CN112867792A - 工程化靶特异性碱基编辑器 - Google Patents

工程化靶特异性碱基编辑器 Download PDF

Info

Publication number
CN112867792A
CN112867792A CN201980067879.2A CN201980067879A CN112867792A CN 112867792 A CN112867792 A CN 112867792A CN 201980067879 A CN201980067879 A CN 201980067879A CN 112867792 A CN112867792 A CN 112867792A
Authority
CN
China
Prior art keywords
dna
lys
base
leu
editing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980067879.2A
Other languages
English (en)
Inventor
F.福瑟
J.C.米勒
E.雷巴尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sangamo Therapeutics Inc
Original Assignee
Sangamo Therapeutics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sangamo Therapeutics Inc filed Critical Sangamo Therapeutics Inc
Publication of CN112867792A publication Critical patent/CN112867792A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/111General methods applicable to biologically active non-coding nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/78Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y305/00Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
    • C12Y305/04Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
    • C12Y305/04001Cytosine deaminase (3.5.4.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y305/00Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
    • C12Y305/04Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
    • C12Y305/04002Adenine deaminase (3.5.4.2)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/31Chemical structure of the backbone
    • C12N2310/318Chemical structure of the backbone where the PO2 is completely replaced, e.g. MMI or formacetal
    • C12N2310/3181Peptide nucleic acid, PNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/32Chemical structure of the sugar
    • C12N2310/323Chemical structure of the sugar modified ring structure
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/32Chemical structure of the sugar
    • C12N2310/323Chemical structure of the sugar modified ring structure
    • C12N2310/3231Chemical structure of the sugar modified ring structure having an additional ring, e.g. LNA, ENA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/30Phosphoric diester hydrolysing, i.e. nuclease
    • C12Q2521/307Single strand endonuclease
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/50Other enzymatic activities
    • C12Q2521/539Deaminase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2522/00Reaction characterised by the use of non-enzymatic proteins
    • C12Q2522/10Nucleic acid binding proteins
    • C12Q2522/101Single or double stranded nucleic acid binding proteins

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)

Abstract

本文描述了DNA编辑复合物,特别是特异性改变靶DNA序列中单个碱基对的DNA编辑复合物,以及制备和应用这些DNA编辑复合物的方法。

Description

工程化靶特异性碱基编辑器
相关申请的交叉引用
本申请要求于2018年8月23日提交的美国临时申请号62/721,903;于2018年10月31日提交的美国临时申请号62/753,696;于2019年3月12日提交的美国临时申请号62/817,153;以及于2019年6月27日提交的美国临时申请号62/867,565,其中所公开的内容通过引用整体并入本文。
序列表
本申请包含以ASCII格式电子提交的序列表,其通过引用整体并入本文。所述ASCII副本于2019年8月20日创建,命名为8325-0180-S180-PCT_SL.txt,大小为225,507字节。
技术领域
本公开为多肽和基因组工程领域。
发明背景
人工核酸酶,如工程化锌指核酸酶(ZFN),转录激活因子样效应物核酸酶(TALEN),具有工程化crRNA/tracr RNA(“单个引导RNA”)的CRISPR/Cas系统(又被称为RNA引导的核酸酶)和/或基于Argonaute系统的核酸酶,正在彻底改变医学、生物技术和农业领域。这些分子工具使生物体中基因组的基因操纵(如,编辑)达到前所未有的水平。人工核酸酶能够切割DNA,使得此类切割后,细胞被迫通过易错非同源末端连接(NHEJ)或在与切割位点侧翼区同源的底物DNA存在下通过同源定向修复(HDR)插入底物DNA来“修复”断裂。这两个过程均始于DNA中的双链断裂(DSB)。
在一些情况下,工程化核酸酶可能会导致不需要的结果(如,易位、倒置和缺失),其可能由于在基因编辑细胞的染色体中诱导多个DSB而发生。例如,核酸酶处理后已观测到包括易位、倒置和缺失的染色体重排的一些证据(Kosicki,et al.(2018)Nat Biotechnol36:765和Shin,et al.(2017)Nat Comm doi:10.1038/ncomms15646),并且最近,关注到在某些细胞中使用CRISPR/Cas系统切割后诱导p53通路,导致凋亡(Ihry,et al.(2018)NatMed 24:939-946和Haapaniemi,et al.(2018)Nat Med 24:927-930)。另外,HDR在大多数真核生物中通常效率非常低,使基因校正变得困难(Eid,et al.(2018)Biochem J 475:1955-1964)。
此外,Cas9碱基编辑器如AID-dCas9、APOBEC-dCas9(如,APOBEC3G或APOBEC1)、BE2、BE3和BE4(参见,如Komor,et al.(2016)Nature 533:420-424;Komor,et al.(2017)Science Advances 3(8),eaao4774;Kim,et al.(2017)Nat Biotechnol 35(4):371-376)可以显示缺乏特异性(参见,Kim,et al.(2019)Nat Biotechnol 10.1038/s41587-019-0050-1;Zuo,et al.(2019)Science DOI:10.1126/science.aav9973),使它们不适合用于多种目的,包括体内和离体治疗应用。
因此,仍然需要完成基因组(碱基)编辑而不引起双链断裂且具有高特异性。
发明概述
本公开提供了在细胞中选择性编辑DNA的方法和组合物(如,碱基编辑器),包括不在靶DNA(如,经编辑的基因组)中进行双链切割的情况下的(如,单个碱基的)编辑。此类碱基编辑器可以是将C:G改变为T:A的胞嘧啶碱基编辑器(CBE)或将A:T改变为G:C的腺嘌呤碱基编辑器(ABE)。此外,由于没有诱导双链断裂,内源靶标中没有游离的DNA末端,也没有发生易位。如本文所述的碱基编辑器可用于基因敲除(如,例如使用胞嘧啶碱基编辑器将常规密码子改变为终止密码子和/或使用胞嘧啶或腺嘌呤碱基编辑器使剪接受体位点突变);将突变(如,激活或阻抑突变)引入基因的控制元件(如,启动子区域);校正(逆转)致病突变(如点突变);和/或诱导产生治疗益处的突变。可提供本文所述的碱基编辑器(提供给细胞用于体外或离体应用,或提供给受试者体内)用于多肽和/或多核苷酸形式的碱基编辑。除其他优点外,本发明的碱基编辑器可以(1)由于额外的DNA结合结构域/结合位点的长度而增加特异性,由于减少PAM需求而增加精确度或靶向密度;(2)扩展(放宽)PAM限制,以允许靶向当前不可靶向的位点;(3)在性能不佳的PAM位点处提高编辑效率;和/或(4)用非ZFP锚定试剂提高可靶向的靶位点的效率,因而支持较低剂量,这也导致较低的脱靶活性。
因此,本文描述了碱基编辑组合物,其包含至少一种功能结构域(如,DNA去稳定分子,如切口酶、蛋白质和/或核苷酸)和至少一种DNA结合结构域(如,锌指蛋白)。在某些实施方案中,碱基编辑组合物编辑DNA中的腺嘌呤(A)或胞苷(C)碱基,其中组合物包含:(1)至少一种锌指蛋白(ZFP)DNA结合结构域;(2)至少一种DNA去稳定分子;和(3)至少一种腺嘌呤或胞嘧啶脱氨酶,其中组合物不在DNA中进行双链切割。
可将任何DNA去稳定分子以任何组合用于本文所述的组合物中,包括但不限于Cas9切口酶,可操作地连接至单个引导RNA(sgRNA)的Cas9蛋白(如,dCas),任何RNA可编程系统,锌指核酸酶切口酶(ZFN切口酶),TALEN切口酶,如表A中所示的一种或多种蛋白质,和/或一种或多种核苷酸(如,一种或多种肽核酸(PNA),锁核酸(LNA)和/或桥连核酸(BNA))。在某些实施方案中,碱基编辑组合物包含多于一种DNA去稳定分子,例如,一种或多种蛋白质(如,表A,切口酶等)和/或一种或多种核苷酸。在某些实施方案中,组合物包含ZFN切口酶和一种或多种另外的蛋白质和/或核苷酸DNA去稳定分子(如,表A的一种或多种蛋白质和/或如本文所述的一种或多种核苷酸)。在某些方面,碱基编辑组合物不包含Cas9蛋白,但是可包含其他Cas蛋白(如,非Cas9 RNA可编程系统)。在某些实施方案中,DNA去稳定分子包含锌指核酸酶(ZFN)切口酶。
碱基编辑组合物的至少一种锌指蛋白(ZFP)DNA结合结构域可以可操作地连接至碱基编辑组合物的一种或多种其他组分,例如连接至一种或多种DNA去稳定分子(如,Cas9切口酶,dCas9等)和/或至少一种腺嘌呤或胞嘧啶脱氨酶。在某些实施方案中,至少一种ZFPDNA结合结构域可操作地连接至腺嘌呤或胞嘧啶脱氨酶。在其他实施方案中,碱基编辑组合物包含第一和第二ZFP DNA结合结构域,其中第一ZFP DNA结合结构域可操作地连接至Cas9切口酶。ZFP DNA结合结构域可包含3、4、5、6个或更多个指,并且可与待编辑靶碱基任一侧(5’或3’)的靶位点结合。在某些实施方案中,ZFP结合至靶位点,该靶位点是在靶定碱基任一侧的1至100(或其间的任何数)个核苷酸。在其他实施方案中,ZFP结合至靶位点,该靶位点是在靶定碱基任一侧的1至50(或其间的任何数)个核苷酸。
任何腺嘌呤或胞嘧啶脱氨酶均可用于本文所述的组合物中,包括野生型和/或进化的结构域。在某些实施方案中,腺嘌呤或胞嘧啶脱氨酶由二聚化形成活性腺嘌呤或胞嘧啶脱氨酶的第一和第二非活性结构域组成。在某些实施方案中,腺嘌呤或胞嘧啶脱氨酶的第一非活性结构域可操作地连接至Cas9切口酶,而腺嘌呤或胞嘧啶脱氨酶的第二非活性结构域可操作地连接至ZFP DNA结合结构域。在另外的实施方案中,腺嘌呤或胞嘧啶脱氨酶和ZFP DNA结合结构域两者均可操作地连接至Cas9切口酶。在其他实施方案中,碱基编辑器包含第一和第二ZFP DNA结构域,第一ZFP可操作地连接至Cas9切口酶,第二ZFP DNA结合结构域可操作地连接至腺嘌呤或胞嘧啶脱氨酶。
还提供了编码一种或多种如本文所述的碱基编辑组合物的一种或多种多核苷酸。多核苷酸可携带于病毒(如,AAV、Ad等)和/或非病毒(如,质粒、mRNA等)载体上。此外,还提供了包含本文所述的一种或多种组合物和/或一种或多种多核苷酸的细胞或细胞群,以及此类细胞的后代,其中所述细胞包含经编辑的碱基。
还提供了使用本文所述的一种或多种组合物和/或多核苷酸编辑靶DNA(如,DNA双链内源基因或染色体外(游离型)序列)中碱基的方法。在某些实施方案中,该方法包括:(i)将胞苷碱基(“C”)编辑为尿嘧啶碱基(“U”),任选地,其中DNA复制期间U被胸苷碱基(“T”)取代;(ii)将腺嘌呤碱基(“A”)编辑为肌苷(“I”),任选地,其中复制期间I被鸟嘌呤碱基(“G”)取代;和/或(iii)将CA或AC二核苷酸编辑为UI或IU。在其他实施方案中,细胞中的编辑导致:(i)将C:G碱基对改变为T:A碱基对;(ii)将C:G碱基对改变为G:C碱基对;(iii)将A:T碱基对改变为G:C碱基对;(iv)引入终止密码子;和/或(v)编辑或产生拼接序列。该方法可用于校正包括外显子或内含子中的任何疾病突变(如,点突变),其中细胞或受试者中染色体或染色体外游离体中的DNA被编辑。该方法可在体外、离体或体内进行。
一方面,本文描述了包含DNA编辑组合物(如,碱基编辑组合物,在本文中又被称为碱基编辑复合物)的组合物和系统。DNA编辑复合物包含至少一种功能结构域和DNA结合结构域。在某些实施方案中,DNA编辑组合物复合物包含融合分子,该融合分子包含DNA结合结构域,以及另外,至少一种DNA去稳定分子,如在双链DNA中进行单链切割的切口酶结构域(如,DNA切口酶)。在其他实施方案中,DNA编辑组合物(复合物)包含多个(两个或更多个)融合分子,例如包含切口酶(含有第一DNA结合结构域和切口酶结构域)的第一催化活性融合分子和包含第二DNA结合结构域的第二无催化活性融合分子以及任选地一个或多个另外的融合分子,每一种均包含本文所述的另外的DNA结合结构域和一个或多个功能结构域。在某些实施方案中,碱基编辑器包括如图1A至1D中任一个所示的组合物。在某些实施方案中,如当催化活性和无催化活性融合分子二聚化时,第一和第二(和任选地另外的DNA结合结构域)的结合导致碱基编辑。在一些实施方案中,任选另外的DNA结合结构域结合至双链DNA,而在其他实施方案中,DNA结合结构域结合至单链DNA。在一些实施方案中,DNA切口酶是ZFN切口酶、TALEN切口酶或CRISPR/Cas切口酶,其中至少一种功能(切口酶)结构域可操作地连接至DNA结合结构域(如,ZFP DNA结合结构域、TALE DNA结合结构域和与CRISPR/Cas系统一起使用的sgRNA)。在一些实施方案中,DNA切口酶(如,融合分子)包含位于切口酶结构域和DNA结合结构域之间的接头序列。切口酶结构域可位于DNA结合结构域的任一侧,包括融合分子的N或C端侧(DNA结合结构域的N和/或C端)。在一些实施方案中,接头选自来自大型接头文库(>10e8个成员)的细菌选择系统。在一些实施方案中,接头范围为4至22个氨基酸残基。在一些实施方案中,接头允许功能结构域(如,切口酶结构域)相对于DNA结合结构域的特异性定位(如,切口酶结构域与DNA结合结构域的N或C端侧的连接)。在一些实例中,使用Paschon,et al.(2019)Nat Commun.10:1133中公开的方法选择接头。还提供了编码碱基编辑器(或其组分)的一种或多种多核苷酸(如,构建体)。
本文所述的DNA编辑复合物包含一种或多种功能结构域,包括但不限于一种或多种腺嘌呤脱氨酶结构域、一种或多种胞苷脱氨酶和/或一种或多种尿嘧啶DNA糖基化酶抑制剂。一种或多种功能结构域可包含在本文所述的DNA编辑复合物的催化活性和/或无催化活性融合分子中。在一些实施方案中,胞苷脱氨酶是载脂蛋白B mRNA编辑复合体1(APOBEC1)结构域。在一些实施方案中,胞苷脱氨酶是激活诱导性脱氨酶(AID)。在一些实施方案中,脱氨酶是腺嘌呤脱氨酶。在一些实施方案中,腺嘌呤脱氨酶是野生型或突变(进化)的TadA(tRNA腺嘌呤脱氨酶(参见,Gaudelli,et al.(2017)Nature551:464-471)。在一些实施方案中,腺嘌呤脱氨酶是ABE 7.8、ABE 7.9或ABE7.10(Gaudelli,同上)或ABEmax(Koblan,etal.(2018)Nat Biotechnol.36(9):843-846)。在一些实施方案中,脱氨酶(腺嘌呤或胞苷)功能结构域由包括可操作地连接的锌指(如,分裂酶)的两个多肽组装,或由可操作地连接至分裂酶的一部分的一个或多个ZFP和可操作地连接至分裂酶的另一组分的Cas9切口酶组装(参见,如图1B)。在一些实施方案中,脱氨酶的组装由可操作连接的锌指与DNA靶标的结合驱动,从而使多肽定位以允许组装。在一些实施方案中,碱基编辑器进一步包含尿嘧啶DNA糖基化酶抑制剂(UGI)。
一方面,碱基编辑器包括源自CRISPR系统的DNA解链(又被称为DNA去稳定)系统,例如Cas9(如,天然存在和/或工程化Cas9)蛋白(如,切口酶)或非Cas9蛋白。在某些实施方案中,碱基编辑器是Cas9碱基编辑器,其还包含锌指蛋白DNA结合结构域,ZFP可在任何方向上可操作地连接至Cas9蛋白的任何组分(如,野生型或工程化切口酶),例如,碱基编辑器包含可操作地连接至Cas9蛋白的ZFP(ZFP锚),Cas9切口酶的sgRNA或脱氨酶(野生型或工程化(进化的)ABE或CBE)。在某些实施方案中,ZFP可操作地连接至碱基编辑器的Cas9结构域。在某些实施方案中,碱基编辑器包括如图3的Cas9碱基编辑器中所示的组分。
另一方面,碱基编辑器不包含源自Cas9蛋白的DNA解链(DNA去稳定)元件(又被称为“无Cas9”)。在某些实施方案中,本发明的无Cas9碱基编辑器包含ZFP-脱氨酶融合蛋白和ZFN切口酶,以及任选地一种或多种DNA去稳定因子。在某些实施方案中,DNA去稳定因子是蛋白质(例如,如表A中所示)或寡核苷酸(如,一种或多种PNA、LNA和/或BNA)。可将一种或多种非Cas9DNA去稳定(解链)因子(如,表A的蛋白质、LNA、PNA、BNA等)可操作地连接至碱基编辑器的任何组分,例如,ZFP-脱氨酶融合蛋白的组分和/或ZFN切口酶的任何组分。在一些实施方案中,碱基编辑器包含一种或多种蛋白质和一种或多种核苷酸DNA去稳定(解链)因子。在另外的实施方案中,本文所述的无Cas9碱基编辑器包含源自CRISPR系统的一种或多种蛋白质,该蛋白质不是Cas9但具有DNA去稳定(解链)特性。
在某些实施方案中,碱基编辑器包含一个或多个核苷酸序列,如一个或多个DNA寡核苷酸、RNA寡核苷酸、肽核酸(PNA)、锁核酸(LNA)和/或桥连核酸(BNA),其可用于为靶位点处的碱基编辑器提供单链DNA底物。这可通过如双重侵入,三重侵入或尾钳(tail-clamp)来促进(Quijano,et al.(2017)Yale J.Biol and Med.90:583-598;Pellestor andPaulasova(2004)European J.Human Genetics 12:694-700;Schleifman,et al.(2011)Chem&Bio.18:1189-1198)。碱基编辑器的一种或多种核苷酸序列的结构在以下方面有所不同:长度;DNA和/或RNA和/或LNA和/或LNA和/或BNA碱基的数量和位置;硫代磷酸酯键;这些寡核苷酸的其他常见修饰,这取决于靶序列组成。
在某些实施方案中,碱基编辑器包含一个或多个PNA,如包含miniPEG取代和用于增强结合、增加溶解度和改善递送的γ位置的γPNA(Bahal,et al.(2014)Current GeneTher.14(5):331-342)。在某些实施方案中,PNA包含表示8-氨基-2,6-二氧杂辛酸接头的一个或多个O和/或一个或多个胞嘧啶(C)或假异胞嘧啶残基。任选地,一个或多个赖氨酸(Lys)残基被包含于PNA中,例如在PNA序列的N和/或C端。在某些实施方案中,1、2、3、4、5个或更多个Lys残基被包含于PNA的一个或两个末端。在某些实施方案中,在碱基编辑器中使用两个或多个PNA,例如在相对于彼此相同或相反的方向上。在某些实施方案中,PNA包括如图8B至8E中所示的一种或多种PNA,包括但不限于以下结构的一种或多种PNA:N-Lys-Lys-Lys-N NNNNNNNNN-OOO-NNNNNNNNNN-Lys-Lys-Lys-C;N-Lys-Lys-Lys-NNNNNNNNNN-OOO-NNNNNNNNNNNNNNN-Lys-Lys-Lys-C;N-Lys-Lys-Lys-NNNNNNNNNN-OOO-NNNNNNNNNN-Lys-Lys-Lys-C;N-Lys-Lys-Lys-NNNNNNNNNN-OOO-NNNNNNNNNN-Lys-Lys-Lys-C;和/或N-Lys-Lys-Lys-NNNNNNNNNNNNNNNNN-Lys-Lys-Lys-C,其中O表示8-氨基-2,6-二氧杂辛酸接头,且C表示胞嘧啶。PNA序列的N和/或C端上的Lys残基是任选的,并且假异胞嘧啶可取代胞嘧啶。
在其他实施方案中,碱基编辑器包括一个或多个LNA。LNA可包括堆叠接头和2’-甘氨酰氨基LNA以提高性能(Geny,et al.(2016)Nucleic Acids Res.44(5):2007-2019)。在某些实施方案中,LNA包含一个或多个硫代磷酸酯键,任选地在一个或多个LNA残基和/或DNA残基之间。在其他实施方案中,LNA包含一个或多个胆固醇-TEG,其可增加细胞摄取。在某些实施方案中,碱基编辑器包括如图8F或8G中所示的一个或多个LNA,其包括但不限于具有以下结构的一个或多个LNA:5’-NnNnNnNnNnNnNnNtctctnNnNnNnNnNnNnNnNnnNnnNnnNnnNn-3’(SEQ ID NO:1);5’-N*n*NnNnNnNnNnNnNtNcttctnNnNnNnNnNnNnNnNnnNnnNnnNnnNnn*N*n-3’(SEQ ID NO:69);和/或5'-NnNnNnNnNnNnNnNttctctnNnNnNnNnNnNnNnnNnnNnnNnnNnnNnNn-Chol-TEG-3’(SEQ ID NO:70),其中LNA核苷酸以大写字母显示;DNA核苷酸为小写;“*”表示硫代磷酸酯键;以及Chol-TEG表示增加细胞摄取的3’胆固醇-TEG。
本文所述的碱基编辑组合物的组分可以以任何组合包括(一种或多种切口酶结构域,一种或多种DNA结合结构域,一种或多种功能结构域等),并且这些组分可以以相对于彼此的任何顺序定位。在一些实施方案中,UGI,胞苷和/或腺嘌呤脱氨酶位于DNA编辑复合物的无催化活性融合分子的DNA结合结构域的N端和/或催化活性融合分子的切口酶结构域的N端。在一些实施方案中,胞苷和/或腺嘌呤脱氨酶和/或UGI位于无催化活性融合分子的DNA结合结构域的C端和/或催化活性融合分子的切口酶结构域的C端。在一些实施方案中,一种或多种UGI,胞苷和/或腺嘌呤脱氨酶定位于(催化活性结构域中的)DNA结合结构域和切口酶结构域之间。在一些实施方案中,融合分子包含胞苷脱氨酶和腺嘌呤脱氨酶结构域或UGI,其中UGI、胞苷和腺嘌呤脱氨酶相对于DNA结合结构域、彼此和/或切口酶结构域以任何方式定位(如,两者以任何顺序定位于无催化活性融合分子的DNA结合结构域的N端,两者以任何顺序定位于无催化活性融合分子的DNA结合结构域的C端,一个定位于无催化活性融合分子的DNA结合结构域的N端,一个定位于无催化活性融合分子的DNA结合结构域的C端,定位于催化活性融合分子的切口酶结构域和/或DNA结合结构域的N端,定位于催化活性融合分子的切口酶结构域和/或DNA结合结构域的C端,一个定位于催化活性融合分子的切口酶结构域和/或DNA结合结构域的C端,一个定位于催化活性融合分子的切口酶结构域和/或DNA结合结构域的N端,定位于催化活性融合分子的切口酶结构域和DNA结合结构域之间等)。附图和实施例中显示了碱基编辑组合物的一种或多种融合分子的配置的非限制性实例。在一些实施方案中,使用本领域已知的接头将UGI、胞苷和/或腺嘌呤脱氨酶结构域连接至DNA编辑复合物的其他成员。还提供了编码碱基编辑器或其组分的一种或多种多核苷酸。
其他方面,DNA编辑复合物包含一个或多个功能结构域,该功能结构域包含至少一个尿嘧啶DNA糖基化酶抑制剂(如,UGI)结构域。将UGI结构域以任何方式掺入DNA编辑复合物中,以使DNA编辑复合物是可操作的。在一些实施方案中,碱基编辑复合物包含噬菌体Gam蛋白。在一些实施方案中,碱基编辑复合物包含脱氨酶、切口酶、UGI和/或GAM蛋白。在一些实施方案中,碱基编辑复合物的组分在编码一种、两种或多种融合蛋白的一种、两种或多种基因表达构建体中提供。在一些实施方案中,使用上述和本领域已知的接头将一个或多个尿嘧啶DNA糖基化酶抑制剂结构域连接至复合物的其他成员。在一些实施方案中,使用接头将尿嘧啶DNA糖基化酶抑制剂连接至复合物的其他成员,其中使用Paschon,et al.(2019)Nat Commun.10:1133中所公开的方法鉴定接头。
在一些实施方案中,DNA编辑(碱基编辑)复合物还包含有助于打开双链DNA螺旋的分子。在一些实施方案中,分子包含酶。在一些实施方案中,酶是解旋酶(如,RecQ解旋酶((WRN、BLM、RecQL4和RecQ5,(参见,Mo,et al.(2018)Cancer Lett.413:1-10),DNA2(Jia,et al.(2017)DNA Repair(Amst).59:9-19)和任何其他真核解旋酶,包括例如FANCJ、XPD、XPB、RTEL1和PIF1(Brosh(2013)Nat Rev Canc 13(8):542-558))。在一些实施方案中,酶是细菌和/或病毒解旋酶。示例性病毒解旋酶包括由肌病毒科(Myoviridae)家族病毒编码的那些(如,gp41、Dda、UvsW、Geneα和Ban);由短尾病毒科(Podpviridae)家族病毒编码的那些(如,4B);由长尾病毒科(Siphoviridae),杆状病毒科(Baculoviridae),疱疹病毒科(Herpesviridae),多瘤病毒科(Polyomaviridae),乳头瘤病毒科(Palillomaviridae)和痘病毒科(Poxviridae)家族编码的那些(如,G40P、p143、UL5、UL9、Tag、E1、NPH-1、NPH-II、A18R和VETF)或本领域已知的任何其他病毒解旋酶(参见,例如Frick and Lam(2006)CurrPharm Des 12(11):1315-1338)。在一些实施方案中,解旋酶是细菌酶。示例性细菌解旋酶包括铜绿假单胞菌(P.aeruginosa)SF4 DnaB样解旋酶,或RecB和RecD解旋酶,它们是细菌(如,大肠杆菌和幽门螺杆菌(H.pylori))中细菌RecBCD复合物的一部分(Shadrick,et al.(2013)J.Biomol Screen 18(7):761-781)。在一些实施方案中,使用工程化或进化的多聚解旋酶变体,其导致单体解旋酶活性(参见,例如Brendza,et al.(2005)PNAS102(29):10076-70081)。在一些实施方案中,分子包含CRISPR/Cas复合物。在一些实施方案中,CRISPR/Cas复合物包含引导RNA。在一些实施方案中,复合物包含在其核酸酶结构域中有催化缺陷的Cas酶。在一些实施方案中,复合物包含在其核酸酶结构域之一有催化缺陷的Cas酶(如,切口酶)。在一些实施方案中,Cas酶在其PAM识别上有缺陷(Anders,et al.(2014)Nature 513(7519):569-573)。在一些实施方案中,与天然PAM序列相比,Cas酶具有放宽(扩展)的PAM需求(参见,例如Nishimasu,et al.(2018)Science 361:1259-1262)。在某些实施方案中,与SpCas9的NGG PAM序列相比,本文所述的Cas碱基编辑器显示放宽(扩展)的PAM需求。在一些实施方案中,分子具有螺旋去稳定的性质。示例性螺旋去稳定分子包括来自I型单纯疱疹病毒的ICP8(Boehmer and Lehman(1993)J Virol 67(2):711-715),Puralpha(Darbinian,et al.(2001)J Cell Biochem 80(4):589-95)和小牛胸腺DNA螺旋去稳定蛋白(Kohwi-Shigematsu,et al.(1978)Proc Natl Acad Sci USA 75(10):4689-93)。在一些实施方案中,分子参与转录和/或D环形成/稳定。此类的示例性分子包括Rad51、Rad52、RPA1、RPA2和RPA3、Exo1、BLM以及HMGB1和HMGB2。可利用的其他蛋白质包括Bovin ROA1和大肠杆菌RecA或大肠杆菌rad51。可充当DNA螺旋去稳定剂的其他蛋白质结构域包括来自Cas9的RecI和Rec II结构域或RecII结构域自身,以及来自Cas9的任何其他螺旋去稳定区。表A中显示了用于本文所述的碱基编辑器的合适蛋白质结构域的其他非限制性实例。
在一些实施方案中,分子是核酸,包括但不限于寡核苷酸、PNA、LNA、BNA等。在一些实施方案中,核酸是与靶向编辑附近的区域具有同源性的DNA。在一些实施方案中,核酸是与靶向编辑附近的区域具有同源性的RNA。在一些实施方案中,RNA被修饰。在一些实施方案中,融合分子包含位于融合分子的一个或多个结构域之间的氨基酸接头序列。在一些实施方案中,使用上述接头将用于协助打开双链DNA螺旋的分子连接至DNA编辑复合物的其他成员。在一些实施方案中,使用已知方法确定将用于协助打开双链DNA螺旋的分子连接至DNA编辑复合物的其他成员。
在某些实施方案中,核酸包含PNA,例如PNA包含表示8-氨基-2,6-二氧杂辛酸接头的一个或多个O和/或一个或多个胞嘧啶(C)或假异胞嘧啶残基。任选地,一个或多个赖氨酸(Lys)残基被包括于PNA中,例如PNA序列的N和/或C端。在某些实施方案中,PNA的一个或两个末端包括1、2、3、4、5个或更多个Lys残基。在某些实施方案中,在碱基编辑器中使用两个或更多个PNA,例如以相对于彼此相同或相反的方向。在某些实施方案中,一个或多个PNA包括:N-Lys-Lys-Lys-NNNNNNNNNN-OOO-NNNNNNNNNN-Lys-Lys-Lys-C;
N-Lys-Lys-Lys-NNNNNNNNNN-OOO-NNNNNNNNNNNNNNN-Lys-Lys-Lys-C;N-Lys-Lys-Lys-NNNNNNNNNN-OOO-NNNNNNNNNN-Lys-Lys-Lys-C;N-Lys-Lys-Lys-NNNNNNNNNN-OOO-NNNNNNNNNN-Lys-Lys-Lys-C;和/或N-Lys-Lys-Lys-NNNNNNNNNNNNNNN-Lys-Lys-Lys-C(PNA#5),其中O表示8-氨基-2,6-二氧杂辛酸接头,且C表示胞嘧啶。位于PNA序列的N和/或C端的Lys是任选的,并且伪异胞嘧啶可取代胞嘧啶。还参见图8B至8E。
在其他实施方案中,碱基编辑器包括一个或多个LNA。LNA可包含堆叠接头和2’-甘氨酰氨基-LNA以改善性能((Geny,et al.(2016)Nucleic Acids Res.44(5):2007-2019)。在某些实施方案中,LNA包含一个或多个硫代磷酸酯键,任选地位于一个或多个LNA残基和/或DNA残基之间。在其他实施方案中,LNA包含一种或多种胆固醇-TEG,其可以增加细胞摄取。在某些实施方案中,一个或多个LNA包含:5’-NnNnNnNnNnNnNnNtctctnNnNnNnNnNnNnNnNnnNnnNnnNnnNn-3’
(SEQ ID NO:1);5’-N*n*NnNnNnNnNnNnNtctctnNnNnNnNnNnNnNnNnnNnnNnnNnn*N*n-3’(SEQ ID NO:69);和/或5’-NnNnNnNnNnNnNnNtctctnNnNnNnNnNnNnNnNnnNnnNnnNnnNn-Chol-TEG-3’(SEQ ID NO:70),其中LNA核苷酸为大写字母;DNA核苷酸为小写字母;“*”表示硫代磷酸酯键;以及“Chol-TEG”表示增加细胞摄取的3’胆固醇-TEG。同样,参见图8F和8G。
这些分子可全部掺入本文所述的碱基编辑系统中,并且可起作用以增加编辑效率、减少脱靶碱基编辑、调节碱基编辑窗口或改变核酸碱基的靶向类型。
在一些实施方案中,如本文所述的功能结构域被包含于单个融合分子中。可选择地,可以以任何方式将包括多个功能结构域的DNA编辑复合物分为不同的融合分子。在一些实施方案中,一个融合分子包含DNA结合结构域,胞苷和/或腺嘌呤脱氨酶和UGI,而第二融合分子包含切口酶或半切口酶结构域。在一些实施方案中,一个融合分子包含融合至与脱氨酶结构域融合的DNA结合结构域的无催化活性(死亡(dead))FokI结构域,而第二融合蛋白包含半FokI切口酶蛋白,DNA结合结构域和UGI结构域。在一些实施方案中,一个融合蛋白包含融合至与UGI结构域融合的脱氨酶结构域的无催化活性(死亡)FokI结构域,而第二融合分子包含功能性切口酶蛋白。在一些实施方案中,本文公开的一个或多个融合蛋白在可操作的融合分子内以任何结构域的顺序融合。在一些实施方案中,切口酶结构域是Cas切口酶结构域,而在一些实施方案中,切口酶结构域是TALEN切口酶结构域。在一些实施方案中,使用上述接头将一个或多个功能结构域连接至复合物的一个或多个其他成员。在一些实施方案中,使用Paschon,et al.(2019)Nat Commun.10:1133中公开的方法鉴定的接头,将一个或多个功能结构域与复合物的一个或多个其他成员连接。
本文所述的碱基编辑器可由一个或多个多核苷酸编码。一个或多个多核苷酸可携带于病毒载体(AAV,Ad等),非病毒载体(质粒,mRNA等)或其组合上。在某些实施方案中,一个多核苷酸包括碱基编辑器的所有组分,而在其他实施方案中,碱基编辑器的组分由两个或更多个多核苷酸(如,带有分裂酶和/或ZFP的不同多核苷酸)携带。
另一方面,本文描述了使用本文所述的一种或多种DNA编辑复合物编辑(如,基因编辑)DNA分子的方法。该方法描述了将一种或多种DNA编辑复合物引入细胞以使DNA分子被编辑的方法。该细胞可以是分离的或可以在活的受试者内(如,通过静脉内或其他施用至受试者)。在一些实施方案中,DNA分子是细胞中的染色体或染色体外游离体。在一些实施方案中,染色体或染色体外游离体包含胞苷碱基(“C”),其被本文公开的融合蛋白脱氨基为尿嘧啶碱基(“U”)。在一些实施方案中,DNA复制期间U被胸苷碱基(“T”)取代。在一些实施方案中,染色体或染色体外游离体包含腺嘌呤碱基(“A”),其被本文公开的融合蛋白脱氨为肌苷(“I”)碱基。在一些实施方案中,复制期间I被鸟嘌呤碱基(“G”)取代。在一些实施方案中,染色体或染色体外游离体包含被本文公开的脱氨酶脱氨基的腺嘌呤和胞苷碱基,从而将CA或AC二核苷酸脱氨基为UI或IU二核苷酸(图1为示例系统)。
在一些实施方案中,切口酶结构域源自FokI DNA切割结构域(参见,美国专利号5,436,150;8,703,489;9,200,266;和9,631,186)。在一些实施方案中,与亲本FokI切口酶相比,FokI切口酶包含一个或多个突变。本文所述的突变包括但不限于改变切割结构域电荷的突变,例如带正电荷的残基突变为不带正电荷的残基(如,K和R残基(如,突变为S);N残基(如,突变为D)和Q残基(如,突变为E)的突变;突变为基于分子建模预测接近DNA主链并且显示FokI同源物的变异的残基;和/或在其他残基处的突变(如,美国专利号8,623,618和Guo,et al.(2010)J.Mol.Biol.400(1):96-107))。切口酶可以是ZFN切口酶、TALEN切口酶和CRISPR/Cas系统,如Cas切口酶。
在一些实施方案中,碱基编辑器包含DNA结合结构域(如,工程化切口酶结构域),该DNA结合结构域包含源自FokI或FokI同源物且包含氨基酸残基416、418、422、447、448、476、479、481和/或525(相对于SEQ ID NO:5中所示的野生型全长FokI或FokI同源物中的相应残基编号)的一个或多个处的突变的切割结构域。在一些实施方案中,源自FokI的切割半结构域包含在氨基酸残基414-426、443-450、467-488、501-502和/或521-531的一个或多个处的突变,包括387、393、394、398、400、416、418、422、427、434、439、441、442、444、446、448、472、473、476、478、479、480、481、487、495、497、506、516、523、525、527、529、534、559、569、570和/或571中的一个或多个处的突变。突变可包括突变为与FokI同源的天然限制性酶在相应位置存在的残基。在一些实施方案中,突变是取代,例如野生型残基被任何不同的氨基酸取代,例如,丙氨酸(A)、半胱氨酸(C)、天冬氨酸(D)、谷氨酸(E)、组氨酸(H)、苯丙氨酸(F)、甘氨酸(G)、天冬酰胺(N)、丝氨酸(S)或苏氨酸(T)。在一些实施方案中,FokI核酸酶结构域包含416、418、422、476、447、479、481和/或525(相对于野生型,SEQ ID NO:5编号)的一个或多个处的突变。核酸酶结构域还可包含位置418、432、441、448、476、481、483、486、487、490、496、499、523、527、537、538和559处的一个或多个突变,包括但不限于ELD、KKR、ELE、KKS。参见,如美国专利号8,623,618。在一些实施方案中,切割结构域包括残基419、420、425、446、447、470、471、472、475、478、480、492、500、502、521、523、526、530、536、540、545、573和/或574的一个或多个残基处的突变。在某些实施方案中,本文所述的变体切割结构域包括突变为参与核酸酶二聚化的残基(二聚化结构域突变)和一个或多个其他突变;例如,突变为磷酸盐接触残基:如与二聚化结构域外(如,在可能参与磷酸盐接触的氨基酸残基中)的氨基酸位置的一个、两个、三个、四个、五个、六个或更多个突变组合的二聚化突变体(如,ELD、KKR、ELE、KKS等)。在一些实施方案中,位置416、418、422、447、448、476、479、481和/或525处的突变包括用不带电荷或带负电荷的氨基酸取代带正电荷的氨基酸。在其他实施方案中,位置446、472和/或478(和任选地,例如二聚化或催化结构域中的其他残基)处进行突变。在一些实施方案中,突变包括I479Q和/或Q481A突变。
在一些实施方案中,除本文所述的突变外,工程化切割半结构域还包括二聚化结构域中的突变,例如氨基酸残基490、537、538、499、496和486。在一些实施方案中,本发明提供了融合蛋白,其中工程化切割半结构域包括多肽,除本文所述的一个或多个突变外,该多肽中位置486处的野生型Gln(Q)残基被Glu(E)残基取代,位置499处的野生型Ile(I)残基被Leu(L)残基取代,以及位置496处的野生型Asn(N)残基被Asp(D)或Glu(E)残基取代(“ELD”或“ELE”)。在一些实施方案中,工程化切口酶半结构域源自野生型FokI或FokI同源切割半结构域,并且除氨基酸残基416、418、422、447、448、476、479、481或525处的一个或多个突变外,包含相对于野生型FokI(SEQ ID NO:5)编号的氨基酸残基490、538和537处的突变。在一些实施方案中,本发明提供了融合蛋白,其中工程化切口酶半结构域包含多肽,除本文所述的一种或多种突变外,该多肽中位置490处的野生型Glu(E)残基被Lys(K)残基取代,位置538处的野生型Ile(I)残基被Lys(K)残基取代,以及位置537处的野生型His(H)残基被Lys(K)残基或Arg(R)残基取代(“KKK”或“KKR”)(参见,美国专利号8,962,281,通过引用并入本文)(参见,美国专利公开号2018/0087072)。
在一些实施方案中,提供了包含DNA结合结构域和如本文所述产生人工核酸酶的工程化FokI或其同源物切割半结构域的融合分子。在一些实施方案中,融合分子的DNA结合结构域是锌指结合结构域(如,工程化锌指结合结构域,ZFP)。在一些实施方案中,使用Paschon等(同上)所公开的方法鉴定的接头将一个或多个锌指连接在一起。在一些实施方案中,DNA结合结构域是TALE DNA结合结构域(TALE)。在一些实施方案中,DNA结合结构域包含DNA结合分子(如,引导RNA)和无催化活性Cas或Cpf1(又被称为Cas12a)蛋白(如,dCas9或dCpf1)。在一些实施方案中,DNA结合结构域包含与无催化活性Cas(dCas)蛋白融合的ZFP。在一些实施方案中,ZFP-dCas融合蛋白包含改变PAM特异性的突变。在一些实施方案中,ZFP-dCas蛋白不依赖于PAM识别来特异性结合DNA序列。在一些实施方案中,DNA结合结构域包含与dCas蛋白融合的TALE。在一些实施方案中,TALE-dCas融合蛋白包含改变PAM特异性的突变。在一些实施方案中,TALE-dCas蛋白不依赖于PAM识别来特异性结合DNA序列。在任何上述实施方案中,使用本领域已知的方法鉴定用于将DNA结合结构域(如,ZFP、TALE或引导RNA和Cas系统)连接至工程化FokI或其同源物的接头。参见,例如,Paschon,et al.(2019)Nat Commun.10:1133。
在一些实施方案中,DNA编辑复合物编辑双链DNA中的特定DNA碱基。在一些实施方案中,在细胞内的DNA分子中进行编辑。在一些实施方案中,DNA在细胞的染色体中。在一些实施方案中,编辑导致从C:G碱基对至T:A碱基对的改变。在一些实施方案中,编辑导致从C:G碱基对至G:C碱基对的改变。在一些实施方案中,编辑导致从A:T碱基对至G:C碱基对的改变。在一些实施例中,编辑是在外显子中进行的。在一些实施方案中,编辑导致引入终止密码子(如,TAA、TAG、TGA)。在一些实施方案中,碱基编辑导致敲除靶向基因的基因表达。在一些实施方案中,编辑是在编码剪接序列的序列中进行的(如,U2剪接序列,其中5’共有序列为GTA/GA/C/TGT/G/A/CA/G/T/C(T/C/G/A)3(SEQ ID NO:73)且3’共有序列为(T/C)10T/C/A/GC/TAG(SEQ ID NO:74);和U12剪接序列,其中5’共有序列为G/ATATCTT/C且3’共有序列为(T/G/A/G)2T/A/C/G(T/C/A/G)2C/TAG/C序列,参见Turunen,et al.(2013)WileyInterdiscip Rev RNA.4(1):61-76)。在一些实施方案中,产生新的剪接序列。在一些实施方案中,改变剪接序列,使得其不再用作剪接序列。在一些实施方案中,剪接序列的改变导致外显子跳跃。在一些实施方案中,改变序列使得产生稀有密码子。在一些实施方案中,碱基编辑引起DNA序列中点突变的校正,使得与疾病相关的基因被校正。用于治疗和/或预防疾病的碱基编辑的非限制性实例包括JAK2的编辑,使得不再表达V617F形式(从而减少导致不受控制的血细胞产生的该基因的激活这);碱基编辑以敲除或抑制其他癌症基因如BCR/ABL;A1AT的碱基编辑;等等。可治疗的示例性疾病包括镰状细胞病、血友病、囊性纤维化、苯酮尿症、泰-萨氏(Tay-Sachs)病、色盲、法布里(Fabry)病、弗里德里希(Friedreich’s)共济失调、前列腺癌等。
在一些实施方案中,本文公开的碱基编辑复合物作用于RNA分子。在一些实施方案中,碱基编辑器利用RNA特异性脱氨酶如ADAR2(作用于2型RNA的腺苷脱氨酶)(参见Cox,etal.(2017)Science 358(6366):1019-1027)。
本文还公开了包含任何组合物(碱基编辑组合物和/或一种或多种编码这些组合物的多核苷酸)的细胞,以及起源于已通过本文公开的方法和组合物修饰的这些细胞的细胞。在一些实施方案中,细胞是细菌细胞或真核细胞。在一些实施方案中,细胞包含碱基编辑复合物和碱基编辑复合物诱导的DNA或RNA修饰。经修饰的细胞以及源自经修饰细胞的任何细胞不一定包含比瞬时更多的本公开的碱基编辑复合物,但是保持由此类碱基编辑复合物介导的基因组修饰。
另一方面,本文公开了用于在感兴趣区域中靶向编辑细胞染色质的方法;治疗感染的方法;和/或治疗疾病的方法。这些方法可在体外、离体或体内或其组合中实践。该方法涉及通过表达如本文所述的碱基编辑复合物(如,融合多肽和任选地任何相关的核酸,其中一种或多种融合多肽包含如本文所公开的工程化切口酶),在细胞中预定感兴趣区域处编辑细胞染色质。在某些实施方案中,靶向编辑在靶位点存在于5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%的细胞。
可将本文所公开的碱基编辑复合物用于在感兴趣区域靶向编辑细胞染色质的方法。细胞包括培养细胞、细胞系、生物体中的细胞、在细胞和/或其后代将在处理后返回生物体的情况下已从生物体中取出用于处理的细胞以及从生物体中取出,使用本发明的融合分子进行修饰,然后在治疗方法(细胞疗法)中返回生物体的细胞。细胞染色质的感兴趣区域可以是,例如基因组序列或其部分。
融合分子可在细胞中表达,例如通过将融合分子作为多肽递送至细胞,或通过将编码融合分子的多核苷酸递送至细胞,其中多核苷酸若是DNA,则被转录并翻译以产生融合分子。此外,如果多核苷酸是编码融合分子的mRNA,则在将mRNA递送至细胞后,mRNA被翻译,从而产生融合分子。
在本发明的其他方面,提供了用于增加碱基编辑特异性的方法和组合物。在一些实施方案中,提供了用于通过减少脱靶编辑活性而提高整体在靶编辑特异性的方法。在一些实施方案中,提供了用于减少与碱基编辑相关的插入缺失(indel)形成的方法。在一些实施方案中,将工程化碱基编辑复合物的工程化切口酶组分(切口酶配偶体,例如,形成ZFN切口酶的无催化活性ZFN配偶体和催化活性ZFN配偶体)用于接触细胞,其中复合物的每个切口酶配偶体与另一配偶体的比例不是1:1。在一些实施方案中,两个配偶体的比例以1:2、1:3、1:4、1:5、1:6、1:8、1:9、1:10或1:20的比例或两者之间的任何值给出。在其他实施方案中,两个配偶体的比例大于1:30。在一些方面,每个配偶体作为mRNA递送至细胞或在病毒或非病毒载体中递送,其中递送不同量的mRNA或编码每个配偶体的载体。在进一步的实施方案中,核酸酶复合物的每个配偶体可包含在单个病毒或非病毒载体中,但是被有意地表达,使得一个配偶体以比另一个更高或更低的值表达,最终向细胞递送切割半结构域的比例不是1:1。在一些实施方案中,使用具有不同表达效率的不同启动子表达每个切割半结构域。在一些实施方案中,使用病毒或非病毒载体将两个切割结构域递送至细胞,其中二者均由同一开放阅读框表达,但是编码两个配偶体的基因被序列(如,自切割2A序列或IRES)分开,导致3’配偶体以较低的速率表达,使得两个配偶体的比例为1:2、1:3、1:4、1:5、1:6、1:8、1:9、1:10或1:20的比例,或两者之间的任何值。在其他实施方案中,以选择为不同于1:1的比率来配置两个配偶体。
另一方面,本文描述了使用本文所述的一个或多个碱基编辑器产生的细胞群。在某些实施方案中,大于5%-20%(或其间的任何值),优选大于20%,甚至更优选大于50%,甚至更优选80%至100%的细胞包括对靶定碱基的修饰(如,为碱基编辑的细胞)。在进一步的实施方案中,经编辑的细胞显示很少或没有脱靶编辑(基因组中任何地方的无意编辑)和/或旁观者(紧邻编辑事件,例如,如Cas9的前间区序列内任一侧的1-20个(或其之间的任何值)核苷酸)突变。如本文所述的分离的碱基编辑细胞群可用于离体治疗受试者的疾病和/或可在用作离体治疗之前进一步离体操纵(如,通过如本文所述的另一轮碱基编辑)。另外,碱基编辑可在体内进行,从而在体内校正疾病相关的突变后治疗受试者的疾病或病症。
在一些实施方案中,切口酶配偶体融合至另外的活性结构域。在一些实施方案中,另外的结构域包括选自一个或多个脱氨酶(如,A特异性或C特异性),UGI结构域,解旋酶和GAM结构域的一个或多个示例性结构域。另一方面,本文描述了试剂盒,其包含如本文所述的碱基编辑复合物或编码如本文所述的一种或多种碱基编辑复合物蛋白的一个或多个多核苷酸;辅助试剂;以及任选地,说明书和合适的容器。
鉴于整体上的公开,这些和其他方面对于本领域技术人员而言将是显而易见的。
附图简述
图1A至1D是描述示例性DNA编辑系统和复合物的示意图。图1A显示包含一个无催化活性融合分子(用“X”表示,其包含DNA结合结构域(如,ZFP、TALE、sgRNA))和一个催化活性切口酶融合分子(用剪刀表示,同样包含DNA结合结构域(如,ZFP、TALE、sgRNA))的系统。催化活性和无催化活性融合分子在DNA结合结构域与它们各自的靶位点结合时二聚化,并在结合后编辑靶DNA(如,碱基编辑)。图1A还显示包含两个UGI结构域的复合物。图1B显示用于碱基编辑的另一示例性Cas9和无Cas9系统。上图显示碱基编辑器,其通过使任何腺苷或胞嘧啶脱氨酶结构域的组分二聚化来发挥作用。图1B的下图示出如本文所述的ABE和CBE碱基编辑器的不同实施方案。图1C显示本文所述的碱基编辑器的另一个实施方案,其包含Cas9 DNA去稳定分子(如,包含可操作地连接至sgRNA的dCas9的RNA可编程系统),任选地连接至ZFP锚;ZFP-脱氨酶融合蛋白;和ZFN切口酶。在某些实施方案中,ZFN切口酶不存在,并且DNA去稳定分子包含任何RNA可编程分子。该示意图显示来自ZFP脱氨酶融合蛋白的Cas9切口酶相对侧的ZFN切口酶,但显然ZFN切口酶和ZFP脱氨酶可同时位于Cas9切口酶的3’或5’。图1D显示其他无Cas9(又被称为非Cas9)碱基编辑系统。三角形表示出现切口的位置,“PNA”指肽核酸;“LNA”指锁核酸,“BNA”指桥连核酸。这些碱基编辑器(如,DNA寡核苷酸、RNA寡核苷酸、肽核酸(PNA)、锁核酸(LNA)和/或桥连核酸(BNA))中的核苷酸可在靶位点处为碱基编辑器提供单链DNA底物。
图2显示由示例性腺嘌呤碱基编辑器靶向的DNA的示意图。该图显示在A1AT Z突变附近的DNA序列,其中野生型mRNA前间区序列和PAM在顶部对齐(SEQ ID NO:78)。前间区序列的右侧显示几种不同ZFP的DNA靶标。如图所示,对于需要PAM序列的ABE,用于碱基编辑的靶标(又被称为碱基编辑窗口)通常是来自PAM序列的13-16个核苷酸,并且可以是3、4、5、6、7个或更多个核苷酸大小(图中显示的是4个核苷酸的碱基编辑窗口)(SEQ ID NO:77)。
图3A和3B是描述示例性ZFP碱基编辑器的示意图。图3A示出示例性ZFP腺嘌呤碱基编辑器。上图显示具有所示组分的示例性编辑器。中间图显示使用两个大肠杆菌tRNA特异性腺苷脱氨酶(tadA)的示例性ABE,其中一个是野生型序列,另一个是进化的序列(Gaudelli,et al.(2017)Nature 551(7681):464-471))。使用所示接头(SEQ ID NO:2)将TadA结构域彼此附接并附接至SPCas9序列。使用的SpCas9是VRVRFRR变体,具有已知放宽的PAM需求(参见Nishimasu,et al.(2018)Science 361:1259-1262)。然后将Cas9序列连接至ZFP DNA结合结构域,其中所使用的接头(SEQ ID NO:3)可包含两个NLS序列和三个HA标签。Cas9VR又被称为Cas9NG。图3B示出如本文所述的示例性Cas9和无Cas9碱基编辑器。使用以下缩写:“TadA”指野生型腺嘌呤脱氨酶结构域;TadA*指进化(工程化)的腺嘌呤脱氨酶结构域;“7.8”、“7.9”、“7.10”和“MAX”指进化(工程化)的腺嘌呤脱氨酶结构域,如Gaudelli,etal.(2017)Nature 551(7681):464-471和Koblan,et al.(2018)Nat Biotechnol.36(9):843-846中所述;“SpCas9[PAM:NGG]”指酿脓链球菌的Cas9,如Jinek,et al.(2012)Science337(6096):816-21中所述;“SpXCas9-3.7[PAM:NGN,GAA&GAT]”指具有广泛PAM兼容性的SpCas9变体,如Hu,et al.(2018)Nature 556(7699):57-63中所述;“SpCas9-NG[PAM:NGN;体外NAN]指具有放宽的PAM需求的SpCas9变体,如Nishimasu,et al.(2018)Science 361(6408):1259-1262中所述;“ScCas9[PAM:TGT,…]”指具有最小PAM特异性的SpCas9直系同源物,如Chatterjee,et al.(2018)Sci Adv 4(10):eaau0766.doi:10.1126/sciadv.aau0766中所述;“NO CAS9”表示该结构域不存在(无Cas9的碱基编辑器);“5F ZFP”指5个指的ZFP;“6F ZFP”指6个指的ZFP;“>6F ZFP”指具有多于6个指的ZFP;“ZFP RQ”和“(…)”指经修饰的ZFP,如Miller,et al.(2019)Nature Biotechnology 37(8):945-952中所述。
图4是描绘位于编辑窗口(SEQ ID NO:4)内被分析腺嘌呤碱基编辑器靶向的腺嘌呤碱基的示意图。
图5A至5F是描述示例性胞苷碱基编辑器构建体的示意图。图5A和5B显示碱基编辑器构建体,其包含编码两个UGI蛋白的序列,其连接至ZFP DNA结合结构域,并进一步连接至编码APOBEC1(图5A)或AID(图5B)胞苷酶(能够使C核苷酸脱氨基为U)的序列。图5C和5D描绘缺少图5A和5B的构建体的UGI结构域的两个胞苷碱基编辑器构建体。图5E和5F描绘利用编码FokI切口酶的序列的两个构建体。这些构建体可以成对使用,其中编码胞苷碱基编辑器的序列连接至ZFP DNA结合结构域,该ZFP DNA结合结构域接着连接至FokI无催化活性核酸酶结构域。第二构建体(图5F)包含编码连接至ZFP DNA结合结构域的两个UGI结构域的序列,该ZFP DNA结合结构域连接至编码催化活性FokI核酸酶结构域的序列。该对可以以任何方式构建,以形成活性碱基编辑器,其中活性和非活性FokI结构域可位于两个配偶体构建体的任一个,并且UGI序列和胞苷碱基编辑器序列可位于任一配偶体上。
图6A和6B描绘了两个示例性腺嘌呤碱基编辑器。图6A显示包含编码两个TadA结构域(一个是野生型和一个是进化的)并连接至ZFP DNA结合结构域的序列的构建体。如图6B中所示,在一些变化中,构建体还包含无催化活性FokI结构域。
图7A至7C示出JAK2 V617F靶标的碱基编辑。图7A左侧显示野生型DNA双链序列(SEQ ID NO:30),其中上部示出编码的缬氨酸(V)。中间序列显示突变的DNA双链序列(SEQID NO:31),其中上部显示突变体苯丙氨酸(F)。右侧显示两个可能的碱基编辑结果(SEQ IDNO:32和33),其中经编辑的核苷酸以粗体显示,在上部变化为丝氨酸(S)或脯氨酸(P)。图7B显示JAK2 V617F突变周围的DNA序列(SEQ ID NO:34),其中示出两个最接近的PAM位点。图7B公开如SEQ ID NO:79的蛋白序列。图7C显示无V617F突变的K562细胞中所示碱基编辑器的示例性结果。将碱基编辑窗口的其他A:T对用于评估所测试碱基编辑器的活性。ABEmax-Cas9NG指示与ABEmax融合的Cas9NG切口酶。用7种不同ZFP(显示为ZFP 2、ZFP 4、ZFP 6和ZFP 7)锚定ABEmax-Cas9。图7C左侧显示三个不同PAM位点(AAT,TAA,AAA;参见图7B)的结果。在此,ABEmax表达构建体和相应sgRNA作为质粒DNA(各600ng)提供。ZFP锚定的ABEmax-Cas9NG构建体对全部3个PAM位点显示增加的效率(AAT和AAA PAM位点约为2倍;TAA PAM位点约为12倍)。还以较高剂量(800ng质粒DNA)测试AAT和TAA PAM位点的碱基编辑器,并显示相似的结果。对于AAT PAM位点,ZFP 6导致约2.5倍更高的活性,对于TAA PAM位点,ZFP 2导致更高约17倍的活性。
图8A至8G是示出示例性碱基编辑器的示意图,其包括核苷酸(如,用于在靶位点为碱基编辑器提供单链DNA底物的DNA寡核苷酸、RNA寡核苷酸、肽核酸(PNA)、锁核酸(LNA)和/或桥连核酸(BNA),如图1D中所示)。图8A描绘与碱基编辑器的含核苷酸的单链底物接触之前(左侧)和之后(右侧)待编辑的靶定碱基(“X”)。图8B描绘用于本文所述碱基编辑器的示例性PNA(PNA#1),该PNA具有以下结构:N-Lys-Lys-Lys-NNNNNNNNNN-OOO-NNNNNNNNNN-Lys-Lys-Lys-C。图8C描绘用于本文所述碱基编辑器的示例性PNA(PNA#2),该PNA具有以下结构:N-Lys-Lys-Lys-NNNNNNNNNN-OOO-NNNNNNNNNNNNNNN-Lys-Lys-Lys-C。图8D描绘包括2个PNA(具有以下结构的PNA#3:N-Lys-Lys-Lys-NNNNNNNNNN-OOO-NNNNNNNNNN-Lys-Lys-Lys-C和具有以下结构的PNA#4:N-Lys-Lys-Lys-NNNNNNNNNN-OOO-NNNNNNNNNN-Lys-Lys-Lys-C,二者相对彼此为相反方向)的碱基编辑器的示例性实施方案。图8E描绘包括结构N-Lys-Lys-Lys-NNNNNNNNNNNNNNN-Lys-Lys-Lys-C(PNA#5)的PNA的示例性实施方案。在图8B至8E中,O表示8-氨基-2,6-二氧杂辛酸接头,且C表示胞嘧啶。PNA序列的N-和/或C-末端的Lys残基是任选的,并且假异胞嘧啶可取代胞嘧啶。图8F和8G描绘包括LNA的碱基编辑器的示例性实施方案。图8F示出示例性LNA(LNA#1)(SEQ ID NO:80)。示例性LNA#1序列包括LNA#1a:5’-NnNnNnNnNnNnNnNtctctnNnNnNnNnNnNnNnNnnNnnNnnNnnNn-3’(SEQ ID NO:1);LNA#1b:5’-N*n*NnNnNnNnNnNnNtctctnNnNnNnNnNnNnNnNnnNnnNnnNnn*N*n-3’(SEQ ID NO:69);和LNA#1c:5’-NnNnNnNnNnNnNnNtctctnNnNnNnNnNnNnNnNnnNnnNnnNnnNn-Chol-TEG-3’(SEQ ID NO:70)。图8G示出包括相对于彼此以相反方向示出的2个LNA(LNA#2:5’-NnNnNnNnNntctctNnNnNnNnNn-3’(SEQ ID NO:71)和LNA#3:5’-NnNnNnNnNntctctNnNnNnNnNn-3’(SEQ ID NO:72))的碱基编辑器的示例性实施方案。图8F和8G中,LNA核苷酸为大写;DNA核苷酸为小写;“*”表示硫代磷酸酯键;“Chol-TEG”表示用于增强细胞摄取的3’胆固醇-TEG。
发明详述
人工核酸酶,如工程化锌指核酸酶(ZFN),转录激活因子样效应物核酸酶(TALEN),具有工程化crRNA/tracr RNA(“单个引导RNA”)的CRISPR/Cas系统(又被称为RNA引导的核酸酶)和/或基于Argonaute体系的核酸酶,正在彻底改变医学、生物技术和农业领域。这些分子工具使生物体中基因组的基因操纵(如,编辑)达到前所未有的水平。人工核酸酶能够切割DNA,使得此类切割后,细胞被迫通过易错非同源末端连接(NHEJ)或在与切割位点侧翼区同源的底物DNA存在下通过同源定向修复(HDR)插入底物DNA来“修复”断裂。这两个过程均始于DNA的双链断裂(DSB)。
本文描述了用于碱基编辑的组合物(系统)和方法,其不使用双链切割进行基因修饰。碱基编辑基本依赖于改变DNA链中特定碱基的身份,并且涉及DNA碱基的位点特异性修饰以及DNA修复机制的操纵,以避免修复所编辑的碱基。通常通过使用打开DNA双螺旋结构的系统,使得存在单链DNA区域来实现。接着,碱基本身通过碱基修饰酶如脱氨酶起作用来改变核苷结构。例如,激活诱导脱氨酶(AID)和载脂蛋白B mRNA编辑酶催化性多肽样家族蛋白(APOBEC)是对抗体的多样化和对逆转录病毒的固有免疫力至关重要的胞苷脱氨酶。这些酶将DNA的胞苷(C)转化为尿嘧啶(U)。如果DNA复制发生在尿嘧啶修复之前,复制机制会将尿嘧啶视为胸腺嘧啶(T),导致C:G至T:A碱基对转化(Yang,et al.(2016)Nat Commun doi10.1038/ncomms13330),因而该系统可用于生成C至T点突变。
可将如本文所述的任何碱基编辑器用于任何用途的靶向碱基编辑,包括但不限于基因敲除(如,改变碱基以产生终止密码子代替常规密码子;改变剪接受体位点的碱基);在基因的控制(启动子)区引入突变以激活或抑制基因表达;和/或通过逆转点突变来校正致病突变。还提供了包含碱基编辑器和/或通过碱基编辑器进行靶向变化(但不再包含碱基编辑器本身)的细胞和细胞系。
与当前使用的碱基编辑器相比,本发明的碱基编辑器提供了出乎意料地优越的编辑效率和/或特异性。
概述
除非另有说明,否则本文所公开方法的实践以及组合物的制备和使用采用分子生物学、生物化学、染色质结构和分析、计算化学、细胞培养、重组DNA和相关领域中的常规技术,它们在本领域技术范围内。这些技术在文献中已得到充分解释。参见,例如Sambrook etal.MOLECULAR CLONING:A LABORATORY MANUAL,第二版,Cold Spring Harbor LaboratoryPress,1989和第三版,2001;Ausubel et al.,CURRENT PROTOCOLS IN MOLECULARBIOLOGY,John Wiley&Sons,New York,1987及定期更新;METHODS IN ENZYMOLOGY系列,Academic Press,San Diego;Wolffe,CHROMATIN STRUCTURE AND FUNCTION,第三版,Academic Press,San Diego,1998;METHODS IN ENZYMOLOGY,Vol.304,“Chromatin”(P.M.Wassarman and A.P.Wolffe编),Academic Press,San Diego,1999;以及METHODS INMOLECULAR BIOLOGY,Vol.119,“Chromatin Protocols”(P.B.Becker编)Humana Press,Totowa,1999。
定义
术语“核酸”、“多核苷酸”和“寡核苷酸”可互换使用,并且是指线性或环状构造以及单链或双链形式的脱氧核糖核苷酸或核糖核苷酸聚合物。为了本公开的目的,这些术语不应解释为对聚合物长度的限制。该术语可涵盖天然核苷酸的已知类似物,以及在碱基、糖和/或磷酸部分(如,硫代磷酸酯主链)中修饰的核苷酸。通常,特定核苷酸的类似物具有相同的碱基配对特异性,即A的类似物将与T碱基配对。
术语“多肽”、“肽”和“蛋白”可互换使用,是指氨基酸残基的聚合物。术语还适用于氨基酸聚合物,其中一个或多个氨基酸是相应的天然存在的氨基酸的化学类似物或修饰的衍生物。
“结合”是指大分子之间(如,蛋白与核酸之间)的序列特异性、非共价相互作用。只要相互作用整体上是序列特异性的,并不是结合相互作用的所有组分都需要具有序列特异性(如,与DNA主链中的磷酸酯残基接触)。此类相互作用通常以10-6M-1或更低的解离常数(Kd)为特征。“亲和力”是指结合强度:增加的结合亲和力与较低的Kd相关。“非特异性结合”是指在不依赖在靶序列的任何感兴趣的分子(如,工程化核酸酶)和大分子(如,DNA)之间发生的非共价相互作用。
“结合蛋白”是能够非共价结合另一分子的蛋白。结合蛋白可结合如DNA分子(DNA结合蛋白)、RNA分子(RNA结合蛋白)和/或蛋白质分子(蛋白质结合蛋白)。在蛋白质结合蛋白的情况下,它可结合自身(以形成同二聚体、同三聚体等)和/或它可结合不同蛋白的一个或多个分子。结合蛋白可具有超过一种类型的结合活性。例如,锌指蛋白具有DNA结合、RNA结合和蛋白结合活性。在RNA引导的核酸酶系统的情况下,引导RNA与核酸酶组分(Cas9或Cfp1)异源且二者都被工程化改造。
“DNA结合分子”是可结合DNA的分子。此类DNA结合分子可以是多肽、蛋白质的结构域、较大蛋白质内的结构域或多核苷酸。在一些实施方案中,多核苷酸是DNA,而在其他实施方案中,多核苷酸是RNA。在一些实施方案中,DNA结合分子是核酸酶的蛋白质结构域(如,FokI结构域),而在其他实施方案中,DNA结合分子是RNA引导的核酸酶(如,Cas9或Cfp1)的引导RNA组分。DNA结合分子可包含蛋白质或较大蛋白质内的结构域,其以序列特异性的方式结合DNA,例如,通过一个或多个锌指或通过与锌指蛋白(ZFP)的一个或多个ZFP识别螺旋区或TALE的RVD相互作用。DNA结合分子还包括CRISPR/Cas系统的单个引导RNA(sgRNA)和/或Ttago系统的DNA结合结构域。术语锌指DNA结合蛋白通常缩写为锌指蛋白或ZFP。
“锌指DNA结合蛋白”(或结合结构域)是通过一个或多个锌指以序列特异性方式结合DNA的蛋白质或较大蛋白质内的结构域,锌指是结合结构域内氨基酸序列区,其结构通过锌离子的配位而稳定。术语锌指DNA结合蛋白通常缩写为锌指蛋白或ZFP。
“TALE DNA结合结构域”或“TALE”是包含一个或多个TALE重复结构域/单元的多肽。重复结构域参与TALE和其同源靶DNA序列的结合。单个“重复单元”(也称为“重复序列”)的长度通常为33-35个氨基酸,并且与天然存在的TALE蛋白内的其他TALE重复序列表现出至少一些序列同源性。参见,如美国专利号8,586,526,其通过引用整体并入本文。
DNA结合结构域可被“工程化改造”以结合至预定的核苷酸序列,如通过工程化改造天然存在的锌指蛋白的识别螺旋区(改变一个或多个氨基酸)或通过工程化改造参与DNA结合的氨基酸(重复可变双残基或RVD区)。因此,工程化锌指蛋白或TALE蛋白是非天然存在的蛋白。用于工程化改造锌指蛋白和TALE的方法的非限制性实例是设计和选择。设计的蛋白质是自然界中不存在的蛋白质,其设计/组成主要源自合理的标准。合理的设计标准包括应用取代规则和用于处理存储现有ZFP或TALE设计和结合数据数的信息的数据库中信息的计算机算法。参见,如美国专利号9,458,205;8,586,526;6,140,081;6,453,242;和6,534,261;同样参见WO 98/53058;WO 98/53059;WO 98/53060;WO 02/016536和WO 03/016496。
自然界中不存在“选定的”锌指蛋白、TALE蛋白或CRISPR/Cas系统,并且其产生主要源自经验过程,如噬菌体展示、相互作用陷阱、合理设计或杂交选择。参见,如美国专利号5,789,538;5,925,523;6,007,988;6,013,453;和6,200,759;以及国际专利公开号WO 95/19431;WO 96/06166;WO 98/53057;WO 98/54311;WO 00/27878;WO 01/60970;WO 01/88197;和WO 02/099084。
“TtAgo”是被认为参与基因沉默的原核Argonaute蛋白。TtAgo源自细菌嗜热栖热菌(Thermus thermophilus)。参见,如Swarts,et al.(2014)Nature 507(7491):258-261;Swarts,et al.(2012)PLoSOne 7(4):e35888;G.Sheng,et al.(2013)Proc.Natl.Acad.Sci.U.S.A.111,652)。“TtAgo系统”是所需要的全部组分,包括如,由TtAgo酶切割的引导DNA。
“切割”是指DNA分子的共价主链的断裂。切割可通过多种方法引发,包括但不限于磷酸二酯键的酶促水解或化学水解。单链裂解和双链裂解两者都是可能的,并且由于两个不同的单链裂解事件而可能发生双链裂解。DNA切割可导致产生平端或交错端。在某些实施方案中,将融合多肽用于靶向双链DNA切割。
“切割半结构域”是与第二多肽(相同或不同)结合形成具有切割活性(优选双链切割活性)的复合物的多肽序列。术语“第一和第二切割半结构域”;“+和-切割半结构域”和“右和左切割半结构域”可互换使用,是指二聚化的切割半结构域对。术语“切割结构域”与术语“切割半结构域”可互换使用。术语“FokI切割结构域”包括如SEQ ID NO:5所示的FokI序列以及任何FokI同源物。
“工程化切割半结构域”是已经修饰以便与另一个切割半结构域(如,另一个工程化切割半结构域)形成专性异二聚体的切割半结构域。
如本文所用,术语“编辑”是指其中核苷酸碱基相比相同位置的初始(如,野生型)碱基被修饰的过程。碱基编辑(如,靶向点突变)必定再现从经编辑的DNA转录的任何mRNA的变化。腺嘌呤和胞苷脱氨酶从它们各自的核苷酸靶去除氨基,分别将其转化为肌苷和尿苷。DNA修复或复制期间,肌苷被聚合酶识别为鸟嘌呤,尿苷被识别为胸腺嘧啶,导致已经编辑的双链DNA中A:T碱基对转化为G:C碱基对,或C:G碱基对转化为T:A碱基对。“碱基编辑窗口”是指由本文所述的碱基编辑器进行编辑的任何碱基,其可与编辑系统的任何组分相距任何距离,通常在碱基编辑系统的至少一个组分与靶DNA结合之后易接近区域内。需要PAM序列的碱基编辑器(如,包含Cas9的编辑器)通常具有3、4、5、6、7个或更多个核苷酸的碱基编辑窗口,该核苷酸可以是PAM序列中的13-16个或更多个核苷酸。本文所述碱基编辑器可用于任何用途的靶向碱基编辑,包括但不限于基因敲除(如,改变碱基以产生代替常规密码子的终止密码子;改变剪接受体位点中的碱基);在基因控制(启动子)区引入突变以激活或抑制基因表达;和/或通过逆转点突变来校正致病突变。包含碱基编辑器和/或通过碱基编辑器进行靶向改变(但不再包含碱基编辑器本身)的细胞系。
术语“序列”是指任何长度的核苷酸序列,其可以是DNA或RNA;可以是线性、环状或分支的,并且可以是单链或双链的。术语“转基因”是指插入基因组中的核苷酸序列。转基因可具有任何长度,例如长度为2至100,000,000个核苷酸(或其间或其上的任何整数值),优选长度为约100至100,000个核苷酸(或其间的任何整数),更优选地长度为约2000至20,000个核苷酸(或其间的任何值),甚至更优选为约5至15kb(或其间的任何值)。
“染色体”是包含细胞基因组的全部或部分的染色质复合物。细胞的基因组通常以其核型表征,核型是构成细胞基因组的全部染色体的集合。细胞的基因组可包含一个或多个染色体。
“游离体”是包含非细胞染色体核型部分的核酸的复制核酸、核蛋白复合物或其他结构。游离体的示例包括质粒、微环和某些病毒基因组。本文所述的肝特异性构建体可保持游离,或可选择地可稳定整合至细胞中。
“外源”分子是通常不存在于细胞中但可通过一种或多种遗传、生化或其他方法引入细胞的分子。相对于细胞的特定发育阶段和环境条件确定“细胞中的正常存在”。因此,例如,仅在肌肉的胚胎发育期间存在的分子是相对于成年肌肉细胞的外源分子。类似地,相对于非热激细胞,由热激诱导的分子是外源分子。外源分子可包括,如功能失常的内源性分子的功能形式或功能正常的内源性分子的功能失调形式。
此外,外源分子可以尤其是小分子,如通过组合化学过程产生的小分子,或者大分子,如蛋白质、核酸、碳水化合物、脂质、糖蛋白、脂蛋白、多糖、上述分子的任何修饰衍生物,或包含一种或多种上述分子的任何复合物。核酸包括DNA和RNA,可以是单链或双链;可以是线性、分支或环状;并且可以是任何长度。核酸包括能够形成双链体的核酸以及形成三链体的核酸。参见,如美国专利号5,176,996和5,422,251。蛋白质包括但不限于DNA结合蛋白、转录因子、染色质重塑因子、甲基化DNA结合蛋白、聚合酶、甲基化酶、脱甲基酶、乙酰化酶、去乙酰化酶、激酶、磷酸酶、整合酶、重组酶、连接酶、拓扑异构酶、促旋酶和解旋酶。
外源分子可以是与内源分子相同类型的分子,如外源蛋白质或核酸。例如,外源核酸可包含感染性病毒基因组、引入细胞中的质粒或游离体、或细胞中正常不存在的染色体。将外源分子引入细胞的方法是本领域技术人员已知的,并且包括但不限于脂质介导的转移(即脂质体,包括中性和阳离子脂质)、电穿孔、直接注射、细胞融合、颗粒轰击、磷酸钙共沉淀、DEAE-葡聚糖介导的转移、以及病毒载体介导的转移。外源分子也可以是与内源分子相同类型的分子,但源自不同于细胞来源的物种。例如,可将人核酸序列引入最初源自小鼠或仓鼠的细胞系。将外源分子引入植物细胞的方法是本领域技术人员已知的,并且包括但不限于原生质体转化、碳化硅(如,WHISKERSTM)、农杆菌介导的转化、脂质介导的转移(即,脂质体,包括中性和阳离子脂质)、电穿孔、直接注射、细胞融合、粒子轰击(如,使用“基因枪”)、磷酸钙共沉淀、DEAE-葡聚糖介导的转移、以及病毒载体介导的转移。
相反,“内源”分子是通常在特定环境条件下特定发育阶段存在于特定细胞中的分子。例如,内源性核酸可包含染色体、线粒体、叶绿体或其他细胞器的基因组,或天然存在的游离核酸。其他内源分子可包括蛋白质,如转录因子和酶。
如本文所用,术语“外源核酸的产物”包括多核苷酸和多肽产物两者,例如,转录产物(多核苷酸,如RNA)和翻译产物(多肽)。
“融合”分子是其中两个或更多个亚基分子连接(优选共价连接)的分子。亚基分子可以是相同化学类型的分子,也可以是不同化学类型的分子。融合分子的实例包括但不限于,融合蛋白(如,蛋白质DNA结合结构域和切割结构域之间的融合物),可操作地与切割结构域缔合的多核苷酸DNA结合结构域(如,sgRNA),以及融合核酸(如,编码融合蛋白的核酸)。
细胞中融合蛋白的表达可由融合蛋白至细胞的递送或编码融合蛋白的多核苷酸至细胞的递送而产生,其中多核苷酸被转录和转录本被翻译转而产生融合蛋白。反式剪接、多肽切割和多肽连接也可参与蛋白质在细胞中的表达。用于递送多核苷酸和多肽至细胞的方法在本公开内容的其他地方描述。
“分裂酶(split enzyme)”是已被分成两种或多种无活性多肽链然后重新组装成可操作酶的酶。分裂酶组装成活性蛋白通常通过邻近性驱动,其中每条无活性多肽链融合至能够将无活性链物理地放在一起使得它们能组装的其他分子,从而克服碎片化的熵成本。融合分子可以是彼此相互作用的其他蛋白质,或者彼此相互作用或与共同配体相互作用的任何类型分子,使得相互作用导致组成分裂酶的多肽的组装。参见,例如Shekhawatand Ghosh(2011)Curr Opin Chem Biol 15(6):789-797。
为了本公开的目的,“基因”包括编码基因产物的DNA区域(参见下文),以及调节基因产物产生的所有DNA区域,无论此类调节序列是否与编码和/或转录序列相邻。因此,基因包括但不必限于启动子序列、终止子、翻译调节序列如核糖体结合位点和内部核糖体进入位点、增强子、沉默子、绝缘子、边界元件、复制起点、基质附着位点和基因座控制区。
“基因表达”是指将基因中包含的信息转化为基因产物。基因产物可以是基因的直接转录产物(如,mRNA、tRNA、rRNA、反义RNA、核酶、结构RNA或任何其他类型的RNA)或由mRNA翻译产生的蛋白质。基因产物还包括通过诸如加帽、聚腺苷酸化、甲基化和编辑等过程修饰的RNA,以及通过如甲基化、乙酰化、磷酸化、泛素化、ADP-核糖基化、肉豆蔻化和糖基化修饰的蛋白质。
基因表达的“调控”是指基因活性的变化。表达的调控可包括但不限于基因激活和基因阻抑。可将基因组编辑(如切割、改变、失活、随机突变)用于调控表达。基因失活是指与不包含如本文所述ZFP、TALE或CRISPR/Cas系统的细胞相比,基因表达的任何降低。因此,基因失活可以是部分或完全的。
“感兴趣的区域”是细胞染色质的任何区域,如,例如基因或者在基因内或基因附近的非编码序列,其中期望结合外源分子。结合可出于靶向DNA切割和/或靶向重组的目的。例如,感兴趣的区域可存在于染色体、游离体、细胞器基因组(如,线粒体、叶绿体)或感染性病毒基因组中。感兴趣的区域可在基因的编码区域内,在转录的非编码区域内如,例如前导序列、尾随序列或内含子,或在非转录区域内(编码区域的上游或下游)。感兴趣的区域可以小到单核苷酸对或至多2,000个核苷酸对的长度,或者任何整数值的核苷酸对。
“真核”细胞包括但不限于真菌细胞(如,酵母)、植物细胞、动物细胞、哺乳动物细胞和人细胞(如,T细胞),包括干细胞(多能性和专能性)。
术语“可操作连接”和“可操作地连接的”(或“可操作连接的”)涉及两个或更多个组分(如,序列元件)的并列时可互换使用,其中排列组分使得这两个组分正常发挥功能,并允许这样的可能性,即至少一个组分可介导对至少一个其他组分施加的功能。举例来说,若转录调节序列响应一种或多种转录调节因子的存在或不存在来控制编码序列的转录水平,则将转录调节序列如启动子可操作地连接至编码序列。转录调节序列通常与编码序列顺式可操作地连接,但是不必直接与其相邻。例如,增强子是与编码序列可操作连接的转录调节序列,即使它们不是连续的。
蛋白质、多肽或核酸的“功能性片段”是如下的蛋白质、多肽或核酸,其序列与全长蛋白、多肽或核酸不同,但仍保留与全长蛋白、多肽或核酸相同的功能。功能性片段可拥有与相应的天然分子相比更多、更少或相同数目的残基,和/或可包含一个或多个氨基酸或核苷酸取代。确定核酸或蛋白质功能(如,编码功能,与另一核酸杂交的能力,酶活性测定)的方法是本领域公知的。
多核苷酸“载体”或“构建体”能够将基因序列转移至靶细胞。通常,“载体构建体”、“表达载体”、“表达构建体”、“表达盒”和“基因转移载体”意指能够指导感兴趣的基因表达并且可将基因序列转移至靶细胞的任何核酸构建体。因此,术语包括克隆和表达媒介物,以及整合载体。
术语“受试者”和“患者”可互换使用,是指哺乳动物,如人患者和非人灵长类,以及实验动物如兔、狗、猫、大鼠、小鼠和其他动物。因此,如本文所用的术语“受试者”或“患者”是指可施用本发明的表达盒的任何哺乳动物患者或受试者。本发明的受试者包括患有病症的那些受试者。
如本文所用,术语“治疗”和“处理”是指症状的严重性和/或频率的降低、症状和/或基本病因的消除、症状和/或其基本病因的发生的预防、以及损害的改善或补救。癌症、单基因疾病和移植物抗宿主病是可使用本文所述的组合物和方法治疗的病况的非限制性实例。
“染色质”是包含细胞基因组的核蛋白结构。细胞染色质包含核酸(主要是DNA)和蛋白质,包括组蛋白和非组蛋白染色体蛋白。大多数真核细胞染色质以核小体的形式存在,其中核小体核心包含与八聚体结合的约150个碱基对的DNA,该八聚体包含组蛋白H2A、H2B、H3和H4各2个;并且接头DNA(随生物体而具有可变长度)在核小体核心之间延伸。组蛋白H1分子通常与接头DNA缔合。为了本公开内容的目的,术语“染色质”意指涵盖原核和真核的所有类型的细胞核蛋白。细胞染色质包括染色体和游离染色质两者。
“易接近区域”是细胞染色质的位点,其中核酸中存在的靶位点可被识别该靶位点的外源分子结合。不希望受任何特定理论的束缚,认为易接近区域是未包装成核小体结构的区域。通常通过其对化学和酶探针如核酸酶的敏感性来检测易接近区域的不同结构。
“靶位点”或“靶序列”是核酸序列,其定义了若足够的结合条件存在时结合分子将结合的核酸的一部分。例如,序列5’-GAATTC-3’是大肠杆菌限制性内切核酸酶的靶位点。“预期的”或“在靶(on-target)”序列是结合分子预期结合的序列,而“非预期的”或“脱靶(off-target)”序列包括被结合分子结合的非预期靶的任何序列。
术语“DNA去稳定分子”和“DNA解链分子”可互换地使用,是指有助于增加由碱基编辑器靶向的碱基的可及性(如,通过暴露)的任何分子(如,蛋白质、核苷酸、小分子等)。该术语包括但不限于切口酶、寡核苷酸(LNA、PNA、BNA等)、RNA可编程系统(如,与sgRNA可操作地连接的CAS蛋白),以及其他蛋白质(如,表A)。
碱基编辑器
本文所述碱基编辑组合物(系统)可直接改变单个DNA碱基对的身份而不诱导双链断裂。因此,碱基编辑器不依赖于对靶细胞的DNA修复途径偏好。此外,由于未在靶DNA中进行双链断裂,不存在游离DNA端因而没有易位。
本文所述碱基编辑器可以是胞嘧啶碱基编辑器(CBE)(将C:G对改变为T:A对),或腺嘌呤碱基编辑器(ABES)(将A:T对改变为G:C对)。这些碱基编辑器可用于失活(基因敲除),例如通过将常规密码子转换成终止密码子(如,使用胞嘧啶碱基编辑器)和/或使用胞嘧啶或腺嘌呤碱基编辑器突变剪接受体位点。此外,本文所述碱基编辑器可用于改变基因的控制(如,启动子区),以活化或阻抑基因的表达。此外,碱基编辑可用于校正突变,特别是疾病引起的突变。
继开发首个APOBEC-dCas9碱基编辑器之后,开发了被称为BE2的第二碱基编辑器,其中加入尿嘧啶DNA糖基酶(UGI)。碱基切除修复是细胞对G:U错配的主要响应,并通过尿嘧啶N-糖基酶(UNG)切除尿嘧啶来启动。为了保护来自UNG切除的经编辑的G:U中间体,将83个氨基酸的尿嘧啶糖基酶抑制剂(UGI)直接加入到催化死亡的Cas9(DCAS9)的C端,从而导致效率提高(Komor,et al.(2017)Science Advances 3(8):eaao4774)。在早期版本的碱基编辑器中,通常使用死亡的Cas9,使得将DNA复制机制用于执行与经编辑碱基相对的核苷酸碱基的最终转化。此外,已将Cas切口酶用于在包含经编辑碱基的链的相对链上形成切口。切口的形成吸引了DNA修复机制,使得使用经编辑的链作为模板,切口下游的区域被切除和取代。胞苷碱基编辑器BE3使用切口酶Cas(Cas9 D10A),这也提高了效率(Kim,et al.(2017)Nat Biotechnol35(4):371-376)。在另一个变体中,BE4系统为了更大的效率同时在复合物的N和C端使用两个UGI结构域。另一种胞苷脱氨酶系统依赖于活化诱导的胞苷脱氨酶(AID)与切口酶CAS9(“靶-AID”)组合。
当碱基编辑器与DNA相互作用时,基于Cas的编辑器需要PAM序列与活性的窗口(碱基编辑窗口)相互作用,其中该活性的窗口(碱基编辑窗口)通常是来自PAM序列5’末端的13-16个碱基(同样参见,图2)。上述不同编辑系统的活性窗口是不同的。靶-AID系统编辑远离PAM序列的碱基,而BE4系统编辑接近PAM的那些碱基。碱基编辑器已基于Cpf1 CRISPR系统(Eid,et al.,同上)构建。此外,使用源自酿脓链球菌和金黄色葡萄球菌的CRISPR系统(分别为PE4和SABE4)开发了碱性编辑器的BE4配置。因此,Cas9碱基编辑系统受以下限制:与靶位点适当隔开的PAM序列的可用性(因为距离可显著影响碱基编辑器的效率和/或特异性)和/或PAM序列与碱基编辑窗口的距离(如图2A中所示,靶碱基(如,A)和NGG PAM的5’末端之间的13-16个碱基。
因此,在本发明之前,已知Cas9碱基编辑器诱导全基因组脱靶效应以及旁观者效应(靶碱基附近的非预期编辑)。参见,例如,Zuo,et al.(2019)Science364(6437):289-292;Jin,et al.(2019)Science 364(6437):292-295;Gruenewald,et al.(2019)Nature569(7756):433-437。
另外的碱基编辑器配置包括使用来自噬菌体Mu的GAM蛋白。在某些情况下,已观测到由于某些类型碱基编辑所致的插入缺失(插入和删除)。由于一些碱基编辑器在U的相对链形成切口,通过UNG切割糖苷键,然后通过AP裂解酶加工所得到的无嘌呤或无嘧啶位点,可能导致双链DNA断裂(DSB),潜在地导致插入缺失形成。噬菌体Mu的Gam蛋白与DSB末端结合,并保护它们免于降解,从而使用GAM结合DSB的自由末端可减少碱基编辑期间插入缺失形成(Komor,et al.(2016)Nature 533:420-424;Komor,et al.(2017)Science Advances3(8))。除了胞苷脱氨酶编辑器外,已开发具有合成腺苷脱氨酶的碱基编辑器,其将腺嘌呤碱基转化为肌苷(腺嘌呤碱基编辑器:“ABEs”,参见Gaudelli,et al.(2017)Nature 551(7681):464-471)。肌苷可与胞苷碱基配对并随后校正为鸟嘌呤,从而将A转化为G,或将A:T转化为G:C。
如上所述,如本文所述碱基编辑器可进一步包含“打开”DNA螺旋以暴露DNA单链区域内的靶碱基的分子。可实现这一点的常见分子包括但不限于DNA螺旋酶、螺旋去稳定分子和细菌DnaA蛋白、单链DNA结合蛋白、三链体形成寡核苷酸或寡核苷酸。
在某些实施方案中,碱基编辑器包括蛋白结构域,其有助于解开(打开)DNA螺旋以暴露靶碱基进行编辑。合适的蛋白的非限制性实例示于表A中。
表A
Figure BDA0003020316560000321
Figure BDA0003020316560000331
Figure BDA0003020316560000341
Figure BDA0003020316560000351
Figure BDA0003020316560000361
Figure BDA0003020316560000371
Figure BDA0003020316560000381
Figure BDA0003020316560000391
Figure BDA0003020316560000401
Figure BDA0003020316560000411
Figure BDA0003020316560000421
在某些实施方案中,碱基编辑器(如,无Cas碱基编辑器)包括一个或多个DNA寡核苷酸,一个或多个RNA寡核苷酸和/或一个或多个合成寡核苷酸,其包括一个或多个肽核酸(PNA)、一个或多个锁核酸(LNA)和/或一个或多个桥连核酸(BNA)。参见,例如,图1D。参见,例如,Nielsen,et al.(1991)Science 254:1497-1500和Bahal,et al.(2014)Curr GeneTher.14(5):331-342关于PNA;Moreno,et al.(2013)Nucleic Acid Res.41(5):3257-3273和Geny,et al.(2016)Nucleic Acid Res.44(5):2007-2019关于LNA;以及Rahman,et al.(2007)Nucleosides Nucleotides Nucleic Acids 26(10-12):1625-1628关于BNA。
在某些实施方案中,本发明的无Cas9碱基编辑器包括ZFP-脱氨酶融合蛋白和ZFN切口酶,以及任选地一个或多个DNA去稳定因子。在某些实施方案中,DNA去稳定因子是蛋白质(如,如表A中所示)或寡核苷酸(如,LNA、PNA或BNA)。在其他实施方案中,无Cas9碱基编辑器包括非Cas9 CRISPR蛋白,其具有DNA去稳定(解链)性质,包括任何CAS9等同物,如Cas12a(包括全长或截短的Cas12蛋白)。在其他实施方案中,无CAS9碱基编辑器不包括来自CRISPR系统的任何元件。一个或多个非Cas9 DNA去稳定(解链)因子(如,表A的蛋白质、LNA、PNA、BNA等)可与碱基编辑器的任何组分可操作地连接,例如,ZFP-脱氨酶融合蛋白的任一组分和/或ZFN切口酶的任何组分。
在某些实施方案中,碱基编辑器包括一个或多个核苷酸序列,例如一个或多个DNA寡核苷酸、RNA寡核苷酸、肽核酸(PNA)、锁核酸(LNA)和/或桥连核酸(BNA),其可用于在靶位点提供用于碱基编辑器的单链DNA底物。这可通过如双重侵入、三重侵入或尾钳来促进(Quijano,et al.(2017)Yale J.Biol and Med.90:583-598;Pellestor and Paulasova(2004)European J.Human Genetics 12:694-700;Schleifman,et al.(2011)Chem&Bio.18:1189-1198。碱基编辑器的一个或多个核苷酸序列的结构在以下方面有所不同:长度;DNA和/或RNA和/或LNA和/或LNA和/或BNA碱基的数量和位置;硫代磷酸酯键;这些寡核苷酸的其他常见修饰,这取决于靶序列组成。
在某些实施方案中,碱基编辑器包含一个或多个PNA,如包含miniPEG取代和用于增强结合、增加溶解度和改善递送的γ位置的γPNA(Bahal,et al.(2014)Current GeneTher.14(5):331-342)。在某些实施方案中,PNA包含表示8-氨基-2,6-二氧杂辛酸接头的一个或多个O和/或一个或多个胞嘧啶(C)或假异胞嘧啶残基。任选地,一个或多个赖氨酸(Lys)残基被包含于PNA中,如在PNA序列的N和/或C端。在某些实施方案中,1、2、3、4、5个或更多个Lys残基被包含于PNA的一个或两个末端。在某些实施方案中,将两个或更多个PNA用于碱基编辑器中,例如在相对于彼此相同或相反的方向。在某些实施方案中,一个或多个PNA具有以下结构:N-Lys-Lys-Lys-NNNNNNNNNN-OOO-NNNNNNNNNN-Lys-Lys-Lys-C;N-Lys-Lys-Lys-NNNNNNNNNN-OOO-NNNNNNNNNNNNNNN-Lys-Lys-Lys-C;N-Lys-Lys-Lys-NNNNNNNNNN-OOO-NNNNNNNNNN-Lys-Lys-Lys-C;N-Lys-Lys-Lys-NNNNNNNNNN-OOO-NNNNNNNNNN-Lys-Lys-Lys-C;和/或N-Lys-Lys-Lys-NNNNNNNNNNNNNNN-Lys-Lys-Lys-C,其中O表示8-氨基-2,6-二氧杂辛酸接头,C表示胞嘧啶。PNA序列的N和/或C末端的Lys残基是任选的,并且假异胞嘧啶可取代胞嘧啶。在某些实施方案中,一个或多个PNA包含如图8B至图8E所示的一个或多个PNA。
在其他实施方案中,碱基编辑器包括一个或多个LNA。LNA可包括堆叠接头和2'-甘氨酰氨基LNA以提高性能(Geny,et al.(2016)Nucleic Acids Res.44(5):2007-2019)。在某些实施方案中,LNA包含一个或多个硫代磷酸酯键,任选地位于一个或多个LNA残基和/或DNA残基之间。在其他实施方案中,LNA包含一个或多个胆固醇-TEG,其可增加细胞摄取。在某些实施方案中,一个或多个LNA具有以下结构:5’-NnNnNnNnNnNnNnNtctctnNnNnNnNnNnNnNnNnnNnnNnnNnnNn-3’(SEQ ID NO:1);5’-N*n*NnNnNnNnNnNnNtctctnNnNnNnNnNnNnNnNnnNnnNnnNnn*N*n-3’(SEQ ID NO:69);和/或5’-NnNnNnNnNnNnNnNtctctnNnNnNnNnNnNnNnNnnNnnNnnNnnNn-Chol-TEG-3’(SEQ ID NO:70),其中LNA核苷酸为大写字母;DNA核苷酸为小写;“*”表示硫代磷酸酯键;以及Chol-TEG表示增加细胞摄取的3’胆固醇-TEG(参见,例如,Bijsterbosch,et al.(2000)Nucleic Acids Res.28:2717-2725;Bijsterbosch,et al.(2002)J.Pharmacol.Exp.Ther.302:619-626;Manoharan(2002)Antisense Nucleic AcidDrug Dev 12:103-28;M.Manoharan(2004)Curr Opin Chem Biol.8:570-9)。在某些实施方案中,碱基编辑器包括如图8F或图8G所示的一个或多个LNA。
一个或多个DNA去稳定因子可独立于碱基编辑器(如,ABE和/或CBE)和/或切口酶提供,和/或与碱基编辑器(如,ABE和/或CBE)和/或切口酶一起提供。在某些实施方案中,DNA去稳定因子是以任何方向(如,N和/或C端)融合至ZFP和/或ZFN切口酶。DNA去稳定因子可在碱基编辑器靶位点的1kb窗口内结合。
在某些实施方案中,本文描述的碱基编辑系统包括碱基编辑器(如,Cas9腺嘌呤或胞嘧啶碱基编辑器)和一个或多个另外的DNA结合结构域(如,ZFP,TALE,其他sgRNA),其特异性结合至靶位点附近(RANGE)的碱基编辑器。在某些实施方案中,含CAS9的碱基编辑系统包括:Cas9切口酶和一个或多个DNA结合分子(如,ZFP),其用于锚定CAS9切口酶和/或定位与其他组分相关的碱基编辑器的一个或多个组分,从而增加碱基编辑的特异性和/或效率。一个或多个DNA结合分子(如,ZFP锚)通常与碱基编辑器(如,CAS9或无Cas9碱基编辑器)的1-50个(或它们之间的任何值)核苷酸内的靶位点和/或靶碱基结合。DNA结合分子可将5’和/或3’结合至碱基编辑器和/或靶定碱基。在某些实施方案中,如本文所述的CAS9碱基编辑器包含两个以上的ZFP结构域,如ZFP结构域可操作地连接至脱氨酶结构域或其组分和ZFP锚定结构域。参见,如图1B。在某些实施方案中,至少一个DNA结合结构域与碱基编辑器的靶位置5’结合,任选地在被碱基编辑器结合的相同或不同的链上。参见,例如,图1B,右下方的示意图;图3;和图7A用于示例性实施方案,其中将一个或多个额外的ZFP锚用于特异性地结合至系统的碱基编辑器的靶位点5’,并且在被碱基编辑器结合的相同链上。与不包括ZFP锚的碱基编辑器相比,含有一个或多个ZFP锚可提高碱基编辑器的效率和/或特异性,例如在某些情况下,2倍至5倍(或它们之间的任何值),10倍至100倍(或它们之间的任何值),或超过100倍。
在其他实施方案中,本文描述了碱基编辑系统,其包括:(1)Cas9切口酶(如,包含腺苷脱氨酶的无催化活性单体);(2)锚DNA结合结构域(如,ZFP),其特异性结合至Cas9切口酶的靶位置5’或3’;以及(3)非Cas9切口酶(如,ZFP-切口酶),其包含腺苷脱氨酶的无催化活性单体和结合至Cas9切口酶靶位置5’或3’的DNA结合结构域(如,ZFP)。二聚化时,Cas9切口酶和非Cas9切口酶(如,ZFN切口酶)的A脱氨酶单体二聚化形成功能性脱氨酶。锚DNA结合结构域和非Cas9切口酶可在靶的相同或不同链上结合,和/或在Cas9切口酶的相同(5’或3’)或不同(一个在5’,一个在3’)侧结合。在某些实施方案中,锚DNA结合结构域和非Cas9切口酶结合至Cas9切口酶的相对侧的相对链。参见,如图1B,上方示意图。
在其他实施方案中,本文描述了碱基编辑系统,其包括:(1)Cas9切口酶;(2)任选的锚DNA结合结构域(如,ZFP),其特异性结合至Cas9切口酶的靶位置5’或3’;以及(3)非Cas9切口酶(如,ZFP切口酶),其包含A或C脱氨酶。锚DNA结合结构域和非Cas9切口酶可在靶的相同或不同链上结合,和/或在Cas9切口酶的相同(5’或3’)或不同(一个在5’,一个在3’)侧结合。在某些实施方案中,锚DNA结合结构域和非Cas9切口酶碱基编辑器结合至Cas9切口酶的相对侧的相对链。参见,如图1B,下方中间示意图。
在其他实施方案中,本文描述了碱基编辑系统,其包括:(1)可操作地连接至sgRNA的Cas9蛋白(如,dCas9);(2)任选的锚DNA结合结构域(如,ZFP锚),其特异性结合至CAS9切口酶的靶位置5’或3’;(3)包含可操作地连接至A或C脱氨酶的ZFP的融合蛋白,该融合蛋白位于Cas9蛋白的3’或5’;以及(4)ZFN切口酶,其结合Cas9蛋白的3’或5’和/或ZFP。锚DNA结合结构域和非CAS9蛋白可在靶的相同或不同链上结合,和/或在Cas9蛋白的相同(5’或3’)或不同(一个5’,一个3’)侧结合。在某些实施方案中,ZFP-脱氨酶融合蛋白的ZFP和任选的锚ZFP结合至相对的链。参见,如图1C。在进一步的实施方案中,碱基编辑器不包括ZFN切口酶。
本文所述的Cas9碱基编辑器在PAM序列方面提供了令人惊讶且意想不到的优势,其可用于高效且靶向碱基编辑,包括用于包括sgRNA的碱基编辑器的扩展(放宽)的可用PAM序列。
本文还描述了不包括Cas9碱基编辑器(如,缺乏Cas9切口酶或Cas9蛋白)的碱基编辑器(ABE或CBE)。参见,如图1A至图1D。
在某些实施方案中,碱基编辑器包括:(1)非Cas9切口酶,例如包含ZFN对(ZFP可操作地连接至核酸酶结构域)的ZFN切口酶,其中该对的核酸酶结构域之一是无催化活性的(参见,如美国专利号8,703,489;9,200,266;9,6,631,186;和10,113,207);以及(2)ZFP碱基编辑器,其包含可操作地连接至A或C脱氨酶的ZFP。参见,如图1B,下方左侧的示意图。
在其他实施方案中,碱基编辑器包括DNA去稳定分子,其包含任何RNA可编程分子。在某些实施方案中,DNA去稳定分子包含RNA可编程分子,该RNA可编程分子包含Cas9蛋白(如,DCAS9)和sgRNA。在其他实施方案中,RNA可编程分子不是Cas9蛋白(如,Cpf1(又被称为Cas12a)、C2c1、C2c2(又被称为Cas13a)、C2c3、Cas1、Cas2、Cas4、CasX和CasY);以及腺苷或胞苷脱氨酶。任选地,碱基编辑器还包括至少一个ZFP DNA结合结构域(如,可操作地连接至腺苷或胞嘧啶脱氨酶的ZFP DNA结合结构域;DNA去稳定分子任一侧的ZFP锚;和/或ZFN切口酶的任何组合)。
在其他实施方案中,无Cas9碱基编辑器包括ZFN切口酶和ABE或CBE(如,与ZFP可操作地连接)和使靶碱基易接近(如,解链DNA)的一个或多个DNA去稳定分子。参见,如图1D。DNA去稳定(解链)分子的非限制性实例包括如表A中所示的蛋白结构域,以及如图8中所示的核酸,包括LNA和/或PNA。ZFN切口酶可包括催化活性和/或无催化活性FokI结构域中的一个或多个突变,和/或ZFP主链的一个或多个突变。参见,如美国专利公开号2018/0087072。在某些实施方案中,如本文所述的碱基编辑器可以是无Cas9的,但可包括非Cas9 CRISPR蛋白。
任何无Cas9(如,ZFP)的碱基编辑器可进一步包括(或募集)一种或多种其他DNA去稳定因子(如,DNA解旋酶,螺旋去稳定分子和细菌DnaA蛋白,单链DNA结合蛋白,寡核苷酸等),例如,如果DNA的进一步解旋通过增加靶的可及性来增强碱基编辑器功能。一个或多个DNA去稳定因子可与切口酶和/或含A或C脱氨酶的分子缔合。在某些实施方案中,DNA去稳定因子(如,DNA寡核苷酸)与ZFN切口酶缔合,如图1D中所示。
在其他实施方案中,本文描述了碱基编辑系统,其包括:(1)至少一种DNA去稳定分子(如,非Cas9蛋白);(2)任选的DNA结合结构域(如,ZFN锚),其特异性结合至DNA去稳定分子的靶位点5’或3’;(3)融合蛋白,其包含可操作地连接至A或C脱氨酶的ZFP,该融合蛋白位于DNA去稳定分子的3’或5’。
无Cas9的碱基编辑器提供了优于Cas9碱基编辑器的一些令人惊讶且出乎意料的优势,包括但不限于:(i)无Cas9依赖性脱靶效应,因为我们可以以99%或更高的切割效率来构建ZFN(无脱靶效应);(ii)消除了PAM限制,因为ZFP基本可靶向人基因组的任何序列;(iii)减少和/或消除当前Cas9碱基编辑器普遍存在的旁观者突变(如,在靶窗口内);和/或(iv)由于减小构建体尺寸而促进AAV递送(已知在体内起作用)。
因此,无cas9的碱基编辑器提供了优于常见Cas9碱基编辑器的显著优势,包括但不限于:靶特异性;多功能性;控制或消除旁观者突变;以及易递送。就靶特异性而言,可设计99%编辑效率的无Cas9的ZFP碱基编辑器,其几乎没有或完全没有脱靶效应,而Cas9碱基编辑器展现出更高的脱靶效应率。类似地,非Cas9 ZFP碱基编辑器控制(减少)或消除如使用Cas9碱基编辑器所看到的旁观者突变。此外,虽然非Cas9 ZFP碱基编辑器的靶位点选择受到PAM需求的限制,但无Cas9的ZFP碱基编辑器可基本靶向任何靶序列。另外,由于非Cas9碱基编辑器的构建体尺寸减小,因而它们可使用AAV载体递送,从而极大地扩展了治疗性(体内)应用。
在某些实施方案中,本文所述的碱基编辑器(碱基编辑系统)包括在以下中要改变的单个碱基(靶碱基):(1)碱基编辑窗口和/或(2)碱基编辑窗口与PAM序列插入5’末端之间的碱基。同样参见图2。DNA编辑窗口的打开使其他非靶碱基(腺嘌呤和/或胞嘧啶)保持打开,以供碱基编辑器进行潜在的修饰。这意味着尽管靶标可能位于远离PAM序列5’端13-16个核苷酸,但是那些插入核苷酸和/或碱基编辑窗口中存在的靶定碱基(如,腺嘌呤或胞嘧啶)也可能会发生变化。此类非靶向的突变,又被称为“旁观者”突变,在碱基编辑过程中可能是不期望的。在某些情况下,可通过在编辑窗口选择不包含要靶向的碱基(腺嘌呤碱基编辑器为腺嘌呤或胞苷碱基编辑器为胞苷)的PAM序列来避免旁观者突变。可选择地和/或除了选择PAM序列之外,本发明通过使用如本文所述的碱基编辑器来减少或消除旁观者突变,该碱基编辑器包含与ZFN切口酶功能结构域配对的ZFP锚,从而消除了PAM需求,并允许使用者将编辑器放置在任何最佳位置。
在一些实施方案中,本文公开了包含各种融合蛋白的复合物(系统)。在一些实施方案中,可将Cas蛋白融合至替代的DNA结合结构域来增加融合蛋白与DNA的结合特异性(参见,Bolukbashi,et al.(2015)Nat Methods12(12):1150-1156)。例如,ZFP、TtAgo和TALEDNA结合结构域可与dCas融合。在一些实施方案中,dCas包含突变,以改变PAM特异性(参见,Gao,et al.(2017)Nature Biotechnology 35:789-792;Virginijus Siksnys(2016)MolCell61:793)或改变PAM识别需求。在一些实施方案中,碱基编辑器缺少Cas核酸酶。
该方法的潜在靶标有很多。碱基编辑进行治疗和/或预防涉及待治疗的示例性疾病的基因编辑的疾病的非限制性实例包括镰状细胞病、血友病、囊性纤维化、苯酮尿症、泰-萨氏病、色盲、法布里病、弗里德里希共济失调、前列腺癌等。
因此,可将本文所述碱基编辑系统用于改变任何疾病相关基因的表达。在某些实施方案中,该基因与癌症相关,例如JAK2 V617F突变。该突变在骨髓增生性赘生物的扩展中起关键作用。JAK2通过转录因子STAT家族的磷酸化来转导膜结合受体的细胞因子和生长因子信号。V617F突变导致组成型酪氨酸磷酸化活性并促进细胞因子超敏性(James,et al.(2005)Nature 434:1144-1148)以及在缺乏细胞因子的情况下驱动细胞增殖的能力(Zhao,et al.(2005)J.Biol Chem 280(24):22788-22792)。对于某些JAK2 V617F疾病(如,原发性骨髓纤维化),唯一的治愈方法是造血细胞移植,但是当前方法通常与疾病复发以及移植物抗宿主病关联(Byrne,et al.(2018)Ther Avd Hematol 9(9):251-259)。编辑受试者的造血干细胞/祖细胞(HSC/PC)以去除突变,可成功治疗这些疾病。
在某些实施方案中,碱基靶向α-1抗胰蛋白酶(在SERPINA基因座内)。引起A1AT蛋白中常染色体隐性遗传缺陷的基因座突变与肝病和肺病两者都有关。PiZ突变是北欧人中最常见的缺陷等位基因之一,导致仅产生约10-20%的A1AT蛋白。这种突变是由外显子5中的单个突变引起的,导致氨基酸位置342处的赖氨酸被谷氨酰胺取代,其中DNA位置1096处的G在突变基因序列中为A(综述见Fregonese and Stolk(2008)Orphanet J Rare Dis 3:16)。
DNA结合分子/结构域
本文描述了包含与任何感兴趣基因或基因座中的靶位点特异性结合的一种或多种DNA结合分子/结构域的组合物。可将任何DNA结合分子/结构域用于本文公开的组合物和方法,包括但不限于锌指DNA结合结构域、TALE DNA结合结构域、CRISPR/Cas核酸酶的DNA结合部分(引导或sgRNA)和/或来自大范围核酸酶的DNA结合结构域。
在某些实施方案中,本文所述的碱基编辑器包含锌指蛋白DNA结合结构域。优选地,锌指蛋白是非天然存在的,因为其被工程化为结合至选择的靶位点。参见,例如Beerli,et al.(2002)Nature Biotechnol.20:135-141;Pabo,et al.(2001)Ann.Rev.Biochem.70:313-340;Isalan,et al.(2001)Nature Biotechnol.19:656-660;Segal,et al.(2001)Curr.Opin.Biotechnol.12:632-637;Choo,et al.(2000)Curr.Opin.Struct.Biol.10:411-416;美国专利号6,453,242;6,534,261;6,599,692;6,503,717;6,689,558;7,030,215;6,794,136;7,067,317;7,262,054;7,070,934;7,361,635;和7,253,273;以及美国专利公开号2005/0064474;2007/0218528;和2005/0267061,全部通过引用整体并入本文。在某些实施方案中,DNA结合结构域包含在美国专利公开号2012/0060230中公开的锌指蛋白,通过引用整体并入本文。
与天然存在的锌指蛋白相比,工程化锌指结合结构域可具有新的结合特异性。工程化方法包括但不限于合理设计和各种选择。合理设计包括,例如使用包含三链体(或四链体)核苷酸序列和单个锌指氨基酸序列的数据库,其中每个三链体或四链体核苷酸序列与结合特定三链体序列的锌指的一个或多个氨基酸序列缔合。参见,如美国专利号6,453,242和6,534,261,通过引用整体并入本文。
示例性的选择方法,包括噬菌体展示和双杂交系统,公开于美国专利号5,789,538;5,925,523;6,007,988;6,013,453;6,410,248;6,140,466;6,200,759;和6,242,568;以及国际专利公开号WO 98/37186;WO 98/53057;WO 98/53057;WO 00/27878;以及WO 01/88197和GB 2,338,237。另外,例如在美国专利号6,794,136中描述了增强锌指结合结构域的结合特异性。
另外,如在这些和其他参考文献中所公开的,锌指结构域和/或多指锌指蛋白可使用任何合适的接头序列连接在一起,包括,例如长度为5个或更多个氨基酸的接头。长度为6个或更多个氨基酸的示例性接头序列参见如美国专利号6,479,626;6,903,185;和7,153,949。本文所述蛋白可包括蛋白的单个锌指之间的合适接头的任何组合。此外,例如美国专利号6,794,136描述了增强锌指结合结构域的结合特异性。
选择靶位点;ZFP和用于设计和构建融合蛋白(和编码其的多核苷酸)的方法对于本领域技术人员而言是已知的,并且详细描述于美国专利号6,140,081;5,789,538;6,453,242;6,534,261;5,925,523;6,007,988;6,013,453;和6,200,759;和国际专利公开号WO95/19431;WO 96/06166;WO 98/53057;WO 98/54311;WO 00/27878;WO 01/60970;WO 01/88197;WO 02/099084;WO 98/53058;WO 98/53059;WO 98/53060;WO 02/016536;和WO 03/016496。
另外,如这些和其他参考文献中所公开的,锌指结构域和/或多指锌指蛋白可使用任何合适的接头序列连接在一起,包括,例如长度为5个或更多个氨基酸的接头。长度为6个或更多个氨基酸的示例性接头序列参见如美国专利号6,479,626;6,903,185;和7,153,949。本文所述蛋白可包括蛋白单个锌指之间的合适接头的任何组合。
通常,ZFP包括至少三个指。某些ZFP包括四个、五个、六个或更多个指。包含三个指的ZFP通常识别包含9个或10个核苷酸的靶位点;包含四个指的ZFP通常识别包含12至14个核苷酸的靶位点;而具有六个指的ZFP可识别包含18至21个核苷酸的靶位点。ZFP也可以是包含一个或多个调节结构域的融合蛋白,该结构域可以是转录激活或阻抑结构域。
在一些实施方案中,DNA结合结构域可源自核酸酶。例如,诸如I-SceI、I-CeuI、PI-PspI、PI-Sce、I-SceIV、I-CsmI、I-PanI、I-SceII、I-PpoI、I-SceIII、I-CreI、I-TevI、I-TevII和I-TevIII的归巢核酸内切酶和大范围核酸酶的识别序列是已知的。另外,参见美国专利号5,420,032;美国专利号6,833,252;Belfort,et al.(1997)Nucleic Acids Res.25:3379-3388;Dujon,et al.(1989)Gene 82:115-118;Perler,et al.(1994)Nucleic AcidsRes.22,1125-1127;Jasin(1996)Trends Genet.12:224-228;Gimble,et al.(1996)J.Mol.Biol.263:163-180;Argast,et al.(1998)J.Mol.Biol.280:345-353和New EnglandBiolabs目录。此外,归巢核酸内切酶和大范围核酸酶的DNA结合特异性可被工程化以结合非天然靶位点。参见,例如,Chevalier,et al.(2002)Molec.Cell10:895-905;Epinat,etal.(2003)Nucleic Acids Res.31:2952-2962;Ashworth,et al.(2006)Nature 441:656-659;
Figure BDA0003020316560000511
et al.(2007)Current Gene Therapy7:49-66;美国专利公开号2007/0117128。
在某些实施方案中,与本文所述突变体切割结构域一起使用的锌指蛋白包含主链区(如,7-氨基酸识别螺旋区编号-1至6之外的区域)的一个或多个突变(取代、缺失和/或插入),例如位置-14、-9和/或-5处的一个或多个。一个或多个这些位置处的野生型残基可缺失,被任何氨基酸残基取代和/或包括一个或多个另外的残基。在一些实施方案中,位置-5处的Arg(R)改变为Tyr(Y)、Asp(N)、Glu(E)、Leu(L)、Gln(Q)或Ala(A)。在其他实施方案中,位置(-9)处的Arg(R)取代为Ser(S)、Asp(N)或Glu(E)。在进一步的实施方案中,位置(-14)处的Arg(R)取代为Ser(S)或Gln(Q)。在其他实施方案中,融合多肽可在锌指DNA结合结构域中包含突变,其中将位置(-5)、(-9)和/或(-14)处的氨基酸改变为任意组合的以上列出的任何氨基酸。
在其他实施方案中,DNA结合结构域包含来自转录激活因子样(TAL)效应物(TALE)的工程化结构域,类似于源自植物病原体黄单胞菌(Xanthomonas)(参见,Boch,et al.(2009)Science 326:1509-1512和Moscou and Bogdanove(2009)Science 326:1501)和Ralstonia(参见Heuer,et al.(2007)Applied and Environmental Microbiology 73(13):4379-4384)的那些;美国专利公开号2011/0301073和2011/0145940。已知黄单胞菌属的植物致病细菌在重要农作物中引起许多疾病。黄单胞菌的致病性取决于保守型III型分泌(T3S)系统,该系统向植物细胞注射25种以上的不同效应蛋白。这些被注射的蛋白质是模仿植物转录活化剂并操纵植物转录组的转录活化剂样效应物(TALE)(参见,Kay,et al.(2007)Science 318:648-651)。这些蛋白包含DNA结合结构域和转录激活结构域。最充分表征的TALE之一是来自野油菜黄单胞菌辣椒斑点病致病变种(Xanthomonas campestgrispv.Vesicatoria)的AvrBs3(参见,Bonas,et al.(1989)Mol Gen Genet 218:127-136,和国际专利公开号WO 2010/079430)。TALE包含串联重复序列的集中结构域,每个重复序列包含约34个氨基酸,这是这些蛋白的DNA结合特异性的关键。另外,它们含有核定位序列和酸性转录激活结构域(综述参见,Schornack S.,et al.(2006)J Plant Physiol 163(3):256-272)。此外,已发现植物致病性细菌茄科雷尔氏菌(Ralstonia solanacearum)中的两个基因(分别命名为brg11和hpx17)与茄科雷尔氏菌生物变型1菌株GMI1000和生物变型4菌株RS1000中黄杆菌属的AvrBs3家族同源(参见,Heuer,et al.(2007)Appl and Envir Micro73(13):4379-4384)。这些基因在核苷酸序列上彼此98.9%相同,但在hpx17的重复结构域中缺失了1,575个碱基对。然而,两个基因产物与黄单胞菌的AvrBs3家族蛋白具有少于40%的序列同一性。
这些TAL效应物的特异性取决于串联重复序列中存在的序列。重复的序列包含大约102个碱基对,并且重复序列通常彼此91-100%同源(Bonas,et al.,同上)。重复序列的多态性通常位于位置12和13,并且位置12和13处的高变二残基(重复可变二残基或RVD区域)的同一性与TAL效应物的靶序列中连续核苷酸的同一性之间似乎存在一一对应(参见,Moscou and Bogdanove(2009)Science 326:1501and Boch,et al.(2009)Science 326:1509-1512)。实验上,已确定了这些TAL效应物的DNA识别的天然密码子,使得位置12和13处的HD序列(重复可变残基或RVD)导致与胞嘧啶(C)结合,NG结合至T,NI结合至A、C、G或T、NN结合至A或G,以及ING结合至T。这些DNA结合重复序列已被组装成具有重复序列的新组合和数量的蛋白质,以形成能够与新序列相互作用并激活植物细胞中非内源性报道基因表达的人工转录因子(Boch,et al.,同上)。工程化TAL蛋白已与FokI切割半结构域连接,以产生TAL效应物结构域核酸酶融合物(TALEN),其包括具有非典型RVD的TALEN。参见,如美国专利号8,586,526。
在一些实施方案中,TALEN包含核酸内切酶(如,FokI)切割结构域或切割半结构域。在其他实施方案中,TALE核酸酶是巨大TAL。这些巨大TAL核酸酶是包含TALE DNA结合结构域和大范围核酸酶切割结构域的融合蛋白。大范围核酸酶切割结构域作为单体具有活性,且不需要二聚化来实现活性(参见,Boissel et al.(2013)Nucl Acid Res:1-13,doi:10.1093/nar/gkt1224)。
在进一步的实施方案中,核酸酶包含致密TALEN。这些是将TALE DNA结合结构域与TevI核酸酶结构域连接的单链融合蛋白。取决于TALE DNA结合结构域相对于TevI核酸酶结构域定位的位置,融合蛋白可充当被TALE区域定位的切口酶,或者可产生双链断裂(参见,Beurdeley,et al.(2013)Nat Comm:1-8DOI:10.1038/ncomms2782)。另外,核酸酶结构域也可显示DNA结合功能。可将任何TALEN与其他TALEN(如,一个或多个TALEN(cTALEN或FokI-TALEN))和一个或多个巨大TALE组合使用。
另外,如在这些和其他参考文献中所公开的,锌指结构域和/或多指锌指蛋白或TALE可使用任何合适的接头序列连接在一起,包括,如长度为5个或更多个氨基酸的接头。长度为6个或更多个氨基酸的示例性接头序列参见如美国专利号6,479,626;6,903,185;和7,153,949。本文所述蛋白可包括蛋白的单个锌指之间的合适接头的任何组合。另外,如美国专利号6,794,136描述了增强锌指结合结构域的结合特异性。
在某些实施方案中,碱基编辑器包含DNA结合结构域,其为CRISPR/Cas核酸酶系统的一部分,包括结合至DNA的单个引导RNA(sgRNA)DNA结合分子。参见,例如美国专利号8,697,359和美国专利公开号2015/0056705和2015/0159172。编码系统的RNA组分的CRISPR(成簇规律间隔短回文重复序列)基因座和编码蛋白质的cas(CRISPR相关)基因座(Jansen,et al.(2002)Mol.Microbiol.43:1565-1575;Makarova,et al.(2002)Nucleic AcidsRes.30:482-496;Makarova,et al.(2006)Biol.Direct 1:7;Haft,et al.(2005)PLoSComput.Biol.1:e60)组成CRISPR/Cas核酸酶系统的基因序列。微生物宿主中的CRISPR基因座包含CRISPR相关(Cas)基因以及能够编程CRISPR介导的核酸切割特异性的非编码RNA元件的组合。
在一些实施方案中,DNA结合结构域是TtAgo系统的一部分(参见Swarts,et al.(2014)Nature 507(7491):258-261;Swarts,et al.(2012)PLoS One 7(4):e35888;Sheng,et al.,同上)。真核生物中,基因沉默是由Argonaute(Ago)蛋白家族介导的。在这种范例中,Ago与小(19-31nt)RNA结合。该蛋白-RNA沉默复合物通过小RNA与靶标之间的沃森-克里克(Watson-Crick)碱基配对识别靶RNA,并且内切核苷酸切割靶RNA(Vogel(2014)Science344:972-973)。相反,原核Ago蛋白与小的单链DNA片段结合,并可能起检测和去除外来(通常是病毒)DNA的作用(Yuan,et al.(2005)Mol.Cell 19:405;Olovnikov,et al.(2013)Mol.Cell 51,594;Swarts,et al.(2014)Nature 507(7491):258-261;Swarts,et al.(2012)PLoS One 7(4):e35888)。示例性原核Ago蛋白包括来自超嗜热菌(Aquifexaeolicus)、球形红细菌(Rhodobacter sphaeroides)和嗜热栖热菌(Thermusthermophilus)的那些蛋白。
最充分表征的原核Ago蛋白之一是来自嗜热栖热菌的一种(TtAgo;Swarts,et al.(2014)Nature 507(7491):258-261;Swarts,et al.(2012)PLoS One7(4):e35888)。TtAgo与具有5’磷酸基团的15nt或13-25nt单链DNA片段缔合。将被TtAgo结合的这种“引导DNA”用于指导蛋白-DNA复合物结合第三方DNA分子中的沃森-克里克互补DNA序列。一旦这些引导DNA的序列信息已允许识别靶DNA,则TtAgo引导DNA复合物就切割靶DNA。当与其靶DNA结合时,TtAgo-引导DNA复合物的结构也支持了此类机制(G.Sheng,et al.,同上)。来自球形红细菌的Ago(RsAgo)具有类似性质(Olovnikov,et al.,同上)。
可将任意DNA序列的外源引导DNA加载到TtAgo蛋白(Swarts,et al.(2014)Nature507(7491):258-261;Swarts,et al.(2012)PLoS One 7(4):e35888)。由于TtAgo切割的特异性是由引导DNA指导的,因而由外源的研究者指定的引导DNA形成的TtAgo-DNA复合物将指导TtAgo靶DNA切割互补的研究者指定的靶DNA。以这种方式,可在DNA中形成靶向双链断裂。使用TtAgo-引导DNA系统(或其他生物体的直系同源Ago-引导DNA系统)允许在细胞内靶向切割基因组DNA。此类切割可以是单链或双链的。为了切割哺乳动物基因组DNA,优选使用为在哺乳动物细胞中表达而优化的TtAgo密码子的形式。另外,可能更优选用体外形成的TtAgo-DNA复合物处理细胞,其中TtAgo蛋白与细胞穿透肽融合。此外,可能更优选使用经由诱变改变的TtAgo蛋白的形式,使其在37℃时具有改善的活性。使用本领域为DNA断裂开发的标准技术,可将Ago-RNA介导的DNA切割用于影响全套结果,包括基因敲除、靶向基因添加、基因校正、靶向基因缺失。
因此,可使用任何DNA结合分子/结构域。在某些实施方案中,本文所述的碱基编辑器是Cas9碱基编辑器,其包括sgRNA DNA结合结构域(如,作为Cas9切口酶的一部分)和任选地一个或多个ZFP DNA结合结构域(被称为“ZFP锚”),该ZFP可提高碱基编辑效率和/或特异性。包括ZFP锚在内的Cas9碱基编辑器的非限制性实例如图1B和图3中所示。
融合分子
本文所述的DNA编辑复合物可包括一个或多个融合分子,该融合分子包含本文所述的DNA结合结构域(如,ZFP或TALE,CRISPR/Cas组分如单个引导RNA),并且还提供了异源(功能)结构域(或其功能片段)。
常见的结构域包括,如转录因子结构域(激活剂、阻抑剂、共激活剂、共阻抑物),沉默子,致癌基因(如,myc、jun、fos、myb、max、mad、rel、ets、bcl、myb、mos家族成员等);DNA修复酶及其相关因子和修饰剂;解旋酶,双链DNA结合蛋白,DNA重排酶及其相关因子和修饰剂;染色质相关蛋白及其修饰剂(如激酶、乙酰酶和去乙酰酶);以及DNA修饰酶(如,甲基转移酶、拓扑异构酶、解旋酶、连接酶、激酶、磷酸酶、脱氨酶、聚合酶、核酸内切酶)及其相关因子和修饰剂。关于DNA结合结构域和核酸酶切割结构域的融合的细节,参见美国专利公开号2005/0064474;2006/0188987;和2007/0218528,通过引用以整体并入本文。
通过本领域技术人员所熟知的克隆和生化缀合方法来构建融合分子。融合分子包含DNA结合结构域和功能结构域(如,解旋酶和/或脱氨酶和/或GUI和/或GAM)。融合分子还任选地包含核定位信号(如,例如来自SV40中等T抗原的信号)和表位标签(如,例如FLAG和血凝素)。设计融合蛋白(和编码它们的核酸),使得翻译阅读框被保留在融合的组分之间。
一方面的功能结构域(或其功能片段)的多肽组分与另一方面的非蛋白DNA结合结构域(如,抗生素、嵌入剂、小沟结合物、核酸)之间的融合通过本领域技术人员已知的生化缀合方法来构建。参见,例如Pierce Chemical Company(Rockford,IL)目录。已描述了在小沟结合物和多肽之间进行融合的方法和组合物(Mapp,et al.(2000)Proc.Natl.Acad.Sci.USA 97:3930-3935)。此外,CRISPR/Cas系统的单个引导RNA与功能结构域缔合形成活性转录调节因子和核酸酶。
在某些实施方案中,DNA结合结构域的靶位点存在于细胞染色质的易接近区中。可以如美国专利号7,217,509和7,923,542中所述的那样确定易接近区。如果靶位点不存在于细胞染色质的易接近区中,则可产生一个或多个易接近区,如美国专利号7,785,792和8,071,370所述。在其他实施方案中,融合分子的DNA结合结构域能够结合细胞染色质,无论其靶位点是否在易接近区中。例如,此类DNA结合结构域能够结合接头DNA和/或核小体DNA。在某些类固醇受体和肝细胞核因子3(HNF3)中发现了这类“先锋”DNA结合结构域的实例(Cordingley,et al.(1987)Cell 48:261-270;Pina,et al.(1990)Cell 60:719-731;和Cirillo,et al.(1998)EMBO J.17:244-254)。
如本领域技术人员已知的,融合分子可与药学上可接受的载体一起配制。参见,例如Remington's Pharmaceutical Sciences,第17版,1985;以及美国专利号6,453,242和6,534,261。
融合分子的功能组分/结构域可选自一旦融合分子经由其DNA结合结构域结合至靶序列就能够影响基因序列的多种不同组分中的任一种。因此,功能组分可包括但不限于各种脱氨酶、UGI、GAM、解旋酶等。在某些实施方案中,功能结构域包含一种或多种胞苷脱氨酶(如,载脂蛋白B mRNA编辑复合物1(APOBEC1)结构域和/或激活诱导的脱氨酶(AID))。在其他实施方案中,功能结构域包含一个或腺嘌呤脱氨酶(如,突变的TadA(tRNA腺嘌呤脱氨酶(参见,Gaudelli,et al.(2017)Nature 551:464-471))。在进一步的实施方案中,功能结构域包含至少一个尿嘧啶DNA糖基化酶抑制剂(如,UGI)结构域。在一些实施方案中,碱基编辑复合物包含脱氨酶、切口酶、UGI和/或GAM蛋白。功能结构域可相对于DNA结合结构域(和/或切口酶(当包括在催化活性融合分子时))以任何方式定位,包括但不限于N端(当存在多个功能结构域时以任何顺序),C端(当存在多个功能结构域时以任何顺序)等。
在一些实施方案中,DNA编辑(碱基编辑)复合物还包含有助于打开或去稳定双链DNA螺旋的分子。在一些实施方案中,分子包含酶。在一些实施方案中,酶是解旋酶(如,RecQ解旋酶(WRN、BLM、RecQL4和RecQ5)(参见,Mo,et al.(2018)Cancer Lett.413:1-10),DNA2(Jia,et al.(2017)DNA Repair(Amst).59:9-19)和任何其他真核解旋酶,包括例如FANCJ、XPD、XPB、RTEL1和PIF1(Brosh(2013)Nat Rev Canc 13(8):542-558))。在一些实施方案中,酶是细菌和/或病毒解旋酶。示例性病毒解旋酶包括由肌病毒科家族病毒编码的那些(如,gp41、Dda、UvsW、Geneα和Ban);由短尾病毒科家族病毒编码的那些(例如4B);由长尾病毒科、杆状病毒科、疱疹病毒科、多瘤病毒科、乳头瘤病毒科(Palillomaviridae)和痘病毒科家族编码的那些(如,G40P、p143、UL5、UL9、Tag、E1、NPH-1、NPH-II、A18R和VETF)或本领域已知的任何其他病毒解旋酶(参见,例如Frick and Lam(2006)Curr Pharm Des 12(11):1315-1338)。在一些实施方案中,解旋酶是细菌酶。示例性细菌解旋酶包括铜绿假单胞菌SF4 DnaB样解旋酶,或RecB和RecD解旋酶,它们是细菌(如,大肠杆菌和幽门螺杆菌)中细菌RecBCD复合物的一部分(Shadrick,et al.(2013)J.Biomol Screen 18(7):761-781)。在一些实施方案中,分子包含CRISPR/Cas复合物。在一些实施方案中,CRISPR/Cas复合物包含引导RNA。在一些实施方案中,复合物包含在核酸酶结构域之一有催化缺陷的Cas酶。在一些实施方案中,Cas酶在其PAM识别上有缺陷(Anders,et al.(2014)Nature 513(7519):569-573)。在一些实施方案中,分子具有螺旋去稳定特性。示例性螺旋去稳定分子包括来自I型单纯疱疹病毒的ICP8(Boehmer and Lehman(1993)J Virol 67(2):711-715),Puralpha(Darbinian,et al.(2001)J Cell Biochem 80(4):589-95)和小牛胸腺DNA螺旋去稳定蛋白(Kohwi-Shigematsu,et al.(1978)Proc Natl Acad Sci USA 75(10):4689-93)。在一些实施方案中,分子是核酸。在一些实施方案中,核酸是与接近靶向编辑区域同源的DNA。在一些实施方案中,核酸是与接近靶向编辑区同源的RNA。在一些实施方案中,RNA被修饰。在一些实施方案中,融合分子包含融合分子的一个或多个结构域之间的氨基酸接头序列。
本文所述DNA编辑复合物可包含如本文所述的1、2、3、4个或更多个融合分子。在某些实施方案中,DNA编辑复合物包含2个融合分子:第一融合分子,其是包含DNA结合结构域和切口酶结构域的催化活性切口酶(催化活性),和第二无催化活性融合分子,其包含DNA结合结构域和一个或多个功能域(胞苷脱氨酶、腺嘌呤脱氨酶和/或UGI等)。通常,融合分子是“配偶体”,因为两个DNA结合结构域与靶位点结合,从而使两个融合分子二聚化以产生DNA编辑。在其他实施方案中,DNA编辑复合物包含3个或更多个融合分子:第一融合分子,其是包含DNA结合结构域和切口酶结构域的催化活性切口酶;第二无催化活性融合分子,其包含DNA结合结构域(如,其是配偶体且与第一融合分子二聚化);以及第三融合分子,其包含DNA结合结构域和本文所述的一个或多个功能结构域。
切口酶结构域
在某些实施方案中,融合蛋白包含DNA结合结构域和切割(核酸酶)结构域,优选切口酶结构域。这样,可使用核酸酶如工程化切口酶来实现基因编辑。工程化核酸酶技术基于天然存在的DNA结合蛋白的工程化。例如,已描述了具有定制的DNA结合特异性的归巢核酸内切酶的工程化(Chames,et al.(2005)Nucleic Acids Res 33(20):e178;Arnould,etal.(2006)J.Mol.Biol.355:443-458)。此外,还描述了ZFP的工程化。参见,例如,美国专利号6,534,261;6,607,882;6,824,978;6,979,539;6,933,113;7,163,824;和7,013,219。
另外,已将ZFP和/或TALE融合至核酸酶结构域,以产生ZFN和TALEN——能够通过其工程化(ZFP或TALE)DNA结合结构域识别其预期的核酸靶标并引起经由核酸酶活性在DNA结合位点附近切割DNA的功能实体。参见,例如Kim,et al.(1996)Proc Nat’l Acad SciUSA 93(3):1156-1160。最近,此类核酸酶已用于各种生物体的基因组修饰。参见,例如美国专利号9,255,250;9,200,266;9,045,763;9,005,973;8,956,828;8,945,868;8,703,489;8,586,526;6,534,261;6,599,692;6,503,717;6,689,558;7,067,317;7,262,054;7,888,121;7,972,854;7,914,796;7,951,925;8,110,379;8,409,861;美国专利公开号2003/0232410;2005/0208489;2005/0026157;2005/0064474;2006/0063231;2008/0159996;2010/00218264;2012/0017290;2011/0265198;2013/0137104;2013/0122591;2013/0177983;2013/0177960;和2015/0056705。
因此,本文所述方法和组合物是广泛适用的,并且可涉及任何感兴趣核酸酶。核酸酶的非限制性实例包括大范围核酸酶、TALEN和锌指核酸酶。核酸酶可包含异源DNA结合和切割结构域(如,锌指核酸酶;具有异源切割结构域的大范围核酸酶DNA结合结构域),或者可选择地,可将天然存在的核酸酶的DNA结合结构域改变为结合至所选择的靶位点(如,已被工程化为结合至不同于同源结合位点的位点的大范围核酸酶)。
本文所述的任何核酸酶中,核酸酶可包含工程化TALE DNA结合结构域和核酸酶结构域(如,核酸内切酶和/或大范围核酸酶结构域),又被称为TALEN。已公开了工程化这些TALEN蛋白以与使用者选择的靶序列进行稳健、位点特异性相互作用的方法和组合物(参见美国专利号8,586,526)。在一些实施方案中,TALEN包含核酸内切酶(如,FokI)切割结构域或切割半结构域。在其他实施方案中,TALE核酸酶是巨大TAL。这些巨大TAL核酸酶是包含TALE DNA结合结构域和大范围核酸酶切割结构域的融合蛋白。大范围核酸酶切割结构域作为单体具有活性,并且不需要二聚化来实现活性(参见,Boissel,et al.(2013)Nucl AcidRes 1-13,doi:10.1093/nar/gkt1224)。另外,核酸酶结构域还可以显示DNA结合功能。
在进一步的实施方案中,核酸酶包含致密TALEN(cTALEN)。这些是将TALE DNA结合结构域与TevI核酸酶结构域连接的单链融合蛋白。取决于TALE DNA结合结构域相对于TevI核酸酶结构域定位的位置,融合蛋白可充当被TALE区域定位的切口酶,或者可产生双链断裂(参见,Beurdeley,et al.(2013)Nat Comm:1-8DOI:10.1038/ncomms2782)。任何TALEN可与其他TALEN(如,一种或多种TALEN(cTALEN或FokI-TALEN)和一种或多种巨大-TAL)或其他DNA切割酶组合使用。
在某些实施方案中,核酸酶包含大范围核酸酶(归巢核酸内切酶)或其表现出切割活性的部分。天然存在的大范围核酸酶识别15-40个碱基对的切割位点,通常分为四个家族:LAGLIDADG家族(“LAGLIDADG”公开为SEQ ID NO:75),GIY-YIG家族,His-Cyst盒家族和HNH家族。示例性归巢核酸内切酶包括I-SceI、I-CeuI、PI-PspI、PI-Sce、I-SceIV、I-CsmI、I-PanI、I-SceII、I-PpoI、I-SceIII、I-CreI、I-TevI、I-TevII和I-TevIII。它们的识别序列是已知的。另外参见美国专利号5,420,032;美国专利号6,833,252;Belfort,et al.(1997)Nucleic Acids Res.25:3379-3388;Dujon,et al.(1989)Gene 82:115-118;Perler,etal.(1994)Nucleic Acids Res.22:1125-1127;Jasin(1996)Trends Genet.12:224-228;Gimble,et al.(1996)J.Mol.Biol.263:163-180;Argast,et al.(1998)J.Mol.Biol.280:345-353和New England Biolabs目录。
已将来自天然存在的大范围核酸酶,主要是来自LAGLIDADG家族(以SEQ ID NO:75公开的“LAGLIDADG”)的DNA结合结构域用于促进植物、酵母、果蝇、哺乳动物细胞和小鼠中的位点特异性基因组修饰,但是这种方法仅限于修饰保留大范围核酸酶识别序列的同源基因(Monet,et al.(1999)Biochem.Biophysics.Res.Common 255:88-93),或已引入识别序列的预先工程化基因组(Route,et al.(1994)Mol.Cell.Biol.14:8096-106;Chilton,etal.(2003)Plant Physiology 133:956-65;Puchta,et al.(1996)Proc.Natl.Acad.Sci.USA 93:5055-60;Rong,et al.(2002)Genes Dev.16:1568-81;Gouble,et al.(2006)J.Gene Med.8(5):616-622)。因此,已尝试工程化大范围核酸酶以在医学或生物技术相关的位点表现出新的结合特异性(Porteus,et al.(2005)Nat.Biotechnol.23:967-73;Sussman,et al.(2004)J.Mol.Biol.342:31-41;Epinat,etal.(2003)Nucleic Acids Res.31:2952-62;Chevalier,et al.(2002)Molec.Cell 10:895-905;Epinat,et al.(2003)Nucleic Acids Res.31:2952-2962;Ashworth,et al.(2006)Nature 441:656-659;Paques,et al.(2007)Current Gene Therapy 7:49-66;美国专利公开号2007/0117128;2006/0206949;2006/0153826;2006/0078552;和2004/0002092)。此外,来自大范围核酸酶的天然存在或工程化DNA结合结构域可与来自异源核酸酶的切割结构域(如,FokI)可操作地连接,和/或来自大范围核酸酶的切割结构域可与异源DNA结合结构域(如,ZFP或TALE)可操作地连接。
在其他实施方案中,核酸酶是锌指核酸酶(ZFN)或TALE DNA结合结构域-核酸酶融合物(TALEN)。ZFN和TALEN包含已被工程化为结合至选择基因和切割结构域或切割半结构域(如,来自限制性和/或本文所述的大范围核酸酶)中靶位点的DNA结合结构域(锌指蛋白或TALE DNA结合结构域)。
如上所述,可将锌指结合结构域和TALE DNA结合结构域工程化为结合至选择的序列。参见,例如Beerli,et al.(2002)Nature Biotechnol.20:135-141;Pabo,et al.(2001)Ann.Rev.Biochem.70:313-340;Isalan,et al.(2001)Nature Biotechnol.19:656-660;Segal,et al.(2001)Curr.Opin.Biotechnol.12:632-637;Choo,et al.(2000)Curr.Opin.Struct.Biol.10:411-416。与天然存在的蛋白质相比,工程化锌指结合结构域或TALE蛋白可具有新的结合特异性。工程化方法包括但不限于合理设计和各种选择。合理设计包括,例如使用包含三链体(或四链体)核苷酸序列和单个锌指或TALE氨基酸序列的数据库,其中每个三链体或四链体核苷酸序列与结合特定三链体或四链体序列的锌指或TALE重复单元的一个或多个氨基酸序列相关联。参见,例如美国专利号6,453,242和6,534,261,通过引用整体并入本文。
选择靶位点;以及设计和构建融合蛋白(和编码其的多核苷酸)的方法是本领域技术人员已知的,并且详细描述于美国专利号7,888,121和8,409,861中,通过引用整体并入本文。
此外,如在这些和其他参考文献中所公开的,可使用任何合适的接头序列将锌指结构域、TALE和/或多指锌指蛋白连接在一起,所述接头序列包括,例如长度为5个或更多个氨基酸的接头。长度为6个或更多个氨基酸的示例性接头序列参见如美国专利号6,479,626;6,903,185;和7,153,949。本文所述蛋白质可包括蛋白质的单个锌指之间的合适接头的任何组合。同样参见美国专利号8,772,453。
因此,诸如ZFN、TALEN和/或大范围核酸酶的核酸酶可包含任何DNA结合结构域和任何核酸酶(切割)结构域(切割结构域、切割半结构域)。如上所述,切割结构域可与以下异源:DNA结合结构域如锌指或TAL效应物DNA结合结构域和来自核酸酶的切割结构域,或者大范围核酸酶DNA结合结构域和来自不同核酸酶的切割结构域。异源切割结构域可获自任何核酸内切酶或核酸外切酶。可从其衍生切割结构域的示例性核酸内切酶包括但不限于限制性核酸内切酶和归巢核酸内切酶。参见,例如,2002-2003目录,New England Biolabs,Beverly,MA;以及Belfort,et al.(1997)Nucleic Acids Res.25:3379-3388。其他切割DNA的酶是已知的(如,S1核酸酶;绿豆核酸酶;胰腺DNase I;微球菌核酸酶;酵母HO核酸内切酶;还参见Linn,et al.(eds.)Nucleases,Cold Spring Harbor Laboratory Press,1993)。可将这些酶中的一种或多种(或其功能片段)用作切割结构域和切割半结构域的来源。
类似地,切割半结构域可源自如上所述的任何核酸酶或其部分,其需要二聚化来实现切割活性。通常,如果融合蛋白包含切割半结构域,则切割需要两个融合蛋白。可选择地,可使用包含两个切割半结构域的单个蛋白质。两个切割半结构域可源自相同的核酸内切酶(或其功能片段),或者每个切割半结构域可源自不同的核酸内切酶(或其功能片段)。另外,两个融合蛋白的靶位点优选相对于彼此布置,使得两个融合蛋白与它们各自的靶位点的结合将切割半结构域在彼此空间方向上放置,从而允许切割半结构域以形成功能性切割结构域,如通过二聚化。因此,在某些实施方案中,靶位点的近边缘被5-10个核苷酸或15-18个核苷酸隔开。然而,任何整数的核苷酸或核苷酸对都可在两个靶位点之间插入(如,2至50个核苷酸对或更多)。通常,切割位点位于靶位点之间。
限制性核酸内切酶(限制酶)存在于许多物种中,并且能够与DNA(在识别位点处)进行序列特异性结合,并在结合位点处或结合位点附近切割DNA。某些限制酶(如,IIS型)在远离识别位点的位点切割DNA,并具有可分离的结合和切割结构域。例如,IIS型酶FokI在一条链上距其识别位点9个核苷酸处和另一条链距其识别位点13个核苷酸处催化DNA的双链切割。参见,例如,美国专利号5,455,802;5,436,150;和5,487,994;以及Li,et al.(1992)Proc.Natl.Acad.Sci.USA 89:4275-4279;Li,et al.(1993)Proc.Natl.Acad.Sci.USA 90:2764-2768;Kim,et al.(1994a)Proc.Natl.Acad.Sci.USA 91:883-887;Kim,et al.(1994b)J.Biol.Chem.269:31,978-31,982。因此,在一个实施方案中,融合蛋白包含来自至少一个IIS型限制酶的切割结构域(或切割半结构域)和一个或多个可被工程化或未被工程化的锌指结合结构域。
其切割结构域与结合结构域分开的示例性IIS型限制酶为FokI。这种特定的酶作为二聚体具有活性(Bitinaite,et al.(1998)Proc.Natl.Acad.Sci.USA95:10,570-10,575)。因此,出于本公开的目的,在公开的融合蛋白中使用的FokI酶的部分被认为是切割半结构域。因而,对于使用锌指-FokI融合物的细胞序列的靶向双链切割和/或靶向置换,可使用两个融合蛋白来重构催化活性切割结构域,其中每个融合蛋白包含FokI切割半结构域。可选择地,还可使用包含锌指结合结构域和两个FokI切割半结构域的单个多肽分子。使用锌指-FokI融合物进行靶向切割和靶向序列改变的参数在本公开的其他地方提供。
切割结构域或切割半结构域可以是蛋白的任何部分,其保留切割活性或保留多聚化(如,二聚化)形成功能切割结构域的能力。
示例性IIS型限制酶描述于国际专利公开号WO 07/014275中,其整体并入本文。其他限制酶也包含可分离的结合和切割结构域,并且本公开考虑了这些。参见,例如,Roberts,et al.(2003)Nucleic Acids Res.31:418-420。
在某些实施方案中,切割结构域是FokI切割结构域。全长FokI序列如下所示。切割结构域以斜体和下划线(全长蛋白的位置384至579)显示,其中完整蛋白序列如下所示(SEQID NO:5):
Figure BDA0003020316560000621
Figure BDA0003020316560000631
源自FokI的切割半结构域可在如SEQ ID NO:5所示的一个或多个氨基酸残基中包含突变。突变包括取代(野生型氨基酸残基取代为不同残基),插入(一个或多个氨基酸残基的插入)和/或缺失(一个或多个氨基酸残基的缺失)。在某些实施方案中,残基414-426、443-450、467-488、501-502和/或521-531(相对于SEQ ID NO:5编号)的一个或多个被突变,因为这些残基位于结合至其靶位点的ZFN的分子模型中DNA主链附近,如Miller,et al.(2007)Nat Biotechnol 25:778-784中所述。在某些实施方案中,位置416、422、447、448和/或525处的一个或多个残基被突变。在某些实施方案中,突变包括野生型残基被任何不同的残基取代,例如丙氨酸(A)残基、半胱氨酸(C)残基、天冬氨酸(D)残基、谷氨酸(E)残基、组氨酸(H)残基、苯丙氨酸(F)残基、甘氨酸(G)残基、天冬酰胺(N)残基、丝氨酸(S)残基或苏氨酸(T)残基。在其他实施方案中,位置416、418、422、446、448、476、479、480、481和/或525的一个或多个处的野生型残基被任何其他残基取代,包括但不限于,R416D、R416E、S418E、S418D、R422H、S446D、K448A、N476D、I479Q、I479T、G480D、Q481A、Q481E、K525S、K525A、N527D、R416E+R422H、R416D+R422H、R416E+K448A、R416D+R422H、K448A+I479Q、K448A+Q481A、K448A+K525A。
在某些实施方案中,切割结构域包含最小化或防止同源二聚化的一个或多个工程化切割半结构域(又被称为二聚化结构域突变体),例如描述于美国专利号7,914,796;8,034,598;和8,623,618以及美国专利公开第2011/0201055中,其全部公开内容通过引用整体并入本文。FokI的位置446、447、479、483、484、486、487、490、491、496、498、499、500、531、534、537和538(相对于SEQ ID NO:5编号)处的氨基酸残基是影响FokI切割半结构域二聚化的全部靶点。突变可包括在与FokI同源的天然限制酶中存在的残基的突变。在优选实施方案中,位置416、422、447、448和/或525(相对于SEQ ID NO:5编号)处的突变包括用不带电荷或带负电荷的氨基酸替换带正电荷的氨基酸。在另一实施方案中,除一个或多个氨基酸残基416、422、447、448或525处的突变外,工程化切割半结构域还包含氨基酸残基499、496和486处的突变(均相对于SEQ ID NO:5编号)。
可将任何切口酶结构域用于本文所述的DNA编辑复合物中。切口酶在催化结构域中包含突变,使得核酸酶不能进行完整的双链断裂,而是导致部分切割,即双链DNA“产生切口”。在需要两个或更多个切割结构域来使靶产生切口的实施方案中,通常至少一个切割结构域(如,切割半结构域)包括对其催化结构域的一个或多个突变,这使得核酸酶失活(如,无催化活性半结构域)。用于产生切口酶的无催化活性切割结构域包括但不限于突变的FokI和/或dCas蛋白。参见,例如,美国专利号9,522,936;9,631,186;9,200,266;和8,703,489,以及Guillinger,et al.(2014)Nature Biotech.32(6):577-582;Cho,et al.(2014)Genome Res.24(1):132-141)。这些无催化活性切割结构域可与催化活性结构域组合用作切口酶以进行单链切割。其他切口酶在本领域中也是已知的,例如,McCaffery,et al.(2016)Nucleic Acids Res.44(2):e11.doi:10.1093/nar/gkv878.Epub 2015Oct 19。
在某些实施方案中,切口酶包含核酸酶切口酶,其包含无催化活性FokI切割结构域,如锌指核酸酶(ZFN)切口酶或TAL效应物结构域(TALEN)切口酶。在FokI的催化结构域中可被突变的氨基酸的非限制性实例包括氨基酸残基450、467和/或469(相对于野生型确定)。在某些实施方案中,对专性异二聚体的一个成员的催化结构域进行一个或多个点突变,以使切割半结构域的催化活性失活。例如,位置450可从D突变为N,位置467可从D突变为A;且位置469可从K突变为A。其他氨基酸可在这些或其他位置被取代。参见,例如,美国专利号9,522,936;9,631,186;8,703,489和9,200,266,以及Guillinger,et al.(2014)NatureBiotech.32(6):577-582;Cho,et al.(2014)Genome Res.24(1):132-141)。无催化活性切割结构域可与催化活性结构域组合充当切口酶进行单链切割。其他切口酶在本领域中也是已知的,例如,McCaffery,et al.(2016)Nucleic Acids Res.44(2):e11.doi:10.1093/nar/gkv878.Epub 2015 Oct 19。任何核酸酶(如,ZFN或TALEN或CRISPR/Cas核酸酶)都可通过使用形成单链切割的切割结构域代替形成双链切割的核酸酶的切割结构域而成为切口酶。
FokI结构域还可包含一个或多个其他突变。在某些实施方案中,本文所述的组合物包括FokI的工程化切割半结构域,其形成专性异二聚体,如描述于例如美国专利号7,914,796;8,034,598;8,961,281;和8,623,618;美国专利公开号2008/0131962和2012/0040398中。因此,在一个优选实施方案中,本发明提供了融合蛋白,其中工程化切割半结构域包含多肽,其中除位置416、422、447、448或525(相对于SEQ ID NO:5编号)处的一个或多个突变外,该多肽中位置486处的野生型Gln(Q)残基被Glu(E)残基取代,位置499处的野生型Ile(I)残基被Leu(L)残基取代,并且位置496处的野生型Asn(N)残基被Asp(D)或Glu(E)残基取代(“ELD”或“ELE”)。在另一个实施方案中,工程化切割半结构域源自野生型FokI切割半结构域,并且除氨基酸残基416、422、447、448或525处的一个或多个突变外,还包含相对于野生型FokI(SEQ ID NO:5)编号的氨基酸残基490、538和537处的突变。在优选实施方案中,本发明提供了融合蛋白,其中工程化切割半结构域包含多肽,其中除位置416、422、447、448或525处的一个或多个突变外,该多肽中位置490处的野生型Glu(E)残基被Lys(K)残基取代,位置538处的野生型Ile(I)残基被Lys(K)残基取代,且位置537处的野生型His(H)残基被Lys(K)残基或Arg(R)残基取代(“KKK”或“KKR”)(参见US 8,962,281,通过引用并入本文),参见,例如美国专利号7,914,796;8,034,598;和8,623,618,其公开内容出于所有目的通过引用整体并入本文。在其他实施方案中,工程化切割半结构域包含“Sharkey”和/或“Sharkey突变”(参见Guo,et al.(2010)J.Mol.Biol.400(1):96-107)。
在其他实施方案中,本文所述切口酶包含工程化切割半结构域,其源自野生型FokI切割半结构域,并且除氨基酸残基416、422、447、448或525处的一个或多个突变外,还包含相对于野生型FokI或FokI同源物编号的氨基酸残基490和538处的突变。在优选实施方案中,本发明提供了融合蛋白,其中工程化切割半结构域包含多肽,其中除位置416、422、447、448或525处的一个或多个突变外,该多肽中位置490处的野生型Glu(E)残基被Lys(K)残基取代,且位置538处的野生型Ile(I)残基被Lys(K)残基(“KK”)取代。在其他优选实施方案中,说明书提供了融合蛋白,其中工程化切割半结构域包含多肽,其中除位置416、422、447、448或525处的一个或多个突变外,该多肽中位置486处的野生型Gln(Q)残基被Glu(E)残基取代,位置499处的野生型Ile(I)残基被Leu(L)残基取代(“EL”)(参见美国专利号8,034,598,通过引用并入本文)。
在某些方面,说明书提供了融合蛋白,其中工程化切割半结构域包含多肽,其中FokI催化结构域的位置387、393、394、398、400、402、416、422、427、427、434、439、441、447、448、469、487、495、497、506、516、525、529、534、559、569、570、571的一个或多个处的野生型氨基酸残基被突变。在一些实施方案中,一个或多个突变将野生型氨基酸从带正电荷的残基改变为中性残基或带负电荷的残基。在任何这些实施方案中,所述突变体也可在含有一个或多个其他突变的FokI结构域中制备。在优选实施方案中,这些其他突变位于二聚化结构域中,如位置418、432、441、481、483、486、487、490、496、499、523、527、537、538和/或559处。突变的非限制性实例包括位置393、394、398、416、421、422、442、444、472、473、473、478、480、525或530处利用任何氨基酸残基的任何切割结构域(如,FokI或FokI的同源物)的野生型残基的突变(如,取代)(如,K393X、K394X、R398X、R416S、D421X、R422X、K444X、S472X、G473X、S472、P478X、G480X、K525X和A530X,其中第一个残基表示野生型,X表示取代野生型残基的任何氨基酸)。在一些实施方案中,X为E、D、H、A、K、S、T、D或N。其他示例性突变包括S418E、S418D、S446D、K448A、I479Q、I479T、Q481A、Q481N、Q481E、A530E和/或A530K,其中氨基酸残基相对于全长FokI野生型切割结构域及其同源物编号。在某些实施方案中,组合可包括416和422,位置416处的突变和K448A,K448A和I479Q,K448A和Q481A和/或K448A,以及位置525处的突变。在一个实施方案中,位置416处的野生残基可被Glu(E)残基取代(R416E),位置422处的野生型残基被His(H)残基取代(R422H),位置525处的野生型残基被Ala(A)取代。本文所述切割结构域可进一步包括其他突变,其包括但不限于位置432、441、483、486、487、490、496、499、527、537、538和/或559处,例如二聚化结构域突变体(如,ELD、KKR)和/或切口酶突变体(催化结构域的突变)。本文所述具有突变的切割半结构域形成本领域已知的异二聚体。
核酸酶可使用所谓“分裂-酶”技术在体内核酸靶位点处组装(参见,如美国专利公开号2009/0068164)。此类分裂酶的组分可在单独的表达构建体上表达,或可在一个开放阅读框中连接,在该阅读框中各个组分被如自切割2A肽或IRES序列分开。组分可以是单独的锌指结合结构域或大范围核酸酶核酸结合结构域的结构域。
核酸酶(如,ZFN和/或TALEN)可在使用之前筛选活性,例如,在如美国专利号8,563,314中所述的基于酵母的染色体系统中。
除ZFN或TALEN切口酶外或代替ZFN或TALEN切口酶,DNA编辑复合物可包含CRISPR/Cas切口酶。CRISPR/Cas切口酶的非限制性实例描述于美国专利号9,840,713;9,770,489;9,567,604;8,932,814;8,889,356;8,697,359;8,771,945;8,795,965;8,865,406;8,871,445;8,889,356;8,895,308;8.906,616;8,932,814;8,945,839;8,945,839;8,999,641;10,000,772等中。
编码系统的RNA组分的CRISPR(成簇规律间隔短回文重复序列)基因座和编码蛋白质的Cas(CRISPR相关)基因座(Jansen,et al.(2002)Mol.Microbiol.43:1565-1575;Makarova,et al.(2002)Nucleic Acids Res.30:482-496;Makarova,et al.(2006)Biol.Direct 1:7;Haft,et al.(2005)PLoS Comput.Biol.1:e60)组成CRISPR/Cas核酸酶系统的基因序列。微生物宿主中的CRISPR基因座包含CRISPR相关(Cas)基因以及能够编程CRISPR介导的核酸切割特异性的非编码RNA元件的组合。
II型CRISPR是表征最充分的系统之一,并且在四个连续步骤中进行靶向DNA双链断裂。首先,从CRISPR基因座转录两个非编码RNA,即pre-crRNA阵列和tracrRNA。第二,将tracrRNA与pre-crRNA的重复区域杂交,并介导pre-crRNA加工为含有单个间隔区序列的成熟crRNA。第三,成熟crRNA:tracrRNA复合物经由crRNA上的间隔区与靶DNA上的前间区序列(其位于靶标识别额外需求的前间区序列邻近基序(PAM)旁边)之间的沃森-克里克碱基配对将Cas9引导至靶DNA。最后,Cas9介导靶DNA的切割以在前间区序列内产生双链断裂。CRISPR/Cas系统的活性包括三个步骤:(i)将外来DNA序列插入CRISPR阵列以防止将来的攻击,被称为“适应(adaptation)”的过程,(ii)相关蛋白的表达以及阵列的表达和加工,接着(iii)RNA介导的外来核酸干扰。因此,在细菌细胞中,一些所谓的“Cas”蛋白与CRISPR/Cas系统的天然功能有关,并在诸如插入外来DNA等功能中发挥作用。
最初,Cas与引导RNA的核糖-磷酸主链广泛接触,预定了初始DNA询问所需的10-ntRNA种子序列。除预定的种子序列外,Cas蛋白R1333和R1335的PAM相互作用位点(其负责5’-NGG-3’PAM识别并在缺乏引导的apo结构中发生混乱)在与靶DNA进行接触之前预先定位,表明sgRNA负载使Cas能够形成具有DNA识别能力的结构。一旦Cas结合其引导RNA,该复合物就准备好搜索互补的靶DNA位点。靶标搜索和识别既需要靶DNA中20-nt间隔区序列与前间区序列之间的互补碱基配对,也需要邻近靶位点存在保守的PAM序列。PAM序列对于区分自身和非自身序列至关重要。单分子实验表明,Cas通过探测适当PAM序列然后询问侧翼DNA潜在引导RNA互补性来启动靶DNA搜索过程。通过三维碰撞发生靶识别,其中Cas从未含适当PAM序列的DNA快速解离,并且停留时间取决于存在适当PAM时引导RNA与邻近DNA之间的互补性。一旦Cas找到具有适当PAM的靶位点,它就触发PAM邻近成核位点的局部DNA解链,然后RNA链入侵,形成RNA–DNA杂合体和来自PAM近端至PAM远端的置换DNA链(被称为R环)。PAM双链体位于含保守HNH的α螺旋识别(REC)叶的核酸酶(NUC)叶与分裂RuvC核酸酶结构域之间带正电荷的沟槽中,而含PAM的非靶链主要位于C端结构域(CTD)。PAM序列的第一个碱基(表示为N)与其配对物保持碱基配对,但不与Cas相互作用。通过与位于CTD的β-发夹结构的两个精氨酸残基(R1333和R1335)的碱基特异性氢键相互作用,保守的PAM GG二核苷酸直接在大沟槽中读出。除与GG二核苷酸进行碱基特异性接触外,Cas的CTD还与含PAM的非靶DNA链的脱氧核糖磷酸主链进行许多氢键相互作用。然而,Cas和与PAM互补的靶链核苷酸之间未观测到直接接触(Jiang and Doudna(2017)Annual Review of Biophysics 46:505-529)。在一些实施方案中,本发明的方法和组合物中公开的Cas是PAM不可知的。在一些实施方案中,上文公开的位置R1333和R1335包含改变PAM识别的突变(Anders,et al.(2014)Nature513(7519):569-573)。
在一些实施方案中,使用了CRISPR-Cpf1系统。在弗朗西斯菌(Francisella spp.)中鉴定的CRISPR-Cpf1系统是2类CRISPR-Cas系统,其在人细胞中介导强大的DNA干扰。尽管在功能上是保守的,但Cpf1和Cas9在许多方面都存在差异,包括它们的引导RNA和底物特异性(参见,Fagerlund,et al.(2015)Genom Bio 16:251)。Cas9和Cpf1蛋白之间的主要区别在于Cpf1不利用tracrRNA,因而仅需要crRNA。FnCpf1 crRNA为42–44个核苷酸长(19个核苷酸的重复序列和23–25个核苷酸的间隔区),并且含有单个茎环,其允许保留二级结构的序列变化。此外,Cpf1 crRNA明显短于Cas9所需的约100个核苷酸工程化sgRNA,FnCpfl的PAM需求是置换链上的5’-TTN-3’和5’-CTA-3’。尽管Cas9和Cpf1两者都在靶DNA中产生双链断裂,但是Cas9利用它的RuvC和HNH样结构域在引导RNA的种子序列内进行平端切割,而Cpf1利用RuvC样结构域在种子外部产生交错切割。由于Cpf1远离关键种子区域进行交错切割,因而NHEJ不会破坏靶位点,因此确保Cpf1可继续切割同一位点,直到发生所期望的HDR重组事件为止。因此,在本文所述的方法和组合物中,应理解,术语“Cas”包括Cas9蛋白和Cfp1蛋白。因此,如本文所用,“CRISPR/Cas系统”是指CRISPR/Cas和/或CRISPR/Cfp1系统,包括核酸酶、切口酶和/或转录因子系统。
在一些实施方案中,可使用其他Cas蛋白。一些示例性Cas蛋白包括Cas9、Cpf1(又被称为Cas12a)、C2c1、C2c2(又被称为Cas13a)、C2c3、Cas1、Cas2、Cas4、CasX和CasY;并且包括其工程化和天然变体(Burstein,et al.(2017)Nature 542:237-241)例如HF1/spCas9(Kleinstiver,et al.(2016)Nature 529:490-495;Cebrian-Serrano and Davies(2017)Mamm Genome 28(7):247-261);split Cas9系统(Zetsche,et al.(2015)Nat Biotechnol33(2):139-142),基于内含肽-外显肽系统的反式剪接Cas9(Troung,et al.(2015)NuclAcid Res 43(13):6450-8);mini-SaCas9(Ma,et al.(2018)ACS Synth Biol 7(4):978-985)。因此,在本文所述方法和组合物中,应理解,术语“Cas”包括天然和工程化的所有Cas变体蛋白。因此,如本文所用,“CRISPR/Cas系统”是指任何CRISPR/Cas系统,其包括核酸酶、切口酶和/或转录因子系统。
在某些实施方案中,Cas蛋白可以是天然存在的Cas蛋白的“功能衍生物”。天然序列多肽的“功能衍生物”是具有与天然序列多肽相同的定性生物学特性的化合物。“功能衍生物”包括但不限于天然序列的片段和天然序列多肽及其片段的衍生物,条件是它们具有与相应的天然序列多肽相同的生物学活性。本文考虑的生物学活性是功能衍生物使DNA底物水解成片段的能力。术语“衍生物”涵盖多肽的氨基酸序列变体,共价修饰及其融合物,例如衍生物Cas蛋白。Cas多肽或其片段的合适衍生物包括但不限于Cas蛋白或其片段的突变体、融合物、共价修饰。Cas蛋白,其包括Cas蛋白或其片段以及Cas蛋白或其片段的衍生物,可从细胞获得或化学合成获得或通过这两种方法的组合获得。细胞可以是天然产生Cas蛋白的细胞,或者是天然产生Cas蛋白并经基因工程化改造为产生处于较高表达水平的内源Cas蛋白或由外源导入的核酸(该核酸编码与内源Cas相同或不同的Cas)产生Cas蛋白的细胞。在某些情况下,该细胞不天然产生Cas蛋白,而是经过基因工程化来产生Cas蛋白。在一些实施方案中,Cas蛋白是用于经由AAV载体递送的小Cas9直向同源物(Ran,et al.(2015)Nature 510:186)。
递送
可通过任何合适的手段将本文所述的DNA编辑复合物(或其组分分子)递送至靶细胞,包括例如通过注射蛋白质和/或mRNA组分。可经由任何合适的手段递送至分离细胞(其反过来可施用于活体受试者用于离体细胞治疗)或活体受试者。将基因编辑分子递送至细胞和受试者是本领域已知的。
合适的细胞包括但不限于真核和原核细胞和/或细胞系。此类细胞或由此类细胞生成的细胞系的非限制性实例包括T细胞、COS、CHO(如,CHO-S、CHO-K1、CHO-DG44、CHO-DUXB11、CHO-DUKX、CHOK1SV)、VERO、MDCK、WI38、V79、B14AF28-G3、BHK、HaK、NS0、SP2/0-Ag14、HeLa、HEK293(如,HEK293-F、HEK293-H、HEK293-T)和perC6细胞以及昆虫细胞如草地贪夜蛾(Sodoptera fugiperda,Sf)或真菌细胞如酿酒酵母属、毕赤酵母属和裂殖酵母属。在某些实施方案中,细胞系是CHO-K1、MDCK或HEK293细胞系。合适的细胞还包括干细胞,例如,胚胎干细胞、诱导性多能干细胞(iPS细胞)、造血干细胞、神经元干细胞和间充质干细胞。
递送如本文所述的蛋白的方法描述于例如美国专利号6,453,242;6,503,717;6,534,261;6,599,692;6,607,882;6,689,558;6,824,978;6,933,113;6,979,539;7,013,219;和7,163,824中,其全部公开内容通过引用整体并入本文。
本文所述的DNA编辑复合物也可使用包含编码一个或多个组分(如,融合分子)的序列的载体来递送。此外,其他核酸(如,供体)也可通过这些载体递送。可使用任何载体系统,包括但不限于质粒载体、逆转录病毒载体、慢病毒载体、腺病毒载体、痘病毒载体;疱疹病毒载体和腺伴随病毒载体等。同样,参见美国专利号6,534,261;6,607,882;6,824,978;6,933,113;6,979,539;7,013,219;和7,163,824,通过引用整体并入本文。此外,很明显,这些载体中的任一种可包含一个或多个DNA结合蛋白编码序列和/或其他合适的核酸。因此,当将本文所述的一个或多个DNA结合蛋白引入细胞时,它们可携带于相同载体或不同载体。当使用多个载体时,每个载体可包含编码一个或多个DNA结合蛋白的序列和所期望的其他核酸。可使用常规的基于病毒和非病毒的基因转移方法在细胞(如,哺乳动物细胞)和靶组织中引入编码工程化DNA结合蛋白的核酸并共同引入所期望的其他核苷酸序列。此类方法还可用于在体外向细胞施用编码核酸(如,编码DNA结合蛋白和/或供体)。在某些实施方案中,施用核酸用于体内或离体基因治疗用途。非病毒载体递送系统包括DNA质粒、裸核酸以及与诸如脂质体或泊洛沙姆的递送媒介物复合的核酸。病毒载体递送系统包括DNA和RNA病毒,其在递送至细胞后具有游离或整合的基因组。关于基因治疗程序的综述,参见Anderson(1992)Science 256:808-813;Nabel&Felgner(1993)TIBTECH 11:211-217;Mitani&Caskey(1993)TIBTECH 11:162-166;Dillon(1993)TIBTECH 11:167-175;Miller(1992)Nature357:455-460;Van Brunt(1988)Biotechnology 6(10):1149-1154;Vigne(1995)Restorative Neurology and Neuroscience 8:35-36;Kremer&Perricaudet(1995)British Medical Bulletin 51(1):31-44;Haddada,et al,in Current Topics inMicrobiology and Immunology Doerfler and
Figure BDA0003020316560000711
(eds.)(1995);and Yu,et al.(1994)Gene Therapy 1:13-26。
核酸的非病毒递送的方法包括电穿孔、脂转染、显微注射、生物射弹、病毒体、脂质体、免疫脂质体、聚阳离子或脂质:核酸缀合物、裸DNA、mRNA、人工病毒体和试剂增强的DNA摄取。使用例如Sonitron 2000系统(Rich-Mar)的超声处理也可用于核酸的递送。在一个优选实施方案中,一种或多种核酸作为mRNA递送。还优选使用带帽的mRNA来增加翻译效率和/或mRNA稳定性。特别优选的是ARCA(抗-反向帽类似物)帽或其变体。参见美国专利号7,074,596和8,153,773,通过引用并入本文。
另外的示例性核酸递送系统包括由Amaxa Biosystems(Cologne,Germany),Maxcyte公司(Rockville,Maryland),BTX Molecular Delivery Systems(Holliston,MA)和Copernicus Therapeutics公司(参见,例如美国专利号6,008,336)提供的那些系统。脂质转染描述于例如美国专利号5,049,386;4,946,787;和4,897,355)以及脂转染试剂在市场上出售(例如TransfectamTM和LipofectinTM和LipofectamineTMRNAiMAX)。适用于多核苷酸的有效受体识别脂转染的阳离子和中性脂质包括Felgner、国际专利公开号WO91/17424和WO 91/16024的那些脂质。可递送至细胞(离体施用)或靶组织(体内施用)。
脂质:核酸复合物的制备,包括靶向脂质体,例如免疫脂质复合物,是本领域技术人员公知的(参见,例如,Crystal(1995)Science 270:404-410;Blaese,et al.(1995)Cancer Gene Ther.2:291-297;Behr,et al.(1994)Bioconjugate Chem.5:382-389;Remy,et al.(1994)Bioconjugate Chem.5:647-654;Gao,et al.(1995)Gene Therapy 2:710-722;Ahmad,et al.(1992)Cancer Res.52:4817-4820;美国专利号4,186,183;4,217,344;4,235,871;4,261,975;4,485,054;4,501,728;4,774,085;4,837,028;和4,946,787)。
其他递送方法包括使用将要递送的核酸包装到EnGeneIC递送媒介物(EDV)中。使用双特异性抗体将这些EDV特异性递送至靶组织,其中抗体的一个臂对靶组织具有特异性,而另一个臂对EDV具有特异性。抗体将EDV带到靶细胞表面,然后通过胞吞将EDV带入细胞中。一旦在细胞中,内容物就被释放(参见,MacDiarmid,et al.(2009)NatureBiotechnology 27(7):643)。
使用基于RNA或DNA病毒的系统来递送编码工程化DNA结合蛋白和/或期望的供体(如,CAR或ACTR)的核酸利用了将病毒靶向身体中的特定细胞并将病毒有效载荷运输至核的高度进化的过程。病毒载体可直接施用于患者(体内),或者它们也可用于体外处理细胞,并且将经修饰的细胞施用于患者(离体)。用于递送核酸的常规的基于病毒的系统包括但不限于用于基因转移的逆转录病毒、慢病毒、腺病毒、腺伴随病毒、痘苗和单纯疱疹病毒载体。用逆转录病毒、慢病毒和腺伴随病毒基因转移方法可在宿主基因组中整合,通常导致插入转基因的长期表达。另外,已在许多不同细胞类型和靶组织中观测到高转导效率。
逆转录病毒的向性可通过掺入外来包膜蛋白,扩大靶细胞的潜在靶群体来改变。慢病毒载体是能够转导或感染非分裂细胞并通常产生高病毒滴度的逆转录病毒载体。逆转录病毒基因转移系统的选择取决于靶组织。逆转录病毒载体由顺式作用的长末端重复序列组成,具有多达6-10kb的外源序列的包装能力。最小的顺式作用LTR足以复制和包装载体,然后使用所述载体将治疗性基因整合至靶细胞中以提供永久性转基因表达。广泛使用的逆转录病毒载体包括基于小鼠白血病病毒(MuLV)、长臂猿白血病病毒(GaLV)、猿免疫缺陷病毒(SIV)、人免疫缺陷病毒(HIV)及其组合的载体(参见,例如Buchscher,et al.(1992)J.Virol.66:2731-2739;Johann,et al.(1992)J.Virol.66:1635-1640;Sommerfelt,etal.(1990)Virol.176:58-59;Wilson,et al.(1989)J.Virol.63:2374-2378;Miller,etal.(1991)J.Virol.65:2220-2224;国际专利公开号WO 94/26877)。
在优选瞬时表达的应用中,可使用基于腺病毒的系统。基于腺病毒的载体在许多细胞类型中都能够有很高的转导效率,并且不需要细胞分裂。使用此类载体,已经获得了高滴度和高水平的表达。此载体可在相对简单的系统中大量产生。也可以使用腺伴随病毒(“AAV”)载体来用靶核酸转导细胞,例如在靶核酸和肽的体外生产中,以及在体内和离体基因治疗程序中(见例如West et al.,(1987)Virology 160:38-47;美国专利号4,797,368;国际专利公开号WO 93/24641;Kotin(1994),Human Gene Therapy 5:793-801;Muzyczka(1994)J.Clin.Invest.94:1351)。重组AAV载体的构建描述于许多出版物,包括美国专利号5,173,414;Tratschin et al.(1985),Mol.Cell.Biol.5:3251-3260;Tratschin,et al.(1984),Mol.Cell.Biol.4:2072-2081;Hermonat&Muzyczka(1984),PNAS 81:6466-6470;和Samulski et al.(1989),J.Virol.63:03822-3828。
至少六种病毒载体方法目前可用于临床试验中的基因转移,其利用涉及通过插入辅助细胞系中的基因对缺陷载体进行互补以产生转导剂的方法。
pLASN和MFG-S是已在临床试验中使用的逆转录病毒载体的实例(Dunbar et al.(1995),Blood 85:3048-305;Kohn et al.(1995),Nat.Med.1:1017-102;Malech et al.(1997),PNAS USA 94(22):12133-12138)。PA317/pLASN是基因治疗试验中使用的第一种治疗载体(Blaese et al.(1995),Science 270:475-480)。已对MFG-S包装的载体观察到50%或更大的转导效率(Ellem et al.(1997),Immunol Immunother.44(1):10-20;Dranoff etal.(1997),Hum.Gene Ther.1:111-2)。
重组腺伴随病毒载体(rAAV)是基于有缺陷且非致病性细小病毒腺伴随2型病毒的有前途的备选基因递送系统。所有载体均源自仅保留转基因表达盒侧翼的AAV 145bp反向末端重复序列的质粒。由于整合到转导细胞的基因组中所致的有效的基因转移和稳定的转基因传递是该载体系统的关键特征(Wagner et al.(1998),Lancet 351(9117):1702-3,Kearns et al.(1996),Gene Ther.9:748-55)。根据本发明,也可使用其他AAV血清型,包括AAV1、AAV3、AAV4、AAV5、AAV6、AAV8、AAV8.2、AAV9和AAV rh10和假型化的AAV如AAV2/8、AAV2/5和AAV2/6。复制缺陷型重组腺病毒载体(Ad)可以高滴度产生并且容易感染许多不同的细胞类型。大多数腺病毒载体经过工程化改造,以使转基因替换Ad E1a、E1b和/或E3基因;随后,复制缺陷型载体可在人293细胞中繁殖,该细胞以反式提供缺失的基因功能。Ad载体可在体内转导多种类型的组织,包括非分裂的分化细胞,例如在肝、肾和肌肉中存在的细胞。常规的Ad载体具有大的携带能力。在临床试验中使用Ad载体的实例涉及多核苷酸疗法,用于用肌内注射进行抗肿瘤免疫(Sterman et al.(1998),Hum.Gene Ther.7:1083-1089)。在临床试验中使用腺病毒载体进行基因转移的其他实例包括Rosenecker,et al.(1996)Infection 24(1):5-10;Sterman,et al.(1998)Hum.Gene Ther.9(7):1083-1089;Welsh,et al.(1995)Hum.Gene Ther.2:205-218;Alvarez,et al.(1997)Hum.Gene Ther.5:597-613;Topf,et al.(1998)Gene Ther.5:507-513;Sterman,et al.(1998)Hum.Gene Ther.7:1083-1089。
使用包装细胞形成能够感染宿主细胞的病毒颗粒。此类细胞包括包装腺病毒的293细胞和包装逆转录病毒的ψ2细胞或PA317细胞。基因治疗中使用的病毒载体通常由生产者细胞系产生,该生产者细胞系将核酸载体包装到病毒颗粒中。载体通常含有包装和随后整合入宿主(若适用的话)所需要的最小病毒序列,由编码要表达的蛋白的表达盒替换的其他病毒序列。缺少的病毒功能由包装细胞系反式提供。例如,用于基因治疗的AAV载体通常仅拥有来自AAV基因组的反向末端重复(ITR)序列,其是包装和整合到宿主基因组中所需要的。病毒DNA包装在细胞系中,该细胞系包含编码其他AAV基因(即rep和cap)但缺少ITR序列的辅助质粒。细胞系还用作为辅助者的腺病毒感染。辅助病毒促进AAV载体的复制和从辅助质粒表达AAV基因。由于缺少ITR序列,因此未大量包装辅助质粒。腺病毒的污染可通过如热处理来减少,其中腺病毒比AAV更敏感。
在许多基因治疗应用中,期望基因治疗载体以高度特异性递送到特定组织类型。因此,可通过将配体表达为与病毒外表面的病毒壳体蛋白的融合蛋白来修饰病毒载体以对给定的细胞类型具有特异性。选择配体以对已知存在于靶细胞类型的受体具有亲和力。例如,Han et al.(1995),Proc.Natl.Acad.Sci.USA 92:9747-9751报告了可对Moloney鼠白血病病毒进行修饰以表达与gp70融合的人调蛋白(heregulin),并且该重组病毒感染某些表达人表皮生长因子受体的人乳腺癌细胞。该原理可以扩展到其他病毒-靶细胞对,其中靶细胞表达受体,并且病毒表达包含细胞表面受体配体的融合蛋白。例如,丝状噬菌体可被工程化改造以展示对实际上任何选择的细胞受体具有特异性结合亲和力的抗体片段(如,FAB或Fv)。尽管以上描述主要适用于病毒载体,但是相同的原理可适用于非病毒载体。可将此类载体工程化改造以含有有利于特定靶细胞摄取的特定摄取序列。
用于CRISPR/Cas系统的递送方法可以包括上述那些方法。例如,在动物模型中,可使用玻璃针将体外转录的编码Cas的mRNA或重组Cas蛋白直接注射至单细胞阶段的胚胎,对动物进行基因组编辑。为了在体外细胞中表达Cas并引导RNA,通常经由脂质转染或电穿孔将编码它们的质粒转染到细胞中。同样,重组Cas蛋白可与体外转录的引导RNA复合,其中Cas-引导RNA核糖核蛋白被感兴趣的细胞摄取(Kim,et al.(2014)Genome Res 24(6):1012)。为了治疗目的,可通过病毒和非病毒技术的组合来递送Cas和引导RNA。例如,编码Cas的mRNA可经由纳米颗粒递送来递送,而引导RNA和任何期望的转基因或修复模板经由AAV来递送(Yin,et al.(2016)Nat Biotechnol 34(3):328)。
如下文所述,基因治疗载体可通过向个体患者(受试者)施用体内递送,通常通过全身施用(如,静脉内、腹膜内、肌内、皮下或颅内输注)或局部施用。可选择地,可将载体离体递送至细胞,例如从个体患者移植的细胞(如,淋巴细胞、骨髓穿刺、组织活组织检查)或通用供体造血干细胞,然后将细胞再移植到患者中,通常在选择已经掺入载体的细胞后。
用于诊断、研究、移植或用于基因治疗的离体细胞转染(如,通过将转染的细胞再输注至宿主生物体)是本领域技术人员所熟知的。在优选实施方案中,从受试者生物体中分离细胞,用DNA结合蛋白核酸(DNA或cDNA)转染,然后再输注回受试者生物体(如,患者)。适用于离体转染的各种细胞类型是本领域技术人员所熟知的(参见,例如Freshney,et al.,Culture of Animal Cells,A Manual of Basic Technique(第3版1994))及其中引用的讨论如何从患者分离和培养细胞的参考文献)。
在一个实施方案中,将干细胞在离体程序中用于细胞转染和基因治疗。使用干细胞的优势在于,它们可在体外分化为其他细胞类型,或可引入哺乳动物(如,供体细胞),在哺乳动物中它们将植入骨髓中。使用细胞因子,如GM-CSF、IFN-γ和TNF-α在体外将CD34+细胞分化为临床上重要的免疫细胞类型的方法是已知的(参见,Inaba,et al.(1992)J.Exp.Med.176:1693-1702)。
使用已知的方法分离用于转导和分化的干细胞。例如,通过用结合不需要的细胞如CD4+和CD8+(T细胞),CD45+(panB细胞),GR-1(粒细胞)和Iad(分化的抗原呈递细胞)的抗体淘选骨髓细胞来从骨髓细胞中分离干细胞(参见Inaba,et al.(1992)J.Exp.Med.176:1693-1702)。
在一些实施方案中,也可使用已经修饰的干细胞。例如,已经变得对凋亡具有抗性的神经元干细胞可用作治疗组合物,其中干细胞还含有本发明的ZFP TF。对凋亡的抗性可例如通过在干细胞中使用BAX-或BAK-特异性TALEN或ZFN敲除BAX和/或BAK(参见,美国专利号8,597,912)产生,或者如再次使用胱天蛋白酶-6特异性ZFN破坏胱天蛋白酶的那些产生。
含有治疗性DNA结合蛋白(或编码这些蛋白的核酸)的载体(如,逆转录病毒、腺病毒、脂质体等)也可直接施用于生物体以在体内转导细胞。可选择地,可施用裸DNA。施用通过通常用于使分子与血液或组织细胞最终接触的任何途径进行,包括但不限于注射、输注、局部应用和电穿孔。施用此类核酸的合适方法是可获得的,并且是本领域技术人员所熟知的,并且尽管可使用超过一种途径来施用特定的组合物,但是特定的途径通常可比另一种途径提供更直接且更有效的反应。
例如,在美国专利号5,928,638中公开了将DNA引入造血干细胞的方法。可用于将转基因导入造血干细胞(如,CD34+细胞)的载体包括35型腺病毒。
适用于将转基因引入免疫细胞(如,T细胞)的载体包括非整合型慢病毒载体。参见,例如Ory,et al.(1996)Proc.Natl.Acad.Sci.USA 93:11382-11388;Dull,et al.(1998)J.Virol.72:8463-8471;Zuffery,et al.(1998)J.Virol.72:9873-9880;Follenzi,et al.(2000)Nature Genetics 25:217-222。
药学上可接受的载体部分由所施用的特定组合物以及用于施用组合物的特定方法决定。因此,存在如下所述的极其多种合适的药物组合物的配制剂(参见,例如Remington’s Pharmaceutical Sciences,第17版,1989)。
如上所述,可将所公开方法和组合物用于任何类型的细胞,包括但不限于原核细胞、真菌细胞、古细菌细胞、植物细胞、昆虫细胞、动物细胞、脊椎动物细胞、哺乳动物细胞和人细胞,包括T细胞核任何类型的干细胞。用于蛋白质表达的合适细胞系是本领域技术人员已知的,包括但不限于COS、CHO(如,CHO-S、CHO-K1、CHO-DG44、CHO-DUXB11)、VERO、MDCK、WI38、V79、B14AF28-G3、BHK、HaK、NS0、SP2/0-Ag14、HeLa、HEK293(如、HEK293-F、HEK293-H、HEK293-T)、perC6、昆虫细胞如草地贪夜蛾(Sf),以及真菌细胞如酿酒酵母属、毕赤酵母属和裂殖酵母属。也可使用这些细胞系的后代、变体和衍生物。
应用
工程化DNA碱基编辑器复合物在疾病的治疗和预防中的应用提供了医学上的重大发展。本文所述方法和组合物用于增加这些新工具的特异性,以确保所期望的靶位点是编辑的主要场所。
可通过本文所述组合物和方法治疗和/或预防的示例性遗传疾病包括但不限于软骨发育不全、色盲、酸性麦芽糖酶缺乏症、腺苷脱氨酶缺乏症(OMIM No.102700)、肾上腺白细胞营养不良、心律失常综合征、α-1抗胰蛋白酶缺乏症、α地中海贫血、雄激素不敏感综合征、阿佩尔(apert)综合征、致心律失常性右室心肌病、发育异常、共济失调性毛细血管扩张症、巴氏(apert)综合征、β地中海贫血、蓝色橡皮疱痣综合征、卡纳万(canavan)病、慢性肉芽肿病(CGD)、猫叫(cri du chat)综合征、囊性纤维化、德尔肯氏(dercum’s)病、外胚层发育不良、范可尼(fanconi)贫血、进行性纤维发育不良性骨化、脆性X综合征、半乳糖血症、高雪氏(Gaucher’s)病、泛发性神经节苷脂沉积症(如,GM1)、血色素沉着症、β-球蛋白第6密码子血红蛋白C突变(HbC)、血友病、亨廷顿(Huntington’s)舞蹈病、霍勒氏(Hurler)综合征、低磷酸酯酶症、克氏(Klinefleter)综合征、克拉伯(Krabbes)病、兰格-吉戴恩(Langer-Giedion)综合征、白细胞粘附缺乏症(LAD、OMIM No.116920)、脑白质营养不良、长QT综合征、马凡(Marfan)综合征、莫比斯(Moebius)综合征、粘多糖贮积症(MPS)、指甲-髌骨综合征、肾性尿崩症、神经纤维瘤病、奈曼-皮克(Neimann-Pick)病、成骨不全症、苯丙酮尿症(PKU)、卟啉症、普拉德-威利(Prader-Willi)综合征、早衰症、Proteus综合征、视网膜母细胞瘤、雷特(Rett)综合征、Rubinstein-Taybi综合征、沙费利波(Sanfilippo)综合征、重症综合性免疫缺陷症(SCID)、Shwachman综合征、镰状细胞病(镰状细胞性贫血)、Smith-Magenis综合征、Stickler综合征、泰-萨氏(Tay-Sachs)病、血小板减少-桡骨缺失(TAR)综合征、特雷彻柯林斯(Treacher Collins)综合征、三体综合征、结节性硬化症、特纳氏(Turner’s)综合征、尿素循环障碍、希佩尔·林道(von Hippel-Landau)综合征、瓦登伯格(Waardenburg)综合征、威廉斯(Williams)综合征、威尔森氏(Wilson’s)病、Wiskott-Aldrich综合征、X连锁淋巴组织增生综合征(XLP、OMIM No.308240)。
可通过靶向DNA碱基编辑来治疗的其他示例性疾病包括获得性免疫缺陷,溶酶体贮积病(如,高雪氏病、GM1、法布里病和泰-萨氏病),粘多糖贮积病(如,亨特氏(Hunter’s)病、霍勒氏(Hurler’s)病),血红蛋白病(如,镰状细胞病、HbC、α-地中海贫血、β-地中海贫血)以及血友病。
此类方法还允许治疗宿主中的感染(病毒或细菌)(如,通过阻断病毒或细菌受体的表达,从而在宿主生物中防止感染和/或传播)来治疗遗传疾病。
靶向碱基编辑也可用于治疗宿主中的病毒感染。另外,可使用编码病毒受体的基因的靶向切割来阻断此类受体的表达,从而在宿主生物体中防止病毒感染和/或病毒传播。编码病毒受体(如,HIV的CCR5和CXCR4受体)的基因的定向诱变可用于使受体无法结合病毒,从而防止新的感染并阻断现有感染的传播。参见美国专利公开号2008/015996。可靶向的病毒或病毒受体的非限制性实例包括单纯疱疹病毒(HSV)如HSV-1和HSV-2,水痘带状疱疹病毒(VZV),爱泼斯坦-巴尔病毒(EBV)和巨细胞病毒(CMV),HHV6和HHV7。肝炎病毒家族包括甲型肝炎病毒(HAV),乙型肝炎病毒(HBV),丙型肝炎病毒(HCV),丁型肝炎病毒(HDV),戊型肝炎病毒(HEV)和庚型肝炎病毒(HGV)。还可靶向其他病毒或它们的受体,包括但不限于小RNA病毒科(Picornaviridae)(如,脊髓灰质炎病毒等);杯状病毒科;披膜病毒科(如,风疹病毒,登革热病毒等);黄病毒科;冠状病毒科;呼肠孤病毒科双RNA病毒科(Birnaviridae);弹状病毒科(如,狂犬病毒等);丝状病毒科;副粘病毒科(如,腮腺炎病毒,麻疹病毒,呼吸道合胞病毒等);正粘病毒科(如,甲、乙、丙型流感病毒等);布尼亚病毒科;沙粒病毒科;逆转录病毒科;慢病毒(如,HTLV-I;HTLV-II;HIV-1(又被称为HTLV-III,LAV,ARV,hTLR等)HIV-II);猿猴免疫缺陷病毒(SIV),人类乳突病毒(HPV),流感病毒以及蜱传脑炎病毒。参见,例如Virology,第3版(W.K.Joklik编,1988);Fundamental Virology,第二版(B.N.Fields和D.M.Knipe编,1991年),描述了这些病毒和其他病毒。例如,HIV的受体包括CCR-5和CXCR-4。如上所述,本文所述组合物和方法可用于基因修饰、基因校正和基因破坏。
本文所述组合物和方法还可应用于基于干细胞的疗法,包括但不限于导致以下结果的编辑:体细胞突变的校正;显性阴性等位基因的破坏;病原体进入或有效感染细胞所需基因的破坏;增强组织工程,如通过编辑基因活性来促进功能组织的分化或形成;和/或破坏基因活性以促进功能组织的分化或形成;阻断或诱导分化,如通过编辑阻断分化的基因来促进干细胞向特定谱系途径分化,该程序的细胞类型包括但不限于T细胞、B细胞、造血干细胞和胚胎干细胞。此外,可使用同样从患者自身的体细胞中产生的诱导多能干细胞(iPSC)。因此,这些干细胞或其衍生物(分化的细胞类型或组织)可潜在地植入任何人,而不论其来源或组织相容性如何。
所述组合物和方法也可用于体细胞治疗,从而允许产生经修饰以增强其生物学特性的库存细胞。可将此类细胞输注入各种患者中,而与细胞的供体来源及其与受体的组织相容性无关。
除了治疗应用之外,本文所述的DNA编辑复合物可用于作物工程、细胞系工程和疾病模型的构建。专性异二聚体切割半结构域提供了改善核酸酶特性的直接方法。
所述工程化DNA编辑复合物也可用于需要立即在多个靶标处同时裂解的基因修饰方案中。在两个靶标处的编辑需要两个DNA编辑复合物的细胞表达,并且优选地使用包括切割结构域的切口酶来实现,其中每个复合物的切割结构域不与另一个复合物的切割结构域相互作用(二聚化)。
实施例
实施例1:制备ZFP
设计靶向特定靶位点的ZFP并将其掺入质粒载体中,基本上如Urnov,et al.(2005)Nature 435(7042):646-651,Perez,et al.(2008)Nature Biotechnology 26(7):808-816,以及国际专利公开号WO 2016/183298和WO 2017/106528中所述。还开发了针对特定位点的TALE和sgRNA,如美国专利号8,586,526和9,873,894中所述。
用于碱基编辑的一个示例性靶标是SERPINA基因座,其编码α-1抗胰蛋白酶(A1AT)。导致A1AT蛋白中常染色体隐性遗传缺陷的基因座中的突变与肝病和肺病两者都有关系。PiZ突变是北欧人中最常见的缺陷等位基因之一,导致仅产生约10-20%的A1AT蛋白。这种突变是由外显子5中的单个突变引起的,导致氨基酸位置342处的赖氨酸被谷氨酰胺取代,其中DNA中位置1096处的G在突变基因序列中为A(综述见Fregonese and Stolk(2008)Orphanet J Rare Dis 3:16)。
另一个示例性靶标是JAK2 V617F突变。编辑V617F以形成另一个突变可能会导致JAK2的激活降低。例如,已显示V617L、V617P和V617S突变比V617F激活程度更低(Dusa,etal.(2008)J Biol Chem 283(19):12941-12948)。
因此,制备了几种锌指蛋白(ZFP),其靶向A1AT突变附近的区域(参见图2)。ZFP的设计如下表1A(A1AT)和表1B(JAK2)中所示。
Figure BDA0003020316560000801
Figure BDA0003020316560000811
使用标准方案构建包括几种不同组合的碱基编辑器。不同组合包括下述编辑器,其包含一种或多种脱氨酶、解旋酶、选定的DNA结合结构域(ZFP、TALE、sgRNA)、dCas、切口酶(ZFN、TALEN、CRISPR/Cas)复合物、UGI、GAM等。组合包括下述复合物,其包含顺序融合的选定的结构域,或者其中组合以单独的融合蛋白提供。结构域之间使用任意接头。
将组合组装成表达构建体,用于转染至细胞或用于体外产生mRNA。然后可通过本领域已知的方法(如,电穿孔)将这些mRNA引入细胞。将无靶向突变的细胞用作对照。
实施例2:腺嘌呤碱基编辑器
使用具有放宽PAM需求的Cas9变体(SpCas9VRVRFRR_D10A;Nishimasu,et al.(2018)Science 361:1259-1262或xCas9,参见Hu,et al.(2018)Nature 556:57-63)构建腺嘌呤碱基编辑器,该Cas9变体连接至靶向分子C末端侧的突变的A1AT PiZ突变的ZFP DNA结合结构域。将设计为与相邻DNA区域结合的一系列ZFP DNA结合结构域(参见实施例1)掺入碱基编辑器(参见图2和7)。使用含有3个HA肽和2个核酸酶定位序列(NLS)的接头将ZFP附接至Cas9。接头的序列为:GTGGPKKKRKVYPYDVPDYAGYPYDVPDYAGSYPYDVPDYAGSAAPAAKKKKLDFESE(SEQ ID NO:3)(参见Bolukbasi,et al.(2015)Nat Methods 12(12):1150-1156)。然后将Cas9在N末端侧连接至两个大肠杆菌TadA腺嘌呤脱氨酶(“ecTadA”;Kim,et al.(2006)Biochemistry 45:6407-6416)。在该构建体中,TadA蛋白之一是野生型蛋白,而另一种是进化版本(Gaudelli,et al.(2017)Nature 551:464)。在Cas9和TadA亚基之间两次使用富含丝氨酸-甘氨酸的接头,其包含序列:SGGSSGGSSGSETPGTSESATPESSGGSSGGS(SEQ ID NO:2)。腺嘌呤碱基编辑器(ABE)的示意图显示于图3A。在某些情况下,使用其他类型的腺嘌呤脱氨酶。例如,在一些构建体中,使用ABE7.10脱氨酶或ABEmax腺嘌呤脱氨酶(Koblan,et al.(2018)Nat Biotechnol.36(9):843-846)。
为了靶向JAK2 V617F突变,使用位于突变位点上游的TAA或AAT或AAA PAM位点制备靶向突变位点附近的JAK2基因的Cas9NG腺嘌呤碱基编辑器(参见图7A至7C)。如上所述,将ZFP DNA结合结构域融合至碱基编辑器,并用于编辑HSC/PC。ZFP序列显示在表1B中。指之间和/或ZFP与碱基编辑器之间可使用任何接头。
结果显示在靶基因座处成功编辑。图7A显示导致氨基酸序列改变成丝氨酸(S)或脯氨酸(P)的碱基编辑。已显示这两种变体均比苯丙氨酸突变体(F)激活程度更低(参见Dusa,et al.(2008)J Biol Chem 283(19):12941-8)。
用含有碱基编辑器的表达载体(如,质粒或病毒载体)转染细胞(如,K562细胞),或使用如上所述的编码碱基编辑器的mRNA电穿孔细胞。收获转染的细胞并分离基因组DNA。根据本领域的标准方法,通过PCR扩增来扩增感兴趣的在靶和脱靶基因组区域。对序列进行碱基编辑和插入缺失存在的评估。
如上所述,在K562细胞上对A1AT基因座测试了腺嘌呤碱基编辑器(ABE),其中每200,000个细胞使用800ng编码碱基编辑器的质粒DNA。在没有Z的K562细胞中也进行了实验,并且将接近致病突变的A核苷酸用作测量活性的代用品(proxy)。使用Amaxa装置(根据制造商的方案)转染后72小时,收获细胞并进行Miseq分析(Illumina),以分析可能发生的任何编辑。图4说明可能在该复合物的编辑窗口内靶向的A碱基,其中在这些位置存在G表明已发生了基于A的编辑。
测试了包含变体ZFP结构域的各个构建体的三个不同克隆。结果显示在以下表2中(请注意,术语“Cas9VRVRFRR”,“Cas9VR”和“Cas9NG”可互换使用):
表2:A1AT基因座处的腺嘌呤碱基编辑
Figure BDA0003020316560000831
Figure BDA0003020316560000841
标记为“sgRNA_only”的行是仅包含引导RNA的那些,“ABE_Cas9VR_D10A”是缺乏ZFP DNA结合结构域的复合物。从数据可看出,与缺乏ZFP结构域的编辑复合物相比,在一些ZFP DNA结合结构域的存在下,位置A5处的腺嘌呤的靶向编辑增加了。无ZFP的天然ABE-Cas9融合构建体导致约0.5%的碱基编辑,而ABE-Cas9-ZFP融合构建体在该数据集中显示至少7倍更高的碱基编辑效率。
在这些实验中,使用连接至ABEmax或ABE7.10腺嘌呤脱氨酶的xCas或Cas9NG蛋白进行研究。使用的引导RNA是TGT PAM或AGT PAM。结果显示,与缺乏ZFP DNA结合结构域(ZFP锚)的碱基编辑器相比,碱基编辑效率为5至10倍或更高。
使用腺嘌呤脱氨基酶的替代形式进行了进一步的实验,包括使用ABE 7.9和ABE7.8,并显示类似的结果。
对于JAK2 V617F突变体的碱基编辑,实验条件与以上所述相同,包括在无V617F突变的K562细胞中进行的实验,但是将紧邻致病突变的A核苷酸用作测量活性的代用品。靶定PAM序列在图7B中示出。使用连接至ABEmax的xCas或Cas9NG蛋白的各种组合进行研究(参见,如图3B)。
结果显示,ZFP锚的存在改善了编辑并放宽了PAM需求,包括在AAT和TAA PAM序列处显示活性。值得注意的是,具有TAA PAM序列的碱基编辑器在无ZFP结构域的情况下在此位点是失活的。参见,例如图7C中所示的示例性结果。
对其他疾病相关点突变进行另外的实验,并且在ZFP锚结构域的存在下实现更高的碱基编辑特异性和/或活性。此外,取决于待编辑的靶碱基,可使用任何PAM序列,包括但不限于NAN(如,TAA)、AAT、NGG(TGG)、NGT(如,TGT或AGT)。
实施例3:胞苷碱基编辑器
使用载脂蛋白B mRNA编辑酶,催化多肽样(APOBEC)蛋白构建将C核苷酸转化为U的胞苷碱基编辑器(Yang,et al.(2017)J Genet Genomics 44(9):423-437)。具体地,使用胞苷脱氨酶如载脂蛋白B mRNA编辑酶,催化多肽1或APOBEC-1来制备胞苷碱基编辑器。由AICDA基因编码的激活诱导性胞苷脱氨酶,又被称为AICDA和AID,也可包括在本文所述的胞苷脱氨酶碱基编辑器中。
认为对U:G异源双链DNA的细胞修复响应引起尿嘧啶DNA糖基化酶(UDG)的活性,该尿嘧啶DNA糖基化酶催化从DNA去除U并利用将U:G对回复至C:G对来启动碱基切除修复,从而降低碱基编辑的效率。因此,胞苷碱基编辑器可具有融合至编辑器的尿嘧啶糖基化酶抑制剂(UGI),以阻断内源性UDG活性(Komor,et al.(2016)Nature 533(7603):420-424)。使用连接至APOBEC1或B细胞特异性活化诱导的胞苷脱氨酶(AID)酶的ZFP DNA结合结构域构建胞苷碱基编辑器(Kescu and Adli(2016)Nat Methods 13(12):983)。将胞苷碱基编辑器附接至DNA结合结构域,如ZFP。
在一些实施方案中,编辑器还包含UGI二聚体(参见,图5A至5F)。使用诸如L0(LRGS,SEQ ID NO:76)或N7a(SGTPHEVGVYTL,SEQ ID NO:28,参见美国专利公开号2017/0218349)的接头将UGI二聚体附接至ZFP DNA结合结构域。AID或APOBEC1通过接头如L0或诸如SGGGLGST(SEQ ID NO:29,Yang et al.,(2016)Nat Commun DOI:10.1038/ncomms13330)的序列附接至ZFP。
还构建了无UGI结构域的胞苷碱基编辑器。一些编辑器被构建为可成对使用,其中一个配偶体包含连接至ZFP的胞苷编辑器,该ZFP与无催化活性的FokI切口酶结构域连接。第二配偶体包含活性Fok结构域,使得两个Fok半结构域可配对并作用以形成切口。胞苷编辑器结构域可位于UGI二聚体组装体的任一半。
实施例4:其他碱基编辑器
构建并测试了其他ABE和/或CBE。
特别地,使用包含以下的腺嘌呤碱基编辑器进行实验:(1)Cas9切口酶,其任选可操作地连接至ZFP锚;和(2)ZFP,其可操作地连接至ABE结构域(如,进化的ABE结构域)。参见,例如,图1B,下部中间图。
结果表明,这些碱基编辑器在疾病相关突变的靶向编辑中是有效的。
此外,用包含以下的ABE碱基编辑器进行实验:(1)dCas9蛋白,其可操作地连接至单个引导RNA,任选地可操作地连接至ZFP锚;(2)ZFP,其可操作地连接至ABE结构域(如,进化的ABE结构域);和(3)ZFN切口酶。参见,例如图1C。
结果显示,与dCas9碱基编辑器相比,包括ZFN切口酶的碱基编辑器提高了碱基编辑效率。
实施例5:无Cas9的碱基编辑器
还构建和评估了无Cas9的碱基编辑器。如上所述,使用包括具有两个TadA结构域的碱基编辑器的构建体,任选地,其中一个是野生型,一个是进化的,并且这些可连接至ZFPDNA结合结构域。该组装体单独使用,或者可连接至无催化活性的FokI切口酶结构域。当与包含活性FokI结构域的另一载体结合使用时,腺嘌呤碱基编辑器具有切口活性以防止碱基编辑的校正。制备的其他非Cas碱基编辑器如图1D中所示。
上文还构建和测试了包含DNA去稳定或解链因子的非Cas碱基编辑器。DNA去稳定因子与ZFP和/或ZFN切口酶的N或C末端融合(参见图1D),或独立于ZFP和/或切口酶引入。
特别地,生成图1D中所示的碱基编辑器。这些碱基编辑器包括ZFP脱氨酶融合蛋白和ZFN切口酶。此外,这些编辑器包括DNA去稳定因子,任选地通过其3’端或5’端与ZFN切口酶的ZFP连接。
特别地,构建包括以下的碱基编辑器:如表A中所示的一个或多个蛋白DNA去稳定因子(如,解旋酶;DSB修复期间参与D环形成的因子(如,Rad51、Rad52、RPA1、RPA2、RPA3等);和/或螺旋去稳定蛋白(如,ICP8、Puralpha或小牛胸腺DNA螺旋去稳定蛋白),具有或不具有一个或多个CRISPR蛋白(如,Cas9蛋白))。
可选择地或除DNA去稳定蛋白外,构建碱基编辑器,其包括一个或多个肽核酸(PNA);锁核酸(LNA)和/或桥连核酸(BNA)。特别地,构建并测试包含一个或多个核苷酸的碱基编辑器。如本文所述构建包含PNA和/或LNA的碱基编辑器(同样参见,图1D和图8)。
结果显示,无Cas9的碱基编辑器编辑它们的靶位点。
本文提及的所有专利、专利申请和出版物均通过引用全文并入本文。
尽管出于清楚理解的目的,以说明和示例的方式详细地提供了本公开,但是对于本领域技术人员显而易见的是,在不脱离本公开的精神或范围的情况下可实践各种改变和修改。因此,前述说明书和实施例不应解释为限制性的。
序列表
<110> 桑格摩生物治疗股份有限公司
<120> 工程化靶特异性碱基编辑器
<130> 8325-0180/S180-PCT
<140>
<141>
<150> 62/867,565
<151> 2019-06-27
<150> 62/817,153
<151> 2019-03-12
<150> 62/753,696
<151> 2018-10-31
<150> 62/721,903
<151> 2018-08-23
<160> 92
<170> PatentIn version 3.5
<210> 1
<211> 49
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<220>
<221> 修饰的碱基
<222> (1)..(15)
<223> a, c, t, g, 未知或其他
<220>
<221> 修饰的碱基
<222> (21)..(49)
<223> a, c, t, g, 未知或其他
<400> 1
nnnnnnnnnn nnnnntctct nnnnnnnnnn nnnnnnnnnn nnnnnnnnn 49
<210> 2
<211> 32
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成的多肽
<400> 2
Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr
1 5 10 15
Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser
20 25 30
<210> 3
<211> 58
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成的多肽
<400> 3
Gly Thr Gly Gly Pro Lys Lys Lys Arg Lys Val Tyr Pro Tyr Asp Val
1 5 10 15
Pro Asp Tyr Ala Gly Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Gly Ser
20 25 30
Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Gly Ser Ala Ala Pro Ala Ala
35 40 45
Lys Lys Lys Lys Leu Asp Phe Glu Ser Glu
50 55
<210> 4
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 4
gtgctgacca tcgacgagaa agggactgaa gct 33
<210> 5
<211> 579
<212> PRT
<213> 未知
<220>
<223> 未知的描述:FokI多肽
<400> 5
Met Val Ser Lys Ile Arg Thr Phe Gly Trp Val Gln Asn Pro Gly Lys
1 5 10 15
Phe Glu Asn Leu Lys Arg Val Val Gln Val Phe Asp Arg Asn Ser Lys
20 25 30
Val His Asn Glu Val Lys Asn Ile Lys Ile Pro Thr Leu Val Lys Glu
35 40 45
Ser Lys Ile Gln Lys Glu Leu Val Ala Ile Met Asn Gln His Asp Leu
50 55 60
Ile Tyr Thr Tyr Lys Glu Leu Val Gly Thr Gly Thr Ser Ile Arg Ser
65 70 75 80
Glu Ala Pro Cys Asp Ala Ile Ile Gln Ala Thr Ile Ala Asp Gln Gly
85 90 95
Asn Lys Lys Gly Tyr Ile Asp Asn Trp Ser Ser Asp Gly Phe Leu Arg
100 105 110
Trp Ala His Ala Leu Gly Phe Ile Glu Tyr Ile Asn Lys Ser Asp Ser
115 120 125
Phe Val Ile Thr Asp Val Gly Leu Ala Tyr Ser Lys Ser Ala Asp Gly
130 135 140
Ser Ala Ile Glu Lys Glu Ile Leu Ile Glu Ala Ile Ser Ser Tyr Pro
145 150 155 160
Pro Ala Ile Arg Ile Leu Thr Leu Leu Glu Asp Gly Gln His Leu Thr
165 170 175
Lys Phe Asp Leu Gly Lys Asn Leu Gly Phe Ser Gly Glu Ser Gly Phe
180 185 190
Thr Ser Leu Pro Glu Gly Ile Leu Leu Asp Thr Leu Ala Asn Ala Met
195 200 205
Pro Lys Asp Lys Gly Glu Ile Arg Asn Asn Trp Glu Gly Ser Ser Asp
210 215 220
Lys Tyr Ala Arg Met Ile Gly Gly Trp Leu Asp Lys Leu Gly Leu Val
225 230 235 240
Lys Gln Gly Lys Lys Glu Phe Ile Ile Pro Thr Leu Gly Lys Pro Asp
245 250 255
Asn Lys Glu Phe Ile Ser His Ala Phe Lys Ile Thr Gly Glu Gly Leu
260 265 270
Lys Val Leu Arg Arg Ala Lys Gly Ser Thr Lys Phe Thr Arg Val Pro
275 280 285
Lys Arg Val Tyr Trp Glu Met Leu Ala Thr Asn Leu Thr Asp Lys Glu
290 295 300
Tyr Val Arg Thr Arg Arg Ala Leu Ile Leu Glu Ile Leu Ile Lys Ala
305 310 315 320
Gly Ser Leu Lys Ile Glu Gln Ile Gln Asp Asn Leu Lys Lys Leu Gly
325 330 335
Phe Asp Glu Val Ile Glu Thr Ile Glu Asn Asp Ile Lys Gly Leu Ile
340 345 350
Asn Thr Gly Ile Phe Ile Glu Ile Lys Gly Arg Phe Tyr Gln Leu Lys
355 360 365
Asp His Ile Leu Gln Phe Val Ile Pro Asn Arg Gly Val Thr Lys Gln
370 375 380
Leu Val Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu Arg His Lys
385 390 395 400
Leu Lys Tyr Val Pro His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg
405 410 415
Asn Ser Thr Gln Asp Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe
420 425 430
Met Lys Val Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly Ser Arg Lys
435 440 445
Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val
450 455 460
Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly
465 470 475 480
Gln Ala Asp Glu Met Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn
485 490 495
Lys His Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val
500 505 510
Thr Glu Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr
515 520 525
Lys Ala Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala
530 535 540
Val Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala
545 550 555 560
Gly Thr Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu
565 570 575
Ile Asn Phe
<210> 6
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 6
atgtttttag aggccatacc catgtcta 28
<210> 7
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 7
gccatgtttt tagaggccat acccatgt 28
<210> 8
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 8
gggccatgtt tttagaggcc atacccat 28
<210> 9
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 9
ggggccatgt ttttagaggc cataccca 28
<210> 10
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 10
ctggggccat gtttttagag gccatacc 28
<210> 11
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成的肽
<400> 11
Thr Gln Ala Thr Leu Gly Val
1 5
<210> 12
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成的肽
<400> 12
Asp Arg Ser His Leu Ala Arg
1 5
<210> 13
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成的肽
<400> 13
Gln Ser Ala His Arg Lys Asn
1 5
<210> 14
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成的肽
<400> 14
Ser Thr Ala Ala Leu Ser Tyr
1 5
<210> 15
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成的肽
<400> 15
Thr Ser Gly Ser Leu Thr Arg
1 5
<210> 16
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成的肽
<400> 16
Ser Asn Gln Asn Leu Thr Thr
1 5
<210> 17
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成的肽
<400> 17
Thr Ser Gly Ser Leu Ser Arg
1 5
<210> 18
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成的肽
<400> 18
His Ser Ala Thr Leu Lys Tyr
1 5
<210> 19
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成的肽
<400> 19
Gln Asn Ala His Arg Lys Thr
1 5
<210> 20
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成的肽
<400> 20
Thr Ser Ser Asn Arg Ala Val
1 5
<210> 21
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成的肽
<400> 21
Arg Ser Asp Ala Leu Ser Thr
1 5
<210> 22
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成的肽
<400> 22
Asp Arg Ser Thr Arg Thr Lys
1 5
<210> 23
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成的肽
<400> 23
Asp Ser Ser His Arg Thr Arg
1 5
<210> 24
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成的肽
<400> 24
Asp Arg Ser Asp Leu Ser Arg
1 5
<210> 25
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成的肽
<400> 25
Arg Ser Thr His Leu Val Arg
1 5
<210> 26
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成的肽
<400> 26
Glu Arg Gly Thr Leu Ala Arg
1 5
<210> 27
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成的肽
<400> 27
Arg Ser Asp His Leu Ser Arg
1 5
<210> 28
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成的肽
<400> 28
Ser Gly Thr Pro His Glu Val Gly Val Tyr Thr Leu
1 5 10
<210> 29
<211> 8
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成的肽
<400> 29
Ser Gly Gly Gly Leu Gly Ser Thr
1 5
<210> 30
<211> 9
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 30
tgtgtctgt 9
<210> 31
<211> 9
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 31
tgtttctgt 9
<210> 32
<211> 9
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 32
tgttcctgt 9
<210> 33
<211> 9
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 33
tgtccctgt 9
<210> 34
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 34
tttaaattat ggagtatgtt tctgtgga 28
<210> 35
<211> 320
<212> PRT
<213> Bos sp.
<400> 35
Met Ser Lys Ser Glu Ser Pro Lys Glu Pro Glu Gln Leu Arg Lys Leu
1 5 10 15
Phe Ile Gly Gly Leu Ser Phe Glu Thr Thr Asp Glu Ser Leu Arg Ser
20 25 30
His Phe Glu Gln Trp Gly Thr Leu Thr Asp Cys Val Val Met Arg Asp
35 40 45
Pro Asn Thr Lys Arg Ser Arg Gly Phe Gly Phe Val Thr Tyr Ala Thr
50 55 60
Val Glu Glu Val Asp Ala Ala Met Asn Ala Arg Pro His Lys Val Asp
65 70 75 80
Gly Arg Val Val Glu Pro Lys Arg Ala Val Ser Arg Glu Asp Ser Gln
85 90 95
Arg Pro Gly Ala His Leu Thr Val Lys Lys Ile Phe Val Gly Gly Ile
100 105 110
Lys Glu Asp Thr Glu Glu His His Leu Arg Asp Tyr Phe Glu Gln Tyr
115 120 125
Gly Lys Ile Glu Val Ile Glu Ile Met Thr Asp Arg Gly Ser Gly Lys
130 135 140
Lys Arg Gly Phe Ala Phe Val Thr Phe Asp Asp His Asp Ser Val Asp
145 150 155 160
Lys Ile Val Ile Gln Lys Tyr His Thr Val Asn Gly His Asn Cys Glu
165 170 175
Val Arg Lys Ala Leu Ser Lys Gln Glu Met Ala Ser Ala Ser Ser Ser
180 185 190
Gln Arg Gly Arg Ser Gly Ser Gly Asn Phe Gly Gly Gly Arg Gly Gly
195 200 205
Gly Phe Gly Gly Asn Asp Asn Phe Gly Arg Gly Gly Asn Phe Ser Gly
210 215 220
Arg Gly Gly Phe Gly Gly Ser Arg Gly Gly Gly Gly Tyr Gly Gly Ser
225 230 235 240
Gly Asp Gly Tyr Asn Gly Phe Gly Asn Asp Gly Ser Asn Phe Gly Gly
245 250 255
Gly Gly Ser Tyr Asn Asp Phe Gly Asn Tyr Asn Asn Gln Ser Ser Asn
260 265 270
Phe Gly Pro Met Lys Gly Gly Asn Phe Gly Gly Arg Ser Ser Gly Pro
275 280 285
Tyr Gly Gly Gly Gly Gln Tyr Phe Ala Lys Pro Arg Asn Gln Gly Gly
290 295 300
Tyr Gly Gly Ser Ser Ser Ser Ser Ser Tyr Gly Ser Gly Arg Arg Phe
305 310 315 320
<210> 36
<211> 587
<212> PRT
<213> 未知
<220>
<223> 未知的描述:
BPT4序列
<400> 36
Met Asp Ile Lys Val His Phe His Asp Phe Ser His Val Arg Ile Asp
1 5 10 15
Cys Glu Glu Ser Thr Phe His Glu Leu Arg Asp Phe Phe Ser Phe Glu
20 25 30
Ala Asp Gly Tyr Arg Phe Asn Pro Arg Phe Arg Tyr Gly Asn Trp Asp
35 40 45
Gly Arg Ile Arg Leu Leu Asp Tyr Asn Arg Leu Leu Pro Phe Gly Leu
50 55 60
Val Gly Gln Ile Lys Lys Phe Cys Asp Asn Phe Gly Tyr Lys Ala Trp
65 70 75 80
Ile Asp Pro Gln Ile Asn Glu Lys Glu Glu Leu Ser Arg Lys Asp Phe
85 90 95
Asp Glu Trp Leu Ser Lys Leu Glu Ile Tyr Ser Gly Asn Lys Arg Ile
100 105 110
Glu Pro His Trp Tyr Gln Lys Asp Ala Val Phe Glu Gly Leu Val Asn
115 120 125
Arg Arg Arg Ile Leu Asn Leu Pro Thr Ser Ala Gly Lys Ser Leu Ile
130 135 140
Gln Ala Leu Leu Ala Arg Tyr Tyr Leu Glu Asn Tyr Glu Gly Lys Ile
145 150 155 160
Leu Ile Ile Val Pro Thr Thr Ala Leu Thr Thr Gln Met Ala Asp Asp
165 170 175
Phe Val Asp Tyr Arg Leu Phe Ser His Ala Met Ile Lys Lys Ile Gly
180 185 190
Gly Gly Ala Ser Lys Asp Asp Lys Tyr Lys Asn Asp Ala Pro Val Val
195 200 205
Val Gly Thr Trp Gln Thr Val Val Lys Gln Pro Lys Glu Trp Phe Ser
210 215 220
Gln Phe Gly Met Met Met Asn Asp Glu Cys His Leu Ala Thr Gly Lys
225 230 235 240
Ser Ile Ser Ser Ile Ile Ser Gly Leu Asn Asn Cys Met Phe Lys Phe
245 250 255
Gly Leu Ser Gly Ser Leu Arg Asp Gly Lys Ala Asn Ile Met Gln Tyr
260 265 270
Val Gly Met Phe Gly Glu Ile Phe Lys Pro Val Thr Thr Ser Lys Leu
275 280 285
Met Glu Asp Gly Gln Val Thr Glu Leu Lys Ile Asn Ser Ile Phe Leu
290 295 300
Arg Tyr Pro Asp Glu Phe Thr Thr Lys Leu Lys Gly Lys Thr Tyr Gln
305 310 315 320
Glu Glu Ile Lys Ile Ile Thr Gly Leu Ser Lys Arg Asn Lys Trp Ile
325 330 335
Ala Lys Leu Ala Ile Lys Leu Ala Gln Lys Asp Glu Asn Ala Phe Val
340 345 350
Met Phe Lys His Val Ser His Gly Lys Ala Ile Phe Asp Leu Ile Lys
355 360 365
Asn Glu Tyr Asp Lys Val Tyr Tyr Val Ser Gly Glu Val Asp Thr Glu
370 375 380
Thr Arg Asn Ile Met Lys Thr Leu Ala Glu Asn Gly Lys Gly Ile Ile
385 390 395 400
Ile Val Ala Ser Tyr Gly Val Phe Ser Thr Gly Ile Ser Val Lys Asn
405 410 415
Leu His His Val Val Leu Ala His Gly Val Lys Ser Lys Ile Ile Val
420 425 430
Leu Gln Thr Ile Gly Arg Val Leu Arg Lys His Gly Ser Lys Thr Ile
435 440 445
Ala Thr Val Trp Asp Leu Ile Asp Ser Ala Gly Val Lys Pro Lys Ser
450 455 460
Ala Asn Thr Lys Lys Lys Tyr Val His Leu Asn Tyr Leu Leu Lys His
465 470 475 480
Gly Ile Asp Arg Ile Gln Arg Tyr Ala Asp Glu Lys Phe Asn Tyr Val
485 490 495
Met Lys Thr Val Asn Leu Ile Ser Phe Gly Pro Leu Glu Lys Lys Met
500 505 510
Leu Leu Glu Phe Lys Gln Phe Leu Tyr Glu Ala Ser Ile Asp Glu Phe
515 520 525
Met Gly Lys Ile Ala Ser Cys Gln Thr Leu Glu Gly Leu Glu Glu Leu
530 535 540
Glu Ala Tyr Tyr Lys Lys Arg Val Lys Glu Thr Glu Leu Lys Asp Thr
545 550 555 560
Asp Asp Ile Ser Val Arg Asp Ala Leu Ala Gly Lys Arg Ala Glu Leu
565 570 575
Glu Asp Ser Asp Asp Glu Val Glu Glu Ser Phe
580 585
<210> 37
<211> 715
<212> PRT
<213> 耐辐射奇球菌
<400> 37
Met Ser Ala Ala Leu Pro Ala Glu Pro Phe Arg Val Ser Gly Gly Val
1 5 10 15
Asn Lys Val Arg Phe Arg Ser Asp Thr Gly Phe Thr Val Met Ser Ala
20 25 30
Thr Leu Arg Asn Glu Gln Gly Glu Asp Pro Asp Ala Thr Val Ile Gly
35 40 45
Val Met Pro Pro Leu Asp Val Gly Asp Thr Phe Ser Ala Glu Val Leu
50 55 60
Met Glu Glu His Arg Glu Tyr Gly Tyr Gln Tyr Arg Val Val Asn Met
65 70 75 80
Val Leu Glu Ala Met Pro Ala Asp Leu Ser Glu Glu Gly Val Ala Ala
85 90 95
Tyr Phe Glu Ala Arg Val Gly Gly Val Gly Lys Val Leu Ala Gly Arg
100 105 110
Ile Ala Lys Thr Phe Gly Ala Ala Ala Phe Asp Leu Leu Glu Asp Asp
115 120 125
Pro Gln Lys Phe Leu Gln Val Pro Gly Ile Thr Glu Ser Thr Leu His
130 135 140
Lys Met Val Ser Ser Trp Ser Gln Gln Gly Leu Glu Arg Arg Leu Leu
145 150 155 160
Ala Gly Leu Gln Gly Leu Gly Leu Thr Ile Asn Gln Ala Gln Arg Ala
165 170 175
Val Lys His Phe Gly Ala Asp Ala Leu Asp Arg Leu Glu Lys Asp Leu
180 185 190
Phe Thr Leu Thr Glu Val Glu Gly Ile Gly Phe Leu Thr Ala Asp Lys
195 200 205
Leu Trp Gln Ala Arg Gly Gly Ala Leu Asp Asp Pro Arg Arg Leu Thr
210 215 220
Ala Ala Ala Val Tyr Ala Leu Gln Leu Ala Gly Thr Gln Ala Gly His
225 230 235 240
Ser Phe Leu Pro Arg Ser Arg Ala Glu Lys Gly Val Val His Tyr Thr
245 250 255
Arg Val Thr Pro Gly Gln Ala Arg Leu Ala Val Glu Thr Ala Val Glu
260 265 270
Leu Gly Arg Leu Ser Glu Asp Asp Ser Pro Leu Phe Ala Ala Glu Ala
275 280 285
Ala Ala Thr Gly Glu Gly Arg Ile Tyr Leu Pro His Val Leu Arg Ala
290 295 300
Glu Lys Lys Leu Ala Ser Leu Ile Arg Thr Leu Leu Ala Thr Pro Pro
305 310 315 320
Ala Asp Gly Ala Gly Asn Asp Asp Trp Ala Val Pro Lys Lys Ala Arg
325 330 335
Lys Gly Leu Ser Glu Glu Gln Ala Ser Val Leu Asp Gln Leu Ala Gly
340 345 350
His Arg Leu Val Val Leu Thr Gly Gly Pro Gly Thr Gly Lys Ser Thr
355 360 365
Thr Thr Lys Ala Val Ala Asp Leu Ala Glu Ser Leu Gly Leu Glu Val
370 375 380
Gly Leu Cys Ala Pro Thr Gly Lys Ala Ala Arg Arg Leu Gly Glu Val
385 390 395 400
Thr Gly Arg Thr Ala Ser Thr Val His Arg Leu Leu Gly Tyr Gly Pro
405 410 415
Gln Gly Phe Arg His Asn His Leu Glu Pro Ala Pro Tyr Asp Leu Leu
420 425 430
Ile Val Asp Glu Val Ser Met Met Gly Asp Ala Leu Met Leu Ser Leu
435 440 445
Leu Ala Ala Val Pro Pro Gly Ala Arg Val Leu Leu Val Gly Asp Thr
450 455 460
Asp Gln Leu Pro Pro Val Asp Ala Gly Leu Pro Leu Leu Ala Leu Ala
465 470 475 480
Gln Ala Ala Pro Thr Ile Lys Leu Thr Gln Val Tyr Arg Gln Ala Ala
485 490 495
Lys Asn Pro Ile Ile Gln Ala Ala His Gly Leu Leu His Gly Glu Ala
500 505 510
Pro Ala Trp Gly Asp Lys Arg Leu Asn Leu Thr Glu Ile Glu Pro Asp
515 520 525
Gly Gly Ala Arg Arg Val Ala Leu Met Val Arg Glu Leu Gly Gly Pro
530 535 540
Gly Ala Val Gln Val Leu Thr Pro Met Arg Lys Gly Pro Leu Gly Met
545 550 555 560
Asp His Leu Asn Tyr His Leu Gln Ala Leu Phe Asn Pro Gly Glu Gly
565 570 575
Gly Val Arg Ile Ala Glu Gly Glu Ala Arg Pro Gly Asp Thr Val Val
580 585 590
Gln Thr Lys Asn Asp Tyr Asn Asn Glu Ile Phe Asn Gly Thr Leu Gly
595 600 605
Met Val Leu Lys Ala Glu Gly Ala Arg Leu Thr Val Asp Phe Asp Gly
610 615 620
Asn Val Val Glu Leu Thr Gly Ala Glu Leu Phe Asn Leu Gln Leu Gly
625 630 635 640
Tyr Ala Leu Thr Val His Arg Ala Gln Gly Ser Glu Trp Gly Thr Val
645 650 655
Leu Gly Val Leu His Glu Ala His Met Pro Met Leu Ser Arg Asn Leu
660 665 670
Val Tyr Thr Ala Leu Thr Arg Ala Arg Asp Arg Phe Phe Ser Ala Gly
675 680 685
Ser Ala Ser Ala Trp Gln Ile Ala Ala Ala Arg Gln Arg Glu Ala Arg
690 695 700
Asn Thr Ala Leu Leu Glu Arg Ile Arg Ala His
705 710 715
<210> 38
<211> 353
<212> PRT
<213> 大肠杆菌
<400> 38
Met Ala Ile Asp Glu Asn Lys Gln Lys Ala Leu Ala Ala Ala Leu Gly
1 5 10 15
Gln Ile Glu Lys Gln Phe Gly Lys Gly Ser Ile Met Arg Leu Gly Glu
20 25 30
Asp Arg Ser Met Asp Val Glu Thr Ile Ser Thr Gly Ser Leu Ser Leu
35 40 45
Asp Ile Ala Leu Gly Ala Gly Gly Leu Pro Met Gly Arg Ile Val Glu
50 55 60
Ile Tyr Gly Pro Glu Ser Ser Gly Lys Thr Thr Leu Thr Leu Gln Val
65 70 75 80
Ile Ala Ala Ala Gln Arg Glu Gly Lys Thr Cys Ala Phe Ile Asp Ala
85 90 95
Glu His Ala Leu Asp Pro Ile Tyr Ala Arg Lys Leu Gly Val Asp Ile
100 105 110
Asp Asn Leu Leu Cys Ser Gln Pro Asp Thr Gly Glu Gln Ala Leu Glu
115 120 125
Ile Cys Asp Ala Leu Ala Arg Ser Gly Ala Val Asp Val Ile Val Val
130 135 140
Asp Ser Val Ala Ala Leu Thr Pro Lys Ala Glu Ile Glu Gly Glu Ile
145 150 155 160
Gly Asp Ser His Met Gly Leu Ala Ala Arg Met Met Ser Gln Ala Met
165 170 175
Arg Lys Leu Ala Gly Asn Leu Lys Gln Ser Asn Thr Leu Leu Ile Phe
180 185 190
Ile Asn Gln Ile Arg Met Lys Ile Gly Val Met Phe Gly Asn Pro Glu
195 200 205
Thr Thr Thr Gly Gly Asn Ala Leu Lys Phe Tyr Ala Ser Val Arg Leu
210 215 220
Asp Ile Arg Arg Ile Gly Ala Val Lys Glu Gly Glu Asn Val Val Gly
225 230 235 240
Ser Glu Thr Arg Val Lys Val Val Lys Asn Lys Ile Ala Ala Pro Phe
245 250 255
Lys Gln Ala Glu Phe Gln Ile Leu Tyr Gly Glu Gly Ile Asn Phe Tyr
260 265 270
Gly Glu Leu Val Asp Leu Gly Val Lys Glu Lys Leu Ile Glu Lys Ala
275 280 285
Gly Ala Trp Tyr Ser Tyr Lys Gly Glu Lys Ile Gly Gln Gly Lys Ala
290 295 300
Asn Ala Thr Ala Trp Leu Lys Asp Asn Pro Glu Thr Ala Lys Glu Ile
305 310 315 320
Glu Lys Lys Val Arg Glu Leu Leu Leu Ser Asn Pro Asn Ser Thr Pro
325 330 335
Asp Phe Ser Val Asp Asp Ser Glu Gly Val Ala Glu Thr Asn Glu Asp
340 345 350
Phe
<210> 39
<211> 1180
<212> PRT
<213> 大肠杆菌
<400> 39
Met Ser Asp Val Ala Glu Thr Leu Asp Pro Leu Arg Leu Pro Leu Gln
1 5 10 15
Gly Glu Arg Leu Ile Glu Ala Ser Ala Gly Thr Gly Lys Thr Phe Thr
20 25 30
Ile Ala Ala Leu Tyr Leu Arg Leu Leu Leu Gly Leu Gly Gly Ser Ala
35 40 45
Ala Phe Pro Arg Pro Leu Thr Val Glu Glu Leu Leu Val Val Thr Phe
50 55 60
Thr Glu Ala Ala Thr Ala Glu Leu Arg Gly Arg Ile Arg Ser Asn Ile
65 70 75 80
His Glu Leu Arg Ile Ala Cys Leu Arg Glu Thr Thr Asp Asn Pro Leu
85 90 95
Tyr Glu Arg Leu Leu Glu Glu Ile Asp Asp Lys Ala Gln Ala Ala Gln
100 105 110
Trp Leu Leu Leu Ala Glu Arg Gln Met Asp Glu Ala Ala Val Phe Thr
115 120 125
Ile His Gly Phe Cys Gln Arg Met Leu Asn Leu Asn Ala Phe Glu Ser
130 135 140
Gly Met Leu Phe Glu Gln Gln Leu Ile Glu Asp Glu Ser Leu Leu Arg
145 150 155 160
Tyr Gln Ala Cys Ala Asp Phe Trp Arg Arg His Cys Tyr Pro Leu Pro
165 170 175
Arg Glu Ile Ala Gln Val Val Phe Glu Thr Trp Lys Gly Pro Gln Ala
180 185 190
Leu Leu Arg Asp Ile Asn Arg Tyr Leu Gln Gly Glu Ala Pro Val Ile
195 200 205
Lys Ala Pro Pro Pro Asp Asp Glu Thr Leu Ala Ser Arg His Ala Gln
210 215 220
Ile Val Ala Arg Ile Asp Thr Val Lys Gln Gln Trp Arg Asp Ala Val
225 230 235 240
Gly Glu Leu Asp Ala Leu Ile Glu Ser Ser Gly Ile Asp Arg Arg Lys
245 250 255
Phe Asn Arg Ser Asn Gln Ala Lys Trp Ile Asp Lys Ile Ser Ala Trp
260 265 270
Ala Glu Glu Glu Thr Asn Ser Tyr Gln Leu Pro Glu Ser Leu Glu Lys
275 280 285
Phe Ser Gln Arg Phe Leu Glu Asp Arg Thr Lys Ala Gly Gly Glu Thr
290 295 300
Pro Arg His Pro Leu Phe Glu Ala Ile Asp Gln Leu Leu Ala Glu Pro
305 310 315 320
Leu Ser Ile Arg Asp Leu Val Ile Thr Arg Ala Leu Ala Glu Ile Arg
325 330 335
Glu Thr Val Ala Arg Glu Lys Arg Arg Arg Gly Glu Leu Gly Phe Asp
340 345 350
Asp Met Leu Ser Arg Leu Asp Ser Ala Leu Arg Ser Glu Ser Gly Glu
355 360 365
Val Leu Ala Ala Ala Ile Arg Thr Arg Phe Pro Val Ala Met Ile Asp
370 375 380
Glu Phe Gln Asp Thr Asp Pro Gln Gln Tyr Arg Ile Phe Arg Arg Ile
385 390 395 400
Trp His His Gln Pro Glu Thr Ala Leu Leu Leu Ile Gly Asp Pro Lys
405 410 415
Gln Ala Ile Tyr Ala Phe Arg Gly Ala Asp Ile Phe Thr Tyr Met Lys
420 425 430
Ala Arg Ser Glu Val His Ala His Tyr Thr Leu Asp Thr Asn Trp Arg
435 440 445
Ser Ala Pro Gly Met Val Asn Ser Val Asn Lys Leu Phe Ser Gln Thr
450 455 460
Asp Asp Ala Phe Met Phe Arg Glu Ile Pro Phe Ile Pro Val Lys Ser
465 470 475 480
Ala Gly Lys Asn Gln Ala Leu Arg Phe Val Phe Lys Gly Glu Thr Gln
485 490 495
Pro Ala Met Lys Met Trp Leu Met Glu Gly Glu Ser Cys Gly Val Gly
500 505 510
Asp Tyr Gln Ser Thr Met Ala Gln Val Cys Ala Ala Gln Ile Arg Asp
515 520 525
Trp Leu Gln Ala Gly Gln Arg Gly Glu Ala Leu Leu Met Asn Gly Asp
530 535 540
Asp Ala Arg Pro Val Arg Ala Ser Asp Ile Ser Val Leu Val Arg Ser
545 550 555 560
Arg Gln Glu Ala Ala Gln Val Arg Asp Ala Leu Thr Leu Leu Glu Ile
565 570 575
Pro Ser Val Tyr Leu Ser Asn Arg Asp Ser Val Phe Glu Thr Leu Glu
580 585 590
Ala Gln Glu Met Leu Trp Leu Leu Gln Ala Val Met Thr Pro Glu Arg
595 600 605
Glu Asn Thr Leu Arg Ser Ala Leu Ala Thr Ser Met Met Gly Leu Asn
610 615 620
Ala Leu Asp Ile Glu Thr Leu Asn Asn Asp Glu His Ala Trp Asp Val
625 630 635 640
Val Val Glu Glu Phe Asp Gly Tyr Arg Gln Ile Trp Arg Lys Arg Gly
645 650 655
Val Met Pro Met Leu Arg Ala Leu Met Ser Ala Arg Asn Ile Ala Glu
660 665 670
Asn Leu Leu Ala Thr Ala Gly Gly Glu Arg Arg Leu Thr Asp Ile Leu
675 680 685
His Ile Ser Glu Leu Leu Gln Glu Ala Gly Thr Gln Leu Glu Ser Glu
690 695 700
His Ala Leu Val Arg Trp Leu Ser Gln His Ile Leu Glu Pro Asp Ser
705 710 715 720
Asn Ala Ser Ser Gln Gln Met Arg Leu Glu Ser Asp Lys His Leu Val
725 730 735
Gln Ile Val Thr Ile His Lys Ser Lys Gly Leu Glu Tyr Pro Leu Val
740 745 750
Trp Leu Pro Phe Ile Thr Asn Phe Arg Val Gln Glu Gln Ala Phe Tyr
755 760 765
His Asp Arg His Ser Phe Glu Ala Val Leu Asp Leu Asn Ala Ala Pro
770 775 780
Glu Ser Val Asp Leu Ala Glu Ala Glu Arg Leu Ala Glu Asp Leu Arg
785 790 795 800
Leu Leu Tyr Val Ala Leu Thr Arg Ser Val Trp His Cys Ser Leu Gly
805 810 815
Val Ala Pro Leu Val Arg Arg Arg Gly Asp Lys Lys Gly Asp Thr Asp
820 825 830
Val His Gln Ser Ala Leu Gly Arg Leu Leu Gln Lys Gly Glu Pro Gln
835 840 845
Asp Ala Ala Gly Leu Arg Thr Cys Ile Glu Ala Leu Cys Asp Asp Asp
850 855 860
Ile Ala Trp Gln Thr Ala Gln Thr Gly Asp Asn Gln Pro Trp Gln Val
865 870 875 880
Asn Asp Val Ser Thr Ala Glu Leu Asn Ala Lys Thr Leu Gln Arg Leu
885 890 895
Pro Gly Asp Asn Trp Arg Val Thr Ser Tyr Ser Gly Leu Gln Gln Arg
900 905 910
Gly His Gly Ile Ala Gln Asp Leu Met Pro Arg Leu Asp Val Asp Ala
915 920 925
Ala Gly Val Ala Ser Val Val Glu Glu Pro Thr Leu Thr Pro His Gln
930 935 940
Phe Pro Arg Gly Ala Ser Pro Gly Thr Phe Leu His Ser Leu Phe Glu
945 950 955 960
Asp Leu Asp Phe Thr Gln Pro Val Asp Pro Asn Trp Val Arg Glu Lys
965 970 975
Leu Glu Leu Gly Gly Phe Glu Ser Gln Trp Glu Pro Val Leu Thr Glu
980 985 990
Trp Ile Thr Ala Val Leu Gln Ala Pro Leu Asn Glu Thr Gly Val Ser
995 1000 1005
Leu Ser Gln Leu Ser Ala Arg Asn Lys Gln Val Glu Met Glu Phe
1010 1015 1020
Tyr Leu Pro Ile Ser Glu Pro Leu Ile Ala Ser Gln Leu Asp Thr
1025 1030 1035
Leu Ile Arg Gln Phe Asp Pro Leu Ser Ala Gly Cys Pro Pro Leu
1040 1045 1050
Glu Phe Met Gln Val Arg Gly Met Leu Lys Gly Phe Ile Asp Leu
1055 1060 1065
Val Phe Arg His Glu Gly Arg Tyr Tyr Leu Leu Asp Tyr Lys Ser
1070 1075 1080
Asn Trp Leu Gly Glu Asp Ser Ser Ala Tyr Thr Gln Gln Ala Met
1085 1090 1095
Ala Ala Ala Met Gln Ala His Arg Tyr Asp Leu Gln Tyr Gln Leu
1100 1105 1110
Tyr Thr Leu Ala Leu His Arg Tyr Leu Arg His Arg Ile Ala Asp
1115 1120 1125
Tyr Asp Tyr Glu His His Phe Gly Gly Val Ile Tyr Leu Phe Leu
1130 1135 1140
Arg Gly Val Asp Lys Glu His Pro Gln Gln Gly Ile Tyr Thr Thr
1145 1150 1155
Arg Pro Asn Ala Gly Leu Ile Ala Leu Met Asp Glu Met Phe Ala
1160 1165 1170
Gly Met Thr Leu Glu Glu Ala
1175 1180
<210> 40
<211> 1122
<212> PRT
<213> 大肠杆菌
<400> 40
Met Leu Arg Val Tyr His Ser Asn Arg Leu Asp Val Leu Glu Ala Leu
1 5 10 15
Met Glu Phe Ile Val Glu Arg Glu Arg Leu Asp Asp Pro Phe Glu Pro
20 25 30
Glu Met Ile Leu Val Gln Ser Thr Gly Met Ala Gln Trp Leu Gln Met
35 40 45
Thr Leu Ser Gln Lys Phe Gly Ile Ala Ala Asn Ile Asp Phe Pro Leu
50 55 60
Pro Ala Ser Phe Ile Trp Asp Met Phe Val Arg Val Leu Pro Glu Ile
65 70 75 80
Pro Lys Glu Ser Ala Phe Asn Lys Gln Ser Met Ser Trp Lys Leu Met
85 90 95
Thr Leu Leu Pro Gln Leu Leu Glu Arg Glu Asp Phe Thr Leu Leu Arg
100 105 110
His Tyr Leu Thr Asp Asp Ser Asp Lys Arg Lys Leu Phe Gln Leu Ser
115 120 125
Ser Lys Ala Ala Asp Leu Phe Asp Gln Tyr Leu Val Tyr Arg Pro Asp
130 135 140
Trp Leu Ala Gln Trp Glu Thr Gly His Leu Val Glu Gly Leu Gly Glu
145 150 155 160
Ala Gln Ala Trp Gln Ala Pro Leu Trp Lys Ala Leu Val Glu Tyr Thr
165 170 175
His Gln Leu Gly Gln Pro Arg Trp His Arg Ala Asn Leu Tyr Gln Arg
180 185 190
Phe Ile Glu Thr Leu Glu Ser Ala Thr Thr Cys Pro Pro Gly Leu Pro
195 200 205
Ser Arg Val Phe Ile Cys Gly Ile Ser Ala Leu Pro Pro Val Tyr Leu
210 215 220
Gln Ala Leu Gln Ala Leu Gly Lys His Ile Glu Ile His Leu Leu Phe
225 230 235 240
Thr Asn Pro Cys Arg Tyr Tyr Trp Gly Asp Ile Lys Asp Pro Ala Tyr
245 250 255
Leu Ala Lys Leu Leu Thr Arg Gln Arg Arg His Ser Phe Glu Asp Arg
260 265 270
Glu Leu Pro Leu Phe Arg Asp Ser Glu Asn Ala Gly Gln Leu Phe Asn
275 280 285
Ser Asp Gly Glu Gln Asp Val Gly Asn Pro Leu Leu Ala Ser Trp Gly
290 295 300
Lys Leu Gly Arg Asp Tyr Ile Tyr Leu Leu Ser Asp Leu Glu Ser Ser
305 310 315 320
Gln Glu Leu Asp Ala Phe Val Asp Val Thr Pro Asp Asn Leu Leu His
325 330 335
Asn Ile Gln Ser Asp Ile Leu Glu Leu Glu Asn Arg Ala Val Ala Gly
340 345 350
Val Asn Ile Glu Glu Phe Ser Arg Ser Asp Asn Lys Arg Pro Leu Asp
355 360 365
Pro Leu Asp Ser Ser Ile Thr Phe His Val Cys His Ser Pro Gln Arg
370 375 380
Glu Val Glu Val Leu His Asp Arg Leu Leu Ala Met Leu Glu Glu Asp
385 390 395 400
Pro Thr Leu Thr Pro Arg Asp Ile Ile Val Met Val Ala Asp Ile Asp
405 410 415
Ser Tyr Ser Pro Phe Ile Gln Ala Val Phe Gly Ser Ala Pro Ala Asp
420 425 430
Arg Tyr Leu Pro Tyr Ala Ile Ser Asp Arg Arg Ala Arg Gln Ser His
435 440 445
Pro Val Leu Glu Ala Phe Ile Ser Leu Leu Ser Leu Pro Asp Ser Arg
450 455 460
Phe Val Ser Glu Asp Val Leu Ala Leu Leu Asp Val Pro Val Leu Ala
465 470 475 480
Ala Arg Phe Asp Ile Thr Glu Glu Gly Leu Arg Tyr Leu Arg Gln Trp
485 490 495
Val Asn Glu Ser Gly Ile Arg Trp Gly Ile Asp Asp Asp Asn Val Arg
500 505 510
Glu Leu Glu Leu Pro Ala Thr Gly Gln His Thr Trp Arg Phe Gly Leu
515 520 525
Thr Arg Met Leu Leu Gly Tyr Ala Met Glu Ser Ala Gln Gly Glu Trp
530 535 540
Gln Ser Val Leu Pro Tyr Asp Glu Ser Ser Gly Leu Ile Ala Glu Leu
545 550 555 560
Val Gly His Leu Ala Ser Leu Leu Met Gln Leu Asn Ile Trp Arg Arg
565 570 575
Gly Leu Ala Gln Glu Arg Pro Leu Glu Glu Trp Leu Pro Val Cys Arg
580 585 590
Asp Met Leu Asn Ala Phe Phe Leu Pro Asp Ala Glu Thr Glu Ala Ala
595 600 605
Met Thr Leu Ile Glu Gln Gln Trp Gln Ala Ile Ile Ala Glu Gly Leu
610 615 620
Gly Ala Gln Tyr Gly Asp Ala Val Pro Leu Ser Leu Leu Arg Asp Glu
625 630 635 640
Leu Ala Gln Arg Leu Asp Gln Glu Arg Ile Ser Gln Arg Phe Leu Ala
645 650 655
Gly Pro Val Asn Ile Cys Thr Leu Met Pro Met Arg Ser Ile Pro Phe
660 665 670
Lys Val Val Cys Leu Leu Gly Met Asn Asp Gly Val Tyr Pro Arg Gln
675 680 685
Leu Ala Pro Leu Gly Phe Asp Leu Met Ser Gln Lys Pro Lys Arg Gly
690 695 700
Asp Arg Ser Arg Arg Asp Asp Asp Arg Tyr Leu Phe Leu Glu Ala Leu
705 710 715 720
Ile Ser Ala Gln Gln Lys Leu Tyr Ile Ser Tyr Ile Gly Arg Ser Ile
725 730 735
Gln Asp Asn Ser Glu Arg Phe Pro Ser Val Leu Val Gln Glu Leu Ile
740 745 750
Asp Tyr Ile Gly Gln Ser His Tyr Leu Pro Gly Asp Glu Ala Leu Asn
755 760 765
Cys Asp Glu Ser Glu Ala Arg Val Lys Ala His Leu Thr Cys Leu His
770 775 780
Thr Arg Met Pro Phe Asp Pro Gln Asn Tyr Gln Pro Gly Glu Arg Gln
785 790 795 800
Ser Tyr Ala Arg Glu Trp Leu Pro Ala Ala Ser Gln Ala Gly Lys Ala
805 810 815
His Ser Glu Phe Val Gln Pro Leu Pro Phe Thr Leu Pro Glu Thr Val
820 825 830
Pro Leu Glu Thr Leu Gln Arg Phe Trp Ala His Pro Val Arg Ala Phe
835 840 845
Phe Gln Met Arg Leu Gln Val Asn Phe Arg Thr Glu Asp Ser Glu Ile
850 855 860
Pro Asp Thr Glu Pro Phe Ile Leu Glu Gly Leu Ser Arg Tyr Gln Ile
865 870 875 880
Asn Gln Gln Leu Leu Asn Ala Leu Val Glu Gln Asp Asp Ala Glu Arg
885 890 895
Leu Phe Arg Arg Phe Arg Ala Ala Gly Asp Leu Pro Tyr Gly Ala Phe
900 905 910
Gly Glu Ile Phe Trp Glu Thr Gln Cys Gln Glu Met Gln Gln Leu Ala
915 920 925
Asp Arg Val Ile Ala Cys Arg Gln Pro Gly Gln Ser Met Glu Ile Asp
930 935 940
Leu Ala Cys Asn Gly Val Gln Ile Thr Gly Trp Leu Pro Gln Val Gln
945 950 955 960
Pro Asp Gly Leu Leu Arg Trp Arg Pro Ser Leu Leu Ser Val Ala Gln
965 970 975
Gly Met Gln Leu Trp Leu Glu His Leu Val Tyr Cys Ala Ser Gly Gly
980 985 990
Asn Gly Glu Ser Arg Leu Phe Leu Arg Lys Asp Gly Glu Trp Arg Phe
995 1000 1005
Pro Pro Leu Ala Ala Glu Gln Ala Leu His Tyr Leu Ser Gln Leu
1010 1015 1020
Ile Glu Gly Tyr Arg Glu Gly Met Ser Ala Pro Leu Leu Val Leu
1025 1030 1035
Pro Glu Ser Gly Gly Ala Trp Leu Lys Thr Cys Tyr Asp Ala Gln
1040 1045 1050
Asn Asp Ala Met Leu Asp Asp Asp Ser Thr Leu Gln Lys Ala Arg
1055 1060 1065
Thr Lys Phe Leu Gln Ala Tyr Glu Gly Asn Met Met Val Arg Gly
1070 1075 1080
Glu Gly Asp Asp Ile Trp Tyr Gln Arg Leu Trp Arg Gln Leu Thr
1085 1090 1095
Pro Glu Thr Met Glu Ala Ile Val Glu Gln Ser Gln Arg Phe Leu
1100 1105 1110
Leu Pro Leu Phe Arg Phe Asn Gln Ser
1115 1120
<210> 41
<211> 608
<212> PRT
<213> 大肠杆菌
<400> 41
Met Lys Leu Gln Lys Gln Leu Leu Glu Ala Val Glu His Lys Gln Leu
1 5 10 15
Arg Pro Leu Asp Val Gln Phe Ala Leu Thr Val Ala Gly Asp Glu His
20 25 30
Pro Ala Val Thr Leu Ala Ala Ala Leu Leu Ser His Asp Ala Gly Glu
35 40 45
Gly His Val Cys Leu Pro Leu Ser Arg Leu Glu Asn Asn Glu Ala Ser
50 55 60
His Pro Leu Leu Ala Thr Cys Val Ser Glu Ile Gly Glu Leu Gln Asn
65 70 75 80
Trp Glu Glu Cys Leu Leu Ala Ser Gln Ala Val Ser Arg Gly Asp Glu
85 90 95
Pro Thr Pro Met Ile Leu Cys Gly Asp Arg Leu Tyr Leu Asn Arg Met
100 105 110
Trp Cys Asn Glu Arg Thr Val Ala Arg Phe Phe Asn Glu Val Asn His
115 120 125
Ala Ile Glu Val Asp Glu Ala Leu Leu Ala Gln Thr Leu Asp Lys Leu
130 135 140
Phe Pro Val Ser Asp Glu Ile Asn Trp Gln Lys Val Ala Ala Ala Val
145 150 155 160
Ala Leu Thr Arg Arg Ile Ser Val Ile Ser Gly Gly Pro Gly Thr Gly
165 170 175
Lys Thr Thr Thr Val Ala Lys Leu Leu Ala Ala Leu Ile Gln Met Ala
180 185 190
Asp Gly Glu Arg Cys Arg Ile Arg Leu Ala Ala Pro Thr Gly Lys Ala
195 200 205
Ala Ala Arg Leu Thr Glu Ser Leu Gly Lys Ala Leu Arg Gln Leu Pro
210 215 220
Leu Thr Asp Glu Gln Lys Lys Arg Ile Pro Glu Asp Ala Ser Thr Leu
225 230 235 240
His Arg Leu Leu Gly Ala Gln Pro Gly Ser Gln Arg Leu Arg His His
245 250 255
Ala Gly Asn Pro Leu His Leu Asp Val Leu Val Val Asp Glu Ala Ser
260 265 270
Met Ile Asp Leu Pro Met Met Ser Arg Leu Ile Asp Ala Leu Pro Asp
275 280 285
His Ala Arg Val Ile Phe Leu Gly Asp Arg Asp Gln Leu Ala Ser Val
290 295 300
Glu Ala Gly Ala Val Leu Gly Asp Ile Cys Ala Tyr Ala Asn Ala Gly
305 310 315 320
Phe Thr Ala Glu Arg Ala Arg Gln Leu Ser Arg Leu Thr Gly Thr His
325 330 335
Val Pro Ala Gly Thr Gly Thr Glu Ala Ala Ser Leu Arg Asp Ser Leu
340 345 350
Cys Leu Leu Gln Lys Ser Tyr Arg Phe Gly Ser Asp Ser Gly Ile Gly
355 360 365
Gln Leu Ala Ala Ala Ile Asn Arg Gly Asp Lys Thr Ala Val Lys Thr
370 375 380
Val Phe Gln Gln Asp Phe Thr Asp Ile Glu Lys Arg Leu Leu Gln Ser
385 390 395 400
Gly Glu Asp Tyr Ile Ala Met Leu Glu Glu Ala Leu Ala Gly Tyr Gly
405 410 415
Arg Tyr Leu Asp Leu Leu Gln Ala Arg Ala Glu Pro Asp Leu Ile Ile
420 425 430
Gln Ala Phe Asn Glu Tyr Gln Leu Leu Cys Ala Leu Arg Glu Gly Pro
435 440 445
Phe Gly Val Ala Gly Leu Asn Glu Arg Ile Glu Gln Phe Met Gln Gln
450 455 460
Lys Arg Lys Ile His Arg His Pro His Ser Arg Trp Tyr Glu Gly Arg
465 470 475 480
Pro Val Met Ile Ala Arg Asn Asp Ser Ala Leu Gly Leu Phe Asn Gly
485 490 495
Asp Ile Gly Ile Ala Leu Asp Arg Gly Gln Gly Thr Arg Val Trp Phe
500 505 510
Ala Met Pro Asp Gly Asn Ile Lys Ser Val Gln Pro Ser Arg Leu Pro
515 520 525
Glu His Glu Thr Thr Trp Ala Met Thr Val His Lys Ser Gln Gly Ser
530 535 540
Glu Phe Asp His Ala Ala Leu Ile Leu Pro Ser Gln Arg Thr Pro Val
545 550 555 560
Val Thr Arg Glu Leu Val Tyr Thr Ala Val Thr Arg Ala Arg Arg Arg
565 570 575
Leu Ser Leu Tyr Ala Asp Glu Arg Ile Leu Ser Ala Ala Ile Ala Thr
580 585 590
Arg Thr Glu Arg Arg Ser Gly Leu Ala Ala Leu Phe Ser Ser Arg Glu
595 600 605
<210> 42
<211> 609
<212> PRT
<213> 大肠杆菌
<400> 42
Met Ala Gln Ala Glu Val Leu Asn Leu Glu Ser Gly Ala Lys Gln Val
1 5 10 15
Leu Gln Glu Thr Phe Gly Tyr Gln Gln Phe Arg Pro Gly Gln Glu Glu
20 25 30
Ile Ile Asp Thr Val Leu Ser Gly Arg Asp Cys Leu Val Val Met Pro
35 40 45
Thr Gly Gly Gly Lys Ser Leu Cys Tyr Gln Ile Pro Ala Leu Leu Leu
50 55 60
Asn Gly Leu Thr Val Val Val Ser Pro Leu Ile Ser Leu Met Lys Asp
65 70 75 80
Gln Val Asp Gln Leu Gln Ala Asn Gly Val Ala Ala Ala Cys Leu Asn
85 90 95
Ser Thr Gln Thr Arg Glu Gln Gln Leu Glu Val Met Thr Gly Cys Arg
100 105 110
Thr Gly Gln Ile Arg Leu Leu Tyr Ile Ala Pro Glu Arg Leu Met Leu
115 120 125
Asp Asn Phe Leu Glu His Leu Ala His Trp Asn Pro Val Leu Leu Ala
130 135 140
Val Asp Glu Ala His Cys Ile Ser Gln Trp Gly His Asp Phe Arg Pro
145 150 155 160
Glu Tyr Ala Ala Leu Gly Gln Leu Arg Gln Arg Phe Pro Thr Leu Pro
165 170 175
Phe Met Ala Leu Thr Ala Thr Ala Asp Asp Thr Thr Arg Gln Asp Ile
180 185 190
Val Arg Leu Leu Gly Leu Asn Asp Pro Leu Ile Gln Ile Ser Ser Phe
195 200 205
Asp Arg Pro Asn Ile Arg Tyr Met Leu Met Glu Lys Phe Lys Pro Leu
210 215 220
Asp Gln Leu Met Arg Tyr Val Gln Glu Gln Arg Gly Lys Ser Gly Ile
225 230 235 240
Ile Tyr Cys Asn Ser Arg Ala Lys Val Glu Asp Thr Ala Ala Arg Leu
245 250 255
Gln Ser Lys Gly Ile Ser Ala Ala Ala Tyr His Ala Gly Leu Glu Asn
260 265 270
Asn Val Arg Ala Asp Val Gln Glu Lys Phe Gln Arg Asp Asp Leu Gln
275 280 285
Ile Val Val Ala Thr Val Ala Phe Gly Met Gly Ile Asn Lys Pro Asn
290 295 300
Val Arg Phe Val Val His Phe Asp Ile Pro Arg Asn Ile Glu Ser Tyr
305 310 315 320
Tyr Gln Glu Thr Gly Arg Ala Gly Arg Asp Gly Leu Pro Ala Glu Ala
325 330 335
Met Leu Phe Tyr Asp Pro Ala Asp Met Ala Trp Leu Arg Arg Cys Leu
340 345 350
Glu Glu Lys Pro Gln Gly Gln Leu Gln Asp Ile Glu Arg His Lys Leu
355 360 365
Asn Ala Met Gly Ala Phe Ala Glu Ala Gln Thr Cys Arg Arg Leu Val
370 375 380
Leu Leu Asn Tyr Phe Gly Glu Gly Arg Gln Glu Pro Cys Gly Asn Cys
385 390 395 400
Asp Ile Cys Leu Asp Pro Pro Lys Gln Tyr Asp Gly Ser Thr Asp Ala
405 410 415
Gln Ile Ala Leu Ser Thr Ile Gly Arg Val Asn Gln Arg Phe Gly Met
420 425 430
Gly Tyr Val Val Glu Val Ile Arg Gly Ala Asn Asn Gln Arg Ile Arg
435 440 445
Asp Tyr Gly His Asp Lys Leu Lys Val Tyr Gly Met Gly Arg Asp Lys
450 455 460
Ser His Glu His Trp Val Ser Val Ile Arg Gln Leu Ile His Leu Gly
465 470 475 480
Leu Val Thr Gln Asn Ile Ala Gln His Ser Ala Leu Gln Leu Thr Glu
485 490 495
Ala Ala Arg Pro Val Leu Arg Gly Glu Ser Ser Leu Gln Leu Ala Val
500 505 510
Pro Arg Ile Val Ala Leu Lys Pro Lys Ala Met Gln Lys Ser Phe Gly
515 520 525
Gly Asn Tyr Asp Arg Lys Leu Phe Ala Lys Leu Arg Lys Leu Arg Lys
530 535 540
Ser Ile Ala Asp Glu Ser Asn Val Pro Pro Tyr Val Val Phe Asn Asp
545 550 555 560
Ala Thr Leu Ile Glu Met Ala Glu Gln Met Pro Ile Thr Ala Ser Glu
565 570 575
Met Leu Ser Val Asn Gly Val Gly Met Arg Lys Leu Glu Arg Phe Gly
580 585 590
Lys Pro Phe Met Ala Leu Ile Arg Ala His Val Asp Gly Asp Asp Glu
595 600 605
Glu
<210> 43
<211> 508
<212> PRT
<213> 大肠杆菌
<400> 43
Met Arg Leu Asn Pro Gly Gln Gln Gln Ala Val Glu Phe Val Thr Gly
1 5 10 15
Pro Cys Leu Val Leu Ala Gly Ala Gly Ser Gly Lys Thr Arg Val Ile
20 25 30
Thr Asn Lys Ile Ala His Leu Ile Arg Gly Cys Gly Tyr Gln Ala Arg
35 40 45
His Ile Ala Ala Val Thr Phe Thr Asn Lys Ala Ala Arg Glu Met Lys
50 55 60
Glu Arg Val Gly Gln Thr Leu Gly Arg Lys Glu Ala Arg Gly Leu Met
65 70 75 80
Ile Ser Thr Phe His Thr Leu Gly Leu Asp Ile Ile Lys Arg Glu Tyr
85 90 95
Ala Ala Leu Gly Met Lys Ala Asn Phe Ser Leu Phe Asp Asp Thr Asp
100 105 110
Gln Leu Ala Leu Leu Lys Glu Leu Thr Glu Gly Leu Ile Glu Asp Asp
115 120 125
Lys Val Leu Leu Gln Gln Leu Ile Ser Thr Ile Ser Asn Trp Lys Asn
130 135 140
Asp Leu Lys Thr Pro Ala Gln Ala Ala Ala Glu Ala Lys Gly Glu Arg
145 150 155 160
Asp Arg Ile Phe Ala His Cys Tyr Gly Leu Tyr Asp Ala His Leu Lys
165 170 175
Ala Cys Asn Val Leu Asp Phe Asp Asp Leu Ile Leu Leu Pro Thr Leu
180 185 190
Leu Leu Gln Arg Asn Glu Glu Val Arg Glu Arg Trp Gln Asn Lys Ile
195 200 205
Arg Tyr Leu Leu Val Asp Glu Tyr Gln Asp Thr Asn Thr Ser Gln Tyr
210 215 220
Glu Leu Val Lys Leu Leu Val Gly Ser Arg Ala Arg Phe Thr Val Val
225 230 235 240
Gly Asp Asp Asp Gln Ser Ile Tyr Ser Trp Arg Gly Ala Arg Pro Gln
245 250 255
Asn Leu Val Leu Leu Ser Gln Asp Phe Pro Ala Leu Lys Val Ile Lys
260 265 270
Leu Glu Gln Asn Tyr Arg Ser Ser Gly Arg Ile Leu Lys Ala Ala Asn
275 280 285
Ile Leu Ile Ala Asn Asn Pro His Val Phe Glu Lys Arg Leu Phe Ser
290 295 300
Glu Leu Gly Tyr Gly Thr Glu Leu Lys Val Leu Ser Ala Asn Asn Glu
305 310 315 320
Glu His Glu Ala Glu Arg Val Thr Gly Glu Leu Ile Ala His His Phe
325 330 335
Val Asn Lys Thr Gln Tyr Lys Asp Tyr Ala Ile Leu Tyr Arg Gly Asn
340 345 350
His Gln Ser Arg Val Phe Glu Lys Phe Leu Met Gln Asn Arg Ile Pro
355 360 365
Tyr Lys Ile Ser Gly Gly Gly Gly Gly Gly Glu Ser Glu Glu Glu Leu
370 375 380
Asp Gln Val Gln Leu Met Thr Leu His Ala Ser Lys Gly Leu Glu Phe
385 390 395 400
Pro Tyr Val Tyr Met Val Gly Met Glu Glu Gly Phe Leu Pro His Gln
405 410 415
Ser Ser Ile Asp Glu Asp Asn Ile Asp Glu Glu Arg Arg Leu Ala Tyr
420 425 430
Val Gly Ile Thr Arg Ala Gln Lys Glu Leu Thr Phe Thr Leu Cys Lys
435 440 445
Glu Arg Arg Gln Tyr Gly Glu Leu Val Arg Pro Glu Pro Ser Arg Phe
450 455 460
Leu Leu Glu Leu Pro Gln Asp Asp Leu Ile Trp Glu Gln Glu Arg Lys
465 470 475 480
Val Val Ser Ala Glu Glu Arg Met Gln Lys Gly Gln Ser His Leu Ala
485 490 495
Asn Leu Lys Ala Met Met Ala Ala Lys Arg Gly Lys
500 505
<210> 44
<211> 720
<212> PRT
<213> 大肠杆菌
<400> 44
Met Asp Val Ser Tyr Leu Leu Asp Ser Leu Asn Asp Lys Gln Arg Glu
1 5 10 15
Ala Val Ala Ala Pro Arg Ser Asn Leu Leu Val Leu Ala Gly Ala Gly
20 25 30
Ser Gly Lys Thr Arg Val Leu Val His Arg Ile Ala Trp Leu Met Ser
35 40 45
Val Glu Asn Cys Ser Pro Tyr Ser Ile Met Ala Val Thr Phe Thr Asn
50 55 60
Lys Ala Ala Ala Glu Met Arg His Arg Ile Gly Gln Leu Met Gly Thr
65 70 75 80
Ser Gln Gly Gly Met Trp Val Gly Thr Phe His Gly Leu Ala His Arg
85 90 95
Leu Leu Arg Ala His His Met Asp Ala Asn Leu Pro Gln Asp Phe Gln
100 105 110
Ile Leu Asp Ser Glu Asp Gln Leu Arg Leu Leu Lys Arg Leu Ile Lys
115 120 125
Ala Met Asn Leu Asp Glu Lys Gln Trp Pro Pro Arg Gln Ala Met Trp
130 135 140
Tyr Ile Asn Ser Gln Lys Asp Glu Gly Leu Arg Pro His His Ile Gln
145 150 155 160
Ser Tyr Gly Asn Pro Val Glu Gln Thr Trp Gln Lys Val Tyr Gln Ala
165 170 175
Tyr Gln Glu Ala Cys Asp Arg Ala Gly Leu Val Asp Phe Ala Glu Leu
180 185 190
Leu Leu Arg Ala His Glu Leu Trp Leu Asn Lys Pro His Ile Leu Gln
195 200 205
His Tyr Arg Glu Arg Phe Thr Asn Ile Leu Val Asp Glu Phe Gln Asp
210 215 220
Thr Asn Asn Ile Gln Tyr Ala Trp Ile Arg Leu Leu Ala Gly Asp Thr
225 230 235 240
Gly Lys Val Met Ile Val Gly Asp Asp Asp Gln Ser Ile Tyr Gly Trp
245 250 255
Arg Gly Ala Gln Val Glu Asn Ile Gln Arg Phe Leu Asn Asp Phe Pro
260 265 270
Gly Ala Glu Thr Ile Arg Leu Glu Gln Asn Tyr Arg Ser Thr Ser Asn
275 280 285
Ile Leu Ser Ala Ala Asn Ala Leu Ile Glu Asn Asn Asn Gly Arg Leu
290 295 300
Gly Lys Lys Leu Trp Thr Asp Gly Ala Asp Gly Glu Pro Ile Ser Leu
305 310 315 320
Tyr Cys Ala Phe Asn Glu Leu Asp Glu Ala Arg Phe Val Val Asn Arg
325 330 335
Ile Lys Thr Trp Gln Asp Asn Gly Gly Ala Leu Ala Glu Cys Ala Ile
340 345 350
Leu Tyr Arg Ser Asn Ala Gln Ser Arg Val Leu Glu Glu Ala Leu Leu
355 360 365
Gln Ala Ser Met Pro Tyr Arg Ile Tyr Gly Gly Met Arg Phe Phe Glu
370 375 380
Arg Gln Glu Ile Lys Asp Ala Leu Ser Tyr Leu Arg Leu Ile Ala Asn
385 390 395 400
Arg Asn Asp Asp Ala Ala Phe Glu Arg Val Val Asn Thr Pro Thr Arg
405 410 415
Gly Ile Gly Asp Arg Thr Leu Asp Val Val Arg Gln Thr Ser Arg Asp
420 425 430
Arg Gln Leu Thr Leu Trp Gln Ala Cys Arg Glu Leu Leu Gln Glu Lys
435 440 445
Ala Leu Ala Gly Arg Ala Ala Ser Ala Leu Gln Arg Phe Met Glu Leu
450 455 460
Ile Asp Ala Leu Ala Gln Glu Thr Ala Asp Met Pro Leu His Val Gln
465 470 475 480
Thr Asp Arg Val Ile Lys Asp Ser Gly Leu Arg Thr Met Tyr Glu Gln
485 490 495
Glu Lys Gly Glu Lys Gly Gln Thr Arg Ile Glu Asn Leu Glu Glu Leu
500 505 510
Val Thr Ala Thr Arg Gln Phe Ser Tyr Asn Glu Glu Asp Glu Asp Leu
515 520 525
Met Pro Leu Gln Ala Phe Leu Ser His Ala Ala Leu Glu Ala Gly Glu
530 535 540
Gly Gln Ala Asp Thr Trp Gln Asp Ala Val Gln Leu Met Thr Leu His
545 550 555 560
Ser Ala Lys Gly Leu Glu Phe Pro Gln Val Phe Ile Val Gly Met Glu
565 570 575
Glu Gly Met Phe Pro Ser Gln Met Ser Leu Asp Glu Gly Gly Arg Leu
580 585 590
Glu Glu Glu Arg Arg Leu Ala Tyr Val Gly Val Thr Arg Ala Met Gln
595 600 605
Lys Leu Thr Leu Thr Tyr Ala Glu Thr Arg Arg Leu Tyr Gly Lys Glu
610 615 620
Val Tyr His Arg Pro Ser Arg Phe Ile Gly Glu Leu Pro Glu Glu Cys
625 630 635 640
Val Glu Glu Val Arg Leu Arg Ala Thr Val Ser Arg Pro Val Ser His
645 650 655
Gln Arg Met Gly Thr Pro Met Val Glu Asn Asp Ser Gly Tyr Lys Leu
660 665 670
Gly Gln Arg Val Arg His Ala Lys Phe Gly Glu Gly Thr Ile Val Asn
675 680 685
Met Glu Gly Ser Gly Glu His Ser Arg Leu Gln Val Ala Phe Gln Gly
690 695 700
Gln Gly Ile Lys Trp Leu Val Ala Ala Tyr Ala Arg Leu Glu Ser Val
705 710 715 720
<210> 45
<211> 968
<212> PRT
<213> 大肠杆菌
<400> 45
Met Pro Phe Thr Leu Gly Gln Arg Trp Ile Ser Asp Thr Glu Ser Glu
1 5 10 15
Leu Gly Leu Gly Thr Val Val Ala Val Asp Ala Arg Thr Val Thr Leu
20 25 30
Leu Phe Pro Ser Thr Gly Glu Asn Arg Leu Tyr Ala Arg Ser Asp Ser
35 40 45
Pro Val Thr Arg Val Met Phe Asn Pro Gly Asp Thr Ile Thr Ser His
50 55 60
Asp Gly Trp Gln Met Gln Val Glu Glu Val Lys Glu Glu Asn Gly Leu
65 70 75 80
Leu Thr Tyr Ile Gly Thr Arg Leu Asp Thr Glu Glu Ser Gly Val Ala
85 90 95
Leu Arg Glu Val Phe Leu Asp Ser Lys Leu Val Phe Ser Lys Pro Gln
100 105 110
Asp Arg Leu Phe Ala Gly Gln Ile Asp Arg Met Asp Arg Phe Ala Leu
115 120 125
Arg Tyr Arg Ala Arg Lys Tyr Ser Ser Glu Gln Phe Arg Met Pro Tyr
130 135 140
Ser Gly Leu Arg Gly Gln Arg Thr Ser Leu Ile Pro His Gln Leu Asn
145 150 155 160
Ile Ala His Asp Val Gly Arg Arg His Ala Pro Arg Val Leu Leu Ala
165 170 175
Asp Glu Val Gly Leu Gly Lys Thr Ile Glu Ala Gly Met Ile Leu His
180 185 190
Gln Gln Leu Leu Ser Gly Ala Ala Glu Arg Val Leu Ile Ile Val Pro
195 200 205
Glu Thr Leu Gln His Gln Trp Leu Val Glu Met Leu Arg Arg Phe Asn
210 215 220
Leu Arg Phe Ala Leu Phe Asp Asp Glu Arg Tyr Ala Glu Ala Gln His
225 230 235 240
Asp Ala Tyr Asn Pro Phe Asp Thr Glu Gln Leu Val Ile Cys Ser Leu
245 250 255
Asp Phe Ala Arg Arg Ser Lys Gln Arg Leu Glu His Leu Cys Glu Ala
260 265 270
Glu Trp Asp Leu Leu Val Val Asp Glu Ala His His Leu Val Trp Ser
275 280 285
Glu Asp Ala Pro Ser Arg Glu Tyr Gln Ala Ile Glu Gln Leu Ala Glu
290 295 300
His Val Pro Gly Val Leu Leu Leu Thr Ala Thr Pro Glu Gln Leu Gly
305 310 315 320
Met Glu Ser His Phe Ala Arg Leu Arg Leu Leu Asp Pro Asn Arg Phe
325 330 335
His Asp Phe Ala Gln Phe Val Glu Glu Gln Lys Asn Tyr Arg Pro Val
340 345 350
Ala Asp Ala Val Ala Met Leu Leu Ala Gly Asn Lys Leu Ser Asn Asp
355 360 365
Glu Leu Asn Met Leu Gly Glu Met Ile Gly Glu Gln Asp Ile Glu Pro
370 375 380
Leu Leu Gln Ala Ala Asn Ser Asp Ser Glu Asp Ala Gln Ser Ala Arg
385 390 395 400
Gln Glu Leu Val Ser Met Leu Met Asp Arg His Gly Thr Ser Arg Val
405 410 415
Leu Phe Arg Asn Thr Arg Asn Gly Val Lys Gly Phe Pro Lys Arg Glu
420 425 430
Leu His Thr Ile Lys Leu Pro Leu Pro Thr Gln Tyr Gln Thr Ala Ile
435 440 445
Lys Val Ser Gly Ile Met Gly Ala Arg Lys Ser Ala Glu Asp Arg Ala
450 455 460
Arg Asp Met Leu Tyr Pro Glu Arg Ile Tyr Gln Glu Phe Glu Gly Asp
465 470 475 480
Asn Ala Thr Trp Trp Asn Phe Asp Pro Arg Val Glu Trp Leu Met Gly
485 490 495
Tyr Leu Thr Ser His Arg Ser Gln Lys Val Leu Val Ile Cys Ala Lys
500 505 510
Ala Ala Thr Ala Leu Gln Leu Glu Gln Val Leu Arg Glu Arg Glu Gly
515 520 525
Ile Arg Ala Ala Val Phe His Glu Gly Met Ser Ile Ile Glu Arg Asp
530 535 540
Arg Ala Ala Ala Trp Phe Ala Glu Glu Asp Thr Gly Ala Gln Val Leu
545 550 555 560
Leu Cys Ser Glu Ile Gly Ser Glu Gly Arg Asn Phe Gln Phe Ala Ser
565 570 575
His Met Val Met Phe Asp Leu Pro Phe Asn Pro Asp Leu Leu Glu Gln
580 585 590
Arg Ile Gly Arg Leu Asp Arg Ile Gly Gln Ala His Asp Ile Gln Ile
595 600 605
His Val Pro Tyr Leu Glu Lys Thr Ala Gln Ser Val Leu Val Arg Trp
610 615 620
Tyr His Glu Gly Leu Asp Ala Phe Glu His Thr Cys Pro Thr Gly Arg
625 630 635 640
Thr Ile Tyr Asp Ser Val Tyr Asn Asp Leu Ile Asn Tyr Leu Ala Ser
645 650 655
Pro Asp Gln Thr Glu Gly Phe Asp Asp Leu Ile Lys Asn Cys Arg Glu
660 665 670
Gln His Glu Ala Leu Lys Ala Gln Leu Glu Gln Gly Arg Asp Arg Leu
675 680 685
Leu Glu Ile His Ser Asn Gly Gly Glu Lys Ala Gln Ala Leu Ala Glu
690 695 700
Ser Ile Glu Glu Gln Asp Asp Asp Thr Asn Leu Ile Ala Phe Ala Met
705 710 715 720
Asn Leu Phe Asp Ile Ile Gly Ile Asn Gln Asp Asp Arg Gly Asp Asn
725 730 735
Met Ile Val Leu Thr Pro Ser Asp His Met Leu Val Pro Asp Phe Pro
740 745 750
Gly Leu Ser Glu Asp Gly Ile Thr Ile Thr Phe Asp Arg Glu Val Ala
755 760 765
Leu Ala Arg Glu Asp Ala Gln Phe Ile Thr Trp Glu His Pro Leu Ile
770 775 780
Arg Asn Gly Leu Asp Leu Ile Leu Ser Gly Asp Thr Gly Ser Ser Thr
785 790 795 800
Ile Ser Leu Leu Lys Asn Lys Ala Leu Pro Val Gly Thr Leu Leu Val
805 810 815
Glu Leu Ile Tyr Val Val Glu Ala Gln Ala Pro Lys Gln Leu Gln Leu
820 825 830
Asn Arg Phe Leu Pro Pro Thr Pro Val Arg Met Leu Leu Asp Lys Asn
835 840 845
Gly Asn Asn Leu Ala Ala Gln Val Glu Phe Glu Thr Phe Asn Arg Gln
850 855 860
Leu Asn Ala Val Asn Arg His Thr Gly Ser Lys Leu Val Asn Ala Val
865 870 875 880
Gln Gln Asp Val His Ala Ile Leu Gln Leu Gly Glu Ala Gln Ile Glu
885 890 895
Lys Ser Ala Arg Ala Leu Ile Asp Ala Ala Arg Asn Glu Ala Asp Glu
900 905 910
Lys Leu Ser Ala Glu Leu Ser Arg Leu Glu Ala Leu Arg Ala Val Asn
915 920 925
Pro Asn Ile Arg Asp Asp Glu Leu Thr Ala Ile Glu Ser Asn Arg Gln
930 935 940
Gln Val Met Glu Ser Leu Asp Gln Ala Gly Trp Arg Leu Asp Ala Leu
945 950 955 960
Arg Leu Ile Val Val Thr His Gln
965
<210> 46
<211> 693
<212> PRT
<213> 大肠杆菌
<400> 46
Met Lys Gly Arg Leu Leu Asp Ala Val Pro Leu Ser Ser Leu Thr Gly
1 5 10 15
Val Gly Ala Ala Leu Ser Asn Lys Leu Ala Lys Ile Asn Leu His Thr
20 25 30
Val Gln Asp Leu Leu Leu His Leu Pro Leu Arg Tyr Glu Asp Arg Thr
35 40 45
His Leu Tyr Pro Ile Gly Glu Leu Leu Pro Gly Val Tyr Ala Thr Val
50 55 60
Glu Gly Glu Val Leu Asn Cys Asn Ile Ser Phe Gly Gly Arg Arg Met
65 70 75 80
Met Thr Cys Gln Ile Ser Asp Gly Ser Gly Ile Leu Thr Met Arg Phe
85 90 95
Phe Asn Phe Ser Ala Ala Met Lys Asn Ser Leu Ala Ala Gly Arg Arg
100 105 110
Val Leu Ala Tyr Gly Glu Ala Lys Arg Gly Lys Tyr Gly Ala Glu Met
115 120 125
Ile His Pro Glu Tyr Arg Val Gln Gly Asp Leu Ser Thr Pro Glu Leu
130 135 140
Gln Glu Thr Leu Thr Pro Val Tyr Pro Thr Thr Glu Gly Val Lys Gln
145 150 155 160
Ala Thr Leu Arg Lys Leu Thr Asp Gln Ala Leu Asp Leu Leu Asp Thr
165 170 175
Cys Ala Ile Glu Glu Leu Leu Pro Pro Glu Leu Ser Gln Gly Met Met
180 185 190
Thr Leu Pro Glu Ala Leu Arg Thr Leu His Arg Pro Pro Pro Thr Leu
195 200 205
Gln Leu Ser Asp Leu Glu Thr Gly Gln His Pro Ala Gln Arg Arg Leu
210 215 220
Ile Leu Glu Glu Leu Leu Ala His Asn Leu Ser Met Leu Ala Leu Arg
225 230 235 240
Ala Gly Ala Gln Arg Phe His Ala Gln Pro Leu Ser Ala Asn Asp Thr
245 250 255
Leu Lys Asn Lys Leu Leu Ala Ala Leu Pro Phe Lys Pro Thr Gly Ala
260 265 270
Gln Ala Arg Val Val Ala Glu Ile Glu Arg Asp Met Ala Leu Asp Val
275 280 285
Pro Met Met Arg Leu Val Gln Gly Asp Val Gly Ser Gly Lys Thr Leu
290 295 300
Val Ala Ala Leu Ala Ala Leu Arg Ala Ile Ala His Gly Lys Gln Val
305 310 315 320
Ala Leu Met Ala Pro Thr Glu Leu Leu Ala Glu Gln His Ala Asn Asn
325 330 335
Phe Arg Asn Trp Phe Ala Pro Leu Gly Ile Glu Val Gly Trp Leu Ala
340 345 350
Gly Lys Gln Lys Gly Lys Ala Arg Leu Ala Gln Gln Glu Ala Ile Ala
355 360 365
Ser Gly Gln Val Gln Met Ile Val Gly Thr His Ala Ile Phe Gln Glu
370 375 380
Gln Val Gln Phe Asn Gly Leu Ala Leu Val Ile Ile Asp Glu Gln His
385 390 395 400
Arg Phe Gly Val His Gln Arg Leu Ala Leu Trp Glu Lys Gly Gln Gln
405 410 415
Gln Gly Phe His Pro His Gln Leu Ile Met Thr Ala Thr Pro Ile Pro
420 425 430
Arg Thr Leu Ala Met Thr Ala Tyr Ala Asp Leu Asp Thr Ser Val Ile
435 440 445
Asp Glu Leu Pro Pro Gly Arg Thr Pro Val Thr Thr Val Ala Ile Pro
450 455 460
Asp Thr Arg Arg Thr Asp Ile Ile Asp Arg Val His His Ala Cys Ile
465 470 475 480
Thr Glu Gly Arg Gln Ala Tyr Trp Val Cys Thr Leu Ile Glu Glu Ser
485 490 495
Glu Leu Leu Glu Ala Gln Ala Ala Glu Ala Thr Trp Glu Glu Leu Lys
500 505 510
Leu Ala Leu Pro Glu Leu Asn Val Gly Leu Val His Gly Arg Met Lys
515 520 525
Pro Ala Glu Lys Gln Ala Val Met Ala Ser Phe Lys Gln Gly Glu Leu
530 535 540
His Leu Leu Val Ala Thr Thr Val Ile Glu Val Gly Val Asp Val Pro
545 550 555 560
Asn Ala Ser Leu Met Ile Ile Glu Asn Pro Glu Arg Leu Gly Leu Ala
565 570 575
Gln Leu His Gln Leu Arg Gly Arg Val Gly Arg Gly Ala Val Ala Ser
580 585 590
His Cys Val Leu Leu Tyr Lys Thr Pro Leu Ser Lys Thr Ala Gln Ile
595 600 605
Arg Leu Gln Val Leu Arg Asp Ser Asn Asp Gly Phe Val Ile Ala Gln
610 615 620
Lys Asp Leu Glu Ile Arg Gly Pro Gly Glu Leu Leu Gly Thr Arg Gln
625 630 635 640
Thr Gly Asn Ala Glu Phe Lys Val Ala Asp Leu Leu Arg Asp Gln Ala
645 650 655
Met Ile Pro Glu Val Gln Arg Leu Ala Arg His Ile His Glu Arg Tyr
660 665 670
Pro Gln Gln Ala Lys Ala Leu Ile Glu Arg Trp Met Pro Glu Thr Glu
675 680 685
Arg Tyr Ser Asn Ala
690
<210> 47
<211> 467
<212> PRT
<213> 智人
<400> 47
Met Ser Leu Ser Leu Trp Gln Gln Cys Leu Ala Arg Leu Gln Asp Glu
1 5 10 15
Leu Pro Ala Thr Glu Phe Ser Met Trp Ile Arg Pro Leu Gln Ala Glu
20 25 30
Leu Ser Asp Asn Thr Leu Ala Leu Tyr Ala Pro Asn Arg Phe Val Leu
35 40 45
Asp Trp Val Arg Asp Lys Tyr Leu Asn Asn Ile Asn Gly Leu Leu Thr
50 55 60
Ser Phe Cys Gly Ala Asp Ala Pro Gln Leu Arg Phe Glu Val Gly Thr
65 70 75 80
Lys Pro Val Thr Gln Thr Pro Gln Ala Ala Val Thr Ser Asn Val Ala
85 90 95
Ala Pro Ala Gln Val Ala Gln Thr Gln Pro Gln Arg Ala Ala Pro Ser
100 105 110
Thr Arg Ser Gly Trp Asp Asn Val Pro Ala Pro Ala Glu Pro Thr Tyr
115 120 125
Arg Ser Asn Val Asn Val Lys His Thr Phe Asp Asn Phe Val Glu Gly
130 135 140
Lys Ser Asn Gln Leu Ala Arg Ala Ala Ala Arg Gln Val Ala Asp Asn
145 150 155 160
Pro Gly Gly Ala Tyr Asn Pro Leu Phe Leu Tyr Gly Gly Thr Gly Leu
165 170 175
Gly Lys Thr His Leu Leu His Ala Val Gly Asn Gly Ile Met Ala Arg
180 185 190
Lys Pro Asn Ala Lys Val Val Tyr Met His Ser Glu Arg Phe Val Gln
195 200 205
Asp Met Val Lys Ala Leu Gln Asn Asn Ala Ile Glu Glu Phe Lys Arg
210 215 220
Tyr Tyr Arg Ser Val Asp Ala Leu Leu Ile Asp Asp Ile Gln Phe Phe
225 230 235 240
Ala Asn Lys Glu Arg Ser Gln Glu Glu Phe Phe His Thr Phe Asn Ala
245 250 255
Leu Leu Glu Gly Asn Gln Gln Ile Ile Leu Thr Ser Asp Arg Tyr Pro
260 265 270
Lys Glu Ile Asn Gly Val Glu Asp Arg Leu Lys Ser Arg Phe Gly Trp
275 280 285
Gly Leu Thr Val Ala Ile Glu Pro Pro Glu Leu Glu Thr Arg Val Ala
290 295 300
Ile Leu Met Lys Lys Ala Asp Glu Asn Asp Ile Arg Leu Pro Gly Glu
305 310 315 320
Val Ala Phe Phe Ile Ala Lys Arg Leu Arg Ser Asn Val Arg Glu Leu
325 330 335
Glu Gly Ala Leu Asn Arg Val Ile Ala Asn Ala Asn Phe Thr Gly Arg
340 345 350
Ala Ile Thr Ile Asp Phe Val Arg Glu Ala Leu Arg Asp Leu Leu Ala
355 360 365
Leu Gln Glu Lys Leu Val Thr Ile Asp Asn Ile Gln Lys Thr Val Ala
370 375 380
Glu Tyr Tyr Lys Ile Lys Val Ala Asp Leu Leu Ser Lys Arg Arg Ser
385 390 395 400
Arg Ser Val Ala Arg Pro Arg Gln Met Ala Met Ala Leu Ala Lys Glu
405 410 415
Leu Thr Asn His Ser Leu Pro Glu Ile Gly Asp Ala Phe Gly Gly Arg
420 425 430
Asp His Thr Thr Val Leu His Ala Cys Arg Lys Ile Glu Gln Leu Arg
435 440 445
Glu Glu Ser His Asp Ile Lys Glu Asp Phe Ser Asn Leu Ile Arg Thr
450 455 460
Leu Ser Ser
465
<210> 48
<211> 215
<212> PRT
<213> 智人
<400> 48
Met Gly Lys Gly Asp Pro Lys Lys Pro Arg Gly Lys Met Ser Ser Tyr
1 5 10 15
Ala Phe Phe Val Gln Thr Cys Arg Glu Glu His Lys Lys Lys His Pro
20 25 30
Asp Ala Ser Val Asn Phe Ser Glu Phe Ser Lys Lys Cys Ser Glu Arg
35 40 45
Trp Lys Thr Met Ser Ala Lys Glu Lys Gly Lys Phe Glu Asp Met Ala
50 55 60
Lys Ala Asp Lys Ala Arg Tyr Glu Arg Glu Met Lys Thr Tyr Ile Pro
65 70 75 80
Pro Lys Gly Glu Thr Lys Lys Lys Phe Lys Asp Pro Asn Ala Pro Lys
85 90 95
Arg Pro Pro Ser Ala Phe Phe Leu Phe Cys Ser Glu Tyr Arg Pro Lys
100 105 110
Ile Lys Gly Glu His Pro Gly Leu Ser Ile Gly Asp Val Ala Lys Lys
115 120 125
Leu Gly Glu Met Trp Asn Asn Thr Ala Ala Asp Asp Lys Gln Pro Tyr
130 135 140
Glu Lys Lys Ala Ala Lys Leu Lys Glu Lys Tyr Glu Lys Asp Ile Ala
145 150 155 160
Ala Tyr Arg Ala Lys Gly Lys Pro Asp Ala Ala Lys Lys Gly Val Val
165 170 175
Lys Ala Glu Lys Ser Lys Lys Lys Lys Glu Glu Glu Glu Asp Glu Glu
180 185 190
Asp Glu Glu Asp Glu Glu Glu Glu Glu Asp Glu Glu Asp Glu Asp Glu
195 200 205
Glu Glu Asp Asp Asp Asp Glu
210 215
<210> 49
<211> 209
<212> PRT
<213> 智人
<400> 49
Met Gly Lys Gly Asp Pro Asn Lys Pro Arg Gly Lys Met Ser Ser Tyr
1 5 10 15
Ala Phe Phe Val Gln Thr Cys Arg Glu Glu His Lys Lys Lys His Pro
20 25 30
Asp Ser Ser Val Asn Phe Ala Glu Phe Ser Lys Lys Cys Ser Glu Arg
35 40 45
Trp Lys Thr Met Ser Ala Lys Glu Lys Ser Lys Phe Glu Asp Met Ala
50 55 60
Lys Ser Asp Lys Ala Arg Tyr Asp Arg Glu Met Lys Asn Tyr Val Pro
65 70 75 80
Pro Lys Gly Asp Lys Lys Gly Lys Lys Lys Asp Pro Asn Ala Pro Lys
85 90 95
Arg Pro Pro Ser Ala Phe Phe Leu Phe Cys Ser Glu His Arg Pro Lys
100 105 110
Ile Lys Ser Glu His Pro Gly Leu Ser Ile Gly Asp Thr Ala Lys Lys
115 120 125
Leu Gly Glu Met Trp Ser Glu Gln Ser Ala Lys Asp Lys Gln Pro Tyr
130 135 140
Glu Gln Lys Ala Ala Lys Leu Lys Glu Lys Tyr Glu Lys Asp Ile Ala
145 150 155 160
Ala Tyr Arg Ala Lys Gly Lys Ser Glu Ala Gly Lys Lys Gly Pro Gly
165 170 175
Arg Pro Thr Gly Ser Lys Lys Lys Asn Glu Pro Glu Asp Glu Glu Glu
180 185 190
Glu Glu Glu Glu Glu Asp Glu Asp Glu Glu Glu Glu Asp Glu Asp Glu
195 200 205
Glu
<210> 50
<211> 616
<212> PRT
<213> 智人
<400> 50
Met Val Gly Gln Leu Ser Glu Gly Ala Ile Ala Ala Ile Met Gln Lys
1 5 10 15
Gly Asp Thr Asn Ile Lys Pro Ile Leu Gln Val Ile Asn Ile Arg Pro
20 25 30
Ile Thr Thr Gly Asn Ser Pro Pro Arg Tyr Arg Leu Leu Met Ser Asp
35 40 45
Gly Leu Asn Thr Leu Ser Ser Phe Met Leu Ala Thr Gln Leu Asn Pro
50 55 60
Leu Val Glu Glu Glu Gln Leu Ser Ser Asn Cys Val Cys Gln Ile His
65 70 75 80
Arg Phe Ile Val Asn Thr Leu Lys Asp Gly Arg Arg Val Val Ile Leu
85 90 95
Met Glu Leu Glu Val Leu Lys Ser Ala Glu Ala Val Gly Val Lys Ile
100 105 110
Gly Asn Pro Val Pro Tyr Asn Glu Gly Leu Gly Gln Pro Gln Val Ala
115 120 125
Pro Pro Ala Pro Ala Ala Ser Pro Ala Ala Ser Ser Arg Pro Gln Pro
130 135 140
Gln Asn Gly Ser Ser Gly Met Gly Ser Thr Val Ser Lys Ala Tyr Gly
145 150 155 160
Ala Ser Lys Thr Phe Gly Lys Ala Ala Gly Pro Ser Leu Ser His Thr
165 170 175
Ser Gly Gly Thr Gln Ser Lys Val Val Pro Ile Ala Ser Leu Thr Pro
180 185 190
Tyr Gln Ser Lys Trp Thr Ile Cys Ala Arg Val Thr Asn Lys Ser Gln
195 200 205
Ile Arg Thr Trp Ser Asn Ser Arg Gly Glu Gly Lys Leu Phe Ser Leu
210 215 220
Glu Leu Val Asp Glu Ser Gly Glu Ile Arg Ala Thr Ala Phe Asn Glu
225 230 235 240
Gln Val Asp Lys Phe Phe Pro Leu Ile Glu Val Asn Lys Val Tyr Tyr
245 250 255
Phe Ser Lys Gly Thr Leu Lys Ile Ala Asn Lys Gln Phe Thr Ala Val
260 265 270
Lys Asn Asp Tyr Glu Met Thr Phe Asn Asn Glu Thr Ser Val Met Pro
275 280 285
Cys Glu Asp Asp His His Leu Pro Thr Val Gln Phe Asp Phe Thr Gly
290 295 300
Ile Asp Asp Leu Glu Asn Lys Ser Lys Asp Ser Leu Val Asp Ile Ile
305 310 315 320
Gly Ile Cys Lys Ser Tyr Glu Asp Ala Thr Lys Ile Thr Val Arg Ser
325 330 335
Asn Asn Arg Glu Val Ala Lys Arg Asn Ile Tyr Leu Met Asp Thr Ser
340 345 350
Gly Lys Val Val Thr Ala Thr Leu Trp Gly Glu Asp Ala Asp Lys Phe
355 360 365
Asp Gly Ser Arg Gln Pro Val Leu Ala Ile Lys Gly Ala Arg Val Ser
370 375 380
Asp Phe Gly Gly Arg Ser Leu Ser Val Leu Ser Ser Ser Thr Ile Ile
385 390 395 400
Ala Asn Pro Asp Ile Pro Glu Ala Tyr Lys Leu Arg Gly Trp Phe Asp
405 410 415
Ala Glu Gly Gln Ala Leu Asp Gly Val Ser Ile Ser Asp Leu Lys Ser
420 425 430
Gly Gly Val Gly Gly Ser Asn Thr Asn Trp Lys Thr Leu Tyr Glu Val
435 440 445
Lys Ser Glu Asn Leu Gly Gln Gly Asp Lys Pro Asp Tyr Phe Ser Ser
450 455 460
Val Ala Thr Val Val Tyr Leu Arg Lys Glu Asn Cys Met Tyr Gln Ala
465 470 475 480
Cys Pro Thr Gln Asp Cys Asn Lys Lys Val Ile Asp Gln Gln Asn Gly
485 490 495
Leu Tyr Arg Cys Glu Lys Cys Asp Thr Glu Phe Pro Asn Phe Lys Tyr
500 505 510
Arg Met Ile Leu Ser Val Asn Ile Ala Asp Phe Gln Glu Asn Gln Trp
515 520 525
Val Thr Cys Phe Gln Glu Ser Ala Glu Ala Ile Leu Gly Gln Asn Ala
530 535 540
Ala Tyr Leu Gly Glu Leu Lys Asp Lys Asn Glu Gln Ala Phe Glu Glu
545 550 555 560
Val Phe Gln Asn Ala Asn Phe Arg Ser Phe Ile Phe Arg Val Arg Val
565 570 575
Lys Val Glu Thr Tyr Asn Asp Glu Ser Arg Ile Lys Ala Thr Val Met
580 585 590
Asp Val Lys Pro Val Asp Tyr Arg Glu Tyr Gly Arg Arg Leu Val Met
595 600 605
Ser Ile Arg Arg Ser Ala Leu Met
610 615
<210> 51
<211> 270
<212> PRT
<213> 智人
<400> 51
Met Trp Asn Ser Gly Phe Glu Ser Tyr Gly Ser Ser Ser Tyr Gly Gly
1 5 10 15
Ala Gly Gly Tyr Thr Gln Ser Pro Gly Gly Phe Gly Ser Pro Ala Pro
20 25 30
Ser Gln Ala Glu Lys Lys Ser Arg Ala Arg Ala Gln His Ile Val Pro
35 40 45
Cys Thr Ile Ser Gln Leu Leu Ser Ala Thr Leu Val Asp Glu Val Phe
50 55 60
Arg Ile Gly Asn Val Glu Ile Ser Gln Val Thr Ile Val Gly Ile Ile
65 70 75 80
Arg His Ala Glu Lys Ala Pro Thr Asn Ile Val Tyr Lys Ile Asp Asp
85 90 95
Met Thr Ala Ala Pro Met Asp Val Arg Gln Trp Val Asp Thr Asp Asp
100 105 110
Thr Ser Ser Glu Asn Thr Val Val Pro Pro Glu Thr Tyr Val Lys Val
115 120 125
Ala Gly His Leu Arg Ser Phe Gln Asn Lys Lys Ser Leu Val Ala Phe
130 135 140
Lys Ile Met Pro Leu Glu Asp Met Asn Glu Phe Thr Thr His Ile Leu
145 150 155 160
Glu Val Ile Asn Ala His Met Val Leu Ser Lys Ala Asn Ser Gln Pro
165 170 175
Ser Ala Gly Arg Ala Pro Ile Ser Asn Pro Gly Met Ser Glu Ala Gly
180 185 190
Asn Phe Gly Gly Asn Ser Phe Met Pro Ala Asn Gly Leu Thr Val Ala
195 200 205
Gln Asn Gln Val Leu Asn Leu Ile Lys Ala Cys Pro Arg Pro Glu Gly
210 215 220
Leu Asn Phe Gln Asp Leu Lys Asn Gln Leu Lys His Met Ser Val Ser
225 230 235 240
Ser Ile Lys Gln Ala Val Asp Phe Leu Ser Asn Glu Gly His Ile Tyr
245 250 255
Ser Thr Val Asp Asp Asp His Phe Lys Ser Thr Asp Ala Glu
260 265 270
<210> 52
<211> 121
<212> PRT
<213> 智人
<400> 52
Met Val Asp Met Met Asp Leu Pro Arg Ser Arg Ile Asn Ala Gly Met
1 5 10 15
Leu Ala Gln Phe Ile Asp Lys Pro Val Cys Phe Val Gly Arg Leu Glu
20 25 30
Lys Ile His Pro Thr Gly Lys Met Phe Ile Leu Ser Asp Gly Glu Gly
35 40 45
Lys Asn Gly Thr Ile Glu Leu Met Glu Pro Leu Asp Glu Glu Ile Ser
50 55 60
Gly Ile Val Glu Val Val Gly Arg Val Thr Ala Lys Ala Thr Ile Leu
65 70 75 80
Cys Thr Ser Tyr Val Gln Phe Lys Glu Asp Ser His Pro Phe Asp Leu
85 90 95
Gly Leu Tyr Asn Glu Ala Val Lys Ile Ile His Asp Phe Pro Gln Phe
100 105 110
Tyr Pro Leu Gly Ile Val Gln His Asp
115 120
<210> 53
<211> 339
<212> PRT
<213> 智人
<400> 53
Met Ala Met Gln Met Gln Leu Glu Ala Asn Ala Asp Thr Ser Val Glu
1 5 10 15
Glu Glu Ser Phe Gly Pro Gln Pro Ile Ser Arg Leu Glu Gln Cys Gly
20 25 30
Ile Asn Ala Asn Asp Val Lys Lys Leu Glu Glu Ala Gly Phe His Thr
35 40 45
Val Glu Ala Val Ala Tyr Ala Pro Lys Lys Glu Leu Ile Asn Ile Lys
50 55 60
Gly Ile Ser Glu Ala Lys Ala Asp Lys Ile Leu Ala Glu Ala Ala Lys
65 70 75 80
Leu Val Pro Met Gly Phe Thr Thr Ala Thr Glu Phe His Gln Arg Arg
85 90 95
Ser Glu Ile Ile Gln Ile Thr Thr Gly Ser Lys Glu Leu Asp Lys Leu
100 105 110
Leu Gln Gly Gly Ile Glu Thr Gly Ser Ile Thr Glu Met Phe Gly Glu
115 120 125
Phe Arg Thr Gly Lys Thr Gln Ile Cys His Thr Leu Ala Val Thr Cys
130 135 140
Gln Leu Pro Ile Asp Arg Gly Gly Gly Glu Gly Lys Ala Met Tyr Ile
145 150 155 160
Asp Thr Glu Gly Thr Phe Arg Pro Glu Arg Leu Leu Ala Val Ala Glu
165 170 175
Arg Tyr Gly Leu Ser Gly Ser Asp Val Leu Asp Asn Val Ala Tyr Ala
180 185 190
Arg Ala Phe Asn Thr Asp His Gln Thr Gln Leu Leu Tyr Gln Ala Ser
195 200 205
Ala Met Met Val Glu Ser Arg Tyr Ala Leu Leu Ile Val Asp Ser Ala
210 215 220
Thr Ala Leu Tyr Arg Thr Asp Tyr Ser Gly Arg Gly Glu Leu Ser Ala
225 230 235 240
Arg Gln Met His Leu Ala Arg Phe Leu Arg Met Leu Leu Arg Leu Ala
245 250 255
Asp Glu Phe Gly Val Ala Val Val Ile Thr Asn Gln Val Val Ala Gln
260 265 270
Val Asp Gly Ala Ala Met Phe Ala Ala Asp Pro Lys Lys Pro Ile Gly
275 280 285
Gly Asn Ile Ile Ala His Ala Ser Thr Thr Arg Leu Tyr Leu Arg Lys
290 295 300
Gly Arg Gly Glu Thr Arg Ile Cys Lys Ile Tyr Asp Ser Pro Cys Leu
305 310 315 320
Pro Glu Ala Glu Ala Met Phe Ala Ile Asn Ala Asp Gly Val Gly Asp
325 330 335
Ala Lys Asp
<210> 54
<211> 418
<212> PRT
<213> 智人
<400> 54
Met Ser Gly Thr Glu Glu Ala Ile Leu Gly Gly Arg Asp Ser His Pro
1 5 10 15
Ala Ala Gly Gly Gly Ser Val Leu Cys Phe Gly Gln Cys Gln Tyr Thr
20 25 30
Ala Glu Glu Tyr Gln Ala Ile Gln Lys Ala Leu Arg Gln Arg Leu Gly
35 40 45
Pro Glu Tyr Ile Ser Ser Arg Met Ala Gly Gly Gly Gln Lys Val Cys
50 55 60
Tyr Ile Glu Gly His Arg Val Ile Asn Leu Ala Asn Glu Met Phe Gly
65 70 75 80
Tyr Asn Gly Trp Ala His Ser Ile Thr Gln Gln Asn Val Asp Phe Val
85 90 95
Asp Leu Asn Asn Gly Lys Phe Tyr Val Gly Val Cys Ala Phe Val Arg
100 105 110
Val Gln Leu Lys Asp Gly Ser Tyr His Glu Asp Val Gly Tyr Gly Val
115 120 125
Ser Glu Gly Leu Lys Ser Lys Ala Leu Ser Leu Glu Lys Ala Arg Lys
130 135 140
Glu Ala Val Thr Asp Gly Leu Lys Arg Ala Leu Arg Ser Phe Gly Asn
145 150 155 160
Ala Leu Gly Asn Cys Ile Leu Asp Lys Asp Tyr Leu Arg Ser Leu Asn
165 170 175
Lys Leu Pro Arg Gln Leu Pro Leu Glu Val Asp Leu Thr Lys Ala Lys
180 185 190
Arg Gln Asp Leu Glu Pro Ser Val Glu Glu Ala Arg Tyr Asn Ser Cys
195 200 205
Arg Pro Asn Met Ala Leu Gly His Pro Gln Leu Gln Gln Val Thr Ser
210 215 220
Pro Ser Arg Pro Ser His Ala Val Ile Pro Ala Asp Gln Asp Cys Ser
225 230 235 240
Ser Arg Ser Leu Ser Ser Ser Ala Val Glu Ser Glu Ala Thr His Gln
245 250 255
Arg Lys Leu Arg Gln Lys Gln Leu Gln Gln Gln Phe Arg Glu Arg Met
260 265 270
Glu Lys Gln Gln Val Arg Val Ser Thr Pro Ser Ala Glu Lys Ser Glu
275 280 285
Ala Ala Pro Pro Ala Pro Pro Val Thr His Ser Thr Pro Val Thr Val
290 295 300
Ser Glu Pro Leu Leu Glu Lys Asp Phe Leu Ala Gly Val Thr Gln Glu
305 310 315 320
Leu Ile Lys Thr Leu Glu Asp Asn Ser Glu Lys Trp Ala Val Thr Pro
325 330 335
Asp Ala Gly Asp Gly Val Val Lys Pro Ser Ser Arg Ala Asp Pro Ala
340 345 350
Gln Thr Ser Asp Thr Leu Ala Leu Asn Asn Gln Met Val Thr Gln Asn
355 360 365
Arg Thr Pro His Ser Val Cys His Gln Lys Pro Gln Ala Lys Ser Gly
370 375 380
Ser Trp Asp Leu Gln Thr Tyr Ser Ala Asp Gln Arg Thr Thr Gly Asn
385 390 395 400
Trp Glu Ser His Arg Lys Ser Gln Asp Met Lys Lys Arg Lys Tyr Asp
405 410 415
Pro Ser
<210> 55
<211> 1417
<212> PRT
<213> 智人
<400> 55
Met Ala Ala Val Pro Gln Asn Asn Leu Gln Glu Gln Leu Glu Arg His
1 5 10 15
Ser Ala Arg Thr Leu Asn Asn Lys Leu Ser Leu Ser Lys Pro Lys Phe
20 25 30
Ser Gly Phe Thr Phe Lys Lys Lys Thr Ser Ser Asp Asn Asn Val Ser
35 40 45
Val Thr Asn Val Ser Val Ala Lys Thr Pro Val Leu Arg Asn Lys Asp
50 55 60
Val Asn Val Thr Glu Asp Phe Ser Phe Ser Glu Pro Leu Pro Asn Thr
65 70 75 80
Thr Asn Gln Gln Arg Val Lys Asp Phe Phe Lys Asn Ala Pro Ala Gly
85 90 95
Gln Glu Thr Gln Arg Gly Gly Ser Lys Ser Leu Leu Pro Asp Phe Leu
100 105 110
Gln Thr Pro Lys Glu Val Val Cys Thr Thr Gln Asn Thr Pro Thr Val
115 120 125
Lys Lys Ser Arg Asp Thr Ala Leu Lys Lys Leu Glu Phe Ser Ser Ser
130 135 140
Pro Asp Ser Leu Ser Thr Ile Asn Asp Trp Asp Asp Met Asp Asp Phe
145 150 155 160
Asp Thr Ser Glu Thr Ser Lys Ser Phe Val Thr Pro Pro Gln Ser His
165 170 175
Phe Val Arg Val Ser Thr Ala Gln Lys Ser Lys Lys Gly Lys Arg Asn
180 185 190
Phe Phe Lys Ala Gln Leu Tyr Thr Thr Asn Thr Val Lys Thr Asp Leu
195 200 205
Pro Pro Pro Ser Ser Glu Ser Glu Gln Ile Asp Leu Thr Glu Glu Gln
210 215 220
Lys Asp Asp Ser Glu Trp Leu Ser Ser Asp Val Ile Cys Ile Asp Asp
225 230 235 240
Gly Pro Ile Ala Glu Val His Ile Asn Glu Asp Ala Gln Glu Ser Asp
245 250 255
Ser Leu Lys Thr His Leu Glu Asp Glu Arg Asp Asn Ser Glu Lys Lys
260 265 270
Lys Asn Leu Glu Glu Ala Glu Leu His Ser Thr Glu Lys Val Pro Cys
275 280 285
Ile Glu Phe Asp Asp Asp Asp Tyr Asp Thr Asp Phe Val Pro Pro Ser
290 295 300
Pro Glu Glu Ile Ile Ser Ala Ser Ser Ser Ser Ser Lys Cys Leu Ser
305 310 315 320
Thr Leu Lys Asp Leu Asp Thr Ser Asp Arg Lys Glu Asp Val Leu Ser
325 330 335
Thr Ser Lys Asp Leu Leu Ser Lys Pro Glu Lys Met Ser Met Gln Glu
340 345 350
Leu Asn Pro Glu Thr Ser Thr Asp Cys Asp Ala Arg Gln Ile Ser Leu
355 360 365
Gln Gln Gln Leu Ile His Val Met Glu His Ile Cys Lys Leu Ile Asp
370 375 380
Thr Ile Pro Asp Asp Lys Leu Lys Leu Leu Asp Cys Gly Asn Glu Leu
385 390 395 400
Leu Gln Gln Arg Asn Ile Arg Arg Lys Leu Leu Thr Glu Val Asp Phe
405 410 415
Asn Lys Ser Asp Ala Ser Leu Leu Gly Ser Leu Trp Arg Tyr Arg Pro
420 425 430
Asp Ser Leu Asp Gly Pro Met Glu Gly Asp Ser Cys Pro Thr Gly Asn
435 440 445
Ser Met Lys Glu Leu Asn Phe Ser His Leu Pro Ser Asn Ser Val Ser
450 455 460
Pro Gly Asp Cys Leu Leu Thr Thr Thr Leu Gly Lys Thr Gly Phe Ser
465 470 475 480
Ala Thr Arg Lys Asn Leu Phe Glu Arg Pro Leu Phe Asn Thr His Leu
485 490 495
Gln Lys Ser Phe Val Ser Ser Asn Trp Ala Glu Thr Pro Arg Leu Gly
500 505 510
Lys Lys Asn Glu Ser Ser Tyr Phe Pro Gly Asn Val Leu Thr Ser Thr
515 520 525
Ala Val Lys Asp Gln Asn Lys His Thr Ala Ser Ile Asn Asp Leu Glu
530 535 540
Arg Glu Thr Gln Pro Ser Tyr Asp Ile Asp Asn Phe Asp Ile Asp Asp
545 550 555 560
Phe Asp Asp Asp Asp Asp Trp Glu Asp Ile Met His Asn Leu Ala Ala
565 570 575
Ser Lys Ser Ser Thr Ala Ala Tyr Gln Pro Ile Lys Glu Gly Arg Pro
580 585 590
Ile Lys Ser Val Ser Glu Arg Leu Ser Ser Ala Lys Thr Asp Cys Leu
595 600 605
Pro Val Ser Ser Thr Ala Gln Asn Ile Asn Phe Ser Glu Ser Ile Gln
610 615 620
Asn Tyr Thr Asp Lys Ser Ala Gln Asn Leu Ala Ser Arg Asn Leu Lys
625 630 635 640
His Glu Arg Phe Gln Ser Leu Ser Phe Pro His Thr Lys Glu Met Met
645 650 655
Lys Ile Phe His Lys Lys Phe Gly Leu His Asn Phe Arg Thr Asn Gln
660 665 670
Leu Glu Ala Ile Asn Ala Ala Leu Leu Gly Glu Asp Cys Phe Ile Leu
675 680 685
Met Pro Thr Gly Gly Gly Lys Ser Leu Cys Tyr Gln Leu Pro Ala Cys
690 695 700
Val Ser Pro Gly Val Thr Val Val Ile Ser Pro Leu Arg Ser Leu Ile
705 710 715 720
Val Asp Gln Val Gln Lys Leu Thr Ser Leu Asp Ile Pro Ala Thr Tyr
725 730 735
Leu Thr Gly Asp Lys Thr Asp Ser Glu Ala Thr Asn Ile Tyr Leu Gln
740 745 750
Leu Ser Lys Lys Asp Pro Ile Ile Lys Leu Leu Tyr Val Thr Pro Glu
755 760 765
Lys Ile Cys Ala Ser Asn Arg Leu Ile Ser Thr Leu Glu Asn Leu Tyr
770 775 780
Glu Arg Lys Leu Leu Ala Arg Phe Val Ile Asp Glu Ala His Cys Val
785 790 795 800
Ser Gln Trp Gly His Asp Phe Arg Gln Asp Tyr Lys Arg Met Asn Met
805 810 815
Leu Arg Gln Lys Phe Pro Ser Val Pro Val Met Ala Leu Thr Ala Thr
820 825 830
Ala Asn Pro Arg Val Gln Lys Asp Ile Leu Thr Gln Leu Lys Ile Leu
835 840 845
Arg Pro Gln Val Phe Ser Met Ser Phe Asn Arg His Asn Leu Lys Tyr
850 855 860
Tyr Val Leu Pro Lys Lys Pro Lys Lys Val Ala Phe Asp Cys Leu Glu
865 870 875 880
Trp Ile Arg Lys His His Pro Tyr Asp Ser Gly Ile Ile Tyr Cys Leu
885 890 895
Ser Arg Arg Glu Cys Asp Thr Met Ala Asp Thr Leu Gln Arg Asp Gly
900 905 910
Leu Ala Ala Leu Ala Tyr His Ala Gly Leu Ser Asp Ser Ala Arg Asp
915 920 925
Glu Val Gln Gln Lys Trp Ile Asn Gln Asp Gly Cys Gln Val Ile Cys
930 935 940
Ala Thr Ile Ala Phe Gly Met Gly Ile Asp Lys Pro Asp Val Arg Phe
945 950 955 960
Val Ile His Ala Ser Leu Pro Lys Ser Val Glu Gly Tyr Tyr Gln Glu
965 970 975
Ser Gly Arg Ala Gly Arg Asp Gly Glu Ile Ser His Cys Leu Leu Phe
980 985 990
Tyr Thr Tyr His Asp Val Thr Arg Leu Lys Arg Leu Ile Met Met Glu
995 1000 1005
Lys Asp Gly Asn His His Thr Arg Glu Thr His Phe Asn Asn Leu
1010 1015 1020
Tyr Ser Met Val His Tyr Cys Glu Asn Ile Thr Glu Cys Arg Arg
1025 1030 1035
Ile Gln Leu Leu Ala Tyr Phe Gly Glu Asn Gly Phe Asn Pro Asp
1040 1045 1050
Phe Cys Lys Lys His Pro Asp Val Ser Cys Asp Asn Cys Cys Lys
1055 1060 1065
Thr Lys Asp Tyr Lys Thr Arg Asp Val Thr Asp Asp Val Lys Ser
1070 1075 1080
Ile Val Arg Phe Val Gln Glu His Ser Ser Ser Gln Gly Met Arg
1085 1090 1095
Asn Ile Lys His Val Gly Pro Ser Gly Arg Phe Thr Met Asn Met
1100 1105 1110
Leu Val Asp Ile Phe Leu Gly Ser Lys Ser Ala Lys Ile Gln Ser
1115 1120 1125
Gly Ile Phe Gly Lys Gly Ser Ala Tyr Ser Arg His Asn Ala Glu
1130 1135 1140
Arg Leu Phe Lys Lys Leu Ile Leu Asp Lys Ile Leu Asp Glu Asp
1145 1150 1155
Leu Tyr Ile Asn Ala Asn Asp Gln Ala Ile Ala Tyr Val Met Leu
1160 1165 1170
Gly Asn Lys Ala Gln Thr Val Leu Asn Gly Asn Leu Lys Val Asp
1175 1180 1185
Phe Met Glu Thr Glu Asn Ser Ser Ser Val Lys Lys Gln Lys Ala
1190 1195 1200
Leu Val Ala Lys Val Ser Gln Arg Glu Glu Met Val Lys Lys Cys
1205 1210 1215
Leu Gly Glu Leu Thr Glu Val Cys Lys Ser Leu Gly Lys Val Phe
1220 1225 1230
Gly Val His Tyr Phe Asn Ile Phe Asn Thr Val Thr Leu Lys Lys
1235 1240 1245
Leu Ala Glu Ser Leu Ser Ser Asp Pro Glu Val Leu Leu Gln Ile
1250 1255 1260
Asp Gly Val Thr Glu Asp Lys Leu Glu Lys Tyr Gly Ala Glu Val
1265 1270 1275
Ile Ser Val Leu Gln Lys Tyr Ser Glu Trp Thr Ser Pro Ala Glu
1280 1285 1290
Asp Ser Ser Pro Gly Ile Ser Leu Ser Ser Ser Arg Gly Pro Gly
1295 1300 1305
Arg Ser Ala Ala Glu Glu Leu Asp Glu Glu Ile Pro Val Ser Ser
1310 1315 1320
His Tyr Phe Ala Ser Lys Thr Arg Asn Glu Arg Lys Arg Lys Lys
1325 1330 1335
Met Pro Ala Ser Gln Arg Ser Lys Arg Arg Lys Thr Ala Ser Ser
1340 1345 1350
Gly Ser Lys Ala Lys Gly Gly Ser Ala Thr Cys Arg Lys Ile Ser
1355 1360 1365
Ser Lys Thr Lys Ser Ser Ser Ile Ile Gly Ser Ser Ser Ala Ser
1370 1375 1380
His Thr Ser Gln Ala Thr Ser Gly Ala Asn Ser Lys Leu Gly Ile
1385 1390 1395
Met Ala Pro Pro Lys Pro Ile Asn Arg Pro Phe Leu Lys Pro Ser
1400 1405 1410
Tyr Ala Phe Ser
1415
<210> 56
<211> 846
<212> PRT
<213> 智人
<400> 56
Met Gly Ile Gln Gly Leu Leu Gln Phe Ile Lys Glu Ala Ser Glu Pro
1 5 10 15
Ile His Val Arg Lys Tyr Lys Gly Gln Val Val Ala Val Asp Thr Tyr
20 25 30
Cys Trp Leu His Lys Gly Ala Ile Ala Cys Ala Glu Lys Leu Ala Lys
35 40 45
Gly Glu Pro Thr Asp Arg Tyr Val Gly Phe Cys Met Lys Phe Val Asn
50 55 60
Met Leu Leu Ser His Gly Ile Lys Pro Ile Leu Val Phe Asp Gly Cys
65 70 75 80
Thr Leu Pro Ser Lys Lys Glu Val Glu Arg Ser Arg Arg Glu Arg Arg
85 90 95
Gln Ala Asn Leu Leu Lys Gly Lys Gln Leu Leu Arg Glu Gly Lys Val
100 105 110
Ser Glu Ala Arg Glu Cys Phe Thr Arg Ser Ile Asn Ile Thr His Ala
115 120 125
Met Ala His Lys Val Ile Lys Ala Ala Arg Ser Gln Gly Val Asp Cys
130 135 140
Leu Val Ala Pro Tyr Glu Ala Asp Ala Gln Leu Ala Tyr Leu Asn Lys
145 150 155 160
Ala Gly Ile Val Gln Ala Ile Ile Thr Glu Asp Ser Asp Leu Leu Ala
165 170 175
Phe Gly Cys Lys Lys Val Ile Leu Lys Met Asp Gln Phe Gly Asn Gly
180 185 190
Leu Glu Ile Asp Gln Ala Arg Leu Gly Met Cys Arg Gln Leu Gly Asp
195 200 205
Val Phe Thr Glu Glu Lys Phe Arg Tyr Met Cys Ile Leu Ser Gly Cys
210 215 220
Asp Tyr Leu Ser Ser Leu Arg Gly Ile Gly Leu Ala Lys Ala Cys Lys
225 230 235 240
Val Leu Arg Leu Ala Asn Asn Pro Asp Ile Val Lys Val Ile Lys Lys
245 250 255
Ile Gly His Tyr Leu Lys Met Asn Ile Thr Val Pro Glu Asp Tyr Ile
260 265 270
Asn Gly Phe Ile Arg Ala Asn Asn Thr Phe Leu Tyr Gln Leu Val Phe
275 280 285
Asp Pro Ile Lys Arg Lys Leu Ile Pro Leu Asn Ala Tyr Glu Asp Asp
290 295 300
Val Asp Pro Glu Thr Leu Ser Tyr Ala Gly Gln Tyr Val Asp Asp Ser
305 310 315 320
Ile Ala Leu Gln Ile Ala Leu Gly Asn Lys Asp Ile Asn Thr Phe Glu
325 330 335
Gln Ile Asp Asp Tyr Asn Pro Asp Thr Ala Met Pro Ala His Ser Arg
340 345 350
Ser His Ser Trp Asp Asp Lys Thr Cys Gln Lys Ser Ala Asn Val Ser
355 360 365
Ser Ile Trp His Arg Asn Tyr Ser Pro Arg Pro Glu Ser Gly Thr Val
370 375 380
Ser Asp Ala Pro Gln Leu Lys Glu Asn Pro Ser Thr Val Gly Val Glu
385 390 395 400
Arg Val Ile Ser Thr Lys Gly Leu Asn Leu Pro Arg Lys Ser Ser Ile
405 410 415
Val Lys Arg Pro Arg Ser Ala Glu Leu Ser Glu Asp Asp Leu Leu Ser
420 425 430
Gln Tyr Ser Leu Ser Phe Thr Lys Lys Thr Lys Lys Asn Ser Ser Glu
435 440 445
Gly Asn Lys Ser Leu Ser Phe Ser Glu Val Phe Val Pro Asp Leu Val
450 455 460
Asn Gly Pro Thr Asn Lys Lys Ser Val Ser Thr Pro Pro Arg Thr Arg
465 470 475 480
Asn Lys Phe Ala Thr Phe Leu Gln Arg Lys Asn Glu Glu Ser Gly Ala
485 490 495
Val Val Val Pro Gly Thr Arg Ser Arg Phe Phe Cys Ser Ser Asp Ser
500 505 510
Thr Asp Cys Val Ser Asn Lys Val Ser Ile Gln Pro Leu Asp Glu Thr
515 520 525
Ala Val Thr Asp Lys Glu Asn Asn Leu His Glu Ser Glu Tyr Gly Asp
530 535 540
Gln Glu Gly Lys Arg Leu Val Asp Thr Asp Val Ala Arg Asn Ser Ser
545 550 555 560
Asp Asp Ile Pro Asn Asn His Ile Pro Gly Asp His Ile Pro Asp Lys
565 570 575
Ala Thr Val Phe Thr Asp Glu Glu Ser Tyr Ser Phe Glu Ser Ser Lys
580 585 590
Phe Thr Arg Thr Ile Ser Pro Pro Thr Leu Gly Thr Leu Arg Ser Cys
595 600 605
Phe Ser Trp Ser Gly Gly Leu Gly Asp Phe Ser Arg Thr Pro Ser Pro
610 615 620
Ser Pro Ser Thr Ala Leu Gln Gln Phe Arg Arg Lys Ser Asp Ser Pro
625 630 635 640
Thr Ser Leu Pro Glu Asn Asn Met Ser Asp Val Ser Gln Leu Lys Ser
645 650 655
Glu Glu Ser Ser Asp Asp Glu Ser His Pro Leu Arg Glu Glu Ala Cys
660 665 670
Ser Ser Gln Ser Gln Glu Ser Gly Glu Phe Ser Leu Gln Ser Ser Asn
675 680 685
Ala Ser Lys Leu Ser Gln Cys Ser Ser Lys Asp Ser Asp Ser Glu Glu
690 695 700
Ser Asp Cys Asn Ile Lys Leu Leu Asp Ser Gln Ser Asp Gln Thr Ser
705 710 715 720
Lys Leu Arg Leu Ser His Phe Ser Lys Lys Asp Thr Pro Leu Arg Asn
725 730 735
Lys Val Pro Gly Leu Tyr Lys Ser Ser Ser Ala Asp Ser Leu Ser Thr
740 745 750
Thr Lys Ile Lys Pro Leu Gly Pro Ala Arg Ala Ser Gly Leu Ser Lys
755 760 765
Lys Pro Ala Ser Ile Gln Lys Arg Lys His His Asn Ala Glu Asn Lys
770 775 780
Pro Gly Leu Gln Ile Lys Leu Asn Glu Leu Trp Lys Asn Phe Gly Phe
785 790 795 800
Lys Lys Asp Ser Glu Lys Leu Pro Pro Cys Lys Lys Pro Leu Ser Pro
805 810 815
Val Arg Asp Asn Ile Gln Leu Thr Pro Glu Ala Glu Glu Asp Ile Phe
820 825 830
Asn Lys Pro Glu Cys Gly Arg Val Gln Arg Ala Ile Phe Gln
835 840 845
<210> 57
<211> 649
<212> PRT
<213> 智人
<400> 57
Met Ala Ser Val Ser Ala Leu Thr Glu Glu Leu Asp Ser Ile Thr Ser
1 5 10 15
Glu Leu His Ala Val Glu Ile Gln Ile Gln Glu Leu Thr Glu Arg Gln
20 25 30
Gln Glu Leu Ile Gln Lys Lys Lys Val Leu Thr Lys Lys Ile Lys Gln
35 40 45
Cys Leu Glu Asp Ser Asp Ala Gly Ala Ser Asn Glu Tyr Asp Ser Ser
50 55 60
Pro Ala Ala Trp Asn Lys Glu Asp Phe Pro Trp Ser Gly Lys Val Lys
65 70 75 80
Asp Ile Leu Gln Asn Val Phe Lys Leu Glu Lys Phe Arg Pro Leu Gln
85 90 95
Leu Glu Thr Ile Asn Val Thr Met Ala Gly Lys Glu Val Phe Leu Val
100 105 110
Met Pro Thr Gly Gly Gly Lys Ser Leu Cys Tyr Gln Leu Pro Ala Leu
115 120 125
Cys Ser Asp Gly Phe Thr Leu Val Ile Cys Pro Leu Ile Ser Leu Met
130 135 140
Glu Asp Gln Leu Met Val Leu Lys Gln Leu Gly Ile Ser Ala Thr Met
145 150 155 160
Leu Asn Ala Ser Ser Ser Lys Glu His Val Lys Trp Val His Ala Glu
165 170 175
Met Val Asn Lys Asn Ser Glu Leu Lys Leu Ile Tyr Val Thr Pro Glu
180 185 190
Lys Ile Ala Lys Ser Lys Met Phe Met Ser Arg Leu Glu Lys Ala Tyr
195 200 205
Glu Ala Arg Arg Phe Thr Arg Ile Ala Val Asp Glu Val His Cys Cys
210 215 220
Ser Gln Trp Gly His Asp Phe Arg Pro Asp Tyr Lys Ala Leu Gly Ile
225 230 235 240
Leu Lys Arg Gln Phe Pro Asn Ala Ser Leu Ile Gly Leu Thr Ala Thr
245 250 255
Ala Thr Asn His Val Leu Thr Asp Ala Gln Lys Ile Leu Cys Ile Glu
260 265 270
Lys Cys Phe Thr Phe Thr Ala Ser Phe Asn Arg Pro Asn Leu Tyr Tyr
275 280 285
Glu Val Arg Gln Lys Pro Ser Asn Thr Glu Asp Phe Ile Glu Asp Ile
290 295 300
Val Lys Leu Ile Asn Gly Arg Tyr Lys Gly Gln Ser Gly Ile Ile Tyr
305 310 315 320
Cys Phe Ser Gln Lys Asp Ser Glu Gln Val Thr Val Ser Leu Gln Asn
325 330 335
Leu Gly Ile His Ala Gly Ala Tyr His Ala Asn Leu Glu Pro Glu Asp
340 345 350
Lys Thr Thr Val His Arg Lys Trp Ser Ala Asn Glu Ile Gln Val Val
355 360 365
Val Ala Thr Val Ala Phe Gly Met Gly Ile Asp Lys Pro Asp Val Arg
370 375 380
Phe Val Ile His His Ser Met Ser Lys Ser Met Glu Asn Tyr Tyr Gln
385 390 395 400
Glu Ser Gly Arg Ala Gly Arg Asp Asp Met Lys Ala Asp Cys Ile Leu
405 410 415
Tyr Tyr Gly Phe Gly Asp Ile Phe Arg Ile Ser Ser Met Val Val Met
420 425 430
Glu Asn Val Gly Gln Gln Lys Leu Tyr Glu Met Val Ser Tyr Cys Gln
435 440 445
Asn Ile Ser Lys Cys Arg Arg Val Leu Met Ala Gln His Phe Asp Glu
450 455 460
Val Trp Asn Ser Glu Ala Cys Asn Lys Met Cys Asp Asn Cys Cys Lys
465 470 475 480
Asp Ser Ala Phe Glu Arg Lys Asn Ile Thr Glu Tyr Cys Arg Asp Leu
485 490 495
Ile Lys Ile Leu Lys Gln Ala Glu Glu Leu Asn Glu Lys Leu Thr Pro
500 505 510
Leu Lys Leu Ile Asp Ser Trp Met Gly Lys Gly Ala Ala Lys Leu Arg
515 520 525
Val Ala Gly Val Val Ala Pro Thr Leu Pro Arg Glu Asp Leu Glu Lys
530 535 540
Ile Ile Ala His Phe Leu Ile Gln Gln Tyr Leu Lys Glu Asp Tyr Ser
545 550 555 560
Phe Thr Ala Tyr Ala Thr Ile Ser Tyr Leu Lys Ile Gly Pro Lys Ala
565 570 575
Asn Leu Leu Asn Asn Glu Ala His Ala Ile Thr Met Gln Val Thr Lys
580 585 590
Ser Thr Gln Asn Ser Phe Arg Ala Glu Ser Ser Gln Thr Cys His Ser
595 600 605
Glu Gln Gly Asp Lys Lys Met Glu Glu Lys Asn Ser Gly Asn Phe Gln
610 615 620
Lys Lys Ala Ala Asn Met Leu Gln Gln Ser Gly Ser Lys Asn Thr Gly
625 630 635 640
Ala Lys Lys Arg Lys Ile Asp Asp Ala
645
<210> 58
<211> 760
<212> PRT
<213> 智人
<400> 58
Met Lys Leu Asn Val Asp Gly Leu Leu Val Tyr Phe Pro Tyr Asp Tyr
1 5 10 15
Ile Tyr Pro Glu Gln Phe Ser Tyr Met Arg Glu Leu Lys Arg Thr Leu
20 25 30
Asp Ala Lys Gly His Gly Val Leu Glu Met Pro Ser Gly Thr Gly Lys
35 40 45
Thr Val Ser Leu Leu Ala Leu Ile Met Ala Tyr Gln Arg Ala Tyr Pro
50 55 60
Leu Glu Val Thr Lys Leu Ile Tyr Cys Ser Arg Thr Val Pro Glu Ile
65 70 75 80
Glu Lys Val Ile Glu Glu Leu Arg Lys Leu Leu Asn Phe Tyr Glu Lys
85 90 95
Gln Glu Gly Glu Lys Leu Pro Phe Leu Gly Leu Ala Leu Ser Ser Arg
100 105 110
Lys Asn Leu Cys Ile His Pro Glu Val Thr Pro Leu Arg Phe Gly Lys
115 120 125
Asp Val Asp Gly Lys Cys His Ser Leu Thr Ala Ser Tyr Val Arg Ala
130 135 140
Gln Tyr Gln His Asp Thr Ser Leu Pro His Cys Arg Phe Tyr Glu Glu
145 150 155 160
Phe Asp Ala His Gly Arg Glu Val Pro Leu Pro Ala Gly Ile Tyr Asn
165 170 175
Leu Asp Asp Leu Lys Ala Leu Gly Arg Arg Gln Gly Trp Cys Pro Tyr
180 185 190
Phe Leu Ala Arg Tyr Ser Ile Leu His Ala Asn Val Val Val Tyr Ser
195 200 205
Tyr His Tyr Leu Leu Asp Pro Lys Ile Ala Asp Leu Val Ser Lys Glu
210 215 220
Leu Ala Arg Lys Ala Val Val Val Phe Asp Glu Ala His Asn Ile Asp
225 230 235 240
Asn Val Cys Ile Asp Ser Met Ser Val Asn Leu Thr Arg Arg Thr Leu
245 250 255
Asp Arg Cys Gln Gly Asn Leu Glu Thr Leu Gln Lys Thr Val Leu Arg
260 265 270
Ile Lys Glu Thr Asp Glu Gln Arg Leu Arg Asp Glu Tyr Arg Arg Leu
275 280 285
Val Glu Gly Leu Arg Glu Ala Ser Ala Ala Arg Glu Thr Asp Ala His
290 295 300
Leu Ala Asn Pro Val Leu Pro Asp Glu Val Leu Gln Glu Ala Val Pro
305 310 315 320
Gly Ser Ile Arg Thr Ala Glu His Phe Leu Gly Phe Leu Arg Arg Leu
325 330 335
Leu Glu Tyr Val Lys Trp Arg Leu Arg Val Gln His Val Val Gln Glu
340 345 350
Ser Pro Pro Ala Phe Leu Ser Gly Leu Ala Gln Arg Val Cys Ile Gln
355 360 365
Arg Lys Pro Leu Arg Phe Cys Ala Glu Arg Leu Arg Ser Leu Leu His
370 375 380
Thr Leu Glu Ile Thr Asp Leu Ala Asp Phe Ser Pro Leu Thr Leu Leu
385 390 395 400
Ala Asn Phe Ala Thr Leu Val Ser Thr Tyr Ala Lys Gly Phe Thr Ile
405 410 415
Ile Ile Glu Pro Phe Asp Asp Arg Thr Pro Thr Ile Ala Asn Pro Ile
420 425 430
Leu His Phe Ser Cys Met Asp Ala Ser Leu Ala Ile Lys Pro Val Phe
435 440 445
Glu Arg Phe Gln Ser Val Ile Ile Thr Ser Gly Thr Leu Ser Pro Leu
450 455 460
Asp Ile Tyr Pro Lys Ile Leu Asp Phe His Pro Val Thr Met Ala Thr
465 470 475 480
Phe Thr Met Thr Leu Ala Arg Val Cys Leu Cys Pro Met Ile Ile Gly
485 490 495
Arg Gly Asn Asp Gln Val Ala Ile Ser Ser Lys Phe Glu Thr Arg Glu
500 505 510
Asp Ile Ala Val Ile Arg Asn Tyr Gly Asn Leu Leu Leu Glu Met Ser
515 520 525
Ala Val Val Pro Asp Gly Ile Val Ala Phe Phe Thr Ser Tyr Gln Tyr
530 535 540
Met Glu Ser Thr Val Ala Ser Trp Tyr Glu Gln Gly Ile Leu Glu Asn
545 550 555 560
Ile Gln Arg Asn Lys Leu Leu Phe Ile Glu Thr Gln Asp Gly Ala Glu
565 570 575
Thr Ser Val Ala Leu Glu Lys Tyr Gln Glu Ala Cys Glu Asn Gly Arg
580 585 590
Gly Ala Ile Leu Leu Ser Val Ala Arg Gly Lys Val Ser Glu Gly Ile
595 600 605
Asp Phe Val His His Tyr Gly Arg Ala Val Ile Met Phe Gly Val Pro
610 615 620
Tyr Val Tyr Thr Gln Ser Arg Ile Leu Lys Ala Arg Leu Glu Tyr Leu
625 630 635 640
Arg Asp Gln Phe Gln Ile Arg Glu Asn Asp Phe Leu Thr Phe Asp Ala
645 650 655
Met Arg His Ala Ala Gln Cys Val Gly Arg Ala Ile Arg Gly Lys Thr
660 665 670
Asp Tyr Gly Leu Met Val Phe Ala Asp Lys Arg Phe Ala Arg Gly Asp
675 680 685
Lys Arg Gly Lys Leu Pro Arg Trp Ile Gln Glu His Leu Thr Asp Ala
690 695 700
Asn Leu Asn Leu Thr Val Asp Glu Gly Val Gln Val Ala Lys Tyr Phe
705 710 715 720
Leu Arg Gln Met Ala Gln Pro Phe His Arg Glu Asp Gln Leu Gly Leu
725 730 735
Ser Leu Leu Ser Leu Glu Gln Leu Glu Ser Glu Glu Thr Leu Lys Arg
740 745 750
Ile Glu Gln Ile Ala Gln Gln Leu
755 760
<210> 59
<211> 782
<212> PRT
<213> 智人
<400> 59
Met Gly Lys Arg Asp Arg Ala Asp Arg Asp Lys Lys Lys Ser Arg Lys
1 5 10 15
Arg His Tyr Glu Asp Glu Glu Asp Asp Glu Glu Asp Ala Pro Gly Asn
20 25 30
Asp Pro Gln Glu Ala Val Pro Ser Ala Ala Gly Lys Gln Val Asp Glu
35 40 45
Ser Gly Thr Lys Val Asp Glu Tyr Gly Ala Lys Asp Tyr Arg Leu Gln
50 55 60
Met Pro Leu Lys Asp Asp His Thr Ser Arg Pro Leu Trp Val Ala Pro
65 70 75 80
Asp Gly His Ile Phe Leu Glu Ala Phe Ser Pro Val Tyr Lys Tyr Ala
85 90 95
Gln Asp Phe Leu Val Ala Ile Ala Glu Pro Val Cys Arg Pro Thr His
100 105 110
Val His Glu Tyr Lys Leu Thr Ala Tyr Ser Leu Tyr Ala Ala Val Ser
115 120 125
Val Gly Leu Gln Thr Ser Asp Ile Thr Glu Tyr Leu Arg Lys Leu Ser
130 135 140
Lys Thr Gly Val Pro Asp Gly Ile Met Gln Phe Ile Lys Leu Cys Thr
145 150 155 160
Val Ser Tyr Gly Lys Val Lys Leu Val Leu Lys His Asn Arg Tyr Phe
165 170 175
Val Glu Ser Cys His Pro Asp Val Ile Gln His Leu Leu Gln Asp Pro
180 185 190
Val Ile Arg Glu Cys Arg Leu Arg Asn Ser Glu Gly Glu Ala Thr Glu
195 200 205
Leu Ile Thr Glu Thr Phe Thr Ser Lys Ser Ala Ile Ser Lys Thr Ala
210 215 220
Glu Ser Ser Gly Gly Pro Ser Thr Ser Arg Val Thr Asp Pro Gln Gly
225 230 235 240
Lys Ser Asp Ile Pro Met Asp Leu Phe Asp Phe Tyr Glu Gln Met Asp
245 250 255
Lys Asp Glu Glu Glu Glu Glu Glu Thr Gln Thr Val Ser Phe Glu Val
260 265 270
Lys Gln Glu Met Ile Glu Glu Leu Gln Lys Arg Cys Ile His Leu Glu
275 280 285
Tyr Pro Leu Leu Ala Glu Tyr Asp Phe Arg Asn Asp Ser Val Asn Pro
290 295 300
Asp Ile Asn Ile Asp Leu Lys Pro Thr Ala Val Leu Arg Pro Tyr Gln
305 310 315 320
Glu Lys Ser Leu Arg Lys Met Phe Gly Asn Gly Arg Ala Arg Ser Gly
325 330 335
Val Ile Val Leu Pro Cys Gly Ala Gly Lys Ser Leu Val Gly Val Thr
340 345 350
Ala Ala Cys Thr Val Arg Lys Arg Cys Leu Val Leu Gly Asn Ser Ala
355 360 365
Val Ser Val Glu Gln Trp Lys Ala Gln Phe Lys Met Trp Ser Thr Ile
370 375 380
Asp Asp Ser Gln Ile Cys Arg Phe Thr Ser Asp Ala Lys Asp Lys Pro
385 390 395 400
Ile Gly Cys Ser Val Ala Ile Ser Thr Tyr Ser Met Leu Gly His Thr
405 410 415
Thr Lys Arg Ser Trp Glu Ala Glu Arg Val Met Glu Trp Leu Lys Thr
420 425 430
Gln Glu Trp Gly Leu Met Ile Leu Asp Glu Val His Thr Ile Pro Ala
435 440 445
Lys Met Phe Arg Arg Val Leu Thr Ile Val Gln Ala His Cys Lys Leu
450 455 460
Gly Leu Thr Ala Thr Leu Val Arg Glu Asp Asp Lys Ile Val Asp Leu
465 470 475 480
Asn Phe Leu Ile Gly Pro Lys Leu Tyr Glu Ala Asn Trp Met Glu Leu
485 490 495
Gln Asn Asn Gly Tyr Ile Ala Lys Val Gln Cys Ala Glu Val Trp Cys
500 505 510
Pro Met Ser Pro Glu Phe Tyr Arg Glu Tyr Val Ala Ile Lys Thr Lys
515 520 525
Lys Arg Ile Leu Leu Tyr Thr Met Asn Pro Asn Lys Phe Arg Ala Cys
530 535 540
Gln Phe Leu Ile Lys Phe His Glu Arg Arg Asn Asp Lys Ile Ile Val
545 550 555 560
Phe Ala Asp Asn Val Phe Ala Leu Lys Glu Tyr Ala Ile Arg Leu Asn
565 570 575
Lys Pro Tyr Ile Tyr Gly Pro Thr Ser Gln Gly Glu Arg Met Gln Ile
580 585 590
Leu Gln Asn Phe Lys His Asn Pro Lys Ile Asn Thr Ile Phe Ile Ser
595 600 605
Lys Val Gly Asp Thr Ser Phe Asp Leu Pro Glu Ala Asn Val Leu Ile
610 615 620
Gln Ile Ser Ser His Gly Gly Ser Arg Arg Gln Glu Ala Gln Arg Leu
625 630 635 640
Gly Arg Val Leu Arg Ala Lys Lys Gly Met Val Ala Glu Glu Tyr Asn
645 650 655
Ala Phe Phe Tyr Ser Leu Val Ser Gln Asp Thr Gln Glu Met Ala Tyr
660 665 670
Ser Thr Lys Arg Gln Arg Phe Leu Val Asp Gln Gly Tyr Ser Phe Lys
675 680 685
Val Ile Thr Lys Leu Ala Gly Met Glu Glu Glu Asp Leu Ala Phe Ser
690 695 700
Thr Lys Glu Glu Gln Gln Gln Leu Leu Gln Lys Val Leu Ala Ala Thr
705 710 715 720
Asp Leu Asp Ala Glu Glu Glu Val Val Ala Gly Glu Phe Gly Ser Arg
725 730 735
Ser Ser Gln Ala Ser Arg Arg Phe Gly Thr Met Ser Ser Met Ser Gly
740 745 750
Ala Asp Asp Thr Val Tyr Met Glu Tyr His Ser Ser Arg Ser Lys Ala
755 760 765
Pro Ser Lys His Val His Pro Leu Phe Lys Arg Phe Arg Lys
770 775 780
<210> 60
<211> 1432
<212> PRT
<213> 智人
<400> 60
Met Ser Glu Lys Lys Leu Glu Thr Thr Ala Gln Gln Arg Lys Cys Pro
1 5 10 15
Glu Trp Met Asn Val Gln Asn Lys Arg Cys Ala Val Glu Glu Arg Lys
20 25 30
Ala Cys Val Arg Lys Ser Val Phe Glu Asp Asp Leu Pro Phe Leu Glu
35 40 45
Phe Thr Gly Ser Ile Val Tyr Ser Tyr Asp Ala Ser Asp Cys Ser Phe
50 55 60
Leu Ser Glu Asp Ile Ser Met Ser Leu Ser Asp Gly Asp Val Val Gly
65 70 75 80
Phe Asp Met Glu Trp Pro Pro Leu Tyr Asn Arg Gly Lys Leu Gly Lys
85 90 95
Val Ala Leu Ile Gln Leu Cys Val Ser Glu Ser Lys Cys Tyr Leu Phe
100 105 110
His Val Ser Ser Met Ser Val Phe Pro Gln Gly Leu Lys Met Leu Leu
115 120 125
Glu Asn Lys Ala Val Lys Lys Ala Gly Val Gly Ile Glu Gly Asp Gln
130 135 140
Trp Lys Leu Leu Arg Asp Phe Asp Ile Lys Leu Lys Asn Phe Val Glu
145 150 155 160
Leu Thr Asp Val Ala Asn Lys Lys Leu Lys Cys Thr Glu Thr Trp Ser
165 170 175
Leu Asn Ser Leu Val Lys His Leu Leu Gly Lys Gln Leu Leu Lys Asp
180 185 190
Lys Ser Ile Arg Cys Ser Asn Trp Ser Lys Phe Pro Leu Thr Glu Asp
195 200 205
Gln Lys Leu Tyr Ala Ala Thr Asp Ala Tyr Ala Gly Phe Ile Ile Tyr
210 215 220
Arg Asn Leu Glu Ile Leu Asp Asp Thr Val Gln Arg Phe Ala Ile Asn
225 230 235 240
Lys Glu Glu Glu Ile Leu Leu Ser Asp Met Asn Lys Gln Leu Thr Ser
245 250 255
Ile Ser Glu Glu Val Met Asp Leu Ala Lys His Leu Pro His Ala Phe
260 265 270
Ser Lys Leu Glu Asn Pro Arg Arg Val Ser Ile Leu Leu Lys Asp Ile
275 280 285
Ser Glu Asn Leu Tyr Ser Leu Arg Arg Met Ile Ile Gly Ser Thr Asn
290 295 300
Ile Glu Thr Glu Leu Arg Pro Ser Asn Asn Leu Asn Leu Leu Ser Phe
305 310 315 320
Glu Asp Ser Thr Thr Gly Gly Val Gln Gln Lys Gln Ile Arg Glu His
325 330 335
Glu Val Leu Ile His Val Glu Asp Glu Thr Trp Asp Pro Thr Leu Asp
340 345 350
His Leu Ala Lys His Asp Gly Glu Asp Val Leu Gly Asn Lys Val Glu
355 360 365
Arg Lys Glu Asp Gly Phe Glu Asp Gly Val Glu Asp Asn Lys Leu Lys
370 375 380
Glu Asn Met Glu Arg Ala Cys Leu Met Ser Leu Asp Ile Thr Glu His
385 390 395 400
Glu Leu Gln Ile Leu Glu Gln Gln Ser Gln Glu Glu Tyr Leu Ser Asp
405 410 415
Ile Ala Tyr Lys Ser Thr Glu His Leu Ser Pro Asn Asp Asn Glu Asn
420 425 430
Asp Thr Ser Tyr Val Ile Glu Ser Asp Glu Asp Leu Glu Met Glu Met
435 440 445
Leu Lys His Leu Ser Pro Asn Asp Asn Glu Asn Asp Thr Ser Tyr Val
450 455 460
Ile Glu Ser Asp Glu Asp Leu Glu Met Glu Met Leu Lys Ser Leu Glu
465 470 475 480
Asn Leu Asn Ser Gly Thr Val Glu Pro Thr His Ser Lys Cys Leu Lys
485 490 495
Met Glu Arg Asn Leu Gly Leu Pro Thr Lys Glu Glu Glu Glu Asp Asp
500 505 510
Glu Asn Glu Ala Asn Glu Gly Glu Glu Asp Asp Asp Lys Asp Phe Leu
515 520 525
Trp Pro Ala Pro Asn Glu Glu Gln Val Thr Cys Leu Lys Met Tyr Phe
530 535 540
Gly His Ser Ser Phe Lys Pro Val Gln Trp Lys Val Ile His Ser Val
545 550 555 560
Leu Glu Glu Arg Arg Asp Asn Val Ala Val Met Ala Thr Gly Tyr Gly
565 570 575
Lys Ser Leu Cys Phe Gln Tyr Pro Pro Val Tyr Val Gly Lys Ile Gly
580 585 590
Leu Val Ile Ser Pro Leu Ile Ser Leu Met Glu Asp Gln Val Leu Gln
595 600 605
Leu Lys Met Ser Asn Ile Pro Ala Cys Phe Leu Gly Ser Ala Gln Ser
610 615 620
Glu Asn Val Leu Thr Asp Ile Lys Leu Gly Lys Tyr Arg Ile Val Tyr
625 630 635 640
Val Thr Pro Glu Tyr Cys Ser Gly Asn Met Gly Leu Leu Gln Gln Leu
645 650 655
Glu Ala Asp Ile Gly Ile Thr Leu Ile Ala Val Asp Glu Ala His Cys
660 665 670
Ile Ser Glu Trp Gly His Asp Phe Arg Asp Ser Phe Arg Lys Leu Gly
675 680 685
Ser Leu Lys Thr Ala Leu Pro Met Val Pro Ile Val Ala Leu Thr Ala
690 695 700
Thr Ala Ser Ser Ser Ile Arg Glu Asp Ile Val Arg Cys Leu Asn Leu
705 710 715 720
Arg Asn Pro Gln Ile Thr Cys Thr Gly Phe Asp Arg Pro Asn Leu Tyr
725 730 735
Leu Glu Val Arg Arg Lys Thr Gly Asn Ile Leu Gln Asp Leu Gln Pro
740 745 750
Phe Leu Val Lys Thr Ser Ser His Trp Glu Phe Glu Gly Pro Thr Ile
755 760 765
Ile Tyr Cys Pro Ser Arg Lys Met Thr Gln Gln Val Thr Gly Glu Leu
770 775 780
Arg Lys Leu Asn Leu Ser Cys Gly Thr Tyr His Ala Gly Met Ser Phe
785 790 795 800
Ser Thr Arg Lys Asp Ile His His Arg Phe Val Arg Asp Glu Ile Gln
805 810 815
Cys Val Ile Ala Thr Ile Ala Phe Gly Met Gly Ile Asn Lys Ala Asp
820 825 830
Ile Arg Gln Val Ile His Tyr Gly Ala Pro Lys Asp Met Glu Ser Tyr
835 840 845
Tyr Gln Glu Ile Gly Arg Ala Gly Arg Asp Gly Leu Gln Ser Ser Cys
850 855 860
His Val Leu Trp Ala Pro Ala Asp Ile Asn Leu Asn Arg His Leu Leu
865 870 875 880
Thr Glu Ile Arg Asn Glu Lys Phe Arg Leu Tyr Lys Leu Lys Met Met
885 890 895
Ala Lys Met Glu Lys Tyr Leu His Ser Ser Arg Cys Arg Arg Gln Ile
900 905 910
Ile Leu Ser His Phe Glu Asp Lys Gln Val Gln Lys Ala Ser Leu Gly
915 920 925
Ile Met Gly Thr Glu Lys Cys Cys Asp Asn Cys Arg Ser Arg Leu Asp
930 935 940
His Cys Tyr Ser Met Asp Asp Ser Glu Asp Thr Ser Trp Asp Phe Gly
945 950 955 960
Pro Gln Ala Phe Lys Leu Leu Ser Ala Val Asp Ile Leu Gly Glu Lys
965 970 975
Phe Gly Ile Gly Leu Pro Ile Leu Phe Leu Arg Gly Ser Asn Ser Gln
980 985 990
Arg Leu Ala Asp Gln Tyr Arg Arg His Ser Leu Phe Gly Thr Gly Lys
995 1000 1005
Asp Gln Thr Glu Ser Trp Trp Lys Ala Phe Ser Arg Gln Leu Ile
1010 1015 1020
Thr Glu Gly Phe Leu Val Glu Val Ser Arg Tyr Asn Lys Phe Met
1025 1030 1035
Lys Ile Cys Ala Leu Thr Lys Lys Gly Arg Asn Trp Leu His Lys
1040 1045 1050
Ala Asn Thr Glu Ser Gln Ser Leu Ile Leu Gln Ala Asn Glu Glu
1055 1060 1065
Leu Cys Pro Lys Lys Leu Leu Leu Pro Ser Ser Lys Thr Val Ser
1070 1075 1080
Ser Gly Thr Lys Glu His Cys Tyr Asn Gln Val Pro Val Glu Leu
1085 1090 1095
Ser Thr Glu Lys Lys Ser Asn Leu Glu Lys Leu Tyr Ser Tyr Lys
1100 1105 1110
Pro Cys Asp Lys Ile Ser Ser Gly Ser Asn Ile Ser Lys Lys Ser
1115 1120 1125
Ile Met Val Gln Ser Pro Glu Lys Ala Tyr Ser Ser Ser Gln Pro
1130 1135 1140
Val Ile Ser Ala Gln Glu Gln Glu Thr Gln Ile Val Leu Tyr Gly
1145 1150 1155
Lys Leu Val Glu Ala Arg Gln Lys His Ala Asn Lys Met Asp Val
1160 1165 1170
Pro Pro Ala Ile Leu Ala Thr Asn Lys Ile Leu Val Asp Met Ala
1175 1180 1185
Lys Met Arg Pro Thr Thr Val Glu Asn Val Lys Arg Ile Asp Gly
1190 1195 1200
Val Ser Glu Gly Lys Ala Ala Met Leu Ala Pro Leu Leu Glu Val
1205 1210 1215
Ile Lys His Phe Cys Gln Thr Asn Ser Val Gln Thr Asp Leu Phe
1220 1225 1230
Ser Ser Thr Lys Pro Gln Glu Glu Gln Lys Thr Ser Leu Val Ala
1235 1240 1245
Lys Asn Lys Ile Cys Thr Leu Ser Gln Ser Met Ala Ile Thr Tyr
1250 1255 1260
Ser Leu Phe Gln Glu Lys Lys Met Pro Leu Lys Ser Ile Ala Glu
1265 1270 1275
Ser Arg Ile Leu Pro Leu Met Thr Ile Gly Met His Leu Ser Gln
1280 1285 1290
Ala Val Lys Ala Gly Cys Pro Leu Asp Leu Glu Arg Ala Gly Leu
1295 1300 1305
Thr Pro Glu Val Gln Lys Ile Ile Ala Asp Val Ile Arg Asn Pro
1310 1315 1320
Pro Val Asn Ser Asp Met Ser Lys Ile Ser Leu Ile Arg Met Leu
1325 1330 1335
Val Pro Glu Asn Ile Asp Thr Tyr Leu Ile His Met Ala Ile Glu
1340 1345 1350
Ile Leu Lys His Gly Pro Asp Ser Gly Leu Gln Pro Ser Cys Asp
1355 1360 1365
Val Asn Lys Arg Arg Cys Phe Pro Gly Ser Glu Glu Ile Cys Ser
1370 1375 1380
Ser Ser Lys Arg Ser Lys Glu Glu Val Gly Ile Asn Thr Glu Thr
1385 1390 1395
Ser Ser Ala Glu Arg Lys Arg Arg Leu Pro Val Trp Phe Ala Lys
1400 1405 1410
Gly Ser Asp Thr Ser Lys Lys Leu Met Asp Lys Thr Lys Arg Gly
1415 1420 1425
Gly Leu Phe Ser
1430
<210> 61
<211> 991
<212> PRT
<213> 智人
<400> 61
Met Ser Ser His His Thr Thr Phe Pro Phe Asp Pro Glu Arg Arg Val
1 5 10 15
Arg Ser Thr Leu Lys Lys Val Phe Gly Phe Asp Ser Phe Lys Thr Pro
20 25 30
Leu Gln Glu Ser Ala Thr Met Ala Val Val Lys Gly Asn Lys Asp Val
35 40 45
Phe Val Cys Met Pro Thr Gly Ala Gly Lys Ser Leu Cys Tyr Gln Leu
50 55 60
Pro Ala Leu Leu Ala Lys Gly Ile Thr Ile Val Val Ser Pro Leu Ile
65 70 75 80
Ala Leu Ile Gln Asp Gln Val Asp His Leu Leu Thr Leu Lys Val Arg
85 90 95
Val Ser Ser Leu Asn Ser Lys Leu Ser Ala Gln Glu Arg Lys Glu Leu
100 105 110
Leu Ala Asp Leu Glu Arg Glu Lys Pro Gln Thr Lys Ile Leu Tyr Ile
115 120 125
Thr Pro Glu Met Ala Ala Ser Ser Ser Phe Gln Pro Thr Leu Asn Ser
130 135 140
Leu Val Ser Arg His Leu Leu Ser Tyr Leu Val Val Asp Glu Ala His
145 150 155 160
Cys Val Ser Gln Trp Gly His Asp Phe Arg Pro Asp Tyr Leu Arg Leu
165 170 175
Gly Ala Leu Arg Ser Arg Leu Gly His Ala Pro Cys Val Ala Leu Thr
180 185 190
Ala Thr Ala Thr Pro Gln Val Gln Glu Asp Val Phe Ala Ala Leu His
195 200 205
Leu Lys Lys Pro Val Ala Ile Phe Lys Thr Pro Cys Phe Arg Ala Asn
210 215 220
Leu Phe Tyr Asp Val Gln Phe Lys Glu Leu Ile Ser Asp Pro Tyr Gly
225 230 235 240
Asn Leu Lys Asp Phe Cys Leu Lys Ala Leu Gly Gln Glu Ala Asp Lys
245 250 255
Gly Leu Ser Gly Cys Gly Ile Val Tyr Cys Arg Thr Arg Glu Ala Cys
260 265 270
Glu Gln Leu Ala Ile Glu Leu Ser Cys Arg Gly Val Asn Ala Lys Ala
275 280 285
Tyr His Ala Gly Leu Lys Ala Ser Glu Arg Thr Leu Val Gln Asn Asp
290 295 300
Trp Met Glu Glu Lys Val Pro Val Ile Val Ala Thr Ile Ser Phe Gly
305 310 315 320
Met Gly Val Asp Lys Ala Asn Val Arg Phe Val Ala His Trp Asn Ile
325 330 335
Ala Lys Ser Met Ala Gly Tyr Tyr Gln Glu Ser Gly Arg Ala Gly Arg
340 345 350
Asp Gly Lys Pro Ser Trp Cys Arg Leu Tyr Tyr Ser Arg Asn Asp Arg
355 360 365
Asp Gln Val Ser Phe Leu Ile Arg Lys Glu Val Ala Lys Leu Gln Glu
370 375 380
Lys Arg Gly Asn Lys Ala Ser Asp Lys Ala Thr Ile Met Ala Phe Asp
385 390 395 400
Ala Leu Val Thr Phe Cys Glu Glu Leu Gly Cys Arg His Ala Ala Ile
405 410 415
Ala Lys Tyr Phe Gly Asp Ala Leu Pro Ala Cys Ala Lys Gly Cys Asp
420 425 430
His Cys Gln Asn Pro Thr Ala Val Arg Arg Arg Leu Glu Ala Leu Glu
435 440 445
Arg Ser Ser Ser Trp Ser Lys Thr Cys Ile Gly Pro Ser Gln Gly Asn
450 455 460
Gly Phe Asp Pro Glu Leu Tyr Glu Gly Gly Arg Lys Gly Tyr Gly Asp
465 470 475 480
Phe Ser Arg Tyr Asp Glu Gly Ser Gly Gly Ser Gly Asp Glu Gly Arg
485 490 495
Asp Glu Ala His Lys Arg Glu Trp Asn Leu Phe Tyr Gln Lys Gln Met
500 505 510
Gln Leu Arg Lys Gly Lys Asp Pro Lys Ile Glu Glu Phe Val Pro Pro
515 520 525
Asp Glu Asn Cys Pro Leu Lys Glu Ala Ser Ser Arg Arg Ile Pro Arg
530 535 540
Leu Thr Val Lys Ala Arg Glu His Cys Leu Arg Leu Leu Glu Glu Ala
545 550 555 560
Leu Ser Ser Asn Arg Gln Ser Thr Arg Thr Ala Asp Glu Ala Asp Leu
565 570 575
Arg Ala Lys Ala Val Glu Leu Glu His Glu Thr Phe Arg Asn Ala Lys
580 585 590
Val Ala Asn Leu Tyr Lys Ala Ser Val Leu Lys Lys Val Ala Asp Ile
595 600 605
His Arg Ala Ser Lys Asp Gly Gln Pro Tyr Asp Met Gly Gly Ser Ala
610 615 620
Lys Ser Cys Ser Ala Gln Ala Glu Pro Pro Glu Pro Asn Glu Tyr Asp
625 630 635 640
Ile Pro Pro Ala Ser His Val Tyr Ser Leu Lys Pro Lys Arg Val Gly
645 650 655
Ala Gly Phe Pro Lys Gly Ser Cys Pro Phe Gln Thr Ala Thr Glu Leu
660 665 670
Met Glu Thr Thr Arg Ile Arg Glu Gln Ala Pro Gln Pro Glu Arg Gly
675 680 685
Gly Glu His Glu Pro Pro Ser Arg Pro Cys Gly Leu Leu Asp Glu Asp
690 695 700
Gly Ser Glu Pro Leu Pro Gly Pro Arg Gly Glu Val Pro Gly Gly Ser
705 710 715 720
Ala His Tyr Gly Gly Pro Ser Pro Glu Lys Lys Ala Lys Ser Ser Ser
725 730 735
Gly Gly Ser Ser Leu Ala Lys Gly Arg Ala Ser Lys Lys Gln Gln Leu
740 745 750
Leu Ala Thr Ala Ala His Lys Asp Ser Gln Ser Ile Ala Arg Phe Phe
755 760 765
Cys Arg Arg Val Glu Ser Pro Ala Leu Leu Ala Ser Ala Pro Glu Ala
770 775 780
Glu Gly Ala Cys Pro Ser Cys Glu Gly Val Gln Gly Pro Pro Met Ala
785 790 795 800
Pro Glu Lys Tyr Thr Gly Glu Glu Asp Gly Ala Gly Gly His Ser Pro
805 810 815
Ala Pro Pro Gln Thr Glu Glu Cys Leu Arg Glu Arg Pro Ser Thr Cys
820 825 830
Pro Pro Arg Asp Gln Gly Thr Pro Glu Val Gln Pro Thr Pro Ala Lys
835 840 845
Asp Thr Trp Lys Gly Lys Arg Pro Arg Ser Gln Gln Glu Asn Pro Glu
850 855 860
Ser Gln Pro Gln Lys Arg Pro Arg Pro Ser Ala Lys Pro Ser Val Val
865 870 875 880
Ala Glu Val Lys Gly Ser Val Ser Ala Ser Glu Gln Gly Thr Leu Asn
885 890 895
Pro Thr Ala Gln Asp Pro Phe Gln Leu Ser Ala Pro Gly Val Ser Leu
900 905 910
Lys Glu Ala Ala Asn Val Val Val Lys Cys Leu Thr Pro Phe Tyr Lys
915 920 925
Glu Gly Lys Phe Ala Ser Lys Glu Leu Phe Lys Gly Phe Ala Arg His
930 935 940
Leu Ser His Leu Leu Thr Gln Lys Thr Ser Pro Gly Arg Ser Val Lys
945 950 955 960
Glu Glu Ala Gln Asn Leu Ile Arg His Phe Phe His Gly Arg Ala Arg
965 970 975
Cys Glu Ser Glu Ala Asp Trp His Gly Leu Cys Gly Pro Gln Arg
980 985 990
<210> 62
<211> 1208
<212> PRT
<213> 智人
<400> 62
Met Glu Arg Leu Arg Asp Val Arg Glu Arg Leu Gln Ala Trp Glu Arg
1 5 10 15
Ala Phe Arg Arg Gln Arg Gly Arg Arg Pro Ser Gln Asp Asp Val Glu
20 25 30
Ala Ala Pro Glu Glu Thr Arg Ala Leu Tyr Arg Glu Tyr Arg Thr Leu
35 40 45
Lys Arg Thr Thr Gly Gln Ala Gly Gly Gly Leu Arg Ser Ser Glu Ser
50 55 60
Leu Pro Ala Ala Ala Glu Glu Ala Pro Glu Pro Arg Cys Trp Gly Pro
65 70 75 80
His Leu Asn Arg Ala Ala Thr Lys Ser Pro Gln Ser Thr Pro Gly Arg
85 90 95
Ser Arg Gln Gly Ser Val Pro Asp Tyr Gly Gln Arg Leu Lys Ala Asn
100 105 110
Leu Lys Gly Thr Leu Gln Ala Gly Pro Ala Leu Gly Arg Arg Pro Trp
115 120 125
Pro Leu Gly Arg Ala Ser Ser Lys Ala Ser Thr Pro Lys Pro Pro Gly
130 135 140
Thr Gly Pro Val Pro Ser Phe Ala Glu Lys Val Ser Asp Glu Pro Pro
145 150 155 160
Gln Leu Pro Glu Pro Gln Pro Arg Pro Gly Arg Leu Gln His Leu Gln
165 170 175
Ala Ser Leu Ser Gln Arg Leu Gly Ser Leu Asp Pro Gly Trp Leu Gln
180 185 190
Arg Cys His Ser Glu Val Pro Asp Phe Leu Gly Ala Pro Lys Ala Cys
195 200 205
Arg Pro Asp Leu Gly Ser Glu Glu Ser Gln Leu Leu Ile Pro Gly Glu
210 215 220
Ser Ala Val Leu Gly Pro Gly Ala Gly Ser Gln Gly Pro Glu Ala Ser
225 230 235 240
Ala Phe Gln Glu Val Ser Ile Arg Val Gly Ser Pro Gln Pro Ser Ser
245 250 255
Ser Gly Gly Glu Lys Arg Arg Trp Asn Glu Glu Pro Trp Glu Ser Pro
260 265 270
Ala Gln Val Gln Gln Glu Ser Ser Gln Ala Gly Pro Pro Ser Glu Gly
275 280 285
Ala Gly Ala Val Ala Val Glu Glu Asp Pro Pro Gly Glu Pro Val Gln
290 295 300
Ala Gln Pro Pro Gln Pro Cys Ser Ser Pro Ser Asn Pro Arg Tyr His
305 310 315 320
Gly Leu Ser Pro Ser Ser Gln Ala Arg Ala Gly Lys Ala Glu Gly Thr
325 330 335
Ala Pro Leu His Ile Phe Pro Arg Leu Ala Arg His Asp Arg Gly Asn
340 345 350
Tyr Val Arg Leu Asn Met Lys Gln Lys His Tyr Val Arg Gly Arg Ala
355 360 365
Leu Arg Ser Arg Leu Leu Arg Lys Gln Ala Trp Lys Gln Lys Trp Arg
370 375 380
Lys Lys Gly Glu Cys Phe Gly Gly Gly Gly Ala Thr Val Thr Thr Lys
385 390 395 400
Glu Ser Cys Phe Leu Asn Glu Gln Phe Asp His Trp Ala Ala Gln Cys
405 410 415
Pro Arg Pro Ala Ser Glu Glu Asp Thr Asp Ala Val Gly Pro Glu Pro
420 425 430
Leu Val Pro Ser Pro Gln Pro Val Pro Glu Val Pro Ser Leu Asp Pro
435 440 445
Thr Val Leu Pro Leu Tyr Ser Leu Gly Pro Ser Gly Gln Leu Ala Glu
450 455 460
Thr Pro Ala Glu Val Phe Gln Ala Leu Glu Gln Leu Gly His Gln Ala
465 470 475 480
Phe Arg Pro Gly Gln Glu Arg Ala Val Met Arg Ile Leu Ser Gly Ile
485 490 495
Ser Thr Leu Leu Val Leu Pro Thr Gly Ala Gly Lys Ser Leu Cys Tyr
500 505 510
Gln Leu Pro Ala Leu Leu Tyr Ser Arg Arg Ser Pro Cys Leu Thr Leu
515 520 525
Val Val Ser Pro Leu Leu Ser Leu Met Asp Asp Gln Val Ser Gly Leu
530 535 540
Pro Pro Cys Leu Lys Ala Ala Cys Ile His Ser Gly Met Thr Arg Lys
545 550 555 560
Gln Arg Glu Ser Val Leu Gln Lys Ile Arg Ala Ala Gln Val His Val
565 570 575
Leu Met Leu Thr Pro Glu Ala Leu Val Gly Ala Gly Gly Leu Pro Pro
580 585 590
Ala Ala Gln Leu Pro Pro Val Ala Phe Ala Cys Ile Asp Glu Ala His
595 600 605
Cys Leu Ser Gln Trp Ser His Asn Phe Arg Pro Cys Tyr Leu Arg Val
610 615 620
Cys Lys Val Leu Arg Glu Arg Met Gly Val His Cys Phe Leu Gly Leu
625 630 635 640
Thr Ala Thr Ala Thr Arg Arg Thr Ala Ser Asp Val Ala Gln His Leu
645 650 655
Ala Val Ala Glu Glu Pro Asp Leu His Gly Pro Ala Pro Val Pro Thr
660 665 670
Asn Leu His Leu Ser Val Ser Met Asp Arg Asp Thr Asp Gln Ala Leu
675 680 685
Leu Thr Leu Leu Gln Gly Lys Arg Phe Gln Asn Leu Asp Ser Ile Ile
690 695 700
Ile Tyr Cys Asn Arg Arg Glu Asp Thr Glu Arg Ile Ala Ala Leu Leu
705 710 715 720
Arg Thr Cys Leu His Ala Ala Trp Val Pro Gly Ser Gly Gly Arg Ala
725 730 735
Pro Lys Thr Thr Ala Glu Ala Tyr His Ala Gly Met Cys Ser Arg Glu
740 745 750
Arg Arg Arg Val Gln Arg Ala Phe Met Gln Gly Gln Leu Arg Val Val
755 760 765
Val Ala Thr Val Ala Phe Gly Met Gly Leu Asp Arg Pro Asp Val Arg
770 775 780
Ala Val Leu His Leu Gly Leu Pro Pro Ser Phe Glu Ser Tyr Val Gln
785 790 795 800
Ala Val Gly Arg Ala Gly Arg Asp Gly Gln Pro Ala His Cys His Leu
805 810 815
Phe Leu Gln Pro Gln Gly Glu Asp Leu Arg Glu Leu Arg Arg His Val
820 825 830
His Ala Asp Ser Thr Asp Phe Leu Ala Val Lys Arg Leu Val Gln Arg
835 840 845
Val Phe Pro Ala Cys Thr Cys Thr Cys Thr Arg Pro Pro Ser Glu Gln
850 855 860
Glu Gly Ala Val Gly Gly Glu Arg Pro Val Pro Lys Tyr Pro Pro Gln
865 870 875 880
Glu Ala Glu Gln Leu Ser His Gln Ala Ala Pro Gly Pro Arg Arg Val
885 890 895
Cys Met Gly His Glu Arg Ala Leu Pro Ile Gln Leu Thr Val Gln Ala
900 905 910
Leu Asp Met Pro Glu Glu Ala Ile Glu Thr Leu Leu Cys Tyr Leu Glu
915 920 925
Leu His Pro His His Trp Leu Glu Leu Leu Ala Thr Thr Tyr Thr His
930 935 940
Cys Arg Leu Asn Cys Pro Gly Gly Pro Ala Gln Leu Gln Ala Leu Ala
945 950 955 960
His Arg Cys Pro Pro Leu Ala Val Cys Leu Ala Gln Gln Leu Pro Glu
965 970 975
Asp Pro Gly Gln Gly Ser Ser Ser Val Glu Phe Asp Met Val Lys Leu
980 985 990
Val Asp Ser Met Gly Trp Glu Leu Ala Ser Val Arg Arg Ala Leu Cys
995 1000 1005
Gln Leu Gln Trp Asp His Glu Pro Arg Thr Gly Val Arg Arg Gly
1010 1015 1020
Thr Gly Val Leu Val Glu Phe Ser Glu Leu Ala Phe His Leu Arg
1025 1030 1035
Ser Pro Gly Asp Leu Thr Ala Glu Glu Lys Asp Gln Ile Cys Asp
1040 1045 1050
Phe Leu Tyr Gly Arg Val Gln Ala Arg Glu Arg Gln Ala Leu Ala
1055 1060 1065
Arg Leu Arg Arg Thr Phe Gln Ala Phe His Ser Val Ala Phe Pro
1070 1075 1080
Ser Cys Gly Pro Cys Leu Glu Gln Gln Asp Glu Glu Arg Ser Thr
1085 1090 1095
Arg Leu Lys Asp Leu Leu Gly Arg Tyr Phe Glu Glu Glu Glu Gly
1100 1105 1110
Gln Glu Pro Gly Gly Met Glu Asp Ala Gln Gly Pro Glu Pro Gly
1115 1120 1125
Gln Ala Arg Leu Gln Asp Trp Glu Asp Gln Val Arg Cys Asp Ile
1130 1135 1140
Arg Gln Phe Leu Ser Leu Arg Pro Glu Glu Lys Phe Ser Ser Arg
1145 1150 1155
Ala Val Ala Arg Ile Phe His Gly Ile Gly Ser Pro Cys Tyr Pro
1160 1165 1170
Ala Gln Val Tyr Gly Gln Asp Arg Arg Phe Trp Arg Lys Tyr Leu
1175 1180 1185
His Leu Ser Phe His Ala Leu Val Gly Leu Ala Thr Glu Glu Leu
1190 1195 1200
Leu Gln Val Ala Arg
1205
<210> 63
<211> 1101
<212> PRT
<213> 智人
<400> 63
Met Asp Glu Cys Gly Ser Arg Ile Arg Arg Arg Val Ser Leu Pro Lys
1 5 10 15
Arg Asn Arg Pro Ser Leu Gly Cys Ile Phe Gly Ala Pro Thr Ala Ala
20 25 30
Glu Leu Val Pro Gly Asp Glu Gly Lys Glu Glu Glu Glu Met Val Ala
35 40 45
Glu Asn Arg Arg Arg Lys Thr Ala Gly Val Leu Pro Val Glu Val Gln
50 55 60
Pro Leu Leu Leu Ser Asp Ser Pro Glu Cys Leu Val Leu Gly Gly Gly
65 70 75 80
Asp Thr Asn Pro Asp Leu Leu Arg His Met Pro Thr Asp Arg Gly Val
85 90 95
Gly Asp Gln Pro Asn Asp Ser Glu Val Asp Met Phe Gly Asp Tyr Asp
100 105 110
Ser Phe Thr Glu Asn Ser Phe Ile Ala Gln Val Asp Asp Leu Glu Gln
115 120 125
Lys Tyr Met Gln Leu Pro Glu His Lys Lys His Ala Thr Asp Phe Ala
130 135 140
Thr Glu Asn Leu Cys Ser Glu Ser Ile Lys Asn Lys Leu Ser Ile Thr
145 150 155 160
Thr Ile Gly Asn Leu Thr Glu Leu Gln Thr Asp Lys His Thr Glu Asn
165 170 175
Gln Ser Gly Tyr Glu Gly Val Thr Ile Glu Pro Gly Ala Asp Leu Leu
180 185 190
Tyr Asp Val Pro Ser Ser Gln Ala Ile Tyr Phe Glu Asn Leu Gln Asn
195 200 205
Ser Ser Asn Asp Leu Gly Asp His Ser Met Lys Glu Arg Asp Trp Lys
210 215 220
Ser Ser Ser His Asn Thr Val Asn Glu Glu Leu Pro His Asn Cys Ile
225 230 235 240
Glu Gln Pro Gln Gln Asn Asp Glu Ser Ser Ser Lys Val Arg Thr Ser
245 250 255
Ser Asp Met Asn Arg Arg Lys Ser Ile Lys Asp His Leu Lys Asn Ala
260 265 270
Met Thr Gly Asn Ala Lys Ala Gln Thr Pro Ile Phe Ser Arg Ser Lys
275 280 285
Gln Leu Lys Asp Thr Leu Leu Ser Glu Glu Ile Asn Val Ala Lys Lys
290 295 300
Thr Val Glu Ser Ser Ser Asn Asp Leu Gly Pro Phe Tyr Ser Leu Pro
305 310 315 320
Ser Lys Val Arg Asp Leu Tyr Ala Gln Phe Lys Gly Ile Glu Lys Leu
325 330 335
Tyr Glu Trp Gln His Thr Cys Leu Thr Leu Asn Ser Val Gln Glu Arg
340 345 350
Lys Asn Leu Ile Tyr Ser Leu Pro Thr Ser Gly Gly Lys Thr Leu Val
355 360 365
Ala Glu Ile Leu Met Leu Gln Glu Leu Leu Cys Cys Arg Lys Asp Val
370 375 380
Leu Met Ile Leu Pro Tyr Val Ala Ile Val Gln Glu Lys Ile Ser Gly
385 390 395 400
Leu Ser Ser Phe Gly Ile Glu Leu Gly Phe Phe Val Glu Glu Tyr Ala
405 410 415
Gly Ser Lys Gly Arg Phe Pro Pro Thr Lys Arg Arg Glu Lys Lys Ser
420 425 430
Leu Tyr Ile Ala Thr Ile Glu Lys Gly His Ser Leu Val Asn Ser Leu
435 440 445
Ile Glu Thr Gly Arg Ile Asp Ser Leu Gly Leu Val Val Val Asp Glu
450 455 460
Leu His Met Ile Gly Glu Gly Ser Arg Gly Ala Thr Leu Glu Met Thr
465 470 475 480
Leu Ala Lys Ile Leu Tyr Thr Ser Lys Thr Thr Gln Ile Ile Gly Met
485 490 495
Ser Ala Thr Leu Asn Asn Val Glu Asp Leu Gln Lys Phe Leu Gln Ala
500 505 510
Glu Tyr Tyr Thr Ser Gln Phe Arg Pro Val Glu Leu Lys Glu Tyr Leu
515 520 525
Lys Ile Asn Asp Thr Ile Tyr Glu Val Asp Ser Lys Ala Glu Asn Gly
530 535 540
Met Thr Phe Ser Arg Leu Leu Asn Tyr Lys Tyr Ser Asp Thr Leu Lys
545 550 555 560
Lys Met Asp Pro Asp His Leu Val Ala Leu Val Thr Glu Val Ile Pro
565 570 575
Asn Tyr Ser Cys Leu Val Phe Cys Pro Ser Lys Lys Asn Cys Glu Asn
580 585 590
Val Ala Glu Met Ile Cys Lys Phe Leu Ser Lys Glu Tyr Leu Lys His
595 600 605
Lys Glu Lys Glu Lys Cys Glu Val Ile Lys Asn Leu Lys Asn Ile Gly
610 615 620
Asn Gly Asn Leu Cys Pro Val Leu Lys Arg Thr Ile Pro Phe Gly Val
625 630 635 640
Ala Tyr His His Ser Gly Leu Thr Ser Asp Glu Arg Lys Leu Leu Glu
645 650 655
Glu Ala Tyr Ser Thr Gly Val Leu Cys Leu Phe Thr Cys Thr Ser Thr
660 665 670
Leu Ala Ala Gly Val Asn Leu Pro Ala Arg Arg Val Ile Leu Arg Ala
675 680 685
Pro Tyr Val Ala Lys Glu Phe Leu Lys Arg Asn Gln Tyr Lys Gln Met
690 695 700
Ile Gly Arg Ala Gly Arg Ala Gly Ile Asp Thr Ile Gly Glu Ser Ile
705 710 715 720
Leu Ile Leu Gln Glu Lys Asp Lys Gln Gln Val Leu Glu Leu Ile Thr
725 730 735
Lys Pro Leu Glu Asn Cys Tyr Ser His Leu Val Gln Glu Phe Thr Lys
740 745 750
Gly Ile Gln Thr Leu Phe Leu Ser Leu Ile Gly Leu Lys Ile Ala Thr
755 760 765
Asn Leu Asp Asp Ile Tyr His Phe Met Asn Gly Thr Phe Phe Gly Val
770 775 780
Gln Gln Lys Val Leu Leu Lys Glu Lys Ser Leu Trp Glu Ile Thr Val
785 790 795 800
Glu Ser Leu Arg Tyr Leu Thr Glu Lys Gly Leu Leu Gln Lys Asp Thr
805 810 815
Ile Tyr Lys Ser Glu Glu Glu Val Gln Tyr Asn Phe His Ile Thr Lys
820 825 830
Leu Gly Arg Ala Ser Phe Lys Gly Thr Ile Asp Leu Ala Tyr Cys Asp
835 840 845
Ile Leu Tyr Arg Asp Leu Lys Lys Gly Leu Glu Gly Leu Val Leu Glu
850 855 860
Ser Leu Leu His Leu Ile Tyr Leu Thr Thr Pro Tyr Asp Leu Val Ser
865 870 875 880
Gln Cys Asn Pro Asp Trp Met Ile Tyr Phe Arg Gln Phe Ser Gln Leu
885 890 895
Ser Pro Ala Glu Gln Asn Val Ala Ala Ile Leu Gly Val Ser Glu Ser
900 905 910
Phe Ile Gly Lys Lys Ala Ser Gly Gln Ala Ile Gly Lys Lys Val Asp
915 920 925
Lys Asn Val Val Asn Arg Leu Tyr Leu Ser Phe Val Leu Tyr Thr Leu
930 935 940
Leu Lys Glu Thr Asn Ile Trp Thr Val Ser Glu Lys Phe Asn Met Pro
945 950 955 960
Arg Gly Tyr Ile Gln Asn Leu Leu Thr Gly Thr Ala Ser Phe Ser Ser
965 970 975
Cys Val Leu His Phe Cys Glu Glu Leu Glu Glu Phe Trp Val Tyr Arg
980 985 990
Ala Leu Leu Val Glu Leu Thr Lys Lys Leu Thr Tyr Cys Val Lys Ala
995 1000 1005
Glu Leu Ile Pro Leu Met Glu Val Thr Gly Val Leu Glu Gly Arg
1010 1015 1020
Ala Lys Gln Leu Tyr Ser Ala Gly Tyr Lys Ser Leu Met His Leu
1025 1030 1035
Ala Asn Ala Asn Pro Glu Val Leu Val Arg Thr Ile Asp His Leu
1040 1045 1050
Ser Arg Arg Gln Ala Lys Gln Ile Val Ser Ser Ala Lys Met Leu
1055 1060 1065
Leu His Glu Lys Ala Glu Ala Leu Gln Glu Glu Val Glu Glu Leu
1070 1075 1080
Leu Arg Leu Pro Ser Asp Phe Pro Gly Ala Val Ala Ser Ser Thr
1085 1090 1095
Asp Lys Ala
1100
<210> 64
<211> 1196
<212> PRT
<213> 单纯疱疹病毒
<400> 64
Met Glu Thr Lys Pro Lys Thr Ala Thr Thr Ile Lys Val Pro Pro Gly
1 5 10 15
Pro Leu Gly Tyr Val Tyr Ala Arg Ala Cys Pro Ser Glu Gly Ile Glu
20 25 30
Leu Leu Ala Leu Leu Ser Ala Arg Ser Gly Asp Ser Asp Val Ala Val
35 40 45
Ala Pro Leu Val Val Gly Leu Thr Val Glu Ser Gly Phe Glu Ala Asn
50 55 60
Val Ala Val Val Val Gly Ser Arg Thr Thr Gly Leu Gly Gly Thr Ala
65 70 75 80
Val Ser Leu Lys Leu Thr Pro Ser His Tyr Ser Ser Ser Val Tyr Val
85 90 95
Phe His Gly Gly Arg His Leu Asp Pro Ser Thr Gln Ala Pro Asn Leu
100 105 110
Thr Arg Leu Cys Glu Arg Ala Arg Arg His Phe Gly Phe Ser Asp Tyr
115 120 125
Thr Pro Arg Pro Gly Asp Leu Lys His Glu Thr Thr Gly Glu Ala Leu
130 135 140
Cys Glu Arg Leu Gly Leu Asp Pro Asp Arg Ala Leu Leu Tyr Leu Val
145 150 155 160
Val Thr Glu Gly Phe Lys Glu Ala Val Cys Ile Asn Asn Thr Phe Leu
165 170 175
His Leu Gly Gly Ser Asp Lys Val Thr Ile Gly Gly Ala Glu Val His
180 185 190
Arg Ile Pro Val Tyr Pro Leu Gln Leu Phe Met Pro Asp Phe Ser Arg
195 200 205
Val Ile Ala Glu Pro Phe Asn Ala Asn His Arg Ser Ile Gly Glu Lys
210 215 220
Phe Thr Tyr Pro Leu Pro Phe Phe Asn Arg Pro Leu Asn Arg Leu Leu
225 230 235 240
Phe Glu Ala Val Val Gly Pro Ala Ala Val Ala Leu Arg Cys Arg Asn
245 250 255
Val Asp Ala Val Ala Arg Ala Ala Ala His Leu Ala Phe Asp Glu Asn
260 265 270
His Glu Gly Ala Ala Leu Pro Ala Asp Ile Thr Phe Thr Ala Phe Glu
275 280 285
Ala Ser Gln Gly Lys Thr Pro Arg Gly Gly Arg Asp Gly Gly Gly Lys
290 295 300
Gly Ala Ala Gly Gly Phe Glu Gln Arg Leu Ala Ser Val Met Ala Gly
305 310 315 320
Asp Ala Ala Leu Ala Leu Glu Ser Ile Val Ser Met Ala Val Phe Asp
325 330 335
Glu Pro Pro Thr Asp Ile Ser Ala Trp Pro Leu Phe Glu Gly Gln Asp
340 345 350
Thr Ala Ala Ala Arg Ala Asn Ala Val Gly Ala Tyr Leu Ala Arg Ala
355 360 365
Ala Gly Leu Val Gly Ala Met Val Phe Ser Thr Asn Ser Ala Leu His
370 375 380
Leu Thr Glu Val Asp Asp Ala Gly Pro Ala Asp Pro Lys Asp His Ser
385 390 395 400
Lys Pro Ser Phe Tyr Arg Phe Phe Leu Val Pro Gly Thr His Val Ala
405 410 415
Ala Asn Pro Gln Val Asp Arg Glu Gly His Val Val Pro Gly Phe Glu
420 425 430
Gly Arg Pro Thr Ala Pro Leu Val Gly Gly Thr Gln Glu Phe Ala Gly
435 440 445
Glu His Leu Ala Met Leu Cys Gly Phe Ser Pro Ala Leu Leu Ala Lys
450 455 460
Met Leu Phe Tyr Leu Glu Arg Cys Asp Gly Ala Val Ile Val Gly Arg
465 470 475 480
Gln Glu Met Asp Val Phe Arg Tyr Val Ala Asp Ser Asn Gln Thr Asp
485 490 495
Val Pro Cys Asn Leu Cys Thr Phe Asp Thr Arg His Ala Cys Val His
500 505 510
Thr Thr Leu Met Arg Leu Arg Ala Arg His Pro Lys Phe Ala Ser Ala
515 520 525
Ala Arg Gly Ala Ile Gly Val Phe Gly Thr Met Asn Ser Met Tyr Ser
530 535 540
Asp Cys Asp Val Leu Gly Asn Tyr Ala Ala Phe Ser Ala Leu Lys Arg
545 550 555 560
Ala Asp Gly Ser Glu Thr Ala Arg Thr Ile Met Gln Glu Thr Tyr Arg
565 570 575
Ala Ala Thr Glu Arg Val Met Ala Glu Leu Glu Thr Leu Gln Tyr Val
580 585 590
Asp Gln Ala Val Pro Thr Ala Met Gly Arg Leu Glu Thr Ile Ile Thr
595 600 605
Asn Arg Glu Ala Leu His Thr Val Val Asn Asn Val Arg Gln Val Val
610 615 620
Asp Arg Glu Val Glu Gln Leu Met Arg Asn Leu Val Glu Gly Arg Asn
625 630 635 640
Phe Lys Phe Arg Asp Gly Leu Gly Glu Ala Asn His Ala Met Ser Leu
645 650 655
Thr Leu Asp Pro Tyr Ala Cys Gly Pro Cys Pro Leu Leu Gln Leu Leu
660 665 670
Gly Arg Arg Ser Asn Leu Ala Val Tyr Gln Asp Leu Ala Leu Ser Gln
675 680 685
Cys His Gly Val Phe Ala Gly Gln Ser Val Glu Gly Arg Asn Phe Arg
690 695 700
Asn Gln Phe Gln Pro Val Leu Arg Arg Arg Val Met Asp Met Phe Asn
705 710 715 720
Asn Gly Phe Leu Ser Ala Lys Thr Leu Thr Val Ala Leu Ser Glu Gly
725 730 735
Ala Ala Ile Cys Ala Pro Ser Leu Thr Ala Gly Gln Thr Ala Pro Ala
740 745 750
Glu Ser Ser Phe Glu Gly Asp Val Ala Arg Val Thr Leu Gly Phe Pro
755 760 765
Lys Glu Leu Arg Val Lys Ser Arg Val Leu Phe Ala Gly Ala Ser Ala
770 775 780
Asn Ala Ser Glu Ala Ala Lys Ala Arg Val Ala Ser Leu Gln Ser Ala
785 790 795 800
Tyr Gln Lys Pro Asp Lys Arg Val Asp Ile Leu Leu Gly Pro Leu Gly
805 810 815
Phe Leu Leu Lys Gln Phe His Ala Ala Ile Phe Pro Asn Gly Lys Pro
820 825 830
Pro Gly Ser Asn Gln Pro Asn Pro Gln Trp Phe Trp Thr Ala Leu Gln
835 840 845
Arg Asn Gln Leu Pro Ala Arg Leu Leu Ser Arg Glu Asp Ile Glu Thr
850 855 860
Ile Ala Phe Ile Lys Lys Phe Ser Leu Asp Tyr Gly Ala Ile Asn Phe
865 870 875 880
Ile Asn Leu Ala Pro Asn Asn Val Ser Glu Leu Ala Met Tyr Tyr Met
885 890 895
Ala Asn Gln Ile Leu Arg Tyr Cys Asp His Ser Thr Tyr Phe Ile Asn
900 905 910
Thr Leu Thr Ala Ile Ile Ala Gly Ser Arg Arg Pro Pro Ser Val Gln
915 920 925
Ala Ala Ala Ala Trp Ser Ala Gln Gly Gly Ala Gly Leu Glu Ala Gly
930 935 940
Ala Arg Ala Leu Met Asp Ala Val Asp Ala His Pro Gly Ala Trp Thr
945 950 955 960
Ser Met Phe Ala Ser Cys Asn Leu Leu Arg Pro Val Met Ala Ala Arg
965 970 975
Pro Met Val Val Leu Gly Leu Ser Ile Ser Lys Tyr Tyr Gly Met Ala
980 985 990
Gly Asn Asp Arg Val Phe Gln Ala Gly Asn Trp Ala Ser Leu Met Gly
995 1000 1005
Gly Lys Asn Ala Cys Pro Leu Leu Ile Phe Asp Arg Thr Arg Lys
1010 1015 1020
Phe Val Leu Ala Cys Pro Arg Ala Gly Phe Val Cys Ala Ala Ser
1025 1030 1035
Ser Leu Gly Gly Gly Ala His Glu Ser Ser Leu Cys Glu Gln Leu
1040 1045 1050
Arg Gly Ile Ile Ser Glu Gly Gly Ala Ala Val Ala Ser Ser Val
1055 1060 1065
Phe Val Ala Thr Val Lys Ser Leu Gly Pro Arg Thr Gln Gln Leu
1070 1075 1080
Gln Ile Glu Asp Trp Leu Ala Leu Leu Glu Asp Glu Tyr Leu Ser
1085 1090 1095
Glu Glu Met Met Glu Leu Thr Ala Arg Ala Leu Glu Arg Gly Asn
1100 1105 1110
Gly Glu Trp Ser Thr Asp Ala Ala Leu Glu Val Ala His Glu Ala
1115 1120 1125
Glu Ala Leu Val Ser Gln Leu Gly Asn Ala Gly Glu Val Phe Asn
1130 1135 1140
Phe Gly Asp Phe Gly Cys Glu Asp Asp Asn Ala Thr Pro Phe Gly
1145 1150 1155
Gly Pro Gly Ala Pro Gly Pro Ala Phe Ala Gly Arg Lys Arg Ala
1160 1165 1170
Phe His Gly Asp Asp Pro Phe Gly Glu Gly Pro Pro Asp Lys Lys
1175 1180 1185
Gly Asp Leu Thr Leu Asp Met Leu
1190 1195
<210> 65
<211> 843
<212> PRT
<213> 酿酒酵母
<400> 65
Met Thr Asp Val Glu Gly Tyr Gln Pro Lys Ser Lys Gly Lys Ile Phe
1 5 10 15
Pro Asp Met Gly Glu Ser Phe Phe Ser Ser Asp Glu Asp Ser Pro Ala
20 25 30
Thr Asp Ala Glu Ile Asp Glu Asn Tyr Asp Asp Asn Arg Glu Thr Ser
35 40 45
Glu Gly Arg Gly Glu Arg Asp Thr Gly Ala Met Val Thr Gly Leu Lys
50 55 60
Lys Pro Arg Lys Lys Thr Lys Ser Ser Arg His Thr Ala Ala Asp Ser
65 70 75 80
Ser Met Asn Gln Met Asp Ala Lys Asp Lys Ala Leu Leu Gln Asp Thr
85 90 95
Asn Ser Asp Ile Pro Ala Asp Phe Val Pro Asp Ser Val Ser Gly Met
100 105 110
Phe Arg Ser His Asp Phe Ser Tyr Leu Arg Leu Arg Pro Asp His Ala
115 120 125
Ser Arg Pro Leu Trp Ile Ser Pro Ser Asp Gly Arg Ile Ile Leu Glu
130 135 140
Ser Phe Ser Pro Leu Ala Glu Gln Ala Gln Asp Phe Leu Val Thr Ile
145 150 155 160
Ala Glu Pro Ile Ser Arg Pro Ser His Ile His Glu Tyr Lys Ile Thr
165 170 175
Ala Tyr Ser Leu Tyr Ala Ala Val Ser Val Gly Leu Glu Thr Asp Asp
180 185 190
Ile Ile Ser Val Leu Asp Arg Leu Ser Lys Val Pro Val Ala Glu Ser
195 200 205
Ile Ile Asn Phe Ile Lys Gly Ala Thr Ile Ser Tyr Gly Lys Val Lys
210 215 220
Leu Val Ile Lys His Asn Arg Tyr Phe Val Glu Thr Thr Gln Ala Asp
225 230 235 240
Ile Leu Gln Met Leu Leu Asn Asp Ser Val Ile Gly Pro Leu Arg Ile
245 250 255
Asp Ser Asp His Gln Val Gln Pro Pro Glu Asp Val Leu Gln Gln Gln
260 265 270
Leu Gln Gln Thr Ala Gly Lys Pro Ala Thr Asn Val Asn Pro Asn Asp
275 280 285
Val Glu Ala Val Phe Ser Ala Val Ile Gly Gly Asp Asn Glu Arg Glu
290 295 300
Glu Glu Asp Asp Asp Ile Asp Ala Val His Ser Phe Glu Ile Ala Asn
305 310 315 320
Glu Ser Val Glu Val Val Lys Lys Arg Cys Gln Glu Ile Asp Tyr Pro
325 330 335
Val Leu Glu Glu Tyr Asp Phe Arg Asn Asp His Arg Asn Pro Asp Leu
340 345 350
Asp Ile Asp Leu Lys Pro Ser Thr Gln Ile Arg Pro Tyr Gln Glu Lys
355 360 365
Ser Leu Ser Lys Met Phe Gly Asn Gly Arg Ala Arg Ser Gly Ile Ile
370 375 380
Val Leu Pro Cys Gly Ala Gly Lys Thr Leu Val Gly Ile Thr Ala Ala
385 390 395 400
Cys Thr Ile Lys Lys Ser Val Ile Val Leu Cys Thr Ser Ser Val Ser
405 410 415
Val Met Gln Trp Arg Gln Gln Phe Leu Gln Trp Cys Thr Leu Gln Pro
420 425 430
Glu Asn Cys Ala Val Phe Thr Ser Asp Asn Lys Glu Met Phe Gln Thr
435 440 445
Glu Ser Gly Leu Val Val Ser Thr Tyr Ser Met Val Ala Asn Thr Arg
450 455 460
Asn Arg Ser His Asp Ser Gln Lys Val Met Asp Phe Leu Thr Gly Arg
465 470 475 480
Glu Trp Gly Phe Ile Ile Leu Asp Glu Val His Val Val Pro Ala Ala
485 490 495
Met Phe Arg Arg Val Val Ser Thr Ile Ala Ala His Ala Lys Leu Gly
500 505 510
Leu Thr Ala Thr Leu Val Arg Glu Asp Asp Lys Ile Gly Asp Leu Asn
515 520 525
Phe Leu Ile Gly Pro Lys Leu Tyr Glu Ala Asn Trp Met Glu Leu Ser
530 535 540
Gln Lys Gly His Ile Ala Asn Val Gln Cys Ala Glu Val Trp Cys Pro
545 550 555 560
Met Thr Ala Glu Phe Tyr Gln Glu Tyr Leu Arg Glu Thr Ala Arg Lys
565 570 575
Arg Met Leu Leu Tyr Ile Met Asn Pro Thr Lys Phe Gln Ala Cys Gln
580 585 590
Phe Leu Ile Gln Tyr His Glu Arg Arg Gly Asp Lys Ile Ile Val Phe
595 600 605
Ser Asp Asn Val Tyr Ala Leu Gln Glu Tyr Ala Leu Lys Met Gly Lys
610 615 620
Pro Phe Ile Tyr Gly Ser Thr Pro Gln Gln Glu Arg Met Asn Ile Leu
625 630 635 640
Gln Asn Phe Gln Tyr Asn Asp Gln Ile Asn Thr Ile Phe Leu Ser Lys
645 650 655
Val Gly Asp Thr Ser Ile Asp Leu Pro Glu Ala Thr Cys Leu Ile Gln
660 665 670
Ile Ser Ser His Tyr Gly Ser Arg Arg Gln Glu Ala Gln Arg Leu Gly
675 680 685
Arg Ile Leu Arg Ala Lys Arg Arg Asn Asp Glu Gly Phe Asn Ala Phe
690 695 700
Phe Tyr Ser Leu Val Ser Lys Asp Thr Gln Glu Met Tyr Tyr Ser Thr
705 710 715 720
Lys Arg Gln Ala Phe Leu Val Asp Gln Gly Tyr Ala Phe Lys Val Ile
725 730 735
Thr His Leu His Gly Met Glu Asn Ile Pro Asn Leu Ala Tyr Ala Ser
740 745 750
Pro Arg Glu Arg Arg Glu Leu Leu Gln Glu Val Leu Leu Lys Asn Glu
755 760 765
Glu Ala Ala Gly Ile Glu Val Gly Asp Asp Ala Asp Asn Ser Val Gly
770 775 780
Arg Gly Ser Asn Gly His Lys Arg Phe Lys Ser Lys Ala Val Arg Gly
785 790 795 800
Glu Gly Ser Leu Ser Gly Leu Ala Gly Gly Glu Asp Met Ala Tyr Met
805 810 815
Glu Tyr Ser Thr Asn Lys Asn Lys Glu Leu Lys Glu His His Pro Leu
820 825 830
Ile Arg Lys Met Tyr Tyr Lys Asn Leu Lys Lys
835 840
<210> 66
<211> 778
<212> PRT
<213> 酿酒酵母
<400> 66
Met Lys Phe Tyr Ile Asp Asp Leu Pro Val Leu Phe Pro Tyr Pro Lys
1 5 10 15
Ile Tyr Pro Glu Gln Tyr Asn Tyr Met Cys Asp Ile Lys Lys Thr Leu
20 25 30
Asp Val Gly Gly Asn Ser Ile Leu Glu Met Pro Ser Gly Thr Gly Lys
35 40 45
Thr Val Ser Leu Leu Ser Leu Thr Ile Ala Tyr Gln Met His Tyr Pro
50 55 60
Glu His Arg Lys Ile Ile Tyr Cys Ser Arg Thr Met Ser Glu Ile Glu
65 70 75 80
Lys Ala Leu Val Glu Leu Glu Asn Leu Met Asp Tyr Arg Thr Lys Glu
85 90 95
Leu Gly Tyr Gln Glu Asp Phe Arg Gly Leu Gly Leu Thr Ser Arg Lys
100 105 110
Asn Leu Cys Leu His Pro Glu Val Ser Lys Glu Arg Lys Gly Thr Val
115 120 125
Val Asp Glu Lys Cys Arg Arg Met Thr Asn Gly Gln Ala Lys Arg Lys
130 135 140
Leu Glu Glu Asp Pro Glu Ala Asn Val Glu Leu Cys Glu Tyr His Glu
145 150 155 160
Asn Leu Tyr Asn Ile Glu Val Glu Asp Tyr Leu Pro Lys Gly Val Phe
165 170 175
Ser Phe Glu Lys Leu Leu Lys Tyr Cys Glu Glu Lys Thr Leu Cys Pro
180 185 190
Tyr Phe Ile Val Arg Arg Met Ile Ser Leu Cys Asn Ile Ile Ile Tyr
195 200 205
Ser Tyr His Tyr Leu Leu Asp Pro Lys Ile Ala Glu Arg Val Ser Asn
210 215 220
Glu Val Ser Lys Asp Ser Ile Val Ile Phe Asp Glu Ala His Asn Ile
225 230 235 240
Asp Asn Val Cys Ile Glu Ser Leu Ser Leu Asp Leu Thr Thr Asp Ala
245 250 255
Leu Arg Arg Ala Thr Arg Gly Ala Asn Ala Leu Asp Glu Arg Ile Ser
260 265 270
Glu Val Arg Lys Val Asp Ser Gln Lys Leu Gln Asp Glu Tyr Glu Lys
275 280 285
Leu Val Gln Gly Leu His Ser Ala Asp Ile Leu Thr Asp Gln Glu Glu
290 295 300
Pro Phe Val Glu Thr Pro Val Leu Pro Gln Asp Leu Leu Thr Glu Ala
305 310 315 320
Ile Pro Gly Asn Ile Arg Arg Ala Glu His Phe Val Ser Phe Leu Lys
325 330 335
Arg Leu Ile Glu Tyr Leu Lys Thr Arg Met Lys Val Leu His Val Ile
340 345 350
Ser Glu Thr Pro Lys Ser Phe Leu Gln His Leu Lys Gln Leu Thr Phe
355 360 365
Ile Glu Arg Lys Pro Leu Arg Phe Cys Ser Glu Arg Leu Ser Leu Leu
370 375 380
Val Arg Thr Leu Glu Val Thr Glu Val Glu Asp Phe Thr Ala Leu Lys
385 390 395 400
Asp Ile Ala Thr Phe Ala Thr Leu Ile Ser Thr Tyr Glu Glu Gly Phe
405 410 415
Leu Leu Ile Ile Glu Pro Tyr Glu Ile Glu Asn Ala Ala Val Pro Asn
420 425 430
Pro Ile Met Arg Phe Thr Cys Leu Asp Ala Ser Ile Ala Ile Lys Pro
435 440 445
Val Phe Glu Arg Phe Ser Ser Val Ile Ile Thr Ser Gly Thr Ile Ser
450 455 460
Pro Leu Asp Met Tyr Pro Arg Met Leu Asn Phe Lys Thr Val Leu Gln
465 470 475 480
Lys Ser Tyr Ala Met Thr Leu Ala Lys Lys Ser Phe Leu Pro Met Ile
485 490 495
Ile Thr Lys Gly Ser Asp Gln Val Ala Ile Ser Ser Arg Phe Glu Ile
500 505 510
Arg Asn Asp Pro Ser Ile Val Arg Asn Tyr Gly Ser Met Leu Val Glu
515 520 525
Phe Ala Lys Ile Thr Pro Asp Gly Met Val Val Phe Phe Pro Ser Tyr
530 535 540
Leu Tyr Met Glu Ser Ile Val Ser Met Trp Gln Thr Met Gly Ile Leu
545 550 555 560
Asp Glu Val Trp Lys His Lys Leu Ile Leu Val Glu Thr Pro Asp Ala
565 570 575
Gln Glu Thr Ser Leu Ala Leu Glu Thr Tyr Arg Lys Ala Cys Ser Asn
580 585 590
Gly Arg Gly Ala Ile Leu Leu Ser Val Ala Arg Gly Lys Val Ser Glu
595 600 605
Gly Ile Asp Phe Asp His Gln Tyr Gly Arg Thr Val Leu Met Ile Gly
610 615 620
Ile Pro Phe Gln Tyr Thr Glu Ser Arg Ile Leu Lys Ala Arg Leu Glu
625 630 635 640
Phe Met Arg Glu Asn Tyr Arg Ile Arg Glu Asn Asp Phe Leu Ser Phe
645 650 655
Asp Ala Met Arg His Ala Ala Gln Cys Leu Gly Arg Val Leu Arg Gly
660 665 670
Lys Asp Asp Tyr Gly Val Met Val Leu Ala Asp Arg Arg Phe Ser Arg
675 680 685
Lys Arg Ser Gln Leu Pro Lys Trp Ile Ala Gln Gly Leu Ser Asp Ala
690 695 700
Asp Leu Asn Leu Ser Thr Asp Met Ala Ile Ser Asn Thr Lys Gln Phe
705 710 715 720
Leu Arg Thr Met Ala Gln Pro Thr Asp Pro Lys Asp Gln Glu Gly Val
725 730 735
Ser Val Trp Ser Tyr Glu Asp Leu Ile Lys His Gln Asn Ser Arg Lys
740 745 750
Asp Gln Gly Gly Phe Ile Glu Asn Glu Asn Lys Glu Gly Glu Gln Asp
755 760 765
Glu Asp Glu Asp Glu Asp Ile Glu Met Gln
770 775
<210> 67
<211> 129
<212> PRT
<213> 酿脓链球菌
<400> 67
Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu
1 5 10 15
Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile
20 25 30
Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala
35 40 45
Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala
50 55 60
Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala
65 70 75 80
Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu
85 90 95
Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu
100 105 110
Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg
115 120 125
Val
<210> 68
<211> 625
<212> PRT
<213> 酿脓链球菌
<400> 68
Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu
1 5 10 15
Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu
20 25 30
Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys
35 40 45
Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala
50 55 60
Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp
65 70 75 80
Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val
85 90 95
Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly
100 105 110
Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg
115 120 125
Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu
130 135 140
Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys
145 150 155 160
Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp
165 170 175
Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln
180 185 190
Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu
195 200 205
Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu
210 215 220
Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr
225 230 235 240
Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu
245 250 255
Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly
260 265 270
Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu
275 280 285
Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp
290 295 300
Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln
305 310 315 320
Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe
325 330 335
Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr
340 345 350
Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg
355 360 365
Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn
370 375 380
Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu
385 390 395 400
Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro
405 410 415
Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr
420 425 430
Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser
435 440 445
Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg
450 455 460
Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu
465 470 475 480
Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala
485 490 495
Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp
500 505 510
Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu
515 520 525
Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys
530 535 540
Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg
545 550 555 560
Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly
565 570 575
Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser
580 585 590
Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser
595 600 605
Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly
610 615 620
Asp
625
<210> 69
<211> 49
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<220>
<221> 修饰的碱基
<222> (1)..(15)
<223> a, c, t, g, 未知或其他
<220>
<221> 修饰的碱基
<222> (21)..(49)
<223> a, c, t, g, 未知或其他
<400> 69
nnnnnnnnnn nnnnntctct nnnnnnnnnn nnnnnnnnnn nnnnnnnnn 49
<210> 70
<211> 49
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<220>
<221> 修饰的碱基
<222> (1)..(15)
<223> a, c, t, g, 未知或其他
<220>
<221> 修饰的碱基
<222> (21)..(49)
<223> a, c, t, g, 未知或其他
<400> 70
nnnnnnnnnn nnnnntctct nnnnnnnnnn nnnnnnnnnn nnnnnnnnn 49
<210> 71
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<220>
<221> 修饰的碱基
<222> (1)..(10)
<223> a, c, t, g, 未知或其他
<220>
<221> 修饰的碱基
<222> (16)..(25)
<223> a, c, t, g, 未知或其他
<400> 71
nnnnnnnnnn tctctnnnnn nnnnn 25
<210> 72
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<220>
<221> 修饰的碱基
<222> (1)..(10)
<223> a, c, t, g, 未知或其他
<220>
<221> 修饰的碱基
<222> (16)..(25)
<223> a, c, t, g, 未知或其他
<400> 72
nnnnnnnnnn tctctnnnnn nnnnn 25
<210> 73
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<220>
<221> 修饰的碱基
<222> (6)..(10)
<223> a, c, t, g, 未知或其他
<400> 73
gtrhgnnnnn 10
<210> 74
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<220>
<221> 修饰的碱基
<222> (11)..(11)
<223> a, c, t, g, 未知或其他
<400> 74
yyyyyyyyyy nyag 14
<210> 75
<211> 9
<212> PRT
<213> 未知
<220>
<223> 未知的描述:'LAGLIDADG' 家族基序肽
<400> 75
Leu Ala Gly Leu Ile Asp Ala Asp Gly
1 5
<210> 76
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成的肽
<400> 76
Leu Arg Gly Ser
1
<210> 77
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<220>
<221> 修饰的碱基
<222> (1)..(3)
<223> a, c, t, g, 未知或其他
<220>
<221> 修饰的碱基
<222> (8)..(21)
<223> a, c, t, g, 未知或其他
<400> 77
nnnaaaannn nnnnnnnnnn ngg 23
<210> 78
<211> 59
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 78
gtgctgacca tcgacgagaa agggactgaa gctgctgggg ccatgttttt agaggccat 59
<210> 79
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成的肽
<400> 79
Leu Asn Tyr Gly Val Cys Phe Cys Gly
1 5
<210> 80
<211> 49
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<220>
<221> 修饰的碱基
<222> (1)..(15)
<223> a, c, t, g, 未知或其他
<220>
<221> 修饰的碱基
<222> (21)..(49)
<223> a, c, t, g, 未知或其他
<400> 80
nnnnnnnnnn nnnnntctct nnnnnnnnnn nnnnnnnnnn nnnnnnnnn 49
<210> 81
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 81
caaatgcttg tgagaaagct tgctca 26
<210> 82
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成的肽
<400> 82
Gln Ser Ser Asp Leu Ser Arg
1 5
<210> 83
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成的肽
<400> 83
Leu Lys Trp Asn Leu Arg Thr
1 5
<210> 84
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成的肽
<400> 84
Arg Ser Asp Asn Leu Ala Arg
1 5
<210> 85
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成的肽
<400> 85
Trp Gln Ser Ser Leu Ile Val
1 5
<210> 86
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成的肽
<400> 86
Gln Ser Gly Asn Arg Thr Thr
1 5
<210> 87
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 87
atgcttgtga gaaagcttgc tcatca 26
<210> 88
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 88
cttgtgagaa agcttgctca tcatac 26
<210> 89
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成的肽
<400> 89
Thr Asn Gln Asn Arg Ile Thr
1 5
<210> 90
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成的肽
<400> 90
Arg Ser Ala Asn Leu Thr Arg
1 5
<210> 91
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 91
gtgagaaagc ttgctcatca tacttg 26
<210> 92
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成的肽
<400> 92
Ala His Gly Ala Arg Trp Asn
1 5

Claims (31)

1.用于编辑DNA中的腺嘌呤(A)或胞苷(C)碱基的组合物,所述组合物包含:
至少一种锌指蛋白(ZFP)DNA结合结构域;
至少一种DNA去稳定分子;
和至少一种腺嘌呤或胞嘧啶脱氨酶;
其中所述组合物不在DNA中进行双链切割。
2.权利要求1的组合物,其中所述DNA去稳定分子是可操作地连接至单个引导RNA(sgRNA)的Cas9切口酶或Cas9蛋白。
3.权利要求1的组合物,其中所述组合物不包含Cas9蛋白。
4.前述权利要求中任一项的组合物,其中所述DNA去稳定分子是锌指核酸酶(ZFN)切口酶。
5.前述权利要求中任一项的组合物,其中所述至少一种ZFP DNA结合结构域可操作地连接至所述Cas9切口酶或失活Cas9蛋白(dCas9)。
6.前述权利要求中任一项的组合物,其包含第一和第二ZFP DNA结合结构域,其中所述第一ZFP DNA结合结构域可操作地连接至所述Cas9切口酶。
7.前述权利要求中任一项的组合物,其中所述腺嘌呤或胞嘧啶脱氨酶由二聚化形成活性腺嘌呤或胞嘧啶脱氨酶的第一和第二非活性结构域组成。
8.前述权利要求中任一项的组合物,其中所述腺嘌呤或胞嘧啶脱氨酶的第一非活性结构域可操作地连接至所述Cas9切口酶,并且所述腺嘌呤或胞嘧啶脱氨酶的第二非活性结构域可操作地连接至所述第二ZFP DNA结合结构域。
9.权利要求2的组合物,其中所述腺嘌呤或胞嘧啶脱氨酶和所述ZFP DNA结合结构域可操作地连接至所述Cas9切口酶。
10.权利要求2的组合物,其包含第一和第二ZFP DNA结构域,所述第一ZFP可操作地连接至所述Cas9切口酶,并且所述第二ZFP DNA结合结构域可操作地连接至所述腺嘌呤或胞嘧啶脱氨酶。
11.前述权利要求中任一项的组合物,其中所述至少一种ZFP DNA结合结构域可操作地连接至所述腺嘌呤或胞嘧啶脱氨酶。
12.前述权利要求中任一项的组合物,其进一步包含ZFN切口酶。
13.前述权利要求中任一项的组合物,其中所述DNA去稳定因子包含至少一种蛋白质和/或至少一种核苷酸。
14.权利要求13的组合物,其中所述DNA去稳定因子包含蛋白质。
15.权利要求14的组合物,其中所述DNA去稳定因子包含Cas蛋白和/或表A中所示的蛋白质。
16.权利要求13的组合物,其中所述DNA去稳定核苷酸包含寡核苷酸。
17.权利要求16的组合物,其中所述寡核苷酸包含肽核酸(PNA);锁核酸(LNA)和/或桥连核酸(BNA)。
18.权利要求17的组合物,其中所述PNA包含:N-Lys-Lys-Lys-NNNNNNNNNN-OOO-NNNNNNNNNN-Lys-Lys-Lys-C;N-Lys-Lys-Lys-NNNNNNNNNN-OOO-NNNNNNNNNNNNNNN-Lys-Lys-Lys-C;N-Lys-Lys-Lys-NNNNNNNNNN-OOO-NNNNNNNNNN-Lys-Lys-Lys-C;N-Lys-Lys-Lys-NNNNNNNNNN-OOO-NNNNNNNNNN-Lys-Lys-Lys-C;和/或N-Lys-Lys-Lys-NNNNNNNNNNNNNNN-Lys-Lys-Lys-C,其中O表示8-氨基-2,6-二氧杂辛酸接头;C表示胞嘧啶,以及Lys残基是任选的。
19.权利要求17的组合物,其中所述LNA包含:5’-NnNnNnNnNnNnNnNtctctnNnNnNnNnNnNnNnNnnNnnNnnNnnNn-3’(SEQ ID NO:1);5’-N*n*NnNnNnNnNnNnNtctctnNnNnNnNnNnNnNnNnnNnnNnnNnn*N*n-3’(SEQ ID NO:69);和/或5’-NnNnNnNnNnNnNnNtctctnNnNnNnNnNnNnNnNnnNnnNnnNnnNn-Chol-TEG-3’(SEQ ID NO:70),其中LNA核苷酸以大写字母显示;DNA核苷酸为小写字母;“*”表示硫代磷酸酯键。
20.编码前述权利要求中任一项的一种或多种组合物的一种或多种多核苷酸。
21.细胞,其包含根据权利要求1至19中任一项的一种或多种组合物或根据权利要求20的一种或多种多核苷酸,或所述细胞的后代,其中所述细胞包含经编辑的碱基。
22.编辑细胞中靶DNA的碱基的方法,所述方法包括向所述细胞提供权利要求1至19中任一项的组合物或权利要求20的一种或多种多核苷酸。
23.权利要求22的方法,其中所述编辑包括:
(i)将胞苷碱基(“C”)编辑为尿嘧啶碱基(“U”),任选地,其中在DNA复制期间所述U被胸苷碱基(“T”)取代;
(ii)将腺嘌呤碱基(“A”)编辑为肌苷(“I”),任选地,其中在复制期间所述I被鸟嘌呤碱基(“G”)取代;和/或
(iii)将CA或AC二核苷酸编辑为UI或IU。
24.权利要求22的方法,其中所述细胞中的编辑导致:
(i)将C:G碱基对改变为T:A碱基对;
(ii)将C:G碱基对改变为G:C碱基对;
(iii)将A:T碱基对改变为G:C碱基对;
(iv)引入终止密码子;和/或
(v)编辑或产生拼接序列。
25.权利要求24的方法,其中所述编辑校正疾病突变。
26.权利要求22的方法,其中外显子被编辑。
27.用于编辑靶DNA中的碱基的试剂盒,所述试剂盒包括权利要求20的一种或多种多核苷酸。
28.权利要求1至19中任一项的一种或多种组合物或权利要求20的一种或多种多核苷酸在编辑分离的细胞或受试者中的靶DNA分子中的用途,任选地,其中所述细胞或所述受试者中的染色体或染色体外游离体中的DNA被编辑。
29.权利要求28所述的用途,其中所述编辑包括:
(iv)将胞苷碱基(“C”)编辑为尿嘧啶碱基(“U”),任选地,其中在DNA复制期间所述U被胸苷碱基(“T”)取代;
(v)将腺嘌呤碱基(“A”)编辑为肌苷(“I”),任选地,其中在复制期间所述I被鸟嘌呤碱基(“G”)取代;和/或
(vi)将CA或AC二核苷酸编辑为UI或IU。
30.权利要求28或29的用途,其中所述细胞或所述受试者中的编辑导致:
(vi)将C:G碱基对改变为T:A碱基对;
(vii)将C:G碱基对改变为G:C碱基对;
(viii)将A:T碱基对改变为G:C碱基对;
(ix)引入终止密码子;和/或
(x)编辑或产生拼接序列。
31.权利要求28至30中任一项的用途,其中外显子被编辑。
CN201980067879.2A 2018-08-23 2019-08-20 工程化靶特异性碱基编辑器 Pending CN112867792A (zh)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
US201862721903P 2018-08-23 2018-08-23
US62/721,903 2018-08-23
US201862753696P 2018-10-31 2018-10-31
US62/753,696 2018-10-31
US201962817153P 2019-03-12 2019-03-12
US62/817,153 2019-03-12
US201962867565P 2019-06-27 2019-06-27
US62/867,565 2019-06-27
PCT/US2019/047172 WO2020041249A1 (en) 2018-08-23 2019-08-20 Engineered target specific base editors

Publications (1)

Publication Number Publication Date
CN112867792A true CN112867792A (zh) 2021-05-28

Family

ID=69583877

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980067879.2A Pending CN112867792A (zh) 2018-08-23 2019-08-20 工程化靶特异性碱基编辑器

Country Status (10)

Country Link
US (1) US11834686B2 (zh)
EP (1) EP3841204A4 (zh)
JP (1) JP2021536229A (zh)
KR (1) KR20210049124A (zh)
CN (1) CN112867792A (zh)
AU (1) AU2019326408A1 (zh)
CA (1) CA3109592A1 (zh)
IL (1) IL280951B1 (zh)
SG (1) SG11202101801RA (zh)
WO (1) WO2020041249A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023138617A1 (zh) * 2022-01-19 2023-07-27 北京干细胞与再生医学研究院 工程化的CasX核酸酶、效应蛋白及其用途
WO2024065721A1 (en) * 2022-09-30 2024-04-04 Peking University Methods of determining genome-wide dna binding protein binding sites by footprinting with double stranded dna deaminase

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IL280951B1 (en) 2018-08-23 2024-04-01 Sangamo Therapeutics Inc Engineered target-specific base editors
JP7059965B2 (ja) * 2019-02-21 2022-04-26 株式会社豊田中央研究所 エピゲノム状態を制御する融合タンパク質及びその利用
US20230049455A1 (en) * 2020-01-31 2023-02-16 University Of Massachusetts A cas9-pdbd base editor platform with improved targeting range and specificity
CN111518794B (zh) * 2020-04-13 2023-05-16 中山大学 基于激活诱导性胞苷脱氨酶的诱导突变蛋白的制备和用途
CN111690720B (zh) * 2020-06-16 2021-06-15 山东舜丰生物科技有限公司 利用修饰的单链核酸进行靶核酸检测的方法
WO2022006226A1 (en) * 2020-06-30 2022-01-06 Pairwise Plants Services, Inc. Compositions, systems, and methods for base diversification
WO2022027035A1 (en) * 2020-07-27 2022-02-03 The Children's Hospital Of Philadelphia In utero and postnatal gene editing and therapy for treatment of monogenic diseases, including mucopolysaccharidosis type 1h and other disorders
JP2023542705A (ja) * 2020-09-25 2023-10-11 サンガモ セラピューティクス, インコーポレイテッド 核酸塩基編集のためのジンクフィンガー融合タンパク質
AU2021364930A1 (en) * 2020-10-23 2023-06-01 Strm.Bio Incorporated Compositions and methods related to megakaryocyte-derived extracellular vesicles for treating myeloproliferative neoplasms
TW202237845A (zh) * 2020-12-11 2022-10-01 美商英特利亞醫療公司 用於涉及去胺作用之基因體編輯之多核苷酸、組合物及方法
WO2022240846A1 (en) 2021-05-10 2022-11-17 Sqz Biotechnologies Company Methods for delivering genome editing molecules to the nucleus or cytosol of a cell and uses thereof
WO2023049926A2 (en) * 2021-09-27 2023-03-30 Vor Biopharma Inc. Fusion polypeptides for genetic editing and methods of use thereof
WO2023070122A1 (en) * 2021-10-23 2023-04-27 Strm.Bio Incorporated Gene editing to treat myeloproliferative neoplasms
CA3241193A1 (en) * 2021-12-22 2023-06-29 Friedrich A. FAUSER Novel zinc finger fusion proteins for nucleobase editing
KR20230139064A (ko) * 2022-03-25 2023-10-05 기초과학연구원 식물세포 소기관 dna의 아데닌을 구아닌으로 염기 교정
WO2024063538A1 (ko) * 2022-09-21 2024-03-28 기초과학연구원 식물세포 소기관 dna의 염기 교정

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160177278A1 (en) * 2014-12-22 2016-06-23 University Of Massachusetts Cas9-DNA Targeting Unit Chimeras
CN106916852A (zh) * 2017-04-13 2017-07-04 上海科技大学 一种碱基编辑系统及其构建和应用方法
US20170349913A1 (en) * 2016-06-02 2017-12-07 Sigma-Aldrich Co., Llc Using programmable dna binding proteins to enhance targeted genome modification
CN110997728A (zh) * 2017-05-25 2020-04-10 通用医疗公司 二分型碱基编辑器(bbe)结构和ii-型-cas9锌指编辑

Family Cites Families (97)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5436150A (en) 1992-04-03 1995-07-25 The Johns Hopkins University Functional domains in flavobacterium okeanokoities (foki) restriction endonuclease
CA2681922C (en) 1994-01-18 2012-05-15 The Scripps Research Institute Zinc finger protein derivatives and methods therefor
US6242568B1 (en) 1994-01-18 2001-06-05 The Scripps Research Institute Zinc finger protein derivatives and methods therefor
US6140466A (en) 1994-01-18 2000-10-31 The Scripps Research Institute Zinc finger protein derivatives and methods therefor
JP4118327B2 (ja) 1994-08-20 2008-07-16 ゲンダック・リミテッド Dna認識のための結合タンパク質におけるまたはそれに関連する改良
GB9824544D0 (en) 1998-11-09 1999-01-06 Medical Res Council Screening system
US5789538A (en) 1995-02-03 1998-08-04 Massachusetts Institute Of Technology Zinc finger proteins with high affinity new DNA binding specificities
US5928638A (en) 1996-06-17 1999-07-27 Systemix, Inc. Methods for gene transfer
US5925523A (en) 1996-08-23 1999-07-20 President & Fellows Of Harvard College Intraction trap assay, reagents and uses thereof
GB2338237B (en) 1997-02-18 2001-02-28 Actinova Ltd In vitro peptide or protein expression library
GB9703369D0 (en) 1997-02-18 1997-04-09 Lindqvist Bjorn H Process
GB9710807D0 (en) 1997-05-23 1997-07-23 Medical Res Council Nucleic acid binding proteins
GB9710809D0 (en) 1997-05-23 1997-07-23 Medical Res Council Nucleic acid binding proteins
US6410248B1 (en) 1998-01-30 2002-06-25 Massachusetts Institute Of Technology General strategy for selecting high-affinity zinc finger proteins for diverse DNA target sites
JP4309051B2 (ja) 1998-03-02 2009-08-05 マサチューセッツ インスティテュート オブ テクノロジー 改善したリンカーを有するポリジンクフィンガータンパク質
US6140081A (en) 1998-10-16 2000-10-31 The Scripps Research Institute Zinc finger binding domains for GNN
US7070934B2 (en) 1999-01-12 2006-07-04 Sangamo Biosciences, Inc. Ligand-controlled regulation of endogenous gene expression
US6534261B1 (en) 1999-01-12 2003-03-18 Sangamo Biosciences, Inc. Regulation of endogenous gene expression in cells using zinc finger proteins
US7013219B2 (en) 1999-01-12 2006-03-14 Sangamo Biosciences, Inc. Regulation of endogenous gene expression in cells using zinc finger proteins
US6599692B1 (en) 1999-09-14 2003-07-29 Sangamo Bioscience, Inc. Functional genomics using zinc finger proteins
US6453242B1 (en) 1999-01-12 2002-09-17 Sangamo Biosciences, Inc. Selection of sites for targeting by zinc finger proteins and methods of designing zinc finger proteins to bind to preselected sites
US6794136B1 (en) 2000-11-20 2004-09-21 Sangamo Biosciences, Inc. Iterative optimization in the design of binding proteins
US7030215B2 (en) 1999-03-24 2006-04-18 Sangamo Biosciences, Inc. Position dependent recognition of GNN nucleotide triplets by zinc fingers
ATE309536T1 (de) 1999-12-06 2005-11-15 Sangamo Biosciences Inc Methoden zur verwendung von randomisierten zinkfingerprotein-bibliotheken zur identifizierung von genfunktionen
WO2001059450A2 (en) 2000-02-08 2001-08-16 Sangamo Biosciences, Inc. Cells expressing zinc finger protein for drug discovery
US20020061512A1 (en) 2000-02-18 2002-05-23 Kim Jin-Soo Zinc finger domains and methods of identifying same
AU5391401A (en) 2000-04-28 2001-11-12 Sangamo Biosciences Inc Targeted modification of chromatin structure
US7923542B2 (en) 2000-04-28 2011-04-12 Sangamo Biosciences, Inc. Libraries of regulatory sequences, methods of making and using same
ATE374249T1 (de) 2000-04-28 2007-10-15 Sangamo Biosciences Inc Datenbanken von regulatorischen sequenzen, methoden zu ihrer herstellung und verwendung
AU2001263155A1 (en) 2000-05-16 2001-11-26 Massachusetts Institute Of Technology Methods and compositions for interaction trap assays
JP2002060786A (ja) 2000-08-23 2002-02-26 Kao Corp 硬質表面用殺菌防汚剤
US7067317B2 (en) 2000-12-07 2006-06-27 Sangamo Biosciences, Inc. Regulation of angiogenesis with zinc finger proteins
GB0108491D0 (en) 2001-04-04 2001-05-23 Gendaq Ltd Engineering zinc fingers
US20040224385A1 (en) 2001-08-20 2004-11-11 Barbas Carlos F Zinc finger binding domains for cnn
US7262054B2 (en) 2002-01-22 2007-08-28 Sangamo Biosciences, Inc. Zinc finger proteins for DNA binding and gene regulation in plants
AU2003251286B2 (en) 2002-01-23 2007-08-16 The University Of Utah Research Foundation Targeted chromosomal mutagenesis using zinc finger nucleases
US20030232410A1 (en) 2002-03-21 2003-12-18 Monika Liljedahl Methods and compositions for using zinc finger endonucleases to enhance homologous recombination
US7361635B2 (en) 2002-08-29 2008-04-22 Sangamo Biosciences, Inc. Simultaneous modulation of multiple genes
CA2497913C (en) 2002-09-05 2014-06-03 California Institute Of Technology Use of chimeric nucleases to stimulate gene targeting
US8409861B2 (en) 2003-08-08 2013-04-02 Sangamo Biosciences, Inc. Targeted deletion of cellular DNA sequences
US7888121B2 (en) 2003-08-08 2011-02-15 Sangamo Biosciences, Inc. Methods and compositions for targeted cleavage and recombination
US7972854B2 (en) 2004-02-05 2011-07-05 Sangamo Biosciences, Inc. Methods and compositions for targeted cleavage and recombination
EP1737498A2 (en) 2004-04-08 2007-01-03 Sangamo Biosciences Inc. Zinc finger proteins for treatment of neuropathic pain
WO2005099771A2 (en) 2004-04-08 2005-10-27 Sangamo Biosciences, Inc. Methods and compositions for treating neuropathic and neurodegenerative conditions
US20080131962A1 (en) 2006-05-25 2008-06-05 Sangamo Biosciences, Inc. Engineered cleavage half-domains
CA2579677A1 (en) 2004-09-16 2006-03-30 Sangamo Biosciences, Inc. Compositions and methods for protein production
EP1877583A2 (en) * 2005-05-05 2008-01-16 Arizona Board of Regents on behalf of the Unversity of Arizona Sequence enabled reassembly (seer) - a novel method for visualizing specific dna sequences
GB0607063D0 (en) 2006-04-07 2006-05-17 Cellcentric Ltd Compositions and methods for epigenetic modification of nucleic acid sequences in vivo
US7951925B2 (en) 2006-05-25 2011-05-31 Sangamo Biosciences, Inc. Methods and compositions for gene inactivation
WO2008133938A2 (en) 2007-04-26 2008-11-06 Sangamo Biosciences, Inc. Targeted integration into the ppp1r12c locus
US8563314B2 (en) 2007-09-27 2013-10-22 Sangamo Biosciences, Inc. Methods and compositions for modulating PD1
EP2281050B1 (en) 2008-04-14 2014-04-02 Sangamo BioSciences, Inc. Linear donor constructs for targeted integration
JP2011521643A (ja) 2008-05-28 2011-07-28 サンガモ バイオサイエンシーズ, インコーポレイテッド Dna結合ドメインおよび切断ドメインを連結するための組成物
CA2893175C (en) 2008-06-10 2016-09-06 Sangamo Biosciences, Inc. Methods and compositions for generation of bax- and bak-deficient cell lines
KR101759586B1 (ko) 2008-08-22 2017-07-19 상가모 테라퓨틱스, 인코포레이티드 표적화된 단일가닥 분할 및 표적화된 통합을 위한 방법 및 조성물
KR101803737B1 (ko) 2008-12-04 2017-12-01 상가모 테라퓨틱스, 인코포레이티드 징크 핑거 뉴클레아제를 이용한 랫트의 유전체 편집
EP2206723A1 (en) 2009-01-12 2010-07-14 Bonas, Ulla Modular DNA-binding domains
US8956828B2 (en) 2009-11-10 2015-02-17 Sangamo Biosciences, Inc. Targeted disruption of T cell receptor genes using engineered zinc finger protein nucleases
WO2011072246A2 (en) 2009-12-10 2011-06-16 Regents Of The University Of Minnesota Tal effector-mediated dna modification
JP6137596B2 (ja) 2010-02-08 2017-05-31 サンガモ セラピューティクス, インコーポレイテッド 遺伝子操作された切断ハーフドメイン
EP2660318A1 (en) 2010-02-09 2013-11-06 Sangamo BioSciences, Inc. Targeted genomic modification with partially single-stranded donor molecules
CN102939377B (zh) 2010-04-26 2016-06-08 桑格摩生物科学股份有限公司 使用锌指核酸酶对Rosa位点进行基因组编辑
WO2011139349A1 (en) 2010-05-03 2011-11-10 Sangamo Biosciences, Inc. Compositions for linking zinc finger modules
AU2011256838B2 (en) 2010-05-17 2014-10-09 Sangamo Therapeutics, Inc. Novel DNA-binding proteins and uses thereof
CA2993567C (en) 2010-07-21 2022-06-28 Sangamo Biosciences, Inc. Methods and compositions for modification of a t-cell receptor gene
EP3498833B1 (en) 2011-09-21 2023-08-16 Sangamo Therapeutics, Inc. Methods and compositions for regulation of transgene expression
EP2771457B1 (en) 2011-10-27 2017-11-22 Sangamo Therapeutics, Inc. Methods and compositions for modification of the hprt locus
PT2800811T (pt) 2012-05-25 2017-08-17 Univ California Métodos e composições para modificação de adn alvo dirigida por arn e para modulação dirigida por arn de transcrição
AU2013355327A1 (en) 2012-12-05 2015-06-11 Sangamo Therapeutics, Inc. Methods and compositions for regulation of metabolic disorders
US20140310830A1 (en) 2012-12-12 2014-10-16 Feng Zhang CRISPR-Cas Nickase Systems, Methods And Compositions For Sequence Manipulation in Eukaryotes
EP4279588A3 (en) 2012-12-12 2024-01-17 The Broad Institute, Inc. Engineering of systems, methods and optimized guide compositions for sequence manipulation
SG10201912327SA (en) 2012-12-12 2020-02-27 Broad Inst Inc Engineering and Optimization of Improved Systems, Methods and Enzyme Compositions for Sequence Manipulation
US8697359B1 (en) 2012-12-12 2014-04-15 The Broad Institute, Inc. CRISPR-Cas systems and methods for altering expression of gene products
EP3825401A1 (en) 2012-12-12 2021-05-26 The Broad Institute, Inc. Crispr-cas component systems, methods and compositions for sequence manipulation
WO2014093655A2 (en) 2012-12-12 2014-06-19 The Broad Institute, Inc. Engineering and optimization of systems, methods and compositions for sequence manipulation with functional domains
CN110540991B (zh) 2013-03-15 2023-10-24 通用医疗公司 使用截短的引导RNA(tru-gRNA)提高RNA引导的基因组编辑的特异性
CN116083487A (zh) 2013-05-15 2023-05-09 桑格摩生物治疗股份有限公司 用于治疗遗传病状的方法和组合物
US9771403B2 (en) 2013-12-09 2017-09-26 Sangamo Therapeutics, Inc. Methods and compositions for treating hemophilia
ES2787198T3 (es) 2014-01-31 2020-10-15 Factor Bioscience Inc ARN sintético para su uso en el tratamiento de la epidermólisis ampollosa distrófica
EP3613854A1 (en) * 2014-03-05 2020-02-26 National University Corporation Kobe University Genomic sequence modification method for specifically converting nucleic acid bases of targeted dna sequence, and molecular complex for use in same
US9522936B2 (en) 2014-04-24 2016-12-20 Sangamo Biosciences, Inc. Engineered transcription activator like effector (TALE) proteins
EP3167071B1 (en) * 2014-07-09 2020-10-07 Gen9, Inc. Compositions and methods for site-directed dna nicking and cleaving
IL284707B2 (en) 2015-05-12 2024-01-01 Sangamo Therapeutics Inc Regulation of nuclease-mediated gene expression
IL294014B1 (en) 2015-10-23 2024-03-01 Harvard College Nucleobase editors and their uses
SG11201803144WA (en) * 2015-11-04 2018-05-30 Fate Therapeutics Inc Genomic engineering of pluripotent cells
KR102061438B1 (ko) * 2015-11-27 2019-12-31 고쿠리츠다이가쿠호진 고베다이가쿠 표적화 dna 서열 중의 핵산 염기가 특이적으로 전환되어 있는 단자엽식물 게놈 서열을 전환시키는 방법, 및 그것에 사용되는 분자 복합체
CA3008413A1 (en) 2015-12-18 2017-06-22 Sangamo Therapeutics, Inc. Targeted disruption of the t cell receptor
EP3411056A4 (en) 2016-02-02 2019-10-02 Sangamo Therapeutics, Inc. COMPOUNDS FOR NETWORKING DNA BINDING DOMAINS AND SPLITTING DOMAINS
EP3504327B1 (en) 2016-08-24 2021-10-06 Sangamo Therapeutics, Inc. Engineered target specific nucleases
WO2018039438A1 (en) 2016-08-24 2018-03-01 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
CA3035910A1 (en) * 2016-09-07 2018-03-15 Flagship Pioneering, Inc. Methods and compositions for modulating gene expression
EP3559046A4 (en) 2016-12-21 2020-06-03 University of Florida Research Foundation, Incorporated CCR2 + HEMATOPOIETIC STEM CELLS FOR TRANSMITTING T-CELL ACTIVATION IN ADOPTIVE CELL THERAPY
GB2605925B (en) * 2016-12-23 2023-02-22 Harvard College Gene editing of PCSK9
WO2018119359A1 (en) * 2016-12-23 2018-06-28 President And Fellows Of Harvard College Editing of ccr5 receptor gene to protect against hiv infection
IL280951B1 (en) 2018-08-23 2024-04-01 Sangamo Therapeutics Inc Engineered target-specific base editors
WO2021155065A1 (en) 2020-01-28 2021-08-05 The Broad Institute, Inc. Base editors, compositions, and methods for modifying the mitochondrial genome
WO2022155265A2 (en) 2021-01-12 2022-07-21 Mitolab Inc. Context-dependent, double-stranded dna-specific deaminases and uses thereof

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160177278A1 (en) * 2014-12-22 2016-06-23 University Of Massachusetts Cas9-DNA Targeting Unit Chimeras
US20170349913A1 (en) * 2016-06-02 2017-12-07 Sigma-Aldrich Co., Llc Using programmable dna binding proteins to enhance targeted genome modification
CN106916852A (zh) * 2017-04-13 2017-07-04 上海科技大学 一种碱基编辑系统及其构建和应用方法
CN110997728A (zh) * 2017-05-25 2020-04-10 通用医疗公司 二分型碱基编辑器(bbe)结构和ii-型-cas9锌指编辑
US20200140842A1 (en) * 2017-05-25 2020-05-07 The General Hospital Corporation Bipartite base editor (bbe) architectures and type-ii-c-cas9 zinc finger editing

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王丽洁 等: "碱基编辑技术的发展与应用", 《生命的化学》, 15 February 2019 (2019-02-15) *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023138617A1 (zh) * 2022-01-19 2023-07-27 北京干细胞与再生医学研究院 工程化的CasX核酸酶、效应蛋白及其用途
WO2024065721A1 (en) * 2022-09-30 2024-04-04 Peking University Methods of determining genome-wide dna binding protein binding sites by footprinting with double stranded dna deaminase

Also Published As

Publication number Publication date
EP3841204A4 (en) 2022-05-18
SG11202101801RA (en) 2021-03-30
KR20210049124A (ko) 2021-05-04
IL280951B1 (en) 2024-04-01
CA3109592A1 (en) 2020-02-27
IL280951A (en) 2021-04-29
JP2021536229A (ja) 2021-12-27
US20200063114A1 (en) 2020-02-27
US11834686B2 (en) 2023-12-05
AU2019326408A1 (en) 2021-03-11
EP3841204A1 (en) 2021-06-30
WO2020041249A1 (en) 2020-02-27

Similar Documents

Publication Publication Date Title
US11834686B2 (en) Engineered target specific base editors
AU2020203792B2 (en) Compositions For Linking DNA-Binding Domains And Cleavage Domains
US11827900B2 (en) Engineered target specific nucleases
US10494648B2 (en) Delivery methods and compositions for nuclease-mediated genome engineering
US10179918B2 (en) Methods and compositions for increasing transgene activity
EP3769775A2 (en) Compositions for linking dna-binding domains and cleavage domains
CN111954540A (zh) 工程化靶标特异性核酸酶
US20240229079A9 (en) Engineered target specific nucleases
RU2782794C2 (ru) Сконструированные мишень-специфические нуклеазы
NZ791740A (en) Engineered target specific nucleases
NZ791711A (en) Engineered target specific nucleases

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination