CN111801345A - 使用噬菌体辅助连续进化(pace)的进化碱基编辑器的方法和组合物 - Google Patents

使用噬菌体辅助连续进化(pace)的进化碱基编辑器的方法和组合物 Download PDF

Info

Publication number
CN111801345A
CN111801345A CN201880062594.5A CN201880062594A CN111801345A CN 111801345 A CN111801345 A CN 111801345A CN 201880062594 A CN201880062594 A CN 201880062594A CN 111801345 A CN111801345 A CN 111801345A
Authority
CN
China
Prior art keywords
amino acid
cytidine deaminase
ugi
seq
fusion protein
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201880062594.5A
Other languages
English (en)
Inventor
D.R.刘
C.G.威尔逊
B.瑟隆伊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harvard College
Original Assignee
Harvard College
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harvard College filed Critical Harvard College
Publication of CN111801345A publication Critical patent/CN111801345A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/32Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Bacillus (G)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2497Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing N- glycosyl compounds (3.2.2)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/78Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y305/00Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
    • C12Y305/04Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
    • C12Y305/04005Cytidine deaminase (3.5.4.5)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/80Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Virology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Medicinal Preparation (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)

Abstract

本说明书提供了进化的碱基编辑器,该进化的碱基编辑器克服了现有技术中那些碱基编辑器的缺陷(包括提高效率和/或降低对编辑位点处特定的序列背景的需求),并且通过噬菌体辅助连续进化(PACE)系统获得。特别是,本说明书提供了进化的胞苷碱基编辑器(例如,基于APOBEC1、CDA或AID胞苷脱氨酶结构域),该进化的胞苷碱基编辑器克服了现有技术中那些碱基编辑器的缺陷(包括提高效率和/或降低对编辑位点处特定的序列背景的需求),并且通过噬菌体辅助连续进化(PACE)系统获得。

Description

使用噬菌体辅助连续进化(PACE)的进化碱基编辑器的方法和 组合物
相关申请和通过引用并入
本申请要求于2017年7月28日提交的美国临时专利申请第62/538,380号的优先权,该申请的全部内容通过引用并入本文。
背景技术
核酸序列的靶向编辑,例如,靶向切割或向基因组DNA中靶向引入特定修饰,是研究基因功能的非常有前途的方法,并且也具有提供用于人类基因病(例如因点突变导致的那些)的新疗法的潜力。点突变代表大多数与疾病相关的已知人类遗传变型(1)。因此,开发可靠的方法来引入和纠正点突变是理解和治疗具有遗传成分的疾病的重要挑战。
近年来已开发了工程化碱基编辑器(2,3)。碱基编辑器是催化丧失能力的Cas部分与核碱基修饰酶(例如,天然或进化的核碱基脱氨酶,如包括APOBEC1(“载脂蛋白B mRNA编辑酶,催化多肽1”)、CDA(“胞苷脱氨酶”)或AID(“激活诱导的胞苷脱氨酶”)的胞嘧啶脱氨酶)结构域的融合物。在某些情况下,核苷酸编辑器可能还包含改变细胞DNA修复过程以提高所得单核苷酸变化的效率和稳定性的蛋白质,例如UGI结构域(2,3)。
迄今为止,已大体上描述了两类碱基编辑器:胞苷碱基编辑器将靶C·G碱基对转化为T·A碱基对,腺嘌呤碱基编辑器将A·T碱基对转化为G·C碱基对。总体上,这两类碱基编辑器能够靶向安装全部四种转换突变(C-至-T、G-至-A、A-至-G和T-至-C),其总体上占ClinVar数据库中的已知的人致病性小核苷酸多态性(SNPs)的约61%。特别是,在通过Cas9开环的单链DNA环中,C-至-T碱基编辑器使用胞苷脱氨酶将胞苷转化为尿苷。相对的链被Cas9切开以刺激DNA修复机制,该机制使用编辑的链作为模板,而融合的尿嘧啶糖基化酶抑制剂(未显示)减慢了编辑的碱基的切除速度。最终,DNA修复导致C·G到T·C碱基对的转化。
碱基编辑器可高效编辑许多靶,通常在单次处理后无需富集即可编辑30-70%的细胞。然而,不幸的是,碱基编辑的实用性受到几项约束的限制,包括所用的特定Cas部分(例如,来自化脓性链球菌(S.pyogenes)的天然存在的Cas9,或其修饰形式,或其同源物)所强加的PAM要求,理想编辑位点附近非靶核苷酸的脱靶碱基编辑,不理想的编辑的基因组副产物(例如插入缺失)的产生,以及总体低下的编辑效率。例如,现有的胞苷碱基编辑器活性依赖于靶核苷酸周围的碱基。基于APOBEC1胞苷脱氨酶的C-至-T编辑器偏向于编辑TC基序,而不喜欢大部分GC碱基。这种偏向可导致编辑规范编辑窗口之外位置的TC,以及甚至在GC靶位于最佳位置时也很少编辑GC靶。使用其他脱氨酶如CDA或AID的C-至-T编辑器可提供用于某些GC位点的有效替代方案,但与APOBEC1 Bes相比其总体编辑效率低下。
已开始开发“下一代”碱基编辑器以解决这些限制中的一些,包括具有不同的或扩展的PAM相容性的碱基编辑器(19-21),具有降低的脱靶活性的高保真碱基编辑器(20,22-25),具有较窄的编辑窗口的碱基编辑器(通常宽度为~5个核苷酸)(19),具有松散的序列背景偏向的碱基编辑器,以及具有较少副产物(6)的胞苷碱基编辑器(BE4)(6)。然而,尽管有这些研究进展,除其他因素之外,碱基编辑器的碱基编辑效率也因细胞类型和目标基因座而大幅变化。因此,在本领域中,仍然存在开发具有改进的编辑效率的具有序列背景无关的碱基编辑活性的碱基编辑器的显著需要。本文描述了一种用于开发和产生进化的碱基编辑器的噬菌体辅助连续进化系统,该进化的碱基编辑器具有高效,并且为背景无关的,因此解决了现有技术中的问题。
发明内容
本说明书提供了进化的碱基编辑器,其克服了现有技术中那些碱基编辑器的缺陷(包括提高效率和/或降低对编辑位点处特定序列背景的需求),并且其通过噬菌体辅助连续进化(PACE)系统获得。特别是,本说明书提供了进化的胞苷碱基编辑器(例如,基于APOBEC1、CDA或AID胞苷脱氨酶结构域),该进化的胞苷碱基编辑器克服了现有技术中那些碱基编辑器的缺陷(包括提高效率和/或降低对编辑位点处特定的序列背景的需求),并且其通过噬菌体辅助连续进化(PACE)系统获得。此外,本说明书提供了编码和/或表达如本文所述的进化的碱基编辑器的核酸分子,以及用于表达本文所述的进化的碱基编辑器的表达载体或构建体,包含所述核酸分子和表达载体的宿主细胞,以及用于递送和/或施用本文所述的基于核酸的实施方式的组合物。此外,本公开提供了分离的进化的碱基编辑器,以及包含如本文所述的分离的进化的碱基编辑器的组合物。又另外,本公开提供了制备进化的碱基编辑器的方法,以及以与形成现有技术状态的碱基编辑器相比更高的效率,优选以序列背景无关的方式(即,其中理想编辑位点不需要特定的序列背景),在包括编辑核酸分子如基因组的应用中使用进化的碱基编辑器或编码进化的碱基编辑器的核酸分子的方法。在实施方式中,本文提供的制备方法是改进型噬菌体辅助连续进化(PACE)系统,其可用于快速连续地进化的碱基编辑器中的一个或多个组件(例如,Cas9结构域或胞苷脱氨酶结构域)。本说明书还提供了用本文所述的碱基编辑系统(例如,如本文所述的分离的进化的碱基编辑器形式或者编码该进化的碱基编辑器的载体或构建体形式)有效地编辑靶核酸分子(如基因组的单个核碱基)并进行碱基编辑(优选以序列背景无关的方式)的方法。又另外,本说明书提供了治疗基因病和/或用于改变或变化遗传特性或条件的治疗方法,所述方法通过将靶核酸分子(例如,基因组)与碱基编辑系统(例如,如本文所述的分离的进化的碱基编辑器形式或者编码该进化的碱基编辑器的载体形式)相接触并进行碱基编辑来治疗基因病和/或改变遗传特性(例如,眼睛颜色)。
本发明人惊奇地发现通过开发可用于快速改善碱基编辑器的一个或多个结构域或组件的功能的有效的连续进化突变发生过程(即,PACE)改进了碱基编辑器(例如,胞嘧啶碱基编辑器)。
因此,在一个方面,本说明书提供了一种胞苷脱氨酶,其包含与SEQ ID NO:1的氨基酸残基2-162具有至少80%、85%、90%、95%、98%、99%或99.5%同一性的氨基酸序列,其中该胞苷脱氨酶包含相对于SEQ ID NO:1的选自H102X1、D104X2和V115X3的一个或多个突变或另一种胞苷脱氨酶中的相应突变,其中X1是非H的任意氨基酸(例如,H102P),X2是非D的任意氨基酸(例如,D104N)和X3是非V的任意氨基酸(例如,M)。在一个实施方式中,胞苷脱氨酶包含SEQ ID NO:5的残基2-162。胞苷脱氨酶还可包含N-末端甲硫氨酸(M)氨基酸残基。
在另一方面,本说明书提供了一种胞苷脱氨酶,其包含与SEQ ID NO:2的氨基酸残基3-229具有至少80%、85%、90%、95%、98%、99%或99.5%同一性的氨基酸序列,其中该胞苷脱氨酶包含相对于SEQ ID NO:2的选自E4X1、V10X2、E31X3、Y40X4、E95X5、H109X6、H122X7、D124X8、R126X9、R154X10、N158X11、A165X12、P201X13、F205X14、和I208X15的一个或多个突变或另一种胞苷脱氨酶中的相应突变,其中X1、X3和X5是非E的任意氨基酸,X2是非V的任意氨基酸,X4是非Y的任意氨基酸,X6和X7是非H的任意氨基酸,X8是非D的任意氨基酸,X9和X10是非R的任意氨基酸,X11是非N的任意氨基酸,X12是非A的任意氨基酸,X13是非P的任意氨基酸,X14是非F的任意氨基酸,和X15是非I的任意氨基酸。在多个实施方式中:X1是非K;X2和X5是非A;X3是非V,X4是非C;X6和X8是非N;X7和X15是非L;X9和X10是非H;X11,X12,X13;和X14是非S。在多个实施方式中,胞苷脱氨酶可包含相对于SEQ ID NO:2的可包含E4K、H109N、H122L、D124N、R154H、A165S、P201S和F205S的2、3、4、5、6、7或全部8个突变。在一个实施方式中,胞苷脱氨酶包含SEQ ID NO:6的氨基酸序列。
在仍然另一个实施方式中,本说明书提供了一种胞苷脱氨酶,其包含与SEQ IDNO:3的氨基酸残基2-208具有至少80%、85%、90%、95%、98%、99%或99.5%同一性的氨基酸序列,其中该胞苷脱氨酶包含相对于SEQ ID NO:3的选自H10X1、F23X2、V75X3、K120X4、A123X5、C158X6、I193X7、I195X8和V197X9的一个或多个突变或另一种胞苷脱氨酶中的相应突变,其中X1是非H的任意氨基酸,X2是非F的任意氨基酸,X3和X9是非V的任意氨基酸,X4是非K的任意氨基酸,X5是非A的任意氨基酸,X6是非C的任意氨基酸,和X7和X8是非I的任意氨基酸。在多个实施方式中:X1是非Y;X2是非S;X3是非I;X4和X6是非R;X5是非V;X7是非T;X8是非F或T;和X9是非A。在一个实施方式中,胞苷脱氨酶包含相对于SEQ ID NO:3的突变F23S、A123V和I195F。在其他实施方式中,胞嘧啶脱氨酶包含N-末端甲硫氨酸(M)氨基酸残基。在优选实施方式中,胞苷脱氨酶包含SEQ ID NO:7的氨基酸序列。
在仍然另一个方面,本说明书提供了一种胞苷脱氨酶,其包含与SEQ ID NO:4的氨基酸残基3-229具有至少80%、85%、90%、95%、98%、99%或99.5%同一性的氨基酸序列,其中该胞苷脱氨酶包含相对于SEQ ID NO:4的选自E4X1,H122X2,D124X3,R154X4,A165X5,P201X6和F205X7的一个或多个突变或另一种胞苷脱氨酶中的相应突变,其中X1是非E的任意氨基酸,X2非H的任意氨基酸,X3是非D的任意氨基酸,X4是非R的任意氨基酸,X5是非A的任意氨基酸,X6是非P的任意氨基酸,和X7是非F的任意氨基酸。在多个实施方式中,胞苷脱氨酶包含相对于SEQ ID NO:4的选自E4X1,H122X2,D124X3,R154X4,A165X5,P201X6和F205X7的2、3、4、5、6或全部7个突变,其中X1是非E的任意氨基酸,X2是非H的任意氨基酸,X3是非D的任意氨基酸,X4是非R的任意氨基酸,X5是非A的任意氨基酸,X6是非P的任意氨基酸,和X7是非F的任意氨基酸。在某些实施方式中:X1是非K;X2是非L;X3是非N;X4是非H;X5是非S;X6是非S;和/或X7是非S。在其他实施方式中,一个或多个突变可选自相对于SEQ ID NO:4的E4K、H122L、D124N、R154H、A165S、P201S和F205S。在另一个实施方式中,脱氨酶可为SEQ ID NO:89或SEQID NO:8的氨基酸残基3-229,并且可包含N-末端甲硫氨酸(M)氨基酸残基或两个N-末端氨基酸残基,其为M和S。
在仍然另一个方面,本说明书提供了一种进化的碱基编辑器融合蛋白,其包含:(i)核酸可编程DNA结合蛋白(napDNAbp);(ii)如本文所述的上述任意方面中的胞苷脱氨酶;和(iii)尿嘧啶糖基化酶抑制剂结构域(UGI)。融合蛋白可具有2、3、4或5个UGI结构域。核酸可编程DNA结合蛋白(napDNAbp)是非Cas9结构域。napDNAbp也可为CasX、CasY、Cpf1、C2c1、C2c2、C2c3或Argonaute蛋白。Cas9结构域是非核酸酶活性Cas9、核酸酶失活的Cas9(dCas9)或Cas9切口酶(nCas9)。
在进化的碱基编辑器融合蛋白的多个实施方式中,nCas9可具有与以下氨基酸序列具有至少80%、85%、90%、95%、98%、99%、99.5%或99.9%同一性的氨基酸序列:
DKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD(SEQ ID NO:9)。
在其他实施方式中,进化的碱基编辑器融合蛋白的UGI结构域可包含能够抑制UDG活性的结构域。UGI结构域包含与以下氨基酸序列具有至少80%、85%、90%、95%、98%、99%、99.5%或99.9%同一性的氨基酸序列:MTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKML(SEQ ID NO:10)。
在多个实施方式中,本文所述的进化的碱基编辑器融合蛋白可包含以下任意结构:NH2-[胞苷脱氨酶]-[napDNAbp]-[UGI]-COOH;NH2-[胞苷脱氨酶]-[UGI]-[napDNAbp]-COOH;NH2-[napDNAbp]-[UGI]-[胞苷脱氨酶]-COOH;NH2-[napDNAbp]-[胞苷脱氨酶]-[UGI]-COOH;NH2-[UGI]-[胞苷脱氨酶]-[napDNAbp]-COOH;和NH2-[UGI]-[napDNAbp]-[胞苷脱氨酶]-COOH;其中胞苷脱氨酶可为以上方面中所述的进化的胞苷脱氨酶,其中UGI是UGI结构域,和其中每个“-”包含任选的接头。
在其他实施方式中,本文所述的进化的碱基编辑器融合蛋白可包含以下任意结构:NH2-[胞苷脱氨酶]-[napDNAbp]-[UGI]-[UGI]-COOH;NH2-[胞苷脱氨酶]-[UGI]-[napDNAbp]-[UGI]-COOH;NH2-[UGI]-[胞苷脱氨酶]-[napDNAbp]-[UGI]-COOH;NH2-[胞苷脱氨酶]-[UGI]-[napDNAbp]-[UGI]-COOH;NH2-[胞苷脱氨酶]-[UGI]-[UGI]-[napDNAbp]-COOH;NH2-[UGI]-[胞苷脱氨酶]-[UGI]-[napDNAbp]-COOH;NH2-[UGI]-[napDNAbp]-[UGI]-[胞苷脱氨酶]-COOH;NH2-[napDNAbp]-[UGI]-[UGI]-[胞苷脱氨酶]-COOH;NH2-[napDNAbp]-[UGI]-[胞苷脱氨酶]-[UGI]-COOH;NH2-[napDNAbp]-[胞苷脱氨酶]-[UGI]-[UGI]-COOH;NH2-[napDNAbp]-[UGI]-[胞苷脱氨酶]-[UGI]-COOH;NH2-[UGI]-[napDNAbp]-[胞苷脱氨酶]-[UGI]-COOH;NH2-[UGI]-[胞苷脱氨酶]-[napDNAbp]-[UGI]-COOH;NH2-[UGI]-[胞苷脱氨酶]-[UGI]-[napDNAbp]-COOH;NH2-[UGI]-[UGI]-[胞苷脱氨酶]-[napDNAbp]-COOH;NH2-[UGI]-[napDNAbp]-[胞苷脱氨酶]-[UGI]-COOH;NH2-[UGI]-[napDNAbp]-[UGI]-[胞苷脱氨酶]-COOH;和NH2-[UGI]-[UGI]-[napDNAbp]-[胞苷脱氨酶]-COOH;其中胞苷脱氨酶是以上方面中所述的进化的胞苷脱氨酶,其中UGI是UGI结构域,和其中每个“-”包含任选的接头。
接头可包含以下任意氨基酸序列:SGGSSGGSSGSETPGTSESATPESSGGSSGGS(SEQ IDNO:11);SGGSGGSGGS(SEQ ID NO:12);SGGS(SEQ ID NO:14);或SGGSGGSGGS(SEQ ID NO:12)。
在多个实施方式中,进化的碱基编辑器融合蛋白还可包含一个或多个(例如,2、3、4、5、6或更多个)核定位序列(NLS),诸如,KRTADGSEFEPKKKRKV(SEQ ID NO:13)。
在多个实施方式中,进化的碱基编辑器融合蛋白可包含与SEQ ID NOs:15-20中任一个所示的任一个氨基酸序列具有至少80%、85%、90%、95%、98%、99%或99.5%同一性的氨基酸序列。
在多个其他实施方式中,本说明书提供了编码任一个进化的碱基编辑器融合蛋白或其结构域的核酸分子。核酸序列可进行编码优化以用于在哺乳动物细胞(例如,HEK293T)中表达。
在仍然其他实施方式中,本说明书提供了一种具有启动子的载体,该启动子用于驱动编码进化的碱基编辑器(或其一个或多个独立组件)的核酸序列的表达。
在多个实施方式中,本发明的连续进化/PACE方法设想了将进化的碱基编辑器融合蛋白的表达分到两个或更多个表达载体上,其中每个表达单元编码进化的碱基编辑器融合蛋白的一部分。所表达的部分包含分裂内含肽结构域,其通过蛋白质剪接过程驱动完全形成的进化的碱基编辑器的自体形成。
在其他方面,本说明书提供了本文所述的进化的碱基编辑器融合蛋白和与融合蛋白的napDNAbp结合的RNA(诸如,向导RNA(gRNA))的复合物。向导RNA可为单链向导RNA或多链向导RNAs。RNA的长度可为10-100个核苷酸,并且包含与靶序列互补的至少10个连续的核苷酸或者与靶序列互补的至少11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39或40个核苷酸。
在一些实施方式中,该靶序列(要被编辑的序列)是DNA序列,包括生物体基因组。生物体可为原核生物或真核生物或脊椎生物、哺乳动物或人。
在其他实施方式中,本说明书提供了细胞,该细胞包含本文所公开的进化的胞苷脱氨酶,进化的碱基编辑器融合,本文所公开的复合物,编码其的核酸分子或包含核酸分子的载体。
在仍然其他实施方式中,本说明书提供了包含核酸或核酸构建体的试剂盒,该试剂盒包含:编码本文所公开的融合蛋白的核酸序列;和驱动该融合蛋白表达的异源启动子。试剂盒还可包含编码向导RNA骨架的表达构建体,其中该构建体包含被定为以允许将与靶序列相同或互补的核酸序列克隆到向导RNA骨架中的克隆位点。
在其他实施方式中,本说明书提供了一种药物组合物,其包含如本文所述的进化的碱基编辑器融合蛋白和可药用赋形剂以及任选的脂质(诸如阳离子脂质)。药物组合物还可包含聚合物。
本说明书还提供了一种使用本文所述的包含进化的碱基编辑器或编码其的核酸分子用于编辑靶核苷酸序列(例如基因组)的方法。靶核苷酸序列可包含与疾病或病症相关的靶序列(例如,点突变)。靶序列可包含T至C的与疾病或病症相关的点突变,其中突变C碱基的脱氨化导致不与疾病或病症相关的序列。靶序列可编码蛋白质,其中点突变位于密码子中,并且导致与野生型密码子相比突变密码子所编辑的氨基酸发生变化。靶序列还可位于剪接位点处,其中点突变导致与野生型转录物相比mRNA转录物的剪接发生变化。此外,靶可在基因的启动子处,其中点突变导致基因表达增加或减少。
在多个实施方式中,进化的碱基编辑器导致靶位点的脱氨化。在一些情况中,突变C的脱氨化导致突变密码子所编码的氨基酸发生变化,在在一些情况中可导致表达野生型氨基酸。脱氨化也可导致mRNA转录物发生变化,并且甚至将mRNA转录物恢复到野生型状态。
本文所述的涉及将进化的碱基编辑器与靶核苷酸序列相接触的方法可发生在体外或发生在受试者体内。受试者可为已被诊断患有疾病或病症(诸如与ApoE基因中的点突变相关的疾病或病症)的某些人。
本发明的方法还涉及与降解决定子(degron tag)融合的RNA聚合酶(例如,T7 RNA聚合酶)。
本发明的方法还涉及如下融合蛋白,该融合蛋白包含与N-内含肽或C-内含肽融合的碱基编辑器的胞苷脱氨酶,以及包含与互补的N-内含肽或C-内含肽结构域融合的碱基编辑器的其余部分的独立表达的融合蛋白,这样,由于作用在N-和C-内含肽结构域上的细胞的蛋白质剪接机制,在同一细胞中表达胞嘧啶脱氨酶和表达碱基编辑器的其余部分导致完整的碱基编辑器。胞嘧啶脱氨酶可以是APOBEC脱氨酶。
本说明书还提供了包含编码与分裂内含肽结构域融合的完整碱基编辑器的第一部分的核酸分子的第一表达载体,和与同源分裂内含肽结构域融合的完整碱基编辑器的第二部分的核酸分子的第二表达载体,其中当在细胞中表达时,细胞的蛋白质剪接机制通过如下方式形成整个碱基编辑器:接合分裂内含肽结构域,随后将其去除,留下接合第一和第二部分的残余肽键。
本说明书还提供了一种用于基于噬菌体的连续定向进化的载体系统,其包含:
a.包含编码能够使胞嘧啶脱氨基的碱基编辑器蛋白的核酸的载体;
b.编码整个碱基编辑器的其余部分的第二载体;和
c.编码luxAB和向导RNA(gRNA)的载体。
本说明书还提供了一种核酸的连续进化方法,包括:(i)通过泻湖(lagoon)将包含待进化的目的基因(例如脱氨酶)的选择噬菌粒(SP)引入到细菌宿主细胞流中,
其中宿主细胞包含将选择噬菌粒包装到感染性噬菌体颗粒中所需的噬菌体基因,其中将选择噬菌粒包装入噬菌体颗粒中所需的至少一个基因是丧失能力的(disable),
其中将选择噬菌粒包装入感染性噬菌体颗粒所需的至少一个基因的表达相应于待进化的基因在宿主细胞中的表达,
并且其中宿主细胞通过泻湖的流速允许噬菌粒在泻湖中复制,但是不允许宿主细胞复制;
(ii)在宿主细胞流中复制和突变噬菌粒;和
(iii)从细胞流分离包含突变的待进化基因的噬菌粒。
宿主细胞可包含第一辅助质粒(AP),该第一辅助质粒包含在宿主细胞中丧失能力的将选择噬菌粒包装入噬菌体颗粒所需的基因,其中相应于Sp所编码的融合蛋白的表达,从辅助质粒表达基因。
在某些实施方式中,靶位于生物体基因组中。在某些实施方式中,生物体是原核生物。在某些实施方式中,生物体是真核生物。在某些实施方式中,生物体是脊椎生物。在某些实施方式中,脊椎生物是哺乳动物。在某些实施方式中,哺乳动物是人。
在一个方面,本说明书公开了一种细胞,其包含任一种本文所公开的进化的碱基编辑器融合蛋白。
在一个方面,本说明书公开了一种细胞,其包含任一种本文所公开的核酸。
在一个方面,本说明书公开了一种细胞,其包含任一种本文所公开的载体。
在一个方面,本说明书公开了一种细胞,其包含任一种本文所公开的复合物。
在一个方面,本说明书公开了一种方法,其包括将核酸分子与任何本文所公开的复合物相接触。在某些实施方式中,核酸是DNA。在某些实施方式中,核酸是双链DNA。在某些实施方式中,核酸包含与疾病或病症相关的靶序列。在某些实施方式中,靶序列包含与疾病或病症相关的点突变。
在某些实施方式中,靶序列包含T至C的与疾病或病症相关的点突变,和其中突变C碱基的脱氨化导致不与疾病或病症相关的序列。在某些实施方式中,靶序列包含G至A的与疾病或病症相关的点突变,和其中突变C碱基的脱氨化导致不与疾病或病症相关的序列。
在某些实施方式中,其中发生了理想的编辑的靶序列是序列无关的(agnostic)。即,本文所述的进化的碱基编辑器可实施有效和精确的编辑而无需在靶编辑位点处的特定序列。
在某些实施方式中,靶序列编码蛋白质,和其中点突变在密码子中,和导致与野生型密码子相比突变密码子所编辑的氨基酸发生变化。在某些实施方式中,靶序列位于剪接位点处,其中点突变导致与野生型转录物相比mRNA转录物的剪接发生变化。在某些实施方式中,靶序列位于基因的启动子处,其中点突变导致基因表达增加。在某些实施方式中,靶序列位于基因的启动子处,其中点突变导致基因表达减少。
在某些实施方式中,突变C或突变A的脱氨化导致突变密码子所编码的氨基酸发生变化。在某些实施方式中,突变C或突变A的脱氨化导致编码野生型氨基酸的密码子。在某些实施方式中,突变C或突变A的脱氨化导致mRNA转录物发生变化。在某些实施方式中,突变C或突变A的脱氨化导致野生型mRNA转录物。在某些实施方式中,突变C或突变A的脱氨化导致基因表达增加。在某些实施方式中,突变C或突变A的脱氨化导致基因表达减少。
在某些实施方式中,接触在体外实施。在某些实施方式中,接触在受试者体内实施。
在某些实施方式中,受试者已被诊断患有疾病或病症。在某些实施方式中,疾病或病症选自先天性糖基化1f型病症、家族性红斑性肢痛症、阵发性极端疼痛病症、对疼痛的慢性不敏感、镰状细胞性贫血和β-地中海贫血。在某些实施方式中,疾病或病症与MDPU1基因中的点突变相关。在某些实施方式中,疾病或病症与SCN9a基因中的点突变相关。在某些实施方式中,疾病或病症可通过增加HBG1和/或HBG2基因的表达来治疗。
在一个方面,本说明书公开了一种包含核酸构建体的试剂盒,该试剂盒包含(a)编码任一种本文所公开的融合蛋白的核酸序列;和(b)驱动(a)的序列的表达的异源启动子。在某些实施方式中,试剂盒还包含编码向导RNA骨架的表达构建体,其中该构建体包含被定为以允许将与靶序列相同或互补的核酸序列克隆到向导RNA骨架中的克隆位点。
在一个方面,本说明书公开了一种药物组合物,其包含任一种本文所公开的融合蛋白。
在一个方面,本说明书公开了一种药物组合物,其包含任一种本文所公开的复合物。
在一个方面,本说明书公开了一种药物组合物,其包含任一种本文所公开的核酸。
在一个方面,本说明书公开了一种药物组合物,其包含任一种本文所公开的载体。在某些实施方式中,药物组合物还包含可药用赋形剂。在某些实施方式中,药物组合物还包含脂质。在某些实施方式中,脂质是阳离子脂质。在某些实施方式中,药物组合物还包含聚合物。
在某些实施方式中,融合蛋白包含如下结构:NH2-[任何本文所公开的胞苷脱氨酶]-[Cas9结构域]-COOH,并且每个“-”包含任选的接头。在某些实施方式中,融合蛋白包含如下结构:NH2-[任何本文所公开的胞苷脱氨酶]-[Cas9结构域]-[UGI结构域]-COOH,并且每个“-”包含任选的接头。在某些实施方式中,融合蛋白包含如下结构:NH2-[任何本文所公开的胞苷脱氨酶]-[Cas9结构域]-[第一UGI结构域]-[第二UGI结构域]-COOH,并且每个“-”包含任选的接头。在某些实施方式中,融合蛋白包含如下结构:NH2-[任何本文所公开的胞苷脱氨酶]-[Cas9结构域]-[核定位序列]-COOH,并且每个“-”包含任选的接头。在某些实施方式中,融合蛋白包含如下结构:NH2-[第一核定位序列]-[任何本文所公开的胞苷脱氨酶]-[Cas9结构域]-[第二核定位序列]-COOH,并且每个“-”包含任选的接头。在某些实施方式中,融合蛋白包含如下结构:NH2-[第一核定位序列]-[任何本文所公开的胞苷脱氨酶]-[Cas9结构域]-[第一UGI结构域]-[第二UGI结构域]-[第二核定位序列]-COOH,并且每个“-”包含任选的接头。
在一个方面,本说明书公开了一种核酸,其编码任何本文所公开的融合蛋白。在某些实施方式中,核酸包含任何本文所公开的核酸。
应当理解,前述概念和下面讨论的其他概念可以以任何适当的组合来布置,因为本公开在此方面不受限制。此外,结合附图考虑以下各种非限制性实施例的详细描述,本公开的其他优点和新颖特征将变得显而易见。
附图说明
图1显示了Cas9基因组编辑和C至T碱基编辑的示意图。
图2显示了PACE的示意图。
图3显示了无碱基编辑相对于碱基编辑的示意图。
图4显示了T7RNAP表达水平。
图5显示了具有使用分裂内含肽的改性噬菌体骨架的T7RNAP的表达。
图6显示了APOBEC噬菌体生长在24小时内结束。
图7显示了低严格度回路上PACE中的繁殖。
图8显示了gIII重组体野生型相对于T7RNAP重组体的示意图。
图9显示了碱基编辑的示意图。
图10显示了用EdgX-RpoZ融合筛选。
图11显示了ClinVAR数据库致病性变异。
图12显示了Cas9基因组编辑和C至T碱基编辑的示意图。
图13显示了碱基编辑结果。
图14显示了Pam选择性的示意图。
图15显示了表达和活性的示意图。
图16显示了所提出的碱基进化方法的示意图。
图17显示了进化过程的示意图。
图18显示了体内连续定向进化的示意图。
图19显示了体内连续定向进化的示意图。
图20显示了噬菌体辅助连续进化的示意图。
图21显示了噬菌体辅助连续进化的示意图。
图22显示了用于碱基编辑中的PACE选择的示意图。
图23用于碱基编辑中的PACE选择的示意图。
图24用于碱基编辑中的PACE选择的示意图。
图25显示了T7 RNAP活性上的C-末端降解决定子标签切割的示意图。
图26显示了T7 RNAP的C-末端的蛋白质模型。
图27显示了无碱基编辑和碱基编辑中的C-末端降解决定子标签的示意图。
图28显示了T7RNAP激活和碱基编辑结果的示意图。
图29显示了组成型T7RNAP表达和碱基编辑结果的示意图。
图30显示了碱基编辑器噬菌体的示意图。
图31显示了使用Golden Gate克隆的碱基编辑器噬菌体装配的示意图。
图32显示了第一代SP。
图33显示了选择和优化的示意图。
图34显示了内含肽断裂碱基编辑器和gRNA-依赖型繁殖的示意图。
图35显示了PACE中的内含肽断裂碱基编辑器的示意图。
图36显示了活性编辑器的结果。
图37显示了在内含肽断裂的碱基编辑器中观察到的突变。
图38显示了使用重组开发的作弊器(cheaters)的示意图。
图39显示了使用重组开发的作弊器的示意图。
图40显示了PACE数据。
图41显示了用荧光酶读出检验的噬菌体碱基编辑活性。
图42显示了荧光酶时间进程检验。
图43显示了PACE 5前15个克隆的荧光酶时间进程检验。
图44显示了PACE 5前8个克隆的荧光酶时间进程检验。
图45显示了摘要和将来的方向。
图46显示了“清理”PACE输出的示意图。
图47显示了“1.5-杂化”选择的示意图。
图48显示了“1.5-杂化”选择的示意图。
图49显示了转录激活因子募集的示意图。蛋白质序列对应于SEQ ID NO:46。
图50显示了转录激活因子募集的示意图。
图51显示了显示了转录激活因子募集的示意图。
图52显示了对编辑的响应碱基。密钥中的蛋白质序列从上到下对应于SEQ IDNOs:99、100和99。
图53显示了对编辑的响应碱基。蛋白质序列对应于SEQ ID NO:100。
图54显示了对编辑的响应碱基。蛋白质序列对应于SEQ ID NO:99。
图55显示了对编辑的响应碱基。蛋白质序列对应于SEQ ID NO:99。
图56显示了对编辑的响应碱基。蛋白质序列对应于SEQ ID NO:14。
图57显示了具有高激活因子表达的最大相应。蛋白质序列对应于SEQ ID NO:14。
图58显示了PACE-进化的噬菌体回路优化。
图59显示了模板支架编辑(template stand editing)的示意图。
图60显示了模板支架编辑的示意图。
图61显示了模板支架编辑的示意图。
图62显示了模板支架编辑的示意图。
图63显示了模板支架编辑的示意图。
图64显示了通过模板链脱氨化观察到的编码突变的样品。序列从上到下对应于SEQ ID NOs:95-98。
图65显示了更强的T7RNAP表达的结果。
图66显示了E158K突变的示意图。
图67显示了E158K突变的示意图。
图68显示了C-末端T7溶菌酶-降解决定子融合。
图69显示了具有较小的编辑器变异的示意图和结果。
图70显示了质粒编码的编辑器的示意图和结果。
图71显示了噬菌体编码的编辑器的示意图。
图72显示了噬菌体基因组相对于质粒的表达比较。
图73显示了降低T7 RNAP-降解决定子表达,导致更高的开启的结果。
图74显示了噬菌体骨架突变有显著作用。
图75显示了进化的噬菌体更好地繁殖。
图76显示了无模板链编辑可能无法激活回路。
图77显示了5’AG减少了APOBEC而不是CDA编辑。
图78显示了PCE 12演变为5’-碱基无关的APOBEC。
图79显示了使用分离的BE构建体对早期PACE进化的脱氨酶的HEK细胞编辑,显示了对野生型BE的改进。
图80显示了使用分离的BE构建体对早期PACE进化的脱氨酶的HEK细胞编辑,显示了对野生型BE的改进。
图81显示了使用分离的BE构建体对早期PACE进化的脱氨酶的HEK细胞编辑,显示了对野生型BE的改进。
图82显示了使用分离的BE构建体对早期PACE进化的脱氨酶的HEK细胞编辑,显示了对野生型BE的改进。
图83显示了使用分离的BE构建体对早期PACE进化的脱氨酶的HEK细胞编辑,显示了对野生型BE的改进。
图84显示了细菌回路激活显示改进的GCC编辑。
图85显示了PACE进化的脱氨酶的试验细节。这些显示了HEK细胞编辑中的改进。
图86显示了NC靶。
图87显示了NC靶。
图88显示了EMX1数据,其显示了在低转染剂量(30ng)下,HEK细胞中进化型相对于野生型脱氨酶的活性提高。
图89显示了RNF2数据,其显示了在低转染剂量(30ng)下,HEK细胞中进化型相对于野生型脱氨酶的活性提高。
图90显示了HEK4数据,其显示了在低转染剂量(30ng)下,HEK细胞中进化型相对于野生型脱氨酶的活性提高。
图91显示了HEK2数据,其显示了在低转染剂量(30ng)下,HEK细胞中进化型相对于野生型脱氨基酶的活性提高。
图92显示了HEK3数据,其显示了在低转染剂量(30ng)下,HEK细胞中进化型相对于野生型脱氨酶的活性提高。
图93显示了对EMX1 GC-3的750ng转染HEK细胞编辑。HEK细胞编辑:750ng碱基编辑器,250ng向导RNA;脂质体转染;温育3天。除非另有说明,N=3;误差线=SD。箭头指示选择用于进一步研究的野生型和“evo”基因型。
图94显示了对于EMX1 CC-2的750ng转染HEK细胞编辑。HEK细胞编辑:750ng碱基编辑器,250ng向导RNA;脂质体转染;温育3天。除非另外指明,N=3;误差线=SD。箭头指示选择用于进一步研究的野生型和“evo”基因型。
图95显示了对EMX1 TC5的750ng转染HEK细胞编辑。HEK细胞编辑:750ng碱基编辑器,250ng向导RNA;脂质体转染;温育3天。除非另外指明,N=3;误差线=SD。箭头指示选择用于进一步研究的野生型和“evo”基因型。
图96显示了对于EMX1 CC6的750ng转染HEK细胞编辑。HEK细胞编辑:750ng碱基编辑器,250ng向导RNA;脂质体转染;温育3天。除非另外指明,N=3;误差线=SD。箭头指示选择用于进一步研究的野生型和“evo”基因型。
图97显示了对于EMX1 GC10的750ng转染HEK细胞编辑。HEK细胞编辑:750ng碱基编辑器,250ng向导RNA;脂质体转染;温育3天。除非另外指明,N=3;误差线=SD。箭头指示选择用于进一步研究的野生型和“evo”基因型。
图98显示了对于HEK2 AC-3的750ng转染HEK细胞编辑。HEK细胞编辑:750ng碱基编辑器,250ng向导RNA;脂质体转染;温育3天。除非另外指明,N=3;误差线=SD。箭头指示选择用于进一步研究的野生型和“evo”基因型。
图99显示了对于HEK2 AC4的750ng转染HEK细胞编辑。HEK细胞编辑:750ng碱基编辑器,250ng向导RNA;脂质体转染;温育3天。除非另外指明,N=3;误差线=SD。箭头指示选择用于进一步研究的野生型和“evo”基因型。
图100显示了对于HEK2 AC6的750ng转染HEK细胞编辑。HEK细胞编辑:750ng碱基编辑器,250ng向导RNA;脂质体转染;温育3天。除非另外指明,N=3;误差线=SD。箭头指示选择用于进一步研究的野生型和“evo”基因型。
图101显示了对于HEK2 GC11的750ng转染HEK细胞编辑。HEK细胞编辑:750ng碱基编辑器,250ng向导RNA;脂质体转染;温育3天。除非另外指明,N=3;误差线=SD。箭头指示选择用于进一步研究的野生型和“evo”基因型。
图102显示了对于HEK3 GC3的750ng转染HEK细胞编辑。HEK细胞编辑:750ng碱基编辑器,250ng向导RNA;脂质体转染;温育3天。除非另外指明,N=3;误差线=SD。箭头指示选择用于进一步研究的野生型和“evo”基因型。
图103显示了对于HEK3 CC4的750ng转染HEK细胞编辑。HEK细胞编辑:750ng碱基编辑器,250ng向导RNA;脂质体转染;温育3天。除非另外指明,N=3;误差线=SD。箭头指示选择用于进一步研究的野生型和“evo”基因型。
图104显示了对于HEK3 CC5的750ng转染HEK细胞编辑。HEK细胞编辑:750ng碱基编辑器,250ng向导RNA;脂质体转染;温育3天。除非另外指明,N=3;误差线=SD。箭头指示选择用于进一步研究的野生型和“evo”基因型。
图105显示了对于HEK3 AC9的750ng转染HEK细胞编辑。HEK细胞编辑:750ng碱基编辑器,250ng向导RNA;脂质体转染;温育3天。除非另外指明,N=3;误差线=SD。箭头指示选择用于进一步研究的野生型和“evo”基因型。
图106显示了对于HEK3 GC14的750ng转染HEK细胞编辑。HEK细胞编辑:750ng碱基编辑器,250ng向导RNA;脂质体转染;温育3天。除非另外指明,N=3;误差线=SD。箭头指示选择用于进一步研究的野生型和“evo”基因型。
图107显示了对于HEK3 AC16的750ng转染HEK细胞编辑。HEK细胞编辑:750ng碱基编辑器,250ng向导RNA;脂质体转染;温育3天。除非另外指明,N=3;误差线=SD。箭头指示选择用于进一步研究的野生型和“evo”基因型。
图108显示了对于HEK4 GC3的750ng转染HEK细胞编辑。HEK细胞编辑:750ng碱基编辑器,250ng向导RNA;脂质体转染;温育3天。除非另外指明,N=3;误差线=SD。箭头指示选择用于进一步研究的野生型和“evo”基因型。
图109显示了对于HEK4 AC5的750ng转染HEK细胞编辑。HEK细胞编辑:750ng碱基编辑器,250ng向导RNA;脂质体转染;温育3天。除非另外指明,N=3;误差线=SD。箭头指示选择用于进一步研究的野生型和“evo”基因型。
图110显示了对于HEK4 GC8的750ng转染HEK细胞编辑。HEK细胞编辑:750ng碱基编辑器,250ng向导RNA;脂质体转染;温育3天。除非另外指明,N=3;误差线=SD。箭头指示选择用于进一步研究的野生型和“evo”基因型。
图111显示了对于HEK4 GC11的750ng转染HEK细胞编辑。HEK细胞编辑:750ng碱基编辑器,250ng向导RNA;脂质体转染;温育3天。除非另外指明,N=3;误差线=SD。箭头指示选择用于进一步研究的野生型和“evo”基因型。
图112显示了对于RNF2 TC3的750ng转染HEK细胞编辑。HEK细胞编辑:750ng碱基编辑器,250ng向导RNA;脂质体转染;温育3天。除非另外指明,N=3;误差线=SD。箭头指示选择用于进一步研究的野生型和“evo”基因型。
图113显示了对于RNF2 TC6的750ng转染HEK细胞编辑。HEK细胞编辑:750ng碱基编辑器,250ng向导RNA;脂质体转染;温育3天。除非另外指明,N=3;误差线=SD。箭头指示选择用于进一步研究的野生型和“evo”基因型。
图114显示了对于RNF2 TC12的750ng转染HEK细胞编辑。HEK细胞编辑:750ng碱基编辑器,250ng向导RNA;脂质体转染;温育3天。除非另外指明,N=3;误差线=SD。箭头指示选择用于进一步研究的野生型和“evo”基因型。
图115显示了对于EMX1 GC-3的750ng转染HEK细胞编辑。HEK细胞编辑:750ng碱基编辑器,250ng向导RNA;脂质体转染;温育3天。除非另外指明,N=3;误差线=SD。箭头指示选择用于进一步研究的野生型和“evo”基因型。
图116显示了对于EMX1 CC-2的750ng转染HEK细胞编辑。HEK细胞编辑:750ng碱基编辑器,250ng向导RNA;脂质体转染;温育3天。除非另外指明,N=3;误差线=SD。箭头指示选择用于进一步研究的野生型和“evo”基因型。
图117显示了对于EMX1 TC5的750ng转染HEK细胞编辑。HEK细胞编辑:750ng碱基编辑器,250ng向导RNA;脂质体转染;温育3天。除非另外指明,N=3;误差线=SD。箭头指示选择用于进一步研究的野生型和“evo”基因型。
图118显示了对于EMX1 CC6的750ng转染HEK细胞编辑。HEK细胞编辑:750ng碱基编辑器,250ng向导RNA;脂质体转染;温育3天。除非另外指明,N=3;误差线=SD。箭头指示选择用于进一步研究的野生型和“evo”基因型。
图119显示了对于EMX1 GC10的750ng转染HEK细胞编辑。HEK细胞编辑:750ng碱基编辑器,250ng向导RNA;脂质体转染;温育3天。除非另外指明,N=3;误差线=SD。箭头指示选择用于进一步研究的野生型和“evo”基因型。
图120显示了对于HEK2 AC-3的750ng转染HEK细胞编辑。HEK细胞编辑:750ng碱基编辑器,250ng向导RNA;脂质体转染;温育3天。除非另外指明,N=3;误差线=SD。箭头指示选择用于进一步研究的野生型和“evo”基因型。
图121显示了对于HEK2 AC4的750ng转染HEK细胞编辑。HEK细胞编辑:750ng碱基编辑器,250ng向导RNA;脂质体转染;温育3天。除非另外指明,N=3;误差线=SD。箭头指示选择用于进一步研究的野生型和“evo”基因型。
图122显示了对于HEK2 AC6的750ng转染HEK细胞编辑。HEK细胞编辑:750ng碱基编辑器,250ng向导RNA;脂质体转染;温育3天。除非另外指明,N=3;误差线=SD。箭头指示选择用于进一步研究的野生型和“evo”基因型。
图123显示了对于HEK2 GC11的750ng转染HEK细胞编辑。HEK细胞编辑:750ng碱基编辑器,250ng向导RNA;脂质体转染;温育3天。除非另外指明,N=3;误差线=SD。箭头指示选择用于进一步研究的野生型和“evo”基因型。
图124显示了对于HEK3 GC3的750ng转染HEK细胞编辑。HEK细胞编辑:750ng碱基编辑器,250ng向导RNA;脂质体转染;温育3天。除非另外指明,N=3;误差线=SD。箭头指示选择用于进一步研究的野生型和“evo”基因型。
图125显示了对于HEK3 CC4的750ng转染HEK细胞编辑。HEK细胞编辑:750ng碱基编辑器,250ng向导RNA;脂质体转染;温育3天。除非另外指明,N=3;误差线=SD。箭头指示选择用于进一步研究的野生型和“evo”基因型。
图126显示了对于HEK3 CC5的750ng转染HEK细胞编辑。HEK细胞编辑:750ng碱基编辑器,250ng向导RNA;脂质体转染;温育3天。除非另外指明,N=3;误差线=SD。箭头指示选择用于进一步研究的野生型和“evo”基因型。
图127显示了对于HEK3 AC9的750ng转染HEK细胞编辑。HEK细胞编辑:750ng碱基编辑器,250ng向导RNA;脂质体转染;温育3天。除非另外指明,N=3;误差线=SD。箭头指示选择用于进一步研究的野生型和“evo”基因型。
图128显示了对于HEK3 GC14的750ng转染HEK细胞编辑。HEK细胞编辑:750ng碱基编辑器,250ng向导RNA;脂质体转染;温育3天。除非另外指明,N=3;误差线=SD。箭头指示选择用于进一步研究的野生型和“evo”基因型。
图129显示了对于HEK3 AC16的750ng转染HEK细胞编辑。HEK细胞编辑:750ng碱基编辑器,250ng向导RNA;脂质体转染;温育3天。除非另外指明,N=3;误差线=SD。箭头指示选择用于进一步研究的野生型和“evo”基因型。
图130显示了对于HEK4 GC3的750ng转染HEK细胞编辑。HEK细胞编辑:750ng碱基编辑器,250ng向导RNA;脂质体转染;温育3天。除非另外指明,N=3;误差线=SD。箭头指示选择用于进一步研究的野生型和“evo”基因型。
图131对于HEK4 AC5显示了的750ng转染HEK细胞编辑。HEK细胞编辑:750ng碱基编辑器,250ng向导RNA;脂质体转染;温育3天。除非另外指明,N=3;误差线=SD。箭头指示选择用于进一步研究的野生型和“evo”基因型。
图132显示了对于HEK4 GC8的750ng转染HEK细胞编辑。HEK细胞编辑:750ng碱基编辑器,250ng向导RNA;脂质体转染;温育3天。除非另外指明,N=3;误差线=SD。箭头指示选择用于进一步研究的野生型和“evo”基因型。
图133显示了对于HEK4 GC11的750ng转染HEK细胞编辑。HEK细胞编辑:750ng碱基编辑器,250ng向导RNA;脂质体转染;温育3天。除非另外指明,N=3;误差线=SD。箭头指示选择用于进一步研究的野生型和“evo”基因型。
图134显示了对于RNF2 TC3的750ng转染HEK细胞编辑。HEK细胞编辑:750ng碱基编辑器,250ng向导RNA;脂质体转染;温育3天。除非另外指明,N=3;误差线=SD。箭头指示选择用于进一步研究的野生型和“evo”基因型。
图135显示了对于RNF2 TC6的750ng转染HEK细胞编辑。HEK细胞编辑:750ng碱基编辑器,250ng向导RNA;脂质体转染;温育3天。除非另外指明,N=3;误差线=SD。箭头指示选择用于进一步研究的野生型和“evo”基因型。
图136显示了对于RNF2 TC12的750ng转染HEK细胞编辑。HEK细胞编辑:750ng碱基编辑器,250ng向导RNA;脂质体转染;温育3天。除非另外指明,N=3;误差线=SD。箭头指示选择用于进一步研究的野生型和“evo”基因型。
图137显示了扩展PACE选择以移动或加宽编辑窗口。N=6个独立的宿主细胞培养物用包含脱氨酶-内含肽融合的骨架同基因噬菌体感染。对于每个回路,感染后2-3小时之间的线性阶段中的回路激活速率(每OD600每分钟发光)被标准化为wt-APOBEC。误差线显示SEM。
图138显示了胚胎细胞中的选择的进化脱氨酶和构建体的组合。从上到下,序列对应于SEQ ID NOs:126-128。
图139显示了evo-脱氨酶允许在先前不能编辑的位点中的碱基-编辑;以及在进化后增加了以BE-CDA进行的编辑(8%至33%)。
图140显示了ApoE蛋白结构域结构ApoE4 R112 sgRNA和ApoE4->E3(R112->C112)编辑的示意图。在中心部分,序列从上到下对应于SEQ ID NO:129-131。
图141显示了通过核碱基修饰酶的单碱基改变的示意图。
图142:在PACE期间,关注活性与在其基因组中编码该活性的噬菌体的繁殖有关(1)。这种关联是通过大肠杆菌宿主细胞(2)编码的遗传回路完成的,该宿主细胞被连续泵入固定体积的容器中,并在此处被噬菌体(3)感染。激活该回路的噬菌体编码基因导致噬菌体基因III(4)的表达,使它们得以繁殖,而具有失活基因的噬菌体则不能表达。感染的宿主细胞和噬菌体不断流出容器(5),从而稀释了失活的基因。有活性的噬菌体基因组通过强人工诱变复制(6),然后作为感染性颗粒释放到培养基(7)中,以便它们可以感染新的宿主细胞。只有编码所选活性的噬菌体才能足够快地繁殖,以克服稀释率。
图143显示了编辑选择回路的碱基的激活取决于所有回路组成部分以及全长碱基编辑器蛋白和靶上的向导RNA。
图144显示了在选择回路上具有TCC和GCC靶的进化脱氨酶噬菌体的相对活性。
定义
除非背景中另有明确说明,如本文和权利要求中所使用的,单数形式的“一/一个/一种(a/an)”和“所述/该(the)”包括单数形式和复数形式。因此,例如,当提及“一”药剂时包含单个药剂和多个此类药剂。
辅助质粒
术语“辅助质粒”如本文所用是指包含在条件启动子控制下产生感染性病毒颗粒所需的基因的质粒。在基因连续进化的背景中,通常直接或间接地通过待进化基因的功能激活从辅助质粒的条件启动子的转录。因此,辅助质粒具有为给定病毒载体种群中的如下那些病毒载体传递竞争优势的功能:这些病毒载体携带的待进化基因的形式比待进化基因的其他形式能够激活条件启动子或能够更强地激活条件启动子。在一些实施方式中,仅有携带待进化基因的“激活”形式的病毒载体将能够诱导在宿主细胞中产生感染性病毒颗粒所需的基因的表达,并且,因此,允许病毒基因组在宿主细胞流中的包装和繁殖。另一方面,携带待进化基因的未激活形式的载体将不会诱导产生感染性病毒载体所需的基因的表达,并且,因此,将不会被包装到能感染新鲜宿主细胞的病毒颗粒中。
祖先序列重构(ASR)
祖先序列重构(ASR)是进化/系统发育背景下分析现代序列以使用ASR算法推算树的特定节点上的祖先序列的过程。ASR算法是本领域中已知的。
碱基编辑
碱基编辑是基因组编辑技术,其涉及将在靶基因组位置处将特定的核酸碱基转变为另一个。在某些方面,可实现这点而无需双链DNA断裂(DSB)。由于许多基因病由点突变引起,这项技术在人类健康和疾病的研究中具有重要的意义。
时至今日,其他基因组编辑技术,包括基于CRISPR的系统,均开始于在关注位置处引入DSB。随后,细胞DNA修复酶修复断裂,通常导致碱基在DSB位点处的随机插入或缺失(插入缺失)。然而,当希望在目标基因座处引入或纠正点突变而不是随机破坏整个基因时,这些基因组编辑技术是不适用的,因为纠正率很低(例如,通常0.1%至5%),而主要的基因组编辑产物是插入缺失。为增加基因纠正的效率同时不会引入随机的插入缺失,本发明人先前修饰了CRISPR/Cas9系统以将一个DNA碱基直接转变为另一个而不形成DSB。
碱基编辑器
术语“碱基编辑器(BEs)”或“核碱基编辑器(NBEs)”或如本文所用是指如本文所述的改进的Cas-融合蛋白。在一些实施方式中,融合蛋白包含与脱氨酶融合的无核酸酶活性的Cas9(dCas9),其仍然通过形成R-环路以向导RNA-编码的形式结合DNA,但不切割DNA骨架。例如,融合蛋白的dCas9可包含D10A和H840A突变(它们使Cas9能够仅切割双链核酸的一条链),如PCT/US2016/058344(公布为WO 2017/070632)中所述,该申请通过引用整体并入本文。在一些实施方式中,融合蛋白包含与脱氨酶融合的Cas9切口酶,该脱氨酶例如为将DNA碱基胞嘧啶转变为尿嘧啶的胞苷脱氨酶(rAPOBEC1)。一种这样的碱基编辑器在文献中被称为“BE1”。在一些实施方式中,融合蛋白包含与脱氨酶融合并且还与UGI结构域(尿嘧啶DNA糖基化酶抑制剂,其防止后续的U:G错配被修复回C:G碱基对)融合的无核酸酶活性的Cas9。一种这样的碱基编辑器在文献中被称为“BE2”。在其他实施方式中,为改善碱基编辑效率,可恢复BE的Cas9 HNH结构域中840位置处的催化性的His残基(得到如文献中所述的“BE3”),这仅在未编辑链上产生刻痕,模拟新合成的并导致所需的U:A产物。在其他实施方式中,dCas9是在PCT/US2017/045381(公布为WO 2018/027078)中公开或描述的任何dCas9,该申请通过引用整体并入本文。术语“核碱基编辑器(NBEs)”和“碱基编辑器(BEs)”可互换使用。术语“碱基编辑器”涵盖本申请提交时本领域中已知或描述的任何碱基编辑器,以及本文所述的进化的碱基编辑器。可通过本文所述方法和策略修饰的现有技术状态下已知的碱基编辑器包括,例如,BE1,BE2,BE3或BE4。
Cas9或Cas9部分或Cas9结构域
术语“Cas9”或“Cas9核酸酶”或“Cas9部分”或“Cas9结构域”是指CRISPR相关蛋白9或其功能片段,并且包容任何生物体中任何天然存在的Cas9,任何天然存在的Cas9等效物或其功能片段,任何Cas9同源物,来自任何生物体的直系同源物或旁系同源物,以及任何Cas9的天然存在或工程化的突变体或变体。更广泛地说,Cas9是“RNA可编程核酸酶”或“RNA向导的核酸酶”的类型,或更广泛地是“核酸可编程DNA结合蛋白(napDNAbp)”的类型。术语Cas9并不意味着特别限制,并且可被称为“Cas9或等效物”。示例性的Cas9蛋白在本文中和/或在本领域中已描述,并且通过引用并入本文。本公开不限于本发明的进化的碱基编辑器中采用的特定Cas9。
dCas9
如本文所用,术语“dCas9”是指无核酸酶活性的Cas9或核酸酶死亡的Cas9或其功能片段,并且包含来自任何生物体的任何天然存在的dCas9,任何天然存在的dCas9等效物或其功能片段,来自任何生物体的任何dCas9同系物、直接同源物或间接同源物,和以及天然存在的或工程化的任何dCas9突变体或变体。术语dCas9并非意味着具体限制,并且可被称为“dCas9或等效物”。示例性的dCas9蛋白质和制备dCas9蛋白质的方法在本文中进一步描述和/或在现有技术中描述并通过引用并入本文。
嵌合蛋白
术语“嵌合蛋白”是指其中第一蛋白部分和第二蛋白部分来源于不同物种的融合蛋白。
连续进化
术语“连续进化”如本文所用是指如下的进化过程,其中将一组核酸投入多轮:(a)复制,(b)突变,和(c)选择中以产生所需的进化产物,例如,编码具有所需活性的蛋白质的核酸,其中可在没有研究者交互的条件下进行多轮,并且其中(a)-(c)的过程可同时进行。通常,进化过程在体外进行,例如,使用培养基中的细胞作为宿主细胞。通常,本文所提供的连续进化过程依赖于如下系统:其中目的基因在核酸载体中提供,该核酸载体经历了在宿主细胞中复制并转染到另一个宿主细胞中的生命周期,其中生命周期的关键组分失活,并且该组分的再激活依赖于目的基因中的所需突变。
在一些实施方式中,将目的基因以与该目的基因的活性相关的方式在细胞之间转移。在一些实施方式中,转移载体是感染细胞的病毒,例如,细菌噬菌体或逆转录病毒载体。在一些实施方式中,病毒载体是感染细菌宿主细胞的噬菌体载体。在一些实施方式中,转移载体是感染人或小鼠细胞的逆转录病毒载体,例如,慢病毒载体或疱疹性口炎表达载体。在一些实施方式中,转移载体是从供体细菌细胞转移到受体细菌细胞的缀合质粒。
在一些实施方式中,包含目的基因的核酸载体是噬菌体、病毒载体或裸DNA(例如,迁移质粒)。在一些实施方式中,目的基因在细胞之间的转移经由裸DNA的感染、转染、转导、缀合或摄入来进行,细胞-至-细胞转移的效率(例如,转移率)取决于该目的基因所编码的产物的活性。例如,在一些实施方式中,核酸载体是带有目的基因的噬菌体,噬菌体转移效率(经由感染)取决于目的基因的活性,其中仅在存在目的基因的所需活性的情况下,才在宿主细胞中表达产生噬菌体颗粒所需的蛋白质(例如,M13噬菌体所需的pIII)。在另一个示例中,核酸载体是逆转录病毒载体,例如,带有目的基因的慢病毒或疱疹性口炎表达载体,和病毒在细胞之间转移的效率取决于目的基因的活性,其中仅在存在目的基因的所需活性的情况下,才在宿主细胞中表达产生病毒颗粒所需的蛋白质(例如,包膜蛋白,诸如VSV-g)。在另一个示例中,核酸载体是包含目的基因的DNA载体,例如,以可迁移质粒DNA的形式,即经由缀合在细菌宿主细胞之间转移,缀合-介导的在细胞之间转移的效率取决于目的基因的活性,其中仅在存在目的基因的所需活性的情况下,才在宿主细胞中表达产生缀合-介导的转移(例如,traA或traQ)所需的蛋白质。宿主细胞包含缺乏那些基因中的一个或两个的F质粒。
例如,一些实施方式提供了一种连续进化系统,其中一组包含目的待进化基因的病毒载体在宿主细胞流中复制,例如,通过泻湖的流,其中病毒载体缺乏编码对于产生感染性病毒颗粒必不可少的蛋白质的基因,并且其中该基因被包含在处于条件启动子控制下的宿主细胞中,该条件启动子可被目的基因或其突变形式编码的基因产物激活。在一些实施方式中,条件启动子的活性取决于目的基因所编码的基因产物的所需功能。其中目的基因尚未获得赋予所需功能的突变的病毒载体将不会激活条件启动子或仅有实现最小激活,而赋予所需突变的目的基因中的任何突变将导致导致条件启动子的激活。由于条件启动子控制病毒生命周期的必需蛋白,对于已经获得有利突变的那些载体而言,该启动子的激活直接对应于病毒传播和复制的优势。
胞苷脱氨酶
如本文所用,由CDA基因编码的“胞苷脱氨酶”是催化从胞苷(即,当连接至核糖环时的碱基胞嘧啶)脱除氨基至尿苷(C至U)和从脱氧胞苷脱除氨基为脱氧尿苷(C至U)的酶。胞苷脱氨酶的非限制性示例是APOBEC1(“载脂蛋白B mRNA编辑酶,催化多肽1”)。另一个示例是AID(“激活诱导的胞苷脱氨酶”)。在标准的Watson-Crick氢键配对下,胞嘧啶碱基氢键合至鸟嘌呤碱基。当胞苷转化为尿苷(或脱氧胞苷转化为脱氧尿苷)时,尿苷(或尿苷的尿嘧啶碱基)与碱基腺嘌呤进行氢键配对。因此,胞苷脱氨酶将“C”转化为尿苷(“U”)将在细胞修复和/或复制过程中导致插入“A”而不是“G”。由于腺嘌呤“A”与胸腺嘧啶“T”配对,胞苷脱氨酶与DNA复制协同作用导致双链DNA分子中C·G配对转变为T·A配对。
CRISPR
CRISPR是细菌和古细菌中的DNA序列家族(即CRISPR簇),其代表先前入侵过原核生物的病毒片段。该DNA片段被原核生物细胞用来检测和破坏来自类似病毒后续攻击的DNA,并与一系列CRISPR相关蛋白(包括Cas9及其同源物)和CRISPR相关RNA一起有效地组成原核生物免疫防御系统。实际上,CRISPR簇被转录并加工成CRISPR RNA(crRNA)。在某些类型的CRISPR系统(例如II型CRISPR系统)中,正确处理pre-crRNA需要转码的小RNA(tracrRNA)、内源性核糖核酸酶3(rnc)和Cas9蛋白。tracrRNA可作为核糖核酸酶3辅助pre-crRNA加工的向导。随后,Cas9/crRNA/tracrRNA对与RNA互补的线性或环状dsDNA靶进行核酸内切切割。具体地,不与crRNA互补的靶链首先进行核酸内切,然后进行3'-5'的核酸外切。实际上,DNA结合和切割通常需要蛋白质和两种RNA。但是,可以对单个向导RNA物种(“sgRNA”或简称为“gNRA”)进行工程化改造,以便将crRNA和tracrRNA的各个方面都整合到单个RNA物种–向导RNA中。参见例如Jinek M.,Chylinski K.,Fonfara I.,Hauer M.,Doudna J.A.,Charpentier E.Science 337:816-821(2012),,其全部内容通过引用并入本文。Cas9识别CRISPR重复序列中的短基序(PAM或原间隔子相邻基序),以帮助区分自我与非自我。CRISPR生物学以及Cas9核酸酶的序列和结构是本领域技术人员众所周知的(参见,例如,“Complete genome sequence of an M1 strain of Streptococcus pyogenes.”Ferretti et al.,J.J.,McShan W.M.,Ajdic D.J.,Savic D.J.,Savic G.,Lyon K.,Primeaux C.,Sezate S.,Suvorov A.N.,Kenton S.,Lai H.S.,Lin S.P.,Qian Y.,JiaH.G.,Najar F.Z.,Ren Q.,Zhu H.,Song L.,White J.,Yuan X.,Clifton S.W.,Roe B.A.,McLaughlin R.E.,Proc.Natl.Acad.Sci.U.S.A.98:4658-4663(2001);“CRISPR RNAmaturation by trans-encoded small RNA and host factor RNase III.”DeltchevaE.,Chylinski K.,Sharma C.M.,Gonzales K.,Chao Y.,Pirzada Z.A.,Eckert M.R.,Vogel J.,Charpentier E.,Nature471:602-607(2011);and“A programmable dual-RNA-guided DNA endonuclease in adaptive bacterica immunity.”Jinek M.,ChylinskiK.,Fonfara I.,Hauer M.,Doudna J.A.,Charpentier E.Science 337:816-821(2012),通过引用将上述文献的全部内容并入本文)。已经在各种物种中描述了Cas9直接同源物,包括但不限于化脓性链球菌和嗜热链球菌。基于该公开,其他合适的Cas9核酸酶和序列对本领域技术人员将是显而易见的,并且此类Cas9核酸酶和序列包括来自在以下文献中公开的生物和基因座的Cas9序列:Chylinski,Rhun,and Charpentier,“The tracrRNA and Cas9families of type II CRISPR-Cas immunity systems”(2013)RNA Biology 10:5,726-737;其全部内容通过引用并入本文。
脱氨酶或脱氨酶结构域
如本文所用,术语“脱氨酶”或“脱氨酶结构域”或“脱氨酶部分”是指催化脱氨化反应的蛋白质或酶。在一些实施方式中,脱氨酶是催化腺嘌呤或腺苷的水解脱氨化的腺苷脱氨酶(例如,使DNA中的腺苷脱氨化的工程化腺苷脱氨酶)。在一些实施方式中,脱氨酶或脱氨酶结构域是分别催化胞苷或脱氧胞苷水解脱氨化为尿苷或脱氧尿苷的胞苷脱氨酶。在一些实施方式中,脱氨酶或脱氨酶结构域是催化胞嘧啶水解脱氨化为尿嘧啶的胞苷脱氨酶结构域。在一些实施方式中,脱氨酶或脱氨酶结构域是来自生物体的天然存在的脱氨酶,该生物体诸如人、黑猩猩、大猩猩、猴子、牛、犬、大鼠或小鼠。在一些实施方式中,脱氨酶或脱氨酶结构域是在自然界中不存在的来自生物体的天然存在的脱氨酶的变体。例如,在一些实施方式中,脱氨酶或脱氨酶结构域与来自生物体的天然存在的脱氨酶具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%的同一性。术语脱氨酶还包含任何基因工程化的脱氨酶,其可包含导致变体脱氨酶的基因修饰(例如,一个或多个突变),所述变体脱氨酶相对于野生型副本脱氨酶具有包含一个或多个变化的氨基酸序列。在本文中给出了脱氨酶的示例,该术语并非表示限制性的。
有效量
术语“有效量”如本文所用是指足以引起所需的生物反应的生物活性剂的量。例如,在一些实施方式中,有效量的碱基编辑器可以指足以编辑靶位点核苷酸序列(例如,基因组)的量的碱基编辑器。在一些实施方式中,例如本文所提供的有效量的碱基编辑器,例如,包含无核酸酶活性的Cas9结构域和核酸编辑结构域(例如,脱氨酶结构域)的融合蛋白的有效量的碱基编辑器可以指足以诱导该融合蛋白特异性结合和编辑的靶位点的编辑的融合蛋白的量。如技术人员将会意识到的,有效量的药剂,例如,融合蛋白、核酸酶、脱氨酶、杂化蛋白、蛋白质二聚体、蛋白质(或蛋白质二聚体)与多核苷酸的复合物或多核苷酸可根据多种因素而变,例如,根据所需的生物反应,例如,根据要被编辑的具体等位基因、基因组或靶位点,根据靶细胞或组织,和根据要被使用的药剂。
进化的碱基编辑器
术语“进化的碱基编辑器”或“进化的碱基编辑器变体”是指因通过连续进化方法(例如,PACE)使参考或起点碱基编辑器(或其组分或结构域)突变而形成的碱基编辑器,其中该进化的碱基编辑器相对于参考或起点碱基编辑器的氨基酸序列具有被引入到其氨基酸序列中的一个或多个氨基酸变动。氨基酸序列变动可包括在参考碱基编辑器的氨基酸序列内的一个或多个突变残基,例如,作为编码该碱基编辑器的核苷酸序列中变化的结果,该一个或多个突变碱基导致处于编码序列中任何特定位置处的密码子发生变化,缺失一个或多个氨基酸(例如,截短蛋白),插入一个或多个氨基酸,或前述的任何组合。在一些实施方式中,一种进化的碱基编辑器与参考碱基编辑器具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%的同一性。进化的碱基编辑器可包括在碱基编辑器的一个或多个组分或结构域中的变体(例如,被引入到Cas9结构域、脱氨酶结构域或UGI结构域中的变体或被引入到这些结构域的组合中的变体)。
术语“流(flow)”,如本文中在宿主细胞的背景下所用,是指宿主细胞物流,其中被引入到宿主细胞群(例如,泻湖(lagoon)中的宿主细胞群)中的新鲜的宿主细胞在细胞群中保留有限时间,随后从宿主细胞群中移除。简单来说,宿主细胞流可为通过管路或通道的,例如,以受控的速率。在其他实施方式中,宿主细胞流被向导通过泻湖,该泻湖容纳了一定体积的细胞培养基,并且包含流入流和流出流。新鲜宿主细胞的引入可为连续或间歇性的,并且移除可为被动的,例如,通过溢流,或者可为主动的,例如,通过主动虹吸或泵送。移除还可为随机的,例如,如果提供了宿主细胞的搅拌悬浮培养物,则被移除的液体培养基将包含新鲜引入的宿主细胞以及已成为宿主细胞群成员一段时间的细胞。甚至,理论上,细胞可无限期地逃避从泻湖中移除,宿主细胞平均仅在泻湖中保留有限时间,这主要由通过泻湖的培养基(以及悬浮细胞)的流速决定。
由于病毒载体在宿主细胞流复制,其中提供新鲜的、未感染的宿主细胞,同时移除感染细胞,因此可发生多个连贯的病毒生命周期而不会有调查者感染,这允许在单个进化试验中积累多个有利突变。
目的基因
术语“目的基因”如本文所用是指包含编码目的基因产物的核苷酸序列的核酸构建体,例如,要在如本文所述的连续进化过程中进化的基因产物(例如,碱基编辑器或其组分/结构域)。该术语包括因根据本文所提供过的方法的连续进化过程所致的目的基因的任何变动。例如,在一些实施方式中,目的基因是包含被克隆到病毒载体(例如,噬菌体基因组)中的编码待进化蛋白质的核苷酸序列的核酸构建体,因此编码序列表达处于病毒基因组中一个或多个启动子的控制下。在其他实施方式中,目的基因是包含编码待进化蛋白质的核苷酸序列和可操作地与编码序列相连的启动子的核酸构建体。当被克隆到病毒载体(例如,噬菌体基因组)中时,此类目的基因的编码序列的表达处于异源启动子控制下,并且,在一些实施方式中,还可受被包含在病毒基因组中的一个或多个启动子影响。
目的基因的功能
术语“目的基因的功能”可与术语“目的基因的活性”互换使用,其是指通过目的基因编码的基因产物(例如核酸或蛋白质)的活性或功能。例如,目的基因的功能可为酶活性(例如,导致产生反应产物的酶活性、磷酰化活性、磷酸酶活性等),激活转录的能力(例如,靶向特定启动子序列的转录激活活性),成键活性,(例如,导致形成共价键的酶活性)或结合活性(例如,蛋白质、DNA或RNA结合活性)。
融合蛋白
术语“融合蛋白”如本文所用是指包含来自至少两种不同蛋白质的蛋白质结构域的杂化多肽。一种蛋白质可位于融合蛋白的氨基-末端(N-末端)部分或羧基-末端(C-末端)蛋白处,因此分别形成“氨基-末端融合蛋白”或“羧基-末端融合蛋白”。蛋白质可包含不同结构域,例如,核酸结合结构域(例如,知道蛋白质结合到靶位点的Cas9的gRNA结合结构域)以及编辑蛋白质的核酸的核酸切割结构域或催化结构域。本文提供的任何蛋白质可通过本领域已知的任何方法产生。例如,本文提供的蛋白质可经由重组蛋白质表达和纯化来产生,这尤其适合于包含肽接头的融合蛋白。用于重组蛋白质表达和纯化的方法是公知的,并且包括以下中所述的那些:Green and Sambrook,Molecular Cloning:A Laboratory Manual(4th ed.,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.(2012)),其全部内容通过引用并入本文。
辅助噬菌体
如本文所用,术语“辅助噬菌体”可与术语“辅助噬菌粒”和“辅助质粒”互换使用,其是指包含噬菌体生命周期所需的噬菌体基因或者多个此类基因但缺乏包装到噬菌体颗粒中的基因组所需的结构元件的核酸构建体。例如,辅助噬菌体可提供一种野生型的缺乏噬菌体复制起源的噬菌体基因组。在一些实施方式中,提供了包含产生噬菌体颗粒所需的基因但缺乏产生感染性颗粒所需的基因(例如全长pIII基因)的辅助噬菌体。在一些实施方式中,辅助噬菌体仅提供了产生噬菌体颗粒所需的一些而非全部基因。辅助噬菌体可用于使缺少噬菌体颗粒生成所需基因的修饰噬菌体完成噬菌体在宿主细胞中的生命周期。通常,辅助噬菌体将包含噬菌体基因组中缺少的产生噬菌体颗粒所需的基因,从而补充了噬菌体基因组。在连续进化的背景下,辅助噬菌体通常补充选择噬菌体,但是两者都缺乏产生感染性噬菌体颗粒所需的噬菌体基因。
宿主细胞
如本文所用,术语“宿主细胞”是指可以作为宿主、复制和转运可用于本文提供的连续进化过程中的噬菌体载体的细胞。在其中载体是病毒载体的实施方式中,合适的宿主细胞是可以被病毒载体感染,可以复制,并且可以将其包装到可以感染新鲜宿主细胞的病毒颗粒中的细胞。如果细胞支持病毒载体基因的表达,病毒基因组的复制,和/或病毒颗粒的产生,则它可以作为病毒载体的宿主。确定细胞是否是给定病毒载体的合适宿主细胞的一个标准是确定该细胞是否可以支持该病毒载体所衍生的野生型病毒基因组的生命周期。例如,如果病毒载体是如本文所述的一些实施方式中所提供的修饰的M13噬菌体基因组,则合适的宿主细胞将是能够支持野生型M13噬菌体生命周期的任何细胞。在连续进化过程中有用的用于病毒载体的合适宿主细胞是本领域技术人员众所周知的,并且本公开不限于此方面。在一些实施方式中,病毒载体是噬菌体并且宿主细胞是细菌细胞。在一些实施方式中,宿主细胞是大肠杆菌细胞。合适的大肠杆菌宿主菌株对本领域技术人员将是显而易见的,并且包括但不限于New England Biolabs(NEB)的Turbo,Top10F’,DH12S,ER2738,ER2267和XL1-Blue MRF’。这些菌株名称是本领域公认的,并且已经很好地表征了这些菌株的基因型。应当理解,上述菌株仅是示例性的,并且本发明在此方面不做限制。在宿主细胞的上下文中,术语“新鲜”与本文中的“未感染的”或“无感染的”可互换使用,其是指宿主细胞没有被包含本文提供的连续进化过程中所用的包含目的基因的病毒载体所感染的宿主细胞。然而,新鲜的宿主细胞可能已被与待进化载体无关的病毒载体或相同或相似类型但不携带目的基因的载体感染。
在一些实施方式中,宿主细胞是原核生物细胞,例如,细菌细胞。在一些实施方式中,宿主细胞是大肠杆菌细胞。在一些实施方式中,宿主细胞是真核生物细胞,例如,酵母细胞、昆虫细胞或哺乳动物细胞。当然,宿主细胞的类型将取决于所采用的病毒载体,和合适的宿主细胞/病毒载体组合对于本领域技术人员来说是容易可知的。
在一些PACE实施方式中,例如,在采用M13选择噬菌体的实施方式中,宿主细胞是表达Fertility因子(通常也称为F因子、性别因子或F-质粒)的大肠杆菌细胞。F-因子是允许细菌产生结合所需的性菌毛的细菌DNA序列,并且对用特定噬菌体(例如用M13噬菌体)感染大肠杆菌细胞来说是必不可少的。例如,在一些实施方式中,用于M13-PACE的宿主细胞具有基因型F′proA+B+Δ(lacIZY)zzf::Tn10(TetR)/endA1 recA1 galE15 galK16 nupG rpsLΔlacIZYA araD139 Δ(ara,leu)7697 mcrA Δ(mrr-hsdRMS-mcrBC)proBA::pir116λ-
感染性病毒颗粒
如本文所用,术语“感染性病毒颗粒”是指能够将其包含的病毒基因组转运到合适的宿主细胞中的病毒颗粒。并非所有病毒颗粒都能将病毒基因组转运至合适的宿主细胞。无法完成此操作的粒子称为非感染性病毒粒子。在一些实施方式中,病毒颗粒包含多种不同的外壳蛋白,其中一种或一些外壳蛋白可以被省略而不会损害病毒颗粒的结构。在一些实施方式中,提供了一种病毒颗粒,其中至少一种外壳蛋白在不丧失感染性的情况下不能被省略。如果病毒颗粒缺乏赋予感染性的蛋白质,则该病毒颗粒无感染性。例如,包含包装在噬菌体蛋白(例如pVIII)外壳中的噬菌体基因组但缺少pIII(蛋白III)的M13噬菌体颗粒是非感染性M13噬菌体颗粒,因为pIII对于M13噬菌体颗粒的感染性是至关重要的。
碱基修复抑制剂
术语“碱基修复抑制剂”或“IBR”是指能够抑制核酸修复酶(例如碱基删除修复酶)的活性的蛋白质。在一些实施方式中,IBR是肌苷碱基删除修复的抑制剂。碱基修复的示例性抑制剂包括APE1、Endo III、Endo IV、Endo V、Endo VIII、Fpg、hOGG1、hNEIL1、T7 EndoI、T4PDG、UDG、hSMUG1和hAAG的抑制剂。在一些实施方式中,IBR是Endo V或hAAG的抑制剂。在一些实施方式中,IBR是催化失活的EndoV或催化失活的hAAG。
内含肽
如本文所用,术语“内含肽”是指在来自生命的所有结构域的生物体中发现的自加工多肽结构域。内含肽(介入蛋白)会进行独特的自动加工事件,称为蛋白剪接,其中,内含肽通过切割两个肽键而将其自身从较大的前体多肽中切除,并且,在该过程中,通过形成新的肽键将侧翼的外显肽(外部蛋白)序列连接起来。这种重排发生在翻译后(或可能是共翻译),因为发现内含蛋白基因嵌入其他蛋白质编码基因的框架内。此外,内含肽介导的蛋白剪接是自发的。它不需要外部因素或能量来源,仅需要折叠内含肽结构域。此过程也称为顺式蛋白质剪接,与使用“分裂内含肽”进行反式蛋白质剪接的自然过程相反。内含肽是自剪接RNA内含肽的蛋白质等效物(参见et al.,Nucleic Acids Res.22:1125-1127(1994)),其催化自身从前体蛋白中切除,并伴随着侧翼蛋白序列(称为外显肽)的融合(在Perler etal.,Curr.Opin.Chem.Biol.1:292-299(1997);Perler,F.B.细胞92(1):1-4(1998);Xu etal.,EMBO J.15(19):5146-5153(1996)中综述)。
泻湖、细胞恒容器和恒浊器
如本文所用,术语“泻湖”是指通过其向导宿主细胞流的容器。当用于本文提供的连续进化过程时,泻湖通常容纳宿主细胞群和在宿主细胞群内复制的病毒载体群,其中该泻湖包括通过其将宿主细胞从泻湖中移出的流出物以及将新鲜的宿主细胞引入泻湖从而补充了宿主细胞数量的流入物。在一些实施方式中,调节通过泻湖的细胞流以在泻湖内产生基本上恒定数目的宿主细胞。在一些实施方式中,调节细胞通过泻湖的流量以在泻湖内产生基本上恒定数量的新鲜宿主细胞。
如本文所用,术语“细胞恒容器(cellstat)”是指包含宿主细胞的培养容器,其中细胞的数量随时间基本恒定。
如本文所用,术语“恒浊器(turbidostat)”是指包含处于悬浮培养物中的宿主细胞的培养容器,其中该培养基的浊度随时间基本上是恒定的。在一些实施方式中,例如细菌细胞的悬浮培养物的浊度是培养基中细胞密度的量度。在一些实施方式中,恒浊器包括新鲜培养基的流入流和流出流以及基于该恒浊器中的悬浮培养物的浊度来调节进入和/或离开该恒浊器的流的控制器。
接头
如本文所用,术语“接头”是指连接两个分子或部分(例如核酸酶的结合结构域和切割结构域)的化学基团或分子。在一些实施方式中,接头将RNA可编程核酸酶的gRNA结合结构域与重组酶的催化结构域连接。在一些实施方式中,接头接合dCas9和碱基编辑器部分(例如胞苷或腺苷脱氨酶)。通常,接头位于两个基团、分子或其他部分之间或两侧,并通过共价键连接至每个基团,从而连接两者。在一些实施方式中,接头是氨基酸或多个氨基酸(例如,肽或蛋白质)。在一些实施方式中,接头是有机分子、基团、聚合物或化学部分。在一些实施方式中,接头的长度为5-100个氨基酸,例如5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、30-35、35-40、40-45、45-50、50-60、60-70、70-80、80-90、90-100、100-150或150-200个氨基酸。也可以考虑更长或更短的接头。
诱变剂
如本文所用,术语“诱变剂”是指在给定的生物系统如宿主细胞中诱导突变或增加突变率至高于该系统中自然发生的突变水平的试剂。在连续进化过程中,诱变剂可能是缺乏校对能力的DNA聚合酶。
诱变质粒
如本文所用,术语“诱变质粒”是指包含编码充当诱变剂的基因产物的基因的质粒。在一些实施方式中,该基因编码缺乏校对能力的DNA聚合酶。在一些实施方式中,该基因是参与细菌SOS应激反应的基因,例如UmuC、UmuD'或RecA基因。在一些实施方式中,该基因是GATC甲基化酶基因,例如,脱氧腺苷甲基化酶(dam甲基化酶)基因。在一些实施方式中,该基因参与半甲基化GATC序列的结合,例如seqA基因。在一些实施方式中,该基因与诱变核碱基输出(例如emrR)的抑制有关。诱变质粒(也称为诱变构建体)在例如于2016年4月16日提交的国际专利申请PCT/US2016/027795(于2016年10月20日公开为WO2016/168631)描述,该文献的全部内容通过引用在此并入。
突变
如本文所用,术语“突变”是指序列(如核酸或氨基酸序列)中的残基被另一残基取代,或者序列中的一个或多个残基的缺失或插入。在本文中通常通过鉴定原始残基,随后在序列中定位该残基,并鉴定新取代的残基来描述。本文提供的用于进行氨基酸取代(突变)的各种方法是本领域众所周知的,并且例如Green and Sambrook,Molecular Cloning:ALaboratory Manual(4th ed.,Cold Spring Harbor Laboratory Press,Cold SpringHarbor,N.Y.(2012))提供。突变可以包括多种类别,例如单碱基多态性、微复制区、插入缺失和逆转,其并不意味着以任何方式进行限制。突变可包括“功能丧失型”突变,这是降低或消除蛋白质活性的突变的正常结果。大多数功能丧失型突变都是隐性的,因为在杂合子中,第二个染色体拷贝携带的是编码功能完整的蛋白质的基因的未突变形式,该蛋白质的存在补偿了突变的影响。当功能丧失型突变为显性时存在一些例外,一个例子是单倍体不足,其中生物体不能耐受因杂合子所致的蛋白质活性的约50%降低。这是对人类几种基因病的解释,包括马凡氏综合征;(Marfan syndrome),该疾病是由结缔组织蛋白(原纤维蛋白)基因突变导致的。突变还包含“功能获得型”突变,这是一种赋予蛋白质或细胞异常活性的功能,该异常活性在正常情况下不存在。许多功能获得型突变都在调节序列中而不是在编码区中,因此可能产生许多后果。例如,突变可能导致一个或多个基因在错误的组织中表达,这些组织获得了它们通常缺乏的功能。可选择地,该突变可以导致参与细胞周期控制的一个或多个基因的过表达,从而导致不受控制的细胞分裂并因此导致癌症。由于其性质,功能获得型突变通常占主导地位。
非天然存在或工程化
术语“非天然存在”或“工程化”可互换使用,表示人为介入。当提及核酸分子或多肽(例如,Cas9或脱酰胺酶)时,该术语是指该核酸分子或多肽至少基本上不含至少一种在自然界中与其缔合和/或在自然界中发现的其他组分(例如,在自然界中未发现的氨基酸序列)。
核酸/核酸分子
如本文所用,术语“核酸”是指核苷酸聚合物。该聚合物可包括天然核苷(即腺苷、胸苷、鸟苷、胞苷、尿苷、脱氧腺苷、脱氧胸苷、脱氧鸟苷和脱氧胞苷)、核苷类似物(例如2-氨基腺苷、2-硫代胸苷、肌苷、吡咯并嘧啶、甲基腺苷、5-甲基胞苷、C5-溴尿苷、C5-氟尿苷、C5-碘尿苷、C5-丙炔尿苷、C5-丙炔基胞嘧啶、C5-甲基胞嘧啶、7-脱氮杂腺苷、7-脱氮鸟苷、8-氧代腺苷、8-氧代鸟苷、O(6)-甲基鸟嘌呤、4-乙酰胞苷、5-(羧基羟甲基)尿苷、二氢尿苷、甲基伪尿苷、1-甲基腺苷、1-甲基鸟苷、N6-甲基腺苷和2-硫胞苷)、化学修饰碱基、生物修饰碱基(例如甲基化碱基)、插入碱基、修饰糖(例如2'-氟核糖、核糖、2'-脱氧核糖、2'-O-甲基胞苷、阿拉伯糖和己糖)或修饰的磷酸基团(例如硫代磷酸酯和5'N亚磷酰胺键)。
核酸可编程R/DNA结合蛋白(napR/DNAbp)
术语“核酸可编程D/RNA结合蛋白(napR/DNAbp)”是指可以与一个或多个核酸分子缔合(例如,形成复合物)的任何蛋白质(即,可以广泛地称为作为“napR/DNAbp编码核酸分子”,例如在Cas系统的情况下包括向导RNA),该向导RNA向导或以其他方式编码蛋白质以使其定位于特定的靶核苷酸序列(例如,基因组的基因座),该特定的靶核苷酸序列与和该蛋白质相关的一个或多个核酸分子(或其一部分或区域)互补,从而使蛋白质与特定靶位点的核苷酸序列结合。此术语napR/DNAbp涵盖CRISPR Cas 9蛋白,以及Cas9等同物、同源物、直向同源物或旁系同源物,无论是天然存在的还是非天然存在的(例如,工程改造的或重组的),并且可以包括来自任何类型的CRISPR系统(例如II型,V型,VI型),包括Cpf1(V型CRISPR-Cas系统),C2c1(V型CRISPR-Cas系统),C2c2(VI型CRISPR-Cas系统)和C2c3(V型CRISPR-Cas系统)。在Makarova et al.,“C2c2 is a single-component programmableRNA-guided RNA-targeting CRISPR effector,”Science 2016;353(6299)还描述了其他的Cas-等同物,其内容通过引用并入本文。然而,可以与本发明结合使用的核酸可编程DNA结合蛋白(napDNAbp)不限于CRISPR-Cas系统。本发明包括任何这样的可编程蛋白质,例如得自纳特氏杆菌(Natronobacterium gregoryi(NgAgo))的Argonaute蛋白质,其也可以用于DNA向导的基因组编辑。NgAgo-向导的DNA系统不需要PAM序列或向导RNA分子,这意味着基因组编辑可以简单地通过表达NgAgo通用蛋白并在任何基因组序列上引入合成寡核苷酸来进行。参见See Gao F,Shen XZ,Jiang F,Wu Y,Han C.DNA-guided genome editingusing the Natronobacterium gregoryi Argonaute.Nat Biotechnol 2016;34(7):768-73,其通过引用并入本文。
napR/DNAbp-编码的核酸分子或向导序列
术语“napR/DNAbp编码的核酸分子”或等同的“向导序列”是指与一个或多个与napR/DNAbp蛋白缔合或以其他方式向导或编码该蛋白以定位于特定靶核苷酸序列(例如,基因组的基因座),该特定靶核苷酸序列与和该蛋白质相关的一个或多个核酸分子(或其一部分或区域)互补,从而使napR/DNAbp蛋白质在特定位点处结合核苷酸序列。非限制性示例是CRISPR-Cas基因组编辑系统的Cas蛋白的向导RNA。
核定位信号(NLS)
核定位信号或序列(NLS)是标签、指定或以其他方式标记通过核转运输入到细胞核中的蛋白质的氨基酸序列。通常,该信号由暴露于蛋白质表面的一个或多个带正电荷的赖氨酸或精氨酸的短序列组成。不同的核定位蛋白可能共享相同的NLS。NLS具有与核输出信号(NES)相反的功能,后者将蛋白质靶向核外,因此单个核定位信号可以将与之相关的实体向导到细胞核。这样的序列可以具有任何大小和组成,例如多于25、25、15、12、10、8、7、6、5或4个氨基酸,但是优选地将包含已知的至少4至8个已知用作核定位信号(NLS)的氨基酸序列。
核碱基修饰部分或核酸效应子结构域
如本文所用,术语“核碱基修饰部分”或等效地为“核酸效应子结构域”,包括能够修饰DNA或RNA分子的任何蛋白质、酶或多肽(或其功能片段)。核碱基修饰部分可以是天然存在的,或可以是重组的。例如,核碱基修饰部分可包括一种或多种DNA修复酶,例如,涉及碱基删除修复(BER)、核苷酸删除修复(NER)、同源性依赖重组修复(HR)、非-同源末端连接修复(NHEJ)、微同源末端连接修复(MMEJ)、错配修复(MMR)、直接逆转修复或其他已知的DNA修复途径的酶或蛋白质。核碱基修饰部分可具有一种或多种类型的酶活性,包括但不限于核酸内切酶活性、聚合酶活性、连接酶活性、复制活性、校对活性。核碱基修饰部分还可以包括DNA或RNA修饰酶和/或诱变酶,例如DNA甲基化酶和脱氨酶(即,脱氨酶,包括胞嘧啶脱氨酶和腺苷脱氨酶,以上均已定义),这些脱氨酶使核碱基脱氨,在一些情况中通过正常细胞修复和复制过程导致诱变纠正。如本文所用,“核酸效应子结构域”(例如,DNA效应子结构域或RNA效应子结构域)也可以指能够对核酸(例如DNA或RNA)进行一个或多个修饰(例如,胞苷残基的脱氨基)的蛋白质或酶。示例性的核酸编辑结构域包括但不限于脱氨酶、核酸酶、切口酶、重组酶、甲基转移酶、甲基化酶、乙酰化酶、乙酰转移酶、转录激活因子或转录抑制子结构域。在一些实施方式中,核酸编辑结构域是脱氨酶(例如胞苷脱氨酶,例如APOBEC或AID脱氨酶)。
寡核苷酸/多核苷酸
如本文所用,术语“寡核苷酸”和“多核苷酸”可以互换使用,用于指代核苷酸聚合物(例如,至少三个核苷酸的串)。在一些实施方式中,“核酸”涵盖RNA以及单链和/或双链DNA。核酸可以是天然存在的,例如在基因组、转录物、mRNA、tRNA、rRNA、siRNA、snRNA、质粒、粘粒、染色体、染色单体或其他天然存在的核酸分子的背景下。另一方面,核酸分子可以是非天然存在的分子,例如重组DNA或RNA、人工染色体、工程基因组或其片段,或者合成DNA、RNA、DNA/RNA杂种,或包括非天然存在的核苷酸或核苷。此外,术语“核酸”、“DNA”、“RNA”和/或类似术语包括核酸类似物,例如具有非磷酸二酯主链外的类似物。核酸可以从天然来源中纯化,使用重组表达系统生产,并任选纯化,化学合成等。在适当的情况下,例如,在化学合成分子的情况下,核酸可以包含核苷类似物,例如具有化学修饰的碱基或糖和骨架修饰。除非另有说明,否则核酸序列以5'至3'方向呈现。在一些实施方式中,核酸是或包含天然核苷(例如腺苷、胸苷、鸟苷、胞苷、尿苷、脱氧腺苷、脱氧胸苷、脱氧鸟苷和脱氧胞苷);或核苷类似物(例如2-氨基腺苷、2-硫代胸苷、肌苷、吡咯并嘧啶、3-甲基腺苷、5-甲基胞苷、2-氨基腺苷、C5-溴尿苷、C5-氟尿苷、C5-碘尿苷、C5-丙炔基尿苷、C5-丙炔胞苷、C5-甲基胞苷、2-氨基腺苷、7-脱氮杂腺苷、7-脱氮鸟苷、8-氧代腺苷、8-氧代鸟苷、O(6)-甲基鸟嘌呤和2-硫代胞苷);化学修饰碱基;生物修饰碱基(例如甲基化碱基);插入碱基;修饰糖(例如2'-氟核糖、核糖、2'-脱氧核糖、阿拉伯糖和己糖);和/或修饰的磷酸基团(例如硫代磷酸酯和5'-N-亚磷酰胺键)。
PACE(噬菌体辅助连续进化)
术语“噬菌体辅助连续进化(PACE)”如本文所用是指采用噬菌体作为病毒载体的连续进化。PACE技术的一般概念已在例如以下中描述:国际PCT申请,PCT/US2009/056194,于2009年9月8日提交,于2010年3月11日公布为WO 2010/028347;国际PCT申请,PCT/US2011/066747,于2011年12月22日提交,于2012年6月28日公布为WO 2012/088381;美国申请,美国专利第9,023,594号,2015年5月5日颁发;国际PCT申请,PCT/US2015/012022,于2015年1月20日提交,于2015年9月11日公布为WO 2015/134121;和国际PCT申请,PCT/US2016/027795,于2016年4月15日提交,与2016年10月20日公布为WO 2016/168631,上述每篇文献的全部内容通过引用并入本文。
启动子
术语“启动子”是本领域公认的,并且是指具有被细胞转录机制识别并能够启动下游基因转录的序列的核酸分子。启动子可以是组成型活性的,这意味着该启动子在给定的细胞环境中始终是有活性的,或者是条件型活性的,这意味着该启动子仅在特定条件下才是有活性的。例如,条件型启动子仅在存在将与启动子中的调节元件相关的蛋白质与基本转录机制连接的特定蛋白质的情况下或者仅在不存在抑制剂分子的情况下才具有活性。条件型活性启动子的一个亚类是诱导型启动子,该诱导型启动子需要活性的小分子“诱导物”。诱导型启动子的示例包括但不限于阿拉伯糖诱导型启动子,Tet-on启动子,和他莫昔芬诱导型启动子。多种组成型、条件型和诱导型启动子是本领域技术人员众所周知的,并且本领域技术人员将能够确定可用于实施本发明的多种此类启动子,其在此方面不受限制。
噬菌体
如本文所用,术语“噬菌体”可与术语“细菌噬菌体”互换使用,是指感染细菌细胞的病毒。通常,噬菌体由包裹遗传物质的外部蛋白质衣壳组成。遗传物质可以是线性或环状形式的ssRNA、dsRNA、ssDNA或dsDNA。噬菌体和噬菌体载体是本领域技术人员众所周知的,可用于实施本文提供的方法的噬菌体的非限制性示例是λ(Lysogen)、T2、T4、T7、T12、R17、M13、MS2、G4、P1、P2、P4、Phi X174、N4、Φ6和Φ29。在某些实施方式中,用于本发明的噬菌体是M13。其他合适的噬菌体和宿主细胞对于本领域技术人员将是显而易见的,并且本发明不限于此方面。有关其他合适的噬菌体和宿主细胞的示例性说明,请参见Elizabeth Kutterand Alexander Sulakvelidze:Bacteriophages:Biology and Applications.CRC Press;1st edition(December 2004),ISBN:0849313368;Martha R.J.Clokie and AndrewM.Kropinski:Bacteriophages:Methods and Protocols,Volume 1:Isolation,Characterization,and Interactions(Methods in Molecular Biology)Humana Press;1st edition(December,2008),ISBN:1588296822;Martha R.J.Clokie and AndrewM.Kropinski:Bacteriophages:Methods and Protocols,Volume 2:Molecular andApplied Aspects(Methods in Molecular Biology)Humana Press;1st edition(December2008),ISBN:1603275649;上述全部通过引用以其整体并入本文,用于公开合适的噬菌体和宿主细胞以及用于分离、培养和操作这些噬菌体的方法和方案。
在一些实施方式中,噬菌体是丝状噬菌体。在一些实施方式中,噬菌体是M13噬菌体。M13噬菌体是本领域技术人员众所周知的,并且已经广泛研究了M13噬菌体的生物学。图16提供了野生型M13基因组的示意图。野生型M13噬菌体颗粒包含约6.4kb的环状单链基因组。野生型基因组包含十个基因gI-gX,它们分别编码十个M13蛋白pI-pX。gVIII编码pVIII,通常也称为噬菌体颗粒的主要结构蛋白,而gIII编码pIII,也称为次要外壳蛋白,这是M13噬菌体颗粒的感染性所必需的。
M13的生命周期包括通过pIII蛋白将噬菌体附着到合适的细菌宿主细胞的性菌毛上,以及将噬菌体基因组插入宿主细胞中。然后将环状单链噬菌体基因组转化为环状双链DNA,也称为复制形式(RF),从中启动噬菌体基因转录。野生型M13基因组包含9个启动子和2个转录终止子以及复制起点。该系列的启动子提供转录梯度,使得最接近两个转录终止子(gVIII和IV)的基因以最高水平转录。在野生型M13噬菌体中,所有10个基因的转录方向相同。噬菌体编码蛋白之一pII启动宿主细胞中线性单链噬菌体基因组的生成,随后将其环化并通过pV结合并稳定化。然后将环状的单链M13基因组与pVIII结合,同时将pV剥离基因组,从而启动包装过程。在包装过程结束时,pIII的多个拷贝将附着在野生型M13颗粒上,从而产生了可感染另一个宿主细胞的感染性噬菌体,并结束了生命周期。
可以例如通过缺失一个或多个野生型基因和/或将异源核酸构建体插入基因组来操纵M13噬菌体基因组。M13没有严格的基因组大小限制,并且已经报道了高达42kb的插入。这使得M13噬菌体载体可用于连续进化实验中,以进化目的基因,而不会限制所涉及基因的长度。
已经很好地表征了M13噬菌体,并且已经报道了M13的基因组序列。可以从公共数据库中检索代表性的M13基因组序列,并在国家生物技术信息中心(NCBI)数据库(www.ncbi.nlm,nih.gov)的条目V00604中提供示例性序列:
噬菌体M13基因组:
>gi|56713234|emb|V00604.2|噬菌体M13基因组
AACGCTACTACTATTAGTAGAATTGATGCCACCTTTTCAGCTCGCGCCCCAAATGAAAATATAGCTAAACAGGTTATTGACCATTTGCGAAATGTATCTAATGGTCAAACTAAATCTACTCGTTCGCAGAATTGGGAATCAACTGTTACATGGAATGAAACTTCCAGACACCGTACTTTAGTTGCATATTTAAAACATGTTGAGCTACAGCACCAGATTCAGCAATTAAGCTCTAAGCCATCCGCAAAAATGACCTCTTATCAAAAGGAGCAATTAAAGGTACTCTCTAATCCTGACCTGTTGGAGTTTGCTTCCGGTCTGGTTCGCTTTGAAGCTCGAATTAAAACGCGATATTTGAAGTCTTTCGGGCTTCCTCTTAATCTTTTTGATGCAATCCGCTTTGCTTCTGACTATAATAGTCAGGGTAAAGACCTGATTTTTGATTTATGGTCATTCTCGTTTTCTGAACTGTTTAAAGCATTTGAGGGGGATTCAATGAATATTTATGACGATTCCGCAGTATTGGACGCTATCCAGTCTAAACATTTTACTATTACCCCCTCTGGCAAAACTTCTTTTGCAAAAGCCTCTCGCTATTTTGGTTTTTATCGTCGTCTGGTAAACGAGGGTTATGATAGTGTTGCTCTTACTATGCCTCGTAATTCCTTTTGGCGTTATGTATCTGCATTAGTTGAATGTGGTATTCCTAAATCTCAACTGATGAATCTTTCTACCTGTAATAATGTTGTTCCGTTAGTTCGTTTTATTAACGTAGATTTTTCTTCCCAACGTCCTGACTGGTATAATGAGCCAGTTCTTAAAATCGCATAAGGTAATTCACAATGATTAAAGTTGAAATTAAACCATCTCAAGCCCAATTTACTACTCGTTCTGGTGTTTCTCGTCAGGGCAAGCCTTATTCACTGAATGAGCAGCTTTGTTACGTTGATTTGGGTAATGAATATCCGGTTCTTGTCAAGATTACTCTTGATGAAGGTCAGCCAGCCTATGCGCCTGGTCTGTACACCGTTCATCTGTCCTCTTTCAAAGTTGGTCAGTTCGGTTCCCTTATGATTGACCGTCTGCGCCTCGTTCCGGCTAAGTAACATGGAGCAGGTCGCGGATTTCGACACAATTTATCAGGCGATGATACAAATCTCCGTTGTACTTTGTTTCGCGCTTGGTATAATCGCTGGGGGTCAAAGATGAGTGTTTTAGTGTATTCTTTCGCCTCTTTCGTTTTAGGTTGGTGCCTTCGTAGTGGCATTACGTATTTTACCCGTTTAATGGAAACTTCCTCATGAAAAAGTCTTTAGTCCTCAAAGCCTCTGTAGCCGTTGCTACCCTCGTTCCGATGCTGTCTTTCGCTGCTGAGGGTGACGATCCCGCAAAAGCGGCCTTTAACTCCCTGCAAGCCTCAGCGACCGAATATATCGGTTATGCGTGGGCGATGGTTGTTGTCATTGTCGGCGCAACTATCGGTATCAAGCTGTTTAAGAAATTCACCTCGAAAGCAAGCTGATAAACCGATACAATTAAAGGCTCCTTTTGGAGCCTTTTTTTTTGGAGATTTTCAACATGAAAAAATTATTATTCGCAATTCCTTTAGTTGTTCCTTTCTATTCTCACTCCGCTGAAACTGTTGAAAGTTGTTTAGCAAAACCCCATACAGAAAATTCATTTACTAACGTCTGGAAAGACGACAAAACTTTAGATCGTTACGCTAACTATGAGGGTTGTCTGTGGAATGCTACAGGCGTTGTAGTTTGTACTGGTGACGAAACTCAGTGTTACGGTACATGGGTTCCTATTGGGCTTGCTATCCCTGAAAATGAGGGTGGTGGCTCTGAGGGTGGCGGTTCTGAGGGTGGCGGTTCTGAGGGTGGCGGTACTAAACCTCCTGAGTACGGTGATACACCTATTCCGGGCTATACTTATATCAACCCTCTCGACGGCACTTATCCGCCTGGTACTGAGCAAAACCCCGCTAATCCTAATCCTTCTCTTGAGGAGTCTCAGCCTCTTAATACTTTCATGTTTCAGAATAATAGGTTCCGAAATAGGCAGGGGGCATTAACTGTTTATACGGGCACTGTTACTCAAGGCACTGACCCCGTTAAAACTTATTACCAGTACACTCCTGTATCATCAAAAGCCATGTATGACGCTTACTGGAACGGTAAATTCAGAGACTGCGCTTTCCATTCTGGCTTTAATGAGGATCCATTCGTTTGTGAATATCAAGGCCAATCGTCTGACCTGCCTCAACCTCCTGTCAATGCTGGCGGCGGCTCTGGTGGTGGTTCTGGTGGCGGCTCTGAGGGTGGTGGCTCTGAGGGTGGCGGTTCTGAGGGTGGCGGCTCTGAGGGAGGCGGTTCCGGTGGTGGCTCTGGTTCCGGTGATTTTGATTATGAAAAGATGGCAAACGCTAATAAGGGGGCTATGACCGAAAATGCCGATGAAAACGCGCTACAGTCTGACGCTAAAGGCAAACTTGATTCTGTCGCTACTGATTACGGTGCTGCTATCGATGGTTTCATTGGTGACGTTTCCGGCCTTGCTAATGGTAATGGTGCTACTGGTGATTTTGCTGGCTCTAATTCCCAAATGGCTCAAGTCGGTGACGGTGATAATTCACCTTTAATGAATAATTTCCGTCAATATTTACCTTCCCTCCCTCAATCGGTTGAATGTCGCCCTTTTGTCTTTAGCGCTGGTAAACCATATGAATTTTCTATTGATTGTGACAAAATAAACTTATTCCGTGGTGTCTTTGCGTTTCTTTTATATGTTGCCACCTTTATGTATGTATTTTCTACGTTTGCTAACATACTGCGTAATAAGGAGTCTTAATCATGCCAGTTCTTTTGGGTATTCCGTTATTATTGCGTTTCCTCGGTTTCCTTCTGGTAACTTTGTTCGGCTATCTGCTTACTTTTCTTAAAAAGGGCTTCGGTAAGATAGCTATTGCTATTTCATTGTTTCTTGCTCTTATTATTGGGCTTAACTCAATTCTTGTGGGTTATCTCTCTGATATTAGCGCTCAATTACCCTCTGACTTTGTTCAGGGTGTTCAGTTAATTCTCCCGTCTAATGCGCTTCCCTGTTTTTATGTTATTCTCTCTGTAAAGGCTGCTATTTTCATTTTTGACGTTAAACAAAAAATCGTTTCTTATTTGGATTGGGATAAATAATATGGCTGTTTATTTTGTAACTGGCAAATTAGGCTCTGGAAAGACGCTCGTTAGCGTTGGTAAGATTCAGGATAAAATTGTAGCTGGGTGCAAAATAGCAACTAATCTTGATTTAAGGCTTCAAAACCTCCCGCAAGTCGGGAGGTTCGCTAAAACGCCTCGCGTTCTTAGAATACCGGATAAGCCTTCTATATCTGATTTGCTTGCTATTGGGCGCGGTAATGATTCCTACGATGAAAATAAAAACGGCTTGCTTGTTCTCGATGAGTGCGGTACTTGGTTTAATACCCGTTCTTGGAATGATAAGGAAAGACAGCCGATTATTGATTGGTTTCTACATGCTCGTAAATTAGGATGGGATATTATTTTTCTTGTTCAGGACTTATCTATTGTTGATAAACAGGCGCGTTCTGCATTAGCTGAACATGTTGTTTATTGTCGTCGTCTGGACAGAATTACTTTACCTTTTGTCGGTACTTTATATTCTCTTATTACTGGCTCGAAAATGCCTCTGCCTAAATTACATGTTGGCGTTGTTAAATATGGCGATTCTCAATTAAGCCCTACTGTTGAGCGTTGGCTTTATACTGGTAAGAATTTGTATAACGCATATGATACTAAACAGGCTTTTTCTAGTAATTATGATTCCGGTGTTTATTCTTATTTAACGCCTTATTTATCACACGGTCGGTATTTCAAACCATTAAATTTAGGTCAGAAGATGAAATTAACTAAAATATATTTGAAAAAGTTTTCTCGCGTTCTTTGTCTTGCGATTGGATTTGCATCAGCATTTACATATAGTTATATAACCCAACCTAAGCCGGAGGTTAAAAAGGTAGTCTCTCAGACCTATGATTTTGATAAATTCACTATTGACTCTTCTCAGCGTCTTAATCTAAGCTATCGCTATGTTTTCAAGGATTCTAAGGGAAAATTAATTAATAGCGACGATTTACAGAAGCAAGGTTATTCACTCACATATATTGATTTATGTACTGTTTCCATTAAAAAAGGTAATTCAAATGAAATTGTTAAATGTAATTAATTTTGTTTTCTTGATGTTTGTTTCATCATCTTCTTTTGCTCAGGTAATTGAAATGAATAATTCGCCTCTGCGCGATTTTGTAACTTGGTATTCAAAGCAATCAGGCGAATCCGTTATTGTTTCTCCCGATGTAAAAGGTACTGTTACTGTATATTCATCTGACGTTAAACCTGAAAATCTACGCAATTTCTTTATTTCTGTTTTACGTGCTAATAATTTTGATATGGTTGGTTCAATTCCTTCCATAATTCAGAAGTATAATCCAAACAATCAGGATTATATTGATGAATTGCCATCATCTGATAATCAGGAATATGATGATAATTCCGCTCCTTCTGGTGGTTTCTTTGTTCCGCAAAATGATAATGTTACTCAAACTTTTAAAATTAATAACGTTCGGGCAAAGGATTTAATACGAGTTGTCGAATTGTTTGTAAAGTCTAATACTTCTAAATCCTCAAATGTATTATCTATTGACGGCTCTAATCTATTAGTTGTTAGTGCACCTAAAGATATTTTAGATAACCTTCCTCAATTCCTTTCTACTGTTGATTTGCCAACTGACCAGATATTGATTGAGGGTTTGATATTTGAGGTTCAGCAAGGTGATGCTTTAGATTTTTCATTTGCTGCTGGCTCTCAGCGTGGCACTGTTGCAGGCGGTGTTAATACTGACCGCCTCACCTCTGTTTTATCTTCTGCTGGTGGTTCGTTCGGTATTTTTAATGGCGATGTTTTAGGGCTATCAGTTCGCGCATTAAAGACTAATAGCCATTCAAAAATATTGTCTGTGCCACGTATTCTTACGCTTTCAGGTCAGAAGGGTTCTATCTCTGTTGGCCAGAATGTCCCTTTTATTACTGGTCGTGTGACTGGTGAATCTGCCAATGTAAATAATCCATTTCAGACGATTGAGCGTCAAAATGTAGGTATTTCCATGAGCGTTTTTCCTGTTGCAATGGCTGGCGGTAATATTGTTCTGGATATTACCAGCAAGGCCGATAGTTTGAGTTCTTCTACTCAGGCAAGTGATGTTATTACTAATCAAAGAAGTATTGCTACAACGGTTAATTTGCGTGATGGACAGACTCTTTTACTCGGTGGCCTCACTGATTATAAAAACACTTCTCAAGATTCTGGCGTACCGTTCCTGTCTAAAATCCCTTTAATCGGCCTCCTGTTTAGCTCCCGCTCTGATTCCAACGAGGAAAGCACGTTATACGTGCTCGTCAAAGCAACCATAGTACGCGCCCTGTAGCGGCGCATTAAGCGCGGCGGGTGTGGTGGTTACGCGCAGCGTGACCGCTACACTTGCCAGCGCCCTAGCGCCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTCCCCGTCAAGCTCTAAATCGGGGGCTCCCTTTAGGGTTCCGATTTAGTGCTTTACGGCACCTCGACCCCAAAAAACTTGATTTGGGTGATGGTTCACGTAGTGGGCCATCGCCCTGATAGACGGTTTTTCGCCCTTTGACGTTGGAGTCCACGTTCTTTAATAGTGGACTCTTGTTCCAAACTGGAACAACACTCAACCCTATCTCGGGCTATTCTTTTGATTTATAAGGGATTTTGCCGATTTCGGCCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAATATTAACGTTTACAATTTAAATATTTGCTTATACAATCTTCCTGTTTTTGGGGCTTTTCTGATTATCAACCGGGGTACATATGATTGACATGCTAGTTTTACGATTACCGTTCATCGATTCTCTTGTTTGCTCCAGACTCTCAGGCAATGACCTGATAGCCTTTGTAGACCTCTCAAAAATAGCTACCCTCTCCGGCATGAATTTATCAGCTAGAACGGTTGAATATCATATTGATGGTGATTTGACTGTCTCCGGCCTTTCTCACCCTTTTGAATCTTTACCTACACATTACTCAGGCATTGCATTTAAAATATATGAGGGTTCTAAAAATTTTTATCCTTGCGTTGAAATAAAGGCTTCTCCCGCAAAAGTATTACAGGGTCATAATGTTTTTGGTACAACCGATTTAGCTTTATGCTCTGAGGCTTTATTGCTTAATTTTGCTAATTCTTTGCCTTGCCTGTATGATTTATTGGATGTT(SEQ ID NO:21)
GENE II:加入(6006..6407,1..831)
翻译=MIDMLVLRLPFIDSLVCSRLSGNDLIAFVDLSKIATLSGMNLSARTVEYHIDGDLTVSGLSHPFESLPTHYSGIAFKIYEGSKNFYPCVEIKASPAKVLQGHNVFGTTDLALCSEALLLNFANSLPCLYDLLDVNATTISRIDATFSARAPNENIAKQVIDHLRNVSNGQTKSTRSQNWESTVTWNETSRHRTLVAYLKHVELQHQIQQLSSKPSAKMTSYQKEQLKVLSNPDLLEFASGLVRFEARIKTRYLKSFGLPLNLFDAIRFASDYNSQGKDLIFDLWSFSFSELFKAFEGDSMNIYDDSAVLDAIQSKHFTITPSGKTSFAKASRYFGFYRRLVNEGYDSVALTMPRNSFWRYVSALVECGIPKSQLMNLSTCNNVVPLVRFINVDFSSQRPDWYNEPVLKIA(SEQ ID NO:22)
GENE X:496..831
翻译=MNIYDDSAVLDAIQSKHFTITPSGKTSFAKASRYFGFYRRLVNEGYDSVALTMPRNSFWRYVSALVECGIPKSQLMNLSTCNNVVPLVRFINVDFSSQRPDWYNEPVLKIA(SEQ ID NO:23)
GENE V:843..1106
翻译=MIKVEIKPSQAQFTTRSGVSRQGKPYSLNEQLCYVDLGNEYPVLVKITLDEGQPAYAPGLYTVHLSSFKVGQFGSLMIDRLRLVPAK(SEQ ID NO:24)
GENE VII:1108..1209
翻译=MEQVADFDTIYQAMIQISVVLCFALGIIAGGQR(SEQ ID NO:25)
GENE IX:1206..1304
翻译=MSVLVYSFASFVLGWCLRSGITYFTRLMETSS(SEQ ID NO:26)
GENE VIII:1301..1522
翻译=MKKSLVLKASVAVATLVPMLSFAAEGDDPAKAAFNSLQASATEYIGYAWAMVVVIVGATIGIKLFKKFTSKAS(SEQ ID NO:27)
GENE III:1579..2853
翻译=MKKLLFAIPLVVPFYSHSAETVESCLAKPHTENSFTNVWKDDKTLDRYANYEGCLWNATGVVVCTGDETQCYGTWVPIGLAIPENEGGGSEGGGSEGGGSEGGGTKPPEYGDTPIPGYTYINPLDGTYPPGTEQNPANPNPSLEESQPLNTFMFQNNRFRNRQGALTVYTGTVTQGTDPVKTYYQYTPVSSKAMYDAYWNGKFRDCAFHSGFNEDPFVCEYQGQSSDLPQPPVNAGGGSGGGSGGGSEGGGSEGGGSEGGGSEGGGSGGGSGSGDFDYEKMANANKGAMTENADENALQSDAKGKLDSVATDYGAAIDGFIGDVSGLANGNGATGDFAGSNSQMAQVGDGDNSPLMNNFRQYLPSLPQSVECRPFVFSAGKPYEFSIDCDKINLFRGVFAFLLYVATFMYVFSTFANILRNKES(SEQ ID NO:28)
GENE VI:2856..3194
翻译=MPVLLGIPLLLRFLGFLLVTLFGYLLTFLKKGFGKIAIAISLFLALIIGLNSILVGYLSDISAQLPSDFVQGVQLILPSNALPCFYVILSVKAAIFIFDVKQKIVSYLDWDK(SEQ ID NO:29)
GENE I:3196..4242
翻译=MAVYFVTGKLGSGKTLVSVGKIQDKIVAGCKIATNLDLRLQNLPQVGRFAKTPRVLRIPDKPSISDLLAIGRGNDSYDENKNGLLVLDECGTWFNTRSWNDKERQPIIDWFLHARKLGWDIIFLVQDLSIVDKQARSALAEHVVYCRRLDRITLPFVGTLYSLITGSKMPLPKLHVGVVKYGDSQLSPTVERWLYTGKNLYNAYDTKQAFSSNYDSGVYSYLTPYLSHGRYFKPLNLGQKMKLTKIYLKKFSRVLCLAIGFASAFTYSYITQPKPEVKKVVSQTYDFDKFTIDSSQRLNLSYRYVFKDSKGKLINSDDLQKQGYSLTYIDLCTVSIKKGNSNEIVKCN(SEQ ID NO:30)
GENE IV:4220..5500
翻译=MKLLNVINFVFLMFVSSSSFAQVIEMNNSPLRDFVTWYSKQSGESVIVSPDVKGTVTVYSSDVKPENLRNFFISVLRANNFDMVGSIPSIIQKYNPNNQDYIDELPSSDNQEYDDNSAPSGGFFVPQNDNVTQTFKINNVRAKDLIRVVELFVKSNTSKSSNVLSIDGSNLLVVSAPKDILDNLPQFLSTVDLPTDQILIEGLIFEVQQGDALDFSFAAGSQRGTVAGGVNTDRLTSVLSSAGGSFGIFNGDVLGLSVRALKTNSHSKILSVPRILTLSGQKGSISVGQNVPFITGRVTGESANVNNPFQTIERQNVGISMSVFPVAMAGGNIVLDITSKADSLSSSTQASDVITNQRSIATTVNLRDGQTLLLGGLTDYKNTSQDSGVPFLSKIPLIGLLFSSRSDSNEESTLYVLVKATIVRAL(SEQ ID NO:31)
蛋白质/肽/多肽
术语“蛋白质”、“肽”和“多肽”在本文可互换使用,是指通过肽(酰胺)键连接在一起的氨基酸残基的聚合物。该术语是指任何大小、结构或功能的蛋白质、肽或多肽。通常,蛋白质、肽或多肽的长度至少为三个氨基酸。蛋白质、肽或多肽可以指单个蛋白质或蛋白质的集合。蛋白质、肽或多肽中的一个或多个氨基酸可以被修饰,例如,通过添加化学实体,例如糖基团,羟基基团,磷酸基团,法呢基基团,异法呢基基团,脂肪酸基团,用于缀合、官能化或其他修饰的结构等。蛋白质、肽或多肽也可以是单分子,也可以是多分子复合物。蛋白质、肽或多肽可以仅仅是天然存在的蛋白质或肽的片段。蛋白质、肽或多肽可以是天然存在的、重组的或合成的,或其任何组合。如本文所用,术语“融合蛋白”是指包含来自至少两种不同蛋白的蛋白结构域的杂合多肽。一种蛋白质可以位于融合蛋白的氨基末端(N-末端)部分或羧基末端(C-末端)蛋白质,从而分别形成“氨基末端融合蛋白”或“羧基末端融合蛋白”。蛋白质可以包含不同的结构域,例如重组酶的核酸结合结构域(例如,向导蛋白质与靶位点结合的Cas9的gRNA结合结构域)和核酸切割结构域或催化结构域。在一些实施方式中,蛋白质包含蛋白质部分,例如构成核酸结合结构域的氨基酸序列,和有机化合物,例如可以充当核酸切割剂的化合物。在一些实施方式中,蛋白质与核酸例如RNA形成复合物或与核酸缔合。本文提供的任何蛋白质可以通过本领域已知的任何方法产生。例如,本文提供的蛋白质可以通过重组蛋白质表达和纯化产生,其特别适合于包含肽接头的融合蛋白。重组蛋白表达和纯化的方法是众所周知的,包括Green and Sambrook,Molecular Cloning:A LaboratoryManual(4th ed.,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.(2012))中描述的方法,其全部内容通过引用并入本文。
蛋白剪接
如本文所用,术语“蛋白剪接”是指其中前体蛋白的内部区域(内含肽)被切除并且蛋白质的侧翼区域(外显肽)被连接形成成熟蛋白质的过程。在来自原核生物和真核生物的许多蛋白质中都可以观察到这种自然过程(Perler,F.B.,Xu,M.Q.,Paulus,H.CurrentOpinion in Chemical Biology 1997,1,292-299;Perler,F.B.Nucleic Acids Research1999,27,346-347)。内含肽单元包含催化蛋白剪接所需的必要组分,并且通常包含参与内含肽移动性的核酸内切酶结构域(Perler,F.B.,Davis,E.O.,Dean,G.E.,Gimble,F.S.,Jack,W.E.,Neff,N.,Noren,C.J.,Thomer,J.,Belfort,M.Nucleic Acids Research 1994,22,1127-1127)。产生的蛋白质是连接在一起的,但是并不以单独的蛋白质表达。蛋白质剪接也可以与在分开的多肽上表达的分裂内含肽自发结合形成单个内含肽,然后进行蛋白质剪接过程以结合成分离的蛋白质,从而以反式方式进行。
重组体
术语“重组体”如本文所用在蛋白质或核酸背景下是指在自然界中不存在,而是人类工程产物的蛋白质或核酸。例如,在一些实施方式中,重组蛋白或核酸分子包含与任何天然存在的序列相比包含至少1个、至少2个、至少3个、至少4个、至少5个、至少6个或至少个突变的氨基酸或核苷酸序列。
参考碱基编辑器
术语“参考碱基编辑器”如本文所用是指用作连续进化过程(例如,PACE)起点以实现或得到的进化的碱基编辑器的碱基编辑器形式。参考碱基编辑器可包括天然存在的多肽序列。参考碱基编辑器还可包括非天然存在的多肽序列,例如,相对于野生型或规范性多肽在氨基酸序列中具有一个或多个变化(例如一个或多个突变残基,一个或多个氨基酸的插入或一个或多个氨基酸的缺失)的碱基编辑器。换句话说,参考碱基编辑器可以包含天然存在的碱基编辑器组件(例如,脱氨酶和Cas9)(例如野生型人,小鼠,大鼠,马或兔多肽序列或其天然存在的变体),或者其还可包括相对于天然存在的序列已经进行修饰并且希望使用本文所述的连续进化方法(例如PACE)进一步进化和/或改变和/或改进的碱基编辑器。当涉及碱基编辑器的各个组件时,将观察到类似的定义。例如,“参考Cas9域”或“参考脱氨酶”或“参考UGI”或其他此类碱基编辑器的单独组件指的是如下的组分或结构域形式:该形式用作连续进化过程(如PACE)的起点以实现或得到进化形式的组件或结构域。
RNA-可编程核酸酶/RNA-向导的核酸酶
术语“RNA可编程核酸酶”和“RNA向导的核酸酶”在本文中可互换使用,并且是指与非切割靶(例如,Cas9或其同源物或变体)的一种或多种RNA形成复合物(例如,结合或缔合)的核酸酶。在一些实施方式中,当RNA可编程核酸酶与RNA复合时,可被称为核酸酶:RNA复合物。通常,结合的RNA被称为向导RNA(gRNA)。gRNAs可以两个或多个RNAs的复合体形式存在,也可以单个RNA分子形式存在。以单个RNA分子形式存在的gRNAs可以称为“单向导RNAs”(sgRNAs),尽管“gRNA”可互换地用于指以单个分子形式或以两个或多个分子的复合物形式存在的向导RNAs。通常,以单个RNA种类存在的gRNAs包含两个域:(1)与靶核酸具有同源性的结构域(例如,并向导Cas9(或等效)复合物与靶结合);(2)结合Cas9蛋白的结构域。在一些实施方式中,结构域(2)对应于被称为tracrRNA的序列,并包含茎环结构。例如,在一些实施方式中,结构域(2)与如Jinek et al.,Science 337:816-821(2012)的图1E中所示的tracrRNA同源,该文献的全部内容通过引用并入本文。gRNAs的其他示例(例如,包括结构域2的那些)可见于2013年9月6日提交的题为“Switchable Cas9 Nucleases and Uses”的美国临时专利申请U.S.S.N.61/874,682和于2013年9月6日提交的题为“Delivery SystemFor Functional Nucleases”的美国临时专利U.S.S.N 61/874,746中,上述文献的全部内容通过引用整体并入本文。在一些实施方式中,gRNA包含结构域(1)和(2)中的两个或更多个,并且可被称为“延长gRNA”。例如,如本文所述,延长gRNA将例如结合两个或更多个Cas9蛋白并且在两个或更多个不同的区域结合靶核酸。gRNA包含与靶位点互补的核苷酸序列,其介导核酸酶/RNA复合物与所述靶位点的结合,提供核酸酶:RNA复合物的序列特异性。在一些实施方式中,RNA可编程核酸酶是(CRISPR相关系统(CRISPR-associated system))Cas9核酸内切酶,例如来自化脓链球菌的Cas9(Csn1)(参见,例如,“Complete genomesequence of an M1 strain of Streptococcus pyogenes.”Ferretti J.J.,McShanW.M.,Ajdic D.J.,Savic D.J.,Savic G.,Lyon K.,Primeaux C.,Sezate S.,SuvorovA.N.,Kenton S.,Lai H.S.,Lin S.P.,Qian Y.,Jia H.G.,Najar F.Z.,Ren Q.,Zhu H.,Song L.,White J.,Yuan X.,Clifton S.W.,Roe B.A.,McLaughlin R.E.,Proc.Natl.Acad.Sci.U.S.A.98:4658-4663(2001);“CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III.”Deltcheva E.,Chylinski K.,SharmaC.M.,Gonzales K.,Chao Y.,Pirzada Z.A.,Eckert M.R.,Vogel J.,Charpentier E.,Nature 471:602-607(2011);and“A programmable dual-RNA-guided DNA endonucleasein adaptive bacterial immunity.”Jinek M.,Chylinski K.,Fonfara I.,Hauer M.,Doudna J.A.,Charpentier E.Science 337:816-821(2012),,其中每一个的全部内容通过引用并入本文。
因为RNA可编程核酸酶(例如,Cas9)使用RNA:DNA杂交来靶向DNA切割位点,所以这些蛋白质原则上能够靶向由向导RNA指定的任何序列。使用RNA可编程核酸酶(例如Cas9)进行位点特异性切割(例如,修饰基因组)的方法是本领域已知的(参见例如,Cong,L.etal.Multiplex genome engineering using CRISPR/Cas systems.Science339,819-823(2013);Mali,P.et al.RNA-guided human genome engineering via Cas9.Science339,823-826(2013);Hwang,W.Y.et al.Efficient genome editing in zebrafish using aCRISPR-Cas system.Nature biotechnology31,227-229(2013);Jinek,M.et al.RNA-programmed genome editing in human cells.eLife2,e00471(2013);Dicarlo,J.E.etal.Genome engineering in Saccharomyces cerevisiae using CRISPR-Cassystems.Nucleic acids research(2013);Jiang,W.et al.RNA-guided editing ofbacterial genomes using CRISPR-Cas systems.Nature biotechnology31,233-239(2013);上述每一篇的全部内容通过引用并入本文。
选择噬菌体
如本文所用,术语“选择噬菌体”与术语“选择质粒”可互换使用,并且是指包含编码待进化的tRNA合成酶的核酸序列并缺少编码产生感染性噬菌体颗粒所需的蛋白质的全长基因的修饰噬菌体。例如,本文提供的一些M13选择噬菌体包含编码例如处于M13启动子控制下的待进化的基因并且缺少编码产生感染性噬菌体所需的蛋白质的全部或部分噬菌体基因(例如gI,gII,gIII,gIV,gV,gVI,gVII,gVIII,gIX或gX,或其任何组合)的核酸序列。例如,本文提供的一些M13选择噬菌体包含编码例如处于M13启动子控制下的待进化的tRNA合成酶蛋白并且缺少编码产生感染性噬菌体颗粒所需的蛋白质的全部或部分基因(例如编码pIII蛋白的gIII基因)的核酸序列。
序列背景不相关
如本文所用,术语“序列背景不相关”是指本文所述的进化的碱基编辑器的期望性质或特征,其中接近于所需靶编辑位点的(上游和/或下游)序列对于进化的碱基编辑器编辑所需靶编辑位点的效率几乎没有或没有影响。
分裂内含肽
已被鉴定的内含肽基因的一小部分(少于5%)编码分裂的内含肽。9与更常见的连续内含肽不同,它们被转录并翻译为两个独立的多肽,N-内含肽和C-内含肽,每个与一个外显肽融合。在翻译后,内含肽片段自发地和非共价地组装成规范的内含肽结构,从而以反式方式进行蛋白质剪接。
受试者
术语“受试者”如本文所用是指单个生物体,例如,单个哺乳动物。在一些实施方式中,受试者是人。在一些实施方式中,受试者是非人哺乳动物。在一些实施方式中,受试者是非人灵长类动物。在一些实施方式中,受试者是啮齿类动物。在一些实施方式中,受试者是绵羊、山羊、牛、猫或犬。在一些实施方式中,受试者是脊椎生物、两栖动物、爬行动物、鱼、昆虫、飞虫或线虫。在一些实施方式中,受试者是研究动物。在一些实施方式中,受试者是基因工程化的,例如,基因工程化的非人受试者。受试者可具有任一性别和处于任何发育阶段。
靶位点
术语“靶位点”是指核酸分子中通过脱氨酶或包含脱氨酶的融合蛋白(例如本文中提供的dCas9-脱氨酶融合蛋白)脱氨基的序列序列。
载体
如本文所用,术语“载体”是指可以被修饰以编码目的基因并且能够进入宿主细胞、在宿主细胞内突变和复制然后将载体的复制形式转运至另一宿主细胞中的核酸。示例性的合适载体包括病毒载体,例如逆转录病毒载体或细菌噬菌体和丝状噬菌体,以及结合质粒。基于本公开,其他合适的载体对于本领域技术人员将是显而易见的。
病毒生命周期
如本文所用,术语“病毒生命周期”是指病毒繁殖周期,其包括将病毒基因组插入宿主细胞中,病毒基因组在宿主细胞中的复制,以及通过宿主细胞将病毒基因组的复制产物包装到病毒颗粒中。
病毒颗粒
术语“病毒颗粒”如本文所用是指与病毒蛋白质或多种蛋白质的包被相关的病毒基因组,例如,DNA或RNA基因组,并且在一些情况中,与脂质包膜相关。例如,噬菌体颗粒包含被包装到通过野生型噬菌体基因组编码的蛋白质中的噬菌体基因组。
病毒载体
如本文所用,术语“病毒载体”是指如下的包含病毒基因组的核酸,当将其引入合适的宿主细胞中时,其可以被复制并包装到能够将病毒基因组转运至另一宿主细胞中的病毒颗粒。术语病毒载体延伸至包含截短或部分病毒基因组的载体。例如,在一些实施方式中,提供了缺乏编码对于感染性病毒颗粒的产生必不可少的蛋白质的基因的病毒载体。然而,在合适的宿主细胞中,例如,在包含处于条件启动子控制下的缺乏基因的宿主细胞中,这种截短的病毒载体可以复制并产生能够将截短的病毒基因组转运到另一宿主细胞中的病毒颗粒。在一些实施方式中,病毒载体是噬菌体,例如丝状噬菌体(例如,M13噬菌体)。在一些实施方式中,提供了病毒载体,例如噬菌体载体,其包含待进化的目的基因。
尿嘧啶糖基化酶抑制剂或UGI
如本文所用,术语“尿嘧啶糖基化酶抑制剂”或“UGI”是指能够抑制尿嘧啶DNA糖基化酶碱基删除修复酶的蛋白质。在一些实施方式中,UGI结构域包含野生型UGI或如SEQ IDNO:10所示的UGI。在一些实施方式中,本文提供的UGI蛋白包括UGI的片段和与UGI或UGI片段同源的蛋白。例如,在一些实施方式中,UGI结构域包含SEQ ID NO:10所示氨基酸序列的片段。在一些实施方式中,UGI片段包含如下的氨基酸序列:该氨基酸序列包含SEQ ID NO:10所示氨基酸序列的至少60%,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,至少96%,至少97%,至少98%,至少99%或至少99.5%。在一些实施方式中,UGI包含与SEQ ID NO:10所示氨基酸序列同源的氨基酸序列或与SEQ ID NO:10所示氨基酸序列的片段同源的氨基酸序列。在一些实施方式中,包含UGI或UGI的片段或者UGI或UGI片段的同源物的蛋白质被称为“UGI变体”。UGI变体与UGI或其片段具有同源性。例如,UGI变体与野生型UGI或SEQ ID NO:10所示的UGI具有至少70%同一性,至少75%同一性,至少80%同一性,至少85%同一性,至少90%同一性,至少95%同一性,至少96%同一性,至少97%同一性,至少98%同一性,至少99%同一性,至少99.5%同一性,或至少99.9%同一性。在一些实施方式中,UGI变体包含如下的UGI片段,使得该UGI片段与野生型UGI或SEQ IDNO:10所示的UGI的相应片段具有至少70%同一性,至少80%同一性,至少90%同一性,至少95%同一性,至少96%同一性,至少97%同一性,至少98%的同一性,至少99%的同一性,至少99.5%的同一性,或至少99.9%同一性。在一些实施方式中,UGI包含以下氨基酸序列:MTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKML(SEQ ID NO:10)(P14739|UNGI_BPPB2尿嘧啶-DNA糖基化酶抑制剂)。
治疗
如本文所述,术语“治疗(treatment,treat和treating)”是指旨在逆转,减轻,延迟疾病或病症或其一种或多种症状的发作或抑制其进展的临床干预。如本文所用,术语(treatment,treat和treating)”是指旨在逆转,减轻,延迟疾病或病症或其一种或多种症状的发作或抑制其进展的临床干预,如本文所述。在一些实施方式中,可以在已经发展了一种或多种症状之后和/或在已诊断出疾病之后施用治疗。在其他实施方式中,可以在没有症状的情况下施用治疗,例如,以预防或延迟症状的发作或抑制疾病的发作或发展。例如,可以在症状发作之前对易感个体施用治疗(例如,根据症状史和/或根据遗传或其他易感性因素)。也可在症状缓解后继续治疗,例如预防或延迟其复发。
变体
如本文所用,术语“变体”应被理解为具有偏离自然界中存在的模式的特性,例如变体Cas9是与野生Cas9氨基酸序列相比包括一个或多个氨基酸残基变化的Cas9。
野生型
如本文所用,术语“野生型”是本领结构域技术人员理解的术语,其表示与突变或变体形式不不同的存在于自然界中的生物体、菌株、基因或特征。
具体实施方式
本发明的发明人惊奇地发现了通过开发有效的连续进化诱变过程(即,PACE)来改进碱基编辑器,该连续进化诱变过程可用于快速改进碱基编辑器的一个或多个结构域或组分的功能。
本说明书提供了进化的碱基编辑器,其克服了现有技术中那些碱基编辑器的缺陷(包括提高效率和/或降低对编辑位点处特定的序列背景的需求),并且其通过噬菌体辅助连续进化(PACE)系统获得。特别是,本说明书提供了进化的胞苷碱基编辑器(例如,基于APOBEC1、CDA或AID胞苷脱氨酶结构域),其克服了现有技术中那些碱基编辑器的缺陷(包括提高效率和/或降低对编辑位点处特定的序列背景的需求),并且其通过噬菌体辅助连续进化(PACE)系统获得。此外,本说明书提供了编码和/或表达如本文所述的进化的碱基编辑器的核酸分子,以及用于表达本文所述的进化的碱基编辑器的表达载体或构建物,包含所述核酸分子的宿主细胞和表达载体,以及用于递送和/或施用基于核酸的本文所述实施方式的组合物。此外,本公开提供了分离的进化的碱基编辑器,以及包含所述分离的如本文所述的进化的碱基编辑器的组合物。仍然另外地,本公开提供了制备进化的碱基编辑器的方法,以及在包括编辑核酸分子如基因组的应用中使用进化的碱基编辑器或编码进化的碱基编辑器的核酸分子的方法,该方法与形成现有技术的碱基编辑器相比,优选地,以序列背景不相关的方式(即,其中所需的编辑位点不需要特定的序列背景),具有改进的效率。在实施方式中,本文提供的制备方法是改进型噬菌体辅助连续进化(PACE)系统,其可用于以快速和连续的方式进化的碱基编辑器的一个或多个组分(例如,Cas9结构域或胞苷脱氨酶结构域)。本说明书还提供了用如本文所述的碱基编辑系统(例如,以如本文所述的分离的进化的碱基编辑器或编码其的载体或构建物的形式)有效地编辑靶核酸分子(例如,基因组的单个核碱基)并优选以序列背景不相关的方式进行碱基编辑的方法。仍然另外地,本说明书提供了通过将靶核酸分子(例如基因组)与碱基编辑系统(例如,以分离的进化的碱基编辑器蛋白或编码其的载体的形式)相接触并进行碱基编辑以治疗基因病和/或改变遗传特性(例如,眼睛颜色)的治疗基因病和/或改变或变化遗传特性或状况的治疗方法。
I.进化的碱基编辑器
在多个方面,本公开提供了通过连续进化方法(例如,PACE)诱变参考或起点碱基编辑器(或其组分或结构域)的进化的碱基编辑器。在多个实施方式中,本公开提供了一种进化的碱基编辑器,其相对于参考或起点碱基编辑器的氨基酸序列具有一个或多个被引入其氨基酸序列中的氨基酸变动。氨基酸序列变动可包括参考碱基编辑器的氨基酸序列的一个或多个突变残基,例如,由于编码该碱基编辑器的核苷酸序列中的导致编码序列中任何位置处的密码子变化的变化,缺失一个或多个氨基酸(例如,截短蛋白),插入一个或多个氨基酸,或前述的任何组合。在一些实施方式中,一种进化的碱基编辑器与参考碱基编辑器具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%同一性。进化的碱基编辑器可包括在碱基编辑器的一个或多个组分或结构域中的变体(例如,被引入到Cas9结构域、脱氨酶结构域或UGI结构域中的变体或被引入到这些结构域的组合中的变体)。
在某些方面,本文描述的用于进化的碱基编辑器的方法开始于本领结构域已知的碱基编辑器。截至本文提交时,现有技术已描述了许多碱基编辑器。本文描述的用于改进碱基编辑器的方法和方法可以应用于任何先前已知的碱基编辑器,或者可以应用于可以进一步开发但缺少由本方法和修饰方式赋予的有益特性的碱基编辑器。可以通过本文所述的方法进行修饰以实现本发明的进化的碱基编辑器的示例性碱基编辑器可以包括,例如,在以下参考文献和/或专利出版物中描述的那些,其每一个均通过引用整体并入:(a)PCT/US2014/070038(于2015年6月18日作为WO2015/089406公布)及其在美国或世界范围内的等效文件;(b)PCT/US2016/058344(于2017年4月27日作为WO2017/070632公布)及其在美国或世界范围内的等效文件;(c)PCT/US2016/058345(于2017年4月27日作为WO2017/070633公布)及其在美国或世界范围内的等效文件;(d)PCT/US2017/045381(于2018年2月8日作为WO2018/027078公布)及其在美国或世界范围内的等效文件;(e)PCT/US2017/056671(于2018年4月19日作为WO2018/071868公布)及其在美国或世界范围内的等效文件;PCT/2017/048390(WO2017/048390,2017年3月23日)及其在美国或世界范围内的等效文件;(f)PCT/US2017/068114(未公布)及其在美国或世界范围内的等效文件;(g)PCT/US2017/068105(未公布)及其在美国或世界范围内的等效文件;(h)PCT/US2017/046144(WO2018/031683,2018年2月15日)及其在美国或世界范围内的等效文件;(i)PCT/US2018/024208(未公布)及其在美国或世界范围内的等效文件;(j)PCT/2018/021878(WO2018/021878,2018年2月1日)及其在美国和世界范围内的等效文件;(k)Komor,A.C.,Kim,Y.B.,Packer,M.S.,Zuris,J.A.&Liu,D.R.Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage.Nature 533,420(2016);(l)Gaudelli,N.M.et al.Programmablebase editing of A.T to G.C in genomic DNA without DNA cleavage.Nature 551,464-(2017);(m)本说明书中标题为“参考文献”的任何参考文献,其报告或描述了本领结构域已知的碱基编辑器。
在各个方面,本文所述的进化或修饰的碱基编辑器具有以下通用结构:A–B–C,其中“A”是Cas部分或napDNAbp,“B”是核酸效应子结构域(例如脱氨酶)(例如胞苷或腺苷脱氨酶),“C”代表可选的附加碱基编辑器功能结构域(例如,UGI结构域或NLS结构域)。另外,“-”表示接头,其共价连接部分A、B和C。接头可具有任何合适的类型(例如氨基酸序列或其他生物聚合物,或在各部分彼此生物缀合的情况下为合成化学键)或长度。另外,本发明的功能性改进型碱基编辑器还可包括一个或多个“R”或向导序列(例如,在Cas9或Cas9等同物的情况下,向导RNA)以进行靶向要纠正的特定位点的碱基编辑器的R/DNA可编码官能化。
各部分的连接顺序并不特别限定,只要各部分元件的特定排列产生功能性碱基编辑器即可。即,本发明的进化的碱基编辑器还可以包括由以下结构表示的编辑器:B–A–C;B–C–A;C–B–A;C–A–B;等等。在多个实施方式中,进化的碱基编辑器可包含已通过连续进化过程(例如,PACE)进化的进化的碱基编辑器中的至少一个结构域(例如,Cas9结构域或脱氨酶结构域)。因此,在一个实施方式中,本说明书提供了一种进化的碱基编辑器,其包括相对于参考Cas9结构域的进化Cas9结构域,但是该碱基编辑器的其他结构域尚未进化。在另一个实施方式中,本说明书提供了包括进化的脱氨酶结构域(例如,APOBEC1、AID或CDA结构域)的碱基编辑器,但是碱基编辑器的其他结构域尚未进化。在又一个实施方式中,本说明书提供了包括进化的UGI结构域的进化的碱基编辑器,但是碱基编辑器的其他结构域尚未进化。在其他实施方式中,进化的碱基编辑器可以包括通过本文所述的连续进化过程进化的结构域的组合。
在一个实施方式中,进化的碱基编辑器可包含融合蛋白,其包含:(i)核酸可编程DNA结合蛋白(napDNAbp);(ii)胞苷脱氨酶;和(iii)尿嘧啶糖基化酶抑制剂结构域(UGI),其中(i)、(ii)或(iii)中的至少一个使用本文所述的连续进化过程(例如,PACE)进化。在多个实施方式中,融合蛋白可包含2个、3个、4个或5个或更多个UGI结构域。在某些实施方式中,核酸可编程DNA结合蛋白(napDNAbp)是Cas9结构域。Cas9结构域在多个实施方式中可为核酸酶活性Cas9、核酸酶失活的Cas9(dCas9)或Cas9切口酶(nCas9)。在多个其他实施方式中,napDNAbp为CasX、CasY、Cpf1、C2c1、C2c2、C2c3或Argonaute蛋白。
包含(i)核酸可编程DNA结合蛋白(napDNAbp);(ii)胞苷脱氨酶;和(iii)尿嘧啶糖基化酶抑制剂结构域(UGI),其中(i)、(ii)或(iii)中的至少一个使用本文所述的连续进化过程(例如,PACE)进化的进化的碱基编辑器可以多种构型进行结构排列,其包括,但不限于:
NH2-[胞苷脱氨酶]-[napDNAbp]-[UGI]-COOH;
NH2-[胞苷脱氨酶]-[UGI]-[napDNAbp]-COOH;
NH2-[napDNAbp]-[UGI]-[胞苷脱氨酶]-COOH;
NH2-[napDNAbp]-[胞苷脱氨酶]-[UGI]-COOH;
NH2-[UGI]-[胞苷脱氨酶]-[napDNAbp]-COOH;或
NH2-[UGI]-[napDNAbp]-[胞苷脱氨酶]-COOH,其中每个“-”包含任选的接头。
在其他实施方式中,包含:(i)核酸可编程DNA结合蛋白(napDNAbp);(ii)胞苷脱氨酶;和(iii)尿嘧啶糖基化酶抑制剂结构域(UGI),其中(i)、(ii)或(iii)中的至少一个使用本文所述的连续进化过程(例如,PACE)进化的进化的碱基编辑器,可以多种构型进行结构排列,其包括,但不限于:
NH2-[胞苷脱氨酶]-[napDNAbp]-[UGI]-[UGI]-COOH;
NH2-[胞苷脱氨酶]-[UGI]-[napDNAbp]-[UGI]-COOH;
NH2-[UGI]-[胞苷脱氨酶]-[napDNAbp]-[UGI]-COOH;
NH2-[胞苷脱氨酶]-[UGI]-[napDNAbp]-[UGI]-COOH;
NH2-[胞苷脱氨酶]-[UGI]-[UGI]-[napDNAbp]-COOH;
NH2-[UGI]-[胞苷脱氨酶]-[UGI]-[napDNAbp]-COOH;
NH2-[UGI]-[napDNAbp]-[UGI]-[胞苷脱氨酶]-COOH;
NH2-[napDNAbp]-[UGI]-[UGI]-[胞苷脱氨酶]-COOH;
NH2-[napDNAbp]-[UGI]-[胞苷脱氨酶]-[UGI]-COOH;
NH2-[napDNAbp]-[胞苷脱氨酶]-[UGI]-[UGI]-COOH;
NH2-[napDNAbp]-[UGI]-[胞苷脱氨酶]-[UGI]-COOH;
NH2-[UGI]-[napDNAbp]-[胞苷脱氨酶]-[UGI]-COOH;
NH2-[UGI]-[胞苷脱氨酶]-[napDNAbp]-[UGI]-COOH;
NH2-[UGI]-[胞苷脱氨酶]-[UGI]-[napDNAbp]-COOH;
NH2-[UGI]-[UGI]-[胞苷脱氨酶]-[napDNAbp]-COOH;
NH2-[UGI]-[napDNAbp]-[胞苷脱氨酶]-[UGI]-COOH;
NH2-[UGI]-[napDNAbp]-[UGI]-[胞苷脱氨酶]-COOH;和
NH2-[UGI]-[UGI]-[napDNAbp]-[胞苷脱氨酶]-COOH;其中每个“-”包含任选的接头。
在一些实施方式中,使用参考碱基编辑器来进化的碱基编辑器,下面总结了参考碱基编辑器以及进化的碱基编辑器的相应示例。
对于以下所有序列,文本格式表示碱基编辑器组件的标识,如下所示:SV40BPNLS–脱氨酶–接头–nCas9–接头–UGI–接头–UGI–SV40 BPNLS
以下碱基编辑器(SEQ ID NO:15)包含野生型rAPOBEC1,其可用作参考碱基编辑器。该碱基编辑器被进化以产生以下evoAPOBEC碱基编辑器(SEQ ID NO:16)。
野生型APOBEC BE4Max的全氨基酸序列
Figure BDA0002426427270000611
Figure BDA0002426427270000621
以下碱基编辑器包含evoAPOBEC,其基于以上所提供的碱基编辑器进化(SEQ IDNO: 15)。
evoAPOBEC BE4Max的全氨基酸序列
Figure BDA0002426427270000622
Figure BDA0002426427270000631
以下碱基编辑器(SEQ ID NO:17)包含野生型pmCDA1,其可用作参考碱基编辑器。该碱基编辑器被进化以产生以下evoCDA碱基编辑器(SEQ ID NO:18)。
wt-CDA-BE4Max的全氨基酸序列
Figure BDA0002426427270000641
Figure BDA0002426427270000651
以下碱基编辑器包含evoCDA,其基于上面提供的碱基编辑器进化(SEQ ID NO:17)。
evoCDA-BE4Max的全氨基酸序列
Figure BDA0002426427270000652
Figure BDA0002426427270000661
以下碱基编辑器(SEQ ID NO:19)包含野生型FERNY,其可用作参考碱基编辑器。该碱基编辑器被进化以产生以下evoFERNY碱基编辑器(SEQ ID NO:20)。
FERNY-BE4Max的全氨基酸序列
Figure BDA0002426427270000662
Figure BDA0002426427270000671
以下碱基编辑器包含evoFERNY,其基于上面提供的碱基编辑器进化(SEQ ID NO:19)。
evoFERNY-BE4Max的全氨基酸序列
Figure BDA0002426427270000672
Figure BDA0002426427270000681
Figure BDA0002426427270000691
在一些实施方式中,本文提供的任何碱基编辑器蛋白可进一步包含一个或多个另外的核酸效应子部分,例如肌苷碱基删除修复抑制剂(例如尿嘧啶糖基化酶抑制剂(UGI)结构域或催化失活的肌苷特异性核酸酶(dISN)。不希望受到任何特定理论的束缚,UGI结构域或dISN可以抑制或防止脱氨基腺苷残基(例如肌苷)的碱基删除修复,从而可以改善碱基编辑器的活性或效率。本文进一步描述了其他碱基编辑器功能。
(A)Cas9结构域
本说明书提供的进化的碱基编辑器包括任何合适的Cas9部分或等效蛋白,例如CRISPR相关蛋白9或其功能片段,并且包括来自任何生物体的任何天然存在的Cas9,任何天然存在的Cas9等效物或其功能片段,来自任何生物体的任何Cas9同源物,直系同源物或旁系同源物以及Cas9的任何突变体或变体,它们是天然存在的或工程化的。可以使用本文描述的连续进化方法(例如,PACE)来进化这些Cas9分子或等效蛋白质。进化的碱基编辑器包括其中使用PACE仅进化Cas9部分的那些,或其中Cas9部分与一个或多个其他碱基编辑器结构域(例如,脱氨酶)一起进化的那些。本文所述的进化的碱基编辑器还可包括那些融合蛋白,其中Cas9部分或结构域未使用PACE进化,但其中一个或多个其他碱基编辑器结构域(例如脱氨酶结构域)已使用PACE进化。
更广泛而言,Cas9是“RNA-可编程核酸酶”或“RNA-向导的核酸酶”或“核酸可编程DNA-结合蛋白质”类型。术语napR/DNAbp或Cas9并不意味着特别限制。本公开不限于在本发明的进化的碱基编辑器中采用的特定的napR/DNAbp、Cas9或Cas9等效物。
如在本公开上下文中所理解的,任何Cas9结构域通常被视为用于使用如本文所述的连续进化方法(例如,PACE)处理的可能的参考多肽(即,起点)。否则,将指示已使用本文所述的连续进化方法进化的那些Cas9结构域。
在一些实施方式中,napR/DNAbp是Cas部分。
在多个实施方式中,Cas部分是化脓链球菌Cas9,其已被最广泛地用作基因组工程的工具。该Cas9蛋白是一种大型的多结构域蛋白,包含两个不同的核酸酶结构域。可以将点突变引入Cas9中以消除核酸酶活性,从而导致仍然保留其以sgRNA编码方式结合DNA的能力的死亡的Cas9(dCas9)。原则上,当与另一种蛋白质或结构域融合时,dCas9可以简单地通过与适当的sgRNA共表达将该蛋白质靶向几乎任何DNA序列。
在其他实施方式中,Cas部分是来自以下来源的Cas9:Corynebacterium ulcerans(NCBI Refs:NC_015683.1,NC_017317.1);Corynebacterium diphtheria(NCBI Refs:NC_016782.1,NC_016786.1);Spiroplasma syrphidicola(NCBI Ref:NC_021284.1);Prevotella intermedia(NCBI Ref:NC_017861.1);Spiroplasma taiwanense(NCBI Ref:NC_021846.1);Streptococcus iniae(NCBI Ref:NC_021314.1);Belliella baltica(NCBIRef:NC_018010.1);Psychroflexus torquisI(NCBI Ref:NC_018721.1);Streptococcusthermophilus(NCBI Ref:YP_820832.1);Listeria innocua(NCBI Ref:NP_472073.1);Campylobacter jejuni(NCBI Ref:YP_002344900.1);或Neisseria.meningitidis(NCBIRef:YP_002342100.1)。
在仍然其他实施方式中,Cas部分可包括任何CRISPR相关的蛋白质,包括但不限于,Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(also known as Csn1和Csx12)、Cas10、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2.Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4、其同系物或修饰形式。这些酶是已知的。例如,化脓链球菌Cas9蛋白的氨基酸序列可以在SwissProt数据库中以登录号Q99ZW2找到。在一些实施方式中,未修饰的CRISPR酶具有DNA切割活性,例如Cas9。在一些实施方式中,CRISPR酶是Cas9,并且可以是来自化脓性链球菌或肺炎链球菌的Cas9。在一些实施方式中,CRISPR酶向导在靶序列的位置处的一条或两条链的切割,例如在靶序列内和/或在靶序列的互补序列内。在一些实施方式中,CRISPR酶向导从靶序列的第一或最后核苷酸开始切割下约1、2、3、4、5、6、7、8、9、10、15、20、25、50、100、200、500或更多碱基对的一条或两条链。在一些实施方式中,载体编码如下的CRISPR酶,该CRISPR酶相对于相应的野生型酶发生突变,使得突变的CRISPR酶缺乏切割包含靶多核苷酸的靶序列的一条或两条链的能力。例如,来自化脓性链球菌的Cas9的RuvC I催化结构域中的天冬氨酸至丙氨酸取代(D10A)将来自切割两条链的核酸酶的Cas9转化为切口酶(切割单条链)。使Cas9成为切口酶的突变的其他示例包括但不限于H840A、N854A和N863A。
ACas部分也可以称为casn1核酸酶或CRISPR(成簇的规则间隔的短回文重复序列)相关的核酸酶。如上所述,CRISPR是一种适应性免疫系统,其可针对移动遗传元件(病毒、可转座元件和结合质粒)提供保护。CRISPR簇包含间隔子,与先前的移动元件互补的序列,以及靶向入侵的核酸。CRISPR簇被转录并加工成CRISPR RNA(crRNA)。在II型CRISPR系统中,正确处理pre-crRNA需要反编码小RNA(tracrRNA),内源性核糖核酸酶3(rnc)和Cas9蛋白。tracrRNA可作为pre-crRNA的核糖核酸酶3辅助加工的向导。随后,Cas9/crRNA/tracrRNA对与间隔物互补的线性或环状dsDNA靶进行核酸内切酶切割。不与crRNA互补的靶链首先进行核酸内切酶切割,然后进行3'-5'的核酸外切酶切割。实际上,DNA结合和切割通常需要蛋白质和两种RNA。但是,可以设计单个向导RNA(“sgRNA”或简称为“gNRA”),以便将crRNA和tracrRNA的各个方面都整合到单个RNA物种中。参见例如Jinek M.,Chylinski K.,FonfaraI.,Hauer M.,Doudna J.A.,Charpentier E.Science 337:816-821(2012),其全部内容通过引用并入本文。
Cas9及其等同物识别CRISPR重复序列中的短基序(PAM或前间隔序列相邻基序),以帮助区分自身与非自身。如本文所述,Cas9核酸酶序列和结构是本领域技术人员众所周知的(参见,例如,“Complete genome sequence of an M1 strain of Streptococcuspyogenes.”Ferretti et al.,J.J.,McShan W.M.,Ajdic D.J.,Savic D.J.,Savic G.,Lyon K.,Primeaux C.,Sezate S.,Suvorov A.N.,Kenton S.,Lai H.S.,Lin S.P.,QianY.,Jia H.G.,Najar F.Z.,Ren Q.,Zhu H.,Song L.,White J.,Yuan X.,Clifton S.W.,Roe B.A.,McLaughlin R.E.,Proc.Natl.Acad.Sci.U.S.A.98:4658-4663(2001);“CRISPRRNA maturation by trans-encoded small RNA and host factor RNase III.”Deltcheva E.,Chylinski K.,Sharma C.M.,Gonzales K.,Chao Y.,Pirzada Z.A.,EckertM.R.,Vogel J.,Charpentier E.,Nature 471:602-607(2011);和“A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity.”Jinek M.,Chylinski K.,Fonfara I.,Hauer M.,Doudna J.A.,Charpentier E.Science 337:816-821(2012),上述文献中每个的全部内容均通过引用并入本文)。
Cas部分可包括任何合适的同源物和/或直系同源物。已经在各种物种中描述了Cas9同源物和/或直系同源物,包括但不限于化脓性链球菌和嗜热链球菌。基于本公开,其他合适的Cas9核酸酶和序列对本领域技术人员将是显而易见的,并且此类Cas9核酸酶和序列包括来自Chylinski,Rhun,and Charpentier,“The tracrRNA and Cas9 families oftype II CRISPR-Cas immunity systems”(2013)RNA Biology 10:5,726-737中公开的生物体和基因座的Cas9序列,上述文献的全部内容通过引用并入本文。在一些实施方式中,Cas9核酸酶具有失活的(例如,灭活的)DNA切割结构域,即,Cas9是切口酶。
在多个实施方式中,进化的碱基编辑器可以包含核酸酶失活的Cas蛋白,其可互换地称为“dCas”或“dCas9”蛋白(对于核酸酶-“死亡”Cas9)。产生具有失活的DNA切割结构域的Cas9蛋白(或其片段)的方法是已知的(参见,例如,Jinek et al.,Science.337:816-821(2012);Qi et al.,“Repurposing CRISPR as an RNA-Guided Platform for Sequence-Specific Control of Gene Expression”(2013)Cell.28;152(5):1173-83,其中每个的全部内容通过引用并入本文。例如,已知Cas9的DNA切割结构域包括两个子结构域,即HNH核酸酶子结构域和RuvC1子结构域。HNH子结构域切割与gRNA互补的链,而RuvC1子结构域切割非互补链。这些子结构域内的突变可以使Cas9的核酸酶活性沉默。例如,突变D10A和H840A使化脓性链球菌Cas9的核酸酶活性完全失活(Jinek et al.,Science.337:816-821(2012);Qi et al.,Cell.28;152(5):1173-83(2013))。在一些实施方式中,提供了包含Cas9的片段的蛋白质。例如,在一些实施方式中,蛋白质包含两个Cas9结构域之一:(1)Cas9的gRNA结合结构域;或(2)Cas9的DNA切割结构域。
在一些实施方式中,包含Cas9或其片段的蛋白质被称为“Cas9变体”。Cas9变体与Cas9或其片段具有同源性。例如,Cas9变体与野生型Cas9具有至少约70%同一性,至少约80%同一性,至少约90%同一性,至少约95%同一性,至少约96%同一性,至少约97%同一性,至少约98%同一性,至少约99%同一性,至少约99.5%同一性或至少约99.9%同一性。在一些实施方式中,Cas9变体相对于野生型Cas9可具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50或更多个氨基酸变化。在一些实施方式中,Cas9变体包含Cas9的片段(例如,gRNA结合结构域或DNA-切割结构域),由此使得该片段与野生型Cas9的相应片段具有至少约70%同一性,至少约80%同一性,至少约90%同一性,至少约95%同一性,至少约96%同一性,至少约97%同一性,至少约98%同一性,至少约99%同一性,至少约99.5%同一性或至少约99.9%同一性。在一些实施方式中,该片段与相应野生型Cas9的氨基酸长度有至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相同。
在一些实施方式中,Cas9片段的长度为至少100个氨基酸。在一些实施方式中,该片段的长度为至少100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250或至少1300个氨基酸。在一些实施方式中,野生型Cas9对应于来自化脓性链球菌的Cas9(NCBI参考序列:NC_017053.1)。在其他实施方式中,野生型Cas9对应于来自化脓性链球菌的Cas9(NCBI参考序列:NC_002737.2)。在仍然其他实施方式中,dCas9部分或全部对应于或包含具有使Cas9核酸酶活性失活的一个或多个突变的Cas9氨基酸序列。
在一些实施方式中,Cas9结构域包含D10A突变,而相对于野生型序列如来自化脓性链球菌的Cas9(NCBI参考序列:NC_017053.1)在840位置处的残基。
不希望受任何特定理论束缚,催化残基H840的存在恢复了Cas9切割包含与靶C相对的G的未编辑(例如,未脱氨基)链的能力。H840(例如来自A840)不会导致切割包含C的靶链。此类Cas9变体能够基于gRNA定义的靶序列在特定位置产生单链DNA断裂(缺口),导致未编辑链的修复,最终导致未编辑链上的G到A的改变。简言之,可以通过脱氨酶,例如APOBEC脱氨酶,将C-G碱基对的C脱氨成U。对具有G的未编辑链刻痕,有助于通过错配修复机制去除G。UGI抑制UDG,从而防止U的移除。
在其他实施方式中,提供了具有除D10A和H840A以外的突变的dCas9变体,其例如导致核酸酶灭活的Cas9(dCas9)。举例来说,此类突变包括相对于野生型序列在D10和H820处的其他氨基酸取代,或在Cas9的核酸酶结构域内的其他取代(例如,在HNH核酸酶亚结构域和/或RuvC1亚结构域中的取代)。例如化脓性链球菌的Cas9(NCBI参考序列:NC_017053.1)。在一些实施方式中,提供了dCas9的变体或同源物(例如,来自化脓链球菌的Cas9的变体(NCBI参考序列:NC_017053.1)),其与NCBI参考序列:NC_017053.1具有至少约70%同一性,至少约80%同一性,至少约90同一性,至少约95%同一性,至少约98%同一性,至少约99%同一性,至少约99.5%同一性,至少约99.9%同一性。在一些实施方式中,提供了dCas9的变体(例如,NCBI参考序列:NC_017053.1的变体),其氨基酸序列比NC_017053.1短或长约5个氨基酸、约10个氨基酸、约10个氨基酸、15个氨基酸、约20个氨基酸、约25个氨基酸、约30个氨基酸、约40个氨基酸、约50个氨基酸、约75个氨基酸、约100个氨基酸或更多。
在一些实施方式中,本文提供的进化的碱基编辑器包含Cas9蛋白的全长氨基酸序列,例如本文提供的Cas9序列之一。然而,在其他实施方式中,本文提供的融合蛋白不包含全长Cas9序列,而仅包含其片段。例如,在一些实施方式中,本文提供的Cas9融合蛋白包含Cas9片段,其中该片段结合crRNA和tracrRNA或sgRNA,但不包含功能性核酸酶结构域,例如,其中仅包含截短形式的核酸酶结构域或根本没有核酸酶结构域。本文提供了合适的Cas9结构域和Cas9片段的示例性氨基酸序列,并且Cas9结构域和片段的其他合适的序列对本领域技术人员而言是显而易见的。
应理解包括其变体和同源物在内的其他Cas9蛋白(例如,核酸酶死亡的Cas9(dCas9),Cas9切口酶(nCas9)或核酸酶活性Cas9)在本公开的范围内。示例性的Cas9蛋白包括但不限于以下提供的那些。在一些实施方式中,Cas9蛋白是核酸酶死亡的Cas9(dCas9)。在一些实施方式中,dCas9包含氨基酸序列(SEQ ID NO:32)。在一些实施方式中,Cas9蛋白是Cas9切口酶(nCas9)。
在某些实施方式中,本发明的进化的碱基编辑器可包括催化失活的Cas9(dCas9),其具有以下参考序列:
DKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD(SEQ ID NO:32)或其已使用本文所述的连续进化过程(例如,PACE)进化的进化变体。
在其他实施方式中,进化的碱基编辑器可包含如下的Cas9切口酶(nCas9):其包含与如下的氨基酸序列具有至少80%、85%、90%、95%、98%或99%同一性的氨基酸序列:
DKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD(SEQ ID NO:9),并且可为其进化形式。
在仍然其他实施方式中,进化的碱基编辑器可包含如下的催化活性的Cas9:其与如下的氨基酸序列具有至少80%、85%、90%、95%、98%或99%的同一性:
DKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD(SEQ ID NO:33)。
在一些实施方式中,Cas部分是指来自古细菌(例如,纳古菌)的Cas9或Cas9同源物,其构成单细胞原核生物微生物的结构域和界(kingdom)。在一些实施方式中,Cas9是指CasX或CasY,其已在例如Burstein et al.,“New CRISPR–Cas systems fromuncultivated microbes.”Cell Res.2017 Feb 21.doi:10.1038/cr.2017.21中进行了描述,该文献的全部内容通过引用并入本文。使用基因组分辨的宏基因组学,鉴定了许多CRISPR–Cas系统,包括生命古细菌界中首次报道的Cas9。这种差异化的Cas9蛋白是作为主动CRISPR–Cas系统的一部分在研究较少的纳古菌中发现的。在细菌中,发现了两个先前未知的系统,即CRISPR–CasX和CRISPR–CasY,这是迄今为止发现的最紧凑的系统。在一些实施方式中,Cas9是指CasX或CasX的变体。在一些实施方式中,Cas9是指CasY或CasY的变体。应当理解,其他RNA引导的DNA结合蛋白可以用作核酸可编程DNA结合蛋白(napDNAbp),并且在本公开的范围内。
在一些实施方式中,Cas9部分是本文提供的任何融合蛋白的核酸可编程DNA结合蛋白(napDNAbp),可以是CasX或CasY蛋白。在一些实施方式中,napDNAbp是CasX蛋白。在一些实施方式中,napDNAbp是CasY蛋白。在一些实施方式中,napDNAbp包含与与天然存在的CasX或CasY蛋白具有至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%或至少99.5%同一性的氨基酸序列。在一些实施方式中,napDNAbp是天然存在的CasX或CasY蛋白。在一些实施方式中,napDNAbp包含与野生型Cas部分或本文提供的任何Cas部分具有至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%或至少99.5%同一性的氨基酸序列。
在多个实施方式中,核酸可编程DNA结合蛋白包括但不限于Cas9(例如,dCas9和nCas9)、CasX、CasY、Cpf1、C2c1、C2c2、C2C3和Argonaute。具有与Cas9不同的PAM特异性的核酸可编程DNA结合蛋白的一个例子是来自Prevotella和Francisella 1(Cpf1)的成簇的规则间隔的短回文重复序列。与Cas9相似,Cpf1也是2类CRISPR效应子。已经显示Cpf1介导具有不同于Cas9的特征的强大的DNA干扰。Cpf1是一种缺少tracrRNA的RNA向导的内切核酸酶,它利用了富含T的前间隔序列相邻基序(TTN、TTTN或YTN)。此外,Cpf1通过交错的DNA双链断裂来切割DNA。在16个Cpf1家族蛋白中,来自Acidaminococcus和Lachnospiraceae的两种酶显示在人类细胞中具有有效的基因组编辑活性。Cpf1蛋白在本领域中是已知的,并且先前已经进行了描述,例如Yamano et al.,“Crystal structure of Cpf1 in complexwith guide RNA and target DNA.”Cell(165)2016,p.949-962;其全部内容通过引用结合于此。
在本发明的组合物和方法中还可使用的是无核酸酶活性的Cpf1(dCpf1)变体,其可用作向导核苷酸序列-可编程DNA-结合蛋白质结构域。Cpf1蛋白具有RuvC样核酸内切酶结构域,其类似于Cas9的RuvC结构域,但不具有HNH核酸内切酶结构域,并且Cpf1的N-末端不具备Cas9的α-螺旋识别页。在Zetsche et al.,Cell,163,759–771,2015(其通过引用并入本文)中还显示,Cpf1的RuvC样结构域负责切割DNA双链,RuvC样结构域的失活使Cpf1核酸酶活性失活。例如,对应于Francisella novicida Cpf1中的D917A、E1006A或D1255A的突变使Cpf1核酸酶活性失活。在一些实施方式中,本公开的dCpf1包含对应于SEQ ID NO:34中的D917A、E1006A、D1255A、D917A/E1006A、D917A/D1255A、E1006A/D1255A或D917A/E1006A/D1255A的突变。应理解,根据本公开可使用使Cpf1的RuvC结构域失活的任何突变,例如,取代突变、插入或缺失。
在一些实施方式中,本文提供的任何融合蛋白的核酸可编程DNA结合蛋白(napDNAbp)可为Cpf1蛋白。在一些实施方式中,Cpf1蛋白是Cpf1切口酶(nCpf1)。在一些实施方式中,Cpf1蛋白是核酸酶失活的Cpf1(dCpf1)。在一些实施方式中,Cpf1、nCpf1或dCpf1包含与SEQ ID NOs:34-41中任一个具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%同一性的氨基酸序列。在一些实施方式中,dCpf1包含如下的氨基酸序列,其与SEQ ID NOs:34-41中任一个具有与至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%同一性,并且包含对应于SEQ IDNO:34中的D917A、E1006A、D1255A、D917A/E1006A、D917A/D1255A、E1006A/D1255A或D917A/E1006A/D1255A的突变。应意识到,根据本公开也可使用来自其他细菌物种的Cpf1。
野生型Francisella novicida Cpf1(SEQ ID NO:34)(D917、E1006和D1255被加粗和下划线)
Figure BDA0002426427270000791
Figure BDA0002426427270000801
Francisella novicida Cpf1 D917A(SEQ ID NO:35)(A917、E1006和D1255被加粗和加下划线)
Figure BDA0002426427270000802
Figure BDA0002426427270000811
Francisella novicida Cpf1 E1006A(SEQ ID NO:36)(D917,A1006,和D1255被加粗和加下划线)
Figure BDA0002426427270000812
Figure BDA0002426427270000821
Francisella novicida Cpf1 D1255A(SEQ ID NO:37)(D917,E1006,和A1255被加粗和加下划线)
Figure BDA0002426427270000822
Figure BDA0002426427270000831
Francisella novicida Cpf1 D917A/E1006A(SEQ ID NO:38)(A917,A1006,和D1255被加粗和加下划线)
Figure BDA0002426427270000832
Figure BDA0002426427270000841
Francisella novicida Cpf1 D917A/D1255A(SEQ ID NO:39)(A917,E1006,和A1255被加粗和加下划线)
Figure BDA0002426427270000842
Figure BDA0002426427270000851
Francisella novicida Cpf1 E1006A/D1255A(SEQ ID NO:40)(D917,A1006,和A1255被加粗和加下划线)
Figure BDA0002426427270000852
Figure BDA0002426427270000861
Francisella novicida Cpf1 D917A/E1006A/D1255A(SEQ ID NO:41)(A917,A1006,和A1255被加粗和加下划线)
Figure BDA0002426427270000862
Figure BDA0002426427270000871
在一些实施方式中,核酸可编程DNA结合蛋白(napDNAbp)是不需要规范(NGG)PAM序列的核酸可编程DNA结合蛋白。在一些实施方式中,napDNAbp是精氨酸蛋白。这样的核酸可编程DNA结合蛋白的一个示例是来自格雷特氏杆菌(NgAgo)的Argonaute蛋白。NgAgo是ssDNA向导的核酸内切酶。NgAgo结合约24个核苷酸的5'磷酸化ssDNA(gDNA),将其指引至其靶位点,并使gDNA位点的DNA双链断裂。与Cas9相比,NgAgo-gDNA系统不需要前间隔序列基序(PAM)。使用核酸酶失活的NgAgo(dNgAgo)可以大大扩展可被靶向的碱基。NgAgo的表征和用途已在Gao et al.,Nat Biotechnol.,2016Jul;34(7):768-73.PubMed PMID:27136078;Swarts et al.,Nature.507(7491)(2014):258-61;and Swarts et al.,Nucleic AcidsRes.43(10)(2015):5120-9,其每一个均通过引用并入本文。在SEQ ID NO:42中提供了格氏古细菌Argonaute的序列。
野生型Natronobacterium gregoryi Argonaute(SEQ ID NO:42)
MTVIDLDSTTTADELTSGHTYDISVTLTGVYDNTDEQHPRMSLAFEQDNGERRYITLWKNTTPKDVFTYDYATGSTYIFTNIDYEVKDGYENLTATYQTTVENATAQEVGTTDEDETFAGGEPLDHHLDDALNETPDDAETESDSGHVMTSFASRDQLPEWTLHTYTLTATDGAKTDTEYARRTLAYTVRQELYTDHDAAPVATDGLMLLTPEPLGETPLDLDCGVRVEADETRTLDYTTAKDRLLARELVEEGLKRSLWDDYLVRGIDEVLSKEPVLTCDEFDLHERYDLSVEVGHSGRAYLHINFRHRFVPKLTLADIDDDNIYPGLRVKTTYRPRRGHIVWGLRDECATDSLNTLGNQSVVAYHRNNQTPINTDLLDAIEAADRRVVETRRQGHGDDAVSFPQELLAVEPNTHQIKQFASDGFHQQARSKTRLSASRCSEKAQAFAERLDPVRLNGSTVEFSSEFFTGNNEQQLRLLYENGESVLTFRDGARGAHPDETFSKGIVNPPESFEVAVVLPEQQADTCKAQWDTMADLLNQAGAPPTRSETVQYDAFSSPESISLNVAGAIDPSEVDAAFVVLPPDQEGFADLASPTETYDELKKALANMGIYSQMAYFDRFRDAKIFYTRNVALGLLAAAGGVAFTTEHAMPGDADMFIGIDVSRSYPEDGASGQINIAATATAVYKDGTILGHSSTRPQLGEKLQSTDVRDIMKNAILGYQQVTGESPTHIVIHRDGFMNEDLDPATEFLNEQGVEYDIVEIRKQPQTRLLAVSDVQYDTPVKSIAAINQNEPRATVATFGAPEYLATRDGGGLPRPIQIERVAGETDIETLTRQVYLLSQSHIQVHNSTARLPITTAYADQASTHATKGYLVQTGAFESNVGFL(SEQ ID NO:42)
在一些实施方式中,napDNAbp是Argonaute蛋白的原核生物同源物。Argonaute蛋白的原核生物同源物是已知的,并且例如以下中所述:Makarova K.,et al.,“Prokaryotichomologs of Argonaute proteins are predicted to function as key components ofa novel system of defense against mobile genetic elements”,Biol Direct.2009Aug 25;4:29.doi:10.1186/1745-6150-4-29,其全部内容通过引用并入本文。在一些实施方式中,napDNAbp是Marinitoga piezophila Argunaute Argunaute(MpAgo)蛋白。与CRISPR相关的Marinitoga piezophila Argunaute(MpAgo)蛋白使用5'磷酸化的向导切割单链靶序列。所有已知的Argonautes都使用5'向导。MpAgo-RNA复合物的晶体结构显示了向导链结合位点,其中包含可阻断5'磷酸相互作用的残基。该数据表明对5'-羟基化向导具有非规范特异性的Argonaute亚类的进化。参见,例如,Kaya et al.,“A bacterialArgonaute with noncanonical guide RNA specificity”,Proc Natl Acad Sci U SA.2016 Apr 12;113(15):4057-62,其全部内容通过引用并入本文。)应当理解,可以使用其他argonaute蛋白,并且它们在本公开的范围内。
在一些实施方式中,核酸DNA结合蛋白(napDNAbp)是微生物CRISPR-Cas系统的单个效应子。微生物CRISPR-Cas系统的单个效应子包括但不限于Cas9、Cpf1、C2c1、C2c2和C2c3。通常,微生物CRISPR-Cas系统分为1类和2类系统。1类系统具有多亚单元效应子复合物,而2类系统具有单个蛋白质效应子。例如,Cas9和Cpf1是2类效应子。此外,对于Cas9和Cpf1,Shmakov et al.,“Discovery and Functional Characterization of DiverseClass 2 CRISPR Cas Systems”,Mol.Cell,2015 Nov 5;60(3):385–397已经描述了三个不同的2类CRISPR-Cas系统(C2c1、C2c2和C2c3),该文献的全部内容通过引用并入本文。两个系统C2c1和C2c3的效应子包含与Cpf1相关的RuvC样核酸内切酶结构域。第三个系统,C2c2包含一个带有两个设想的HEPN核糖核酸酶结构域的效应子。成熟的CRISPR RNA的产生与tracrRNA无关,与C2c1产生的CRISPR RNA不同。C2c1取决于用于DNA切割的CRISPR RNA和tracrRNA。细菌C2c2显示具有用于CRISPR RNA成熟的独特的核糖核酸酶活性,不同于其RNA激活的单链RNA降解活性。这些核糖核酸酶的功能彼此不同并且不同于Cpf1的CRISPR RNA加工行为。参见,例如,East-Seletsky,et al.,“Two distinct RNase activities ofCRISPR-C2c2 enable guide-RNA processing and RNA detection”,Nature,2016 Oct13;538(7624):270-273,其全部内容通过引用在此并入。Leptotrichia shahii中的C2c2体外生化分析表明,C2c2是由单个CRISPR RNA引导的,并且可以被编码为切割携带互补前间隔序列的ssRNA靶。两个保守的HEPN结构域中的催化性残基介导切割。催化性残基的突变产生催化失活的RNA-结合蛋白。参见例如,Abudayyeh et al.,“C2c2 is a single-component programmable RNA-guided RNA-targeting CRISPR effector”,Science,2016Aug 5;353(6299),其全部内容在此引用作为参考。
已经报道了酸脂环酸芽孢杆菌C2c1(AacC2c1)的晶体结构与嵌合单分子向导RNA(sgRNA)复合。参见例如,Liu et al.,“C2c1-sgRNA Complex Structure Reveals RNA-Guided DNA Cleavage Mechanism”,Mol.Cell,2017Jan 19;65(2):310-322,其全部内容通过引用结合于此。还已经报道了酸热脂环酸杆菌C2c1与靶DNA结合为三元复合物的晶体结构。参见例如,Yang et al.,“PAM-dependent Target DNA Recognition and Cleavage byC2C1 CRISPR-Cas endonuclease”,Cell,2016 Dec 15;167(7):1814-1828,其全部内容通过引用并入本文。具有靶和非靶DNA链的AacC2c1具有催化能力的构象已被捕获,独立地位于单个RuvC催化口袋中,C2c1介导的切割导致靶DNA的交错的七核苷酸断裂。C2c1三元复合物与先前鉴定的Cas9和Cpf1对应物之间的结构比较证明了CRISPR-Cas9系统使用的机制的多样性。
在一些实施方式中,本文提供的任何融合蛋白的核酸可编程DNA结合蛋白(napDNAbp)可以是C2cl、C2c2或C2c3蛋白。在一些实施方式中,napDNAbp是C2cl蛋白。在一些实施方式中,napDNAbp是C2c2蛋白。在一些实施方式中,napDNAbp是C2c3蛋白。在一些实施方式中,napDNAbp包含如下的氨基酸序列:其与天然存在的C2cl,C2c2或C2c3蛋白具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、96%、至少97%、至少98%、至少99%或至少99.5%同一性。在一些实施方式中,napDNAbp是天然存在的C2c1、C2c2或C2c3蛋白。在一些实施方式中,napDNAbp包含如下的氨基酸序列:其与SEQ ID NO:43或44中的任何一个具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%同一性。在一些实施方式中,napDNAbp包含SEQ ID NO:43或44中任何一个的氨基酸序列。应当理解,根据本公开,也可以使用来自其他细菌物种的C2c1、C2c2或C2c3。
C2c1(uniprot.org/uniprot/T0D7A2#)
sp|T0D7A2|C2C1_ALIAG CRISPR-相关的核酸内切酶C2c1 OS=Alicyclobacillusacidoterrestris(菌株ATCC 49025/DSM 3922/CIP106132/NCIMB 13137/GD3B)GN=c2c1PE=1 SV=1
MAVKSIKVKLRLDDMPEIRAGLWKLHKEVNAGVRYYTEWLSLLRQENLYRRSPNGDGEQECDKTAEECKAELLERLRARQVENGHRGPAGSDDELLQLARQLYELLVPQAIGAKGDAQQIARKFLSPLADKDAVGGLGIAKAGNKPRWVRMREAGEPGWEEEKEKAETRKSADRTADVLRALADFGLKPLMRVYTDSEMSSVEWKPLRKGQAVRTWDRDMFQQAIERMMSWESWNQRVGQEYAKLVEQKNRFEQKNFVGQEHLVHLVNQLQQDMKEASPGLESKEQTAHYVTGRALRGSDKVFEKWGKLAPDAPFDLYDAEIKNVQRRNTRRFGSHDLFAKLAEPEYQALWREDASFLTRYAVYNSILRKLNHAKMFATFTLPDATAHPIWTRFDKLGGNLHQYTFLFNEFGERRHAIRFHKLLKVENGVAREVDDVTVPISMSEQLDNLLPRDPNEPIALYFRDYGAEQHFTGEFGGAKIQCRRDQLAHMHRRRGARDVYLNVSVRVQSQSEARGERRPPYAAVFRLVGDNHRAFVHFDKLSDYLAEHPDDGKLGSEGLLSGLRVMSVDLGLRTSASISVFRVARKDELKPNSKGRVPFFFPIKGNDNLVAVHERSQLLKLPGETESKDLRAIREERQRTLRQLRTQLAYLRLLVRCGSEDVGRRERSWAKLIEQPVDAANHMTPDWREAFENELQKLKSLHGICSDKEWMDAVYESVRRVWRHMGKQVRDWRKDVRSGERPKIRGYAKDVVGGNSIEQIEYLERQYKFLKSWSFFGKVSGQVIRAEKGSRFAITLREHIDHAKEDRLKKLADRIIMEALGYVYALDERGKGKWVAKYPPCQLILLEELSEYQFNNDRPPSENNQLMQWSHRGVFQELINQAQVHDLLVGTMYAAFSSRFDARTGAPGIRCRRVPARCTQEHNPEPFPWWLNKFVVEHTLDACPLRADDLIPTGEGEIFVSPFSAEEGDFHQIHADLNAAQNLQQRLWSDFDISQIRLRCDWGEVDGELVLIPRLTGKRTADSYSNKVFYTNTGVTYYERERGKKRRKVFAQEKLSEEEAELLVEADEAREKSVVLMRDPSGIINRGNWTRQKEFWSMVNQRIEGYLVKQIRSRVPLQDSACENTGDI(SEQID NO:43)
C2c2(uniprot.org/uniprot/P0DOC6)
>sp|P0DOC6|C2C2_LEPSD CRISPR-相关的核糖核酸内切酶C2c2OS=Leptotrichiashahii(strain DSM 19757/CCUG 47503/CIP 107916/JCM16776/LB37)GN=c2c2 PE=1 SV=1
MGNLFGHKRWYEVRDKKDFKIKRKVKVKRNYDGNKYILNINENNNKEKIDNNKFIRKYINYKKNDNILKEFTRKFHAGNILFKLKGKEGIIRIENNDDFLETEEVVLYIEAYGKSEKLKALGITKKKIIDEAIRQGITKDDKKIEIKRQENEEEIEIDIRDEYTNKTLNDCSIILRIIENDELETKKSIYEIFKNINMSLYKIIEKIIENETEKVFENRYYEEHLREKLLKDDKIDVILTNFMEIREKIKSNLEILGFVKFYLNVGGDKKKSKNKKMLVEKILNINVDLTVEDIADFVIKELEFWNITKRIEKVKKVNNEFLEKRRNRTYIKSYVLLDKHEKFKIERENKKDKIVKFFVENIKNNSIKEKIEKILAEFKIDELIKKLEKELKKGNCDTEIFGIFKKHYKVNFDSKKFSKKSDEEKELYKIIYRYLKGRIEKILVNEQKVRLKKMEKIEIEKILNESILSEKILKRVKQYTLEHIMYLGKLRHNDIDMTTVNTDDFSRLHAKEELDLELITFFASTNMELNKIFSRENINNDENIDFFGGDREKNYVLDKKILNSKIKIIRDLDFIDNKNNITNNFIRKFTKIGTNERNRILHAISKERDLQGTQDDYNKVINIIQNLKISDEEVSKALNLDVVFKDKKNIITKINDIKISEENNNDIKYLPSFSKVLPEILNLYRNNPKNEPFDTIETEKIVLNALIYVNKELYKKLILEDDLEENESKNIFLQELKKTLGNIDEIDENIIENYYKNAQISASKGNNKAIKKYQKKVIECYIGYLRKNYEELFDFSDFKMNIQEIKKQIKDINDNKTYERITVKTSDKTIVINDDFEYIISIFALLNSNAVINKIRNRFFATSVWLNTSEYQNIIDILDEIMQLNTLRNECITENWNLNLEEFIQKMKEIEKDFDDFKIQTKKEIFNNYYEDIKNNILTEFKDDINGCDVLEKKLEKIVIFDDETKFEIDKKSNILQDEQRKLSNINKKDLKKKVDQYIKDKDQEIKSKILCRIIFNSDFLKKYKKEIDNLIEDMESENENKFQEIYYPKERKNELYIYKKNLFLNIGNPNFDKIYGLISNDIKMADAKFLFNIDGKNIRKNKISEIDAILKNLNDKLNGYSKEYKEKYIKKLKENDDFFAKNIQNKNYKSFEKDYNRVSEYKKIRDLVEFNYLNKIESYLIDINWKLAIQMARFERDMHYIVNGLRELGIIKLSGYNTGISRAYPKRNGSDGFYTTTAYYKFFDEESYKKFEKICYGFGIDLSENSEINKPENESIRNYISHFYIVRNPFADYSIAEQIDRVSNLLSYSTRYNNSTYASVFEVFKKDVNLDYDELKKKFKLIGNNDILERLMKPKKVSVLELESYNSDYIKNLIIELLTKIENTNDTL(SEQ ID NO:44)
本公开的一些方面提供了具有不同PAM特异性的Cas9结构域。通常,Cas9蛋白,例如化脓链球菌的Cas9(spCas9),需要规范的NGG PAM序列才能结合特定的核酸区域。这可能会限制编辑基因组中所需碱基的能力。在一些实施方式中,本文提供的碱基编辑融合蛋白可能需要放置在精确的位置,例如,将靶碱基放置在4个碱基区域(例如,“脱氨化窗口”)内,其为PAM上游的约15个碱基。参见Komor,A.C.,et al.,“Programmable editing of atarget base in genomic DNA without double-stranded DNA cleavage”Nature 533,420-424(2016),其全部内容通过引用结合于此。因此,在一些实施方式中,本文提供的任何融合蛋白可包含能够结合不包含规范(例如NGG)PAM序列的核苷酸序列的Cas9结构域。结合非规范PAM序列的Cas9结构域已经在本领域中描述,并且对本领域技术人员而言是显而易见的。例如,在Kleinstiver,B.P.,et al.,“Engineered CRISPR-Cas9 nucleases withaltered PAM specificities”Nature 523,481-485(2015);and Kleinstiver,B.P.,etal.,“Broadening the targeting range of金黄色葡萄球菌CRISPR-Cas9 by modifyingPAM recognition”Nature Biotechnology 33,1293-1298(2015)中已经描述了结合非经典PAM序列的Cas9结构域,上述每个申请的全部内容通过引用合并于此。
在一些实施方式中,Cas9结构域是来自金黄色葡萄球菌的Cas9结构域(SaCas9)。在一些实施方式中,SaCas9结构域是核酸酶活性SaCas9,核酸酶失活的SaCas9(SaCas9d)或SaCas9切口酶(SaCas9n)。在一些实施方式中,SaCas9包含以下氨基酸序列:SEQ ID NO:45。在一些实施方式中,SaCas9包含SEQ ID NO:45的N579X突变,其中X是除N之外的任意氨基酸。在一些实施方式中,SaCas9包含SEQ ID NO:45的N579A突变。在一些实施方式中,SaCas9结构域、SaCas9d结构域或SaCas9n结构域可结合到非规范PAM的核酸序列。在一些实施方式中,SaCas9结构域、SaCas9d结构域或the SaCas9n结构域可结合到具有NNGRRT PAM序列的核酸序列。
在一些实施方式中,本文提供的任何融合蛋白的Cas9结构域包含与SEQ ID NO:45具有至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%同一性的氨基酸序列。在一些实施方式中,本文提供的任何融合蛋白的Cas9结构域包含SEQ ID NOs:45的氨基酸序列。在一些实施方式中,本文提供的任何融合蛋白的Cas9结构域由SEQ ID NO:45的氨基酸序列组成。
示例性的SaCas9氨基酸序列是:
Figure BDA0002426427270000931
Figure BDA0002426427270000941
(B)脱氨酶结构域
在多个实施方式中,本文提供的进化的碱基编辑器包含一个或多个核酸效应子结构域(例如,胞苷脱氨酶),其可任选地使用如本文所述的连续进化过程(例如,PACE)来进化。
在多个实施方式中,核酸效应子结构域可为能够修饰DNA或RNA分子的任何蛋白质、酶或多肽(或其功能片段)。核碱基修饰部分是非天然存在的或可为重组的。例如,核碱基修饰部分可包括一个或多个DNA修复酶,例如,和参与以下的酶或蛋白质:碱基删除修复(BER),核苷酸删除修复(NER),同源依赖重组修复(HR),非同源末端接合修复(NHEJ),微同源末端接合修复(MMEJ),错配修复(MMR),直接逆向修复或其他已知DNA修复途径。核碱基修饰部分可具有一种或多种类型的酶活性,包括,但不限于核酸内切酶活性,聚合酶活性,脂酶活性,复制活性,纠正活性。核碱基修饰部分还可包含DNA或RNA-修饰酶和/或诱变酶,诸如,DNA甲基化酶和脱氨化酶(即,脱氨酶,包括胞苷脱氨酶和腺苷脱氨酶,所有均在上文中定义),其使核碱基脱氨基,在一些情况中通过正常细胞的DNA修复和复制过程来诱导纠正。“核酸效应子结构域”(例如,DNA效应子结构域或RNA效应子结构域)如本文所用也可以指能够第核酸(例如,DNA或RNA)做一个或多个修饰(例如,胞苷残基的脱氨化)的蛋白质或酶。示例性核酸编辑结构域包括,但不限于脱氨酶、核酸酶、切口酶、重组酶、甲基转移酶、甲基化酶、乙酰化酶、乙酰转移酶、转录激活因子或转录抑制剂的结构域。在一些实施方式中,核酸编辑结构域是脱氨酶(例如,胞苷脱氨酶,诸如APOBEC或AID脱氨酶)或其进化形式。
在一些实施方式中,核酸编辑结构域包含a脱氨酶。在一些实施方式中,脱氨酶是胞苷脱氨酶。在其他实施方式中,脱氨酶是腺苷脱氨酶。在一些实施方式中,脱氨酶是载脂蛋白B mRNA-编辑复合(APOBEC)家族脱氨酶。在一些实施方式中,脱氨酶是APOBEC1脱氨酶,APOBEC2脱氨酶,APOBEC3A脱氨酶,APOBEC3B脱氨酶,APOBEC3C脱氨酶,APOBEC3D脱氨酶,APOBEC3F脱氨酶,APOBEC3G脱氨酶,APOBEC3H脱氨酶或APOBEC4脱氨酶。在一些实施方式中,脱氨酶是激活-诱导的脱氨酶(AID)。在一些实施方式中,脱氨酶是Lamprey CDA1(pmCDA1)脱氨酶。在一些实施方式中,脱氨酶来自人,黑猩猩,大猩猩,猴子,牛,犬,大鼠或小鼠。在一些实施方式中,脱氨酶来自人。在一些实施方式中,脱氨酶来自大鼠。在一些实施方式中,脱氨酶是人APOBEC1脱氨酶。在一些实施方式中,脱氨酶是pmCDA1。在一些实施方式中,脱氨酶是人APOBEC3G。在一些实施方式中,脱氨酶是人APOBEC3G变体。在一些实施方式中,脱氨酶与本文所阐述的任何一个APOBEC氨基酸序列具有至少80%、至少85%、至少90%、至少92%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%同一性。
在下文中提供了一些示例性的合适的核酸编辑结构域,例如,能与根据本公开多个方面的Cas9结构域融合的脱氨酶和脱氨酶结构域。应理解,在一些实施方式中,可使用相应序列的活性结构域,例如,没有定位信号的结构域(核定位序列,无核输出信号、胞浆定位信号)。
人AID:
Figure BDA0002426427270000951
(下划线:核定位序列;双下划线:核输出信号)
小鼠AID:
Figure BDA0002426427270000952
(下划线:核定位序列;双下划线:核输出信号)
犬AID:
Figure BDA0002426427270000953
Figure BDA0002426427270000961
(下划线:核定位序列;双下划线:核输出信号)
牛AID:
Figure BDA0002426427270000962
(下划线:核定位序列;双下划线:核输出信号)
大鼠AID:
Figure BDA0002426427270000963
(下划线:核定位序列;双下划线:核输出信号)
小鼠APOBEC-3:
Figure BDA0002426427270000964
(斜体:核酸编辑结构域)
大鼠APOBEC-3:
Figure BDA0002426427270000971
(斜体:核酸编辑结构域)
猕猴APOBEC-3G:
Figure BDA0002426427270000972
(斜体:核酸编辑结构域;下划线:胞浆定位信号)
黑猩猩APOBEC-3G:
Figure BDA0002426427270000973
(斜体:核酸编辑结构域;下划线:胞浆定位信号)
绿猴APOBEC-3G:
Figure BDA0002426427270000981
(斜体:核酸编辑结构域;下划线:胞浆定位信号)
人APOBEC-3G:
Figure BDA0002426427270000982
(斜体:核酸编辑结构域;下划线:胞浆定位信号)
人APOBEC-3F:
Figure BDA0002426427270000983
(斜体:核酸编辑结构域)
人APOBEC-3B:
Figure BDA0002426427270000991
(斜体:核酸编辑结构域)
大鼠APOBEC-3B:
Figure BDA0002426427270000992
牛APOBEC-3B:
DGWEVAFRSGTVLKAGVLGVSMTEGWAGSGHPGQGACVWTPGTRNTMNLLREVLFKQQFGNQPRVPAPYYRRKTYLCYQLKQRNDLTLDRGCFRNKKQRHAEIRFIDKINSLDLNPSQSYKIICYITWSPCPNCANELVNFITRNNHLKLEIFASRLYFHWIKSFKMGLQDLQNAGISVAVMTHTEFEDCWEQFVDNQSRPFQPWDKLEQYSASIRRRLQRILTAPI(SEQ ID NO:61)
黑猩猩APOBEC-3B:
MNPQIRNPMEWMYQRTFYYNFENEPILYGRSYTWLCYEVKIRRGHSNLLWDTGVFRGQMYSQPEHHAEMCFLSWFCGNQLSAYKCFQITWFVSWTPCPDCVAKLAKFLAEHPNVTLTISAARLYYYWERDYRRALCRLSQAGARVKIMDDEEFAYCWENFVYNEGQPFMPWYKFDDNYAFLHRTLKEIIRHLMDPDTFTFNFNNDPLVLRRHQTYLCYEVERLDNGTWVLMDQHMGFLCNEAKNLLCGFYGRHAELRFLDLVPSLQLDPAQIYRVTWFISWSPCFSWGCAGQVRAFLQENTHVRLRIFAARIYDYDPLYKEALQMLRDAGAQVSIMTYDEFEYCWDTFVYRQGCPFQPWDGLEEHSQALSGRLRAILQVRASSLCMVPHRPPPPPQSPGPCLPLCSEPPLGSLLPTGRPAPSLPFLLTASFSFPPPASLPPLPSLSLSPGHLPVPSFHSLTSCSIQPPCSSRIRETEGWASVSKEGRDLG(SEQ ID NO:62)
人APOBEC-3C:
Figure BDA0002426427270001001
(斜体:核酸编辑结构域)
大猩猩APOBEC3C:
Figure BDA0002426427270001002
(斜体:核酸编辑结构域)
人APOBEC-3A:
Figure BDA0002426427270001003
(斜体:核酸编辑结构域)
猕猴APOBEC-3A:
Figure BDA0002426427270001004
Figure BDA0002426427270001011
(斜体:核酸编辑结构域)
牛APOBEC-3A:
Figure BDA0002426427270001012
(斜体:核酸编辑结构域)
人APOBEC-3H:
Figure BDA0002426427270001013
(斜体:核酸编辑结构域)
猕猴APOBEC-3H:
Figure BDA0002426427270001014
人APOBEC-3D:
Figure BDA0002426427270001015
Figure BDA0002426427270001021
(斜体:核酸编辑结构域)
人APOBEC-1:
Figure BDA0002426427270001022
小鼠APOBEC-1:
MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSVWRHTSQNTSNHVEVNFLEKFTTERYFRPNTRCSITWFLSWSPCGECSRAITEFLSRHPYVTLFIYIARLYHHTDQRNRQGLRDLISSGVTIQIMTEQEYCYCWRNFVNYPPSNEAYWPRYPHLWVKLYVLELYCIILGLPPCLKILRRKQPQLTFFTITLQTCHYQRIPPHLLWATGLK(SEQ ID NO:72)
大鼠APOBEC-1:
MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSIWRHTSQNTNKHVEVNFIEKFTTERYFCPNTRCSITWFLSWSPCGECSRAITEFLSRYPHVTLFIYIARLYHHADPRNRQGLRDLISSGVTIQIMTEQESGYCWRNFVNYSPSNEAHWPRYPHLWVRLYVLELYCIILGLPPCLNILRRKQPQLTFFTIALQSCHYQRLPPHILWATGLK(SEQ ID NO:73)
人APOBEC-2:
MAQKEEAAVATEAASQNGEDLENLDDPEKLKELIELPPFEIVTGERLPANFFKFQFRNVEYSSGRNKTFLCYVVEAQGKGGQVQASRGYLEDEHAAAHAEEAFFNTILPAFDPALRYNVTWYVSSSPCAACADRIIKTLSKTKNLRLLILVGRLFMWEEPEIQAALKKLKEAGCKLRIMKPQDFEYVWQNFVEQEEGESKAFQPWEDIQENFLYYEEKLADILK(SEQ ID NO:74)
小鼠APOBEC-2:
MAQKEEAAEAAAPASQNGDDLENLEDPEKLKELIDLPPFEIVTGVRLPVNFFKFQFRNVEYSSGRNKTFLCYVVEVQSKGGQAQATQGYLEDEHAGAHAEEAFFNTILPAFDPALKYNVTWYVSSSPCAACADRILKTLSKTKNLRLLILVSRLFMWEEPEVQAALKKLKEAGCKLRIMKPQDFEYIWQNFVEQEEGESKAFEPWEDIQENFLYYEEKLADILK(SEQ ID NO:75)
大鼠APOBEC-2:
MAQKEEAAEAAAPASQNGDDLENLEDPEKLKELIDLPPFEIVTGVRLPVNFFKFQFRNVEYSSGRNKTFLCYVVEAQSKGGQVQATQGYLEDEHAGAHAEEAFFNTILPAFDPALKYNVTWYVSSSPCAACADRILKTLSKTKNLRLLILVSRLFMWEEPEVQAALKKLKEAGCKLRIMKPQDFEYLWQNFVEQEEGESKAFEPWEDIQENFLYYEEKLADILK(SEQ ID NO:76)
牛APOBEC-2:
MAQKEEAAAAAEPASQNGEEVENLEDPEKLKELIELPPFEIVTGERLPAHYFKFQFRNVEYSSGRNKTFLCYVVEAQSKGGQVQASRGYLEDEHATNHAEEAFFNSIMPTFDPALRYMVTWYVSSSPCAACADRIVKTLNKTKNLRLLILVGRLFMWEEPEIQAALRKLKEAGCRLRIMKPQDFEYIWQNFVEQEEGESKAFEPWEDIQENFLYYEEKLADILK(SEQ ID NO:77)
海七鳃鳗CDA1(pmCDA1)
MTDAEYVRIHEKLDIYTFKKQFFNNKKSVSHRCYVLFELKRRGERRACFWGYAVNKPQSGTERGIHAEIFSIRKVEEYLRDNPGQFTINWYSSWSPCADCAEKILEWYNQELRGNGHTLKIWACKLYYEKNARNQIGLWNLRDNGVGLNVMVSEHYQCCRKIFIQSSHNQLNENRWLEKTLKRAEKRRSELSIMIQVKILHTTKSPAV(SEQ ID NO:78)
人APOBEC3G D316R_D317R
MKPHFRNTVERMYRDTFSYNFYNRPILSRRNTVWLCYEVKTKGPSRPPLDAKIFRGQVYSELKYHPEMRFFHWFSKWRKLHRDQEYEVTWYISWSPCTKCTRDMATFLAEDPKVTLTIFVARLYYFWDPDYQEALRSLCQKRDGP大鼠MKIMNYDEFQHCWSKFVYSQRELFEPWNNLPKYYILLHIMLGEILRHSMDPPTFTFNFNNEPWVRGRHETYLCYEVERMHNDTWVLLNQRRGFLCNQAPHKHGFLEGRHAELCFLDVIPFWKLDLDQDYRVTCFTSWSPCFSCAQEMAKFISKNKHVSLCIFTARIYRRQGRCQEGLRTLAEAGAKISIMTYSEFKHCWDTFVDHQGCPFQPWDGLDEHSQDLSGRLRAILQNQEN(SEQ ID NO:79)
人APOBEC3G链A
MDPPTFTFNFNNEPWVRGRHETYLCYEVERMHNDTWVLLNQRRGFLCNQAPHKHGFLEGRHAELCFLDVIPFWKLDLDQDYRVTCFTSWSPCFSCAQEMAKFISKNKHVSLCIFTARIYDDQGRCQEGLRTLAEAGAKISIMTYSEFKHCWDTFVDHQGCPFQPWDGLDEHSQDLSGRLRAILQ(SEQ ID NO:80)
人APOBEC3G链A D120R_D121R
MDPPTFTFNFNNEPWVRGRHETYLCYEVERMHNDTWVLLNQRRGFLCNQAPHKHGFLEGRHAELCFLDVIPFWKLDLDQDYRVTCFTSWSPCFSCAQEMAKFISKNKHVSLCIFTARIYRRQGRCQEGLRTLAEAGAKISIMTYSEFKHCWDTFVDHQGCPFQPWDGLDEHSQDLSGRLRAILQ(SEQ ID NO:81)
前述任何DNA效应子结构域可经历如如本文所述的连续进化过程(例如,PACE。
本公开的一些方面提供了胞苷脱氨酶,其中的任何可经历如本文所述的连续进化过程(例如,PACE)。
在一些实施方式中,第二蛋白质包含核酸编辑结构域。在一些实施方式中,核酸编辑结构域可催化C至U碱基变化。在一些实施方式中,核酸编辑结构域是脱氨酶结构域。在一些实施方式中,脱氨酶是胞苷脱氨酶或胞苷脱氨酶。在一些实施方式中,脱氨酶是载脂蛋白B mRNA-编辑复合(APOBEC)家族脱氨酶。在一些实施方式中,脱氨酶是APOBEC1脱氨酶。在一些实施方式中,脱氨酶是APOBEC2脱氨酶。在一些实施方式中,脱氨酶是APOBEC3脱氨酶。在一些实施方式中,脱氨酶是APOBEC3A脱氨酶。在一些实施方式中,脱氨酶是APOBEC3B脱氨酶。在一些实施方式中,脱氨酶是APOBEC3C脱氨酶。在一些实施方式中,脱氨酶是APOBEC3D脱氨酶。在一些实施方式中,脱氨酶是APOBEC3E脱氨酶。在一些实施方式中,脱氨酶是APOBEC3F脱氨酶。在一些实施方式中,脱氨酶是APOBEC3G脱氨酶。在一些实施方式中,脱氨酶是APOBEC3H脱氨酶。在一些实施方式中,脱氨酶是APOBEC4脱氨酶。在一些实施方式中,脱氨酶是激活-诱导的脱氨酶(AID)。在一些实施方式中,脱氨酶是脊椎生物脱氨酶。在一些实施方式中,脱氨酶是无脊椎生物脱氨酶。在一些实施方式中,脱氨酶是人、黑猩猩、大猩猩、猴子、牛、犬、大鼠或小鼠脱氨酶。在一些实施方式中,脱氨酶是人脱氨酶。在一些实施方式中,脱氨酶是大鼠脱氨酶,例如,rAPOBEC1。
在一些实施方式中,核酸编辑结构域与上面所公开的脱氨酶序列中的任何一个的脱氨酶结构域具有至少80%、至少85%、至少90%、至少92%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%同一性。
本公开的一些方面基于以下认识:调节本文提供的任何融合蛋白的脱氨酶域催化活性,例如通过在脱氨酶结构域中进行点突变来影响融合蛋白(例如,碱基编辑器)的加工能力。例如,减少但不消除碱基编辑融合蛋白中脱氨酶结构域催化活性的突变可使脱氨酶结构域催化与靶残基相邻的残基脱氨化的可能性降低,从而缩小脱氨化窗口。缩小脱氨化窗口的能力可以防止与特定目标残基相邻的残基发生不希望的脱氨基,这可能会降低或防止脱靶效应。
在一些实施方式中,本文提供的任何融合蛋白包含具有降低的催化脱氨酶活性的脱氨酶结构域(例如,胞苷脱氨酶结构域)。在一些实施方式中,本文提供的任何融合蛋白包含与合适的对照物相比具有降低的催化脱氨酶活性的脱氨酶结构域(例如,胞苷脱氨酶结构域)。例如,合适的对照物可为在想脱氨酶中引入一个或多个突变之前的脱氨酶活性。在其他实施方式中,合适的对照物可为野生型脱氨酶。在一些实施方式中,合适的对照物是野生型载脂蛋白B mRNA-编辑复合(APOBEC)家族脱氨酶。在一些实施方式中,合适的对照物是APOBEC1脱氨酶、APOBEC2脱氨酶、APOBEC3A脱氨酶、APOBEC3B脱氨酶、APOBEC3C脱氨酶、APOBEC3D脱氨酶、APOBEC3F脱氨酶、APOBEC3G脱氨酶或APOBEC3H脱氨酶。在一些实施方式中,合适的对照物是激活诱导的脱氨酶(AID)。在一些实施方式中,合适的对照物是来自海七鳃鳗的胞苷脱氨酶1(pmCDA1)。在一些实施方式中,脱氨酶结构域可为与合适的对照物相比其催化脱氨酶活性降低至少1%、至少5%、至少15%、至少20%、至少25%、至少30%、至少40%、至少50%、至少60%、at lest 70%、至少80%、至少90%或至少95%的脱氨酶结构域。
胞苷脱氨酶的载脂蛋白B mRNA-编辑复合(APOBEC)家族包含其中蛋白质,其用于以受控和有利的方式启动诱变。一个家族成员,激活-诱导的胞苷脱氨酶(AID),负责通过以转录依赖性、链偏置性方式将ssDNA中的胞嘧啶转化为尿嘧啶而使抗体成熟。载脂蛋白B编辑复合3(APOBEC3)酶通过使逆转录病毒ssDNA中的胞嘧啶脱氨化为人类细胞提供了对抗特定HIV-1病毒株的保护。这些蛋白质全都需要Zn2+-配位基序(His-X-Glu-X23-26-Pro-Cys-X2-4-Cys;SEQ ID NO:82)和结合水分子以获得催化活性。Glu残基用于激活水分子形成氢氧化锌以在脱氨化反应中进行亲核攻击。每个家族成员优选在其自身特定的“热点”处脱氨化,其范围从hAID的WRC(W是A或T,R是A或G)到hAPOBEC3F的TTC。APOBEC3G催化结构域的最新晶体结构揭示了由五链β-片状核与侧翼的两个α-螺旋构成的二级结构,据信其在整个家族中都是保守的。活性中心环已被证明既负责ssDNA结合,又负责确定“热点”身份。这些酶的过表达与基因组不稳定性和癌症有关,因此突出了序列特异性靶向的重要性。
本公开的一些方面涉及如下认识:胞嘧啶脱氨酶(例如APOBEC酶)的活性可以被导向基因组DNA中的特定位点。不希望受到任何特定理论的束缚,使用Cas9作为识别剂的优点包括:(1)通过简单地改变sgRNA序列就可以轻松地改变Cas9的序列特异性;(2)Cas9通过使dsDNA变性而与其靶序列结合,从而产生单链DNA片段,因此是脱氨酶的可行底物。应当理解,其他催化结构域或来自其他脱氨基酶的催化结构域也可以用于产生与Cas9的融合蛋白,并且本公开内容不限于此。
本公开的一些方面是基于以下认识:Cas9:脱氨酶融合蛋白可以有效地使核苷酸脱氨基。鉴于本文提供的关于可被Cas9:脱氨酶融合蛋白靶向的核苷酸的结果,本领域技术人员将能够设计合适的向导RNA,以将融合蛋白靶向包含要脱氨化的核苷酸的靶序列。
在某些实施方式中,参考胞苷脱氨酶结构域包含“FERNY”多肽,其具有根据SEQ IDNO:1的氨基酸序列或与SEQ ID NO:1具有至少60%、65%、70%、75%、80%、85%、90%、95,98%、99%或99.5%同一性的氨基酸序列,如下所示:
MFERNYDPRELRKETYLLYEIKWGKSGKLWRHWCQNNRTQHAEVYFLENIFNARRFNPSTHCSITWYLSWSPCAECSQKIVDFLKEHPNVNLEIYVARLYYHEDERNRQGLRDLVNSGVTIRIMDLPDYNYCWKTFVSDQGGDEDYWPGHFAPWIKQYSLKL(SEQ ID NO:1)
在某些其他实施方式中,进化的胞苷脱氨酶结构域(即,由于本文所述的连续进化过程)包含“evoFERNY”多肽,其具有根据SEQ ID NO:5的氨基酸序列或与SEQ ID NO:5具有至少60%、65%、70%、75%、80%、85%、90%、95,98%、99%或99.5%同一性并包含H102P和D104N置换的氨基酸序列,如下所示:
Figure BDA0002426427270001071
在其他实施方式中,参考胞苷脱氨酶结构域包含“大鼠APOBEC-1”多肽,其具有根据SEQ ID NO:2的氨基酸序列或与SEQ ID NO:2具有至少60%、65%、70%、75%、80%、85%、90%、95,98%、99%或99.5%同一性的氨基酸序列,如下所示:
MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSIWRHTSQNTNKHVEVNFIEKFTTERYFCPNTRCSITWFLSWSPCGECSRAITEFLSRYPHVTLFIYIARLYHHADPRNRQGLRDLISSGVTIQIMTEQESGYCWRNFVNYSPSNEAHWPRYPHLWVRLYVLELYCIILGLPPCLNILRRKQPQLTFFTIALQSCHYQRLPPHILWATGLK(SEQ ID NO:2)
在某些其他实施方式中,进化的胞苷脱氨酶结构域(即,由于本文所述的连续进化过程)包含“evoAPOBEC”多肽,其具有根据SEQ ID NO:6的氨基酸序列或与SEQ ID NO:6具有至少60%、65%、70%、75%、80%、85%、90%、95,98%、99%或99.5%同一性并且包含置换E4K;H109N;H122L;D124N;R154H;A165S;P201S;F205S的氨基酸序列,如下所示:
Figure BDA0002426427270001072
在仍然其他实施方式中,参考胞苷脱氨酶结构域包含“海七鳃鳗CDA1(pmCDA1)”多肽,其具有根据SEQ ID NO:3的氨基酸序列或与SEQ ID NO:3具有至少60%、65%、70%、75%、80%、85%、90%、95,98%、99%或99.5%同一性的氨基酸序列,如下所示:
MTDAEYVRIHEKLDIYTFKKQFFNNKKSVSHRCYVLFELKRRGERRACFWGYAVNKPQSGTERGIHAEIFSIRKVEEYLRDNPGQFTINWYSSWSPCADCAEKILEWYNQELRGNGHTLKIWACKLYYEKNARNQIGLWNLRDNGVGLNVMVSEHYQCCRKIFIQSSHNQLNENRWLEKTLKRAEKRRSELSIMIQVKILHTTKSPAV(SEQ ID NO:3)
在其他实施方式中,进化的胞苷脱氨酶结构域(即,由于本文所述的连续进化过程)包含“evoCDA”多肽,其具有根据SEQ ID NO:7的氨基酸序列或与SEQ ID NO:7并具有至少60%、65%、70%、75%、80%、85%、90%、95,98%、99%或99.5%同一性包括置换F23S;A123V;I195F的氨基酸序列,如下所示:
Figure BDA0002426427270001081
在仍然其他的实施方式中,参考胞苷脱氨酶结构域包含“Anc689APOBEC”多肽,其具有根据SEQ ID NO:4的氨基酸序列或与SEQ ID NO:4具有至少60%、65%、70%、75%、80%、85%、90%、95,98%、99%或99.5%同一性的氨基酸序列,如下所示:
MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEIKWGTSHKIWRHSSKNTTKHVEVNFIEKFTSERHFCPSTSCSITWFLSWSPCGECSKAITEFLSQHPNVTLVIYVARLYHHMDQQNRQGLRDLVNSGVTIQIMTAPEYDYCWRNFVNYPPGKEAHWPRYPPLWMKLYALELHAGILGLPPCLNILRRKQPQLTFFTIALQSCHYQRLPPHILWATGLK(SEQ ID NO:4)
在其他实施方式中,进化的胞苷脱氨酶结构域(即,由于本文所述的连续进化过程)包含“evoAnc689 APOBEC”多肽,其具有根据SEQ ID NO:8的氨基酸序列或与SEQ ID NO:8具有至少60%、65%、70%、75%、80%、85%、90%、95,98%、99%或99.5%同一性并包括置换E4K;H122L;D124N;R154H;A165S;P201S;F205S的氨基酸序列,如下所示:
Figure BDA0002426427270001082
Figure BDA0002426427270001091
在一些方面,本说明书提供了用于构建具有改善特性的碱基编辑器的进化胞苷脱氨酶。例如,诸如本文提供的那些的进化胞苷脱氨酶能够改善碱基编辑效率和/或改善碱基编辑器更有效地编辑碱基的能力,无论周围序列如何。例如,在一些方面,本公开提供了一种进化的APOBEC脱氨酶(例如,进化的rAPOBEC1),在5'-G-3'背景下,当其相对于目标碱基(例如C)为5'时,其具有改进的碱基编辑效率。在一些实施方式中,本公开提供了包含本文提供的任何进化的胞苷脱氨基酶的碱基编辑器。应当理解,本文提供的任何进化的胞嘧啶脱氨酶都可用作碱基编辑器蛋白质(例如本文提供的任何碱基编辑器)中的脱氨酶。还应当理解,本公开内容考虑具有本文提供的任何突变,例如在实施例部分中描述的任何突变的胞苷脱氨酶。
(C)UGI结构域
在其他实施方式中,本文所述的碱基编辑器可包含一个或多个尿嘧啶糖基化酶抑制剂,其可任选地使用如本文所述的连续进化过程(例如,PACE)进化。
术语“尿嘧啶糖基化酶抑制剂”或“UGI”如本文所用是指能够抑制尿嘧啶-DNA糖基化酶碱基-删除修复酶的蛋白质。在一些实施方式中,UGI结构域包含野生型UGI或如SEQ IDNO:10所示的UGI。在一些实施方式中,本文提供的UGI蛋白质包括UGI的片段和与UGI或UGI片段同源的蛋白质。例如,在一些实施方式中,UGI结构域包含SEQ ID NO:10中所示的氨基酸序列的片段。在一些实施方式中,UGI片段包含如下的氨基酸序列:其包含如SEQ ID NO:10所示的氨基酸序列的至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%。UGI包含与SEQID NO:10所示氨基酸序列同源的氨基酸序列,或与SEQ ID NO:10所示氨基酸序列的片段同源的氨基酸序列。包含UGI或UGI片段或UGI或UGI片段的同源物的蛋白质称为“UGI变体”。UGI变体与UGI或其片段具有同源性。例如,UGI变体与野生型UGI或SEQ ID NO:10所示的UGI具有至少70%同一性,至少75%同一性,至少80%同一性,至少85%同一性,至少90%同一性,至少95%同一性,至少96%同一性,至少97%同一性,至少98%同一性,至少99%同一性,至少99.5%同一性或至少99.9%同一性。在一些实施方式中,UGI变体包含UGI的片段,使得该片段与SEQ ID NO:10所示的野生型UGI或UGI的相应片段具有至少70%同一性,至少80%同一性,至少90%同一性,至少95%同一性,至少96%同一性,至少97%同一性,具有至少98%的同一性,至少99%的同一性,至少99.5%的同一性或至少99.9%。UGI包含以下氨基酸序列:
>sp|P14739|UNGI_BPPB2尿嘧啶-DNA糖基化酶抑制剂MTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKML(SEQ ID NO:10)。
本文所述的碱基编辑器可包含多于一个UGI结构域,其可被如本文所述的一个或多个接头隔开。
(D)分裂内含肽结构域
在本文所述的多个实施方式中,连续进化方法(例如,PACE)可用于进化的碱基编辑器的第一部分。该第一部分可以包括单个组分或结构域,例如Cas9结构域、脱氨酶结构域或UGI结构域。然后可以通过将进化的部分和剩余的未进化部分在分裂内含肽多肽结构域中单独表达而在细胞内将进化的组分或结构域与碱基编辑器的其余部分融合。第一部分可以更广泛地包括期望使用本文所述的连续进化方法进化的碱基编辑器的任何第一氨基酸部分。在该实施方式中,第二部分将是指未使用本文的方法进化的碱基编辑器的其余氨基酸部分。碱基编辑器的进化的第一部分和第二部分各自可以在细胞中用分裂内含肽多肽结构域表达。细胞的天然蛋白剪接机制将进化的第一部分和未进化的第二部分重新组装以形成单个融合蛋白的进化的碱基编辑器。进化的第一部分可包含单个融合蛋白的N端或C端部分。以类似的方式,使用第二个正交的反式剪接内含肽允许进化的第一部分包含单个融合蛋白的内部部分。
因此,本文所述的碱基编辑器的任何进化和未进化组分都可以用分裂内含肽标签表达,以便于在细胞内形成包括进化和未进化成分的完整碱基编辑器。
已对蛋白质剪接过程的机制进行了详尽的研究(Chong,et al.,J.Biol.Chem.1996,271,22159-22168;Xu,M-Q&Perler,F.B.EMBO Journal,1996,15,5146-5153),并且在内含肽和外显肽剪接点发现了保守的氨基酸(Xu et al.,EMBO Journal,1994,13 5517-522)。本文所述的构建体包含与第一基因的5'-末端融合的内含肽序列(例如,碱基编辑器的进化部分)。合适的内含肽序列可以选自已知包含蛋白质剪接元件的任何蛋白质。包含所有已知内含肽的数据库可以在万维网上找到(Perler,F.B.Nucleic AcidsResearch,1999,27,346-347)。内含肽序列在3'端与第二个基因的5'端融合。为了将该基因靶向特定细胞器,可以将肽信号融合到该基因的编码序列。在第二个基因之后,可以根据需要多次重复内含肽基因序列,以在同一细胞中表达多种蛋白质。对于含有多个内含肽的构建体,使用来自不同来源的内含肽元件可能是有用的。在要表达的最后一个基因的序列之后,必须插入转录终止序列。在一个实施方式中,设计了修饰的内含肽剪接单元,使得其既可以催化从内含肽上切除外显肽,又可以防止外显肽的连接。发现Pyrococcus speciesGB-D DNA聚合酶中C末端外显肽接合点的诱变产生改变的剪接元件,该改变的剪接元件诱导外显肽和内含肽的切割,但阻止随后的外显肽连接(Xu,M-Q&Perler,F.B.EMBO Journal,1996,15,5146-5153)。丝氨酸538突变为丙氨酸或甘氨酸可诱导切割,但阻止连接。其他内含肽剪接单元中等价残基的突变也应阻止外显肽连接,这是由于内含肽的C-末端外显肽结合处的氨基酸保守性。优选的不含核酸内切酶结构域的内含肽是Mycobacterium xenopiGyrA蛋白蛋白质(Telenti,et al.J.Bacteriol.1997,179,6378-6382)。其他已在自然界发现或已通过从含有核酸内切酶的内含肽中去除核酸内切酶结构域而人工创建内含肽(Chong,et al.J.Biol.Chem.1997,272,15587-15590)。在优选的实施方式中,内含肽选择为使得其由执行剪接功能所需的最小数目的氨基酸组成,例如来自Mycobacterium xenopiGyrA蛋白的内含肽(Telenti,A.,et al.,J.Bacteriol.1997,179,6378-6382)。在另一个实施方式中,选择没有核酸内切酶活性的内含肽,例如已被修饰以去除核酸内切酶结构域的来自Mycobacterium xenopi GyrA蛋白的内含肽或酿酒酵母VMA内含肽(Chong,1997)。进一步修饰内含肽剪接单元可允许改变切割反应的反应速率,使得可以通过简单修饰剪接单元的基因序列来控制蛋白质量。
内含肽也可以作为由两个单独转录和翻译的基因编码的两个片段而存在。这些所谓的分裂内含肽以反式自结合并催化蛋白剪接活性。已在多种蓝细菌和古细菌中鉴定了分裂的内含肽(Caspi et al,Mol Microbiol.50:1569-1577(2003);Choi J.et al,J MolBiol.556:1093-1106(2006.);Dassa B.et al,Biochemistry.46:322-330(2007.);LiuX.and Yang J.,J Biol Chem.275:26315-26318(2003);Wu H.et al.,Proc Natl AcadSci USA.
Figure BDA0002426427270001121
5:9226-9231(1998.);和Zettler J.et al,FEBS Letters.553:909-914(2009)),但其迄今尚未在真恶化生物中发现。最近,对环境宏基因组学数据的生物信息学分析揭示了26个不同的基因座,它们具有新颖的基因组排列方式。在每个基因座处,保守的酶编码区被分裂内含肽中断,在编码内含肽亚结构域的区段之间插入了独立的核酸内切酶基因。其中,五个基因座已完全组装:DNA解旋酶(gp41-1,gp41-8);肌苷5'-单磷酸脱氢酶(IMPDH-1);和核糖核苷酸还原酶催化亚基(NrdA-2和NrdJ-1)。这种断裂的基因组织似乎主要存在于噬菌体中(Dassa et al.,Nucleic Acids Research.57:2560-2573(2009))。
分裂内含肽Npu DnaE的特征是具有蛋白质反式剪接反应中报道的最高速率。另外,Npu DnaE蛋白质剪接反应被认为对于不同的外显肽序列、6-37℃的温度以及存在高达6M的尿素的情况下是稳定和高产的(Zettler J.et al,FEBS Letters.553:909-914(2009);Iwai I.et al,FEBS Letters 550:1853-1858(2006))。如所预期的,当在这些内含肽的N-结构域引入Cysl Ala突变时,最初的N至S-酰基转移,因此蛋白质剪接被阻断。不幸的是,C-末端切割反应也几乎被完全抑制。C末端剪接点的天冬酰胺环化对N末端易裂肽键的酰基转移的依赖性似乎是天然分裂的DnaE内含肽等位基因共有的独特特性(ZettlerJ.et al.FEBS Letters.555:909-914(2009))。
分裂内含肽Npu DnaE的特征是报告对于蛋白质反式剪接反应具有最高的速率。此外,就不同的外显肽序列而言,Npu DnaE蛋白剪接反应被认为是稳健和高产的,温度范围为6至37℃,并且存在的尿素高达6M Urea(Zettler J.et al,FEBS Letters.553:909-914(2009);Iwai I.et al,FEBS Letters 550:1853-1858(2006))。如预期的那样,当引入位于这些内含肽的N结构域处的Cysl Ala突变时,阻断了最初的N到S-的酰基转移并因此阻止了蛋白剪接。不幸的是,C-末端切割反应也几乎被完全抑制。C-末端剪接接合处的天冬酰胺环化对N-末端可剪切肽键上的酰基转移的依赖性似乎是天然分裂的DnaE内含肽等位基因共有的独特属性(Zettler J.et al.FEBS Letters.555:909-914(2009))。
蛋白质剪接的机制通常包括四个步骤[29-30]:1)内含肽N-末端的N-S或N-O酰基转移,这会破坏上游肽键并在N-外显肽与内含肽的第一个氨基酸(Cys或Ser)的侧链之前形成酯键;2)酯交换反应,将N-外显肽重新定位到内含肽C-末端,形成将N-外显肽连接至C-内含肽的第一个氨基酸(Cys、Ser或Thr)的侧链的新酯键;3)Asn环化破坏内含肽和C-外显肽之间的肽键;4)S-N或O-N酰基转移,其用N-外显肽与C-外显肽之间的肽键取代酯键。
由分裂内含肽催化的蛋白质反式剪接提供了一种完全酶促的蛋白质连接方法[31]。分裂内含肽本质上是分裂为分别名为N-内含肽和C-内含肽的两片的连续内含肽(例如迷你内含肽)。分裂内含肽的N-内含肽和C-内含肽可以非共价结合形成活性内含肽,并基本上以与连续内含肽相同的方式催化剪接反应。已在自然界发现了分裂内含肽,并在实验室中对其进行了工程改造[31-35]。如本文所用,术语“分裂内含肽”是指其中N-末端和C-末端氨基酸序列之间存在一个或多个肽键断裂以使N-末端和C-末端序列成为单独的分子的任何内含肽,这些单独的分子可非共价地重新结合或重新组成为对反式剪接反应有功能的内含肽。任何具有催化活性的内含肽或其片段均可用于衍生用于本发明方法的分裂内含肽。例如,在一方面,分裂内含肽可以衍生自真核生物内含肽。在另一方面,分裂内含肽可以衍生自细菌内含肽。在另一方面,分裂内含肽可以衍生自古细菌内含肽。优选地,这样衍生的分裂内含肽将仅具有催化反式-剪接反应所必需的氨基酸序列。
如本文所用,“N末端分裂内含肽(In)”是指包含对反式剪接反应有功能的N末端氨基酸序列的任何内含肽序列。因此,In还包括在反式剪接发生时所剪接出来的序列。In可以包含如下序列,该序列是天然存在的内含肽序列的N-末端部分的修饰。例如,In可以包含另外的氨基酸残基和/或突变的残基,只要包含这样的另外的和/或突变的残基不会使In在反式剪接中不起作用。优选地,包含额外和/或突变的残基改善或增强了In的反式剪接活性。
如本文所用,“C末端分裂内含肽(Ic)”是指包含对反式剪接反应起作用的C末端氨基酸序列的任何内含肽序列。一方面,Ic包含4至7个连续的氨基酸残基,其中至少4个氨基酸来自其来源的内含肽的最后β链。因此,Ic还包含在发生反式剪接时所剪接出来的序列。Ic可包含如下序列,其是天然存在的内含肽序列的C-末端部分的修饰。例如,Ic可包含另外的氨基酸残基和/或突变的残基,只要包含这样的另外的和/或突变的残基不会使Ic在反式剪接中不起作用。优选地,包含额外和/或突变的残基改善或增强了Ic的反式剪接活性。
在本发明的一些实施方式中,与Ic或In连接的肽可包含另外的化学部分,该另外的化学部分包括荧光基团、生物素、聚乙二醇(PEG)、氨基酸类似物、非天然氨基酸、磷酸盐基、糖基、放射性同位素标记和药物分子。在其他实施方式中,与Ic连接的肽可以包含一个或多个化学反应性基团,其中包括酮、醛、Cys残基和Lys残基。当存在“内含肽剪接多肽(ISP)”时,分裂内含肽的N-内含肽和C-内含肽可以非共价结合形成活性内含肽并催化剪接反应。如本文所用,“内含肽剪切多肽(ISP)”是指当从内含肽去除Ic、In或此两者时保留下来的内含肽的氨基酸序列的一部分。在某些实施方式中,In包括ISP。在另一个实施方式中,Ic包括ISP。在又一个实施方式中,ISP是不与In或Ic共价连接的单独的肽。
可以通过对在迷你内含肽结构中发现的-12个保守β链之间的非结构环或插入氨基酸序列中一个或多个分裂位点进行工程改造而从连续内含肽产生分裂蛋白[25-28]。在β链之间的区域内的分裂位点的位置上可存在一些弹性,条件是分裂的产生将不会使内含肽的结构,特别是结构化β链的结构,破坏到足以丧失蛋白剪接活性的程度。
在蛋白质反式剪接中,一个前体蛋白质由N-外显肽部分然后是N-内含肽组成,另一个前体蛋白质由C-内含肽然后是C-外显肽部分组成,并且反式剪接反应(由N-和C-内含肽共同催化)切除两个内含肽序列,并用肽键连接两个外显肽序列。作为酶促反应的蛋白质反式剪接可在非常低(例如微摩尔)的蛋白质浓度下进行,并且可以在生理条件下进行。
(E)其他碱基编辑器功能
在多个实施方式中,本文公开的碱基编辑器进一步包含一个或更多,优选至少两个核定位信号。在优选实施方式中,碱基编辑器包含至少两个NLSs。在具有至少两个NLSs的实施方式中,NLSs可为相同的NLSs,或它们可为不同的NLSs。此外,NLSs可作为具有碱基编辑器的其余部分的融合蛋白的一部分来表达。NLS融合的位置可在N-末端,C-末端,或在碱基编辑器的序列中(例如,插入到所编码的napR/DNAbp组件(例如,Cas9)和DNA效应子部分(例如,a脱氨酶)之间)。
NLSs可为本领域已知的任何NLS序列。NLSs还可为未来发现的任何用于核定位的NLSs。NLSs还可为任何天然存在的NLS或任何非天然存在的NLS(例如,具有一个或多个所需突变的NLS)。
核定位信号或序列(NLS)是打标签、指定或以其他方式标记通过核转运进入细胞核的蛋白质的氨基酸序列。通常,该信号由暴露于蛋白质表面的一个或多个带正电荷的赖氨酸或精氨酸的短序列组成。不同的核定位蛋白可能共享相同的NLS。NLS具有与核输出信号(NES)相反的功能,后者将蛋白质靶向细胞核之外。核定位信号也可以靶向细胞的外表面。因此,单个核定位信号可以将与其相关的实体引导至细胞外部以及细胞核。这样的序列可以具有任何大小和组成,例如超过25、25、15、12、10、8、7、6、5或4个氨基酸,但是优选地将包含已知用作核定位信号(NLS)的至少4至8个氨基酸序列。
术语“核定位序列”或“NLS”是指促进蛋白质进入到细胞核中的氨基酸序列,例如,通过核转运。核定位序列在本领域中是已知的,并且对技术人员是显而易见的。例如,NLS序列在以下中描述:Plank et al.,国际PCT申请,PCT/EP2000/011690,于2000年11月23日提交,与2001年5月31日公布为WO/2001/038547,其内容通过引用并入本文以公开其示例性的核定位序列。在一些实施方式中,NLS包含以下氨基酸序列:PKKKRKV(SEQ ID NO:83),MDSLLMNRRKFLYQFKNVRWAKGRRETYLC(SEQ ID NO:84),KRTADGSEFESPKKKRKV(SEQ ID NO:101)或KRTADGSEFEPKKKRKV(SEQ ID NO:13)。
在本发明的一个方面,碱基编辑器(例如,已知碱基编辑器,诸如BE1,BE2,BE3或BE4)可用一个或多个核定位信号(NLS)修饰,优选至少两个NLSs。在优选实施方式中,碱基编辑器用两个或更多个NLSs修饰。本发明设想了使用在发明时本领域中已知的任何核定位信号或者在发明提交后在现有技术中鉴定或以其他方式可知的任何核定位信号。代表性的核定位信号是将蛋白质引导到表达该序列的细胞的细胞核中的肽序列。核定位信号主要为碱性的,可位于蛋白质的氨基酸序列的几乎任何地方,一般包括四个氨基酸的短序列(Autieri&Agrawal,(1998)J.Biol.Chem.273:14731-37,通过引用并入本文)至八个氨基酸,并且通常富含赖氨酸和精氨酸残基(Magin et al.,(2000)Virology 274:11-16,通过引用并入本文)。核定位信号通常包含普暗示残基。多个核定位信号可被鉴定和用于影响生物分子从细胞质到细胞核的转运。参见,例如,Tinland et al.,(1992)Proc.Natl.Acad.Sci.U.S.A.89:7442-46;Moede et al.,(1999)FEBS Leff.461:229-34,其通过参考并入。易位现在被认为涉及核孔蛋白。
大多数NLSs可分类为三个一般组:(i)单组分NLS,其示例为SV40大型T抗原NLS(PKKKRKVSEQ ID NO:83);(ii)由通过可变数量的间隔序列氨基酸隔开的两个基本结构域组成的双组份基序,其示例为非洲爪蟾蜍核质蛋白NLS(KRXXXXXXXXXXKKKL SEQ ID NO:102);和(iii)不规范的序列,诸如hnRNP Al蛋白质的M9,流感表达核蛋白NLS,和酵母Gal4蛋白NLS(Dingwall和Laskey 1991)。
核定位信号出现在蛋白质的氨基酸序列的各个位置。已在蛋白质的N末端,C末端和中央区域鉴定了NLS。因此,本说明书提供了可以在碱基编辑器的C末端、N末端以及中心区域内用一个或多个NLSs修饰的碱基编辑器。应该选择不作为组分NLS残基的较长序列的残基,以免例如在听觉上或空间上干扰核定位信号本身。因此,尽管对包含NLS的序列的组成没有严格限制,但实际上,可以在功能上限制这种序列的长度和组成。
本公开考虑了可通过其将碱基编辑器修饰为包括一个或多个NLSs的任何合适的手段。一方面,可以对碱基编辑器进行工程改造以表达在其N端或C端(或两者)翻译融合至一个或多个NLSs的碱基编辑器蛋白,即形成碱基编辑器-NLS融合构建提。在其他实施方式中,可以对编码碱基编辑器的核苷酸序列进行基因修饰,以在所编码的碱基编辑器的内部区域中加入编码一个或多个NLSs的阅读框。另外,NLS可以包括在碱基编辑器和N末端、C末端或内部附接的NLS氨基酸序列之间编码的多个接头或间隔序列区域,例如,在蛋白质的中心区域。因此,本公开还提供了用于表达包含碱基编辑器和一个或多个NLSs的融合蛋白的核苷酸构建体、载体和宿主细胞。
本文描述的进化的碱基编辑器还可包含通过一个或多个接头(例如聚合物、氨基酸、核酸、多糖、化学或核酸接头元件)连接到碱基编辑器的核定位信号。在本公开的预期范围内的接头不意图具有任何限制,并且可以是任何合适类型的分子(例如,聚合物、氨基酸、多糖、核酸、脂质或任何合成的化学接头部分)并且通过有效地在碱基编辑器和一个或多个NLSs之间形成键(例如共价键、氢键)的任何合适的策略而接合到碱基编辑器。
本文所述的碱基编辑器还可包括一个或多个附加功能。在某些实施方式中,附加功能可以包括碱基修复的效应子。
在某些实施方式中,本文所述的碱基编辑器可包含碱基修复抑制剂。术语“碱基修复抑制剂”或“IBR”是指能够抑制核酸修复酶,例如碱基删除修复酶的活性的蛋白质。在一些实施方式中,IBR是肌苷碱基删除修复的抑制剂。碱基修复的示例性抑制剂包括APE1、Endo III、Endo IV、Endo V、Endo VIII、Fpg、hOGG1、hNEIL1、T7 EndoI、T4PDG、UDG、hSMUG1和hAAG的抑制剂。在一些实施方式中,IBR是Endo V或hAAG的抑制剂。在一些实施方式中,IBR是催化失活的EndoV或催化失活的hAAG。
在一些实施方式中,本文所述的碱基编辑器可包含一个或多个异源蛋白质结构域(例如,约为或大于约1、2、3、4、5、6、7、8、9、10或更多个结构域以及碱基编辑器组件)。碱基编辑器可以包含任何其他蛋白质序列,以及任选地在任何两个结构域之间的接头序列。可以融合至碱基编辑器或其组分的蛋白质结构域的示例(例如,napR/DNAbp部分,核酸效应子部分或NLS部分)包括但不限于表位标签,报告基因序列和具有以下一种或多种活性的蛋白质结构域:甲基化酶活性、脱甲基化酶活性、转录激活活性、转录抑制活性、转录释放因子活性、组蛋白修饰活性、RNA切割活性和核酸结合活性。表位标签的非限制性示例包括组氨酸(His)标签、V5标签、FLAG标签、流感血凝素(HA)标签、Myc标签、VSV-G标签和硫氧还蛋白(Trx)标签。报告基因的示例包括但不限于谷胱甘肽-5-转移酶(GST)、辣根过氧化物酶(HRP)、氯霉素乙酰基转移酶(CAT)β-半乳糖苷酶、β-葡糖醛酸糖苷酶、荧光素酶、绿色荧光蛋白(GFP)、HcRed、DsRed、青色荧光蛋白(CFP)、黄色荧光蛋白(YFP)和包括蓝色荧光蛋白(BFP)的自发荧光蛋白。碱基编辑器可以与编码结合DNA分子或结合其他细胞分子的蛋白质或蛋白质片段的基因序列融合,包括但不限于麦芽糖结合蛋白(MBP)、S标签、Lex A DNA结合域(DBD)融合体、GAL4 DNA结合域融合体和单纯疱疹病毒(HSV)BP16蛋白融合体。在US20110059502中描述了可以形成包含碱基编辑器的融合蛋白的一部分的其他结构域,其通过引用并入本文。在一些实施方式中,标记的碱基编辑器用于识别靶序列的位置。
在本发明的一个方面,包括但不限于谷胱甘肽5-转移酶(GST)、辣根过氧化物酶(HRP)、氯霉素乙酰转移酶(CAT)β-半乳糖苷酶、β-葡萄糖醛酸苷酶、萤光素酶、绿色荧光蛋白(GFP),HcRed,DsRed,青色荧光蛋白(CFP),黄色荧光蛋白(YFP)和包括蓝色荧光蛋白(BFP)的自体荧光蛋白的报道基因可被引入到细胞中,以编码用作通过其测量基因产物表达改变或修饰的标记物。在本发明的另一个实施方式中,可通过载体将编码基因产物的DNA分子引入细胞。在本发明的优选实施方式中,基因产物是荧光素酶。在本发明的另一个实施方式中,基因产物的表达降低。
可能存在的其他示例性特征是定位序列,例如胞质定位序列,输出序列(例如核输出序列)或其他定位序列,以及可用于融合蛋白的增溶、纯化或检测的序列标签。本文提供的合适的蛋白质标签包括但不限于生物素羧化酶载体蛋白(BCCP)标签、myc标签、钙调蛋白标签、FLAG标签、血凝素(HA)标签、多组氨酸标签(也称为组氨酸标签或His标签)、麦芽糖结合蛋白(MBP)标签、nus标签、谷胱甘肽S-转移酶(GST)标签、绿色荧光蛋白(GFP)标签、硫氧还蛋白标签、S标签、Softags(例如,Softag 1、Softag 3)、链球菌标签、生物素连接酶标签、FlAsH标签、V5标签和SBP标签。对于本领域技术人员而言,其他合适的序列将是显而易见的。在一些实施方式中,融合蛋白包含一个或多个His标签。
(F)向导序列(例如,向导RNA)
在多个实施方式中,进化的碱基编辑器可以与一个或多个向导序列(即将会与碱基编辑器关联或结合并引导其定位到与该向导序列或其部分具有互补性的特定靶序列的序列)复合、结合或以其他方式关联(例如,通过任何类型的共价或非共价键)。向导序列的具体设计方面将取决于目的基因组靶位点(即,需要编辑的位点)的核苷酸序列和碱基编辑器中存在的napR/DNAbp的类型(例如,Cas蛋白的类型)等因素,例如PAM序列位置,靶序列中G/C百分比,微同源区域的程度,二级结构等。
通常,向导序列是与靶多核苷酸序列具有足够互补性以与靶序列杂交并引导napR/DNAbp(例如,Cas9,Cas9同源物或Cas9变体)与靶序列的序列特异性结合的任何多核苷酸序列。在一些实施方式中,当使用合适的比对算法最佳比对时,向导序列与其对应的靶序列之间的互补程度为约或大于约50%,60%,75%,80%,85%,90%,95%,97.5%,99%或更高。可以使用任何合适的用于比对序列的算法来确定最佳比对,其非限制性示例包括Smith-Waterman算法,Needleman-Wunsch算法,基于Burrows-Wheeler变换的算法(例如,Burrows Wheeler Aligner),ClustalW,Clustal X,BLAT,Novoalign(NovocraftTechnologies,ELAND(Illumina,San Diego,Calif.),SOAP(可得自soap.genomics.org.cn),和Maq(可得自maq.sourceforge.net)。在一些实施方式中,向导序列的长度为约或大于约5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、75或更多个核苷酸。
在一些实施方式中,向导序列的长度小于约75、50、45、40、35、30、25、20、15、12或更少的核苷酸。向导序列引导碱基编辑器与靶序列的序列特异性结合的能力可以通过任何合适的测定法来评估。例如,可以将包含待测试的向导序列的碱基编辑器的组分提供给具有相应靶序列的宿主细胞,诸如通过用本文公开的碱基编辑器的组分的载体转染,然后评估靶序列中的有限切割,例如通过如本文所述的Surveyor测定。类似地,可以通过如下方式在试管中评价靶多核苷酸序列的切割:提供靶序列,碱基编辑器的组件(包括要测试的向导序列和不同于测试向导序列的对照向导序列),并比较测试和对照向导序列反应之间的靶序列结合或切割率。可也使用其他测定,这对本领域技术人员而言是显而易见的。
向导序列可选择为靶向任何靶序列。在一些实施方式中,靶序列是细胞基因组中的序列。示例性的靶序列包括靶基因组中独有的那些。例如,对于化脓性链球菌Cas9,基因组中独有的靶序列可包括如下形式的Cas9靶位点:MMMMMMMMNNNNNNNNNNNNXGG,其中NNNNNNNNNNNNXGG(N是A,G,T或C;和X可为任何)在基因组中具有单次出现。基因组中独有的靶序列可包括如下形式的化脓性链球菌Cas9靶位点:MMMMMMMMMNNNNNNNNNNNXGG,其中NNNNNNNNNNNXGG(N是A,G,T或C;和X可为任何)在基因组中具有单次出现。对于嗜热链球菌CRISPR1Cas9,基因组中独有的靶序列可包括如下形式的Cas9靶位点:MMMMMMMMNNNNNNNNNNNNXXAGAAW,其中NNNNNNNNNNNNXXAGAAW(N是A,G,T或C;X可为任何;和W是或T)在基因组中具有单次出现。基因组中独有的靶序列可包括嗜热链球菌如下形式的CRISPR 1 Cas9靶位点:MMMMMMMMMNNNNNNNNNNNXXAGAAW,其中NNNNNNNNNNNXXAGAAW(N是A,G,T或C;X可为任何;和W是或T)在基因组中具有单次出现。对于化脓性链球菌Cas9,基因组中独有的靶序列可包括如下形式的Cas9靶位点:MMMMMMMMNNNNNNNNNNNNXGGXG,其中NNNNNNNNNNNNXGGXG(N是A,G,T或C;和X可为任何)在基因组中具有单次出现。基因组中独有的靶序列可包括如下形式的化脓性链球菌Cas9靶位点:MMMMMMMMMNNNNNNNNNNNXGGXG,其中NNNNNNNNNNNXGGXG(N是A,G,T或C;和X可为任何)在基因组中具有单次出现。在这些序列每个中,“M”可为A,G,T或C,并且将序列识别为唯一序列时无需考虑。
在一些实施方式中,向导序列选择为减少向导序列中二级结构程度。二级结构可通过任何合适的多核苷酸算法来测定。一些程序基于计算最小吉布斯自由能。一种这样的算法的示例是mFold,如Zuker和Stiegler(Nucleic Acid Res.9(1981),133-148)所示。另一种示例的折叠算法是线上网络服务器RNAfold,由Institute for TheoreticalChemistry at the University of Vienna开发,使用形心结构预测算法(参见,例如A.R.Gruber et al.,2008,Cell 106(1):23-24;and PA Carr and GM Church,2009,Nature Biotechnology 27(12):1151-62)。其他算法可见于美国申请序列号61/836,080;Broad Reference BI-2013/004A);其通过引用并入本文。
通常,tracr配体序列包含与tracr序列具有足够互补性以促进以下一个或多个的任何序列:(1)在含有相应tracr序列的细胞中,切除侧翼为tracr mate序列的向导序列;(2)在靶序列处形成复合物,其中该复合物包含与tracr序列杂交的tracr伴侣序列。通常,互补度是指沿着两个序列中较短者的长度,tracr配对序列和tracr序列的最佳比对。最佳比对可以通过任何合适的比对算法来确定,并且可以进一步考虑二级结构,例如tracr序列或tracr配对序列内的自互补性。在一些实施方式中,当最优比对时,沿着两个中较短的一个的tracr序列和tracr配对序列之间的互补程度为约或大于约25%,30%,40%,50%,60%,70%,80%,90%,95%,97.5%,99%或更高。在一些实施方式中,tracr序列的长度为约或大于约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、40、50个或更多核苷酸。在一些实施方式中,tracr序列和tracr伴侣序列包含在单个转录物中,使得两者之间的杂交产生具有二级结构的转录物,例如发夹。用于发夹结构的优选的环形成序列的长度为四个核苷酸,最优选具有序列GAAA。但是,可以使用更长或更短的循环序列,也可以使用其他序列。序列优选包括核苷酸三联体(例如AAA)和另外的核苷酸(例如C或G)。环形成序列的示例包括CAAA和AAAG。在本发明的一个实施方式中,转录物或转录的多核苷酸序列具有至少两个或更多个发夹。在优选的实施方式中,转录物具有两个,三个,四个或五个发夹。在本发明的另一个实施方式中,转录物具有至多五个发夹。在一些实施方式中,单个转录物进一步包括转录终止序列;优选地,这是polyT序列,例如六个T核苷酸。包含向导序列、tracr配对序列和tracr序列的单个多核苷酸的其他非限制性示例如下(从5'至3'列出),其中“N”代表向导序列的碱基,第一部分小写字母表示tracr配对序列,第二部分小写字母表示tracr序列,最后的poly-T序列表示转录终止子:(1)NNNNNNNNgtttttgtactctcaagatttaGAAAtaaatcttgcagaagctacaaagataaggcttcatgccgaaatcaacaccctgtcattttatggcagggtgttttcgttatttaaTTTTTT(SEQ ID NO:103);(2)NNNNNNNNNNNNNNNNNNgtttttgtactctcaGAAAtgcagaagctacaaagataaggcttcatgccgaaatca acaccctgtcattttatggcagggtgttttcgttatttaaTTTTTT(SEQ ID NO:104);(3)NNNNNNNNNNNNNNNNNNNNgtttttgtactctcaGAAAtgcagaagctacaaagataaggcttcatgccgaaatca acaccctgtcattttatggcagggtgtTTTTT(SEQ ID NO:105);(4)NNNNNNNNNNNNNNNNNNNNgttttagagctaGAAAtagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcTTTTTT(SEQ ID NO:106);(5)NNNNNNNNNNNNNNNNNNNNgttttagagctaGAAATAGcaagttaaaataaggctagtccgttatcaacttgaa aaagtgTTTTTTT(SEQ ID NO:107);和(6)NNNNNNNNNNNNNNNNNNNNgttttagagctagAAATAGcaagttaaaataaggctagtccgttatcaTTTTTTTT(SEQ ID NO:108)。在一些实施方式中,序列(1)至(3)与来自嗜热链球菌CRISPR1的Cas9一起使用。在一些实施方式中,序列(4)至(6)与来自化脓性链球菌的Cas9一起使用。在一些实施方式中,tracr序列是与包含tracr配对序列的转录物不同的转录物。
对于本领域技术人员而言显而易见的是,为了将本文所公开的包含Cas9结构域和脱氨酶的任何融合蛋白靶向靶位点,例如,包含白编辑的点突变的位点,通常需要将融合蛋白与向导RNA,例如sgRNA一起共表达。如本文其他地方更详细地解释的,向导RNA通常包含允许Cas9结合的tracrRNA框架和向导序列,其为Cas9:核酸编辑酶/结构域融合蛋白赋予序列特异性。
在一些实施方式中,向导RNA包含结构5’-[向导序列]-guuuuagagcuagaaauagcaaguuaaaauaaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugcuuuuu-3’(SEQ ID NO:109),其中向导序列包含与靶序列互补的序列。向导序列通常为20个核苷酸长。根据本公开,用于将Cas9:核酸编辑酶/结构域融合蛋白靶向特定基因组靶位点的合适的向导RNAs的序列对于本领域技术人员将是显而易见的。这种合适的向导RNA序列通常包含与要编辑的靶核苷酸上游或下游的50个氨基酸以内的核酸序列互补。在本文中提供了适合将所提供的任何融合蛋白靶向特定靶序列的一些示例性的向导RNA序列。其他向导序列是本领域公知的,并且可与本文所述的碱基编辑器一起使用。
(G)接头
在某些实施方式中,接头可用于连接任何本发明的肽或肽结构域或部分(例如,共价连接到部分B的部分A,该部分B共价连接到部分C)。
如上所定义的,术语“接头”如本文所用是指连接两个分子或部分(例如,核酸酶的结合结构域和切割结构域)的化学基团或分子。在一些实施方式中,接头接合RNA-可编程核酸酶的gRNA结合结构域与重组酶的催化结构域。在一些实施方式中,接头接合dCas9和碱基编辑器部分(例如,胞苷或腺苷脱氨酶)。通常,接头位于两个基团、分子或其他部分之间或侧翼,并且经由共价键连接到每个,因此连接二者。在一些实施方式中,接头是氨基酸或多个氨基酸(例如,肽或蛋白质)。在一些实施方式中,接头是有机分子,基团,聚合物或化学部分。在一些实施方式中,接头的长度为5-100个氨基酸,例如,长度为5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、30-35、35-40、40-45、45-50、50-60、60-70、70-80、80-90、90-100、100-150或150-200个氨基酸。也可设想更长或更短的接头。
接头可以是简单的共价键,也可以是长度很多原子的聚合接头。在某些实施方式中,接头是肽或基于氨基酸。在其他实施方式中,接头不是肽样的。在某些实施方式中,接头是共价键(例如,碳-碳键,二硫键,碳-杂原子键等)。在某些实施方式中,接头是酰胺键的碳-氮键。在某些实施方式中,接头是环状或无环的,取代或未取代的,支链或直链的脂族或杂脂族接头。在某些实施方式中,接头是聚合的(例如,聚乙烯,聚乙二醇,聚酰胺,聚酯等)。在某些实施方式中,接头包含氨基链烷酸的单体,二聚体或聚合物。在某些实施方式中,该接头包含氨基链烷酸(例如,甘氨酸,乙酸,丙氨酸,β-丙氨酸,3-氨基丙酸,4-氨基丁酸,5-戊酸等)。在某些实施方式中,接头包含氨基己酸(Ahx)的单体,二聚体或聚合物。在某些实施方式中,接头基于碳环部分(例如,环戊烷,环己烷)。在其他实施方式中,接头包含聚乙二醇部分(PEG)。在其他实施方式中,接头包含氨基酸。在某些实施方式中,接头包含肽。在某些实施方式中,接头包含芳基或杂芳基部分。在某些实施方式中,接头基于苯环。接头可包括官能化部分,以促进来自肽的亲核试剂(例如硫醇,氨基)到接头的连接。任何亲电子试剂都可以用作接头的一部分。示例性的亲电试剂包括但不限于活化的酯,活化的酰胺,迈克尔受体,烷基卤化物,芳基卤化物,酰基卤化物和异硫氰酸酯。
在一些其他实施方式中,接头包含以下氨基酸序列:(GGGGS)n(SEQ ID NO:110)、(G)n(SEQ ID NO:111)、(EAAAK)n(SEQ ID NO:112)、(GGS)n(SEQ ID NO:113)、(SGGS)n(SEQID NO:114),SGSETPGTSESATPES SEQ ID NO:115)、(XP)n(SEQ ID NO:116)或其任何组合,其中n独立为1-30的整数,和其中X是任何氨基酸。在一些实施方式中,接头包含以下氨基酸序列:(GGS)n(SEQ ID NO:117),其中n是1、3或7。在一些实施方式中,接头包含以下氨基酸序列:SGSETPGTSESATPES(SEQ ID NO:99)。在一些实施方式中,接头包含以下氨基酸序列:SGGSSGGSSGSETPGTSESATPESSGGSSGGS(SEQ ID NO:11)。在一些实施方式中,接头包含以下氨基酸序列:SGGSGGSGGS(SEQ ID NO:12)。在一些实施方式中,接头包含以下氨基酸序列:SGGS(SEQ ID NO:14)。
在一些实施方式中,融合蛋白包含如下结构:[核酸编辑结构域]-[任选的接头序列]-[dCas9或Cas9切口酶]-[任选的接头序列]-[UGI]。在一些实施方式中,融合蛋白包含如下结构:[核酸编辑结构域]-[任选的接头序列]-[UGI]-[任选的接头序列]-[dCas9或Cas9切口酶];[UGI]-[任选的接头序列]-[核酸编辑结构域]-[任选的接头序列]-[dCas9或Cas9切口酶];[UGI]-[任选的接头序列]-[dCas9或Cas9切口酶]-[任选的接头序列]-[核酸编辑结构域];[dCas9或Cas9切口酶]-[任选的接头序列]-[UGI]-[任选的接头序列]-[核酸编辑结构域];或[dCas9或Cas9切口酶]-[任选的接头序列]-[核酸编辑结构域]-[任选的接头序列]-[UGI]。
碱基编辑器的连续进化
尽管碱基编辑器的设计最近有所发展,但碱基编辑的效率差异很大。为了提高碱基编辑效率,发明人试图找出限制细胞中碱基编辑效率的因素。发明人惊奇地发现,人类细胞中的表达和核定位对编辑效率施加了关键瓶颈。发明人发现,通过优化密码子使用,使用改进的核定位序列(NLS)和进行脱氨酶的祖先重构,导致碱基编辑器的编辑效率大大提高,与未修饰的对应编辑器相比,靶核苷酸转化率通常提高一倍以上。如显著中所示,显示出所得的碱基编辑器比先前描述的碱基编辑器更有效地将与人类疾病相关的点突变安装在多种哺乳动物细胞类型中。这些方法可用于提供进化的碱基编辑器,该进化的碱基编辑器可用于以与本领域已知的碱基编辑器相比显着改善的方式有效地编辑核酸分子。进化的碱基编辑器可用于例如通过纠正致病点突变来有效编辑核酸分子,例如基因组。
因此,本发明在多个方面涉及通过多种操纵模式来制造所公开的进化碱基编辑器的方法,所述多种操纵模式包括但不限于密码子优化和实施碱基编辑器的组分(例如,脱氨酶)的祖先重构以在细胞中获得更高的表达水平,以及使用核定位序列(NLS),最好是至少两个NLS来增加所表达的碱基编辑器在细胞核中的定位。
增加表达
本文所设想的碱基编辑器可包括通过密码子优化和祖先重构分析导致表达增加的修饰。
在一些实施方式中,碱基编辑器(或其组分)进行密码子优化以在特定细胞如真核生物细胞中表达。真核生物细胞可为是或来源于特定生物体的那些,诸如哺乳动物,包括但不限于人,小鼠,大鼠,兔子,犬或非人灵长类动物。通常,密码子优化是指通过如下方式修饰核酸序列以增强在目的宿主细胞中的表达的方法:将原生序列中的至少一个密码子(例如约或多于约1、2、3、4、5、10、15、20、25、50或更多个密码子)替换为更频繁或最频繁用于该宿主细胞的基因中的密码子同时保持原生的氨基酸序列。多个物种显示出对于特定氨基酸的某些密码子的特定偏见。密码子偏见(生物体之间密码子使用的差异)通常与信使RNA(mRNA)的翻译效率有关,这又被认为取决于所翻译的密码子的性质和特定转运RNA(tRNA)分子的可用性等有关。细胞中所选tRNA的优势通常反映了肽合成中最常使用的密码子。因此,可以基于密码子优化来定制基因以在给定生物中得到最佳基因表达。密码子使用表很容易获得,例如在“Codon Usage Database”中,并且这些表可以通过多种方式进行改编。参见Codon usage tabulated from the international DNA sequence databases:statusfor the year 2000”Nucl.Acids Res.28:292(2000)。也可获得用于优化特定序列以在特定宿主细胞中表达的密码子的计算机算法,例如Gene Forge(Aptagen;Jacobus,Pa.)。在一些实施方式中,编码CRISPR酶的序列中的一个或多个密码子(例如1、2、3、4、5、10、15、20、25、50或更多或所有密码子)对应于特定氨基酸最常用的密码子。
在其他实施方式中,由于祖先序列重构分析的结果,本发明的碱基编辑器具有改善的表达(与未修饰的或现有技术的对应编辑器相比)。祖先序列重构(ASR)是在进化/系统进化背景下分析现代序列以推断树的特定节点处的祖先序列的过程。这些古老的序列最常被合成,然后在实验室微生物或细胞系中重组表达,然后进行表征以揭示已灭绝生物分子的古老特性[2,3,4,5,6]。这个过程对分子适应和功能差异的机制产生了深刻的见解7。尽管有这样的见识,但对ASR的主要批评是通常无法对已实现算法的基准进行基准测试。由于许多原因,很难对ASR进行基准测试。值得注意的是,遗传物质无法在足够长的时间内保存在化石中,无法满足大多数ASR研究(数百万至数十亿年前)的需求,而且从物理上还无法及时返回以收集样本。可以参考Cai et al.,“Reconstruction of ancestral proteinsequences and its applications,”BMC Evolutionary Biology 2004,4:33 and Zakaset al.,“Enhancing the pharmaceutical properties of protein drugs by ancestralsequence reconstruction,”Nature Biotechnology,35,pp.35-37(2017),每一个均通过引用并入本文。
有许多可用的可执行祖先状态重构的软件包。通常,这些软件包是在相关领域的科学家的努力下开发和维护的,并在自由软件许可下发布。以下列表并不是要对所有可用软件包进行全面的逐项列出,而是提供了具有代表性的示例,其中包括各种实现了具有不同强度和功能的祖先重构方法的软件包:PAML(Phylogenetic Analysis by MaximumLikelihood,可得自at//abacus.gene.ucl.ac.uk/software/paml.html),BEAST(Bayesianevolutionary analysis by sampling trees,可得自at//www.beast2.org/wiki/index.php/Main_Page),and Diversitree(FitzJohn RG,2012.Diversitree:comparativephylogenetic analyses of diversification in R.Methods in Ecology andEvolution),and HyPHy(Hypothesis testing using phylogenies,可得自at//hyphy.org/w/index.php/Main_Page)。
实施例说明了使用ASR增加本文公开的碱基编辑器的整体表达并产生长度减短的功能性碱基编辑器的一个实施方式。
以上描述旨在使碱基编辑器的表达增加,从而增加编辑效率。
增加核定位
一方面,本说明书提供了一种通过在其中加入例如N-末端或C-末端融合蛋白的一个或多个核定位信号(NLS)来改进碱基编辑器的策略。优选地,至少两个NLSs被合并到碱基编辑器中。在实施例中,发明人探索了次优的核定位是碱基还是差的编辑效率。发明人测试了作为SV40 NLS或二分NLS(bpNLS)的N和/或C端融合的6种碱基编辑器组合“BE4”。如实施例中所示,使用一个或两个bpNLS的所有变体显示出编辑效率改进。在N端和C端均存在bpNLS(以下称为“双bpNLS”)效果最佳,导致BE4介导的C·G到T·A的编辑效率在五个示例性测试基因组座处平均提高了1.3倍(平均编辑度为48±8.0%,而BE4中使用C端SV40 NLS的平均编辑度为37±5.6%)。这些结果共同表明,用一个或多个核定位信号(例如bis-bpNLS)修改碱基编辑器可以显著提高先前描述的已知碱基编辑器(如BE3和BE4)的编辑效率(6、7)。
然而,这些实施例并非旨在进行限制,而仅说明了通过用一个或多个核定位信号,优选至少两个NLSs对碱基编辑器进行修饰来提高碱基编辑器效率的更广泛策略。本发明无意于限制使用哪个NLS,以及将NLS附着或以其他方式耦合到碱基编辑器的方式。NLS序列是本领域已知的,并且本文公开了示例。
载体
制作和使用本发明的碱基编辑器的几个方面涉及包含一个或多个载体或载体本身的载体系统。载体可被设计为克隆和/或表达本发明的进化的碱基编辑器。载体还可被涉及为将本发明的进化的碱基编辑器转染到一个或多个细胞中,例如用于用本文公开的碱基编辑器系统和方法进行治疗的靶病变真核生物细胞。
载体可设计为在原核生物或真核生物细胞中表达碱基编辑器转录物(例如核酸转录物,蛋白质或酶)。例如,碱基编辑器转录物可以在细菌细胞如大肠杆菌,昆虫细胞(使用杆状病毒表达载体),酵母细胞或哺乳动物细胞中表达。合适的宿主细胞在Goeddel,GENEEXPRESSION TECHNOLOGY:方法IN ENZYMOLOGY 185,Academic Press.San Diego,Calif.(1990)中进一步讨论。可选择地,编码本文所述的一种或多种进化的碱基编辑器的表达载体可以在体外转录和翻译,例如使用T7启动子调节序列和T7聚合酶。
载体可以在原核生物细胞中引入和繁殖。在一些实施方式中,原核生物用于扩增将要引入真核生物细胞的载体的拷贝,或在要引入真核生物细胞的载体的生产过程中作为中间载体(例如,扩增质粒作为病毒载体包装系统的一部分)。在一些实施方式中,原核生物用于扩增载体的拷贝并表达一种或多种核酸,从而提供一种或多种蛋白质的来源以递送至宿主细胞或宿主生物。蛋白质在原核生物中的表达最常见的是在大肠杆菌中与含有向导融合蛋白或非融合蛋白表达的组成型或诱导型启动子的载体一起进行。
融合表达载体也可以用于表达本发明的进化的碱基编辑器。这样的载体通常向其中编码的蛋白质,例如重组蛋白质的氨基末端添加许多氨基酸。此类融合载体可用于一个或多个目的,例如:(i)增加重组蛋白的表达;(ii)增加重组蛋白的溶解度;(iii)通过在亲和纯化中充当配体来帮助重组蛋白的纯化。通常,在融合表达载体中,在融合部分和重组蛋白的连接处引入蛋白水解切割位点,以使得在纯化融合蛋白之后能够从融合部分分离重组蛋白。这些酶及其同源识别序列包括因子Xa,凝血酶和肠激酶。融合表达载体的示例包括分别将谷胱甘肽S-转移酶(GST)、麦芽糖E结合蛋白或蛋白A与靶重组蛋白质融合的(Pharmacia Biotech Inc;Smith and Johnson,1988.Gene 67:31-40),pMAL(New EnglandBiolabs,Beverly,Mass.)和pRIT5(Pharmacia,Piscataway,N.J.)。
合适的诱导型非融合大肠杆菌表达载体的示例包括pTrc pTrc(Amrann et al.,(1988)Gene 69:301-315)和pET 11d(Studier et al.,GENE EXPRESSION TECHNOLOGY:方法IN ENZYMOLOGY 185,Academic Press,San Diego,Calif.(1990)60-89)。
在一些实施方式中,载体是用于表达本文描述的进化的碱基编辑器的酵母表达载体。在酵母酿酒酵母中表达的载体的示例包括pYepSec1(Baldari,et al.,1987.EMBO J.6:229-234),pMFa(Kuijan and Herskowitz,1982.Cell 30:933-943),pJRY88(Schultz etal.,1987.Gene 54:113-123),pYES2(Invitrogen Corporation,San Diego,Calif.),andpicZ(InVitrogen Corp,San Diego,Calif.)。
在一些实施方式中,载体使用杆状病毒表达载体驱动昆虫细胞中的蛋白表达。可用于在培养的昆虫细胞(例如SF9细胞)中表达蛋白质的杆状病毒载体包括the pAc series(Smith,et al.,1983.Mol.Cell.Biol.3:2156-2165)and the pVL series(Lucklow andSummers,1989.Virology 170:31-39)。
在一些实施方式中,载体能够使用哺乳动物表达载体驱动哺乳动物细胞中一个或多个序列的表达。哺乳动物表达载体的示例包括pCDM8(Seed,1987.Nature 329:840)andpMT2PC(Kaufman,et al.,1987.EMBO J.6:187-195)。当用于哺乳动物细胞时,表达载体的控制功能通常由一种或多种调节元件提供。例如,常用的启动子衍生自多瘤,腺病毒2,巨细胞病毒,猿猴病毒40以及本文公开和本领域已知的其他启动子。对于用于原核生物和真核生物细胞的其他合适的表达系统,参见,例如,Chapters 16 and 17 of Sambrook,et al.,MOLECULAR CLONING:A LABORATORY MANUAL.2nd ed.,Cold Spring Harbor Laboratory,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.,1989。
在一些实施方式中,重组哺乳动物表达载体能够优先指导核酸在特定细胞类型中的表达(例如,组织特异性调控元件用于表达核酸)。组织特异性调节元件是本领域已知的。合适的组织特异性启动子的非限制性示例包括白蛋白启动子(肝特异性;Pinkert,et al.,1987.Genes Dev.1:268-277),淋巴类特异性启动子promoters(Calame and Eaton,1988.Adv.Immunol.43:235-275),特别是T细胞受体的启动子(Winoto and Baltimore,1989.EMBO J.8:729-733)和免疫球蛋白(Baneiji,et al.,1983.Cell 33:729-740;Queenand Baltimore,1983.Cell 33:741-748),神经元特异性启动子(例如,神经丝启动子;Byrne and Ruddle,1989.Proc.Natl.Acad.Sci.USA 86:5473-5477),胰腺特异性启动子(Edlund,et al.,1985.Science 230:912-916)和乳腺特异性启动子(例如乳清启动子,美国专利号4,873,316和欧洲申请公开号264,166)。还包括发育调节的启动子,例如鼠hox启动子(Kessel and Gruss,1990.Science 249:374-379)和α-甲胎蛋白启动子(Campes andTilghman,1989.Genes Dev.3:537-546)。。
增加碱基编辑器效率
本公开的一些方面是基于以下认识:本文提供的任何碱基编辑器都能够修饰特定的核苷酸碱基而不会产生显著比例的插入缺失。如本文所用,“插入/缺失”是指核酸内核苷酸碱基的插入或缺失。此类插入或缺失可导致基因编码区内的移码突变。在一些实施方式中,期望产生有效地修饰(例如突变或脱氨基)核酸内的特定核苷酸而不在核酸中产生大量插入或缺失(即插入/缺失)的碱基编辑器。在某些实施方式中,与插入缺失相比,本文提供的任何碱基编辑器能够产生更大比例的预期修饰(例如,点突变或脱氨基)。在一些实施方式中,本文提供的碱基编辑器能够产生大于1:1的预期点突变与插入缺失的比率。在一些实施方式中,本文提供的碱基编辑器能够产生如下的预期点突变与插入缺失的比率:至少1.5:1,至少2:1,至少2.5:1,至少3:1,至少3.5,至少4:1,至少4.5:1,至少5:1,至少5.5:1,至少6:1,至少6.5:1,至少7:1,至少7.5:1,至少8:1,至少10:1,至少12:1,至少15:1,至少20:1,至少25:1,至少30:1,至少40:1,在至少50:1,至少100:1,至少200:1,至少300:1,至少400:1,至少500:1,至少600:1,至少700:1,至少800:1,至少900:1或至少1000:1或更高。可以使用任何合适的方法,例如在以下实施例中使用的方法,确定预期的突变和插入/缺失的数目。在一些实施方式中,为了计算插入缺失频率,扫描测序读数以寻找与两个10-bp序列的精确匹配,所述两个10-bp序列位于可能发生插入缺失的窗口的两侧。如果未找到完全匹配的内容,则将其从分析中排除。如果此插入缺失窗口的长度与参考序列完全匹配,则将读数分类为不包含插入缺失。如果插入缺失窗口比参考序列长或短两个或多个碱基,则测序读数分别分类为插入或缺失。
在一些实施方式中,本文提供的碱基编辑器能够限制核酸区域中插入缺失的形成。在一些实施方式中,该区域位于碱基编辑器所靶向的核苷酸处或碱基编辑器所靶向的核苷酸的2、3、4、5、6、7、8、9或10个核苷酸内的区域。在一些实施方式中,本文提供的任何碱基编辑器均能够将核酸区域上插入缺失的形成限制为小于1%,小于1.5%,小于2%,小于2.5%,小于3%,小于3.5%,小于4%,小于4.5%,小于5%,小于6%,小于7%,小于8%,小于9%,小于10%,小于12%,小于15%或小于20%。在核酸区域形成的插入缺失的数量可以取决于核酸(例如,细胞基因组内的核酸)暴露于碱基编辑器的时间量。在一些实施方式中,在将核酸(例如,细胞基因组内的核酸)暴露于碱基编辑器至少1小时,至少2小时,至少6小时,至少12小时,至少24小时,至少36小时,至少48小时,至少3天,至少4天,至少5天,至少7天,至少10天或至少14天之后确定插入缺失的数量或比例。。
本公开的一些方面是基于以下认识:本文提供的任何碱基编辑器均能够有效地在核酸(例如DNA的基因组内的核酸)中产生预期的突变,例如点突变,而不会产生大量的意外突变,例如意外的点突变。在一些实施方式中,预期的突变是由与gRNA结合的特定碱基编辑器产生的突变,其经特别设计以产生预期的突变。在一些实施方式中,预期的突变是与疾病或病症相关的突变。在一些实施方式中,预期的突变是与疾病或病症相关的腺嘌呤(A)至鸟嘌呤(G)点突变。在一些实施方式中,预期的突变是与疾病或病症相关的胸腺嘧啶(T)至胞嘧啶(C)点突变。在一些实施方式中,预期的突变是基因的编码区内的腺嘌呤(A)至鸟嘌呤(G)点突变。在一些实施方式中,预期的突变是基因的编码区内的胸腺嘧啶(T)至胞嘧啶(C)点突变。在一些实施方式中,预期的突变是点突变,其在基因的编码区内产生终止密码子,例如过早的终止密码子。在一些实施方式中,预期的突变是消除终止密码子的突变。在一些实施方式中,预期的突变是改变基因的剪接的突变。在一些实施方式中,预期的突变是改变基因(例如,基因启动子或基因阻遏物)的调控序列的突变。在一些实施方式中,本文提供的任何碱基编辑器均能够产生大于1:1的预期突变与非预期突变(例如,预期点突变:非预期点突变)之比。在一些实施方式中,本文提供的任何碱基编辑器均能够产生预期突变与非预期突变(例如,预期点突变:非预期点突变)的比率为至少1.5:1,至少2:1,至少2.5:1,至少3:1,至少3.5:1,至少4:1,至少4.5:1,至少5:1,至少5.5:1,至少6:1,至少6.5:1,至少7:1,至少7.5:1,至少8:1,至少10:1,至少12:1,至少15:1,至少20:1,至少25:1,至少30:1,至少40:1,至少50:1,至少100:1,至少150:1,至少200:1,至少250:1,至少500:1或至少1000:1,或更高。应当理解,本文“碱基编辑器效率”部分中描述的碱基编辑器的特征可以应用于任何融合蛋白,或使用本文提供的融合蛋白的方法。
II.制备和使用进化的碱基编辑器的方法
本公开的一些方面提供了制备本文公开的进化的碱基编辑器或包含一个或多个napR/DNAbp编码核酸分子(例如,Cas9向导RNA)和本文提供的核碱基编辑器的碱基编辑器复合物的方法。另外,本公开的一些方面提供了使用进化的碱基编辑器来编辑靶核苷酸序列(例如,基因组)的方法。
连续进化方法
本公开的多个方面涉及提供连续进化的方法和系统(例如,适当的载体,细胞,噬菌体,流动容器等)。
本文提供的连续进化方法允许病毒载体中的目的基因(例如,碱基编辑器基因)在宿主细胞流中经过多代病毒生命周期进化以获得所需的功能或活性。
本发明的一些方面提供了一种使目的基因连续进化的方法,该方法包括(a)使宿主细胞群与包含目的基因的病毒载体群接触,其中(1)宿主细胞易于被病毒载体感染;(2)宿主细胞表达产生病毒颗粒所需的病毒基因;(3)产生感染性病毒颗粒所需的至少一种病毒基因的表达取决于目的基因的功能;(4)病毒载体允许蛋白质在宿主细胞中表达,并且可以被宿主细胞复制并包装成病毒颗粒。在一些实施方式中,该方法包括(b)使宿主细胞与诱变剂接触。在一些实施方式中,该方法进一步包括(c)在允许病毒复制和产生病毒颗粒的条件下温育宿主细胞群,其中从宿主细胞群中除去宿主细胞,并将新鲜的未感染宿主细胞引入宿主细胞群,从而补充宿主细胞群并产生宿主细胞的流动。在所有实施方式中,在允许目的基因获得突变的条件下温育细胞。在一些实施方式中,该方法进一步包括(d)从宿主细胞群中分离编码进化的基因产物(例如蛋白质)的病毒载体的突变形式。
在一些实施方式中,提供了一种噬菌体辅助的连续进化的方法,该方法包括(a)使细菌宿主细胞群与包含要进化的目的基因并且缺乏产生感染性噬菌体所需基因的噬菌体群接触,其中(1)噬菌体允许目的基因在宿主细胞中表达;(2)宿主细胞是用于噬菌体感染,复制和包装的合适宿主细胞;(3)宿主细胞包含表达构建体,其编码产生感染性噬菌体所需的基因,其中该基因的表达取决于目的基因的基因产物的功能。在一些实施方式中,该方法进一步包括(b)在允许目的基因突变,感染性噬菌体的产生以及宿主细胞被噬菌体感染的条件下温育宿主细胞群,其中从宿主细胞中去除感染的细胞,并且其中宿主细胞群被未被噬菌体感染的新鲜宿主细胞补充。在一些实施方式中,该方法进一步包括(c)从宿主细胞群中分离编码进化蛋白的突变噬菌体复制产物。
在一些实施方式中,病毒载体或噬菌体是丝状噬菌体,例如,M13噬菌体,如本文中其他地方更详细描述的M13选择噬菌体。在一些这样的实施方式中,产生感染性病毒颗粒所需的基因是M13基因III(gIII)。
在一些实施方式中,病毒载体感染哺乳动物细胞。在一些实施方式中,病毒载体是逆转录病毒载体。在一些实施方式中,病毒载体是疱疹性口炎病毒(VSV)载体。作为dsRNA病毒,VSV具有很高的突变率,可以携带长达4.5kb的货物(包括目的基因)。感染性VSV颗粒的产生需要包膜蛋白VSV-G,这是一种介导磷脂酰丝氨酸附着和细胞进入的病毒糖蛋白。VSV可以感染各种宿主细胞,包括哺乳动物和昆虫细胞。因此,VSV是非常适合在人,小鼠或昆虫宿主细胞中连续进化的载体。类似地,可以用VSV-G包膜蛋白假型化的其他逆转录病毒载体同样适用于本文所述的连续进化过程。
本领域技术人员知道,许多逆转录病毒载体(例如鼠白血病病毒载体或慢病毒载体)可以有效地与VSV-G包膜蛋白一起包装,以替代病毒的天然包膜蛋白。在一些实施方式中,这样的VSV-G可包装载体适用于连续进化系统,因为天然包膜(env)蛋白(例如VSVS载体中的VSV-G,或MLV载体中的env)被从病毒基因组中删除了。然后,在目的宿主细胞中活性启动子的控制下,将目的基因插入病毒基因组。进而,宿主细胞在启动子的控制下表达VSV-G蛋白,另一种适合载体假型化的env蛋白或病毒载体的天然env蛋白,该启动子的活性取决于由其编码的产物的活性。因此,与具有基线或功能丧失突变的载体相比,具有导致目的基因活性增加的突变的病毒载体的包装效率更高。
在一些实施方式中,哺乳动物宿主细胞受到病毒载体不断进化的感染,例如,包含目的基因但缺乏VSV-G编码基因的VSV载体,其中宿主细胞包含在条件启动子控制下的编码VSV-G蛋白的基因。这样的基于逆转录病毒的系统可以是双载体系统(病毒载体和包含编码包膜蛋白的基因的表达构建体),或者可替代地,可以使用辅助病毒,例如VSV辅助病毒。辅助病毒通常包含阶段的病毒基因组,其缺少将基因组包装到病毒颗粒中所需的结构元件,但是包括编码宿主细胞中病毒基因组加工和产生病毒颗粒所需的蛋白质的病毒基因。在这样的实施方式中,基于病毒载体的系统可以是三载体系统(病毒载体,包含由条件启动子驱动的包膜蛋白的表达构建体,和包含病毒基因组繁殖所需的病毒功能但不包含包膜蛋白的辅助病毒。在一些实施方式中,宿主细胞中来自辅助病毒或表达构建体的VSV基因组的五个基因的表达允许产生携带目的基因的传染性病毒颗粒,表明不平衡的基因表达允许病毒以降低的速率复制,表明降低的VSV-G表达确实将作为有效病毒生产的限制步骤。
使用辅助病毒的一个优点是病毒载体可能缺乏编码该辅助病毒提供的蛋白质或其他功能的基因,因此可以携带更长的目的基因。在一些实施方式中,辅助病毒不表达包膜蛋白,因为已知病毒包膜蛋白的表达通过受体干扰降低了某些病毒载体对宿主细胞的感染性。适用于连续进化过程的病毒载体,例如逆转录病毒载体,其各自的包膜蛋白,以及此类载体的辅助病毒,是本领域技术人员众所周知的。对于适用于本文所述的连续进化程序的一些示例性病毒基因组,辅助病毒,宿主细胞和包膜蛋白的概述,Coffin et al.,Retroviruses,CSHL Press 1997,ISBN0-87969-571-4,该文献以其整体并入本文。
在一些实施方式中,宿主细胞的温育进行如下的时间:该时间足以进行至少10,至少20,至少30,至少40,至少50,至少100,至少200,至少300,至少400,至少500,至少600,至少700,至少800,至少900,至少1000,至少1250,至少1500,至少1750,至少2000,至少2500,至少3000,至少4000,至少5000,至少7500,至少10000个或更多个连续的病毒生命周期。在某些实施方式中,病毒载体是M13噬菌体,并且单个病毒生命周期的长度为约10-20分钟。
在一些实施方式中,在悬浮培养物中接触和/或温育细胞。例如,在一些实施方式中,细菌细胞在液体培养基中的悬浮培养中温育。用于细菌悬浮培养的合适培养基对本领域技术人员而言是显而易见的,并且本发明不限于此。参见,例如,Molecular Cloning:ALaboratory Manual,2nd Ed.,ed.by Sambrook,Fritsch,and Maniatis(Cold SpringHarbor Laboratory Press:1989);Elizabeth Kutter and Alexander Sulakvelidze:Bacteriophages:Biology and Applications.CRC Press;1st edition(December 2004),ISBN:0849313368;Martha R.J.Clokie and Andrew M.Kropinski:Bacteriophages:Methods and Protocols,Volume 1:Isolation,Characterization,and Interactions(Methods in Molecular Biology)Humana Press;1st edition(December,2008),ISBN:1588296822;Martha R.J.Clokie and Andrew M.Kropinski:Bacteriophages:Methodsand Protocols,Volume 2:Molecular and Applied Aspects(Methods in MolecularBiology)Humana Press;1st edition(December 2008),ISBN:1603275649;所有文献均通过引用以其整体并入本文用于公开细菌宿主细胞培养的合适培养基。悬浮培养通常需要连续或间歇地搅拌培养基。在一些实施方式中,这是通过搅拌或搅拌包含宿主细胞群的容器来实现的。在一些实施方式中,宿主细胞的流出和新鲜宿主细胞的流入足以维持宿主细胞悬浮。尤其是当细胞流入和/或流出泻湖的流速高时。
在一些实施方式中,选择病毒载体/宿主细胞的组合,其中病毒载体的生命周期明显短于宿主细胞的细胞分裂之间的平均时间。对于许多细胞类型和载体,平均细胞分裂时间和病毒载体生命周期时间是本领域众所周知的,从而使本领域技术人员能够确定此类宿主细胞/载体的组合。在某些实施方式中,从与病毒载体接触的宿主细胞群中去除宿主细胞的速率使得宿主细胞在被去除之前保留在宿主细胞群中的平均时间短于宿主细胞的细胞分裂之间的平均时间,但要长于所用病毒载体的平均生命周期。结果是,平均而言,宿主细胞没有足够的时间在宿主细胞群中增殖,而病毒载体确实有足够的时间感染宿主细胞,在宿主细胞中复制,并在宿主细胞保留在细胞群中的时间内产生新的病毒颗粒。这确保了宿主细胞群中唯一的复制核酸是病毒载体,并且宿主细胞基因组,辅助质粒或任何其他核酸构建体不能获得允许逃避施加的选择压力的突变。
例如,在一些实施方式中,宿主细胞在宿主细胞群中保留的平均时间为约10,约11,约12,约13,约14,约15,约16,约17,约18,大约19,大约20,大约21,大约22,大约23,大约24,大约25,大约30,大约35,大约40,大约45,大约50,大约55,大约60,大约70,大约80,大约90大约100,大约120,大约150或大约180分钟。
在一些实施方式中,宿主细胞在宿主细胞群中保留的平均时间取决于宿主细胞分裂的速度和感染(或结合)所需的时间。通常,流速应比细胞分裂所需的平均时间快,但应足够慢以允许病毒(或共轭)繁殖。前者会因介质类型的不同而有所差异,可以通过添加细胞分裂抑制剂抗生素(大肠杆菌中的FtsZ抑制剂等)来延迟。由于连续进化的限制步骤是产生从细胞到细胞的基因转移所需的蛋白质,因此洗出载体的流速将取决于目的基因的当前活性。在一些实施方式中,如本文所述,可滴定地产生用于产生感染性颗粒所需的蛋白质可以减轻该问题。在一些实施方式中,噬菌体感染的指示器允许针对当前活性水平进行流速的实时计算机控制的优化。
在一些实施方式中,用新鲜的未感染的宿主细胞连续补充宿主细胞群。在一些实施方式中,这是通过将稳定的新鲜宿主细胞流流入宿主细胞群来实现的。然而,在其他实施方式中,新鲜宿主细胞向泻湖的流入是半连续或间歇的(例如分批进料)。在一些实施方式中,新鲜宿主细胞流入细胞群的速率使得补偿从宿主细胞群中去除细胞的速率。在一些实施方式中,这种细胞流量补偿的结果是,细胞群中的细胞数量在连续进化过程中基本上是恒定的。在一些实施方式中,细胞群中新鲜的未感染细胞的部分在连续进化过程的时间内基本上是恒定的。例如,在一些实施例中,宿主细胞群中大约10%,大约15%,大约20%,大约25%,大约30%,大约40%,大约50%,大约60%,大约70%,大约75%,大约80%,或约90%的细胞未感染病毒。通常,宿主细胞的流速越快,宿主细胞群中被感染的细胞部分就越小。然而,更快的流速允许更多的转移周期,例如病毒生命周期,因此,在给定的时间段内可以进化出更多的载体,而更低的流速则导致宿主中感染宿主细胞的比例更高细胞群,因此更大的文库大小以缓慢的进化为代价。在一些实施方式中,有效流速的范围总是由慢端的细胞分裂时间和高端的载体洗脱所限制。在一些实施方式中,例如按每体积细胞培养基的感染性病毒颗粒测量的病毒载量在连续进化过程中基本上是恒定的。
在一些实施方式中,新鲜的宿主细胞包含选择病毒载体所需的辅助质粒,例如,所述辅助质粒包含从正在进化的噬菌体中缺乏感染性噬菌体颗粒的产生所需的基因。在一些实施方式中,通过使未感染的宿主细胞与相关载体例如辅助质粒和任选的诱变质粒接触,并生长足以补充宿主细胞群的量的宿主细胞来产生宿主细胞。在连续进化实验中将质粒和其他基因构建体引入宿主细胞的方法是本领域技术人员众所周知的,并且本发明在此方面不受限制。对于细菌宿主细胞,这种方法包括但不限于感受态细胞的电穿孔和热激。在一些实施方式中,辅助质粒包含选择标记,例如抗生素抗性标记,并且新鲜的宿主细胞在相应抗生素的存在下生长以确保质粒在宿主细胞中的存在。当存在多个质粒时,通常使用不同的标记。这样的选择标记及其在细胞培养中的用途是本领域技术人员已知的,并且本发明在此方面不受限制。
在一些实施方式中,连续进化实验中的宿主细胞群用在平行的连续培养中生长的新鲜宿主细胞。在一些实施方式中,与病毒载体接触的宿主细胞群中宿主细胞的细胞密度和新鲜宿主细胞群的密度基本相同。
通常,从与病毒载体接触的细胞群中去除的细胞包括被病毒载体感染的细胞和未感染的细胞。在一些实施方式中,例如通过使细胞从群中连续流出而连续地从细胞群中去除细胞。在其他实施方式中,从群中半连续或间歇地去除细胞。在一些实施方式中,新鲜细胞的补充将与从细胞群中去除细胞的模式匹配,例如,如果连续去除细胞,则将连续引入新鲜细胞。然而,在一些实施例中,补充和去除的模式可能不匹配,例如,可以用新鲜细胞连续补充细胞群,并且可以半连续或分批去除细胞。
在一些实施方式中,根据定量细胞群中的宿主细胞来调节新鲜宿主细胞的补充速率和/或宿主细胞去除速率。例如,在一些实施方式中,监测包含宿主细胞群的培养基的浊度,并且如果该浊度降至阈值水平以下,则调节宿主细胞流入与宿主细胞流出的比例,以增加宿主细胞的数量。细胞培养液浊度增加表明宿主细胞数量增加。在其他实施方式中,如果浊度升高到阈值水平以上,则调节宿主细胞流入与宿主细胞流出的比例以实现群中宿主细胞数量的减少,这由降低的细胞培养物浊度所证明。将宿主细胞群中宿主细胞的密度维持在特定的密度范围内,可确保有足够的宿主细胞可作为宿主用于不断发展的病毒载体种群,并避免了因病毒包装成本和来源于细胞的毒素积累导致的营养物耗尽使培养物过度拥挤。
在一些实施方式中,宿主细胞群中的细胞密度和/或流入物中的新鲜宿主细胞密度为约102细胞/ml至约1012细胞/ml。在一些实施方式中,宿主细胞密度为约102细胞/ml,约103细胞/ml,约104细胞/ml,约105细胞/ml,约5x105细胞/ml,约106细胞/ml,约5x106细胞/ml,约107细胞/ml,约5x107细胞/ml,约108细胞/ml,约5x108细胞/ml,约109细胞/ml,约5x109细胞/ml,约1010细胞/ml,或约5x1010个细胞/ml。在一些实施方式中,宿主细胞密度大于约1010细胞/ml。
在一些实施方式中,使宿主细胞群与诱变剂接触。在一些实施方式中,与病毒载体(例如噬菌体)接触的细胞群以允许增加目的基因的突变率但对宿主细胞无明显毒性的浓度连续暴露于诱变剂,同时在宿主细胞群中。在其他实施方式中,使宿主细胞群间歇地与诱变剂接触,从而产生诱变增加的阶段,并因此产生病毒载体多样化增加的阶段。例如,在一些实施方式中,将宿主细胞在足以在目的基因中产生加快速度的诱变的诱变剂浓度暴露约10%,约20%,约50%或约75%的时间。
在一些实施方式中,宿主细胞包含诱变表达构建体,例如,在细菌宿主细胞的情况下,诱变质粒。在一些实施方式中,诱变质粒包含编码促进诱变的基因产物,例如,纠正受损的DNA聚合酶的基因表达盒。在其他实施方式中,诱变质粒,包括与SOS应激反应有关的基因(例如,UmuC,UmuD'和/或RecA)。在一些实施方式中,诱变促进基因在诱导型启动子的控制下。合适的诱导型启动子是本领域技术人员众所周知的,并且包括例如阿拉伯糖诱导型启动子,四环素或强力霉素诱导型启动子,以及他莫昔芬诱导型启动子。在一些实施方式中,使宿主细胞群与诱导型启动子的诱导剂接触,诱导剂的量足以引起诱变的速率增加。例如,在一些实施方式中,提供了细菌宿主细胞群,其中宿主细胞包含诱变质粒,其中dnaQ926,UmuC,UmuD'和RecA表达盒由阿拉伯糖诱导型启动子控制。在一些这样的实施方式中,使宿主细胞群与诱导剂例如阿拉伯糖接触,其量足以诱导增加的突变率。
使用诱导型诱变质粒可使人们在没有诱导剂的情况下产生一组新鲜的,未感染的宿主细胞,从而避免在将新鲜宿主细胞引入与病毒载体接触的细胞群之前增加其突变率。然而,一旦引入该群,这些细胞就可以被诱导以支持增加的突变率,这在连续进化的一些实施方式中特别有用。例如,在一些实施方式中,宿主细胞包含如本文所述的诱变质粒,其包含阿拉伯糖诱导型启动子,其驱动来自pBAD启动子的dnaQ926,UmuC,UmuD'和RecA730的表达(参见,例如,Khlebnikov A,Skaug T,Keasling JD.Modulation of gene expressionfrom the arabinose-inducible araBAD promoter.J Ind Microbiol Biotechnol.2002Jul;29(1):34-7,其通过引用并入本文以公开pBAD启动子。在一些实施方式中,新鲜的宿主细胞不暴露于阿拉伯糖,其激活上述鉴定的基因的表达,并因此增加暴露于阿拉伯糖的细胞中的突变率,直到宿主细胞到达泻湖,在该泻湖中选择噬菌体群复制。因此,在一些实施方式中,宿主细胞中的突变率是正常的,直到它们成为泻湖中宿主细胞群的一部分,在那里它们暴露于诱导剂(例如阿拉伯糖)并因此增加了诱变。在一些实施方式中,提供了一种连续进化的方法,该方法包括通过诱变使病毒载体群多样化的阶段,其中在适合于病毒载体诱变的条件下,在没有严格选择突变复制的条件下温育细胞以得到编码进化蛋白的病毒载体的产物。这在其中要进化的期望功能不仅是增加已经存在的功能,例如增加转录因子的转录激活速率,而且是获得在进化过程开始时不存在于目的基因中的功能的实施方式中特别有用。使病毒载体(例如噬菌体)群内的目的基因的突变形式文库多样化的步骤允许增加寻找传达所需功能的突变的机会。
在一些实施方式中,通过提供宿主细胞流来实现病毒载体群的多样化,所述宿主细胞流并非选择用于在目的基因中增加功能的突变以用于病毒载体群的复制、诱变和繁殖。在一些实施方式中,宿主细胞是表达产生感染性病毒颗粒所需的所有基因的宿主细胞,例如表达完整辅助噬菌体的细菌细胞,因此不对目的基因施加选择性压力。在其他实施方式中,宿主细胞包含辅助质粒,该辅助质粒包含条件启动子,该条件启动子的基线活性即使在不存在目的基因的显著功能获得突变的情况下也足以支持病毒载体的繁殖。这可以通过使用“泄漏的”条件启动子,通过使用高拷贝数的辅助质粒,从而放大基线泄漏和/或通过使用条件启动子来实现,该条件启动子对目标基因的初始形式产生低水平的影响,而所需的功能获得突变会显著提高活性。
例如,如在实施例部分中更详细地描述的,在一些实施方式中,使包含具有产生感染性噬菌体颗粒所需的基因的高复制性辅助质粒的宿主细胞群与包含目的基因的选择噬菌体接触,其中辅助质粒包含驱动从条件启动子产生所需基因的表达的条件启动子,所述条件启动子的活性取决于目的基因编码的基因产物的活性。在一些这样的实施方式中,低严格性选择阶段可以通过以初始目的基因显示出一些对该启动子的活性的方式设计条件启动子来实现。例如,如果要进化转录激活因子(例如T7RNAP或转录因子)以识别非原生靶DNA序列(例如,T7RNAP对其不具有活性的T3RNAP启动子序列),则低严格性辅助质粒可被设计成包含条件启动子,其中靶序列具有所需特征,但仍保留天然识别序列的特征,该特征允许转录激活因子识别靶序列,尽管效率低于其天然靶序列。最初暴露于包含杂交靶序列(例如,T7/T3杂交启动子,具有最终所需靶序列的某些特征和某些天然靶序列的低严格性辅助质粒)的噬菌体载体群可以多样化通过获得基于辅助质粒的允许特性而不能立即针对其选择的多个突变。然后可以将这种多样化的噬菌体载体群暴露于严格的选择辅助质粒,例如,在其条件启动子中包含最终期望的靶序列的质粒,该靶序列不保留天然靶序列的特征,从而产生对为活的允许识别所需的靶序列的突变的噬菌体载体的强的阴性选择性压力。
在一些实施方式中,将与进化的病毒载体群接触的初始宿主细胞群用不同于该初始群中的宿主细胞的新鲜宿主细胞补充。例如,在一些实施方式中,初始宿主细胞群由包含低严格性辅助质粒或根本不包含此类质粒的宿主细胞组成,或允许进行病毒感染和繁殖。在一些实施方式中,在使低严格度或无选择宿主细胞群中的病毒载体群多样化之后,将新鲜的宿主细胞引入宿主细胞群中,其对目的基因的所需功能施加更严格的选择压力。例如,在一些实施方式中,次级新鲜宿主细胞不再被允许用于病毒复制和繁殖。在一些实施方式中,严格选择性宿主细胞包含辅助质粒,其中条件启动子不显示或仅显示最小的基线活性,和/或在宿主细胞中仅以低或非常低的拷贝数存在。
这种涉及具有不同选择性严格性的宿主细胞的方法,可以利用本文提供的连续进化方法的力量来进化目的基因的初始形式中完全不存在的功能,例如,用于进化识别外源靶序列的转录因子,该外源把标序列是用作初始的目的基因的原生转录因子所根本不能识别的。或者,作为另一个示例,通过不结合或不表现出任何指向所需靶序列的活性的DNA结合蛋白,重组酶,核酸酶,锌指蛋白或RNA聚合酶识别所需的靶序列。
在一些实施方式中,通过惩罚不想要的活性,在如本文所述的连续进化方法期间施加否定选择。在一些实施方式中,这是通过引起不希望的活性干扰pIII产生来实现的。例如,表达与gIII RBS和/或起始密码子互补的反义RNA是应用阴性选择的一种方法,而表达蛋白酶(例如,TEV)并将蛋白酶识别位点工程化为pIII是另一种方法。
在一些实施方式中,通过惩罚进化产物的不期望的活性,在如本文所述的连续进化方法期间施加否定选择。例如,如果所需的进化产物是具有高特异性的酶,例如具有改变但未加宽的特异性的转录因子或蛋白酶,则这是有用的。在一些实施方式中,通过使不期望的活性干扰pIII的产生,从而抑制编码不期望活性的基因产物的噬菌体基因组的繁殖,来实现对不期望活性的阴性选择。在一些实施方式中,pIII的显性阴性形式的表达或与gIIIRBS和/或gIII起始密码子互补的反义RNA的表达与不期望的活性的存在相关。在一些实施方式中,将不希望其识别或切割的核酸酶或蛋白酶切割位点分别插入pIII转录物序列或pIII氨基酸序列中。在一些实施方式中,使用转录阻遏蛋白或翻译阻遏蛋白,其抑制pIII的显性阴性变体的表达并且包含不希望识别或裂解其的蛋白酶切割位点。
在一些实施方式中,通过将不期望的进化产物活性与噬菌体增殖的抑制联系起来,实现了针对非靶底物上活性的反选择。例如,在一些实施方式中,其中转录因子被进化为识别特定的靶序列,而不是不需要的脱靶序列,采用了阴性选择盒,其包括处于包含脱靶序列的启动子控制下的编码pIII的显性-阴性形式(pIII-neg)的核酸序列。如果进化产物识别出脱靶序列,则得到的噬菌体颗粒将掺入pIII-neg,从而导致噬菌体感染力和噬菌体繁殖受到抑制,从而构成对如下任何进化产物的任何噬菌体基因组的选择性缺点:该进化产物与不显示此类活性的进化产物相比显示出不理想的脱靶活性。在一些实施方式中,在连续进化实验期间应用双重选择策略,其中阳性选择和阴性选择构建体均存在于宿主细胞中。在一些这样的实施方式中,阳性和阴性选择构建体位于同一质粒上,也称为双重选择辅助质粒。
例如,在一些实施方式中,使用双重选择辅助质粒,其包含阳性选择盒和阴性选择盒,所述阳性选择盒包含处于靶核酸序列的启动子控制下的pIII编码序列,并且所述阴性选择和包含处于包含脱靶核酸序列的启动子控制下的pIII-neg编码盒。使用同时双重选择策略的一个优点是,与阳性选择构建体相比,可以基于阴性选择构建体的活性或表达水平对选择严格性进行微调。双重选择策略的另一个优势是选择不取决于所需或不想要的活性的存在与否,而是取决于所需和不想要的活性的比率以及因此得到的被加入到相应的噬菌体颗粒中的pIII和pIII-neg的比率。
本发明的一些方面提供或利用了pIII(pIII-neg)的显性阴性变体。这些方面基于令人惊讶的发现,即包含pIII的两个N末端结构域和截短的不具有末端终止能力的C末端结构域的pIII变异体不仅无活性,而且是pIII的显性阴性变体。在Bennett,N.J.;Rakonjac,J.,Unlocking of the filamentous bacteriophage virion during infection ismediated by the C-domain of pIII.Journal of Molecular Biology 2006,356(2),266-73中描述了包含pIII的两个N-末端结构域和截短的不具有终止能力的C-末端结构域的pIII变体;其全部内容通过引用并入本文。但是,此类pIII变体的显性阴性特性先前尚未描述。本发明的一些方面基于令人惊讶的发现,即本文提供的pIII-neg变体被有效地掺入噬菌体颗粒中,但是它不催化颗粒的解锁以在感染期间进入,即使野生时也使相应的噬菌体无感染性。pIII型存在于同一噬菌体颗粒中。因此,这样的pIII-neg变体可用于在PACE的背景下设计阴性选择策略,例如,通过提供包含编码pIII-neg变体的核酸序列的表达构建体,所述核酸序列处于包含识别基序的启动子的控制下,这是不希望的。在其他实施方案中,pIII-neg用于阳性选择策略,例如通过提供如下的表达构建体:其中pIII-neg编码序列由包含核酸酶靶位点或阻遏物识别位点的启动子控制,识别任何一个都是理想的。
阳性和阴性选择策略可以进一步设计为将非DNA指导的活性与噬菌体繁殖效率联系起来。例如,通过设计可被识别靶位点的蛋白酶灭活的基因表达的阻遏物,可以将针对所需靶蛋白酶切割位点的蛋白酶活性与pIII表达联系起来。在一些实施方案中,pIII表达由包含针对该阻遏物的结合位点的启动子驱动。合适的转录阻遏物是本领域技术人员已知的,并且一种示例性阻遏物是λ阻遏蛋白,其有效阻遏λ启动子pR并且可以被修饰以包括所需的蛋白酶切割位点(参见例如Sices,H.J.;Kristie,T.M.,A genetic screen for theisolation and characterization of site-specific proteases.Proc Natl Acad SciU S A 1998,95(6),2828-33;and Sices,H.J.;Leusink,M.D.;Pacheco,A.;Kristie,T.M.,Rapid genetic selection of inhibitor-resistant protease mutants:clinicallyrelevant and novel mutants of the HIV protease.AIDS Res Hum Retroviruses2001,17(13),1249-55,其每一个的全部内容通过引用并入本文)。λ阻遏物(cI)包含N端DNA结合结构域和C端二聚结构域。这两个结构域通过柔性接头连接。有效的转录抑制需要cI的二聚化,因此,连接二聚化和结合结构域的接头的切割会导致cI的阻遏物活性消失。
一些实施方案提供了pIII表达构建体,其包含驱动pIII表达的pR启动子(含有cI结合位点)。当与在连接二聚化和结合结构域的接头序列中包含所需蛋白酶切割位点的修饰的cI一起表达时,cI分子将在不存在所需蛋白酶活性的情况下抑制pIII转录,并且在存在此类蛋白酶的情况下将取消这种抑制活性,因此提供了蛋白酶切割活性和pIII表达增加之间的联系,可用于阳性PACE蛋白酶选择。一些实施方案提供了针对PACE进化产物中不希望的蛋白酶活性的阴性选择策略。在一些实施方案中,阴性选择是由表达盒赋予的,所述表达盒包含在cI抑制的启动子的控制下的pIII-neg编码核酸。当与包含不需要的蛋白酶切割位点的cI阻遏蛋白共表达时,pIII-neg的表达将在带有噬菌体的细胞中表达,该噬菌体表达的蛋白酶对不需要的靶位点表现出蛋白酶活性,因此会否定选择编码这种不需要的进化产物的噬菌体。通过共表达cI可抑制的pIII和pIII-neg编码表达构建体与识别不同DNA靶序列的正交cI变异体,可以实现蛋白酶靶特异性的双重选择,从而允许同时表达而不会互相干扰。具有二聚化特异性和DNA结合特异性的正交cI变体是本领域技术人员已知的(参见,例如,Wharton,R.P.;Ptashne,M.,Changing the binding specificity of arepressor by redesigning an alphahelix.Nature 1985,316(6029),601-5;andWharton,R.P.;Ptashne,M.,A new-specificity mutant of 434 repressor thatdefines an amino acid-basepair contact.Nature 1987,326(6116),888-91,其中每个的全部内容都通过引用并入本文)。
具有所需活性的基因产物的其他选择方案是本领域技术人员众所周知的,或者根据本公开内容将是显而易见的。可以在本文提供的连续进化过程和方法中使用的选择策略包括但不限于在双杂交筛选中有用的选择策略。例如,本文其他地方更详细描述的T7 RNAP选择策略是启动子识别选择策略的一个示例。双杂交辅助质粒设置进一步允许蛋白质-蛋白质相互作用的进化,而需要位点特异性重组酶活性以生产感染性病毒颗粒(例如pIII)所需蛋白质的辅助质粒允许重组酶进化为识别任何所需的目标站点。两杂交设置或相关的一杂交设置可进一步用于进化DNA结合蛋白,而三杂交设置可进化RNA与蛋白质的相互作用。
产生小分子的生物合成途径也可以通过响应于所需小分子的存在的启动子或核糖开关(例如,控制基因III的表达/翻译)来进化。例如,可以将仅在丁醇存在下转录的启动子放在基因III上游的辅助质粒上,以优化编码丁醇合成酶的生物合成途径。已获得促进丁醇合成的活性的携带目的基因的噬菌体载体相对于进化噬菌体群中尚未获得这种功能获得的其他噬菌体具有选择性有时。可替代地,例如,如在Baker and Cornish,PNAS,2002(其通过引用并入本文)中所述的,化学互补系统可以用于进化能够进行键形成反应的单个蛋白质或酶。在其他实施方案中,可以通过在选择噬菌体上仅表达来自辅助质粒的基因III的后半部分,在前面接上靶序列,然后放置另一半(与反式剪接的内含肽融合)来进化涉及为将其自身剪接如特定靶序列中的反式剪接的内含肽。成功的剪接将重建全长pIII编码的mRNA。可以通过表达与来自辅助质粒的大蛋白质融合并且被包含所需的蛋白酶识别位点的接头隔开的pIII来进化从辅助质粒表达融合到大蛋白上的pIII来进化蛋白酶的特异性和活性。由选择噬菌体编码的活性蛋白酶切割接头将导致感染性pIII,而未切割的pIII由于封闭蛋白而无法结合。此外,例如,如Malmborg and Borrebaeck 1997所描述的,靶抗原可以与细菌的F菌毛融合,从而阻止野生型pIII的结合。展示对抗原具有特异性的抗体的噬菌体可以结合并感染,从而在噬菌体展示中产生>1000倍的富集。在一些实施方案中,该系统可以适于连续进化,因为辅助质粒被设计成产生野生型pIII以接触tolA受体并进行实际感染(因为抗体-pIII融合体结合良好但感染效率低),而选择噬菌体编码pIII-抗体融合蛋白。包含两种类型pIII的子代噬菌体通过抗体-抗原相互作用紧密吸附至F菌毛,而野生型pIII接触tolA并介导高效感染。为了在抗体与抗原之间的初始相互作用较弱时传播,宿主细胞的混合物可以流入泻湖:一小部分表达野生型菌毛并充当受感染细胞的储库,无论活性如何,它们都可以繁殖任何选择噬菌体,而大多数细胞需要成功的相互作用,用作改善其结合亲和力的任何突变体的“奖励”。在一些实施方案中,该后一系统可以比靶病原体本身更快地进化出对靶病原体有效的新抗体,因为本文所述的PACE和其他系统的进化速率高于人类特异性病原体的进化速率,例如,人类病毒的进化速率。
设计适合于实施本文描述的选择策略的条件启动子的方法和策略是本领域技术人员众所周知的。在图3B中总结了一些示例性设计策略。对于对用于设计驱动细胞-细胞基因转移所需的基因(例如,gIII)的表达的条件启动子的示例性合适选择策略和方法的概述,参见Vidal and Legrain,Yeast n-hybrid review,Nucleic Acid Research 27,919(1999),其全部内容并入本文。
用于连续进化的设备
本发明还提供了用于核酸的连续进化的装置。这种设备的核心元件是允许产生宿主细胞流的泻湖,其中大量病毒载体可在其中复制和繁殖。在一些实施方案中,泻湖包括细胞培养容器,该细胞培养容器包含病毒载体的活跃复制的群(例如,包含目的基因的噬菌体载体),以及宿主细胞的群(例如细菌宿主细胞)。在一些实施方案中,泻湖包括用于将新鲜的宿主细胞引入泻湖的流入流和用于从泻湖移除宿主细胞的流出流。在一些实施方案中,流入流连接至包含新鲜宿主细胞培养物的恒浊器。在一些实施方案中,流出流连接至废物容器或水槽。在一些实施方案中,泻湖进一步包括用于将诱变剂引入泻湖的流入流。在一些实施方案中,该流入流连接至容纳诱变剂溶液的容器。在一些实施方案中,泻湖包括用于将基因表达的诱变剂引入泻湖的流入流,例如,激活宿主细胞内驱动促进诱变的基因的表达的诱导型启动子(例如,作为诱变颗粒的一部分)的诱变剂,如本文其他地方更详细描述的。在一些实施方案中,该流入流连接至包含诱导剂溶液如阿拉伯糖溶液的容器。
在一些实施方案中,泻湖包含病毒载体群。在一些实施方案中,泻湖包含病毒载体群。在一些实施方案中,病毒载体是缺乏产生本文所述的感染性病毒颗粒所需的基因的噬菌体,例如M13噬菌体。在一些这样的实施方案中,宿主细胞是适于噬菌体感染、复制和噬菌体繁殖的原核生物细胞,例如,包含辅助质粒的宿主细胞,辅助质粒包含在条件启动子控制下的产生感染性病毒颗粒所需的基因,如本文所述。
在一些实施方案中,泻湖包括用于调节宿主细胞的流入和流出速率、诱变剂的流入和/或诱变剂的流入的控制器。在一些实施方案中,噬菌体存在的视觉指示物,例如荧光标记物,被追踪和于控制流速,保持总感染种群恒定。在一些实施方案中,视觉标记物是由噬菌体基因组编码的荧光蛋白,或由噬菌体基因组编码的酶,其一旦在宿主细胞中表达,就会在宿主细胞中导致视觉上可检测的变化。在一些实施方案中,感染细胞的视觉跟踪用于调节流速以保持系统尽可能快地流动而没有载体洗出的风险。
在一些实施方案中,产生感染性颗粒所需的基因的表达是可滴定的。在一些实施方案中,这通过产生与添加到泻湖中的去水四环素的量成正比的pIII的辅助质粒来实现。其他在一些实施方案中,这样的可滴定的表达构建体可以与本文所述的另一种辅助质粒组合,从而允许同时选择pIII的活性和可滴定的控制。这使得活性的进化太弱而无法在泻湖中生存,并且允许中性漂移以逃脱局部适应峰陷阱。在一些实施方案中,通过惩罚不需要的活性,在如本文所述的连续进化方法期间施加否定选择。在一些实施方案中,这是通过引起不希望的活性以干扰pIII产生来实现的。例如,表达与gIII RBS和/或起始密码子互补的反义RNA是应用阴性选择的一种方法,而表达蛋白酶(例如,TEV)并将蛋白酶识别位点工程化为pIII是另一种方法。
在一些实施方式中,设备包括恒浊器。在一些实施方案中,恒浊器包括细胞培养容器,其中新鲜宿主细胞群位于例如液体悬浮培养物中。在一些实施方案中,恒浊器包括与泻湖的流入流相连的流出流,从而允许将新鲜细胞从该恒浊器引入泻湖中。在一些实施方案中,恒浊器包括用于将新鲜培养基引入该恒浊器的流入流。在一些实施方案中,流入流连接至包含无菌培养基的容器。在一些实施方案中,恒浊器进一步包括用于从该恒浊器移除宿主细胞的流出流。在一些实施方式中,流出流连接至废物容器或排水管。
在一些实施方案中,恒浊器包括用于测量恒浊器中新鲜宿主细胞培养物的浊度。在一些实施方案中,恒浊器包括控制器,该控制器基于恒浊器中培养液的浊度来调节无菌液体介质的流入和向废物容器的流出。
在一些实施方案中,泻湖和/或恒浊器包括用于恒定或间歇搅拌的振动器或搅拌器,例如振动器、混合器、搅拌器或起泡器,以允许宿主细胞群连续或间歇地进行搅拌和充氧。
在一些实施方案中,控制器将新鲜宿主细胞流入泻湖的速率调节为与从泻湖流出的速率基本相同(体积/体积)。在一些实施方案中,将新鲜宿主细胞流入和/或宿主细胞从泻湖中流出的速率调节为在连续进化实验的时间内基本恒定。在一些实施方式中,流入速率和/或流出速率是从约0.1泻湖体积/小时到约25泻湖体积/小时。在一些实施方式中,流入速率和/或流出速率是约0.1泻湖体积/小时(lv/h),约0.2lv/h,约0.25lv/h,约0.3lv/h,约0.4lv/h,约0.5lv/h,约0.6lv/h,约0.7lv/h,约0.75lv/h,约0.8lv/h,约0.9lv/h,约1lv/h,约2lv/h,约2.5lv/h,约3lv/h,约4lv/h,约5lv/h,约7.5lv/h,约10lv/h或大于10lv/h。
在一些实施方案中,基于对泻湖中宿主细胞群的定量评估来控制流入和流出速率,例如,通过测量细胞数量,细胞密度,每体积湿生物质重量,浊度或细胞生长速度。在一些实施方案中,控制泻湖的流入和/或流出速率以维持泻湖中的宿主细胞密度为约102细胞/ml至约1012细胞/ml。在一些实施方案中,控制流入和/或流出速率以维持泻湖中的宿主细胞密度为:约102细胞/ml,约103细胞/ml,约104细胞/ml,约105细胞/ml,约5x105细胞/ml,约106细胞/ml,约5x106细胞/ml,约107细胞/ml,约5x107细胞/ml,约108细胞/ml,约5x108细胞/ml,约109细胞/ml,约5x109细胞/ml,约1010细胞/毫升,约5x1010细胞/毫升,或大于5x1010细胞/毫升。在一些实施方案中,在恒浊器中的新鲜宿主细胞的密度与在泻湖中的宿主细胞的密度基本相同。
在一些实施方案中,控制泻湖的流入和流出速率以维持泻湖中的宿主细胞的数量基本恒定。在一些实施方案中,控制流入和流出速率以维持泻湖中新鲜宿主细胞的基本恒定频率。在一些实施方案中,用未被噬菌体感染的新鲜宿主细胞连续补充宿主细胞群。在一些实施方案中,补充是半连续的或通过将新鲜细胞分批进料到细胞群中来进行。
在一些实施方式中,泻湖体积为约1ml至约100l,例如,泻湖体积为约1ml,约10ml,约50ml,约100ml,约200ml,约250ml,约500ml,约750ml,约1l,约2ml,约2.5l,约3l,约4l,约5l,约10l,约1ml-10ml,约10ml-50ml,约50ml-100,约100ml-250ml,约250ml-500ml,大约500ml-1l,大约1l-2l,大约2l-5l,大约5l-10l,大约10-50l,大约50-100l或大于100l。
在一些实施方式中,泻湖和/或恒浊器还包括控制温度的加热器和恒温器。在一些实施方式中,将泻湖和/或浊度计中的温度控制为约4℃至约55℃,优选约25℃至约39℃,例如约37℃。
在一些实施方案中,控制流入速率和/或流出速率以允许宿主细胞群体的温育和补充持续至少10,至少20,至少30,至少40,至少50,至少100,至少200,至少300,至少400,至少500,至少600,至少700,至少800,至少900,至少1000,至少1250,至少1500,至少1750,至少2000,至少2500,至少3000,至少4000,至少5000,至少7500,至少10000或更多个连续的病毒载体或噬菌体生命周期。在一些实施方案中,对于一个噬菌体生命周期而言足够的时间是约10分钟。
因此,在一些实施方案中,整个进化过程的时间为约12小时,约18小时,约24小时,约36小时,约48小时,约50小时,约3天,约4天,约5天,大约6天,大约7天,大约10天,大约2周,大约3周,大约4周或大约5周。
例如,在一些实施方式中,提供了一种PACE装置,其包括约100ml或约1l体积的泻湖,其中该泻湖与约0.5l,1l或3l体积的恒浊器相连。并向包含用于诱变质粒的诱变剂(例如阿拉伯糖)的容器中输送,其中泻湖和恒浊器包含大肠杆菌细胞的悬浮培养物,其浓度约为5x108细胞/ml。在一些实施方案中,将细胞通过泻湖的流量调节至每小时约3个泻湖体积。在一些实施方式中,通过连续泵送,例如通过使用设置在对应于泻湖中的理想液体体积(例如,约100ml)的泻湖容器高度上的废物针将细胞从泻湖中移除。在一些实施方案中,宿主细胞是包含F'质粒的大肠杆菌细胞,例如基因型为F′proA+B+Δ(lacIZY)zzf::Tn10(TetR)/endA1 recA1 galE15 galK16 nupG rpsL ΔlacIZYA araD139Δ(ara,leu)7697mcrAΔ(mrr-hsdRMS-mcrBC)proBA::pir116λ-的细胞。在一些实施方案中,选择噬菌体包含M13基因组,其中pIII编码区或其一部分已被替换为目的基因,例如,通过野生型噬菌体启动子驱动的编码区。在一些实施方案中,宿主细胞包含辅助质粒,其中编码产生感染性噬菌体颗粒所需的蛋白的基因,例如M13pIII,由在本文其他地方更详细描述的条件启动子表达。在一些实施方案中,宿主细胞进一步包含诱变质粒,例如表达来自诱导型启动子如阿拉伯糖诱导型启动子的促诱变蛋白的诱变质粒。在一些实施方式中,设备被设置为向恒浊器提供新鲜的培养基以产生每小时约2-4个泻湖体积的细胞流约3-7天。
载体和试剂
本发明提供了用于本发明的连续进化过程的病毒载体。在一些实施方案中,提供了用于噬菌体辅助的连续进化的噬菌体载体。在一些实施方案中,提供了一种选择噬菌体,其包括缺乏至少一种产生感染性噬菌体颗粒所需的基因的噬菌体基因组和待进化的目的基因。
例如,在一些实施方案中,选择噬菌体包含M13噬菌体基因组,其缺乏产生感染性M13噬菌体颗粒所需的基因,例如全长gIII。在一些实施方案中,选择噬菌体包含噬菌体基因组,其提供噬菌体生命周期所需的所有其他噬菌体功能,除了产生感染性噬菌体颗粒所需的基因。在一些这样的实施方案中,提供了M13选择噬菌体,其包含gI、gII、gIV、gV、gVI、gVII、gVIII、gIX和gX基因,但不包含全长gIII。在一些实施方案中,选择噬菌体包含gIII的3′片段,但不包含全长gIII。在一些实施方式中,包含启动子并保留该启动子活性的gIII的3′-末端(见图16)对于增加位于gIII 3′-启动子的紧邻下游的gVI的表达或者对于宿主细胞中噬菌体基因的更平衡的(野生型噬菌体样的)基因表达水平之比是有益的,进而可以导致更有效的噬菌体生产。在一些实施方案中,gIII基因的3′片段包含3′-gIII启动子序列。在一些实施方案中,gIII的3′片段包含gIII的最后180bp,最后150bp,最后125bp,最后100bp,最后50bp或最后25bp。在一些实施方案中,gIII的3′-片段包含gIII的最后180bp。
提供M13选择噬菌体以使其在噬菌体基因组中包含目的基因,例如,插入到gVIII3′-终止子的下游和gIII-3′-启动子的上游。在一些实施方案中,提供了M13选择噬菌体以使其包括用于将目的基因克隆到噬菌体基因组中的多克隆位点,例如,在gVIII 3′-终止子下游和gIII-3′-启动子上游插入的多克隆位点(MCS)。
本发明的一些方面提供了用于连续进化过程的载体系统,其包括病毒载体,例如选择噬菌体,和匹配的辅助质粒。在一些实施方案中,提供了用于基于噬菌体的连续定向进化的载体系统,其包含(a)选择噬菌体,其包含待进化的目的基因,其中所述噬菌体基因组缺乏产生感染性噬菌体所需的基因;(b)辅助质粒,其包含在条件启动子的控制下产生感染性噬菌体颗粒所需的基因,其中所述条件启动子由目的基因编码的基因产物的功能激活。
在一些实施方案中,选择噬菌体是如本文所述的M13噬菌体。例如,在一些实施方案中,选择噬菌体包含M13基因组,其包括产生噬菌体颗粒所需的所有基因,例如gI,gII,gIV,gV,gVI,gVII,gVIII,gIX和gX基因,但不包括全长gIII基因。在一些实施方案中,选择噬菌体基因组包含F1或M13复制起点。在一些实施方案中,选择噬菌体基因组包含gIII基因的3′片段。在一些实施方案中,选择噬菌体在gIII 3′-启动子上游和gVIII 3′-终止子下游包含一个多克隆位点。
在一些实施方案中,选择噬菌体不包含全长gVI。GVI与gIII相似是感染所需要的,因此,可以按与本文gIII所述相似的方式用于选择。然而,发现pIII的连续表达使一些宿主细胞对M13感染具有抗性。因此,希望仅在感染后才产生pIII。这可以通过在可诱导的启动子(如本文所述的阿拉伯糖可诱导的启动子)的控制下提供编码pIII的基因,并在发生感染的泻湖中提供诱导剂而不是在恒浊器中或在感染发生之前这样做。在一些实施方案中,从选择噬菌体基因组中除去产生感染性噬菌体所需的多个基因,例如gIII和gVI,并由宿主细胞提供,例如在本文所述的辅助质粒中。
载体系统可进一步包含辅助噬菌体,其中选择噬菌体不包含产生噬菌体颗粒所需的所有基因,并且其中辅助噬菌体与选择噬菌体的基因组互补,因此辅助噬菌体基因组和选择噬菌体基因组共同包含产生噬菌体颗粒所需的所有基因的至少一个功能拷贝,但缺乏产生感染性噬菌体颗粒所需的至少一个基因。
在一些实施方案中,载体系统的辅助质粒包含表达盒,该表达盒包含在条件启动子的控制下产生感染性噬菌体所需的基因。在一些实施方案中,载体系统的辅助质粒包含在条件启动子的控制下编码pIII的基因,条件启动子的活性取决于目的基因的产物的功能。
在一些实施方案中,载体系统进一步包含诱变质粒,例如,如本文所述的阿拉伯糖可诱变的诱变质粒。
在一些实施方案中,载体系统进一步包含辅助质粒,其提供在选择噬菌体的噬菌体基因组或在辅助质粒中不包含的任何噬菌体基因的表达构建体。
在连续进化过程中本文使用的载体的多个实施方式可以包括任意组合的以下成分:
gRNA骨架
gttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcttttttt(SEQ ID NO:132)
T7 RNA聚合酶
MNTINIAKNDFSDIELAAIPFNTLADHYGERLAREQLALEHESYEMGEARFRKMFERQLKAGEVADNAAAKPLITTLLPKMIARINDWFEEVKAKRGKRPTAFQFLQEIKPEAVAYITIKTTLACLTSADNTTVQAVASAIGRAIEDEARFGRIRDLKAKHFKKNVEEQLNKRVGHVYKKAFMQVVEADMLSKGLLGGEAWSSWHKEDSIHVGVRCIEMLIESTGMVSLHRQNAGVVGQDSETIELAPEYAEAIATRAGALAGISPMFQPCVVPPKPWTGITGGGYWANGRRPLALVRTHSKKALMRYEDVYMPEVYKAINIAQNTAWKINKKVLAVANVITKWKHCPVEDIPAIEREELPMKPEDIDMNPEALTAWKRAAAAVYRKDKARKSRRISLEFMLEQANKFANHKAIWFPYNMDWRGRVYAVSMFNPQGNDMTKGLLTLAKGKPIGKEGYYWLKIHGANCAGVDKVPFPERIKFIEENHENIMACAKSPLENTWWAEQDSPFCFLAFCFEYAGVQHHGLSYNCSLPLAFDGSCSGIQHFSAMLRDEVGGRAVNLLPSETVQDIYGIVAKKVNEILQADAINGTDNEVVTVTDENTGEISEKVKLGTKALAGQWLAYGVTRSVTKRSVMTLAYGSKEFGFRQQVLEDTIQPAIDSGKGLMFTQPNQAAGYMAKLIWESVSVTVVAAVEAMNWLKSAAKLLAAEVKDKKTGEILRKRCAVHWVTPDGFPVWQEYKKPIQTRLNLMFLGQFRLQPTINTNKDSEIDAHKQESGIAPNFVHSQDGSHLRKTVVWAHEKYGIESFALIHDSFGTIPADAANLFKAVRETMVDTYESCDVLADFYDQFADQLHESQLDKMPALPAKGNLNLRDILESDFAFA*(SEQ ID NO:133)
降解决定子标签
AANDENYNYALAA(SEQ ID NO:134)
融合序列
MNTINIAKNDFSDIELAAIPFNTLADHYGERLAREQLALEHESYEMGEARFRKMFERQLKAGEVADNAAAKPLITTLLPKMIARINDWFEEVKAKRGKRPTAFQFLQEIKPEAVAYITIKTTLACLTSADNTTVQAVASAIGRAIEDEARFGRIRDLKAKHFKKNVEEQLNKRVGHVYKKAFMQVVEADMLSKGLLGGEAWSSWHKEDSIHVGVRCIEMLIESTGMVSLHRQNAGVVGQDSETIELAPEYAEAIATRAGALAGISPMFQPCVVPPKPWTGITGGGYWANGRRPLALVRTHSKKALMRYEDVYMPEVYKAINIAQNTAWKINKKVLAVANVITKWKHCPVEDIPAIEREELPMKPEDIDMNPEALTAWKRAAAAVYRKDKARKSRRISLEFMLEQANKFANHKAIWFPYNMDWRGRVYAVSMFNPQGNDMTKGLLTLAKGKPIGKEGYYWLKIHGANCAGVDKVPFPERIKFIEENHENIMACAKSPLENTWWAEQDSPFCFLAFCFEYAGVQHHGLSYNCSLPLAFDGSCSGIQHFSAMLRDEVGGRAVNLLPSETVQDIYGIVAKKVNEILQADAINGTDNEVVTVTDENTGEISEKVKLGTKALAGQWLAYGVTRSVTKRSVMTLAYGSKEFGFRQQVLEDTIQPAIDSGKGLMFTQPNQAAGYMAKLIWESVSVTVVAAVEAMNWLKSAAKLLAAEVKDKKTGEILRKRCAVHWVTPDGFPVWQEYKKPIQTRLNLMFLGQFRLQPTINTNKDSEIDAHKQESGIAPNFVHSQDGSHLRKTVVWAHEKYGIESFALIHDSFGTIPADAANLFKAVRETMVDTYESCDVLADFYDQFADQLHESQLDKMPALPAKGNLNLRDILESDFAFAWTRAANDENYNYALAA*(SEQID NO:135)
DnaE内含肽(经由XTEN接头与脱氨酶融合)
CLSYETEILTVEYGLLPIGKIVEKRIECTVYSVDNNGNIYTQPVAQWHDRGEQEVFEYCLEDGSLIRATKDHKFMTVDGQMLPIDEIFERELDLMRVDNLPN*(SEQ ID NO:136)
与APOBEC融合
MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSIWRHTSQNTNKHVEVNFIEKFTTERYFCPNTRCSITWFLSWSPCGECSRAITEFLSRYPHVTLFIYIARLYHHADPRNRQGLRDLISSGVTIQIMTEQESGYCWRNFVNYSPSNEAHWPRYPHLWVRLYVLELYCIILGLPPCLNILRRKQPQLTFFTIALQSCHYQRLPPHILWATGLKSGSETPGTSESATPECLSYETEILTVEYGLLPIGKIVEKRIECTVYSVDNNGNIYTQPVAQWHDRGEQEVFEYCLEDGSLIRRATKDHKFMTVDGQMLPIDEIFERELDLMRVDNLPN*(SEQ ID NO:137)
与Cas9融合的C-内含肽
MIKIATRKYLGKQNVYDIGVERDHNFALKNGFIASNC(SEQ ID NO:138)
与Cas9融合
MIKIATRKYLGKQNVYDIGVERDHNFALKNGFIASNCFNKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDSGGSMTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKML*(SEQ ID NO:139)
编辑DNA或RNA
本公开的一些方面提供使用如本文所述的碱基编辑器编辑合适的方法。在一些实施方案中,该方法用于编辑核酸的核碱基的(例如,双链DNA序列的碱基对)的方法。在一些实施方案中,该方法包括以下步骤:a)将核酸的靶区域(例如,双链DNA序列)与包含碱基编辑器(例如,与腺苷脱氨酶融合的Cas9结构域)和向导核酸(例如,gRNA)的复合物相接触,其中靶区域包含靶向的核碱基对,b)诱导所述靶区域的链分离,c)将靶区域的一个单链中的所述靶碱基对的第一核碱基转化为第二核碱基,和d)切割所述靶区域的不多于一个链,其中将与第一核碱基互补的第三核碱基替换为与第二核碱基互补的第四核碱基。在一些实施方案中,该方法导致核酸中的不到20%插入缺失形成。应意识到,在一些实施方案中,省略步骤b。在一些实施方案中,第一核碱基是腺嘌呤。在一些实施方案中,第二核碱基是脱氨化的腺嘌呤或肌苷。在一些实施方案中,第三核碱基是胸腺嘧啶。在一些实施方案中,第四核碱基是胞嘧啶。在一些实施方案中,该方法导致少于19%、18%、16%、14%、12%、10%、8%、6%、4%、2%、1%、0.5%、0.2%或少于0.1%插入缺失形成。在一些实施方案中,该方法还包含将第二核碱基替换为与第四核碱基互补的第五核碱基,从而产生与其的编辑碱基对(例如,A:T至G:C)。在一些实施方案中,第五核碱基是鸟嘌呤。在一些实施方案中,至少5%的预期碱基对被编辑。在一些实施方案中,至少10%、15%、20%、25%、30%、35%、40%、45%或50%的预期碱基对被编辑。
在一些实施方案中,靶核苷酸中预期产物与非预期产物之比为至少2:1,5:1,10:1,20:1,30:1,40:1,50:1,60:1,70:1,80:1,90:1,100:1或200:1或更多。在一些实施方案中,预期点突变与插入缺失形成之比大于1:1,10:1,50:1,100:1,500:1或1000:1或更多。在一些实施方案中,切割单链(刻痕链)与向导核酸杂交。在一些实施方案中,切割单链与包含第一核碱基的链相反。在一些实施方案中,碱基编辑器包含Cas9结构域。在一些实施方案中,第一碱基是腺嘌呤,和第二碱基不是G,C,A或T。在一些实施方案中,第二碱基是肌苷。在一些实施方案中,第一碱基是腺嘌呤。在一些实施方案中,第二碱基不是G,C,A或T。在一些实施方案中,第二碱基是肌苷。在一些实施方案中,碱基编辑器抑制编辑链的碱基删除修复。在一些实施方案中,碱基编辑器保护或结合未编辑链。在一些实施方案中,碱基编辑器包含UGI活性。在一些实施方案中,碱基编辑器包含催化失活的肌苷-特异性核酸酶。在一些实施方案中,碱基编辑器包含切口酶活性。在一些实施方案中,预期的编辑碱基对在PAM位点上游。在一些实施方案中,预期的编辑碱基对是PAM位点上游的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸。在一些实施方案中,预期的编辑碱基对在PAM位点下游。在一些实施方案中,预期的编辑碱基对是PAM位点下游的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸。在一些实施方案中,该方法不需要规范的(例如,NGG)PAM位点。在一些实施方案中,核碱基编辑器包含接头。在一些实施方案中,接头的长度为1-25个氨基酸。在一些实施方案中,接头的长度是5-20个氨基酸。在一些实施方案中,接头的长度是10、11、12、13、14、15、16、17、18、19或20个氨基酸。在一些实施方案中,靶区域包含靶窗口,其中靶窗口包含靶核碱基对。在一些实施方案中,靶窗口包含1-10个核苷酸。在一些实施方案中,靶窗口的长度是1-9,1-8,1-7,1-6,1-5,1-4,1-3,1-2或1个核苷酸。在一些实施方案中,靶窗口的长度是1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸。在一些实施方案中,预期的编辑碱基对在靶窗口中。在一些实施方案中,靶窗口包含预期的编辑碱基对。在一些实施方案中,该方法使用本文提供的任何碱基编辑器进行。在一些实施方案中,靶窗口是脱氨化窗口.
在一些实施方案中,本公开提供了用于编辑核苷酸的方法。在一些实施方案中,本公开提供了一种用于编辑双链DNA序列的核碱基对的方法。在一些实施方案中,该方法包括a)将双链DNA序列的靶区域与包含碱基编辑器和向导核酸(例如,gRNA)的复合物接触,其中靶区域包含靶核碱基对,b)诱导所述靶区域的链分离,c)将靶区域的单链中的所述靶碱基对的第一核碱基转化为第二核碱基,d)切割所述靶区域的不多于一个链,其中与第一核碱基互补的第三核碱基被替换为与第二核碱基互补的第四核碱基,第二核碱基被替换为与第四核碱基互补的第五核碱基,从而产生预期的编辑碱基对,其中产生预期的编辑碱基对的效率为至少5%。应意识到,在一些实施方案中,省略步骤b。在一些实施方案中,至少5%的预期碱基对被编辑。在一些实施方案中,至少10%、15%、20%、25%、30%、35%、40%、45%或50%的预期碱基对被编辑。在一些实施方案中,该方法导致少于19%、18%、16%、14%、12%、10%、8%、6%、4%、2%、1%、0.5%、0.2%或少于0.1%插入缺失形成。在一些实施方案中,靶核苷酸处的预期产物与非预期产物之比为至少2:1,5:1,10:1,20:1,30:1,40:1,50:1,60:1,70:1,80:1,90:1,100:1或200:1或更多。在一些实施方案中,预期点突变与插入缺失形成之比大于1:1,10:1,50:1,100:1,500:1或1000:1或更多。在一些实施方案中,切割单链与向导核酸杂交。在一些实施方案中,切割单链与包含第一核碱基的链相反。在一些实施方案中,第一碱基是腺嘌呤。在一些实施方案中,第二核碱基不是G,C,A或T。在一些实施方案中,第二碱基是肌苷。在一些实施方案中,碱基编辑器抑制编辑链的碱基删除修复。在一些实施方案中,碱基编辑器保护(例如,形成碱基删除修复)或结合未编辑链。在一些实施方案中,核碱基编辑器包含UGI活性。在一些实施方案中,碱基编辑器包含催化失活的肌苷-特异性核酸酶。在一些实施方案中,核碱基编辑器包含切口酶活性。在一些实施方案中,预期的编辑碱基对在PAM位点上游。在一些实施方案中,预期的编辑碱基对是PAM上游的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸。在一些实施方案中,预期的编辑碱基对在PAM位点下游。在一些实施方案中,预期的编辑碱基对是PAM位点下游的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸。在一些实施方案中,该方法不需要规范的(例如,NGG)PAM位点。在一些实施方案中,核碱基编辑器包含接头。在一些实施方案中,接头的长度为1-25个氨基酸。在一些实施方案中,接头的长度为5-20个氨基酸。在一些实施方案中,接头的长度为10、11、12、13、14、15、16、17、18、19或20个氨基酸。在一些实施方案中,靶区域包含靶窗口,其中靶窗口包含靶核碱基对。在一些实施方案中,靶窗口包含1-10个核苷酸。在一些实施方案中,靶窗口的长度为1-9、1-8、1-7、1-6、1-5、1-4、1-3、1-2或1个核苷酸。在一些实施方案中,靶窗口的长度为1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸。在一些实施方案中,预期的编辑碱基对发生在靶窗口中。在一些实施方案中,靶窗口包含预期的编辑碱基对。在一些实施方案中,核碱基编辑器是本文提供的任何一个碱基编辑器。
在另一个实施方案中,本公开提供了一种编辑方法,其包括将DNA或RNA分子与本文提供的任何碱基编辑器和与至少一个向导核酸(例如,向导RNA)接触,其中向导核酸,(例如,向导RNA)长约15-100个核苷酸,并且包含与靶序列互补的至少10个连续核苷酸的序列。在一些实施方案中,靶序列的3’端紧邻规范的PAM序列(NGG)。在一些实施方案中,靶序列的3’末端不紧邻规范的PAM序列(NGG)。在一些实施方案中,靶序列的3’末端紧邻AGC,GAG,TTT,GTG或CAA序列。
在一些实施方案中,靶DNA序列包含与疾病或病症相关的序列。在一些实施方案中,靶DNA序列包含与疾病或病症相关的点突变。在一些实施方案中,融合蛋白(例如,包含腺苷脱氨酶和Cas9结构域)或复合物的活性导致点突变的纠正。在一些实施方案中,靶DNA序列包含与疾病或病症相关的G→A点突变,和其中突变A碱基的脱氨化导致不与疾病或病症相关的序列。在一些实施方案中,靶DNA序列编码蛋白质,和点突变在密码子中,并且导致与野生型密码子相比由突变密码子编码的氨基酸发生变化。在一些实施方案中,突变A的脱氨化导致突变密码子所编码的氨基酸发生变化。在一些实施方案中,突变A的脱氨化导致编码野生型氨基酸的密码子。在一些实施方案中,接触在受试者体内进行。在一些实施方案中,受试者患有或已被诊断患有疾病或病症。在一些实施方案中,疾病或病症是苯丙酮尿症,维勒布兰德病(vWD),与突变的PTEN或BRCA1相关的肿瘤性疾病,或Li-Fraumeni综合征;。可使用本文所述的碱基编辑器治疗的示例性的疾病和病症在表1中示出。表1包含靶基因、要纠正的突变、相关疾病和相关前间隔序列的核苷酸序列以及PAM。
表1–可使用本文所述的碱基编辑器治疗的示例性的疾病和病症的列表。前间隔序列中要编辑的A用下划线示出,PAM用粗体示出。
Figure BDA0002426427270001571
一些实施方案提供了使用本文提供的进化的碱基编辑器的方法。在一些实施方案中,碱基编辑器用于通过使靶核碱基如C残基脱氨化将点突变引入到核酸中。在一些实施方案中,靶核碱基的脱氨化导致基因缺陷的纠正,例如,导致基因产物功能丧失的点突变的纠正。在一些实施方案中,基因缺陷与疾病或病症相关,例如,溶酶体贮积症或代谢病,诸如,例如,I型糖尿病。在一些实施方案中,本文提供的方法用于将失活的点突变引入到编码与疾病或病症相关的基因产物的基因或等位基因中。例如,在一些实施方案中,本文中提供了采用DNA编辑融合蛋白将失活点突变引入致癌基因中的方法(例如,在增殖性疾病的治疗中)。在一些实施方案中,失活突变可在编码序列中产生不成熟的终止密码子,这导致表达截短的基因产物,例如,缺乏全长蛋白质的功能的截短蛋白。
在一些实施方案中,本文提供的方法的目的是通过基因组编辑来恢复功能异常的基因的功能。可以例如通过纠正人细胞培养物中与疾病相关的突变来在体外验证本文提供的核碱基编辑蛋白用于基于基因编辑的人治疗剂。本领域技术人员将理解,本文提供的核碱基编辑蛋白,例如,包含核酸可编程DNA结合蛋白(例如,Cas9)和腺苷脱氨酶结构域的融合蛋白,可以用于纠正任何G至A或C到T的单点突变。在第一种情况下,将突变A脱氨化为I纠正突变,在后一种情况下,将与突变T碱基配对的A脱氨,然后进行一轮复制,以纠正突变。表1列出了可以纠正的示例性点突变。
疾病相关基因和等位基因中点突变的成功纠正为治疗和基础研究中的应用开辟了基因纠正的新策略。位点特异性单碱基修饰系统,如所公开的核酸可编程DNA结合蛋白和腺苷脱氨酶结构域的融合体,也可用于“反向”基因治疗,其中某些基因功能被有目的地抑制或消除。在这些情况下,可使用导致蛋白质失活的突变或抑制蛋白质功能的突变的位点特异性突变残基来消除或抑制蛋白质功能。
治疗方法
本公开提供了用于治疗被诊断患有与点突变相关或由点突变引起的疾病的受试者的方法,该疾病可以通过本文提供的DNA编辑融合蛋白来纠正。例如,在一些实施方案中,提供了一种方法,该方法包括对患有此类疾病(例如,如上所述的与点突变相关的癌症)的受试者施用有效量的纠正该点突变或向疾病相关基因中引入失活突变的腺苷脱氨酶融合蛋白。在一些实施方案中,疾病是增殖性疾病。在一些实施方案中,疾病是基因病。在一些实施方案中,该疾病是赘生性疾病。在一些实施方案中,该疾病是代谢病。在一些实施方案中,该疾病是溶酶体贮积病。可以通过纠正点突变或将失活突变引入疾病相关基因来治疗的其他疾病是本领域技术人员已知的,并且本公开不限于此。
本公开提供了用于治疗其他疾病或病症的方法,例如与可以通过脱氨酶介导的基因编辑来校正的点突变相关或由其引起的疾病或病症。本文中描述了一些此类疾病,并且基于本公开内容,可以用本文提供的策略和融合蛋白治疗的其他合适的疾病对于本领域技术人员将是显而易见的。示例性的合适的疾病和病症在下面列出。将理解的是,各个序列中特定位置或残基的编号取决于所使用的特定蛋白质和编号方案。编号可能不同,例如,在成熟蛋白的前体和成熟蛋白本身中,编号之间的差异可能会影响编号。本领域技术人员将能够通过本领域众所周知的方法,例如通过序列比对和同源残基的确定,来鉴定任何同源蛋白质和相应编码核酸中的各自残基。示例性的合适疾病和病症包括但不限于:2-甲基-3-羟基丁酸尿;3β-羟基类固醇脱氢酶缺乏症;3-甲基谷氨酸尿酸;3-氧代-5α-类固醇δ4-脱氢酶缺乏症;46,XY性逆转,类型1、3和5;5-羟脯氨酸酶缺乏症;6-丙酮酰四氢蝶呤合酶缺乏症;Aarskog综合征;Aase综合征;2型软骨成长不全;色盲2和7;获得性长QT综合征;Schinzel型顶骨综合征;股骨头顶上发育异常;肢端不全症2,有或没有激素抵抗;上皮角化皮;肢端发育不良;不依赖Acth的大结节性肾上腺增生2;PI3K-δ活化综合征;急性间歇性卟啉症;缺少酰基辅酶A脱氢酶家族成员9;亚当斯-奥利弗综合征5和6;腺嘌呤磷酸核糖基转移酶缺乏症;腺苷酸激酶缺乏症;腺苷琥珀酸裂合酶缺乏引起的溶血性贫血;青春期肾炎;肾-肝-胰腺发育不良;Meckel综合征7型;肾上腺皮质营养不良;成人交界性表皮松解性大疱;交界性的地方病变异表皮松解性大疱;成人神经元类脂褐藻病;成人神经元类脂褐藻病;成人发作性共济失调和动眼性失用;ADULT综合征;纤维蛋白原血症和先天性纤维蛋白原血症;常染色体隐性遗传球蛋白血症2;与年龄有关的黄斑变性3、6、11和12;Aicardi Goutieres综合征,1、4和5;Chilbain红斑狼疮1;Alagille综合征,1和2;Alexander病;碱性磷酸酶尿症;Allan-Herndon-Dudley综合征;先天性脱发;阿尔卑斯脑病;α1-抗胰蛋白酶缺乏症;常染色体显性遗传,常染色体隐性遗传和X连锁隐性Alport综合征;家族性阿尔茨海默病,3岁,有痉挛性轻瘫和失用;阿尔茨海默病,1、3和4型;低钙化型和低成熟型,IIA1产卵不全症;氨酰酶1缺乏症;阿米什人小儿癫痫综合征;产生淀粉样的运甲状腺素蛋白淀粉样变性;淀粉样变性心肌病,与甲状腺素相关;心肌病;肌萎缩性侧索硬化症的类型有1、6、15(有或没有额颞叶痴呆),22(有或没有额颞叶痴呆)和10;额颞痴呆伴TDP43夹杂物(inclusions),与TARDBP相关;Andermann综合征;Andersen Tawil综合征;先天性长QT综合征;G6PD缺乏症引起的贫血,非球囊溶血;Angelman综合征;严重的新生儿发作性脑病,伴小头畸形;对自闭症的敏感性,与X连锁3;遗传性血管病,肾病,动脉瘤和肌肉痉挛;血管紧张素转换酶,血清良性增加;无虹膜,小脑性共济失调和智力低下;无甲症;抗凝血酶III缺乏症;具有生殖器异常和类固醇生成异常的Antley-Bixler综合征;主动脉瘤,家族性胸4、6和9;胸主动脉瘤和主动脉夹层;多系统性平滑肌功能障碍综合征;Moyamoya病5;再生障碍性贫血;明显的盐皮质激素过量;精氨酸酶缺乏症;精氨酸琥珀酸裂合酶缺乏症;芳香酶缺乏症;心律失常性右室心肌病类型5、8和10;原发性家族性肥厚型心肌病;X-连锁远端多发性先天性关节炎;关节软骨病肾功能不全胆汁淤积综合征;关节软化,肾功能不全和胆汁淤积2;天冬酰胺合成酶缺乏症;神经元迁移异常;缺乏维生素E的共济失调;常染色体显性感觉共济失调;共济失调毛细血管扩张症;遗传性癌症易感综合征;转铁蛋白血症;家族性房颤,11、12、13和16;房间隔缺损2、4和7(有或没有房室传导缺损);心房停顿2;房室间隔缺损4;遗传性眼球萎缩;ATR-X综合征;Auriculocondylar综合征2;婴儿期发作的多系统自身免疫性疾病;1a型自身免疫性淋巴组织增生综合征;常染色体显性遗传不足的外胚层发育不良;常染色体显性遗传进行性外眼肌麻痹,线粒体DNA缺失1和3;常染色体显性遗传扭转性肌张力障碍4;常染色体隐性遗传性中心核肌病;常染色体隐性先天性鱼鳞病1、2、3、4A和4B;IA型和1B型常染色体隐性角质松弛;常染色体隐性遗传不足的外胚层发育不良综合征;外胚层发育不良11b;亚多汗/毛发/牙齿类型,常染色体隐性;常染色体隐性低磷酸盐血症性骨病;3型Axenfeld-Rieger综合征;Bainbridge-Ropers综合征;Bannayan-Riley-Ruvalcaba综合征;PTEN错构瘤肿瘤综合征;Baraitser-Winter综合征,1和2;Barakat综合征;Bardet-Biedl综合征,1、11、16和19;2型裸淋巴细胞综合征,补充组E;产前2型Bartter综合征;3、3型伴低钙尿症的Bartter综合征和4型;特发性基底节钙化,4;念珠状的毛发;良性家族性血尿;良性家族性新生儿发作1和2;癫痫,良性家族性新生儿1和/或肌无力;癫痫发作,早期婴儿癫痫性脑病7;良性家族性新生儿小儿惊厥;良性遗传性舞蹈病;良性肩胛腓骨肌营养不良伴心肌病;Bernard-Soulier综合征,A1和A2型(常染色体显性);最佳雌激素症,常染色体隐性遗传;β地中海贫血症;Bethlem肌病和Bethlem肌病2;Bietti晶体性角膜视网膜营养不良;先天性胆汁酸合成缺陷,2;生物素酶缺乏症;Birk Barel智力低下同型症候群;睑裂狭小、上睑下垂和倒转型内呲赘皮;Bloom综合征;Borjeson-Forssman-Lehmann综合征;BoucherNeuhauser综合征;Brachydactyly类型A1和A2;具有高血压的Brachydactyly;脑小血管疾病伴出血;支链酮酸脱氢酶激酶缺乏症;Branchiootic综合征,2和3;早发乳腺癌;家族性乳腺癌,1、2和4;脆性角膜综合征2;Brody肌病;支气管扩张,具有或不具有汗液氯化物升高,3;Brown-Vialetto-Van Laere综合征;和Brown-Vialetto-Van Laere综合征2;Brugada综合征;Brugada综合征1;心室颤动;阵发性家族性心室纤颤;Brugada综合征;和Brugada综合征;4;长QT综合征;心脏猝死;牛眼黄斑营养不良;Stargardt病4;锥细胞营养不良12;大疱鱼鳞状红皮病;Burn-Mckeown综合征;念珠菌,家族,2、5、6和8;I型和II型糖蛋白缺乏综合征;碳酸酐酶缺乏症,高氨血症;结肠癌;心律失常;长QT综合征,LQT1亚型;因细胞色素C氧化酶缺乏症而导致的致命性脑脊髓病;心脏面部皮肤综合征;心肌病;Danon病;肥厚型心肌病;左心室非致密性心肌病;Carnevale综合征;Carney复合体,类型1;肉碱酰基肉碱转位酶缺乏症;肉碱棕榈酰转移酶I,II,II(迟发)和II(婴儿)缺乏症;白内障1、4,常染色体显性遗传,常染色体显性遗传,多种类型,具有微角膜,coppock样,幼体,微角膜和糖尿,核扩散性非渐进性;儿茶酚胺能性多形性室性心动过速;尾椎退化综合征;家族性Cd8缺乏症;中枢核疾病;1,9和16号染色体的着丝粒不稳定性和免疫缺陷;小儿共济失调伴小儿进行性眼外肌麻痹和小脑共济失调,智力低下和不平衡综合征2;脑淀粉样血管病,与APP有关;脑常染色体显性和隐性动脉病伴皮质下梗死和白脑病;脑海绵状畸形2;脑筋膜骨骼骨骼综合征2;脑眼筋膜骨骼综合征;脑视网膜微血管病伴钙化和囊肿;环状脂褐藻病神经元2、6、7和10;Ch\xc3\xa9diak-Higashi综合征,Chediak-Higashi综合征,成人型;1B,2B2、2C,2F,2I,2U(轴突),1C(脱髓鞘),显性中间体C,隐性中间体A,2A2、4C,4D,4H,IF,IVF和X型Charcot-Marie-Tooth疾病;肩胛腓脊肌萎缩症;先天性非进行性远端脊髓性肌萎缩;脊髓性肌萎缩,远端,常染色体隐性遗传,5,CHARGE联合畸形;儿童低磷血症;成人低磷;胆囊炎;进行性家族性肝内胆汁淤积3;妊娠肝内胆汁淤积3;胆固醇储存疾病;胆固醇单加氧酶缺乏症(侧链裂解);软骨发育不良Blomstrand型;点状软骨发育不良1,X连锁隐性和2X连锁隐性;CHOPS综合征;慢性肉芽肿病,常染色体隐性细胞色素b阳性,1和2型;Chudley-McCullough综合征;初级,7、11、15、20和22的睫状运动障碍;I型瓜氨酸血症;I和II型瓜氨酸血症;颅骨发育不良;C样综合征;Cockayne综合征,A型;辅酶Q10缺乏症,主要是1、4和7;Coffin Siris/智障;Coffin-Lowry综合征;Cohen综合征;感冒出汗综合征1;COLE-CARPENTER综合征2;合并细胞和体液免疫缺陷的肉芽肿;合并的d-2-和l-2-羟基戊二酸尿症;合并丙二酸和甲基丙二酸尿症;组合的氧化磷酸化缺陷1、3、4、12、15和25;合并部分和完全17-α-羟化酶/17,20-裂合酶缺乏症;常见变异型免疫缺陷病9;补体成分4,由于c1抑制剂功能异常而部分缺乏;补体因子B缺乏症;锥体单色现象圆锥杆营养不良2和6;杆状营养不良性牙釉质发生不完善;先天性肾上腺增生和先天性肾上腺发育不全,X连锁;先天性巨核细胞血小板减少症;先天性无虹膜;先天性中央通气不足;巨结肠病3;先天性蛛网膜下囊肿;四肢和面部先天性挛缩,肌张力低下和发育迟缓;1B,1D,1G,1H,1J,1K,1N,1P,2C,2J,2K,IIm型先天性糖基化疾病;I型和II型先天性贫血性贫血;面部先天性外胚层发育不良;先天性红细胞生成性卟啉症;先天性2型脂肪营养不良;先天性心脏病,多种类型,2;先天性心脏病;主动脉弓断裂;先天性脂肪瘤过度生长,血管畸形和表皮痣;非小细胞肺癌;卵巢肿瘤;心脏传导缺陷,非特异性;先天性微毛萎缩;先天性肌营养不良;由于部分LAMA2缺乏而导致的先天性肌营养不良;先天性肌营养不良症-营养不良性糖尿病伴脑和眼异常,类型为A2,A7,A8,A11和A14;B2,B3,B5和B15型伴有智力障碍的先天性肌营养不良性糖营养不良症;无智力障碍的先天性肌营养不良-营养不良性糖病,B5型;先天性肌肉肥大性脑综合征;先天性肌无力综合征,对乙酰唑胺有反应;先天性肌病,纤维类型不均衡;先天性眼球瘤;1A,1B,1C,1E,1F和2A型先天性固定性夜盲症;粪卟啉;扁平角膜2;角膜营养不良,Fuchs角膜内皮细胞营养不良,4;2型角膜内皮营养不良;角膜脆性角化球,蓝巩膜和关节活动过度;Cornelia de Lange综合征,1和5;冠状动脉疾病,常染色体显性遗传2;冠状动脉心脏疾病;高脂蛋白血症2;复杂型的皮质发育不良,伴有其他脑畸形5和6;枕骨皮质畸形;皮质类固醇结合球蛋白缺乏症;2型皮质酮甲基氧化酶缺乏症;Costell综合征;Cowden综合征1;扁平髋;颅骨干发育异常,常染色体显性;颅骨前突1和4;颅骨前突和牙齿异常;X连锁肌酸缺乏症;Crouzon综合征;隐眼综合征;隐睾,单侧或双侧;Cushing指关节粘连;皮肤恶性黑色素瘤1;角质疏松症伴骨质营养不良和严重的肺部,胃肠道和泌尿系统异常;发绀,暂时性新生儿和非典型肾病;囊性纤维化;半胱氨酸尿;细胞色素c氧化酶i缺乏;细胞色素c氧化酶缺乏症;D-2-羟基戊二酸尿症2;胆道疾病,节段性;耳聋伴复杂性小耳发育不全或小二发育不全症(LAMM);耳聋,常染色体显性遗传3a,4、12、13、15,常染色体显性非综合征;感音神经常染色体显性遗传非综合征17、20和65;耳聋,常染色体隐性遗传1A,2、3、6、8、9、12、15、16、18b,22、28、31、44、49、63、77、86和89;耳聋,耳蜗,近视和智力障碍,无前庭受累,常染色体显性遗传,X连锁2;2-甲基丁酰辅酶A脱氢酶缺乏症;3-羟酰基辅酶A脱氢酶缺乏症;α-甘露糖苷酶缺乏症;芳香族L-氨基酸脱羧酶的缺乏;双磷酸甘油酸突变酶缺乏症;丁酰辅酶A脱氢酶缺乏症;铁氧化酶缺乏症;半乳糖激酶缺乏症;胍基乙酸甲酯甲基转移酶缺乏症;缺乏透明质酸氨基葡萄糖苷酶;核糖-5-磷酸异构酶缺乏症;缺乏类固醇11-β-单加氧酶;UDP葡萄糖-己糖-1-磷酸尿酸转移酶缺乏症;黄嘌呤氧化酶缺乏症;Dejerine-Sottas病;Charcot-Marie-齿病,ID和IVF型;Dejerine-Sottas综合征,常染色体显性;树突状细胞,单核细胞,B淋巴细胞和自然杀伤性淋巴细胞缺乏症;Desbuquois发育不良2;Desbuquois综合征;DFNA 2非综合性听力损失;患有视神经萎缩和耳聋的糖尿病和尿崩症;2型糖尿病和胰岛素依赖型20;Diamond-Blackfan贫血1、5、8和10;腹泻3(分泌性钠,先天性,综合征;)和5(伴簇状肠病,先天性);二羧酸氨基酸尿;弥漫型掌足角化皮棘脑神经综合征;二氢蝶呤还原酶缺乏症;扩张型心肌病1A,1AA,1C,1G,1BB,1DD,1FF,1HH,1I,1KK,1N,1S,1Y和3B;左心室不紧密3;由于细胞色素p450氧化还原酶缺乏引起的类固醇生成障碍;2B型远距离关节角膜病;2B型遗传性远端运动神经病;远端肌病Markesbery-Griggs型;远端脊髓性肌萎缩,X连锁3;湿疹-淋巴水肿综合征;缺乏皮肤的主要营养不良性大疱性表皮松解;显性遗传性视神经萎缩;Donnai Barrow综合征;多巴胺β羟化酶缺乏症;多巴胺受体d2,降低脑密度;Dowling-degos病4;Doyne蜂窝状视网膜营养不良;Malattia综合征2型;Dubin-Johnson综合征;Duchenne肌营养不良症;Becker肌营养不良症;血纤维蛋白原血症;先天性角化病常染色体显性遗传和常染色体显性遗传,3;先天性角化病,常染色体隐性,1、3、4和5;先天性角化不全X连锁;家族性运动障碍,面部肌强直;血纤维蛋白溶酶原血症;肌张力障碍2(扭转,常染色体隐性遗传),3(扭转,X连锁),5(多巴反应型),10、12、16、25、26(肌酸);良性家族性婴儿癫痫发作2;婴幼儿早期癫痫性脑病2、4、7、9、10、11、13和14;非典型Rett综合征;早期T细胞祖细胞急性淋巴细胞白血病;皮肤表皮发育异常的皮肤脆性综合征;皮肤外胚层发育不全综合征1;扁桃体,孤立的常染色体隐性和显性;外胚层发育不良和唇left裂综合征,3;Ehlers-Danlos综合征;7型(常染色体隐性遗传),经典型,2型(progeroid),羟赖氨酸缺陷型,4型,4型变体,以及由于腱生蛋白-X缺乏症;Eichsfeld型先天性肌营养不良;内分泌脑骨增生;s-cone综合征;增强;前庭导水管综合征;扩大;肠激酶缺乏症;疣状表皮增生;大疱表皮单纯性和四肢带状肌营养不良症,具有斑驳的色素沉着的单纯形,幽门闭锁的单纯形,单纯性,常染色体隐性遗传和幽门闭锁;表皮溶解性掌plant角化病;家族性高热惊厥8;癫痫,儿童期未见2、12(特发性,易感性)5(夜间额叶),夜间额叶类型1,局部,病灶可变,进行性肌阵挛3和X连锁,具有学习障碍和行为障碍;癫痫性脑病,儿童期,婴儿早期,1、19、23、25、30和32;骨骼发育不良,多发,伴有近视和传导性耳聋;阵发性共济失调2型;阵发性疼痛综合征,家族性,3;Epstein综合征;Fechtner综合征;促红细胞原卟啉;雌激素抵抗渗出性玻璃体视网膜病变6;Fabry病,心脏变异;因子H,VII,X,v和因子viii,联合缺乏2,xiii,亚单位,缺乏;家族性腺瘤性息肉病1和3;家族性淀粉样肾病,荨麻疹和耳聋;家族性冷荨麻疹;家族性小脑蚓体发育不良;家族性天疱疮;乳腺癌家族性癌症;乳腺癌易感性;骨肉瘤;胰腺癌3;家族性心肌病;家族性冷性自身炎综合征2;家族性大肠癌;家族性渗出性玻璃体视网膜病变,X-连锁;家族性偏瘫偏头痛1型和2型;家族性高胆固醇血症;家族性肥厚性心肌病1、2、3、4、4、7、10、23和24;家族性低钾血症-低镁血症;家族性增生,肾小球肾;家族性婴儿肌无力;家族性青少年痛风;家族性地中海热和家族性地中海热,常染色体显性;家族性孔性脑病;家族性卟啉单胞菌家族性肺毛细血管血管瘤病;家族性肾糖尿症;家族性肾低尿酸血症;家族性限制性心肌病1;家族性1型和3型高脂蛋白血症;Fanconi贫血,补充组E,I,N和O;Fanconi-Bickel综合征;喜爱,易感;家族性高热惊厥11Feingold综合征1;胎儿血红蛋白定量性状位点1;FG综合征;和FG综合征;4;先天性眼外肌纤维化1、2、3a(有或没有眼外受累),3b;鱼眼病;角膜营养不良;浮港综合征;伴有或没有智力障碍的言语障碍的局灶性癫痫;局灶性节段性肾小球硬化5;前脑缺陷;Frank Ter Haar综合征;Borrone Di Rocco Crovato综合征;Frasier综合征;Wilms瘤1;Freeman-Sheldon综合征;额骨骺发育异常1和3;额颞痴呆;额颞痴呆和/或肌萎缩性侧索硬化症3和4;额颞痴呆染色体3连锁和额颞痴呆泛素阳性;果糖-双磷酸酶缺乏症;弗曼综合征;γ-氨基丁酸转氨酶缺乏症;Gamstorp-Wohlfart综合征;高雪氏病1型和亚急性神经病;注视麻痹,家族性水平,进行性脊柱侧弯;广义优势营养性表皮松解性大疱;全身性癫痫伴高热惊厥加3型1型2;癫痫性脑病Lennox-Gastaut型;巨大的轴索神经病;格兰兹曼性血小板减少症;青光眼1,开角e,F和G;青光眼3,原发性先天性,d;青光眼,先天性和青光眼,先天性,结肠炎;青光眼,原发性开角,少年发病;胶质瘤易感性1;1型葡萄糖转运蛋白缺乏症;6-磷酸葡萄糖转运缺陷;GLUT1缺乏症候群2;癫痫病,特发性,易感,12;谷氨酸甲酰转移酶缺乏症;戊二酸血症IIA和IIB;戊二酸尿症,类型1;谷胱甘肽合成酶缺乏症;糖原贮积病0(肌肉),II(成人形式),IXa2,IXc,1A型;II型,IV型,IV型(合并肝和肌病),V型和VI型;Goldmann-Favre综合征;Gordon综合征;Gorlin综合征;足前脑序列;头颅前脑7;肉芽肿病,慢性,X连锁,变异;卵巢颗粒细胞瘤;灰色血小板综合征;Griscelli综合征,3型;Groenouw I型角膜营养不良;生长和智力低下,下颌面部发育不良,小头畸形和and裂;生长激素缺乏症伴垂体异常;生长激素不敏感伴免疫缺陷;GTP环水解酶I缺乏症;Hajdu-Cheney综合征;手足子宫综合征;听力受损;血管瘤,毛细血管婴儿;血液肿瘤;1、2B和3型血色素沉着症;糖尿病的微血管并发症7;转铁蛋白血清水平定量性状基因座2;血红蛋白H病(非删除);由于磷酸葡萄糖异构酶缺乏引起的溶血性贫血,非球囊性;家族性吞噬性淋巴细胞组织细胞增生,2;吞噬性淋巴细胞组织细胞增生,家族性,3;肝素辅因子II缺乏症;遗传性肠炎性肠病;遗传性乳腺癌和卵巢癌综合征;共济失调-毛细血管扩张样疾病;遗传性弥漫性胃癌;有球状的遗传性弥漫性白质脑病;遗传因素II,IX,VIII缺乏症;遗传性2型出血性毛细血管扩张;对遗传性无汗症不敏感;遗传性I型淋巴水肿;遗传性运动和感觉神经病伴视神经萎缩;遗传性肌病伴早期呼吸衰竭;遗传性神经性肌萎缩症;遗传性非息肉病结直肠肿瘤;林奇综合征;I和II;遗传性胰腺炎;胰腺炎,慢性,易感;IIB型和IIA型遗传性感觉和自主神经病;遗传性铁粒幼细胞性贫血;Hermansky-Pudlak综合征;1、3、4和6;异位,内脏,2、4和6,常染色体;异位,内脏,X-连锁;异视;组织细胞髓质网状变性;组织细胞增多症-淋巴结病加综合征;羟羧化酶合成酶缺乏症;前脑无裂畸形2、3、7和9;Holt-Oram综合征;由于MTHFR缺乏,CBS缺乏和高胱氨酸尿症引起的同型半胱氨酸,吡醇反应敏感;由于钴胺素代谢缺陷,cblE互补型导致的同型半胱氨酸尿症-巨幼细胞性贫血;Howel-Evans综合征;Hurler综合征;Hutchinson-Gilford综合征;脑积水;III型高氨血症;高胆固醇血症和高胆固醇血症,常染色体隐性遗传;Hyperekplexia 2和Hyperekplexia遗传性;高铁蛋白血症性白内障综合征;高血糖尿;伴有高热的高免疫球蛋白D;甲羟戊酸尿症;高免疫球蛋白E综合征;高胰岛素血症性低血糖家族3、4和5;高胰岛素血症-高氨血症综合征;高溶血血症;高锰血症伴肌张力障碍,红细胞增多症和肝硬化;高蛋白血症-高氨血症-尿蛋白尿症;甲状旁腺功能亢进1和2;甲状旁腺功能亢进,新生儿严重;高苯丙氨酸血症,bh4缺乏,a,由于部分pts缺乏,BH4缺乏,D和非pku;患有智力低下综合征;2、3和4的高磷血症;高毛变性骨软骨发育不良;低血脂蛋白血症,家族性,与apob32相关;低钙血症,常染色体显性1;低钙血症性高钙血症,家族性1型和3型;软骨形成;低色素性小细胞性贫血伴铁超载;肝糖原合成酶缺乏的低血糖症;促性腺激素减退性性腺功能减退11低免疫性外胚层发育不良伴免疫缺陷;低渗X连锁外胚层发育不良;低钾性周期性麻痹1和2;低镁血症1,肠;低镁血症,癫痫发作和智力低下;催眠性白细胞营养不良7;左心发育不全综合征;房室间隔缺损和常见的房室交界处;尿道下裂1和2,X连锁;甲状腺功能减退症,先天性,非甲状腺肿,1;少毛症8和12;败血病-淋巴水肿-毛细血管扩张综合征;I血型系统;Siemens大疱性鱼鳞病;剥脱性鱼鳞病;鱼鳞病早熟综合征;特发性基底节钙化5;特发性纤维化性肺泡炎,慢性形式;先天性角化不全,常染色体显性遗传,2和5;婴儿特发性高钙血症;由于钙进入缺陷2而导致T细胞失活的免疫功能障碍;免疫缺陷病15、16、19、30、31C,38、40、8,由于cd3-zeta缺陷,IgM类型1和2高,X连锁,镁缺陷,EB病毒感染和肿瘤;免疫缺陷-着丝粒不稳定-面部异常综合征2;包涵体肌病2和3;Nonaka myopathy;小儿惊厥和阵发性胆囊性纤维化,家族性;婴儿皮质肥大;婴儿GM1神经节病;婴儿低磷血症;婴儿肾炎小儿眼球震颤,X连锁;婴儿帕金森氏综合征;-肌张力障碍;与多尾精子和过多的DNA有关的不育;胰岛素抵抗;胰岛素抵抗性糖尿病和黑棘皮病;胰岛素依赖型糖尿病分泌性腹泻综合征;间质性肾炎,核糖浆增生;宫内发育迟缓,干骺端发育不良,先天性肾上腺发育不全和生殖器异常;碘代酪氨酰偶合缺陷;IRAK4缺乏症;Iridogoniodysgenesis显性类型1;铁在脑中积累;耻骨非典型增生;胰岛细胞增生;孤立的17,20-裂合酶缺乏症;孤立的促肾上腺皮质激素缺乏症;异戊酰辅酶A脱氢酶缺乏症;Jankovic Rivera综合征;Jervell和Lange-Nielsen综合征2;Joubert综合征,1、6、7、9/15(双基因),14、16和17,以及Orofaciodigital综合征,xiv;Herlitz的大结节表皮松解症;少年GM>1<神经节病;青少年息肉综合征;青少年息肉病/遗传性出血性毛细血管扩张综合征;少年视网膜分裂症;歌舞伎面谱综合征;Kallmann综合征,1、2和6;青春期延迟;Kanzaki病;Karak综合征;Kartagener综合征;Kenny-Caffey综合征,2型;Keppen-Lubinsky综合征;圆锥角膜1;毛囊角化病;掌角化病纹状体1;Kindler综合征;L-2-羟基戊二酸尿症;Larsen综合征,显性类型;角膜呈格子状营养不良III型;黑蒙(Leber amaurosis);Zellweger综合征;过氧化物酶体生物发生障碍;Zellweger综合征谱;Leber先天性黑蒙11、12、13、16、4、7和9;Leber视神经萎缩;氨基糖苷引起的耳聋;耳聋非综合征;感音性神经,线粒体;左心室不紧密5;左右轴畸形;Leigh病;线粒体短链Enoyl-CoA水合酶1缺乏症;线粒体复合体I缺乏导致的Leigh综合征;莱纳病;Leri Weill软骨异常;致命的先天性挛缩综合征,6;I型和III型白细胞粘附缺陷;脑白质营养不良;Hypomyelinating,11和6;脑白质病伴有共济失调,脑干和脊髓受累,乳酸升高,白质消失,进行性卵巢衰竭;全白甲病;莱维小体病;Lichtenstein-Knorr综合征;Li-Fraumeni综合征1;Lig4综合征;1B,2A,2B,2D型腰带型肌营养不良症,C1,C5,C9,C14;A14和B14型先天性肌营养不良-营养不良性糖尿病伴脑和眼异常;合并脂肪酶缺乏症;脂质蛋白沉着症2型和3型家族性脂肪营养不良;异头畸形1,2(X连锁),3,6(小头畸形),X连锁;皮质下层状异位症,X-连锁;肝功能衰竭急性婴儿;Loeys-Dietz综合征,1,2,3;长QT综合征,1、2、2/9、2/5,(双基因),3、5和5,获得性,易感性;肺癌;淋巴水肿,遗传性,id;原发性淋巴水肿,伴有骨髓增生异常;淋巴增生综合征;1、1(X连锁)和2;溶酶体酸性脂肪酶缺乏症;大头畸形,巨婴,面部畸形综合征;黄斑营养不良,玻璃状,成年发病;恶性高热敏感性1型;恶性淋巴瘤,非霍奇金淋巴瘤;恶性黑色素瘤前列腺恶性肿瘤;下颌骨骨质疏松症;下颌骨非典型增生,具有非典型的A型或B型脂肪营养不良;下颌面发育不全,Treacher Collins型,常染色体隐性;甘露糖结合蛋白缺乏症;枫糖浆尿病1A型和3型;马尔登·沃克(Marden Walker)综合征;马凡综合征;Marinesco-Sj\xc3\xb6gren综合征;马尔索夫综合征;1型,2型,11型,3型和9型年轻人的成熟期糖尿病;May-Hegglin异常;MYH9相关疾病;Sebastian综合征;McCune-Albright综合征;生长激素细胞腺瘤;性索间质肿瘤;库欣综合征;McKusick Kaufman综合征;McLeod神经棘皮细胞增多症;Meckel-Gruber综合征;中链酰基辅酶A脱氢酶缺乏症;髓母细胞瘤;皮质下囊肿1和2a的大脑白质脑病;先天性巨脑角质早发性毛细血管扩张症;PIK3CA相关的过度生长谱;巨脑多发性小脑回多发性脑积水综合征2;巨幼细胞性贫血,对硫胺素有反应,伴有糖尿病和感音神经性耳聋;Meier-Gorlin综合征,1和4;Melnick-Needles综合征;脑膜瘤,X连锁,3、21、30和72的智力低下;智力低下和小头畸形伴桥脑和小脑发育不全;智力低下X连锁综合征,5;智力低下,上颌前突和斜视;智力低下,常染色体显性遗传12、13、15、24、3、30、4、5、6和9;智力低下,常染色体隐性遗传15、44、46和5;智力低下,定型运动,癫痫和/或脑畸形;智力低下,综合征,Claes-Jensen型,X连锁;智力低下,X连锁,非特异性,综合征,Hedera型和综合征,wu型;缺乏肌球蛋白的先天性肌营养不良;幼年,婴儿晚期和成年型的变色性脑白质营养不良;异色性白细胞营养不良;营养不良型发育不良;I和2型高铁血红蛋白血症;蛋氨酸腺苷转移酶缺乏症,常染色体显性;甲基丙二酸血症伴高胱氨酸尿症;甲基丙二酸尿症cblB型,甲基丙二酸辅酶A突变酶缺乏引起的甲基丙二酸尿症;甲基丙二酸,mut(0)类型;小头型骨发育不良原发性侏儒症2型;小头畸形伴或不伴脉络膜视网膜病变,淋巴水肿或智力低下;小头畸形,食管裂孔疝和肾病综合征;小头畸形;call体发育不全;痉挛性截瘫50,常染色体隐性;整体发育延迟;中枢神经系统低髓鞘;脑萎缩小头畸形,正常智力和免疫缺陷;小头-毛细血管畸形综合征;小细胞性贫血;小眼症综合征,5、7和9;小眼症,分离3、5、6、8,并伴淋巴瘤6;微球菌;偏头痛,家族性基底;米勒综合征;小核肌病伴外眼肌麻痹;先天性核心肌病;Mitchell-Riley综合征;线粒体3-羟基-3-甲基戊二酰辅酶A合酶缺乏症;线粒体复合物I,II,III,III(2、4或8型核)缺乏;线粒体DNA耗竭综合征;11,12(心肌病型),2,4B(MNGIE型),8B(MNGIE型);线粒体DNA耗竭综合征;3和7,肝脑型和13(脑肌病型);线粒体磷酸载体和丙酮酸载体缺乏;线粒体三功能蛋白缺乏症;长链3-羟酰基辅酶A脱氢酶缺乏症;三好肌营养不良1;远端肌病,伴胫骨前病;Mohr-Tranebjaerg综合征;钼辅助因子缺乏症,补充组A;Mowat-Wilson综合征;血脂异常IIIγ;粘多糖贮积症为VI型,VI型(严重)和VII型;粘多糖贮积病,MPS-I-H/S,MPS-II,MPS-III-A,MPS-III-B,MPS-III-C,MPS-IV-A,MPS-IV-B;色素性视网膜炎73;神经节病GM1 type1(有心脏受累)3;多中心性骨溶解性肾病;多中心骨溶解,结节和关节病;多个先天性异常;房间隔缺损2;多发性先天性异常-低钾-癫痫综合征;3;多发皮肤和粘膜静脉畸形;多发性内分泌肿瘤,类型1和4;多发性phy骨发育不良5或占优势;多发性胃肠道闭锁;多发性翼状syndrome肉综合征;Escobar型;多种硫酸酯酶缺乏症;多发性鼻窦综合征;3;肌肉AMP脱氨酶缺乏症;肌肉眼脑疾病;肌营养不良,先天性,巨圆锥型;重症肌无力,家族性婴儿,1;先天性肌无力综合征,11岁,伴有乙酰胆碱受体缺乏症;先天性肌无力综合征,17岁,2A(慢通道),4B(快通道),无肾小管聚集体;髓过氧化物酶缺乏症;与MYH相关的息肉病;子宫内膜癌;心肌梗塞1;肌阵挛性肌张力障碍;肌阵挛性强直性癫痫;肌阵挛癫痫伴红色纤维参差不齐;肌原纤维肌病1与ZASP相关;肌红蛋白尿,急性复发,常染色体隐性遗传;肌性胃肠道脑病综合征;婴儿小脑共济失调伴进行性外眼肌麻痹;线粒体DNA耗竭综合征;4B,MNGIE型;肌病,中心核,1,先天性,有过多的肌肉纺锤体,远端,1,乳酸性酸中毒,铁粒幼细胞贫血1,线粒体进行性伴有先天性白内障,听力下降和发育延迟,以及肾小管聚集2;近视6;心肌硬化,常染色体隐性遗传;先天性肌强直;先天性肌强直,常染色体显性和隐性形式;Nail-patella综合征;Nance-Horan综合征;Nanophthalmos 2;Navajo神经肝病;血肿性肌病3和9;新生儿肌张力低下;智力残疾;癫痫发作;言语和语言发展延迟;智力低下,常染色体显性遗传31;柠檬酸缺乏引起的新生儿肝内胆汁淤积;肾病性尿崩症,肾病性尿崩症,X-连锁;肾结石/骨质疏松症,低磷酸盐血症,2;Nephronophthisis13、15和4;不孕症小脑-眼-肾综合征;(肾病,动眼性失用症和小脑异常);3型,5型肾病综合征,有或没有眼部异常,7型和9型;Nestor-Guillermo早衰综合征;Neu-Laxova综合征1;神经变性伴脑铁积聚4和6;神经铁蛋白病;1型和2型神经纤维瘤病;神经纤维肉瘤;神经下垂体尿崩症;神经病,遗传性感觉,IC型;中性1氨基酸转运缺陷;中性脂质贮积病伴肌病;中性粒细胞免疫缺陷综合征;Nicolaides-Baraitser综合征;Niemann-Pick病C1,C2,A型和C1型成人形式;非酮症高血糖症;Noonan综合征;1和4,LEOPARD综合征1;伴或不伴少年骨髓单核细胞白血病的Noonan综合征;样疾病;正常钾性周期性麻痹,对钾敏感;诺鲁姆病;癫痫,听力下降和智力低下综合征;智力迟钝,X连锁102和综合征;13;肥胖;眼白化病,I型;眼皮肤白化病1B型,3型和4型;Odontohypophosphatasia;牙质低磷;牙周牙综合征;Oguchi病;少牙结肠直肠癌综合征;Opitz G/BBB综合征;视神经萎缩9;口面指综合征;鸟氨酸氨基转移酶缺乏症;口面部裂隙11和7,唇裂/上ate-外胚层发育不良综合征;Orstavik Lindemann Solberg综合征;骨关节炎伴轻度软骨发育不良;骨软骨炎剥离;成骨不全症类型12,类型5,类型7,类型8,类型I,类型III,巩膜正常,显性形式,隐性围产期致死性;颅骨硬化性骨病纹状体;骨质疏松症常染色体显性1型和2型,隐性4型,隐性1型,隐性6型;骨质疏松合并假性神经胶质瘤;I和II型Oto-palato-digital综合征;卵巢发育不全1;卵巢白细胞营养不良;先天性肺炎4型和2型;Ovarian骨病,家族性;Pallister-Hall综合征;掌跖角化病,无软脂分解,局灶性或弥漫性;胰腺发育不全和先天性心脏病;Papillon-Lef\xc3\xa8vre综合征;副神经节瘤3;Eulenburg先天性肌强直;甲状旁腺癌;帕金森病14、15、19(青少年期),2、20(早期发病),6(常染色体隐性隐性早期发作和9;部分白化病;部分次黄嘌呤-鸟嘌呤磷酸核糖基转移酶缺乏症;视网膜色素上皮样营养不良;PC-K6a;Pelizaeus-Merzbacher病;Pendred综合征;周围性脱髓鞘性神经病,中枢性脱髓鞘;Hirschsprung病;永久性新生儿糖尿病;永久性新生儿糖尿病,具有神经系统特征;新生儿胰岛素依赖性糖尿病;成熟期年轻的2型;过氧化物酶体生物发生障碍14B,2A,4A,5B,6A,7A和7B;Perrault综合征;4;Perry综合征;婴儿持续性高胰岛素血症性低血糖;家族性高胰岛素血症;表型;苯丙酮尿症;嗜铬细胞瘤;遗传性副神经节瘤-嗜铬细胞瘤综合征;副神经节1;肠类癌;考登综合征;3;磷酸甘油酸脱氢酶缺乏症;磷酸甘油酸激酶1缺乏症;光敏性毛滴虫营养不良;植酸储存病;选择疾病;皮尔森综合征;色素性视网膜营养不良;色素性结节性肾上腺皮质疾病,原发性;1;乳房瘤皮特-霍普金斯综合征;垂体依赖性皮质醇过多症;垂体激素缺乏症,合并1、2、3和4;纤溶酶原激活物抑制剂1型缺乏;纤溶酶缺乏症,I型;血小板型出血性疾病15和8;鬼臼皮病,遗传性纤维化,肌腱挛缩,肌病和肺纤维化;多囊肾病2,成年型和婴儿型;多囊性脂膜性骨增生伴硬化性白质脑病;聚葡聚糖体肌病1有或没有免疫缺陷;多小脑回,不对称,双侧额叶;多发性神经病,听力丧失,共济失调,色素性视网膜炎和白内障;桥小脑发育不全4型;腘翼状胬肉综合征综合征;潜伏期2;猪角化病8,弥漫性浅表光化型;胆色素原合酶缺乏症;卟啉胆素原合酶缺乏;后柱共济失调伴色素性视网膜炎;后极性白内障2型;Prader-Willi样综合征;卵巢早衰4、5、7和9;原发性常染色体隐性小头畸形10、2、3和5;原发性睫状运动障碍24;原发性扩张型心肌病;左心室不紧致6;4,左心室不紧致10;阵发性房颤;原发性高草酸尿症,I型,III型和III型;原发性肥厚性骨关节炎,常染色体隐性遗传2;原发性低镁血症;原发性开角型青光眼少年发作1;原发性肺动脉高压;报春花综合征;1B型进行性家族性心脏传导阻滞;进行性家族性肝内胆汁淤积2和3;进行性肝内胆汁淤积;进行性肌阵挛性癫痫伴共济失调;进行性假性类风湿发育不良;进行性硬化性脊髓灰质炎;蛋白酶缺乏症脯氨酸脱氢酶缺乏症;精神分裂症4;备解素缺乏症,X连锁;丙酸血症;前蛋白转化酶1/3缺乏症;前列腺癌,遗传性,2;蛋白尿;芬兰先天性肾病综合征;变形综合征;乳腺腺癌;假性软骨发育不良性脊柱骨赘发育不良综合征;假性低醛固酮增多症1型常染色体显性和隐性2型;假性甲状旁腺功能低下1A型,假性甲状旁腺功能低下;假性肾上腺皮质营养不良;假性原发性醛固酮增多症;弹性假黄瘤;婴儿的全身动脉钙化2;多发性凝血因子缺乏症的类假性黄瘤牛皮癣易感性2;PTEN错构瘤肿瘤综合征;与遗传性出血性毛细血管扩张有关的肺动脉高压;端粒相关的肺纤维化和/或骨髓衰竭,1和3;肺动脉高压,原发性1,伴有遗传性出血性毛细血管扩张;嘌呤核苷磷酸化酶缺乏症;丙酮酸羧化酶缺乏症;丙酮酸脱氢酶E1-alpha缺乏;丙酮酸激酶缺乏症的红细胞;雷恩综合征;皮肤病;隐性营养不良性大疱性表皮松解;非先天性先天性指甲疾病8;Reifenstein综合征;肾非典型增生;肾肉碱运输缺陷;肾小球瘤综合征;肾发育不良;肾发育不良,视网膜色素营养不良,小脑共济失调和骨骼发育不良;肾小管性酸中毒,远端,常染色体隐性遗传,伴迟发性感音神经性听力丧失或溶血性贫血;肾小管性酸中毒,近端,有眼部异常和智力低下;视网膜锥营养不良3B;色素性视网膜炎;色素性视网膜炎10、11、12、14、15、17和19;色素性视网膜炎2,20,25,35,36,38,39,4,40,43,45,48,66,7,70,72;视网膜母细胞瘤;瑞特障碍横纹肌瘤易感综合征2;类风湿性视网膜脱离,常染色体显性;2型和3型点状软骨发育不良;罗伯茨-SC海豹肢症综合征;Robinow Sorauf综合征;Robinow综合征,常染色体隐性遗传,常染色体隐性遗传,具有brachy-syn-polydactyly;Rothmund-Thomson综合征;Rapadilino综合征;与RRM2B相关的线粒体疾病;Rubinstein-Taybi综合征;Sandhoff病,成年和婴儿类型;结节病,早发;Blau综合征;1型Schindler病;Schizencephaly;精神分裂症15;Schneckenbecken非典型增生;Schwannomatosis 2;Schwartz Jampel综合征;1型;巩膜巩膜炎,常染色体隐性;硬化症;继发性甲状腺功能减退;濑川综合征,常染色体隐性遗传;Senior-Loken综合征,4和5;感觉性共济失调,构音障碍和眼轻瘫;Sepaapterin还原酶缺乏症;SeSAME综合征;由于ADA缺乏而导致的严重综合免疫缺陷,伴小头畸形,生长迟缓和对电离辐射敏感,非典型,常染色体隐性,T细胞阴性,B细胞阳性,NK细胞阴性,NK阳性;部分腺苷脱氨酶缺乏症;严重的先天性中性粒细胞减少症;严重的先天性中性粒细胞减少症3,常染色体隐性或显性;重度先天性中性粒细胞减少和6,常染色体隐性遗传;婴儿时期严重的肌阵挛性癫痫;全身性癫痫伴高热惊厥,类型1和2;严重的X连锁肌管肌病;短QT综合征;3;身材矮小,非特异性骨骼异常;身材矮小,听觉管道闭锁,下颌发育不全,骨骼异常;身材矮小,甲癣,面部畸形和发育不全;原始侏儒症;短肋胸发育不良11或3,有或没有多指的;甲型和乙型疟疾;银痉挛性截瘫综合征;神经传导速度减慢,常染色体显性;Smith-Lemli-Opitz综合征;斯奈德·罗宾逊综合征;体营养腺瘤;泌乳素瘤家族性,垂体腺瘤的易感性;索托斯综合征,1或2;痉挛性共济失调5,常染色体隐性,Charlevoix-Saguenay型,1,10或11,常染色体隐性;肌萎缩性侧索硬化5型;痉挛性截瘫15、2、3、35、39、4,常染色体显性,55,常染色体隐性和5A;胆汁酸合成缺陷,先天性3;生精失败11、3和8;球形细胞增多症类型4和5;球体肌病;脊髓性肌萎缩症,下肢占优势2,常染色体显性;脊髓型肌萎缩症,II型;脊髓小脑共济失调14,21,35,40,和6;脊髓小脑共济失调常染色体隐性1和16;脾脏发育不全;腰椎棘突滑行综合征;脊柱神经性发育不良,类似Ehlers-Danlos综合征,具有免疫失调,Aggrecan型,先天性关节脱位,短肢型,Sedaghatian型,锥杆型营养不良和Kozlowski型;超准侏儒症;Stargardt病1;圆锥杆营养不良3;Stickler综合征,1型;Kniest dysplasia;Stickler综合征,1型(非综合征;性眼)和4型;Sing相关性血管疾病,小儿发作;Stormorken综合征;Sturge-Weber综合征,毛细血管畸形,先天性,1;琥珀酰辅酶A乙酰乙酸转移酶缺乏症;蔗糖异麦芽糖酶缺乏症;婴儿猝死综合征;亚硫酸盐氧化酶缺乏症,分离;瓣上主动脉瓣狭窄;表面活性剂代谢功能异常,肺部2和3;指交近端1b;塞纳尼·伦茨(Cenani Lenz)类型;并指型3;X线综合征;智障16;马蹄内翻足;Tangier病;TARP综合征;Tay-Sachs病,B1变异,Gm2-神经节病(成人),Gm2-神经节病(成人发病);Temtamy综合征;Tenorio综合征;晚期骨性发育异常;睾丸激素17-β-脱氢酶缺乏症;四肢畸形,常染色体隐性;法洛四联症;左心发育不全综合征2;动脉干;心脏和大血管畸形;室间隔缺损1;Thiel-Behnke角膜营养不良;胸主动脉瘤和主动脉夹层;Marfanoid habitus;三M综合征2;血小板减少,血小板功能障碍,溶血和血红蛋白合成失衡;血小板减少症,X连锁;血友病,遗传性,由于蛋白C缺乏,常染色体显性和隐性;甲状腺发育不全;甲状腺癌,滤泡性;甲状腺激素代谢异常;全身性常染色体显性甲状腺激素抵抗;甲状腺毒性周期性麻痹和甲状腺毒性周期性麻痹2;促甲状腺激素释放激素抵抗,普遍存在;蒂莫西综合征;TNF受体相关的周期性发热综合征,(TRAPS);牙齿发育不全,选择性3和4;尖端扭转;Townes-Brocks-支气管肾样综合征;新生儿暂时性大疱性皮肤溶解;Treacher collins综合征1;睫状体扩大症,伴有智力低下,侏儒症和视网膜色素变性;Ⅰ型鼻咽肌发育异常;棘鼻咽综合征,3型;三甲基尿结节性硬化症综合征;淋巴管肌瘤病;结节性硬化症1和2;酪氨酸酶阴性眼皮肤白化病;酪氨酸酶阳性眼皮肤白化病;I型酪氨酸血症;UDPglucose-4-差向异构酶缺乏症;Ullrich先天性肌营养不良症;尺骨和腓骨缺失,严重肢体缺乏;Upshaw-Schulman综合征;尿酸水合酶缺乏症;1、1B,1D,1G,2A,2C和2D型Usher综合征;色素性视网膜炎39;紫外线敏感综合征;Van der Woude综合征;Van Maldergem综合征2;Hennekam淋巴管扩张症-淋巴水肿综合征2;不定性卟啉病;脑室肥大伴囊性肾病;Verheij综合征;超长链酰基辅酶A脱氢酶缺乏症;膀胱输尿管反流8;内脏异质性5,常染色体;内脏肌病维生素D依赖性病,类型1和2;珍珠状营养不良;von Willebrand病2M型和3型;1、4C和2E型Waardenburg综合征;(伴有神经系统疾病);Klein-Waardenberg综合征;Walker-Warburg先天性肌营养不良;Warburg微综合征;2和4;疣,低球蛋白血症,感染和骨髓软化;韦弗综合征;Weill-Marchesani综合征1和3;Weill-Marchesani样综合征;Weissenbacher-Zweymuller综合征;Werdnig-Hoffmann病;Charcot-Marie-Tooth病;Werner综合征;WFS1相关疾病;Wiedemann-Steiner综合征;威尔逊病;Wolfram样综合征,常染色体显性;Worth疾病;范布赫姆病2型;色素干燥皮炎,补充组b,D组,E组和G组;X连锁的丙种球蛋白血症;X连锁遗传性运动和感觉神经病;X-连锁鱼鳞病,伴有硫酸酯酶缺乏症;X联脑室周围异位;I型oto-palato-digital综合征;X连锁严重合并免疫缺陷;Zimmermann-Laband综合征;和Zimmermann-Laband综合征2;带状粉状性白内障3。
本公开提供了包含致病性G至A或C至T突变的基因的列表。可以使用本文提供的方法和组合物纠正这种病原性的G至A或C至T突变,例如通过将A突变为G,和/或将T突变为C,从而恢复基因功能。表2包括可以使用本文所述的碱基编辑器纠正的示例性突变。表2包括基因符号、相关的表型、待纠正的突变以及可用于纠正突变的示例性gRNA序列。表2中提供的gRNA序列是编码可将Cas9或herin提供的任何碱基编辑器导向靶位点的RNA的序列。例如,可以将表2中提供的gRNA序列克隆到gRNA表达载体(例如pFYF)中,以将靶向Cas9的gRNA(或本文提供的任何碱基编辑器)编码到靶位点,以纠正疾病,相关突变。然而,应当理解,可以纠正其他突变以治疗与G至A或C至T突变相关的其他疾病。此外,可以基于本公开内容和本领域的知识设计其他gRNA,本领域技术人员将理解。
药物组合物
本公开的其他方面涉及药物组合物,其包含本文所述的任何腺苷脱氨酶、融合蛋白或融合蛋白-gRNA复合物。如本文所用,术语“药物组合物”是指配制用于药物用途的组合物。在一些实施方案中,药物组合物还包含可药用载体。在一些实施方案中,药物组合物包含另外的试剂(例如用于特异性递送,增加的半衰期或其他治疗化合物)。
如本文所用,术语“可药用载体”是指涉及将化合物从身体的一个部位(例如,递送位置)携带或输送到另一位置(例如,身体的器官、组织或部分)的可药用材料、组合物或媒介物,例如液体或固体填充剂,稀释剂,赋形剂,制造助剂(例如润滑剂,滑石、硬脂酸镁、钙或锌或硬脂酸)或溶剂封装材料。可药用载体在与制剂的其他成分相容并且对受试者的组织无害的意义上(例如,生理相容性,无菌,生理pH等)是“可接受的”。可以用作可药用载体的材料的一些示例包括:(1)糖,例如乳糖,葡萄糖和蔗糖;(2)淀粉,例如玉米淀粉和马铃薯淀粉;(3)纤维素及其衍生物,例如羧甲基纤维素钠,甲基纤维素,乙基纤维素,微晶纤维素和醋酸纤维素;(4)黄芪粉;(5)麦芽;(6)明胶;(七)润滑剂,如硬脂酸镁,十二烷基硫酸钠和滑石粉;(8)赋形剂,例如可可脂和栓剂蜡;(九)花生油,棉籽油,红花油,芝麻油,橄榄油,玉米油和大豆油等油;(10)二醇,例如丙二醇;(11)多元醇,例如甘油,山梨糖醇,甘露糖醇和聚乙二醇(PEG);(12)酯,例如油酸乙酯和月桂酸乙酯;(13)琼脂;(14)缓冲剂,例如氢氧化镁和氢氧化铝;(15)海藻酸;(16)无热原水;(17)等渗盐水;(18)林格氏溶液;(19)乙醇;(20)pH缓冲溶液;(21)聚酯,聚碳酸酯和/或聚酐;(22)填充剂,例如多肽和氨基酸;(23)血清成分,例如血清白蛋白,HDL和LDL;(22)C2-C12醇,例如乙醇;(23)药物制剂中使用的其他无毒相容性物质。制剂中也可以存在润湿剂,着色剂,脱模剂,包衣剂,甜味剂,调味剂,加香剂,防腐剂和抗氧化剂。诸如“赋形剂”,“载体”,“可药用载体”等的术语在本文中可互换使用。
在一些实施方案中,配制药物组合物以递送至受试者,例如,用于基因编辑。施用本文所述药物组合物的合适途径包括但不限于:局部,皮下,透皮,皮内,病变内,关节内,腹膜内,膀胱内,透粘膜,牙龈,齿内,耳蜗内,耳蜗,鼓膜内,器官,硬膜外,鞘内,鞘内,肌内,静脉内,血管内,骨内,眼周,肿瘤内,脑内和脑室内给药。
在一些实施方案中,本文所述的药物组合物局部施用于患病部位(例如肿瘤部位)。在一些实施方案中,本文所述的药物组合物通过注射,通过导管,通过栓剂或通过植入物施用于受试者,所述植入物为多孔、无孔或凝胶状材料,包括诸如唾液弹性膜的膜或纤维。
在其他实施方案中,本文所述的药物组合物在控释系统中递送。在一个实施方案中,可以使用泵(参见,例如,Langer,1990,Science 249:1527-1533;Sefton,1989,CRCCrit.Ref.Biomed.Eng.14:201;Buchwald et al.,1980,Surgery 88:507;Saudek et al.,1989,N.Engl.J.Med.321:574)。在另一个实施方案中,可以使用聚合物材料。(参见,例如Medical Applications of Controlled Release(Langer and Wise eds.,CRC Press,Boca Raton,Fla.,1974);Controlled Drug Bioavailability,Drug Product Design andPerformance(Smolen and Ball eds.,Wiley,New York,1984);Ranger and Peppas,1983,Macromol.Sci.Rev.Macromol.Chem.23:61.See also Levy et al.,1985,Science 228:190;During et al.,1989,Ann.Neurol.25:351;Howard et al.,1989,J.Neurosurg.71:105.)其他控释系统例如在上文的Langer中讨论。
在一些实施方案中,按照常规程序将药物组合物配制成适于静脉内或皮下施用给受试者例如人的组合物。在一些实施方案中,用于注射给药的药物组合物是在无菌等渗水性缓冲液中的溶液。必要时,药物还可以包括增溶剂和局部麻醉剂,例如利多卡因,以减轻注射部位的疼痛。通常,成分以单位剂型单独或混合在一起提供,例如,作为干燥的冻干粉末或无水浓缩物,放在指示活性剂含量的密闭容器中,例如安瓿或小药囊中。如果要通过输液方式给药,可以用装有无菌药物级水或盐水的输液瓶分配。在通过注射施用药物组合物的情况下,可以提供安瓿注射用无菌水或盐水,以便可以在施用之前将成分混合。
用于全身给药的药物组合物可以是液体,例如无菌盐水,乳酸林格氏液或汉克溶液。另外,药物组合物可以是固体形式,并且在使用前立即重新溶解或悬浮。还考虑了冻干形式。
药物组合物可以包含在脂质颗粒或囊泡中,例如脂质体或微晶,其也适合于肠胃外给药。颗粒可以具有任何合适的结构,例如单层或多层,只要其中包含组合物即可。可以将化合物截留在“稳定的质粒-脂质颗粒”(SPLP)中,该颗粒包含促融合脂质油酰磷脂酰乙醇胺(DOPE),低水平(5-10mol%)的阳离子脂质,并通过聚乙二醇(PEG)涂层使其稳定(Zhang Y.P.et al.,Gene Ther.1999,6:1438-47)。带正电荷的脂质,例如N-[1-(2,3-二醇基氧丙基)丙基]-N,N,N-三甲基铵甲基硫酸盐或“DOTAP”,对于此类颗粒和囊泡特别优选。这种脂质颗粒的制备是众所周知的。参见,例如,美国专利第4,880,635号;和4,906,477;4,911,928;4,917,951;4,920,016;4,921,757;每一个均通过引用并入本文。
本文所述的药物组合物可以例如以单位剂量施用或包装。当涉及本公开内容的药物组合物时,术语“单位剂量”是指适合作为对象的单位剂量的物理上离散的单位,每个单位包含预定量的活性物质以及所需的稀释剂(即,载体或介质),所述活性物质经计算可产生期望的治疗效果。
此外,可以将药物组合物作为药物试剂盒提供,其包括(a)包含冻干形式的本发明化合物的容器和(b)包含用于注射的可药用稀释剂(例如无菌水)的第二容器。可药用稀释剂可用于重构或稀释本发明的冻干化合物。任选地与这样的容器相关联的可以是由政府机构规定的用于规范药品或生物制品的生产,使用或销售的通知,该通知反映了该生产,使用或销售的机构对人类管理的认可。
另一方面,包括一种制品,其包含可用于治疗上述疾病的材料。在一些实施例中,该制品包括容器和标签。合适的容器包括例如瓶、小瓶、注射器和试管。容器可以由多种材料形成,例如玻璃或塑料。在一些实施方案中,容器容纳有效治疗本文所述疾病的组合物,并且可以具有无菌进入口。例如,容器可以是静脉内溶液袋或具有可被皮下注射针刺穿的塞子的小瓶。组合物中的活性剂是本发明的化合物。在一些实施方案中,容器上或与容器相关的标签表明该组合物用于治疗选择的疾病。该制品可以进一步包括第二容器,该第二容器包含药学上可接受的缓冲剂,例如磷酸盐缓冲盐水,林格氏溶液或右旋糖溶液。从商业和用户的角度来看,它可能还包括其他材料,包括其他缓冲液,稀释剂,过滤器,针头,注射器和带有使用说明的包装说明书。
递送方法
在一些方面,本发明提供了一种方法,包括将一种或多种多核苷酸(如本文所述的一种或多种载体)、其一种或多种转录物和/或从其转录的一种或多种蛋白质,递送至宿主细胞的方法。在一些方面,本发明进一步提供了通过此类方法产生的细胞,以及包含此类细胞或由此类细胞产生的生物(例如动物,植物或真菌)。在一些实施方案中,与向导序列结合(并且任选地与之结合)的本文所述的碱基编辑器被递送至细胞。常规的基于病毒和非病毒的基因转移方法可用于将核酸引入哺乳动物细胞或靶组织。此类方法可用于向培养中或宿主生物中的细胞施用编码碱基编辑器成分的核酸。非病毒载体递送系统包括DNA质粒,RNA(例如本文所述的载体的转录物),裸核酸以及与诸如脂质体的递送载体复合的核酸。病毒载体递送系统包括DNA和RNA病毒,它们在递送至细胞后具有游离基因组或整合的基因组。有关基因治疗程序的概述,请参见Anderson,Science 256:808-813(1992);Nabel&Felgner,TIBTECH 11:211-217(1993);Mitani&Caskey,TIBTECH 11:162-166(1993);Dillon,TIBTECH 11:167-175(1993);Miller,Nature 357:455-460(1992);Van Brunt,Biotechnology 6(10):1149-1154(1988);Vigne,Restorative Neurology andNeuroscience 8:35-36(1995);Kremer&Perricaudet,British Medical Bulletin 51(1):31-44(1995);Haddada et al.,in Current Topics in Microbiology and ImmunologyDoerfler and Bihm(eds)(1995);and Yu et al.,Gene Therapy 1:13-26(1994)。
核酸的非病毒递送方法包括脂质转染,核转染,显微注射,生物弹药,病毒体,脂质体,免疫脂质体,聚阳离子或脂质:核酸偶联物,裸DNA,人工病毒体和试剂增强的DNA摄入。脂质转染在例如美国专利5,049,386、4,946,787;和4,897,355中描述,脂转染试剂在市面上有售(例如TransfectamTM和LipofectinTM)。适用于多核苷酸的有效受体识别脂质转染的阳离子脂质和中性脂质包括Feigner的WO 91/17424;和WO 91/16024的那些。可以递送至细胞(例如体外或离体施用)或靶组织(例如体内施用)。
脂质:核酸复合物(包括靶向脂质体如免疫脂质复合物)的制备是本领域技术人员众所周知的(参见,例如,Crystal,Science 270:404-410(1995);Blaese et al.,CancerGene Ther.2:291-297(1995);Behr et al.,Bioconjugate Chem.5:382-389(1994);Remyet al.,Bioconjugate Chem.5:647-654(1994);Gao et al.,Gene Therapy 2:710-722(1995);Ahmad et al.,Cancer Res.52:4817-4820(1992);U.S.Pat.Nos.4,186,183,4,217,344,4,235,871,4,261,975,4,485,054,4,501,728,4,774,085,4,837,028,and 4,946,787)。
基于RNA或DNA病毒的系统用于递送核酸的利用利用了高度进化的过程,该过程将病毒靶向到体内的特定细胞并将病毒有效载荷运输到细胞核。病毒载体可直接施用于患者(体内),或可用于体外治疗细胞,修饰的细胞可任选地施用于患者(离体)。基于病毒的常规系统可以包括用于基因转移的逆转录病毒、慢病毒、腺病毒、腺相关病毒和单纯疱疹病毒载体。使用逆转录病毒、慢病毒和腺相关病毒的基因转移方法可以整合到宿主基因组中,通常会导致插入的转基因长期表达。另外,已经在许多不同的细胞类型和靶组织中观察到高转导效率。
使用基于RNA或DNA病毒的系统用于递送核酸利用了高度进化的过程以将病毒靶向到体内的特定细胞并将病毒有效载荷运输到细胞核。病毒载体可直接施用于患者(体内),或可用于体外治疗细胞,修饰的细胞可任选地施用于患者(离体)。基于病毒的常规系统可以包括用于基因转移的逆转录病毒,慢病毒,腺病毒,腺相关病毒和单纯疱疹病毒载体。用逆转录病毒,慢病毒和腺相关病毒基因转移方法可以整合到宿主基因组中,通常会导致插入的转基因长期表达。另外,已经在许多不同的细胞类型和靶组织中观察到高转导效率。
可以通过掺入外来包膜蛋白,扩大靶细胞的潜在靶群来改变病毒的向性。慢病毒载体是能够转导或感染非分裂细胞并通常产生高病毒滴度的逆转录病毒载体。因此,逆转录病毒基因转移系统的选择将取决于靶组织。逆转录病毒载体由顺式作用的长末端重复序列组成,其包装能力可容纳6-10kb的外源序列。最小的顺式作用LTR足以复制和包装载体,然后将其用于将治疗性基因整合到靶细胞中以提供永久性转基因表达。广泛使用的逆转录病毒载体包括基于鼠白血病病毒(MuLV),长臂猿白血病病毒(GaLV),猿猴免疫缺陷病毒(SIV),人免疫缺陷病毒(HIV)及其组合的那些(参见,例如,Buchscher et al.,J.Virol.66:2731-2739(1992);Johann et al.,J.Virol.66:1635-1640(1992);Sommnerfelt et al.,Virol.176:58-59(1990);Wilson et al.,J.Virol.63:2374-2378(1989);Miller et al.,J.Virol.65:2220-2224(1991);PCT/US94/05700)。在优选瞬时表达的应用中,可以使用基于腺病毒的系统。基于腺病毒的载体在许多细胞类型中都具有很高的转导效率,并且不需要细胞分裂。使用这样的载体,已经获得了高滴度和表达水平。该载体可以在相对简单的系统中大量产生。腺伴随病毒(“AAV”)载体还可用于例如在核酸和肽的体外生产中,以及在体内和离体基因治疗程序中(参见,例如West et al.,Virology160:38-47(1987);U.S.Pat.No.4,797,368;WO 93/24641;Kotin,Human Gene Therapy 5:793-801(1994);Muzyczka,J.Clin.Invest.94:1351(1994).Construction ofrecombinant AAV vectors are described in a number of publications,includingU.S.Pat.No.5,173,414;Tratschin et al.,Mol.Cell.Biol.5:3251-3260(1985);Tratschin,et al.,Mol.Cell.Biol.4:2072-2081(1984);Hermonat&Muzyczka,PNAS81:6466-6470(1984);and Samulski et al.,J.Virol.63:03822-3828(1989)。
包装细胞通常用于形成能够感染宿主细胞的病毒颗粒。这样的细胞包括包装腺病毒的293细胞和包装逆转录病毒的ψ2细胞或PA317细胞。基因疗法中使用的病毒载体通常是通过产生将核酸载体包装成病毒颗粒的细胞系而产生的。载体通常包含包装和随后整合入宿主所需的最小病毒序列,其他病毒序列被表达盒替代以表达多核苷酸。缺失的病毒功能通常由包装细胞系反式提供。例如,用于基因治疗的AAV载体通常仅具有来自AAV基因组的ITR序列,其是包装和整合到宿主基因组中所需要的。病毒DNA包装在细胞系中,该细胞系包含编码其他AAV基因(即rep和cap)但缺少ITR序列的辅助质粒。该细胞系也可以被腺病毒作为辅助感染。辅助病毒可促进AAV载体的复制和辅助质粒中AAV基因的表达。由于缺少ITR序列,因此没有大量包装辅助质粒。腺病毒的污染可以通过例如腺病毒比AAV更敏感的热处理来减少。用于将核酸递送至细胞的其他方法是本领域技术人员已知的。参见例如US20030087817,其通过引用并入本文。
试剂盒,载体,细胞
本公开的一些方面提供了一种包含核酸构建物的试剂盒,该核酸构建物包含编码能够将去氧核糖核酸(DNA)分子中的腺苷脱氨化的腺苷脱氨酶的核苷酸序列。在一些实施方案中,核苷酸序列编码本文提供的任何腺苷脱氨酶。在一些实施方案中,核苷酸序列包含驱动该腺苷脱氨酶表达的异源启动子。
本公开的一些方面提供了包含核酸构建物的试剂盒,其包含(a)本文提供的编码与腺苷脱氨酶融合的napDNAbp(例如,Cas9结构域)或包含napDNAbp(例如,Cas9结构域)和腺苷脱氨酶的融合蛋白的核苷酸序列;和(b)驱动(a)的序列的表达的异源启动子。在一些实施方案中,试剂盒还包含编码向导核酸骨架(例如,向导RNA骨架)的表达构建物,其中构建物包含克隆位点,该克隆位点被定为以允许将与靶序列相同或互补的核酸序列克隆到向导核酸(例如,向导RNA骨架)中。
本公开的一些方面提供了包含本文提供的任何腺苷脱氨酶、融合蛋白或复合物的细胞。在一些实施方案中,该细胞包含编码本文提供的任何腺苷脱氨酶或融合蛋白的核苷酸。在一些实施方案中,该细胞包含本文提供的任何核苷酸或载体。
在一些实施方案中,用本文所述的一种或多种载体瞬时或非瞬时转染宿主细胞。在一些实施方案中,细胞在其天然存在于受试者中时被转染。在一些实施方案中,转染的细胞取自受试者。在一些实施方案中,细胞衍生自受试者的细胞,例如细胞系。用于组织培养的各种各样的细胞系是本领域已知的。细胞系的示例包括,C8161、CCRF-CEM、MOLT、mIMCD-3、NHDF、HeLa-S3、Huh1、Huh4、Huh7、HUVEC、HASMC、HEKn、HEKa、MiaPaCell、Panc1、PC-3、TF1、CTLL-2、C1R、大鼠6、CV1、RPTE、A10、T24、J82、A375、ARH-77、Calu1、SW480、SW620、SKOV3、SK-UT、CaCo2、P388D1、SEM-K2、WEHI-231、HB56、TIB55、Jurkat、J45.01、LRMB、Bcl-1、BC-3、IC21、DLD2、Raw264.7、NRK、NRK-52E、MRC5-、MEF、Hep G2、HeLa B、HeLa T4、COS、COS-1、COS-6、COS-M6A、BS-C-1猴肾上皮epithelial、BALB/3T3小鼠胚胎成纤维细胞、3T3 Swiss、3T3-L1、132-d5人胎儿成纤维细胞;10.1小鼠成纤维细胞、293-T、3T3、721、9L、A2780、A2780ADR、A2780cis、A 172、A20、A253、A431、A-549、ALC、B16、B35、BCP-1细胞、BEAS-2B、bEnd.3、BHK-21、BR 293.BxPC3.C3H-10T1/2、C6/36、Cal-27、CHO、CHO-7、CHO-IR、CHO-K1、CHO-K2、CHO-T、CHO Dhfr-/-、COR-L23、COR-L23/CPR、COR-L23/5010、COR-L23/R23、COS-7、COV-434、CMLT1、CMT、CT26、D17、DH82、DU145、DuCaP、EL4、EM2、EM3、EMT6/AR1、EMT6/AR10.0、FM3、H1299、H69、HB54、HB55、HCA2、HEK-293、HeLa、Hepa1c1c7、HL-60、HMEC、HT-29、Jurkat、JY细胞、K562细胞、Ku812、KCL22、KG1、KYO1、LNCap、Ma-Mel 1-48、MC-38、MCF-7、MCF-10A、MDA-MB-231、MDA-MB-468、MDA-MB-435、MDCK II、MDCK 11、MOR/0.2R、MONO-MAC 6、MTD-1A、MyEnd、NCI-H69/CPR、NCI-H69/LX10、NCI-H69/LX20、NCI-H69/LX4、NIH-3T3、NALM-1、NW-145、OPCN/OPCT细胞系、Peer、PNT-1A/PNT 2、RenCa、RIN-5F、RMA/RMAS、Saos-2细胞、Sf-9、SkBr3、T2、T-47D、T84、THP1细胞系、U373、U87、U937、VCaP、Vero细胞、WM39、WT-49、X63、YAC-1、YAR及其转基因物种。细胞系可得自本领域技术人员已知的多种来源(参见,例如,the American TypeCulture Collection(ATCC)(Manassus,Va.))。在一些实施方案中,用本文所述的一种或多种载体转染的细胞用于建立包含一个或多个载体衍生序列的新细胞系。在一些实施方案中,用如本文所述的CRISPR系统的组分瞬时转染(诸如通过用一个或多个载体瞬时转染或用RNA转染)并且通过CRISPR复合物的活性修饰的细胞用于建立包含新的细胞系,该新的细胞系包括含有修饰但缺乏任何其他外源序列的细胞。在一些实施方案中,用本文所述的一种或多种载体瞬时或非瞬时转染的细胞或来源于此类细胞的细胞系用于评估一种或多种测试化合物。
实施例
实施例1:使用PACE连续进化碱基编辑器或其组分
CRISPR-Cas9基因组编辑极大地扩展了合成生物学和遗传医学的范围,其多功能性是一项主要资产,因为它允许删除或替换序列。然而,人类医学目的许多遗传靶标是单基点突变。为了做出这些小的改变,CRISPR-Cas9方法仍必须引入使基因组不稳定的双链断裂,并依靠同源重组与添加的模板DNA对其进行修复。
碱基编辑是一种可替代的方法,可在没有双链断裂的情况下修饰DNA碱基。Cas9用于靶向编辑位点,并为束缚脱氨酶提供单链DNA底物,后者将胞苷转化为尿嘧啶。正常的DNA修复可导致用A-T替换G-C对,如下所示。
现有的碱基编辑方法需要改进,以使其成为更通用的工具,尤其是作为治疗方法可行,因为对安全性和功效的要求很高,并且体内递送具有挑战性。一种快速的生物分子进化方法,噬菌体辅助连续进化(PACE),正在被用于开发具有高活性和序列通用性以及精确碱基靶向的更有效的碱基编辑器。
在PACE中,所选择的基因在M13噬菌体基因组上编码。通过控制基因III的表达使其活性与M13的繁殖相关,因此只有活性变体才能产生感染性子代噬菌体。噬菌体不断繁殖和诱变,但突变仅在噬菌体基因组中积累,而不在宿主或其选择回路中积累,因为新鲜的宿主细胞不断流入(或流出)生长容器,从而有效地重置了选择背景。只有通过选择的噬菌体才能繁殖并在连续稀释过程中存活下来。
新的PACE选择的关键是将基因III表达与目的活性联系起来。设计了一种低严格性选择,其中碱基编辑激活了转录gIII的T7 RNA聚合酶。单个编辑事件可以在编辑的DNA转录后立即导致高输出扩增。
选择优化和验证
本文概述的概念验证回路显示了向导RNA依赖性的T7 RNA聚合酶的激活,但是开启不是最佳的。通过启动子/RBS扫描优化了T7RNAP的表达水平。尽管质粒编码的编辑器给出了使用优化构建体的高倍激活(在3小时内>200x),但噬菌体编码的编辑器无法开启,并且与空对照噬菌体相比,编辑器噬菌体在回路中的繁殖强度不高。
对于PACE选择来说不寻常地,通过优化噬菌体而不是使用更高活性的基因变体或降低选择严格性来实现选择性繁殖。噬菌体骨架被替换为已在PACE中繁殖了数百代的骨架。也可通过使用分裂内含肽来减轻编辑器的DNA大小负担,其中单独表达的N-内含肽和C-内含肽结合形成融合蛋白。在该方案中,仅N-末端脱氨酶与反式剪接内含肽的接头和N末端部分一起在噬菌体上编码。通过与宿主编码的组成性表达的C-末端dCas9和UGI剪接,在噬菌体感染后重构完整碱基编辑器。这限制了脱氨酶和接头的突变,从而限制了可及的靶。现在,在进化过程中噬菌体骨架和脱氨酶活性的提高使得可以将完整的碱基编辑器编码在噬菌体上(下表1)。
通过在连续流动下在回路上繁殖活性(APOBEC-N-内含肽)和失活(RFP)的噬菌体的混合物来验证选择。即使RFP噬菌体过量1000倍,APOBEC噬菌体仍会在24小时内被接管,无论其初始滴度如何。
低严格性回路在PACE中的繁殖是可靠的(如图7所示,对于相同的输入噬菌体和回路的3个流速表)。用于通过单个克隆激活的回路的荧光素酶测定(每个泻湖24个,每个时间点8个)显示出比起始基因型有所改善,但这到目前为止主要归因于骨架优化。
基因III或激活的T7 RNA聚合酶在噬菌体上的重组允许碱基编辑器在回路上独立繁殖。重新编码以减少同源性,阴性选择轮次以去除噬菌体和改进的碱基编辑器克隆上的T7活性减少或消除了这些问题。
其他选择:尿嘧啶结合“单杂交”
低严格性的T7 RNAP激活选择具有有限的适应不同靶和/或阴性选择的潜力,因为编辑位点在功能敏感的编码序列内。基于用于PACE中的TALEN和Cas9进化的单杂交DNA结合域选择,设计了另一种方案。碱基编辑(未显示)将尿嘧啶安装在弱启动子的上游,该弱启动子由与转录激活因子融合的尿嘧啶-DNA结合蛋白UdgX来结合。这种架构将允许任意的目标序列指定和对称的双重选择,以实现不需要的碱基编辑活动。
转录激活对RpoZ、RNAP和启动子的空间组织敏感。筛选了一系列UdgX-RpoZ融合蛋白,并针对不同的上游位置进行了编辑。一些位点和激活剂融合物显示非常适度但可重现的向导RNA依赖性转录激活。但是,到目前为止,来自PACE的最活跃的噬菌体克隆在优化的回路上只能产生1.6倍的激活,这不足以支持繁殖。
核碱基编辑器(碱基编辑器)的噬菌体辅助连续进化
本文概述的本发明将碱基编辑描述为用于精确基因组修饰、噬菌体辅助的连续进化,用于碱基编辑的低严格度选择的开发,选择调整和验证以及定向进化的第一步的方法。
点突变是重要的基因组编辑目标。单核苷酸多态性约占人类遗传变异的90%。单碱基变化可能解决许多人类疾病。引入终止密码子而不是插入缺失可提供更一致的敲除并减少细胞死亡。图11显示了ClinVAR数据库的致病性变异。
碱基编辑引入了没有双链断裂的点突变,如图12所示。
可以改进碱基编辑。可以编辑“窗口”中的多个Cs。序列背景会影响编辑效率(图13)。PAM特异性和窗口控制可精确或彻底编辑的位点(图14)。当递送受到限制时,表达和活性(在特定位点上)至关重要(图15)。
碱基编辑可受益于图16所示的无偏进化方法。此外,离散的定向进化回合花费时间,如图17所示。如此处所述,连续定向进化结合了体内的所有步骤(请参见图18和19)。
噬菌体辅助的连续进化将突变限制到进化中的基因(图20和21)。
对碱基编辑器进行PACE
碱基编辑器体积大并且表达差。首先,蛋白质表达水平和成熟时间证明是有问题的。其次,噬菌体的基因组大小会损害适应度并刺激欺骗行为。编辑缓慢发生。在哺乳动物细胞中,编辑需要3-5天才能达到最高水平。在细菌中,编辑在40-60代达到最高水平。因此,如果需要DNA修复或复制,则需要>1代。最后,编辑器结合可能会干扰编辑读取(CRISPRi)。Cas9停留时间长,并且编辑蛋白质编码序列可导致CRISPRi。
如图22、23和24所示,可以将PACE选择用于碱基编辑。这提供了具有低严格性的巨大扩增的优点,并且它是可调的。
原则上,任何PACE回路都可以通过以下方式进行碱基编辑:1)将通常处于选择状态的噬菌体组分移至宿主细胞,以及2)以可通过碱基编辑纠正的方式使组分或回路的任何部分失活。在图24中,通过碱基编辑激活T7 RNA聚合酶。其他类似的示例包括1)通过碱基编辑催化激活蛋白酶或将不可切割的底物转化为可切割的底物,或2)通过碱基编辑催化激活重组酶等。
C-末端的降解决定子标签切割T7 RNAP活性,如图25所示。在一些实施方式中,降解决定子标签是靶向蛋白质以降解的氨基酸序列。在一些实施方式中,降解决定子标签是泛素依赖性的。在一些实施方式中,降解决定子标签是泛素无关的。此外,T7 RNA聚合酶的C末端参与催化。T26 RNA聚合酶C末端的模型如图26所示。图27说明了C末端降解决定子标签对T7 RNAP活性的影响,包括碱基编辑和无碱基编辑。通过融合C末端降解决定子标签而使T7 RNAP失活,其中该C-末端降解决定子标签靶向其以进行蛋白水解并阻断其C末端羧基(参与催化)。模板链上Trp密码子的编辑将其转换为mRNA的终止位点(TAA、TGA或TAG,具体取决于碱基编辑的位置和数量),并恢复野生型T7 RNAP。
碱基编辑激活T7RNAP。T28RNA的激活示意图和碱基编辑结果如图28所示。基于质粒的编辑器表达显示:1)通过荧光素酶报道基因的RNA依赖的回路激活,第2和3栏,以及2)靶向野生型T7 RNAP的碱基编辑器对回路输出的最小影响。但是,组成型T7RNAP表达的工作更好,如图29所示。将组成型启动子用于T7 RNAP可将回路开启提高10倍以上。
碱基编辑器噬菌体非常大,如图30所示。金栅克隆(Golden cloning)使得无需PCR即可克隆克隆噬菌体。其如图31所示。
第一代SP并未在C端降解决定子回路中富集。第一代SP的结果如图32所示。噬菌体上的未进化的全长碱基编辑器不会在碱基编辑回路中繁殖,即使阳性(gIII噬菌体,其在任何可感染宿主细胞上或使选择短路的T7 RNAP噬菌体中繁殖)和阴性(空/终止密码子噬菌体,它们没有碱基编辑活性)对照的行为也如预期那样。但是,碱基编辑器噬菌体比空噬菌体更有效地繁殖,这表明正在发生编辑依赖型繁殖。这种方法的一个好处是可以使用不同的选择来实现优化,如图33所示。步骤如下:1)将编辑器克隆到PACE优化的噬菌体骨架中;2)减少T7RNAP的表达;3)增加gIII质粒的拷贝数,并4)用内含肽拆分编辑器,并将dCas9.ugi置于宿主质粒上。
内含肽分裂的碱基编辑器显示了gRNA依赖型增殖,如图34所示。两个关键的变化允许碱基编辑器的向导RNA的富集(过夜富集10倍)。1)使用具有来自其他PACE项目的~30个累积突变的噬菌体骨架可以改善繁殖。2)使用反式剪接的内含肽来拆分碱基编辑器,使噬菌体的货物限于脱氨酶和N-内含肽,而C-内含肽、Cas9和UGI由宿主细胞表达。这大大减少了噬菌体基因组的大小,并加快了复制和包装的速度。它还限制了噬菌体编码脱氨酶的进化,这使PACE可以更有效地揭示脱氨酶驱动的碱基编辑器变化。内含肽分裂碱基编辑器进一步在PACE中繁殖,如图35所示。优化的分裂碱基编辑器可以持续存在于连续流动的PACE中(滴度随时间增加)。
主动编辑器可以接管一个泻湖,如图36所示。主动分裂的BE噬菌体可以接管一个播种了大量过量的失活(RFP)噬菌体,甚至滴度很低的活性噬菌体(1e7 pfu/mL RFP噬菌体,1e4 pfu/mL活性噬菌体)的的泻湖。
内含肽分裂碱基编辑器累积突变,如图37所示。
重组产生具有野生型繁殖的欺骗者(cheater),如图38和39所示。
进一步的PACE显示降低的gIII重组。PACE数据如图40所示。
可以用萤光素酶读出测定噬菌体碱基的编辑活性,如图41所示。萤光素酶测定的时间进程允许估算BE噬菌体的活性。在宿主细胞感染后2到3小时之间,观察到发光/OD/时间的线性相位,其斜率被用作量度或回路激活速率。萤光素酶时程测定法显示了改善的噬菌体适应性,如图42所示。进一步的PACE实验产生的噬菌体后代(分别从不同的泻湖和时间点进行测定,彩色线)比亲代基因型(黑色粗线)具有更快的回路激活速率。PACE 5的前15个克隆如图43所示。T7RNAP在噬菌体上的重组产生了欺骗者。PACE 5的前8个克隆显示在图44中,突出显示了欺骗者。
总而言之,T7RNAP激活选择出活性碱基编辑器选择,碱基编辑器可以在PACE中繁殖,并且优化的输入可进行选择工作。在将来的开发中,欺骗将不如改进有效,并且将启用全长碱基编辑器PACE。可选择地,将启动其他选择。如图45所示。
如图46所示,可以“清理”PACE输出。
尿嘧啶-DNA结合蛋白可以实现“1.5杂交”选择。这在图47和48中进行了说明。
转录激活因子募集对空间组织敏感,如图49、50和51中所示。
进一步筛选显示了一些位置对编辑有反应,如图52、53、54、55和56中所示。
在高激活因子表达时反应最大,如图57所示。
PACE-进化的噬菌体显示了优化回路的激活如图58所示。
模板链编辑导致更快的表达-水平反应,如图59、60、61、62和63所示。
模板链脱氨化导致有限组的编码突变,如图64所示。
较强的T7RNAP表达减少了开启,并且有毒,如图65所示。
自发的E158K突变降低了背景,如图66所示。
降解决定子对于减少毒性至关重要,但是对降低活性则否,如图67所示。
C-末端T7溶菌酶-降解决定子融合体不会降低背景,如图68所示。
较小的或表达更好的编辑器变体可能有帮助,如图69所示。
质粒-编码的编辑器在噬菌体-感染的细胞中有功能,如图70所示。
噬菌体-编码的编辑器是有活性的,如图71所示。
由噬菌体基因组表达低于由质粒表达。
扫描用于T7 RNAP表达的启动子和RBS强度允许优化回路激活(通过在在质粒上表达活性和失活碱基编辑器时的荧光素酶输出变化来评估)。与优化回路((R3 proB))相比,初始回路(SD8 proA)具有低很多倍的激活和较高的背景。这点如图73所示。
噬菌体骨架中的突变,而不是专门在脱氨酶-内含肽融合插入中的突变,可导致噬菌体活性的显著变化(图74)。
在荧光素酶检验中,与更严格回路上的未进化噬菌体(右)相比,PACE-进化的噬菌体不仅比更快地激活回路,而且其也可以更有效地繁殖(R2和R4RBSs导致较低的T7 RNAP表达水平,因此需要比R3更多的编辑事件以激活回路)。这些更严格的回路允许在噬菌体上继续进行PACE,该噬菌体在R3回路中强烈富集(未显示),图75。
编辑模板链以用于RNA聚合被称为T7 RNAP激活回路,其是在PACE-相容性时间尺度上激活所需的(图76)。无模板编辑需要质粒复制和可能的DNA修复以得到mRNA-水平的基因型,其甚至在用进化的噬菌体处理3h只能不能显示激活,而类似的模板链编辑导致强激活。
全长BE2PACE现在看起来是实用的。需要繁殖>10-倍以进行成功的PACE。尽管甚至在使用进化的噬菌体骨架时全长野生型碱基编辑器也不能繁殖,但添加来自分裂BE PACE的脱氨酶突变导致多达1000x的繁殖。在全长BEs上进行PACE允许包括dCas9在内的所有BE组分进化。
表2.进化的噬菌体骨架(骨架#)和脱氨酶突变(插入)允许全长碱基编辑器在BE回路上繁殖,显示整体BE是未进化的。
Figure BDA0002426427270001871
Figure BDA0002426427270001881
若干脱氨酶的活性足以用于PACE。BE3和BE4基于大鼠APOBEC1。
BE3和BE4基于大鼠APOBEC1。它们具有高整体活性,严重受损的编辑GC靶的活性,和对TC靶的高编辑。可选择的脱氨酶已被证实为碱基编辑器。AID和CDA对GC靶均工作良好,但通常比APOBEC1活性较低APOBEC3G与所有这些相比都表现没那么好(Komor,A.C.etal.Improved base excision repair inhibition and bacteriophage Mu Gam proteinyields C:G-to-T:A base editors with higher efficiency and product purity.SciAdv 3,eaao4774(2017))。靶-AID碱基编辑实施使用了CDA(Nishida,K.et al.Targetednucleotide editing using hybrid prokaryotic and vertebrate adaptive immunesystems.Science 353,aaf8729–aaf8729(2016))。“FERNY”是N-和C-末端截短的祖先序列,其基于APOBEC家族系统发育树重构.rAPOBEC1:229aa;FERNY:161aa。与rAPOBEC1的序列相似性为55%。祖先重构技术在提交论文中描述(Koblan et al.,Nature Biotechnolsubmitted),但在其中没有描述FERNY序列。
荧光素酶检验显示与ATCC靶相比,AGCC靶显著切割了rAPOBEC1的激活率,但pmCDA1可激活二者(图77)。PACE进化可产生rAPOBEC1基因型和能与TCC回路同样强地激活GCC回路的噬菌体,以及激活率可比得上APOBEC1的CDA和FERNY噬菌体(图78)。使用分裂BE构建物的早期PACE进化的脱氨酶的HEK细胞编辑显示了相对于野生型BE有所改进(图79-83,表3)。
表3.初步HEK检验汇总的进化的碱基编辑器的基因型
Figure BDA0002426427270001891
对HEK细胞中的一大组作为全长碱基编辑器的PACE-衍生的APOBEC、CDA和FERNY基因型的检测显示,与野生型脱氨酶相比,它们具有改进的编辑特性(表4)。
表4.PACE12产生改进的脱氨酶基因型。常规文本是PACE5-PACE10和斜体字文本PACE12.
Figure BDA0002426427270001892
Figure BDA0002426427270001901
图84显示,如果将脱氨酶克隆到同基因的噬菌体骨架中,可以通过BE回路活化率对其进行分析。只有脱氨酶基因型不同,因此它们决定了激活率。在图84中,数据是通过将进化的脱氨基酶亚克隆到标准化的噬菌体骨架中而收集的,因此它们应主要反映出脱氨酶的特征。
PACE进化的脱氨基酶显示了HEK细胞编辑的改善(图85-87)。对于靶位点中的每个C,野生型和进化的脱氨酶的编辑%均以相同的顺序显示。
四种基因型表现突出(表5,图88-92)。两个CDA变体具有基本等效的活性,并且比野生型CDA具有更高的编辑能力,并且窗口稍宽。进化的APOBEC基因型对GC靶具有活性,而野生型APOBEC对GC的活性却很低。进化出的FERNY基因型还具有较高的GC活性,尽管是较短的蛋白质,但与APOBEC具有相当的活性。
表5.四种基因型表现突出
Figure BDA0002426427270001911
PACE选择可以适应其他进化靶。这些扩展尚未通过实验验证。可以自由更改CCA编辑位点的5'碱基,从而可以选择在特定的5'序列背景下进行编辑。可以选择在窗口中最多位置进行编辑(例如,在+1进行编辑)。可以通过编辑将T7 RNAP中的终止密码子还原为Q或R来选择ABE(A至G碱基编辑器)活性。可以在ABE上进行类似的阳性选择,以改善/改变脱氨酶活性、窗口或背景特异性。全长碱基编辑器PACE将允许Cas9中的突变影响PAM特异性、编辑窗口、靶位点驻留等。可以通过提供第二个具有正交启动子特异性(T3)和重新编码的C末端的T7 RNAP来进行阴性选择。不需要的编辑会激活T3变体(通过以与阳性选择相同的方式移除C末端降解子)并驱动pIII-neg的产生,从而减少噬菌体的繁殖。可以在具有特定5'碱基或特定窗口位置的目标上进行否定选择。阳性选择和阴性选择可以在同一宿主细胞中同时发生。这种串联双重选择的一个示例使用情况将是选择在位置1进行编辑,而不是在位置5进行编辑,从而迫使编辑窗口移离PAM。使用给定的脱氨酶的BE的窗口移位从未可靠地实现。
在密码子优化的BE4Max的背景下,以下数据(表6,图93-114)使用直接衍生自PACE的脱氨酶基因型,而没有密码子优化。他们表明,在高转染剂量(750ng编辑质粒)下,几种进化的基因型具有优于或等同于野生型脱氨酶的性能。在几乎所有位点上,进化的CDA(“evoCDA”,pBT222),APOBEC(“evoAPOBEC”,pBT223)和FERNY(pBT224)基因型的表现均优于野生型。在这种高饱和的编辑器剂量下,编辑窗口边缘的性能特别地说明了野生型和进化型脱氨基酶之间的活性差异。
表6.直接衍生自PACE的脱氨酶基因型
Figure BDA0002426427270001921
Figure BDA0002426427270001931
Figure BDA0002426427270001941
转染750ng碱基编辑器会使编辑窗口中间附近的位置处的编辑饱和,从而掩盖了基因型之间的差异。在几乎每个位点和位置,进化的脱氨酶在误差范围内都是等效的,甚至优于野生型脱氨酶。在窗口的空白处进行编辑会显示编辑器活动之间的最大差异(例如,HEK4 GC11,RNF2 TC12)。约5种进化的CDA基因型具有同样高的编辑活性和扩展窗口大小。约有7种进化的APOBEC基因型具有同样高的编辑活性,可以有效地编辑GC目标(例如HEK3GC3和HEK4 GC3)。根据该平台前面显示的n=1的30ng转染数据,选择了单个evoCDA和evoAPOBEC基因型。这些基因型:1)优化了Genscript密码子,2)经历有限的回复分析,和3)突变转移至野生型脱氨酶或anc689背景(ancBE4Max,Koblan,L.W.et al.Improvingcytidine and adenine base editors by expression optimization and ancestralreconstruction.Nature Publishing Group 1–9(2018).doi:10.1038/nbt.4172).。
图115-136显示了通过Genscript密码子优化的脱氨酶进行的编辑,除了一些进化的突变之外,其组成与BE4Max(基于rAPOBEC1的最先进的碱基编辑器)和ancBE4Max(重构的祖先anc689,在某些位点的表现优于BE4Max)相同。剂量很高(750ng),因此如先前数据一样,在窗口中心的编辑已饱和。
APOBEC/FERNY的特异性环中两个突变(突变体表中的虚线)对于GC活性至关重要。这些突变是特定于其进化的脱氨酶环境的,均未将端口设置为anc689后台。已知该环区会影响各种胞苷脱氨酶的-1和-2碱基偏爱(例如Kohli,R.M.et al.A portable hot spotrecognition loop transfers sequence preferences from APOBEC family members toactivation-induced cytidine deaminase.Journal of Biological Chemistry 284,22898–22904(2009))。将APOBEC或anc689截短为FERNY的大小会完全使其无效。这三个evoCDA突变似乎都具有功能,但F23S突变似乎最重要。evoCDA的最大活性窗口为~1-13的一半(相比于CDA~1-9)。evoAPOBEC具有类似于APOBEC的窗口,向任一侧扩展了约0.5个碱基。在所有测试的位点上,evoAPOBEC和evoFERNY均优于anc689(当前最新的BE)。仅在少数几个靶点上,evoAPOBEC的编辑水平高于evoFERNY。与APOBEC/anc689的~227aa相比,evoFERNY长约161aa,使其成为限制DNA大小的递送方法的更好选择。
Genscript密码子优化可提高活性,但仅改善一点点(比较PACE基因型和Genscript密码子优化的转染数据),因此蛋白质序列是性能的主要决定因素。
接下来是使用BE PACE改变或扩大脱氨酶编辑窗口的概念验证数据(图137)。CDA的窗口比APOBEC1宽(每个evo版本的窗口比野生型窗口大)。构建了PACE回路,其中向导RNA将GTCC编辑目标置于位置4和5或位置1和2。否则回路是相同的。当目标为1/2时,具有更大窗口的脱氨酶比野生型APOBEC1的性能要强于4/5。因此,在1/2回路上的发展有望使脱氨酶富集于更宽的窗口,或者窗口远离PAM。
简要方法:
使用标准分子生物学技术,通过USER和金栅克隆构建质粒。使用前,将通过PCR扩增的所有DNA进行序列验证。
荧光素酶报道基因检验:
对于典型的测定,将包含合适质粒的S1030或S2060细胞[Carlson,J.C.,Badran,A.H.,Guggiana-Nilo,D.A.&Liu,D.R.Negative selection and stringency modulationin phage-assisted continuous evolution.Nature Chemical Biology 10,216–222(2014)]接种到1mL DRM培养基中,该培养基中含有羧苄青霉素(50μg/mL),卡那霉素(30μg/mL),氯霉素(40μg/mL)和/或壮观霉素(100μg/mL),并在37℃的深96孔板中培养过夜,该深96孔板的容量为2mL(Eppendorf),配有透气的顶部薄膜密封垫。独立的生物复制体是来自一个或多个质粒的新鲜转化的独立菌落,或者是-80甘油原液的独立过夜生长物。将过夜培养物用抗生素反稀释50倍至新鲜的DRM中,然后在深孔板中生长约1.5h(对于噬菌体表达的碱基编辑器)或2h(对于质粒表达的碱基编辑器)。对于噬菌体测定,在透明底黑色96孔测定板(Costar)中,将135μL宿主细胞培养物与15μL高滴度噬菌体储备液(>1e10 pfu/mL)混合。对于用质粒表达的碱基编辑器测定,将培养物用阿拉伯糖(10mM或如图所示)诱导,再培养3小时,然后转移至测定板(每孔150-200μL)。使用Infinite M1000 Pro酶标仪(Tecan)在温度设定为37℃的条件下监测OD600和发光度。对于动力学测定,在监测期间每3.5分钟进行一次读数,并在两次读数之间将板摇动30秒。
繁殖分析(幻灯片11、13、19):
将按荧光素酶测定法制备的DRM中的对数期宿主细胞与滴定的噬菌体原液混合至终浓度~1e6 pfu/mL,体积为1mL,并在具有透气顶膜密封的深孔板中生长过夜。将培养物离心(3,600×g,10分钟)以移除细胞,如先前所述[Badran,A.H.et al.Continuousevolution of Bacillus thuringiensis toxins overcomes insect resistance.Nature533,1–19(2016)]。通过将在宿主细胞上繁殖的噬菌体的滴度除以在没有细胞的情况下以相同浓度摇动过夜的噬菌体的滴度来计算富集倍数。
基本上如[Badran,A.H.et al.Continuous evolution of Bacillusthuringiensis toxins overcomes insect resistance.Nature 533,1–19(2016)]所述地进行PACE实验。
哺乳动物细胞实验:通过金栅克隆制备碱基编辑器质粒,并使用ZymoPure Midi试剂盒(Zymo Research)进行midipreped。HEK细胞转染、HTS文库制备和测序基本上按所述进行(Komor,A.C.et al.Improved base excision repair inhibition and bacteriophageMu Gam protein yields C:G-to-T:A base editors with higher efficiency andproduct purity.Sci Adv 3,eaao4774(2017)。
使用Baringo小鼠进行编辑的总结:耳聋模型
为克服APOBEC1序列特异性问题并有效编辑Baringo位点,研究表明,带有激活诱导的(胞苷)脱氨酶(AID)或胞苷脱氨酶(CDA)的BE4变体在靶向Baringo突变方面效果很好。在图138中,将进化脱氨基酶合并,并将构建体在Baringo胚胎细胞中进行核转染。Evo脱氨酶允许在以前不可编辑的位点进行碱基编辑,进化后,BE-CDA的编辑作用增加了(8%至33%)(图139)。
总结:碱基编辑器的连续定相进化
基因组编辑彻底改变了生命科学,并提供了治愈基因病的潜力。最近开发了碱基编辑,这是一种新的基因组编辑策略,可将一个目标碱基以可编码的方式直接不可逆地转化为另一目标碱基,而无需在DNA或供体模板中进行双链断裂。1-4由于大多数与疾病有关的突变是单碱基改变,碱基编辑器适用于研究和治疗具有基因成分的许多疾病。
C到T碱基编辑器使用胞苷脱氨酶将通过Cas9打开的单链DNA环中的胞苷转化为尿苷。相对的链被Cas9切开以刺激DNA修复机制,该机制使用编辑链作为模板,而融合的尿嘧啶糖基化酶抑制剂(未显示)减慢了编辑碱基的切除速度。最终,DNA修复导致C·G到T·C碱基对的转化。
碱基编辑器可以高效编辑许多目标,通常一次编辑即可实现30-70%的细胞编辑而无需富集。但是,当前的胞苷碱基编辑器活性取决于靶核苷酸周围的碱基。基于APOBEC1胞苷脱氨酶的C-至-T编辑器偏向于编辑TC基序,并且不支持大多数GC碱基。这种偏向可能导致在规范编辑窗口之外的位置上编辑TC,3,并且即使GC目标处于最佳位置,也可能导致GC目标编辑不佳。使用其他脱氨酶(例如CDA或AID)的C-至-T编辑器可以为某些GC位点提供有效的替代方法,但是与APOBEC1 Bes.3,5相比,总体上具有较低的编辑效率。目标是使用定向进化来产生高活性的、与序列背景无关的碱基编辑器。
C-至-T碱基编辑器是一种工程化的酶融合体,具有超过1800个氨基酸,可串联使用三个蛋白质成分来执行非天然功能,并且有关其结构和机理的信息非常有限。所有这些功能使无偏向进化成为改善碱基编辑器功能的有吸引力的平台。本文使用的是噬菌体辅助的连续进化PACE,它可以在每个实验中进行数百轮突变和选择。目的是使这个功能强大的系统适合碱基编辑。
将碱基编辑与噬菌体复制耦合需要可以通过单个碱基转换而强烈激活的回路。设计并验证了PACE选择,其中碱基编辑导致T7 RNA聚合酶的表达,然后从T7启动子转录基因III(或荧光素酶报道基因)。转录模板链的碱基编辑将Trp密码子转换为mRNA中的终止密码子,从而从翻译的酶中去除了蛋白水解降解标签。这种结构具有广泛的动态范围,可通过改变T7 RNA聚合酶的转录进行调节,并且使编辑效率与大肠杆菌和哺乳动物细胞之间不同的下游DNA修复步骤脱钩。
为开始使用该回路的PACE,进化选择为被限制于碱基编辑器的脱氨酶部分。与包括Cas9相比,这可以减少噬菌体基因组的大小,加快繁殖速度,并创建功能更密集的突变靶标。这是通过在融合到反式剪接的分裂内含肽的噬菌体上编码脱氨酶来实现的。然后,其余的编辑器(核酸酶死亡的Cas9和尿嘧啶糖基化酶抑制剂)也作为分裂内含肽融合体在宿主细胞中表达,并且在噬菌体感染后通过蛋白质剪接来重建全长编辑器。
通过改变靶CCA的碱基5'的标识,当前选择可用于改善碱基编辑活性或选择5'序列背景相容性。这种PACE碱基编辑选择用于改进GCC靶的C-至-T编辑,该GCC靶由诸如BE3和BE4的基于APOBEC1的编辑器的编辑不佳。3APOBEC1噬菌体首先在TCC靶上经历PACE以优化活性,然后在GCC靶上经历PACE。在细菌荧光素酶报告基因分析中,一种从PACE产生的APOBEC1变体在GCC靶上相对于野生型APOBEC1具有180倍的活性增加。同一回路用于进化CDA的较高活性变体,该变体具有较高的原生GC活性,但总体效率较低。3在细菌荧光素酶测定中,CDA的表观活性提高了3到4倍。对在哺乳动物细胞中编辑多样化基因组靶的这些进化的脱氨基酶进行测试,并且正在准备手稿。
PACE选择用于碱基编辑的可用性为改进碱基编辑器功能开辟了许多可能性。下一个目标是转移和缩小编辑范围,这将允许对靶点C进行精确修饰,而无需编辑附近的“旁观者”Cs,并导致完全转换为单个等位基因。这将需要实现串联双重选择,在期望的窗口中进行阳性选择,在其外部进行阴性选择(与哈佛大学2018年级学生Christine Zheng一起)。可以使用类似的方法选择背景特异性编辑器,其仅在给定序列背景下修改Cs,从而再次减少旁观者C的修饰。最后,BE PACE选择可以应用于A-至-G碱基编辑器11和使用工程化Cas9或其同系物的新碱基编辑器变体以改善其性能。
参考文献
1.Komor,A.C.,Kim,Y.B.,Packer,M.S.,Zuris,J.A.&Liu,D.R.Programmableediting of a target base in genomic DNA without double-stranded DNAcleavage.Nature 533,420-424,doi:10.1038/nature17946(2016).
2.Y.B.et al.Increasing the genome-targeting scope and precision ofbase editing with engineered Cas9-cytidine deaminase fusions.Nat.Biotech.35,371-376,doi:10.1038/nbt.3803(2017).
3.Komor,A.C.et al.Improved base excision repair inhibition andbacteriophage Mu Gam protein yields C:G-to-T:A base editors with higherefficiency and product purity.Sci Adv 3,eaao4774,doi:10.1126/sciadv.aao4774(2017).
4.Rees,H.A.et al.Improving the DNA specificity and applicability ofbase editing through protein engineering and protein delivery.Nat Commun 8,15790,doi:10.1038/ncomms15790(2017).
5.Nishida,K.et al.Targeted nucleotide editing using hybridprokaryotic and vertebrate adaptive immune systems.Science 353,doi:10.1126/science.aaf8729(2016).
6.Esvelt,K.M.,Carlson,J.C.&Liu,D.R.A system for the continuousdirected evolution of biomolecules.Nature 472,499-503,doi:10.1038/nature09929(2011).
7.Carlson,J.C.,Badran,A.H.,Guggiana-Nilo,D.A.&Liu,D.R.Negativeselection and stringency modulation in phage-assisted continuousevolution.Nat Chem Biol 10,216-222,doi:10.1038/nchembio.1453(2014).
8.Leconte,A.M.et al.A population-based experimental model for proteinevolution:effects of mutation rate and selection stringency on evolutionaryoutcomes.Biochemistry 52,1490-1499,doi:10.1021/bi3016185(2013).
9.Hubbard,B.P.et al.Continuous directed evolution of DNA-bindingproteins to improve TALEN specificity.Nat Methods 12,939-942,doi:10.1038/nmeth.3515(2015).
10.Bryson,D.I.et al.Continuous directed evolution of aminoacyl-tRNAsynthetases.Nat Chem Biol,doi:10.1038/nchembio.2474(2017).
11Gaudelli,N.M.et al.Programmable base editing of A*T to G*C ingenomic DNA without DNA cleavage.Nature 551,464-471,doi:10.1038/nature24644(2017).
等效物和范围
在权利要求中,诸如“一个”,“一种”和“该”的冠词可以表示一个或多个,除非相反地指出或从上下文中明显看出。如果在给定的产品或过程中存在,使用或与之相关的一组或多于一组的成员,则认为在一组的一个或多个成员之间包含“或”的要求或描述得到了满足,除非另有说明。从上下文中得出相反或相反的结论。本发明包括其中给定产品或过程中存在,使用或与给定产品或过程相关的恰好一个组的实施方式。本发明包括这样的实施例,其中给定的产品或过程中存在一种以上或所有的组成员,在其中使用或与之相关。
此外,本发明涵盖所有变型,组合和置换,其中将来自一个或多个所列权利要求的一个或多个限制,要素,从句和描述性术语引入另一权利要求中。例如,可以将依赖于另一权利要求的任何权利要求修改为包括在依赖于同一基本权利要求的任何其他权利要求中找到的一个或多个限制。在元素以列表形式呈现的情况下,例如以马库什组格式,还公开了元素的每个子组,并且可以从该组中删除任何元素。应当理解,通常,在将本发明或本发明的方面称为包含特定要素和/或特征的情况下,本发明或本发明的某些实施例由以下组成或基本上由以下组成:此类元素和/或功能。为了简单起见,这些实施例没有在本文中具体阐述。还应注意,术语“包含”和“包含”旨在是开放的,并允许包括附加元件或步骤。在给出范围的地方,包括端点。此外,除非另外指明或从上下文和本领域普通技术人员的理解中显而易见,否则在本发明的不同实施例中,表示为范围的值可以假定为所述范围内的任何特定值或子范围。范围下限的十分之一单位,除非上下文另有明确规定。
本申请涉及各种已发布的专利,公开的专利申请,期刊文章和其他出版物,所有这些都通过引用并入本文。如果任何引用的参考文件与本说明书之间存在冲突,则以本说明书为准。另外,落入现有技术范围内的本发明的任何特定实施例可以明确地从权利要求中的任何一个或多个中排除。因为这样的实施例被认为是本领域普通技术人员已知的,所以即使在这里没有明确提出排除,也可以将它们排除。本发明的任何特定实施例可以出于任何原因从任何权利要求中排除,无论是否与现有技术的存在有关。
本领域技术人员将仅使用常规实验就将认识到或能够确定本文所述具体实施方式的许多等同方案。本文描述的本实施例的范围不旨在限于以上描述,而是如所附权利要求书中所述。本领域普通技术人员将理解,可以在不脱离如所附权利要求书所限定的本发明的精神或范围的情况下,对该描述进行各种改变和修改。
序列表
<110> 哈佛大学的校长及成员们
<120> 用于使用噬菌体辅助连续进化(PACE)来进化碱基编辑器的方法和组合物
<130> H0824.70277WO00
<140> Not Yet Assigned
<141> Concurrently Herewith
<150> US 62/538,380
<151> 2017-07-28
<160> 139
<170> PatentIn version 3.5
<210> 1
<211> 162
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 1
Met Phe Glu Arg Asn Tyr Asp Pro Arg Glu Leu Arg Lys Glu Thr Tyr
1 5 10 15
Leu Leu Tyr Glu Ile Lys Trp Gly Lys Ser Gly Lys Leu Trp Arg His
20 25 30
Trp Cys Gln Asn Asn Arg Thr Gln His Ala Glu Val Tyr Phe Leu Glu
35 40 45
Asn Ile Phe Asn Ala Arg Arg Phe Asn Pro Ser Thr His Cys Ser Ile
50 55 60
Thr Trp Tyr Leu Ser Trp Ser Pro Cys Ala Glu Cys Ser Gln Lys Ile
65 70 75 80
Val Asp Phe Leu Lys Glu His Pro Asn Val Asn Leu Glu Ile Tyr Val
85 90 95
Ala Arg Leu Tyr Tyr His Glu Asp Glu Arg Asn Arg Gln Gly Leu Arg
100 105 110
Asp Leu Val Asn Ser Gly Val Thr Ile Arg Ile Met Asp Leu Pro Asp
115 120 125
Tyr Asn Tyr Cys Trp Lys Thr Phe Val Ser Asp Gln Gly Gly Asp Glu
130 135 140
Asp Tyr Trp Pro Gly His Phe Ala Pro Trp Ile Lys Gln Tyr Ser Leu
145 150 155 160
Lys Leu
<210> 2
<211> 229
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 2
Met Ser Ser Glu Thr Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg
1 5 10 15
Arg Ile Glu Pro His Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu
20 25 30
Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile Asn Trp Gly Gly Arg His
35 40 45
Ser Ile Trp Arg His Thr Ser Gln Asn Thr Asn Lys His Val Glu Val
50 55 60
Asn Phe Ile Glu Lys Phe Thr Thr Glu Arg Tyr Phe Cys Pro Asn Thr
65 70 75 80
Arg Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys
85 90 95
Ser Arg Ala Ile Thr Glu Phe Leu Ser Arg Tyr Pro His Val Thr Leu
100 105 110
Phe Ile Tyr Ile Ala Arg Leu Tyr His His Ala Asp Pro Arg Asn Arg
115 120 125
Gln Gly Leu Arg Asp Leu Ile Ser Ser Gly Val Thr Ile Gln Ile Met
130 135 140
Thr Glu Gln Glu Ser Gly Tyr Cys Trp Arg Asn Phe Val Asn Tyr Ser
145 150 155 160
Pro Ser Asn Glu Ala His Trp Pro Arg Tyr Pro His Leu Trp Val Arg
165 170 175
Leu Tyr Val Leu Glu Leu Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys
180 185 190
Leu Asn Ile Leu Arg Arg Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile
195 200 205
Ala Leu Gln Ser Cys His Tyr Gln Arg Leu Pro Pro His Ile Leu Trp
210 215 220
Ala Thr Gly Leu Lys
225
<210> 3
<211> 208
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 3
Met Thr Asp Ala Glu Tyr Val Arg Ile His Glu Lys Leu Asp Ile Tyr
1 5 10 15
Thr Phe Lys Lys Gln Phe Phe Asn Asn Lys Lys Ser Val Ser His Arg
20 25 30
Cys Tyr Val Leu Phe Glu Leu Lys Arg Arg Gly Glu Arg Arg Ala Cys
35 40 45
Phe Trp Gly Tyr Ala Val Asn Lys Pro Gln Ser Gly Thr Glu Arg Gly
50 55 60
Ile His Ala Glu Ile Phe Ser Ile Arg Lys Val Glu Glu Tyr Leu Arg
65 70 75 80
Asp Asn Pro Gly Gln Phe Thr Ile Asn Trp Tyr Ser Ser Trp Ser Pro
85 90 95
Cys Ala Asp Cys Ala Glu Lys Ile Leu Glu Trp Tyr Asn Gln Glu Leu
100 105 110
Arg Gly Asn Gly His Thr Leu Lys Ile Trp Ala Cys Lys Leu Tyr Tyr
115 120 125
Glu Lys Asn Ala Arg Asn Gln Ile Gly Leu Trp Asn Leu Arg Asp Asn
130 135 140
Gly Val Gly Leu Asn Val Met Val Ser Glu His Tyr Gln Cys Cys Arg
145 150 155 160
Lys Ile Phe Ile Gln Ser Ser His Asn Gln Leu Asn Glu Asn Arg Trp
165 170 175
Leu Glu Lys Thr Leu Lys Arg Ala Glu Lys Arg Arg Ser Glu Leu Ser
180 185 190
Ile Met Ile Gln Val Lys Ile Leu His Thr Thr Lys Ser Pro Ala Val
195 200 205
<210> 4
<211> 229
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 4
Met Ser Ser Glu Thr Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg
1 5 10 15
Arg Ile Glu Pro His Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu
20 25 30
Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile Lys Trp Gly Thr Ser His
35 40 45
Lys Ile Trp Arg His Ser Ser Lys Asn Thr Thr Lys His Val Glu Val
50 55 60
Asn Phe Ile Glu Lys Phe Thr Ser Glu Arg His Phe Cys Pro Ser Thr
65 70 75 80
Ser Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys
85 90 95
Ser Lys Ala Ile Thr Glu Phe Leu Ser Gln His Pro Asn Val Thr Leu
100 105 110
Val Ile Tyr Val Ala Arg Leu Tyr His His Met Asp Gln Gln Asn Arg
115 120 125
Gln Gly Leu Arg Asp Leu Val Asn Ser Gly Val Thr Ile Gln Ile Met
130 135 140
Thr Ala Pro Glu Tyr Asp Tyr Cys Trp Arg Asn Phe Val Asn Tyr Pro
145 150 155 160
Pro Gly Lys Glu Ala His Trp Pro Arg Tyr Pro Pro Leu Trp Met Lys
165 170 175
Leu Tyr Ala Leu Glu Leu His Ala Gly Ile Leu Gly Leu Pro Pro Cys
180 185 190
Leu Asn Ile Leu Arg Arg Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile
195 200 205
Ala Leu Gln Ser Cys His Tyr Gln Arg Leu Pro Pro His Ile Leu Trp
210 215 220
Ala Thr Gly Leu Lys
225
<210> 5
<211> 162
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 5
Met Phe Glu Arg Asn Tyr Asp Pro Arg Glu Leu Arg Lys Glu Thr Tyr
1 5 10 15
Leu Leu Tyr Glu Ile Lys Trp Gly Lys Ser Gly Lys Leu Trp Arg His
20 25 30
Trp Cys Gln Asn Asn Arg Thr Gln His Ala Glu Val Tyr Phe Leu Glu
35 40 45
Asn Ile Phe Asn Ala Arg Arg Phe Asn Pro Ser Thr His Cys Ser Ile
50 55 60
Thr Trp Tyr Leu Ser Trp Ser Pro Cys Ala Glu Cys Ser Gln Lys Ile
65 70 75 80
Val Asp Phe Leu Lys Glu His Pro Asn Val Asn Leu Glu Ile Tyr Val
85 90 95
Ala Arg Leu Tyr Tyr Pro Glu Asn Glu Arg Asn Arg Gln Gly Leu Arg
100 105 110
Asp Leu Val Asn Ser Gly Val Thr Ile Arg Ile Met Asp Leu Pro Asp
115 120 125
Tyr Asn Tyr Cys Trp Lys Thr Phe Val Ser Asp Gln Gly Gly Asp Glu
130 135 140
Asp Tyr Trp Pro Gly His Phe Ala Pro Trp Ile Lys Gln Tyr Ser Leu
145 150 155 160
Lys Leu
<210> 6
<211> 229
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 6
Met Ser Ser Lys Thr Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg
1 5 10 15
Arg Ile Glu Pro His Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu
20 25 30
Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile Asn Trp Gly Gly Arg His
35 40 45
Ser Ile Trp Arg His Thr Ser Gln Asn Thr Asn Lys His Val Glu Val
50 55 60
Asn Phe Ile Glu Lys Phe Thr Thr Glu Arg Tyr Phe Cys Pro Asn Thr
65 70 75 80
Arg Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys
85 90 95
Ser Arg Ala Ile Thr Glu Phe Leu Ser Arg Tyr Pro Asn Val Thr Leu
100 105 110
Phe Ile Tyr Ile Ala Arg Leu Tyr His Leu Ala Asn Pro Arg Asn Arg
115 120 125
Gln Gly Leu Arg Asp Leu Ile Ser Ser Gly Val Thr Ile Gln Ile Met
130 135 140
Thr Glu Gln Glu Ser Gly Tyr Cys Trp His Asn Phe Val Asn Tyr Ser
145 150 155 160
Pro Ser Asn Glu Ser His Trp Pro Arg Tyr Pro His Leu Trp Val Arg
165 170 175
Leu Tyr Val Leu Glu Leu Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys
180 185 190
Leu Asn Ile Leu Arg Arg Lys Gln Ser Gln Leu Thr Ser Phe Thr Ile
195 200 205
Ala Leu Gln Ser Cys His Tyr Gln Arg Leu Pro Pro His Ile Leu Trp
210 215 220
Ala Thr Gly Leu Lys
225
<210> 7
<211> 208
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 7
Met Thr Asp Ala Glu Tyr Val Arg Ile His Glu Lys Leu Asp Ile Tyr
1 5 10 15
Thr Phe Lys Lys Gln Phe Ser Asn Asn Lys Lys Ser Val Ser His Arg
20 25 30
Cys Tyr Val Leu Phe Glu Leu Lys Arg Arg Gly Glu Arg Arg Ala Cys
35 40 45
Phe Trp Gly Tyr Ala Val Asn Lys Pro Gln Ser Gly Thr Glu Arg Gly
50 55 60
Ile His Ala Glu Ile Phe Ser Ile Arg Lys Val Glu Glu Tyr Leu Arg
65 70 75 80
Asp Asn Pro Gly Gln Phe Thr Ile Asn Trp Tyr Ser Ser Trp Ser Pro
85 90 95
Cys Ala Asp Cys Ala Glu Lys Ile Leu Glu Trp Tyr Asn Gln Glu Leu
100 105 110
Arg Gly Asn Gly His Thr Leu Lys Ile Trp Val Cys Lys Leu Tyr Tyr
115 120 125
Glu Lys Asn Ala Arg Asn Gln Ile Gly Leu Trp Asn Leu Arg Asp Asn
130 135 140
Gly Val Gly Leu Asn Val Met Val Ser Glu His Tyr Gln Cys Cys Arg
145 150 155 160
Lys Ile Phe Ile Gln Ser Ser His Asn Gln Leu Asn Glu Asn Arg Trp
165 170 175
Leu Glu Lys Thr Leu Lys Arg Ala Glu Lys Arg Arg Ser Glu Leu Ser
180 185 190
Ile Met Phe Gln Val Lys Ile Leu His Thr Thr Lys Ser Pro Ala Val
195 200 205
<210> 8
<211> 229
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 8
Met Ser Ser Lys Thr Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg
1 5 10 15
Arg Ile Glu Pro His Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu
20 25 30
Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile Lys Trp Gly Thr Ser His
35 40 45
Lys Ile Trp Arg His Ser Ser Lys Asn Thr Thr Lys His Val Glu Val
50 55 60
Asn Phe Ile Glu Lys Phe Thr Ser Glu Arg His Phe Cys Pro Ser Thr
65 70 75 80
Ser Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys
85 90 95
Ser Lys Ala Ile Thr Glu Phe Leu Ser Gln His Pro Asn Val Thr Leu
100 105 110
Val Ile Tyr Val Ala Arg Leu Tyr His Leu Met Asn Gln Gln Asn Arg
115 120 125
Gln Gly Leu Arg Asp Leu Val Asn Ser Gly Val Thr Ile Gln Ile Met
130 135 140
Thr Ala Pro Glu Tyr Asp Tyr Cys Trp His Asn Phe Val Asn Tyr Pro
145 150 155 160
Pro Gly Lys Glu Ser His Trp Pro Arg Tyr Pro Pro Leu Trp Met Lys
165 170 175
Leu Tyr Ala Leu Glu Leu His Ala Gly Ile Leu Gly Leu Pro Pro Cys
180 185 190
Leu Asn Ile Leu Arg Arg Lys Gln Ser Gln Leu Thr Ser Phe Thr Ile
195 200 205
Ala Leu Gln Ser Cys His Tyr Gln Arg Leu Pro Pro His Ile Leu Trp
210 215 220
Ala Thr Gly Leu Lys
225
<210> 9
<211> 1367
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 9
Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly
1 5 10 15
Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys
20 25 30
Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly
35 40 45
Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys
50 55 60
Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr
65 70 75 80
Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe
85 90 95
Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His
100 105 110
Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His
115 120 125
Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser
130 135 140
Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met
145 150 155 160
Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp
165 170 175
Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn
180 185 190
Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys
195 200 205
Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu
210 215 220
Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu
225 230 235 240
Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp
245 250 255
Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp
260 265 270
Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu
275 280 285
Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile
290 295 300
Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met
305 310 315 320
Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala
325 330 335
Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp
340 345 350
Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln
355 360 365
Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly
370 375 380
Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys
385 390 395 400
Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly
405 410 415
Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu
420 425 430
Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro
435 440 445
Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met
450 455 460
Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val
465 470 475 480
Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn
485 490 495
Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu
500 505 510
Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr
515 520 525
Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys
530 535 540
Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val
545 550 555 560
Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser
565 570 575
Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr
580 585 590
Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn
595 600 605
Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu
610 615 620
Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His
625 630 635 640
Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr
645 650 655
Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys
660 665 670
Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala
675 680 685
Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys
690 695 700
Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His
705 710 715 720
Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile
725 730 735
Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg
740 745 750
His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr
755 760 765
Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu
770 775 780
Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val
785 790 795 800
Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln
805 810 815
Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu
820 825 830
Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp
835 840 845
Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly
850 855 860
Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn
865 870 875 880
Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe
885 890 895
Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys
900 905 910
Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys
915 920 925
His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu
930 935 940
Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys
945 950 955 960
Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu
965 970 975
Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val
980 985 990
Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val
995 1000 1005
Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys
1010 1015 1020
Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr
1025 1030 1035
Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn
1040 1045 1050
Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr
1055 1060 1065
Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg
1070 1075 1080
Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu
1085 1090 1095
Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg
1100 1105 1110
Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys
1115 1120 1125
Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu
1130 1135 1140
Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser
1145 1150 1155
Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe
1160 1165 1170
Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu
1175 1180 1185
Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe
1190 1195 1200
Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu
1205 1210 1215
Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn
1220 1225 1230
Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro
1235 1240 1245
Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His
1250 1255 1260
Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg
1265 1270 1275
Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr
1280 1285 1290
Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile
1295 1300 1305
Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe
1310 1315 1320
Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr
1325 1330 1335
Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly
1340 1345 1350
Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 10
<211> 84
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 10
Met Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu
1 5 10 15
Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val
20 25 30
Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr Asp
35 40 45
Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu
50 55 60
Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys
65 70 75 80
Ile Lys Met Leu
<210> 11
<211> 32
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 11
Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr
1 5 10 15
Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser
20 25 30
<210> 12
<211> 10
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 12
Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser
1 5 10
<210> 13
<211> 17
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 13
Lys Arg Thr Ala Asp Gly Ser Glu Phe Glu Pro Lys Lys Lys Arg Lys
1 5 10 15
Val
<210> 14
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 14
Ser Gly Gly Ser
1
<210> 15
<211> 1853
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 15
Met Lys Arg Thr Ala Asp Gly Ser Glu Phe Glu Ser Pro Lys Lys Lys
1 5 10 15
Arg Lys Val Ser Ser Glu Thr Gly Pro Val Ala Val Asp Pro Thr Leu
20 25 30
Arg Arg Arg Ile Glu Pro His Glu Phe Glu Val Phe Phe Asp Pro Arg
35 40 45
Glu Leu Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile Asn Trp Gly Gly
50 55 60
Arg His Ser Ile Trp Arg His Thr Ser Gln Asn Thr Asn Lys His Val
65 70 75 80
Glu Val Asn Phe Ile Glu Lys Phe Thr Thr Glu Arg Tyr Phe Cys Pro
85 90 95
Asn Thr Arg Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Gly
100 105 110
Glu Cys Ser Arg Ala Ile Thr Glu Phe Leu Ser Arg Tyr Pro His Val
115 120 125
Thr Leu Phe Ile Tyr Ile Ala Arg Leu Tyr His His Ala Asp Pro Arg
130 135 140
Asn Arg Gln Gly Leu Arg Asp Leu Ile Ser Ser Gly Val Thr Ile Gln
145 150 155 160
Ile Met Thr Glu Gln Glu Ser Gly Tyr Cys Trp Arg Asn Phe Val Asn
165 170 175
Tyr Ser Pro Ser Asn Glu Ala His Trp Pro Arg Tyr Pro His Leu Trp
180 185 190
Val Arg Leu Tyr Val Leu Glu Leu Tyr Cys Ile Ile Leu Gly Leu Pro
195 200 205
Pro Cys Leu Asn Ile Leu Arg Arg Lys Gln Pro Gln Leu Thr Phe Phe
210 215 220
Thr Ile Ala Leu Gln Ser Cys His Tyr Gln Arg Leu Pro Pro His Ile
225 230 235 240
Leu Trp Ala Thr Gly Leu Lys Ser Gly Gly Ser Ser Gly Gly Ser Ser
245 250 255
Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser
260 265 270
Gly Gly Ser Ser Gly Gly Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala
275 280 285
Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys
290 295 300
Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser
305 310 315 320
Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr
325 330 335
Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg
340 345 350
Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met
355 360 365
Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu
370 375 380
Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile
385 390 395 400
Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu
405 410 415
Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile
420 425 430
Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile
435 440 445
Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile
450 455 460
Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn
465 470 475 480
Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys
485 490 495
Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys
500 505 510
Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro
515 520 525
Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu
530 535 540
Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile
545 550 555 560
Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp
565 570 575
Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys
580 585 590
Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln
595 600 605
Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys
610 615 620
Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr
625 630 635 640
Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro
645 650 655
Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn
660 665 670
Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile
675 680 685
Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln
690 695 700
Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys
705 710 715 720
Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly
725 730 735
Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr
740 745 750
Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser
755 760 765
Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys
770 775 780
Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn
785 790 795 800
Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala
805 810 815
Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys
820 825 830
Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys
835 840 845
Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg
850 855 860
Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys
865 870 875 880
Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp
885 890 895
Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu
900 905 910
Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln
915 920 925
Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu
930 935 940
Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe
945 950 955 960
Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His
965 970 975
Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser
980 985 990
Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser
995 1000 1005
Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp
1010 1015 1020
Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val
1025 1030 1035
Ile Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys
1040 1045 1050
Asn Ser Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu
1055 1060 1065
Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln
1070 1075 1080
Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg
1085 1090 1095
Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp
1100 1105 1110
Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp
1115 1120 1125
Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly
1130 1135 1140
Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
1145 1150 1155
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg
1160 1165 1170
Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu
1175 1180 1185
Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg
1190 1195 1200
Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn
1205 1210 1215
Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val
1220 1225 1230
Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe
1235 1240 1245
Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His
1250 1255 1260
Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys
1265 1270 1275
Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val
1280 1285 1290
Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly
1295 1300 1305
Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe
1310 1315 1320
Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg
1325 1330 1335
Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp
1340 1345 1350
Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro
1355 1360 1365
Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe
1370 1375 1380
Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile
1385 1390 1395
Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp
1400 1405 1410
Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu
1415 1420 1425
Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly
1430 1435 1440
Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp
1445 1450 1455
Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile
1460 1465 1470
Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg
1475 1480 1485
Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu
1490 1495 1500
Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser
1505 1510 1515
His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys
1520 1525 1530
Gln Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile
1535 1540 1545
Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala
1550 1555 1560
Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys
1565 1570 1575
Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu
1580 1585 1590
Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr
1595 1600 1605
Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala
1610 1615 1620
Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile
1625 1630 1635
Asp Leu Ser Gln Leu Gly Gly Asp Ser Gly Gly Ser Gly Gly Ser
1640 1645 1650
Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly
1655 1660 1665
Lys Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu
1670 1675 1680
Val Glu Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val
1685 1690 1695
His Thr Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu
1700 1705 1710
Thr Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln
1715 1720 1725
Asp Ser Asn Gly Glu Asn Lys Ile Lys Met Leu Ser Gly Gly Ser
1730 1735 1740
Gly Gly Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys
1745 1750 1755
Glu Thr Gly Lys Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu
1760 1765 1770
Pro Glu Glu Val Glu Glu Val Ile Gly Asn Lys Pro Glu Ser Asp
1775 1780 1785
Ile Leu Val His Thr Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val
1790 1795 1800
Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala Leu
1805 1810 1815
Val Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys Met Leu Ser
1820 1825 1830
Gly Gly Ser Lys Arg Thr Ala Asp Gly Ser Glu Phe Glu Pro Lys
1835 1840 1845
Lys Lys Arg Lys Val
1850
<210> 16
<211> 1853
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 16
Met Lys Arg Thr Ala Asp Gly Ser Glu Phe Glu Ser Pro Lys Lys Lys
1 5 10 15
Arg Lys Val Ser Ser Lys Thr Gly Pro Val Ala Val Asp Pro Thr Leu
20 25 30
Arg Arg Arg Ile Glu Pro His Glu Phe Glu Val Phe Phe Asp Pro Arg
35 40 45
Glu Leu Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile Asn Trp Gly Gly
50 55 60
Arg His Ser Ile Trp Arg His Thr Ser Gln Asn Thr Asn Lys His Val
65 70 75 80
Glu Val Asn Phe Ile Glu Lys Phe Thr Thr Glu Arg Tyr Phe Cys Pro
85 90 95
Asn Thr Arg Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Gly
100 105 110
Glu Cys Ser Arg Ala Ile Thr Glu Phe Leu Ser Arg Tyr Pro Asn Val
115 120 125
Thr Leu Phe Ile Tyr Ile Ala Arg Leu Tyr His Leu Ala Asn Pro Arg
130 135 140
Asn Arg Gln Gly Leu Arg Asp Leu Ile Ser Ser Gly Val Thr Ile Gln
145 150 155 160
Ile Met Thr Glu Gln Glu Ser Gly Tyr Cys Trp His Asn Phe Val Asn
165 170 175
Tyr Ser Pro Ser Asn Glu Ser His Trp Pro Arg Tyr Pro His Leu Trp
180 185 190
Val Arg Leu Tyr Val Leu Glu Leu Tyr Cys Ile Ile Leu Gly Leu Pro
195 200 205
Pro Cys Leu Asn Ile Leu Arg Arg Lys Gln Ser Gln Leu Thr Ser Phe
210 215 220
Thr Ile Ala Leu Gln Ser Cys His Tyr Gln Arg Leu Pro Pro His Ile
225 230 235 240
Leu Trp Ala Thr Gly Leu Lys Ser Gly Gly Ser Ser Gly Gly Ser Ser
245 250 255
Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser
260 265 270
Gly Gly Ser Ser Gly Gly Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala
275 280 285
Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys
290 295 300
Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser
305 310 315 320
Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr
325 330 335
Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg
340 345 350
Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met
355 360 365
Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu
370 375 380
Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile
385 390 395 400
Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu
405 410 415
Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile
420 425 430
Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile
435 440 445
Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile
450 455 460
Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn
465 470 475 480
Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys
485 490 495
Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys
500 505 510
Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro
515 520 525
Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu
530 535 540
Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile
545 550 555 560
Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp
565 570 575
Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys
580 585 590
Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln
595 600 605
Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys
610 615 620
Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr
625 630 635 640
Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro
645 650 655
Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn
660 665 670
Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile
675 680 685
Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln
690 695 700
Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys
705 710 715 720
Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly
725 730 735
Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr
740 745 750
Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser
755 760 765
Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys
770 775 780
Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn
785 790 795 800
Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala
805 810 815
Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys
820 825 830
Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys
835 840 845
Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg
850 855 860
Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys
865 870 875 880
Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp
885 890 895
Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu
900 905 910
Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln
915 920 925
Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu
930 935 940
Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe
945 950 955 960
Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His
965 970 975
Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser
980 985 990
Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser
995 1000 1005
Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp
1010 1015 1020
Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val
1025 1030 1035
Ile Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys
1040 1045 1050
Asn Ser Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu
1055 1060 1065
Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln
1070 1075 1080
Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg
1085 1090 1095
Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp
1100 1105 1110
Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp
1115 1120 1125
Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly
1130 1135 1140
Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
1145 1150 1155
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg
1160 1165 1170
Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu
1175 1180 1185
Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg
1190 1195 1200
Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn
1205 1210 1215
Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val
1220 1225 1230
Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe
1235 1240 1245
Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His
1250 1255 1260
Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys
1265 1270 1275
Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val
1280 1285 1290
Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly
1295 1300 1305
Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe
1310 1315 1320
Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg
1325 1330 1335
Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp
1340 1345 1350
Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro
1355 1360 1365
Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe
1370 1375 1380
Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile
1385 1390 1395
Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp
1400 1405 1410
Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu
1415 1420 1425
Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly
1430 1435 1440
Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp
1445 1450 1455
Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile
1460 1465 1470
Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg
1475 1480 1485
Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu
1490 1495 1500
Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser
1505 1510 1515
His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys
1520 1525 1530
Gln Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile
1535 1540 1545
Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala
1550 1555 1560
Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys
1565 1570 1575
Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu
1580 1585 1590
Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr
1595 1600 1605
Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala
1610 1615 1620
Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile
1625 1630 1635
Asp Leu Ser Gln Leu Gly Gly Asp Ser Gly Gly Ser Gly Gly Ser
1640 1645 1650
Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly
1655 1660 1665
Lys Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu
1670 1675 1680
Val Glu Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val
1685 1690 1695
His Thr Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu
1700 1705 1710
Thr Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln
1715 1720 1725
Asp Ser Asn Gly Glu Asn Lys Ile Lys Met Leu Ser Gly Gly Ser
1730 1735 1740
Gly Gly Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys
1745 1750 1755
Glu Thr Gly Lys Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu
1760 1765 1770
Pro Glu Glu Val Glu Glu Val Ile Gly Asn Lys Pro Glu Ser Asp
1775 1780 1785
Ile Leu Val His Thr Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val
1790 1795 1800
Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala Leu
1805 1810 1815
Val Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys Met Leu Ser
1820 1825 1830
Gly Gly Ser Lys Arg Thr Ala Asp Gly Ser Glu Phe Glu Pro Lys
1835 1840 1845
Lys Lys Arg Lys Val
1850
<210> 17
<211> 1833
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 17
Met Lys Arg Thr Ala Asp Gly Ser Glu Phe Glu Ser Pro Lys Lys Lys
1 5 10 15
Arg Lys Val Ser Thr Asp Ala Glu Tyr Val Arg Ile His Glu Lys Leu
20 25 30
Asp Ile Tyr Thr Phe Lys Lys Gln Phe Phe Asn Asn Lys Lys Ser Val
35 40 45
Ser His Arg Cys Tyr Val Leu Phe Glu Leu Lys Arg Arg Gly Glu Arg
50 55 60
Arg Ala Cys Phe Trp Gly Tyr Ala Val Asn Lys Pro Gln Ser Gly Thr
65 70 75 80
Glu Arg Gly Ile His Ala Glu Ile Phe Ser Ile Arg Lys Val Glu Glu
85 90 95
Tyr Leu Arg Asp Asn Pro Gly Gln Phe Thr Ile Asn Trp Tyr Ser Ser
100 105 110
Trp Ser Pro Cys Ala Asp Cys Ala Glu Lys Ile Leu Glu Trp Tyr Asn
115 120 125
Gln Glu Leu Arg Gly Asn Gly His Thr Leu Lys Ile Trp Ala Cys Lys
130 135 140
Leu Tyr Tyr Glu Lys Asn Ala Arg Asn Gln Ile Gly Leu Trp Asn Leu
145 150 155 160
Arg Asp Asn Gly Val Gly Leu Asn Val Met Val Ser Glu His Tyr Gln
165 170 175
Cys Cys Arg Lys Ile Phe Ile Gln Ser Ser His Asn Gln Leu Asn Glu
180 185 190
Asn Arg Trp Leu Glu Lys Thr Leu Lys Arg Ala Glu Lys Arg Arg Ser
195 200 205
Glu Leu Ser Ile Met Ile Gln Val Lys Ile Leu His Thr Thr Lys Ser
210 215 220
Pro Ala Val Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr
225 230 235 240
Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser
245 250 255
Gly Gly Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn
260 265 270
Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys
275 280 285
Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn
290 295 300
Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr
305 310 315 320
Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg
325 330 335
Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp
340 345 350
Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp
355 360 365
Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val
370 375 380
Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu
385 390 395 400
Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu
405 410 415
Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu
420 425 430
Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln
435 440 445
Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val
450 455 460
Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu
465 470 475 480
Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe
485 490 495
Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser
500 505 510
Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr
515 520 525
Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr
530 535 540
Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu
545 550 555 560
Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser
565 570 575
Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu
580 585 590
Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile
595 600 605
Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly
610 615 620
Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys
625 630 635 640
Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu
645 650 655
Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile
660 665 670
His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr
675 680 685
Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe
690 695 700
Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe
705 710 715 720
Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe
725 730 735
Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg
740 745 750
Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys
755 760 765
His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys
770 775 780
Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly
785 790 795 800
Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys
805 810 815
Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys
820 825 830
Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser
835 840 845
Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe
850 855 860
Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr
865 870 875 880
Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr
885 890 895
Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg
900 905 910
Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile
915 920 925
Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp
930 935 940
Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu
945 950 955 960
Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp
965 970 975
Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys
980 985 990
Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val
995 1000 1005
Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg
1010 1015 1020
Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg
1025 1030 1035
Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile
1040 1045 1050
Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys
1055 1060 1065
Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp
1070 1075 1080
Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His
1085 1090 1095
Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys
1100 1105 1110
Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val
1115 1120 1125
Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln
1130 1135 1140
Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu
1145 1150 1155
Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly
1160 1165 1170
Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His
1175 1180 1185
Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu
1190 1195 1200
Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
1205 1210 1215
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val
1220 1225 1230
Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn
1235 1240 1245
Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu
1250 1255 1260
Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys
1265 1270 1275
Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys
1280 1285 1290
Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile
1295 1300 1305
Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr
1310 1315 1320
Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe
1325 1330 1335
Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val
1340 1345 1350
Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile
1355 1360 1365
Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp
1370 1375 1380
Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala
1385 1390 1395
Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys
1400 1405 1410
Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu
1415 1420 1425
Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys
1430 1435 1440
Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys
1445 1450 1455
Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala
1460 1465 1470
Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser
1475 1480 1485
Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu
1490 1495 1500
Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu
1505 1510 1515
Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu
1520 1525 1530
Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val
1535 1540 1545
Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln
1550 1555 1560
Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala
1565 1570 1575
Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg
1580 1585 1590
Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln
1595 1600 1605
Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu
1610 1615 1620
Gly Gly Asp Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Thr Asn
1625 1630 1635
Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu Val Ile
1640 1645 1650
Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val Ile
1655 1660 1665
Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr Asp
1670 1675 1680
Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala Pro
1685 1690 1695
Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu
1700 1705 1710
Asn Lys Ile Lys Met Leu Ser Gly Gly Ser Gly Gly Ser Gly Gly
1715 1720 1725
Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln
1730 1735 1740
Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu
1745 1750 1755
Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr
1760 1765 1770
Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser
1775 1780 1785
Asp Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser
1790 1795 1800
Asn Gly Glu Asn Lys Ile Lys Met Leu Ser Gly Gly Ser Lys Arg
1805 1810 1815
Thr Ala Asp Gly Ser Glu Phe Glu Pro Lys Lys Lys Arg Lys Val
1820 1825 1830
<210> 18
<211> 1833
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 18
Met Lys Arg Thr Ala Asp Gly Ser Glu Phe Glu Ser Pro Lys Lys Lys
1 5 10 15
Arg Lys Val Ser Thr Asp Ala Glu Tyr Val Arg Ile His Glu Lys Leu
20 25 30
Asp Ile Tyr Thr Phe Lys Lys Gln Phe Ser Asn Asn Lys Lys Ser Val
35 40 45
Ser His Arg Cys Tyr Val Leu Phe Glu Leu Lys Arg Arg Gly Glu Arg
50 55 60
Arg Ala Cys Phe Trp Gly Tyr Ala Val Asn Lys Pro Gln Ser Gly Thr
65 70 75 80
Glu Arg Gly Ile His Ala Glu Ile Phe Ser Ile Arg Lys Val Glu Glu
85 90 95
Tyr Leu Arg Asp Asn Pro Gly Gln Phe Thr Ile Asn Trp Tyr Ser Ser
100 105 110
Trp Ser Pro Cys Ala Asp Cys Ala Glu Lys Ile Leu Glu Trp Tyr Asn
115 120 125
Gln Glu Leu Arg Gly Asn Gly His Thr Leu Lys Ile Trp Val Cys Lys
130 135 140
Leu Tyr Tyr Glu Lys Asn Ala Arg Asn Gln Ile Gly Leu Trp Asn Leu
145 150 155 160
Arg Asp Asn Gly Val Gly Leu Asn Val Met Val Ser Glu His Tyr Gln
165 170 175
Cys Cys Arg Lys Ile Phe Ile Gln Ser Ser His Asn Gln Leu Asn Glu
180 185 190
Asn Arg Trp Leu Glu Lys Thr Leu Lys Arg Ala Glu Lys Arg Arg Ser
195 200 205
Glu Leu Ser Ile Met Phe Gln Val Lys Ile Leu His Thr Thr Lys Ser
210 215 220
Pro Ala Val Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr
225 230 235 240
Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser
245 250 255
Gly Gly Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn
260 265 270
Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys
275 280 285
Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn
290 295 300
Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr
305 310 315 320
Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg
325 330 335
Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp
340 345 350
Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp
355 360 365
Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val
370 375 380
Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu
385 390 395 400
Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu
405 410 415
Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu
420 425 430
Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln
435 440 445
Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val
450 455 460
Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu
465 470 475 480
Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe
485 490 495
Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser
500 505 510
Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr
515 520 525
Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr
530 535 540
Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu
545 550 555 560
Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser
565 570 575
Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu
580 585 590
Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile
595 600 605
Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly
610 615 620
Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys
625 630 635 640
Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu
645 650 655
Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile
660 665 670
His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr
675 680 685
Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe
690 695 700
Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe
705 710 715 720
Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe
725 730 735
Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg
740 745 750
Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys
755 760 765
His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys
770 775 780
Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly
785 790 795 800
Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys
805 810 815
Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys
820 825 830
Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser
835 840 845
Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe
850 855 860
Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr
865 870 875 880
Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr
885 890 895
Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg
900 905 910
Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile
915 920 925
Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp
930 935 940
Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu
945 950 955 960
Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp
965 970 975
Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys
980 985 990
Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val
995 1000 1005
Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg
1010 1015 1020
Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg
1025 1030 1035
Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile
1040 1045 1050
Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys
1055 1060 1065
Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp
1070 1075 1080
Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His
1085 1090 1095
Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys
1100 1105 1110
Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val
1115 1120 1125
Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln
1130 1135 1140
Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu
1145 1150 1155
Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly
1160 1165 1170
Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His
1175 1180 1185
Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu
1190 1195 1200
Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
1205 1210 1215
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val
1220 1225 1230
Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn
1235 1240 1245
Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu
1250 1255 1260
Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys
1265 1270 1275
Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys
1280 1285 1290
Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile
1295 1300 1305
Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr
1310 1315 1320
Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe
1325 1330 1335
Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val
1340 1345 1350
Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile
1355 1360 1365
Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp
1370 1375 1380
Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala
1385 1390 1395
Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys
1400 1405 1410
Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu
1415 1420 1425
Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys
1430 1435 1440
Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys
1445 1450 1455
Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala
1460 1465 1470
Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser
1475 1480 1485
Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu
1490 1495 1500
Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu
1505 1510 1515
Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu
1520 1525 1530
Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val
1535 1540 1545
Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln
1550 1555 1560
Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala
1565 1570 1575
Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg
1580 1585 1590
Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln
1595 1600 1605
Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu
1610 1615 1620
Gly Gly Asp Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Thr Asn
1625 1630 1635
Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu Val Ile
1640 1645 1650
Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val Ile
1655 1660 1665
Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr Asp
1670 1675 1680
Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala Pro
1685 1690 1695
Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu
1700 1705 1710
Asn Lys Ile Lys Met Leu Ser Gly Gly Ser Gly Gly Ser Gly Gly
1715 1720 1725
Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln
1730 1735 1740
Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu
1745 1750 1755
Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr
1760 1765 1770
Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser
1775 1780 1785
Asp Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser
1790 1795 1800
Asn Gly Glu Asn Lys Ile Lys Met Leu Ser Gly Gly Ser Lys Arg
1805 1810 1815
Thr Ala Asp Gly Ser Glu Phe Glu Pro Lys Lys Lys Arg Lys Val
1820 1825 1830
<210> 19
<211> 1787
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 19
Met Lys Arg Thr Ala Asp Gly Ser Glu Phe Glu Ser Pro Lys Lys Lys
1 5 10 15
Arg Lys Val Ser Phe Glu Arg Asn Tyr Asp Pro Arg Glu Leu Arg Lys
20 25 30
Glu Thr Tyr Leu Leu Tyr Glu Ile Lys Trp Gly Lys Ser Gly Lys Leu
35 40 45
Trp Arg His Trp Cys Gln Asn Asn Arg Thr Gln His Ala Glu Val Tyr
50 55 60
Phe Leu Glu Asn Ile Phe Asn Ala Arg Arg Phe Asn Pro Ser Thr His
65 70 75 80
Cys Ser Ile Thr Trp Tyr Leu Ser Trp Ser Pro Cys Ala Glu Cys Ser
85 90 95
Gln Lys Ile Val Asp Phe Leu Lys Glu His Pro Asn Val Asn Leu Glu
100 105 110
Ile Tyr Val Ala Arg Leu Tyr Tyr His Glu Asp Glu Arg Asn Arg Gln
115 120 125
Gly Leu Arg Asp Leu Val Asn Ser Gly Val Thr Ile Arg Ile Met Asp
130 135 140
Leu Pro Asp Tyr Asn Tyr Cys Trp Lys Thr Phe Val Ser Asp Gln Gly
145 150 155 160
Gly Asp Glu Asp Tyr Trp Pro Gly His Phe Ala Pro Trp Ile Lys Gln
165 170 175
Tyr Ser Leu Lys Leu Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser
180 185 190
Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly
195 200 205
Ser Ser Gly Gly Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly
210 215 220
Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro
225 230 235 240
Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys
245 250 255
Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu
260 265 270
Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys
275 280 285
Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys
290 295 300
Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu
305 310 315 320
Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp
325 330 335
Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys
340 345 350
Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu
355 360 365
Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly
370 375 380
Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu
385 390 395 400
Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser
405 410 415
Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg
420 425 430
Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly
435 440 445
Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe
450 455 460
Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys
465 470 475 480
Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp
485 490 495
Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile
500 505 510
Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro
515 520 525
Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu
530 535 540
Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys
545 550 555 560
Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp
565 570 575
Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu
580 585 590
Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu
595 600 605
Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His
610 615 620
Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp
625 630 635 640
Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu
645 650 655
Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser
660 665 670
Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp
675 680 685
Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile
690 695 700
Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu
705 710 715 720
Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu
725 730 735
Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu
740 745 750
Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn
755 760 765
Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile
770 775 780
Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn
785 790 795 800
Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys
805 810 815
Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val
820 825 830
Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu
835 840 845
Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys
850 855 860
Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn
865 870 875 880
Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys
885 890 895
Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp
900 905 910
Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln
915 920 925
Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala
930 935 940
Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val
945 950 955 960
Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala
965 970 975
Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg
980 985 990
Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu
995 1000 1005
Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu
1010 1015 1020
Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln
1025 1030 1035
Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile
1040 1045 1050
Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val
1055 1060 1065
Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro
1070 1075 1080
Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu
1085 1090 1095
Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr
1100 1105 1110
Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe
1115 1120 1125
Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His Val
1130 1135 1140
Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn
1145 1150 1155
Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys
1160 1165 1170
Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
1175 1180 1185
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala
1190 1195 1200
Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser
1205 1210 1215
Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met
1220 1225 1230
Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr
1235 1240 1245
Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr
1250 1255 1260
Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn
1265 1270 1275
Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala
1280 1285 1290
Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys
1295 1300 1305
Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu
1310 1315 1320
Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp
1325 1330 1335
Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr
1340 1345 1350
Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys
1355 1360 1365
Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg
1370 1375 1380
Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly
1385 1390 1395
Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr
1400 1405 1410
Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser
1415 1420 1425
Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys
1430 1435 1440
Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys
1445 1450 1455
Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln
1460 1465 1470
His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe
1475 1480 1485
Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu
1490 1495 1500
Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala
1505 1510 1515
Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro
1520 1525 1530
Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr
1535 1540 1545
Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser
1550 1555 1560
Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly
1565 1570 1575
Gly Asp Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Thr Asn Leu
1580 1585 1590
Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu Val Ile Gln
1595 1600 1605
Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val Ile Gly
1610 1615 1620
Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr Asp Glu
1625 1630 1635
Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu
1640 1645 1650
Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn
1655 1660 1665
Lys Ile Lys Met Leu Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser
1670 1675 1680
Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu
1685 1690 1695
Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu
1700 1705 1710
Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala
1715 1720 1725
Tyr Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp
1730 1735 1740
Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn
1745 1750 1755
Gly Glu Asn Lys Ile Lys Met Leu Ser Gly Gly Ser Lys Arg Thr
1760 1765 1770
Ala Asp Gly Ser Glu Phe Glu Pro Lys Lys Lys Arg Lys Val
1775 1780 1785
<210> 20
<211> 1787
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 20
Met Lys Arg Thr Ala Asp Gly Ser Glu Phe Glu Ser Pro Lys Lys Lys
1 5 10 15
Arg Lys Val Ser Phe Glu Arg Asn Tyr Asp Pro Arg Glu Leu Arg Lys
20 25 30
Glu Thr Tyr Leu Leu Tyr Glu Ile Lys Trp Gly Lys Ser Gly Lys Leu
35 40 45
Trp Arg His Trp Cys Gln Asn Asn Arg Thr Gln His Ala Glu Val Tyr
50 55 60
Phe Leu Glu Asn Ile Phe Asn Ala Arg Arg Phe Asn Pro Ser Thr His
65 70 75 80
Cys Ser Ile Thr Trp Tyr Leu Ser Trp Ser Pro Cys Ala Glu Cys Ser
85 90 95
Gln Lys Ile Val Asp Phe Leu Lys Glu His Pro Asn Val Asn Leu Glu
100 105 110
Ile Tyr Val Ala Arg Leu Tyr Tyr Pro Glu Asn Glu Arg Asn Arg Gln
115 120 125
Gly Leu Arg Asp Leu Val Asn Ser Gly Val Thr Ile Arg Ile Met Asp
130 135 140
Leu Pro Asp Tyr Asn Tyr Cys Trp Lys Thr Phe Val Ser Asp Gln Gly
145 150 155 160
Gly Asp Glu Asp Tyr Trp Pro Gly His Phe Ala Pro Trp Ile Lys Gln
165 170 175
Tyr Ser Leu Lys Leu Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser
180 185 190
Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly
195 200 205
Ser Ser Gly Gly Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly
210 215 220
Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro
225 230 235 240
Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys
245 250 255
Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu
260 265 270
Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys
275 280 285
Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys
290 295 300
Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu
305 310 315 320
Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp
325 330 335
Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys
340 345 350
Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu
355 360 365
Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly
370 375 380
Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu
385 390 395 400
Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser
405 410 415
Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg
420 425 430
Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly
435 440 445
Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe
450 455 460
Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys
465 470 475 480
Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp
485 490 495
Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile
500 505 510
Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro
515 520 525
Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu
530 535 540
Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys
545 550 555 560
Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp
565 570 575
Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu
580 585 590
Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu
595 600 605
Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His
610 615 620
Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp
625 630 635 640
Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu
645 650 655
Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser
660 665 670
Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp
675 680 685
Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile
690 695 700
Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu
705 710 715 720
Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu
725 730 735
Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu
740 745 750
Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn
755 760 765
Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile
770 775 780
Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn
785 790 795 800
Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys
805 810 815
Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val
820 825 830
Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu
835 840 845
Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys
850 855 860
Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn
865 870 875 880
Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys
885 890 895
Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp
900 905 910
Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln
915 920 925
Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala
930 935 940
Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val
945 950 955 960
Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala
965 970 975
Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg
980 985 990
Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu
995 1000 1005
Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu
1010 1015 1020
Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln
1025 1030 1035
Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile
1040 1045 1050
Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val
1055 1060 1065
Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro
1070 1075 1080
Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu
1085 1090 1095
Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr
1100 1105 1110
Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe
1115 1120 1125
Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His Val
1130 1135 1140
Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn
1145 1150 1155
Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys
1160 1165 1170
Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
1175 1180 1185
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala
1190 1195 1200
Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser
1205 1210 1215
Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met
1220 1225 1230
Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr
1235 1240 1245
Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr
1250 1255 1260
Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn
1265 1270 1275
Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala
1280 1285 1290
Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys
1295 1300 1305
Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu
1310 1315 1320
Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp
1325 1330 1335
Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr
1340 1345 1350
Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys
1355 1360 1365
Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg
1370 1375 1380
Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly
1385 1390 1395
Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr
1400 1405 1410
Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser
1415 1420 1425
Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys
1430 1435 1440
Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys
1445 1450 1455
Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln
1460 1465 1470
His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe
1475 1480 1485
Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu
1490 1495 1500
Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala
1505 1510 1515
Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro
1520 1525 1530
Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr
1535 1540 1545
Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser
1550 1555 1560
Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly
1565 1570 1575
Gly Asp Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Thr Asn Leu
1580 1585 1590
Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu Val Ile Gln
1595 1600 1605
Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val Ile Gly
1610 1615 1620
Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr Asp Glu
1625 1630 1635
Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu
1640 1645 1650
Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn
1655 1660 1665
Lys Ile Lys Met Leu Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser
1670 1675 1680
Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu
1685 1690 1695
Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu
1700 1705 1710
Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala
1715 1720 1725
Tyr Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp
1730 1735 1740
Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn
1745 1750 1755
Gly Glu Asn Lys Ile Lys Met Leu Ser Gly Gly Ser Lys Arg Thr
1760 1765 1770
Ala Asp Gly Ser Glu Phe Glu Pro Lys Lys Lys Arg Lys Val
1775 1780 1785
<210> 21
<211> 6407
<212> DNA
<213> bacteriophage
<400> 21
aacgctacta ctattagtag aattgatgcc accttttcag ctcgcgcccc aaatgaaaat 60
atagctaaac aggttattga ccatttgcga aatgtatcta atggtcaaac taaatctact 120
cgttcgcaga attgggaatc aactgttaca tggaatgaaa cttccagaca ccgtacttta 180
gttgcatatt taaaacatgt tgagctacag caccagattc agcaattaag ctctaagcca 240
tccgcaaaaa tgacctctta tcaaaaggag caattaaagg tactctctaa tcctgacctg 300
ttggagtttg cttccggtct ggttcgcttt gaagctcgaa ttaaaacgcg atatttgaag 360
tctttcgggc ttcctcttaa tctttttgat gcaatccgct ttgcttctga ctataatagt 420
cagggtaaag acctgatttt tgatttatgg tcattctcgt tttctgaact gtttaaagca 480
tttgaggggg attcaatgaa tatttatgac gattccgcag tattggacgc tatccagtct 540
aaacatttta ctattacccc ctctggcaaa acttcttttg caaaagcctc tcgctatttt 600
ggtttttatc gtcgtctggt aaacgagggt tatgatagtg ttgctcttac tatgcctcgt 660
aattcctttt ggcgttatgt atctgcatta gttgaatgtg gtattcctaa atctcaactg 720
atgaatcttt ctacctgtaa taatgttgtt ccgttagttc gttttattaa cgtagatttt 780
tcttcccaac gtcctgactg gtataatgag ccagttctta aaatcgcata aggtaattca 840
caatgattaa agttgaaatt aaaccatctc aagcccaatt tactactcgt tctggtgttt 900
ctcgtcaggg caagccttat tcactgaatg agcagctttg ttacgttgat ttgggtaatg 960
aatatccggt tcttgtcaag attactcttg atgaaggtca gccagcctat gcgcctggtc 1020
tgtacaccgt tcatctgtcc tctttcaaag ttggtcagtt cggttccctt atgattgacc 1080
gtctgcgcct cgttccggct aagtaacatg gagcaggtcg cggatttcga cacaatttat 1140
caggcgatga tacaaatctc cgttgtactt tgtttcgcgc ttggtataat cgctgggggt 1200
caaagatgag tgttttagtg tattctttcg cctctttcgt tttaggttgg tgccttcgta 1260
gtggcattac gtattttacc cgtttaatgg aaacttcctc atgaaaaagt ctttagtcct 1320
caaagcctct gtagccgttg ctaccctcgt tccgatgctg tctttcgctg ctgagggtga 1380
cgatcccgca aaagcggcct ttaactccct gcaagcctca gcgaccgaat atatcggtta 1440
tgcgtgggcg atggttgttg tcattgtcgg cgcaactatc ggtatcaagc tgtttaagaa 1500
attcacctcg aaagcaagct gataaaccga tacaattaaa ggctcctttt ggagcctttt 1560
tttttggaga ttttcaacat gaaaaaatta ttattcgcaa ttcctttagt tgttcctttc 1620
tattctcact ccgctgaaac tgttgaaagt tgtttagcaa aaccccatac agaaaattca 1680
tttactaacg tctggaaaga cgacaaaact ttagatcgtt acgctaacta tgagggttgt 1740
ctgtggaatg ctacaggcgt tgtagtttgt actggtgacg aaactcagtg ttacggtaca 1800
tgggttccta ttgggcttgc tatccctgaa aatgagggtg gtggctctga gggtggcggt 1860
tctgagggtg gcggttctga gggtggcggt actaaacctc ctgagtacgg tgatacacct 1920
attccgggct atacttatat caaccctctc gacggcactt atccgcctgg tactgagcaa 1980
aaccccgcta atcctaatcc ttctcttgag gagtctcagc ctcttaatac tttcatgttt 2040
cagaataata ggttccgaaa taggcagggg gcattaactg tttatacggg cactgttact 2100
caaggcactg accccgttaa aacttattac cagtacactc ctgtatcatc aaaagccatg 2160
tatgacgctt actggaacgg taaattcaga gactgcgctt tccattctgg ctttaatgag 2220
gatccattcg tttgtgaata tcaaggccaa tcgtctgacc tgcctcaacc tcctgtcaat 2280
gctggcggcg gctctggtgg tggttctggt ggcggctctg agggtggtgg ctctgagggt 2340
ggcggttctg agggtggcgg ctctgaggga ggcggttccg gtggtggctc tggttccggt 2400
gattttgatt atgaaaagat ggcaaacgct aataaggggg ctatgaccga aaatgccgat 2460
gaaaacgcgc tacagtctga cgctaaaggc aaacttgatt ctgtcgctac tgattacggt 2520
gctgctatcg atggtttcat tggtgacgtt tccggccttg ctaatggtaa tggtgctact 2580
ggtgattttg ctggctctaa ttcccaaatg gctcaagtcg gtgacggtga taattcacct 2640
ttaatgaata atttccgtca atatttacct tccctccctc aatcggttga atgtcgccct 2700
tttgtcttta gcgctggtaa accatatgaa ttttctattg attgtgacaa aataaactta 2760
ttccgtggtg tctttgcgtt tcttttatat gttgccacct ttatgtatgt attttctacg 2820
tttgctaaca tactgcgtaa taaggagtct taatcatgcc agttcttttg ggtattccgt 2880
tattattgcg tttcctcggt ttccttctgg taactttgtt cggctatctg cttacttttc 2940
ttaaaaaggg cttcggtaag atagctattg ctatttcatt gtttcttgct cttattattg 3000
ggcttaactc aattcttgtg ggttatctct ctgatattag cgctcaatta ccctctgact 3060
ttgttcaggg tgttcagtta attctcccgt ctaatgcgct tccctgtttt tatgttattc 3120
tctctgtaaa ggctgctatt ttcatttttg acgttaaaca aaaaatcgtt tcttatttgg 3180
attgggataa ataatatggc tgtttatttt gtaactggca aattaggctc tggaaagacg 3240
ctcgttagcg ttggtaagat tcaggataaa attgtagctg ggtgcaaaat agcaactaat 3300
cttgatttaa ggcttcaaaa cctcccgcaa gtcgggaggt tcgctaaaac gcctcgcgtt 3360
cttagaatac cggataagcc ttctatatct gatttgcttg ctattgggcg cggtaatgat 3420
tcctacgatg aaaataaaaa cggcttgctt gttctcgatg agtgcggtac ttggtttaat 3480
acccgttctt ggaatgataa ggaaagacag ccgattattg attggtttct acatgctcgt 3540
aaattaggat gggatattat ttttcttgtt caggacttat ctattgttga taaacaggcg 3600
cgttctgcat tagctgaaca tgttgtttat tgtcgtcgtc tggacagaat tactttacct 3660
tttgtcggta ctttatattc tcttattact ggctcgaaaa tgcctctgcc taaattacat 3720
gttggcgttg ttaaatatgg cgattctcaa ttaagcccta ctgttgagcg ttggctttat 3780
actggtaaga atttgtataa cgcatatgat actaaacagg ctttttctag taattatgat 3840
tccggtgttt attcttattt aacgccttat ttatcacacg gtcggtattt caaaccatta 3900
aatttaggtc agaagatgaa attaactaaa atatatttga aaaagttttc tcgcgttctt 3960
tgtcttgcga ttggatttgc atcagcattt acatatagtt atataaccca acctaagccg 4020
gaggttaaaa aggtagtctc tcagacctat gattttgata aattcactat tgactcttct 4080
cagcgtctta atctaagcta tcgctatgtt ttcaaggatt ctaagggaaa attaattaat 4140
agcgacgatt tacagaagca aggttattca ctcacatata ttgatttatg tactgtttcc 4200
attaaaaaag gtaattcaaa tgaaattgtt aaatgtaatt aattttgttt tcttgatgtt 4260
tgtttcatca tcttcttttg ctcaggtaat tgaaatgaat aattcgcctc tgcgcgattt 4320
tgtaacttgg tattcaaagc aatcaggcga atccgttatt gtttctcccg atgtaaaagg 4380
tactgttact gtatattcat ctgacgttaa acctgaaaat ctacgcaatt tctttatttc 4440
tgttttacgt gctaataatt ttgatatggt tggttcaatt ccttccataa ttcagaagta 4500
taatccaaac aatcaggatt atattgatga attgccatca tctgataatc aggaatatga 4560
tgataattcc gctccttctg gtggtttctt tgttccgcaa aatgataatg ttactcaaac 4620
ttttaaaatt aataacgttc gggcaaagga tttaatacga gttgtcgaat tgtttgtaaa 4680
gtctaatact tctaaatcct caaatgtatt atctattgac ggctctaatc tattagttgt 4740
tagtgcacct aaagatattt tagataacct tcctcaattc ctttctactg ttgatttgcc 4800
aactgaccag atattgattg agggtttgat atttgaggtt cagcaaggtg atgctttaga 4860
tttttcattt gctgctggct ctcagcgtgg cactgttgca ggcggtgtta atactgaccg 4920
cctcacctct gttttatctt ctgctggtgg ttcgttcggt atttttaatg gcgatgtttt 4980
agggctatca gttcgcgcat taaagactaa tagccattca aaaatattgt ctgtgccacg 5040
tattcttacg ctttcaggtc agaagggttc tatctctgtt ggccagaatg tcccttttat 5100
tactggtcgt gtgactggtg aatctgccaa tgtaaataat ccatttcaga cgattgagcg 5160
tcaaaatgta ggtatttcca tgagcgtttt tcctgttgca atggctggcg gtaatattgt 5220
tctggatatt accagcaagg ccgatagttt gagttcttct actcaggcaa gtgatgttat 5280
tactaatcaa agaagtattg ctacaacggt taatttgcgt gatggacaga ctcttttact 5340
cggtggcctc actgattata aaaacacttc tcaagattct ggcgtaccgt tcctgtctaa 5400
aatcccttta atcggcctcc tgtttagctc ccgctctgat tccaacgagg aaagcacgtt 5460
atacgtgctc gtcaaagcaa ccatagtacg cgccctgtag cggcgcatta agcgcggcgg 5520
gtgtggtggt tacgcgcagc gtgaccgcta cacttgccag cgccctagcg cccgctcctt 5580
tcgctttctt cccttccttt ctcgccacgt tcgccggctt tccccgtcaa gctctaaatc 5640
gggggctccc tttagggttc cgatttagtg ctttacggca cctcgacccc aaaaaacttg 5700
atttgggtga tggttcacgt agtgggccat cgccctgata gacggttttt cgccctttga 5760
cgttggagtc cacgttcttt aatagtggac tcttgttcca aactggaaca acactcaacc 5820
ctatctcggg ctattctttt gatttataag ggattttgcc gatttcggcc tattggttaa 5880
aaaatgagct gatttaacaa aaatttaacg cgaattttaa caaaatatta acgtttacaa 5940
tttaaatatt tgcttataca atcttcctgt ttttggggct tttctgatta tcaaccgggg 6000
tacatatgat tgacatgcta gttttacgat taccgttcat cgattctctt gtttgctcca 6060
gactctcagg caatgacctg atagcctttg tagacctctc aaaaatagct accctctccg 6120
gcatgaattt atcagctaga acggttgaat atcatattga tggtgatttg actgtctccg 6180
gcctttctca cccttttgaa tctttaccta cacattactc aggcattgca tttaaaatat 6240
atgagggttc taaaaatttt tatccttgcg ttgaaataaa ggcttctccc gcaaaagtat 6300
tacagggtca taatgttttt ggtacaaccg atttagcttt atgctctgag gctttattgc 6360
ttaattttgc taattctttg ccttgcctgt atgatttatt ggatgtt 6407
<210> 22
<211> 410
<212> PRT
<213> bacteriophage
<400> 22
Met Ile Asp Met Leu Val Leu Arg Leu Pro Phe Ile Asp Ser Leu Val
1 5 10 15
Cys Ser Arg Leu Ser Gly Asn Asp Leu Ile Ala Phe Val Asp Leu Ser
20 25 30
Lys Ile Ala Thr Leu Ser Gly Met Asn Leu Ser Ala Arg Thr Val Glu
35 40 45
Tyr His Ile Asp Gly Asp Leu Thr Val Ser Gly Leu Ser His Pro Phe
50 55 60
Glu Ser Leu Pro Thr His Tyr Ser Gly Ile Ala Phe Lys Ile Tyr Glu
65 70 75 80
Gly Ser Lys Asn Phe Tyr Pro Cys Val Glu Ile Lys Ala Ser Pro Ala
85 90 95
Lys Val Leu Gln Gly His Asn Val Phe Gly Thr Thr Asp Leu Ala Leu
100 105 110
Cys Ser Glu Ala Leu Leu Leu Asn Phe Ala Asn Ser Leu Pro Cys Leu
115 120 125
Tyr Asp Leu Leu Asp Val Asn Ala Thr Thr Ile Ser Arg Ile Asp Ala
130 135 140
Thr Phe Ser Ala Arg Ala Pro Asn Glu Asn Ile Ala Lys Gln Val Ile
145 150 155 160
Asp His Leu Arg Asn Val Ser Asn Gly Gln Thr Lys Ser Thr Arg Ser
165 170 175
Gln Asn Trp Glu Ser Thr Val Thr Trp Asn Glu Thr Ser Arg His Arg
180 185 190
Thr Leu Val Ala Tyr Leu Lys His Val Glu Leu Gln His Gln Ile Gln
195 200 205
Gln Leu Ser Ser Lys Pro Ser Ala Lys Met Thr Ser Tyr Gln Lys Glu
210 215 220
Gln Leu Lys Val Leu Ser Asn Pro Asp Leu Leu Glu Phe Ala Ser Gly
225 230 235 240
Leu Val Arg Phe Glu Ala Arg Ile Lys Thr Arg Tyr Leu Lys Ser Phe
245 250 255
Gly Leu Pro Leu Asn Leu Phe Asp Ala Ile Arg Phe Ala Ser Asp Tyr
260 265 270
Asn Ser Gln Gly Lys Asp Leu Ile Phe Asp Leu Trp Ser Phe Ser Phe
275 280 285
Ser Glu Leu Phe Lys Ala Phe Glu Gly Asp Ser Met Asn Ile Tyr Asp
290 295 300
Asp Ser Ala Val Leu Asp Ala Ile Gln Ser Lys His Phe Thr Ile Thr
305 310 315 320
Pro Ser Gly Lys Thr Ser Phe Ala Lys Ala Ser Arg Tyr Phe Gly Phe
325 330 335
Tyr Arg Arg Leu Val Asn Glu Gly Tyr Asp Ser Val Ala Leu Thr Met
340 345 350
Pro Arg Asn Ser Phe Trp Arg Tyr Val Ser Ala Leu Val Glu Cys Gly
355 360 365
Ile Pro Lys Ser Gln Leu Met Asn Leu Ser Thr Cys Asn Asn Val Val
370 375 380
Pro Leu Val Arg Phe Ile Asn Val Asp Phe Ser Ser Gln Arg Pro Asp
385 390 395 400
Trp Tyr Asn Glu Pro Val Leu Lys Ile Ala
405 410
<210> 23
<211> 111
<212> PRT
<213> bacteriophage
<400> 23
Met Asn Ile Tyr Asp Asp Ser Ala Val Leu Asp Ala Ile Gln Ser Lys
1 5 10 15
His Phe Thr Ile Thr Pro Ser Gly Lys Thr Ser Phe Ala Lys Ala Ser
20 25 30
Arg Tyr Phe Gly Phe Tyr Arg Arg Leu Val Asn Glu Gly Tyr Asp Ser
35 40 45
Val Ala Leu Thr Met Pro Arg Asn Ser Phe Trp Arg Tyr Val Ser Ala
50 55 60
Leu Val Glu Cys Gly Ile Pro Lys Ser Gln Leu Met Asn Leu Ser Thr
65 70 75 80
Cys Asn Asn Val Val Pro Leu Val Arg Phe Ile Asn Val Asp Phe Ser
85 90 95
Ser Gln Arg Pro Asp Trp Tyr Asn Glu Pro Val Leu Lys Ile Ala
100 105 110
<210> 24
<211> 87
<212> PRT
<213> bacteriophage
<400> 24
Met Ile Lys Val Glu Ile Lys Pro Ser Gln Ala Gln Phe Thr Thr Arg
1 5 10 15
Ser Gly Val Ser Arg Gln Gly Lys Pro Tyr Ser Leu Asn Glu Gln Leu
20 25 30
Cys Tyr Val Asp Leu Gly Asn Glu Tyr Pro Val Leu Val Lys Ile Thr
35 40 45
Leu Asp Glu Gly Gln Pro Ala Tyr Ala Pro Gly Leu Tyr Thr Val His
50 55 60
Leu Ser Ser Phe Lys Val Gly Gln Phe Gly Ser Leu Met Ile Asp Arg
65 70 75 80
Leu Arg Leu Val Pro Ala Lys
85
<210> 25
<211> 33
<212> PRT
<213> bacteriophage
<400> 25
Met Glu Gln Val Ala Asp Phe Asp Thr Ile Tyr Gln Ala Met Ile Gln
1 5 10 15
Ile Ser Val Val Leu Cys Phe Ala Leu Gly Ile Ile Ala Gly Gly Gln
20 25 30
Arg
<210> 26
<211> 32
<212> PRT
<213> bacteriophage
<400> 26
Met Ser Val Leu Val Tyr Ser Phe Ala Ser Phe Val Leu Gly Trp Cys
1 5 10 15
Leu Arg Ser Gly Ile Thr Tyr Phe Thr Arg Leu Met Glu Thr Ser Ser
20 25 30
<210> 27
<211> 73
<212> PRT
<213> bacteriophage
<400> 27
Met Lys Lys Ser Leu Val Leu Lys Ala Ser Val Ala Val Ala Thr Leu
1 5 10 15
Val Pro Met Leu Ser Phe Ala Ala Glu Gly Asp Asp Pro Ala Lys Ala
20 25 30
Ala Phe Asn Ser Leu Gln Ala Ser Ala Thr Glu Tyr Ile Gly Tyr Ala
35 40 45
Trp Ala Met Val Val Val Ile Val Gly Ala Thr Ile Gly Ile Lys Leu
50 55 60
Phe Lys Lys Phe Thr Ser Lys Ala Ser
65 70
<210> 28
<211> 424
<212> PRT
<213> bacteriophage
<400> 28
Met Lys Lys Leu Leu Phe Ala Ile Pro Leu Val Val Pro Phe Tyr Ser
1 5 10 15
His Ser Ala Glu Thr Val Glu Ser Cys Leu Ala Lys Pro His Thr Glu
20 25 30
Asn Ser Phe Thr Asn Val Trp Lys Asp Asp Lys Thr Leu Asp Arg Tyr
35 40 45
Ala Asn Tyr Glu Gly Cys Leu Trp Asn Ala Thr Gly Val Val Val Cys
50 55 60
Thr Gly Asp Glu Thr Gln Cys Tyr Gly Thr Trp Val Pro Ile Gly Leu
65 70 75 80
Ala Ile Pro Glu Asn Glu Gly Gly Gly Ser Glu Gly Gly Gly Ser Glu
85 90 95
Gly Gly Gly Ser Glu Gly Gly Gly Thr Lys Pro Pro Glu Tyr Gly Asp
100 105 110
Thr Pro Ile Pro Gly Tyr Thr Tyr Ile Asn Pro Leu Asp Gly Thr Tyr
115 120 125
Pro Pro Gly Thr Glu Gln Asn Pro Ala Asn Pro Asn Pro Ser Leu Glu
130 135 140
Glu Ser Gln Pro Leu Asn Thr Phe Met Phe Gln Asn Asn Arg Phe Arg
145 150 155 160
Asn Arg Gln Gly Ala Leu Thr Val Tyr Thr Gly Thr Val Thr Gln Gly
165 170 175
Thr Asp Pro Val Lys Thr Tyr Tyr Gln Tyr Thr Pro Val Ser Ser Lys
180 185 190
Ala Met Tyr Asp Ala Tyr Trp Asn Gly Lys Phe Arg Asp Cys Ala Phe
195 200 205
His Ser Gly Phe Asn Glu Asp Pro Phe Val Cys Glu Tyr Gln Gly Gln
210 215 220
Ser Ser Asp Leu Pro Gln Pro Pro Val Asn Ala Gly Gly Gly Ser Gly
225 230 235 240
Gly Gly Ser Gly Gly Gly Ser Glu Gly Gly Gly Ser Glu Gly Gly Gly
245 250 255
Ser Glu Gly Gly Gly Ser Glu Gly Gly Gly Ser Gly Gly Gly Ser Gly
260 265 270
Ser Gly Asp Phe Asp Tyr Glu Lys Met Ala Asn Ala Asn Lys Gly Ala
275 280 285
Met Thr Glu Asn Ala Asp Glu Asn Ala Leu Gln Ser Asp Ala Lys Gly
290 295 300
Lys Leu Asp Ser Val Ala Thr Asp Tyr Gly Ala Ala Ile Asp Gly Phe
305 310 315 320
Ile Gly Asp Val Ser Gly Leu Ala Asn Gly Asn Gly Ala Thr Gly Asp
325 330 335
Phe Ala Gly Ser Asn Ser Gln Met Ala Gln Val Gly Asp Gly Asp Asn
340 345 350
Ser Pro Leu Met Asn Asn Phe Arg Gln Tyr Leu Pro Ser Leu Pro Gln
355 360 365
Ser Val Glu Cys Arg Pro Phe Val Phe Ser Ala Gly Lys Pro Tyr Glu
370 375 380
Phe Ser Ile Asp Cys Asp Lys Ile Asn Leu Phe Arg Gly Val Phe Ala
385 390 395 400
Phe Leu Leu Tyr Val Ala Thr Phe Met Tyr Val Phe Ser Thr Phe Ala
405 410 415
Asn Ile Leu Arg Asn Lys Glu Ser
420
<210> 29
<211> 112
<212> PRT
<213> bacteriophage
<400> 29
Met Pro Val Leu Leu Gly Ile Pro Leu Leu Leu Arg Phe Leu Gly Phe
1 5 10 15
Leu Leu Val Thr Leu Phe Gly Tyr Leu Leu Thr Phe Leu Lys Lys Gly
20 25 30
Phe Gly Lys Ile Ala Ile Ala Ile Ser Leu Phe Leu Ala Leu Ile Ile
35 40 45
Gly Leu Asn Ser Ile Leu Val Gly Tyr Leu Ser Asp Ile Ser Ala Gln
50 55 60
Leu Pro Ser Asp Phe Val Gln Gly Val Gln Leu Ile Leu Pro Ser Asn
65 70 75 80
Ala Leu Pro Cys Phe Tyr Val Ile Leu Ser Val Lys Ala Ala Ile Phe
85 90 95
Ile Phe Asp Val Lys Gln Lys Ile Val Ser Tyr Leu Asp Trp Asp Lys
100 105 110
<210> 30
<211> 348
<212> PRT
<213> bacteriophage
<400> 30
Met Ala Val Tyr Phe Val Thr Gly Lys Leu Gly Ser Gly Lys Thr Leu
1 5 10 15
Val Ser Val Gly Lys Ile Gln Asp Lys Ile Val Ala Gly Cys Lys Ile
20 25 30
Ala Thr Asn Leu Asp Leu Arg Leu Gln Asn Leu Pro Gln Val Gly Arg
35 40 45
Phe Ala Lys Thr Pro Arg Val Leu Arg Ile Pro Asp Lys Pro Ser Ile
50 55 60
Ser Asp Leu Leu Ala Ile Gly Arg Gly Asn Asp Ser Tyr Asp Glu Asn
65 70 75 80
Lys Asn Gly Leu Leu Val Leu Asp Glu Cys Gly Thr Trp Phe Asn Thr
85 90 95
Arg Ser Trp Asn Asp Lys Glu Arg Gln Pro Ile Ile Asp Trp Phe Leu
100 105 110
His Ala Arg Lys Leu Gly Trp Asp Ile Ile Phe Leu Val Gln Asp Leu
115 120 125
Ser Ile Val Asp Lys Gln Ala Arg Ser Ala Leu Ala Glu His Val Val
130 135 140
Tyr Cys Arg Arg Leu Asp Arg Ile Thr Leu Pro Phe Val Gly Thr Leu
145 150 155 160
Tyr Ser Leu Ile Thr Gly Ser Lys Met Pro Leu Pro Lys Leu His Val
165 170 175
Gly Val Val Lys Tyr Gly Asp Ser Gln Leu Ser Pro Thr Val Glu Arg
180 185 190
Trp Leu Tyr Thr Gly Lys Asn Leu Tyr Asn Ala Tyr Asp Thr Lys Gln
195 200 205
Ala Phe Ser Ser Asn Tyr Asp Ser Gly Val Tyr Ser Tyr Leu Thr Pro
210 215 220
Tyr Leu Ser His Gly Arg Tyr Phe Lys Pro Leu Asn Leu Gly Gln Lys
225 230 235 240
Met Lys Leu Thr Lys Ile Tyr Leu Lys Lys Phe Ser Arg Val Leu Cys
245 250 255
Leu Ala Ile Gly Phe Ala Ser Ala Phe Thr Tyr Ser Tyr Ile Thr Gln
260 265 270
Pro Lys Pro Glu Val Lys Lys Val Val Ser Gln Thr Tyr Asp Phe Asp
275 280 285
Lys Phe Thr Ile Asp Ser Ser Gln Arg Leu Asn Leu Ser Tyr Arg Tyr
290 295 300
Val Phe Lys Asp Ser Lys Gly Lys Leu Ile Asn Ser Asp Asp Leu Gln
305 310 315 320
Lys Gln Gly Tyr Ser Leu Thr Tyr Ile Asp Leu Cys Thr Val Ser Ile
325 330 335
Lys Lys Gly Asn Ser Asn Glu Ile Val Lys Cys Asn
340 345
<210> 31
<211> 426
<212> PRT
<213> bacteriophage
<400> 31
Met Lys Leu Leu Asn Val Ile Asn Phe Val Phe Leu Met Phe Val Ser
1 5 10 15
Ser Ser Ser Phe Ala Gln Val Ile Glu Met Asn Asn Ser Pro Leu Arg
20 25 30
Asp Phe Val Thr Trp Tyr Ser Lys Gln Ser Gly Glu Ser Val Ile Val
35 40 45
Ser Pro Asp Val Lys Gly Thr Val Thr Val Tyr Ser Ser Asp Val Lys
50 55 60
Pro Glu Asn Leu Arg Asn Phe Phe Ile Ser Val Leu Arg Ala Asn Asn
65 70 75 80
Phe Asp Met Val Gly Ser Ile Pro Ser Ile Ile Gln Lys Tyr Asn Pro
85 90 95
Asn Asn Gln Asp Tyr Ile Asp Glu Leu Pro Ser Ser Asp Asn Gln Glu
100 105 110
Tyr Asp Asp Asn Ser Ala Pro Ser Gly Gly Phe Phe Val Pro Gln Asn
115 120 125
Asp Asn Val Thr Gln Thr Phe Lys Ile Asn Asn Val Arg Ala Lys Asp
130 135 140
Leu Ile Arg Val Val Glu Leu Phe Val Lys Ser Asn Thr Ser Lys Ser
145 150 155 160
Ser Asn Val Leu Ser Ile Asp Gly Ser Asn Leu Leu Val Val Ser Ala
165 170 175
Pro Lys Asp Ile Leu Asp Asn Leu Pro Gln Phe Leu Ser Thr Val Asp
180 185 190
Leu Pro Thr Asp Gln Ile Leu Ile Glu Gly Leu Ile Phe Glu Val Gln
195 200 205
Gln Gly Asp Ala Leu Asp Phe Ser Phe Ala Ala Gly Ser Gln Arg Gly
210 215 220
Thr Val Ala Gly Gly Val Asn Thr Asp Arg Leu Thr Ser Val Leu Ser
225 230 235 240
Ser Ala Gly Gly Ser Phe Gly Ile Phe Asn Gly Asp Val Leu Gly Leu
245 250 255
Ser Val Arg Ala Leu Lys Thr Asn Ser His Ser Lys Ile Leu Ser Val
260 265 270
Pro Arg Ile Leu Thr Leu Ser Gly Gln Lys Gly Ser Ile Ser Val Gly
275 280 285
Gln Asn Val Pro Phe Ile Thr Gly Arg Val Thr Gly Glu Ser Ala Asn
290 295 300
Val Asn Asn Pro Phe Gln Thr Ile Glu Arg Gln Asn Val Gly Ile Ser
305 310 315 320
Met Ser Val Phe Pro Val Ala Met Ala Gly Gly Asn Ile Val Leu Asp
325 330 335
Ile Thr Ser Lys Ala Asp Ser Leu Ser Ser Ser Thr Gln Ala Ser Asp
340 345 350
Val Ile Thr Asn Gln Arg Ser Ile Ala Thr Thr Val Asn Leu Arg Asp
355 360 365
Gly Gln Thr Leu Leu Leu Gly Gly Leu Thr Asp Tyr Lys Asn Thr Ser
370 375 380
Gln Asp Ser Gly Val Pro Phe Leu Ser Lys Ile Pro Leu Ile Gly Leu
385 390 395 400
Leu Phe Ser Ser Arg Ser Asp Ser Asn Glu Glu Ser Thr Leu Tyr Val
405 410 415
Leu Val Lys Ala Thr Ile Val Arg Ala Leu
420 425
<210> 32
<211> 1367
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 32
Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly
1 5 10 15
Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys
20 25 30
Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly
35 40 45
Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys
50 55 60
Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr
65 70 75 80
Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe
85 90 95
Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His
100 105 110
Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His
115 120 125
Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser
130 135 140
Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met
145 150 155 160
Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp
165 170 175
Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn
180 185 190
Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys
195 200 205
Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu
210 215 220
Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu
225 230 235 240
Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp
245 250 255
Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp
260 265 270
Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu
275 280 285
Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile
290 295 300
Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met
305 310 315 320
Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala
325 330 335
Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp
340 345 350
Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln
355 360 365
Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly
370 375 380
Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys
385 390 395 400
Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly
405 410 415
Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu
420 425 430
Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro
435 440 445
Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met
450 455 460
Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val
465 470 475 480
Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn
485 490 495
Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu
500 505 510
Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr
515 520 525
Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys
530 535 540
Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val
545 550 555 560
Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser
565 570 575
Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr
580 585 590
Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn
595 600 605
Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu
610 615 620
Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His
625 630 635 640
Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr
645 650 655
Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys
660 665 670
Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala
675 680 685
Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys
690 695 700
Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His
705 710 715 720
Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile
725 730 735
Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg
740 745 750
His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr
755 760 765
Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu
770 775 780
Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val
785 790 795 800
Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln
805 810 815
Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu
820 825 830
Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys Asp
835 840 845
Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly
850 855 860
Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn
865 870 875 880
Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe
885 890 895
Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys
900 905 910
Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys
915 920 925
His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu
930 935 940
Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys
945 950 955 960
Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu
965 970 975
Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val
980 985 990
Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val
995 1000 1005
Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys
1010 1015 1020
Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr
1025 1030 1035
Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn
1040 1045 1050
Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr
1055 1060 1065
Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg
1070 1075 1080
Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu
1085 1090 1095
Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg
1100 1105 1110
Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys
1115 1120 1125
Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu
1130 1135 1140
Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser
1145 1150 1155
Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe
1160 1165 1170
Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu
1175 1180 1185
Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe
1190 1195 1200
Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu
1205 1210 1215
Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn
1220 1225 1230
Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro
1235 1240 1245
Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His
1250 1255 1260
Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg
1265 1270 1275
Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr
1280 1285 1290
Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile
1295 1300 1305
Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe
1310 1315 1320
Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr
1325 1330 1335
Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly
1340 1345 1350
Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 33
<211> 1367
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 33
Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val Gly
1 5 10 15
Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys
20 25 30
Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly
35 40 45
Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys
50 55 60
Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr
65 70 75 80
Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe
85 90 95
Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His
100 105 110
Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His
115 120 125
Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser
130 135 140
Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met
145 150 155 160
Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp
165 170 175
Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn
180 185 190
Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys
195 200 205
Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu
210 215 220
Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu
225 230 235 240
Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp
245 250 255
Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp
260 265 270
Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu
275 280 285
Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile
290 295 300
Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met
305 310 315 320
Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala
325 330 335
Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp
340 345 350
Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln
355 360 365
Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly
370 375 380
Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys
385 390 395 400
Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly
405 410 415
Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu
420 425 430
Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro
435 440 445
Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met
450 455 460
Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val
465 470 475 480
Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn
485 490 495
Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu
500 505 510
Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr
515 520 525
Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys
530 535 540
Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val
545 550 555 560
Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser
565 570 575
Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr
580 585 590
Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn
595 600 605
Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu
610 615 620
Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His
625 630 635 640
Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr
645 650 655
Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys
660 665 670
Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala
675 680 685
Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys
690 695 700
Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His
705 710 715 720
Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile
725 730 735
Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg
740 745 750
His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr
755 760 765
Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu
770 775 780
Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val
785 790 795 800
Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln
805 810 815
Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu
820 825 830
Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp
835 840 845
Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly
850 855 860
Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn
865 870 875 880
Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe
885 890 895
Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys
900 905 910
Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys
915 920 925
His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu
930 935 940
Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys
945 950 955 960
Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu
965 970 975
Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val
980 985 990
Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val
995 1000 1005
Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys
1010 1015 1020
Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr
1025 1030 1035
Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn
1040 1045 1050
Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr
1055 1060 1065
Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg
1070 1075 1080
Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu
1085 1090 1095
Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg
1100 1105 1110
Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys
1115 1120 1125
Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu
1130 1135 1140
Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser
1145 1150 1155
Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe
1160 1165 1170
Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu
1175 1180 1185
Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe
1190 1195 1200
Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu
1205 1210 1215
Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn
1220 1225 1230
Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro
1235 1240 1245
Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His
1250 1255 1260
Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg
1265 1270 1275
Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr
1280 1285 1290
Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile
1295 1300 1305
Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe
1310 1315 1320
Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr
1325 1330 1335
Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly
1340 1345 1350
Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 34
<211> 1300
<212> PRT
<213> Francisella novicida
<400> 34
Met Ser Ile Tyr Gln Glu Phe Val Asn Lys Tyr Ser Leu Ser Lys Thr
1 5 10 15
Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Glu Asn Ile Lys
20 25 30
Ala Arg Gly Leu Ile Leu Asp Asp Glu Lys Arg Ala Lys Asp Tyr Lys
35 40 45
Lys Ala Lys Gln Ile Ile Asp Lys Tyr His Gln Phe Phe Ile Glu Glu
50 55 60
Ile Leu Ser Ser Val Cys Ile Ser Glu Asp Leu Leu Gln Asn Tyr Ser
65 70 75 80
Asp Val Tyr Phe Lys Leu Lys Lys Ser Asp Asp Asp Asn Leu Gln Lys
85 90 95
Asp Phe Lys Ser Ala Lys Asp Thr Ile Lys Lys Gln Ile Ser Glu Tyr
100 105 110
Ile Lys Asp Ser Glu Lys Phe Lys Asn Leu Phe Asn Gln Asn Leu Ile
115 120 125
Asp Ala Lys Lys Gly Gln Glu Ser Asp Leu Ile Leu Trp Leu Lys Gln
130 135 140
Ser Lys Asp Asn Gly Ile Glu Leu Phe Lys Ala Asn Ser Asp Ile Thr
145 150 155 160
Asp Ile Asp Glu Ala Leu Glu Ile Ile Lys Ser Phe Lys Gly Trp Thr
165 170 175
Thr Tyr Phe Lys Gly Phe His Glu Asn Arg Lys Asn Val Tyr Ser Ser
180 185 190
Asn Asp Ile Pro Thr Ser Ile Ile Tyr Arg Ile Val Asp Asp Asn Leu
195 200 205
Pro Lys Phe Leu Glu Asn Lys Ala Lys Tyr Glu Ser Leu Lys Asp Lys
210 215 220
Ala Pro Glu Ala Ile Asn Tyr Glu Gln Ile Lys Lys Asp Leu Ala Glu
225 230 235 240
Glu Leu Thr Phe Asp Ile Asp Tyr Lys Thr Ser Glu Val Asn Gln Arg
245 250 255
Val Phe Ser Leu Asp Glu Val Phe Glu Ile Ala Asn Phe Asn Asn Tyr
260 265 270
Leu Asn Gln Ser Gly Ile Thr Lys Phe Asn Thr Ile Ile Gly Gly Lys
275 280 285
Phe Val Asn Gly Glu Asn Thr Lys Arg Lys Gly Ile Asn Glu Tyr Ile
290 295 300
Asn Leu Tyr Ser Gln Gln Ile Asn Asp Lys Thr Leu Lys Lys Tyr Lys
305 310 315 320
Met Ser Val Leu Phe Lys Gln Ile Leu Ser Asp Thr Glu Ser Lys Ser
325 330 335
Phe Val Ile Asp Lys Leu Glu Asp Asp Ser Asp Val Val Thr Thr Met
340 345 350
Gln Ser Phe Tyr Glu Gln Ile Ala Ala Phe Lys Thr Val Glu Glu Lys
355 360 365
Ser Ile Lys Glu Thr Leu Ser Leu Leu Phe Asp Asp Leu Lys Ala Gln
370 375 380
Lys Leu Asp Leu Ser Lys Ile Tyr Phe Lys Asn Asp Lys Ser Leu Thr
385 390 395 400
Asp Leu Ser Gln Gln Val Phe Asp Asp Tyr Ser Val Ile Gly Thr Ala
405 410 415
Val Leu Glu Tyr Ile Thr Gln Gln Ile Ala Pro Lys Asn Leu Asp Asn
420 425 430
Pro Ser Lys Lys Glu Gln Glu Leu Ile Ala Lys Lys Thr Glu Lys Ala
435 440 445
Lys Tyr Leu Ser Leu Glu Thr Ile Lys Leu Ala Leu Glu Glu Phe Asn
450 455 460
Lys His Arg Asp Ile Asp Lys Gln Cys Arg Phe Glu Glu Ile Leu Ala
465 470 475 480
Asn Phe Ala Ala Ile Pro Met Ile Phe Asp Glu Ile Ala Gln Asn Lys
485 490 495
Asp Asn Leu Ala Gln Ile Ser Ile Lys Tyr Gln Asn Gln Gly Lys Lys
500 505 510
Asp Leu Leu Gln Ala Ser Ala Glu Asp Asp Val Lys Ala Ile Lys Asp
515 520 525
Leu Leu Asp Gln Thr Asn Asn Leu Leu His Lys Leu Lys Ile Phe His
530 535 540
Ile Ser Gln Ser Glu Asp Lys Ala Asn Ile Leu Asp Lys Asp Glu His
545 550 555 560
Phe Tyr Leu Val Phe Glu Glu Cys Tyr Phe Glu Leu Ala Asn Ile Val
565 570 575
Pro Leu Tyr Asn Lys Ile Arg Asn Tyr Ile Thr Gln Lys Pro Tyr Ser
580 585 590
Asp Glu Lys Phe Lys Leu Asn Phe Glu Asn Ser Thr Leu Ala Asn Gly
595 600 605
Trp Asp Lys Asn Lys Glu Pro Asp Asn Thr Ala Ile Leu Phe Ile Lys
610 615 620
Asp Asp Lys Tyr Tyr Leu Gly Val Met Asn Lys Lys Asn Asn Lys Ile
625 630 635 640
Phe Asp Asp Lys Ala Ile Lys Glu Asn Lys Gly Glu Gly Tyr Lys Lys
645 650 655
Ile Val Tyr Lys Leu Leu Pro Gly Ala Asn Lys Met Leu Pro Lys Val
660 665 670
Phe Phe Ser Ala Lys Ser Ile Lys Phe Tyr Asn Pro Ser Glu Asp Ile
675 680 685
Leu Arg Ile Arg Asn His Ser Thr His Thr Lys Asn Gly Ser Pro Gln
690 695 700
Lys Gly Tyr Glu Lys Phe Glu Phe Asn Ile Glu Asp Cys Arg Lys Phe
705 710 715 720
Ile Asp Phe Tyr Lys Gln Ser Ile Ser Lys His Pro Glu Trp Lys Asp
725 730 735
Phe Gly Phe Arg Phe Ser Asp Thr Gln Arg Tyr Asn Ser Ile Asp Glu
740 745 750
Phe Tyr Arg Glu Val Glu Asn Gln Gly Tyr Lys Leu Thr Phe Glu Asn
755 760 765
Ile Ser Glu Ser Tyr Ile Asp Ser Val Val Asn Gln Gly Lys Leu Tyr
770 775 780
Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ser Ala Tyr Ser Lys Gly Arg
785 790 795 800
Pro Asn Leu His Thr Leu Tyr Trp Lys Ala Leu Phe Asp Glu Arg Asn
805 810 815
Leu Gln Asp Val Val Tyr Lys Leu Asn Gly Glu Ala Glu Leu Phe Tyr
820 825 830
Arg Lys Gln Ser Ile Pro Lys Lys Ile Thr His Pro Ala Lys Glu Ala
835 840 845
Ile Ala Asn Lys Asn Lys Asp Asn Pro Lys Lys Glu Ser Val Phe Glu
850 855 860
Tyr Asp Leu Ile Lys Asp Lys Arg Phe Thr Glu Asp Lys Phe Phe Phe
865 870 875 880
His Cys Pro Ile Thr Ile Asn Phe Lys Ser Ser Gly Ala Asn Lys Phe
885 890 895
Asn Asp Glu Ile Asn Leu Leu Leu Lys Glu Lys Ala Asn Asp Val His
900 905 910
Ile Leu Ser Ile Asp Arg Gly Glu Arg His Leu Ala Tyr Tyr Thr Leu
915 920 925
Val Asp Gly Lys Gly Asn Ile Ile Lys Gln Asp Thr Phe Asn Ile Ile
930 935 940
Gly Asn Asp Arg Met Lys Thr Asn Tyr His Asp Lys Leu Ala Ala Ile
945 950 955 960
Glu Lys Asp Arg Asp Ser Ala Arg Lys Asp Trp Lys Lys Ile Asn Asn
965 970 975
Ile Lys Glu Met Lys Glu Gly Tyr Leu Ser Gln Val Val His Glu Ile
980 985 990
Ala Lys Leu Val Ile Glu Tyr Asn Ala Ile Val Val Phe Glu Asp Leu
995 1000 1005
Asn Phe Gly Phe Lys Arg Gly Arg Phe Lys Val Glu Lys Gln Val
1010 1015 1020
Tyr Gln Lys Leu Glu Lys Met Leu Ile Glu Lys Leu Asn Tyr Leu
1025 1030 1035
Val Phe Lys Asp Asn Glu Phe Asp Lys Thr Gly Gly Val Leu Arg
1040 1045 1050
Ala Tyr Gln Leu Thr Ala Pro Phe Glu Thr Phe Lys Lys Met Gly
1055 1060 1065
Lys Gln Thr Gly Ile Ile Tyr Tyr Val Pro Ala Gly Phe Thr Ser
1070 1075 1080
Lys Ile Cys Pro Val Thr Gly Phe Val Asn Gln Leu Tyr Pro Lys
1085 1090 1095
Tyr Glu Ser Val Ser Lys Ser Gln Glu Phe Phe Ser Lys Phe Asp
1100 1105 1110
Lys Ile Cys Tyr Asn Leu Asp Lys Gly Tyr Phe Glu Phe Ser Phe
1115 1120 1125
Asp Tyr Lys Asn Phe Gly Asp Lys Ala Ala Lys Gly Lys Trp Thr
1130 1135 1140
Ile Ala Ser Phe Gly Ser Arg Leu Ile Asn Phe Arg Asn Ser Asp
1145 1150 1155
Lys Asn His Asn Trp Asp Thr Arg Glu Val Tyr Pro Thr Lys Glu
1160 1165 1170
Leu Glu Lys Leu Leu Lys Asp Tyr Ser Ile Glu Tyr Gly His Gly
1175 1180 1185
Glu Cys Ile Lys Ala Ala Ile Cys Gly Glu Ser Asp Lys Lys Phe
1190 1195 1200
Phe Ala Lys Leu Thr Ser Val Leu Asn Thr Ile Leu Gln Met Arg
1205 1210 1215
Asn Ser Lys Thr Gly Thr Glu Leu Asp Tyr Leu Ile Ser Pro Val
1220 1225 1230
Ala Asp Val Asn Gly Asn Phe Phe Asp Ser Arg Gln Ala Pro Lys
1235 1240 1245
Asn Met Pro Gln Asp Ala Asp Ala Asn Gly Ala Tyr His Ile Gly
1250 1255 1260
Leu Lys Gly Leu Met Leu Leu Gly Arg Ile Lys Asn Asn Gln Glu
1265 1270 1275
Gly Lys Lys Leu Asn Leu Val Ile Lys Asn Glu Glu Tyr Phe Glu
1280 1285 1290
Phe Val Gln Asn Arg Asn Asn
1295 1300
<210> 35
<211> 1300
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 35
Met Ser Ile Tyr Gln Glu Phe Val Asn Lys Tyr Ser Leu Ser Lys Thr
1 5 10 15
Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Glu Asn Ile Lys
20 25 30
Ala Arg Gly Leu Ile Leu Asp Asp Glu Lys Arg Ala Lys Asp Tyr Lys
35 40 45
Lys Ala Lys Gln Ile Ile Asp Lys Tyr His Gln Phe Phe Ile Glu Glu
50 55 60
Ile Leu Ser Ser Val Cys Ile Ser Glu Asp Leu Leu Gln Asn Tyr Ser
65 70 75 80
Asp Val Tyr Phe Lys Leu Lys Lys Ser Asp Asp Asp Asn Leu Gln Lys
85 90 95
Asp Phe Lys Ser Ala Lys Asp Thr Ile Lys Lys Gln Ile Ser Glu Tyr
100 105 110
Ile Lys Asp Ser Glu Lys Phe Lys Asn Leu Phe Asn Gln Asn Leu Ile
115 120 125
Asp Ala Lys Lys Gly Gln Glu Ser Asp Leu Ile Leu Trp Leu Lys Gln
130 135 140
Ser Lys Asp Asn Gly Ile Glu Leu Phe Lys Ala Asn Ser Asp Ile Thr
145 150 155 160
Asp Ile Asp Glu Ala Leu Glu Ile Ile Lys Ser Phe Lys Gly Trp Thr
165 170 175
Thr Tyr Phe Lys Gly Phe His Glu Asn Arg Lys Asn Val Tyr Ser Ser
180 185 190
Asn Asp Ile Pro Thr Ser Ile Ile Tyr Arg Ile Val Asp Asp Asn Leu
195 200 205
Pro Lys Phe Leu Glu Asn Lys Ala Lys Tyr Glu Ser Leu Lys Asp Lys
210 215 220
Ala Pro Glu Ala Ile Asn Tyr Glu Gln Ile Lys Lys Asp Leu Ala Glu
225 230 235 240
Glu Leu Thr Phe Asp Ile Asp Tyr Lys Thr Ser Glu Val Asn Gln Arg
245 250 255
Val Phe Ser Leu Asp Glu Val Phe Glu Ile Ala Asn Phe Asn Asn Tyr
260 265 270
Leu Asn Gln Ser Gly Ile Thr Lys Phe Asn Thr Ile Ile Gly Gly Lys
275 280 285
Phe Val Asn Gly Glu Asn Thr Lys Arg Lys Gly Ile Asn Glu Tyr Ile
290 295 300
Asn Leu Tyr Ser Gln Gln Ile Asn Asp Lys Thr Leu Lys Lys Tyr Lys
305 310 315 320
Met Ser Val Leu Phe Lys Gln Ile Leu Ser Asp Thr Glu Ser Lys Ser
325 330 335
Phe Val Ile Asp Lys Leu Glu Asp Asp Ser Asp Val Val Thr Thr Met
340 345 350
Gln Ser Phe Tyr Glu Gln Ile Ala Ala Phe Lys Thr Val Glu Glu Lys
355 360 365
Ser Ile Lys Glu Thr Leu Ser Leu Leu Phe Asp Asp Leu Lys Ala Gln
370 375 380
Lys Leu Asp Leu Ser Lys Ile Tyr Phe Lys Asn Asp Lys Ser Leu Thr
385 390 395 400
Asp Leu Ser Gln Gln Val Phe Asp Asp Tyr Ser Val Ile Gly Thr Ala
405 410 415
Val Leu Glu Tyr Ile Thr Gln Gln Ile Ala Pro Lys Asn Leu Asp Asn
420 425 430
Pro Ser Lys Lys Glu Gln Glu Leu Ile Ala Lys Lys Thr Glu Lys Ala
435 440 445
Lys Tyr Leu Ser Leu Glu Thr Ile Lys Leu Ala Leu Glu Glu Phe Asn
450 455 460
Lys His Arg Asp Ile Asp Lys Gln Cys Arg Phe Glu Glu Ile Leu Ala
465 470 475 480
Asn Phe Ala Ala Ile Pro Met Ile Phe Asp Glu Ile Ala Gln Asn Lys
485 490 495
Asp Asn Leu Ala Gln Ile Ser Ile Lys Tyr Gln Asn Gln Gly Lys Lys
500 505 510
Asp Leu Leu Gln Ala Ser Ala Glu Asp Asp Val Lys Ala Ile Lys Asp
515 520 525
Leu Leu Asp Gln Thr Asn Asn Leu Leu His Lys Leu Lys Ile Phe His
530 535 540
Ile Ser Gln Ser Glu Asp Lys Ala Asn Ile Leu Asp Lys Asp Glu His
545 550 555 560
Phe Tyr Leu Val Phe Glu Glu Cys Tyr Phe Glu Leu Ala Asn Ile Val
565 570 575
Pro Leu Tyr Asn Lys Ile Arg Asn Tyr Ile Thr Gln Lys Pro Tyr Ser
580 585 590
Asp Glu Lys Phe Lys Leu Asn Phe Glu Asn Ser Thr Leu Ala Asn Gly
595 600 605
Trp Asp Lys Asn Lys Glu Pro Asp Asn Thr Ala Ile Leu Phe Ile Lys
610 615 620
Asp Asp Lys Tyr Tyr Leu Gly Val Met Asn Lys Lys Asn Asn Lys Ile
625 630 635 640
Phe Asp Asp Lys Ala Ile Lys Glu Asn Lys Gly Glu Gly Tyr Lys Lys
645 650 655
Ile Val Tyr Lys Leu Leu Pro Gly Ala Asn Lys Met Leu Pro Lys Val
660 665 670
Phe Phe Ser Ala Lys Ser Ile Lys Phe Tyr Asn Pro Ser Glu Asp Ile
675 680 685
Leu Arg Ile Arg Asn His Ser Thr His Thr Lys Asn Gly Ser Pro Gln
690 695 700
Lys Gly Tyr Glu Lys Phe Glu Phe Asn Ile Glu Asp Cys Arg Lys Phe
705 710 715 720
Ile Asp Phe Tyr Lys Gln Ser Ile Ser Lys His Pro Glu Trp Lys Asp
725 730 735
Phe Gly Phe Arg Phe Ser Asp Thr Gln Arg Tyr Asn Ser Ile Asp Glu
740 745 750
Phe Tyr Arg Glu Val Glu Asn Gln Gly Tyr Lys Leu Thr Phe Glu Asn
755 760 765
Ile Ser Glu Ser Tyr Ile Asp Ser Val Val Asn Gln Gly Lys Leu Tyr
770 775 780
Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ser Ala Tyr Ser Lys Gly Arg
785 790 795 800
Pro Asn Leu His Thr Leu Tyr Trp Lys Ala Leu Phe Asp Glu Arg Asn
805 810 815
Leu Gln Asp Val Val Tyr Lys Leu Asn Gly Glu Ala Glu Leu Phe Tyr
820 825 830
Arg Lys Gln Ser Ile Pro Lys Lys Ile Thr His Pro Ala Lys Glu Ala
835 840 845
Ile Ala Asn Lys Asn Lys Asp Asn Pro Lys Lys Glu Ser Val Phe Glu
850 855 860
Tyr Asp Leu Ile Lys Asp Lys Arg Phe Thr Glu Asp Lys Phe Phe Phe
865 870 875 880
His Cys Pro Ile Thr Ile Asn Phe Lys Ser Ser Gly Ala Asn Lys Phe
885 890 895
Asn Asp Glu Ile Asn Leu Leu Leu Lys Glu Lys Ala Asn Asp Val His
900 905 910
Ile Leu Ser Ile Ala Arg Gly Glu Arg His Leu Ala Tyr Tyr Thr Leu
915 920 925
Val Asp Gly Lys Gly Asn Ile Ile Lys Gln Asp Thr Phe Asn Ile Ile
930 935 940
Gly Asn Asp Arg Met Lys Thr Asn Tyr His Asp Lys Leu Ala Ala Ile
945 950 955 960
Glu Lys Asp Arg Asp Ser Ala Arg Lys Asp Trp Lys Lys Ile Asn Asn
965 970 975
Ile Lys Glu Met Lys Glu Gly Tyr Leu Ser Gln Val Val His Glu Ile
980 985 990
Ala Lys Leu Val Ile Glu Tyr Asn Ala Ile Val Val Phe Glu Asp Leu
995 1000 1005
Asn Phe Gly Phe Lys Arg Gly Arg Phe Lys Val Glu Lys Gln Val
1010 1015 1020
Tyr Gln Lys Leu Glu Lys Met Leu Ile Glu Lys Leu Asn Tyr Leu
1025 1030 1035
Val Phe Lys Asp Asn Glu Phe Asp Lys Thr Gly Gly Val Leu Arg
1040 1045 1050
Ala Tyr Gln Leu Thr Ala Pro Phe Glu Thr Phe Lys Lys Met Gly
1055 1060 1065
Lys Gln Thr Gly Ile Ile Tyr Tyr Val Pro Ala Gly Phe Thr Ser
1070 1075 1080
Lys Ile Cys Pro Val Thr Gly Phe Val Asn Gln Leu Tyr Pro Lys
1085 1090 1095
Tyr Glu Ser Val Ser Lys Ser Gln Glu Phe Phe Ser Lys Phe Asp
1100 1105 1110
Lys Ile Cys Tyr Asn Leu Asp Lys Gly Tyr Phe Glu Phe Ser Phe
1115 1120 1125
Asp Tyr Lys Asn Phe Gly Asp Lys Ala Ala Lys Gly Lys Trp Thr
1130 1135 1140
Ile Ala Ser Phe Gly Ser Arg Leu Ile Asn Phe Arg Asn Ser Asp
1145 1150 1155
Lys Asn His Asn Trp Asp Thr Arg Glu Val Tyr Pro Thr Lys Glu
1160 1165 1170
Leu Glu Lys Leu Leu Lys Asp Tyr Ser Ile Glu Tyr Gly His Gly
1175 1180 1185
Glu Cys Ile Lys Ala Ala Ile Cys Gly Glu Ser Asp Lys Lys Phe
1190 1195 1200
Phe Ala Lys Leu Thr Ser Val Leu Asn Thr Ile Leu Gln Met Arg
1205 1210 1215
Asn Ser Lys Thr Gly Thr Glu Leu Asp Tyr Leu Ile Ser Pro Val
1220 1225 1230
Ala Asp Val Asn Gly Asn Phe Phe Asp Ser Arg Gln Ala Pro Lys
1235 1240 1245
Asn Met Pro Gln Asp Ala Asp Ala Asn Gly Ala Tyr His Ile Gly
1250 1255 1260
Leu Lys Gly Leu Met Leu Leu Gly Arg Ile Lys Asn Asn Gln Glu
1265 1270 1275
Gly Lys Lys Leu Asn Leu Val Ile Lys Asn Glu Glu Tyr Phe Glu
1280 1285 1290
Phe Val Gln Asn Arg Asn Asn
1295 1300
<210> 36
<211> 1300
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 36
Met Ser Ile Tyr Gln Glu Phe Val Asn Lys Tyr Ser Leu Ser Lys Thr
1 5 10 15
Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Glu Asn Ile Lys
20 25 30
Ala Arg Gly Leu Ile Leu Asp Asp Glu Lys Arg Ala Lys Asp Tyr Lys
35 40 45
Lys Ala Lys Gln Ile Ile Asp Lys Tyr His Gln Phe Phe Ile Glu Glu
50 55 60
Ile Leu Ser Ser Val Cys Ile Ser Glu Asp Leu Leu Gln Asn Tyr Ser
65 70 75 80
Asp Val Tyr Phe Lys Leu Lys Lys Ser Asp Asp Asp Asn Leu Gln Lys
85 90 95
Asp Phe Lys Ser Ala Lys Asp Thr Ile Lys Lys Gln Ile Ser Glu Tyr
100 105 110
Ile Lys Asp Ser Glu Lys Phe Lys Asn Leu Phe Asn Gln Asn Leu Ile
115 120 125
Asp Ala Lys Lys Gly Gln Glu Ser Asp Leu Ile Leu Trp Leu Lys Gln
130 135 140
Ser Lys Asp Asn Gly Ile Glu Leu Phe Lys Ala Asn Ser Asp Ile Thr
145 150 155 160
Asp Ile Asp Glu Ala Leu Glu Ile Ile Lys Ser Phe Lys Gly Trp Thr
165 170 175
Thr Tyr Phe Lys Gly Phe His Glu Asn Arg Lys Asn Val Tyr Ser Ser
180 185 190
Asn Asp Ile Pro Thr Ser Ile Ile Tyr Arg Ile Val Asp Asp Asn Leu
195 200 205
Pro Lys Phe Leu Glu Asn Lys Ala Lys Tyr Glu Ser Leu Lys Asp Lys
210 215 220
Ala Pro Glu Ala Ile Asn Tyr Glu Gln Ile Lys Lys Asp Leu Ala Glu
225 230 235 240
Glu Leu Thr Phe Asp Ile Asp Tyr Lys Thr Ser Glu Val Asn Gln Arg
245 250 255
Val Phe Ser Leu Asp Glu Val Phe Glu Ile Ala Asn Phe Asn Asn Tyr
260 265 270
Leu Asn Gln Ser Gly Ile Thr Lys Phe Asn Thr Ile Ile Gly Gly Lys
275 280 285
Phe Val Asn Gly Glu Asn Thr Lys Arg Lys Gly Ile Asn Glu Tyr Ile
290 295 300
Asn Leu Tyr Ser Gln Gln Ile Asn Asp Lys Thr Leu Lys Lys Tyr Lys
305 310 315 320
Met Ser Val Leu Phe Lys Gln Ile Leu Ser Asp Thr Glu Ser Lys Ser
325 330 335
Phe Val Ile Asp Lys Leu Glu Asp Asp Ser Asp Val Val Thr Thr Met
340 345 350
Gln Ser Phe Tyr Glu Gln Ile Ala Ala Phe Lys Thr Val Glu Glu Lys
355 360 365
Ser Ile Lys Glu Thr Leu Ser Leu Leu Phe Asp Asp Leu Lys Ala Gln
370 375 380
Lys Leu Asp Leu Ser Lys Ile Tyr Phe Lys Asn Asp Lys Ser Leu Thr
385 390 395 400
Asp Leu Ser Gln Gln Val Phe Asp Asp Tyr Ser Val Ile Gly Thr Ala
405 410 415
Val Leu Glu Tyr Ile Thr Gln Gln Ile Ala Pro Lys Asn Leu Asp Asn
420 425 430
Pro Ser Lys Lys Glu Gln Glu Leu Ile Ala Lys Lys Thr Glu Lys Ala
435 440 445
Lys Tyr Leu Ser Leu Glu Thr Ile Lys Leu Ala Leu Glu Glu Phe Asn
450 455 460
Lys His Arg Asp Ile Asp Lys Gln Cys Arg Phe Glu Glu Ile Leu Ala
465 470 475 480
Asn Phe Ala Ala Ile Pro Met Ile Phe Asp Glu Ile Ala Gln Asn Lys
485 490 495
Asp Asn Leu Ala Gln Ile Ser Ile Lys Tyr Gln Asn Gln Gly Lys Lys
500 505 510
Asp Leu Leu Gln Ala Ser Ala Glu Asp Asp Val Lys Ala Ile Lys Asp
515 520 525
Leu Leu Asp Gln Thr Asn Asn Leu Leu His Lys Leu Lys Ile Phe His
530 535 540
Ile Ser Gln Ser Glu Asp Lys Ala Asn Ile Leu Asp Lys Asp Glu His
545 550 555 560
Phe Tyr Leu Val Phe Glu Glu Cys Tyr Phe Glu Leu Ala Asn Ile Val
565 570 575
Pro Leu Tyr Asn Lys Ile Arg Asn Tyr Ile Thr Gln Lys Pro Tyr Ser
580 585 590
Asp Glu Lys Phe Lys Leu Asn Phe Glu Asn Ser Thr Leu Ala Asn Gly
595 600 605
Trp Asp Lys Asn Lys Glu Pro Asp Asn Thr Ala Ile Leu Phe Ile Lys
610 615 620
Asp Asp Lys Tyr Tyr Leu Gly Val Met Asn Lys Lys Asn Asn Lys Ile
625 630 635 640
Phe Asp Asp Lys Ala Ile Lys Glu Asn Lys Gly Glu Gly Tyr Lys Lys
645 650 655
Ile Val Tyr Lys Leu Leu Pro Gly Ala Asn Lys Met Leu Pro Lys Val
660 665 670
Phe Phe Ser Ala Lys Ser Ile Lys Phe Tyr Asn Pro Ser Glu Asp Ile
675 680 685
Leu Arg Ile Arg Asn His Ser Thr His Thr Lys Asn Gly Ser Pro Gln
690 695 700
Lys Gly Tyr Glu Lys Phe Glu Phe Asn Ile Glu Asp Cys Arg Lys Phe
705 710 715 720
Ile Asp Phe Tyr Lys Gln Ser Ile Ser Lys His Pro Glu Trp Lys Asp
725 730 735
Phe Gly Phe Arg Phe Ser Asp Thr Gln Arg Tyr Asn Ser Ile Asp Glu
740 745 750
Phe Tyr Arg Glu Val Glu Asn Gln Gly Tyr Lys Leu Thr Phe Glu Asn
755 760 765
Ile Ser Glu Ser Tyr Ile Asp Ser Val Val Asn Gln Gly Lys Leu Tyr
770 775 780
Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ser Ala Tyr Ser Lys Gly Arg
785 790 795 800
Pro Asn Leu His Thr Leu Tyr Trp Lys Ala Leu Phe Asp Glu Arg Asn
805 810 815
Leu Gln Asp Val Val Tyr Lys Leu Asn Gly Glu Ala Glu Leu Phe Tyr
820 825 830
Arg Lys Gln Ser Ile Pro Lys Lys Ile Thr His Pro Ala Lys Glu Ala
835 840 845
Ile Ala Asn Lys Asn Lys Asp Asn Pro Lys Lys Glu Ser Val Phe Glu
850 855 860
Tyr Asp Leu Ile Lys Asp Lys Arg Phe Thr Glu Asp Lys Phe Phe Phe
865 870 875 880
His Cys Pro Ile Thr Ile Asn Phe Lys Ser Ser Gly Ala Asn Lys Phe
885 890 895
Asn Asp Glu Ile Asn Leu Leu Leu Lys Glu Lys Ala Asn Asp Val His
900 905 910
Ile Leu Ser Ile Asp Arg Gly Glu Arg His Leu Ala Tyr Tyr Thr Leu
915 920 925
Val Asp Gly Lys Gly Asn Ile Ile Lys Gln Asp Thr Phe Asn Ile Ile
930 935 940
Gly Asn Asp Arg Met Lys Thr Asn Tyr His Asp Lys Leu Ala Ala Ile
945 950 955 960
Glu Lys Asp Arg Asp Ser Ala Arg Lys Asp Trp Lys Lys Ile Asn Asn
965 970 975
Ile Lys Glu Met Lys Glu Gly Tyr Leu Ser Gln Val Val His Glu Ile
980 985 990
Ala Lys Leu Val Ile Glu Tyr Asn Ala Ile Val Val Phe Ala Asp Leu
995 1000 1005
Asn Phe Gly Phe Lys Arg Gly Arg Phe Lys Val Glu Lys Gln Val
1010 1015 1020
Tyr Gln Lys Leu Glu Lys Met Leu Ile Glu Lys Leu Asn Tyr Leu
1025 1030 1035
Val Phe Lys Asp Asn Glu Phe Asp Lys Thr Gly Gly Val Leu Arg
1040 1045 1050
Ala Tyr Gln Leu Thr Ala Pro Phe Glu Thr Phe Lys Lys Met Gly
1055 1060 1065
Lys Gln Thr Gly Ile Ile Tyr Tyr Val Pro Ala Gly Phe Thr Ser
1070 1075 1080
Lys Ile Cys Pro Val Thr Gly Phe Val Asn Gln Leu Tyr Pro Lys
1085 1090 1095
Tyr Glu Ser Val Ser Lys Ser Gln Glu Phe Phe Ser Lys Phe Asp
1100 1105 1110
Lys Ile Cys Tyr Asn Leu Asp Lys Gly Tyr Phe Glu Phe Ser Phe
1115 1120 1125
Asp Tyr Lys Asn Phe Gly Asp Lys Ala Ala Lys Gly Lys Trp Thr
1130 1135 1140
Ile Ala Ser Phe Gly Ser Arg Leu Ile Asn Phe Arg Asn Ser Asp
1145 1150 1155
Lys Asn His Asn Trp Asp Thr Arg Glu Val Tyr Pro Thr Lys Glu
1160 1165 1170
Leu Glu Lys Leu Leu Lys Asp Tyr Ser Ile Glu Tyr Gly His Gly
1175 1180 1185
Glu Cys Ile Lys Ala Ala Ile Cys Gly Glu Ser Asp Lys Lys Phe
1190 1195 1200
Phe Ala Lys Leu Thr Ser Val Leu Asn Thr Ile Leu Gln Met Arg
1205 1210 1215
Asn Ser Lys Thr Gly Thr Glu Leu Asp Tyr Leu Ile Ser Pro Val
1220 1225 1230
Ala Asp Val Asn Gly Asn Phe Phe Asp Ser Arg Gln Ala Pro Lys
1235 1240 1245
Asn Met Pro Gln Asp Ala Asp Ala Asn Gly Ala Tyr His Ile Gly
1250 1255 1260
Leu Lys Gly Leu Met Leu Leu Gly Arg Ile Lys Asn Asn Gln Glu
1265 1270 1275
Gly Lys Lys Leu Asn Leu Val Ile Lys Asn Glu Glu Tyr Phe Glu
1280 1285 1290
Phe Val Gln Asn Arg Asn Asn
1295 1300
<210> 37
<211> 1300
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 37
Met Ser Ile Tyr Gln Glu Phe Val Asn Lys Tyr Ser Leu Ser Lys Thr
1 5 10 15
Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Glu Asn Ile Lys
20 25 30
Ala Arg Gly Leu Ile Leu Asp Asp Glu Lys Arg Ala Lys Asp Tyr Lys
35 40 45
Lys Ala Lys Gln Ile Ile Asp Lys Tyr His Gln Phe Phe Ile Glu Glu
50 55 60
Ile Leu Ser Ser Val Cys Ile Ser Glu Asp Leu Leu Gln Asn Tyr Ser
65 70 75 80
Asp Val Tyr Phe Lys Leu Lys Lys Ser Asp Asp Asp Asn Leu Gln Lys
85 90 95
Asp Phe Lys Ser Ala Lys Asp Thr Ile Lys Lys Gln Ile Ser Glu Tyr
100 105 110
Ile Lys Asp Ser Glu Lys Phe Lys Asn Leu Phe Asn Gln Asn Leu Ile
115 120 125
Asp Ala Lys Lys Gly Gln Glu Ser Asp Leu Ile Leu Trp Leu Lys Gln
130 135 140
Ser Lys Asp Asn Gly Ile Glu Leu Phe Lys Ala Asn Ser Asp Ile Thr
145 150 155 160
Asp Ile Asp Glu Ala Leu Glu Ile Ile Lys Ser Phe Lys Gly Trp Thr
165 170 175
Thr Tyr Phe Lys Gly Phe His Glu Asn Arg Lys Asn Val Tyr Ser Ser
180 185 190
Asn Asp Ile Pro Thr Ser Ile Ile Tyr Arg Ile Val Asp Asp Asn Leu
195 200 205
Pro Lys Phe Leu Glu Asn Lys Ala Lys Tyr Glu Ser Leu Lys Asp Lys
210 215 220
Ala Pro Glu Ala Ile Asn Tyr Glu Gln Ile Lys Lys Asp Leu Ala Glu
225 230 235 240
Glu Leu Thr Phe Asp Ile Asp Tyr Lys Thr Ser Glu Val Asn Gln Arg
245 250 255
Val Phe Ser Leu Asp Glu Val Phe Glu Ile Ala Asn Phe Asn Asn Tyr
260 265 270
Leu Asn Gln Ser Gly Ile Thr Lys Phe Asn Thr Ile Ile Gly Gly Lys
275 280 285
Phe Val Asn Gly Glu Asn Thr Lys Arg Lys Gly Ile Asn Glu Tyr Ile
290 295 300
Asn Leu Tyr Ser Gln Gln Ile Asn Asp Lys Thr Leu Lys Lys Tyr Lys
305 310 315 320
Met Ser Val Leu Phe Lys Gln Ile Leu Ser Asp Thr Glu Ser Lys Ser
325 330 335
Phe Val Ile Asp Lys Leu Glu Asp Asp Ser Asp Val Val Thr Thr Met
340 345 350
Gln Ser Phe Tyr Glu Gln Ile Ala Ala Phe Lys Thr Val Glu Glu Lys
355 360 365
Ser Ile Lys Glu Thr Leu Ser Leu Leu Phe Asp Asp Leu Lys Ala Gln
370 375 380
Lys Leu Asp Leu Ser Lys Ile Tyr Phe Lys Asn Asp Lys Ser Leu Thr
385 390 395 400
Asp Leu Ser Gln Gln Val Phe Asp Asp Tyr Ser Val Ile Gly Thr Ala
405 410 415
Val Leu Glu Tyr Ile Thr Gln Gln Ile Ala Pro Lys Asn Leu Asp Asn
420 425 430
Pro Ser Lys Lys Glu Gln Glu Leu Ile Ala Lys Lys Thr Glu Lys Ala
435 440 445
Lys Tyr Leu Ser Leu Glu Thr Ile Lys Leu Ala Leu Glu Glu Phe Asn
450 455 460
Lys His Arg Asp Ile Asp Lys Gln Cys Arg Phe Glu Glu Ile Leu Ala
465 470 475 480
Asn Phe Ala Ala Ile Pro Met Ile Phe Asp Glu Ile Ala Gln Asn Lys
485 490 495
Asp Asn Leu Ala Gln Ile Ser Ile Lys Tyr Gln Asn Gln Gly Lys Lys
500 505 510
Asp Leu Leu Gln Ala Ser Ala Glu Asp Asp Val Lys Ala Ile Lys Asp
515 520 525
Leu Leu Asp Gln Thr Asn Asn Leu Leu His Lys Leu Lys Ile Phe His
530 535 540
Ile Ser Gln Ser Glu Asp Lys Ala Asn Ile Leu Asp Lys Asp Glu His
545 550 555 560
Phe Tyr Leu Val Phe Glu Glu Cys Tyr Phe Glu Leu Ala Asn Ile Val
565 570 575
Pro Leu Tyr Asn Lys Ile Arg Asn Tyr Ile Thr Gln Lys Pro Tyr Ser
580 585 590
Asp Glu Lys Phe Lys Leu Asn Phe Glu Asn Ser Thr Leu Ala Asn Gly
595 600 605
Trp Asp Lys Asn Lys Glu Pro Asp Asn Thr Ala Ile Leu Phe Ile Lys
610 615 620
Asp Asp Lys Tyr Tyr Leu Gly Val Met Asn Lys Lys Asn Asn Lys Ile
625 630 635 640
Phe Asp Asp Lys Ala Ile Lys Glu Asn Lys Gly Glu Gly Tyr Lys Lys
645 650 655
Ile Val Tyr Lys Leu Leu Pro Gly Ala Asn Lys Met Leu Pro Lys Val
660 665 670
Phe Phe Ser Ala Lys Ser Ile Lys Phe Tyr Asn Pro Ser Glu Asp Ile
675 680 685
Leu Arg Ile Arg Asn His Ser Thr His Thr Lys Asn Gly Ser Pro Gln
690 695 700
Lys Gly Tyr Glu Lys Phe Glu Phe Asn Ile Glu Asp Cys Arg Lys Phe
705 710 715 720
Ile Asp Phe Tyr Lys Gln Ser Ile Ser Lys His Pro Glu Trp Lys Asp
725 730 735
Phe Gly Phe Arg Phe Ser Asp Thr Gln Arg Tyr Asn Ser Ile Asp Glu
740 745 750
Phe Tyr Arg Glu Val Glu Asn Gln Gly Tyr Lys Leu Thr Phe Glu Asn
755 760 765
Ile Ser Glu Ser Tyr Ile Asp Ser Val Val Asn Gln Gly Lys Leu Tyr
770 775 780
Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ser Ala Tyr Ser Lys Gly Arg
785 790 795 800
Pro Asn Leu His Thr Leu Tyr Trp Lys Ala Leu Phe Asp Glu Arg Asn
805 810 815
Leu Gln Asp Val Val Tyr Lys Leu Asn Gly Glu Ala Glu Leu Phe Tyr
820 825 830
Arg Lys Gln Ser Ile Pro Lys Lys Ile Thr His Pro Ala Lys Glu Ala
835 840 845
Ile Ala Asn Lys Asn Lys Asp Asn Pro Lys Lys Glu Ser Val Phe Glu
850 855 860
Tyr Asp Leu Ile Lys Asp Lys Arg Phe Thr Glu Asp Lys Phe Phe Phe
865 870 875 880
His Cys Pro Ile Thr Ile Asn Phe Lys Ser Ser Gly Ala Asn Lys Phe
885 890 895
Asn Asp Glu Ile Asn Leu Leu Leu Lys Glu Lys Ala Asn Asp Val His
900 905 910
Ile Leu Ser Ile Asp Arg Gly Glu Arg His Leu Ala Tyr Tyr Thr Leu
915 920 925
Val Asp Gly Lys Gly Asn Ile Ile Lys Gln Asp Thr Phe Asn Ile Ile
930 935 940
Gly Asn Asp Arg Met Lys Thr Asn Tyr His Asp Lys Leu Ala Ala Ile
945 950 955 960
Glu Lys Asp Arg Asp Ser Ala Arg Lys Asp Trp Lys Lys Ile Asn Asn
965 970 975
Ile Lys Glu Met Lys Glu Gly Tyr Leu Ser Gln Val Val His Glu Ile
980 985 990
Ala Lys Leu Val Ile Glu Tyr Asn Ala Ile Val Val Phe Glu Asp Leu
995 1000 1005
Asn Phe Gly Phe Lys Arg Gly Arg Phe Lys Val Glu Lys Gln Val
1010 1015 1020
Tyr Gln Lys Leu Glu Lys Met Leu Ile Glu Lys Leu Asn Tyr Leu
1025 1030 1035
Val Phe Lys Asp Asn Glu Phe Asp Lys Thr Gly Gly Val Leu Arg
1040 1045 1050
Ala Tyr Gln Leu Thr Ala Pro Phe Glu Thr Phe Lys Lys Met Gly
1055 1060 1065
Lys Gln Thr Gly Ile Ile Tyr Tyr Val Pro Ala Gly Phe Thr Ser
1070 1075 1080
Lys Ile Cys Pro Val Thr Gly Phe Val Asn Gln Leu Tyr Pro Lys
1085 1090 1095
Tyr Glu Ser Val Ser Lys Ser Gln Glu Phe Phe Ser Lys Phe Asp
1100 1105 1110
Lys Ile Cys Tyr Asn Leu Asp Lys Gly Tyr Phe Glu Phe Ser Phe
1115 1120 1125
Asp Tyr Lys Asn Phe Gly Asp Lys Ala Ala Lys Gly Lys Trp Thr
1130 1135 1140
Ile Ala Ser Phe Gly Ser Arg Leu Ile Asn Phe Arg Asn Ser Asp
1145 1150 1155
Lys Asn His Asn Trp Asp Thr Arg Glu Val Tyr Pro Thr Lys Glu
1160 1165 1170
Leu Glu Lys Leu Leu Lys Asp Tyr Ser Ile Glu Tyr Gly His Gly
1175 1180 1185
Glu Cys Ile Lys Ala Ala Ile Cys Gly Glu Ser Asp Lys Lys Phe
1190 1195 1200
Phe Ala Lys Leu Thr Ser Val Leu Asn Thr Ile Leu Gln Met Arg
1205 1210 1215
Asn Ser Lys Thr Gly Thr Glu Leu Asp Tyr Leu Ile Ser Pro Val
1220 1225 1230
Ala Asp Val Asn Gly Asn Phe Phe Asp Ser Arg Gln Ala Pro Lys
1235 1240 1245
Asn Met Pro Gln Asp Ala Ala Ala Asn Gly Ala Tyr His Ile Gly
1250 1255 1260
Leu Lys Gly Leu Met Leu Leu Gly Arg Ile Lys Asn Asn Gln Glu
1265 1270 1275
Gly Lys Lys Leu Asn Leu Val Ile Lys Asn Glu Glu Tyr Phe Glu
1280 1285 1290
Phe Val Gln Asn Arg Asn Asn
1295 1300
<210> 38
<211> 1300
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 38
Met Ser Ile Tyr Gln Glu Phe Val Asn Lys Tyr Ser Leu Ser Lys Thr
1 5 10 15
Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Glu Asn Ile Lys
20 25 30
Ala Arg Gly Leu Ile Leu Asp Asp Glu Lys Arg Ala Lys Asp Tyr Lys
35 40 45
Lys Ala Lys Gln Ile Ile Asp Lys Tyr His Gln Phe Phe Ile Glu Glu
50 55 60
Ile Leu Ser Ser Val Cys Ile Ser Glu Asp Leu Leu Gln Asn Tyr Ser
65 70 75 80
Asp Val Tyr Phe Lys Leu Lys Lys Ser Asp Asp Asp Asn Leu Gln Lys
85 90 95
Asp Phe Lys Ser Ala Lys Asp Thr Ile Lys Lys Gln Ile Ser Glu Tyr
100 105 110
Ile Lys Asp Ser Glu Lys Phe Lys Asn Leu Phe Asn Gln Asn Leu Ile
115 120 125
Asp Ala Lys Lys Gly Gln Glu Ser Asp Leu Ile Leu Trp Leu Lys Gln
130 135 140
Ser Lys Asp Asn Gly Ile Glu Leu Phe Lys Ala Asn Ser Asp Ile Thr
145 150 155 160
Asp Ile Asp Glu Ala Leu Glu Ile Ile Lys Ser Phe Lys Gly Trp Thr
165 170 175
Thr Tyr Phe Lys Gly Phe His Glu Asn Arg Lys Asn Val Tyr Ser Ser
180 185 190
Asn Asp Ile Pro Thr Ser Ile Ile Tyr Arg Ile Val Asp Asp Asn Leu
195 200 205
Pro Lys Phe Leu Glu Asn Lys Ala Lys Tyr Glu Ser Leu Lys Asp Lys
210 215 220
Ala Pro Glu Ala Ile Asn Tyr Glu Gln Ile Lys Lys Asp Leu Ala Glu
225 230 235 240
Glu Leu Thr Phe Asp Ile Asp Tyr Lys Thr Ser Glu Val Asn Gln Arg
245 250 255
Val Phe Ser Leu Asp Glu Val Phe Glu Ile Ala Asn Phe Asn Asn Tyr
260 265 270
Leu Asn Gln Ser Gly Ile Thr Lys Phe Asn Thr Ile Ile Gly Gly Lys
275 280 285
Phe Val Asn Gly Glu Asn Thr Lys Arg Lys Gly Ile Asn Glu Tyr Ile
290 295 300
Asn Leu Tyr Ser Gln Gln Ile Asn Asp Lys Thr Leu Lys Lys Tyr Lys
305 310 315 320
Met Ser Val Leu Phe Lys Gln Ile Leu Ser Asp Thr Glu Ser Lys Ser
325 330 335
Phe Val Ile Asp Lys Leu Glu Asp Asp Ser Asp Val Val Thr Thr Met
340 345 350
Gln Ser Phe Tyr Glu Gln Ile Ala Ala Phe Lys Thr Val Glu Glu Lys
355 360 365
Ser Ile Lys Glu Thr Leu Ser Leu Leu Phe Asp Asp Leu Lys Ala Gln
370 375 380
Lys Leu Asp Leu Ser Lys Ile Tyr Phe Lys Asn Asp Lys Ser Leu Thr
385 390 395 400
Asp Leu Ser Gln Gln Val Phe Asp Asp Tyr Ser Val Ile Gly Thr Ala
405 410 415
Val Leu Glu Tyr Ile Thr Gln Gln Ile Ala Pro Lys Asn Leu Asp Asn
420 425 430
Pro Ser Lys Lys Glu Gln Glu Leu Ile Ala Lys Lys Thr Glu Lys Ala
435 440 445
Lys Tyr Leu Ser Leu Glu Thr Ile Lys Leu Ala Leu Glu Glu Phe Asn
450 455 460
Lys His Arg Asp Ile Asp Lys Gln Cys Arg Phe Glu Glu Ile Leu Ala
465 470 475 480
Asn Phe Ala Ala Ile Pro Met Ile Phe Asp Glu Ile Ala Gln Asn Lys
485 490 495
Asp Asn Leu Ala Gln Ile Ser Ile Lys Tyr Gln Asn Gln Gly Lys Lys
500 505 510
Asp Leu Leu Gln Ala Ser Ala Glu Asp Asp Val Lys Ala Ile Lys Asp
515 520 525
Leu Leu Asp Gln Thr Asn Asn Leu Leu His Lys Leu Lys Ile Phe His
530 535 540
Ile Ser Gln Ser Glu Asp Lys Ala Asn Ile Leu Asp Lys Asp Glu His
545 550 555 560
Phe Tyr Leu Val Phe Glu Glu Cys Tyr Phe Glu Leu Ala Asn Ile Val
565 570 575
Pro Leu Tyr Asn Lys Ile Arg Asn Tyr Ile Thr Gln Lys Pro Tyr Ser
580 585 590
Asp Glu Lys Phe Lys Leu Asn Phe Glu Asn Ser Thr Leu Ala Asn Gly
595 600 605
Trp Asp Lys Asn Lys Glu Pro Asp Asn Thr Ala Ile Leu Phe Ile Lys
610 615 620
Asp Asp Lys Tyr Tyr Leu Gly Val Met Asn Lys Lys Asn Asn Lys Ile
625 630 635 640
Phe Asp Asp Lys Ala Ile Lys Glu Asn Lys Gly Glu Gly Tyr Lys Lys
645 650 655
Ile Val Tyr Lys Leu Leu Pro Gly Ala Asn Lys Met Leu Pro Lys Val
660 665 670
Phe Phe Ser Ala Lys Ser Ile Lys Phe Tyr Asn Pro Ser Glu Asp Ile
675 680 685
Leu Arg Ile Arg Asn His Ser Thr His Thr Lys Asn Gly Ser Pro Gln
690 695 700
Lys Gly Tyr Glu Lys Phe Glu Phe Asn Ile Glu Asp Cys Arg Lys Phe
705 710 715 720
Ile Asp Phe Tyr Lys Gln Ser Ile Ser Lys His Pro Glu Trp Lys Asp
725 730 735
Phe Gly Phe Arg Phe Ser Asp Thr Gln Arg Tyr Asn Ser Ile Asp Glu
740 745 750
Phe Tyr Arg Glu Val Glu Asn Gln Gly Tyr Lys Leu Thr Phe Glu Asn
755 760 765
Ile Ser Glu Ser Tyr Ile Asp Ser Val Val Asn Gln Gly Lys Leu Tyr
770 775 780
Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ser Ala Tyr Ser Lys Gly Arg
785 790 795 800
Pro Asn Leu His Thr Leu Tyr Trp Lys Ala Leu Phe Asp Glu Arg Asn
805 810 815
Leu Gln Asp Val Val Tyr Lys Leu Asn Gly Glu Ala Glu Leu Phe Tyr
820 825 830
Arg Lys Gln Ser Ile Pro Lys Lys Ile Thr His Pro Ala Lys Glu Ala
835 840 845
Ile Ala Asn Lys Asn Lys Asp Asn Pro Lys Lys Glu Ser Val Phe Glu
850 855 860
Tyr Asp Leu Ile Lys Asp Lys Arg Phe Thr Glu Asp Lys Phe Phe Phe
865 870 875 880
His Cys Pro Ile Thr Ile Asn Phe Lys Ser Ser Gly Ala Asn Lys Phe
885 890 895
Asn Asp Glu Ile Asn Leu Leu Leu Lys Glu Lys Ala Asn Asp Val His
900 905 910
Ile Leu Ser Ile Ala Arg Gly Glu Arg His Leu Ala Tyr Tyr Thr Leu
915 920 925
Val Asp Gly Lys Gly Asn Ile Ile Lys Gln Asp Thr Phe Asn Ile Ile
930 935 940
Gly Asn Asp Arg Met Lys Thr Asn Tyr His Asp Lys Leu Ala Ala Ile
945 950 955 960
Glu Lys Asp Arg Asp Ser Ala Arg Lys Asp Trp Lys Lys Ile Asn Asn
965 970 975
Ile Lys Glu Met Lys Glu Gly Tyr Leu Ser Gln Val Val His Glu Ile
980 985 990
Ala Lys Leu Val Ile Glu Tyr Asn Ala Ile Val Val Phe Ala Asp Leu
995 1000 1005
Asn Phe Gly Phe Lys Arg Gly Arg Phe Lys Val Glu Lys Gln Val
1010 1015 1020
Tyr Gln Lys Leu Glu Lys Met Leu Ile Glu Lys Leu Asn Tyr Leu
1025 1030 1035
Val Phe Lys Asp Asn Glu Phe Asp Lys Thr Gly Gly Val Leu Arg
1040 1045 1050
Ala Tyr Gln Leu Thr Ala Pro Phe Glu Thr Phe Lys Lys Met Gly
1055 1060 1065
Lys Gln Thr Gly Ile Ile Tyr Tyr Val Pro Ala Gly Phe Thr Ser
1070 1075 1080
Lys Ile Cys Pro Val Thr Gly Phe Val Asn Gln Leu Tyr Pro Lys
1085 1090 1095
Tyr Glu Ser Val Ser Lys Ser Gln Glu Phe Phe Ser Lys Phe Asp
1100 1105 1110
Lys Ile Cys Tyr Asn Leu Asp Lys Gly Tyr Phe Glu Phe Ser Phe
1115 1120 1125
Asp Tyr Lys Asn Phe Gly Asp Lys Ala Ala Lys Gly Lys Trp Thr
1130 1135 1140
Ile Ala Ser Phe Gly Ser Arg Leu Ile Asn Phe Arg Asn Ser Asp
1145 1150 1155
Lys Asn His Asn Trp Asp Thr Arg Glu Val Tyr Pro Thr Lys Glu
1160 1165 1170
Leu Glu Lys Leu Leu Lys Asp Tyr Ser Ile Glu Tyr Gly His Gly
1175 1180 1185
Glu Cys Ile Lys Ala Ala Ile Cys Gly Glu Ser Asp Lys Lys Phe
1190 1195 1200
Phe Ala Lys Leu Thr Ser Val Leu Asn Thr Ile Leu Gln Met Arg
1205 1210 1215
Asn Ser Lys Thr Gly Thr Glu Leu Asp Tyr Leu Ile Ser Pro Val
1220 1225 1230
Ala Asp Val Asn Gly Asn Phe Phe Asp Ser Arg Gln Ala Pro Lys
1235 1240 1245
Asn Met Pro Gln Asp Ala Asp Ala Asn Gly Ala Tyr His Ile Gly
1250 1255 1260
Leu Lys Gly Leu Met Leu Leu Gly Arg Ile Lys Asn Asn Gln Glu
1265 1270 1275
Gly Lys Lys Leu Asn Leu Val Ile Lys Asn Glu Glu Tyr Phe Glu
1280 1285 1290
Phe Val Gln Asn Arg Asn Asn
1295 1300
<210> 39
<211> 1300
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 39
Met Ser Ile Tyr Gln Glu Phe Val Asn Lys Tyr Ser Leu Ser Lys Thr
1 5 10 15
Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Glu Asn Ile Lys
20 25 30
Ala Arg Gly Leu Ile Leu Asp Asp Glu Lys Arg Ala Lys Asp Tyr Lys
35 40 45
Lys Ala Lys Gln Ile Ile Asp Lys Tyr His Gln Phe Phe Ile Glu Glu
50 55 60
Ile Leu Ser Ser Val Cys Ile Ser Glu Asp Leu Leu Gln Asn Tyr Ser
65 70 75 80
Asp Val Tyr Phe Lys Leu Lys Lys Ser Asp Asp Asp Asn Leu Gln Lys
85 90 95
Asp Phe Lys Ser Ala Lys Asp Thr Ile Lys Lys Gln Ile Ser Glu Tyr
100 105 110
Ile Lys Asp Ser Glu Lys Phe Lys Asn Leu Phe Asn Gln Asn Leu Ile
115 120 125
Asp Ala Lys Lys Gly Gln Glu Ser Asp Leu Ile Leu Trp Leu Lys Gln
130 135 140
Ser Lys Asp Asn Gly Ile Glu Leu Phe Lys Ala Asn Ser Asp Ile Thr
145 150 155 160
Asp Ile Asp Glu Ala Leu Glu Ile Ile Lys Ser Phe Lys Gly Trp Thr
165 170 175
Thr Tyr Phe Lys Gly Phe His Glu Asn Arg Lys Asn Val Tyr Ser Ser
180 185 190
Asn Asp Ile Pro Thr Ser Ile Ile Tyr Arg Ile Val Asp Asp Asn Leu
195 200 205
Pro Lys Phe Leu Glu Asn Lys Ala Lys Tyr Glu Ser Leu Lys Asp Lys
210 215 220
Ala Pro Glu Ala Ile Asn Tyr Glu Gln Ile Lys Lys Asp Leu Ala Glu
225 230 235 240
Glu Leu Thr Phe Asp Ile Asp Tyr Lys Thr Ser Glu Val Asn Gln Arg
245 250 255
Val Phe Ser Leu Asp Glu Val Phe Glu Ile Ala Asn Phe Asn Asn Tyr
260 265 270
Leu Asn Gln Ser Gly Ile Thr Lys Phe Asn Thr Ile Ile Gly Gly Lys
275 280 285
Phe Val Asn Gly Glu Asn Thr Lys Arg Lys Gly Ile Asn Glu Tyr Ile
290 295 300
Asn Leu Tyr Ser Gln Gln Ile Asn Asp Lys Thr Leu Lys Lys Tyr Lys
305 310 315 320
Met Ser Val Leu Phe Lys Gln Ile Leu Ser Asp Thr Glu Ser Lys Ser
325 330 335
Phe Val Ile Asp Lys Leu Glu Asp Asp Ser Asp Val Val Thr Thr Met
340 345 350
Gln Ser Phe Tyr Glu Gln Ile Ala Ala Phe Lys Thr Val Glu Glu Lys
355 360 365
Ser Ile Lys Glu Thr Leu Ser Leu Leu Phe Asp Asp Leu Lys Ala Gln
370 375 380
Lys Leu Asp Leu Ser Lys Ile Tyr Phe Lys Asn Asp Lys Ser Leu Thr
385 390 395 400
Asp Leu Ser Gln Gln Val Phe Asp Asp Tyr Ser Val Ile Gly Thr Ala
405 410 415
Val Leu Glu Tyr Ile Thr Gln Gln Ile Ala Pro Lys Asn Leu Asp Asn
420 425 430
Pro Ser Lys Lys Glu Gln Glu Leu Ile Ala Lys Lys Thr Glu Lys Ala
435 440 445
Lys Tyr Leu Ser Leu Glu Thr Ile Lys Leu Ala Leu Glu Glu Phe Asn
450 455 460
Lys His Arg Asp Ile Asp Lys Gln Cys Arg Phe Glu Glu Ile Leu Ala
465 470 475 480
Asn Phe Ala Ala Ile Pro Met Ile Phe Asp Glu Ile Ala Gln Asn Lys
485 490 495
Asp Asn Leu Ala Gln Ile Ser Ile Lys Tyr Gln Asn Gln Gly Lys Lys
500 505 510
Asp Leu Leu Gln Ala Ser Ala Glu Asp Asp Val Lys Ala Ile Lys Asp
515 520 525
Leu Leu Asp Gln Thr Asn Asn Leu Leu His Lys Leu Lys Ile Phe His
530 535 540
Ile Ser Gln Ser Glu Asp Lys Ala Asn Ile Leu Asp Lys Asp Glu His
545 550 555 560
Phe Tyr Leu Val Phe Glu Glu Cys Tyr Phe Glu Leu Ala Asn Ile Val
565 570 575
Pro Leu Tyr Asn Lys Ile Arg Asn Tyr Ile Thr Gln Lys Pro Tyr Ser
580 585 590
Asp Glu Lys Phe Lys Leu Asn Phe Glu Asn Ser Thr Leu Ala Asn Gly
595 600 605
Trp Asp Lys Asn Lys Glu Pro Asp Asn Thr Ala Ile Leu Phe Ile Lys
610 615 620
Asp Asp Lys Tyr Tyr Leu Gly Val Met Asn Lys Lys Asn Asn Lys Ile
625 630 635 640
Phe Asp Asp Lys Ala Ile Lys Glu Asn Lys Gly Glu Gly Tyr Lys Lys
645 650 655
Ile Val Tyr Lys Leu Leu Pro Gly Ala Asn Lys Met Leu Pro Lys Val
660 665 670
Phe Phe Ser Ala Lys Ser Ile Lys Phe Tyr Asn Pro Ser Glu Asp Ile
675 680 685
Leu Arg Ile Arg Asn His Ser Thr His Thr Lys Asn Gly Ser Pro Gln
690 695 700
Lys Gly Tyr Glu Lys Phe Glu Phe Asn Ile Glu Asp Cys Arg Lys Phe
705 710 715 720
Ile Asp Phe Tyr Lys Gln Ser Ile Ser Lys His Pro Glu Trp Lys Asp
725 730 735
Phe Gly Phe Arg Phe Ser Asp Thr Gln Arg Tyr Asn Ser Ile Asp Glu
740 745 750
Phe Tyr Arg Glu Val Glu Asn Gln Gly Tyr Lys Leu Thr Phe Glu Asn
755 760 765
Ile Ser Glu Ser Tyr Ile Asp Ser Val Val Asn Gln Gly Lys Leu Tyr
770 775 780
Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ser Ala Tyr Ser Lys Gly Arg
785 790 795 800
Pro Asn Leu His Thr Leu Tyr Trp Lys Ala Leu Phe Asp Glu Arg Asn
805 810 815
Leu Gln Asp Val Val Tyr Lys Leu Asn Gly Glu Ala Glu Leu Phe Tyr
820 825 830
Arg Lys Gln Ser Ile Pro Lys Lys Ile Thr His Pro Ala Lys Glu Ala
835 840 845
Ile Ala Asn Lys Asn Lys Asp Asn Pro Lys Lys Glu Ser Val Phe Glu
850 855 860
Tyr Asp Leu Ile Lys Asp Lys Arg Phe Thr Glu Asp Lys Phe Phe Phe
865 870 875 880
His Cys Pro Ile Thr Ile Asn Phe Lys Ser Ser Gly Ala Asn Lys Phe
885 890 895
Asn Asp Glu Ile Asn Leu Leu Leu Lys Glu Lys Ala Asn Asp Val His
900 905 910
Ile Leu Ser Ile Ala Arg Gly Glu Arg His Leu Ala Tyr Tyr Thr Leu
915 920 925
Val Asp Gly Lys Gly Asn Ile Ile Lys Gln Asp Thr Phe Asn Ile Ile
930 935 940
Gly Asn Asp Arg Met Lys Thr Asn Tyr His Asp Lys Leu Ala Ala Ile
945 950 955 960
Glu Lys Asp Arg Asp Ser Ala Arg Lys Asp Trp Lys Lys Ile Asn Asn
965 970 975
Ile Lys Glu Met Lys Glu Gly Tyr Leu Ser Gln Val Val His Glu Ile
980 985 990
Ala Lys Leu Val Ile Glu Tyr Asn Ala Ile Val Val Phe Glu Asp Leu
995 1000 1005
Asn Phe Gly Phe Lys Arg Gly Arg Phe Lys Val Glu Lys Gln Val
1010 1015 1020
Tyr Gln Lys Leu Glu Lys Met Leu Ile Glu Lys Leu Asn Tyr Leu
1025 1030 1035
Val Phe Lys Asp Asn Glu Phe Asp Lys Thr Gly Gly Val Leu Arg
1040 1045 1050
Ala Tyr Gln Leu Thr Ala Pro Phe Glu Thr Phe Lys Lys Met Gly
1055 1060 1065
Lys Gln Thr Gly Ile Ile Tyr Tyr Val Pro Ala Gly Phe Thr Ser
1070 1075 1080
Lys Ile Cys Pro Val Thr Gly Phe Val Asn Gln Leu Tyr Pro Lys
1085 1090 1095
Tyr Glu Ser Val Ser Lys Ser Gln Glu Phe Phe Ser Lys Phe Asp
1100 1105 1110
Lys Ile Cys Tyr Asn Leu Asp Lys Gly Tyr Phe Glu Phe Ser Phe
1115 1120 1125
Asp Tyr Lys Asn Phe Gly Asp Lys Ala Ala Lys Gly Lys Trp Thr
1130 1135 1140
Ile Ala Ser Phe Gly Ser Arg Leu Ile Asn Phe Arg Asn Ser Asp
1145 1150 1155
Lys Asn His Asn Trp Asp Thr Arg Glu Val Tyr Pro Thr Lys Glu
1160 1165 1170
Leu Glu Lys Leu Leu Lys Asp Tyr Ser Ile Glu Tyr Gly His Gly
1175 1180 1185
Glu Cys Ile Lys Ala Ala Ile Cys Gly Glu Ser Asp Lys Lys Phe
1190 1195 1200
Phe Ala Lys Leu Thr Ser Val Leu Asn Thr Ile Leu Gln Met Arg
1205 1210 1215
Asn Ser Lys Thr Gly Thr Glu Leu Asp Tyr Leu Ile Ser Pro Val
1220 1225 1230
Ala Asp Val Asn Gly Asn Phe Phe Asp Ser Arg Gln Ala Pro Lys
1235 1240 1245
Asn Met Pro Gln Asp Ala Ala Ala Asn Gly Ala Tyr His Ile Gly
1250 1255 1260
Leu Lys Gly Leu Met Leu Leu Gly Arg Ile Lys Asn Asn Gln Glu
1265 1270 1275
Gly Lys Lys Leu Asn Leu Val Ile Lys Asn Glu Glu Tyr Phe Glu
1280 1285 1290
Phe Val Gln Asn Arg Asn Asn
1295 1300
<210> 40
<211> 1300
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 40
Met Ser Ile Tyr Gln Glu Phe Val Asn Lys Tyr Ser Leu Ser Lys Thr
1 5 10 15
Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Glu Asn Ile Lys
20 25 30
Ala Arg Gly Leu Ile Leu Asp Asp Glu Lys Arg Ala Lys Asp Tyr Lys
35 40 45
Lys Ala Lys Gln Ile Ile Asp Lys Tyr His Gln Phe Phe Ile Glu Glu
50 55 60
Ile Leu Ser Ser Val Cys Ile Ser Glu Asp Leu Leu Gln Asn Tyr Ser
65 70 75 80
Asp Val Tyr Phe Lys Leu Lys Lys Ser Asp Asp Asp Asn Leu Gln Lys
85 90 95
Asp Phe Lys Ser Ala Lys Asp Thr Ile Lys Lys Gln Ile Ser Glu Tyr
100 105 110
Ile Lys Asp Ser Glu Lys Phe Lys Asn Leu Phe Asn Gln Asn Leu Ile
115 120 125
Asp Ala Lys Lys Gly Gln Glu Ser Asp Leu Ile Leu Trp Leu Lys Gln
130 135 140
Ser Lys Asp Asn Gly Ile Glu Leu Phe Lys Ala Asn Ser Asp Ile Thr
145 150 155 160
Asp Ile Asp Glu Ala Leu Glu Ile Ile Lys Ser Phe Lys Gly Trp Thr
165 170 175
Thr Tyr Phe Lys Gly Phe His Glu Asn Arg Lys Asn Val Tyr Ser Ser
180 185 190
Asn Asp Ile Pro Thr Ser Ile Ile Tyr Arg Ile Val Asp Asp Asn Leu
195 200 205
Pro Lys Phe Leu Glu Asn Lys Ala Lys Tyr Glu Ser Leu Lys Asp Lys
210 215 220
Ala Pro Glu Ala Ile Asn Tyr Glu Gln Ile Lys Lys Asp Leu Ala Glu
225 230 235 240
Glu Leu Thr Phe Asp Ile Asp Tyr Lys Thr Ser Glu Val Asn Gln Arg
245 250 255
Val Phe Ser Leu Asp Glu Val Phe Glu Ile Ala Asn Phe Asn Asn Tyr
260 265 270
Leu Asn Gln Ser Gly Ile Thr Lys Phe Asn Thr Ile Ile Gly Gly Lys
275 280 285
Phe Val Asn Gly Glu Asn Thr Lys Arg Lys Gly Ile Asn Glu Tyr Ile
290 295 300
Asn Leu Tyr Ser Gln Gln Ile Asn Asp Lys Thr Leu Lys Lys Tyr Lys
305 310 315 320
Met Ser Val Leu Phe Lys Gln Ile Leu Ser Asp Thr Glu Ser Lys Ser
325 330 335
Phe Val Ile Asp Lys Leu Glu Asp Asp Ser Asp Val Val Thr Thr Met
340 345 350
Gln Ser Phe Tyr Glu Gln Ile Ala Ala Phe Lys Thr Val Glu Glu Lys
355 360 365
Ser Ile Lys Glu Thr Leu Ser Leu Leu Phe Asp Asp Leu Lys Ala Gln
370 375 380
Lys Leu Asp Leu Ser Lys Ile Tyr Phe Lys Asn Asp Lys Ser Leu Thr
385 390 395 400
Asp Leu Ser Gln Gln Val Phe Asp Asp Tyr Ser Val Ile Gly Thr Ala
405 410 415
Val Leu Glu Tyr Ile Thr Gln Gln Ile Ala Pro Lys Asn Leu Asp Asn
420 425 430
Pro Ser Lys Lys Glu Gln Glu Leu Ile Ala Lys Lys Thr Glu Lys Ala
435 440 445
Lys Tyr Leu Ser Leu Glu Thr Ile Lys Leu Ala Leu Glu Glu Phe Asn
450 455 460
Lys His Arg Asp Ile Asp Lys Gln Cys Arg Phe Glu Glu Ile Leu Ala
465 470 475 480
Asn Phe Ala Ala Ile Pro Met Ile Phe Asp Glu Ile Ala Gln Asn Lys
485 490 495
Asp Asn Leu Ala Gln Ile Ser Ile Lys Tyr Gln Asn Gln Gly Lys Lys
500 505 510
Asp Leu Leu Gln Ala Ser Ala Glu Asp Asp Val Lys Ala Ile Lys Asp
515 520 525
Leu Leu Asp Gln Thr Asn Asn Leu Leu His Lys Leu Lys Ile Phe His
530 535 540
Ile Ser Gln Ser Glu Asp Lys Ala Asn Ile Leu Asp Lys Asp Glu His
545 550 555 560
Phe Tyr Leu Val Phe Glu Glu Cys Tyr Phe Glu Leu Ala Asn Ile Val
565 570 575
Pro Leu Tyr Asn Lys Ile Arg Asn Tyr Ile Thr Gln Lys Pro Tyr Ser
580 585 590
Asp Glu Lys Phe Lys Leu Asn Phe Glu Asn Ser Thr Leu Ala Asn Gly
595 600 605
Trp Asp Lys Asn Lys Glu Pro Asp Asn Thr Ala Ile Leu Phe Ile Lys
610 615 620
Asp Asp Lys Tyr Tyr Leu Gly Val Met Asn Lys Lys Asn Asn Lys Ile
625 630 635 640
Phe Asp Asp Lys Ala Ile Lys Glu Asn Lys Gly Glu Gly Tyr Lys Lys
645 650 655
Ile Val Tyr Lys Leu Leu Pro Gly Ala Asn Lys Met Leu Pro Lys Val
660 665 670
Phe Phe Ser Ala Lys Ser Ile Lys Phe Tyr Asn Pro Ser Glu Asp Ile
675 680 685
Leu Arg Ile Arg Asn His Ser Thr His Thr Lys Asn Gly Ser Pro Gln
690 695 700
Lys Gly Tyr Glu Lys Phe Glu Phe Asn Ile Glu Asp Cys Arg Lys Phe
705 710 715 720
Ile Asp Phe Tyr Lys Gln Ser Ile Ser Lys His Pro Glu Trp Lys Asp
725 730 735
Phe Gly Phe Arg Phe Ser Asp Thr Gln Arg Tyr Asn Ser Ile Asp Glu
740 745 750
Phe Tyr Arg Glu Val Glu Asn Gln Gly Tyr Lys Leu Thr Phe Glu Asn
755 760 765
Ile Ser Glu Ser Tyr Ile Asp Ser Val Val Asn Gln Gly Lys Leu Tyr
770 775 780
Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ser Ala Tyr Ser Lys Gly Arg
785 790 795 800
Pro Asn Leu His Thr Leu Tyr Trp Lys Ala Leu Phe Asp Glu Arg Asn
805 810 815
Leu Gln Asp Val Val Tyr Lys Leu Asn Gly Glu Ala Glu Leu Phe Tyr
820 825 830
Arg Lys Gln Ser Ile Pro Lys Lys Ile Thr His Pro Ala Lys Glu Ala
835 840 845
Ile Ala Asn Lys Asn Lys Asp Asn Pro Lys Lys Glu Ser Val Phe Glu
850 855 860
Tyr Asp Leu Ile Lys Asp Lys Arg Phe Thr Glu Asp Lys Phe Phe Phe
865 870 875 880
His Cys Pro Ile Thr Ile Asn Phe Lys Ser Ser Gly Ala Asn Lys Phe
885 890 895
Asn Asp Glu Ile Asn Leu Leu Leu Lys Glu Lys Ala Asn Asp Val His
900 905 910
Ile Leu Ser Ile Asp Arg Gly Glu Arg His Leu Ala Tyr Tyr Thr Leu
915 920 925
Val Asp Gly Lys Gly Asn Ile Ile Lys Gln Asp Thr Phe Asn Ile Ile
930 935 940
Gly Asn Asp Arg Met Lys Thr Asn Tyr His Asp Lys Leu Ala Ala Ile
945 950 955 960
Glu Lys Asp Arg Asp Ser Ala Arg Lys Asp Trp Lys Lys Ile Asn Asn
965 970 975
Ile Lys Glu Met Lys Glu Gly Tyr Leu Ser Gln Val Val His Glu Ile
980 985 990
Ala Lys Leu Val Ile Glu Tyr Asn Ala Ile Val Val Phe Ala Asp Leu
995 1000 1005
Asn Phe Gly Phe Lys Arg Gly Arg Phe Lys Val Glu Lys Gln Val
1010 1015 1020
Tyr Gln Lys Leu Glu Lys Met Leu Ile Glu Lys Leu Asn Tyr Leu
1025 1030 1035
Val Phe Lys Asp Asn Glu Phe Asp Lys Thr Gly Gly Val Leu Arg
1040 1045 1050
Ala Tyr Gln Leu Thr Ala Pro Phe Glu Thr Phe Lys Lys Met Gly
1055 1060 1065
Lys Gln Thr Gly Ile Ile Tyr Tyr Val Pro Ala Gly Phe Thr Ser
1070 1075 1080
Lys Ile Cys Pro Val Thr Gly Phe Val Asn Gln Leu Tyr Pro Lys
1085 1090 1095
Tyr Glu Ser Val Ser Lys Ser Gln Glu Phe Phe Ser Lys Phe Asp
1100 1105 1110
Lys Ile Cys Tyr Asn Leu Asp Lys Gly Tyr Phe Glu Phe Ser Phe
1115 1120 1125
Asp Tyr Lys Asn Phe Gly Asp Lys Ala Ala Lys Gly Lys Trp Thr
1130 1135 1140
Ile Ala Ser Phe Gly Ser Arg Leu Ile Asn Phe Arg Asn Ser Asp
1145 1150 1155
Lys Asn His Asn Trp Asp Thr Arg Glu Val Tyr Pro Thr Lys Glu
1160 1165 1170
Leu Glu Lys Leu Leu Lys Asp Tyr Ser Ile Glu Tyr Gly His Gly
1175 1180 1185
Glu Cys Ile Lys Ala Ala Ile Cys Gly Glu Ser Asp Lys Lys Phe
1190 1195 1200
Phe Ala Lys Leu Thr Ser Val Leu Asn Thr Ile Leu Gln Met Arg
1205 1210 1215
Asn Ser Lys Thr Gly Thr Glu Leu Asp Tyr Leu Ile Ser Pro Val
1220 1225 1230
Ala Asp Val Asn Gly Asn Phe Phe Asp Ser Arg Gln Ala Pro Lys
1235 1240 1245
Asn Met Pro Gln Asp Ala Ala Ala Asn Gly Ala Tyr His Ile Gly
1250 1255 1260
Leu Lys Gly Leu Met Leu Leu Gly Arg Ile Lys Asn Asn Gln Glu
1265 1270 1275
Gly Lys Lys Leu Asn Leu Val Ile Lys Asn Glu Glu Tyr Phe Glu
1280 1285 1290
Phe Val Gln Asn Arg Asn Asn
1295 1300
<210> 41
<211> 1300
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 41
Met Ser Ile Tyr Gln Glu Phe Val Asn Lys Tyr Ser Leu Ser Lys Thr
1 5 10 15
Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Glu Asn Ile Lys
20 25 30
Ala Arg Gly Leu Ile Leu Asp Asp Glu Lys Arg Ala Lys Asp Tyr Lys
35 40 45
Lys Ala Lys Gln Ile Ile Asp Lys Tyr His Gln Phe Phe Ile Glu Glu
50 55 60
Ile Leu Ser Ser Val Cys Ile Ser Glu Asp Leu Leu Gln Asn Tyr Ser
65 70 75 80
Asp Val Tyr Phe Lys Leu Lys Lys Ser Asp Asp Asp Asn Leu Gln Lys
85 90 95
Asp Phe Lys Ser Ala Lys Asp Thr Ile Lys Lys Gln Ile Ser Glu Tyr
100 105 110
Ile Lys Asp Ser Glu Lys Phe Lys Asn Leu Phe Asn Gln Asn Leu Ile
115 120 125
Asp Ala Lys Lys Gly Gln Glu Ser Asp Leu Ile Leu Trp Leu Lys Gln
130 135 140
Ser Lys Asp Asn Gly Ile Glu Leu Phe Lys Ala Asn Ser Asp Ile Thr
145 150 155 160
Asp Ile Asp Glu Ala Leu Glu Ile Ile Lys Ser Phe Lys Gly Trp Thr
165 170 175
Thr Tyr Phe Lys Gly Phe His Glu Asn Arg Lys Asn Val Tyr Ser Ser
180 185 190
Asn Asp Ile Pro Thr Ser Ile Ile Tyr Arg Ile Val Asp Asp Asn Leu
195 200 205
Pro Lys Phe Leu Glu Asn Lys Ala Lys Tyr Glu Ser Leu Lys Asp Lys
210 215 220
Ala Pro Glu Ala Ile Asn Tyr Glu Gln Ile Lys Lys Asp Leu Ala Glu
225 230 235 240
Glu Leu Thr Phe Asp Ile Asp Tyr Lys Thr Ser Glu Val Asn Gln Arg
245 250 255
Val Phe Ser Leu Asp Glu Val Phe Glu Ile Ala Asn Phe Asn Asn Tyr
260 265 270
Leu Asn Gln Ser Gly Ile Thr Lys Phe Asn Thr Ile Ile Gly Gly Lys
275 280 285
Phe Val Asn Gly Glu Asn Thr Lys Arg Lys Gly Ile Asn Glu Tyr Ile
290 295 300
Asn Leu Tyr Ser Gln Gln Ile Asn Asp Lys Thr Leu Lys Lys Tyr Lys
305 310 315 320
Met Ser Val Leu Phe Lys Gln Ile Leu Ser Asp Thr Glu Ser Lys Ser
325 330 335
Phe Val Ile Asp Lys Leu Glu Asp Asp Ser Asp Val Val Thr Thr Met
340 345 350
Gln Ser Phe Tyr Glu Gln Ile Ala Ala Phe Lys Thr Val Glu Glu Lys
355 360 365
Ser Ile Lys Glu Thr Leu Ser Leu Leu Phe Asp Asp Leu Lys Ala Gln
370 375 380
Lys Leu Asp Leu Ser Lys Ile Tyr Phe Lys Asn Asp Lys Ser Leu Thr
385 390 395 400
Asp Leu Ser Gln Gln Val Phe Asp Asp Tyr Ser Val Ile Gly Thr Ala
405 410 415
Val Leu Glu Tyr Ile Thr Gln Gln Ile Ala Pro Lys Asn Leu Asp Asn
420 425 430
Pro Ser Lys Lys Glu Gln Glu Leu Ile Ala Lys Lys Thr Glu Lys Ala
435 440 445
Lys Tyr Leu Ser Leu Glu Thr Ile Lys Leu Ala Leu Glu Glu Phe Asn
450 455 460
Lys His Arg Asp Ile Asp Lys Gln Cys Arg Phe Glu Glu Ile Leu Ala
465 470 475 480
Asn Phe Ala Ala Ile Pro Met Ile Phe Asp Glu Ile Ala Gln Asn Lys
485 490 495
Asp Asn Leu Ala Gln Ile Ser Ile Lys Tyr Gln Asn Gln Gly Lys Lys
500 505 510
Asp Leu Leu Gln Ala Ser Ala Glu Asp Asp Val Lys Ala Ile Lys Asp
515 520 525
Leu Leu Asp Gln Thr Asn Asn Leu Leu His Lys Leu Lys Ile Phe His
530 535 540
Ile Ser Gln Ser Glu Asp Lys Ala Asn Ile Leu Asp Lys Asp Glu His
545 550 555 560
Phe Tyr Leu Val Phe Glu Glu Cys Tyr Phe Glu Leu Ala Asn Ile Val
565 570 575
Pro Leu Tyr Asn Lys Ile Arg Asn Tyr Ile Thr Gln Lys Pro Tyr Ser
580 585 590
Asp Glu Lys Phe Lys Leu Asn Phe Glu Asn Ser Thr Leu Ala Asn Gly
595 600 605
Trp Asp Lys Asn Lys Glu Pro Asp Asn Thr Ala Ile Leu Phe Ile Lys
610 615 620
Asp Asp Lys Tyr Tyr Leu Gly Val Met Asn Lys Lys Asn Asn Lys Ile
625 630 635 640
Phe Asp Asp Lys Ala Ile Lys Glu Asn Lys Gly Glu Gly Tyr Lys Lys
645 650 655
Ile Val Tyr Lys Leu Leu Pro Gly Ala Asn Lys Met Leu Pro Lys Val
660 665 670
Phe Phe Ser Ala Lys Ser Ile Lys Phe Tyr Asn Pro Ser Glu Asp Ile
675 680 685
Leu Arg Ile Arg Asn His Ser Thr His Thr Lys Asn Gly Ser Pro Gln
690 695 700
Lys Gly Tyr Glu Lys Phe Glu Phe Asn Ile Glu Asp Cys Arg Lys Phe
705 710 715 720
Ile Asp Phe Tyr Lys Gln Ser Ile Ser Lys His Pro Glu Trp Lys Asp
725 730 735
Phe Gly Phe Arg Phe Ser Asp Thr Gln Arg Tyr Asn Ser Ile Asp Glu
740 745 750
Phe Tyr Arg Glu Val Glu Asn Gln Gly Tyr Lys Leu Thr Phe Glu Asn
755 760 765
Ile Ser Glu Ser Tyr Ile Asp Ser Val Val Asn Gln Gly Lys Leu Tyr
770 775 780
Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ser Ala Tyr Ser Lys Gly Arg
785 790 795 800
Pro Asn Leu His Thr Leu Tyr Trp Lys Ala Leu Phe Asp Glu Arg Asn
805 810 815
Leu Gln Asp Val Val Tyr Lys Leu Asn Gly Glu Ala Glu Leu Phe Tyr
820 825 830
Arg Lys Gln Ser Ile Pro Lys Lys Ile Thr His Pro Ala Lys Glu Ala
835 840 845
Ile Ala Asn Lys Asn Lys Asp Asn Pro Lys Lys Glu Ser Val Phe Glu
850 855 860
Tyr Asp Leu Ile Lys Asp Lys Arg Phe Thr Glu Asp Lys Phe Phe Phe
865 870 875 880
His Cys Pro Ile Thr Ile Asn Phe Lys Ser Ser Gly Ala Asn Lys Phe
885 890 895
Asn Asp Glu Ile Asn Leu Leu Leu Lys Glu Lys Ala Asn Asp Val His
900 905 910
Ile Leu Ser Ile Asp Arg Gly Glu Arg His Leu Ala Tyr Tyr Thr Leu
915 920 925
Val Asp Gly Lys Gly Asn Ile Ile Lys Gln Asp Thr Phe Asn Ile Ile
930 935 940
Gly Asn Asp Arg Met Lys Thr Asn Tyr His Asp Lys Leu Ala Ala Ile
945 950 955 960
Glu Lys Asp Arg Asp Ser Ala Arg Lys Asp Trp Lys Lys Ile Asn Asn
965 970 975
Ile Lys Glu Met Lys Glu Gly Tyr Leu Ser Gln Val Val His Glu Ile
980 985 990
Ala Lys Leu Val Ile Glu Tyr Asn Ala Ile Val Val Phe Ala Asp Leu
995 1000 1005
Asn Phe Gly Phe Lys Arg Gly Arg Phe Lys Val Glu Lys Gln Val
1010 1015 1020
Tyr Gln Lys Leu Glu Lys Met Leu Ile Glu Lys Leu Asn Tyr Leu
1025 1030 1035
Val Phe Lys Asp Asn Glu Phe Asp Lys Thr Gly Gly Val Leu Arg
1040 1045 1050
Ala Tyr Gln Leu Thr Ala Pro Phe Glu Thr Phe Lys Lys Met Gly
1055 1060 1065
Lys Gln Thr Gly Ile Ile Tyr Tyr Val Pro Ala Gly Phe Thr Ser
1070 1075 1080
Lys Ile Cys Pro Val Thr Gly Phe Val Asn Gln Leu Tyr Pro Lys
1085 1090 1095
Tyr Glu Ser Val Ser Lys Ser Gln Glu Phe Phe Ser Lys Phe Asp
1100 1105 1110
Lys Ile Cys Tyr Asn Leu Asp Lys Gly Tyr Phe Glu Phe Ser Phe
1115 1120 1125
Asp Tyr Lys Asn Phe Gly Asp Lys Ala Ala Lys Gly Lys Trp Thr
1130 1135 1140
Ile Ala Ser Phe Gly Ser Arg Leu Ile Asn Phe Arg Asn Ser Asp
1145 1150 1155
Lys Asn His Asn Trp Asp Thr Arg Glu Val Tyr Pro Thr Lys Glu
1160 1165 1170
Leu Glu Lys Leu Leu Lys Asp Tyr Ser Ile Glu Tyr Gly His Gly
1175 1180 1185
Glu Cys Ile Lys Ala Ala Ile Cys Gly Glu Ser Asp Lys Lys Phe
1190 1195 1200
Phe Ala Lys Leu Thr Ser Val Leu Asn Thr Ile Leu Gln Met Arg
1205 1210 1215
Asn Ser Lys Thr Gly Thr Glu Leu Asp Tyr Leu Ile Ser Pro Val
1220 1225 1230
Ala Asp Val Asn Gly Asn Phe Phe Asp Ser Arg Gln Ala Pro Lys
1235 1240 1245
Asn Met Pro Gln Asp Ala Ala Ala Asn Gly Ala Tyr His Ile Gly
1250 1255 1260
Leu Lys Gly Leu Met Leu Leu Gly Arg Ile Lys Asn Asn Gln Glu
1265 1270 1275
Gly Lys Lys Leu Asn Leu Val Ile Lys Asn Glu Glu Tyr Phe Glu
1280 1285 1290
Phe Val Gln Asn Arg Asn Asn
1295 1300
<210> 42
<211> 887
<212> PRT
<213> Natronobacterium gregoryi
<400> 42
Met Thr Val Ile Asp Leu Asp Ser Thr Thr Thr Ala Asp Glu Leu Thr
1 5 10 15
Ser Gly His Thr Tyr Asp Ile Ser Val Thr Leu Thr Gly Val Tyr Asp
20 25 30
Asn Thr Asp Glu Gln His Pro Arg Met Ser Leu Ala Phe Glu Gln Asp
35 40 45
Asn Gly Glu Arg Arg Tyr Ile Thr Leu Trp Lys Asn Thr Thr Pro Lys
50 55 60
Asp Val Phe Thr Tyr Asp Tyr Ala Thr Gly Ser Thr Tyr Ile Phe Thr
65 70 75 80
Asn Ile Asp Tyr Glu Val Lys Asp Gly Tyr Glu Asn Leu Thr Ala Thr
85 90 95
Tyr Gln Thr Thr Val Glu Asn Ala Thr Ala Gln Glu Val Gly Thr Thr
100 105 110
Asp Glu Asp Glu Thr Phe Ala Gly Gly Glu Pro Leu Asp His His Leu
115 120 125
Asp Asp Ala Leu Asn Glu Thr Pro Asp Asp Ala Glu Thr Glu Ser Asp
130 135 140
Ser Gly His Val Met Thr Ser Phe Ala Ser Arg Asp Gln Leu Pro Glu
145 150 155 160
Trp Thr Leu His Thr Tyr Thr Leu Thr Ala Thr Asp Gly Ala Lys Thr
165 170 175
Asp Thr Glu Tyr Ala Arg Arg Thr Leu Ala Tyr Thr Val Arg Gln Glu
180 185 190
Leu Tyr Thr Asp His Asp Ala Ala Pro Val Ala Thr Asp Gly Leu Met
195 200 205
Leu Leu Thr Pro Glu Pro Leu Gly Glu Thr Pro Leu Asp Leu Asp Cys
210 215 220
Gly Val Arg Val Glu Ala Asp Glu Thr Arg Thr Leu Asp Tyr Thr Thr
225 230 235 240
Ala Lys Asp Arg Leu Leu Ala Arg Glu Leu Val Glu Glu Gly Leu Lys
245 250 255
Arg Ser Leu Trp Asp Asp Tyr Leu Val Arg Gly Ile Asp Glu Val Leu
260 265 270
Ser Lys Glu Pro Val Leu Thr Cys Asp Glu Phe Asp Leu His Glu Arg
275 280 285
Tyr Asp Leu Ser Val Glu Val Gly His Ser Gly Arg Ala Tyr Leu His
290 295 300
Ile Asn Phe Arg His Arg Phe Val Pro Lys Leu Thr Leu Ala Asp Ile
305 310 315 320
Asp Asp Asp Asn Ile Tyr Pro Gly Leu Arg Val Lys Thr Thr Tyr Arg
325 330 335
Pro Arg Arg Gly His Ile Val Trp Gly Leu Arg Asp Glu Cys Ala Thr
340 345 350
Asp Ser Leu Asn Thr Leu Gly Asn Gln Ser Val Val Ala Tyr His Arg
355 360 365
Asn Asn Gln Thr Pro Ile Asn Thr Asp Leu Leu Asp Ala Ile Glu Ala
370 375 380
Ala Asp Arg Arg Val Val Glu Thr Arg Arg Gln Gly His Gly Asp Asp
385 390 395 400
Ala Val Ser Phe Pro Gln Glu Leu Leu Ala Val Glu Pro Asn Thr His
405 410 415
Gln Ile Lys Gln Phe Ala Ser Asp Gly Phe His Gln Gln Ala Arg Ser
420 425 430
Lys Thr Arg Leu Ser Ala Ser Arg Cys Ser Glu Lys Ala Gln Ala Phe
435 440 445
Ala Glu Arg Leu Asp Pro Val Arg Leu Asn Gly Ser Thr Val Glu Phe
450 455 460
Ser Ser Glu Phe Phe Thr Gly Asn Asn Glu Gln Gln Leu Arg Leu Leu
465 470 475 480
Tyr Glu Asn Gly Glu Ser Val Leu Thr Phe Arg Asp Gly Ala Arg Gly
485 490 495
Ala His Pro Asp Glu Thr Phe Ser Lys Gly Ile Val Asn Pro Pro Glu
500 505 510
Ser Phe Glu Val Ala Val Val Leu Pro Glu Gln Gln Ala Asp Thr Cys
515 520 525
Lys Ala Gln Trp Asp Thr Met Ala Asp Leu Leu Asn Gln Ala Gly Ala
530 535 540
Pro Pro Thr Arg Ser Glu Thr Val Gln Tyr Asp Ala Phe Ser Ser Pro
545 550 555 560
Glu Ser Ile Ser Leu Asn Val Ala Gly Ala Ile Asp Pro Ser Glu Val
565 570 575
Asp Ala Ala Phe Val Val Leu Pro Pro Asp Gln Glu Gly Phe Ala Asp
580 585 590
Leu Ala Ser Pro Thr Glu Thr Tyr Asp Glu Leu Lys Lys Ala Leu Ala
595 600 605
Asn Met Gly Ile Tyr Ser Gln Met Ala Tyr Phe Asp Arg Phe Arg Asp
610 615 620
Ala Lys Ile Phe Tyr Thr Arg Asn Val Ala Leu Gly Leu Leu Ala Ala
625 630 635 640
Ala Gly Gly Val Ala Phe Thr Thr Glu His Ala Met Pro Gly Asp Ala
645 650 655
Asp Met Phe Ile Gly Ile Asp Val Ser Arg Ser Tyr Pro Glu Asp Gly
660 665 670
Ala Ser Gly Gln Ile Asn Ile Ala Ala Thr Ala Thr Ala Val Tyr Lys
675 680 685
Asp Gly Thr Ile Leu Gly His Ser Ser Thr Arg Pro Gln Leu Gly Glu
690 695 700
Lys Leu Gln Ser Thr Asp Val Arg Asp Ile Met Lys Asn Ala Ile Leu
705 710 715 720
Gly Tyr Gln Gln Val Thr Gly Glu Ser Pro Thr His Ile Val Ile His
725 730 735
Arg Asp Gly Phe Met Asn Glu Asp Leu Asp Pro Ala Thr Glu Phe Leu
740 745 750
Asn Glu Gln Gly Val Glu Tyr Asp Ile Val Glu Ile Arg Lys Gln Pro
755 760 765
Gln Thr Arg Leu Leu Ala Val Ser Asp Val Gln Tyr Asp Thr Pro Val
770 775 780
Lys Ser Ile Ala Ala Ile Asn Gln Asn Glu Pro Arg Ala Thr Val Ala
785 790 795 800
Thr Phe Gly Ala Pro Glu Tyr Leu Ala Thr Arg Asp Gly Gly Gly Leu
805 810 815
Pro Arg Pro Ile Gln Ile Glu Arg Val Ala Gly Glu Thr Asp Ile Glu
820 825 830
Thr Leu Thr Arg Gln Val Tyr Leu Leu Ser Gln Ser His Ile Gln Val
835 840 845
His Asn Ser Thr Ala Arg Leu Pro Ile Thr Thr Ala Tyr Ala Asp Gln
850 855 860
Ala Ser Thr His Ala Thr Lys Gly Tyr Leu Val Gln Thr Gly Ala Phe
865 870 875 880
Glu Ser Asn Val Gly Phe Leu
885
<210> 43
<211> 1129
<212> PRT
<213> Alicyclobacillus acidoterrestris
<400> 43
Met Ala Val Lys Ser Ile Lys Val Lys Leu Arg Leu Asp Asp Met Pro
1 5 10 15
Glu Ile Arg Ala Gly Leu Trp Lys Leu His Lys Glu Val Asn Ala Gly
20 25 30
Val Arg Tyr Tyr Thr Glu Trp Leu Ser Leu Leu Arg Gln Glu Asn Leu
35 40 45
Tyr Arg Arg Ser Pro Asn Gly Asp Gly Glu Gln Glu Cys Asp Lys Thr
50 55 60
Ala Glu Glu Cys Lys Ala Glu Leu Leu Glu Arg Leu Arg Ala Arg Gln
65 70 75 80
Val Glu Asn Gly His Arg Gly Pro Ala Gly Ser Asp Asp Glu Leu Leu
85 90 95
Gln Leu Ala Arg Gln Leu Tyr Glu Leu Leu Val Pro Gln Ala Ile Gly
100 105 110
Ala Lys Gly Asp Ala Gln Gln Ile Ala Arg Lys Phe Leu Ser Pro Leu
115 120 125
Ala Asp Lys Asp Ala Val Gly Gly Leu Gly Ile Ala Lys Ala Gly Asn
130 135 140
Lys Pro Arg Trp Val Arg Met Arg Glu Ala Gly Glu Pro Gly Trp Glu
145 150 155 160
Glu Glu Lys Glu Lys Ala Glu Thr Arg Lys Ser Ala Asp Arg Thr Ala
165 170 175
Asp Val Leu Arg Ala Leu Ala Asp Phe Gly Leu Lys Pro Leu Met Arg
180 185 190
Val Tyr Thr Asp Ser Glu Met Ser Ser Val Glu Trp Lys Pro Leu Arg
195 200 205
Lys Gly Gln Ala Val Arg Thr Trp Asp Arg Asp Met Phe Gln Gln Ala
210 215 220
Ile Glu Arg Met Met Ser Trp Glu Ser Trp Asn Gln Arg Val Gly Gln
225 230 235 240
Glu Tyr Ala Lys Leu Val Glu Gln Lys Asn Arg Phe Glu Gln Lys Asn
245 250 255
Phe Val Gly Gln Glu His Leu Val His Leu Val Asn Gln Leu Gln Gln
260 265 270
Asp Met Lys Glu Ala Ser Pro Gly Leu Glu Ser Lys Glu Gln Thr Ala
275 280 285
His Tyr Val Thr Gly Arg Ala Leu Arg Gly Ser Asp Lys Val Phe Glu
290 295 300
Lys Trp Gly Lys Leu Ala Pro Asp Ala Pro Phe Asp Leu Tyr Asp Ala
305 310 315 320
Glu Ile Lys Asn Val Gln Arg Arg Asn Thr Arg Arg Phe Gly Ser His
325 330 335
Asp Leu Phe Ala Lys Leu Ala Glu Pro Glu Tyr Gln Ala Leu Trp Arg
340 345 350
Glu Asp Ala Ser Phe Leu Thr Arg Tyr Ala Val Tyr Asn Ser Ile Leu
355 360 365
Arg Lys Leu Asn His Ala Lys Met Phe Ala Thr Phe Thr Leu Pro Asp
370 375 380
Ala Thr Ala His Pro Ile Trp Thr Arg Phe Asp Lys Leu Gly Gly Asn
385 390 395 400
Leu His Gln Tyr Thr Phe Leu Phe Asn Glu Phe Gly Glu Arg Arg His
405 410 415
Ala Ile Arg Phe His Lys Leu Leu Lys Val Glu Asn Gly Val Ala Arg
420 425 430
Glu Val Asp Asp Val Thr Val Pro Ile Ser Met Ser Glu Gln Leu Asp
435 440 445
Asn Leu Leu Pro Arg Asp Pro Asn Glu Pro Ile Ala Leu Tyr Phe Arg
450 455 460
Asp Tyr Gly Ala Glu Gln His Phe Thr Gly Glu Phe Gly Gly Ala Lys
465 470 475 480
Ile Gln Cys Arg Arg Asp Gln Leu Ala His Met His Arg Arg Arg Gly
485 490 495
Ala Arg Asp Val Tyr Leu Asn Val Ser Val Arg Val Gln Ser Gln Ser
500 505 510
Glu Ala Arg Gly Glu Arg Arg Pro Pro Tyr Ala Ala Val Phe Arg Leu
515 520 525
Val Gly Asp Asn His Arg Ala Phe Val His Phe Asp Lys Leu Ser Asp
530 535 540
Tyr Leu Ala Glu His Pro Asp Asp Gly Lys Leu Gly Ser Glu Gly Leu
545 550 555 560
Leu Ser Gly Leu Arg Val Met Ser Val Asp Leu Gly Leu Arg Thr Ser
565 570 575
Ala Ser Ile Ser Val Phe Arg Val Ala Arg Lys Asp Glu Leu Lys Pro
580 585 590
Asn Ser Lys Gly Arg Val Pro Phe Phe Phe Pro Ile Lys Gly Asn Asp
595 600 605
Asn Leu Val Ala Val His Glu Arg Ser Gln Leu Leu Lys Leu Pro Gly
610 615 620
Glu Thr Glu Ser Lys Asp Leu Arg Ala Ile Arg Glu Glu Arg Gln Arg
625 630 635 640
Thr Leu Arg Gln Leu Arg Thr Gln Leu Ala Tyr Leu Arg Leu Leu Val
645 650 655
Arg Cys Gly Ser Glu Asp Val Gly Arg Arg Glu Arg Ser Trp Ala Lys
660 665 670
Leu Ile Glu Gln Pro Val Asp Ala Ala Asn His Met Thr Pro Asp Trp
675 680 685
Arg Glu Ala Phe Glu Asn Glu Leu Gln Lys Leu Lys Ser Leu His Gly
690 695 700
Ile Cys Ser Asp Lys Glu Trp Met Asp Ala Val Tyr Glu Ser Val Arg
705 710 715 720
Arg Val Trp Arg His Met Gly Lys Gln Val Arg Asp Trp Arg Lys Asp
725 730 735
Val Arg Ser Gly Glu Arg Pro Lys Ile Arg Gly Tyr Ala Lys Asp Val
740 745 750
Val Gly Gly Asn Ser Ile Glu Gln Ile Glu Tyr Leu Glu Arg Gln Tyr
755 760 765
Lys Phe Leu Lys Ser Trp Ser Phe Phe Gly Lys Val Ser Gly Gln Val
770 775 780
Ile Arg Ala Glu Lys Gly Ser Arg Phe Ala Ile Thr Leu Arg Glu His
785 790 795 800
Ile Asp His Ala Lys Glu Asp Arg Leu Lys Lys Leu Ala Asp Arg Ile
805 810 815
Ile Met Glu Ala Leu Gly Tyr Val Tyr Ala Leu Asp Glu Arg Gly Lys
820 825 830
Gly Lys Trp Val Ala Lys Tyr Pro Pro Cys Gln Leu Ile Leu Leu Glu
835 840 845
Glu Leu Ser Glu Tyr Gln Phe Asn Asn Asp Arg Pro Pro Ser Glu Asn
850 855 860
Asn Gln Leu Met Gln Trp Ser His Arg Gly Val Phe Gln Glu Leu Ile
865 870 875 880
Asn Gln Ala Gln Val His Asp Leu Leu Val Gly Thr Met Tyr Ala Ala
885 890 895
Phe Ser Ser Arg Phe Asp Ala Arg Thr Gly Ala Pro Gly Ile Arg Cys
900 905 910
Arg Arg Val Pro Ala Arg Cys Thr Gln Glu His Asn Pro Glu Pro Phe
915 920 925
Pro Trp Trp Leu Asn Lys Phe Val Val Glu His Thr Leu Asp Ala Cys
930 935 940
Pro Leu Arg Ala Asp Asp Leu Ile Pro Thr Gly Glu Gly Glu Ile Phe
945 950 955 960
Val Ser Pro Phe Ser Ala Glu Glu Gly Asp Phe His Gln Ile His Ala
965 970 975
Asp Leu Asn Ala Ala Gln Asn Leu Gln Gln Arg Leu Trp Ser Asp Phe
980 985 990
Asp Ile Ser Gln Ile Arg Leu Arg Cys Asp Trp Gly Glu Val Asp Gly
995 1000 1005
Glu Leu Val Leu Ile Pro Arg Leu Thr Gly Lys Arg Thr Ala Asp
1010 1015 1020
Ser Tyr Ser Asn Lys Val Phe Tyr Thr Asn Thr Gly Val Thr Tyr
1025 1030 1035
Tyr Glu Arg Glu Arg Gly Lys Lys Arg Arg Lys Val Phe Ala Gln
1040 1045 1050
Glu Lys Leu Ser Glu Glu Glu Ala Glu Leu Leu Val Glu Ala Asp
1055 1060 1065
Glu Ala Arg Glu Lys Ser Val Val Leu Met Arg Asp Pro Ser Gly
1070 1075 1080
Ile Ile Asn Arg Gly Asn Trp Thr Arg Gln Lys Glu Phe Trp Ser
1085 1090 1095
Met Val Asn Gln Arg Ile Glu Gly Tyr Leu Val Lys Gln Ile Arg
1100 1105 1110
Ser Arg Val Pro Leu Gln Asp Ser Ala Cys Glu Asn Thr Gly Asp
1115 1120 1125
Ile
<210> 44
<211> 1389
<212> PRT
<213> Leptotrichia shahii
<400> 44
Met Gly Asn Leu Phe Gly His Lys Arg Trp Tyr Glu Val Arg Asp Lys
1 5 10 15
Lys Asp Phe Lys Ile Lys Arg Lys Val Lys Val Lys Arg Asn Tyr Asp
20 25 30
Gly Asn Lys Tyr Ile Leu Asn Ile Asn Glu Asn Asn Asn Lys Glu Lys
35 40 45
Ile Asp Asn Asn Lys Phe Ile Arg Lys Tyr Ile Asn Tyr Lys Lys Asn
50 55 60
Asp Asn Ile Leu Lys Glu Phe Thr Arg Lys Phe His Ala Gly Asn Ile
65 70 75 80
Leu Phe Lys Leu Lys Gly Lys Glu Gly Ile Ile Arg Ile Glu Asn Asn
85 90 95
Asp Asp Phe Leu Glu Thr Glu Glu Val Val Leu Tyr Ile Glu Ala Tyr
100 105 110
Gly Lys Ser Glu Lys Leu Lys Ala Leu Gly Ile Thr Lys Lys Lys Ile
115 120 125
Ile Asp Glu Ala Ile Arg Gln Gly Ile Thr Lys Asp Asp Lys Lys Ile
130 135 140
Glu Ile Lys Arg Gln Glu Asn Glu Glu Glu Ile Glu Ile Asp Ile Arg
145 150 155 160
Asp Glu Tyr Thr Asn Lys Thr Leu Asn Asp Cys Ser Ile Ile Leu Arg
165 170 175
Ile Ile Glu Asn Asp Glu Leu Glu Thr Lys Lys Ser Ile Tyr Glu Ile
180 185 190
Phe Lys Asn Ile Asn Met Ser Leu Tyr Lys Ile Ile Glu Lys Ile Ile
195 200 205
Glu Asn Glu Thr Glu Lys Val Phe Glu Asn Arg Tyr Tyr Glu Glu His
210 215 220
Leu Arg Glu Lys Leu Leu Lys Asp Asp Lys Ile Asp Val Ile Leu Thr
225 230 235 240
Asn Phe Met Glu Ile Arg Glu Lys Ile Lys Ser Asn Leu Glu Ile Leu
245 250 255
Gly Phe Val Lys Phe Tyr Leu Asn Val Gly Gly Asp Lys Lys Lys Ser
260 265 270
Lys Asn Lys Lys Met Leu Val Glu Lys Ile Leu Asn Ile Asn Val Asp
275 280 285
Leu Thr Val Glu Asp Ile Ala Asp Phe Val Ile Lys Glu Leu Glu Phe
290 295 300
Trp Asn Ile Thr Lys Arg Ile Glu Lys Val Lys Lys Val Asn Asn Glu
305 310 315 320
Phe Leu Glu Lys Arg Arg Asn Arg Thr Tyr Ile Lys Ser Tyr Val Leu
325 330 335
Leu Asp Lys His Glu Lys Phe Lys Ile Glu Arg Glu Asn Lys Lys Asp
340 345 350
Lys Ile Val Lys Phe Phe Val Glu Asn Ile Lys Asn Asn Ser Ile Lys
355 360 365
Glu Lys Ile Glu Lys Ile Leu Ala Glu Phe Lys Ile Asp Glu Leu Ile
370 375 380
Lys Lys Leu Glu Lys Glu Leu Lys Lys Gly Asn Cys Asp Thr Glu Ile
385 390 395 400
Phe Gly Ile Phe Lys Lys His Tyr Lys Val Asn Phe Asp Ser Lys Lys
405 410 415
Phe Ser Lys Lys Ser Asp Glu Glu Lys Glu Leu Tyr Lys Ile Ile Tyr
420 425 430
Arg Tyr Leu Lys Gly Arg Ile Glu Lys Ile Leu Val Asn Glu Gln Lys
435 440 445
Val Arg Leu Lys Lys Met Glu Lys Ile Glu Ile Glu Lys Ile Leu Asn
450 455 460
Glu Ser Ile Leu Ser Glu Lys Ile Leu Lys Arg Val Lys Gln Tyr Thr
465 470 475 480
Leu Glu His Ile Met Tyr Leu Gly Lys Leu Arg His Asn Asp Ile Asp
485 490 495
Met Thr Thr Val Asn Thr Asp Asp Phe Ser Arg Leu His Ala Lys Glu
500 505 510
Glu Leu Asp Leu Glu Leu Ile Thr Phe Phe Ala Ser Thr Asn Met Glu
515 520 525
Leu Asn Lys Ile Phe Ser Arg Glu Asn Ile Asn Asn Asp Glu Asn Ile
530 535 540
Asp Phe Phe Gly Gly Asp Arg Glu Lys Asn Tyr Val Leu Asp Lys Lys
545 550 555 560
Ile Leu Asn Ser Lys Ile Lys Ile Ile Arg Asp Leu Asp Phe Ile Asp
565 570 575
Asn Lys Asn Asn Ile Thr Asn Asn Phe Ile Arg Lys Phe Thr Lys Ile
580 585 590
Gly Thr Asn Glu Arg Asn Arg Ile Leu His Ala Ile Ser Lys Glu Arg
595 600 605
Asp Leu Gln Gly Thr Gln Asp Asp Tyr Asn Lys Val Ile Asn Ile Ile
610 615 620
Gln Asn Leu Lys Ile Ser Asp Glu Glu Val Ser Lys Ala Leu Asn Leu
625 630 635 640
Asp Val Val Phe Lys Asp Lys Lys Asn Ile Ile Thr Lys Ile Asn Asp
645 650 655
Ile Lys Ile Ser Glu Glu Asn Asn Asn Asp Ile Lys Tyr Leu Pro Ser
660 665 670
Phe Ser Lys Val Leu Pro Glu Ile Leu Asn Leu Tyr Arg Asn Asn Pro
675 680 685
Lys Asn Glu Pro Phe Asp Thr Ile Glu Thr Glu Lys Ile Val Leu Asn
690 695 700
Ala Leu Ile Tyr Val Asn Lys Glu Leu Tyr Lys Lys Leu Ile Leu Glu
705 710 715 720
Asp Asp Leu Glu Glu Asn Glu Ser Lys Asn Ile Phe Leu Gln Glu Leu
725 730 735
Lys Lys Thr Leu Gly Asn Ile Asp Glu Ile Asp Glu Asn Ile Ile Glu
740 745 750
Asn Tyr Tyr Lys Asn Ala Gln Ile Ser Ala Ser Lys Gly Asn Asn Lys
755 760 765
Ala Ile Lys Lys Tyr Gln Lys Lys Val Ile Glu Cys Tyr Ile Gly Tyr
770 775 780
Leu Arg Lys Asn Tyr Glu Glu Leu Phe Asp Phe Ser Asp Phe Lys Met
785 790 795 800
Asn Ile Gln Glu Ile Lys Lys Gln Ile Lys Asp Ile Asn Asp Asn Lys
805 810 815
Thr Tyr Glu Arg Ile Thr Val Lys Thr Ser Asp Lys Thr Ile Val Ile
820 825 830
Asn Asp Asp Phe Glu Tyr Ile Ile Ser Ile Phe Ala Leu Leu Asn Ser
835 840 845
Asn Ala Val Ile Asn Lys Ile Arg Asn Arg Phe Phe Ala Thr Ser Val
850 855 860
Trp Leu Asn Thr Ser Glu Tyr Gln Asn Ile Ile Asp Ile Leu Asp Glu
865 870 875 880
Ile Met Gln Leu Asn Thr Leu Arg Asn Glu Cys Ile Thr Glu Asn Trp
885 890 895
Asn Leu Asn Leu Glu Glu Phe Ile Gln Lys Met Lys Glu Ile Glu Lys
900 905 910
Asp Phe Asp Asp Phe Lys Ile Gln Thr Lys Lys Glu Ile Phe Asn Asn
915 920 925
Tyr Tyr Glu Asp Ile Lys Asn Asn Ile Leu Thr Glu Phe Lys Asp Asp
930 935 940
Ile Asn Gly Cys Asp Val Leu Glu Lys Lys Leu Glu Lys Ile Val Ile
945 950 955 960
Phe Asp Asp Glu Thr Lys Phe Glu Ile Asp Lys Lys Ser Asn Ile Leu
965 970 975
Gln Asp Glu Gln Arg Lys Leu Ser Asn Ile Asn Lys Lys Asp Leu Lys
980 985 990
Lys Lys Val Asp Gln Tyr Ile Lys Asp Lys Asp Gln Glu Ile Lys Ser
995 1000 1005
Lys Ile Leu Cys Arg Ile Ile Phe Asn Ser Asp Phe Leu Lys Lys
1010 1015 1020
Tyr Lys Lys Glu Ile Asp Asn Leu Ile Glu Asp Met Glu Ser Glu
1025 1030 1035
Asn Glu Asn Lys Phe Gln Glu Ile Tyr Tyr Pro Lys Glu Arg Lys
1040 1045 1050
Asn Glu Leu Tyr Ile Tyr Lys Lys Asn Leu Phe Leu Asn Ile Gly
1055 1060 1065
Asn Pro Asn Phe Asp Lys Ile Tyr Gly Leu Ile Ser Asn Asp Ile
1070 1075 1080
Lys Met Ala Asp Ala Lys Phe Leu Phe Asn Ile Asp Gly Lys Asn
1085 1090 1095
Ile Arg Lys Asn Lys Ile Ser Glu Ile Asp Ala Ile Leu Lys Asn
1100 1105 1110
Leu Asn Asp Lys Leu Asn Gly Tyr Ser Lys Glu Tyr Lys Glu Lys
1115 1120 1125
Tyr Ile Lys Lys Leu Lys Glu Asn Asp Asp Phe Phe Ala Lys Asn
1130 1135 1140
Ile Gln Asn Lys Asn Tyr Lys Ser Phe Glu Lys Asp Tyr Asn Arg
1145 1150 1155
Val Ser Glu Tyr Lys Lys Ile Arg Asp Leu Val Glu Phe Asn Tyr
1160 1165 1170
Leu Asn Lys Ile Glu Ser Tyr Leu Ile Asp Ile Asn Trp Lys Leu
1175 1180 1185
Ala Ile Gln Met Ala Arg Phe Glu Arg Asp Met His Tyr Ile Val
1190 1195 1200
Asn Gly Leu Arg Glu Leu Gly Ile Ile Lys Leu Ser Gly Tyr Asn
1205 1210 1215
Thr Gly Ile Ser Arg Ala Tyr Pro Lys Arg Asn Gly Ser Asp Gly
1220 1225 1230
Phe Tyr Thr Thr Thr Ala Tyr Tyr Lys Phe Phe Asp Glu Glu Ser
1235 1240 1245
Tyr Lys Lys Phe Glu Lys Ile Cys Tyr Gly Phe Gly Ile Asp Leu
1250 1255 1260
Ser Glu Asn Ser Glu Ile Asn Lys Pro Glu Asn Glu Ser Ile Arg
1265 1270 1275
Asn Tyr Ile Ser His Phe Tyr Ile Val Arg Asn Pro Phe Ala Asp
1280 1285 1290
Tyr Ser Ile Ala Glu Gln Ile Asp Arg Val Ser Asn Leu Leu Ser
1295 1300 1305
Tyr Ser Thr Arg Tyr Asn Asn Ser Thr Tyr Ala Ser Val Phe Glu
1310 1315 1320
Val Phe Lys Lys Asp Val Asn Leu Asp Tyr Asp Glu Leu Lys Lys
1325 1330 1335
Lys Phe Lys Leu Ile Gly Asn Asn Asp Ile Leu Glu Arg Leu Met
1340 1345 1350
Lys Pro Lys Lys Val Ser Val Leu Glu Leu Glu Ser Tyr Asn Ser
1355 1360 1365
Asp Tyr Ile Lys Asn Leu Ile Ile Glu Leu Leu Thr Lys Ile Glu
1370 1375 1380
Asn Thr Asn Asp Thr Leu
1385
<210> 45
<211> 1052
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 45
Lys Arg Asn Tyr Ile Leu Gly Leu Asp Ile Gly Ile Thr Ser Val Gly
1 5 10 15
Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly Val
20 25 30
Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg Ser
35 40 45
Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile Gln
50 55 60
Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His Ser
65 70 75 80
Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu Ser
85 90 95
Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu Ala
100 105 110
Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr Gly
115 120 125
Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala Leu
130 135 140
Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys Asp
145 150 155 160
Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr Val
165 170 175
Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln Leu
180 185 190
Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg Arg
195 200 205
Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys Asp
210 215 220
Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe Pro
225 230 235 240
Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr Asn
245 250 255
Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn Glu
260 265 270
Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe Lys
275 280 285
Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu Val
290 295 300
Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys Pro
305 310 315 320
Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr Ala
325 330 335
Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala Lys
340 345 350
Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu Thr
355 360 365
Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser Asn
370 375 380
Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile Asn
385 390 395 400
Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala Ile
405 410 415
Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln Gln
420 425 430
Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro Val
435 440 445
Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile Ile
450 455 460
Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg Glu
465 470 475 480
Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys Arg
485 490 495
Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr Gly
500 505 510
Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp Met
515 520 525
Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu Asp
530 535 540
Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro Arg
545 550 555 560
Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys Gln
565 570 575
Glu Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu Ser
580 585 590
Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile Leu
595 600 605
Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu Tyr
610 615 620
Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp Phe
625 630 635 640
Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu Met
645 650 655
Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys Val
660 665 670
Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp Lys
675 680 685
Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp Ala
690 695 700
Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys Leu
705 710 715 720
Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys Gln
725 730 735
Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu Ile
740 745 750
Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp Tyr
755 760 765
Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile Asn
770 775 780
Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu Ile
785 790 795 800
Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu Lys
805 810 815
Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His Asp
820 825 830
Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly Asp
835 840 845
Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr Leu
850 855 860
Thr Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile Lys
865 870 875 880
Tyr Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp Tyr
885 890 895
Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr Arg
900 905 910
Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val Lys
915 920 925
Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys
930 935 940
Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu
945 950 955 960
Phe Ile Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly Glu
965 970 975
Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile Glu
980 985 990
Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn
995 1000 1005
Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys Thr
1010 1015 1020
Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu Tyr
1025 1030 1035
Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly
1040 1045 1050
<210> 46
<211> 52
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<220>
<221> misc_feature
<222> (16)..(16)
<223> Xaa可为任何天然氨基酸
<400> 46
Ser Gly Gly Ser Ser Ala Ala Ala Thr Ser Gly Gly Gly Gly Ala Xaa
1 5 10 15
Thr Glu Asn Ser Gly Ser Ala Gly Ser Ala Ala Gly Ser Gly Glu Ser
20 25 30
Ala Ala Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
35 40 45
Ser Thr Ala Ala
50
<210> 47
<211> 198
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 47
Met Asp Ser Leu Leu Met Asn Arg Arg Lys Phe Leu Tyr Gln Phe Lys
1 5 10 15
Asn Val Arg Trp Ala Lys Gly Arg Arg Glu Thr Tyr Leu Cys Tyr Val
20 25 30
Val Lys Arg Arg Asp Ser Ala Thr Ser Phe Ser Leu Asp Phe Gly Tyr
35 40 45
Leu Arg Asn Lys Asn Gly Cys His Val Glu Leu Leu Phe Leu Arg Tyr
50 55 60
Ile Ser Asp Trp Asp Leu Asp Pro Gly Arg Cys Tyr Arg Val Thr Trp
65 70 75 80
Phe Thr Ser Trp Ser Pro Cys Tyr Asp Cys Ala Arg His Val Ala Asp
85 90 95
Phe Leu Arg Gly Asn Pro Asn Leu Ser Leu Arg Ile Phe Thr Ala Arg
100 105 110
Leu Tyr Phe Cys Glu Asp Arg Lys Ala Glu Pro Glu Gly Leu Arg Arg
115 120 125
Leu His Arg Ala Gly Val Gln Ile Ala Ile Met Thr Phe Lys Asp Tyr
130 135 140
Phe Tyr Cys Trp Asn Thr Phe Val Glu Asn His Glu Arg Thr Phe Lys
145 150 155 160
Ala Trp Glu Gly Leu His Glu Asn Ser Val Arg Leu Ser Arg Gln Leu
165 170 175
Arg Arg Ile Leu Leu Pro Leu Tyr Glu Val Asp Asp Leu Arg Asp Ala
180 185 190
Phe Arg Thr Leu Gly Leu
195
<210> 48
<211> 198
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 48
Met Asp Ser Leu Leu Met Lys Gln Lys Lys Phe Leu Tyr His Phe Lys
1 5 10 15
Asn Val Arg Trp Ala Lys Gly Arg His Glu Thr Tyr Leu Cys Tyr Val
20 25 30
Val Lys Arg Arg Asp Ser Ala Thr Ser Cys Ser Leu Asp Phe Gly His
35 40 45
Leu Arg Asn Lys Ser Gly Cys His Val Glu Leu Leu Phe Leu Arg Tyr
50 55 60
Ile Ser Asp Trp Asp Leu Asp Pro Gly Arg Cys Tyr Arg Val Thr Trp
65 70 75 80
Phe Thr Ser Trp Ser Pro Cys Tyr Asp Cys Ala Arg His Val Ala Glu
85 90 95
Phe Leu Arg Trp Asn Pro Asn Leu Ser Leu Arg Ile Phe Thr Ala Arg
100 105 110
Leu Tyr Phe Cys Glu Asp Arg Lys Ala Glu Pro Glu Gly Leu Arg Arg
115 120 125
Leu His Arg Ala Gly Val Gln Ile Gly Ile Met Thr Phe Lys Asp Tyr
130 135 140
Phe Tyr Cys Trp Asn Thr Phe Val Glu Asn Arg Glu Arg Thr Phe Lys
145 150 155 160
Ala Trp Glu Gly Leu His Glu Asn Ser Val Arg Leu Thr Arg Gln Leu
165 170 175
Arg Arg Ile Leu Leu Pro Leu Tyr Glu Val Asp Asp Leu Arg Asp Ala
180 185 190
Phe Arg Met Leu Gly Phe
195
<210> 49
<211> 198
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 49
Met Asp Ser Leu Leu Met Lys Gln Arg Lys Phe Leu Tyr His Phe Lys
1 5 10 15
Asn Val Arg Trp Ala Lys Gly Arg His Glu Thr Tyr Leu Cys Tyr Val
20 25 30
Val Lys Arg Arg Asp Ser Ala Thr Ser Phe Ser Leu Asp Phe Gly His
35 40 45
Leu Arg Asn Lys Ser Gly Cys His Val Glu Leu Leu Phe Leu Arg Tyr
50 55 60
Ile Ser Asp Trp Asp Leu Asp Pro Gly Arg Cys Tyr Arg Val Thr Trp
65 70 75 80
Phe Thr Ser Trp Ser Pro Cys Tyr Asp Cys Ala Arg His Val Ala Asp
85 90 95
Phe Leu Arg Gly Tyr Pro Asn Leu Ser Leu Arg Ile Phe Ala Ala Arg
100 105 110
Leu Tyr Phe Cys Glu Asp Arg Lys Ala Glu Pro Glu Gly Leu Arg Arg
115 120 125
Leu His Arg Ala Gly Val Gln Ile Ala Ile Met Thr Phe Lys Asp Tyr
130 135 140
Phe Tyr Cys Trp Asn Thr Phe Val Glu Asn Arg Glu Lys Thr Phe Lys
145 150 155 160
Ala Trp Glu Gly Leu His Glu Asn Ser Val Arg Leu Ser Arg Gln Leu
165 170 175
Arg Arg Ile Leu Leu Pro Leu Tyr Glu Val Asp Asp Leu Arg Asp Ala
180 185 190
Phe Arg Thr Leu Gly Leu
195
<210> 50
<211> 199
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 50
Met Asp Ser Leu Leu Lys Lys Gln Arg Gln Phe Leu Tyr Gln Phe Lys
1 5 10 15
Asn Val Arg Trp Ala Lys Gly Arg His Glu Thr Tyr Leu Cys Tyr Val
20 25 30
Val Lys Arg Arg Asp Ser Pro Thr Ser Phe Ser Leu Asp Phe Gly His
35 40 45
Leu Arg Asn Lys Ala Gly Cys His Val Glu Leu Leu Phe Leu Arg Tyr
50 55 60
Ile Ser Asp Trp Asp Leu Asp Pro Gly Arg Cys Tyr Arg Val Thr Trp
65 70 75 80
Phe Thr Ser Trp Ser Pro Cys Tyr Asp Cys Ala Arg His Val Ala Asp
85 90 95
Phe Leu Arg Gly Tyr Pro Asn Leu Ser Leu Arg Ile Phe Thr Ala Arg
100 105 110
Leu Tyr Phe Cys Asp Lys Glu Arg Lys Ala Glu Pro Glu Gly Leu Arg
115 120 125
Arg Leu His Arg Ala Gly Val Gln Ile Ala Ile Met Thr Phe Lys Asp
130 135 140
Tyr Phe Tyr Cys Trp Asn Thr Phe Val Glu Asn His Glu Arg Thr Phe
145 150 155 160
Lys Ala Trp Glu Gly Leu His Glu Asn Ser Val Arg Leu Ser Arg Gln
165 170 175
Leu Arg Arg Ile Leu Leu Pro Leu Tyr Glu Val Asp Asp Leu Arg Asp
180 185 190
Ala Phe Arg Thr Leu Gly Leu
195
<210> 51
<211> 239
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 51
Met Ala Val Gly Ser Lys Pro Lys Ala Ala Leu Val Gly Pro His Trp
1 5 10 15
Glu Arg Glu Arg Ile Trp Cys Phe Leu Cys Ser Thr Gly Leu Gly Thr
20 25 30
Gln Gln Thr Gly Gln Thr Ser Arg Trp Leu Arg Pro Ala Ala Thr Gln
35 40 45
Asp Pro Val Ser Pro Pro Arg Ser Leu Leu Met Lys Gln Arg Lys Phe
50 55 60
Leu Tyr His Phe Lys Asn Val Arg Trp Ala Lys Gly Arg His Glu Thr
65 70 75 80
Tyr Leu Cys Tyr Val Val Lys Arg Arg Asp Ser Ala Thr Ser Phe Ser
85 90 95
Leu Asp Phe Gly Tyr Leu Arg Asn Lys Ser Gly Cys His Val Glu Leu
100 105 110
Leu Phe Leu Arg Tyr Ile Ser Asp Trp Asp Leu Asp Pro Gly Arg Cys
115 120 125
Tyr Arg Val Thr Trp Phe Thr Ser Trp Ser Pro Cys Tyr Asp Cys Ala
130 135 140
Arg His Val Ala Asp Phe Leu Arg Gly Asn Pro Asn Leu Ser Leu Arg
145 150 155 160
Ile Phe Thr Ala Arg Leu Thr Gly Trp Gly Ala Leu Pro Ala Gly Leu
165 170 175
Met Ser Pro Ala Arg Pro Ser Asp Tyr Phe Tyr Cys Trp Asn Thr Phe
180 185 190
Val Glu Asn His Glu Arg Thr Phe Lys Ala Trp Glu Gly Leu His Glu
195 200 205
Asn Ser Val Arg Leu Ser Arg Arg Leu Arg Arg Ile Leu Leu Pro Leu
210 215 220
Tyr Glu Val Asp Asp Leu Arg Asp Ala Phe Arg Thr Leu Gly Leu
225 230 235
<210> 52
<211> 429
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 52
Met Gly Pro Phe Cys Leu Gly Cys Ser His Arg Lys Cys Tyr Ser Pro
1 5 10 15
Ile Arg Asn Leu Ile Ser Gln Glu Thr Phe Lys Phe His Phe Lys Asn
20 25 30
Leu Gly Tyr Ala Lys Gly Arg Lys Asp Thr Phe Leu Cys Tyr Glu Val
35 40 45
Thr Arg Lys Asp Cys Asp Ser Pro Val Ser Leu His His Gly Val Phe
50 55 60
Lys Asn Lys Asp Asn Ile His Ala Glu Ile Cys Phe Leu Tyr Trp Phe
65 70 75 80
His Asp Lys Val Leu Lys Val Leu Ser Pro Arg Glu Glu Phe Lys Ile
85 90 95
Thr Trp Tyr Met Ser Trp Ser Pro Cys Phe Glu Cys Ala Glu Gln Ile
100 105 110
Val Arg Phe Leu Ala Thr His His Asn Leu Ser Leu Asp Ile Phe Ser
115 120 125
Ser Arg Leu Tyr Asn Val Gln Asp Pro Glu Thr Gln Gln Asn Leu Cys
130 135 140
Arg Leu Val Gln Glu Gly Ala Gln Val Ala Ala Met Asp Leu Tyr Glu
145 150 155 160
Phe Lys Lys Cys Trp Lys Lys Phe Val Asp Asn Gly Gly Arg Arg Phe
165 170 175
Arg Pro Trp Lys Arg Leu Leu Thr Asn Phe Arg Tyr Gln Asp Ser Lys
180 185 190
Leu Gln Glu Ile Leu Arg Pro Cys Tyr Ile Pro Val Pro Ser Ser Ser
195 200 205
Ser Ser Thr Leu Ser Asn Ile Cys Leu Thr Lys Gly Leu Pro Glu Thr
210 215 220
Arg Phe Cys Val Glu Gly Arg Arg Met Asp Pro Leu Ser Glu Glu Glu
225 230 235 240
Phe Tyr Ser Gln Phe Tyr Asn Gln Arg Val Lys His Leu Cys Tyr Tyr
245 250 255
His Arg Met Lys Pro Tyr Leu Cys Tyr Gln Leu Glu Gln Phe Asn Gly
260 265 270
Gln Ala Pro Leu Lys Gly Cys Leu Leu Ser Glu Lys Gly Lys Gln His
275 280 285
Ala Glu Ile Leu Phe Leu Asp Lys Ile Arg Ser Met Glu Leu Ser Gln
290 295 300
Val Thr Ile Thr Cys Tyr Leu Thr Trp Ser Pro Cys Pro Asn Cys Ala
305 310 315 320
Trp Gln Leu Ala Ala Phe Lys Arg Asp Arg Pro Asp Leu Ile Leu His
325 330 335
Ile Tyr Thr Ser Arg Leu Tyr Phe His Trp Lys Arg Pro Phe Gln Lys
340 345 350
Gly Leu Cys Ser Leu Trp Gln Ser Gly Ile Leu Val Asp Val Met Asp
355 360 365
Leu Pro Gln Phe Thr Asp Cys Trp Thr Asn Phe Val Asn Pro Lys Arg
370 375 380
Pro Phe Trp Pro Trp Lys Gly Leu Glu Ile Ile Ser Arg Arg Thr Gln
385 390 395 400
Arg Arg Leu Arg Arg Ile Lys Glu Ser Trp Gly Leu Gln Asp Leu Val
405 410 415
Asn Asp Phe Gly Asn Leu Gln Leu Gly Pro Pro Met Ser
420 425
<210> 53
<211> 429
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 53
Met Gly Pro Phe Cys Leu Gly Cys Ser His Arg Lys Cys Tyr Ser Pro
1 5 10 15
Ile Arg Asn Leu Ile Ser Gln Glu Thr Phe Lys Phe His Phe Lys Asn
20 25 30
Leu Arg Tyr Ala Ile Asp Arg Lys Asp Thr Phe Leu Cys Tyr Glu Val
35 40 45
Thr Arg Lys Asp Cys Asp Ser Pro Val Ser Leu His His Gly Val Phe
50 55 60
Lys Asn Lys Asp Asn Ile His Ala Glu Ile Cys Phe Leu Tyr Trp Phe
65 70 75 80
His Asp Lys Val Leu Lys Val Leu Ser Pro Arg Glu Glu Phe Lys Ile
85 90 95
Thr Trp Tyr Met Ser Trp Ser Pro Cys Phe Glu Cys Ala Glu Gln Val
100 105 110
Leu Arg Phe Leu Ala Thr His His Asn Leu Ser Leu Asp Ile Phe Ser
115 120 125
Ser Arg Leu Tyr Asn Ile Arg Asp Pro Glu Asn Gln Gln Asn Leu Cys
130 135 140
Arg Leu Val Gln Glu Gly Ala Gln Val Ala Ala Met Asp Leu Tyr Glu
145 150 155 160
Phe Lys Lys Cys Trp Lys Lys Phe Val Asp Asn Gly Gly Arg Arg Phe
165 170 175
Arg Pro Trp Lys Lys Leu Leu Thr Asn Phe Arg Tyr Gln Asp Ser Lys
180 185 190
Leu Gln Glu Ile Leu Arg Pro Cys Tyr Ile Pro Val Pro Ser Ser Ser
195 200 205
Ser Ser Thr Leu Ser Asn Ile Cys Leu Thr Lys Gly Leu Pro Glu Thr
210 215 220
Arg Phe Cys Val Glu Arg Arg Arg Val His Leu Leu Ser Glu Glu Glu
225 230 235 240
Phe Tyr Ser Gln Phe Tyr Asn Gln Arg Val Lys His Leu Cys Tyr Tyr
245 250 255
His Gly Val Lys Pro Tyr Leu Cys Tyr Gln Leu Glu Gln Phe Asn Gly
260 265 270
Gln Ala Pro Leu Lys Gly Cys Leu Leu Ser Glu Lys Gly Lys Gln His
275 280 285
Ala Glu Ile Leu Phe Leu Asp Lys Ile Arg Ser Met Glu Leu Ser Gln
290 295 300
Val Ile Ile Thr Cys Tyr Leu Thr Trp Ser Pro Cys Pro Asn Cys Ala
305 310 315 320
Trp Gln Leu Ala Ala Phe Lys Arg Asp Arg Pro Asp Leu Ile Leu His
325 330 335
Ile Tyr Thr Ser Arg Leu Tyr Phe His Trp Lys Arg Pro Phe Gln Lys
340 345 350
Gly Leu Cys Ser Leu Trp Gln Ser Gly Ile Leu Val Asp Val Met Asp
355 360 365
Leu Pro Gln Phe Thr Asp Cys Trp Thr Asn Phe Val Asn Pro Lys Arg
370 375 380
Pro Phe Trp Pro Trp Lys Gly Leu Glu Ile Ile Ser Arg Arg Thr Gln
385 390 395 400
Arg Arg Leu His Arg Ile Lys Glu Ser Trp Gly Leu Gln Asp Leu Val
405 410 415
Asn Asp Phe Gly Asn Leu Gln Leu Gly Pro Pro Met Ser
420 425
<210> 54
<211> 370
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 54
Met Val Glu Pro Met Asp Pro Arg Thr Phe Val Ser Asn Phe Asn Asn
1 5 10 15
Arg Pro Ile Leu Ser Gly Leu Asn Thr Val Trp Leu Cys Cys Glu Val
20 25 30
Lys Thr Lys Asp Pro Ser Gly Pro Pro Leu Asp Ala Lys Ile Phe Gln
35 40 45
Gly Lys Val Tyr Ser Lys Ala Lys Tyr His Pro Glu Met Arg Phe Leu
50 55 60
Arg Trp Phe His Lys Trp Arg Gln Leu His His Asp Gln Glu Tyr Lys
65 70 75 80
Val Thr Trp Tyr Val Ser Trp Ser Pro Cys Thr Arg Cys Ala Asn Ser
85 90 95
Val Ala Thr Phe Leu Ala Lys Asp Pro Lys Val Thr Leu Thr Ile Phe
100 105 110
Val Ala Arg Leu Tyr Tyr Phe Trp Lys Pro Asp Tyr Gln Gln Ala Leu
115 120 125
Arg Ile Leu Cys Gln Lys Arg Gly Gly Pro His Ala Thr Met Lys Ile
130 135 140
Met Asn Tyr Asn Glu Phe Gln Asp Cys Trp Asn Lys Phe Val Asp Gly
145 150 155 160
Arg Gly Lys Pro Phe Lys Pro Arg Asn Asn Leu Pro Lys His Tyr Thr
165 170 175
Leu Leu Gln Ala Thr Leu Gly Glu Leu Leu Arg His Leu Met Asp Pro
180 185 190
Gly Thr Phe Thr Ser Asn Phe Asn Asn Lys Pro Trp Val Ser Gly Gln
195 200 205
His Glu Thr Tyr Leu Cys Tyr Lys Val Glu Arg Leu His Asn Asp Thr
210 215 220
Trp Val Pro Leu Asn Gln His Arg Gly Phe Leu Arg Asn Gln Ala Pro
225 230 235 240
Asn Ile His Gly Phe Pro Lys Gly Arg His Ala Glu Leu Cys Phe Leu
245 250 255
Asp Leu Ile Pro Phe Trp Lys Leu Asp Gly Gln Gln Tyr Arg Val Thr
260 265 270
Cys Phe Thr Ser Trp Ser Pro Cys Phe Ser Cys Ala Gln Glu Met Ala
275 280 285
Lys Phe Ile Ser Asn Asn Glu His Val Ser Leu Cys Ile Phe Ala Ala
290 295 300
Arg Ile Tyr Asp Asp Gln Gly Arg Tyr Gln Glu Gly Leu Arg Ala Leu
305 310 315 320
His Arg Asp Gly Ala Lys Ile Ala Met Met Asn Tyr Ser Glu Phe Glu
325 330 335
Tyr Cys Trp Asp Thr Phe Val Asp Arg Gln Gly Arg Pro Phe Gln Pro
340 345 350
Trp Asp Gly Leu Asp Glu His Ser Gln Ala Leu Ser Gly Arg Leu Arg
355 360 365
Ala Ile
370
<210> 55
<211> 384
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 55
Met Lys Pro His Phe Arg Asn Pro Val Glu Arg Met Tyr Gln Asp Thr
1 5 10 15
Phe Ser Asp Asn Phe Tyr Asn Arg Pro Ile Leu Ser His Arg Asn Thr
20 25 30
Val Trp Leu Cys Tyr Glu Val Lys Thr Lys Gly Pro Ser Arg Pro Pro
35 40 45
Leu Asp Ala Lys Ile Phe Arg Gly Gln Val Tyr Ser Lys Leu Lys Tyr
50 55 60
His Pro Glu Met Arg Phe Phe His Trp Phe Ser Lys Trp Arg Lys Leu
65 70 75 80
His Arg Asp Gln Glu Tyr Glu Val Thr Trp Tyr Ile Ser Trp Ser Pro
85 90 95
Cys Thr Lys Cys Thr Arg Asp Val Ala Thr Phe Leu Ala Glu Asp Pro
100 105 110
Lys Val Thr Leu Thr Ile Phe Val Ala Arg Leu Tyr Tyr Phe Trp Asp
115 120 125
Pro Asp Tyr Gln Glu Ala Leu Arg Ser Leu Cys Gln Lys Arg Asp Gly
130 135 140
Pro Arg Ala Thr Met Lys Ile Met Asn Tyr Asp Glu Phe Gln His Cys
145 150 155 160
Trp Ser Lys Phe Val Tyr Ser Gln Arg Glu Leu Phe Glu Pro Trp Asn
165 170 175
Asn Leu Pro Lys Tyr Tyr Ile Leu Leu His Ile Met Leu Gly Glu Ile
180 185 190
Leu Arg His Ser Met Asp Pro Pro Thr Phe Thr Ser Asn Phe Asn Asn
195 200 205
Glu Leu Trp Val Arg Gly Arg His Glu Thr Tyr Leu Cys Tyr Glu Val
210 215 220
Glu Arg Leu His Asn Asp Thr Trp Val Leu Leu Asn Gln Arg Arg Gly
225 230 235 240
Phe Leu Cys Asn Gln Ala Pro His Lys His Gly Phe Leu Glu Gly Arg
245 250 255
His Ala Glu Leu Cys Phe Leu Asp Val Ile Pro Phe Trp Lys Leu Asp
260 265 270
Leu His Gln Asp Tyr Arg Val Thr Cys Phe Thr Ser Trp Ser Pro Cys
275 280 285
Phe Ser Cys Ala Gln Glu Met Ala Lys Phe Ile Ser Asn Asn Lys His
290 295 300
Val Ser Leu Cys Ile Phe Ala Ala Arg Ile Tyr Asp Asp Gln Gly Arg
305 310 315 320
Cys Gln Glu Gly Leu Arg Thr Leu Ala Lys Ala Gly Ala Lys Ile Ser
325 330 335
Ile Met Thr Tyr Ser Glu Phe Lys His Cys Trp Asp Thr Phe Val Asp
340 345 350
His Gln Gly Cys Pro Phe Gln Pro Trp Asp Gly Leu Glu Glu His Ser
355 360 365
Gln Ala Leu Ser Gly Arg Leu Arg Ala Ile Leu Gln Asn Gln Gly Asn
370 375 380
<210> 56
<211> 377
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 56
Met Asn Pro Gln Ile Arg Asn Met Val Glu Gln Met Glu Pro Asp Ile
1 5 10 15
Phe Val Tyr Tyr Phe Asn Asn Arg Pro Ile Leu Ser Gly Arg Asn Thr
20 25 30
Val Trp Leu Cys Tyr Glu Val Lys Thr Lys Asp Pro Ser Gly Pro Pro
35 40 45
Leu Asp Ala Asn Ile Phe Gln Gly Lys Leu Tyr Pro Glu Ala Lys Asp
50 55 60
His Pro Glu Met Lys Phe Leu His Trp Phe Arg Lys Trp Arg Gln Leu
65 70 75 80
His Arg Asp Gln Glu Tyr Glu Val Thr Trp Tyr Val Ser Trp Ser Pro
85 90 95
Cys Thr Arg Cys Ala Asn Ser Val Ala Thr Phe Leu Ala Glu Asp Pro
100 105 110
Lys Val Thr Leu Thr Ile Phe Val Ala Arg Leu Tyr Tyr Phe Trp Lys
115 120 125
Pro Asp Tyr Gln Gln Ala Leu Arg Ile Leu Cys Gln Glu Arg Gly Gly
130 135 140
Pro His Ala Thr Met Lys Ile Met Asn Tyr Asn Glu Phe Gln His Cys
145 150 155 160
Trp Asn Glu Phe Val Asp Gly Gln Gly Lys Pro Phe Lys Pro Arg Lys
165 170 175
Asn Leu Pro Lys His Tyr Thr Leu Leu His Ala Thr Leu Gly Glu Leu
180 185 190
Leu Arg His Val Met Asp Pro Gly Thr Phe Thr Ser Asn Phe Asn Asn
195 200 205
Lys Pro Trp Val Ser Gly Gln Arg Glu Thr Tyr Leu Cys Tyr Lys Val
210 215 220
Glu Arg Ser His Asn Asp Thr Trp Val Leu Leu Asn Gln His Arg Gly
225 230 235 240
Phe Leu Arg Asn Gln Ala Pro Asp Arg His Gly Phe Pro Lys Gly Arg
245 250 255
His Ala Glu Leu Cys Phe Leu Asp Leu Ile Pro Phe Trp Lys Leu Asp
260 265 270
Asp Gln Gln Tyr Arg Val Thr Cys Phe Thr Ser Trp Ser Pro Cys Phe
275 280 285
Ser Cys Ala Gln Lys Met Ala Lys Phe Ile Ser Asn Asn Lys His Val
290 295 300
Ser Leu Cys Ile Phe Ala Ala Arg Ile Tyr Asp Asp Gln Gly Arg Cys
305 310 315 320
Gln Glu Gly Leu Arg Thr Leu His Arg Asp Gly Ala Lys Ile Ala Val
325 330 335
Met Asn Tyr Ser Glu Phe Glu Tyr Cys Trp Asp Thr Phe Val Asp Arg
340 345 350
Gln Gly Arg Pro Phe Gln Pro Trp Asp Gly Leu Asp Glu His Ser Gln
355 360 365
Ala Leu Ser Gly Arg Leu Arg Ala Ile
370 375
<210> 57
<211> 384
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 57
Met Lys Pro His Phe Arg Asn Thr Val Glu Arg Met Tyr Arg Asp Thr
1 5 10 15
Phe Ser Tyr Asn Phe Tyr Asn Arg Pro Ile Leu Ser Arg Arg Asn Thr
20 25 30
Val Trp Leu Cys Tyr Glu Val Lys Thr Lys Gly Pro Ser Arg Pro Pro
35 40 45
Leu Asp Ala Lys Ile Phe Arg Gly Gln Val Tyr Ser Glu Leu Lys Tyr
50 55 60
His Pro Glu Met Arg Phe Phe His Trp Phe Ser Lys Trp Arg Lys Leu
65 70 75 80
His Arg Asp Gln Glu Tyr Glu Val Thr Trp Tyr Ile Ser Trp Ser Pro
85 90 95
Cys Thr Lys Cys Thr Arg Asp Met Ala Thr Phe Leu Ala Glu Asp Pro
100 105 110
Lys Val Thr Leu Thr Ile Phe Val Ala Arg Leu Tyr Tyr Phe Trp Asp
115 120 125
Pro Asp Tyr Gln Glu Ala Leu Arg Ser Leu Cys Gln Lys Arg Asp Gly
130 135 140
Pro Arg Ala Thr Met Lys Ile Met Asn Tyr Asp Glu Phe Gln His Cys
145 150 155 160
Trp Ser Lys Phe Val Tyr Ser Gln Arg Glu Leu Phe Glu Pro Trp Asn
165 170 175
Asn Leu Pro Lys Tyr Tyr Ile Leu Leu His Ile Met Leu Gly Glu Ile
180 185 190
Leu Arg His Ser Met Asp Pro Pro Thr Phe Thr Phe Asn Phe Asn Asn
195 200 205
Glu Pro Trp Val Arg Gly Arg His Glu Thr Tyr Leu Cys Tyr Glu Val
210 215 220
Glu Arg Met His Asn Asp Thr Trp Val Leu Leu Asn Gln Arg Arg Gly
225 230 235 240
Phe Leu Cys Asn Gln Ala Pro His Lys His Gly Phe Leu Glu Gly Arg
245 250 255
His Ala Glu Leu Cys Phe Leu Asp Val Ile Pro Phe Trp Lys Leu Asp
260 265 270
Leu Asp Gln Asp Tyr Arg Val Thr Cys Phe Thr Ser Trp Ser Pro Cys
275 280 285
Phe Ser Cys Ala Gln Glu Met Ala Lys Phe Ile Ser Lys Asn Lys His
290 295 300
Val Ser Leu Cys Ile Phe Thr Ala Arg Ile Tyr Asp Asp Gln Gly Arg
305 310 315 320
Cys Gln Glu Gly Leu Arg Thr Leu Ala Glu Ala Gly Ala Lys Ile Ser
325 330 335
Ile Met Thr Tyr Ser Glu Phe Lys His Cys Trp Asp Thr Phe Val Asp
340 345 350
His Gln Gly Cys Pro Phe Gln Pro Trp Asp Gly Leu Asp Glu His Ser
355 360 365
Gln Asp Leu Ser Gly Arg Leu Arg Ala Ile Leu Gln Asn Gln Glu Asn
370 375 380
<210> 58
<211> 373
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 58
Met Lys Pro His Phe Arg Asn Thr Val Glu Arg Met Tyr Arg Asp Thr
1 5 10 15
Phe Ser Tyr Asn Phe Tyr Asn Arg Pro Ile Leu Ser Arg Arg Asn Thr
20 25 30
Val Trp Leu Cys Tyr Glu Val Lys Thr Lys Gly Pro Ser Arg Pro Arg
35 40 45
Leu Asp Ala Lys Ile Phe Arg Gly Gln Val Tyr Ser Gln Pro Glu His
50 55 60
His Ala Glu Met Cys Phe Leu Ser Trp Phe Cys Gly Asn Gln Leu Pro
65 70 75 80
Ala Tyr Lys Cys Phe Gln Ile Thr Trp Phe Val Ser Trp Thr Pro Cys
85 90 95
Pro Asp Cys Val Ala Lys Leu Ala Glu Phe Leu Ala Glu His Pro Asn
100 105 110
Val Thr Leu Thr Ile Ser Ala Ala Arg Leu Tyr Tyr Tyr Trp Glu Arg
115 120 125
Asp Tyr Arg Arg Ala Leu Cys Arg Leu Ser Gln Ala Gly Ala Arg Val
130 135 140
Lys Ile Met Asp Asp Glu Glu Phe Ala Tyr Cys Trp Glu Asn Phe Val
145 150 155 160
Tyr Ser Glu Gly Gln Pro Phe Met Pro Trp Tyr Lys Phe Asp Asp Asn
165 170 175
Tyr Ala Phe Leu His Arg Thr Leu Lys Glu Ile Leu Arg Asn Pro Met
180 185 190
Glu Ala Met Tyr Pro His Ile Phe Tyr Phe His Phe Lys Asn Leu Arg
195 200 205
Lys Ala Tyr Gly Arg Asn Glu Ser Trp Leu Cys Phe Thr Met Glu Val
210 215 220
Val Lys His His Ser Pro Val Ser Trp Lys Arg Gly Val Phe Arg Asn
225 230 235 240
Gln Val Asp Pro Glu Thr His Cys His Ala Glu Arg Cys Phe Leu Ser
245 250 255
Trp Phe Cys Asp Asp Ile Leu Ser Pro Asn Thr Asn Tyr Glu Val Thr
260 265 270
Trp Tyr Thr Ser Trp Ser Pro Cys Pro Glu Cys Ala Gly Glu Val Ala
275 280 285
Glu Phe Leu Ala Arg His Ser Asn Val Asn Leu Thr Ile Phe Thr Ala
290 295 300
Arg Leu Tyr Tyr Phe Trp Asp Thr Asp Tyr Gln Glu Gly Leu Arg Ser
305 310 315 320
Leu Ser Gln Glu Gly Ala Ser Val Glu Ile Met Gly Tyr Lys Asp Phe
325 330 335
Lys Tyr Cys Trp Glu Asn Phe Val Tyr Asn Asp Asp Glu Pro Phe Lys
340 345 350
Pro Trp Lys Gly Leu Lys Tyr Asn Phe Leu Phe Leu Asp Ser Lys Leu
355 360 365
Gln Glu Ile Leu Glu
370
<210> 59
<211> 382
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 59
Met Asn Pro Gln Ile Arg Asn Pro Met Glu Arg Met Tyr Arg Asp Thr
1 5 10 15
Phe Tyr Asp Asn Phe Glu Asn Glu Pro Ile Leu Tyr Gly Arg Ser Tyr
20 25 30
Thr Trp Leu Cys Tyr Glu Val Lys Ile Lys Arg Gly Arg Ser Asn Leu
35 40 45
Leu Trp Asp Thr Gly Val Phe Arg Gly Gln Val Tyr Phe Lys Pro Gln
50 55 60
Tyr His Ala Glu Met Cys Phe Leu Ser Trp Phe Cys Gly Asn Gln Leu
65 70 75 80
Pro Ala Tyr Lys Cys Phe Gln Ile Thr Trp Phe Val Ser Trp Thr Pro
85 90 95
Cys Pro Asp Cys Val Ala Lys Leu Ala Glu Phe Leu Ser Glu His Pro
100 105 110
Asn Val Thr Leu Thr Ile Ser Ala Ala Arg Leu Tyr Tyr Tyr Trp Glu
115 120 125
Arg Asp Tyr Arg Arg Ala Leu Cys Arg Leu Ser Gln Ala Gly Ala Arg
130 135 140
Val Thr Ile Met Asp Tyr Glu Glu Phe Ala Tyr Cys Trp Glu Asn Phe
145 150 155 160
Val Tyr Asn Glu Gly Gln Gln Phe Met Pro Trp Tyr Lys Phe Asp Glu
165 170 175
Asn Tyr Ala Phe Leu His Arg Thr Leu Lys Glu Ile Leu Arg Tyr Leu
180 185 190
Met Asp Pro Asp Thr Phe Thr Phe Asn Phe Asn Asn Asp Pro Leu Val
195 200 205
Leu Arg Arg Arg Gln Thr Tyr Leu Cys Tyr Glu Val Glu Arg Leu Asp
210 215 220
Asn Gly Thr Trp Val Leu Met Asp Gln His Met Gly Phe Leu Cys Asn
225 230 235 240
Glu Ala Lys Asn Leu Leu Cys Gly Phe Tyr Gly Arg His Ala Glu Leu
245 250 255
Arg Phe Leu Asp Leu Val Pro Ser Leu Gln Leu Asp Pro Ala Gln Ile
260 265 270
Tyr Arg Val Thr Trp Phe Ile Ser Trp Ser Pro Cys Phe Ser Trp Gly
275 280 285
Cys Ala Gly Glu Val Arg Ala Phe Leu Gln Glu Asn Thr His Val Arg
290 295 300
Leu Arg Ile Phe Ala Ala Arg Ile Tyr Asp Tyr Asp Pro Leu Tyr Lys
305 310 315 320
Glu Ala Leu Gln Met Leu Arg Asp Ala Gly Ala Gln Val Ser Ile Met
325 330 335
Thr Tyr Asp Glu Phe Glu Tyr Cys Trp Asp Thr Phe Val Tyr Arg Gln
340 345 350
Gly Cys Pro Phe Gln Pro Trp Asp Gly Leu Glu Glu His Ser Gln Ala
355 360 365
Leu Ser Gly Arg Leu Arg Ala Ile Leu Gln Asn Gln Gly Asn
370 375 380
<210> 60
<211> 396
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 60
Met Gln Pro Gln Gly Leu Gly Pro Asn Ala Gly Met Gly Pro Val Cys
1 5 10 15
Leu Gly Cys Ser His Arg Arg Pro Tyr Ser Pro Ile Arg Asn Pro Leu
20 25 30
Lys Lys Leu Tyr Gln Gln Thr Phe Tyr Phe His Phe Lys Asn Val Arg
35 40 45
Tyr Ala Trp Gly Arg Lys Asn Asn Phe Leu Cys Tyr Glu Val Asn Gly
50 55 60
Met Asp Cys Ala Leu Pro Val Pro Leu Arg Gln Gly Val Phe Arg Lys
65 70 75 80
Gln Gly His Ile His Ala Glu Leu Cys Phe Ile Tyr Trp Phe His Asp
85 90 95
Lys Val Leu Arg Val Leu Ser Pro Met Glu Glu Phe Lys Val Thr Trp
100 105 110
Tyr Met Ser Trp Ser Pro Cys Ser Lys Cys Ala Glu Gln Val Ala Arg
115 120 125
Phe Leu Ala Ala His Arg Asn Leu Ser Leu Ala Ile Phe Ser Ser Arg
130 135 140
Leu Tyr Tyr Tyr Leu Arg Asn Pro Asn Tyr Gln Gln Lys Leu Cys Arg
145 150 155 160
Leu Ile Gln Glu Gly Val His Val Ala Ala Met Asp Leu Pro Glu Phe
165 170 175
Lys Lys Cys Trp Asn Lys Phe Val Asp Asn Asp Gly Gln Pro Phe Arg
180 185 190
Pro Trp Met Arg Leu Arg Ile Asn Phe Ser Phe Tyr Asp Cys Lys Leu
195 200 205
Gln Glu Ile Phe Ser Arg Met Asn Leu Leu Arg Glu Asp Val Phe Tyr
210 215 220
Leu Gln Phe Asn Asn Ser His Arg Val Lys Pro Val Gln Asn Arg Tyr
225 230 235 240
Tyr Arg Arg Lys Ser Tyr Leu Cys Tyr Gln Leu Glu Arg Ala Asn Gly
245 250 255
Gln Glu Pro Leu Lys Gly Tyr Leu Leu Tyr Lys Lys Gly Glu Gln His
260 265 270
Val Glu Ile Leu Phe Leu Glu Lys Met Arg Ser Met Glu Leu Ser Gln
275 280 285
Val Arg Ile Thr Cys Tyr Leu Thr Trp Ser Pro Cys Pro Asn Cys Ala
290 295 300
Arg Gln Leu Ala Ala Phe Lys Lys Asp His Pro Asp Leu Ile Leu Arg
305 310 315 320
Ile Tyr Thr Ser Arg Leu Tyr Phe Tyr Trp Arg Lys Lys Phe Gln Lys
325 330 335
Gly Leu Cys Thr Leu Trp Arg Ser Gly Ile His Val Asp Val Met Asp
340 345 350
Leu Pro Gln Phe Ala Asp Cys Trp Thr Asn Phe Val Asn Pro Gln Arg
355 360 365
Pro Phe Arg Pro Trp Asn Glu Leu Glu Lys Asn Ser Trp Arg Ile Gln
370 375 380
Arg Arg Leu Arg Arg Ile Lys Glu Ser Trp Gly Leu
385 390 395
<210> 61
<211> 227
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 61
Asp Gly Trp Glu Val Ala Phe Arg Ser Gly Thr Val Leu Lys Ala Gly
1 5 10 15
Val Leu Gly Val Ser Met Thr Glu Gly Trp Ala Gly Ser Gly His Pro
20 25 30
Gly Gln Gly Ala Cys Val Trp Thr Pro Gly Thr Arg Asn Thr Met Asn
35 40 45
Leu Leu Arg Glu Val Leu Phe Lys Gln Gln Phe Gly Asn Gln Pro Arg
50 55 60
Val Pro Ala Pro Tyr Tyr Arg Arg Lys Thr Tyr Leu Cys Tyr Gln Leu
65 70 75 80
Lys Gln Arg Asn Asp Leu Thr Leu Asp Arg Gly Cys Phe Arg Asn Lys
85 90 95
Lys Gln Arg His Ala Glu Ile Arg Phe Ile Asp Lys Ile Asn Ser Leu
100 105 110
Asp Leu Asn Pro Ser Gln Ser Tyr Lys Ile Ile Cys Tyr Ile Thr Trp
115 120 125
Ser Pro Cys Pro Asn Cys Ala Asn Glu Leu Val Asn Phe Ile Thr Arg
130 135 140
Asn Asn His Leu Lys Leu Glu Ile Phe Ala Ser Arg Leu Tyr Phe His
145 150 155 160
Trp Ile Lys Ser Phe Lys Met Gly Leu Gln Asp Leu Gln Asn Ala Gly
165 170 175
Ile Ser Val Ala Val Met Thr His Thr Glu Phe Glu Asp Cys Trp Glu
180 185 190
Gln Phe Val Asp Asn Gln Ser Arg Pro Phe Gln Pro Trp Asp Lys Leu
195 200 205
Glu Gln Tyr Ser Ala Ser Ile Arg Arg Arg Leu Gln Arg Ile Leu Thr
210 215 220
Ala Pro Ile
225
<210> 62
<211> 490
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 62
Met Asn Pro Gln Ile Arg Asn Pro Met Glu Trp Met Tyr Gln Arg Thr
1 5 10 15
Phe Tyr Tyr Asn Phe Glu Asn Glu Pro Ile Leu Tyr Gly Arg Ser Tyr
20 25 30
Thr Trp Leu Cys Tyr Glu Val Lys Ile Arg Arg Gly His Ser Asn Leu
35 40 45
Leu Trp Asp Thr Gly Val Phe Arg Gly Gln Met Tyr Ser Gln Pro Glu
50 55 60
His His Ala Glu Met Cys Phe Leu Ser Trp Phe Cys Gly Asn Gln Leu
65 70 75 80
Ser Ala Tyr Lys Cys Phe Gln Ile Thr Trp Phe Val Ser Trp Thr Pro
85 90 95
Cys Pro Asp Cys Val Ala Lys Leu Ala Lys Phe Leu Ala Glu His Pro
100 105 110
Asn Val Thr Leu Thr Ile Ser Ala Ala Arg Leu Tyr Tyr Tyr Trp Glu
115 120 125
Arg Asp Tyr Arg Arg Ala Leu Cys Arg Leu Ser Gln Ala Gly Ala Arg
130 135 140
Val Lys Ile Met Asp Asp Glu Glu Phe Ala Tyr Cys Trp Glu Asn Phe
145 150 155 160
Val Tyr Asn Glu Gly Gln Pro Phe Met Pro Trp Tyr Lys Phe Asp Asp
165 170 175
Asn Tyr Ala Phe Leu His Arg Thr Leu Lys Glu Ile Ile Arg His Leu
180 185 190
Met Asp Pro Asp Thr Phe Thr Phe Asn Phe Asn Asn Asp Pro Leu Val
195 200 205
Leu Arg Arg His Gln Thr Tyr Leu Cys Tyr Glu Val Glu Arg Leu Asp
210 215 220
Asn Gly Thr Trp Val Leu Met Asp Gln His Met Gly Phe Leu Cys Asn
225 230 235 240
Glu Ala Lys Asn Leu Leu Cys Gly Phe Tyr Gly Arg His Ala Glu Leu
245 250 255
Arg Phe Leu Asp Leu Val Pro Ser Leu Gln Leu Asp Pro Ala Gln Ile
260 265 270
Tyr Arg Val Thr Trp Phe Ile Ser Trp Ser Pro Cys Phe Ser Trp Gly
275 280 285
Cys Ala Gly Gln Val Arg Ala Phe Leu Gln Glu Asn Thr His Val Arg
290 295 300
Leu Arg Ile Phe Ala Ala Arg Ile Tyr Asp Tyr Asp Pro Leu Tyr Lys
305 310 315 320
Glu Ala Leu Gln Met Leu Arg Asp Ala Gly Ala Gln Val Ser Ile Met
325 330 335
Thr Tyr Asp Glu Phe Glu Tyr Cys Trp Asp Thr Phe Val Tyr Arg Gln
340 345 350
Gly Cys Pro Phe Gln Pro Trp Asp Gly Leu Glu Glu His Ser Gln Ala
355 360 365
Leu Ser Gly Arg Leu Arg Ala Ile Leu Gln Val Arg Ala Ser Ser Leu
370 375 380
Cys Met Val Pro His Arg Pro Pro Pro Pro Pro Gln Ser Pro Gly Pro
385 390 395 400
Cys Leu Pro Leu Cys Ser Glu Pro Pro Leu Gly Ser Leu Leu Pro Thr
405 410 415
Gly Arg Pro Ala Pro Ser Leu Pro Phe Leu Leu Thr Ala Ser Phe Ser
420 425 430
Phe Pro Pro Pro Ala Ser Leu Pro Pro Leu Pro Ser Leu Ser Leu Ser
435 440 445
Pro Gly His Leu Pro Val Pro Ser Phe His Ser Leu Thr Ser Cys Ser
450 455 460
Ile Gln Pro Pro Cys Ser Ser Arg Ile Arg Glu Thr Glu Gly Trp Ala
465 470 475 480
Ser Val Ser Lys Glu Gly Arg Asp Leu Gly
485 490
<210> 63
<211> 190
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 63
Met Asn Pro Gln Ile Arg Asn Pro Met Lys Ala Met Tyr Pro Gly Thr
1 5 10 15
Phe Tyr Phe Gln Phe Lys Asn Leu Trp Glu Ala Asn Asp Arg Asn Glu
20 25 30
Thr Trp Leu Cys Phe Thr Val Glu Gly Ile Lys Arg Arg Ser Val Val
35 40 45
Ser Trp Lys Thr Gly Val Phe Arg Asn Gln Val Asp Ser Glu Thr His
50 55 60
Cys His Ala Glu Arg Cys Phe Leu Ser Trp Phe Cys Asp Asp Ile Leu
65 70 75 80
Ser Pro Asn Thr Lys Tyr Gln Val Thr Trp Tyr Thr Ser Trp Ser Pro
85 90 95
Cys Pro Asp Cys Ala Gly Glu Val Ala Glu Phe Leu Ala Arg His Ser
100 105 110
Asn Val Asn Leu Thr Ile Phe Thr Ala Arg Leu Tyr Tyr Phe Gln Tyr
115 120 125
Pro Cys Tyr Gln Glu Gly Leu Arg Ser Leu Ser Gln Glu Gly Val Ala
130 135 140
Val Glu Ile Met Asp Tyr Glu Asp Phe Lys Tyr Cys Trp Glu Asn Phe
145 150 155 160
Val Tyr Asn Asp Asn Glu Pro Phe Lys Pro Trp Lys Gly Leu Lys Thr
165 170 175
Asn Phe Arg Leu Leu Lys Arg Arg Leu Arg Glu Ser Leu Gln
180 185 190
<210> 64
<211> 190
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 64
Met Asn Pro Gln Ile Arg Asn Pro Met Lys Ala Met Tyr Pro Gly Thr
1 5 10 15
Phe Tyr Phe Gln Phe Lys Asn Leu Trp Glu Ala Asn Asp Arg Asn Glu
20 25 30
Thr Trp Leu Cys Phe Thr Val Glu Gly Ile Lys Arg Arg Ser Val Val
35 40 45
Ser Trp Lys Thr Gly Val Phe Arg Asn Gln Val Asp Ser Glu Thr His
50 55 60
Cys His Ala Glu Arg Cys Phe Leu Ser Trp Phe Cys Asp Asp Ile Leu
65 70 75 80
Ser Pro Asn Thr Asn Tyr Gln Val Thr Trp Tyr Thr Ser Trp Ser Pro
85 90 95
Cys Pro Glu Cys Ala Gly Glu Val Ala Glu Phe Leu Ala Arg His Ser
100 105 110
Asn Val Asn Leu Thr Ile Phe Thr Ala Arg Leu Tyr Tyr Phe Gln Asp
115 120 125
Thr Asp Tyr Gln Glu Gly Leu Arg Ser Leu Ser Gln Glu Gly Val Ala
130 135 140
Val Lys Ile Met Asp Tyr Lys Asp Phe Lys Tyr Cys Trp Glu Asn Phe
145 150 155 160
Val Tyr Asn Asp Asp Glu Pro Phe Lys Pro Trp Lys Gly Leu Lys Tyr
165 170 175
Asn Phe Arg Phe Leu Lys Arg Arg Leu Gln Glu Ile Leu Glu
180 185 190
<210> 65
<211> 199
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 65
Met Glu Ala Ser Pro Ala Ser Gly Pro Arg His Leu Met Asp Pro His
1 5 10 15
Ile Phe Thr Ser Asn Phe Asn Asn Gly Ile Gly Arg His Lys Thr Tyr
20 25 30
Leu Cys Tyr Glu Val Glu Arg Leu Asp Asn Gly Thr Ser Val Lys Met
35 40 45
Asp Gln His Arg Gly Phe Leu His Asn Gln Ala Lys Asn Leu Leu Cys
50 55 60
Gly Phe Tyr Gly Arg His Ala Glu Leu Arg Phe Leu Asp Leu Val Pro
65 70 75 80
Ser Leu Gln Leu Asp Pro Ala Gln Ile Tyr Arg Val Thr Trp Phe Ile
85 90 95
Ser Trp Ser Pro Cys Phe Ser Trp Gly Cys Ala Gly Glu Val Arg Ala
100 105 110
Phe Leu Gln Glu Asn Thr His Val Arg Leu Arg Ile Phe Ala Ala Arg
115 120 125
Ile Tyr Asp Tyr Asp Pro Leu Tyr Lys Glu Ala Leu Gln Met Leu Arg
130 135 140
Asp Ala Gly Ala Gln Val Ser Ile Met Thr Tyr Asp Glu Phe Lys His
145 150 155 160
Cys Trp Asp Thr Phe Val Asp His Gln Gly Cys Pro Phe Gln Pro Trp
165 170 175
Asp Gly Leu Asp Glu His Ser Gln Ala Leu Ser Gly Arg Leu Arg Ala
180 185 190
Ile Leu Gln Asn Gln Gly Asn
195
<210> 66
<211> 202
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 66
Met Asp Gly Ser Pro Ala Ser Arg Pro Arg His Leu Met Asp Pro Asn
1 5 10 15
Thr Phe Thr Phe Asn Phe Asn Asn Asp Leu Ser Val Arg Gly Arg His
20 25 30
Gln Thr Tyr Leu Cys Tyr Glu Val Glu Arg Leu Asp Asn Gly Thr Trp
35 40 45
Val Pro Met Asp Glu Arg Arg Gly Phe Leu Cys Asn Lys Ala Lys Asn
50 55 60
Val Pro Cys Gly Asp Tyr Gly Cys His Val Glu Leu Arg Phe Leu Cys
65 70 75 80
Glu Val Pro Ser Trp Gln Leu Asp Pro Ala Gln Thr Tyr Arg Val Thr
85 90 95
Trp Phe Ile Ser Trp Ser Pro Cys Phe Arg Arg Gly Cys Ala Gly Gln
100 105 110
Val Arg Val Phe Leu Gln Glu Asn Lys His Val Arg Leu Arg Ile Phe
115 120 125
Ala Ala Arg Ile Tyr Asp Tyr Asp Pro Leu Tyr Gln Glu Ala Leu Arg
130 135 140
Thr Leu Arg Asp Ala Gly Ala Gln Val Ser Ile Met Thr Tyr Glu Glu
145 150 155 160
Phe Lys His Cys Trp Asp Thr Phe Val Asp Arg Gln Gly Arg Pro Phe
165 170 175
Gln Pro Trp Asp Gly Leu Asp Glu His Ser Gln Ala Leu Ser Gly Arg
180 185 190
Leu Arg Ala Ile Leu Gln Asn Gln Gly Asn
195 200
<210> 67
<211> 185
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 67
Met Asp Glu Tyr Thr Phe Thr Glu Asn Phe Asn Asn Gln Gly Trp Pro
1 5 10 15
Ser Lys Thr Tyr Leu Cys Tyr Glu Met Glu Arg Leu Asp Gly Asp Ala
20 25 30
Thr Ile Pro Leu Asp Glu Tyr Lys Gly Phe Val Arg Asn Lys Gly Leu
35 40 45
Asp Gln Pro Glu Lys Pro Cys His Ala Glu Leu Tyr Phe Leu Gly Lys
50 55 60
Ile His Ser Trp Asn Leu Asp Arg Asn Gln His Tyr Arg Leu Thr Cys
65 70 75 80
Phe Ile Ser Trp Ser Pro Cys Tyr Asp Cys Ala Gln Lys Leu Thr Thr
85 90 95
Phe Leu Lys Glu Asn His His Ile Ser Leu His Ile Leu Ala Ser Arg
100 105 110
Ile Tyr Thr His Asn Arg Phe Gly Cys His Gln Ser Gly Leu Cys Glu
115 120 125
Leu Gln Ala Ala Gly Ala Arg Ile Thr Ile Met Thr Phe Glu Asp Phe
130 135 140
Lys His Cys Trp Glu Thr Phe Val Asp His Lys Gly Lys Pro Phe Gln
145 150 155 160
Pro Trp Glu Gly Leu Asn Val Lys Ser Gln Ala Leu Cys Thr Glu Leu
165 170 175
Gln Ala Ile Leu Lys Thr Gln Gln Asn
180 185
<210> 68
<211> 200
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 68
Met Ala Leu Leu Thr Ala Glu Thr Phe Arg Leu Gln Phe Asn Asn Lys
1 5 10 15
Arg Arg Leu Arg Arg Pro Tyr Tyr Pro Arg Lys Ala Leu Leu Cys Tyr
20 25 30
Gln Leu Thr Pro Gln Asn Gly Ser Thr Pro Thr Arg Gly Tyr Phe Glu
35 40 45
Asn Lys Lys Lys Cys His Ala Glu Ile Cys Phe Ile Asn Glu Ile Lys
50 55 60
Ser Met Gly Leu Asp Glu Thr Gln Cys Tyr Gln Val Thr Cys Tyr Leu
65 70 75 80
Thr Trp Ser Pro Cys Ser Ser Cys Ala Trp Glu Leu Val Asp Phe Ile
85 90 95
Lys Ala His Asp His Leu Asn Leu Gly Ile Phe Ala Ser Arg Leu Tyr
100 105 110
Tyr His Trp Cys Lys Pro Gln Gln Lys Gly Leu Arg Leu Leu Cys Gly
115 120 125
Ser Gln Val Pro Val Glu Val Met Gly Phe Pro Lys Phe Ala Asp Cys
130 135 140
Trp Glu Asn Phe Val Asp His Glu Lys Pro Leu Ser Phe Asn Pro Tyr
145 150 155 160
Lys Met Leu Glu Glu Leu Asp Lys Asn Ser Arg Ala Ile Lys Arg Arg
165 170 175
Leu Glu Arg Ile Lys Ile Pro Gly Val Arg Ala Gln Gly Arg Tyr Met
180 185 190
Asp Ile Leu Cys Asp Ala Glu Val
195 200
<210> 69
<211> 210
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 69
Met Ala Leu Leu Thr Ala Lys Thr Phe Ser Leu Gln Phe Asn Asn Lys
1 5 10 15
Arg Arg Val Asn Lys Pro Tyr Tyr Pro Arg Lys Ala Leu Leu Cys Tyr
20 25 30
Gln Leu Thr Pro Gln Asn Gly Ser Thr Pro Thr Arg Gly His Leu Lys
35 40 45
Asn Lys Lys Lys Asp His Ala Glu Ile Arg Phe Ile Asn Lys Ile Lys
50 55 60
Ser Met Gly Leu Asp Glu Thr Gln Cys Tyr Gln Val Thr Cys Tyr Leu
65 70 75 80
Thr Trp Ser Pro Cys Pro Ser Cys Ala Gly Glu Leu Val Asp Phe Ile
85 90 95
Lys Ala His Arg His Leu Asn Leu Arg Ile Phe Ala Ser Arg Leu Tyr
100 105 110
Tyr His Trp Arg Pro Asn Tyr Gln Glu Gly Leu Leu Leu Leu Cys Gly
115 120 125
Ser Gln Val Pro Val Glu Val Met Gly Leu Pro Glu Phe Thr Asp Cys
130 135 140
Trp Glu Asn Phe Val Asp His Lys Glu Pro Pro Ser Phe Asn Pro Ser
145 150 155 160
Glu Lys Leu Glu Glu Leu Asp Lys Asn Ser Gln Ala Ile Lys Arg Arg
165 170 175
Leu Glu Arg Ile Lys Ser Arg Ser Val Asp Val Leu Glu Asn Gly Leu
180 185 190
Arg Ser Leu Gln Leu Gly Pro Val Thr Pro Ser Ser Ser Ile Arg Asn
195 200 205
Ser Arg
210
<210> 70
<211> 386
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 70
Met Asn Pro Gln Ile Arg Asn Pro Met Glu Arg Met Tyr Arg Asp Thr
1 5 10 15
Phe Tyr Asp Asn Phe Glu Asn Glu Pro Ile Leu Tyr Gly Arg Ser Tyr
20 25 30
Thr Trp Leu Cys Tyr Glu Val Lys Ile Lys Arg Gly Arg Ser Asn Leu
35 40 45
Leu Trp Asp Thr Gly Val Phe Arg Gly Pro Val Leu Pro Lys Arg Gln
50 55 60
Ser Asn His Arg Gln Glu Val Tyr Phe Arg Phe Glu Asn His Ala Glu
65 70 75 80
Met Cys Phe Leu Ser Trp Phe Cys Gly Asn Arg Leu Pro Ala Asn Arg
85 90 95
Arg Phe Gln Ile Thr Trp Phe Val Ser Trp Asn Pro Cys Leu Pro Cys
100 105 110
Val Val Lys Val Thr Lys Phe Leu Ala Glu His Pro Asn Val Thr Leu
115 120 125
Thr Ile Ser Ala Ala Arg Leu Tyr Tyr Tyr Arg Asp Arg Asp Trp Arg
130 135 140
Trp Val Leu Leu Arg Leu His Lys Ala Gly Ala Arg Val Lys Ile Met
145 150 155 160
Asp Tyr Glu Asp Phe Ala Tyr Cys Trp Glu Asn Phe Val Cys Asn Glu
165 170 175
Gly Gln Pro Phe Met Pro Trp Tyr Lys Phe Asp Asp Asn Tyr Ala Ser
180 185 190
Leu His Arg Thr Leu Lys Glu Ile Leu Arg Asn Pro Met Glu Ala Met
195 200 205
Tyr Pro His Ile Phe Tyr Phe His Phe Lys Asn Leu Leu Lys Ala Cys
210 215 220
Gly Arg Asn Glu Ser Trp Leu Cys Phe Thr Met Glu Val Thr Lys His
225 230 235 240
His Ser Ala Val Phe Arg Lys Arg Gly Val Phe Arg Asn Gln Val Asp
245 250 255
Pro Glu Thr His Cys His Ala Glu Arg Cys Phe Leu Ser Trp Phe Cys
260 265 270
Asp Asp Ile Leu Ser Pro Asn Thr Asn Tyr Glu Val Thr Trp Tyr Thr
275 280 285
Ser Trp Ser Pro Cys Pro Glu Cys Ala Gly Glu Val Ala Glu Phe Leu
290 295 300
Ala Arg His Ser Asn Val Asn Leu Thr Ile Phe Thr Ala Arg Leu Cys
305 310 315 320
Tyr Phe Trp Asp Thr Asp Tyr Gln Glu Gly Leu Cys Ser Leu Ser Gln
325 330 335
Glu Gly Ala Ser Val Lys Ile Met Gly Tyr Lys Asp Phe Val Ser Cys
340 345 350
Trp Lys Asn Phe Val Tyr Ser Asp Asp Glu Pro Phe Lys Pro Trp Lys
355 360 365
Gly Leu Gln Thr Asn Phe Arg Leu Leu Lys Arg Arg Leu Arg Glu Ile
370 375 380
Leu Gln
385
<210> 71
<211> 236
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 71
Met Thr Ser Glu Lys Gly Pro Ser Thr Gly Asp Pro Thr Leu Arg Arg
1 5 10 15
Arg Ile Glu Pro Trp Glu Phe Asp Val Phe Tyr Asp Pro Arg Glu Leu
20 25 30
Arg Lys Glu Ala Cys Leu Leu Tyr Glu Ile Lys Trp Gly Met Ser Arg
35 40 45
Lys Ile Trp Arg Ser Ser Gly Lys Asn Thr Thr Asn His Val Glu Val
50 55 60
Asn Phe Ile Lys Lys Phe Thr Ser Glu Arg Asp Phe His Pro Ser Met
65 70 75 80
Ser Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Trp Glu Cys
85 90 95
Ser Gln Ala Ile Arg Glu Phe Leu Ser Arg His Pro Gly Val Thr Leu
100 105 110
Val Ile Tyr Val Ala Arg Leu Phe Trp His Met Asp Gln Gln Asn Arg
115 120 125
Gln Gly Leu Arg Asp Leu Val Asn Ser Gly Val Thr Ile Gln Ile Met
130 135 140
Arg Ala Ser Glu Tyr Tyr His Cys Trp Arg Asn Phe Val Asn Tyr Pro
145 150 155 160
Pro Gly Asp Glu Ala His Trp Pro Gln Tyr Pro Pro Leu Trp Met Met
165 170 175
Leu Tyr Ala Leu Glu Leu His Cys Ile Ile Leu Ser Leu Pro Pro Cys
180 185 190
Leu Lys Ile Ser Arg Arg Trp Gln Asn His Leu Thr Phe Phe Arg Leu
195 200 205
His Leu Gln Asn Cys His Tyr Gln Thr Ile Pro Pro His Ile Leu Leu
210 215 220
Ala Thr Gly Leu Ile His Pro Ser Val Ala Trp Arg
225 230 235
<210> 72
<211> 229
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 72
Met Ser Ser Glu Thr Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg
1 5 10 15
Arg Ile Glu Pro His Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu
20 25 30
Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile Asn Trp Gly Gly Arg His
35 40 45
Ser Val Trp Arg His Thr Ser Gln Asn Thr Ser Asn His Val Glu Val
50 55 60
Asn Phe Leu Glu Lys Phe Thr Thr Glu Arg Tyr Phe Arg Pro Asn Thr
65 70 75 80
Arg Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys
85 90 95
Ser Arg Ala Ile Thr Glu Phe Leu Ser Arg His Pro Tyr Val Thr Leu
100 105 110
Phe Ile Tyr Ile Ala Arg Leu Tyr His His Thr Asp Gln Arg Asn Arg
115 120 125
Gln Gly Leu Arg Asp Leu Ile Ser Ser Gly Val Thr Ile Gln Ile Met
130 135 140
Thr Glu Gln Glu Tyr Cys Tyr Cys Trp Arg Asn Phe Val Asn Tyr Pro
145 150 155 160
Pro Ser Asn Glu Ala Tyr Trp Pro Arg Tyr Pro His Leu Trp Val Lys
165 170 175
Leu Tyr Val Leu Glu Leu Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys
180 185 190
Leu Lys Ile Leu Arg Arg Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile
195 200 205
Thr Leu Gln Thr Cys His Tyr Gln Arg Ile Pro Pro His Leu Leu Trp
210 215 220
Ala Thr Gly Leu Lys
225
<210> 73
<211> 229
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 73
Met Ser Ser Glu Thr Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg
1 5 10 15
Arg Ile Glu Pro His Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu
20 25 30
Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile Asn Trp Gly Gly Arg His
35 40 45
Ser Ile Trp Arg His Thr Ser Gln Asn Thr Asn Lys His Val Glu Val
50 55 60
Asn Phe Ile Glu Lys Phe Thr Thr Glu Arg Tyr Phe Cys Pro Asn Thr
65 70 75 80
Arg Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys
85 90 95
Ser Arg Ala Ile Thr Glu Phe Leu Ser Arg Tyr Pro His Val Thr Leu
100 105 110
Phe Ile Tyr Ile Ala Arg Leu Tyr His His Ala Asp Pro Arg Asn Arg
115 120 125
Gln Gly Leu Arg Asp Leu Ile Ser Ser Gly Val Thr Ile Gln Ile Met
130 135 140
Thr Glu Gln Glu Ser Gly Tyr Cys Trp Arg Asn Phe Val Asn Tyr Ser
145 150 155 160
Pro Ser Asn Glu Ala His Trp Pro Arg Tyr Pro His Leu Trp Val Arg
165 170 175
Leu Tyr Val Leu Glu Leu Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys
180 185 190
Leu Asn Ile Leu Arg Arg Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile
195 200 205
Ala Leu Gln Ser Cys His Tyr Gln Arg Leu Pro Pro His Ile Leu Trp
210 215 220
Ala Thr Gly Leu Lys
225
<210> 74
<211> 224
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 74
Met Ala Gln Lys Glu Glu Ala Ala Val Ala Thr Glu Ala Ala Ser Gln
1 5 10 15
Asn Gly Glu Asp Leu Glu Asn Leu Asp Asp Pro Glu Lys Leu Lys Glu
20 25 30
Leu Ile Glu Leu Pro Pro Phe Glu Ile Val Thr Gly Glu Arg Leu Pro
35 40 45
Ala Asn Phe Phe Lys Phe Gln Phe Arg Asn Val Glu Tyr Ser Ser Gly
50 55 60
Arg Asn Lys Thr Phe Leu Cys Tyr Val Val Glu Ala Gln Gly Lys Gly
65 70 75 80
Gly Gln Val Gln Ala Ser Arg Gly Tyr Leu Glu Asp Glu His Ala Ala
85 90 95
Ala His Ala Glu Glu Ala Phe Phe Asn Thr Ile Leu Pro Ala Phe Asp
100 105 110
Pro Ala Leu Arg Tyr Asn Val Thr Trp Tyr Val Ser Ser Ser Pro Cys
115 120 125
Ala Ala Cys Ala Asp Arg Ile Ile Lys Thr Leu Ser Lys Thr Lys Asn
130 135 140
Leu Arg Leu Leu Ile Leu Val Gly Arg Leu Phe Met Trp Glu Glu Pro
145 150 155 160
Glu Ile Gln Ala Ala Leu Lys Lys Leu Lys Glu Ala Gly Cys Lys Leu
165 170 175
Arg Ile Met Lys Pro Gln Asp Phe Glu Tyr Val Trp Gln Asn Phe Val
180 185 190
Glu Gln Glu Glu Gly Glu Ser Lys Ala Phe Gln Pro Trp Glu Asp Ile
195 200 205
Gln Glu Asn Phe Leu Tyr Tyr Glu Glu Lys Leu Ala Asp Ile Leu Lys
210 215 220
<210> 75
<211> 224
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 75
Met Ala Gln Lys Glu Glu Ala Ala Glu Ala Ala Ala Pro Ala Ser Gln
1 5 10 15
Asn Gly Asp Asp Leu Glu Asn Leu Glu Asp Pro Glu Lys Leu Lys Glu
20 25 30
Leu Ile Asp Leu Pro Pro Phe Glu Ile Val Thr Gly Val Arg Leu Pro
35 40 45
Val Asn Phe Phe Lys Phe Gln Phe Arg Asn Val Glu Tyr Ser Ser Gly
50 55 60
Arg Asn Lys Thr Phe Leu Cys Tyr Val Val Glu Val Gln Ser Lys Gly
65 70 75 80
Gly Gln Ala Gln Ala Thr Gln Gly Tyr Leu Glu Asp Glu His Ala Gly
85 90 95
Ala His Ala Glu Glu Ala Phe Phe Asn Thr Ile Leu Pro Ala Phe Asp
100 105 110
Pro Ala Leu Lys Tyr Asn Val Thr Trp Tyr Val Ser Ser Ser Pro Cys
115 120 125
Ala Ala Cys Ala Asp Arg Ile Leu Lys Thr Leu Ser Lys Thr Lys Asn
130 135 140
Leu Arg Leu Leu Ile Leu Val Ser Arg Leu Phe Met Trp Glu Glu Pro
145 150 155 160
Glu Val Gln Ala Ala Leu Lys Lys Leu Lys Glu Ala Gly Cys Lys Leu
165 170 175
Arg Ile Met Lys Pro Gln Asp Phe Glu Tyr Ile Trp Gln Asn Phe Val
180 185 190
Glu Gln Glu Glu Gly Glu Ser Lys Ala Phe Glu Pro Trp Glu Asp Ile
195 200 205
Gln Glu Asn Phe Leu Tyr Tyr Glu Glu Lys Leu Ala Asp Ile Leu Lys
210 215 220
<210> 76
<211> 224
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 76
Met Ala Gln Lys Glu Glu Ala Ala Glu Ala Ala Ala Pro Ala Ser Gln
1 5 10 15
Asn Gly Asp Asp Leu Glu Asn Leu Glu Asp Pro Glu Lys Leu Lys Glu
20 25 30
Leu Ile Asp Leu Pro Pro Phe Glu Ile Val Thr Gly Val Arg Leu Pro
35 40 45
Val Asn Phe Phe Lys Phe Gln Phe Arg Asn Val Glu Tyr Ser Ser Gly
50 55 60
Arg Asn Lys Thr Phe Leu Cys Tyr Val Val Glu Ala Gln Ser Lys Gly
65 70 75 80
Gly Gln Val Gln Ala Thr Gln Gly Tyr Leu Glu Asp Glu His Ala Gly
85 90 95
Ala His Ala Glu Glu Ala Phe Phe Asn Thr Ile Leu Pro Ala Phe Asp
100 105 110
Pro Ala Leu Lys Tyr Asn Val Thr Trp Tyr Val Ser Ser Ser Pro Cys
115 120 125
Ala Ala Cys Ala Asp Arg Ile Leu Lys Thr Leu Ser Lys Thr Lys Asn
130 135 140
Leu Arg Leu Leu Ile Leu Val Ser Arg Leu Phe Met Trp Glu Glu Pro
145 150 155 160
Glu Val Gln Ala Ala Leu Lys Lys Leu Lys Glu Ala Gly Cys Lys Leu
165 170 175
Arg Ile Met Lys Pro Gln Asp Phe Glu Tyr Leu Trp Gln Asn Phe Val
180 185 190
Glu Gln Glu Glu Gly Glu Ser Lys Ala Phe Glu Pro Trp Glu Asp Ile
195 200 205
Gln Glu Asn Phe Leu Tyr Tyr Glu Glu Lys Leu Ala Asp Ile Leu Lys
210 215 220
<210> 77
<211> 224
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 77
Met Ala Gln Lys Glu Glu Ala Ala Ala Ala Ala Glu Pro Ala Ser Gln
1 5 10 15
Asn Gly Glu Glu Val Glu Asn Leu Glu Asp Pro Glu Lys Leu Lys Glu
20 25 30
Leu Ile Glu Leu Pro Pro Phe Glu Ile Val Thr Gly Glu Arg Leu Pro
35 40 45
Ala His Tyr Phe Lys Phe Gln Phe Arg Asn Val Glu Tyr Ser Ser Gly
50 55 60
Arg Asn Lys Thr Phe Leu Cys Tyr Val Val Glu Ala Gln Ser Lys Gly
65 70 75 80
Gly Gln Val Gln Ala Ser Arg Gly Tyr Leu Glu Asp Glu His Ala Thr
85 90 95
Asn His Ala Glu Glu Ala Phe Phe Asn Ser Ile Met Pro Thr Phe Asp
100 105 110
Pro Ala Leu Arg Tyr Met Val Thr Trp Tyr Val Ser Ser Ser Pro Cys
115 120 125
Ala Ala Cys Ala Asp Arg Ile Val Lys Thr Leu Asn Lys Thr Lys Asn
130 135 140
Leu Arg Leu Leu Ile Leu Val Gly Arg Leu Phe Met Trp Glu Glu Pro
145 150 155 160
Glu Ile Gln Ala Ala Leu Arg Lys Leu Lys Glu Ala Gly Cys Arg Leu
165 170 175
Arg Ile Met Lys Pro Gln Asp Phe Glu Tyr Ile Trp Gln Asn Phe Val
180 185 190
Glu Gln Glu Glu Gly Glu Ser Lys Ala Phe Glu Pro Trp Glu Asp Ile
195 200 205
Gln Glu Asn Phe Leu Tyr Tyr Glu Glu Lys Leu Ala Asp Ile Leu Lys
210 215 220
<210> 78
<211> 208
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 78
Met Thr Asp Ala Glu Tyr Val Arg Ile His Glu Lys Leu Asp Ile Tyr
1 5 10 15
Thr Phe Lys Lys Gln Phe Phe Asn Asn Lys Lys Ser Val Ser His Arg
20 25 30
Cys Tyr Val Leu Phe Glu Leu Lys Arg Arg Gly Glu Arg Arg Ala Cys
35 40 45
Phe Trp Gly Tyr Ala Val Asn Lys Pro Gln Ser Gly Thr Glu Arg Gly
50 55 60
Ile His Ala Glu Ile Phe Ser Ile Arg Lys Val Glu Glu Tyr Leu Arg
65 70 75 80
Asp Asn Pro Gly Gln Phe Thr Ile Asn Trp Tyr Ser Ser Trp Ser Pro
85 90 95
Cys Ala Asp Cys Ala Glu Lys Ile Leu Glu Trp Tyr Asn Gln Glu Leu
100 105 110
Arg Gly Asn Gly His Thr Leu Lys Ile Trp Ala Cys Lys Leu Tyr Tyr
115 120 125
Glu Lys Asn Ala Arg Asn Gln Ile Gly Leu Trp Asn Leu Arg Asp Asn
130 135 140
Gly Val Gly Leu Asn Val Met Val Ser Glu His Tyr Gln Cys Cys Arg
145 150 155 160
Lys Ile Phe Ile Gln Ser Ser His Asn Gln Leu Asn Glu Asn Arg Trp
165 170 175
Leu Glu Lys Thr Leu Lys Arg Ala Glu Lys Arg Arg Ser Glu Leu Ser
180 185 190
Ile Met Ile Gln Val Lys Ile Leu His Thr Thr Lys Ser Pro Ala Val
195 200 205
<210> 79
<211> 384
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 79
Met Lys Pro His Phe Arg Asn Thr Val Glu Arg Met Tyr Arg Asp Thr
1 5 10 15
Phe Ser Tyr Asn Phe Tyr Asn Arg Pro Ile Leu Ser Arg Arg Asn Thr
20 25 30
Val Trp Leu Cys Tyr Glu Val Lys Thr Lys Gly Pro Ser Arg Pro Pro
35 40 45
Leu Asp Ala Lys Ile Phe Arg Gly Gln Val Tyr Ser Glu Leu Lys Tyr
50 55 60
His Pro Glu Met Arg Phe Phe His Trp Phe Ser Lys Trp Arg Lys Leu
65 70 75 80
His Arg Asp Gln Glu Tyr Glu Val Thr Trp Tyr Ile Ser Trp Ser Pro
85 90 95
Cys Thr Lys Cys Thr Arg Asp Met Ala Thr Phe Leu Ala Glu Asp Pro
100 105 110
Lys Val Thr Leu Thr Ile Phe Val Ala Arg Leu Tyr Tyr Phe Trp Asp
115 120 125
Pro Asp Tyr Gln Glu Ala Leu Arg Ser Leu Cys Gln Lys Arg Asp Gly
130 135 140
Pro Arg Ala Thr Met Lys Ile Met Asn Tyr Asp Glu Phe Gln His Cys
145 150 155 160
Trp Ser Lys Phe Val Tyr Ser Gln Arg Glu Leu Phe Glu Pro Trp Asn
165 170 175
Asn Leu Pro Lys Tyr Tyr Ile Leu Leu His Ile Met Leu Gly Glu Ile
180 185 190
Leu Arg His Ser Met Asp Pro Pro Thr Phe Thr Phe Asn Phe Asn Asn
195 200 205
Glu Pro Trp Val Arg Gly Arg His Glu Thr Tyr Leu Cys Tyr Glu Val
210 215 220
Glu Arg Met His Asn Asp Thr Trp Val Leu Leu Asn Gln Arg Arg Gly
225 230 235 240
Phe Leu Cys Asn Gln Ala Pro His Lys His Gly Phe Leu Glu Gly Arg
245 250 255
His Ala Glu Leu Cys Phe Leu Asp Val Ile Pro Phe Trp Lys Leu Asp
260 265 270
Leu Asp Gln Asp Tyr Arg Val Thr Cys Phe Thr Ser Trp Ser Pro Cys
275 280 285
Phe Ser Cys Ala Gln Glu Met Ala Lys Phe Ile Ser Lys Asn Lys His
290 295 300
Val Ser Leu Cys Ile Phe Thr Ala Arg Ile Tyr Arg Arg Gln Gly Arg
305 310 315 320
Cys Gln Glu Gly Leu Arg Thr Leu Ala Glu Ala Gly Ala Lys Ile Ser
325 330 335
Ile Met Thr Tyr Ser Glu Phe Lys His Cys Trp Asp Thr Phe Val Asp
340 345 350
His Gln Gly Cys Pro Phe Gln Pro Trp Asp Gly Leu Asp Glu His Ser
355 360 365
Gln Asp Leu Ser Gly Arg Leu Arg Ala Ile Leu Gln Asn Gln Glu Asn
370 375 380
<210> 80
<211> 184
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 80
Met Asp Pro Pro Thr Phe Thr Phe Asn Phe Asn Asn Glu Pro Trp Val
1 5 10 15
Arg Gly Arg His Glu Thr Tyr Leu Cys Tyr Glu Val Glu Arg Met His
20 25 30
Asn Asp Thr Trp Val Leu Leu Asn Gln Arg Arg Gly Phe Leu Cys Asn
35 40 45
Gln Ala Pro His Lys His Gly Phe Leu Glu Gly Arg His Ala Glu Leu
50 55 60
Cys Phe Leu Asp Val Ile Pro Phe Trp Lys Leu Asp Leu Asp Gln Asp
65 70 75 80
Tyr Arg Val Thr Cys Phe Thr Ser Trp Ser Pro Cys Phe Ser Cys Ala
85 90 95
Gln Glu Met Ala Lys Phe Ile Ser Lys Asn Lys His Val Ser Leu Cys
100 105 110
Ile Phe Thr Ala Arg Ile Tyr Asp Asp Gln Gly Arg Cys Gln Glu Gly
115 120 125
Leu Arg Thr Leu Ala Glu Ala Gly Ala Lys Ile Ser Ile Met Thr Tyr
130 135 140
Ser Glu Phe Lys His Cys Trp Asp Thr Phe Val Asp His Gln Gly Cys
145 150 155 160
Pro Phe Gln Pro Trp Asp Gly Leu Asp Glu His Ser Gln Asp Leu Ser
165 170 175
Gly Arg Leu Arg Ala Ile Leu Gln
180
<210> 81
<211> 184
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 81
Met Asp Pro Pro Thr Phe Thr Phe Asn Phe Asn Asn Glu Pro Trp Val
1 5 10 15
Arg Gly Arg His Glu Thr Tyr Leu Cys Tyr Glu Val Glu Arg Met His
20 25 30
Asn Asp Thr Trp Val Leu Leu Asn Gln Arg Arg Gly Phe Leu Cys Asn
35 40 45
Gln Ala Pro His Lys His Gly Phe Leu Glu Gly Arg His Ala Glu Leu
50 55 60
Cys Phe Leu Asp Val Ile Pro Phe Trp Lys Leu Asp Leu Asp Gln Asp
65 70 75 80
Tyr Arg Val Thr Cys Phe Thr Ser Trp Ser Pro Cys Phe Ser Cys Ala
85 90 95
Gln Glu Met Ala Lys Phe Ile Ser Lys Asn Lys His Val Ser Leu Cys
100 105 110
Ile Phe Thr Ala Arg Ile Tyr Arg Arg Gln Gly Arg Cys Gln Glu Gly
115 120 125
Leu Arg Thr Leu Ala Glu Ala Gly Ala Lys Ile Ser Ile Met Thr Tyr
130 135 140
Ser Glu Phe Lys His Cys Trp Asp Thr Phe Val Asp His Gln Gly Cys
145 150 155 160
Pro Phe Gln Pro Trp Asp Gly Leu Asp Glu His Ser Gln Asp Leu Ser
165 170 175
Gly Arg Leu Arg Ala Ile Leu Gln
180
<210> 82
<211> 36
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<220>
<221> misc_feature
<222> (2)..(2)
<223> Xaa可为任何天然氨基酸
<220>
<221> misc_feature
<222> (4)..(29)
<223> Xaa可为任何天然氨基酸
<220>
<221> misc_feature
<222> (27)..(29)
<223> 可能不存在
<220>
<221> misc_feature
<222> (32)..(35)
<223> Xaa可为任何天然氨基酸
<220>
<221> misc_feature
<222> (34)..(35)
<223> 可能不存在
<400> 82
His Xaa Glu Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
1 5 10 15
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Pro Cys Xaa
20 25 30
Xaa Xaa Xaa Cys
35
<210> 83
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 83
Pro Lys Lys Lys Arg Lys Val
1 5
<210> 84
<211> 30
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 84
Met Asp Ser Leu Leu Met Asn Arg Arg Lys Phe Leu Tyr Gln Phe Lys
1 5 10 15
Asn Val Arg Trp Ala Lys Gly Arg Arg Glu Thr Tyr Leu Cys
20 25 30
<210> 85
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成多肽
<400> 85
tatatgcata tttattacat cgg 23
<210> 86
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 86
ccgtcatgtg ggtcctgaat tgg 23
<210> 87
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 87
acactgaaag actccaggtc agg 23
<210> 88
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 88
gtcagaagag atgtggtcaa tgg 23
<210> 89
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 89
tttaaagtga agcagcatct ggg 23
<210> 90
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 90
atttaaagtg aagcagcatc tgg 23
<210> 91
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 91
actccatgac agtgtaattt tgg 23
<210> 92
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 92
gcctggagaa gccatccagc agg 23
<210> 93
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 93
ctcagacaca ctcattgatg agg 23
<210> 94
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 94
gaggcactgc ccccaccatg agcg 24
<210> 95
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 95
Arg Glu Cys Ala Ser Asp Arg Val Trp
1 5
<210> 96
<211> 8
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<220>
<221> misc_feature
<222> (8)..(8)
<223> Xaa is Ile or Met
<400> 96
His Lys Tyr Thr Asn Asn Gln Xaa
1 5
<210> 97
<211> 8
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 97
Ala Asp Glu Cys Gly Arg Val Met
1 5
<210> 98
<211> 8
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<220>
<221> misc_feature
<222> (5)..(5)
<223> Xaa is Asn, Lys, Asp, or Glu
<220>
<221> misc_feature
<222> (6)..(6)
<223> Xaa is Lys or His
<400> 98
Thr Asn Lys Tyr Xaa Xaa Ile Ile
1 5
<210> 99
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 99
Ser Gly Ser Ala Gly Ser Ala Ala Gly Ser Gly Glu
1 5 10
<210> 100
<211> 21
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 100
Ser Ala Ala Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly
1 5 10 15
Gly Ser Thr Ala Ala
20
<210> 101
<211> 18
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 101
Lys Arg Thr Ala Asp Gly Ser Glu Phe Glu Ser Pro Lys Lys Lys Arg
1 5 10 15
Lys Val
<210> 102
<211> 16
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<220>
<221> misc_feature
<222> (3)..(12)
<223> Xaa可为任何天然氨基酸
<400> 102
Lys Arg Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Lys Lys Lys Leu
1 5 10 15
<210> 103
<211> 125
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<220>
<221> misc_feature
<222> (1)..(8)
<223> n is a, c, g, or t
<400> 103
nnnnnnnngt ttttgtactc tcaagattta gaaataaatc ttgcagaagc tacaaagata 60
aggcttcatg ccgaaatcaa caccctgtca ttttatggca gggtgttttc gttatttaat 120
ttttt 125
<210> 104
<211> 121
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<220>
<221> misc_feature
<222> (1)..(18)
<223> n is a, c, g, or t
<400> 104
nnnnnnnnnn nnnnnnnngt ttttgtactc tcagaaatgc agaagctaca aagataaggc 60
ttcatgccga aatcaacacc ctgtcatttt atggcagggt gttttcgtta tttaattttt 120
t 121
<210> 105
<211> 109
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<220>
<221> misc_feature
<222> (1)..(20)
<223> n is a, c, g, or t
<400> 105
nnnnnnnnnn nnnnnnnnnn gtttttgtac tctcagaaat gcagaagcta caaagataag 60
gcttcatgcc gaaatcaaca ccctgtcatt ttatggcagg gtgtttttt 109
<210> 106
<211> 102
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<220>
<221> misc_feature
<222> (1)..(20)
<223> n is a, c, g, or t
<400> 106
nnnnnnnnnn nnnnnnnnnn gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgctttt tt 102
<210> 107
<211> 88
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<220>
<221> misc_feature
<222> (1)..(20)
<223> n is a, c, g, or t
<400> 107
nnnnnnnnnn nnnnnnnnnn gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt gttttttt 88
<210> 108
<211> 76
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<220>
<221> misc_feature
<222> (1)..(20)
<223> n is a, c, g, or t
<400> 108
nnnnnnnnnn nnnnnnnnnn gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcatt tttttt 76
<210> 109
<211> 82
<212> RNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 109
guuuuagagc uagaaauagc aaguuaaaau aaaggcuagu ccguuaucaa cuugaaaaag 60
uggcaccgag ucggugcuuu uu 82
<210> 110
<211> 150
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<220>
<221> misc_feature
<222> (6)..(150)
<223> 可能不存在
<400> 110
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
1 5 10 15
Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
20 25 30
Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly
35 40 45
Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
50 55 60
Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
65 70 75 80
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
85 90 95
Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
100 105 110
Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly
115 120 125
Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
130 135 140
Ser Gly Gly Gly Gly Ser
145 150
<210> 111
<211> 30
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<220>
<221> misc_feature
<222> (2)..(30)
<223> 可能不存在
<400> 111
Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly
1 5 10 15
Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly
20 25 30
<210> 112
<211> 150
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<220>
<221> misc_feature
<222> (6)..(150)
<223> 可能不存在
<400> 112
Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu
1 5 10 15
Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala
20 25 30
Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala
35 40 45
Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala
50 55 60
Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys
65 70 75 80
Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu
85 90 95
Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala
100 105 110
Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala
115 120 125
Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala
130 135 140
Lys Glu Ala Ala Ala Lys
145 150
<210> 113
<211> 90
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<220>
<221> misc_feature
<222> (4)..(90)
<223> 可能不存在
<400> 113
Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly
1 5 10 15
Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly
20 25 30
Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser
35 40 45
Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly
50 55 60
Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly
65 70 75 80
Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser
85 90
<210> 114
<211> 120
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<220>
<221> misc_feature
<222> (5)..(120)
<223> 可能不存在
<400> 114
Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser
1 5 10 15
Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser
20 25 30
Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser
35 40 45
Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser
50 55 60
Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser
65 70 75 80
Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser
85 90 95
Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser
100 105 110
Ser Gly Gly Ser Ser Gly Gly Ser
115 120
<210> 115
<211> 16
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 115
Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser
1 5 10 15
<210> 116
<211> 60
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<220>
<221> misc_feature
<222> (1)..(1)
<223> Xaa可为任何天然氨基酸
<220>
<221> misc_feature
<222> (3)..(3)
<223> Xaa可为任何天然氨基酸
<220>
<221> misc_feature
<222> (3)..(60)
<223> 可能不存在
<220>
<221> misc_feature
<222> (5)..(5)
<223> Xaa可为任何天然氨基酸
<220>
<221> misc_feature
<222> (7)..(7)
<223> Xaa可为任何天然氨基酸
<220>
<221> misc_feature
<222> (9)..(9)
<223> Xaa可为任何天然氨基酸
<220>
<221> misc_feature
<222> (11)..(11)
<223> Xaa可为任何天然氨基酸
<220>
<221> misc_feature
<222> (13)..(13)
<223> Xaa可为任何天然氨基酸
<220>
<221> misc_feature
<222> (15)..(15)
<223> Xaa可为任何天然氨基酸
<220>
<221> misc_feature
<222> (17)..(17)
<223> Xaa可为任何天然氨基酸
<220>
<221> misc_feature
<222> (19)..(19)
<223> Xaa可为任何天然氨基酸
<220>
<221> misc_feature
<222> (21)..(21)
<223> Xaa可为任何天然氨基酸
<220>
<221> misc_feature
<222> (23)..(23)
<223> Xaa可为任何天然氨基酸
<220>
<221> misc_feature
<222> (25)..(25)
<223> Xaa可为任何天然氨基酸
<220>
<221> misc_feature
<222> (27)..(27)
<223> Xaa可为任何天然氨基酸
<220>
<221> misc_feature
<222> (29)..(29)
<223> Xaa可为任何天然氨基酸
<220>
<221> misc_feature
<222> (31)..(31)
<223> Xaa可为任何天然氨基酸
<220>
<221> misc_feature
<222> (33)..(33)
<223> Xaa可为任何天然氨基酸
<220>
<221> misc_feature
<222> (35)..(35)
<223> Xaa可为任何天然氨基酸
<220>
<221> misc_feature
<222> (37)..(37)
<223> Xaa可为任何天然氨基酸
<220>
<221> misc_feature
<222> (39)..(39)
<223> Xaa可为任何天然氨基酸
<220>
<221> misc_feature
<222> (41)..(41)
<223> Xaa可为任何天然氨基酸
<220>
<221> misc_feature
<222> (43)..(43)
<223> Xaa可为任何天然氨基酸
<220>
<221> misc_feature
<222> (45)..(45)
<223> Xaa可为任何天然氨基酸
<220>
<221> misc_feature
<222> (47)..(47)
<223> Xaa可为任何天然氨基酸
<220>
<221> misc_feature
<222> (49)..(49)
<223> Xaa可为任何天然氨基酸
<220>
<221> misc_feature
<222> (51)..(51)
<223> Xaa可为任何天然氨基酸
<220>
<221> misc_feature
<222> (53)..(53)
<223> Xaa可为任何天然氨基酸
<220>
<221> misc_feature
<222> (55)..(55)
<223> Xaa可为任何天然氨基酸
<220>
<221> misc_feature
<222> (57)..(57)
<223> Xaa可为任何天然氨基酸
<220>
<221> misc_feature
<222> (59)..(59)
<223> Xaa可为任何天然氨基酸
<400> 116
Xaa Pro Xaa Pro Xaa Pro Xaa Pro Xaa Pro Xaa Pro Xaa Pro Xaa Pro
1 5 10 15
Xaa Pro Xaa Pro Xaa Pro Xaa Pro Xaa Pro Xaa Pro Xaa Pro Xaa Pro
20 25 30
Xaa Pro Xaa Pro Xaa Pro Xaa Pro Xaa Pro Xaa Pro Xaa Pro Xaa Pro
35 40 45
Xaa Pro Xaa Pro Xaa Pro Xaa Pro Xaa Pro Xaa Pro
50 55 60
<210> 117
<211> 21
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<220>
<221> misc_feature
<222> (4)..(21)
<223> 可能不存在
<400> 117
Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly
1 5 10 15
Gly Ser Gly Gly Ser
20
<210> 118
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 118
gtcatcttag tcattacctg agg 23
<210> 119
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 119
gaacacaaag catagactgc ggg 23
<210> 120
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 120
ggcactgcgg ctggaggtgg gg 22
<210> 121
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 121
gcctgagtcc gagcagaaga agaaggg 27
<210> 122
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 122
ggcagtcatc ttagtcatta cctga 25
<210> 123
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 123
ccggtggcac tgcggctgga ggtggg 26
<210> 124
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 124
actggaacac aaagcataga ctgcg 25
<210> 125
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 125
acttggggcc cagactgagc acgtgat 27
<210> 126
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 126
gaacaggaag cacgaggcca ctgagg 26
<210> 127
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 127
Phe Leu Phe Cys Ser Ala Val Ser Ser
1 5
<210> 128
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 128
cttgtccttc gtgctccggt gactcc 26
<210> 129
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 129
atggaggacg tgcgcggccg cctg 24
<210> 130
<211> 8
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 130
Met Glu Asp Val Arg Gly Arg Leu
1 5
<210> 131
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 131
tacctcctgc acgcgccggc ggac 24
<210> 132
<211> 83
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 132
gttttagagc tagaaatagc aagttaaaat aaggctagtc cgttatcaac ttgaaaaagt 60
ggcaccgagt cggtgctttt ttt 83
<210> 133
<211> 883
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 133
Met Asn Thr Ile Asn Ile Ala Lys Asn Asp Phe Ser Asp Ile Glu Leu
1 5 10 15
Ala Ala Ile Pro Phe Asn Thr Leu Ala Asp His Tyr Gly Glu Arg Leu
20 25 30
Ala Arg Glu Gln Leu Ala Leu Glu His Glu Ser Tyr Glu Met Gly Glu
35 40 45
Ala Arg Phe Arg Lys Met Phe Glu Arg Gln Leu Lys Ala Gly Glu Val
50 55 60
Ala Asp Asn Ala Ala Ala Lys Pro Leu Ile Thr Thr Leu Leu Pro Lys
65 70 75 80
Met Ile Ala Arg Ile Asn Asp Trp Phe Glu Glu Val Lys Ala Lys Arg
85 90 95
Gly Lys Arg Pro Thr Ala Phe Gln Phe Leu Gln Glu Ile Lys Pro Glu
100 105 110
Ala Val Ala Tyr Ile Thr Ile Lys Thr Thr Leu Ala Cys Leu Thr Ser
115 120 125
Ala Asp Asn Thr Thr Val Gln Ala Val Ala Ser Ala Ile Gly Arg Ala
130 135 140
Ile Glu Asp Glu Ala Arg Phe Gly Arg Ile Arg Asp Leu Lys Ala Lys
145 150 155 160
His Phe Lys Lys Asn Val Glu Glu Gln Leu Asn Lys Arg Val Gly His
165 170 175
Val Tyr Lys Lys Ala Phe Met Gln Val Val Glu Ala Asp Met Leu Ser
180 185 190
Lys Gly Leu Leu Gly Gly Glu Ala Trp Ser Ser Trp His Lys Glu Asp
195 200 205
Ser Ile His Val Gly Val Arg Cys Ile Glu Met Leu Ile Glu Ser Thr
210 215 220
Gly Met Val Ser Leu His Arg Gln Asn Ala Gly Val Val Gly Gln Asp
225 230 235 240
Ser Glu Thr Ile Glu Leu Ala Pro Glu Tyr Ala Glu Ala Ile Ala Thr
245 250 255
Arg Ala Gly Ala Leu Ala Gly Ile Ser Pro Met Phe Gln Pro Cys Val
260 265 270
Val Pro Pro Lys Pro Trp Thr Gly Ile Thr Gly Gly Gly Tyr Trp Ala
275 280 285
Asn Gly Arg Arg Pro Leu Ala Leu Val Arg Thr His Ser Lys Lys Ala
290 295 300
Leu Met Arg Tyr Glu Asp Val Tyr Met Pro Glu Val Tyr Lys Ala Ile
305 310 315 320
Asn Ile Ala Gln Asn Thr Ala Trp Lys Ile Asn Lys Lys Val Leu Ala
325 330 335
Val Ala Asn Val Ile Thr Lys Trp Lys His Cys Pro Val Glu Asp Ile
340 345 350
Pro Ala Ile Glu Arg Glu Glu Leu Pro Met Lys Pro Glu Asp Ile Asp
355 360 365
Met Asn Pro Glu Ala Leu Thr Ala Trp Lys Arg Ala Ala Ala Ala Val
370 375 380
Tyr Arg Lys Asp Lys Ala Arg Lys Ser Arg Arg Ile Ser Leu Glu Phe
385 390 395 400
Met Leu Glu Gln Ala Asn Lys Phe Ala Asn His Lys Ala Ile Trp Phe
405 410 415
Pro Tyr Asn Met Asp Trp Arg Gly Arg Val Tyr Ala Val Ser Met Phe
420 425 430
Asn Pro Gln Gly Asn Asp Met Thr Lys Gly Leu Leu Thr Leu Ala Lys
435 440 445
Gly Lys Pro Ile Gly Lys Glu Gly Tyr Tyr Trp Leu Lys Ile His Gly
450 455 460
Ala Asn Cys Ala Gly Val Asp Lys Val Pro Phe Pro Glu Arg Ile Lys
465 470 475 480
Phe Ile Glu Glu Asn His Glu Asn Ile Met Ala Cys Ala Lys Ser Pro
485 490 495
Leu Glu Asn Thr Trp Trp Ala Glu Gln Asp Ser Pro Phe Cys Phe Leu
500 505 510
Ala Phe Cys Phe Glu Tyr Ala Gly Val Gln His His Gly Leu Ser Tyr
515 520 525
Asn Cys Ser Leu Pro Leu Ala Phe Asp Gly Ser Cys Ser Gly Ile Gln
530 535 540
His Phe Ser Ala Met Leu Arg Asp Glu Val Gly Gly Arg Ala Val Asn
545 550 555 560
Leu Leu Pro Ser Glu Thr Val Gln Asp Ile Tyr Gly Ile Val Ala Lys
565 570 575
Lys Val Asn Glu Ile Leu Gln Ala Asp Ala Ile Asn Gly Thr Asp Asn
580 585 590
Glu Val Val Thr Val Thr Asp Glu Asn Thr Gly Glu Ile Ser Glu Lys
595 600 605
Val Lys Leu Gly Thr Lys Ala Leu Ala Gly Gln Trp Leu Ala Tyr Gly
610 615 620
Val Thr Arg Ser Val Thr Lys Arg Ser Val Met Thr Leu Ala Tyr Gly
625 630 635 640
Ser Lys Glu Phe Gly Phe Arg Gln Gln Val Leu Glu Asp Thr Ile Gln
645 650 655
Pro Ala Ile Asp Ser Gly Lys Gly Leu Met Phe Thr Gln Pro Asn Gln
660 665 670
Ala Ala Gly Tyr Met Ala Lys Leu Ile Trp Glu Ser Val Ser Val Thr
675 680 685
Val Val Ala Ala Val Glu Ala Met Asn Trp Leu Lys Ser Ala Ala Lys
690 695 700
Leu Leu Ala Ala Glu Val Lys Asp Lys Lys Thr Gly Glu Ile Leu Arg
705 710 715 720
Lys Arg Cys Ala Val His Trp Val Thr Pro Asp Gly Phe Pro Val Trp
725 730 735
Gln Glu Tyr Lys Lys Pro Ile Gln Thr Arg Leu Asn Leu Met Phe Leu
740 745 750
Gly Gln Phe Arg Leu Gln Pro Thr Ile Asn Thr Asn Lys Asp Ser Glu
755 760 765
Ile Asp Ala His Lys Gln Glu Ser Gly Ile Ala Pro Asn Phe Val His
770 775 780
Ser Gln Asp Gly Ser His Leu Arg Lys Thr Val Val Trp Ala His Glu
785 790 795 800
Lys Tyr Gly Ile Glu Ser Phe Ala Leu Ile His Asp Ser Phe Gly Thr
805 810 815
Ile Pro Ala Asp Ala Ala Asn Leu Phe Lys Ala Val Arg Glu Thr Met
820 825 830
Val Asp Thr Tyr Glu Ser Cys Asp Val Leu Ala Asp Phe Tyr Asp Gln
835 840 845
Phe Ala Asp Gln Leu His Glu Ser Gln Leu Asp Lys Met Pro Ala Leu
850 855 860
Pro Ala Lys Gly Asn Leu Asn Leu Arg Asp Ile Leu Glu Ser Asp Phe
865 870 875 880
Ala Phe Ala
<210> 134
<211> 13
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 134
Ala Ala Asn Asp Glu Asn Tyr Asn Tyr Ala Leu Ala Ala
1 5 10
<210> 135
<211> 899
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 135
Met Asn Thr Ile Asn Ile Ala Lys Asn Asp Phe Ser Asp Ile Glu Leu
1 5 10 15
Ala Ala Ile Pro Phe Asn Thr Leu Ala Asp His Tyr Gly Glu Arg Leu
20 25 30
Ala Arg Glu Gln Leu Ala Leu Glu His Glu Ser Tyr Glu Met Gly Glu
35 40 45
Ala Arg Phe Arg Lys Met Phe Glu Arg Gln Leu Lys Ala Gly Glu Val
50 55 60
Ala Asp Asn Ala Ala Ala Lys Pro Leu Ile Thr Thr Leu Leu Pro Lys
65 70 75 80
Met Ile Ala Arg Ile Asn Asp Trp Phe Glu Glu Val Lys Ala Lys Arg
85 90 95
Gly Lys Arg Pro Thr Ala Phe Gln Phe Leu Gln Glu Ile Lys Pro Glu
100 105 110
Ala Val Ala Tyr Ile Thr Ile Lys Thr Thr Leu Ala Cys Leu Thr Ser
115 120 125
Ala Asp Asn Thr Thr Val Gln Ala Val Ala Ser Ala Ile Gly Arg Ala
130 135 140
Ile Glu Asp Glu Ala Arg Phe Gly Arg Ile Arg Asp Leu Lys Ala Lys
145 150 155 160
His Phe Lys Lys Asn Val Glu Glu Gln Leu Asn Lys Arg Val Gly His
165 170 175
Val Tyr Lys Lys Ala Phe Met Gln Val Val Glu Ala Asp Met Leu Ser
180 185 190
Lys Gly Leu Leu Gly Gly Glu Ala Trp Ser Ser Trp His Lys Glu Asp
195 200 205
Ser Ile His Val Gly Val Arg Cys Ile Glu Met Leu Ile Glu Ser Thr
210 215 220
Gly Met Val Ser Leu His Arg Gln Asn Ala Gly Val Val Gly Gln Asp
225 230 235 240
Ser Glu Thr Ile Glu Leu Ala Pro Glu Tyr Ala Glu Ala Ile Ala Thr
245 250 255
Arg Ala Gly Ala Leu Ala Gly Ile Ser Pro Met Phe Gln Pro Cys Val
260 265 270
Val Pro Pro Lys Pro Trp Thr Gly Ile Thr Gly Gly Gly Tyr Trp Ala
275 280 285
Asn Gly Arg Arg Pro Leu Ala Leu Val Arg Thr His Ser Lys Lys Ala
290 295 300
Leu Met Arg Tyr Glu Asp Val Tyr Met Pro Glu Val Tyr Lys Ala Ile
305 310 315 320
Asn Ile Ala Gln Asn Thr Ala Trp Lys Ile Asn Lys Lys Val Leu Ala
325 330 335
Val Ala Asn Val Ile Thr Lys Trp Lys His Cys Pro Val Glu Asp Ile
340 345 350
Pro Ala Ile Glu Arg Glu Glu Leu Pro Met Lys Pro Glu Asp Ile Asp
355 360 365
Met Asn Pro Glu Ala Leu Thr Ala Trp Lys Arg Ala Ala Ala Ala Val
370 375 380
Tyr Arg Lys Asp Lys Ala Arg Lys Ser Arg Arg Ile Ser Leu Glu Phe
385 390 395 400
Met Leu Glu Gln Ala Asn Lys Phe Ala Asn His Lys Ala Ile Trp Phe
405 410 415
Pro Tyr Asn Met Asp Trp Arg Gly Arg Val Tyr Ala Val Ser Met Phe
420 425 430
Asn Pro Gln Gly Asn Asp Met Thr Lys Gly Leu Leu Thr Leu Ala Lys
435 440 445
Gly Lys Pro Ile Gly Lys Glu Gly Tyr Tyr Trp Leu Lys Ile His Gly
450 455 460
Ala Asn Cys Ala Gly Val Asp Lys Val Pro Phe Pro Glu Arg Ile Lys
465 470 475 480
Phe Ile Glu Glu Asn His Glu Asn Ile Met Ala Cys Ala Lys Ser Pro
485 490 495
Leu Glu Asn Thr Trp Trp Ala Glu Gln Asp Ser Pro Phe Cys Phe Leu
500 505 510
Ala Phe Cys Phe Glu Tyr Ala Gly Val Gln His His Gly Leu Ser Tyr
515 520 525
Asn Cys Ser Leu Pro Leu Ala Phe Asp Gly Ser Cys Ser Gly Ile Gln
530 535 540
His Phe Ser Ala Met Leu Arg Asp Glu Val Gly Gly Arg Ala Val Asn
545 550 555 560
Leu Leu Pro Ser Glu Thr Val Gln Asp Ile Tyr Gly Ile Val Ala Lys
565 570 575
Lys Val Asn Glu Ile Leu Gln Ala Asp Ala Ile Asn Gly Thr Asp Asn
580 585 590
Glu Val Val Thr Val Thr Asp Glu Asn Thr Gly Glu Ile Ser Glu Lys
595 600 605
Val Lys Leu Gly Thr Lys Ala Leu Ala Gly Gln Trp Leu Ala Tyr Gly
610 615 620
Val Thr Arg Ser Val Thr Lys Arg Ser Val Met Thr Leu Ala Tyr Gly
625 630 635 640
Ser Lys Glu Phe Gly Phe Arg Gln Gln Val Leu Glu Asp Thr Ile Gln
645 650 655
Pro Ala Ile Asp Ser Gly Lys Gly Leu Met Phe Thr Gln Pro Asn Gln
660 665 670
Ala Ala Gly Tyr Met Ala Lys Leu Ile Trp Glu Ser Val Ser Val Thr
675 680 685
Val Val Ala Ala Val Glu Ala Met Asn Trp Leu Lys Ser Ala Ala Lys
690 695 700
Leu Leu Ala Ala Glu Val Lys Asp Lys Lys Thr Gly Glu Ile Leu Arg
705 710 715 720
Lys Arg Cys Ala Val His Trp Val Thr Pro Asp Gly Phe Pro Val Trp
725 730 735
Gln Glu Tyr Lys Lys Pro Ile Gln Thr Arg Leu Asn Leu Met Phe Leu
740 745 750
Gly Gln Phe Arg Leu Gln Pro Thr Ile Asn Thr Asn Lys Asp Ser Glu
755 760 765
Ile Asp Ala His Lys Gln Glu Ser Gly Ile Ala Pro Asn Phe Val His
770 775 780
Ser Gln Asp Gly Ser His Leu Arg Lys Thr Val Val Trp Ala His Glu
785 790 795 800
Lys Tyr Gly Ile Glu Ser Phe Ala Leu Ile His Asp Ser Phe Gly Thr
805 810 815
Ile Pro Ala Asp Ala Ala Asn Leu Phe Lys Ala Val Arg Glu Thr Met
820 825 830
Val Asp Thr Tyr Glu Ser Cys Asp Val Leu Ala Asp Phe Tyr Asp Gln
835 840 845
Phe Ala Asp Gln Leu His Glu Ser Gln Leu Asp Lys Met Pro Ala Leu
850 855 860
Pro Ala Lys Gly Asn Leu Asn Leu Arg Asp Ile Leu Glu Ser Asp Phe
865 870 875 880
Ala Phe Ala Trp Thr Arg Ala Ala Asn Asp Glu Asn Tyr Asn Tyr Ala
885 890 895
Leu Ala Ala
<210> 136
<211> 102
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 136
Cys Leu Ser Tyr Glu Thr Glu Ile Leu Thr Val Glu Tyr Gly Leu Leu
1 5 10 15
Pro Ile Gly Lys Ile Val Glu Lys Arg Ile Glu Cys Thr Val Tyr Ser
20 25 30
Val Asp Asn Asn Gly Asn Ile Tyr Thr Gln Pro Val Ala Gln Trp His
35 40 45
Asp Arg Gly Glu Gln Glu Val Phe Glu Tyr Cys Leu Glu Asp Gly Ser
50 55 60
Leu Ile Arg Ala Thr Lys Asp His Lys Phe Met Thr Val Asp Gly Gln
65 70 75 80
Met Leu Pro Ile Asp Glu Ile Phe Glu Arg Glu Leu Asp Leu Met Arg
85 90 95
Val Asp Asn Leu Pro Asn
100
<210> 137
<211> 346
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 137
Met Ser Ser Glu Thr Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg
1 5 10 15
Arg Ile Glu Pro His Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu
20 25 30
Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile Asn Trp Gly Gly Arg His
35 40 45
Ser Ile Trp Arg His Thr Ser Gln Asn Thr Asn Lys His Val Glu Val
50 55 60
Asn Phe Ile Glu Lys Phe Thr Thr Glu Arg Tyr Phe Cys Pro Asn Thr
65 70 75 80
Arg Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys
85 90 95
Ser Arg Ala Ile Thr Glu Phe Leu Ser Arg Tyr Pro His Val Thr Leu
100 105 110
Phe Ile Tyr Ile Ala Arg Leu Tyr His His Ala Asp Pro Arg Asn Arg
115 120 125
Gln Gly Leu Arg Asp Leu Ile Ser Ser Gly Val Thr Ile Gln Ile Met
130 135 140
Thr Glu Gln Glu Ser Gly Tyr Cys Trp Arg Asn Phe Val Asn Tyr Ser
145 150 155 160
Pro Ser Asn Glu Ala His Trp Pro Arg Tyr Pro His Leu Trp Val Arg
165 170 175
Leu Tyr Val Leu Glu Leu Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys
180 185 190
Leu Asn Ile Leu Arg Arg Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile
195 200 205
Ala Leu Gln Ser Cys His Tyr Gln Arg Leu Pro Pro His Ile Leu Trp
210 215 220
Ala Thr Gly Leu Lys Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser
225 230 235 240
Ala Thr Pro Glu Cys Leu Ser Tyr Glu Thr Glu Ile Leu Thr Val Glu
245 250 255
Tyr Gly Leu Leu Pro Ile Gly Lys Ile Val Glu Lys Arg Ile Glu Cys
260 265 270
Thr Val Tyr Ser Val Asp Asn Asn Gly Asn Ile Tyr Thr Gln Pro Val
275 280 285
Ala Gln Trp His Asp Arg Gly Glu Gln Glu Val Phe Glu Tyr Cys Leu
290 295 300
Glu Asp Gly Ser Leu Ile Arg Ala Thr Lys Asp His Lys Phe Met Thr
305 310 315 320
Val Asp Gly Gln Met Leu Pro Ile Asp Glu Ile Phe Glu Arg Glu Leu
325 330 335
Asp Leu Met Arg Val Asp Asn Leu Pro Asn
340 345
<210> 138
<211> 37
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 138
Met Ile Lys Ile Ala Thr Arg Lys Tyr Leu Gly Lys Gln Asn Val Tyr
1 5 10 15
Asp Ile Gly Val Glu Arg Asp His Asn Phe Ala Leu Lys Asn Gly Phe
20 25 30
Ile Ala Ser Asn Cys
35
<210> 139
<211> 1492
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 139
Met Ile Lys Ile Ala Thr Arg Lys Tyr Leu Gly Lys Gln Asn Val Tyr
1 5 10 15
Asp Ile Gly Val Glu Arg Asp His Asn Phe Ala Leu Lys Asn Gly Phe
20 25 30
Ile Ala Ser Asn Cys Phe Asn Lys Tyr Ser Ile Gly Leu Ala Ile Gly
35 40 45
Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro
50 55 60
Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys
65 70 75 80
Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu
85 90 95
Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys
100 105 110
Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys
115 120 125
Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu
130 135 140
Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp
145 150 155 160
Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys
165 170 175
Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu
180 185 190
Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly
195 200 205
Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu
210 215 220
Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser
225 230 235 240
Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg
245 250 255
Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly
260 265 270
Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe
275 280 285
Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys
290 295 300
Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp
305 310 315 320
Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile
325 330 335
Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro
340 345 350
Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu
355 360 365
Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys
370 375 380
Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp
385 390 395 400
Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu
405 410 415
Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu
420 425 430
Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His
435 440 445
Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp
450 455 460
Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu
465 470 475 480
Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser
485 490 495
Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp
500 505 510
Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile
515 520 525
Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu
530 535 540
Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu
545 550 555 560
Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu
565 570 575
Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn
580 585 590
Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile
595 600 605
Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn
610 615 620
Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys
625 630 635 640
Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val
645 650 655
Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu
660 665 670
Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys
675 680 685
Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn
690 695 700
Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys
705 710 715 720
Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp
725 730 735
Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln
740 745 750
Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala
755 760 765
Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val
770 775 780
Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala
785 790 795 800
Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg
805 810 815
Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu
820 825 830
Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr
835 840 845
Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu
850 855 860
Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln
865 870 875 880
Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser
885 890 895
Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val
900 905 910
Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile
915 920 925
Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu
930 935 940
Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr
945 950 955 960
Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn
965 970 975
Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile
980 985 990
Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe
995 1000 1005
Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala
1010 1015 1020
Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro
1025 1030 1035
Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp
1040 1045 1050
Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala
1055 1060 1065
Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys
1070 1075 1080
Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu
1085 1090 1095
Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly
1100 1105 1110
Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val
1115 1120 1125
Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys
1130 1135 1140
Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg
1145 1150 1155
Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro
1160 1165 1170
Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly
1175 1180 1185
Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr
1190 1195 1200
Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu
1205 1210 1215
Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys
1220 1225 1230
Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg
1235 1240 1245
Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala
1250 1255 1260
Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr
1265 1270 1275
Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu
1280 1285 1290
Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln
1295 1300 1305
Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu
1310 1315 1320
Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile
1325 1330 1335
Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn
1340 1345 1350
Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp
1355 1360 1365
Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu
1370 1375 1380
Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu
1385 1390 1395
Ser Gln Leu Gly Gly Asp Ser Gly Gly Ser Met Thr Asn Leu Ser
1400 1405 1410
Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu Val Ile Gln Glu
1415 1420 1425
Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val Ile Gly Asn
1430 1435 1440
Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr Asp Glu Ser
1445 1450 1455
Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr
1460 1465 1470
Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys
1475 1480 1485
Ile Lys Met Leu
1490

Claims (175)

1.一种胞苷脱氨酶,其包含与SEQ ID NO:1的氨基酸残基2-162具有至少80%、85%、90%、95%、98%、99%或99.5%同一性的氨基酸序列,其中所述胞苷脱氨酶包含相对于SEQID NO:1的选自H102X1、D104X2和V115X3的一个或多个突变或另一种胞苷脱氨酶中的相应突变,其中X1是非H的任意氨基酸,X2是非D的任意氨基酸,和X3是非V的任意氨基酸。
2.一种胞苷脱氨酶,其包含SEQ ID NO:1的氨基酸残基2-162,其中所述胞苷脱氨酶包含相对于SEQ ID NO:1的选自H102X1、D104X2和V115X3的一个或多个突变,其中X1是非H的任意氨基酸,X2是非D的任意氨基酸,和X3是非V的任意氨基酸。
3.如权利要求1或2所述的胞苷脱氨酶,其中所述胞苷脱氨酶包含相对于SEQ ID NO:1的选自H102X1、D104X2和V115X3的2个或全部3个突变或另一种胞苷脱氢酶中的相应突变,其中X1是非H的任意氨基酸,X2是非D的任意氨基酸,和X3是非V的任意氨基酸。
4.如权利要求1-3中任一项所述的胞苷脱氨酶,其中X1是P。
5.如权利要求1-4中任一项所述的胞苷脱氨酶,其中X2是N。
6.如权利要求1-5中任一项所述的胞苷脱氨酶,其中X3是M。
7.如权利要求1-6中任一项所述的胞苷脱氨酶,其中所述胞苷脱氨酶包含相对于SEQID NO:1的H102P和D104N突变。
8.如权利要求1-7中任一项所述的胞苷脱氨酶,其中所述胞苷脱氨酶包含SEQ ID NO:5的氨基酸残基2-162。
9.如权利要求1-8中任一项所述的胞苷脱氨酶,其中所述胞苷脱氨酶还包含N-末端甲硫氨酸(M)氨基酸残基。
10.如权利要求1-9中任一项所述的胞苷脱氨酶,其中所述胞苷脱氨酶包含SEQ ID NO:5的氨基酸序列。
11.一种胞苷脱氨酶,其包含与SEQ ID NO:2的氨基酸残基3-229具有至少80%、85%、90%、95%、98%、99%或99.5%同一性的氨基酸序列,其中所述胞苷脱氨酶包含相对于SEQID NO:2的选自E4X1、V10X2、E31X3、Y40X4、E95X5、H109X6、H122X7、D124X8、R126X9、R154X10、N158X11、A165X12、P201X13、F205X14和I208X15的一个或多个突变或另一种胞苷脱氨酶中的相应突变,其中X1、X3和X5是非E的任意氨基酸,X2是非V的任意氨基酸,X4是非Y的任意氨基酸,X6和X7是非H的任意氨基酸,X8是非D的任意氨基酸,X9和X10是非R的任意氨基酸,X11是非N的任意氨基酸,X12是非A的任意氨基酸,X13是非P的任意氨基酸,X14是非F的任意氨基酸,和X15是非I的任意氨基酸。
12.一种胞苷脱氨酶,其包含SEQ ID NO:2的氨基酸残基3-229,其中所述胞苷脱氨酶包含相对于SEQ ID NO:2的选自E4X1、V10X2、E31X3、Y40X4、E95X5、H109X6、H122X7、D124X8、R126X9、R154X10、N158X11、A165X12、P201X13、F205X14和I208X15的一个或多个突变,其中X1,X3和X5是非E的任意氨基酸,X2是非V的任意氨基酸,X4是非Y的任意氨基酸,X6和X7是非H的任意氨基酸,X8是非D的任意氨基酸,X9和X10是非R的任意氨基酸,X11是非N的任意氨基酸,X12是非A的任意氨基酸,X13是非P的任意氨基酸,X14是非F的任意氨基酸,和X15是非I的任意氨基酸。
13.如权利要求11或12所述的胞苷氨基酸,其中所述胞苷脱氨酶包含相对于SEQ IDNO:2的选自E4X1、V10X2、E31X3、Y40X4、E95X5、H109X6、H122X7、D124X8、R126X9、R154X10、N158X11、A165X12、P201X13、F205X14和I208X15的2、3、4、5、6、7、8、9、10、11、12、13、14或全部15个突变,其中X1、X3和X5是非E的任意氨基酸,X2是非V的任意氨基酸,X4是非Y的任意氨基酸,X6和X7是非H的任意氨基酸,X8是非D的任意氨基酸,X9和X10是非R的任意氨基酸,X11是非N的任意氨基酸,X12是非A的任意氨基酸,X13是非P的任意氨基酸,X14是非F的任意氨基酸,和X15是非I的任意氨基酸。
14.如权利要求11-13中任一项所述的胞苷脱氨酶,其中X1是K。
15.如权利要求11-14中任一项所述的胞苷脱氨酶,其中X2和X5是A。
16.如权利要求11-15中任一项所述的胞苷脱氨酶,其中X3是V。
17.如权利要求11-16中任一项所述的胞苷脱氨酶,其中X4是C。
18.如权利要求11-17中任一项所述的胞苷脱氨酶,其中X6和X8是N。
19.如权利要求11-18中任一项所述的胞苷脱氨酶,其中X7和X15是L。
20.如权利要求11-19中任一项所述的胞苷脱氨酶,其中X9和X10是H。
21.如权利要求11-20中任一项所述的胞苷脱氨酶,其中X11、X12、X13和X14是S。
22.如权利要求11-21中任一项所述的胞苷脱氨酶,其中所述一个或多个突变选自相对于SEQ ID NO:2的E4X1、H109X6、H122X7、D124X8、R154X10、A165X12、P201X13和F205X14,其中X1是非E的任意氨基酸,X6和X7是非H的任意氨基酸,X8是非D的任意氨基酸,X10是非R的任意氨基酸,X12是非A的任意氨基酸,X13是非P的任意氨基酸,和X14是非F的任意氨基酸。
23.如权利要求11-22中任一项所述的胞苷脱氨酶,其中所述一个或多个突变选自相对于SEQ ID NO:2的E4K、H109N、H122L、D124N、R154H、A165S、P201S和F205S。
24.如权利要求11-23中任一项所述的胞苷脱氨酶,其中所述胞苷脱氨酶包含相对于SEQ ID NO:2的选自E4K、H109N、H122L、D124N、R154H、A165S、P201S和F205S的2、3、4、5、6、7或全部8个突变。
25.如权利要求11-24中任一项所述的胞苷脱氨酶,其中所述胞苷脱氨酶包含相对于SEQ ID NO:2的突变E4K、H109N、H122L、D124N、R154H、A165S、P201S和F205S。
26.如权利要求11-25中任一项所述的胞苷脱氨酶,其中所述胞苷脱氨酶包含SEQ IDNO:6的氨基酸残基3-229。
27.如权利要求11-26中任一项所述的胞苷脱氨酶,其中所述胞苷脱氨酶还包含N-末端甲硫氨酸(M)氨基酸残基。
28.如权利要求11-26中任一项所述的胞苷脱氨酶,其中所述胞苷脱氨酶还包含两个N-末端氨基酸残基,其为M和S。
29.如权利要求11-28中任一项所述的胞苷脱氨酶,其中所述胞苷脱氨酶包含SEQ IDNO:6的氨基酸序列。
30.一种胞苷脱氨酶,其包含与SEQ ID NO:3的氨基酸残基2-208具有至少80%、85%、90%、95%、98%、99%或99.5%同一性的氨基酸序列,其中所述胞苷脱氨酶包含相对于SEQID NO:3的选自H10X1、F23X2、V75X3、K120X4、A123X5、C158X6、I193X7、I195X8和V197X9的一个或多个突变或另一种胞苷脱氨酶中的相应突变,其中X1是非H的任意氨基酸,X2是非F的任意氨基酸,X3和X9是非V的任意氨基酸,X4是非K的任意氨基酸,X5是非A的任意氨基酸,X6是非C的任意氨基酸,和X7和X8是非I的任意氨基酸。
31.一种胞苷脱氨酶,其包含SEQ ID NO:3的氨基酸残基2-208,其中所述胞苷脱氨酶包含相对于SEQ ID NO:3选自H10X1、F23X2、V75X3、K120X4、A123X5、C158X6、I193X7、I195X8和V197X9的一个或多个突变,其中X1是非H的任意氨基酸,X2是非F的任意氨基酸,X3和X9是非V的任意氨基酸,X4是非K的任意氨基酸,X5是非A的任意氨基酸,X6是非C的任意氨基酸,和X7和X8是非I的任意氨基酸。
32.如权利要求30或31所述的胞苷氨基酸,其中所述胞苷脱氨酶包含相对于SEQ IDNO:3的选自H10X1、F23X2、V75X3、K120X4、A123X5、C158X6、I193X7、I195X8和V197X9的2、3、4、5、6、7、8或全部9个突变,其中X1是非H的任意氨基酸,X2是非F的任意氨基酸,X3和X9是非V的任意氨基酸,X4是非K的任意氨基酸,X5是非A的任意氨基酸,X6是非C的任意氨基酸,和X7和X8是非I的任意氨基酸。
33.如权利要求30-32中任一项所述的胞苷脱氨酶,其中X1是Y。
34.如权利要求30-33中任一项所述的胞苷脱氨酶,其中X2是S。
35.如权利要求30-34中任一项所述的胞苷脱氨酶,其中X3是I。
36.如权利要求30-35中任一项所述的胞苷脱氨酶,其中X4和X6是R。
37.如权利要求30-36中任一项所述的胞苷脱氨酶,其中X5是V。
38.如权利要求30-37中任一项所述的胞苷脱氨酶,其中X7是T。
39.如权利要求30-38中任一项所述的胞苷脱氨酶,其中X8是F或T。
40.如权利要求30-39中任一项所述的胞苷脱氨酶,其中X9是A。
41.如权利要求30-40中任一项所述的胞苷脱氨酶,其中所述一个或多个突变选自相对于SEQ ID NO:3的F23X2、A123X5和I195X8,其中X2是非F的任意氨基酸,X5是非A的任意氨基酸,和X8是非I的任意氨基酸。
42.如权利要求30-41中任一项所述的胞苷脱氨酶,其中所述一个或多个突变选自相对于SEQ ID NO:3的F23S、A123V和I195F。
43.如权利要求30-42中任一项所述的胞苷脱氨酶,其中所述胞苷脱氨酶包含相对于SEQ ID NO:3的选自F23S、A123V和I195F的2个或全部3个突变。
44.如权利要求30-43中任一项所述的胞苷脱氨酶,其中所述胞苷脱氨酶包含相对于SEQ ID NO:3的突变F23S、A123V和I195F。
45.如权利要求30-44中任一项所述的胞苷脱氨酶,其中所述胞苷脱氨酶包含SEQ IDNO:7的氨基酸残基2-208。
46.如权利要求30-45中任一项所述的胞苷脱氨酶,其中所述胞苷脱氨酶还包含N-末端甲硫氨酸(M)氨基酸残基。
47.如权利要求30-46中任一项所述的胞苷脱氨酶,其中所述胞苷脱氨酶包含SEQ IDNO:7的氨基酸序列。
48.一种胞苷脱氨酶,其包含与SEQ ID NO:4的氨基酸残基3-229具有至少80%、85%、90%、95%、98%、99%或99.5%同一性的氨基酸序列,其中所述胞苷脱氨酶包含相对于SEQID NO:4的选自E4X1、H122X2、D124X3、R154X4、A165X5、P201X6和F205X7的一个或多个突变或另一种胞苷脱氨酶中的相应突变,其中X1是非E的任意氨基酸,X2是非H的任意氨基酸,X3是非D的任意氨基酸,X4是非R的任意氨基酸,X5是非A的任意氨基酸,X6是非P的任意氨基酸,和X7是非F的任意氨基酸。
49.一种胞苷脱氨酶,其包含SEQ ID NO:4的氨基酸残基3-229,其中所述胞苷脱氨酶包含相对于SEQ ID NO:4的选自E4X1、H122X2、D124X3、R154X4、A165X5、P201X6和F205X7的一个或多个突变,其中X1是非E的任意氨基酸,X2非H的任意氨基酸,X3是非D的任意氨基酸,X4是非R的任意氨基酸,X5是非A的任意氨基酸,X6是非P的任意氨基酸,和X7是非F的任意氨基酸。
50.如权利要求48或49所述的胞苷氨基酸,其中所述胞苷脱氨酶包含相对于SEQ IDNO:4的选自E4X1、H122X2、D124X3、R154X4、A165X5、P201X6和F205X7的2、3、4、5、6或全部7个突变,其中X1是非E的任意氨基酸,X2非H的任意氨基酸,X3是非D的任意氨基酸,X4是非R的任意氨基酸,X5是非A的任意氨基酸,X6是非P的任意氨基酸,和X7是非F的任意氨基酸。
51.如权利要求48-50中任一项所述的胞苷脱氨酶,其中X1是K。
52.如权利要求48-51中任一项所述的胞苷脱氨酶,其中X2是L。
53.如权利要求48-52中任一项所述的胞苷脱氨酶,其中X3是N。
54.如权利要求48-53任一项所述的胞苷脱氨酶,其中X4是H。
55.如权利要求48-54中任一项所述的胞苷脱氨酶,其中X5是S。
56.如权利要求48-55中任一项所述的胞苷脱氨酶,其中X6是S。
57.如权利要求48-56中任一项所述的胞苷脱氨酶,其中X7是S。
58.如权利要求48-57中任一项所述的胞苷脱氨酶,其中所述一个或多个突变选自相对于SEQ ID NO:4的E4K、H122L、D124N、R154H、A165S、P201S和F205S。
59.如权利要求48-58中任一项所述的胞苷脱氨酶,其中所述胞苷脱氨酶包含选自相对于SEQ ID NO:4的E4K、H122L、D124N、R154H、A165S、P201S和F205S的2、3、4、5、6或全部7个突变。
60.如权利要求48-59中任一项所述的胞苷脱氨酶,其中所述胞苷脱氨酶包含相对于SEQ ID NO:4的突变E4K、H122L、D124N、R154H、A165S、P201S和F205S。
61.如权利要求48-60中任一项所述的胞苷脱氨酶,其中所述胞苷脱氨酶包含SEQ IDNO:8的氨基酸残基3-229。
62.如权利要求48-61中任一项所述的胞苷脱氨酶,其中所述胞苷脱氨酶还包含N-末端甲硫氨酸(M)氨基酸残基。
63.如权利要求48-62中任一项所述的胞苷脱氨酶,其中所述胞苷脱氨酶还包含两个N-末端氨基酸残基,其为M和S。
64.如权利要求48-63中任一项所述的胞苷脱氨酶,其中所述胞苷脱氨酶包含SEQ IDNO:8的氨基酸序列。
65.一种融合蛋白,其包含:
(i)核酸可编程DNA结合蛋白(napDNAbp);
(ii)权利要求1-64中任一项所述的胞苷脱氨酶;和
(iii)尿嘧啶糖基化酶抑制剂结构域(UGI)。
66.如权利要求65所述的融合蛋白,其中所述融合蛋白包含2、3、4或5个UGI结构域。
67.如权利要求65或66所述的融合蛋白,其中所述核酸可编程DNA结合蛋白(napDNAbp)是Cas9结构域。
68.如权利要求65-67中任一项所述的融合蛋白,其中所述Cas9结构域是核酸酶活性的Cas9、核酸酶失活的Cas9(dCas9)或Cas9切口酶(nCas9)。
69.如权利要求65-68中任一项所述的融合蛋白,其中所述Cas9结构域是Cas9切口酶(nCas9)。
70.如权利要求65-69中任一项所述的融合蛋白,其中所述nCas9包含与以下氨基酸序列具有至少80%、85%、90%、95%、98%、99%、99.5%或99.9%同一性的氨基酸序列:
DKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD(SEQ ID NO:9)。
71.如权利要求65-70中任一项所述的融合蛋白,其中所述nCas9包含如SEQ ID NO:9所示的氨基酸序列。
72.如权利要求65-66中任一项所述的融合蛋白,其中所述napDNAbp是CasX、CasY、Cpf1、C2c1、C2c2、C2c3或Argonaute蛋白。
73.如权利要求65-72中任一项所述的融合蛋白,其中所述UGI结构域包含能够抑制UDG活性的结构域。
74.如权利要求65-73中任一项所述的融合蛋白,其中所述UGI结构域包含与以下氨基酸序列具有至少80%、85%、90%、95%、98%、99%、99.5%或99.9%同一性的氨基酸序列:
MTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKML(SEQ ID NO:10)。
75.如权利要求65-74中任一项所述的融合蛋白,其中所述UGI结构域包含SEQ ID NO:10所示的序列。
76.如权利要求65-75中任一项所述的融合蛋白,其中所述融合蛋白包含以下结构:
NH2-[胞苷脱氨酶]-[napDNAbp]-[UGI]-COOH;
NH2-[胞苷脱氨酶]-[UGI]-[napDNAbp]-COOH;
NH2-[napDNAbp]-[UGI]-[胞苷脱氨酶]-COOH;
NH2-[napDNAbp]-[胞苷脱氨酶]-[UGI]-COOH;
NH2-[UGI]-[胞苷脱氨酶]-[napDNAbp]-COOH;和
NH2-[UGI]-[napDNAbp]-[胞苷脱氨酶]-COOH;
其中所述胞苷脱氨酶是权利要求1-64中任一项所述的胞苷脱氨酶,其中所述UGI是UGI结构域,和其中每个“-”包含任选的接头。
77.如权利要求65-76中任一项所述的融合蛋白,其中所述融合蛋白包含以下结构:
NH2-[胞苷脱氨酶]-[napDNAbp]-[UGI]-[UGI]-COOH;
NH2-[胞苷脱氨酶]-[UGI]-[napDNAbp]-[UGI]-COOH;
NH2-[UGI]-[胞苷脱氨酶]-[napDNAbp]-[UGI]-COOH;
NH2-[胞苷脱氨酶]-[UGI]-[napDNAbp]-[UGI]-COOH;
NH2-[胞苷脱氨酶]-[UGI]-[UGI]-[napDNAbp]-COOH;
NH2-[UGI]-[胞苷脱氨酶]-[UGI]-[napDNAbp]-COOH;
NH2-[UGI]-[napDNAbp]-[UGI]-[胞苷脱氨酶]-COOH;
NH2-[napDNAbp]-[UGI]-[UGI]-[胞苷脱氨酶]-COOH;
NH2-[napDNAbp]-[UGI]-[胞苷脱氨酶]-[UGI]-COOH;
NH2-[napDNAbp]-[胞苷脱氨酶]-[UGI]-[UGI]-COOH;
NH2-[napDNAbp]-[UGI]-[胞苷脱氨酶]-[UGI]-COOH;
NH2-[UGI]-[napDNAbp]-[胞苷脱氨酶]-[UGI]-COOH;
NH2-[UGI]-[胞苷脱氨酶]-[napDNAbp]-[UGI]-COOH;
NH2-[UGI]-[胞苷脱氨酶]-[UGI]-[napDNAbp]-COOH;
NH2-[UGI]-[UGI]-[胞苷脱氨酶]-[napDNAbp]-COOH;
NH2-[UGI]-[napDNAbp]-[胞苷脱氨酶]-[UGI]-COOH;
NH2-[UGI]-[napDNAbp]-[UGI]-[胞苷脱氨酶]-COOH;和
NH2-[UGI]-[UGI]-[napDNAbp]-[胞苷脱氨酶]-COOH;
其中所述胞苷脱氨酶是权利要求1-64中任一项所述的胞苷脱氨酶,其中所述UGI是UGI结构域,和其中每个“-”包含任选的接头。
78.如权利要求65-77中任一项所述的融合蛋白,其中所述融合蛋白包含以下结构:
NH2-[胞苷脱氨酶]-[napDNAbp]-[UGI]-[UGI]-COOH;
其中所述胞苷脱氨酶是权利要求1-64中任一项所述的胞苷脱氨酶,其中所述UGI是UGI结构域,和其中每个“-”包含任选的接头。
79.如权利要求78所述的融合蛋白,其中所述胞苷脱氨酶与所述napDNAbp通过包含以下氨基酸序列的接头融合:SGGSSGGSSGSETPGTSESATPESSGGSSGGS(SEQ ID NO:11)。
80.如权利要求78或79所述的融合蛋白,其中所述napDNAbp和所述UGI结构域通过包括以下氨基酸序列的接头融合:SGGSGGSGGS(SEQ ID NO:12)。
81.如权利要求77-80中任一项所述的融合蛋白,其中所述UGI结构域通过包括以下氨基酸序列的接头融合:SGGSGGSGGS(SEQ ID NO:12)。
82.如权利要求77-81中任一项所述的融合蛋白,其中所述融合蛋白还包含核定位序列(NLS)。
83.如权利要求82所述的融合蛋白,其中所述NLS包含以下氨基酸序列:KRTADGSEFEPKKKRKV(SEQ ID NO:13)。
84.如权利要求82或83所述的融合蛋白,其中所述融合蛋白包含两个核定位序列(NLSs)。
85.如权利要求82-84中任一项所述的融合蛋白,其中所述融合蛋白包含以下结构:
NH2-[NLS]-[胞苷脱氨酶]-[napDNAbp]-[UGI]-[UGI]-[NLS]-COOH;
其中所述胞苷脱氨酶是权利要求1-64中任一项所述的胞苷脱氨酶,其中所述UGI是UGI结构域,和其中每个“-”包含任选的接头。
86.如权利要求85所述的融合蛋白,其中所述UGI和所述NLS通过包括以下氨基酸序列的接头融合:SGGS(SEQ ID NO:14)。
87.如权利要求65-86中任一项所述的融合蛋白,其中所述融合蛋白包含与SEQ IDNOs:15-20所示的任一个氨基酸序列具有至少80%、85%、90%、95%、98%、99%或99.5%同一性的氨基酸序列。
88.如权利要求65-86中任一项所述的融合蛋白,其中所述融合蛋白包含SEQ ID NOs:15-20所示的任一个氨基酸序列。
89.一种核酸序列,其编码如权利要求1-64中任一项所述的胞苷脱氨酶或如权利要求65-88中任一项所述的融合蛋白。
90.如权利要求89所述的核酸,其中所述核酸序列是经优化以在哺乳动物细胞中表达的密码子。
91.如权利要求90所述的核酸,其中所述哺乳动物细胞是HEK293T细胞。
92.一种载体,其包含如权利要求89-91中任一项所述的核酸。
93.如权利要求92所述的载体,其中所述载体包含驱动核酸表达的异源启动子。
94.一种复合物,其包含如权利要求65-88中任一项所述的融合蛋白和与该融合蛋白的napDNAbp结合的RNA。
95.如权利要求94所述的复合物,其中所述RNA是向导RNA(gRNA)。
96.如权利要求94或95所述的复合物,其中所述RNA是单链向导RNA(sgRNA)。
97.如权利要求70所述的复合物,其中所述sgRNA包含如下的骨架序列:gttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcttttttt(SEQID NO:132),任选地其中每个t是尿嘧啶(u)。
98.如权利要求94-97中任一项所述的复合物,其中所述RNA的长度为10-100个核苷酸,并且包含与靶序列互补的至少10个连续核苷酸的序列。
99.如权利要求94-98中任一项所述的复合物,其中所述RNA包含与靶序列互补的10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39或40个连续核苷酸的序列。
100.如权利要求94-99中任一项所述的复合物,其中所述靶序列是DNA序列。
101.如权利要求94-100中任一项所述的复合物,其中所述RNA包含与编码ApoE或TMC1的核酸序列互补的至少10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39或40个连续核苷酸的核酸序列。
102.如权利要求98-101中任一项所述的复合物,其中所述靶位于生物体的基因组中。
103.如权利要求102所述的复合物,其中所述生物体是原核生物。
104.如权利要求102所述的复合物,其中所述生物体是真核生物。
105.如权利要求104所述的复合物,其中所述生物体是脊椎生物。
106.如权利要求105所述的复合物,其中所述脊椎生物是哺乳动物。
107.如权利要求106所述的复合物,其中所述哺乳动物是人。
108.一种细胞,其包含如权利要求1-64中任一项所述的胞苷脱氨酶或如权利要求65-88中任一项所述的融合蛋白。
109.一种细胞,其包含如权利要求89-91中任一项所述的核酸。
110.一种细胞,其包含如权利要求92或93所述的载体。
111.一种细胞,其包含如权利要求94-107中任一项所述的复合物。
112.一种试剂盒,其包含核酸构建体,其包含:编码如权利要求65-88中任一项所述的融合蛋白的核酸序列;和驱动所述融合蛋白表达的异源启动子。
113.如权利要求112所述的试剂盒,其还包含编码向导RNA骨架的表达构建体,其中所述构建体包含允许将与靶序列具有同一性或互补性的核酸序列克隆定位到所述向导RNA骨架中的克隆位点。
114.一种药物组合物,其包含如权利要求65-88中任一项所述的融合蛋白。
115.一种药物组合物,其包含如权利要求94-107中任一项所述的复合物。
116.一种药物组合物,其包含如权利要求89-91中任一项所述的核酸。
117.一种药物组合物,其包含如权利要求92或93所述的载体。
118.如权利要求114-117中任一项所述的药物组合物,其还包含可药用赋形剂。
119.如权利要求114-118中任一项所述的药物组合物,其还包含脂质。
120.如权利要求119所述的药物组合物,其中所述脂质是阳离子脂质。
121.如权利要求114-120中任一项所述的药物组合物,其还包含聚合物。
122.一种方法,其包括将核酸分子与如权利要求94-107中任一项所述的复合物相接触。
123.如权利要求122所述的方法,其中所述核酸是DNA。
124.如权利要求123所述的方法,其中所述核酸是双链DNA。
125.如权利要求122-124中任一项所述的方法,其中所述核酸包含与疾病或病症相关的靶序列。
126.如权利要求125所述的方法,其中所述靶序列包含与疾病或病症相关的点突变。
127.如权利要求125-126中任一项所述的方法,其中所述靶序列包含T至C或A至G的与疾病或病症相关的点突变,和其中所述突变C碱基的脱氨化导致与疾病或病症不相关的序列。
128.如权利要求125-127中任一项所述的方法,其中所述靶序列编码蛋白质,并且其中所述点突变在密码子中,并且导致与野生型密码子相比由该突变密码子编码的氨基酸变化。
129.如权利要求125-127中任一项所述的方法,其中所述靶序列位于剪接位点处,和其中所述点突变导致与野生型转录物相比mRNA转录物的剪接变化。
130.如权利要求125-127中任一项所述的方法,其中所述靶序列位于基因的启动子处,和其中所述点突变导致基因表达增加。
131.如权利要求125-127中任一项所述的方法,其中所述靶序列位于基因的启动子处,和其中所述点突变导致基因表达减少。
132.如权利要求125-131中任一项所述的方法,其中所述突变C的脱氨化导致该突变密码子所编码的氨基酸变化。
133.如权利要求125-131中任一项所述的方法,其中所述突变C的脱氨化导致编码野生型氨基酸的密码子。
134.如权利要求129所述的方法,其中所述突变C的脱氨化导致mRNA转录物变化。
135.如权利要求127-134中任一项所述的方法,其中所述突变C的脱氨化导致野生型mRNA转录物。
136.如权利要求127-135中任一项所述的方法,其中所述突变C的脱氨化导致基因表达增加。
137.如权利要求127-135中任一项所述的方法,其中所述突变C的脱氨化导致基因表达减少。
138.如权利要求122-137中任一项所述的方法,其中所述接触在体外实施。
139.如权利要求122-137中任一项所述的方法,其中所述接触在受试者体内实施。
140.如权利要求139所述的方法,其中所述受试者已被诊断患有疾病或病症。
141.如权利要求89-106中任一项所述的方法,其中所述疾病或病症与ApoE基因或Tmc1基因中的点突变相关,任选地其中所述点突变是ApoE C112R或ApoE C158R突变,任选地其中所述点突变是Tmc1 Y182C突变。
142.一种融合蛋白,其包含与降解决定子(degron)标签融合的RNA聚合酶,任选地其中所述降解决定子标签包含与如下序列具有至少80%、85%、90%、95%、98%、99%或100%同一性的氨基酸序列:AANDENYNYALAA(SEQ ID NO:134)。
143.如权利要求143所述的融合蛋白,其中所述RNA聚合酶是T7RNA聚合酶,任选地其中所述降解决定子标签包含与以下序列具有至少80%、85%、90%、95%、98%、99%或100%同一性的氨基酸序列:MNTINIAKNDFSDIELAAIPFNTLADHYGERLAREQLALEHESYEMGEARFRKMFERQLKAGEVADNAAAKPLITTLLPKMIARINDWFEEVKAKRGKRPTAFQFLQEIKPEAVAYITIKTTLACLTSADNTTVQAVASAIGRAIEDEARFGRIRDLKAKHFKKNVEEQLNKRVGHVYKKAFMQVVEADMLSKGLLGGEAWSSWHKEDSIHVGVRCIEMLIESTGMVSLHRQNAGVVGQDSETIELAPEYAEAIATRAGALAGISPMFQPCVVPPKPWTGITGGGYWANGRRPLALVRTHSKKALMRYEDVYMPEVYKAINIAQNTAWKINKKVLAVANVITKWKHCPVEDIPAIEREELPMKPEDIDMNPEALTAWKRAAAAVYRKDKARKSRRISLEFMLEQANKFANHKAIWFPYNMDWRGRVYAVSMFNPQGNDMTKGLLTLAKGKPIGKEGYYWLKIHGANCAGVDKVPFPERIKFIEENHENIMACAKSPLENTWWAEQDSPFCFLAFCFEYAGVQHHGLSYNCSLPLAFDGSCSGIQHFSAMLRDEVGGRAVNLLPSETVQDIYGIVAKKVNEILQADAINGTDNEVVTVTDENTGEISEKVKLGTKALAGQWLAYGVTRSVTKRSVMTLAYGSKEFGFRQQVLEDTIQPAIDSGKGLMFTQPNQAAGYMAKLIWESVSVTVVAAVEAMNWLKSAAKLLAAEVKDKKTGEILRKRCAVHWVTPDGFPVWQEYKKPIQTRLNLMFLGQFRLQPTINTNKDSEIDAHKQESGIAPNFVHSQDGSHLRKTVVWAHEKYGIESFALIHDSFGTIPADAANLFKAVRETMVDTYESCDVLADFYDQFADQLHESQLDKMPALPAKGNLNLRDILESDFAFA(SEQ ID NO:133)。
144.如权利要求143或144所述的融合蛋白,其中所述降解决定子标签与RNA聚合酶的C-末端融合,任选地其中所述融合包含与以下序列具有至少80%、85%、90%、95%、98%、99%或100%同一性的氨基酸序列:MNTINIAKNDFSDIELAAIPFNTLADHYGERLAREQLALEHESYEMGEARFRKMFERQLKAGEVADNAAAKPLITTLLPKMIARINDWFEEVKAKRGKRPTAFQFLQEIKPEAVAYITIKTTLACLTSADNTTVQAVASAIGRAIEDEARFGRIRDLKAKHFKKNVEEQLNKRVGHVYKKAFMQVVEADMLSKGLLGGEAWSSWHKEDSIHVGVRCIEMLIESTGMVSLHRQNAGVVGQDSETIELAPEYAEAIATRAGALAGISPMFQPCVVPPKPWTGITGGGYWANGRRPLALVRTHSKKALMRYEDVYMPEVYKAINIAQNTAWKINKKVLAVANVITKWKHCPVEDIPAIEREELPMKPEDIDMNPEALTAWKRAAAAVYRKDKARKSRRISLEFMLEQANKFANHKAIWFPYNMDWRGRVYAVSMFNPQGNDMTKGLLTLAKGKPIGKEGYYWLKIHGANCAGVDKVPFPERIKFIEENHENIMACAKSPLENTWWAEQDSPFCFLAFCFEYAGVQHHGLSYNCSLPLAFDGSCSGIQHFSAMLRDEVGGRAVNLLPSETVQDIYGIVAKKVNEILQADAINGTDNEVVTVTDENTGEISEKVKLGTKALAGQWLAYGVTRSVTKRSVMTLAYGSKEFGFRQQVLEDTIQPAIDSGKGLMFTQPNQAAGYMAKLIWESVSVTVVAAVEAMNWLKSAAKLLAAEVKDKKTGEILRKRCAVHWVTPDGFPVWQEYKKPIQTRLNLMFLGQFRLQPTINTNKDSEIDAHKQESGIAPNFVHSQDGSHLRKTVVWAHEKYGIESFALIHDSFGTIPADAANLFKAVRETMVDTYESCDVLADFYDQFADQLHESQLDKMPALPAKGNLNLRDILESDFAFAWTRAANDENYNYALAA(SEQ ID NO:135)。
145.一种核酸,其编码如权利要求143-145中任一项所述的融合蛋白。
146.一种载体,其包含如权利要求146所述的核酸。
147.一种融合蛋白,其包含与N-内含肽融合的胞苷脱氨酶,任选地其中所述融合包含与以下序列具有至少80%、85%、90%、95%、98%、99%或100%同一性的氨基酸序列:CLSYETEILTVEYGLLPIGKIVEKRIECTVYSVDNNGNIYTQPVAQWHDRGEQEVFEYCLEDGSLIRATKDHKFMTVDGQMLPIDEIFERELDLMRVDNLPN*(SEQ ID NO:136)。
148.如权利要求148所述的融合蛋白,其中所述胞苷脱氨酶是APOBEC脱氨酶。
149.如权利要求148或149所述的融合蛋白,其中所述胞苷脱氨酶是如权利要求1-64中任一项所述的胞苷脱氨酶。
150.如权利要求148-150中任一项所述的融合蛋白,其中所述N-内含肽与胞苷脱氨酶的C末端融合,任选地其中所述融合包含与以下序列具有至少80%、85%、90%、95%、98%、99%或100%同一性的氨基酸序列:MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSIWRHTSQNTNKHVEVNFIEKFTTERYFCPNTRCSITWFLSWSPCGECSRAITEFLSRYPHVTLFIYIARLYHHADPRNRQGLRDLISSGVTIQIMTEQESGYCWRNFVNYSPSNEAHWPRYPHLWVRLYVLELYCIILGLPPCLNILRRKQPQLTFFTIALQSCHYQRLPPHILWATGLKSGSETPGTSESATPECLSYETEILTVEYGLLPIGKIVEKRIECTVYSVDNNGNIYTQPVAQWHDRGEQEVFEYCLEDGSLIRATKDHKFMTVDGQMLPIDEIFERELDLMRVDNLPN(SEQID NO:137)。
151.一种核酸,其编码如权利要求148-151中任一项所述的融合蛋白。
152.一种载体,其包含如权利要求152所述的核酸,任选地其中所述载体是噬菌粒,还任选地其中所述噬菌粒是M13噬菌粒。
153.一种融合蛋白,其包含Cas9结构域、尿嘧啶DNA糖基化酶抑制剂(UGI)结构域和C-内含肽,任选地其中所述融合包含与以下序列具有至少80%、85%、90%、95%、98%、99%或100%同一性的氨基酸序列:MIKIATRKYLGKQNVYDIGVERDHNFALKNGFIASNC(SEQ ID NO:138)。
154.如权利要求154所述的融合蛋白,其中所述Cas9结构域是核酸酶失活的Cas9结构域(dCas9)或Cas9切口酶(nCas9)。
155.如权利要求154或155所述的融合蛋白,其中所述C-内含肽与Cas9结构域的N-末端融合,和所述UGI结构域与Cas9结构域的C-末端融合,任选地其中所述融合包含与以下序列具有至少80%、85%、90%、95%、98%、99%或100%同一性的氨基酸序列:MIKIATRKYLGKQNVYDIGVERDHNFALKNGFIASNCFNKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDSGGSMTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKML(SEQ ID NO:139)。
156.一种核酸,其编码如权利要求154-156中任一项所述的融合蛋白。
157.一种载体,其包含如权利要求157所述的核酸,任选地其中所述载体是噬菌粒,任选地其中所述噬菌粒是M13噬菌粒。
158.一种融合蛋白,其包含尿嘧啶-DNA结合蛋白和转录激活因子。
159.如权利要求159所述的融合蛋白,其中所述转录激活因子是RpoZ。
160.如权利要求159或160所述的融合蛋白,其中所述尿嘧啶-DNA结合蛋白是UdgX。
161.一种核酸,其编码如权利要求159-161中任一项所述的融合蛋白。
162.一种载体,其包含如权利要求162所述的核酸。
163.一种用于基于噬菌体的连续定向进化的载体系统,其包括:
a.包含编码能够使胞嘧啶脱氨基的碱基编辑器蛋白的核酸或其编码内含肽的部分的载体;
b.如权利要求147所述的载体;和
c.编码luxAB和向导RNA(gRNA)的载体。
164.一种载体系统,其包含:
a.如权利要求147所述的载体;
b.如权利要求153所述的载体;
c.如权利要求154所述的载体;和
d.包含编码gIII、luxAB和向导RNA(gRNA)的核酸的载体。
165.一种载体系统,其包含:
a.包含编码能够使胞嘧啶脱氨基的碱基编辑器蛋白的核酸的载体;
b.如权利要求所述的载体163;和
c.包含编码luxAB和gRNA的核酸的载体。
166.如权利要求166所述的载体系统,其中所述编码luxAB和gRNA的核酸编码显性阴性gIII蛋白变体,诸如pIII-neg。
167.一种细胞,其包含权利要求164-166中任一项所述的载体系统。
168.一种细胞或噬菌体,其包含如权利要求147、153、158或163中任一项所述的载体。
169.一种核酸的连续进化方法,其包括:
(i)将包含如权利要求153所述的载体的选择噬菌粒(SP)通过泻湖(lagoon)引入到细菌宿主细胞流中,
其中所述宿主细胞包含将选择噬菌粒包装到感染性噬菌体颗粒中所需的噬菌体基因,其中将选择噬菌粒包装到噬菌体颗粒中所需的至少一种基因是丧失能力的,
其中将选择噬菌粒包装入感染性噬菌体颗粒所需的至少一种基因的表达响应于所述宿主细胞中待进化基因的表达,
并且其中所述宿主细胞通过泻湖的流速允许噬菌粒在泻湖中复制,但不允许宿主细胞复制;
(ii)在所述宿主细胞流中复制和突变噬菌粒;和
(iii)从细胞流中分离包含突变的待进化基因的噬菌粒。
170.如权利要求170所述的方法,其中所述宿主细胞包含第一辅助质粒(AP),所述第一辅助质粒包含将选择噬菌粒包装到在所述宿主细胞中丧失能力的噬菌体颗粒中所需的基因,其中响应于SP所编码的融合蛋白的表达,由所述辅助质粒表达该基因。
171.如权利要求171所述的方法,其中所述第一AP包含编码gIII、luxAB和向导RNA(gRNA)的核酸。
172.如权利要求172所述的方法,其中所述宿主细胞包含第二AP,其中所述第二AP包含如权利要求147所述的载体。
173.如权利要求173所述的方法,其中所述宿主细胞包含第三AP,其中所述第三AP包含如权利要求158所述的载体。
174.通过如权利要求170-174中任一项所述方法制备的碱基编辑器。
175.如权利要求175所述的碱基编辑器,其中所述碱基编辑器包含胞苷脱氨酶、Cas9结构域和UGI结构域。
CN201880062594.5A 2017-07-28 2018-07-27 使用噬菌体辅助连续进化(pace)的进化碱基编辑器的方法和组合物 Pending CN111801345A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201762538380P 2017-07-28 2017-07-28
US62/538,380 2017-07-28
PCT/US2018/044242 WO2019023680A1 (en) 2017-07-28 2018-07-27 METHODS AND COMPOSITIONS FOR EVOLUTION OF BASIC EDITORS USING PHAGE-ASSISTED CONTINUOUS EVOLUTION (PACE)

Publications (1)

Publication Number Publication Date
CN111801345A true CN111801345A (zh) 2020-10-20

Family

ID=63209676

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880062594.5A Pending CN111801345A (zh) 2017-07-28 2018-07-27 使用噬菌体辅助连续进化(pace)的进化碱基编辑器的方法和组合物

Country Status (5)

Country Link
US (2) US11732274B2 (zh)
EP (1) EP3658573A1 (zh)
JP (1) JP2020534795A (zh)
CN (1) CN111801345A (zh)
WO (1) WO2019023680A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110964742A (zh) * 2019-12-20 2020-04-07 北京市农林科学院 一种抗除草剂水稻的制备方法
CN112266420A (zh) * 2020-10-30 2021-01-26 华南农业大学 一种植物高效胞嘧啶单碱基编辑器及其构建与应用
CN114686456A (zh) * 2022-05-10 2022-07-01 中山大学 基于双分子脱氨酶互补的碱基编辑系统及其应用
CN115725533A (zh) * 2022-11-18 2023-03-03 中国农业科学院作物科学研究所 一种获得抗草甘膦水稻的方法及其所用双碱基融合编辑系统
CN117106751A (zh) * 2023-07-14 2023-11-24 华南师范大学 一种斑马鱼胞嘧啶碱基编辑器及其构建方法与应用

Families Citing this family (69)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9163284B2 (en) 2013-08-09 2015-10-20 President And Fellows Of Harvard College Methods for identifying a target site of a Cas9 nuclease
US9359599B2 (en) 2013-08-22 2016-06-07 President And Fellows Of Harvard College Engineered transcription activator-like effector (TALE) domains and uses thereof
US9526784B2 (en) 2013-09-06 2016-12-27 President And Fellows Of Harvard College Delivery system for functional nucleases
US9340799B2 (en) 2013-09-06 2016-05-17 President And Fellows Of Harvard College MRNA-sensing switchable gRNAs
US11053481B2 (en) 2013-12-12 2021-07-06 President And Fellows Of Harvard College Fusions of Cas9 domains and nucleic acid-editing domains
US10077453B2 (en) 2014-07-30 2018-09-18 President And Fellows Of Harvard College CAS9 proteins including ligand-dependent inteins
IL310721A (en) 2015-10-23 2024-04-01 Harvard College Nucleobase editors and their uses
CA3032699A1 (en) 2016-08-03 2018-02-08 President And Fellows Of Harvard College Adenosine nucleobase editors and uses thereof
AU2017308889B2 (en) 2016-08-09 2023-11-09 President And Fellows Of Harvard College Programmable Cas9-recombinase fusion proteins and uses thereof
WO2018039438A1 (en) 2016-08-24 2018-03-01 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
CN110214180A (zh) 2016-10-14 2019-09-06 哈佛大学的校长及成员们 核碱基编辑器的aav递送
WO2018119359A1 (en) 2016-12-23 2018-06-28 President And Fellows Of Harvard College Editing of ccr5 receptor gene to protect against hiv infection
JP2020508685A (ja) 2017-03-03 2020-03-26 ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア サプレッサーtRNA及びデアミナーゼによる変異のRNAターゲティング
EP3592853A1 (en) 2017-03-09 2020-01-15 President and Fellows of Harvard College Suppression of pain by gene editing
US11542496B2 (en) 2017-03-10 2023-01-03 President And Fellows Of Harvard College Cytosine to guanine base editor
CN110914426A (zh) 2017-03-23 2020-03-24 哈佛大学的校长及成员们 包含核酸可编程dna结合蛋白的核碱基编辑器
WO2018209320A1 (en) 2017-05-12 2018-11-15 President And Fellows Of Harvard College Aptazyme-embedded guide rnas for use with crispr-cas9 in genome editing and transcriptional activation
CN111801345A (zh) 2017-07-28 2020-10-20 哈佛大学的校长及成员们 使用噬菌体辅助连续进化(pace)的进化碱基编辑器的方法和组合物
US11319532B2 (en) 2017-08-30 2022-05-03 President And Fellows Of Harvard College High efficiency base editors comprising Gam
AU2018352592A1 (en) 2017-10-16 2020-06-04 Beam Therapeutics, Inc. Uses of adenosine base editors
US20220282275A1 (en) 2018-11-15 2022-09-08 The Broad Institute, Inc. G-to-t base editors and uses thereof
US20200199555A1 (en) * 2018-12-05 2020-06-25 The Broad Institute, Inc. Cas proteins with reduced immunogenicity and methods of screening thereof
WO2020163396A1 (en) 2019-02-04 2020-08-13 The General Hospital Corporation Adenine dna base editor variants with reduced off-target rna editing
US20220127594A1 (en) * 2019-02-13 2022-04-28 Beam Therapeutics Inc. Compositions and methods for treating glycogen storage disease type 1a
KR20210138603A (ko) * 2019-02-13 2021-11-19 빔 테라퓨틱스, 인크. 표적 서열에서 핵염기를 변형하기 위한 아데노신 데아미나제 염기 편집기를 갖는 변형된 면역 세포
US20220177877A1 (en) * 2019-03-04 2022-06-09 President And Fellows Of Harvard College Highly multiplexed base editing
WO2020181193A1 (en) 2019-03-06 2020-09-10 The Broad Institute, Inc. T:a to a:t base editing through adenosine methylation
WO2020181195A1 (en) 2019-03-06 2020-09-10 The Broad Institute, Inc. T:a to a:t base editing through adenine excision
WO2020181202A1 (en) 2019-03-06 2020-09-10 The Broad Institute, Inc. A:t to t:a base editing through adenine deamination and oxidation
WO2020181178A1 (en) 2019-03-06 2020-09-10 The Broad Institute, Inc. T:a to a:t base editing through thymine alkylation
WO2020181180A1 (en) 2019-03-06 2020-09-10 The Broad Institute, Inc. A:t to c:g base editors and uses thereof
WO2020209959A1 (en) * 2019-03-08 2020-10-15 Crispr Therapeutics Ag Nucleobase-editing fusion protein systems, compositions, and uses thereof
AU2020242032A1 (en) * 2019-03-19 2021-10-07 Massachusetts Institute Of Technology Methods and compositions for editing nucleotide sequences
EP3956349A1 (en) 2019-04-17 2022-02-23 The Broad Institute, Inc. Adenine base editors with reduced off-target effects
EP3966335A4 (en) * 2019-05-07 2023-06-28 Suzhou Qi Biodesign biotechnology Company Limited Improved gene editing system
EP3965832A4 (en) * 2019-05-10 2024-02-07 Beam Therapeutics Inc COMPOSITIONS AND METHODS FOR TREATING HEPATITIS B
EP3973054A1 (en) 2019-05-20 2022-03-30 The Broad Institute Inc. Aav delivery of nucleobase editors
JP2022542839A (ja) 2019-07-19 2022-10-07 フラッグシップ パイオニアリング イノベーションズ シックス,エルエルシー リコンビナーゼ組成物及び使用方法
WO2021025750A1 (en) 2019-08-08 2021-02-11 The Broad Institute, Inc. Base editors with diversified targeting scope
WO2021030666A1 (en) 2019-08-15 2021-02-18 The Broad Institute, Inc. Base editing by transglycosylation
US20220333133A1 (en) 2019-09-03 2022-10-20 Voyager Therapeutics, Inc. Vectorized editing of nucleic acids to correct overt mutations
WO2021056302A1 (en) * 2019-09-26 2021-04-01 Syngenta Crop Protection Ag Methods and compositions for dna base editing
WO2021072328A1 (en) 2019-10-10 2021-04-15 The Broad Institute, Inc. Methods and compositions for prime editing rna
WO2021108717A2 (en) 2019-11-26 2021-06-03 The Broad Institute, Inc Systems and methods for evaluating cas9-independent off-target editing of nucleic acids
CN115038789A (zh) 2019-12-02 2022-09-09 塑造治疗公司 治疗性编辑
EP4069282A4 (en) * 2019-12-06 2023-11-08 The General Hospital Corporation FRACTIONATED DEAMINASE BASE EDITORS
US20230070731A1 (en) * 2020-01-25 2023-03-09 The Trustees Of The University Of Pennsylvania Compositions for small molecule control of precise base editing of target nucleic acids and methods of use thereof
WO2021155065A1 (en) 2020-01-28 2021-08-05 The Broad Institute, Inc. Base editors, compositions, and methods for modifying the mitochondrial genome
US20230235309A1 (en) 2020-02-05 2023-07-27 The Broad Institute, Inc. Adenine base editors and uses thereof
US20230108687A1 (en) 2020-02-05 2023-04-06 The Broad Institute, Inc. Gene editing methods for treating spinal muscular atrophy
WO2021158995A1 (en) 2020-02-05 2021-08-12 The Broad Institute, Inc. Base editor predictive algorithm and method of use
US20230127008A1 (en) 2020-03-11 2023-04-27 The Broad Institute, Inc. Stat3-targeted base editor therapeutics for the treatment of melanoma and other cancers
US20230131352A1 (en) 2020-04-01 2023-04-27 Voyager Therapeutics, Inc. Redirection of tropism of aav capsids
WO2021222318A1 (en) 2020-04-28 2021-11-04 The Broad Institute, Inc. Targeted base editing of the ush2a gene
CA3177481A1 (en) 2020-05-08 2021-11-11 David R. Liu Methods and compositions for simultaneous editing of both strands of a target double-stranded nucleotide sequence
GB202010348D0 (en) 2020-07-06 2020-08-19 Univ Wageningen Base editing tools
IT202000028688A1 (it) * 2020-11-27 2022-05-27 Consiglio Nazionale Ricerche Varianti della citidina deaminasi per l’editazione di basi
WO2022221337A2 (en) * 2021-04-12 2022-10-20 The Broad Institute, Inc. Evolved double-stranded dna deaminase base editors and methods of use
WO2022261509A1 (en) 2021-06-11 2022-12-15 The Broad Institute, Inc. Improved cytosine to guanine base editors
WO2023102537A2 (en) 2021-12-03 2023-06-08 The Broad Institute, Inc. Self-assembling virus-like particles for delivery of nucleic acid programmable fusion proteins and methods of making and using same
WO2023131870A2 (en) 2022-01-06 2023-07-13 Twelve Bio Aps Endonuclease variants and methods of use
WO2023196802A1 (en) 2022-04-04 2023-10-12 The Broad Institute, Inc. Cas9 variants having non-canonical pam specificities and uses thereof
WO2023212715A1 (en) 2022-04-28 2023-11-02 The Broad Institute, Inc. Aav vectors encoding base editors and uses thereof
WO2023230613A1 (en) 2022-05-27 2023-11-30 The Broad Institute, Inc. Improved mitochondrial base editors and methods for editing mitochondrial dna
WO2023240137A1 (en) 2022-06-08 2023-12-14 The Board Institute, Inc. Evolved cas14a1 variants, compositions, and methods of making and using same in genome editing
WO2024040083A1 (en) 2022-08-16 2024-02-22 The Broad Institute, Inc. Evolved cytosine deaminases and methods of editing dna using same
WO2024052681A1 (en) 2022-09-08 2024-03-14 The University Court Of The University Of Edinburgh Rett syndrome therapy
WO2024077247A1 (en) 2022-10-07 2024-04-11 The Broad Institute, Inc. Base editing methods and compositions for treating triplet repeat disorders
CN117987447A (zh) * 2022-11-02 2024-05-07 广州大学 一种真核细胞持续进化的控制方法及其应用

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103088008A (zh) * 2011-10-31 2013-05-08 中国科学院微生物研究所 胞苷脱氨酶及其编码基因和它们的应用
CN105934516A (zh) * 2013-12-12 2016-09-07 哈佛大学的校长及成员们 用于基因编辑的cas变体
WO2017070632A2 (en) * 2015-10-23 2017-04-27 President And Fellows Of Harvard College Nucleobase editors and uses thereof
CN106916852A (zh) * 2017-04-13 2017-07-04 上海科技大学 一种碱基编辑系统及其构建和应用方法

Family Cites Families (1777)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4217344A (en) 1976-06-23 1980-08-12 L'oreal Compositions containing aqueous dispersions of lipid spheres
US4235871A (en) 1978-02-24 1980-11-25 Papahadjopoulos Demetrios P Method of encapsulating biologically active materials in lipid vesicles
US4186183A (en) 1978-03-29 1980-01-29 The United States Of America As Represented By The Secretary Of The Army Liposome carriers in chemotherapy of leishmaniasis
US4182449A (en) 1978-04-18 1980-01-08 Kozlow William J Adhesive bandage and package
US4261975A (en) 1979-09-19 1981-04-14 Merck & Co., Inc. Viral liposome particle
US4663290A (en) 1982-01-21 1987-05-05 Molecular Genetics, Inc. Production of reverse transcriptase
US4485054A (en) 1982-10-04 1984-11-27 Lipoderm Pharmaceuticals Limited Method of encapsulating biologically active materials in multilamellar lipid vesicles (MLV)
US4501728A (en) 1983-01-06 1985-02-26 Technology Unlimited, Inc. Masking of liposomes from RES recognition
US4880635B1 (en) 1984-08-08 1996-07-02 Liposome Company Dehydrated liposomes
US4946787A (en) 1985-01-07 1990-08-07 Syntex (U.S.A.) Inc. N-(ω,(ω-1)-dialkyloxy)- and N-(ω,(ω-1)-dialkenyloxy)-alk-1-yl-N,N,N-tetrasubstituted ammonium lipids and uses therefor
US5049386A (en) 1985-01-07 1991-09-17 Syntex (U.S.A.) Inc. N-ω,(ω-1)-dialkyloxy)- and N-(ω,(ω-1)-dialkenyloxy)Alk-1-YL-N,N,N-tetrasubstituted ammonium lipids and uses therefor
US4897355A (en) 1985-01-07 1990-01-30 Syntex (U.S.A.) Inc. N[ω,(ω-1)-dialkyloxy]- and N-[ω,(ω-1)-dialkenyloxy]-alk-1-yl-N,N,N-tetrasubstituted ammonium lipids and uses therefor
US4797368A (en) 1985-03-15 1989-01-10 The United States Of America As Represented By The Department Of Health And Human Services Adeno-associated virus as eukaryotic expression vector
US4921757A (en) 1985-04-26 1990-05-01 Massachusetts Institute Of Technology System for delayed and pulsed release of biologically active substances
US4774085A (en) 1985-07-09 1988-09-27 501 Board of Regents, Univ. of Texas Pharmaceutical administration systems containing a mixture of immunomodulators
US5139941A (en) 1985-10-31 1992-08-18 University Of Florida Research Foundation, Inc. AAV transduction vectors
US4737323A (en) 1986-02-13 1988-04-12 Liposome Technology, Inc. Liposome extrusion method
US5017492A (en) 1986-02-27 1991-05-21 Life Technologies, Inc. Reverse transcriptase and method for its production
DE122007000007I1 (de) 1986-04-09 2007-05-16 Genzyme Corp Genetisch transformierte Tiere, die ein gewünschtes Protein in Milch absondern
US5374553A (en) 1986-08-22 1994-12-20 Hoffmann-La Roche Inc. DNA encoding a thermostable nucleic acid polymerase enzyme from thermotoga maritima
US4889818A (en) 1986-08-22 1989-12-26 Cetus Corporation Purified thermostable enzyme
US5079352A (en) 1986-08-22 1992-01-07 Cetus Corporation Purified thermostable enzyme
US4920016A (en) 1986-12-24 1990-04-24 Linear Technology, Inc. Liposomes with enhanced circulation time
US4837028A (en) 1986-12-24 1989-06-06 Liposome Technology, Inc. Liposomes with enhanced circulation time
JPH0825869B2 (ja) 1987-02-09 1996-03-13 株式会社ビタミン研究所 抗腫瘍剤包埋リポソ−ム製剤
US4917951A (en) 1987-07-28 1990-04-17 Micro-Pak, Inc. Lipid vesicles formed of surfactants and steroids
US4911928A (en) 1987-03-13 1990-03-27 Micro-Pak, Inc. Paucilamellar lipid vesicles
RO108522B1 (ro) 1987-04-23 1994-06-30 Fmc Corp Derivati de di(aril)-cilopropil substituiti si intermediari ai acestora
US4873316A (en) 1987-06-23 1989-10-10 Biogen, Inc. Isolation of exogenous recombinant proteins from the milk of transgenic mammals
ATE115999T1 (de) 1987-12-15 1995-01-15 Gene Shears Pty Ltd Ribozyme.
US5244797B1 (en) 1988-01-13 1998-08-25 Life Technologies Inc Cloned genes encoding reverse transcriptase lacking rnase h activity
US4965185A (en) 1988-06-22 1990-10-23 Grischenko Valentin I Method for low-temperature preservation of embryos
EP1892296A1 (en) 1988-09-02 2008-02-27 Dyax Corporation Generation and selection of recombinant varied binding proteins
US5223409A (en) 1988-09-02 1993-06-29 Protein Engineering Corp. Directed evolution of novel binding proteins
US5270179A (en) 1989-08-10 1993-12-14 Life Technologies, Inc. Cloning and expression of T5 DNA polymerase reduced in 3'- to-5' exonuclease activity
US5047342A (en) 1989-08-10 1991-09-10 Life Technologies, Inc. Cloning and expression of T5 DNA polymerase
EP0451221B1 (en) 1989-08-31 1994-10-12 City Of Hope Chimeric dna-rna catalytic sequences
US5264618A (en) 1990-04-19 1993-11-23 Vical, Inc. Cationic lipids for intracellular delivery of biologically active molecules
US5427908A (en) 1990-05-01 1995-06-27 Affymax Technologies N.V. Recombinant library screening methods
AU7979491A (en) 1990-05-03 1991-11-27 Vical, Inc. Intracellular delivery of biologically active substances by means of self-assembling lipid complexes
US5580737A (en) 1990-06-11 1996-12-03 Nexstar Pharmaceuticals, Inc. High-affinity nucleic acid ligands that discriminate between theophylline and caffeine
US5637459A (en) 1990-06-11 1997-06-10 Nexstar Pharmaceuticals, Inc. Systematic evolution of ligands by exponential enrichment: chimeric selex
DK0550687T3 (da) 1990-09-28 1999-12-13 Hoffmann La Roche 5' til 3'-exonukleasemutationer af termostabile DNA-polymeraser
WO1992006188A2 (en) 1990-10-05 1992-04-16 Barnes Wayne M Thermostable dna polymerase
DE69123979T2 (de) 1990-10-12 1997-04-30 Max Planck Gesellschaft Abgeänderte ribozyme
US5173414A (en) 1990-10-30 1992-12-22 Applied Immune Sciences, Inc. Production of recombinant adeno-associated virus vectors
NZ314629A (en) 1991-01-17 2000-08-25 Gen Hospital Corp Use trans-splicing ribozymes to prepare medicaments for gene therapies
NZ241311A (en) 1991-01-17 1995-03-28 Gen Hospital Corp Rna sequence having trans-splicing activity, plant strains
CA2108147C (en) 1991-04-10 2009-01-06 Angray Kang Heterodimeric receptor libraries using phagemids
DE4216134A1 (de) 1991-06-20 1992-12-24 Europ Lab Molekularbiolog Synthetische katalytische oligonukleotidstrukturen
US6872816B1 (en) 1996-01-24 2005-03-29 Third Wave Technologies, Inc. Nucleic acid detection kits
US5652094A (en) 1992-01-31 1997-07-29 University Of Montreal Nucleozymes
JPH05274181A (ja) 1992-03-25 1993-10-22 Nec Corp ブレークポイント設定・解除方式
US5587308A (en) 1992-06-02 1996-12-24 The United States Of America As Represented By The Department Of Health & Human Services Modified adeno-associated virus vector capable of expression from a novel promoter
US5496714A (en) 1992-12-09 1996-03-05 New England Biolabs, Inc. Modification of protein by use of a controllable interveining protein sequence
US5834247A (en) 1992-12-09 1998-11-10 New England Biolabs, Inc. Modified proteins comprising controllable intervening protein sequences or their elements methods of producing same and methods for purification of a target protein comprised by a modified protein
US5434058A (en) 1993-02-09 1995-07-18 Arch Development Corporation Apolipoprotein B MRNA editing protein compositions and methods
US5436149A (en) 1993-02-19 1995-07-25 Barnes; Wayne M. Thermostable DNA polymerase with enhanced thermostability and enhanced length and efficiency of primer extension
WO1994026877A1 (en) 1993-05-17 1994-11-24 The Regents Of The University Of California Ribozyme gene therapy for hiv infection and aids
US5512462A (en) 1994-02-25 1996-04-30 Hoffmann-La Roche Inc. Methods and reagents for the polymerase chain reaction amplification of long DNA sequences
US5651981A (en) 1994-03-29 1997-07-29 Northwestern University Cationic phospholipids for transfection
US5912155A (en) 1994-09-30 1999-06-15 Life Technologies, Inc. Cloned DNA polymerases from Thermotoga neapolitana
US5614365A (en) 1994-10-17 1997-03-25 President & Fellow Of Harvard College DNA polymerase having modified nucleotide binding site for DNA sequencing
US5449639A (en) 1994-10-24 1995-09-12 Taiwan Semiconductor Manufacturing Company Ltd. Disposable metal anti-reflection coating process used together with metal dry/wet etch
US5767099A (en) 1994-12-09 1998-06-16 Genzyme Corporation Cationic amphiphiles containing amino acid or dervatized amino acid groups for intracellular delivery of therapeutic molecules
US6057153A (en) 1995-01-13 2000-05-02 Yale University Stabilized external guide sequences
US5795587A (en) 1995-01-23 1998-08-18 University Of Pittsburgh Stable lipid-comprising drug delivery complexes and methods for their production
US5830430A (en) 1995-02-21 1998-11-03 Imarx Pharmaceutical Corp. Cationic lipids and the use thereof
US5851548A (en) 1995-06-07 1998-12-22 Gen-Probe Incorporated Liposomes containing cationic lipids and vitamin D
US5773258A (en) 1995-08-25 1998-06-30 Roche Molecular Systems, Inc. Nucleic acid amplification using a reversibly inactivated thermostable enzyme
NO953680D0 (no) 1995-09-18 1995-09-18 Hans Prydz Cellesyklusenzymer
US5962313A (en) 1996-01-18 1999-10-05 Avigen, Inc. Adeno-associated virus vectors comprising a gene encoding a lyosomal enzyme
WO1997044348A1 (en) 1996-05-17 1997-11-27 Thomas Jefferson University Ribozyme-mediated gene replacement
US6887707B2 (en) 1996-10-28 2005-05-03 University Of Washington Induction of viral mutation by incorporation of miscoding ribonucleoside analogs into viral RNA
GB9701425D0 (en) 1997-01-24 1997-03-12 Bioinvent Int Ab A method for in vitro molecular evolution of protein function
US5981182A (en) 1997-03-13 1999-11-09 Albert Einstein College Of Medicine Of Yeshiva University Vector constructs for the selection and identification of open reading frames
US20040203109A1 (en) 1997-06-06 2004-10-14 Incyte Corporation Human regulatory proteins
US5849528A (en) 1997-08-21 1998-12-15 Incyte Pharmaceuticals, Inc.. Polynucleotides encoding a human S100 protein
US6355415B1 (en) 1997-09-29 2002-03-12 Ohio University Compositions and methods for the use of ribozymes to determine gene function
US6156509A (en) 1997-11-12 2000-12-05 Genencor International, Inc. Method of increasing efficiency of directed evolution of a gene using phagemid
US6429301B1 (en) 1998-04-17 2002-08-06 Whitehead Institute For Biomedical Research Use of a ribozyme to join nucleic acids and peptides
US6183998B1 (en) 1998-05-29 2001-02-06 Qiagen Gmbh Max-Volmer-Strasse 4 Method for reversible modification of thermostable enzymes
US8097648B2 (en) 1998-06-17 2012-01-17 Eisai R&D Management Co., Ltd. Methods and compositions for use in treating cancer
WO2000022115A2 (en) 1998-10-13 2000-04-20 Board Of Regents, The University Of Texas System Assays for identifying functional alterations in the p53 tumor suppressor
ATE383331T1 (de) 1998-11-12 2008-01-15 Invitrogen Corp Transportreagentien
US6534261B1 (en) 1999-01-12 2003-03-18 Sangamo Biosciences, Inc. Regulation of endogenous gene expression in cells using zinc finger proteins
US6599692B1 (en) 1999-09-14 2003-07-29 Sangamo Bioscience, Inc. Functional genomics using zinc finger proteins
US7013219B2 (en) 1999-01-12 2006-03-14 Sangamo Biosciences, Inc. Regulation of endogenous gene expression in cells using zinc finger proteins
US6503717B2 (en) 1999-12-06 2003-01-07 Sangamo Biosciences, Inc. Methods of using randomized libraries of zinc finger proteins for the identification of gene function
US6453242B1 (en) 1999-01-12 2002-09-17 Sangamo Biosciences, Inc. Selection of sites for targeting by zinc finger proteins and methods of designing zinc finger proteins to bind to preselected sites
US20090130718A1 (en) 1999-02-04 2009-05-21 Diversa Corporation Gene site saturation mutagenesis
EP1174509A4 (en) 1999-03-29 2003-10-22 Kansai Tech Licensing Org Co NEW CYTIDINE DESAMINASE
US6365410B1 (en) 1999-05-19 2002-04-02 Genencor International, Inc. Directed evolution of microorganisms
GB9920194D0 (en) 1999-08-27 1999-10-27 Advanced Biotech Ltd A heat-stable thermostable DNA polymerase for use in nucleic acid amplification
EP1230268B1 (en) 1999-11-18 2009-10-14 Pharmexa Inc. Heteroclitic analogs of class i epitopes
AU785007B2 (en) 1999-11-24 2006-08-24 Mcs Micro Carrier Systems Gmbh Polypeptides comprising multimers of nuclear localization signals or of protein transduction domains and their use for transferring molecules into cells
CA2398590C (en) 2000-02-08 2012-08-28 Sangamo Biosciences, Inc. Cells for drug discovery
US7378248B2 (en) 2000-03-06 2008-05-27 Rigel Pharmaceuticals, Inc. In vivo production of cyclic peptides for inhibiting protein-protein interaction
US7078208B2 (en) 2000-05-26 2006-07-18 Invitrogen Corporation Thermostable reverse transcriptases and uses thereof
US6573092B1 (en) 2000-10-10 2003-06-03 Genvec, Inc. Method of preparing a eukaryotic viral vector
CA2881568C (en) 2000-10-27 2019-09-24 Novartis Vaccines And Diagnostics, Inc. Nucleic acids and proteins from streptococcus groups a & b
US20040003420A1 (en) 2000-11-10 2004-01-01 Ralf Kuhn Modified recombinase
US7067650B1 (en) 2000-11-22 2006-06-27 National Institute Of Advanced Industrial Science And Technology Ribozymes targeting bradeion transcripts and use thereof
NZ527208A (en) 2001-01-25 2005-05-27 Evolva Ltd Concatemers of differentially expressed multiple genes
US20050222030A1 (en) 2001-02-21 2005-10-06 Anthony Allison Modified annexin proteins and methods for preventing thrombosis
EP1392846B1 (en) 2001-02-27 2008-06-11 University of Rochester METHODS AND COMPOSITIONS FOR MODIFYING APOLIPOPROTEIN B mRNA EDITING
US7476500B1 (en) 2001-03-19 2009-01-13 President And Fellows Of Harvard College In vivo selection system for enzyme activity
US7807408B2 (en) 2001-03-19 2010-10-05 President & Fellows Of Harvard College Directed evolution of proteins
US7678554B2 (en) 2001-03-19 2010-03-16 President And Fellows Of Harvard College Nucleic acid shuffling
EP1423400B2 (en) 2001-03-19 2013-05-22 President and Fellows of Harvard College Evolving new molecular function
IL158419A0 (en) 2001-04-19 2004-05-12 Scripps Research Inst Methods and composition for the production of orthoganal trna-aminoacyl trna synthetase pairs
EP1446757A2 (en) 2001-05-30 2004-08-18 Biomedical Center In silico screening for phenotype-associated expressed sequences
ATE432981T1 (de) 2001-07-26 2009-06-15 Stratagene California Multi-stellen-mutagenese
US20030167533A1 (en) 2002-02-04 2003-09-04 Yadav Narendra S. Intein-mediated protein splicing
ES2421596T3 (es) 2002-05-10 2013-09-04 Medical Res Council Desaminasa inducida por activación (AID)
US20070015238A1 (en) 2002-06-05 2007-01-18 Snyder Richard O Production of pseudotyped recombinant AAV virions
US9388459B2 (en) 2002-06-17 2016-07-12 Affymetrix, Inc. Methods for genotyping
EP1578932A4 (en) 2002-07-12 2006-08-30 Affymetrix Inc SYNTHETIC MARKER GENES
JP4657919B2 (ja) 2002-08-19 2011-03-23 プレジデント アンド フェローズ オブ ハーバード カレッジ 進化する新しい分子機能
WO2004027035A2 (en) 2002-09-20 2004-04-01 Yale University Riboswitches, methods for their use, and compositions for use with riboswitches.
US8017323B2 (en) 2003-03-26 2011-09-13 President And Fellows Of Harvard College Free reactant use in nucleic acid-templated synthesis
CA2515850A1 (en) 2003-04-14 2004-10-28 Caliper Life Sciences, Inc. Reduction of migration shift assay interference
WO2004113495A2 (en) 2003-05-23 2004-12-29 The President And Fellows Of Harvard College Rna-based transcriptional regulators
WO2005002527A2 (en) 2003-07-03 2005-01-13 Massachusetts Institute Of Technology Sirt1 modulation of adipogenesis and adipose function
MXPA06000242A (es) 2003-07-07 2006-04-07 Scripps Research Inst Composiciones de pares de lisil-trna ortogonal y aminoacil- trna sintetasa y sus usos.
WO2005014791A2 (en) 2003-08-08 2005-02-17 Sangamo Biosciences, Inc. Methods and compositions for targeted cleavage and recombination
US7670807B2 (en) 2004-03-10 2010-03-02 East Tennessee State Univ. Research Foundation RNA-dependent DNA polymerase from Geobacillus stearothermophilus
WO2005098043A2 (en) 2004-03-30 2005-10-20 The President And Fellows Of Harvard College Ligand-dependent protein splicing
US7595179B2 (en) 2004-04-19 2009-09-29 Applied Biosystems, Llc Recombinant reverse transcriptases
US7919277B2 (en) 2004-04-28 2011-04-05 Danisco A/S Detection and typing of bacterial strains
US7476734B2 (en) 2005-12-06 2009-01-13 Helicos Biosciences Corporation Nucleotide analogs
US9012140B2 (en) 2004-07-06 2015-04-21 Societe de Commercialisation des Produits de la Recherche Appliquée Socpra Sciences et Génie S.E.C. Target-dependent nucleic acid adapter
US7851658B2 (en) 2004-08-17 2010-12-14 President And Fellows Of Harvard College Palladium-catalyzed carbon-carbon bond forming reactions
WO2006023207A2 (en) 2004-08-19 2006-03-02 The United States Of America As Represented By The Secretary Of Health And Human Services, Nih Coacervate of anionic and cationic polymer forming microparticles for the sustained release of therapeutic agents
EP1799825B1 (en) 2004-10-05 2011-06-29 The California Institute of Technology Aptamer regulated nucleic acids and uses thereof
US8178291B2 (en) 2005-02-18 2012-05-15 Monogram Biosciences, Inc. Methods and compositions for determining hypersusceptibility of HIV-1 to non-nucleoside reverse transcriptase inhibitors
JP2006248978A (ja) 2005-03-10 2006-09-21 Mebiopharm Co Ltd 新規なリポソーム製剤
US8183178B2 (en) 2005-06-17 2012-05-22 President And Fellows Of Harvard College Iterated branching reaction pathways via nucleic acid-mediated chemistry
WO2007011722A2 (en) 2005-07-15 2007-01-25 President And Fellows Of Harvard College Reaction discovery system
US9783791B2 (en) 2005-08-10 2017-10-10 Agilent Technologies, Inc. Mutant reverse transcriptase and methods of use
ES2398918T3 (es) 2005-08-26 2013-03-22 Dupont Nutrition Biosciences Aps Un método y una ordenación para soportar verticalmente elementos de resistencia eléctrica pendientes
AU2012244264B2 (en) 2005-08-26 2015-08-06 Dupont Nutrition Biosciences Aps Use
AU2015252023B2 (en) 2005-08-26 2017-06-29 Dupont Nutrition Biosciences Aps Use
KR100784478B1 (ko) 2005-12-05 2007-12-11 한국과학기술원 기능요소의 동시 삽입에 의한 신기능을 갖는 단백질을제조하는 방법
US20080051317A1 (en) 2005-12-15 2008-02-28 George Church Polypeptides comprising unnatural amino acids, methods for their production and uses therefor
EP2604255B1 (en) 2006-05-05 2017-10-25 Molecular Transfer, Inc. Novel reagents for transfection of eukaryotic cells
DK2426220T3 (en) 2006-05-19 2016-09-26 Dupont Nutrition Biosci Aps Labeled microorganisms, and methods for labeling
EP3045532A1 (en) 2006-06-02 2016-07-20 President and Fellows of Harvard College Protein surface remodeling
WO2008005529A2 (en) 2006-07-07 2008-01-10 The Trustees Columbia University In The City Of New York Cell-mediated directed evolution
US20120322861A1 (en) 2007-02-23 2012-12-20 Barry John Byrne Compositions and Methods for Treating Diseases
ES2719789T3 (es) 2007-03-02 2019-07-16 Dupont Nutrition Biosci Aps Cultivos con resistencia mejorada a fagos
FR2919804B1 (fr) 2007-08-08 2010-08-27 Erytech Pharma Composition et vaccin therapeutique anti-tumoral
WO2009033027A2 (en) 2007-09-05 2009-03-12 Medtronic, Inc. Suppression of scn9a gene expression and/or function for the treatment of pain
CN101883863B (zh) 2007-09-27 2018-01-23 桑格摩生物科学股份有限公司 生物活性核酸酶的快速体内鉴定
US9029524B2 (en) 2007-12-10 2015-05-12 California Institute Of Technology Signal activated RNA interference
EP2087789A1 (en) 2008-02-06 2009-08-12 Heinrich-Heine-Universität Düsseldorf Fto-modified non-human mammal
US20090215878A1 (en) 2008-02-08 2009-08-27 Sangamo Biosciences, Inc. Treatment of chronic pain with zinc finger proteins
GB0806562D0 (en) 2008-04-10 2008-05-14 Fermentas Uab Production of nucleic acid
WO2009146179A1 (en) 2008-04-15 2009-12-03 University Of Iowa Research Foundation Zinc finger nuclease for the cftr gene and methods of use thereof
EP2297182A4 (en) 2008-04-28 2012-08-15 Harvard College SUPER-LOADED PROTEINS FOR CELL PENETRATION
US8394604B2 (en) 2008-04-30 2013-03-12 Paul Xiang-Qin Liu Protein splicing using short terminal split inteins
WO2010011961A2 (en) 2008-07-25 2010-01-28 University Of Georgia Research Foundation, Inc. Prokaryotic rnai-like system and methods of use
JP2010033344A (ja) 2008-07-29 2010-02-12 Azabu Jui Gakuen 核酸構成塩基の偏在性を表す方法
EP2159286A1 (en) 2008-09-01 2010-03-03 Consiglio Nazionale Delle Ricerche Method for obtaining oligonucleotide aptamers and uses thereof
US8790664B2 (en) 2008-09-05 2014-07-29 Institut National De La Sante Et De La Recherche Medicale (Inserm) Multimodular assembly useful for intracellular delivery
US9023594B2 (en) 2008-09-05 2015-05-05 President And Fellows Of Harvard College Continuous directed evolution of proteins and nucleic acids
US8636884B2 (en) 2008-09-15 2014-01-28 Abbott Diabetes Care Inc. Cationic polymer based wired enzyme formulations for use in analyte sensors
US20100076057A1 (en) 2008-09-23 2010-03-25 Northwestern University TARGET DNA INTERFERENCE WITH crRNA
US9404098B2 (en) 2008-11-06 2016-08-02 University Of Georgia Research Foundation, Inc. Method for cleaving a target RNA using a Cas6 polypeptide
US10662227B2 (en) 2008-11-07 2020-05-26 Dupont Nutrition Biosciences Aps Bifidobacteria CRISPR sequences
US20110016540A1 (en) 2008-12-04 2011-01-20 Sigma-Aldrich Co. Genome editing of genes associated with trinucleotide repeat expansion disorders in animals
US9175338B2 (en) 2008-12-11 2015-11-03 Pacific Biosciences Of California, Inc. Methods for identifying nucleic acid modifications
WO2010068289A2 (en) 2008-12-11 2010-06-17 Pacific Biosciences Of California, Inc. Classification of nucleic acid templates
WO2010075424A2 (en) 2008-12-22 2010-07-01 The Regents Of University Of California Compositions and methods for downregulating prokaryotic genes
US8389679B2 (en) 2009-02-05 2013-03-05 The Regents Of The University Of California Targeted antimicrobial moieties
US20100305197A1 (en) 2009-02-05 2010-12-02 Massachusetts Institute Of Technology Conditionally Active Ribozymes And Uses Thereof
WO2010102085A2 (en) 2009-03-04 2010-09-10 Board Of Regents, The University Of Texas System Stabilized reverse transcriptase fusion proteins
CN105274004B (zh) 2009-03-06 2019-08-09 合成基因组股份有限公司 用于克隆和操作基因组的方法
AU2010245304B2 (en) 2009-04-27 2015-06-04 Pacific Biosciences Of California, Inc. Real-time sequencing methods and systems
JP2012525146A (ja) 2009-04-28 2012-10-22 プレジデント アンド フェロウズ オブ ハーバード カレッジ 細胞透過のための過剰に荷電されたタンパク質
WO2010132092A2 (en) 2009-05-12 2010-11-18 The Scripps Research Institute Cytidine deaminase fusions and related methods
WO2010144150A2 (en) 2009-06-12 2010-12-16 Pacific Biosciences Of California, Inc. Real-time analytical methods and systems
CA2765488C (en) 2009-06-30 2018-01-02 Sangamo Biosciences, Inc. Rapid screening of biologically active nucleases and isolation of nuclease-modified cells
US8569256B2 (en) 2009-07-01 2013-10-29 Protiva Biotherapeutics, Inc. Cationic lipids and methods for the delivery of therapeutic agents
DK2462230T3 (en) 2009-08-03 2015-10-19 Recombinetics Inc METHODS AND COMPOSITIONS FOR TARGETED RE-MODIFICATION
US20120178647A1 (en) 2009-08-03 2012-07-12 The General Hospital Corporation Engineering of zinc finger arrays by context-dependent assembly
GB0913681D0 (en) 2009-08-05 2009-09-16 Glaxosmithkline Biolog Sa Immunogenic composition
US8889394B2 (en) 2009-09-07 2014-11-18 Empire Technology Development Llc Multiple domain proteins
CA2779495C (en) 2009-10-30 2019-04-30 Synthetic Genomics, Inc. Encoding text into nucleic acid sequences
IL297588A (en) 2009-11-02 2022-12-01 Univ Washington Therapeutic nuclease preparations and methods
US9175340B2 (en) 2009-11-04 2015-11-03 President And Fellows Of Harvard College Reactivity-dependent and interaction-dependent PCR
US20110104787A1 (en) 2009-11-05 2011-05-05 President And Fellows Of Harvard College Fusion Peptides That Bind to and Modify Target Nucleic Acid Sequences
US20110142886A1 (en) 2009-12-01 2011-06-16 Intezyne Technologies, Incorporated Pegylated polyplexes for polynucleotide delivery
PT3338765T (pt) 2009-12-01 2019-03-18 Translate Bio Inc Derivado de esteróide adequado para a administração de arnm em doenças genéticas humanas
AU2010327998B2 (en) 2009-12-10 2015-11-12 Iowa State University Research Foundation, Inc. TAL effector-mediated DNA modification
EP2513296A4 (en) 2009-12-18 2013-05-22 Univ Leland Stanford Junior USE OF CYTIDINE DAMINASE ASSOCIATED ACTIVITIES TO PROMOTE DEMETHYLATION AND CELL REPROGRAMMEIRING
CA2787494C (en) 2010-01-22 2019-09-17 Dow Agrosciences Llc Targeted genomic alteration
KR101951489B1 (ko) 2010-01-22 2019-04-22 다우 아그로사이언시즈 엘엘씨 유전적으로 변형된 유기체에서 도입유전자의 절제
US9198983B2 (en) 2010-01-25 2015-12-01 Alnylam Pharmaceuticals, Inc. Compositions and methods for inhibiting expression of Mylip/Idol gene
WO2011109031A1 (en) 2010-03-05 2011-09-09 Synthetic Genomics, Inc. Methods for cloning and manipulating genomes
US8557961B2 (en) 2010-04-02 2013-10-15 Amunix Operating Inc. Alpha 1-antitrypsin compositions and methods of making and using same
MX2012013037A (es) 2010-05-10 2013-07-29 Univ California Composiciones de endorribonucleasa y metodos de uso de las mismas.
WO2011146121A1 (en) 2010-05-17 2011-11-24 Sangamo Biosciences, Inc. Novel dna-binding proteins and uses thereof
GB201008267D0 (en) 2010-05-18 2010-06-30 Univ Edinburgh Cationic lipids
US20130164271A1 (en) 2010-05-27 2013-06-27 Max-Planck-Gesellschaft Zur Foederug Der Wissensch E.V. Tailored recombinase for recombining asymmetric target sites in a plurality of retrovirus strains
DK2575767T3 (en) 2010-06-04 2017-03-13 Sirna Therapeutics Inc HOWEVER UNKNOWN LOW MOLECULAR CATIONIC LIPIDS TO PROCESS OIGONUCLEOTIDES
EP2580331A4 (en) 2010-06-14 2013-11-27 Univ Iowa State Res Found Inc NUCLEASE ACTIVITY OF THE TAL EFFECTOR AND FUSION PROTEIN FOKI
US8975232B2 (en) 2010-07-29 2015-03-10 President And Fellows Of Harvard College Macrocyclic kinase inhibitors and uses thereof
US8822663B2 (en) 2010-08-06 2014-09-02 Moderna Therapeutics, Inc. Engineered nucleic acids and methods of use thereof
JPWO2012020759A1 (ja) 2010-08-13 2013-10-28 国立大学法人京都大学 変異型逆転写酵素
CA2821504C (en) 2010-09-20 2019-03-26 Spi Pharma, Inc. Microencapsulation process and product
EA201390586A1 (ru) 2010-10-20 2014-11-28 ДюПон НЬЮТРИШН БАЙОСАЙЕНСИЗ АпС Последовательности crispr-cas lactococcus
US9458484B2 (en) 2010-10-22 2016-10-04 Bio-Rad Laboratories, Inc. Reverse transcriptase mixtures with improved storage stability
US9405700B2 (en) 2010-11-04 2016-08-02 Sonics, Inc. Methods and apparatus for virtualization in an integrated circuit
US20140005269A1 (en) 2010-11-26 2014-01-02 University Of The Witwatersrand, Johannesburg Polymeric matrix of polymer-lipid nanoparticles as a pharmaceutical dosage form
KR101255338B1 (ko) 2010-12-15 2013-04-16 포항공과대학교 산학협력단 표적 세포에 대한 폴리뉴클레오티드 전달체
EP2651400B2 (en) 2010-12-16 2023-01-18 Amgen (Europe) GmbH Controlled release oral dosage forms of poorly soluble drugs and uses thereof
US9394537B2 (en) 2010-12-22 2016-07-19 President And Fellows Of Harvard College Continuous directed evolution
US9499592B2 (en) 2011-01-26 2016-11-22 President And Fellows Of Harvard College Transcription activator-like effectors
KR101818126B1 (ko) 2011-02-09 2018-01-15 (주)바이오니아 열안정성이 증가된 역전사효소
US9528124B2 (en) 2013-08-27 2016-12-27 Recombinetics, Inc. Efficient non-meiotic allele introgression
WO2012125445A2 (en) 2011-03-11 2012-09-20 President And Fellows Of Harvard College Small molecule-dependent inteins and uses thereof
US9164079B2 (en) 2011-03-17 2015-10-20 Greyledge Technologies Llc Systems for autologous biological therapeutics
US20120244601A1 (en) 2011-03-22 2012-09-27 Bertozzi Carolyn R Riboswitch based inducible gene expression platform
JP2012210172A (ja) 2011-03-30 2012-11-01 Japan Science & Technology Agency 外部環境に応答して内部の物質組成を変えるリポソーム
US8709466B2 (en) 2011-03-31 2014-04-29 International Business Machines Corporation Cationic polymers for antimicrobial applications and delivery of bioactive materials
WO2012138939A1 (en) 2011-04-05 2012-10-11 Philippe Duchateau New tale-protein scaffolds and uses thereof
US10092660B2 (en) 2011-04-25 2018-10-09 Stc.Unm Solid compositions for pharmaceutical use
BR112013025567B1 (pt) 2011-04-27 2021-09-21 Amyris, Inc Métodos para modificação genômica
WO2012158985A2 (en) 2011-05-17 2012-11-22 Transposagen Biopharmaceuticals, Inc. Methods for site-specific genetic modification in spermatogonial stem cells using zinc finger nuclease (zfn) for the creation of model organisms
US8691750B2 (en) 2011-05-17 2014-04-08 Axolabs Gmbh Lipids and compositions for intracellular delivery of biologically active compounds
US20140201858A1 (en) 2011-05-17 2014-07-17 Transposagen Biopharmaceuticals, Inc Methods for site-specific genetic modification in stem cells using xanthomonas tal nucleases (xtn) for the creation of model organisms
WO2012164565A1 (en) 2011-06-01 2012-12-06 Yeda Research And Development Co. Ltd. Compositions and methods for downregulating prokaryotic genes
BR112013031553A2 (pt) 2011-06-08 2020-11-10 Shire Human Genetic Therapies, Inc. composições, mrna que codifica para uma hgla e seu uso, uso de pelo menos uma molécula de mrna e um veículo de transferência e uso de um mrna que codifica para proteína exógena
WO2013006451A2 (en) 2011-07-01 2013-01-10 President And Fellows Of Harvard College Macrocyclic insulin-degrading enzyme (ide) inhibitors and uses thereof
WO2013012674A1 (en) 2011-07-15 2013-01-24 The General Hospital Corporation Methods of transcription activator like effector assembly
CN103857797A (zh) 2011-07-19 2014-06-11 帷幄生物技术公司 用于修复软骨损伤的非遗传修饰性重编程细胞的组合物和方法
EP2734621B1 (en) 2011-07-22 2019-09-04 President and Fellows of Harvard College Evaluation and improvement of nuclease cleavage specificity
WO2013039857A1 (en) 2011-09-12 2013-03-21 modeRNA Therapeutics Engineered nucleic acids and methods of use thereof
EP3384938A1 (en) 2011-09-12 2018-10-10 Moderna Therapeutics, Inc. Engineered nucleic acids and methods of use thereof
RU2633510C2 (ru) 2011-09-28 2017-10-12 Рибомик Инк. Аптамер против ngf и его применение
KR102096534B1 (ko) 2011-09-28 2020-04-03 에라 바이오테크, 에스.에이. 분할된 인테인 및 그의 이용
LT2788487T (lt) 2011-12-08 2018-09-10 Sarepta Therapeutics, Inc. Oligonukleotido analogai, nukreipti į žmogaus lmna
EP2791160B1 (en) 2011-12-16 2022-03-02 ModernaTX, Inc. Modified mrna compositions
US11458157B2 (en) 2011-12-16 2022-10-04 Targetgene Biotechnologies Ltd. Compositions and methods for modifying a predetermined target nucleic acid sequence
GB201122458D0 (en) 2011-12-30 2012-02-08 Univ Wageningen Modified cascade ribonucleoproteins and uses thereof
WO2013119602A1 (en) 2012-02-06 2013-08-15 President And Fellows Of Harvard College Arrdc1-mediated microvesicles (armms) and uses thereof
KR101833589B1 (ko) 2012-02-24 2018-03-02 프레드 헛친슨 켄서 리서치 센터 이상혈색소증 치료를 위한 조성물 및 방법
BR112014021104B1 (pt) 2012-02-29 2023-03-28 Sangamo Biosciences, Inc Proteína de fusão de ocorrência não natural compreendendo um domínio de ligação de dna de dedo de zinco manipulado que se liga a um gene htt, seu uso, método in vitro de modificação da expressão de um gene htt em uma célula, e método de geração de um sistema modelo para o estudo da doença de huntington
EP3360560A1 (en) 2012-03-17 2018-08-15 The Regents of the University of California Composition for treating acne
US9637739B2 (en) 2012-03-20 2017-05-02 Vilnius University RNA-directed DNA cleavage by the Cas9-crRNA complex
WO2013141680A1 (en) 2012-03-20 2013-09-26 Vilnius University RNA-DIRECTED DNA CLEAVAGE BY THE Cas9-crRNA COMPLEX
WO2013152359A1 (en) 2012-04-06 2013-10-10 The Regents Of The University Of California Novel tetrazines and method of synthesizing the same
CN104245940A (zh) 2012-04-23 2014-12-24 拜尔作物科学公司 植物中的靶向基因组工程
NZ701060A (en) 2012-05-02 2016-10-28 Sangamo Biosciences Inc Targeted modification of malate dehydrogenase
RU2650819C2 (ru) 2012-05-07 2018-04-17 Сангамо Терапьютикс, Инк. Способы и композиции для опосредованной нуклеазой направленной интеграции трансгенов
WO2013169398A2 (en) 2012-05-09 2013-11-14 Georgia Tech Research Corporation Systems and methods for improving nuclease specificity and activity
ES2962571T3 (es) 2012-05-25 2024-03-19 Cellectis Métodos para modificar células T alogénicas y resistentes a la inmunosupresión para inmunoterapia
US20150017136A1 (en) 2013-07-15 2015-01-15 Cellectis Methods for engineering allogeneic and highly active t cell for immunotherapy
DE202013012242U1 (de) 2012-05-25 2016-02-02 Emmanuelle Charpentier Zusammensetzungen für die durch RNA gesteuerte Modifikation einer Ziel-DNA und für die durch RNA gesteuerte Modulation der Transkription
US20150376645A1 (en) 2012-05-30 2015-12-31 Baylor College Of Medicine Supercoiled minivectors as a tool for dna repair, alteration and replacement
US9102936B2 (en) 2012-06-11 2015-08-11 Agilent Technologies, Inc. Method of adaptor-dimer subtraction using a CRISPR CAS6 protein
RU2014153918A (ru) 2012-06-12 2016-07-27 Дженентек, Инк. Способы и композиции для получения условно нокаутных аллелей
EP2674501A1 (en) 2012-06-14 2013-12-18 Agence nationale de sécurité sanitaire de l'alimentation,de l'environnement et du travail Method for detecting and identifying enterohemorrhagic Escherichia coli
WO2013188638A2 (en) 2012-06-15 2013-12-19 The Regents Of The University Of California Endoribonucleases and methods of use thereof
CA2877290A1 (en) 2012-06-19 2013-12-27 Daniel F. Voytas Gene targeting in plants using dna viruses
US9267127B2 (en) 2012-06-21 2016-02-23 President And Fellows Of Harvard College Evolution of bond-forming enzymes
PL2877490T3 (pl) 2012-06-27 2019-03-29 The Trustees Of Princeton University Inteiny podzielone, koniugaty i ich zastosowania
PL2867361T3 (pl) 2012-06-29 2018-07-31 Massachusetts Institute Of Technology Masowo równoległa genetyka kombinatoryczna
US9125508B2 (en) 2012-06-30 2015-09-08 Seasons 4, Inc. Collapsible tree system
JP6329537B2 (ja) 2012-07-11 2018-05-23 サンガモ セラピューティクス, インコーポレイテッド 生物学的薬剤の送達のための方法および組成物
WO2014011237A1 (en) 2012-07-11 2014-01-16 Sangamo Biosciences, Inc. Methods and compositions for the treatment of lysosomal storage diseases
CN105188767A (zh) 2012-07-25 2015-12-23 布罗德研究所有限公司 可诱导的dna结合蛋白和基因组干扰工具及其应用
US10058078B2 (en) 2012-07-31 2018-08-28 Recombinetics, Inc. Production of FMDV-resistant livestock by allele substitution
WO2014020608A1 (en) 2012-07-31 2014-02-06 Yeda Research And Development Co. Ltd. Methods of diagnosing and treating motor neuron diseases
EP2880171B1 (en) 2012-08-03 2018-10-03 The Regents of The University of California Methods and compositions for controlling gene expression by rna processing
KR102218562B1 (ko) 2012-08-29 2021-02-19 상가모 테라퓨틱스, 인코포레이티드 유전적 병태를 치료하기 위한 방법 및 조성물
US9937205B2 (en) 2012-09-04 2018-04-10 The Trustees Of The University Of Pennsylvania Inhibition of diacylglycerol kinase to augment adoptive T cell transfer
KR102141259B1 (ko) 2012-09-04 2020-08-05 셀렉티스 멀티―체인 키메라 항원 수용체 및 그것의 용도들
KR102596125B1 (ko) 2012-09-04 2023-10-30 더 스크립스 리서치 인스티튜트 표적화된 바인딩 특이도를 갖는 키메라 폴리펩타이드들
US20140075593A1 (en) 2012-09-07 2014-03-13 Dow Agrosciences Llc Fluorescence activated cell sorting (facs) enrichment to generate plants
CN105264067B (zh) 2012-09-07 2020-11-10 美国陶氏益农公司 Fad3性能基因座及相应的能够诱导靶向断裂的靶位点特异性结合蛋白
UA118090C2 (uk) 2012-09-07 2018-11-26 ДАУ АГРОСАЙЄНСІЗ ЕлЕлСі Спосіб інтегрування послідовності нуклеїнової кислоти, що представляє інтерес, у ген fad2 у клітині сої та специфічний для локусу fad2 білок, що зв'язується, здатний індукувати спрямований розрив
UA119135C2 (uk) 2012-09-07 2019-05-10 ДАУ АГРОСАЙЄНСІЗ ЕлЕлСі Спосіб отримання трансгенної рослини
WO2014043143A1 (en) 2012-09-11 2014-03-20 Life Technologies Corporation Nucleic acid amplification
GB201216564D0 (en) 2012-09-17 2012-10-31 Univ Edinburgh Genetically edited animal
WO2014047103A2 (en) 2012-09-18 2014-03-27 The Translational Genomics Research Institute Isolated genes and transgenic organisms for producing biofuels
US9181535B2 (en) 2012-09-24 2015-11-10 The Chinese University Of Hong Kong Transcription activator-like effector nucleases (TALENs)
CN104822830B (zh) 2012-10-03 2021-07-09 谷万达公司 内含肽修饰的蛋白酶、其制备方法和工业用途
JO3470B1 (ar) 2012-10-08 2020-07-05 Merck Sharp & Dohme مشتقات 5- فينوكسي-3h-بيريميدين-4-أون واستخدامها كمثبطات ناسخ عكسي ل hiv
AU2013329186B2 (en) 2012-10-10 2019-02-14 Sangamo Therapeutics, Inc. T cell modifying compounds and uses thereof
EP2906602B1 (en) 2012-10-12 2019-01-16 The General Hospital Corporation Transcription activator-like effector (tale) - lysine-specific demethylase 1 (lsd1) fusion proteins
DE202013012597U1 (de) 2012-10-23 2017-11-21 Toolgen, Inc. Zusammensetzung zum Spalten einer Ziel-DNA, umfassend eine für die Ziel-DNA spezifische guide-RNA und eine Cas-Protein-codierende Nukleinsäure oder ein Cas-Protein, sowie deren Verwendung
US20140115728A1 (en) 2012-10-24 2014-04-24 A. Joseph Tector Double knockout (gt/cmah-ko) pigs, organs and tissues
AU2013337951B2 (en) 2012-10-30 2019-10-03 Recombinetics, Inc. Control of sexual maturation in animals
AR093296A1 (es) 2012-10-31 2015-05-27 Kiss György Botond Identificacion de un gen de resistencia a xanthomonas euvesicatoria de pimienta (capsicum annuum) y metodo para generar plantas a esa resistencia
BR112015009812A2 (pt) 2012-10-31 2017-08-22 Cellectis Método para a inserção genética específica em um genoma de planta, célula de planta transformada e seu uso, planta resistente a herbicidas, kit, vetor, e célula hospedeira
RU2711249C2 (ru) 2012-11-01 2020-01-15 Фэктор Байосайенс Инк. Способы и продукты для экспрессии белков в клетках
US20150315576A1 (en) 2012-11-01 2015-11-05 Massachusetts Institute Of Technology Genetic device for the controlled destruction of dna
US20140127752A1 (en) 2012-11-07 2014-05-08 Zhaohui Zhou Method, composition, and reagent kit for targeted genomic enrichment
WO2014072941A1 (en) 2012-11-09 2014-05-15 Marco Archetti Diffusible factors and cancer cells
WO2014081855A1 (en) 2012-11-20 2014-05-30 Universite De Montreal Methods and compositions for muscular dystrophies
EP2922960A4 (en) 2012-11-20 2016-06-29 Cold Spring Harbor Lab MUTATIONS FOR SOLANACEAE PLANTS FOR MODULATING SPRING ARCHITECTURE AND IMPROVING PERFORMANCE-RELATED PHENOTYPES
CN104884626A (zh) 2012-11-20 2015-09-02 杰.尔.辛普洛公司 Tal介导的转移dna插入
CN109554350B (zh) 2012-11-27 2022-09-23 儿童医疗中心有限公司 用于胎儿血红蛋白再诱导的靶向bcl11a远端调控元件
US20140150135A1 (en) 2012-11-29 2014-05-29 North Carolina State University Synthetic Pathway for Biological Carbon Dioxide Sequestration
WO2014085830A2 (en) 2012-11-30 2014-06-05 The Parkinson's Institute Screening assays for therapeutics for parkinson's disease
WO2014082644A1 (en) 2012-11-30 2014-06-05 WULFF, Peter, Samuel Circular rna for inhibition of microrna
JP2016500254A (ja) 2012-12-05 2016-01-12 サンガモ バイオサイエンシーズ, インコーポレイテッド 代謝疾患の調節のための方法および組成物
PL3138910T3 (pl) 2012-12-06 2018-01-31 Sigma Aldrich Co Llc Oparta na CRISPR modyfikacja i regulacja genomu
PT2929029T (pt) 2012-12-06 2018-10-04 Synthetic Genomics Inc Mutantes de algas tendo um fenótipo de aclimatação a luminosidade intensa incluido
US9447422B2 (en) 2012-12-06 2016-09-20 Synthetic Genomics, Inc. Autonomous replication sequences and episomal DNA molecules
US10272163B2 (en) 2012-12-07 2019-04-30 The Regents Of The University Of California Factor VIII mutation repair and tolerance induction
US9914931B2 (en) 2012-12-07 2018-03-13 Synthetic Genomics, Inc. Nannochloropsis spliced leader sequences and uses therefor
WO2014093479A1 (en) 2012-12-11 2014-06-19 Montana State University Crispr (clustered regularly interspaced short palindromic repeats) rna-guided control of gene regulation
WO2014093694A1 (en) 2012-12-12 2014-06-19 The Broad Institute, Inc. Crispr-cas nickase systems, methods and compositions for sequence manipulation in eukaryotes
WO2014093701A1 (en) 2012-12-12 2014-06-19 The Broad Institute, Inc. Functional genomics using crispr-cas systems, compositions, methods, knock out libraries and applications thereof
SG10201707569YA (en) 2012-12-12 2017-10-30 Broad Inst Inc Delivery, Engineering and Optimization of Systems, Methods and Compositions for Sequence Manipulation and Therapeutic Applications
JP6552965B2 (ja) 2012-12-12 2019-07-31 ザ・ブロード・インスティテュート・インコーポレイテッド 配列操作のための改善された系、方法および酵素組成物のエンジニアリングおよび最適化
US20140186843A1 (en) 2012-12-12 2014-07-03 Massachusetts Institute Of Technology Methods, systems, and apparatus for identifying target sequences for cas enzymes or crispr-cas systems for target sequences and conveying results thereof
EP3434776A1 (en) 2012-12-12 2019-01-30 The Broad Institute, Inc. Methods, models, systems, and apparatus for identifying target sequences for cas enzymes or crispr-cas systems for target sequences and conveying results thereof
PL2931898T3 (pl) 2012-12-12 2016-09-30 Le Cong Projektowanie i optymalizacja systemów, sposoby i kompozycje do manipulacji sekwencją z domenami funkcjonalnymi
MX2015007549A (es) 2012-12-12 2017-01-20 Broad Inst Inc Modificaciones de sistemas, métodos y composiciones guía optimizadas para la manipulación de secuencias.
ES2635244T3 (es) 2012-12-12 2017-10-03 The Broad Institute, Inc. Sistemas, métodos y composiciones de componentes de CRISPR-Cas para manipulación de secuencias
US8697359B1 (en) 2012-12-12 2014-04-15 The Broad Institute, Inc. CRISPR-Cas systems and methods for altering expression of gene products
US20140189896A1 (en) 2012-12-12 2014-07-03 Feng Zhang Crispr-cas component systems, methods and compositions for sequence manipulation
AU2013358998B2 (en) 2012-12-13 2019-04-18 Massachusetts Institute Of Technology Recombinase-based logic and memory systems
MX2015007574A (es) 2012-12-13 2015-10-22 Dow Agrosciences Llc Gen de precision dirigido a un locus particular en el maiz.
RU2678001C2 (ru) 2012-12-13 2019-01-22 ДАУ АГРОСАЙЕНСИЗ ЭлЭлСи Способы обнаружения днк для сайт-специфической нуклеазной активности
WO2014099744A1 (en) 2012-12-17 2014-06-26 President And Fellows Of Harvard College Rna-guided human genome engineering
US9708589B2 (en) 2012-12-18 2017-07-18 Monsanto Technology Llc Compositions and methods for custom site-specific DNA recombinases
CA2895909C (en) 2012-12-21 2021-07-06 Cellectis Potatoes with reduced cold-induced sweetening
EP2938184B1 (en) 2012-12-27 2018-10-31 Keygene N.V. Method for removing genetic linkage in a plant
EP2943579B1 (en) 2013-01-10 2018-09-12 Dharmacon, Inc. Libraries and methods for generating molecules
CN105142396A (zh) 2013-01-14 2015-12-09 重组股份有限公司 缺角家畜
EP3919505B1 (en) 2013-01-16 2023-08-30 Emory University Uses of cas9-nucleic acid complexes
CN103233028B (zh) 2013-01-25 2015-05-13 南京徇齐生物技术有限公司 一种无物种限制无生物安全性问题的真核生物基因打靶方法及螺旋结构dna序列
WO2014123967A2 (en) 2013-02-05 2014-08-14 University Of Georgia Research Foundation, Inc. Cell lines for virus production and methods of use
US10660943B2 (en) 2013-02-07 2020-05-26 The Rockefeller University Sequence specific antimicrobials
US11466306B2 (en) 2013-02-14 2022-10-11 Osaka University Method for isolating specific genomic regions with use of molecule capable of specifically binding to endogenous DNA sequence
WO2014127287A1 (en) 2013-02-14 2014-08-21 Massachusetts Institute Of Technology Method for in vivo tergated mutagenesis
EP2958990B1 (en) 2013-02-20 2019-10-16 Regeneron Pharmaceuticals, Inc. Genetic modification of rats
US20150353885A1 (en) 2013-02-21 2015-12-10 Cellectis Method to counter-select cells or organisms by linking loci to nuclease components
ES2522765B2 (es) 2013-02-22 2015-03-18 Universidad De Alicante Método para dectectar inserciones de espaciadores en estructuras CRISPR
EP2958996B1 (en) 2013-02-25 2019-10-16 Sangamo Therapeutics, Inc. Methods and compositions for enhancing nuclease-mediated gene disruption
JP2016507244A (ja) 2013-02-27 2016-03-10 ヘルムホルツ・ツェントルム・ミュンヒェン・ドイチェス・フォルシュンクスツェントルム・フューア・ゲズントハイト・ウント・ウムベルト(ゲーエムベーハー)Helmholtz Zentrum MuenchenDeutsches Forschungszentrum fuer Gesundheit und Umwelt (GmbH) Cas9ヌクレアーゼによる卵母細胞における遺伝子編集
WO2014138379A1 (en) 2013-03-06 2014-09-12 The Johns Hopkins University The telomerator-a tool for chromosome engineering
US10612043B2 (en) 2013-03-09 2020-04-07 Agilent Technologies, Inc. Methods of in vivo engineering of large sequences using multiple CRISPR/cas selections of recombineering events
US10329574B2 (en) 2013-03-12 2019-06-25 E I Du Pont De Nemours And Company Methods for the identification of variant recognition sites for rare-cutting engineered double-strand-break-inducing agents and compositions and uses thereof
CA2904210C (en) 2013-03-12 2022-07-19 Sangamo Biosciences, Inc. Methods and compositions for modification of hla
EP2970923B1 (en) 2013-03-13 2018-04-11 President and Fellows of Harvard College Mutants of cre recombinase
EP2970940B1 (en) 2013-03-14 2018-07-25 Translate Bio, Inc. Mrna therapeutic compositions and use to treat diseases and disorders
WO2014150624A1 (en) 2013-03-14 2014-09-25 Caribou Biosciences, Inc. Compositions and methods of nucleic acid-targeting nucleic acids
US20160138027A1 (en) 2013-03-14 2016-05-19 The Board Of Trustees Of The Leland Stanford Junior University Treatment of diseases and conditions associated with dysregulation of mammalian target of rapamycin complex 1 (mtorc1)
US20140283156A1 (en) 2013-03-14 2014-09-18 Cold Spring Harbor Laboratory Trans-splicing ribozymes and silent recombinases
WO2014204578A1 (en) 2013-06-21 2014-12-24 The General Hospital Corporation Using rna-guided foki nucleases (rfns) to increase specificity for rna-guided genome editing
MY183741A (en) 2013-03-15 2021-03-10 Cibus Us Llc Methods and compositions for increasing efficiency of targeted gene modification using oligonucleotide-mediated gene repair
US20140273230A1 (en) 2013-03-15 2014-09-18 Sigma-Aldrich Co., Llc Crispr-based genome modification and regulation
WO2014144094A1 (en) 2013-03-15 2014-09-18 J.R. Simplot Company Tal-mediated transfer dna insertion
KR102210319B1 (ko) 2013-03-15 2021-02-01 더 제너럴 하스피탈 코포레이션 특정 게놈 좌위에 대한 유전적 및 후성적 조절 단백질의 rna-안내 표적화
US10760064B2 (en) 2013-03-15 2020-09-01 The General Hospital Corporation RNA-guided targeting of genetic and epigenomic regulatory proteins to specific genomic loci
WO2014145736A2 (en) 2013-03-15 2014-09-18 Transposagen Biopharmaceuticals, Inc. Reproducible method for testis-mediated genetic modification (tgm) and sperm-mediated genetic modification (sgm)
US20140349400A1 (en) 2013-03-15 2014-11-27 Massachusetts Institute Of Technology Programmable Modification of DNA
US9234213B2 (en) 2013-03-15 2016-01-12 System Biosciences, Llc Compositions and methods directed to CRISPR/Cas genomic engineering systems
US11332719B2 (en) 2013-03-15 2022-05-17 The Broad Institute, Inc. Recombinant virus and preparations thereof
MX2015011985A (es) 2013-03-15 2016-04-07 Univ Minnesota Ingenieria genomica de plantas utilizando sistemas crispr/cas.
CA2906970C (en) 2013-03-21 2021-05-18 Ospedale San Raffaele Srl Targeted disruption of t cell receptor genes using engineered zinc finger protein nucleases
WO2014161821A1 (en) 2013-04-02 2014-10-09 Bayer Cropscience Nv Targeted genome engineering in eukaryotes
ES2831315T3 (es) 2013-04-03 2021-06-08 Memorial Sloan Kettering Cancer Center Generación efectiva de células T dirigidas al tumor derivadas de células madre pluripotentes
WO2014165825A2 (en) 2013-04-04 2014-10-09 President And Fellows Of Harvard College Therapeutic uses of genome editing with crispr/cas systems
CA2908253C (en) 2013-04-04 2024-01-09 Trustees Of Dartmouth College Compositions and methods for in vivo excision of hiv-1 proviral dna
CN105263312A (zh) 2013-04-05 2016-01-20 美国陶氏益农公司 用于在植物基因组内整合外源序列的方法和组合物
US20150056629A1 (en) 2013-04-14 2015-02-26 Katriona Guthrie-Honea Compositions, systems, and methods for detecting a DNA sequence
US20160186208A1 (en) 2013-04-16 2016-06-30 Whitehead Institute For Biomedical Research Methods of Mutating, Modifying or Modulating Nucleic Acid in a Cell or Nonhuman Mammal
EP2986709A4 (en) 2013-04-16 2017-03-15 University Of Washington Through Its Center For Commercialization Activating an alternative pathway for homology-directed repair to stimulate targeted gene correction and genome engineering
HUE040575T2 (hu) 2013-04-16 2019-03-28 Regeneron Pharma A patkány genom célzott módosítása
WO2014176355A1 (en) 2013-04-23 2014-10-30 President And Fellows Of Harvard College In situ interaction determination
EP2796558A1 (en) 2013-04-23 2014-10-29 Rheinische Friedrich-Wilhelms-Universität Bonn Improved gene targeting and nucleic acid carrier molecule, in particular for use in plants
CN103224947B (zh) 2013-04-28 2015-06-10 陕西师范大学 一种基因打靶系统
US10471099B2 (en) 2013-05-10 2019-11-12 Whitehead Institute For Biomedical Research In vitro production of red blood cells with proteins comprising sortase recognition motifs
US10604771B2 (en) 2013-05-10 2020-03-31 Sangamo Therapeutics, Inc. Delivery methods and compositions for nuclease-mediated genome engineering
EP2997141B1 (en) 2013-05-13 2022-10-12 Cellectis Cd19 specific chimeric antigen receptor and uses thereof
EP2997133B1 (en) 2013-05-13 2023-08-23 Cellectis Methods for engineering highly active t cell for immunotherapy
CN105683376A (zh) 2013-05-15 2016-06-15 桑格摩生物科学股份有限公司 用于治疗遗传病状的方法和组合物
WO2014186686A2 (en) 2013-05-17 2014-11-20 Two Blades Foundation Targeted mutagenesis and genome engineering in plants using rna-guided cas nucleases
EP3778899A1 (en) 2013-05-22 2021-02-17 Northwestern University Rna-directed dna cleavage and gene editing by cas9 enzyme from neisseria meningitidis
ES2645393T3 (es) 2013-05-29 2017-12-05 Cellectis Métodos de manipulación de linfocitos T para inmunoterapia usando el sistema de nucleasa Cas guiada por ARN
JP6670743B2 (ja) 2013-05-29 2020-03-25 セレクティスCellectis Ii型crisprシステムにおける新規のコンパクトなcas9足場
US9873907B2 (en) 2013-05-29 2018-01-23 Agilent Technologies, Inc. Method for fragmenting genomic DNA using CAS9
JP7065564B2 (ja) 2013-05-29 2022-05-12 セレクティス Cas9ニッカーゼ活性を用いて正確なdna切断をもたらすための方法
US20150067922A1 (en) 2013-05-30 2015-03-05 The Penn State Research Foundation Gene targeting and genetic modification of plants via rna-guided genome editing
US20140359796A1 (en) 2013-05-31 2014-12-04 Recombinetics, Inc. Genetically sterile animals
ES2716867T3 (es) 2013-05-31 2019-06-17 Cellectis Sa Endonucleasa de asentamiento LAGLIDADG que escinde el gen de receptor de células T alfa y usos de la misma
WO2014191525A1 (en) 2013-05-31 2014-12-04 Cellectis A laglidadg homing endonuclease cleaving the c-c chemokine receptor type-5 (ccr5) gene and uses thereof
US20140356956A1 (en) 2013-06-04 2014-12-04 President And Fellows Of Harvard College RNA-Guided Transcriptional Regulation
WO2014197568A2 (en) 2013-06-04 2014-12-11 President And Fellows Of Harvard College Rna-guideded transcriptional regulation
EP3539573B1 (en) 2013-06-05 2024-02-14 Duke University Rna-guided gene editing and gene regulation
US20150315252A1 (en) 2013-06-11 2015-11-05 Clontech Laboratories, Inc. Protein enriched microvesicles and methods of making and using the same
EP3008181B1 (en) 2013-06-11 2019-11-06 The Regents of The University of California Methods and compositions for target dna modification
EP3008192B1 (en) 2013-06-11 2019-07-17 Takara Bio USA, Inc. Protein enriched microvesicles and methods of making and using the same
JP2016521561A (ja) 2013-06-14 2016-07-25 セレクティス 植物における非トランスジェニックのゲノム編集のための方法
KR20160034901A (ko) 2013-06-17 2016-03-30 더 브로드 인스티튜트, 인코퍼레이티드 서열 조작에 최적화된 crispr-cas 이중 닉카아제 시스템, 방법 및 조성물
EP3011032B1 (en) 2013-06-17 2019-10-16 The Broad Institute, Inc. Delivery, engineering and optimization of systems, methods and compositions for targeting and modeling diseases and disorders of post mitotic cells
RU2716421C2 (ru) 2013-06-17 2020-03-11 Те Брод Инститьют Инк. Доставка, применение и применения в терапии систем crispr-cas и композиций для целенаправленного воздействия на нарушения и заболевания с использованием вирусных компонентов
WO2014204727A1 (en) 2013-06-17 2014-12-24 The Broad Institute Inc. Functional genomics using crispr-cas systems, compositions methods, screens and applications thereof
AU2014281026B2 (en) 2013-06-17 2020-05-28 Massachusetts Institute Of Technology Delivery, engineering and optimization of tandem guide systems, methods and compositions for sequence manipulation
EP3011035B1 (en) 2013-06-17 2020-05-13 The Broad Institute, Inc. Assay for quantitative evaluation of target site cleavage by one or more crispr-cas guide sequences
BR112015031608A2 (pt) 2013-06-17 2017-08-22 Massachusetts Inst Technology Aplicação e uso dos sistemas crispr-cas, vetores e composições para direcionamento e terapia hepáticos
CA2915467A1 (en) 2013-06-19 2014-12-24 Sigma Aldrich Co. Llc Targeted integration
EP3013939A1 (en) 2013-06-25 2016-05-04 Cellectis Modified diatoms for biofuel production
US20160369268A1 (en) 2013-07-01 2016-12-22 The Board Of Regents Of The University Of Texas System Transcription activator-like effector (tale) libraries and methods of synthesis and use
SG10201913026TA (en) 2013-07-09 2020-02-27 Harvard College Multiplex rna-guided genome engineering
JP2016528890A (ja) 2013-07-09 2016-09-23 プレジデント アンド フェローズ オブ ハーバード カレッジ CRISPR/Cas系を用いるゲノム編集の治療用の使用
SG10201913015XA (en) 2013-07-10 2020-02-27 Harvard College Orthogonal cas9 proteins for rna-guided gene regulation and editing
CA2916905A1 (en) 2013-07-10 2015-01-15 Novartis Ag Multiple proteases deficient filamentous fungal cells and methods of use thereof
CN105555132B (zh) 2013-07-10 2018-07-17 约瑟夫·A·玛吉朱布 Mrap2敲除
PL3019619T3 (pl) 2013-07-11 2022-01-10 Modernatx, Inc. Kompozycje zawierające syntetyczne polinkleotydy kodujące białka powiązane z crispr i syntetyczne sgrna oraz sposoby ich stosowania
WO2015007194A1 (zh) 2013-07-16 2015-01-22 中国科学院上海生命科学研究院 植物基因组定点修饰方法
WO2015010114A1 (en) 2013-07-19 2015-01-22 Larix Bioscience, Llc Methods and compositions for producing double allele knock outs
GB201313235D0 (en) 2013-07-24 2013-09-04 Univ Edinburgh Antiviral Compositions Methods and Animals
CN103388006B (zh) 2013-07-26 2015-10-28 华东师范大学 一种基因定点突变的构建方法
US11306328B2 (en) 2013-07-26 2022-04-19 President And Fellows Of Harvard College Genome engineering
US10421957B2 (en) 2013-07-29 2019-09-24 Agilent Technologies, Inc. DNA assembly using an RNA-programmable nickase
WO2015017866A1 (en) 2013-08-02 2015-02-05 Enevolv, Inc. Processes and host cells for genome, pathway, and biomolecular engineering
ITTO20130669A1 (it) 2013-08-05 2015-02-06 Consiglio Nazionale Ricerche Vettore adeno-associato ricombinante muscolo-specifico e suo impiego nel trattamento di patologie muscolari
US9163284B2 (en) 2013-08-09 2015-10-20 President And Fellows Of Harvard College Methods for identifying a target site of a Cas9 nuclease
WO2015021426A1 (en) 2013-08-09 2015-02-12 Sage Labs, Inc. A crispr/cas system-based novel fusion protein and its application in genome editing
WO2015021990A1 (en) 2013-08-16 2015-02-19 University Of Copenhagen Rna probing method and reagents
WO2015024017A2 (en) 2013-08-16 2015-02-19 President And Fellows Of Harvard College Rna polymerase, methods of purification and methods of use
CA2921778A1 (en) 2013-08-20 2015-02-26 Universiteit Gent Inhibition of a lncrna for treatment of melanoma
EP3611268A1 (en) 2013-08-22 2020-02-19 E. I. du Pont de Nemours and Company Plant genome modification using guide rna/cas endonuclease systems and methods of use
US9359599B2 (en) 2013-08-22 2016-06-07 President And Fellows Of Harvard College Engineered transcription activator-like effector (TALE) domains and uses thereof
GB201315321D0 (en) 2013-08-28 2013-10-09 Koninklijke Nederlandse Akademie Van Wetenschappen Transduction Buffer
JP6588438B2 (ja) 2013-08-28 2019-10-09 サンガモ セラピューティクス, インコーポレイテッド Dna結合ドメインと切断ドメインとを連結するための組成物
CN106102781A (zh) 2013-08-29 2016-11-09 英联邦高等教育系统天普大学 用于hiv感染的rna指导的治疗的方法和组合物
JP6535333B2 (ja) 2013-09-04 2019-06-26 シーエスアイアール 遺伝子発現をサイレンシングする遺伝子制御エレメントを標的とする部位特異的ヌクレアーゼ単一細胞アッセイ
EP3041345B1 (de) 2013-09-04 2024-05-01 KWS SAAT SE & Co. KGaA Helminthosporium turcicum-resistente pflanze
WO2015034885A1 (en) 2013-09-04 2015-03-12 Dow Agrosciences Llc Rapid targeting analysis in crops for determining donor insertion
EP3041498B1 (en) 2013-09-05 2022-02-16 Massachusetts Institute of Technology Tuning microbial populations with programmable nucleases
WO2016070129A1 (en) 2014-10-30 2016-05-06 President And Fellows Of Harvard College Delivery of negatively charged proteins using cationic lipids
US9388430B2 (en) 2013-09-06 2016-07-12 President And Fellows Of Harvard College Cas9-recombinase fusion proteins and uses thereof
US9526784B2 (en) 2013-09-06 2016-12-27 President And Fellows Of Harvard College Delivery system for functional nucleases
US9340799B2 (en) 2013-09-06 2016-05-17 President And Fellows Of Harvard College MRNA-sensing switchable gRNAs
WO2015040075A1 (en) 2013-09-18 2015-03-26 Genome Research Limited Genomic screening methods using rna-guided endonucleases
DE202014010413U1 (de) 2013-09-18 2015-12-08 Kymab Limited Zellen und Organismen
WO2015042393A2 (en) 2013-09-20 2015-03-26 President And Fellows Of Harvard College Evolved sortases and uses thereof
US10526616B2 (en) 2013-09-23 2020-01-07 Rensselaer Polytechnic Institute Nanoparticle-mediated gene delivery, genomic editing and ligand-targeted modification in various cell populations
US20160237455A1 (en) 2013-09-27 2016-08-18 Editas Medicine, Inc. Crispr-related methods and compositions
WO2015048690A1 (en) 2013-09-27 2015-04-02 The Regents Of The University Of California Optimized small guide rnas and methods of use
CA2925050A1 (en) 2013-09-30 2015-04-02 The Regents Of The University Of California Identification of cxcr8, a novel chemokine receptor
WO2015048707A2 (en) 2013-09-30 2015-04-02 Regents Of The University Of Minnesota Conferring resistance to geminiviruses in plants using crispr/cas systems
WO2015051191A1 (en) 2013-10-02 2015-04-09 Northeastern University Methods and compositions for generation of developmentally-incompetent eggs in recipients of nuclear genetic transfer
JP5774657B2 (ja) 2013-10-04 2015-09-09 国立大学法人京都大学 エレクトロポレーションを利用した哺乳類の遺伝子改変方法
WO2015054315A1 (en) 2013-10-07 2015-04-16 Northeastern University Methods and compositions for ex vivo generation of developmentally competent eggs from germ line cells using autologous cell systems
DE102013111099B4 (de) 2013-10-08 2023-11-30 Eberhard Karls Universität Tübingen Medizinische Fakultät Permanente Genkorrektur mittels nukleotidmodifizierter messenger RNA
JP2015076485A (ja) 2013-10-08 2015-04-20 株式会社ジャパンディスプレイ 表示装置
WO2015052231A2 (en) 2013-10-08 2015-04-16 Technical University Of Denmark Multiplex editing system
US20150098954A1 (en) 2013-10-08 2015-04-09 Elwha Llc Compositions and Methods Related to CRISPR Targeting
AU2014333776B2 (en) 2013-10-11 2021-01-28 Cellectis Methods and kits for detecting nucleic acid sequences of interest using DNA-binding protein domain
WO2015057671A1 (en) 2013-10-14 2015-04-23 The Broad Institute, Inc. Artificial transcription factors comprising a sliding domain and uses thereof
EP3057994B1 (en) 2013-10-15 2020-09-23 The Scripps Research Institute Peptidic chimeric antigen receptor t cell switches and uses thereof
ES2741308T3 (es) 2013-10-15 2020-02-10 Scripps Research Inst Interruptores de células T con receptores de antígenos quiméricos y usos de los mismos
US10117899B2 (en) 2013-10-17 2018-11-06 Sangamo Therapeutics, Inc. Delivery methods and compositions for nuclease-mediated genome engineering in hematopoietic stem cells
CN110713995B (zh) 2013-10-17 2023-08-01 桑格摩生物科学股份有限公司 用于核酸酶介导的基因组工程改造的递送方法和组合物
US10759764B2 (en) 2013-10-18 2020-09-01 President And Fellows Of Harvard College Fluorination of organic compounds
KR102251168B1 (ko) 2013-10-25 2021-05-13 셀렉티스 고 반복 모티프를 포함하는 dna 서열에 대한 효율적이고 특이적인 표적화를 위한 희소-절단 엔도뉴클레아제의 설계
WO2015065964A1 (en) 2013-10-28 2015-05-07 The Broad Institute Inc. Functional genomics using crispr-cas systems, compositions, methods, screens and applications thereof
WO2015066119A1 (en) 2013-10-30 2015-05-07 North Carolina State University Compositions and methods related to a type-ii crispr-cas system in lactobacillus buchneri
US9909131B2 (en) 2013-11-04 2018-03-06 Dow Agrosciences Llc Optimal soybean loci
US10233465B2 (en) 2013-11-04 2019-03-19 Dow Agrosciences Llc Optimal soybean loci
BR102014027438B1 (pt) 2013-11-04 2022-09-27 Dow Agrosciences Llc Molécula de ácido nucleico recombinante e método de produção de uma célula vegetal transgênica
MX360318B (es) 2013-11-04 2018-10-29 Dow Agrosciences Llc Óptimos loci de maíz.
US10077449B2 (en) 2013-11-04 2018-09-18 Dow Agrosciences Llc Universal donor system for gene targeting
US10752906B2 (en) 2013-11-05 2020-08-25 President And Fellows Of Harvard College Precise microbiota engineering at the cellular level
DK3066201T3 (en) 2013-11-07 2018-06-06 Editas Medicine Inc CRISPR-RELATED PROCEDURES AND COMPOSITIONS WITH LEADING GRADES
US20160282354A1 (en) 2013-11-08 2016-09-29 The Broad Institute, Inc. Compositions and methods for selecting a treatment for b-cell neoplasias
US20150132263A1 (en) 2013-11-11 2015-05-14 Radiant Genomics, Inc. Compositions and methods for targeted gene disruption in prokaryotes
NZ719477A (en) 2013-11-11 2022-05-27 Sangamo Therapeutics Inc Methods and compositions for treating huntington’s disease
SI3068881T1 (sl) 2013-11-13 2019-05-31 Children's Medical Center Corporation Z nukleazo posredovano uravnavanje izražanja genov
CA2930590C (en) 2013-11-15 2021-02-16 The United States Of America, As Represented By The Secretary, Department Of Health And Human Services Engineering neural stem cells using homologous recombination
KR20160091920A (ko) 2013-11-18 2016-08-03 예일 유니버시티 트랜스포존 조성물 및 이의 이용 방법
AU2014350051A1 (en) 2013-11-18 2016-07-07 Crispr Therapeutics Ag CRISPR-Cas system materials and methods
US10787684B2 (en) 2013-11-19 2020-09-29 President And Fellows Of Harvard College Large gene excision and insertion
WO2015075056A1 (en) 2013-11-19 2015-05-28 Thermo Fisher Scientific Baltics Uab Programmable enzymes for isolation of specific dna fragments
US9074199B1 (en) 2013-11-19 2015-07-07 President And Fellows Of Harvard College Mutant Cas9 proteins
WO2015075154A2 (en) 2013-11-20 2015-05-28 Fondazione Telethon Artificial dna-binding proteins and uses thereof
WO2015075175A1 (en) 2013-11-22 2015-05-28 Cellectis Method for generating batches of allogeneic t-cells with averaged potency
AU2014351482B2 (en) 2013-11-22 2020-08-20 Mina Therapeutics Limited C/EBP alpha short activating RNA compositions and methods of use
WO2015075195A1 (en) 2013-11-22 2015-05-28 Cellectis Method of engineering chemotherapy drug resistant t-cells for immunotherapy
CN103642836A (zh) 2013-11-26 2014-03-19 苏州同善生物科技有限公司 一种基于crispr基因敲除技术建立脆性x综合症灵长类动物模型的方法
CN103614415A (zh) 2013-11-27 2014-03-05 苏州同善生物科技有限公司 一种基于crispr基因敲除技术建立肥胖症大鼠动物模型的方法
JP2016538001A (ja) 2013-11-28 2016-12-08 ホライズン・ジェノミクス・ゲーエムベーハー 体細胞半数体ヒト細胞株
ES2813367T3 (es) 2013-12-09 2021-03-23 Sangamo Therapeutics Inc Métodos y composiciones para ingeniería genómica
MX2016007654A (es) 2013-12-11 2017-08-15 Regeneron Pharma Metodos y composiciones para la modificacion dirigida de un genoma.
BR112016013201B1 (pt) 2013-12-12 2023-01-31 The Broad Institute, Inc. Uso de uma composição compreendendo um sistema crispr-cas no tratamento de uma doença genética ocular
EP3080266B1 (en) 2013-12-12 2021-02-03 The Regents of The University of California Methods and compositions for modifying a single stranded target nucleic acid
EP3080271B1 (en) 2013-12-12 2020-02-12 The Broad Institute, Inc. Systems, methods and compositions for sequence manipulation with optimized functional crispr-cas systems
WO2015089364A1 (en) 2013-12-12 2015-06-18 The Broad Institute Inc. Crystal structure of a crispr-cas system, and uses thereof
KR20160097327A (ko) 2013-12-12 2016-08-17 더 브로드 인스티튜트, 인코퍼레이티드 유전자 산물, 구조 정보 및 유도성 모듈형 cas 효소의 발현의 변경을 위한 crispr-cas 시스템 및 방법
EP3079726B1 (en) 2013-12-12 2018-12-05 The Broad Institute, Inc. Delivery, use and therapeutic applications of the crispr-cas systems and compositions for targeting disorders and diseases using particle delivery components
EP3080259B1 (en) 2013-12-12 2023-02-01 The Broad Institute, Inc. Engineering of systems, methods and optimized guide compositions with new architectures for sequence manipulation
SG10201804974RA (en) 2013-12-12 2018-07-30 Broad Inst Inc Compositions and Methods of Use of Crispr-Cas Systems in Nucleotide Repeat Disorders
SG10201804975PA (en) 2013-12-12 2018-07-30 Broad Inst Inc Delivery, Use and Therapeutic Applications of the Crispr-Cas Systems and Compositions for HBV and Viral Diseases and Disorders
CA2932948A1 (en) 2013-12-13 2015-06-18 Cellectis New method of selection of algal-transformed cells using nuclease
US20160304893A1 (en) 2013-12-13 2016-10-20 Cellectis Cas9 nuclease platform for microalgae genome engineering
US20150191744A1 (en) 2013-12-17 2015-07-09 University Of Massachusetts Cas9 effector-mediated regulation of transcription, differentiation and gene editing/labeling
EP3083958B1 (en) 2013-12-19 2019-04-17 Amyris, Inc. Methods for genomic integration
KR20160102056A (ko) 2013-12-26 2016-08-26 더 제너럴 하스피탈 코포레이션 멀티플렉스 가이드 rna
DK3090062T3 (da) 2013-12-30 2020-09-21 Univ Pittsburgh Commonwealth Sys Higher Education Fusionsgener associeret med fremadskridende prostatakræft
CN103668472B (zh) 2013-12-31 2014-12-24 北京大学 利用CRISPR/Cas9系统构建真核基因敲除文库的方法
US9963689B2 (en) 2013-12-31 2018-05-08 The Regents Of The University Of California Cas9 crystals and methods of use thereof
WO2015105928A1 (en) 2014-01-08 2015-07-16 President And Fellows Of Harvard College Rna-guided gene drives
MX2016009243A (es) 2014-01-14 2017-03-08 Lam Therapeutics Inc Métodos de mutagénesis.
US10774338B2 (en) 2014-01-16 2020-09-15 The Regents Of The University Of California Generation of heritable chimeric plant traits
EP3097196B1 (en) 2014-01-20 2019-09-11 President and Fellows of Harvard College Negative selection and stringency modulation in continuous evolution systems
WO2015109752A1 (en) 2014-01-21 2015-07-30 The Institute Of Genetics And Developmental Biology Chinese Academy Of Sciences Modified plants
GB201400962D0 (en) 2014-01-21 2014-03-05 Kloehn Peter C Screening for target-specific affinity binders using RNA interference
WO2015112790A2 (en) 2014-01-24 2015-07-30 Children's Medical Center Corporation High-throughput mouse model for optimizing antibody affinities
WO2015112896A2 (en) 2014-01-24 2015-07-30 North Carolina State University Methods and compositions for sequences guiding cas9 targeting
WO2015113063A1 (en) 2014-01-27 2015-07-30 Georgia Tech Research Corporation Methods and systems for identifying crispr/cas off-target sites
CN104805078A (zh) 2014-01-28 2015-07-29 北京大学 用于高效基因组编辑的rna分子的设计、合成及其应用
US9850525B2 (en) 2014-01-29 2017-12-26 Agilent Technologies, Inc. CAS9-based isothermal method of detection of specific DNA sequence
WO2015117041A1 (en) 2014-01-30 2015-08-06 Nair Ramesh B Gene modification-mediated methods and compositions for generating dominant traits in eukaryotic systems
US10233456B2 (en) 2014-01-30 2019-03-19 The Board Of Trustees Of The University Of Arkansas Method, vectors, cells, seeds and kits for stacking genes into a single genomic site
GB201401707D0 (en) 2014-01-31 2014-03-19 Sec Dep For Health The Adeno-associated viral vectors
EP4249036A3 (en) 2014-01-31 2023-10-25 Factor Bioscience Inc. Methods and products for nucleic acid production and delivery
WO2015115903A1 (en) 2014-02-03 2015-08-06 Academisch Ziekenhuis Leiden H.O.D.N. Lumc Site-specific dna break-induced genome editing using engineered nucleases
PL3102673T3 (pl) 2014-02-03 2020-11-02 Sangamo Therapeutics, Inc. Sposoby i kompozycje do leczenia talasemii beta
DK3102722T3 (da) 2014-02-04 2020-11-16 Jumpcode Genomics Inc Genom fraktionering
DK3102680T3 (en) 2014-02-07 2019-04-08 Vib Vzw INHIBITION OF NEAT1 FOR TREATMENT OF SOLID TUMORS
PL3105328T3 (pl) 2014-02-11 2020-10-19 The Regents Of The University Of Colorado, A Body Corporate Umożliwiana przez CRISPR multipleksowa modyfikacja genomu
CN113265394A (zh) 2014-02-13 2021-08-17 宝生物工程(美国) 有限公司 从核酸的初始集合中耗尽靶分子的方法、以及用于实践其的组合物和试剂盒
AU2015216875B2 (en) 2014-02-14 2021-02-25 Cellectis Cells for immunotherapy engineered for targeting antigen present both on immune cells and pathological cells
JP2017506893A (ja) 2014-02-18 2017-03-16 デューク ユニバーシティ ウイルス複製不活化組成物並びにその製造方法及び使用
US10041135B2 (en) 2014-02-20 2018-08-07 Dsm Ip Assets B.V. Phage insensitive Streptococcus thermophilus
EP3107552B1 (en) 2014-02-21 2018-03-28 Cellectis Method for in situ inhibition of regulatory t cells
US10370680B2 (en) 2014-02-24 2019-08-06 Sangamo Therapeutics, Inc. Method of treating factor IX deficiency using nuclease-mediated targeted integration
US20170015994A1 (en) 2014-02-24 2017-01-19 Massachusetts Institute Of Technology Methods for in vivo genome editing
WO2015129686A1 (ja) 2014-02-25 2015-09-03 国立研究開発法人 農業生物資源研究所 標的dnaに変異が導入された植物細胞、及びその製造方法
CA3194412A1 (en) 2014-02-27 2015-09-03 Monsanto Technology Llc Compositions and methods for site directed genomic modification
CN103820454B (zh) 2014-03-04 2016-03-30 上海金卫生物技术有限公司 CRISPR-Cas9特异性敲除人PD1基因的方法以及用于特异性靶向PD1基因的sgRNA
CN103820441B (zh) 2014-03-04 2017-05-17 黄行许 CRISPR‑Cas9特异性敲除人CTLA4基因的方法以及用于特异性靶向CTLA4基因的sgRNA
EP3613854A1 (en) 2014-03-05 2020-02-26 National University Corporation Kobe University Genomic sequence modification method for specifically converting nucleic acid bases of targeted dna sequence, and molecular complex for use in same
WO2015134812A1 (en) 2014-03-05 2015-09-11 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating usher syndrome and retinitis pigmentosa
US9938521B2 (en) 2014-03-10 2018-04-10 Editas Medicine, Inc. CRISPR/CAS-related methods and compositions for treating leber's congenital amaurosis 10 (LCA10)
EP4368705A2 (en) 2014-03-11 2024-05-15 Cellectis Method for generating t-cells compatible for allogenic transplantation
EP3858376A1 (en) 2014-03-12 2021-08-04 Precision Biosciences, Inc. Dystrophin gene exon deletion using engineered nucleases
WO2015138870A2 (en) 2014-03-13 2015-09-17 The Trustees Of The University Of Pennsylvania Compositions and methods for targeted epigenetic modification
WO2015138855A1 (en) 2014-03-14 2015-09-17 The Regents Of The University Of California Vectors and methods for fungal genome engineering by crispr-cas9
EA201691581A1 (ru) 2014-03-14 2017-02-28 Кибус Юс Ллс Способы и композиции для повышения эффективности направленной модификации генов с применением опосредованной олигонуклеотидами репарации генов
AU2015231353B2 (en) 2014-03-18 2020-11-05 Sangamo Therapeutics, Inc. Methods and compositions for regulation of zinc finger protein expression
EP3126498A4 (en) 2014-03-20 2017-08-23 Université Laval Crispr-based methods and products for increasing frataxin levels and uses thereof
KR20220100728A (ko) 2014-03-21 2022-07-15 더 보드 어브 트러스티스 어브 더 리랜드 스탠포드 주니어 유니버시티 뉴클레아제 없는 게놈 편집
US10451633B2 (en) 2014-03-24 2019-10-22 IMMCO Diagnostics, Inc. Anti-nuclear antibody detection and diagnostics for systemic and non-systemic autoimmune disorders
RS58337B1 (sr) 2014-03-24 2019-03-29 Translate Bio Inc Irnk terapija za lečenje očnih oboljenja
WO2015148680A1 (en) 2014-03-25 2015-10-01 Ginkgo Bioworks, Inc. Methods and genetic systems for cell engineering
WO2015148670A1 (en) 2014-03-25 2015-10-01 Editas Medicine Inc. Crispr/cas-related methods and compositions for treating hiv infection and aids
US11242525B2 (en) 2014-03-26 2022-02-08 Editas Medicine, Inc. CRISPR/CAS-related methods and compositions for treating sickle cell disease
WO2015148860A1 (en) 2014-03-26 2015-10-01 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating beta-thalassemia
US10349639B2 (en) 2014-03-26 2019-07-16 University Of Maryland, College Park Targeted genome editing in zygotes of domestic large animals
US9609415B2 (en) 2014-03-26 2017-03-28 Bose Corporation Headphones with cable management
BR112016022553A2 (pt) 2014-03-28 2017-08-15 Aposense Ltd Compostos e métodos para entrega transmembrana de moléculas?
US9993563B2 (en) 2014-03-28 2018-06-12 Aposense Ltd. Compounds and methods for trans-membrane delivery of molecules
WO2015153791A1 (en) 2014-04-01 2015-10-08 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating herpes simplex virus type 2 (hsv-2)
WO2015153760A2 (en) 2014-04-01 2015-10-08 Sangamo Biosciences, Inc. Methods and compositions for prevention or treatment of a nervous system disorder
EP4123024A1 (en) 2014-04-01 2023-01-25 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating herpes simplex virus type 1 (hsv-1)
US20170029850A1 (en) 2014-04-02 2017-02-02 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating primary open angle glaucoma
US10507232B2 (en) 2014-04-02 2019-12-17 University Of Florida Research Foundation, Incorporated Materials and methods for the treatment of latent viral infection
CN103911376B (zh) 2014-04-03 2017-02-15 黄行许 CRISPR‑Cas9靶向敲除乙肝病毒cccDNA及其特异性sgRNA
EP3126503A1 (en) 2014-04-03 2017-02-08 Massachusetts Institute Of Technology Methods and compositions for the production of guide rna
JP2017512481A (ja) 2014-04-08 2017-05-25 ノースカロライナ ステート ユニバーシティーNorth Carolina State University Crispr関連遺伝子を用いた、rna依存性の転写抑制のための方法および組成物
EP3556858A3 (en) 2014-04-09 2020-01-22 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating cystic fibrosis
WO2015157534A1 (en) 2014-04-10 2015-10-15 The Regents Of The University Of California Methods and compositions for using argonaute to modify a single stranded target nucleic acid
WO2015155341A1 (en) 2014-04-11 2015-10-15 Cellectis Method for generating immune cells resistant to arginine and/or tryptophan depleted microenvironment
CN103923911B (zh) 2014-04-14 2016-06-08 上海金卫生物技术有限公司 CRISPR-Cas9特异性敲除人CCR5基因的方法以及用于特异性靶向CCR5基因的sgRNA
HUE051354T2 (hu) 2014-04-14 2021-03-01 Nemesis Bioscience Ltd Terapeutikum
KR102406585B1 (ko) 2014-04-14 2022-06-07 맥스시티 인코포레이티드 게놈 dna를 변형하기 위한 방법 및 조성물
GB201406968D0 (en) 2014-04-17 2014-06-04 Green Biologics Ltd Deletion mutants
GB201406970D0 (en) 2014-04-17 2014-06-04 Green Biologics Ltd Targeted mutations
JP2017513485A (ja) 2014-04-18 2017-06-01 エディタス・メディシン,インコーポレイテッド がん免疫療法のためのcrispr−cas関連方法、組成物および構成要素
CN105039399A (zh) 2014-04-23 2015-11-11 复旦大学 多能干细胞-遗传性心肌病心肌细胞及其制备方法
US9522936B2 (en) 2014-04-24 2016-12-20 Sangamo Biosciences, Inc. Engineered transcription activator like effector (TALE) proteins
US20170076039A1 (en) 2014-04-24 2017-03-16 Institute For Basic Science A Method of Selecting a Nuclease Target Sequence for Gene Knockout Based on Microhomology
KR20160145186A (ko) 2014-04-24 2016-12-19 보드 오브 리전츠, 더 유니버시티 오브 텍사스 시스템 입양 세포 요법 생성물을 생성하기 위한 유도 만능 줄기 세포의 응용
CN111647627A (zh) 2014-04-28 2020-09-11 重组股份有限公司 多重基因编辑
JP2017513506A (ja) 2014-04-28 2017-06-01 ダウ アグロサイエンシィズ エルエルシー ハプロイドトウモロコシ形質転換
WO2015168158A1 (en) 2014-04-28 2015-11-05 Fredy Altpeter Targeted genome editing to modify lignin biosynthesis and cell wall composition
WO2015167766A1 (en) 2014-04-29 2015-11-05 Seattle Children's Hospital (dba Seattle Children's Research Institute) Ccr5 disruption of cells expressing anti-hiv chimeric antigen receptor (car) derived from broadly neutralizing antibodies
WO2015168404A1 (en) 2014-04-30 2015-11-05 Massachusetts Institute Of Technology Toehold-gated guide rna for programmable cas9 circuitry with rna input
WO2015165275A1 (zh) 2014-04-30 2015-11-05 清华大学 利用tale转录抑制子在哺乳动物细胞中模块化构建合成基因线路
CN104178506B (zh) 2014-04-30 2017-03-01 清华大学 Taler蛋白通过空间位阻发挥转录抑制作用及其应用
WO2015165276A1 (zh) 2014-04-30 2015-11-05 清华大学 利用tale转录抑制子在哺乳动物细胞中模块化构建合成基因线路的试剂盒
JP2017514476A (ja) 2014-05-01 2017-06-08 ユニバーシティ・オブ・ワシントン アデノウイルスベクターを用いたインビボでの遺伝子操作
GB201407852D0 (en) 2014-05-02 2014-06-18 Iontas Ltd Preparation of libraries od protein variants expressed in eukaryotic cells and use for selecting binding molecules
WO2015171603A1 (en) 2014-05-06 2015-11-12 Two Blades Foundation Methods for producing plants with enhanced resistance to oomycete pathogens
CN106413760B (zh) 2014-05-08 2020-01-14 桑格摩生物科学股份有限公司 用于治疗亨廷顿病的方法和组合物
EP3140403A4 (en) 2014-05-09 2017-12-20 Université Laval Prevention and treatment of alzheimer's disease by genome editing using the crispr/cas system
WO2015172128A1 (en) 2014-05-09 2015-11-12 Indiana University Research And Technology Corporation Methods and compositions for treating hepatitis b virus infections
US10487336B2 (en) 2014-05-09 2019-11-26 The Regents Of The University Of California Methods for selecting plants after genome editing
EP3142707A4 (en) 2014-05-13 2018-02-21 Sangamo Therapeutics, Inc. Methods and compositions for prevention or treatment of a disease
CN103981212B (zh) 2014-05-16 2016-06-01 安徽省农业科学院水稻研究所 将黄色颖壳的水稻品种的颖壳颜色改为褐色的育种方法
US20170088819A1 (en) 2014-05-16 2017-03-30 Vrije Universiteit Brussel Genetic correction of myotonic dystrophy type 1
CN104017821B (zh) 2014-05-16 2016-07-06 安徽省农业科学院水稻研究所 定向编辑颖壳颜色决定基因OsCHI创制褐壳水稻材料的方法
CN104004782B (zh) 2014-05-16 2016-06-08 安徽省农业科学院水稻研究所 一种延长水稻生育期的育种方法
CN103981211B (zh) 2014-05-16 2016-07-06 安徽省农业科学院水稻研究所 一种创制闭颖授粉水稻材料的育种方法
WO2015179540A1 (en) 2014-05-20 2015-11-26 Regents Of The University Of Minnesota Method for editing a genetic sequence
CA2852593A1 (en) 2014-05-23 2015-11-23 Universite Laval Methods for producing dopaminergic neurons and uses thereof
US10653123B2 (en) 2014-05-27 2020-05-19 Dana-Farber Cancer Institute, Inc. Methods and compositions for perturbing gene expression in hematopoietic stem cell lineages in vivo
US20170191123A1 (en) 2014-05-28 2017-07-06 Toolgen Incorporated Method for Sensitive Detection of Target DNA Using Target-Specific Nuclease
US10066241B2 (en) 2014-05-30 2018-09-04 The Board Of Trustees Of The Leland Stanford Junior University Compositions and methods of delivering treatments for latent viral infections
WO2015188056A1 (en) 2014-06-05 2015-12-10 Sangamo Biosciences, Inc. Methods and compositions for nuclease design
LT3152312T (lt) 2014-06-06 2020-04-27 Regeneron Pharmaceuticals, Inc. Tikslinio lokuso modifikavimo būdai ir kompozicijos
US11030531B2 (en) 2014-06-06 2021-06-08 Trustees Of Boston University DNA recombinase circuits for logical control of gene expression
US20170210818A1 (en) 2014-06-06 2017-07-27 The California Institute For Biomedical Research Constant region antibody fusion proteins and compositions thereof
JP2017518049A (ja) 2014-06-06 2017-07-06 ザ カリフォルニア インスティテュート フォー バイオメディカル リサーチ アミノ末端免疫グロブリン融合タンパク質とその組成物を構築する方法
CN104004778B (zh) 2014-06-06 2016-03-02 重庆高圣生物医药有限责任公司 含有CRISPR/Cas9系统的靶向敲除载体及其腺病毒和应用
WO2015188094A1 (en) 2014-06-06 2015-12-10 President And Fellows Of Harvard College Methods for targeted modification of genomic dna
US11274302B2 (en) 2016-08-17 2022-03-15 Diacarta Ltd Specific synthetic chimeric Xenonucleic acid guide RNA; s(XNA-gRNA) for enhancing CRISPR mediated genome editing efficiency
CA2951707A1 (en) 2014-06-10 2015-12-17 Massachusetts Institute Of Technology Method for gene editing
EP3155098A4 (en) 2014-06-11 2018-01-03 Howard, Tom E. FACTOR VIII MUTATION REPAIR AND TOLERANCE INDUCTION AND RELATED CDNAs, COMPOSITIONS, METHODS AND SYSTEMS
GB2528177B (en) 2014-06-11 2019-08-28 Univ Duke Compositions and methods for rapid and dynamic flux control using synthetic metabolic valves
US11584936B2 (en) 2014-06-12 2023-02-21 King Abdullah University Of Science And Technology Targeted viral-mediated plant genome editing using CRISPR /Cas9
WO2015191911A2 (en) 2014-06-12 2015-12-17 Clontech Laboratories, Inc. Protein enriched microvesicles and methods of making and using the same
WO2015195547A1 (en) 2014-06-16 2015-12-23 University Of Washington Methods for controlling stem cell potential and for gene editing in stem cells
CN106852157B (zh) 2014-06-16 2022-04-12 约翰斯·霍普金斯大学 用于使用h1启动子表达crispr向导rna的组合物和方法
EP3157328B1 (en) 2014-06-17 2021-08-04 Poseida Therapeutics, Inc. A method for directing proteins to specific loci in the genome and uses thereof
WO2015193858A1 (en) 2014-06-20 2015-12-23 Cellectis Potatoes with reduced granule-bound starch synthase
HUE049405T2 (hu) 2014-06-23 2020-09-28 Regeneron Pharma Nukleáz-közvetített DNS-összeállítás
ES2888976T3 (es) 2014-06-23 2022-01-10 Massachusetts Gen Hospital Identificación no sesgada pangenómica de DSBs evaluada por secuenciación (GUIDE-Seq.)
WO2015200555A2 (en) 2014-06-25 2015-12-30 Caribou Biosciences, Inc. Rna modification to engineer cas9 activity
GB201411344D0 (en) 2014-06-26 2014-08-13 Univ Leicester Cloning
HUE041584T2 (hu) 2014-06-26 2019-05-28 Regeneron Pharma Célzott genetikai módosítások és alkalmazási módszerek és készítmények
EP3162328B1 (en) 2014-06-30 2022-01-19 Kao Corporation Adhesive sheet for cooling
US20170152787A1 (en) 2014-06-30 2017-06-01 Nissan Motor Co., Ltd. Internal combustion engine
WO2016004010A1 (en) 2014-07-01 2016-01-07 Board Of Regents, The University Of Texas System Regulated gene expression from viral vectors
EP3164112A1 (en) 2014-07-02 2017-05-10 Shire Human Genetic Therapies, Inc. Encapsulation of messenger rna
US20170198268A1 (en) 2014-07-09 2017-07-13 Gen9, Inc. Compositions and Methods for Site-Directed DNA Nicking and Cleaving
EP2966170A1 (en) 2014-07-10 2016-01-13 Heinrich-Pette-Institut Leibniz-Institut für experimentelle Virologie-Stiftung bürgerlichen Rechts - HBV inactivation
US10676754B2 (en) 2014-07-11 2020-06-09 E I Du Pont De Nemours And Company Compositions and methods for producing plants resistant to glyphosate herbicide
CA2954686A1 (en) 2014-07-11 2016-01-14 Pioneer Hi-Bred International, Inc. Agronomic trait modification using guide rna/cas endonuclease systems and methods of use
CN104109687A (zh) 2014-07-14 2014-10-22 四川大学 运动发酵单胞菌CRISPR-Cas9系统的构建与应用
EP3169776A4 (en) 2014-07-14 2018-07-04 The Regents of The University of California Crispr/cas transcriptional modulation
CN107075483A (zh) 2014-07-15 2017-08-18 朱诺治疗学股份有限公司 用于过继细胞治疗的工程改造的细胞
US9944933B2 (en) 2014-07-17 2018-04-17 Georgia Tech Research Corporation Aptamer-guided gene targeting
EP3193944B1 (en) 2014-07-17 2021-04-07 University of Pittsburgh - Of the Commonwealth System of Higher Education Methods of treating cells containing fusion genes
US20160053304A1 (en) 2014-07-18 2016-02-25 Whitehead Institute For Biomedical Research Methods Of Depleting Target Sequences Using CRISPR
US20160053272A1 (en) 2014-07-18 2016-02-25 Whitehead Institute For Biomedical Research Methods Of Modifying A Sequence Using CRISPR
US10975406B2 (en) 2014-07-18 2021-04-13 Massachusetts Institute Of Technology Directed endonucleases for repeatable nucleic acid cleavage
KR102612313B1 (ko) 2014-07-21 2023-12-12 노파르티스 아게 인간화 항-bcma 키메라 항원 수용체를 사용한 암의 치료
CA2955382C (en) 2014-07-21 2023-07-18 Illumina, Inc. Polynucleotide enrichment using crispr-cas systems
JP6653420B2 (ja) 2014-07-22 2020-02-26 パナソニックIpマネジメント株式会社 複合磁性材料とこれを用いたコイル部品ならびに複合磁性材料の製造方法
US10244771B2 (en) 2014-07-24 2019-04-02 Dsm Ip Assets B.V. Non-CRISPR-mediated phage resistant Streptococcus thermophilus
US9757420B2 (en) 2014-07-25 2017-09-12 Sangamo Therapeutics, Inc. Gene editing for HIV gene therapy
US9816074B2 (en) 2014-07-25 2017-11-14 Sangamo Therapeutics, Inc. Methods and compositions for modulating nuclease-mediated genome engineering in hematopoietic stem cells
WO2016012544A2 (en) 2014-07-25 2016-01-28 Boehringer Ingelheim International Gmbh Enhanced reprogramming to ips cells
US10301367B2 (en) 2014-07-26 2019-05-28 Consiglio Nazionale Delle Ricerche Compositions and methods for treatment of muscular dystrophy
US9616090B2 (en) 2014-07-30 2017-04-11 Sangamo Biosciences, Inc. Gene correction of SCID-related genes in hematopoietic stem and progenitor cells
FR3024464A1 (fr) 2014-07-30 2016-02-05 Centre Nat Rech Scient Ciblage de vecteurs integratifs non-viraux dans les sequences d'adn nucleolaires chez les eucaryotes
US10077453B2 (en) 2014-07-30 2018-09-18 President And Fellows Of Harvard College CAS9 proteins including ligand-dependent inteins
US9850521B2 (en) 2014-08-01 2017-12-26 Agilent Technologies, Inc. In vitro assay buffer for Cas9
US20160076093A1 (en) 2014-08-04 2016-03-17 University Of Washington Multiplex homology-directed repair
EP2982758A1 (en) 2014-08-04 2016-02-10 Centre Hospitalier Universitaire Vaudois (CHUV) Genome editing for the treatment of huntington's disease
CN106922154B (zh) 2014-08-06 2022-01-07 基因工具股份有限公司 使用空肠弯曲杆菌crispr/cas系统衍生的rna引导的工程化核酸酶的基因编辑
US10280402B2 (en) 2014-08-06 2019-05-07 College Of Medicine Pochon Cha University Industry-Academic Cooperation Foundation Immune-compatible cells created by nuclease-mediated editing of genes encoding HLA
US9932566B2 (en) 2014-08-07 2018-04-03 Agilent Technologies, Inc. CIS-blocked guide RNA
WO2016022931A1 (en) 2014-08-07 2016-02-11 The Rockefeller University Compositions and methods for transcription-based crispr-cas dna editing
JP6837429B2 (ja) 2014-08-11 2021-03-03 ザ ボード オブ リージェンツ オブ ザ ユニバーシティー オブ テキサス システム Crispr/cas9媒介遺伝子編集による筋ジストロフィーの予防
US10513711B2 (en) 2014-08-13 2019-12-24 Dupont Us Holding, Llc Genetic targeting in non-conventional yeast using an RNA-guided endonuclease
CN104178461B (zh) 2014-08-14 2017-02-01 北京蛋白质组研究中心 携带cas9的重组腺病毒及其应用
US11071289B2 (en) 2014-08-14 2021-07-27 Biocytogen Boston Corp DNA knock-in system
US9879270B2 (en) 2014-08-15 2018-01-30 Wisconsin Alumni Research Foundation Constructs and methods for genome editing and genetic engineering of fungi and protists
EP3686279B1 (en) 2014-08-17 2023-01-04 The Broad Institute, Inc. Genome editing using cas9 nickases
WO2016028843A2 (en) 2014-08-19 2016-02-25 President And Fellows Of Harvard College Rna-guided systems for probing and mapping of nucleic acids
WO2016028887A1 (en) 2014-08-19 2016-02-25 Pacific Biosciences Of California, Inc. Compositions and methods for enrichment of nucleic acids
US20190045758A1 (en) 2014-08-20 2019-02-14 Shanghai Institutes For Biological Sciences, Chinese Academy Of Sciences Biomarker and Therapeutic Target for Triple Negative Breast Cancer
CA2957938A1 (en) 2014-08-25 2016-03-03 GeneWeave Biosciences, Inc. Non-replicative transduction particles and transduction particle-based reporter systems
BR112017003528A2 (pt) 2014-08-26 2018-07-10 Univ California receptores de aba hipersensíveis.
SG11201701245QA (en) 2014-08-27 2017-03-30 Caribou Biosciences Inc Methods for increasing cas9-mediated engineering efficiency
WO2016033298A1 (en) 2014-08-28 2016-03-03 North Carolina State University Novel cas9 proteins and guiding features for dna targeting and genome editing
US10570418B2 (en) 2014-09-02 2020-02-25 The Regents Of The University Of California Methods and compositions for RNA-directed target DNA modification
EP3188746A4 (en) 2014-09-05 2018-05-02 The Johns Hopkins University Targeting capn9/capns2 activity as a therapeutic strategy for the treatment of myofibroblast differentiation and associated pathologies
DK3189140T3 (en) 2014-09-05 2020-02-03 Univ Vilnius Programmerbar RNA-fragmentering ved hjælp af TYPE III-A CRISPR-Cas-systemet af Streptococcus thermophilus
WO2016040594A1 (en) 2014-09-10 2016-03-17 The Regents Of The University Of California Reconstruction of ancestral cells by enzymatic recording
RU2017112324A (ru) 2014-09-12 2018-10-15 Пайонир Хай-Бред Интернэшнл, Инк. Создание сайтов сайт-специфической интеграции для сложных локусов признаков в кукурузе и сое, а также способы применения
WO2016044416A1 (en) 2014-09-16 2016-03-24 Sangamo Biosciences, Inc. Methods and compositions for nuclease-mediated genome engineering and correction in hematopoietic stem cells
CN106715431A (zh) 2014-09-16 2017-05-24 吉利德科学公司 Toll样受体调节剂的固体形式
WO2016049163A2 (en) 2014-09-24 2016-03-31 The Broad Institute Inc. Use and production of chd8+/- transgenic animals with behavioral phenotypes characteristic of autism spectrum disorder
EP3198018B1 (en) 2014-09-24 2020-12-09 City of Hope Adeno-associated virus vector variants for high efficiency genome editing and methods thereof
WO2016049024A2 (en) 2014-09-24 2016-03-31 The Broad Institute Inc. Delivery, use and therapeutic applications of the crispr-cas systems and compositions for modeling competition of multiple cancer mutations in vivo
WO2016049251A1 (en) 2014-09-24 2016-03-31 The Broad Institute Inc. Delivery, use and therapeutic applications of the crispr-cas systems and compositions for modeling mutations in leukocytes
WO2016046635A1 (en) 2014-09-25 2016-03-31 Institut Pasteur Methods for characterizing human papillomavirus associated cervical lesions
WO2016049258A2 (en) 2014-09-25 2016-03-31 The Broad Institute Inc. Functional screening with optimized functional crispr-cas systems
US20160090603A1 (en) 2014-09-30 2016-03-31 Sandia Corporation Delivery platforms for the domestication of algae and plants
KR102630014B1 (ko) 2014-10-01 2024-01-25 더 제너럴 하스피탈 코포레이션 뉴클레아제-유도 상동성-지정 복구의 효율 증가 방법
CA2963840A1 (en) 2014-10-09 2016-04-14 Seattle Children's Hospital (dba Seattle Children's Research Institute) Long poly(a) plasmids and methods for introduction of long poly(a) sequences into the plasmid
US9879283B2 (en) 2014-10-09 2018-01-30 Life Technologies Corporation CRISPR oligonucleotides and gene editing
CA2963693A1 (en) 2014-10-10 2016-04-14 Editas Medicine, Inc. Compositions and methods for promoting homology directed repair
CN107530399B (zh) 2014-10-10 2022-03-18 马萨诸塞眼科耳科诊所 治疗分子在体外和体内的有效递送
WO2016061073A1 (en) 2014-10-14 2016-04-21 Memorial Sloan-Kettering Cancer Center Composition and method for in vivo engineering of chromosomal rearrangements
PL3207124T3 (pl) 2014-10-15 2019-11-29 Regeneron Pharma Sposoby i kompozycje do wytwarzania lub utrzymywania komórek pluripotencjalnych
CN104342457A (zh) 2014-10-17 2015-02-11 杭州师范大学 一种将外源基因定点整合到靶标基因的方法
EP3207131B1 (en) 2014-10-17 2022-09-28 Howard Hughes Medical Institute Genomic probes
US10308947B2 (en) 2014-10-17 2019-06-04 The Penn State Research Foundation Methods and compositions for multiplex RNA guided genome editing and other RNA technologies
AU2015336086C1 (en) 2014-10-20 2021-07-29 Envirologix Inc. Compositions and methods for detecting an RNA virus
US10920208B2 (en) 2014-10-22 2021-02-16 President And Fellows Of Harvard College Evolution of proteases
US20170306306A1 (en) 2014-10-24 2017-10-26 Life Technologies Corporation Compositions and Methods for Enhancing Homologous Recombination
US20170247762A1 (en) 2014-10-27 2017-08-31 The Board Institute Inc. Compositions, methods and use of synthetic lethal screening
US10731143B2 (en) 2014-10-28 2020-08-04 Agrivida, Inc. Methods and compositions for stabilizing trans-splicing intein modified proteases
WO2016069912A1 (en) 2014-10-29 2016-05-06 Massachusetts Eye And Ear Infirmary Efficient delivery of therapeutic molecules in vitro and in vivo
MA40880A (fr) 2014-10-30 2017-09-05 Temple Univ Of The Commonwealth Éradication guidée par l'arn du virus jc humain et d'autres polyomavirus
US9816080B2 (en) 2014-10-31 2017-11-14 President And Fellows Of Harvard College Delivery of CAS9 via ARRDC1-mediated microvesicles (ARMMs)
AU2015339744B2 (en) 2014-10-31 2021-03-25 The Trustees Of The University Of Pennsylvania Altering gene expression in CART cells and uses thereof
WO2016070037A2 (en) 2014-10-31 2016-05-06 Massachusetts Institute Of Technology Massively parallel combinatorial genetics for crispr
CN104404036B (zh) 2014-11-03 2017-12-01 赛业(苏州)生物科技有限公司 基于CRISPR/Cas9技术的条件性基因敲除方法
US10435697B2 (en) 2014-11-03 2019-10-08 Nanyang Technological University Recombinant expression system that senses pathogenic microorganisms
CN104504304B (zh) 2014-11-03 2017-08-25 深圳先进技术研究院 一种成簇的规律间隔的短回文重复序列识别方法及装置
PT3216867T (pt) 2014-11-04 2020-07-16 Univ Kobe Nat Univ Corp Método para modificar a sequência de genoma para introduzir mutação específica a sequência de adn alvo por reação de remoção de bases, e complexo molecular nele utilizado
US20180291382A1 (en) 2014-11-05 2018-10-11 The Regents Of The University Of California Methods for Autocatalytic Genome Editing and Neutralizing Autocatalytic Genome Editing
CN107406838A (zh) 2014-11-06 2017-11-28 纳幕尔杜邦公司 Rna引导的内切核酸酶向细胞中的肽介导的递送
EP3215617B1 (en) 2014-11-07 2024-05-08 Editas Medicine, Inc. Systems for improving crispr/cas-mediated genome-editing
EP3218513B1 (en) 2014-11-11 2018-10-31 Illumina, Inc. Polynucleotide amplification using crispr-cas systems
US20170369848A1 (en) 2014-11-11 2017-12-28 Q Therapeutics, Inc. Engineering mesenchymal stem cells using homologous recombination
CN107109486B (zh) 2014-11-14 2021-08-13 基础科学研究院 用于检测基因组中遗传剪刀的脱靶位点的方法
JP7090421B2 (ja) 2014-11-15 2022-06-24 ズムトール バイオロジクス、インコーポレイテッド Dna結合ドメイン、非フコシル化及び部分的フコシル化タンパク質、並びにその方法
US11470826B2 (en) 2014-11-17 2022-10-18 National University Corporation Tokyo Medical And Dental University Method of conveniently producing genetically modified non-human mammal with high efficiency
CN107109422B (zh) 2014-11-19 2021-08-13 基础科学研究院 使用由两个载体表达的拆分的Cas9的基因组编辑
WO2016081924A1 (en) 2014-11-20 2016-05-26 Duke University Compositions, systems and methods for cell therapy
US10227661B2 (en) 2014-11-21 2019-03-12 GeneWeave Biosciences, Inc. Sequence-specific detection and phenotype determination
LT3221457T (lt) 2014-11-21 2019-06-10 Regeneron Pharmaceuticals, Inc. Nukreipiančios genetinės modifikacijos būdai ir kompozicijos, naudojant suporuotas kreipiančiąsias rnr sekas
WO2016086177A2 (en) 2014-11-25 2016-06-02 Drexel University Compositions and methods for hiv quasi-species excision from hiv-1-infected patients
WO2016084088A1 (en) 2014-11-26 2016-06-02 Ramot At Tel-Aviv University Ltd. Targeted elimination of bacterial genes
WO2016082135A1 (zh) 2014-11-27 2016-06-02 中国农业科学院北京畜牧兽医研究所 一种利用定点切割系统对猪h11位点定点插入的方法
CN105695485B (zh) 2014-11-27 2020-02-21 中国科学院上海生命科学研究院 一种用于丝状真菌Crispr-Cas系统的Cas9编码基因及其应用
GB201421096D0 (en) 2014-11-27 2015-01-14 Imp Innovations Ltd Genome editing methods
WO2016084084A1 (en) 2014-11-27 2016-06-02 Danziger Innovations Ltd. Nucleic acid constructs for genome editing
US20170266320A1 (en) 2014-12-01 2017-09-21 President And Fellows Of Harvard College RNA-Guided Systems for In Vivo Gene Editing
US10479997B2 (en) 2014-12-01 2019-11-19 Novartis Ag Compositions and methods for diagnosis and treatment of prostate cancer
JP7068821B2 (ja) 2014-12-03 2022-05-17 アジレント・テクノロジーズ・インク 化学修飾を有するガイドrna
CN104450774A (zh) 2014-12-04 2015-03-25 中国农业科学院作物科学研究所 一种大豆CRISPR/Cas9体系的构建及其在大豆基因修饰中的应用
CN107208079B (zh) 2014-12-05 2021-06-29 应用干细胞有限公司 整合转基因的位点定向crispr/重组酶组合物和方法
CN104531705A (zh) 2014-12-09 2015-04-22 中国农业大学 利用CRISPR-Cas9系统敲除动物myostatin基因的方法
CN104531704B (zh) 2014-12-09 2019-05-21 中国农业大学 利用CRISPR-Cas9系统敲除动物FGF5基因的方法
WO2016094679A1 (en) 2014-12-10 2016-06-16 Regents Of The University Of Minnesota Genetically modified cells, tissues, and organs for treating disease
EP3230452A1 (en) 2014-12-12 2017-10-18 The Broad Institute Inc. Dead guides for crispr transcription factors
WO2016094874A1 (en) 2014-12-12 2016-06-16 The Broad Institute Inc. Escorted and functionalized guides for crispr-cas systems
EP3985115A1 (en) 2014-12-12 2022-04-20 The Broad Institute, Inc. Protected guide rnas (pgrnas)
WO2016094880A1 (en) 2014-12-12 2016-06-16 The Broad Institute Inc. Delivery, use and therapeutic applications of crispr systems and compositions for genome editing as to hematopoietic stem cells (hscs)
JP6814155B2 (ja) 2014-12-12 2021-01-13 ジュー,ジェイムズ 対象とする細胞を選択的に除去する方法及び組成物
CN104480144B (zh) 2014-12-12 2017-04-12 武汉大学 用于艾滋病基因治疗的CRISPR/Cas9重组慢病毒载体及其慢病毒
EP3230445B1 (en) 2014-12-12 2024-01-24 Tod M. Woolf Compositions and methods for editing nucleic acids in cells utilizing oligonucleotides
EP3234150A1 (en) 2014-12-16 2017-10-25 Danisco US Inc. Fungal genome modification systems and methods of use
JP6842417B2 (ja) 2014-12-16 2021-03-17 シー3ジェイ セラピューティクス インコーポレイテッド インビトロウイルスゲノム工学のための組成物及びその方法
CA2971391C (en) 2014-12-17 2023-05-09 E. I. Du Pont De Nemours And Company Compositions and methods for efficient gene editing in e. coli using guide rna/cas endonuclease systems in combination with circular polynucleotide modification templates.
EP3712269A1 (en) 2014-12-17 2020-09-23 ProQR Therapeutics II B.V. Targeted rna editing
AU2015367317A1 (en) 2014-12-17 2017-06-01 Cellectis Inhibitory chimeric antigen receptor (iCAR or N-CAR) expressing non-T cell transduction domain
WO2016097751A1 (en) 2014-12-18 2016-06-23 The University Of Bath Method of cas9 mediated genome engineering
CN107208096B (zh) 2014-12-18 2021-02-12 综合基因技术公司 基于crispr的组合物和使用方法
WO2016100974A1 (en) 2014-12-19 2016-06-23 The Broad Institute Inc. Unbiased identification of double-strand breaks and genomic rearrangement by genome-wide insert capture sequencing
CN104745626B (zh) 2014-12-19 2018-05-01 中国航天员科研训练中心 一种条件性基因敲除动物模型的快速构建方法及应用
EP3957745A1 (en) 2014-12-20 2022-02-23 Arc Bio, LLC Compositions and methods for targeted depletion, enrichment, and partitioning of nucleic acids using crispr/cas system proteins
US10190106B2 (en) 2014-12-22 2019-01-29 Univesity Of Massachusetts Cas9-DNA targeting unit chimeras
CN104560864B (zh) 2014-12-22 2017-08-11 中国科学院微生物研究所 利用CRISPR‑Cas9系统构建的敲除IFN‑β基因的293T细胞系
WO2016106239A1 (en) 2014-12-23 2016-06-30 The Regents Of The University Of California Methods and compositions for nucleic acid integration
WO2016106236A1 (en) 2014-12-23 2016-06-30 The Broad Institute Inc. Rna-targeting system
CN104651398A (zh) 2014-12-24 2015-05-27 杭州师范大学 利用CRISPR-Cas9特异敲出microRNA基因家族的方法
EP3237017A4 (en) 2014-12-24 2018-08-01 Dana-Farber Cancer Institute, Inc. Systems and methods for genome modification and regulation
AU2015101792A4 (en) 2014-12-24 2016-01-28 Massachusetts Institute Of Technology Engineering of systems, methods and optimized enzyme and guide scaffolds for sequence manipulation
EP3702456A1 (en) 2014-12-24 2020-09-02 The Broad Institute, Inc. Crispr having or associated with destabilization domains
WO2016104716A1 (ja) 2014-12-26 2016-06-30 国立研究開発法人理化学研究所 遺伝子のノックアウト方法
WO2016108926A1 (en) 2014-12-30 2016-07-07 The Broad Institute Inc. Crispr mediated in vivo modeling and genetic screening of tumor growth and metastasis
WO2016109255A1 (en) 2014-12-30 2016-07-07 University Of South Florida Methods and compositions for cloning into large vectors
CN104498493B (zh) 2014-12-30 2017-12-26 武汉大学 CRISPR/Cas9特异性敲除乙型肝炎病毒的方法以及用于特异性靶向HBV DNA的gRNA
CN104651399B (zh) 2014-12-31 2018-11-16 广西大学 一种利用CRISPR/Cas系统在猪胚胎细胞中实现基因敲除的方法
WO2016109840A2 (en) 2014-12-31 2016-07-07 Synthetic Genomics, Inc. Compositions and methods for high efficiency in vivo genome editing
EP3242950B1 (en) 2015-01-06 2021-10-06 DSM IP Assets B.V. A crispr-cas system for a filamentous fungal host cell
WO2016110512A1 (en) 2015-01-06 2016-07-14 Dsm Ip Assets B.V. A crispr-cas system for a yeast host cell
ES2842151T3 (es) 2015-01-06 2021-07-13 Univ Yonsei Iacf Endonucleasa dirigida al gen del factor VIII de coagulación sanguínea y composición para el tratamiento de la hemofilia que comprende el mismo
US10590436B2 (en) 2015-01-06 2020-03-17 Dsm Ip Assets B.V. CRISPR-CAS system for a lipolytic yeast host cell
CN104651392B (zh) 2015-01-06 2018-07-31 华南农业大学 一种利用CRISPR/Cas9系统定点突变P/TMS12-1获得温敏不育系的方法
WO2016112242A1 (en) 2015-01-08 2016-07-14 President And Fellows Of Harvard College Split cas9 proteins
CN104593422A (zh) 2015-01-08 2015-05-06 中国农业大学 一种抗蓝耳病克隆猪的制备方法
CN113388670B (zh) 2015-01-09 2024-02-02 生物辐射实验室股份有限公司 检测基因组编辑
US11208638B2 (en) 2015-01-12 2021-12-28 The Regents Of The University Of California Heterodimeric Cas9 and methods of use thereof
CA2971626A1 (en) 2015-01-12 2016-07-21 Massachusetts Institute Of Technology Gene editing through microfluidic delivery
WO2016112963A1 (en) 2015-01-13 2016-07-21 Riboxx Gmbh Delivery of biomolecules into cells
MA41349A (fr) 2015-01-14 2017-11-21 Univ Temple Éradication de l'herpès simplex de type i et d'autres virus de l'herpès associés guidée par arn
US20170368134A1 (en) 2015-01-14 2017-12-28 Université D'aix-Marseille Proteasome inhibitors for treating a disorder related to an accumulation of non-degraded abnormal protein or a cancer
CN107429263A (zh) 2015-01-15 2017-12-01 斯坦福大学托管董事会 调控基因组编辑的方法
CN104611370A (zh) 2015-01-16 2015-05-13 深圳市科晖瑞生物医药有限公司 一种剔除β2-微球蛋白基因片段的方法
WO2016116032A1 (en) 2015-01-19 2016-07-28 Institute Of Genetics And Developmental Biology,Chinese Academy Of Sciences A method for precise modification of plant via transient gene expression
CN104725626B (zh) 2015-01-22 2016-06-29 漳州亚邦化学有限公司 一种适用于人造石英石的不饱和树脂的制备方法
CN105821072A (zh) 2015-01-23 2016-08-03 深圳华大基因研究院 用于DNA组装的CRISPR-Cas9系统及DNA组装方法
WO2016123071A1 (en) 2015-01-26 2016-08-04 Cold Spring Harbor Laboratory Methods of identifying essential protein domains
US10059940B2 (en) 2015-01-27 2018-08-28 Minghong Zhong Chemically ligated RNAs for CRISPR/Cas9-lgRNA complexes as antiviral therapeutic agents
CN104561095B (zh) 2015-01-27 2017-08-22 深圳市国创纳米抗体技术有限公司 一种能够生产人神经生长因子的转基因小鼠的制备方法
EP3250689B1 (en) 2015-01-28 2020-11-04 The Regents of The University of California Methods and compositions for labeling a single-stranded target nucleic acid
LT3250691T (lt) 2015-01-28 2023-09-11 Caribou Biosciences, Inc. Crispr hibridiniai dnr/rnr polinukleotidai ir naudojimo būdai
EP3798302A1 (fr) 2015-01-29 2021-03-31 Meiogenix Procede pour induire des recombinaisons meiotiques ciblees
CN107429254B (zh) 2015-01-30 2021-10-15 加利福尼亚大学董事会 原代造血细胞中的蛋白递送
MX2017009953A (es) 2015-02-02 2018-04-26 Meiragtx Uk Ii Ltd Regulacion de la expresión génica a través de la modulación mediada por un aptámero del empalme alternativo.
CN104593418A (zh) 2015-02-06 2015-05-06 中国医学科学院医学实验动物研究所 一种人源化大鼠药物评价动物模型建立的方法
WO2016130600A2 (en) 2015-02-09 2016-08-18 Duke University Compositions and methods for epigenome editing
KR101584933B1 (ko) 2015-02-10 2016-01-13 성균관대학교산학협력단 항생제 내성 억제용 재조합 벡터 및 이의 용도
WO2016130697A1 (en) 2015-02-11 2016-08-18 Memorial Sloan Kettering Cancer Center Methods and kits for generating vectors that co-express multiple target molecules
CN104928321B (zh) 2015-02-12 2018-06-01 中国科学院西北高原生物研究所 一种由Crispr/Cas9诱导的鳞片缺失斑马鱼模式及建立方法
CN104726494B (zh) 2015-02-12 2018-10-23 中国人民解放军第二军医大学 CRISPR-Cas9技术构建染色体易位干细胞及动物模型的方法
US10584321B2 (en) 2015-02-13 2020-03-10 University Of Massachusetts Compositions and methods for transient delivery of nucleases
US20160244784A1 (en) 2015-02-15 2016-08-25 Massachusetts Institute Of Technology Population-Hastened Assembly Genetic Engineering
WO2016132122A1 (en) 2015-02-17 2016-08-25 University Of Edinburgh Assay construct
JP6354100B2 (ja) 2015-02-19 2018-07-11 国立大学法人徳島大学 Cas9 mRNAを哺乳動物の受精卵にエレクトロポレーションにより導入する方法
WO2016137949A1 (en) 2015-02-23 2016-09-01 Voyager Therapeutics, Inc. Regulatable expression using adeno-associated virus (aav)
WO2016135557A2 (en) 2015-02-23 2016-09-01 Crispr Therapeutics Ag Materials and methods for treatment of hemoglobinopathies
WO2016135559A2 (en) 2015-02-23 2016-09-01 Crispr Therapeutics Ag Materials and methods for treatment of human genetic diseases including hemoglobinopathies
CA2985991A1 (en) 2015-02-25 2016-09-01 Andrew Mark CIGAN Composition and methods for regulated expression of a guide rna/cas endonuclease complex
KR20160103953A (ko) 2015-02-25 2016-09-02 연세대학교 산학협력단 Crispr 시스템을 이용한 다중 위치 염기서열의 동시 포획 방법
WO2016135507A1 (en) 2015-02-27 2016-09-01 University Of Edinburgh Nucleic acid editing systems
CN104805099B (zh) 2015-03-02 2018-04-13 中国人民解放军第二军医大学 一种安全编码Cas9蛋白的核酸分子及其表达载体
EP3858990A1 (en) 2015-03-03 2021-08-04 The General Hospital Corporation Engineered crispr-cas9 nucleases with altered pam specificity
CN104651401B (zh) 2015-03-05 2019-03-08 东华大学 一种mir-505双等位基因敲除的方法
CN104673816A (zh) 2015-03-05 2015-06-03 广东医学院 一种pCr-NHEJ载体及其构建方法及其用于细菌基因定点敲除的应用
US20180271891A1 (en) 2015-03-11 2018-09-27 The Broad Institute Inc. Selective treatment of prmt5 dependent cancer
US20160264934A1 (en) 2015-03-11 2016-09-15 The General Hospital Corporation METHODS FOR MODULATING AND ASSAYING m6A IN STEM CELL POPULATIONS
JP2018507705A (ja) 2015-03-12 2018-03-22 中国科学院遺▲伝▼与▲発▼育生物学研究所Institute of Genetics and Developmental Biology, Chinese Academy of Sciences 侵入するdnaウイルスに対する植物の抵抗能力を高めるための方法
GB201504223D0 (en) 2015-03-12 2015-04-29 Genome Res Ltd Biallelic genetic modification
WO2016148994A1 (en) 2015-03-13 2016-09-22 The Jackson Laboratory A three-component crispr/cas complex system and uses thereof
CN106032540B (zh) 2015-03-16 2019-10-25 中国科学院上海生命科学研究院 CRISPR/Cas9核酸内切酶体系的腺相关病毒载体构建及其用途
AU2016239037B2 (en) 2015-03-16 2022-04-21 Institute Of Genetics And Developmental Biology, Chinese Academy Of Sciences Method of applying non-genetic substance to perform site-directed reform of plant genome
WO2016149484A2 (en) 2015-03-17 2016-09-22 Temple University Of The Commonwealth System Of Higher Education Compositions and methods for specific reactivation of hiv latent reservoir
WO2016149547A1 (en) 2015-03-17 2016-09-22 Bio-Rad Laboratories, Inc. Detection of genome editing
WO2016150855A1 (en) 2015-03-20 2016-09-29 Danmarks Tekniske Universitet Crispr/cas9 based engineering of actinomycetal genomes
MA41382A (fr) 2015-03-20 2017-11-28 Univ Temple Édition génique basée sur le système crispr/endonucléase à induction par tat
CN104726449A (zh) 2015-03-23 2015-06-24 国家纳米科学中心 一种用于预防和/或治疗HIV的CRISPR-Cas9系统及其制备方法和用途
CN106148416B (zh) 2015-03-24 2019-12-17 华东师范大学 Cyp基因敲除大鼠的培育方法及其肝微粒体的制备方法
WO2016154596A1 (en) 2015-03-25 2016-09-29 Editas Medicine, Inc. Crispr/cas-related methods, compositions and components
EP3274453B1 (en) 2015-03-26 2021-01-27 Editas Medicine, Inc. Crispr/cas-mediated gene conversion
WO2016161004A1 (en) 2015-03-30 2016-10-06 The Board Of Regents Of The Nevada System Of Higher Educ. On Behalf Of The University Of Nevada, La Compositions comprising talens and methods of treating hiv
CN108124453B (zh) 2015-03-31 2022-04-05 爱克莱根科技公司 用于将DNA序列靶向并入细胞或生物体的基因组中的Cas9逆转录病毒整合酶和Cas9重组酶系统
WO2016161380A1 (en) 2015-04-01 2016-10-06 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating duchenne muscular dystrophy and becker muscular dystrophy
EP3300507A4 (en) 2015-04-02 2019-03-13 Agenovir Corporation GENERIC ADMINISTRATION AND COMPOSITIONS
US20170166928A1 (en) 2015-04-03 2017-06-15 Whitehead Institute For Biomedical Research Compositions And Methods For Genetically Modifying Yeast
ES2959608T3 (es) 2015-04-03 2024-02-27 Dana Farber Cancer Inst Inc Composición y métodos de edición del genoma de células B
CN106434737A (zh) 2015-04-03 2017-02-22 内蒙古中科正标生物科技有限责任公司 基于CRISPR/Cas9技术的单子叶植物基因敲除载体及其应用
CN107787367B (zh) 2015-04-06 2021-10-26 里兰斯坦福初级大学理事会 用于crispr/cas介导的基因调控的化学修饰的引导rna
WO2016164797A1 (en) 2015-04-08 2016-10-13 University Of Pittsburgh - Of The Commonwealth System Of Higher Education Activatable crispr/cas9 for spatial and temporal control of genome editing
JP6892642B2 (ja) 2015-04-13 2021-06-23 国立大学法人 東京大学 光依存的に又は薬物存在下でヌクレアーゼ活性若しくはニッカーゼ活性を示す、又は標的遺伝子の発現を抑制若しくは活性化するポリペプチドのセット
US10155938B2 (en) 2015-04-14 2018-12-18 City Of Hope Coexpression of CAS9 and TREX2 for targeted mutagenesis
GB201506509D0 (en) 2015-04-16 2015-06-03 Univ Wageningen Nuclease-mediated genome editing
US11299729B2 (en) 2015-04-17 2022-04-12 President And Fellows Of Harvard College Vector-based mutagenesis system
US10738290B2 (en) 2015-04-21 2020-08-11 Novartis Ag RNA-guided gene editing system and uses thereof
CN104805118A (zh) 2015-04-22 2015-07-29 扬州大学 一种苏禽黄鸡胚胎干细胞特定基因进行靶向敲除方法
CN104762321A (zh) 2015-04-22 2015-07-08 东北林业大学 基于CRISPR/Cas9系统靶向敲除KHV基因的敲除载体构建方法及其crRNA原件
US20180298340A1 (en) 2015-04-24 2018-10-18 The Regents Of The University Of California Systems for detecting, monitoring or treating diseases or conditions using engineered cells and methods for making and using them
JP2018522249A (ja) 2015-04-24 2018-08-09 エディタス・メディシン、インコーポレイテッド Cas9分子/ガイドrna分子複合体の評価
US11268158B2 (en) 2015-04-24 2022-03-08 St. Jude Children's Research Hospital, Inc. Assay for safety assessment of therapeutic genetic manipulations, gene therapy vectors and compounds
EP3288594B1 (en) 2015-04-27 2022-06-29 The Trustees of The University of Pennsylvania Dual aav vector system for crispr/cas9 mediated correction of human disease
CA2983364A1 (en) 2015-04-27 2016-11-03 Genethon Compositions and methods for the treatment of nucleotide repeat expansion disorders
EP3087974A1 (en) 2015-04-29 2016-11-02 Rodos BioTarget GmbH Targeted nanocarriers for targeted drug delivery of gene therapeutics
DK3289080T3 (da) 2015-04-30 2021-11-08 Univ Columbia Genterapi til autosomalt dominante sygdomme
WO2016176404A1 (en) 2015-04-30 2016-11-03 The Brigham And Women's Hospital, Inc. Methods and kits for cloning-free genome editing
US20160346359A1 (en) 2015-05-01 2016-12-01 Spark Therapeutics, Inc. Adeno-associated Virus-Mediated CRISPR-Cas9 Treatment of Ocular Disease
US20180344817A1 (en) 2015-05-01 2018-12-06 Precision Biosciences, Inc. Precise deletion of chromosomal sequences in vivo and treatment of nucleotide repeat expansion disorders using engineered nucleases
CN104894068A (zh) 2015-05-04 2015-09-09 南京凯地生物科技有限公司 一种利用CRISPR/Cas9制备CAR-T细胞的方法
CN108026566A (zh) 2015-05-04 2018-05-11 特拉维夫大学拉莫特有限公司 用于使dna片段化的方法和试剂盒
GB2531454A (en) 2016-01-10 2016-04-20 Snipr Technologies Ltd Recombinogenic nucleic acid strands in situ
IL310108A (en) 2015-05-06 2024-03-01 Snipr Tech Ltd Changing bacterial populations and microbiota adaptation
WO2016182917A1 (en) 2015-05-08 2016-11-17 Children's Medical Center Corporation Targeting bcl11a enhancer functional regions for fetal hemoglobin reinduction
WO2016182893A1 (en) 2015-05-08 2016-11-17 Teh Broad Institute Inc. Functional genomics using crispr-cas systems for saturating mutagenesis of non-coding elements, compositions, methods, libraries and applications thereof
AU2016262521A1 (en) 2015-05-11 2017-12-14 Editas Medicine, Inc. CRISPR/CAS-related methods and compositions for treating HIV infection and AIDS
WO2016182959A1 (en) 2015-05-11 2016-11-17 Editas Medicine, Inc. Optimized crispr/cas9 systems and methods for gene editing in stem cells
KR101785847B1 (ko) 2015-05-12 2017-10-17 연세대학교 산학협력단 선형 이중가닥 DNA를 활용한 CRISPR/Cas9 시스템을 이용한 표적 유전체 교정
CA2984013A1 (en) 2015-05-12 2016-11-17 Sangamo Therapeutics, Inc. Nuclease-mediated regulation of gene expression
JP2018520648A (ja) 2015-05-13 2018-08-02 シアトル チルドレンズ ホスピタル, ディービーエー シアトル チルドレンズ リサーチ インスティテュート 初代細胞におけるエンドヌクレアーゼに基づいた遺伝子編集の向上
JP6587696B2 (ja) 2015-05-13 2019-10-09 ズムトール バイオロジクス、インコーポレイテッド アフコシル化タンパク質、前記タンパク質を発現する細胞、及び関連する方法
WO2016183402A2 (en) 2015-05-13 2016-11-17 President And Fellows Of Harvard College Methods of making and using guide rna for use with cas9 systems
CN105886498A (zh) 2015-05-13 2016-08-24 沈志荣 CRISPR-Cas9特异性敲除人PCSK9基因的方法以及用于特异性靶向PCSK9基因的sgRNA
US20180291372A1 (en) 2015-05-14 2018-10-11 Massachusetts Institute Of Technology Self-targeting genome editing system
US11535871B2 (en) 2015-05-14 2022-12-27 University Of Southern California Optimized gene editing utilizing a recombinant endonuclease system
EP3294880A4 (en) 2015-05-15 2018-12-26 Dharmacon, Inc. Synthetic single guide rna for cas9-mediated gene editing
US11371050B2 (en) 2015-05-15 2022-06-28 Pioneer Hi-Bred International, Inc. Rapid characterization of Cas endonuclease systems, PAM sequences and guide RNA elements
CA2986021A1 (en) 2015-05-16 2016-11-24 Genzyme Corporation Gene editing of deep intronic mutations
CN104846010B (zh) 2015-05-18 2018-07-06 安徽省农业科学院水稻研究所 一种删除转基因水稻筛选标记基因的方法
EP3298149A1 (en) 2015-05-18 2018-03-28 King Abdullah University Of Science And Technology Method of inhibiting plant virus pathogen infections by crispr/cas9-mediated interference
EP3095870A1 (en) 2015-05-19 2016-11-23 Kws Saat Se Methods for the in planta transformation of plants and manufacturing processes and products based and obtainable therefrom
CN106011104B (zh) 2015-05-21 2019-09-27 清华大学 利用拆分Cas系统进行基因编辑和表达调控方法
US20160340622A1 (en) 2015-05-22 2016-11-24 Nabil Radi Abdou Bar Soap Anchoring Core
CN105518135B (zh) 2015-05-22 2020-11-24 深圳市第二人民医院 CRISPR-Cas9特异性敲除猪CMAH基因的方法及用于特异性靶向CMAH基因的sgRNA
WO2016187904A1 (zh) 2015-05-22 2016-12-01 深圳市第二人民医院 CRISPR-Cas9特异性敲除猪CMAH基因的方法及用于特异性靶向CMAH基因的sgRNA
WO2016187717A1 (en) 2015-05-26 2016-12-01 Exerkine Corporation Exosomes useful for genome editing
WO2016191684A1 (en) 2015-05-28 2016-12-01 Finer Mitchell H Genome editing vectors
CN104894075B (zh) 2015-05-28 2019-08-06 华中农业大学 CRISPR/Cas9和Cre/lox系统编辑伪狂犬病毒基因组制备疫苗方法和应用
CN105624146B (zh) 2015-05-28 2019-02-15 中国科学院微生物研究所 基于CRISPR/Cas9和酿酒酵母细胞内源的同源重组的分子克隆方法
CA3000170A1 (en) 2015-05-29 2016-12-08 Agenovir Corporation Antiviral methods and compositions
US10117911B2 (en) 2015-05-29 2018-11-06 Agenovir Corporation Compositions and methods to treat herpes simplex virus infections
EP3331571A4 (en) 2015-05-29 2019-04-10 Agenovir Corporation COMPOSITIONS AND METHODS FOR TREATING VIRAL INFECTIONS
US20160346362A1 (en) 2015-05-29 2016-12-01 Agenovir Corporation Methods and compositions for treating cytomegalovirus infections
EA201792663A1 (ru) 2015-05-29 2018-04-30 Норт Каролина Стейт Юниверсити Способы скрининга бактерий, архей, водорослей и дрожжей с использованием нуклеиновых кислот crispr
JP2018516597A (ja) 2015-05-29 2018-06-28 アジェノビア コーポレーション 移植のために細胞を処置する方法および組成物
WO2016196499A1 (en) 2015-05-29 2016-12-08 Clark Atlanta University Human cell lines mutant for zic2
US20160346360A1 (en) 2015-05-29 2016-12-01 Agenovir Corporation Compositions and methods for cell targeted hpv treatment
WO2016196539A2 (en) 2015-06-01 2016-12-08 Temple University - Of The Commonwealth System Of Higher Education Methods and compositions for rna-guided treatment of hiv infection
WO2016191869A1 (en) 2015-06-01 2016-12-08 The Hospital For Sick Children Delivery of structurally diverse polypeptide cargo into mammalian cells by a bacterial toxin
CN105112445B (zh) 2015-06-02 2018-08-10 广州辉园苑医药科技有限公司 一种基于CRISPR-Cas9基因敲除技术的miR-205基因敲除试剂盒
EP3303634B1 (en) 2015-06-03 2023-08-30 The Regents of The University of California Cas9 variants and methods of use thereof
EP3303585A4 (en) 2015-06-03 2018-10-31 Board of Regents of the University of Nebraska Dna editing using single-stranded dna
US20180245074A1 (en) 2015-06-04 2018-08-30 Protiva Biotherapeutics, Inc. Treating hepatitis b virus infection using crispr
WO2016197133A1 (en) 2015-06-04 2016-12-08 Protiva Biotherapeutics, Inc. Delivering crispr therapeutics with lipid nanoparticles
CN105039339B (zh) 2015-06-05 2017-12-19 新疆畜牧科学院生物技术研究所 一种以RNA介导的特异性敲除绵羊FecB基因的方法及其专用sgRNA
WO2016196805A1 (en) 2015-06-05 2016-12-08 The Regents Of The University Of California Methods and compositions for generating crispr/cas guide rnas
EP3307887A1 (en) 2015-06-09 2018-04-18 Editas Medicine, Inc. Crispr/cas-related methods and compositions for improving transplantation
US20160362667A1 (en) 2015-06-10 2016-12-15 Caribou Biosciences, Inc. CRISPR-Cas Compositions and Methods
JP7085841B2 (ja) 2015-06-10 2022-06-17 フイルメニツヒ ソシエテ アノニム ムスク化合物の同定方法
JP6961494B2 (ja) 2015-06-10 2021-11-05 フイルメニツヒ ソシエテ アノニムFirmenich Sa 匂い物質および芳香の受容体をスクリーニングするための細胞株
WO2016198500A1 (en) 2015-06-10 2016-12-15 INSERM (Institut National de la Santé et de la Recherche Médicale) Methods and compositions for rna-guided treatment of human cytomegalovirus (hcmv) infection
CN105518134A (zh) 2015-06-11 2016-04-20 深圳市第二人民医院 CRISPR-Cas9特异性敲除猪SLA-2基因的方法及用于特异性靶向SLA-2基因的sgRNA
CN105492609A (zh) 2015-06-11 2016-04-13 深圳市第二人民医院 CRISPR-Cas9特异性敲除猪GGTA1基因的方法及用于特异性靶向GGTA1基因的sgRNA
CN105518140A (zh) 2015-06-11 2016-04-20 深圳市第二人民医院 CRISPR-Cas9特异性敲除猪vWF基因的方法及用于特异性靶向vWF基因的sgRNA
CN105518138B (zh) 2015-06-11 2021-07-27 深圳市第二人民医院 CRISPR-Cas9特异性敲除猪GFRA1基因的方法及用于特异性靶向GFRA1基因的sgRNA
WO2016197355A1 (zh) 2015-06-11 2016-12-15 深圳市第二人民医院 CRISPR-Cas9特异性敲除猪SALL1基因的方法及用于特异性靶向SALL1基因的sgRNA
WO2016197359A1 (zh) 2015-06-11 2016-12-15 深圳市第二人民医院 CRISPR-Cas9特异性敲除猪SLA-1基因的方法及用于特异性靶向SLA-1基因的sgRNA
CN105492608B (zh) 2015-06-11 2021-07-23 深圳市第二人民医院 CRISPR-Cas9特异性敲除猪PDX1基因的方法及用于特异性靶向PDX1基因的sgRNA
WO2016197357A1 (zh) 2015-06-11 2016-12-15 深圳市第二人民医院 CRISPR-Cas9特异性敲除猪SLA-3基因的方法及用于特异性靶向SLA-3基因的sgRNA
CN105518139B (zh) 2015-06-11 2021-02-02 深圳市第二人民医院 CRISPR-Cas9特异性敲除猪FGL2基因的方法及用于特异性靶向FGL2基因的sgRNA
WO2016200263A1 (en) 2015-06-12 2016-12-15 Erasmus University Medical Center Rotterdam New crispr assays
WO2016201138A1 (en) 2015-06-12 2016-12-15 The Regents Of The University Of California Reporter cas9 variants and methods of use thereof
GB201510296D0 (en) 2015-06-12 2015-07-29 Univ Wageningen Thermostable CAS9 nucleases
EP3307872B1 (en) 2015-06-15 2023-09-27 North Carolina State University Methods and compositions for efficient delivery of nucleic acids and rna-based antimicrobials
WO2016205728A1 (en) 2015-06-17 2016-12-22 Massachusetts Institute Of Technology Crispr mediated recording of cellular events
WO2016205623A1 (en) 2015-06-17 2016-12-22 North Carolina State University Methods and compositions for genome editing in bacteria using crispr-cas9 systems
US11555207B2 (en) 2015-06-17 2023-01-17 The Uab Research Foundation CRISPR/Cas9 complex for introducing a functional polypeptide into cells of blood cell lineage
EP3310932B1 (en) 2015-06-17 2023-08-30 The UAB Research Foundation Crispr/cas9 complex for genomic editing
AU2016279077A1 (en) 2015-06-18 2019-03-28 Omar O. Abudayyeh Novel CRISPR enzymes and systems
EP3310395A4 (en) 2015-06-18 2019-05-22 Robert D. Bowles REGULATION OF RNA GUIDED TRANSCRIPTION AND METHODS OF USE THEREOF FOR THE TREATMENT OF LOMBALGIA
EP3436575A1 (en) 2015-06-18 2019-02-06 The Broad Institute Inc. Novel crispr enzymes and systems
CA2989830A1 (en) 2015-06-18 2016-12-22 The Broad Institute, Inc. Crispr enzyme mutations reducing off-target effects
WO2016205745A2 (en) 2015-06-18 2016-12-22 The Broad Institute Inc. Cell sorting
WO2016205759A1 (en) 2015-06-18 2016-12-22 The Broad Institute Inc. Engineering and optimization of systems, methods, enzymes and guide scaffolds of cas9 orthologs and variants for sequence manipulation
US9790490B2 (en) 2015-06-18 2017-10-17 The Broad Institute Inc. CRISPR enzymes and systems
US9957501B2 (en) 2015-06-18 2018-05-01 Sangamo Therapeutics, Inc. Nuclease-mediated regulation of gene expression
AU2016285724A1 (en) 2015-06-29 2017-11-16 Ionis Pharmaceuticals, Inc. Modified CRISPR RNA and modified single CRISPR RNA and uses thereof
GB201511376D0 (en) 2015-06-29 2015-08-12 Ecolab Usa Inc Process for the treatment of produced water from chemical enhanced oil recovery
WO2017004279A2 (en) 2015-06-29 2017-01-05 Massachusetts Institute Of Technology Compositions comprising nucleic acids and methods of using the same
EP4043556B1 (en) 2015-06-30 2024-02-07 Cellectis Methods for improving functionality in nk cell by gene inactivation using specific endonuclease
CN108350446A (zh) 2015-07-02 2018-07-31 约翰霍普金斯大学 基于crispr/cas9的治疗
CN108026523B (zh) 2015-07-06 2021-11-30 帝斯曼知识产权资产管理有限公司 向导rna组装载体
US20170009242A1 (en) 2015-07-06 2017-01-12 Whitehead Institute For Biomedical Research CRISPR-Mediated Genome Engineering for Protein Depletion
CN105132451B (zh) 2015-07-08 2019-07-23 电子科技大学 一种CRISPR/Cas9单一转录单元定向修饰骨架载体及其应用
EP3322297A4 (en) 2015-07-13 2019-04-17 Sangamo Therapeutics, Inc. RELEASE METHOD AND COMPOSITIONS FOR NUCLEASE-DERIVED GENOMINE ENGINEERING
WO2017009399A1 (en) 2015-07-13 2017-01-19 Institut Pasteur Improving sequence-specific antimicrobials by blocking dna repair
US20170014449A1 (en) 2015-07-13 2017-01-19 Elwha LLC, a limited liability company of the State of Delaware Site-specific epigenetic editing
JP6624743B2 (ja) 2015-07-14 2019-12-25 学校法人福岡大学 部位特異的rna変異導入方法およびそれに使用する標的編集ガイドrnaならびに標的rna−標的編集ガイドrna複合体
US11479793B2 (en) 2015-07-15 2022-10-25 Rutgers, The State University Of New Jersey Nuclease-independent targeted gene editing platform and uses thereof
MA42895A (fr) 2015-07-15 2018-05-23 Juno Therapeutics Inc Cellules modifiées pour thérapie cellulaire adoptive
US20170020922A1 (en) 2015-07-16 2017-01-26 Batu Biologics Inc. Gene editing for immunological destruction of neoplasia
WO2017015101A1 (en) 2015-07-17 2017-01-26 University Of Washington Methods for maximizing the efficiency of targeted gene correction
WO2017015015A1 (en) 2015-07-17 2017-01-26 Emory University Crispr-associated protein from francisella and uses related thereto
WO2017015637A1 (en) 2015-07-22 2017-01-26 Duke University High-throughput screening of regulatory element function with epigenome editing technologies
US10392674B2 (en) 2015-07-22 2019-08-27 President And Fellows Of Harvard College Evolution of site-specific recombinases
AU2016297167A1 (en) 2015-07-23 2018-02-22 Mayo Foundation For Medical Education And Research Editing mitochondrial DNA
CN108025074A (zh) 2015-07-25 2018-05-11 哈比卜·弗罗斯特 用于为癌症和其他病理状态提供治疗或治愈的系统、装置和方法
CN106399360A (zh) 2015-07-27 2017-02-15 上海药明生物技术有限公司 基于crispr技术敲除fut8基因的方法
JP6937740B2 (ja) 2015-07-28 2021-09-22 ダニスコ・ユーエス・インク ゲノム編集システムおよび使用方法
CN105063061B (zh) 2015-07-28 2018-10-30 华南农业大学 一种水稻千粒重基因tgw6突变体及其制备方法与应用
CN106701808A (zh) 2015-07-29 2017-05-24 深圳华大基因研究院 Dna聚合酶i缺陷型菌株及其构建方法
WO2017019895A1 (en) 2015-07-30 2017-02-02 President And Fellows Of Harvard College Evolution of talens
CA2993431A1 (en) 2015-07-31 2017-02-09 Regents Of The University Of Minnesota Nuclease based knockouts of immunological checkpoint genes in immune cells
US20200123533A1 (en) 2015-07-31 2020-04-23 The Trustees Of Columbia University In The City Of New York High-throughput strategy for dissecting mammalian genetic interactions
WO2017024047A1 (en) 2015-08-03 2017-02-09 Emendobio Inc. Compositions and methods for increasing nuclease induced recombination rate in cells
WO2017023974A1 (en) 2015-08-03 2017-02-09 President And Fellows Of Harvard College Cas9 genome editing and transcriptional regulation
AU2016301196B2 (en) 2015-08-06 2022-09-08 Dana-Farber Cancer Institute, Inc. Tunable endogenous protein degradation
US9580727B1 (en) 2015-08-07 2017-02-28 Caribou Biosciences, Inc. Compositions and methods of engineered CRISPR-Cas9 systems using split-nexus Cas9-associated polynucleotides
CN104962523B (zh) 2015-08-07 2018-05-25 苏州大学 一种测定非同源末端连接修复活性的方法
CN108474007A (zh) 2015-08-07 2018-08-31 联邦科学技术研究组织 产生包含种系遗传修饰的动物的方法
CN108495641A (zh) 2015-08-11 2018-09-04 塞勒克提斯公司 用于靶向cd38抗原和用于cd38基因失活的工程化的用于免疫疗法的细胞
BR112018002026A2 (pt) 2015-08-14 2018-09-18 Institute Of Genetics And Developmental Biology, Chinese Academy Of Sciences método para se obter arroz resistente a glifosato através da substituição de nucleotídeo direcionada ao sítio
CN105255937A (zh) 2015-08-14 2016-01-20 西北农林科技大学 一种真核细胞III型启动子表达CRISPR sgRNA的方法及其应用
EP3337898B1 (en) 2015-08-19 2021-07-28 Arc Bio, LLC Capture of nucleic acids using a nucleic acid-guided nuclease-based system
CN107922953B (zh) 2015-08-20 2022-03-04 应用干细胞有限公司 提高基因编辑效率的核酸酶
CN105112519A (zh) 2015-08-20 2015-12-02 郑州大学 一种基于crispr的大肠杆菌o157:h7菌株检测试剂盒及检测方法
CN105177126B (zh) 2015-08-21 2018-12-04 东华大学 一种利用荧光pcr技术对小鼠的分型鉴定方法
MX2018002339A (es) 2015-08-25 2018-12-19 Univ Duke Composiciones y metodos de mejora de la especificidad en ingenieria genomica usando endonucleasas guiadas por arn.
CN106480083B (zh) 2015-08-26 2021-12-14 中国科学院分子植物科学卓越创新中心 CRISPR/Cas9介导的大片段DNA拼接方法
US9512446B1 (en) 2015-08-28 2016-12-06 The General Hospital Corporation Engineered CRISPR-Cas9 nucleases
WO2017040348A1 (en) 2015-08-28 2017-03-09 The General Hospital Corporation Engineered crispr-cas9 nucleases
US9926546B2 (en) 2015-08-28 2018-03-27 The General Hospital Corporation Engineered CRISPR-Cas9 nucleases
US10526590B2 (en) 2015-08-31 2020-01-07 Agilent Technologies, Inc. Compounds and methods for CRISPR/Cas-based genome editing by homologous recombination
CN105087620B (zh) 2015-08-31 2017-12-29 中国农业大学 一种过表达猪共刺激受体4‑1bb载体及其应用
WO2017040709A1 (en) 2015-08-31 2017-03-09 Caribou Biosciences, Inc. Directed nucleic acid repair
AU2016316027B2 (en) 2015-09-01 2022-04-07 Dana-Farber Cancer Institute Inc. Systems and methods for selection of gRNA targeting strands for Cas9 localization
WO2017040813A2 (en) 2015-09-02 2017-03-09 University Of Massachusetts Detection of gene loci with crispr arrayed repeats and/or polychromatic single guide ribonucleic acids
US20180251789A1 (en) 2015-09-04 2018-09-06 Massachusetts Institute Of Technology Multilayer genetic safety kill circuits based on single cas9 protein and multiple engineered grna in mammalian cells
CN105400810B (zh) 2015-09-06 2019-05-07 吉林大学 采用敲除技术建立低磷性佝偻病模型的方法
CA3036409C (en) 2015-09-08 2023-07-11 Erik J. Sontheimer Dnase h activity of neisseria meningitidis cas9
WO2017043656A1 (ja) 2015-09-09 2017-03-16 国立大学法人神戸大学 標的化したdna配列の核酸塩基を特異的に変換する、グラム陽性菌のゲノム配列の変換方法、及びそれに用いる分子複合体
SG11201801809VA (en) 2015-09-09 2018-04-27 Univ Kobe Nat Univ Corp Method for modifying genome sequence that specifically converts nucleobase of targeted dna sequence, and molecular complex used in said method
EP3347469A4 (en) 2015-09-10 2019-02-27 Youhealth Biotech, Limited METHOD AND COMPOSITIONS FOR TREATING GLAUCOMA
WO2017044776A1 (en) 2015-09-10 2017-03-16 Texas Tech University System Single-guide rna (sgrna) with improved knockout efficiency
CN105274144A (zh) 2015-09-14 2016-01-27 徐又佳 通过CRISPR/Cas9技术得到敲除铁调素基因斑马鱼的制备方法
US10301613B2 (en) 2015-09-15 2019-05-28 Arizona Board Of Regents On Behalf Of Arizona State University Targeted remodeling of prokaryotic genomes using CRISPR-nickases
CN105210981B (zh) 2015-09-15 2018-09-28 中国科学院生物物理研究所 建立可应用于人类疾病研究的雪貂模型的方法及其应用
US10109551B2 (en) 2015-09-15 2018-10-23 Intel Corporation Methods and apparatuses for determining a parameter of a die
CN105112422B (zh) 2015-09-16 2019-11-08 中山大学 基因miR408和UCL在培育高产水稻中的应用
US11261439B2 (en) 2015-09-18 2022-03-01 President And Fellows Of Harvard College Methods of making guide RNA
CN105132427B (zh) 2015-09-21 2019-01-08 新疆畜牧科学院生物技术研究所 一种以RNA介导的特异性敲除双基因获得基因编辑绵羊的方法及其专用sgRNA
ES2959815T3 (es) 2015-09-21 2024-02-28 Arcturus Therapeutics Inc Edición génica selectiva de alelo y usos de la misma
US20180237800A1 (en) 2015-09-21 2018-08-23 The Regents Of The University Of California Compositions and methods for target nucleic acid modification
JP6853257B2 (ja) 2015-09-23 2021-03-31 サンガモ セラピューティクス, インコーポレイテッド Httリプレッサー及びその使用
JP2018532402A (ja) 2015-09-24 2018-11-08 クリスパー セラピューティクス アーゲー Rnaプログラム可能エンドヌクレアーゼの新規のファミリーならびにゲノム編集および他の適用におけるそれらの使用
JP2018531596A (ja) 2015-09-24 2018-11-01 シグマ−アルドリッチ・カンパニー・リミテッド・ライアビリティ・カンパニーSigma−Aldrich Co., LLC Rnaガイド型核酸結合タンパク質を使用する分子間近接性検出用の方法および試薬
WO2017053879A1 (en) 2015-09-24 2017-03-30 Editas Medicine, Inc. Use of exonucleases to improve crispr/cas-mediated genome editing
WO2017053729A1 (en) 2015-09-25 2017-03-30 The Board Of Trustees Of The Leland Stanford Junior University Nuclease-mediated genome editing of primary cells and enrichment thereof
WO2017053713A1 (en) 2015-09-25 2017-03-30 Tarveda Therapeutics, Inc. Compositions and methods for genome editing
KR101745863B1 (ko) 2015-09-25 2017-06-12 전남대학교산학협력단 Crispr/cas9 시스템을 이용한 프로히비틴2 유전자 제거용 시발체
KR101795999B1 (ko) 2015-09-25 2017-11-09 전남대학교산학협력단 Crispr/cas9 시스템을 이용한 베타2-마이크로글로불린 유전자 제거용 시발체
EP3147363B1 (en) 2015-09-26 2019-10-16 B.R.A.I.N. Ag Activation of taste receptor genes in mammalian cells using crispr-cas-9
JP2018527943A (ja) 2015-09-28 2018-09-27 テンプル ユニバーシティー オブ ザ コモンウェルス システム オブ ハイヤー エデュケーション Rna誘導性の、hiv感染の処置のための、方法および組成物
US20170088828A1 (en) 2015-09-29 2017-03-30 Agenovir Corporation Compositions and methods for treatment of latent viral infections
CN108603192A (zh) 2015-09-29 2018-09-28 埃吉诺维亚公司 用于调节潜伏的病毒转录的组合物和方法
US20170087224A1 (en) 2015-09-29 2017-03-30 Agenovir Corporation Delivery methods and compositions
US20170088587A1 (en) 2015-09-29 2017-03-30 Agenovir Corporation Antiviral fusion proteins and genes
CN105177038B (zh) 2015-09-29 2018-08-24 中国科学院遗传与发育生物学研究所 一种高效定点编辑植物基因组的CRISPR/Cas9系统
CN105331627B (zh) 2015-09-30 2019-04-02 华中农业大学 一种利用内源CRISPR-Cas系统进行原核生物基因组编辑的方法
EP3356520B1 (en) 2015-10-02 2022-03-23 The U.S.A. as represented by the Secretary, Department of Health and Human Services Lentiviral protein delivery system for rna-guided genome editing
WO2017062605A1 (en) 2015-10-06 2017-04-13 The Children's Hospital Of Philadelphia Compositions and methods for treating fragile x syndrome and related syndromes
WO2017062754A1 (en) 2015-10-07 2017-04-13 New York University Compositions and methods for enhancing crispr activity by polq inhibition
KR20180054871A (ko) 2015-10-08 2018-05-24 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 다중화 게놈 편집
WO2017062886A1 (en) 2015-10-08 2017-04-13 Cellink Corporation Battery interconnects
CA3000917A1 (en) 2015-10-09 2017-04-13 Monsanto Technology Llc Rna-guided nucleases and uses thereof
EP3359662A4 (en) 2015-10-09 2019-06-19 The Children's Hospital of Philadelphia COMPOSITIONS AND METHODS OF TREATING HUNTINGTON DISEASE AND RELATED DISEASES
AU2016338785B2 (en) 2015-10-12 2022-07-14 E. I. Du Pont De Nemours And Company Protected DNA templates for gene modification and increased homologous recombination in cells and methods of use
EP4089175A1 (en) 2015-10-13 2022-11-16 Duke University Genome engineering with type i crispr systems in eukaryotic cells
WO2017066707A1 (en) 2015-10-14 2017-04-20 Life Technologies Corporation Ribonucleoprotein transfection agents
CN105400779A (zh) 2015-10-15 2016-03-16 芜湖医诺生物技术有限公司 嗜热链球菌CRISPR-Cas9系统识别的人CCR5基因的靶序列和sgRNA及其应用
FR3042506B1 (fr) 2015-10-16 2018-11-30 IFP Energies Nouvelles Outil genetique de transformation de bacteries clostridium
WO2017064566A2 (en) 2015-10-16 2017-04-20 Astrazeneca Ab Inducible modification of a cell genome
DK3362461T3 (da) 2015-10-16 2022-05-09 Modernatx Inc Mrna-cap-analoger med modificeret phosphatbinding
WO2017066588A2 (en) 2015-10-16 2017-04-20 Temple University - Of The Commonwealth System Of Higher Education Methods and compositions utilizing cpf1 for rna-guided gene editing
CN105331607A (zh) 2015-10-19 2016-02-17 芜湖医诺生物技术有限公司 嗜热链球菌CRISPR-Cas9系统识别的人CCR5基因的靶序列和sgRNA及其应用
WO2017070169A1 (en) 2015-10-19 2017-04-27 The Methodist Hospital Crispr-cas9 delivery to hard-to-transfect cells via membrane deformation
CN105316324A (zh) 2015-10-20 2016-02-10 芜湖医诺生物技术有限公司 嗜热链球菌CRISPR-Cas9系统识别的人CXCR4基因的靶序列和sgRNA及其应用
JP7059179B2 (ja) 2015-10-20 2022-04-25 アンスティチュ ナショナル ドゥ ラ サンテ エ ドゥ ラ ルシェルシュ メディカル 遺伝子操作のための方法及び製品
CN105316337A (zh) 2015-10-20 2016-02-10 芜湖医诺生物技术有限公司 嗜热链球菌CRISPR-Cas9系统识别的人CXCR4基因的靶序列和sgRNA及其应用
CN105331608A (zh) 2015-10-20 2016-02-17 芜湖医诺生物技术有限公司 脑膜炎双球菌CRISPR-Cas9系统识别的人CXCR4基因的靶序列和sgRNA及其应用
CN105331609A (zh) 2015-10-20 2016-02-17 芜湖医诺生物技术有限公司 脑膜炎双球菌CRISPR-Cas9系统识别的人CCR5基因的靶序列和sgRNA及其应用
JP2018531024A (ja) 2015-10-20 2018-10-25 パイオニア ハイ−ブレッド インターナショナル, イン マーカーフリーゲノム改変のための方法および組成物
AU2016341919A1 (en) 2015-10-21 2018-04-19 Editas Medicine, Inc. CRISPR/CAS-related methods and compositions for treating hepatitis b virus
EP3365441A1 (en) 2015-10-22 2018-08-29 The Broad Institute Inc. Type vi-b crispr enzymes and systems
CN105219799A (zh) 2015-10-22 2016-01-06 天津吉诺沃生物科技有限公司 一种基于CRISPR/Cas系统的多年生黑麦草的育种方法
EP3159407A1 (en) 2015-10-23 2017-04-26 Silence Therapeutics (London) Ltd Guide rnas, methods and uses
ES2699848T3 (es) 2015-10-23 2019-02-13 Caribou Biosciences Inc Acido nucleico CRISPR clase 2 de tipo cruzado modificado que se dirige a ácidos nucleicos
TW201715041A (zh) 2015-10-26 2017-05-01 國立清華大學 細菌基因編輯方法
US9988637B2 (en) 2015-10-26 2018-06-05 National Tsing Hua Univeristy Cas9 plasmid, genome editing system and method of Escherichia coli
CA3006465A1 (en) 2015-10-27 2017-05-04 Recombinetics, Inc. Engineering of humanized car t-cells and platelets by genetic complementation
US10280411B2 (en) 2015-10-27 2019-05-07 Pacific Biosciences of California, In.c Methods, systems, and reagents for direct RNA sequencing
WO2017072590A1 (en) 2015-10-28 2017-05-04 Crispr Therapeutics Ag Materials and methods for treatment of duchenne muscular dystrophy
BR112018008519A2 (pt) 2015-10-28 2018-11-06 Sangamo Therapeutics Inc construtos específicos de fígado, cassetes de expressão de fator viii e métodos de uso dos mesmos
WO2017075335A1 (en) 2015-10-28 2017-05-04 Voyager Therapeutics, Inc. Regulatable expression using adeno-associated virus (aav)
WO2017074962A1 (en) 2015-10-30 2017-05-04 Brandeis University Modified cas9 compositions and methods of use
EP3368670A1 (en) 2015-10-30 2018-09-05 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating herpes simplex virus
CN105238806B (zh) 2015-11-02 2018-11-27 中国科学院天津工业生物技术研究所 一种用于微生物的CRISPR/Cas9基因编辑载体的构建及其应用
CN105316327B (zh) 2015-11-03 2019-01-29 中国农业科学院作物科学研究所 小麦TaAGO4a基因CRISPR/Cas9载体及其应用
CN108368520B (zh) 2015-11-04 2023-01-17 菲特治疗公司 多能细胞的基因组工程改造
MX2018005612A (es) 2015-11-04 2018-11-09 Univ Pennsylvania Metodos y composiciones para la edicion genetica en celulas madre hematopoyeticas.
WO2017079428A1 (en) 2015-11-04 2017-05-11 President And Fellows Of Harvard College Site specific germline modification
GB2544270A (en) 2015-11-05 2017-05-17 Fundació Centre De Regulació Genòmica Nucleic acids, peptides and methods
AU2016348782A1 (en) 2015-11-05 2018-05-31 Cellectis Process of gene-editing of cells isolated from a subject suffering from a metabolic disease affecting the erythroid lineage, cells obtained by said process and uses thereof.
AU2016349738A1 (en) 2015-11-06 2018-05-24 The Jackson Laboratory Large genomic DNA knock-in and uses thereof
WO2017078751A1 (en) 2015-11-06 2017-05-11 The Methodist Hospital Micoluidic cell deomailiy assay for enabling rapid and efficient kinase screening via the crispr-cas9 system
EP3374507A1 (en) 2015-11-09 2018-09-19 IFOM Fondazione Istituto Firc di Oncologia Molecolare Crispr-cas sgrna library
EP3374494A4 (en) 2015-11-11 2019-05-01 Coda Biotherapeutics, Inc. CRISPR COMPOSITIONS AND METHODS OF USE FOR GENE THERAPY
US11566052B2 (en) 2015-11-11 2023-01-31 Lonza Ltd. CRISPR-associated (Cas) proteins with reduced immunogenicity
JP2018537448A (ja) 2015-11-12 2018-12-20 ファイザー・インコーポレイテッド CRISPR−Cas9を用いた組織特異的ゲノム操作
WO2017083766A1 (en) 2015-11-13 2017-05-18 Massachusetts Institute Of Technology High-throughput crispr-based library screening
KR101885901B1 (ko) 2015-11-13 2018-08-07 기초과학연구원 5' 말단의 인산기가 제거된 rna를 포함하는 리보핵산단백질 전달용 조성물
US20170191047A1 (en) 2015-11-13 2017-07-06 University Of Georgia Research Foundation, Inc. Adenosine-specific rnase and methods of use
KR20180081600A (ko) 2015-11-16 2018-07-16 리서치 인스티튜트 앳 네이션와이드 칠드런스 하스피탈 티틴-기반 근증 및 다른 티틴성병증의 치료를 위한 물질 및 방법
CN106893739A (zh) 2015-11-17 2017-06-27 香港中文大学 用于靶向基因操作的新方法和系统
CN109072235B (zh) 2015-11-23 2023-02-28 加利福尼亚大学董事会 通过核递送crispr/cas9追踪并操纵细胞rna
CN105602987A (zh) 2015-11-23 2016-05-25 深圳市默赛尔生物医学科技发展有限公司 一种高效的dc细胞xbp1基因敲除方法
US20170145438A1 (en) 2015-11-24 2017-05-25 University Of South Carolina Viral Vectors for Gene Editing
EP3382018B1 (en) 2015-11-25 2022-03-30 National University Corporation Gunma University Dna methylation editing kit and dna methylation editing method
US10240145B2 (en) 2015-11-25 2019-03-26 The Board Of Trustees Of The Leland Stanford Junior University CRISPR/Cas-mediated genome editing to treat EGFR-mutant lung cancer
WO2017091510A1 (en) 2015-11-27 2017-06-01 The Regents Of The University Of California Compositions and methods for the production of hydrocarbons, hydrogen and carbon monoxide using engineered azotobacter strains
CN105505979A (zh) 2015-11-28 2016-04-20 湖北大学 一种以CRISPR/Cas9基因编辑技术打靶Badh2基因获得香稻品系的方法
CN106811479B (zh) 2015-11-30 2019-10-25 中国农业科学院作物科学研究所 利用CRISPR/Cas9系统定点修饰ALS基因获得抗除草剂水稻的系统及其应用
WO2017095111A1 (ko) 2015-11-30 2017-06-08 기초과학연구원 F. novicida 유래 Cas9을 포함하는 유전체 교정용 조성물
CN105296518A (zh) 2015-12-01 2016-02-03 中国农业大学 一种用于CRISPR/Cas9技术的同源臂载体构建方法
RU2634395C1 (ru) 2015-12-01 2017-10-26 Федеральное государственное автономное образовательное учреждение высшего профессионального образования "Балтийский Федеральный Университет имени Иммануила Канта" (БФУ им. И. Канта) Генетическая конструкция на основе системы редактирования генома crispr/cas9, кодирующая нуклеазу cas9, специфически импортируемую в митохондрии клеток человека
BR112018011242B1 (pt) 2015-12-02 2023-11-28 Ceres, Inc. Método de produção de uma planta com um traço agronômico desejável
EP3383409A4 (en) 2015-12-02 2019-10-02 The Regents of The University of California COMPOSITIONS AND METHODS FOR MODIFYING TARGET NUCLEIC ACID
WO2017093370A1 (en) 2015-12-03 2017-06-08 Technische Universität München T-cell specific genome editing
US20180362975A1 (en) 2015-12-04 2018-12-20 Novartis Ag Compositions and methods for immunooncology
CN105779449B (zh) 2015-12-04 2018-11-27 新疆农业大学 一种棉花启动子GbU6-5PS及应用
CN105779448B (zh) 2015-12-04 2018-11-27 新疆农业大学 一种棉花启动子GbU6-7PS及应用
CN106845151B (zh) 2015-12-07 2019-03-26 中国农业大学 CRISPR-Cas9系统sgRNA作用靶点的筛选方法及装置
CN105462968B (zh) 2015-12-07 2018-10-16 北京信生元生物医学科技有限公司 一种靶向apoCⅢ的CRISPR-Cas9系统及其应用
RU2018124657A (ru) 2015-12-09 2020-01-09 Эксижн Биотерапевтикс, Инк. Способы редактирования генов и композиции для устранения риска активации вируса jc и пмл (прогрессирующая мультифокальная лейкоэнцефалопатия) во время иммуносупрессивной терапии
CN105463003A (zh) 2015-12-11 2016-04-06 扬州大学 一种消除卡那霉素耐药基因活性的重组载体及其构建方法
US20180362961A1 (en) 2015-12-11 2018-12-20 Danisco Us Inc. Methods and compositions for enhanced nuclease-mediated genome modification and reduced off-target site effects
CN105296537A (zh) 2015-12-12 2016-02-03 西南大学 一种基于睾丸内注射的基因定点编辑技术
CN105400773B (zh) 2015-12-14 2018-06-26 同济大学 应用于大规模筛选癌症基因的CRISPR/Cas9富集测序方法
WO2017105350A1 (en) 2015-12-14 2017-06-22 Cellresearch Corporation Pte Ltd A method of generating a mammalian stem cell carrying a transgene, a mammalian stem cell generated by the method and pharmaceuticals uses of the mammalian stem cell
WO2017106616A1 (en) 2015-12-17 2017-06-22 The Regents Of The University Of Colorado, A Body Corporate Varicella zoster virus encoding regulatable cas9 nuclease
CN105463027A (zh) 2015-12-17 2016-04-06 中国农业大学 一种高肌肉量及肥厚型心肌病模型克隆猪的制备方法
NO343153B1 (en) 2015-12-17 2018-11-19 Hydra Systems As A method of assessing the integrity status of a barrier plug
WO2017105991A1 (en) 2015-12-18 2017-06-22 Danisco Us Inc. Methods and compositions for t-rna based guide rna expression
WO2017106767A1 (en) 2015-12-18 2017-06-22 The Scripps Research Institute Production of unnatural nucleotides using a crispr/cas9 system
AU2016369490C1 (en) 2015-12-18 2021-12-23 Sangamo Therapeutics, Inc. Targeted disruption of the T cell receptor
BR112018012235A2 (pt) 2015-12-18 2018-12-04 Sangamo Therapeutics Inc rompimento alvejado do receptor de células de mhc
US20190233814A1 (en) 2015-12-18 2019-08-01 The Broad Institute, Inc. Novel crispr enzymes and systems
AU2016370726B2 (en) 2015-12-18 2022-12-08 Danisco Us Inc. Methods and compositions for polymerase II (Pol-II) based guide RNA expression
US11118194B2 (en) 2015-12-18 2021-09-14 The Regents Of The University Of California Modified site-directed modifying polypeptides and methods of use thereof
WO2017104404A1 (ja) 2015-12-18 2017-06-22 国立研究開発法人科学技術振興機構 遺伝子改変非ヒト生物、卵細胞、受精卵、及び標的遺伝子の改変方法
EP3701963A1 (en) 2015-12-22 2020-09-02 CureVac AG Method for producing rna molecule compositions
US11542466B2 (en) 2015-12-22 2023-01-03 North Carolina State University Methods and compositions for delivery of CRISPR based antimicrobials
BR112018012894A2 (pt) 2015-12-23 2018-12-04 Crispr Therapeutics Ag materiais e métodos para tratamento de esclerose lateral amiotrófica e/ou degeneração lobular frontotemporal
CN105543270A (zh) 2015-12-24 2016-05-04 中国农业科学院作物科学研究所 双抗性CRISPR/Cas9载体及应用
CN105505976A (zh) 2015-12-25 2016-04-20 安徽大学 一种维吉尼亚链霉菌ibl14产青霉素重组菌株的构建方法
CN105543266A (zh) 2015-12-25 2016-05-04 安徽大学 一种维吉尼亚链霉菌IBL14中的CRISPR-Cas系统及应用其进行基因编辑的方法
BR112018013065A2 (pt) 2015-12-28 2018-12-11 Intellia Therapeutics Inc composições e métodos para o tratamento de hemoglobinopatias
WO2017117395A1 (en) 2015-12-29 2017-07-06 Monsanto Technology Llc Novel crispr-associated transposases and uses thereof
CN105441451B (zh) 2015-12-31 2019-03-22 暨南大学 一种特异靶向人ABCB1基因的sgRNA导向序列及应用
CN105567735A (zh) 2016-01-05 2016-05-11 华东师范大学 一种凝血因子基因突变的定点修复载体系统及方法
CN108473986A (zh) 2016-01-08 2018-08-31 诺维信公司 芽孢杆菌宿主细胞的基因组编辑
US11441146B2 (en) 2016-01-11 2022-09-13 Christiana Care Health Services, Inc. Compositions and methods for improving homogeneity of DNA generated using a CRISPR/Cas9 cleavage system
CN105647922A (zh) 2016-01-11 2016-06-08 中国人民解放军疾病预防控制所 基于一种新gRNA序列的CRISPR-Cas9系统在制备乙肝治疗药物中的应用
US11427837B2 (en) 2016-01-12 2022-08-30 The Regents Of The University Of California Compositions and methods for enhanced genome editing
AU2017208094A1 (en) 2016-01-14 2018-08-09 Upside Foods, Inc. Methods for extending the replicative capacity of somatic cells during an ex vivo cultivation process
CA3011458A1 (en) 2016-01-14 2017-07-20 The Brigham And Women's Hospital, Inc. Genome editing for treating glioblastoma
EP3402327A1 (en) 2016-01-15 2018-11-21 The Jackson Laboratory Genetically modified non-human mammals by multi-cycle electroporation of cas9 protein
CN105567734A (zh) 2016-01-18 2016-05-11 丹弥优生物技术(湖北)有限公司 一种基因组dna序列精准编辑方法
WO2017126987A1 (ru) 2016-01-18 2017-07-27 Анатолий Викторович ЗАЗУЛЯ Эритроциты для направленного транспорта лекарственного средства
CN105567738A (zh) 2016-01-18 2016-05-11 南开大学 使用基因组编辑技术CRISPR-Cas9诱导CCR5Δ32缺失的方法
EP3405570A1 (en) 2016-01-22 2018-11-28 The Broad Institute, Inc. Crystal structure of crispr cpf1
JP2019512458A (ja) 2016-01-25 2019-05-16 エクシジョン バイオセラピューティクス インコーポレイテッド Rnaによって誘導された、ヒトjcウイルス及び他のポリオーマウイルスの根絶
EP3407918A4 (en) 2016-01-25 2019-09-04 Excision Biotherapeutics METHOD AND COMPOSITIONS FOR RNA-TREATED TREATMENT OF HIV INFECTIONS
CN105543228A (zh) 2016-01-25 2016-05-04 宁夏农林科学院 一种快速将水稻转化为香稻的方法
CN105567689B (zh) 2016-01-25 2019-04-09 重庆威斯腾生物医药科技有限责任公司 CRISPR/Cas9靶向敲除人TCAB1基因及其特异性gRNA
EP3199632A1 (en) 2016-01-26 2017-08-02 ACIB GmbH Temperature-inducible crispr/cas system
CN105567688A (zh) 2016-01-27 2016-05-11 武汉大学 一种可用于艾滋病基因治疗的CRISPR/SaCas9系统
SI3408292T1 (sl) 2016-01-29 2023-09-29 The Trustees Of Princeton University Razcepljeni inteini z izjemnim združevalnim delovanjem
CN109072224B (zh) 2016-01-30 2022-07-15 株式会社博纳克 人工单导rna及其用途
CN107022562B (zh) 2016-02-02 2020-07-17 中国种子集团有限公司 利用CRISPR/Cas9系统对玉米基因定点突变的方法
CN105647968B (zh) 2016-02-02 2019-07-23 浙江大学 一种CRISPR/Cas9工作效率快速测试系统及其应用
US11845933B2 (en) 2016-02-03 2023-12-19 Massachusetts Institute Of Technology Structure-guided chemical modification of guide RNA and its applications
CN105671083B (zh) 2016-02-03 2017-09-29 安徽柯顿生物科技有限公司 PD‑1基因重组病毒质粒及构建、重组逆转录病毒Lenti‑PD‑1‑Puro及包装与应用
WO2017136520A1 (en) 2016-02-04 2017-08-10 President And Fellows Of Harvard College Mitochondrial genome editing and regulation
US20190038780A1 (en) 2016-02-05 2019-02-07 Regents Of The University Of Minnesota Vectors and system for modulating gene expression
WO2017139264A1 (en) 2016-02-09 2017-08-17 President And Fellows Of Harvard College Dna-guided gene editing and regulation
RU2016104674A (ru) 2016-02-11 2017-08-16 Анатолий Викторович Зазуля Устройство модификации эритроцита с механизмом направленного транспорта лекарственного средства для функций генной терапии crispr/cas9
CA3048963A1 (en) 2016-02-11 2017-08-17 The Regents Of The University Of California Methods and compositions for modifying a mutant dystrophin gene in a cell's genome
CN105647962A (zh) 2016-02-15 2016-06-08 浙江大学 运用CRISPR-Cas9系统敲除水稻MIRNA393b茎环序列的基因编辑方法
WO2017142835A1 (en) 2016-02-15 2017-08-24 Temple University - Of The Commonwealth System Of Higher Education Excision of retroviral nucleic acid sequences
US9896696B2 (en) 2016-02-15 2018-02-20 Benson Hill Biosystems, Inc. Compositions and methods for modifying genomes
CN105647969B (zh) 2016-02-16 2020-12-15 湖南师范大学 一种基因敲除选育stat1a基因缺失型斑马鱼的方法
CN105594664B (zh) 2016-02-16 2018-10-02 湖南师范大学 一种基因敲除选育stat1a基因缺失型斑马鱼的方法
US11136597B2 (en) 2016-02-16 2021-10-05 Yale University Compositions for enhancing targeted gene editing and methods of use thereof
CN105624187A (zh) 2016-02-17 2016-06-01 天津大学 酿酒酵母基因组定点突变的方法
US11326161B2 (en) 2016-02-18 2022-05-10 President And Fellows Of Harvard College Methods and systems of molecular recording by CRISPR-Cas system
WO2017147056A1 (en) 2016-02-22 2017-08-31 Caribou Biosciences, Inc. Methods for modulating dna repair outcomes
US20170275665A1 (en) 2016-02-24 2017-09-28 Board Of Regents, The University Of Texas System Direct crispr spacer acquisition from rna by a reverse-transcriptase-cas1 fusion protein
CN105646719B (zh) 2016-02-24 2019-12-20 无锡市妇幼保健院 一种高效定点转基因的工具及其应用
WO2017147278A1 (en) 2016-02-25 2017-08-31 The Children's Medical Center Corporation Customized class switch of immunoglobulin genes in lymphoma and hybridoma by crispr/cas9 technology
US20170246260A1 (en) 2016-02-25 2017-08-31 Agenovir Corporation Modified antiviral nuclease
AU2017223964A1 (en) 2016-02-25 2018-09-06 Agenovir Corporation Viral and oncoviral nuclease treatment
US20170247703A1 (en) 2016-02-25 2017-08-31 Agenovir Corporation Antiviral nuclease methods
CN109072245B (zh) 2016-02-26 2022-06-14 朗泽科技新西兰有限公司 用于c1固定菌的crispr/cas系统
US10538750B2 (en) 2016-02-29 2020-01-21 Agilent Technologies, Inc. Methods and compositions for blocking off-target nucleic acids from cleavage by CRISPR proteins
US11447768B2 (en) 2016-03-01 2022-09-20 University Of Florida Research Foundation, Incorporated Molecular cell diary system
CN105671070B (zh) 2016-03-03 2019-03-19 江南大学 一种用于枯草芽孢杆菌基因组编辑的CRISPRCas9系统及其构建方法
KR102587132B1 (ko) 2016-03-04 2023-10-11 에디타스 메디신, 인코포레이티드 암 면역요법을 위한 crispr-cpf1-관련 방법, 조성물 및 구성성분
CN105821039B (zh) 2016-03-09 2020-02-07 李旭 联合免疫基因抑制HBV复制的特异性sgRNA、表达载体及其应用
CN105821040B (zh) 2016-03-09 2018-12-14 李旭 联合免疫基因抑制高危型HPV表达的sgRNA、基因敲除载体及其应用
CN107177591A (zh) 2016-03-09 2017-09-19 北京大学 利用CRISPR技术编辑CCR5基因的sgRNA序列及其用途
CN105861547A (zh) 2016-03-10 2016-08-17 黄捷 身份证号码永久嵌入基因组的方法
EP3426778A1 (en) 2016-03-11 2019-01-16 Pioneer Hi-Bred International, Inc. Novel cas9 systems and methods of use
MX2018011114A (es) 2016-03-14 2019-02-20 Editas Medicine Inc Métodos y composiciones relacionadas con crispr/cas para el tratamiento de beta hemoglobinopatías.
WO2017160752A1 (en) 2016-03-14 2017-09-21 Intellia Therapeutics, Inc. Methods and compositions for gene editing
EP3430332B1 (en) 2016-03-15 2020-01-01 Carrier Corporation Refrigerated sales cabinet
EP3429635A4 (en) 2016-03-15 2019-11-27 University of Massachusetts ANTI-CRISPR COMPOUNDS AND METHODS OF USE
EP3219799A1 (en) 2016-03-17 2017-09-20 IMBA-Institut für Molekulare Biotechnologie GmbH Conditional crispr sgrna expression
WO2017161068A1 (en) 2016-03-18 2017-09-21 President And Fellows Of Harvard College Mutant cas proteins
EP3433364A1 (en) 2016-03-25 2019-01-30 Editas Medicine, Inc. Systems and methods for treating alpha 1-antitrypsin (a1at) deficiency
EP3433363A1 (en) 2016-03-25 2019-01-30 Editas Medicine, Inc. Genome editing systems comprising repair-modulating enzyme molecules and methods of their use
WO2017172644A2 (en) 2016-03-28 2017-10-05 The Charles Stark Draper Laboratory, Inc. Bacteria identification and antibiotic susceptibility profiling device
CN106047803A (zh) 2016-03-28 2016-10-26 青岛市胶州中心医院 CRISPR/Cas9靶向敲除兔BMP2基因的细胞模型及其应用
US20190136231A1 (en) 2016-03-30 2019-05-09 Intellia Therapeutics, Inc. Lipid nanoparticle formulations for crispr/cas components
WO2017173004A1 (en) 2016-03-30 2017-10-05 Mikuni Takayasu A method for in vivo precise genome editing
US20190093128A1 (en) 2016-03-31 2019-03-28 The Regents Of The University Of California Methods for genome editing in zygotes
GB2565461B (en) 2016-03-31 2022-04-13 Harvard College Methods and compositions for the single tube preparation of sequencing libraries using Cas9
US10301619B2 (en) 2016-04-01 2019-05-28 New England Biolabs, Inc. Compositions and methods relating to synthetic RNA polynucleotides created from synthetic DNA oligonucleotides
CN106167525B (zh) 2016-04-01 2019-03-19 北京康明百奥新药研发有限公司 筛选超低岩藻糖细胞系的方法和应用
CA3017678A1 (en) 2016-04-04 2017-10-12 Eth Zurich Mammalian cell line for protein production and library generation
US20190093091A1 (en) 2016-04-06 2019-03-28 Temple University - Of The Commonwealth System Of Higher Education Compositions for eradicating flavivirus infections in subjects
CN105802980A (zh) 2016-04-08 2016-07-27 北京大学 Gateway兼容性CRISPR/Cas9系统及其应用
CN106399306B (zh) 2016-04-12 2019-11-05 西安交通大学第一附属医院 靶向人lncRNA-UCA1抑制膀胱癌的sgRNA、基因载体及其应用
WO2017180915A2 (en) 2016-04-13 2017-10-19 Duke University Crispr/cas9-based repressors for silencing gene targets in vivo and methods of use
EP3443088A1 (en) 2016-04-13 2019-02-20 Editas Medicine, Inc. Grna fusion molecules, gene editing systems, and methods of use thereof
WO2017180694A1 (en) 2016-04-13 2017-10-19 Editas Medicine, Inc. Cas9 fusion molecules gene editing systems, and methods of use thereof
EP3442596A1 (en) 2016-04-14 2019-02-20 Université de Lausanne Treatment and/or prevention of dna-triplet repeat diseases or disorders
AU2017250683A1 (en) 2016-04-14 2018-11-01 Boco Silicon Valley, Inc. Genome editing of human neural stem cells using nucleases
CN105821116A (zh) 2016-04-15 2016-08-03 扬州大学 一种绵羊mstn基因定向敲除及其影响成肌分化的检测方法
US20200172935A1 (en) 2016-04-16 2020-06-04 Ohio State Innovation Foundation Modified cpf1 mrna, modified guide rna, and uses thereof
EP3445852A1 (en) 2016-04-18 2019-02-27 Ruprecht-Karls-Universität Heidelberg Means and methods for inactivating therapeutic dna in a cell
WO2017184334A1 (en) 2016-04-18 2017-10-26 The Board Of Regents Of The University Of Texas System Generation of genetically engineered animals by crispr/cas9 genome editing in spermatogonial stem cells
CN110382692A (zh) 2016-04-19 2019-10-25 博德研究所 新型crispr酶以及系统
WO2017184786A1 (en) 2016-04-19 2017-10-26 The Broad Institute Inc. Cpf1 complexes with reduced indel activity
CN106086062A (zh) 2016-04-19 2016-11-09 上海市农业科学院 一种获得番茄基因组定点敲除突变体的方法
WO2017189308A1 (en) 2016-04-19 2017-11-02 The Broad Institute Inc. Novel crispr enzymes and systems
CN105886616B (zh) 2016-04-20 2020-08-07 广东省农业科学院农业生物基因研究中心 一种用于猪基因编辑的高效特异性sgRNA识别位点引导序列及其筛选方法
CN105821075B (zh) 2016-04-22 2017-09-12 湖南农业大学 一种茶树咖啡因合成酶CRISPR/Cas9基因组编辑载体的构建方法
CN107304435A (zh) 2016-04-22 2017-10-31 中国科学院青岛生物能源与过程研究所 一种Cas9/RNA系统及其应用
CN105861552B (zh) 2016-04-25 2019-10-11 西北农林科技大学 一种T7 RNA聚合酶介导的CRISPR/Cas9基因编辑系统的构建方法
WO2017189336A1 (en) 2016-04-25 2017-11-02 The Regents Of The University Of California Methods and compositions for genomic editing
CN107326046A (zh) 2016-04-28 2017-11-07 上海邦耀生物科技有限公司 一种提高外源基因同源重组效率的方法
NZ747685A (en) 2016-04-29 2023-05-26 Sarepta Therapeutics Inc Oligonucleotide analogues targeting human lmna
CN105886534A (zh) 2016-04-29 2016-08-24 苏州溯源精微生物科技有限公司 一种抑制肿瘤转移的方法
CN105821049B (zh) 2016-04-29 2019-06-04 中国农业大学 一种Fbxo40基因敲除猪的制备方法
EP4166661A1 (en) 2016-04-29 2023-04-19 BASF Plant Science Company GmbH Fused donor - guide nucleic acid and methods for modification of target nucleic acids
SG11201810755TA (en) 2016-05-01 2019-01-30 Neemo Inc Harnessing heterologous and endogenous crispr-cas machineries for efficient markerless genome editing in clostridium
US10751423B2 (en) 2016-05-02 2020-08-25 Massachusetts Institute Of Technology Nanoparticle conjugates of highly potent toxins and intraperitoneal administration of nanoparticles for treating or imaging cancer
WO2017191210A1 (en) 2016-05-04 2017-11-09 Novozymes A/S Genome editing by crispr-cas9 in filamentous fungal host cells
CN105950639A (zh) 2016-05-04 2016-09-21 广州美格生物科技有限公司 金黄色葡萄球菌CRISPR/Cas9系统的制备及其在构建小鼠模型中的应用
EP3452101A2 (en) 2016-05-04 2019-03-13 CureVac AG Rna encoding a therapeutic protein
US20190093092A1 (en) 2016-05-05 2019-03-28 Temple University - Of The Commonwealth System Of Higher Education Rna guided eradication of varicella zoster virus
ES2957660T3 (es) 2016-05-05 2024-01-23 Univ Duke Composiciones relacionadas con crispr/cas para tratar la distrofia muscular de duchenne
WO2017190664A1 (zh) 2016-05-05 2017-11-09 苏州吉玛基因股份有限公司 化学合成的crRNA和修饰crRNA在CRISPR/Cpf1基因编辑系统中的应用
CN106244591A (zh) 2016-08-23 2016-12-21 苏州吉玛基因股份有限公司 修饰crRNA在CRISPR/Cpf1基因编辑系统中的应用
CN105907785B (zh) 2016-05-05 2020-02-07 苏州吉玛基因股份有限公司 化学合成的crRNA用于CRISPR/Cpf1系统在基因编辑中的应用
CN105985985B (zh) 2016-05-06 2019-12-31 苏州大学 Crispr技术编辑并用igf优化的异体间充质干细胞的制备方法及在治疗心梗中应用
CA3022319A1 (en) 2016-05-06 2017-11-09 Tod M. Woolf Improved methods for genome editing with and without programmable nucleases
US20190161743A1 (en) 2016-05-09 2019-05-30 President And Fellows Of Harvard College Self-Targeting Guide RNAs in CRISPR System
WO2017197038A1 (en) 2016-05-10 2017-11-16 United States Government As Represented By The Department Of Veterans Affairs Lentiviral delivery of crispr/cas constructs that cleave genes essential for hiv-1 infection and replication
CN105861554B (zh) 2016-05-10 2020-01-31 华南农业大学 一种基于对Rbmy基因进行编辑来实现动物性别控制的方法和应用
CN107365786A (zh) 2016-05-12 2017-11-21 中国科学院微生物研究所 一种将spacer序列克隆至CRISPR-Cas9系统中的方法及其应用
WO2017197238A1 (en) 2016-05-12 2017-11-16 President And Fellows Of Harvard College Aav split cas9 genome editing and transcriptional regulation
WO2017197301A1 (en) 2016-05-12 2017-11-16 Hanley Brian P Safe delivery of crispr and other gene therapies to large fractions of somatic cells in humans and animals
KR101922989B1 (ko) 2016-05-13 2018-11-28 연세대학교 산학협력단 CRISPR/Retron 시스템을 이용한 유전체상의 치환 변이 생성과 추적 방법
CN105838733A (zh) 2016-05-18 2016-08-10 云南省农业科学院花卉研究所 Cas9 介导的香石竹基因编辑载体和应用
CN106011171B (zh) 2016-05-18 2019-10-11 西北农林科技大学 一种利用CRISPR/Cas9技术基于SSA修复的基因无缝编辑方法
CN105907758B (zh) 2016-05-18 2020-06-05 世翱(上海)生物医药科技有限公司 CRISPR-Cas9引导序列及其引物、转基因表达载体及其构建方法
RU2745563C2 (ru) 2016-05-20 2021-03-29 Регенерон Фармасьютикалс, Инк. Способы преодоления иммунологической толерантности с использованием множества направляющих рнк
CN106446600B (zh) 2016-05-20 2019-10-18 同济大学 一种基于CRISPR/Cas9的sgRNA的设计方法
US20190300867A1 (en) 2016-05-23 2019-10-03 The Trustees Of Columbia University In The City Of New York Bypassing the pam requirement of the crispr-cas system
WO2017205423A1 (en) 2016-05-23 2017-11-30 Washington University Pulmonary targeted cas9/crispr for in vivo editing of disease genes
CN105950560B (zh) 2016-05-24 2019-07-23 苏州系统医学研究所 人源化pd-l1肿瘤细胞系及具有该细胞系的动物模型与应用
CN106011167B (zh) 2016-05-27 2019-11-01 上海交通大学 雄性不育基因OsDPW2的应用及水稻育性恢复的方法
KR20190012229A (ko) 2016-06-01 2019-02-08 케이더블유에스 사아트 에스이 유전자 조작을 위한 하이브리드 핵산 서열
US20190100732A1 (en) 2016-06-02 2019-04-04 Yissum Research Development Company Of The Hebrew University Of Jerusalem Ltd. Assay for the removal of methyl-cytosine residues from dna
CA3209273A1 (en) 2016-06-02 2017-12-07 Sigma-Aldrich Co. Llc Using programmable dna binding proteins to enhance targeted genome modification
JP2019517503A (ja) 2016-06-03 2019-06-24 テンプル ユニバーシティー オブ ザ コモンウェルス システム オブ ハイヤー エデュケーション 遺伝子編集戦略によるhiv−1のネガティブフィードバック調節
US11140883B2 (en) 2016-06-03 2021-10-12 Auburn University Gene editing of reproductive hormones to sterilize aquatic animals
WO2017213898A2 (en) 2016-06-07 2017-12-14 Temple University - Of The Commonwealth System Of Higher Education Rna guided compositions for preventing and treating hepatitis b virus infections
CN106119275A (zh) 2016-06-07 2016-11-16 湖北大学 基于CRISPR/Cas9技术将非糯性水稻株系改造成糯性株系的打靶载体和方法
US10767175B2 (en) 2016-06-08 2020-09-08 Agilent Technologies, Inc. High specificity genome editing using chemically modified guide RNAs
CN106086008B (zh) 2016-06-10 2019-03-12 中国农业科学院植物保护研究所 烟粉虱MED隐种TRP基因的CRISPR/cas9系统及其应用
WO2017222834A1 (en) 2016-06-10 2017-12-28 City Of Hope Compositions and methods for mitochondrial genome editing
AU2017286122A1 (en) 2016-06-14 2018-11-22 Pioneer Hi-Bred International, Inc. Use of Cpf1 endonuclease for plant genome modifications
CN106434752A (zh) 2016-06-14 2017-02-22 南通大学附属医院 敲除Wnt3a基因的过程及其验证方法
CN106167808A (zh) 2016-06-16 2016-11-30 郑州大学 一种基于CRISPR/Cas9技术消除mecA质粒的方法
CN106167821A (zh) 2016-06-16 2016-11-30 郑州大学 一种金黄色葡萄球菌crispr位点检测试剂盒及检测方法
CN105950633B (zh) 2016-06-16 2019-05-03 复旦大学 基因OsARF4在控制水稻粒长和千粒重中的应用
US20190323038A1 (en) 2016-06-17 2019-10-24 Montana State Univesity Bidirectional targeting for genome editing
JP7267013B2 (ja) 2016-06-17 2023-05-01 ザ・ブロード・インスティテュート・インコーポレイテッド Vi型crisprオルソログ及び系
WO2017216771A2 (en) 2016-06-17 2017-12-21 Genesis Technologies Limited Crispr-cas system, materials and methods
CN105950626B (zh) 2016-06-17 2018-09-28 新疆畜牧科学院生物技术研究所 基于CRISPR/Cas9获得不同毛色绵羊的方法及靶向ASIP基因的sgRNA
WO2017223107A1 (en) 2016-06-20 2017-12-28 Unity Biotechnology, Inc. Genome modifying enzyme therapy for diseases modulated by senescent cells
US20170362635A1 (en) 2016-06-20 2017-12-21 University Of Washington Muscle-specific crispr/cas9 editing of genes
WO2017222773A1 (en) 2016-06-20 2017-12-28 Pioneer Hi-Bred International, Inc. Novel cas systems and methods of use
US11371051B2 (en) 2016-06-20 2022-06-28 Keygene N.V. Method for targeted DNA alteration in plant cells
CN106148370A (zh) 2016-06-21 2016-11-23 苏州瑞奇生物医药科技有限公司 肥胖症大鼠动物模型和构建方法
EP3475416A4 (en) 2016-06-22 2020-04-29 Icahn School of Medicine at Mount Sinai VIRAL DELIVERY OF RNA USING SELF-CLeavING RIBOZYMES AND CRISPR-BASED APPLICATIONS
JP7074345B2 (ja) 2016-06-22 2022-05-24 プロキューアール セラピューティクス ツー ベスローテン フェンノートシャップ 一本鎖rna編集オリゴヌクレオチド
CN106047877B (zh) 2016-06-24 2019-01-11 中山大学附属第一医院 一种靶向敲除FTO基因的sgRNA及CRISPR/Cas9慢病毒系统与应用
CN106119283A (zh) 2016-06-24 2016-11-16 广西壮族自治区水牛研究所 一种利用CRISPR‑Cas9靶向敲除MSTN基因的方法
CN105925608A (zh) 2016-06-24 2016-09-07 广西壮族自治区水牛研究所 一种利用CRISPR-Cas9靶向敲除ALK6基因的方法
AU2017286835B2 (en) 2016-06-29 2023-12-14 Crispr Therapeutics Ag Compositions and methods for gene editing
US20210222164A1 (en) 2016-06-29 2021-07-22 The Broad Institute, Inc. Crispr-cas systems having destabilization domain
US11913017B2 (en) 2016-06-29 2024-02-27 The Regents Of The University Of California Efficient genetic screening method
CN106148286B (zh) 2016-06-29 2019-10-29 牛刚 一种用于检测热原的细胞模型的构建方法和细胞模型及热原检测试剂盒
US10927383B2 (en) 2016-06-30 2021-02-23 Ethris Gmbh Cas9 mRNAs
US10892034B2 (en) 2016-07-01 2021-01-12 Microsoft Technology Licensing, Llc Use of homology direct repair to record timing of a molecular event
WO2018005117A1 (en) 2016-07-01 2018-01-04 Microsoft Technology Licensing, Llc Storage through iterative dna editing
US20180004537A1 (en) 2016-07-01 2018-01-04 Microsoft Technology Licensing, Llc Molecular State Machines
WO2018009562A1 (en) 2016-07-05 2018-01-11 The Johns Hopkins University Crispr/cas9-based compositions and methods for treating retinal degenerations
CN106191057B (zh) 2016-07-06 2018-12-25 中山大学 一种用于敲除人CYP2E1基因的sgRNA序列、CYP2E1基因缺失细胞株的构建方法及其应用
WO2018009520A1 (en) 2016-07-06 2018-01-11 Novozymes A/S Improving a microorganism by crispr-inhibition
CN106051058A (zh) 2016-07-07 2016-10-26 上海格昆机电科技有限公司 用于航天贮箱和粒子治疗仪的旋转机架及其传动机构
CN107586777A (zh) 2016-07-08 2018-01-16 上海吉倍生物技术有限公司 人PDCD1基因sgRNA的用途及其相关药物
US11845929B2 (en) 2016-07-08 2023-12-19 Ohio State Innovation Foundation Modified nucleic acids, hybrid guide RNAs, and uses thereof
CN106047930B (zh) 2016-07-12 2020-05-19 北京百奥赛图基因生物技术有限公司 一种PS1基因条件性敲除flox大鼠的制备方法
BR112019000430A2 (pt) 2016-07-13 2019-07-09 Dsm Ip Assets Bv sistema crispr-cas para uma célula hospedeira de algas
US11674158B2 (en) 2016-07-15 2023-06-13 Salk Institute For Biological Studies Methods and compositions for genome editing in non-dividing cells
US20190330659A1 (en) 2016-07-15 2019-10-31 Zymergen Inc. Scarless dna assembly and genome editing using crispr/cpf1 and dna ligase
CN106191062B (zh) 2016-07-18 2019-06-14 广东华南疫苗股份有限公司 一种tcr-/pd-1-双阴性t细胞及其构建方法
CN106191061B (zh) 2016-07-18 2019-06-18 暨南大学 一种特异靶向人ABCG2基因的sgRNA导向序列及其应用
CN106190903B (zh) 2016-07-18 2019-04-02 华中农业大学 鸭疫里氏杆菌Cas9基因缺失突变株及其应用
EP4275747A3 (en) 2016-07-19 2024-01-24 Duke University Therapeutic applications of cpf1-based genome editing
CN106434651B (zh) 2016-07-19 2021-05-18 广西大学 根癌农杆菌和CRISPR-Cas9介导的基因定点插入失活方法及其应用
JP2019520844A (ja) 2016-07-21 2019-07-25 マックスサイト インコーポレーティッド ゲノムdnaを改変するための方法および組成物
WO2018015444A1 (en) 2016-07-22 2018-01-25 Novozymes A/S Crispr-cas9 genome editing with multiple guide rnas in filamentous fungi
CN106191064B (zh) 2016-07-22 2019-06-07 中国农业大学 一种制备mc4r基因敲除猪的方法
CN106191107B (zh) 2016-07-22 2020-03-20 湖南农业大学 一种降低水稻籽粒落粒性的分子改良方法
US20190270980A1 (en) 2016-07-25 2019-09-05 Mayo Foundation For Medical Education And Research Treating cancer
CN106222193B (zh) 2016-07-26 2019-09-20 浙江大学 一种重组载体及无转基因基因编辑植株的筛选方法
WO2018018979A1 (zh) 2016-07-26 2018-02-01 浙江大学 植物重组载体及无转基因成分的基因编辑植株的筛选方法
CN109790527A (zh) 2016-07-26 2019-05-21 通用医疗公司 普氏菌属和弗朗西斯氏菌属的CRISPR1(Cpf1)的变体
CN106086061A (zh) 2016-07-27 2016-11-09 苏州泓迅生物科技有限公司 一种基于CRISPR‑Cas9系统的酿酒酵母基因组编辑载体及其应用
CN106191099A (zh) 2016-07-27 2016-12-07 苏州泓迅生物科技有限公司 一种基于CRISPR‑Cas9系统的酿酒酵母基因组并行多重编辑载体及其应用
KR101828958B1 (ko) 2016-07-28 2018-02-13 주식회사 비엠티 옥외 배관용 히팅재킷
CN106191113B (zh) 2016-07-29 2020-01-14 中国农业大学 一种mc3r基因敲除猪的制备方法
GB201613135D0 (en) 2016-07-29 2016-09-14 Medical Res Council Genome editing
CN106191124B (zh) 2016-07-29 2019-10-11 中国科学院重庆绿色智能技术研究院 一种利用鱼卵保存液提高CRISPR-Cas9基因编辑和传代效率的鱼类育种方法
CN106191114B (zh) 2016-07-29 2020-02-11 中国科学院重庆绿色智能技术研究院 利用CRISPR-Cas9系统敲除鱼类MC4R基因的育种方法
CN106434748A (zh) 2016-07-29 2017-02-22 中国科学院重庆绿色智能技术研究院 一种热激诱导型 Cas9 酶转基因斑马鱼的研制及应用
EP3491134B1 (en) 2016-08-01 2023-10-11 University of Pittsburgh - of The Commonwealth System of Higher Education Human induced pluripotent stem cells for high efficiency genetic engineering
CN106011150A (zh) 2016-08-01 2016-10-12 云南纳博生物科技有限公司 一种水稻穗粒数Gn1a基因人工定点突变体及其应用
CN106434688A (zh) 2016-08-01 2017-02-22 云南纳博生物科技有限公司 一种水稻直立密穗dep1基因人工定点突变体及其应用
WO2018025206A1 (en) 2016-08-02 2018-02-08 Kyoto University Method for genome editing
EP3494220A1 (en) 2016-08-02 2019-06-12 Editas Medicine, Inc. Compositions and methods for treating cep290 associated disease
CA3032699A1 (en) 2016-08-03 2018-02-08 President And Fellows Of Harvard College Adenosine nucleobase editors and uses thereof
CN106282241A (zh) 2016-08-05 2017-01-04 无锡市第二人民医院 通过CRISPR/Cas9得到敲除bmp2a基因的斑马鱼的方法
AU2017308889B2 (en) 2016-08-09 2023-11-09 President And Fellows Of Harvard College Programmable Cas9-recombinase fusion proteins and uses thereof
KR101710026B1 (ko) 2016-08-10 2017-02-27 주식회사 무진메디 Cas9 단백질 및 가이드 RNA의 혼성체를 함유하는 나노 리포좀 전달체 조성물
CN106222203A (zh) 2016-08-10 2016-12-14 云南纳博生物科技有限公司 利用CRISPR/Cas技术获得家蚕丝素重链基因突变体及突变方法和应用
CN106172238B (zh) 2016-08-12 2019-01-22 中南大学 miR-124基因敲除小鼠动物模型的构建方法和应用
CN106222177B (zh) 2016-08-13 2018-06-26 江苏集萃药康生物科技有限公司 一种靶向人STAT6的CRISPR-Cas9系统及其用于治疗过敏性疾病的应用
EP3500967A1 (en) 2016-08-17 2019-06-26 The Broad Institute, Inc. Methods for identifying class 2 crispr-cas systems
US11810649B2 (en) 2016-08-17 2023-11-07 The Broad Institute, Inc. Methods for identifying novel gene editing elements
US20210000091A1 (en) 2016-08-17 2021-01-07 The Regents Of The University Of California Split Trans-Complementing Gene-Drive System for Suppressing Aedes Aegypti Mosquitos
CA3034089A1 (en) 2016-08-18 2018-02-22 The Regents Of The University Of California Crispr-cas genome engineering via a modular aav delivery system
AU2017312132A1 (en) 2016-08-19 2019-03-21 Bluebird Bio, Inc. Genome editing enhancers
CN109963945A (zh) 2016-08-20 2019-07-02 阿维利诺美国实验室股份有限公司 单一向导rna、crispr/cas9系统及其使用方法
CN106191116B (zh) 2016-08-22 2019-10-08 西北农林科技大学 基于CRISPR/Cas9的外源基因敲入整合系统及其建立方法和应用
CN106191071B (zh) 2016-08-22 2018-09-04 广州资生生物科技有限公司 一种CRISPR-Cas9系统及其用于治疗乳腺癌疾病的应用
CN106086028B (zh) 2016-08-23 2019-04-23 中国农业科学院作物科学研究所 一种通过基因组编辑提高水稻抗性淀粉含量的方法及其专用sgRNA
CN106244555A (zh) 2016-08-23 2016-12-21 广州医科大学附属第三医院 一种提高基因打靶的效率的方法及β‑球蛋白基因位点的碱基原位修复方法
KR101856345B1 (ko) 2016-08-24 2018-06-20 경상대학교산학협력단 CRISPR/Cas9 시스템을 이용하여 APOBEC3H 및 APOBEC3CH 이중-넉아웃 고양이를 제조하는 방법
KR102455249B1 (ko) 2016-08-24 2022-10-17 상가모 테라퓨틱스, 인코포레이티드 가공된 표적 특이적 뉴클레아제
CN106109417A (zh) 2016-08-24 2016-11-16 李因传 一种肝细胞膜仿生脂质体药物载体、制作方法及其应用
CN110325635B (zh) 2016-08-24 2023-12-26 桑格摩生物治疗股份有限公司 使用工程化的核酸酶调控基因表达
CN106244609A (zh) 2016-08-24 2016-12-21 浙江理工大学 一种调节pi3k‑akt信号通路的非编码基因的筛选系统及筛选方法
WO2018039438A1 (en) 2016-08-24 2018-03-01 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
CN106544357B (zh) 2016-08-25 2018-08-21 湖南杂交水稻研究中心 一种培育镉低积累籼稻品种的方法
CN106350540A (zh) 2016-08-26 2017-01-25 苏州系统医学研究所 一种由慢病毒介导的高效可诱导型CRISPR/Cas9基因敲除载体及其应用
CN107784200B (zh) 2016-08-26 2020-11-06 深圳华大生命科学研究院 一种筛选新型CRISPR-Cas系统的方法和装置
CN106318973B (zh) 2016-08-26 2019-09-13 深圳市第二人民医院 一种基于CRISPR-Cas9的基因调控装置及基因调控方法
CN106244557B (zh) 2016-08-29 2019-10-25 中国农业科学院北京畜牧兽医研究所 定点突变ApoE基因与LDLR基因的方法
CN106480097A (zh) 2016-10-13 2017-03-08 南京凯地生物科技有限公司 利用CRISPR/Cas9技术敲除人PD‑1基因构建可靶向MSLN新型CAR‑T细胞的方法及其应用
CN106399375A (zh) 2016-08-31 2017-02-15 南京凯地生物科技有限公司 利用CRISPR/Cas9敲除人PD‑1基因构建靶向CD19CAR‑T细胞的方法
CN106399367A (zh) 2016-08-31 2017-02-15 深圳市卫光生物制品股份有限公司 提高crispr介导的同源重组效率的方法
CN107794272B (zh) 2016-09-06 2021-10-12 中国科学院上海营养与健康研究所 一种高特异性的crispr基因组编辑体系
US20190255106A1 (en) 2016-09-07 2019-08-22 Flagship Pioneering Inc. Methods and compositions for modulating gene expression
CN106399311A (zh) 2016-09-07 2017-02-15 同济大学 用于Chip‑seq全基因组结合谱的内源蛋白标记的方法
CN106367435B (zh) 2016-09-07 2019-11-08 电子科技大学 一种水稻miRNA定向敲除的方法
WO2018048827A1 (en) 2016-09-07 2018-03-15 Massachusetts Institute Of Technology Rna-guided endonuclease-based dna assembly
CN106399377A (zh) 2016-09-07 2017-02-15 同济大学 一种基于CRISPR/Cas9高通量技术筛选药物靶点基因的方法
CN107574179B (zh) 2016-09-09 2018-07-10 康码(上海)生物科技有限公司 一种为克鲁维酵母优化的CRISPR/Cas9高效基因编辑系统
EP3510151A4 (en) 2016-09-09 2020-04-15 The Board of Trustees of the Leland Stanford Junior University HIGH-THROUGHPUT PRECISION GENE EDITING
WO2018051347A1 (en) 2016-09-14 2018-03-22 Yeda Research And Development Co. Ltd. Crisp-seq, an integrated method for massively parallel single cell rna-seq and crispr pooled screens
CN106318934B (zh) 2016-09-21 2020-06-05 上海交通大学 胡萝卜β(1,2)木糖转移酶的基因全序列及用于转染双子叶植物的CRISPR/CAS9的质粒构建
CN106957858A (zh) 2016-09-23 2017-07-18 西北农林科技大学 一种利用CRISPR/Cas9系统共同敲除绵羊MSTN、ASIP、BCO2基因的方法
US9580698B1 (en) 2016-09-23 2017-02-28 New England Biolabs, Inc. Mutant reverse transcriptase
CN109715804A (zh) 2016-09-23 2019-05-03 帝斯曼知识产权资产管理有限公司 用于宿主细胞的指导rna表达系统
US20180127786A1 (en) 2016-09-23 2018-05-10 Casebia Therapeutics Limited Liability Partnership Compositions and methods for gene editing
US11319546B2 (en) 2016-09-28 2022-05-03 Cellivery Therapeutics, Inc. Cell-permeable (CP)-Cas9 recombinant protein and uses thereof
EP3523426A4 (en) 2016-09-30 2020-01-22 The Regents of The University of California RNA GUIDED NUCLEIC ACID MODIFYING ENZYMES AND METHOD FOR USE THEREOF
WO2018064516A1 (en) 2016-09-30 2018-04-05 Monsanto Technology Llc Method for selecting target sites for site-specific genome modification in plants
CN107881184B (zh) 2016-09-30 2021-08-27 中国科学院分子植物科学卓越创新中心 一种基于Cpf1的DNA体外拼接方法
CN106480027A (zh) 2016-09-30 2017-03-08 重庆高圣生物医药有限责任公司 CRISPR/Cas9 靶向敲除人PD‑1基因及其特异性gRNA
KR20190072548A (ko) 2016-09-30 2019-06-25 더 리젠츠 오브 더 유니버시티 오브 캘리포니아 Rna-가이드된 핵산 변형 효소 및 이의 사용 방법
CN107880132B (zh) 2016-09-30 2022-06-17 北京大学 一种融合蛋白及使用其进行同源重组的方法
WO2018067546A1 (en) 2016-10-03 2018-04-12 President And Fellows Of Harvard College Delivery of therapeutic rnas via arrdc1-mediated microvesicles
WO2018067846A1 (en) 2016-10-05 2018-04-12 President And Fellows Of Harvard College Methods of crispr mediated genome modulation in v. natriegens
US10669539B2 (en) 2016-10-06 2020-06-02 Pioneer Biolabs, Llc Methods and compositions for generating CRISPR guide RNA libraries
KR20230164759A (ko) 2016-10-07 2023-12-04 인티그레이티드 디엔에이 테크놀로지스 아이엔씨. S. 피오게네스 cas9 돌연변이 유전자 및 이에 의해 암호화되는 폴리펩티드
CN106479985A (zh) 2016-10-09 2017-03-08 上海吉玛制药技术有限公司 病毒介导的Cpf1蛋白在CRISPR/Cpf1基因编辑系统中的应用
IT201600102542A1 (it) 2016-10-12 2018-04-12 Univ Degli Studi Di Trento Plasmide e sistema lentivirale contenente un circuito autolimitante della Cas9 che ne incrementa la sicurezza.
US20190365862A1 (en) 2016-10-12 2019-12-05 Temple University - Of The Commonwealth System Of Higher Education Combination therapies for eradicating flavivirus infections in subjects
CN106434663A (zh) 2016-10-12 2017-02-22 遵义医学院 CRISPR/Cas9靶向敲除人ezrin基因增强子关键区的方法及其特异性gRNA
WO2018071663A1 (en) 2016-10-14 2018-04-19 Emendobio Inc. Rna compositions for genome editing
CN106434782B (zh) 2016-10-14 2020-01-10 南京工业大学 一种产顺式-4-羟脯氨酸的方法
CN110214180A (zh) 2016-10-14 2019-09-06 哈佛大学的校长及成员们 核碱基编辑器的aav递送
CA3040481A1 (en) 2016-10-14 2018-04-19 The General Hospital Corporation Epigenetically regulated site-specific nucleases
US11840694B2 (en) 2016-10-17 2023-12-12 Nanyang Technological University Truncated CRISPR-Cas proteins for DNA targeting
US10640810B2 (en) 2016-10-19 2020-05-05 Drexel University Methods of specifically labeling nucleic acids using CRISPR/Cas
WO2018081534A1 (en) 2016-10-28 2018-05-03 President And Fellows Of Harvard College Assay for exo-site binding molecules
WO2018081535A2 (en) 2016-10-28 2018-05-03 Massachusetts Institute Of Technology Dynamic genome engineering
WO2018081504A1 (en) 2016-10-28 2018-05-03 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating herpes simplex virus
US20180119141A1 (en) 2016-10-28 2018-05-03 Massachusetts Institute Of Technology Crispr/cas global regulator screening platform
WO2018081728A1 (en) 2016-10-31 2018-05-03 Emendobio Inc. Compositions for genome editing
RU2711516C1 (ru) 2016-10-31 2020-01-17 Егути Хай Фриквенси Ко., Лтд. Дроссель
EP3535396A1 (en) 2016-11-01 2019-09-11 Novartis AG Methods and compositions for enhancing gene editing
WO2018085288A1 (en) 2016-11-01 2018-05-11 President And Fellows Of Harvard College Inhibitors of rna guided nucleases and uses thereof
GB201618507D0 (en) 2016-11-02 2016-12-14 Stichting Voor De Technische Wetenschappen And Wageningen Univ Microbial genome editing
US11732258B2 (en) 2016-11-02 2023-08-22 President And Fellows Of Harvard College Engineered guide RNA sequences for in situ detection and sequencing
CN106544353A (zh) 2016-11-08 2017-03-29 宁夏医科大学总医院 一种利用CRISPR‑Cas9清除鲍曼不动杆菌耐药性基因的方法
CN106755088A (zh) 2016-11-11 2017-05-31 广东万海细胞生物科技有限公司 一种自体car‑t细胞制备方法及应用
WO2018089664A1 (en) 2016-11-11 2018-05-17 The Regents Of The University Of California Variant rna-guided polypeptides and methods of use
EP3538661A4 (en) 2016-11-14 2020-04-15 Institute Of Genetics And Developmental Biology, Chinese Academy Of Sciences BASIC EDITING METHOD IN PLANTS
CN106566838B (zh) 2016-11-14 2019-11-01 上海伯豪生物技术有限公司 一种基于CRISPR-Cas9技术的miR-126全长基因敲除试剂盒及其应用
CN106554969A (zh) 2016-11-15 2017-04-05 陕西理工学院 基于抑菌杀菌的多靶点CRISPR/Cas9表达载体
JP7210029B2 (ja) 2016-11-16 2023-01-23 ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア CRISPR-Cas9の阻害因子
CN106754912B (zh) 2016-11-16 2019-11-08 上海交通大学 一类定向清除肝细胞中HBVcccDNA的质粒及制剂
US20180282722A1 (en) 2016-11-21 2018-10-04 Massachusetts Institute Of Technology Chimeric DNA:RNA Guide for High Accuracy Cas9 Genome Editing
CN106480067A (zh) 2016-11-21 2017-03-08 中国农业科学院烟草研究所 烟草NtNAC096基因控制烟草衰老的应用
EP3545085A4 (en) 2016-11-22 2020-10-28 Integrated Dna Technologies, Inc. CRISPR / CPF1 SYSTEMS AND METHODS
EP3545090A1 (en) 2016-11-28 2019-10-02 The Board of Regents of The University of Texas System Prevention of muscular dystrophy by crispr/cpf1-mediated gene editing
CN106755091A (zh) 2016-11-28 2017-05-31 中国人民解放军第三军医大学第附属医院 基因敲除载体,mh7a细胞nlrp1基因敲除方法
CN106480036B (zh) 2016-11-30 2019-04-09 华南理工大学 一种具有启动子功能的dna片段及其应用
CN106834323A (zh) 2016-12-01 2017-06-13 安徽大学 一种基于维吉尼亚链霉菌IBL14基因cas7‑5‑3的基因编辑方法
CN107043779B (zh) 2016-12-01 2020-05-12 中国农业科学院作物科学研究所 一种CRISPR/nCas9介导的定点碱基替换在植物中的应用
CA3045335A1 (en) 2016-12-01 2018-06-07 Universite Laval Crispr-based treatment of friedreich ataxia
US9816093B1 (en) 2016-12-06 2017-11-14 Caribou Biosciences, Inc. Engineered nucleic acid-targeting nucleic acids
CN108165573B (zh) 2016-12-07 2022-01-14 中国科学院分子植物科学卓越创新中心 叶绿体基因组编辑方法
CN106701830B (zh) 2016-12-07 2020-01-03 湖南人文科技学院 一种敲除猪胚胎p66shc基因的方法
CN106544351B (zh) 2016-12-08 2019-09-10 江苏省农业科学院 CRISPR-Cas9体外敲除耐药基因mcr-1的方法及其专用细胞穿透肽
BR112019011509A2 (pt) 2016-12-08 2020-01-28 Intellia Therapeutics Inc rnas guias modificados
US11192929B2 (en) 2016-12-08 2021-12-07 Regents Of The University Of Minnesota Site-specific DNA base editing using modified APOBEC enzymes
WO2018107103A1 (en) 2016-12-09 2018-06-14 The Broad Institute, Inc. Crispr-systems for modifying a trait of interest in a plant
PT3551753T (pt) 2016-12-09 2022-09-02 Harvard College Diagnósticos baseados num sistema efetor de crispr
WO2018111946A1 (en) 2016-12-12 2018-06-21 Integrated Dna Technologies, Inc. Genome editing detection
WO2018111947A1 (en) 2016-12-12 2018-06-21 Integrated Dna Technologies, Inc. Genome editing enhancement
CN107893074A (zh) 2016-12-13 2018-04-10 广东赤萌医疗科技有限公司 一种用于敲除CXCR4基因的gRNA、表达载体、敲除系统、试剂盒
WO2018109101A1 (en) 2016-12-14 2018-06-21 Wageningen Universiteit Thermostable cas9 nucleases
CA3046824A1 (en) 2016-12-14 2018-06-21 Wageningen Universiteit Thermostable cas9 nucleases
KR101748575B1 (ko) 2016-12-16 2017-06-20 주식회사 엠젠플러스 Ins 유전자 녹아웃 당뇨병 또는 당뇨병 합병증 동물모델 및 이의 제조방법
WO2018112336A1 (en) 2016-12-16 2018-06-21 Ohio State Innovation Foundation Systems and methods for dna-guided rna cleavage
WO2018112446A2 (en) 2016-12-18 2018-06-21 Selonterra, Inc. Use of apoe4 motif-mediated genes for diagnosis and treatment of alzheimer's disease
CN106755026A (zh) 2016-12-18 2017-05-31 吉林大学 sgRNA表达载体的构建及牙釉质钙化不全模型的建立
WO2018119359A1 (en) 2016-12-23 2018-06-28 President And Fellows Of Harvard College Editing of ccr5 receptor gene to protect against hiv infection
CN110352242A (zh) 2016-12-23 2019-10-18 哈佛大学的校长及成员们 Pcsk9的基因编辑
CN106755424B (zh) 2016-12-26 2020-11-06 郑州大学 一种基于crispr的大肠杆菌st131系菌株检测引物、试剂盒及检测方法
CN107354173A (zh) 2016-12-26 2017-11-17 浙江省医学科学院 基于crispr技术和水动力尾静脉注射建立肝脏特异性敲除小鼠模型的方法
CN106834347A (zh) 2016-12-27 2017-06-13 安徽省农业科学院畜牧兽医研究所 一种山羊cdk2基因敲除载体及其构建方法
CN106755097A (zh) 2016-12-27 2017-05-31 安徽省农业科学院畜牧兽医研究所 一种山羊tlr4基因敲除载体及其构建方法
CN106597260B (zh) 2016-12-29 2020-04-03 合肥工业大学 基于连续小波分析和elm网络的模拟电路故障诊断方法
CN106834341B (zh) 2016-12-30 2020-06-16 中国农业大学 一种基因定点突变载体及其构建方法和应用
CN106755077A (zh) 2016-12-30 2017-05-31 华智水稻生物技术有限公司 利用crispr‑cas9技术对水稻cenh3基因定点突变的方法
CN106868008A (zh) 2016-12-30 2017-06-20 重庆高圣生物医药有限责任公司 CRISPR/Cas9靶向敲除人Lin28A基因及其特异性gRNA
CN106701763B (zh) 2016-12-30 2019-07-19 重庆高圣生物医药有限责任公司 CRISPR/Cas9靶向敲除人乙肝病毒P基因及其特异性gRNA
CN106701818B (zh) 2017-01-09 2020-04-24 湖南杂交水稻研究中心 一种培育水稻普通核不育系的方法
CN107012164B (zh) 2017-01-11 2023-03-03 电子科技大学 CRISPR/Cpf1植物基因组定向修饰功能单元、包含该功能单元的载体及其应用
EP3568476A1 (en) 2017-01-11 2019-11-20 Oxford University Innovation Limited Crispr rna
WO2018135838A2 (ko) 2017-01-17 2018-07-26 기초과학연구원 Dna 단일가닥 절단에 의한 염기 교정 비표적 위치 확인 방법
CN107058372A (zh) 2017-01-18 2017-08-18 四川农业大学 一种应用于植物上的CRISPR/Cas9载体的构建方法
WO2018136396A2 (en) 2017-01-18 2018-07-26 Excision Biotherapeutics, Inc. Crisprs
CN106701823A (zh) 2017-01-18 2017-05-24 上海交通大学 生产无岩藻糖单克隆抗体的cho细胞系建立及其应用
CN106801056A (zh) 2017-01-24 2017-06-06 中国科学院广州生物医药与健康研究院 一种sgRNA及其构建的慢病毒载体和应用
BR112019015578A2 (pt) 2017-01-30 2020-03-10 KWS SAAT SE & Co. KGaA Ligação de modelo de reparo a endonucleases para engenharia de genoma
TWI608100B (zh) 2017-02-03 2017-12-11 國立清華大學 Cas9表達質體、大腸桿菌基因剪輯系統及其方法
TW201839136A (zh) 2017-02-06 2018-11-01 瑞士商諾華公司 治療血色素異常症之組合物及方法
WO2018145068A1 (en) 2017-02-06 2018-08-09 Trustees Of Boston University An integrated system for programmable dna methylation
WO2018148246A1 (en) 2017-02-07 2018-08-16 Massachusetts Institute Of Technology Methods and compositions for rna-guided genetic circuits
WO2018148256A1 (en) 2017-02-07 2018-08-16 The Regents Of The University Of California Gene therapy for haploinsufficiency
WO2018148647A2 (en) 2017-02-10 2018-08-16 Lajoie Marc Joseph Genome editing reagents and their use
IT201700016321A1 (it) 2017-02-14 2018-08-14 Univ Degli Studi Di Trento Mutanti di cas9 ad alta specificita' e loro applicazioni.
KR20190117536A (ko) 2017-02-15 2019-10-16 키진 엔.브이. 식물 세포에서 표적 유전적 변형 방법
WO2018152197A1 (en) 2017-02-15 2018-08-23 Massachusetts Institute Of Technology Dna writers, molecular recorders and uses thereof
CN106957855B (zh) 2017-02-16 2020-04-17 上海市农业科学院 使用CRISPR/Cas9技术靶向敲除水稻矮杆基因SD1的方法
US20190367924A1 (en) 2017-02-17 2019-12-05 Temple University - Of The Commonwealth System Of Higher Education Gene editing therapy for hiv infection via dual targeting of hiv genome and ccr5
EA201991849A1 (ru) 2017-02-20 2020-03-23 Институте Оф Генетисс Анд Девелопментал Биологй. Чинесе Асадемй Оф Ссиенсес Система и способ редактирования генома
EP3585898A1 (en) 2017-02-22 2020-01-01 CRISPR Therapeutics AG Materials and methods for treatment of spinocerebellar ataxia type 1 (sca1) and other spinocerebellar ataxia type 1 protein (atxn1) gene related conditions or disorders
WO2018156372A1 (en) 2017-02-22 2018-08-30 The Regents Of The University Of California Genetically modified non-human animals and products thereof
EP3585897A1 (en) 2017-02-22 2020-01-01 CRISPR Therapeutics AG Materials and methods for treatment of dystrophic epidermolysis bullosa (deb) and other collagen type vii alpha 1 chain (col7a1) gene related conditions or disorders
US20200216857A1 (en) 2017-02-22 2020-07-09 Crispr Therapeutics Ag Materials and methods for treatment of spinocerebellar ataxia type 2 (sca2) and other spinocerebellar ataxia type 2 protein (atxn2) gene related conditions or disorders
EP3585899A1 (en) 2017-02-22 2020-01-01 CRISPR Therapeutics AG Materials and methods for treatment of primary hyperoxaluria type 1 (ph1) and other alanine-glyoxylate aminotransferase (agxt) gene related conditions or disorders
WO2018154380A1 (en) 2017-02-22 2018-08-30 Crispr Therapeutics Ag Compositions and methods for treatment of proprotein convertase subtilisin/kexin type 9 (pcsk9)-related disorders
WO2018154412A1 (en) 2017-02-22 2018-08-30 Crispr Therapeutics Ag Materials and methods for treatment of merosin-deficient cogenital muscular dystrophy (mdcmd) and other laminin, alpha 2 (lama2) gene related conditions or disorders
EP3585807A1 (en) 2017-02-22 2020-01-01 CRISPR Therapeutics AG Materials and methods for treatment of early onset parkinson's disease (park1) and other synuclein, alpha (snca) gene related conditions or disorders
US11920148B2 (en) 2017-02-22 2024-03-05 Crispr Therapeutics Ag Compositions and methods for gene editing
US20190380314A1 (en) 2017-02-23 2019-12-19 President And Fellows Of Harvard College Methods of Genetic Modification of a Cell
CN106868031A (zh) 2017-02-24 2017-06-20 北京大学 一种基于分级组装的多个sgRNA串联并行表达的克隆方法及应用
WO2018161009A1 (en) 2017-03-03 2018-09-07 Yale University Aav-mediated direct in vivo crispr screen in glioblastoma
US11111492B2 (en) 2017-03-06 2021-09-07 Florida State University Research Foundation, Inc. Genome engineering methods using a cytosine-specific Cas9
EP3592853A1 (en) 2017-03-09 2020-01-15 President and Fellows of Harvard College Suppression of pain by gene editing
WO2018165631A1 (en) 2017-03-09 2018-09-13 President And Fellows Of Harvard College Cancer vaccine
US11542496B2 (en) 2017-03-10 2023-01-03 President And Fellows Of Harvard College Cytosine to guanine base editor
WO2018170015A1 (en) 2017-03-14 2018-09-20 The Regents Of The University Of California Engineering crispr cas9 immune stealth
CN106978428A (zh) 2017-03-15 2017-07-25 上海吐露港生物科技有限公司 一种Cas蛋白特异结合靶标DNA、调控靶标基因转录的方法及试剂盒
CA3056411A1 (en) 2017-03-15 2018-09-20 The Broad Institute, Inc. Crispr effector system based diagnostics for virus detection
CN106906242A (zh) 2017-03-16 2017-06-30 重庆高圣生物医药有限责任公司 一种提高CRIPSR/Cas9靶向敲除基因产生非同源性末端接合效率的方法
WO2018175502A2 (en) 2017-03-21 2018-09-27 Shuber Anthony P Treating cancer with cas endonuclease complexes
CN110914426A (zh) 2017-03-23 2020-03-24 哈佛大学的校长及成员们 包含核酸可编程dna结合蛋白的核碱基编辑器
CN107012213A (zh) 2017-03-24 2017-08-04 南开大学 结直肠癌的生物标记物
EP3526324B1 (en) 2017-03-28 2021-08-25 Locanabio, Inc. Crispr-associated (cas) protein
CN106947780A (zh) 2017-03-28 2017-07-14 扬州大学 一种兔mstn基因的编辑方法
CN106906240A (zh) 2017-03-29 2017-06-30 浙江大学 运用CRISPR‑Cas9系统敲除大麦VE合成通路中的关键基因HPT的方法
WO2018179578A1 (ja) 2017-03-30 2018-10-04 国立大学法人京都大学 ゲノム編集によるエクソンスキッピング誘導方法
CN108660161B (zh) 2017-03-31 2023-05-09 中国科学院脑科学与智能技术卓越创新中心 基于CRISPR/Cas9技术的制备无嵌合基因敲除动物的方法
CN107058358B (zh) 2017-04-01 2020-06-09 中国科学院微生物研究所 一种双spacer序列识别切割CRISPR-Cas9载体构建及其在疣孢菌中的应用
US9938288B1 (en) 2017-04-05 2018-04-10 President And Fellows Of Harvard College Macrocyclic compound and uses thereof
CN106967726B (zh) 2017-04-05 2020-12-29 华南农业大学 一种创建亚洲栽培稻与非洲栽培稻种间杂种亲和系的方法和应用
CN107142282A (zh) 2017-04-06 2017-09-08 中山大学 一种利用CRISPR/Cas9在哺乳动物细胞中实现大片段DNA定点整合的方法
CN107034229A (zh) 2017-04-07 2017-08-11 江苏贝瑞利生物科技有限公司 一种植物中高效筛选CRISPR/CAS9基因编辑系统候选sgRNA系统及应用
WO2018189184A1 (en) 2017-04-11 2018-10-18 Roche Diagnostics Gmbh Mutant reverse transcriptase with increased thermal stability as well as products, methods and uses involving the same
EP3610009A1 (en) 2017-04-12 2020-02-19 The Broad Institute, Inc. Novel type vi crispr orthologs and systems
CN107058320B (zh) 2017-04-12 2019-08-02 南开大学 Il7r基因缺失斑马鱼突变体的制备及其应用
CN108728476A (zh) 2017-04-14 2018-11-02 复旦大学 一种利用crispr系统产生多样性抗体文库的方法
CN107298701B (zh) 2017-04-18 2020-10-30 上海大学 玉米转录因子ZmbZIP22及其应用
KR20200006980A (ko) 2017-04-20 2020-01-21 이제네시스, 인크. 유전자 변형 동물의 생성 방법
CN106957844A (zh) 2017-04-20 2017-07-18 华侨大学 一种能有效敲除HTLV‑1病毒基因组的CRISPR/Cas9的gRNA序列
WO2018195555A1 (en) 2017-04-21 2018-10-25 The Board Of Trustees Of The Leland Stanford Junior University Crispr/cas 9-mediated integration of polynucleotides by sequential homologous recombination of aav donor vectors
CA3059956A1 (en) 2017-04-21 2018-10-25 The General Hospital Corporation Variants of cpf1 (cas12a) with altered pam specificity
US11530405B2 (en) 2017-04-24 2022-12-20 Dupont Nutrition Biosciences Aps Anti-CRISPR genes and proteins and methods of use
CN107043775B (zh) 2017-04-24 2020-06-16 中国农业科学院生物技术研究所 一种能促进棉花侧根发育的sgRNA及其应用
CN206970581U (zh) 2017-04-26 2018-02-06 重庆威斯腾生物医药科技有限责任公司 一种用于辅助CRISPR/cas9基因敲除的试剂盒
US20180312822A1 (en) 2017-04-26 2018-11-01 10X Genomics, Inc. Mmlv reverse transcriptase variants
WO2018197020A1 (en) 2017-04-27 2018-11-01 Novozymes A/S Genome editing by crispr-cas9 using short donor oligonucleotides
US20200407737A1 (en) 2017-05-03 2020-12-31 KWS SAAT SE & Co. KGaA Use of crispr-cas endonucleases for plant genome engineering
WO2018204493A1 (en) 2017-05-04 2018-11-08 The Trustees Of The University Of Pennsylvania Compositions and methods for gene editing in t cells using crispr/cpf1
CN107012174A (zh) 2017-05-04 2017-08-04 昆明理工大学 CRISPR/Cas9技术在获得家蚕锌指蛋白基因突变体中的应用
CN107254485A (zh) 2017-05-08 2017-10-17 南京农业大学 一种能够快速构建植物基因定点敲除载体的新反应体系
CN107129999A (zh) 2017-05-09 2017-09-05 福建省农业科学院畜牧兽医研究所 利用稳转CRISPR/Cas9系统对病毒基因组进行靶向编辑的方法
WO2018208755A1 (en) 2017-05-09 2018-11-15 The Regents Of The University Of California Compositions and methods for tagging target proteins in proximity to a nucleotide sequence of interest
CA3062595A1 (en) 2017-05-10 2018-11-15 The Regents Of The University Of California Directed editing of cellular rna via nuclear delivery of crispr/cas9
WO2018209158A2 (en) 2017-05-10 2018-11-15 Editas Medicine, Inc. Crispr/rna-guided nuclease systems and methods
WO2018209320A1 (en) 2017-05-12 2018-11-15 President And Fellows Of Harvard College Aptazyme-embedded guide rnas for use with crispr-cas9 in genome editing and transcriptional activation
CN107130000B (zh) 2017-05-12 2019-12-17 浙江卫未生物医药科技有限公司 一种同时敲除KRAS基因和EGFR基因的CRISPR-Cas9系统及其应用
CN107326042A (zh) 2017-05-16 2017-11-07 上海交通大学 水稻tms10基因的定点敲除系统及其应用
CN106916820B (zh) 2017-05-16 2019-09-27 吉林大学 能有效编辑猪ROSA26基因的sgRNA及其应用
CN107012250B (zh) 2017-05-16 2021-01-29 上海交通大学 一种适用于CRISPR/Cas9系统的基因组DNA片段编辑精准度的分析方法及应用
WO2018213351A1 (en) 2017-05-16 2018-11-22 The Regents Of The University Of California Thermostable rna-guided endonucleases and methods of use thereof
CN106939303B (zh) 2017-05-16 2021-02-23 上海交通大学 一种Cas9核酸酶R919P及其用途
CN106957831B (zh) 2017-05-16 2021-03-12 上海交通大学 一种Cas9核酸酶K918A及其用途
CN106957830B (zh) 2017-05-16 2020-12-25 上海交通大学 一种Cas9核酸酶ΔF916及其用途
CN106987570A (zh) 2017-05-16 2017-07-28 上海交通大学 一种Cas9核酸酶R780A及其用途
CN106947750B (zh) 2017-05-16 2020-12-08 上海交通大学 一种Cas9核酸酶Q920P及其用途
CN106967697B (zh) 2017-05-16 2021-03-26 上海交通大学 一种Cas9核酸酶G915F及其用途
WO2018213726A1 (en) 2017-05-18 2018-11-22 The Broad Institute, Inc. Systems, methods, and compositions for targeted nucleic acid editing
US11591620B2 (en) 2017-05-18 2023-02-28 Cargill, Incorporated Genome editing system
KR20200026804A (ko) 2017-05-18 2020-03-11 더 브로드 인스티튜트, 인코퍼레이티드 표적화된 핵산 편집을 위한 시스템, 방법 및 조성물
WO2018213791A1 (en) 2017-05-18 2018-11-22 Children's National Medical Center Compositions comprising aptamers and nucleic acid payloads and methods of using the same
CN107043787B (zh) 2017-05-19 2017-12-26 南京医科大学 一种基于CRISPR/Cas9获得MARF1定点突变小鼠模型的构建方法和应用
CN107236737A (zh) 2017-05-19 2017-10-10 上海交通大学 特异靶向拟南芥ILK2基因的sgRNA序列及其应用
WO2018217852A1 (en) 2017-05-23 2018-11-29 Gettysburg College Crispr based tool for characterizing bacterial serovar diversity
CN107034188B (zh) 2017-05-24 2018-07-24 中山大学附属口腔医院 一种靶向骨的外泌体载体、CRISPR/Cas9基因编辑系统及应用
WO2018218166A1 (en) 2017-05-25 2018-11-29 The General Hospital Corporation Using split deaminases to limit unwanted off-target base editor deamination
CN107177625B (zh) 2017-05-26 2021-05-25 中国农业科学院植物保护研究所 一种定点突变的人工载体系统及定点突变方法
US20200263186A1 (en) 2017-05-26 2020-08-20 North Carolina State University Altered guide rnas for modulating cas9 activity and methods of use
CN107287245B (zh) 2017-05-27 2020-03-17 南京农业大学 一种基于CRISPR/Cas9技术的Glrx1基因敲除动物模型的构建方法
CN107142272A (zh) 2017-06-05 2017-09-08 南京金斯瑞生物科技有限公司 一种控制大肠杆菌中质粒复制的方法
CN107034218A (zh) 2017-06-07 2017-08-11 浙江大学 用于猪APN基因编辑的靶向sgRNA、修饰载体及其制备方法和应用
CN107177595A (zh) 2017-06-07 2017-09-19 浙江大学 用于猪CD163基因编辑的靶向sgRNA、修饰载体及其制备方法和应用
CN107119071A (zh) 2017-06-07 2017-09-01 江苏三黍生物科技有限公司 一种降低植物直链淀粉含量的方法及应用
CN106987757A (zh) 2017-06-12 2017-07-28 苏州双金实业有限公司 一种耐腐蚀型奥氏体镍基合金
CN107236739A (zh) 2017-06-12 2017-10-10 上海捷易生物科技有限公司 CRISPR/SaCas9特异性敲除人CXCR4基因的方法
CN107083392B (zh) 2017-06-13 2020-09-08 中国医学科学院病原生物学研究所 一种CRISPR/Cpf1基因编辑系统及其在分枝杆菌中的应用
CN107227352A (zh) 2017-06-13 2017-10-03 西安医学院 基于eGFP的GPR120基因表达的检测方法及应用
CN107245502B (zh) 2017-06-14 2020-11-03 中国科学院武汉病毒研究所 Cd2结合蛋白(cd2ap)和其相互作用蛋白
CN107312798B (zh) 2017-06-16 2020-06-23 武汉大学 含特异靶向CCR5基因的gRNA序列的CRISPR/Cas9重组慢病毒载体及应用
CN107099850B (zh) 2017-06-19 2018-05-04 东北农业大学 一种通过酶切基因组构建CRISPR/Cas9基因组敲除文库的方法
CN107446951B (zh) 2017-06-20 2021-01-08 温氏食品集团股份有限公司 一种通过CRISPR/Cas9系统快速筛选重组鸡痘病毒的方法及其应用
CN107266541B (zh) 2017-06-20 2021-06-04 上海大学 玉米转录因子ZmbHLH167及其应用
CN107058328A (zh) 2017-06-22 2017-08-18 江苏三黍生物科技有限公司 一种提高植物直链淀粉含量的方法及应用
US9982279B1 (en) 2017-06-23 2018-05-29 Inscripta, Inc. Nucleic acid-guided nucleases
CN107099533A (zh) 2017-06-23 2017-08-29 东北农业大学 一种特异靶向猪IGFBP3基因的sgRNA导向序列及应用
US10011849B1 (en) 2017-06-23 2018-07-03 Inscripta, Inc. Nucleic acid-guided nucleases
CN107119053A (zh) 2017-06-23 2017-09-01 东北农业大学 一种特异靶向猪MC4R基因的sgRNA导向序列及其应用
CN107227307A (zh) 2017-06-23 2017-10-03 东北农业大学 一种特异靶向猪IRS1基因的sgRNA导向序列及其应用
CN107177631B (zh) 2017-06-26 2020-11-24 中国农业大学 利用CRISPR-CAS9技术敲除NRK细胞Slc22a2基因的方法
WO2019005886A1 (en) 2017-06-26 2019-01-03 The Broad Institute, Inc. CRISPR / CAS-CYTIDINE DEAMINASE COMPOSITIONS, SYSTEMS AND METHODS FOR TARGETED EDITING OF NUCLEIC ACIDS
JP7454494B2 (ja) 2017-06-26 2024-03-22 ザ・ブロード・インスティテュート・インコーポレイテッド 標的化された核酸編集のためのcrispr/cas-アデニンデアミナーゼ系の組成物、系及び方法
CN107217075B (zh) 2017-06-28 2021-07-02 西安交通大学医学院第一附属医院 一种构建epo基因敲除斑马鱼动物模型的方法及引物、质粒与制备方法
CN107356793A (zh) 2017-07-01 2017-11-17 合肥东玖电气有限公司 一种防火电表箱
CN107312793A (zh) 2017-07-05 2017-11-03 新疆农业科学院园艺作物研究所 Cas9介导的番茄基因编辑载体及其应用
CN107190006A (zh) 2017-07-07 2017-09-22 南通大学附属医院 一种靶向IGF‑IR基因的sgRNA及其应用
US20200202981A1 (en) 2017-07-07 2020-06-25 The Broad Institute, Inc. Methods for designing guide sequences for guided nucleases
CN107190008A (zh) 2017-07-19 2017-09-22 苏州吉赛基因测序科技有限公司 一种基于Crispr/cas9的捕获基因组目标序列的方法及其在高通量测序中的应用
CN107400677B (zh) 2017-07-19 2020-05-22 江南大学 一种基于CRISPR-Cas9系统的地衣芽孢杆菌基因组编辑载体及其制备方法
CN107236741A (zh) 2017-07-19 2017-10-10 广州医科大学附属第五医院 一种敲除野生型T细胞TCR alpha链的gRNA及方法
CN107354156B (zh) 2017-07-19 2021-02-09 广州医科大学附属第五医院 一种敲除野生型T细胞TCR beta链的gRNA及方法
CN107435069A (zh) 2017-07-28 2017-12-05 新乡医学院 一种细胞系CRISPR/Cas9基因敲除的快速检测方法
CN111801345A (zh) 2017-07-28 2020-10-20 哈佛大学的校长及成员们 使用噬菌体辅助连续进化(pace)的进化碱基编辑器的方法和组合物
CN107446954A (zh) 2017-07-28 2017-12-08 新乡医学院 一种sd大鼠t细胞缺失遗传模型的制备方法
CN107384922A (zh) 2017-07-28 2017-11-24 重庆医科大学附属儿童医院 CRISPR/Cas9靶向敲除人CNE9基因及其特异性gRNA
CN107435051B (zh) 2017-07-28 2020-06-02 新乡医学院 一种通过CRISPR/Cas9系统快速获得大片段缺失的细胞系基因敲除方法
CN107418974A (zh) 2017-07-28 2017-12-01 新乡医学院 一种利用单克隆细胞分选快速获得CRISPR/Cas9基因敲除稳定细胞株的方法
CN107267515B (zh) 2017-07-28 2020-08-25 重庆医科大学附属儿童医院 CRISPR/Cas9靶向敲除人CNE10基因及其特异性gRNA
CN107217042B (zh) 2017-07-31 2020-03-06 江苏东抗生物医药科技有限公司 一种生产无岩藻糖基化蛋白的基因工程细胞系及其建立方法
CN107446922A (zh) 2017-08-03 2017-12-08 无锡市第二人民医院 一种敲除人成骨细胞株中hepcidin基因的gRNA序列及其使用方法
CN107502618B (zh) 2017-08-08 2021-03-12 中国科学院微生物研究所 可控载体消除方法及易用型CRISPR-Cas9工具
CN107312785B (zh) 2017-08-09 2019-12-06 四川农业大学 OsKTN80b基因在降低水稻株高方面的应用
CN107384926B (zh) 2017-08-13 2020-06-26 中国人民解放军疾病预防控制所 一种靶向清除细菌耐药性质粒的CRISPR-Cas9系统及应用
CN107446923B (zh) 2017-08-13 2019-12-31 中国人民解放军疾病预防控制所 rAAV8-CRISPR-SaCas9系统及在制备乙肝治疗药物中的应用
CN107365804B (zh) 2017-08-13 2019-12-20 中国人民解放军疾病预防控制所 一种使用温和噬菌体载体包装CRISPR-Cas9系统的方法
CN107815463A (zh) 2017-08-15 2018-03-20 西南大学 CRISPR/Cas9技术介导miR167前体序列编辑体系的建立方法
CN107446924B (zh) 2017-08-16 2020-01-14 中国科学院华南植物园 一种基于CRISPR-Cas9的猕猴桃基因AcPDS编辑载体及其构建方法和应用
CN108034656A (zh) 2017-08-16 2018-05-15 四川省农业科学院生物技术核技术研究所 与水稻红褐色颖壳性状有关的sgRNA、CRISPR/Cas9载体、载体构建、应用
CN107384894B (zh) 2017-08-21 2019-10-22 华南师范大学 功能化氧化石墨烯高效运载CRISPR/Cas9用于基因编辑的方法
CN107557393B (zh) 2017-08-23 2020-05-08 中国科学院上海应用物理研究所 一种磁性纳米材料介导的CRISPR/Cas9 T细胞内递送系统及其制备方法和应用
CN107299114B (zh) 2017-08-23 2021-08-27 中国科学院分子植物科学卓越创新中心 一种高效的酵母菌染色体融合方法
CN107312795A (zh) 2017-08-24 2017-11-03 浙江省农业科学院 运用CRISPR/Cas9系统创制粉色果实番茄的基因编辑方法
CN107460196A (zh) 2017-08-25 2017-12-12 同济大学 一种免疫缺陷小鼠动物模型的构建方法及应用
CN107488649A (zh) 2017-08-25 2017-12-19 南方医科大学 一种Cpf1和p300核心结构域的融合蛋白、相应的DNA靶向激活系统和应用
CN107541525B (zh) 2017-08-26 2021-12-10 内蒙古大学 一种基于CRISPR/Cas9技术介导山羊Tβ4基因定点敲入的方法
CN107446932B (zh) 2017-08-29 2020-02-21 江西省农业科学院 一个控制水稻雄性生殖发育基因及其应用
US11319532B2 (en) 2017-08-30 2022-05-03 President And Fellows Of Harvard College High efficiency base editors comprising Gam
CN107519492B (zh) 2017-09-06 2019-01-25 武汉迈特维尔生物科技有限公司 使用CRISPR技术敲除miR-3187-3p在冠状动脉粥样硬化性心脏病中的应用
CN107641631A (zh) 2017-09-07 2018-01-30 浙江工业大学 一种由化学转化介导的基于CRISPR/Cas9系统敲除大肠杆菌基因的方法
CN107362372B (zh) 2017-09-07 2019-01-11 佛山波若恩生物科技有限公司 使用crispr技术在冠状动脉粥样硬化性心脏病中的应用
CN107502608B (zh) 2017-09-08 2020-10-16 中山大学 用于敲除人ALDH2基因的sgRNA、ALDH2基因缺失细胞株的构建方法及应用
WO2019051097A1 (en) 2017-09-08 2019-03-14 The Regents Of The University Of California RNA-GUIDED ENDONUCLEASE FUSION POLYPEPTIDES AND METHODS OF USING SAME
CN107557455A (zh) 2017-09-15 2018-01-09 国家纳米科学中心 一种基于CRISPR‑Cas13a的特异性核酸片段的检测方法
US11624130B2 (en) 2017-09-18 2023-04-11 President And Fellows Of Harvard College Continuous evolution for stabilized proteins
CN107475300B (zh) 2017-09-18 2020-04-21 上海市同济医院 Ifit3-eKO1基因敲除小鼠动物模型的构建方法和应用
CN107557390A (zh) 2017-09-18 2018-01-09 江南大学 一种筛选cho细胞系高表达位点的方法
CN107557373A (zh) 2017-09-19 2018-01-09 安徽大学 一种基于I‑B型CRISPR‑Cas系统基因cas3的基因编辑方法
CN107557378A (zh) 2017-09-19 2018-01-09 安徽大学 一种基于I型CRISPR‑Cas系统中基因cas7‑3的真核基因编辑方法
CN107630042A (zh) 2017-09-19 2018-01-26 安徽大学 一种源于I型Cas系统4个cas基因的原核生物基因编辑方法
CN107523583A (zh) 2017-09-19 2017-12-29 安徽大学 一种源于I型CRISPR‑Cas系统中基因cas5‑3的原核基因编辑方法
CN107630041A (zh) 2017-09-19 2018-01-26 安徽大学 一种基于维吉尼亚链霉菌IBL14 I‑B型Cas系统的真核基因编辑方法
CN107619837A (zh) 2017-09-20 2018-01-23 西北农林科技大学 利用Cas9切割核酸酶介导Ipr1定点插入获取转基因牛胎儿成纤维细胞的方法
CN107513531B (zh) 2017-09-21 2020-02-21 无锡市妇幼保健院 用于内源性过表达lncRNA-XIST的gRNA靶点序列及其应用
CN107686848A (zh) 2017-09-26 2018-02-13 中山大学孙逸仙纪念医院 转座子协同CRISPR/Cas9系统的稳定敲除单质粒载体及其应用
CN107760652A (zh) 2017-09-29 2018-03-06 华南理工大学 CRISPR/CAS9介导药物转运体靶向性敲除的caco‑2细胞模型及其方法
CN107557394A (zh) 2017-09-29 2018-01-09 南京鼓楼医院 降低CRISPR/Cas9介导的胚胎基因编辑脱靶率的方法
CN107760663A (zh) 2017-09-30 2018-03-06 新疆大学 油莎草pepc基因的克隆及表达载体的构建和应用
CN107630006B (zh) 2017-09-30 2020-09-11 山东兴瑞生物科技有限公司 一种制备tcr与hla双基因敲除的t细胞的方法
CN107828794A (zh) 2017-09-30 2018-03-23 上海市农业生物基因中心 一种水稻耐盐基因OsRR22突变体、其编码的氨基酸序列、植株及该突变体的创制方法
CN107604003A (zh) 2017-10-10 2018-01-19 南方医科大学 一种基于线性化crispr‑cas9慢病毒载体基因敲除试剂盒及其应用
CN108102940B (zh) 2017-10-12 2021-07-13 中石化上海工程有限公司 一株利用CRISPR/Cas9系统敲除XKS1基因的工业酿酒酵母菌株及构建方法
CN107557381A (zh) 2017-10-12 2018-01-09 南京农业大学 一种白菜CRISPR‑Cas9基因编辑体系的建立及其应用
CN107474129B (zh) 2017-10-12 2018-10-19 江西汉氏联合干细胞科技有限公司 特异性增强crispr-cas系统基因编辑效率的方法
CN108103586A (zh) 2017-10-13 2018-06-01 上海科技大学 一种CRISPR/Cas9随机文库及其构建和应用
CN107586779B (zh) 2017-10-14 2018-08-28 天津金匙生物科技有限公司 使用crispr-cas系统对间充质干细胞进行casp3基因敲除的方法
CN107619829B (zh) 2017-10-14 2018-08-24 南京平港生物技术有限公司 使用crispr-cas系统对间充质干细胞进行gins2基因敲除的方法
CN107523567A (zh) 2017-10-16 2017-12-29 遵义医学院 一种敲除人ezrin基因增强子的食管癌细胞株的构建方法
AU2018352592A1 (en) 2017-10-16 2020-06-04 Beam Therapeutics, Inc. Uses of adenosine base editors
CN107760715B (zh) 2017-10-17 2021-12-10 张业胜 一种转基因载体及其构建方法和应用
CN107937427A (zh) 2017-10-20 2018-04-20 广东石油化工学院 一种基于CRISPR/Cas9体系的同源修复载体构建方法
WO2019084062A1 (en) 2017-10-23 2019-05-02 The Broad Institute, Inc. SYSTEMS, METHODS AND COMPOSITIONS FOR TARGETED NUCLEIC ACID EDITION
CN107893086B (zh) 2017-10-24 2021-09-03 中国科学院武汉植物园 快速构建配对sgRNA的Cas9双元表达载体文库的方法
CN107760684B (zh) 2017-11-03 2018-09-25 上海拉德钫斯生物科技有限公司 使用crispr-cas系统对间充质干细胞进行rbm17基因敲除的方法
US20200239379A1 (en) 2017-11-05 2020-07-30 Aveterra Corp Method and Apparatus for Automated Composting of Organic Wastes
CN107858346B (zh) 2017-11-06 2020-06-16 天津大学 一种敲除酿酒酵母染色体的方法
CN107794276A (zh) 2017-11-08 2018-03-13 中国农业科学院作物科学研究所 一种crispr介导快速有效的农作物定点基因片段或等位基因替换方法和体系
CN107630043A (zh) 2017-11-14 2018-01-26 吉林大学 采用敲除技术建立Gadd45a敲除兔模型的方法
CN108441519A (zh) 2017-11-15 2018-08-24 中国农业大学 在crispr/cas9基因编辑中提高同源修复效率的方法
CN107858373B (zh) 2017-11-16 2020-03-17 山东省千佛山医院 内皮细胞条件性敲除ccr5基因小鼠模型的构建方法
CN108192956B (zh) 2017-11-17 2021-06-01 东南大学 一种基于Cas9核酸酶的DNA检测分析方法及其应用
CN107893075A (zh) 2017-11-17 2018-04-10 和元生物技术(上海)股份有限公司 CRISPR‑Cas9靶向敲除人肠癌细胞RITA基因及其特异性的sgRNA
CN107828874B (zh) 2017-11-20 2020-10-16 东南大学 一种基于crispr的dna检测和分型方法及其应用
CN107653256A (zh) 2017-11-21 2018-02-02 云南省烟草农业科学研究院 一种烟草多酚氧化酶基因NtPPO1及其定点突变方法与应用
CN107904261A (zh) 2017-11-21 2018-04-13 福州大学 CRISPR/Cas9纳米基因系统的制备及其在转染方面的应用
CN107893076A (zh) 2017-11-23 2018-04-10 和元生物技术(上海)股份有限公司 CRISPR‑Cas9靶向敲除人乳腺癌细胞RASSF2基因及其特异性的sgRNA
CN107937432B (zh) 2017-11-24 2020-05-01 华中农业大学 一种基于crispr系统的基因组编辑方法及其应用
CN107937501A (zh) 2017-11-24 2018-04-20 安徽师范大学 一种快速简便的筛选CRISPR/Cas基因编辑阳性对象的方法
CN107828738A (zh) 2017-11-28 2018-03-23 新乡医学院 一种dna甲基转移酶缺陷型cho细胞系及其制备方法及应用
CN107988256B (zh) 2017-12-01 2020-07-28 暨南大学 人亨廷顿基因敲入用重组载体及其构建方法和在模型猪构建中的应用
CN108570479B (zh) 2017-12-06 2020-04-03 内蒙古大学 一种基于CRISPR/Cas9技术介导绒山羊VEGF基因定点敲入的方法
CN108148873A (zh) 2017-12-06 2018-06-12 南方医科大学 一种cav-1基因缺失斑马鱼及其制备方法
CN107974466B (zh) 2017-12-07 2020-09-29 中国科学院水生生物研究所 一种鲟鱼CRISPR/Cas9基因编辑方法
CN108148835A (zh) 2017-12-07 2018-06-12 和元生物技术(上海)股份有限公司 CRISPR-Cas9靶向敲除SLC30A1基因及其特异性的sgRNA
CN108315330B (zh) 2017-12-07 2020-05-19 嘉兴市第一医院 CRISPR-Cas9系统特异性靶向人RSPO2基因的sgRNA及敲除方法和应用
CN108251423B (zh) 2017-12-07 2020-11-06 嘉兴市第一医院 CRISPR-Cas9系统特异性靶向人RSPO2基因的sgRNA及激活方法和应用
CN107828826A (zh) 2017-12-12 2018-03-23 南开大学 一种体外高效获得神经干细胞的方法
CN108103090B (zh) 2017-12-12 2021-06-15 中山大学附属第一医院 靶向RNA甲基化的RNA Cas9-m6A修饰载体系统及其构建方法和应用
MA51138A (fr) 2017-12-14 2020-10-21 Bayer Healthcare Llc Nouveaux systèmes d'endonucléases arn-programmables et leurs utilisations dans l'édition de génome et d'autres applications
CN108103098B (zh) 2017-12-14 2020-07-28 华南理工大学 一种化合物皮肤致敏体外评估细胞模型及其构建方法
EP3724214A4 (en) 2017-12-15 2021-09-01 The Broad Institute Inc. SYSTEMS AND PROCEDURES FOR PREDICTING REPAIR RESULTS IN GENE ENGINEERING
CN107988268A (zh) 2017-12-18 2018-05-04 湖南师范大学 一种基因敲除选育tcf25基因缺失型斑马鱼的方法
CN108018316A (zh) 2017-12-20 2018-05-11 湖南师范大学 一种基因敲除选育rmnd5b基因缺失型斑马鱼的方法
CN108048466B (zh) 2017-12-21 2020-02-07 嘉兴市第一医院 CRISPR-Cas13a系统特异性靶向人RSPO2基因的crRNA及系统和应用
WO2019123430A1 (en) 2017-12-21 2019-06-27 Casebia Therapeutics Llp Materials and methods for treatment of usher syndrome type 2a and/or non-syndromic autosomal recessive retinitis pigmentosa (arrp)
RU2652899C1 (ru) 2017-12-28 2018-05-03 Федеральное бюджетное учреждение науки "Центральный научно-исследовательский институт эпидемиологии" Федеральной службы по надзору в сфере защиты прав потребителей и благополучия человека (ФБУН ЦНИИ Эпидемиологии Роспотребнадзора) РНК-проводники для подавления репликации вируса гепатита B и для элиминации вируса гепатита B из клетки-хозяина
CN107893080A (zh) 2017-12-29 2018-04-10 江苏省农业科学院 一种靶向大鼠Inhba基因的sgRNA及其应用
CN107988229B (zh) 2018-01-05 2020-01-07 中国农业科学院作物科学研究所 一种利用CRISPR-Cas修饰OsTAC1基因获得分蘖改变的水稻的方法
CN107988246A (zh) 2018-01-05 2018-05-04 汕头大学医学院 一种基因敲除载体及其斑马鱼胶质瘤模型
CN108103092B (zh) 2018-01-05 2021-02-12 中国农业科学院作物科学研究所 利用CRISPR-Cas系统修饰OsHPH基因获得矮化水稻的系统及其应用
CN108559760A (zh) 2018-01-09 2018-09-21 陕西师范大学 基于CRISPR靶向基因组修饰技术建立荧光素酶knock-in细胞系的方法
WO2019139951A1 (en) 2018-01-09 2019-07-18 The United States Of America As Represented By The Secretary Of The Department Of Health And Human Services Detecting protein interaction sites in nucleic acids
CN108559730B (zh) 2018-01-12 2021-09-24 中国人民解放军第四军医大学 利用CRISPR/Cas9技术构建Hutat2:Fc基因敲入单核细胞的实验方法
US11268092B2 (en) 2018-01-12 2022-03-08 GenEdit, Inc. Structure-engineered guide RNA
CN108148837A (zh) 2018-01-12 2018-06-12 南京医科大学 ApoE-CRISPR/Cas9载体及其在敲除ApoE基因中的应用
CN108251451A (zh) 2018-01-16 2018-07-06 西南大学 HTT的CRISPR/Cas9-gRNA打靶序列对、质粒及其应用
CN108251452A (zh) 2018-01-17 2018-07-06 扬州大学 一种表达Cas9基因的转基因斑马鱼及其构建方法和应用
KR20200103769A (ko) 2018-01-23 2020-09-02 기초과학연구원 연장된 단일 가이드 rna 및 그 용도
CN108359712B (zh) 2018-02-09 2020-06-26 广东省农业科学院农业生物基因研究中心 一种快速高效筛选SgRNA靶向DNA序列的方法
CN208034188U (zh) 2018-02-09 2018-11-02 衡阳市振洋汽车配件有限公司 一种快速定位的加工孔用夹具
CN108559745A (zh) 2018-02-10 2018-09-21 和元生物技术(上海)股份有限公司 基于CRISPR-Cas9技术提高B16F10细胞转染效率的方法
CN108486145A (zh) 2018-02-12 2018-09-04 中国科学院遗传与发育生物学研究所 基于CRISPR/Cas9的植物高效同源重组方法
CN108359691B (zh) 2018-02-12 2021-09-28 中国科学院重庆绿色智能技术研究院 利用mito-CRISPR/Cas9系统敲除异常线粒体DNA的试剂盒及方法
CN109021111B (zh) 2018-02-23 2021-12-07 上海科技大学 一种基因碱基编辑器
CN108396027A (zh) 2018-02-27 2018-08-14 和元生物技术(上海)股份有限公司 CRISPR-Cas9靶向敲除人肠癌细胞DEAF1基因及其特异性的sgRNA
CN108486159B (zh) 2018-03-01 2021-10-22 南通大学附属医院 一种敲除GRIN2D基因的CRISPR-Cas9系统及其应用
CN108410906A (zh) 2018-03-05 2018-08-17 淮海工学院 一种适用于海洋甲壳类线粒体基因组的CRISPR/Cpf1基因编辑方法
CN108342480B (zh) 2018-03-05 2022-03-01 北京医院 一种基因变异检测质控物及其制备方法
CN108410907B (zh) 2018-03-08 2021-08-27 湖南农业大学 一种基于CRISPR/Cas9技术实现HMGCR基因敲除的方法
CN108410911B (zh) 2018-03-09 2021-08-20 广西医科大学 基于CRISPR/Cas9技术构建的LMNA基因敲除的细胞系
CN108486108B (zh) 2018-03-16 2020-10-09 华南农业大学 一种敲除人hmgb1基因的细胞株及其应用
CN108486146B (zh) 2018-03-16 2021-02-19 中国农业科学院作物科学研究所 LbCpf1-RR突变体用于CRISPR/Cpf1系统在植物基因编辑中的应用
CN108384784A (zh) 2018-03-23 2018-08-10 广西医科大学 一种利用CRISPR/Cas9技术敲除Endoglin基因的方法
CN108504685A (zh) 2018-03-27 2018-09-07 宜明细胞生物科技有限公司 一种利用CRISPR/Cas9系统同源重组修复IL-2RG缺陷基因的方法
CN108410877A (zh) 2018-03-27 2018-08-17 和元生物技术(上海)股份有限公司 CRISPR-Cas9靶向敲除人细胞SANIL1基因及其特异性的sgRNA
CN108424931A (zh) 2018-03-29 2018-08-21 内蒙古大学 CRISPR/Cas9技术介导山羊VEGF基因定点整合的方法
CN108486234B (zh) 2018-03-29 2022-02-11 东南大学 一种crispr分型pcr的方法及其应用
CN108504693A (zh) 2018-04-04 2018-09-07 首都医科大学附属北京朝阳医院 利用Crispr技术敲除T合酶基因构建的O-型糖基化异常的结肠癌细胞系
CN108441520B (zh) 2018-04-04 2020-07-31 苏州大学 利用CRISPR/Cas9系统构建的基因条件性敲除方法
CN108486111A (zh) 2018-04-04 2018-09-04 山西医科大学 CRISPR-Cas9靶向敲除人SMYD3基因的方法及其特异性sgRNA
CN108486154A (zh) 2018-04-04 2018-09-04 福州大学 一种唾液酸酶基因敲除小鼠模型的构建方法及其应用
CN108753772B (zh) 2018-04-04 2020-10-30 南华大学 基于CRISPR/Cas技术敲除CAPNS1基因的人神经母细胞瘤细胞系的构建方法
CN108504657B (zh) 2018-04-12 2019-06-14 中南民族大学 利用crispr-cas9技术敲除hek293t细胞kdm2a基因的方法
CN108588182A (zh) 2018-04-13 2018-09-28 中国科学院深圳先进技术研究院 基于crispr-链取代的等温扩增及检测技术
CN108753817A (zh) 2018-04-13 2018-11-06 北京华伟康信生物科技有限公司 增强细胞的抗癌能力的方法及采用该方法获得的增强型细胞
CN108753832A (zh) 2018-04-20 2018-11-06 中山大学 一种利用CRISPR/Cas9编辑大白猪CD163基因的方法
CN108823248A (zh) 2018-04-20 2018-11-16 中山大学 一种利用CRISPR/Cas9编辑陆川猪CD163基因的方法
CN108588071A (zh) 2018-04-25 2018-09-28 和元生物技术(上海)股份有限公司 CRISPR-Cas9靶向敲除人肠癌细胞CNR1基因及其特异性的sgRNA
CN108546712B (zh) 2018-04-26 2020-08-07 中国农业科学院作物科学研究所 一种利用CRISPR/LbCpf1系统实现目的基因在植物中同源重组的方法
CN108707621B (zh) 2018-04-26 2021-02-12 中国农业科学院作物科学研究所 一种CRISPR/Cpf1系统介导的以RNA转录本为修复模板的同源重组方法
CN108588128A (zh) 2018-04-26 2018-09-28 南昌大学 一种高效率大豆CRISPR/Cas9系统的构建方法及应用
CN108642053A (zh) 2018-04-28 2018-10-12 和元生物技术(上海)股份有限公司 CRISPR-Cas9靶向敲除人肠癌细胞PPP1R1C基因及其特异性的sgRNA
CN108611364A (zh) 2018-05-03 2018-10-02 南京农业大学 一种非转基因crispr突变体的制备方法
CN108588123A (zh) 2018-05-07 2018-09-28 南京医科大学 CRISPR/Cas9载体组合在制备基因敲除猪的血液制品中的应用
AU2019265019A1 (en) 2018-05-11 2020-11-26 Beam Therapeutics Inc. Methods of substituting pathogenic amino acids using programmable base editor systems
CN108610399B (zh) 2018-05-14 2019-09-27 河北万玛生物医药有限公司 特异性增强crispr-cas系统在表皮干细胞中进行基因编辑效率的方法
CN108546717A (zh) 2018-05-15 2018-09-18 吉林大学 反义lncRNA介导顺式调控抑制靶基因表达的方法
CN108624622A (zh) 2018-05-16 2018-10-09 湖南艾佳生物科技股份有限公司 一种基于CRISPR-Cas9系统构建的能分泌小鼠白细胞介素-6的基因工程细胞株
CN108546718B (zh) 2018-05-16 2021-07-09 康春生 crRNA介导的CRISPR/Cas13a基因编辑系统在肿瘤细胞中的应用
CN108642055B (zh) 2018-05-17 2021-12-03 吉林大学 能有效编辑猪miR-17-92基因簇的sgRNA
CN108642078A (zh) 2018-05-18 2018-10-12 江苏省农业科学院 基于CRISPR/Cas9基因编辑技术选育绿豆开花传粉突变体的方法及专用gRNA
CN108642090A (zh) 2018-05-18 2018-10-12 中国人民解放军总医院 基于CRISPR/Cas9技术获得Nogo-B敲除模式小鼠的方法及应用
CN108642077A (zh) 2018-05-18 2018-10-12 江苏省农业科学院 基于CRISPR/Cas9基因编辑技术选育绿豆不育突变体的方法及专用gRNA
CN108559732A (zh) 2018-05-21 2018-09-21 陕西师范大学 基于CRISPR/Cas9靶向基因组修饰技术建立KI-T2A-luciferase细胞系的方法
CN108707620A (zh) 2018-05-22 2018-10-26 西北农林科技大学 一种Gene drive载体及构建方法
EP3797160A1 (en) 2018-05-23 2021-03-31 The Broad Institute Inc. Base editors and uses thereof
CN108690844B (zh) 2018-05-25 2021-10-15 西南大学 HTT的CRISPR/Cas9-gRNA打靶序列对、质粒及HD细胞模型
CN108707629A (zh) 2018-05-28 2018-10-26 上海海洋大学 斑马鱼notch1b基因突变体的制备方法
CN108823249A (zh) 2018-05-28 2018-11-16 上海海洋大学 CRISPR/Cas9构建notch1a突变体斑马鱼的方法
CN108707628B (zh) 2018-05-28 2021-11-23 上海海洋大学 斑马鱼notch2基因突变体的制备方法
CN108707604B (zh) 2018-05-30 2019-07-23 江西汉氏联合干细胞科技有限公司 表皮干细胞中采用CRISPR-Cas系统进行CNE10基因敲除
CN108753835A (zh) 2018-05-30 2018-11-06 中山大学 一种利用CRISPR/Cas9编辑猪BMP15基因的方法
CN108753836B (zh) 2018-06-04 2021-10-12 北京大学 一种利用rna干扰机制的基因调控或编辑系统
CN108715850B (zh) 2018-06-05 2020-10-23 艾一生命科技(广东)有限公司 表皮干细胞中采用CRISPR-Cas系统进行GING2基因敲除
KR20210089629A (ko) 2018-06-05 2021-07-16 라이프에디트 테라퓨틱스, 인크. Rna-가이드된 뉴클레아제 및 그의 활성 단편 및 변이체 및 사용 방법
CN108753813B (zh) 2018-06-08 2021-08-24 中国水稻研究所 获得无标记转基因植物的方法
CN108753783A (zh) 2018-06-13 2018-11-06 上海市同济医院 Sqstm1全基因敲除小鼠动物模型的构建方法和应用
CN108728486A (zh) 2018-06-20 2018-11-02 江苏省农业科学院 一种茄子CRISPR/Cas9基因敲除载体的构建方法和应用
CN108841845A (zh) 2018-06-21 2018-11-20 广东石油化工学院 一种带有筛选标记的CRISPR/Cas9载体及其构建方法
CN108893529A (zh) 2018-06-25 2018-11-27 武汉博杰生物医学科技有限公司 一种基于CRISPR技术特异性检测人KRAS基因2号及3号外显子突变的crRNA
CN108866093B (zh) 2018-07-04 2021-07-09 广东三杰牧草生物科技有限公司 一种利用CRISPR/Cas9系统对紫花苜蓿基因定点突变的方法
CN108913714A (zh) 2018-07-05 2018-11-30 江西省超级水稻研究发展中心 一种利用CRISPR/Cas9系统敲除BADH2基因创制香稻的方法
CN108795902A (zh) 2018-07-05 2018-11-13 深圳三智医学科技有限公司 一种安全高效的CRISPR/Cas9基因编辑技术
US20220033785A1 (en) 2018-07-09 2022-02-03 The Broad Institute, Inc. Rna programmable epigenetic rna modifiers and uses thereof
CN108913691B (zh) 2018-07-16 2020-09-01 山东华御生物科技有限公司 表皮干细胞中采用CRISPR-Cas系统进行Card3基因敲除
CN108913664B (zh) 2018-07-20 2020-09-04 嘉兴学院 一种CRISPR/Cas9基因编辑方法敲除卵巢癌细胞中CFP1基因的方法
CN108853133A (zh) 2018-07-25 2018-11-23 福州大学 一种PAMAM与CRISPR/Cas9系统重组质粒递送纳米粒的制备方法
CN108823291B (zh) 2018-07-25 2022-04-12 领航医学科技(深圳)有限公司 基于crispr技术的特异性核酸片段定量检测方法
WO2020028555A2 (en) 2018-07-31 2020-02-06 The Broad Institute, Inc. Novel crispr enzymes and systems
CN108913717A (zh) 2018-08-01 2018-11-30 河南农业大学 一种利用CRISPR/Cas9系统对水稻PHYB基因定点突变的方法
US20210277379A1 (en) 2018-08-03 2021-09-09 Beam Therapeutics Inc. Multi-effector nucleobase editors and methods of using same to modify a nucleic acid target sequence
EP3841203A4 (en) 2018-08-23 2022-11-02 The Broad Institute Inc. CAS9 VARIANTS WITH NON-CANONICAL PAM SPECIFICITIES AND USES OF THEM
WO2020047124A1 (en) 2018-08-28 2020-03-05 Flagship Pioneering, Inc. Methods and compositions for modulating a genome
WO2020051360A1 (en) 2018-09-05 2020-03-12 The Broad Institute, Inc. Base editing for treating hutchinson-gilford progeria syndrome
WO2020086908A1 (en) 2018-10-24 2020-04-30 The Broad Institute, Inc. Constructs for improved hdr-dependent genomic editing
WO2020092453A1 (en) 2018-10-29 2020-05-07 The Broad Institute, Inc. Nucleobase editors comprising geocas9 and uses thereof
US20220282275A1 (en) 2018-11-15 2022-09-08 The Broad Institute, Inc. G-to-t base editors and uses thereof
CN109517841B (zh) 2018-12-05 2020-10-30 华东师范大学 一种用于核苷酸序列修饰的组合物、方法与应用
US20230002745A1 (en) 2019-01-23 2023-01-05 The Broad Institute, Inc. Supernegatively charged proteins and uses thereof
WO2020181178A1 (en) 2019-03-06 2020-09-10 The Broad Institute, Inc. T:a to a:t base editing through thymine alkylation
WO2020181195A1 (en) 2019-03-06 2020-09-10 The Broad Institute, Inc. T:a to a:t base editing through adenine excision
WO2020181180A1 (en) 2019-03-06 2020-09-10 The Broad Institute, Inc. A:t to c:g base editors and uses thereof
WO2020181193A1 (en) 2019-03-06 2020-09-10 The Broad Institute, Inc. T:a to a:t base editing through adenosine methylation
WO2020181202A1 (en) 2019-03-06 2020-09-10 The Broad Institute, Inc. A:t to t:a base editing through adenine deamination and oxidation
AU2020242032A1 (en) 2019-03-19 2021-10-07 Massachusetts Institute Of Technology Methods and compositions for editing nucleotide sequences
US20220204975A1 (en) 2019-04-12 2022-06-30 President And Fellows Of Harvard College System for genome editing
EP3956349A1 (en) 2019-04-17 2022-02-23 The Broad Institute, Inc. Adenine base editors with reduced off-target effects
EP3973054A1 (en) 2019-05-20 2022-03-30 The Broad Institute Inc. Aav delivery of nucleobase editors
WO2021025750A1 (en) 2019-08-08 2021-02-11 The Broad Institute, Inc. Base editors with diversified targeting scope
WO2021030666A1 (en) 2019-08-15 2021-02-18 The Broad Institute, Inc. Base editing by transglycosylation
WO2021072328A1 (en) 2019-10-10 2021-04-15 The Broad Institute, Inc. Methods and compositions for prime editing rna
WO2021108717A2 (en) 2019-11-26 2021-06-03 The Broad Institute, Inc Systems and methods for evaluating cas9-independent off-target editing of nucleic acids
WO2021155065A1 (en) 2020-01-28 2021-08-05 The Broad Institute, Inc. Base editors, compositions, and methods for modifying the mitochondrial genome
WO2021158995A1 (en) 2020-02-05 2021-08-12 The Broad Institute, Inc. Base editor predictive algorithm and method of use
US20230108687A1 (en) 2020-02-05 2023-04-06 The Broad Institute, Inc. Gene editing methods for treating spinal muscular atrophy
US20230235309A1 (en) 2020-02-05 2023-07-27 The Broad Institute, Inc. Adenine base editors and uses thereof
WO2021222318A1 (en) 2020-04-28 2021-11-04 The Broad Institute, Inc. Targeted base editing of the ush2a gene
CA3177481A1 (en) 2020-05-08 2021-11-11 David R. Liu Methods and compositions for simultaneous editing of both strands of a target double-stranded nucleotide sequence

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103088008A (zh) * 2011-10-31 2013-05-08 中国科学院微生物研究所 胞苷脱氨酶及其编码基因和它们的应用
CN105934516A (zh) * 2013-12-12 2016-09-07 哈佛大学的校长及成员们 用于基因编辑的cas变体
WO2017070632A2 (en) * 2015-10-23 2017-04-27 President And Fellows Of Harvard College Nucleobase editors and uses thereof
CN106916852A (zh) * 2017-04-13 2017-07-04 上海科技大学 一种碱基编辑系统及其构建和应用方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
VINCENT PETIT等: "《Powerful mutators lurking in the genome》", 《PHILOSOPHICAL TRANSACTIONS OF THE ROYAL SOCIETY B BIOLOGICAL SCIENCES》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110964742A (zh) * 2019-12-20 2020-04-07 北京市农林科学院 一种抗除草剂水稻的制备方法
CN110964742B (zh) * 2019-12-20 2022-03-01 北京市农林科学院 一种抗除草剂水稻的制备方法
CN112266420A (zh) * 2020-10-30 2021-01-26 华南农业大学 一种植物高效胞嘧啶单碱基编辑器及其构建与应用
CN112266420B (zh) * 2020-10-30 2022-08-09 华南农业大学 一种植物高效胞嘧啶单碱基编辑器及其构建与应用
CN114686456A (zh) * 2022-05-10 2022-07-01 中山大学 基于双分子脱氨酶互补的碱基编辑系统及其应用
CN114686456B (zh) * 2022-05-10 2023-02-17 中山大学 基于双分子脱氨酶互补的碱基编辑系统及其应用
CN115725533A (zh) * 2022-11-18 2023-03-03 中国农业科学院作物科学研究所 一种获得抗草甘膦水稻的方法及其所用双碱基融合编辑系统
CN115725533B (zh) * 2022-11-18 2023-08-25 中国农业科学院作物科学研究所 一种获得抗草甘膦水稻的方法及其所用双碱基融合编辑系统
CN117106751A (zh) * 2023-07-14 2023-11-24 华南师范大学 一种斑马鱼胞嘧啶碱基编辑器及其构建方法与应用
CN117106751B (zh) * 2023-07-14 2024-05-24 华南师范大学 一种斑马鱼胞嘧啶碱基编辑器及其构建方法与应用

Also Published As

Publication number Publication date
WO2019023680A1 (en) 2019-01-31
US20200172931A1 (en) 2020-06-04
US11732274B2 (en) 2023-08-22
US20230272425A1 (en) 2023-08-31
JP2020534795A (ja) 2020-12-03
EP3658573A1 (en) 2020-06-03

Similar Documents

Publication Publication Date Title
CN111801345A (zh) 使用噬菌体辅助连续进化(pace)的进化碱基编辑器的方法和组合物
US11912985B2 (en) Methods and compositions for simultaneous editing of both strands of a target double-stranded nucleotide sequence
US20220170013A1 (en) T:a to a:t base editing through adenosine methylation
US11795452B2 (en) Methods and compositions for prime editing nucleotide sequences
US20220380740A1 (en) Constructs for improved hdr-dependent genomic editing
WO2020181195A1 (en) T:a to a:t base editing through adenine excision
WO2020181178A1 (en) T:a to a:t base editing through thymine alkylation
WO2020181202A1 (en) A:t to t:a base editing through adenine deamination and oxidation
US20220282275A1 (en) G-to-t base editors and uses thereof
WO2020181180A1 (en) A:t to c:g base editors and uses thereof
WO2021030666A1 (en) Base editing by transglycosylation
JPWO2020191233A5 (zh)
JPWO2020191243A5 (zh)
JPWO2020191234A5 (zh)
WO2022261509A1 (en) Improved cytosine to guanine base editors
CA3225808A1 (en) Context-specific adenine base editors and uses thereof
WO2023240137A1 (en) Evolved cas14a1 variants, compositions, and methods of making and using same in genome editing

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20201020

WD01 Invention patent application deemed withdrawn after publication