CN116419973A - 用于蛋白质生产和筛选的表达系统 - Google Patents

用于蛋白质生产和筛选的表达系统 Download PDF

Info

Publication number
CN116419973A
CN116419973A CN202180067891.0A CN202180067891A CN116419973A CN 116419973 A CN116419973 A CN 116419973A CN 202180067891 A CN202180067891 A CN 202180067891A CN 116419973 A CN116419973 A CN 116419973A
Authority
CN
China
Prior art keywords
thr
antigen binding
arg
expression system
seq
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180067891.0A
Other languages
English (en)
Inventor
杨元生
杨慧敏
张思薇
吴方诗怡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Agency for Science Technology and Research Singapore
Original Assignee
Agency for Science Technology and Research Singapore
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Agency for Science Technology and Research Singapore filed Critical Agency for Science Technology and Research Singapore
Publication of CN116419973A publication Critical patent/CN116419973A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/46Hybrid immunoglobulins
    • C07K16/468Immunoglobulins having two or more different antigen binding sites, e.g. multifunctional antibodies
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • C07K14/70503Immunoglobulin superfamily
    • C07K14/70532B7 molecules, e.g. CD80, CD86
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • C07K14/71Receptors; Cell surface antigens; Cell surface determinants for growth factors; for growth regulators
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1086Preparation or screening of expression libraries, e.g. reporter assays
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6854Immunoglobulins
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/20Immunoglobulins specific features characterized by taxonomic origin
    • C07K2317/24Immunoglobulins specific features characterized by taxonomic origin containing regions, domains or residues from different species, e.g. chimeric, humanized or veneered
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/02Fusion polypeptide containing a localisation/targetting motif containing a signal sequence
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/03Fusion polypeptide containing a localisation/targetting motif containing a transmembrane segment
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/035Fusion polypeptide containing a localisation/targetting motif containing a signal for targeting to the external surface of a cell, e.g. to the outer membrane of Gram negative bacteria, GPI- anchored eukaryote proteins
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/50Fusion polypeptide containing protease site
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/90Fusion polypeptide containing a motif for post-translational modification
    • C07K2319/92Fusion polypeptide containing a motif for post-translational modification containing an intein ("protein splicing")domain
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2840/00Vectors comprising a special translation-regulating system
    • C12N2840/20Vectors comprising a special translation-regulating system translation of more than one cistron
    • C12N2840/203Vectors comprising a special translation-regulating system translation of more than one cistron having an IRES
    • C12N2840/206Vectors comprising a special translation-regulating system translation of more than one cistron having an IRES having multiple IRES

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Immunology (AREA)
  • Organic Chemistry (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Zoology (AREA)
  • Cell Biology (AREA)
  • Biotechnology (AREA)
  • Toxicology (AREA)
  • Urology & Nephrology (AREA)
  • Hematology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Food Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Plant Pathology (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明涉及用于抗原结合分子的表达系统,其中所述抗原结合分子是可分泌的或膜结合的,所述表达系统包含第一抗原结合多核苷酸;编码包含弗林蛋白酶共有序列RXKR或RXRR和2A多肽片段的切割位点的切割多核苷酸;编码膜锚多肽的锚多核苷酸,其中所述2A多肽片段包含一个或多个在任一氨基酸残基中的突变,以控制所述切割位点的切割效率,以调节分泌抗原结合分子相对于膜结合抗原结合分子的产生比率。

Description

用于蛋白质生产和筛选的表达系统
相关申请的交叉引用
本申请要求2020年10月2日提交的新加坡专利申请号10202009841Y的优先权,其内容出于所有目的通过引用以其整体并入本文。
技术领域
本发明总体上涉及生物技术领域,具体涉及基于核苷酸的表达系统。特别地,本发明涉及用于双重筛选目的的抗原结合分子的表达系统。
背景技术
抗原结合分子如抗体是增长最快的类型的生物治疗分子之一。抗体的一个示例是免疫球蛋白G(IgG),它由两条重链(HC)和两条轻链(LC)多肽组成。
开发治疗性抗体仍然是一个技术上具有挑战性、极其耗时且成本高昂的过程。开发正确抗体的过程往往不成功,因为抗体可能无效或仅包含不正确的序列,因此导致高损耗率和高失败风险。开发治疗性抗体的过程始于发现具有特异性结合亲和力和所期望功能的抗体,然后在哺乳动物细胞中生产抗体,为商业化前的临床前和临床研究提供足够的高质量材料。抗体的发现依赖于动物体内免疫或体外基于展示的技术,例如噬菌体展示、细菌展示和哺乳动物细胞展示。中国仓鼠卵巢细胞(CHO)是抗体生产的主要哺乳动物细胞,因为它们能够进行正确的复合物组装和类人糖基化。从抗体开发到生产的转变(这涉及抗体基因的重新克隆以及抗体形式和生产宿主细胞的改变)不仅导致时间和成本增加,而且许多候选抗体都失败了。
鉴于上述情况,需要提供一种允许筛选蛋白质的表达系统,以能够产生抗原结合分子例如抗体,并将错误加工的抗体种类的产生保持在最低限度。
发明内容
一方面,本公开涉及抗原结合分子的表达系统,其中所述抗原结合分子是可分泌的或膜结合的,所述表达系统包括:
-编码抗原结合分子的第一部分的第一抗原结合多核苷酸;
-编码包含弗林蛋白酶(Furin)共有序列RXKR(SEQ ID NO:1)或RXRR(SEQ ID NO:2)及其2A多肽片段的切割位点的切割多核苷酸;
-编码膜锚多肽的锚多核苷酸;
其中其2A多肽片段包含一个或多个在任一氨基酸残基中的突变以控制所述切割位点的切割效率从而调节可分泌抗原结合分子相对于膜结合抗原结合分子的产生比率;
其中所述切割多核苷酸在所述第一抗原结合多核苷酸和所述锚多核苷酸之间;
其中当所述切割位点被切割时,包含抗原结合分子的第一部分的所述可分泌抗原结合分子被释放;
其中当所述切割位点不被切割时,包含所述抗原结合分子的第一部分,所述弗林蛋白酶共有序列RXKR(SEQ ID NO:1)或RXRR(SEQ ID NO:2),所述其2A多肽片段和所述膜锚多肽的所述膜结合抗原结合分子被释放。
在另一方面,本公开涉及抗原结合分子的表达系统,其中所述抗原结合分子是可分泌的或膜结合的,所述表达系统包括:
-编码所述抗原结合分子的第一部分的第一抗原结合多核苷酸;
-编码第一切割位点的第一切割多核苷酸,其中该第一切割位点是最小弗林蛋白酶切割共有序列RXKR(SEQ ID NO:1)或RXRR(SEQ ID NO:2);
-编码自加工第二切割位点的第二切割多核苷酸,其中该自加工第二切割位点是2A多肽或其片段;
-编码膜锚多肽的锚多核苷酸;
其中所述2A多肽或其片段包含一个或多个在任一氨基酸残基中的突变以控制该第一切割位点和该第二切割位点的切割效率从而调节所述可分泌抗原结合分子相对于所述膜结合抗原结合分子的产生比率;
其中该第一和第二切割多核苷酸在该第一抗原结合多核苷酸和该锚多核苷酸之间;
其中当该第一切割位点被切割时,包含所述抗原结合分子的第一部分的所述可分泌抗原结合分子被释放;
其中当该第一和第二切割位点不被切割时包含所述抗原结合分子的第一部分,所述最小弗林蛋白酶切割共有序列RXKR(SEQ ID NO:1)或RXRR(SEQ ID NO:2),所述2A多肽或其片段和所述膜锚多肽的所述膜结合抗原结合分子被释放。
另一方面,本公开涉及包含如本文所公开的表达系统的载体。
另一方面,本公开涉及包含本文所公开的表达系统或载体的宿主细胞。
另一方面,本公开涉及包含本文所公开的表达系统、载体或宿主细胞的试剂盒。
在另一方面,本公开涉及一种用于检测样品中一种或多种分泌抗体和/或一种或多种表面结合抗体的存在的方法,该方法包括:
-提供如本文所公开的表达系统;
-将所述表达系统递送至一种或多种靶细胞,其中所述靶细胞转录所述表达系统,其中一旦转录,所述切割位点在第一多个所述抗原结合分子的第一部分中被切割,使得所述第一多个所述抗原结合分子的第一部分不包含所述膜锚多肽,并由此由所述靶细胞分泌,并且其中所述切割位点在第二多个所述抗原结合分子的第一部分中不被切割,使得所述第二多个所述抗原结合分子的第一部分包含所述膜锚多肽,并由此结合到所述靶分子的表面;和
-检测由所述靶细胞分泌的抗原结合分子的所述第一多个第一部分的存在或不存在和/或检测所述靶细胞的表面上抗原结合分子的所述第二多个第一部分的量。
在另一方面,本公开涉及一种用于检测样品中一种或多种分泌抗体和/或一种或多种表面结合抗体的存在的方法,该方法包括:
-提供如本文所公开的表达系统;
-将所述表达系统递送至一种或多种靶细胞,其中所述靶细胞转录所述表达系统,其中一旦转录,所述第一切割位点在第一多个所述抗原结合分子的第一部分中被切割,使得所述第一多个所述抗原结合分子的第一部分不包含所述膜锚多肽,并由此由所述靶细胞分泌,并且其中所述第一和第二切割位点在第二多个所述抗原结合分子的第一部分中不被切割,使得所述第二多个所述抗原结合分子的第一部分包含所述膜锚多肽,并由此结合到所述靶分子的表面;和
-检测由所述靶细胞分泌的所述第一多个所述抗原结合分子的第一部分的存在或不存在和/或检测所述靶细胞的表面上所述第二多个所述抗原结合分子的第一部分的量。
在另一方面,本公开涉及如本文公开的表达系统、载体、宿主细胞或试剂盒,用于筛选抗体文库或抗体生产。
附图说明
当结合非限制性实施例和附图考虑时,参考详细描述将更好地理解本发明,其中:
图1显示了示例性表达系统及其用途的示意图。图1A是说明本文公开的示例性表达系统的示意图。图1B的示意图说明了通过在示例性CHO细胞中组合抗体展示和生产来加速抗体开发和生产的平台。
图2显示了生成示例性CHO主克隆的工作流程,该克隆包含整合到单个整合位点中的标签化载体。ChiP是由鼠巨细胞病毒(CMV)增强子、人CMV核心启动子和人CMV内含子A组成的嵌合启动子;mCMV是鼠CMV增强子和启动子;IRESv18是突变的脑心肌炎病毒(EMCV)内部核糖体进入位点(IRES);pA是猿猴病毒40(SV40)聚腺苷酸化信号;Fw和F3分别是野生型和突变型翻转酶识别靶位点;EGFP是编码增强型绿色荧光蛋白的cDNA;Zeo是吉欧霉素抗性Sh ble基因cDNA;(-ATG)Pur是无起始密码子的嘌呤霉素N-乙酰基转移酶cDNA;HYG是潮霉素抗性基因cDNA;Flpe是增强型翻转酶重组酶cDNA。
图3显示了对每个细胞整合一个基因拷贝的示例性CHO K1主克隆的验证。图3A的示意图概述用于表达重组蛋白的重组酶介导的盒交换(RMCE)。图3B是靶向载体的示意图。图3C的图显示了通过单独转染pTarget-DsRed、pTarget-EGFP克隆或共转染pTarget-DsRed和pTarget-EGFP生成的靶向池的荧光激活细胞分选(FACS)分析。ChiP是由鼠巨细胞病毒(CMV)增强子、人CMV核心启动子和人CMV内含子A组成的嵌合启动子;mCMV是鼠CMV增强子和启动子;IRES是野生型脑心肌炎病毒(EMCV)内部核糖体进入位点(IRES);pA是猿猴病毒40(SV40)聚腺苷酸化信号;Fw和F3分别是野生型和突变型翻转酶识别靶位点;EGFP是编码增强型绿色荧光蛋白的cDNA;DsRed是编码荧光蛋白DsRed的cDNA;(-ATG)Pur是去除了起始密码子的嘌呤霉素N-乙酰基转移酶cDNA;HYG是潮霉素抗性基因cDNA;Flpe是增强型翻转酶重组酶cDNA;GOI是目的基因。
图4显示了用于抗体表达的示例性CHO K1主克隆的表征。图4A是携带DsRed、LC和HC的靶向载体的示意图。IRES是野生型脑心肌炎病毒(EMCV)内部核糖体进入位点(IRES);Fw和F3分别是野生型和突变型翻转酶识别靶位点;DsRed是编码荧光蛋白DsRed的cDNA;(-ATG)Pur是去除了起始密码子的嘌呤霉素N-乙酰基转移酶cDNA;LC是轻链cDNA;HC是重链cDNA。图4B的图显示通过用靶向载体和表达Flpe的载体转染主克隆产生的靶向池的荧光激活细胞分选(FACS)分析。图4C显示的图表显示了14天补料分批培养中靶向池的生长和滴度的表征。
图5显示来自靶向载体(其中HC直接连接到GPI或通过弗林蛋白酶切割序列(RRKR(SEQ ID NO:3),各种2A肽或RRKR(SEQ ID NO:3)-2A组合)的抗原结合分子(例如IgG抗体)同时展示和分泌。图5A是重组酶介导的盒交换(RMCE)和用于在靶细胞中同时展示和分泌IgG抗体的载体设计的概览示意图。图5B是各种靶向载体的概览示意图。ChiP是由鼠巨细胞病毒(CMV)增强子、人CMV核心启动子和人CMV内含子A组成的嵌合启动子;mCMV是鼠CMV增强子和启动子;IRES是野生型脑心肌炎病毒(EMCV)内部核糖体进入位点(IRES);pA是猿猴病毒40(SV40)聚腺苷酸化信号;Fw和F3分别是野生型和突变型翻转酶识别靶位点;HYG是潮霉素抗性基因cDNA;(-ATG)Pur是去除起始密码子的嘌呤霉素N-乙酰基转移酶cDNA;Flpe是增强型翻转酶重组酶cDNA;LC是轻链cDNA;HC是重链cDNA;RRKR(SEQ ID NO:3)是示例性的弗林蛋白酶识别序列;F2A是编码2A肽口蹄疫病毒的DNA;E2A是编码2A肽马鼻炎A病毒的DNA;T2A是编码2A肽明脉扁刺蛾病毒(Thosea asigna virus)的DNA;P2A是编码源自猪捷申病毒-1的2A肽的DNA;GPI是编码源自人衰变加速因子的糖基磷脂酰肌醇膜锚的DNA。图5C的图显示了使用各种靶向载体用于展示和分泌IgG抗体而生成的靶向细胞的表征。每个靶向的细胞池都是使用特定的靶向载体生成的。靶向的细胞用抗人IgG(γ链特异性)FITC缀合物染色,用于定量细胞表面结合的抗体。使用荧光激活细胞分选(FACS)将结合的分子的强度量化为几何平均荧光强度(GMFI)。图中的每个点代表归一化为GPI载体的GMFI。使用浊度计定量培养物上清液中分泌的抗体的浓度。每个载体的比生产率计算为第7天确定的抗体滴度除以相应的积分活细胞密度。图中的每个点代表对照载体的归一化比生产率。还在还原条件下使用SDS PAGE分析分泌的抗体。
图6显示了P2A的点突变,以控制膜结合的IgG抗体比分泌的IgG抗体的比例。图6A是具有通过P2A或RRKR(SEQ ID NO:3)-P2A连接到膜锚GPI的HC的靶向载体的示意图。P2A有19个氨基酸(SEQ ID NO.43)。图6B显示的图使用包含不同P2A变体的P2A-GPI和RRKR-P2A-GPI载体,P2A变体通过将P2A中的每个氨基酸点突变为甘氨酸(G)而生成。图6C显示的图使用包含不同P2A变体的P2A-GPI和RRKR-P2A-GPI载体,P2A变体通过将P2A中的每个氨基酸点突变为脯氨酸(P)而生成。图6D显示的图使用包含不同P2A变体的P2A-GPI和RRKR-P2A-GPI载体,P2A变体通过将P2A中的每个氨基酸点突变为丙氨酸(A)而生成。图6B-6D中的图显示了使用含有不同P2A变体用于展示和分泌IgG抗体的的P2A-GPI和RRKR-P2A-GPI载体产生的靶向的细胞的表征。每个靶向的细胞池都是使用含有特定P2A变体的靶向载体生成的。靶向的细胞用抗人IgG(γ链特异性)FITC缀合物染色,用于定量细胞表面结合的抗体。使用荧光激活细胞分选(FACS)将结合的分子的强度量化为几何平均荧光强度(GMFI)。图中的每个点代表归一化为GM载体的GMFI。使用浊度计定量培养物上清液中分泌的抗体的浓度。每个载体的比生产率计算为第7天确定的抗体滴度除以相应的积分活细胞密度。图中的每个点代表至对照载体的归一化比生产率。图6B-6D中的照片是在还原条件下使用SDS PAGE对分泌的抗体进行的蛋白质印迹分析。
图7显示了弗林蛋白酶识别序列,用于控制膜结合的IgG抗体比分泌的IgG抗体的比例。图7A是具有通过弗林蛋白酶识别序列变体连接到膜锚GPI的HC的靶向载体的示意图。靶向载体基于从弗林蛋白酶序列到膜锚GPI的部分而命名。从弗林蛋白酶序列到膜锚GPI的部分可以通过SEQ ID NO:150-170鉴定。图7B的图显示使用包含不同弗林蛋白酶变体的载体用于展示和分泌IgG抗体而产生的靶向的细胞的表征。靶向的细胞用抗人IgG(γ链特异性)FITC缀合物染色,用于定量细胞表面上的结合抗体。使用荧光激活细胞分选(FACS)将结合的分子的强度量化为几何平均荧光强度(GMFI)。图中的每个点代表归一化为GM载体的GMFI。使用浊度计定量培养物上清液中分泌的抗体的浓度。每个载体的比生产率计算为第7天确定的抗体滴度除以相应的积分活细胞密度。图中的每个点代表至对照载体的归一化比生产率。照片是在还原条件下使用SDS PAGE对分泌的抗体进行的蛋白质印迹分析。
图8显示了同时展示和分泌系统在抗体人源化中的应用。图8A是将可变轻链和重链文库设计到表达系统中的过程以及产生可分泌和膜结合的抗原结合分子或抗体的示意图。图8B是在测试抗原结合分子或抗体的结合亲和力、免疫原性和/或功能之前,在抗原结合分子或抗体的放大规模生产过程中分选可分泌的和膜结合的抗原结合分子或抗体的过程的示意图。
图9显示了各种弗林蛋白酶识别序列RRKR-2A肽和GPI膜锚的DNA和氨基酸序列。从上到下:RRKR-F2A的DNA序列(SEQ ID NO:176);RRKR-F2A的氨基酸序列(SEQ ID NO:171);RRKR-E2A的DNA序列(SEQ ID NO:177);RRKR-E2A的氨基酸序列(SEQ ID NO:172);RRKR-T2A的DNA序列(SEQ ID NO:178);RRKR-T2A的氨基酸序列(SEQ ID NO:173);RRKR-P2A的DNA序列(SEQ ID NO:179);RRKR-P2A的氨基酸序列(SEQ ID NO:174);GPI的DNA序列(SEQ ID NO:180);GPI的氨基酸序列(SEQ ID NO:175)。F2A是源自口蹄疫病毒的2A肽;E2A是源自马鼻炎A病毒的2A肽;T2A是源自明脉扁刺蛾病毒病毒的2A肽;P2A是源自猪捷申病毒-1的2A肽;GPI是源自人衰变加速因子的糖基磷脂酰肌醇膜锚。
具体实施方式
分泌的重组IgG可用于生产目的,而细胞表面展示的抗体可用于通过FACS进行筛选/分选。如今使用的表达系统显示高水平的膜抗体和几乎没有分泌抗体,或者反之亦然,低水平的膜抗体和高水平的分泌抗体。膜和分泌抗体的这种不平衡表达水平不能满足从抗体发现到生产的平稳过渡的需要,并最终导致用于抗体筛选和/或生产的低效系统。
鉴于上述问题,需要提供一种更有效的表达系统,其通过使用具有不同切割位点具有不同切割效率的工程化肽,允许相同的蛋白质以最佳比例同时细胞表面展示和分泌。这种表达系统可用于双重筛选目的和更有效的抗体生产。本公开的发明人已经发现了抗原结合分子的表达系统,其中抗原结合分子是可分泌的或膜结合的。本文使用的术语“表达系统”是指设计用于在细胞内或细胞外产生蛋白质或RNA(核糖核酸)的DNA构建体。表达系统可以单独存在或并入载体中。示例性表达系统包括但不限于哺乳动物表达系统、昆虫表达系统、酵母表达系统、细菌表达系统、藻类表达系统或无细胞表达系统。表达系统可包含以下组分,包括但不限于启动子、一个或多个目的基因、一个或多个鉴定标签。在一个实例中,表达系统可用于双重筛选目的以筛选可分泌抗原结合分子和/或膜结合抗原结合分子的表达水平。
本文所用的术语“抗原结合分子”是指抗体、抗体片段或其他蛋白质构建体,例如结构域。
在一个实例中,本公开提供了一种用于抗原结合分子的表达系统,其中所述抗原结合分子是可分泌的或膜结合的,所述表达系统包括:
编码抗原结合分子的第一部分的第一抗原结合多核苷酸;
-编码包含弗林蛋白酶共有序列RXKR(SEQ ID NO:1)或RXRR(SEQ ID NO:2)及其2A多肽片段的切割位点的切割多核苷酸;
-编码膜锚多肽的锚多核苷酸;
其中其2A多肽片段包含一个或多个在任一氨基酸残基中的突变以控制切割位点的切割效率从而调节可分泌抗原结合分子相对于膜结合抗原结合分子的产生比率;
其中切割多核苷酸在第一抗原结合多核苷酸和锚多核苷酸之间;
其中当切割位点被切割时,包含抗原结合分子的第一部分的可分泌抗原结合分子被释放;
其中当切割位点不被切割时,膜结合抗原结合分子(包含抗原结合分子的第一部分,弗林蛋白酶共有序列RXKR(SEQ ID NO:1)或RXRR(SEQ ID NO:2),其2A多肽片段和膜锚多肽)被释放。
在另一个实例中,本公开提供了一种用于抗原结合分子的表达系
统,其中所述抗原结合分子是可分泌的或膜结合的,所述表达系统包括:-编码抗原结合分子的第一部分的第一抗原结合多核苷酸;
-编码第一切割位点的第一切割多核苷酸,其中该第一切割位点是最小弗
林蛋白酶切割共有序列RXKR(SEQ ID NO:1)或RXRR(SEQ ID NO:2);-编码自加工第二切割位点的第二切割多核苷酸,其中该自加工第二切割位点是2A多肽或其片段;
-编码膜锚多肽的锚多核苷酸;
其中2A多肽或其片段包含一个或多个在任一氨基酸残基中的突变以控制该第一切割位点和该第二切割位点的切割效率从而调节可分泌抗原结合分子相对于膜结合抗原结合分子的产生比率;
其中该第一和第二切割多核苷酸在该第一抗原结合多核苷酸和该锚多核苷酸之间;
其中当该第一切割位点被切割时,包含抗原结合分子的第一部分的可分泌抗原结合分子被释放;
其中当该第一和第二切割位点不被切割时,膜结合抗原结合分子(包含抗原结合分子的第一部分,最小弗林蛋白酶切割共有序列RXKR(SEQ ID NO:
1)或RXRR(SEQ ID NO:2),2A多肽或其片段和膜锚多肽)被释放。
本文使用的术语“多核苷酸”是指编码目的产物或其片段、衍生物、突变蛋白或变体的核苷酸序列。多核苷酸包括DNA分子(例如,cDNA或基因组DNA)、RNA分子(例如,mRNA)、使用核苷酸类似物(例如,肽核酸和非天然存在的核苷酸类似物)产生的DNA或RNA的类似物,及其杂交体。核酸分子可以是单链或双链的。多核苷酸的命名取决于多核苷酸编码的目标产物。例如,第一或第二抗原结合多核苷酸是编码本文公开的抗原结合分子的第一或第二部分的核苷酸序列;第一或第二切割多核苷酸是编码本文公开的第一或第二切割位点的核苷酸序列;锚多核苷酸是编码本文公开的膜锚多肽的核苷酸序列。相同的命名法适用于本文公开的任何其他多核苷酸。
第一抗原结合多核苷酸的长度可以是至少15个核苷酸。在另一个实例中,第一抗原结合多核苷酸可以是但不限于约15至1500个核苷酸的长度,或约50、约100、约200、约300、约400、约500、约600、约700、约800、约900、约1000、约1100、约1200、约1300、约1400或约1500个核苷酸的长度。
第一抗原结合多核苷酸编码抗原结合分子的第一部分。在一个实例中,抗原结合分子的第一部分是抗体或其片段。在另一个实例中,抗原结合分子的第一部分是抗体重链。在另一个实例中,抗原结合分子的第一部分是抗体轻链。
第一抗原结合分子的长度可以是至少5个氨基酸。在另一个实例中,第一抗原结合分子可以是但不限于约5至500个氨基酸的长度,或约50、约100、约150、约200、约250、约300、约350、约400、约450或约500个氨基酸残基的长度。
本公开的表达系统还可包含编码抗原结合分子的第二部分的第二抗原结合多核苷酸。
第二抗原结合多核苷酸的长度可以是至少15个核苷酸。在另一个实例中,第二结合多核苷酸可以是但不限于约15至700个核苷酸的长度,或约50、约100、约200、约300、约400、约500、约600或约700个核苷酸的长度。
第二抗原结合多核苷酸编码抗原结合分子的第二部分。在一个实例中,抗原结合分子的第二部分是抗体或其片段。在另一个实例中,抗原结合分子的第二部分是抗体轻链。在另一个实例中,抗原结合分子的第二部分是抗体重链。
第二抗原结合分子的长度可以是至少5个氨基酸。在另一个实例中,第二抗原结合分子可以是但不限于约5至250个氨基酸的长度,或约50、约100、约150、约200或约250个氨基酸残基的长度。
在表达系统编码多于一个切割位点的情况下,表达系统的第一切割多核苷酸的长度可以是至少9个核苷酸。在另一个实例中,第一切割多核苷酸可以是但不限于约9至30个核苷酸的长度,或约10、约15、约20、约25或约30个核苷酸的长度。在一个优选的实例中,第一切割多核苷酸的长度是12个核苷酸。
第一切割多核苷酸编码第一切割位点。第一切割位点的长度可以是至少3个氨基酸。在另一个实例中,第一切割位点可以是但不限于约3至10个氨基酸的长度,或约3、4、5、6、7、8、9或10个氨基酸残基的长度。在一个优选的实例中,第一切割位点的长度是4个氨基酸。
在一个实例中,第一切割位点是最小弗林蛋白酶切割共有序列。本文中使用的术语“弗林蛋白酶”是指一种普遍存在的枯草杆菌蛋白酶样前蛋白转化酶,它可以切割含有其识别位点的蛋白质。本文所用的不限于“弗林蛋白酶共有序列”、“最小切割位点”、“最小弗林蛋白酶切割共有序列”或“弗林蛋白酶识别位点”的术语是指RXKR(SEQ ID NO:1)或RXRR(SEQ ID NO:2)的氨基酸序列,其中X可以是任何氨基酸。弗林蛋白酶识别包含弗林蛋白酶共有序列的蛋白质,这导致包含弗林蛋白酶共有序列的蛋白质的切割。切割可以发生在例如高尔基体中。
在一个实例中,弗林蛋白酶共有序列选自由以下组成的组:RRKR(SEQ ID NO:3)、RRRR(SEQ ID NO:4)、RSKR(SEQ ID NO:5)、RSRR(SEQ ID NO:6)、RKKR(SEQ ID NO:7)、RKRR(SEQ ID NO:8)、RQKR(SEQ ID NO:9)、RQRR(SEQ ID NO:10)、RTKR(SEQ ID NO:11)、RTRR(SEQ ID NO:12)、REKR(SEQ ID NO:13)、RERR(SEQ ID NO:14)、RDKR(SEQ ID NO:15)、RDRR(SEQ ID NO:16)、RHKR(SEQ ID NO:17)、RHRR(SEQ ID NO:18)、RFKR(SEQ ID NO:19)、RFRR(SEQ ID NO:20)、RAKR(SEQ ID NO:21)、RARR(SEQ ID NO:22)、RNKR(SEQ ID NO:23)、RNRR(SEQ ID NO:24)、RCKR(SEQ ID NO:25)、RCRR(SEQ ID NO:26)、RGKR(SEQ ID NO:27)、RGRR(SEQ ID NO:28)、RIKR(SEQ ID NO:29)、RIRR(SEQ ID NO:30)、RLKR(SEQ ID NO:31)、RLRR(SEQ ID NO:32)、RMKR(SEQ ID NO:33)、RMRR(SEQ ID NO:34)、RPKR(SEQ ID NO:35)、RPRR(SEQ ID NO:36)、RWKR(SEQ ID NO:37)、RWRR(SEQ ID NO:38)、RYKR(SEQ ID NO:39)、RYRR(SEQ ID NO:40)、RVKR(SEQ ID NO:41)和RVRR(SEQ ID NO:42)。在优选的实例中,弗林蛋白酶共有序列是RRKR(SEQ ID NO:3)。
表达系统的第二切割多核苷酸的长度可以是至少10个核苷酸。在另一个实例中,第一切割多核苷酸可以是但不限于约10至200个核苷酸的长度,或约10、约20、约30、约40、约50、约60、约70、约80、约90、约100、约110、约120、约130、约140、约150、约160、约170、约180、约190或约200个核苷酸的长度。在一个优选的实例中,第二切割多核苷酸的长度是15个核苷酸。在另一个优选的实例中,第二切割多核苷酸的长度是57个核苷酸。
第二切割多核苷酸编码第二切割位点。第二切割位点是自加工切割位点。本文所用术语“自加工切割位点”是指具有自切割或自加工能力的肽序列,其中肽不需要外部分子或酶例如蛋白酶来切割肽序列。第二切割位点的长度可以是至少4个氨基酸。在另一个实例中,第一切割位点可以是但不限于约4至50个氨基酸、约10至20个氨基酸、约20至30个氨基酸、约30至40个氨基酸、约40至50个氨基酸,或约4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个氨基酸残基的长度。在一个实例中,第一切割位点的长度是5个氨基酸。在另一个实例中,第一切割位点的长度是19个氨基酸。
在一个实例中,该自加工第二切割位点是2A多肽或其片段。本文使用的不限于“2A多肽”、“2A肽”、“2A蛋白质”的术语是指在真核细胞翻译过程中介导蛋白质“自切割”或“自加工”的肽。例如,2A多肽的长度通常为18-25个氨基酸(aa),并且源自病毒。2A多肽能够自切割,其在例如最后两个氨基酸甘氨酸和脯氨酸之间共翻译地发生。在一个实例中,2A多肽或其片段选自由以下组成的组:P2A、F2A、E2A和T2A或其片段。F2A是源自口蹄疫病毒的2A肽;E2A是源自马鼻炎A病毒的2A肽;T2A是源自明脉扁刺蛾病毒的2A肽;P2A是源自猪捷申病毒-1的2A肽。在另一个实例中,2A多肽或其片段是P2A多肽或其片段。在一个实例中,P2A多肽是ATNFSLLKQAGDVEENPGP(SEQ ID NO:43)。在另一个实例中,F2A多肽是APVKQTLNFDLLKLAGDVESNPGP(SEQ ID NO:44)。在另一个实例中,E2A多肽是QCTNYALLKLAGDVESNPGP(SEQ ID NO:45)。在另一个实例中,T2A多肽是EGRGSLLTCGDVEENPGP(SEQ ID NO:46)。相应的核苷酸序列显示在下表1中。
表1.P2A、F2A、E2A和T2A的核苷酸和氨基酸序列。
Figure BDA0004158610070000141
在表达系统编码一个切割位点的情况下,表达系统包含编码切割位点的切割多核苷酸,所述切割位点包含本文公开的弗林蛋白酶共有序列及其2A多肽片段。还应当理解,其2A多肽片段是指本文公开的2A多肽的部分。在一个实例中,其2A多肽段包含来自2A多肽的至少3个氨基酸的部分。在另一个实例中,其2A多肽片段包含但不限于来自2A多肽的约3-10个氨基酸的部分,或约3、4、5、6、7、8、9或10个氨基酸的部分。在另一个实例中,其2A多肽片段选自以下组成的组:其P2A、F2A、E2A和T2A片段。在另一个实例中,其2A多肽片段是其P2A多肽片段。
在一个实例中,其2A多肽片段可以是本文公开的2A多肽的前3-10个氨基酸,或本文公开的2A多肽的最后3-10个氨基酸。在另一个实例中,其2A多肽片段是P2A、F2A、E2A或T2A多肽的前5个氨基酸。在另一个实例中,其P2A多肽片段是P2A多肽的前5个氨基酸。在另一个实例中,其2A多肽片段是ATNFS(SEQ ID NO:51)。
由所述表达系统编码的2A多肽或其2A多肽片段包含一个或多个突变。2A多肽或其2A多肽片段中例如脯氨酸或甘氨酸的氨基酸突变可分别通过限制或提供肽链的高柔性来影响所述2A多肽或其2A多肽片段的二级结构。
在编码多于一个切割位点的表达系统中,此类突变可以控制第一切割位点和第二个切割位点的切割效率,从而调节可分泌抗原结合分子相对于膜结合抗原结合分子的产生比率。在一个实例中,2A多肽或其片段在氨基酸残基1、2、3、4或5中包含一个或多个突变。应当理解,氨基酸残基1、2、3、4或5是指2A多肽或其片段的氨基酸残基1、2、3、4或5。在一个实例中,2A多肽或其片段的氨基酸残基1、2、3、4或5被突变为选自由以下组成的组的任何一个:甘氨酸、脯氨酸、丙氨酸、精氨酸、组氨酸、赖氨酸、天冬氨酸、谷氨酸、丝氨酸、苏氨酸、天冬酰胺、谷氨酰胺、半胱氨酸、硒代半胱氨酸、缬氨酸、异亮氨酸、亮氨酸、甲硫氨酸、苯丙氨酸、酪氨酸和色氨酸。在另一个实例中,2A多肽或其片段的氨基酸残基1、2、3、4或5突变为甘氨酸、脯氨酸或丙氨酸。
在一个实例中,2A多肽或其片段中的一个或多个突变选自由以下组成的组:A1P、A1G、T2G、T2P、N3P、F4P、S5P、N3A和F4A。如果突变发生在P2A多肽中,则突变分别导致以下P2A多肽序列:PTNFSLLKQAGDVEENPGP(SEQ ID NO:109)、GTNFSLLKQAGDVEENPGP(SEQ ID NO:101)、AGNFSLLKQAGDVEENPGP(SEQ ID NO:108)、APNFSLLKQAGDVEENPGP(SEQ ID NO:107)、ATPFSLLKQAGDVEENPGP(SEQ ID NO:103)、ATNPSLLKQAGDVEENPGP(SEQ ID NO:105)、ATNFPLLKQAGDVEENPGP(SEQ ID NO:106)、ATAFSLLKQAGDVEENPGP(SEQ ID NO:104)和ATNASLLKQAGDVEENPGP(SEQ ID NO:102)。在另一个实例中,2A多肽或其片段中的突变包括A1P、A1G、T2G或T2P。在另一个实例中,2A多肽或其片段中的突变是A1P。在另一个实例中,2A多肽或其片段中的突变是A1G。在另一个实例中,2A多肽或其片段中的突变是T2G。在另一个实例中,2A多肽或其片段中的突变是T2P。
在编码一个切割位点的表达系统中,此类突变可以控制切割位点的切割效率以调节可分泌抗原结合分子相对于膜结合抗原结合分子的产生比率。在另一个实例中,其2A多肽片段在氨基酸残基1、2、3、4或5中包含一个或多个突变。应当理解,氨基酸残基1、2、3、4或5是指其2A多肽片段的氨基酸残基1、2、3、4或5。在一个实例中,其2A多肽片段的氨基酸残基1、2、3、4或5被突变为选自由以下组成的组的任何一个:甘氨酸、脯氨酸、丙氨酸、精氨酸、组氨酸、赖氨酸、天冬氨酸、谷氨酸、丝氨酸、苏氨酸、天冬酰胺、谷氨酰胺、半胱氨酸、硒代半胱氨酸、缬氨酸、异亮氨酸、亮氨酸、甲硫氨酸、苯丙氨酸、酪氨酸和色氨酸。在另一个实例中,其2A多肽片段的氨基酸残基1、2、3、4或5被突变为甘氨酸、脯氨酸或丙氨酸。在另一个实例中,2A多肽片段中的一个或多个突变选自由以下组成的组:A1P、A1G、T2G、T2P、N3P、F4P、S5P、N3A和F4A。突变分别产生以下2A多肽片段序列:PTNFS(SEQ ID NO:60)、GTNFS(SEQ IDNO:52)、AGNFS(SEQ ID NO:59)、APNFS(SEQ ID NO:58)、ATPFS(SEQ ID NO:54)、ATNPS(SEQID NO:56)、ATNFP(SEQ ID NO:57)、ATAFS(SEQ ID NO:55)和ATNAS(SEQ ID NO:53)。在另一个实例中,其2A多肽片段中的突变是A1P。在另一个实例中,其2A多肽片段中的突变是A1G。在另一个实例中,其2A多肽片段中的突变是T2G。在另一个实例中,其2A多肽片段中的突变是T2P。
所述表达系统可包含分别编码包含弗林蛋白酶共有序列的第一切割位点和包含2A多肽或其片段的第二切割位点的第一和第二切割多核苷酸,并且可包含如本文所公开的弗林蛋白酶共有序列和2A多肽或片段的不同组合。在一个实例中,第一和第二切割位点包含选自由以下组成的组的序列:RXKRPTNFSLLKQAGDVEENPGP(SEQ ID NO:139)、RXKRGTNFSLLKQAGDVEENPGP(SEQ ID NO:131)、RXKRAGNFSLLKQAGDVEENPGP(SEQ ID NO:138)、RXKRAPNFSLLKQAGDVEENPGP(SEQ ID NO:137)、RXKRATPFSLLKQAGDVEENPGP(SEQ IDNO:133)、RXKRATNPSLLKQAGDVEENPGP(SEQ ID NO:135)、RXKRATNFPLLKQAGDVEENPGP(SEQ IDNO:136)、RXKRATAFSLLKQAGDVEENPGP(SEQ ID NO:134)、RXKRATNASLLKQAGDVEENPGP(SEQ IDNO:132)、RXKRATNFSLLKQAGDVEENPGP(SEQ ID NO:130)、RXRRATNFSLLKQAGDVEENPGP(SEQ IDNO:140)、RXRRGTNFSLLKQAGDVEENPGP(SEQ ID NO:141)、RXRRATNASLLKQAGDVEENPGP(SEQ IDNO:142)、RXRRATPFSLLKQAGDVEENPGP(SEQ ID NO:143)、RXRRATAFSLLKQAGDVEENPGP(SEQ IDNO:144)、RXRRATNPSLLKQAGDVEENPGP(SEQ ID NO:145)、RXRRATNFPLLKQAGDVEENPGP(SEQ IDNO:146)、RXRRAPNFSLLKQAGDVEENPGP(SEQ ID NO:147)、RXRRAGNFSLLKQAGDVEENPGP(SEQ IDNO:148)和RXRRPTNFSLLKQAGDVEENPGP(SEQ ID NO:149)。在另一个实例中,第一和第二切割位点包含选自由以下组成的组的序列:RRKRPTNFSLLKQAGDVEENPGP(SEQ ID NO:119)、RRKRGTNFSLLKQAGDVEENPGP(SEQ ID NO:111)、RRKRAGNFSLLKQAGDVEENPGP(SEQ ID NO:118)、RRKRAPNFSLLKQAGDVEENPGP(SEQ ID NO:117)、RRKRATPFSLLKQAGDVEENPGP(SEQ IDNO:113)、RRKRATNPSLLKQAGDVEENPGP(SEQ ID NO:115)、RRKRATNFPLLKQAGDVEENPGP(SEQ IDNO:116)、RRKRATAFSLLKQAGDVEENPGP(SEQ ID NO:114)、RRKRATNASLLKQAGDVEENPGP(SEQ IDNO:112)、RRKRATNFSLLKQAGDVEENPGP(SEQ ID NO:110)、RRRRATNFSLLKQAGDVEENPGP(SEQ IDNO:120)、RRRRGTNFSLLKQAGDVEENPGP(SEQ ID NO:121)、RRRRATNASLLKQAGDVEENPGP(SEQ IDNO:122)、RRRRATPFSLLKQAGDVEENPGP(SEQ ID NO:123)、RRRRATAFSLLKQAGDVEENPGP(SEQ IDNO:124)、RRRRATNPSLLKQAGDVEENPGP(SEQ ID NO:125)、RRRRATNFPLLKQAGDVEENPGP(SEQ IDNO:126)、RRRRAPNFSLLKQAGDVEENPGP(SEQ ID NO:127)、RRRRAGNFSLLKQAGDVEENPGP(SEQ IDNO:128)和RRRRPTNFSLLKQAGDVEENPGP(SEQ ID NO:129)。这种切割位点的实例可以在图7A所示的表达系统中找到。
所述表达系统可包含编码包含弗林蛋白酶共有序列及其2A多肽片段的切割位点的切割多核苷酸,可包括如本文所公开的弗林蛋白酶共有序列及其2A多肽片段的不同组合。在一个实例中,切割位点包含选自由以下组成的组的序列:RXKRPTNFS(SEQ ID NO:90)、RXKRGTNFS(SEQ ID NO:82)、RXKRAGNFS(SEQ ID NO:89)、RXKRAPNFS(SEQ ID NO:88)、RXKRATPFS(SEQ ID NO:84)、RXKRATNPS(SEQ ID NO:86)、RXKRATNFP(SEQ ID NO:87)、RXKRATAFS(SEQ ID NO:85)、RXKRATNAS(SEQ ID NO:83)、RXKRATNFS(SEQ ID NO:81)、RXRRATNFS(SEQ ID NO:91)、RXRRGTNFS(SEQ ID NO:92)、RXRRATNAS(SEQ ID NO:93)、RXRRATPFS(SEQ ID NO:94)、RXRRATAFS(SEQ ID NO:95)、RXRRATNPS(SEQ ID NO:96)、RXRRATNFP(SEQ ID NO:97)、RXRRAPNFS(SEQ ID NO:98)、RXRRAGNFS(SEQ ID NO:99)和RXRRPTNFS(SEQ ID NO:100)。在另一个实例中,切割位点包含选自由以下组成的组的序列:RRKRPTNFS(SEQ ID NO:70)、RRKRGTNFS(SEQ ID NO:62)、RRKRAGNFS(SEQ ID NO:69)、RRKRAPNFS(SEQ ID NO:68)、RRKRATPFS(SEQ ID NO:64)、RRKRATNPS(SEQ ID NO:66)、RRKRATNFP(SEQ ID NO:67)、RRKRATAFS(SEQ ID NO:65)、RRKRATNAS(SEQ ID NO:63)、RRKRATNFS(SEQ ID NO:61)、RRRRATNFS(SEQ ID NO:71)、RRRRGTNFS(SEQ ID NO:72)、RRRRATNAS(SEQ ID NO:73)、RRRRATPFS(SEQ ID NO:74)、RRRRATAFS(SEQ ID NO:75)、RRRRATNPS(SEQ ID NO:76)、RRRRATNFP(SEQ ID NO:77)、RRRRAPNFS(SEQ ID NO:78)、RRRRAGNFS(SEQ ID NO:79)和RRRRPTNFS(SEQ ID NO:80)。在另一个实例中,切割位点序列是RRKRPTNFS(SEQ ID NO:70)。在另一个实例中,切割位点序列是RRKRGTNFS(SEQ ID NO:62)。在另一个实例中,切割位点序列是RRKRAGNFS(SEQ ID NO:69)。在另一个实例中,切割位点序列是RRKRAPNFS(SEQ ID NO:68)。在一个实例中,切割位点序列是RRKRATNFS(SEQ IDNO:61)。在另一个实例中,切割位点序列是RRKRATNAS(SEQ ID NO:63)。在另一个实例中,切割位点序列是RRKRATPFS(SEQ ID NO:64)。在另一个实例中,切割位点序列是RRKRATAFS(SEQ ID NO:65)。在另一个实例中,切割位点序列是RRKRATNPS(SEQ ID NO:66)。在另一个实例中,切割位点序列是RRKRATNFP(SEQ ID NO:67)。这种切割位点的实例可以在图7A所示的表达系统中找到。
所述表达系统的所述锚多核苷酸的长度可以是至少20个核苷酸。在另一个实例中,第一切割多核苷酸可以是但不限于约20至130个核苷酸的长度,或约10、约20、约30、约40、约50、约60、约70、约80,约90、约100、约110、约120或约130个核苷酸的长度。在一个优选的实例中,第一切割多核苷酸的长度是111个核苷酸。
锚多核苷酸编码膜锚多肽。所述膜锚多肽的长度可以是至少7个氨基酸。在另一个实例中,膜锚多肽可以是但不限于约7至45个氨基酸、约15至40个氨基酸、或约7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44或45个氨基酸残基的长度。在一个优选的实例中,膜锚多肽的长度是37个氨基酸。
在一个实例中,膜锚多肽包含糖磷脂跨膜结构域(GPI)、血小板衍生生长因子受体(PDGFR)β链跨膜结构域(PTM)或鼠B7-1抗原的免疫球蛋白C2型细胞外-跨膜-胞质结构域。在另一个实例中,膜锚多肽是糖磷脂跨膜结构域(GPI)。本文使用的不限于“糖磷脂跨膜结构域”、“糖磷脂膜锚”、“GM”或“GPI”的术语是指通过包含磷脂酰肌醇、碳水化合物和乙醇胺的结构锚定到细胞膜的膜蛋白。在一个实例中,糖磷脂跨膜结构域(GPI)是一种源自人衰变加速因子的糖基磷脂酰肌醇膜锚。在一个实例中,糖磷脂跨膜结构域(GPI)的氨基酸序列是SEQ ID NO:175。
本公开的表达系统的一个目的是筛选可分泌抗原结合分子和/或膜结合抗原结合分子的表达水平,也称为双重筛选。为了调节可分泌抗原结合分子相对于膜结合抗原结合分子的产生比率,切割位点例如第一切割位点和第二切割位点的切割效率可以通过例如切割位点的类型和/或切割位点中存在的突变来控制。取决于切割位点的效率,由本公开的表达系统产生的蛋白质可以发生完全切割或不完全切割。
本文使用的不限于“不完全切割”或“部分切割”的术语是指一个细胞中的抗原结合分子在弗林蛋白酶和/或2A切割位点被差异切割,导致以下的混合物:抗原结合分子仅在弗林蛋白酶切割位点被切割产生可分泌抗原结合分子;抗原结合分子仅在2A切割位点被切割产生不正确的可分泌抗原结合分子;抗原结合分子在弗林蛋白酶和2A切割位点二者都被切割;和抗原结合分子在弗林蛋白酶和2A切割位点二者都不被切割的,产生膜结合抗原结合分子,如图5A中的示意图所示。在一个优选的实施方案中,当抗原结合分子在RRKR(SEQID NO:3)和/或P2A切割位点被差异切割时,发生不完全切割。可以使用不同的方法来量化不完全切割的水平。在一个实例中,分泌的抗原结合分子(培养物上清液中抗体的浓度)比膜结合抗原结合分子的比率可用于量化不完全切割的水平。在一个优选的实例中,分泌抗体(培养物上清液中抗体的浓度)与膜结合抗体(通过染色和荧光激活细胞分选(FACS)测量)的比率间接表明在细胞中表达的在RRKR(SEQ ID NO:3)和/或2A处被部分切割的分子与在两个位点都没有被切割的分子的相对比率。
如本文所用,术语“完全切割”是指一个细胞中的所有抗原结合分子在弗林蛋白酶切割位点和2A切割位点二者都被切割,产生可分泌的抗原结合分子,如图5A中的示意图所示。在一个优选的实施方案中,当切割发生在RRKR(SEQ ID NO:3)和P2A切割位点时,发生完全切割。
如本文所用,术语“膜结合抗原结合分子”是指抗原结合分子,其包含抗原结合分子的第一部分和第二部分、弗林蛋白酶共有序列、2A多肽或其片段以及膜锚多肽,其衍生自如本文所公开的表达系统的,由细胞产生和释放。在一个实例中,膜结合抗原结合分子包含抗体的轻链和重链、RXKR(SEQ ID NO:1)或RXRR(SEQ ID NO:2)序列、P2A多肽或其片段和膜锚多肽。在优选的实例中,膜结合抗原结合分子包含抗体的轻链和重链、RRKR(SEQ ID NO:3)序列、P2A多肽或其片段和膜锚多肽。
膜结合抗原结合分子的水平由展示水平决定。本文所用的术语“展示水平”是指膜结合抗原结合分子在细胞表面的表达,其中膜结合抗原结合分子包含:编码抗原结合分子的第一部分的第一抗原结合多核苷酸;编码抗原结合分子的第二部分的第二抗原结合多核苷酸。
本文使用的术语“可分泌抗原结合分子”、“正确产物”或“所期望产物”是指抗原结合分子,其衍生自如本文所公开的表达系统,由细胞产生和释放,包含抗原结合分子的第一部分和第二部分。在优选的实例中,可分泌抗原结合分子包含抗体的轻链和重链。
本文使用的不限于“不正确的可分泌抗原结合分子”、“不正确的产物”或“不期望的产物”的术语是指抗原结合分子,其包含抗原结合分子的第一部分和第二部分、弗林蛋白酶共有序列、和2A多肽或其片段,其衍生自如本文所公开的表达系统,由细胞产生和释放。在优选的实例中,不正确的可分泌抗原结合分子包含抗体的轻链和重链、RRKR(SEQ ID NO:3)序列和P2A多肽或其片段。
本公开的表达系统可进一步包含一个或多个内部核糖体进入位点(IRES)多核苷酸。在一个实例中,一个或多个IRES多核苷酸在第一抗原结合多核苷酸之前。在另一个实例中,一个或多个IRES多核苷酸在锚多核苷酸之后。在一个实例中,一个或多个IRES多核苷酸的核苷酸序列是SEQ ID NO:181。在一个实例中,一个或多个IRES多核苷酸编码野生型脑心肌炎病毒(EMCV)内部核糖体进入位点(IRES)。
本公开的表达系统还可进一步包含一个或多个可操作连接的启动子序列。术语“可操作地连接”是指转录调节核苷酸序列(例如,启动子序列)和其他核苷酸序列之间的功能性连接。因此,转录调节核苷酸序列可以调节其他核苷酸序列的转录和/或翻译。在一个实例中,一个或多个可操作地连接的启动子序列选自由ChiP、人CMV、鼠CMV、SV40、人EF启动子组成的组。在一个优选的实例中,启动子序列是ChiP。ChiP是由鼠巨细胞病毒(CMV)增强子、人CMV核心启动子和人CMV内含子A组成的嵌合启动子。在一个实例中,一个或多个可操作地连接的启动子序列的核苷酸序列是SEQ ID NO:182。
可以生成表达系统的不同组合。在一个实例中,表达系统包括:编码轻链抗体的第二抗原结合多核苷酸;编码重链抗体的第一抗原结合多核苷酸;编码弗林蛋白酶共有序列RXKR(SEQ ID NO:1)或RXRR(SEQ ID NO:2)的第一切割多核苷酸;编码2A多肽或其片段的第二切割多核苷酸;编码膜锚多肽的锚多核苷酸;其中2A多肽或其片段包含一个或多个突变。在另一个实例中,表达系统包含编码可操作地连接的启动子序列的多核苷酸;编码轻链抗体的第二抗原结合多核苷酸;第一IRES多核苷酸;编码重链抗体的第一抗原结合多核苷酸;编码弗林蛋白酶共有序列RXKR(SEQ ID NO:1)或RXRR(SEQ ID NO:2)的第一切割多核苷酸;编码2A多肽或其片段的第二切割多核苷酸;编码膜锚多肽的锚多核苷酸;第二IRES多核苷酸;其中2A多肽或其片段包含一个或多个突变。
在另一个实例中,表达系统包括:编码轻链抗体的第二抗原结合多核苷酸;编码重链抗体的第一抗原结合多核苷酸;编码弗林蛋白酶共有序列RXKR(SEQ ID NO:1)或RXRR(SEQ ID NO:2)及其2A多肽片段的切割多核苷酸;编码膜锚多肽的锚多核苷酸;其中其2A多肽片段包含一个或多个突变。在另一个实例中,表达系统包括:编码轻链抗体的第二抗原结合多核苷酸;编码重链抗体的第一抗原结合多核苷酸;编码RRKRGTNFS(SEQ ID NO:62)的切割多核苷酸;编码膜锚多肽的锚多核苷酸。在另一个实例中,表达系统包括:编码轻链抗体的第二抗原结合多核苷酸;编码重链抗体的第一抗原结合多核苷酸;编码RRKRAPNFS(SEQID NO:68)的切割多核苷酸;编码膜锚多肽的锚多核苷酸。在另一个实例中,表达系统包括:编码轻链抗体的第二抗原结合多核苷酸;编码重链抗体的第一抗原结合多核苷酸;编码RRKRATNAS(SEQ ID NO:63)的切割多核苷酸;编码膜锚多肽的锚多核苷酸。在另一个实例中,表达系统包括:编码轻链抗体的第二抗原结合多核苷酸;编码重链抗体的第一抗原结合多核苷酸;编码RRKRATPFS(SEQ ID NO:64)的切割多核苷酸;编码膜锚多肽的锚多核苷酸。在另一个实例中,表达系统包括:编码轻链抗体的第二抗原结合多核苷酸;编码重链抗体的第一抗原结合多核苷酸;编码RRKRATAFS(SEQ ID NO:65)的切割多核苷酸;编码膜锚多肽的锚多核苷酸。在另一个实例中,表达系统包括:编码轻链抗体的第二抗原结合多核苷酸;编码重链抗体的第一抗原结合多核苷酸;编码RRKRATNPS(SEQ ID NO:66)的切割多核苷酸;编码膜锚多肽的锚多核苷酸。在另一个实例中,表达系统包括:编码轻链抗体的第二抗原结合多核苷酸;编码重链抗体的第一抗原结合多核苷酸;编码RRKRATNFP(SEQ ID NO:67)的切割多核苷酸;编码膜锚多肽的锚多核苷酸。在另一个实例中,表达系统包括:编码轻链抗体的第二抗原结合多核苷酸;编码重链抗体的第一抗原结合多核苷酸;编码RRKRAGNFS(SEQ IDNO:69)的切割多核苷酸;编码膜锚多肽的锚多核苷酸。在另一个实例中,表达系统包括:编码轻链抗体的第二抗原结合多核苷酸;编码重链抗体的第一抗原结合多核苷酸;编码RRKRPTNFS(SEQ ID NO:70)的切割多核苷酸;编码膜锚多肽的锚多核苷酸。
在另一个实例中,表达系统包含编码可操作地连接的启动子序列的多核苷酸;编码轻链抗体的第二抗原结合多核苷酸;第一IRES多核苷酸;编码重链抗体的第一抗原结合多核苷酸;编码弗林蛋白酶共有序列RXKR(SEQ ID NO:1)或RXRR(SEQ ID NO:2)和其2A多肽片段的切割多核苷酸;编码膜锚多肽的锚多核苷酸;第二IRES多核苷酸;其中其2A多肽片段包含一个或多个突变。在一个实例中,表达系统包含编码可操作地连接的启动子序列的多核苷酸;编码轻链抗体的第二抗原结合多核苷酸;第一IRES多核苷酸;编码重链抗体的第一抗原结合多核苷酸;编码RRKRGTNFS(SEQ ID NO:62)的切割多核苷酸;编码膜锚多肽的锚多核苷酸;第二IRES多核苷酸。在一个实例中,表达系统包含编码可操作地连接的启动子序列的多核苷酸;编码轻链抗体的第二抗原结合多核苷酸;第一IRES多核苷酸;编码重链抗体的第一抗原结合多核苷酸;编码RRKRAPNFS(SEQ ID NO:68)的切割多核苷酸;编码膜锚多肽的锚多核苷酸;第二IRES多核苷酸。在一个实例中,表达系统包含编码可操作地连接的启动子序列的多核苷酸;编码轻链抗体的第二抗原结合多核苷酸;第一IRES多核苷酸;编码重链抗体的第一抗原结合多核苷酸;编码RRKRATNAS(SEQ ID NO:63)的切割多核苷酸;编码膜锚多肽的锚多核苷酸;第二IRES多核苷酸。在一个实例中,表达系统包含编码可操作地连接的启动子序列的多核苷酸;编码轻链抗体的第二抗原结合多核苷酸;第一IRES多核苷酸;编码重链抗体的第一抗原结合多核苷酸;编码RRKRATPFS(SEQ ID NO:64)的切割多核苷酸;编码膜锚多肽的锚多核苷酸;第二IRES多核苷酸。在一个实例中,表达系统包含编码可操作地连接的启动子序列的多核苷酸;编码轻链抗体的第二抗原结合多核苷酸;第一IRES多核苷酸;编码重链抗体的第一抗原结合多核苷酸;编码RRKRATAFS(SEQ ID NO:65)的切割多核苷酸;编码膜锚多肽的锚多核苷酸;第二IRES多核苷酸。在一个实例中,表达系统包含编码可操作地连接的启动子序列的多核苷酸;编码轻链抗体的第二抗原结合多核苷酸;第一IRES多核苷酸;编码重链抗体的第一抗原结合多核苷酸;编码RRKRATNPS(SEQ ID NO:66)的切割多核苷酸;编码膜锚多肽的锚多核苷酸;第二IRES多核苷酸。在一个实例中,表达系统包含编码可操作地连接的启动子序列的多核苷酸;编码轻链抗体的第二抗原结合多核苷酸;第一IRES多核苷酸;编码重链抗体的第一抗原结合多核苷酸;编码RRKRATNFP(SEQ ID NO:67)的切割多核苷酸;编码膜锚多肽的锚多核苷酸;第二IRES多核苷酸。在一个实例中,表达系统包含编码可操作地连接的启动子序列的多核苷酸;编码轻链抗体的第二抗原结合多核苷酸;第一IRES多核苷酸;编码重链抗体的第一抗原结合多核苷酸;编码RRKRAGNFS(SEQ ID NO:69)的切割多核苷酸;编码膜锚多肽的锚多核苷酸;第二IRES多核苷酸。在一个实例中,表达系统包含编码可操作地连接的启动子序列的多核苷酸;编码轻链抗体的第二抗原结合多核苷酸;第一IRES多核苷酸;编码重链抗体的第一抗原结合多核苷酸;编码RRKRPTNFS(SEQ IDNO:70)的切割多核苷酸;编码膜锚多肽的锚多核苷酸;第二IRES多核苷酸。
在一个实例中,本文所公开的表达系统包含选自由以下组成的组的任一序列:SEQID NO:150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205和206。在一个实例中,表达系统包含SEQ ID NO:170。在另一个实例中,表达系统包含SEQ ID NO:154。在另一个实例中,表达系统包含SEQ ID NO:168。在另一个实例中,表达系统包含SEQ ID NO:166。在另一个实例中,表达系统包含SEQ ID NO:169。在另一个实例中,表达系统包含SEQ ID NO:153。在另一个实例中,表达系统包含SEQ ID NO:167。在另一个实例中,表达系统包含SEQ ID NO:165。
提供了包含如本文所公开的表达系统的载体。如本文所用,术语“载体”是指在宿主细胞中转运和表达靶基因的手段,通常是核酸。例如,载体可包括质粒载体、粘粒载体或病毒载体,例如噬菌体载体、腺病毒载体、逆转录病毒载体和腺相关病毒载体。可通过操纵本领域已知的质粒、噬菌体或病毒来制备重组载体。
还提供了包含本文公开的表达系统或载体的宿主细胞。宿主细胞可以是原核或真核宿主细胞。能够稳定持续地克隆或表达所述表达系统或载体的宿主细胞可以是本领域已知的任何宿主细胞。
还提供了包含本文公开的表达系统、载体或宿主细胞的试剂盒。试剂盒可进一步包含但不限于本领域已知的缓冲液(buffer)或细胞培养基。
本文公开的表达系统可用于检测样品中分泌抗体和/或表面结合抗体的存在的方法中。在一个实例中,用于检测样品中一种或多种分泌抗体和/或一种或多种表面结合抗体的存在的方法包括:提供如本文公开的表达系统;将所述表达系统递送至一种或多种靶细胞,其中所述靶细胞转录所述表达系统,其中一旦转录,所述第一切割位点在第一多个所述抗原结合分子的第一部分中被切割,使得所述第一多个所述抗原结合分子的第一部分不包含所述膜锚多肽,并由此由所述靶细胞分泌,并且其中所述第一和第二切割位点在抗原结合分子的第二多个第一部分中不被切割,使得第二多个所述抗原结合分子的第一部分包含所述膜锚多肽,并由此结合到所述靶细胞的表面;和检测由所述靶细胞分泌的所述第一多个所述抗原结合分子的第一部分的存在或不存在和/或检测所述靶细胞的表面上所述第二多个所述抗原结合分子的第一部分的量。
在另一个实例中,用于检测样品中一种或多种分泌抗体和/或一种或多种表面结合抗体的存在的方法包括:提供如本文公开的表达系统;将所述表达系统递送至一种或多种靶细胞,其中所述靶细胞转录所述表达系统,其中一旦转录,所述切割位点在第一多个所述抗原结合分子的第一部分中被切割,使得所述第一多个所述抗原结合分子的第一部分不包含所述膜锚多肽,并由此由所述靶细胞分泌,并且其中所述切割位点在第二多个所述抗原结合分子的第一部分中不被切割,使得所述第二多个所述抗原结合分子的第一部分包含所述膜锚多肽,并由此结合到所述靶分子的表面;和检测由所述靶细胞分泌的所述第一多个所述抗原结合分子的第一部分的存在或不存在和/或检测所述靶细胞的表面上所述第二多个所述抗原结合分子的第一部分的量。
因此,本文公开的表达系统、载体、宿主细胞或试剂盒具有不同的应用。在一个实例中,如本文所公开的表达系统、载体、宿主细胞或试剂盒用于抗体发现。在另一个实例中,本文公开的表达系统、载体、宿主细胞或试剂盒用于筛选抗体文库。在另一个实例中,本文公开的表达系统、载体、宿主细胞或试剂盒用于抗体人源化。在另一个实例中,如本文所公开的表达系统、载体、宿主细胞或试剂盒用于亲和力成熟。在另一个实例中,本文公开的表达系统、载体、宿主细胞或试剂盒用于抗体生产,包括但不限于单克隆抗体或多克隆抗体。
如本申请中所用,单数形式“一(a/an)”以及“该(所述)”包括复数个指示物,除非上下文中另外明确指明。例如,术语“遗传标记”包括多个遗传标记,包括它们的混合物和组合。
如本文所用,术语“增加”和“减少”是指群体亚集中所选性状或特征相比于整个群体中存在的所选性状或特征的相对改变。因此,增加表示正比例变化,而减少表示负比例变化。如本文所用,术语“变化”还指分离群体子集的所选性状或特征与作为整体的群体中的相同性状或特征相比之间的差异。但是,该术语无对所见差异的评估。
如本文所用,在物质浓度、物质大小、时间长度或其他设定值的上下文中的术语“约”是指设定值的+/-5%,或设定值的+/-4%,或设定值的+/-3%,或设定值的+/-2%,或设定值的+/-1%,或设定值的+/-0.5%。
在整个本公开中,某些实施方案可以以范围形式公开。应当理解,范围格式的描述仅仅是为了方便和简洁,不应理解为对所公开范围的范围的硬性限制。因此,应该认为范围的描述已经具体公开了该范围内的所有可能的子范围以及各个数值。例如,范围例如从1至6的描述应当被认为是具有具体公开的子范围,例如从1至3、从1至4、从1至5、从2至4、从2至6、从3至6等,以及该范围内的单独数字,例如1、2、3、4、5和6。无论范围的广度如何,这都适用。
本文示例性描述的发明可以适当地在本文中未具体公开的任何一种或多种要素、一种或多种限制不存在的情况下实施。因此,例如,术语“包含”、“包括”、“含有”等应被宽泛地解读且无限制。另外,这里使用的术语和表达是被用作描述术语而非限制的,并且无意使用这些术语和表达来排除所示和所描述的特征的任何等同或其部分,而应认识到,在所要求保护的本发明范围内,各种修改是可能的。因此,应当理解的是,虽然本发明已经通过优选实施方案以及任选的特征进行特定的公开,但本领域技术人员可以利用本文所公开于其中的发明的修饰及变化,且认为这样的修饰及变化在本发明的范围内。
本发明在此已被广泛地和一般性地描述。属于一般公开内容的每个更窄的种类和亚一般的组也构成本发明的一部分。这包括对本发明的一般性描述,其条件或负面限制是将任何主题从该类中移除,而不管所去除的材料是否在本文中具体叙述。
其他实施方案在所附权利要求和非限制性实施例内。另外,在根据马库什组描述本发明的特征或方面的情况下,本领域技术人员将认识到,本发明也因此以马库什组的任何单个成员或成员亚组进行描述。
实验部分
材料与方法
生成用于单基因整合的CHO主克隆
用于展示和分泌抗体的主克隆需要有单一整合位点,其能够提供稳定和高抗体表达,并允许抗体基因的有效靶向整合。图2总结了生成这种主克隆的过程。贴壁CHO K1细胞(ATCC)适应悬浮在由50%HyQ PF(GE Healthcare Life Sciences)和50%CD CHO(ThermoFisher Scientific)组成的无蛋白培养基(维持培养基)中,所述培养基补充有1g/L碳酸钠(Sigma)、6mM谷氨酰胺(Sigma)和0.1%Pluronic F-68(Thermo Fisher Scientific)。
为了开发CHO主克隆,用pTag载体转染悬浮的CHO K1细胞,其中pTag载体包含EGFP报告基因和由EMCV IRES变体(IRESv18)连接的吉欧霉素抗性基因。EGFP-IRES-Zeo盒的两侧是FLP重组酶识别位点、突变型FRT变体(F3)和野生型FRT(Fwt)。将缺乏ATG的嘌呤霉素抗性基因置于Fwt的下游,以便将来选择正确的盒交换。在含有吉欧霉素的培养基中选择转染的细胞以生成稳定转染池。稳定转染池通过荧光激活细胞分选(FACS)富集高EGFP产生细胞。使用有限稀释法分离克隆,并通过荧光激活细胞分选(FACS)筛选高EGFP表达,并通过DNA印迹法分析pTag载体的一个拷贝的整合。原代主克隆Z2A4被确认有pTag的一个拷贝。用含有潮霉素抗性基因的pExchange载体和表达Flpe的载体共转染该原代主克隆。在含有潮霉素的培养基中选择转染的细胞。GFP基因被潮霉素抗性基因取代的细胞在选择中存活下来。再次进行有限稀释,鉴定出含有潮霉素抗性基因的一个拷贝的主克隆Z2A4-18。通过DNA印迹和靶向基因座扩增分析证实了单基因整合。
用于维持CHO K1主克隆的细胞培养和培养基
CHO K1主克隆在37℃下在8%CO2下在加湿Kuhner摇床(Adolf Kühner AG)中在无蛋白培养基(维持培养基)中生长,该培养基由50%HyQ PF(GE Healthcare LifeSciences)和50%CD CHO(Thermo Fisher Scientific)组成,补充有1g/L碳酸钠(Sigma),6mM谷氨酰胺(Sigma)和0.1%Pluronic F-68(Thermo Fisher Scientific)。通过在125mL摇瓶(Corning)中的15mL新鲜培养基中以3×105细胞/mL的密度接种细胞,每3至4天进行一次常规传代培养。在Vi-Cell XR活力分析仪(Beckman Coulter)上通过台盼蓝排除法测定细胞密度和活力。
通过重组酶介导的盒交换(RMCE)生成稳定转染池
使用Amaxa SG细胞系4D-Nucleofector X试剂盒和程序FF-137(Lonza),用一个或两个合适的靶向载体和表达FLPe的载体共转染CHO K1主克隆。在每次转染中,用5μg靶向质粒载体和5μg FLPe质粒载体(呈环状形式)转染1×107个细胞。然后将转染的细胞重新悬浮在预装在6孔悬浮培养板(NUNC)中的2mL维持培养基中,并在静态Incusafe培养箱(Sanyo)中孵育。转染后24小时,通过离心(100×g,5分钟)收集它们,并在8%CO2在37℃在加湿Kuhner摇床(Adolf Kühner AG)中的125mL摇瓶中的15mL无蛋白维持培养基中重新悬浮。四天后,转染的细胞在含有20μg/mL嘌呤霉素(InvivoGen)的维持培养基中进行选择。通过每3至4天在选择培养基中传代,选择持续两周。当细胞活力恢复超过95%时,认为稳定转染的细胞池已建立。
表达抗体的稳定池的生长和生产率的表征
稳定转染的表达抗体的细胞池通过在50mL离心管(TPP)中以3×105个细胞/mL的活细胞密度接种30mL培养物在加湿Kuhner摇床(Adolf Kühner AG)上在8%CO2在37℃进行14天的补料分批生产。在第3、5、7、9和11天添加3mL Ex-Cell Advanced CHO Feed 1(含葡萄糖)(Sigma)。当葡萄糖水平在补料分批培养过程中降至2g/L以下时,添加400μL 45%(w/v)D-葡萄糖(Sigma)。在第3、5、7、9、11和14天分别使用Vi-Cell XR活力分析仪(BeckmanCoulter)和IMMAGE 800免疫化学系统(Beckman Coulter)监测细胞密度、活力和抗体滴度。IMMAGE 800免疫化学系统利用抗人Fc区抗体进行IgG定量。培养物指数期的特定mAb生产率(qP)计算为第7天的mAb浓度除以基于梯形法确定的积分活细胞密度(IVCD)。
蛋白A纯化
在配备280nm和254nm紫外检测器的
Figure BDA0004158610070000301
AVANT上,使用填充有MabSelect SuRe的Tricorn 10/150柱对收获的培养物上清液进行纯化。在加载样品之前,使用pH 7.4的Dulbecco PBS对柱进行平衡。将培养物过滤(0.22μm),在装入柱之前不调整pH。使用100mM乙酸钠(乙酸和氢氧化钠)在pH 3.6下进行洗脱。用1M Tris碱缓冲液将纯化的样品中和至pH 6.0。流速设置为5.0mL/min。使用超滤浓缩器Vivaspin 20、3000MWCO PES将纯化样品浓缩至大于15mg/mL的浓度。使用摆动桶在2200g和4℃下进行离心。
SDS PAGE分析
在对纯化的mAb进行SDS-PAGE分离之前,通过在25mM还原剂DTT(Bio-RadLaborotories,161-0611)存在下(对于还原性凝胶)和在还原剂不存在下(对于非还原性凝胶)在1XLaemmli缓冲液[62.5mM Tris-HCl,pH 6.8,10.5%甘油(BDH,101186),2%SDS(BioRad,161-0148),0.01%溴酚蓝(PlusOne,17-1329-01)中在95℃下煮沸10分钟来变性4μg每个纯化的mAb样品。还原的和非还原的变性mAb蛋白样品通过Bio-Rad Mini-
Figure BDA0004158610070000302
TGXTM聚丙烯酰胺预制凝胶(4-15%)在200伏特下分离30分钟,并用0.1%考马斯蓝R-250(Pierce,20278)在50%甲醇、10%乙酸、40%H2O(V/V)中染色。将凝胶用10%甲醇、5%乙酸和30%乙醇脱色,然后在Imagescanner III(GE Healthcare)上扫描。
免疫荧光染色和流式细胞术分析
为确定细胞表面的抗体展示水平,从使用不同双重展示和分泌靶向载体产生的稳定转染池中在指数生长期收集含有1×107个细胞的培养物上清液。然后将培养上清液在400g离心5分钟以完全去除上清液。使用500μL冷PBS通过上下吹打多次重新悬浮细胞沉淀,然后再次离心以去除PBS溶液。随后,将细胞重新悬浮在500uL的山羊中产生的抗人IgG(γ链特异性)-FITC抗体(Sigma,F0132)中,该抗体在含有3%BSA(牛血清白蛋白)的PBS中稀释100倍,然后在4℃下在黑暗中孵育30分钟(在冰上)。接下来,将细胞溶液离心以除去溶液并使用PBS洗涤几次。最后,将细胞重新悬浮在500μL冷PBS中,并在BD FACSCalibur上进行流式细胞术分析。
实验结果
每个细胞整合一个基因拷贝和高水平抗体表达的主克隆验证
为了验证生成的主克隆Z2A4-18允许每个细胞有效整合一个基因拷贝,将其用pTarget-DsRed载体、pTarget-EGFP载体和表达Flpe的载体共转染(图3A-3C)。重组酶介导的盒交换(RMCE)使得能够用实现用DsRed和/或GFP替换HYG。在含有嘌呤霉素的培养基中进行选择,以确保只有具有正确交换的细胞才能存活。荧光激活细胞分选(FACS)分析表明,共转染池由0.1%至0.2%的同时表达DsRed和EGFP的细胞组成,表明超过99%的细胞仅表达所述基因中的任一个。
为了针对表达单克隆抗体和交换效率评估主克隆,将主克隆用含有DsRed、LC和HC的靶向载体pTarget-DsRedHER2(图4A)以及表达Flpe的载体使用重组酶介导的盒式交换(RMCE)过程进行共转染,如图3A中所述。在含有嘌呤霉素的培养基中选择前1.78%的细胞表达DsRed,在选择后97.70%的细胞表达DsRed(图4B),表明交换效率接近2%。选择后靶向的池的细胞密度峰值达到1.8E7个细胞/mL,培养结束时的抗体滴度为380mg/L(图4C)。
用于同时展示和分泌全长IgG抗体的载体设计
接下来,设计了一组靶向载体,其中通过RMCE测试了CHO细胞中全长IgG抗体的展示和分泌(图5A和5B)。对照载体通过使用内部核糖体进入位点(IRES)在一个转录物中表达抗体轻链(LC)和重链(HC)基因。GPI载体的设计与对照载体相似,除了HC基因与膜锚相连。其他靶向载体被设计为HC基因通过单独的弗林蛋白酶切割序列RRKR(SEQ ID NO:3)、单独的2A肽或RRKR-2A肽组合与膜锚连接。弗林蛋白酶是一种重组的、普遍存在的枯草杆菌蛋白酶样前蛋白转化酶,具有R-X-K-R(SEQ ID NO:1)或R-X-R-R(SEQ ID NO:2)的最小切割序列,并且蛋白质的切割发生在高尔基体中。2A肽含有大约20个氨基酸,“自切割”在最后两个氨基酸(甘氨酸和脯氨酸)之间共翻译地发生。已从病毒中鉴定出许多类型的2A肽。不同的2A肽具有不同的切割效率。2A和弗林蛋白酶的切割效率也影响其侧翼氨基酸。
没有膜锚的对照靶向载体将抗体高水平分泌到培养基中,但在细胞表面上展示的抗体很少(图5C)。相比之下,GPI载体具有高展示水平的抗体但无抗体分泌。RRKR-GPI载体显示出比GPI载体更高的展示水平,但没有抗体分泌。来自GPI的侧翼氨基酸可以抑制弗林蛋白酶在RRKR(SEQ ID NO:3)处的切割。通过所有四种2A肽将HC与GPI连接起来,导致以不同的比率的展示和分泌。与对照载体表达的相比,这些载体分泌的HC多肽具有更大的尺寸(图5C)。肽作图分析表明它们附接有2A或2A-GPI残基。较高的分泌和较低的展示表明2A肽的切割效率较高。结果表明,在不同的2A肽中,E2A的切割效率最高,其次是T2A、F2A和P2A。使用RRKR-2A连接HC和膜锚导致P2A、E2A和T2A的分泌较高和展示较少,但对于E2A不是这样。RRKR-P2A-GPI、RRKR-F2A-GPI和RRKR-T2A-GPI的分泌水平已增加到接近对照载体的水平。从RRKR-F2A-GPI、RRKR-T2A-GPI和RRKR-T2A-GPI载体分泌的HC多肽仍然含有显著比例的与2A或2A-GPI残基相连的种类。只有RRKR-P2A-GPI载体产生的抗体没有错误的种类(图5C)。然而,该载体的展示水平太低,无法将染色细胞与空白细胞分开。
工程化P2A肽和弗林蛋白酶识别序列,用于调节膜结合抗体比分泌抗体的比率
为了增加来自RRKR-P2A-GPI载体的展示抗体比分泌抗体的比率,产生了P2A的点突变,其中点突变包括甘氨酸、脯氨酸或丙氨酸的单个残基(图6)。脯氨酸和甘氨酸影响二级结构,分别限制或提供肽链的高柔性。相反,丙氨酸对二级结构的影响很小。测试了另一组含有具有相同突变的P2A的靶向载体,以了解突变如何影响P2A的切割效率。与野生型P2A相比,A1G、T2G、A1P、T2P、N3P、F4P、S5P、N3A和F4A这九个点突变增加了来自RRKR-P2A-GPI载体的展示水平。表2中提供了表达水平。增加的水平取决于突变而不同。A1P和T2G将GPI载体的展示水平增加到80%和50%。包含这两个突变的RRKR-P2A-GPI的分泌产物包含不正确的产物。肽作图分析表明,大多数不正确的种类是与P2A残基相连的HC多肽,一小部分与P2A-GPI残基相连。包含其他7个突变的RRKR-P2A-GPI载体将GPI载体的展示水平增加了9%到20%。来自这些载体的分泌的HC多肽具有正确的大小。然而,肽作图分析表明一小部分种类附接有2A和2A-GPI残基。正如P2A-GM载体分泌减少所表明的,许多点突变降低了P2A的切割效率。然而,这些突变并未增加来自F-P2A-GM载体的展示,表明这些突变仅影响P2A的切割效率。在RRKR(SEQ ID NO:3)处的切割仍然导致从HC去除GPI和抗体分泌。增加来自RRKR-P2A-GPI载体的展示水平的9个突变可归因于它们对RRKR(SEQ ID NO:3)和P2A两者处的切割效率的影响。
表2.通过归一化几何平均荧光强度(GMFI)值测量的膜结合抗原结合分子的水平、分泌的抗原结合分子的水平和具有基于图6的相关点突变的表达系统的存在。
Figure BDA0004158610070000331
Figure BDA0004158610070000341
具有增加来自F-P2A-GM载体的展示水平的点突变的9个被鉴定的变体位于P2A第一个到第五个氨基酸处。表明R-X-K-R(SEQ ID NO:1)或R-X-R-R(SEQ ID NO:2)下游的5个侧翼氨基酸是保守的,并且可能在决定弗林蛋白酶切割效率方面发挥作用。为了了解具有点突变的9个变体如何影响弗林蛋白酶切割效率,构建了一组具有通过弗林蛋白酶切割序列变体与GPI连接的重链(HC)的靶向载体。这些弗林蛋白酶切割序列变体-GPI载体或变体表达系统包含来自RRKR(SEQ ID NO:3)下游P2A变体的N末端的前5个氨基酸。变体表达系统是:RRKR-(ATNFS)-GPI、RRKR-(GTNFS)-GPI、RRKR-(ATNAS)-GPI、RRKR-(ATPFS)-GPI、RRKR-(ATAFS)-GPI、RRKR-(ATNPS)-GPI、RRKR-(ATNFP)-GPI、RRKR-(APNFS)-GPI、RRKR-(AGNFS)-GPI、RRKR-(PTNFS)-GPI。包含相同突变的RRKR-P2A-GPI载体或主要表达系统被包括在内以进行比较。RRKR-P2A-GPI载体是RRKR-(ATNFS)P2A-GPI、RRKR-(GTNFS)P2A-GPI、RRKR-(ATNAS)P2A-GPI、RRKR-(ATPFS)P2A-GPI、RRKR-(ATAFS)P2A-GPI、RRKR-(ATNPS)P2A-GPI、RRKR-(ATNFP)P2A-GPI、RRKR-(APNFS)P2A-GPI、RRKR-(AGNFS)P2A-GPI、RRKR-(PTNFS)P2A-GPI(图7A)。与RRKR-GPI载体相比,所有弗林蛋白酶切割序列变体-GPI载体都表现出分泌增加和展示减少(图7B)。不同的弗林蛋白酶切割序列变体控制着不同水平的展示比分泌比率。分泌水平和展示水平的相对变化与来自包含相同突变的RRKR-P2A-GPI载体的变化密切相关,除了RRKR-GTNFS(SEQ ID NO:62)和RRKR-APNFS(SEQ ID NO:68)。含有这两种弗林蛋白酶切割序列变体RRKR-GTNFS(SEQ ID NO:62)和RRKR-APNFS(SEQ ID NO:68)的靶向载体比其含有RRKR-(GTNFS)P2A和RRKR-(APNFS)P2A的相应靶向载体的展示水平高,为约5倍和3倍。相应地,与含有RRKR-(GTNFS)P2A和RRKR-(APNFS)P2A的相应靶向载体相比,来自含有这两种弗林蛋白酶切割序列变体的靶向载体的分泌水平下降,但下降幅度小于展示增加的水平。含有弗林蛋白酶切割序列变体的靶向载体和含有在P2A中具有相应点突变的RRKR-P2A的靶向载体之间展示和分泌水平变化的良好相关性表明P2A中的点突变主要影响在RRKR处的切割效率而不是在P2A处的切割效率。包含RRKR-GTNFS和RRKR-APNFS的靶向载体与其对应的包含RRKR-(GTNFS)P2A和RRKR-(APNFS)P2A的靶向载体之间展示和分泌水平变化的差异表明A1G和T2P的点突变影响RRKR和P2A两者处的切割效率。从包含RRKR-AGNFS-GPI和RRKR-PTNFS-GPI的靶向载体表达的HC多肽包含分子量大于对照HC多肽的种类。肽做图分析表明,来自RRKR-AGNFS-GPI载体的一小部分HC多肽与GPI相连。培养基中这些不正确种类的出现可能是由于细胞死亡。其他7种弗林蛋白酶切割序列变体给出了HC多肽的正确分子量。肽作图分析证实,来自RRKR-GTNFS-GPI载体的所有分泌HC多肽都具有正确的氨基酸序列。
同时展示和分泌系统对于抗体人源化的应用
本文公开的表达系统具有不同的应用。例如,该表达系统可用于抗体发现,可替代杂交瘤和单B细胞克隆以从免疫小鼠中产生抗体。这使得可以从人血液中快速鉴定和生产用于治疗传染病(例如COVID-19)的抗体。
本文公开的表达系统也可用于抗体人源化和亲和力成熟,以及抗体生产。该表达系统允许快速开发细胞系以生产单克隆抗体。这可以允许开发用于同源生产多克隆抗体的细胞系,例如用于治疗免疫缺陷病的重组IVIG。
讨论
开发了一种哺乳动物表达系统,以允许以不同比率同时细胞表面展示和分泌相同的蛋白质(图1A和5A)。该系统由CHO主克隆和一组靶向表达载体组成,这允许蛋白质以不同比率的同时展示和分泌。CHO主克隆包含预定的整合位点,其允许通过重组酶介导的盒交换(RMCE)进行一个质粒载体拷贝/细胞的位点特异性整合。每个靶向载体都携带由EMCV IRES连接的抗体轻链(LC)基因和重链(HC)基因。重链(HC)基因通过最小弗林蛋白酶识别序列RXKR(SEQ ID NO:1)或RXRR(SEQ ID NO:2)与2A肽或其片段的组合与膜锚连接。RRKR-2A连接的HC和膜锚在一个开放阅读框中翻译。
在最小弗林蛋白酶识别序列和2A肽处二者进行切割会产生不附接2A残基和膜锚的重链(HC)多肽,其与轻链(LC)多肽组装形成分泌型抗体。在2A而不是RRKR处的切割导致分泌的不正确的抗体,其中HC多肽与2A残基附接。在2A和最小弗林蛋白酶识别序列二者的不完全切割导致重链(HC)多肽与膜锚融合,其与轻链(LC)多肽组装形成膜结合抗体。获得抗体的展示比分泌的不同比率需要在不同水平控制弗林蛋白酶和2A的切割效率。
此外,需要以比在2A肽更高的效率控制在最小弗林蛋白酶识别序列的切割,以确保分泌的抗体不会将2A残基附接到HC多肽的C末端。已从病毒中鉴定出许多类型的2A肽。不同的2A肽具有不同的切割效率。2A和最小弗林蛋白酶识别序列的切割效率也受其侧翼氨基酸序列的影响。针对抗体的同时展示和分泌,筛选了最小弗林蛋白酶识别序列和不同类型的2A肽的不同组合。结果表明,E2A的切割效率最高,其次是T2A、F2A和P2A。在一个实例中,包含RRKR-P2A组合的靶向载体分泌正确的抗体,其没有2A残基连接到HC多肽。然而,来自带有野生型P2A肽的载体的展示水平太低,无法用于筛选抗体结合亲和力。为了增加细胞表面抗体与分泌抗体的相对量,通过点突变生成了一组具有不同切割效率的P2A变体。观察到P2A的前五个氨基酸对于弗林蛋白酶和P2A二者的切割效率是关键的。九个特异性点突变,A1G,T2G,A1P,T2P,N3P,F4P,S5P,N3A和F4A,以不同的效率抑制弗林蛋白酶和P2A的切割,增加了展示水平,范围为将HC直接与膜锚连接的对照载体的9%到80%。来自分别含有A1P和T2G的两个靶向载体的分泌产物(其最高展示水平为对照载体的80%和50%)由于在RRKR切割低于在P2A的切割而含有不正确的产物,其中2A残基与HC多肽相连。所有包含其他点突变的靶向载体都分泌正确的抗体产物。前五个氨基酸到其他氨基酸的点突变或其他位点的突变对RRKR(SEQ ID NO:3)和P2A处切割二者的切割没有影响或仅抑制P2A的切割。包含这些突变的靶向载体没有改变展示水平,因为膜锚仍然可以通过RRKR处的切割去除。为了涵盖更广泛的展示比分泌比率并确保分泌正确的产物,对主要和变体表达系统的文库进行高通量筛选,其中P2A的前五个氨基酸被随机化以鉴定在RRKR和P2A处具有受控切割效率的变体(图7A)。
使用RRKR-P2A的表达系统使得能够在2A残基不连接到重链(HC)多肽的情况下实现产物分泌。该表达系统还具有以与通过使用最小弗林蛋白酶识别序列获得的展示水平可比或甚至更高的展示水平获得更高分泌的优势。这是因为弗林蛋白酶切割发生在高尔基体。膜锚与HC多肽的连接可导致ER的不正确折叠,从而导致未折叠蛋白反应(UPR),并且因此导致补料分批培养中的细胞更早死亡。相比之下,2A“自切割”是共翻译地发生的。在进入ER之前去除一些HC多肽上的膜锚可以减少ER应激,从而提高补料分批培养中的活力和分泌的抗体滴度。
与其他表达系统相比,本公开的表达系统允许同时展示和分泌抗体。本公开的表达系统中P2A的一些点突变也显示增加的展示水平,因为这些突变抑制了在RRKR和P2A两者处的切割。通过弗林蛋白酶切割序列变体(通过包含P2A变体的前5个氨基酸设计)连接重链(HC)和膜锚,这允许不同比率的分泌和展示。与其他表达系统相比,它的优点是避免分泌具有附接至重链(HC)多肽的2A残基的错误产物。
总之,发明人开发了一个在一个系统中提供抗体发现和生产能力的平台技术。这样的平台由三个关键组成部分组成:1)包含预定基因组位点的CHO主克隆,其提供稳定和高水平的基因表达,2)靶向载体,其允许同时展示和分泌抗体,以及3)文库,其由不同的抗体组成(图1B)。通过将抗体文库克隆到靶向载体中以生成质粒文库,然后将其大量转染到CHO主细胞中,可以发现所期望的抗体。通过利用重组酶介导的盒交换(RMCE),每个主细胞都包含不同抗体的整合到预选基因组位点的一个DNA拷贝,从而创建表达许多不同分泌的IgG的混合物的CHO细胞文库。通过展示功能,可以通过基于FACS的高通量分选从该CHO细胞库中鉴定出呈递具有高结合亲和力、高特异性和良好可制造性的抗体的细胞。凭借分泌功能,鉴定出的呈递有希望抗体的CHO细胞可直接用作生产细胞系,以生产足够的材料用于可开发性评估和功能研究。因此,该平台提供了建立用于治疗性抗体的高速和低成本开发的简化流程的机会。
表3.本文引用的SEQ ID NO及其相应序列的详细信息。还提供了序列的简要描述。
Figure BDA0004158610070000381
/>
Figure BDA0004158610070000391
/>
Figure BDA0004158610070000401
/>
Figure BDA0004158610070000411
/>
Figure BDA0004158610070000421
/>
Figure BDA0004158610070000431
/>
Figure BDA0004158610070000441
/>
Figure BDA0004158610070000451
/>
Figure BDA0004158610070000461
/>
Figure BDA0004158610070000471
/>
Figure BDA0004158610070000481
/>
Figure BDA0004158610070000491
/>
Figure BDA0004158610070000501
/>
Figure BDA0004158610070000511
/>
Figure BDA0004158610070000521
/>
Figure BDA0004158610070000531
/>
Figure BDA0004158610070000541
/>
Figure BDA0004158610070000551
/>
Figure BDA0004158610070000561
/>
Figure BDA0004158610070000571
/>
Figure BDA0004158610070000581
/>
序列表
<110> 新加坡科技研究局
<120> 用于蛋白质生产和筛选的表达系统
<130> 72683PCT
<150> SG10202009841Y
<151> 2020-10-02
<160> 206
<170> PatentIn 3.5版
<210> 1
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 示例性最小弗林蛋白酶切割共有序列
<220>
<221> 尚未归类的特征
<222> (2)..(2)
<223> Xaa 可以是任何天然存在的氨基酸
<400> 1
Arg Xaa Lys Arg
1
<210> 2
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 示例性最小弗林蛋白酶切割共有序列
<220>
<221> 尚未归类的特征
<222> (2)..(2)
<223> Xaa 可以是任何天然存在的氨基酸
<400> 2
Arg Xaa Arg Arg
1
<210> 3
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 示例性最小弗林蛋白酶切割共有序列
<400> 3
Arg Arg Lys Arg
1
<210> 4
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 示例性最小弗林蛋白酶切割共有序列
<400> 4
Arg Arg Arg Arg
1
<210> 5
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 示例性最小弗林蛋白酶切割共有序列
<400> 5
Arg Ser Lys Arg
1
<210> 6
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 示例性最小弗林蛋白酶切割共有序列
<400> 6
Arg Ser Arg Arg
1
<210> 7
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 示例性最小弗林蛋白酶切割共有序列
<400> 7
Arg Lys Lys Arg
1
<210> 8
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 示例性最小弗林蛋白酶切割共有序列
<400> 8
Arg Lys Arg Arg
1
<210> 9
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 示例性最小弗林蛋白酶切割共有序列
<400> 9
Arg Gln Lys Arg
1
<210> 10
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 示例性最小弗林蛋白酶切割共有序列
<400> 10
Arg Gln Arg Arg
1
<210> 11
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 示例性最小弗林蛋白酶切割共有序列
<400> 11
Arg Thr Lys Arg
1
<210> 12
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 示例性最小弗林蛋白酶切割共有序列
<400> 12
Arg Thr Arg Arg
1
<210> 13
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 示例性最小弗林蛋白酶切割共有序列
<400> 13
Arg Glu Lys Arg
1
<210> 14
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 示例性最小弗林蛋白酶切割共有序列
<400> 14
Arg Glu Arg Arg
1
<210> 15
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 示例性最小弗林蛋白酶切割共有序列
<400> 15
Arg Asp Lys Arg
1
<210> 16
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 示例性最小弗林蛋白酶切割共有序列
<400> 16
Arg Asp Arg Arg
1
<210> 17
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 示例性最小弗林蛋白酶切割共有序列
<400> 17
Arg His Lys Arg
1
<210> 18
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 示例性最小弗林蛋白酶切割共有序列
<400> 18
Arg His Arg Arg
1
<210> 19
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 示例性最小弗林蛋白酶切割共有序列
<400> 19
Arg Phe Lys Arg
1
<210> 20
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 示例性最小弗林蛋白酶切割共有序列
<400> 20
Arg Phe Arg Arg
1
<210> 21
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 示例性最小弗林蛋白酶切割共有序列
<400> 21
Arg Ala Lys Arg
1
<210> 22
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 示例性最小弗林蛋白酶切割共有序列
<400> 22
Arg Ala Arg Arg
1
<210> 23
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 示例性最小弗林蛋白酶切割共有序列
<400> 23
Arg Asn Lys Arg
1
<210> 24
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 示例性最小弗林蛋白酶切割共有序列
<400> 24
Arg Asn Arg Arg
1
<210> 25
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 示例性最小弗林蛋白酶切割共有序列
<400> 25
Arg Cys Lys Arg
1
<210> 26
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 示例性最小弗林蛋白酶切割共有序列
<400> 26
Arg Cys Arg Arg
1
<210> 27
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 示例性最小弗林蛋白酶切割共有序列
<400> 27
Arg Gly Lys Arg
1
<210> 28
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 示例性最小弗林蛋白酶切割共有序列
<400> 28
Arg Gly Arg Arg
1
<210> 29
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 示例性最小弗林蛋白酶切割共有序列
<400> 29
Arg Ile Lys Arg
1
<210> 30
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 示例性最小弗林蛋白酶切割共有序列
<400> 30
Arg Ile Arg Arg
1
<210> 31
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 示例性最小弗林蛋白酶切割共有序列
<400> 31
Arg Leu Lys Arg
1
<210> 32
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 示例性最小弗林蛋白酶切割共有序列
<400> 32
Arg Leu Arg Arg
1
<210> 33
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 示例性最小弗林蛋白酶切割共有序列
<400> 33
Arg Met Lys Arg
1
<210> 34
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 示例性最小弗林蛋白酶切割共有序列
<400> 34
Arg Met Arg Arg
1
<210> 35
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 示例性最小弗林蛋白酶切割共有序列
<400> 35
Arg Pro Lys Arg
1
<210> 36
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 示例性最小弗林蛋白酶切割共有序列
<400> 36
Arg Pro Arg Arg
1
<210> 37
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 示例性最小弗林蛋白酶切割共有序列
<400> 37
Arg Trp Lys Arg
1
<210> 38
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 示例性最小弗林蛋白酶切割共有序列
<400> 38
Arg Trp Arg Arg
1
<210> 39
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 示例性最小弗林蛋白酶切割共有序列
<400> 39
Arg Tyr Lys Arg
1
<210> 40
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 示例性最小弗林蛋白酶切割共有序列
<400> 40
Arg Tyr Arg Arg
1
<210> 41
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 示例性最小弗林蛋白酶切割共有序列
<400> 41
Arg Val Lys Arg
1
<210> 42
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 示例性最小弗林蛋白酶切割共有序列
<400> 42
Arg Val Arg Arg
1
<210> 43
<211> 19
<212> PRT
<213> 人工序列
<220>
<223> P2A氨基酸序列(野生型)
<400> 43
Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn
1 5 10 15
Pro Gly Pro
<210> 44
<211> 24
<212> PRT
<213> 人工序列
<220>
<223> F2A氨基酸序列(野生型)
<400> 44
Ala Pro Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly
1 5 10 15
Asp Val Glu Ser Asn Pro Gly Pro
20
<210> 45
<211> 20
<212> PRT
<213> 人工序列
<220>
<223> E2A氨基酸序列(野生型)
<400> 45
Gln Cys Thr Asn Tyr Ala Leu Leu Lys Leu Ala Gly Asp Val Glu Ser
1 5 10 15
Asn Pro Gly Pro
20
<210> 46
<211> 18
<212> PRT
<213> 人工序列
<220>
<223> T2A氨基酸序列(野生型)
<400> 46
Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro
1 5 10 15
Gly Pro
<210> 47
<211> 57
<212> DNA
<213> 人工序列
<220>
<223> P2A核苷酸序列(野生型)
<400> 47
gctactaact tcagcctgct gaagcaggct ggagacgtgg aggagaaccc tgggccc 57
<210> 48
<211> 72
<212> DNA
<213> 人工序列
<220>
<223> F2A核苷酸序列(野生型)
<400> 48
gcaccggtga aacagacttt gaattttgac cttctgaagt tggcaggaga cgttgagtcc 60
aaccctgggc cc 72
<210> 49
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> E2A核苷酸序列(野生型)
<400> 49
cagtgtacta attatgctct cttgaaattg gctggagatg ttgagagcaa ccctgggccc 60
<210> 50
<211> 54
<212> DNA
<213> 人工序列
<220>
<223> T2A核苷酸序列(野生型)
<400> 50
gagggcagag gaagtctgct aacatgcggt gacgtcgagg agaatcctgg gccc 54
<210> 51
<211> 5
<212> PRT
<213> 人工序列
<220>
<223> 示例性P2A片段序列
<400> 51
Ala Thr Asn Phe Ser
1 5
<210> 52
<211> 5
<212> PRT
<213> 人工序列
<220>
<223> 具有A1G突变的示例性P2A片段序列
<400> 52
Gly Thr Asn Phe Ser
1 5
<210> 53
<211> 5
<212> PRT
<213> 人工序列
<220>
<223> 具有F4A突变的示例性P2A片段序列
<400> 53
Ala Thr Asn Ala Ser
1 5
<210> 54
<211> 5
<212> PRT
<213> 人工序列
<220>
<223> 具有N3P突变的示例性P2A片段序列
<400> 54
Ala Thr Pro Phe Ser
1 5
<210> 55
<211> 5
<212> PRT
<213> 人工序列
<220>
<223> 具有N3A突变的示例性P2A片段序列
<400> 55
Ala Thr Ala Phe Ser
1 5
<210> 56
<211> 5
<212> PRT
<213> 人工序列
<220>
<223> 具有F4P突变的示例性P2A片段序列
<400> 56
Ala Thr Asn Pro Ser
1 5
<210> 57
<211> 5
<212> PRT
<213> 人工序列
<220>
<223> 具有S5P突变的示例性P2A片段序列
<400> 57
Ala Thr Asn Phe Pro
1 5
<210> 58
<211> 5
<212> PRT
<213> 人工序列
<220>
<223> 具有T2P突变的示例性P2A片段序列
<400> 58
Ala Pro Asn Phe Ser
1 5
<210> 59
<211> 5
<212> PRT
<213> 人工序列
<220>
<223> 具有T2G突变的示例性P2A片段序列
<400> 59
Ala Gly Asn Phe Ser
1 5
<210> 60
<211> 5
<212> PRT
<213> 人工序列
<220>
<223> 具有A1P突变的示例性P2A片段序列
<400> 60
Pro Thr Asn Phe Ser
1 5
<210> 61
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 示例性弗林蛋白酶RRKR和P2A片段序列
<400> 61
Arg Arg Lys Arg Ala Thr Asn Phe Ser
1 5
<210> 62
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 具有A1G突变的示例性弗林蛋白酶RRKR和P2A片段序列
<400> 62
Arg Arg Lys Arg Gly Thr Asn Phe Ser
1 5
<210> 63
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 具有F4A突变的示例性弗林蛋白酶RRKR和P2A片段序列
<400> 63
Arg Arg Lys Arg Ala Thr Asn Ala Ser
1 5
<210> 64
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 具有N3P突变的示例性弗林蛋白酶RRKR和P2A片段序列
<400> 64
Arg Arg Lys Arg Ala Thr Pro Phe Ser
1 5
<210> 65
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 具有N3A突变的示例性弗林蛋白酶RRKR和P2A片段序列
<400> 65
Arg Arg Lys Arg Ala Thr Ala Phe Ser
1 5
<210> 66
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 具有F4P突变的示例性弗林蛋白酶RRKR和P2A片段序列
<400> 66
Arg Arg Lys Arg Ala Thr Asn Pro Ser
1 5
<210> 67
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 具有S5P突变的示例性弗林蛋白酶RRKR和P2A片段序列
<400> 67
Arg Arg Lys Arg Ala Thr Asn Phe Pro
1 5
<210> 68
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 具有T2P突变的示例性弗林蛋白酶RRKR和P2A片段序列
<400> 68
Arg Arg Lys Arg Ala Pro Asn Phe Ser
1 5
<210> 69
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 具有T2G突变的示例性弗林蛋白酶RRKR和P2A片段序列
<400> 69
Arg Arg Lys Arg Ala Gly Asn Phe Ser
1 5
<210> 70
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 具有A1P突变的示例性弗林蛋白酶RRKR和P2A片段序列
<400> 70
Arg Arg Lys Arg Pro Thr Asn Phe Ser
1 5
<210> 71
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 示例性弗林蛋白酶RRRR和P2A片段序列
<400> 71
Arg Arg Arg Arg Ala Thr Asn Phe Ser
1 5
<210> 72
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 具有A1G突变的示例性弗林蛋白酶RRRR和P2A片段序列
<400> 72
Arg Arg Arg Arg Gly Thr Asn Phe Ser
1 5
<210> 73
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 具有F4A突变的示例性弗林蛋白酶RRRR和P2A片段序列
<400> 73
Arg Arg Arg Arg Ala Thr Asn Ala Ser
1 5
<210> 74
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 具有N3P突变的示例性弗林蛋白酶RRRR和P2A片段序列
<400> 74
Arg Arg Arg Arg Ala Thr Pro Phe Ser
1 5
<210> 75
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 具有N3A突变的示例性弗林蛋白酶RRRR和P2A片段序列
<400> 75
Arg Arg Arg Arg Ala Thr Ala Phe Ser
1 5
<210> 76
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 具有F4P突变的示例性弗林蛋白酶RRKR和P2A片段序列
<400> 76
Arg Arg Arg Arg Ala Thr Asn Pro Ser
1 5
<210> 77
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 具有S5P突变的示例性弗林蛋白酶RRRR和P2A片段序列
<400> 77
Arg Arg Arg Arg Ala Thr Asn Phe Pro
1 5
<210> 78
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 具有T2P突变的示例性弗林蛋白酶RRRR和P2A片段序列
<400> 78
Arg Arg Arg Arg Ala Pro Asn Phe Ser
1 5
<210> 79
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 具有T2G突变的示例性弗林蛋白酶RRRR和P2A片段序列
<400> 79
Arg Arg Arg Arg Ala Gly Asn Phe Ser
1 5
<210> 80
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 具有A1P突变的示例性弗林蛋白酶RRRR和P2A片段序列
<400> 80
Arg Arg Arg Arg Pro Thr Asn Phe Ser
1 5
<210> 81
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 示例性弗林蛋白酶RXKR和P2A片段序列
<220>
<221> 尚未归类的特征
<222> (2)..(2)
<223> Xaa 可以是任何天然存在的氨基酸
<400> 81
Arg Xaa Lys Arg Ala Thr Asn Phe Ser
1 5
<210> 82
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 具有A1G突变的示例性弗林蛋白酶RXKR和P2A片段序列
<220>
<221> 尚未归类的特征
<222> (2)..(2)
<223> Xaa 可以是任何天然存在的氨基酸
<400> 82
Arg Xaa Lys Arg Gly Thr Asn Phe Ser
1 5
<210> 83
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 具有F4A突变的示例性弗林蛋白酶RXKR和P2A片段序列
<220>
<221> 尚未归类的特征
<222> (2)..(2)
<223> Xaa 可以是任何天然存在的氨基酸
<400> 83
Arg Xaa Lys Arg Ala Thr Asn Ala Ser
1 5
<210> 84
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 具有N3P突变的示例性弗林蛋白酶RXKR和P2A片段序列
<220>
<221> 尚未归类的特征
<222> (2)..(2)
<223> Xaa 可以是任何天然存在的氨基酸
<400> 84
Arg Xaa Lys Arg Ala Thr Pro Phe Ser
1 5
<210> 85
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 具有N3A突变的示例性弗林蛋白酶RXKR和P2A片段序列
<220>
<221> 尚未归类的特征
<222> (2)..(2)
<223> Xaa 可以是任何天然存在的氨基酸
<400> 85
Arg Xaa Lys Arg Ala Thr Ala Phe Ser
1 5
<210> 86
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 具有F4P突变的示例性弗林蛋白酶RXKR和P2A片段序列
<220>
<221> 尚未归类的特征
<222> (2)..(2)
<223> Xaa 可以是任何天然存在的氨基酸
<400> 86
Arg Xaa Lys Arg Ala Thr Asn Pro Ser
1 5
<210> 87
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 具有S5P突变的示例性弗林蛋白酶RXKR和P2A片段序列
<220>
<221> 尚未归类的特征
<222> (2)..(2)
<223> Xaa 可以是任何天然存在的氨基酸
<400> 87
Arg Xaa Lys Arg Ala Thr Asn Phe Pro
1 5
<210> 88
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 具有T2P突变的示例性弗林蛋白酶RXKR和P2A片段序列
<220>
<221> 尚未归类的特征
<222> (2)..(2)
<223> Xaa 可以是任何天然存在的氨基酸
<400> 88
Arg Xaa Lys Arg Ala Pro Asn Phe Ser
1 5
<210> 89
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 具有T2G突变的示例性弗林蛋白酶RXKR和P2A片段序列
<220>
<221> 尚未归类的特征
<222> (2)..(2)
<223> Xaa 可以是任何天然存在的氨基酸
<400> 89
Arg Xaa Lys Arg Ala Gly Asn Phe Ser
1 5
<210> 90
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 具有A1P突变的示例性弗林蛋白酶RXKR和P2A片段序列
<220>
<221> 尚未归类的特征
<222> (2)..(2)
<223> Xaa 可以是任何天然存在的氨基酸
<400> 90
Arg Xaa Lys Arg Pro Thr Asn Phe Ser
1 5
<210> 91
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 示例性弗林蛋白酶RXRR和P2A片段序列
<220>
<221> 尚未归类的特征
<222> (2)..(2)
<223> Xaa 可以是任何天然存在的氨基酸
<400> 91
Arg Xaa Arg Arg Ala Thr Asn Phe Ser
1 5
<210> 92
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 具有A1G突变的示例性弗林蛋白酶RXRR和P2A片段序列
<220>
<221> 尚未归类的特征
<222> (2)..(2)
<223> Xaa 可以是任何天然存在的氨基酸
<400> 92
Arg Xaa Arg Arg Gly Thr Asn Phe Ser
1 5
<210> 93
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 具有F4A突变的示例性弗林蛋白酶RXRR和P2A片段序列
<220>
<221> 尚未归类的特征
<222> (2)..(2)
<223> Xaa 可以是任何天然存在的氨基酸
<400> 93
Arg Xaa Arg Arg Ala Thr Asn Ala Ser
1 5
<210> 94
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 具有N3P突变的示例性弗林蛋白酶RXRR和P2A片段序列
<220>
<221> 尚未归类的特征
<222> (2)..(2)
<223> Xaa 可以是任何天然存在的氨基酸
<400> 94
Arg Xaa Arg Arg Ala Thr Pro Phe Ser
1 5
<210> 95
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 具有N3A突变的示例性弗林蛋白酶RXRR和P2A片段序列
<220>
<221> 尚未归类的特征
<222> (2)..(2)
<223> Xaa 可以是任何天然存在的氨基酸
<400> 95
Arg Xaa Arg Arg Ala Thr Ala Phe Ser
1 5
<210> 96
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 具有F4P突变的示例性弗林蛋白酶RXKR和P2A片段序列
<220>
<221> 尚未归类的特征
<222> (2)..(2)
<223> Xaa 可以是任何天然存在的氨基酸
<400> 96
Arg Xaa Arg Arg Ala Thr Asn Pro Ser
1 5
<210> 97
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 具有S5P突变的示例性弗林蛋白酶RXRR和P2A片段序列
<220>
<221> 尚未归类的特征
<222> (2)..(2)
<223> Xaa 可以是任何天然存在的氨基酸
<400> 97
Arg Xaa Arg Arg Ala Thr Asn Phe Pro
1 5
<210> 98
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 具有T2P突变的示例性弗林蛋白酶RXRR和P2A片段序列
<220>
<221> 尚未归类的特征
<222> (2)..(2)
<223> Xaa 可以是任何天然存在的氨基酸
<400> 98
Arg Xaa Arg Arg Ala Pro Asn Phe Ser
1 5
<210> 99
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 具有T2G突变的示例性弗林蛋白酶RXRR和P2A片段序列
<220>
<221> 尚未归类的特征
<222> (2)..(2)
<223> Xaa 可以是任何天然存在的氨基酸
<400> 99
Arg Xaa Arg Arg Ala Gly Asn Phe Ser
1 5
<210> 100
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 具有A1P突变的示例性弗林蛋白酶RXRR和P2A片段序列
<220>
<221> 尚未归类的特征
<222> (2)..(2)
<223> Xaa 可以是任何天然存在的氨基酸
<400> 100
Arg Xaa Arg Arg Pro Thr Asn Phe Ser
1 5
<210> 101
<211> 19
<212> PRT
<213> 人工序列
<220>
<223> 具有A1G突变的示例性P2A序列
<400> 101
Gly Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn
1 5 10 15
Pro Gly Pro
<210> 102
<211> 19
<212> PRT
<213> 人工序列
<220>
<223> 具有F4A突变的示例性P2A序列
<400> 102
Ala Thr Asn Ala Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn
1 5 10 15
Pro Gly Pro
<210> 103
<211> 19
<212> PRT
<213> 人工序列
<220>
<223> 具有N3P突变的示例性P2A序列
<400> 103
Ala Thr Pro Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn
1 5 10 15
Pro Gly Pro
<210> 104
<211> 19
<212> PRT
<213> 人工序列
<220>
<223> 具有N3A突变的示例性P2A序列
<400> 104
Ala Thr Ala Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn
1 5 10 15
Pro Gly Pro
<210> 105
<211> 19
<212> PRT
<213> 人工序列
<220>
<223> 具有F4P突变的示例性P2A序列
<400> 105
Ala Thr Asn Pro Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn
1 5 10 15
Pro Gly Pro
<210> 106
<211> 19
<212> PRT
<213> 人工序列
<220>
<223> 具有S5P突变的示例性P2A序列
<400> 106
Ala Thr Asn Phe Pro Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn
1 5 10 15
Pro Gly Pro
<210> 107
<211> 19
<212> PRT
<213> 人工序列
<220>
<223> 具有T2P突变的示例性P2A序列
<400> 107
Ala Pro Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn
1 5 10 15
Pro Gly Pro
<210> 108
<211> 19
<212> PRT
<213> 人工序列
<220>
<223> 具有T2G突变的示例性P2A序列
<400> 108
Ala Gly Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn
1 5 10 15
Pro Gly Pro
<210> 109
<211> 19
<212> PRT
<213> 人工序列
<220>
<223> 具有A1P突变的示例性P2A序列
<400> 109
Pro Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn
1 5 10 15
Pro Gly Pro
<210> 110
<211> 23
<212> PRT
<213> 人工序列
<220>
<223> 示例性弗林蛋白酶RRKR和P2A序列
<400> 110
Arg Arg Lys Arg Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp
1 5 10 15
Val Glu Glu Asn Pro Gly Pro
20
<210> 111
<211> 23
<212> PRT
<213> 人工序列
<220>
<223> 具有A1G突变的示例性弗林蛋白酶RRKR和P2A序列
<400> 111
Arg Arg Lys Arg Gly Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp
1 5 10 15
Val Glu Glu Asn Pro Gly Pro
20
<210> 112
<211> 23
<212> PRT
<213> 人工序列
<220>
<223> 具有F4A突变的示例性弗林蛋白酶RRKR和P2A序列
<400> 112
Arg Arg Lys Arg Ala Thr Asn Ala Ser Leu Leu Lys Gln Ala Gly Asp
1 5 10 15
Val Glu Glu Asn Pro Gly Pro
20
<210> 113
<211> 23
<212> PRT
<213> 人工序列
<220>
<223> 具有N3P突变的示例性弗林蛋白酶RRKR和P2A序列
<400> 113
Arg Arg Lys Arg Ala Thr Pro Phe Ser Leu Leu Lys Gln Ala Gly Asp
1 5 10 15
Val Glu Glu Asn Pro Gly Pro
20
<210> 114
<211> 23
<212> PRT
<213> 人工序列
<220>
<223> 具有N3A突变的示例性弗林蛋白酶RRKR和P2A序列
<400> 114
Arg Arg Lys Arg Ala Thr Ala Phe Ser Leu Leu Lys Gln Ala Gly Asp
1 5 10 15
Val Glu Glu Asn Pro Gly Pro
20
<210> 115
<211> 23
<212> PRT
<213> 人工序列
<220>
<223> 具有F4P突变的示例性弗林蛋白酶RRKR和P2A序列
<400> 115
Arg Arg Lys Arg Ala Thr Asn Pro Ser Leu Leu Lys Gln Ala Gly Asp
1 5 10 15
Val Glu Glu Asn Pro Gly Pro
20
<210> 116
<211> 23
<212> PRT
<213> 人工序列
<220>
<223> 具有S5P突变的示例性弗林蛋白酶RRKR和P2A序列
<400> 116
Arg Arg Lys Arg Ala Thr Asn Phe Pro Leu Leu Lys Gln Ala Gly Asp
1 5 10 15
Val Glu Glu Asn Pro Gly Pro
20
<210> 117
<211> 23
<212> PRT
<213> 人工序列
<220>
<223> 具有T2P突变的示例性弗林蛋白酶RRKR和P2A序列
<400> 117
Arg Arg Lys Arg Ala Pro Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp
1 5 10 15
Val Glu Glu Asn Pro Gly Pro
20
<210> 118
<211> 23
<212> PRT
<213> 人工序列
<220>
<223> 具有T2G突变的示例性弗林蛋白酶RRKR和P2A序列
<400> 118
Arg Arg Lys Arg Ala Gly Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp
1 5 10 15
Val Glu Glu Asn Pro Gly Pro
20
<210> 119
<211> 23
<212> PRT
<213> 人工序列
<220>
<223> 具有A1P突变的示例性弗林蛋白酶RRKR和P2A序列
<400> 119
Arg Arg Lys Arg Pro Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp
1 5 10 15
Val Glu Glu Asn Pro Gly Pro
20
<210> 120
<211> 23
<212> PRT
<213> 人工序列
<220>
<223> 示例性弗林蛋白酶RRRR和P2A序列
<400> 120
Arg Arg Arg Arg Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp
1 5 10 15
Val Glu Glu Asn Pro Gly Pro
20
<210> 121
<211> 23
<212> PRT
<213> 人工序列
<220>
<223> 具有A1G突变的示例性弗林蛋白酶RRRR和P2A序列
<400> 121
Arg Arg Arg Arg Gly Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp
1 5 10 15
Val Glu Glu Asn Pro Gly Pro
20
<210> 122
<211> 23
<212> PRT
<213> 人工序列
<220>
<223> 具有F4A突变的示例性弗林蛋白酶RRRR和P2A序列
<400> 122
Arg Arg Arg Arg Ala Thr Asn Ala Ser Leu Leu Lys Gln Ala Gly Asp
1 5 10 15
Val Glu Glu Asn Pro Gly Pro
20
<210> 123
<211> 23
<212> PRT
<213> 人工序列
<220>
<223> 具有N3P突变的示例性弗林蛋白酶RRRR和P2A序列
<400> 123
Arg Arg Arg Arg Ala Thr Pro Phe Ser Leu Leu Lys Gln Ala Gly Asp
1 5 10 15
Val Glu Glu Asn Pro Gly Pro
20
<210> 124
<211> 23
<212> PRT
<213> 人工序列
<220>
<223> 具有N3A突变的示例性弗林蛋白酶RRRR和P2A序列
<400> 124
Arg Arg Arg Arg Ala Thr Ala Phe Ser Leu Leu Lys Gln Ala Gly Asp
1 5 10 15
Val Glu Glu Asn Pro Gly Pro
20
<210> 125
<211> 23
<212> PRT
<213> 人工序列
<220>
<223> 具有F4P突变的示例性弗林蛋白酶RRKR和P2A序列
<400> 125
Arg Arg Arg Arg Ala Thr Asn Pro Ser Leu Leu Lys Gln Ala Gly Asp
1 5 10 15
Val Glu Glu Asn Pro Gly Pro
20
<210> 126
<211> 23
<212> PRT
<213> 人工序列
<220>
<223> 具有S5P突变的示例性弗林蛋白酶RRRR和P2A序列
<400> 126
Arg Arg Arg Arg Ala Thr Asn Phe Pro Leu Leu Lys Gln Ala Gly Asp
1 5 10 15
Val Glu Glu Asn Pro Gly Pro
20
<210> 127
<211> 23
<212> PRT
<213> 人工序列
<220>
<223> 具有T2P突变的示例性弗林蛋白酶RRRR和P2A序列
<400> 127
Arg Arg Arg Arg Ala Pro Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp
1 5 10 15
Val Glu Glu Asn Pro Gly Pro
20
<210> 128
<211> 23
<212> PRT
<213> 人工序列
<220>
<223> 具有T2G突变的示例性弗林蛋白酶RRRR和P2A序列
<400> 128
Arg Arg Arg Arg Ala Gly Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp
1 5 10 15
Val Glu Glu Asn Pro Gly Pro
20
<210> 129
<211> 23
<212> PRT
<213> 人工序列
<220>
<223> 具有A1P突变的示例性弗林蛋白酶RRRR和P2A序列
<400> 129
Arg Arg Arg Arg Pro Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp
1 5 10 15
Val Glu Glu Asn Pro Gly Pro
20
<210> 130
<211> 23
<212> PRT
<213> 人工序列
<220>
<223> 示例性弗林蛋白酶RXKR和P2A序列
<220>
<221> 尚未归类的特征
<222> (2)..(2)
<223> Xaa 可以是任何天然存在的氨基酸
<400> 130
Arg Xaa Lys Arg Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp
1 5 10 15
Val Glu Glu Asn Pro Gly Pro
20
<210> 131
<211> 23
<212> PRT
<213> 人工序列
<220>
<223> 具有A1G突变的示例性弗林蛋白酶RXKR和P2A序列
<220>
<221> 尚未归类的特征
<222> (2)..(2)
<223> Xaa 可以是任何天然存在的氨基酸
<400> 131
Arg Xaa Lys Arg Gly Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp
1 5 10 15
Val Glu Glu Asn Pro Gly Pro
20
<210> 132
<211> 23
<212> PRT
<213> 人工序列
<220>
<223> 具有F4A突变的示例性弗林蛋白酶RXKR和P2A序列
<220>
<221> 尚未归类的特征
<222> (2)..(2)
<223> Xaa 可以是任何天然存在的氨基酸
<400> 132
Arg Xaa Lys Arg Ala Thr Asn Ala Ser Leu Leu Lys Gln Ala Gly Asp
1 5 10 15
Val Glu Glu Asn Pro Gly Pro
20
<210> 133
<211> 23
<212> PRT
<213> 人工序列
<220>
<223> 具有N3P突变的示例性弗林蛋白酶RXKR和P2A序列
<220>
<221> 尚未归类的特征
<222> (2)..(2)
<223> Xaa 可以是任何天然存在的氨基酸
<400> 133
Arg Xaa Lys Arg Ala Thr Pro Phe Ser Leu Leu Lys Gln Ala Gly Asp
1 5 10 15
Val Glu Glu Asn Pro Gly Pro
20
<210> 134
<211> 23
<212> PRT
<213> 人工序列
<220>
<223> 具有N3A突变的示例性弗林蛋白酶RXKR和P2A序列
<220>
<221> 尚未归类的特征
<222> (2)..(2)
<223> Xaa 可以是任何天然存在的氨基酸
<400> 134
Arg Xaa Lys Arg Ala Thr Ala Phe Ser Leu Leu Lys Gln Ala Gly Asp
1 5 10 15
Val Glu Glu Asn Pro Gly Pro
20
<210> 135
<211> 23
<212> PRT
<213> 人工序列
<220>
<223> 具有F4P突变的示例性弗林蛋白酶RXKR和P2A序列
<220>
<221> 尚未归类的特征
<222> (2)..(2)
<223> Xaa 可以是任何天然存在的氨基酸
<400> 135
Arg Xaa Lys Arg Ala Thr Asn Pro Ser Leu Leu Lys Gln Ala Gly Asp
1 5 10 15
Val Glu Glu Asn Pro Gly Pro
20
<210> 136
<211> 23
<212> PRT
<213> 人工序列
<220>
<223> 具有S5P突变的示例性弗林蛋白酶RXKR和P2A序列
<220>
<221> 尚未归类的特征
<222> (2)..(2)
<223> Xaa 可以是任何天然存在的氨基酸
<400> 136
Arg Xaa Lys Arg Ala Thr Asn Phe Pro Leu Leu Lys Gln Ala Gly Asp
1 5 10 15
Val Glu Glu Asn Pro Gly Pro
20
<210> 137
<211> 23
<212> PRT
<213> 人工序列
<220>
<223> 具有T2P突变的示例性弗林蛋白酶RXKR和P2A序列
<220>
<221> 尚未归类的特征
<222> (2)..(2)
<223> Xaa 可以是任何天然存在的氨基酸
<400> 137
Arg Xaa Lys Arg Ala Pro Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp
1 5 10 15
Val Glu Glu Asn Pro Gly Pro
20
<210> 138
<211> 23
<212> PRT
<213> 人工序列
<220>
<223> 具有T2G突变的示例性弗林蛋白酶RXKR和P2A序列
<220>
<221> 尚未归类的特征
<222> (2)..(2)
<223> Xaa 可以是任何天然存在的氨基酸
<400> 138
Arg Xaa Lys Arg Ala Gly Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp
1 5 10 15
Val Glu Glu Asn Pro Gly Pro
20
<210> 139
<211> 23
<212> PRT
<213> 人工序列
<220>
<223> 具有A1P突变的示例性弗林蛋白酶RXKR和P2A序列
<220>
<221> 尚未归类的特征
<222> (2)..(2)
<223> Xaa 可以是任何天然存在的氨基酸
<400> 139
Arg Xaa Lys Arg Pro Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp
1 5 10 15
Val Glu Glu Asn Pro Gly Pro
20
<210> 140
<211> 23
<212> PRT
<213> 人工序列
<220>
<223> 示例性弗林蛋白酶RXRR和P2A序列
<220>
<221> 尚未归类的特征
<222> (2)..(2)
<223> Xaa 可以是任何天然存在的氨基酸
<400> 140
Arg Xaa Arg Arg Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp
1 5 10 15
Val Glu Glu Asn Pro Gly Pro
20
<210> 141
<211> 23
<212> PRT
<213> 人工序列
<220>
<223> 具有A1G突变的示例性弗林蛋白酶RXRR和P2A序列
<220>
<221> 尚未归类的特征
<222> (2)..(2)
<223> Xaa 可以是任何天然存在的氨基酸
<400> 141
Arg Xaa Arg Arg Gly Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp
1 5 10 15
Val Glu Glu Asn Pro Gly Pro
20
<210> 142
<211> 23
<212> PRT
<213> 人工序列
<220>
<223> 具有F4A突变的示例性弗林蛋白酶RXRR和P2A序列
<220>
<221> 尚未归类的特征
<222> (2)..(2)
<223> Xaa 可以是任何天然存在的氨基酸
<400> 142
Arg Xaa Arg Arg Ala Thr Asn Ala Ser Leu Leu Lys Gln Ala Gly Asp
1 5 10 15
Val Glu Glu Asn Pro Gly Pro
20
<210> 143
<211> 23
<212> PRT
<213> 人工序列
<220>
<223> 具有N3P突变的示例性弗林蛋白酶RXRR和P2A序列
<220>
<221> 尚未归类的特征
<222> (2)..(2)
<223> Xaa 可以是任何天然存在的氨基酸
<400> 143
Arg Xaa Arg Arg Ala Thr Pro Phe Ser Leu Leu Lys Gln Ala Gly Asp
1 5 10 15
Val Glu Glu Asn Pro Gly Pro
20
<210> 144
<211> 23
<212> PRT
<213> 人工序列
<220>
<223> 具有N3A突变的示例性弗林蛋白酶RXRR和P2A序列
<220>
<221> 尚未归类的特征
<222> (2)..(2)
<223> Xaa 可以是任何天然存在的氨基酸
<400> 144
Arg Xaa Arg Arg Ala Thr Ala Phe Ser Leu Leu Lys Gln Ala Gly Asp
1 5 10 15
Val Glu Glu Asn Pro Gly Pro
20
<210> 145
<211> 23
<212> PRT
<213> 人工序列
<220>
<223> 具有F4P突变的示例性弗林蛋白酶RXKR和P2A序列
<220>
<221> 尚未归类的特征
<222> (2)..(2)
<223> Xaa 可以是任何天然存在的氨基酸
<400> 145
Arg Xaa Arg Arg Ala Thr Asn Pro Ser Leu Leu Lys Gln Ala Gly Asp
1 5 10 15
Val Glu Glu Asn Pro Gly Pro
20
<210> 146
<211> 23
<212> PRT
<213> 人工序列
<220>
<223> 具有S5P突变的示例性弗林蛋白酶RXRR和P2A序列
<220>
<221> 尚未归类的特征
<222> (2)..(2)
<223> Xaa 可以是任何天然存在的氨基酸
<400> 146
Arg Xaa Arg Arg Ala Thr Asn Phe Pro Leu Leu Lys Gln Ala Gly Asp
1 5 10 15
Val Glu Glu Asn Pro Gly Pro
20
<210> 147
<211> 23
<212> PRT
<213> 人工序列
<220>
<223> 具有T2P突变的示例性弗林蛋白酶RXRR和P2A序列
<220>
<221> 尚未归类的特征
<222> (2)..(2)
<223> Xaa 可以是任何天然存在的氨基酸
<400> 147
Arg Xaa Arg Arg Ala Pro Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp
1 5 10 15
Val Glu Glu Asn Pro Gly Pro
20
<210> 148
<211> 23
<212> PRT
<213> 人工序列
<220>
<223> 具有T2G突变的示例性弗林蛋白酶RXRR和P2A序列
<220>
<221> 尚未归类的特征
<222> (2)..(2)
<223> Xaa 可以是任何天然存在的氨基酸
<400> 148
Arg Xaa Arg Arg Ala Gly Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp
1 5 10 15
Val Glu Glu Asn Pro Gly Pro
20
<210> 149
<211> 23
<212> PRT
<213> 人工序列
<220>
<223> 具有A1P突变的示例性弗林蛋白酶RXRR和P2A序列
<220>
<221> 尚未归类的特征
<222> (2)..(2)
<223> Xaa 可以是任何天然存在的氨基酸
<400> 149
Arg Xaa Arg Arg Pro Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp
1 5 10 15
Val Glu Glu Asn Pro Gly Pro
20
<210> 150
<211> 60
<212> PRT
<213> 人工序列
<220>
<223> 表达系统中的RRKR-P2A-GPI部分的氨基酸序列
<400> 150
Arg Arg Lys Arg Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp
1 5 10 15
Val Glu Glu Asn Pro Gly Pro Pro Asn Lys Gly Ser Gly Thr Thr Ser
20 25 30
Gly Thr Thr Arg Leu Leu Ser Gly His Thr Cys Phe Thr Leu Thr Gly
35 40 45
Leu Leu Gly Thr Leu Val Thr Met Gly Leu Leu Thr
50 55 60
<210> 151
<211> 60
<212> PRT
<213> 人工序列
<220>
<223> 表达系统中的RRKR-(ATNFS)P2A-GPI部分的氨基酸
序列
<400> 151
Arg Arg Lys Arg Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp
1 5 10 15
Val Glu Glu Asn Pro Gly Pro Pro Asn Lys Gly Ser Gly Thr Thr Ser
20 25 30
Gly Thr Thr Arg Leu Leu Ser Gly His Thr Cys Phe Thr Leu Thr Gly
35 40 45
Leu Leu Gly Thr Leu Val Thr Met Gly Leu Leu Thr
50 55 60
<210> 152
<211> 46
<212> PRT
<213> 人工序列
<220>
<223> 表达系统中的RRKR-ATNFS-GPI部分的氨基酸
序列
<400> 152
Arg Arg Lys Arg Ala Thr Asn Phe Ser Pro Asn Lys Gly Ser Gly Thr
1 5 10 15
Thr Ser Gly Thr Thr Arg Leu Leu Ser Gly His Thr Cys Phe Thr Leu
20 25 30
Thr Gly Leu Leu Gly Thr Leu Val Thr Met Gly Leu Leu Thr
35 40 45
<210> 153
<211> 60
<212> PRT
<213> 人工序列
<220>
<223> 表达系统中的RRKR-(GTNFS)P2A-GPI部分的氨基酸
序列(包括P2A多肽中的A1G突变)
<400> 153
Arg Arg Lys Arg Gly Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp
1 5 10 15
Val Glu Glu Asn Pro Gly Pro Pro Asn Lys Gly Ser Gly Thr Thr Ser
20 25 30
Gly Thr Thr Arg Leu Leu Ser Gly His Thr Cys Phe Thr Leu Thr Gly
35 40 45
Leu Leu Gly Thr Leu Val Thr Met Gly Leu Leu Thr
50 55 60
<210> 154
<211> 46
<212> PRT
<213> 人工序列
<220>
<223> 表达系统中的RRKR-GTNFS-GPI部分的氨基酸
序列(包括P2A多肽片段中的A1G突变)
<400> 154
Arg Arg Lys Arg Gly Thr Asn Phe Ser Pro Asn Lys Gly Ser Gly Thr
1 5 10 15
Thr Ser Gly Thr Thr Arg Leu Leu Ser Gly His Thr Cys Phe Thr Leu
20 25 30
Thr Gly Leu Leu Gly Thr Leu Val Thr Met Gly Leu Leu Thr
35 40 45
<210> 155
<211> 60
<212> PRT
<213> 人工序列
<220>
<223> 表达系统中的RRKR-(ATNAS)P2A-GPI部分的氨基酸
序列(包括P2A多肽中的F4A突变)
<400> 155
Arg Arg Lys Arg Ala Thr Asn Ala Ser Leu Leu Lys Gln Ala Gly Asp
1 5 10 15
Val Glu Glu Asn Pro Gly Pro Pro Asn Lys Gly Ser Gly Thr Thr Ser
20 25 30
Gly Thr Thr Arg Leu Leu Ser Gly His Thr Cys Phe Thr Leu Thr Gly
35 40 45
Leu Leu Gly Thr Leu Val Thr Met Gly Leu Leu Thr
50 55 60
<210> 156
<211> 46
<212> PRT
<213> 人工序列
<220>
<223> 表达系统中的RRKR-ATNAS-GPI部分的氨基酸
序列(包括P2A多肽片段中的F4A突变)
<400> 156
Arg Arg Lys Arg Ala Thr Asn Ala Ser Pro Asn Lys Gly Ser Gly Thr
1 5 10 15
Thr Ser Gly Thr Thr Arg Leu Leu Ser Gly His Thr Cys Phe Thr Leu
20 25 30
Thr Gly Leu Leu Gly Thr Leu Val Thr Met Gly Leu Leu Thr
35 40 45
<210> 157
<211> 60
<212> PRT
<213> 人工序列
<220>
<223> 表达系统中的RRKR-(ATPFS)P2A-GPI部分的氨基酸
序列(包括P2A多肽中的N3P突变)
<400> 157
Arg Arg Lys Arg Ala Thr Pro Phe Ser Leu Leu Lys Gln Ala Gly Asp
1 5 10 15
Val Glu Glu Asn Pro Gly Pro Pro Asn Lys Gly Ser Gly Thr Thr Ser
20 25 30
Gly Thr Thr Arg Leu Leu Ser Gly His Thr Cys Phe Thr Leu Thr Gly
35 40 45
Leu Leu Gly Thr Leu Val Thr Met Gly Leu Leu Thr
50 55 60
<210> 158
<211> 46
<212> PRT
<213> 人工序列
<220>
<223> 表达系统中的RRKR-ATPFS-GPI部分的氨基酸
序列(包括P2A多肽片段中的N3P突变)
<400> 158
Arg Arg Lys Arg Ala Thr Pro Phe Ser Pro Asn Lys Gly Ser Gly Thr
1 5 10 15
Thr Ser Gly Thr Thr Arg Leu Leu Ser Gly His Thr Cys Phe Thr Leu
20 25 30
Thr Gly Leu Leu Gly Thr Leu Val Thr Met Gly Leu Leu Thr
35 40 45
<210> 159
<211> 60
<212> PRT
<213> 人工序列
<220>
<223> 表达系统中的RRKR-(ATAFS)P2A-GPI部分的氨基酸
序列(包括P2A多肽中的N3A突变)
<400> 159
Arg Arg Lys Arg Ala Thr Ala Phe Ser Leu Leu Lys Gln Ala Gly Asp
1 5 10 15
Val Glu Glu Asn Pro Gly Pro Pro Asn Lys Gly Ser Gly Thr Thr Ser
20 25 30
Gly Thr Thr Arg Leu Leu Ser Gly His Thr Cys Phe Thr Leu Thr Gly
35 40 45
Leu Leu Gly Thr Leu Val Thr Met Gly Leu Leu Thr
50 55 60
<210> 160
<211> 46
<212> PRT
<213> 人工序列
<220>
<223> 表达系统中的RRKR-ATAFS-GPI部分的氨基酸
序列(包括P2A多肽片段中的N3A突变)
<400> 160
Arg Arg Lys Arg Ala Thr Ala Phe Ser Pro Asn Lys Gly Ser Gly Thr
1 5 10 15
Thr Ser Gly Thr Thr Arg Leu Leu Ser Gly His Thr Cys Phe Thr Leu
20 25 30
Thr Gly Leu Leu Gly Thr Leu Val Thr Met Gly Leu Leu Thr
35 40 45
<210> 161
<211> 60
<212> PRT
<213> 人工序列
<220>
<223> 表达系统中的RRKR-(ATNPS)P2A-GPI部分的氨基酸
序列(包括P2A多肽中的F4P突变)
<400> 161
Arg Arg Lys Arg Ala Thr Asn Pro Ser Leu Leu Lys Gln Ala Gly Asp
1 5 10 15
Val Glu Glu Asn Pro Gly Pro Pro Asn Lys Gly Ser Gly Thr Thr Ser
20 25 30
Gly Thr Thr Arg Leu Leu Ser Gly His Thr Cys Phe Thr Leu Thr Gly
35 40 45
Leu Leu Gly Thr Leu Val Thr Met Gly Leu Leu Thr
50 55 60
<210> 162
<211> 46
<212> PRT
<213> 人工序列
<220>
<223> 表达系统中的RRKR-ATNPS-GPI部分的氨基酸
序列(包括P2A多肽片段中的F4P突变)
<400> 162
Arg Arg Lys Arg Ala Thr Asn Pro Ser Pro Asn Lys Gly Ser Gly Thr
1 5 10 15
Thr Ser Gly Thr Thr Arg Leu Leu Ser Gly His Thr Cys Phe Thr Leu
20 25 30
Thr Gly Leu Leu Gly Thr Leu Val Thr Met Gly Leu Leu Thr
35 40 45
<210> 163
<211> 60
<212> PRT
<213> 人工序列
<220>
<223> 表达系统中的RRKR-(ATNFP)P2A-GPI部分的氨基酸
序列(包括P2A多肽中的S5P突变)
<400> 163
Arg Arg Lys Arg Ala Thr Asn Phe Pro Leu Leu Lys Gln Ala Gly Asp
1 5 10 15
Val Glu Glu Asn Pro Gly Pro Pro Asn Lys Gly Ser Gly Thr Thr Ser
20 25 30
Gly Thr Thr Arg Leu Leu Ser Gly His Thr Cys Phe Thr Leu Thr Gly
35 40 45
Leu Leu Gly Thr Leu Val Thr Met Gly Leu Leu Thr
50 55 60
<210> 164
<211> 46
<212> PRT
<213> 人工序列
<220>
<223> 表达系统中的RRKR-ATNFP-GPI部分的氨基酸
序列(包括P2A多肽片段中的S5P突变)
<400> 164
Arg Arg Lys Arg Ala Thr Asn Phe Pro Pro Asn Lys Gly Ser Gly Thr
1 5 10 15
Thr Ser Gly Thr Thr Arg Leu Leu Ser Gly His Thr Cys Phe Thr Leu
20 25 30
Thr Gly Leu Leu Gly Thr Leu Val Thr Met Gly Leu Leu Thr
35 40 45
<210> 165
<211> 60
<212> PRT
<213> 人工序列
<220>
<223> 表达系统中的RRKR-(APNFS)P2A-GPI部分的氨基酸
序列(包括P2A多肽中的T2P突变)
<400> 165
Arg Arg Lys Arg Ala Pro Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp
1 5 10 15
Val Glu Glu Asn Pro Gly Pro Pro Asn Lys Gly Ser Gly Thr Thr Ser
20 25 30
Gly Thr Thr Arg Leu Leu Ser Gly His Thr Cys Phe Thr Leu Thr Gly
35 40 45
Leu Leu Gly Thr Leu Val Thr Met Gly Leu Leu Thr
50 55 60
<210> 166
<211> 46
<212> PRT
<213> 人工序列
<220>
<223> 表达系统中的RRKR-APNFS-GPI部分的氨基酸
序列(包括P2A多肽片段中的T2P突变)
<400> 166
Arg Arg Lys Arg Ala Pro Asn Phe Ser Pro Asn Lys Gly Ser Gly Thr
1 5 10 15
Thr Ser Gly Thr Thr Arg Leu Leu Ser Gly His Thr Cys Phe Thr Leu
20 25 30
Thr Gly Leu Leu Gly Thr Leu Val Thr Met Gly Leu Leu Thr
35 40 45
<210> 167
<211> 60
<212> PRT
<213> 人工序列
<220>
<223> 表达系统中的RRKR-(AGNFS)P2A-GPI部分的氨基酸
序列(包括P2A多肽中的T2G突变)
<400> 167
Arg Arg Lys Arg Ala Gly Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp
1 5 10 15
Val Glu Glu Asn Pro Gly Pro Pro Asn Lys Gly Ser Gly Thr Thr Ser
20 25 30
Gly Thr Thr Arg Leu Leu Ser Gly His Thr Cys Phe Thr Leu Thr Gly
35 40 45
Leu Leu Gly Thr Leu Val Thr Met Gly Leu Leu Thr
50 55 60
<210> 168
<211> 46
<212> PRT
<213> 人工序列
<220>
<223> 表达系统中的RRKR-AGNFS-GPI部分的氨基酸
序列(包括P2A多肽片段中的T2G突变)
<400> 168
Arg Arg Lys Arg Ala Gly Asn Phe Ser Pro Asn Lys Gly Ser Gly Thr
1 5 10 15
Thr Ser Gly Thr Thr Arg Leu Leu Ser Gly His Thr Cys Phe Thr Leu
20 25 30
Thr Gly Leu Leu Gly Thr Leu Val Thr Met Gly Leu Leu Thr
35 40 45
<210> 169
<211> 60
<212> PRT
<213> 人工序列
<220>
<223> 表达系统中的RRKR-(PTNFS)P2A-GPI部分的氨基酸
序列(包括P2A多肽中的A1P突变)
<400> 169
Arg Arg Lys Arg Pro Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp
1 5 10 15
Val Glu Glu Asn Pro Gly Pro Pro Asn Lys Gly Ser Gly Thr Thr Ser
20 25 30
Gly Thr Thr Arg Leu Leu Ser Gly His Thr Cys Phe Thr Leu Thr Gly
35 40 45
Leu Leu Gly Thr Leu Val Thr Met Gly Leu Leu Thr
50 55 60
<210> 170
<211> 46
<212> PRT
<213> 人工序列
<220>
<223> 表达系统中的RRKR-PTNFS-GPI部分的氨基酸
序列(包括P2A多肽片段中的A1P突变)
<400> 170
Arg Arg Lys Arg Pro Thr Asn Phe Ser Pro Asn Lys Gly Ser Gly Thr
1 5 10 15
Thr Ser Gly Thr Thr Arg Leu Leu Ser Gly His Thr Cys Phe Thr Leu
20 25 30
Thr Gly Leu Leu Gly Thr Leu Val Thr Met Gly Leu Leu Thr
35 40 45
<210> 171
<211> 28
<212> PRT
<213> 人工序列
<220>
<223> RRKR-F2A(野生型)氨基酸序列
<400> 171
Arg Arg Lys Arg Ala Pro Val Lys Gln Thr Leu Asn Phe Asp Leu Leu
1 5 10 15
Lys Leu Ala Gly Asp Val Glu Ser Asn Pro Gly Pro
20 25
<210> 172
<211> 24
<212> PRT
<213> 人工序列
<220>
<223> RRKR-E2A(野生型)氨基酸序列
<400> 172
Arg Arg Lys Arg Gln Cys Thr Asn Tyr Ala Leu Leu Lys Leu Ala Gly
1 5 10 15
Asp Val Glu Ser Asn Pro Gly Pro
20
<210> 173
<211> 22
<212> PRT
<213> 人工序列
<220>
<223> RRKR-T2A(野生型)氨基酸序列
<400> 173
Arg Arg Lys Arg Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val
1 5 10 15
Glu Glu Asn Pro Gly Pro
20
<210> 174
<211> 23
<212> PRT
<213> 人工序列
<220>
<223> RRKR-P2A(野生型)氨基酸序列
<400> 174
Arg Arg Lys Arg Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp
1 5 10 15
Val Glu Glu Asn Pro Gly Pro
20
<210> 175
<211> 37
<212> PRT
<213> 人工序列
<220>
<223> GPI氨基酸序列
<400> 175
Pro Asn Lys Gly Ser Gly Thr Thr Ser Gly Thr Thr Arg Leu Leu Ser
1 5 10 15
Gly His Thr Cys Phe Thr Leu Thr Gly Leu Leu Gly Thr Leu Val Thr
20 25 30
Met Gly Leu Leu Thr
35
<210> 176
<211> 84
<212> DNA
<213> 人工序列
<220>
<223> RRKR-F2A(野生型)核苷酸序列
<400> 176
cggagaaagc gcgcaccggt gaaacagact ttgaattttg accttctgaa gttggcagga 60
gacgttgagt ccaaccctgg gccc 84
<210> 177
<211> 72
<212> DNA
<213> 人工序列
<220>
<223> RRKR-E2A(野生型)核苷酸序列
<400> 177
cggagaaagc gccagtgtac taattatgct ctcttgaaat tggctggaga tgttgagagc 60
aaccctgggc cc 72
<210> 178
<211> 66
<212> DNA
<213> 人工序列
<220>
<223> RRKR-T2A(野生型)核苷酸序列
<400> 178
cggagaaagc gcgagggcag aggaagtctg ctaacatgcg gtgacgtcga ggagaatcct 60
gggccc 66
<210> 179
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> RRKR-P2A(野生型)核苷酸序列
<400> 179
cggagaaagc gcgctactaa cttcagcctg ctgaagcagg ctggagacgt ggaggagaac 60
cctgggccc 69
<210> 180
<211> 111
<212> DNA
<213> 人工序列
<220>
<223> GPI核苷酸序列
<400> 180
ccaaataaag gaagtggaac cacttcaggt actacccgtc ttctatctgg gcacacgtgt 60
ttcacgttga caggtttgct tgggacgcta gtaaccatgg gcttgctgac t 111
<210> 181
<211> 587
<212> DNA
<213> 人工序列
<220>
<223> IRES核苷酸序列
<400> 181
cccctctccc tccccccccc ctaacgttac tggccgaagc cgcttggaat aaggccggtg 60
tgcgtttgtc tatatgttat tttccaccat attgccgtct tttggcaatg tgagggcccg 120
gaaacctggc cctgtcttct tgacgagcat tcctaggggt ctttcccctc tcgccaaagg 180
aatgcaaggt ctgttgaatg tcgtgaagga agcagttcct ctggaagctt cttgaagaca 240
aacaacgtct gtagcgaccc tttgcaggca gcggaacccc ccacctggcg acaggtgcct 300
ctgcggccaa aagccacgtg tataagatac acctgcaaag gcggcacaac cccagtgcca 360
cgttgtgagt tggatagttg tggaaagagt caaatggctc tcctcaagcg tattcaacaa 420
ggggctgaag gatgcccaga aggtacccca ttgtatggga tctgatctgg ggcctcggta 480
cacatgcttt acatgtgttt agtcgaggtt aaaaaaacgt ctaggccccc cgaaccacgg 540
ggacgtggtt ttcctttgaa aacgcgtatg ataatatggc cacaacc 587
<210> 182
<211> 1603
<212> DNA
<213> 人工序列
<220>
<223> ChiP核苷酸序列
<400> 182
agtcaatggg aaaaacccat tggagccaag tacactgact caatagggac tttccattgg 60
gttttgccca gtacataagg tcaatagggg gtgagtcaac aggaaagtcc cattggagcc 120
aagtacattg agtcaatagg gactttccaa tgggttttgc ccagtacata aggtcaatgg 180
gaggtaagcc aatgggtttt tcccattact ggcacgtata ctgagtcatt agggactttc 240
caatgggttt tgcccagtac ataaggtcaa taggggtgaa tcaacaggaa agtcccattg 300
gagccaagta cactgagtca atagggactt tccattgggt tttgcccagt acaaaaggtc 360
aatagggggt gagtcaatgg gtttttccca ttattggcac gtacataagg tcaatagggg 420
tgactagtca tggtgatgcg gttttggcag tacatcaatg ggcgtggata gcggtttgac 480
tcacggggat ttccaagtct ccaccccatt gacgtcaatg ggagtttgtt ttggcaccaa 540
aatcaacggg actttccaaa atgtcgtaac aactccgccc cattgacgca aatgggcggt 600
aggcgtgtac ggtgggaggt ctatataagc agagctcgtt tagtgaaccg tcagatcgcc 660
tggagacgcc atccacgctg ttttgacctc catagaagac accgggaccg atccagcctc 720
cgcggccggg aacggtgcat tggaacgcgg attccccgtg ccaagagtga cgtaagtacc 780
gcctatagac tctataggca cacccctttg gctcttatgc atgctatact gtttttggct 840
tggggcctat acacccccgc tccttatgct ataggtgatg gtatagctta gcctataggt 900
gtgggttatt gaccattatt gaccactccc ctattggtga cgatactttc cattactaat 960
ccataacatg gctctttgcc acaactatct ctattggcta tatgccaata ctctgtcctt 1020
cagagactga cacggactct gtatttttac aggatggggt cccatttatt atttacaaat 1080
tcacatatac aacaacgccg tcccccgtgc ccgcagtttt tattaaacat agcgtgggat 1140
ctccacgcga atctcgggta cgtgttccgg acatgggctc ttctccggta gcggcggagc 1200
ttccacatcc gagccctggt cccatgcctc cagcggctca tggtcgctcg gcagctcctt 1260
gctcctaaca gtggaggcca gacttaggca cagcacaatg cccaccacca ccagtgtgcc 1320
gcacaaggcc gtggcggtag ggtatgtgtc tgaaaatgag ctcggagatt gggctcgcac 1380
cgtgacgcag atggaagact taaggcagcg gcagaagaag atgcaggcag ctgagttgtt 1440
gtattctgat aagagtcaga ggtaactccc gttgcggtgc tgttaacggt ggagggcagt 1500
gtagtctgag cagtactcgt tgctgccgcg cgcgccacca gacataatag ctgacagact 1560
aacagactgt tcctttccat gggtcttttc tgcagtcacc gtc 1603
<210> 183
<211> 46
<212> PRT
<213> 人工序列
<220>
<223> RXKR-PTNFS-GPI的氨基酸序列(包含P2A多肽片段中
的A1P突变)
<220>
<221> 尚未归类的特征
<222> (2)..(2)
<223> Xaa 可以是任何天然存在的氨基酸
<400> 183
Arg Xaa Lys Arg Pro Thr Asn Phe Ser Pro Asn Lys Gly Ser Gly Thr
1 5 10 15
Thr Ser Gly Thr Thr Arg Leu Leu Ser Gly His Thr Cys Phe Thr Leu
20 25 30
Thr Gly Leu Leu Gly Thr Leu Val Thr Met Gly Leu Leu Thr
35 40 45
<210> 184
<211> 46
<212> PRT
<213> 人工序列
<220>
<223> RXKR-GTNFS-GPI的氨基酸序列(包含P2A多肽片段中
的A1G突变)
<220>
<221> 尚未归类的特征
<222> (2)..(2)
<223> Xaa 可以是任何天然存在的氨基酸
<400> 184
Arg Xaa Lys Arg Gly Thr Asn Phe Ser Pro Asn Lys Gly Ser Gly Thr
1 5 10 15
Thr Ser Gly Thr Thr Arg Leu Leu Ser Gly His Thr Cys Phe Thr Leu
20 25 30
Thr Gly Leu Leu Gly Thr Leu Val Thr Met Gly Leu Leu Thr
35 40 45
<210> 185
<211> 46
<212> PRT
<213> 人工序列
<220>
<223> RXKR-AGNFS-GPI的氨基酸序列(包含P2A多肽片段中
的T2G突变)
<220>
<221> 尚未归类的特征
<222> (2)..(2)
<223> Xaa 可以是任何天然存在的氨基酸
<400> 185
Arg Xaa Lys Arg Ala Gly Asn Phe Ser Pro Asn Lys Gly Ser Gly Thr
1 5 10 15
Thr Ser Gly Thr Thr Arg Leu Leu Ser Gly His Thr Cys Phe Thr Leu
20 25 30
Thr Gly Leu Leu Gly Thr Leu Val Thr Met Gly Leu Leu Thr
35 40 45
<210> 186
<211> 46
<212> PRT
<213> 人工序列
<220>
<223> RXKR-APNFS-GPI的氨基酸序列(包含P2A多肽片段中
的T2P突变)
<220>
<221> 尚未归类的特征
<222> (2)..(2)
<223> Xaa 可以是任何天然存在的氨基酸
<400> 186
Arg Xaa Lys Arg Ala Pro Asn Phe Ser Pro Asn Lys Gly Ser Gly Thr
1 5 10 15
Thr Ser Gly Thr Thr Arg Leu Leu Ser Gly His Thr Cys Phe Thr Leu
20 25 30
Thr Gly Leu Leu Gly Thr Leu Val Thr Met Gly Leu Leu Thr
35 40 45
<210> 187
<211> 60
<212> PRT
<213> 人工序列
<220>
<223> RXKR-(PTNFS)P2A-GPI的氨基酸序列(包含P2A多肽中
的A1P突变)
<220>
<221> 尚未归类的特征
<222> (2)..(2)
<223> Xaa 可以是任何天然存在的氨基酸
<400> 187
Arg Xaa Lys Arg Pro Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp
1 5 10 15
Val Glu Glu Asn Pro Gly Pro Pro Asn Lys Gly Ser Gly Thr Thr Ser
20 25 30
Gly Thr Thr Arg Leu Leu Ser Gly His Thr Cys Phe Thr Leu Thr Gly
35 40 45
Leu Leu Gly Thr Leu Val Thr Met Gly Leu Leu Thr
50 55 60
<210> 188
<211> 60
<212> PRT
<213> 人工序列
<220>
<223> RXKR-(GTNFS)P2A-GPI的氨基酸序列(包含P2A多肽中
的A1P突变)
<220>
<221> 尚未归类的特征
<222> (2)..(2)
<223> Xaa 可以是任何天然存在的氨基酸
<400> 188
Arg Xaa Lys Arg Gly Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp
1 5 10 15
Val Glu Glu Asn Pro Gly Pro Pro Asn Lys Gly Ser Gly Thr Thr Ser
20 25 30
Gly Thr Thr Arg Leu Leu Ser Gly His Thr Cys Phe Thr Leu Thr Gly
35 40 45
Leu Leu Gly Thr Leu Val Thr Met Gly Leu Leu Thr
50 55 60
<210> 189
<211> 60
<212> PRT
<213> 人工序列
<220>
<223> RXKR-(AGNFS)P2A-GPI-的氨基酸序列(包含P2A多肽中
的T2G突变)
<220>
<221> 尚未归类的特征
<222> (2)..(2)
<223> Xaa 可以是任何天然存在的氨基酸
<400> 189
Arg Xaa Lys Arg Ala Gly Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp
1 5 10 15
Val Glu Glu Asn Pro Gly Pro Pro Asn Lys Gly Ser Gly Thr Thr Ser
20 25 30
Gly Thr Thr Arg Leu Leu Ser Gly His Thr Cys Phe Thr Leu Thr Gly
35 40 45
Leu Leu Gly Thr Leu Val Thr Met Gly Leu Leu Thr
50 55 60
<210> 190
<211> 60
<212> PRT
<213> 人工序列
<220>
<223> RXKR-(APNFS)P2A-GPI的氨基酸序列(包含P2A多肽中
的T2P突变)
<220>
<221> 尚未归类的特征
<222> (2)..(2)
<223> Xaa 可以是任何天然存在的氨基酸
<400> 190
Arg Xaa Lys Arg Ala Pro Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp
1 5 10 15
Val Glu Glu Asn Pro Gly Pro Pro Asn Lys Gly Ser Gly Thr Thr Ser
20 25 30
Gly Thr Thr Arg Leu Leu Ser Gly His Thr Cys Phe Thr Leu Thr Gly
35 40 45
Leu Leu Gly Thr Leu Val Thr Met Gly Leu Leu Thr
50 55 60
<210> 191
<211> 46
<212> PRT
<213> 人工序列
<220>
<223> RXRR-PTNFS-GPI的氨基酸序列(包含P2A多肽片段中
的A1P突变)
<220>
<221> 尚未归类的特征
<222> (2)..(2)
<223> Xaa 可以是任何天然存在的氨基酸
<400> 191
Arg Xaa Arg Arg Pro Thr Asn Phe Ser Pro Asn Lys Gly Ser Gly Thr
1 5 10 15
Thr Ser Gly Thr Thr Arg Leu Leu Ser Gly His Thr Cys Phe Thr Leu
20 25 30
Thr Gly Leu Leu Gly Thr Leu Val Thr Met Gly Leu Leu Thr
35 40 45
<210> 192
<211> 46
<212> PRT
<213> 人工序列
<220>
<223> RXRR-GTNFS-GPI的氨基酸序列(包含P2A多肽片段中
的A1G突变)
<220>
<221> 尚未归类的特征
<222> (2)..(2)
<223> Xaa 可以是任何天然存在的氨基酸
<400> 192
Arg Xaa Arg Arg Gly Thr Asn Phe Ser Pro Asn Lys Gly Ser Gly Thr
1 5 10 15
Thr Ser Gly Thr Thr Arg Leu Leu Ser Gly His Thr Cys Phe Thr Leu
20 25 30
Thr Gly Leu Leu Gly Thr Leu Val Thr Met Gly Leu Leu Thr
35 40 45
<210> 193
<211> 46
<212> PRT
<213> 人工序列
<220>
<223> RXRR-AGNFS-GPI的氨基酸序列(包含P2A多肽片段中
的T2G突变)
<220>
<221> 尚未归类的特征
<222> (2)..(2)
<223> Xaa 可以是任何天然存在的氨基酸
<400> 193
Arg Xaa Arg Arg Ala Gly Asn Phe Ser Pro Asn Lys Gly Ser Gly Thr
1 5 10 15
Thr Ser Gly Thr Thr Arg Leu Leu Ser Gly His Thr Cys Phe Thr Leu
20 25 30
Thr Gly Leu Leu Gly Thr Leu Val Thr Met Gly Leu Leu Thr
35 40 45
<210> 194
<211> 46
<212> PRT
<213> 人工序列
<220>
<223> RXRR-APNFS-GPI的氨基酸序列(包含P2A多肽片段中
的T2P突变)
<220>
<221> 尚未归类的特征
<222> (2)..(2)
<223> Xaa 可以是任何天然存在的氨基酸
<400> 194
Arg Xaa Arg Arg Ala Pro Asn Phe Ser Pro Asn Lys Gly Ser Gly Thr
1 5 10 15
Thr Ser Gly Thr Thr Arg Leu Leu Ser Gly His Thr Cys Phe Thr Leu
20 25 30
Thr Gly Leu Leu Gly Thr Leu Val Thr Met Gly Leu Leu Thr
35 40 45
<210> 195
<211> 60
<212> PRT
<213> 人工序列
<220>
<223> RXRR-(PTNFS)P2A-GPI的氨基酸序列(包含P2A多肽中
的A1P突变)
<220>
<221> 尚未归类的特征
<222> (2)..(2)
<223> Xaa 可以是任何天然存在的氨基酸
<400> 195
Arg Xaa Arg Arg Pro Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp
1 5 10 15
Val Glu Glu Asn Pro Gly Pro Pro Asn Lys Gly Ser Gly Thr Thr Ser
20 25 30
Gly Thr Thr Arg Leu Leu Ser Gly His Thr Cys Phe Thr Leu Thr Gly
35 40 45
Leu Leu Gly Thr Leu Val Thr Met Gly Leu Leu Thr
50 55 60
<210> 196
<211> 60
<212> PRT
<213> 人工序列
<220>
<223> RXRR-(GTNFS)P2A-GPI-的氨基酸序列(包含P2A多肽中
的A1G突变)
<220>
<221> 尚未归类的特征
<222> (2)..(2)
<223> Xaa 可以是任何天然存在的氨基酸
<400> 196
Arg Xaa Arg Arg Gly Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp
1 5 10 15
Val Glu Glu Asn Pro Gly Pro Pro Asn Lys Gly Ser Gly Thr Thr Ser
20 25 30
Gly Thr Thr Arg Leu Leu Ser Gly His Thr Cys Phe Thr Leu Thr Gly
35 40 45
Leu Leu Gly Thr Leu Val Thr Met Gly Leu Leu Thr
50 55 60
<210> 197
<211> 60
<212> PRT
<213> 人工序列
<220>
<223> RXRR-(AGNFS)P2A-GPI的氨基酸序列(包含P2A多肽中
的T2G突变)
<220>
<221> 尚未归类的特征
<222> (2)..(2)
<223> Xaa 可以是任何天然存在的氨基酸
<400> 197
Arg Xaa Arg Arg Ala Gly Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp
1 5 10 15
Val Glu Glu Asn Pro Gly Pro Pro Asn Lys Gly Ser Gly Thr Thr Ser
20 25 30
Gly Thr Thr Arg Leu Leu Ser Gly His Thr Cys Phe Thr Leu Thr Gly
35 40 45
Leu Leu Gly Thr Leu Val Thr Met Gly Leu Leu Thr
50 55 60
<210> 198
<211> 60
<212> PRT
<213> 人工序列
<220>
<223> RXRR-(APNFS)P2A-GPI的氨基酸序列(包含P2A多肽中
的T2P突变)
<220>
<221> 尚未归类的特征
<222> (2)..(2)
<223> Xaa 可以是任何天然存在的氨基酸
<400> 198
Arg Xaa Arg Arg Ala Pro Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp
1 5 10 15
Val Glu Glu Asn Pro Gly Pro Pro Asn Lys Gly Ser Gly Thr Thr Ser
20 25 30
Gly Thr Thr Arg Leu Leu Ser Gly His Thr Cys Phe Thr Leu Thr Gly
35 40 45
Leu Leu Gly Thr Leu Val Thr Met Gly Leu Leu Thr
50 55 60
<210> 199
<211> 46
<212> PRT
<213> 人工序列
<220>
<223> RRRR-PTNFS-GPI的氨基酸序列(包含P2A多肽片段中
的A1P突变)
<400> 199
Arg Arg Arg Arg Pro Thr Asn Phe Ser Pro Asn Lys Gly Ser Gly Thr
1 5 10 15
Thr Ser Gly Thr Thr Arg Leu Leu Ser Gly His Thr Cys Phe Thr Leu
20 25 30
Thr Gly Leu Leu Gly Thr Leu Val Thr Met Gly Leu Leu Thr
35 40 45
<210> 200
<211> 46
<212> PRT
<213> 人工序列
<220>
<223> RRRR-GTNFS-GPI的氨基酸序列(包含P2A多肽片段中
的A1G突变)
<400> 200
Arg Arg Arg Arg Gly Thr Asn Phe Ser Pro Asn Lys Gly Ser Gly Thr
1 5 10 15
Thr Ser Gly Thr Thr Arg Leu Leu Ser Gly His Thr Cys Phe Thr Leu
20 25 30
Thr Gly Leu Leu Gly Thr Leu Val Thr Met Gly Leu Leu Thr
35 40 45
<210> 201
<211> 46
<212> PRT
<213> 人工序列
<220>
<223> RRRR-AGNFS-GPI的氨基酸序列(包含P2A多肽片段中
的T2G突变)
<400> 201
Arg Arg Arg Arg Ala Gly Asn Phe Ser Pro Asn Lys Gly Ser Gly Thr
1 5 10 15
Thr Ser Gly Thr Thr Arg Leu Leu Ser Gly His Thr Cys Phe Thr Leu
20 25 30
Thr Gly Leu Leu Gly Thr Leu Val Thr Met Gly Leu Leu Thr
35 40 45
<210> 202
<211> 46
<212> PRT
<213> 人工序列
<220>
<223> RRRR-APNFS-GPI的氨基酸序列(包含P2A多肽片段中
的T2P突变)
<400> 202
Arg Arg Arg Arg Ala Pro Asn Phe Ser Pro Asn Lys Gly Ser Gly Thr
1 5 10 15
Thr Ser Gly Thr Thr Arg Leu Leu Ser Gly His Thr Cys Phe Thr Leu
20 25 30
Thr Gly Leu Leu Gly Thr Leu Val Thr Met Gly Leu Leu Thr
35 40 45
<210> 203
<211> 60
<212> PRT
<213> 人工序列
<220>
<223> RRRR-(PTNFS)P2A-GPI的氨基酸序列(包含P2A多肽
中的A1P突变)
<400> 203
Arg Arg Arg Arg Pro Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp
1 5 10 15
Val Glu Glu Asn Pro Gly Pro Pro Asn Lys Gly Ser Gly Thr Thr Ser
20 25 30
Gly Thr Thr Arg Leu Leu Ser Gly His Thr Cys Phe Thr Leu Thr Gly
35 40 45
Leu Leu Gly Thr Leu Val Thr Met Gly Leu Leu Thr
50 55 60
<210> 204
<211> 60
<212> PRT
<213> 人工序列
<220>
<223> RRRR-(GTNFS)P2A-GPI的氨基酸序列(包含P2A多肽中
的A1G突变)
<400> 204
Arg Arg Arg Arg Gly Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp
1 5 10 15
Val Glu Glu Asn Pro Gly Pro Pro Asn Lys Gly Ser Gly Thr Thr Ser
20 25 30
Gly Thr Thr Arg Leu Leu Ser Gly His Thr Cys Phe Thr Leu Thr Gly
35 40 45
Leu Leu Gly Thr Leu Val Thr Met Gly Leu Leu Thr
50 55 60
<210> 205
<211> 60
<212> PRT
<213> 人工序列
<220>
<223> RRRR-(AGNFS)P2A-GPI的氨基酸序列(包含P2A多肽中
的T2G突变)
<400> 205
Arg Arg Arg Arg Ala Gly Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp
1 5 10 15
Val Glu Glu Asn Pro Gly Pro Pro Asn Lys Gly Ser Gly Thr Thr Ser
20 25 30
Gly Thr Thr Arg Leu Leu Ser Gly His Thr Cys Phe Thr Leu Thr Gly
35 40 45
Leu Leu Gly Thr Leu Val Thr Met Gly Leu Leu Thr
50 55 60
<210> 206
<211> 60
<212> PRT
<213> 人工序列
<220>
<223> RRRR-(APNFS)P2A-GPI的氨基酸序列(包含P2A多肽中
的T2P突变)
<400> 206
Arg Arg Arg Arg Ala Pro Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp
1 5 10 15
Val Glu Glu Asn Pro Gly Pro Pro Asn Lys Gly Ser Gly Thr Thr Ser
20 25 30
Gly Thr Thr Arg Leu Leu Ser Gly His Thr Cys Phe Thr Leu Thr Gly
35 40 45
Leu Leu Gly Thr Leu Val Thr Met Gly Leu Leu Thr
50 55 60

Claims (20)

1.一种用于抗原结合分子的表达系统,其中所述抗原结合分子是可分泌的或膜结合的,所述表达系统包括:
-编码所述抗原结合分子的第一部分的第一抗原结合多核苷酸;
-编码包含弗林蛋白酶共有序列RXKR(SEQ ID NO:1)或RXRR(SEQ ID NO:2)及其2A多肽片段的切割位点的切割多核苷酸;
-编码膜锚多肽的锚多核苷酸;
其中所述其2A多肽片段包含在任一氨基酸残基中的一个或多个突变以控制所述切割位点的切割效率,以调节可分泌抗原结合分子相对于膜结合抗原结合分子的产生比率;
其中所述切割多核苷酸在所述第一抗原结合多核苷酸和所述锚多核苷酸之间;
其中当所述切割位点被切割时,包含所述抗原结合分子的第一部分的所述可分泌抗原结合分子被释放;
其中当所述切割位点不被切割时,所述膜结合抗原结合分子被释放,所述膜结合抗原结合分子包含所述抗原结合分子的第一部分、所述弗林蛋白酶共有序列RXKR(SEQ ID NO:1)或RXRR(SEQ ID NO:2)、所述其2A多肽片段和所述膜锚多肽。
2.如权利要求2所述的表达系统,其进一步包含编码所述抗原结合分子的第二部分的第二抗原结合多核苷酸。
3.如权利要求2或3所述的表达系统,其中所述其2A多肽片段在氨基酸残基1、2、3、4或5中包含一个或多个突变。
4.如权利要求1-3中任一项所述的表达系统,其中所述其2A多肽片段选自以下组成的组:其P2A、F2A、E2A和T2A片段。
5.如权利要求1-4中任一项所述的表达系统,其中所述氨基酸突变为甘氨酸、脯氨酸或丙氨酸。
6.如权利要求1-5中任一项所述的表达系统,其中所述一个或多个突变选自由以下组成的组:A1P、A1G、T2G、T2P、N3P、F4P、S5P、N3A和F4A。
7.如权利要求1所述的表达系统,其中所述膜锚多肽是糖磷脂跨膜结构域(GPI)、血小板衍生生长因子受体(PDGFR)β链跨膜结构域(PTM)或鼠B7-1抗原的免疫球蛋白C2型细胞外-跨膜-胞质结构域。
8.一种用于抗原结合分子的表达系统,其中所述抗原结合分子是可分泌的或膜结合的,所述表达系统包括:
-编码所述抗原结合分子的第一部分的第一抗原结合多核苷酸;
-编码第一切割位点的第一切割多核苷酸,其中所述第一切割位点是最小弗林蛋白酶切割共有序列RXKR(SEQ ID NO:1)或RXRR(SEQ ID NO:2);
-编码自加工第二切割位点的第二切割多核苷酸,其中所述自加工第二切割位点是2A多肽或其片段;
-编码膜锚多肽的锚多核苷酸;
其中所述2A多肽或其片段包含在任一氨基酸残基中的一个或多个突变以控制所述第一切割位点和所述第二切割位点的切割效率,以调节可分泌抗原结合分子相对于膜结合抗原结合分子的产生比率;
其中所述第一切割多核苷酸和所述第二切割多核苷酸在所述第一抗原结合多核苷酸和所述锚多核苷酸之间;
其中当所述第一切割位点被切割时,包含所述抗原结合分子的第一部分的所述可分泌抗原结合分子被释放;
其中当所述第一切割位点和所述第二切割位点不被切割时,所述膜结合抗原结合分子被释放,所述膜结合抗原结合分子包含所述抗原结合分子的第一部分,所述最小弗林蛋白酶切割共有序列RXKR(SEQ ID NO:1)或RXRR(SEQ ID NO:2),所述2A多肽或其片段和所述膜锚多肽。
9.如权利要求8所述的表达系统,其进一步包含编码所述抗原结合分子的第二部分的第二抗原结合多核苷酸。
10.如权利要求8或9所述的表达系统,其中所述2A多肽或其片段在氨基酸残基1、2、3、4或5中包含一个或多个突变。
11.如权利要求8-10中任一项所述的表达系统,其中所述2A多肽或其片段选自由以下组成的组:P2A、F2A、E2A和T2A或其片段。
12.如权利要求8-11中任一项所述的表达系统,其中所述氨基酸被突变为甘氨酸、脯氨酸或丙氨酸。
13.如权利要求8-12中任一项所述的表达系统,其中所述一个或多个突变选自由以下组成的组:A1P、A1G、T2G、T2P、N3P、F4P、S5P、N3A和F4A。
14.如权利要求8所述的表达系统,其中所述膜锚多肽是糖磷脂跨膜结构域(GPI)、血小板衍生生长因子受体(PDGFR)β链跨膜结构域(PTM)或鼠B7-1抗原的免疫球蛋白C2型细胞外-跨膜-胞质结构域。
15.一种载体,其包含如权利要求1-14中任一项所述的表达系统。
16.一种宿主细胞,其包含如权利要求1-14中任一项所述的表达系统或如权利要求15所述的载体。
17.一种试剂盒,其包含如权利要求1-14中任一项所述的表达系统、如权利要求15所述的载体或如权利要求16所述的宿主细胞。
18.一种用于检测样品中一种或多种分泌抗体和/或一种或多种表面结合抗体的存在的方法,所述方法包括:
-提供如权利要求1-7中任一项所述的表达系统;
-将所述表达系统递送至一种或多种靶细胞,其中所述靶细胞转录所述表达系统,其中一旦转录,所述切割位点在第一多个所述抗原结合分子的第一部分中被切割,使得所述第一多个所述抗原结合分子的第一部分不包含所述膜锚多肽,并由此由所述靶细胞分泌,并且其中所述切割位点在第二多个所述抗原结合分子的第一部分中不被切割,使得所述第二多个所述抗原结合分子的第一部分包含所述膜锚多肽,并由此结合到所述靶分子的表面;和
-检测由所述靶细胞分泌的所述第一多个所述抗原结合分子的第一部分的存在或不存在和/或检测所述靶细胞的表面上所述第二多个所述抗原结合分子的第一部分的量。
19.一种用于检测样品中一种或多种分泌抗体和/或一种或多种表面结合抗体的存在的方法,所述方法包括:
-提供如权利要求8-14中任一项所述的表达系统;
-将所述表达系统递送至一种或多种靶细胞,其中所述靶细胞转录所述表达系统,其中一旦转录,所述第一切割位点在第一多个所述抗原结合分子的第一部分中被切割,使得所述第一多个所述抗原结合分子的第一部分不包含所述膜锚多肽,并由此由所述靶细胞分泌,并且其中所述第一切割位点和所述第二切割位点在第二多个所述抗原结合分子的第一部分中不被切割,使得所述第二多个所述抗原结合分子的第一部分包含所述膜锚多肽,并由此结合到所述靶分子的表面;和
-检测由所述靶细胞分泌的所述第一多个所述抗原结合分子的第一部分的存在或不存在和/或检测所述靶细胞的表面上所述第二多个所述抗原结合分子的第一部分的量。
20.如权利要求1-14中任一项所述的表达系统、如权利要求15所述的载体、如权利要求16所述的宿主细胞或如权利要求17所述的试剂盒,用于筛选抗体文库或抗体生产。
CN202180067891.0A 2020-10-02 2021-10-01 用于蛋白质生产和筛选的表达系统 Pending CN116419973A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
SG10202009841Y 2020-10-02
SG10202009841Y 2020-10-02
PCT/SG2021/050592 WO2022071887A1 (en) 2020-10-02 2021-10-01 Expression system for protein production and screening

Publications (1)

Publication Number Publication Date
CN116419973A true CN116419973A (zh) 2023-07-11

Family

ID=80951931

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180067891.0A Pending CN116419973A (zh) 2020-10-02 2021-10-01 用于蛋白质生产和筛选的表达系统

Country Status (4)

Country Link
US (1) US20240010752A1 (zh)
EP (1) EP4192959A1 (zh)
CN (1) CN116419973A (zh)
WO (1) WO2022071887A1 (zh)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9540657B2 (en) * 2012-05-25 2017-01-10 California Institute Of Technology Expression of secreted and cell-surface polypeptides

Also Published As

Publication number Publication date
US20240010752A1 (en) 2024-01-11
WO2022071887A1 (en) 2022-04-07
EP4192959A1 (en) 2023-06-14

Similar Documents

Publication Publication Date Title
JP6754414B2 (ja) ヒト細胞系における組換えヒトタンパク質の無血清安定トランスフェクションおよび製造
US20230227850A1 (en) Recombinant arterivirus replicon systems and uses thereof
US8957196B2 (en) Vector and expression cell line for mass production of recombinant protein and a process of producing recombinant protein using same
RU2494147C2 (ru) Вектор экспрессии млекопитающих
CN102648288A (zh) 基于抑制的对细胞克隆的高通量筛选方法
CN105849268B (zh) 具有改进的基因表达能力的表达载体
JP6087148B2 (ja) タンパク質の生産方法
US10563222B2 (en) Promoters for high level expression
US20110171729A1 (en) Method for Producing Stable Mammalian Cell Lines Producing High Levels of Recombinant Proteins
JP7179828B2 (ja) 安定産生細胞株の作製のための選択マーカーとしての成長因子受容体の恒常的活性型変異体の使用
EA037273B1 (ru) Экспрессионная кассета
CN116419973A (zh) 用于蛋白质生产和筛选的表达系统
JP7264353B2 (ja) 新規ベクターおよびその利用
CN109790214B (zh) 用于选择产生多肽的细胞的改进方法
Dröge Mammalian Expression Systems
Jiang et al. Recent advances in transient gene expression protocol
CN114008081A (zh) 通过以限定的组织形式靶向整合多个表达盒来产生二价双特异性抗体表达细胞的方法
CN114258403A (zh) 通过以限定的组织形式靶向整合多个表达盒来产生多价多特异性抗体表达细胞的方法
CN114080451A (zh) 通过使用Cre mRNA进行的靶向整合来产生蛋白质表达细胞的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination