CN115427577A - 活性特异性细胞富集 - Google Patents

活性特异性细胞富集 Download PDF

Info

Publication number
CN115427577A
CN115427577A CN202180021372.0A CN202180021372A CN115427577A CN 115427577 A CN115427577 A CN 115427577A CN 202180021372 A CN202180021372 A CN 202180021372A CN 115427577 A CN115427577 A CN 115427577A
Authority
CN
China
Prior art keywords
host cells
gene product
interest
expressed
population
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180021372.0A
Other languages
English (en)
Inventor
J·刘
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Absci Corp
Original Assignee
Absci Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Absci Corp filed Critical Absci Corp
Publication of CN115427577A publication Critical patent/CN115427577A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1093General methods of preparing gene libraries, not provided for in other subgroups
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/65Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression using markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/02Libraries contained in or displayed by microorganisms, e.g. bacteria or animal cells; Libraries contained in or displayed by vectors, e.g. plasmids; Libraries containing only microorganisms or vectors

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

提供了一种活性特异性细胞富集方法,所述方法能够从可以包括表达载体的宿主细胞的遗传多样性池中选择高性能宿主细胞和/或表达载体。

Description

活性特异性细胞富集
相关申请交叉引用
本申请要求2020年1月15日提交的美国临时专利申请第62/961,392号的权益,所述美国临时专利申请以全文引用的方式并入本文。
技术领域
本公开涉及分子生物学和生物技术制造的一般技术领域。更具体地,本公开属于用于基因产物表达的宿主细胞工程的技术领域。
背景技术
生物技术物质的产生是一个复杂的过程,受到多种因素的影响,所述多种因素影响由宿主细胞表达的基因产物,如蛋白质的质量和数量。考虑到包括表达构建体的宿主细胞群体,其中宿主细胞基因组和/或表达构建体之间存在变异(多样性),从所述多样化群体中选择能够产生期望量的活性基因产物/细胞的宿主细胞和/或表达构建体将是有利的。当基因产物完全在宿主细胞质中表达时,实现此目的的技术挑战更难克服,并且因此不易被基因产物特异性检测试剂接触。
发明内容
显然需要用于选择高性能宿主细胞和/或表达构建体的改进方法。本公开提供了从可以包括表达构建体的宿主细胞的遗传多样性群体中活性特异性富集高性能细胞的方法。
因此,在一些实施例中,提供了用于从具有遗传多样性的宿主细胞的群体中选择表达的宿主细胞的方法,所述遗传多样性包括多个遗传变体,其中所述宿主细胞中的至少一些宿主细胞包括编码所关注的基因产物的多核苷酸序列。在一些实例中,所述方法包含培养所述宿主细胞的群体,由此所述所关注的基因产物通过所述群体中的所述宿主细胞的亚群表达,所述亚群由此包括表达的宿主细胞,其中来自所述表达的宿主细胞的所述所关注的基因产物的表达水平基于所述遗传变体而变化;标记所述亚群中的所述表达的宿主细胞中的至少一些表达的宿主细胞,其中所述标记包括使所述所关注的基因产物与可检测部分相关联,其中所述标记的量与所述表达的宿主细胞中的所述所关注的基因产物的所述表达水平成比例,由此产生经标记的表达的宿主细胞;以及选择经标记的表达的宿主细胞的子集,其中所述选择包括通过细胞分选设备检测所述可检测部分和所述标记的量。在一些实例中,表达的宿主细胞通过测量每种遗传变体的所述所关注的基因产物的相对表达水平来确定。
在其它实施例中,提供了用于从具有遗传多样性的宿主细胞的群体中选择表达的宿主细胞的方法,所述遗传多样性包括多个遗传变体,其中所述宿主细胞中的至少一些宿主细胞包括编码所关注的基因产物的多核苷酸序列。在一些实例中,所述方法包含培养所述宿主细胞的群体,由此所述所关注的基因产物通过所述群体中的所述宿主细胞的亚群表达,所述亚群由此包括表达的宿主细胞,其中所述表达的宿主细胞的预定特性基于所述遗传变体而变化;标记所述亚群中的所述表达的宿主细胞中的至少一些表达的宿主细胞,其中所述标记包括使所述所关注的基因产物与可检测部分相关联,其中所述标记的量与所述表达的宿主细胞中的所述所关注的基因产物的所述预定特性成比例,由此产生经标记的表达的宿主细胞;以及选择经标记的表达的宿主细胞的子集,其中所述选择包括通过细胞分选设备检测所述可检测部分和所述预定。在特定实例中,所述表达的宿主细胞的所述预定特性包括所关注的活性基因产物的表达水平、所述所关注的基因产物的表达水平、所述所关注的基因产物的适当蛋白质折叠、所述所关注的基因产物的适当折叠的蛋白质的表达水平、细胞活力和/或生物质的量。在另外的实例中,通过测量每种遗传变体的所述所关注的基因产物的相对表达水平来确定表达的宿主细胞。
还提供了用于从具有至少1000个遗传多样性的宿主细胞的群体中选择宿主细胞的方法,其中所述宿主细胞中的至少一些宿主细胞包括编码所关注的基因产物的多核苷酸序列。在一些实例中,所述方法包含培养所述宿主细胞的群体,由此所述所关注的基因产物通过所述群体中的所述宿主细胞的亚群表达,所述亚群由此包括表达的宿主细胞;标记所述亚群中的所述表达的宿主细胞中的至少一些表达的宿主细胞,其中所述标记包括使所述所关注的基因产物与可检测部分相关联,由此产生经标记的表达的宿主细胞;以及选择经标记的表达的宿主细胞的子集,其中所述选择包括通过细胞分选设备检测所述可检测部分。在一些实例中,表达的宿主细胞通过测量每种遗传变体的所述所关注的基因产物的相对表达水平来确定。
在所公开的方法的实施例中,所述宿主细胞群体的所述遗传多样性是由所述宿主细胞群体的至少一些所述宿主细胞组成的宿主细胞基因组变异、一种或多种表达构建体的多核苷酸序列变异或其组合。在特定实例中,所述宿主细胞的群体的所述遗传多样性为200,000-1,000,000。
在所述方法的实施例中,所述选择是荧光激活的细胞分选。在一些实例中,所述可检测部分是荧光部分,并且所述选择包括选择具有最高荧光发射的0.01%-5%的细胞。在特定非限制性实例中,所述选择包括选择具有最高荧光发射的0.5%的细胞。
在所述方法的另外的实施例中,所述所关注的基因产物包括缺乏信号肽的多肽。在其它实施例中,所述所关注的基因产物包括与选自由荧光多肽和生物发光多肽组成的组的第二多肽使用相同读框融合的第一多肽。在一些实例中,与所述所关注的基因产物相关联的所述可检测部分包括选自由荧光多肽和生物发光多肽组成的组的所述多肽。其它实施例中,所述所关注的基因产物包括与具有酶活性的第二多肽使用相同读框融合的第一多肽。在一些实例中,与所述所关注的基因产物相关联的所述可检测部分与具有酶活性的所述多肽的活性位点结合。
在所述方法的一些实施例中,编码所述所关注的基因产物的所述多核苷酸序列是表达载体。在一些实例中,所述表达载体是染色体外表达载体。
在另外的实施例中,标记所述亚群中的所述表达的宿主细胞中的至少一些表达的宿主细胞包括固定表达的宿主细胞的所述亚群。固定表达的宿主细胞的所述亚群可以包含使所述亚群的所述表达的宿主细胞的至少一些表达的宿主细胞与醛,例如多聚甲醛接触。
在其它实施例中,标记所述亚群中的所述表达的宿主细胞中的至少一些表达的宿主细胞包括使所述亚群的所述表达的宿主细胞的至少一些表达的宿主细胞透化,例如使所述亚群的所述表达的宿主细胞的至少一些表达的宿主细胞与溶菌酶接触。
在另外的实施例中,标记所述亚群中的所述表达的宿主细胞中的至少一些表达的宿主细胞进一步包括使所述亚群的所述表达的宿主细胞的至少一些表达的宿主细胞与标记DNA,例如碘化丙啶的化合物接触。
在一些实施例中,宿主细胞的所述群体是原核细胞。在一个实例中,所述宿主细胞是大肠杆菌(Escherichia coli)细胞,如大肠杆菌521细胞。
在一些实施例中,所述方法还包含从经标记的表达的宿主细胞的所述子集中回收多核苷酸,由此产生经回收的多核苷酸。在一些实施例中,所述方法还包含从所述经回收的多核苷酸中获得DNA序列信息。所述方法可以进一步包含基于所述DNA序列信息对宿主细胞的基因组进行修饰,例如,基于所述DNA序列信息构建表达载体的文库。在一些实例中,用所述表达载体的文库进一步转化亲本宿主细胞品系。在其它实例中,所述经回收的多核苷酸是表达载体,并且所述方法可以进一步包含用一种或多种所述经回收的表达载体转化亲本宿主细胞品系。所述方法可以进一步包含培养经转化的宿主细胞,其中所述经转化的宿主细胞中的至少一些经转化的宿主细胞表达所述所关注的基因产物。在一些实例中,例如通过以下方法来确定所述所关注的基因产物的所述表达水平:凝胶电泳、酶联免疫吸附测定(ELISA)、包含高效液相色谱法(HP-LC)的液相色谱法(LC)、固相萃取质谱法(SPE-MS)或放大发光接近均相测定。
本公开的前述特征和其它特征将根据以下参考附图进行的详细描述而变得更加明显。
附图说明
图1A-1F是活性特异性细胞富集过程的实施例的示意图。向下箭头表示通过应用由水平虚线表示的选择性过程,从大型遗传多样性宿主细胞群体开始选择高性能宿主细胞(图1A)。图1B指示通过使用细胞分选设备,例如通过活性特异性细胞分选来选择高性能宿主细胞。图1C示出了所选的宿主细胞群体,在一些实施例中,所述宿主细胞群体可以是用从所选的高性能宿主细胞回收的染色体外表达载体,或使用来自所选的高性能宿主细胞的序列信息创建的“高性能”表达载体文库转化亲本宿主细胞品系的结果。图1D和1E示出了利用高通量测定,如SPE-MS和/或基于活性的测定(图1E)如抗原结合测定进一步选择高性能宿主细胞(图1D)。如在图1F中所示出的,在发酵过程中,可以针对滴度和产物质量两者来优化性能最高的宿主细胞以确保可扩展性。图1B、1D、1E和1F中所示出的选择过程中的每个选择过程可以根据需要重复以进一步选择高性能宿主细胞。
图2A-2C示出了指示处于“低DNA”门控参数内的检测事件的三个FACS图。在每个图中,使用荧光标记的HER2蛋白,针对对于TRAST-Fab表达标记的宿主细胞的荧光(530nm/30滤光片FSC-A)绘制的经标记的宿主细胞的DNA荧光(675nm/20滤光片FSC-A)。图2A是阴性对照样品A1,包括空载体的宿主细胞群体。图2B是阳性对照样品A3,以双顺反子布置表达TRAST-Fab重链和轻链的宿主细胞群体具有cDsbC共表达(参见表1)。图2C是实验样品B1,即以双顺反子布置表达DnaB-TRAST-Fab重链和DnaB-TRAST-Fab轻链的宿主细胞群体,其中在所述宿主细胞群体中存在1.7百万种不同形式的DnaB-TRAST-Fab的表达载体。
图3是示出用于高水平的DnaB-TRAST-Fab表达的从通过FACS选择的宿主细胞中回收的表达载体的NGS(下一代测序)分析结果的直方图。示出了宿主细胞的B1群体的结果(参见表1),其包括编码137种不同的基因产物的表达载体,所述不同的基因产物与来自丙酸盐诱导型(prp)启动子的DnaB-TRAST-Fab共表达。保留FACS分选之前的B1宿主细胞的样品以用于NGS分析,并且回收来自这些分选前细胞和来自FACS分选(“分选后”)细胞的质粒DNA并通过NGS测序。从prp启动子共表达的编码序列的同一性由序列数据确定,并且存在于分选前和分选后B1宿主细胞群体中的137种不同基因产物中的每种基因产物的频率在直方图中示出。
图4A-4B示出了指示处于“低DNA”门控参数内的检测事件的两个FACS图。在每个图中,使用荧光标记的HER2蛋白,针对对于TRAST-Fab表达标记的宿主细胞的荧光(530nm/30滤光片FSC-A)绘制的经标记的宿主细胞的DNA荧光(675nm/20滤光片FSC-A)。图4A是通过FACS分选前的宿主细胞群体B1,即以双顺反子布置表达DnaB-TRAST-Fab重链和DnaB-TRAST-Fab轻链宿主细胞群体,其中在所述宿主细胞群体中存在1.7百万种不同形式的DnaB-TRAST-Fab的表达载体(参见表1)。图4B是使用从B1宿主细胞群体中回收的表达载体重建的宿主细胞群体B1*,所述表达载体由FACS分选以选择表达高水平的DnaB-TRAST-Fab的宿主细胞。
图5是绘制针对通过固相萃取质谱法(SPE-MS)测量的每OD的DnaB-TRAST-Fab轻链(“LC”)的产生在600nm处的每宿主细胞培养物光密度(“OD”)的DnaB-TRAST-Fab重链(“HC”)的产生的图。通过FACS对多种宿主细胞群体B1进行分类以鉴定表达高水平的DnaB-TRAST-Fab的宿主细胞,并且来自那些高性能宿主细胞的表达载体用于重建所选的宿主细胞群体B1*。然后测试单独的B1*宿主细胞的DnaB-TRAST-Fab表达,并且通过SPE-MS测量DnaB-TRAST-Fab HC和LC肽的产生。
图6示出了FACS图,其证明了曲妥珠单抗(Trastuzumab)Fab'高表达载体在分选前(ACE之前)和分选后、分离质粒载体和重新转化(ACE之后)的三个未处理的文库中的富集。在ACE之前和之后均施加相同的分选门(<0.5%)。
图7A-7B示出了FACS图,其中门控是通过阴性对照和阳性对照建立的(图7A)并且在分选后曲妥珠单抗Fab'的表达增加(图7B)。
序列表
使用核苷酸碱基和氨基酸的标准字母缩写示出本文或随附序列表中所列出的任何核酸和氨基酸序列,如37C.F.R.§1.822中所限定。在至少一些情况下,每个核酸序列只示出了一条链,但是通过对所显示的链的任何参考,互补链被理解为包含在内。
SEQ ID NO:1是示例性双启动子表达载体的核酸序列。
SEQ ID NO:2是曲妥珠单抗-Fab重链A2的氨基酸序列。
SEQ ID NO:3是曲妥珠单抗-Fab轻链A2的氨基酸序列。
SEQ ID NO:4是定位于细胞质(cDsbC)的二硫键异构酶蛋白DsbC的氨基酸序列。
SEQ ID NO:5是双顺反子曲妥珠单抗-Fab重链A3的氨基酸序列。
SEQ ID NO:6是双顺反子曲妥珠单抗-Fab轻链A3的氨基酸序列。
SEQ ID NO:7是具有源自集胞藻(Synechocystis sp.)DnaB的N末端氨基酸序列的曲妥珠单抗-Fab重链的氨基酸序列。
SEQ ID NO:8是具有源自集胞藻DnaB的N末端氨基酸序列的曲妥珠单抗-Fab轻链的氨基酸序列。
SEQ ID NO:9是源自包含6xHis序列的集胞藻DnaB的N末端氨基酸序列的氨基酸序列。
具体实施方式
通过本文所提供的细胞富集方法解决了从此类细胞的遗传多样性群体中选择可以包括表达构建体的高性能宿主细胞的问题。这些方法提供了高性能宿主细胞的快速鉴定和分离,例如,表达比存在于遗传多样性宿主细胞群体中的其它宿主细胞更多的所关注的基因产物的宿主细胞。“高性能”还可以意指表达较少所关注的基因产物,例如在期望鉴定表达较少的蛋白酶、毒素或过敏基因产物的宿主细胞的情况下。
所提供的活性特异性细胞富集方法鉴定表达所关注的活性基因产物而不是非活性物质的宿主细胞。作为实例,可以通过活性基因产物特异性地结合结合伴侣分子的能力,或者通过基因产物参与化学或酶反应的能力将活性基因产物与非活性物质区分开来。多肽基因产物中适当形成的二硫键的存在指示其正确地折叠并且假定具有活性;确定多肽基因产物中二硫键的位置的方法参见实例1。在细胞富集方法中,通过利用与所关注的活性基因产物特异性地结合的适当标记复合物来检测所关注的活性基因产物,如如果所关注的基因产物是抗体或Fab,则为经标记的抗原;或者如果所关注的基因产物是受体或受体片段,则为经标记的配体,其中所述配体与所述受体的活性构象特异性地结合;或者如果所关注的基因产物是酶,则为经标记的底物或经标记的底物类似物,作为实例。对于任何所关注的基因产物,如果存在与活性基因产物特异性地结合而不与非活性基因产物特异性地结合的可用抗体或抗体片段,则所述抗体或抗体片段可以用于在与可检测部分连接时标记所关注的活性基因产物,如下文所描述的。
宿主细胞的群体中的遗传多样性可以例如由宿主细胞之间的基因组变异和/或因由宿主细胞组成的表达构建体的多核苷酸序列的差异引起。如果宿主细胞之间存在基因组多样性,则选择高性能宿主细胞和测序从其回收的基因组DNA可以用于鉴定与所选宿主细胞的卓越性能相关联的基因组差异,如突变。如果宿主细胞群体中的表达构建体之间存在多样性,则从所选的宿主细胞回收表达构建体,如表达载体,并且对表达构建体进行测序可以允许创建表达构建体的文库(“高性能文库”),所述表达构建体包括与高性能宿主细胞相关联的表达构建体元素。可以通过用高性能文库或者用所回收的高性能表达构建体自身转化亲本宿主细胞品系来重建活的高性能宿主细胞群体。亲本宿主细胞品系可以是用于产生针对高性能宿主细胞筛选的宿主细胞群体的品系,或者是可以用表达构建体进行基因修饰或转化以产生能够表达所关注的基因产物的宿主细胞品系的另一品系。
所提供的活性特异性细胞富集方法充分利用流式细胞仪的样品分析速度来分离高性能宿主细胞,如表达更多所关注的基因产物的高性能宿主细胞。在一些实施例中,可以在几分钟内分析多样性中超过一百万个宿主细胞的群体以确定是否存在更高性能的子集群体。如果这样,并且如果流式细胞仪是FACS仪器,则可以在一小时内分离来自罕见(一百万分之一)亚群的几百个更高性能的宿主细胞,以使得能够进行后续分析。定义宿主细胞亚群的标准可以包含在所定义的亚群内群体的无宿主细胞、一些宿主细胞或所有宿主细胞;在一些情况下,亚群可以与群体共存。例如,由经标记的所关注的基因产物以流式细胞仪可检测的水平的表达所定义的宿主细胞的亚群可以包含群体的所有宿主细胞或绝大部分宿主细胞。
在一些实施例中,活性特异性细胞富集方法涉及以下方面:(1)提供可以包括表达构建体的宿主细胞的遗传多样性群体;(2)通过将所关注的基因产物表达为可检测的融合蛋白,或者通过使所关注的基因产物与特异性地结合所关注的活性基因产物的标记复合物接触来标记宿主细胞内的所关注的基因产物;(3)使用采用流式细胞术或可比较方法的分选装置选择高性能宿主细胞;(4)分析所选的宿主细胞和/或表达载体;(5)重建宿主细胞品系;(6)任选地进一步分析所重建的宿主细胞品系,特别是关于所关注的基因产物的活性;以及(7)任选地重复上述(1)-(6)中的任何方面或全部方面。所述方法的这些方面在图1A-1F中示意性地示出,并且在下文更详细地描述。
I.宿主细胞和/或表达构建体的遗传多样性群体
A.宿主细胞
本文所公开的细胞富集方法被设计成选择表达期望水平的活性基因产物的宿主细胞。用于本文所描述的细胞富集方法中,宿主细胞可以是能够表达基因产物并通过流式细胞术或可比较方法分选的任何细胞,如单细胞生物体、在培养物中生长的分离的细胞或衍生自多细胞生物体的分离的细胞。提供了允许基因产物,如包括二硫键的多肽基因产物的有效诱导表达的宿主细胞的实例。
特别合适的宿主细胞能够在发酵培养物中以高细胞密度生长,并且可以通过高度控制的可诱导基因表达在氧化性宿主细胞质中产生基因产物。通过组合具有以下特征中的一些特征或全部特征来产生具有这些质量的宿主细胞。(1)通过增加细胞质中的氧化性多肽的表达或功能,和/或通过减少细胞质中的还原性多肽的表达或功能,将宿主细胞基因修饰以具有氧化性细胞质。半胱氨酸氧化酶DsbA、二硫键异构体酶DsbC或通常转运到周质中的Dsb蛋白的组合的表达增加已经用于需要二硫键的异源蛋白的表达(Makino等人,“(用于改进细菌中重组蛋白表达的品系工程(Strain engineering for improved expressionof recombinant proteins in bacteria)”,《微生物细胞杂志(Microb Cell Fact)》2011年5月14日;10:32)。还可能表达这些Dsb蛋白的细胞质形式,如DsbC(“cDsbC”)的细胞质版本,例如具有二十个氨基酸的N末端截短,其缺乏信号肽并且因此不转运到周质中。细胞质Dsb蛋白,如cDsbC可用于使宿主细胞的细胞质更具氧化性,并且因此更有利于在细胞质中产生的异源蛋白中形成二硫键。通过直接改变硫氧还蛋白和谷氧还蛋白/谷胱甘肽酶系统来使宿主细胞质更具氧化性:谷胱甘肽还原酶(gor)或谷胱甘肽合成酶(gshB)中有缺陷的突变品系,连同硫氧还蛋白还原酶(trxB)一起使细胞质具有氧化性。这些品系不能减少核糖核苷酸并且因此不能在不存在外源还原剂如二硫苏糖醇(DTT)的情况下生长。编码过氧化物酶AhpC的基因ahpC中的抑制突变(ahpC*或ahpCΔ),将其转化为产生还原型谷胱甘肽的二硫还原酶,从而允许将电子引导到酶核糖核苷酸还原酶上,并且使gor和trxB中有缺陷的细胞,或gshB和trxB中有缺陷的细胞在不存在DTT的情况下生长。不同类型的AhpC的突变形式可以允许在γ-谷氨酰半胱氨酸合成酶(gshA)的活性中有缺陷和在trxB中有缺陷的品系在不存在DTT的情况下生长;这些包含AhpC V164G、AhpC S71F、AhpC E173/S71F、AhpCE171Ter和AhpC dup162–169(Faulkner等人,“过氧化物酶的功能可塑性允许多种二硫化物还原途径的进化(Functional plasticity of a peroxidase allows evolution ofdiverse disulfide-reducing pathways)”,《美国国家科学院院刊(Proc Natl Acad SciU S A)》2008年5月6日;105(18):6735-6740,电子版2008年5月2日)。(2)任选地,宿主细胞还可以经基因修饰以表达有助于产生期望基因产物的伴侣和/或辅因子,和/或糖基化多肽基因产物。(3)宿主细胞含有另外的基因修饰,所述基因修饰被设计成改善来自表达构建体的基因产物表达的某些方面。在特定实施例中,宿主细胞(A)具有编码至少一个诱导型启动子的诱导物的转运蛋白的至少一个基因的基因功能的改变,并且作为另一实例,其中编码所述转运蛋白的基因选自由以下组成的组:araE、araF、araG、araH、rhaT、xylF、xylG和xylH,或特别是araE,或其中基因功能的改变更具体地是来自组成型启动子的araE的表达;和/或(B)具有编码代谢至少一个诱导型启动子的诱导物的蛋白质的至少一个基因的降低水平的基因功能,并且作为另外的实例,其中编码代谢至少一个诱导型启动子的诱导物的蛋白质的基因选自由以下组成的组:araA、araB、araD、prpB、prpD、rhaA、rhaB、rhaD、xylA和xylB;和/或(C)具有编码涉及至少一个诱导型启动子的诱导物的生物合成的蛋白质的至少一个基因的降低水平的基因功能,在另外的实施例中,所述基因选自由以下组成的组:scpA/sbm、argK/ygfD、scpB/ygfG、scpC/ygfH、rmlA、rmlB、rmlC和rmlD。
在某些实施例中,宿主细胞是微生物细胞,如酵母(酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)等)或细菌细胞,或者是革兰式阳性细菌(gram-positivebacteria)或革兰式阴性细菌(gram-negative bacteria),或者是大肠杆菌(E.coli),或者是大肠杆菌B品系,或者是大肠杆菌B品系521细胞,或者是大肠杆菌B品系522细胞。大肠杆菌521和522细胞具有以下基因型:
大肠杆菌521:ΔaraBAD fhuA2[lon]ompT ahpCΔ galλatt::pNEB3-r1-cDsbC(Spec,lacI)ΔtrxB sulA11 R(mcr-73::miniTn10--TetS)2[dcm]R(zgb-210::Tn10--TetS)ΔaraEp::J23104ΔscpA-argK-scpBCendA1rpsL-Arg43ΔgorΔ(mcrC-mrr)114::IS10
大肠杆菌522:ΔaraBAD fhuA2 prpD[lon]ompT ahpCΔ galλatt::pNEB3-r1-cDsbC(Spec,lacI)ΔtrxB sulA11 R(mcr-73::miniTn10--TetS)2[dcm]R(zgb-210::Tn10--TetS)ΔaraEp::J23104ΔscpA-argK-scpBCendA1rpsL-Arg43ΔgorΔ(mcrC-mrr)114::IS10
在具有氧化性细胞质的大肠杆菌宿主细胞的生长实验中,我们已确定具有氧化性细胞质的大肠杆菌B品系能够生长到比对应的大肠杆菌K品系高得多的细胞密度。其它合适的品系包含大肠杆菌B品系
Figure BDA0003846877850000101
表达(NEB目录号C3028H)和
Figure BDA0003846877850000102
T7表达(NEB目录号C3029H)和大肠杆菌K品系
Figure BDA0003846877850000103
T7(NEB目录号C3026H)。
在一些实施例中,宿主细胞是原核宿主细胞。原核宿主细胞可以包含古菌(archaea)(如盐富饶菌(Haloferax volcanii)、硫磺矿硫化叶菌(Sulfolobussolfataricus))、革兰氏阳性菌(如枯草芽孢杆菌(Bacillus subtilis)、地衣芽孢杆菌(Bacillus licheniformis)、桥石短芽孢杆菌(Brevibacillus choshinensis)、短乳杆菌(Lactobacillus brevis)、布氏乳杆菌(Lactobacillus buchneri)、乳酸乳球菌(Lactococcus lactis)和变铅青链霉菌(Streptomyces lividans))或革兰氏阴性菌细菌,包含变形杆菌纲(Alphaproteobacteria)(根癌土壤杆菌(Agrobacterium tumefaciens)、新月柄杆菌(Caulobacter crescentus)、类球红杆菌(Rhodobacter sphaeroides)和苜蓿中华根瘤菌(Sinorhizobium meliloti))、β-变形菌(Betaproteobacteria)(真养产碱杆菌(Alcaligenes eutrophus)和丙型变形细菌纲(Gammaproteobacteria)(酸钙不动杆菌(Acinetobacter calcoaceticus)、固氮菌(Azotobacter)、棕色固氮菌(vinelandii)、大肠杆菌、铜绿假单胞菌(Pseudomonas aeruginosa)和恶臭假单胞菌(Pseudomonas putida))。优选的宿主细胞包含家族肠杆菌科的γ-变形杆菌(Gammaproteobacteria),如肠杆菌(Enterobacter)、欧文氏菌(Erwinia)、埃希氏菌属(Escherichia)(包含大肠杆菌)、克雷伯氏菌属(Klebsiella)、变形杆菌(Proteus)、沙门氏菌(Salmonella)(包含鼠伤寒沙门氏菌(Salmonella typhimurium))、沙雷氏菌属(Serratia)(包含粘质沙雷氏菌(Serratiamarcescans))和志贺氏杆菌(Shigella)。
许多另外类型的宿主细胞可以用于本文所提供的方法中,包含真核细胞,如酵母(休哈塔假丝酵母(Candida shehatae)、乳酸克鲁维酵母(Kluyveromyces lactis)、脆壁克鲁维氏酵母(Kluyveromyces fragilis)、其它克鲁维酵母菌属(Kluyveromyces species)、毕赤酵母(Pichia pastoris)、酿酒酵母(Saccharomyces cerevisiae)、巴氏酵母(Saccharomyces pastorianus)也称为卡尔斯伯酵母(Saccharomyces carlsbergensis)、粟酒裂殖酵母(Schizosaccharomyces pombe)、德克酵母属/酒香酵母属(Dekkera/Brettanomyces species)和解脂耶氏酵母(Yarrowia lipolytica));其它真菌(构巢曲霉(Aspergillus nidulans)、黑曲霉(Aspergillus niger)、粗糙脉孢菌(Neurosporacrassa)、青霉菌(Penicillium)、弯颈霉属(Tolypocladium)、木霉属(Trichodermareesia));昆虫细胞系(黑腹果蝇施耐德(Drosophila melanogaster Schneider)2细胞和草地贪夜蛾(Spodoptera frugiperda)Sf9细胞);以及哺乳动物细胞系,包含无限增殖化细胞系(中国仓鼠卵巢(CHO)细胞、HeLa细胞、幼仓鼠肾(BHK)细胞、猴肾细胞(COS)、人胚肾(HEK、293或HEK-293)细胞)和人肝癌细胞(Hep G2))。上述宿主细胞可从美国型培养物保藏中心(American Type Culture Collection)获得。
B.表达构建体
表达构建体是设计用于表达一种或多种所关注的基因产物的多核苷酸。某些所关注的基因产物是异源基因产物,因为其源自与其在其中表达的宿主细胞的物种不同的物种,和/或并非由在表达构建体内使用的启动子天然表达的异源基因产物。所关注的基因产物包含经修饰的基因产物,所述经修饰的基因产物被设计成包含与此类基因产物的天然存在形式的差异。异源和/或经修饰的基因产物的实例包含缺乏信号肽的多肽基因产物,所述信号肽因此表达并保留在宿主细胞质内。包括编码异源和/或经修饰的基因产物的多核苷酸,或包括源自不同物种的生物体的多核苷酸的组合,或包括已修饰以与天然存在的多核苷酸不同的多核苷酸的表达构建体不是天然存在的分子。表达构建体可以整合到宿主细胞染色体中,或者作为独立于宿主细胞染色体,如质粒或人工染色体复制的多核苷酸分子维持在宿主细胞内。表达构建体的实例是由将一个或多个多核苷酸序列插入到宿主细胞染色体中产生的多核苷酸,其中所插入的多核苷酸序列改变染色体编码序列的表达。表达载体是特异性地用于表达一种或多种基因产物的质粒表达构建体。一个或多个表达构建体可以整合到宿主细胞染色体中或者维持在染色体外多核苷酸,如质粒或人工染色体上。合适的表达构建体包含美国专利申请公开US20160376602A1中所描述的双启动子表达载体,所述美国专利申请公开以引用的方式并入本文。
表达构建体,如染色体外表达载体可以包括复制起点,如colE1、pMB1(pBR3220)、经修饰的pMB1(pUC9)、R1(ts)(pMOB45)、p15A(pPRO33)、pSC101、RK2、CloDF13(pCDFDuetTM-1)、ColA(pCOLADuetTM-1)和RSF1030/NTP1(pRSFDuetTM-1)。表达构建体还可以包括赋予抗生素抗性的至少一个选择性标记,如氨苄青霉素(AmpR)、氯霉素(CmlR或CmR)、卡那霉素(KanR)、大观霉素(SpcR)、链霉素(StrR)和四环素(TetR)。进一步地,表达构建体可以包括多克隆位点(MCS),也称为多接头,所述多接头是含有彼此紧邻或重叠的多个限制位点的多核苷酸。MCS中的限制位点通常在MCS序列内发生一次,并且优选地不在质粒或其它多核苷酸构建体的其余部分内发生,从而允许限制酶仅在MCS内切割质粒或其它多核苷酸构建体。MCS序列的实例包含pBAD系列的表达载体中的那些表达载体,如pBAD24和pBAD33(Guzman等人,“含有阿拉伯糖PBAD启动子的载体的紧密调节、调制和高水平表达(Tight regulation,modulation,and high-level expression by vectors containing the arabinose PBADpromoter)”,《细菌学杂志(J Bacteriol)》1995年7月;177(14):4121-4130),以及源自pBAD载体的pPRO系列表达载体中的那些表达载体,如pPRO33(美国专利第8178338号)。
对于编码至少一个多肽基因产物的表达构建体,待表达的多肽基因产物的转录起始位点与编码序列的起始密码子之间的多核苷酸区域对应于所述多肽基因产物的mRNA的5'非翻译区域(“UTR”)。优选地,对应于5'UTR的表达构建体的区域包括与在宿主细胞的物种中发现的共有核糖体结合位点(RBS,也称为Shine-Dalgarno序列)相似的核苷酸序列。在原核生物(古菌和细菌)中,RBS共有序列包括核苷酸序列GGAGG或GGAGGU,并且在细菌如大肠杆菌中,RBS共有序列是AGGAGG或AGGAGGU。RBS通常由5到10个干预核苷酸与起始密码子分离,并且通常位于表达构建体内非常接近MCS的5'(或“上游”)。
对于一种或多种基因产物的有效表达,表达构建体优选地包括至少一个启动子,如组成型启动子或诱导型启动子,并且优选地包括诱导型启动子。在表达构建体内,将启动子置于待表达的基因产物的任何RBS序列和编码序列的上游,使得启动子的存在将相对于编码基因产物的多核苷酸的编码链在5'到3'方向上指导基因产物编码序列的转录。可以用于表达构建体的诱导型启动子的实例是众所周知的大肠杆菌糖诱导型启动子,如L-阿拉伯糖诱导型启动子ParaBAD、乳糖诱导型启动子PlacZYA、鼠李糖诱导型启动子PrhaBAD和木糖诱导型启动子PxylAB和PxylFGHR;大肠杆菌丙氨盐诱导型启动子PprpBCDE;以及可通过磷酸盐耗竭诱导的启动子PphoA,所有这些启动子均在PCT申请公开WO2016205570A1中详细描述,所述申请公开以引用的方式并入本文。J23104启动子等组成型启动子可以从iGEM(马萨诸塞州波士顿(Boston,Massachusetts))维护的标准生物部件注册处获得;参见parts.igem.org/Promoters/Catalog。
C.宿主细胞群体遗传多样性
所提供的方法有利地用于从宿主细胞的遗传多样性群体中选择高性能宿主细胞,其中宿主细胞群体内的多样性或变化可以例如由宿主细胞基因组之间的差异或由宿主细胞构成的表达构建体之间的差异产生。宿主细胞群体遗传多样性可以通过如突变的方法随机地产生,或者通过在宿主细胞基因组或表达构建体中作出改变的靶向方法特异性地引入,然后将所述宿主细胞群体遗传多样性引入到宿主细胞品系中。
宿主细胞群体包括多个遗传变体。在许多实施例中,本发明的一个方面包括基于宿主细胞的预定特性对宿主细胞群体进行分选,所述预定特性基于宿主细胞群体内的遗传变体而变化。在许多实施例中,预定特性是所关注的基因产物的表达水平,并且所述方法包含检测多个遗传变体中的每个遗传变体内的所关注的活性基因产物的表达水平。宿主细胞的另外的预定特性包含所关注的活性基因产物的表达水平、所关注的基因产物的适当折叠、适当折叠的蛋白质的表达水平、细胞活力和/或生物质。因此,宿主细胞群体的遗传多样性应当包括多个遗传变体,所述遗传变体足够多以提供遗传多样性群体中的表达水平或其它预定特性的变化。在一些实施例中,能够基本上表达所关注的基因产物的遗传变体的数量可能很少,这可能需要增加遗传多样性。在许多实施例中,宿主细胞群体的遗传多样性可以如本文所述增加,直到实现合适的遗传多样性。
在所公开的方法的实施例中,宿主细胞群体的遗传多样性被定义为存在于宿主细胞群体中的不同遗传变体的数量、相对于阴性对照的不同遗传变体的数量、和/或相对于参考细胞品系的不同遗传变体的数量。遗传变体的数量可以是宿主细胞群体中的变体的实际数量或计算的(“靶标”)遗传变体的数量。这些变体可以是宿主细胞基因组在细胞之间的一种或多种遗传(例如,核酸序列)差异、一种或多种表达构建体在宿主细胞之间的一种或多种遗传(例如,核酸序列)差异或其组合的结果。在一些实例中,遗传差异包含序列的一个或多个核苷酸的改变、缺失或插入或一个或多个元素(如一个或多个标签、结构域、表达对照序列和/或相关蛋白质)的插入或缺失。
在一些实施例中,宿主细胞群体的遗传多样性为至少500、至少1000、至少2000、至少5000、至少10,000、至少50,000、至少100,000、至少200,000、至少500,000、至少1,000,000、至少2,000,000、至少5,000,000、至少10,000,000、至少100,000,000、至少500,000,000或至少1,000,000,000。在其它实例中,遗传多样性为约1000-1,000,000,000,如约1000-10,000、约5000-50,000、约50,000-200,000、约100,000-500,000、约200,000-1,000,000、约500,000-2,000,000、约1,000,000-5,000,000、约5,000,000-50,000,000、约20,000,000-100,000,000、约50,000,000-500,000,000或约500,000,000-1,000,000,000。
可以使用本文所提供的方法探测任何类型的遗传多样性。在一些实施例中,遗传多样性包含所关注的基因产物(包含但不限于编码序列变体和密码子优化)、启动子(包含组成型启动子和/或诱导型启动子)、分子伴侣、核糖体结合序列、标签、核定位信号、信号肽、一个或多个基因的敲除或敲入、一个或多个(如1个、2个、3个或更多个)质粒的存在或其任何组合之间的差异(包含改变或存在或不存在)中的一个或多个。在一些实例中,遗传多样性通过标准指导的基因修饰技术产生。在其它实例中,遗传多样性通过随机诱变、容易出错的PCR诱变或转座子诱变(例如,Tn5)产生。技术的组合还可以用于产生另外水平的遗传多样性。
本领域已知存在许多用于改变宿主细胞基因组或表达构建体以便改变核苷酸序列和/或消除、减少或改变基因功能的方法。已经描述了在宿主细胞如大肠杆菌和其它原核生物中进行基因的靶向断裂的方法(Muyrers等人,“通过ET重组快速修饰细菌人工染色体(Rapid modification of bacterial artificial chromosomes by ET-recombination)”,《核酸研究(Nucleic Acids Res)》1999年3月15日;27(6):1555-1557;Datsenko和Wanner,“使用PCR产物对大肠杆菌K-12中的染色体基因进行一步灭活(One-step inactivation of chromosomal genes in[g3]Escherichia coli[/g3]K-12 usingPCR products)”,《美国国家科学院院刊》2000年6月6日;97(12):6640-6645),以及用于使用类似的Red/ET重组方法的试剂盒可商购获得(例如,德国海德堡基因桥GmbH公司(GeneBridges GmbH,Heidelberg,Germany)的快速简易大肠杆菌基因缺失试剂盒)。Red/ET重组方法还可以用于将启动子序列替换为不同的启动子的序列,如组成型启动子,或预测促进一定水平转录的人工启动子(De Mey等人,“启动子敲入:用于基因微调的新合理方法(Promoter knock-in:a novel rational method for the fine tuning of genes)”,《BMC生物技术(BMC Biotechnol)》2010年3月24日;10:26)。宿主细胞基因组或表达构建体的功能还可以通过RNA沉默方法消除或减少(Man等人,“人工反式编码的小非编码RNA特异性地沉默细菌中选定的基因表达(Artificial trans-encoded small non-coding RNAsspecifically silence the selected gene expression in bacteria)”,《核酸研究》2011年4月;39(8):e50,电子版2011年2月3日)。Gibson组装方法(Gibson,“重叠DNA片段的酶效应组装(Enzymatic assembly of overlapping DNA fragments)”,《酶学方法(Methods Enzymol)》2011;498:349-361;doi:10.1016/B978-0-12-385120-8.00015-2)还可以用于在宿主细胞基因组或表达构建体中进行靶向改变,如插入、缺失和点突变。用于在宿主细胞基因组或表达构建体中进行定向改变的另一种方法利用CRISPR(聚集的规则间隔的短回文重复)核苷酸序列和Cas9(CRISPR相关蛋白9),其识别并裂解与CRISPR序列互补的核苷酸序列。进一步地,可以通过传统遗传方法引入对宿主细胞基因组的改变。
II.宿主细胞内的标记基因产物
标记所关注的基因产物涉及所关注的基因产物与可检测部分的关联。所关注的基因产物与可检测部分的关联可以以不同的方式发生,包含但不限于:所关注的基因产物与可检测部分之间的共价键,如当所关注的基因产物是表达为具有可检测的荧光或发光多肽的融合多肽的多肽时;非共价结合相互作用,如在所关注的抗体基因产物与抗原之间;或者所关注的基因产物的表达与宿主细胞中的可检测的变化之间的关联,如由所关注的基因产物的表达引起的细胞内钙浓度的变化。
为了通过细胞分选来选择活宿主细胞,其中宿主细胞在细胞质中表达所关注的基因产物,有必要在细胞质内标记基因产物,以便可检测信号与特定宿主细胞相关联。在一些实例中,在所关注的基因产物具有酶活性的情况下,有可能将所述酶的细胞可渗透的显色底物引入到细胞中。在其它实例中,如果所关注的活性基因产物的存在与宿主细胞的另一种属性相关,所述另一种属性可以在不杀伤宿主细胞的情况下检测到,如使用荧光报告蛋白如水母发光蛋白测量细胞内钙浓度,则宿主细胞可以经基因修饰以包含报告蛋白或其它分子。
作为另一实例,宿主细胞包括将所关注的多肽编码为融合蛋白的表达构建体,所述融合蛋白中的至少一种融合蛋白具有在其N末端或C末端处、优选地在其C末端处以框表达的荧光蛋白,如绿色荧光蛋白(GFP)。此类融合蛋白还可以包括每种所关注的多肽的氨基酸序列与荧光蛋白之间的接头多肽。优选地,编码所关注的多肽的荧光部分的多核苷酸序列可以通过用一种或多种限制酶消化而容易地从表达载体中去除。如果所关注的基因产物包括多于一条多肽链,如包括重链和轻链的抗体,两种或更多种组成多肽可以各自与BRET(生物发光共振能量转移)或FRET(荧光共振能量转移)供体/受体对的一个组分融合,以便荧光信号通过组成多肽的表达和组装以及BRET或FRET供体和受体的缔合来产生,从而提供表达量和组成多肽形成所关注的基因产物的能力两者的量度。
在一些情况下,一种或多种所关注的多肽作为与荧光或发光蛋白的融合的表达可以影响所关注的多肽的折叠、构象和/或活性,但即使在此情况下,基于荧光或发光量的FACS选择也可以鉴定表达所关注的多肽的期望量的活宿主细胞。例如,如果BRET供体和受体被表达为与所关注的基因产物的多肽组分的融合多肽,但BRET供体和受体无法达到BRET受体产生信号的所需接近度,那么可以通过检测BRET供体生物发光来执行FACS选择。
在一些实施例中,活性特异性细胞富集方法还可以涉及通过标记与所关注的活性基因产物特异性地相互作用的复合物来标记宿主细胞。标记复合物还可以包含多肽或其它化学接头以将标记复合物的组分彼此连接,或将标记复合物与细胞结构连接,或延伸到细胞表面或延伸超出细胞表面以与珠或其它有助于检测或纯化的培养基连接。对于在宿主细胞质中表达和保留的所关注的基因产物,标记程序可以包含固定,以便由宿主细胞产生的所关注的基因产物将与产生其的特定宿主细胞保持相关联,并且使宿主细胞透化,以便标记复合物将能够接近所关注的基因产物。
标记复合物。用于活性特异性细胞富集方法中,标记复合物可以包含为所关注的活性基因产物提供特异性的组分,以及可检测部分的存在。可检测部分产生可通过分选装置检测的光、电磁辐射和/或颗粒的发射,从而允许选择高性能宿主细胞。
标记复合物对活性基因产物的特异性可以通过使用结合伴侣(或“特异性组分”)建立,所述结合伴侣仅与活性基因产物,如抗原结合以标记抗体或抗体片段、与配体(对活性受体具有特异性)结合以标记受体或受体片段、与底物或底物类似物分子结合以标记酶,或与对活性基因产物具有特异性的抗体或抗体片段结合以标记所述基因产物。作为一实例,如果所关注的基因产物是抗体,则可以单独地或以任何组合方式使用三种单独的标记复合物来检测活性抗体基因产物:经标记的抗原特异性地结合抗原结合结构域,经标记的抗Fc抗体特异性地结合正确折叠和/或组装的Fc区域,以及经标记的抗轻链抗体特异性地结合正确折叠和/或组装的轻链。作为另外的实例,如果基因产物包括多核糖核苷酸,则标记复合物的特异性可以由在标记反应的条件下与多核糖核苷酸特异性地结合的多核苷酸提供。
标记复合物的可检测部分可以包括发色团、荧光团和/或发光团,在每种情况下,在特某些条件下产生光的可检测吸光度变化或光发射。合适的荧光可检测部分的实例是链霉亲和素-Alexa
Figure BDA0003846877850000171
488(马萨诸塞州沃尔瑟姆赛默飞世尔科技公司(ThermoFisherScientific Inc.,Waltham,Massachusetts))。如果用于对经标记的宿主细胞进行分选的装置能够检测和利用放射性发射,则标记复合物的可检测部分还可以包括产生通过闪烁或通过直接β或γ射线检测可检测到的发射的放射性同位素。另外类型的可检测部分可以包括重金属的一个或多个原子(例如,铁、镍、铜、锌、镓、钌、银、镉、铟、锡、铪、铂、金、汞、铊、或铅),以便可以通过质谱仪检测的可检测部分的存在或不存在。可检测部分的另一实例是与可以通过分选装置检测的与磁场相关联的实例。在所关注的基因产物是酶的情况下,可检测部分可以包括与底物类似物连接的荧光分子,所述底物类似物将与酶的活性位点特异性地结合。作为另一实例,如果所关注的基因产物是酶并且可检测部分与所述酶的底物相关联,则用于对经标记的宿主细胞进行分选的装置可以被设置成检测由可检测部分所产生的吸光度、荧光或发光的变化:当底物被所述酶转换时,在来自可检测部分的信号减少的情况下减少,或者由于底物的酶转化,在来自可检测部分的信号变得可检测的情况下增加。作为特定实例,显色酶底物可以提供作为标记复合物的特异性,因为其与酶的活性位点特异性地相互作用,并且还是标记复合物的可检测部分,因为其由于与所关注的酶基因产物的相互作用而产生光吸光度的可检测变化。一种此类显色酶底物是Chromogenix S-2222(TM)(俄亥俄州西切斯特Diapharma公司(Diapharma,West Chester,Ohio))所述此类显色酶底物与丝氨酸肽链内切酶因子Xa结合并且被其切割,从而激活发色团对硝基苯胺(pNA)。
在一些情况下,标记复合物-抗原、配体、底物、底物类似物、抗体等的特异性组分作为具有发色团或其它类型的可检测部分的缀合物可商购获得。在其它情况下,特异性组分作为具有共价连接的结合部分,如生物素的缀合物可商购获得,并且此缀合物可以结合于与结合部分的结合伴侣如链霉亲和素共价连接的可检测部分。包括结合部分和可检测部分的合适的缀合物的一实例是链霉亲和素-Alexa
Figure BDA0003846877850000181
488(马萨诸塞州沃尔瑟姆赛默飞世尔科技公司)。在没有此类缀合物可商购获得的情况下,结合部分如生物素可以与标记复合物的特异性组分缀合。可以使用的其它结合部分-结合伴侣对包含在标记复合物的多肽特异性组分中包含多组氨酸氨基酸序列、六个或更多个组氨酸,优选地六到十个组氨酸残基的运行,并将其与镍缀合的或钴缀合的可检测部分结合。结合-部分-结合-伴侣对的另一实例是SpyTag-SpyCatcher对:SpyTag是通过12.3-kDa SpyCatcher蛋白结合的13个氨基酸的肽,从而形成共价分子间异肽键。
作为另外的实例,特异性组分(例如,HER2抗原)可以作为结合部分通过抗体(例如,抗HER2二级抗体)结合,与检测部分缀合,其中抗体以不干扰特异性组分与所关注的基因产物之间的结合的方式特异性地识别特异性组分。在此布置的进一步变化中,检测部分可以与特异性地识别特异性地识别特异性组分的抗体等的抗体缀合,只要链中的每种抗体对其结合靶是特异性的。
还存在若干个“脱落蛋白”或“蛋白片段补体”结合对,其中蛋白质的单独表达的结构域彼此具有亲和力,并且当结构域结合时,脱落蛋白的活性恢复。例如,使用β内酰胺酶、β半乳糖苷酶、辣根过氧化物酶或荧光素酶的一个结构域作为结合部分和与结合伴侣相同的蛋白质的互补结构域,将重建当其底物存在时可以生成可检测信号的酶,并且在一些特定实例中,底物可以作为具有一个或多个结合结构域的融合蛋白的一部分提供。在另一实例中,称为双分子荧光补体(BiFC),“脱落”蛋白是荧光蛋白,如绿色荧光蛋白或黄色荧光蛋白,所述荧光蛋白可以各自通过接头与互补结合对的成员,如抗平行亮氨酸拉链基序连接,分离成蛋白质片段。当通过亮氨酸拉链基序的相互作用重关联时,荧光蛋白活性恢复,从而产生可检测部分。
一种既可以用于特异性标记又可以用于检测的方法是α(放大发光接近均相测定)技术(马萨诸塞州沃尔瑟姆珀金埃尔默公司(PerkinElmer,Waltham Massachusetts)),其中两个结合伴侣,例如,所关注的基因产物与特异性组分的结合将供体珠(与一个结合伴侣连接)和受体珠(与另一个结合伴侣连接)带到邻近处,以便在一个波长(680nm)下激发供体珠将导致化学能量传递到受体珠并且以不同的波长(520-620nm)发射。在此技术中,供体珠和受体珠在接近时产生可检测部分。
固定。所关注的基因产物可以通过用交联试剂,如施加在溶液中的一种或多种醛(多聚甲醛、戊二醛、甲醛)固定宿主细胞而保留在宿主细胞内。使用一种或多种醛在宿主细胞内固定所关注的基因产物是亲电体/亲核体化学的实例,其中醛是亲电体,并且所关注的基因产物供应亲核体中心,如多肽中的胺基和聚核苷酸的鸟嘌呤残基的N7位。交联试剂通常是双官能的,并且可以与一端处的所关注的基因产物反应,并且与另一端处的宿主细胞的组分(DNA、RNA、细胞骨架、膜、细胞壁或与这些组分之一复合的蛋白质)反应。许多不同类型的交联试剂是可商购获得的(马萨诸塞州沃尔瑟姆赛默飞世尔科技公司)。在宿主细胞内保留所关注的基因产物的另一种方法涉及在所关注的基因产物的编码序列内包含编码多肽或多核苷酸的多核苷酸序列,所述多肽或多核苷酸与宿主细胞的结构,如细胞骨架组分或其它细胞质结构缔合。例如,特别是在原核宿主细胞中,将细胞骨架MreB蛋白或其类似物的全部或一部分与所关注的基因产物连接可以导致所关注的基因产物通过MreB与MreC或类似蛋白质的相互作用而与内细胞膜相关联。
透化。通过用溶菌酶和EDTA,或用溶菌酶和洗涤剂如辛基-葡糖苷处理使宿主细胞透化以促进溶菌酶渗透。
标记宿主细胞的核酸。活宿主细胞的DNA和其它核酸可以用不带电荷的染料(如,Hoechst 33342)或含有缀合系统的染料来标记以分配任何电荷,从而使其能够渗透细胞。然而,活宿主细胞可以将染料输送回细胞外。可以固定和/或透化宿主细胞以允许DNA标记化合物进入宿主细胞并保留在宿主细胞中。在固定细胞中标记DNA的化合物包含碘化丙啶(PI)、7-氨基放线菌素-D(7-AAD)和4'6'-二脒基-2-苯基吲哚(DAPI)。因此,在一些实例中,DNA染色用于鉴定群体中的活细胞。
III.选择高性能宿主细胞
使用能够检测由每个经标记的宿主细胞产生的发射(光、电磁辐射等)的装置对经标记的宿主细胞群体进行分选,并且基于如针对所述细胞检测到的发射量的因素对每个宿主细胞进行分选。分选装置可以利用任何类型的细胞分选技术,如流式细胞术或微流体细胞分选,所述细胞分选技术可以通过使用激光检测器一次地分选一个细胞。在MACS中(磁激活的细胞分选),宿主细胞用磁颗粒标记,并且在基于亲和力的细胞分选中,宿主细胞用延伸到细胞表面或延伸超出细胞表面的标记复合物标记以用于与固体培养基如树脂的基于亲和力的相互作用。MACS和基于亲和力的细胞分选技术不分离单个细胞,但可以基于标记复合物与宿主细胞内所关注的基因产物的特异性结合的水平来分组宿主细胞。
在一些实施例中,所述方法包含对包含至少200个细胞的宿主细胞的群体进行分选。例如,宿主细胞的群体可以包含至少200个细胞、至少500个细胞、至少1000个细胞、至少2000个细胞、至少5000个细胞、至少10,000个细胞、至少20,000个细胞、至少40,000个细胞、至少50,000个细胞、至少75,000个细胞、至少100,000个细胞、至少200,000个细胞、至少500,000个细胞或更多细胞。在一个实例中,分选的宿主细胞的群体包含200-40,000个细胞。然而,本领域的普通技术人员将理解,只要有足够的时间和设备容量,就可以对任何数量的细胞进行分选,并且所选的细胞的数量为后续步骤提供足够的DNA。
在一个实施例中,分选装置利用流式细胞术。流式细胞术是用于分析细胞的群体的强大技术,具有以高速(每秒100,000个或更多个事件(细胞))同时测量单细胞水平上的多个参数的能力。流式细胞仪通常通过(1)分离群体中的每个单独的细胞,(2)用一个或多个激光器依序照射(或“询问”)每个细胞,以及(3)记录与所述经照射的细胞相关联的发射光来操作。基于与给定细胞相关联的发射光,配备有能够将细胞分选到两个或更多个容器(每次一个细胞)中的流式细胞仪称为荧光激活的细胞分选仪(FACS)。FACS仪器允许从复合物群体中分离一种或多种特定细胞类型以进行后续分析。合适的FACS仪器的实例是BDFACSAria(TM)-IIu(新泽西州富兰克林湖贝克顿,迪金森公司(Becton,Dickinson andCo.,Franklin Lakes,New Jersey))。
在FACS仪器中,细胞的群体,如经标记的宿主细胞,通过产生单细胞流的喷嘴汇集,所述单细胞流然后流过一组激光光源,每次流过一个细胞。用适当的可检测部分如荧光团标记的宿主细胞由通过激发或发射或两者产生的不同荧光信号来检测。当由激光器询问时,细胞散射由两个光学检测器测量的光。一个检测器测量沿激光器的路径的散射;此参数被称为前向散射(FSC)。前向散射的测量允许按大小区分细胞,因为FSC强度与细胞的直径成比例,并且主要归因于细胞周围的光衍射。另一个检测器测量相对于激光器以九十度角的散射;此参数被称为侧向散射(SSC)。侧向散射测量提供了关于细胞的内部复杂性(“颗粒度”)的信息。激光器与细胞内结构之间的相互作用导致光折射或反射。对于每个细胞,FACS仪器将每个FSC和SSC测量为“脉冲”,所述脉冲可以可视化为具有宽度(W)、高度(H)和曲线下面积(A)的曲线。当结合测量时,每个细胞的FSC和SSC测量结果允许异质性群体内的细胞之间的一定程度的分化。细胞的一些通常测量的参数包含如上文所描述的细胞大小和粒度,以及当可检测地标记靶蛋白和/或DNA时的靶蛋白丰度和/或DNA含量。
为了提供用于比较荧光测量结果的基准,FACS可以扫描来自对照宿主细胞品系的经标记的宿主细胞,所述对照宿主细胞品系已表征为所关注的基因产物的表达水平,优选地所关注的活性基因产物的水平。对照宿主细胞品系的FSC和/或SSC可以在FACS装置的某些设置下测量,例如在光电倍增管(PMT)的特定电压下测量。当实验样品,如表达所关注的基因产物的高度遗传多样性宿主细胞群体,由FACS使用与用于对照宿主细胞品系相同的FACS装置设置来扫描时,所得FSC和/或SSC读数可以与针对对照宿主细胞品系获得的读数进行比较,以查看实验样品是否可能产生比“基准”对照宿主细胞品系更高性能的宿主细胞。在一些实施例中,对照宿主细胞品系是阴性对照,如在实验样品中不表达所关注的基因产物的宿主细胞品系。
门控。门控是在已选择用于测量的参数内设置选择范围的过程,其中在选择范围内展现特征的细胞将被选择并将其与未选择的细胞分选。门控参数通常可以在具有一个、两个、三个或更多个维度的FACS图上可视化为限定区域。例如,可以将门控参数可视化为在以SSC-W测量的荧光针对以FSC-H测量的荧光的二维图上的限定区域,以选择在与来自单个细胞的荧光一致的SSC-W值范围内属于所述限定区域的检测事件。在特定实例中,门控参数还鉴定并消除聚集的细胞或非细胞碎片,以便基本上仅测量来自单个细胞的信号。这减少了由于细胞“凝集”而导致的所关注的产物表达增加的伪影,而不是由于细胞的特定遗传多样性而导致的实际增加的伪影。
IV.分析所选的宿主细胞和/或表达载体
为了确定已通过细胞分选选择为高性能宿主细胞的宿主细胞的特性,或由这些宿主细胞组成的表达构建体的宿主细胞的特性,可以从分选的细胞中获得DNA,并且用于通过DNA测序的分析或用于具有高性能宿主细胞的遗传特性的活宿主细胞(参见下文)的重建。例如,如果宿主细胞包括质粒表达载体,则可以从所选的高性能宿主细胞回收这些质粒表达载体并通过NGS进行测序。基因组DNA也可以从所选的宿主细胞中回收并测序,但可能需要更高量的基因组DNA来实现与从质粒表达载体的回收中获得的结果相当的结果。RNA也可以从所选的宿主细胞回收,逆转录到DNA中,并且然后通过NGS分析和/或通过其它方法利用。
通过NGS对所回收的DNA的分析可以表明遗传多样性宿主细胞群体的哪些遗传属性通过高性能宿主细胞的选择而富集。例如,可以从大量共表达的基因产物池中鉴定与所关注的基因产物共表达并且增强所关注的活性基因产物的表达水平的基因产物。作为另一实例,从高性能宿主细胞回收的核酸的分析可以检测与结合于标记复合物和/或作用于标记复合物的能力增加相关联的所关注的基因产物本身内的任何遗传变异。
通过FACS为遗传多样性宿主细胞群体生成的荧光图,代表单独的宿主细胞表达所关注的基因产物,优选地所关注的活性基因产物的能力,可以分成多个不同区段。在一些实施例中,使用截断来鉴定具有最高荧光发射的细胞来选择单个区段。在一些实例中,截断是具有最高荧光发射的0.05%-5%的细胞,如顶部0.05%-0.2%、0.1-0.5%、0.25-0.75%、0.5-1%、0.75-1.5%、1%-2.5%、2%-4%或3%-5%的细胞。在一个实例中,截断是具有最高荧光发射的0.5%的细胞。然而,本领域普通技术人员将认识到,取决于所使用的细胞分选设备的容量和类型,可以使用较高或较低的截断值。选择截断以提供筛选轮次之间和/或项目之间的统一性,和/或减少富集宿主细胞群体中的多样性的量。另外,截断可以取决于分选的细胞的数量,使得足够数量的细胞被包含在所选的细胞群体中,例如足够数量的细胞以允许足够DNA的分离以进行后续步骤。因此,在一个非限制性实例中,截断是具有最高荧光发射的0.5%的细胞,并且分选的最小细胞数量是200。
通过FACS对宿主细胞进行分选,并收集对应于每个区段的宿主细胞。NGS然后可以用于确定各个区段的宿主细胞中和未分选的宿主细胞的遗传多样性群体中的表达构建体的核苷酸序列,优选地提供未分选的群体中和每个分选的区段中独特序列的至少10倍并且更优选地至少50倍重复覆盖。
将来自所收集的区段中的每个独特序列的相对丰度与未分选的宿主细胞群体的相对丰度进行比较。通过将分选的宿主细胞中独特序列的相对丰度除以未分选的宿主细胞群体中所述序列的相对丰度来计算的相对丰度的倍数变化,用于对每个序列进行排序,作为其对所关注的基因产物的表达的贡献的量度。在展现出高性能的区段富集并且还从展现出低性能的区段耗竭的核苷酸序列是改善所关注的基因产物的表达的序列的最佳候选者。
还可能用来自包括特定核苷酸序列(“对照核苷酸序列”)的表征对照品系的宿主细胞“掺入”宿主细胞群体。这些遗传同质对照宿主细胞很可能被分选成FACS图的一个或几个区段,并且由对照宿主细胞组成的对照核苷酸序列的NGS分析应该示出这些序列具有从FACS图的几个区段获得的分选宿主细胞的相对丰度中的最高倍数变化,从而鉴定由对照宿主细胞证明的荧光水平。此任选的“掺入”程序为对照宿主细胞品系的荧光谱提供了内部基准,其已针对所关注的基因产物的表达进行表征,从而允许将遗传多样性宿主细胞群体的荧光水平与对照宿主细胞的荧光水平进行比较。
已经通过细胞分选方法,如FACS选择的高性能宿主细胞,例如显示出最高表达水平的宿主细胞群体的0.1%、1%或10%,可以通过对由所选的宿主细胞群体产生的荧光或其它可检测特性的进一步FACS筛选来表征,以确定细胞分选和选择程序是否已经导致宿主细胞的群体富含具有期望特性的宿主细胞。如上所描述的,可以用活细胞或固定细胞执行另外几轮FACS分选,以进一步富集用于高性能宿主细胞的宿主细胞群体。
当使用活宿主细胞执行FACS分选时,特别是当采用多轮活细胞FACS分选时,所选的活宿主细胞的群体通常在FACS程序之后培养。为了测试在培养期间所选宿主细胞群体的组成的变化,在培养之前去除相对较少量的宿主细胞(例如,5-10%的群体),并且为NGS分析而保留。在培养(例如,在一个细胞分裂一致的时间内)之后可以去除宿主细胞的另一个样品(例如,20-50%),其目的是如上文所描述的确定所选的宿主细胞群体相对于对照宿主细胞品系的性能。
用活细胞进行一轮或多轮初始FACS筛选可能是有利的,因为用不太可能形成多个细胞团块的活细胞筛选高度遗传多样性的宿主细胞群体更有效。一旦用活细胞进行了足够多轮的FACS选择,如当与“掺入”量的对照宿主细胞相比时,具有较高性能特征的所选细胞的比例所示,然后可以用固定且经标记的宿主细胞执行FACS进一步富集具有期望特性的宿主细胞,以产生所关注的活性基因产物。
V.重建宿主细胞品系
在某些实例中,通过细胞分选选择的固定宿主细胞内的表达构建体被收获并通过NGS测序。对表达构建体内每个变异点的序列进行定量,并且与未分选的群体相比,所述序列以相对丰度的最大倍数变化存在。群体内的所述序列被认为与所选的宿主细胞的高性能特征相关。然而,通过NGS测序模糊了表达载体上的变异点之间的连接,因此不可能确定例如位置2处的最普遍的序列是否与位置1和位置3处的特定序列相关联。可以创建表达载体的“高性能”文库,包含在每个变异点处最普遍的序列,并且创建表达载体文库以包含普遍序列的所有组合,包含可能显示由序列的特定组合所创建的相加或协同特性的序列。然后将此“高性能”文库转化成宿主细胞的亲本品系,如上文所描述的大肠杆菌品系521,以“重建”具有反映所选的高性能宿主细胞的遗传特性的活宿主细胞的群体。
如果将遗传多样性宿主细胞群体的FACS扫描与如上文所描述的“基准”对照宿主细胞品系的FACS扫描进行比较,那么遗传多样性群体的性能(如通过FACS测量)不明显高于对照宿主细胞品系的性能,使用NGS序列数据来创建如上文所描述的“高性能”文库可能是有利的,以在另一轮FACS筛选中测试文库中最高性能的基因序列之间的相加性或协同性。“高性能”文库的创建也可以在高性能宿主细胞的富集得到证明之后进行,以便确定其性能是否可以进一步提高。
还可以从高性能标记和分选的宿主细胞中回收质粒表达载体。然后所回收的质粒可以用于转化亲本宿主细胞品系,并且重建高性能宿主细胞的群体。
来自所选的高性能宿主细胞的基因组DNA的分析还可以提供有关与期望高性能相关联的遗传特性的信息;然后可以使用第I节“宿主细胞群体遗传多样性”中所描述的方法将这些遗传特性重新引入亲本宿主细胞品系中。
VI.进一步分析重建的宿主细胞品系
可以通过适用于表达所关注的基因产物的细胞的群体的任何方法分析具有反映所选的高性能宿主细胞的遗传特性的重建的宿主细胞品系。首先通过FACS分选或通过接种宿主细胞并挑选和培养单独的菌落从重建的宿主细胞群体中分离单个宿主细胞是有用的,以评估源自单独的宿主细胞的遗传同质克隆群体的性能。
确定哪些宿主细胞群体或培养物展现出与所关注的基因产物的产生有关的最高性能水平的方法可以包含通过以下对所关注的基因产物进行定量:凝胶电泳、酶联免疫吸附测定(ELISA)、包含高效液相色谱法(HP-LC)的液相色谱法(LC)、固相萃取质谱法(SPE-MS)和LC-MS(实例1)。
为了获得所关注的基因产物以用于进一步评估其数量和活性,从宿主细胞中分离所关注的基因产物的方法包含基于高通量板的捕获方法,如采用基于蛋白质A的捕获方法或KappaSelect(马萨诸塞州马尔堡通用电气医疗集团(GE Healthcare Life Sciences,Marlborough,Massachusetts)固体培养基的方法以捕获抗体。
对于包括二硫键的所关注的基因产物,这些键在基因产物内的位置可以通过如下文实例1所描述的质谱法来确定。确定所关注的活性基因产物的量的测定可以包含抗原结合测定、配体结合测定、酶活性测定如显色底物或显色底物类似物的裂解,以及所关注的基因产物针对其活性形式的抗体特异性的结合。由于变体结合和/或作用于流式细胞术中所使用的标记复合物的能力增加,这些类型的测定还可以用于表征在宿主细胞富集过程中鉴定的所关注的基因产物的变体。
展现出与所关注的基因产物的产生相关的期望高性能特征的宿主细胞可以在较大的发酵培养物中生长,以证明大规模产生所关注的基因产物的能力,如实例2中所描述的。
实例
提供以下实例以展示某些特定特征和/或实施例。这些实例不应被解释为将本公开限制于所描述的特定特征或实施例。
实例1
表征二硫键
多肽基因产物中二硫键的数量和位置可以通过在非还原条件下用蛋白酶,如胰蛋白酶消化多肽基因产物来确定,并使所得肽片段经受组合连续电子转移解离(ETD)和碰撞诱导的解离(CID)MS步骤(MS2,MS3)的质谱法(MS)(Nili等人,“通过串联质谱法与电子转移解离和碰撞诱导的解离来定义胰岛素样生长因子结合蛋白-5的二硫键(Defining thedisulfide bonds of insulin-like growth factor-binding protein-5 by tandemmass spectrometry with electron transfer dissociation and collision-induceddissociation)”,《生物化学杂志(J Biol Chem)》2012年1月6日;287(2):1510-1519;电子版2011年11月22日)。
共表达蛋白质的消化。为了防止二硫键重新布置,通过烷基化来阻断游离半胱氨酸残基:用烷基化剂碘乙酰胺(5mM)在含有4M脲的缓冲液中在20℃下将多肽基因产物避光温育持续30分钟,并且然后然后使用预制凝胶通过非还原性SDS-PAGE分离。可替代地,在用碘乙酰胺进行电泳之后,或在不作为对照的情况下,将聚肽基因产物在凝胶中温育。将蛋白质带染色,用双去离子去染色,切除,并且在0.5mL的50mM碳酸氢铵、50%(v/v)乙腈中温育两次,同时在20℃下摇晃持续30分钟。将蛋白质样品在100%乙腈中脱水持续2分钟,通过真空离心干燥,并且在含有50mM碳酸氢铵和5mM氯化钙的缓冲液中用10mg/ml的胰蛋白酶或糜蛋白酶在冰上再水化持续15分钟。去除多余的缓冲液,并用0.05mL不含酶的相同缓冲液替换,随后将胰蛋白酶或糜蛋白酶分别在37℃下或在20℃下温育持续16小时,同时摇晃。通过添加3微升的88%甲酸来停止消化,并且在短暂涡旋后,去除上清液并储存在-20℃下直到分析。
通过质谱法定位二硫键。在含有0.1%甲酸的流动相中,将肽以20微升/分钟注射到1mm×8mm的捕集柱(加利福尼亚州奥本市的Michrom生物资源公司(MichromBioResources,Inc.,Auburn,CA)上。然后将捕集器边缘放置在0.5mm×250mm的含有5mmZorbax SB-C18固定相的柱上(加利福尼亚州圣克拉拉安捷伦科技公司(AgilentTechnologies,Santa Clara,CA)),并且通过2-30%乙腈梯度在90分钟内以10微升/分钟的速度用1100系列毛细管HPLC(安捷伦科技公司)分离肽。使用具有ETD源(加利福尼亚州圣何塞赛默飞世尔科技公司(Thermo Scientific,San Jose,CA))的LTQ Velos线性离子捕集器分析肽。使用Captive Spray源(Michrom生物资源公司)进行电喷雾电离。调查MS扫描之后是包含调查扫描中最强离子上的CID和ETD MS2扫描的七次数据依赖性扫描,随后是ETDMS2扫描中第一到第五最强离子上的五次MS3 CID扫描。CID扫描使用35的归一化碰撞能量,并且ETD扫描使用100毫秒激活时间,并且启用补充激活。启动MS2 CID和ETD扫描的最小信号为10,000,启动MS3 CID扫描的最小信号为1000,并且所有MS2和MS3扫描的隔离宽度为3.0m/z。软件的动态排除功能启用,重复计数为1,排除列表大小为100,并且排除持续时间为30秒。使用靶向具体交联物种的包含列表以用于收集ETD MS2扫描。使用ZSA电荷状态分析,由Bioworks 3.3(赛默飞世尔科技公司)创建MS2和MS3扫描的单独数据文件。MS2和MS3扫描与肽序列的匹配由Sequest(V27,Rev 12,赛默飞世尔科技公司)执行。在没有酶特异性、亲本离子质量耐受性为2.5、片段质量耐受性为1.0以及氧化甲硫氨酸残基的可变质量为+16的情况下进行分析。然后使用程序Scafffold(V3_00_08,奥勒冈州波特兰蛋白质组软件公司(Proteome Software,Portland,OR))分析结果,其中使用最低肽和蛋白质概率为95%和99%。来自MS3结果的肽按照扫描编号进行分选,并且从由在ETD MS2扫描中观察到的五种最强离子产生的MS3扫描组中鉴定含有半胱氨酸的肽。通过手动检查在调查扫描和ETD MS2扫描中观察到的亲本离子质量,进一步证实了参与二硫键连接的物种中半胱氨酸肽的同一性。
实例2
发酵
生产所关注的基因产物所涉及的发酵过程可以使用属于以下类别之一的操作模式:(1)不连续(分批过程)操作、(2)连续操作,和(3)半连续(分批进料)操作。分批过程通过在过程开始时用微生物接种无菌培养基(分批培养基)进行表征,在特定反应期内培养。在培养期间,细胞浓度、底物浓度(碳源、营养盐、维生素等)和产物浓度改变。良好的混合确保反应混合物的组成或温度没有显著的局部差异。反应是不稳定的并且细胞会一直生长直到限制生长的底物(通常为碳源)已经被消耗为止。
连续操作的表征在于将新鲜培养基(进料培养基)连续添加到发酵罐中,并且以相同速率从发酵罐中连续地抽取废弃的培养基和细胞。在连续操作中,生长速率由培养基添加速率确定,并且生长产率由生长限制底物(即,碳源)的浓度确定。所有反应变量和控制参数在时间上保持恒定并且因此在发酵罐中建立恒定状态,随后是恒定的生产率和输出。
半连续操作可以被视为批次操作和连续操作的组合。发酵作为分批过程开始,并且当限制生长的底物被消耗,以指定方式(分批进料)添加含有葡萄糖和矿物质的连续进料培养基。换言之,此操作采用分批培养基和进料培养基两者以实现细胞生长和所期望基因产物的有效产生。在培养期间不添加或取出细胞,并且因此就微生物而言,发酵罐是分批操作的。虽然本方法可以用于各种过程,包含上文所提到的过程,但特定利用与分批进料过程结合。
在上述过程的每个过程中,可以通过利用代谢物形成与一些其它变量,如培养基pH、光密度、颜色和可滴定酸度之间的相关性来间接监测细胞生长和产物累积。例如,光密度提供不溶性细胞颗粒累积的指示,并且可以使用耦合到显示装置或记录器的微OD单元在运转中监测,或者通过采样离线监测。600纳米(OD600)下的光学密度读数被用作测定干细胞重量的手段。
高细胞密度发酵通常被描述为产率达到至少>30g细胞干重/升(OD600>60)的过程,并且在某些实施例中产率达到>40g细胞干重/升(OD600>80)的过程。所有高细胞密度发酵过程均采用浓缩营养培养基,所述浓缩营养培养基在“分批进料”过程中逐渐被计量到发酵罐中。高细胞密度过程需要浓缩的营养进料培养基,以便最大限度地减少进料期间发酵罐内容物的稀释。需要分批进料过程,因为其允许操作者控制碳源进料,这很重要,因为如果细胞暴露于足够高的碳源浓度以产生高细胞密度,则细胞将产生如此多的抑制性双产物乙酸盐,所述生长将停止(Majewski和Domach,“大肠杆菌中醋酸盐溢出的简单约束优化视图(Simple constrained-optimization view of acetate overflow in E.coli)”,《生物技术与生物工程(Biotechnol Bioeng)》1990年3月25日;35(7):732-738)。
乙酸及其去质子化离子乙酸盐共同代表生物反应器中大规模蛋白质生产中的细菌生长的主要抑制副产物之一。在pH 7下,乙酸盐是乙酸的最普遍形式。当碳能源的量大大超过细菌的处理能力时,任何过量的碳能源均可以转换成乙酸。三羧酸循环和/或电子运输链的饱和是乙酸累积的最可能原因。生长培养基的选择可能会影响乙酸抑制的水平;在确定成分培养基中生长的细胞可能比在复合培养基中生长的细胞更容易受到乙酸的影响。用甘油置换葡萄糖也可能大大减少乙酸产生的量。据信甘油产生的乙酸比葡萄糖少,因为其运输到细胞中的速率比葡萄糖运输到细胞中的速率慢得多。然而,甘油比葡萄糖更昂贵,并且可能导致细菌生长更缓慢。使用降低的生长温度还可以降低碳源摄取的速度和生长速率,从而降低乙酸的产生。细菌不仅在存在过量碳能源的情况下或在快速生长期间产生乙酸,而且在厌氧条件下也产生乙酸。当允许大肠杆菌等细菌生长过快时,其可能超过生物反应器系统的氧气递送能力,这可能导致厌氧生长条件。为了防止这种情况,可以通过营养限制来维持较慢的恒定生长速率。用于减少乙酸累积的其它方法包含基因修饰以防止乙酸产生、添加乙酸利用基因和选择乙酸减少的品系。大肠杆菌BL21(DE3)是已经示出产生较低水平的乙酸的品系之一,因为其可以在其乙醛酸支路途径中使用乙酸。
更大规模的分批进料发酵罐可用于产生所关注的基因产物。较大的发酵罐具有至少1000升的容量,优选地约1000到100,000升的容量(即,工作体积),从而留下用于顶部空间的足够空间。这些发酵罐使用搅拌器叶轮或其它合适的方法来分配氧气和营养物,尤其是葡萄糖(优选的碳/能源)。小规模发酵一般是指在容积不超过大约100升,并且在一些具体实施例中不超过大约10升的发酵罐中发酵。
用于产生所关注的基因产物的发酵过程的标准反应条件通常涉及将pH维持在约5.0到8.0以及微生物宿主细胞如大肠杆菌的培养温度维持在20到50℃的范围内。在一个实施例中,利用大肠杆菌作为宿主系统,在约7.0的最佳pH和约30℃的最佳培养温度下进行发酵。
这些发酵过程中的标准营养培养基组分通常包含能量源、碳、氮、磷、镁和痕量的铁和钙。另外,培养基可以含有生长因子(如维生素和氨基酸)、无机盐和产物形成所必需的任何其它前体。培养基可以含有可转运的有机磷酸酯,如甘油磷酸盐,例如α-甘油磷酸盐和/或β-甘油磷酸盐,并且作为更具体的实例,甘油-2-磷酸盐和/或甘油-3-磷酸盐。正在培养的宿主细胞的元素组成可以用于计算支持细胞生长所需的每种组分的比例。组分浓度将根据所述过程是低细胞密度过程还是高细胞密度过程而变化。例如,低细胞密度分批发酵过程中的葡萄糖浓度范围为1到5g/L,而高细胞密度分批过程使用的葡萄糖浓度范围为45g/L到75g/L。另外,生长培养基可以含有适度浓度(例如,在0.1-5mM、或0.25mM、0.5mM、1mM、1.5mM或2mM的范围内)的保护性渗透剂如甜菜碱、二甲基磺基丙酸盐和/或胆碱。
可以将一种或多种诱导剂引入到生长培养基中以诱导所关注的基因产物的表达。诱导可以在指数生长期期间开始,例如,如在指数生长期快结束但在培养物达到最大细胞密度之前,或在发酵期间的较早或较晚时间开始。当从一种或多种可通过耗竭如磷酸盐的营养物诱导的启动子表达所关注的基因产物时,当所述营养物已经从生长培养基中充分耗竭时,将发生诱导,而无需添加外源诱导剂。
在宿主细胞的指数生长期间,代谢速率与氧气和碳/能源的可用性成正比;因此,降低可用氧气或碳/能源或两者的水平将降低代谢速率。操纵发酵罐操作参数,如搅拌速率或背压,或降低O2压力,调节可用氧气水平,并且可以降低宿主细胞代谢速率。降低碳/能源的浓度或递送速率或两者具有类似的效应。此外,取决于表达系统的性质,表达的诱导可以导致宿主细胞代谢速率的降低。最后,在达到最大细胞密度时,生长速率停止或急剧降低。宿主细胞代谢速率的降低可以导致所关注的基因产物的更受控的表达,包含蛋白质折叠和组装的过程。可以通过测量细胞生长速率、具体生长速率或瞬时生长速率(通过测量光密度(OD),如OD600和或任选地通过将OD转换为生物质)来评估宿主细胞代谢速率。计算每个测定点的近似生物质(细胞干重):近似生物质(g)=(OD600÷2)x体积(L)。在某些实施例中,期望生长速率在0.01到0.7的范围内,或在0.05到0.3的范围内,或在0.1到0.2的范围内,或为约0.15(0.15加或减10%),或为0.15。
发酵设备。以下是可以用于生长宿主细胞的设备的实例;发酵系统的许多其它配置是可商购获得的。宿主细胞可以在新不伦瑞克(New Brunswick)BioFlo/CelliGen 115带水套的发酵罐(纽约霍波格Eppendorf North America公司(Eppendorf North America,Hauppauge,New York))中生长,1L容器尺寸具有2X Rushton叶轮和BioFlo/CelliGen 115发酵罐/生物反应器控制器;监测温度、pH和溶解氧(DO)。还可以在四倍可配置的DASGIP系统(纽约霍波格Eppendorf North America公司)中生长宿主细胞,所述系统包括四个60ml到250ml的DASbox发酵容器,每个容器具有2X Rushton叶轮、DASbox排气冷凝器和DASbox进料和监测模块(其包含温度传感器、pH/氧化还原传感器和溶解氧传感器)。合适的发酵设备还包含在不锈钢容器中具有30-L容量和20-L最大工作体积的NLF 22 30L实验室发酵罐(马萨诸塞州萨默维尔市生物工程公司(Bioengineering,Inc.,Somerville,Massachusetts));仅空气喷射的两个Rushton叶轮;以及运行BioSCADA软件的控制系统,所述控制系统允许跟踪和控制包含pH、DO、排气O2、CO2、温度、温度和压力的所有相关参数。
实例3
表达TRAST-Fab的宿主细胞的活性特异性富集
TRAST-Fab是HER2结合性单克隆抗体曲妥珠单抗的抗原结合片段。TRAST-Fab重链(“HC”)和TRAST-Fab轻链(“LC”)的氨基酸序列分别在SEQ ID NO 2和3中呈现。在此实例中,TRAST-Fab的重链和轻链从表达构建体、双启动子表达载体中共表达,所述双启动子表达载体包括阿拉伯糖诱导的araBAD(“ara”)启动子和丙酸盐诱导的prpBCDE(“prp”)启动子。双启动子表达载体的核苷酸序列在SEQ ID NO:1中呈现。对于以下活性特异性细胞富集程序,宿主细胞是具有上文第I节中所示的基因型的大肠杆菌521细胞。
为了创建供选择和活性特异性富集的宿主细胞群体,用双启动子表达载体(SEQID NO:1)转化大肠杆菌521细胞,或者不插入到其中的任何另外的多核苷酸序列(“空”,表1的样品A1),或者包括包含编码TRAST-Fab的各种多核苷酸序列,如下表1中所描述的。为了允许从prp启动子表达另外的基因产物,在某些样品中,TRAST-Fab HC和LC以双顺反子布置从ara启动子以HC-LC或LC-HC布置表达。在其中一些样品中,prp启动子表达编码二硫键异构酶蛋白DsbC形式的多核苷酸,其显然缺乏信号肽并且因此定位于细胞细胞质,并且将被称为“cDsbC”(SEQ ID NO:4)。SEQ ID NO:7和8的TRAST-Fab HC和LC多肽具有衍生自集胞藻DnaB(UniProtKB Q55418)的N末端氨基酸序列;此DnaB相关的氨基酸序列包括6xHis序列并且作为SEQ ID NO:9提供。
表1.用于活性特异性富集的宿主细胞群体的特性
Figure BDA0003846877850000311
Figure BDA0003846877850000321
样品A1-A4是所述程序的对照样品,A1是不表达TRAST-Fab基因产物的阴性对照宿主细胞群体,并且A2-A4是各自表达来自表达载体的单一形式的TRAST-Fab的对照宿主细胞群体。在样品B1-B4和C1-C4中,宿主细胞群体包括具有从prp启动子表达的137种不同的基因产物的不同形式的表达载体。在样品B1-B6和C1-C4中,由宿主细胞组成的表达载体具有另外的变异源,所述变异源将群体内不同形式表达载体的总数增加到12,769,19,728或1,749,353。
在用表达载体转化之后,将宿主细胞样品铺板接种到含有卡那霉素(kanamycin)(50微克/mL)的固体培养基上以选择包括表达载体的成功转化子,所述表达载体携带卡那霉素抗性的基因。在37℃下生长过夜之后,将宿主细胞集落从固体培养基中刮取到LB培养基(10g/L胰蛋白酶、5g/L酵母提取物和10g/L NaCl)中,并且通过用LB培养基稀释将600nm处的光密度(OD600)调节到3。诱导宿主细胞群体在诱导培养基(具有8mM MgSO4、1 X Korz微量金属、50微克/mL卡那霉素和如下文所描述的诱导剂的发酵生产培养基)中表达TRAST-Fab HC和LC,以及存在于表达载体上的任何其它基因产物。
发酵生产培养基包含KH2PO4、(NH4)2SO4、酵母提取物、甘油、柠檬酸和1 X Korz微量金属,其中NH4OH达到pH 6.8。
在含有1mM丙酸盐和250微摩尔阿拉伯糖的培养基中诱导样品A1、A3、A4和B1-B6;在含有20mM丙酸盐和250微摩尔阿拉伯糖的培养基中诱导样品A2和C1-C4。
将每个宿主细胞群体的两份复制样品(在上文为3的OD600下)置于24孔深孔板中的诱导培养基中,用AerasealTM盖板(加利福尼亚州维克多维尔Excel公司(ExcelScientific,Victorville,California))覆盖,温育,并且然后测定每个样品的OD600。收获每个样品中剩余的宿主细胞培养物以通过离心进行进一步分析,随后进行上清液的抽吸并作为沉淀储存。
然后固定样品以进行标记。通过将0.5mL的冷固定溶液(含0.65%多聚甲醛、0.02%戊二醛和32.25mM磷酸三钠的去离子水)添加到每个样品中并且使沉淀重新悬浮、培育、离心并通过抽吸去除上清液来固定宿主细胞。将0.2mL体积的透化缓冲液(含50mM葡萄糖、20mM Tris、10mM EDTA pH 8.2和每10mL缓冲液1单位溶菌酶的去离子水)添加到每个洗涤的沉淀中,并且将样品在冰上温育。在透化缓冲液中温育之后,将样品在冷时离心,并且通过抽吸去除上清液。通过将0.5mL 1X免疫测定缓冲液(马萨诸塞州沃尔瑟姆珀金埃尔默公司,25mM HEPES pH 7.4,0.1%酪蛋白,1mg/mL右旋糖酐-500,0.5%曲通X-100和0.05%Proclin-300,加1mM EDTA)添加到未混合的沉淀中来固定透化宿主细胞沉淀,将样品离心,并通过抽吸去除上清液。
为了在透化和固定宿主细胞内标记TRAST-Fab,首先将与TRAST-Fab抗体片段特异性地结合的HER2抗原在荧光标记的链霉亲和素存在下与生物素缀合,以制备HER2-生物素-链霉亲和素-荧光团缀合物。通过添加具有1mM EDTA的免疫测定缓冲液(参见上文),使10微摩尔Alexa
Figure BDA0003846877850000331
488链霉亲和素(马萨诸塞州沃尔瑟姆赛默飞世尔科技公司)和1.75微摩尔HER2(约1:20v/v)的混合物达到10mL。将含有此溶液的管在旋转式混合器上在4℃下温育过夜。温育之后,将生物素添加到HER2 Alexa
Figure BDA0003846877850000332
488链霉亲和素溶液(0.1mg/mL生物素最终浓度)中并温育。
通过将HER2-生物素-链霉亲和素-Alexa
Figure BDA0003846877850000333
488溶液添加到每个样品来标记宿主细胞样品并在4℃下温育过夜。然后将样品离心并通过抽吸去除上清液。将宿主细胞沉淀重新悬浮在0.5mL 1 X PBS pH 8中以用于FACS选择程序。
FACS仪器,BD FACSAriaTM-IIu(新泽西州富兰克林湖贝克顿,迪金森公司)用于分选样品中的经标记的宿主细胞。将碘化丙啶(1mg/ml)添加到每个0.5mL样品中以染色存在于宿主细胞中的DNA。因为样品中的宿主细胞被固定且透化,所以碘化丙啶能够穿透宿主细胞并且获得细胞的DNA。将如表1中所示的宿主细胞样品A1-A4、B1-B6和C1-C4在未进行分选的情况下在FACS仪器上运行,以设置实验中使用的光电倍增管(PMT)的电压。通过FACS仪器运行宿主细胞样品,记录每个A1-A4对照样品的50,000个事件和每个B1-B6和C1-C4样品的1百万个事件,除了A4之外,每个样品重复运行。基于从样品产生的实验数据,使用FlowJo(TM)软件(新泽西州富兰克林湖贝克顿,迪金森公司)设置分选门,所述软件确定经标记的宿主细胞分选将发生的参数。
第一门控标准基于DNA荧光检测,使用675/20nm波长滤光片,针对FSC-A(总细胞荧光作为细胞大小的指标)绘制为SSC-A(总细胞粒度)。对于此实验中所使用的固定和经标记的大肠杆菌宿主细胞,大小和粒度的增加可能由多个细胞的凝集引起。此初始门(“P2”)设定为保留超过99.9%的所询问的检测事件,并仅排除与预期SSC-A到FSC-A分布相比时为极端异常值的事件。第二门也基于675/20DNA荧光,针对FSC-H绘制为SSC-W,并且将所选的事件设定为SSC-W值在38,000至63,000之间的事件——单个细胞的预期范围——以消除多个细胞的团块,并且FSC-H值为20或更大。取决于样品,第二门导致保留大约30%到50%的检测事件。
最终分选门是基于以FSC-A测量的675/20DNA荧光与以FSC-A测量的经HER2标记的TRAST-Fab蛋白或DnaB-TRAST-Fab的530/30荧光的比较。如在图2中示出的,创建了具有复杂边界的“低DNA”门。此门选择与较低量的DNA荧光和较高量的经HER2标记的Alexa
Figure BDA0003846877850000341
488荧光相关联的检测事件,以选择具有较高产量的TRAST-Fab或DnaB-TRAST-Fab的单独的细胞。当将此“低DNA”门应用于为对照样品A1-A4记录的50,000个事件时,用此门为A1“空载体”对照样品选择零事件,为A4对照样品选择1个事件,为样品A2和A3分别选择2434和1471个事件(两次运行的平均值)。将“低DNA”门应用于为B1-B6和C1-C4样品记录的一百万个事件,从而导致每个样品的平均值在82与662个事件之间被选中。
在开始细胞分选操作之前,将50微升的不含EDTA的1X免疫测定缓冲液(参见上文)置于收集管中。对样品B1-B6和C1-C4进行细胞分选,记录了2.7百万个到10.9百万个事件并且每个样品收集了1000个事件。
制备了包括展现出高水平的DnaB-TRAST-Fab表达的宿主细胞的FACS分类样品以通过根据制造商的说明使用QIAprep(R)Spin Miniprep试剂盒(荷兰文洛凯杰公司(Qiagen,Venlo,Netherlands))从所选的细胞群体中分离质粒DNA进行进一步分析,目的是重建宿主细胞(下文)并且用于高通量下一代DNA测序(“NGS”)。还为NGS分析准备了对应的分选前样品。通过与Nextera Flex珠(加利福尼亚州圣地亚哥依诺米那公司(Illumina,SanDiego,California))的混合物制备用于NGS的DNA样品。然后通过聚合酶链反应(PCR)扩增“标记”DNA样品,并在MiSeq测序仪(加利福尼亚州圣地亚哥依诺米那公司)上运行。
当与对应的分选前样品进行比较时,NGS发现通过FACS分选选择用于较高DnaB-TRAST-Fab表达的宿主细胞群体富集了特定表达载体多核苷酸元素的存在和与来自prp启动子的DnaB-TRAST-Fab共表达的某些基因产物,如图3所示。
从高表达的宿主细胞中回收的质粒DNA还用于转化亲本宿主细胞品系大肠杆菌521细胞,以重建富集指导DnaB-TRAST-Fab高水平表达的表达载体的宿主细胞群体。
对应于选自上文表1中的样品B1-B6和C1-C4的宿主细胞的重建的宿主细胞群体被称为B1*-B6*和C1*-C4*以指示其是从FACS选择的宿主细胞重建的。这些B1*-B6*和C1*-C4*宿主细胞群体,连同表1中所描述的先前未分选的宿主细胞群体B1-B6和C1-C4通过在诱导培养基中温育持续22小时来诱导生长,收获、标记,并通过如上文所描述的门控FACS筛选进行分析。由FACS分选产生的宿主细胞的B1*-B6*和C1*-C4*群体显着富集了以更高水平表达TRAST-Fab的宿主细胞,如在图4中所示出的。
FACS选择的B1*B4*宿主细胞群体如上文实施例1E中所描述的进行重建:将从每个样品中回收的质粒转化到大肠杆菌521亲本宿主细胞品系中,并含有50微克/mL卡那霉素的固体培养基上铺板接种。将宿主细胞的单个集落挑选到96孔板中-88孔用于B1*、163孔用于B2*、88孔用于B3*以及189孔用于B4*,以便通过衍生自单独的细胞的宿主细胞培养物确定TRAST-Fab的表达。对照宿主细胞A3和A4(参见表1)也包含在每个96孔板上的多个孔中。这些宿主细胞样品生长并通常使用实例1A中所列的程序通过在诱导培养基中温育来诱导TRAST-Fab表达。为了通过SPE-MS测定这些等分样品的TRAST-Fab表达水平,从每个诱导的宿主细胞培养物中取出预定体积(200微升)到新鲜96孔板中。
裂解收获的宿主细胞样品(A3、A4和B1*-B4*),并且离心样品。将每个样品转移到消化缓冲液(8M脲,在pH 6.00下200mM组氨酸,1:1v/v)中,然后加热以帮助展开蛋白质。加热后,向每个孔中添加胰蛋白酶/lysC蛋白酶混合物(威斯康星州麦迪逊普洛麦格公司(Promega,Madison Wisconsin))。然后温育样品。温育后,用添加甲酸来淬灭样品。
然后对来自样品A3、A4和B1*-B4*的宿主细胞蛋白的消化和淬灭样品进行SPE-MS,以进行肽多反应监测(MRM)检测。MRM被设置成监测来自样品的DnaB-TRAST-Fab多肽的三种肽:来自重链(HC)的肽,GPSVFPLAPSSK(SEQ ID NO:2的氨基酸126-137);来自轻链(LC)的肽,DSTYSLSSTLTLSK(SEQ ID NO:3的氨基酸171-184);以及来自DnaB相关N末端氨基酸序列的肽,EHIALPR(SEQ ID NO:9的氨基酸92-98)。选择这些肽以提供最佳去簇电位和碰撞能量。基于这些标准,监测每个肽的两个转换,如在下表2中所示出的。
表2.DnaB-TRAST-Fab MRM实验的描述性特征。
Figure BDA0003846877850000361
TRAST-Fab标准品在一系列稀释样品中消化,所述稀释样品通过用由‘空’(无表达载体)宿主细胞制备的细胞裂解物稀释标准品而制备。通过此程序产生的标准曲线用于对所有询问样品进行定量。
基于相对于表1中所示出的A3对照样品表达大量的HC和LC(mg/L/OD600)两者,并且还基于展现出比对照样品A3高至少2.5倍的对应于更高的总蛋白产量的DnaB内含肽来选择候选宿主细胞群体(参见图5)。选择样品B1*_G5、B1*_H11、B1*_H6、B2*_A10和B4*_H11以通过基于蛋白质A的纯化和通过功能性TRAST-Fab的抗原结合测定进行进一步分析,如下文进一步所描述的。
将来自样品B1*_G5、B1*_H11、B1*_H6、B2*_A10和B4*_H11以及对照样品A3的宿主细胞在通常如实例1A中所描述的20mL的摇瓶培养物中生长,测量每种培养物的OD600,并且然后离心形成宿主细胞的沉淀。裂解宿主细胞,并在冰上温育持续30分钟。将宿主细胞裂解物离心并过滤上清液。通过蛋白质A结合Fab重链,将过滤的细胞裂解物加载到
Figure BDA0003846877850000362
(TM)HiTrap MabSelect(TM)1-mL柱(马萨诸塞州马尔堡通用电气医疗集团)上用于对来自样品的宿主细胞裂解物中的TRAST-Fab或DnaB-TRAST-Fab重链/轻链异二聚体(统称为TRAST-Fab异二聚体)的基于蛋白-A的纯化。
Figure BDA0003846877850000371
(TM)器件测量洗脱液级分在280nm处的吸光度,并整合每个样品的结果以测定存在于洗脱液峰中的蛋白质的总量。另外,基于对应于异二聚体的预期质量的280nm吸光度峰,HP-LC用于定量存在于洗脱液级分中的TRAST-Fab异二聚体的量。结果在下表3中示出,其中蛋白质的量以所诱导的宿主细胞培养物的体积和细胞密度(OD600)表达。从此分析中可以看出,B4*_H11样品产生的总蛋白和TRAST Fab异二聚体始终是对照A3样品的约1.5倍。
表3.单独的宿主细胞对TRAST-Fab产生的定量
样品 OD600 总蛋白-A结合(mg/L/OD600) TRAST-Fab异二聚体(mg/L/OD600)
A3对照 19.56 14.62 7.07
B1*_G5 16.84 8.06 11.15
B1*_H11 17.08 10.05 3.81
B1*_H6 17.56 25.49 5.02
B2*_A10 20.36 22.10 2.95
B4*_H11 16.64 20.82 11.20
通过特异性地测量具有抗原结合活性的TRAST-Fab异源二聚体的存在的抗原结合测定来评估由样品B1*G5、B1*_H11、B1*H6、B2*_A10和B4*_H11的样品产生的活性DnaB-TRAST-Fab的量以及由对照样品A3产生的活性TRAST-Fab的量。此测定指示样品B2*_A10和B4*_H11各自产生的TRAST Fab异二聚体为对照A3样品的约1.5倍。
评估高表达载体的富集水平。使用ACE测定,固定、透化未处理的文库并用HER2探测以检测曲妥珠单抗Fab'的产生。在产生靶标的细胞中,前<0.5%的细胞通过ACE测定进行分选。随后,分离载体质粒并将其重新转化到细胞中以评估表达。应用相同的分选门,在重新转化后,证明了对于高表达载体的>10倍富集(图6)。为了评估ACE测定后曲妥珠单抗Fab'产生的完全增加,通过阴性和阳性对照样品建立了门控。在ACE测定后,未处理的文库通常具有显著增加的低水平表达(图7A-7B)。
在实践本公开时,任选地使用分子生物学、微生物学和重组DNA技术中的许多传统技术。此类传统技术涉及载体、宿主细胞和重组方法。这些技术是众所周知的并且在例如以下文献中有所解释:Berger和Kimmel,分子克隆技术指南(Guide to Molecular CloningTechniques),《酶学方法(Methods in Enzymology)第152卷加利福尼亚州圣地亚哥学术出版社(Academic Press,Mc,San Diego,CA);Sambrook等人,《分子克隆:实验室手册(Molecular Cloning-A Laboratory Manual)(第3版),第1-3卷,《冷泉港实验室(ColdSpring Harbor Laboratory)》,纽约冷泉港(Cold Spring Harbor,New York),2000;以及《当代分子生物学实验指南(Current Protocols in Molecular Biology)》,F.M.Ausubel等人编辑,《当今方案(Current Protocols)》,格林出版协会公司(Greene PublishingAssociates,Inc.)与约翰威利父子公司(John Wiley Sons,Inc.,)合资企业,(2006年补充)。例如用于细胞分离和培养以及用于随后的核酸或蛋白质分离的其它有用的参考,包含Freshney(1994)动物细胞的培养(Culture of Animal Cells),《基础技术手册(a Manualof Basic Technique)》,第三版,纽约威利-丽斯出版社(Wiley-Liss,New York)以及其中引用的参考文献;Payne等人,(1992)液体系统中的植物细胞和组织培养物(Plant Celland Tissue Culture in Liquid Systems)纽约约翰威利父子公司(John Wiley&Sons,Inc.New York),NY;Gamborg和Phillips(编辑)(1995)植物细胞、组织和器官培养(PlantCell,Tissue and Organ Culture);《施普林格实验室手册基本方法(FundamentalMethods Springer Lab Manual)》,施普林格出版社(Springer-Verlag)(纽约海德堡柏林(Berlin Heidelberg New York));以及Atlas和Parks(编辑)《微生物培养基手册(TheHandbook of Microbiological Media)》(1993)佛罗里达州波卡拉顿CRC出版社(CRCPress,Boca Raton,FL)。在上述参考文献中描述了制备核酸(例如,通过体外扩增、从细胞中纯化或化学合成)的方法、用于操纵核酸的方法(例如,通过定点诱变、限制性酶消化、连接等)以及可用于操纵和制备核酸的各种载体、细胞系等。另外,基本上任何多核苷酸(包含经标记的或生物素化的多核苷酸)均可以从各种商业来源中定制或标准订购。
已经按照发现或提出的包括用于实施本发明的某些模式的特定实施例描述了本发明。本领域普通技术人员将理解,鉴于本公开,在不脱离本发明的预期范围的情况下,可以对例示的特定实施例进行多种修改和改变。
本文中所有引用的参考文献,包含专利出版物均以全文引用的方式并入本文。通过所公开的基因组位置或其它描述所提及的核苷酸和其它基因序列也以引用的方式明确地并入本文。
<110> AbSci有限责任公司(AbSci LLC)
<120> 活性特异性细胞富集
<130> 10294-105653-01
<150> US 62/961,392
<151> 2020-01-15
<160> 9
<170> PatentIn 3.5版
<210> 1
<211> 5304
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 表达载体
<400> 1
ggcctttctt cggtagaagt cttcccccag aggcaggtat caaaggatct tcttgagatc 60
ctttttttct gcgcgtaatc tgctgcttgc aaacaaaaaa accaccgcta ccagcggtgg 120
tttgtttgcc ggatcaagag ctaccaactc tttttccgag gtaactggct tcagcagagc 180
gcagatacca aatactgttc ttctagtgta gccgtagtta ggccaccact tcaagaactc 240
tgtagcaccg cctacatacc tcgctctgct aatcctgtta ccagtggctg ctgccagtgg 300
cgataagtcg tgtcttaccg ggttggactc aagacgatag ttaccggata aggcgcagcg 360
gtcgggctga acggggggtt cgtgcacaca gcccagcttg gagcgaacga cctacaccga 420
actgagatac ctacagcgtg agctatgaga aagcgccacg cttcccgaag ggagaaaggc 480
ggacaggtat ccggtaagcg gcagggtcgg aacaggagag cgcacgaggg agcttccagg 540
gggaaacgcc tggtatcttt atagtcctgt cgggtttcgc cacctctgac ttgagcatcg 600
atttttgtga tgctcgtcag gggggcggag cctatggaaa aacgccagca acgcagaaag 660
gcccacccga aggtgagcca ggtgattaca tttgggccct catcagaggt tttcaccgtc 720
atcaccgaaa cgcgcgaggc agctgcggta aagctcatca gcgtggtcgt gaagcgattc 780
acagatgtct gcctgttcat ccgcgtccag ctcgttgagt ttctccagaa gcgttaatgt 840
ctggcttctg ataaagcggg ccatgttaag ggcggttttt tcctgtttgg tcatacctgc 900
ttagaaaaac tcatcgagca tcaaatgaaa ttgcaattta ttcatatcag gattatcaat 960
accatatttt tgaaaaagcc gtttctgtaa tgaaggagaa aactcaccga ggcagttcca 1020
taggatggca agatcctggt atcggtctgc gattccgact cgtccaacat caatacaacc 1080
tattaatttc ccctcgtcaa aaataaggtt atcaagtgag aaatcaccat gagtgacgac 1140
tgaatccggt gagaatggca aaagtttatg catttctttc cagacttgtt caacaggcca 1200
gccattacgc tcgtcatcaa aatcactcgc atcaaccaaa ccgttattca ttcgtgattg 1260
cgcctgagcg aggcgaaata cgcgatcgct gttaaaagga caattacaaa caggaatcga 1320
gtgcaaccgg cgcaggaaca ctgccagcgc atcaacaata ttttcacctg aatcaggata 1380
ttcttctaat acctggaacg ctgtttttcc ggggatcgca gtggtgagta accatgcatc 1440
atcaggagta cggataaaat gcttgatggt cggaagtggc ataaattccg tcagccagtt 1500
tagtctgacc atctcatctg taacatcatt ggcaacgcta cctttgccat gtttcagaaa 1560
caactctggc gcatcgggct tcccatacaa gcgatagatt gtcgcacctg attgcccgac 1620
attatcgcga gcccatttat acccatataa atcagcatcc atgttggaat ttaatcgcgg 1680
cctcgacgtt tcccgttgaa tatggctcat agctcctgaa aatctcgata actcaaaaaa 1740
tacgcccggt agtgatctta tttcattatg gtgaaagttg gaacctctta cgtgccgatc 1800
aagaagacgg tcaaaagcct ccggtcggag gccgggagag tgttcaccga caaacaacag 1860
ataaaacaaa aggcccagtc ttccgactga gccttttgtt ttatttgatg tctggcagtt 1920
cccgagacgt tatgacaact tgacggctac atcattcact ttttcttcac aaccggcacg 1980
gaactcgctc gggctggccc cggtgcattt tttaaatacc cgcgagaaat agagttgatc 2040
gtcaaaacca acattgcgac cgacggtggc gataggcatc cgggtggtgc tcaaaagcag 2100
cttcgcctgg ctgatacgtt ggtcctcgcg ccagcttaag acgctaatcc ctaactgctg 2160
gcggaaaaga tgtgacagac gcgacggcga caagcaaaca tgctgtgcga cgctggcgat 2220
atcaaaattg ctgtctgcca ggtgatcgct gatgtactga caagcctcgc gtacccgatt 2280
atccatcggt ggatggagcg actcgttaat cgcttccatg cgccgcagta acaattgctc 2340
aagcagattt atcgccagca gctccgaata gcgcccttcc ccttgcccgg cgttaatgat 2400
ttgcccaaac aggtcgctga aatgcggctg gtgcgcttca tccgggcgaa agaaccccgt 2460
attggcaaat attgacggcc agttaagcca ttcatgccag taggcgcgcg gacgaaagta 2520
aacccactgg tgataccatt cgcgagcctc cggatgacga ccgtagtgat gaatctctcc 2580
tggcgggaac agcaaaatat cacccggtcg gcaaacaaat tctcgtccct gatttttcac 2640
caccccctga ccgcgaatgg tgagattgag aatataacct ttcattccca gcggtcggtc 2700
gataaaaaaa tcgagataac cgttggcctc aatcggcgtt aaacccgcca ccagatgggc 2760
attaaacgag tatcccggca gcaggggatc attttgcgct tcagccatac ttttcatact 2820
cccgccattc agagaagaaa ccaattgtcc atattgcatc agacattgcc gtctctgcgt 2880
cttttactgg ctcttctcgc taaccaaacc ggtaaccccg cttattaaaa gcattctgta 2940
acaaagcggg accaaagcca tgacaaaaac gcgtaacaaa agtgtctata atcacggcag 3000
aaaagtccac attgattatt tgcacggcgt cacactttgc tatgccatag catttttatc 3060
cataagatta gcggatccta cctgacgctt tttatcgcaa ctctctactg tttctccata 3120
cccgtttttt tgggctagca ggaggtaaaa aaaatgtgag accggtctcg gtctagatcg 3180
gtcagtttca cctgatttac gtaaaaaccc gcttcggcgg gtttttgctt ttggaggggc 3240
agaaagatga atgactgtct ctcctgttag tgagggttaa tgcccggaac gaagaaaggc 3300
ccacccgtga aggtgagcca gtgagttggt tacattttct cttgagggtt tagcttttca 3360
gacgacgcca aaaggtcgta cgtgaaatac ccaaatagtt ggccgcagcc gtcttgtcac 3420
cattaaactt ctcaagcgct tgctgcgggg tcagcaaacg cggagccggc gtctttgcgc 3480
tctcacgcgc cagctccggc agcagcaact gcatgaattg cggagtcaga tccggggtcg 3540
gctcaacgga caggaacagc gccaggcgtt ccatcatatt acgcagctcg cggatgttac 3600
ccggccagtc ataatgcagc agcaccgttt cgctcgcctg cagaccctgg cgcagtgccg 3660
cagagaacgg tgcgctcagg gctgccagcg agactttcag gaaagactcc gccagcggta 3720
aaatgtcggc gacacgttca cgcaacggcg ggagctgcag acgcagaatg ctcaggcggt 3780
agaacaggtc gcgacgaaaa cggccctgtt gcatatcctc ttccagattg cagtgggtcg 3840
cgctaatcac gcgcacgtct accggaaccg gttgatgacc accgacgcgg gtcacttctt 3900
tctcttccag cacacgcagc agacgggttt gcaatggcag cggcatctca ccgatctcgt 3960
ccaggaacaa ggtgccgccg tgggcaattt caaacaaacc agcacggcca ccgcgacggc 4020
tacccgtgaa tgcgccctct tcgtagccaa acagctcagc ttccagcagg ctttccgcga 4080
ttgcaccgca attaactgcc acaaacggat gagatttctt accctggcgg gcatcgtgac 4140
gggcgaaata ctcacgatgg attgcttgcg cagccagttc cttacccgta ccagtctcgc 4200
cttcgatcag aacagccgcg ctgctacgtg catacagcag aatggtctgg cgaacttgct 4260
ccatttgagg gctttggccc agcatatcac ccaggacata acgggtacgc agcgcattac 4320
gcgtcgcatc gtgggtgttg tggcgcaggc tcattctggt catgtccagg gcgtcgctga 4380
acgcctgacg caccgttgcc gcgctgtaga taaagatgcc cgtcatgccc gcttcttcgg 4440
ccaagtccgt gatcagaccc gcaccaacca cagcctcggt accgttcgct ttcagttcgt 4500
tgatctggcc acgtgcatct tcctcggtaa tgtagctgcg ttggtccagg cgcagattaa 4560
aggtcttttg aaacgcgacc agcgcaggga tcgtttcctg gtaggtgaca acgccaatcg 4620
aggaggtcag tttgcctgcc ttcgccagcg cctgcaagac atcgtaaccg ctcggcttaa 4680
tcaggatcac cggcacggac agacgggatt tcaggtaggc accattgcta cccgctgcga 4740
taatggcgtc acaacgctcg ttggccagct ttttgcgaat gtaggtaacg gctttctcga 4800
aacccagctg aatcggagtg atgttcgcca ggtgatcaaa ctccaggcta atgtcgcgga 4860
acaactcgaa cagacgggtg acgctaacgg tccaaataac tggtttatca tcgttcaaac 4920
gcggtgggtg tgccatggtg aatacctcct gttaagaaac cgaatattgg gtttaaactt 4980
gtttcataat tgttgcaatg aaacgcggtg aaacattgcc tgaaacgtta actgaaacgc 5040
atatttgcgg attagttcat gactttatct ctaacaaatt gaaattaaac atttaatttt 5100
attaaggcaa ttgtggcaca ccccttgctt tgtctttatc aacgcaaata acaagttgat 5160
aacaaaagct taggaggaaa acatagagac cggtctctct cgagtaacta gttgatagag 5220
atcaagcctt aacgaactaa gacccccgca ccgaaaggtc cgggggtttt ttttgacctt 5280
aaaaacataa ccgaggagca gaca 5304
<210> 2
<211> 229
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 曲妥珠单抗-Fab重链A2
<400> 2
Met Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Pro Gly
1 5 10 15
Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Asn Ile Lys Asp
20 25 30
Thr Tyr Ile His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp
35 40 45
Val Ala Arg Ile Tyr Pro Thr Asn Gly Tyr Thr Arg Tyr Ala Asp Ser
50 55 60
Val Lys Gly Arg Phe Thr Ile Ser Ala Asp Thr Ser Lys Asn Thr Ala
65 70 75 80
Tyr Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr
85 90 95
Cys Ser Arg Trp Gly Gly Asp Gly Phe Tyr Ala Met Asp Tyr Trp Gly
100 105 110
Gln Gly Thr Leu Val Thr Val Ser Ser Ala Ser Thr Lys Gly Pro Ser
115 120 125
Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly Gly Thr Ala
130 135 140
Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val
145 150 155 160
Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr Phe Pro Ala
165 170 175
Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Thr Val
180 185 190
Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn Val Asn His
195 200 205
Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val Glu Pro Pro Lys Ser
210 215 220
Cys Asp Lys Thr His
225
<210> 3
<211> 215
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 曲妥珠单抗-Fab轻链A2
<400> 3
Met Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Val
1 5 10 15
Gly Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Gln Asp Val Asn Thr
20 25 30
Ala Val Ala Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro Lys Leu Leu
35 40 45
Ile Tyr Ser Ala Ser Phe Leu Tyr Ser Gly Val Pro Ser Arg Phe Ser
50 55 60
Gly Ser Arg Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln
65 70 75 80
Pro Glu Asp Phe Ala Thr Tyr Tyr Cys Gln Gln His Tyr Thr Thr Pro
85 90 95
Pro Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys Arg Thr Val Ala
100 105 110
Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser
115 120 125
Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu
130 135 140
Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn Ser
145 150 155 160
Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu
165 170 175
Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys Val
180 185 190
Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro Val Thr Lys
195 200 205
Ser Phe Asn Arg Gly Glu Cys
210 215
<210> 4
<211> 228
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 4
Met Ala Ile Thr Ile Ser His Arg Lys Gln Thr Met Asp Asp Ala Ala
1 5 10 15
Ile Gln Gln Thr Leu Ala Lys Met Gly Ile Lys Ser Ser Asp Ile Gln
20 25 30
Pro Ala Pro Val Ala Gly Met Lys Thr Val Leu Thr Asn Ser Gly Val
35 40 45
Leu Tyr Ile Thr Asp Asp Gly Lys His Ile Ile Gln Gly Pro Met Tyr
50 55 60
Asp Val Ser Gly Thr Ala Pro Val Asn Val Thr Asn Lys Met Leu Leu
65 70 75 80
Lys Gln Leu Asn Ala Leu Glu Lys Glu Met Ile Val Tyr Lys Ala Pro
85 90 95
Gln Glu Lys His Val Ile Thr Val Phe Thr Asp Ile Thr Cys Gly Tyr
100 105 110
Cys His Lys Leu His Glu Gln Met Ala Asp Tyr Asn Ala Leu Gly Ile
115 120 125
Thr Val Arg Tyr Leu Ala Phe Pro Arg Gln Gly Leu Asp Ser Asp Ala
130 135 140
Glu Lys Glu Met Lys Ala Ile Trp Cys Ala Lys Asp Lys Asn Lys Ala
145 150 155 160
Phe Asp Asp Val Met Ala Gly Lys Ser Val Ala Pro Ala Ser Cys Asp
165 170 175
Val Asp Ile Ala Asp His Tyr Ala Leu Gly Val Gln Leu Gly Val Ser
180 185 190
Gly Thr Pro Ala Val Val Leu Ser Asn Gly Thr Leu Val Pro Gly Tyr
195 200 205
Gln Pro Pro Lys Glu Met Lys Glu Phe Leu Asp Glu His Gln Lys Met
210 215 220
Thr Ser Gly Lys
225
<210> 5
<211> 228
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 双顺反子曲妥珠单抗-Fab重链A3
<400> 5
Met Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Pro Gly
1 5 10 15
Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Asn Ile Lys Asp
20 25 30
Thr Tyr Ile His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp
35 40 45
Val Ala Arg Ile Tyr Pro Thr Asn Gly Tyr Thr Arg Tyr Ala Asp Ser
50 55 60
Val Lys Gly Arg Phe Thr Ile Ser Ala Asp Thr Ser Lys Asn Thr Ala
65 70 75 80
Tyr Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr
85 90 95
Cys Ser Arg Trp Gly Gly Asp Gly Phe Tyr Ala Met Asp Tyr Trp Gly
100 105 110
Gln Gly Thr Leu Val Thr Val Ser Ser Ala Ser Thr Lys Gly Pro Ser
115 120 125
Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly Gly Thr Ala
130 135 140
Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val
145 150 155 160
Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr Phe Pro Ala
165 170 175
Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Thr Val
180 185 190
Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn Val Asn His
195 200 205
Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val Glu Pro Lys Ser Cys
210 215 220
Asp Lys Thr His
225
<210> 6
<211> 215
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 双顺反子曲妥珠单抗-Fab轻链A3
<400> 6
Met Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Val
1 5 10 15
Gly Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Gln Asp Val Asn Thr
20 25 30
Ala Val Ala Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro Lys Leu Leu
35 40 45
Ile Tyr Ser Ala Ser Phe Leu Tyr Ser Gly Val Pro Ser Arg Phe Ser
50 55 60
Gly Ser Arg Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln
65 70 75 80
Pro Glu Asp Phe Ala Thr Tyr Tyr Cys Gln Gln His Tyr Thr Thr Pro
85 90 95
Pro Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys Arg Thr Val Ala
100 105 110
Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser
115 120 125
Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu
130 135 140
Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn Ser
145 150 155 160
Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu
165 170 175
Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys Val
180 185 190
Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro Val Thr Lys
195 200 205
Ser Phe Asn Arg Gly Glu Cys
210 215
<210> 7
<211> 396
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 具有源自集胞藻DnaB的N末端氨基酸序列的曲妥珠单抗-Fab重链
<400> 7
Met Ala Ile Ser Gly Asp Ser Leu Ile Ser Leu Ala Ser Thr Gly Lys
1 5 10 15
Arg Val Ser Ile Lys Asp Leu Leu Asp Glu Lys Asp Phe Glu Ile Trp
20 25 30
Ala Ile Asn Glu Gln Thr Met Lys Leu Glu Ser Ala Lys Val Ser Arg
35 40 45
Val Phe Cys Thr Gly Lys Lys Leu Val Tyr Ile Leu Lys Thr Arg Leu
50 55 60
Gly Arg Thr Ile Lys Ala Thr Ala Asn His Arg Phe Leu Thr Ile Asp
65 70 75 80
Gly Trp Lys Arg Leu Asp Glu Leu Ser Leu Lys Glu His Ile Ala Leu
85 90 95
Pro Arg Lys Leu Glu Ser Ser Ser Leu Gln Leu Ala Ser Gly His His
100 105 110
His His His His Gly Gly Ser Gly Ser Ser Pro Glu Ile Glu Lys Leu
115 120 125
Ser Gln Ser Asp Ile Tyr Trp Asp Ser Ile Val Ser Ile Thr Glu Thr
130 135 140
Gly Val Glu Glu Val Phe Asp Leu Thr Val Pro Gly Pro His Asn Phe
145 150 155 160
Val Ala Asn Asp Ile Ile Val His Asn Glu Val Gln Leu Val Glu Ser
165 170 175
Gly Gly Gly Leu Val Gln Pro Gly Gly Ser Leu Arg Leu Ser Cys Ala
180 185 190
Ala Ser Gly Phe Asn Ile Lys Asp Thr Tyr Ile His Trp Val Arg Gln
195 200 205
Ala Pro Gly Lys Gly Leu Glu Trp Val Ala Arg Ile Tyr Pro Thr Asn
210 215 220
Gly Tyr Thr Arg Tyr Ala Asp Ser Val Lys Gly Arg Phe Thr Ile Ser
225 230 235 240
Ala Asp Thr Ser Lys Asn Thr Ala Tyr Leu Gln Met Asn Ser Leu Arg
245 250 255
Ala Glu Asp Thr Ala Val Tyr Tyr Cys Ser Arg Trp Gly Gly Asp Gly
260 265 270
Phe Tyr Ala Met Asp Tyr Trp Gly Gln Gly Thr Leu Val Thr Val Ser
275 280 285
Ser Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser
290 295 300
Lys Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp
305 310 315 320
Tyr Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr
325 330 335
Ser Gly Val His Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr
340 345 350
Ser Leu Ser Ser Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln
355 360 365
Thr Tyr Ile Cys Asn Val Asn His Lys Pro Ser Asn Thr Lys Val Asp
370 375 380
Lys Lys Val Glu Pro Lys Ser Cys Asp Lys Thr His
385 390 395
<210> 8
<211> 383
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 具有源自集胞藻DnaB的N末端氨基酸序列的曲妥珠单抗-Fab轻链
<400> 8
Met Ala Ile Ser Gly Asp Ser Leu Ile Ser Leu Ala Ser Thr Gly Lys
1 5 10 15
Arg Val Ser Ile Lys Asp Leu Leu Asp Glu Lys Asp Phe Glu Ile Trp
20 25 30
Ala Ile Asn Glu Gln Thr Met Lys Leu Glu Ser Ala Lys Val Ser Arg
35 40 45
Val Phe Cys Thr Gly Lys Lys Leu Val Tyr Ile Leu Lys Thr Arg Leu
50 55 60
Gly Arg Thr Ile Lys Ala Thr Ala Asn His Arg Phe Leu Thr Ile Asp
65 70 75 80
Gly Trp Lys Arg Leu Asp Glu Leu Ser Leu Lys Glu His Ile Ala Leu
85 90 95
Pro Arg Lys Leu Glu Ser Ser Ser Leu Gln Leu Ala Ser Gly His His
100 105 110
His His His His Gly Gly Ser Gly Ser Ser Pro Glu Ile Glu Lys Leu
115 120 125
Ser Gln Ser Asp Ile Tyr Trp Asp Ser Ile Val Ser Ile Thr Glu Thr
130 135 140
Gly Val Glu Glu Val Phe Asp Leu Thr Val Pro Gly Pro His Asn Phe
145 150 155 160
Val Ala Asn Asp Ile Ile Val His Asn Asp Ile Gln Met Thr Gln Ser
165 170 175
Pro Ser Ser Leu Ser Ala Ser Val Gly Asp Arg Val Thr Ile Thr Cys
180 185 190
Arg Ala Ser Gln Asp Val Asn Thr Ala Val Ala Trp Tyr Gln Gln Lys
195 200 205
Pro Gly Lys Ala Pro Lys Leu Leu Ile Tyr Ser Ala Ser Phe Leu Tyr
210 215 220
Ser Gly Val Pro Ser Arg Phe Ser Gly Ser Arg Ser Gly Thr Asp Phe
225 230 235 240
Thr Leu Thr Ile Ser Ser Leu Gln Pro Glu Asp Phe Ala Thr Tyr Tyr
245 250 255
Cys Gln Gln His Tyr Thr Thr Pro Pro Thr Phe Gly Gln Gly Thr Lys
260 265 270
Val Glu Ile Lys Arg Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro
275 280 285
Pro Ser Asp Glu Gln Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu
290 295 300
Leu Asn Asn Phe Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp
305 310 315 320
Asn Ala Leu Gln Ser Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp
325 330 335
Ser Lys Asp Ser Thr Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys
340 345 350
Ala Asp Tyr Glu Lys His Lys Val Tyr Ala Cys Glu Val Thr His Gln
355 360 365
Gly Leu Ser Ser Pro Val Thr Lys Ser Phe Asn Arg Gly Glu Cys
370 375 380
<210> 9
<211> 169
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 源自包含6xHis序列的集胞藻DnaB的N末端氨基酸序列
<400> 9
Met Ala Ile Ser Gly Asp Ser Leu Ile Ser Leu Ala Ser Thr Gly Lys
1 5 10 15
Arg Val Ser Ile Lys Asp Leu Leu Asp Glu Lys Asp Phe Glu Ile Trp
20 25 30
Ala Ile Asn Glu Gln Thr Met Lys Leu Glu Ser Ala Lys Val Ser Arg
35 40 45
Val Phe Cys Thr Gly Lys Lys Leu Val Tyr Ile Leu Lys Thr Arg Leu
50 55 60
Gly Arg Thr Ile Lys Ala Thr Ala Asn His Arg Phe Leu Thr Ile Asp
65 70 75 80
Gly Trp Lys Arg Leu Asp Glu Leu Ser Leu Lys Glu His Ile Ala Leu
85 90 95
Pro Arg Lys Leu Glu Ser Ser Ser Leu Gln Leu Ala Ser Gly His His
100 105 110
His His His His Gly Gly Ser Gly Ser Ser Pro Glu Ile Glu Lys Leu
115 120 125
Ser Gln Ser Asp Ile Tyr Trp Asp Ser Ile Val Ser Ile Thr Glu Thr
130 135 140
Gly Val Glu Glu Val Phe Asp Leu Thr Val Pro Gly Pro His Asn Phe
145 150 155 160
Val Ala Asn Asp Ile Ile Val His Asn
165

Claims (37)

1.一种用于从具有至少1000个遗传多样性的宿主细胞的群体中选择宿主细胞的方法,其中所述宿主细胞中的至少一些宿主细胞包括编码所关注的基因产物的多核苷酸序列,所述方法包括:
培养所述宿主细胞的群体,由此所述所关注的基因产物通过所述群体中的所述宿主细胞的亚群表达,所述亚群由此包括表达的宿主细胞;
标记所述亚群中的所述表达的宿主细胞中的至少一些表达的宿主细胞,其中所述标记包括使所述所关注的基因产物与可检测部分相关联,由此产生经标记的表达的宿主细胞;以及
选择经标记的表达的宿主细胞的子集,其中所述选择包括通过细胞分选设备检测所述可检测部分。
2.根据权利要求1所述的方法,其中所述宿主细胞群体的所述遗传多样性是由所述宿主细胞群体中的所述宿主细胞中的至少一些宿主细胞构成的宿主细胞基因组变异、一种或多种表达构建体的多核苷酸序列变异或其组合。
3.根据权利要求2所述的方法,其中所述宿主细胞的群体的所述遗传多样性为200,000-1,000,000。
4.一种用于从具有遗传多样性的宿主细胞的群体中选择表达的宿主细胞的方法,所述遗传多样性包括多个遗传变体,其中所述宿主细胞中的至少一些宿主细胞包括编码所关注的基因产物的多核苷酸序列,所述方法包括:
培养所述宿主细胞的群体,由此所述所关注的基因产物通过所述群体中的所述宿主细胞的亚群表达,所述亚群由此包括表达的宿主细胞,其中来自所述表达的宿主细胞的所述所关注的基因产物的表达水平基于所述遗传变体而变化;
标记所述亚群中的所述表达的宿主细胞中的至少一些表达的宿主细胞,其中所述标记包括使所述所关注的基因产物与可检测部分相关联,其中所述标记的量与所述表达的宿主细胞中的所述所关注的基因产物的所述表达水平成比例,由此产生经标记的表达的宿主细胞;以及
选择经标记的表达的宿主细胞的子集,其中所述选择包括通过细胞分选设备检测所述可检测部分和所述标记的量。
5.一种用于从具有遗传多样性的宿主细胞的群体中选择表达的宿主细胞的方法,所述遗传多样性包括多个遗传变体,其中所述宿主细胞中的至少一些宿主细胞包括编码所关注的基因产物的多核苷酸序列,所述方法包括:
培养所述宿主细胞的群体,由此所述所关注的基因产物通过所述群体中的所述宿主细胞的亚群表达,所述亚群由此包括表达的宿主细胞,其中所述表达的宿主细胞的预定特性基于所述遗传变体而变化;
标记所述亚群中的所述表达的宿主细胞中的至少一些表达的宿主细胞,其中所述标记包括使所述所关注的基因产物与可检测部分相关联,其中所述标记的量与所述表达的宿主细胞中的所述所关注的基因产物的所述预定特性成比例,由此产生经标记的表达的宿主细胞;以及
选择经标记的表达的宿主细胞的子集,其中所述选择包括通过细胞分选设备检测所述可检测部分和所述预定。
6.根据权利要求5所述的方法,其中所述表达的宿主细胞的所述预定特性包括所关注的活性基因产物的表达水平、所述所关注的基因产物的表达水平、所述所关注的基因产物的适当蛋白质折叠、所述所关注的基因产物的适当折叠的蛋白质的表达水平、细胞活力和/或生物质的量。
7.根据权利要求1到5中任一项所述的方法,其进一步包括测量每种遗传变体的所述所关注的基因产物的相对表达水平。
8.根据权利要求1到5中任一项所述的方法,其中所述选择包括荧光激活的细胞分选。
9.根据权利要求1到5中任一项所述的方法,其中所述可检测部分包括荧光部分,并且所述选择包括选择具有最高荧光发射的0.01%-5%的细胞。
10.根据权利要求9所述的方法,其中所述选择包括选择具有最高荧光发射的0.5%的细胞。
11.根据权利要求1到5中任一项所述的方法,其中所述所关注的基因产物包括缺乏信号肽的多肽。
12.根据权利要求1到5中任一项所述的方法,其中所述所关注的基因产物包括与选自由荧光多肽和生物发光多肽组成的组的第二多肽使用相同读框融合的第一多肽。
13.根据权利要求12所述的方法,其中与所述所关注的基因产物相关联的所述可检测部分包括选自由荧光多肽和生物发光多肽组成的组的所述多肽。
14.根据权利要求1到5中任一项所述的方法,其中所述所关注的基因产物包括与具有酶活性的第二多肽使用相同读框融合的第一多肽。
15.根据权利要求14所述的方法,其中与所述所关注的基因产物相关联的所述可检测部分与具有酶活性的所述多肽的活性位点结合。
16.根据权利要求1到5中任一项所述的方法,其中编码所述所关注的基因产物的所述多核苷酸序列是表达载体。
17.根据权利要求16所述的方法,其中所述表达载体是染色体外表达载体。
18.根据权利要求1到5中任一项所述的方法,其中标记所述亚群中的所述表达的宿主细胞中的至少一些表达的宿主细胞包括固定所述表达的宿主细胞的亚群。
19.根据权利要求18所述的方法,其中固定所述表达的宿主细胞的亚群包括使所述亚群中的所述表达的宿主细胞中的至少一些表达的宿主细胞与醛接触。
20.根据权利要求19所述的方法,其中所述醛是多聚甲醛。
21.根据权利要求1到5中任一项所述的方法,其中标记所述亚群中的所述表达的宿主细胞中的至少一些表达的宿主细胞包括使所述亚群中的所述表达的宿主细胞中的至少一些表达的宿主细胞透化。
22.根据权利要求21所述的方法,其中使所述亚群中的所述表达的宿主细胞中的至少一些表达的宿主细胞透化包括使所述亚群中的所述表达的宿主细胞中的至少一些表达的宿主细胞与溶菌酶接触。
23.根据权利要求1到5中任一项所述的方法,其中标记所述亚群中的所述表达的宿主细胞中的至少一些表达的宿主细胞进一步包括使所述亚群中的所述表达的宿主细胞中的至少一些表达的宿主细胞与标记DNA的化合物接触。
24.根据权利要求23所述的方法,其中所述标记DNA的化合物是碘化丙啶。
25.根据权利要求1到5中任一项所述的方法,其中所述宿主细胞的群体中的所述宿主细胞是原核细胞。
26.根据权利要求25所述的方法,其中所述宿主细胞的群体中的所述宿主细胞是大肠杆菌(Escherichia coli)细胞。
27.根据权利要求26所述的方法,其中所述宿主细胞的群体中的所述宿主细胞是大肠杆菌521细胞。
28.根据权利要求1到5中任一项所述的方法,其进一步包括从所述经标记的表达的宿主细胞的子集中回收多核苷酸,由此产生经回收的多核苷酸。
29.根据权利要求28所述的方法,其进一步包括从所述经回收的多核苷酸中获得DNA序列信息。
30.根据权利要求29所述的方法,其进一步包括基于所述DNA序列信息对宿主细胞的基因组进行修饰。
31.根据权利要求30所述的方法,其进一步包括基于所述DNA序列信息构建表达载体的文库。
32.根据权利要求31所述的方法,其进一步包括用所述表达载体的文库转化亲本宿主细胞品系。
33.根据权利要求28所述的方法,其中所述经回收的多核苷酸是表达载体。
34.根据权利要求33所述的方法,其进一步包括用所述表达载体中的一种或多种表达载体转化亲本宿主细胞品系。
35.根据权利要求32或权利要求34所述的方法,其进一步包括培养经转化的宿主细胞。
36.根据权利要求35所述的方法,其中所述经转化的宿主细胞中的至少一些经转化的宿主细胞表达所述所关注的基因产物。
37.根据权利要求36所述的方法,其进一步包括通过选自由以下组成的组的方法来确定所述所关注的基因产物的所述表达水平:凝胶电泳、酶联免疫吸附测定(ELISA)、包含高效液相色谱法(HP-LC)的液相色谱法(LC)、固相萃取质谱法(SPE-MS)和放大发光接近均相测定。
CN202180021372.0A 2020-01-15 2021-01-15 活性特异性细胞富集 Pending CN115427577A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202062961392P 2020-01-15 2020-01-15
US62/961392 2020-01-15
PCT/US2021/013734 WO2021146626A1 (en) 2020-01-15 2021-01-15 Activity-specific cell enrichment

Publications (1)

Publication Number Publication Date
CN115427577A true CN115427577A (zh) 2022-12-02

Family

ID=76864321

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180021372.0A Pending CN115427577A (zh) 2020-01-15 2021-01-15 活性特异性细胞富集

Country Status (9)

Country Link
US (1) US20230062579A1 (zh)
EP (1) EP4090745A4 (zh)
JP (1) JP2023514045A (zh)
CN (1) CN115427577A (zh)
AU (1) AU2021207690A1 (zh)
CA (1) CA3168282A1 (zh)
IL (1) IL294764A (zh)
MX (1) MX2022008801A (zh)
WO (1) WO2021146626A1 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118434853A (zh) 2021-12-23 2024-08-02 Absci公司 用于在宿主细胞中异源表达蛋白质的产物和方法
WO2023129881A1 (en) 2021-12-30 2023-07-06 Absci Corporation Knockout of ptsp gene elevates active gene expression
US20230268026A1 (en) 2022-01-07 2023-08-24 Absci Corporation Designing biomolecule sequence variants with pre-specified attributes
WO2024040020A1 (en) 2022-08-15 2024-02-22 Absci Corporation Quantitative affinity activity specific cell enrichment

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2700713B1 (en) * 2012-08-21 2016-07-13 Miltenyi Biotec GmbH Screening and enrichment system for protein expression in eukaryotic cells using a tricistronic expression cassette
CA3034924A1 (en) * 2016-09-26 2018-03-29 Cellular Research, Inc. Measurement of protein expression using reagents with barcoded oligonucleotide sequences

Also Published As

Publication number Publication date
JP2023514045A (ja) 2023-04-05
WO2021146626A1 (en) 2021-07-22
IL294764A (en) 2022-09-01
EP4090745A4 (en) 2024-02-28
EP4090745A1 (en) 2022-11-23
US20230062579A1 (en) 2023-03-02
AU2021207690A1 (en) 2022-09-01
MX2022008801A (es) 2022-11-07
CA3168282A1 (en) 2021-07-22

Similar Documents

Publication Publication Date Title
CN115427577A (zh) 活性特异性细胞富集
Otten et al. Directed evolution: selecting today's biocatalysts
KR20210064325A (ko) 단백질 정제 방법
Wang et al. Multi-protein bridging factor 1 (Mbf1), Rps3 and Asc1 prevent stalled ribosomes from frameshifting
KR100752107B1 (ko) 피키아 파스토리스 유래의 tef 프로모터 및 이를 이용한이종 단백질의 제조방법
EA017803B1 (ru) Система экспрессии
CN114717209B (zh) 具有增加的耐盐性的t4 dna连接酶变体
JPS62130691A (ja) 組換えdna発現ベクタ−およびペニシリウム・クリソゲナムのイソペニシリンnシンセタ−ゼをコ−ドしているdna化合物
US6867042B2 (en) Method for determining and modifying protein/peptide solubility
CN115362263A (zh) 邻近测定
Fu et al. Improving the efficiency and orthogonality of genetic code expansion
CN109679886A (zh) 一种基于生物传感器的高通量筛选方法
EP3044312B1 (en) Reagents and methods for the expression of oxygen-sensitive proteins
Taki et al. Leucyl/Phenylalanyl‐tRNA‐Protein Transferase‐Mediated Chemoenzymatic Coupling of N‐Terminal Arg/Lys Units in Post‐translationally Processed Proteins with Non‐natural Amino Acids
CN113260700B (zh) 基于可检测标签与靶蛋白的CRISPR/Cas控制的整合而选择细胞的方法
US20050170460A1 (en) Method for diversifying the chemical composition of proteins produced in vivo by genetically disabling the editing function of their aminoacyl tRNA synthetases
Chen et al. A surface display yeast two-hybrid screening system for high-throughput protein interactome mapping
Tan et al. Efficient selection scheme for incorporating noncanonical amino acids into proteins in Saccharomyces cerevisiae
CN111778270B (zh) 通过整合发光报告基因反映体外无细胞蛋白表达水平的方法
WO2015044456A1 (en) Improved biosensor-based detection system
KR20130142942A (ko) 리보스위치를 이용한 l-트립토판 고생산균 스크리닝 방법
CN114250243B (zh) 一种检测极端嗜盐生物中氨酰-tRNA合成酶和tRNA活性的系统及方法
JP2018509939A (ja) 微生物学的タンパク質分泌の検出および定量化のためのセンサ
Di Girolamo First characterization of a class F sortase and establishment of a microreactor-based assay for its directed evolution
CN118574927A (zh) 突变体及其应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination