CN113614233A

CN113614233A - 用于产生糖蛋白、鉴定糖基化途径的平台

Info

Publication number: CN113614233A
Application number: CN202080021391.9A
Authority: CN
Inventors: M·C·杰维特; W·K·奈特林格
Original assignee: Northwestern University
Current assignee: Northwestern University
Priority date: 2019-01-25
Filing date: 2020-01-27
Publication date: 2021-11-05
Also published as: EP3914716A2; US20220186276A1; EP3914716A4; CA3127668A1; JP2022518914A; WO2020167455A2; WO2020167455A3

Abstract

公开了用于体外和体内糖蛋白蛋白质合成的组分、系统和方法。特别地，所公开的组分、系统和方法涉及用于产生糖蛋白的模块化平台。本文公开的组分、系统和方法可用于在无细胞蛋白质合成(CFPS)和经修饰的细胞中合成糖蛋白和重组糖蛋白。

Description

用于产生糖蛋白、鉴定糖基化途径的平台

关于联邦资助的研究或开发的声明

本发明是在国防威胁减少局授予的HDTRA1-15-1-0052/P00001下在政府支持下完成的。政府对本发明享有一定的权利。

相关申请的交叉引用

本申请根据35 U.S.C.§119(e)要求2019年1月25日提交的美国临时申请号62/796,773的优先权，其内容通过引用整体并入本文。

发明背景

本发明总体上涉及用于糖蛋白蛋白质合成的组分、系统和方法。特别地，本发明涉及用于产生糖蛋白和鉴定糖基化途径的模块化平台。本文公开的组分、系统和方法可用于在无细胞蛋白质合成(CFPS)和经修饰的细胞中合成糖蛋白和重组糖蛋白。

糖基化调节蛋白质治疗剂和疫苗的药代动力学和效力。大多数糖蛋白合成的方法使用真核生物体(通常是哺乳动物细胞，例如中国仓鼠卵巢(CHO)细胞)内的天然途径。然而，这些方法导致聚糖异质性，限制了生物制造宿主的选择，并对已知严重影响蛋白质特性的糖基化结构提供有限的控制，尤其是对于蛋白质治疗剂。这些限制推动了工程化或合成的糖基化系统的开发，无论是通过真核生物(通常是酵母或CHO细胞)、细菌系统的细胞工程化还是体外的。其中，在细菌中或体外构建的合成的糖基化系统提供了最密切控制糖基化模式和更快速地开发更多样化糖基化模式的机会。细菌宿主的使用还可以实现更具成本效益的生物制造。

已经开发了几种细菌系统来产生蛋白质疫苗或糖基化治疗剂。然而，这些合成的糖基化系统的开发仍然缓慢，因为它需要在活细胞中构建和测试酶的集合(生物合成途径)。因此，细菌中产生的糖基化结构通常局限于可以通过表达自然界中发现的完整操纵子来合成的那些，这严重限制了可以构建的结构的多样性，从而限制了该技术可以用于的应用的多样性。

在此，发明人公开了一种与通过快速体外混合和表达进行糖基化途径组装(GlycoPRIME)的模块化无细胞平台相关的技术。使用该技术，发明人已经发现了几种新的生物合成途径，其可用于在体外或在活细胞中产生糖蛋白治疗剂、疫苗和分析标准品。

发明内容

公开了用于在体外和体内的糖蛋白蛋白质合成的组分、系统和方法。特别地，所公开的组分、系统和方法涉及用于产生糖蛋白的模块化平台。本文公开的组分、系统和方法可用于在无细胞蛋白质合成(CFPS)和经修饰的细胞中合成糖蛋白和重组糖蛋白。

所公开的组分、系统和方法通常包括或利用可溶性或任选不溶性(例如膜结合的)N-连接的糖基转移酶(N-糖基转移酶，或NGT)以将葡萄糖部分转移至存在于肽、多肽或蛋白质中的接受者肽序列。所公开的组分、系统和方法还可以包括或利用额外的可溶性或任选不溶性(例如膜结合的)糖基转移酶以修饰N-连接的葡萄糖部分并提供更复杂的N-连接的聚糖。

附图简述

图1.提供了通过快速体外混合和表达进行糖基化途径组装(GlycoPRIME)的平台的图。建立GlycoPRIME以构建和筛选产生多种N-连接的聚糖的生物合成途径。通过无细胞蛋白质合成(CFPS)将富含靶蛋白质或个体糖基转移酶(GT)的粗制大肠杆菌裂解物以各种组合方式混合，以鉴定用于各种N-连接的聚糖的构建的生物合成途径。模型受体蛋白(Im7-6)、来自胸膜肺炎放线杆菌(A.pleuropneumoniae)的N-连接的糖基转移酶(ApNGT)和24个精心设计的GT在CFPS中产生，然后在37条独特的糖基化途径中与活化的糖供体组装。在这37条途径中，我们鉴定了产生独特糖基化结构的23种生物合成GT组合，其中一些具有治疗相关性。体外发现的途径被转移至无细胞或基于细胞的生产平台，以产生治疗相关的糖蛋白。

图2：单酶和双酶糖基化途径的体外合成和组装。(a)蛋白质名称、种类、先前表征的活性和对于选择用于聚糖精心制作的Im7-6靶蛋白、ApNGT和GT的优化的可溶性CFPS产率。参考图8中先前表征的活性。CFPS产率指示来自n＝3个CFPS反应的平均值和标准偏差(s.d.)，其通过[14C]-亮氨酸掺入定量。完整CFPS表达数据在图6和图12和13中。(b)用于通过ApNGT在Im7-6上安装N-连接的葡萄糖和通过选择的GT进行精心制作的符号性关键和成功途径。本文中的聚糖结构使用用于聚糖的符号命名法(SNFG)和用于键联的OxfordSystem惯例。唾液酸是指N-乙酰神经氨酸。(c)从由有和没有0.4μM ApNGT以及2.5mM UDP-Glc的CFPS反应产物组装的IVG反应纯化来自Im7-6蛋白质的解卷积质谱光谱。在30℃下24小时后观察到完全转化为N-连接的葡萄糖。(d)从含有10μM Im7-6、0.4μM ApNGT和7.8μMNmLgtB、13.9μM NgLgtB、3.1μM BfGalNAcT或9.4μM Apα1-6的IVG反应纯化来自Im7蛋白质的完整解卷积MS光谱。视情况而定，IVG反应补充有2.5mM UDP-Glc以及2.5mM UDP-Gal或5mM UDP-GalNAc，在30℃下反应24小时。观察到的质量位移和MS/MS碎片化光谱(图14)与用β1-4Gal、β1-4Gal、β1-3GalNAc或α1-6葡聚糖聚合物对N-连接的葡萄糖的有效修饰一致。图7中发现理论蛋白质质量。Hpβ4GalT、Btβ4GalT1和SpWchJ+K不修饰通过ApNGT安装的N-连接的葡萄糖(图15)。所有光谱均从所有检测的糖基化和非糖基化Im7-6种类的完全洗脱峰区域获得，并且代表n＝3个独立的IVG。使用Bruker Compass数据分析最大熵方法将来自m/z100-2000的光谱解卷积为11,000-14,000Da。

图3：复杂糖基化途径的体外合成和组装。(a)蛋白质名称、种类、先前表征的特异性(图8)和对于针对N-连接的乳糖的精心制作测试的酶的优化的CFPS可溶性产率(图6)。CFPS产率指示来自n＝3个CFPS反应的平均值和s.d.，其通过[14C]-亮氨酸掺入定量。在氧化条件下测量CjCST-I和HsSIAT1产率(参见图20)。(b)从含有10μM Im7-6、0.4μM ApNGT、2μM NmLgtB和2.5mM合适的核苷酸活化糖供体以及4.0μM BtGGTA、5.3μM NmLgtC、4.9μMHpFutA、2.6μM HpFutC、4.9μM PdST6、5.0μM CjCST-II、1.3μM CjCST-I、11.5μM NgLgtA或2.2μM SpPvg1的IVG反应纯化来自Im7-6蛋白质的完整解卷积MS光谱。完整的Im7-6的质量位移、胰蛋白酶化的Im7-6糖肽的碎片化光谱(图18)和外切糖苷酶消化(图21和22)与根据BtGGTA、NmLgtC、HpFutA、HpFutC、PdST6、CjCST-II、CjCST-I、NgLgtA或SpPvg1的已知活性用α1-3Gal、α1-4Gal、α1-3Fuc、α2-6Sia、α2-3 Sia、α2-8 Sia、β1-3 GlcNAc或丙酮酸化修饰N-连接的乳糖一致。(d)通过四酶和五酶组合产生的岩藻糖基化和唾液酸化LacNAc结构的解卷积的完整Im7-6光谱。IVG反应包含10μM Im7-6、0.4μM ApNGT、2μM NmLgtB、适当的糖供体，并且指示分别对于四酶和五酶途径在b中所示浓度的一半或三分之一的GT。根据已知活性，完整质量位移和碎片化光谱(图23)与LacNAc核心的岩藻糖基化和唾液酸化一致。来自此处未显示的其他筛选的GT和GT组合的完整蛋白质和糖肽碎片化光谱在图17-19和23-25中。为了提供最大转化率，IVG反应在30℃下孵育24小时，补充了额外的2.5mM糖供体，并在30℃下孵育另外24小时。光谱从所有检测的糖基化和非糖基化Im7种类的完全洗脱区域获得，并且代表n＝2个IVG。使用Bruker Compass数据分析最大熵方法将来自m/z 100-2000的光谱解卷积为11,000-14,000Da。

图4：用于无细胞和细菌生产平台的生物合成途径的设计。(a)用于用αGal聚糖修饰的H1HA10蛋白疫苗的合成的一锅式CFPS-GpS。编码通过GlycoPRIME筛选发现的靶蛋白和生物合成途径GT的质粒与适当的活化的糖供体在CFPS-GpS反应中组合。(b)胰蛋白酶化的糖肽MS光谱，(c)糖肽的外切糖苷酶消化，以及(d)来自从包含等摩尔量的每种指定的编码H1HA10、ApNGT、NmLgtB和BtGGTA的质粒以及2.5mM的UDP-Glc和UDP-Gal的IVG反应纯化的H1HA10的MS/MS糖肽碎片化光谱(参见方法)。所有反应均含有10nM总质粒浓度，并在30℃下孵育24小时。糖肽包含位于H1HA10的N末端的一个工程化受体序列。在b-d光谱中观察到的质量和质量位移与通过ApNGT用N-连接的Glc、通过ApNGT和NmLgtB用乳糖(Glcβ1-4Gal)或通过ApNGT、NmLgtB和BtGGTA用αGal表位(Glcβ1-4Galα1-3Gal)修饰H1HA10肽一致。(e)设计细胞质糖基化系统以在大肠杆菌中产生唾液酸化IgG Fc。三个质粒包含NmNeuA(CMP-Sia合成)、用优化的受体序列(靶蛋白)工程化的IgG Fc，以及使用GlycoPRIME(GT操纵子)发现的生物合成途径。(f)解卷积的完整糖蛋白MS光谱，(g)完整糖蛋白的外切糖苷酶消化光谱，以及(h)来自从补充有唾液酸、IPTG和阿拉伯糖并在25℃孵育过夜的大肠杆菌培养物纯化的Fc-6的MS/MS糖肽碎片化光谱(见方法)。指出了所有糖基化途径中的最后一个GT。MS光谱是从所有检测的糖基化和非糖基化蛋白质或肽种类的完全洗脱区域获得的，并代表n＝3个CFPS-GpS或大肠杆菌培养物。通过伪多反应监测(MRM)碎片化以对应于使用30eV碰撞能量检测的完整糖肽或蛋白质MS峰的理论糖肽质量(红色菱形)获得MS/MS光谱。使用Compass数据分析最大熵方法将收集来自m/z 100-2000的光谱解卷积为27,000-29,000Da。对于理论质量参见图9-11。

图5.提供总结此研究1-6中使用的所有菌株和质粒的表格。列出了质粒主链特征，然后是蛋白质编码序列和任何修饰或融合序列的Uniprot或NCBI标识符。在此研究中开发的所有质粒的注释的蛋白质编码序列与侧翼质粒序列背景一起显示在图29中。

图6.提供显示与Im7靶标和糖基化酶的无细胞蛋白质合成的优化相关的概述的表格。通过GlycoPRIME测试的体外糖基化途径的Im7-6靶标和酶的CFPS产率。CFPS产率和误差指示来自通过14C-亮氨酸掺入定量的n＝3个CFPS反应的平均值和s.d.。所有CFPS反应在指定的温度和条件下孵育20小时。溶解度是从以12,000xg离心15分钟后分离的级分的产率的定量计算的。星号(*)指示在氧化条件下进行CFPS时的产率。优化条件下的产率也显示在图2和图3中。列出的平均值和s.d.值的源数据在源数据文件中提供(可在Kightlinger等人,Nature Communications,2019中获得，其通过引用整体并入本文)。

图7.提供对于在GlycoPRIME生物合成途径工程化期间产生的Im7-6糖型的理论糖蛋白和糖肽质量的表格。预测的糖基化结构基于先前建立的GT活性，其显示于图2和3和图8中。显示了预期糖蛋白产物的理论、中性和平均质量，以及糖肽的理论、三电荷、单同位素的质荷比(m/z)。糖肽质量对应于Im7-6中唯一的ApNGT糖基化位点，其包含在胰蛋白酶肽EATTGGNWTTAGGDVLDVLLEHFVK中。实验观察到的质量在解卷积的完整蛋白质MS和糖肽MS/MS光谱中进行了注释。

图8.提供显示本研究7-23中使用的糖基转移酶的先前表征的活性的表格。下面列出的GT被选择用于在GlycoPRIME系统中基于它们之前建立的活性进行测试。许多以前也被用于糖脂或游离寡糖的生物合成，为它们在本研究中精心制作通过ApNGT安装的N-连接的葡萄糖的新背景下进行测试奠定了基础。

图9.提供显示在糖肽MS/MS光谱中检测到的糖碎片离子的理论质量的表格。在糖肽的MS/MS碎片化过程中，检测到诊断的糖离子。这些糖离子的理论质荷比示于表中。理论m/z的所有计算均假设单电荷离子。本文中所有提及的唾液酸(Sia)均指N-乙酰神经氨酸(NeuAc)。

图10.提供显示体外合成和糖基化的H1AH10的理论糖肽质量的表格。通过一锅式体外反应合成和糖基化的H1AH10中的含有N末端工程化糖基化位点的胰蛋白酶肽的理论、双电荷、单同位素的质荷比(m/z)。预测的糖基化结构基于先前建立的GT活性，其显示于图2和3和图8中。实验观察到的质量在图4和25中的解卷积MS和MS/MS光谱上进行了注释。

图11.提供显示在大肠杆菌细胞质中合成和糖基化的Fc-6的理论糖蛋白和糖肽质量的表格。预测的糖基化结构基于先前建立的GT活性，其显示于图2和3和图8中。表中显示了预期糖蛋白产物的理论、中性、平均质量和糖肽的理论、三电荷、单同位素的质荷比(m/z)。糖肽质量对应于Fc-6中唯一的ApNGT糖基化位点，其包含在胰蛋白酶肽EEATTGGNWTTAGGR中。实验观察到的质量在图4和26中的解卷积MS和MS/MS光谱上进行了注释。

图12.考马斯染色的蛋白质凝胶显示GlycoPRIME靶标和酶的CFPS表达。在Im7-6靶标和指示的GlycoPRIME酶的体外合成后，基于CFPS反应的大肠杆菌粗制裂解物的可溶性级分的考马斯染色的蛋白质凝胶。高度富集的蛋白质根据接近预期分子量的增加的条带厚度(箭头)是明显的，其他产物可以在图13中看到。来自CFPS反应的产物在通过(*)指示的氧化条件下运行。通过在4℃下以12,000xg离心15分钟来分离可溶性样品。代表n＝2个凝胶。将相同的凝胶曝光为放射自显影图以确定含有[14C]-亮氨酸蛋白的条带(图13)。

图13.蛋白质凝胶的放射自显影图，显示CFPS中GlycoPRIME靶标和酶的CFPS表达。在Im7-6靶标和指示的GlycoPRIME酶的体外合成后，基于含有[14C]-亮氨酸的CFPS反应的大肠杆菌粗制裂解物的可溶级分的蛋白质凝胶的放射自显影图。接近预期分子量的含有[14C]-亮氨酸的条带的存在指示没有大截断的蛋白质的全长表达(箭头指示预期的全长产物)。来自CFPS反应的产物在通过(*)指示的氧化条件下运行。通过在4℃下以12,000xg离心15分钟来分离可溶性样品。通过将在MOPS中运行的4-12％SDS-PAGE凝胶曝光于磷屏(phosphoscreen)72小时来生成放射自显影图。放射自显影图代表n＝2个凝胶和曝光。相同的凝胶被考马斯染色(补充图1)并与放射自显影图像对齐作为分子量标准参考。

图14.来自精心制作N-连接的葡萄糖的两种酶生物合成途径的GlycoPRIME反应产物的糖肽MS/MS光谱。来自含有图2所示的修饰Im7-6的两种酶途径的IVG反应的产物经过纯化、胰蛋白酶消化，并通过在对应于检测的蛋白质MS峰的理论糖肽质量(红色菱形)处的伪多反应监测(MRM)MS/MS碎片化使用30eV的碰撞能量进行分析(参见方法)。光谱代表来自n＝1个IVG反应的许多MS/MS采集。源自预期糖基化结构的理论蛋白质、肽和糖离子质量示于图7和9。所有指示的糖离子都是带单电荷的，并且糖肽碎片化产物是带三个电荷的离子，与使用指示的糖结构的Im7-6胰蛋白酶肽EATTGGNWTTAGGDVLDVLLEHFVK的修饰一致。(a)999.49±2m/z的MS/MS光谱对应于通过BfGalNAcT安装的N连接的Glcβ1-3GalNAc。(b)1418.29±2m/z的MS/MS光谱对应于通过Apα1-6安装的N-连接的葡聚糖聚合物。(c)985.81±2m/z的MS/MS光谱对应于通过NmLgtB安装的N-连接的乳糖。所有IVG反应都含有Im7-6、ApNGT和根据建立的酶活性的合适的糖供体(图8)。

图15.显示没有通过ApNGT安装的N-连接的葡萄糖的修饰的IVG反应产物的解卷积完整蛋白质MS光谱。含有10μM Im7-6、0.4μM ApNGT、2.5mM适当糖供体和一个精心制作性GT的IVG反应的产物通过完整蛋白质MS进行纯化和分析(参见方法)。(a)含有1.3μM Hpβ4GalT的IVG的解卷积完整蛋白质MS光谱。(b)含有1.4μM Btβ4GalT1并补充有10μMα-乳清蛋白并在氧化条件下进行的IVG的解卷积完整蛋白质MS光谱(参见方法)。(c)包含1.5μM SpWchJ和1.0μM SpWchK的IVG的解卷积完整蛋白质MS光谱。没有检测到指示Im7-6被通过ApNGT安装的N-连接的葡萄糖修饰的峰(理论质量值如图7所示)。使用Bruker Compass数据分析最大熵方法将来自m/z 100-2000的光谱解卷积为11,000-14,000Da。此处显示的解卷积光谱代表n＝2个IVG反应。

图16.LgtB同源物和浓度的优化。含有10μM Im7-6、0.4μM ApNGT、2.5mM适当糖供体和指定浓度的NmLgtB或NgLgtB的IVG反应的产物通过完整蛋白质MS进行纯化和分析(参见方法)。(a)来自含有指定浓度的NmLgtB的IVG反应的解卷积完整蛋白质MS光谱。(b)来自含有指定浓度的NgLgtB的IVG反应的解卷积完整蛋白质MS光谱。代表在30℃下进行24小时的n＝2个IVG反应的结果表明，在CFPS中产生的NmLgtB具有更高的比活性，并且可以用2μMNmLgtB获得几乎均质的N-连接的乳糖。理论质量值如图7所示。所有光谱从所有检测到的糖基化和非糖基化Im7-6种类的完全洗脱峰区域获得，并使用Bruker Bruker Compass数据分析最大熵方法从m/z100-2000解卷积为11,000-14,000Da。

图17.唾液酸转移酶同源物的优化。代表含有0.4μM ApNGT、2μM NmLgtB、图3所示的每种唾液酸转移酶和各2.5mM的UDP-Glc、UDP-Gal和CMP-Sia的n＝2个IVG反应的解卷积完整蛋白质MS光谱。将通过CFPS富含唾液酸转移酶的裂解物以等体积添加到每个IVG反应，以使得每个32μl-IVG反应包含总共25μl的CFPS裂解物。基于图6中所示的CFPS产率，这些反应包含12.9μM PpST3；9.8μM VsST3；1.8μM PmST3,6；1.3μM CjCST-I；5.6μM PlST6；0.7μMHsSIAT1；和4.9μM PdST6。CjCST-I和HsSIAT1在氧化条件下在CFPS中合成，因为发现它们在以这种方式产生时更具活性(图20)。在上述条件下，含有PdST6的反应提供最有效的向6’-唾液酸乳糖的转化，而含有CjCST-I的反应提供最有效的向3’-唾液酸乳糖的转化(为了确认键联的外切糖苷酶消化显示在图21中)。尽管PpST6和VsST3中仅出现痕量，但MS/MS检测和鉴定表明这些酶是有功能的(图18)。所有光谱均从所有检测的糖基化和非糖基化Im7-6种类的完全洗脱峰区域获得，并使用Bruker Compass数据分析最大熵方法从m/z 100-2000解卷积为11,000-14,000Da。

图18.来自精心制作N-连接的乳糖的三种酶生物合成途径的GlycoPRIME反应产物的糖肽MS/MS光谱。来自含有图3所示的修饰Im7-6的三种酶途径的IVG反应的产物经过纯化、胰蛋白酶消化，并通过在对应于图3和图17中检测的蛋白质MS峰的理论糖肽质量(由红色菱形指示)处的伪MRM MS/MS碎片化进行分析(参见方法)。使用30eV的碰撞能量将所有糖肽碎片化，其中使用从靶m/z值的±2m/z的窗口(参见方法)。光谱代表了来自n＝1个IVG反应的许多MS/MS采集。源自预期糖基化结构的理论蛋白质、肽和糖离子质量示于图7和9。所有指示的糖离子都是带单电荷的，并且糖肽碎片化产物是带三个电荷的离子，与使用指示的糖结构的Im7-6胰蛋白酶肽EATTGGNWTTAGGDVLDVLLEHFVK的修饰一致。预测的糖键联基于先前建立的GT活性(图8)和外切糖苷酶测序(图21和22)。所有IVG反应都包含根据已建立的GT活性的合适的糖供体、Im7-6、ApNGT、NmLgtB和指示的GT。

图19.HdGlcNAcT不修饰通过ApNGT和NmLgtB安装的N-连接的乳糖底物。包含10μMIm7-6、0.4μM ApNGT、2μM NmLgtB、1.5μM HdGlcNAcT和2.5mM UDP-Glc、UDP-Gal和UDP-GlcNAc的IVG反应产物的解卷积完整蛋白质MS光谱。没有检测到指示Im7-6被通过ApNGT和NmLgtB安装的N-连接的乳糖修饰的峰(理论质量值参见图7)。解卷积光谱代表n＝2个IVG反应。

图20.CjCST-I和HsSIAT1当在氧化条件下产生时表现出更大的活性。解卷积完整蛋白质MS光谱代表n＝2个IVG反应产物，其包含10μM Im7-6、0.4μM ApNGT、2μM NmLgtB、2.5mM UDP-Glc、UDP-Gal和CMP-Sia以及在氧化条件、补充了大肠杆菌二硫键异构酶(DsbC)的还原条件或标准还原条件下进行的CFPS中制备的CjCST-I或HsSIAT1(参见方法)。已知CFPS条件产生有助于二硫键形成的蛋白质合成环境，如前所述24。以等体积加入通过CFPS富含唾液酸转移酶的裂解物。因此，还原反应条件包含1.9μM的CjCST-I或3.8μM的HsSIAT1，而氧化反应条件反应包含1.3μM的CjCST-I和0.7μM的HsSIAT1(详细的CFPS产率信息如图15所示)。除了对于CjCST-I和HsSIAT1的CFPS合成条件外，IVG反应在不确保用于糖基化的氧化环境的情况下相同地进行。Im7-6、ApNGT和NmLgtB是用标准CFPS反应条件产生的。相对糖基化效率指示CFPS的氧化CFPS环境允许每单位CFPS反应体积和每μM酶的更高的酶活性。这一观察结果对于HsSIAT1是有意义的，HsSIAT1通常在人高尔基体的氧化环境中具有活性，并且已知含有二硫键。有趣的是，氧化合成环境似乎也有利于不含二硫键的CjCST-I的活性。然而，CjCST-I的增加的活性不能通过DsbC的一般分子伴侣活性来解释。

图21.通过含有唾液酸的GlycoPRIME生物合成途径修饰的Im7-6的外切糖苷酶测序。从GlycoPRIME工作流程完成IVG反应，其中使用Ni-NTA磁珠进行纯化，在有和没有指定的市售外切糖苷酶的情况下在37℃下孵育至少4小时，胰蛋白酶化过夜，然后通过糖肽LC-MS进行分析。α2-3神经氨酸酶S能够去除通过CjCST-I；PmST3,6安装的唾液酸；以及通过CjCST-II安装的第一个唾液酸，表明这些酶安装了具有α2-3键联的唾液酸。通过PdST6、HsSIAT1安装的唾液酸以及通过CjCST-II安装的第二个和第三个唾液酸对通过α2-3神经氨酸酶S的消化具有抗性，但容易被α2-3,6,8神经氨酸酶裂解，这与PdST6和HsSIAT1的建立的α2-6活性以及在随后的唾液酸添加中通过CjCST-II安装的α2,8键联是一致的。对于外切糖苷酶的详细信息，参见方法部分。所有光谱均从含有ApNGT糖基化受体序列的Im7-6胰蛋白酶肽EATTGGNWTTAGGDVLDVLLEHFVK的所有检测的糖基化和非糖基化种类的完全洗脱峰区域获得。所有指定的糖肽产物都是带三个电荷的离子，与用指定的糖结构修饰的此Im7-6胰蛋白酶肽一致。

图22.通过不含唾液酸的GlycoPRIME生物合成途径修饰的Im7-6外切糖苷酶测序。从GlycoPRIME工作流程完成IVG反应，其中使用Ni-NTA磁珠进行纯化，在有和没有指定的市售外切糖苷酶的情况下在37℃下孵育至少4小时，胰蛋白酶化过夜，然后通过糖肽LC-MS进行分析。通过NmLgtB、BtGGTA、HpFutA和HpFutC安装的糖分别容易被市售的β1-4半乳糖苷酶S；α1-3,6半乳糖苷酶；α1-3,4岩藻糖苷酶；和α1-2岩藻糖苷酶裂解。通过NmLgtC安装的半乳糖对通过β1-4半乳糖苷酶S和α1-3,6半乳糖苷酶的裂解具有抗性，但容易被α1-3,4,6半乳糖苷酶裂解。通过NmLgtB和NgLgtA的交替活动安装的LacNAc聚合物容易被β1-4半乳糖苷酶S和β-N-乙酰葡糖胺苷酶S的混合物裂解。所有光谱均从含有ApNGT糖基化受体序列的Im7-6胰蛋白酶肽EATTGGNWTTAGGDVLDVLLEHFVK的所有检测的糖基化和非糖基化种类的完全洗脱峰区域获得。所有指定的糖肽产物都是带三个电荷的离子，与用指定的糖结构修饰的此Im7-6胰蛋白酶肽一致。裂解观察结果与先前建立的GT活性(图2-3和8)一致。对于外切糖苷酶的详细信息，参见方法部分。

图23.来自精心制作N-连接的乳糖的四种和五种酶生物合成途径的GlycoPRIME反应产物的糖肽MS/MS光谱。来自包含图3d和图25所示的修饰Im7-6的四种和五种酶途径的IVG反应的产物经过纯化、胰蛋白酶化并通过在对应于图3d和图25中检测的蛋白质MS峰的理论糖肽质量(由红色菱形指示)处的伪MRM MS/MS碎片化进行分析(参见方法)。使用30eV的碰撞能量将所有糖肽碎片化，其中使用从靶m/z值的±2m/z的窗口(参见方法)。光谱代表了来自n＝1个IVG反应的许多MS/MS采集。源自预期糖基化结构的理论蛋白质、肽和糖离子质量示于图7和9。所有指示的糖离子都是带单电荷的，并且糖肽碎片化产物是带三个电荷的离子，与使用指示的糖结构的Im7-6胰蛋白酶肽EATTGGNWTTAGGDVLDVLLEHFVK的修饰一致。预测的糖键联基于先前建立的GT活性(图8)。尽管无法明确定义来自五种酶生物合成途径的产物，但糖和糖肽片段确实暗示了岩藻糖和唾液酸的修饰。所有IVG反应都包含根据已建立的GT活性的合适的糖供体、Im7-6、ApNGT、NmLgtB和指示的酶。

图24.IVG反应产物的解卷积完整蛋白质MS光谱，显示未产生岩藻糖基化和唾液酸化的种类。含有10μM Im7-6、0.4μM ApNGT、2μM NmLgtB、指示的酶和2.5mM的适当糖供体(UDP-Glc、UDP-Gal、CMP-Sia和GDP-Fuc)的IVG反应的产物经过纯化并通过完整蛋白质MS进行分析。如所示的，反应包含2.4μM HpFutA和2.4μM PdST6或1.3μM HpFutC和0.65μMCjCST-I。解卷积光谱代表n＝2个IVG。没有检测到指示用唾液酸和岩藻糖修饰的Im7-6的存在的峰(通过箭头注释的光谱区域[在12000和12200之间]显示了唾液酸化和岩藻糖基化种类的预期范围)(对于理论质量值参见图8)。

图25.含有五种酶的生物合成途径GlycoPRIME筛选。含有10μM Im7-6、0.4μMApNGT、2μM NmLgtB、指示的GT和2.5mM的适当糖供体(UDP-Glc、UDP-Gal、CMP-Sia和GDP-Fuc)的IVG反应的产物经过纯化并通过完整蛋白质MS进行分析。解卷积光谱代表n＝2个IVG。(a)含有0.87μM HpFutC、3.83μM NgLgtA和1.63μM PdST6的IVG反应的解卷积完整蛋白质MS。(b)含有1.63μM HpFutA、3.83μM NgLgtA和1.63μM PdST6的IVG反应的解卷积完整蛋白质MS(也显示在图3d中)(c)含有1.63μM HpFutA、3.83μM NgLgtA和0.43μM CjCST-I的IVG反应的解卷积完整蛋白质MS。(d)包含0.87μM HpFutC、3.83μM NgLgtA和0.43μM CjCST-I的IVG反应的解卷积完整蛋白质MS。a和b中的光谱以及图23中的碎片化光谱分别指示含有唾液酸和岩藻糖的3种和1种种类。预测的糖基化结构基于先前建立的GT活性(图8)和碎片化光谱(图23)。尽管无法明确鉴定结构，但之前观察到的HpFutA和PdST6的不兼容，以及碎片化光谱中1083m/z峰(Glcβ4Galα6Sia)的存在和1034m/z(Glc(α3Fuc)β4Gal)峰的不存在表明在b中，近端半乳糖被唾液酸修饰，而GlcNAc被岩藻糖修饰。在c或d中没有检测到指示用唾液酸和岩藻糖修饰的Im7-6的存在的峰(对于理论质量值参见图7)。

图26.通过CFPS-GpS反应合成和糖基化的Im7-6的完整蛋白质MS光谱。(a)编码基于通过两锅示GlycoPRIME筛选开发的12条成功生物合成途径的Im7-6靶蛋白和多至3种GT的集合的质粒与合适的糖供体在一锅式CFPS-GpS反应中组合并在30℃孵育24小时。(b)来自在有和没有ApNGT质粒的CFPS-GpS反应中合成和糖基化的Im7-6的解卷积完整蛋白质光谱。(c)来自在具有ApNGT质粒和指示的GT质粒的CFPS-GpS反应中合成和糖基化的Im7-6的解卷积完整蛋白质光谱。(d)来自在具有ApNGT、NmLgtB和指示的GT质粒的CFPS-GpS反应中合成和糖基化的Im7-6的解卷积完整蛋白质光谱。所有反应都含有等摩尔量的每种质粒和10nM的总质粒浓度。在完整蛋白质分析之前，使用Ni-NTA磁珠纯化所有Im7-6蛋白质(参见方法)。所有反应都显示出完整的蛋白质质量位移，这与在我们的两锅式系统中观察到的使用相同聚糖对Im7-6的修饰一致(图2-3)，尽管效率较低。MS光谱是从所有检测的糖基化和非糖基化蛋白质或肽种类的完全洗脱区域获得的，并代表n＝2个CFPS-GpS反应。使用Bruker Compass数据分析最大熵方法将收集来自m/z 100-2000的光谱解卷积到11,000-14,000Da。对于理论质量值参见图16。

图27.在大肠杆菌细胞质中产生唾液酸化的Im7-6。(a)设计细胞质糖基化系统以在大肠杆菌中产生唾液酸化糖蛋白。三种质粒包含NmNeuA(CMP-Sia合成)、含有ApNGT糖基化受体序列的靶蛋白和使用GlycoPRIME(GT操纵子)发现的生物合成途径。(b-f)来自从含有CMP-Sia合成质粒和Im7-6靶蛋白质粒以及无GT操纵子b；含有ApNGT的GT操纵子c；含有ApNGT和LgtB的GT操纵子d；含有ApNGT、NmLgtB和CjCST-I的GT操纵子e；或含有ApNGT、NmLgtB和PdST6 f的GT操纵子的CLM24ΔnanA大肠杆菌菌株纯化的Im7-6的解卷积完整蛋白质光谱。指示了所有糖基化途径中的最后一个GT。完整蛋白质光谱中的质量位移与每个GT的已建立的活性以及分别在b、c、d、e和f中的N-连接的Glc、乳糖、3’-唾液酸乳糖和6’-唾液酸乳糖在Im7-6上的安装一致。所有大肠杆菌培养物都补充有5mM唾液酸，并在37℃下生长至OD600＝0.6，用1mM IPTG和0.2％阿拉伯糖诱导，然后在25℃下孵育过夜。MS光谱从所有检测的糖基化和非糖基化蛋白质种类的完全洗脱区域获得，并使用Bruker Compass数据分析最大熵方法从m/z 100-2000解卷积为11,000-14,000Da。对于理论质量参见图7。光谱代表n＝2个细菌培养物。

图28.大肠杆菌细胞质中糖基化Fc的外切糖苷酶测序。(a)来自从含有CMP-Sia合成质粒、Fc-6靶蛋白质粒和含有ApNGT、NmLgtB和PdST6的GT操纵子质粒的CLM24ΔnanA大肠杆菌菌株纯化的Fc-6的解卷积完整蛋白质光谱。(b-d)将来自a的纯化的Fc-6与市售的α2-3神经氨酸酶S b、α2-3,6,8神经氨酸酶c或β1-4半乳糖苷酶S和α2-3,6,8神经氨酸酶d在37℃下孵育至少4小时。末端唾液酸对α2-3神经氨酸酶S的抗性和对α2-3,6,8神经氨酸酶的敏感性表明存在α2-6键联，这与PdST6的先前建立的活性一致(图8)。(e)来自从含有CMP-Sia合成质粒、Fc-6靶蛋白质粒和含有ApNGT、NmLgtB和CjCST-I的GT操纵子质粒的CLM24ΔnanA大肠杆菌菌株纯化的Fc-6的解卷积完整蛋白质光谱。(f-g)将来自e的纯化的Fc-6与市售的α2-3神经氨酸酶S b或β1-4半乳糖苷酶S和α2-3神经氨酸酶S在37℃下孵育至少4小时。末端唾液酸对α2-3神经氨酸酶的敏感性证实了CjCST-I的先前建立的活性(图8)。在d和g中去除中间的半乳糖并添加β1-4半乳糖苷酶S证实了NmLgtB的先前建立的活性(图8)。a-c和e-f也显示在图4中。对于外切糖苷酶的细节参见方法并且对于理论糖蛋白质量参见图11。所有大肠杆菌培养物均补充有5mM唾液酸，并在37℃下生长至OD600＝0.6，然后用1mM IPTG和0.2％阿拉伯糖诱导，然后在25℃下孵育过夜。MS光谱从所有检测的糖基化和非糖基化蛋白质种类的完全洗脱区域获得，并使用Bruker Compass数据分析最大熵方法从m/z 100-2000解卷积为27,000-29,000Da。

图29.显示了编码工程化的糖基化靶标、体外表达的糖基转移酶、体内糖基转移酶操纵子和体内CMP-Sia产生质粒的DNA序列。关键词：翻译区域；工程化的糖基化受体序列；与糖基化受体序列相邻的侧翼区域；启动子；终止子；亲和标签或CSL前导序列。

图30是显示在活大肠杆菌中使用非标准糖进行糖基化的示意图。

图31.解卷积的糖蛋白MS结果，显示模型蛋白Im7(ATTCCNWTTAGG接枝到暴露的环中)用具有α2,3和α2,6键联的叠氮基唾液酸成功修饰。

图32.解卷积糖蛋白MS结果，显示模型蛋白人Fc(用ATTGGNWTTAGG替换Fc上的天然QYNSTY糖基化位点)用具有α2,3和α2,6键联的叠氮基唾液酸成功修饰。

图33.提供了显示示例性治疗化合物的定点glycoPEGylation和用于致耐受反应的示例性“点击”型siglec-结合配体的示意图。

发明详述

介绍

糖基化赋予蛋白质治疗剂有益的特性，包括增加的血清半衰期和引发保护性免疫反应的能力。基因编辑、工程化微生物菌株和体外合成系统的发展为糖蛋白疗法提供了新的机会。然而，构建生物合成途径来改造蛋白质糖基化仍然是一个关键的瓶颈。在这里，发明人开发并采用了模块化无细胞平台用于通过快速体外混合和表达进行糖基化途径组装(GlycoPRIME)。在GlycoPRIME中，粗制大肠杆菌裂解物通过无细胞蛋白质合成富含糖基转移酶，然后组装糖基化途径以精心制作由可溶性、N连接的糖基转移酶安装的单个葡萄糖引发手柄。发明人使用GlycoPRIME构建了37条推定的蛋白质糖基化途径，创建了23个独特的聚糖基序。许多这些途径以前没有被描述过，并产生了用于蛋白质治疗剂和疫苗的感兴趣的糖基化结构。然后，发明人使用选择的生物合成途径以在活大肠杆菌中产生具有最少唾液酸聚糖的人抗体的恒定区的糖蛋白和在按需无细胞表达平台中产生具有辅助性聚糖的蛋白质疫苗候选物。GlycoPRIME和此处描述的途径可以加速具有确定特性的糖蛋白的工程化以及替代宿主中糖蛋白的制造。

定义和术语

所公开的用于糖蛋白和重组糖蛋白蛋白质合成的组分、系统和方法可以使用如下定义和术语进一步描述。本文中使用的定义和术语仅用于描述特定实施方案的目的，并不旨在进行限制。

如在本说明书和权利要求中使用的，单数形式“一个”、“一种”和“该”包括复数形式，除非上下文另有明确规定。例如，术语“一个/种寡糖”或“一个/种糖基转移酶”应分别解释为是指“一个或多个/一种或多种寡糖”和“一个或多个/一种或多种糖基转移酶”，除非上下文另有明确规定。如本文所用，术语“多个/多种”是指“两个或更多个/两种或更多种”。

如本文所用，“约”、“大约”、“基本上”和“显著”将被本领域普通技术人员理解并且将在它们使用的上下文中在一定程度上变化。如果考虑到使用它的上下文，该术语的使用对于本领域的普通技术人员来说是不清楚的，则“约”和“大约”将意味着特定术语的多至正负10％和“基本上”和“显著”将意味着超过特定术语的正负10％。

如本文所用，术语“包括”和“包括的”与术语“包含”和“包含的”具有相同的含义。术语“包括”和“包含”应被解释为“开放”过渡性术语，其允许进一步包括在权利要求中记载的那些组分之外的附加组分。术语“组成”和“由……组成”应被解释为“封闭式”过渡性术语，其不允许包括除权利要求中记载的组分之外的附加组分。术语“基本上由……组成”应被解释为部分封闭，其仅允许包含不会根本上改变要求保护的主题的性质的附加组分。

短语“诸如”应被解释为“例如，包括”。此外，任何和所有示例性语言的使用，包括但不限于“诸如”，仅意在更好地阐明本发明而不对本发明的范围构成限制，除非另有声明。

此外，在其中使用类似于“A、B和C等中的至少一个”的约定的那些情况下，一般而言，这样的造句意在具有本领域普通技术人员将理解该约定的意义(例如，“具有A、B和C中的至少一个的系统”将包括但不限于具有单独的A、单独的B、单独的C、A和B一起、A和C一起、B和C一起和/或A、B和C一起的系统)。本领域技术人员将进一步理解，呈现两个或更多个替代术语的实际上任何分离词和/或短语(无论是在说明书还是附图中)都应该被理解为考虑包括术语中的一个、术语中的任一个或术语中的两者的可能性。例如，短语“A或B”将被理解为包括“A”或“B”或“A和B”的可能性。

诸如“多至”、“至少”、“大于”、“小于”等的所有语言包括所列举的数字并且指的是随后可以被分解为范围和子范围的范围。范围包括每个个体成员。因此，例如，具有1-3个成员的组是指具有1、2或3个成员的组。类似地，具有6个成员的组是指具有1、2、3、4或6个成员的组，以此类推。

情态动词“可以”是指在几个所描述的实施方案或包含在其中的特征中的一个或多个选项或选择的优选使用或选择。当没有公开关于特定实施方案或其中包含的特征的选项或选择时，情态动词“可以”是指关于如何制作或使用所描述的实施方案或包含在其中的特征的方面的肯定行为，或使用关于所描述的实施方案或包含在其中的特征的特定技能的最终决定。在后一种情况下，情态动词“可以”与助动词“可能”具有相同的含义和内涵。

多核苷酸和合成方法

如本文所用，术语“核酸”和“寡核苷酸”是指聚脱氧核糖核苷酸(含有2-脱氧-D-核糖)、聚核糖核苷酸(含有D-核糖)，以及作为嘌呤或嘧啶碱基的N糖苷的任何其他类型的多核苷酸。术语“核酸”、“寡核苷酸”和“多核苷酸”之间在长度上没有意图的区别，并且这些术语将互换使用。这些术语仅指分子的一级结构。因此，这些术语包括双链和单链DNA，以及双链和单链RNA。为了在本方法中使用，寡核苷酸还可以包括其中碱基、糖或磷酸主链被修饰的核苷酸类似物以及非嘌呤或非嘧啶核苷酸类似物。

寡核苷酸可以通过任何合适的方法制备，包括通过诸如Narang等人,1979,Meth.Enzymol.68:90-99的磷酸三酯方法；Brown等人,1979,Meth.Enzymol.68:109-151的磷酸二酯方法；Beaucage等人,1981,Tetrahedron Letters 22:1859-1862的二乙基亚磷酰胺方法；和美国专利号4,458,066的固体支持方法(每个都通过引用并入本文)的方法直接化学合成。Goodchild,1990,Bioconjugate Chemistry 1(3):165-187中提供了寡核苷酸和修饰的核苷酸的缀合物的合成方法的综述，该文献通过引用并入本文。

术语“扩增反应”是指任何化学反应，包括酶促反应，其导致模板核酸序列的增加的拷贝或导致模板核酸的转录。扩增反应包括逆转录、聚合酶链反应(PCR)，包括实时PCR(参见美国专利号4,683,195和4,683,202；PCR Protocols:A Guide to Methods andApplications(Innis等人,eds,1990))，和连接酶链反应(LCR)(参见Barany等人，美国专利号5,494,810)。示例性的“扩增反应条件”或“扩增条件”通常包括两步或三步循环。两步循环具有高温变性步骤，然后是杂交/延伸(或连接)步骤。三步循环包括变性步骤，接着是杂交步骤，接着是单独的延伸步骤。

如本文所用，术语“靶标”、“靶序列”、“靶区域”和“靶核酸”是同义词，并且是指待扩增、测序或检测的核酸的区域或序列。

如本文所用，术语“杂交”是指由于互补碱基配对由两条单链核酸形成双链体结构。杂交可发生在完全互补的核酸链之间或包含少量错配区域的“基本互补”核酸链之间。其中完全互补的核酸链的杂交是强烈优先的条件称为“严格杂交条件”或“序列特异性杂交条件”。在不太严格的杂交条件下可以获得基本互补序列的稳定双链体；可以通过适当调整杂交条件来控制容许的错配程度。核酸技术领域的技术人员可以根据经验确定双链体稳定性，其中考虑许多变量，包括例如寡核苷酸的长度和碱基对组成、离子强度和错配碱基对的发生率，遵循本领域提供的指导(参见，例如，Sambrook等人,1989,Molecular Cloning–ALaboratory Manual,Cold Spring Harbor Laboratory,Cold Spring Harbor,New York；Wetmur,1991,Critical Review in Biochem.and Mol.Biol.26(3/4):227-259；和Owczarzy等人,2008,Biochemistry,47:5336-5353，其通过引用并入本文)。

如本文所用，术语“引物”是指在合适的条件下能够充当DNA合成起始点的寡核苷酸。此类条件包括其中在四种不同的三磷酸核苷和用于延伸的试剂(例如，DNA聚合酶或逆转录酶)的存在下在适当的缓冲液中并且在合适的温度下诱导与核酸链互补的引物延伸产物的合成的那些条件。

引物优选地是单链DNA。引物的合适长度取决于引物的预期用途，但通常范围为约6至约225个核苷酸，包括中间范围，例如15至35个核苷酸、18至75个核苷酸和25至150个核苷酸。短引物分子通常需要较低的温度以与模板形成足够稳定的杂交复合物。引物不需要反映模板核酸的确切序列，但必须充分互补以与模板杂交。用于扩增给定靶序列的合适引物的设计是本领域众所周知的并且描述于本文引用的文献中。

引物可以包括允许检测或固定引物但不改变引物的基本特性(即作为DNA合成起始点)的附加特征。例如，引物可以在5’端包含额外的核酸序列，该序列不与靶核酸杂交，但其有助于扩增产物的克隆或检测，或其使得能够转录RNA(例如，通过包含启动子)或翻译蛋白质(例如，通过包含5’-UTR，例如内部核糖体进入位点(IRES)或3’-UTR元件，例如聚(A)n序列，其中n在约20至约200的范围内)。与模板充分互补以杂交的引物区域在本文中称为杂交区域。

如本文所用，如果在足够严格的条件下用于扩增反应中时，引物主要与靶核酸杂交，则引物对于靶序列是“特异性的”。通常，如果引物-靶标双链体稳定性大于引物与样品中发现的任何其他序列之间形成的双链体的稳定性，则引物对靶序列具有特异性。本领域技术人员将认识到各种因素(例如盐条件以及引物的碱基组成和错配的位置)将影响引物的特异性，并且引物特异性的常规实验确认将在很多情况下是需要的。可以选择杂交条件，在该条件下引物可以仅与靶序列形成稳定的双链体。因此，在适当严格的扩增条件下使用靶特异性引物能够选择性扩增含有靶引物结合位点的那些靶序列。

如本文所用，“聚合酶”是指催化核苷酸的聚合的酶。“DNA聚合酶”催化脱氧核糖核苷酸的聚合。已知的DNA聚合酶包括例如激烈火球菌(Pyrococcus furiosus)(Pfu)DNA聚合酶、大肠杆菌DNA聚合酶I、T7 DNA聚合酶和水生栖热菌(Thermus aquaticus)(Taq)DNA聚合酶等。“RNA聚合酶”催化核糖核苷酸的聚合。DNA聚合酶的上述实例也称为DNA依赖性DNA聚合酶。RNA依赖性DNA聚合酶也属于DNA聚合酶的范围。逆转录酶，包括由逆转录病毒编码的病毒聚合酶，是RNA依赖性DNA聚合酶的一个实例。RNA聚合酶(“RNAP”)的已知实例包括例如T3 RNA聚合酶、T7 RNA聚合酶、SP6 RNA聚合酶和大肠杆菌RNA聚合酶等。RNA聚合酶的上述实例也称为DNA依赖性RNA聚合酶。任何上述酶的聚合酶活性可以通过本领域公知的方法测定。

术语“启动子”是指顺式作用DNA序列，其指导RNA聚合酶和其他反式作用转录因子从包含顺式作用DNA序列的DNA模板起始RNA转录。

如本文所用，术语“序列确定的生物聚合物”是指具有特定一级序列的生物聚合物。在基因编码具有特定一级序列的生物聚合物的情况下，序列确定的生物聚合物可以等同于基因编码的确定的生物聚合物。

本文考虑的多核苷酸序列可以存在于表达载体中。例如，载体可以包含：(a)编码蛋白质的ORF的多核苷酸；(b)表达RNA的多核苷酸，该RNA指导靶DNA序列的RNA介导的结合、切口和/或裂解；以及(a)和(b)。载体中存在的多核苷酸可以与原核或真核启动子可操作地连接。“可操作地连接”是指其中将第一核酸序列放置于与第二核酸序列的功能关系中的情况。例如，如果启动子影响编码序列的转录或表达，则启动子与编码序列可操作地连接。可操作地连接的DNA序列可以在同一阅读框中非常接近或连续并且在需要时连接两个蛋白质编码区。本文考虑的载体可包含与编码蛋白质的多核苷酸可操作地连接的异源启动子(例如，真核或原核启动子)。“异源启动子”是指不是所表达的蛋白质或RNA的天然或内源启动子的启动子。本文公开的载体可包括质粒载体。

如本文所用，“表达”是指多核苷酸从DNA模板转录的过程(例如转录成mRNA或其他RNA转录物)和/或转录的mRNA随后翻译成肽、多肽或蛋白质的过程。转录物和编码的多肽可以统称为“基因产物”。如果多核苷酸源自基因组DNA，则表达可包括在真核细胞中mRNA的剪接。

如本文所用，“表达模板”是指作为底物用于转录至少一种可以翻译成序列确定的生物聚合物(例如，多肽或蛋白质)的RNA的核酸。表达模板包括由DNA或RNA组成的核酸。将核酸用于表达模板的DNA的合适来源包括基因组DNA、cDNA和可以转化为cDNA的RNA。基因组DNA、cDNA和RNA可以来自任何生物来源，例如组织样品、活组织检查、拭子、痰、血液样品、粪便样品、尿液样品、刮屑等。基因组DNA、cDNA和RNA可以来自宿主细胞或病毒来源以及来自任何物种，包括现存和灭绝的生物体。如本文所用，“表达模板”和“转录模板”具有相同含义并可互换使用。

如本文所用，术语“载体”是指能够运输与其连接的另一种核酸的核酸分子。一种类型的载体是“质粒”，它指的是环状双链DNA环，其中可以连接额外的DNA区段。此类载体在本文中称为“表达载体”。通常，可用于重组DNA技术的表达载体通常是质粒形式。在本说明书中，“质粒”和“载体”可以互换使用。然而，所公开的方法和组合物旨在包括此类其他形式的表达载体，例如起到等效功能的病毒载体。

在某些示例性实施方案中，重组表达载体包含适合在本文所述的一种或多种方法中表达核酸序列的形式的核酸序列，这意味着重组表达载体包括与待表达的核酸序列可操作地连接的一种或多种调节性序列。在重组表达载体内，“可操作地连接”旨在意指编码一种或多种rRNA或报告多肽和/或本文所述的蛋白质的核苷酸序列以允许表达核苷酸序列(例如，在体外转录和/或翻译系统中)的方式连接至一种或多种调节序列。术语“调节序列”旨在包括启动子、增强子和其他表达控制元件(例如，聚腺苷酸化信号)。例如，在Goeddel；Gene Expression Technology:Methods in Enzymology 185,Academic Press,SanDiego,Calif.(1990)中描述了这样的调节序列。

寡核苷酸和多核苷酸可以任选地包括一种或多种非标准核苷酸、核苷酸类似物和/或修饰的核苷酸。修饰的核苷酸的实例包括但不限于二氨基嘌呤、S2T、5-氟尿嘧啶、5-溴尿嘧啶、5-氯尿嘧啶、5-碘尿嘧啶、次黄嘌呤、黄嘌呤、4-乙酰胞嘧啶、5-(羧基羟甲基)尿嘧啶、5-羧甲基氨基甲基-2-硫尿苷、5-羧甲基氨基甲基尿嘧啶、二氢尿嘧啶、β-D-半乳糖基奎苷(galactosylqueosine)、肌苷、N6-异戊烯基腺嘌呤、1-甲基鸟嘌呤、1-甲基肌苷、2,2-二甲基鸟嘌呤、2-甲基腺嘌呤、2-甲基鸟嘌呤、3-甲基胞嘧啶、5-甲基胞嘧啶、N6-腺嘌呤、7-甲基鸟嘌呤、5-甲基氨基甲基尿嘧啶、5-甲氧基氨基甲基-2-硫尿嘧啶、β-D-甘露糖基奎苷、5’-甲氧基羧甲基尿嘧啶、5-甲氧基尿嘧啶、2-甲硫基-D46-异戊烯基腺嘌呤、尿嘧啶-5-羟乙酸(v)、wybutoxosine、假尿嘧啶、奎苷(queosine)、2-巯基胞嘧啶、5-甲基-2-硫尿嘧啶、2-硫尿嘧啶、4-硫尿嘧啶、5-甲基尿嘧啶、尿嘧啶-5-羟乙酸甲酯、尿嘧啶-5-羟乙酸(v)、5-甲基-2-硫尿嘧啶、3-(3-氨基-3-N-2-羧丙基)尿嘧啶、(acp3)w、2,6-二氨基嘌呤等。核酸分子也可以在碱基部分(例如，在通常可用于与互补核苷酸形成氢键的一个或多个原子处和/或在通常不能与互补核苷酸形成氢键的一个或多个原子处)、糖部分或磷酸主链处进行修饰。

术语“多核苷酸”、“多核苷酸序列”、“核酸”和“核酸序列”是指核苷酸、寡核苷酸、多核苷酸(这些术语可以互换使用)或其任何片段。这些短语也指基因组、天然或合成来源的DNA或RNA(其可以是单链或双链，并且可以代表有义链或反义链)。

关于多核苷酸序列，术语“同一性百分比”和“％同一性”是指使用标准化算法比对的至少两个多核苷酸序列之间的残基匹配的百分比。这样的算法可以以标准化和可重复的方式在被比较的序列中插入缺口以优化两个序列之间的比对，并因此实现两个序列的更有意义的比较。核酸序列的同一性百分比可以如本领域所理解的那样确定。(参见，例如，美国专利号7,396,664，其通过引用整体并入本文)。国家生物技术信息中心(NCBI)基本局部比对搜索工具(BLAST)提供了一套常用且可免费获得的序列比较算法，其可从多个来源获得，包括NCBI,Bethesda,Md.，在其网站上获得。BLAST软件套件包括各种序列分析程序，包括“blastn”，其用于将已知的多核苷酸序列与来自各种数据库的其他多核苷酸序列进行比对。还可用的是称为“BLAST 2 Sequences”的工具，其用于两个核苷酸序列的直接成对比较。“BLAST 2 Sequences”可以在NCBI网站上以交互方式访问和使用。“BLAST 2Sequences”工具可用于blastn和blastp(如上所讨论的)。

关于多核苷酸序列，同一性百分比可以在整个确定的多核苷酸序列(例如，如由特定的SEQ ID号确定的)的长度上测量，或者可以在较短的长度上测量，例如，在取自更大的、确定的序列的片段的长度(例如至少20、至少30、至少40、至少50、至少70、至少100或至少200个连续核苷酸的片段)上测量。此类长度仅是示例性的，并且应理解，本文、表格、附图或序列表中所示序列支持的任何片段长度可用于描述在其上可测量同一性百分比的长度。

关于多核苷酸序列，“变体”、“突变体”或“衍生物”可以定义为使用国家生物技术信息中心网站上提供的blastn和“BLAST 2 Sequences”工具在核酸序列之一的特定长度上与特定核酸序列具有至少50％序列同一性的核酸序列。(参见Tatiana A.Tatusova,ThomasL.Madden(1999),"Blast 2 sequences-a new tool for comparing protein andnucleotide sequences",FEMS Microbiol Lett.174:247-250)。此类核酸对可在某个确定的长度上显示例如至少60％、至少70％、至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％或至少99％或更高的序列同一性。

由于遗传密码的简并性(其中多个密码子可以编码单一氨基酸)，因此不显示高度同一性的核酸序列仍然可以编码相似的氨基酸序列。应当理解，可以使用这种简并性来改变核酸序列以产生全部编码基本相同蛋白质的多个核酸序列。例如，本文考虑的多核苷酸序列可以编码蛋白质并且可以针对在特定宿主中的表达进行密码子优化。在本领域中，已经为包括人、小鼠、大鼠、猪、大肠杆菌、植物和其他宿主细胞在内的许多宿主生物制备了密码子使用频率表。

“重组核酸”是非天然存在的序列或具有通过人工组合序列的两个或更多个另外分离的区段而制成的序列。这种人工组合通常通过化学合成来实现，或者更常见的通过人工操作核酸的分离的区段(例如通过本领域已知的基因工程技术)来实现。术语重组体包括仅通过添加、取代或缺失一部分核酸而改变的核酸。通常，重组核酸可包括与启动子序列可操作地连接的核酸序列。这样的重组核酸可以是用于例如转化细胞的载体的一部分。

本文公开的核酸可以是“基本上分离的或纯化的”。术语“基本上分离或纯化”是指从其天然环境中去除的核酸，并且至少60％不含，优选至少75％不含，以及更优选至少90％不含，甚至更优选至少95％不含与它天然相关的其他组分。

肽、多肽、蛋白质和合成方法

如本文所用，术语“肽”、“多肽”和“蛋白质”是指包含通过酰胺键连接的氨基酸残基的聚合物链的分子。术语“氨基酸残基”包括但不限于包含在由丙氨酸(Ala或A)、半胱氨酸(Cys或C)、天冬氨酸(Asp或D)、谷氨酸(Glu或E)、苯丙氨酸(Phe或F)、甘氨酸(Gly或G)、组氨酸(His或H)、异亮氨酸(Ile或I)、赖氨酸(Lys或K)、亮氨酸(Leu或L)、甲硫氨酸(Met或M)、天冬酰胺(Asn或N)、脯氨酸(Pro或P)、谷氨酰胺(Gln或Q)、精氨酸(Arg或R)、丝氨酸(Ser或S)、苏氨酸(Thr或T)、缬氨酸(Val或V)、色氨酸(Trp或W)和酪氨酸(Tyr或Y)残基组成的组中的氨基酸残基。术语“氨基酸残基”还可包括非标准或非天然氨基酸。术语“氨基酸残基”可包括α-、β-、γ-和δ-氨基酸。

在一些实施方案中，术语“氨基酸残基”可包括包含在由同型半胱氨酸、2-氨基己二酸、N-乙基天冬酰胺、3-氨基己二酸、羟赖氨酸、β-丙氨酸、β-氨基丙酸、别羟赖氨酸、2-氨基丁酸、3-羟脯氨酸、4-氨基丁酸、4-羟脯氨酸、哌啶酸、6-氨基己酸、异锁链素、2-氨基庚酸、别异亮氨酸、2-氨基异丁酸、N-甲基甘氨酸、肌氨酸、3-氨基异丁酸、N-甲基异亮氨酸、2-氨基庚二酸、6-N-甲基赖氨酸、2,4-二氨基丁酸、N-甲基缬氨酸、锁链素、正缬氨酸、2,2’-二氨基庚二酸、正亮氨酸、2,3-二氨基丙酸、鸟氨酸和N-乙基甘氨酸组成的组中的非标准或非天然氨基酸残基。术语“氨基酸残基”可包括任何上述氨基酸的L异构体或D异构体。

非标准或非天然氨基酸的其他实例包括但不限于对-乙酰基-L-苯丙氨酸、对-碘-L-苯丙氨酸、O-甲基-L-酪氨酸、对炔丙氧基苯丙氨酸、对-炔丙基-苯丙氨酸、L-3-(2-萘基)丙氨酸、3-甲基-苯丙氨酸、O-4-烯丙基-L-酪氨酸、4-丙基-L-酪氨酸、三-O-乙酰基-GlcNAcpβ-丝氨酸、L-多巴、氟化苯丙氨酸、异丙基-L-苯丙氨酸、对-叠氮基-L-苯丙氨酸、对-酰基-L-苯丙氨酸、对-苯甲酰基-L-苯丙氨酸、L-磷酸丝氨酸、磷酸丝氨酸、磷酸酪氨酸、对溴苯丙氨酸、对-氨基-L-苯丙氨酸、异丙基-L-苯丙氨酸、酪氨酸氨基酸的非天然类似物；谷氨酰胺氨基酸的非天然类似物；苯丙氨酸氨基酸的非天然类似物；丝氨酸氨基酸的非天然类似物；苏氨酸氨基酸的非天然类似物；甲硫氨酸氨基酸的非天然类似物；亮氨酸氨基酸的非天然类似物；异亮氨酸氨基酸的非天然类似物；烷基、芳基、酰基、叠氮基、氰基、卤素、肼、酰肼、羟基、烯基、炔基、醚、硫醇、磺酰基、硒基、酯、硫代酸、硼酸盐、硼酸酯、28ufa28hor、膦酰基、膦、杂环、烯酮、亚胺、醛、羟胺、酮或氨基取代的氨基酸，或其组合；具有可光活化交联剂的氨基酸；自旋标记的氨基酸；荧光氨基酸；金属结合氨基酸；含金属的氨基酸；放射性氨基酸；光笼罩的和/或光致异构化氨基酸；含生物素或生物素类似物的氨基酸；含酮的氨基酸；包含聚乙二醇或聚醚的氨基酸；重原子取代的氨基酸；可化学裂解或可光裂解的氨基酸；具有延长侧链的氨基酸；含有毒性基团的氨基酸；糖取代的氨基酸；碳连接的含糖氨基酸；具有氧化还原活性的氨基酸；含α-羟基的酸；麦角氨酸(amino thioacid)；α,α双取代氨基酸；β-氨基酸；γ-氨基酸，脯氨酸或组氨酸以外的环状氨基酸，苯丙氨酸、酪氨酸或色氨酸以外的芳香族氨基酸。

如本文所用，“肽”被定义为氨基酸的短聚合物，其长度通常为20个或更少个氨基酸，更通常长度为12个或更少个氨基酸(Garrett&Grisham,Biochemistry,第2版,1999,Brooks/Cole,110)。在一些实施方案中，如本文所考虑的肽可包括不超过约2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个氨基酸。多肽，也称为蛋白质，通常具有>100个氨基酸的长度(Garrett&Grisham,Biochemistry,第2版,1999,Brooks/Cole,110)。如本文所考虑的多肽可包含但不限于100、101、102、103、104、105、约110、约120、约130、约140、约150、约160、约170、约180、约190、约200、约210、约220、约230、约240、约250、约275、约300、约325、约350、约375、约400、约425、约450、约475、约500、约525、约550、约575、约600、约625、约650、约675、约700、约725、约750、约775、约800、约825、约850、约875、约900、约925、约950、约975、约1000、约1100、约1200、约1300、约1400、约1500、约1750、约2000、约2250、约2500个或更多个氨基酸残基。

如本文所考虑的肽或多肽可以被进一步修饰以包括非氨基酸部分。修饰可以包括但不限于酰化(例如，O-酰化(酯)、N-酰化(酰胺)、S-酰化(硫酯))、乙酰化(例如，在蛋白质的N-末端或在赖氨酸残基处添加乙酰基)、甲酰化脂酰化(例如，硫辛酸酯、C8官能团的附接)、肉豆蔻酰化(例如，肉豆蔻酸酯、C14饱和酸的附接)、棕榈酰化(例如，棕榈酸酯、C16饱和酸的附接)、烷基化(例如，烷基的添加，例如在赖氨酸或精氨酸残基处添加甲基)、异戊二烯化或戊二烯化(例如，添加类异戊二烯基团，例如法呢醇或香叶基香叶醇)、在C-末端的酰胺化、糖基化(例如，在天冬酰胺、羟赖氨酸、丝氨酸或苏氨酸上添加糖基，产生糖蛋白)、糖化(被认为是糖的非酶促附接)、聚唾液酸化(例如，添加聚唾液酸)、糖基磷脂酰肌醇化(glypiation)(例如,糖基磷脂酰肌醇(GPI)锚形成、羟基化、碘化(例如甲状腺激素的)和磷酸化(例如，添加磷酸基团，通常添加到丝氨酸、酪氨酸、苏氨酸或组氨酸)。

本文公开的修饰的氨基酸序列可以包括一个或多个氨基酸的缺失。如本文所用，“缺失”是指相对于天然氨基酸序列去除一个或多个氨基酸。本文公开的修饰的氨基酸序列可以包括一个或多个氨基酸的插入。如本文所用，“插入”是指向天然氨基酸序列添加一个或多个氨基酸。本文公开的修饰的氨基酸序列可以包括一个或多个氨基酸的取代。如本文所用，“取代”意指用对氨基酸序列而言非天然的氨基酸替换天然氨基酸序列的氨基酸。例如，本文公开的修饰的氨基序列可以包括一个或多个缺失、插入和/或取代，以便修饰靶蛋白的天然氨基酸序列以包括被N-糖基转移酶糖基化的一个或多个异源氨基酸基序。

关于蛋白质，“缺失”是指导致一个或多个氨基酸残基的不存在的氨基酸序列的变化。缺失可以去除至少1、2、3、4、5、10、20、50、100、200或更多个氨基酸残基。缺失可包括内部缺失和/或末端缺失(例如，参考多肽的N-末端截短、C-末端截短或两者)。参考多肽序列的“变体”、“突变体”或“衍生物”可以包括相对于参考多肽序列的缺失。

关于蛋白质，“片段”是与参考序列在序列上相同但长度比参考序列短的氨基酸序列的一部分。片段可以包含多至参考序列的整个长度，减去至少一个氨基酸残基。例如，片段可分别包含参考多肽的5至1000个连续氨基酸残基。在一些实施方案中，片段可包含参考多肽的至少5、10、15、20、25、30、40、50、60、70、80、90、100、150、250或500个连续氨基酸残基。片段可以优先选自分子的某些区域。术语“至少一个片段”包括全长多肽。相对于全长蛋白质，片段可以包括N-末端截短、C-末端截短或这两种截短。参考多肽序列的“变体”、“突变体”或“衍生物”可以包括参考多肽序列的片段。

关于蛋白质，词语“插入”和“添加”是指导致一个或多个氨基酸残基的添加的氨基酸序列的变化。插入或添加可指1、2、3、4、5、10、20、30、40、50、60、70、80、90、100、150、200或更多个氨基酸残基。参考多肽序列的“变体”、“突变体”或“衍生物”可以包括相对于参考多肽序列的插入或添加。蛋白质的变体可具有N-末端插入、C-末端插入、内部插入或N-末端插入、C-末端插入和内部插入的任意组合。

关于蛋白质，短语“同一性百分比”和“％同一性”是指使用标准化算法比对的至少两个氨基酸序列之间的残基匹配的百分比。氨基酸序列比对的方法是众所周知的。一些比对方法考虑了保守的氨基酸取代。下文更详细解释的此类保守取代通常保留取代位点处的电荷和疏水性，从而保留多肽的结构(并因此保留功能)。氨基酸序列的同一性百分比可以如本领域所理解的那样确定。(参见，例如，美国专利号7,396,664，其通过引用整体并入本文)。国家生物技术信息中心(NCBI)基本局部比对搜索工具(BLAST)提供了一套常用且可免费获得的序列比较算法，其可从多个来源获得，包括NCBI,Bethesda,Md.，在其网站上获得。BLAST软件套件包括各种序列分析程序，包括“blastp”，其用于将已知氨基酸序列与来自各种数据库的其他氨基酸序列进行比对。

关于蛋白质，同一性百分比可以在整个确定的多肽序列(例如，如由特定的SEQ ID号确定的)的长度上测量，或可以在较短的长度上测量，例如，在取自更大的、确定的多肽序列的片段的长度(例如至少15、至少20、至少30、至少40、至少50、至少70或至少150个连续残基的片段)上测量。此类长度仅是示例性的，并且应理解，本文、表格、附图或序列表中所示序列支持的任何片段长度可用于描述在其上可测量同一性百分比的长度。

本文包含的肽、多肽和蛋白质可以包括或可以被修饰以包括糖基转移酶的氨基酸受体基序。例如，本文包含的肽、多肽和蛋白质可以包括或可以被修饰以包括包含N-X-S/T的氨基酸受体基序，其是本文讨论的N-连接的糖基转移酶(NGT)的氨基酸受体基序(例如，ApNGT)。

关于蛋白质，如本文所考虑的变体、突变体或衍生物的氨基酸序列可以包括相对于参考氨基酸序列的保守氨基酸取代。例如，变体、突变体或衍生物蛋白质可以包括相对于参考分子的保守氨基酸取代。“保守氨基酸取代”是将氨基酸取代为不同氨基酸的那些取代，其中预测该取代对参考多肽的特性干扰最少。换言之，保守氨基酸取代基本上保留了参考多肽的结构和功能。下表提供了本文考虑的示例性保守氨基酸取代的列表：

保守氨基酸取代通常保持(a)取代区域中的多肽主链的结构，例如作为β折叠或α螺旋构象，(b)在取代位点处分子的电荷或疏水性，和/或(c)大部分侧链。非保守氨基酸通常破坏(a)取代区域中的多肽主链的结构，例如，作为β折叠或α螺旋构象，(b)在取代位点处分子的电荷或疏水性，和/或(c)大部分侧链。

本文所述或公开的蛋白质、突变体、变体可以具有由参考多肽展示的一种或多种功能或生物活性(例如，由野生型蛋白质展示的一种或多种功能或生物活性)。

所公开的蛋白质可以是基本上分离的或纯化的。术语“基本上分离或纯化”是指从其天然环境中去除的蛋白质，并且至少60％不含，优选至少75％不含，以及更优选至少90％不含，甚至更优选至少95％不含与它天然相关的其他组分。

无细胞蛋白质合成(CFPS)

本文公开的组分、系统和方法可以应用于本领域已知的无细胞蛋白质合成方法。参见，例如，美国专利号5,478,730；5,556,769；5,665,563；6,168,931；6,548,276；6,869,774；6,994,986；7,118,883；7,186,525；7,189,528；7,235,382；7,338,789；7,387,884；7,399,610；7,776,535；7,817,794；8,703,471；8,298,759；8,715,958；8,734,856；8,999,668；和9,005,920。还参见美国公开申请号2018/0016614,2018/0016612,2016/0060301,2015-0259757,2014/0349353,2014-0295492,2014-0255987,2014-0045267,2012-0171720,2008-0138857,2007-0154983,2005-0054044,和2004-0209321。还参见美国公开申请号2005-0170452；2006-0211085；2006-0234345；2006-0252672；2006-0257399；2006-0286637；2007-0026485；2007-0178551。还参见公开的PCT国际申请号2003/056914；2004/013151；2004/035605；2006/102652；2006/119987；和2007/120932。还参见Jewett,M.C.,Hong,S.H.,Kwon,Y.C.,Martin,R.W.,和Des Soye,B.J.2014,“Methods for improved invitro protein synthesis with proteins containing non standard amino acids,”美国专利申请系列号:62/044,221；Jewett,M.C.,Hodgman,C.E.,和Gan,R.2013,“Methodsfor yeast cell-free protein synthesis,”美国专利申请系列号:61/792,290；Jewett,M.C.,J.A.Schoborg,和C.E.Hodgman.2014,“Substrate Replenishment and ByproductRemoval Improve Yeast Cell-Free Protein Synthesis,”美国专利申请系列号:61/953,275；和Jewett,M.C.,Anderson,M.J.,Stark,J.C.,Hodgman,C.E.2015,“Methods foractivating natural energy metabolism for improved yeast cell-free proteinsynthesis,”美国专利申请系列号:62/098,578。还参见Guarino,C.,&DeLisa,M.P.(2012).A prokaryote-based cell-free translation system that efficiently synthesizesglycoproteins.Glycobiology,22(5),596-601。所有这些参考文献的内容通过引用整体并入本申请。

在一些实施方案中，“CFPS反应混合物”通常可包含粗制或部分纯化的细胞提取物、RNA翻译模板和用于促进从RNA翻译模板的无细胞蛋白质合成的合适的反应缓冲液中的一种或多种。在一些方面，CFPS反应混合物可以包括外源RNA翻译模板。在其他方面，CFPS反应混合物可以包括编码与DNA依赖性RNA聚合酶的启动子元件可操作地连接的开放阅读框的DNA表达模板。在这些其他方面，CFPS反应混合物还可包括DNA依赖性RNA聚合酶以指导编码开放阅读框的RNA翻译模板的转录。在这些其他方面，CFPS反应混合物中可以包含额外的NTP和二价阳离子辅因子。如果反应混合物包含实现反应所需的所有试剂，则称其为完全反应混合物，如果其仅包含一部分必需试剂，则称其为不完全反应混合物。本领域普通技术人员将理解，反应组分通常作为单独的溶液储存，每个溶液包含总组分的一个子集，这是出于方便、储存稳定性的原因，或以允许组分浓度的应用依赖性调整，并且在反应之前将反应组分合并以产生完全反应混合物。此外，本领域普通技术人员将理解，为了商业化，反应组分被分开包装，并且有用的商业试剂盒可以包含本发明的反应组分的任何子集。

所公开的无细胞蛋白质合成系统可以利用粗制的和/或至少部分分离和/或纯化的组分。如本文所用，术语“粗制”可以指通过破碎和裂解细胞获得的组分，并且至多最低限度地纯化来自破碎和裂解的细胞的粗制组分，例如通过离心破碎和裂解的细胞并从离心后的上清液和/或沉淀收集粗制组分。术语“分离的或纯化的”是指从其天然环境中去除的组分，并且至少60％不含，优选至少75％不含，以及更优选至少90％不含，甚至更优选至少95％不含与它天然相关的其他组分。

如本文所用，多肽的“翻译模板”是指来自表达模板的转录的RNA产物，其可被核糖体用于合成多肽或蛋白质。

如本文所用，术语“反应混合物”是指含有进行给定反应所需的试剂的溶液。如果反应混合物包含进行反应所需的所有试剂，则该反应混合物被称为完全反应混合物。反应混合物的组分可以分别储存在单独的容器中，每个容器包含全部组分中的一种或多种。组分可以单独包装用于商业化，并且有用的商业试剂盒可以包含反应混合物的反应组分中的一种或多种。

反应混合物可以包括表达模板、翻译模板或表达模板和翻译模板两者。表达模板用作用于转录至少一种RNA的底物，该RNA可以翻译成序列确定的生物聚合物(例如，多肽或蛋白质)。翻译模板是一种RNA产物，其可以被核糖体用来合成序列确定的生物聚合物。在某些实施方案中，平台包括表达模板和翻译模板。在某些特定实施方案中，反应混合物可包含偶联的转录/翻译(“Tx/Tl”)系统，其中从相同细胞提取物合成翻译模板和序列确定的生物聚合物。

反应混合物可以包含能够从表达模板产生翻译模板的一种或多种聚合酶。聚合酶可以外源提供或可以从用于制备提取物的生物体提供。在某些特定实施方案中，聚合酶由存在于用于制备提取物的生物体中的质粒和/或用于制备提取物的生物体的基因组中的整合位点表达。

改变CFPS反应的物理化学环境以更好地模拟细胞质可以改善蛋白质合成活性。以下参数可以单独考虑或与一种或多种其他组分结合考虑以改善基于粗制细胞提取物(例如，S12、S30和S60提取物)的稳健CFPS反应平台。

温度可以是适合于CFPS的任何温度。温度可在约10℃至约40℃的一般范围内，包括该一般范围内的中间特定范围，包括约15℃至约35℃、约15℃至约30℃，约15℃至约25℃。在某些方面，反应温度可以是约15℃、约16℃、约17℃、约18℃、约19℃、约20℃、约21℃、约22℃、约23℃、约24℃、约25℃。

反应混合物可以包括适用于CFPS的任何有机阴离子。在某些方面，有机阴离子可以是谷氨酸根、乙酸根等。在某些方面，有机阴离子的浓度独立地在约0mM至约200mM的一般范围内，包括该一般范围内的中间特定值，例如约0mM、约10mM、约20mM、约30mM、约40mM、约50mM、约60mM、约70mM、约80mM、约90mM、约100mM、约110mM、约120mM、约130mM、约140mM、约150mM、约160mM、约170mM、约180mM、约190mM和约200mM，等等。

反应混合物可以包括适用于CFPS的任何卤化物阴离子。在某些方面，卤化物阴离子可以是氯化物、溴化物、碘化物等。优选的卤化物阴离子是氯化物。通常，卤化物阴离子(如果存在于反应中)的浓度在约0mM至约200mM的一般范围内，包括该一般范围内的中间特定值，例如本文一般公开的用于有机阴离子的那些。

反应混合物可以包括适用于CFPS的任何有机阳离子。在某些方面，有机阳离子可以是多胺，例如亚精胺或腐胺等。优选多胺存在于CFPS反应中。在某些方面，反应中有机阳离子的浓度通常可为约0mM至约3mM、约0.5mM至约2.5mM、约1mM至约2mM。在某些方面，可以存在多于一种有机阳离子。

反应混合物可以包括适用于CFPS的任何无机阳离子。例如，合适的无机阳离子可包括一价阳离子，例如钠、钾、锂等；和二价阳离子，例如镁、钙、锰等。在某些方面，无机阳离子是镁。在这样的方面，镁浓度可以在约1mM至约50mM的一般范围内，包括在这个一般范围内的中间特定值，例如约1mM、约2mM、约3mM、约5mM、约6mM、约7mM、约8mM、约9mM、约10mM等。在优选的方面，无机阳离子的浓度可在约4mM至约9mM的特定范围内，更优选在约5mM至约7mM的范围内。

反应混合物可以包括内源性NTP(即，存在于细胞提取物中的NTP)和/或外源性NTP(即，添加到反应混合物中的NTP)。在某些方面，反应使用ATP、GTP、CTP和UTP。在某些方面，个体NTP的浓度在约0.1mM至约2mM的范围内。

反应混合物可以包括适用于CFPS的任何醇。在某些方面，醇可以是多元醇，更具体地是甘油。在某些方面，醇在约0％(v/v)至约25％(v/v)的一般范围内，包括约5％(v/v)、约10％(v/v)和约15％(v/v)和约20％(v/v)等的特定中间值。

在某些示例性实施方案中，本文所述的一种或多种方法在容器例如单个容器中进行。如本文所用，术语“容器”是指适合容纳本文所述的一种或多种反应物(例如，用于一个或多个转录、翻译和/或糖基化步骤)的任何容器。容器的实例包括但不限于微量滴定板、试管、微量离心管、烧杯、烧瓶、多孔板、比色皿、流动系统、微纤维、显微镜载玻片等。

蛋白质的糖基化

本文公开的组分、系统和方法可以应用于重组细胞系统和无细胞蛋白质合成方法以制备糖基化蛋白质。可以使用所公开的组分、系统和方法制备的糖基化蛋白质可以包括具有N-连接的糖基化(即，附接至天冬酰胺的氮的聚糖)的蛋白质。本文公开的糖基化蛋白质可以包括由本领域已知的单糖(例如葡萄糖(例如，β-D-葡萄糖)、半乳糖(例如，β-D-半乳糖)、甘露糖(例如，β-D-甘露糖)、岩藻糖(例如，α-L-岩藻糖)、N-乙酰基-葡糖胺(GlcNAc)、N-乙酰基-半乳糖胺(GalNAc)、N-乙酰基-葡糖胺、丙酮酸、神经氨酸、N-乙酰神经氨酸(即唾液酸)和木糖，它们可以通过各自的糖基转移酶附接至糖基化的蛋白质、生长的聚糖链或供体分子(例如，糖供体核苷酸))组成的无支链和/或支链糖链。用于糖基化蛋白质的其他单糖可以包括阿洛糖、阿卓糖、古洛糖、艾杜糖、塔罗糖、核糖、阿拉伯糖、来苏糖。用于糖基化蛋白质的其他单糖可包括脱氧单糖，例如脱氧核糖。此外，由于非天然糖独特的生物物理特性(包括表面电荷和氢键合)、与内源性受体(包括凝集素和siglec)的独特结合特征、通过双正交或半双正交缀合方法(包括点击化学和迈克尔加成)进一步修饰的潜力以及它们被物理降解或酶促降解或去除(包括通过糖苷酶)的能力的差异，非天然糖也可用于糖基化蛋白质。这些非天然糖包括但不限于具有叠氮基、炔烃或应变炔烃/烯烃官能团糖(包括叠氮基唾液酸，(叠氮基-Sia))的糖；具有硫醇或马来酰亚胺基团的糖；脱氧糖；聚乙二醇化的糖；氨基糖；含有天然和/或非天然单体的预组装的寡糖或多糖；氟化糖；和其它的。

原核生物中的糖基化

原核生物中的糖基化是本领域已知的。(参见，例如，美国专利号8,703,471；和8,999,668；和美国公开申请号2005/0170452；2006/0211085；2006/0234345；2006/0252672；2006/0257399；2006/0286637；2007/0026485；2007/0178551；和国际公开申请WO2003/056914A1；WO2004/035605A2；WO2006/102652A2；WO2006/119987A2；和WO2007/120932A2；其全部内容通过引用整体并入本文)。

用于产生糖蛋白和鉴定糖基化途径的模块化平台

发明人已经公开了用于在体外和体内的糖蛋白蛋白质合成的组分、系统和方法。特别地，发明人已经公开了与用于产生糖蛋白的模块化平台相关的组分、系统和方法。发明人公开的组分、系统和方法可用于在无细胞蛋白质合成(CFPS)和经修饰的细胞中合成糖蛋白和重组糖蛋白。

在一个实施方案中，发明人公开了一种用于在体外对肽或多肽序列进行糖基化的无细胞系统。肽或多肽序列可以存在于肽(即相对较短的氨基酸序列)或多肽(即相对较长的氨基酸序列)中，肽或多肽序列通常包含天冬酰胺残基，其可通过N-连接的糖基转移酶糖基化。例如，肽或多肽序列可以包含氨基酸基序N-X-S/T。所公开的系统可包含以下组分：(i)糖基转移酶，其是可溶的N-连接的糖基转移酶(如本文所用的术语“N-连接的糖基转移酶”和“N-糖基转移酶”和“NGT”可互换使用)，其催化将单糖(任选地，其中单糖是葡萄糖(Glc))转移至天冬酰胺残基的氨基以提供N-连接的聚糖，或在无细胞蛋白质合成(CFPS)反应混合物中表达NGT的表达载体；(ii)包含单糖供体(任选地，Glc供体；任选地，单糖；如本文所用的术语“单糖供体”包括但不限于单糖和多糖)的糖基化混合物；其中所述肽或多肽序列在体外在所述糖基化混合物中被糖基化以提供包含N-连接的聚糖(任选地N-连接的Glc)的肽或多肽序列。在一些实施方案中，NGT是膜结合的。

在所公开系统的进一步实施方案中，该系统还可以包含以下组分：(iii)第二糖基转移酶，其是可溶性的并且催化将单糖转移至N-连接的聚糖(任选地，其中单糖是Glc、半乳糖(Gal)、N-乙酰半乳糖胺(GalNAc)、N-乙酰葡糖胺(GlcNAc)、丙酮酸、岩藻糖(Fuc)、唾液酸(Sia))，或在无细胞蛋白质合成(CFPS)反应混合物中表达第二糖基转移酶的表达载体；其中糖基化混合物包含Glc供体、Gal供体、GalNAc供体、GlcNAc供体、丙酮酸供体、岩藻糖供体、唾液酸供体或其混合物，并且其中N-连接的聚糖被选自Glc、Gal、GalNAc、GlcNAc、丙酮酸、Fuc和Sia的一种或多种部分糖基化(任选地提供N-连接的右旋糖、N-连接的乳糖或N-连接的Glc-GalNAc)。在一些实施方案中，第二糖基转移酶是膜结合的。

在所公开系统的更进一步的实施方案中，该系统还可以包含以下组分：(iv)第三糖基转移酶，其是可溶性的并且催化将单糖转移至N-连接的聚糖(任选地，其中单糖是Glc、Gal、GalNAc、GlcNAc、丙酮酸、Fuc、Sia或其组合)，或在无细胞蛋白质合成(CFPS)反应混合物中表达第三糖基转移酶的表达载体；其中糖基化混合物包含Glc供体、Gal供体、GalNAc供体、GlcNAc供体、丙酮酸供体、岩藻糖供体、唾液酸供体或其混合物，并且其中N-连接的聚糖进一步被选自Glc、Gal、GalNAc、GlcNAc、丙酮酸、Fuc和Sia的一种或多种部分糖基化(任选地以提供包含选自唾液酸化形式的乳糖(例如，单唾液酸化形式的乳糖，例如3’-唾液酸乳糖、6’-唾液酸乳糖和二唾液酸化形式的乳糖)、岩藻糖基化形式的乳糖(例如，单岩藻糖基化形式的乳糖，例如2’-岩藻糖基乳糖(Glcβ1-4Galα1-2Fuc)和3’-岩藻糖基乳糖(即(Glcβ1-4Galα1-23Fuc)和双岩藻糖基化形式的乳糖)、唾液酸化形式的LacNAc(例如单唾液酸化形式的LacNAc和二唾液酸化形式的LacNAc)、岩藻糖基化形式的LacNAc(例如，单岩藻糖基化形式的LacNAc和双岩藻糖基化形式的LacNAc)、丙酮酸化的乳糖或丙酮酸化的LacNAc以及αGal表位(例如Glcβ1-4Galα1-3Gal或GlcNAcβ1-4Galα1-3Gal)的一种或多种部分的N-连接的聚糖)。如本文所用，LacNAc与乳糖-(聚)LacNAc可互换使用。在一些实施方案中，第三糖基转移酶是膜结合的。

所公开的系统可以包括或利用无细胞蛋白质合成(CFPS)和/或用于执行CFPS的组分。在所公开系统的一些实施方案中，系统包含或利用无细胞蛋白质合成(CFPS)反应混合物，并且在CFPS反应混合物中存在或表达第一糖基转移酶、第二糖基转移酶和第三糖基转移酶中的一种或多种。在所公开系统的进一步实施方案中，该系统包含或利用一种或多种无细胞蛋白质合成(CFPS)反应混合物，并且在CFPS反应混合物中存在或表达第一糖基转移酶、第二糖基转移酶和第三糖基转移酶中的一种或多种。任选地，可以组合一种或多种CFPS反应混合物以提供公开的系统和/或公开的系统的组分。在一些实施方案中，可组合一种或多种CFPS反应混合物以产生糖基化途径。

所公开的系统可用于对肽或多肽序列进行糖基化。在所公开系统的一些实施方案中，系统包含肽或多肽序列，或表达肽或多肽序列的表达载体。任选地，可以在无细胞蛋白质合成(CFPS)反应混合物中提供和/或表达肽或多肽序列。

合适的CFPS反应混合物可包含获自原核细胞的一种或多种组分。例如，用于CFPS反应混合物的组分可包括原核细胞裂解物。任选地，细胞裂解物可以富含一种或多种如本文公开的糖基转移酶。在一些实施方案中，CFPS反应混合物可包含或利用由大肠杆菌制备的裂解物，任选地其中大肠杆菌已被修饰以表达所公开的系统的一种或多种组分，例如本文所公开的糖基转移酶。

所公开的系统通常包含和/或利用第一糖基转移酶。任选地，第一糖基转移酶可以是细菌N-连接的糖基转移酶(NGT)或相对于野生型NGT具有一个或多个突变的修饰的NGT。任选地，细菌NGT是选自以下的细菌NGT：胸膜肺炎放线杆菌(Actinobacilluspleuropneumoniae)(ApNGT)(SEQ ID NO：1)、大肠杆菌(Escherichia coli)NGT(EcNGT)(SEQ ID NO：3)、流感嗜血杆菌(Haemophilus influenza)NGT(HiNGT)(SEQ ID NO：5)、溶血曼海姆菌(Mannheimia haemolytica)NGT(MhNGT)(SEQ ID NO：7)、杜雷嗜血杆菌(Haemophilus dureyi)NGT(HdNGT)(SEQ ID NO：9)、海藻百伯史坦菌(Bibersteiniatrehalosi)NGT(BtNGT)(SEQ ID NO：11)、嗜沫聚合杆菌(Aggregatibacter aphrophilus)NGT(AaNGT)(SEQ ID NO：13)、小肠结肠炎耶尔森菌(Yersinia enterocolitica)(YeNGT)NGT(SEQ ID NO：15)、鼠疫耶尔森菌(Yersinia pestis)(YpNGT)NGT(SEQ ID NO：17)和金格金氏杆菌(Kingella kingae)(KkNGT)NGT(SEQ ID NO：19)。在一些实施方案中，NGT是可溶的。在一些实施方案中，NGT是膜结合的。可用于本发明的组合物和方法的其他NGT可以在PCT/US2018/000185中找到，例如具有Q469A突变的胸膜肺炎放线杆菌(ApNGT)糖基转移酶(NGT)。

在一些实施方案中，所公开的系统可以包含和/或可以表达用于所公开的方法的糖基转移酶，例如包含一个或多个突变(例如，改变肽受体特异性和/或增加酶促周转率的突变)的经修饰的细菌NGT。(参见Song等人,“Production of homogeneous glycoproteinwith multisite modifications by an engineered N-glycosyltransferase mutant,”J.Biol.Chem.,April 5,2017,292,8856-8863，其内容通过引用整体并入本文)。在一些实施方案中，经修饰的细菌NGT是在Q469处具有取代的修饰的ApNGT，例如其中Q469被氨基酸X取代，其中X选自S、T、N、C、G、P、A、I、L、M、V(参见，例如具有Q469A的SEQ ID NO：2)。在一些实施方案中，经修饰的细菌NGT是在F482处具有取代的修饰的EcNGT，其中F482被氨基酸X取代，其中X选自S、T、N、C、G、P、A、I、L、M、V(参见，例如具有F482A的SEQ ID NO：4)。在一些实施方案中，经修饰的细菌NGT是在Q495处具有取代的修饰的HiNGT，其中Q495被氨基酸X取代，其中X选自S、T、N、C、G、P、A、I、L、M、V(参见，例如具有Q495A的SEQ ID NO：6)。在一些实施方案中，经修饰的细菌NGT是在Q469处具有取代的修饰的MhNGT，其中Q469被氨基酸X取代，其中X选自S、T、N、C、G、P、A、I、L、M、V(参见，例如具有Q469A的SEQ ID NO：8)。在一些实施方案中，经修饰的细菌NGT是在Q468处具有取代的修饰的HdNGT，其中Q468被氨基酸X取代，其中X选自S、T、N、C、G、P、A、I、L、M、V(参见，例如具有Q468A的SEQ ID NO：10)。在一些实施方案中，经修饰的细菌NGT是在Q471处具有取代的修饰的BtNGT，其中Q471被氨基酸X取代，其中X选自S、T、N、C、G、P、A、I、L、M、V(参见，例如具有Q471A的SEQ ID NO：12)。在一些实施方案中，经修饰的细菌NGT是在Q468处具有取代的修饰的AaNGT，其中Q468被氨基酸X取代，其中X选自S、T、N、C、G、P、A、I、L、M、V(参见，例如具有Q468A的SEQ ID NO：14)。在一些实施方案中，经修饰的细菌NGT是在F466处具有取代的修饰的YeNGT，其中F466被氨基酸X取代，其中X选自S、T、N、C、G、P、A、I、L、M、V(参见，例如具有F466A的SEQ ID NO：16)。在一些实施方案中，经修饰的细菌NGT是在F466处具有取代的修饰的YpNGT，其中F466被氨基酸X取代，其中X选自S、T、N、C、G、P、A、I、L、M、V(参见，例如具有F466A的SEQ ID NO：18)。在一些实施方案中，经修饰的细菌NGT是在Q474处具有取代的修饰的KkNGT，其中Q474被氨基酸X取代，其中X选自S、T、N、C、G、P、A、I、L、M、V(参见，例如具有Q474A的SEQ ID NO：20)。

在一些实施方案中，所公开的系统可包括和/或可表达具有SEQ ID NO：1、3、5、7、9、11、13、15、17或19中任一个的氨基酸序列或与SEQ ID NO：1、3、5、7、9、11、13、15、17或19中的任一个具有至少50％、60％、70％、80％、90％、95％、96％、97％、98％或99％的序列同一性的糖基转移酶，或第一糖基转移酶是经修饰的细菌N-连接的糖基转移酶(NGT)，其具有SEQ ID NO：2、4、6、8、10、12、14、16、18或20中任一个的氨基酸序列，或与SEQ ID NO：2、4、6、8、10、12、14、16、18或20中的任一个具有至少50％、60％、70％、80％、90％、95％、96％、97％、98％或99％的序列同一性。

所公开的系统可以包括和/或利用第二糖基转移酶。任选地，第二糖基转移酶是细菌糖基转移酶。任选地，第二糖基转移酶是α1-6葡萄糖基转移酶、β1-4半乳糖基转移酶或β1-3N-乙酰半乳糖胺转移酶。任选地，第二糖基转移酶选自胸膜肺炎放线杆菌α1-6葡萄糖基转移酶(Apα1-6)、淋病奈瑟菌(Neisseria gonorrhoeae)β1-4半乳糖基转移酶LgtB(NgLGtB)、脑膜炎奈瑟菌(Neisseria meningitidis)β1-4半乳糖基转移酶LgtB(NmLGtB)和脆弱拟杆菌(Bacteriodes fragilis)β1-3N-乙酰半乳糖胺转移酶(BfGalNAcT)。

所公开的系统可以包括和/或利用第三糖基转移酶。任选地，第三糖基转移酶是细菌糖基转移酶。任选地，第三糖基转移酶是β1-3N-乙酰葡糖胺转移酶、丙酮酸转移酶、α1-3岩藻糖基转移酶、α1-2岩藻糖基转移酶、α1-4半乳糖基转移酶、α1-3半乳糖基转移酶、α2-6唾液酸转移酶、α2-3,6唾液酸转移酶、α2-3唾液酸转移酶或α2-3,8唾液酸转移酶。任选地，第三糖基转移酶选自淋病奈瑟菌β1-3N-乙酰葡糖胺转移酶(NgLgtA)、粟酒裂殖酵母(Schizosaccharomyces pombe)丙酮酸转移酶(SpPvg1)、幽门螺杆菌(Helicobacterpylori)α1-3岩藻糖基转移酶(HpFutA)、幽门螺杆菌α1-2岩藻糖基转移酶(HpFutC)、脑膜炎奈瑟菌α1-4半乳糖基转移酶(NmLgtC)、牛(Bos taurus)α1-3半乳糖基转移酶(BtGGTA)、智人(Homo sapiens)α2-6唾液酸转移酶(HsSIAT1)、美人鱼发光杆菌(Photobacteriumdamselae)α2-6唾液酸转移酶(PdST6)、鳆发光杆菌(Photobacterium leiognathid)α2-6唾液酸转移酶(PlST6)、多杀巴斯德氏菌(Pasteurella multocida)α2-3,6唾液酸转移酶(PmST3,6)、弧菌属(Vibrio sp)JT-FAJ-16α2-3唾液酸转移酶(VsST3)、明亮发光杆菌(Photobacterium phosphoreum)α2-3唾液酸转移酶(PpST3)、空肠弯曲杆菌(Campylobacter jejuni)α2-3唾液酸转移酶(CjCST-I)和空肠弯曲杆菌α2-3,8唾液酸转移酶(CjCST-II)。

所公开的系统的一个或多个组分可以是保存的形式。在一些实施方案中，所公开的系统的一种或多种组分是冷冻干燥的。

还公开了包含N-连接的聚糖的肽或多肽序列。任选地，公开的肽或多肽序列使用本文公开的任何系统或使用本文公开的系统的任何组分制备。在一些实施方案中，肽或多肽序列包含N-连接的聚糖，其中该N-连接的聚糖包含选自唾液酸化形式的乳糖(例如，单唾液酸化形式的乳糖，例如3’-唾液酸乳糖、6’-唾液酸乳糖和二唾液酸化形式的乳糖)、岩藻糖基化形式的乳糖(例如，单岩藻糖基化形式的乳糖，例如2’-岩藻糖基乳糖(Glcβ1-4Galα1-2Fuc)和3’-岩藻糖基乳糖(即(Glcβ1-4Galα1-23Fuc)和双岩藻糖基化形式的乳糖)、唾液酸化形式的LacNAc(例如单唾液酸化形式的LacNAc和二唾液酸化形式的LacNAc)、岩藻糖基化形式的LacNAc(例如，单岩藻糖基化形式的LacNAc和双岩藻糖基化形式的LacNAc)、丙酮酸化的乳糖或丙酮酸化的LacNAc以及αGal表位(例如Glcβ1-4Galα1-3Gal或GlcNAcβ1-4Galα1-3Gal)的部分。在一些实施方案中，公开了包含在α1,2或α1,3键联中添加了一个或多个岩藻糖和/或在α2,3或α2,6键联中添加了一个或多个唾液酸的形式的乳糖或乳糖-(聚)LacNAc的肽或多肽。在一些实施方案中，所公开的肽或多肽可被利用或配制以用作治疗性蛋白质或疫苗。如本文所用，术语LacNAc与乳糖-(聚)LacNAc可互换使用。

本文还公开了经修饰的细胞。所公开的经修饰的细菌细胞可以包括经修饰的细菌细胞，例如基因修饰的细菌细胞。基因修饰的细菌细胞可包括其中细胞的基因组已被修饰以表达异源蛋白质(例如，异源糖基转移酶或用于糖基化的肽或多肽序列)的细胞和已被表达异源蛋白质(例如，用于糖基化的异源糖基转移酶或肽或多肽序列)的表观遗传载体转化的细胞。所公开的经修饰的细胞可以包含和/或表达本文公开的系统的一种或多种组分。所公开的经修饰的细胞可用于制备本文公开的系统的一种或多种组分。所公开的经修饰的细胞可过表达特定蛋白质或可缺乏特定蛋白质的表达。例如但不作为限制，在一些实施方案中，经修饰的细胞或细胞裂解物可能缺乏NanA(唾液酸醛缩酶)，产生减少量的NanA(唾液酸醛缩酶)，或表达无功能或功能降低的NanA(唾液酸醛缩酶)。

在一些实施方案中，经修饰的细胞和/或经修饰的细胞的组分可用于本文公开的方法中以对肽或多肽序列进行糖基化。在公开的用于体内制备糖基化肽或多肽序列的方法的一些实施方案中，所述方法包括培养经修饰的细菌细胞，其中所述经修饰的细菌细胞包含或表达用于糖基化的肽或多肽序列、N-连接的糖基转移酶和/或一种或多种额外的糖基转移酶，并且肽或多肽序列在经修饰的细菌细胞中或在糖基化反应混合物中被糖基化。在一些实施方案中，体内糖基化包括非天然糖(例如，叠氮基修饰的糖，包括叠氮基唾液酸)。

在一些实施方案中，经修饰的细胞的组分可用于无细胞蛋白质合成CFPS方法和/或糖基化反应方法。从经修饰的细胞制备的组分可包括但不限于细胞裂解物，任选其中裂解物单独地或与从其他经修饰的细胞制备的细胞裂解物组合地适用于CFPS反应方法和/或糖基化反应方法。

本文还公开了体外制备糖基化肽或多肽序列的方法。所述方法可包括使包含天冬酰胺残基的肽或多肽序列(例如包含氨基酸基序N-X-S/T的肽或多肽序列)在包含单糖供体(任选其中单糖供体是葡萄糖(Glc)供体，或其中单糖供体是单糖)的糖基化混合物中与糖基转移酶反应，所述糖基转移酶是可溶性N-连接的糖基转移酶(如本文所用，术语“N-连接的糖基转移酶”、“N-糖基转移酶”和“NGT”可互换使用)，其催化将来自单糖供体的单糖(任选地来自Glc供体的Glc或其中单糖供体是单糖)转移至天冬酰胺残基的氨基，以提供N-连接的聚糖(任选地，N-连接的Glc)。在公开的方法中，所述肽或多肽序列在体外在所述糖基化混合物中被糖基化以提供包含N-连接的聚糖(任选地N-连接的Glc)的肽或多肽序列。任选地，在公开的体外方法中，肽或多肽序列、NGT或两者可以在进行糖基化反应之前在一种或多种无细胞蛋白质合成(CFPS)反应混合物中表达。任选地，肽或多肽序列可以在第一CFPS反应混合物中表达，和/或NGT可以在第二CFPS反应混合物中表达，并且该方法可以包括组合第一CFPS反应混合物和第二CFPS反应混合物以对肽或多肽序列进行糖基化。

在公开的体外方法的一些实施方案中，该方法进一步包括使包含N-连接的Glc聚糖的肽与第二糖基转移酶反应，所述第二糖基转移酶是可溶性的并且催化将单糖转移至N-连接的聚糖(任选地，其中单糖是Glc、半乳糖(Gal)、N-乙酰半乳糖胺(GalNAc)、N-乙酰葡糖胺(GlcNAc)、丙酮酸、岩藻糖(Fuc)、唾液酸(Sia)、非标准糖例如包含在C5或C9用叠氮基位置官能化的唾液酸的叠氮基糖、具有炔烃的糖或应变炔烃/烯烃官能团糖(包括叠氮基唾液酸)；具有硫醇或马来酰亚胺基团的糖；脱氧糖；聚乙二醇化的糖；氨基糖；含有天然和/或非天然单体的预组装的寡糖或多糖；氟化糖；及其组合，其中糖基化混合物包含Glc供体、Gal供体、GalNAc供体、GlcNAc供体、丙酮酸供体、岩藻糖供体、唾液酸供体、叠氮基唾液酸供体或其混合物。然后将N-连接的聚糖糖基化以提供包含选自Glc、Gal、GalNAc、GlcNAc、丙酮酸、Fuc和Sia的一个或多个部分的N-连接的聚糖(任选地提供N-连接的右旋糖、N-连接的乳糖或N-连接的Glc-GalNAc)，任选地其中第二寡核苷酸转移酶在进行糖基化之前在无细胞蛋白质合成(CFPS)反应混合物中表达。任选地，肽或多肽序列可以在第一CFPS反应混合物中表达，NGT可以在第二CFPS反应混合物中表达，和/或第二糖基转移酶可以在第三CFPS反应混合物中表达，并且该方法可以包括组合第一CFPS反应混合物、第二CFPS反应混合物和/或第三反应混合物中的两种或更多种以对肽或多肽序列进行糖基化。

在公开的体外方法的一些实施方案中，该方法进一步包括使包含聚糖的肽与第三糖基转移酶反应，该第三糖基转移酶是可溶性的并且催化将单糖转移至N-连接的聚糖(任选地，其中单糖是Glc、Gal、GalNAc、GlcNAc、丙酮酸、Fuc、Sia或非标准糖例如叠氮基糖，其中糖基化混合物包含Glc供体、Gal供体、GalNAc供体、GlcNAc供体、丙酮酸供体、岩藻糖供体、唾液酸供体、叠氮基唾液酸供体、非天然糖供体例如叠氮基糖供体，包括在C5或C9用叠氮基位置官能化的唾液酸的供体，或其混合物，并且其中N-连接的聚糖进一步被选自Glc、Gal、GalNAc、GlcNAc、丙酮酸、Fuc、Sia和非标准糖的一个或多个部分糖基化，非标准糖是例如具有叠氮基、炔烃或应变炔烃/烯烃官能团糖(包括叠氮基唾液酸)的糖；具有硫醇或马来酰亚胺基团的糖；脱氧糖；聚乙二醇化的糖；氨基糖；含有天然和/或非天然单体的预组装的寡糖或多糖；氟化糖；和其他的。然后将N-连接的聚糖进一步糖基化以提供包含选自唾液酸化形式的乳糖(例如，单唾液酸化形式的乳糖，例如3’-唾液酸乳糖、6’-唾液酸乳糖和二唾液酸化形式的乳糖)、岩藻糖基化形式的乳糖(例如，单岩藻糖基化形式的乳糖，例如2’-岩藻糖基乳糖(Glcβ1-4Galα1-2Fuc)和3’-岩藻糖基乳糖(即(Glcβ1-4Galα1-23Fuc)和双岩藻糖基化形式的乳糖)、唾液酸化形式的LacNAc(例如单唾液酸化形式的LacNAc和二唾液酸化形式的LacNAc)、岩藻糖基化形式的LacNAc(例如，单岩藻糖基化形式的LacNAc和双岩藻糖基化形式的LacNAc)、丙酮酸化的乳糖或丙酮酸化的LacNAc以及αGal表位(例如Glcβ1-4Galα1-3Gal或GlcNAcβ1-4Galα1-3Gal)的一种或多种部分的N-连接的聚糖。任选地，肽或多肽序列可以在第一CFPS反应混合物中表达，NGT可以在第二CFPS反应混合物中表达，第二糖基转移酶可以在第三CFPS反应混合物中表达，和/或第三糖基转移酶可以在第四CFPS反应混合物中表达，并且该方法可以包括将第一CFPS反应混合物、第二CFPS反应混合物、第三反应混合物和/或第四反应混合物中的两个或更多个组合以对肽或多肽序列进行糖基化。

用于所公开方法的合适的CFPS反应混合物可以包括原核CFPS反应混合物。在一些实施方案中，合适的CFPS反应混合物可包括原核CFPS反应混合物，所述原核CFPS反应混合物包含由大肠杆菌制备的裂解物。

在一些实施方案中，用于所公开方法的CFPS反应混合物可以包含和/或可以表达所公开的方法中用于糖基化的肽或多肽序列(例如，包含氨基酸基序N-X-S/T的肽或多肽序列或经工程化以包含氨基酸基序N-X-S/T的肽或多肽序列，其中氨基酸基序N-X-S/T并非天然存在于肽或多肽序列中。

在一些实施方案中，所公开的方法可包括和/或可利用细菌NGT，其任选地选自胸膜肺炎放线杆菌(ApNGT)(SEQ ID NO：1)或其具有以下取代Q469A的衍生物、大肠杆菌NGT(EcNGT)(SEQ ID NO：3)、流感嗜血杆菌NGT(HiNGT)(SEQ ID NO：5)、溶血曼海姆菌NGT(MhNGT)(SEQ ID NO：7)、杜雷嗜血杆菌NGT(HdNGT)(SEQ ID NO：9)、海藻百伯史坦菌NGT(BtNGT)(SEQ ID NO：11)、嗜沫聚合杆菌NGT(AaNGT)(SEQ ID NO：13)、小肠结肠炎耶尔森菌NGT(YeNGT)(SEQ ID NO：15)、鼠疫耶尔森菌NGT(YpNGT)(SEQ ID NO：17)和金格金氏杆菌NGT(KkNGT)(SEQ ID NO：19)。任选地，细菌NGT可以是相对于野生型细菌NGT具有一个或多个突变的经修饰的细菌NGT。

在一些实施方案中，所公开的方法可以包括或利用修饰的NGT，例如包含一个或多个突变(例如改变肽受体特异性和/或增加酶周转率的突变)的经修饰的细菌NGT。(参见Song等人,“Production of homogeneous glycoprotein with multisite modificationsby an engineered N-glycosyltransferase mutant,”J.Biol.Chem.,April 5,2017,292,8856-8863，其内容通过引用整体并入全文)。在一些实施方案中，经修饰的细菌NGT是在Q469处具有取代的修饰的ApNGT，例如其中Q469被氨基酸X取代，其中X选自S、T、N、C、G、P、A、I、L、M、V(参见，例如具有Q469A的SEQ ID NO：2)。在一些实施方案中，经修饰的细菌NGT是在F482处具有取代的修饰的EcNGT，其中F482被氨基酸X取代，其中X选自S、T、N、C、G、P、A、I、L、M、V(参见，例如具有F482A的SEQ ID NO：4)。在一些实施方案中，经修饰的细菌NGT是在Q495处具有取代的修饰的HiNGT，其中Q495被氨基酸X取代，其中X选自S、T、N、C、G、P、A、I、L、M、V(参见，例如具有Q495A的SEQ ID NO：6)。在一些实施方案中，经修饰的细菌NGT是在Q469处具有取代的修饰的MhNGT，其中Q469被氨基酸X取代，其中X选自S、T、N、C、G、P、A、I、L、M、V(参见，例如具有Q469A的SEQ ID NO：8)。在一些实施方案中，经修饰的细菌NGT是在Q468处具有取代的修饰的HdNGT，其中Q468被氨基酸X取代，其中X选自S、T、N、C、G、P、A、I、L、M、V(参见，例如具有Q468A的SEQ ID NO：10)。在一些实施方案中，经修饰的细菌NGT是在Q471处具有取代的修饰的BtNGT，其中Q471被氨基酸X取代，其中X选自S、T、N、C、G、P、A、I、L、M、V(参见，例如具有Q471A的SEQ ID NO：12)。在一些实施方案中，经修饰的细菌NGT是在Q468处具有取代的修饰的AaNGT，其中Q468被氨基酸X取代，其中X选自S、T、N、C、G、P、A、I、L、M、V(参见，例如具有Q468A的SEQ ID NO：14)。在一些实施方案中，经修饰的细菌NGT是在F466处具有取代的修饰的YeNGT，其中F466被氨基酸X取代，其中X选自S、T、N、C、G、P、A、I、L、M、V(参见，例如具有F466A的SEQ ID NO：16)。在一些实施方案中，经修饰的细菌NGT是在F466处具有取代的修饰的YpNGT，其中F466被氨基酸X取代，其中X选自S、T、N、C、G、P、A、I、L、M、V(参见，例如具有F466A的SEQ ID NO：18)。在一些实施方案中，经修饰的细菌NGT是在Q474处具有取代的修饰的KkNGT，其中Q474被氨基酸X取代，其中X选自S、T、N、C、G、P、A、I、L、M、V(参见，例如具有Q474A的SEQ ID NO：20)。

在一些实施方案中，所公开的方法可包括和/或可利用具有SEQ ID NO：1、3、5、7、9、11、13、15、17或19中任一个的氨基酸序列或与SEQ ID NO：1、3、5、7、9、11、13、15、17或19中的任一个具有至少50％、60％、70％、80％、90％、95％、96％、97％、98％或99％的序列同一性的糖基转移酶，或第一糖基转移酶是经修饰的细菌N-连接的糖基转移酶(NGT)，其具有SEQ ID NO：2、4、6、8、10、12、14、16、18或20中任一个的氨基酸序列，或与SEQ ID NO：2、4、6、8、10、12、14、16、18或20中的任一个具有至少50％、60％、70％、80％、90％、95％、96％、97％、98％或99％的序列同一性。

在一些实施方案中，用于所公开的方法的CFPS反应混合物可以包括和/或可以表达用于所公开的方法的糖基转移酶，例如α1-6葡萄糖基转移酶、β1-4半乳糖基转移酶或β1-3N-乙酰半乳糖胺转移酶，任选地选自胸膜肺炎放线杆菌α1-6葡萄糖基转移酶(Apα1-6)、淋病奈瑟菌β1-4半乳糖基转移酶LgtB(NgLGtB)、脑膜炎奈瑟菌β1-4半乳糖基转移酶LgtB(NmLGtB)和脆弱拟杆菌β1-3N-乙酰半乳糖胺转移酶(BfGalNAcT)。

在一些实施方案中，用于所公开的方法的CFPS反应混合物可以包括和/或可以表达，CFPS反应混合物可以包括和/或可以表达β1-3N-乙酰葡糖胺转移酶、丙酮酸转移酶、α1-3岩藻糖基转移酶、α1-2岩藻糖基转移酶、α1-4半乳糖基转移酶、α1-3半乳糖基转移酶、α2-6唾液酸转移酶、α2-3,6唾液酸转移酶、α2-3唾液酸转移酶或α2-3,8唾液酸转移酶，任选地选自淋病奈瑟菌β1-3N-乙酰葡糖胺转移酶(NgLgtA)、粟酒裂殖酵母丙酮酸转移酶(SpPvg1)、幽门螺杆菌α1-3岩藻糖基转移酶(HpFutA)、幽门螺杆菌α1-2岩藻糖基转移酶(HpFutC)、脑膜炎奈瑟菌α1-4半乳糖基转移酶(NmLgtC)、牛α1-3半乳糖基转移酶(BtGGTA)、智人α2-6唾液酸转移酶(HsSIAT1)、美人鱼发光杆菌α2-6唾液酸转移酶(PdST6)、鳆发光杆菌α2-6唾液酸转移酶(PlST6)、多杀巴斯德氏菌α2-3,6唾液酸转移酶(PmST3,6)、弧菌属JT-FAJ-16α2-3唾液酸转移酶(VsST3)、明亮发光杆菌α2-3唾液酸转移酶(PpST3)、空肠弯曲杆菌α2-3唾液酸转移酶(CjCST-I)和空肠弯曲杆菌α2-3,8唾液酸转移酶(CjCST-II)。

还公开了包含N-连接的聚糖并通过任何公开的方法制备的肽、多肽或蛋白质。在一些实施方案中，N-连接的聚糖包含选自唾液酸化形式的乳糖(例如，单唾液酸化形式的乳糖，例如3’-唾液酸乳糖、6’-唾液酸乳糖和二唾液酸化形式的乳糖)、岩藻糖基化形式的乳糖(例如，单岩藻糖基化形式的乳糖，例如2’-岩藻糖基乳糖(Glcβ1-4Galα1-2Fuc)和3’-岩藻糖基乳糖(即(Glcβ1-4Galα1-23Fuc)和双岩藻糖基化形式的乳糖)、唾液酸化形式的LacNAc(例如单唾液酸化形式的LacNAc和二唾液酸化形式的LacNAc)、岩藻糖基化形式的LacNAc(例如，单岩藻糖基化形式的LacNAc和双岩藻糖基化形式的LacNAc)、丙酮酸化的乳糖或丙酮酸化的LacNAc以及αGal表位(例如Glcβ1-4Galα1-3Gal或GlcNAcβ1-4Galα1-3Gal)的部分，任选地其中肽、多肽或蛋白质被用作或配制为治疗剂或疫苗。

应用

所公开的技术的应用包括但不限于：(i)糖基转移酶特异性和活性的高通量测试，以选择用于在活细胞中的合成或按需制造的最佳酶变体和组合；(ii)本文所述的经发现的生物合成途径用于糖蛋白的按需合成，其中糖基化酶和靶蛋白均在一锅中合成并且使用糖供体进行补充；(iii)本文所述的经发现的生物合成途径用于在体外或在活大肠杆菌中产生糖蛋白治疗剂、疫苗、诊断剂或分析标准品；(iv)使用本文所述的经发现的生物合成途径在体外或在活大肠杆菌中产生更均质的糖蛋白治疗剂、疫苗、诊断剂或分析标准品；(v)使用在用于体外按需生物制造或用于在活细胞中产生糖蛋白的本工作中描述的体外途径合成用免疫刺激性糖基化结构修饰的疫苗蛋白；(vi)在体外或活细胞中合成具有免疫调节性最小唾液酸基序的过敏疫苗；(vii)使用在用于体外按需生物制造或用于在活细胞中产生糖蛋白的本工作中描述的途径合成用含有唾液酸的聚糖修饰的治疗性蛋白质(包括抗体)；(viii)具有半乳糖-α1,3-半乳糖(α-半乳糖或α-gal)的疫苗的无细胞生物合成；(ix)通过点击已知与T调节细胞上的Siglec受体相互作用的亲脂性基团来简化致耐受性过敏疫苗的产生；和(x)简化从细菌产生聚乙二醇化蛋白质(无纯化的酶以及与所有OTS策略和标准氨基酸化学正交)。

优点

所公开的技术的优点可以包括但不限于以下方面中的一个或多个。本文所述的糖基化途径提供了针对来自通过N-连接的糖基转移酶(NGT)安装的Asn连接的葡萄糖残基的治疗相关的聚糖的几种新的途径。以单糖在细胞质中的NGT安装开始的糖基化途径与现有的化学缀合或寡糖基转移酶糖基化方法相比具有几个优点，因为它们允许在没有真核宿主的情况下对多肽的有效糖基化、跨细胞膜转运、复杂的化学合成或脂质结合的底物和酶。NGT的肽受体特异性也是被充分理解的。最终，这些途径可用于在体外或在活细胞中产生治疗相关的糖蛋白。

目前对可以使用的疫苗蛋白或糖缀合物载体蛋白的多样性有严格的限制，因为大多数蛋白不会引发实质性的免疫反应。通过使用本工作中描述的方法用佐剂聚糖修饰疫苗蛋白，有可能改进现有疫苗或使得能够使用更广泛的疫苗蛋白或糖缀合物载体蛋白。

许多糖蛋白产生系统导致异质性或不想要的糖型。通过定义在不包含内源性糖基化系统的细菌中的糖基化系统或通过定义体外反应条件，这里描述的方法和途径可以实现产生或更均质的糖蛋白治疗剂。

糖蛋白的合理设计和工程改造仍然受限于用于糖蛋白生物合成途径构建的当前方法的通量，这些方法需要对来自活细胞的糖蛋白进行基因操作、表达和分析。发明人的用于蛋白质糖基化途径的合成和原型设计的无细胞平台允许快速测试新的蛋白质糖基化途径。该平台适用于糖基化途径的大规模平行合成和组装、反应条件的轻松操作和自动液体处理。经原型设计后，这些途径可以应用于糖蛋白的体外或体内产生。

尽管无细胞生物合成途径原型设计已经被应用于小分子的合成并且一些单酶糖基化过程已经在体外重现，但这是无细胞生物合成原型设计对多酶蛋白糖基化系统的首次应用。

技术领域

技术领域涉及使用无细胞蛋白质合成开发新型多酶蛋白质糖基化途径。

通过该技术解决的技术问题

用于糖蛋白合成的大多数方法使用真核生物(通常是CHO细胞)体内的天然途径。然而，这些方法导致聚糖异质性，限制生物制造宿主的选择，并对已知严重影响蛋白质特性的糖基化结构提供有限的控制，尤其是对于蛋白质治疗剂。这些限制推动了工程化或合成的糖基化系统的开发，无论是通过真核生物(酵母或CHO细胞)、细菌系统的细胞工程化还是体外的。其中，在细菌中或体外构建的合成的糖基化系统提供了最密切控制糖基化模式和更快速地开发更多样化糖基化模式的机会。细菌宿主的使用还可以实现更具成本效益的生物制造。

已经开发了几种细菌系统来产生蛋白质疫苗或糖基化治疗剂。然而，这些合成的糖基化系统的开发仍然缓慢，因为它需要在活细胞中构建和测试酶的集合(生物合成途径)。因此，细菌中产生的糖基化结构通常局限于可以通过表达自然界中发现的完整操纵子来合成的那些，这严重限制了可以构建的结构的多样性，从而限制了该技术可以用于的应用的多样性。发明人的无细胞糖基化原型设计技术提供了一种快速合成和测试合成糖基化系统的方法。使用该技术，发明人已经发现了几种新的生物合成途径，其可用于在体外或在活细胞中产生糖蛋白治疗剂、疫苗和分析标准品。

与现有工作相比，发明人开发的生物合成途径的一个关键区别因素是他们使用可溶性、高活性的N-连接的糖基转移酶(NGT)来将单个糖安装到蛋白质上，然后将该单个糖精心制作成广泛的治疗相关聚糖。这与大多数现有工作形成对比，这些工作使用寡糖基转移酶(OST)将脂质连接的糖供体整体缀合到蛋白质上。NGT的高活性和可溶性性质为在活细胞或体外合成糖蛋白提供了主要的技术优势。然而，用于修饰异源蛋白质的NGT的使用受到限制，这可能是由于缺乏已知的生物合成途径来精心制作安装到治疗相关的糖基化结构的单个糖。到目前为止，只有一项工作(Keyes等人,Metabolic Engineering,2017)证明了NGT的完全生物合成使用来产生治疗相关的聚糖(聚唾液酸)。发明人的工作提供了多种具有更广泛适用性的新糖基化结构，例如具有免疫刺激性糖基化结构的蛋白质疫苗的产生。

除了在生命系统中产生蛋白质之外，其他人已经使用全化学合成来通过固相肽合成(SPPS)构建确定的糖蛋白。虽然可用于小糖肽，但这种方法对于较大的蛋白质变得更加困难，并且不太可能在商业上可用于产生完整糖蛋白蛋白质。还有一些人使用化学合成来产生确定的聚糖，然后将这些聚糖转移至在细胞中产生的完整蛋白质。事实上，这也已经与用NGT修饰蛋白质结合使用(Lomino等人,Bioorg Med Chem.,2013)。虽然对于商业应用比全化学合成更有前景，但这种方法仍然需要费力且昂贵的化学步骤来产生聚糖。发明人的技术使用酶来直接在蛋白质上构建聚糖，并且适合在活细胞或一锅式无细胞系统中进行总生物合成产生，从而提供了一种更便宜、更具商业可行性的方法。

虽然其他方法已将叠氮基糖掺入细菌中，但其仅将此用于可视化和研究，而非治疗剂的工程化修饰。

商业化

所公开的技术可以以包括但不限于以下的方式商业化。发明人的无细胞平台允许在体外对多酶糖基化系统进行原型设计，从而允许更快速地开发用于蛋白质糖基化的生物合成途径。在发明人的工作中发现的几种途径可以解决关于哺乳动物细胞中糖蛋白的合成的现有问题，因为它们将允许在细菌中产生治疗相关的糖蛋白以用于大规模产生或在体外产生治疗相关的糖蛋白以用于研究或按需合成应用。具体应用领域包括具有抗原性或免疫调节性聚糖的蛋白质疫苗以及具有延长的半衰期或增加的稳定性的蛋白质治疗剂。

价值

所公开的技术的价值包括但不限于以下内容。发明人已经描述了使用无细胞系统来原型设计和发现新的糖基化生物合成途径。生物制药公司可能会授权这项技术来针对他们选择的某些糖蛋白进行无细胞原型设计项目，或者直接使用在这项工作中发现的生物合成途径来在体外或在活细胞中产生具有增强的特性的蛋白质治疗剂和疫苗(特别是在蛋白质治疗剂或疫苗上唾液酸的安装和在蛋白质疫苗上α-半乳糖免疫刺激基序的安装)。在这项工作中发现的生物合成途径的脂质非依赖性性质使它们对于体外或细菌细胞质中糖蛋白治疗剂的合成特别有吸引力。这些高滴度、快速表达系统可以允许糖蛋白治疗剂的开发和更快地和以更低的成本产生。

其它

除非本文另有说明或与上下文明显矛盾，否则本文描述的方法的步骤可以以任何合适的顺序执行。除非本文另有说明或与上下文明显矛盾，否则这些步骤可以重复或反复任意次数以实现期望的目标。

本文描述了本发明的优选方面，包括发明人已知的用于实施本发明的最佳模式。在阅读上述描述后，那些优选方面的变化对于本领域普通技术人员来说将变得明显。发明人期望本领域的普通技术人员适当地采用这种变化，并且发明人打算以不同于本文具体描述的方式来实践本发明。因此，本发明包括在适用法律允许的情况下在所附权利要求中记载的主题的所有修改和等效物。此外，除非本文另有说明或与上下文明显矛盾，否则本发明涵盖其所有可能变化形式的上述要素的任何组合。

实施方案

1.生物合成途径(酶的集合)以及所附手稿中描述的所有糖型的合成模式。

2.通过实施方案1的生物合成途径制备的糖型。

3.实施方案1中的酶途径在活细胞中的表达，特别是以α-gal和唾液酸终止的聚糖的所证明的实施方案。在一些实施方案中，提供了N-连接的葡萄糖和/或N-连接的乳糖。

4.实施方案1中的多肽序列和/或酶作为体外糖基化的手段的用途。

5.使用在任何前述实施方案中描述的生物合成途径的糖蛋白的无细胞生物合成。

6.使用在任何前述实施方案中描述的生物合成途径的以冻干形式的糖蛋白的无细胞生物合成。

7.用于蛋白质糖基化途径的快速原型设计以设计体内生物合成途径的无细胞方法。该方法包括以下步骤中的一个或多个：(i)使用NGT来将引发葡萄糖安装到蛋白质上；(ii)通过混合和匹配富含途径酶的细胞裂解物进行途径在无细胞系统中的组合性组装；(iii)快速体外糖基化途径组装；和(iv)鉴定的用于在体外和体内生产平台中制造糖蛋白的途径的转移。

8.权利要求7的实施方案，其中通过无细胞蛋白质合成在裂解物中富集酶。

9.权利要求7的实施方案，其中通过在裂解物来源菌株中的过表达富集酶。

美国公开申请和专利

US2004/0171826；US2004/0018590；US2004/0230042；US2005/0260729；US2005/0170452；US2005/0208617；US2005/0170452；US2006/0148035；US2006/040353；US2006/0286637；US2006/0177898；US2006/0211085；US2006/0024292；US2006/0024304；US2006/0234345；US2006/0252672；US2006/0257399；US2006/0286637；US2006/0029604；US2006/0034828；US2007/0026485；US2007/0178551；US2007/0178551；US2007/0037248；US2008/0274498；US2008/0199942；US2009/0155847；US2009/0209024；US2010/0279356；US2010/0062516；US2010/0062523；US2010/0021991；US2010/0184143；US2010/0016561；US2011/0053214；US2012/0052530；US2012/0064568；US2013/021706；US2013/0018177；US2014/0194345；US2015/0079633；US2015/0203890；US2015/0152427；US2015/0190492；US2016/0362708；US2016/0068880；US2018/0016612；US2018/0354997；US8703471；和US8999668；其内容通过引用整体并入本文。

国际和外国申请和专利

WO2003056914；WO2004035605；WO2005090552；WO2006102652；WO2006119987；WO2007101862；WO2017117539；WO2007120932；CN105505959；CN107090442；和CN107034202；其内容通过引用整体并入本文。

非专利参考文献

Xu,Y.等人,A novel enzymatic method for synthesis of glycopeptidescarrying natural eukaryotic N-glycans.Chemical Communications 53,9075-9077(2017).

Kong,Y.等人,N-Glycosyltransferase from Aggregatibacter aphrophilussynthesizes glycopeptides with relaxed nucleotide-activated sugar donorselectivity.Carbohydrate Research462,7-12(2018).

Keys,T.G.等人,A biosynthetic route for polysialylating proteins inEscherichia coli.Metabolic Engineering 44,293-301(2017).

Keys,T.G.&Aebi,M.Engineering protein glycosylation inprokaryotes.Current Opinion in Systems Biology 5,23-31(2017).

Cuccui,J.等人,The N-linking glycosylation system from Actinobacilluspleuropneumoniae is required for adhesion and has potential use inglycoengineering.Open biology 7(2017).

Song,Q.等人,Production of homogeneous glycoprotein with multi-sitemodifications by an engineered N-glycosyltransferase mutant.Journal ofBiological Chemistry(2017).

Naegeli,A.等人,Substrate Specificity of Cytoplasmic N-Glycosyltransferase.Journal of Biological Chemistry 289,24521-24532(2014).

Naegeli,A.等人,Molecular analysis of an alternative N-glycosylationmachinery by functional transfer from Actinobacillus pleuropneumoniae toEscherichia coli.The Journal of biological chemistry 289,2170-2179(2014).

Schwarz,F.,Fan,Y.-Y.,Schubert,M.&Aebi,M.Cytoplasmic N-Glycosyltransferase of Actinobacillus pleuropneumoniae Is an Inverting Enzymeand Recognizes the NX(S/T)Consensus Sequence.Journal of Biological Chemistry286,35267-35274(2011).

Jaroentomeechai,T.等人,Single-pot glycoprotein biosynthesis using acell-free transcription-translation system enriched with glycosylationmachinery.Nature Communications 9,2686(2018).

Schoborg,J.A.等人,A cell-free platform for rapid synthesis andtesting of active oligosaccharyltransferases.Biotechnology and bioengineering(2017).

Guarino,C.,&DeLisa,M.P.(2012).A prokaryote-based cell-freetranslation system that efficiently synthesizes glycoproteins.Glycobiology,22(5),596-601.

Lizak,C.,Fan,Y.-Y.,Weber,T.C.&Aebi,M.N-Linked Glycosylation ofAntibody Fragments in Escherichia coli.Bioconjugate chemistry 22,488-496(2011).

Karim,A.S.&Jewett,M.C.A cell-free framework for rapid biosyntheticpathway prototyping and enzyme discovery.Metabolic Engineering 36,116-126(2016).

Huai,G.,Qi,P.,Yang,H.&Wang,Y.I.Characteristics of a-Gal epitope,anti-Gal antibody,a1,3galactosyltransferase and its clinical exploitation(Review).International journal of molecular medicine 37,11-20(2016).

Abdel-Motal,U.M.等人,Increased immunogenicity of HIV-1 p24 and gp120following immunization with gp120/p24 fusion protein vaccine expressingalpha-gal epitopes.Vaccine 28,1758-1765(2010).

Meuris,L.等人,GlycoDelete engineering of mammalian cells simplifiesN-glycosylation of recombinant proteins.Nat Biotech 32,485-489(2014).

前述非专利参考文献的内容通过引用整体并入本文。

图5、6和20中引用的参考文献。

1.Martin,R.W.等人,Cell-free protein synthesis from genomicallyrecoded bacteria enables multisite incorporation of noncanonical aminoacids.Nature Communications 9,1203(2018).

2.Bundy,B.C.&Swartz,J.R.Site-Specific Incorporation of p-Propargyloxyphenylalanine in a Cell-Free Environment for Direct Protein-Protein Click Conjugation.Bioconjugate chemistry 21,255-263(2010).

3.Kightlinger,W.等人,Design of glycosylation sites by rapid synthesisand analysis of glycosyltransferases.Nature Chemical Biology 14,627-635(2018).

4.Ollis,A.A.,Zhang,S.,Fisher,A.C.&DeLisa,M.P.Engineeredoligosaccharyltransferases with greatly relaxed acceptor-sitespecificity.Nature Chemical Biology 10,816-822(2014).

5.Glasscock,C.J.等人,A flow cytometric approach to engineeringEscherichia coli for improved eukaryotic protein glycosylation.MetabolicEngineering 47,488-495(2018).

6.Valentine,Jenny L.等人,Immunization with Outer Membrane VesiclesDisplaying Designer Glycotopes Yields Class-Switched,Glycan-SpecificAntibodies.Cell Chemical Biology 23,655-665(2016).

7.Naegeli,A.等人,Substrate Specificity of Cytoplasmic N-Glycosyltransferase.Journal of Biological Chemistry 289,24521-24532(2014).

8.Schwarz,F.,Fan,Y.-Y.,Schubert,M.&Aebi,M.Cytoplasmic N-Glycosyltransferase of Actinobacillus pleuropneumoniae Is an Inverting Enzymeand Recognizes the NX(S/T)Consensus Sequence.Journal of Biological Chemistry286,35267-35274(2011).

9.Park,J.E.,Lee,K.Y.,Do,S.I.&Lee,S.S.Expression and characterizationof beta-1,4-galactosyltransferase from Neisseria meningitidis and Neisseriagonorrhoeae.Journal of biochemistry and molecular biology 35,330-336(2002).

10.Peng,W.等人,Helicobacter pylori β1,3-N-acetylglucosaminyltransferase for versatile synthesis of type 1 and type 2poly-LacNAcs on N-linked,O-linked and I-antigen glycans.Glycobiology 22,1453-1464(2012).

11.Ramakrishnan,B.&Qasba,P.K.Crystal structure of lactose synthasereveals a large conformational change in its catalytic component,the beta1,4-galactosyltransferase-I.Journal of Molecular Biology 310,205-218(2001).

12.Aanensen,D.M.,Mavroidi,A.,Bentley,S.D.,Reeves,P.R.&Spratt,B.G.Predicted Functions and Linkage Specificities of the Products of theStreptococcus pneumoniae Capsular Biosynthetic Loci.Journal of bacteriology189,7856-7876(2007).

13.Ban,L.等人,Discovery of glycosyltransferases using carbohydratearrays and mass spectrometry.Nature Chemical Biology 8,769-773(2012).

14.Blixt,O.,van Die,I.,Norberg,T.&van den Eijnden,D.H.High-levelexpression of the Neisseria meningitidis lgtA gene in Escherichia coli andcharacterization of the encoded N-acetylglucosaminyltransferase as a usefulcatalyst in the synthesis of GlcNAcβ1→3Gal and GalNAcβ1→3Gallinkages.Glycobiology 9,1061-1071(1999).

15.Higuchi,Y.等人,A rationally engineered yeast pyruvyltransferasePvg1p introduces sialylation-like properties in neo-human-type complexoligosaccharide.Scientific reports 6,26349(2016).

16.Sun,S.,Scheffler,N.K.,Gibson,B.W.,Wang,J.&Munson Jr.,R.S.Identification and Characterization of the N-AcetylglucosamineGlycosyltransferase Gene of Haemophilus ducreyi.Infection and immunity 70,5887-5892(2002).

17.Wang,G.,Ge,Z.,Rasko,D.A.&Taylor,D.E.Lewis antigens in Helicobacterpylori:biosynthesis and phase variation.Molecular Microbiology 36,1187-1196(2000).

18.Persson,K.等人,Crystal structure of the retaininggalactosyltransferase LgtC from Neisseria meningitidis in complex with donorand acceptor sugar analogs.Nature Structural Biology 8,166(2001).

19.Fang,J.等人,Highly Efficient Chemoenzymatic Synthesis of α-Galactosyl Epitopes with a Recombinant α(1→3)-Galactosyltransferase.Journalof the American Chemical Society 120,6635-6638(1998).

20.Hidari,K.I.等人,Purification and characterization of a solublerecombinant human ST6Gal I functionally expressed in Escherichiacoli.Glycoconjugate Journal 22,1-11(2005).

21.Yamamoto,T.Marine Bacterial Sialyltransferases.Marine Drugs 8,2781(2010).

22.Chiu,C.P.C.等人,Structural Analysis of the α-2,3-SialyltransferaseCst-I from Campylobacter jejuni in Apo and Substrate-Analogue BoundForms.Biochemistry 46,7196-7204(2007).

23.Keys,T.G.等人,A biosynthetic route for polysialylating proteins inEscherichia coli.Metabolic Engineering 44,293-301(2017).

24.Kim,D.M.&Swartz,J.R.Efficient production of a bioactive,multipledisulfide-bonded protein using modified extracts of Escherichiacoli.Biotechnology and bioengineering 85,122-129(2004).

前述非专利参考文献的内容通过引用整体并入本文。

举例说明性实施方案

以下实施方案是举例说明性的，并且不应被解释为限制所要求保护的主题的范围。

实施方案1.一种用于在体外对肽或多肽序列进行糖基化的无细胞系统，所述肽或多肽序列包含天冬酰胺残基，并且所述系统包含以下组分：(i)糖基转移酶，其为可溶性N-连接的糖基转移酶(NGT)，其催化将单糖(任选地，其中单糖是葡萄糖(Glc))转移至天冬酰胺残基的氨基以提供N-连接的聚糖，或在无细胞蛋白质合成(CFPS)反应混合物中表达NGT的表达载体；(ii)包含单糖供体(任选地，Glc供体)的糖基化混合物；其中所述肽或多肽序列在体外在所述糖基化混合物中被糖基化以提供包含N-连接的聚糖(任选地N-连接的Glc)的肽或多肽序列。

2.权利要求1的系统，其进一步包含以下组分：(iii)第二糖基转移酶，其是可溶性的并且催化将单糖转移至N-连接的聚糖(任选地，其中单糖是Glc、半乳糖(Gal)、N-乙酰半乳糖胺(GalNAc)、N-乙酰葡糖胺(GlcNAc)、丙酮酸、岩藻糖(Fuc)、唾液酸(Sia))，或在无细胞蛋白质合成(CFPS)反应混合物中表达第二糖基转移酶的表达载体；其中糖基化混合物包含Glc供体、Gal供体、GalNAc供体、GlcNAc供体、丙酮酸供体、岩藻糖供体、唾液酸供体或其混合物，并且其中N-连接的聚糖被选自Glc、Gal、GalNAc、GlcNAc、丙酮酸、Fuc、Sia和叠氮基-Sia的一种或多种部分糖基化(任选地提供N-连接的右旋糖、N-连接的乳糖或N-连接的Glc-GalNAc)。

3.权利要求2的系统，其进一步包含以下组分：(iv)第三糖基转移酶，其是可溶性的并且催化将单糖转移至N-连接的聚糖(任选地，其中单糖是Glc、Gal、GalNAc、GlcNAc、丙酮酸、Fuc、Sia或其组合)，或在无细胞蛋白质合成(CFPS)反应混合物中表达第三糖基转移酶的表达载体；其中糖基化混合物包含Glc供体、Gal供体、GalNAc供体、GlcNAc供体、丙酮酸供体、岩藻糖供体、唾液酸供体或其混合物，并且其中N-连接的聚糖进一步被选自Glc、Gal、GalNAc、GlcNAc、丙酮酸、Fuc、Sia和叠氮基-Sia的一种或多种部分糖基化(任选地以提供包含选自唾液酸化形式的乳糖(例如，单唾液酸化形式的乳糖，例如3’-唾液酸乳糖、6’-唾液酸乳糖和二唾液酸化形式的乳糖)、岩藻糖基化形式的乳糖(例如，单岩藻糖基化形式的乳糖，例如2’-岩藻糖基乳糖(Glcβ1-4Galα1-2Fuc)和3’-岩藻糖基乳糖(即(Glcβ1-4Galα1-23Fuc)和双岩藻糖基化形式的乳糖)、唾液酸化形式的LacNAc(例如单唾液酸化形式的LacNAc和二唾液酸化形式的LacNAc)、岩藻糖基化形式的LacNAc(例如，单岩藻糖基化形式的LacNAc和双岩藻糖基化形式的LacNAc)、丙酮酸化的乳糖或丙酮酸化的LacNAc以及αGal表位(例如Glcβ1-4Galα1-3Gal或GlcNAcβ1-4Galα1-3Gal)的一种或多种部分的N-连接的聚糖)。

4.前述权利要求中任一项的系统，其中所述系统包含无细胞蛋白质合成(CFPS)反应混合物并且在CFPS反应混合物中存在或表达第一糖基转移酶、第二糖基转移酶和第三糖基转移酶中的一种或多种。

5.前述权利要求中任一项的系统，其中所述系统包含一种或多种无细胞蛋白质合成(CFPS)反应混合物并且在CFPS反应混合物中存在或表达第一糖基转移酶、第二糖基转移酶和第三糖基转移酶中的一种或多种，并且将一种或多种CFPS反应混合物组合以提供系统。

6.前述权利要求中任一项的系统，其进一步包含所述肽或多肽序列或表达所述肽或多肽序列的表达载体，任选地其中在无细胞蛋白质合成(CFPS)反应混合物中提供或表达所述肽或多肽序列。

7.前述权利要求中任一项的系统，其中所述CFPS反应混合物是原核CFPS反应混合物。

8.前述权利要求中任一项的系统，其中所述CFPS反应混合物是原核CFPS反应混合物，所述原核CFPS反应混合物包含由大肠杆菌制备的裂解物。

9.前述权利要求中任一项的系统，其中任选地第一糖基转移酶是细菌N-连接的糖基转移酶(NGT)，任选地其中细菌NGT是选自以下的细菌NGT：胸膜肺炎放线杆菌(ApNGT)、大肠杆菌NGT(EcNGT)、流感嗜血杆菌NGT(HiNGT)、溶血曼海姆菌NGT(MhNGT)、杜雷嗜血杆菌NGT(HdNGT)、海藻百伯史坦菌NGT(BtNGT)、嗜沫聚合杆菌NGT(AaNGT)、小肠结肠炎耶尔森菌NGT(YeNGT)、鼠疫耶尔森菌NGT(YpNGT)和金格金氏杆菌NGT(KkNGT)或其经修饰的形式。

10.前述权利要求中任一项的系统，其中第一糖基转移酶是具有SEQ ID NO：1、3、5、7、9、11、13、15、17或19中任一项的氨基酸序列或与SEQ ID NO：1、3、5、7、9、11、13、15、17或19中任一项的氨基酸序列具有至少50％、60％、70％、80％、90％、95％、96％、97％、98％或99％的序列同一性的细菌N-连接的糖基转移酶(NGT)，或第一糖基转移酶是具有SEQ IDNO：2、4、6、8、10、12、14、16、18或20中任一项的氨基酸序列或与SEQ ID NO：2、4、6、8、10、12、14、16、18或20中任一项的氨基酸序列具有至少50％、60％、70％、80％、90％、95％、96％、97％、98％或99％的序列同一性的修饰的细菌N-连接的糖基转移酶(NGT)。

11.前述权利要求中任一项的系统，其中任选地第二糖基转移酶是α1-6葡萄糖基转移酶、β1-4半乳糖基转移酶或β1-3N-乙酰半乳糖胺转移酶，并且任选地其中第二糖基转移酶选自胸膜肺炎放线杆菌α1-6葡萄糖基转移酶(Apα1-6)、淋病奈瑟菌β1-4半乳糖基转移酶LgtB(NgLGtB)、脑膜炎奈瑟菌β1-4半乳糖基转移酶LgtB(NmLGtB)和脆弱拟杆菌β1-3N-乙酰半乳糖胺转移酶(BfGalNAcT)。

12.前述权利要求中任一项的系统，其中任选地第三糖基转移酶是β1-3N-乙酰葡糖胺转移酶、丙酮酸转移酶、α1-3岩藻糖基转移酶、α1-2岩藻糖基转移酶、α1-4半乳糖基转移酶、α1-3半乳糖基转移酶、α2-6唾液酸转移酶、α2-3,6唾液酸转移酶、α2-3唾液酸转移酶或α2-3,8唾液酸转移酶，任选地其中第三糖基转移酶选自淋病奈瑟菌β1-3N-乙酰葡糖胺转移酶(NgLgtA)、粟酒裂殖酵母丙酮酸转移酶(SpPvg1)、幽门螺杆菌α1-3岩藻糖基转移酶(HpFutA)、幽门螺杆菌α1-2岩藻糖基转移酶(HpFutC)、脑膜炎奈瑟菌α1-4半乳糖基转移酶(NmLgtC)、牛α1-3半乳糖基转移酶(BtGGTA)、智人α2-6唾液酸转移酶(HsSIAT1)、美人鱼发光杆菌α2-6唾液酸转移酶(PdST6)、鳆发光杆菌α2-6唾液酸转移酶(PlST6)、多杀巴斯德氏菌α2-3,6唾液酸转移酶(PmST3,6)、弧菌属JT-FAJ-16α2-3唾液酸转移酶(VsST3)、明亮发光杆菌α2-3唾液酸转移酶(PpST3)、空肠弯曲杆菌α2-3唾液酸转移酶(CjCST-I)和空肠弯曲杆菌α2-3,8唾液酸转移酶(CjCST-II)。

13.前述权利要求中任一项的系统，其中所述系统的一个或多个组分处于保存的形式，任选地其中所述系统的一个或多个组分被冷冻干燥。

14.一种包含N-连接的聚糖的肽或多肽序列(任选地使用前述权利要求的任何系统或前述权利要求的系统的组分制备)，所述N-连接的聚糖包含选自以下的部分：唾液酸化形式的乳糖(例如，单唾液酸化形式的乳糖，例如3’-唾液酸乳糖、6’-唾液酸乳糖和二唾液酸化形式的乳糖)、岩藻糖基化形式的乳糖(例如，单岩藻糖基化形式的乳糖，例如2’-岩藻糖基乳糖(Glcβ1-4Galα1-2Fuc)和3’-岩藻糖基乳糖(即(Glcβ1-4Galα1-23Fuc)和双岩藻糖基化形式的乳糖)、唾液酸化形式的LacNAc(例如单唾液酸化形式的LacNAc和二唾液酸化形式的LacNAc)、岩藻糖基化形式的LacNAc(例如，单岩藻糖基化形式的LacNAc和双岩藻糖基化形式的LacNAc)、丙酮酸化的乳糖或丙酮酸化的LacNAc、αGal表位(例如Glcβ1-4Galα1-3Gal或GlcNAcβ1-4Galα1-3Gal)和Glc-Gal-叠氮基-Sia，任选地其中肽或多肽序列被用作或配制为治疗剂或疫苗。

15.一种经修饰的细胞，其包含或表达权利要求1-13的系统的一种或多种组分，任选地其中所述经修饰的细胞是经修饰的细菌细胞。

16.一种用于制备糖基化肽或多肽序列的方法，该方法包括培养权利要求15的经修饰的细胞，其中所述经修饰的细胞包含或表达肽或多肽序列、N-连接的糖基转移酶和任选地一种或多种额外的糖基转移酶，并且肽或多肽序列在经修饰的细菌细胞中被糖基化。

17.一种包含N-连接的聚糖的肽或多肽序列(任选地使用权利要求16的方法制备)，所述N-连接的聚糖包含选自以下的部分：唾液酸化形式的乳糖(例如，单唾液酸化形式的乳糖，例如3’-唾液酸乳糖、6’-唾液酸乳糖和二唾液酸化形式的乳糖)、岩藻糖基化形式的乳糖(例如，单岩藻糖基化形式的乳糖，例如2’-岩藻糖基乳糖(Glcβ1-4Galα1-2Fuc)和3’-岩藻糖基乳糖(即(Glcβ1-4Galα1-23Fuc)和双岩藻糖基化形式的乳糖)、唾液酸化形式的LacNAc(例如单唾液酸化形式的LacNAc和二唾液酸化形式的LacNAc)、岩藻糖基化形式的LacNAc(例如，单岩藻糖基化形式的LacNAc和双岩藻糖基化形式的LacNAc)、丙酮酸化的乳糖或丙酮酸化的LacNAc、αGal表位(例如Glcβ1-4Galα1-3Gal或GlcNAcβ1-4Galα1-3Gal)和Glc-Gal-叠氮基-Sia，任选地其中肽或多肽序列被用作或配制为治疗性蛋白或疫苗。

18.由权利要求15的经修饰的细胞制备的裂解物，任选地其中所述裂解物适用于无细胞蛋白质合成(CFPS)反应。

19.一种用于体外制备糖基化肽或多肽序列的方法，所述方法包括使在包含单糖供体(任选其中单糖供体是葡萄糖(Glc)供体，或者是单糖)的糖基化混合物中的包含天冬酰胺残基的肽或多肽序列与糖基转移酶反应，所述糖基转移酶是催化将单糖(任选地，来自Glc供体的Glc)从单糖供体转移至天冬酰胺残基的氨基以提供N-连接的聚糖(任选地N-连接的Glc)的可溶性N-连接的糖基转移酶(“N-糖基转移酶”，“NGT”)，其中所述肽或多肽序列在体外在所述糖基化混合物中被糖基化以提供包含N-连接的聚糖(任选地N-连接的Glc)的肽或多肽序列，任选地，其中在进行糖基化之前，所述肽或多肽序列、NGT或两者在一种或多种无细胞蛋白质合成(CFPS)反应混合物中表达。

20.权利要求19的方法，其中肽或多肽序列在第一CFPS反应混合物中表达，NGT在第二CFPS反应混合物中表达，并且所述方法包括将第一CFPS反应混合物和第二CFPS反应混合物组合。

21.权利要求19或20的方法，其进一步包括使包含聚糖的肽与第二糖基转移酶反应，所述第二糖基转移酶是可溶性的并且催化将单糖转移至N-连接的聚糖(任选地，其中单糖是Glc、半乳糖(Gal)、N-乙酰半乳糖胺(GalNAc)、N-乙酰葡糖胺(GlcNAc)、丙酮酸、岩藻糖(Fuc)、唾液酸(Sia)或其组合)，其中糖基化混合物包含Glc供体、Gal供体、GalNAc供体、GlcNAc供体、丙酮酸供体、岩藻糖供体、唾液酸供体或其混合物，并且其中N-连接的聚糖被选自Glc、Gal、GalNAc、GlcNAc、丙酮酸、Fuc、Sia和叠氮基-Sia的一个或多个部分糖基化(任选地提供N-连接的右旋糖、N-连接的乳糖或N-连接的Glc-GalNAc)，任选地其中第二寡核苷酸转移酶在进行糖基化之前在无细胞蛋白质合成(CFPS)反应混合物中表达。

22.权利要求21的方法，其中所述肽或多肽序列在第一CFPS反应混合物中表达，所述NGT在第二CFPS反应混合物中表达，并且所述第二糖基转移酶在第三CFPS反应混合物中表达，并且所述方法包括将第一CFPS反应混合物、第二CFPS反应混合物和第三反应混合物中的两种或更多种组合。

23.权利要求21或22的方法，其还包括使包含聚糖的肽与第三糖基转移酶反应，所述第三糖基转移酶是可溶性的并且催化将单糖转移至N-连接的聚糖(任选地，其中单糖是Glc、Gal、GalNAc、GlcNAc、丙酮酸、Fuc或Sia)，其中糖基化混合物包含Glc供体、Gal供体、GalNAc供体、GlcNAc供体、丙酮酸供体、岩藻糖供体、唾液酸供体或其混合物，并且其中N-连接的聚糖进一步被选自Glc、Gal、GalNAc、GlcNAc、丙酮酸、Fuc、Sia、叠氮基-Sia的一个或多个部分糖基化(任选地提供包含选自以下的一个或多个部分的N-连接的聚糖：唾液酸化形式的乳糖(例如，单唾液酸化形式的乳糖，例如3’-唾液酸乳糖、6’-唾液酸乳糖和二唾液酸化形式的乳糖)、岩藻糖基化形式的乳糖(例如，单岩藻糖基化形式的乳糖，例如2’-岩藻糖基乳糖(Glcβ1-4Galα1-2Fuc)和3’-岩藻糖基乳糖(即(Glcβ1-4Galα1-23Fuc)和双岩藻糖基化形式的乳糖)、唾液酸化形式的LacNAc(例如单唾液酸化形式的LacNAc和二唾液酸化形式的LacNAc)、岩藻糖基化形式的LacNAc(例如，单岩藻糖基化形式的LacNAc和双岩藻糖基化形式的LacNAc)、丙酮酸化的乳糖或丙酮酸化的LacNAc以及αGal表位(例如Glcβ1-4Galα1-3Gal或GlcNAcβ1-4Galα1-3Gal)，并且任选地其中在进行糖基化之前第二寡核苷酸转移酶在无细胞蛋白质合成(CFPS)反应混合物中表达。

24.权利要求23的方法，其中所述肽或多肽序列在第一CFPS反应混合物中表达，所述NGT在第二CFPS反应混合物中表达，所述第二糖基转移酶在第三CFPS反应混合物中表达，所述第三糖基转移酶在第四CFPS反应混合物中表达，并且所述方法包括组合第一CFPS反应混合物、第二CFPS反应混合物、第三反应混合物和第四反应混合物中的两种或更多种。

25.权利要求19-24中任一项的方法，其中所述CFPS反应混合物是原核CFPS反应混合物。

26.权利要求19-25中任一项的方法，其中所述CFPS反应混合物是原核CFPS反应混合物，所述原核CFPS反应混合物包含由大肠杆菌制备的裂解物。

27.权利要求19-26中任一项的方法，其中任选地第一糖基转移酶是细菌N-连接的糖基转移酶(NGT)，并且任选地细菌N-连接的糖基转移酶(NGT)是选自以下的细菌NGT：胸膜肺炎放线杆菌(ApNGT)、大肠杆菌NGT(EcNGT)、流感嗜血杆菌NGT(HiNGT)、溶血曼海姆菌NGT(MhNGT)、杜雷嗜血杆菌NGT(HdNGT)、海藻百伯史坦菌NGT(BtNGT)、嗜沫聚合杆菌NGT(AaNGT)、小肠结肠炎耶尔森菌NGT(YeNGT)、鼠疫耶尔森菌NGT(YpNGT)和金格金氏杆菌NGT(KkNGT)或其经修饰的形式。

28.权利要求19-27中任一项的方法，其中第一糖基转移酶是具有SEQ ID NO：1、3、5、7、9、11、13、15、17或19中任一项的氨基酸序列或与SEQ ID NO：1、3、5、7、9、11、13、15、17或19中任一项的氨基酸序列具有至少50％、60％、70％、80％、90％、95％、96％、97％、98％或99％的序列同一性的细菌N-连接的糖基转移酶(NGT)，或第一糖基转移酶是具有SEQ IDNO：2、4、6、8、10、12、14、16、18或20中任一项的氨基酸序列或与SEQ ID NO：2、4、6、8、10、12、14、16、18或20中任一项的氨基酸序列具有至少50％、60％、70％、80％、90％、95％、96％、97％、98％或99％的序列同一性的经修饰的细菌N-连接的糖基转移酶(NGT)。

29.权利要求19-28中任一项的方法，其中任选地第二糖基转移酶是α1-6葡萄糖基转移酶、β1-4半乳糖基转移酶或β1-3N-乙酰半乳糖胺转移酶，并且任选地其中第二糖基转移酶选自胸膜肺炎放线杆菌α1-6葡萄糖基转移酶(Apα1-6)、淋病奈瑟菌β1-4半乳糖基转移酶LgtB(NgLGtB)、脑膜炎奈瑟菌β1-4半乳糖基转移酶LgtB(NmLGtB)和脆弱拟杆菌β1-3N-乙酰半乳糖胺转移酶(BfGalNAcT)。

30.权利要求19-29中任一项的方法，其中任选地第三糖基转移酶是β1-3N-乙酰葡糖胺转移酶、丙酮酸转移酶、α1-3岩藻糖基转移酶、α1-2岩藻糖基转移酶、α1-4半乳糖基转移酶、α1-3半乳糖基转移酶、α2-6唾液酸转移酶、α2-3,6唾液酸转移酶、α2-3唾液酸转移酶或α2-3,8唾液酸转移酶，任选地其中第三糖基转移酶选自淋病奈瑟菌β1-3N-乙酰葡糖胺转移酶(NgLgtA)、粟酒裂殖酵母丙酮酸转移酶(SpPvg1)、幽门螺杆菌α1-3岩藻糖基转移酶(HpFutA)、幽门螺杆菌α1-2岩藻糖基转移酶(HpFutC)、脑膜炎奈瑟菌α1-4半乳糖基转移酶(NmLgtC)、牛α1-3半乳糖基转移酶(BtGGTA)、智人α2-6唾液酸转移酶(HsSIAT1)、美人鱼发光杆菌α2-6唾液酸转移酶(PdST6)、鳆发光杆菌α2-6唾液酸转移酶(PlST6)、多杀巴斯德氏菌α2-3,6唾液酸转移酶(PmST3,6)、弧菌属JT-FAJ-16α2-3唾液酸转移酶(VsST3)、明亮发光杆菌α2-3唾液酸转移酶(PpST3)、空肠弯曲杆菌α2-3唾液酸转移酶(CjCST-I)和空肠弯曲杆菌α2-3,8唾液酸转移酶(CjCST-II)。

31.一种包含通过权利要求19-30中任一项的方法制备的N-连接的聚糖的肽或多肽序列，任选地其中所述N-连接的聚糖包含选自以下的部分：唾液酸化形式的乳糖(例如，单唾液酸化形式的乳糖，例如3’-唾液酸乳糖、6’-唾液酸乳糖和二唾液酸化形式的乳糖)、岩藻糖基化形式的乳糖(例如，单岩藻糖基化形式的乳糖，例如2’-岩藻糖基乳糖(Glcβ1-4Galα1-2Fuc)和3’-岩藻糖基乳糖(即(Glcβ1-4Galα1-23Fuc)和双岩藻糖基化形式的乳糖)、唾液酸化形式的LacNAc(例如单唾液酸化形式的LacNAc和二唾液酸化形式的LacNAc)、岩藻糖基化形式的LacNAc(例如，单岩藻糖基化形式的LacNAc和双岩藻糖基化形式的LacNAc)、丙酮酸化的乳糖或丙酮酸化的LacNAc、αGal表位(例如Glcβ1-4Galα1-3Gal或GlcNAcβ1-4Galα1-3Gal)和Glc-Gal-叠氮基-Sia，任选地其中肽或多肽序列被用作或配制为治疗剂或疫苗。

32.一种通过权利要求19-30中任一项的方法合成并用作或配制为治疗剂或疫苗的蛋白质，任选地其中所述蛋白质包含N-连接的聚糖并且所述N-连接的聚糖包含选自以下的部分：唾液酸化形式的乳糖(例如，单唾液酸化形式的乳糖，例如3’-唾液酸乳糖、6’-唾液酸乳糖和二唾液酸化形式的乳糖)、岩藻糖基化形式的乳糖(例如，单岩藻糖基化形式的乳糖，例如2’-岩藻糖基乳糖(Glcβ1-4Galα1-2Fuc)和3’-岩藻糖基乳糖(即(Glcβ1-4Galα1-23Fuc)和双岩藻糖基化形式的乳糖)、唾液酸化形式的LacNAc(例如单唾液酸化形式的LacNAc和二唾液酸化形式的LacNAc)、岩藻糖基化形式的LacNAc(例如，单岩藻糖基化形式的LacNAc和双岩藻糖基化形式的LacNAc)、丙酮酸化的乳糖或丙酮酸化的LacNAc、αGal表位(例如Glcβ1-4Galα1-3Gal或GlcNAcβ1-4Galα1-3Gal)和Glc-Gal-叠氮基-Sia。

实施例

以下实施例是举例说明性的，并不旨在限制要求保护的主题的范围。

实施例1-用于产生糖蛋白和鉴定糖基化途径的模块化无细胞平台

摘要

糖基化在细胞功能中起重要作用并且赋予蛋白质治疗剂有益的特性。然而，构建生物合成途径来研究和设计蛋白质上的精确聚糖结构仍然是一个瓶颈。在这里，我们报告了通过快速体外混合和表达进行糖基化途径组装(GlycoPRIME)的模块化、多功能无细胞平台。在GlycoPRIME中，通过混合和匹配无细胞合成的糖基转移酶(其可以通过N-糖基转移酶精心设计安装在蛋白质靶标上的葡萄糖引物)来组装糖基化途径。我们通过以下来证明GlycoPRIME：构建了37条推定的蛋白质糖基化途径，创建了23个独特的聚糖基序，其中18个尚未在蛋白质上合成。我们使用选择的途径以在一锅式无细胞系统中合成具有α-半乳糖佐剂基序的蛋白质疫苗候选物，并在糖工程化的大肠杆菌中合成具有最少唾液酸基序的人抗体恒定区。我们预计这些方法和途径将促进糖科学并使新的糖工程化应用成为可能。

A.引言

蛋白质糖基化，即将寡糖附接到氨基酸侧链的酶促过程，是自然界中最丰富和最复杂的翻译后修饰之一^1,2，并且在人健康中起着关键作用¹。糖基化存在于超过70％的蛋白质治疗剂中³，并深刻影响蛋白质稳定性^4,5、免疫原性^6,7和活性⁸。糖基化在生物学中的重要性以及蛋白质上的聚糖结构的有意操纵可以改善治疗特性的证据^4,6,8促使许多努力以研究和工程化蛋白质糖基化结构^9-11。

不幸的是，糖蛋白工程化受到可以在蛋白质以及可用于糖蛋白产生的平台上构建的聚糖结构的数量和多样性的限制^9,12。一个关键的挑战是聚糖在自然界中是由跨多个亚细胞区室的许多糖基转移酶(GT)合成的1，从而使工程化工作复杂化并导致结构异质性^3,12。此外，真核生物中的基本生物合成途径限制了可以在这些系统中进行工程化的聚糖结构的多样性^9,13。细菌糖工程化通过在缺乏内源性糖基化酶的实验室大肠杆菌菌株中表达异源糖基化途径来解决这些限制^13,14。已在细菌细胞^13-17和无细胞系统^18-21中成功重建了几种天冬酰胺(N连接)糖基化途径。特别地，在粗制细胞裂解物中合成蛋白质和代谢物的无细胞系统可以加速酶和生物合成途径的表征和工程化^22-25。基于大肠杆菌的无细胞蛋白质合成(CFPS)系统可以在数小时内产生克/升滴度的复杂蛋白质²⁶，使得能够快速发现、原型设计和优化代谢途径而无需针对每个途径迭代重新工程化生物体^23-25。

然而，现有的无细胞糖蛋白合成平台尚未充分利用该范例，因为它们依赖寡糖基转移酶(OST)来将预构建的糖从脂质连接的寡糖(LLO)转移至蛋白质。OST很难表达，因为它们是完整的膜蛋白，其通常包含多个亚基1。此外，OST的LLO底物特异性限制了可转移至蛋白质的聚糖结构的模块化和多样性²⁷。最后，能够通过OST进行转移的LLO难以在体外合成¹²。事实上，尚未表明LLO生物合成和糖基化可以在体外共同激活，或者LLO可以在细菌CFPS系统中转移和扩展。相反，LLO必须通过活细胞中LLO生物合成途径的表达从细胞裂解物中衍生或预先富集^18-20。在细胞中表达LLO生物合成途径需要耗时的多顺反子操纵子的克隆和调整、细胞转化以及用于每个聚糖结构的新的裂解物的产生。总之，膜相关OST和LLO的复杂性以及OST底物特异性阻碍了糖工程化和多酶糖基化途径的简便构建和筛选¹²。

N-糖基转移酶(NGT)可以通过构建简化的、与OST和LLO无关的蛋白质糖基化途径来克服这些限制^9,16,28。NGT是细胞质细菌酶，其将葡萄糖残基从尿嘧啶二磷酸葡萄糖(UDP-Glc)糖供体转移到天冬酰胺侧链上²⁹。重要的是，NGT是可溶性酶，其可以将葡萄糖引物安装到大肠杆菌细胞质中的蛋白质上^16,17,22。然后可以通过共表达的GT依次精心制作该引物^16,28。基于合成NGT的糖基化系统不受OST底物特异性的限制，并且不需要跨膜蛋白质转运或脂质相关组分⁹。这些系统作为合成糖蛋白(包括治疗剂和疫苗)的补充方法引起了极大的兴趣，使用基于OST的系统很难或不可能产生这些糖蛋白^{9,16,22,28,30-32}。最近的几项进展为实现这一愿景奠定了基础。首先，使用糖蛋白组学和GlycoSCORES技术^17,22,31对NGT的受体特异性进行严格表征揭示NGT修饰了N-X-S/T氨基酸基序。其次，胸膜肺炎放线杆菌(ApNGT)的NGT已被证明可以在体外和在大肠杆菌中修饰真核蛋白质中天然和合理设计的糖基化位点^16,17,22,28。第三，Aebi小组和其他人最近报道了ApNGT将葡萄糖安装到大肠杆菌细胞中的聚唾液酸乳糖²⁸或葡聚糖¹⁶基序上，以及将预构建的噁唑啉官能化的寡糖转移至该葡萄糖残基上的化学酶促方法^30,32。然而，尚未探索使用NGT构建聚糖的其他生物合成途径⁹，可能是由于与在活细胞中建立和测试合成糖基化途径相关的缓慢时间线。基于ApNGT的无细胞合成平台将通过实现合成糖基化途径的高通量和完全体外构建、组装和筛选来加速糖工程化努力。

在此，我们描述了通过快速体外混合和表达进行糖基化途径组装(GlycoPRIME)的模块化、无细胞方法。在这种两锅式方法中，粗制大肠杆菌裂解物通过CFPS表达选择性地富集个体GT，然后以混合和匹配的方式组合以构建多酶糖基化途径。GlycoPRIME的目标是设计、建立、测试和分析多种酶组合，而无需为每种组合制造新的基因构建体、菌株、细胞裂解物或纯化的酶，以发现感兴趣的糖蛋白结构的新生物合成途径(包括许多在自然界中未发现的途径)。然后可以将这些酶组合转移至生物制造系统，例如活细胞，并用于产生和测试糖蛋白。GlycoPRIME的一个关键特征是使用ApNGT将单个N连接的葡萄糖引物位点特异性地安装到蛋白质上，其可以被精心制作为聚糖的多样库。使用ApNGT作为起始糖基化酶移除了针对LLO的OST特异性对聚糖结构的限制，并通过避免在活细胞中的LLO前体上合成聚糖的需要，实现了第一个完全体外的糖基化途径合成和筛选工作流程。

为了验证GlycoPRIME，我们优化了24种细菌和真核生物GT的体外表达，并将它们组合以创建37条推定的生物合成途径，以精心制作通过ApNGT在模型糖蛋白底物上安装的葡萄糖。我们生成了23种独特的聚糖结构，其由1至5个核心糖和更长的重复结构组成。这些途径产生了18种尚未报道的在蛋白质上的聚糖结构，并为治疗相关基序(包括α1-3连接的半乳糖(αGal)表位以及岩藻糖基化和唾液酸化的乳糖或聚N-乙酰乳糖胺(LacNAc))提供了新的生物合成途径。然后，我们证明使用GlycoPRIME鉴定的途径可以通过(i)在一锅式无细胞蛋白质合成驱动的糖蛋白合成(CFPS-GpS)平台中产生具有佐剂αGal聚糖6,7,33的蛋白质疫苗候选物和(ii)在大肠杆菌细胞质中产生具有已知改善体内药代动力学的最小唾液酸聚糖人免疫球蛋白(IgG1)抗体的恒定区(Fc)^5,34来转移至无细胞和细胞生物合成系统。GlycoPRIME方法代表了一种加速多酶糖基化途径的构建和筛选的强大的新方法。通过鉴定可行的合成糖基化途径，我们预计GlycoPRIME将使未来努力能够产生和工程化糖蛋白以用于引人注目的应用，包括基础研究和改进的治疗学。

B.建立体外糖工程化平台

我们将GlycoPRIME建立为模块化的体外蛋白质合成和糖基化平台，以开发生物合成途径，其将通过ApNGT安装的N-连接的葡萄糖引发残基精心制作为多样的糖基化基序，包括唾液酸化和岩藻糖基化形式的乳糖和LacNAc以及αGal表位(图1)。

为了证明概念，我们的目的是在使得能够在我们的GlycoPRIME工作流程中进一步精心制作聚糖的设置中用ApNGT糖基化模型蛋白质。具体来说，我们确定了提供高GT表达滴度的CFPS条件，以便可以将完全糖蛋白转化所需的最小体积的富含GT的裂解物添加到每个体外糖基化(IVG)反应中，从而留下足够的反应体积并产生底物用于通过混合无细胞裂解物的进一步精心制作。基于我们之前对ApNGT受体序列特异性的表征²²，我们选择了一个工程化形式的在内部环处具有一个单一的、优化的糖基化序列GGNWTT的大肠杆菌免疫蛋白Im7(Im7-6)作为我们的模型靶蛋白(图5和图29)。我们使用[14C]-亮氨酸掺入来测量和优化我们的工程化的Im7-6靶标和ApNGT的CFPS反应温度(图6和图2a)，并通过SDS-PAGE放射自显影图确认它们的全长表达(图12和13)。我们发现23℃提供了这些蛋白质的最易溶解的产物，平衡了较高温度下更大的整体蛋白质产率和较低温度下更大的溶解度。我们通过CFPS合成了Im7-6和ApNGT，然后在32μl IVG反应中将这些反应产物与UDP-Glc混合在一起。然后我们使用Ni-NTA官能化磁珠纯化Im7-6底物并进行完整的糖蛋白液相色谱质谱(LC-MS)(参见方法)。我们观察到10μM Im7-6底物(11μl)的几乎完全转化，只有0.4μM ApNGT(1μl)(图2c)，如通过解卷积的蛋白质质谱中162Da(葡萄糖残基的质量)的质量位移所示(理论质量如图7所示)。这表明CFPS产物可以直接组装到IVG反应中以产生糖蛋白，剩余的反应体积用于添加精心设计的GT。

接下来，我们鉴定了具有先前表征的特异性的7个GT，其可用于将ApNGT安装的葡萄糖引物精心制作为相关聚糖(图2和图8)。先前的工作表明，在胸膜肺炎放线杆菌中，通过聚合Apα1-6葡萄糖基转移酶修饰ApNGT安装的葡萄糖以形成N-连接的葡聚糖29，并且这种结构可能是一种有用的疫苗抗原16,35。最近的工作还表明来自脑膜炎奈瑟菌的β1-4半乳糖基转移酶LgtB(NmLgtB)可以修饰大肠杆菌中ApNGT安装的葡萄糖，形成N连接的乳糖(Asn-Glcβ1-4Gal)28。在这里，我们试图在体外重现这些途径，并选择了另外5种具有潜在有用活性的酶(图2a)。我们选择了来自脆弱拟杆菌的N-乙酰半乳糖胺(GalNAc)转移酶(BfGalNAcT)，因为它安装的GalNAc残基36可以作为O-连接聚糖表位的精心制作点。我们还选择了来自肺炎链球菌(SpWchK)、淋病奈瑟菌(NgLgtB)、幽门螺杆菌(Hpβ4GalT)和牛(Btβ4GalT1)的几种β1-4半乳糖基转移酶，以确定N-连接的乳糖的最佳生物合成途径。这很重要，因为乳糖是修饰牛奶寡糖和人N连接的聚糖的末端的许多GT的已知底物1,37-40，使其成为进一步聚糖多样化的关键反应节点。

鉴定后，我们优化了CFPS条件并确认了这7个GT(图2、图6和图12和13)以及来自肺炎链球菌(S.pneumoniae)的SpWchJ(其已知增强SpWchK的活性41)的可溶性全长表达。然后，我们根据先前表征的活性，通过将包含这些GT的CFPS产物与Im7-6和ApNGT CFPS产物以及UDP-Glc和其他合适的糖供体混合来组装IVG反应(图2)。我们观察到与NmLgtB和NgLgtB(β1-4半乳糖基转移酶)、BfGalNAcT(β1-3N-乙酰半乳糖基转移酶)和Apα1-6(聚合α1-6葡萄糖基转移酶)的已知活性一致的胰蛋白酶化糖肽的Im7-6完整质量位移和串联MS(MS/MS)碎片化光谱(图2、图14和图9)。我们没有观察到通过Hpβ4GalT、SpWchK(甚至使用SpWchJ)或Btβ4GalT1(即使使用α-乳清蛋白和有助于二硫键形成的条件)的修饰(图15)。通过测试具有递减量的NmLgtB和NgLgtB的IVG，我们发现2μM的NmLgtB提供几乎完全转化为N-连接的乳糖，而相同量的NgLgtB效率较低(图16)。这些结果表明可以在体外快速合成、组合组装和评估多酶糖基化途径。使用这种方法，我们发现ApNGT和NmLgtB提供了针对N-连接的乳糖的有效的体外途径，并发现ApNGT和BfGalNAcT可以位点特异性地安装GalNAc封端的聚糖。

C.多样糖基化途径的模块化构建

为了证明GlycoPRIME用于模块化途径构建和筛选的能力，我们接下来选择了15个具有已知特异性的GT，这些GT提示它们有能力将通过ApNGT和NmLgtB安装的N-连接的乳糖精心制作成3至5个糖基序的多样库和更长的重复结构(图3和图8)。具体来说，我们试图发现将N-连接的乳糖精心制成9种包含唾液酸(Sia)、半乳糖(Gal)、丙酮酸、岩藻糖(Fuc)和LacNAc的低聚糖的生物合成途径。从那里，我们可以通过以各种方式重新组合这些GT来获得更大的多样性。我们首先描述我们选择这些途径类别的基本原理，包括它们对各种应用的潜在价值，然后展示我们的实验结果。

我们的第一个目标是构建末端为唾液酸的聚糖，因为它们提供了许多有用的特性以用于蛋白质治疗应用^5,8,28,34,42(例如改进的运输、稳定性和药效学)；功能生物材料⁴³；与细菌受体^44,45、人半乳凝集素⁴⁶和siglecs⁴⁷的结合相互作用；以及用于疫苗的佐剂⁴⁸和肿瘤相关碳水化合物抗原(TACA)^49,50。由于末端唾液酸的连接对这些应用很重要，我们选择酶来使用α2-3、α2-6和α2-8键联将Sia安装到N-连接的乳糖上。我们首先构建了3’-唾液酸乳糖(Glcβ1-4Galα2-6Sia)结构，该结构可以提供多种有用的特性，包括与粘附在人体细胞上的病原体受体的特异性结合⁴⁴、将疫苗递送至巨噬细胞以增加抗原呈递⁴⁸以及模拟用于癌症疫苗的人GM3神经节苷脂(神经酰胺-Glcβ1-4Galα2-3Sia)⁵⁰。3’-唾液酸乳糖结构也可以模拟最近报道的GlycoDelete结构(GlcNAcβ1-4Galα2-3Sia)，这是一种已知保留糖蛋白治疗活性和药代动力学的简化的N-聚糖⁵¹。为了构建3’-唾液酸乳糖，我们选择了来自多杀巴斯德氏菌(PmST3,6)、弧菌属物种JT-FAJ-16(VsST3)、明亮发光杆菌(PpST3)和空肠弯曲杆菌(CjCST-I)的四种α2-3唾液酸转移酶。接下来，我们的目标是发现针对6’-唾液酸乳糖(Glcβ1-4Galα2-6Sia)的生物合成途径，因为具有末端α2-6Sia的N-聚糖在分泌的人蛋白质中很常见⁵，表现出抗炎特性8，使得能够靶向B细胞用于治疗淋巴瘤⁵²，并提供一组独特的siglec、凝集素和受体结合特征谱^5,44,47。为了产生6’-唾液酸乳糖，我们选择了来自人(HsSIAT1)、美人鱼发光杆菌(PdST6)和鳆发光杆菌(PlST6)的三种α2-6唾液酸转移酶。最后，我们研究了用于产生具有α2-8Sia的聚糖的途径，这些聚糖可以模拟GD3神经节苷脂(神经酰胺-Glcβ1-4Galα2-3Siaα2-8Sia)，一种TACA和可能的针对黑色素瘤的疫苗表位^49,53。基于先前的工作^28,42，我们选择来自空肠弯曲杆菌的CST-II双功能唾液酸转移酶来安装末端α2-8Sia。除了含有Sia的聚糖外，我们还探索了丙酮酸半乳糖的合成，因为这种结构显示出与Sia相似的凝集素结合特性⁵⁴。为了构建末端的丙酮酸化乳糖，我们选择了来自粟酒裂殖酵母(SpPvg1)的丙酮酸转移酶⁵⁴。

除了末端为Sia的结构之外，我们探索了用Gal、Fuc和LacNAc修饰N-连接的乳糖的途径。例如，我们的目标是工程化一种首创的细菌系统用于用αGal(Glcβ1-4Galα1-3Gal)表位修饰的蛋白质的完全生物合成。αGal是在人中的一种有效的自身:非自身鉴别表位，并且与估计1％的人IgG库结合^6,7,33。因此，当与各种肽、蛋白质、全细胞和基于纳米颗粒的免疫原缔合时，αGal赋予佐剂性质6,7,33,55。为了构建αGal，我们选择了来自牛的α1,3半乳糖基转移酶(BtGGTA)。此外，我们试图合成球二糖(globobiose)结构(Glcβ1-4Galα1-4Gal)，因为它可以模拟Gb3神经节苷脂(神经酰胺-Glcβ1-4Galα1-4Gal)，其可以结合并中和由病原菌分泌的志贺样毒素⁵⁶。我们选择了来自脑膜炎奈瑟菌的半乳糖基转移酶LgtC(NmLgtC)来合成球二糖。我们还旨在构建LacNAc，因为它为生物材料提供了有用的特性⁵⁷以及提供了半乳凝集素的抑制和调节以控制癌症、炎症和纤维化⁵⁸。我们选择了来自淋病奈瑟菌(NgLgtA)和杜克雷嗜血杆菌(HdGlcNAcT)的两种β1-3N-乙酰氨基葡糖(GlcNAc)转移酶来制造这种结构。最后，我们的目标是构建岩藻糖基化乳糖结构，其可应用于用于神经元组织的生物材料⁵⁹以及靶向或防止细菌粘附⁶⁰。为了合成岩藻糖基化乳糖，我们筛选了来自幽门螺杆菌的α1,3和α1,2岩藻糖基转移酶(分别为HpFutA和HpFutC)。

在设计途径和选择GT之后，我们使用GlycoPRIME来合成和组装包含ApNGT、NmLgtB和上述15个GT中的每一个的三酶生物合成途径。我们首先优化并证明了每个GT的全长、可溶性表达(图3a和图6以及图12和13)。然后，我们使用GlycoPRIME工作流来合成Im7-6、ApNGT、NmLgtB和GT以用于在单独的CFPS反应中进行聚糖延伸，然后将这些CFPS产物和适当的糖供体混合以形成IVG反应。值得注意的是，当IVG产物通过Ni-NTA纯化并通过LC-MS(/MS)分析时，我们观察到完整的Im7-6质量位移(图3和图17)和胰蛋白酶化糖肽的碎片化光谱(图18)，根据选择用于精心制作该结构的所有15个GT(除了HdGlcNAcT)的假设活性，这与由ApNGT和NmLgtB安装的N-连接的乳糖的修饰一致(图19)。虽然我们确实通过完整蛋白质和/或糖肽分析检测到来自所有八种唾液酸转移酶的一些活性，但我们发现CjCST-I和PdST6分别提供了所有α2-3和α2-6唾液酸转移酶的最高转化率(图17)。这种优化证明了GlycoPRIME快速比较几种生物合成途径以确定产生所需产物的酶组合的能力。我们还发现，通过在氧化条件下对那些GT进行CFPS，我们可以显著提高包含CjCST-I和HsSIAT1的反应的转化率(图20)。该结果证明了CFPS反应的开放反应环境为改善酶合成(包括具有二硫键的人酶(HsSIAT1)的合成)提供的优势。值得注意的是，我们发现NgLgtA不仅安装了GlcNAc，而且还进而与NmLgtB一起用于形成具有多达6个重复单元的LacNAc聚合物(图3)。除了完整的蛋白质和糖肽LC-MS(/MS)，我们还使用市售外切糖苷酶对通过ApNGT、NmLgtB和PdST6、HsSIAT1、CjCST-I、HpFutA、HpFutC、NgLgtA和BtGGTA修饰的Im7-6进行了消化(图21和22)。我们的发现支持这些酶的先前建立的连接特异性(图2、3和图8)。在这些条件下，我们发现PmST3,6主要表现出α2-3活性，这与之前的报道一致⁶¹。

使用三酶途径证明了多种GT的活性后，我们进一步推动GlycoPRIME系统来评估包含四种和五种酶的生物合成途径。具体而言，我们的目标是使用HpFutA、HpFutC、CjCST-I、PdST6和NgLgtA的组合合成唾液酸化和岩藻糖基化的乳糖和LacNAc结构。与上述构建的较小聚糖相比，这些结构可以在各种应用(包括靶向和抑制人和病原细胞上的半乳凝集素、siglecs和凝集素^44,46,57,58以及通过在树突细胞上安装与DC-SIGN受体结合的Lewis-X聚糖结构辅助疫苗⁶²)中提供更大的特异性。虽然这些GT的一些组合已被用于产生游离寡糖或糖脂^37-40,63-65，但尚未在蛋白质底物的背景下系统地研究由它们的特异性之间的相互作用产生的产物。我们使用GlycoPRIME来测试这五个GT的所有成对组合，在单独的CFPS反应中表达它们中的每一个，然后将这些粗制裂解物中的两种以等体积与含有10μM Im7-6、0.4μMApNGT和2μM NmLgtB的CFPS反应混合。在我们对这些IVG产物的分析中，我们观察到完整的蛋白质(图3d)和糖肽碎片化产物(图23)，表明几种有趣结构(包括双岩藻糖基化乳糖、二唾液酸化乳糖、具有唾液酸化和岩藻糖基化键联的组合的乳糖变体、具有分支或仅末端Sia的唾液酸化LacNAc结构和岩藻糖基化的LacNAc结构)的合成。我们的分析还揭示了酶之间的一些可能的特异性冲突。例如，CjCST-I与HpFutA和PdST6与HpFutC的组合产生被唾液酸化和岩藻糖基化的产物，但PdST6与HpFutC和CjCST-I与HpFutC则没有(图24)。此外，我们观察到，当HpFutC和NgLgtA一起使用时，无论其长度如何，仅将一种岩藻糖添加到LacNAc主链中(图3d和图23)。相反，当HpFutA和NgLgtA结合时，我们的观察表明两种可用的Glc(NAc)残基都可被修饰；然而，较短的聚合物长度表明，使用HpFutA的岩藻糖基化可能阻止LacNAc链通过NgLgtA的持续生长(图3)。虽然我们在这里重点测试所有途径酶同时作用的反应，但使用类似工作流程的体外连续糖基化反应可用于进一步表征这些特异性冲突并严格确定酶动力学。为了测试GlycoPRIME可以支持的生物合成节点的数量，我们使用NgLgtA、一种岩藻糖基转移酶(HpFutA或HpFutC)和一种唾液酸转移酶(CjCST-I或PdST6)构建了几个五酶糖基化途径。虽然这些聚糖的复杂性不允许我们明确指定它们的结构，但来自包含NgLgtA、PdST6和HpFutA或HpFutC的途径的完整蛋白质质量位移(图24)和碎片化光谱(图23)指明了被岩藻糖基化和唾液酸化的LacNAc结构聚糖的构建(图3d和图23和25)。由这些四酶和五酶组合合成的许多聚糖先前没有被描述过，并将需要进一步研究以了解它们提供的功能特性。

D.GlycoPRIME途径在细菌产生系统中起作用

使用GlycoPRIME构建和筛选了许多新的生物合成途径后，我们试图证明我们发现的合成糖基化途径可以在体外和体内生物生产平台内转化为新的背景，以合成治疗相关的糖蛋白(图4)。

首先，我们的目标是将使用我们的两锅式GlycoPRIME系统发现的糖基化途径转化为一锅式、协调的无细胞蛋白质合成驱动的糖蛋白合成(CFPS-GpS)平台。在CFPS-GpS中，靶蛋白在糖供体的存在下与GT共表达，以同时合成和糖基化感兴趣的糖蛋白。通过使得能够在细胞裂解前在体外而不是在底盘菌株内体内表达糖基化途径酶，该策略为我们之前报道的一锅式无细胞糖蛋白合成(CFGpS)平台18提供了一种替代和互补的方法。我们通过混合Im7-6靶蛋白质粒、基于在我们的两锅式GlycoPRIME筛选中开发的12条成功生物合成途径的多达三种GT质粒的组以及在一锅式CFPS-GpS反应中的适当糖供体来验证我们的一锅式CFPS-GpS方法。在所有反应中，我们观察到与用在我们的两锅式系统中观察到的相同聚糖对Im7-6的修饰一致的完整蛋白质质量位移，尽管效率较低(图26)。这些结果表明，在一锅式体外反应中，靶蛋白和GT合成与蛋白质糖基化的共同激活是可能的，与两锅式GlycoPRIME形式相比，进一步简化和缩短了产生糖蛋白所需的时间。总体而言，CFPS-GpS仅使用质粒、市售小分子和未富集的粗制大肠杆菌裂解物来产生糖蛋白，使得能够根据需要或所需的应用，通过简单地添加不同的质粒到单一的粗制裂解物来源来进行不同糖蛋白靶标和/或聚糖结构的通用产生。

在开发了CFPS-GpS方法之后，我们的目标是使用我们使用GlycoPRIME发现的生物合成途径(图4)合成和糖基化具有αGal聚糖基序的流感疫苗候选物H1HA10⁶⁶。我们选择在H1HA10模型蛋白上展示αGal途径，因为H1HA10是一种有效的免疫原，其可以在大肠杆菌中表达，并且αGal的化学酶促安装已被显示可用作其他流感疫苗候选物的有效分子内佐剂^7,67。当我们在一锅式CFPS-GpS反应中组合UDP-Glc、UDP-Gal和编码H1HA10蛋白ApNGT、NmLgtB和BtGGTA的质粒时，我们观察到αGal在H1HA10的N末端处安装在含有工程化受体序列的胰蛋白酶肽上(图4b)。我们通过外切糖苷酶消化和LC-MS/MS进一步证实了这种αGal聚糖的连接(图4c-d和图10)。

为了证明使用GlycoPRIME发现的途径向活细胞的转移，我们设计了合成糖基化系统以将N-连接的3’-唾液酸乳糖和6’-唾液酸乳糖安装到大肠杆菌中人IgG1的Fc区(图4)。虽然已经在工程化大肠杆菌中产生了具有α2,8连接的多唾液酸的糖蛋白²⁸，但这些具有不同末端唾液酸连接和简化、更均质的结构的聚糖可以为糖蛋白治疗的一些应用提供独特和理想的特性^5,8,34,51。为此，我们构建了一个三质粒系统，其由编码脑膜炎奈瑟菌CMP-Sia合酶(ConNeuA)的组成型表达的胞苷-5’-单磷酸-N-乙酰神经氨酸(CMP-Sia)合成质粒；异丙基β-D-1-硫代吡喃半乳糖苷(IPTG)诱导型靶蛋白质粒；以及编码ApNGT、NmLgtB和CjCST-I或PdST6的GT操纵子质粒组成。CMP-Sia合成质粒是必需的，因为实验室大肠杆菌菌株不会内源性产生CMP-Sia。根据之前的报道^28,40，我们选择了一种携带nanT唾液酸转运蛋白基因的K-12大肠杆菌菌株用于摄取补充到培养基中的Sia并敲除CMP-Sia醛缩酶基因(nanA)以防止细胞内Sia的消化，从而产生CLM24ΔnanA。与CFPS-GpS一样，我们使用Im7-6模型蛋白验证了我们的靶聚糖的体内合成。当我们在CLM24ΔnanA中转化和诱导我们的三质粒系统时，我们观察到分别与通过ApNGT用N-连接的Glc修饰Im7-6、通过NmLgtB精心制作成乳糖以及通过CjCST-I或PdST6精心制作成3’-唾液酸乳糖或6’-唾液酸乳糖一致的完整的蛋白质光谱(图27)。为了合成用这些聚糖修饰的Fc，我们将Im7-6靶质粒替换为编码Fc的质粒，其在Asn297(Fc-6)的保守人IgG1糖基化位点处具有工程化受体序列22。在该系统中，我们观察到完整的蛋白质MS、MS/MS肽碎片化和外切糖苷酶消化，这与根据提供的GT操纵子的Glc、乳糖和3’-唾液酸乳糖或6’-唾液酸乳糖在Fc-6上的预期安装一致(图4f-h、图28和图11)。将需要进一步研究以评估αGal表位作为用于H1HA10的佐剂的功效以及Fc上最小唾液酸基序的治疗效果。然而，我们的研究结果清楚地表明，在GlycoPRIME工作流程中鉴定的有用糖基化途径可以快速且轻松地转化为细菌无细胞和基于细胞的表达平台以用于产生治疗相关的糖蛋白。

E.讨论

这项工作建立并证明了GlycoPRIME平台(这是一种用于多酶糖基化途径的模块化合成、组装和发现的无细胞工作流程)的效用。GlycoPRIME有几个关键特性。首先，通过消除活细胞中LLO产生的需要，GlycoPRIME是第一个能够完全在体外生物合成糖基化靶标、GT和糖蛋白的系统。这种方法将设计-构建测试单元从活细胞系转移至无细胞裂解物。我们通过快速探索37条推定的蛋白质糖基化途径证明了GlycoPRIME的效用，其中23条产生了独特的糖基化基序。

其次，使用ApNGT(一种可溶性细菌酶)有效地将引发N-连接葡萄糖安装到糖蛋白上是促进途径组装的关键。通过精心制作这种葡萄糖残基，我们在体外自下而上生成了治疗相关糖基化基序的多样化文库。在这项工作中对于其发现生物合成途径的23个独特糖基化基序中，有几个已合成为游离^37-40,63,64或脂质连接^37,38的寡糖或通过重塑现有的糖蛋白^6,30,42合成；然而，据我们所知，之前只有葡萄糖^16,22,28、葡聚糖¹⁶、乳糖²⁸、LacNAc⁶⁵和聚唾液酸乳糖28已在细菌系统中产生为糖蛋白缀合物。在这项工作中发现的导致蛋白质上的新聚糖基序的18条合成糖基化途径代表了迄今为止通过任何单一细菌糖工程化研究完成的最大的增加。具体来说，我们开发了产生携带N-连接的3’-唾液酸乳糖、6’-唾液酸乳糖、αGal表位、丙酮酸化乳糖、2’-岩藻糖基乳糖(Glcβ1-4Galα1-2Fuc)、3-岩藻糖基乳糖(Glcβ1-4[α1-3Fuc]Gal)，以及许多其他单或双岩藻糖基化和唾液酸化形式的乳糖或LacNAc的蛋白质的第一条细菌生物合成途径。

第三，在GlycoPRIME中鉴定的生物合成途径可以在新的背景中和在用于体外和大肠杆菌细胞质中糖蛋白产生的新蛋白质上实施。具体而言，我们展示了在一锅式CFPS-GpS反应中用αGal佐剂基序修饰的候选疫苗蛋白H1HA10的合成，以及在大肠杆菌中用3’-唾液酸乳糖和6’-唾液酸乳糖修饰的IgG1 Fc的产生(图4)。虽然没有研究大规模产生和纯化方法，但我们的工作显示了将通过GlycoPRIME发现的途径转化为相关生物制造表达系统的可行性。此外，使用ApNGT而不是OST使这些途径具有吸引力，因为它们不需要跨细胞膜的运输或膜相关组分。这些发现证明了GlycoPRIME用于加速糖工程化工作的潜力并与在分布式生物制造系统^21,68,69和具有降低的内毒素水平的大肠杆菌菌株^21,70,71中的最新发展组合实现了在生物技术中的新应用，包括糖蛋白疗法的按需产生。

虽然在这项工作中产生的糖基化结构没有天然人聚糖复杂，但它们仍然提供了许多有前途的应用。潜在应用包括开发用于碳水化合物结合蛋白的基础研究⁴⁴；基于聚糖的细菌靶向⁶⁰、毒素中和⁵⁶和粘附预防^44,45,60；糖蛋白治疗特性和运输的改善^{5,8,28,34,42,52}；功能生物材料的新机遇^43,57,59；人半乳凝集素46和siglecs^46,47的调节和抑制；以及新抗原的开发^49,50,53和用于免疫的佐剂^{6,7,33,48,55,62}的其他研究试剂和成像。尽管游离寡糖或小分子可以实现一些上述功能，但在这项工作中证明的在糖蛋白上位点特异性地构建聚糖的能力将实现广泛的附加功能，包括靶向、抗原呈递、检测、成像和破坏^6,62。值得注意的是，将需要进一步研究以评估通过ApNGT产生的Asn-βGlc连接的免疫原性，其存在仅在哺乳动物系统中报道过一次⁷²。如果这种连接是免疫原性的，这里描述的糖蛋白结构仍然可能在研究、急性治疗应用或免疫中产生重大影响。此外，最近的工作旨在发现或工程化具有放松的糖供体特异性的NGT(例如GlcNAc)^32,73，或将这些NGT变体与乙酰转移酶组合以产生N连接的GlcNAc³²。我们预计这些方法和未来的进步将与这里描述的大多数生物合成途径兼容，因为NmLgtB可以修改Glc或GlcNAc受体³⁹。

展望未来，GlycoPRIME提供了一种发现、研究和优化糖基化途径的新方法。例如，未来的应用可以利用GlycoPRIME的开放和灵活的反应环境来优化酶化学计量以用于更均匀的生物合成，并更好地理解GT特异性和动力学。通过使得能够合成和快速组装产生所需糖蛋白的酶，GlycoPRIME还准备好针对按需和按设计产生糖蛋白进一步扩展糖工程化工具包。例如，将脂质相关聚糖补充到无细胞合成反应中^18-20或在体外产生GalNAcT²²和OST¹⁹的最近报道的方法提供了新的机会来在对GlycoPRIME工作流程进行小修饰的情况下发现产生多样的聚糖(N-和O-连接的)的生物合成途径。最后，通过GlycoPRIME途径可访问的多样但简单的聚糖组可有助于阐明提供所需糖蛋白特性的最小基序。总而言之，我们预计这项工作中描述的GlycoPRIME和生物合成途径将加速细菌系统中糖蛋白的工程化，有助于融合糖科学和合成生物学团体。

F.方法

质粒构建和分子克隆。本研究中使用的质粒的细节和来源以适用的数据库登录号示于图5。在质粒背景下的完整编码序列区显示在图29中。编码CFPS中糖基化靶标和GT的密码子优化DNA序列由Twist Bioscience、Integrated DNA Technologies或LifeTechnologies合成为基因片段或完整质粒。根据标准分子生物学技术，使用聚合酶链反应(PCR)扩增和Gibson组装将基因片段插入卡那霉素抗性pJL1²²体外表达载体中的NdeI和SalI限制位点之间⁷⁴。一些GT是用N末端CAT-Strep-Linker(CSL)融合序列产生的，该序列已显示增加体外表达²²(见图29)。用于在CLM24ΔnanA大肠杆菌菌株中表达Im7-6和Fc-6糖基化靶标的质粒是通过来自pJL1.Im7-6和pJL1.Fc-6的携带优化的ApNGT糖基化受体序列和His标签的工程化形式的Im7(Im7-6)和Fc(Fc-6)的聚合酶链反应(PCR)扩增产生的²²。然后使用Gibson组装将这些基因片段置于具有在NcoI和HindIII限制性位点之间的IPTG诱导性表达和羧苄青霉素抗性的pBR322(ptrc99)主链75中。用于在大肠杆菌中表达GT操纵子的质粒是通过从它们的pJL1质粒形式PCR扩增ApNGT、NmLgtB和CjCST-I或PdST6，然后Gibson组装成具有NcoI和HindIII限制性位点之间的阿拉伯糖诱导性表达、pBBR1复制起点和甲氧苄氨嘧啶抗性的pMAF10主链²²构建的。将使用RBS Calculator v2.076设计以用于最大翻译起始率的Strep-II标签、FLAG标签和核糖体结合位点插入到这些质粒中，如图5和29所示。用于在大肠杆菌中产生CMP-Sia的pCon.NeuA质粒是通过从pTF77 PCR扩增NeuA随后Gibson组装成具有卡那霉素抗性并用P32100启动子修饰以用于在NsiI和SalI限制位点之间的组成性表达的pConYCG主链产生的。

用于CFPS的细胞提取物的制备。糖基化酶和靶蛋白的CFPS使用来自使用成熟的方法制备的最近描述的高产率MG1655衍生大肠杆菌菌株C321.ΔA.75926的粗制大肠杆菌裂解物进行^22,26。简而言之，大肠杆菌细胞的1升培养物在2xYTPG培养基(酵母提取物10g/l、胰蛋白胨16g/l、NaCl 5g/l、K₂HPO₄ 7g/l、KH₂PO₄ 3g/l和葡萄糖18g/l，pH7.2)中在2.5升Tunair烧瓶中在34℃下在以250r.p.m振荡的情况下从OD₆₀₀＝0.08开始生长。在OD₆₀₀＝3.0时在冰上收获细胞，并将其通过在5,000xg在4℃下离心15分钟沉淀。细胞沉淀用冷S30缓冲液(10mM Tris-乙酸盐pH 8.2、14mM乙酸镁、60mM乙酸钾、2mM二硫苏糖醇[DTT])洗涤3次，然后在液氮上冷冻，然后储存在-80℃。细胞沉淀在冰上解冻并重新悬浮于每克湿细胞重量0.8ml的S30缓冲液中，并使用Q125 Sonicator(Qsonica)使用三个脉冲(50％振幅，45秒开启和59秒关闭)在冰上裂解在1.4ml等分试样中。超声处理后，向每个等分试样加入4μl的1MDTT。每个等分试样在12,000xg和4℃下离心10分钟。上清液以250r.p.m在37℃下孵育1小时，并以10,000xg在4℃离心10分钟。然后将澄清的S12裂解上清液在液氮上冷冻并储存在-80℃。

无细胞蛋白质合成。糖基化靶标和GT的CFPS是使用良好建立的PANOx-SP粗制裂解液系统26进行的。简而言之，CFPS反应包含各0.85mM的GTP、UTP和CTP；1.2mM ATP；170μg/ml的大肠杆菌tRNA混合物；34μg/ml亚叶酸；16μg/ml纯化的T7 RNA聚合酶；2mM的20种标准氨基酸中的每一种；0.27mM辅酶A(CoA)；0.33mM烟酰胺腺嘌呤二核苷酸(NAD)；1.5mM亚精胺；1mM腐胺；4mM草酸钠；130mM谷氨酸钾；12mM谷氨酸镁；10mM谷氨酸铵；57mM HEPES，pH＝7.2；33mM磷酸烯醇丙酮酸(PEP)；在pJL1载体中编码所需蛋白质的13.3μg/ml DNA质粒模板；和27％v/v的大肠杆菌粗制裂解物。大肠杆菌总tRNA混合物(来自MRE600菌株)和磷酸烯醇丙酮酸购自Roche Applied Science。ATP、GTP、CTP、UTP、20种氨基酸和其他材料购自Sigma-Aldrich。使用ZymoPURE Midi试剂盒(Zymo Research)从DH5-α大肠杆菌菌株(NEB)纯化用于CFPS的质粒DNA。在有助于二硫键形成的氧化条件下的CFPS反应与标准CFPS反应类似地进行，不同之处在于使用裂解物与14.3μM IAM的30分钟预孵育并添加4mM氧化的L-谷胱甘肽GSSG、1mM还原的L-谷胱甘肽和3μM纯化的大肠杆菌DsbC到CFPS反应78。所有蛋白质均在2.0ml离心管中的15μl批次CFPS反应中表达。对于GlycoPRIME，CFPS反应在每种蛋白质的优化温度下孵育20小时(图6)。

无细胞蛋白质合成驱动的糖蛋白合成。一锅式CFPS-GpS与CFPS类似地进行，不同之处在于CFPS-GpS反应具有50μl的总体积，并补充有2.5mM的每个合适的活化的糖供体以及来自所需靶蛋白的多个质粒模板和最多三个GT。CFPS-GpS反应包含10nM的总质粒浓度，其在反应中的每个独特质粒之间均分。CFPS-GpS反应在23℃下孵育24h，然后通过Ni-NTA磁珠针对糖肽进行纯化，或通过LC-MS进行完整蛋白质分析。

CFPS产率的定量。GlycoPRIME的糖基化靶标和GT的CFPS产率是通过使用已建立的方案在标准CFPS反应中补充10μM[¹⁴C]-亮氨酸来确定的^22,26。简而言之，沉淀CFPS中产生的蛋白质和使用5％三氯乙酸(TCA)洗涤3次然后通过Microbeta2液体闪烁计数器对掺入的放射性进行定量。从在4℃下以12,000xg离心15分钟后分离的级分确定可溶性产率。在不含质粒模板的CFPS反应中测量低水平的背景放射性，并将其在计算蛋白质产率之前减去。

CFPS反应产物的放射自显影图。根据已建立的方法²²，在GlycoPRIME中使用酶和Im7-6靶标的可溶部分的放射自显影图。简而言之，使用MOPS缓冲液、使用4-12％Bolt Bis-Tris Plus SDS-PAGE凝胶(Invitrogen)分离CFPS反应前补充10μM[14C]-亮氨酸并在CFPS反应后在4℃以12,000xg离心15分钟的2μl CFPS反应。凝胶使用InstantBlue(Expedeon)染色、成像，然后在玻璃纸膜之间干燥过夜，然后暴露于Storage Phosphor Screen(GEHealthcare)72小时。Phosphor Screen使用Typhoon FLA7000成像仪(GE Healthcare)成像，并且干燥的凝胶使用GelDoc XR+Imager(Bio-Rad)成像，以帮助与分子量标准阶梯对齐。SDS-PAGE和放射自显影凝胶图像分别使用Image Lab软件6.0.0版和Typhoon FLA7000控制软件1.2版Build 1.2.1.93获得。

体外糖基化反应。GlycoPRIME的IVG反应从含有Im7-6靶蛋白的已完成的CFPS反应的上清液在标准的0.2ml管中组装，并且指示的GT在4℃下以12,000xg离心10分钟。通过[¹⁴C]-亮氨酸掺入对靶标和酶产率进行定量和优化(图6)。标准IVG反应包含10μM Im7-6靶标、指示的量的形成推定的生物合成途径的多达5个GT、10mM MnCl2(以提供用于NmLgtB和其他GT的首选金属辅因子)、23mM HEPES缓冲液(pH＝7.5)和2.5mM的每种所需的核苷酸活化糖供体(根据图8中显示的先前表征的活性)。每个反应包含32μl的总体积，其中有25μl的已完成的CFPS反应(必要时，剩余的CFPS反应体积由已合成sfGFP的已完成的CFPS反应填充)。组装后，包含多达两个GT的IVG反应在30℃下孵育24小时。为了提高转化率，将含有超过两个GT的IVG反应在30℃下孵育24小时，补充额外2.5mM的每种活化的糖供体，然后孵育另外24小时。当需要时，CFPS反应和IVG都可以在它们各自的孵育步骤后快速冷冻。孵育后，使用磁性His-标签Dynabeads(Thermo Fisher Scientific)从IVG反应纯化Im7-6。IVG反应在90μl缓冲液1(50mM NaH2PO4和300mM NaCl，pH8.0)中稀释，并在4℃下以12,000xg离心10分钟。将此上清液在滚筒上在室温下与已用120μl缓冲液1平衡的20μl珠子孵育10分钟。然后用120μl缓冲液1将珠子洗涤3次，然后使用具有500mM咪唑的70μl缓冲液1洗脱。使用3.5kDa MWCO微透析盒(Pierce)将样品针对缓冲液2(12.5mM NaH2PO4和75mM NaCl，pH7.5)透析过夜。一锅式CFPS-GpS反应的纯化与IVG反应类似地完成。

从活大肠杆菌产生糖蛋白。构建大肠杆菌菌株CLM24ΔnanA(基因型W3110 ΔwecAΔnanA ΔwaaL::kan)以实现细胞质中唾液酸的摄取和存活以用于在体内产生唾液酸化糖蛋白。CLM24ΔnanA是使用来源于Keio集合⁷⁹的wecA::kan、nanA::kan和waaL::kan等位基因以该顺序的P1转导从W3110中产生的。在连续转导之间，使用pE-FLP去除卡那霉素标记⁸⁰。如所示的，CLM24ΔnanA依次用CMP-Sia产生质粒pCon.NeuA；靶蛋白质粒pBR322.Im7-6或pBR322.Fc-6；和GT操纵子质粒pMAF10.NGT、pMAF10.ApNGT.NmLgtB、pMAF10.CjCST-I.NmLgtB.ApNGT或pMAF10.PdST6.NmLgtB.ApNGT通过在每个步骤中用适当的抗生素分离个体克隆进行转化。然后将完整的菌株用于接种含有适当抗生素的LB培养基中的5ml过夜培养物，然后将其以OD₆₀₀＝0.08继代培养到5ml新鲜的LB培养基中，该培养基补充有5mM购自Carbosynth的N-乙酰神经氨酸(唾液酸)并使用NaOH和HCl调节至pH＝6.0。然后将该培养物在37℃下在以250r.p.m.的振荡的情况下生长。通过在OD₆₀₀＝0.4下用0.2％阿拉伯糖补充培养物来诱导GT操纵子表达，然后在OD600＝1.0下用1mM IPTG诱导靶蛋白表达。IPTG诱导后，培养物在28℃和250r.p.m下生长过夜。通过在4℃下以4,000xg离心10分钟使细胞沉淀，在液氮中冷冻，并在-80℃下储存。将细胞沉淀解冻并重新悬浮于630μl含有5mM咪唑并补充有70μl的10mg/ml溶菌酶(Sigma)、1μl(250U)Benzonase(Millipore)和7μl 100X Halt蛋白酶抑制剂(Thermo Fisher Scientific)的缓冲液1中。解冻和重新悬浮15分钟后，将细胞在冰上孵育15-60分钟，以50％振幅超声处理45秒，然后以12,000xg离心15分钟。然后将上清液与已用缓冲液1中的5mM咪唑预平衡的50μl His-标签Dynabeads一起在室温下在滚筒上孵育10分钟。然后将珠子用1ml的含有5mM咪唑的缓冲液1洗涤3次，然后用70μl的含有500mM咪唑的缓冲液1通过在滚筒上在室温孵育10分钟进行洗脱。然后在用于LC-MS的糖肽或糖蛋白处理和分析之前，用3.5kDa MWCO微透析盒针对缓冲液2透析样品过夜。

糖蛋白修饰的LC-MS分析。通过将5μl(或约5pmol)His-标签纯化、透析的糖蛋白注射到配备有具有与Impact-II UHR TOF质谱仪(Bruker Daltonics,Inc.)偶联的相同填料的10mm保护柱(186004495 Waters Corp.)的ACQUITY UPLC Peptide BEH C4柱，

1.7μm，2.1mm X 50mm(186004495 Waters Corp.)的Bruker Elute UPLC中通过LC-MS确定完整糖蛋白靶标的修饰。注射前，Fc样品用50mM DTT还原。液相色谱使用100％H2O和0.1％甲酸作为溶剂A和100％乙腈和0.1％甲酸作为溶剂B以0.5mL/min的流速和50℃的柱温进行。在从20％到50％B的4分钟梯度期间洗脱感兴趣的蛋白质之前，将20％B的初始条件保持1分钟。通过在71.4％B下0.5分钟、0.1分钟梯度至100％B、在100％B下洗涤2分钟、0.1分钟梯度至20％B和然后在20％B下保持2.2分钟来洗涤和平衡柱子，总共运行10分钟。使用100-3000m/z的MS扫描范围和2Hz的光谱速率。在数据收集之前进行外部校准。

糖肽修饰的LC-MS分析。用于LC-MS(/MS)分析的糖肽是通过用0.0044μg/μl MS级胰蛋白酶(Thermo Fisher Scientific)在37℃下将His标签纯化的经透析的糖基化靶标消化过夜制备的。注射前，通过与10mM DTT孵育2小时来减少H1HA10样品。LC-MS(/MS)通过将2μl(或约2pmol)的经消化的糖肽注射到配备有具有与Impact-II UHR TOF质谱仪偶联的相同填料的10mm保护柱(186004629 Waters Corp.)的ACQUITY UPLC Peptide BEH C18柱，

1.7μm，2.1mm X 100mm(186003686 Waters Corp.)的Bruker Elute UPLC中来进行LC-MS(/MS)。液相色谱使用100％H2O和0.1％甲酸作为溶剂A和100％乙腈和0.1％甲酸作为溶剂B以0.5mL/min的流速和40℃的柱温进行。将0％B的初始条件保持1分钟，然后在4分钟梯度至50％B的过程中洗脱感兴趣的肽。通过0.1分钟梯度至100％B、在100％B下洗涤2分钟、0.1分钟梯度至0％B和然后在0％B下保持1.8分钟来洗涤和平衡柱子，总共运行9分钟。进行糖肽的LC-MS/MS以确认GT修饰符合先前表征的特异性。伪多反应监测(MRM)MS/MS碎片化被靶向至对应于检测到的完整蛋白质MS峰的理论糖肽质量。使用30eV的碰撞能量将所有糖肽碎片化，其中使用从靶m/z值的±2m/z的窗口。源自预期糖基化结构的理论蛋白质、肽和糖离子质量显示于图7和9-11。对于糖肽的LC-MS和LC-MS/MS，使用具有8Hz的光谱速率的100-3000m/z的扫描范围。在数据收集之前进行外部校准。

外切糖苷酶消化。在可能的情况下，使用来自New England Biolabs的具有充分表征的活性的市售酶通过外切糖苷酶消化确认由各种GT和生物合成途径安装的糖键联。如图和图例所示，使用制造商建议的缓冲液和消化条件，将糖蛋白或糖肽与外切糖苷酶在37℃下孵育至少4小时。本研究中使用的外切糖苷酶和相关产品编号为：β1-4半乳糖苷酶S(P0745S)；α1-3,6半乳糖苷酶(P0731S)；α1-3,4岩藻糖苷酶(P0769S)；和α1-2岩藻糖苷酶(P0724S)；α1-3,4,6半乳糖苷酶(P0747S)；β-N-乙酰葡糖胺苷酶S(P0744S)；α2-3神经氨酸酶S(P0743S)；和α2-3,6,8神经氨酸酶(P0720S)。

LC-MS(/MS)数据分析。LC-MS(/MS)数据使用Bruker Compass Hystar v4.1收集并使用Bruker Compass Data Analysis v4.1(Bruker Daltonics,Inc.)进行分析。糖肽MS和完整糖蛋白MS光谱在糖基化和非糖基化糖型的整个洗脱时间进行平均(通过理论糖肽和糖蛋白电荷状态的提取的离子光谱图确定)。然后通过从100-2,000的完整m/z扫描范围到对于Im7-6样品的10,000-14,000Da或对于Fc-6样品的27,000-29,000Da的质量范围的数据分析最大熵解卷积分析完整糖蛋白的MS光谱。选择来自MRM碎片化的代表性LC-MS/MS光谱并手动注释。观察到的糖肽m/z和完整蛋白质解卷积质量在图中注释，理论值显示在图7和9-11中。LC-MS(/MS)数据从Bruker Compass Data Analysis导出并在Microsoft Excel 365中绘制。

统计信息。图例指示每个实验的平均值、标准偏差(误差条)和代表性数据的确切样品数。本研究中未使用统计显著性的测试或动物受试者。

数据可用性。本研究期间生成或分析的所有数据均包括在内，或可应合理要求从发明人处获得。作为图6中报告的平均值的基础的源数据作为源数据文件提供，可在Kightlinger等人,Nature Communications,10,Article No.5404(Nov.27,2019)获得，其通过引用整体并入本文。

G.实施例1中引用的参考文献

1.Helenius,A.&Aebi,M.Intracellular functions of N-linkedglycans.Science(New York,N.Y.)291,2364-2369(2001).

2.Khoury,G.A.,Baliban,R.C.&Floudas,C.A.Proteome-wide post-translational modification statistics:frequency analysis and curation of theswiss-prot database.Scientific reports 1,90(2011).

3.Sethuraman,N.&Stadheim,T.A.Challenges in therapeutic glycoproteinproduction.Current Opinions in Biotechnology 17,341-346(2006).

4.Elliott,S.等人,Enhancement of therapeutic protein in vivoactivities through glycoengineering.Nature Biotechnology 21,414-421(2003).

5.Varki,A.Sialic acids in human health and disease.Trends inmolecular medicine 14,351-360(2008).

6.Abdel-Motal,U.M.等人,Increased immunogenicity of HIV-1 p24 andgp120 following immunization with gp120/p24 fusion protein vaccine expressingalpha-gal epitopes.Vaccine 28,1758-1765(2010).

7.Abdel-Motal,U.M.,Guay,H.M.,Wigglesworth,K.,Welsh,R.M.&Galili,U.Immunogenicity of influenza virus vaccine is increased by anti-gal-mediatedtargeting to antigen-presenting cells.Journal of virology 81,9131-9141(2007).

8.Lin,C.-W.等人,A common glycan structure on immunoglobulin G forenhancement of effector functions.Proceedings of the National Academy ofSciences USA 112,10611-10616(2015).

9.Keys,T.G.&Aebi,M.Engineering protein glycosylation inprokaryotes.Current Opinion in Systems Biology 5,23-31(2017).

10.Li,H.等人,Optimization of humanized IgGs in glycoengineered Pichiapastoris.Nature Biotechnology 24,210-215(2006).

11.Yang,Z.等人,Engineered CHO cells for production of diverse,homogeneous glycoproteins.Nature Biotechnology 33,842-844(2015).

12.Wang,L.-X.&Amin,M.N.Chemical and Chemoenzymatic Synthesis ofGlycoproteins for Deciphering Functions.Chemistry&Biology 21,51-66(2014).

13.Valderrama-Rincon,J.D.等人,An engineered eukaryotic proteinglycosylation pathway in Escherichia coli.Nature Chemical Biology 8,434-436(2012).

14.Wacker,M.等人,N-linked glycosylation in Campylobacter jejuni andits functional transfer into E.coli.Science(New York,N.Y.)298,1790-1793(2002).

15.Feldman,M.F.等人,Engineering N-linked protein glycosylation withdiverse O antigen lipopolysaccharide structures in Escherichiacoli.Proceedings of the National Academy of Sciences of the United States ofAmerica 102,3016-3021(2005).

16.Cuccui,J.等人,The N-linking glycosylation system fromActinobacillus pleuropneumoniae is required for adhesion and has potentialuse in glycoengineering.Open biology 7(2017).

17.Naegeli,A.等人,Molecular analysis of an alternative N-glycosylation machinery by functional transfer from Actinobacilluspleuropneumoniae to Escherichia coli.Journal of Biological Chemistry 289,2170-2179(2014).

18.Jaroentomeechai,T.等人,Single-pot glycoprotein biosynthesis usinga cell-free transcription-translation system enriched with glycosylationmachinery.Nature Communications 9,2686(2018).

19.Schoborg,J.A.等人,A cell-free platform for rapid synthesis andtesting of active oligosaccharyltransferases.Biotechnology and bioengineering(2017).

20.Guarino,C.&DeLisa,M.P.A prokaryote-based cell-free translationsystem that efficiently synthesizes glycoproteins.Glycobiology 22,596-601(2012).

21.Stark,J.C.等人,On-demand,cell-free biomanufacturing of conjugatevaccines at the point-of-care.Preprint at https://www.biorxiv.org/content/biorxiv/early/2019/2006/2024/681841.full.pdf(2019).

22.Kightlinger,W.等人,Design of glycosylation sites by rapidsynthesis and analysis of glycosyltransferases.Nature Chemical Biology 14,627-635(2018).

23.Karim,A.S.&Jewett,M.C.A cell-free framework for rapid biosyntheticpathway prototyping and enzyme discovery.Metabolic Engineering 36,116-126(2016).

24.Dudley,Q.M.,Anderson,K.C.&Jewett,M.C.Cell-Free Mixing ofEscherichia coli Crude Extracts to Prototype and Rationally Engineer High-Titer Mevalonate Synthesis.ACS synthetic biology 5,1578-1588(2016).

25.Dudley,Q.M.,Karim,A.S.&Jewett,M.C.Cell-free metabolic engineering:Biomanufacturing beyond the cell.Biotechnology journal 10,69-82(2015).

26.Martin,R.W.等人,Cell-free protein synthesis from genomicallyrecoded bacteria enables multisite incorporation of noncanonical aminoacids.Nature Communications 9,1203(2018).

27.Napiórkowska,M.等人,Molecular basis of lipid-linkedoligosaccharide recognition and processing by bacterial oligosaccharyltransferase.Nature Structural and Molecular Biology 24,1100(2017).

28.Keys,T.G.等人,A biosynthetic route for polysialylating proteins inEscherichia coli.Metabolic Engineering 44,293-301(2017).

29.Schwarz,F.,Fan,Y.-Y.,Schubert,M.&Aebi,M.Cytoplasmic N-Glycosyltransferase of Actinobacillus pleuropneumoniae Is an Inverting Enzymeand Recognizes the NX(S/T)Consensus Sequence.Journal of Biological Chemistry286,35267-35274(2011).

30.Lomino,J.V.等人,A two-step enzymatic glycosylation of polypeptideswith complex N-glycans.Bioorganic&Medicinal Chemistry 21,2262-2270(2013).

31.Song,Q.等人,Production of homogeneous glycoprotein with multi-sitemodifications by an engineered N-glycosyltransferase mutant.Journal ofBiological Chemistry(2017).

32.Xu,Y.等人,A novel enzymatic method for synthesis of glycopeptidescarrying natural eukaryotic N-glycans.Chemical Communications 53,9075-9077(2017).

33.Phanse,Y.等人,A systems approach to designing next generationvaccines:combining alpha-galactose modified antigens with nanoparticleplatforms.Scientific reports 4,3775(2014).

34.Bork,K.,Horstkorte,R.&Weidemann,W.Increasing the sialylation oftherapeutic glycoproteins:The potential of the sialic acid biosyntheticpathway.Journal of Pharmaceutical Sciences 98,3499-3508(2009).

35.Passmore,I.J.,Andrejeva,A.,Wren,B.W.&Cuccui,J.Cytoplasmicglycoengineering of Apx toxin fragments in the development of Actinobacilluspleuropneumoniae glycoconjugate vaccines.BMC veterinary research 15,6(2019).

36.Ban,L.等人,Discovery of glycosyltransferases using carbohydratearrays and mass spectrometry.Nature Chemical Biology 8,769-773(2012).

37.Dumon,C.,Samain,E.&Priem,B.Assessment of the Two Helicobacterpyloriα-1,3-Fucosyltransferase Ortholog Genes for the Large-Scale Synthesisof LewisX Human Milk Oligosaccharides by Metabolically Engineered Escherichiacoli.Biotechnology Progress 20,412-419(2004).

38.Huang,D.等人,Metabolic engineering of Escherichia coli for theproduction of 2′-fucosyllactose and 3-fucosyllactose through modular pathwayenhancement.Metabolic Engineering 41,23-38(2017).

39.Li,Y.等人,Donor substrate promiscuity of bacterial beta1-3-N-acetylglucosaminyltransferases and acceptor substrate flexibility of beta1-4-galactosyltransferases.Bioorganic and Medicinal Chemistry 24,1696-1705(2016).

40.Priem,B.,Gilbert,M.,Wakarchuk,W.W.,Heyraud,A.&Samain,E.A newfermentation process allows large-scale production of human milkoligosaccharides by metabolically engineered bacteria.Glycobiology 12,235-240(2002).

41.Aanensen,D.M.,Mavroidi,A.,Bentley,S.D.,Reeves,P.R.&Spratt,B.G.Predicted Functions and Linkage Specificities of the Products of theStreptococcus pneumoniae Capsular Biosynthetic Loci.Journal of bacteriology189,7856-7876(2007).

42.Lindhout,T.等人,Site-specific enzymatic polysialylation oftherapeutic proteins using bacterial enzymes.Proceedings of the NationalAcademy of Sciences 108,7397-7402(2011).

43.Sgambato,A.等人,Different Sialoside Epitopes on Collagen FilmSurfaces Direct Mesenchymal Stem Cell Fate.ACS Applied Materials&Interfaces8,14952-14957(2016).

44.Imberty,A.&Varrot,A.Microbial recognition of human cell surfaceglycoconjugates.Curr Opin Struct Biol 18,567-576(2008).

45.Barthelson,R.,Mobasseri,A.,Zopf,D.&Simon,P.Adherence ofStreptococcus pneumoniae to respiratory epithelial cells is inhibited bysialylated oligosaccharides.Infection and immunity 66,1439-1444(1998).

46.Rabinovich,G.A.&Toscano,M.A.Turning"sweet"on immunity:galectin–glycan interactions in immune tolerance and inflammation.Nature ReviewsImmunology 9,338(2009).

47.O’Reilly,M.K.&Paulson,J.C.Siglecs as targets for therapy inimmune-cell-mediated disease.Trends in Pharmacological Sciences30,240-248(2009).

48.Chen,W.C.等人,Antigen Delivery to Macrophages Using LiposomalNanoparticles Targeting Sialoadhesin/CD169.PloS one 7,e39039(2012).

49.Ragupathi,G.等人,Induction of antibodies against GD3 gangliosidein melanoma patients by vaccination with GD3-lactone-KLH conjugate plusimmunological adjuvant QS-21.International Journal of Cancer 85,659-666(2000).

50.Pan,Y.,Chefalo,P.,Nagy,N.,Harding,C.&Guo,Z.Synthesis andimmunological properties of N-modified GM3 antigens as therapeutic cancervaccines.Journal of Medicinal Chemistry 48,875-883(2005).

51.Meuris,L.等人,GlycoDelete engineering of mammalian cellssimplifies N-glycosylation of recombinant proteins.Nature Biotechnology 32,485-489(2014).

52.Chen,W.C.等人,In vivo targeting of B-cell lymphoma with glycanligands of CD22.Blood 115,4778-4786(2010).

53.Zou,W.等人,Bioengineering of surface GD3 ganglioside forimmunotargeting human melanoma cells.Journal of Biological Chemistry(2004).

54.Higuchi,Y.等人,A rationally engineered yeast pyruvyltransferasePvg1p introduces sialylation-like properties in neo-human-type complexoligosaccharide.Scientific reports 6,26349(2016).

55.Deguchi,T.等人,Increased Immunogenicity of Tumor-AssociatedAntigen,Mucin 1,Engineered to Expressα-Gal Epitopes:A Novel Approach toImmunotherapy in Pancreatic Cancer.Cancer Research 70,5259-5269(2010).

56.Kitov,P.I.等人,Shiga-like toxins are neutralized by tailoredmultivalent carbohydrate ligands.Nature 403,669(2000).

57.Beer,M.V.等人,The Next Step in Biomimetic Material Design:Poly-LacNAc-Mediated Reversible Exposure of Extra Cellular MatrixComponents.Advanced Healthcare Materials 2,306-311(2013).

58.Laaf,D.,Bojarová,P.,Pelantová,H.,

V.&Elling,L.TailoredMultivalent Neo-Glycoproteins:Synthesis,Evaluation,and Application of aLibrary of Galectin-3-Binding Glycan Ligands.Bioconjugate chemistry 28,2832-2840(2017).

59.Kalovidouris,S.A.,Gama,C.I.,Lee,L.W.&Hsieh-Wilson,L.C.A Role forFucoseα(1-2)Galactose Carbohydrates in Neuronal Growth.Journal of theAmerican Chemical Society 127,1340-1341(2005).

60.Yu,Y.等人,Human Milk Contains Novel Glycans That Are PotentialDecoy Receptors for Neonatal Rotaviruses.Molecular&Cellular Proteomics 13,2944-2960(2014).

61.Yu,H.等人,A Multifunctional Pasteurella multocidaSialyltransferase: A Powerful Tool for the Synthesis of SialosideLibraries.Journal of the American Chemical Society 127,17618-17619(2005).

62.Wang,J.等人,Lewis X oligosaccharides targeting to DC-SIGN enhancedantigen-specific immune response.Immunology 121,174-182(2007).

63.Yavuz,E.,Maffioli,C.,Ilg,K.,Aebi,M.&Priem,B.Glycomimicry:displayof fucosylation on the lipo-oligosaccharide of recombinant Escherichia coliK12.Glycoconjugate Journal 28,39-47(2011).

64.Ilg,K.,Yavuz,E.,Maffioli,C.,Priem,B.&Aebi,M.Glycomimicry:displayof the GM3 sugar epitope on Escherichia coli and Salmonella enterica svTyphimurium.Glycobiology 20,1289-1297(2010).

65.Hug,I.等人,Exploiting Bacterial Glycosylation Machineries for theSynthesis of a Lewis Antigen-containing Glycoprotein.Journal of BiologicalChemistry 286,37887-37894(2011).

66.Mallajosyula,V.V.A.等人,Influenza hemagglutinin stem-fragmentimmunogen elicits broadly neutralizing antibodies and confers heterologousprotection.Proceedings of the National Academy of Sciences USA 111,E2514-E2523(2014).

67.Chen,W.A.等人,Addition of alphaGal HyperAcute technology torecombinant avian influenza vaccines induces strong low-dose antibodyresponses.PloS one 12,e0182683(2017).

68.Pardee,K.等人,Portable,On-Demand Biomolecular Manufacturing.Cell167,248-259.e212(2016).

69.Crowell,L.E.等人,On-demand manufacturing of clinical-qualitybiopharmaceuticals.Nature Biotechnology 36,988(2018).

70.Needham,B.D.等人,Modulating the innate immune response bycombinatorial engineering of endotoxin.Proceedings of the National Academy ofSciences 110,1464-1469(2013).

71.Wilding,K.M.等人,Endotoxin-Free E.coli-Based Cell-Free ProteinSynthesis:Pre-Expression Endotoxin Removal Approaches for on-Demand CancerTherapeutic Production.Biotechnology journal 14,1800271(2019).

72.Schreiner,R.,Schnabel,E.&Wieland,F.Novel N-glycosylation ineukaryotes:laminin contains the linkage unit beta-glucosylasparagine.TheJournal of cell biology 124,1071-1081(1994).

73.Kong,Y.等人,N-Glycosyltransferase from Aggregatibacter aphrophilussynthesizes glycopeptides with relaxed nucleotide-activated sugar donorselectivity.Carbohydrate Research 462,7-12(2018).

74.Gibson,D.G.等人,Enzymatic assembly of DNA molecules up to severalhundred kilobases.Nature Methods 6,343-345(2009).

75.Ollis,A.A.,Zhang,S.,Fisher,A.C.&DeLisa,M.P.Engineeredoligosaccharyltransferases with greatly relaxed acceptor-sitespecificity.Nature Chemical Biology 10,816-822(2014).

76.Espah Borujeni,A.,Channarasappa,A.S.&Salis,H.M.Translation rate iscontrolled by coupled trade-offs between site accessibility,selective RNAunfolding and sliding at upstream standby sites.Nucleic Acids Research 42,2646-2659(2014).

77.Valentine,Jenny L.等人,Immunization with Outer Membrane VesiclesDisplaying Designer Glycotopes Yields Class-Switched,Glycan-SpecificAntibodies.Cell Chemical Biology 23,655-665(2016).

78.Kim,D.M.&Swartz,J.R.Efficient production of a bioactive,multipledisulfide-bonded protein using modified extracts of Escherichiacoli.Biotechnology and bioengineering 85,122-129(2004).

79.Baba,T.等人,Construction of Escherichia coli K-12in-frame,single-gene knockout mutants:the Keio collection.Molecular systems biology 2,2006.0008-2006.0008(2006).

80.St-Pierre,F.等人,One-Step Cloning and Chromosomal Integration ofDNA.ACS synthetic biology 2,537-541(2013).

前述非专利参考文献的内容通过引用整体并入本文。

实施例2.用于将非标准糖掺入活大肠杆菌细胞的方法。

概述

我们使用上文针对GlycoPRIME方法描述的途径在活大肠杆菌中将唾液酸的非标准(叠氮基)变体在N-连接的三糖(Asn-Glc-Gal-Sia)的末端掺入。这种方法可用于提供小治疗剂的一般修饰策略(聚乙二醇化等)，以及通过掺入已知与siglecs和半乳凝集素产生耐受性反应的特定唾液酸来产生过敏原疫苗的方法。与现有技术相比这很有趣，因为这提供了在活大肠杆菌中掺入非标准(或可点击)聚糖用于蛋白质治疗的第一个实例。因此，在哺乳动物细胞中或酶促体外方法中可比目前的方法更容易安装非标准唾液酸。如下所述，我们已将使用GlycoPRIME开发的最小唾液酸聚糖途径应用于在大肠杆菌中产生具有可点击唾液酸的重组蛋白。我们的数据表明这些叠氮基唾液酸掺入到Im7-6模型蛋白和Fc-6中。

与经典的免疫原性疫苗相比，致耐受性疫苗被设计成诱导长期的、抗原特异性的、抑制性记忆，其防止对良性物质(例如过敏原或自身免疫性病症的靶标)的炎症免疫反应¹。最近有证据表明，siglecs与细胞和抗原上的唾液酸的结合可能在免疫细胞(特别是树突状细胞和调节性T细胞)介导的致耐受反应中发挥重要作用^2,3。还有进一步的证据表明，siglec-唾液酸相互作用可以使用化学修饰的唾液酸放大和调整^4-9。因此，唾液酸并且尤其是化学修饰的唾液酸与自身免疫所靶向的过敏原或蛋白质的缔合提供了一种很有前景的治疗策略以治疗过敏或自身免疫性病症^7,10-12。还显示了使用代谢标记将具有炔烃部分的唾液酸掺入到细胞表面蛋白质中以用于使用点击化学¹³进行进一步的化学修饰以调节siglec相互作用⁷。使用在GlycoPRIME中开发的途径在细菌中安装叠氮基唾液酸的方法可以为这些致耐受性疫苗提供新的途径。

一旦在我们的系统中产生，这些可点击的唾液酸可以用针对siglecs的多种高亲和力和选择性配体进一步功能化以产生致耐受性疫苗。由于它发生在具有较低产生成本并且能够更容易工程化的细菌中，因此该系统将与其他基于哺乳动物的代谢标记系统互补。从理论上讲，用于收集该初步数据以实现这一目标的系统的唯一需要的修改是用编码耐受诱导所需要的与ApNGT靶向的GlycTag的重复区域融合的蛋白质的质粒替换靶蛋白质质粒，类似于先前研究中描述的构建体¹⁴。

除了允许调节siglec结合之外，叠氮基唾液酸聚糖还可以用作将聚乙二醇(PEG)附接至小治疗剂(例如GM-CSF)以增加它们的循环半衰期或将化疗“弹头”附接至短链抗体片段或纳米抗体以实现对癌细胞的精确靶向和破坏的通用化学柄。虽然还有其他方法将化学柄安装到细菌中的蛋白质上，例如掺入非标准氨基酸或先前报道的GlycoPEGylation策略^15,16，但这种方法确实具有不需要使用正交翻译系统或昂贵的非天然活化糖供体或纯化的酶的优点(如GlycoPEGylation那样)。

方法

在本实施例中使用了在上述实施例1中描述的体内方法中实施并在图4中举例说明的相同的三酶途径(ApNGT、LgtB和CST-1或Pd2ST6)。简而言之，在大肠杆菌培养物中，细菌用携带三种糖基转移酶、CMP-Sia合酶和具有针对NGT的优化的肽受体序列的靶蛋白的三种质粒转化，并补充有叠氮基唾液酸(脱氧C-9；C-5也可以被取代)合成糖(在9位取代，购自CarboSynth)。参见图30。如图31和32所示，非标准糖被掺入糖蛋白中；细菌吸收叠氮基糖并使用所实施的途径以非常高的效率(接近100％，参见图31和32中的MS光谱)将其作为三糖Asn-Glc-Gal-azido-Sia掺入糖蛋白中。在图中，完整的蛋白质MS数据和糖肽MS/MS数据最终通过将叠氮基唾液酸补充到具有含有与上述对GlycoPRIME所述的相同的三个质粒系统的大肠杆菌的培养基中显示叠氮基唾液酸(与标准唾液酸的区别是24Da的质量差)的有效地掺入。因此，NanT唾液酸转运蛋白、CMP-Sia合酶和PdST6以及CST-I Sia T都接受非标准糖。因为系统中没有天然唾液酸，非特异性掺入不是一个严重的问题，在光谱中没有观察到。因此，C9-叠氮基唾液酸可以使用2,6和2,3键联附接。细菌吸收叠氮基糖并使用所实施的途径以非常高的效率将其作为三糖Asn-Glc-Gal-azido-Sia掺入糖蛋白中。这是使用重组表达的蛋白质糖基化途径将叠氮基糖单体掺入细菌宿主中重组表达的糖蛋白的第一个实例。

下表提供了使用本文公开的组合物和方法进行过敏原基因设计的示例性、非限制性靶标。

在一些实施方案中，选择先前已在大肠杆菌中表达且未二硫键键合的过敏原或自身免疫靶标。另外或可选择地，在一些实施方案中，采用具有例如1、5或10个重复受体序列的“糖模块”。在一些实施方案中，这些多个序列紧密堆积，同时仍确保良好的修饰(例如，COKa或HMW1蛋白或GlycoSCORES上的天然受体)。

在一些实施方案中，仅添加非天然糖。举例来说，但不作为限制，仅将葡萄糖添加到无细胞裂解物(其可以被精确的糖供体合酶取代)并且可以将单糖加载到糖供体上。

实施例2的参考文献：

1.Mannie,M.D.&Curtis,A.D.,2nd Tolerogenic vaccines for Multiplesclerosis.Human vaccines&immunotherapeutics 9,1032-1038(2013).

2.

U.&

P.Induction of Tolerogenic Dendritic Cellsby Endogenous Biomolecules:An Update.Frontiers in immunology 9,2482-2482(2018).

3.Lübbers,J.,Rodríguez,E.&van Kooyk,Y.Modulation of Immune Tolerancevia Siglec-Sialic Acid Interactions.Frontiers in immunology 9,2807-2807(2018).

4.Rillahan,C.D.,Schwartz,E.,McBride,R.,Fokin,V.V.&Paulson,J.C.Clickand Pick:Identification of Sialoside Analogues for Siglec-Based CellTargeting.Angewandte Chemie International Edition 51,11014-11018(2012).

5.Spence,S.等人,Targeting Siglecs with a sialic acid–decoratednanoparticle abrogates inflammation.Science Translational Medicine 7,303ra140-303ra140(2015).

6.Prescher,H.,Schweizer,A.,Kuhfeldt,E.,Nitschke,L.&Brossmer,R.Discovery of Multifold Modified Sialosides as Human CD22/Siglec-2 Ligandswith Nanomolar Activity on B-Cells.ACS Chemical Biology 9,1444-1450(2014).

7.Büll,C.等人,Steering Siglec–Sialic Acid Interactions on LivingCells using Bioorthogonal Chemistry.Angewandte Chemie International Edition56,3309-3313(2017).

8.Büll,C.,Heise,T.,Adema,G.J.&Boltje,T.J.Sialic Acid Mimetics toTarget the Sialic Acid–Siglec Axis.Trends in Biochemical Sciences 41,519-531(2016).

9.Abdu-Allah,H.H.M.等人,CD22-Antagonists with nanomolar potency:Thesynergistic effect of hydrophobic groups at C-2 and C-9 of sialic acidscaffold.Bioorganic&Medicinal Chemistry 19,1966-1971(2011).

10.Perdicchio,M.等人,Sialic acid-modified antigens impose tolerancevia inhibition of T-cell proliferation and de novo induction of regulatory Tcells.Proceedings of the National Academy of Sciences 113,3329-3334(2016).

11.Pang,L.,Macauley,M.S.,Arlian,B.M.,Nycholat,C.M.&Paulson,J.C.Encapsulating an Immunosuppressant Enhances Tolerance Induction bySiglec-Engaging Tolerogenic Liposomes.Chembiochem:a European journal ofchemical biology 18,1226-1233(2017).

12.Orgel,K.A.等人,Exploiting CD22 on antigen-specific B cells toprevent allergy to the major peanut allergen Ara h 2.Journal of Allergy andClinical Immunology 139,366-369.e362(2017).

13.Kolb,H.C.,Finn,M.&Sharpless,K.B.Click chemistry:diverse chemicalfunction from a few good reactions.Angewandte Chemie International Edition40,2004-2021(2001).

14.Mathiesen,C.B.K.等人,Genetically engineered cell factories produceglycoengineered vaccines that target antigen-presenting cells and reduceantigen-specific T-cell reactivity.Journal of Allergy and Clinical Immunology142,1983-1987(2018).

15.DeFrees,S.等人,GlycoPEGylation of recombinant therapeutic proteinsproduced in Escherichia coli.Glycobiology 16,833-843(2006).

16.Henderson,G.E.,Isett,K.D.&Gerngross,T.U.Site-Specific Modificationof Recombinant Proteins:A Novel Platform for Modifying GlycoproteinsExpressed in E.coli.Bioconjugate chemistry 22,903-912(2011).

17.Santos da Silva E,Asam C,Lackner P,等人,Allergens of Blomiatropicalis:An Overview of Recombinant Molecules.Int Arch AllergyImmunol.2017；172(4):203–214.doi:10.1159/000464325

18.Derewenda,U.,Li,J.,Derewenda,Z.,Dauter,Z.,Mueller,G.A.,Rule,G.S.&Benjamin,D.C.The crystal structure of a major dust mite allergen Der p 2,andits biological implications.J Mol Biol 318,189-197(2002).

19.

Z.,Degano,M.,Lamba,D.,von Roepenack-Lahaye,E.,Clemens,S.,Susani,M.,Ferreira,F.,Scheiner,O.&Breiteneder,H.CrystalStructure of a Hypoallergenic Isoform of the Major Birch Pollen Allergen Betv 1 and its Likely Biological Function as a Plant Steroid Carrier.Journal ofMolecular Biology 325,123-133(2003).

在前述描述中，本领域技术人员将容易明白，在不脱离本发明的范围和精神的情况下，可以对本文公开的发明进行各种替换和修改。此处举例说明性描述的本发明可以适当地在不存在此处未具体公开的任何一个或多个元素、一个或多个限制或限制的情况下实施。已使用的术语和表达被用作描述而非限制，并且在使用这些术语和表达时无意排除所示和描述的特征或其部分的任何等效物，但认识到各种修改在本发明的范围内是可能的。因此，应当理解，虽然本发明已经通过特定实施方案和可选特征进行了举例说明，但是本领域技术人员可以对这里公开的概念进行修改和/或变化，并且考虑这样的修改和变化在本发明的范围内。

除非本文另有说明或与上下文明显矛盾，否则本文描述的所有方法都可以以任何合适的顺序进行。除非另外声明，否则本文提供的任何和所有实例的使用仅旨在更好地阐明本发明并且不对本发明的范围构成限制。说明书中的任何语言都不应被解释为表明任何未要求保护的元素对于本发明的实践是必不可少的。

本文引用了大量专利和非专利参考文献。引用的参考文献通过引用整体并入本文。如果说明书中的术语定义与引用的参考文献中的术语定义不一致，则应根据说明书中的定义来解释该术语。

序列表

<110> 西北大学

Jewett, Michael Christopher

Kightlinger, Weston

<120> 用于产生糖蛋白、鉴定糖基化途径的平台

<130> 5369-00600

<160> 20

<170> PatentIn version 3.5

<210> 1

<211> 620

<212> PRT

<213> Actinobacillus pleuropneumoniae（胸膜肺炎放线杆菌）

<400> 1

Met Glu Asn Glu Asn Lys Pro Asn Val Ala Asn Phe Glu Ala Ala Val

1 5 10 15

Ala Ala Lys Asp Tyr Glu Lys Ala Cys Ser Glu Leu Leu Leu Ile Leu

20 25 30

Ser Gln Leu Asp Ser Asn Phe Gly Gly Ile His Glu Ile Glu Phe Glu

35 40 45

Tyr Pro Ala Gln Leu Gln Asp Leu Glu Gln Glu Lys Ile Val Tyr Phe

50 55 60

Cys Thr Arg Met Ala Thr Ala Ile Thr Thr Leu Phe Ser Asp Pro Val

65 70 75 80

Leu Glu Ile Ser Asp Leu Gly Val Gln Arg Phe Leu Val Tyr Gln Arg

85 90 95

Trp Leu Ala Leu Ile Phe Ala Ser Ser Pro Phe Val Asn Ala Asp His

100 105 110

Ile Leu Gln Thr Tyr Asn Arg Glu Pro Asn Arg Lys Asn Ser Leu Glu

115 120 125

Ile His Leu Asp Ser Ser Lys Ser Ser Leu Ile Lys Phe Cys Ile Leu

130 135 140

Tyr Leu Pro Glu Ser Asn Val Asn Leu Asn Leu Asp Val Met Trp Asn

145 150 155 160

Ile Ser Pro Glu Leu Cys Ala Ser Leu Cys Phe Ala Leu Gln Ser Pro

165 170 175

Arg Phe Val Gly Thr Ser Thr Ala Phe Asn Lys Arg Ala Thr Ile Leu

180 185 190

Gln Trp Phe Pro Arg His Leu Asp Gln Leu Lys Asn Leu Asn Asn Ile

195 200 205

Pro Ser Ala Ile Ser His Asp Val Tyr Met His Cys Ser Tyr Asp Thr

210 215 220

Ser Val Asn Lys His Asp Val Lys Arg Ala Leu Asn His Val Ile Arg

225 230 235 240

Arg His Ile Glu Ser Glu Tyr Gly Trp Lys Asp Arg Asp Val Ala His

245 250 255

Ile Gly Tyr Arg Asn Asn Lys Pro Val Met Val Val Leu Leu Glu His

260 265 270

Phe His Ser Ala His Ser Ile Tyr Arg Thr His Ser Thr Ser Met Ile

275 280 285

Ala Ala Arg Glu His Phe Tyr Leu Ile Gly Leu Gly Ser Pro Ser Val

290 295 300

Asp Gln Ala Gly Gln Glu Val Phe Asp Glu Phe His Leu Val Ala Gly

305 310 315 320

Asp Asn Met Lys Gln Lys Leu Glu Phe Ile Arg Ser Val Cys Glu Ser

325 330 335

Asn Gly Ala Ala Ile Phe Tyr Met Pro Ser Ile Gly Met Asp Met Thr

340 345 350

Thr Ile Phe Ala Ser Asn Thr Arg Leu Ala Pro Ile Gln Ala Ile Ala

355 360 365

Leu Gly His Pro Ala Thr Thr His Ser Asp Phe Ile Glu Tyr Val Ile

370 375 380

Val Glu Asp Asp Tyr Val Gly Ser Glu Glu Cys Phe Ser Glu Thr Leu

385 390 395 400

Leu Arg Leu Pro Lys Asp Ala Leu Pro Tyr Val Pro Ser Ala Leu Ala

405 410 415

Pro Glu Lys Val Asp Tyr Leu Leu Arg Glu Asn Pro Glu Val Val Asn

420 425 430

Ile Gly Ile Ala Ser Thr Thr Met Lys Leu Asn Pro Tyr Phe Leu Glu

435 440 445

Ala Leu Lys Ala Ile Arg Asp Arg Ala Lys Val Lys Val His Phe His

450 455 460

Phe Ala Leu Gly Gln Ser Asn Gly Ile Thr His Pro Tyr Val Glu Arg

465 470 475 480

Phe Ile Lys Ser Tyr Leu Gly Asp Ser Ala Thr Ala His Pro His Ser

485 490 495

Pro Tyr His Gln Tyr Leu Arg Ile Leu His Asn Cys Asp Met Met Val

500 505 510

Asn Pro Phe Pro Phe Gly Asn Thr Asn Gly Ile Ile Asp Met Val Thr

515 520 525

Leu Gly Leu Val Gly Val Cys Lys Thr Gly Ala Glu Val His Glu His

530 535 540

Ile Asp Glu Gly Leu Phe Lys Arg Leu Gly Leu Pro Glu Trp Leu Ile

545 550 555 560

Ala Asn Thr Val Asp Glu Tyr Val Glu Arg Ala Val Arg Leu Ala Glu

565 570 575

Asn His Gln Glu Arg Leu Glu Leu Arg Arg Tyr Ile Ile Glu Asn Asn

580 585 590

Gly Leu Asn Thr Leu Phe Thr Gly Asp Pro Arg Pro Met Gly Gln Val

595 600 605

Phe Leu Glu Lys Leu Asn Ala Phe Leu Lys Glu Asn

610 615 620

<210> 2

<211> 620

<212> PRT

<213> 人工

<220>

<223> 经修饰的胸膜肺炎放线杆菌NGT

<400> 2

Met Glu Asn Glu Asn Lys Pro Asn Val Ala Asn Phe Glu Ala Ala Val

1 5 10 15

Ala Ala Lys Asp Tyr Glu Lys Ala Cys Ser Glu Leu Leu Leu Ile Leu

20 25 30

Ser Gln Leu Asp Ser Asn Phe Gly Gly Ile His Glu Ile Glu Phe Glu

35 40 45

Tyr Pro Ala Gln Leu Gln Asp Leu Glu Gln Glu Lys Ile Val Tyr Phe

50 55 60

Cys Thr Arg Met Ala Thr Ala Ile Thr Thr Leu Phe Ser Asp Pro Val

65 70 75 80

Leu Glu Ile Ser Asp Leu Gly Val Gln Arg Phe Leu Val Tyr Gln Arg

85 90 95

Trp Leu Ala Leu Ile Phe Ala Ser Ser Pro Phe Val Asn Ala Asp His

100 105 110

Ile Leu Gln Thr Tyr Asn Arg Glu Pro Asn Arg Lys Asn Ser Leu Glu

115 120 125

Ile His Leu Asp Ser Ser Lys Ser Ser Leu Ile Lys Phe Cys Ile Leu

130 135 140

Tyr Leu Pro Glu Ser Asn Val Asn Leu Asn Leu Asp Val Met Trp Asn

145 150 155 160

Ile Ser Pro Glu Leu Cys Ala Ser Leu Cys Phe Ala Leu Gln Ser Pro

165 170 175

Arg Phe Val Gly Thr Ser Thr Ala Phe Asn Lys Arg Ala Thr Ile Leu

180 185 190

Gln Trp Phe Pro Arg His Leu Asp Gln Leu Lys Asn Leu Asn Asn Ile

195 200 205

Pro Ser Ala Ile Ser His Asp Val Tyr Met His Cys Ser Tyr Asp Thr

210 215 220

Ser Val Asn Lys His Asp Val Lys Arg Ala Leu Asn His Val Ile Arg

225 230 235 240

Arg His Ile Glu Ser Glu Tyr Gly Trp Lys Asp Arg Asp Val Ala His

245 250 255

Ile Gly Tyr Arg Asn Asn Lys Pro Val Met Val Val Leu Leu Glu His

260 265 270

Phe His Ser Ala His Ser Ile Tyr Arg Thr His Ser Thr Ser Met Ile

275 280 285

Ala Ala Arg Glu His Phe Tyr Leu Ile Gly Leu Gly Ser Pro Ser Val

290 295 300

Asp Gln Ala Gly Gln Glu Val Phe Asp Glu Phe His Leu Val Ala Gly

305 310 315 320

Asp Asn Met Lys Gln Lys Leu Glu Phe Ile Arg Ser Val Cys Glu Ser

325 330 335

Asn Gly Ala Ala Ile Phe Tyr Met Pro Ser Ile Gly Met Asp Met Thr

340 345 350

Thr Ile Phe Ala Ser Asn Thr Arg Leu Ala Pro Ile Gln Ala Ile Ala

355 360 365

Leu Gly His Pro Ala Thr Thr His Ser Asp Phe Ile Glu Tyr Val Ile

370 375 380

Val Glu Asp Asp Tyr Val Gly Ser Glu Glu Cys Phe Ser Glu Thr Leu

385 390 395 400

Leu Arg Leu Pro Lys Asp Ala Leu Pro Tyr Val Pro Ser Ala Leu Ala

405 410 415

Pro Glu Lys Val Asp Tyr Leu Leu Arg Glu Asn Pro Glu Val Val Asn

420 425 430

Ile Gly Ile Ala Ser Thr Thr Met Lys Leu Asn Pro Tyr Phe Leu Glu

435 440 445

Ala Leu Lys Ala Ile Arg Asp Arg Ala Lys Val Lys Val His Phe His

450 455 460

Phe Ala Leu Gly Ala Ser Asn Gly Ile Thr His Pro Tyr Val Glu Arg

465 470 475 480

Phe Ile Lys Ser Tyr Leu Gly Asp Ser Ala Thr Ala His Pro His Ser

485 490 495

Pro Tyr His Gln Tyr Leu Arg Ile Leu His Asn Cys Asp Met Met Val

500 505 510

Asn Pro Phe Pro Phe Gly Asn Thr Asn Gly Ile Ile Asp Met Val Thr

515 520 525

Leu Gly Leu Val Gly Val Cys Lys Thr Gly Ala Glu Val His Glu His

530 535 540

Ile Asp Glu Gly Leu Phe Lys Arg Leu Gly Leu Pro Glu Trp Leu Ile

545 550 555 560

Ala Asn Thr Val Asp Glu Tyr Val Glu Arg Ala Val Arg Leu Ala Glu

565 570 575

Asn His Gln Glu Arg Leu Glu Leu Arg Arg Tyr Ile Ile Glu Asn Asn

580 585 590

Gly Leu Asn Thr Leu Phe Thr Gly Asp Pro Arg Pro Met Gly Gln Val

595 600 605

Phe Leu Glu Lys Leu Asn Ala Phe Leu Lys Glu Asn

610 615 620

<210> 3

<211> 637

<212> PRT

<213> Escherichia coli（大肠杆菌）

<400> 3

Met Met Ser His Lys Thr Asp Thr Ala Pro Val Gln Glu Gln Ala Gly

1 5 10 15

Leu Thr Phe Arg Leu Glu Thr Phe Glu Trp Gln Val His Gln Gly Leu

20 25 30

Asn Glu Glu Ala Ala Arg Ser Leu Ile Ser Leu Leu Gln Leu Leu Asp

35 40 45

Arg His Tyr Ala Gln Trp Gly Glu Ser Phe Ser Ala Trp Ala Pro Gly

50 55 60

Met Thr Ala Glu Glu Ile Asn Pro His Leu Cys Thr Arg Ile Ala Gly

65 70 75 80

Ala Ile Thr Ala Leu Phe Ser Arg Pro Gly Phe Arg Val Ser Asp Gly

85 90 95

Gly Phe Ala Glu Leu Met Asp Tyr His Arg Trp Leu Ala Ile Ile Phe

100 105 110

Ala Val Ser Asp Tyr Arg His Gly Asp His Ile Ile Arg Asn Ile Asn

115 120 125

Ala Ala Gly Gly Gly Val Val Ala Pro Leu Thr Leu Asn Ala Asp Asn

130 135 140

Leu Gln Leu Phe Cys Leu Ser Tyr Tyr Pro Asp Ser Gln Ile Ala Leu

145 150 155 160

Gln Pro Glu Pro Leu Trp Gln Tyr Asp Arg Gln Thr Val Val Arg Leu

165 170 175

Phe Phe Ala Leu Leu Ser Gly Arg Ala Leu Pro Thr Pro Ala Ala His

180 185 190

Gln Lys Arg Glu His Leu Leu Ala Trp Leu Pro Glu Arg Leu Lys Glu

195 200 205

Ile Asp Ser Leu Glu Phe Leu Pro Gly Lys Val Leu His Asp Val Tyr

210 215 220

Met His Cys Ser Tyr Ala Asp Leu Pro Glu Lys His Arg Ile Lys Gln

225 230 235 240

Glu Ile Asn Arg Leu Thr Ala Arg Ala Leu Glu Gln Thr Tyr Ala Asp

245 250 255

Cys Leu Pro Val Arg Ala Pro Glu Ala Ala Arg Gln Lys Pro Val Leu

260 265 270

Ala Val Val Leu Glu Trp Phe Thr Cys Gln His Ser Ile Tyr Arg Thr

275 280 285

His Ser Thr Ser Met Arg Ala Leu Arg Glu His Phe His Leu Leu Gly

290 295 300

Ile Ala Gln Pro Gly Ala Thr Asp Glu Ile Thr Arg Glu Val Phe Asp

305 310 315 320

Glu Phe Arg Glu Leu Ser Ala Glu Asn Val Val Gly Asp Ala Ile Arg

325 330 335

Cys Leu Ser Glu Val Arg Pro Asp Val Ile Tyr Tyr Pro Ser Val Gly

340 345 350

Met Phe Pro Leu Thr Val Tyr Leu Thr Ala Leu Arg Leu Ala Pro Leu

355 360 365

Gln Leu Met Ala Leu Gly His Pro Ala Thr Thr Trp Ser Glu His Ile

370 375 380

Asp Gly Val Leu Val Glu Glu Asp Tyr Leu Gly Asp Pro Ala Cys Phe

385 390 395 400

Ser Glu Thr Val Cys Ala Val Pro Lys Asp Ala Ile Pro Tyr Ile Pro

405 410 415

Pro Ala Ser Thr Glu Arg Val Leu Pro Glu Arg Thr Pro Phe Arg Asp

420 425 430

Arg Ala Lys Ala Ala Trp Pro Ala Ala Leu Pro Val Arg Val Ala Val

435 440 445

Cys Ala Ser Val Met Lys Ile Asn Pro Gly Phe Leu Asp Thr Leu Arg

450 455 460

Glu Ile Ser Asp Arg Ser Arg Val Pro Val Gln Phe Cys Phe Trp Met

465 470 475 480

Gly Phe Ala Gln Gly Leu Thr Leu Asp Tyr Leu Arg Arg Ala Ile Arg

485 490 495

Gln Ala Leu Pro Thr Ala Glu Val Asn Ala His Met Pro Val Gln Ala

500 505 510

Tyr Gln Gln Ala Leu Asn Ser Cys Glu Leu Phe Val Asn Pro Phe Pro

515 520 525

Phe Gly Asn Thr Asn Gly Leu Val Asp Thr Val Arg Gln Gly Leu Pro

530 535 540

Gly Val Cys Met Thr Gly Pro Glu Val His Thr His Ile Asp Glu Gly

545 550 555 560

Leu Phe Arg Arg Leu Gly Leu Pro Glu Ala Leu Ile Ala Arg Asp Arg

565 570 575

Glu Glu Tyr Ile Thr Ala Val Leu Ser Leu Thr Glu Thr Pro Arg Leu

580 585 590

Arg Glu Arg Leu Gln Lys Tyr Leu Thr Glu Asn Asp Val Glu Lys Val

595 600 605

Leu Phe Glu Gly Arg Pro Asp Lys Phe Ala Glu Arg Val Trp Gln Leu

610 615 620

Trp Glu Ala Arg Ser His Arg Gln Glu Glu Gly Ala Glu

625 630 635

<210> 4

<211> 637

<212> PRT

<213> 人工

<220>

<223> 经修饰的大肠杆菌NGT

<400> 4

Met Met Ser His Lys Thr Asp Thr Ala Pro Val Gln Glu Gln Ala Gly

1 5 10 15

Leu Thr Phe Arg Leu Glu Thr Phe Glu Trp Gln Val His Gln Gly Leu

20 25 30

Asn Glu Glu Ala Ala Arg Ser Leu Ile Ser Leu Leu Gln Leu Leu Asp

35 40 45

Arg His Tyr Ala Gln Trp Gly Glu Ser Phe Ser Ala Trp Ala Pro Gly

50 55 60

Met Thr Ala Glu Glu Ile Asn Pro His Leu Cys Thr Arg Ile Ala Gly

65 70 75 80

Ala Ile Thr Ala Leu Phe Ser Arg Pro Gly Phe Arg Val Ser Asp Gly

85 90 95

Gly Phe Ala Glu Leu Met Asp Tyr His Arg Trp Leu Ala Ile Ile Phe

100 105 110

Ala Val Ser Asp Tyr Arg His Gly Asp His Ile Ile Arg Asn Ile Asn

115 120 125

Ala Ala Gly Gly Gly Val Val Ala Pro Leu Thr Leu Asn Ala Asp Asn

130 135 140

Leu Gln Leu Phe Cys Leu Ser Tyr Tyr Pro Asp Ser Gln Ile Ala Leu

145 150 155 160

Gln Pro Glu Pro Leu Trp Gln Tyr Asp Arg Gln Thr Val Val Arg Leu

165 170 175

Phe Phe Ala Leu Leu Ser Gly Arg Ala Leu Pro Thr Pro Ala Ala His

180 185 190

Gln Lys Arg Glu His Leu Leu Ala Trp Leu Pro Glu Arg Leu Lys Glu

195 200 205

Ile Asp Ser Leu Glu Phe Leu Pro Gly Lys Val Leu His Asp Val Tyr

210 215 220

Met His Cys Ser Tyr Ala Asp Leu Pro Glu Lys His Arg Ile Lys Gln

225 230 235 240

Glu Ile Asn Arg Leu Thr Ala Arg Ala Leu Glu Gln Thr Tyr Ala Asp

245 250 255

Cys Leu Pro Val Arg Ala Pro Glu Ala Ala Arg Gln Lys Pro Val Leu

260 265 270

Ala Val Val Leu Glu Trp Phe Thr Cys Gln His Ser Ile Tyr Arg Thr

275 280 285

His Ser Thr Ser Met Arg Ala Leu Arg Glu His Phe His Leu Leu Gly

290 295 300

Ile Ala Gln Pro Gly Ala Thr Asp Glu Ile Thr Arg Glu Val Phe Asp

305 310 315 320

Glu Phe Arg Glu Leu Ser Ala Glu Asn Val Val Gly Asp Ala Ile Arg

325 330 335

Cys Leu Ser Glu Val Arg Pro Asp Val Ile Tyr Tyr Pro Ser Val Gly

340 345 350

Met Phe Pro Leu Thr Val Tyr Leu Thr Ala Leu Arg Leu Ala Pro Leu

355 360 365

Gln Leu Met Ala Leu Gly His Pro Ala Thr Thr Trp Ser Glu His Ile

370 375 380

Asp Gly Val Leu Val Glu Glu Asp Tyr Leu Gly Asp Pro Ala Cys Phe

385 390 395 400

Ser Glu Thr Val Cys Ala Val Pro Lys Asp Ala Ile Pro Tyr Ile Pro

405 410 415

Pro Ala Ser Thr Glu Arg Val Leu Pro Glu Arg Thr Pro Phe Arg Asp

420 425 430

Arg Ala Lys Ala Ala Trp Pro Ala Ala Leu Pro Val Arg Val Ala Val

435 440 445

Cys Ala Ser Val Met Lys Ile Asn Pro Gly Phe Leu Asp Thr Leu Arg

450 455 460

Glu Ile Ser Asp Arg Ser Arg Val Pro Val Gln Phe Cys Phe Trp Met

465 470 475 480

Gly Ala Ala Gln Gly Leu Thr Leu Asp Tyr Leu Arg Arg Ala Ile Arg

485 490 495

Gln Ala Leu Pro Thr Ala Glu Val Asn Ala His Met Pro Val Gln Ala

500 505 510

Tyr Gln Gln Ala Leu Asn Ser Cys Glu Leu Phe Val Asn Pro Phe Pro

515 520 525

Phe Gly Asn Thr Asn Gly Leu Val Asp Thr Val Arg Gln Gly Leu Pro

530 535 540

Gly Val Cys Met Thr Gly Pro Glu Val His Thr His Ile Asp Glu Gly

545 550 555 560

Leu Phe Arg Arg Leu Gly Leu Pro Glu Ala Leu Ile Ala Arg Asp Arg

565 570 575

Glu Glu Tyr Ile Thr Ala Val Leu Ser Leu Thr Glu Thr Pro Arg Leu

580 585 590

Arg Glu Arg Leu Gln Lys Tyr Leu Thr Glu Asn Asp Val Glu Lys Val

595 600 605

Leu Phe Glu Gly Arg Pro Asp Lys Phe Ala Glu Arg Val Trp Gln Leu

610 615 620

Trp Glu Ala Arg Ser His Arg Gln Glu Glu Gly Ala Glu

625 630 635

<210> 5

<211> 650

<212> PRT

<213> Haemophilus influenza（流感嗜血杆菌）

<400> 5

Met Thr Lys Glu Asn Leu Gln Ser Val Pro Gln Asn Thr Thr Ala Ser

1 5 10 15

Leu Val Glu Ser Asn Asn Asp Gln Thr Ser Leu Gln Ile Leu Lys Gln

20 25 30

Pro Pro Lys Pro Asn Leu Leu Arg Leu Glu Gln His Val Ala Lys Lys

35 40 45

Asp Tyr Glu Leu Ala Cys Arg Glu Leu Met Ala Ile Leu Glu Lys Met

50 55 60

Asp Ala Asn Phe Gly Gly Val His Asp Ile Glu Phe Asp Ala Pro Ala

65 70 75 80

Gln Leu Ala Tyr Leu Pro Glu Lys Leu Leu Ile His Phe Ala Thr Arg

85 90 95

Leu Ala Asn Ala Ile Thr Thr Leu Phe Ser Asp Pro Glu Leu Ala Ile

100 105 110

Ser Glu Glu Gly Ala Leu Lys Met Ile Ser Leu Gln Arg Trp Leu Thr

115 120 125

Leu Ile Phe Ala Ser Ser Pro Tyr Val Asn Ala Asp His Ile Leu Asn

130 135 140

Lys Tyr Asn Ile Asn Pro Asp Ser Glu Gly Gly Phe His Leu Ala Thr

145 150 155 160

Asp Asn Ser Ser Ile Ala Lys Phe Cys Ile Phe Tyr Leu Pro Glu Ser

165 170 175

Asn Val Asn Met Ser Leu Asp Ala Leu Trp Ala Gly Asn Gln Gln Leu

180 185 190

Cys Ala Ser Leu Cys Phe Ala Leu Gln Ser Ser Arg Phe Ile Gly Thr

195 200 205

Ala Ser Ala Phe His Lys Arg Ala Val Val Leu Gln Trp Phe Pro Lys

210 215 220

Lys Leu Ala Glu Ile Ala Asn Leu Asp Glu Leu Pro Ala Asn Ile Leu

225 230 235 240

His Asp Val Tyr Met His Cys Ser Tyr Asp Leu Ala Lys Asn Lys His

245 250 255

Asp Val Lys Arg Pro Leu Asn Glu Leu Val Arg Lys His Ile Leu Thr

260 265 270

Gln Gly Trp Gln Asp Arg Tyr Leu Tyr Thr Leu Gly Lys Lys Asp Gly

275 280 285

Lys Pro Val Met Met Val Leu Leu Glu His Phe Asn Ser Gly His Ser

290 295 300

Ile Tyr Arg Thr His Ser Thr Ser Met Ile Ala Ala Arg Glu Lys Phe

305 310 315 320

Tyr Leu Val Gly Leu Gly His Glu Gly Val Asp Asn Ile Gly Arg Glu

325 330 335

Val Phe Asp Glu Phe Phe Glu Ile Ser Ser Asn Asn Ile Met Glu Arg

340 345 350

Leu Phe Phe Ile Arg Lys Gln Cys Glu Thr Phe Gln Pro Ala Val Phe

355 360 365

Tyr Met Pro Ser Ile Gly Met Asp Ile Thr Thr Ile Phe Val Ser Asn

370 375 380

Thr Arg Leu Ala Pro Ile Gln Ala Val Ala Leu Gly His Pro Ala Thr

385 390 395 400

Thr His Ser Glu Phe Ile Asp Tyr Val Ile Val Glu Asp Asp Tyr Val

405 410 415

Gly Ser Glu Asp Cys Phe Ser Glu Thr Leu Leu Arg Leu Pro Lys Asp

420 425 430

Ala Leu Pro Tyr Val Pro Ser Ala Leu Ala Pro Gln Lys Val Asp Tyr

435 440 445

Val Leu Arg Glu Asn Pro Glu Val Val Asn Ile Gly Ile Ala Ala Thr

450 455 460

Thr Met Lys Leu Asn Pro Glu Phe Leu Leu Thr Leu Gln Glu Ile Arg

465 470 475 480

Asp Lys Ala Lys Val Lys Ile His Phe His Phe Ala Leu Gly Gln Ser

485 490 495

Thr Gly Leu Thr His Pro Tyr Val Lys Trp Phe Ile Glu Ser Tyr Leu

500 505 510

Gly Asp Asp Ala Thr Ala His Pro His Ala Pro Tyr His Asp Tyr Leu

515 520 525

Ala Ile Leu Arg Asp Cys Asp Met Leu Leu Asn Pro Phe Pro Phe Gly

530 535 540

Asn Thr Asn Gly Ile Ile Asp Met Val Thr Leu Gly Leu Val Gly Val

545 550 555 560

Cys Lys Thr Gly Asp Glu Val His Glu His Ile Asp Glu Gly Leu Phe

565 570 575

Lys Arg Leu Gly Leu Pro Glu Trp Leu Ile Ala Asp Thr Arg Glu Thr

580 585 590

Tyr Ile Glu Cys Ala Leu Arg Leu Ala Glu Asn His Gln Glu Arg Leu

595 600 605

Glu Leu Arg Arg Tyr Ile Ile Glu Asn Asn Gly Leu Gln Lys Leu Phe

610 615 620

Thr Gly Asp Pro Arg Pro Leu Gly Lys Ile Leu Leu Lys Lys Thr Asn

625 630 635 640

Glu Trp Lys Arg Lys His Leu Ser Lys Lys

645 650

<210> 6

<211> 650

<212> PRT

<213> 人工

<220>

<223> 经修饰的流感嗜血杆菌NGT

<400> 6

Met Thr Lys Glu Asn Leu Gln Ser Val Pro Gln Asn Thr Thr Ala Ser

1 5 10 15

Leu Val Glu Ser Asn Asn Asp Gln Thr Ser Leu Gln Ile Leu Lys Gln

20 25 30

Pro Pro Lys Pro Asn Leu Leu Arg Leu Glu Gln His Val Ala Lys Lys

35 40 45

Asp Tyr Glu Leu Ala Cys Arg Glu Leu Met Ala Ile Leu Glu Lys Met

50 55 60

Asp Ala Asn Phe Gly Gly Val His Asp Ile Glu Phe Asp Ala Pro Ala

65 70 75 80

Gln Leu Ala Tyr Leu Pro Glu Lys Leu Leu Ile His Phe Ala Thr Arg

85 90 95

Leu Ala Asn Ala Ile Thr Thr Leu Phe Ser Asp Pro Glu Leu Ala Ile

100 105 110

Ser Glu Glu Gly Ala Leu Lys Met Ile Ser Leu Gln Arg Trp Leu Thr

115 120 125

Leu Ile Phe Ala Ser Ser Pro Tyr Val Asn Ala Asp His Ile Leu Asn

130 135 140

Lys Tyr Asn Ile Asn Pro Asp Ser Glu Gly Gly Phe His Leu Ala Thr

145 150 155 160

Asp Asn Ser Ser Ile Ala Lys Phe Cys Ile Phe Tyr Leu Pro Glu Ser

165 170 175

Asn Val Asn Met Ser Leu Asp Ala Leu Trp Ala Gly Asn Gln Gln Leu

180 185 190

Cys Ala Ser Leu Cys Phe Ala Leu Gln Ser Ser Arg Phe Ile Gly Thr

195 200 205

Ala Ser Ala Phe His Lys Arg Ala Val Val Leu Gln Trp Phe Pro Lys

210 215 220

Lys Leu Ala Glu Ile Ala Asn Leu Asp Glu Leu Pro Ala Asn Ile Leu

225 230 235 240

His Asp Val Tyr Met His Cys Ser Tyr Asp Leu Ala Lys Asn Lys His

245 250 255

Asp Val Lys Arg Pro Leu Asn Glu Leu Val Arg Lys His Ile Leu Thr

260 265 270

Gln Gly Trp Gln Asp Arg Tyr Leu Tyr Thr Leu Gly Lys Lys Asp Gly

275 280 285

Lys Pro Val Met Met Val Leu Leu Glu His Phe Asn Ser Gly His Ser

290 295 300

Ile Tyr Arg Thr His Ser Thr Ser Met Ile Ala Ala Arg Glu Lys Phe

305 310 315 320

Tyr Leu Val Gly Leu Gly His Glu Gly Val Asp Asn Ile Gly Arg Glu

325 330 335

Val Phe Asp Glu Phe Phe Glu Ile Ser Ser Asn Asn Ile Met Glu Arg

340 345 350

Leu Phe Phe Ile Arg Lys Gln Cys Glu Thr Phe Gln Pro Ala Val Phe

355 360 365

Tyr Met Pro Ser Ile Gly Met Asp Ile Thr Thr Ile Phe Val Ser Asn

370 375 380

Thr Arg Leu Ala Pro Ile Gln Ala Val Ala Leu Gly His Pro Ala Thr

385 390 395 400

Thr His Ser Glu Phe Ile Asp Tyr Val Ile Val Glu Asp Asp Tyr Val

405 410 415

Gly Ser Glu Asp Cys Phe Ser Glu Thr Leu Leu Arg Leu Pro Lys Asp

420 425 430

Ala Leu Pro Tyr Val Pro Ser Ala Leu Ala Pro Gln Lys Val Asp Tyr

435 440 445

Val Leu Arg Glu Asn Pro Glu Val Val Asn Ile Gly Ile Ala Ala Thr

450 455 460

Thr Met Lys Leu Asn Pro Glu Phe Leu Leu Thr Leu Gln Glu Ile Arg

465 470 475 480

Asp Lys Ala Lys Val Lys Ile His Phe His Phe Ala Leu Gly Ala Ser

485 490 495

Thr Gly Leu Thr His Pro Tyr Val Lys Trp Phe Ile Glu Ser Tyr Leu

500 505 510

Gly Asp Asp Ala Thr Ala His Pro His Ala Pro Tyr His Asp Tyr Leu

515 520 525

Ala Ile Leu Arg Asp Cys Asp Met Leu Leu Asn Pro Phe Pro Phe Gly

530 535 540

Asn Thr Asn Gly Ile Ile Asp Met Val Thr Leu Gly Leu Val Gly Val

545 550 555 560

Cys Lys Thr Gly Asp Glu Val His Glu His Ile Asp Glu Gly Leu Phe

565 570 575

Lys Arg Leu Gly Leu Pro Glu Trp Leu Ile Ala Asp Thr Arg Glu Thr

580 585 590

Tyr Ile Glu Cys Ala Leu Arg Leu Ala Glu Asn His Gln Glu Arg Leu

595 600 605

Glu Leu Arg Arg Tyr Ile Ile Glu Asn Asn Gly Leu Gln Lys Leu Phe

610 615 620

Thr Gly Asp Pro Arg Pro Leu Gly Lys Ile Leu Leu Lys Lys Thr Asn

625 630 635 640

Glu Trp Lys Arg Lys His Leu Ser Lys Lys

645 650

<210> 7

<211> 669

<212> PRT

<213> Mannheimia haemolytica（溶血曼海姆菌）

<400> 7

Met Ser Ala Glu Asn Met Pro Ser Val Ile Arg Phe Glu Gln Ala Val

1 5 10 15

Ala Lys Lys Asp Tyr Glu Ser Ala Cys Thr Glu Leu Leu Ser Ile Leu

20 25 30

Ser Lys Leu Asp Ser Asn Phe Gly Gly Ile Ser Asn Ile Glu Leu Asn

35 40 45

Met Pro Glu Gln Ile Glu Asn Leu Glu Asn Asp Lys Ala Ile Tyr Phe

50 55 60

Cys Thr Arg Met Ala Val Ala Ile Thr Arg Leu Phe Glu Asp Pro Ala

65 70 75 80

Leu Glu Ile Ser Glu His Gly Ala Met Arg Phe Leu Thr Leu Gln Arg

85 90 95

Trp Ile Ala Leu Ile Phe Ala Ser Ser Pro Tyr Val Asn Ala Asp His

100 105 110

Ile Leu Arg Thr Tyr Asn Arg Asn Lys Glu Ser Ala Asn Pro Asn Thr

115 120 125

Val Asp Leu Asp Ala Thr Leu Gln Ala Leu Ile Lys Phe Cys Ile Leu

130 135 140

Tyr Leu Pro Glu Ser Asn Ile Leu Leu Asn Leu Asp Ala Ala Trp Asn

145 150 155 160

Ala Ser Ser Asp Leu Thr Ala Ser Leu Cys Phe Ala Leu Gln Ser Pro

165 170 175

Arg Phe Ile Gly Thr Ser Ser Ala Phe Ala Lys Arg Ala Ala Ile Leu

180 185 190

Gln Trp Phe Pro Glu Lys Leu Ala Gln Ile Glu Asn Leu Asn Lys Leu

195 200 205

Pro Ser Ala Ile Ser His Asp Val Tyr Met His Cys Ser Tyr Asp Ile

210 215 220

Glu Ala Asn Lys His Asn Val Lys Arg Ser Leu Asn Ala Val Ile Arg

225 230 235 240

Arg His Leu Leu Ser Val Gly Trp Glu Asp Arg Lys Ile Glu Gln Leu

245 250 255

Gly Thr Arg Asn Asn Lys Pro Val Met Val Val Leu Leu Glu His Phe

260 265 270

His Ser Ser His Ser Ile Tyr Arg Thr His Ser Thr Ser Met Val Ala

275 280 285

Ala Arg Glu His Phe His Leu Ile Gly Leu Gly Ser Asp Ala Val Asp

290 295 300

Glu Met Gly Gln Gln Val Phe Asp Glu Phe His Leu Leu Pro Gln Asp

305 310 315 320

Gly Ser Leu Phe Asp Arg Leu Ser Phe Leu Lys Asp Ile Cys Asp Lys

325 330 335

Asn Asn Pro Ala Val Phe Tyr Met Pro Ser Ile Gly Met Asp Leu Thr

340 345 350

Thr Ile Phe Ala Ser Asn Thr Arg Leu Ala Pro Ile Gln Ala Val Ala

355 360 365

Leu Gly His Pro Ala Thr Thr His Ser Asp Phe Ile Glu Tyr Val Ile

370 375 380

Val Glu Asp Asp Tyr Val Gly Ser Glu Ser Cys Phe Ser Glu Gln Leu

385 390 395 400

Leu Arg Leu Pro Lys Asp Ala Leu Pro Tyr Val Pro Ser Ala Leu Ala

405 410 415

Pro Gln Asn Val Val Tyr Asn Leu Arg Glu Asn Pro Glu Val Ile His

420 425 430

Ile Gly Ile Ala Ser Thr Thr Met Lys Leu Asn Pro Tyr Phe Leu Glu

435 440 445

Ala Leu Lys Ala Ile Arg Asp Arg Ala Lys Val Lys Thr His Phe His

450 455 460

Phe Ala Leu Gly Gln Ser Ser Gly Ile Thr His Pro Tyr Val Glu Arg

465 470 475 480

Phe Ile Lys Ser Tyr Leu Gly Asn Asp Ala Thr Ala His Pro His Ser

485 490 495

Pro Tyr Asp Glu Tyr Leu Asn Ile Leu His Asn Cys Asp Met Met Leu

500 505 510

Asn Pro Phe Pro Phe Gly Asn Thr Asn Gly Ile Ile Asp Met Val Thr

515 520 525

Leu Gly Leu Val Gly Val Cys Lys Thr Gly Pro Glu Val His Glu His

530 535 540

Ile Asp Glu Gly Leu Phe Lys Arg Leu Gly Leu Pro Asn Trp Leu Ile

545 550 555 560

Thr Gln Thr Ala Glu Glu Tyr Val Thr Gln Ala Ile Arg Leu Ala Glu

565 570 575

Asn His Glu Glu Arg Leu Ala Ile Arg Arg Asp Ile Ile Glu Asn Asn

580 585 590

Lys Leu Gln Thr Leu Phe Ser Gly Asp Pro Arg Pro Met Gly Gln Ile

595 600 605

Phe Leu Ala Lys Val Gln Ala Trp Leu Ala Asp Lys Asn Pro Lys Asn

610 615 620

Ala Glu Val Glu Val Lys Thr Lys Lys Val Arg Lys Ala Ala Thr Ala

625 630 635 640

Ser Gln Ser Ala Lys Lys Gln Thr Thr Ser Lys Thr Gln Thr Ala Lys

645 650 655

Ala Glu Lys Asp Asn Ala Ala Lys Thr Glu Thr Lys Ser

660 665

<210> 8

<211> 669

<212> PRT

<213> 人工

<220>

<223> 经修饰的溶血曼海姆菌NGT

<400> 8

Met Ser Ala Glu Asn Met Pro Ser Val Ile Arg Phe Glu Gln Ala Val

1 5 10 15

Ala Lys Lys Asp Tyr Glu Ser Ala Cys Thr Glu Leu Leu Ser Ile Leu

20 25 30

Ser Lys Leu Asp Ser Asn Phe Gly Gly Ile Ser Asn Ile Glu Leu Asn

35 40 45

Met Pro Glu Gln Ile Glu Asn Leu Glu Asn Asp Lys Ala Ile Tyr Phe

50 55 60

Cys Thr Arg Met Ala Val Ala Ile Thr Arg Leu Phe Glu Asp Pro Ala

65 70 75 80

Leu Glu Ile Ser Glu His Gly Ala Met Arg Phe Leu Thr Leu Gln Arg

85 90 95

Trp Ile Ala Leu Ile Phe Ala Ser Ser Pro Tyr Val Asn Ala Asp His

100 105 110

Ile Leu Arg Thr Tyr Asn Arg Asn Lys Glu Ser Ala Asn Pro Asn Thr

115 120 125

Val Asp Leu Asp Ala Thr Leu Gln Ala Leu Ile Lys Phe Cys Ile Leu

130 135 140

Tyr Leu Pro Glu Ser Asn Ile Leu Leu Asn Leu Asp Ala Ala Trp Asn

145 150 155 160

Ala Ser Ser Asp Leu Thr Ala Ser Leu Cys Phe Ala Leu Gln Ser Pro

165 170 175

Arg Phe Ile Gly Thr Ser Ser Ala Phe Ala Lys Arg Ala Ala Ile Leu

180 185 190

Gln Trp Phe Pro Glu Lys Leu Ala Gln Ile Glu Asn Leu Asn Lys Leu

195 200 205

Pro Ser Ala Ile Ser His Asp Val Tyr Met His Cys Ser Tyr Asp Ile

210 215 220

Glu Ala Asn Lys His Asn Val Lys Arg Ser Leu Asn Ala Val Ile Arg

225 230 235 240

Arg His Leu Leu Ser Val Gly Trp Glu Asp Arg Lys Ile Glu Gln Leu

245 250 255

Gly Thr Arg Asn Asn Lys Pro Val Met Val Val Leu Leu Glu His Phe

260 265 270

His Ser Ser His Ser Ile Tyr Arg Thr His Ser Thr Ser Met Val Ala

275 280 285

Ala Arg Glu His Phe His Leu Ile Gly Leu Gly Ser Asp Ala Val Asp

290 295 300

Glu Met Gly Gln Gln Val Phe Asp Glu Phe His Leu Leu Pro Gln Asp

305 310 315 320

Gly Ser Leu Phe Asp Arg Leu Ser Phe Leu Lys Asp Ile Cys Asp Lys

325 330 335

Asn Asn Pro Ala Val Phe Tyr Met Pro Ser Ile Gly Met Asp Leu Thr

340 345 350

Thr Ile Phe Ala Ser Asn Thr Arg Leu Ala Pro Ile Gln Ala Val Ala

355 360 365

Leu Gly His Pro Ala Thr Thr His Ser Asp Phe Ile Glu Tyr Val Ile

370 375 380

Val Glu Asp Asp Tyr Val Gly Ser Glu Ser Cys Phe Ser Glu Gln Leu

385 390 395 400

Leu Arg Leu Pro Lys Asp Ala Leu Pro Tyr Val Pro Ser Ala Leu Ala

405 410 415

Pro Gln Asn Val Val Tyr Asn Leu Arg Glu Asn Pro Glu Val Ile His

420 425 430

Ile Gly Ile Ala Ser Thr Thr Met Lys Leu Asn Pro Tyr Phe Leu Glu

435 440 445

Ala Leu Lys Ala Ile Arg Asp Arg Ala Lys Val Lys Thr His Phe His

450 455 460

Phe Ala Leu Gly Ala Ser Ser Gly Ile Thr His Pro Tyr Val Glu Arg

465 470 475 480

Phe Ile Lys Ser Tyr Leu Gly Asn Asp Ala Thr Ala His Pro His Ser

485 490 495

Pro Tyr Asp Glu Tyr Leu Asn Ile Leu His Asn Cys Asp Met Met Leu

500 505 510

Asn Pro Phe Pro Phe Gly Asn Thr Asn Gly Ile Ile Asp Met Val Thr

515 520 525

Leu Gly Leu Val Gly Val Cys Lys Thr Gly Pro Glu Val His Glu His

530 535 540

Ile Asp Glu Gly Leu Phe Lys Arg Leu Gly Leu Pro Asn Trp Leu Ile

545 550 555 560

Thr Gln Thr Ala Glu Glu Tyr Val Thr Gln Ala Ile Arg Leu Ala Glu

565 570 575

Asn His Glu Glu Arg Leu Ala Ile Arg Arg Asp Ile Ile Glu Asn Asn

580 585 590

Lys Leu Gln Thr Leu Phe Ser Gly Asp Pro Arg Pro Met Gly Gln Ile

595 600 605

Phe Leu Ala Lys Val Gln Ala Trp Leu Ala Asp Lys Asn Pro Lys Asn

610 615 620

Ala Glu Val Glu Val Lys Thr Lys Lys Val Arg Lys Ala Ala Thr Ala

625 630 635 640

Ser Gln Ser Ala Lys Lys Gln Thr Thr Ser Lys Thr Gln Thr Ala Lys

645 650 655

Ala Glu Lys Asp Asn Ala Ala Lys Thr Glu Thr Lys Ser

660 665

<210> 9

<211> 654

<212> PRT

<213> Haemophilus dureyi（杜雷嗜血杆菌）

<400> 9

Met Glu Leu His Ser Pro Ser Leu Glu Lys Phe Glu Ala Ala Val Ile

1 5 10 15

Glu Lys Asp Tyr Glu Leu Ala Cys Thr Glu Leu Leu Ala Ile Leu Asp

20 25 30

Lys Leu Asp Asn Asn Phe Gly Thr Leu Gln Asp Ile Glu Phe Ala Tyr

35 40 45

Pro Pro Gln Leu Glu Asp Leu Glu Gln Asp Lys Val Val Tyr Phe Cys

50 55 60

Thr Arg Met Ala Thr Val Ile Thr Thr Leu Phe Thr Asp Val Glu Phe

65 70 75 80

Ala Ile Ser Ser Ala Gly Ala Gln Arg Phe Leu Val Phe Gln Arg Trp

85 90 95

Leu Ser Phe Ile Phe Ala Ser Ser Pro Phe Ile Asn Ala Asp His Ile

100 105 110

Leu Gln Ser Tyr Asn Cys Asn Pro Asp Arg Asp Ile Glu Asp Asp Ile

115 120 125

His Leu Ala Ala Thr Lys Glu Ala Leu Ile Lys Phe Cys Val Met Tyr

130 135 140

Leu Pro Glu Ser Asn Leu Lys Leu Asn Leu Asp Ala Ala Trp Asn Val

145 150 155 160

Asp Pro Glu Leu Cys Ala Ser Leu Cys Phe Ala Leu Gln Ser Pro Arg

165 170 175

Phe Leu Gly Thr Val Ala Ala Tyr Ser Lys Arg Ser Ala Ile Leu Gln

180 185 190

Trp Phe Pro Glu His Leu Ala Gln Leu Ala Asn Leu Asp Asn Ile Pro

195 200 205

Ser Ala Ile Ser His Asp Val Tyr Met His Cys Ser Tyr Asp Ile Ala

210 215 220

Glu Asn Lys His Ala Val Lys Lys Ala Leu Asn Gln Val Ile Arg Arg

225 230 235 240

His Val Val Asn Glu Tyr Gly Trp Gln Asp Arg Asp Thr Thr Arg Ile

245 250 255

Gly Tyr Arg Asn Asp Lys Pro Val Met Val Val Leu Leu Glu His Phe

260 265 270

His Ser Ala His Ser Ile Tyr Arg Thr His Ser Thr Ser Met Ile Ala

275 280 285

Ala Arg Glu His Phe Tyr Leu Ile Gly Leu Gly Ser Lys Ala Val Asp

290 295 300

Ala Asn Gly Gln Ala Val Phe Asp Glu Phe His Leu Leu Glu Asp Asp

305 310 315 320

Asn Met Lys Asp Lys Leu Asp His Ile Arg Ser Ile Cys Glu Gln Asn

325 330 335

Gly Ala Ala Ile Leu Tyr Met Pro Ser Val Gly Met Asp Leu Ser Thr

340 345 350

Ile Phe Val Ser Asn Thr Arg Leu Ala Pro Ile Gln Val Ile Ala Leu

355 360 365

Gly His Pro Ala Thr Thr Tyr Ser Glu Phe Ile Asp Tyr Val Ile Val

370 375 380

Glu Glu Asp Tyr Ile Gly Ser Glu Ala Cys Phe Ser Glu Thr Leu Leu

385 390 395 400

Pro Leu Pro Lys Asp Ala Leu Pro Tyr Val Pro Ser Ala Leu Ala Pro

405 410 415

Glu Lys Val Glu Tyr Leu Leu Arg Glu Asn Pro Glu Val Val Asn Ile

420 425 430

Gly Ile Ala Ala Thr Thr Met Lys Leu Asn Pro Tyr Phe Leu Asp Ala

435 440 445

Leu Lys Val Ile Arg Asp Arg Ala Lys Val Lys Ile His Phe His Phe

450 455 460

Ala Leu Gly Gln Ser Thr Gly Val Thr His Pro His Ile Ala Arg Phe

465 470 475 480

Ile Lys Ser Tyr Leu Gly Asp Ser Ala Thr Ala Tyr Pro His Ala Pro

485 490 495

Tyr His Gln Tyr Leu Thr Val Leu His Asn Cys Asp Met Met Leu Asn

500 505 510

Pro Phe Pro Phe Gly Asn Thr Asn Gly Ile Ile Asp Met Val Thr Leu

515 520 525

Gly Leu Val Gly Ile Cys Lys Thr Gly Asp Glu Val His Glu His Ile

530 535 540

Asp Glu Gly Leu Phe Lys Arg Leu Gly Leu Pro Glu Trp Leu Ile Ala

545 550 555 560

Asp Thr Val Asp Glu Tyr Ile Glu Cys Ala Leu Arg Leu Ala Glu Asn

565 570 575

His Thr Glu Arg Leu Ala Leu Arg Arg His Ile Ile Glu Asn Asn Gly

580 585 590

Leu Ala Thr Leu Phe Thr Gly Asp Pro Ser Pro Met Gly Ser Val Leu

595 600 605

Leu Ala Lys Leu Asn Glu Trp Arg Glu Gln Gln Lys Thr Val Ala Pro

610 615 620

Leu Lys Lys Thr Lys Lys Val Ala Lys Lys Ala Thr Glu Thr Asn Lys

625 630 635 640

Ser Val Thr Lys Lys Pro Val Ala Lys Lys Lys Arg Ser Ser

645 650

<210> 10

<211> 654

<212> PRT

<213> 人工

<220>

<223> 经修饰的杜雷嗜血杆菌NGT

<400> 10

Met Glu Leu His Ser Pro Ser Leu Glu Lys Phe Glu Ala Ala Val Ile

1 5 10 15

Glu Lys Asp Tyr Glu Leu Ala Cys Thr Glu Leu Leu Ala Ile Leu Asp

20 25 30

Lys Leu Asp Asn Asn Phe Gly Thr Leu Gln Asp Ile Glu Phe Ala Tyr

35 40 45

Pro Pro Gln Leu Glu Asp Leu Glu Gln Asp Lys Val Val Tyr Phe Cys

50 55 60

Thr Arg Met Ala Thr Val Ile Thr Thr Leu Phe Thr Asp Val Glu Phe

65 70 75 80

Ala Ile Ser Ser Ala Gly Ala Gln Arg Phe Leu Val Phe Gln Arg Trp

85 90 95

Leu Ser Phe Ile Phe Ala Ser Ser Pro Phe Ile Asn Ala Asp His Ile

100 105 110

Leu Gln Ser Tyr Asn Cys Asn Pro Asp Arg Asp Ile Glu Asp Asp Ile

115 120 125

His Leu Ala Ala Thr Lys Glu Ala Leu Ile Lys Phe Cys Val Met Tyr

130 135 140

Leu Pro Glu Ser Asn Leu Lys Leu Asn Leu Asp Ala Ala Trp Asn Val

145 150 155 160

Asp Pro Glu Leu Cys Ala Ser Leu Cys Phe Ala Leu Gln Ser Pro Arg

165 170 175

Phe Leu Gly Thr Val Ala Ala Tyr Ser Lys Arg Ser Ala Ile Leu Gln

180 185 190

Trp Phe Pro Glu His Leu Ala Gln Leu Ala Asn Leu Asp Asn Ile Pro

195 200 205

Ser Ala Ile Ser His Asp Val Tyr Met His Cys Ser Tyr Asp Ile Ala

210 215 220

Glu Asn Lys His Ala Val Lys Lys Ala Leu Asn Gln Val Ile Arg Arg

225 230 235 240

His Val Val Asn Glu Tyr Gly Trp Gln Asp Arg Asp Thr Thr Arg Ile

245 250 255

Gly Tyr Arg Asn Asp Lys Pro Val Met Val Val Leu Leu Glu His Phe

260 265 270

His Ser Ala His Ser Ile Tyr Arg Thr His Ser Thr Ser Met Ile Ala

275 280 285

Ala Arg Glu His Phe Tyr Leu Ile Gly Leu Gly Ser Lys Ala Val Asp

290 295 300

Ala Asn Gly Gln Ala Val Phe Asp Glu Phe His Leu Leu Glu Asp Asp

305 310 315 320

Asn Met Lys Asp Lys Leu Asp His Ile Arg Ser Ile Cys Glu Gln Asn

325 330 335

Gly Ala Ala Ile Leu Tyr Met Pro Ser Val Gly Met Asp Leu Ser Thr

340 345 350

Ile Phe Val Ser Asn Thr Arg Leu Ala Pro Ile Gln Val Ile Ala Leu

355 360 365

Gly His Pro Ala Thr Thr Tyr Ser Glu Phe Ile Asp Tyr Val Ile Val

370 375 380

Glu Glu Asp Tyr Ile Gly Ser Glu Ala Cys Phe Ser Glu Thr Leu Leu

385 390 395 400

Pro Leu Pro Lys Asp Ala Leu Pro Tyr Val Pro Ser Ala Leu Ala Pro

405 410 415

Glu Lys Val Glu Tyr Leu Leu Arg Glu Asn Pro Glu Val Val Asn Ile

420 425 430

Gly Ile Ala Ala Thr Thr Met Lys Leu Asn Pro Tyr Phe Leu Asp Ala

435 440 445

Leu Lys Val Ile Arg Asp Arg Ala Lys Val Lys Ile His Phe His Phe

450 455 460

Ala Leu Gly Ala Ser Thr Gly Val Thr His Pro His Ile Ala Arg Phe

465 470 475 480

Ile Lys Ser Tyr Leu Gly Asp Ser Ala Thr Ala Tyr Pro His Ala Pro

485 490 495

Tyr His Gln Tyr Leu Thr Val Leu His Asn Cys Asp Met Met Leu Asn

500 505 510

Pro Phe Pro Phe Gly Asn Thr Asn Gly Ile Ile Asp Met Val Thr Leu

515 520 525

Gly Leu Val Gly Ile Cys Lys Thr Gly Asp Glu Val His Glu His Ile

530 535 540

Asp Glu Gly Leu Phe Lys Arg Leu Gly Leu Pro Glu Trp Leu Ile Ala

545 550 555 560

Asp Thr Val Asp Glu Tyr Ile Glu Cys Ala Leu Arg Leu Ala Glu Asn

565 570 575

His Thr Glu Arg Leu Ala Leu Arg Arg His Ile Ile Glu Asn Asn Gly

580 585 590

Leu Ala Thr Leu Phe Thr Gly Asp Pro Ser Pro Met Gly Ser Val Leu

595 600 605

Leu Ala Lys Leu Asn Glu Trp Arg Glu Gln Gln Lys Thr Val Ala Pro

610 615 620

Leu Lys Lys Thr Lys Lys Val Ala Lys Lys Ala Thr Glu Thr Asn Lys

625 630 635 640

Ser Val Thr Lys Lys Pro Val Ala Lys Lys Lys Arg Ser Ser

645 650

<210> 11

<211> 690

<212> PRT

<213> Bibersteinia trehalosi（海藻百伯史坦菌）

<400> 11

Met Ser Gln Glu Gln Lys Thr Pro Ser Val Ile Arg Phe Glu Gln Ala

1 5 10 15

Val Lys Ala Lys Gln Tyr Glu Ser Ala Cys Asn Glu Leu Leu Asp Ile

20 25 30

Leu Ser Gln Ile Asp Ser Asn Phe Gly Gly Ile Asn Gly Ile Glu Phe

35 40 45

Asn Cys Pro Glu Gln Leu Asn Asn Pro Asn Leu Ser Lys Glu Lys Thr

50 55 60

Ile Tyr Phe Ser Thr Arg Met Ala Asp Leu Ile Thr Glu Leu Phe Ser

65 70 75 80

Asp Glu Ser Leu Ser Leu Thr Val Gly Gly Ala Val Arg Phe Phe Ser

85 90 95

Tyr Gln Arg Trp Ile Ala Leu Leu Phe Ala Cys Ser Pro Tyr Ile Asn

100 105 110

Ser Asp His Ile Leu Gln Val Tyr Asn Arg Asn Pro Asp Lys Ser Asn

115 120 125

Pro Asn Ser Val His Leu Ser Ala Asn Pro Asn Asp Leu Val Lys Phe

130 135 140

Cys Ile Met Tyr Leu Pro Glu Ser Asn Ile Ser Leu Asn Leu Asp Ala

145 150 155 160

Ile Trp Gln Leu Asn Pro Thr Leu Cys Ala Ser Met Cys Phe Ala Leu

165 170 175

Gln Ser Pro Arg Phe Ile Gly Thr Lys Glu Ala Phe Gly Lys Arg Gly

180 185 190

Ala Ile Leu Gln Trp Phe Pro Glu Lys Leu Ala Gln Leu Pro Asn Leu

195 200 205

Asp Asn Leu Pro Ser Ser Ile Ser His Asp Val Tyr Met His Cys Ser

210 215 220

Tyr Asp Val Ala Ala Asn Lys His Asp Val Lys Arg Ala Leu Asn Gln

225 230 235 240

Val Met Arg Arg His Leu Val Thr Ser Gly Trp Val Asp Arg Asp Ile

245 250 255

Ser Lys Ile Gly Lys Thr Asn Gly Lys Pro Val Met Val Val Leu Leu

260 265 270

Glu His Phe His Ser Ala His Ser Ile Tyr Arg Thr His Ser Thr Ser

275 280 285

Met Arg Ala Ala Arg Glu His Phe His Leu Ile Gly Ile Gly Gly Ser

290 295 300

Ala Val Asp Lys Ala Gly Gln Glu Val Phe Asp Asp Phe Arg Leu Val

305 310 315 320

Glu Gly Asn Thr Ile Phe Glu Lys Leu Ser Phe Val Lys Arg Leu Cys

325 330 335

Glu Glu Tyr Gly Ala Ala Ile Phe Tyr Met Pro Ser Ile Gly Met Asp

340 345 350

Leu Thr Thr Ile Phe Ala Ser Asn Thr Arg Leu Ala Pro Ile Gln Ala

355 360 365

Ile Ala Leu Gly His Pro Gly Thr Thr His Ser Glu Phe Ile Glu Tyr

370 375 380

Val Val Val Glu Asp Asp Tyr Val Gly Ser Glu Ala Cys Phe Ser Glu

385 390 395 400

Lys Leu Leu Arg Leu Pro Lys Asp Ala Leu Pro Tyr Val Pro Ser Ala

405 410 415

Leu Ala Pro Ala Ser Val Glu Tyr Arg Leu Arg Glu Asn Pro Glu Val

420 425 430

Val Asn Ile Gly Ile Ala Ser Thr Thr Met Lys Leu Asn Pro Tyr Phe

435 440 445

Leu Asp Ala Leu Lys Ala Ile Arg Asp Arg Ala Lys Val Lys Val His

450 455 460

Phe His Phe Ala Leu Gly Gln Ser Ser Gly Ile Thr His Pro Tyr Val

465 470 475 480

Glu Arg Phe Ile Lys Ser His Leu Gly Asp Ser Ala Thr Ala His Pro

485 490 495

His Ser Pro Tyr His Gln Tyr Met Gln Ile Leu His Asn Cys Asp Met

500 505 510

Leu Val Asn Pro Phe Pro Phe Gly Asn Thr Asn Gly Ile Ile Asp Met

515 520 525

Val Thr Leu Gly Leu Val Gly Ile Cys Lys Thr Gly Pro Glu Val His

530 535 540

Glu His Ile Asp Glu Gly Leu Phe Lys Arg Leu Gly Leu Pro Glu Trp

545 550 555 560

Leu Ile Ala Asn Thr Val Asp Glu Tyr Val Glu Arg Ala Val Arg Leu

565 570 575

Ala Glu Asn His Ala Glu Arg Leu Ala Leu Arg Arg His Ile Ile Glu

580 585 590

Asn Asn Gly Leu Gln Thr Leu Phe Thr Gly Asp Pro Lys Pro Met Gly

595 600 605

Gln Val Phe Val Gln Lys Leu Asn Glu Trp Ala Gly Leu His Asn Ile

610 615 620

Asp Val Ser Asp Phe Ala Phe Ala Gln Ser Ser Gly Lys Lys Val Thr

625 630 635 640

Lys Ser Ala Lys Thr Ala Ala Lys Lys Thr Val Lys Val Thr Val Lys

645 650 655

Lys Ser Ala Gln Pro Lys Glu Ser Thr Lys Thr Lys Ser Lys Thr Glu

660 665 670

Lys Lys Lys Thr Ser Ser Val Lys Asp Ala Ala Lys Thr Ser Lys Lys

675 680 685

Lys Ala

690

<210> 12

<211> 690

<212> PRT

<213> 人工

<220>

<223> 经修饰的海藻百伯史坦菌NGT

<400> 12

Met Ser Gln Glu Gln Lys Thr Pro Ser Val Ile Arg Phe Glu Gln Ala

1 5 10 15

Val Lys Ala Lys Gln Tyr Glu Ser Ala Cys Asn Glu Leu Leu Asp Ile

20 25 30

Leu Ser Gln Ile Asp Ser Asn Phe Gly Gly Ile Asn Gly Ile Glu Phe

35 40 45

Asn Cys Pro Glu Gln Leu Asn Asn Pro Asn Leu Ser Lys Glu Lys Thr

50 55 60

Ile Tyr Phe Ser Thr Arg Met Ala Asp Leu Ile Thr Glu Leu Phe Ser

65 70 75 80

Asp Glu Ser Leu Ser Leu Thr Val Gly Gly Ala Val Arg Phe Phe Ser

85 90 95

Tyr Gln Arg Trp Ile Ala Leu Leu Phe Ala Cys Ser Pro Tyr Ile Asn

100 105 110

Ser Asp His Ile Leu Gln Val Tyr Asn Arg Asn Pro Asp Lys Ser Asn

115 120 125

Pro Asn Ser Val His Leu Ser Ala Asn Pro Asn Asp Leu Val Lys Phe

130 135 140

Cys Ile Met Tyr Leu Pro Glu Ser Asn Ile Ser Leu Asn Leu Asp Ala

145 150 155 160

Ile Trp Gln Leu Asn Pro Thr Leu Cys Ala Ser Met Cys Phe Ala Leu

165 170 175

Gln Ser Pro Arg Phe Ile Gly Thr Lys Glu Ala Phe Gly Lys Arg Gly

180 185 190

Ala Ile Leu Gln Trp Phe Pro Glu Lys Leu Ala Gln Leu Pro Asn Leu

195 200 205

Asp Asn Leu Pro Ser Ser Ile Ser His Asp Val Tyr Met His Cys Ser

210 215 220

Tyr Asp Val Ala Ala Asn Lys His Asp Val Lys Arg Ala Leu Asn Gln

225 230 235 240

Val Met Arg Arg His Leu Val Thr Ser Gly Trp Val Asp Arg Asp Ile

245 250 255

Ser Lys Ile Gly Lys Thr Asn Gly Lys Pro Val Met Val Val Leu Leu

260 265 270

Glu His Phe His Ser Ala His Ser Ile Tyr Arg Thr His Ser Thr Ser

275 280 285

Met Arg Ala Ala Arg Glu His Phe His Leu Ile Gly Ile Gly Gly Ser

290 295 300

Ala Val Asp Lys Ala Gly Gln Glu Val Phe Asp Asp Phe Arg Leu Val

305 310 315 320

Glu Gly Asn Thr Ile Phe Glu Lys Leu Ser Phe Val Lys Arg Leu Cys

325 330 335

Glu Glu Tyr Gly Ala Ala Ile Phe Tyr Met Pro Ser Ile Gly Met Asp

340 345 350

Leu Thr Thr Ile Phe Ala Ser Asn Thr Arg Leu Ala Pro Ile Gln Ala

355 360 365

Ile Ala Leu Gly His Pro Gly Thr Thr His Ser Glu Phe Ile Glu Tyr

370 375 380

Val Val Val Glu Asp Asp Tyr Val Gly Ser Glu Ala Cys Phe Ser Glu

385 390 395 400

Lys Leu Leu Arg Leu Pro Lys Asp Ala Leu Pro Tyr Val Pro Ser Ala

405 410 415

Leu Ala Pro Ala Ser Val Glu Tyr Arg Leu Arg Glu Asn Pro Glu Val

420 425 430

Val Asn Ile Gly Ile Ala Ser Thr Thr Met Lys Leu Asn Pro Tyr Phe

435 440 445

Leu Asp Ala Leu Lys Ala Ile Arg Asp Arg Ala Lys Val Lys Val His

450 455 460

Phe His Phe Ala Leu Gly Ala Ser Ser Gly Ile Thr His Pro Tyr Val

465 470 475 480

Glu Arg Phe Ile Lys Ser His Leu Gly Asp Ser Ala Thr Ala His Pro

485 490 495

His Ser Pro Tyr His Gln Tyr Met Gln Ile Leu His Asn Cys Asp Met

500 505 510

Leu Val Asn Pro Phe Pro Phe Gly Asn Thr Asn Gly Ile Ile Asp Met

515 520 525

Val Thr Leu Gly Leu Val Gly Ile Cys Lys Thr Gly Pro Glu Val His

530 535 540

Glu His Ile Asp Glu Gly Leu Phe Lys Arg Leu Gly Leu Pro Glu Trp

545 550 555 560

Leu Ile Ala Asn Thr Val Asp Glu Tyr Val Glu Arg Ala Val Arg Leu

565 570 575

Ala Glu Asn His Ala Glu Arg Leu Ala Leu Arg Arg His Ile Ile Glu

580 585 590

Asn Asn Gly Leu Gln Thr Leu Phe Thr Gly Asp Pro Lys Pro Met Gly

595 600 605

Gln Val Phe Val Gln Lys Leu Asn Glu Trp Ala Gly Leu His Asn Ile

610 615 620

Asp Val Ser Asp Phe Ala Phe Ala Gln Ser Ser Gly Lys Lys Val Thr

625 630 635 640

Lys Ser Ala Lys Thr Ala Ala Lys Lys Thr Val Lys Val Thr Val Lys

645 650 655

Lys Ser Ala Gln Pro Lys Glu Ser Thr Lys Thr Lys Ser Lys Thr Glu

660 665 670

Lys Lys Lys Thr Ser Ser Val Lys Asp Ala Ala Lys Thr Ser Lys Lys

675 680 685

Lys Ala

690

<210> 13

<211> 621

<212> PRT

<213> Aggregatibacter aphrophilus（嗜沫聚合杆菌）

<400> 13

Met Ser Glu Lys Lys Asn Pro Ser Val Ile Gln Phe Glu Lys Ala Ile

1 5 10 15

Arg Glu Lys Asn Tyr Glu Ala Ala Cys Thr Glu Leu Leu Asp Ile Leu

20 25 30

Asn Lys Ile Asp Thr Asn Phe Gly Asp Ile Glu Gly Ile Asp Phe Asp

35 40 45

Tyr Pro Gln Gln Leu Lys Thr Leu Met Gln Glu Arg Ile Val Tyr Phe

50 55 60

Cys Thr Arg Met Ala Asn Ala Ile Thr Gln Leu Phe Cys Asp Pro Gln

65 70 75 80

Phe Ser Leu Ser Glu Ser Gly Ala Asn Arg Phe Phe Val Val Gln Arg

85 90 95

Trp Leu Asn Leu Ile Phe Ala Ser Ser Pro Tyr Ile Asn Ala Asp His

100 105 110

Ile Leu Gln Thr Tyr Asn Cys Asn Pro Glu Arg Asp Ser Ile Tyr Asp

115 120 125

Ile Tyr Leu Glu Pro Asn Lys Asn Val Leu Met Lys Phe Ala Val Leu

130 135 140

Tyr Leu Pro Glu Ser Asn Val Asn Leu Asn Leu Asp Thr Met Trp Glu

145 150 155 160

Thr Asp Lys Asn Ile Cys Gly Ser Leu Cys Phe Ala Leu Gln Ser Pro

165 170 175

Arg Phe Ile Gly Thr Pro Ala Ala Phe Ser Lys Arg Ser Thr Ile Leu

180 185 190

Gln Trp Phe Pro Ala Lys Leu Glu Gln Phe His Val Leu Asp Asp Leu

195 200 205

Pro Ser Asn Ile Ser His Asp Val Tyr Met His Cys Ser Tyr Asp Thr

210 215 220

Ala Glu Asn Lys His Asn Val Lys Lys Ala Leu Asn Gln Val Ile Arg

225 230 235 240

Ser His Leu Leu Lys Cys Gly Trp Gln Asp Arg Gln Ile Thr Gln Ile

245 250 255

Gly Met Arg Asn Gly Lys Pro Val Met Val Val Val Leu Glu His Phe

260 265 270

His Ser Ser His Ser Ile Tyr Arg Thr His Ser Thr Ser Met Ile Ala

275 280 285

Ala Arg Glu Gln Phe Tyr Leu Ile Gly Leu Gly Asn Asn Ala Val Asp

290 295 300

Gln Ala Gly Arg Asp Val Phe Asp Glu Phe His Glu Phe Asp Asp Ser

305 310 315 320

Asn Ile Leu Lys Lys Leu Ala Phe Leu Lys Glu Met Cys Glu Lys Asn

325 330 335

Asp Ala Ala Val Leu Tyr Met Pro Ser Ile Gly Met Asp Leu Ala Thr

340 345 350

Ile Phe Val Ser Asn Ala Arg Phe Ala Pro Ile Gln Val Ile Ala Leu

355 360 365

Gly His Pro Ala Thr Thr His Ser Glu Phe Ile Glu Tyr Val Ile Val

370 375 380

Glu Asp Asp Tyr Val Gly Ser Val Ser Cys Phe Ser Glu Thr Leu Leu

385 390 395 400

Arg Leu Pro Lys Asp Ala Leu Pro Tyr Val Pro Ser Ser Leu Ala Pro

405 410 415

Thr Asp Val Gln Tyr Val Leu Gln Glu Thr Pro Glu Val Val Asn Ile

420 425 430

Gly Ile Ala Ala Thr Thr Met Lys Leu Asn Pro Tyr Phe Leu Glu Thr

435 440 445

Leu Lys Thr Ile Arg Asp Arg Ala Lys Val Lys Val His Phe His Phe

450 455 460

Ala Leu Gly Gln Ser Ile Gly Ile Thr His Pro Tyr Val Ala Arg Phe

465 470 475 480

Ile Arg Ser Tyr Leu Gly Asn Asp Ala Thr Ala His Pro His Ser Pro

485 490 495

Tyr Asn Arg Tyr Leu Asp Ile Leu His Asn Cys Asp Met Met Leu Asn

500 505 510

Pro Phe Pro Phe Gly Asn Thr Asn Gly Ile Ile Asp Met Val Thr Leu

515 520 525

Gly Leu Val Gly Val Cys Lys Thr Gly Pro Glu Val His Glu His Ile

530 535 540

Asp Glu Gly Leu Phe Lys Arg Leu Gly Leu Pro Glu Trp Leu Ile Ala

545 550 555 560

Asp Ser Val Glu Asp Tyr Ile Glu Arg Ala Ile Arg Leu Ala Glu Asn

565 570 575

His Gln Glu Arg Leu Ala Leu Arg Arg His Ile Ile Glu Asn Asn Gly

580 585 590

Leu Lys Thr Leu Phe Ser Gly Asp Pro Ser Pro Met Gly Lys Met Leu

595 600 605

Phe Ala Lys Leu Thr Glu Trp Arg Gln Thr Asn Gly Ile

610 615 620

<210> 14

<211> 621

<212> PRT

<213> 人工

<220>

<223> 经修饰的嗜沫聚合杆菌NGT

<400> 14

Met Ser Glu Lys Lys Asn Pro Ser Val Ile Gln Phe Glu Lys Ala Ile

1 5 10 15

Arg Glu Lys Asn Tyr Glu Ala Ala Cys Thr Glu Leu Leu Asp Ile Leu

20 25 30

Asn Lys Ile Asp Thr Asn Phe Gly Asp Ile Glu Gly Ile Asp Phe Asp

35 40 45

Tyr Pro Gln Gln Leu Lys Thr Leu Met Gln Glu Arg Ile Val Tyr Phe

50 55 60

Cys Thr Arg Met Ala Asn Ala Ile Thr Gln Leu Phe Cys Asp Pro Gln

65 70 75 80

Phe Ser Leu Ser Glu Ser Gly Ala Asn Arg Phe Phe Val Val Gln Arg

85 90 95

Trp Leu Asn Leu Ile Phe Ala Ser Ser Pro Tyr Ile Asn Ala Asp His

100 105 110

Ile Leu Gln Thr Tyr Asn Cys Asn Pro Glu Arg Asp Ser Ile Tyr Asp

115 120 125

Ile Tyr Leu Glu Pro Asn Lys Asn Val Leu Met Lys Phe Ala Val Leu

130 135 140

Tyr Leu Pro Glu Ser Asn Val Asn Leu Asn Leu Asp Thr Met Trp Glu

145 150 155 160

Thr Asp Lys Asn Ile Cys Gly Ser Leu Cys Phe Ala Leu Gln Ser Pro

165 170 175

Arg Phe Ile Gly Thr Pro Ala Ala Phe Ser Lys Arg Ser Thr Ile Leu

180 185 190

Gln Trp Phe Pro Ala Lys Leu Glu Gln Phe His Val Leu Asp Asp Leu

195 200 205

Pro Ser Asn Ile Ser His Asp Val Tyr Met His Cys Ser Tyr Asp Thr

210 215 220

Ala Glu Asn Lys His Asn Val Lys Lys Ala Leu Asn Gln Val Ile Arg

225 230 235 240

Ser His Leu Leu Lys Cys Gly Trp Gln Asp Arg Gln Ile Thr Gln Ile

245 250 255

Gly Met Arg Asn Gly Lys Pro Val Met Val Val Val Leu Glu His Phe

260 265 270

His Ser Ser His Ser Ile Tyr Arg Thr His Ser Thr Ser Met Ile Ala

275 280 285

Ala Arg Glu Gln Phe Tyr Leu Ile Gly Leu Gly Asn Asn Ala Val Asp

290 295 300

Gln Ala Gly Arg Asp Val Phe Asp Glu Phe His Glu Phe Asp Asp Ser

305 310 315 320

Asn Ile Leu Lys Lys Leu Ala Phe Leu Lys Glu Met Cys Glu Lys Asn

325 330 335

Asp Ala Ala Val Leu Tyr Met Pro Ser Ile Gly Met Asp Leu Ala Thr

340 345 350

Ile Phe Val Ser Asn Ala Arg Phe Ala Pro Ile Gln Val Ile Ala Leu

355 360 365

Gly His Pro Ala Thr Thr His Ser Glu Phe Ile Glu Tyr Val Ile Val

370 375 380

Glu Asp Asp Tyr Val Gly Ser Val Ser Cys Phe Ser Glu Thr Leu Leu

385 390 395 400

Arg Leu Pro Lys Asp Ala Leu Pro Tyr Val Pro Ser Ser Leu Ala Pro

405 410 415

Thr Asp Val Gln Tyr Val Leu Gln Glu Thr Pro Glu Val Val Asn Ile

420 425 430

Gly Ile Ala Ala Thr Thr Met Lys Leu Asn Pro Tyr Phe Leu Glu Thr

435 440 445

Leu Lys Thr Ile Arg Asp Arg Ala Lys Val Lys Val His Phe His Phe

450 455 460

Ala Leu Gly Ala Ser Ile Gly Ile Thr His Pro Tyr Val Ala Arg Phe

465 470 475 480

Ile Arg Ser Tyr Leu Gly Asn Asp Ala Thr Ala His Pro His Ser Pro

485 490 495

Tyr Asn Arg Tyr Leu Asp Ile Leu His Asn Cys Asp Met Met Leu Asn

500 505 510

Pro Phe Pro Phe Gly Asn Thr Asn Gly Ile Ile Asp Met Val Thr Leu

515 520 525

Gly Leu Val Gly Val Cys Lys Thr Gly Pro Glu Val His Glu His Ile

530 535 540

Asp Glu Gly Leu Phe Lys Arg Leu Gly Leu Pro Glu Trp Leu Ile Ala

545 550 555 560

Asp Ser Val Glu Asp Tyr Ile Glu Arg Ala Ile Arg Leu Ala Glu Asn

565 570 575

His Gln Glu Arg Leu Ala Leu Arg Arg His Ile Ile Glu Asn Asn Gly

580 585 590

Leu Lys Thr Leu Phe Ser Gly Asp Pro Ser Pro Met Gly Lys Met Leu

595 600 605

Phe Ala Lys Leu Thr Glu Trp Arg Gln Thr Asn Gly Ile

610 615 620

<210> 15

<211> 619

<212> PRT

<213> Yersinia enterocolitica（小肠结肠炎耶尔森菌）

<400> 15

Met Val Asp Lys Thr Val Glu Val Ser Gln Glu Ala Glu Asn Leu Thr

1 5 10 15

Ala Phe Ser Leu Pro Tyr Phe Glu Phe Leu Val Cys Val Arg Arg Tyr

20 25 30

Glu Glu Ala Gly Arg Leu Leu Ile Leu Met Leu Glu Gln Leu Asp Thr

35 40 45

Gln Tyr Gly Arg Trp Asp Val Phe Ser Leu Lys Gln Gln Ser Ile Gln

50 55 60

Gln Gln Glu His Tyr Cys Asn Arg Leu Ala Ala Ala Ile Gly Asn Leu

65 70 75 80

Phe Ser Asp Pro Gly Phe Val Leu Ser Glu Lys Gly Phe Leu Gln Leu

85 90 95

Ile Asn Phe His Arg Trp Ile Ala Leu Ile Phe Ala Ala Ser Pro Phe

100 105 110

Gly His Ala Asp His Val Ile Thr Asn Leu Asn Gln Val Gly Glu Gly

115 120 125

Cys Ala His Pro Leu Arg Phe Glu Gln Asn Asn Phe Leu Lys Phe Cys

130 135 140

Val Met Tyr Leu Pro Glu Ser Gly Ile Pro Leu Gln Pro Asp Ile Leu

145 150 155 160

Trp Gln Phe Asn Pro Asn Ala Ala Ala Ala Leu Phe Leu Ala Leu Leu

165 170 175

Ser Pro Arg Ile Leu Pro Ser Thr Val Gly His Ala Lys Arg Glu Leu

180 185 190

Leu Leu Arg Trp Leu Pro Glu Arg Leu Leu Thr Leu Asp Ser Leu Glu

195 200 205

His Leu Pro Glu Arg Ile Leu His Asp Val Tyr Met His Cys Ser Tyr

210 215 220

Ala Asp Met Ala Glu Lys His Ala Ile Lys Arg Ser Ile Asn Phe His

225 230 235 240

Leu Arg Asn Thr Leu Leu His Asn Gly Leu Ser Asp Asn His Leu Ser

245 250 255

Pro Pro Ser Arg Asp Lys Pro Leu Met Leu Val Ile Leu Glu Trp Phe

260 265 270

Asn Ser Gly His Ser Ile Tyr Arg Thr His Ser Ser Thr Leu Arg Ala

275 280 285

Ala Arg Glu Gln Phe Ser Thr His Gly Ala Thr Ile Ile Asp Ala Thr

290 295 300

Asp Ala Ile Thr Gln Ala Val Phe Asp Asp Phe Thr Glu Val Asn Arg

305 310 315 320

Ala Gly Ala Val Glu Ala Ile Val Ala Leu Thr Gln Gln Leu Leu Pro

325 330 335

Asp Val Ile Tyr Phe Pro Ser Val Gly Met Phe Pro Leu Thr Ile Ala

340 345 350

Leu Thr Asn Leu Arg Leu Ala Pro Leu Gln Val Met Ala Leu Gly His

355 360 365

Pro Ala Thr Thr His Ser Asp Tyr Ile Asp Ala Val Leu Val Glu Glu

370 375 380

Asp Tyr Leu Gly Asp Ile Ala Cys Phe Ser Glu Lys Val Val Ser Leu

385 390 395 400

Pro Lys Asp Cys Leu Pro Tyr Val Pro Pro Ala Asn Ile Ser Gln Pro

405 410 415

Glu Pro Ile Leu His Phe Ala Glu Arg Pro Ala Val His Ile Ala Val

420 425 430

Cys Ala Ser Ala Met Lys Ile Asn Pro Arg Phe Leu Ala Thr Cys Ala

435 440 445

Glu Ile Thr Arg Gln Thr Ser Thr Ser Val Val Phe His Phe Leu Val

450 455 460

Gly Phe Cys Trp Gly Ile Thr His Arg Val Met Glu Lys Ala Val Asn

465 470 475 480

Asp Ile Leu Pro Gln Ala Arg Val Tyr Glu His Leu Gly Tyr Leu Asp

485 490 495

Tyr Leu Gln Val Ile Asn Gln Cys Asp Leu Phe Ile Asn Pro Phe Pro

500 505 510

Phe Gly Asn Thr Asn Gly Ile Val Asp Thr Val Arg Gln Gly Leu Pro

515 520 525

Gly Val Cys Leu Ser Gly Thr Glu Val His Glu His Ile Asp Glu Gly

530 535 540

Leu Phe Arg Arg Leu Gly Leu Asp Glu Glu Leu Ile Ala His Asp Leu

545 550 555 560

Ala Glu Tyr Ile Ala Val Thr Val Arg Leu Ile Ser Asp Lys Glu Trp

565 570 575

Arg Gln Ser Leu Arg Gln Arg Leu Leu Gln Ile Gln Pro Asp Asn Val

580 585 590

Leu Phe Ala Gly Lys Pro Glu Gln Phe Gly Leu Ile Val Arg Gly Leu

595 600 605

Leu Ala Asp Lys Lys Ala Ser Asp Lys Gly Gly

610 615

<210> 16

<211> 619

<212> PRT

<213> 人工

<220>

<223> 经修饰的小肠结肠炎耶尔森菌NGT

<400> 16

Met Val Asp Lys Thr Val Glu Val Ser Gln Glu Ala Glu Asn Leu Thr

1 5 10 15

Ala Phe Ser Leu Pro Tyr Phe Glu Phe Leu Val Cys Val Arg Arg Tyr

20 25 30

Glu Glu Ala Gly Arg Leu Leu Ile Leu Met Leu Glu Gln Leu Asp Thr

35 40 45

Gln Tyr Gly Arg Trp Asp Val Phe Ser Leu Lys Gln Gln Ser Ile Gln

50 55 60

Gln Gln Glu His Tyr Cys Asn Arg Leu Ala Ala Ala Ile Gly Asn Leu

65 70 75 80

Phe Ser Asp Pro Gly Phe Val Leu Ser Glu Lys Gly Phe Leu Gln Leu

85 90 95

Ile Asn Phe His Arg Trp Ile Ala Leu Ile Phe Ala Ala Ser Pro Phe

100 105 110

Gly His Ala Asp His Val Ile Thr Asn Leu Asn Gln Val Gly Glu Gly

115 120 125

Cys Ala His Pro Leu Arg Phe Glu Gln Asn Asn Phe Leu Lys Phe Cys

130 135 140

Val Met Tyr Leu Pro Glu Ser Gly Ile Pro Leu Gln Pro Asp Ile Leu

145 150 155 160

Trp Gln Phe Asn Pro Asn Ala Ala Ala Ala Leu Phe Leu Ala Leu Leu

165 170 175

Ser Pro Arg Ile Leu Pro Ser Thr Val Gly His Ala Lys Arg Glu Leu

180 185 190

Leu Leu Arg Trp Leu Pro Glu Arg Leu Leu Thr Leu Asp Ser Leu Glu

195 200 205

His Leu Pro Glu Arg Ile Leu His Asp Val Tyr Met His Cys Ser Tyr

210 215 220

Ala Asp Met Ala Glu Lys His Ala Ile Lys Arg Ser Ile Asn Phe His

225 230 235 240

Leu Arg Asn Thr Leu Leu His Asn Gly Leu Ser Asp Asn His Leu Ser

245 250 255

Pro Pro Ser Arg Asp Lys Pro Leu Met Leu Val Ile Leu Glu Trp Phe

260 265 270

Asn Ser Gly His Ser Ile Tyr Arg Thr His Ser Ser Thr Leu Arg Ala

275 280 285

Ala Arg Glu Gln Phe Ser Thr His Gly Ala Thr Ile Ile Asp Ala Thr

290 295 300

Asp Ala Ile Thr Gln Ala Val Phe Asp Asp Phe Thr Glu Val Asn Arg

305 310 315 320

Ala Gly Ala Val Glu Ala Ile Val Ala Leu Thr Gln Gln Leu Leu Pro

325 330 335

Asp Val Ile Tyr Phe Pro Ser Val Gly Met Phe Pro Leu Thr Ile Ala

340 345 350

Leu Thr Asn Leu Arg Leu Ala Pro Leu Gln Val Met Ala Leu Gly His

355 360 365

Pro Ala Thr Thr His Ser Asp Tyr Ile Asp Ala Val Leu Val Glu Glu

370 375 380

Asp Tyr Leu Gly Asp Ile Ala Cys Phe Ser Glu Lys Val Val Ser Leu

385 390 395 400

Pro Lys Asp Cys Leu Pro Tyr Val Pro Pro Ala Asn Ile Ser Gln Pro

405 410 415

Glu Pro Ile Leu His Phe Ala Glu Arg Pro Ala Val His Ile Ala Val

420 425 430

Cys Ala Ser Ala Met Lys Ile Asn Pro Arg Phe Leu Ala Thr Cys Ala

435 440 445

Glu Ile Thr Arg Gln Thr Ser Thr Ser Val Val Phe His Phe Leu Val

450 455 460

Gly Ala Cys Trp Gly Ile Thr His Arg Val Met Glu Lys Ala Val Asn

465 470 475 480

Asp Ile Leu Pro Gln Ala Arg Val Tyr Glu His Leu Gly Tyr Leu Asp

485 490 495

Tyr Leu Gln Val Ile Asn Gln Cys Asp Leu Phe Ile Asn Pro Phe Pro

500 505 510

Phe Gly Asn Thr Asn Gly Ile Val Asp Thr Val Arg Gln Gly Leu Pro

515 520 525

Gly Val Cys Leu Ser Gly Thr Glu Val His Glu His Ile Asp Glu Gly

530 535 540

Leu Phe Arg Arg Leu Gly Leu Asp Glu Glu Leu Ile Ala His Asp Leu

545 550 555 560

Ala Glu Tyr Ile Ala Val Thr Val Arg Leu Ile Ser Asp Lys Glu Trp

565 570 575

Arg Gln Ser Leu Arg Gln Arg Leu Leu Gln Ile Gln Pro Asp Asn Val

580 585 590

Leu Phe Ala Gly Lys Pro Glu Gln Phe Gly Leu Ile Val Arg Gly Leu

595 600 605

Leu Ala Asp Lys Lys Ala Ser Asp Lys Gly Gly

610 615

<210> 17

<211> 617

<212> PRT

<213> Yersinia pestis（鼠疫耶尔森菌）

<400> 17

Met Ala Asp Lys Ser Val Glu Leu Thr Pro Val Val Glu Ala Pro Val

1 5 10 15

Val Phe Ser Leu Pro Tyr Phe Glu Phe Leu Val Cys Thr Arg Arg Tyr

20 25 30

Glu Asp Ala Gly Arg Leu Leu Ile Leu Met Leu Glu Lys Leu Asp Thr

35 40 45

Gln Tyr Gly Arg Trp Asp Val Phe Ser Leu Asn Lys Gln Pro Ile Gln

50 55 60

Gln Gln Glu Tyr Tyr Cys Asn Arg Leu Ala Ala Ala Ile Gly Cys Leu

65 70 75 80

Phe Ser Asp Pro Gly Phe Val Ile Ser Glu Thr Gly Phe Leu Gln Leu

85 90 95

Ile Asn Phe His Arg Trp Ile Ala Leu Ile Phe Ala Ala Ser Thr Phe

100 105 110

Gly His Ala Asp His Val Ile Thr Asn Leu Asn Glu Ala Gly Asn Gly

115 120 125

Cys Ser His Pro Leu Arg Phe Glu Arg Asn Asn Phe Leu Lys Phe Cys

130 135 140

Val Met Tyr Leu Pro Glu Ser Gly Ile Pro Leu Gln Pro Asp Ile Leu

145 150 155 160

Trp Gln Phe Asn Pro Gln Ala Thr Ala Ala Leu Phe Leu Ala Leu Leu

165 170 175

Ser Pro Arg Ile Leu Pro Ser Ala Ala Gly His Glu Lys Arg Glu Thr

180 185 190

Leu Leu Ala Trp Leu Pro Glu Lys Leu Leu Thr Leu Ile Ser Leu Glu

195 200 205

Gly Leu Pro Glu Arg Ile Leu His Asp Val Tyr Met His Cys Ser Tyr

210 215 220

Ala Asp Met Ala Lys Lys His Thr Ile Lys Arg Ser Ile Asn Phe His

225 230 235 240

Leu Arg Lys Thr Met Leu Lys Asn Gly Leu Ser Asp Met Asn Glu Leu

245 250 255

Pro Pro Leu Arg Ser Lys Pro Leu Met Leu Val Ile Leu Glu Trp Phe

260 265 270

Asn Ser Gly His Ser Ile Tyr Arg Thr His Ser Ser Thr Leu Arg Ala

275 280 285

Ala Arg Asp Gln Phe Ser Thr His Gly Val Ala Ile Ala Glu Ala Thr

290 295 300

Asp Asp Ile Thr Arg Lys Val Phe Asp Asp Phe Thr Glu Val Ser Arg

305 310 315 320

Thr Gly Ala Val Glu Thr Ile Met Ala Leu Ala Gln Gln Leu Arg Pro

325 330 335

Asp Val Ile Tyr Phe Pro Ser Val Gly Met Phe Pro Met Thr Val Ala

340 345 350

Leu Thr Asn Leu Arg Leu Ala Pro Leu Gln Val Met Ala Leu Gly His

355 360 365

Pro Ala Thr Thr His Ser Asp Tyr Ile Asp Ala Val Leu Val Glu Glu

370 375 380

Asp Tyr Leu Gly Asp Ile Ala Cys Phe Ser Glu Lys Val Val Ser Leu

385 390 395 400

Pro Lys Asp Cys Leu Pro Tyr Val Pro Pro Ala Asn Ile Thr Gln Pro

405 410 415

Glu Pro Ile Gln Gln Phe Val Gln Arg Glu Ala Val His Ile Ala Val

420 425 430

Cys Ala Ser Ala Met Lys Ile Asn Pro Arg Phe Leu Ala Ala Cys Ala

435 440 445

Glu Ile Ala Leu Arg Ser Pro Leu Pro Ile Ile Phe His Phe Leu Val

450 455 460

Gly Phe Cys Trp Gly Ile Thr His Arg Val Met Glu Lys Ala Val Asn

465 470 475 480

Glu Met Val Thr Ser Ala Lys Val Tyr Glu His Leu Asn Tyr Gln Asn

485 490 495

Tyr Leu Gln Val Ile Asn Gln Cys Asp Leu Phe Ile Asn Pro Phe Pro

500 505 510

Phe Gly Asn Thr Asn Gly Ile Val Asp Thr Val Arg Gln Gly Leu Pro

515 520 525

Gly Val Cys Leu Ser Gly Glu Glu Val His Glu His Ile Asp Glu Gly

530 535 540

Leu Phe Arg Arg Leu Gly Leu Ala Glu Glu Leu Ile Thr His Asn Val

545 550 555 560

Glu Gln Tyr Ile Thr Ala Thr Val Arg Leu Ile Thr Asp Thr Asn Trp

565 570 575

Arg Asn Gly Leu Arg Arg Gln Leu Leu Gln Thr Gln Pro Asp Asn Val

580 585 590

Leu Phe Thr Gly Lys Pro Glu Gln Phe Gly Gln Ile Val Arg Ala Leu

595 600 605

Leu Asp Asn Gly His Gln Asp Val Asn

610 615

<210> 18

<211> 617

<212> PRT

<213> 人工

<220>

<223> 经修饰的鼠疫耶尔森菌NGT

<400> 18

Met Ala Asp Lys Ser Val Glu Leu Thr Pro Val Val Glu Ala Pro Val

1 5 10 15

Val Phe Ser Leu Pro Tyr Phe Glu Phe Leu Val Cys Thr Arg Arg Tyr

20 25 30

Glu Asp Ala Gly Arg Leu Leu Ile Leu Met Leu Glu Lys Leu Asp Thr

35 40 45

Gln Tyr Gly Arg Trp Asp Val Phe Ser Leu Asn Lys Gln Pro Ile Gln

50 55 60

Gln Gln Glu Tyr Tyr Cys Asn Arg Leu Ala Ala Ala Ile Gly Cys Leu

65 70 75 80

Phe Ser Asp Pro Gly Phe Val Ile Ser Glu Thr Gly Phe Leu Gln Leu

85 90 95

Ile Asn Phe His Arg Trp Ile Ala Leu Ile Phe Ala Ala Ser Thr Phe

100 105 110

Gly His Ala Asp His Val Ile Thr Asn Leu Asn Glu Ala Gly Asn Gly

115 120 125

Cys Ser His Pro Leu Arg Phe Glu Arg Asn Asn Phe Leu Lys Phe Cys

130 135 140

Val Met Tyr Leu Pro Glu Ser Gly Ile Pro Leu Gln Pro Asp Ile Leu

145 150 155 160

Trp Gln Phe Asn Pro Gln Ala Thr Ala Ala Leu Phe Leu Ala Leu Leu

165 170 175

Ser Pro Arg Ile Leu Pro Ser Ala Ala Gly His Glu Lys Arg Glu Thr

180 185 190

Leu Leu Ala Trp Leu Pro Glu Lys Leu Leu Thr Leu Ile Ser Leu Glu

195 200 205

Gly Leu Pro Glu Arg Ile Leu His Asp Val Tyr Met His Cys Ser Tyr

210 215 220

Ala Asp Met Ala Lys Lys His Thr Ile Lys Arg Ser Ile Asn Phe His

225 230 235 240

Leu Arg Lys Thr Met Leu Lys Asn Gly Leu Ser Asp Met Asn Glu Leu

245 250 255

Pro Pro Leu Arg Ser Lys Pro Leu Met Leu Val Ile Leu Glu Trp Phe

260 265 270

Asn Ser Gly His Ser Ile Tyr Arg Thr His Ser Ser Thr Leu Arg Ala

275 280 285

Ala Arg Asp Gln Phe Ser Thr His Gly Val Ala Ile Ala Glu Ala Thr

290 295 300

Asp Asp Ile Thr Arg Lys Val Phe Asp Asp Phe Thr Glu Val Ser Arg

305 310 315 320

Thr Gly Ala Val Glu Thr Ile Met Ala Leu Ala Gln Gln Leu Arg Pro

325 330 335

Asp Val Ile Tyr Phe Pro Ser Val Gly Met Phe Pro Met Thr Val Ala

340 345 350

Leu Thr Asn Leu Arg Leu Ala Pro Leu Gln Val Met Ala Leu Gly His

355 360 365

Pro Ala Thr Thr His Ser Asp Tyr Ile Asp Ala Val Leu Val Glu Glu

370 375 380

Asp Tyr Leu Gly Asp Ile Ala Cys Phe Ser Glu Lys Val Val Ser Leu

385 390 395 400

Pro Lys Asp Cys Leu Pro Tyr Val Pro Pro Ala Asn Ile Thr Gln Pro

405 410 415

Glu Pro Ile Gln Gln Phe Val Gln Arg Glu Ala Val His Ile Ala Val

420 425 430

Cys Ala Ser Ala Met Lys Ile Asn Pro Arg Phe Leu Ala Ala Cys Ala

435 440 445

Glu Ile Ala Leu Arg Ser Pro Leu Pro Ile Ile Phe His Phe Leu Val

450 455 460

Gly Ala Cys Trp Gly Ile Thr His Arg Val Met Glu Lys Ala Val Asn

465 470 475 480

Glu Met Val Thr Ser Ala Lys Val Tyr Glu His Leu Asn Tyr Gln Asn

485 490 495

Tyr Leu Gln Val Ile Asn Gln Cys Asp Leu Phe Ile Asn Pro Phe Pro

500 505 510

Phe Gly Asn Thr Asn Gly Ile Val Asp Thr Val Arg Gln Gly Leu Pro

515 520 525

Gly Val Cys Leu Ser Gly Glu Glu Val His Glu His Ile Asp Glu Gly

530 535 540

Leu Phe Arg Arg Leu Gly Leu Ala Glu Glu Leu Ile Thr His Asn Val

545 550 555 560

Glu Gln Tyr Ile Thr Ala Thr Val Arg Leu Ile Thr Asp Thr Asn Trp

565 570 575

Arg Asn Gly Leu Arg Arg Gln Leu Leu Gln Thr Gln Pro Asp Asn Val

580 585 590

Leu Phe Thr Gly Lys Pro Glu Gln Phe Gly Gln Ile Val Arg Ala Leu

595 600 605

Leu Asp Asn Gly His Gln Asp Val Asn

610 615

<210> 19

<211> 684

<212> PRT

<213> Kingella kingae（金格金氏杆菌）

<400> 19

Met Thr Gln Thr Thr Glu Gln Ser Ile Pro Ser Leu Thr Arg Phe Glu

1 5 10 15

Gln Ala Val Ser Ser Gln Asn Tyr Glu Ala Ala Cys Thr Glu Leu Leu

20 25 30

Ser Ile Leu Gly Gln Leu Asp Ser Asn Phe Gly Glu Ile His Gly Ile

35 40 45

Glu Phe Ala Tyr Pro Val Gln Leu Gln Asn Leu Gln Gln Asp Val Thr

50 55 60

Ile His Phe Cys Thr Arg Met Ala Thr Ala Ile Thr Thr Leu Phe Thr

65 70 75 80

Asn Lys Met Trp Ser Leu Thr Asp Asp Gly Arg Thr Arg Phe Leu Thr

85 90 95

Val Gln Arg Trp Ile Asn Met Ile Phe Ala Ser Ser Pro Tyr Val Asn

100 105 110

Ala Asp His Val Leu Ala Thr Tyr Asn Thr Asn Pro Glu Pro Asp Ser

115 120 125

Leu Trp Asn Asn Ile His Leu Asp Asn Asn Gln Ser Ala Phe Asn Lys

130 135 140

Phe Ala Val Met Tyr Leu Pro Glu Ser Asn Val Gln Val Asn Leu Asp

145 150 155 160

Ser Leu Trp Ser Val Asn Pro Ser Leu Thr Ala Ser Leu Cys Phe Ala

165 170 175

Trp Gln Ser Pro Arg Phe Ile Ala Thr Glu Ala Ala Phe Asn Arg Arg

180 185 190

Ala Gln Val Leu Gln Trp Phe Pro Ala Lys Leu Ala Gln Phe Asn Asn

195 200 205

Leu Asn Thr Leu Pro Ala Asn Ile Ser His Asp Val Tyr Met His Cys

210 215 220

Ser Tyr Asp Ile Glu Pro Asn Lys His Asp Val Lys Gly Ala Leu Asn

225 230 235 240

Gln Val Ile Arg Arg His Ile Leu Glu Glu Tyr Gly Trp Gln Asp Cys

245 250 255

Asp Val Thr Lys Ile Gly Asn Ala His Gly Lys Pro Val Met Leu Val

260 265 270

Leu Leu Glu His Phe His Ser Gly His Ser Ile Tyr Arg Thr His Ser

275 280 285

Thr Ser Met Ile Ala Ala Arg Glu Gln Phe Tyr Leu Ile Gly Ile Gly

290 295 300

Gly Ala Ala Val Asp Glu Ala Gly Arg Ala Val Phe Asp Glu Phe Val

305 310 315 320

Glu Ile Asp Ala Lys Ala Ser Thr Met Glu Lys Leu Gln Ala Ile Arg

325 330 335

Ala Ile Ala Thr Lys Glu Gln Pro Ala Val Phe Tyr Met Pro Ser Ile

340 345 350

Gly Met Asp Leu Ile Thr Ile Phe Ala Ser Asn Thr Arg Ile Ala Pro

355 360 365

Ile Gln Val Ile Ala Leu Gly His Pro Ala Thr Thr His Ser Lys Phe

370 375 380

Ile Glu Tyr Val Ile Val Glu Asp Asp Tyr Val Gly Ser Glu Glu Cys

385 390 395 400

Phe Ser Glu Thr Leu Leu Arg Leu Pro Lys Asp Ala Leu Pro Tyr Val

405 410 415

Pro Ser Ala Leu Ala Pro Ala Ser Val Glu Tyr Asn Leu Arg Glu Asn

420 425 430

Pro Ser Val Val His Ile Gly Val Ala Ser Thr Thr Met Lys Leu Asn

435 440 445

Pro Tyr Phe Leu Arg Ala Cys Ala Glu Ile Lys Ala Arg Ser Lys Val

450 455 460

Pro Val His Phe His Phe Ala Met Gly Gln Ala Ser Gly Val Thr Phe

465 470 475 480

Ala Tyr Ile Glu Arg Phe Leu Lys Thr Tyr Leu Gly Lys Ala Val Thr

485 490 495

Ala Tyr Pro His Gln Ser Tyr Thr Asp Tyr Leu Arg Thr Leu His Gln

500 505 510

Cys Asp Met Met Ile Asn Pro Phe Pro Phe Gly Asn Thr Asn Gly Ile

515 520 525

Ile Asp Met Val Thr Leu Gly Leu Val Gly Ile Cys Lys Thr Gly Ala

530 535 540

Glu Val His Glu His Ile Asp Glu Gly Leu Phe Lys Arg Leu Gly Leu

545 550 555 560

Pro Glu Trp Leu Ile Thr Gln Thr Ala Asp Asp Tyr Val Asn Cys Ala

565 570 575

Val Arg Leu Ala Glu Asn His Glu Glu Arg Leu Ala Leu Arg Arg His

580 585 590

Ile Ile Glu Asn Asn Gly Leu Asn Thr Leu Phe Ser Gly Asp Pro Lys

595 600 605

Pro Met Gly Gln Ile Leu Trp Ala Lys Val Gln Glu Lys Met Ala Lys

610 615 620

Pro Ala Lys Lys Ala Thr Ala Lys Val Ala Ser Lys Pro Ala Thr Ala

625 630 635 640

Val Glu Pro Val Ala Glu Lys Pro Ala Thr Lys Thr Val Arg Lys Thr

645 650 655

Ala Ser Lys Lys Ala Ala Ala Thr Glu Ala Thr Thr Glu Lys Ala Ala

660 665 670

Pro Lys Thr Thr Arg Thr Arg Lys Lys Ala Ala Glu

675 680

<210> 20

<211> 684

<212> PRT

<213> 人工

<220>

<223> 经修饰的金格金氏杆菌NGT

<400> 20

Met Thr Gln Thr Thr Glu Gln Ser Ile Pro Ser Leu Thr Arg Phe Glu

1 5 10 15

Gln Ala Val Ser Ser Gln Asn Tyr Glu Ala Ala Cys Thr Glu Leu Leu

20 25 30

Ser Ile Leu Gly Gln Leu Asp Ser Asn Phe Gly Glu Ile His Gly Ile

35 40 45

Glu Phe Ala Tyr Pro Val Gln Leu Gln Asn Leu Gln Gln Asp Val Thr

50 55 60

Ile His Phe Cys Thr Arg Met Ala Thr Ala Ile Thr Thr Leu Phe Thr

65 70 75 80

Asn Lys Met Trp Ser Leu Thr Asp Asp Gly Arg Thr Arg Phe Leu Thr

85 90 95

Val Gln Arg Trp Ile Asn Met Ile Phe Ala Ser Ser Pro Tyr Val Asn

100 105 110

Ala Asp His Val Leu Ala Thr Tyr Asn Thr Asn Pro Glu Pro Asp Ser

115 120 125

Leu Trp Asn Asn Ile His Leu Asp Asn Asn Gln Ser Ala Phe Asn Lys

130 135 140

Phe Ala Val Met Tyr Leu Pro Glu Ser Asn Val Gln Val Asn Leu Asp

145 150 155 160

Ser Leu Trp Ser Val Asn Pro Ser Leu Thr Ala Ser Leu Cys Phe Ala

165 170 175

Trp Gln Ser Pro Arg Phe Ile Ala Thr Glu Ala Ala Phe Asn Arg Arg

180 185 190

Ala Gln Val Leu Gln Trp Phe Pro Ala Lys Leu Ala Gln Phe Asn Asn

195 200 205

Leu Asn Thr Leu Pro Ala Asn Ile Ser His Asp Val Tyr Met His Cys

210 215 220

Ser Tyr Asp Ile Glu Pro Asn Lys His Asp Val Lys Gly Ala Leu Asn

225 230 235 240

Gln Val Ile Arg Arg His Ile Leu Glu Glu Tyr Gly Trp Gln Asp Cys

245 250 255

Asp Val Thr Lys Ile Gly Asn Ala His Gly Lys Pro Val Met Leu Val

260 265 270

Leu Leu Glu His Phe His Ser Gly His Ser Ile Tyr Arg Thr His Ser

275 280 285

Thr Ser Met Ile Ala Ala Arg Glu Gln Phe Tyr Leu Ile Gly Ile Gly

290 295 300

Gly Ala Ala Val Asp Glu Ala Gly Arg Ala Val Phe Asp Glu Phe Val

305 310 315 320

Glu Ile Asp Ala Lys Ala Ser Thr Met Glu Lys Leu Gln Ala Ile Arg

325 330 335

Ala Ile Ala Thr Lys Glu Gln Pro Ala Val Phe Tyr Met Pro Ser Ile

340 345 350

Gly Met Asp Leu Ile Thr Ile Phe Ala Ser Asn Thr Arg Ile Ala Pro

355 360 365

Ile Gln Val Ile Ala Leu Gly His Pro Ala Thr Thr His Ser Lys Phe

370 375 380

Ile Glu Tyr Val Ile Val Glu Asp Asp Tyr Val Gly Ser Glu Glu Cys

385 390 395 400

Phe Ser Glu Thr Leu Leu Arg Leu Pro Lys Asp Ala Leu Pro Tyr Val

405 410 415

Pro Ser Ala Leu Ala Pro Ala Ser Val Glu Tyr Asn Leu Arg Glu Asn

420 425 430

Pro Ser Val Val His Ile Gly Val Ala Ser Thr Thr Met Lys Leu Asn

435 440 445

Pro Tyr Phe Leu Arg Ala Cys Ala Glu Ile Lys Ala Arg Ser Lys Val

450 455 460

Pro Val His Phe His Phe Ala Met Gly Ala Ala Ser Gly Val Thr Phe

465 470 475 480

Ala Tyr Ile Glu Arg Phe Leu Lys Thr Tyr Leu Gly Lys Ala Val Thr

485 490 495

Ala Tyr Pro His Gln Ser Tyr Thr Asp Tyr Leu Arg Thr Leu His Gln

500 505 510

Cys Asp Met Met Ile Asn Pro Phe Pro Phe Gly Asn Thr Asn Gly Ile

515 520 525

Ile Asp Met Val Thr Leu Gly Leu Val Gly Ile Cys Lys Thr Gly Ala

530 535 540

Glu Val His Glu His Ile Asp Glu Gly Leu Phe Lys Arg Leu Gly Leu

545 550 555 560

Pro Glu Trp Leu Ile Thr Gln Thr Ala Asp Asp Tyr Val Asn Cys Ala

565 570 575

Val Arg Leu Ala Glu Asn His Glu Glu Arg Leu Ala Leu Arg Arg His

580 585 590

Ile Ile Glu Asn Asn Gly Leu Asn Thr Leu Phe Ser Gly Asp Pro Lys

595 600 605

Pro Met Gly Gln Ile Leu Trp Ala Lys Val Gln Glu Lys Met Ala Lys

610 615 620

Pro Ala Lys Lys Ala Thr Ala Lys Val Ala Ser Lys Pro Ala Thr Ala

625 630 635 640

Val Glu Pro Val Ala Glu Lys Pro Ala Thr Lys Thr Val Arg Lys Thr

645 650 655

Ala Ser Lys Lys Ala Ala Ala Thr Glu Ala Thr Thr Glu Lys Ala Ala

660 665 670

Pro Lys Thr Thr Arg Thr Arg Lys Lys Ala Ala Glu

675 680

Claims

1.一种用于在体外对肽或多肽序列进行糖基化的无细胞系统，所述肽或多肽序列包含天冬酰胺残基，并且所述系统包含以下组分：

(i)糖基转移酶，其是催化将单糖转移至天冬酰胺残基的氨基以提供N-连接的聚糖的N-糖基转移酶(NGT)，或在无细胞蛋白质合成(CFPS)反应混合物中表达NGT的表达载体；

(ii)包含单糖供体任选地单糖的糖基化混合物；

其中所述肽或多肽序列在体外在所述糖基化混合物中被糖基化以提供包含N-连接的聚糖的肽或多肽序列。

2.权利要求1的系统，其还包含以下组分：

(iii)催化将单糖转移至N-连接的聚糖的第二糖基转移酶，或在无细胞蛋白质合成(CFPS)反应混合物中表达第二糖基转移酶的表达载体；

其中所述糖基化混合物包含Glc供体、Gal供体、GalNAc供体、GlcNAc供体、丙酮酸供体、岩藻糖供体、唾液酸供体或其混合物，并且其中N-连接的聚糖被选自Glc、Gal、GalNAc、GlcNAc、丙酮酸、Fuc、Sia和非天然糖的一种或多种部分糖基化。

3.权利要求2的系统，其还包含以下组分：

(iv)催化将单糖转移至N-连接的聚糖的第三糖基转移酶，或在无细胞蛋白质合成(CFPS)反应混合物中表达第三糖基转移酶的表达载体；

其中所述糖基化混合物包含Glc供体、Gal供体、GalNAc供体、GlcNAc供体、丙酮酸供体、岩藻糖供体、唾液酸供体或其混合物，并且其中N-连接的聚糖进一步被选自Glc、Gal、GalNAc、GlcNAc、丙酮酸、Fuc、Sia和叠氮基-Sia的一种或多种部分糖基化。

4.权利要求1的系统，其中所述系统包含无细胞蛋白质合成(CFPS)反应混合物，并且所述第一糖基转移酶、所述第二糖基转移酶和所述第三糖基转移酶中的一种或多种存在于或表达于所述CFPS反应混合物中。

5.权利要求1的系统，其中所述系统包含一种或多种无细胞蛋白质合成(CFPS)反应混合物，并且所述第一糖基转移酶、所述第二糖基转移酶和所述第三糖基转移酶中的一种或多种存在于或表达于所述CFPS反应混合物中并且所述一种或多种CFPS反应混合物经组合以提供所述系统。

6.权利要求1的系统，其还包含所述肽或多肽序列或表达所述肽或多肽序列的表达载体。

7.权利要求1的系统，其还包含原核CFPS反应混合物。

8.权利要求1的系统，其还包含原核CFPS反应混合物，所述原核CFPS反应混合物包含从大肠杆菌制备的裂解物。

9.权利要求1的系统，其中所述糖基转移酶是选自以下的细菌N-连接的糖基转移酶(NGT)：胸膜肺炎放线杆菌(Actinobacillus pleuropneumoniae)NGT(ApNGT)、大肠杆菌(Escherichia coli)NGT(EcNGT)、流感嗜血杆菌(Haemophilus influenza)NGT(HiNGT)、溶血曼海姆菌(Mannheimia haemolytica)NGT(MhNGT)、杜雷嗜血杆菌(Haemophilus dureyi)NGT(HdNGT)、海藻百伯史坦菌(Bibersteinia trehalosi)NGT(BtNGT)、嗜沫聚合杆菌(Aggregatibacter aphrophilus)NGT(AaNGT)、小肠结肠炎耶尔森菌(Yersiniaenterocolitica)NGT(YeNGT)、鼠疫耶尔森菌(Yersinia pestis)NGT(YpNGT)和金格金氏杆菌(Kingella kingae)NGT(KkNGT)或其经修饰的形式。

10.权利要求1的系统，其中所述糖基转移酶是具有SEQ ID NO：1、3、5、7、9、11、13、15、17或19中任一项的氨基酸序列或与SEQ ID NO：1、3、5、7、9、11、13、15、17或19中任一项的氨基酸序列具有至少50％、60％、70％、80％、90％、95％、96％、97％、98％或99％的序列同一性的细菌N-连接的糖基转移酶(NGT)，或所述第一糖基转移酶是具有SEQ ID NO：2、4、6、8、10、12、14、16、18或20中任一项的氨基酸序列或与SEQ ID NO：2、4、6、8、10、12、14、16、18或20中任一项的氨基酸序列具有至少50％、60％、70％、80％、90％、95％、96％、97％、98％或99％的序列同一性的经修饰的细菌N-连接的糖基转移酶(NGT)。

11.权利要求2的系统，其中所述第二糖基转移酶是选自胸膜肺炎放线杆菌α1-6葡萄糖基转移酶(Apα1-6)、淋病奈瑟菌(Neisseria gonorrhoeae)β1-4半乳糖基转移酶LgtB(NgLGtB)、脑膜炎奈瑟菌(Neisseria meningitidis)β1-4半乳糖基转移酶LgtB(NmLGtB)和脆弱拟杆菌(Bacteriodes fragilis)β1-3N-乙酰半乳糖胺转移酶(BfGalNAcT)的α1-6葡萄糖基转移酶、β1-4半乳糖基转移酶或β1-3N-乙酰半乳糖胺转移酶。

12.权利要求3的系统，其中所述第三糖基转移酶是选自以下的β1-3N-乙酰葡糖胺转移酶、丙酮酸转移酶、α1-3岩藻糖基转移酶、α1-2岩藻糖基转移酶、α1-4半乳糖基转移酶、α1-3半乳糖基转移酶、α2-6唾液酸转移酶、α2-3,6唾液酸转移酶、α2-3唾液酸转移酶或α2-3,8唾液酸转移酶：淋病奈瑟菌β1-3N-乙酰葡糖胺转移酶(NgLgtA)、粟酒裂殖酵母(Schizosaccharomyces pombe)丙酮酸转移酶(SpPvg1)、幽门螺杆菌(Helicobacterpylori)α1-3岩藻糖基转移酶(HpFutA)、幽门螺杆菌α1-2岩藻糖基转移酶(HpFutC)、脑膜炎奈瑟菌α1-4半乳糖基转移酶(NmLgtC)、牛α1-3半乳糖基转移酶(BtGGTA)、智人α2-6唾液酸转移酶(HsSIAT1)、美人鱼发光杆菌(Photobacterium damselae)α2-6唾液酸转移酶(PdST6)、鳆发光杆菌(Photobacterium leiognathid)α2-6唾液酸转移酶(PlST6)、多杀巴斯德氏菌(Pasteurella multocida)α2-3,6唾液酸转移酶(PmST3,6)、弧菌属(Vibrio sp)JT-FAJ-16α2-3唾液酸转移酶(VsST3)、明亮发光杆菌(Photobacterium phosphoreum)α2-3唾液酸转移酶(PpST3)、空肠弯曲杆菌(Campylobacter jejuni)α2-3唾液酸转移酶(CjCST-I)和空肠弯曲杆菌α2-3,8唾液酸转移酶(CjCST-II)。

13.权利要求1的系统，其中所述系统的一种或多种组分呈冻干形式。

14.一种包含N-连接的聚糖的肽或多肽序列，所述N-连接的聚糖包含选自以下的部分：唾液酸化形式的乳糖、岩藻糖基化形式的乳糖、唾液酸化形式的LacNAc(乳糖-(聚)LacNAc)、岩藻糖基化形式的LacNAc(乳糖-(聚)LacNAc)、丙酮酸化的乳糖、丙酮酸化的LacNAc(乳糖-(聚)LacNAc)、葡萄糖、聚α1,6-连接的葡萄糖、用β1,3GalNAc修饰的葡萄糖、乳糖、用(聚)LacNAc修饰的乳糖(乳糖-(聚)LacNAc)、用α1,4半乳糖修饰的乳糖、用寡唾液酸修饰的乳糖和αGal表位。

15.一种经修饰的细菌细胞，其包含或表达权利要求1的系统的一种或多种组分。

16.一种由权利要求14的经修饰的细胞制备的裂解物，其适用于无细胞蛋白质合成(CFPS)反应。

17.一种用于制备糖基化肽或多肽序列的方法，所述方法包括培养权利要求14的经修饰的细菌细胞，其中所述经修饰的细胞包含或表达肽或多肽序列和N-连接的糖基转移酶。

18.一种用于体外制备糖基化肽或多肽序列的方法，所述方法包括使在包含单糖供体的糖基化混合物中的包含天冬酰胺残基的肽或多肽序列与糖基转移酶反应，所述糖基转移酶是催化将单糖从单糖供体转移至天冬酰胺残基的氨基以提供N-连接的聚糖的N-糖基转移酶(NGT)，其中所述肽或多肽序列在体外在所述糖基化混合物中被糖基化以提供包含N-连接的聚糖的肽或多肽序列。

19.权利要求17的方法，其中所述肽或多肽序列在第一CFPS反应混合物中表达，所述NGT在第二CFPS反应混合物中表达，并且所述方法包括将第一CFPS反应混合物和第二CFPS反应混合物组合。

20.权利要求17的方法，其还包括使包含聚糖的肽与第二糖基转移酶反应，并且所述第二糖基转移酶催化将单糖转移至N-连接的聚糖，其中所述糖基化混合物包含Glc供体、Gal供体、GalNAc供体、GlcNAc供体、丙酮酸供体、岩藻糖供体、唾液酸供体或其混合物，并且其中所述N-连接的聚糖被选自Glc、Gal、GalNAc、GlcNAc、丙酮酸、Fuc、Sia和非天然糖的一种或多种部分糖基化。

21.权利要求20的方法，其中所述肽或多肽序列在第一CFPS反应混合物中表达，所述NGT在第二CFPS反应混合物中表达，并且所述第二糖基转移酶在第三CFPS反应混合物中表达，并且所述方法包括组合第一CFPS反应混合物、第二CFPS反应混合物和第三反应混合物中的两种或更多种。

22.权利要求19的方法，其还包括使包含聚糖的肽与第三糖基转移酶反应并且所述第三糖基转移酶催化将单糖转移至N-连接的聚糖，其中所述糖基化混合物包含Glc供体、Gal供体、GalNAc供体、GlcNAc供体、丙酮酸供体、岩藻糖供体、唾液酸供体或其混合物，并且其中所述N-连接的聚糖进一步被选自Glc、Gal、GalNAc、GlcNAc、丙酮酸、Fuc、Sia和非天然糖的一种或多种部分糖基化。

23.权利要求22的方法，其中所述肽或多肽序列在第一CFPS反应混合物中表达，所述NGT在第二CFPS反应混合物中表达，所述第二糖基转移酶在第三CFPS反应混合物中表达，所述第三糖基转移酶在第四CFPS反应混合物中表达，并且所述方法包括组合第一CFPS反应混合物、第二CFPS反应混合物、第三反应混合物和第四反应混合物中的两种或更多种。

24.权利要求14的经修饰的细菌细胞，其中所述细胞缺乏NanA(唾液酸醛缩酶)。

25.一种用于制备糖基化肽或多肽序列的系统，所述肽或多肽序列包含天冬酰胺残基，并且所述系统包含以下组分：

(i)经修饰的细菌细胞，任选地，其中所述细菌细胞被修饰以表达外源糖基转移酶，所述外源糖基转移酶是催化将单糖转移至天冬酰胺残基的氨基以提供N-连接的聚糖的N-糖基转移酶(NGT)，或在无细胞蛋白质合成(CFPS)反应混合物中表达NGT的表达载体；

(ii)包含非天然糖供体的糖基化混合物，其任选地被添加到培养基中以用于生长经修饰的细菌细胞；

其中所述肽或多肽序列在经修饰的细菌细胞中被糖基化以提供包含非天然糖的肽或多肽序列。

26.一种用于制备糖基化肽或多肽序列的制备方法，所述方法包括在权利要求25的系统的经修饰的细菌细胞中表达肽或多肽序列，并对表达的肽或多肽序列进行糖基化。