CN116528880A

CN116528880A - 用于在肠道中表达纤维合成酶的工程化益生菌

Info

Publication number: CN116528880A
Application number: CN202180069035.9A
Authority: CN
Inventors: 扎卡里·D·阿伯特; 约翰·威廉·基德·奥利弗
Original assignee: Z Life Sciences
Current assignee: Z Life Sciences
Priority date: 2020-10-08
Filing date: 2021-10-07
Publication date: 2023-08-01
Also published as: US20230372453A1; AU2021358080A1; MX2023003972A; CA3194677A1; GB202306208D0; JP2023546022A; EP4225338A1; GB2616358A; KR20230088715A; WO2022076693A1

Abstract

本公开提供了对健康中的各种挑战，包括与高碳水化合物消耗和/或低可溶性纤维消耗有关的健康挑战的解决方案。本公开尤其提供了经过工程化以表达纤维合成酶，例如在肠道中(例如肠中)表达所述酶的细菌。在特定实施方案中，本公开提供了经过工程化以表达纤维合成酶的细菌，所述纤维合成酶在例如在肠道中合成纤维的过程中消耗碳水化合物。本公开还包括用于向受试者施用的分离的纤维合成酶的制剂。

Description

用于在肠道中表达纤维合成酶的工程化益生菌

优先申请

本申请要求于2020年10月8日提交的美国临时专利申请号63/089,334的权益，所述专利申请的内容以全文引用的方式并入本文中。

背景技术

微生物组为一种复杂的微生物集合，所述微生物共同影响有机体健康和功能的许多方面。举例来说，微生物组可影响免疫力、代谢以及多种疾病。微生物组的微生物通过多种机制与宿主有机体相互作用，包括微生物信号传导、代谢产物消耗以及小分子产生。因此，微生物组中微生物与代谢产物的类型和比例可对健康具有重要影响。

发明内容

例如通过引入新的微生物功能或改变现有微生物功能改变微生物组的方法和组合物可对人类健康具有重要影响。本公开提供了针对健康和/或微生物组工程化中的各种挑战的解决方案。举例来说，本公开认识到，人类健康中的一个挑战为许多个体所消耗的日常饮食包括例如超过个体代谢需要的碳水化合物，诸如单糖和/或二糖。这些所消耗的单糖和/或二糖在肠道中(例如对微生物组)和/或在消化之后可具有有害健康的影响。再提供一个本公开认识到的人类健康中的挑战的实例，许多个体所消耗的日常饮食所包括的纤维太少。低纤维消耗和/或低肠道纤维水平可产生各种有害健康的影响。本公开提供了同时解决由消耗碳水化合物引起的损害以及由不消耗纤维引起的损害的解决方案。

本公开尤其提供了经过工程化以表达纤维合成酶，例如用于在肠道中(例如在肠中，例如在小肠和/或大肠中)表达所述酶的细菌。在特定实施方案中，本公开提供了经过工程化以表达纤维合成酶的细菌，所述纤维合成酶在例如在肠道中合成纤维的过程中消耗碳水化合物。本领域技术人员将了解，本文中所有提到肠道之处包括小肠和/或大肠中的至少一者或两者，本文中提到肠也是如此。

本公开还尤其提供了用于经口递送纤维合成酶，例如用于将纤维合成酶递送至肠道(例如递送至肠，例如递送至小肠和/或大肠)的制剂。在各种实施方案中，本公开提供了一种包括分离的纤维合成酶的丸剂或囊剂。

在至少某些方面中，本公开提供了一种降低受试者肠道中碳水化合物的量或浓度的方法，所述方法包括向受试者施用经过工程化以表达编码纤维合成酶的异源核酸序列的细菌，其中所述纤维合成酶从碳水化合物底物合成纤维。

在至少某些方面中，本公开提供了一种增加受试者肠道中纤维的量或浓度的方法，所述方法包括向受试者施用经过工程化以表达编码纤维合成酶的异源核酸序列的细菌，其中所述纤维合成酶从碳水化合物底物合成纤维。

在至少某些方面中，本公开提供了一种对需要降低肠道中碳水化合物的量或浓度或增加肠道中纤维的量或浓度的受试者进行治疗的方法，所述方法包括向受试者施用经过工程化以表达编码纤维合成酶的异源核酸序列的细菌，其中所述纤维合成酶从碳水化合物底物合成纤维。

在各种实施方案中，受试者罹患与碳水化合物消耗正向相关或关联的疾患。在各种实施方案中，受试者罹患与纤维消耗负向相关或关联的疾患。在各种实施方案中，受试者罹患选自以下的疾患：心血管疾病、心脏病、高血压、高血胆固醇、高血糖、糖尿病、肥胖症、肠道失调、炎性肠道疾病、肠易激综合征(IBS)、憩室炎、结肠直肠癌、肠癌、腹胀、抽筋、胀气、痔疮以及腹泻。

在各种实施方案中，纤维为可溶性纤维。在各种实施方案中，合成的纤维包含葡萄糖、果糖、半乳糖醛酸、N-乙酰基-D-葡糖胺和/或半乳糖单体。在各种实施方案中，碳水化合物底物选自以下中的一者或多者：UDP-葡萄糖、UDP-半乳糖、UDP-岩藻糖、ADP-α-D-葡萄糖、UDP-半乳糖醛酸、UDP-N-乙酰基-α-D-葡糖胺、肌醇半乳糖苷、乳糖、葡萄糖以及蔗糖，并且/或者其中在肠道中量或浓度降低的碳水化合物选自以下中的一者或多者：葡萄糖、半乳糖、蔗糖、果糖和/或乳糖。在各种实施方案中，合成的纤维为果寡糖，并且/或者选自昆布二糖、愈创葡聚糖、凝胶多糖、燕麦β-葡聚糖、昆布多糖、pleuran、香菇多糖、酵母β葡聚糖、海藻酮糖、海藻糖、菊粉、蔗果三糖、蔗果四糖、左聚糖、棉子糖、水苏糖、毛蕊花糖、红细胞三糖、人乳寡糖(HMO)、纤维二糖、纤维素、微晶纤维素、棉花、麦芽糖、直链淀粉、淀粉、糖原、支链淀粉、果胶、几丁质。在各种实施方案中，纤维合成酶选自蔗糖酶、菊粉蔗糖酶、左聚糖蔗糖酶、1,3-β-葡聚糖合酶、1,3；1,4-β-D-葡聚糖合酶、1,6-β-葡聚糖合酶、蔗糖异构酶、1,6-α-半乳糖基转移酶、海藻酮糖合酶、海藻糖-6-磷酸合酶、α-1,4-半乳糖基转移酶、α-1,2-岩藻糖基转移酶、β-半乳糖苷酶、b-D-半乳糖苷酶、纤维素合酶、麦芽糖合酶、淀粉合酶、淀粉分支酶、糖原合酶、半乳糖醛酸基转移酶以及几丁质寡糖合酶。在各种实施方案中，纤维合成酶与分泌多肽可操作地连接。

在各种实施方案中，细菌为芽孢形成细菌并且/或者呈芽孢形式。在各种实施方案中，细菌为益生菌。在各种实施方案中，细菌属于选自以下的属：芽孢杆菌属(Bacillus)、双歧杆菌属(Bifidobacterium)、肠球菌属(Enterococcus)、埃希氏杆菌属(Escherichia)、乳杆菌属(Lactobacillus)、乳球菌(Lactococcus)、明串珠菌属(Leuconostoc)、片球菌属(Pediococcus)以及链球菌属(Streptococcus)，任选地其中细菌属于芽孢杆菌属，任选地其中细菌属于枯草芽孢杆菌(B.subtilis)种。在各种实施方案中，细菌属于特征为不定殖于肠道的菌株。

在各种实施方案中，所述方法包括向在之前一段时间内已消耗碳水化合物和/或碳水化合物底物的受试者施用工程化细菌，其中之前一段时间为24小时12小时、6小时、3小时或1小时的时间。在各种实施方案中，所述方法包括向尚未消耗碳水化合物和/或碳水化合物底物的受试者施用工程化细菌。在各种实施方案中，所述方法包括向在之前一段时间内尚未消耗碳水化合物和/或碳水化合物底物的受试者施用工程化细菌，其中所述之前一段时间为24小时12小时、6小时、3小时或1小时的时间。在各种实施方案中，受试者在施用工程化细菌之后一段时间内消耗碳水化合物和/或碳水化合物底物，其中之后一段时间为24小时12小时、6小时、3小时或1小时的时间。

在各种实施方案中，所述方法防止糖在受试者的结肠中累积。在各种实施方案中，纤维合成酶和/或由工程化细菌所包含的异源核酸序列编码的酶由纤维合成酶组成。

在各种实施方案中，施用包括经口施用包含工程化细菌的组合物。在各种实施方案中，施用包括施用约10⁴至约10¹²个集落形成单位的工程化细菌。

在各种实施方案中，编码表达产物的核酸序列与组成性启动子可操作地连接。在各种实施方案中，编码表达产物的核酸序列与鞭毛蛋白基因启动子可操作地连接。在各种实施方案中，鞭毛蛋白基因启动子包含CsrA结合位点中的突变，其中CsrA结合位点中的突变抑制CsrA与编码纤维合成酶的mRNA转录物结合，但不阻碍纤维合成酶的表达。在各种实施方案中，工程化细菌包含内源性flgM基因的突变，所述突变降低FlgM对σ因子的抑制。在各种实施方案中，鞭毛蛋白基因启动子为枯草芽孢杆菌hag启动子。在各种实施方案中，CsrA结合位点中的突变为选自结合位点1(BS1)和结合位点2(BS2)的枯草芽孢杆菌hag启动子CsrA结合位点中的突变。在各种实施方案中，CsrA结合位点中的突变为BS1的茎-环二级结构的茎中或BS2的茎-环二级结构的茎中的突变。在各种实施方案中，CsrA结合位点中的突变为具有序列AGGA的CsrA BS1识别序列中的突变。在各种实施方案中，CsrA结合位点中的突变为根据SEQ ID NO:29的BS1突变或根据SEQ ID NO:30的BS2突变。在各种实施方案中，CsrA结合位点中的突变不破坏枯草芽孢杆菌hag启动子的夏因-达尔加诺序列(Shine-Dalgarno sequence)。在各种实施方案中，内源性flgM基因的突变包含所有或一部分flgM基因的缺失。在各种实施方案中，内源性flgM基因的突变包含编码flgM的活性位点的序列中的突变。在各种实施方案中，内源性flgM基因的突变包含编码参与FlgM与SigD的结合的氨基酸的序列中的突变。在各种实施方案中，内源性flgM基因的突变改变编码在FlgM蛋白的C端FlgM的第3螺旋或第4螺旋中的氨基酸的序列。在各种实施方案中，细菌为枯草芽孢杆菌种并且内源性flgM基因的突变在选自以下的氨基酸处改变由SEQ ID NO:31编码的氨基酸序列：I-58、K-62、I-65、G-68、D-73以及A-78。在各种实施方案中，细菌为枯草芽孢杆菌种并且内源性flgM基因的突变在选自以下的氨基酸处改变由SEQ ID NO:31编码的氨基酸序列：I-3、G-7、S-10、V-11、A-40、K-41、M43、I-58、L-61、K-62、I-65、Y-70、K-71、V-72、D-73、A-74、H-76、I-77、A-78、N-80、M-81、I-82、N-83、F-84、Y-85以及K-86。在各种实施方案中，内源性flgM基因的突变降低或消除FlgM生物活性。在各种实施方案中，σ因子为SigD。

在至少某些方面中，本公开提供了一种经过工程化以表达编码纤维合成酶的异源核酸序列的细菌，其中所述纤维合成酶从碳水化合物底物合成纤维。在各种实施方案中，纤维为可溶性纤维。在各种实施方案中，合成的纤维包含葡萄糖、果糖、半乳糖醛酸、N-乙酰基-D-葡糖胺和/或半乳糖单体。在各种实施方案中，碳水化合物底物选自以下中的一者或多者：UDP-葡萄糖、UDP-半乳糖、UDP-岩藻糖、ADP-α-D-葡萄糖、UDP-半乳糖醛酸、UDP-N-乙酰基-α-D-葡糖胺、肌醇半乳糖苷、乳糖、葡萄糖以及蔗糖，并且/或者其中在肠道中量或浓度降低的碳水化合物选自以下中的一者或多者：葡萄糖、半乳糖、蔗糖、果糖和/或乳糖。在各种实施方案中，合成的纤维为果寡糖，并且/或者选自昆布二糖、愈创葡聚糖、凝胶多糖、燕麦β-葡聚糖、昆布多糖、pleuran、香菇多糖、酵母β葡聚糖、海藻酮糖、海藻糖、菊粉、蔗果三糖、蔗果四糖、左聚糖、棉子糖、水苏糖、毛蕊花糖、红细胞三糖、人乳寡糖(HMO)、纤维二糖、纤维素、微晶纤维素、棉花、麦芽糖、直链淀粉、淀粉、糖原、支链淀粉、果胶、几丁质。在各种实施方案中，纤维合成酶选自蔗糖酶、菊粉蔗糖酶、左聚糖蔗糖酶、1,3-β-葡聚糖合酶、1,3；1,4-β-D-葡聚糖合酶、1,6-β-葡聚糖合酶、蔗糖异构酶、1,6-α-半乳糖基转移酶、海藻酮糖合酶、海藻糖-6-磷酸合酶、α-1,4-半乳糖基转移酶、α-1,2-岩藻糖基转移酶、β-半乳糖苷酶、b-D-半乳糖苷酶、纤维素合酶、麦芽糖合酶、淀粉合酶、淀粉分支酶、糖原合酶、半乳糖醛酸基转移酶以及几丁质寡糖合酶。在各种实施方案中，纤维合成酶与分泌多肽可操作地连接。在各种实施方案中，细菌为芽孢形成细菌并且/或者呈芽孢形式。在各种实施方案中，细菌为益生菌。在各种实施方案中，细菌属于选自以下的属：芽孢杆菌属、双歧杆菌属、肠球菌属、埃希氏杆菌属、乳杆菌属、乳球菌、明串珠菌属、片球菌属以及链球菌属，任选地其中细菌属于芽孢杆菌属，任选地其中细菌属于枯草芽孢杆菌种。在各种实施方案中，细菌属于特征为不定殖于肠道的菌株。在各种实施方案中，纤维合成酶和/或由工程化细菌所包含的异源核酸序列编码的酶由纤维合成酶组成。

在各种实施方案中，编码表达产物的核酸序列与组成性启动子可操作地连接。在各种实施方案中，编码表达产物的核酸序列与鞭毛蛋白基因启动子可操作地连接。在各种实施方案中，鞭毛蛋白基因启动子包含CsrA结合位点中的突变，其中CsrA结合位点中的突变抑制CsrA与编码纤维合成酶的mRNA转录物结合，但不阻碍纤维合成酶的表达。在各种实施方案中，工程化细菌包含内源性flgM基因的突变，所述突变降低FlgM对σ因子的抑制。在各种实施方案中，鞭毛蛋白基因启动子为枯草芽孢杆菌hag启动子。在各种实施方案中，CsrA结合位点中的突变为选自结合位点1(BS1)和结合位点2(BS2)的枯草芽孢杆菌hag启动子CsrA结合位点中的突变。在各种实施方案中，CsrA结合位点中的突变为BS1的茎-环二级结构的茎中或BS2的茎-环二级结构的茎中的突变。在各种实施方案中，CsrA结合位点中的突变为具有序列AGGA的CsrA BS1识别序列中的突变。在各种实施方案中，CsrA结合位点中的突变为根据SEQ ID NO:29的BS1突变或根据SEQ ID NO:30的BS2突变。在各种实施方案中，CsrA结合位点中的突变不破坏枯草芽孢杆菌hag启动子的夏因-达尔加诺序列。在各种实施方案中，内源性flgM基因的突变包含所有或一部分flgM基因的缺失。在各种实施方案中，内源性flgM基因的突变包含编码flgM的活性位点的序列中的突变。在各种实施方案中，内源性flgM基因的突变包含编码参与FlgM与SigD的结合的氨基酸的序列中的突变。在各种实施方案中，内源性flgM基因的突变改变编码在FlgM蛋白的C端FlgM的第3螺旋或第4螺旋中的氨基酸的序列。在各种实施方案中，细菌为枯草芽孢杆菌种并且内源性flgM基因的突变在选自以下的氨基酸处改变由SEQ ID NO:31编码的氨基酸序列：I-58、K-62、I-65、G-68、D-73以及A-78。在各种实施方案中，细菌为枯草芽孢杆菌种并且内源性flgM基因的突变在选自以下的氨基酸处改变由SEQ ID NO:31编码的氨基酸序列：I-3、G-7、S-10、V-11、A-40、K-41、M43、I-58、L-61、K-62、I-65、Y-70、K-71、V-72、D-73、A-74、H-76、I-77、A-78、N-80、M-81、I-82、N-83、F-84、Y-85以及K-86。在各种实施方案中，内源性flgM基因的突变降低或消除FlgM生物活性。在各种实施方案中，σ因子为SigD。

在至少某些方面中，本公开提供了一种包含本公开的工程化细菌的组合物。在某些实施方案中，组合物被配制成用于经口施用。在一些实施方案中，制剂包含约10⁴至约10¹²个集落形成单位的工程化细菌。在各种实施方案中，组合物包含生理学上可接受的载体。在各种实施方案中，生理学上可接受的载体选自乳酸发酵食品、发酵乳制品、抗性淀粉、膳食纤维、碳水化合物、蛋白质、糖基化蛋白、水、胶囊填料以及胶状物质。

在至少某些方面中，本公开提供了一种包含本公开的工程化细菌的细菌细胞培养物。

在至少某些方面中，本公开提供了一种降低受试者肠道中碳水化合物的量或浓度的方法，所述方法包括向受试者施用包含纤维合成酶的组合物，其中所述纤维合成酶从碳水化合物底物合成纤维。在各种实施方案中，纤维合成酶为分离的纤维合成酶。

在至少某些方面中，本公开提供了一种增加受试者肠道中纤维的量或浓度的方法，所述方法包括向受试者施用包含纤维合成酶的组合物，其中所述纤维合成酶从碳水化合物底物合成纤维。在各种实施方案中，纤维合成酶为分离的纤维合成酶。

在至少某些方面中，本公开提供了一种对需要降低肠道中碳水化合物的量或浓度或增加肠道中纤维的量或浓度的受试者进行治疗的方法，所述方法包括向受试者施用包含纤维合成酶的组合物，其中所述纤维合成酶从碳水化合物底物合成纤维。在各种实施方案中，纤维合成酶为分离的纤维合成酶。

在各种实施方案中，纤维为可溶性纤维。在各种实施方案中，合成的纤维包含葡萄糖、果糖、半乳糖醛酸、N-乙酰基-D-葡糖胺和/或半乳糖单体。在各种实施方案中，碳水化合物底物选自以下中的一者或多者：UDP-葡萄糖、UDP-半乳糖、UDP-岩藻糖、ADP-α-D-葡萄糖、UDP-半乳糖醛酸、UDP-N-乙酰基-α-D-葡糖胺、肌醇半乳糖苷、乳糖、葡萄糖以及蔗糖，并且/或者其中在肠道中量或浓度降低的碳水化合物选自以下中的一者或多者：葡萄糖、半乳糖、蔗糖、果糖和/或乳糖。在各种实施方案中，合成的纤维为果寡糖，并且/或者选自昆布二糖、愈创葡聚糖、凝胶多糖、燕麦β-葡聚糖、昆布多糖、pleuran、香菇多糖、酵母β葡聚糖、海藻酮糖、海藻糖、菊粉、蔗果三糖、蔗果四糖、左聚糖、棉子糖、水苏糖、毛蕊花糖、红细胞三糖、人乳寡糖(HMO)、纤维二糖、纤维素、微晶纤维素、棉花、麦芽糖、直链淀粉、淀粉、糖原、支链淀粉、果胶、几丁质。在各种实施方案中，纤维合成酶选自蔗糖酶、菊粉蔗糖酶、左聚糖蔗糖酶、1,3-β-葡聚糖合酶、1,3；1,4-β-D-葡聚糖合酶、1,6-β-葡聚糖合酶、蔗糖异构酶、1,6-α-半乳糖基转移酶、海藻酮糖合酶、海藻糖-6-磷酸合酶、α-1,4-半乳糖基转移酶、α-1,2-岩藻糖基转移酶、β-半乳糖苷酶、b-D-半乳糖苷酶、纤维素合酶、麦芽糖合酶、淀粉合酶、淀粉分支酶、糖原合酶、半乳糖醛酸基转移酶以及几丁质寡糖合酶。

在各种实施方案中，所述方法包括向在之前一段时间内已消耗碳水化合物和/或碳水化合物底物的受试者施用组合物，其中之前一段时间为24小时12小时、6小时、3小时或1小时的时间。在各种实施方案中，所述方法包括向尚未消耗碳水化合物和/或碳水化合物底物的受试者施用组合物。在各种实施方案中，所述方法包括向在之前一段时间内尚未消耗碳水化合物和/或碳水化合物底物的受试者施用组合物，其中之前一段时间为24小时12小时、6小时、3小时或1小时的时间。在各种实施方案中，受试者在施用组合物之后一段时间内消耗碳水化合物和/或碳水化合物底物，其中之后一段时间为24小时12小时、6小时、3小时或1小时的时间。

在各种实施方案中，所述方法防止糖在受试者的结肠中累积。在各种实施方案中，构成组合物的纤维合成酶和/或构成组合物的酶由纤维合成酶组成。在各种实施方案中，施用包括经口施用组合物。

在至少某些方面中，本公开提供了一种包含纤维合成酶的组合物，其中所述纤维合成酶从碳水化合物底物合成纤维，并且所述组合物被配制成用于经口施用。在各种实施方案中，纤维为可溶性纤维。在各种实施方案中，合成的纤维包含葡萄糖、果糖、半乳糖醛酸、N-乙酰基-D-葡糖胺和/或半乳糖单体。在各种实施方案中，碳水化合物底物选自以下中的一者或多者：UDP-葡萄糖、UDP-半乳糖、UDP-岩藻糖、ADP-α-D-葡萄糖、UDP-半乳糖醛酸、UDP-N-乙酰基-α-D-葡糖胺、肌醇半乳糖苷、乳糖、葡萄糖以及蔗糖，并且/或者其中在肠道中量或浓度降低的碳水化合物选自以下中的一者或多者：葡萄糖、半乳糖、蔗糖、果糖和/或乳糖。在各种实施方案中，合成的纤维为果寡糖，并且/或者选自昆布二糖、愈创葡聚糖、凝胶多糖、燕麦β-葡聚糖、昆布多糖、pleuran、香菇多糖、酵母β葡聚糖、海藻酮糖、海藻糖、菊粉、蔗果三糖、蔗果四糖、左聚糖、棉子糖、水苏糖、毛蕊花糖、红细胞三糖、人乳寡糖(HMO)、纤维二糖、纤维素、微晶纤维素、棉花、麦芽糖、直链淀粉、淀粉、糖原、支链淀粉、果胶、几丁质。在各种实施方案中，纤维合成酶选自蔗糖酶、菊粉蔗糖酶、左聚糖蔗糖酶、1,3-β-葡聚糖合酶、1,3；1,4-β-D-葡聚糖合酶、1,6-β-葡聚糖合酶、蔗糖异构酶、1,6-α-半乳糖基转移酶、海藻酮糖合酶、海藻糖-6-磷酸合酶、α-1,4-半乳糖基转移酶、α-1,2-岩藻糖基转移酶、β-半乳糖苷酶、b-D-半乳糖苷酶、纤维素合酶、麦芽糖合酶、淀粉合酶、淀粉分支酶、糖原合酶、半乳糖醛酸基转移酶以及几丁质寡糖合酶。在各种实施方案中，构成组合物的纤维合成酶和/或构成组合物的酶由纤维合成酶组成。在各种实施方案中，组合物包含生理学上可接受的载体。在各种实施方案中，生理学上可接受的载体选自乳酸发酵食品、发酵乳制品、抗性淀粉、膳食纤维、碳水化合物、蛋白质、糖基化蛋白、水、胶囊填料以及胶状物质。

定义

一个、一种、所述：如本文所用，“一个”、“一种”以及“所述”是指所述冠词的一个(种)或超过一个(种)(即，至少一个(种))语法对象。举例来说，“一个元件”公开了刚好一个元件的实施方案以及包括超过一个元件的实施方案。

约：如本文所用，术语“约”当用于提到一个值时是指在所提到的值的上下文中类似的值。一般来说，熟悉上下文的本领域技术人员将了解在上下文中“约”所涵盖的偏差的相关程度。举例来说，在一些实施方案中，术语“约”可涵盖在所提到的值的25％、20％、19％、18％、17％、16％、15％、14％、13％、12％、11％、10％、9％、8％、7％、6％、5％、4％、3％、2％、1％或更小的范围内的值。

施用：如本文所用，术语“施用”典型地是指向受试者或系统施用组合物以实现为组合物或包括在组合物中的剂的递送。

与……相关：如果一个事件或实体的存在、水平和/或形式与另一个事件或实体的存在、水平和/或形式相关，那么两个事件或实体彼此“相关”，如所述术语在本文中所用。举例来说，如果特定实体(例如多肽、遗传印迹、代谢产物、微生物等)的存在、水平和/或形式与特定疾病、病症或疾患的发病率和/或易感性相关(例如在相关人群中)，那么认为它与所述疾病、病症或疾患相关。在一些实施方案中，如果两个或更多个实体直接或间接地相互作用，使得它们在物理上彼此邻近和/或保持在物理上彼此邻近，那么它们在物理上彼此“相关”。在一些实施方案中，彼此物理相关的两个或更多个实体彼此共价连接；在一些实施方案中，彼此物理相关的两个或更多个实体不彼此共价连接，而是例如借助于氢键、范德华相互作用(van der Waals interaction)、疏水相互作用、磁性以及它们的组合非共价连接。

在……之间或从……：如本文所用，术语“在……之间”是指属于所指示的上限与下限或第一边界与第二边界之间(包括边界)的内容。类似地，当在值的范围情形下使用时，术语“从……”表明所述范围包括介于所指示的上限与下限或第一边界与第二边界之间(包括边界)的内容。

结合：如本文所用，术语“结合”是指两种或更多种剂之间的非共价相关。“直接”结合涉及剂之间的物理接触；间接结合涉及借助于与一种或多种中间剂物理接触实现的物理相互作用。可在多种情形中的任一者中发生和/或评估两种或更多种剂之间的结合，包括其中孤立地或在更复杂的系统情形下(例如同时使用载体剂和/或在生物系统或细胞中共价地或以其他方式相关联)对相互作用的剂进行研究。

对照表达或活性：如本文所用，如果第二元件的表达或活性在至少一组条件下完全或部分取决于第一元件的状态(例如存在、不存在、构象、化学修饰、相互作用或其他活性)，那么第一元件(例如蛋白质，诸如转录因子，或核酸序列，诸如启动子)“控制”或“驱动”第二元件(例如蛋白质或编码诸如蛋白质等剂的核酸)的表达或活性。表达或活性的控制可为基本的控制或活性，例如因为第一元件的状态的变化在至少一组条件下可使得第二元件的表达或活性与参考对照相比变化至少10％(例如至少20％、30％、40％、50％、60％、70％、80％、90％、100％、2倍、3倍、4倍、5倍、10倍、20倍、30倍、40-倍、50倍、100倍)。

对应于：如本文所用，术语“对应于”可用于通过与适当的参考化合物或组合物比较来指定化合物或组合物中的结构元件的位置/身份。举例来说，在一些实施方案中，聚合物中的单体残基(例如多肽中的氨基酸残基或多核苷酸中的核酸残基)可被鉴定为“对应于”适当的参考聚合物中的残基。举例来说，本领域技术人员了解，常常根据相关参考序列的方案(即使例如此类命名不反映所提供的序列的文字编号)来指定所提供的多肽或多核苷酸序列中的残基(例如编号或标记)。借助于说明，如果参考序列在位置100-110包括特定氨基酸基序，并且第二相关序列在位置110-120包括相同基序，那么第二相关序列的所述基序位置可被说成“对应于”参考序列的位置100-110。本领域技术人员了解，可例如通过序列比对容易地鉴定对应位置，并且此类比对通常通过多种已知工具、策略和/或算法中的任一者来实现，包括但不限于软件程序，诸如BLAST、CS-BLAST、CUDASW++、DIAMOND、FASTA、GGSEARCH/GLSEARCH、Genoogle、HMMER、HHpred/HHsearch、IDF、Infernal、KLAST、USEARCH、parasail、PSI-BLAST、PSI-Search、ScalaBLAST、Sequilab、SAM、SSEARCH、SWAPHI、SWAPHI-LS、SWIMM或SWIPE。

剂型或单位剂型：本领域技术人员将了解，术语“剂型”可用于指用于向受试者施用的剂(例如治疗剂或诊断剂)的物理离散单元。典型地，各个此类单元含有预定量的剂。在一些实施方案中，此类量为适合根据已确定当向相关群体施用(即，使用治疗性投用方案)时与所需或有益结果有关的投用方案施用的单位剂量(或其整个部分)。本领域技术人员了解，向特定受试者施用的治疗性组合物或剂的总量或游离量由一个或多个主治医师确定并且可涉及施用多个剂型。

投用方案：如本文所用，术语“投用方案”可指向受试者施用的一组一个或多个相同或不同的单位剂量，典型地包括多个单位剂量，其中的每一者的施用与其他单位剂量的施用隔开一段时间。在各种实施方案中，投用方案的一个或多个或所有单位剂量可为相同的或可改变(例如随时间推移增加、随时间推移降低或根据受试者和/或医师决定进行调整)。在各种实施方案中，各剂量之间的一个或多个或所有时间段可为相同的或可改变(例如随时间推移增加、随时间推移降低或根据受试者和/或医师决定进行调整)。在一些实施方案中，给定治疗剂具有建议投用方案，所述建议投用方案可涉及一个或多个剂量。典型地，市售药物的至少一种建议投用方案为本领域技术人员已知的。在一些实施方案中，投用方案与当在相关群体中施用时的所需或有益结果相关(即，为治疗性投用方案)。

工程化的：如本文所用，术语“工程化的”是指已经人工操纵的方面。举例来说，当在工程化的多核苷酸中在自然界在顺序上不键联在一起的两个或更多个序列经人工操纵而彼此键联时，多核苷酸被认为是“工程化的”。本领域技术人员将了解，“工程化的”核酸或氨基酸序列可为重组核酸或氨基酸序列。在一些实施方案中，工程化多核苷酸包括在自然界中被发现与第一序列可操作地连接但在自然界中未被发现与第二序列可操作地连接的编码序列和/或调控序列，所述编码序列和/或调控序列在工程化多核苷酸中并且经人工与第二序列可操作地连接。在一些实施方案中，如果细胞或有机体已被操纵使得其遗传信息被改变(例如已例如通过转化、杂交、体细胞杂交、转染、转导或其他机制引入先前不存在的新的遗传物质，或先前存在的遗传物质例如因取代、缺失或杂交而被改变或去除)，那么它被视为“工程化的”。如作为惯例并且本领域技术人员所理解，尽管是对现有实体的直接操纵，但工程化多核苷酸或细胞的完美或不完美后代或拷贝典型地仍被称为“工程化的”。

赋形剂：如本文所用，“赋形剂”是指可包括于药物组合物中例如用于提供或促进所需一致性或稳定化作用的非治疗性剂。在一些实施方案中，适合的药物赋形剂可包括例如淀粉、葡萄糖、乳糖、蔗糖、明胶、麦芽、稻米、面粉、白垩、硅胶、硬脂酸钠、单硬脂酸甘油酯、滑石、氯化钠、脱脂乳粉、甘油、丙烯、二醇、水、乙醇等。

表达：如本文所用，“表达”个别地指和/或统指使得从核酸序列产生所编码的剂(诸如多肽)的一个或多个生物过程。表达尤其包括转录和翻译中的任一者或两者。

片段：如本文所用，“片段”指为或包括参考剂(有时称为“母体”剂)的离散部分的结构。在一些实施方案中，片段缺乏在参考剂中发现的一个或多个部分。在一些实施方案中，片段为或包括在参考剂中发现的一个或多个部分。在一些实施方案中，参考剂为聚合物，诸如多核苷酸或多肽。在一些实施方案中，聚合物的片段为或包括参考聚合物的至少3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、275、300、325、350、375、400、425、450、475、500个或更多个单体单元(例如残基)。在一些实施方案中，聚合物的片段为或包括在参考聚合物中发现的单体单元(例如残基)的至少约5％、10％、15％、20％、25％、30％、25％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或更多。参考聚合物的片段不一定与参考聚合物的对应部分相同。举例来说，参考聚合物的片段可为具有残基与参考聚合物具有至少约5％、10％、15％、20％、25％、30％、25％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或更多同一性的序列的聚合物。可通过或可不通过参考剂的物理片段化产生片段。在一些情况下，通过参考剂的物理片段化产生片段。在一些情况下，不通过参考剂的物理片段化产生片段，而是可替代地例如通过从头合成或其他手段产生。

基因或转基因：如本文所用，术语“基因”是指为或包括编码序列的DNA序列(即，编码表达产物(诸如RNA产物和/或多肽产物)的DNA序列)，任选以及一些或所有的控制编码序列的表达的调控序列。在一些实施方案中，基因包括非编码序列，诸如但不限于内含子。在一些实施方案中，基因可包括编码(例如外显子)与非编码(例如内含子)序列两者。在一些实施方案中，基因包括调控序列，所述调控序列为启动子。在一些实施方案中，基因包括以下中的一者或两者：(i)延长参考背景(诸如来源基因组)下编码序列上游预定数目的核苷酸的DNA核苷酸，以及(ii)延长参考背景(诸如来源基因组)下编码序列下游预定数目的核苷酸的DNA核苷酸。在各种实施方案中，预定数目的核苷酸可为500bp、1kb、2kb、3kb、4kb、5kb、10kb、20kb、30kb、40kb、50kb、75kb或100kb。如本文所用，“转基因”是指一种基因相对于其中存在所述基因或可通过工程化将所述基因放于其中的参考背景来说不为内源性或天然的。

基因产物或表达产物：如本文所用，术语“基因产物”或“表达产物”通常指从基因转录的RNA(加工前和/或加工后)或由从基因转录的RNA编码的多肽(修饰前和/或修饰后)。

异源：如本文所用，如果在自然界中第一核酸序列不与第二核酸序列可操作地连接，那么第一核酸序列对于第二核酸序列来说为“异源”的。通过延伸，如果多肽由对启动子来说异源的核酸序列编码，那么所述多肽对表达控制序列来说为“异源”的。

同一性：如本文所用，术语“同一性”是指聚合分子之间(例如核酸分子(例如DNA分子和/或RNA分子)之间和/或多肽分子之间)的总体相关性。用于计算两个所提供的序列之间的同一性百分比的方法为本领域已知的。举例来说，计算两个核酸或多肽序列的同一性百分比可通过出于最佳比较目的比对两个序列(或一个或两个序列的补体)来进行(例如可在第一和第二序列中的一者或两者中引入空隙以获得最佳比对并且出于比较目的可不管不相同的序列)。然后比较对应位置的核苷酸或氨基酸。当第一序列中的位置在第二序列中的对应位置被相同残基(例如核苷酸或氨基酸)占据时，那么所述分子在所述位置为相同的。两个序列之间的同一性百分比为序列所拥有的相同位置的数目的函数，任选考虑空隙的数目和各空隙的长度，可能需要引入所述空隙以获得两个序列的最佳比对。两个序列之间的序列比较和同一性百分比确定可使用计算算法(诸如BLAST(基本局部比对检索工具))来实现。

“改善”、“增加”、“抑制”或“降低”：如本文所用，术语“改善”、“增加”、“抑制”以及“降低”以及其语法等效形式指示与参考物的定性或定量差异。

分离的：如本文所用，“分离的”或“纯化的”可指物质和/或实体(a)与最初产生(在自然界中和/或在实验环境中)时与其缔合的至少一些组分分离，和/或(b)经人工设计、产生、制备和/或制造。分离的物质和/或实体可与至少约10％、约20％、约30％、约40％、约50％、约60％、约70％、约80％、约90％、约91％、约92％、约93％、约94％、约95％、约96％、约97％、约98％、约99％或超过约99％的最初与其缔合的其他组分分离。在一些实施方案中，分离的物质和/或实体为至少约80％纯、约85％纯、约90％纯、约91％纯、约92％纯、约93％纯、约94％纯、约95％纯、约96％纯、约97％纯、约98％纯、约99％纯或超过约99％纯。如本文所用，如果物质和/或实体基本上不含其他组分，那么物质和/或实体为“纯的”。在一些实施方案中，如本领域技术人员将理解，物质和/或实体在与某些其他组分(诸如一种或多种载体或赋形剂，例如缓冲剂、溶剂、水等)组合之后仍可被认为是“分离的”或“纯的”；在此类实施方案中，在不包括此类载体或赋形剂的情况下计算物质和/或实体的分离百分比或纯度。仅举一个例子，在一些实施方案中，存在于自然界中的诸如多肽或多核苷酸等生物聚合物当(a)由于其衍生起源或来源不与自然界中在其天然状态中的一些或所有与其相缔合的组分相关；(b)它基本上不含与自然界中产生它的物种相同的物种的其他多肽或核酸；(c)由来自不属于自然界中产生它的物种的细胞或其他表达系统表达或以其他方式与所述细胞或其他表达系统的组分相关时可被认为是“分离的”。因此，举例来说，在一些实施方案中，化学合成或在与在自然界中产生它的细胞系统不同的细胞系统中合成的多肽被认为是“分离的”多肽。或者或另外，在一些实施方案中，已经历一种或多种纯化技术的多肽在它已与(a)自然界中与其缔合；和/或(b)当最初产生时与其缔合的其他组分分离的情况下可被认为是“分离的”多肽。

核酸：如本文所用，术语“核酸”广义上是指合并至或可合并至寡核苷酸链中的任何化合物和/或物质。在一些实施方案中，核酸为经由磷酸二酯键联合并至或可合并至寡核苷酸链中的化合物和/或物质。如由上下文将显而易见，在一些实施方案中，术语核酸是指个别核酸残基(例如核苷酸和/或核苷)，并且在一些实施方案中是指包括多个个别核酸残基的多核苷酸链。核酸可为或包括DNA、RNA或它们的组合。核酸可包括天然核酸残基、核酸类似物和/或合成残基。在一些实施方案中，核酸包括天然核苷酸(例如腺苷、胸苷、鸟苷、胞苷、尿苷、脱氧腺苷、脱氧胸苷、脱氧鸟苷以及脱氧胞苷)。在一些实施方案中，核酸为或包括一种或多种核苷酸类似物(例如2-氨基腺苷、2-硫代胸苷、肌苷、吡咯并-嘧啶、3-甲基腺苷、5-甲基胞苷、C-5丙炔基-胞苷、C-5丙炔基-尿苷、2-氨基腺苷、C5-溴尿苷、C5-氟尿苷、C5-碘尿苷、C5-丙炔基-尿苷、C5-丙炔基-胞苷、C5-甲基胞苷、2-氨基腺苷、7-去氮腺苷、7-去氮鸟苷、8-氧代腺苷、8-氧代鸟苷、0(6)-甲基鸟嘌呤、2-硫代胞苷、甲基化碱基、嵌插碱基以及它们的组合)。在一些实施方案中，核酸具有编码功能基因产物(诸如RNA或蛋白质)的核苷酸序列。在一些实施方案中，核酸包括一个或多个内含子。在一些实施方案中，核酸包括一个或多个基因。在一些实施方案中，通过以下中的一者或多者来制备核酸：从天然来源分离、通过基于互补模板的聚合进行酶促合成(体内或体外)、在重组细胞或系统中复制以及化学合成。在一些实施方案中，核酸类似物不同于核酸，因为它不使用磷酸二酯骨架。举例来说，在一些实施方案中，核酸可包括本领域已知的一种或多种肽核酸并且具有肽键替代骨架中的磷酸二酯键。或者或另外，在一些实施方案中，核酸具有一个或多个硫代磷酸酯和/或5'-N-亚磷酰胺键联而非磷酸二酯键。在一些实施方案中，与天然核酸中的那些糖相比，核酸包括一个或多个修饰的糖(例如2'-氟核糖、核糖、2'-脱氧核糖、阿拉伯糖以及己糖)。在一些实施方案中，核酸为或包括至少3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、110、120、130、140、150、160、170、180、190、20、225、250、275、300、325、350、375、400、425、450、475、500、600、700、800、900、1000、1500、2000、2500、3000、3500、4000、4500、5000个或更多个残基。在一些实施方案中，核酸为部分或完全单链的，或部分或完全双链的。在一些实施方案中，核酸所具有的序列包括至少一个编码多肽或为编码多肽的序列的补体的元件。在一些实施方案中，核酸具有酶活性。

可操作地连接：如本文所用，“可操作地连接”是指至少第一元件与第二元件缔合使得组成元件处于一个关系中，从而容许它们以其预期方式发挥功能。举例来说，如果调控序列以容许编码序列的表达受调控序列控制的方式与编码序列相缔合，那么核酸调控序列“可操作地连接”至核酸编码序列。在一些实施方案中，“可操作地连接”的调控序列直接或间接地与编码序列共价相关(例如在单个核酸中)。在一些实施方案中，调控序列反向控制编码序列的表达并且在与编码序列相同的核酸中包括调控序列不为可操作连接的要求。

药学上可接受：如本文所用，在应用于用于配制如本文所公开的组合物的一种或多种或所有组分时，术语“药学上可接受”意味着各组分必须与组合物的其他成分相容并且不对其接受者有害。

药学上可接受的载体：如本文所用，术语“药学上可接受的载体”是指有助于一种剂(例如药剂)的配制、改变一种剂的生物利用率或有助于一种剂从受试者的一个器官或部分转运至另一器官或部分的药学上可接受的物质、组合物或媒介物，诸如液体或固体填料、稀释剂、赋形剂或溶剂封装物质。可充当药学上可接受的载体的一些物质的实例包括：糖，诸如乳糖、葡萄糖以及蔗糖；淀粉，诸如玉米淀粉和马铃薯淀粉；纤维素和其衍生物，诸如羧甲基纤维素钠、乙基纤维素以及乙酸纤维素；黄蓍胶粉；麦芽；明胶；滑石；赋形剂，诸如可可脂和栓剂蜡；油，诸如花生油、棉籽油、红花油、芝麻油、橄榄油、玉米油以及大豆油；二醇，诸如丙二醇；多元醇，诸如甘油、山梨糖醇、甘露醇以及聚乙二醇；酯，诸如油酸乙酯和月桂酸乙酯；琼脂；缓冲剂，诸如氢氧化镁和氢氧化铝；海藻酸；无热原水；等渗盐水；林格氏溶液(Ringer’s solution)；乙醇；pH缓冲溶液；聚酯，聚碳酸酯和/或聚酸酐；以及药物制剂中所用的其他无毒相容物质。

药物组合物：如本文所用，术语“药物组合物”是指其中治疗剂与一种或多种药学上可接受的载体一起配制的组合物。

多肽：如本文所用，“多肽”是指氨基酸的任何聚合链。在一些实施方案中，多肽具有自然界中存在的氨基酸序列。在一些实施方案中，多肽具有自然界中不存在的氨基酸序列。在一些实施方案中，多肽具有工程化的氨基酸序列，因为它是通过人工作用设计和/或产生的。在一些实施方案中，多肽可为或包括天然氨基酸、非天然氨基酸或两者。在一些实施方案中，多肽可为或包括仅天然氨基酸或仅非天然氨基酸。在一些实施方案中，多肽可包括D-氨基酸、L-氨基酸或两者。在一些实施方案中，多肽可仅包括L-氨基酸。在一些实施方案中，多肽可例如在多肽的N端、在多肽的C端、在非末端氨基酸处或它们的任何组合包括一个或多个侧基或其他修饰，例如一个或多个氨基酸侧链。在一些实施方案中，此类侧基或修饰可选自乙酰化、酰胺化、脂化、甲基化、磷酸化、糖基化、糖化、硫酸化、甘露糖基化、亚硝基化、酰化、棕榈酰基化、异戊烯化、聚乙二醇化等，包括它们的组合。在一些实施方案中，多肽可为环状的，和/或可包括环状部分。

在一些实施方案中，术语“多肽”可附加参考多肽的名称、活性或结构以指示共同拥有相关活性或结构的一类多肽。对于此类类别，本说明书提供了和/或本领域技术人员将知道氨基酸序列和/或功能已知的类别内的示例性多肽。在一些实施方案中，多肽类别或家族的成员显示与所述类别的参考多肽具有显著序列同源性或同一性，与其拥有共同的序列基序(例如特征序列元件)和/或与其拥有共同的活性(在一些实施方案中，在类似水平或指定范围内)。举例来说，在一些实施方案中，成员多肽显示与参考多肽的总序列同源性或同一性程度为至少约30-40％，并且常常大于约50％、60％、70％、80％，90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多，和/或包括至少一个显示非常高的序列同一性(常常大于90％或甚至95％、96％、97％、98％或99％)的区域(例如保守区域，所述保守区域在一些实施方案中可为或包括特征序列元件)。此类保守区域通常涵盖至少3-4个并且在一些情况下多达20个或更多个氨基酸；在一些实施方案中，保守区域涵盖至少一段至少2、3、4、5、6、7、8、9、10、11、12、13、14、15个或更多个连续的氨基酸。在一些实施方案中，相关多肽可为或包括母体多肽的片段。在一些实施方案中，可用的多肽可为或包括多个片段，与在所关注的多肽中所发现的相比，其中的每一者在相同母体多肽中被发现相对于彼此呈不同空间排列(例如在所关注的多肽中在母体中直接键联的片段在空间上可为分开的或反之亦然，和/或与在母体中相比在所关注的多肽中片段可以不同顺序存在)，使得所关注的多肽为其母体多肽的衍生物。

预防(prevent/prevention)：如本文结合疾病、病症或疾患的发生所用的术语“预防(prevent/prevention)”是指降低发展所述疾病、病症或疾患的风险；延迟所述疾病、病症或疾患的发作；延迟所述疾病、病症或疾患的一种或多种特征或症状的发作；和/或降低所述疾病、病症或疾患的一种或多种特征或症状的频率和/或严重程度。预防可指在特定受试者中的预防或指对受试者群体的统计学影响。当疾病、病症或疾患的发作已被延迟本领域技术人员预定或理解的一段时间时可认为已发生预防。

启动子：如本文所用，“启动子”或“启动子序列”可为直接或间接(例如通过启动子-结合蛋白或物质)参与编码序列的转录的起始和/或持续进行的DNA调控区。在适合的条件下，在一个或多个转录因子和/或调控部分与启动子结合后，启动子可起始编码序列的转录。参与起始编码序列的转录的启动子可“可操作地连接”至编码序列。在某些情况下，启动子可为或包括DNA调控区，所述DNA调控区从转录起始位点(在其3'端)延伸至上游(5'方向)位置，使得如此指定的序列包括起始转录事件所必需的最少数目的碱基或元件中的一者或两者。启动子可为表达控制序列(诸如增强子和抑制子序列)、包括所述表达控制序列或与其可操作地缔合或可操作地连接。

参考：如本文所用，“参考”是指相对于它进行比较的标准或对照。举例来说，在一些实施方案中，将剂、样品、序列、受试者、动物或个体或其群体或其代表性度量或特征与参考、剂、样品、序列、受试者、动物或个体或其群体或其代表性度量或特征相比较。在一些实施方案中，参考为测量值。在一些实施方案中，参考为确定的标准或预期值。在一些实施方案中，参考为历史参考。参考可为定量的或定性的。典型地，如本领域技术人员将理解，参考和与它比较的值表示在类似条件下的度量。本领域技术人员将了解何时存在足够的相似性来证明依赖和/或比较是合理的。在一些实施方案中，在本领域技术人员例如出于评估一个或多个特定变量(例如存在或不存在一种剂或条件)或其代表性度量或特征的目的将认为类似的条件下，适当的参考可为剂、样品、序列、受试者、动物或个体或其群体。

调控序列：如本文在核酸编码序列的表达情形下所用，调控序列为控制编码序列的表达的核酸序列。在一些实施方案中，调控序列可控制或影响基因表达的一个或多个方面(例如细胞型特异性表达、可诱导表达等)。

风险：如本文关于疾病、病症或疾患所用，术语“风险”是指特定个体将发展所述疾病、病症或疾患的定性或定量概率(以百分比或以其他方式表示)。在一些实施方案中，风险以百分比表示。在一些实施方案中，风险为等于或大于0％、1％、2％、3％、4％、5％、6％、7％、8％、9％、10％、20％、30％、40％、50％、60％、70％、80％、90％或100％的定性或定量概率。在一些实施方案中，风险表示为相对于与参考风险或水平或与归因于参考相同的结果的风险的定性或定量风险水平。在一些实施方案中，与参考样品相比相对风险增加或降低的系数为1.1、1.2、1.3、1.4、1.5、1.6、1.7、1.8、1.9、2、3、4、5、6、7、8、9、10或更多。

受试者：如本文所用，术语“受试者”是指有机体，典型地哺乳动物(例如人、大鼠或小鼠)。在一些实施方案中，受试者罹患一种疾病、病症或疾患。在一些实施方案中，受试者易患一种疾病、病症或疾患。在一些实施方案中，受试者展示疾病、病症或疾患的一种或多种症状或特征。在一些实施方案中，受试者未罹患一种疾病、病症或疾患。在一些实施方案中，受试者未展示疾病、病症或疾患的任何症状或特征。在一些实施方案中，受试者具有易患一种疾病、病症或疾患或处于患一种疾病、病症或疾患的风险中的一种或多种特征。在一些实施方案中，受试者为已针对一种疾病、病症或疾患进行检查和/或已施用疗法的受试者。在一些情况下，人受试者可互换地称为“患者”或“个体”。

易患：“易患”一种疾病、病症或疾患的个体处于发展所述疾病、病症或疾患的风险中。在一些实施方案中，易患一种疾病、病症或疾患的个体未展示所述疾病、病症或疾患的任何症状。在一些实施方案中，易患一种疾病、病症或疾患的个体尚未被诊断为患有所述疾病、病症和/或疾患。在一些实施方案中，易患一种疾病、病症或疾患的个体为已暴露于与发展所述疾病、病症或疾患相关的条件或存在与发展所述疾病、病症或疾患相关生物标记物状态(例如甲基化状态)的个体。在一些实施方案中，发展一种疾病、病症和/或疾患的风险为基于群体的风险(例如罹患所述疾病、病症或疾患的个体的家族成员)。

症状减轻：根据本发明，当一种特定疾病、病症或疾患的一种或多种症状的量级(例如强度、严重程度等)和/或频率降低时“症状减轻”。为避免引起怀疑，特定症状的发作延迟被认为是降低所述症状的频率的一种形式。

治疗有效量：如本文所用，“治疗有效量”是指产生施用它所希望的效应的量。在一些实施方案中，所述术语是指当根据治疗性投用方案向罹患或易患一种疾病、病症和/或疾患的群体施用时，足以治疗所述疾病、病症和/或疾患的量。在一些实施方案中，治疗有效量为使疾病、病症和/或疾患的一种或多种症状的发生率和/或严重程度降低和/或使其发作延迟的量。本领域技术人员将了解，治疗有效量不一定在所治疗的每个特定个体中均实现成功治疗。相反地，治疗有效量可为当向需要此类治疗的患者施用时在大量受试者中提供特定所需药理学反应的量。在一些实施方案中，提到治疗有效量可为提到如在一种或多种特定组织(例如受疾病、病症或病状影响的组织)或流体(例如血液、唾液、血清、汗液、眼泪、尿液等)中所测量的量。本领域技术人员将了解，在一些实施方案中，可以单个剂量配制和/或施用治疗有效量的特定剂或疗法。在一些实施方案中，可以多个剂量配制和/或施用治疗有效的剂，例如作为投用方案的一部分。

治疗：如本文所用，术语“治疗(treatment)”(以及治疗(treat/treating))是指一种疗法的施用部分或完全缓解、改善、缓和、抑制一种特定疾病、病症或疾患的一种或多种症状、特征和/或病因；延迟其发作；降低其严重程度；和/或降低其发生率，或是为实现任何此类结果目的而施用。在一些实施方案中，此类治疗可为对未展现相关疾病、病症或疾患的迹象的受试者和/或仅展现所述疾病、病症或疾患的早期迹象的受试者的治疗。或者或另外，此类治疗可为对展现相关疾病、病症和/或疾患的一种或多种确定迹象的受试者的治疗。在一些实施方案中，治疗可为对已被诊断为罹患相关疾病、病症和/或疾患的受试者的治疗。在一些实施方案中，治疗可为对已知具有在统计学上与发展相关疾病、病症或疾患的风险增加相关的一种或多种敏感因素的受试者的治疗。

单位剂量：如本文所用，术语“单位剂量”是指作为单个剂量和/或以药物组合物的物理离散单元的形式施用的量。在许多实施方案中，单位剂量含有预定量的治疗剂。在一些实施方案中，单位剂量含有完整单一剂量的所述剂。在一些实施方案中，施用超过一个单元剂量以实现总单一剂量。在一些实施方案中，实现预期效果需要或预期需要施用多个单元剂量。单位剂量可为例如含有预定量的一种或多种治疗剂的一定体积的液体(例如可接受的载体)、预定量的呈固体形式的一种或多种治疗剂、含有预定量的一种或多种治疗剂的持续释放制剂或药物递送装置等。应了解，单位剂量可存在于包括除一种或多种治疗剂外的多种组分中的任一者的制剂中。举例来说，可包括可接受的载体(例如药学上可接受的载体)、稀释剂、稳定剂、缓冲剂、防腐剂等。本领域技术人员将了解，在许多实施方案中，特定治疗剂的总适当日剂量可包括单位剂量的一部分或多个单位剂量，并且可例如由执业医师在合理医学判断范围内进行决定。在一些实施方案中，用于任何特定受试者或有机体的特定有效剂量水平可取决于多种因素，包括所治疗的病症和病症的严重程度；使用的特定治疗剂的活性；使用的特定组合物；受试者的年龄、体重、总体健康、性别以及饮食；使用的特定治疗剂的施用时间和排泄速率；治疗的持续时间；与使用的一种或多种特定化合物组合或同时使用的药物和/或其他疗法以及医学领域中熟知的类似因素。

附图说明

图1.在经过工程化以表达左聚糖蔗糖酶的细菌(菌株ZB423)的培养物中产生左聚糖的速率(随时间(分钟)推移每分升产生的毫克数)。由葡萄糖释放计算左聚糖并且在分批培养中通过HPAEC和NMR验证(参见图3至图7)。

图2为示出上清液中所分泌的左聚糖蔗糖酶的累积的SDS-PAGE凝胶。泳道1和泳道2分别为来自不编码SacB(PY79)或经过工程化以编码SacB(ZB423)的菌株的细胞球粒溶解产物。泳道6和泳道7分别为来自不编码SacB(PY79)或经过工程化以编码SacB(ZB423)的菌株的细胞培养上清液。泳道3、泳道4以及泳道5为来自不与此研究相关的其他枯草芽孢杆菌菌株的上清液。泳道8含有仅作为对照参考的细胞培养基。泳道9含有条带自下而上对应于10、15、20、25、37、50、75、100、150、250kDa的蛋白质梯形带。ZB423的上清液级分清楚地显示靠近50kDa梯形带标记物的条带，与SacB蛋白52.99kDa的预期尺寸匹配。

图3从ZB423培养物分离的左聚糖的高性能阴离子交换色谱(HPAEC)数据。使ZB423的培养物在含有蔗糖的制备培养基中生长72小时。然后使细胞培养物形成球粒以去除细胞并且将冷乙醇(1:1.5)添加至上清液中。观察到白色沉淀并且通过将溶解于水中并且在冷乙醇中沉淀随后离心收集球粒重复两次来进一步纯化。将球粒在真空下干燥24小时，然后分析。使用相同的HPAEC方法对菊粉的单独行业标准进行分析。未工程化以表达SacB的枯草芽孢杆菌PY79的菌株未从上清液产生沉淀或球粒并且不能分析。A)来自ZB423球粒的10g样品的色谱图显示约50的聚合度(DP)B)用于比较的使用相同HPAEC方法和柱子运行的菊粉标准显示与植物菊粉提取物相符的约14的DP。

图4从ZB423培养物分离的左聚糖的1H-NMR图谱。图谱示出了在4.78ppm下的溶剂峰；在4.18、4.16ppm下的双重峰(积分：1)；在4.09、4.07、4.06ppm下的三重峰(积分：1)，两个峰在3.93、3.91、3.88、3.87ppm下具有无定形分裂(积分：2)，在3.76、3.74ppm下的双重峰；在3.67、3.64ppm下的双重峰；以及在3.55、3.53、3.52ppm下的三重峰。溶剂为D2O。

图5从ZB423培养物分离的左聚糖的13C-NMR图谱。图谱示出了在59.96、104.25、76.35、75.24、80.31、63.42ppm下的峰。

图6从ZB423培养物分离的左聚糖的HSQC-NMR图谱。此图谱显示13C原子与1H NMR峰之间的关联。结果与先前针对来自植物来源的左聚糖所分析相匹配。

图7从ZB423培养物分离的左聚糖的13C-NMR化学位移以及与文献的比较的表格。

图8在用β-半乳糖苷酶LacZ工程化的枯草芽孢杆菌的培养物中在反式半乳糖基化反应期间的乳糖降解。由释放的葡萄糖计算乳糖。在对照样品中使用纯化的乳糖酶来实现完全乳糖降解并且与释放的葡萄糖相互关联确认了葡萄糖累积与乳糖降解之间直接相关。

图9从具有可操作地连接至表达基因座中的hag启动子的mutB(ZS459)或没有mutB(ZS161)的枯草芽孢杆菌PY79的工程化菌株的培养肉汤分离的细胞上清液中的海藻酮糖产量(测试所分泌的酶的活性)。以总蔗糖的减少来计算海藻酮糖。理论极限等于分析期间添加至细胞上清液的蔗糖的量。

图10含有具有可操作地连接至表达基因座中的hag启动子的mutB(ZS459)或没有mutB(ZS161)的枯草芽孢杆菌PY79的工程化菌株的全部细胞肉汤的海藻酮糖产量(测试细胞内和所分泌的酶的组合活性)。以总蔗糖的减少来计算海藻酮糖。理论极限等于分析期间添加至细胞上清液的蔗糖的量。

具体实施方式

代谢和营养是一个复杂的领域，其中已经确定了许多挑战。肠道(例如人肠道)和肠道微生物组(例如人肠道微生物组)的功能已越来越多地被认识，这在代谢和营养方面提出了新挑战。这些挑战中的某些涉及碳水化合物在人体代谢和营养中的作用。举例来说，肠道和/或肠道微生物组的一个功能是消化碳水化合物，通常消化成单糖，例如葡萄糖、果糖以及半乳糖。碳水化合物含量高的饮食与例如高血压、心脏病、肥胖症、糖尿病、高血糖等健康问题有关。另一个重要的代谢和营养挑战涉及可溶性纤维。可溶性纤维可改善例如肠道健康，并且改善或降低诸如高血胆固醇、心脏病、肥胖症、糖尿病、高血糖等疾患以及其他健康问题的风险。肠道碳水化合物和肠道可溶性纤维可有益地(例如治疗性地)或有害地影响肠道微生物组的组成(例如肠道微生物组的各种微生物的类型和浓度或量)。

本领域技术人员将了解，现代饮食通常包括浓度和/或量超过营养需求的碳水化合物(例如单糖和/或二糖和/或复合碳水化合物)。过量的单糖和/或二糖在各种情况下可由单糖二糖或复合碳水化合物的消耗引起，所述单糖、二糖或复合碳水化合物中的任何一者和/或全部在许多现代饮食中是常见的。举例来说，根据某些估计，所消耗的蔗糖5％可穿过小肠而不被降解和消化。因此，在含有例如30g蔗糖的典型碳水化合物来源(诸如一罐苏打水)中，多达1.5g的蔗糖可通过胃和小肠到达结肠)。此外，肠中的蔗糖可裂解成葡萄糖和果糖。虽然葡萄糖可通过肠内衬被快速吸收，但果糖吸收较慢，导致果糖在结肠中累积。本说明书认识到，需要可增加某些通常有益的微生物组过程、活性和/或微生物类型；可减少某些通常有害的微生物组过程、活性和/或微生物类型；或者可促进有益的总微生物组组成的剂。本领域技术人员还将了解，没有必要说清楚一种剂的个别效应(例如对肠道微生物组的组成的效应)(例如以鉴定因所述剂递送至肠道而增加或减少的肠道微生物组细菌)来证明和/或了解所述剂对健康和/或肠道微生物组具有有益影响。

本领域技术人员还将了解，现代饮食所包括的纤维(例如可溶性纤维)的浓度和/或量通常低于对人体健康最佳的浓度和/或量。纤维(例如高纤维饮食，例如高可溶性纤维饮食)的消耗有助于维持肠道健康。纤维通常被归类为可溶性纤维和不溶性纤维，可溶性纤维可溶解于水中形成凝胶状物质，不溶性纤维不能溶解于水中。纤维(特别是可溶性纤维)的消耗可帮助维持健康的体重(例如减轻或稳定体重)，和/或降低发展糖尿病、心脏病和/或一些类型的癌症(例如结肠直肠癌和/或其他肠道或肠癌)的风险。纤维(特别是可溶性纤维)的消耗可降低死于心血管疾病和所有癌症的风险，使得和/或允许寿命延长。纤维(特别是可溶性纤维)的消耗可降低你的结肠中发展痔疮和/或小囊袋(憩室病)的风险。纤维(特别是可溶性纤维)的消耗可降低血压和减轻炎症。例如在糖尿病受试者中，纤维(特别是可溶性纤维)的消耗可使葡萄糖吸收至血液中减慢和/或引起血糖水平降低和/或稳定血糖水平(例如降低血糖水平随时间推移的变化)。可溶性纤维可例如通过降低低密度脂蛋白水平来帮助降低血胆固醇(例如总血胆固醇浓度或量)。

肠道碳水化合物和肠道可溶性纤维影响肠道微生物组的组成。肠道微生物组典型地包括数万亿的微生物，所述微生物促进例如代谢、营养以及矿物质吸收；酶、维生素以及氨基酸的合成；以及短链脂肪酸(SCFA)的产生。肠道微生物组的微生物具有影响健康(例如促进幸福或疾病)和/或生理学的巨大潜力。肠道微生物组的微生物可具有代谢活性，所述代谢活性影响宿主有机体的健康，防止宿主有机体受病原体影响，训练宿主有机体的免疫系统，和/或直接或间接影响许多生理功能。肠道微生物组包括多种不同类型的微生物(例如多种不同的细菌门、纲、目、科、属、种和/或株)，其中的每一者可以不同的代谢特征为特征。举例来说，例如在存在碳水化合物的情况下或在存在纤维的情况下，不同类型的微生物可在多种条件中的任一者下表现出增加或减少的生长。此外，某些微生物被认为是有益的，某些微生物被认为是有害的，肠道微生物组的总体组成(例如肠道微生物组中不同微生物的相对量)被认为是健康的重要因素。

碳水化合物消耗和/或肠道碳水化合物(例如单糖和/或二糖的消耗和/或过量)可不利地影响肠道微生物组和/或引起与碳水化合物过量相关的各种疾患。肠道中可溶性纤维不足也会不利地影响肠道微生物组(例如肠道微生物组组成和/或活性)和/或引起与纤维不足相关的各种疾患。可溶性纤维还可促进有益健康的细菌的生长。因此，碳水化合物消耗和/或纤维消耗不足可例如通过增加变形菌的浓度或量、降低拟杆菌的浓度或量和/或使变形菌与拟杆菌的比率增加导致例如大肠的肠道微生物组的微生物组菌株平衡的破坏(失调)。肠道微生物群的失调与肠疾患(例如炎性肠道疾病和肠易激综合征(IBS))和肠外疾患(例如过敏、哮喘、代谢综合征、心血管疾病以及肥胖)的发病机理有关。失调可包括腹胀、痉挛、胀气以及腹泻和/或存在包括腹胀、痉挛、胀气以及腹泻的症状。另外，变形菌和/或拟杆菌门的浓度和/或量和/或其比率可有助于维持免疫稳态和/或肠粘膜中的上皮完整性。拟杆菌属与许多健康益处相关，包括下调肠道中的炎症反应。除了对肠道微生物组的组成和其功能的这些影响之外，已知蔗糖和肠道裂解产物葡萄糖和果糖在使肠道微生物组细菌(诸如拟杆菌)的某些有益健康的功能沉默方面具有直接作用。

因此，本公开识别了有益于健康和/或肠道微生物组的多种独特的肠道条件(例如以一种或多种代谢产物例如相对于参考增加或降低的浓度或量为特征)。这些有益于健康和/或肠道微生物组的目标肠道条件可包括以下中的一者或多者中的任一者：(i)与参考相比，肠道中单糖和/或二糖的浓度或量降低，和/或(ii)与参考相比，肠道纤维(例如肠道可溶性纤维)的浓度或量增加，例如其中参考为同一受试者中较早时间的浓度或量、被鉴定为正常或健康的浓度或量、被鉴定为异常或不健康的浓度或量、代表典型或健康受试者的浓度或量、代表非典型或不健康受试者的浓度或量。本公开还提供了可通过在肠道中(例如在小肠和/或结肠中)通过替代和/或有益方法竞争性摄入单糖和/或二糖(例如蔗糖)和/或通过去除肠道中(例如小肠中)蔗糖降解产生的果糖来实现降低肠道中单糖和/或二糖的浓度或量。本公开还提供了可通过在肠道中合成可溶性纤维来增加肠道纤维(例如肠道可溶性纤维)的浓度或量。本公开还提供了碳水化合物减少和纤维增加的这些目标肠道营养条件对健康和/或肠道微生物组提供协同益处，这至少是因为单糖和/或二糖可抑制微生物组和/或其微生物的有益生长，而可溶性纤维促进微生物组和/或其微生物的正生长，并且在一些情况下单独或另外是因为低碳水化合物和高纤维可一起调节、降低和/或稳定血糖水平。此外，本公开的方法和组合物令人惊讶地并且协同地实现了肠道单糖和/或二糖的浓度或量降低并且纤维的浓度或量增加的目标肠道营养条件。

本公开尤其认识到碳水化合物(诸如单糖和/或二糖，包括但不限于通过消化复合碳水化合物产生的单糖)与可溶性纤维之间的至少两种形式的协同作用：首先，肠道中的可溶性纤维可减慢碳水化合物(例如单糖和/或二糖)的消化，其次两种碳水化合物(例如单糖和/或二糖)和可溶性纤维对肠道微生物群具有深远的影响，本公开包括减少肠道单糖和/或二糖与增加肠道可溶性纤维是独立地以及协同地有益的。本公开提供了诸如工程化细菌的组合物以及其使用方法，所述组合物通过例如通过从包括碳水化合物(例如单糖和/或二糖)的底物酶促合成纤维来降低肠道单糖和/或二糖的浓度和/或量并且增加肠道可溶性纤维。

本公开的各种方法和组合物包括通过将碳水化合物(例如单糖和/或二糖)酶促转化为可溶性纤维来降低肠道中单糖和/或二糖的量和/或浓度并且增加肠道中可溶性纤维的量和/或浓度的工程化细菌，诸如益生菌。执行这些功能的酶促反应包括但不限于寡果糖合酶，所述寡果糖合酶裂解蔗糖并且将果糖隔离至不可被肠道中的人酶消化的不断生长的寡果糖链中。因此，在某些示例性实施方案中，本公开的组合物或方法降解蔗糖并且将果糖合并至纤维分子中。在本公开的某些特定方法和组合物中，工程化细菌对单糖和/或二糖进行加工以产生左聚糖纤维(例如通过将碳水化合物部分合并至可溶性纤维分子中)。

减少碳水化合物并且合成纤维

本公开的降低肠道碳水化合物(单糖和/或二糖)的浓度或量并且增加肠道纤维(例如可溶性纤维)的浓度或量的组合物和方法包括将碳水化合物转化为纤维的酶，并且还包括编码和/或表达将碳水化合物转化为纤维的酶的工程化细菌。本公开包括本发明人认识到某些植物和细菌酶例如通过将碳水化合物部分合并至纤维分子中来参与、催化和/或引起(例如直接)从包括一种或多种碳水化合物的底物合成可溶性难消化纤维分子的反应。某些此类反应典型地发生在非治疗性环境和/或不在受试者内的环境中，例如在使用土壤细菌进行食物发酵期间，或在植物在土壤中生长期间。各种细菌和植物利用碳水化合物向纤维的转化来产生能量储存分子、结构分子和/或渗透梯度。就本发明人所知，这些细菌或植物或其细胞在向受试者施用时都不能使受试者所消耗的碳水化合物部分合并至纤维分子中，在治疗有效量下也不能(例如没有治疗有效剂量的这些细菌或植物或其细胞用于在受试者中从消耗的碳水化合物合成纤维分子)。本公开揭示了通过向受试者施用经过工程化以进行此类反应的细菌来将此类反应引入肠道环境中可降低肠道单糖和/或二糖的浓度或量，同时增加肠道可溶性纤维。

转基因

本公开包括编码和/或表达多种从包括碳水化合物的底物合成纤维的示例性酶(纤维合成酶)的工程化核酸(转基因)。例如由微生物(例如供在受控制的发酵背景下使用)中碳水化合物转化为纤维的研究来看，各种纤维合成酶为本领域已知的。举例来说，已在实验室环境和诸如大肠杆菌(E.coli)等系统中针对例如序列和/或纤维产生特征对各种纤维合成酶进行了表征。

在各种实施方案中，本公开的纤维合成酶利用选自UDP-葡萄糖、UDP-半乳糖、UDP-岩藻糖、ADP-α-D-葡萄糖、UDP-半乳糖醛酸、UDP-N-乙酰基-α-D-葡糖胺、肌醇半乳糖苷、乳糖、葡萄糖以及蔗糖中的一者或多者的碳水化合物底物，并且/或者其中在肠道中量或浓度降低的碳水化合物选自作为合成纤维时的底物的葡萄糖、半乳糖、蔗糖、果糖和/或乳糖，所述纤维包括葡萄糖、果糖、半乳糖醛酸、N-乙酰基-D-葡糖胺和/或半乳糖单体，例如其中合成的纤维包括昆布二糖、愈创葡聚糖、凝胶多糖、燕麦β-葡聚糖、昆布多糖、pleuran、香菇多糖、酵母β-葡聚糖、海藻酮糖、菊粉、蔗果三糖、蔗果三糖、左聚糖、棉子糖、水苏糖和/或毛蕊花糖中的一者或多者。在各种实施方案中，本公开的纤维合成酶利用UDP-葡萄糖作为底物来合成包括葡萄糖单体的纤维，其中合成的纤维为或包括昆布二糖、愈创葡聚糖、凝胶多糖、燕麦β-葡聚糖、昆布多糖、pleuran、香菇多糖、酵母β葡聚糖和/或海藻糖中的一者或多者。在各种实施方案中，本公开的纤维合成酶利用蔗糖作为底物来合成包括果糖单体的纤维，例如其中合成的纤维为或包括菊粉、蔗果三糖、蔗果三糖和/或左聚糖。在各种实施方案中，本公开的纤维合成酶利用蔗糖和UDP-半乳糖作为底物来合成包括半乳糖单体的纤维，例如其中合成的纤维为或包括棉子糖、水苏糖和/或毛蕊花糖。

纤维合成酶的代表性实例包括1,3-β-葡聚糖合酶(例如1,3-β-葡聚糖合酶组分FKS1或愈创葡聚糖合酶1)、1,3；1,4-β-D-葡聚糖合酶(例如可能混合键联的葡聚糖合酶6)、1,6-β-葡聚糖合酶(例如细胞壁合成蛋白KRE9)蔗糖异构酶、左聚糖蔗糖酶或1,6-α-半乳糖基转移酶(例如肌醇半乳糖苷--蔗糖半乳糖基转移酶)。纤维合成酶的代表性实例包括左聚糖蔗糖酶(蔗糖6-果糖基转移酶；β-2,6-果糖基转移酶；β-2,6-果聚糖:D-葡萄糖1-果糖基转移酶；EC 2.4.1.10)；菊粉蔗糖酶(蔗糖:2,1-β-D-果聚糖1-β-D-果糖基转移酶；蔗糖1-果糖基转移酶；EC 2.4.1.9)；果糖基转移酶(2,1-果聚糖:2,1-果聚糖1-果糖基转移酶；1,2-β-D-果聚糖1(F)-果糖基转移酶；1,2-β-D-果聚糖:1,2-β-D-果聚糖1(F)-β-D-果糖基转移酶；1,2-β-果聚糖1(F)-果糖基转移酶；FFT；果聚糖:果聚糖果糖基转移酶，EC 2.4.1.100)；蔗糖果糖基转移酶(SST；蔗糖1(F)-果糖基转移酶；蔗糖-蔗糖1-果糖基转移酶；蔗糖:蔗糖1(F)-β-D-果糖基转移酶；蔗糖:蔗糖1-果糖基转移酶；EC 2.4.1.99)；变聚糖蔗糖酶(EC2.4.1.372)；蔗糖--葡聚糖葡糖基转移酶(EC 2.4.1.4)；蔗糖6-葡糖基转移酶(EC2.4.1.5)；α-(1->2)分枝链蔗糖酶(EC 2.4.1.373)；交替蔗糖酶(蔗糖-1,6(3)-α-葡聚糖6(3)-α-葡糖基转移酶；蔗糖:1,6-、1,3-α-D-葡聚糖3-α-以及6-α-D-葡糖基转移酶；EC2.4.1.140)；蔗糖--1,6-α-葡聚糖3(6)-α-葡糖基转移酶(EC 2.4.1.125)。

在一个实施方案中，用2,1β果糖基转移酶(菊粉蔗糖酶)对益生菌有机体进行工程化，以使得能够在消化道中从消耗的蔗糖合成果寡糖(菊粉、1-蔗果三糖、1-蔗果四糖)。在另一实施方案中，用2,6β果糖基转移酶(左聚糖蔗糖酶)对益生菌有机体进行工程化，以使得能够在消化道中从消耗的蔗糖合成果寡糖(左聚糖、6-蔗果三糖、6-蔗果四糖)。在另一实施方案中，用对乳糖具特异性的半乳糖基转移酶(诸如β(1→4)半乳糖基转移酶)对益生菌有机体进行工程化，以使得能够在消化道中从消耗的乳糖合成乳糖末端半乳寡糖(人乳寡糖、半乳寡糖)。在另一实施方案中，用对肌醇半乳糖苷具特异性的半乳糖基转移酶(诸如(α1→6)半乳糖基转移酶)对益生菌有机体进行工程化，以使得能够在消化道中从消耗的蔗糖和葡萄糖合成蔗糖末端半乳寡糖(棉子糖、水苏糖、毛蕊花糖)，任选使用肌醇半乳糖苷合酶、半乳糖异构酶以及膜转运体来增加前体并且改善合成速率。在另一实施方案中，用β(1→3)葡聚糖合酶(1,3-β-葡聚糖合酶)对益生菌有机体进行工程化，以使得能够在消化道中从消耗的葡萄糖或由消耗的蔗糖产生的葡萄糖合成β-葡聚糖(昆布二糖、愈创葡聚糖、凝胶多糖、燕麦β-葡聚糖)，任选包括果糖异构酶以使得能够从消耗的果糖进行合成，任选包括1,4-β-葡糖基转移酶以使得能够以改善的益菌生质量在消化道中从消耗的蔗糖和葡萄糖合成交联聚合物。在另一实施方案中，将用β(1→3)葡聚糖合酶(1,3-β-葡聚糖合酶)工程化的益生菌有机体用β(1→6)葡聚糖合酶(1,6-β-葡聚糖合酶)进一步工程化，以在消化道中从消耗的蔗糖和葡萄糖形成罕见的交联的益菌生纤维(昆布多糖/Pleuran/香菇多糖/酵母β葡聚糖)。在另一实施方案中，用α(1→1)蔗糖异构酶(海藻酮糖合酶)对益生菌有机体进行工程化，以使得能够在消化道中从消耗的葡萄糖和果糖合成罕见的益菌生二糖(海藻酮糖)。在另一实施方案中，用果胶生物合成路径对益生菌有机体进行工程化，以使得能够在消化道中从消耗的葡萄糖和蔗糖合成果胶和果胶样聚合物。

下表中还提供了纤维合成酶的代表性实例：

表1.示例性纤维合成酶

/>

在一些实施方案中，FKS1纤维合成酶具有根据SEQ ID NO:1(UniProt登录号P38631)的氨基酸序列。在各种实施方案中，纤维合成酶与SEQ ID NO:1具有至少80％同一性，例如与SEQ ID NO:1具有至少80％、85％、90％、95％、96％、97％、98％、99％或100％同一性。本公开还包括编码FKS1纤维合成酶的核酸序列。在某些实施方案中，编码FKS1纤维合成酶的核酸序列为经过工程化以在枯草芽孢杆菌中表达的序列，例如与SEQ ID NO:2具有至少80％同一性，例如与SEQ ID NO:2具有至少80％、85％、90％、95％、96％、97％、98％、99％或100％同一性的核酸序列。

在一些实施方案中，CALS1纤维合成酶具有根据SEQ ID NO:3(UniProt登录号Q9AUE0)的氨基酸序列。在各种实施方案中，纤维合成酶与SEQ ID NO:3具有至少80％同一性，例如与SEQ ID NO:3具有至少80％、85％、90％、95％、96％、97％、98％、99％或100％同一性。本公开还包括编码CALS1纤维合成酶的核酸序列。在某些实施方案中，编码CALS1纤维合成酶的核酸序列为经过工程化以在枯草芽孢杆菌中表达的序列，例如与SEQ ID NO:4具有至少80％同一性，例如与SEQ ID NO:4具有至少80％、85％、90％、95％、96％、97％、98％、99％或100％同一性的核酸序列。

在一些实施方案中，CSLF6纤维合成酶具有根据SEQ ID NO:5(UniProt登录号Q84UP7)的氨基酸序列。在各种实施方案中，纤维合成酶与SEQ ID NO:5具有至少80％同一性，例如与SEQ ID NO:5具有至少80％、85％、90％、95％、96％、97％、98％、99％或100％同一性。本公开还包括编码CSLF6纤维合成酶的核酸序列。在某些实施方案中，编码CSLF6纤维合成酶的核酸序列为经过工程化以在枯草芽孢杆菌中表达的序列，例如与SEQ ID NO:6具有至少80％同一性，例如与SEQ ID NO:6具有至少80％、85％、90％、95％、96％、97％、98％、99％或100％同一性的核酸序列。

在一些实施方案中，KRE9纤维合成酶具有根据SEQ ID NO:7(UniProt登录号P39005)的氨基酸序列。在各种实施方案中，纤维合成酶与SEQ ID NO:7具有至少80％同一性，例如与SEQ ID NO:7具有至少80％、85％、90％、95％、96％、97％、98％、99％或100％同一性。本公开还包括编码KRE9纤维合成酶的核酸序列。在某些实施方案中，编码KRE9纤维合成酶的核酸序列为经过工程化以在枯草芽孢杆菌中表达的序列，例如与SEQ ID NO:8具有至少80％同一性，例如与SEQ ID NO:8具有至少80％、85％、90％、95％、96％、97％、98％、99％或100％同一性的核酸序列。

在一些实施方案中，MutB纤维合成酶具有根据SEQ ID NO:9(UniProt登录号Q2PS28)的氨基酸序列。在各种实施方案中，纤维合成酶与SEQ ID NO:9具有至少80％同一性，例如与SEQ ID NO:9具有至少80％、85％、90％、95％、96％、97％、98％、99％或100％同一性。本公开还包括编码MutB纤维合成酶的核酸序列。在某些实施方案中，编码MutB纤维合成酶的核酸序列为经过工程化以在枯草芽孢杆菌中表达的序列，例如与SEQ ID NO:10具有至少80％同一性，例如与SEQ ID NO:10具有至少80％、85％、90％、95％、96％、97％、98％、99％或100％同一性的核酸序列。

在一些实施方案中，otsA纤维合成酶具有根据SEQ ID NO:33(UniProt登录号P31677)的氨基酸序列。在各种实施方案中，纤维合成酶与SEQ ID NO:33具有至少80％同一性，例如与SEQ ID NO:33具有至少80％、85％、90％、95％、96％、97％、98％、99％或100％同一性。本公开还包括编码MutB纤维合成酶的核酸序列。在某些实施方案中，编码MutB纤维合成酶的核酸序列为经过工程化以在枯草芽孢杆菌中表达的序列，例如与SEQ ID NO:34具有至少80％同一性，例如与SEQ ID NO:34具有至少80％、85％、90％、95％、96％、97％、98％、99％或100％同一性的核酸序列。

在一些实施方案中，InuJ纤维合成酶具有根据SEQ ID NO:11(UniProt登录号Q74K42)的氨基酸序列。在各种实施方案中，纤维合成酶与SEQ ID NO:11具有至少80％同一性，例如与SEQ ID NO:11具有至少80％、85％、90％、95％、96％、97％、98％、99％或100％同一性。本公开还包括编码InuJ纤维合成酶的核酸序列。在某些实施方案中，编码InuJ纤维合成酶的核酸序列为经过工程化以在枯草芽孢杆菌中表达的序列，例如与SEQ ID NO:12具有至少80％同一性，例如与SEQ ID NO:12具有至少80％、85％、90％、95％、96％、97％、98％、99％或100％同一性的核酸序列。

在一些实施方案中，RFS纤维合成酶具有根据SEQ ID NO:13(UniProt登录号Q5VQG4)的氨基酸序列。在各种实施方案中，纤维合成酶与SEQ ID NO:13具有至少80％同一性，例如与SEQ ID NO:13具有至少80％、85％、90％、95％、96％、97％、98％、99％或100％同一性。本公开还包括编码RFS纤维合成酶的核酸序列。在某些实施方案中，编码RFS纤维合成酶的核酸序列为经过工程化以在枯草芽孢杆菌中表达的序列，例如与SEQ ID NO:14具有至少80％同一性，例如与SEQ ID NO:14具有至少80％、85％、90％、95％、96％、97％、98％、99％或100％同一性的核酸序列。

在一些实施方案中，IgtC纤维合成酶具有根据SEQ ID NO:35(UniProt登录号Q8KHJ3)的氨基酸序列。在各种实施方案中，纤维合成酶与SEQ ID NO:35具有至少80％同一性，例如与SEQ ID NO:35具有至少80％、85％、90％、95％、96％、97％、98％、99％或100％同一性。本公开还包括编码IgtC纤维合成酶的核酸序列。在某些实施方案中，编码IgtC纤维合成酶的核酸序列为经过工程化以在枯草芽孢杆菌中表达的序列，例如与SEQ ID NO:36具有至少80％同一性，例如与SEQ ID NO:36具有至少80％、85％、90％、95％、96％、97％、98％、99％或100％同一性的核酸序列。

在一些实施方案中，tll0994纤维合成酶具有根据SEQ ID NO:37(UniProt登录号Q8DK72)的氨基酸序列。在各种实施方案中，纤维合成酶与SEQ ID NO:37具有至少80％同一性，例如与SEQ ID NO:37具有至少80％、85％、90％、95％、96％、97％、98％、99％或100％同一性。本公开还包括编码tll0994纤维合成酶的核酸序列。在某些实施方案中，编码tll0994纤维合成酶的核酸序列为经过工程化以在枯草芽孢杆菌中表达的序列，例如与SEQ ID NO:38具有至少80％同一性，例如与SEQ ID NO:38具有至少80％、85％、90％、95％、96％、97％、98％、99％或100％同一性的核酸序列。

在一些实施方案中，BgaB纤维合成酶具有根据SEQ ID NO:39(UniProt登录号P19668)的氨基酸序列。在各种实施方案中，纤维合成酶与SEQ ID NO:39具有至少80％同一性，例如与SEQ ID NO:39具有至少80％、85％、90％、95％、96％、97％、98％、99％或100％同一性。本公开还包括编码BgaB纤维合成酶的核酸序列。在某些实施方案中，编码BgaB纤维合成酶的核酸序列为经过工程化以在枯草芽孢杆菌中表达的序列，例如与SEQ ID NO:40具有至少80％同一性，例如与SEQ ID NO:40具有至少80％、85％、90％、95％、96％、97％、98％、99％或100％同一性的核酸序列。

在一些实施方案中，Bga纤维合成酶具有根据SEQ ID NO:41(UniProt登录号E5RWQ2)的氨基酸序列。在各种实施方案中，纤维合成酶与SEQ ID NO:41具有至少80％同一性，例如与SEQ ID NO:41具有至少80％、85％、90％、95％、96％、97％、98％、99％或100％同一性。本公开还包括编码Bga纤维合成酶的核酸序列。在某些实施方案中，编码Bga纤维合成酶的核酸序列为经过工程化以在枯草芽孢杆菌中表达的序列，例如与SEQ ID NO:42具有至少80％同一性，例如与SEQ ID NO:42具有至少80％、85％、90％、95％、96％、97％、98％、99％或100％同一性的核酸序列。

在一些实施方案中，ScsAB纤维合成酶具有根据SEQ ID NO:43(UniProt登录号P0CW87)的氨基酸序列。在各种实施方案中，纤维合成酶与SEQ ID NO:43具有至少80％同一性，例如与SEQ ID NO:43具有至少80％、85％、90％、95％、96％、97％、98％、99％或100％同一性。本公开还包括编码ScsAB纤维合成酶的核酸序列。在某些实施方案中，编码ScsAB纤维合成酶的核酸序列为经过工程化以在枯草芽孢杆菌中表达的序列，例如与SEQ ID NO:44具有至少80％同一性，例如与SEQ ID NO:44具有至少80％、85％、90％、95％、96％、97％、98％、99％或100％同一性的核酸序列。

在一些实施方案中，Ss1纤维合成酶具有根据SEQ ID NO:45(UniProt登录号O49064)的氨基酸序列。在各种实施方案中，纤维合成酶与SEQ ID NO:45具有至少80％同一性，例如与SEQ ID NO:45具有至少80％、85％、90％、95％、96％、97％、98％、99％或100％同一性。本公开还包括编码Ss1纤维合成酶的核酸序列。在某些实施方案中，编码Ss1纤维合成酶的核酸序列为经过工程化以在枯草芽孢杆菌中表达的序列，例如与SEQ ID NO:46具有至少80％同一性，例如与SEQ ID NO:46具有至少80％、85％、90％、95％、96％、97％、98％、99％或100％同一性的核酸序列。

在一些实施方案中，SBE3纤维合成酶具有根据SEQ ID NO:47(UniProt登录号D2WL32)的氨基酸序列。在各种实施方案中，纤维合成酶与SEQ ID NO:47具有至少80％同一性，例如与SEQ ID NO:47具有至少80％、85％、90％、95％、96％、97％、98％、99％或100％同一性。本公开还包括编码SBE3纤维合成酶的核酸序列。在某些实施方案中，编码SBE3纤维合成酶的核酸序列为经过工程化以在枯草芽孢杆菌中表达的序列，例如与SEQ ID NO:48具有至少80％同一性，例如与SEQ ID NO:48具有至少80％、85％、90％、95％、96％、97％、98％、99％或100％同一性的核酸序列。

在一些实施方案中，HlgA纤维合成酶具有根据SEQ ID NO:49(UniProt登录号P39125)的氨基酸序列。在各种实施方案中，纤维合成酶与SEQ ID NO:49具有至少80％同一性，例如与SEQ ID NO:49具有至少80％、85％、90％、95％、96％、97％、98％、99％或100％同一性。本公开还包括编码HlgA纤维合成酶的核酸序列。在某些实施方案中，编码HlgA纤维合成酶的核酸序列为经过工程化以在枯草芽孢杆菌中表达的序列，例如与SEQ ID NO:50具有至少80％同一性，例如与SEQ ID NO:50具有至少80％、85％、90％、95％、96％、97％、98％、99％或100％同一性的核酸序列。

在一些实施方案中，GAUT1纤维合成酶具有根据SEQ ID NO:51(UniProt登录号Q9LE59)的氨基酸序列。在各种实施方案中，纤维合成酶与SEQ ID NO:51具有至少80％同一性，例如与SEQ ID NO:51具有至少80％、85％、90％、95％、96％、97％、98％、99％或100％同一性。本公开还包括编码GAUT1纤维合成酶的核酸序列。在某些实施方案中，编码GAUT1纤维合成酶的核酸序列为经过工程化以在枯草芽孢杆菌中表达的序列，例如与SEQ ID NO:52具有至少80％同一性，例如与SEQ ID NO:52具有至少80％、85％、90％、95％、96％、97％、98％、99％或100％同一性的核酸序列。

在一些实施方案中，NodC纤维合成酶具有根据SEQ ID NO:53(UniProt登录号Q07755)的氨基酸序列。在各种实施方案中，纤维合成酶与SEQ ID NO:53具有至少80％同一性，例如与SEQ ID NO:53具有至少80％、85％、90％、95％、96％、97％、98％、99％或100％同一性。本公开还包括编码NodC纤维合成酶的核酸序列。在某些实施方案中，编码NodC纤维合成酶的核酸序列为经过工程化以在枯草芽孢杆菌中表达的序列，例如与SEQ ID NO:54具有至少80％同一性，例如与SEQ ID NO:54具有至少80％、85％、90％、95％、96％、97％、98％、99％或100％同一性的核酸序列。

在一些实施方案中，左聚糖蔗糖酶纤维合成酶具有根据SEQ ID NO:15(UniProt登录号Q43998)的氨基酸序列，这是一种由重氮营养醋杆菌(Acetobacter diazotrophicus)表达的左聚糖蔗糖酶和/或由重氮营养醋杆菌lsdA编码的左聚糖蔗糖酶。在各种实施方案中，纤维合成酶与SEQ ID NO:15具有至少80％同一性，例如与SEQ ID NO:15具有至少80％、85％、90％、95％、96％、97％、98％、99％或100％同一性。

在一些实施方案中，左聚糖蔗糖酶纤维合成酶具有根据SEQ ID NO:16(UniProt登录号P0DJA3)的氨基酸序列，这是一种由运动发酵单胞菌运动亚种(Zymomonas mobilissubsp.Mobilis)表达的左聚糖蔗糖酶和/或由运动发酵单胞菌运动亚种SacB编码的左聚糖蔗糖酶。在各种实施方案中，纤维合成酶与SEQ ID NO:16具有至少80％同一性，例如与SEQID NO:16具有至少80％、85％、90％、95％、96％、97％、98％、99％或100％同一性。

在一些实施方案中，左聚糖蔗糖酶纤维合成酶具有根据SEQ ID NO:17(UniProt登录号Q97I81)的氨基酸序列，这是一种由丙酮丁醇梭菌(Clostridium acetobutylicum)表达的左聚糖蔗糖酶和/或由丙酮丁醇梭菌SacB编码的左聚糖蔗糖酶。在各种实施方案中，纤维合成酶与SEQ ID NO:17具有至少80％同一性，例如与SEQ ID NO:17具有至少80％、85％、90％、95％、96％、97％、98％、99％或100％同一性。

在一些实施方案中，左聚糖蔗糖酶纤维合成酶具有根据SEQ ID NO:18(UniProt登录号P05655)的氨基酸序列，这是一种由纳豆枯草芽孢杆菌(Bacillus Subtilis natto)或枯草芽孢杆菌PY79表达的左聚糖蔗糖酶和/或由纳豆枯草芽孢杆菌SacB和/或枯草芽孢杆菌PY79 SacB编码的左聚糖蔗糖酶。在各种实施方案中，纤维合成酶与SEQ ID NO:18具有至少80％同一性，例如与SEQ ID NO:18具有至少80％、85％、90％、95％、96％、97％、98％、99％或100％同一性。

本公开还包括编码左聚糖蔗糖酶纤维合成酶的核酸序列。在某些实施方案中，编码左聚糖蔗糖酶纤维合成酶的核酸序列为经过工程化以在枯草芽孢杆菌中表达的序列，例如与SEQ ID NO:19具有至少80％同一性，例如与SEQ ID NO:19具有至少80％、85％、90％、95％、96％、97％、98％、99％或100％同一性的核酸序列。本领域技术人员将了解，当具备如本文所公开的酶底物时，本公开的纤维合成酶有效产生纤维。因此，至少因为如本领域技术人员将了解，许多细菌能够将单糖和/或二糖加工成修饰形式、组成性单糖和/或其他底物碳水化合物，所以本领域技术人员将了解，在肠道中多种碳水化合物来源可能减少，并且直接或间接地被酶或被本公开的表达此类纤维合成酶的细胞消耗。一般来说，应了解，可对例如葡萄糖、蔗糖或果糖中的任一者进行修饰和/或加工，以提供酶底物碳水化合物，以便产生如本文所公开的多种纤维中的任一者，包括由如本文所公开的特定酶产生的特定纤维。因此，在某些实施方案中，本公开的纤维合成酶可直接利用肠道碳水化合物并且在某些实施方案中可利用经过修饰和/或加工的形式。

在一些实施方案中，由本公开的组合物或方法产生的纤维为可溶性左聚糖纤维。左聚糖为存在于某些植物和微生物物种中的天然存在的果聚糖。诸如左聚糖等罕见的纤维通过刺激各种有益类型的肠道微生物组组成微生物(诸如双歧杆菌、罗氏菌(Roseburia)和/或直肠真杆菌(Eubacterium rectale))的生长和/或增加其浓度和/或量可促成健康的和/或健康平衡的微生物组或微生物组组成。至少由于这些原因，增加左聚糖可增加有益分子(诸如丁酸盐和丙酸盐)的浓度或量。诸如左聚糖等果聚糖可从蔗糖合成。已知当在大豆上培养枯草芽孢杆菌纳豆亚种(Bacillus subtilis sp.Natto)(纳豆枯草芽孢杆菌(B.s.Natto))时大量产生左聚糖，并且可使用纳豆枯草芽孢杆菌制作食物‘纳豆’(菌株由此命名)。纳豆枯草芽孢杆菌可能来源于土壤并且不是人肠道的共生体。

左聚糖纤维聚合物由以2,6β糖苷键缀合的单糖果糖组成。在本公开的一些实施方案中，通过利用由酶促消化蔗糖(蔗糖包括两个单糖部分：一个葡萄糖和一个果糖)所释放的果糖分子的方法和/或酶来酶促合成左聚糖纤维。在一些实施方案中，本公开包括从蔗糖合成左聚糖的左聚糖蔗糖酶。在各种实施方案中，左聚糖蔗糖酶可将蔗糖裂解为组成性单糖部分并且将果糖单糖部分合并至左聚糖中。因此，不希望受理论束缚，左聚糖蔗糖酶可将50％的碳水化合物生物质和/或单糖部分和/或100％的由左聚糖蔗糖酶裂解蔗糖产生的果糖生物质和/或果糖部分转化成可溶性纤维。

在各种实施方案中，本公开的纤维合成酶可在5.7至8.5的pH值范围内或跨所述pH值范围(例如在以pH值在所述范围内为特征的环境中)从包括碳水化合物(例如单糖和/或二糖)的底物合成纤维。在某些实施方案中，本公开的纤维合成酶可在pH 5.7、pH 6.0、pH7.4和/或pH 8.5下合成纤维。在某些实施方案中，本公开的纤维合成酶可在5.7至6.0、6.0至7.4和/或7.4至8.5的pH值范围内或跨所述pH值范围，或在下界选自约5.5、5.6、5.7、5.8、5.9、6.0、6.1、6.2、6.3、6.4、6.5、6.6、6.7、6.8、6.9以及7.0并且上界选自约6.0、6.1、6.2、6.3、6.4、6.5、6.6、6.7、6.8、6.9、7.0、7.1、7.2、7.3、7.4、7.5、7.6、7.7、7.8、7.9、8.0、8.1、8.2、8.3、8.4或8.5的范围内或跨所述范围合成纤维。不希望受任何特定科学理论的束缚，人胃肠道pH值典型地在小肠中从约pH 6逐渐增加至末端回肠中的约pH 7.4，在盲肠中下降至约5.7，并且穿过结肠再次逐渐增加，在直肠中达到约pH 6.7。本领域技术人员将了解，可使用各种已确定的技术来改变多肽pH值和/或肽酶抗性。在各种实施方案中，本公开的纤维合成酶被隔离和/或保护在纤维基质内，所述纤维基质防止较大的肽酶参与酶的降解(同时仍允许用于纤维合成的剂(例如碳水化合物，例如蔗糖)与酶接触)。本领域技术人员还将了解，编码本公开的纤维合成酶的编码序列可经过修饰以反映表达所述酶的细胞的密码子使用。

在各种实施方案中，本公开的多肽(例如酶，例如左聚糖蔗糖酶)与分泌多肽可操作地连接。分泌多肽的鉴定在本领域中是常见的，例如通过合成包括所关注的信号传导多肽的融合多肽并且针对从示例性细胞分泌对融合多肽进行筛选。示例性信号序列可包括但不限于表2中提供的那些信号序列。

表2：分泌多肽

名称	氨基酸序列
		sacB	MNIKKFAKQATVLTFTTALLAGGATQAFA(SEQ ID NO:55)
yvcE	MRKSLITLGLASVIGTSSFLIPFTSKTASA(SEQ ID NO:56)
		yoqM	MKLRKVLTGSVLSLGLLVSASPAFA(SEQ ID NO:57)
yuaB	MKRKLLSSLAISALSLGLLVSAPTASFAAE(SEQ ID NO:58)
		pel	MKKVMLATALFLGLTPAGANA(SEQ ID NO:59)
pelB	MKRLCLWFTVFSLFLVLLPGKALG(SEQ ID NO:60)
		yoaW	MKKMLMLAFTFLLALTIHVGEASA(SEQ ID NO:61)
yqxI	MFKKLLLATSALTFSLSLVLPLDGHAKA(SEQ ID NO:62)
		lipA	MKFVKRRIIALVTILMLSVTSLFALQPSAKAA(SEQ ID NO:63)
lipB	MKKVLMAFIICLSLILSVLAAPPSGAKA(SEQ ID NO:64)
		yoqH	MKRFILVLSFLSIIVAYPIQTNA(SEQ ID NO:65)
ybfO	MKRMIVRMTLPLLIVCLAFSSFSASARA(SEQ ID NO:66)
		sacB	MNIKKFAKQTVLTFTTALLAGGATQAFA(SEQ ID NO:67)
bglS	MPYLKRVLLLLVTGLFMSLFAVTATASA(SEQ ID NO:68)
		yddT	MRKKRVITCVMAASLTLGSLLPAGYASA(SEQ ID NO:69)
yobB	MKIRKILLSSALSFGMLISAVPALA(SEQ ID NO:70)

本领域技术人员还将了解，其他信号序列存在于枯草芽孢杆菌基因组中，并且可包括在本公开的转基因和酶中。在枯草芽孢杆菌中的三种已知分泌途径中，Sec路径引导大部分的分泌蛋白进入生长培养基。或者，经由Tat路径或ABC分泌少量具有特定功能的外蛋白(exoprotein)。通过Sec途径输出可通过将疏水性分泌多肽在分泌的多肽的N端纳入多肽中来实现，所述分泌的多肽的长度可为约20个氨基酸，并且在一些实例中可包括3个区域：带正电荷的氨基端、疏水核心以及极性羧基端。可使用商业试剂盒(Takara Bio)不费力地测试173种不同的分泌多肽。在本文所提供的某些实施例中，融合多肽包括与来源于天然与SacB相关的序列的分泌多肽可操作地连接的左聚糖蔗糖酶。

经过工程化以包括分泌多肽(本领域也称为分泌信号)的纤维合成酶的表达可引起酶的分泌(例如从包括编码纤维合成酶的转基因的细胞分泌，例如进入施用细胞的受试者的肠道)。本公开包括认识到，在各种实施方案中，相对于施用的本公开的工程化细胞，在肠道中从碳水化合物合成纤维可有利地发生在细胞外。举例来说，通过由本公开的工程化细胞递送至肠道的纤维合成酶进行的纤维的细胞外合成可消除将蔗糖穿过细胞膜输入工程化细胞的胞质液中的需要，从而产生比通过酶的细胞内表达将实现的酶活性更高的酶活性，并且因此更快和/或更多地消耗糖和/或合成纤维。此外，由于相对更高的蔗糖浓度可使得产生相对更高分子量的纤维分子，在碳水化合物浓度最大的肠道中合成纤维可使平均纤维分子量增加。

本领域已知用于选择分泌多肽来与多肽或编码多肽的核酸序列配对(例如融合或以其他方式可操作地连接)的多种方法。举例来说，可使用各种商业试剂盒(诸如来自Takara Bio(3380-枯草芽孢杆菌分泌蛋白表达系统)的商业试剂盒)快速筛选分泌多肽。本领域技术人员还将了解，可使用实验室方法选择或演化出(例如通过随机演化)包括本公开的纤维合成酶和分泌多肽的融合多肽的变体，其中所述变体与参考融合多肽(例如选择或演化之前的融合多肽)相比可具有增加的稳定性和/或表达。在各种实施方案中，本公开的分泌多肽可基于表达工程化多肽(例如融合多肽)的细胞类型来选择。

在各种实施方案中，本公开的纤维合成酶不为分泌的。因此，在一些实施方案中，针对分泌对纤维合成酶进行工程化，使得所述酶直接作用于存在于肠道中的底物，并且在一些实施方案中，对纤维合成酶进行工程化，使得它不为分泌的并且作用于由表达纤维合成酶的细胞内化的底物。示例性分泌型酶可包括蔗糖异构酶、海藻酮糖合酶、菊粉蔗糖酶、左聚糖蔗糖酶、β-半乳糖苷酶或b-D-半乳糖苷酶。因此，某些此类分泌型纤维合成酶可利用存在于肠道中的底物并且降低肠道中所述底物(例如用于蔗糖异构酶、海藻酮糖合酶、菊粉蔗糖酶或左聚糖蔗糖酶的底物蔗糖，或β-半乳糖苷酶或B-D-半乳糖苷酶的底物乳糖)的浓度或量。在各种实施方案中不为分泌的并且在本公开的细胞处或细胞中合成纤维(例如通过胞质或膜活性)的示例性纤维合成酶可包括1,3-β-葡聚糖合酶、1,3；1,4-β-D-葡聚糖合酶、1,3-β-葡聚糖合酶、1,6-β-葡聚糖合酶、海藻糖-6-磷酸合酶、1,6-α-半乳糖基转移酶、α-1,4-半乳糖基转移酶、α-1,2-岩藻糖基转移酶、纤维素合酶、麦芽糖合酶、淀粉合酶、淀粉分支酶、糖原合酶、半乳糖醛酸基转移酶或几丁质寡糖合酶。因此，存在于本公开的细胞的胞质液或膜中的各种非分泌型纤维合成酶可作用于由细胞内化的底物，并且任选地在用作用酶进行纤维合成时的底物之前被细胞改变。诸如1,3-β-葡聚糖合酶、1,3；1,4-β-D-葡聚糖合酶、1,3-β-葡聚糖合酶、1,6-β-葡聚糖合酶、海藻糖-6-磷酸合酶、纤维素合酶、麦芽糖合酶、淀粉合酶以及淀粉分支酶等纤维合成酶可使用UDP-葡萄糖作为底物，其中酶的活性使肠道中葡萄糖、蔗糖和/或果糖的量或浓度降低，因为由细胞吸收的葡萄糖、蔗糖和/或果糖碳水化合物天然地转化为UDP-葡萄糖，UDP-葡萄糖为纤维合成酶提供底物。诸如糖原合酶等纤维合成酶可利用ADP-α-D-葡萄糖作为底物，其中酶的活性使肠道中葡萄糖、蔗糖和/或果糖的量或浓度降低，因为由细胞吸收的葡萄糖、蔗糖和/或果糖碳水化合物天然地转化为ADP-α-D-葡萄糖，ADP-α-D-葡萄糖为纤维合成酶提供底物。诸如α-1,4-半乳糖基转移酶等纤维合成酶可利用UDP-半乳糖作为底物，其中酶的活性使肠道中乳糖的量或浓度降低，因为由细胞吸收的乳糖碳水化合物天然地转化为UDP-半乳糖，UDP-半乳糖为纤维合成酶提供底物。诸如α-1,2-岩藻糖基转移酶等纤维合成酶可利用UDP-半乳糖和/或UDP-岩藻糖作为底物，其中酶的活性使肠道中乳糖的量或浓度降低，因为由细胞吸收的乳糖碳水化合物天然地转化为利用UDP-半乳糖和/或UDP-岩藻糖，UDP-半乳糖和/或UDP-岩藻糖为纤维合成酶提供底物。诸如1,6-α-半乳糖基转移酶等纤维合成酶可利用乳糖和/或肌醇半乳糖苷作为底物，其中酶的活性使肠道中乳糖的量或浓度降低，因为由细胞吸收的乳糖碳水化合物天然地转化为乳糖和/或肌醇半乳糖苷，乳糖和/或肌醇半乳糖苷为纤维合成酶提供底物。诸如半乳糖醛酸基转移酶等纤维合成酶可利用各种分子作为底物，其中酶的活性使肠道中葡萄糖、蔗糖和/或果糖的量或浓度降低，因为由细胞吸收的葡萄糖、蔗糖和/或果糖碳水化合物天然地转化为纤维合成酶的底物。诸如几丁质寡糖合酶等纤维合成酶可利用UDP-N-乙酰基-α-D-葡糖胺作为底物，其中酶的活性使肠道中葡萄糖、蔗糖和/或果糖的量或浓度降低，因为由细胞吸收的葡萄糖、蔗糖和/或果糖碳水化合物天然地转化为UDP-N-乙酰基-α-D-葡糖胺，UDP-N-乙酰基-α-D-葡糖胺为纤维合成酶提供底物。

本公开总体上尤其包括向受试者施用工程化细胞的创新，所述工程化细胞编码和/或表达本公开的纤维合成酶。本领域技术人员还将了解，在各种实施方案中，编码本公开的纤维合成酶的核酸序列可与控制酶在细胞中的表达的调控核酸序列可操作地连接。此外，如本领域技术人员将了解，用于可操作地连接至编码序列和/或用于表达所编码的多肽的多种调控核酸序列为本领域已知的。

在一些实施方案中，调控核酸可为组成型启动子和/或引起由可操作地连接的编码序列编码的多肽例如在细菌中(例如在枯草芽孢杆菌中)的组成性表达。在一些实施方案中，调控核酸可为条件性启动子和/或引起由可操作地连接的编码序列编码的多肽例如在细菌中(例如在枯草芽孢杆菌中)的条件性表达。在各种实施方案中，细菌调控核酸序列可为选自以下的启动子：T7、T7lac、Sp6、araBAD、trp、lac、Ptac或pL。在一些实施方案中，调控核酸序列可为例如如Guiziou(2016Nucl.Acids Res.44(15):7495-7508)中所阐述的选自Pveg、PserA、PymdA、PfbaA、Pzwf、PfoleA、Ppgi、PlepA或PrelA的枯草芽孢杆菌启动子，所述参考文献关于枯草芽孢杆菌启动子并且以全文引用的方式并入本文中。

在各种实施方案中，示例性调控核酸可以是基于与例如鞭毛结构的表达相关的一个或多个调控核酸序列。此类调控核酸序列先前已被改造用于由可操作地连接的编码核酸序列编码的多肽的组成性和/或稳健性表达。各种细菌(例如枯草芽孢杆菌)通过包括阳性和阴性对照的调控系统调控鞭毛蛋白基因座(在一些系统中称为hag)的表达。可利用去除和/或减少鞭毛蛋白基因座表达的负向调控和/或添加或增加鞭毛蛋白基因座表达的正向调控来增加鞭毛蛋白启动子的表达。典型地，不希望受任何特定科学理论的束缚，鞭毛蛋白基因座的表达由σ因子SigD正向控制，σ因子SigD受到FlgM蛋白的抑制。flgM缺失和/或FlgM表达降低显著增强SigD的表达和/或活性，并且因此引起鞭毛蛋白基因座的增加的和/或组成性的表达。典型地，不希望受任何特定科学理论的束缚，可通过被称为CsrA的蛋白质与存在于鞭毛蛋白基因座转录物中的核糖体结合位点的结合负向转录后控制鞭毛亚单位的表达。csrA缺失和/或CsrA表达降低显著增强鞭毛亚单位的表达。鞭毛蛋白基因调控核酸序列中一个或多个CsrA结合位点的缺失和/或减少可另外或替代地显著增加鞭毛亚单位的表达。在各种实施方案中，CsrA结合位点中的某些点突变可降低和/或消除CsrA对鞭毛亚单位表达的负向控制。因此，在各种实施方案中，例如枯草芽孢杆菌中可通过(i)缺失flgM基因和/或(ii)CsrA结合位点中的点突变中的任一者或两者来增加与鞭毛蛋白基因调控核酸序列(例如鞭毛蛋白启动子，例如hag启动子)可操作地连接的核酸的表达。因此，本领域技术人员将了解，如果鞭毛蛋白基因的编码核酸序列被编码纤维合成酶(例如左聚糖蔗糖酶)的核酸序列置换，使得纤维合成酶可操作地连接至鞭毛蛋白基因调控序列(例如包括hag启动子)，那么纤维合成酶可以高水平和/或组成性水平表达。在各种实施方案中，纤维合成酶包括分泌多肽。

在某些实施方案中，本公开的转基因包括编码与鞭毛蛋白基因调控核酸序列(例如鞭毛蛋白基因启动子)可操作地连接的左聚糖蔗糖酶的核酸序列。在某些实施方案中，本公开的转基因可包括编码与hag启动子可操作地连接的左聚糖蔗糖酶的核酸序列。在各种实施方案中，左聚糖蔗糖酶包括分泌多肽。

本领域技术人员将了解，内源sacB基因座可包括在不存在蔗糖的情况下抑制sacB表达的调控元件。在消化道中，消化物的滞留时间可能比所消耗的碳水化合物(例如蔗糖)诱导表达所需的时间短，因为滞留时间可能小于20分钟。此外，内源性肠道酶还可分解碳水化合物。因此，本公开包括其中组成性表达纤维合成酶以使消化物在肠道中停留与纤维合成酶在肠道中活动的重叠增加的实施方案。肠道中纤维合成酶的组成性表达可使得可用于例如在消耗和消化期间从碳水化合物合成纤维的纤维合成酶发生累积。

本公开还包括核酸载体，所述核酸载体包括本公开的转基因。本领域技术人员将了解，多种载体(诸如质粒)可用于例如在将异源核酸序列整合至靶细胞的基因组中的情况下将异源核酸引入靶细胞(例如本文所公开的细菌靶细胞)中。示例性载体可包括质粒和病毒载体。在各种实施方案中，载体包括可选择标记物和/或可反选择标记物。在一些实施方案中，对载体进行工程化以通过同源重组将异源核酸序列整合至靶细胞基因组中。在一些实施方案中，对载体进行工程化以将异源核酸序列不稳定整合至靶细胞基因组中(例如在一些实施方案中，通过产生部分二倍体细胞)。在一些实施方案中，对载体进行工程化以通过单交换事件整合至宿主细胞基因组中，随后通过后续双交换进行拆分从而使得质粒DNA(例如由pminiMAD或pMAD质粒形成的那些质粒DNA)丢失。

工程化细胞

本公开包括含有包括编码和/或表达本公开的纤维合成酶的转基因的异源核酸序列的细胞(例如芽孢)(此类细胞在本文中称为工程化细胞)。本领域技术人员将了解，可对多种细胞和/或芽孢中的任一者进行工程化以产生例如用于向受试者(例如人受试者)施用的组合物和/或用于所述组合物中。

在各种实施方案中，本公开的工程化细胞可为营养细胞和/或非芽孢形成细胞。许多例如用于作为益生菌向人受试者施用的细胞制剂包括不能形成芽孢和/或作为营养细胞施用的细菌(例如在冻干制剂中)。可作为营养细胞施用的非芽孢形成细胞的常见实例包括乳杆菌和双歧杆菌。常用的是乳杆菌细胞。可作为营养细胞施用的非芽孢形成细胞的实例包括但不限于拟杆菌科的成员(例如单形拟杆菌(Bacter oides uniformis)、多形拟杆菌(Bacteroides thetaiotaomicron)、脆弱拟杆菌(Bacteroides fragilis)、卵形拟杆菌(Bacteroides ovatus)、普通拟杆菌(Bacteroides vulgatus)、粪拟杆菌(Bacteroidescaccae)、埃氏拟杆菌(Bacteroides eggerthii)、普通拟杆菌以及狄氏副拟杆菌(Parabacter oides distasonis))和乳杆菌(Lactobacillae)科的成员(例如副干酪乳杆菌(Lactobacillus paracasei)、短乳杆菌(Lactobacillus brevis)、干酪乳杆菌(Lactobacillus casei)、德氏乳杆菌(Lactobacillus delbrueckii)、加氏乳杆菌(Lactobacillus gasseri)、鼠李糖乳杆菌(Lactobacillus rhamno sus)、罗伊氏乳杆菌(Lactobacillus reuteri)、植物乳杆菌(Lactobacillusplantarum)以及约氏乳杆菌)。

在各种实施方案中，本公开的细胞包括共生细菌，诸如乳杆菌、梭菌或拟杆菌，或被认为以活的形式可食用的其他细胞，例如酿酒酵母。

在各种实施方案中，细胞为对动物(例如人)摄取来说安全的益生菌微生物。益生菌微生物包括但不限于来自芽孢杆菌属、双歧杆菌属、肠球菌属、大肠杆菌属、乳杆菌属、明串珠菌属、片球菌属以及链球菌属。本公开包括使用芽孢杆菌属的细菌，例如枯草芽孢杆菌。在某些实施方案中，微生物不为真核生物。举例来说，微生物不为用于酒精饮料发酵的真核生物，诸如糖酵母属。

在某些实施方案中，细胞为可形成芽孢的细菌细胞。芽孢可为细胞的抵抗恶劣环境的形式。细菌芽孢可为休眠的活形式，所述形式可以干燥和/或脱水状态存在相当长的时间和/或无限期地存在。不希望受任何特定科学理论的束缚，各种芽孢形成细菌的自然生命周期可包括芽孢在环境营养物和/或因子存在下的萌发、萌发细胞的增殖以及在环境营养物耗尽的情况下再形成芽孢。在各种实施方案中，芽孢可在向受试者施用之后例如在受试者的肠道中(例如在受试者的肠中)萌发和/或增殖。各种芽孢形成细菌为本领域已知的，并且可经过工程化以包括例如包括本公开的转基因的异源核酸。在各种实施方案中，工程化细胞为呈芽孢状态的细胞。本公开的示例性工程化芽孢包括例如用于向受试者施用的芽孢杆菌种的工程化芽孢。

芽孢在本公开的上下文中可为有用的细胞形式，至少部分是因为芽孢在储存一段时间(例如在室温下例如长时间储存)后可保留萌发和/或增殖的能力，并且至少由于这个原因，芽孢被认为具有长有效保质期。保质期可为消费品的安全性、满意度以及价格点的重要因素，从而使它成为供应商和消费者的宝贵财富。另外，抵抗恶劣环境的芽孢形式允许活的有机体穿过众所周知使酶和活性分子失活的胃部环境，所述有机体以其他方式不能被配制成可承受穿过胃部。因此，芽孢形式使得能够将工程化细胞配制成消费者满意的形式。举例来说，虽然存在用于配制丸剂以使纯化的和配制的治疗分子能够穿过胃的方法，但也可制备诸如液体制剂等制剂(例如至少部分基于使用工程化芽孢)，并且可能是一些消费者更喜欢的。芽孢的施用避免了对某些昂贵的配制步骤的需要。另外，芽孢的施用可提供活性细胞从休眠状态的交错释放。因此，本公开尤其提供了用于使治疗剂在肠道中延长释放的组合物和方法，其中所述组合物包括工程化细胞，例如工程化细胞的芽孢形式。由于尺寸小并且耐热，芽孢还可促进和/或能够以比类似的非芽孢细胞可在类似细胞存活率情况下冻干更快的速率冻干。

本领域技术人员将了解，芽孢的萌发可遵循指数衰减，所述指数衰减例如根据每分钟萌发的芽孢的恒定百分比来建模并且根据营养触发物的可用性来定义。萌发可使得活性活细胞在数小时内稳定释放，这可进一步促成一个时间段，在所述时间段内剂量为有效的和/或将纤维合成酶递送至肠道。此外，在缺乏足够营养的情况下，活性细胞可重新进入芽孢状态。萌发和再形成芽孢的特性可个别地以及一起允许所施用的细胞以抵抗恶劣环境的芽孢形式停留在肠道中，直到与消化物接触。

芽孢形成细菌和其芽孢包括例如枯草芽孢杆菌PY79和其芽孢。其他芽孢形成微生物和其芽孢包括但不限于枯草芽孢杆菌组成员(例如枯草芽孢杆菌枯草亚种菌株168和枯草芽孢杆菌纳豆亚种)、芽孢杆菌组成员(例如凝结芽孢杆菌(Bacillus coagulans)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)、地衣芽孢杆菌(Bacillus licheniformis)、芽孢杆菌种(Bacillus sp.)、巨大芽孢杆菌(Bacillus megatarium)以及枯草芽孢杆菌斯氏亚种(Bacillus subtilis subsp.Spizizenii))、梭菌科成员(例如丁酸梭菌(Clostridium butyricum)、丙酮丁醇梭菌(Clostridium ac etobutylicum)、阿魏梭菌(Clostridium arbusti)、金丁酸梭菌(Clostridiu m aurantibutyricum)、拜氏梭菌(Clostridium beijerinckii)、嗜纤维梭菌(Clostridium cellulovorans)、解纤维梭菌(Clostridium cellulolyticum)、热纤维梭菌(Clostridium thermocellum)、热丁酸梭菌(Clostridium ther mobutyricum)、巴氏梭菌(Clostridium pasteurianum)、克氏梭菌(Clost ridium kluyveri)、诺氏梭菌(Clostridium novyi)、糖丁基梭菌(Clostridi umsaccharobutylicum)、热琥珀酸梭菌(Clostridium thermosuccinogen es)、热棕榈梭菌(Clostridium thermopalmarium)、解糖梭菌(Clostridiu m saccharolyticum)、糖霜梭菌(Clostridium saccharoperbutylacetonicu m)、酪丁酸梭菌(Clostridiumtyrobutyricum)、破伤风梭菌(Clostridium tetanomorphum)、大型梭菌(Clostridiummagnum)、永达尔梭菌(Clos tridium ljungdahlii)、产乙醇梭菌(Clostridiumautoethanogenum)、丁酸梭菌(Clostridium butyricum)、普那梭菌(Clostridiumpuniceum)、产二醇梭菌(Clostridium diolis)、同型丙酸梭菌5(Clostridium 5homopropionicum)和/或玫瑰色梭菌(Clostridium roseum))以及各种可食用酵母(诸如酿酒酵母)以及其芽孢。

在各种实施方案中，芽孢形成微生物和其芽孢包括但不限于枯草芽孢杆菌组成员枯草芽孢杆菌A29、枯草芽孢杆菌Abs3、枯草芽孢杆菌AP254、枯草芽孢杆菌At2、枯草芽孢杆菌B2、枯草芽孢杆菌B7-s、枯草芽孢杆菌BEST7003、枯草芽孢杆菌BEST7613、枯草芽孢杆菌BSn5、枯草芽孢杆菌E1、枯草芽孢杆菌gtP20b、枯草芽孢杆菌Hal1、枯草芽孢杆菌HJ5、枯草芽孢杆菌J22、枯草芽孢杆菌J23、枯草芽孢杆菌J24、枯草芽孢杆菌J25、枯草芽孢杆菌J26、枯草芽孢杆菌J27、枯草芽孢杆菌KCTC 1028＝ATCC 6051a、枯草芽孢杆菌LX-8、枯草芽孢杆菌MB73/2、枯草芽孢杆菌Miyagi-4、枯草芽孢杆菌Miyagi-4100、枯草芽孢杆菌PRO 1、枯草芽孢杆菌PS216、枯草芽孢杆菌PTS-394、枯草芽孢杆菌PY79、枯草芽孢杆菌QB928、枯草芽孢杆菌QH-1、枯草芽孢杆菌S1-4、枯草芽孢杆菌SPZ1、枯草芽孢杆菌菌株10、枯草芽孢杆菌菌株DY、枯草芽孢杆菌淀粉糖亚种(Bacillus subtilis subsp.amylosacchariticus)、枯草芽孢杆菌清国酱亚种(Bacillus subtilis subsp.chungkookjang)、枯草芽孢杆菌内生亚种(Bacillus subtilis subsp.endophyticus)、枯草芽孢杆菌球形亚种(Bacillussubtilis subsp.globigii)、枯草芽孢杆菌沙漠亚种(Bacillus subtilissubsp.inaquosorum)(枯草芽孢杆菌沙漠亚种KCTC 13429)、枯草芽孢杆菌克里斯蒂亚种(Bacillus subtilis subsp.krictiensis)、枯草芽孢杆菌乳聚糖亚种(Bacillussubtilis subsp.lactipan)、枯草芽孢杆菌纳豆亚种、枯草芽孢杆菌纳豆亚种BEST195、枯草芽孢杆菌纳豆亚种HSF 1410、枯草芽孢杆菌尼日尔亚种(Bacillus subtilissubsp.niger)、枯草芽孢杆菌青岛亚种(Bacillus subtilis subsp.qingdao)、枯草芽孢杆菌sadata亚种(Bacillus subtilis subsp.sadata)、枯草芽孢杆菌斯氏亚种(枯草芽孢杆菌斯氏亚种ATCC 6633、枯草芽孢杆菌斯氏亚种DV1-B-1、枯草芽孢杆菌斯氏亚种JCM 2499、枯草芽孢杆菌斯氏亚种RFWG1A3、枯草芽孢杆菌斯氏亚种RFWG1A4、枯草芽孢杆菌斯氏亚种RFWG4C10、枯草芽孢杆菌斯氏亚种RFWG5B15、枯草芽孢杆菌斯氏亚种菌株W23、枯草芽孢杆菌斯氏亚种TU-B-10)、枯草芽孢杆菌粪亚种(Bacillus subtilis subsp.stercoris)、枯草芽孢杆菌枯草亚种(Bacillus subtilis subsp.subtilis)(枯草芽孢杆菌枯草亚种NCIB3610＝ATCC 6051、枯草芽孢杆菌枯草亚种6051-HGW、枯草芽孢杆菌枯草亚种菌株168、枯草芽孢杆菌枯草亚种菌株L170、枯草芽孢杆菌枯草亚种菌株N170、枯草芽孢杆菌枯草亚种菌株AG1839、枯草芽孢杆菌枯草亚种菌株AUSI98、枯草芽孢杆菌枯草亚种菌株B2、枯草芽孢杆菌枯草亚种菌株BAB-1、枯草芽孢杆菌枯草亚种菌株BSP1、枯草芽孢杆菌枯草亚种菌株JH642、枯草芽孢杆菌枯草亚种菌株JH642亚株AG174、枯草芽孢杆菌枯草亚种菌株MP11、枯草芽孢杆菌枯草亚种菌株MP9、枯草芽孢杆菌枯草亚种菌株OH 131.1、枯草芽孢杆菌枯草亚种菌株R0179、枯草芽孢杆菌枯草亚种菌株RO-NN-1、枯草芽孢杆菌枯草亚种菌株SC-8、枯草芽孢杆菌枯草亚种菌株SMY)、枯草芽孢杆菌TO-A、枯草芽孢杆菌TPK 210909、枯草芽孢杆菌UCMB5014、枯草芽孢杆菌XF-1以及枯草芽孢杆菌YF001。

在各种实施方案中，芽孢形成微生物和其芽孢包括但不限于枯草芽孢杆菌组的枯草芽孢杆菌组成员：解淀粉芽孢杆菌(解淀粉芽孢杆菌AB01、解淀粉芽孢杆菌AP143、解淀粉芽孢杆菌AP193、解淀粉芽孢杆菌AP71、解淀粉芽孢杆菌AP79、解淀粉芽孢杆菌CC178、解淀粉芽孢杆菌DC-12、解淀粉芽孢杆菌DSM7＝ATCC 23350、解淀粉芽孢杆菌EBL11、解淀粉芽孢杆菌EGD-AQ14、解淀粉芽孢杆菌GGI-18、解淀粉芽孢杆菌HB-26、解淀粉芽孢杆菌IT-45、解淀粉芽孢杆菌KHG19、解淀粉芽孢杆菌LFB112、解淀粉芽孢杆菌LL3、解淀粉芽孢杆菌Lx-11、解淀粉芽孢杆菌PGK1、解淀粉芽孢杆菌TA208、解淀粉芽孢杆菌UASWS BA1、解淀粉芽孢杆菌UCMB5007、解淀粉芽孢杆菌UCMB5140、解淀粉芽孢杆菌UMAF6614、解淀粉芽孢杆菌UMAF6639、解淀粉芽孢杆菌XH7、解淀粉芽孢杆菌Y2)、暹罗芽孢杆菌(Bacillus siamensis)(暹罗芽孢杆菌KCTC 13613)、贝莱斯芽孢杆菌(Bacillus velezensis)(贝莱斯芽孢杆菌A3、贝莱斯芽孢杆菌AS43.3、贝莱斯芽孢杆菌At1、贝莱斯芽孢杆菌CAU B946、贝莱斯芽孢杆菌FZB42、贝莱斯芽孢杆菌M27、贝莱斯芽孢杆菌NAU-B3、贝莱斯芽孢杆菌NJN-6、贝莱斯芽孢杆菌SK19.001、贝莱斯芽孢杆菌SQR9、贝莱斯芽孢杆菌TrigoCor1448、贝莱斯芽孢杆菌UCMB5033、贝莱斯芽孢杆菌UCMB5036、贝莱斯芽孢杆菌UCMB5113、贝莱斯芽孢杆菌聚酵素变体(Bacillus velezensis variant polyfermenticus)、贝莱斯芽孢杆菌YAU B9601-Y2)、萎缩芽孢杆菌(Bacillus atrophaeus)(萎缩芽孢杆菌1013-1、萎缩芽孢杆菌1013-2、萎缩芽孢杆菌1942、萎缩芽孢杆菌BACI051-E、萎缩芽孢杆菌BACI051-N、萎缩芽孢杆菌C89、萎缩芽孢杆菌Detrick-1、萎缩芽孢杆菌Detrick-2、萎缩芽孢杆菌Detrick-3、萎缩芽孢杆菌NBRC 15539、萎缩芽孢杆菌菌株Dugway、萎缩芽孢杆菌球形亚种、萎缩芽孢杆菌ATCC49822、萎缩芽孢杆菌ATCC 9372、萎缩芽孢杆菌UCMB-5137)、地衣芽孢杆菌(地衣芽孢杆菌10-1-A、地衣芽孢杆菌5-2-D、地衣芽孢杆菌CG-B52、地衣芽孢杆菌CGMCC 3963、地衣芽孢杆菌DSM 13＝ATCC 14580、地衣芽孢杆菌F1-1、地衣芽孢杆菌F2-1、地衣芽孢杆菌KRB2009、地衣芽孢杆菌LMG 17339、地衣芽孢杆菌LMG 6934、地衣芽孢杆菌LMG 7559、地衣芽孢杆菌MKU3、地衣芽孢杆菌S16、地衣芽孢杆菌WX-02)、摩加夫芽孢杆菌(Bacillus mojavensis)亚组、耐盐芽孢杆菌(Bacillus halotolerans)、摩加夫芽孢杆菌(摩加夫芽孢杆菌RO-H-1＝KCTC 3706、摩加夫芽孢杆菌RRC 101)、副地衣芽孢杆菌(Bacillus paralicheniformis)(副地衣芽孢杆菌ATCC 9945a、副地衣芽孢杆菌G-1)、沙诺氏芽孢杆菌(Bacillussonorensis)(沙诺氏芽孢杆菌L12、沙诺氏芽孢杆菌NBRC 101234＝KCTC 13918)、枯草芽孢杆菌(枯草芽孢杆菌A29、枯草芽孢杆菌Abs3、枯草芽孢杆菌AP254、枯草芽孢杆菌At2、枯草芽孢杆菌B2、枯草芽孢杆菌B7-s、枯草芽孢杆菌BEST7003、枯草芽孢杆菌BEST7613、枯草芽孢杆菌BSn5、枯草芽孢杆菌E1、枯草芽孢杆菌gtP20b、枯草芽孢杆菌Hal1、枯草芽孢杆菌HJ5、枯草芽孢杆菌J22、枯草芽孢杆菌J23、枯草芽孢杆菌J24、枯草芽孢杆菌J25、枯草芽孢杆菌J26、枯草芽孢杆菌J27、枯草芽孢杆菌KCTC 1028＝ATCC 6051a、枯草芽孢杆菌LX-8、枯草芽孢杆菌MB73/2、枯草芽孢杆菌Miyagi-4、枯草芽孢杆菌Miyagi-4100、枯草芽孢杆菌PRO1、枯草芽孢杆菌PS216、枯草芽孢杆菌PTS-394、枯草芽孢杆菌PY79、枯草芽孢杆菌QB928、枯草芽孢杆菌QH-1、枯草芽孢杆菌S1-4、枯草芽孢杆菌SPZ1、枯草芽孢杆菌菌株10、枯草芽孢杆菌株DY、枯草芽孢杆菌淀粉糖亚种、枯草芽孢杆菌清国酱亚种、枯草芽孢杆菌内生亚种、枯草芽孢杆菌球形亚种、枯草芽孢杆菌沙漠亚种(枯草芽孢杆菌沙漠亚种KCTC 13429)、枯草芽孢杆菌克里斯蒂亚种、枯草芽孢杆菌乳聚糖亚种、枯草芽孢杆菌纳豆亚种(枯草芽孢杆菌纳豆亚种BEST195、枯草芽孢杆菌纳豆亚种HSF 1410)、枯草芽孢杆菌尼日尔亚种、枯草芽孢杆菌青岛亚种、枯草芽孢杆菌sadata亚种、枯草芽孢杆菌斯氏亚种(枯草芽孢杆菌斯氏亚种ATCC 6633、枯草芽孢杆菌斯氏亚种DV1-B-1、枯草芽孢杆菌斯氏亚种JCM 2499、枯草芽孢杆菌斯氏亚种RFWG1A3、枯草芽孢杆菌斯氏亚种RFWG1A4、枯草芽孢杆菌斯氏亚种RFWG4C10、枯草芽孢杆菌斯氏亚种RFWG5B15、枯草芽孢杆菌斯氏亚种菌株W23、枯草芽孢杆菌斯氏亚种TU-B-10)、枯草芽孢杆菌粪亚种、枯草芽孢杆菌枯草亚种(枯草芽孢杆菌枯草亚种NCIB3610＝ATCC 6051、枯草芽孢杆菌枯草亚种菌株168、枯草芽孢杆菌枯草亚种菌株AG1839、枯草芽孢杆菌枯草亚种菌株AUSI98、枯草芽孢杆菌枯草亚种菌株B2、枯草芽孢杆菌枯草亚种菌株BAB-1、枯草芽孢杆菌枯草亚种菌株BSP1、枯草芽孢杆菌枯草亚种菌株JH642、枯草芽孢杆菌枯草亚种菌株MP11、枯草芽孢杆菌枯草亚种菌株MP9、枯草芽孢杆菌枯草亚种菌株OH131.1、枯草芽孢杆菌枯草亚种菌株R0179、枯草芽孢杆菌枯草亚种菌株RO-NN-1、枯草芽孢杆菌枯草亚种菌株SC-8、枯草芽孢杆菌枯草亚种菌株SMY)、枯草芽孢杆菌TO-A、枯草芽孢杆菌TPK 210909、枯草芽孢杆菌UCMB5014、枯草芽孢杆菌XF-1、枯草芽孢杆菌YF001)、特基拉芽孢杆菌(Bacillus tequilensis)(特基拉芽孢杆菌KCTC 13622)、死亡谷芽孢杆菌(Bacillus vallismortis)(死亡谷芽孢杆菌DV1-F-3、死亡谷芽孢杆菌NRRL B-14890)、芽孢杆菌种AB01、芽孢杆菌种AP102、芽孢杆菌种AP143、芽孢杆菌种AP183、芽孢杆菌种AP189、芽孢杆菌种AP193、芽孢杆菌种AP215、芽孢杆菌种AP218、芽孢杆菌种AP219、芽孢杆菌种AP295、芽孢杆菌种AP301、芽孢杆菌种AP303、芽孢杆菌种AP305、芽孢杆菌种AP71、芽孢杆菌种AP77、芽孢杆菌种AP79、芽孢杆菌种D10(2019)、芽孢杆菌种D9(2019)、芽孢杆菌种GeS7V、芽孢杆菌种LiF4a、芽孢杆菌种LJF-10、芽孢杆菌种LJF-11、芽孢杆菌种LJF-2、芽孢杆菌种LJF-5、芽孢杆菌种LJF-8、芽孢杆菌种LJF-9、芽孢杆菌种M1(2010)、芽孢杆菌种M100(2010)、芽孢杆菌种M101(2010)、芽孢杆菌种M103(2010)、芽孢杆菌种M110(2010)、芽孢杆菌种M112(2010)、芽孢杆菌种M14(2010)、芽孢杆菌种M2(2010)、芽孢杆菌种M21(2010)、芽孢杆菌种M22(2010)、芽孢杆菌种M25(2010)、芽孢杆菌种M29(2010)、芽孢杆菌种M30(2010)、芽孢杆菌种M35(2010)、芽孢杆菌种M38(2010)、芽孢杆菌种M4(2010b)、芽孢杆菌种M40(2010)、芽孢杆菌种M5(2010)、芽孢杆菌种M63(2010)、芽孢杆菌种M64(2010)、芽孢杆菌种M67(2010)、芽孢杆菌种M68(2010)、芽孢杆菌种M88(2010)、芽孢杆菌种M90(2010)、芽孢杆菌种M94(2010)、芽孢杆菌种M95(2010)、芽孢杆菌种M98(2010)、芽孢杆菌种SE-54、芽孢杆菌种TT106(2010)、芽孢杆菌种TT45(2010)、芽孢杆菌种TT46(2010)、芽孢杆菌种TT53(2010)、芽孢杆菌种TT80(2010)、芽孢杆菌种ZYJ-1、芽孢杆菌种ZYJ-10、芽孢杆菌种ZYJ-11、芽孢杆菌种ZYJ-12、芽孢杆菌种ZYJ-13、芽孢杆菌种ZYJ-15、芽孢杆菌种ZYJ-16、芽孢杆菌种ZYJ-17、芽孢杆菌种ZYJ-18、芽孢杆菌种ZYJ-19、芽孢杆菌种ZYJ-2、芽孢杆菌种ZYJ-20、芽孢杆菌种ZYJ-21、芽孢杆菌种ZYJ-22、芽孢杆菌种ZYJ-23、芽孢杆菌种ZYJ-24、芽孢杆菌种ZYJ-26、芽孢杆菌种ZYJ-27、芽孢杆菌种ZYJ-28、芽孢杆菌种ZYJ-3、芽孢杆菌种ZYJ-32、芽孢杆菌种ZYJ-33、芽孢杆菌种ZYJ-34、芽孢杆菌种ZYJ-35、芽孢杆菌种ZYJ-36、芽孢杆菌种ZYJ-37、芽孢杆菌种ZYJ-38、芽孢杆菌种ZYJ-39、芽孢杆菌种ZYJ-4、芽孢杆菌种ZYJ-40、芽孢杆菌种ZYJ-43、芽孢杆菌种ZYJ-44、芽孢杆菌种ZYJ-5、芽孢杆菌种ZYJ-6、芽孢杆菌种ZYJ-7、芽孢杆菌种ZYJ-8、芽孢杆菌种ZYJ-9、枯草芽孢杆菌组种以及诺卡氏菌(Nocardia)种KY2-1。

在各种实施方案中，芽孢形成微生物和其芽孢包括但不限于凝结芽孢杆菌细菌，任选选自凝结芽孢杆菌2-6、凝结芽孢杆菌36D1、凝结芽孢杆菌CSIL1、凝结芽孢杆菌DSM 1＝ATCC 7050、凝结芽孢杆菌H-1、凝结芽孢杆菌P38、凝结芽孢杆菌XZL4以及凝结芽孢杆菌XZL9。在各种实施方案中，芽孢形成微生物和其芽孢包括但不限于乳杆菌属细菌，任选选自副干酪乳杆菌、短乳杆菌、干酪乳杆菌、德氏乳杆菌、加氏乳杆菌、鼠李糖乳杆菌、罗伊氏乳杆菌、植物乳杆菌以及约氏乳杆菌。在各种实施方案中，芽孢形成微生物和其芽孢包括但不限于乳杆菌属细菌，任选选自副干酪乳杆菌(副干酪乳杆菌AT CC 334、副干酪乳杆菌COM0101、副干酪乳杆菌N1115、副干酪乳杆菌NRIC 0644、副干酪乳杆菌NRIC 1917、副干酪乳杆菌NRIC 1981、副干酪乳杆菌副干酪亚种(Lactobacillus paracasei subsp.paracasei)(副干酪乳杆菌副干酪亚种8700:2、副干酪乳杆菌副干酪亚种AT CC 25302、副干酪乳杆菌副干酪亚种BGSJ2-8、副干酪乳杆菌副干酪亚种CNCM I-2877、副干酪乳杆菌副干酪亚种CNCM I-4270、副干酪乳杆菌副干酪亚种CNCM I-4648、副干酪乳杆菌副干酪亚种CN CMI-4649、副干酪乳杆菌副干酪亚种DSM 5622、副干酪乳杆菌副干酪亚种JCM 8130、副干酪乳杆菌副干酪亚种Lpp120、副干酪乳杆菌副干酪亚种Lpp122、副干酪乳杆菌副干酪亚种Lpp123、副干酪乳杆菌副干酪亚种Lpp125、副干酪乳杆菌副干酪亚种Lpp126、副干酪乳杆菌副干酪亚种Lpp14、副干酪乳杆菌副干酪亚种Lpp17、副干酪乳杆菌副干酪亚种Lpp189、副干酪乳杆菌副干酪亚种Lpp219、副干酪乳杆菌副干酪亚种Lpp22、副干酪乳杆菌副干酪亚种Lpp221、副干酪乳杆菌副干酪亚种Lpp223、副干酪乳杆菌副干酪亚种Lpp225、副干酪乳杆菌副干酪亚种Lpp226、副干酪乳杆菌副干酪亚种Lpp227、副干酪乳杆菌副干酪亚种Lpp228、副干酪乳杆菌副干酪亚种Lpp229、副干酪乳杆菌副干酪亚种Lpp230、副干酪乳杆菌副干酪亚种Lpp37、副干酪乳杆菌副干酪亚种Lpp41、副干酪乳杆菌副干酪亚种Lpp43、副干酪乳杆菌副干酪亚种Lpp46、副干酪乳杆菌副干酪亚种Lpp48、副干酪乳杆菌副干酪亚种Lpp49、副干酪乳杆菌副干酪亚种Lpp7、副干酪乳杆菌副干酪亚种Lpp70、副干酪乳杆菌副干酪亚种Lpp71、副干酪乳杆菌副干酪亚种Lpp74)、副干酪乳杆菌坚韧亚种(Lactobacil lusparacasei subsp.tolerans)(副干酪乳杆菌坚韧亚种DSM 20258、副干酪乳杆菌坚韧亚种Lpl14、副干酪乳杆菌坚韧亚种Lpl7)、副干酪乳杆菌TXW)、短乳杆菌(短乳杆菌AG48、短乳杆菌ATCC 14869＝DSM 20054、短乳杆菌ATCC 367、短乳杆菌BSO 464、短乳杆菌EW、短乳杆菌KB290、短乳杆菌凝结亚种(Lactobacillus brevis subsp.coagulans)、短乳杆菌格雷夫斯亚种(Lactobacillus brevis subsp.grave sensis)、短乳杆菌格雷夫斯亚种ATCC27305)、干酪乳杆菌(干酪乳杆菌12A、干酪乳杆菌21/1、干酪乳杆菌32G、干酪乳杆菌5b、干酪乳杆菌A2-362、干酪乳杆菌BD-II、干酪乳杆菌BL23、干酪乳杆菌CRF28、干酪乳杆菌DN-114001、干酪乳杆菌DSM 20011＝JC M 1134＝ATCC 393、干酪乳杆菌Lc-10、干酪乳杆菌LC2W、干酪乳杆菌LcA、干酪乳杆菌LcY、干酪乳杆菌LOCK919、干酪乳杆菌Lpc-37、干酪乳杆菌M36、干酪乳杆菌菌株Zhang、干酪乳杆菌T71499、干酪乳杆菌UCD174、干酪乳杆菌UW1、干酪乳杆菌UW4、干酪乳杆菌W56)、德氏乳杆菌(德氏乳杆菌保加利亚亚种(Lactobacill usdelbrueckii subsp.bulgaricus)(德氏乳杆菌保加利亚亚种2038、德氏乳杆菌保加利亚亚种ATCC 11842＝JCM 1002、德氏乳杆菌保加利亚亚种ATCC BAA-365、德氏乳杆菌保加利亚亚种CNCM I-1519、德氏乳杆菌保加利亚亚种CNCM I-1632、德氏乳杆菌保加利亚亚种ND02、德氏乳杆菌保加利亚亚种PB2003/044-T3-4)、德氏乳杆菌德氏亚种(Lactobacillusdelbrueckii subsp.delbrueckii)(德氏乳杆菌德氏亚种DSM 20074＝JCM 1012)、德氏乳杆菌印度亚种(Lactobacill us delbrueckii subsp.indicus)(德氏乳杆菌印度亚种DSM15996)、德氏乳杆菌雅各布森亚种(Lactobacillus delbrueckii subsp.jakobsenii)(德氏乳杆菌雅各布森亚种ZN7a-9＝DSM 26046)、德氏乳杆菌乳酸亚种(Lactobacillusdelbrueckii subsp.lactis)(德氏乳杆菌乳酸亚种CRL581、德氏乳杆菌乳酸亚种DSM20072)、德氏乳杆菌桑基亚种(Lactobacillus delbrueckii subsp.sunkii))、加氏乳杆菌(加氏乳杆菌130918、加氏乳杆菌2016、加氏乳杆菌202-4、加氏乳杆菌224-1、加氏乳杆菌ADH、加氏乳杆菌ADL-351、加氏乳杆菌ATCC 33323＝JCM 1131、加氏乳杆菌CECT5714、加氏乳杆菌DSM 14869、加氏乳杆菌EX336960VC01、加氏乳杆菌EX336960VC02、加氏乳杆菌EX336960VC03、加氏乳杆菌EX336960VC06、加氏乳杆菌EX336960VC07、加氏乳杆菌EX336960VC10、加氏乳杆菌EX336960VC13、加氏乳杆菌EX336960VC15、加氏乳杆菌MV-22、加氏乳杆菌SJ-9E-US、加氏乳杆菌SV-16A-US)、鼠李糖乳杆菌(鼠李糖乳杆菌2166、鼠李糖乳杆菌51B、鼠李糖乳杆菌ATCC 21052、鼠李糖乳杆菌AT CC 8530、鼠李糖乳杆菌BPL15、鼠李糖乳杆菌CASL、鼠李糖乳杆菌CRL1505、鼠李糖乳杆菌DSM 14870、鼠李糖乳杆菌DSM 20021＝JCM 1136＝NBRC 3425、鼠李糖乳杆菌E800、鼠李糖乳杆菌GG、鼠李糖乳杆菌HN001、鼠李糖乳杆菌K32、鼠李糖乳杆菌L31、鼠李糖乳杆菌L33、鼠李糖乳杆菌L34、鼠李糖乳杆菌L35、鼠李糖乳杆菌Lc 705、鼠李糖乳杆菌LMG 25859、鼠李糖乳杆菌LMG 27229、鼠李糖乳杆菌LMS2-1、鼠李糖乳杆菌LOCK900、鼠李糖乳杆菌LOCK908、鼠李糖乳杆菌LR231、鼠李糖乳杆菌LRHMDP2、鼠李糖乳杆菌LRHMDP3、鼠李糖乳杆菌MSUIS1、鼠李糖乳杆菌MT CC 5462、鼠李糖乳杆菌PEL5、鼠李糖乳杆菌PEL6、鼠李糖乳杆菌R0011)、罗伊氏乳杆菌(罗伊氏乳杆菌100-23、罗伊氏乳杆菌1063、罗伊氏乳杆菌ATCC 53608、罗伊氏乳杆菌CF 48-3A、罗伊氏乳杆菌DSM 20016、罗伊氏乳杆菌F275、罗伊氏乳杆菌I5007、罗伊氏乳杆菌JCM 1112、罗伊氏乳杆菌lpuph、罗伊氏乳杆菌mlc3、罗伊氏乳杆菌MM2-2、罗伊氏乳杆菌MM2-3、罗伊氏乳杆菌MM4-1A、罗伊氏乳杆菌SD2112、罗伊氏乳杆菌TD1)、植物乳杆菌(植物乳杆菌16、植物乳杆菌19L3、植物乳杆菌2025、植物乳杆菌2165、植物乳杆菌4_3、植物乳杆菌80、植物乳杆菌AY01、植物乳杆菌CMPG 5300、植物乳杆菌DOMLa、植物乳杆菌EGD-AQ4、植物乳杆菌IP LA88、植物乳杆菌JDM1、植物乳杆菌LP91、植物乳杆菌ST-III、植物乳杆菌斯特拉斯堡亚种(Lactobacillus plantarum subsp.argentora tensis)(植物乳杆菌斯特拉斯堡亚种DSM16365)、植物乳杆菌植物亚种(Lactobacillus plantarum subsp.plantarum)(植物乳杆菌植物亚种ATCC 14917＝JCM 1149＝CGMCC 1.2437、植物乳杆菌植物亚种KCA-1、植物乳杆菌植物亚种NC8、植物乳杆菌植物亚种P-8、植物乳杆菌植物亚种R0403、植物乳杆菌植物亚种ST-III)、植物乳杆菌UCMA 3037、植物乳杆菌WCFS1、植物乳杆菌WHE 92、植物乳杆菌WJL、植物乳杆菌ZJ316)、约氏乳杆菌(约氏乳杆菌135-1-CH N、约氏乳杆菌16、约氏乳杆菌ATCC33200、约氏乳杆菌DPC 6026、约氏乳杆菌FI9785、约氏乳杆菌N6.2、约氏乳杆菌NCC 533以及约氏乳杆菌pf01。

向受试者施用的细胞(例如向受试者施用和/或递送至受试者的肠的芽孢和/或非芽孢细胞)可表达和/或向受试者递送纤维合成酶。在各种实施方案中，向受试者施用的细胞在升结肠、横结肠和/或降结肠中表达纤维合成酶和/或将纤维合成酶递送至升结肠、横结肠和/或降结肠。在各种实施方案中，向受试者施用的细胞定殖于肠道中。在各种实施方案中，在细胞定殖于肠道中之前、期间和/或之后，向受试者施用的细胞在肠道中表达纤维合成酶和/或将纤维合成酶递送至肠道。在一些实施方案中，向受试者施用的细胞为非定殖的并且可穿过整个消化道，例如同时表达和/或递送本公开的纤维合成酶。在各种实施方案中，工程化细胞为能够穿过受试者的胃肠道而不持续存在于受试者的微生物组中(正交于微生物组)的细胞，任选地其中细胞为工程化的枯草芽孢杆菌细胞。

在各种实施方案中，工程化细胞为已被政府监管机构(诸如美国食品和药物管理局(United States Food and Drug Administration))或另一国家的等同机构指定为安全的细胞类型，或为本领域技术人员以其他方式已知或认为安全的细胞类型的细胞。

在各种实施方案中，本公开的细胞为可例如使用基本培养基例如在30-3000L发酵罐中大批量发酵的细胞。在各种实施方案中，本公开的细胞为可纯化为包括营养细胞或芽孢的生物质产物的细胞，任选地其中生物质产物的细胞可容易地纯化，并且/或者其中生物质产物可经过稳定化(例如通过过滤和/或冻干，例如以便于运输)。举例来说，在营养物饥饿后快速形成芽孢使得大的发酵批次能够在生长结束时转化成芽孢。芽孢可容易地储存、运输和/或通过加热生长培养基并且去除上清液从营养细胞纯化。

用于制备和/或纯化芽孢的各种方法为已知的。举一个例子，可通过包括在营养限制培养基中使细胞生长至高密度以刺激芽孢形成，随后进行纯化芽孢的步骤的技术来制备芽孢(例如枯草芽孢杆菌芽孢)。在一个实例中，可使细胞在37℃下在Difco芽孢形成培养基(0.8％营养肉汤、0.1％ KCl、0.012％ MgSO₄·7H₂O、0.5mM NaOH、1mM Ca(NO₃)₂ 0.01mMMnCl₂、1uM FeSO₄)中生长24-48小时，同时250rpm振荡以提供氧。可将所得细胞碎片与芽孢的混合物加热至80℃以杀死和溶解营养细胞，随后形成球粒并且用蒸馏水冲洗三次以去除细胞碎片并且纯化芽孢层。以此方式制备的芽孢在水中可稳定超过一年。

在某些实施方案中，将本公开的转基因引入包括与转基因具有显著同源性的序列的细胞中，例如其中转基因与细胞的序列(例如至少50个核苷酸，例如至少50、75、100、150、200、250、300、350、400、450、500、1,000、2,000、3,000、4,000或5,000个核苷酸的序列)具有至少80％同一性(例如至少80％、85％、90％、95％、96％、97％、98％、99％或100％同一性)。在各种此类情况下，细胞核酸序列与转基因的基于同源性的相互作用可竞争和/或抑制不同靶基因座处转基因的整合。此外，在各种情况下，转基因的整合(例如在与转基因不同源的靶基因座处)可引起基因组不稳定性和/或转基因功能损失。至少由于这些原因，在各种实施方案中，在引入转基因核酸序列之前，细胞的同源内源性核酸序列被修饰或从细胞基因组缺失(例如通过敲除)。

分离的纤维合成酶

在各种实施方案中，本公开包括分离的纤维合成酶和包括所述分离的纤维合成酶的组合物。为了避免疑问，虽然本公开提供了可用于向受试者施用的各种工程化细胞，使得所述细胞向受试者递送纤维合成酶，但本公开的分离的纤维合成酶不需要衍生自、分离自此类细胞。相反，本公开包括从任何来源分离的纤维合成酶。在各种实施方案中，本公开的纤维合成酶由天然表达纤维合成酶的植物或细菌产生和/或分离自所述植物或细菌。在各种实施方案中，本公开的纤维合成酶由植物、细菌或动物(例如大鼠、小鼠、奶牛、猪或马)产生和/或分离自植物、细菌或动物，所述植物、细菌或动物例如使用本领域技术人员已知的分子生物学标准技术进行工程化以表达本公开的纤维合成酶。

本公开的纤维合成酶可通过本领域技术人员已知的任何手段来分离。本领域技术人员将了解，蛋白质的分离是本领域技术人员用于所述目的的多种已知技术的成熟实践。分离纤维合成酶的方法可包括例如在细胞培养物(例如细菌细胞培养物或哺乳动物细胞培养物，例如大肠杆菌细胞培养物)中表达纤维合成酶、用亲和力标签标记纤维合成酶以便于分离(例如通过工程化和表达编码纤维合成酶和亲和力标签的核酸序列)和/或通过诸如色谱法(例如高效液相色谱(HPLC)或反相色谱)或酶联免疫吸附分析(ELISA)或其他免疫亲和方法等方法分离纤维合成酶。在各种实施方案中，可例如通过冻干或超滤对分离的纤维合成酶进行加工。

本公开包括方法和组合物，所述方法和组合物包括可递送至受试者并且可提供本文所公开的各种健康益处的本文所公开的分离的纤维合成酶。

制剂和应用

本公开包括纤维合成酶制剂，例如其中纤维合成酶制剂可为或包括一种或多种本公开的工程化细胞(例如呈芽孢形式)和/或本公开的分离的纤维合成酶。本公开的酶(例如分离的纤维合成酶)和细胞可以多种制剂中的任一者递送至受试者。本公开包括例如以已知用于施用益生菌的任何方式配制本公开的分离的纤维合成酶和/或工程化细胞。本公开包括向受试者施用纤维合成酶制剂。在各种实施方案中，本公开包括药学上可接受的纤维合成酶制剂，所述药学上可接受的纤维合成酶制剂包括药学上可接受的载体或赋形剂。

在一些实施方案中，可将纤维合成酶制剂配制成饮食补充剂。在一些实施方案中，可将纤维合成酶制剂配制成冷冻干燥粉末形式。在一些实施方案中，可将纤维合成酶制剂配制成于棒状包装或囊剂中的粉末的形式。

在一些实施方案中，可将纤维合成酶制剂配制成口服剂型，诸如胶囊或片剂(例如咀嚼片)。在一些实施方案中，可将纤维合成酶制剂配制成胶状物(例如包括诸如糖和明胶中的一者或多者等成分)。本公开包括施用被配制成延迟释放口服剂型(例如肠溶包衣口服剂型)的纤维合成酶制剂。

许多食物和/或成分可为或被用作递送纤维合成酶制剂的媒介物，包括但不限于巧克力、饼干、谷类、酸奶、纳豆、康普茶(kombucha)或面粉。因此，本公开包括在食品和/或食物成分中配制或配制成食品和/或食物成分的纤维合成酶制剂，所述食品和/或食物成分为诸如巧克力、饼干、谷类、酸奶、纳豆、康普茶或面粉。在各种实施方案中，纤维合成酶制剂被配制在食品或食物成分中或配制成食品或食物成分，所述食品或食物成分为液体，诸如果汁或饮料。在各种实施方案中，可将芽孢配制成悬浮液。在各种实施方案中，本公开的食品或食物成分的单位剂量或剂型具有介于约0.05mL与500mL之间，例如介于约0.5mL与约50mL之间或介于约2.5mL以及15mL之间的体积。在各种实施方案中，本公开的食品或食物成分的单位剂量或剂型具有下界为例如0.05mL、0.5mL、1mL、10mL、15mL、20mL、25mL、50mL或100mL并且上界为例如50mL、100mL、150mL、200mL、250mL、300mL、350mL、400mL、450mL或500mL的体积。

本公开还包括纤维合成酶制剂，所述纤维合成酶制剂为包括一种或多种本公开的工程化细胞(例如呈芽孢形式)和/或本公开的分离的纤维合成酶的囊剂。在各种实施方案中，配制囊剂以例如通过将食品与纤维合成酶制剂组合，例如通过与食品混合和/或分布至食品上或食品中(例如通过喷洒)来将本公开的一种或多种工程化细胞(例如呈芽孢形式)和/或本公开的分离的纤维合成酶与供消耗的食品一起使用。

在各种实施方案中，在向受试者施用和/或受试者消耗食品之前，将纤维合成酶制剂包括在或添加至食品(例如食物成分)中。在各种实施方案中，食品为供人消耗的食品。在各种实施方案中，食品为动物的食物，诸如动物饲料或饼干。在各种实施方案中，包括纤维合成酶制剂以在施用和/或消耗食品和/或食物成分之后例如在受试者的肠道中获得活性。单糖和/或二糖使得在被受试者消耗之前食品和/或食物成分中纤维的浓度或量增加。

可将各种制剂在周围条件下储存延长的时间段，例如至少1周、2周、3周、1个月、2个月、3个月、6个月或1年，例如长达1个月、2个月、3个月、6个月或1年。

在各种实施方案中，包括本公开的工程化细胞的制剂的单位剂量或剂型所包括的集落形成单位(CFU)数目介于1E+04与1E+14之间(例如约1E+04、1E+05、1E+06、1E+07、1E+08、1E+09、1E+10、1E+11、1E+12、1E+13或1E+14CFU或在下界为约1E+04、1E+05、1E+06、1E+07、1E+08、1E+09或1E+10CFU并且上界为约1E+08、1E+09、1E+10、1E+11、1E+12、1E+13或1E+14CFU的范围内)。在某些实施方案中，单位剂量或剂型包括1E+11CFU的工程化细胞(例如芽孢)。活细胞制剂施用的各种实例为本领域已知的。举例来说，在一项研究中，发现2.25E+11CFU为可耐受剂量，并且没有可观测的有害作用。纳豆(一种通过用枯草芽孢杆菌发酵制成的食物)可每克含有多达1E+09CFU并且纳豆的典型消耗部分(约90-100g)可包括1E+11CFU。关于凝结芽孢杆菌消耗的一些建议所建议的日剂量为1E+11-2E+11CFU。动物研究支持本文所提供的CFU剂量的安全性和功效，例如证实7E+12和9E+12例如对于70kg的人来说为安全剂量。

在各种实施方案中，向有需要的受试者施用本公开的纤维合成酶制剂。在各种实施方案中，施用本公开的纤维合成酶制剂使得产生(例如在1、3、6、12或24小时的时间内)至少1g可溶性纤维，例如至少1g、2g、3g、4g、5g、10g、15g、20g、25g、30g、35g或40g。在各种实施方案中，施用本公开的纤维合成酶制剂使得产生(例如在1、3、6、12或24小时的时间内)至少5g可溶性纤维。在各种实施方案中，施用本公开的纤维合成酶制剂使得产生(例如在1、3、6、12或24小时的时间内)至少10g可溶性纤维。在各种实施方案中，施用本公开的纤维合成酶制剂使得产生(例如在1、3、6、12或24小时的时间内)在下界为1g、2g、3g、4g或5g并且上界为5g、10g、15g、20g、25g、30g、35g或40g的范围内的量的可溶性纤维。在各种实施方案中，施用本公开的纤维合成酶制剂的单个剂量或剂型使得产生纤维。本领域技术人员将了解，在各种实施方案中，所建议的每天纤维总量(例如通过消耗和/或由本公开的分离的纤维合成酶和/或工程化细胞合成)为每天25至30g，包括每天6g至8g可溶性纤维(约1/4总纤维)。

在各种实施方案中，施用本公开的纤维合成酶制剂使得(例如在1、3、6、12或24小时的时间内)至少1g碳水化合物(例如至少1g、2g、3g、4g、5g、10g、15g、20g、25g、30g、35g或40g)合并至纤维中。在各种实施方案中，施用本公开的纤维合成酶制剂使得至少5g碳水化合物合并至纤维中(例如在1、3、6、12或24小时的时间内)。在各种实施方案中，施用本公开的纤维合成酶制剂使得至少10g碳水化合物合并至纤维中(例如在1、3、6、12或24小时的时间内)。在各种实施方案中，施用本公开的纤维合成酶制剂使得在下界为1g、2g、3g、4g或5g并且上界为5g、10g、15g、20g、25g、30g、35g或40g的范围内的量的碳水化合物合并至纤维中(例如在1、3、6、12或24小时的时间内)。在各种实施方案中，施用本公开的纤维合成酶制剂的单个剂量或剂型使得产生纤维。本领域技术人员将了解，在各种实施方案中，典型每天碳水化合物消耗可包括例如约45g-77g蔗糖。

在各种实施方案中，施用本公开的纤维合成酶制剂使得至少1g底物碳水化合物(例如至少1g、2g、3g、4g、5g、10g、15g、20g、25g、30g、35g或40g)裂解(例如在1、3、6、12或24小时的时间内)。在各种实施方案中，施用本公开的纤维合成酶制剂使得至少5g底物碳水化合物裂解(例如在1、3、6、12或24小时的时间内)。在各种实施方案中，施用本公开的纤维合成酶制剂使得至少10g底物碳水化合物裂解(例如在1、3、6、12或24小时的时间内)。在各种实施方案中，施用本公开的纤维合成酶制剂使得在下界为1g、2g、3g、4g或5g并且上界为5g、10g、15g、20g、25g、30g、35g或40g的范围内的量的底物碳水化合物裂解(例如在1、3、6、12或24小时的时间内)。

因此，施用包括本公开的工程化细胞的本公开的纤维合成酶制剂可显著影响肠道中底物碳水化合物与合成的纤维类型的比率。作为实例，如果受试者消耗60g的蔗糖和4g的可溶性纤维，那么可溶性纤维:蔗糖的重量比为约6.7％。如果利用蔗糖作为由工程化细胞表达的纤维合成酶进行纤维合成的底物，使得产生5g的纤维(例如左聚糖)，那么总简单糖含量降至55g并且总可溶性纤维增至9g，纤维:蔗糖比率变为16％。许多消费者一天摄入的可溶性纤维有可能显著低于4g，这将使得施用本公开的纤维合成酶制剂的影响甚至更突出。

测量碳水化合物(例如消耗的碳水化合物和/或肠道碳水化合物，例如单糖和/或二糖)和/或纤维(例如消耗的纤维和/或肠道纤维)的各种手段为本领域已知的。然而，本领域技术人员将了解，对肠道(例如人肠道)直接取样并不总是可能的。因此，本领域技术人员将了解，可通过多种不需要对肠道直接取样的体内或离体替代分析来证实纤维合成酶制剂的活性和/或功效。举例来说，从由蔗糖裂解产生的果糖合成纤维可通过葡萄糖的同源释放来测量。在某些实施方案中，将工程化细胞在生长培养基中与蔗糖一起培养，并且可例如通过多种酶分析和/或通过直接高压液相色谱测量对培养基中葡萄糖的量的变化进行定量。其他方法包括检测粪便中的纤维合成酶，例如在肠道中由工程化细胞分泌纤维合成酶的情况下。样品可来源于排泄物或通过侵入性或其他手段获得。测量可溶性纤维产生的另一种方法包括对粪便的色谱和/或NMR分析。这种方法对于很少消耗的纤维(诸如左聚糖)特别有效。微生物组组成本身也可提供对纤维合成酶活性的指示。微生物组组成可常规地通过宏基因组学来测量。来自高纤维饮食的与简单糖失调相关的菌株的数目或比率降低和/或与健康肠道功能相关的菌株增加证实了治疗功效。

在各种实施方案中，纤维合成酶制剂以治疗有效量施用和/或递送治疗有效量的纤维合成酶。在各种实施方案中，分离的纤维合成酶以治疗有效量(例如治疗有效数目的细胞)施用和/或递送治疗有效量的纤维合成酶。在各种实施方案中，工程化细胞以治疗有效量(例如治疗有效数目的细胞)施用和/或递送治疗有效量的纤维合成酶。在各种实施方案中，工程化细胞为非定殖细胞。在各种实施方案中，工程化细胞为芽孢形成细胞。在各种实施方案中，在向受试者施用之后，工程化细胞在受试者的肠道(例如人受试者的肠道)中萌发。在各种实施方案中，向受试者施用的工程化细胞在受试者的肠道中瞬时萌发。在各种实施方案中，向受试者施用的工程化细胞在受试者的肠道中分泌纤维合成酶。在各种实施方案中，可在受试者的肠道中检测单次施用剂量的纤维合成酶制剂的工程化细胞、由单次施用剂量的纤维合成酶制剂的工程化细胞产生的纤维合成酶和/或由单次施用剂量的纤维合成酶制剂递送的分离的纤维合成酶，例如持续至少6小时的时间(例如至少6、12、18、24、48或72小时，例如持续下限为6、12、18或24小时并且上限为12、24、48、72、96或120小时的时间段)。

在各种实施方案中，在受试者消耗食物之前(例如之前至多1、2、3、4、5、6、12、24或48小时)、期间或之后(例如之后至多1、2、3、4、5、6、12、24或48小时)，向受试者施用本公开纤维合成酶制剂，任选地其中食物包括碳水化合物(例如单糖和/或二糖，例如蔗糖)。在各种实施方案中，本公开纤维合成酶制剂以一种给药方案施用，例如其中为个体施用单一日剂量、多个日剂量(例如两个或三个日剂量)或一个剂量持续一定天数的各个时间，例如1、2、3、4、5、6或7天。为使消费者能够成功使用此技术，非常希望限制补充剂使用者所需的施用事件的次数。本发明人已经确定，消费者更喜欢每天使用一片，并且除了别的以外，特别喜欢每餐使用一片或其他形式的施用。这部分是由实现隐私驱动的，其中可在任何情况下享用饮食而不会引起对使用补充剂的注意。在一个实施方案中，通过在枯草芽孢杆菌中递送活性酶来实现单个剂量的功效，所述枯草芽孢杆菌以不同于配制的补充剂的方式穿过肠道。

本公开包括以下认识，在各种实施方案中，本公开的组合物穿过受试者胃肠道的预期时间长于典型食物穿过受试者胃肠道的预期时间(这在本文中可称为缓慢穿过)可为有益的。缓慢穿过的一个益处是单次施用本文所提供的组合物可在受试者中表达本公开的酶持续包括多餐的时间和/或至少3小时的时间(例如至少3、6、9、12、18或24小时，例如至少3至6小时、3至9小时、3至12小时、3至18小时、3至24小时、6至9小时、6至12小时、6至18小时、6至24小时、12至18小时或12至24小时的时间)。在各种实施方案中，缓慢穿过可为瞬时附着于肠内衬的组合物的特征。本领域技术人员将了解，相比之下，所递送(例如使用各种缓慢释放制剂)的纯化的酶以与消化物相同的速率穿过肠，并且因此通常必须考虑需要何种治疗作用与所摄取的食物一起施用或在与所摄取的食物大致相同的时间施用。

本公开包括以下认识，在各种实施方案中，本公开的组合物在没有显著损失细胞(例如细胞存活)或细胞存活力(例如萌发和/或增殖的能力)的情况下穿过受试者的胃可为有益的。在各种实施方案中，细胞或细胞活力的损失小于50％，例如小于50％、40％、30％、20％、10％、5％、4％、3％、2％或1％。本公开包括以下认识，在各种实施方案中，本公开的组合物在没有显著损失分离的纤维合成酶的活性的情况下穿过受试者的胃可为有益的。在各种实施方案中，纤维合成酶活性的损失小于50％，例如小于50％、40％、30％、20％、10％、5％、4％、3％、2％或1％。

本公开包括以下认识，在各种实施方案中，本公开的组合物在有限的时间范围(肠道停留时间)内穿过肠道可为有益的。包括保护层的剂可经历随肠道活性而变化的穿过时间，所述穿过时间例如可根据受试者的饮食行为和消耗的内容物而增加或减少。定殖于肠道的剂可提供所表达的转基因产物的长期递送，但定殖细菌的延长停留可为细菌中的突变(例如降低转基因表达的突变)留出时间，并且增殖或群体大小可能难以监测、稳定和/或控制。还可随时间推移产生针对定殖细菌的炎性和/或免疫反应。定殖还可通过在施用本公开的剂之前引起存在于微生物组中的相似菌株的损失来影响微生物组相对于其他微生物的组成。与定殖相关的延长的停留还可揭示意想不到的特征，诸如发现由定殖的益生菌大肠杆菌Nissile产生的大肠杆菌毒素(colibactin)的致癌作用，大肠杆菌Nissile是在历史上为供人消耗而开发的一种菌株。在各种实施方案中，本公开的组合物的肠道停留时间为小于10天，例如小于10、9、8、7、6、5、4、3、2或1天。在各种实施方案中，从施用一定剂量的本公开的纤维合成酶制剂到受试者包括与细胞组合物一起施用或来源于细胞组合物的细胞的数目不超过所述剂量中所施用细胞总数目的5％、4％、3％、2％、1％、0.5％、0.1％、0.05％、0.01％、0.005％或0.001％的时间来测量停留时间。在各种实施方案中，以在受试者的例如分离自受试者的粪便的DNA样品中不能检测到所施用的细胞的DNA特征来测量清除率。本领域技术人员由本公开将了解，本公开包括因此与定殖细胞组合物相比，以重复剂量施用细胞组合物可为有利的，例如其中个别剂量具有有限的停留时间，并且可随时间推移使用多个剂量来延长治疗的持续时间。在各种实施方案中，本公开的细胞为缺乏在肠道中存活和/或定殖所需的一种或多种功能的细胞，所述功能包括但不限于依赖氧作为电子受体、对宿主微生物的防御的敏感性、不能参与已建立的微生物组的互养生态系统和/或缺乏针对宿主微生物组菌株的攻击性自我保护。

本领域技术人员将了解，在消耗碳水化合物(例如单糖和/或二糖，例如蔗糖)之前、期间或之后向受试者施用纤维合成酶制剂可降低受试者肠道中单糖和/或二糖的浓度或量，和/或降低受试者的肠吸收果糖的速率或量，和/或降低受试者微生物组细胞加工单糖和/或二糖的速率或量，并且还增加纤维的产生。在一些实施方案中，对于纤维合成酶用作底物的每一重量或摩尔单位的果糖来说，可产生相等重量或摩尔单位的纤维，从而产生肠道可溶性纤维的浓度或量增加所带来的相称的有益健康效果。

在各种实施方案中，施用需要的纤维合成酶制剂可治疗与碳水化合物(例如单糖和/或二糖)消耗相关或由碳水化合物消耗引起的疾患，例如高血压、心脏病、肥胖症、糖尿病、高血糖以及其他健康问题。在各种实施方案中，向有需要的受试者施用本公开的纤维合成酶制剂可治疗与低可溶性纤维消耗相关或由低可溶性纤维消耗引起的疾患，例如高血胆固醇、心脏病、肥胖症、糖尿病、高血糖以及其他健康问题。在各种实施方案中，向有需要的受试者施用本公开的纤维合成酶制剂可提供与可溶性纤维消耗相关的健康益处，包括但不限于降低高血胆固醇、心脏病、肥胖症、糖尿病、高血糖以及其他健康问题的风险。在各种实施方案中，向有需要的受试者本公开的施用纤维合成酶制剂以治疗失调。

在各种实施方案中，向有需要的受试者施用纤维合成酶制剂，其中受试者患有与碳水化合物(例如单糖和/或二糖)消耗相关或由碳水化合物消耗引起、由低可溶性纤维消耗引起或可通过可溶性纤维消耗预防的疾患中的一者或多者、已被诊断为患有所述疾患中的一者或多者或为处于发展所述疾患中的一者或多者的风险中，例如其中所述疾患选自高血压、心脏病、肥胖症、糖尿病、高血糖以及其他健康问题。

在各种实施方案中，向受试者施用纤维合成酶制剂以进行体重管理，例如用于限定饮食和/或用于治疗肥胖症。在各种实施方案中，受试者为过重的或肥胖的。在各种实施方案中，肥胖症是指身体质量指数等于或大于30的疾患。在各种疾患中，过重是指身体质量指数等于或大于25的疾患。本领域技术人员将了解，本公开的纤维合成酶制剂还可由既不过重也不肥胖的个体(身体质量指数低于25)出于体重管理的目的或出于本文所提供的任何其他目的(例如为了肠道健康)而使用。

在各种实施方案中，向前24小时已消耗的碳水化合物的量(例如总碳水化合物或单糖和/或二糖的量)等于或大于约45g(例如至少约45g、50g、55g、60g、65g、70g、80g、85g、90g、95g、100g、105g、110g、115g、120g、125g、130g、135g、140g、145g、150g、155g、160g、165g、170g、175g、180g、185g、190g、195g、200g或更多)的受试者施用纤维合成酶制剂。在各种实施方案中，向前24小时已消耗的纤维的量等于或小于约50g(例如小于约50g、45g、40g、35g、30g、25g、20g、15g、10g、5g或1g)的受试者施用纤维合成酶制剂。在各种实施方案中，向前24小时已消耗的可溶性纤维的量等于或小于约20g(例如小于约20g、15g、10g、9g、8g、7g、6g、5g、4g、3g、2g或1g)的受试者施用纤维合成酶制剂。

在各种实施方案中，向在前5天或更多天(例如5、7、10、14、28、42、50、100、150、200、250、300、350或365天)的至少约10％(例如至少约10％、20％、30％、40％、50％、60％、70％、80％、90％或100％)的时间内已消耗的碳水化合物的量(例如总碳水化合物或单糖和/或二糖的量)等于或大于约45g(例如至少约45g、50g、55g、60g、65g、70g、80g、85g、90g、95g、100g、105g、110g、115g、120g、125g、130g、135g、140g、145g、150g、155g、160g、165g、170g、175g、180g、185g、190g、195g、200g或更多)的受试者施用纤维合成酶制剂。在各种实施方案中，向在前5天或更多天(例如5、7、10、14、28、42、50、100、150、200、250、300、350或365天)的至少约10％(例如至少约10％、20％、30％、40％、50％、60％、70％、80％、90％或100％)的时间内已消耗的纤维的量等于或小于约50g(例如小于约50g、45g、40g、35g、30g、25g、20g、15g、10g、5g或1g)的受试者施用纤维合成酶制剂。在各种实施方案中，向在前5天或更多天(例如5、7、10、14、28、42、50、100、150、200、250、300、350或365天)的至少约10％(例如至少约10％、20％、30％、40％、50％、60％、70％、80％、90％或100％)的时间内已消耗的可溶性纤维的量等于或小于约20g(例如小于约20g、15g、10g、9g、8g、7g、6g、5g、4g、3g、2g或1g)的受试者施用纤维合成酶制剂。

在各种实施方案中，向受试者施用纤维合成酶制剂，所述受试者为人。在各种实施方案中，向受试者施用纤维合成酶制剂，所述受试者为动物，例如家养动物(例如猫、狗或其他家畜)、家畜(例如马、奶牛、绵羊、山羊、猪或其他家畜家畜)或动物园动物(例如非人灵长类动物、大象、河马、犀牛、熊或其他动物园动物)。

在各种实施方案中，与直接消耗纤维相比，通过施用纤维合成酶制剂实现治疗为有利的。举例来说，直接消耗纤维不能防止结肠中纯化糖过多。另外，单个日剂量的纤维仅介导一次大剂量穿过消化道，并且可能不影响全天消耗的其他含糖食物部分。大剂量的纤维还具有对食物来说异常的物理化学和生物化学性质，从而导致渗透压变化和细菌大量生长，并且具有相关的负面体验。快速摄取大量纤维会促进肠气、腹胀以及痉挛。据本发明人所知，还未曾尝试在消耗后在被肠或微生物组吸收之前减少糖。就本发明人所知，也没有适合的技术来历时例如12或24小时或更长的时间持续递送治疗有效量的可溶性纤维。

本公开包括以下发现，本文所公开的对各种挑战的解决方案是通过使用活性工程化细胞作为递送载体来解决的。在各种实施方案中，工程化细胞暂时附着于和/或停留在肠壁内衬的粘液层内。粘液层与穿过的消化物接近允许工程化细胞和/或纤维合成酶与穿过的消化物快速相互作用。已知工程化细菌芽孢和其他活细胞历经大于9小时的时间通过肠，这允许工程化细胞和/或由此产生的纤维合成酶与多次饮食(例如在9小时的时间内消耗两餐)相互作用。细菌芽孢极其稳健，被证实能够在胃部环境中完整存活。在特定实施方案中，我们还能够鉴定在肠环境中有活性但不长期定殖于肠的微生物芽孢形成剂。这种微生物(枯草芽孢杆菌)作为大豆发酵产生食物纳豆中的活性试剂在食物中被消耗有着悠久的历史，并且被认为是食品安全的。由于至少这些原因，施用本公开的工程化细胞可提供比摄取纯化酶更持久的持续活性。本公开的工程化细胞(例如芽孢)可安全地穿过胃，并且随后在肠中表达纤维合成酶。我们确定了枯草芽孢杆菌为优选的候选工程化细胞，至少部分是因为当向受试者施用时，它被粘膜捕获(粘性球模型)。因此，枯草芽孢杆菌为食品安全、非定殖(正交于微生物组)并且形成芽孢的递送载体的有限集合的示例。

参考文献

Davis，L.M.G.，I.Martinez，J.Walter，and R.Hutkins.2010.“A Dose DependentImpact of Prebiotic Galactooligosaccharides on the Intestinal Microbiota ofHealthy Adults.”International.Journal of Food Microbiology 144(2)：285-92.

Desai，Mahesh S.，Anna M.Seekatz，Nicole M.Koropatkin，Nobuhiko Kamada，Christina A.Hickey，Mathis Wolter，Nicholas A.Pudlo，et al.2016.“A DietaryFiber-Deprived Gut Microbiota Degrades the Colonic Mucus Banier and EnhancesPathogen Susceptibility.”Cell 167(5)：1339-53.e21.

Dong，Yutong，Li Chen，Bemard Gutin，and Haidong Zhu.2019.“Total，Insoluble，and Soluble Dietary Fiber Intake and Insulin Resistance and BloodPressure in Adolescents.”European Journal of Clinical Nutrition 73(8)：1172-78.

Earle，Kristen A.，Gabriel Billings，Michael Sigal，Joshua S.Lichtman，Gunnar C.Hansson，JoshuaE.Elias，Manuel R.Amieva，Kerwyn Casey Huang，and JustinL.Sonnenburg.2015.“Quantitative Imaging of Gut Microbiota SpatialOrganization.”Cell Host &Microbe18(4)：478-88

Kim，H.J.，M.Camilleri，S.McKinzie，M.B.Lempke，D.D.Burton，G.M.Thomforde，and A.R.Zinsmeister.2003.“A Randomized Controlled Trial of a Probiotic，VSL#3，on Gut Transit and Symptomsin Diarrhoea-Predominant Irritable BowelSyndrome.”Alimentary Pharmacology &Therapetttics 17(7)：895-904.

Marlett，J.A.，and T.F.Cheung.1997.“Database and Quick Methods ofAssessing Typical Dietary Fiber Intakes Using Data for 228 Commonly ConsumedFoods.”Journal of the American Dieteftc Association 97(10)：1139-48，1151；quiz1149-50.

Parnell，Winsome，Noela Wilson，Donnell Alexander，Mark Wohlers，MicallaWilliden，Joel Mann，andAndrewGray.2008.“Exploring the Relationship betweenSugars and Obesity.”Public Health Nutrition 11(8)：860-66.

Schmidt，Kristin，PhilipJ.Cowen，CatherineJ.Harmer，George Tzortzis，StevenErrington，and PhilipW.J.Bumet.2015.“Prebiotic Intake Reduces the WakingCortisol Response and Alters Emotional Bias in Healthy Volunteers.”Psychopharmacology 232(10)：1793-1801.

Townsend，Guy E.，2nd，Weiwei Han，Nathan D.Schwalm 3rd，Varsha Raghavan，Natasha A.Barry，Andrew L.Goodman，and Eduardo A.Groisman.2019.“Dietary SugarSilences a Colonization Factor in a Mammalian Gut Symbiont.”Proceedings ofthe National Acadeny of Sciences of the United States of America 116(1)：233-38.

Wei，Q.，C.Wolf-Hall，and K.C.Chang.2001.“Natto Characteristics asAffected by Steaming Time，Bacillus Strain，and Fermentation Time.”Journal ofFood Science 66(1)：167-73.

实施例

本实施例部分展示了编码纤维合成酶的转基因的构建。本实施例部分还展示了包括并且表达编码纤维合成酶的转基因的工程化细胞的产生。如本领域技术人员将了解，本公开的工程化细胞适合于向包括人受试者的受试者施用，并且表达纤维合成酶。因此，本实施例部分说明了代表本文所公开的组合物并且适合于本文所提供的各种应用的工程化细胞，所述应用包括但不限于包括向人受试者施用的应用。

实施例1：表达用于从碳水化合物底物合成可溶性纤维的酶的工程化细胞的构建和实验验证

构建转基因以表达纤维合成酶。使用分子生物学的标准技术产生转基因。转基因包括编码纤维合成酶的核酸序列，所述核酸序列包括分泌多肽。本实施例利用SacB左聚糖蔗糖酶。编码纤维合成酶的核酸来源于纳豆枯草芽孢杆菌SacB并且具有以下序列，其中分泌多肽编码序列为粗体并且加下划线：

蛋白质产物SacB具有以下氨基酸序列，其中分泌多肽序列为粗体并且加下划线：

编码来源于纳豆枯草芽孢杆菌的纤维合成酶的核酸序列与编码分泌多肽的核酸序列可操作地连接，使得所编码的纤维合成酶为包括分泌多肽的融合多肽。分析编码融合多肽的核酸序列的二级结构，至少部分是因为显著二级结构可引起翻译终止和不良表达。对核酸序列中的二级结构有显著贡献的碱基对通过核酸序列的沉默修饰(例如核酸序列的非编码和/或同义修饰)而被修饰，从而降低对二级结构的贡献。

将编码纤维合成酶的核酸序列转化至枯草芽孢杆菌PY79细胞中，并且通过同源重组在枯草芽孢杆菌PY79基因组的hag基因座处可操作地连接至hag启动子，并且如US 16/048,147(公开为US 2019/0076489)和PCT/US 18/50957(公开为WO 2019/055707)中所描述，通过同源整合在启动子序列中添加修饰突变，所述专利以全文引用的方式并且关于其中所公开的调控序列和系统并入本文中。

通过以下分析测量纤维合成酶活性。因为左聚糖蔗糖酶裂解蔗糖释放葡萄糖，所以葡萄糖的累积提供了纤维合成酶活性的量度。葡萄糖的累积与蔗糖的裂解和果寡糖的形成成正比。各种葡萄糖测定仪为本领域已知的，并且可经过标准化以测量细菌培养基中的葡萄糖浓度。将本实施例的工程化细菌与确定浓度的蔗糖一起在培养基中培养。在培养规定时间之后，通过离心(21xg，2分钟)使细菌形成球粒，并且使剩余的上清液与葡萄糖测定仪测试条接触。图1中示出了左聚糖产量(随时间推移每分升的毫克数)。

对照证实，在分析中未发生显著葡萄糖消耗，这与归因于细胞生长的葡萄糖消耗将小于可用葡萄糖的0.1％的预期一致。其他对照证实，向收集的上清液中添加蔗糖酶以完全裂解剩余的蔗糖使得葡萄糖的最终产量等于蔗糖的起始量。

通过向收集的上清液中添加木糖异构酶证实了果糖聚合物的形成。木糖异构酶可将葡萄糖转化为果糖，并且木糖异构酶的添加使游离的未聚合的果糖与游离的葡萄糖平衡。如果已经形成了果寡糖纤维，那么游离的未聚合的果糖的水平将显著低于葡萄糖，使得木糖异构酶将催化葡萄糖转化为果糖，从而使得上清液的葡萄糖水平下降。如果未形成果寡糖，那么游离的未聚合的果糖的水平将与葡萄糖的水平类似或更高，在这种情况下，木糖异构酶将不催化葡萄糖转化为果糖，并且葡萄糖的水平将升高或保持不变。结果表明木糖异构酶的添加催化葡萄糖转化为果糖，从而引起上清液中葡萄糖水平下降，指示果寡糖纤维形成。本领域技术人员将了解，多种替代方法可容易地用于定量葡萄糖、果糖、果寡糖等(例如其量和/或浓度)，包括但不限于HPLC和HPAEC。为了证实左聚糖是由ZB423产生，将所述菌株在生产培养基(每升水：2.5g酵母提取物、1.5g NH4SO4、7.2g K2HPO4、0.2g MgSO4·7H2O以及200g蔗糖)中培养72小时。然后使细胞培养物形成球粒以去除细胞并且将冷乙醇(1:1.5)添加至上清液中。观察到白色沉淀，通过离心收集，并且通过两次重复溶解于水中并且在冷乙醇中沉淀随后离心收集球粒来进一步纯化。在分析前，将球粒在真空下干燥24小时，干燥后变得透明、硬且脆。未工程化以表达SacB的枯草芽孢杆菌PY79的菌株未从上清液产生沉淀或球粒并且不能分析。通过高效阴离子交换色谱(HPAEC)[图3]对球粒进行分析以确认聚合程度，并且通过1H-NMR[图4]、13C-NMR[图5]以及HSQC-NMR[图6]分析以确认聚合物的结构为左聚糖。13C-NMR化学位移与文献中先前测量的化学位移的比较表明，它们与左聚糖的已知值密切相关[图7]。

在LB培养基中分析工程化细胞分泌纤维合成酶的情况。将工程化细胞培养18小时，此后将蔗糖添加至培养基中，并且如上文所描述定期测量葡萄糖累积。另外，上清液的凝胶显示上清液中而不是细胞级分中有正确尺寸的蛋白质。结果在图2中示出。

本实施例证实，来源于枯草芽孢杆菌纳豆亚种的F1-sacB的编码纤维合成酶的转基因表达高度活性纤维合成酶。

本公开还包括以下认识，来源于纳豆枯草芽孢杆菌的左聚糖蔗糖酶(SacB)具有证实SacB在肠道中表达的功效的某些示例性性质。sacB的左聚糖蔗糖酶活性的最佳pH值范围为6-7，这与小肠相匹配。SacB酶为天然分泌的，并且因此在工程化细胞外为稳定的，便于通过革兰氏阳性细胞被膜分泌。

实施例2：用于增加转基因整合的效率的工程化细胞

本实施例证实了对靶细胞进行工程化以增加用包括编码纤维合成酶的核酸序列的转基因转化靶细胞的效率，其中编码纤维合成酶的核酸序列与靶细胞类型的内源序列具有至少80％的同一性。本实施例特别提供了编码F1-SacB的如实施例1所述的转基因，以及为枯草芽孢杆菌PY79细胞的靶细胞。转基因侧接约800bp的同源区(通常称为“同源臂”)，所述同源区被设计成靶向转基因以通过同源重组整合至枯草芽孢杆菌PY79 hag基因座处。转基因包括与枯草芽孢杆菌PY79 sacB基因具有显著(大于80％)同一性的约1400bp的序列。由于转基因与内源性sacB基因之间的1400bp区域具有显著同一性，所以转基因与内源性sacB基因之间的同源重组可以同源臂与内源性hag基因座之间的同源重组来完成。由于尺寸大，1400bp区域可能比期望的同源臂更可能与内源性基因组重组。为了减少和/或消除转基因与内源性SacB基因之间的重组，使用标准分子生物学技术通过缺失敲除内源性sacB基因的相应序列。

实施例3：用于组成性表达纤维合成酶的工程化细胞

虽然本领域技术人员将了解，已知多种启动子中的任一者均引起可操作地连接的编码序列的组成性表达，但本实施例提供了经过工程化以组成性表达转基因编码的纤维合成酶的细胞的示例性展示。本实施例包括转基因，所述转基因包括可操作地连接至编码纤维合成酶的核酸序列的鞭毛蛋白基因启动子。许多细菌具有鞭毛蛋白基因同源物。鞭毛蛋白基因有许多名称，其中一些实例为：枯草芽孢杆菌中的hag；大肠杆菌、苏云金芽孢杆菌(Bacillus thuringiensis)以及若干乳杆菌种中的fliC；以及军团菌(Legionella)种、弧菌(Vibrio)种以及弯曲杆菌(Campylobacter)种中的flaA或flaB/C/D/E/F/等。公开了包括可操作地连接至编码纤维合成酶的核酸序列的hag启动子的各种实施方案，并且举例说明了至少一个其代表性实施方案。US 16/048,147(公开为US 2019/0076489)和PCT/US 18/50957(公开为WO 2019/055707)的公开内容以全文引用的方式并且关于其中公开的调控序列和系统并入本文中。本领域技术人员将了解，本文所公开的鞭毛蛋白基因表达系统仅仅是可用于表达(例如组成性表达)细菌中的编码序列的许多表达系统之一，并且本文所公开的鞭毛蛋白系统是基于可获得的试剂为实验方便而使用。

在本实施例中，使枯草芽孢杆菌的鞭毛调控机制适合于实现纤维合成酶左聚糖蔗糖酶的组成性和稳健性表达。各种细菌(包括枯草芽孢杆菌)至少部分通过涉及若干正向和负向调控剂的复杂系统调控运动性。本实施例的组成性表达策略包括去除高度表达的枯草芽孢杆菌鞭毛蛋白基因(称为hag)的负向调控剂。

编码枯草芽孢杆菌鞭毛蛋白的鞭毛亚单位的基因为hag，并且其编码的蛋白质在合适的条件下在单个细菌中使用稳健的转录启动子与核糖体结合位点以成千上万的拷贝表达。转录由σ因子SigD介导，SigD受到FlgM蛋白的抑制。flgM表达的失活(例如通过缺失或突变)极大地增强了SigD的组成性表达和活性，并且因此导致鞭毛操纵子和特别是hag基因的更高和更多的组成性转录。由hag基因产生的转录物的翻译是通过高度稳健的核糖体结合位点实现的，所述核糖体结合位点被称为CsrA的蛋白转录后结合并且抑制。然而，CsrA结合位点中的单点突变消除其结合并且使得Hag蛋白的组成性翻译增加。

使用flgM基因失活与在CsrA结合位点中进行单点突变的组合可在枯草芽孢杆菌生命周期中实现极高水平的Hag蛋白组成性表达。类似地，如果用编码所关注的蛋白质的异源基因替换hag基因，那么所述基因可以高水平组成性转录和翻译。因此，用编码纤维合成酶的基因替换hag基因、使flgM基因的表达失活以及在hag启动子的CsrA结合位点处引入单点突变可引起纤维合成酶在枯草芽孢杆菌中的稳健性和组成性表达。

因此，在本文所提供的某些实施方案中，细菌包括CsrA结合位点中的点突变与使flgM表达失活的突变的组合。通过形成这两种突变，来自任何基于SigD的或鞭毛蛋白启动子系统的组成性表达增加。不希望受任何特定科学理论的限制，据信CsrA结合位点的突变不同于CsrA的简单缺失，因为CsrA在许多细菌菌种中为多能调控剂，并且其缺失可能对细胞具有许多其他潜在的不希望的表型效应。通过仅在结合位点中形成点突变，所述突变特异性地和/或唯一地降低或阻碍hag启动子的CsrA抑制，而不是从它可能具有的任何其他靶标中去除CsrA抑制。

本文所公开的某些核酸因此包括包含鞭毛蛋白基因转录调控序列(例如鞭毛蛋白基因启动子，例如hag启动子)的转基因，所述鞭毛蛋白基因转录调控序列与编码纤维合成酶的异源核酸序列可操作地连接。在某些实施方案中，hag启动子包含基因改变，使得在mRNA从hag启动子转录后，与具有野生型或规范CsrA结合位点的参考相比，CsrA对mRNA翻译的抑制被降低或抑制。

在某些实施方案中，鞭毛蛋白基因启动子为hag基因启动子。鞭毛蛋白同源物为芽孢杆菌属(例如枯草芽孢杆菌)中的hag。在另一实施方案中，鞭毛蛋白基因启动子对其中要表达受试者蛋白质的细胞来说为天然的。举例来说，当表达构建体位于细菌染色体中时可以是这种情况。

如本文所用，术语“Hag”(或“hag”或“hag”)可指标注为枯草芽孢杆菌中的“Hag”的蛋白质(或编码此类蛋白质的基因)或相同属、种或株或其他属、种或株中的任何同源物，其为用于组装鞭毛的结构亚单位，在属类上还更多被称为“鞭毛蛋白”。在其他属、种以及株中它有若干其他名称。枯草芽孢杆菌Hag由以下序列编码：

atgagaattaaccacaatattgcagcgcttaacacactgaaccgtttgtcttcaaacaacagtgcgagccaaaagaacatggagaaactttcttcaggtcttcgcatcaaccgtgcgggagatgacgcagcaggtcttgcgatctctgaaaaaatgagaggacaaatcagaggtcttgaaatggcttctaaaaactctcaagacggaatctctcttatccaaacagctgagggtgcattaactgaaactcatgcgatccttcaacgtgttcgtgagctagttgttcaagctggaaacactggaactcaggacaaagcaactgatttgcaatctattcaagatgaaatttcagctttaacagatgaaatcgatggtatttcaaatcgtacagaattcaatggtaagaaattgctcgatggcacttacaaagttgacacagctactcctgcaaatcaaaagaacttggtattccaaatcggagcaaatgctacacagcaaatctctgtaaatattgaggatatgggtgctgacgctcttggaattaaagaagctgatggttcaattgcagctcttcattcagttaatgatcttgacgtaacaaaattcgcagataatgcagcagatactgctgatatcggtttcgatgctcaattgaaagttgttgatgaagcgatcaaccaagtttcttctcaacgtgctaagcttggtgcggtacaaaatcgtctagagcacacaattaacaacttaagcgcttctggtgaaaacttgacagctgctgagtctcgtatccgtgacgttgacatggctaaagagatgagcgaattcacaaagaacaacattctttctcaggcttctcaagctatgcttgctcaagcaaaccaacagccgcaaaacgtacttcaattattacgttaa(SEQ ID NO:22)。

如本文所用，术语“hag启动子”是指来自芽孢杆菌属的天然存在的鞭毛蛋白基因启动子同源物以及具有与其基本上同一(例如至少80％，例如80％、85％、90％、95％、96％、97％、98％、99％或100％同一)或与其特异性杂交的序列的启动子。在枯草芽孢杆菌中，hag启动子包含在hag基因的起始密码子的273碱基对序列5′中，具有以下核酸序列： (SEQ ID NO:23)(其中“ATG”表示hag的起始密码子)。以TTAA(加下划线)开始直至起始密码子ATG的粗体序列足以促进可操作地连接的编码序列的表达。

特别地，hag启动子包括SigD识别序列，所述SigD识别序列由以下序列定义：“ttaa”序列(加下划线)，其为-35SigD RNA聚合酶结合位点；以及“tccgatat”序列(加下划线)，其为-10SigD RNA聚合酶结合位点。此外，hag具有两个CsrA结合位点，所述两个CsrA结合位点由以下序列定义：“gcacaaggacgt”(SEQ ID NO：24)(高亲和力结合位点1，或“BS1”)(加下划线)以及“attcagggaggaa”(SEQ ID NO：25)(低亲和力结合位点2，或“BS2”)(加下划线)。hag启动子还包括夏因-达尔加诺序列：agggagga(SEQ ID NO:26)。

如本文所用，术语“CsrA”(“碳储存调控剂A”)是指标注为枯草芽孢杆菌中的“CsrA”的蛋白质(或编码此类蛋白质的基因)，或另一属或种中的任何同源物或异种同源物或相同种中的旁系同源物。在一些种中，CsrA同源地称为RsmA。CsrA蛋白结合至环中具有共有序列AGGA的茎环RNA基序，从而抑制合并至包含共有序列的mRNA中的核酸序列翻译成多肽。CsrA可直接地通过结合至RNA并且阻止翻译或间接地通过结合至编码以其他方式调控鞭毛表达的蛋白质的另一RNA抑制从hag启动子转录的mRNA的表达。CsrA在枯草芽孢杆菌中由以下序列编码：atgctagttttatcgcggaaaataaacgaagcgattcaaataggt gctgatattgaagtaaaagtgattgcggttgaaggggatcaagtgaagcttggaattgacgccccaaagc atattgatattcacaggaaagaaatttacttgaccattcaggaagaaaataaccgtgcagcagcgttatcc agcgatgtgatctccgcattatcctcacaaaaaaagtga(SEQ ID NO:27)。

在某些实施方案中，本公开的转基因包括在鞭毛蛋白基因启动子中的基因修饰，所述基因修饰在从启动子转录至转录物(诸如mRNA)中后，降低和/或抑制CsrA对mRNA翻译的抑制。本公开涵盖对鞭毛蛋白基因启动子并且特别是对hag启动子的若干基因修饰，以降低和/或抑制CsrA对mRNA翻译的抑制。在一些实施方案中，用于抑制CsrA对翻译的抑制的对hag的基因修饰可包含BS1或BS2中的任一者或两者的茎和环结构的改变。在一些实施方案中，基因修饰为一个或多个核苷酸的插入或缺失。基因修饰可包括对CsrA BS1(结合位点1P的一个或多个点突变。可通过改变CsrA识别序列AGGA中的一个或多个(例如两个、三个或四个)核苷酸来对BS1进行修饰。举例来说，可将BS1的AGGA结合基序修饰为AGAA。或者，基因修饰可包括12碱基对BS1结合位点中或形成BS1的茎环二级结构的茎的核苷酸的任一侧的周围碱基中的一个或多个突变。这包括例如对BS1结合位点gcacaaggacgt(SEQ ID NO:24)的一个或多个核苷酸(例如至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少11个或至少12个核苷酸)的修饰。或者，基因修饰可通过消除允许氢键合的互补性破坏BS1的茎和环结构。可使得此类改变为参与氢键合的序列(SEQ ID NO:28)中的一个或多个突变，例如以消除一个、两个、三个、四个或更多个氢键对。在一个实施方案中，经过修饰的BS1具有核苷酸序列GCACAAGAACGT(SEQ ID NO:29)。基因修饰还可包括或替代地包括对CsrA BS2(结合位点2)的一个或多个点突变。这包括例如13碱基对BS2结合位点或形成BS2的茎环二级结构的茎的结合位点的任一侧的周围碱基中的一个或多个核苷酸(例如至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个或至少13个核苷酸)的修饰。或者，基因修饰可通过消除允许氢键合的互补性破坏BS2的茎和环结构。举例来说，经过修饰的BS2可具有核苷酸序列ATTTAGGGAGGAA(SEQ ID NO:30)。在某些实施方案中，修饰不包括夏因-达尔加诺序列agggagga(SEQ ID NO:26)中的核苷酸的改变。

将认识到，虽然抑制CsrA结合，但基因修饰仍被选择以允许mRNA保留核糖体结合活性并且容许翻译。

σ因子(诸如SigD)和其同源物起始鞭毛蛋白合成。FlgM和其同源物充当σ因子活性的抑制子。本公开提供了通过破坏σ因子抑制子(诸如FlgM)的表达和/或活性(例如使其失活)来去除对σ因子活性的抑制。

如本文所用，术语“FlgM”可指标注为枯草芽孢杆菌中的“FlgM”的蛋白质(或编码此类蛋白质的基因)或另一属或种中的任何同源物，其抑制负责将RNA聚合酶招募至晚期鞭毛基因以便进行转录的σ因子。此受到抑制的σ因子被称为枯草芽孢杆菌中的SigD、大肠杆菌中的FliA或可能其他名称，诸如其他属和种中的σ28，其中所述σ因子具有同源物。在枯草芽孢杆菌中FlgM由以下序列定义：atgaaaatcaatcaatttggaacacaatccgttaatccatatcaaaaaaattatgataagcaagcggtgcaaaaaactgttgcacaacctcaagataaaattgaaatttcatcacaggctaaagaaatgcaacatgcatccgacgcagtcactggttcacgacaggaaaaaattgcgcagcttaaagcgcaaattgaaaacgggtcatacaaagtagacgcaaatcatattgcgaaaaatatgattaatttttataaaaagcaataa(SEQ IDNO:31)。

如本文所用，术语“SigD”可指枯草芽孢杆菌中尤其负责将RNA聚合酶招募至晚期鞭毛基因以便进行转录的σ因子(或编码它的基因)。此外，“SigD”是指其他种中的同源物，诸如大肠杆菌中的FliA，或更广泛地指示若干种中的σ-28。在枯草芽孢杆菌中SigD由以下序列定义：

atgcaatccttgaattatgaagatcaggtgctttggacgcgctggaaagagtggaaagatcctaaagccggtgacgacttaatgcgccgttacatgccgcttgtcacatatcatgtaggcagaatttctgtcggactgccgaaatcagtgcataaagacgatcttatgagccttggtatgcttggtttatatgatgcccttgaaaaatttgaccccagccgggacttaaaatttgatacctacgcctcgtttagaattcgcggcgcaatcatagacgggcttcgtaaagaagattggctgcccagaacctcgcgcgaaaaaacaaaaaaggttgaagcagcaattgaaaagcttgaacagcggtatcttcggaatgtatcgcccgcggaaattgcagaggaactcggaatgacggtacaggatgtcgtgtcaacaatgaatgaaggtttttttgcaaatctgctgtcaattgatgaaaagctccatgatcaagatgacggggaaaacattcaagtcatgatcagagatgacaaaaatgttccgcctgaagaaaagattatgaaggatgaactgattgcacagcttgcggaaaaaattcacgaactctctgaaaaagaacagctggttgtcagtttgttctacaaagaggagttgacactgacagaaatcggacaagtattaaatctttctacgtcccgcatatctcagatccattcaaaggcattatttaaattaaagaatctgctggaaaaagtgatacaataa(SEQ ID NO:32)。

FlgM可经由若干残基结合至SigD，其大部分位于FlgM蛋白C端的第4螺旋。用于失活的靶标将为对应于枯草芽孢杆菌FlgM的I-58、K-62、I-65、G-68、D-73、A-78的第3和第4螺旋中高度保守的残基的突变。更广泛地，可使直接参与结合至SigD(如在PMID：15068809中所鉴定)的26个残基中的任一者或组合发生突变以潜在地产生具有降低的活性或零活性的蛋白质。或者，破坏二级或三级结构(特别是确定二级结构的4个螺旋)的任何突变或突变组合均可潜在地成功降低或减弱FlgM抑制SigD的能力。

在各种实施方案中，细胞包括降低FlgM抑制SigD活性的能力的基因修饰。举例来说，一种此类基因修饰可为FlgM基因的部分或完全缺失以降低或消除其生物活性。部分缺失可包括缺失编码蛋白质C端的至少25％的基因的部分。

其他基因修饰包括例如产生非活性FlgM蛋白或FlgM启动子破坏的移码突变。或者，通过使得FlgM在功能上为非活性或以其他方式抑制其结合至SigD或以其他方式抑制SigD的能力的点突变可使得FlgM为非活性的。间接地，可通过使FlgM对活化剂(诸如ComK或DegU)不敏感或通过使其对抑制子(诸如ScoC)或蛋白酶Epr和Wpr过度敏感来破坏FlgM。

可通过本领域已知的任何方法使编码纤维合成酶的异源核酸序列(诸如转基因)与鞭毛蛋白启动子可操作地连接。举例来说，可使异源核酸序列整合至细菌染色体中。或者，可在引入微生物中的质粒中使异源核酸序列连接至鞭毛蛋白启动子。可如例如PMID：4994568中所描述通过例如同源重组使异源核酸序列靶向hag启动子。另一可用方法涉及转座子技术。转座子可靶向染色体中的特定序列并且在靶基因座处插入连接的核酸序列。各种转座子系统为本领域已知的。

本实施例提供了表达纤维合成酶的工程化细胞，其中细胞为PY79菌株细胞，所述细胞包括flgM的失活缺失(ΔflgM)、内源性SacB的缺失(ΔsacB)以及经过工程化以减少CsrA与转录物的结合的经过修饰的hag启动子(“Pso3”)(Δhag，工程化包括替代地称为“sow3”或“so3”的突变)，所述启动子可操作地连接至编码纤维合成酶的核酸序列，其中编码纤维合成酶的核酸序列具有以下结构：Pso3::编码分泌多肽的核酸序列::编码sacB的核酸序列。分析这些工程化细胞的体外酶活性。发现单位剂量的1E+09个工程化芽孢形成细胞每小时通过蔗糖裂解产生10.4mg的葡萄糖以合并至纤维中。扩展至示例性治疗单位剂量的1E11 CFU的芽孢形成细胞，单个单位剂量的1E11个工程化细胞每小时由蔗糖裂解产生至少1.04g葡萄糖以合并至纤维中，或每天由蔗糖裂解产生至少约25g的葡萄糖以合并至纤维中。这些工程化细胞在反应中产生化学计算量的纤维，并且因此单个单位剂量的1E11个工程化细胞每天合成25g的纤维。

实施例4：用于将乳糖转化为人乳寡糖益菌生纤维的工程化细胞

对基因修饰的枯草芽孢杆菌株进行工程化以表达编码人乳寡糖合成酶的转基因。使用分子生物学的标准技术产生转基因和细菌菌株。各转基因包括编码乳糖降解/寡糖合成酶的核酸序列。具体来说，产生各自包括不同的转基因的四种工程化菌株。所述菌株分别包括根据以下序列信息的用于表达LacZ(大肠杆菌)、YesZ(枯草芽孢杆菌)、GanA(枯草芽孢杆菌)以及LacZ(凝结芽孢杆菌)β-半乳糖苷酶的转基因：

编码LacZ(大肠杆菌)的核酸序列：

atgaccatgattacggattcactggccgtcgttttacaacgtcgtgactgggaaaaccctggcgttacccaacttaatcgccttgcagcacatccccctttcgccagctggcgtaatagcgaagaggcccgcaccgatcgcccttcccaacagttgcgcagcctgaatggcgaatggcgctttgcctggtttccggcaccagaagcggtgccggaaagctggctggagtgcgatcttcctgaggccgatactgtcgtcgtcccctcaaactggcagatgcacggttacgatgcgcccatctacaccaacgtgacctatcccattacggtcaatccgccgtttgttcccacggagaatccgacgggttgttactcgctcacatttaatgttgatgaaagctggctacaggaaggccagacgcgaattatttttgatggcgttaactcggcgtttcatctgtggtgcaacgggcgctgggtcggttacggccaggacagtcgtttgccgtctgaatttgacctgagcgcatttttacgcgccggagaaaaccgcctcgcggtgatggtgctgcgctggagtgacggcagttatctggaagatcaggatatgtggcggatgagcggcattttccgtgacgtctcgttgctgcataaaccgactacacaaatcagcgatttccatgttgccactcgctttaatgatgatttcagccgcgctgtactggaggctgaagttcagatgtgcggcgagttgcgtgactacctacgggtaacagtttctttatggcagggtgaaacgcaggtcgccagcggcaccgcgcctttcggcggtgaaattatcgatgagcgtggtggttatgccgatcgcgtcacactacgtctgaacgtcgaaaacccgaaactgtggagcgccgaaatcccgaatctctatcgtgcggtggttgaactgcacaccgccgacggcacgctgattgaagcagaagcctgcgatgtcggtttccgcgaggtgcggattgaaaatggtctgctgctgctgaacggcaagccgttgctgattcgaggcgttaaccgtcacgagcatcatcctctgcatggtcaggtcatggatgagcagacgatggtgcaggatatcctgctgatgaagcagaacaactttaacgccgtgcgctgttcgcattatccgaaccatccgctgtggtacacgctgtgcgaccgctacggcctgtatgtggtggatgaagccaatattgaaacccacggcatggtgccaatgaatcgtctgaccgatgatccgcgctggctaccggcgatgagcgaacgcgtaacgcgaatggtgcagcgcgatcgtaatcacccgagtgtgatcatctggtcgctggggaatgaatcaggccacggcgctaatcacgacgcgctgtatcgctggatcaaatctgtcgatccttcccgcccggtgcagtatgaaggcggcggagccgacaccacggccaccgatattatttgcccgatgtacgcgcgcgtggatgaagaccagcccttcccggctgtgccgaaatggtccatcaaaaaatggctttcgctacctggagagacgcgcccgctgatcctttgcgaatacgcccacgcgatgggtaacagtcttggcggtttcgctaaatactggcaggcgtttcgtcagtatccccgtttacagggcggcttcgtctgggactgggtggatcagtcgctgattaaatatgatgaaaacggcaacccgtggtcggcttacggcggtgattttggcgatacgccgaacgatcgccagttctgtatgaacggtctggtctttgccgaccgcacgccgcatccagcgctgacggaagcaaaacaccagcagcagtttttccagttccgtttatccgggcaaaccatcgaagtgaccagcgaatacctgttccgtcatagcgataacgagctcctgcactggatggtggcgctggatggtaagccgctggcaagcggtgaagtgcctctggatgtcgctccacaaggtaaacagttgattgaactgcctgaactaccgcagccggagagcgccgggcaactctggctcacagtacgcgtagtgcaaccgaacgcgaccgcatggtcagaagccgggcacatcagcgcctggcagcagtggcgtctggcggaaaacctcagtgtgacgctccccgccgcgtcccacgccatcccgcatctgaccaccagcgaaatggatttttgcatcgagctgggtaataagcgttggcaatttaaccgccagtcaggctttctttcacagatgtggattggcgataaaaaacaactgctgacgccgctgcgcgatcagttcacccgtgcaccgctggataacgacattggcgtaagtgaagcgacccgcattgaccctaacgcctgggtcgaacgctggaaggcggcgggccattaccaggccgaagcagcgttgttgcagtgcacggcagatacacttgctgatgcggtgctgattacgaccgctcacgcgtggcagcatcaggggaaaaccttatttatcagccggaaaacctaccggattgatggtagtggtcaaatggcgattaccgttgatgttgaagtggcgagcgatacaccgcatccggcgcggattggcctgaactgccagctggcgcaggtagcagagcgggtaaactggctcggattagggccgcaagaaaactatcccgaccgccttactgccgcctgttttgaccgctgggatctgccattgtcagacatgtataccccgtacgtcttcccgagcgaaaacggtctgcgctgcgggacgcgcgaattgaattatggcccacaccagtggcgcggcgacttccagttcaacatcagccgctacagtcaacagcaactgatggaaaccagccatcgccatctgctgcacgcggaagaaggcacatggctgaatatcgacggtttccatatggggattggtggcgacgactcctggagcccgtcagtatcggcggaattccagctgagcgccggtcgctaccattaccagttggtctggtgtcaaaaataa.(SEQ ID NO:71)。

LacZ(大肠杆菌)氨基酸序列(由SEQ ID NO:71编码)：

MTMITDSLAVVLQRRDWENPGVTQLNRLAAHPPFASWRNSEEARTDRPSQQLRSLNGEWRFAWFPAPEAVPESWLECDLPEADTVVVPSNWQMHGYDAPIYTNVTYPITVNPPFVPTENPTGCYSLTFNVDESWLQEGQTRIIFDGVNSAFHLWCNGRWVGYGQDSRLPSEFDLSAFLRAGENRLAVMVLRWSDGSYLEDQDMWRMSGIFRDVSLLHKPTTQISDFHVATRFNDDFSRAVLEAEVQMCGELRDYLRVTVSLWQGETQVASGTAPFGGEIIDERGGYADRVTLRLNVENPKLWSAEIPNLYRAVVELHTADGTLIEAEACDVGFREVRIENGLLLLNGKPLLIRGVNRHEHHPLHGQVMDEQTMVQDILLMKQNNFNAVRCSHYPNHPLWYTLCDRYGLYVVDEANIETHGMVPMNRLTDDPRWLPAMSERVTRMVQRDRNHPSVIIWSLGNESGHGANHDALYRWIKSVDPSRPVQYEGGGADTTATDIICPMYARVDEDQPFPAVPKWSIKKWLSLPGETRPLILCEYAHAMGNSLGGFAKYWQAFRQYPRLQGGFVWDWVDQSLIKYDENGNPWSAYGGDFGDTPNDRQFCMNGLVFADRTPHPALTEAKHQQQFFQFRLSGQTIEVTSEYLFRHSDNELLHWMVALDGKPLASGEVPLDVAPQGKQLIELPELPQPESAGQLWLTVRVVQPNATAWSEAGHISAWQQWRLAENLSVTLPAASHAIPHLTTSEMDFCIELGNKRWQFNRQSGFLSQMWIGDKKQLLTPLRDQFTRAPLDNDIGVSEATRIDPNAWVERWKAAGHYQAEAALLQCTADTLADAVLITTAHAWQHQGKTLFISRKTYRIDGSGQMAITVDVEVASDTPHPARIGLNCQLAQVAERVNWLGLGPQENYPDRLTAACFDRWDLPLSDMYTPYVFPSENGLRCGTRELNYGPHQWRGDFQFNISRYSQQQLMETSHRHLLHAEEGTWLNIDGFHMGIGGDDSWSPSVSAEFQLSAGRYHYQLVWCQK*(SEQ ID NO:#72)。

编码YesZ(枯草芽孢杆菌)的核酸序列：

atgagaaaactgtatcatggcgcttgctattatccggaattatgggatgaagagacgattcagcaggacattgacatcatgcgtgaagttggcgtaaatgttgtgcggatcggcgaatttgcctggtcagtcatggaacctgaagaaggaaaaattgacgtcggttttttcaaagaaatcatcgcccggctgtatgatagcgggatcgaaacgattatgtgcacgccgacgcctaccccgccgatttggttctcacatggccggcccgaacgcatgcatgccaatgaaaaaagagagatcatggggcatggctcccgtcagcatgcctgtacgaacaacccgtatttccgaaaaaaagccgccatcatcaccacagccatcgccaaggagcttggccggctcccggggctgatcggatggcagctagacaatgagtttaaatgccatgttgcagaatgcatgtgtgagacatgcttgcgcctatggcatgactggctcaaaaatcgctacggggtaattgagcgcttgaatgaagcttggggaaccgatgtgtggagcgagacctatcagacgtttgagcaagtcccgcagccgggaccggccccgtttctgcatcatgcctctctacgcactatgtatcagctgttttcgatggagatgatcgcttcgtttgcggatgaacaggccaaaatcatccgctgctattcagatgcgccgatcacgcataacggatcagtcatgttcagcgtggacaatgagcgaatgtttcagaatctcgattttgcctcctatgacacgtacgcttcgcaggaaaacgcctctgcctttttattgaactgtgatttatggagaaatctgaaacaagggcgcccgttttggattttggaaacgagtccgtcgtatgccgcctcgcttgaaagctccgcttacccgcacgcagacgggtatttgcaggccgaagccgtatcgtcctacgccttagggagccaggggttttgctactggctatggcgacagcagcgttcaggcagcgagatttcccacggttcggttctcagtgcctggggcgaacccaccatcggctatcaaaatgtgctggcggttgagcgggcaagaaaggaaatcgagcctattattctatcgactgaacccgttcaagccgaggcggcgatgacttactctgacagagcaaaagcatttattaaaactgagcctcaccggggactccggcatcgttcgcttgtgacgcatttttatgaacgtattctcaacacggggattcaccgtgaccttattccggaaggcgctccactggacggctatcgcttgctgtttacgccatttgtgccgtatttgtcttctgaatttatcaaaaaagcttcggcattcgctgaagcgggcggcatctggatcaccgggccgctgacaggaggacgcacatgcgagcataccattcataccgattgcggacttggcgaacttgagaaaacgtcagggatcaaaacactttttacctttccgatgaatgagaacgtgaatacaggaaaagcgtttggcatcacggcgccgctcggactgtggagcgcggtgtttgacacagagagcggaaacacccttggcacggttgaagcaggaccgggggcgggccatgcttttctgacggaacggaattacggcgaggggaaaattgtcatgctgggctcgcttccatccgggaaagaaggggatgcgatgctggaagcgctcgtcaggcattatgcggaggaagctgttatttccagccggtcggatgtgacacccggcacgatcgttgccccgcgtataggcgaaaacggccttgtgtggatcgttgtgaatatggatggaaaaggcgggagcgtgacattgccggaatcgggaacggatttgttgacgcaccgcttggaaaaggcggggagactggcggtcggaccgcatgaataccgtgtgattcaatttgacaatcacagctga(SEQ ID NO:73)

YesZ(枯草芽孢杆菌)氨基酸序列(由SEQ ID NO:73编码)：

MRKLYHGACYYPELWDEETIQQDIDIMREVGVNVVRIGEFAWSVMEPEEGKIDVGFFKEIIARLYDSGIETIMCTPTPTPPIWFSHGRPERMHANEKREIMGHGSRQHACTNNPYFRKKAAIITTAIAKELGRLPGLIGWQLDNEFKCHVAECMCETCLRLWHDWLKNRYGVIERLNEAWGTDVWSETYQTFEQVPQPGPAPFLHHASLRTMYQLFSMEMIASFADEQAKIIRCYSDAPITHNGSVMFSVDNERMFQNLDFASYDTYASQENASAFLLNCDLWRNLKQGRPFWILETSPSYAASLESSAYPHADGYLQAEAVSSYALGSQGFCYWLWRQQRSGSEISHGSVLSAWGEPTIGYQNVLAVERARKEIEPIILSTEPVQAEAAMTYSDRAKAFIKTEPHRGLRHRSLVTHFYERILNTGIHRDLIPEGAPLDGYRLLFTPFVPYLSSEFIKKASAFAEAGGIWITGPLTGGRTCEHTIHTDCGLGELEKTSGIKTLFTFPMNENVNTGKAFGITAPLGLWSAVFDTESGNTLGTVEAGPGAGHAFLTERNYGEGKIVMLGSLPSGKEGDAMLEALVRHYAEEAVISSRSDVTPGTIVAPRIGENGLVWIVVNMDGKGGSVTLPESGTDLLTHRLEKAGRLAVGPHEYRVIQFDNHS*(SEQ ID NO:74

编码GanA(枯草芽孢杆菌)的核酸序列：

atgtcaaagcttgaaaaaacgcacgtaacaaaagcaaaatttatgctccatgggggagactacaaccccgatcagtggctggatcggcccgatattttagctgacgatatcaaactgatgaagctttctcatacgaatacgttttctgtcggcatttttgcatggagcgcacttgagccggaggagggcgtatatcaatttgaatggctggatgatatttttgagcggattcacagtataggcggccgggtcatattagcaacgccgagcggagcccgtccggcctggctgtcgcaaacctatccggaagttttgcgcgtcaatgcctcccgcgtcaaacagctgcacggcggaaggcacaaccactgcctcacatctaaagtctaccgagaaaaaacacggcacatcaaccgcttattagcagaacgatacggacatcacccggcgctgttaatgtggcacatttcaaacgaatacgggggagattgccactgtgatttatgccagcatgctttccgggagtggctgaaatcgaaatatgacaacagcctcaagacattgaaccatgcgtggtggacccctttttggagccatacgttcaatgactggtcacaaattgaaagcccttcgccgatcggtgaaaatggcttgcatggcctgaatttagattggcgccggttcgtcaccgatcaaacgatttcgttttatgaaaatgaaatcattccgctgaaagaattgacgcctgatatccctatcacaacgaattttatggctgacacaccggatttgatcccgtatcagggcctcgactacagcaaatttgcaaagcatgtcgatgccatcagctgggacgcttatcctgtctggcacaatgactgggaaagcacagctgatttggcgatgaaggtcggctttatcaatgatctgtaccgaagcttgaagcagcagcccttcttattaatggagtgtacgccaagcgcggtcaattggcataacgtcaacaaggcaaagcgcccgggcatgaatctgctgtcatccatgcaaatgattgcccacggctcggacagcgttctctatttccaataccgcaaatcacgggggtcatcagaaaaattacacggagcggttgtggatcatgacaatagcccgaagaaccgcgtctttcaagaagtggccaaggtaggcgagacattggaacggctgtccgaagttgtcggaacgaagaggccggctcaaaccgcgattttatatgactgggaaaatcattgggcgctcgaggatgctcaggggtttgcgaaggcgacaaaacgttatccgcaaacgcttcagcagcattaccgcacattctgggaacacgatatccctgtcgacgtcatcacgaaagaacaagacttttcaccatataaactgctgatcgtcccgatgctgtatttaatcagcgaggacaccgtttcccgtttaaaagcgtttacggctgacggcggcaccttagtcatgacgtatatcagcggggttgtgaatgagcatgacttaacatacacaggcggatggcatccggatcttcaagctatatttggagttgagcctcttgaaacggacaccctgtatccgaaggatcgaaacgctgtcagctaccgcagccaaatatatgaaatgaaggattatgcaaccgtgattgatgtaaagacagcttcagtggaagcggtgtatcaagaagatttttatgcgcgcacgccagcggtcacaagccatgagtatcagcagggcaaggcgtattttatcggcgcgcgtttggaggatcaatttcagcgtgatttctatgagggtctgatcacagacctgtctctctctccagtttttccggttcggcacggaaaaggcgtctccgtacaagcgaggcaggatcaggacaatgattatatttttgtcatgaatttcacggaagaaaaacagctggtcacgtttgatcagagtgtgaaggacataatgacaggagacatattgtcaggcgacctgacgatggaaaagtatgaagtgagaattgtcgtaaacacacattag(SEQ ID NO:75)

GanA(枯草芽孢杆菌)氨基酸序列(由SEQ ID NO:75编码)：

MSKLEKTHVTKAKFMLHGGDYNPDQWLDRPDILADDIKLMKLSHTNTFSVGIFAWSALEPEEGVYQFEWLDDIFERIHSIGGRVILATPSGARPAWLSQTYPEVLRVNASRVKQLHGGRHNHCLTSKVYREKTRHINRLLAERYGHHPALLMWHISNEYGGDCHCDLCQHAFREWLKSKYDNSLKTLNHAWWTPFWSHTFNDWSQIESPSPIGENGLHGLNLDWRRFVTDQTISFYENEIIPLKELTPDIPITTNFMADTPDLIPYQGLDYSKFAKHVDAISWDAYPVWHNDWESTADLAMKVGFINDLYRSLKQQPFLLMECTPSAVNWHNVNKAKRPGMNLLSSMQMIAHGSDSVLYFQYRKSRGSSEKLHGAVVDHDNSPKNRVFQEVAKVGETLERLSEVVGTKRPAQTAILYDWENHWALEDAQGFAKATKRYPQTLQQHYRTFWEHDIPVDVITKEQDFSPYKLLIVPMLYLISEDTVSRLKAFTADGGTLVMTYISGVVNEHDLTYTGGWHPDLQAIFGVEPLETDTLYPKDRNAVSYRSQIYEMKDYATVIDVKTASVEAVYQEDFYARTPAVTSHEYQQGKAYFIGARLEDQFQRDFYEGLITDLSLSPVFPVRHGKGVSVQARQDQDNDYIFVMNFTEEKQLVTFDQSVKDIMTGDILSGDLTMEKYEVRIVVNTH*(SEQ ID NO:76)

编码LacZ(凝结芽孢杆菌)的核酸序列：

atgctcaaaaagcacgaaaagttctactatggcggtgattataatcctgaacaatgggacgaaagcgtctggaaagaggatatgcgcttgatgaagaaagcaggtgttaactatgtatccataaacattttctcttgggcacgtctccaacctgatgaagaaacatatgatttttctacgcttgataaaataatggatatgctggctgaaaacggaattggtgctgacctggctaccgccacggctgctccgccggcctggctgtcacgtaagtatcctgattctttgccggtcgacaaagatggctcccggttcctgccgggatctcgccaacactactgtccgaactctaaagactatgctagactcgcagctaaattggtgagaaagatcgctgagcgctataaaagtcacccagcattagttatgtggcatgtaaacaacgaatacggctgccacatatctgaatgctactgcgataattgtaaaaagggttttcaaacgtggctcaaggagaaatatggaacgatcgagaacttgaataagagctggagtaccgatttctggtcacagcgctactatgagtgggaagaaatttgcctccctggaaaaacacctacctttgcgaatccaatgcagcagctcgattataaggcctttatggatgatagcctgttagcactgtataaaatggagcgtgacatactgaaaacttatacgccagacgtcccagtcatgacgaatttaatggggcttcataaaccagtggacggctttcactgggctaaggagatggatttggttacctgggacgcgtatcctgatcctttcgaggacatcccgtacgctcagttcatggcgcacgatctgacacgcagcttgaagaaacaaccttttcttctcatggaacaggccgcgggggccgtaaattggcgcgcacagaacgctgttaaggcgccaggggttatgcgtttatggtcatacgaagcagcggcgcatggtgctgacggtataatgttttttcaatggcgggcaagtcaaggaggcgcggaaaaatttcatagcgggatggtaccgcattcaggagatgaggagtctcggaattttcgggaggtcgtacagttaggaaatgaacttaagaatttggaaaaagtaacgggaagtgcgtacgcgtccgacgtagcaatagtttttgattggaaaaactggtgggcgttggaactggacagtaagccgagctctctggtcacttatataaaacaactcctcccgttctatcgggttttgcacacgcagaacataggtgtcgactttatccatccagatgaagctatggatcgctacaaggtggttttcgctccggcgagctaccgggtgacaaagacgtttgcagataaggtcaaggcatacgtagagaacggaggatatttcgcgacaaacttcttcagcgggatagctgatgagaatgaacgtgtgtaccttggaggttacccaggcgcttaccgtgacattttgggtatatatgtggaagagtttgccccgatgaaaaaaggagcggtacatcagatccggactggatacggagatgctgcgatacgcgtgtgggaagagaaaattcatttgaaaggcgccgaggcactcgcgtggtttaaggatggttatctggccggctcaccggcggtgaccgcacatcactgtggcaaaggcaaagcatactatattggcacacagccagatgagcaatacttatcctcactgctgaaggaaattctcaaggaggctgacgttcgcccggccctcgatgctccgcgtggagtagaagtcgcggttcgcaaaaacggtcatgaaaaatttctcttcttactgaaccatacagatcaggtgcaattcgtagatgccggcggtacttatccagaactgatttacggtcgcaccgaagccgaaaccgtgagactctcaccacgcgacgtgaaaatccttcaggtcatagagaaataa(SEQ ID NO:77)

LacZ(凝结芽孢杆菌)氨基酸序列(由SEQ ID NO:77编码)：

MLKKHEKFYYGGDYNPEQWDESVWKEDMRLMKKAGVNYVSINIFSWARLQPDEETYDFSTLDKIMDMLAENGIGADLATATAAPPAWLSRKYPDSLPVDKDGSRFLPGSRQHYCPNSKDYARLAAKLVRKIAERYKSHPALVMWHVNNEYGCHISECYCDNCKKGFQTWLKEKYGTIENLNKSWSTDFWSQRYYEWEEICLPGKTPTFANPMQQLDYKAFMDDSLLALYKMERDILKTYTPDVPVMTNLMGLHKPVDGFHWAKEMDLVTWDAYPDPFEDIPYAQFMAHDLTRSLKKQPFLLMEQAAGAVNWRAQNAVKAPGVMRLWSYEAAAHGADGIMFFQWRASQGGAEKFHSGMVPHSGDEESRNFREVVQLGNELKNLEKVTGSAYASDVAIVFDWKNWWALELDSKPSSLVTYIKQLLPFYRVLHTQNIGVDFIHPDEAMDRYKVVFAPASYRVTKTFADKVKAYVENGGYFATNFFSGIADENERVYLGGYPGAYRDILGIYVEEFAPMKKGAVHQIRTGYGDAAIRVWEEKIHLKGAEALAWFKDGYLAGSPAVTAHHCGKGKAYYIGTQPDEQYLSSLLKEILKEADVRPALDAPRGVEVAVRKNGHEKFLFLLNHTDQVQFVDAGGTYPELIYGRTEAETVRLSPRDVKILQVIEK*(SEQ ID NO:78)。

在枯草芽孢杆菌中表达yesZ或ganA构建体的情况下，使用标准分子生物学技术使编码对应序列的内源性序列缺失，以防发生不希望的重组。本实施例还包括以下理解(虽然不要求)，可通过对细胞进行基因修饰以使乳糖转运穿过细胞膜增加来增加纤维合成。因此，另外任选对菌株进行工程化以表达一种或多种乳糖转运体。在经过工程化以表达LacZ(大肠杆菌)的细胞的情况下，对细胞进行进一步修饰以表达编码极性键联的lacY转运体的异源核酸序列，所述异源核酸序列包括以下序列：

atgtactatttaaaaaacacaaacttttggatgttcggtttattctttttcttttacttttttatcatgggagcctacttcccgtttttcccgatttggctacatgacatcaaccatatcagcaaaagtgatacgggtattatttttgccgctatttctctgttctcgctattattccaaccgctgtttggtctgctttctgacaaactcgggctgcgcaaatacctgctgtggattattaccggcatgttagtgatgtttgcgccgttctttatttttatcttcgggccactgttacaatacaacattttagtaggatcgattgttggtggtatttatctaggcttttgttttaacgccggtgcgccagcagtagaggcatttattgagaaagtcagccgtcgcagtaatttcgaatttggtcgcgcgcggatgtttggctgtgttggctgggcgctgtgtgcctcgattgtcggcatcatgttcaccatcaataatcagtttgttttctggctgggctctggctgtgcactcatcctcgccgttttactctttttcgccaaaacggatgcgccctcttctgccacggttgccaatgcggtaggtgccaaccattcggcatttagccttaagctggcactggaactgttcagacagccaaaactgtggtttttgtcactgtatgttattggcgtttcctgcacctacgatgtttttgaccaacagtttgctaatttctttacttcgttctttgctaccggtgaacagggtacgcgggtatttggctacgtaacgacaatgggcgaattacttaacgcctcgattatgttctttgcgccactgatcattaatcgcatcggtgggaaaaacgccctgctgctggctggcactattatgtctgtacgtattattggctcatcgttcgccacctcagcgctggaagtggttattctgaaaacgctgcatatgtttgaagtaccgttcctgctggtgggctgctttaaatatattaccagccagtttgaagtgcgtttttcagcgacgatttatctggtctgtttctgcttctttaagcaactggcgatgatttttatgtctgtactggcgggcaatatgtatgaaagcatcggtttccagggcgcttatctggtgctgggtctggtggcgctgggcttcaccttaatttccgtgttcacgcttagcggccccggcccgctttccctgctgcgtcgtcaggtgaatgaagtcgcttaa(SEQ ID NO:79)，其编码以下氨基酸序列：

MYYLKNTNFWMFGLFFFFYFFIMGAYFPFFPIWLHDINHISKSDTGIIFAAISLFSLLFQPLFGLLSDKLGLRKYLLWIITGMLVMFAPFFIFIFGPLLQYNILVGSIVGGIYLGFCFNAGAPAVEAFIEKVSRRSNFEFGRARMFGCVGWALCASIVGIMFTINNQFVFWLGSGCALILAVLLFFAKTDAPSSATVANAVGANHSAFSLKLALELFRQPKLWFLSLYVIGVSCTYDVFDQQFANFFTSFFATGEQGTRVFGYVTTMGELLNASIMFFAPLIINRIGGKNALLLAGTIMSVRIIGSSFATSALEVVILKTLHMFEVPFLLVGCFKYITSQFEVRFSATIYLVCFCFFKQLAMIFMSVLAGNMYESIGFQGAYLVLGLVALGFTLISVFTLSGPGPLSLLRRQVNEVA*(SEQ ID NO:80)

在经过工程化以表达LacZ(凝结芽孢杆菌)的细胞的情况下，对细胞进行进一步修饰以表达异源核酸序列lacY(巨大芽孢杆菌)，所述异源核酸序列包括以下序列：

atgaaaagtagtaagtcactctactggaagctttctgcgtatttcttctttttcttctttacctggagctctagttactctctgttttccatttggttgggacaggagataaagctgaatggctcagccacggggctcatatttagtgtcaacgccatattcgctctttgtatgcaaccattatacggatatatctccgacagaatcggcctcaagaagcatattttattttttataagttgccttcttgtatttgttgggccattctacatatttgtgtatgggccgttattgcagtataatgtgctcataggtgccattattggtggcctgtacttgggcgtggcatttttggcaggaataggcgcgatagaaacgtatattgagaaggtatctcgcaagtacaagttcgagtatggaaagtctcggatgtgggggagtcttggttgggccgccgcgacgttttttgcgggccaacttttcaatatcaacccgcacatcaatttttgggtggccagcgtatccgctgttatacttatggctataatcttctcagtaaaagttgaaatgagctcttatgaaatggagaaggcagaatcagtgcgtctccgtgatgtaggtaacttgttcctcttaaaggaattctggtttttcatgatctatgtcgtaggtgtaacatgtgtctatggggtgtacgaccaacagttcccaatatactatgcgtctttattcccaaccgagtcaatcggtaatcaagtgttcggttatctcaatagtttccaagtctttctcgaggcagggatgatgttcgccgcgccatttattgttaacaaaataggcgcgaagaattccttaatcctggctggtttcctcatgggctttagaattattggttccgggttggttgtgggtcctataggaatcagttctatgaagcttatacacgcgcttgaacttcctataatgctcatagccatttttaagtacctcgccgcgaattttgatacaagattatcatctattttgtacctggttggcttccaatttgccagtcagattggcgcctctgtcctctcccctatcgccggtggcttgtatgactcagtcggatttagtcgcacttatctgatcatgggtgggatggtacttgtttttaatgttatttcaatgttcacattgttgaatagcaaaaagcataaatttatccggaaggacgttcaagaaaagactcagataatt(SEQ ID NO:81)，其编码以下氨基酸序列：

MKSSKSLYWKLSAYFFFFFFTWSSSYSLFSIWLGQEIKLNGSATGLIFSVNAIFALCMQPLYGYISDRIGLKKHILFFISCLLVFVGPFYIFVYGPLLQYNVLIGAIIGGLYLGVAFLAGIGAIETYIEKVSRKYKFEYGKSRMWGSLGWAAATFFAGQLFNINPHINFWVASVSAVILMAIIFSVKVEMSSYEMEKAESVRLRDVGNLFLLKEFWFFMIYVVGVTCVYGVYDQQFPIYYASLFPTESIGNQVFGYLNSFQVFLEAGMMFAAPFIVNKIGAKNSLILAGFLMGFRIIGSGLVVGPIGISSMKLIHALELPIMLIAIFKYLAANFDTRLSSILYLVGFQFASQIGASVLSPIAGGLYDSVGFSRTYLIMGGMVLVFNVISMFTLLNSKKHKFIRKDVQEKTQII(SEQ ID NO:82)如文献中已确定通过葡萄糖释放来测量用本实施例的各种菌株进行的纤维合成，其中葡萄糖释放对应于乳糖降解。简单地说，将活性细胞的悬浮液与乳糖混合并且孵育。定期获取等分试样，通过离心从等分试样中去除细胞，并且用葡萄糖测定仪分析等分试样的剩余样品的葡萄糖含量。在乳糖降解后释放葡萄糖并且同时根据反应条件和存在的酶使半乳糖合并至转半乳糖基反应中。经过工程化以表达LacZ(ZB420)的枯草芽孢杆菌的培养物能够以163uM/min的速率降解乳糖，比益生菌嗜酸乳杆菌快13倍(图8)。

实施例5：表达用于从碳水化合物底物合成可溶性海藻酮糖纤维的酶的工程化细胞的构建和实验验证

构建用于表达海藻酮糖二糖纤维合成酶的转基因。使用分子生物学的标准技术产生转基因。转基因包括编码纤维合成酶的核酸序列，所述核酸序列包括分泌多肽。本实施例利用mutB海藻酮糖合酶。编码纤维合成酶的核酸来源于嗜中酸假单胞菌并且具有以下序列，其中分泌多肽编码序列为粗体并且加下划线：

蛋白质产物MutB具有以下氨基酸序列，其中分泌多肽序列为粗体并且加下划线：

来源于嗜中酸假单胞菌的编码纤维合成酶的核酸序列与编码分泌多肽的核酸序列可操作地连接，使得所编码的纤维合成酶为包括分泌多肽的融合多肽。分析编码融合多肽的核酸序列的二级结构，至少部分是因为显著二级结构可引起翻译终止和不良表达。对核酸序列中的二级结构有显著贡献的碱基对通过核酸序列的沉默修饰(例如核酸序列的非编码和/或同义修饰)而被修饰，从而降低对二级结构的贡献。

通过以下分析测量纤维合成酶活性。因为海藻酮糖合酶使蔗糖重排成为海藻酮糖，所以它使得蔗糖为蔗糖酶不可及的。用蔗糖酶处理之后葡萄糖的累积仅揭示剩余的蔗糖，因为海藻酮糖不裂解并且不释放葡萄糖。蔗糖酶释放的葡萄糖与剩余蔗糖的量成正比，当从反应开始时蔗糖的量中扣除剩余蔗糖的量时，得到合成的海藻酮糖的量。各种葡萄糖测定仪为本领域已知的，并且可经过标准化以测量细菌培养基中的葡萄糖浓度。将本实施例的工程化细菌在培养基中培养至每毫升1E9个细胞(光学密度为1)的规定密度。然后通过离心(21xg，2分钟)将细胞去除并且通过添加规定量的蔗糖对含有所分泌的酶的上清液进行分析。在分析开始时以及18小时结束时，通过使用蔗糖酶裂解为葡萄糖来测量反应中的蔗糖水平，并且蔗糖浓度相对于缺乏海藻酮糖合酶的对照菌株的差异与所产生的海藻酮糖成正比。图9和图10中示出了使用含有所分泌的酶的上清液或使用全部细胞肉汤的海藻酮糖产量(g/L)。本领域技术人员将了解，还可产生一小部分的异麦芽酮糖，但此类产生将不会降低或消除所公开的实施方案的优点或功效。

本领域技术人员将了解，可容易地获得用于定量葡萄糖、二糖海藻酮糖等(例如其量和/或浓度)的多种替代方法，包括但不限于HPLC和HPAEC。

本实施例证实，来源于嗜中酸假单胞菌的F1-mutB的编码纤维合成酶的转基因表达高度活性的纤维合成酶。

本公开还包括以下认识，来源于嗜中酸假单胞菌的海藻酮糖合酶(mutB)具有某些证实MutB表达在肠道中的功效的示例性性质。MutB的海藻酮糖合酶活性的最佳pH值范围为5.5-6.5，这与小肠相匹配。MutB酶为天然分泌的，并且因此在工程化细胞外为稳定的，便于通过革兰氏阳性细胞被膜分泌。

其他实施方案

虽然我们已描述了许多实施方案，但显然我们的基本公开内容和实施例可提供利用本文所描述的组合物和方法或被本文所描述的组合物和方法涵盖的其他实施方案。因此，应了解，本公开的范围将由从本公开和所附权利要求书可理解的内容限定，而不是由已通过实例呈现的特定实施方案限定。

序列表

SEQ ID NO:1

MNTDQQPYQGQTDYTQGPGNGQSQEQDYDQYGQPLYPSQADGYYDPNVAAGTEADMYGQQPPNESYDQDYTNGEYYGQPPNMAAQDGENFSDFSSYGPPGTPGYDSYGGQYTASQMSYGEPNSSGTSTPIYGNYDPNAIAMALPNEPYPAWTADSQSPVSIEQIEDIFIDLTNRLGFQRDSMRNMFDHFMVLLDSRSSRMSPDQALLSLHADYIGGDTANYKKWYFAAQLDMDDEIGFRNMSLGKLSRKARKAKKKNKKA

MEEANPEDTEETLNKIEGDNSLEAADFRWKAKMNQLSPLERVRH

IALYLLCWGEANQVRFTAECLCFIYKCALDYLDSPLCQQRQEPMP

EGDFLNRVITPIYHFIRNQVYEIVDGRFVKRERDHNKIVGYDDLNQ

LFWYPEGIAKIVLEDGTKLIELPLEERYLRLGDVVWDDVFFKTYK

ETRTWLHLVTNFNRIWVMHISIFWMYFAYNSPTFYTHNYQQLVD

NQPLAAYKWASCALGGTVASLIQIVATLCEWSFVPRKWAGAQHL

SRRFWFLCIIFGINLGPIIFVFAYDKDTVYSTAAHVVAAVMFFVAV

ATIIFFSIMPLGGLFTSYMKKSTRRYVASQTFTAAFAPLHGLDRW

MSYLVWVTVFAAKYSESYYFLVLSLRDPIRILSTTAMRCTGEYW

WGAVLCKVQPKIVLGLVIATDFILFFLDTYLWYIIVNTIFSVGKSFY

LGISILTPWRNIFTRLPKRIYSKILATTDMEIKYKPKVLISQVWNAIII

SMYREHLLAIDHVQKLLYHQVPSEIEGKRTLRAPTFFVSQDDNNF

ETEFFPRDSEAERRISFFAQSLSTPIPEPLPVDNMPTFTVLTPHYAER

ILLSLREIIREDDQFSRVTLLEYLKQLHPVEWECFVKDTKILAEETA

AYEGNENEAEKEDALKSQIDDLPFYCIGFKSAAPEYTLRTRIWASL

RSQTLYRTISGFMNYSRAIKLLYRVENPEIVQMFGGNAEGLERELE

KMARRKFKFLVSMQRLAKFKPHELENAEFLLRAYPDLQIAYLDE

EPPLTEGEEPRIYSALIDGHCEILDNGRRRPKFRVQLSGNPILGDGK

SDNQNHALIFYRGEYIQLIDANQDNYLEECLKIRSVLAEFEELNVE

QVNPYAPGLRYEEQTTNHPVAIVGAREYIFSENSGVLGDVAAGKE

QTFGTLFARTLSQIGGKLHYGHPDFINATFMTTRGGVSKAQKGLH

LNEDIYAGMNAMLRGGRIKHCEYYQCGKGRDLGFGTILNFTTKIG

AGMGEQMLSREYYYLGTQLPVDRFLTFYYAHPGFHLNNLFIQLSL

QMFMLTLVNLSSLAHESIMCIYDRNKPKTDVLVPIGCYNFQPAVD

WVRRYTLSIFIVFWIAFVPIVVQELIERGLWKATQRFFCHLLSLSP

MFEVFAGQIYSSALLSDLAIGGARYISTGRGFATSRIPFSILYSRFA

GSAIYMGARSMLMLLFGTVAHWQAPLLWFWASLSSLIFAPFVFN

PHQFAWEDFFLDYRDYIRWLSRGNNQYHRNSWIGYVRMSRARIT

GFKRKLVGDESEKAAGDASRAHRTNLIMAEIIPCAIYAAGCFIAFT

FINAQTGVKTTDDDRVNSVLRIIICTLAPIAVNLGVLFFCMGMSCC

SGPLFGMCCKKTGSVMAGIAHGVAVIVHIAFFIVMWVLESFNFVR

MLIGVVTCIQCQRLIFHCMTALMLTREFKNDHANTAFWTGKWYG

KGMGYMAWTQPSRELTAKVIELSEFAADFVLGHVILICQLPLIIIPK

IDKFHSIMLFWLKPSRQIRPPIYSLKQTRLRKRMVKKYCSLYFLVL

AIFAGCIIGPAVASAKIHKHIGDSLDGVVHNLFQPINTTNNDTGSQ

MSTYQSHYYTHTPSLKTWSTIK

SEQ ID NO:2

ATGAATACGGACCAACAACCATATCAAGGCCAAACAGACTACACGCAAGGTCCTGGGAACGGGCAATCCCAGGAACAAGACTACGATCAGTATGGCCAGCCATTGTATCCGAGCCAGGCCGATGGGTATTATGATCCGAATGTGGCAGCGGGAACGGAGGCAGATATGTACGGACAACAACCCCCGAATGAGTCGTATGATCAAGACTATACTAATGGCGAATACTATGGCCAACCGCCTAATATGGCGGCGCAGGATGGCGAAAATTTTTCGGACTTTTCAAGTTACGGTCCGCCGGGCACACCGGGGTACGATTCATATGGCGGCCAATATACCGCAAGCCAAATGTCTTATGGCGAGCCGAACAGCTCAGGCACATCAACCCCGATTTACGGAAATTACGACCCTAACGCAATTGCCATGGCTCTGCCGAATGAACCATATCCCGCATGGACGGCTGATAGCCAGAGTCCGGTCAGTATTGAACAAATTGAAGATATTTTTATTGATTTGACGAACCGGTTAGGATTTCAGCGGGATAGCATGCGGAATATGTTTGATCATTTTATGGTTCTGCTTGACTCACGGTCCAGCAGAATGTCACCTGATCAAGCCTTATTATCATTACACGCCGACTACATTGGAGGAGATACAGCAAACTACAAAAAGTGGTATTTCGCGGCGCAGTTAGATATGGATGATGAGATCGGGTTTCGTAATATGTCTCTCGGAAAACTGAGCAGGAAAGCAAGGAAGGCAAAAAAAAAGAATAAAAAGGCGATGGAGGAGGCGAATCCGGAAGATACAGAGGAGACACTGAATAAGATCGAAGGCGACAATTCTTTAGAAGCCGCAGATTTCCGTTGGAAGGCAAAAATGAACCAGTTGAGTCCACTGGAACGAGTTCGACATATCGCGCTGTATCTTTTATGCTGGGGT

GAGGCTAACCAAGTCCGGTTCACCGCCGAATGTTTATGTTTTAT

TTACAAATGTGCCTTAGACTACCTTGACTCTCCTCTGTGCCAAC

AACGCCAGGAACCGATGCCCGAAGGCGACTTCTTAAACCGCGT

GATTACGCCGATTTATCATTTCATTCGCAATCAAGTGTATGAAA

TCGTTGATGGACGTTTTGTTAAACGCGAACGCGATCATAATAA

AATCGTTGGCTACGATGATCTCAACCAACTTTTTTGGTACCCGG

AAGGTATTGCTAAAATTGTATTAGAAGACGGCACGAAACTCAT

TGAGTTACCGTTGGAGGAAAGATACTTACGCCTTGGCGACGTG

GTCTGGGACGATGTTTTTTTTAAAACCTACAAAGAAACACGTA

CGTGGTTACATCTTGTAACGAATTTTAACAGAATTTGGGTAAT

GCATATCTCCATTTTTTGGATGTACTTTGCCTACAATAGCCCTA

CCTTTTATACACATAACTACCAGCAGTTAGTCGACAATCAACC

GCTGGCCGCATACAAATGGGCGTCCTGTGCTTTAGGGGGCACA

GTTGCGAGCTTAATACAGATCGTAGCAACACTGTGCGAATGGA

GCTTCGTTCCGAGAAAATGGGCGGGCGCTCAGCATTTGTCACG

CCGTTTCTGGTTTCTTTGTATCATCTTCGGTATCAACCTGGGTC

CGATTATATTTGTTTTTGCTTACGACAAAGATACCGTCTATTCT

ACTGCAGCCCATGTAGTTGCAGCAGTAATGTTCTTTGTGGCGG

TAGCGACTATTATTTTTTTTTCAATCATGCCTCTGGGCGGCCTG

TTCACCTCGTATATGAAGAAATCGACACGACGCTATGTAGCAT

CGCAAACATTTACAGCCGCGTTTGCCCCGCTGCATGGGCTTGA

CCGTTGGATGTCATATCTGGTCTGGGTGACCGTATTCGCAGCC

AAATATTCCGAAAGTTATTACTTTCTTGTCTTATCTTTGCGAGA

TCCGATTCGTATCTTAAGTACGACAGCAATGAGATGTACGGGG

GAGTATTGGTGGGGCGCCGTTCTTTGTAAAGTTCAGCCGAAAA

TCGTCTTGGGACTGGTGATTGCGACAGACTTTATTTTATTTTTT

CTTGATACATATTTGTGGTATATTATCGTGAATACTATTTTTTCT

GTTGGAAAATCATTTTATCTGGGAATCTCGATTCTGACGCCTTG

GCGCAACATCTTTACACGCCTTCCTAAAAGAATCTATAGTAAA

ATTTTGGCCACAACCGATATGGAAATCAAATATAAACCGAAGG

TGCTTATTAGTCAGGTGTGGAATGCTATTATTATATCGATGTAT

CGCGAACATCTTTTAGCAATCGACCATGTTCAAAAGTTGCTGT

ATCACCAGGTTCCTTCAGAGATCGAAGGAAAGAGGACGTTGA

GGGCGCCCACCTTTTTCGTGAGTCAAGATGATAACAACTTTGA

AACAGAATTTTTTCCAAGGGACTCCGAGGCCGAAAGACGGATT

TCTTTTTTTGCACAATCTTTATCTACACCAATCCCGGAACCTCT

TCCAGTCGACAATATGCCGACGTTTACAGTGCTCACACCCCAC

TATGCCGAAAGAATCCTCTTAAGCCTGAGGGAAATAATCCGAG

AGGATGATCAGTTTTCTCGTGTTACGCTGCTGGAGTATTTAAAA

CAATTACATCCTGTTGAGTGGGAGTGCTTCGTGAAGGATACGA

AAATTTTGGCAGAAGAGACGGCTGCTTATGAAGGCAATGAAA

ACGAAGCTGAAAAAGAAGACGCGCTCAAGTCACAGATAGATG

ATCTCCCTTTTTATTGCATAGGCTTTAAATCTGCGGCCCCGGAA

TATACGCTTCGCACAAGAATATGGGCATCTTTAAGATCCCAAA

CGTTATACCGGACCATTAGTGGATTTATGAACTATTCTCGGGC

AATTAAACTTTTGTATAGAGTGGAAAACCCGGAAATTGTACAA

ATGTTCGGCGGAAATGCTGAAGGCCTGGAGAGGGAACTCGAA

AAAATGGCTCGCAGGAAATTTAAATTTCTGGTTTCCATGCAAC

GCCTTGCGAAATTCAAACCCCATGAATTAGAGAATGCCGAATT

TCTGTTGAGGGCATATCCGGACTTGCAAATAGCATACCTTGAT

GAAGAACCGCCACTGACGGAAGGTGAAGAGCCGAGAATATAT

TCTGCACTTATTGACGGACACTGCGAGATCCTTGACAATGGCC

GACGTAGGCCTAAATTTAGAGTCCAACTTTCTGGAAACCCGAT

TCTTGGTGATGGAAAGTCTGATAATCAAAACCATGCGTTGATC

TTCTATCGGGGAGAATATATTCAACTTATAGATGCAAATCAGG

ATAACTATCTTGAGGAGTGCCTGAAAATTCGGTCTGTTCTGGCT

GAGTTTGAGGAACTTAACGTTGAACAGGTGAATCCCTACGCAC

CGGGACTCAGATATGAGGAACAGACAACCAACCACCCAGTCG

CTATCGTAGGCGCACGCGAATACATATTCTCAGAGAATTCCGG

TGTATTAGGCGACGTCGCCGCCGGTAAAGAACAAACGTTCGGC

ACCTTGTTTGCGCGGACGCTCTCTCAAATTGGGGGAAAACTGC

ATTACGGACATCCTGATTTTATTAATGCAACGTTTATGACAACG

CGAGGAGGAGTGAGTAAAGCTCAGAAAGGCCTTCATTTAAAT

GAAGACATTTATGCCGGCATGAATGCGATGTTGAGGGGCGGCA

GAATAAAACATTGTGAATATTATCAGTGTGGAAAAGGTCGGGA

TTTAGGATTCGGAACAATCCTTAATTTTACGACCAAAATCGGC

GCTGGTATGGGCGAGCAAATGTTATCACGAGAGTATTATTATC

TTGGAACGCAATTACCGGTTGATCGATTCTTGACCTTTTACTAT

GCTCATCCGGGTTTTCATCTTAACAATCTGTTTATTCAACTGTC

CCTGCAAATGTTCATGCTGACGCTTGTAAATTTGTCATCTCTGG

CCCATGAATCGATCATGTGTATCTACGATCGCAATAAACCAAA

GACAGATGTGCTGGTACCGATCGGCTGCTATAATTTCCAACCG

GCTGTGGACTGGGTAAGACGATATACACTTTCCATATTTATTGT

CTTCTGGATCGCTTTTGTACCCATTGTCGTTCAGGAGCTTATTG

AACGCGGCTTGTGGAAAGCGACTCAAAGATTCTTTTGCCATCT

TTTATCCCTCTCTCCAATGTTTGAGGTCTTCGCGGGTCAAATTT

ATTCTTCAGCGCTGCTTAGCGACTTGGCTATTGGCGGCGCGAG

GTATATCTCAACAGGTCGCGGGTTTGCTACGTCCCGTATACCTT

TTTCGATCCTCTATTCAAGATTTGCAGGCAGCGCTATTTACATG

GGCGCACGATCTATGTTAATGTTGTTATTTGGAACAGTTGCTCA

TTGGCAGGCGCCACTTCTTTGGTTCTGGGCATCCTTGTCATCAT

TAATCTTCGCGCCGTTCGTTTTTAATCCGCATCAATTTGCCTGG

GAAGATTTTTTTTTAGATTATCGGGATTACATTCGCTGGCTGAG

CCGAGGAAATAACCAGTATCATCGTAATTCATGGATTGGTTAC

GTACGAATGTCTCGTGCCCGTATTACAGGCTTTAAAAGAAAGC

TCGTCGGCGACGAATCCGAAAAAGCAGCGGGAGATGCAAGCC

GAGCCCATCGTACTAACCTGATCATGGCTGAAATTATCCCGTG

CGCTATCTATGCGGCAGGGTGTTTCATAGCGTTCACGTTTATAA

ACGCTCAGACAGGCGTAAAGACAACCGACGATGACCGCGTCA

ATTCGGTTCTGAGGATCATCATATGTACCCTTGCACCGATTGCC

GTGAATTTGGGAGTGCTTTTCTTTTGTATGGGTATGTCATGCTG

CAGCGGTCCTTTATTCGGTATGTGTTGCAAGAAGACAGGCTCC

GTTATGGCTGGTATTGCACACGGTGTTGCTGTGATTGTTCATAT

TGCGTTCTTTATCGTGATGTGGGTACTGGAGTCTTTCAATTTTG

TTCGCATGCTTATTGGTGTGGTGACATGTATTCAGTGTCAGCGC

TTGATCTTTCACTGCATGACGGCACTGATGCTGACTCGAGAATT

TAAAAACGACCACGCGAATACAGCCTTTTGGACGGGCAAATG

GTATGGCAAAGGAATGGGATATATGGCCTGGACCCAGCCGAG

TAGAGAATTGACGGCAAAAGTCATTGAACTTAGTGAATTTGCA

GCAGATTTCGTATTGGGTCACGTTATTCTGATCTGTCAGTTACC

ACTGATCATCATCCCCAAAATCGACAAGTTTCACTCAATTATG

CTCTTCTGGCTGAAACCATCACGTCAGATCCGTCCCCCTATCTA

TAGTCTCAAACAAACGAGATTGAGAAAAAGAATGGTTAAAAA

ATATTGCAGCCTTTACTTTTTGGTCTTGGCCATTTTTGCGGGGT

GTATCATCGGCCCCGCTGTAGCATCAGCCAAGATCCATAAACA

CATCGGTGATTCCTTAGATGGAGTCGTACATAATCTTTTCCAAC

CGATAAATACCACAAACAATGACACGGGCAGTCAGATGTCAA

CTTACCAGAGTCACTACTATACTCATACGCCGTCCTTAAAAAC

CTGGTCCACAATTAAGTAA

SEQ ID NO:3

MAQRREPDPPPPQRRILRTQTVGSLGEAMLDSEVVPSSLVEIAPILRVANEVEASNPRVAYLCRFYAFEKAHRLDPTSSGRGVRQFKTALLQRLERENETTLAGRQKSDAREMQSFYQHYYKKYIQALLNAADKADRAQLTKAYQTAAVLFEVLKAVNQTEDVEVADEILETHNKVEEKTQIYVPYNILPLDPDSQNQAIMRLPEIQAAVAALRNTRGLPWTAGHKKKLDEDILDWLQSMFGFQKDNVLNQREHLILLLANVHIRQFPKPDQQPKLDDRALTIVMKKLFRNYKKWCKYLGRKSSLWLPTIQQEVQQRKLLYMGLYLLIWGEAANLRFMPECLCYIYHHMAFELYGMLAGSVSPMTGEHVKPAYGGEDEAFLQKVVTPIYQTISKEA

KRSRGGKSKHSVWRNYDDLNEYFWSIRCFRLGWPMRADADFFC

QTAEELRLERSEIKSNSGDRWMGKVNFVEIRSFWHIFRSFDRLWS

FYILCLQAMIVIAWNGSGELSAIFQGDVFLKVLSVFITAAILKLAQ

AVLDIALSWKARHSMSLYVKLRYVMKVGAAAVWVVVMAVTY

AYSWKNASGFSQTIKNWFGGHSHNSPSLFIVAILIYLSPNMLSALL

FLFPFIRRYLERSDYKIMMLMMWWSQPRLYIGRGMHESALSLFK

YTMFWIVLLISKLAFSYYAEIKPLVGPTKDIMRIHISVYSWHEFFPH

AKNNLGVVIALWSPVILVYFMDTQIWYAIVSTLVGGLNGAFRRL

GEIRTLGMLRSRFQSIPGAFNDCLVPQDNSDDTKKKRFRATFSRKF

DQLPSSKDKEAARFAQMWNKIISSFREEDLISDREMELLLVPYWS

DPDLDLIRWPPFLLASKIPIALDMAKDSNGKDRELKKRLAVDSYM

TCAVRECYASFKNLINYLVVGEREGQVINDIFSKIDEHIEKETLITE

LNLSALPDLYGQFVRLIEYLLENREEDKDQIVIVLLNMLELVTRDI

MEEEVPSLLETAHNGSYVKYDVMTPLHQQRKYFSQLRFPVYSQT

EAWKEKIKRLHLLLTVKESAMDVPSNLEARRRLTFFSNSLFMDMP

PAPKIRNMLSFSVLTPYFSEDVLFSIFGLEQQNEDGVSILFYLQKIFP

DEWTNFLERVKCGNEEELRAREDLEEELRLWASYRGQTLTKTVR

GMMYYRKALELQAFLDMAKDEELLKGYKALELTSEEASKSGGS

LWAQCQALADMKFTFVVSCQQYSIHKRSGDQRAKDILRLMTTYP

SIRVAYIDEVEQTHKESYKGTEEKIYYSALVKAAPQTKPMDSSES

VQTLDQLIYRIKLPGPAILGEGKPENQNHAIIFTRGEGLQTIDMNQ

DNYMEEAFKMRNLLQEFLEKHGGVRCPTILGLREHIFTGSVSSLA

WFMSNQENSFVTIGQRVLASPLKVRFHYGHPDIFDRLFHLTRGGI

CKASKVINLSEDIFAGFNSTLREGNVTHHEYIQVGKGRDVGLNQIS

MFEAKIANGNGEQTLSRDLYRLGHRFDFFRMLSCYFTTIGFYFST

MLTVLTVYVFLYGRLYLVLSGLEEGLSSQRAFRNNKPLEAALASQ

SFVQIGFLMALPMMMEIGLERGFHNALIEFVLMQLQLASVFFTFQ

LGTKTHYYGRTLFHGGAEYRGTGRGFVVFHAKFAENYRFYSRSH

FVKGIELMILLLVYQIFGQSYRGVVTYILITVSIWFMVVTWLFAPF

LFNPSGFEWQKIVDDWTDWNKWIYNRGGIGVPPEKSWESWWEK

ELEHLRHSGVRGITLEIFLALRFFIFQYGLVYHLSTFKGKNQSFWV

YGASWFVILFILLIVKGLGVGRRRFSTNFQLLFRIIKGLVFLTFVAIL

ITFLALPLITIKDLFICMLAFMPTGWGMLLIAQACKPLIQQLGIWSS

VRTLARGYEIVMGLLLFTPVAFLAWFPFVSEFQTRMLFNQAFSRG

LQISRILGGQRKDRSSKNKE

SEQ ID NO:4

ATGGCACAACGCAGGGAACCGGACCCGCCACCCCCGCAGCGTAGAATATTGCGGACGCAAACGGTTGGCTCTCTGGGAGAAGCCATGCTTGATTCTGAGGTCGTTCCTTCATCACTTGTCGAAATAGCGCCAATTTTACGCGTCGCAAACGAAGTAGAAGCTTCAAATCCGCGTGTCGCTTACTTATGTAGATTCTACGCATTTGAAAAAGCTCACCGACTTGATCCAACCTCTTCAGGCCGCGGAGTTAGACAATTTAAGACGGCATTGCTTCAACGGTTAGAGCGTGAGAACGAAACCACATTGGCGGGAAGACAAAAAAGCGACGCGCGAGAGATGCAAAGTTTTTACCAGCATTACTACAAAAAATACATTCAAGCGTTACTGAATGCAGCGGACAAGGCAGATCGGGCGCAACTTACAAAAGCGTACCAGACAGCTGCAGTCCTTTTTGAAGTGCTTAAAGCTGTCAATCAGACTGAAGACGTCGAAGTTGCCGATGAAATTCTGGAGACACACAATAAAGTCGAGGAGAAAACGCAGATTTATGTGCCTTATAACATTCTTCCCTTAGATCCTGACAGCCAAAATCAGGCCATTATGCGCTTGCCAGAAATTCAGGCGGCTGTCGCCGCACTGCGCAACACTCGTGGTTTACCTTGGACAGCAGGACACAAAAAGAAATTGGATGAGGATATTCTTGATTGGCTGCAATCGATGTTCGGTTTTCAAAAAGATAATGTGCTCAATCAAAGAGAACATCTGATTTTGCTTCTGGCTAACGTTCATATCCGCCAATTCCCGAAGCCTGATCAGCAGCCAAAACTTGACGACCGGGCTCTTACGATTGTAATGAAAAAGTTATTTCGGAATTACAAGAAGTGGTGCAAGTATCTTGGTCGCAAGTCATCCCTTTGGCTCCCTACAATTCAACAGGAAGTGCAACAGCGTAAATTACTTTATATGGGGCTCTACTTGTTAATAT

GGGGAGAAGCCGCGAATCTTCGCTTTATGCCGGAATGTCTGTG

CTATATCTATCACCATATGGCATTCGAGTTGTATGGGATGTTAG

CAGGCAGCGTGTCTCCGATGACTGGCGAACACGTTAAGCCTGC

ATATGGAGGGGAGGACGAAGCCTTTTTACAGAAGGTCGTCACG

CCAATTTATCAAACTATTTCTAAAGAAGCAAAAAGATCAAGAG

GAGGAAAAAGCAAACATAGCGTGTGGCGGAACTATGATGATC

TCAATGAGTATTTTTGGAGTATTCGGTGTTTTCGGCTTGGCTGG

CCCATGCGCGCGGATGCTGATTTTTTTTGTCAAACAGCTGAAG

AATTGAGGTTAGAGAGAAGCGAGATTAAATCGAATAGCGGGG

ATCGTTGGATGGGGAAAGTAAACTTTGTAGAGATTAGATCATT

TTGGCACATTTTTAGATCTTTTGATAGATTGTGGTCCTTTTACA

TACTGTGCTTGCAAGCGATGATTGTAATCGCTTGGAATGGCTC

GGGTGAATTGTCGGCGATTTTTCAAGGAGATGTATTTTTGAAG

GTGCTCTCTGTCTTTATTACCGCGGCGATCCTGAAGCTGGCGCA

AGCCGTTCTCGATATTGCCCTGTCCTGGAAGGCGCGTCATTCG

ATGAGCCTGTATGTTAAACTTCGTTACGTCATGAAAGTGGGTG

CTGCGGCAGTTTGGGTCGTCGTTATGGCGGTAACATACGCATA

TTCATGGAAAAACGCGTCTGGCTTCTCCCAGACCATTAAGAAC

TGGTTCGGCGGACATTCACATAATTCCCCGTCACTCTTTATTGT

GGCTATCCTGATTTATCTGAGCCCTAACATGTTGTCAGCACTTC

TTTTTCTCTTCCCGTTTATCCGTCGGTATTTGGAACGATCTGATT

ACAAAATCATGATGCTTATGATGTGGTGGTCCCAGCCACGACT

GTATATCGGAAGGGGGATGCATGAATCAGCTCTGTCTCTGTTT

AAATACACTATGTTTTGGATTGTTCTGCTGATTTCGAAACTTGC

CTTTTCGTATTACGCGGAAATTAAACCCCTCGTAGGCCCGACA

AAAGACATTATGCGAATTCATATTAGTGTTTATTCGTGGCATG

AGTTTTTTCCACATGCAAAAAACAATCTGGGTGTAGTCATTGC

ACTTTGGTCACCCGTCATCCTGGTATATTTCATGGACACACAAA

TTTGGTACGCTATCGTCTCCACCCTGGTGGGAGGCTTAAACGG

TGCTTTTAGACGTTTAGGGGAGATCAGAACATTAGGTATGTTA

CGTTCGCGCTTCCAGAGTATCCCAGGTGCATTTAATGATTGTCT

TGTCCCGCAGGACAACTCCGACGACACTAAAAAAAAGCGCTTT

AGAGCAACTTTTAGTCGGAAATTTGATCAGCTTCCATCATCAA

AGGACAAAGAGGCGGCAAGATTCGCACAAATGTGGAATAAAA

TCATTTCAAGTTTTCGTGAAGAAGACCTGATTTCAGACCGGGA

AATGGAACTTTTGCTTGTACCTTACTGGAGTGATCCTGATTTGG

ACCTGATCAGGTGGCCGCCGTTTTTATTAGCATCCAAAATTCCT

ATCGCGCTGGACATGGCTAAAGACTCTAACGGTAAGGACCGTG

AACTCAAAAAGAGACTCGCCGTTGATTCCTATATGACCTGTGC

AGTCCGTGAATGCTACGCGTCTTTCAAAAATTTAATTAATTATT

TAGTTGTTGGAGAACGCGAAGGGCAAGTCATTAATGATATCTT

TTCAAAGATCGATGAACATATAGAAAAAGAGACCTTAATTACA

GAACTTAATTTGAGCGCGCTGCCCGATTTATACGGACAATTCG

TGAGACTTATTGAATATCTGCTGGAAAATCGGGAAGAGGATAA

AGATCAGATTGTTATAGTCTTATTAAATATGCTGGAATTGGTA

ACGCGGGACATTATGGAGGAAGAAGTTCCGTCTTTGTTAGAAA

CGGCTCATAATGGATCTTACGTTAAGTATGATGTGATGACACC

ACTCCATCAGCAGCGTAAATATTTTAGTCAACTGCGGTTTCCG

GTTTACAGCCAAACGGAGGCGTGGAAAGAGAAAATCAAACGA

CTGCATTTGCTGTTGACGGTCAAAGAATCGGCAATGGACGTAC

CGTCAAACTTGGAAGCGCGAAGAAGATTAACCTTCTTTTCTAA

TTCACTGTTCATGGATATGCCTCCTGCACCGAAAATTCGTAATA

TGTTATCATTTTCAGTCTTAACTCCGTATTTCTCTGAAGATGTC

CTTTTTAGCATCTTCGGCCTTGAACAGCAGAATGAAGATGGAG

TGTCCATTCTTTTCTATCTTCAAAAAATTTTTCCGGATGAATGG

ACCAATTTTTTAGAGCGGGTCAAATGCGGCAATGAGGAAGAAC

TGCGGGCCCGTGAAGATCTTGAAGAAGAATTGCGACTTTGGGC

CTCATATAGAGGTCAAACACTGACAAAAACAGTACGTGGGAT

GATGTATTATAGAAAAGCTCTGGAACTGCAGGCATTTTTAGAC

ATGGCTAAAGATGAAGAATTATTAAAAGGTTACAAAGCTCTGG

AGCTTACATCCGAGGAAGCGAGTAAGAGCGGAGGTTCTTTGTG

GGCTCAATGTCAAGCGTTGGCTGACATGAAGTTCACCTTCGTT

GTTTCTTGCCAACAATATAGTATTCATAAGCGTAGCGGTGATC

AAAGAGCGAAGGATATCCTTCGGTTGATGACAACGTATCCGAG

CATCCGAGTTGCATATATAGACGAGGTAGAGCAAACGCACAA

AGAGTCCTATAAAGGCACGGAAGAAAAGATATATTACTCTGCT

CTTGTGAAAGCCGCTCCACAGACAAAGCCGATGGATTCTTCAG

AAAGCGTACAAACATTGGATCAGTTGATTTACCGTATCAAACT

TCCGGGGCCAGCAATCCTGGGAGAAGGCAAACCGGAAAATCA

GAATCACGCAATCATTTTCACAAGAGGCGAAGGCCTTCAAACA

ATCGATATGAATCAGGATAATTATATGGAAGAAGCTTTCAAAA

TGCGCAATCTGTTACAGGAATTCCTTGAAAAACATGGAGGCGT

TAGATGCCCTACAATCCTGGGCCTTCGCGAACACATTTTTACTG

GCAGTGTCAGCTCTTTAGCGTGGTTTATGTCCAACCAAGAAAA

CTCATTTGTCACTATAGGCCAGAGAGTCTTAGCGAGCCCTCTG

AAAGTACGCTTTCACTATGGTCATCCGGATATTTTTGATAGATT

GTTTCACCTTACCAGGGGTGGGATTTGTAAAGCCTCTAAGGTC

ATCAACCTCAGCGAAGACATCTTTGCTGGCTTTAACAGCACAC

TTCGCGAAGGCAATGTCACCCACCATGAATATATTCAAGTTGG

TAAGGGACGTGATGTGGGGTTGAATCAAATCTCGATGTTTGAA

GCGAAAATTGCCAATGGCAATGGAGAACAAACCTTGTCCCGG

GATCTTTACCGGTTGGGTCATCGTTTCGATTTCTTTCGTATGCTT

TCTTGCTATTTTACCACGATTGGGTTTTATTTTTCTACCATGTTG

ACCGTCCTGACTGTATACGTCTTCCTGTATGGGCGGCTGTATCT

TGTCCTGAGCGGTCTGGAAGAAGGACTTAGCTCCCAACGGGCC

TTTCGCAACAACAAGCCTTTAGAAGCCGCACTTGCATCACAAA

GTTTTGTTCAGATCGGATTTTTAATGGCATTGCCTATGATGATG

GAAATTGGGCTCGAAAGGGGTTTTCACAATGCTTTAATAGAAT

TTGTGCTTATGCAATTGCAGCTTGCATCCGTATTCTTTACTTTTC

AATTAGGAACCAAGACTCACTACTATGGAAGGACATTATTTCA

CGGCGGAGCAGAGTATAGAGGCACAGGCCGTGGATTTGTCGT

GTTTCATGCGAAATTTGCCGAAAATTATCGGTTCTATTCTAGGT

CTCATTTTGTCAAAGGCATCGAGCTGATGATCCTTCTTTTGGTC

TATCAAATCTTCGGTCAATCATATAGGGGTGTAGTGACATACA

TCCTTATCACTGTAAGCATATGGTTTATGGTTGTGACGTGGCTG

TTTGCGCCTTTTCTGTTTAACCCCAGTGGATTTGAATGGCAGAA

GATCGTGGATGACTGGACCGATTGGAACAAATGGATCTATAAT

CGCGGCGGCATTGGGGTTCCACCGGAGAAATCTTGGGAGTCAT

GGTGGGAAAAAGAACTGGAACACCTCCGCCATAGCGGAGTCC

GGGGAATTACATTGGAAATTTTCCTTGCGCTTCGCTTTTTCATC

TTTCAGTACGGGCTTGTCTACCATCTCAGCACATTTAAAGGCA

AAAACCAGTCATTTTGGGTCTACGGGGCCTCATGGTTTGTCATT

CTGTTTATTTTGTTAATTGTAAAAGGTTTGGGCGTTGGACGGCG

CCGCTTTTCTACTAATTTCCAGCTGCTTTTCCGCATCATTAAAG

GTCTCGTTTTCTTAACGTTCGTTGCAATTCTGATTACTTTTCTGG

CACTGCCGCTGATAACCATAAAGGATTTATTTATCTGTATGCTT

GCATTTATGCCTACGGGGTGGGGTATGCTTCTGATAGCTCAGG

CGTGCAAACCGCTGATCCAGCAACTGGGAATCTGGTCTTCCGT

CAGAACCTTAGCACGGGGGTACGAAATCGTTATGGGCCTGTTA

CTGTTTACCCCAGTGGCATTTCTTGCGTGGTTTCCGTTTGTAAG

CGAATTCCAAACGCGCATGCTGTTTAATCAGGCGTTTTCTCGCG

GGTTGCAAATTAGCCGCATTTTAGGCGGCCAACGGAAGGATAG

GAGCAGCAAAAATAAGGAG

SEQ ID NO:5

MAPAVAGGGGRRNNEGVNGNAAAPACVCGFPVCACAGAAAVASAASSADMDIVAAGQIGAVNDESWVAVDLSDSDDAPAAGDVQGALDDRPVFRTEKIKGVLLHPYRVLIFVRLIAFTLFVIWRIEHKNPDAMWLWVTSIAGEFWFGFSWLLDQLPKLNPINRVPDLAVLRRRFDHADGTSSLPGLDIFVTTADPIKEPILSTANSILSILAADYPVDRNTCYLSDDSGMLLTYEAMAEAAKFATLWVPFCRKHAIEPRGPESYFELKSHPYMGRAQEEFVNDRRRVRKEYDDFKARINGLEHDIKQRSDSYNAAAGVKDGEPRATWMADGSQWEGTWIEQSENHRKGDHAGIVLVLLNHPSHARQLGPPASADNPLDFSGVDVRLPMLVYVAREKRPGCNHQKKAGAMNALTRASAVLSNSPFILNLDCDHYINNSQALRAGICFMLGRDSDTVAFVQFPQRFEGVDPTDLYANHNRIFFDGTLRALDGLQGPIYVGTGCLFRRITLYGFEPPRINVGGPCFPRLGGMFAKNRYQKPGFEMTKPGAKPVAPPPAATVAKGKHGFLPMPKKAYGKSDAFADTIPRASHPSPYAAEAAVAADEAAIAEAVMVTAAAYEKKTGWGSDIGWVYGTVTEDVVTGYRMHIKGWRSRYCSIYPHAFIGTAPINLTERLFQVLRWSTGSLEIFFSRNNPLFGSTFLHPLQRVAYINITTYPFTALFLIFYTTVPALSFVTGHFIVQRPTTMFYVYLAIVLGTLLILAVLEVKWAGVTVFEWFRNGQFWMTASCSAYLAAVLQVVTKVVFRRDISFKLTSKLPAGDEKKDPYADLYVVRWTWLMITPIIIILVNIIGSAVAFAKVLDGEWTHWLKVAGGVFFNFWVLFHLYPFAKGILGKHGKTPVVVLVWWAFTFVITAVLYINIPHIHGPGRHGAASPSHGHHSAHGTKKYDFTYAWP

SEQ ID NO:6

ATGGCGCCGGCTGTCGCGGGAGGCGGTGGCCGTCGAAATAATGAAGGAGTCAACGGCAACGCCGCAGCTCCAGCCTGCGTATGCGGCTTTCCGGTTTGCGCATGCGCCGGGGCTGCCGCTGTTGCTAGTGCGGCCTCTTCCGCTGATATGGACATTGTGGCGGCCGGCCAGATCGGCGCGGTCAACGACGAATCATGGGTCGCCGTCGATCTGAGCGATAGTGACGACGCCCCGGCGGCGGGTGATGTACAAGGCGCTCTCGATGACCGTCCGGTGTTTAGAACAGAGAAAATTAAAGGCGTTCTCCTTCACCCGTATAGAGTGCTTATTTTTGTACGGCTGATCGCGTTTACGCTTTTCGTCATCTGGAGGATAGAGCATAAGAACCCGGATGCGATGTGGCTGTGGGTTACATCTATAGCAGGTGAATTTTGGTTTGGTTTTTCTTGGCTTCTTGATCAGCTCCCGAAACT

TAATCCTATAAACAGAGTTCCAGACTTGGCTGTATTGCGGAGA

CGATTCGATCATGCGGATGGTACTTCGTCATTACCCGGACTGG

ATATCTTCGTTACAACAGCTGATCCAATTAAAGAGCCTATTTTG

AGCACTGCGAACAGTATCCTGTCAATTTTAGCTGCCGATTATCC

GGTTGATCGGAACACATGTTATCTTAGCGATGATTCAGGAATG

CTGCTCACATATGAAGCAATGGCTGAGGCAGCTAAATTTGCCA

CATTATGGGTGCCGTTTTGTCGTAAACATGCTATTGAGCCGAG

GGGACCGGAAAGCTATTTTGAATTAAAATCTCATCCTTATATG

GGTAGGGCACAGGAAGAATTTGTTAACGATCGTCGAAGGGTA

AGGAAAGAATATGATGATTTTAAAGCACGGATTAACGGCTTAG

AACACGATATCAAACAACGCTCAGATTCATACAACGCGGCAGC

AGGTGTTAAAGACGGGGAACCACGTGCTACATGGATGGCAGA

TGGCTCACAGTGGGAAGGGACATGGATCGAACAATCGGAAAA

TCATCGAAAAGGCGATCACGCAGGTATAGTGCTTGTTCTGTTA

AATCATCCTTCACATGCACGTCAATTAGGACCACCGGCAAGCG

CAGATAATCCTTTGGACTTTTCCGGAGTTGACGTTAGGTTACCT

ATGCTTGTATACGTAGCCCGTGAAAAACGGCCCGGATGCAACC

ACCAAAAAAAAGCGGGAGCAATGAACGCGTTGACGCGCGCTT

CCGCGGTCCTCAGCAATTCTCCGTTTATACTTAATCTGGACTGC

GATCACTACATTAACAACTCACAAGCGCTTCGTGCAGGGATAT

GCTTTATGTTGGGACGTGATAGTGACACAGTGGCTTTCGTGCA

ATTTCCGCAAAGATTTGAAGGCGTAGATCCGACCGACCTGTAC

GCAAACCACAATAGAATTTTTTTTGATGGTACCCTGAGAGCTTT

AGATGGGTTACAGGGGCCGATTTATGTTGGTACGGGCTGCTTG

TTTAGACGCATAACCTTATATGGTTTCGAACCGCCGAGAATCA

ATGTTGGTGGCCCCTGCTTTCCTCGCCTCGGTGGGATGTTTGCC

AAGAATCGGTATCAGAAGCCTGGCTTCGAGATGACTAAGCCGG

GAGCGAAACCCGTTGCACCTCCACCGGCTGCTACAGTAGCCAA

GGGGAAGCATGGCTTTTTACCGATGCCGAAAAAAGCGTATGGG

AAAAGCGACGCATTTGCGGATACAATTCCTAGAGCGTCACACC

CTAGTCCGTATGCCGCCGAAGCAGCTGTTGCCGCCGACGAGGC

TGCAATTGCCGAAGCGGTGATGGTCACAGCTGCCGCTTATGAG

AAAAAGACGGGTTGGGGGTCAGACATCGGCTGGGTTTACGGA

ACAGTTACAGAGGATGTCGTTACTGGATATAGAATGCACATCA

AAGGCTGGCGGTCACGCTACTGTAGCATCTACCCGCATGCATT

CATCGGTACCGCTCCGATTAATTTGACAGAACGACTGTTTCAA

GTCTTACGCTGGAGCACAGGATCTTTGGAAATCTTCTTCTCTAG

AAATAATCCGTTATTCGGTAGCACATTCCTCCATCCATTGCAGA

GGGTTGCGTATATTAATATCACCACCTATCCATTTACTGCACTG

TTTCTTATTTTTTATACAACAGTCCCGGCGCTGTCTTTTGTCACG

GGTCACTTCATTGTACAACGCCCGACAACGATGTTTTACGTGT

ATCTCGCAATAGTACTGGGCACGCTGCTGATCTTAGCCGTCTTA

GAAGTTAAGTGGGCTGGGGTAACGGTATTCGAATGGTTCCGCA

ACGGACAATTTTGGATGACGGCATCTTGTTCAGCTTATTTAGCT

GCTGTCCTTCAAGTCGTTACGAAGGTTGTGTTTCGCCGGGACAT

TTCGTTTAAACTGACATCGAAATTGCCCGCTGGGGATGAAAAG

AAAGATCCATATGCGGATCTTTACGTCGTGCGGTGGACCTGGT

TAATGATTACGCCGATCATTATCATCCTCGTTAACATCATCGGC

TCTGCAGTCGCGTTCGCTAAAGTGCTTGATGGAGAATGGACCC

ATTGGTTAAAAGTGGCGGGCGGCGTCTTTTTTAACTTCTGGGTC

TTGTTTCATTTATACCCTTTCGCAAAGGGAATTTTAGGCAAGCA

TGGGAAAACGCCTGTTGTGGTCCTGGTTTGGTGGGCTTTCACCT

TTGTTATTACAGCGGTTCTTTACATCAACATCCCTCATATCCAT

GGGCCGGGAAGACATGGCGCCGCAAGCCCGTCTCATGGACAT

CATTCTGCACATGGCACAAAAAAATATGATTTCACGTACGCAT

GGCCATAA

SEQ ID NO:7

MRLQRNSIICALVFLVSFVLGDVNIVSPSSKATFSPSGGTVSVPVEWMDNGAYPSLSKISTFTFSLCTGPNNNIDCVAVLASKITPSELTQDDKVYSYTAEFASTLTGNGQYYIQVFAQVDGQGYTIHYTPRFQLTSMGGVTAYTYSATTEPTPQTSIQTTTTNNAQATTIDSRSFTVPYTKQTGTSRFAPMQMQPNTKVTATTWTRKFATSAVTYYSTFGSLPEQATTITPGWSYTISSGVNYATPASMPSDNGGWYKPSKRLSLSARKINMRKV

SEQ ID NO:8

ATGCGGCTTCAACGTAACAGTATCATTTGTGCCTTAGTTTTTTTAGTATCTTTTGTCTTGGGTGATGTCAACATTGTGTCGCCGTCAAGCAAAGCTACATTTTCTCCAAGTGGCGGCACAGTGTCCGTTCCTGTCGAATGGATGGACAACGGAGCTTATCCGAGCCTTTCAAAAATTTCTACATTTACATTTAGTCTGTGCACGGGTCCAAATAATAATATTGATTGTGTTGCTGTCCTGGCAAGTAAAATAACGCCTAGCGAATTAACTCAGGATGACAAAGTTTATTCTTATACGGCTGAATTTGCTTCAACGTTGACCGGGAATGGTCAATACTATATCCAAGTATTTGCCCAGGTAGATGGCCAAGGCTACACAATCCATTACACGCCGCGGTTCCAGCTCACGTCAATGGGGGGCGTGACAGCGTACACATATAGTGCAACGACCGAACCTACACCCCAGACTAGTATTCAAACAACAACGACAAATAATGCGCAGGCAACTACCATAGATTCCCGGTCCTTCACAGTCCCTTATACTAAACAAACGGGCACTTCACGCTTTGCGCCTATGCAGATGCAGCCGAATACTAAAGTGACCGCGACAACGTGGACGAGGAAATTCGCCACCTCAGCAGTTACCTATTACTCTACTTTTGGATCGTTGCCTGAACAAGCAACAACAATTACACCCGGCTGGTCGTATACTATATCAAGCGGGGTAAACTATGCGACACCTGCTAGTATGCCTAGCGATAACGGAGGTTGGTATAAGCCAAGCAAACGATTGAGCCTTTCAGCGCGGAAAATTAACATGCGAAAAGTTTGA

SEQ ID NO:9

MLMKRLFAASLMLAFSSVSSVRAEEAVKPGAPWWKSAVFYQVYPRSFKDTNGDGIGDFKGLTEKLDYLKGLGIDAIWINPHYASPNTDNGYDISDYREVMKEYGTMEDFDRLMAELKKRGMRLMVDVVINHSSDQHEWFKSSRASKDNPYRDYYFWRDGKDGHEPNNYPSFFGGSAWEKDPVTGQYYLHYFGRQQPDLNWDTPKLREELYAMLRFWLDKGVSGMRFDTVATYSKTPGFPDLTPEQMKNFAEAYTQGPNLHRYLQEMHEKVFDHYDAVTAGEIFGAPLNQVPLFIDSRRKELDMAFTFDLIRYDRALDRWHTIPRTLADFRQTIDKVDAIAGEYGWNTFFLGNHDNPRAVSHFGDDRPQWREASAKALATVTLTQRGTPFIFQGDELGMTNYPFKTLQDFDDIEVKGFFQDYVETGKATAEELLTNVALTSRDNARTPFQWDDSANAGFTTGKPWLKVNPNYTEINAAREIGDPKSVYSFYRNLISIRHETPALSTGSYRDIDPSNADVYAYTRSQDGETYLVVVNFKAEPRSFTLPDGMHIAETLIESSSPAAPAAGAASLELQPWQSGIYKVK

SEQ ID NO:10

ATGCTGATGAAGAGATTATTCGCGGCCAGCTTAATGCTGGCCTTCAGTTCAGTATCAAGTGTTAGAGCAGAGGAAGCAGTAAAACCTGGAGCGCCGTGGTGGAAGTCAGCAGTTTTTTATCAAGTTTATCCTAGGAGTTTTAAGGATACAAATGGTGATGGGATTGGCGACTTTAAGGGTCTTACGGAGAAACTTGACTATCTTAAAGGCCTTGGAATCGATGCGATCTGGATAAATCCTCATTATGCATCCCCTAACACGGATAATGGCTATGATATTAGCGACTATCGTGAAGTAATGAAAGAGTATGGGACGATGGAGGATTTCGACCGGCTGATGGCGGAGCTGAAAAAACGCGGCATGCGCCTTATGGTAGATGTAGTGATCAACCATTCATCTGATCAGCACGAATGGTTCAAATCCTCTCGTGCCAGTAAAGATAATCCGTATCGTGATTACTATTTTTGGCGTGATGGAAAAGACGGTCATGAACCTAATAATTATCCTTCTTTCTTCGGCGGCTCAGCATGGGAAAAGGATCCGGTTACCGGGCAATACTATCTCCATTACTTCGGAAGACAGCAGCCAGACTTGAACTGGGATACACCGAAACTGCGGGAGGAGCTGTATGCGATGCTTCGTTTCTGGCTGGATAAAGGCGTCTCTGGAATGCGGTTTGATACGGTGGCCACATATTCTAAAACGCCGGGATTTCCGGACCTGACGCCTGAGCAGATGAAAAACTTTGCCGAAGCTTATACCCAGGGTCCGAACCTCCACCGGTATCTGCAAGAAATGCATGAAAAAGTGTTTGATCATTATGACGCGGTCACCGCTGGGGAGATTTTTGGCGCGCCGCTTAACCAAGTTCCGCTGTTTATTGATTCAAGAAGAAAAGAGCTTGATATGGCTTTCACTTTCGACTTGATTAGATACGACCGTGCTTTAGACCGGTGGCATACAATTCCGCGCACGTTAGCTGATTTCCGTCAGACGATCGACAAGGTGGATGCCATAGCCGGCGAATACGGCTGGAATACATTTTTCTTGGGGAACCATGACAACCCTCGCGCAGTGAGCCATTTTGGTGACGATAGACCTCAGTGGAGAGAAGCGAGCGCTAAAGCACTCGCCACAGTCACGCTGACCCAGCGCGGCACGCCTTTTATTTTTCAAGGGGATGAATTAGGGATGACGAATTACCCTTTTAAAACGCTTCAGGATTTTGATGACATCGAAGTCAAAGGATTCTTCCAAGACTATGTTGAAACAGGGAAAGCTACTGCTGAAGAGCTTTTGACAAACGTTGCGCTTACGTCAAGGGATAATGCCCGAACGCCTTTTCAATGGGACGATAGTGCAAATGCGGGATTTACCACCGGCAAGCCATGGCTGAAAGTTAACCCGAATTACACCGAAATCAATGCCGCGCGTGAAATTGGAGATCCCAAGAGCGTCTATAGCTTTTATAGAAACCTGATTTCTATACGTCACGAAACACCGGCGTTGTCAACTGGGTCCTATCGAGACATTGATCCTAGCAACGCCGATGTGTACGCGTATACGCGGTCACAGGACGGAGAGACATATTTGGTAGTCGTTAATTTTAAGGCAGAGCCCCGGTCTTTTACCTTACCGGATGGTATGCATATTGCGGAAACACTGATTGAGTCCTCTTCCCCGGCGGCTCCGGCAGCCGGCGCAGCCTCTCTGGAGCTCCAGCCGTGGCAGAGTGGTATTTACAAGGTTAAATAA

SEQ ID NO:11

MLENKNHKKISLSGKSLLMGTLSTAAIVLSASTANAATINADNVNENQTVEVTASSVNNENNKQVTEKDSADKSTSDVAEDANTKKSNENTETTEKNTQTVVTNAPVSDVKNTNTVTAETPVDKVVNNSDQKTTNAATTDTKKDDVKQVEKKDSVDKTNAEENKDSSVKPAENATKAELKGQVKDIVEESGVDTSKLTNDQINELNKINFSKEAKSGTQLTYNDFKKIAKTLIEQDARYAIPFFNASKIKNMPAAKTLDAQSGKVEDLEIWDSWPVQDAKTGYVSNWNGYQLVIGMMGVPNVNDNHIYLLYNKYGDNDFNHWKNAGPIFGLGTPVIQQWSGSATLNKDGSIQLYYTKVDTSDNNTNHQKLASATVYLNLEKDQDKISIAHVDNDHIVFEGDGYHYQTYDQWKETNKGADNIAMRDAHVIDDDNGNRYLVFEASTGTENYQGDDQIYQWLNYGGTNKDNLGDFFQILSNSDIKDRAKWSNAAIGIIKLNDDVKNPSVAKVYSPLISAPMVSDEIERPDVVKLGNKYYLFAATRLNRGSNDDAWMATNKAVGDNVAMIGYVSDNLTHGYVPLNESGVVLTASVPANWRTATYSYYAVPVEGRDDQLLITSYITNRGEVAGKGMHATWAPSFLLQINPDNTTTVLAKMTNQGDWIWDDSSENPDMMGVLEKDAPNSAALPGEWGKPVDWDLIGGYNLKPHQPVTPIPNVPTTPETPTTPDKPEVPTTPEVPTTPETPTPEAPKNPVKKTSQSKLPKAGDKNSFAAVVLGAVSSILGAVGLTGVSKRKRNN

SEQ ID NO:12

ATGTTAGAAAACAAGAATCATAAGAAGATTAGCCTTAGTGGAAAATCACTTTTGATGGGAACTTTATCAACAGCCGCTATTGTACTGAGCGCCAGCACAGCAAACGCTGCAACAATTAATGCAGATAACGTTAACGAAAATCAAACCGTTGAAGTAACGGCATCCTCCGTGAATAACGAAAATAATAAGCAGGTGACTGAAAAAGATAGCGCGGATAAATCAACTTCAGACGTTGCCGAGGACGCCAACACAAAAAAATCTAATGAAAACACAGAAACGACAGAGAAAAATACACAAACTGTTGTAACAAACGCTCCGGTGAGTGATGTAAAGAACACGAATACGGTTACAGCAGAAACACCGGTTGATAAGGTGGTTAACAACTCTGACCAGAAAACAACTAATGCAGCGACAACAGATAC

AAAAAAAGACGACGTGAAACAAGTAGAGAAAAAAGATTCCGT

GGATAAGACCAACGCTGAAGAAAATAAGGACTCCTCAGTAAA

GCCTGCTGAAAACGCTACAAAGGCAGAATTGAAAGGGCAGGT

AAAAGATATCGTTGAGGAAAGCGGAGTCGACACGAGTAAACT

TACCAATGATCAAATTAACGAGCTGAACAAAATTAACTTTAGC

AAAGAGGCAAAAAGCGGAACGCAATTGACATATAATGATTTT

AAAAAGATCGCCAAAACCCTTATTGAACAAGATGCCCGCTATG

CCATCCCTTTTTTTAATGCAAGTAAAATTAAAAATATGCCAGC

AGCTAAAACACTCGACGCACAAAGCGGCAAAGTGGAAGATCT

TGAAATTTGGGATTCTTGGCCGGTGCAGGACGCGAAAACGGGC

TACGTGAGTAACTGGAATGGGTACCAGCTGGTCATTGGAATGA

TGGGAGTTCCGAATGTCAACGATAATCATATTTACCTCCTGTAT

AATAAATATGGTGACAACGACTTTAATCATTGGAAAAACGCGG

GCCCTATTTTCGGCCTGGGAACACCAGTGATCCAACAATGGTC

CGGATCAGCCACACTTAATAAAGACGGATCGATACAGCTTTAC

TACACTAAGGTAGACACAAGCGATAATAATACAAATCATCAA

AAACTGGCCAGTGCTACAGTCTACTTAAATTTGGAAAAAGATC

AAGACAAGATAAGTATTGCACACGTGGATAATGACCACATCGT

GTTTGAAGGAGACGGTTACCACTATCAGACATACGATCAATGG

AAGGAAACCAATAAAGGCGCAGACAATATCGCAATGCGCGAT

GCACACGTCATAGACGACGATAACGGGAATCGCTATCTCGTGT

TCGAAGCGAGTACCGGAACAGAAAACTATCAGGGTGATGACC

AGATTTATCAATGGTTGAATTATGGAGGCACTAACAAAGATAA

CCTTGGTGACTTTTTTCAAATCTTAAGCAACTCAGATATCAAAG

ATCGCGCAAAATGGTCCAATGCAGCCATCGGCATCATTAAATT

AAATGATGATGTCAAGAATCCTTCTGTCGCCAAGGTCTATTCA

CCGTTGATTTCAGCGCCTATGGTATCTGATGAGATCGAACGGC

CGGATGTCGTGAAGTTAGGAAATAAATATTATCTGTTTGCTGC

CACGCGGTTAAACAGAGGCAGCAACGATGATGCTTGGATGGC

AACAAACAAAGCAGTGGGGGACAATGTGGCAATGATTGGGTA

TGTATCTGACAACCTTACCCATGGCTATGTACCGCTTAATGAAT

CTGGAGTAGTCCTTACCGCGTCAGTTCCTGCGAATTGGCGCAC

GGCCACCTACTCTTATTATGCGGTCCCTGTCGAAGGGCGCGAT

GATCAATTGCTGATCACATCTTATATTACCAATAGAGGTGAGG

TTGCCGGTAAAGGAATGCATGCCACGTGGGCACCCAGCTTTTT

GCTTCAGATCAACCCGGACAATACGACCACAGTTCTGGCAAAG

ATGACGAACCAGGGGGACTGGATATGGGACGATAGCAGTGAA

AACCCTGACATGATGGGCGTATTAGAAAAAGACGCCCCTAATT

CAGCAGCACTCCCGGGCGAGTGGGGCAAACCAGTTGACTGGG

ATCTGATTGGTGGGTACAACCTCAAACCACATCAACCTGTCAC

ACCTATACCGAACGTGCCAACTACGCCGGAAACACCTACAACG

CCTGATAAACCAGAAGTACCAACTACCCCAGAAGTCCCGACAA

CACCGGAAACACCGACCCCGGAAGCCCCTAAAAACCCTGTCA

AAAAGACGTCACAGTCGAAACTTCCTAAAGCGGGTGATAAGA

ATTCTTTTGCCGCGGTTGTTTTAGGGGCAGTCTCAAGCATTCTG

GGCGCCGTGGGCCTCACGGGCGTTTCTAAAAGAAAACGTAACA

ATTAA

SEQ ID NO:13

MAPNLSKAKDDLIGDVVAVDGLIKPPRFTLKGKDLAVDGHPFLLDVPANIRLTPASTLVPNSDVPAAAAGSFLGFDAPAAKDRHVVPIGKLRDTRFMSIFRFKVWWTTHWVGTNGRDVENETQMMILDQSGTKSSPTGPRPYVLLLPIVEGPFRACLESGKAEDYVHMVLESGSSTVRGSVFRSAVYLHAGDDPFDLVKDAMRVVRAHLGTFRLMEEKTPPPIVDKFGWCTWDAFYLKVHPEGVWEGVRRLADGGCPPGLVLIDDGWQSICHDDDDLGSGAEGMNRTSAGEQMPCRLIKFQENYKFREYKGGMGGFVREMKAAFPTVEQVYVWHALCGYWGGLRPGAPGLPPAKVVAPRLSPGLQRTMEDLAVDKIVNNGVGLVDPRRARELYEGLHSHLQASGIDGVKVDVIHLLEMVCEEYGGRVELAKAYFAGLTESVRRHFNGNGVIASMEHCNDFMLLGTEAVALGRVGDDFWCTDPSGDPDGTFWLQGCHMVHCAYNSLWMGAFIHPDWDMFQSTHPCAAFHAASRAVSGGPVYVSDAVGCHDFDLLRRLALPDGTILRCERYALPTRDCLFADPLHDGKTMLKIWNVNKFSGVLGAFNCQGGGWSREARRNMCAAGFSVPVTARASPADVEWSHGGGGGDRFAVYFVEARKLQLLRRDESVELTLEPFTYELLVVAPVRAIVSPELGIGFAPIGLANMLNAGGAVQGFEAARKDGDVAAEVAVKGAGEMVAYSSARPRLCKVNGQDAEFKYEDGIVTVDVPWTGSSKKLSRVEYFY

SEQ ID NO:14

ATGGCTCCGAATCTGAGTAAAGCAAAGGACGATTTAATTGGAGACGTCGTCGCAGTGGATGGCCTTATCAAACCTCCTCGGTTTACACTCAAAGGAAAAGACCTCGCCGTTGATGGTCACCCGTTTCTGCTGGACGTGCCGGCGAATATCCGGTTAACACCAGCATCAACTCTTGTCCCAAACTCGGATGTTCCGGCTGCAGCTGCTGGGAGCTTTCTTGGCTTCGATGCACCCGCGGCAAAAGATCGTCATGTCGTTCCGATTGGGAAACTGCGCGATACAAGATTTATGTCTATCTTTCGTTTTAAAGTCTGGTGGACGACACATTGGGTTGGGACAAATGGACGGGATGTAGAGAACGAGACCCAGATGATGATCTTGGATCAGTCCGGAACAAAGTCTAGCCCGACTGGACCGCGCCCGTATGTTCTGCTTCTTCCGATCGTCGAAGGCCCGTTTAGAGCCTGTTTAGAATCGGGGAAAGCCGAAGATTATGTCCATATGGTGCTGGAAAGTGGGTCTAGCACCGTACGTGGTTCAGTGTTTAGAAGCGCTGTGTATCTTCATGCTGGCGATGACCCTTTTGATTTGGTGAAAGATGCAATGCGCGTCGTACGTGCGCATTTAGGAACGTTCCGGTTGATGGAGGAAAAGACACCGCCTCCGATCGTTGATAAGTTTGGCTGGTGCACCTGGGATGCCTTTTATTTAAAGGTACATCCAGAAGGAGTGTGGGAAGGAGTACGGAGATTAGCAGATGGCGGCTGCCCACCGGGGCTGGTATTAATTGACGATGGATGGCAATCGATTTGCCATGATGATGACGATCTTGGCTCAGGAGCTGAAGGAATGAACAGAACAAGCGCGGGCGAGCAAATGCCTTGTAGGCTTATTAAATT

TCAGGAAAACTATAAATTCAGGGAATACAAAGGTGGCATGGG

AGGCTTCGTGCGTGAGATGAAAGCAGCATTTCCGACCGTGGAG

CAAGTCTATGTTTGGCACGCACTGTGCGGATATTGGGGAGGTC

TCCGTCCGGGTGCACCGGGTCTGCCGCCAGCAAAAGTGGTAGC

ACCGCGATTGTCCCCGGGCTTACAGCGGACGATGGAAGATCTT

GCGGTAGATAAAATTGTTAACAATGGCGTGGGCCTTGTGGATC

CTCGCAGAGCTAGAGAACTGTATGAAGGCCTTCATTCCCACCT

CCAGGCCAGCGGTATAGATGGAGTGAAAGTAGATGTTATACAC

CTTCTTGAGATGGTTTGCGAGGAATACGGGGGGAGAGTAGAAT

TGGCTAAAGCGTATTTCGCAGGACTCACTGAGTCAGTTCGGAG

GCATTTTAACGGAAATGGTGTCATTGCGTCAATGGAGCACTGC

AACGATTTTATGCTGCTGGGTACAGAAGCTGTAGCATTAGGCC

GGGTGGGAGATGATTTCTGGTGTACAGATCCGTCTGGTGACCC

AGATGGTACGTTCTGGTTACAGGGATGCCACATGGTACACTGT

GCGTATAATAGTTTATGGATGGGCGCCTTTATACATCCGGACT

GGGACATGTTTCAATCTACACACCCCTGCGCGGCGTTCCATGC

TGCGAGCAGAGCCGTCTCCGGTGGACCAGTCTATGTATCAGAT

GCGGTTGGCTGCCATGATTTCGATCTGCTTCGTAGGCTCGCACT

GCCGGATGGCACAATTTTGCGTTGCGAACGCTATGCACTGCCG

ACAAGAGATTGTCTTTTTGCGGATCCCTTGCATGATGGCAAAA

CAATGTTGAAAATATGGAACGTAAACAAATTTTCAGGAGTTTT

AGGAGCATTTAATTGCCAGGGCGGAGGATGGTCACGCGAAGC

TCGTCGCAACATGTGCGCGGCTGGTTTTAGTGTTCCGGTGACTG

CTCGGGCTTCACCTGCAGACGTTGAGTGGTCACACGGAGGCGG

TGGTGGAGATCGTTTTGCCGTTTATTTCGTGGAGGCTCGCAAAC

TTCAATTACTGCGTCGCGACGAAAGCGTGGAACTGACATTAGA

ACCGTTTACATATGAGCTGTTAGTCGTGGCCCCCGTGAGAGCT

ATCGTGTCACCAGAATTAGGTATCGGCTTCGCACCGATTGGCC

TCGCTAATATGCTGAACGCCGGCGGGGCGGTTCAGGGTTTTGA

AGCCGCCCGTAAGGATGGAGATGTGGCTGCTGAGGTGGCTGTC

AAAGGGGCGGGTGAAATGGTCGCATACTCTAGTGCGAGACCA

AGGTTATGCAAGGTAAACGGACAGGACGCCGAATTTAAATAT

GAAGACGGAATTGTCACAGTAGACGTCCCTTGGACAGGATCCT

CCAAAAAACTTAGCAGGGTAGAATATTTCTATTAG

SEQ ID NO:15

MAHVRRKVATLNMALAGSLLMVLGAQSALAQGNFSRQEAARMAHRPGVMPRGGPLFPGRSLAGVPGFPLPSIHTQQAYDPQSDFTARWTRADALQIKAHSDATVAAGQNSLPAQLTMPNIPADFPVINPDVWVWDTWTLIDKHADQFSYNGWEVIFCLTADPNAGYGFDDRHVHARIGFFYRRAGIPASRRPVNGGWTYGGHLFPDGASAQVYAGQTYTNQAEWSGSSRLMQIHGNTVSVFYTDVAFNRDANANNITPPQAIITQTLGRIHADFNHVWFTGFTAHTPLLQPDGVLYQNGAQNEFFNFRDPFTFEDPKHPGVNYMVFEGNTAGQRGVANCTEADLGFRPNDPNAETLQEVLDSGAYYQKANIGLAIATDSTLSKWKFLSPLISANCVNDQTERPQVYLHNGKYYIFTISHRTTFAAGVDGPDGVYGFVGDGIRSDFQPMNYGSGLTMGNPTDLNTAAGTDFDPSPDQNPRAFQSYSHYVMPGGLVESFIDTVENRRGGTLAPTVRVRIAQNASAVDLRYGNGGLGGYGDIPANRADVNIAGFIQDLFGQPTSGLAAQASTNNAQVLAQVRQFLNQ

SEQ ID NO:16

MLNKAGIAEPSLWTRADAMKVHTDDPTATMPTIDYDFPVMTDKYWVWDTWPLRDINGQVVSFQGWSVIFALVADRTKYGWHNRNDGARIGYFYSRGGSNWIFGGHLLKDGANPRSWEWSGCTIMAPGTANSVEVFFTSVNDTPSESVPAQCKGYIYADDKSVWFDGFDKVTDLFQADGLYYADYAENNFWDFRDPHVFINPEDGKTYALFEGNVAMERGTVAVGEEEIGPVPPKTETPDGARYCAAAIGIAQALNEARTEWKLLPPLVTAFGVNDQTERPHVVFQNGLTYLFTISHHSTYADGLSGPDGVYGFVSENGIFGPYEPLNGSGLVLGNPSSQPYQAYSHYVMTNGLVTSFIDTIPSSDPNVYRYGGTLAPTIKLELVGHRSFVTEVKGYGYIPPQIEWLAEDESSNSAAALSLLNK

SEQ ID NO:17

MNKLKIVKCILIGSMICSGIITQQTFASTNDMNYKETYGVSHITRYNMSKIPMEQNDLKFKVPQFNASTLKNIASAKGYDKNGNLIDLDVWDSWPLQNGDGTVANYHGYHIVFALAGDPKNQDDTSIYMFYQKIGENSIDSWKNAGKVFKDSDKYVANDPYLKYQTQEWSGSATLTSDGQVRLFYTDFSGVAKDGGTDASNQVITTTQVNLSQPDSNTINIDSVSDHKSVFDGGNGTIYQNVQQFIDEGKWSSGDNHTLRDPHYVEDNGRKYLVFEANTGTNDGYQGDTSLLNKAFYGRSQSFFKTEKDQLLIDTNKKHDASLANGALGIIELNNDYTLKKEMKPLIASNTVTDEIERANVFKMNGRWYLFTDSRGSKMTINGISSKDIYMLGFSSNSLTGPYKPLNKTGLVLNLNLDPTDLTFTYSHFAVPQTNGKNVVITSYITNRGMYSDHHSSFAPSFLLNIKGTKTSVISNSILQQGQLTIDNY

SEQ ID NO:18

MNIKKFAKQATVLTFTTALLAGGATQAFAKETNQKPYKETYGISHITRHDMLQIPEQQKNEKYQVPEFDSSTIKNISSAKGLDVWDSWPLQNADGTVANYHGYHIVFALAGDPKNADDTSIYMFYQKVGETSIDSWKNAGRVFKDSDKFDANDSILKDQTQEWSGSATFTSDGKIRLFYTDFSGKHYGKQTLTTAQVNVSASDSSLNINGVEDYKSIFDGDGKTYQNVQQFIDEGNYSSGDNHTLRDPHYVEDKGHKYLVFEANTGTEDGYQGEESLFNKAYYGKSTSFFRQESQKLLQSDKKRTAELANGALGMIELNDDYTLKKVMKPLIASNTVTDEIERANVFKMNGKWYLFTDSRGSKMTIDGITSNDIYMLGYVSNSLTGPYKPLNKTGLVLKMDLDPNDVTFTYSHFAVPQAKGNNVVITSYMTNRGFYADKQSTFAPSFLLNIKGKKTSVVKDSILEQGQLTVNK

SEQ ID NO:19

ATGAACATAAAGAAGTTTGCGAAGCAGGCGACAGTATTAACGTTCACCACGGCACTCTTGGCTGGGGGCGCAACCCAGGCTTTTGCTAAAGAGACCAACCAGAAGCCGTATAAGGAAACGTATGGGATTTCCCACATTACAAGACATGATATGCTGCAGATCCCAGAACAACAGAAAAACGAAAAATACCAAGTCCCGGAATTTGATTCTTCGACCATTAAAAACATTTCCTCAGCTAAAGGGCTGGACGTATGGGATTCTTGGCCCCTTCAGAATGCAGATGGAACTGTTGCCAATTACCATGGCTATCATATTGTCTTTGCGCTGGCGGGGGATCCGAAAAACGCAGATGATACGTCCATCTACATGTTTTACCAAAAAGTAGGGGAAACAAGCATTGATTCCTGGAAAAACGCTGGCCGCGTCTTCAAGGATTCAGACAAATTTGATGCGAATGATAGTATACTGAAAGATCAGACGCAAGAGTGGAGCGGTTCCGCAACTTTCACGAGCGACGGAAAAATCCGTCTGTTCTACACCGATTTTAGCGGCAAGCATTACGGGAAGCAGACTCTGACGACGGCCCAAGTCAATGTATCTGCATCGGACTCTTCCCTGAATATTAACGGAGTTGAAGATTACAAATCTATATTTGACGGTGATGGCAAAACCTACCAAAACGTCCAGCAGTTCATAGACGAAGGCAATTATAGTTCAGGGGACAATCATACTTTACGTGACCCACATTATGTCGAAGATAAAGGACATAAATATCTGGTTTTTGAGGCGAACACTGGCACAGAGGACGGGTATCAGGGGGAAGAGTCCCTGTTCAATAAAGCTTATTACGGCAAGTCAACATCTTTTTTTCGCCAAGAATCACAAAAGCTGCTGCAATCAGATAAGAAAAGGACTGCTGAGTTAGCGAACGGCGCATTAGGCATGATTGAACTGAATGACGACTACACACTTAAAAAAGTTATGAAACCATTAATTGCGTCGAACACCGTTACTGATGAAATTGAAAGGGCGAATGTTTTTAAGATGAACGGGAAATGGTATCTCTTTACGGATAGTCGCGGATCAAAGATGACCATCGATGGTATCACGTCCAATGACATTTACATGCTTGGATATGTTAGCAATTCCTTAACTGGACCTTATAAACCGCTTAACAAAACAGGCTTGGTACTGAAAATGGATTTGGATCCAAATGACGTCACATTTACATACTCTCATTTCGCTGTTCCGCAGGCAAAGGGCAACAATGTTGTGATTACATCTTATATGACCAACCGCGGCTTTTATGCGGATAAGCAATCAACCTTCGCACCATCATTCCTGCTTAACATCAAGGGCAAAAAAACGAGCGTAGTCAAAGATTCTATCTTGGAACAGGGTCAGCTGACGGTCAACAAATAA

SEQ ID NO:20

ATGAACATCAAAAAGTTTGCAAAACAAGCAACAGTATTAACCTTTACTACCGCACTGCTGGCAGGAGGCGCAACTCAAGCGTTTGCGAAAGAAACGAACCAAAAGCCATATAAGGAAACATACGGCATTTCCCATATTACACGCCATGATATGCTGCAAATCCCTGAACAGCAAAAAAATGAAAAATATCAAGTTCCTGAATTCGATTCGTCCACAATTAAAAATATCTCTTCTGCAAAAGGCCTGGACGTTTGGGACAGCTGGCCATTACAAAACGCTGACGGCACTGTCGCAAACTATCACGGCTACCACATCGTCTTTGCATTAGCCGGAGATCCTAAAAATGCGGATGACACATCGATTTACATGTTCTATCAAAAAGTCGGCGAAACTTCTATTGACAGCTGGAAAAACGCTGGCCGCGTCTTTAAAGACAGCGACAAATTCGATGCAAATGATTCTATCCTAAAAGACCAAACACAAGAATGGTCAGGTTCAGCCACATTTACATCTGACGGAAAAATCCGTTTATTCTACACTGATTTCTCCGGTAAACATTACGGCAAACAAACACTGACAACTGCACAAGTTAACGTATCAGCATCAGACAGCTCTTTGAACATCAACGGTGTAGAGGATTATAAATCAATCTTTGACGGTGACGGAAAAACGTATCAAAATGTACAGCAGTTCATCGATGAAGGCAACTACAGCTCAGGCGACAACCATACGCTGAGAGATCCTCACTACGTAGAAGATAAAGGCCACAAATACTTAGTATTTGAAGCAAACACTGGAACTGAAGATGGCTACCAAGGCGAAGAATCTTTATTTAACAAAGCATACTATGGCAAAAGCACATCATTCTTCCGTCAAGAAAGTCAAAAACTTCTGCAAAGCGATAAAAAACGCACGGCTGAGTTAGCAAACGGCGCTCTCGGTATGATTGAGCTAAACGATGATTACACACTGAAAAAAGTGATGAAACCGCTGATTGCATCTAACACAGTAACAGATGAAATTGAACGCGCGAACGTCTTTAAAATGAACGGCAAATGGTACCTGTTCACTGACTCCCGCGGATCAAAAATGACGATTGACGGCATTACGTCTAACGATATTTACATGCTTGGTTATGTTTCTAATTCTTTAACTGGCCCATACAAGCCGCTGAACAAAACTGGCCTTGTGTTAAAAATGGATCTTGATCCTAACGATGTAACCTTTACTTACTCACACTTCGCTGTACCTCAAGCGAAAGGAAACAATGTCGTGATTACAAGCTATATGACAAACAGAGGATTCTACGCAGACAAACAATCAACGTTTGCGCCAAGCTTCCTGCTGAACATCAAAGGCAAGAAAACATCTGTTGTCAAAGACAGCATCCTTGAACAAGGACAATTAACAGTTAACAAATAA

SEQ ID NO:21

SEQ ID NO:22

ATGAGAATTAACCACAATATTGCAGCGCTTAACACACTGAACCGTTTGTCTTCAAACAACAGTGCGAGCCAAAAGAACATGGAGAAACTTTCTTCAGGTCTTCGCATCAACCGTGCGGGAGATGACGCAGCAGGTCTTGCGATCTCTGAAAAAATGAGAGGACAAATCAGAGGTCTTGAAATGGCTTCTAAAAACTCTCAAGACGGAATCTCTCTTATCCAAACAGCTGAGGGTGCATTAACTGAAACTCATGCGATCCTTCAACGTGTTCGTGAGCTAGTTGTTCAAGCTGGAAACACTGGAACTCAGGACAAAGCAACTGATTTGCAATCTATTCAAGATGAAATTTCAGCTTTAACAGATGAAATCGATGGTATTTCAAATCGTACAGAATTCAATGGTAAGAAATTGCTCGATGGCACTTACAAAGTTGACACAGCTACTCCTGCAAATCAAAAGAACTTGGTATTCCAAATCGGAGCAAATGCTACACAGCAAATCTCTGTAAATATTGAGGATATGGGTGCTGACGCTCTTGGAATTAAAGAAGCTGATGGTTCAATTGCAGCTCTTCATTCAGTTAATGATCTTGACGTAACAAAATTCGCAGATAATGCAGCAGATACTGCTGATATCGGTTTCGATGCTCAATTGAAAGTTGTTGATGAAGCGATCAACCAAGTTTCTTCTCAACGTGCTAAGCTTGGTGCGGTACAAAATCGTCTAGAGCACACAATTAACAACTTAAGCGCTTCTGGTGAAAACTTGACAGCTGCTGAGTCTCGTATCCGTGACGTTGACATGGCTAAAGAGATGAGCGAATTCACAAAGAACAACATTCTTTCTCAGGCTTCTCAAGCTATGCTTGCTCAAGCAAACCAACAGCCGCAAAACGTACTTCAATTATTACGTTAA

SEQ ID NO:23

GGAATTGACGCCCCAAAGCATATTGATATTCACAGGAAAGAAATTTACTTGACCATTCAGGAAGAAAATAACCGTGCAGCAGCGTTATCCAGCGATGTGATCTCCGCATTATCCTCACAAAAAAAGTGAGGATTTTTTTATTTTTGTATTAACAAAATCAGAGACAATCCGATATTAATGATGTAGCCGGGAGGAGGCGCAAAAGACTCAGCCAGTTACAAAATAAGGGCACAAGGACGTGCCTTAACAACATATTCAGGGAGGAACAAAACA

SEQ ID NO:24

GCACAAGGACGT

SEQ ID NO:25

ATTCAGGGAGGAA

SEQ ID NO:26

AGGGAGGA

SEQ ID NO:27

ATGCTAGTTTTATCGCGGAAAATAAACGAAGCGATTCAAATAGGTGCTGATATTGAAGTAAAAGTGATTGCGGTTGAAGGGGATCAAGTGAAGCTTGGAATTGACGCCCCAAAGCATATTGATATTCACAGGAAAGAAATTTACTTGACCATTCAGGAAGAAAATAACCGTGCAGCAGCGTTATCCAGCGATGTGATCTCCGCATTATCCTCACAAAAAAAGTGA

SEQ ID NO:28

TAAGGGCACAAGGACGTGCCTTA

SEQ ID NO:29

GCACAAGAACGT

SEQ ID NO:30

ATTTAGGGAGGAA

SEQ ID NO:31

ATGAAAATCAATCAATTTGGAACACAATCCGTTAATCCATATCAAAAAAATTATGATAAGCAAGCGGTGCAAAAAACTGTTGCACAACCTCAAGATAAAATTGAAATTTCATCACAGGCTAAAGAAATGCAACATGCATCCGACGCAGTCACTGGTTCACGACAGGAAAAAATTGCGCAGCTTAAAGCGCAAATTGAAAACGGGTCATACAAAGTAGACGCAAATCATATTGCGAAAAATATGATTAATTTTTATAAAAAGCAATAA

SEQ ID NO:32

ATGCAATCCTTGAATTATGAAGATCAGGTGCTTTGGACGCGCTGGAAAGAGTGGAAAGATCCTAAAGCCGGTGACGACTTAATGCGCCGTTACATGCCGCTTGTCACATATCATGTAGGCAGAATTTCTGTCGGACTGCCGAAATCAGTGCATAAAGACGATCTTATGAGCCTTGGTATGCTTGGTTTATATGATGCCCTTGAAAAATTTGACCCCAGCCGGGACTTAAAATTTGATACCTACGCCTCGTTTAGAATTCGCGGCGCAATCATAGACGGGCTTCGTAAAGAAGATTGGCTGCCCAGAACCTCGCGCGAAAAAACAAAAAAGGTTGAAGCAGCAATTGAAAAGCTTGAACAGCGGTATCTTCGGAATGTATCGCCCGCGGAAATTGCAGAGGAACTCGGAATGACGGTACAGGATGTCGTGTCAACAATGAATGAAGGTTTTTTTGCAAATCTGCTGTCAATTGATGAAAAGCTCCATGATCAAGATGACGGGGAAAACATTCAAGTCATGATCAGAGATGACAAAAATGTTCCGCCTGAAGAAAAGATTATGAAGGATGAACTGATTGCACAGCTTGCGGAAAAAATTCACGAACTCTCTGAAAAAGAACAGCTGGTTGTCAGTTTGTTCTACAAAGAGGAGTTGACACTGACAGAAATCGGACAAGTATTAAATCTTTCTACGTCCCGCATATCTCAGATCCATTCAAAGGCATTATTTAAATTAAAGAATCTGCTGGAAAAAGTGATACAATAA

SEQ ID NO:33

MSRLVVVSNRIAPPDEHAASAGGLAVGILGALKAAGGLWFGWSGETGNEDQPLKKVKKGNITWASFNLSEQDLDEYYNQFSNAVLWPAFHYRLDLVQFQRPAWDGYLRVNALLADKLLPLLQDDDIIWIHDYHLLPFAHELRKRGVNNRIGFFLHIPFPTPEIFNALPTYDTLLEQLCDYDLLGFQTENDRLAFLDCLSNLTRVTTRSAKSHTAWGKAFRTEVYPIGIEPKEIAKQAAGPLPPKLAQLKAELKNVQNIFSVERLDYSKGLPERFLAYEALLEKYPQHHGKIRYTQIAPTSRGDVQAYQDIRHQLENEAGRINGKYGQLGWTPLYYLNQHFDRKLLMKIFRYSDVGLVTPLRDGMNLVAKEYVAAQDPANPGVLVLSQFAGAANELTSALIVNPYDRDEVAAALDRALTMSLAERISRHAEMLDVIVKNDINHWQECFISDLKQIVPRSAESQQRDKVATFPKLA

SEQ ID NO:34

ATGTCCCGTTTAGTAGTGGTGTCCAATCGTATCGCGCCGCCGGACGAACATGCTGCCTCAGCTGGCGGCCTGGCCGTAGGAATCCTGGGCGCCCTCAAGGCAGCTGGAGGATTATGGTTCGGCTGGTCTGGCGAGACAGGAAATGAGGATCAACCACTTAAGAAAGTGAAAAAAGGCAATATCACATGGGCTTCCTTCAACCTCAGCGAGCAAGACCTGGATGAGTATTATAACCAGTTTAGCAATGCTGTGCTTTGGCCGGCTTTTCATTACAGGTTAGATTTGGTTCAGTTTCAAAGACCCGCATGGGATGGATACCTCCGAGTGAATGCGTTGTTGGCAGATAAACTTCTCCCGCTCCTTCAGGATGATGATATTATCTGGATTCATGACTACCATCTTCTCCCTTTCGCCCACGAATTGCGCAAACGGGGCGTGAACAATAGGATAGGTTTTTTTTTGCACATTCCTTTTCCCACACCGGAAATTTTCAACGCGCTTCCGACATACGATACTTTACTTGAACAGCTGTGTGATTACGATCTTCTCGGCTTCCAAACTGAAAATGACAGACTTGCCTTTTTGGATTGCCTCTCAAATTTGACGAGGGTTACGACTAGAAGTGCCAAGAGCCATACAGCGTGGGGAAAAGCATTCAGGACAGAAGTTTATCCTATTGGGATCGAGCCTAAGGAAATTGCGAAACAAGCGGCAGGGCCATTACCTCCGAAACTTGCGCAACTCAAAGCGGAATTAAAGAACGTACAAAACATTTTTAGCGTCGAAAGACTTGATTATTCTAAGGGTCTCCCGGAAAGATTCTTAGCCTACGAGGCATTGCTTGAAAAATATCCACAGCATCATGGGAAAATTCGTTATACGCAAATCGCTCCGACTAGCAGAGGCGACGTCCAAGCGTATCAGGACATACGCCACCAACTTGAAAATGAAGCGGGTAGAATCAATGGCAAATATGGACAACTGGGGTGGACACCTCTTTATTACTTGAATCAACATTTCGATAGAAAATTGTTGATGAAAATCTTTCGTTATTCTGACGTCGGACTGGTGACACCGCTGAGAGATGGCATGAACTTAGTTGCCAAGGAATATGTAGCTGCGCAAGACCCTGCTAATCCGGGAGTACTGGTGCTCTCACAATTTGCAGGGGCCGCGAATGAACTTACATCAGCTCTCATCGTTAATCCGTATGACAGGGATGAAGTCGCAGCGGCGCTTGACCGGGCTCTTACAATGTCCTTAGCGGAGAGAATTAGCAGACATGCTGAAATGCTGGATGTGATTGTGAAGAACGATATCAATCATTGGCAAGAATGTTTCATTTCTGACTTAAAGCAAATTGTCCCGCGTTCAGCTGAGTCACAGCAACGGGATAAAGTCGCCACATTTCCCAAACTGGCATAA

SEQ ID NO:35

MDIVFAADDNYAAYLCVAAKSVEAAHPDTEIRFHVLDAGISEANRAAVAANLRGGGNIRFIDVNPEDFAGFPLNIRHISITTYARLKLGEYIADCDKVLYLDIDVLVRDSLKPLWDTDLGDNWLGACIDLFVERQNAYKQKIGMADGEYYFNAGVLLINLKKWRQHDIFKMACEWVEQYKDVMQYQDQDILNGLFKGGVCYANSRFNFMPTNDAFMANRFASRHTDPLYRDRTYTAMPVAVSHYCGPAKPWHRDCTAWGAERFTELAGSLTSVPEEWRGKLAVPHRVFPTKRMLQRWRRKLSARFLRKIY

SEQ ID NO:36

ATGGATATTGTATTTGCGGCAGATGATAATTATGCTGCGTATCTCTGTGTTGCCGCCAAATCCGTGGAAGCCGCTCACCCCGATACAGAGATCCGGTTCCATGTACTTGACGCTGGCATTTCCGAAGCAAACCGGGCAGCAGTTGCAGCCAATCTCCGCGGTGGCGGTAATATTCGTTTTATAGATGTGAACCCGGAAGACTTTGCCGGCTTTCCATTGAATATTCGCCATATTAGTATAACAACTTACGCACGTCTGAAACTTGGGGAGTACATTGCGGATTGTGACAAGGTACTTTATCTCGATATAGATGTACTTGTGCGTGATAGTCTTAAACCGTTATGGGATACAGATCTTGGAGATAATTGGCTTGGTGCATGCATCGACTTATTTGTAGAGAGACAAAACGCTTATAAGCAAAAAATTGGCATGGCTGACGGTGAATATTACTTTAACGCAGGGGTGCTCCTGATTAACCTTAAGAAGTGGCGGCAACACGATATCTTCAAAATGGCTTGCGAATGGGTTGAGCAGTATAAGGATGTAATGCAGTACCAGGACCAAGACATCCTGAATGGATTATTTAAAGGTGGAGTGTGTTACGCTAATAGCAGATTCAATTTCATGCCGACCAATGATGCTTTCATGGCAAACCGGTTTGCTTCACGCCATACGGACCCATTGTATAGAGATAGAACGTATACAGCAATGCCTGTGGCCGTTTCGCATTATTGTGGTCCGGCGAAACCGTGGCATCGCGATTGCACAGCATGGGGCGCAGAAAGATTTACAGAACTTGCAGGAAGTCTGACATCAGTTCCGGAGGAATGGCGCGGAAAACTTGCGGTGCCTCATCGGGTGTTCCCGACTAAACGTATGCTGCAAAGATGGAGACGCAAACTCTCCGCTCGATTTCTGAGAAAAATCTATTGA

SEQ ID NO:37

MIIVHLCGGLGNQMFQYAAGLAAAHRIGSEVKFDTHWFDATCLHQGLELRRVFGLELPEPSSKDLRKVLGACVHPAVRRLLAGHFLHGLRPKSLVIQPHFHYWTGFEHLPDNVYLEGYWQSERYFSNIADIIRQQFRFVEPLDPHNAALMDEMQSGVSVSLHIRRGDYFNNPQMRRVHGVDLSEYYPAAVATMIEKTNAERFYVFSDDPQWVLEHLKLPVSYTVVDHNRGAASYRDMQLMSACRHHIIANSTFSWWGAWLNPRPDKVVIAPRHWFNVDVFDTRDLYCPGWIVL

SEQ ID NO:38

ATGATTATTGTGCACCTTTGCGGTGGTTTAGGAAACCAGATGTTCCAATATGCGGCAGGCCTTGCCGCGGCGCACAGAATTGGCAGCGAAGTTAAATTCGATACGCATTGGTTCGATGCGACATGTCTGCATCAGGGTTTAGAGTTGCGCAGAGTTTTTGGTTTGGAGCTTCCGGAACCCAGTTCCAAGGACCTGAGAAAAGTTTTAGGCGCTTGCGTTCATCCTGCAGTGAGACGGCTTTTGGCTGGTCACTTTCTGCATGGCTTACGGCCGAAGTCGCTCGTTATCCAACCCCATTTTCACTACTGGACGGGCTTTGAACATTTACCGGACAACGTATACTTAGAGGGCTACTGGCAGTCTGAAAGATACTTTTCAAATATTGCTGATATTATAAGACAACAGTTTCGTTTTGTCGAACCGTTAGATCCGCATAATGCGGCCCTCATGGATGAAATGCAGTCCGGGGTTAGTGTTTCACTTCATATTCGCCGTGGAGACTACTTCAACAACCCGCAAATGCGTCGTGTCCACGGCGTAGACTTGAGCGAGTACTACCCGGCGGCAGTCGCGACGATGATCGAAAAAACCAACGCAGAACGGTTTTACGTGTTTTCAGATGACCCACAGTGGGTATTGGAACATCTGAAACTGCCTGTTTCTTACACCGTGGTGGACCATAACCGAGGCGCTGCCTCGTATAGGGATATGCAACTTATGTCTGCTTGCCGACACCATATCATTGCGAATTCAACATTCAGCTGGTGGGGAGCTTGGCTTAACCCTCGGCCGGACAAGGTCGTGATCGCTCCACGCCATTGGTTTAACGTAGATGTATTCGACACACGCGATTTATATTGCCCAGGGTGGATAGTACTGTAA

SEQ ID NO:39

MNVLSSICYGGDYNPEQWPEEIWYEDAKLMQKAGVNLVSLGIFSWSKIEPSDGVFDFEWLDKVIDILYDHGVYINLGTATATTPAWFVKKYPDSLPIDESGVILSFGSRQHYCPNHPQLITHIKRLVRAIAERYKNHPALKMWHVNNEYACHVSKCFCENCAVAFRKWLKERYKTIDELNERWGTNFWGQRYNHWDEINPPRKAPTFINPSQELDYYRFMNDSILKLFLTEKEILREVTPDIPVSTNFMGSFKPLNYFQWAQHVDIVTWDSYPDPREGLPIQHAMMNDLMRSLRKGQPFILMEQVTSHVNWRDINVPKPPGVMRLWSYATIARGADGIMFFQWRQSRAGAEKFHGAMVPHFLNENNRIYREVTQLGQELKKLDCLVGSRIKAEVAIIFDWENWWAVELSSKPHNKLRYIPIVEAYYRELYKRNIAVDFVRPSDDLTKYKVVIAPMLYMVKEGEDENLRQFVANGGTLIVSFFSGIVDENDRVHLGGYPGPLRDILGIFVEEFVPYPETKVNKIYSNDGEYDCTTWADIIRLEGAEPLATFKGDWYAGLPAVTRNCYGKGEGIYVGTYPDSNYLGRLLEQVFAKHHINPILEVAENVEVQQRETDEWKYLIIINHNDYEVTLSLPEDKIYQNMIDGKCFRGGELRIQGVDVAVLREHDEAGKV

SEQ ID NO:40

ATGAACGTTTTGTCGTCTATTTGCTACGGTGGGGATTATAACCCGGAGCAATGGCCGGAGGAGATCTGGTATGAAGATGCTAAATTAATGCAAAAAGCGGGGGTCAATTTAGTGAGCTTAGGCATTTTTTCTTGGTCTAAAATCGAACCGTCTGATGGGGTTTTTGACTTTGAATGGTTAGATAAAGTCATTGATATCCTTTACGATCACGGCGTGTATATTAATCTGGGAACAGCGACGGCTACTACTCCGGCGTGGTTTGTAAAAAAGTATCCTGATTCACTCCCGATCGATGAATCCGGCGTCATCTTATCTTTTGGTTCTCGGCAACATTATTGCCCGAACCACCCTCAATTGATCACACATATTAAACGTCTTGTTCGGGCTATCGCCGAACGCTATAAAAACCATCCAGCGCTTAAGATGTGGCACGTCAATAACGAGTATGCATGTCATGTGTCAAAATGCTTTTGCGAGAATTGTGCTGTGGCGTTTCGAAAATGGTTAAAAGAACGTTATAAAACAATCGACGAACTTAACGAAAGATGGGGGACTAATTTCTGGGGCCAGAGATATAATCACTGGGACGAAATTAACCCGCCGCGAAAAGCACCGACATTCATCAATCCTAGCCAAGAACTTGACTATTATCGATTTATGAACGATTCTATCCTGAAACTGTTTTTAACAGAAAAAGAAATTTTAAGAGAAGTGACACCTGACATCCCTGT

CTCAACAAATTTCATGGGAAGCTTCAAGCCGTTGAACTATTTTC

AATGGGCACAACACGTGGATATTGTTACGTGGGATTCTTATCC

GGACCCTCGCGAAGGTCTTCCGATCCAACATGCCATGATGAAT

GATTTAATGCGTTCACTCAGGAAGGGCCAACCGTTTATTCTGA

TGGAGCAGGTAACAAGCCATGTGAATTGGAGAGATATCAACG

TCCCTAAACCGCCAGGCGTAATGAGGCTGTGGTCCTATGCAAC

TATTGCGCGGGGAGCAGATGGCATTATGTTTTTTCAGTGGCGT

CAATCACGAGCTGGGGCTGAAAAATTTCACGGAGCGATGGTGC

CGCATTTTTTAAATGAAAACAATAGAATTTATCGCGAAGTTAC

ACAGCTTGGACAGGAACTGAAGAAACTTGATTGTTTGGTCGGG

TCACGTATAAAAGCCGAAGTCGCGATAATATTTGATTGGGAAA

ACTGGTGGGCCGTAGAGTTATCCTCGAAACCACACAACAAACT

CCGATACATTCCCATTGTTGAAGCATACTATCGCGAACTGTAT

AAAAGAAATATTGCAGTGGATTTTGTGCGGCCATCTGATGACT

TGACGAAGTATAAGGTTGTGATCGCACCAATGTTATATATGGT

AAAAGAAGGCGAAGATGAAAACTTACGACAATTCGTGGCTAA

TGGAGGCACATTGATCGTCTCATTCTTTAGCGGAATTGTGGAC

GAAAACGATCGCGTTCATTTAGGCGGTTATCCTGGCCCTCTCC

GCGATATCCTTGGCATATTTGTTGAGGAGTTTGTACCTTACCCA

GAAACTAAGGTGAATAAAATTTATTCCAACGATGGGGAATATG

ACTGTACAACATGGGCGGACATTATTCGTTTAGAAGGTGCGGA

GCCGTTAGCTACCTTTAAAGGCGATTGGTATGCGGGCCTGCCA

GCGGTCACGAGGAATTGCTATGGTAAAGGCGAAGGTATTTATG

TGGGCACTTACCCTGATAGCAATTATTTAGGCAGACTGTTGGA

ACAAGTGTTTGCCAAACATCACATTAATCCTATCCTCGAAGTG

GCGGAGAATGTCGAAGTCCAACAGAGGGAAACAGATGAATGG

AAATATCTGATTATTATTAACCACAACGATTATGAAGTAACCC

TGTCCTTACCGGAAGATAAGATCTACCAAAATATGATAGACGG

AAAATGTTTTAGGGGCGGAGAGCTGCGTATCCAAGGGGTGGA

CGTTGCAGTCTTACGGGAACACGACGAAGCAGGAAAAGTTTA

A

SEQ ID NO:41

MKKAISCVFLISALILSSFQVPVQGQAMSKTTSAAGNSVSYDGERRVNFNENWRFQRETNGSIAGAQNPGFDDSSWRKLNLPHDWSIELDFNKNSLATHEGGYLDGGIGWYRKTFTIPESMKGKRISLDFDGVYMNSTTYLNGEVLGTYPFGYNAFSYDISDKLYKDGRANVLVVKVNNTQPSSRWYSGSGIYRNVYLTVTDPIHVARYGTFVTTPNLEKSIKEDRADVNIKTKISNDAAEAKQVKIKSTIYDGAGNTVQTVETEEKTAAAGTVTPFEQNTVIKQPKLWSIDKPYRYNLVTEVIVGGQTVDTYETKFGVRYFKFDENEGFSLNGEYMKLHGVSMHHDLGALGAATNARGVERQMQIMKDMGVNAIRVTHNPASPELLEAANKLGLFIIEEAFDSWAQSKKPYDYGRFFNAWAEHDIKEMVDRGKNEPAIIMWSIGNEIYDTTNAAGVETARNLVGWVKEIDTTRPTTIGEDKTRGDKVNVTPINSYIKEIFNIVDVVGLNYSENNYDGYHKQNPSWKLYGSETSSATRSRGVYTHPYQYNQSTKYADLQQSSYDNDYVGWGRTAEDAWKYDRDLKHIAGQFIWTGFDYIGEPTPYYNSYPAKSSYFGAVDTAGFPKDIFYYYQSQWKKEPMVHLLPHWNWKEGEKVRVLAYTNASKVELVLNGESLGEKNYDNKQTSWGAPYKETKDGKTYLEWAVPFKPGKLEAVAKDENGKVIARDQVVTAGEPASVRLTADRKVVKADGTDLSFITADIVDSKGIVVPDADHLITFNVTGQGELAGVDNGNASSVERYKDNKRKAFSGKALAIVQSSKLSGKITVHASVAGLSSDSTSVFTVTPADHDKKIVAGIDDVNLTVDVNEAPKLPSEIKVYYSDESAAAKNVTWDEVDPKQYSTVGEFTVEGSVEGTSLKAKAFVIVKGIVAVKPYSTATKVGVQPVLPEKATLLYSDGTTKGATVTWDEIPEDKLAKEGRFTVEGSVEGTDLKANVYVRVTNEVKSVNIMLQEQGSAYPKLEATFTNPADNLQHLNDGIKSYTNNPVNRWTNWTRTPRDAGDSITVNFGKKHVINNLDLFVFTDSGTVVPEKAEVQYWDGTAWKDVENLTQPSPYVVEKNELTFDAVATEKLKFHLTPSVKGKFLALTEAEVYADQIVMGETAKLQSITVNGKALEGFDHAKKNYELVLPYGSELPKIEAAAADNATVTILPAFSYPGTAKLFVTSEDGKVTTEYSIGVSTEEPKLVSAELSADKTNVMEDDIIDLKVIGLFESKEKIDVTDSQPTYEFDQQIIKIEGNKLYALETGNVKVKVTVTYKGVSVTTPALEFTIAKNPAPKYITSLEPVTVVVKKGEAPELPATVVAHYNRGIPRDVKVKWERINPSKYQQLGEFTVSGMVEGTDIKAQAKVIVKGAVAVEDIRMAVLLKQMPQLPGKVTVYYSDGAEEQRAVKWEEIPQEELENVGEFKVKGDVNGVKLKATATIRVTDEVGGEQNISRAKNGYEYPKAEASFTNNGPGSSDRIEAINDDVISYEANPHNRWTNWQPVPRAGDWVSITFGDYEPTEYDVDSMEIHWFADHGTSYPERFQIEYKSGDSWKEVTSLKSDPASPALGKANVYSFDRVKTSAIRVKMTAQAGKSLAITELKVFSKWPKAGTEPEVTDIKVGGKSILEDFEQKGDHYEVTIDAGDANVMPKINVKAKDQTSITIVPAVTSPSTAKVIAKSEDGKKVKVYSIHYK

SEQ ID NO:42

ATGAAGAAAGCGATCAGCTGCGTTTTTCTGATATCTGCACTCATCTTAAGCAGCTTTCAAGTACCGGTGCAGGGGCAAGCGATGTCTAAAACTACGTCAGCGGCCGGAAACAGCGTTTCATACGATGGTGAACGGAGAGTTAATTTCAATGAAAATTGGCGGTTCCAGCGGGAAACCAATGGTAGCATTGCAGGTGCACAAAATCCAGGGTTTGATGACTCTTCCTGGAGAAAGCTTAATTTACCGCATGACTGGAGCATAGAACTTGATTTCAATAAAAACTCATTGGCGACGCACGAAGGGGGGTATTTGGACGGCGGCATCGGGTGGTACCGAAAAACGTTCACCATACCTGAATCAATGAAAGGCAAAAGAATCTCTCTGGATTTCGATGGTGTATATATGAACTCAACAACATATTTAAACGGGGAGGTATTAGGTACATATCCGTTTGGCTATAACGCCTTTTCTTACGACATTTCCGATAAACTGTATAAAGATGGAAGAGCGAACGTGCTTGTAGTGAAGGTCAATAATACGCAACCATCTAGTCGATGGTATTCAGGAAGCGGCATATATCGTAATGTGTATTTAACTGTAACGGATCCCATTCATGTTGCGCGGTATGGCACATTTGTCAC

AACACCTAACTTGGAGAAATCAATTAAAGAAGATCGGGCAGA

CGTCAACATTAAAACGAAAATTTCTAACGATGCGGCGGAAGCA

AAACAAGTCAAAATCAAATCAACAATATATGACGGAGCTGGT

AACACAGTACAGACGGTTGAAACGGAGGAAAAAACAGCAGCA

GCAGGTACCGTAACCCCGTTTGAGCAAAACACGGTAATAAAAC

AGCCTAAACTGTGGTCCATCGACAAACCGTACCGTTATAACCT

GGTAACGGAGGTTATTGTTGGCGGCCAAACGGTGGATACTTAT

GAAACTAAATTCGGAGTCAGGTATTTTAAGTTTGACGAGAATG

AGGGGTTTTCTCTGAACGGAGAGTACATGAAGCTTCATGGCGT

CTCCATGCATCACGATTTAGGAGCTTTAGGCGCGGCGACAAAC

GCTAGAGGGGTTGAAAGGCAGATGCAGATTATGAAAGACATG

GGAGTCAATGCCATCAGAGTAACACATAACCCGGCAAGCCCTG

AACTTCTGGAAGCCGCGAACAAGCTCGGCCTGTTTATTATTGA

GGAAGCTTTTGATTCGTGGGCTCAGAGTAAGAAACCCTATGAC

TATGGAAGATTTTTCAATGCGTGGGCGGAGCACGATATAAAAG

AAATGGTTGACAGAGGGAAAAACGAACCCGCAATCATCATGT

GGAGTATTGGGAATGAAATCTATGATACGACTAATGCAGCGGG

CGTGGAAACCGCGAGGAATCTTGTGGGCTGGGTCAAAGAAATT

GACACTACACGGCCCACAACAATCGGCGAAGACAAGACTAGG

GGCGACAAAGTAAACGTGACGCCAATTAACAGTTATATCAAA

GAAATTTTCAACATTGTTGACGTAGTTGGGCTGAACTACTCGG

AAAACAATTATGATGGATATCACAAACAGAATCCCTCTTGGAA

ACTGTATGGATCCGAAACAAGCAGTGCGACAAGATCAAGGGG

TGTTTATACACACCCATATCAGTATAACCAATCTACAAAATAC

GCCGATCTGCAACAATCCTCTTATGACAACGACTATGTTGGCT

GGGGTAGAACAGCGGAAGACGCGTGGAAGTACGACAGAGATT

TGAAACATATCGCGGGACAGTTTATTTGGACGGGATTCGATTA

CATTGGTGAACCAACCCCGTACTATAATAGCTATCCTGCGAAA

AGCAGCTACTTCGGAGCAGTGGATACAGCTGGATTCCCTAAAG

ATATCTTTTACTATTATCAGTCGCAATGGAAAAAGGAGCCGAT

GGTACATCTTCTTCCGCATTGGAACTGGAAGGAAGGAGAGAAG

GTCAGAGTACTGGCCTACACCAATGCTAGCAAAGTCGAACTTG

TACTGAATGGCGAATCCCTCGGAGAGAAAAATTATGATAATAA

ACAAACGTCCTGGGGAGCTCCTTATAAGGAAACAAAAGACGG

AAAGACATATCTGGAATGGGCGGTCCCTTTCAAGCCTGGCAAA

CTGGAAGCCGTGGCAAAAGATGAAAACGGCAAGGTAATTGCA

AGAGATCAAGTAGTGACGGCGGGAGAGCCCGCTAGCGTTAGA

TTGACAGCTGATAGGAAAGTTGTGAAAGCAGATGGAACAGAT

TTAAGCTTTATTACCGCAGATATCGTAGATTCTAAGGGCATTGT

TGTCCCGGATGCTGATCATTTGATTACATTCAATGTGACTGGAC

AAGGAGAACTGGCTGGAGTAGATAATGGTAATGCATCATCCGT

TGAACGGTACAAAGATAATAAAAGAAAGGCCTTTTCAGGTAA

GGCCTTGGCAATCGTACAGTCATCAAAACTTAGCGGTAAAATC

ACCGTACACGCCTCGGTTGCAGGTCTTTCATCCGATAGTACAA

GTGTCTTCACAGTCACACCGGCGGATCACGATAAAAAAATTGT

AGCAGGTATTGACGATGTGAACCTTACGGTTGACGTCAACGAA

GCGCCAAAACTTCCGTCTGAAATTAAAGTCTATTATTCAGACG

AATCTGCGGCCGCGAAAAATGTTACATGGGATGAAGTGGACCC

TAAACAGTATTCTACAGTTGGCGAGTTTACAGTCGAAGGCTCG

GTTGAGGGCACAAGCTTAAAGGCGAAAGCGTTTGTCATAGTTA

AAGGTATCGTCGCCGTTAAACCCTATTCTACGGCGACCAAAGT

TGGAGTTCAACCTGTTTTACCTGAGAAAGCAACATTACTTTATA

GCGATGGCACTACTAAAGGGGCCACAGTGACATGGGATGAAA

TCCCAGAAGATAAATTGGCGAAAGAGGGCCGGTTTACGGTAG

AAGGTTCAGTAGAGGGCACAGACTTGAAAGCGAATGTTTATGT

GCGAGTTACGAATGAGGTAAAGTCTGTTAACATTATGCTTCAG

GAGCAGGGCAGCGCATATCCAAAGCTTGAGGCGACCTTTACAA

ATCCGGCGGACAATCTGCAGCACCTGAATGATGGTATCAAATC

TTATACAAACAATCCGGTGAATAGATGGACGAATTGGACAAG

AACACCAAGGGACGCGGGAGACAGTATCACGGTGAACTTTGG

GAAAAAACACGTAATCAACAATCTTGACCTTTTTGTATTTACA

GATAGTGGTACGGTTGTCCCTGAGAAAGCTGAAGTTCAATATT

GGGATGGAACTGCCTGGAAAGACGTAGAGAATTTAACACAGC

CTTCACCGTACGTTGTGGAAAAAAACGAGTTGACTTTCGATGC

AGTCGCGACAGAAAAATTAAAATTTCATCTGACACCGTCTGTC

AAAGGTAAATTTCTGGCCCTGACAGAAGCAGAAGTATACGCA

GACCAGATTGTAATGGGAGAAACAGCTAAACTCCAGTCCATAA

CGGTCAATGGTAAGGCACTCGAAGGGTTTGATCATGCGAAAAA

GAATTATGAGCTCGTACTGCCGTACGGGTCCGAATTGCCTAAG

ATTGAAGCAGCTGCGGCTGACAATGCTACCGTGACGATTTTAC

CTGCCTTTTCTTATCCAGGAACGGCGAAGTTGTTCGTAACAAGT

GAGGACGGAAAAGTTACAACCGAATATAGCATTGGCGTTTCGA

CTGAAGAGCCAAAGCTGGTCTCAGCTGAGTTGAGCGCAGATAA

GACCAATGTCATGGAAGATGATATAATTGACCTGAAAGTGATA

GGCCTCTTTGAGAGCAAGGAAAAGATTGACGTCACAGACAGC

CAACCAACCTACGAGTTCGACCAGCAAATTATAAAGATCGAAG

GAAATAAATTGTATGCGCTGGAAACCGGTAATGTCAAAGTAAA

GGTCACCGTTACTTATAAAGGAGTCTCTGTTACGACACCAGCC

CTTGAATTCACGATCGCGAAGAATCCTGCTCCGAAATATATTA

CATCGCTCGAGCCAGTCACAGTAGTTGTGAAAAAAGGCGAAG

CTCCCGAACTCCCTGCGACTGTTGTCGCTCATTATAACCGCGGT

ATCCCGCGGGATGTTAAAGTTAAATGGGAACGGATAAATCCAT

CAAAGTACCAACAATTAGGCGAATTTACCGTTTCGGGAATGGT

GGAAGGAACTGATATTAAAGCCCAAGCTAAAGTGATAGTGAA

AGGAGCAGTTGCAGTAGAGGATATTAGAATGGCAGTCCTTTTG

AAGCAAATGCCTCAGTTACCTGGAAAGGTTACGGTATACTATA

GTGATGGTGCGGAAGAACAACGAGCTGTTAAATGGGAGGAGA

TACCGCAAGAAGAACTTGAAAACGTGGGAGAATTTAAGGTGA

AAGGAGATGTTAATGGTGTTAAGCTGAAAGCAACCGCGACCAT

CCGGGTAACGGATGAAGTGGGGGGAGAACAGAATATTTCGCG

GGCAAAAAATGGCTATGAGTACCCGAAGGCTGAGGCTAGTTTT

ACAAATAATGGGCCGGGGTCTAGCGACCGTATTGAGGCTATCA

ATGACGACGTTATCTCATACGAAGCAAATCCGCACAACAGGTG

GACCAACTGGCAGCCGGTGCCTAGAGCTGGCGACTGGGTCTCC

ATTACCTTTGGTGATTATGAACCAACAGAATACGACGTTGACT

CGATGGAAATCCATTGGTTTGCGGACCACGGAACCTCTTACCC

AGAGAGGTTTCAGATCGAATATAAAAGCGGAGACTCGTGGAA

AGAAGTCACGAGCCTGAAGAGTGACCCGGCCTCTCCAGCCCTG

GGAAAAGCTAATGTTTATTCATTCGACCGTGTGAAGACCTCTG

CTATTAGGGTAAAAATGACAGCTCAGGCGGGTAAAAGTCTTGC

TATTACGGAATTAAAAGTCTTTTCAAAATGGCCTAAAGCAGGC

ACCGAACCTGAGGTCACCGATATCAAGGTTGGCGGCAAATCTA

TCCTCGAAGATTTTGAACAAAAAGGCGACCATTATGAAGTGAC

AATTGATGCGGGTGATGCGAATGTAATGCCGAAAATCAATGTG

AAAGCGAAGGATCAAACGTCTATCACAATCGTCCCGGCGGTTA

CTAGTCCGTCAACGGCAAAAGTGATCGCTAAATCGGAAGATGG

CAAAAAAGTGAAAGTATATTCAATACATTATAAATAA

SEQ ID NO:43

MPEVRSSTQSESGMSQWMGKILSIRGAGLTIGVFGLCALIAATSVTLPPEQQLIVAFVCVVIFFIVGHKPSRRSQIFLEVLSGLVSLRYLTWRLTETLSFDTWLQGLLGTMLLVAELYALMMLFLSYFQTIAPLHRAPLPLPPNPDEWPTVDIFVPTYNEELSIVRLTVLGSLGIDWPPEKVRVHILDDGRRPEFAAFAAECGANYIARPTNEHAKAGNLNYAIGHTDGDYILIFDCDHVPTRAFLQLTMGWMVEDPKIALMQTPHHFYSPDPFQRNLSAGYRTPPEGNLFYGVVQDGNDFWDATFFCGSCAILRRTAIEQIGGFATQTVTEDAHTALKMQRLGWSTAYLRIPLAGGLATERLILHIGQRVRWARGMLQIFRIDNPLFGRGLSWGQRLCYLSAMTSFLFAVPRVIFLSSPLAFLFFGQNIIAASPLALLAYAIPHMFHAVGTASKINKGWRYSFWSEVYETTMALFLVRVTIVTLLSPSRGKFNVTDKGGLLEKGYFDLGAVYPNIILGLIMFGGLARGVYELSFGHLDQIAERAYLLNSAWAMLSLIIILAAIAVGRETQQKRNSHRIPATIPVEVANADGSIIVTGVTEDLSMGGAAVKMSWPAKLSGPTPVYIRTVLDGEELILPARIIRAGNGRGIFIWTIDNLQQEFSVIRLVFGRADAWVDWGNYKADRPLLSLMDMVLSVKGLFRSSGDIVHRSSPTKPLAGNALSDDTNNPSRKERVLKGTVKMVSLLALLTFASSAQAASAPRAVAAKAPAHQPEASDLPPLPALLPATSGAAQAGAGDAGANGPGSPTGQPLAADSADALVENAENTSDTATVHNYTLKDLGAAGSITMRGLAPLQGIEFGIPSDQLVTSARLVLSGSMSPNLRPETNSVTMTLNEQYIGTLRPDPAHPTFGPMSFEINPIFFVSGNRLNFNFASGSKGCSDITNDTLWATISQNSQLQITTIALPPRRLLSRLPQPFYDKNVRQHVTVPMVLAQTYDPQILKSAGILASWFGKQTDFLGVTFPVSSTIPQSGNAILIGVADELPTSLGRPQVNGPAVLELPNPSDANATILVVTGRDRDEVITASKGIAFASAPLPTDSHMDVAPVDIAPRKPNDAPSFIAMDHPVRFGDLVTASKLQGTGFTSGVLSVPFRIPPDLYTWRNRPYKMQVRFRSPAGEAKDVEKSRLDVGINEVYLHSYPLRETHGLVGAVLQGVGLARPASGMQVHDLDVPPWTVFGQDQLNFYFDAMPLARGICQSGAANNAFHLGLDPDSTIDFSRAHHIAQMPNLAYMATVGFPFTTYADLSQTAVVLPEHPNAATVGAYLDLMGFMGAATWYPVAGVDIVSADHVSDVADRNLLVISTLATSGEIAPLLSRSSYEVADGHLRTVSHASALDNAIKAVDDPLTAFRDRDSKPQDVDTPLTGGVGAMIEAESPLTAGRTVLALLSSDGAGLNNLLQMLGERKKQANIQGDLVVAHGEDLSSYRTSPVYTIGTLPLWLWPDWYMHNRPVRVLLVGLLGCILIVSVLARALARHATRRFKQLEDERRKS

SEQ ID NO:44

ATGCCAGAGGTCCGATCTTCGACGCAGTCAGAGAGCGGGATGTCCCAGTGGATGGGAAAAATCTTATCAATAAGAGGGGCAGGACTGACGATAGGAGTATTTGGCCTCTGTGCTCTTATAGCCGCGACAAGCGTTACACTTCCACCTGAACAACAACTTATTGTGGCG

TTCGTCTGTGTTGTAATCTTTTTTATCGTCGGACACAAGCCATC

ACGGAGATCGCAAATCTTTCTGGAAGTACTTTCCGGACTTGTCT

CTCTTCGCTACCTTACCTGGCGGTTAACGGAGACCCTGTCCTTT

GATACCTGGTTACAGGGTCTTCTGGGCACGATGTTACTGGTCG

CGGAATTATATGCCCTGATGATGTTATTCTTGTCATACTTCCAG

ACAATAGCACCGCTGCATAGAGCGCCCCTCCCACTCCCCCCGA

ATCCTGATGAATGGCCTACAGTAGATATATTCGTCCCGACATA

CAATGAGGAACTTTCAATCGTAAGACTGACAGTTTTGGGGAGT

TTGGGAATAGATTGGCCGCCGGAAAAAGTTAGAGTACATATCC

TTGACGATGGGAGGCGTCCAGAATTTGCCGCCTTTGCAGCCGA

GTGCGGAGCAAACTATATTGCTAGACCTACAAATGAGCATGCG

AAAGCTGGAAATTTAAATTATGCGATTGGCCATACAGACGGGG

ACTATATATTAATTTTTGATTGTGACCACGTACCAACACGCGCT

TTCCTGCAGCTTACCATGGGATGGATGGTTGAAGATCCAAAAA

TCGCGCTTATGCAAACTCCGCATCACTTTTACAGCCCTGACCCA

TTCCAACGCAATTTGTCTGCGGGGTATAGAACTCCGCCTGAAG

GCAACTTATTTTACGGCGTAGTGCAGGATGGAAATGATTTCTG

GGATGCTACTTTCTTCTGCGGTAGCTGCGCTATTCTTAGACGGA

CAGCCATAGAACAAATTGGGGGATTCGCGACGCAGACCGTAA

CGGAGGACGCTCATACAGCCCTTAAAATGCAAAGACTTGGTTG

GTCAACAGCGTATTTGAGAATACCATTGGCAGGTGGTCTTGCG

ACGGAAAGATTAATCCTGCATATCGGACAACGCGTTCGTTGGG

CACGGGGCATGCTGCAAATCTTTCGCATAGATAACCCGCTCTT

TGGACGCGGCTTATCATGGGGGCAGAGGTTGTGTTATTTAAGT

GCCATGACCTCCTTTCTTTTTGCCGTGCCGCGTGTTATTTTTTTA

AGTTCACCTCTGGCCTTTCTGTTTTTTGGACAAAACATAATTGC

TGCAAGCCCCTTGGCTTTACTGGCTTATGCGATCCCCCATATGT

TTCACGCCGTTGGAACTGCATCTAAGATCAATAAAGGTTGGCG

TTATTCGTTCTGGAGTGAAGTGTACGAGACTACAATGGCGCTG

TTCCTGGTGCGTGTGACCATTGTCACACTGCTCTCTCCTAGCAG

AGGCAAGTTTAATGTGACAGACAAAGGGGGTCTGCTCGAAAA

AGGTTACTTTGATCTTGGAGCGGTATATCCTAATATCATTCTTG

GCTTGATCATGTTTGGAGGGTTGGCGCGTGGAGTATACGAATT

GTCGTTTGGACATCTTGATCAAATCGCCGAACGTGCTTATTTGC

TGAATTCAGCGTGGGCAATGTTATCACTTATAATCATCTTAGCT

GCGATTGCGGTAGGCAGGGAGACACAACAGAAAAGAAATTCT

CACAGGATTCCGGCCACAATTCCGGTCGAGGTCGCCAATGCTG

ACGGAAGCATAATTGTCACAGGAGTCACAGAAGATTTGTCTAT

GGGTGGAGCGGCAGTTAAAATGAGCTGGCCGGCGAAGCTGTC

CGGCCCTACGCCGGTTTATATTAGAACAGTACTGGATGGGGAG

GAATTAATCCTTCCCGCGAGGATCATTAGGGCTGGGAACGGCC

GAGGCATTTTTATCTGGACGATTGACAATTTGCAGCAAGAATT

TTCTGTCATCCGTCTGGTATTCGGGCGTGCCGATGCGTGGGTTG

ACTGGGGAAACTACAAAGCAGATCGTCCGCTGCTGTCCTTAAT

GGATATGGTGCTCTCGGTTAAAGGACTTTTTCGTTCCAGCGGC

GATATTGTTCATCGATCTTCTCCTACAAAACCGTTAGCGGGGA

ATGCCTTGAGTGACGATACAAATAACCCTAGCAGAAAAGAAC

GTGTTTTGAAAGGAACGGTGAAGATGGTATCACTGCTTGCACT

GTTGACATTCGCAAGCTCGGCACAGGCCGCTTCCGCTCCTAGA

GCGGTGGCAGCTAAGGCTCCGGCTCATCAACCGGAAGCTTCCG

ATCTGCCCCCGCTGCCTGCCTTACTTCCGGCGACAAGCGGAGC

AGCACAAGCAGGCGCCGGAGACGCGGGAGCAAATGGACCGGG

GTCTCCAACCGGACAACCCCTTGCGGCAGATTCCGCAGATGCG

CTTGTTGAGAATGCCGAGAACACGTCCGATACGGCCACAGTTC

ACAATTACACACTTAAGGACCTGGGAGCTGCTGGCTCCATTAC

TATGAGGGGACTGGCACCCCTGCAGGGAATTGAGTTCGGCATC

CCAAGCGATCAACTGGTAACCTCGGCTCGCCTGGTACTTTCAG

GAAGCATGTCACCTAACCTCCGACCGGAAACGAATTCTGTTAC

AATGACCCTCAACGAGCAATATATTGGTACATTGAGACCTGAC

CCAGCACACCCGACGTTTGGGCCAATGAGTTTCGAAATCAATC

CGATTTTTTTTGTGTCTGGAAACAGATTAAATTTCAATTTCGCT

TCGGGGTCAAAAGGCTGCTCTGACATTACTAATGACACGCTCT

GGGCAACAATCTCGCAAAATAGTCAACTCCAGATAACAACAAT

TGCCCTTCCCCCGAGAAGATTGTTAAGCAGGCTGCCCCAACCT

TTCTATGATAAAAATGTACGGCAACATGTCACGGTCCCTATGG

TACTTGCCCAGACCTATGATCCCCAGATTCTTAAGAGCGCAGG

CATTCTCGCTTCTTGGTTTGGCAAGCAGACAGACTTTCTTGGTG

TAACGTTTCCGGTTTCTTCAACGATCCCGCAGTCCGGAAACGC

GATCCTTATCGGGGTGGCGGATGAATTACCGACAAGCTTGGGC

AGGCCTCAAGTTAACGGTCCGGCAGTACTGGAATTGCCGAATC

CTTCCGATGCTAACGCCACAATCCTTGTTGTGACCGGGCGTGA

TCGAGATGAAGTAATTACAGCCAGCAAAGGGATCGCTTTTGCC

TCGGCACCGCTTCCTACGGATAGCCATATGGATGTCGCGCCAG

TTGATATCGCCCCACGTAAGCCTAATGATGCGCCCAGTTTTATC

GCAATGGATCATCCTGTACGGTTTGGAGACCTCGTTACAGCAT

CCAAATTACAAGGCACAGGGTTTACGTCAGGCGTTTTGAGCGT

TCCATTCCGGATCCCTCCTGACTTATACACCTGGCGGAATCGTC

CTTACAAAATGCAAGTTCGCTTTCGTTCACCAGCGGGCGAAGC

GAAAGATGTGGAAAAATCTCGGCTTGATGTCGGAATCAACGA

AGTTTATTTGCATAGTTATCCCTTACGAGAGACACACGGCCTG

GTCGGTGCCGTTTTACAAGGGGTTGGCCTTGCTAGACCAGCAT

CTGGTATGCAAGTGCACGACCTGGATGTCCCTCCATGGACCGT

GTTTGGACAAGATCAATTAAATTTTTATTTTGATGCGATGCCGC

TTGCTCGGGGGATTTGTCAGTCCGGAGCAGCAAATAATGCGTT

CCATCTGGGATTGGACCCAGACTCTACTATAGACTTTTCTCGGG

CCCATCATATAGCGCAGATGCCTAACCTTGCGTACATGGCAAC

CGTTGGCTTCCCATTTACTACCTATGCCGATTTGAGCCAGACAG

CTGTCGTCCTGCCGGAGCATCCCAATGCGGCAACAGTTGGAGC

TTATCTTGACCTGATGGGGTTTATGGGCGCGGCCACATGGTAT

CCGGTGGCGGGTGTGGATATTGTCAGTGCGGATCACGTTAGCG

ATGTCGCGGACCGGAATCTCCTTGTTATTTCTACACTGGCTACA

TCTGGTGAGATCGCACCGCTTCTTTCTCGTTCCAGCTATGAGGT

AGCTGATGGACATTTGCGTACCGTTAGCCATGCTAGCGCGTTA

GATAACGCTATTAAGGCAGTGGATGATCCTTTAACCGCCTTTA

GAGACCGGGACTCAAAACCACAAGACGTGGATACGCCACTTA

CTGGCGGGGTCGGTGCTATGATCGAAGCAGAATCACCGCTCAC

CGCTGGACGTACGGTGTTAGCCCTTTTGTCATCCGATGGCGCTG

GCCTGAATAATCTCTTGCAGATGCTGGGCGAAAGGAAAAAGC

AGGCCAATATACAAGGGGATCTTGTTGTAGCCCACGGAGAAG

ATTTGTCATCCTACCGTACATCTCCGGTCTATACCATCGGCACG

CTGCCATTATGGCTGTGGCCGGACTGGTACATGCACAATCGGC

CAGTGAGGGTACTTCTTGTGGGGCTTCTGGGTTGCATTCTCATA

GTTTCCGTGCTTGCGCGCGCTTTAGCTAGACATGCGACTAGAC

GGTTTAAACAACTGGAGGACGAGAGACGCAAATCGTAA

SEQ ID NO:45

MATPSAVGAACLLLARAAWPAAVGDRARPRRLQRVLRRRCVAELSREGPAPRPLPPALLAPPLVPGFLAPPAEPTGEPASTPPPVPDAGLGDLGLEPEGIAEGSIDNTVVVASEQDSEIVVGKEQARAKVTQSIVFVTGEASPYAKSGGLGDVCGSLPVALAARGHRVMVVMPRYLNGTSDKNYANAFYTEKHIRIPCFGGEHEVTFFHEYRDSVDWVFVDHPSYHRPGNLYGDKFGAFGDNQFRYTLLCYAACEAPLILELGGYIYGQNCMFVVNDWHASLVPVLLAAKYRPYGVYKDSRSILVIHNLAHQGVEPASTYPDLGLPPEWYGALEWVFPEWARRHALDKGEAVNFLKGAVVTADRIVTVSKGYSWEVTTAEGGQGLNELLSSRKSVLNGIVNGIDINDWNPATDKCIPCHYSVDDLSGKAKCKGALQKELGLPIRPDVPLIGFIGRLDYQKGIDLIQLIIPDLMREDVQFVMLGSGDPELEDWMRSTESIFKDKFRGWVGFSVPVSHRITAGCDILLMPSRFEPCGLNQLYAMQYGTVPVVHATGGLRDTVENFNPFGENGEQGTGWAFAPLTTENMLWTLRTAISTYREHKSSWEGLMKRGMSKDFTWDHAAEQYEQIFQWAFIDRPYVM

SEQ ID NO:46

ATGGCGACCCCGTCCGCAGTGGGCGCAGCCTGCCTTTTATTAGCGCGCGCAGCTTGGCCGGCAGCCGTTGGAGACAGGGCAAGACCGCGGCGATTACAACGCGTGTTGCGGCGGAGATGTGTAGCAGAACTTTCTCGTGAAGGGCCAGCACCGAGGCCTTTACCTCCTGCCTTGCTTGCCCCCCCGTTAGTACCTGGTTTTCTGGCACCCCCAGCGGAACCAACAGGCGAACCAGCGAGCACGCCTCCGCCGGTTCCGGACGCTGGACTTGGCGACTTGGGATTAGAACCTGAAGGAATCGCGGAAGGTTCAATCGATAATACCGTCGTGGTGGCTTCTGAACAGGATAGTGAGATCGTAGTTGGGAAAGAGCAGGCTCGCGCAAAAGTAACGCAATCAATTGTATTCGTAACCGGCGAGGCAAGCCCCTATGCGAAATCTGGAGGCCTGGGCGATGTTTGCGGAAGCCTTCCGGTTGCGTTAGCTGCCAGAGGACATCGAGTCATGGTCGTCATGCCGCGGTATCTGAACGGAACGTCAGATAAAAATTATGCCAATGCCTTCTATACCGAGAAGCATATCCGGATCCCTTGCTTTGGTGGCGAACACGAAGTGACTTTTTTTCATGAATATCGTGACTCAGTCGACTGGGTTTTTGTCGACCACCCGAGCTATCATAGACCGGGTAACCTGTACGGGGATAAATTTGGAGCGTTTGGCGATAATCAATTCCGGTATACCTTGCTGTGTTATGCCGCATGCGAAGCCCCTCTCATCTTGGAACTCGGAGGCTATATTTATGGACAAAACTGTATGTTCGTAGTAAACGATTGGCACGCATCACTCGTACCAGTACTTCTCGCAGCGAAATATAGACCGTATGGCGTTTACAAAGATTCCAGATCAATTTTAGTTATTCACAACTTAGCTCACCAAGGCGTAGAACCGGCGTCCACATATCCAGATCTTGGATTGCCGCCAGAGTGGTATGGAGCGCTTGAATGGGTCTTTCCTGAATGGGCTCGTCGACATGCGCTGGATAAAGGTGAAGCTGTCAATTTTCTCAAAGGTGCTGTGGTCACTGCCGACAGAATTGTAACAGTGAGCAAAGGCTATTCCTGGGAAGTTACCACCGCTGAGGGTGGCCAAGGGCTCAATGAATTGCTGAGCAGCCGTAAAAGTGTTTTGAATGGTATAGTGAATGGTATCGACATCAATGATTGGAACCCGGCAACAGACAAATGTATCCCCTGTCATTACTCCGTCGACGACCTTTCGGGAAAAGCAAAGTGTAAAGGCGCGCTTCAAAAAGAGTTGGGCTTGCCGATTAGACCGGATGTGCCTCTTATTGGATTCATTGGCCGGTTGGATTATCAGAAGGGAATTGATCTGATCCAGCTGATTATTCCGGACTTGATGAGAGAAGATGTCCAGTTTGTGATGTTGGGCTCCGGCGATCCAGAACTTGAAGATTGGATGCGGAGCACCGAATCAATCTTTAAGGATAAATTTAGAGGATGGGTCGGGTTCTCTGTGCCTGTCTCACATCGCATTACGGCGGGCTGCGATATCCTCCTTATGCCTTCTCGGTTCGAACCGTGTGGTTTAAATCAACTTTATGCGATGCAGTACGGCACTGTGCCGGTTGTTCACGCGACTGGAGGGCTGCGAGATACTGTTGAGAATTTTAATCCGTTTGGAGAGAACGGTGAACAAGGAACAGGATGGGCCTTCGCACCACTGACTACGGAGAACATGCTGTGGACACTTAGAACGGCCATCTCTACGTATAGGGAGCACAAGTCCTCGTGGGAGGGACTCATGAAACGGGGAATGAGTAAAGATTTCACCTGGGATCACGCTGCAGAACAATATGAGCAAATCTTTCAGTGGGCGTTTATCGATCGCCCCTACGTTATGTGA

SEQ ID NO:47

MVSLSNQTRFSFHPNNLVVSEKRRLGISGVNFPRKIKLKITCFAAERPRQEKQKKKSQSQSTSDAEAGVDPVGFLTRLGIADRIFAQFLRERHKALKDLKDEIFKRHFDFRDFASGFELLGMHRHMEHRVDFMDWGPGSRYGAIIGDFNGWSPTENAAREGLFGHDDYGYWFIILEDKLREGEEPDELYFQQYNYVDDYDKGDSGVSAEEIFQKANDEYWEPGEDRFIKNRFEVPAKLYEQMFGPNSPQTLEELGDIPDAETRYKQWKEEHKDDPPSNLPPCDIIDKGQGKPYDIFNVVTSPEWTKKFYEKEPPIPYWLETRKGRKAWLQKYIPAVPHGSKYRLYFNTPDGPLERVPAWATYVQPEDEGKQAYAIHWEPSPEAAYKWKYSKPKVPESLRIYECHVGISGSEPKVSTFEEFTKKVLPHVKRAGYNAIQLIGVPEHKDYFTVGYRVTNFFAASSRYGTPDDFKRLVDEAHGLGLLVFLDIVHSYAAADQMVGLSLFDGSNDCYFHYGKRGHHKHWGTRMFKYGDLDVLHFLISNLNWWITEYQVDGYQFHSLASMIYTHNGFASFNNDLDDYCNQYVDRDALMYLILANEILHVQHPNIITIAEDATYYPGLCEPVSQGGLGFDYYVNLSASEMWVSLLDNVPDNEWSMSKIVSTLVANKEYADKMLSYAENHNQSISGGRSFAEILFGGVDNGSPGGKELLDRGISLHKMIRLITFTSGGRAYLNFMGNEFGHPERVEFPTQSNNFSFSLANRRWDLLESGVHHHLFSFDKELMDLDKSKGILSRGLPSIHHVNDANMVISFSRGPFLFIFNFHPSNSYEKYDVGVEEAGEYTMILNSDEVKYGGQGIVTEDHYLQRSISKRIDGQRNCLEVFLPSRTAQVYKLTRILRI

SEQ ID NO:48

ATGGTCTCTTTGTCGAATCAGACTAGATTTTCTTTCCATCCGAATAACCTGGTCGTGAGTGAGAAACGACGTTTAGGAATCTCGGGCGTTAACTTCCCTCGAAAGATTAAATTAAAAATTACATGCTTTGCAGCGGAGAGACCGCGCCAAGAAAAGCAGAAGAAAAAGTCACAATCTCAAAGCACGTCCGATGCGGAAGCAGGAGTAGACCCGGTGGGCTTTTTAACACGCTTGGGCATAGCGGATAGGATTTTTGCACAATTTCTTAGAGAAAGACATAAGGCTCTTAAAGACCTTAAGGACGAAATATTTAAACGGCATTTTGATTTTCGGGATTTTGCATCAGGCTTCGAACTGTTAGGAATGCACAGGCATATGGAGCATCGGGTTGATTTTATGGATTGGGGACCGGGATCACGGTACGGCGCAATTATTGGTGATTTTAACGGATGGTCTCCAACGGAGAATGCTGCGCGCGAAGGCCTCTTTGGCCATGATGACTATGGTTATTGGTTTATTATACTTGAAGATAAATTGAGAGAAGGAGAGGAGCCGGACGAGTTGTATTTTCAACAATATAACTATGTTGATGACTATGATAAAGGTGACTCAGGCGTGTCGGCTGAAGAAATTTTCCAAAAAGCAAATGATGAATATTGGGAGCCGGGTGAAGATAGGTTTATCAAAAATAGATTTGAAGTGCCGGCTAAATTATATGAGCAAATGT

TTGGACCGAATTCACCGCAAACACTGGAGGAATTAGGTGATAT

CCCTGACGCGGAAACAAGATACAAGCAGTGGAAAGAAGAGCA

TAAAGATGATCCTCCATCTAACCTGCCGCCTTGCGATATTATTG

ATAAAGGTCAAGGCAAACCGTATGATATCTTTAATGTTGTTAC

GTCCCCAGAATGGACAAAAAAATTTTATGAGAAAGAACCCCC

GATCCCATATTGGCTGGAGACACGTAAAGGCAGAAAGGCGTG

GCTCCAGAAATATATCCCGGCCGTCCCCCACGGCTCCAAGTAC

CGCTTATACTTCAATACCCCGGATGGACCATTAGAAAGGGTTC

CGGCTTGGGCGACCTACGTACAGCCAGAAGATGAAGGCAAAC

AGGCCTATGCTATTCATTGGGAACCGAGCCCGGAGGCTGCCTA

TAAATGGAAGTACTCAAAACCAAAAGTACCAGAATCTTTACGG

ATTTATGAATGCCATGTGGGGATTAGCGGAAGCGAACCGAAA

GTAAGCACTTTTGAAGAGTTTACAAAAAAGGTGCTGCCGCACG

TCAAACGAGCGGGATATAACGCGATCCAGTTGATCGGCGTGCC

TGAGCATAAGGATTATTTTACGGTCGGTTATAGAGTGACCAAC

TTTTTCGCAGCATCTTCCCGCTACGGTACTCCTGACGATTTTAA

AAGACTTGTGGATGAAGCTCATGGGCTGGGTCTCCTGGTCTTT

CTGGATATTGTCCACTCATATGCTGCGGCGGATCAGATGGTTG

GGCTGAGCTTGTTTGACGGTTCCAACGATTGCTACTTCCACTAT

GGGAAACGTGGCCATCATAAACATTGGGGGACCAGAATGTTC

AAATATGGCGACCTTGATGTGCTTCACTTTTTAATTTCAAACTT

AAATTGGTGGATTACAGAATACCAGGTTGACGGATATCAATTC

CACAGCTTGGCATCGATGATCTATACACATAACGGGTTCGCAA

GTTTCAATAATGATTTGGACGATTATTGCAATCAGTATGTAGA

CCGGGATGCCCTTATGTACCTGATTCTTGCGAACGAAATCCTTC

ATGTTCAGCATCCGAACATCATTACTATTGCGGAAGATGCAAC

ATACTACCCGGGCCTGTGCGAACCAGTTTCCCAAGGCGGACTG

GGATTTGATTATTATGTCAATCTGTCTGCATCCGAAATGTGGGT

TAGCTTACTTGATAACGTGCCTGATAATGAGTGGTCAATGTCA

AAAATCGTTAGCACACTCGTTGCAAATAAAGAATACGCTGACA

AAATGTTATCCTACGCAGAAAATCATAATCAGAGTATAAGCGG

TGGTCGGTCATTTGCCGAGATCTTATTTGGCGGCGTGGACAAC

GGCAGTCCCGGCGGTAAAGAGTTATTAGATAGAGGTATCAGCC

TTCACAAGATGATTCGCCTGATTACTTTTACAAGTGGCGGAAG

AGCTTATTTGAACTTCATGGGAAACGAGTTCGGACATCCTGAA

AGAGTAGAATTCCCAACACAATCCAACAATTTCTCGTTCAGCT

TAGCAAACCGGCGATGGGATCTGCTGGAGAGTGGGGTACATC

ATCATTTGTTTTCGTTTGATAAAGAGCTGATGGACCTGGATAA

AAGCAAAGGAATTCTGAGCCGAGGACTTCCGAGCATCCATCAT

GTTAATGACGCAAATATGGTCATTAGCTTTTCCCGGGGCCCCTT

CCTTTTTATCTTTAATTTTCACCCCTCAAATTCATATGAAAAGT

ATGATGTCGGCGTCGAGGAGGCGGGTGAGTATACCATGATCCT

CAACTCAGATGAGGTGAAATATGGTGGCCAAGGGATAGTAAC

CGAAGATCATTATTTACAAAGGTCTATAAGCAAGAGGATCGAT

GGACAGAGAAACTGCTTGGAGGTCTTTTTGCCCAGTAGGACAG

CTCAGGTGTACAAGCTTACACGAATCCTTCGCATTTGA

SEQ ID NO:49

MKILFAVSECTPFVKSGGLADVAGALPKALARLGNEVAVMLPKYSQIPEPWKKRMKKQAECTVAVGWRQQYCGIEHMAENDVNYYFIDNEYYFNRDSLYGHYDDGERFAFFSRAVLEAAKVVNVQADIVHTHDWHTAMVNYLLKEEYRKHPFYERMKSVLTIHNLQFQGIFPPDVTHDLLGLEMDHFHYERLECNGFVNFMKAGIIAADHVTTVSPTYRNEIMTPYYGEQLEQVLQYREDDVTGILNGIDDTFYQPKSDPYIEAQYDSGDLACKLENKTKLQQRMGLPEKNDIPLISMVTRLTKQKGLDLVRRIMHELLEEQDIQLVVLGTGEREFEDYFRYAEFAFHEKCRAYIGFDEPLAHQIYAGSDMFLMPSKFEPCGLGQLIALQYGAIPIVRETGGLYDTVRAYQEEEGTGNGFTFSAFNAHDLKFTIERALSFYCQQDVWKSIVKTAMNADYSWGKSAKEYQRIFEQVTRSGRDVLE

SEQ ID NO:50

ATGAAGATTTTGTTCGCGGTTAGCGAGTGCACACCTTTCGTAAAATCCGGCGGATTAGCGGACGTTGCGGGTGCTTTACCGAAAGCCTTAGCGCGCCTTGGAAATGAAGTCGCTGTGATGCTGCCGAAATATAGTCAAATTCCGGAACCGTGGAAGAAAAGAATGAAAAAACAGGCAGAATGCACAGTTGCGGTCGGCTGGCGCCAACAGTACTGCGGAATCGAACATATGGCTGAGAATGACGTGAACTATTATTTTATAGATAACGAATATTATTTTAACAGAGATTCTCTGTATGGACACTATGACGATGGAGAGAGGTTTGCGTTTTTTAGCCGGGCTGTGCTCGAAGCCGCGAAAGTCGTGAATGTGCAGGCTGATATCGTTCATACGCATGACTGGCATACCGCGATGGTCAACTATTTGCTGAAAGAAGAATATCGGAAACATCCGTTTTATGAGCGCATGAAAAGCGTTCTTACGATTCATAATCTCCAATTCCAGGGTATCTTTCCACCCGATGTCACACATGACCTTTTAGGCTTAGAAATGGATCATTTCCATTACGAACGTTTGGAATGCAACGGTTTCGTGAATTTTATGAAGGCTGGAATCATCGCCGCAGATCATGTGACTACGGTCTCTCCTACGTATCGTAATGAAATAATGACGCCATATTATGGTGAACAGCTGGAGCAGGTTCTTCAGTATCGCGAAGATGATGTCACGGGAATTCTGAACGGCATTGATGACACGTTCTACCAACCTAAATCAGACCCATATATTGAAGCGCAGTACGATAGTGGCGATCTTGCCTGCAAATTAGAAAATAAAACAAAGCTGCAACAACGCATGGGATTACCAGAGAAGAATGATATCCCGTTAATTTCAATGGTAACCAGACTTACGAAGCAGAAGGGCCTGGATTTGGTCAGACGGATAATGCATGAACTTTTAGAAGAGCAGGATATCCAGCTGGTCGTGCTGGGCACCGGAGAAAGAGAATTTGAGGATTACTTTCGCTACGCTGAATTTGCGTTTCATGAGAAGTGCCGCGCCTACATTGGCTTTGACGAACCCTTAGCGCACCAGATTTACGCCGGATCAGATATGTTTCTCATGCCGAGCAAGTTTGAACCTTGTGGACTTGGCCAGCTGATTGCATTACAATACGGCGCCATTCCTATTGTACGGGAGACCGGAGGCCTGTATGACACAGTGCGAGCCTATCAGGAAGAAGAAGGTACAGGCAATGGCTTTACTTTTAGTGCGTTTAATGCACATGATCTGAAATTCACAATAGAAAGAGCTTTAAGCTTTTATTGTCAACAGGATGTCTGGAAATCAATCGTAAAGACCGCTATGAATGCCGATTATTCATGGGGTAAATCTGCAAAAGAGTACCAACGTATCTTCGAACAAGTGACACGGTCTGGGCGCGACGTCCTTGAATAA

SEQ ID NO:51

MALKRGLSGVNRIRGSGGGSRSVLVLLIFFCVFAPLCFFVGRGVYIDSSNDYSIVSVKQNLDWRERLAMQSVRSLFSKEILDVIATSTADLGPLSLDSFKKNNLSASWRGTGVDPSFRHSENPATPDVKSNNLNEKRDSISKDSIHQKVETPTKIHRRQLREKRREMRANELVQHNDDTILKLENAAIERSKSVDSAVLGKYSIWRRENENDNSDSNIRLMRDQVIMARVYSGIAKLKNKNDLLQELQARLKDSQRVLGEATSDADLPRSAHEKLRAMGQVLAKAKMQLYDCKLVTGKLRAMLQTADEQVRSLKKQSTFLAQLAAKTIPNPIHCLSMRLTIDYYLLSPEKRKFPRSENLENPNLYHYALFSDNVLAASVVVNSTIMNAKDPSKHVFHLVTDKLNFGAMNMWFLLNPPGKATIHVENVDEFKWLNSSYCPVLRQLESAAMREYYFKADHPTSGSSNLKYRNPKYLSMLNHLRFYLPEVYPKLNKILFLDDDIIVQKDLTPLWEVNLNGKVNGAVETCGESFHRFDKYLNFSNPHIARNFNPNACGWAYGMNMFDLKEWKKRDITGIYHKWQNMNENRTLWKLGTLPPGLITFYGLTHPLNKAWHVLGLGYNPSIDKKDIENAAVVHYNGNMKPWLELAMSKYRPYWTKYIKFDHPYLRRCNLHE

SEQ ID NO:52

ATGGCCCTTAAGAGGGGGCTGAGTGGAGTGAACCGTATCAGAGGATCAGGAGGAGGCAGCCGTTCAGTCCTGGTTCTTCTTATCTTTTTTTGCGTGTTCGCACCGTTATGTTTCTTCGTTGGTCGCGG

AGTCTATATAGACAGCTCGAACGACTACTCAATTGTTAGTGTA

AAGCAGAATTTAGACTGGAGAGAGCGCCTGGCAATGCAATCT

GTAAGATCATTATTCTCGAAGGAAATTTTAGATGTGATAGCCA

CGTCTACGGCAGACTTGGGGCCGTTATCTTTAGATAGCTTCAA

AAAGAACAATTTATCAGCTAGCTGGAGAGGCACGGGCGTTGA

CCCTAGCTTTCGCCACAGCGAAAACCCTGCGACCCCGGATGTT

AAGTCAAACAATTTAAATGAAAAAAGAGATTCTATTTCTAAAG

ATTCCATCCATCAGAAGGTTGAGACACCGACTAAAATCCACCG

ACGACAACTTCGTGAGAAAAGGAGAGAGATGCGCGCGAATGA

ACTTGTCCAGCACAACGATGATACAATTTTAAAGTTGGAGAAT

GCAGCCATTGAGCGTAGTAAAAGTGTAGATTCTGCAGTATTAG

GAAAATACTCAATTTGGCGCCGGGAAAATGAAAATGACAATA

GCGATTCTAATATCAGGCTGATGAGGGACCAGGTCATTATGGC

ACGCGTATATTCGGGCATTGCAAAATTAAAAAACAAAAACGA

CTTACTTCAAGAACTTCAGGCGCGGCTTAAGGATTCCCAGAGA

GTGCTGGGAGAAGCTACATCCGATGCCGATTTGCCAAGGAGCG

CGCACGAGAAACTTAGAGCGATGGGTCAAGTTTTGGCTAAAGC

GAAAATGCAGCTGTATGATTGCAAATTAGTCACTGGTAAACTG

AGAGCAATGTTGCAGACAGCAGATGAGCAGGTACGAAGCTTA

AAAAAACAATCAACGTTTCTTGCACAGCTTGCAGCTAAAACAA

TACCCAATCCAATCCATTGTTTATCTATGAGATTGACCATAGAT

TATTACCTTTTGTCTCCCGAGAAGAGGAAGTTTCCGCGATCTGA

AAATCTGGAAAACCCTAATCTGTATCATTACGCTCTGTTCTCAG

ACAATGTTTTAGCAGCATCTGTTGTCGTAAATAGCACAATCAT

GAATGCGAAGGACCCGTCTAAACATGTGTTCCATCTTGTCACG

GATAAACTTAACTTTGGCGCCATGAATATGTGGTTTCTTCTGAA

TCCTCCGGGCAAAGCCACAATCCATGTGGAAAATGTCGACGAA

TTTAAATGGCTTAACTCCTCCTATTGCCCGGTTCTTCGGCAGTT

AGAATCAGCTGCTATGAGAGAATACTATTTTAAAGCGGATCAT

CCTACGTCCGGCAGCAGCAATTTAAAATACAGAAATCCGAAGT

ACTTATCTATGCTTAACCATTTAAGATTTTATTTACCGGAAGTT

TATCCGAAACTTAATAAAATCCTGTTTCTCGACGATGACATTAT

TGTTCAAAAAGATTTGACTCCGCTTTGGGAAGTGAACTTAAAT

GGCAAAGTCAATGGGGCCGTGGAGACTTGCGGGGAGTCATTTC

ATAGATTTGACAAGTACTTAAACTTTTCTAACCCGCACATTGCA

CGTAATTTCAACCCAAATGCATGTGGATGGGCGTATGGTATGA

ATATGTTTGACTTAAAAGAATGGAAAAAACGCGATATAACAG

GAATTTATCATAAGTGGCAAAACATGAACGAAAACAGGACAC

TGTGGAAACTGGGAACGTTGCCGCCTGGACTTATTACGTTTTAT

GGGTTGACGCACCCGCTTAATAAAGCCTGGCATGTTTTAGGAC

TGGGATATAATCCTAGCATTGACAAGAAAGATATTGAAAACGC

GGCGGTAGTGCATTATAATGGGAATATGAAACCGTGGCTTGAA

CTGGCTATGTCTAAATATAGACCGTACTGGACGAAATACATTA

AATTTGACCATCCGTATTTACGACGGTGCAACCTGCATGAATA

G

SEQ ID NO:53

MSVVDVIGLLATAAYVTLASAYKVVQFINVSSVTDVAGLESDALPLTPRVDVIVPTFNENSSTLLECVASICAQDYRGPITIVVVDDGSTNKTSFHAVCDKYASDERFIFVELDQNKGKRAAQMEAIRRTDGDLILNVDSDTVIDKDVVTKLASSMRAPNVGGVMGQLVAKNRERSWLTRLIDMEYWLACNEERIAQSRFGSVMCCCGPCAMYRRSAITPLLAEYEHQTFLGRPSNFGEDRHLTILMLKAGFRTGYVPGAVARTLVPDGLAPYLRQQLRWARSTYRDTALALRIKKNLSKYITFEICAQNLGTALLLVMTMISLSLTTSGSQTPVIILGVVVGMSIIRCCSVALIAKDFRFLYFIVHSALNVLILTPLKLYALLTIRDSRWLSRESS

SEQ ID NO:54

ATGTCAGTGGTCGACGTAATTGGCCTTCTGGCCACCGCCGCCTATGTGACCCTGGCTTCCGCGTACAAAGTAGTCCAATTTATCAATGTCTCTAGCGTGACTGACGTAGCAGGCCTTGAGAGTGATGCCCTCCCGCTTACACCGCGCGTAGATGTAATCGTGCCCACGTTTAATGAAAATTCTTCCACGCTGTTAGAATGCGTCGCAAGCATTTGTGCGCAAGACTACAGAGGCCCAATCACCATTGTGGTGGTAGACGACGGCTCGACTAATAAAACTAGCTTTCACGCAGTTTGCGACAAATATGCGTCGGATGAGCGCTTCATCTTCGTCGAACTTGATCAGAACAAGGGGAAACGCGCTGCACAGATGGAGGCAATTCGCCGGACGGACGGCGATCTTATCTTGAATGTCGATTCTGATACCGTGATCGACAAGGATGTTGTTACGAAACTTGCTTCGAGCATGCGCGCACCAAACGTGGGTGGAGTGATGGGGCAACTGGTTGCCAAAAATCGGGAACGATCATGGCTCACACGGCTTATCGATATGGAATATTGGTTAGCTTGTAATGAGGAGCGCATCGCTCAAAGCCGCTTTGGTTCTGTCATGTGCTGTTGTGGTCCATGCGCGATGTACAGACGTTCTGCAATCACGCCACTTCTGGCGGAATACGAACACCAGACATTCCTTGGACGACCGTCTAATTTTGGCGAAGATCGGCACTTAACGATTTTAATGTTGAAAGCGGGATTTCGTACGGGGTATGTCCCAGGCGCAGTAGCTCGTACGTTAGTTCCTGACGGATTGGCTCCTTATTTGCGTCAACAACTTCGGTGGGCCCGGAGCACATACCGTGATACAGCTCTGGCATTGCGTATTAAAAAGAACTTATCAAAATATATCACATTTGAAATCTGCGCGCAAAATCTGGGTACGGCGCTTTTGCTTGTGATGACAATGATTTCGTTATCTCTTACCACATCGGGAAGTCAAACCCCGGTAATCATTCTTGGAGTTGTCGTCGGCATGTCAATCATTAGATGTTGTTCGGTTGCCCTTATCGCTAAAGATTTTAGATTTCTCTATTTTATTGTACATTCGGCGCTTAATGTACTGATTCTCACTCCGCTTAAATTGTACGCTCTTCTTACCATTAGAGATAGCAGATGGTTATCGCGCGAATCAAGCTAG

SEQ ID NO:55-70：(参见表2)

SEQ ID NO:71-82：(参见实施例4)

Claims

1.一种降低受试者的肠道中碳水化合物的量或浓度的方法，所述方法包括向所述受试者施用经过工程化以表达编码纤维合成酶的异源核酸序列的细菌，其中所述纤维合成酶从碳水化合物底物合成纤维。

2.一种增加受试者的肠道中纤维的量或浓度的方法，所述方法包括向所述受试者施用经过工程化以表达编码纤维合成酶的异源核酸序列的细菌，其中所述纤维合成酶从碳水化合物底物合成纤维。

3.一种对需要降低肠道中碳水化合物的量或浓度或增加肠道中纤维的量或浓度的受试者进行治疗的方法，所述方法包括向所述受试者施用经过工程化以表达编码纤维合成酶的异源核酸序列的细菌，其中所述纤维合成酶从碳水化合物底物合成纤维。

4.如权利要求3所述的方法，其中所述受试者罹患与碳水化合物消耗正向相关或关联的疾患。

5.如权利要求3所述的方法，其中所述受试者罹患与纤维消耗负向相关或关联的疾患。

6.如权利要求3-5中任一项所述的方法，其中所述受试者罹患选自以下的疾患：心血管疾病、心脏病、高血压、高血胆固醇、高血糖、糖尿病、肥胖症、肠道失调、炎性肠道疾病、肠易激综合征(IBS)、憩室炎、结肠直肠癌、肠癌、腹胀、痉挛、胀气、痔疮以及腹泻。

7.如权利要求1-6中任一项所述的方法，其中所述纤维为可溶性纤维。

8.如权利要求1-7中任一项所述的方法，其中所述合成的纤维包含葡萄糖、果糖、半乳糖醛酸、N-乙酰基-D-葡糖胺和/或半乳糖单体。

9.如权利要求1-8中任一项所述的方法，其中所述碳水化合物底物选自以下中的一者或多者：UDP-葡萄糖、UDP-半乳糖、UDP-岩藻糖、ADP-α-D-葡萄糖、UDP-半乳糖醛酸、UDP-N-乙酰基-α-D-葡糖胺、肌醇半乳糖苷、乳糖、葡萄糖以及蔗糖，并且/或者其中在肠道中量或浓度降低的所述碳水化合物选自以下中的一者或多者：葡萄糖、半乳糖、蔗糖、果糖和/或乳糖。

10.如权利要求1-9中任一项所述的方法，其中所述合成的纤维为果寡糖，并且/或者选自昆布二糖、愈创葡聚糖、凝胶多糖、燕麦β-葡聚糖、昆布多糖、pleuran、香菇多糖、酵母β葡聚糖、海藻酮糖、海藻糖、菊粉、蔗果三糖、蔗果四糖、左聚糖、棉子糖、水苏糖、毛蕊花糖、红细胞三糖、人乳寡糖(HMO)、纤维二糖、纤维素、微晶纤维素、棉花、麦芽糖、直链淀粉、淀粉、糖原、支链淀粉、果胶、几丁质。

11.如权利要求1-10中任一项所述的方法，其中所述纤维合成酶选自蔗糖酶、菊粉蔗糖酶、左聚糖蔗糖酶、1,3-β-葡聚糖合酶、1,3；1,4-β-D-葡聚糖合酶、1,6-β-葡聚糖合酶、蔗糖异构酶、1,6-α-半乳糖基转移酶、海藻酮糖合酶、海藻糖-6-磷酸合酶、α-1,4-半乳糖基转移酶、α-1,2-岩藻糖基转移酶、β-半乳糖苷酶、b-D-半乳糖苷酶、纤维素合酶、麦芽糖合酶、淀粉合酶、淀粉分支酶、糖原合酶、半乳糖醛酸基转移酶以及几丁质寡糖合酶。

12.如权利要求1-11中任一项所述的方法，其中所述纤维合成酶与分泌多肽可操作地连接。

13.如权利要求1-12中任一项所述的方法，其中所述细菌为芽孢形成细菌并且/或者呈芽孢形式。

14.如权利要求1-13中任一项所述的方法，其中所述细菌为益生菌。

15.如权利要求1-14中任一项所述的方法，其中所述细菌属于选自以下的属：芽孢杆菌属、双歧杆菌属、肠球菌属、埃希氏杆菌属、乳杆菌属、乳球菌属、明串珠菌属、片球菌属以及链球菌属，任选地其中所述细菌属于芽孢杆菌属，任选地其中所述细菌属于枯草芽孢杆菌种。

16.如权利要求1-15中任一项所述的方法，其中所述细菌属于特征在于不定殖于肠道的菌株。

17.如权利要求1-16中任一项所述的方法，其中所述方法包括向在之前一段时间内已消耗碳水化合物和/或所述碳水化合物底物的受试者施用所述工程化细菌，其中所述之前一段时间为24小时12小时、6小时、3小时或1小时的时间。

18.如权利要求1-17中任一项所述的方法，其中所述方法包括向尚未消耗碳水化合物和/或所述碳水化合物底物的受试者施用所述工程化细菌。

19.如权利要求1-17中任一项所述的方法，其中所述方法包括向在之前一段时间内尚未消耗碳水化合物和/或所述碳水化合物底物的受试者施用所述工程化细菌，其中所述之前一段时间为24小时12小时、6小时、3小时或1小时的时间。

20.如权利要求1-19中任一项所述的方法，其中所述受试者在施用所述工程化细菌之后一段时间内消耗碳水化合物和/或所述碳水化合物底物，其中所述之后一段时间为24小时12小时、6小时、3小时或1小时的时间。

21.如权利要求1-20中任一项所述的方法，其中所述方法防止糖在所述受试者的结肠中累积。

22.如权利要求1-21中任一项所述的方法，其中纤维合成酶和/或由所述工程化细菌所包含的异源核酸序列编码的酶由所述纤维合成酶组成。

23.如权利要求1-22中任一项所述的方法，其中所述施用包括经口施用包含所述工程化细菌的组合物。

24.如权利要求1-23中任一项所述的方法，其中所述施用包括施用约10⁴至约10¹²个集落形成单位的所述工程化细菌。

25.如权利要求1-24中任一项所述的方法，其中编码表达产物的所述核酸序列与组成性启动子可操作地连接。

26.如权利要求1-25中任一项所述的方法，其中编码表达产物的所述核酸序列与鞭毛蛋白基因启动子可操作地连接。

27.如权利要求26所述的方法，其中所述鞭毛蛋白基因启动子包含CsrA结合位点中的突变，其中所述CsrA结合位点中的所述突变抑制CsrA与编码所述纤维合成酶的mRNA转录物结合，但不阻碍所述纤维合成酶的表达。

28.如权利要求26或权利要求27所述的方法，其中所述工程化细菌包含降低FlgM对σ因子的抑制的内源性flgM基因的突变。

29.一种经过工程化以表达编码纤维合成酶的异源核酸序列的细菌，其中所述纤维合成酶从碳水化合物底物合成纤维。

30.如权利要求29所述的工程化细菌，其中所述纤维为可溶性纤维。

31.如权利要求29或权利要求30所述的工程化细菌，其中所述合成的纤维包含葡萄糖、果糖、半乳糖醛酸、N-乙酰基-D-葡糖胺和/或半乳糖单体。

32.如权利要求29-31中任一项所述的工程化细菌，其中所述碳水化合物底物选自以下中的一者或多者：UDP-葡萄糖、UDP-半乳糖、UDP-岩藻糖、ADP-α-D-葡萄糖、UDP-半乳糖醛酸、UDP-N-乙酰基-α-D-葡糖胺、肌醇半乳糖苷、乳糖、葡萄糖以及蔗糖。

33.如权利要求29-32中任一项所述的工程化细菌，其中所述合成的纤维为果寡糖，并且/或者选自昆布二糖、愈创葡聚糖、凝胶多糖、燕麦β-葡聚糖、昆布多糖、pleuran、香菇多糖、酵母β葡聚糖、海藻酮糖、海藻糖、菊粉、蔗果三糖、蔗果四糖、左聚糖、棉子糖、水苏糖、毛蕊花糖、红细胞三糖、人乳寡糖(HMO)、纤维二糖、纤维素、微晶纤维素、棉花、麦芽糖、直链淀粉、淀粉、糖原、支链淀粉、果胶、几丁质。

34.如权利要求29-33中任一项所述的工程化细菌，其中所述纤维合成酶选自蔗糖酶、菊粉蔗糖酶、左聚糖蔗糖酶、1,3-β-葡聚糖合酶、1,3；1,4-β-D-葡聚糖合酶、1,6-β-葡聚糖合酶、蔗糖异构酶、1,6-α-半乳糖基转移酶、海藻酮糖合酶、海藻糖-6-磷酸合酶、α-1,4-半乳糖基转移酶、α-1,2-岩藻糖基转移酶、β-半乳糖苷酶、b-D-半乳糖苷酶、纤维素合酶、麦芽糖合酶、淀粉合酶、淀粉分支酶、糖原合酶、半乳糖醛酸基转移酶以及几丁质寡糖合酶。

35.如权利要求29-34中任一项所述的工程化细菌，其中所述纤维合成酶与分泌多肽可操作地连接。

36.如权利要求29-35中任一项所述的工程化细菌，其中所述细菌为芽孢形成细菌并且/或者呈芽孢形式。

37.如权利要求29-36中任一项所述的工程化细菌，其中所述细菌为益生菌。

38.如权利要求29-37中任一项所述的工程化细菌，其中所述细菌属于选自以下的属：芽孢杆菌属、双歧杆菌属、肠球菌属、埃希氏杆菌属、乳杆菌属、乳球菌属、明串珠菌属、片球菌属以及链球菌属，任选地其中所述细菌属于芽孢杆菌属，任选地其中所述细菌属于枯草芽孢杆菌种。

39.如权利要求29-38中任一项所述的工程化细菌，其中所述细菌属于特征在于不定殖于肠道的菌株。

40.如权利要求29-39中任一项所述的工程化细菌，其中纤维合成酶和/或由所述工程化细菌所包含的异源核酸序列编码的酶由所述纤维合成酶组成。

41.如权利要求29-40中任一项所述的工程化细菌，其中编码表达产物的所述核酸序列与组成性启动子可操作地连接。

42.如权利要求29-41中任一项所述的工程化细菌，其中编码表达产物的所述核酸序列与鞭毛蛋白基因启动子可操作地连接。

43.如权利要求42所述的工程化细菌，其中所述鞭毛蛋白基因启动子包含CsrA结合位点中的突变，其中所述CsrA结合位点中的所述突变抑制CsrA与编码所述纤维合成酶的mRNA转录物结合，但不阻碍所述纤维合成酶的表达。

44.如权利要求42或权利要求43所述的工程化细菌，其中所述工程化细菌包含降低FlgM对σ因子的抑制的内源性flgM基因的突变。

45.一种组合物，所述组合物包含如权利要求29-44中任一项所述的工程化细菌。

46.如权利要求45所述的组合物，其中所述组合物被配制成用于经口施用。

47.如权利要求45或46所述的制剂，其中所述制剂包含约10⁴至约10¹²个集落形成单位的所述工程化细菌。

48.如权利要求45-47中任一项所述的组合物，其中所述组合物包含生理学上可接受的载体。

49.如权利要求48所述的组合物，其中所述生理学上可接受的载体选自乳酸发酵食品、发酵乳制品、抗性淀粉、膳食纤维、碳水化合物、蛋白质、糖基化蛋白、水、胶囊填料以及胶状物质。

50.一种细菌细胞培养物，所述细菌细胞培养物包含如权利要求29-44中任一项所述的工程化细菌。

51.一种降低受试者的肠道中碳水化合物的量或浓度的方法，所述方法包括向所述受试者施用包含纤维合成酶的组合物，其中所述纤维合成酶从碳水化合物底物合成纤维。

52.一种增加受试者的肠道中纤维的量或浓度的方法，所述方法包括向所述受试者施用包含纤维合成酶的组合物，其中所述纤维合成酶从碳水化合物底物合成纤维。

53.一种对需要降低肠道中碳水化合物的量或浓度或增加肠道中纤维的量或浓度的受试者进行治疗的方法，所述方法包括向所述受试者施用包含纤维合成酶的组合物，其中所述纤维合成酶从碳水化合物底物合成纤维。

54.如权利要求53所述的方法，其中所述受试者罹患与碳水化合物消耗正向相关或关联的疾患。

55.如权利要求53所述的方法，其中所述受试者罹患与纤维消耗负向相关或关联的疾患。

56.如权利要求53-55中任一项所述的方法，其中所述受试者罹患选自以下的疾患：心血管疾病、心脏病、高血压、高血胆固醇、高血糖、糖尿病、肥胖症、肠道失调、炎性肠道疾病、肠易激综合征(IBS)、憩室炎、结肠直肠癌、肠癌、腹胀、痉挛、胀气、痔疮以及腹泻。

57.如权利要求51-56中任一项所述的方法，其中所述纤维为可溶性纤维。

58.如权利要求51-57中任一项所述的方法，其中所述合成纤维包含葡萄糖、果糖、半乳糖醛酸、N-乙酰基-D-葡糖胺和/或半乳糖单体。

59.如权利要求51-58中任一项所述的方法，其中所述碳水化合物底物选自以下中的一者或多者：UDP-葡萄糖、UDP-半乳糖、UDP-岩藻糖、ADP-α-D-葡萄糖、UDP-半乳糖醛酸、UDP-N-乙酰基-α-D-葡糖胺、肌醇半乳糖苷、乳糖、葡萄糖以及蔗糖，并且/或者在肠道中量或浓度降低的所述碳水化合物选自以下中的一者或多者：葡萄糖、半乳糖、蔗糖、果糖和/或乳糖。

60.如权利要求51-59中任一项所述的方法，其中所述合成纤维为果寡糖，并且/或者选自昆布二糖、愈创葡聚糖、凝胶多糖、燕麦β-葡聚糖、昆布多糖、pleuran、香菇多糖、酵母β葡聚糖、海藻酮糖、海藻糖、菊粉、蔗果三糖、蔗果四糖、左聚糖、棉子糖、水苏糖、毛蕊花糖、红细胞三糖、人乳寡糖(HMO)、纤维二糖、纤维素、微晶纤维素、棉花、麦芽糖、直链淀粉、淀粉、糖原、支链淀粉、果胶、几丁质。

61.如权利要求51-60中任一项所述的方法，其中所述纤维合成酶选自蔗糖酶、菊粉蔗糖酶、左聚糖蔗糖酶、1,3-β-葡聚糖合酶、1,3；1,4-β-D-葡聚糖合酶、1,6-β-葡聚糖合酶、蔗糖异构酶、1,6-α-半乳糖基转移酶、海藻酮糖合酶、海藻糖-6-磷酸合酶、α-1,4-半乳糖基转移酶、α-1,2-岩藻糖基转移酶、β-半乳糖苷酶、b-D-半乳糖苷酶、纤维素合酶、麦芽糖合酶、淀粉合酶、淀粉分支酶、糖原合酶、半乳糖醛酸基转移酶以及几丁质寡糖合酶。

62.如权利要求51-61中任一项所述的方法，其中所述方法包括向在之前一段时间内已消耗碳水化合物和/或所述碳水化合物底物的受试者施用所述组合物，其中所述之前一段时间为24小时12小时、6小时、3小时或1小时的时间。

63.如权利要求51-62中任一项所述的方法，其中所述方法包括向尚未消耗碳水化合物和/或所述碳水化合物底物的受试者施用所述组合物。

64.如权利要求51-62中任一项所述的方法，其中所述方法包括向在之前一段时间内尚未消耗碳水化合物和/或所述碳水化合物底物的受试者施用所述组合物，其中所述之前一段时间为24小时12小时、6小时、3小时或1小时的时间。

65.如权利要求51-64中任一项所述的方法，其中所述受试者在施用所述组合物之后一段时间内消耗碳水化合物和/或所述碳水化合物底物，其中所述之后一段时间为24小时12小时、6小时、3小时或1小时的时间。

66.如权利要求51-65中任一项所述的方法，其中所述方法防止糖在所述受试者的结肠中累积。

67.如权利要求51-66中任一项所述的方法，其中构成所述组合物的纤维合成酶和/或构成所述组合物的酶由所述纤维合成酶组成。

68.如权利要求51-67中任一项所述的方法，其中所述施用包括经口施用所述组合物。

69.一种包含纤维合成酶的组合物，其中所述纤维合成酶从碳水化合物底物合成纤维并且其中所述组合物被配制成用于经口施用。

70.如权利要求69所述的组合物，其中所述纤维为可溶性纤维。

71.如权利要求69或权利要求70所述的组合物，其中所述合成纤维包含葡萄糖、果糖、半乳糖醛酸、N-乙酰基-D-葡糖胺和/或半乳糖单体。

72.如权利要求69-71中任一项所述的组合物，其中所述碳水化合物底物选自以下中的一者或多者：UDP-葡萄糖、UDP-半乳糖、UDP-岩藻糖、ADP-α-D-葡萄糖、UDP-半乳糖醛酸、UDP-N-乙酰基-α-D-葡糖胺、肌醇半乳糖苷、乳糖、葡萄糖以及蔗糖。

73.如权利要求69-72中任一项所述的组合物，其中所述合成纤维为果寡糖，并且/或者选自昆布二糖、愈创葡聚糖、凝胶多糖、燕麦β-葡聚糖、昆布多糖、pleuran、香菇多糖、酵母β葡聚糖、海藻酮糖、海藻糖、菊粉、蔗果三糖、蔗果四糖、左聚糖、棉子糖、水苏糖、毛蕊花糖、红细胞三糖、人乳寡糖(HMO)、纤维二糖、纤维素、微晶纤维素、棉花、麦芽糖、直链淀粉、淀粉、糖原、支链淀粉、果胶、几丁质。

74.如权利要求69-73中任一项所述的组合物，其中所述纤维合成酶选自蔗糖酶、菊粉蔗糖酶、左聚糖蔗糖酶、1,3-β-葡聚糖合酶、1,3；1,4-β-D-葡聚糖合酶、1,6-β-葡聚糖合酶、蔗糖异构酶、1,6-α-半乳糖基转移酶、海藻酮糖合酶、海藻糖-6-磷酸合酶、α-1,4-半乳糖基转移酶、α-1,2-岩藻糖基转移酶、β-半乳糖苷酶、b-D-半乳糖苷酶、纤维素合酶、麦芽糖合酶、淀粉合酶、淀粉分支酶、糖原合酶、半乳糖醛酸基转移酶以及几丁质寡糖合酶。

75.如权利要求69-74中任一项所述的组合物，其中构成所述组合物的纤维合成酶和/或构成所述组合物的酶由所述纤维合成酶组成。

76.如权利要求69-75中任一项所述的组合物，其中所述组合物包含生理学上可接受的载体。

77.如权利要求76所述的组合物，其中所述生理学上可接受的载体选自乳酸发酵食品、发酵乳制品、抗性淀粉、膳食纤维、碳水化合物、蛋白质、糖基化蛋白、水、胶囊填料以及胶状物质。