CN109996874A

CN109996874A - 10-甲基硬脂酸的异源性产生

Info

Publication number: CN109996874A
Application number: CN201780071492.5A
Authority: CN
Inventors: A·J·肖; H·布里特不劳; D·V·克拉柏翠
Original assignee: Novogy Inc
Current assignee: Ginkgo Bioworks Inc
Priority date: 2016-09-20
Filing date: 2017-09-20
Publication date: 2019-07-09
Also published as: US20200123579A1; CA3036903A1; BR112019005270A2; US10975398B2; WO2018057607A9; US10457963B2; US20240084340A1; US20210269835A1; US20180105848A1; EP3516049A1; EP3516049A4; WO2018057607A1

Abstract

本发明公开包括甲基转移酶基因和/或还原酶基因的核酸和细胞。这些核酸和细胞可用于产生支化(甲基)脂质，例如10‑甲基硬脂酸酯。

Description

10-甲基硬脂酸的异源性产生

相关申请的交叉引用

本申请要求对2016年9月20日提交的美国临时专利申请序列第62/396,870号的优先权，所述临时申请以引用方式整体并入本文。

背景技术

衍生自农业植物油和动物油的脂肪酸可用作工业润滑剂、液压液、油脂和其他专用流体以及加工用油化学原料。这些脂肪酸的物理和化学性质的大部分源自其碳链长度和不饱和双键数。脂肪酸通常为16:0(16个碳，0个双键)、16:1(16个碳，1个双键)、18:0、18:1、18:2或18:3。重要的是，无双键(饱和)脂肪酸具有高氧化稳定性，但其在低温下固化。双键提高低温流动性，但降低氧化稳定性。这种折衷对润滑剂和其他专用流体制剂造成困难，因为需要在宽范围操作温度下的一致性长期性能(高氧化稳定性)。高18:1(油酸)脂肪酸油提供低温流动性和相对良好的氧化稳定性。因此，已研发具有高油酸组成的若干种商品，例如高油酸大豆油、高油酸葵花油和高油酸藻油。但油酸是烯烃，并且易发生氧化降解。

发明内容

本文所述的核酸、细胞和方法通常可用于产生支化(甲基)脂质，例如10-甲基硬脂酸，以及包括所述脂质的组合物。如10-甲基硬脂酸的饱和支化(甲基)脂质具有有利的低温流动性和有利的氧化稳定性，这是润滑剂和专用流体所需的性质。

各个方面涉及核酸，包括编码甲基转移酶蛋白质的重组tmsB基因、编码还原酶蛋白质的重组tmsA基因和/或编码tmsC蛋白质的重组tmsC基因。甲基转移酶蛋白质、还原酶蛋白质和/或tmsC蛋白质可以是由放线菌(Actinobacteria)物种表达的蛋白质，并且重组tmsB基因、重组tmsA基因和/或重组tmsC基因可进行密码子优化以用于在不同细菌门(例如，变形菌门(Proteobacterium))中或在真核生物(例如，酵母，例如腺嘌呤阿氏酵母(Arxula adeninivorans)(也称作腺嘌呤芽生葡萄孢酵母(Blastobotrys adeninivorans)或腺嘌呤毛孢子菌(Trichosporon adeninivorans))、酿酒酵母(Saccharomycescerevisiae)或解脂耶氏酵母(Yarrowia lipolytica))中的表达。重组tmsB基因、重组tmsA基因或重组tmsC基因可以可操作连接到能驱动在除了放线菌(例如，变形菌门)以外的细菌门中或在真核生物(例如，酵母)中表达的启动子。核酸可以是质粒或染色体。

一些方面涉及包括如本文所述核酸的细胞。细胞可包括支化(甲基)脂质，例如10-甲基硬脂酸；和/或环外亚甲基取代的脂质，例如10-亚甲基硬脂酸。细胞可以是真核细胞，例如藻类细胞、酵母细胞或植物细胞。

一些方面涉及通过培养包括如本文所述细胞的细胞培养物来产生的组合物。油组合物可包含支化(甲基)脂质，例如10-甲基硬脂酸；和/或环外亚甲基取代的脂质，例如10-亚甲基硬脂酸。

附图说明

图1描绘油酸转化为10-甲基硬脂酸的一种可能机制。油酸底物可作为甘油脂或磷脂的酰基链存在。捐献甲基的甲硫氨酸底物可作为S-腺苷甲硫氨酸存在。油酸和甲硫氨酸底物可转化为10-亚甲基硬脂酸(例如，作为甘油脂或磷脂的酰基链存在)和高半胱氨酸(例如，作为S-腺苷高半胱氨酸存在)。该反应可由如本文所述的tmsB蛋白质催化，见下文。10-亚甲基硬脂酸(例如，作为甘油脂或磷脂的酰基链存在)可还原为10-甲基硬脂酸。该反应可由如本文所述的tmsA蛋白质催化，见下文，例如使用NADPH作为还原剂。但说明书和权利要求书的语言并不限于任何特定反应机制。

图2描绘油酸转化为10-甲基硬脂酸的一种可能机制。作为羧酸存于胞质溶胶中的油酸可添加到单酰甘油-3-磷酸酯以形成包括油酸酰基的二酰甘油-3-磷酸酯。“10-甲基合酶”可将包括油酸酰基的二酰甘油-3-磷酸酯转化为包括10-甲基硬脂酸酰基的二酰甘油-3-磷酸酯。二酰基-3-磷酸酯可随后转化为三酰甘油，转化为另一磷脂，例如磷脂酰胆碱，或转化回单酰甘油-3-磷酸酯(例如，由此将游离的10-甲基硬脂酸根释放到胞质溶胶中)。但说明书和权利要求书的语言并不限于任何特定反应机制。

图3描绘来自16个不同细菌物种的编码催化甲基转移到烷基链的酶的原核操纵子，标记为A-P。tmsA和tmsB基因对于甲基化烷基链特别重要。tmsC基因对于甲基化烷基链也可很重要。这些基因的核苷酸序列和其所编码的氨基酸序列显示于SEQ ID NO:1-76中。

图4是质粒pNC704的图谱，其可用于在大肠杆菌(E.coli)中表达耻垢分枝杆菌(Mycobacterium smegmatis)基因tmsA(SEQ ID NO:1)和tmsB(SEQ ID NO:3)。质粒pNC738的核苷酸序列显示于SEQ ID NO:77中。

图5是质粒pNC738的图谱，其可用于在酵母(例如腺嘌呤阿氏酵母、酿酒酵母和解脂耶氏酵母)中表达耻垢分枝杆菌基因tmsA(SEQ ID NO:80)和tmsB(SEQ ID NO:81)的密码子优化形式。质粒pNC738的核苷酸序列显示于SEQ ID NO:78中。

图6是质粒BS-10MS_ER的图谱，其可用于在酵母(例如腺嘌呤阿氏酵母、酿酒酵母和解脂耶氏酵母)中表达耻垢分枝杆菌基因tmsA(SEQ ID NO:80)和tmsB(SEQ ID NO:81)的密码子优化形式。质粒BS-10MS_ER的核苷酸序列显示于SEQ ID NO:79中。

图7A和7B由多种脂肪酸标准品和从多个样品提取的脂质的重叠的气相色谱(GC)迹线组成。标准品为硬脂酸、10-甲基硬脂酸和油酸。在分析前将每一样品和标准品转酯化为脂肪酸甲基酯(FAME)。图7A描绘从表达来自耻垢分枝杆菌的tmsA和tmsB基因的大肠杆菌制备的FAME的GC迹线以及每一标准品的GC迹线。tmsA/tmsB样品显示在约10.777分钟的峰，对应于10-甲基硬脂酸标准品。图7B描绘图7A的每个迹线和两个额外迹线。第一额外迹线对应于从表达来自结核分枝杆菌(Mycobacterium tuberculosis)的ufa基因的大肠杆菌制备的FAME。该样品显示在约10.777分钟的峰，对应于10-甲基硬脂酸标准品。第二额外迹线对应于从已经空载体转染的大肠杆菌制备的FAME。该对照不显示在10.777分钟的峰，表明在经转化大肠杆菌中tmsA和tmsB基因合成10-甲基硬脂酸。

图8A和8B描绘GC-MS结果。图8A是从GC柱洗脱的脂质的气相色谱(GC)迹线。脂质是从已经编码耻垢分枝杆菌基因tmsA和tmsB的pNC704转染的大肠杆菌纯化，并且脂质转化为脂肪酸甲基酯。图8B是20.388到20.447分钟的A组在GC运行期间洗脱的脂质的质谱图。针对具有312的分子量的10-甲基硬脂酸脂肪酸甲基酯对质谱图进行选通。光谱还显示在313m/z的峰，对应于包括天然丰度同位素(例如，单一¹³C)的10-甲基硬脂酸甲基酯。

图9A-9D描绘以下载体的图谱，所述载体可用于表达所指示物种的tmsA和tmsB基因：pNC721(范巴伦氏分枝杆菌(Mycobacterium vanbaaleni))(SEQ ID NO:83)、pNC755(浅黄拟无枝酸球菌(Amycolicicoccus subflavus))(SEQ ID NO:84)、pNC757(甘氨酸棒状杆菌(Corynebacterium glyciniphilum))(SEQ ID NO:85)、pNC 904(浑浊红球菌(Rhodococcus opacus))(SEQ ID NO:86)、pNC905(嗜热子囊菌(Thermobifida fusca))(SEQ ID NO:87)、pNC906(弯曲嗜热单胞菌(Thermomonospora curvata))(SEQ ID NO:88)、pNC907(谷氨酸棒状杆菌(Corynebacterium glutamicum))(SEQ ID NO:89)、pNC908(苏别蒂山农霉菌(Agromycies subbeticus))(SEQ ID NO:90)、pNC910(淡黄分枝杆菌(Mycobacterium gilvum))(SEQ ID NO:91)、pNC911(紫檀分枝杆菌(Mycobacteriumsp.indicus))(SEQ ID NO:92)。

图10描绘以下载体的图谱：pNC985(SEQ ID NO:93)，其可用于在红球菌属(Rhodococcus)细菌中表达耻垢分枝杆菌tmsAB基因，和pNC986(SEQ ID NO:94)，其可用于在红球菌属细菌中表达嗜热子囊菌tmsAB基因。

图11描绘以下载体的图谱：pNC963(SEQ ID NO:95)，其编码在组成型tac启动子控制下的弯曲嗜热单胞菌tmsB基因，和pNC964(SEQ ID NO:96)，其编码在组成型tac启动子控制下的弯曲嗜热单胞菌tmsA基因。

图12是显示表达来自多种生物体的tmsB基因的解脂假丝酵母中的10-亚甲基硬脂酸的气相色谱检测的图表。

图13是显示在含有编码弯曲嗜热单胞菌tmsB的质粒的腺嘌呤阿氏酵母的8种转化体中，10-亚甲基脂肪酸与总脂肪酸相比的百分比的图表。最右侧的两种分离物经空载体对照转化。

图14是显示在含有弯曲嗜热单胞菌tmsB基因的稳定整合拷贝，并且经表达来自谷氨酸棒状杆菌(C.gl.)、弯曲嗜热单胞菌(T.cu.)或嗜热子囊菌(T.fu.)的tmsA的质粒或空载体对照(最右侧的两种转化体)转化的解脂耶氏酵母中，10-亚甲基脂肪酸和10-甲基脂肪酸的重量百分比的图表。

图15是显示在经空载体(-)或编码弯曲嗜热单胞菌tmsA(T.cu.tmsA)、弯曲嗜热单胞菌tmsB(T.cu.tmsB)或弯曲嗜热单胞菌tmsA和tmsB二者(T.cu.tmsA+tmsB)的载体转化的酿酒酵母的转化体中，10-亚甲基脂肪酸和10-甲基脂肪酸与总脂肪酸相比的重量百分比的图表。

图16是显示在含有tmsA-B融合蛋白质、tmsB-A融合蛋白质或空载体(-)的酿酒酵母的转化体中，10-亚甲基脂肪酸和10-甲基脂肪酸与总脂肪酸相比的重量百分比的图表。

图17是显示在含有tmsA-B融合蛋白质、tmsB-A融合蛋白质或空载体(-)的解脂假丝酵母的转化体中，10-亚甲基脂肪酸和10-甲基脂肪酸与总脂肪酸相比的重量百分比的图表。

图18是显示在含有tmsA-B融合蛋白质或空载体(-)的腺嘌呤阿氏酵母的转化体中，10-亚甲基脂肪酸和10-甲基脂肪酸与总脂肪酸相比的重量百分比的图表。

图19A-19D显示对以下序列的CLUSTAL OMEGA比对：由来自耻垢分枝杆菌(SEQ IDNO:4)、范巴伦氏分枝杆菌(SEQ ID NO:54)、浅黄拟无枝酸球菌(SEQ ID NO:12)、甘氨酸棒状杆菌(SEQ ID NO:20)、谷氨酸棒状杆菌(SEQ ID NO:16)、浑浊红球菌(SEQ ID NO:60)、苏别蒂山农霉菌(SEQ ID NO:8)、气生诺尔氏菌(Knoellia aerolata)(SEQ ID NO:26)、淡黄分枝杆菌(SEQ ID NO:36)、紫檀分枝杆菌(SEQ ID NO:42)、嗜热子囊菌(SEQ ID NO:70)和弯曲嗜热单胞菌(SEQ ID NO:76)的tmsB基因编码的tmsB蛋白质序列，以及来自大肠杆菌(Escherichia coli)的环丙烷脂肪酸合酶(Cfa)酶。

图20A-20E显示对以下序列的CLUSTAL OMEGA比对：由来自耻垢分枝杆菌(SEQ IDNO:2)、范巴伦氏分枝杆菌(SEQ ID NO:52)、浅黄拟无枝酸球菌(SEQ ID NO:10)、甘氨酸棒状杆菌(SEQ ID NO:18)、谷氨酸棒状杆菌(SEQ ID NO:14)、浑浊红球菌(SEQ ID NO:58)、苏别蒂山农霉菌(SEQ ID NO:6)、气生诺尔氏菌(SEQ ID NO:24)、淡黄分枝杆菌(SEQ ID NO:34)、紫檀分枝杆菌(SEQ ID NO:40)、嗜热子囊菌(SEQ ID NO:68)和弯曲嗜热单胞菌(SEQID NO:74)的tmsA基因编码的tmsA蛋白质序列，以及来自大肠杆菌的乙醇酸氧化酶亚单位GlcD酶。

具体实施方式

定义

冠词“一(a)”和“一(an)”在本文中用于指一个或多于一个(即，至少一个)所述冠词的语法宾语。例如，“一要素”一个要素或多于一个要素。

术语“生物活性部分”是指氨基酸序列，其小于全长氨基酸序列，但展现全长序列的至少一种活性。例如，甲基转移酶的生物活性部分可是指tmsB的一个或多个结构域，其具有将油酸(例如，包括油酸酯的磷脂)和甲硫氨酸(例如，S-腺苷甲硫氨酸)转化为10-亚甲基硬脂酸(例如，包括10-亚甲基硬脂酸酯的磷脂)的生物活性。还原酶的生物活性部分可是指tmsA的一个或多个结构域，其具有将10-亚甲基硬脂酸(例如，包括10-亚甲基硬脂酸酯的磷脂)和还原剂(例如，NADH、NADPH、FAD、FADH₂、FMNH₂)转化为10-甲基硬脂酸(例如，包括10-甲基硬脂酸酯的磷脂)的生物活性。蛋白质的生物活性部分包括肽或多肽，其包括与所述蛋白质的氨基酸序列足够同一或衍生自所述蛋白质的氨基酸序列的氨基酸序列，例如以下序列中所示的氨基酸序列：SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74或76，其包括少于全长蛋白质的氨基酸，并展现所述蛋白质的至少一种活性，尤其是甲基转移酶或还原酶活性。蛋白质的生物活性部分可包括、包括至少或包括至多例如100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206、207、208、209、210、211、212、213、214、215、216、217、218、219、220、221、222、223、224、225、226、227、228、229、230、231、232、233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、250、251、252、253、254、255、256、257、258、259、260、261、262、263、264、265、266、267、268、269、270、271、272、273、274、275、276、277、278、279、280、281、282、283、284、285、286、287、288、289、290、291、292、293、294、295、296、297、298、299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、316、317、318、319、320、321、322、323、324、325、326、327、328、329、330、331、332、333、334、335、336、337、338、339、340、341、342、343、344、345、346、347、348、349、350、351、352、353、354、355、356、357、358、359、360、361、362、363、364、365、366、367、368、369、370、371、372、373、374、375、376、377、378、379、380、381、382、383、384、385、386、387、388、389、390、391、392、393、394、395、396、397、398、399、400、401、402、403、404、405、406、407、408、409、410、411、412、413、414、415、416、417、418、419、420、421、422、423、424、425、426、427、428、429、430、431、432、433、434、435、436、437、438、439、440、441、442、443、444、445、446、447、448、449、450、451、452、453、454、455、456、457、458、459、460、461、462、463、464、465、466、467、468、469、470、471、472、473、474、475、476、477、478、479、480、481、482、483、484、485、486、487、488、489、490、491、492、493、494、495、496、497、498、499、500或更多氨基酸，或其中可导出的任何范围。通常，生物活性部分包括结构域或基序，其具有催化活性，例如产生10-亚甲基硬脂酸或10-甲基硬脂酸的催化活性。蛋白质的生物活性部分包括与全长肽具有相同活性的蛋白质部分和具有高于背景的活性的每一部分。例如，相对于全长酶，酶的生物活性部分可具有、具有至少或具有至多0.1％、0.5％、1％、2％、3％、4％、5％、10％、25％、30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％、99.5％、99.6％、99.7％、99.8％、99.9％、100％、100.1％、100.2％、100.3％、100.4％、100.5％、100.6％、100.7％、100.8％、100.9％、101％、105％、110％、115％、120％、125％、130％、135％、140％、145％、150％、160％、170％、180％、190％、200％、220％、240％、260％、280％、300％、320％、340％、360％、380％、400％或更高活性(或其中可导出的任何范围)。蛋白质的生物活性部分可包括缺少将蛋白质靶向细胞隔室的结构域的蛋白质部分。

术语“密码子优化”和“针对细胞进行密码子优化”是指编码核苷酸序列(例如，基因)，其已经改变以用在宿主细胞中相对普遍的同义密码子替换在所需宿主细胞中相对罕见的至少一个密码子。密码子优化由此容许通过使重组基因的密码子与宿主细胞的tRNA相匹配更好地利用宿主细胞的tRNA。例如，放线菌(原核生物)物种的密码子使用与酵母(真核生物)的密码子使用不同。编码放线菌蛋白质的mRNA在酵母宿主细胞中的翻译效率可通过用在特定酵母物种中更普遍的密码子替换相应放线菌基因的密码子来提高。密码子优化的基因由此具有与天然存在的基因不同的核苷酸序列。

术语“组成型启动子”是指独立于特定刺激(例如，独立于诸如异丙基β-D-1-硫代半乳糖吡喃糖苷等试剂的存在)介导可操作连接的基因的转录的启动子。

术语“DGAT1”是指编码1型二酰甘油酰基转移酶蛋白质的基因，例如编码酵母DGA2蛋白质的基因。

术语“DGAT2”是指编码2型二酰甘油酰基转移酶蛋白质的基因，例如编码酵母DGA1蛋白质的基因。

“二酰基甘油酯”、“二酰甘油”和“甘油二酯”是包括甘油和两个脂肪酸的酯。

术语“二酰甘油酰基转移酶”和“DGA”是指催化从二酰甘油形成三酰基甘油酯的任何蛋白质。二酰甘油酰基转移酶包括1型二酰甘油酰基转移酶(DGA2)、2型二酰甘油酰基转移酶(DGA1)和3型二酰甘油酰基转移酶(DGA3)和催化上文所提到的反应的所有同系物。

术语“二酰甘油酰基转移酶，1型”和“1型二酰甘油酰基转移酶”是指DGA2和DGA2同源体。

术语“二酰甘油酰基转移酶，2型”和“2型二酰甘油酰基转移酶”是指DGA1和DGA1同源体。

术语“结构域”是指蛋白质的氨基酸序列的一部分，其能折叠成独立于蛋白质的其余部分的稳定三维结构。

术语“药物”是指任何分子，其抑制细胞生长或增殖，由此提供针对含有赋予针对所述药物的抗性的基因的细胞的选择性优点。药物包括抗生素、抗微生物剂、毒素和杀虫剂。

“干重”和“细胞干重”意指在水的相对不存在下确定的重量。例如，提到产油细胞包括以干重计指定百分比的特定组分时意指，所述百分比是基于在移除基本上全部水后细胞的重量来计算。术语“干重％”在涉及具体脂肪酸(例如，油酸或10-甲基硬脂酸)时包括作为羧酸根、酯、硫酯和酰胺存在的脂肪酸。例如，以细胞干重％计以总脂肪酸的百分比包括10-甲基硬脂酸的细胞包括10-甲基硬脂酸、10-甲基硬脂酸根、包括10-甲基硬脂酸酯的二酰甘油的10-甲基硬脂酸根部分、包括10-甲基硬脂酸酯的三酰甘油的10-甲基硬脂酸根部分、包括10-甲基硬脂酸酯的磷脂的10-甲基硬脂酸根部分和10-甲基硬脂酸CoA的10-甲基硬脂酸根部分。术语“干重％”在涉及具体类型的脂肪酸(例如，C16脂肪酸、C18脂肪酸)时包括作为如上文所述的羧酸根、酯、硫酯和酰胺存在的脂肪酸(例如，对于10甲基硬脂酸)。

术语“编码”是指包括编码区、编码区的部分或其补体的核酸。DNA和RNA都可编码基因。DNA和RNA都可编码蛋白质。

如本文所用的术语“酶”是指可催化化学反应的蛋白质。

术语“表达”是指细胞中的核酸或氨基酸序列(例如，肽、多肽或蛋白质)的量。基因的表达增加是指该基因的转录增加。氨基酸序列、肽、多肽或蛋白质的表达增加是指编码所述氨基酸序列、肽、多肽或蛋白质的核酸的翻译增加。

如本文所用的术语“基因”可涵盖含有外显子的基因组序列，尤其是编码具体活性中所涉及的多肽序列的多核苷酸序列。所述术语进一步涵盖并非衍生自基因组序列的合成核酸。在某些实施方案中，基因缺少内含子，因为所述基因是基于cDNA和蛋白质序列的已知DNA序列来合成。在其他实施方案中，基因是合成的非天然cDNA，其中密码子已基于密码子使用针对在解脂假丝酵母或腺嘌呤阿氏酵母中的表达经优化。所述术语还可进一步包括包含上游、下游和/或内含子核苷酸序列的核酸分子。

术语“诱导型启动子”是指响应特定刺激介导可操作连接的基因的转录的启动子。

术语“整合的”是指作为细胞基因组中的插入物维持于细胞中的核酸，例如染色体中的插入物，包括质体基因组中的插入物。

“呈可操作连接”是指两个核酸序列之间，例如控制序列(通常启动子)与所连接序列(通常编码蛋白质的序列，也称为编码序列)之间的功能性连接。如果启动子可介导基因的转录，那么所述启动子与所述基因呈可操作连接。

术语“敲除突变”或“敲除”是指阻止天然基因转录并翻译为功能蛋白质的遗传修饰。

术语“核酸”是指任何长度的核苷酸的聚合形式，所述核苷酸为脱氧核糖核苷酸或核糖核苷酸或其类似物。多核苷酸可具有任何三维结构，并且可实施任何功能。以下是多核苷酸的非限制性示例：基因或基因片段的编码区或非编码区、根据连接分析确定的基因座(loci)(基因座(locus))、外显子、内含子、信使RNA(mRNA)、转移RNA、核糖体RNA、核酶、cDNA、重组多核苷酸、支化多核苷酸、质粒、载体、任何序列的经分离DNA、任何序列的经分离RNA、核酸探针和引物。多核苷酸可包括经修饰核苷酸，例如甲基化核苷酸和核苷酸类似物。如果存在，可在聚合物装配之前或之后给予对核苷酸结构的修饰。多核苷酸可进一步经修饰，例如通过与标记组分接合来修饰。在本文中提供的所有核酸序列中，U核苷酸可与T核苷酸互换。

术语“磷脂”是指包括甘油、两个脂肪酸和磷酸根的酯。磷酸根可共价连接到甘油的碳-3并且不包括进一步取代，即磷脂可以是磷脂酸。磷酸根可经以下基团取代：乙醇胺(例如，磷脂酰乙醇胺)、胆碱(例如，磷脂酰胆碱)、丝氨酸(例如，磷脂酰丝氨酸)、肌醇(例如，磷脂酰肌醇)、磷酸肌醇(例如，磷脂酰肌醇-3-磷酸、磷脂酰肌醇-4-磷酸、磷脂酰肌醇-5-磷酸)、肌醇二磷酸(例如，磷脂酰肌醇-4,5-二磷酸)或肌醇三磷酸(例如，磷脂酰肌醇-3,4,5-二磷酸)。

如本文所用，术语“质粒”是指物理上与生物体的基因组DNA分离的环状DNA分子。质粒可在引入宿主细胞中之前经线性化(在本文中称作线性化质粒)。线性化质粒可能无法自复制，但可整合到生物体的基因组DNA中并用所述基因组DNA来复制。

“启动子”是引导核酸转录的核酸控制序列。如本文所用，启动子包括在转录起始位点附近的必需核酸序列。

术语“蛋白质”是指包括氨基酸序列的分子，其中所述氨基酸通过肽键连接。

“转化”是指核酸转移到宿主生物体中或转移到宿主生物体的基因组中，得到遗传上稳定的继承性。含有经转化核酸的宿主生物体称为“重组”、“转基因”或“经转化”生物体。因此，可将本发明的核酸纳入能引入宿主细胞中并在所述宿主细胞中复制的重组构建体(通常DNA构建体)中。所述构建体可以是载体，其包括复制系统和能在给定宿主细胞中转录并翻译多肽编码序列的序列。通常，表达载体包括例如在5'和3'调节序列的转录控制下的一个或多个经克隆基因以及可选择标记物。所述载体还可含有启动子调节区(例如，控制诱导型或组成型、环境调节或发育调节、或位置特异性表达的调节区)、转录起始位点、核糖体结合位点、转录终止位点和/或多聚腺苷酸化信号。

术语“经转化细胞”是指已经历转化的细胞。因此，经转化细胞包括亲代基因组和可遗传的遗传修饰。

术语“三酰基甘油酯”、“三酰甘油”、“甘油三酯”和“TAG”是包括甘油和三个脂肪酸的酯。

微生物工程化

A.概述

基因和基因产物可引入微生物宿主细胞中。适用于表达基因和核酸分子的宿主细胞是可在真菌或细菌家族内广泛发现的微生物宿主。适宜宿主菌株的示例包括但不限于真菌或酵母物种，例如阿氏酵母属(Arxula)、曲霉菌属(Aspegillus)、橙壶菌属(Aurantiochytrium)、念珠菌属(Candida)、麦角菌属(Claviceps)、隐球菌属(Cryptococcus)、小克银霉属(Cunninghamella)、汉逊酵母属(Hansenula)、克鲁维酵母属(Kluyveromyces)、白冬孢酵母属(Leucosporidiella)、油脂酵母属(Lipomyces)、被孢霉属(Mortierella)、欧格酵母属(Ogataea)、毕赤酵母属(Pichia)、原壁菌属(Prototheca)、根霉菌属(Rhizopus)、红冬孢酵母属(Rhodosporidium)、红酵母属(Rhodotorula)、酵母菌属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)、银耳属(Tremella)、毛孢子菌属(Trichosporon)、耶氏酵母属(Yarrowia)；或细菌物种，例如蛋白菌和放线菌的成员，以及以下属：不动杆菌属(Acinetobacter)、节杆菌属(Arthrobacter)、短颈细菌属(Brevibacterium)、食酸菌属(Acidovorax)、芽孢杆菌属(Bacillus)、梭菌属(Clostridia)、链霉菌属(Streptomyces)、埃希氏菌属(Escherichia)、沙门菌属(Salmonella)、假单胞菌属(Pseudomonas)和棒状杆菌属(Cornyebacterium)。解脂耶氏酵母和腺嘌呤阿氏酵母适合用作宿主微生物，因为其可将其重量的大部分积累为三酰甘油。

含有引导外来蛋白质高水准表达的调节序列的微生物表达系统和表达载体是本领域技术人员已知的。这些中的任一者可用于构建嵌合基因以产生瞬时序列的任一种基因产物。随后可通过转化技术将这些嵌合基因引入适当微生物中，以提供酶的高水准表达。

例如，可将编码酶的基因克隆于适宜质粒中，并且作为宿主的上述起始亲代菌株可经所得质粒转化。该方法可增加每一编码酶的基因的拷贝数，并且因此可增加酶的活性。质粒并不特定受限，只要其赋予可遗传给微生物后代的所需遗传修饰即可。

可用于转化适宜宿主细胞的载体或盒众所周知。通常，载体或盒含有引导相关基因转录和翻译的序列、可选择标记物以及容许自主复制或染色体整合的序列。适宜载体包括基因5'的具有转录起始控制序列的区域，以及DNA片段3'的控制转录终止的区域。在某些实施方案中，两个控制区域都衍生自与经转化宿主细胞同源的基因，但应理解，所述控制区域无需衍生自对于选择作为产生宿主的具体物种为天然的基因。

载体的启动子、cDNA和3'UTR以及其他元件可通过克隆技术使用从天然来源分离的片段生成(参见，例如，Green和Sambrook，分子克隆:实验室手册(Molecular Cloning:A Laboratory Manual),(第4版，2012)；美国专利第4,683,202号(以引用方式并入))。或者，元件可使用已知方法以合成方式生成(参见，例如，Gene 164:49-53(1995))。

B.同源重组

同源重组是互补DNA序列比对并交换同源性区域的能力。将含有与所靶向基因组序列(“模板”)同源的序列的转基因DNA(“供体”)引入生物体中，并随后使其经历在相应同源基因组序列的位点重组到基因组中。

在宿主生物体中实施同源重组的能力对可在分子遗传水平上进行的过程具有多种实际影响，并且可用于生成可产生所需产物的微生物。就性质而言，同源重组是精确基因靶向事件，并且因此大多数以相同靶向序列生成的转基因系将在表型方面基本同一，使得筛选显著更少的转化事件成为必需。同源重组还靶向宿主染色体中的基因插入事件，即使在遗传选择不存在下也可能获得极佳遗传稳定性。由于不同染色体基因座将可能影响基因表达，即使来自外源启动子/UTR，同源重组可以是在不熟悉的基因组环境中询问基因座并评价这些环境因素对基因表达的影响的方法。

特别有用的使用同源重组的遗传工程化方法是增选特异性宿主调节元件，例如启动子/UTR，以用高特异性方式驱动异源基因表达。

由于同源重组是精确基因靶向事件，其可用于精确修饰所关注基因或区域内的任何核苷酸，只要已鉴别足够的侧翼区域即可。因此，同源重组可用作修饰影响RNA和/或蛋白质的基因表达的调节序列的手段。其可还可用于修饰蛋白质编码区，致力于修饰酶活性，例如底物特异性、亲和性和Km，由此影响宿主细胞代谢中的所需变化。同源重组提供操作宿主基因组的有效手段，从而实现基因靶向、基因转化、基因缺失、基因复制、基因倒位，以及交换基因表达调节元件，例如启动子、增强子和3'UTR。

同源重组可通过使用靶向构建体来实现，所述靶向构建体含有内源序列的碎片以“靶向”内源宿主细胞基因组内的所关注基因或区域。所述靶向序列可位于所关注基因或区域的5'，所关注基因/区域的3'，或甚至所关注基因/区域的侧翼。所述靶向构建体可作为具有额外载体主链的超螺旋质粒DNA、无载体主链的PCR产物或作为线性化分子，转化到宿主细胞中。在一些情形中，可有利地首先通过用限制性酶切割转基因DNA暴露转基因DNA(供体DNA)内的同源序列。该步骤可增加重组效率并减少不需要事件的发生率。其他增加重组效率的方法包括使用PCR生成含有与所靶向基因组序列同源的线性末端的转化转基因DNA。

C.载体和载体组分

用于根据本发明转化微生物的载体可通过本领域技术人员熟悉的已知技术根据本文公开内容来制备。载体通常含有一个或多个基因，其中每一基因编码所需产物(基因产物)的表达，并且可操作连接到一个或多个调节基因表达或将基因产物靶向到重组细胞中的特定位置的控制序列。

1.控制序列

控制序列是调节编码序列的表达或将基因产物引导到细胞内或细胞外的特定位置的核酸。调节表达的控制序列包括例如调节编码序列的转录的启动子和终止编码序列的转录的终止子。另一控制序列是位于编码序列末端的编码多聚腺苷酸化信号的3'非翻译序列。将基因产物引导到特定位置的控制序列包括编码信号肽的那些控制序列，其将其所附接的蛋白质引导到细胞内侧或外侧的特定位置。

因此，用于微生物中的基因表达的示例性载体设计含有所需基因产物(例如，可选择标记物，或酶)的编码序列，其与在酵母中具有活性的启动子可操作连接。或者，如果载体不含与所关注编码序列可操作连接的启动子，那么可将编码序列转化到细胞中，使得其在载体整合时与内源启动子可操作连接。

用于表达基因的启动子可以是天然连接到该基因的启动子或不同启动子。

启动子通常可表征为组成型或诱导型。组成型启动子通常在所有时间(或在细胞生命周期的某些时间)以相同水准具有活性或起作用以驱动表达。相反，诱导型启动子仅响应刺激而具有活性(或变得无活性)或被显著上调或下调。两种类型的启动子都可应用于本发明方法中。可用于本发明中的诱导型启动子包括那些响应刺激介导可操作连接的基因的转录的启动子，所述刺激例如外源提供的小分子、温度(热或冷)、培养基中缺少氮等。适宜启动子可激活基本上沉默的基因的转录，或上调(例如显著地)以低水准转录的可操作连接的基因的转录。

包括终止区控制序列是可选的，并且如果采用，那么所述选择主要是便利性选择，因为终止区是相对可互换的。终止区可针对转录起始区(启动子)是天然的，可针对所关注DNA序列是天然的，或可从另一来源获得(参见，例如，Chen和Orozco，Nucleic AcidsResearch 16:8411(1988))。

2.基因和密码子优化

通常，基因包括启动子、编码序列和终止控制序列。在通过重组DNA技术装配时，基因可称作表达盒并且可侧接限制性位点，以便于插入用于将重组基因引入宿主细胞中的载体中。表达盒可侧接来自基因组或其他核酸靶的DNA序列，以有利于通过同源重组将表达盒稳定整合到基因组中。或者，载体和其表达盒可保持未整合(例如，附加体)，在所述情形中，载体通常包括能提供载体DNA的复制的复制原点。

存于载体上的常见基因是编码蛋白质的基因，其表达容许含有所述蛋白质的重组细胞与不表达所述蛋白质的细胞相区分。所述基因和其相应的基因产物称为可选择标记物或选择标记物。众多种可选择标记物中的任一种可用于转基因构建体中，所述转基因构建体可用于转化本发明生物体。

对于重组蛋白质的最佳表达，有益地采用产生具有待转化宿主细胞最佳使用的密码子的mRNA的编码序列。因此，转基因的适当表达可能需要，转基因的密码子使用与所述转基因在其中表达的生物体的具体密码子偏好相匹配。产生该效应的准确机制有很多，但包括可用氨基酰化tRNA池与在细胞中合成的蛋白质的适当平衡，且在满足该需求时与转基因信使RNA(mRNA)的更有效翻译相偶联。在转基因中的密码子使用未经优化时，可用tRNA池不足以容许转基因mRNA的有效翻译，导致核糖体失速和终止以及可能的转基因mRNA不稳定。基因序列的密码子优化的资源描述于Puigbo等(Nucleic Acids Research 35:W126-31(2007))中，并且密码子优化策略的基础原理描述于Angov(Biotechnology Jornal 6:650-69(2011))中。提供不同生物体的密码子使用的统计学的公共数据库是可用的，包括www.kazusa.or.jp/codon/和其他公众可用的数据库和资源。

D.转化

可通过任何适宜技术转化细胞，包括例如生物弹道学、电穿孔、玻璃珠转化和碳化硅晶须转化。本发明中可采用将转基因引入微生物中的任何便捷技术。转化可通过例如以下方法来实现：D.M.Morrison的方法(Methods in Enzymology 68:326(1979))、用氯化钙增加受体细胞对DNA的通透性的方法(Mandel和Higa,J.Molecular Biology,53:159(1970))等。

在产油酵母(例如，解脂耶氏酵母)中表达转基因的示例可发现于文献中(Bordes等,J.Microbiological Methods,70:493(2007)；Chen等,Applied Microbiology&Biotechnology 48:232(1997))。在诸如大肠杆菌等细菌中表达外源基因的示例众所周知(Green和Sambrook,分子克隆：实验室手册(第4版，2012))。

用于根据本发明转化微生物的载体可通过本领域技术人员熟悉的已知技术来制备。在一个实施方案中，用于在微生物中表达基因的示例性载体设计含有与在所述微生物中具有活性的启动子可操作连接的编码酶的基因。或者，如果载体不含与所关注基因可操作连接的启动子，那么可将基因转化到细胞中，使得其在载体整合时与天然启动子可操作连接。载体还可含有编码蛋白质的第二基因。任选地，一个或两个基因之后是含有多聚腺苷酸化信号的3'非翻译序列。编码两个基因的表达盒可物理上连接于载体中或连接在单独载体上。还可使用微生物的共转化，其中同时使用不同载体分子来转化细胞(Protist 155:381-93(2004))。经转化细胞可任选地基于在缺少抗性盒的细胞不会生长的条件下在抗生素或其他可选择标记物存在下生长的能力来选择。

示例性细胞、核酸、组合物和方法

A.经转化细胞

在一些实施方案中，经转化细胞是原核细胞，例如细菌细胞。在一些实施方案中，细胞是真核细胞，例如哺乳动物细胞、酵母细胞、丝状真菌细胞、原生动物细胞、藻类细胞、禽类细胞、植物细胞或昆虫细胞。在一些实施方案中，细胞是酵母。本领域技术人员将认识到，丝状真菌的多种形式产生酵母样生长，并且本文中酵母的定义涵盖所述细胞。细胞可选自由藻类、细菌、霉菌、真菌、植物和酵母组成的组。细胞可以是酵母、真菌或酵母样藻类。细胞可选自破囊壶菌(橙壶菌属)和无叶绿素单细胞藻类(原壁菌属)。

细胞可选自由以下组成的组：阿氏酵母属、曲霉菌属、橙壶菌属、念珠菌属、麦角菌属、隐球菌属、小克银霉属、地丝菌属(Geotrichum)、汉逊酵母属、克鲁维酵母属、柯达酵母属(Kodamaea)、白冬孢酵母属、油脂酵母属、被孢霉属、欧格酵母属、毕赤酵母属、原壁菌属、根霉菌属、红冬孢酵母属、红酵母属、酵母菌属、裂殖酵母属、银耳属、毛孢子菌属、威克汉姆酵母属(Wickerhamomyces)和耶氏酵母属。明确预期，这些细胞类型中的一种或多种可从本发明的实施方案中排除。

细胞可选自由以下组成的组：腺嘌呤阿氏酵母、黑曲霉菌(Aspergillus niger)、米曲霉菌(Aspergillus orzyae)、土曲霉菌(Aspergillus terreus)、裂殖壶菌(Aurantiochytrium limacinum)、产朊假丝酵母(Candida utilis)、紫麦角菌(Clavicepspurpurea)、浅白隐球菌(Cryptococcus albidus)、弯曲隐球菌(Cryptococcus curvatus)、拉米隐球菌(Cryptococcus ramirezgomezianus)、土生隐球菌(Cryptococcus terreus)、威氏隐球菌(Cryptococcus wieringae)、刺孢小克银汉霉(Cunninghamella echinulata)、山茶小克银汉霉(Cunninghamella japonica)、发酵地霉酵母(Geotrichum fermentans)、多形汉逊酵母(Hansenula polymorpha)、乳酸克鲁维酵母(Kluyveromyces lactis)、马克斯克鲁维酵母(Kluyveromyces marxianus)、奥默柯达酵母(Kodamaea ohmeri)、克雷氏白冬孢酵母(Leucosporidiella creatinivora)、产油油脂酵母(Lipomyces lipofer)、斯达油脂酵母(Lipomyces starkeyi)、子囊菌油脂酵母(Lipomyces tetrasporus)、深黄被孢霉(Mortierella isabellina)、高山被孢霉(Mortierella alpina)、多形欧格酵母(Ogataeapolymorpha)、西弗毕赤酵母(Pichia ciferrii)、季也蒙毕赤酵母(Pichiaguilliermondii)、巴斯德毕赤酵母(Pichia pastoris)、树干毕赤酵母(Pichiastipites)、饶氏原壁菌(Prototheca zopfii)、少根根霉(Rhizopus arrhizus)、贝吉维红冬孢酵母(Rhodosporidium babjevae)、圆红冬孢酵母(Rhodosporidium toruloides)、沼泽生红冬孢酵母(Rhodosporidium paludigenum)、黏红酵母(Rhodotorula glutinis)、胶红酵母(Rhodotorula mucilaginosa)、酿酒酵母(Saccharomyces cerevisiae)、粟酒裂殖酵母(Schizosaccharomyces pombe)、恩氏银耳(Tremella enchepala)、皮肤毛孢子菌(Trichosporon cutaneum)、发酵性丝孢酵母(Trichosporon fermentans)、威克汉姆西弗酵母(Wickerhamomyces ciferrii)和解脂耶氏酵母(Yarrowia lipolytica)。明确预期，这些细胞类型中的一种或多种可从本发明的实施方案中排除。

细胞可以是酿酒酵母、解脂耶氏酵母或腺嘌呤阿氏酵母。

在某些实施方案中，如通过细胞干重％所测量，经转化细胞包括至少5％、10％、15％、20％、25％、30％、35％、40％、45％、50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％或更多脂质，或其中可导出的任何范围。在一些实施方案中，经转化细胞包括以下作为细胞中总C16和C18脂肪酸的百分比的浓度的C18脂肪酸：至少5％、10％、15％、20％、25％、30％、35％、40％、45％、50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％或更高，或其中可导出的任何范围。

在一些实施方案中，经转化细胞包括以下作为细胞中总C16和C18脂肪酸的百分比的浓度的油酸：至少5％、10％、15％、20％、25％、30％、35％、40％、45％、50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％或更高，或其中可导出的任何范围。在一些实施方案中，经转化细胞包括以下作为细胞中总脂肪酸的百分比的浓度的链长度为14-20个碳并且在Δ9、Δ10或Δ11位置具有甲基分支的线性脂肪酸(例如，10-甲基硬脂酸)：以重量计至少1％、2％、3％、4％、5％、6％、7％、8％、9％、10％、11％、12％、13％、14％、15％、16％、17％、18％、19％、20％、21％、22％、23％、24％、25％、26％、27％、28％、29％、30％、31％、32％、33％、34％、35％、36％、37％、38％、39％、40％、41％、42％、43％、44％、45％、46％、47％、48％、49％、50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％或更高，或其中可导出的任何范围。在一些实施方案中，脂肪酸的链长度为14、15、16、17、18、19或20个碳，或其中可导出的任何范围。

细胞可经修饰以提高其油酸酯含量，其用作10-甲基硬脂酸酯合成的底物。提高油酸脂含量的遗传修饰是已知的(参见，例如，2016年6月16日公开的PCT专利申请公开第WO16/094520号，其在此以引用方式整体并入)。例如，细胞可包括Δ12去饱和酶敲低或敲除，其有利于积累油酸酯并且不利于产生亚油酸酯。细胞可包括重组Δ9去饱和酶基因，其有利于产生油酸酯并且不利于积累硬脂酸酯。重组Δ9去饱和酶基因可以是例如来自解脂假丝酵母、腺嘌呤阿氏酵母或禾柄锈菌(Puccinia graminis)的Δ9去饱和酶基因。细胞可包括重组延长酶1基因，其有利于产生油酸酯并且不利于积累棕榈酸酯和棕榈油酸酯。重组延长酶1基因可以是来自解脂假丝酵母的延长酶1基因。细胞可包括重组延长酶2基因，其有利于产生油酸酯并且不利于积累棕榈酸酯和棕榈油酸酯。重组延长酶2基因可以是来自褐鼠(R.norvegicus)的延长酶2基因。

细胞可经修饰以提高其三酰甘油含量，由此提高其10-甲基硬脂酸酯含量。提高三酰甘油含量的遗传修饰是已知的(参见，例如，2016年6月16日公开的PCT专利申请公开第WO16/094520号，其在此以引用方式整体并入)。细胞可包括重组二酰甘油酰基转移酶基因(例如，DGAT1、DGAT2或DGAT3)，其有利于产生三酰甘油并且不利于积累二酰甘油。重组二酰甘油酰基转移酶基因可以是例如来自解脂假丝酵母的DGAT2(编码蛋白质DGA1)、来自紫麦角菌的DGAT1(编码蛋白质DGA2)或来自圆红冬孢酵母的DGAT2(编码蛋白质DGA1)。细胞可包括甘油-3-磷酸酯酰基转移酶基因(Sct1)敲低或敲除，根据细胞类型，其可有利于积累三酰甘油。细胞可包括重组甘油-3-磷酸酯酰基转移酶基因(Sct1)，例如来自腺嘌呤阿氏酵母的Sct1基因，其可有利于积累三酰甘油。细胞可包括三酰甘油脂肪酶基因(TGL)敲低或敲除，其可有利于在细胞中积累三酰甘油。

本发明的各个方面涉及经转化细胞。经转化细胞可包括重组甲基转移酶基因(例如，tmsB基因)、重组还原酶基因(例如，tmsA基因)、环外亚甲基替换的脂质和/或支化(甲基)脂质。经转化细胞可包括tmsC基因。支化(甲基)脂质可以是羧酸(例如，10-甲基硬脂酸、10-甲基棕榈酸、12-甲基油酸、13-甲基油酸、10-甲基-十八-12-烯酸)、羧酸酯(例如，10-甲基硬脂酸盐、10-甲基棕榈酸盐、12-甲基油酸盐、13-甲基油酸盐、10-甲基-十八-12-烯酸盐)、酯(例如，二酰甘油、三酰甘油、磷脂)、硫酯(例如，10-甲基硬脂酰基CoA、10-甲基棕榈酰基CoA、12-甲基油酰基CoA、13-甲基油酰基CoA、10-甲基-十八-12-烯酰基CoA)或酰胺。环外亚甲基替换的脂质可以是羧酸(例如，10-亚甲基硬脂酸、10-亚甲基棕榈酸、12-亚甲基油酸、13-亚甲基油酸、10-亚甲基-十八-12-烯酸)、羧酸盐(例如，10-亚甲基硬脂酸盐、10-亚甲基棕榈酸盐、12-亚甲基油酸盐、13-亚甲基油酸盐、10-亚甲基-十八-12-烯酸盐)、酯(例如，二酰甘油、三酰甘油、磷脂)、硫酯(例如，10-亚甲基硬脂酰基CoA、10-亚甲基棕榈酰基CoA、12-亚甲基油酰基CoA、13-亚甲基油酰基CoA、10-亚甲基-十八-12-烯酰基CoA)或酰胺。明确预期，上述脂质中的一种或多种可从本发明的实施方案中排除。

“脂肪酸”通常作为磷脂或三酰甘油存在于细胞中，但其也可作为单酰甘油或二酰甘油存在，例如作为代谢中间产物存在。游离脂肪酸也以相对丰富的羧酸根阴离子与相对稀少的电中性酸之间的平衡存在于细胞中。在生物合成或氧化期间，脂肪酸可作为硫酯、尤其作为具有辅酶A(CoA)的硫酯存在于细胞中。例如在共价结合到蛋白质以将蛋白质锚定到膜时，脂肪酸可作为酰胺存在于细胞中。

细胞可包括本文所述的任一核酸，见下文(参见，例如，下文章节B)。

支化(甲基)脂质可包括饱和支化脂肪族链(例如，10-甲基硬脂酸、10-甲基棕榈酸)或不饱和支化脂肪族链(例如，12-甲基油酸、13-甲基油酸、10-甲基-十八-12-烯酸)。支化(甲基)脂质可包括包含支化甲基的饱和或不饱和支化脂肪族链。

环外亚甲基取代的脂质可包括支化脂肪族链(例如，10-亚甲基硬脂酸、10-亚甲基棕榈酸、12-亚甲基油酸、13-亚甲基油酸、10-亚甲基-十八-12-烯酸)。脂肪族链可因脂肪族链经环外亚甲基取代而经支化。

支化(甲基)脂质可以是10-甲基硬脂酸根，或其酸(10-甲基硬脂酸)、酯(例如，二酰甘油、三酰甘油、磷脂)、硫酯(例如，10-甲基硬脂酰基CoA)或酰胺(例如，10-甲基硬脂酰基酰胺)。例如，支化(甲基)脂质可以是二酰甘油、三酰甘油或磷脂，并且所述二酰甘油、三酰甘油或磷脂可包括10-甲基硬脂酸酯。

环外亚甲基取代的脂质可以是10-亚甲基硬脂酸根，或其酸(10-亚甲基硬脂酸)、酯(例如，二酰甘油、三酰甘油、磷脂)、硫酯(例如，10-亚甲基硬脂酰基CoA)或酰胺(例如，10-亚甲基硬脂酰基酰胺)。例如，环外亚甲基取代的脂质可以是二酰甘油、三酰甘油或磷脂，并且所述二酰甘油、三酰甘油或磷脂可包括10-亚甲基硬脂酸酯。

在一些实施方案中，如通过细胞干重％所测量，细胞中约、至多约或至少约1％的脂肪酸可以是10-甲基硬脂酸。如通过细胞干重％所测量，细胞中约、至少约或至多约2％、3％、4％、5％、6％、7％、8％、9％、10％、11％、12％、13％、14％、15％、16％、17％、18％、19％、20％、21％、22％、23％、24％、25％、26％、27％、28％、29％、30％、31％、32％、33％、34％、35％、36％、37％、38％、39％、40％、41％、42％、43％、44％、45％、46％、47％、48％、49％、50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％的脂肪酸可以是10-甲基硬脂酸，或其中可导出的任何范围。

在一些实施方案中，如通过细胞干重％所测量，细胞中约、至少约或至多约1％的脂肪酸可以是10-亚甲基硬脂酸。如通过细胞干重％所测量，细胞中约、至少约或至多约2％、3％、4％、5％、6％、7％、8％、9％、10％、11％、12％、13％、14％、15％、16％、17％、18％、19％、20％、21％、22％、23％、24％、25％、26％、27％、28％、29％、30％、31％、32％、33％、34％、35％、36％、37％、38％、39％、40％、41％、42％、43％、44％、45％、46％、47％、48％、49％、50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％的脂肪酸可以是10-亚甲基硬脂酸，或其中可导出的任何范围。

在一些实施方案中，细胞中以重量计约、至少约或至多约1％的脂肪酸可以是本文所述支化(甲基)脂质中的一种或多种。细胞中以重量计约、至少约或至多约2％、3％、4％、5％、6％、7％、8％、9％、10％、11％、12％、13％、14％、15％、16％、17％、18％、19％、20％、21％、22％、23％、24％、25％、26％、27％、28％、29％、30％、31％、32％、33％、34％、35％、36％、37％、38％、39％、40％、41％、42％、43％、44％、45％、46％、47％、48％、49％、50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％的脂肪酸可以是本文所述支化(甲基)脂质中的一种或多种，或其中可导出的任何范围。

在一些实施方案中，细胞中以重量计约、至少约或至多约1％的脂肪酸可以是本文所述支化(甲基)脂质中的一种或多种(例如，链长度为14-20个碳并且在Δ9、Δ10或Δ11位置具有甲基分支的线性脂肪酸)。细胞中约、至少约或至多约2％、3％、4％、5％、6％、7％、8％、9％、10％、11％、12％、13％、14％、15％、16％、17％、18％、19％、20％、21％、22％、23％、24％、25％、26％、27％、28％、29％、30％、31％、32％、33％、34％、35％、36％、37％、38％、39％、40％、41％、42％、43％、44％、45％、46％、47％、48％、49％、50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％的脂肪酸可以是本文所述支化(甲基)脂质中的一种或多种(例如，链长度为14-20个碳并且在Δ9、Δ10或Δ11位置具有甲基分支的线性脂肪酸)，或其中可导出的任何范围。

在一些实施方案中，如通过细胞干重％所测量，细胞可包括约、至少约或至多约1％的10-甲基硬脂酸。如通过细胞干重％所测量，细胞可包括约、至少约或至多约2％、3％、4％、5％、6％、7％、8％、9％、10％、11％、12％、13％、14％、15％、16％、17％、18％、19％、20％、21％、22％、23％、24％、25％、26％、27％、28％、29％、30％、31％、32％、33％、34％、35％、36％、37％、38％、39％、40％、41％、42％、43％、44％、45％、46％、47％、48％、49％或50％的10-甲基硬脂酸，或其中可导出的任何范围。

在一些实施方案中，如通过细胞干重％所测量，细胞可包括约、至少约或至多约1％的10-亚甲基硬脂酸。如通过细胞干重％所测量，细胞可包括约、至少约或至多约2％、3％、4％、5％、6％、7％、8％、9％、10％、11％、12％、13％、14％、15％、16％、17％、18％、19％、20％、21％、22％、23％、24％、25％、26％、27％、28％、29％、30％、31％、32％、33％、34％、35％、36％、37％、38％、39％、40％、41％、42％、43％、44％、45％、46％、47％、48％、49％或50％的10-亚甲基硬脂酸，或其中可导出的任何范围。

与本发明细胞具有相同类型(例如，物种)的未经修饰细胞可不包括10-甲基硬脂酸酯，或其酸(10-甲基硬脂酸)、酯(例如，二酰甘油、三酰甘油、磷脂)、硫酯(例如，10-甲基硬脂酰基CoA)或酰胺(例如，10-甲基硬脂酰基酰胺)(例如，其中未经修饰的细胞不包括重组甲基转移酶基因或重组还原酶基因)。与本发明细胞具有相同类型(例如，物种)的未经修饰细胞可不包括10-亚甲基硬脂酸酯，或其酸(10-亚甲基硬脂酸)、酯(例如，二酰甘油、三酰甘油、磷脂)、硫酯(例如，10-亚甲基硬脂酰基CoA)或酰胺(例如，10-亚甲基硬脂酰基酰胺)(例如，其中未经修饰的细胞不包括重组甲基转移酶基因或重组还原酶基因)。在一些实施方案中，与所述细胞为相同物种的未经修饰的细胞不包括支化(甲基)脂质和/或环外亚甲基取代的脂质。在一些实施方案中，与所述细胞为相同物种的未经修饰的细胞不包括本文所述支化(甲基)脂质或环外亚甲基取代的脂质中的一种或多种。

细胞可组成型表达由重组甲基转移酶基因编码的蛋白质。细胞可组成型表达由重组还原酶基因编码的蛋白质。细胞可组成型表达由重组tmsC基因编码的蛋白质。细胞可组成型表达甲基转移酶蛋白质。细胞可组成型表达还原酶蛋白质。细胞可组成型表达tmsC蛋白质。

B.核酸

本发明的各个方面涉及包括重组甲基转移酶基因、重组还原酶基因或二者的核酸。核酸可以是例如质粒。在一些实施方案中，重组甲基转移酶基因和/或重组还原酶基因整合到细胞基因组中，并且因此核酸可以是染色体。在一些实施方案中，本发明涉及包括重组甲基转移酶基因的细胞，例如其中重组甲基转移酶基因存于质粒或染色体中。在一些实施方案中，本发明涉及包括重组还原酶基因的细胞，例如其中重组还原酶基因存于质粒或染色体中。重组甲基转移酶基因和重组还原酶基因可存于细胞中的同一核酸(例如，同一质粒或染色体)中或不同核酸(例如，不同质粒或染色体)中。

核酸可能可遗传给经转化细胞的后代。例如重组甲基转移酶基因或重组还原酶基因的基因可以是可遗传的，因为其驻留在质粒或染色体上。在某些实施方案中，基因可以是可遗传的，因为其整合到经转化细胞的基因组中。

基因可包括保守替换、缺失和/或插入，同时仍编码具有活性的蛋白质。例如，可针对特定宿主细胞优化密码子，不同密码子可以是便捷起见经替换，例如以引入限制位点或产生最佳PCR引物，或者密码子可以是另一目的经替换。类似地，核苷酸序列可经改变以产生保守氨基酸替换、缺失和/或插入。

蛋白质可包括保守替换、缺失和/或插入，同时仍维持活性。保守替换表为本领域所熟知(Creighton，蛋白质(Proteins)(第2d版，1992))。

氨基酸替换、缺失和/或插入可使用重组DNA操作技术容易地实现。操作DNA序列以产生蛋白质的替换、插入或缺失变体的方法为本领域所熟知。这些方法包括M13诱变、T7-Gen体外诱变(USB,Cleveland,OH)、快速变化定点诱变(Stratagene,San Diego,CA)、PCR介导定点诱变和其他定点诱变方案。

为了确定两个氨基酸序列或两个核酸序列的同一性百分比，可比对序列用于最佳比较目的(例如，可在第一和第二氨基酸或核酸序列中的一个或两个中引入空位以获得最佳比对，并且为了比较目的可忽视不相同序列)。为了比较目的比对的参考序列的长度可以是所述参考序列的长度的至少95％。随后可比较在相应氨基酸位置或核苷酸位置的氨基酸残基或核苷酸。在第一序列中的位置由与第二序列中的相应位置相同的氨基酸残基或核苷酸占据时，那么所述分子在该位置同一(如本文所用，氨基酸或核酸“同一性”等同于氨基酸或核酸“同源性”)。两个序列之间的同一性百分比随序列共有的同一性位置数而变，并考虑为了两个序列的最佳比对需要引入的空位数和每个空位的长度。

序列的比较和两个序列之间的同一性百分比的确定可使用数学算法来完成。除非另外指定，否则在本文中提到两个氨基酸序列之间的同一性百分比时是指如使用Needleman和Wunsch(J.Molecular Biology 48:444-453(1970))算法确定的同一性百分比，所述算法已并入GCG软件包(可在http://www.gcg.com获得)的GAP程序中，使用Blosum62矩阵、空位权重为10，并且长度权重为4。在一些实施方案中，两个氨基酸序列之间的同一性百分比是通过Needleman和Wunsch算法使用Blosum 62矩阵或PAM250矩阵来确定，并且空位权重为16、14、12、10、8、6或4，且长度权重为1、2、3、4、5或6。除非另外指定，否则在本文中提到两个核苷酸序列之间的同一性百分比时是指如使用GCG软件包(可在http://www.gcg.com获得)的GAP程序确定的同一性百分比，其使用NWSgapdna.CMP矩阵，并且空位权重为60，且长度权重为4。在另一实施方案中，两个核苷酸序列之间的同一性百分比可使用40、50、60、70或80的空位权重和1、2、3、4、5或6的长度权重来确定。在另一实施方案中，两个氨基酸或核苷酸序列之间的同一性百分比可使用E.Meyers和W.Miller的算法(ComputerApplications in the Biosciences 4:11-17(1988))来确定，所述算法已并入ALIGN程序(2.0或2.0U版)中，其使用PAM120权重残基表、12的空位长度罚分和4的空位罚分。

可用于确定两个序列之间的同一性的示例性电脑程序包括但不限于BLAST程序套件，例如BLASTN、MEGABLAST、BLASTX、TBLASTN、TBLASTX和BLASTP，以及Clustal程序，例如ClustalW、ClustalX和Clustal Omega。

在相对于GenBank DNA序列和其他公众数据库中的核酸序列评估给定核酸序列时，序列搜索通常是使用BLASTN程序来实施。BLASTX程序可有效针对GenBank蛋白质序列和其他公众数据库中的氨基酸序列搜索已在所有阅读框中经翻译的核酸序列。

比对所选序列以确定两个或更多个序列之间的“同一性％”是使用例如CLUSTAL-W程序来进行。

“编码序列”或“编码区”是指具有在表达序列时产生蛋白质产物(例如氨基酸或多肽)所需的序列信息的核酸分子。编码序列可包括翻译区内的非翻译序列(包括内含子或5'或3'非翻译区)和/或由其组成，或可缺少所述介入的非翻译序列(例如，如在cDNA中)。

在说明书通篇中用于提到包括核苷酸序列和/或由核苷酸序列组成的核酸的缩写是常规的单字母缩写。因此，当包括于核酸中时，天然存在的编码核苷酸缩写如下：腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)、胸腺嘧啶(T)和尿嘧啶(U)。同样，除非另外指定，否则本文中呈现的核酸序列是5'→3'方向。

如本文所用，术语“互补”和其衍生词用于指通过熟知规则进行核酸配对，其中A与T或U配对，C与G配对。互补物可以是“部分”或“完整”互补物。在部分互补物中，仅一些核酸碱基根据碱基配对原则匹配；而在完整或完全互补物中，所有碱基都根据配对原则匹配。核酸链之间的互补程度可对核酸链之间的杂交效率和强度具有显著影响，如本领域所熟知。所述杂交的效率和强度取决于检测方法。

在本文中称作与SEQ ID NO中所述的序列具有一定序列同一性百分比的任何核酸包括与SEQ ID NO中所述序列的互补物具有一定序列同一性百分比的核酸。

i.包括重组甲基转移酶基因的核酸

甲基转移酶基因(例如，重组甲基转移酶基因)编码甲基转移酶蛋白质，其为能将碳原子和一个或多个与其结合的质子从例如S-腺苷甲硫氨酸的底物转移到例如油酸的脂肪酸的酶(例如，其中脂肪酸是作为游离脂肪酸、羧酸酯、磷脂、二酰甘油或三酰甘油存在)。甲基转移酶基因(例如，重组甲基转移酶基因)可包括以下序列中所述的任一核苷酸序列：SEQ ID NO:3、SEQ ID NO:7、SEQ ID NO:11、SEQ ID NO:15、SEQ ID NO:19、SEQ ID NO:25、SEQ ID NO:29、SEQ ID NO:35、SEQ ID NO:41、SEQ ID NO:45、SEQ ID NO:49、SEQ ID NO:53、SEQ ID NO:59、SEQ ID NO:63、SEQ ID NO:69、SEQ ID NO:75和SEQ ID NO:81。甲基转移酶基因(例如，重组甲基转移酶基因)可以是如本文所述的10-甲基硬脂酸B基因(tmsB)或其生物活性部分(即，其中其生物活性部分包括甲基转移酶活性)。

甲基转移酶基因(例如，重组甲基转移酶基因)可衍生自放线菌的革兰氏阳性物种，例如分枝杆菌属(Mycobacteria)、棒杆菌属(Corynebacteria)、诺卡尔菌属(Nocardia)、链霉菌属或红球菌属。甲基转移酶基因(例如，重组甲基转移酶基因)可选自由以下组成的组：耻垢分枝杆菌基因tmsB、苏别蒂山农霉菌基因tmsB、浅黄拟无枝酸球菌基因tmsB、谷氨酸棒状杆菌基因tmsB、甘氨酸棒杆菌(Corynebacterium glyciniphilium)基因tmsB、气生诺尔氏菌(Knoella aerolata)基因tmsB、南非分枝杆菌(Mycobacteriumaustroafricanum)基因tmsB、淡黄分枝杆菌基因tmsB、普拉尼亚分枝杆菌(Mycobacteriumindicus pranii)基因tmsB、草分枝杆菌(Mycobacterium phlei)基因tmsB、结核分枝杆菌基因tmsB、范巴伦氏分枝杆菌基因tmsB、浑浊红球菌基因tmsB、拉格西斯链霉菌(Streptomyces regnsis)基因tmsB、嗜热子囊菌基因tmsB和弯曲嗜热单胞菌基因tmsB。明确预期，可从本发明的实施方案排除上文一种或多种甲基转移酶基因。

重组甲基转移酶基因可以是重组体，因为其可操作连接到甲基转移酶基因的天然存在的启动子以外的启动子。所述基因可用于驱动特定物种细胞中的转录。重组甲基转移酶基因可以是重组体，因为其相对于天然存在的甲基转移酶基因含有一个或多个核苷酸替换。所述基因可用于提高特定物种细胞中的甲基转移酶基因的mRNA转录物的翻译效率。

核酸可包括重组甲基转移酶基因和启动子，其中重组甲基转移酶基因和启动子是可操作连接。重组甲基转移酶基因和启动子可衍生自不同物种。例如，重组甲基转移酶基因可编码放线菌的革兰氏阳性物种的甲基转移酶蛋白质，并且重组甲基转移酶基因可以可操作连接到启动子，所述启动子可驱动另一细菌门(例如，变形菌门，例如大肠杆菌)或真核生物(例如，藻类细胞、酵母细胞或植物细胞)中的转录。启动子可以是真核启动子。细胞可包括核酸，并且启动子可能够驱动所述细胞中的转录。细胞可包括重组甲基转移酶基因，并且重组甲基转移酶基因可以可操作连接到能在细胞中驱动重组甲基转移酶基因转录的启动子。细胞可以是酵母物种，并且启动子可以是酵母启动子。细胞可以是细菌物种，并且启动子可以是细菌启动子(例如，其中细菌启动子并非来自放线菌的启动子)。细胞可以是藻类物种，并且启动子可以是藻类启动子。细胞可以是植物物种，并且启动子可以是植物启动子。

重组甲基转移酶基因可以可操作连接到无法驱动重组甲基转移酶基因在为重组甲基转移酶基因的来源的细胞中转录的启动子。例如，启动子可不能结合重组甲基转移酶基因源自的细胞的RNA聚合酶。在一些实施方案中，启动子无法结合原核RNA聚合酶和/或起始由原核RNA聚合酶介导的转录。在一些实施方案中，重组甲基转移酶基因可操作连接到无法驱动所述基因编码的蛋白质在该基因起源的的细胞中的转录的启动子。例如，启动子可不能结合天然表达由重组甲基转移酶基因编码的甲基转移酶的细胞的RNA聚合酶。

启动子可以是诱导型启动子或组成型启动子。启动子可以是2016年1月28日公开的PCT专利申请公开第WO 2016/014900号(其在此以引用方式整体并入)中所述的任一启动子。WO 2016/014900描述衍生自酵母物种解脂耶氏酵母和腺嘌呤阿氏酵母的多种启动子，其可特别可用作用于驱动酵母细胞中的重组基因的转录的启动子。启动子可以是来自编码以下产物的基因的启动子：翻译延长因子EF-1α；甘油-3-磷酸酯脱氢酶；磷酸丙糖异构酶1；果糖-1,6-二磷酸醛缩酶；磷酸甘油酸酯变位酶；丙酮酸激酶；输出蛋白质EXP1；核糖体蛋白质S7；醇脱氢酶；磷酸甘油酸酯激酶；己糖转运蛋白；一般氨基酸通透酶；丝氨酸蛋白酶；异柠檬酸裂合酶；酰基-CoA氧化酶；ATP-硫酸化酶；己糖激酶；3-磷酸甘油酸酯脱氢酶；丙酮酸脱氢酶α亚基；丙酮酸脱氢酶β亚基；顺乌头酸酶；烯醇化酶；肌动蛋白；多药耐药蛋白(ABC转运蛋白)；泛素；GTP酶；质膜Na+/Pi协同转运蛋白；丙酮酸脱羧酶；植酸酶；或α-淀粉酶，例如其中所述基因是酵母基因，例如来自解脂耶氏酵母或腺嘌呤阿氏酵母的基因。

重组甲基转移酶基因可包括与SEQ ID NO:3、SEQ ID NO:7、SEQ ID NO:11、SEQ IDNO:15、SEQ ID NO:19、SEQ ID NO:25、SEQ ID NO:29、SEQ ID NO:35、SEQ ID NO:41、SEQ IDNO:45、SEQ ID NO:49、SEQ ID NO:53、SEQ ID NO:59、SEQ ID NO:63、SEQ ID NO:69、SEQ IDNO:75或SEQ ID NO:81中所述核苷酸序列具有至少约65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％序列同一性的核苷酸序列。重组甲基转移酶基因可包括与SEQ ID NO:3、SEQ ID NO:7、SEQID NO:11、SEQ ID NO:15、SEQ ID NO:19、SEQ ID NO:25、SEQ ID NO:29、SEQ ID NO:35、SEQID NO:41、SEQ ID NO:45、SEQ ID NO:49、SEQ ID NO:53、SEQ ID NO:59、SEQ ID NO:63、SEQID NO:69、SEQ ID NO:75或SEQ ID NO:81中所述核苷酸序列的在以下核苷酸位置开始的150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250或1300个连续碱基对(或其中可导出的任何范围)具有、具有至少或具有至多65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％序列同一性(或其中可导出的任何范围)的核苷酸序列：1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206、207、208、209、210、211、212、213、214、215、216、217、218、219、220、221、222、223、224、225、226、227、228、229、230、231、232、233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、250、251、252、253、254、255、256、257、258、259、260、261、262、263、264、265、266、267、268、269、270、271、272、273、274、275、276、277、278、279、280、281、282、283、284、285、286、287、288、289、290、291、292、293、294、295、296、297、298、299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、316、317、318、319、320、321、322、323、324、325、326、327、328、329、330、331、332、333、334、335、336、337、338、339、340、341、342、343、344、345、346、347、348、349、350、351、352、353、354、355、356、357、358、359、360、361、362、363、364、365、366、367、368、369、370、371、372、373、374、375、376、377、378、379、380、381、382、383、384、385、386、387、388、389、390、391、392、393、394、395、396、397、398、399、400、401、402、403、404、405、406、407、408、409、410、411、412、413、414、415、416、417、418、419、420、421、422、423、424、425、426、427、428、429、430、431、432、433、434、435、436、437、438、439、440、441、442、443、444、445、446、447、448、449、450、451、452、453、454、455、456、457、458、459、460、461、462、463、464、465、466、467、468、469、470、471、472、473、474、475、476、477、478、479、480、481、482、483、484、485、486、487、488、489、490、491、492、493、494、495、496、497、498、499、500、501、502、503、504、505、506、507、508、509、510、511、512、513、514、515、516、517、518、519、520、521、522、523、524、525、526、527、528、529、530、531、532、533、534、535、536、537、538、539、540、541、542、543、544、545、546、547、548、549、550、551、552、553、554、555、556、557、558、559、560、561、562、563、564、565、566、567、568、569、570、571、572、573、574、575、576、577、578、579、580、581、582、583、584、585、586、587、588、589、590、591、592、593、594、595、596、597、598、599、600、601、602、603、604、605、606、607、608、609、610、611、612、613、614、615、616、617、618、619、620、621、622、623、624、625、626、627、628、629、630、631、632、633、634、635、636、637、638、639、640、641、642、643、644、645、646、647、648、649、650、651、652、653、654、655、656、657、658、659、660、661、662、663、664、665、666、667、668、669、670、671、672、673、674、675、676、677、678、679、680、681、682、683、684、685、686、687、688、689、690、691、692、693、694、695、696、697、698、699、700、701、702、703、704、705、706、707、708、709、710、711、712、713、714、715、716、717、718、719、720、721、722、723、724、725、726、727、728、729、730、731、732、733、734、735、736、737、738、739、740、741、742、743、744、745、746、747、748、749、750、751、752、753、754、755、756、757、758、759、760、761、762、763、764、765、766、767、768、769、770、771、772、773、774、775、776、777、778、779、780、781、782、783、784、785、786、787、788、789、790、791、792、793、794、795、796、797、798、799、800、801、802、803、804、805、806、807、808、809、810、811、812、813、814、815、816、817、818、819、820、821、822、823、824、825、826、827、828、829、830、831、832、833、834、835、836、837、838、839、840、841、842、843、844、845、846、847、848、849、850、851、852、853、854、855、856、857、858、859、860、861、862、863、864、865、866、867、868、869、870、871、872、873、874、875、876、877、878、879、880、881、882、883、884、885、886、887、888、889、890、891、892、893、894、895、896、897、898、899、900、901、902、903、904、905、906、907、908、909、910、911、912、913、914、915、916、917、918、919、920、921、922、923、924、925、926、927、928、929、930、931、932、933、934、935、936、937、938、939、940、941、942、943、944、945、946、947、948、949、950、951、952、953、954、955、956、957、958、959、960、961、962、963、964、965、966、967、968、969、970、971、972、973、974、975、976、977、978、979、980、981、982、983、984、985、986、987、988、989、990、991、992、993、994、995、996、997、998、999、1000、1001、1002、1003、1004、1005、1006、1007、1008、1009、1010、1011、1012、1013、1014、1015、1016、1017、1018、1019、1020、1021、1022、1023、1024、1025、1026、1027、1028、1029、1030、1031、1032、1033、1034、1035、1036、1037、1038、1039、1040、1041、1042、1043、1044、1045、1046、1047、1048、1049、1050、1051、1052、1053、1054、1055、1056、1057、1058、1059、1060、1061、1062、1063、1064、1065、1066、1067、1068、1069、1070、1071、1072、1073、1074、1075、1076、1077、1078、1079、1080、1081、1082、1083、1084、1085、1086、1087、1088、1089、1090、1091、1092、1093、1094、1095、1096、1097、1098、1099、1100、1101、1102、1103、1104、1105、1106、1107、1108、1109、1110、1111、1112、1113、1114、1115、1116、1117、1118、1119、1120、1121、1122、1123、1124、1125、1126、1127、1128、1129、1130、1131、1132、1133、1134、1135、1136、1137、1138、1139、1140、1141、1142、1143、1144、1145、1146、1147、1148、1149、1150、1151、1152、1153、1154、1155、1156、1157、1158、1159、1160、1161、1162、1163、1164、1165、1166、1167、1168、1169、1170、1171、1172、1173、1174、1175、1176、1177、1178、1179、1180、1181、1182、1183、1184、1185、1186、1187、1188、1189、1190、1191、1192、1193、1194、1195、1196、1197、1198、1199或1200。重组甲基转移酶可具有或可不具有与SEQ ID NO:3、SEQ ID NO:7、SEQ ID NO:11、SEQ ID NO:15、SEQ ID NO:19、SEQ ID NO:25、SEQ ID NO:29、SEQ ID NO:35、SEQ ID NO:41、SEQ ID NO:45、SEQ ID NO:49、SEQ ID NO:53、SEQ ID NO:59、SEQ ID NO:63、SEQ ID NO:69、SEQ ID NO:75或SEQ IDNO:81中所述任一核苷酸序列的100％序列同一性。重组甲基转移酶基因可具有或可不具有与SEQ ID NO:3、SEQ ID NO:7、SEQ ID NO:11、SEQ ID NO:15、SEQ ID NO:19、SEQ ID NO:25、SEQ ID NO:29、SEQ ID NO:35、SEQ ID NO:41、SEQ ID NO:45、SEQ ID NO:49、SEQ IDNO:53、SEQ ID NO:59、SEQ ID NO:63、SEQ ID NO:69、SEQ ID NO:75或SEQ ID NO:81中所述核苷酸序列的150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250或1300个连续碱基对的100％序列同一性。重组甲基转移酶基因可包括与SEQ ID NO:3、SEQ ID NO:7、SEQ ID NO:11、SEQ ID NO:15、SEQ IDNO:19、SEQ ID NO:25、SEQ ID NO:29、SEQ ID NO:35、SEQ ID NO:41、SEQ ID NO:45、SEQ IDNO:49、SEQ ID NO:53、SEQ ID NO:59、SEQ ID NO:63、SEQ ID NO:69、SEQ ID NO:75或SEQID NO:81中所述核苷酸序列具有、具有至少或具有至多65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％序列同一性的核苷酸序列，并且重组甲基转移酶基因可编码与SEQ ID NO:4、SEQ ID NO:8、SEQ ID NO:12、SEQ ID NO:16、SEQ ID NO:20、SEQ ID NO:26、SEQ ID NO:30、SEQ ID NO:36、SEQ ID NO:42、SEQ ID NO:46、SEQ ID NO:50、SEQ ID NO:54、SEQ ID NO:60、SEQ IDNO:64、SEQ ID NO:70或SEQ ID NO:76中所述氨基酸序列具有、具有至少或具有至多65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％序列同一性的甲基转移酶蛋白质。例如，SEQ ID NO:81是针对酵母中的表达经密码子优化的基因。SEQ ID NO:81与SEQ ID NO:3具有约70％序列同一性(69.86％序列同一性)，并且SEQ ID NO:81编码的蛋白质与SEQ ID NO:4中所述氨基酸序列具有100％序列同一性。因此，即使SEQ ID NO:81与SEQ ID NO:3具有69.86％序列同一性，但是所述两个核苷酸序列编码相同氨基酸序列。

重组甲基转移酶基因可与天然存在的甲基转移酶基因不同，因为重组甲基转移酶基因可经密码子优化以在真核细胞，例如植物细胞、藻类细胞或酵母细胞中表达。细胞可包括重组甲基转移酶基因，其中重组甲基转移酶基因针对所述细胞经密码子优化。

确切地，重组甲基转移酶基因的至少或至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206、207、208、209、210、211、212、213、214、215、216、217、218、219、220、221、222、223、224、225、226、227、228、229、230、231、232、233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、250、251、252、253、254、255、256、257、258、259、260、261、262、263、264、265、266、267、268、269、270、271、272、273、274、275、276、277、278、279、280、281、282、283、284、285、286、287、288、289、290、291、292、293、294、295、296、297、298、299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、316、317、318、319、320、321、322、323、324、325、326、327、328、329、330、331、332、333、334、335、336、337、338、339、340、341、342、343、344、345、346、347、348、349、350、351、352、353、354、355、356、357、358、359、360、361、362、363、364、365、366、367、368、369、370、371、372、373、374、375、376、377、378、379、380、381、382、383、384、385、386、387、388、389、390、391、392、393、394、395、396、397、398、399、400、401、402、403、404、405、406、407、408、409、410、411、412、413、414、415、416、417、418、419、420、421、422、423、424、425、426、427、428、429、430、431、432、433、434、435、436、437、438、439、440、441、442、443、444、445、446、447、448、449、450、451、452、453、454、455、456、457、458、459、460、461、462、463、464、465、466、467、468、469、470、471、472、473、474、475、476、477、478、479、480、481、482、483、484、485、486、487、488、489、490、491、492、493、494、495、496、497、498、499或500个密码子可与天然存在的甲基转移酶基因不同或可相对于天然存在的甲基转移酶基因不变。例如，重组甲基转移酶基因可包括与SEQID NO:3、SEQ ID NO:7、SEQ ID NO:11、SEQ ID NO:15、SEQ ID NO:19、SEQ ID NO:25、SEQID NO:29、SEQ ID NO:35、SEQ ID NO:41、SEQ ID NO:45、SEQ ID NO:49、SEQ ID NO:53、SEQID NO:59、SEQ ID NO:63、SEQ ID NO:69或SEQ ID NO:75中所述天然存在的核苷酸序列具有至少约65％序列同一性(例如，至少70％、75％、80％、85％、90％、95％、96％、97％、98％或99％序列同一性)的核苷酸序列，并且重组甲基转移酶基因的核苷酸序列的至少5个密码子可与天然存在的核苷酸序列不同(例如，至少10、15、20、25、30、35、40、45、50、60、70、80、90或100个密码子(其中可导出的任何范围))。

甲基转移酶基因编码甲基转移酶蛋白质。甲基转移酶蛋白质可以是由放线菌的革兰氏阳性物种表达的蛋白质，例如分枝杆菌属、棒杆菌属、诺卡尔菌属、链霉菌属或红球菌属。即使重组甲基转移酶基因并非天然存在的甲基转移酶基因，所述重组甲基转移酶基因也可编码天然存在的甲基转移酶蛋白质。例如，重组甲基转移酶基因可与天然存在的甲基转移酶基因不同，因为重组甲基转移酶基因针对在具体细胞中的表达经密码子优化。然而，经密码子优化的重组甲基转移酶基因和天然存在的甲基转移酶基因可编码相同的天然存在的甲基转移酶蛋白质。

重组甲基转移酶基因可编码选自以下的甲基转移酶蛋白质：耻垢分枝杆菌酶tmsB、苏别蒂山农霉菌酶tmsB、浅黄拟无枝酸球菌酶tmsB、谷氨酸棒状杆菌酶tmsB、甘氨酸棒状杆菌酶tmsB、气生诺尔氏菌酶tmsB、南非分枝杆菌酶tmsB、淡黄分枝杆菌酶tmsB、普拉尼亚分枝杆菌酶tmsB、草分枝杆菌酶tmsB、结核分枝杆菌酶tmsB、范巴伦氏分枝杆菌酶tmsB、浑浊红球菌酶tmsB、拉格西斯链霉菌酶tmsB、嗜热子囊菌酶tmsB和弯曲嗜热单胞菌酶tmsB。明确预期，可从本发明的实施方案排除上文一种或多种甲基转移酶蛋白质。重组甲基转移酶基因可编码甲基转移酶蛋白质，并且甲基转移酶蛋白质可与前述任一种酶基本上相同，但重组甲基转移酶基因可与编码所述酶的天然存在的基因不同。重组甲基转移酶基因可与天然存在的基因不同，因为重组甲基转移酶基因可针对在细胞的具体门、纲、目、科、属、种或菌株中的表达经密码子优化。

天然存在的甲基转移酶蛋白质的序列陈述于SEQ ID NO:4、SEQ ID NO:8、SEQ IDNO:12、SEQ ID NO:16、SEQ ID NO:20、SEQ ID NO:26、SEQ ID NO:30、SEQ ID NO:36、SEQ IDNO:42、SEQ ID NO:46、SEQ ID NO:50、SEQ ID NO:54、SEQ ID NO:60、SEQ ID NO:64、SEQ IDNO:70或SEQ ID NO:76中。重组甲基转移酶基因可编码或可不编码包括与SEQ ID NO:4、SEQID NO:8、SEQ ID NO:12、SEQ ID NO:16、SEQ ID NO:20、SEQ ID NO:26、SEQ ID NO:30、SEQID NO:36、SEQ ID NO:42、SEQ ID NO:46、SEQ ID NO:50、SEQ ID NO:54、SEQ ID NO:60、SEQID NO:64、SEQ ID NO:70或SEQ ID NO:76中所述氨基酸序列的100％序列同一性的蛋白质。例如，重组甲基转移酶基因可编码与SEQ ID NO:4、SEQ ID NO:8、SEQ ID NO:12、SEQ IDNO:16、SEQ ID NO:20、SEQ ID NO:26、SEQ ID NO:30、SEQ ID NO:36、SEQ ID NO:42、SEQ IDNO:46、SEQ ID NO:50、SEQ ID NO:54、SEQ ID NO:60、SEQ ID NO:64、SEQ ID NO:70或SEQID NO:76中所述氨基酸序列的生物活性部分具有100％序列同一性的蛋白质。

重组甲基转移酶基因可编码与SEQ ID NO:4、SEQ ID NO:8、SEQ ID NO:12、SEQ IDNO:16、SEQ ID NO:20、SEQ ID NO:26、SEQ ID NO:30、SEQ ID NO:36、SEQ ID NO:42、SEQ IDNO:46、SEQ ID NO:50、SEQ ID NO:54、SEQ ID NO:60、SEQ ID NO:64、SEQ ID NO:70或SEQID NO:76中所述氨基酸序列或其生物活性部分具有、具有至少或具有至多65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％序列同一性(或其中可导出的任何范围)的甲基转移酶蛋白质。重组甲基转移酶基因可编码相对于包括SEQ ID NO:4、SEQ ID NO:8、SEQ ID NO:12、SEQ IDNO:16、SEQ ID NO:20、SEQ ID NO:26、SEQ ID NO:30、SEQ ID NO:36、SEQ ID NO:42、SEQ IDNO:46、SEQ ID NO:50、SEQ ID NO:54、SEQ ID NO:60、SEQ ID NO:64、SEQ ID NO:70或SEQID NO:76中所述氨基酸序列的蛋白质具有至少约0.1％、0.5％、1％、2％、3％、4％、5％、10％、25％、30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％、99.5％、99.6％、99.7％、99.8％、99.9％、100％、100.1％、100.2％、100.3％、100.4％、100.5％、100.6％、100.7％、100.8％、100.9％、101％、105％、110％、115％、120％、125％、130％、135％、140％、145％、150％、160％、170％、180％、190％、200％、220％、240％、260％、280％、300％、320％、340％、360％、380％或400％甲基转移酶活性(其中可导出的任何范围)的甲基转移酶蛋白质。重组甲基转移酶基因可编码与在SEQ ID NO:4、SEQ ID NO:8、SEQID NO:12、SEQ ID NO:16、SEQ ID NO:20、SEQ ID NO:26、SEQ ID NO:30、SEQ ID NO:36、SEQID NO:42、SEQ ID NO:46、SEQ ID NO:50、SEQ ID NO:54、SEQ ID NO:60、SEQ ID NO:64、SEQID NO:70或SEQ ID NO:76的以下氨基酸位置开始的10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400、410、420、430、440、450、460、470、480、490或500个连续氨基酸具有至少70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％、99.9％或100％序列同一性的蛋白质：1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206、207、208、209、210、211、212、213、214、215、216、217、218、219、220、221、222、223、224、225、226、227、228、229、230、231、232、233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、250、251、252、253、254、255、256、257、258、259、260、261、262、263、264、265、266、267、268、269、270、271、272、273、274、275、276、277、278、279、280、281、282、283、284、285、286、287、288、289、290、291、292、293、294、295、296、297、298、299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、316、317、318、319、320、321、322、323、324、325、326、327、328、329、330、331、332、333、334、335、336、337、338、339、340、341、342、343、344、345、346、347、348、349、350、351、352、353、354、355、356、357、358、359、360、361、362、363、364、365、366、367、368、369、370、371、372、373、374、375、376、377、378、379、380、381、382、383、384、385、386、387、388、389、390、391、392、393、394、395、396、397、398、399、400、401、402、403、404、405、406、407、408、409、410、411、412、413、414、415、416、417、418、419、420、421、422、423、424、425、426、427、428、429、430、431、432、433、434、435、436、437、438、439、440、441、442、443、444、445、446、447、448、449、450、451、452、453、454、455、456、457、458、459、460、461、462、463、464、465、466、467、468、469、470、471、472、473、474、475、476、477、478、479、480、481、482、483、484、485、486、487、488、489、490、491、492、493、494、495、496、497、498、499或500。

甲基转移酶蛋白质的底物可包括长14到20个碳并在Δ9、Δ10或Δ11位置具有不饱和双键的任何脂肪酸。甲基转移酶蛋白质可能够催化在所述底物的Δ9、Δ10或Δ11位置的亚甲基取代的形成。

在一些实施方案中，重组甲基转移酶基因编码包括S-腺苷甲硫氨酸依赖性甲基转移酶结构域的甲基转移酶蛋白质。在一些实施方案中，根据图19A-D中所示的比对，S-腺苷甲硫氨酸依赖性甲基转移酶结构域与弯曲嗜热单胞菌tmsB(SEQ ID NO:76)的氨基酸192-291或与来自耻垢分枝杆菌、范巴伦氏分枝杆菌、浅黄拟无枝酸球菌、甘氨酸棒状杆菌、谷氨酸棒状杆菌、浑浊红球菌、苏别蒂山农霉菌、气生诺尔氏菌、淡黄分枝杆菌、紫檀分枝杆菌或嗜热子囊菌的TmsB的相应部分具有、具有至少或具有至多70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％、99.9％或100％序列同一性。

在一些实施方案中，重组甲基转移酶基因编码具有相对于SEQ ID NO:4、SEQ IDNO:8、SEQ ID NO:12、SEQ ID NO:16、SEQ ID NO:20、SEQ ID NO:26、SEQ ID NO:30、SEQ IDNO:36、SEQ ID NO:42、SEQ ID NO:46、SEQ ID NO:50、SEQ ID NO:54、SEQ ID NO:60、SEQ IDNO:64、SEQ ID NO:70或SEQ ID NO:76中所述氨基酸序列不变的具体氨基酸的甲基转移酶蛋白质。根据图19A-D中所示的比对，不变的氨基酸可包括1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28或29个选自以下的氨基酸：弯曲嗜热单胞菌tmsB(SEQ ID NO:76)的D23、G24、A59、H128、F147、Y148、L180、L193、M203、G236、A241、R313、R318、E320、L359、L400、V196、G197、C198、G199、W200、G201、G202、T219、L220、Q246、D247、Y248和D262，或来自耻垢分枝杆菌、范巴伦氏分枝杆菌、浅黄拟无枝酸球菌、甘氨酸棒状杆菌、谷氨酸棒状杆菌、浑浊红球菌、苏别蒂山农霉菌、气生诺尔氏菌、淡黄分枝杆菌、紫檀分枝杆菌或嗜热子囊菌的TmsB中的相应氨基酸。

ii.包括重组还原酶基因的核酸

还原酶基因(例如，重组还原酶基因)编码还原酶蛋白质，其为能通常以NADPH依赖性方式还原脂肪酸的双键的酶(例如，其中脂肪酸是作为游离脂肪酸、羧酸酯、磷脂、二酰甘油或三酰甘油存在)。还原酶基因(例如，重组还原酶基因)可包括以下序列中所述的任一核苷酸序列：SEQ ID NO:1、SEQ ID NO:5、SEQ ID NO:9、SEQ ID NO:13、SEQ ID NO:17、SEQ IDNO:23、SEQ ID NO:27、SEQ ID NO:33、SEQ ID NO:39、SEQ ID NO:43、SEQ ID NO:47、SEQ IDNO:51、SEQ ID NO:57、SEQ ID NO:61、SEQ ID NO:67、SEQ ID NO:73和SEQ ID NO:80。还原酶基因(例如，重组还原酶基因)可以是如本文所述的10-甲基硬脂酸A基因(tmsA)或其生物活性部分(即，其中其生物活性部分包括还原酶活性)。

还原酶基因(例如，重组还原酶基因)可衍生自放线菌的革兰氏阳性物种，例如分枝杆菌属、棒杆菌属、诺卡尔菌属、链霉菌属或红球菌属。还原酶基因(例如，重组还原酶基因)可选自由以下组成的组：耻垢分枝杆菌基因tmsA、苏别蒂山农霉菌基因tmsA、浅黄拟无枝酸球菌基因tmsA、谷氨酸棒状杆菌基因tmsA、甘氨酸棒状杆菌基因tmsA、气生诺尔氏菌基因tmsA、南非分枝杆菌基因tmsA、淡黄分枝杆菌基因tmsA、普拉尼亚分枝杆菌基因tmsA、草分枝杆菌基因tmsA、结核分枝杆菌基因tmsA、范巴伦氏分枝杆菌基因tmsA、浑浊红球菌基因tmsA、拉格西斯链霉菌基因tmsA、嗜热子囊菌基因tmsA和弯曲嗜热单胞菌基因tmsA。明确预期，可从本发明的实施方案排除上文一种或多种还原酶基因。

重组还原酶基因可以是重组体，因为其可操作连接到还原酶基因的天然存在的启动子以外的启动子。所述基因可用于驱动特定物种细胞中的转录。重组还原酶基因可以是重组体，因为其相对于天然存在的还原酶基因含有一个或多个核苷酸替换。所述基因可用于提高特定物种的细胞中还原酶基因的mRNA转录物的翻译效率。

核酸可包括重组还原酶基因和启动子，其中重组还原酶基因和启动子可操作连接。重组还原酶基因和启动子可衍生自不同物种。例如，重组还原酶基因可编码放线菌的革兰氏阳性物种的还原酶蛋白质，并且重组还原酶基因可以可操作连接到启动子，所述启动子可驱动另一细菌门(例如，变形菌门，例如大肠杆菌)或真核生物(例如，藻类细胞、酵母细胞或植物细胞)中的转录。启动子可以是真核启动子。细胞可包括核酸，并且启动子可能够驱动所述细胞中的转录。细胞可包括重组还原酶基因，并且重组还原酶基因可以可操作连接到能驱动细胞中的重组还原酶基因的转录的启动子。细胞可以是酵母物种，并且启动子可以是酵母启动子。细胞可以是细菌物种，并且启动子可以是细菌启动子(例如，其中细菌启动子并非来自放线菌的启动子)。细胞可以是藻类物种，并且启动子可以是藻类启动子。细胞可以是植物物种，并且启动子可以是植物启动子。

重组还原酶基因可以可操作连接到无法驱动重组还原酶基因在该重组还原酶基因起源的细胞中转录的启动子。例如，启动子可不能结合重组还原酶基因起源的细胞的RNA聚合酶。在一些实施方案中，启动子无法结合原核RNA聚合酶和/或起始由原核RNA聚合酶介导的转录。在一些实施方案中，重组还原酶基因可操作连接到无法在所述基因编码的蛋白质起源的细胞中驱动转录的启动子。例如，启动子可不能结合天然表达由重组还原酶基因编码的还原酶的细胞的RNA聚合酶。

重组还原酶基因可包括与SEQ ID NO:1、SEQ ID NO:5、SEQ ID NO:9、SEQ ID NO:13、SEQ ID NO:17、SEQ ID NO:23、SEQ ID NO:27、SEQ ID NO:33、SEQ ID NO:39、SEQ IDNO:43、SEQ ID NO:47、SEQ ID NO:51、SEQ ID NO:57、SEQ ID NO:61、SEQ ID NO:67、SEQ IDNO:73或SEQ ID NO:80中所述核苷酸序列具有、具有至少或具有至多65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％序列同一性的核苷酸序列。重组还原酶基因可包括与SEQ ID NO:1、SEQID NO:5、SEQ ID NO:9、SEQ ID NO:13、SEQ ID NO:17、SEQ ID NO:23、SEQ ID NO:27、SEQID NO:33、SEQ ID NO:39、SEQ ID NO:43、SEQ ID NO:47、SEQ ID NO:51、SEQ ID NO:57、SEQID NO:61、SEQ ID NO:67、SEQ ID NO:73或SEQ ID NO:80中所述核苷酸序列的在以下核苷酸位置开始的150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250或1300个连续碱基对具有、具有至少、具有至多65％、70％、75％、80％、85％、90％、95％、96％、97％、98％或99％序列同一性的核苷酸序列：1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206、207、208、209、210、211、212、213、214、215、216、217、218、219、220、221、222、223、224、225、226、227、228、229、230、231、232、233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、250、251、252、253、254、255、256、257、258、259、260、261、262、263、264、265、266、267、268、269、270、271、272、273、274、275、276、277、278、279、280、281、282、283、284、285、286、287、288、289、290、291、292、293、294、295、296、297、298、299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、316、317、318、319、320、321、322、323、324、325、326、327、328、329、330、331、332、333、334、335、336、337、338、339、340、341、342、343、344、345、346、347、348、349、350、351、352、353、354、355、356、357、358、359、360、361、362、363、364、365、366、367、368、369、370、371、372、373、374、375、376、377、378、379、380、381、382、383、384、385、386、387、388、389、390、391、392、393、394、395、396、397、398、399、400、401、402、403、404、405、406、407、408、409、410、411、412、413、414、415、416、417、418、419、420、421、422、423、424、425、426、427、428、429、430、431、432、433、434、435、436、437、438、439、440、441、442、443、444、445、446、447、448、449、450、451、452、453、454、455、456、457、458、459、460、461、462、463、464、465、466、467、468、469、470、471、472、473、474、475、476、477、478、479、480、481、482、483、484、485、486、487、488、489、490、491、492、493、494、495、496、497、498、499、500、501、502、503、504、505、506、507、508、509、510、511、512、513、514、515、516、517、518、519、520、521、522、523、524、525、526、527、528、529、530、531、532、533、534、535、536、537、538、539、540、541、542、543、544、545、546、547、548、549、550、551、552、553、554、555、556、557、558、559、560、561、562、563、564、565、566、567、568、569、570、571、572、573、574、575、576、577、578、579、580、581、582、583、584、585、586、587、588、589、590、591、592、593、594、595、596、597、598、599、600、601、602、603、604、605、606、607、608、609、610、611、612、613、614、615、616、617、618、619、620、621、622、623、624、625、626、627、628、629、630、631、632、633、634、635、636、637、638、639、640、641、642、643、644、645、646、647、648、649、650、651、652、653、654、655、656、657、658、659、660、661、662、663、664、665、666、667、668、669、670、671、672、673、674、675、676、677、678、679、680、681、682、683、684、685、686、687、688、689、690、691、692、693、694、695、696、697、698、699、700、701、702、703、704、705、706、707、708、709、710、711、712、713、714、715、716、717、718、719、720、721、722、723、724、725、726、727、728、729、730、731、732、733、734、735、736、737、738、739、740、741、742、743、744、745、746、747、748、749、750、751、752、753、754、755、756、757、758、759、760、761、762、763、764、765、766、767、768、769、770、771、772、773、774、775、776、777、778、779、780、781、782、783、784、785、786、787、788、789、790、791、792、793、794、795、796、797、798、799、800、801、802、803、804、805、806、807、808、809、810、811、812、813、814、815、816、817、818、819、820、821、822、823、824、825、826、827、828、829、830、831、832、833、834、835、836、837、838、839、840、841、842、843、844、845、846、847、848、849、850、851、852、853、854、855、856、857、858、859、860、861、862、863、864、865、866、867、868、869、870、871、872、873、874、875、876、877、878、879、880、881、882、883、884、885、886、887、888、889、890、891、892、893、894、895、896、897、898、899、900、901、902、903、904、905、906、907、908、909、910、911、912、913、914、915、916、917、918、919、920、921、922、923、924、925、926、927、928、929、930、931、932、933、934、935、936、937、938、939、940、941、942、943、944、945、946、947、948、949、950、951、952、953、954、955、956、957、958、959、960、961、962、963、964、965、966、967、968、969、970、971、972、973、974、975、976、977、978、979、980、981、982、983、984、985、986、987、988、989、990、991、992、993、994、995、996、997、998、999、1000、1001、1002、1003、1004、1005、1006、1007、1008、1009、1010、1011、1012、1013、1014、1015、1016、1017、1018、1019、1020、1021、1022、1023、1024、1025、1026、1027、1028、1029、1030、1031、1032、1033、1034、1035、1036、1037、1038、1039、1040、1041、1042、1043、1044、1045、1046、1047、1048、1049、1050、1051、1052、1053、1054、1055、1056、1057、1058、1059、1060、1061、1062、1063、1064、1065、1066、1067、1068、1069、1070、1071、1072、1073、1074、1075、1076、1077、1078、1079、1080、1081、1082、1083、1084、1085、1086、1087、1088、1089、1090、1091、1092、1093、1094、1095、1096、1097、1098、1099、1100、1101、1102、1103、1104、1105、1106、1107、1108、1109、1110、1111、1112、1113、1114、1115、1116、1117、1118、1119、1120、1121、1122、1123、1124、1125、1126、1127、1128、1129、1130、1131、1132、1133、1134、1135、1136、1137、1138、1139、1140、1141、1142、1143、1144、1145、1146、1147、1148、1149、1150、1151、1152、1153、1154、1155、1156、1157、1158、1159、1160、1161、1162、1163、1164、1165、1166、1167、1168、1169、1170、1171、1172、1173、1174、1175、1176、1177、1178、1179、1180、1181、1182、1183、1184、1185、1186、1187、1188、1189、1190、1191、1192、1193、1194、1195、1196、1197、1198、1199或1200。重组还原酶可具有或可不具有与SEQ ID NO:1、SEQ ID NO:5、SEQ ID NO:9、SEQ ID NO:13、SEQ ID NO:17、SEQ ID NO:23、SEQ ID NO:27、SEQ ID NO:33、SEQ ID NO:39、SEQ ID NO:43、SEQ ID NO:47、SEQ ID NO:51、SEQ ID NO:57、SEQ ID NO:61、SEQ ID NO:67、SEQ ID NO:73或SEQ ID NO:80中所述任一核苷酸序列的100％序列同一性。重组还原酶基因可具有或可不具有与SEQ ID NO:1、SEQID NO:5、SEQ ID NO:9、SEQ ID NO:13、SEQ ID NO:17、SEQ ID NO:23、SEQ ID NO:27、SEQID NO:33、SEQ ID NO:39、SEQ ID NO:43、SEQ ID NO:47、SEQ ID NO:51、SEQ ID NO:57、SEQID NO:61、SEQ ID NO:67、SEQ ID NO:73或SEQ ID NO:80中所述核苷酸序列的150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250或1300个连续碱基对的100％序列同一性。重组还原酶基因可包括与SEQID NO:1、SEQ ID NO:5、SEQ ID NO:9、SEQ ID NO:13、SEQ ID NO:17、SEQ ID NO:23、SEQ IDNO:27、SEQ ID NO:33、SEQ ID NO:39、SEQ ID NO:43、SEQ ID NO:47、SEQ ID NO:51、SEQ IDNO:57、SEQ ID NO:61、SEQ ID NO:67、SEQ ID NO:73或SEQ ID NO:80中所述核苷酸序列具有、具有至少或具有至多65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％序列同一性的核苷酸序列，并且重组还原酶基因可编码与SEQ ID NO:2、SEQ ID NO:6、SEQ ID NO:10、SEQ ID NO:14、SEQID NO:18、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NO:34、SEQ ID NO:40、SEQ ID NO:44、SEQID NO:48、SEQ ID NO:52、SEQ ID NO:58、SEQ ID NO:62、SEQ ID NO:68或SEQ ID NO:74中所述氨基酸序列具有至少约95％、96％、97％、98％、99％或100％序列同一性的还原酶蛋白质。例如，SEQ ID NO:80是针对酵母中的表达经密码子优化的基因。SEQ ID NO:80与SEQ IDNO:1具有约70％序列同一性(70.09％序列同一性)，并且SEQ ID NO:80编码的蛋白质与SEQID NO:2中所述氨基酸序列具有至少约99％序列同一性。SEQ ID NO:1编码的蛋白质与SEQID NO:2中所述氨基酸序列具有100％序列同一性。

重组还原酶基因可与天然存在的还原酶基因不同，因为重组还原酶基因可针对真核细胞，例如植物细胞、藻类细胞或酵母细胞中的表达经密码子优化。细胞可包括重组还原酶基因，其中重组还原酶基因针对所述细胞经密码子优化。

确切地，重组还原酶基因的至少或至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206、207、208、209、210、211、212、213、214、215、216、217、218、219、220、221、222、223、224、225、226、227、228、229、230、231、232、233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、250、251、252、253、254、255、256、257、258、259、260、261、262、263、264、265、266、267、268、269、270、271、272、273、274、275、276、277、278、279、280、281、282、283、284、285、286、287、288、289、290、291、292、293、294、295、296、297、298、299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、316、317、318、319、320、321、322、323、324、325、326、327、328、329、330、331、332、333、334、335、336、337、338、339、340、341、342、343、344、345、346、347、348、349、350、351、352、353、354、355、356、357、358、359、360、361、362、363、364、365、366、367、368、369、370、371、372、373、374、375、376、377、378、379、380、381、382、383、384、385、386、387、388、389、390、391、392、393、394、395、396、397、398、399、400、401、402、403、404、405、406、407、408、409、410、411、412、413、414、415、416、417、418、419、420、421、422、423、424、425、426、427、428、429、430、431、432、433、434、435、436、437、438、439、440、441、442、443、444、445、446、447、448、449、450、451、452、453、454、455、456、457、458、459、460、461、462、463、464、465、466、467、468、469、470、471、472、473、474、475、476、477、478、479、480、481、482、483、484、485、486、487、488、489、490、491、492、493、494、495、496、497、498、499或500个密码子可与天然存在的还原酶基因不同或可相对于天然存在的还原酶基因不变。例如，重组还原酶基因可包括与SEQ ID NO:1、SEQ IDNO:5、SEQ ID NO:9、SEQ ID NO:13、SEQ ID NO:17、SEQ ID NO:23、SEQ ID NO:27、SEQ IDNO:33、SEQ ID NO:39、SEQ ID NO:43、SEQ ID NO:47、SEQ ID NO:51、SEQ ID NO:57、SEQ IDNO:61、SEQ ID NO:67或SEQ ID NO:73中所述天然存在的核苷酸序列具有至少65％序列同一性的核苷酸序列(例如，至少70％、75％、80％、85％、90％、95％、96％、97％、98％或99％序列同一性)，并且重组还原酶基因的核苷酸序列的至少5个密码子可与天然存在的核苷酸序列不同(例如，至少10、15、20、25、30、35、40、45、50、60、70、80、90或100个密码子)。

还原酶基因编码还原酶蛋白质。还原酶蛋白质可以是由放线菌的革兰氏阳性物种表达的蛋白质，例如分枝杆菌属、棒杆菌属、诺卡尔菌属、链霉菌属或红球菌属。即使重组还原酶基因并非天然存在的还原酶基因，所述重组还原酶基因也可编码天然存在的还原酶蛋白质。例如，重组还原酶基因可与天然存在的还原酶基因不同，因为重组还原酶基因针对具体细胞中的表达经密码子优化。然而，经密码子优化的重组还原酶基因和天然存在的还原酶基因可编码相同的天然存在的还原酶蛋白质。

重组还原酶基因可编码选自以下的还原酶蛋白质：耻垢分枝杆菌酶tmsA、苏别蒂山农霉菌酶tmsA、浅黄拟无枝酸球菌酶tmsA、谷氨酸棒状杆菌酶tmsA、甘氨酸棒状杆菌酶tmsA、气生诺尔氏菌酶tmsA、南非分枝杆菌酶tmsA、淡黄分枝杆菌酶tmsA、普拉尼亚分枝杆菌酶tmsA、草分枝杆菌酶tmsA、结核分枝杆菌酶tmsA、范巴伦氏分枝杆菌酶tmsA、浑浊红球菌酶tmsA、拉格西斯链霉菌酶tmsA、嗜热子囊菌酶tmsA和弯曲嗜热单胞菌酶tmsA。明确预期，可从本发明的实施方案排除上文一种或多种还原酶蛋白质。重组还原酶基因可编码还原酶蛋白质，并且还原酶蛋白质可与前述任一种酶基本上相同，但重组还原酶基因可与编码所述酶的天然存在的基因不同。重组还原酶基因可与天然存在的基因不同，因为重组还原酶基因可针对在具体门、纲、目、科、属、种或菌株的细胞中的表达经密码子优化。

天然存在的还原酶蛋白质的序列陈述于SEQ ID NO:2、SEQ ID NO:6、SEQ ID NO:10、SEQ ID NO:14、SEQ ID NO:18、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NO:34、SEQ IDNO:40、SEQ ID NO:44、SEQ ID NO:48、SEQ ID NO:52、SEQ ID NO:58、SEQ ID NO:62、SEQ IDNO:68或SEQ ID NO:74中。重组还原酶基因可编码或可不编码包括与SEQ ID NO:2、SEQ IDNO:6、SEQ ID NO:10、SEQ ID NO:14、SEQ ID NO:18、SEQ ID NO:24、SEQ ID NO:28、SEQ IDNO:34、SEQ ID NO:40、SEQ ID NO:44、SEQ ID NO:48、SEQ ID NO:52、SEQ ID NO:58、SEQ IDNO:62、SEQ ID NO:68或SEQ ID NO:74中所述氨基酸序列的100％序列同一性的蛋白质。例如，重组还原酶基因可编码与SEQ ID NO:2、SEQ ID NO:6、SEQ ID NO:10、SEQ ID NO:14、SEQ ID NO:18、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NO:34、SEQ ID NO:40、SEQ ID NO:44、SEQ ID NO:48、SEQ ID NO:52、SEQ ID NO:58、SEQ ID NO:62、SEQ ID NO:68或SEQ IDNO:74中所述氨基酸序列的生物活性部分具有100％序列同一性的蛋白质。

重组还原酶基因可编码与SEQ ID NO:2、SEQ ID NO:6、SEQ ID NO:10、SEQ ID NO:14、SEQ ID NO:18、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NO:34、SEQ ID NO:40、SEQ IDNO:44、SEQ ID NO:48、SEQ ID NO:52、SEQ ID NO:58、SEQ ID NO:62、SEQ ID NO:68或SEQID NO:74中所述氨基酸序列或其生物活性部分具有、具有至少或具有至多65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％序列同一性的还原酶蛋白质。重组还原酶基因可编码相对于包括SEQ ID NO:2、SEQ ID NO:6、SEQ ID NO:10、SEQ ID NO:14、SEQ ID NO:18、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NO:34、SEQ ID NO:40、SEQ ID NO:44、SEQ ID NO:48、SEQ ID NO:52、SEQ ID NO:58、SEQ ID NO:62、SEQ ID NO:68或SEQ ID NO:74中所述氨基酸序列的蛋白质具有约、至少约或至多约0.1％、0.5％、1％、2％、3％、4％、5％、10％、25％、30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％、99.5％、99.6％、99.7％、99.8％、99.9％、100％、100.1％、100.2％、100.3％、100.4％、100.5％、100.6％、100.7％、100.8％、100.9％、101％、105％、110％、115％、120％、125％、130％、135％、140％、145％、150％、160％、170％、180％、190％、200％、220％、240％、260％、280％、300％、320％、340％、360％、380％或400％还原酶活性的还原酶蛋白质。重组还原酶基因可编码与SEQ ID NO:2、SEQ ID NO:6、SEQ ID NO:10、SEQ ID NO:14、SEQ ID NO:18、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NO:34、SEQ ID NO:40、SEQ ID NO:44、SEQ ID NO:48、SEQ ID NO:52、SEQ ID NO:58、SEQ ID NO:62、SEQ ID NO:68或SEQ ID NO:74中所述氨基酸序列的在以下氨基酸位置开始的10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400、410、420、430、440、450、460、470、480、490或500个连续氨基酸具有、具有至少或具有至多65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％序列同一性的蛋白质：1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206、207、208、209、210、211、212、213、214、215、216、217、218、219、220、221、222、223、224、225、226、227、228、229、230、231、232、233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、250、251、252、253、254、255、256、257、258、259、260、261、262、263、264、265、266、267、268、269、270、271、272、273、274、275、276、277、278、279、280、281、282、283、284、285、286、287、288、289、290、291、292、293、294、295、296、297、298、299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、316、317、318、319、320、321、322、323、324、325、326、327、328、329、330、331、332、333、334、335、336、337、338、339、340、341、342、343、344、345、346、347、348、349、350、351、352、353、354、355、356、357、358、359、360、361、362、363、364、365、366、367、368、369、370、371、372、373、374、375、376、377、378、379、380、381、382、383、384、385、386、387、388、389、390、391、392、393、394、395、396、397、398、399、400、401、402、403、404、405、406、407、408、409、410、411、412、413、414、415、416、417、418、419、420、421、422、423、424、425、426、427、428、429、430、431、432、433、434、435、436、437、438、439、440、441、442、443、444、445、446、447、448、449、450、451、452、453、454、455、456、457、458、459、460、461、462、463、464、465、466、467、468、469、470、471、472、473、474、475、476、477、478、479、480、481、482、483、484、485、486、487、488、489、490、491、492、493、494、495、496、497、498、499或500。

还原酶蛋白质的底物可包括长14到20个碳并在Δ9、Δ10或Δ11位置中具有亚甲基替换的任何脂肪酸。脂肪酸底物的长度可以是14、15、16、17、18、19或20个碳或其中可导出的任何范围。还原酶蛋白质可能够催化亚甲基替换的脂肪酸底物到(甲基)脂质的还原。还原酶蛋白质与甲基转移酶蛋白质一起可能够催化来自长14到20个碳并在Δ9、Δ10或Δ11位置中具有不饱和双键的任何脂肪酸的甲基化分支的产生。

在一些实施方案中，重组还原酶基因编码包括黄素腺嘌呤二核苷酸(FAD)结合结构域的还原酶蛋白质。在一些实施方案中，根据图20A-E中所示的比对，FAD结合结构域与弯曲嗜热单胞菌tmsA(SEQ ID NO:74)的氨基酸9-141或与来自耻垢分枝杆菌、范巴伦氏分枝杆菌、浅黄拟无枝酸球菌、甘氨酸棒状杆菌、谷氨酸棒状杆菌、浑浊红球菌、苏别蒂山农霉菌、气生诺尔氏菌、淡黄分枝杆菌、紫檀分枝杆菌或嗜热子囊菌的TmsA的相应部分具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％、99.9％或100％序列同一性。

在一些实施方案中，重组还原酶基因编码包括含有FAD/FMN的脱氢酶结构域的还原酶蛋白质。在一些实施方案中，根据图20A-E中所示的比对，含有FAD/FMN的脱氢酶结构域与弯曲嗜热单胞菌tmsA(SEQ ID NO:74)的氨基酸22-444或与来自耻垢分枝杆菌、范巴伦氏分枝杆菌、浅黄拟无枝酸球菌、甘氨酸棒状杆菌、谷氨酸棒状杆菌、浑浊红球菌、苏别蒂山农霉菌、气生诺尔氏菌、淡黄分枝杆菌、紫檀分枝杆菌或嗜热子囊菌的TmsA的相应部分具有、具有至少或具有至多65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％序列同一性。

在一些实施方案中，重组还原酶基因编码具有相对于SEQ ID NO:2、SEQ ID NO:6、SEQ ID NO:10、SEQ ID NO:14、SEQ ID NO:18、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NO:34、SEQ ID NO:40、SEQ ID NO:44、SEQ ID NO:48、SEQ ID NO:52、SEQ ID NO:58、SEQ IDNO:62、SEQ ID NO:68或SEQ ID NO:74中所述氨基酸序列不变的具体氨基酸的还原酶蛋白质。根据图20A-E中所示的比对，不变的氨基酸可包括弯曲嗜热单胞菌tmsA(SEQ ID NO:74)的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113个或氨基酸或氨基酸R31、A33、S37、N38、L39、F40、R43、D52、V59、D63、G73、M74、T76、Y77、D79、L80、V81、L85、P91、V93、V94、Q96、L97、T99、I100、T101、A105、G108、G110、E112、S113、S115、F116、R117、N118、P121、H122、E123、V125、E127、G133、P154、N155、Y157、Y162、L166、E171、V173、V177、H181、V208、G213、F216、Y222、L223、S236、D237、Y238、T239、Y245、S247、D254、T257、Y261、W263、R264、W265、D266、D268、W269、C272、A275、G277、Q279、R284、W287、R293、S294、G318、E232、V325、P328、E330、F339、F343、W353、C355、P356、W363、L365、Y366、P367、N376、F379、W380、V383、P384、N395、E399、G407、H408、K409、S410、L411、Y412、S413、Y417、F422、Y426、G428、R443、L447和V452或来自耻垢分枝杆菌、范巴伦氏分枝杆菌、浅黄拟无枝酸球菌、甘氨酸棒状杆菌、谷氨酸棒状杆菌、浑浊红球菌、苏别蒂山农霉菌、气生诺尔氏菌、淡黄分枝杆菌、紫檀分枝杆菌或嗜热子囊菌的TmsA中的相应氨基酸。

iii.包含重组tmsC基因的核酸.

核酸可包括如本文所述的10-甲基硬脂酸C基因(tmsC)。tmsC基因(例如，重组tmsC基因)可包括SEQ ID NO:21、SEQ ID NO:31、SEQ ID NO:37、SEQ ID NO:55、SEQ ID NO:65和SEQ ID NO:71中所述的任一核苷酸序列。tmsC基因(例如，重组tmsC基因)可衍生自放线菌的革兰氏阳性物种，例如分枝杆菌属、棒杆菌属、诺卡尔菌属、链霉菌属或红球菌属。tmsC基因(例如，重组tmsC基因)可选自由以下组成的组：甘氨酸棒状杆菌基因tmsC、南非分枝杆菌基因tmsC、淡黄分枝杆菌基因tmsC、范巴伦氏分枝杆菌基因tmsC、拉格西斯链霉菌基因tmsC和嗜热子囊菌基因tmsC。

重组tmsC基因可以是重组体，因为其可操作连接到tmsC基因的天然存在的启动子以外的启动子。所述基因可用于驱动特定物种细胞中的转录。重组tmsC基因可以是重组体，因为其相对于天然存在的tmsC基因含有一个或多个核苷酸替换。所述基因可用于提高特定物种的细胞中tmsC基因的mRNA转录物的翻译效率。

核酸可包括重组tmsC基因和启动子，其中重组tmsC基因和启动子可操作连接。重组tmsC基因和启动子可衍生自不同物种。例如，重组tmsC基因可编码放线菌的革兰氏阳性物种的tmsC蛋白质，并且重组tmsC基因可以可操作连接到启动子，所述启动子可驱动另一细菌门(例如，变形菌门，例如大肠杆菌)或真核生物(例如，藻类细胞、酵母细胞或植物细胞)中的转录。启动子可以是真核启动子。细胞可包括核酸，并且启动子可能够驱动所述细胞中的转录。细胞可包括重组tmsC基因，并且重组tmsC基因可以可操作连接到能驱动细胞中的重组tmsC基因的转录的启动子。细胞可以是酵母物种，并且启动子可以是酵母启动子。细胞可以是细菌物种，并且启动子可以是细菌启动子(例如，其中细菌启动子并非来自放线菌的启动子)。细胞可以是藻类物种，并且启动子可以是藻类启动子。细胞可以是植物物种，并且启动子可以是植物启动子。

重组tmsC基因可以可操作连接到无法驱动在重组tmsC基因起源的细胞中的转录的启动子。例如，启动子可不能结合重组tmsC基因源起源的细胞的RNA聚合酶。在一些实施方案中，启动子无法结合原核RNA聚合酶和/或起始由原核RNA聚合酶介导的转录。在一些实施方案中，重组tmsC基因可操作连接到无法在所述基因编码的蛋白质起源的细胞中驱动转录的启动子。例如，启动子可不能结合天然表达由重组tmsC基因编码的tmsC酶的细胞的RNA聚合酶。

重组tmsC基因可包括与SEQ ID NO:21、SEQ ID NO:31、SEQ ID NO:37、SEQ ID NO:55、SEQ ID NO:65或SEQ ID NO:71中所述核苷酸序列具有、具有至少或具有至多65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％序列同一性的核苷酸序列。重组tmsC可与SEQ ID NO:21、SEQID NO:31、SEQ ID NO:37、SEQ ID NO:55、SEQ ID NO:65和SEQ ID NO:71中所述任一核苷酸序列具有或可不具有100％序列同一性。重组tmsC基因可包括与SEQ ID NO:21、SEQ ID NO:31、SEQ ID NO:37、SEQ ID NO:55、SEQ ID NO:65和SEQ ID NO:71中所述核苷酸序列具有、具有至少或具有至多65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％序列同一性的核苷酸序列，并且重组tmsC基因可编码与SEQ ID NO:22、SEQ ID NO:32、SEQ ID NO:38、SEQ ID NO:56、SEQID NO:66和SEQ ID NO:72中所述氨基酸序列具有至少约95％、96％、97％、98％、99％或100％序列同一性的tmsC蛋白质。

重组tmsC基因可与天然存在的tmsC基因不同，因为重组tmsC基因可针对真核细胞，例如植物细胞、藻类细胞或酵母细胞中的表达经密码子优化。细胞可包括重组tmsC基因，其中重组tmsC基因针对所述细胞经密码子优化。

确切地，重组tmsC基因的至少或至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206、207、208、209、210、211、212、213、214、215、216、217、218、219、220、221、222、223、224、225、226、227、228、229、230、231、232、233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、250、251、252、253、254、255、256、257、258、259、260、261、262、263、264、265、266、267、268、269、270、271、272、273、274、275、276、277、278、279、280、281、282、283、284、285、286、287、288、289、290、291、292、293、294、295、296、297、298、299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、316、317、318、319、320、321、322、323、324、325、326、327、328、329、330、331、332、333、334、335、336、337、338、339、340、341、342、343、344、345、346、347、348、349、350、351、352、353、354、355、356、357、358、359、360、361、362、363、364、365、366、367、368、369、370、371、372、373、374、375、376、377、378、379、380、381、382、383、384、385、386、387、388、389、390、391、392、393、394、395、396、397、398、399、400、401、402、403、404、405、406、407、408、409、410、411、412、413、414、415、416、417、418、419、420、421、422、423、424、425、426、427、428、429、430、431、432、433、434、435、436、437、438、439、440、441、442、443、444、445、446、447、448、449、450、451、452、453、454、455、456、457、458、459、460、461、462、463、464、465、466、467、468、469、470、471、472、473、474、475、476、477、478、479、480、481、482、483、484、485、486、487、488、489、490、491、492、493、494、495、496、497、498、499或500个密码子可与天然存在的tmsC基因不同或可相对于天然存在的tmsC基因保持不变。例如，重组tmsC基因可包括与SEQ ID NO:21、SEQ IDNO:31、SEQ ID NO:37、SEQ ID NO:55、SEQ ID NO:65或SEQ ID NO:71中所述天然存在的核苷酸序列具有至少约65％序列同一性的核苷酸序列(例如，至少约70％、75％、80％、85％、90％、95％、96％、97％、98％或99％序列同一性)，并且重组tmsC基因的核苷酸序列的至少5个密码子可与天然存在的核苷酸序列不同(例如，至少约10、15、20、25、30、35、40、45、50、60、70、80、90或100个密码子)。

tmsC基因编码tmsC蛋白质。tmsC蛋白质可以是由放线菌的革兰氏阳性物种表达的蛋白质，例如分枝杆菌属、棒杆菌属、诺卡尔菌属、链霉菌属或红球菌属。即使重组tmsC基因并非天然存在的tmsC基因，所述重组tmsC基因也可编码天然存在的tmsC蛋白质。例如，重组tmsC基因可与天然存在的tmsC基因不同，因为重组tmsC基因针对具体细胞中的表达经密码子优化。然而，经密码子优化的重组tmsC基因和天然存在的tmsC基因可编码相同的天然存在的tmsC蛋白质。

重组tmsC基因可编码选自以下的tmsC蛋白质：甘氨酸棒状杆菌酶tmsC、南非分枝杆菌酶tmsC、淡黄分枝杆菌酶tmsC、范巴伦氏分枝杆菌酶tmsC、拉格西斯链霉菌酶tmsC和嗜热子囊菌酶tmsC。重组tmsC基因可编码tmsC蛋白质，并且tmsC蛋白质可与前述任一种酶基本上相同，但重组tmsC基因可与编码所述酶的天然存在的基因不同。重组tmsC基因可与天然存在的基因不同，因为重组tmsC基因可针对在具体门、纲、目、科、属、种或菌株的细胞中的表达经密码子优化。

天然存在的tmsC蛋白质的序列陈述于SEQ ID NO:22、SEQ ID NO:32、SEQ ID NO:38、SEQ ID NO:56、SEQ ID NO:66和SEQ ID NO:72中。重组tmsC基因可编码或可不编码包括与SEQ ID NO:22、SEQ ID NO:32、SEQ ID NO:38、SEQ ID NO:56、SEQ ID NO:66和SEQ IDNO:72中所述氨基酸序列的100％序列同一性的蛋白质。例如，重组tmsC基因可编码与SEQID NO:22、SEQ ID NO:32、SEQ ID NO:38、SEQ ID NO:38、SEQ ID NO:56、SEQ ID NO:66和SEQ ID NO:72中所述氨基酸序列的生物活性部分具有100％序列同一性的蛋白质。重组tmsC基因可编码与SEQ ID NO:22、SEQ ID NO:32、SEQ ID NO:38、SEQ ID NO:56、SEQ IDNO:66或SEQ ID NO:72中所述氨基酸序列或其生物活性部分具有至少约95％、96％、97％、98％或99％序列同一性的tmsC蛋白质。

iv.包括重组甲基转移酶基因和重组还原酶基因的核酸

核酸可包括重组甲基转移酶基因和重组还原酶基因二者。重组甲基转移酶基因和重组还原酶基因可编码来自相同物种或来自不同物种的蛋白质。核酸可包括重组甲基转移酶基因、重组还原酶基因和/或tmsC基因。重组甲基转移酶基因、重组还原酶基因和tmsC基因可编码来自1、2或3个不同物种的蛋白质(即，基因可各自来自相同物种，两个基因可来自相同物种，或所有三个基因可来自不同物种)。

核酸可包括SEQ ID NO:77、SEQ ID NO:78或SEQ ID NO:79中所述的核苷酸序列。核酸可包括与SEQ ID NO:77、SEQ ID NO:78、SEQ ID NO:79、SEQ ID NO:83、SEQ ID NO:84、、SEQ ID NO:85、、SEQ ID NO:86、SEQ ID NO:87、SEQ ID NO:88、SEQ ID NO:89、SEQ IDNO:90、SEQ ID NO:91或SEQ ID NO:92中所述核苷酸序列具有、具有至少或具有至多65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％序列同一性的核苷酸序列。

在一些实施方案中，核酸编码同时包括甲基转移酶和还原酶或其片段的融合蛋白质。在本发明上下文中，“融合蛋白质”意指单一蛋白质分子，其含有通过单一肽链中的肽键共价连接的两种或更多种不同蛋白质或其片段。在一些实施方案中，融合蛋白质包括来自甲基转移酶蛋白质和还原酶蛋白质二者的酶活性结构域。核酸可进一步编码甲基转移酶与还原酶之间的连接体肽。在一些实施方案中，连接体肽包括氨基酸序列AGGAEGGNGGGA。连接体可包括约或至少约2、3、4、5、6、7、8、9、10、15、20、25或30个氨基酸或其中可导出的任何范围。核酸可包括本文所述甲基转移酶和还原酶基因中的任一种，并且所述核酸编码的融合蛋白质可包括本文所述甲基转移酶和还原酶蛋白质中的任一种，包括其生物活性片段。在一些实施方案中，融合蛋白质是tmsA-B蛋白质，其中tmsA蛋白质比tmsB蛋白质更靠近N末端。所述tmsA-B蛋白质的示例是由SEQ ID NO:97的核酸序列编码。在一些实施方案中，融合蛋白质是tmsB-A蛋白质，其中tmsB蛋白质比tmsA蛋白质更靠近N末端。所述tmsB-A蛋白质的示例是由SEQ ID NO:98的核酸序列编码。在一些实施方案中，融合蛋白质与SEQ ID NO:97或SEQ ID NO:98编码的融合蛋白质的氨基酸序列具有至少约80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或99.9％同一性。

C.组合物

本发明的各个方面涉及通过本文所述细胞产生的组合物。组合物可以是包括约或至少约75％、80％、85％、90％、95％或99％脂质的油组合物。组合物可包含支化(甲基)脂质和/或环外亚甲基取代的脂质。支化(甲基)脂质可以是羧酸(例如，10-甲基硬脂酸、10-甲基棕榈酸、12-甲基油酸、13-甲基油酸、10-甲基-十八-12-烯酸)、羧酸酯(例如，10-甲基硬脂酸酯、10-甲基棕榈酸酯、12-甲基油酸酯、13-甲基油酸酯、10-甲基-十八-12-烯酸酯)、酯(例如，二酰甘油、三酰甘油、磷脂)、硫酯(例如，10-甲基硬脂酰基CoA、10-甲基棕榈酰基CoA、12-甲基油酰基CoA、13-甲基油酰基CoA、10-甲基-十八-12-烯酰基CoA)或酰胺。环外亚甲基取代的脂质可以是羧酸(例如，10-亚甲基硬脂酸、10-亚甲基棕榈酸、12-亚甲基油酸、13-亚甲基油酸、10-亚甲基-十八-12-烯酸)、羧酸酯(例如，10-亚甲基硬脂酸酯、10-亚甲基棕榈酸酯、12-亚甲基油酸酯、13-亚甲基油酸酯、10-亚甲基-十八-12-烯酸酯)、酯(例如，二酰甘油、三酰甘油、磷脂)、硫酯(例如，10-亚甲基硬脂酰基CoA、10-亚甲基棕榈酰基CoA、12-亚甲基油酰基CoA、13-亚甲基油酰基CoA、10-亚甲基-十八-12-烯酰基CoA)或酰胺。10-甲基脂质、10-亚甲基脂质或二者。明确预期，可从某些实施方案排除上文一种或多种脂质。

在一些方面中，组合物是通过以下方式来产生：培养包括本文所述任何细胞的培养物，和从细胞培养物回收油组合物。培养物中的细胞可含有本文所述任何重组甲基转移酶基因和/或本文所述任何重组还原酶基因。培养基和条件可基于要培养的细胞的种类来选择，并且可经优化以提供所需脂质谱的最大产量。

已知从细胞培养物回收油组合物的多种方法。例如，脂质、脂质衍生物和烃可用例如己烷的疏水溶剂萃取。脂质和脂质衍生物也可使用液化、油液化和超临界CO₂萃取来萃取。回收过程可包括例如通过过滤或离心收获所培养细胞，溶解细胞以产生溶解物，和使用疏水溶剂萃取脂质/烃组分。

除了在细胞内积累以外，本文所述脂质可由细胞分泌。在该情形中，回收脂质的过程可能不需要从细胞产生溶解物，而是从培养基收集所分泌的脂质。因此，本文所述组合物可通过培养分泌本文所述脂质之一的细胞来制造，所述脂质例如链长度为14-20个碳并且在Δ9、Δ10或Δ11位置具有甲基分支的线性脂肪酸。

在一些实施方案中，油组合物包含以重量计约、至少约或至多约1％、2％、3％、4％、5％、6％、7％、8％、9％、10％、11％、12％、13％、14％、15％、16％、17％、18％、19％、20％、21％、22％、23％、24％、25％、26％、27％、28％、29％、30％、31％、32％、33％、34％、35％、36％、37％、38％、39％、40％、41％、42％、43％、44％、45％、46％、47％、48％、49％、50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％的支化(甲基)脂质(例如10-甲基脂肪酸)或其中可导出的任何范围。在一些实施方案中，10-甲基脂肪酸占组合物中的脂肪酸以重量计约、至少约或至多约1％、2％、3％、4％、5％、6％、7％、8％、9％、10％、11％、12％、13％、14％、15％、16％、17％、18％、19％、20％、21％、22％、23％、24％、25％、26％、27％、28％、29％、30％、31％、32％、33％、34％、35％、36％、37％、38％、39％、40％、41％、42％、43％、44％、45％、46％、47％、48％、49％、50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％或其中可导出的任何范围。

D.产生支化(甲基)脂质的方法

本发明的各个方面涉及产生支化(甲基)脂质的方法。所述方法可包括用培养基孵育如上文所述的细胞或多个细胞。培养基可任选地补充有未支化不饱和脂肪酸，例如油酸，其用作甲基化的底物。培养基可任选地补充有甲硫氨酸或s-腺苷甲硫氨酸，其可类似地用作底物。因此，所述方法可包括使细胞或多个细胞与油酸、甲硫氨酸或二者接触。所述方法可包括在生物反应器中孵育如上文所述的细胞或多个细胞。所述方法可包括例如通过用有机溶剂萃取从细胞和/或从培养基回收脂质。

所述方法可包括使细胞或多个细胞脱胶，例如以移除蛋白质。所述方法可包括对细胞的脂质进行转酯化或酯化。可使用例如甲醇或乙醇的醇进行转酯化或酯化，例如由此产生脂肪酸甲基酯或脂肪酸乙基酯。

实施例

通过以下实施例进一步阐释本说明书，所述实施例不应视为以任何方式进行限制。

实施例1：10-甲基硬脂酸基因tmsA、tmsB和tmsC的鉴别

已鉴别两种不同基因负责结核分枝杆菌中的10-甲基硬脂酸酯产生(参见Meena,L.S.和P.E.Kolattukudy,Biotechnology&Applied Biochemistry 60(4):412(2013)；和Meena,L.S.等Biological Chemistry 394(7):871(2013))。令人好奇的是，两种基因在每个产生10-甲基硬脂酸酯的放线菌物种中都不保守。虽然放线菌的不同物种可能各自独立地进化合成10-甲基硬脂酸酯的基因，但所述趋同进化较为罕见。较简单的解释是，单一共同基因或基因集负责放线菌中的10-甲基硬脂酸酯产生。

为了鉴别可能负责放线菌中10-甲基硬脂酸酯产生的基因，将来自产生10-甲基硬脂酸酯的放线菌的多个物种的与编码催化脂质合成反应的酶的基因具有序列同源性的基因比对。鉴别出两种独特基因并命名为10-甲基硬脂酸A(tmsA)和10-甲基硬脂酸B(tmsB)，其各自在放线菌的每一产生10-甲基硬脂酸酯的物种内的相同操纵子中出现(图3)。第三种基因名为10-甲基硬脂酸C(tmsC)，对于一些产生10-甲基硬脂酸酯的物种，经鉴别为在与tmsA和tmsB相同的操纵子中出现。

10-甲基硬脂酸酯B基因与环丙烷合酶具有序列同源性，这表明10-甲基硬脂酸酯B基因可能够将甲基转移到脂肪酸。10-甲基硬脂酸A基因与氧化还原酶具有序列同源性，这表明其可能够还原支化脂肪酸的环外亚甲基。

将来自耻垢分枝杆菌的10-甲基硬脂酸酯A和10-甲基硬脂酸酯B基因克隆到质粒(名为pNC704)中用于在大肠杆菌中表达(图4)。使用具有耻垢分枝杆菌tmsA和tmsB的pNC704质粒转化大肠杆菌。使经转化细胞在37℃下在补充有100μg/mL油酸的LB培养基中生长20小时。将大肠杆菌用空载体pNC53(SEQ ID NO:81)转化并平行生长作为对照。两个经pNC704转化的大肠杆菌集落各自以占细胞中总脂肪酸的2.0％和2.1％的浓度产生10-甲基硬脂酸酯(表1)。对照未产生10-甲基硬脂酸酯。

表1.以总细胞脂肪酸百分比计的脂肪酸浓度。

“10-MS”对应于10-甲基硬脂酸酯

在HCl的甲醇溶液中将细胞脂质转酯化以产生脂肪酸甲基酯(FAME)。将硬脂酸、10-甲基硬脂酸和油酸转酯化为FAME作为标准品。将每一样品/标准品萃取到异辛烷中并通过各种气相色谱法来分析(图7和8)。首先通过毛细管气相色谱使用火焰离子化检测器(GC-FID)分析FAME。从大肠杆菌产生的FAME展示对应于10-甲基硬脂酸FAME标准品的GC峰，其表明耻垢分枝杆菌tmsA和tmsB基因表达能合成10-甲基硬脂酸的蛋白质(图7A)。

FAME也从经空载体pNC53转化的大肠杆菌产生并如上文通过GC-FID加以分析。这个样品未展示对应于10-甲基硬脂酸FAME的GC峰，从而进一步表明耻垢分枝杆菌tmsA和tmsB基因表达能合成10-甲基硬脂酸的蛋白质(图7B)。

使用以单离子监测模式(SIM)配置的GC-MS分析从tmsA/tmsB样品产生的FAME，其监测在312.3和313.3amu处的m/z。质谱图展示在312.3amu处的峰，对应于10-甲基硬脂酸甲基酯的分子量(图8B)。另外，在312.3amu的峰与在313.3amu的峰的比率表明，在312.3amu处观察到的离子含有20.6个碳，其对应于10-甲基硬脂酸甲基酯中的实际碳数(20)。

实施例2：使用来自不同供体生物体的tmsB和tmsA基因在大肠杆菌中10-甲基脂肪酸的产生

方法：

供体细菌基因组DNA是从德国微生物保藏中心(DSMZ,德国)获得。质粒是通过标准分子生物学技术使用“酵母缺口修复”方法来构建(Shanks,等,Appl.Microbiol.Biotechnol.,48:232(1997))。将空大肠杆菌表达载体pNC53(SEQ ID NO:82)用酶PmeI(New England Biolabs,MA)限制性消化，在该载体上的tac启动子与trpT的终止子序列之间产生双链断裂。将tmsAB基因操纵子从基因组DNA用引物侧翼序列进行PCR扩增，使得tmsB ATG开始位点通过同源重组整合到tac启动子末端中。大肠杆菌转录和翻译是由tac启动子驱动。tmsA基因的终止密码子类似地整合到trpT的终止子区的开始部分中。嵌入操纵子的tmsA基因的大肠杆菌翻译依赖于来自供体生物体DNA的天然翻译信号。如果需要，将tmsB的第一个密码子从GTG或TTG改变为ATG；否则天然密码子序列保持在大肠杆菌表达载体中。

通过DNA测序和限制性消化检查载体的正确构建。针对该实施例产生的载体图解说明于图9中。然后使用转化到大肠杆菌Top10(Invitrogen)中的载体进行发酵研究。将细胞接种于50mL补充有100mg/L氨苄西林和100mg/L油酸的LB培养基中，所述油酸来自100mg/mL油酸于乙醇中的原液。将培养物在37℃和200rpm下于三角瓶中孵育41小时。在培养结束时，通过在Eppendorf 5810 R医用离心机中以4000rpm离心15分钟来收获细胞，用等体积的去离子水洗涤一次，再悬浮于0.1mL去离子水中，并在-80℃下冷冻。然后将细胞冻干到干燥并用于以0.5N HCl于甲醇中的溶液(20x 1mL安瓿,Sigma)在85℃下进行酸催化的转酯化90分钟。在转酯化完成后，通过添加水和异辛烷使用双液相体系萃取将反应混合物中的脂质可溶组分与水溶性组分分离，并且之后用配备有机器人注射器、火焰离子化检测器(Agilent Technologies 7890B GC系统和7396自动采样器)和HP-INNOWAX毛细管柱(30m x0.25mm x 0.15微米,Agilent)的毛细管气相色谱(GC)来分析。10-甲基硬脂酸参考标准品是从Larodan AB(Sweden)获得。

结果：

对于所测试11种载体中的4种观察到油酸转化为10-甲基硬脂酸。使用来自嗜热子囊菌(22％)和弯曲嗜热单胞菌(38％)的tmsAB基因时出现最高转化百分比，如下表2中所指示。

表2

实施例3：浑浊红球菌PD630中的tmsB和tmsA表达

产油细菌浑浊红球菌可天然以低水平产生10-甲基脂肪酸(总脂肪酸的0.2％(等,Microbiology,72:5027(2006))，并且另外具有tmsB和tmsA基因的天然同系物，但所述同系物尚未在文献中得到鉴别。在这个实施例中，发明人测试浑浊红球菌中tmsB和tmsA基因的过表达是否可增加10-甲基支化脂肪酸含量。

方法：

浑浊红球菌PD630是从德国微生物保藏中心(DSMZ)的原料DSM 44193获得。通过用4mL LB培养基稀释来使培养物复苏，并在鼓式滚筒中在30℃下孵育3天。一旦出现明显生长，将10μL肉汤加入LB平板上的单一集落中并在30℃下再孵育3天。分离一个集落并命名为菌株NS1104。

所有浑浊红球菌生长都是在30℃下进行。在补充有适当抗生素的LB培养基中进行常规培养。在如Kalscheuer等所改良的营养肉汤培养基中进行遗传转化(Appl.Microbiol.and Biotechnol.,52:508(1999)),所述营养肉汤含有5g/L蛋白胨、2g/L酵母提取物、1g/L牛肉膏、5g/L NaCl、8.5g/L甘氨酸和10g/L蔗糖。脂质产生是在含有以下组分并用NaOH调节到pH 7.6并在使用前经过滤灭菌的确定成分培养基中进行。

浑浊红球菌发酵培养基

质粒是通过标准分子生物学技术使用“酵母缺口修复”方法来构建(Shanks等,Applied and Environmental Biology 72:5207-36(2006))。使用含有红球菌属repA复制起点和庆大霉素抗性标记物的合成DNA序列(Lessard,BMC Microbiol.,4:15(2004))从两种含有在tac启动子控制下的来自耻垢分枝杆菌和嗜热子囊菌的tmsAB基因的质粒产生浑浊红球菌-大肠杆菌-酿酒酵母穿梭载体。简单来说，repA和gen^R合成DNA是用tmsAB目的质粒的约50bp侧翼同源性区域来构建。用PacI对目的质粒进行限制性消化，并且侧翼同源性区域修复缺口，使得能通过酿酒酵母中的ura3基因进行遗传选择。从酿酒酵母通过苯酚/氯仿萃取和乙醇沉淀来分离DNA，并用于转化大肠杆菌。通过mini-prep(Qiagen,USA)分离正确质粒构建体，并通过限制性消化进行筛选。分离含有耻垢分枝杆菌tmsAB的质粒pNC985(SEQ ID NO:93)和含有嗜热子囊菌tmsAB的pNC986(SEQ ID NO:94)(图10)并用于转化浑浊红球菌。

遵循Kalscheuer等(Kalscheuer 1999)所述的方案转化浑浊红球菌。使细胞在改良营养肉汤中生长过夜，随后以0.13的起始光学密度转移到50mL改良营养肉汤培养基中。在OD 0.36收获细胞，在50mL冰冷水中洗涤两次，并且再悬浮于1.7mL冰冷水中。然后将细胞细分为350μL体积加入2μL 400-600ng/μL浓度的质粒DNA。将细胞加DNA在39℃下孵育5分钟，之后立即在冰上冷却并进行电转化。使用2mm间隙杯以2kV脉冲(600Ω,25μF,12ms时间常数)递送电脉冲。然后用600μL SOC培养基稀释细胞并在30℃下孵育过夜。然后将200μL过夜细胞肉汤平铺于含有10μg/mL庆大霉素的LB琼脂上，并在30℃下再孵育4天以供形成集落。挑选庆大霉素抗性集落用于进一步分析，在不添加质粒DNA的对照板上未见到抗性集落。

在30℃下在250mL摇瓶中以200rpm进行4天发酵(25mL工作体积，使用确定成分培养基，酌情添加10μg/mL庆大霉素)。从LB+10μg/mL庆大霉素中的48小时生长培养物制备接种物。接种量为最终体积的1:25v/v。在发酵结束时，收获细胞并再悬浮于1mL蒸馏水中并在-80℃下冷冻。冷冻后，将细胞冻干到干燥，并随后用甲醇HCl在80℃下将完整细胞原位转酯化，之后萃取到异辛烷中并通过气相色谱法和火焰离子化检测进行定量。

结果：

浑浊红球菌经两种载体转化，这两种载体是表达耻垢分枝杆菌tmsAB基因的pNC985和表达嗜热子囊菌tmsAB基因的pNC986。如下表3中所示，pNC986转化的一种分离物菌株NS1155以总脂肪酸的7.2重量％产生10-甲基硬脂酸，与之相比，对照菌株NS1104以总脂肪酸的3.6重量％产生10-甲基硬脂酸。

表3：在经tmsAB表达载体转化的浑浊红球菌菌株中测量的10-甲基硬脂酸的重量百分比。

实施例4：用于tmsB和tmsA的酰基链底物范围

发明人进行以下实验以确定来自弯曲嗜热单胞菌的tmsB和tmsA酶的酰基链底物范围，特别是脂肪酸链长度和双键位置。

方法：

不饱和脂肪酸购自Nu-Check Prep公司，Elysian MN。将脂肪酸以100mg/mL的浓度溶解于DMSO中，棕榈油酸、油酸和异油酸除外，将其以100mg/mL的浓度溶解于乙醇中。10-甲基硬脂酸参考标准品是从Larodan AB(Sweden)获得。

大肠杆菌菌株NS1161和NS1162用于该实验中；菌株NS1161是通过将对照(空)载体质粒转化到保持天然大肠杆菌环丙烷脂肪酸合酶(cfa)基因的kan^R断裂的大肠杆菌CGSC9407(也称为JW1653-1Keio保藏物)中来构建。菌株NS1162是通过将含有在组成型tac启动子控制下的弯曲嗜热单胞菌tmsB和tmsA基因的质粒pNC906(SEQ ID NO:88)(图9B)转化到大肠杆菌CGSC 9407中来构建。

使大肠杆菌菌株在补充有100mg/L氨苄西林和100mg/L脂肪酸的LB培养基中生长。用过夜预培养物的1:1000稀释物接种培养物并使其在37℃下在旋转鼓式滚筒中在具有5mL工作体积的14mL塑料培养管中生长24小时。在培养结束时，通过在Eppendorf 5810 R医用离心机中以4000rpm离心15分钟来收获细胞，用等体积的去离子水洗涤一次，再悬浮于0.1mL去离子水中，并在-80℃下冷冻。然后将细胞冻干到干燥并用于进行HCl-甲醇催化的转酯化反应以产生脂肪酸甲基酯(FAME)。将这些样品溶解于异辛烷中并注入配备有火焰离子化检测器的气相色谱系统(Agilent Technologies)中。

结果：

在饲喂外源游离脂肪酸时，大肠杆菌可将所述游离脂肪酸纳入其磷脂和其他脂质结构中。将菌株NS1161和NS1162与18种不同的不饱和脂肪酸一起并在不补充脂肪酸的对照培养基中培养，并且比较两种菌株的FAME谱。为了鉴别新的不饱和脂肪酸，通过如与无补充的参考培养物相比的菌株NS1161 FAME谱来鉴别对应于所补充脂肪酸的GC峰。并且随后针对相同GC峰检查菌株NS1162 FAME谱，并且检查对应于甲基化脂肪酸的在特征性保留时间漂移的新峰(0.24向前漂移到0.08分钟，且相对漂移随着总保留时间增加而减小)。使用10-甲基硬脂酸参考标准品(Larodan AB,Sweden)作为对照以将保留时间分配给10-甲基硬脂酸。

如下表4中所观察到的，甲基化发生于具有14、15、16、17、18、19和20个碳的脂肪酸上，并且发生于Δ9、Δ10和Δ11双键位置上。转化为甲基化脂肪酸的最高百分比发生在16和18个碳的脂肪酸上，在Δ9和Δ11位置处。

表4

实施例5：tmsA辅因子使用

发明人进行以下实验以确定tmsA酶(10-亚甲基还原酶)使用哪种氧化还原辅因子从中间体10-亚甲基脂肪酸产生全饱和10-甲基脂肪酸。

方法：

大肠杆菌菌株NS1161、NS1163和NS1164用于该实验中；菌株NS1161是通过将对照(空)载体质粒pNC53转化到保持天然大肠杆菌环丙烷脂肪酸合酶(cfa)基因的kan^R断裂的大肠杆菌CGSC 9407(也称为JW1653-1Keio保藏物)中来构建。菌株NS1163是通过将含有在组成型tac启动子控制下的弯曲嗜热单胞菌tmsB基因的质粒pNC963(SEQ ID NO:95)(图11)转化到大肠杆菌CGSC 9407中来构建。菌株NS1164是通过将含有在组成型tac启动子控制下的弯曲嗜热单胞菌tmsA基因的质粒pNC964(SEQ ID NO:96)(图11)转化到大肠杆菌CGSC9407中来构建。

使菌株NS1163在37℃下在1L补充有100mg/L氨苄西林的LB培养基中生长24小时(2x500mL，在2L三角瓶中)。培养后，通过在Eppendorf 5810 R医用离心机中以4000rpm离心15分钟来收获细胞，并在100mL PBS缓冲液中洗涤两次。在浓缩到40mL PBS缓冲液中之后，将细胞在85℃下热灭活30min。然后将灭活细胞分配到1mL等份中并用0.3克0.1mm玻璃珠使用“大肠杆菌”设定的MP fastprep-24(MP biomedicals,LLC)粉碎。通过以2000xg微离心30秒以移除珠粒来收集全细胞溶解悬浮液，并且之后将每管0.7mL悬浮液转移到新管中并在-80℃下冷冻直到进一步使用为止。

在测定当天，通过在37℃和200rpm下在三角摇瓶中在50mL补充有100mg/L氨苄西林的LB培养基中接种过夜培养物(1:1000稀释)来使菌株NS1161和NS1164生长。在培养4小时后，在5℃下收获细胞，在冰冷PBS中洗涤1x并且随后再悬浮于1mL塑料螺旋管中的750μLPBS中。添加0.3克0.1mm玻璃珠粒并用“大肠杆菌”设定的MP fastprep-24溶解细胞。然后将细胞悬浮液以12,000xg微量离心5min，并将上清液转移到新管中并且保持在冰上直到测定为止。

测定反应：700μL NS1163全溶解物、200μL 37.2mg/mL NADPH溶液(测定浓度10mM)、33.2mg/mL NADH溶液(测定浓度10mM)或PBS缓冲液，以及100μL无细胞提取物或PBS缓冲液。将测定管密封并在37℃下在鼓式滚筒上旋转16小时。为了结束测定，将管在-80℃下冷冻，然后冻干到干燥，之后用甲醇HCL进行原位萃取和转酯化。通过具有火焰离子化检测的GC确定脂肪酸谱，并且比较10-甲基脂肪酸峰面积与总脂肪酸峰面积以确定测定活性。

结果：

使通过表达弯曲嗜热单胞菌tmsB基因积累10-亚甲基中间体脂肪酸的菌株NS1163生长，将其收获、灭活并溶解，以用作tmsA(10-亚甲基还原酶)测定的底物。向该底物无细胞提取物添加表达弯曲嗜热单胞菌tmsA基因的大肠杆菌菌株NS1164或含有空表达载体的大肠杆菌菌株NS1161，以及NADPH或NADH。如下表5中所观察到的，在此测定中仅弯曲嗜热单胞菌tmsA和NADPH的存在导致10-甲基脂肪酸的合成。

表5

ND＝该测定未检测

实施例6：tmsB基因在酵母解脂耶氏酵母和腺嘌呤阿氏酵母中的表达

将编码来自耻垢分枝杆菌、范巴伦氏分枝杆菌、浅黄拟无枝酸球菌、甘氨酸棒状杆菌、浑浊红球菌、苏别蒂山农霉菌、气生诺尔氏菌、淡黄分枝杆菌、紫檀分枝杆菌、嗜热子囊菌和弯曲嗜热单胞菌的天然细菌密码子tmsB序列的序列克隆到标准耶氏酵母属表达载体中，所述标准耶氏酵母属表达载体由解脂假丝酵母TEF1启动子驱动并且含有ARS68解脂假丝酵母复制起点、用于选择的诺尔斯菌素抗生素抗性基因以及用于在酿酒酵母中的高拷贝维持的2μ起点和URA3基因。克隆是使用酵母缺口修复方法(Shanks 2006)和在尿嘧啶缺陷型培养基上选择来进行。遵循标准乙酸锂热激方案和在补充有500μg/mL诺尔丝菌素(nourseothricin)的YPD培养基上选择来转化解脂假丝酵母。选择集落并转移到每孔含有300μL氮限制脂质产生培养基的96孔板中，并在30℃和900rpm振荡下孵育96小时。培养基含有100g/L葡萄糖、0.5g/L尿素、1.5g/L酵母提取物、0.85g/L酪蛋白氨基酸、1.7g/L无氨基酸YNB基料和5.1g/L邻苯二甲酸氢钾，pH 5.5。发酵后，将细胞离心，用蒸馏水洗涤，并在-80℃下冷冻，之后冻干到干燥。用0.5N HCl的甲醇溶液将干燥细胞在85℃下原位转酯化90分钟，以产生适合进行气相色谱分析的脂肪酸甲基酯(FAME)。将这些样品溶解于异辛烷中并注入配备有火焰离子化检测器的气相色谱系统(Agilent Technologies)中。基于已知标准品以及在大肠杆菌tms表达实验中鉴别的10亚甲基和10甲基脂肪酸对总C16和C18支化脂肪酸进行鉴别和定量。在独立实验中通过质谱验证10-甲基脂肪酸和10-亚甲基脂肪酸身份。图12显示，用来自嗜热子囊菌和弯曲嗜热单胞菌的tmsB转化的解脂假丝酵母产生最高量的10-亚甲基硬脂酸。

为了测试腺嘌呤阿氏酵母中的tmsB活性，将来自耶氏酵母属弯曲嗜热单胞菌tmsB(SEQ ID NO:75)的表现最好的tmsB基因克隆到在阿氏酵母属ADH1启动子控制下的组成型表达载体中，得到质粒pNC1065。分离个别转化体集落并使其在40℃下在标准工业培养基(具有高C:N比率以促进脂质积累)中生长4天。分离细胞沉淀，用水洗涤一次并冻干。如同耶氏酵母属菌株一样，将总C16和C18脂肪酸转酯化并通过GC分析。图13显示，用来自弯曲嗜热单胞菌的tmsB转化的腺嘌呤阿氏酵母产生10-亚甲基脂肪酸。

实施例7：解脂耶氏酵母和酿酒酵母中的tmsA和tmsB共表达

发明人发现，在酵母菌属和耶氏酵母属酵母菌株中，tmsA和tmsB基因的同时表达可分别产生支化10-甲基和10-亚甲基脂肪酸。对于在耶氏酵母属中的表达，将组成型表达来自弯曲嗜热单胞菌(pNC984)、嗜热子囊菌(pNC983)和谷氨酸棒状杆菌(pNC991)的tmsA的天然细菌序列的质粒各自转化到含有弯曲嗜热单胞菌tmsB基因(从上文实施例6分离)的稳定整合拷贝的菌株NS1117中。分离个别转化体并使其在30℃下在摇瓶培养基中生长4天。分离脂肪酸并如实施例6中通过GC分析。如图14中所示，与亲代菌株相比，所分析的所有tmsA基因都在耶氏酵母属中以可检测水平产生10甲基脂肪酸。弯曲嗜热单胞菌tmsA基因产生的10-甲基脂肪酸多于所分析的其他tmsA基因。

对于在酵母菌属中的表达，将在耶氏酵母属中具有已证实基因活性的质粒pNC984(具有NAT标记物的弯曲嗜热单胞菌tmsA)和pNC1025(具有HYG标记物的弯曲嗜热单胞菌tmsB)个别且一起地转化到酿酒酵母菌株NS20中，并且在含有适当抗生素的培养基上选择转化体。使个别转化分离物在YPD培养基中在30℃下生长2天。加工细胞沉淀，并且如同耶氏酵母属分析总脂肪酸。如图15中所示，仅用tmsB转化的菌株仅产生10-亚甲基脂肪酸，并且用tmsA和tmsB二者转化的菌株产生相对高百分比的10-甲基脂肪酸。

实施例8：tmsA-B融合蛋白质在大肠杆菌、酿酒酵母、解脂耶氏酵母和腺嘌呤阿氏酵母中的表达

发明人发现，在单一多肽中表达tmsA和tmsB酶提高10-亚甲基脂肪酸到10-甲基脂肪酸的转化率。同时含有tmsA和tmsB的活性的单一蛋白质是通过在框中融合弯曲嗜热单胞菌tmsA和tmsB的基因来产生，两个基因通过柔性连接体结构域隔开。选择弯曲嗜热单胞菌tmsA和tmsB酶是因为其在酵母中产生的10-甲基支化脂肪酸最多。选择在耶氏酵母属FAS2基因中天然存在的具有序列AGGAEGGNGGGA的12个氨基酸的短连接体来连接两种酶。测试两种融合酶在细菌和酵母中的活性，即tmsA-B(NG540；由SEQ ID NO:97编码)和tmsB-A(NG541；由SEQ ID NO:98编码)。

对于大肠杆菌表达，将含有弯曲嗜热单胞菌tmsA-B和tmsB-A基因以及tac启动子和trpT的终止子的质粒pNC1069和pNC1070各自转化到大肠杆菌CGSC 9407中。使个别转化的菌株生长并如上文实施例2中测定总脂肪酸。如下表6中所示，tmsA-B和tmsB-A基因二者都导致在大肠杆菌中产生甲基化硬脂酸。

表6.将油酸和异油酸的甲基化计算为转化为10-甲基脂肪酸和12-甲基脂肪酸的C18:1脂肪酸的百分比。

对于酿酒酵母和解脂耶氏酵母表达，将NG540(SEQ ID NO:97)和NG541(SEQ IDNO:98)各自克隆到含有用于酵母菌属中的高拷贝保持的酵母2u复制起点的标准耶氏酵母属表达载体中，得到相应载体pNC1067和pNC1068。

通过标准方案将质粒pNC1067和pNC1068转化到酵母菌属菌株NS20中，并且选择个别转化的菌株用于支化脂肪酸产生的测定。使菌株在30℃下在25ml YPD培养基中生长2天。冻干细胞沉淀并如实施例2中通过基本转酯化和GC分析对总脂肪酸进行分析。图16显示，tmsA-B和tmsB-A二者在酿酒酵母中的表达都导致产生10甲基脂肪酸。

通过标准热激方案将质粒pNC1067和pNC1068转化到解脂耶氏酵母中。选择个别得到的转化体菌株用于10-亚甲基和10-甲基脂肪酸产生的分析。使菌株生长并如在实施例7中通过GC分析。图17显示，tmsA-B和tmsB-A二者在解脂假丝酵母中的表达都导致产生10甲基脂肪酸，但tmsA-B在将10-亚甲基脂肪酸转化为10-甲基脂肪酸方面更有效。

为了在腺嘌呤阿氏酵母中表达，将NG540克隆到含有组成型阿氏酵母属ADH1启动子的标准表达载体中，得到pNC1151。将pNC1151转化到阿氏酵母属菌株NS1166中，并选择个别转化体以测定10-甲基脂肪酸的产生。使阿氏酵母属菌株生长并如在实施例7中通过GC分析。

这些实验显示，在大肠杆菌(表6)、酿酒酵母(图16)、解脂耶氏酵母(图17)和腺嘌呤阿氏酵母(图18)中检测到10-甲基C16和C18脂肪酸，指示融合酶同时含有tmsA和tmsB活性。10-亚甲基中间体的低产量(在大肠杆菌和酿酒酵母菌中没有检测到，在解脂耶氏酵母和腺嘌呤阿氏酵母属中为低水平)指示，融合蛋白质有效地将不饱和脂肪酸转化为10甲基脂肪酸。

实施例9：tmsB序列分析

用CLUSTAL OMEGA软件程序(European Molecular Biology Laboratory,EMBL)将由来自耻垢分枝杆菌、范巴伦氏分枝杆菌、浅黄拟无枝酸球菌、甘氨酸棒状杆菌、谷氨酸棒状杆菌、浑浊红球菌、苏别蒂山农霉菌、气生诺尔氏菌、淡黄分枝杆菌、紫檀分枝杆菌、嗜热子囊菌和弯曲嗜热单胞菌的tmsB基因编码的tmsB蛋白质序列与来自大肠杆菌的环丙烷脂肪酸合酶(Cfa)酶比对。图19A-D显示这些蛋白质序列的比对。大肠杆菌Cfa与TmsB酶共享同源性并实施与TmsB类似的反应，使脂肪酸磷脂双键甲基化，但产生环丙烷部分而不是亚甲基部分。

大肠杆菌Cfa酶的某些氨基酸被认为结合活性位点碳酸氢根离子。Iwig等，J.Am.Chem.Soc.127:11612-13(2005)。这些氨基酸是大肠杆菌酶的C139、E239、H266、I268和Y317，其在共有tmsB蛋白质序列中是保守的(弯曲嗜热单胞菌tmsB序列SEQ ID NO:76上的C160、E266、H293、I295和Y348)。

另外，有16个氨基酸残基对于所有12种tmsB蛋白质序列是保守的，但在大肠杆菌Cfa序列中不保守。这些氨基酸可特异性用于10-亚甲基加成到脂肪酸磷脂，而不是由大肠杆菌Cfa蛋白质进行的环丙烷加成。这些根据弯曲嗜热单胞菌tmsB序列编号的保守氨基酸是SEQ ID NO:76的D23、G24、A59、H128、F147、Y148、L180、L193、M203、G236、A241、R313、R318、E320、L359、L400。

BLASTp保守结构域分析(National Center for Biotechnology Information,NCBI)鉴别来自弯曲嗜热单胞菌tmsB的氨基酸192-291的S-腺苷甲硫氨酸依赖性甲基转移酶结构域。S-腺苷甲硫氨酸结合位点氨基酸残基经鉴别为V196、G197、C198、G199、W200、G201、G202、T219、L220、Q246、D247、Y248和D262。

表7显示所指示蛋白质相对于弯曲嗜热单胞菌tmsB的序列同一性百分比：

表7.

如表7中所示，在来自不同物种的tmsB蛋白质序列之间存在大量变异。然而，虽然序列有变异，但若干种蛋白质在本文中显示具有相同的催化亚甲基取代的脂质产生的能力。

实施例10：tmsA序列分析

用CLUSTAL OMEGA软件程序(European Molecular Biology Laboratory,EMBL)将来自耻垢分枝杆菌、范巴伦氏分枝杆菌、浅黄拟无枝酸球菌、甘氨酸棒状杆菌、谷氨酸棒状杆菌、浑浊红球菌、苏别蒂山农霉菌、气生诺尔氏菌、淡黄分枝杆菌、紫檀分枝杆菌、嗜热子囊菌和弯曲嗜热单胞菌的tmsA基因编码的tmsA蛋白质序列与来自大肠杆菌的乙醇酸氧化酶亚单位GlcD酶比对。大肠杆菌GlcD酶似乎不进行与TmsA相似的酶反应，但其为与大肠杆菌基因组中的TmsA最密切同源的蛋白质。

图20A-E显示tmsA蛋白质的比对。有114个氨基酸残基对于所有12种tmsA蛋白质序列是保守的，但在大肠杆菌GlcD序列中不保守。这些氨基酸是(根据弯曲嗜热单胞菌序列(SEQ ID NO:74)编号)：R31、A33、S37、N38、L39、F40、R43、D52、V59、D63、G73、M74、T76、Y77、D79、L80、V81、L85、P91、V93、V94、Q96、L97、T99、I100、T101、A105、G108、G110、E112、S113、S115、F116、R117、N118、P121、H122、E123、V125、E127、G133、P154、N155、Y157、Y162、L166、E171、V173、V177、H181、V208、G213、F216、Y222、L223、S236、D237、Y238、T239、Y245、S247、D254、T257、Y261、W263、R264、W265、D266、D268、W269、C272、A275、G277、Q279、R284、W287、R293、S294、G318、E232、V325、P328、E330、F339、F343、W353、C355、P356、W363、L365、Y366、P367、N376、F379、W380、V383、P384、N395、E399、G407、H408、K409、S410、L411、Y412、S413、Y417、F422、Y426、G428、R443、L447和V452。

BLASTp保守结构域分析(National Center for Biotechnology Information,NCBI)鉴别来自弯曲嗜热单胞菌tmsA(SEQ ID NO:74)的氨基酸9-141的黄素腺嘌呤二核苷酸(FAD)结合结构域，以及来自氨基酸22-444的含有FAD/FMN的脱氢酶结构域。表8显示所指示蛋白质相对于弯曲嗜热单胞菌tmsA的序列同一性百分比：

表8.

如表8中所示，在来自不同物种的tmsA蛋白质序列之间存在大量变异。然而，虽然序列有变异，但若干种蛋白质在本文中显示具有相同的催化甲基取代的脂质产生的能力。

以引用方式并入

本文引用的每一专利、已公开专利申请和非专利参考文献在此以引用方式整体并入。

等同内容

本领域技术人员将认识到，或仅使用常规实验就能确定本文所述的发明的具体实施方案的多种等同方案。以下权利要求书计划涵盖所述等同方案。

序列表

<110> 诺沃吉公司

<120> 10-甲基硬脂酸的异源性产生

<130> NOVG.P0005WO

<140> 未知的

<141> 2017-09-20

<150> 62396870

<151> 2016-09-20

<160> 98

<170> PatentIn version 3.5

<210> 1

<211> 1401

<212> DNA

<213> 耻垢分枝杆菌

<400> 1

gtgtctgtgg ttactactga cgcacaggct gcccatgccg ccggcgtctc gcgtcttctg 60

gccagctacc gggcgatccc gcccagcgcg acagtgcgcc ttgcgaaacc gacgtccaac 120

ctgttccgcg cccgcgcccg caccaatgtg aagggtctcg acgtctcggg cctgaccggt 180

gtgatcggtg tcgacccgga cgcgcgcacc gccgatgtgg cgggcatgtg cacctacgag 240

gacctggtgg cggccacgct tccgtacggc cttgccccac tggtggtgcc gcagctcaag 300

accatcacgc tcggtggcgc ggtcaccggt ctgggcatcg agtccacgtc gttccgcaac 360

ggtctgccgc acgaaagtgt cctggagatg gacatcttga ccggttcggg cgagatcgtc 420

acggcctcac cggatcagca ctcggatctg ttccatgcgt tccccaattc atatggaacc 480

cttggttatt ccacccggct gcgcatcgaa ctggagcccg tgcacccgtt tgtggcgttg 540

cgccacctgc gctttcactc gatcaccgat ctggtcgcgg cgatggaccg gatcatcgag 600

accggcgggc tggacggtga acccgtcgac tacctcgacg gcgtggtgtt cagcgcgact 660

gagagttacc tgtgtgttgg cttcaagacg aaaacgccgg ggccggtcag cgattacaca 720

ggtcagcaga tcttctaccg gtcgatccag catgacggcg acaccggcgc cgagaaacac 780

gaccggctga ccatccacga ctacctgtgg cgctgggaca ccgactggtt ctggtgctca 840

cgggcattcg gcgctcagca tccggtgatc cgcaggttct ggccgcggcg gctgcgccgc 900

agcagcttct actggaagct ggtggcctac gaccagcggt acgacatcgc cgaccgtatc 960

gagaagcgca acgggcgccc gccgcgcgag cgggtggtcc aggacgtcga ggtgcccatc 1020

gagcggtgcg cggacttcgt cgagtggttc ctgcagaatg tgccgatcga gccgatctgg 1080

ctgtgccccc tacggttgcg tgacagcgcc gacggcggtg cctcgtggcc cctgtatccg 1140

ctgaaggcgc accacaccta cgtcaacatc ggtttctggt catcagtgcc ggtgggcccc 1200

gaggagggcc acaccaaccg cctcatcgag aaaaaagtcg cggagctgga cgggcacaaa 1260

tctttgtact cggacgctta ttacacacgt gacgaattcg acgagctgta cggcggtgag 1320

gtctacaaca ccgtcaagaa gacgtacgac ccggattcac gtctgctaga cctgtattcg 1380

aaggcggtgc aaagacaatg a 1401

<210> 2

<211> 466

<212> PRT

<213> 耻垢分枝杆菌

<400> 2

Val Ser Val Val Thr Thr Asp Ala Gln Ala Ala His Ala Ala Gly Val

1 5 10 15

Ser Arg Leu Leu Ala Ser Tyr Arg Ala Ile Pro Pro Ser Ala Thr Val

20 25 30

Arg Leu Ala Lys Pro Thr Ser Asn Leu Phe Arg Ala Arg Ala Arg Thr

35 40 45

Asn Val Lys Gly Leu Asp Val Ser Gly Leu Thr Gly Val Ile Gly Val

50 55 60

Asp Pro Asp Ala Arg Thr Ala Asp Val Ala Gly Met Cys Thr Tyr Glu

65 70 75 80

Asp Leu Val Ala Ala Thr Leu Pro Tyr Gly Leu Ala Pro Leu Val Val

85 90 95

Pro Gln Leu Lys Thr Ile Thr Leu Gly Gly Ala Val Thr Gly Leu Gly

100 105 110

Ile Glu Ser Thr Ser Phe Arg Asn Gly Leu Pro His Glu Ser Val Leu

115 120 125

Glu Met Asp Ile Leu Thr Gly Ser Gly Glu Ile Val Thr Ala Ser Pro

130 135 140

Asp Gln His Ser Asp Leu Phe His Ala Phe Pro Asn Ser Tyr Gly Thr

145 150 155 160

Leu Gly Tyr Ser Thr Arg Leu Arg Ile Glu Leu Glu Pro Val His Pro

165 170 175

Phe Val Ala Leu Arg His Leu Arg Phe His Ser Ile Thr Asp Leu Val

180 185 190

Ala Ala Met Asp Arg Ile Ile Glu Thr Gly Gly Leu Asp Gly Glu Pro

195 200 205

Val Asp Tyr Leu Asp Gly Val Val Phe Ser Ala Thr Glu Ser Tyr Leu

210 215 220

Cys Val Gly Phe Lys Thr Lys Thr Pro Gly Pro Val Ser Asp Tyr Thr

225 230 235 240

Gly Gln Gln Ile Phe Tyr Arg Ser Ile Gln His Asp Gly Asp Thr Gly

245 250 255

Ala Glu Lys His Asp Arg Leu Thr Ile His Asp Tyr Leu Trp Arg Trp

260 265 270

Asp Thr Asp Trp Phe Trp Cys Ser Arg Ala Phe Gly Ala Gln His Pro

275 280 285

Val Ile Arg Arg Phe Trp Pro Arg Arg Leu Arg Arg Ser Ser Phe Tyr

290 295 300

Trp Lys Leu Val Ala Tyr Asp Gln Arg Tyr Asp Ile Ala Asp Arg Ile

305 310 315 320

Glu Lys Arg Asn Gly Arg Pro Pro Arg Glu Arg Val Val Gln Asp Val

325 330 335

Glu Val Pro Ile Glu Arg Cys Ala Asp Phe Val Glu Trp Phe Leu Gln

340 345 350

Asn Val Pro Ile Glu Pro Ile Trp Leu Cys Pro Leu Arg Leu Arg Asp

355 360 365

Ser Ala Asp Gly Gly Ala Ser Trp Pro Leu Tyr Pro Leu Lys Ala His

370 375 380

His Thr Tyr Val Asn Ile Gly Phe Trp Ser Ser Val Pro Val Gly Pro

385 390 395 400

Glu Glu Gly His Thr Asn Arg Leu Ile Glu Lys Lys Val Ala Glu Leu

405 410 415

Asp Gly His Lys Ser Leu Tyr Ser Asp Ala Tyr Tyr Thr Arg Asp Glu

420 425 430

Phe Asp Glu Leu Tyr Gly Gly Glu Val Tyr Asn Thr Val Lys Lys Thr

435 440 445

Tyr Asp Pro Asp Ser Arg Leu Leu Asp Leu Tyr Ser Lys Ala Val Gln

450 455 460

Arg Gln

465

<210> 3

<211> 1314

<212> DNA

<213> 耻垢分枝杆菌

<400> 3

atgaccacat tcaaagaacg cgagacgtcc acagcggacc gcaagctcac cctggccgag 60

atcctcgaga tcttcgccgc gggtaaggag ccgctgaagt tcactgcgta cgacggcagc 120

tcggccggtc ccgaggacgc cacgatgggt ctggacctca agaccccgcg tgggaccacc 180

tatctggcca cggcacccgg cgatctgggc ctggcccgtg cgtatgtctc cggtgacctg 240

gagccgcacg gcgtgcatcc cggcgatccc tacccgctgc tgcgcgccct ggccgaacgc 300

atggagttca agcgcccgcc tgcgcgtgtg ctggcgaaca tcgtgcgctc catcggcatc 360

gagcacctca agccgatcgc accgccgccg caggaggcgc tgccccggtg gcgccgcatc 420

atggagggcc tgcggcacag caagacccgc gacgccgagg ccatccacca ccactacgac 480

gtgtcgaaca cgttctacga gtgggtgctg ggcccgtcga tgacctacac gtgcgcgtgc 540

taccccaccg aggacgcgac cctcgaagag gcccaggaca acaagtaccg cctggtgttc 600

gagaagctgc gcctgaagcc cggtgaccgg ttgctcgacg tgggctgcgg ctggggcggc 660

atggtccgct acgcggcccg ccacggcgtc aaggcgctcg gtgtcacgct cagccgcgaa 720

caggcgacgt gggcgcagaa ggccatcgcc caggaaggtc tcaccgatct ggccgaggtg 780

cgtcacggtg attaccgcga cgtcatcgaa tccgggttcg acgcggtgtc ctcgatcggg 840

ctgaccgagc acatcggcgt gcacaactac ccggcgtact tcaacttcct caagtcgaag 900

ctgcgcaccg gtggcctgct gctcaaccac tgcatcaccc gcccggacaa ccggtcggcg 960

ccatcggccg gcgggttcat cgacaggtac gtgttccccg acggggagct caccggctcg 1020

ggccgcatca tcaccgaggc ccaggacgtg ggccttgagg tgatccacga ggagaaccta 1080

cgcaatcact atgcgatgac gctgcgcgac tggtgccgca acctggtcga gcactgggac 1140

gaggcggtcg aagaggtcgg gctgcccacc gcgaaggtgt ggggcctgta catggccggc 1200

tcacgtctgg gcttcgagac caatgtggtt cagctgcacc aggttctggc ggtcaagctt 1260

gacgatcagg gcaaggacgg cggactgccg ttgcggccct ggtggtccgc ctag 1314

<210> 4

<211> 437

<212> PRT

<213> 耻垢分枝杆菌

<400> 4

Met Thr Thr Phe Lys Glu Arg Glu Thr Ser Thr Ala Asp Arg Lys Leu

1 5 10 15

Thr Leu Ala Glu Ile Leu Glu Ile Phe Ala Ala Gly Lys Glu Pro Leu

20 25 30

Lys Phe Thr Ala Tyr Asp Gly Ser Ser Ala Gly Pro Glu Asp Ala Thr

35 40 45

Met Gly Leu Asp Leu Lys Thr Pro Arg Gly Thr Thr Tyr Leu Ala Thr

50 55 60

Ala Pro Gly Asp Leu Gly Leu Ala Arg Ala Tyr Val Ser Gly Asp Leu

65 70 75 80

Glu Pro His Gly Val His Pro Gly Asp Pro Tyr Pro Leu Leu Arg Ala

85 90 95

Leu Ala Glu Arg Met Glu Phe Lys Arg Pro Pro Ala Arg Val Leu Ala

100 105 110

Asn Ile Val Arg Ser Ile Gly Ile Glu His Leu Lys Pro Ile Ala Pro

115 120 125

Pro Pro Gln Glu Ala Leu Pro Arg Trp Arg Arg Ile Met Glu Gly Leu

130 135 140

Arg His Ser Lys Thr Arg Asp Ala Glu Ala Ile His His His Tyr Asp

145 150 155 160

Val Ser Asn Thr Phe Tyr Glu Trp Val Leu Gly Pro Ser Met Thr Tyr

165 170 175

Thr Cys Ala Cys Tyr Pro Thr Glu Asp Ala Thr Leu Glu Glu Ala Gln

180 185 190

Asp Asn Lys Tyr Arg Leu Val Phe Glu Lys Leu Arg Leu Lys Pro Gly

195 200 205

Asp Arg Leu Leu Asp Val Gly Cys Gly Trp Gly Gly Met Val Arg Tyr

210 215 220

Ala Ala Arg His Gly Val Lys Ala Leu Gly Val Thr Leu Ser Arg Glu

225 230 235 240

Gln Ala Thr Trp Ala Gln Lys Ala Ile Ala Gln Glu Gly Leu Thr Asp

245 250 255

Leu Ala Glu Val Arg His Gly Asp Tyr Arg Asp Val Ile Glu Ser Gly

260 265 270

Phe Asp Ala Val Ser Ser Ile Gly Leu Thr Glu His Ile Gly Val His

275 280 285

Asn Tyr Pro Ala Tyr Phe Asn Phe Leu Lys Ser Lys Leu Arg Thr Gly

290 295 300

Gly Leu Leu Leu Asn His Cys Ile Thr Arg Pro Asp Asn Arg Ser Ala

305 310 315 320

Pro Ser Ala Gly Gly Phe Ile Asp Arg Tyr Val Phe Pro Asp Gly Glu

325 330 335

Leu Thr Gly Ser Gly Arg Ile Ile Thr Glu Ala Gln Asp Val Gly Leu

340 345 350

Glu Val Ile His Glu Glu Asn Leu Arg Asn His Tyr Ala Met Thr Leu

355 360 365

Arg Asp Trp Cys Arg Asn Leu Val Glu His Trp Asp Glu Ala Val Glu

370 375 380

Glu Val Gly Leu Pro Thr Ala Lys Val Trp Gly Leu Tyr Met Ala Gly

385 390 395 400

Ser Arg Leu Gly Phe Glu Thr Asn Val Val Gln Leu His Gln Val Leu

405 410 415

Ala Val Lys Leu Asp Asp Gln Gly Lys Asp Gly Gly Leu Pro Leu Arg

420 425 430

Pro Trp Trp Ser Ala

435

<210> 5

<211> 1380

<212> DNA

<213> 未知的

<220>

<223> 苏别蒂山农霉菌

<400> 5

gtgtccgctc ctgcgaccga tgcacgaacc gcccacgccg acggcgtgga gcgattgctc 60

gagagttatc gggcggtgcc ggcggccgca tcggtgcggc tcgccaagcg cacctcgaac 120

ctcttccggt cccgagcggc gacggatgcc cctggcctcg acacctccgg cctgacccac 180

gtcatcgcgg tcgaccccgg ggcgcgcacg gccgacgtcg ccggcatgtg cacctacgac 240

gacctcgtcg ccgcgacact gccgcatggg ctcgcgccac tcgtggtgcc gcaactgaag 300

accatcaccc tcgggggcgc cgtaacggga ctcggcatcg agtcgacgtc gttccgcaac 360

ggtctgccgc acgagtcggt gctcgagatc gacgtgctca ccggcgcagg cgagatcatc 420

acggcgtcgc cgatcgagca cgcagagctg ttccgcgcct tccccaactc gtacggcacc 480

ctcggctacg ccgtgcgcct gcgcatcgag ctcgagccgg tcgagccgtt cgtcgcactc 540

acgcaccttc ggttccatgc gctcaccgac ctcatcgagg caatggagcg catcatcgag 600

accggtcgac tcgacggggt tgccgtcgat tccctcgacg gcgtggtgtt cagcgctgaa 660

gagagctacc tgtgcgtcgg cacgcagacc gcggcatccg gcccggtcag cgactacacc 720

cgccagcaga tcttctatcg ctccatccag catgacgacg gtgcgaagca cgaccggctc 780

accatgcacg actacctgtg gcgctgggac gccgactggt tctggtgctc gcaggcgttc 840

ggcgcgcagc atccgctgat tcgccggttc tggccgcggc gataccggcg cagccgctcg 900

tactcgacgc tcatgcgcct cgaacggcga ttcgacctcg gcgatcgcct cgagaagctc 960

aagggccggc cggcgcgcga acgcgtgatc caagacgtcg aggtgccgat cgggcgcacc 1020

gtcggcttcc tcgaatggtt cctcgcgaac gtgccgatcg agccgatctg gttgtgcccg 1080

ctgcgcctgc ggggcgaccg cggctggcct ctctacccga tccggccgca gcagacctac 1140

gtcaacatcg gcttctggtc gacggttccg gtgggcggct ccgagggcga gacgaaccgc 1200

tcgatcgagc gcgccgtgag cgagttcgac ggacacaagt cgctgtactc cgactcgtac 1260

tactcgcgcg aggagttcga ggagctctac ggcggcgagg cgtaccgggc cgtgaagcgg 1320

cgatacgacc ccgactctcg actgctcgac ctctatgcga aggcggtgca acggcgatga 1380

<210> 6

<211> 459

<212> PRT

<213> 未知的

<220>

<223> 苏别蒂山农霉菌

<400> 6

Val Ser Ala Pro Ala Thr Asp Ala Arg Thr Ala His Ala Asp Gly Val

1 5 10 15

Glu Arg Leu Leu Glu Ser Tyr Arg Ala Val Pro Ala Ala Ala Ser Val

20 25 30

Arg Leu Ala Lys Arg Thr Ser Asn Leu Phe Arg Ser Arg Ala Ala Thr

35 40 45

Asp Ala Pro Gly Leu Asp Thr Ser Gly Leu Thr His Val Ile Ala Val

50 55 60

Asp Pro Gly Ala Arg Thr Ala Asp Val Ala Gly Met Cys Thr Tyr Asp

65 70 75 80

Asp Leu Val Ala Ala Thr Leu Pro His Gly Leu Ala Pro Leu Val Val

85 90 95

Pro Gln Leu Lys Thr Ile Thr Leu Gly Gly Ala Val Thr Gly Leu Gly

100 105 110

Ile Glu Ser Thr Ser Phe Arg Asn Gly Leu Pro His Glu Ser Val Leu

115 120 125

Glu Ile Asp Val Leu Thr Gly Ala Gly Glu Ile Ile Thr Ala Ser Pro

130 135 140

Ile Glu His Ala Glu Leu Phe Arg Ala Phe Pro Asn Ser Tyr Gly Thr

145 150 155 160

Leu Gly Tyr Ala Val Arg Leu Arg Ile Glu Leu Glu Pro Val Glu Pro

165 170 175

Phe Val Ala Leu Thr His Leu Arg Phe His Ala Leu Thr Asp Leu Ile

180 185 190

Glu Ala Met Glu Arg Ile Ile Glu Thr Gly Arg Leu Asp Gly Val Ala

195 200 205

Val Asp Ser Leu Asp Gly Val Val Phe Ser Ala Glu Glu Ser Tyr Leu

210 215 220

Cys Val Gly Thr Gln Thr Ala Ala Ser Gly Pro Val Ser Asp Tyr Thr

225 230 235 240

Arg Gln Gln Ile Phe Tyr Arg Ser Ile Gln His Asp Asp Gly Ala Lys

245 250 255

His Asp Arg Leu Thr Met His Asp Tyr Leu Trp Arg Trp Asp Ala Asp

260 265 270

Trp Phe Trp Cys Ser Gln Ala Phe Gly Ala Gln His Pro Leu Ile Arg

275 280 285

Arg Phe Trp Pro Arg Arg Tyr Arg Arg Ser Arg Ser Tyr Ser Thr Leu

290 295 300

Met Arg Leu Glu Arg Arg Phe Asp Leu Gly Asp Arg Leu Glu Lys Leu

305 310 315 320

Lys Gly Arg Pro Ala Arg Glu Arg Val Ile Gln Asp Val Glu Val Pro

325 330 335

Ile Gly Arg Thr Val Gly Phe Leu Glu Trp Phe Leu Ala Asn Val Pro

340 345 350

Ile Glu Pro Ile Trp Leu Cys Pro Leu Arg Leu Arg Gly Asp Arg Gly

355 360 365

Trp Pro Leu Tyr Pro Ile Arg Pro Gln Gln Thr Tyr Val Asn Ile Gly

370 375 380

Phe Trp Ser Thr Val Pro Val Gly Gly Ser Glu Gly Glu Thr Asn Arg

385 390 395 400

Ser Ile Glu Arg Ala Val Ser Glu Phe Asp Gly His Lys Ser Leu Tyr

405 410 415

Ser Asp Ser Tyr Tyr Ser Arg Glu Glu Phe Glu Glu Leu Tyr Gly Gly

420 425 430

Glu Ala Tyr Arg Ala Val Lys Arg Arg Tyr Asp Pro Asp Ser Arg Leu

435 440 445

Leu Asp Leu Tyr Ala Lys Ala Val Gln Arg Arg

450 455

<210> 7

<211> 1254

<212> DNA

<213> 未知的

<220>

<223> 苏别蒂山农霉菌

<400> 7

atcctcgaga tcgtcgtcgc cggtcggctg ccgctgaggt tcaccgccta cgacgggagc 60

tcggcggggc cgcctgacgc cctgttcggc ctcgacctga agactccgcg aggaacgacc 120

tatctcgcca ccggccgcgg cgatctcggc ctcgcccgcg cctacatcgc gggcgacctc 180

gagatacagg gggtgcaccc cggagacccc tacgagctgc tcaaggcact cgccgacagc 240

ctggtcttca agctgccacc gccgcgggtg atgacccaga tcatccgttc gatcggcgtc 300

gaacatctgc ggccgatcgc gccgccgccg caagaggtgc cgccccggtg gcgccgcatc 360

gccgaggggc tccgacacag caagggccgc gacgccgaag cgatccacca ccactacgac 420

gtgtcgaaca ccttctacga atgggtgctc gggccgtcga tgacctacac gtgcgcgtgc 480

tacccgggcc tcgacgcatc cctcgacgag gcgcagcaga acaagtaccg gctcgtgttc 540

gagaagctgc ggctgaagcc gggcgaccga ctgctcgacg tcggctgcgg gtggggcggc 600

atggtgcgct acgccgcgcg ccacggcgtg caggcgttgg gcgtgaccct gtcgcgagag 660

cagacggcgt gggcgcagca ggcgatcgcc gtcgagggcc tcgccgacct cgccgaggtg 720

cgctacggcg actaccgcga catcgccgaa gacggcttcg atgcggtgtc atcgatcggg 780

ctgctcgagc acatcggcgt gcgcaactac gcttcgtatt tcggctttct gcagtcgcgc 840

ttgcggcccg ggggactctt gctcaaccac tgcatcaccc ggcccgacaa tcgctccgag 900

ccgtcggcgc gcggcttcat cgaccggtac gtgttccccg acggagagct caccggctcg 960

ggccgcatca tcaccgaggc gcaggatgtc ggcttcgaag tgctgcacga agagaacctg 1020

cgtcagcatt atgcactgac actgcgcgat tggtgcgcca acctcgtcgc gcactgggaa 1080

gaggcggtcg ccgaggtcgg gctgccgacc gcgaaggtgt ggggcctcta catggccggg 1140

tcacggctcg cgttcgagag cggcggcatc cagttgcacc aggtgctggc ggtcagacca 1200

gacgatcgca gcgacgccgc ccagctgccg ctgcggccgt ggtggacgcc atag 1254

<210> 8

<211> 417

<212> PRT

<213> 未知的

<220>

<223> 苏别蒂山农霉菌

<400> 8

Ile Leu Glu Ile Val Val Ala Gly Arg Leu Pro Leu Arg Phe Thr Ala

1 5 10 15

Tyr Asp Gly Ser Ser Ala Gly Pro Pro Asp Ala Leu Phe Gly Leu Asp

20 25 30

Leu Lys Thr Pro Arg Gly Thr Thr Tyr Leu Ala Thr Gly Arg Gly Asp

35 40 45

Leu Gly Leu Ala Arg Ala Tyr Ile Ala Gly Asp Leu Glu Ile Gln Gly

50 55 60

Val His Pro Gly Asp Pro Tyr Glu Leu Leu Lys Ala Leu Ala Asp Ser

65 70 75 80

Leu Val Phe Lys Leu Pro Pro Pro Arg Val Met Thr Gln Ile Ile Arg

85 90 95

Ser Ile Gly Val Glu His Leu Arg Pro Ile Ala Pro Pro Pro Gln Glu

100 105 110

Val Pro Pro Arg Trp Arg Arg Ile Ala Glu Gly Leu Arg His Ser Lys

115 120 125

Gly Arg Asp Ala Glu Ala Ile His His His Tyr Asp Val Ser Asn Thr

130 135 140

Phe Tyr Glu Trp Val Leu Gly Pro Ser Met Thr Tyr Thr Cys Ala Cys

145 150 155 160

Tyr Pro Gly Leu Asp Ala Ser Leu Asp Glu Ala Gln Gln Asn Lys Tyr

165 170 175

Arg Leu Val Phe Glu Lys Leu Arg Leu Lys Pro Gly Asp Arg Leu Leu

180 185 190

Asp Val Gly Cys Gly Trp Gly Gly Met Val Arg Tyr Ala Ala Arg His

195 200 205

Gly Val Gln Ala Leu Gly Val Thr Leu Ser Arg Glu Gln Thr Ala Trp

210 215 220

Ala Gln Gln Ala Ile Ala Val Glu Gly Leu Ala Asp Leu Ala Glu Val

225 230 235 240

Arg Tyr Gly Asp Tyr Arg Asp Ile Ala Glu Asp Gly Phe Asp Ala Val

245 250 255

Ser Ser Ile Gly Leu Leu Glu His Ile Gly Val Arg Asn Tyr Ala Ser

260 265 270

Tyr Phe Gly Phe Leu Gln Ser Arg Leu Arg Pro Gly Gly Leu Leu Leu

275 280 285

Asn His Cys Ile Thr Arg Pro Asp Asn Arg Ser Glu Pro Ser Ala Arg

290 295 300

Gly Phe Ile Asp Arg Tyr Val Phe Pro Asp Gly Glu Leu Thr Gly Ser

305 310 315 320

Gly Arg Ile Ile Thr Glu Ala Gln Asp Val Gly Phe Glu Val Leu His

325 330 335

Glu Glu Asn Leu Arg Gln His Tyr Ala Leu Thr Leu Arg Asp Trp Cys

340 345 350

Ala Asn Leu Val Ala His Trp Glu Glu Ala Val Ala Glu Val Gly Leu

355 360 365

Pro Thr Ala Lys Val Trp Gly Leu Tyr Met Ala Gly Ser Arg Leu Ala

370 375 380

Phe Glu Ser Gly Gly Ile Gln Leu His Gln Val Leu Ala Val Arg Pro

385 390 395 400

Asp Asp Arg Ser Asp Ala Ala Gln Leu Pro Leu Arg Pro Trp Trp Thr

405 410 415

Pro

<210> 9

<211> 1428

<212> DNA

<213> 未知的

<220>

<223> 浅黄拟无枝酸球菌

<400> 9

atgacgcctg aagctagtgc ggcggcgcac gccgctgcgg tggatcgcct catccatagc 60

tatcgggcga ttcctgatga cgcgccggtg cggctggcga agaagacgtc aaacctattc 120

cgccacaggg aaaagacttc tgctcctggg cttgacgtat ccggcctggc tcgcgtgatt 180

gggatcgact cagacactcg cactgccgac gttggcggca tgtgcacata cgaggacctt 240

gtcgcggcga cgctcgaata cgatctggtc cccctggtcg tcccgcaact caaaacgatc 300

actctcggcg gcgcggtgac gggcctggga attgagtcca cctcgttccg caatgggctt 360

ccccatgaat ctgttctcga aatggatatc ctgacgggcg ccggggaggt cgtcacggcc 420

ggcccggaag gcccccatag cgatttgtac tgggggtttc cgaattcgta cggcacgctc 480

ggctatgcga cgcgcctgcg catcgaacta gaaccggtcg agccgtacgt cgaactcagg 540

cacctgcggt tcactagcct cgatgagctt caggagacac ttgacaccgt ttcgtacgaa 600

cacacgtatg acggggaacc cgttcattac gtcgatggag tcatgttctc agccacggaa 660

agctacctca cgcttggccg tcagacgagc gaacccggcc cggtcagcga ctacaccgga 720

aaccagatct actaccgttc aatacagcac ggtggcgctg aaactcccgt cgtcgaccgg 780

atgaccattc atgactatct atggcgctgg gatactgact ggttctggtg ctcgcgtgcc 840

ttcggaacgc aacacccagt ggtccggaga ttctggccac gccgctatcg ccgcagcagc 900

ttctactgga agctgatcgc gcttgaccgc caggttgggc tcgcggactt catcgaacaa 960

cggaagggca acctcccccg ggaacgcgta gtccaggaca tcgaggtccc gatcgagaac 1020

actgcgagct tcttgcggtg gttcttggcg aacgtgccga tcgagccggt atggctatgc 1080

ccgctgcgcc tgcgaaaaac acgcagcccc ggcctgcctt cgccgacgtc cccggcttca 1140

cgcccatggc ccctctatcc gctcgagcct cagcgcacat acgtcaatgt tggcttctgg 1200

tcagcggtgc cggtcgtggc cggccagccc gaggggcaca ccaaccggat gatcgagaac 1260

gaagtcgatc gccttgacgg tcacaaatcg ctgtactcag atgcgtttta cgagcgaaaa 1320

gagtttgacg cgctgtacgg cggcgatacc tatagagaac tcaaagagac ctacgaccca 1380

aacagccggt tacttgatct ctatgcaaag gcggtgcaag gacgatga 1428

<210> 10

<211> 475

<212> PRT

<213> 未知的

<220>

<223> 浅黄拟无枝酸球菌

<400> 10

Met Thr Pro Glu Ala Ser Ala Ala Ala His Ala Ala Ala Val Asp Arg

1 5 10 15

Leu Ile His Ser Tyr Arg Ala Ile Pro Asp Asp Ala Pro Val Arg Leu

20 25 30

Ala Lys Lys Thr Ser Asn Leu Phe Arg His Arg Glu Lys Thr Ser Ala

35 40 45

Pro Gly Leu Asp Val Ser Gly Leu Ala Arg Val Ile Gly Ile Asp Ser

50 55 60

Asp Thr Arg Thr Ala Asp Val Gly Gly Met Cys Thr Tyr Glu Asp Leu

65 70 75 80

Val Ala Ala Thr Leu Glu Tyr Asp Leu Val Pro Leu Val Val Pro Gln

85 90 95

Leu Lys Thr Ile Thr Leu Gly Gly Ala Val Thr Gly Leu Gly Ile Glu

100 105 110

Ser Thr Ser Phe Arg Asn Gly Leu Pro His Glu Ser Val Leu Glu Met

115 120 125

Asp Ile Leu Thr Gly Ala Gly Glu Val Val Thr Ala Gly Pro Glu Gly

130 135 140

Pro His Ser Asp Leu Tyr Trp Gly Phe Pro Asn Ser Tyr Gly Thr Leu

145 150 155 160

Gly Tyr Ala Thr Arg Leu Arg Ile Glu Leu Glu Pro Val Glu Pro Tyr

165 170 175

Val Glu Leu Arg His Leu Arg Phe Thr Ser Leu Asp Glu Leu Gln Glu

180 185 190

Thr Leu Asp Thr Val Ser Tyr Glu His Thr Tyr Asp Gly Glu Pro Val

195 200 205

His Tyr Val Asp Gly Val Met Phe Ser Ala Thr Glu Ser Tyr Leu Thr

210 215 220

Leu Gly Arg Gln Thr Ser Glu Pro Gly Pro Val Ser Asp Tyr Thr Gly

225 230 235 240

Asn Gln Ile Tyr Tyr Arg Ser Ile Gln His Gly Gly Ala Glu Thr Pro

245 250 255

Val Val Asp Arg Met Thr Ile His Asp Tyr Leu Trp Arg Trp Asp Thr

260 265 270

Asp Trp Phe Trp Cys Ser Arg Ala Phe Gly Thr Gln His Pro Val Val

275 280 285

Arg Arg Phe Trp Pro Arg Arg Tyr Arg Arg Ser Ser Phe Tyr Trp Lys

290 295 300

Leu Ile Ala Leu Asp Arg Gln Val Gly Leu Ala Asp Phe Ile Glu Gln

305 310 315 320

Arg Lys Gly Asn Leu Pro Arg Glu Arg Val Val Gln Asp Ile Glu Val

325 330 335

Pro Ile Glu Asn Thr Ala Ser Phe Leu Arg Trp Phe Leu Ala Asn Val

340 345 350

Pro Ile Glu Pro Val Trp Leu Cys Pro Leu Arg Leu Arg Lys Thr Arg

355 360 365

Ser Pro Gly Leu Pro Ser Pro Thr Ser Pro Ala Ser Arg Pro Trp Pro

370 375 380

Leu Tyr Pro Leu Glu Pro Gln Arg Thr Tyr Val Asn Val Gly Phe Trp

385 390 395 400

Ser Ala Val Pro Val Val Ala Gly Gln Pro Glu Gly His Thr Asn Arg

405 410 415

Met Ile Glu Asn Glu Val Asp Arg Leu Asp Gly His Lys Ser Leu Tyr

420 425 430

Ser Asp Ala Phe Tyr Glu Arg Lys Glu Phe Asp Ala Leu Tyr Gly Gly

435 440 445

Asp Thr Tyr Arg Glu Leu Lys Glu Thr Tyr Asp Pro Asn Ser Arg Leu

450 455 460

Leu Asp Leu Tyr Ala Lys Ala Val Gln Gly Arg

465 470 475

<210> 11

<211> 1311

<212> DNA

<213> 未知的

<220>

<223> 浅黄拟无枝酸球菌

<400> 11

atgaaggcag tgttgacggc gtttacggct ccccaactcg aaaggatgaa cgtcgctgag 60

atactcagcg cggtactcgg gcgagatttc ccgatccggt tcactgcgta cgacggcagc 120

gcgctcggcc ccgaaaccgc ccgctacggc ttgcacctca cgacgccgcg cgggctgacc 180

tacctcgcta ccgcgcccgg tgatctcggg ctcgcacgcg cgtacgtgtc cggcgacctc 240

gaggtcagtg gggttcatca gggtgacccg tacgagataa tgaagatcct cgcgcatgac 300

gtccgggtgc ggcggccctc gccagcaacg atcgcttcga tcatgcggtc cctcggctgg 360

gaacgcttgc gaccggtcgc gccgcccccg caagagaaca tgccccgttg gcgccggatg 420

gcccttggcc tgctgcactc gaagagccgt gatgctgcgg caatccacca tcattacgac 480

gtgtcgaacg agttttacga gcacatcctc ggcccgtcga tgacgtacac atgcgcggcc 540

taccccagcg cagacagttc cctggaggaa gcacaggaca acaagtaccg actcgtcttc 600

gagaaacttg gcctgaaagc cggggatcgc ctgcttgacg tcgggtgcgg gtggggcggc 660

atggtgcggt tcgccgctaa gcgcggcgtt catgtcatcg gtgcgacatt gtcccgcaaa 720

caggcggaat gggctcagaa gatgattgcc catgaaggat tgggcgatct ggcggaagtc 780

cgtttctgcg actaccgcga tgtcacagag gcgggcttcg acgcagtgtc gtcgatcggc 840

ctcactgaac acatcggttt ggcgaactac ccgtcgtact tcggcttcct gaaggacaag 900

ttgcggccag gcggacgact gctgaaccat tgcatcactc gcccgaacaa ccttcaaagc 960

aaccgcgcag gtgacttcat tgaccggtac gttttccctg acggagagct cgccggacct 1020

ggcttcatca tttcagctgt ccacgacgcc ggtttcgagg tgcggcacga agagaacctc 1080

cgcgagcact acgcactgac gctgcgggac tggaaccgca acctcgctcg cgactgggac 1140

gcgtgtgtgc acgcctccga cgagggcacc gcccgcgtct ggggactgta catttccggt 1200

tcacgagtcg cgtttgaaac gaactcgatt cagctgcacc aggtcctggc ggtcaaaacc 1260

gcgcggaatg gcgaagcgca ggtcccgttg ggtcagtggt ggacccgctg a 1311

<210> 12

<211> 436

<212> PRT

<213> 未知的

<220>

<223> 浅黄拟无枝酸球菌

<400> 12

Met Lys Ala Val Leu Thr Ala Phe Thr Ala Pro Gln Leu Glu Arg Met

1 5 10 15

Asn Val Ala Glu Ile Leu Ser Ala Val Leu Gly Arg Asp Phe Pro Ile

20 25 30

Arg Phe Thr Ala Tyr Asp Gly Ser Ala Leu Gly Pro Glu Thr Ala Arg

35 40 45

Tyr Gly Leu His Leu Thr Thr Pro Arg Gly Leu Thr Tyr Leu Ala Thr

50 55 60

Ala Pro Gly Asp Leu Gly Leu Ala Arg Ala Tyr Val Ser Gly Asp Leu

65 70 75 80

Glu Val Ser Gly Val His Gln Gly Asp Pro Tyr Glu Ile Met Lys Ile

85 90 95

Leu Ala His Asp Val Arg Val Arg Arg Pro Ser Pro Ala Thr Ile Ala

100 105 110

Ser Ile Met Arg Ser Leu Gly Trp Glu Arg Leu Arg Pro Val Ala Pro

115 120 125

Pro Pro Gln Glu Asn Met Pro Arg Trp Arg Arg Met Ala Leu Gly Leu

130 135 140

Leu His Ser Lys Ser Arg Asp Ala Ala Ala Ile His His His Tyr Asp

145 150 155 160

Val Ser Asn Glu Phe Tyr Glu His Ile Leu Gly Pro Ser Met Thr Tyr

165 170 175

Thr Cys Ala Ala Tyr Pro Ser Ala Asp Ser Ser Leu Glu Glu Ala Gln

180 185 190

Asp Asn Lys Tyr Arg Leu Val Phe Glu Lys Leu Gly Leu Lys Ala Gly

195 200 205

Asp Arg Leu Leu Asp Val Gly Cys Gly Trp Gly Gly Met Val Arg Phe

210 215 220

Ala Ala Lys Arg Gly Val His Val Ile Gly Ala Thr Leu Ser Arg Lys

225 230 235 240

Gln Ala Glu Trp Ala Gln Lys Met Ile Ala His Glu Gly Leu Gly Asp

245 250 255

Leu Ala Glu Val Arg Phe Cys Asp Tyr Arg Asp Val Thr Glu Ala Gly

260 265 270

Phe Asp Ala Val Ser Ser Ile Gly Leu Thr Glu His Ile Gly Leu Ala

275 280 285

Asn Tyr Pro Ser Tyr Phe Gly Phe Leu Lys Asp Lys Leu Arg Pro Gly

290 295 300

Gly Arg Leu Leu Asn His Cys Ile Thr Arg Pro Asn Asn Leu Gln Ser

305 310 315 320

Asn Arg Ala Gly Asp Phe Ile Asp Arg Tyr Val Phe Pro Asp Gly Glu

325 330 335

Leu Ala Gly Pro Gly Phe Ile Ile Ser Ala Val His Asp Ala Gly Phe

340 345 350

Glu Val Arg His Glu Glu Asn Leu Arg Glu His Tyr Ala Leu Thr Leu

355 360 365

Arg Asp Trp Asn Arg Asn Leu Ala Arg Asp Trp Asp Ala Cys Val His

370 375 380

Ala Ser Asp Glu Gly Thr Ala Arg Val Trp Gly Leu Tyr Ile Ser Gly

385 390 395 400

Ser Arg Val Ala Phe Glu Thr Asn Ser Ile Gln Leu His Gln Val Leu

405 410 415

Ala Val Lys Thr Ala Arg Asn Gly Glu Ala Gln Val Pro Leu Gly Gln

420 425 430

Trp Trp Thr Arg

435

<210> 13

<211> 1548

<212> DNA

<213> 谷氨酸棒状杆菌

<400> 13

atgagcggat tagttgaccc ggatagtact tttttaaaga ccatcggaaa actgagcaac 60

agcttgtcca ttggtcgtgg agtagatcaa aaagaggtaa tccccaaagg ctggaacgcc 120

cattgggagg caattacaaa gcttaagaga agctttgacg cgattcctgc tggggagcgg 180

gtgcgtttag ctaagaaaac ctccaacctg ttccgtggac gctccgatgc aggtcacggc 240

ctagatgtgg cagcgcttgg gggagtgatt gccattgatc cggtcaatgc caccgccgat 300

gtacagggca tgtgcacgta tgaagacctg gtagatgcca ctttaagtta tggtctgatg 360

ccgttggttg tgcctcaact gaaaaccatc acgcttggtg gcgcagtgac cggaatgggc 420

gtggaatcca catccttccg caacggtttg ccacacgaat cagtgctgga gatggatatt 480

tttaccggca ctggtgagat cgtgacttgc tcgcccacag aaaatgtcga cctttacaga 540

ggttttccca actcttatgg ttcgctggga tacgcggtgc ggctaaaaat tgagctggaa 600

ccagtgcaag attacgtcca gctgcgccac gtgcgcttca acgatttaga gtctttgacc 660

aaagcgattg aggaagtcgc gtcttctctg gagtttgata accaacccgt cgattacctt 720

gacggcgtgg tgttttcacc cacggaagcc tacttagttc ttggcacgca aacctcacaa 780

cctggcccca ccagcgatta caccagggat ttaagctact accgctccct gcaacaccca 840

gagggcatca cctatgaccg cctgacaatc cgcgattaca tctggcgctg ggacaccgac 900

tggttctggt gttcacgcgc attcggcacc caaaaccccg tggtgcgcaa actctggccc 960

agggatctgc tgcgctcgag tttctattgg aagatcatcg gctgggatcg aaaatactcc 1020

atcgctgatc gcctggaaga gcgcaaaggc cgcccggcta gggaacgggt ggtccaagac 1080

gtggaagtta cgattgataa actgccagaa tttttgaaat ggttctttga aagcagcgac 1140

atcgagccgc tgtggctgtg cccgatcaag cttcgggagg taccaggtag ttcggttggt 1200

gctggagaaa ttttgagctc cgctgaagca atcgactccg gtgctgctga acacccttgg 1260

ccgctgtatc ccttgaagaa ggacgtgctg tgggtcaaca tcggattctg gtcctcagtg 1320

ccggttgatc tgatgggctc cgatgcacca gagggagcat ttaacagaga aatcgaacgc 1380

gtcatggcag agctaggcgg acataaatcg ctgtactccg aagcgttcta caccagggaa 1440

gactttgaaa aactttatgg cggaaccatc ccggcgctgc taaaaaagca gtgggatccc 1500

cacagccgat tccccggttt gtatgaaaag acagtaaaag gcgcctag 1548

<210> 14

<211> 515

<212> PRT

<213> 谷氨酸棒状杆菌

<400> 14

Met Ser Gly Leu Val Asp Pro Asp Ser Thr Phe Leu Lys Thr Ile Gly

1 5 10 15

Lys Leu Ser Asn Ser Leu Ser Ile Gly Arg Gly Val Asp Gln Lys Glu

20 25 30

Val Ile Pro Lys Gly Trp Asn Ala His Trp Glu Ala Ile Thr Lys Leu

35 40 45

Lys Arg Ser Phe Asp Ala Ile Pro Ala Gly Glu Arg Val Arg Leu Ala

50 55 60

Lys Lys Thr Ser Asn Leu Phe Arg Gly Arg Ser Asp Ala Gly His Gly

65 70 75 80

Leu Asp Val Ala Ala Leu Gly Gly Val Ile Ala Ile Asp Pro Val Asn

85 90 95

Ala Thr Ala Asp Val Gln Gly Met Cys Thr Tyr Glu Asp Leu Val Asp

100 105 110

Ala Thr Leu Ser Tyr Gly Leu Met Pro Leu Val Val Pro Gln Leu Lys

115 120 125

Thr Ile Thr Leu Gly Gly Ala Val Thr Gly Met Gly Val Glu Ser Thr

130 135 140

Ser Phe Arg Asn Gly Leu Pro His Glu Ser Val Leu Glu Met Asp Ile

145 150 155 160

Phe Thr Gly Thr Gly Glu Ile Val Thr Cys Ser Pro Thr Glu Asn Val

165 170 175

Asp Leu Tyr Arg Gly Phe Pro Asn Ser Tyr Gly Ser Leu Gly Tyr Ala

180 185 190

Val Arg Leu Lys Ile Glu Leu Glu Pro Val Gln Asp Tyr Val Gln Leu

195 200 205

Arg His Val Arg Phe Asn Asp Leu Glu Ser Leu Thr Lys Ala Ile Glu

210 215 220

Glu Val Ala Ser Ser Leu Glu Phe Asp Asn Gln Pro Val Asp Tyr Leu

225 230 235 240

Asp Gly Val Val Phe Ser Pro Thr Glu Ala Tyr Leu Val Leu Gly Thr

245 250 255

Gln Thr Ser Gln Pro Gly Pro Thr Ser Asp Tyr Thr Arg Asp Leu Ser

260 265 270

Tyr Tyr Arg Ser Leu Gln His Pro Glu Gly Ile Thr Tyr Asp Arg Leu

275 280 285

Thr Ile Arg Asp Tyr Ile Trp Arg Trp Asp Thr Asp Trp Phe Trp Cys

290 295 300

Ser Arg Ala Phe Gly Thr Gln Asn Pro Val Val Arg Lys Leu Trp Pro

305 310 315 320

Arg Asp Leu Leu Arg Ser Ser Phe Tyr Trp Lys Ile Ile Gly Trp Asp

325 330 335

Arg Lys Tyr Ser Ile Ala Asp Arg Leu Glu Glu Arg Lys Gly Arg Pro

340 345 350

Ala Arg Glu Arg Val Val Gln Asp Val Glu Val Thr Ile Asp Lys Leu

355 360 365

Pro Glu Phe Leu Lys Trp Phe Phe Glu Ser Ser Asp Ile Glu Pro Leu

370 375 380

Trp Leu Cys Pro Ile Lys Leu Arg Glu Val Pro Gly Ser Ser Val Gly

385 390 395 400

Ala Gly Glu Ile Leu Ser Ser Ala Glu Ala Ile Asp Ser Gly Ala Ala

405 410 415

Glu His Pro Trp Pro Leu Tyr Pro Leu Lys Lys Asp Val Leu Trp Val

420 425 430

Asn Ile Gly Phe Trp Ser Ser Val Pro Val Asp Leu Met Gly Ser Asp

435 440 445

Ala Pro Glu Gly Ala Phe Asn Arg Glu Ile Glu Arg Val Met Ala Glu

450 455 460

Leu Gly Gly His Lys Ser Leu Tyr Ser Glu Ala Phe Tyr Thr Arg Glu

465 470 475 480

Asp Phe Glu Lys Leu Tyr Gly Gly Thr Ile Pro Ala Leu Leu Lys Lys

485 490 495

Gln Trp Asp Pro His Ser Arg Phe Pro Gly Leu Tyr Glu Lys Thr Val

500 505 510

Lys Gly Ala

515

<210> 15

<211> 1308

<212> DNA

<213> 谷氨酸棒状杆菌

<400> 15

atgagtaacg ccgtagcgca ggacctcatg accatcgccg acatcgtcga ggccacgacc 60

actgcaccca tcccattcca catcactgcc ttcgatggaa gcttcactgg ccctgaagat 120

gctccctacc agctgtttgt tgccaacacg gatgcagtat cctacatcgc aacagcgcca 180

ggagatttgg gtttggcacg tgcctacctc atgggagacc tcatcgtgga aggtgagcat 240

cccggccatc cttatgggat ctttgatgcg ttgaaggagt tctaccgctg cttcaaacgc 300

ccagatgcat ccaccacctt gcagatcatg tggactctgc ggaaaatgaa tgccttaaaa 360

ttccaggaaa ttccaccaat ggaacaagcc cctgcatggc gtaaagcact gatcaacggg 420

ctagcatcca ggcactcgaa atcccgcgac aagaaagcca ttagctacca ctacgacgtg 480

ggcaatgagt tctactccct gtttttagat gattccatga cctatacctg cgcgtattat 540

ccaacgccag aatcaagttt ggaagaagcc caagaaaaca aataccgcct catctttgaa 600

aaactgcgtc tgaaagaagg cgatcgcctc ctagacgtgg gatgcggttg gggaggcatg 660

gtccgctacg ccgccaaaca cggtgtgaaa gccatcggag ttacgctgtc tgaacagcaa 720

tatgagtggg gtcaagcaga gatcaaacgc caaggtttgg aagacctcgc ggaaattcgc 780

ttcatggatt accgcgatgt tccagaaact ggattcgatg cgatctcagc aatcggcatc 840

attgaacaca tcggtgtgaa caactatccc gactactttg aattgctcag cagcaaactc 900

aaaacaggcg gactgatgct caaccacagc atcacctacc cagacaaccg cccccgccac 960

gcaggtgcat ttattgatcg ctacattttc cccgacggtg aactcactgg ctctggcacc 1020

ctgatcaagc acatgcagga caacggtttc gaagtgctgc acgaagaaaa cctccgcttt 1080

gattaccaac gcaccctgca cgcgtggtgc gaaaacctca aagaaaattg ggaggaagca 1140

gttgaactcg ccggtgaacc cactgcacga ctctttggcc tgtacatggc aggttcggaa 1200

tggggatttg cccacaacat cgtccagctg caccaagtac tgggtgtgaa actcgatgag 1260

cagggaagtc gcggagaagt tcctgaaaga atgtggtgga ctatctaa 1308

<210> 16

<211> 435

<212> PRT

<213> 谷氨酸棒状杆菌

<400> 16

Met Ser Asn Ala Val Ala Gln Asp Leu Met Thr Ile Ala Asp Ile Val

1 5 10 15

Glu Ala Thr Thr Thr Ala Pro Ile Pro Phe His Ile Thr Ala Phe Asp

20 25 30

Gly Ser Phe Thr Gly Pro Glu Asp Ala Pro Tyr Gln Leu Phe Val Ala

35 40 45

Asn Thr Asp Ala Val Ser Tyr Ile Ala Thr Ala Pro Gly Asp Leu Gly

50 55 60

Leu Ala Arg Ala Tyr Leu Met Gly Asp Leu Ile Val Glu Gly Glu His

65 70 75 80

Pro Gly His Pro Tyr Gly Ile Phe Asp Ala Leu Lys Glu Phe Tyr Arg

85 90 95

Cys Phe Lys Arg Pro Asp Ala Ser Thr Thr Leu Gln Ile Met Trp Thr

100 105 110

Leu Arg Lys Met Asn Ala Leu Lys Phe Gln Glu Ile Pro Pro Met Glu

115 120 125

Gln Ala Pro Ala Trp Arg Lys Ala Leu Ile Asn Gly Leu Ala Ser Arg

130 135 140

His Ser Lys Ser Arg Asp Lys Lys Ala Ile Ser Tyr His Tyr Asp Val

145 150 155 160

Gly Asn Glu Phe Tyr Ser Leu Phe Leu Asp Asp Ser Met Thr Tyr Thr

165 170 175

Cys Ala Tyr Tyr Pro Thr Pro Glu Ser Ser Leu Glu Glu Ala Gln Glu

180 185 190

Asn Lys Tyr Arg Leu Ile Phe Glu Lys Leu Arg Leu Lys Glu Gly Asp

195 200 205

Arg Leu Leu Asp Val Gly Cys Gly Trp Gly Gly Met Val Arg Tyr Ala

210 215 220

Ala Lys His Gly Val Lys Ala Ile Gly Val Thr Leu Ser Glu Gln Gln

225 230 235 240

Tyr Glu Trp Gly Gln Ala Glu Ile Lys Arg Gln Gly Leu Glu Asp Leu

245 250 255

Ala Glu Ile Arg Phe Met Asp Tyr Arg Asp Val Pro Glu Thr Gly Phe

260 265 270

Asp Ala Ile Ser Ala Ile Gly Ile Ile Glu His Ile Gly Val Asn Asn

275 280 285

Tyr Pro Asp Tyr Phe Glu Leu Leu Ser Ser Lys Leu Lys Thr Gly Gly

290 295 300

Leu Met Leu Asn His Ser Ile Thr Tyr Pro Asp Asn Arg Pro Arg His

305 310 315 320

Ala Gly Ala Phe Ile Asp Arg Tyr Ile Phe Pro Asp Gly Glu Leu Thr

325 330 335

Gly Ser Gly Thr Leu Ile Lys His Met Gln Asp Asn Gly Phe Glu Val

340 345 350

Leu His Glu Glu Asn Leu Arg Phe Asp Tyr Gln Arg Thr Leu His Ala

355 360 365

Trp Cys Glu Asn Leu Lys Glu Asn Trp Glu Glu Ala Val Glu Leu Ala

370 375 380

Gly Glu Pro Thr Ala Arg Leu Phe Gly Leu Tyr Met Ala Gly Ser Glu

385 390 395 400

Trp Gly Phe Ala His Asn Ile Val Gln Leu His Gln Val Leu Gly Val

405 410 415

Lys Leu Asp Glu Gln Gly Ser Arg Gly Glu Val Pro Glu Arg Met Trp

420 425 430

Trp Thr Ile

435

<210> 17

<211> 1458

<212> DNA

<213> 未知的

<220>

<223> 甘氨酸棒状杆菌

<400> 17

gtgaccgtcg ccggcaggat cactgacgcg gtacgcatag gaaatggact tgaccagcga 60

gatctagccc ccgtcgggtg gtacgcacac gaacaggccg tggcgcgact gaaggccagt 120

ttcgacgcgg tccccgccgg gcgtcgcgtg cggctggcga agaagacgtc caaccttttc 180

cgcgggcgtt ccggcgaggc agtcgggctc gacgtgtcgg ggctgcacgg cgtcatcgcc 240

gtcgaccccg ttgagggcac cgctgacgtc cagggcatgt gcacgtacga ggacctggtg 300

gacgtcctgc tgccctacgg tctggcgccc accgtcgttc cgcagctgaa gaccatcact 360

ctcggcggtg cggtgaccgg catgggggtg gaatccacct ccttccgcaa cggcctgccg 420

cacgaagccg tcctggaaat ggatgtgctc accggtaccg gagacatcct cacctgttcg 480

ccgacccaga acaccgacct ctaccgcggc ttccccaact cctacggttc cctgggatac 540

agcgtgcggc tgaaggtgcg gtgcgaacgg gtggaaccct acgtcgacct gcggcatgta 600

cgcttcgatg acgttcagtc gctcaccgac gccctcgaca acatcgtcgt ggacaaggag 660

tacgagggtg aacgggtcga ctatctcgac ggtgtggtct tcagcctgga ggagagctac 720

ctcgtcctgg gacgggcgac cagcgaggcc ggccccgtta gcgactacac ccgcgagcgc 780

agttactacc gttctctgca gcatccgtcg ggggtcctgc gcgacaagtt gaccatccgc 840

gactacctct ggcggtggga cgtcgactgg ttctggtgca accgggcctt cggtacccag 900

aaccccacca tccgtactct gtggccgcgg gatctcctgc ggtcgagctt ctactggaag 960

atcatcggct gggaccgacg cttcgacatc gcggaccgga tcgaggcaca caacgggcgc 1020

cccgcacgcg agcgcgtcgt ccaggacatc gaggtcaccc ccgacaacct gccggagttc 1080

ctcacgtggt tcttcaccca ctgcgagatc gagccggtgt ggctgtgccc cattcgactg 1140

gccgacgact cgggcgagcg gacaccgtgg cccctgtacc cgctgtcacc cggcgacacc 1200

tgggtcaacg tgggattctg gagctcggtg cccgccgacc tgatggggaa ggacgccccg 1260

accggagcct tcaaccggga ggtggagaga gtcgtctcgg acctcggcgg acacaagtcg 1320

ttgtactccg aggcattcta ttctgaggaa cagttcgccg ccctctacgg cggtgaacgt 1380

cccgcacaac tcaaggcggt cttcgacccg gatgaccggt tccccgggtt gtacgagaag 1440

accgtgggcg gcgtctga 1458

<210> 18

<211> 485

<212> PRT

<213> 未知的

<220>

<223> 甘氨酸棒状杆菌

<400> 18

Val Thr Val Ala Gly Arg Ile Thr Asp Ala Val Arg Ile Gly Asn Gly

1 5 10 15

Leu Asp Gln Arg Asp Leu Ala Pro Val Gly Trp Tyr Ala His Glu Gln

20 25 30

Ala Val Ala Arg Leu Lys Ala Ser Phe Asp Ala Val Pro Ala Gly Arg

35 40 45

Arg Val Arg Leu Ala Lys Lys Thr Ser Asn Leu Phe Arg Gly Arg Ser

50 55 60

Gly Glu Ala Val Gly Leu Asp Val Ser Gly Leu His Gly Val Ile Ala

65 70 75 80

Val Asp Pro Val Glu Gly Thr Ala Asp Val Gln Gly Met Cys Thr Tyr

85 90 95

Glu Asp Leu Val Asp Val Leu Leu Pro Tyr Gly Leu Ala Pro Thr Val

100 105 110

Val Pro Gln Leu Lys Thr Ile Thr Leu Gly Gly Ala Val Thr Gly Met

115 120 125

Gly Val Glu Ser Thr Ser Phe Arg Asn Gly Leu Pro His Glu Ala Val

130 135 140

Leu Glu Met Asp Val Leu Thr Gly Thr Gly Asp Ile Leu Thr Cys Ser

145 150 155 160

Pro Thr Gln Asn Thr Asp Leu Tyr Arg Gly Phe Pro Asn Ser Tyr Gly

165 170 175

Ser Leu Gly Tyr Ser Val Arg Leu Lys Val Arg Cys Glu Arg Val Glu

180 185 190

Pro Tyr Val Asp Leu Arg His Val Arg Phe Asp Asp Val Gln Ser Leu

195 200 205

Thr Asp Ala Leu Asp Asn Ile Val Val Asp Lys Glu Tyr Glu Gly Glu

210 215 220

Arg Val Asp Tyr Leu Asp Gly Val Val Phe Ser Leu Glu Glu Ser Tyr

225 230 235 240

Leu Val Leu Gly Arg Ala Thr Ser Glu Ala Gly Pro Val Ser Asp Tyr

245 250 255

Thr Arg Glu Arg Ser Tyr Tyr Arg Ser Leu Gln His Pro Ser Gly Val

260 265 270

Leu Arg Asp Lys Leu Thr Ile Arg Asp Tyr Leu Trp Arg Trp Asp Val

275 280 285

Asp Trp Phe Trp Cys Asn Arg Ala Phe Gly Thr Gln Asn Pro Thr Ile

290 295 300

Arg Thr Leu Trp Pro Arg Asp Leu Leu Arg Ser Ser Phe Tyr Trp Lys

305 310 315 320

Ile Ile Gly Trp Asp Arg Arg Phe Asp Ile Ala Asp Arg Ile Glu Ala

325 330 335

His Asn Gly Arg Pro Ala Arg Glu Arg Val Val Gln Asp Ile Glu Val

340 345 350

Thr Pro Asp Asn Leu Pro Glu Phe Leu Thr Trp Phe Phe Thr His Cys

355 360 365

Glu Ile Glu Pro Val Trp Leu Cys Pro Ile Arg Leu Ala Asp Asp Ser

370 375 380

Gly Glu Arg Thr Pro Trp Pro Leu Tyr Pro Leu Ser Pro Gly Asp Thr

385 390 395 400

Trp Val Asn Val Gly Phe Trp Ser Ser Val Pro Ala Asp Leu Met Gly

405 410 415

Lys Asp Ala Pro Thr Gly Ala Phe Asn Arg Glu Val Glu Arg Val Val

420 425 430

Ser Asp Leu Gly Gly His Lys Ser Leu Tyr Ser Glu Ala Phe Tyr Ser

435 440 445

Glu Glu Gln Phe Ala Ala Leu Tyr Gly Gly Glu Arg Pro Ala Gln Leu

450 455 460

Lys Ala Val Phe Asp Pro Asp Asp Arg Phe Pro Gly Leu Tyr Glu Lys

465 470 475 480

Thr Val Gly Gly Val

485

<210> 19

<211> 1368

<212> DNA

<213> 未知的

<220>

<223> 甘氨酸棒状杆菌

<400> 19

atgagcaggg gattcacgcc gctgacggtg ggacagatcg tggacaaggt catcacaccg 60

ccggcaccgt tccgggtgac cgctttcgac ggatccaccg cggggccggc agacgcggaa 120

ctggcactgg agatcacatc gccggacgcc ctggcctata tcgtgaccgc gccgggcgac 180

ctcggactgg cacgcgccta catcaccgga agcctccgcg tcaccggtga cgagcccggc 240

cacccgtacc tcgtctttga ccacctccag cacctttacg accagatccg acgcccctcg 300

gcgaaggacc tgctggatat cgcccgctcg ctgaaggcca tgggggcgat caaggtgcag 360

ccggcaccgg agcaggagac cctcccgggc tggaagaggg ccatactcga ggggctgtcc 420

cggcactctc cggaacggga caaggaggtc gtgagccgcc actacgacgt gggcaatgac 480

ttctacgagc tcttcctcgg cgattccatg gcctacacct gtgcctacta tcccgagttt 540

gacggtgaga accaggtcac cggtcccacc ggcgggtggc ggtacgacga ctgggagaaa 600

gggccgaccg ccaacgggcc gttgacccag gcgcaggaca acaagcatcg cctggtcttc 660

gacaagctgc gactcaaccc gggtgaccgg ttgttggacg tcggctgcgg gtggggcggt 720

atggtgcggt acgccgcccg ccacggcgtg aaggccatcg gtgtcacgct gtcccgagag 780

cagtacgagt ggggtaaggc gaagatcgag gaggagggtc tgcaggacct cgccgaggtc 840

cggtgtatgg actaccgtga cgtgccggag tccgacttcg acgcggtcag tgccatcggc 900

atcctcgagc acatcggcgt gcccaactac gaggactact tcacccgcct gttcgccaag 960

ctgcgcccgg gcggtcggat gctgaaccac tgcatcaccc gtccgcacaa ccggaagacg 1020

aagaccggcc agttcatcga ccgctacatc ttccccgacg gtgagctgac cggctcgggc 1080

cggatcatca cgatcatgca ggacaccgga ttcgacgtcg tccacgagga gaatctgcga 1140

ccgcactacc agcgcacgtt gcatgactgg tgtgaactgt tggccaccaa ctgggaccag 1200

gccgtccatc tcgtgggcga ggagacggct cgtctgttcg gcctgtacat ggcggggtcg 1260

gaatggggtt tcgaacacaa cgtgatccag ctccaccagg ttctcggcgt gaagccggac 1320

gcggcaggca gttccggggt gccggtccgc cagtggtgga ggtcctga 1368

<210> 20

<211> 455

<212> PRT

<213> 未知的

<220>

<223> 甘氨酸棒状杆菌

<400> 20

Met Ser Arg Gly Phe Thr Pro Leu Thr Val Gly Gln Ile Val Asp Lys

1 5 10 15

Val Ile Thr Pro Pro Ala Pro Phe Arg Val Thr Ala Phe Asp Gly Ser

20 25 30

Thr Ala Gly Pro Ala Asp Ala Glu Leu Ala Leu Glu Ile Thr Ser Pro

35 40 45

Asp Ala Leu Ala Tyr Ile Val Thr Ala Pro Gly Asp Leu Gly Leu Ala

50 55 60

Arg Ala Tyr Ile Thr Gly Ser Leu Arg Val Thr Gly Asp Glu Pro Gly

65 70 75 80

His Pro Tyr Leu Val Phe Asp His Leu Gln His Leu Tyr Asp Gln Ile

85 90 95

Arg Arg Pro Ser Ala Lys Asp Leu Leu Asp Ile Ala Arg Ser Leu Lys

100 105 110

Ala Met Gly Ala Ile Lys Val Gln Pro Ala Pro Glu Gln Glu Thr Leu

115 120 125

Pro Gly Trp Lys Arg Ala Ile Leu Glu Gly Leu Ser Arg His Ser Pro

130 135 140

Glu Arg Asp Lys Glu Val Val Ser Arg His Tyr Asp Val Gly Asn Asp

145 150 155 160

Phe Tyr Glu Leu Phe Leu Gly Asp Ser Met Ala Tyr Thr Cys Ala Tyr

165 170 175

Tyr Pro Glu Phe Asp Gly Glu Asn Gln Val Thr Gly Pro Thr Gly Gly

180 185 190

Trp Arg Tyr Asp Asp Trp Glu Lys Gly Pro Thr Ala Asn Gly Pro Leu

195 200 205

Thr Gln Ala Gln Asp Asn Lys His Arg Leu Val Phe Asp Lys Leu Arg

210 215 220

Leu Asn Pro Gly Asp Arg Leu Leu Asp Val Gly Cys Gly Trp Gly Gly

225 230 235 240

Met Val Arg Tyr Ala Ala Arg His Gly Val Lys Ala Ile Gly Val Thr

245 250 255

Leu Ser Arg Glu Gln Tyr Glu Trp Gly Lys Ala Lys Ile Glu Glu Glu

260 265 270

Gly Leu Gln Asp Leu Ala Glu Val Arg Cys Met Asp Tyr Arg Asp Val

275 280 285

Pro Glu Ser Asp Phe Asp Ala Val Ser Ala Ile Gly Ile Leu Glu His

290 295 300

Ile Gly Val Pro Asn Tyr Glu Asp Tyr Phe Thr Arg Leu Phe Ala Lys

305 310 315 320

Leu Arg Pro Gly Gly Arg Met Leu Asn His Cys Ile Thr Arg Pro His

325 330 335

Asn Arg Lys Thr Lys Thr Gly Gln Phe Ile Asp Arg Tyr Ile Phe Pro

340 345 350

Asp Gly Glu Leu Thr Gly Ser Gly Arg Ile Ile Thr Ile Met Gln Asp

355 360 365

Thr Gly Phe Asp Val Val His Glu Glu Asn Leu Arg Pro His Tyr Gln

370 375 380

Arg Thr Leu His Asp Trp Cys Glu Leu Leu Ala Thr Asn Trp Asp Gln

385 390 395 400

Ala Val His Leu Val Gly Glu Glu Thr Ala Arg Leu Phe Gly Leu Tyr

405 410 415

Met Ala Gly Ser Glu Trp Gly Phe Glu His Asn Val Ile Gln Leu His

420 425 430

Gln Val Leu Gly Val Lys Pro Asp Ala Ala Gly Ser Ser Gly Val Pro

435 440 445

Val Arg Gln Trp Trp Arg Ser

450 455

<210> 21

<211> 588

<212> DNA

<213> 未知的

<220>

<223> 甘氨酸棒状杆菌

<400> 21

gtggcggtgc tgtgcacacc gttgctgctc ggagcctgca ccatcggcga cgcgggaccg 60

ggggacgaga ccacggaccc tgtcgtggac actgaagcac cgcccgataa accggtgccg 120

gactctgcgg cggaatccgg cgctgaagac ggacctgatt ctgaggtgcc ggacgacccc 180

gaccagcctg atgctgagcc ggtggagact gatcccgacg ccccgggggc ccggggactg 240

gcgatcggtg actgcgtcgc cgacatggac cagctcgacg gcaccggcga catcgacgtc 300

gtcgactgcg ccggccccca tgccggcgag gtgtacgcac aggcggatat cgcaggtaag 360

aacctgttcc ccggcaacga gccgttgggg caggaggcgg gagcgatctg cgggggtgac 420

tccttcaccg gctatgtcgg catcggattc cccgagtcct cgctggacgt cgtcacgatg 480

atgccgtcca aggagagctg ggcgcaggag gaccggacgg tgacctgtgt ggtcaccgac 540

ccgaacctcg agcagatcgc cggcacgctc gagcagagct ggcgttag 588

<210> 22

<211> 195

<212> PRT

<213> 未知的

<220>

<223> 甘氨酸棒状杆菌

<400> 22

Val Ala Val Leu Cys Thr Pro Leu Leu Leu Gly Ala Cys Thr Ile Gly

1 5 10 15

Asp Ala Gly Pro Gly Asp Glu Thr Thr Asp Pro Val Val Asp Thr Glu

20 25 30

Ala Pro Pro Asp Lys Pro Val Pro Asp Ser Ala Ala Glu Ser Gly Ala

35 40 45

Glu Asp Gly Pro Asp Ser Glu Val Pro Asp Asp Pro Asp Gln Pro Asp

50 55 60

Ala Glu Pro Val Glu Thr Asp Pro Asp Ala Pro Gly Ala Arg Gly Leu

65 70 75 80

Ala Ile Gly Asp Cys Val Ala Asp Met Asp Gln Leu Asp Gly Thr Gly

85 90 95

Asp Ile Asp Val Val Asp Cys Ala Gly Pro His Ala Gly Glu Val Tyr

100 105 110

Ala Gln Ala Asp Ile Ala Gly Lys Asn Leu Phe Pro Gly Asn Glu Pro

115 120 125

Leu Gly Gln Glu Ala Gly Ala Ile Cys Gly Gly Asp Ser Phe Thr Gly

130 135 140

Tyr Val Gly Ile Gly Phe Pro Glu Ser Ser Leu Asp Val Val Thr Met

145 150 155 160

Met Pro Ser Lys Glu Ser Trp Ala Gln Glu Asp Arg Thr Val Thr Cys

165 170 175

Val Val Thr Asp Pro Asn Leu Glu Gln Ile Ala Gly Thr Leu Glu Gln

180 185 190

Ser Trp Arg

195

<210> 23

<211> 1395

<212> DNA

<213> 未知的

<220>

<223> 气生诺尔氏菌

<400> 23

atgagcatgg accggaccgg accggccagg gtgcggaccg tgggggagcg gcggctgctc 60

gagagcttcg ccgccgtccc cccgggcgaa cgcgtgcggc tggccaagcg cacgtccaac 120

ctcttccgcg cccgggaggg cacctcgaca cgcgggctcg acacgagcgg actgaccggc 180

gtgcgcgtgg tcgacgcagg caccctcacg gccgacgtcg acggaatgtg cacgtacgag 240

gacctcgtcg ccgcaacgct gccgctcggg ctcgcgccgc tcgtcgtgcc ccagctgcgg 300

accatcaccg tcggcggggc ggtcaccggt ctcgggatcg agtcgacgtc gttccgcaac 360

gggttgccgc acgagtccgt cctcgagatg gacgtcctca cgggtgccgg cgagatcgtc 420

actgccacag cggacaacga gcacgccgac ctcttccgcg gcttccccaa ctcctacggg 480

tcgctgggct acgcgacgtg cctgcgcatc gagctcgagc gtgtgggtac ctgtgtggag 540

gtgaggcacg tccgcttcca cgacctcgac gccctgtgcg ccgccatcgc cgaggtcgtg 600

gcgacgagat cgcacgaggg cgaggaggtc gaccacgtgg acggggtggt cttctcccgc 660

gacgaggcgt acctcacgct gggtcgtcac tccgaccgga ccggaccgac cagcgactac 720

accgggcagc aggtctacta ccggtcgatc cagcacgacg gcccctctcc acggcgcgac 780

ctgctcacca ctcacgacta cctctggcgc tgggacaccg actggttctg gtgctcgcgc 840

gccttcgggg cccaggaccc gcgcgtccgg cggtggtggc cgcgccggtg gcgccggtcg 900

agcgtgtact ggaggctcgt ggcggcggac cggcgcgtcg ggttctcgga ccgcctcgag 960

gcacgtcggg gcaacccgcc gcgggagcgg gtggtccagg acgtcgagat cccgctcggg 1020

cagaccgcgg ccttcctcca ctggttcctc gacgaggtgc cgatcgaacc gatctggctg 1080

tgcccgttgc gtcttcgcga ccatcagagg tggccgctct atccgctcga gcccggacgc 1140

acctacgtca acgtggggtt ctggtcgacc gtgccggggc ccggaccggg cgaggagctg 1200

ggcgccacca accgcgccat cgagcgccgt gtcgacgagg tcggcggcca caagtccctg 1260

tactccgact cctactactc ccggtccgac ttcgacgccc tctacggcgg ggacgcgtat 1320

gccgtgctga aggccaccta cgacccggac gggcggttcc ctcacctcta cgacaaggcg 1380

gtgcgacacg catga 1395

<210> 24

<211> 464

<212> PRT

<213> 未知的

<220>

<223> 气生诺尔氏菌

<400> 24

Met Ser Met Asp Arg Thr Gly Pro Ala Arg Val Arg Thr Val Gly Glu

1 5 10 15

Arg Arg Leu Leu Glu Ser Phe Ala Ala Val Pro Pro Gly Glu Arg Val

20 25 30

Arg Leu Ala Lys Arg Thr Ser Asn Leu Phe Arg Ala Arg Glu Gly Thr

35 40 45

Ser Thr Arg Gly Leu Asp Thr Ser Gly Leu Thr Gly Val Arg Val Val

50 55 60

Asp Ala Gly Thr Leu Thr Ala Asp Val Asp Gly Met Cys Thr Tyr Glu

65 70 75 80

Asp Leu Val Ala Ala Thr Leu Pro Leu Gly Leu Ala Pro Leu Val Val

85 90 95

Pro Gln Leu Arg Thr Ile Thr Val Gly Gly Ala Val Thr Gly Leu Gly

100 105 110

Ile Glu Ser Thr Ser Phe Arg Asn Gly Leu Pro His Glu Ser Val Leu

115 120 125

Glu Met Asp Val Leu Thr Gly Ala Gly Glu Ile Val Thr Ala Thr Ala

130 135 140

Asp Asn Glu His Ala Asp Leu Phe Arg Gly Phe Pro Asn Ser Tyr Gly

145 150 155 160

Ser Leu Gly Tyr Ala Thr Cys Leu Arg Ile Glu Leu Glu Arg Val Gly

165 170 175

Thr Cys Val Glu Val Arg His Val Arg Phe His Asp Leu Asp Ala Leu

180 185 190

Cys Ala Ala Ile Ala Glu Val Val Ala Thr Arg Ser His Glu Gly Glu

195 200 205

Glu Val Asp His Val Asp Gly Val Val Phe Ser Arg Asp Glu Ala Tyr

210 215 220

Leu Thr Leu Gly Arg His Ser Asp Arg Thr Gly Pro Thr Ser Asp Tyr

225 230 235 240

Thr Gly Gln Gln Val Tyr Tyr Arg Ser Ile Gln His Asp Gly Pro Ser

245 250 255

Pro Arg Arg Asp Leu Leu Thr Thr His Asp Tyr Leu Trp Arg Trp Asp

260 265 270

Thr Asp Trp Phe Trp Cys Ser Arg Ala Phe Gly Ala Gln Asp Pro Arg

275 280 285

Val Arg Arg Trp Trp Pro Arg Arg Trp Arg Arg Ser Ser Val Tyr Trp

290 295 300

Arg Leu Val Ala Ala Asp Arg Arg Val Gly Phe Ser Asp Arg Leu Glu

305 310 315 320

Ala Arg Arg Gly Asn Pro Pro Arg Glu Arg Val Val Gln Asp Val Glu

325 330 335

Ile Pro Leu Gly Gln Thr Ala Ala Phe Leu His Trp Phe Leu Asp Glu

340 345 350

Val Pro Ile Glu Pro Ile Trp Leu Cys Pro Leu Arg Leu Arg Asp His

355 360 365

Gln Arg Trp Pro Leu Tyr Pro Leu Glu Pro Gly Arg Thr Tyr Val Asn

370 375 380

Val Gly Phe Trp Ser Thr Val Pro Gly Pro Gly Pro Gly Glu Glu Leu

385 390 395 400

Gly Ala Thr Asn Arg Ala Ile Glu Arg Arg Val Asp Glu Val Gly Gly

405 410 415

His Lys Ser Leu Tyr Ser Asp Ser Tyr Tyr Ser Arg Ser Asp Phe Asp

420 425 430

Ala Leu Tyr Gly Gly Asp Ala Tyr Ala Val Leu Lys Ala Thr Tyr Asp

435 440 445

Pro Asp Gly Arg Phe Pro His Leu Tyr Asp Lys Ala Val Arg His Ala

450 455 460

<210> 25

<211> 1284

<212> DNA

<213> 未知的

<220>

<223> 气生诺尔氏菌

<400> 25

atgagccaca cgaccgatga gatccgcacg gtcgccgacc tcgtcgacga ggtggtcgtc 60

ggcccgctgc cggtgcgggt cacggcctac gacgggtcga agacggggcc ggacagcgcc 120

ccgcgaacca tccacatcgc caaccagcga gcggtcgcct acctcgccac cgcgcccggg 180

gacctcggca tggcccgcgc ctacaccacc ggtgacctcg tcgtcgaggg cgtgcacccg 240

ggcaacccct acgaggccct ggtcgacctc gaacgtgtgc acttccgccg cccggacccg 300

cggctgctcc tcgacctcgc gcgcatcgtc gggccacgca acctcgcgcc cccgcccccg 360

ccgccgcagg aggctgtgcc gaggtggcgg cgggtggccg agggcctgcg ccactcgtac 420

gggcgggaca gcgaggcgat ccgccaccac tacgacgtct ccaaccactt ctacgagcag 480

gtgctcggcc cgagcatgac ctacacctgc gcggtcttcc ccgaccacga caccgggctc 540

gacgaggcgc aggaggagaa gtaccgcctc gtcttcgaga agctcgcgct gcgtcccggt 600

gaccggttgc tcgacatcgg ctgcgggtgg ggcgggatgg tccggtacgc cgcacggcgg 660

ggggtgcgag cgctcggcgt gacactgtcc ggtgagcagg cggcgtgggc acaggtcgcc 720

atcgcccgcg aggggctggg ggagctcgcc gccgtccggc acgaggacta ccgccacgtc 780

gccgagaccg ggttcgacgc catctcctcg atcggcatca ccgagcacat cggggtgcgc 840

aactacccca cgtacttcga ctggatgctc caccacgtca agccgggagg gctcgtgctc 900

aaccactgca tcaccagacc cgagaaccgg gccaagagcg tcggccggtt catcgaccgc 960

tacatcttcc ccgacggcga gctcaccggg tccggccgga tcatcacgac catgcaggac 1020

aacggtttcg aggtcgtgca ctccgagaac ctgcgagagc actacgccct caccctggcg 1080

gcctggggcg agaacctcgt cgagcactgg gcctcctgcg tggccgacgt gggggagggg 1140

acggcgaagg tctggggcct ctacctcgcg ggctcgcgtc gtggcttcga gcgcaacgtc 1200

gtccagctgc accaggtgct ggccgcgagg ccggtgccgt cccgactccc gcaggtgccg 1260

ctgcgccagt ggtggacctc gtga 1284

<210> 26

<211> 427

<212> PRT

<213> 未知的

<220>

<223> 气生诺尔氏菌

<400> 26

Met Ser His Thr Thr Asp Glu Ile Arg Thr Val Ala Asp Leu Val Asp

1 5 10 15

Glu Val Val Val Gly Pro Leu Pro Val Arg Val Thr Ala Tyr Asp Gly

20 25 30

Ser Lys Thr Gly Pro Asp Ser Ala Pro Arg Thr Ile His Ile Ala Asn

35 40 45

Gln Arg Ala Val Ala Tyr Leu Ala Thr Ala Pro Gly Asp Leu Gly Met

50 55 60

Ala Arg Ala Tyr Thr Thr Gly Asp Leu Val Val Glu Gly Val His Pro

65 70 75 80

Gly Asn Pro Tyr Glu Ala Leu Val Asp Leu Glu Arg Val His Phe Arg

85 90 95

Arg Pro Asp Pro Arg Leu Leu Leu Asp Leu Ala Arg Ile Val Gly Pro

100 105 110

Arg Asn Leu Ala Pro Pro Pro Pro Pro Pro Gln Glu Ala Val Pro Arg

115 120 125

Trp Arg Arg Val Ala Glu Gly Leu Arg His Ser Tyr Gly Arg Asp Ser

130 135 140

Glu Ala Ile Arg His His Tyr Asp Val Ser Asn His Phe Tyr Glu Gln

145 150 155 160

Val Leu Gly Pro Ser Met Thr Tyr Thr Cys Ala Val Phe Pro Asp His

165 170 175

Asp Thr Gly Leu Asp Glu Ala Gln Glu Glu Lys Tyr Arg Leu Val Phe

180 185 190

Glu Lys Leu Ala Leu Arg Pro Gly Asp Arg Leu Leu Asp Ile Gly Cys

195 200 205

Gly Trp Gly Gly Met Val Arg Tyr Ala Ala Arg Arg Gly Val Arg Ala

210 215 220

Leu Gly Val Thr Leu Ser Gly Glu Gln Ala Ala Trp Ala Gln Val Ala

225 230 235 240

Ile Ala Arg Glu Gly Leu Gly Glu Leu Ala Ala Val Arg His Glu Asp

245 250 255

Tyr Arg His Val Ala Glu Thr Gly Phe Asp Ala Ile Ser Ser Ile Gly

260 265 270

Ile Thr Glu His Ile Gly Val Arg Asn Tyr Pro Thr Tyr Phe Asp Trp

275 280 285

Met Leu His His Val Lys Pro Gly Gly Leu Val Leu Asn His Cys Ile

290 295 300

Thr Arg Pro Glu Asn Arg Ala Lys Ser Val Gly Arg Phe Ile Asp Arg

305 310 315 320

Tyr Ile Phe Pro Asp Gly Glu Leu Thr Gly Ser Gly Arg Ile Ile Thr

325 330 335

Thr Met Gln Asp Asn Gly Phe Glu Val Val His Ser Glu Asn Leu Arg

340 345 350

Glu His Tyr Ala Leu Thr Leu Ala Ala Trp Gly Glu Asn Leu Val Glu

355 360 365

His Trp Ala Ser Cys Val Ala Asp Val Gly Glu Gly Thr Ala Lys Val

370 375 380

Trp Gly Leu Tyr Leu Ala Gly Ser Arg Arg Gly Phe Glu Arg Asn Val

385 390 395 400

Val Gln Leu His Gln Val Leu Ala Ala Arg Pro Val Pro Ser Arg Leu

405 410 415

Pro Gln Val Pro Leu Arg Gln Trp Trp Thr Ser

420 425

<210> 27

<211> 1392

<212> DNA

<213> 南非分枝杆菌

<400> 27

gtgtctgttc cttcgaccga cgcacgttct gctcacgccg acggcgtgca gcggcttctc 60

gccagctatc gggcgattcc ccaagacgcc acggtccggc tggccaaacc cacgtcgaac 120

ctcttccgtg cccgcgcgaa aaccaggacc aagggtctgg acacgtctgg gttgacgaac 180

gtgatcgcgg tcgacgcgga ggcacgcacc gccgatgtgg cagggatgtg cacctacgaa 240

gacctggtcg cggccacgct gccgcatgga ctttcgccgc tggtggtgcc gcagttgaag 300

acgatcaccc tcggcggggc ggtcaccgga ctcgggatcg agtccgcctc gttccgcaac 360

ggcctgccac acgaatcggt tctcgagatg gacgtcctca ccggcaccgg tgatgtcgtg 420

cgcgcctccc ccgacgagaa ccctgacctg tttcgggcgt ttccgaattc ctatggcacg 480

ttgggctatt cggttcggct caagatcgag ctggaaccgg tgaagccgtt cgtcgcgctg 540

cgccacctcc gtttccattc gctgtcggct ctcatcgagg cgatggaccg catcgtcgaa 600

accggcggcc tcaacggcga accggtggac tacctcgacg gcgtcgtgtt cagtgccgag 660

gagagttacc tgtgcgtggg gcagcgctcc gcgacaccgg gcccggtcag cgactacacg 720

ggcaagcaga tctactaccg ctcgattcag cacgacggcc cgaccgatgg cgccgagaag 780

cacgaccggc tgaccatcca cgactacctg tggcgctggg acaccgactg gttctggtgc 840

tcaagggcat tcggcgcgca gaacccgcgg atccggcgct ggtggccgcg ccggtaccgg 900

cgcagcagtg tgtactggaa gctgatcggc tacgaccggc gtttcggtat cgccgatcgc 960

atcgagaagc gcaacggccg acccccgcgc gagcgggtgg tccaggacat cgaggtgccc 1020

atcgagcgga ccgtcgagtt tctgcagtgg tttctcgaca ccgtgcccat cgaaccgatc 1080

tggttgtgcc cgttgcggct ccgcgacgac cgcgattggc ccctgtatcc gatccgaccc 1140

caccacacct acgtcaacgt gggtttctgg tcgtcggtgc cggtgggccc ggaggagggc 1200

tacaccaaca ggatgatcga acggaaagtc agcgacctcg acggtcacaa atcgctgtat 1260

tccgatgcgt actactcgcc ggaagagttt gattcgctct atggcgggga gacgtacaag 1320

acggtgaaga agacatacga cccagactct cgtttcctgg acctgtacgg caaagcagtg 1380

gggcggcaat ga 1392

<210> 28

<211> 463

<212> PRT

<213> 南非分枝杆菌

<400> 28

Val Ser Val Pro Ser Thr Asp Ala Arg Ser Ala His Ala Asp Gly Val

1 5 10 15

Gln Arg Leu Leu Ala Ser Tyr Arg Ala Ile Pro Gln Asp Ala Thr Val

20 25 30

Arg Leu Ala Lys Pro Thr Ser Asn Leu Phe Arg Ala Arg Ala Lys Thr

35 40 45

Arg Thr Lys Gly Leu Asp Thr Ser Gly Leu Thr Asn Val Ile Ala Val

50 55 60

Asp Ala Glu Ala Arg Thr Ala Asp Val Ala Gly Met Cys Thr Tyr Glu

65 70 75 80

Asp Leu Val Ala Ala Thr Leu Pro His Gly Leu Ser Pro Leu Val Val

85 90 95

Pro Gln Leu Lys Thr Ile Thr Leu Gly Gly Ala Val Thr Gly Leu Gly

100 105 110

Ile Glu Ser Ala Ser Phe Arg Asn Gly Leu Pro His Glu Ser Val Leu

115 120 125

Glu Met Asp Val Leu Thr Gly Thr Gly Asp Val Val Arg Ala Ser Pro

130 135 140

Asp Glu Asn Pro Asp Leu Phe Arg Ala Phe Pro Asn Ser Tyr Gly Thr

145 150 155 160

Leu Gly Tyr Ser Val Arg Leu Lys Ile Glu Leu Glu Pro Val Lys Pro

165 170 175

Phe Val Ala Leu Arg His Leu Arg Phe His Ser Leu Ser Ala Leu Ile

180 185 190

Glu Ala Met Asp Arg Ile Val Glu Thr Gly Gly Leu Asn Gly Glu Pro

195 200 205

Val Asp Tyr Leu Asp Gly Val Val Phe Ser Ala Glu Glu Ser Tyr Leu

210 215 220

Cys Val Gly Gln Arg Ser Ala Thr Pro Gly Pro Val Ser Asp Tyr Thr

225 230 235 240

Gly Lys Gln Ile Tyr Tyr Arg Ser Ile Gln His Asp Gly Pro Thr Asp

245 250 255

Gly Ala Glu Lys His Asp Arg Leu Thr Ile His Asp Tyr Leu Trp Arg

260 265 270

Trp Asp Thr Asp Trp Phe Trp Cys Ser Arg Ala Phe Gly Ala Gln Asn

275 280 285

Pro Arg Ile Arg Arg Trp Trp Pro Arg Arg Tyr Arg Arg Ser Ser Val

290 295 300

Tyr Trp Lys Leu Ile Gly Tyr Asp Arg Arg Phe Gly Ile Ala Asp Arg

305 310 315 320

Ile Glu Lys Arg Asn Gly Arg Pro Pro Arg Glu Arg Val Val Gln Asp

325 330 335

Ile Glu Val Pro Ile Glu Arg Thr Val Glu Phe Leu Gln Trp Phe Leu

340 345 350

Asp Thr Val Pro Ile Glu Pro Ile Trp Leu Cys Pro Leu Arg Leu Arg

355 360 365

Asp Asp Arg Asp Trp Pro Leu Tyr Pro Ile Arg Pro His His Thr Tyr

370 375 380

Val Asn Val Gly Phe Trp Ser Ser Val Pro Val Gly Pro Glu Glu Gly

385 390 395 400

Tyr Thr Asn Arg Met Ile Glu Arg Lys Val Ser Asp Leu Asp Gly His

405 410 415

Lys Ser Leu Tyr Ser Asp Ala Tyr Tyr Ser Pro Glu Glu Phe Asp Ser

420 425 430

Leu Tyr Gly Gly Glu Thr Tyr Lys Thr Val Lys Lys Thr Tyr Asp Pro

435 440 445

Asp Ser Arg Phe Leu Asp Leu Tyr Gly Lys Ala Val Gly Arg Gln

450 455 460

<210> 29

<211> 1323

<212> DNA

<213> 南非分枝杆菌

<400> 29

ttgacgacat ttcgggacgg cgcggccgac accggcctgc acggagaccg caagctcacc 60

ctggcggagg tcttggaggt cttcgcctcg ggccgactgc ctctgaagtt cacggcgtac 120

gacggcagca gcgcgggccc ggacgacgcc acgctcgggc tggacctgct gaccccccgc 180

gggaccacgt acctcgcaac ggctcccggc gatctcggcc tggcccgggc ctacgtctcc 240

ggtgacctgc agttgcaggg ggtgcaccct ggcgacccgt acgacctgct caacgcactg 300

gtgcagaaac tggacttcaa gcgaccgtcc gcccgggtgc tggcgcaggt cgtccgatcg 360

atcgggatcg agcacctgaa accgatcgcg ccaccgccgc aggaggcgct gccgcggtgg 420

cggcgcatcg cagaaggact gcggcacagc aagacccgtg acgccgacgc gatccaccac 480

cattacgatg tctccaacac cttctacgag tgggtgctcg ggccgtcgat gacctacacc 540

tgcgcctgct acccgcatcc cgacgccacc ctcgaggagg cgcaggagaa caaatatcgg 600

ctggtgttcg agaaactgcg cctcaagccg ggcgaccgcc ttctcgacgt gggttgcggg 660

tggggcggaa tggtgcgcta cgcggcccgt cacggcgtca aggcgatcgg ggtgacgctg 720

tccagggagc aggcgcagtg ggcacgcgcc gccatcgaac gggacggcct gggtgacctc 780

gccgaggtcc gccacagcga ctaccgcgat gtgcgcgagt cccagttcga cgccgtgtct 840

tcgctggggc tcaccgagca catcggggtc gccaactatc cgtcgtactt ccggttcctc 900

aagtcgaagt tgcgcccggg cggcctactg ctcaaccact gcatcacccg gcacaacaat 960

cgcaccggcc ccgccgccgg gggattcatc gaccggtatg tgttcccgga cggggagctg 1020

accggatcgg gccggatcat caccgagatc caggacgtcg gtttggaggt gatgcacgaa 1080

gagaacctgc gccggcacta tgcgctgaca cttcgggact ggtgccggaa tctggtgcag 1140

cactgggacg aagcggtcgc agaggtcggc ctgcccaccg ccaaggtgtg gggtctgtac 1200

atggctgcct cgcgggtcgg cttcgagcag aacagcattc agctgcatca ggtactggcg 1260

gtgaagctcg acgaacgtgg cggggacggc ggtttgccgt tgcggccctg gtggaccgcg 1320

tag 1323

<210> 30

<211> 440

<212> PRT

<213> 南非分枝杆菌

<400> 30

Leu Thr Thr Phe Arg Asp Gly Ala Ala Asp Thr Gly Leu His Gly Asp

1 5 10 15

Arg Lys Leu Thr Leu Ala Glu Val Leu Glu Val Phe Ala Ser Gly Arg

20 25 30

Leu Pro Leu Lys Phe Thr Ala Tyr Asp Gly Ser Ser Ala Gly Pro Asp

35 40 45

Asp Ala Thr Leu Gly Leu Asp Leu Leu Thr Pro Arg Gly Thr Thr Tyr

50 55 60

Leu Ala Thr Ala Pro Gly Asp Leu Gly Leu Ala Arg Ala Tyr Val Ser

65 70 75 80

Gly Asp Leu Gln Leu Gln Gly Val His Pro Gly Asp Pro Tyr Asp Leu

85 90 95

Leu Asn Ala Leu Val Gln Lys Leu Asp Phe Lys Arg Pro Ser Ala Arg

100 105 110

Val Leu Ala Gln Val Val Arg Ser Ile Gly Ile Glu His Leu Lys Pro

115 120 125

Ile Ala Pro Pro Pro Gln Glu Ala Leu Pro Arg Trp Arg Arg Ile Ala

130 135 140

Glu Gly Leu Arg His Ser Lys Thr Arg Asp Ala Asp Ala Ile His His

145 150 155 160

His Tyr Asp Val Ser Asn Thr Phe Tyr Glu Trp Val Leu Gly Pro Ser

165 170 175

Met Thr Tyr Thr Cys Ala Cys Tyr Pro His Pro Asp Ala Thr Leu Glu

180 185 190

Glu Ala Gln Glu Asn Lys Tyr Arg Leu Val Phe Glu Lys Leu Arg Leu

195 200 205

Lys Pro Gly Asp Arg Leu Leu Asp Val Gly Cys Gly Trp Gly Gly Met

210 215 220

Val Arg Tyr Ala Ala Arg His Gly Val Lys Ala Ile Gly Val Thr Leu

225 230 235 240

Ser Arg Glu Gln Ala Gln Trp Ala Arg Ala Ala Ile Glu Arg Asp Gly

245 250 255

Leu Gly Asp Leu Ala Glu Val Arg His Ser Asp Tyr Arg Asp Val Arg

260 265 270

Glu Ser Gln Phe Asp Ala Val Ser Ser Leu Gly Leu Thr Glu His Ile

275 280 285

Gly Val Ala Asn Tyr Pro Ser Tyr Phe Arg Phe Leu Lys Ser Lys Leu

290 295 300

Arg Pro Gly Gly Leu Leu Leu Asn His Cys Ile Thr Arg His Asn Asn

305 310 315 320

Arg Thr Gly Pro Ala Ala Gly Gly Phe Ile Asp Arg Tyr Val Phe Pro

325 330 335

Asp Gly Glu Leu Thr Gly Ser Gly Arg Ile Ile Thr Glu Ile Gln Asp

340 345 350

Val Gly Leu Glu Val Met His Glu Glu Asn Leu Arg Arg His Tyr Ala

355 360 365

Leu Thr Leu Arg Asp Trp Cys Arg Asn Leu Val Gln His Trp Asp Glu

370 375 380

Ala Val Ala Glu Val Gly Leu Pro Thr Ala Lys Val Trp Gly Leu Tyr

385 390 395 400

Met Ala Ala Ser Arg Val Gly Phe Glu Gln Asn Ser Ile Gln Leu His

405 410 415

Gln Val Leu Ala Val Lys Leu Asp Glu Arg Gly Gly Asp Gly Gly Leu

420 425 430

Pro Leu Arg Pro Trp Trp Thr Ala

435 440

<210> 31

<211> 381

<212> DNA

<213> 南非分枝杆菌

<400> 31

gtgatccgct ttctgctgcg cgtcgcggtc tttctcggat cgtcggcgat cgggctactg 60

gtggccggct ggctggtgcc gggggtgtcg ctgtcggtgc tgggcttcgt caccgcggtg 120

gtgatcttca cggtggcaca agggattctg tcgccgttct tcctgaagat ggccagccgc 180

tacgcgtcgg ccttcctcgg cggcatcggc ctggtgtcca cgttcgtggc gctgctgctc 240

gcgtcgctgc tgtccaacgg gctcagcatc cgcggcgtcg ggtcgtggat cgcggccacg 300

gtggtggtct ggctggtcac agccctggcg accgtcgtgc tgcccgttct ggtgctgcgg 360

gagaagaaga aagcagcctg a 381

<210> 32

<211> 126

<212> PRT

<213> 南非分枝杆菌

<400> 32

Val Ile Arg Phe Leu Leu Arg Val Ala Val Phe Leu Gly Ser Ser Ala

1 5 10 15

Ile Gly Leu Leu Val Ala Gly Trp Leu Val Pro Gly Val Ser Leu Ser

20 25 30

Val Leu Gly Phe Val Thr Ala Val Val Ile Phe Thr Val Ala Gln Gly

35 40 45

Ile Leu Ser Pro Phe Phe Leu Lys Met Ala Ser Arg Tyr Ala Ser Ala

50 55 60

Phe Leu Gly Gly Ile Gly Leu Val Ser Thr Phe Val Ala Leu Leu Leu

65 70 75 80

Ala Ser Leu Leu Ser Asn Gly Leu Ser Ile Arg Gly Val Gly Ser Trp

85 90 95

Ile Ala Ala Thr Val Val Val Trp Leu Val Thr Ala Leu Ala Thr Val

100 105 110

Val Leu Pro Val Leu Val Leu Arg Glu Lys Lys Lys Ala Ala

115 120 125

<210> 33

<211> 1392

<212> DNA

<213> 淡黄分枝杆菌

<400> 33

gtgtctgttg ccgtaaccga cgcacgatcc gcctacgccc acggcgtgca gcggctggtc 60

gcgagttacc gcgccatccc cgccggcgcc accgtccgcc tggccaaacc cacgtccaac 120

ctgttccgcg ccagggcgaa gagcaccgcg gcgggcctcg acacctccgg cctgacacat 180

gtgatcgccg tggaccccga gacgcgcacc gccgaggtcg cggggatgtg cacctacgag 240

gacctggtgg cggcgacgct gccccacggg ctttcaccgc tggtggtccc gcaactcaag 300

acgatcaccc tcggcggcgc cgtcaccggg ctcggcatcg agtcggcgtc gttccgcaac 360

ggccttccgc acgaatcggt cctggagatg gacatcctca ccgggaccgg cgacatcgtg 420

cgcgccgcgc ccgacgagaa tcccgacctt ttccgcacct tcccgaattc ttatggaacg 480

ctgggttact cggttcggct gaagatcgag ctggagccgg tgaagccgtt cgtggcgtta 540

cgccatctcc gcttccactc actgtcgaca ctcatcgcga cgatggaccg catcgtcgac 600

accgggagtc tcgacggtga gcaggtcgac tatctcgacg gagtggtgtt cagcgccgag 660

gagagctacc tgtgcgtcgg aacacgttcc gcgacaccgg gtcctgtcag cgactacacc 720

ggcgagcaca tcttctaccg gtcgatccag cacgattgcc cgaccgaagg cggacagaag 780

cacgaccggc tgacggcgca cgactacttc tggcgctggg acaccgactg gttctggtgc 840

tcaagggcat tcggcgcgca gaacccgaag gtccgtcggt ggtggccccg acggctccgg 900

cgcagcagct tctactggaa gctcgtcggc tacgaccagc gtttcggcat cgccgaccgg 960

atcgagaaac accacggccg gccaccgcgc gaacgcgtcg tccaggacgt cgaggtcccc 1020

atcgagcgca ccgtcgaatt cctgcagtgg ttcctcgaca cgatcccgat agagccgctc 1080

tggttgtgcc cgttgcgact tcgcgatgac aacagctggt cgctgtaccc gctccggccc 1140

catcgcacgt atgtcaacgt gggattctgg tcgtcggtgc ccgtcgggcc ggaggagggt 1200

cacaccaaca agctgatcga acgcaggatc agcgagctgg agggacacaa gtcgctgtac 1260

tccgacgcct tctattcggc cgacgagttc gacgcgctgt acggcggcga gatctaccgg 1320

accgtgaaga agacctacga cccagattct cgtttcctcg acctctatgc gaaggcggtg 1380

cgacggcaat ga 1392

<210> 34

<211> 463

<212> PRT

<213> 淡黄分枝杆菌

<400> 34

Val Ser Val Ala Val Thr Asp Ala Arg Ser Ala Tyr Ala His Gly Val

1 5 10 15

Gln Arg Leu Val Ala Ser Tyr Arg Ala Ile Pro Ala Gly Ala Thr Val

20 25 30

Arg Leu Ala Lys Pro Thr Ser Asn Leu Phe Arg Ala Arg Ala Lys Ser

35 40 45

Thr Ala Ala Gly Leu Asp Thr Ser Gly Leu Thr His Val Ile Ala Val

50 55 60

Asp Pro Glu Thr Arg Thr Ala Glu Val Ala Gly Met Cys Thr Tyr Glu

65 70 75 80

Asp Leu Val Ala Ala Thr Leu Pro His Gly Leu Ser Pro Leu Val Val

85 90 95

Pro Gln Leu Lys Thr Ile Thr Leu Gly Gly Ala Val Thr Gly Leu Gly

100 105 110

Ile Glu Ser Ala Ser Phe Arg Asn Gly Leu Pro His Glu Ser Val Leu

115 120 125

Glu Met Asp Ile Leu Thr Gly Thr Gly Asp Ile Val Arg Ala Ala Pro

130 135 140

Asp Glu Asn Pro Asp Leu Phe Arg Thr Phe Pro Asn Ser Tyr Gly Thr

145 150 155 160

Leu Gly Tyr Ser Val Arg Leu Lys Ile Glu Leu Glu Pro Val Lys Pro

165 170 175

Phe Val Ala Leu Arg His Leu Arg Phe His Ser Leu Ser Thr Leu Ile

180 185 190

Ala Thr Met Asp Arg Ile Val Asp Thr Gly Ser Leu Asp Gly Glu Gln

195 200 205

Val Asp Tyr Leu Asp Gly Val Val Phe Ser Ala Glu Glu Ser Tyr Leu

210 215 220

Cys Val Gly Thr Arg Ser Ala Thr Pro Gly Pro Val Ser Asp Tyr Thr

225 230 235 240

Gly Glu His Ile Phe Tyr Arg Ser Ile Gln His Asp Cys Pro Thr Glu

245 250 255

Gly Gly Gln Lys His Asp Arg Leu Thr Ala His Asp Tyr Phe Trp Arg

260 265 270

Trp Asp Thr Asp Trp Phe Trp Cys Ser Arg Ala Phe Gly Ala Gln Asn

275 280 285

Pro Lys Val Arg Arg Trp Trp Pro Arg Arg Leu Arg Arg Ser Ser Phe

290 295 300

Tyr Trp Lys Leu Val Gly Tyr Asp Gln Arg Phe Gly Ile Ala Asp Arg

305 310 315 320

Ile Glu Lys His His Gly Arg Pro Pro Arg Glu Arg Val Val Gln Asp

325 330 335

Val Glu Val Pro Ile Glu Arg Thr Val Glu Phe Leu Gln Trp Phe Leu

340 345 350

Asp Thr Ile Pro Ile Glu Pro Leu Trp Leu Cys Pro Leu Arg Leu Arg

355 360 365

Asp Asp Asn Ser Trp Ser Leu Tyr Pro Leu Arg Pro His Arg Thr Tyr

370 375 380

Val Asn Val Gly Phe Trp Ser Ser Val Pro Val Gly Pro Glu Glu Gly

385 390 395 400

His Thr Asn Lys Leu Ile Glu Arg Arg Ile Ser Glu Leu Glu Gly His

405 410 415

Lys Ser Leu Tyr Ser Asp Ala Phe Tyr Ser Ala Asp Glu Phe Asp Ala

420 425 430

Leu Tyr Gly Gly Glu Ile Tyr Arg Thr Val Lys Lys Thr Tyr Asp Pro

435 440 445

Asp Ser Arg Phe Leu Asp Leu Tyr Ala Lys Ala Val Arg Arg Gln

450 455 460

<210> 35

<211> 1323

<212> DNA

<213> 淡黄分枝杆菌

<400> 35

atgacgactt ttcgggaaca taccgacagt tcggcgtccg acccggatcg gaaactcact 60

ttggcagagg tgttggagat cttcgccgcg ggtcgccgtc cgctgaagtt caccgcctat 120

gacggaagta gttgcgggcc tgaggatgcg acactgggcc tcgacctgct gaccccgcgg 180

ggcacgacct acctggccac ggcgccgggt gatctcggcc tggcgcgggc ctacatcgcc 240

ggcgatctgc gcctcagtgg tgtgcatccc ggcgatcccc atgacctgct cacggcgctg 300

acggaacgcc tggagtacag gcgtccgccg gtgcgagtgc tggccaatgt tctgcgctcc 360

atcgggatcg agcacctcaa gcccgtcgcg ccgccacccc aggagcacct gccgcggtgg 420

cggcggatcg cagaggggtt gcggcacagc aagacccgtg acgctgaggc catccagcac 480

cactacgacg tctcgaacac gttctactca tgggtcctgg gtccgtcgat gacctacacc 540

tgcgcctgct atccacaccc ggatgccacg ctggaggagg cgcaggagaa caagtaccgg 600

ctggtgttcg agaagcttcg actcaagccc ggtgaccggc tgctcgacgt cggttgcggc 660

tggggcggaa tggtccgcta cgccgcccgg cacggggtca aggtcctggg ggtgacgctg 720

tcgaaggagc aggcgcagtg ggcggccgac gcagtcgagc gggacggcct gggtgagttg 780

gccgaggtcc gccacggcga ctaccgcgac gtgcgcgagt cgcacttcga cgcagtgtcc 840

tcgctcgggc tcaccgagca catcggcgtc gcgaactacc cgtcgtactt ccgcttcctg 900

aagtcgaaac tgcggccggg tggcctgctg ctcaaccact gcatcacccg aaacaacaac 960

cggagtcacg ccaccgcagg cggattcatc gatcgctatg tctttcccga cggggagctg 1020

acggggtcgg ggcgaatcat caccgaaatg caggacgtcg gactcgaggt cgtgcacgag 1080

gagaatctgc gtcaccacta cgcgctgacg ctgcgcgact ggagccgcaa cctggtcgcg 1140

cactgggacg acgcggtgac cgaggtcggt ctgccgactg ccaaggtgtg gggcctctac 1200

atcgccgcgt cgcgagtcgg cttcgagcag aacgccattc agctgcacca ggtgctgtcg 1260

gtcaagctcg acgagcgtgg ctcggacggc ggactgccgt tacgaccctg gtggaacgcc 1320

tag 1323

<210> 36

<211> 440

<212> PRT

<213> 淡黄分枝杆菌

<400> 36

Met Thr Thr Phe Arg Glu His Thr Asp Ser Ser Ala Ser Asp Pro Asp

1 5 10 15

Arg Lys Leu Thr Leu Ala Glu Val Leu Glu Ile Phe Ala Ala Gly Arg

20 25 30

Arg Pro Leu Lys Phe Thr Ala Tyr Asp Gly Ser Ser Cys Gly Pro Glu

35 40 45

Asp Ala Thr Leu Gly Leu Asp Leu Leu Thr Pro Arg Gly Thr Thr Tyr

50 55 60

Leu Ala Thr Ala Pro Gly Asp Leu Gly Leu Ala Arg Ala Tyr Ile Ala

65 70 75 80

Gly Asp Leu Arg Leu Ser Gly Val His Pro Gly Asp Pro His Asp Leu

85 90 95

Leu Thr Ala Leu Thr Glu Arg Leu Glu Tyr Arg Arg Pro Pro Val Arg

100 105 110

Val Leu Ala Asn Val Leu Arg Ser Ile Gly Ile Glu His Leu Lys Pro

115 120 125

Val Ala Pro Pro Pro Gln Glu His Leu Pro Arg Trp Arg Arg Ile Ala

130 135 140

Glu Gly Leu Arg His Ser Lys Thr Arg Asp Ala Glu Ala Ile Gln His

145 150 155 160

His Tyr Asp Val Ser Asn Thr Phe Tyr Ser Trp Val Leu Gly Pro Ser

165 170 175

Met Thr Tyr Thr Cys Ala Cys Tyr Pro His Pro Asp Ala Thr Leu Glu

180 185 190

Glu Ala Gln Glu Asn Lys Tyr Arg Leu Val Phe Glu Lys Leu Arg Leu

195 200 205

Lys Pro Gly Asp Arg Leu Leu Asp Val Gly Cys Gly Trp Gly Gly Met

210 215 220

Val Arg Tyr Ala Ala Arg His Gly Val Lys Val Leu Gly Val Thr Leu

225 230 235 240

Ser Lys Glu Gln Ala Gln Trp Ala Ala Asp Ala Val Glu Arg Asp Gly

245 250 255

Leu Gly Glu Leu Ala Glu Val Arg His Gly Asp Tyr Arg Asp Val Arg

260 265 270

Glu Ser His Phe Asp Ala Val Ser Ser Leu Gly Leu Thr Glu His Ile

275 280 285

Gly Val Ala Asn Tyr Pro Ser Tyr Phe Arg Phe Leu Lys Ser Lys Leu

290 295 300

Arg Pro Gly Gly Leu Leu Leu Asn His Cys Ile Thr Arg Asn Asn Asn

305 310 315 320

Arg Ser His Ala Thr Ala Gly Gly Phe Ile Asp Arg Tyr Val Phe Pro

325 330 335

Asp Gly Glu Leu Thr Gly Ser Gly Arg Ile Ile Thr Glu Met Gln Asp

340 345 350

Val Gly Leu Glu Val Val His Glu Glu Asn Leu Arg His His Tyr Ala

355 360 365

Leu Thr Leu Arg Asp Trp Ser Arg Asn Leu Val Ala His Trp Asp Asp

370 375 380

Ala Val Thr Glu Val Gly Leu Pro Thr Ala Lys Val Trp Gly Leu Tyr

385 390 395 400

Ile Ala Ala Ser Arg Val Gly Phe Glu Gln Asn Ala Ile Gln Leu His

405 410 415

Gln Val Leu Ser Val Lys Leu Asp Glu Arg Gly Ser Asp Gly Gly Leu

420 425 430

Pro Leu Arg Pro Trp Trp Asn Ala

435 440

<210> 37

<211> 387

<212> DNA

<213> 淡黄分枝杆菌

<400> 37

atgatccggt tcctgctgcg catcgcggtc tttctgggct catcagcgat cgggctcctc 60

gtcgccggat ggctggtgcc cggggtgtcg ctgtcggtgt ggggcttcgt cacggcagtg 120

gtgatcttca ccgtggcgca ggcgatcctg tccccgttct tcctcaagat ggccagccgc 180

tacgcctcgg cgttcctcgg cgggatcggt ctggtgtcga cgtttgccgc gctgctgctc 240

gtctcgctgc tgtccaacgg tctgagcatc cgcggcatcg gatcctggat cgccgcaacc 300

gtggtggtct ggttggtgac cgccctggcg acgctggtgc tgccgatgtt ggtgctgcgc 360

gagaagaaaa ccgcgtcgcg cgtctga 387

<210> 38

<211> 128

<212> PRT

<213> 淡黄分枝杆菌

<400> 38

Met Ile Arg Phe Leu Leu Arg Ile Ala Val Phe Leu Gly Ser Ser Ala

1 5 10 15

Ile Gly Leu Leu Val Ala Gly Trp Leu Val Pro Gly Val Ser Leu Ser

20 25 30

Val Trp Gly Phe Val Thr Ala Val Val Ile Phe Thr Val Ala Gln Ala

35 40 45

Ile Leu Ser Pro Phe Phe Leu Lys Met Ala Ser Arg Tyr Ala Ser Ala

50 55 60

Phe Leu Gly Gly Ile Gly Leu Val Ser Thr Phe Ala Ala Leu Leu Leu

65 70 75 80

Val Ser Leu Leu Ser Asn Gly Leu Ser Ile Arg Gly Ile Gly Ser Trp

85 90 95

Ile Ala Ala Thr Val Val Val Trp Leu Val Thr Ala Leu Ala Thr Leu

100 105 110

Val Leu Pro Met Leu Val Leu Arg Glu Lys Lys Thr Ala Ser Arg Val

115 120 125

<210> 39

<211> 1425

<212> DNA

<213> 未知的

<220>

<223> 普拉尼亚分枝杆菌

<400> 39

atgcacgggc tgttgtcgaa gactagggta tatgtggtgc ctgtccttgg atctgcactc 60

tcggcccaca agtcgggcgt tgaccggctg ctggcaagct atcgatccat tcccgcaacg 120

tccgcggtcc ggctggccaa accgacgtca aacctgttcc gcgcccgcac caaacgtgac 180

gcgcccggct tggacacctc ggggctgacc ggcgtcctga gcgtggatcc cgaaacccgc 240

accgcggacg tcgccggcat gtgcacctac gcggacctgg tggccgcaac gctgccctac 300

ggcctgtcgc cgctggtcgt cccgcagctg aagaccatca ccctcggcgg ggcggtcagc 360

ggcctgggga tcgagtcggc gtcgtttcgc aacgggctgc cgcacgaatc ggtgctggag 420

atggatatcc tcaccggcgc tggcgatttg ctcaccgcat cacgtaccca gcacccggac 480

ctgttccgcg ccttcccgaa ttcctatggg acactggggt attcgacccg gcttcggatc 540

gagctggaac ccgtcgcacc gttcgtcgcg ctgcgccaca tccgcttccg ctcgctgccc 600

gcgctgatcg ccgcggccga acgcatcgtc gacaccggcg ggcagggcgg aaccccggtc 660

gactacctcg acggggtggt cttcagcgcc gacgaaagct acctgtgcgt gggccggcgg 720

accaccaccc ccggcccggt cagcgactac accggcaagg acatctacta ccagtccatc 780

cggcacgacg ccccgggcct ggaggcgacc aaggatgacc ggctgaccat gcacgactac 840

ttctggcgct gggacaccga ttggttctgg tgctcgcgcg cgttcggcgt gcaggacccg 900

cgggtgcgac gcttctggcc gcgccgttat cggcgcagca gcttctactg gaagctgatt 960

tccctggacc ggcgcttcgg gatctccgac cgcatcgagg cgcgcaacgg gcggccccca 1020

cgcgaacggg tggtgcaaga catcgagatt ccaatcgaac ggacctgcga cttcctggag 1080

tggttcctgg acaacgtgcc aatcacgccg atctggttgt gcccgttgcg ccttcgcgac 1140

cgcgacggct ggccgttgta cccgatgcgg ccggatcaca cgtacgtcaa cgtcggcttc 1200

tggtcgtcgg tgccgggggg cgcgaccgag ggcgccgcca accggatgat cgaagaaaag 1260

gtgagcgaac tcgacgggca caagtccctg tactccgatt ccttctactc ccgcgaggac 1320

ttcgacgagc tgtacggcgg cgagacctac aacaccgtca agaaaaccta cgaccccgat 1380

tctcgtttac tcgacctcta cgcaaaggcg gtgcaacggc gatga 1425

<210> 40

<211> 474

<212> PRT

<213> 未知的

<220>

<223> 普拉尼亚分枝杆菌

<400> 40

Met His Gly Leu Leu Ser Lys Thr Arg Val Tyr Val Val Pro Val Leu

1 5 10 15

Gly Ser Ala Leu Ser Ala His Lys Ser Gly Val Asp Arg Leu Leu Ala

20 25 30

Ser Tyr Arg Ser Ile Pro Ala Thr Ser Ala Val Arg Leu Ala Lys Pro

35 40 45

Thr Ser Asn Leu Phe Arg Ala Arg Thr Lys Arg Asp Ala Pro Gly Leu

50 55 60

Asp Thr Ser Gly Leu Thr Gly Val Leu Ser Val Asp Pro Glu Thr Arg

65 70 75 80

Thr Ala Asp Val Ala Gly Met Cys Thr Tyr Ala Asp Leu Val Ala Ala

85 90 95

Thr Leu Pro Tyr Gly Leu Ser Pro Leu Val Val Pro Gln Leu Lys Thr

100 105 110

Ile Thr Leu Gly Gly Ala Val Ser Gly Leu Gly Ile Glu Ser Ala Ser

115 120 125

Phe Arg Asn Gly Leu Pro His Glu Ser Val Leu Glu Met Asp Ile Leu

130 135 140

Thr Gly Ala Gly Asp Leu Leu Thr Ala Ser Arg Thr Gln His Pro Asp

145 150 155 160

Leu Phe Arg Ala Phe Pro Asn Ser Tyr Gly Thr Leu Gly Tyr Ser Thr

165 170 175

Arg Leu Arg Ile Glu Leu Glu Pro Val Ala Pro Phe Val Ala Leu Arg

180 185 190

His Ile Arg Phe Arg Ser Leu Pro Ala Leu Ile Ala Ala Ala Glu Arg

195 200 205

Ile Val Asp Thr Gly Gly Gln Gly Gly Thr Pro Val Asp Tyr Leu Asp

210 215 220

Gly Val Val Phe Ser Ala Asp Glu Ser Tyr Leu Cys Val Gly Arg Arg

225 230 235 240

Thr Thr Thr Pro Gly Pro Val Ser Asp Tyr Thr Gly Lys Asp Ile Tyr

245 250 255

Tyr Gln Ser Ile Arg His Asp Ala Pro Gly Leu Glu Ala Thr Lys Asp

260 265 270

Asp Arg Leu Thr Met His Asp Tyr Phe Trp Arg Trp Asp Thr Asp Trp

275 280 285

Phe Trp Cys Ser Arg Ala Phe Gly Val Gln Asp Pro Arg Val Arg Arg

290 295 300

Phe Trp Pro Arg Arg Tyr Arg Arg Ser Ser Phe Tyr Trp Lys Leu Ile

305 310 315 320

Ser Leu Asp Arg Arg Phe Gly Ile Ser Asp Arg Ile Glu Ala Arg Asn

325 330 335

Gly Arg Pro Pro Arg Glu Arg Val Val Gln Asp Ile Glu Ile Pro Ile

340 345 350

Glu Arg Thr Cys Asp Phe Leu Glu Trp Phe Leu Asp Asn Val Pro Ile

355 360 365

Thr Pro Ile Trp Leu Cys Pro Leu Arg Leu Arg Asp Arg Asp Gly Trp

370 375 380

Pro Leu Tyr Pro Met Arg Pro Asp His Thr Tyr Val Asn Val Gly Phe

385 390 395 400

Trp Ser Ser Val Pro Gly Gly Ala Thr Glu Gly Ala Ala Asn Arg Met

405 410 415

Ile Glu Glu Lys Val Ser Glu Leu Asp Gly His Lys Ser Leu Tyr Ser

420 425 430

Asp Ser Phe Tyr Ser Arg Glu Asp Phe Asp Glu Leu Tyr Gly Gly Glu

435 440 445

Thr Tyr Asn Thr Val Lys Lys Thr Tyr Asp Pro Asp Ser Arg Leu Leu

450 455 460

Asp Leu Tyr Ala Lys Ala Val Gln Arg Arg

465 470

<210> 41

<211> 1263

<212> DNA

<213> 未知的

<220>

<223> 普拉尼亚分枝杆菌

<400> 41

atggccgaga tcctggaggt cttcgccgcc accggccgac atccgctgaa gttcaccgcc 60

tacgacggca gcatcgccgg caacgaggac gccgaactgg gcctggacct tcgcagcccc 120

cgcggcgcca cctatctggc gaccgccccc ggcgaactcg gcctcgcccg cgcctacgtg 180

tcgggcgacc tgcaggccta cggcgtccat cccggcgacc cgtaccaact gctcaagacg 240

ctcaccgatc gggtggaatt caagcggccc ccggtgcggg tgctggccaa cgtcgtgcgg 300

tcgctggggt tcgagcggtt gctgccggtc gcgccgcccc cgcaggaggc gctgccccgg 360

tggcggcgca tcgccgacgg gctgatgcac acgaggaccc gcgacgccga ggccatccac 420

caccactacg acgtgtccaa caccttctac gaattggtgt tggggccgtc gatgacctac 480

acctgcgcgg tgtatcccga tgccgacgcg acactcgaac aggcgcagga gaacaagtac 540

cggctgatct tcgagaagct gcggctgaag gcgggcgacc ggctgctcga cgtcggctgc 600

ggctggggcg gcatggtgcg ctacgcggcc cggcgcggcg tccgggccac cggcgccacc 660

ctgtcggccg aacaggcgaa gtgggcgcag aaggcgatcg ccgaggaagg ccttgcggac 720

ctggccgagg tgcgccacac cgactatcgg gacgtgggcg aggcggcgtt cgacgccgtg 780

tcctcgatcg ggctgaccga gcacatcggc gtcaagaatt accccgccta cttcggcttc 840

ttgaagtcga agctgcgcac cggcggcctg ctgctcaatc actgcatcac ccgccacgac 900

aacacgtcga cgtcgttcgc gggcggattc accgatcgct atgtcttccc ggacggggag 960

ctgaccggct cgggccgcat cacctgcgac gtccaggact gcggcttcga ggtgctgcac 1020

gcggagaact tccgccacca ctacgcgatg acgctgcgcg actggtgccg caatctggtc 1080

gagaactggg acgccgcggt cagcgaggtc ggcctaccga ccgcgaaggt ctggggcctg 1140

tacatggcgg cgtcacgggt tgcgttcgag cagaacaacc ttcagctgca tcacgtgctg 1200

gcggccaaga ccgacgcgcg gggcgacgac gacctgccgc tgcggccgtg gtggacggcc 1260

tga 1263

<210> 42

<211> 420

<212> PRT

<213> 未知的

<220>

<223> 普拉尼亚分枝杆菌

<400> 42

Met Ala Glu Ile Leu Glu Val Phe Ala Ala Thr Gly Arg His Pro Leu

1 5 10 15

Lys Phe Thr Ala Tyr Asp Gly Ser Ile Ala Gly Asn Glu Asp Ala Glu

20 25 30

Leu Gly Leu Asp Leu Arg Ser Pro Arg Gly Ala Thr Tyr Leu Ala Thr

35 40 45

Ala Pro Gly Glu Leu Gly Leu Ala Arg Ala Tyr Val Ser Gly Asp Leu

50 55 60

Gln Ala Tyr Gly Val His Pro Gly Asp Pro Tyr Gln Leu Leu Lys Thr

65 70 75 80

Leu Thr Asp Arg Val Glu Phe Lys Arg Pro Pro Val Arg Val Leu Ala

85 90 95

Asn Val Val Arg Ser Leu Gly Phe Glu Arg Leu Leu Pro Val Ala Pro

100 105 110

Pro Pro Gln Glu Ala Leu Pro Arg Trp Arg Arg Ile Ala Asp Gly Leu

115 120 125

Met His Thr Arg Thr Arg Asp Ala Glu Ala Ile His His His Tyr Asp

130 135 140

Val Ser Asn Thr Phe Tyr Glu Leu Val Leu Gly Pro Ser Met Thr Tyr

145 150 155 160

Thr Cys Ala Val Tyr Pro Asp Ala Asp Ala Thr Leu Glu Gln Ala Gln

165 170 175

Glu Asn Lys Tyr Arg Leu Ile Phe Glu Lys Leu Arg Leu Lys Ala Gly

180 185 190

Asp Arg Leu Leu Asp Val Gly Cys Gly Trp Gly Gly Met Val Arg Tyr

195 200 205

Ala Ala Arg Arg Gly Val Arg Ala Thr Gly Ala Thr Leu Ser Ala Glu

210 215 220

Gln Ala Lys Trp Ala Gln Lys Ala Ile Ala Glu Glu Gly Leu Ala Asp

225 230 235 240

Leu Ala Glu Val Arg His Thr Asp Tyr Arg Asp Val Gly Glu Ala Ala

245 250 255

Phe Asp Ala Val Ser Ser Ile Gly Leu Thr Glu His Ile Gly Val Lys

260 265 270

Asn Tyr Pro Ala Tyr Phe Gly Phe Leu Lys Ser Lys Leu Arg Thr Gly

275 280 285

Gly Leu Leu Leu Asn His Cys Ile Thr Arg His Asp Asn Thr Ser Thr

290 295 300

Ser Phe Ala Gly Gly Phe Thr Asp Arg Tyr Val Phe Pro Asp Gly Glu

305 310 315 320

Leu Thr Gly Ser Gly Arg Ile Thr Cys Asp Val Gln Asp Cys Gly Phe

325 330 335

Glu Val Leu His Ala Glu Asn Phe Arg His His Tyr Ala Met Thr Leu

340 345 350

Arg Asp Trp Cys Arg Asn Leu Val Glu Asn Trp Asp Ala Ala Val Ser

355 360 365

Glu Val Gly Leu Pro Thr Ala Lys Val Trp Gly Leu Tyr Met Ala Ala

370 375 380

Ser Arg Val Ala Phe Glu Gln Asn Asn Leu Gln Leu His His Val Leu

385 390 395 400

Ala Ala Lys Thr Asp Ala Arg Gly Asp Asp Asp Leu Pro Leu Arg Pro

405 410 415

Trp Trp Thr Ala

420

<210> 43

<211> 1380

<212> DNA

<213> 草分枝杆菌

<400> 43

gtgtctgaac cccgaaccga cgcacgtgtt gttcaggccg cgggcgtgca caagctgctg 60

gagagctacc gcgcgatccc gcccgaggcc accgtccggc tggccaaacc cacctcgaac 120

ctgttccggg cgcgcgccaa gacctcggtc aagggtctcg atgtctcggg cctgacccat 180

gtgatctccg tcgaccccga cgagcgcacc gctgaggtgg ccgggatgtg cacctacgag 240

gacctggtcg ccgcgacgct gccgtacggg ctgtcaccgc tggtggtgcc gcagctcaag 300

accatcaccc tcggcggcgc cgtgacgggt ctgggcatcg agtcggcgtc gttccgtaac 360

ggcctgccgc acgagtcggt gctggagatg gacatcctca ccggatcggg cgagatcctc 420

accgcctccc gcgaccagca ccccgacctg ttccgggcgt tcccgaactc ctatggcacg 480

ctgggctatt cggtgcggct gaagatcgag ttggagaccg tcaaaccgtt cgtcgcggtc 540

cgtcacctgc ggttccacga catcgaggac ctggtcgccg agatggaccg cattgtcgag 600

accggcggct acgacggcac cccggtcgac tatctcgacg gtgtggtgtt ctcggcccgc 660

gagagctacc tgacgctggg cttccagacc gccaccccgg gcccggtcag cgactacacc 720

ggccagcaga tctactaccg ctcgatccag cacgaggacg gcgtcaagga cgaccggctg 780

acgatccacg actacttctg gcgctgggac accgactggt tctggtgctc gcgggcgttc 840

ggcgtgcaga acccgacgat ccgccggttc tggccgcgcc ggctcaagcg cagcagcttc 900

tactggaagc tggtcgccta cgaccgcaag ttcaacatcg ccgatcgcat cgagatgcac 960

aacggccgcc cgccccgcga gcgcgtcgtg caggacatcg aggtgccgat cgagcgggtc 1020

gccgagtttt tgggctggtt cctcgacaac gtgccgatcg agccgatctg gctgtgcccg 1080

ttgcgtcttc gcgacgacgc cggctggccg ctgtacccga tccgggcgca gcacacctac 1140

gtcaacgtgg ggttctggtc ctcggtgccg gtggggccca ccgaggggca cacgaaccgg 1200

ctgatcgagc gcaaggtcag cgagctcgac gggcacaagt cgctgtactc ggacgcgtac 1260

tactcgcgcg acgagttcga ccagctctac ggcggcgaaa tctacaaaac cgttaaaaag 1320

gcctacgatc cagattcacg actgctcgac ctgtacgcga aggcggtgca gcgccagtga 1380

<210> 44

<211> 459

<212> PRT

<213> 草分枝杆菌

<400> 44

Val Ser Glu Pro Arg Thr Asp Ala Arg Val Val Gln Ala Ala Gly Val

1 5 10 15

His Lys Leu Leu Glu Ser Tyr Arg Ala Ile Pro Pro Glu Ala Thr Val

20 25 30

Arg Leu Ala Lys Pro Thr Ser Asn Leu Phe Arg Ala Arg Ala Lys Thr

35 40 45

Ser Val Lys Gly Leu Asp Val Ser Gly Leu Thr His Val Ile Ser Val

50 55 60

Asp Pro Asp Glu Arg Thr Ala Glu Val Ala Gly Met Cys Thr Tyr Glu

65 70 75 80

Asp Leu Val Ala Ala Thr Leu Pro Tyr Gly Leu Ser Pro Leu Val Val

85 90 95

Pro Gln Leu Lys Thr Ile Thr Leu Gly Gly Ala Val Thr Gly Leu Gly

100 105 110

Ile Glu Ser Ala Ser Phe Arg Asn Gly Leu Pro His Glu Ser Val Leu

115 120 125

Glu Met Asp Ile Leu Thr Gly Ser Gly Glu Ile Leu Thr Ala Ser Arg

130 135 140

Asp Gln His Pro Asp Leu Phe Arg Ala Phe Pro Asn Ser Tyr Gly Thr

145 150 155 160

Leu Gly Tyr Ser Val Arg Leu Lys Ile Glu Leu Glu Thr Val Lys Pro

165 170 175

Phe Val Ala Val Arg His Leu Arg Phe His Asp Ile Glu Asp Leu Val

180 185 190

Ala Glu Met Asp Arg Ile Val Glu Thr Gly Gly Tyr Asp Gly Thr Pro

195 200 205

Val Asp Tyr Leu Asp Gly Val Val Phe Ser Ala Arg Glu Ser Tyr Leu

210 215 220

Thr Leu Gly Phe Gln Thr Ala Thr Pro Gly Pro Val Ser Asp Tyr Thr

225 230 235 240

Gly Gln Gln Ile Tyr Tyr Arg Ser Ile Gln His Glu Asp Gly Val Lys

245 250 255

Asp Asp Arg Leu Thr Ile His Asp Tyr Phe Trp Arg Trp Asp Thr Asp

260 265 270

Trp Phe Trp Cys Ser Arg Ala Phe Gly Val Gln Asn Pro Thr Ile Arg

275 280 285

Arg Phe Trp Pro Arg Arg Leu Lys Arg Ser Ser Phe Tyr Trp Lys Leu

290 295 300

Val Ala Tyr Asp Arg Lys Phe Asn Ile Ala Asp Arg Ile Glu Met His

305 310 315 320

Asn Gly Arg Pro Pro Arg Glu Arg Val Val Gln Asp Ile Glu Val Pro

325 330 335

Ile Glu Arg Val Ala Glu Phe Leu Gly Trp Phe Leu Asp Asn Val Pro

340 345 350

Ile Glu Pro Ile Trp Leu Cys Pro Leu Arg Leu Arg Asp Asp Ala Gly

355 360 365

Trp Pro Leu Tyr Pro Ile Arg Ala Gln His Thr Tyr Val Asn Val Gly

370 375 380

Phe Trp Ser Ser Val Pro Val Gly Pro Thr Glu Gly His Thr Asn Arg

385 390 395 400

Leu Ile Glu Arg Lys Val Ser Glu Leu Asp Gly His Lys Ser Leu Tyr

405 410 415

Ser Asp Ala Tyr Tyr Ser Arg Asp Glu Phe Asp Gln Leu Tyr Gly Gly

420 425 430

Glu Ile Tyr Lys Thr Val Lys Lys Ala Tyr Asp Pro Asp Ser Arg Leu

435 440 445

Leu Asp Leu Tyr Ala Lys Ala Val Gln Arg Gln

450 455

<210> 45

<211> 1314

<212> DNA

<213> 草分枝杆菌

<400> 45

atgacggcga tcaaagagaa cccggtcctg acttcggcca ggaagctgtc cctggccgag 60

attctggaaa tccttgccgg gggcgaactc ccggtgcgtt tcacggccta cgacggcagc 120

tcggcgggcc cggcggactc cccgctcggc ctggagctgc tgaccccgcg cggcaccacc 180

tatctggcca ccgccccggg cgatctcggg ctggcacgcg cctacatcgc cggtgacctg 240

cagccgcacg gcgtgcatcc gggcgatccg tacgagctgc tcaaggccct gtcggagaag 300

atggagttca agcggccgcc cgcgaaggtg ctggccaaca tcgtgcgctc catcggtatc 360

gagcacctca agccgatcgc accgccgccg caggaggcgc agccgcgctg gcgccggatc 420

gcggaagggt tgcggcacag caagactcgc gacgccgagg cgatccacca ccactacgac 480

gtgtccaaca cgttctacga gtgggtgctc ggcccgtcga tgacctacac ctgcgcgtgc 540

tacccggacg tcgacgcaac cctggagcag gcgcaggaga acaagtaccg cctggtgttc 600

gagaagctgc gcctgaagcc gggcgaccgg ctgctcgacg tgggctgcgg ctggggcggc 660

atggtgcgct acgccgccca gcacggggtc aaggccatcg gcgtcacgct gtctcgggag 720

caggcgacgt gggcgcagaa ggcgatcgcc gagcaggggc tcagcgatct ggccgaggtc 780

cgccacggcg actaccgcga cattcgcgag tccgggttcg acgcggtgtc ctcgatcggg 840

ctgaccgagc acatcggcgt ggccaactac ccgtcgtact tccggttcct gcagtccaag 900

ctgcgtgtcg gcgggctgct gctcaaccac tgcatcaccc ggccggacaa caagtcgcag 960

gccagcgcgg gcgggttcat cgaccgctac gtgttccccg acggggagct caccgggtcc 1020

ggccgcatca tcgccgcggc ccaggacgtc ggcctcgagg tggtgcacga ggagaacctg 1080

cgccagcact acgcgatgac gctgcgcgac tggtgccgca acctcgtcga gcactgggac 1140

gaggcggtcg ccgaggtcgg cctggaacgc gccaagatct ggggcctgta catggccggc 1200

tcccggctcg gcttcgagac gaacatcgtg cagctgcacc aggtgctggc ggtcaagctg 1260

gaccgcaggg gcggcgacgg cgggctgccg ttgcgcccgt ggtggacgcc ctag 1314

<210> 46

<211> 437

<212> PRT

<213> 草分枝杆菌

<400> 46

Met Thr Ala Ile Lys Glu Asn Pro Val Leu Thr Ser Ala Arg Lys Leu

1 5 10 15

Ser Leu Ala Glu Ile Leu Glu Ile Leu Ala Gly Gly Glu Leu Pro Val

20 25 30

Arg Phe Thr Ala Tyr Asp Gly Ser Ser Ala Gly Pro Ala Asp Ser Pro

35 40 45

Leu Gly Leu Glu Leu Leu Thr Pro Arg Gly Thr Thr Tyr Leu Ala Thr

50 55 60

Ala Pro Gly Asp Leu Gly Leu Ala Arg Ala Tyr Ile Ala Gly Asp Leu

65 70 75 80

Gln Pro His Gly Val His Pro Gly Asp Pro Tyr Glu Leu Leu Lys Ala

85 90 95

Leu Ser Glu Lys Met Glu Phe Lys Arg Pro Pro Ala Lys Val Leu Ala

100 105 110

Asn Ile Val Arg Ser Ile Gly Ile Glu His Leu Lys Pro Ile Ala Pro

115 120 125

Pro Pro Gln Glu Ala Gln Pro Arg Trp Arg Arg Ile Ala Glu Gly Leu

130 135 140

Arg His Ser Lys Thr Arg Asp Ala Glu Ala Ile His His His Tyr Asp

145 150 155 160

Val Ser Asn Thr Phe Tyr Glu Trp Val Leu Gly Pro Ser Met Thr Tyr

165 170 175

Thr Cys Ala Cys Tyr Pro Asp Val Asp Ala Thr Leu Glu Gln Ala Gln

180 185 190

Glu Asn Lys Tyr Arg Leu Val Phe Glu Lys Leu Arg Leu Lys Pro Gly

195 200 205

Asp Arg Leu Leu Asp Val Gly Cys Gly Trp Gly Gly Met Val Arg Tyr

210 215 220

Ala Ala Gln His Gly Val Lys Ala Ile Gly Val Thr Leu Ser Arg Glu

225 230 235 240

Gln Ala Thr Trp Ala Gln Lys Ala Ile Ala Glu Gln Gly Leu Ser Asp

245 250 255

Leu Ala Glu Val Arg His Gly Asp Tyr Arg Asp Ile Arg Glu Ser Gly

260 265 270

Phe Asp Ala Val Ser Ser Ile Gly Leu Thr Glu His Ile Gly Val Ala

275 280 285

Asn Tyr Pro Ser Tyr Phe Arg Phe Leu Gln Ser Lys Leu Arg Val Gly

290 295 300

Gly Leu Leu Leu Asn His Cys Ile Thr Arg Pro Asp Asn Lys Ser Gln

305 310 315 320

Ala Ser Ala Gly Gly Phe Ile Asp Arg Tyr Val Phe Pro Asp Gly Glu

325 330 335

Leu Thr Gly Ser Gly Arg Ile Ile Ala Ala Ala Gln Asp Val Gly Leu

340 345 350

Glu Val Val His Glu Glu Asn Leu Arg Gln His Tyr Ala Met Thr Leu

355 360 365

Arg Asp Trp Cys Arg Asn Leu Val Glu His Trp Asp Glu Ala Val Ala

370 375 380

Glu Val Gly Leu Glu Arg Ala Lys Ile Trp Gly Leu Tyr Met Ala Gly

385 390 395 400

Ser Arg Leu Gly Phe Glu Thr Asn Ile Val Gln Leu His Gln Val Leu

405 410 415

Ala Val Lys Leu Asp Arg Arg Gly Gly Asp Gly Gly Leu Pro Leu Arg

420 425 430

Pro Trp Trp Thr Pro

435

<210> 47

<211> 1413

<212> DNA

<213> 结核分枝杆菌

<400> 47

atgcaggggc agttgtcgag gactagggta tatacggtgc ctgtccctgg atctgcacag 60

tcggcttacg cctgcggcgt cgagcggttg ctggcgagct atcgatccat ccccgcgact 120

gcatccatcc ggcttgccaa gcccacctca aatctgttcc gcgcccgcgt caaacacgat 180

gcacgcggcc tggacgcatc gggactgacc ggtgtcatcg gtatcgatcc cgaggcccgc 240

accgccgacg tggccggcat gtgcacatac gaggacctaa tcgccgcgac actgcactac 300

ggtctgtcac cattggtggt tccgcagctg aggacgatca cattgggcgg agcggtcacc 360

ggcttgggta tcgagtcggc gtcgttccgc aacggcctgc cccacgagtc ggtgctggag 420

atggatatcc tcaccggcgc aggagaactt ctcaccgtct cgcccggaca gcactccgac 480

ttgtaccgtg cattccctaa ctcgtatggg acactgggct attcaacccg gcttcgaatc 540

cagctggagc cggtccggcc gtttgtcgcg ctgcggcaca tccgatttag ctcgttgacg 600

gcgatggtgg ccgcaatgga gcgcatcatc gacaccggcg gactggacgg cgaatcggtg 660

gactatctcg acggggtggt tttcagcgct gacgaaagct acctgtgcat cggcatgcag 720

acgagcgtac cgggcccggt cagcgactac accggacaag acatctacta ccggtcgatc 780

caacacgagg cggggatcaa ggaagaccgg ttgaccatcc acgattactt ctggcgctgg 840

gacaccgatt ggttctggtg ctcacgatcg tttggtgccc aaaacccgcg gctgcgccgc 900

tggtggccgc ggcgctaccg gcgtagcagt gtctactgga ggttgatggc gctcgatcag 960

cgcttcggga tcgccgaccg gttcgagaac agcaggggtc gtcccgcgcg tgaacgggtg 1020

gtgcaggata tcgaagtgcc gatcgaacgg acctgcgagt ttctggagtg gttcggggaa 1080

aacgtgccca tttcgccaat ctggttgtgc ccgttgcggc tacgcgatca cgccggctgg 1140

ccgctgtacc cgatccggcc tgaccgtagc tatgtcaaca tcgggttctg gtcgtcggtg 1200

ccggttggcg ccaccgaggg cgccaccaac cgcaagatcg agaacaaggt gagtgcgctc 1260

gacgggcaca agtcgctcta ctccgactcc ttctataccc gcgaggagtt cgacgagctc 1320

tacggcggcg agacttacaa cactgtgaag aaagcctacg atcccgattc gcgtctcctc 1380

gatctttacg caaaggcggt gcaacgacga tga 1413

<210> 48

<211> 470

<212> PRT

<213> 结核分枝杆菌

<400> 48

Met Gln Gly Gln Leu Ser Arg Thr Arg Val Tyr Thr Val Pro Val Pro

1 5 10 15

Gly Ser Ala Gln Ser Ala Tyr Ala Cys Gly Val Glu Arg Leu Leu Ala

20 25 30

Ser Tyr Arg Ser Ile Pro Ala Thr Ala Ser Ile Arg Leu Ala Lys Pro

35 40 45

Thr Ser Asn Leu Phe Arg Ala Arg Val Lys His Asp Ala Arg Gly Leu

50 55 60

Asp Ala Ser Gly Leu Thr Gly Val Ile Gly Ile Asp Pro Glu Ala Arg

65 70 75 80

Thr Ala Asp Val Ala Gly Met Cys Thr Tyr Glu Asp Leu Ile Ala Ala

85 90 95

Thr Leu His Tyr Gly Leu Ser Pro Leu Val Val Pro Gln Leu Arg Thr

100 105 110

Ile Thr Leu Gly Gly Ala Val Thr Gly Leu Gly Ile Glu Ser Ala Ser

115 120 125

Phe Arg Asn Gly Leu Pro His Glu Ser Val Leu Glu Met Asp Ile Leu

130 135 140

Thr Gly Ala Gly Glu Leu Leu Thr Val Ser Pro Gly Gln His Ser Asp

145 150 155 160

Leu Tyr Arg Ala Phe Pro Asn Ser Tyr Gly Thr Leu Gly Tyr Ser Thr

165 170 175

Arg Leu Arg Ile Gln Leu Glu Pro Val Arg Pro Phe Val Ala Leu Arg

180 185 190

His Ile Arg Phe Ser Ser Leu Thr Ala Met Val Ala Ala Met Glu Arg

195 200 205

Ile Ile Asp Thr Gly Gly Leu Asp Gly Glu Ser Val Asp Tyr Leu Asp

210 215 220

Gly Val Val Phe Ser Ala Asp Glu Ser Tyr Leu Cys Ile Gly Met Gln

225 230 235 240

Thr Ser Val Pro Gly Pro Val Ser Asp Tyr Thr Gly Gln Asp Ile Tyr

245 250 255

Tyr Arg Ser Ile Gln His Glu Ala Gly Ile Lys Glu Asp Arg Leu Thr

260 265 270

Ile His Asp Tyr Phe Trp Arg Trp Asp Thr Asp Trp Phe Trp Cys Ser

275 280 285

Arg Ser Phe Gly Ala Gln Asn Pro Arg Leu Arg Arg Trp Trp Pro Arg

290 295 300

Arg Tyr Arg Arg Ser Ser Val Tyr Trp Arg Leu Met Ala Leu Asp Gln

305 310 315 320

Arg Phe Gly Ile Ala Asp Arg Phe Glu Asn Ser Arg Gly Arg Pro Ala

325 330 335

Arg Glu Arg Val Val Gln Asp Ile Glu Val Pro Ile Glu Arg Thr Cys

340 345 350

Glu Phe Leu Glu Trp Phe Gly Glu Asn Val Pro Ile Ser Pro Ile Trp

355 360 365

Leu Cys Pro Leu Arg Leu Arg Asp His Ala Gly Trp Pro Leu Tyr Pro

370 375 380

Ile Arg Pro Asp Arg Ser Tyr Val Asn Ile Gly Phe Trp Ser Ser Val

385 390 395 400

Pro Val Gly Ala Thr Glu Gly Ala Thr Asn Arg Lys Ile Glu Asn Lys

405 410 415

Val Ser Ala Leu Asp Gly His Lys Ser Leu Tyr Ser Asp Ser Phe Tyr

420 425 430

Thr Arg Glu Glu Phe Asp Glu Leu Tyr Gly Gly Glu Thr Tyr Asn Thr

435 440 445

Val Lys Lys Ala Tyr Asp Pro Asp Ser Arg Leu Leu Asp Leu Tyr Ala

450 455 460

Lys Ala Val Gln Arg Arg

465 470

<210> 49

<211> 1263

<212> DNA

<213> 结核分枝杆菌

<400> 49

atggccgaga tcctggagat cttcaccgcg accgggcaac acccgctgaa gttcaccgcg 60

tatgacggca gcaccgcggg acaagacgac gccacactgg gcctggatct tcggacgccc 120

cgcggcgcca cctacttagc taccgctccc ggcgaactcg gcctggcccg cgcttatgtg 180

tcgggtgacc tacaggcaca cggagtacat cccggcgatc cgtacgaact gctcaaaacg 240

ctgaccgaaa gggtcgactt caaacggccg tcggcgcggg tgctggctaa tgtggtgcgc 300

tcgatcggcg ttgagcacat actgcccatc gcgccgccac cccaggaggc gcgaccccgg 360

tggcgtcgaa tggctaatgg cttgctgcac agcaagaccc gtgacgccga ggctatccat 420

caccactacg acgtctccaa caacttctac gagtgggtgc tcgggccatc gatgacctac 480

acgtgcgcgg tgtttccgaa cgctgaggct tcgctggagc aggcccaaga gaacaaatac 540

cgactcattt tcgaaaagct acggctagag ccgggtgacc ggctactcga cgtcggctgc 600

ggctggggcg gcatggtgcg ctacgccgcc cgacgcggtg tccgggtgat cggcgccacg 660

ctctcggccg agcaggccaa gtggggccag aaagcagtcg aggacgaggg attgagcgac 720

ctcgcgcagg tgcggcattc cgactaccgc gacgtagccg agaccggttt cgacgccgtt 780

tcttcgatcg ggctaaccga gcacatcggc gtcaagaatt acccgttcta cttcgggttt 840

ctcaagtcga agttgcgcac cggcggcttg ctgctcaatc actgcatcac ccgccacgac 900

aacaggtcga cgtcctttgc cggcgggttc accgaccgtt acgttttccc cgacggggag 960

ctgacgggct cgggacgtat taccaccgag atccagcagg tcggcttgga agtgctgcac 1020

gaggagaact tccgccatca ctacgcgatg acgctgcgcg actggtgcgg caacctcgtc 1080

gaacactggg acgacgcggt cgccgaggtc ggtctgccga ccgccaaggt gtggggcctg 1140

tacatggcgg cttcgcgggt ggccttcgaa cgaaacaacc tgcagctaca tcacgtattg 1200

gcgaccaagg tggacccccg gggcgacgac agcttgccac tgcggccctg gtggcagccc 1260

tag 1263

<210> 50

<211> 420

<212> PRT

<213> 结核分枝杆菌

<400> 50

Met Ala Glu Ile Leu Glu Ile Phe Thr Ala Thr Gly Gln His Pro Leu

1 5 10 15

Lys Phe Thr Ala Tyr Asp Gly Ser Thr Ala Gly Gln Asp Asp Ala Thr

20 25 30

Leu Gly Leu Asp Leu Arg Thr Pro Arg Gly Ala Thr Tyr Leu Ala Thr

35 40 45

Ala Pro Gly Glu Leu Gly Leu Ala Arg Ala Tyr Val Ser Gly Asp Leu

50 55 60

Gln Ala His Gly Val His Pro Gly Asp Pro Tyr Glu Leu Leu Lys Thr

65 70 75 80

Leu Thr Glu Arg Val Asp Phe Lys Arg Pro Ser Ala Arg Val Leu Ala

85 90 95

Asn Val Val Arg Ser Ile Gly Val Glu His Ile Leu Pro Ile Ala Pro

100 105 110

Pro Pro Gln Glu Ala Arg Pro Arg Trp Arg Arg Met Ala Asn Gly Leu

115 120 125

Leu His Ser Lys Thr Arg Asp Ala Glu Ala Ile His His His Tyr Asp

130 135 140

Val Ser Asn Asn Phe Tyr Glu Trp Val Leu Gly Pro Ser Met Thr Tyr

145 150 155 160

Thr Cys Ala Val Phe Pro Asn Ala Glu Ala Ser Leu Glu Gln Ala Gln

165 170 175

Glu Asn Lys Tyr Arg Leu Ile Phe Glu Lys Leu Arg Leu Glu Pro Gly

180 185 190

Asp Arg Leu Leu Asp Val Gly Cys Gly Trp Gly Gly Met Val Arg Tyr

195 200 205

Ala Ala Arg Arg Gly Val Arg Val Ile Gly Ala Thr Leu Ser Ala Glu

210 215 220

Gln Ala Lys Trp Gly Gln Lys Ala Val Glu Asp Glu Gly Leu Ser Asp

225 230 235 240

Leu Ala Gln Val Arg His Ser Asp Tyr Arg Asp Val Ala Glu Thr Gly

245 250 255

Phe Asp Ala Val Ser Ser Ile Gly Leu Thr Glu His Ile Gly Val Lys

260 265 270

Asn Tyr Pro Phe Tyr Phe Gly Phe Leu Lys Ser Lys Leu Arg Thr Gly

275 280 285

Gly Leu Leu Leu Asn His Cys Ile Thr Arg His Asp Asn Arg Ser Thr

290 295 300

Ser Phe Ala Gly Gly Phe Thr Asp Arg Tyr Val Phe Pro Asp Gly Glu

305 310 315 320

Leu Thr Gly Ser Gly Arg Ile Thr Thr Glu Ile Gln Gln Val Gly Leu

325 330 335

Glu Val Leu His Glu Glu Asn Phe Arg His His Tyr Ala Met Thr Leu

340 345 350

Arg Asp Trp Cys Gly Asn Leu Val Glu His Trp Asp Asp Ala Val Ala

355 360 365

Glu Val Gly Leu Pro Thr Ala Lys Val Trp Gly Leu Tyr Met Ala Ala

370 375 380

Ser Arg Val Ala Phe Glu Arg Asn Asn Leu Gln Leu His His Val Leu

385 390 395 400

Ala Thr Lys Val Asp Pro Arg Gly Asp Asp Ser Leu Pro Leu Arg Pro

405 410 415

Trp Trp Gln Pro

420

<210> 51

<211> 1392

<212> DNA

<213> 未知的

<220>

<223> 范巴伦氏分枝杆菌

<400> 51

gtgtctgttc cttcgaccga cgcacgttct gctcacgccg acggcgtgca gcggcttctc 60

gccagctatc gggcgattcc ccaagacgcc acggtccggc tggccaaacc cacgtcgaac 120

ctcttccgtg cccgcgcgaa aaccaggacc aagggtctgg acacgtctgg gttgacgaac 180

gtgatcgcgg tcgacgcgga ggcacgcacc gccgatgtgg cagggatgtg cacctacgaa 240

gacctggtcg cggccacgct gccgcatgga ctttcgccgc tggtggtgcc gcagttgaag 300

acgatcaccc tcggcggggc ggtcaccgga ctcgggatcg agtccgcctc gttccgcaac 360

ggcctgccac acgaatcggt tctcgagatg gacgtcctca ccggcaccgg tgatgtcgtg 420

cgcgcctccc ccgacgagaa ccctgacctg tttcgggcgt ttccgaattc ctatggcacg 480

ttgggctatt cggttcggct caagatcgag ctggaaccgg tgaagccgtt cgtcgcgctg 540

cgccacctcc gtttccattc gctgtcggct ctcatcgagg cgatggaccg catcgtcgaa 600

accggcggcc tcaacggcga accggtggac tacctcgacg gcgtcgtgtt cagtgccgag 660

gagagttacc tgtgcgtggg gcagcgctcc gcgacaccgg gcccggtcag cgactacacg 720

ggcaagcaga tctactaccg ctcgattcag cacgacggcc cgaccgatgg cgccgagaag 780

cacgaccggc tgaccatcca cgactacctg tggcgctggg acaccgactg gttctggtgc 840

tcaagggcat tcggcgcgca gaacccgcgg atccggcgct ggtggccgcg ccggtaccgg 900

cgcagcagtg tgtactggaa gctgatcggc tacgaccggc gtttcggtat cgccgatcgc 960

atcgagaagc gcaacggccg acccccgcgc gagcgggtgg tccaggacat cgaggtgccc 1020

atcgagcgga ccgtcgagtt tctgcagtgg tttctcgaca ccgtgcccat cgaaccgatc 1080

tggttgtgcc cgttgcggct ccgcgacgac cgcgattggc ccctgtatcc gatccgaccc 1140

caccacacct acgtcaacgt gggtttctgg tcgtcggtgc cggtgggccc ggaggagggc 1200

tacaccaaca ggatgatcga acggaaagtc agcgacctcg acggtcacaa atcgctgtat 1260

tccgatgcgt actactcgcc ggaagagttt gattcgctct atggcgggga gacgtacaag 1320

acggtgaaga agacatacga cccagactct cgtttcctgg acctgtacgg caaagcagtg 1380

gggcggcaat ga 1392

<210> 52

<211> 463

<212> PRT

<213> 未知的

<220>

<223> 范巴伦氏分枝杆菌

<400> 52

Val Ser Val Pro Ser Thr Asp Ala Arg Ser Ala His Ala Asp Gly Val

1 5 10 15

Gln Arg Leu Leu Ala Ser Tyr Arg Ala Ile Pro Gln Asp Ala Thr Val

20 25 30

Arg Leu Ala Lys Pro Thr Ser Asn Leu Phe Arg Ala Arg Ala Lys Thr

35 40 45

Arg Thr Lys Gly Leu Asp Thr Ser Gly Leu Thr Asn Val Ile Ala Val

50 55 60

Asp Ala Glu Ala Arg Thr Ala Asp Val Ala Gly Met Cys Thr Tyr Glu

65 70 75 80

Asp Leu Val Ala Ala Thr Leu Pro His Gly Leu Ser Pro Leu Val Val

85 90 95

Pro Gln Leu Lys Thr Ile Thr Leu Gly Gly Ala Val Thr Gly Leu Gly

100 105 110

Ile Glu Ser Ala Ser Phe Arg Asn Gly Leu Pro His Glu Ser Val Leu

115 120 125

Glu Met Asp Val Leu Thr Gly Thr Gly Asp Val Val Arg Ala Ser Pro

130 135 140

Asp Glu Asn Pro Asp Leu Phe Arg Ala Phe Pro Asn Ser Tyr Gly Thr

145 150 155 160

Leu Gly Tyr Ser Val Arg Leu Lys Ile Glu Leu Glu Pro Val Lys Pro

165 170 175

Phe Val Ala Leu Arg His Leu Arg Phe His Ser Leu Ser Ala Leu Ile

180 185 190

Glu Ala Met Asp Arg Ile Val Glu Thr Gly Gly Leu Asn Gly Glu Pro

195 200 205

Val Asp Tyr Leu Asp Gly Val Val Phe Ser Ala Glu Glu Ser Tyr Leu

210 215 220

Cys Val Gly Gln Arg Ser Ala Thr Pro Gly Pro Val Ser Asp Tyr Thr

225 230 235 240

Gly Lys Gln Ile Tyr Tyr Arg Ser Ile Gln His Asp Gly Pro Thr Asp

245 250 255

Gly Ala Glu Lys His Asp Arg Leu Thr Ile His Asp Tyr Leu Trp Arg

260 265 270

Trp Asp Thr Asp Trp Phe Trp Cys Ser Arg Ala Phe Gly Ala Gln Asn

275 280 285

Pro Arg Ile Arg Arg Trp Trp Pro Arg Arg Tyr Arg Arg Ser Ser Val

290 295 300

Tyr Trp Lys Leu Ile Gly Tyr Asp Arg Arg Phe Gly Ile Ala Asp Arg

305 310 315 320

Ile Glu Lys Arg Asn Gly Arg Pro Pro Arg Glu Arg Val Val Gln Asp

325 330 335

Ile Glu Val Pro Ile Glu Arg Thr Val Glu Phe Leu Gln Trp Phe Leu

340 345 350

Asp Thr Val Pro Ile Glu Pro Ile Trp Leu Cys Pro Leu Arg Leu Arg

355 360 365

Asp Asp Arg Asp Trp Pro Leu Tyr Pro Ile Arg Pro His His Thr Tyr

370 375 380

Val Asn Val Gly Phe Trp Ser Ser Val Pro Val Gly Pro Glu Glu Gly

385 390 395 400

Tyr Thr Asn Arg Met Ile Glu Arg Lys Val Ser Asp Leu Asp Gly His

405 410 415

Lys Ser Leu Tyr Ser Asp Ala Tyr Tyr Ser Pro Glu Glu Phe Asp Ser

420 425 430

Leu Tyr Gly Gly Glu Thr Tyr Lys Thr Val Lys Lys Thr Tyr Asp Pro

435 440 445

Asp Ser Arg Phe Leu Asp Leu Tyr Gly Lys Ala Val Gly Arg Gln

450 455 460

<210> 53

<211> 1323

<212> DNA

<213> 未知的

<220>

<223> 范巴伦氏分枝杆菌

<400> 53

ttgacgacat ttcgggacgg cgcggccgac accggcctgc acggagaccg caagctcacc 60

ctggcggagg tcttggaggt cttcgcctcg ggccgactgc ctctgaagtt cacggcgtac 120

gacggcagca gcgcgggccc ggacgacgcc acgctcgggc tggacctgct gaccccccgc 180

gggaccacgt acctcgcaac ggctcccggc gatctcggcc tggcccgggc ctacgtctcc 240

ggtgacctgc agttgcaggg ggtgcaccct ggcgacccgt acgacctgct caacgcactg 300

gtgcagaaac tggacttcaa gcgaccgtcc gcccgggtgc tggcgcaggt cgtccgatcg 360

atcgggatcg agcacctgaa accgatcgcg ccaccgccgc aggaggcgct gccgcggtgg 420

cggcgcatcg cagaaggact gcggcacagc aagacccgtg acgccgacgc gatccaccac 480

cattacgatg tctccaacac cttctacgag tgggtgctcg ggccgtcgat gacctacacc 540

tgcgcctgct acccgcatcc cgacgccacc ctcgaggagg cgcaggagaa caaatatcgg 600

ctggtgttcg agaaactgcg cctcaagccg ggcgaccgcc ttctcgacgt gggttgcggg 660

tggggcggaa tggtgcgcta cgcggcccgt cacggcgtca aggcgatcgg ggtgacgctg 720

tccagggagc aggcgcagtg ggcacgcgcc gccatcgaac gggacggcct gggtgacctc 780

gccgaggtcc gccacagcga ctaccgcgat gtgcgcgagt cccagttcga cgccgtgtct 840

tcgctggggc tcaccgagca catcggggtc gccaactatc cgtcgtactt ccggttcctc 900

aagtcgaagt tgcgcccggg cggcctactg ctcaaccact gcatcacccg gcacaacaat 960

cgcaccggcc ccgccgccgg gggattcatc gaccggtatg tgttcccgga cggggagctg 1020

accggatcgg gccggatcat caccgagatc caggacgtcg gtttggaggt gatgcacgaa 1080

gagaacctgc gccggcacta tgcgctgaca cttcgggact ggtgccggaa tctggtgcag 1140

cactgggacg aagcggtcgc agaggtcggc ctgcccaccg ccaaggtgtg gggtctgtac 1200

atggctgcct cgcgggtcgg cttcgagcag aacagcattc agctgcatca ggtactggcg 1260

gtgaagctcg acgaacgtgg cggggacggc ggtttgccgt tgcggccctg gtggaccgcg 1320

tag 1323

<210> 54

<211> 440

<212> PRT

<213> 未知的

<220>

<223> 范巴伦氏分枝杆菌

<400> 54

Leu Thr Thr Phe Arg Asp Gly Ala Ala Asp Thr Gly Leu His Gly Asp

1 5 10 15

Arg Lys Leu Thr Leu Ala Glu Val Leu Glu Val Phe Ala Ser Gly Arg

20 25 30

Leu Pro Leu Lys Phe Thr Ala Tyr Asp Gly Ser Ser Ala Gly Pro Asp

35 40 45

Asp Ala Thr Leu Gly Leu Asp Leu Leu Thr Pro Arg Gly Thr Thr Tyr

50 55 60

Leu Ala Thr Ala Pro Gly Asp Leu Gly Leu Ala Arg Ala Tyr Val Ser

65 70 75 80

Gly Asp Leu Gln Leu Gln Gly Val His Pro Gly Asp Pro Tyr Asp Leu

85 90 95

Leu Asn Ala Leu Val Gln Lys Leu Asp Phe Lys Arg Pro Ser Ala Arg

100 105 110

Val Leu Ala Gln Val Val Arg Ser Ile Gly Ile Glu His Leu Lys Pro

115 120 125

Ile Ala Pro Pro Pro Gln Glu Ala Leu Pro Arg Trp Arg Arg Ile Ala

130 135 140

Glu Gly Leu Arg His Ser Lys Thr Arg Asp Ala Asp Ala Ile His His

145 150 155 160

His Tyr Asp Val Ser Asn Thr Phe Tyr Glu Trp Val Leu Gly Pro Ser

165 170 175

Met Thr Tyr Thr Cys Ala Cys Tyr Pro His Pro Asp Ala Thr Leu Glu

180 185 190

Glu Ala Gln Glu Asn Lys Tyr Arg Leu Val Phe Glu Lys Leu Arg Leu

195 200 205

Lys Pro Gly Asp Arg Leu Leu Asp Val Gly Cys Gly Trp Gly Gly Met

210 215 220

Val Arg Tyr Ala Ala Arg His Gly Val Lys Ala Ile Gly Val Thr Leu

225 230 235 240

Ser Arg Glu Gln Ala Gln Trp Ala Arg Ala Ala Ile Glu Arg Asp Gly

245 250 255

Leu Gly Asp Leu Ala Glu Val Arg His Ser Asp Tyr Arg Asp Val Arg

260 265 270

Glu Ser Gln Phe Asp Ala Val Ser Ser Leu Gly Leu Thr Glu His Ile

275 280 285

Gly Val Ala Asn Tyr Pro Ser Tyr Phe Arg Phe Leu Lys Ser Lys Leu

290 295 300

Arg Pro Gly Gly Leu Leu Leu Asn His Cys Ile Thr Arg His Asn Asn

305 310 315 320

Arg Thr Gly Pro Ala Ala Gly Gly Phe Ile Asp Arg Tyr Val Phe Pro

325 330 335

Asp Gly Glu Leu Thr Gly Ser Gly Arg Ile Ile Thr Glu Ile Gln Asp

340 345 350

Val Gly Leu Glu Val Met His Glu Glu Asn Leu Arg Arg His Tyr Ala

355 360 365

Leu Thr Leu Arg Asp Trp Cys Arg Asn Leu Val Gln His Trp Asp Glu

370 375 380

Ala Val Ala Glu Val Gly Leu Pro Thr Ala Lys Val Trp Gly Leu Tyr

385 390 395 400

Met Ala Ala Ser Arg Val Gly Phe Glu Gln Asn Ser Ile Gln Leu His

405 410 415

Gln Val Leu Ala Val Lys Leu Asp Glu Arg Gly Gly Asp Gly Gly Leu

420 425 430

Pro Leu Arg Pro Trp Trp Thr Ala

435 440

<210> 55

<211> 381

<212> DNA

<213> 未知的

<220>

<223> 范巴伦氏分枝杆菌

<400> 55

gtgatccgct ttctgctgcg cgtcgcggtc tttctcggat cgtcggcgat cgggctactg 60

gtggccggct ggctggtgcc gggggtgtcg ctgtcggtgc tgggcttcgt caccgcggtg 120

gtgatcttca cggtggcaca agggattctg tcgccgttct tcctgaagat ggccagccgc 180

tacgcgtcgg ccttcctcgg cggcatcggc ctggtgtcca cgttcgtggc gctgctgctc 240

gcgtcgctgc tgtccaacgg gctcagcatc cgcggcgtcg ggtcgtggat cgcggccacg 300

gtggtggtct ggctggtcac agccctggcg accgtcgtgc tgcccgttct ggtgctgcgg 360

gagaagaaga aagcagcctg a 381

<210> 56

<211> 126

<212> PRT

<213> 未知的

<220>

<223> 范巴伦氏分枝杆菌

<400> 56

Val Ile Arg Phe Leu Leu Arg Val Ala Val Phe Leu Gly Ser Ser Ala

1 5 10 15

Ile Gly Leu Leu Val Ala Gly Trp Leu Val Pro Gly Val Ser Leu Ser

20 25 30

Val Leu Gly Phe Val Thr Ala Val Val Ile Phe Thr Val Ala Gln Gly

35 40 45

Ile Leu Ser Pro Phe Phe Leu Lys Met Ala Ser Arg Tyr Ala Ser Ala

50 55 60

Phe Leu Gly Gly Ile Gly Leu Val Ser Thr Phe Val Ala Leu Leu Leu

65 70 75 80

Ala Ser Leu Leu Ser Asn Gly Leu Ser Ile Arg Gly Val Gly Ser Trp

85 90 95

Ile Ala Ala Thr Val Val Val Trp Leu Val Thr Ala Leu Ala Thr Val

100 105 110

Val Leu Pro Val Leu Val Leu Arg Glu Lys Lys Lys Ala Ala

115 120 125

<210> 57

<211> 1452

<212> DNA

<213> 浑浊红球菌

<400> 57

atgcgggagg gtggacgccc cttccgtgcg catcgcactc tgcccgtcac cgggatcgac 60

gctcaccgcg ccggcgtcga acggcttctc gcgtcctacc gcgcgattcc cacggacgcc 120

accgtgcgac tcgcgaagaa gacgtccaac ctgttccggg cgcgggccca gaccagcgca 180

cccggcctcg acgtctccgg gctcggcgga gtcatctcgg tcgacgagca ggaccggacc 240

gcggatgtcg ccggaatgtg cacgtacgaa gacctggtgg acgccaccct cccgtacggg 300

ctggcgccgc tggtggttcc gcaactcaag accatcacac tcggcggcgc ggtcaccggc 360

ctcggcatcg agtcgacgtc gttccgcaac gggctccccc acgaatcggt cctcgagatc 420

gacgtcctga ccggaagcgg cgacatcgtc accgcgagac cggaaggcga gaactccgac 480

ctgttctggg ggttccccaa ctcctacgga accctcggct actccacccg actgcgcatc 540

cagctcgaac ccgtcaaacg gtatgtggca ctgcgccatc tgcgtttcga ctccctggac 600

gagctgcagt cggcaatgga tcgcatcgtc accgagcgcg tccacgacgg catccccgtc 660

gactatctgg acggcgtcgt gttcaccgcg tccgagagtt acctgacact gggccatcag 720

accgacgagg gcggccccgt cagcgactac accgggcaga acatcttcta ccggtccatc 780

cagcacagtt ccgtgaacca ccccaaaacg gacaaactca ccatccgaga ctacctgtgg 840

cgctgggaca ccgactggtt ctggtgctcg cgcgccttcg gcgcccagaa ccccaccatc 900

cgccggctgt ggccgaagaa cctcctccgc agcagcttct actggaagct catcgccctc 960

gaccacaagt acgacatcgg cgaccgactc gagaagcgca agggcaaccc gccacgcgaa 1020

cgcgtcgtgc aggacgtcga agtgcccatc gagcgcaccg cggacttcgt ccgctggttc 1080

ctcgacgaaa tcccgatcga accgctgtgg ctgtgcccgt tgcggttgcg ggaacctgcc 1140

cccgccggcg cgtcctcgca acgcccctgg cccctgtacc ccctcgaacc gaaacgcacg 1200

tacgtgaaca tcggattctg gtcatcggtg cccatcgttc cgggccgacc cgagggggcc 1260

gcgaatcggc tgatcgaaga caaggtcagt gacttcgacg gacacaagtc cctctactcc 1320

gattcgtact attcacgcga agatttcgaa cgcctctact acggcggcga tcgatacacg 1380

gaactgaaaa aacgctacga cccgaaatca cgattactgg accttttctc caaggcggtg 1440

caacgtcgat ga 1452

<210> 58

<211> 483

<212> PRT

<213> 浑浊红球菌

<400> 58

Met Arg Glu Gly Gly Arg Pro Phe Arg Ala His Arg Thr Leu Pro Val

1 5 10 15

Thr Gly Ile Asp Ala His Arg Ala Gly Val Glu Arg Leu Leu Ala Ser

20 25 30

Tyr Arg Ala Ile Pro Thr Asp Ala Thr Val Arg Leu Ala Lys Lys Thr

35 40 45

Ser Asn Leu Phe Arg Ala Arg Ala Gln Thr Ser Ala Pro Gly Leu Asp

50 55 60

Val Ser Gly Leu Gly Gly Val Ile Ser Val Asp Glu Gln Asp Arg Thr

65 70 75 80

Ala Asp Val Ala Gly Met Cys Thr Tyr Glu Asp Leu Val Asp Ala Thr

85 90 95

Leu Pro Tyr Gly Leu Ala Pro Leu Val Val Pro Gln Leu Lys Thr Ile

100 105 110

Thr Leu Gly Gly Ala Val Thr Gly Leu Gly Ile Glu Ser Thr Ser Phe

115 120 125

Arg Asn Gly Leu Pro His Glu Ser Val Leu Glu Ile Asp Val Leu Thr

130 135 140

Gly Ser Gly Asp Ile Val Thr Ala Arg Pro Glu Gly Glu Asn Ser Asp

145 150 155 160

Leu Phe Trp Gly Phe Pro Asn Ser Tyr Gly Thr Leu Gly Tyr Ser Thr

165 170 175

Arg Leu Arg Ile Gln Leu Glu Pro Val Lys Arg Tyr Val Ala Leu Arg

180 185 190

His Leu Arg Phe Asp Ser Leu Asp Glu Leu Gln Ser Ala Met Asp Arg

195 200 205

Ile Val Thr Glu Arg Val His Asp Gly Ile Pro Val Asp Tyr Leu Asp

210 215 220

Gly Val Val Phe Thr Ala Ser Glu Ser Tyr Leu Thr Leu Gly His Gln

225 230 235 240

Thr Asp Glu Gly Gly Pro Val Ser Asp Tyr Thr Gly Gln Asn Ile Phe

245 250 255

Tyr Arg Ser Ile Gln His Ser Ser Val Asn His Pro Lys Thr Asp Lys

260 265 270

Leu Thr Ile Arg Asp Tyr Leu Trp Arg Trp Asp Thr Asp Trp Phe Trp

275 280 285

Cys Ser Arg Ala Phe Gly Ala Gln Asn Pro Thr Ile Arg Arg Leu Trp

290 295 300

Pro Lys Asn Leu Leu Arg Ser Ser Phe Tyr Trp Lys Leu Ile Ala Leu

305 310 315 320

Asp His Lys Tyr Asp Ile Gly Asp Arg Leu Glu Lys Arg Lys Gly Asn

325 330 335

Pro Pro Arg Glu Arg Val Val Gln Asp Val Glu Val Pro Ile Glu Arg

340 345 350

Thr Ala Asp Phe Val Arg Trp Phe Leu Asp Glu Ile Pro Ile Glu Pro

355 360 365

Leu Trp Leu Cys Pro Leu Arg Leu Arg Glu Pro Ala Pro Ala Gly Ala

370 375 380

Ser Ser Gln Arg Pro Trp Pro Leu Tyr Pro Leu Glu Pro Lys Arg Thr

385 390 395 400

Tyr Val Asn Ile Gly Phe Trp Ser Ser Val Pro Ile Val Pro Gly Arg

405 410 415

Pro Glu Gly Ala Ala Asn Arg Leu Ile Glu Asp Lys Val Ser Asp Phe

420 425 430

Asp Gly His Lys Ser Leu Tyr Ser Asp Ser Tyr Tyr Ser Arg Glu Asp

435 440 445

Phe Glu Arg Leu Tyr Tyr Gly Gly Asp Arg Tyr Thr Glu Leu Lys Lys

450 455 460

Arg Tyr Asp Pro Lys Ser Arg Leu Leu Asp Leu Phe Ser Lys Ala Val

465 470 475 480

Gln Arg Arg

<210> 59

<211> 1302

<212> DNA

<213> 浑浊红球菌

<400> 59

atgacaactc tgaaagcttc acgctcccag gaccacaagc tgaccatcgc agagattctc 60

gaaactctgt ccgacggcat gctccccctg cggttctccg cctacgacgg cagcgccgcc 120

ggcccggagg acgcccccta cggtctccac ctcaagacga cccgaggcac cacctacctg 180

gcgaccgccc ccggcgacct cggcatggcc cgggcctacg tgtccggcga cctcgaggcc 240

cgcggcgtcc accccggcga cccgtacgag atcctccgcg tgatgggcga cgaactgcac 300

ttccgccgtc cgtccgcgct cacgctcgcc gccatcacgc gctcgctcgg ctgggatctg 360

ctgcgcccca tcgcccctcc cccgcaggag catctcccgc ggtggcgtcg agtcgcggaa 420

gggttgcggc actccaagtc ccgcgacgcc gaggtcatcc accaccacta cgacgtctcg 480

aacaccttct acgagtatgt cctcggcccg tccatgacgt acacgtgcgc ctgctacgag 540

aacgccgagc agaccctcga agaggcacag gacaacaagt accgcctcgt cttcgagaag 600

ctcggcctcc agcccggcga ccgactgctc gacatcggtt gcggctgggg atcgatggtc 660

cggtacgccg cccgccgcgg cgtcaaggtc atcggcgcca ccctgtcccg agagcaggcc 720

gaatgggcac agaaggccat cgccgaagaa ggactgtccg acctcgccga ggtccggttc 780

tccgactacc gtgacgtccc cgagaccgga ttcgacgcca tctcctcgat cggcctgacc 840

gagcacatcg gcgtcggcaa ctaccccgcc tacttcggac tgctgcagag caagctccgc 900

gagggcggcc ggctgctgaa ccactgcatc acccggcccg acaaccagag tcaggcacgc 960

gcgggcggct tcatcgaccg gtacgtcttc cccgacggcg aactcaccgg ctccggacgc 1020

atcatcaccg agatccagaa cgtcggactc gaggtgcggc acgaggagaa tctgcgcgag 1080

cactacgcac tcaccctcgc cggctggtgc cagaacctcg tcgacaactg ggacgcctgc 1140

gtcgccgagg tcggcgaagg caccgcacgt gtgtggggtc tctacatggc cgggtcgcga 1200

ctgggcttcg aacgcaacgt cgttcagctg caccaggtcc tcgccgtcaa gctcggaccc 1260

aagggcgagg cgcatgtgcc gctgcgtccg tggtggaagt ag 1302

<210> 60

<211> 433

<212> PRT

<213> 浑浊红球菌

<400> 60

Met Thr Thr Leu Lys Ala Ser Arg Ser Gln Asp His Lys Leu Thr Ile

1 5 10 15

Ala Glu Ile Leu Glu Thr Leu Ser Asp Gly Met Leu Pro Leu Arg Phe

20 25 30

Ser Ala Tyr Asp Gly Ser Ala Ala Gly Pro Glu Asp Ala Pro Tyr Gly

35 40 45

Leu His Leu Lys Thr Thr Arg Gly Thr Thr Tyr Leu Ala Thr Ala Pro

50 55 60

Gly Asp Leu Gly Met Ala Arg Ala Tyr Val Ser Gly Asp Leu Glu Ala

65 70 75 80

Arg Gly Val His Pro Gly Asp Pro Tyr Glu Ile Leu Arg Val Met Gly

85 90 95

Asp Glu Leu His Phe Arg Arg Pro Ser Ala Leu Thr Leu Ala Ala Ile

100 105 110

Thr Arg Ser Leu Gly Trp Asp Leu Leu Arg Pro Ile Ala Pro Pro Pro

115 120 125

Gln Glu His Leu Pro Arg Trp Arg Arg Val Ala Glu Gly Leu Arg His

130 135 140

Ser Lys Ser Arg Asp Ala Glu Val Ile His His His Tyr Asp Val Ser

145 150 155 160

Asn Thr Phe Tyr Glu Tyr Val Leu Gly Pro Ser Met Thr Tyr Thr Cys

165 170 175

Ala Cys Tyr Glu Asn Ala Glu Gln Thr Leu Glu Glu Ala Gln Asp Asn

180 185 190

Lys Tyr Arg Leu Val Phe Glu Lys Leu Gly Leu Gln Pro Gly Asp Arg

195 200 205

Leu Leu Asp Ile Gly Cys Gly Trp Gly Ser Met Val Arg Tyr Ala Ala

210 215 220

Arg Arg Gly Val Lys Val Ile Gly Ala Thr Leu Ser Arg Glu Gln Ala

225 230 235 240

Glu Trp Ala Gln Lys Ala Ile Ala Glu Glu Gly Leu Ser Asp Leu Ala

245 250 255

Glu Val Arg Phe Ser Asp Tyr Arg Asp Val Pro Glu Thr Gly Phe Asp

260 265 270

Ala Ile Ser Ser Ile Gly Leu Thr Glu His Ile Gly Val Gly Asn Tyr

275 280 285

Pro Ala Tyr Phe Gly Leu Leu Gln Ser Lys Leu Arg Glu Gly Gly Arg

290 295 300

Leu Leu Asn His Cys Ile Thr Arg Pro Asp Asn Gln Ser Gln Ala Arg

305 310 315 320

Ala Gly Gly Phe Ile Asp Arg Tyr Val Phe Pro Asp Gly Glu Leu Thr

325 330 335

Gly Ser Gly Arg Ile Ile Thr Glu Ile Gln Asn Val Gly Leu Glu Val

340 345 350

Arg His Glu Glu Asn Leu Arg Glu His Tyr Ala Leu Thr Leu Ala Gly

355 360 365

Trp Cys Gln Asn Leu Val Asp Asn Trp Asp Ala Cys Val Ala Glu Val

370 375 380

Gly Glu Gly Thr Ala Arg Val Trp Gly Leu Tyr Met Ala Gly Ser Arg

385 390 395 400

Leu Gly Phe Glu Arg Asn Val Val Gln Leu His Gln Val Leu Ala Val

405 410 415

Lys Leu Gly Pro Lys Gly Glu Ala His Val Pro Leu Arg Pro Trp Trp

420 425 430

Lys

<210> 61

<211> 1428

<212> DNA

<213> 未知的

<220>

<223> 拉格西斯链霉菌

<400> 61

atgatcacac tggcaggccg ggccggtgcg cgcgatcatg ggtgtatggc cttcggtgcc 60

gccatcccca cggggtcggg acacgccggg tacgccgagc gcgtcgcaac ccttcgcgcc 120

cacctggccg acctcccgga ggggacgccg gtccggctgg cgaagggcac ctcgaacctg 180

ttccggccgc ggtcccgcgc cacggcgggg ctcgacgtgt cggccttcga ccacgtgctg 240

tcgatcgatc cgcagaaccg gaccgccgac gtcgagggca tggtcaccta cgagcggctc 300

gtcgacgcga cgttgccgca cggcctgatg ccgctcgtcg ttccgcagct caagacgatc 360

acgctgggcg gggcggtcac gggactgggc atcgagtcgt cgtcgttccg cgagggcatg 420

ccccacgaat ccgtggtgga gatggacatc ctcacgggtg cgggagacgt ggtgaccgcg 480

accccggacg gcgagcacag cgacctgttc ttcgggttcc ccaactccta cggaacgctg 540

ggatacgcgc tgcgcctgcg gatcgaactc gcgccggtgc gcccgtacgt acgactcgaa 600

cacctgcgtt tctccgatcc ggcacgctac ttcgagcgcc tggcgcgtgc gtgccgcgac 660

cgggaggccg acttcgtcga cggcaccgtc ttcgctcccg acgagctgta cctgacgttg 720

gccacgttca gcggcgagcc cgacgaggtc agcgactaca cgtggatgga cgtctactac 780

cgctcgatca gggagaagac ggtcgaccat ctgccgatcc gcgactacct gtggcggtgg 840

gacaccgact ggttctggtg ttcgcgcgcg ctcggagcgc agaaccggct cgtgcggctg 900

ctcgcgggtc cacgtctgct gcgttccgat gtgtactgga agatcgtcgg tttcgaacgc 960

aggcaccggc tgtgggagcg tgcgagccgg ctgctgggca ggcccgagcg cgaagcggtg 1020

atgcaggaca tcgaggtgcc ggtgcaccgc gccgaggagt tcctgacgtt cctgcaccgg 1080

gagatcccca tcagtccggt gtggatctgc ccgctgagtg ggcgggacgc gcgccggtgg 1140

ccgctgtacg agctcgaccc ggacgagctg tacgtcaact tcggtttctg gggcacggtg 1200

ccgctcgagc caggcgaacc gcagggttcg cacaaccggc gggtggagaa cgtggttacc 1260

gaactcgacg gacggaaatc cctgtactcg gagagtttct acgaccgcga cacgttctgg 1320

cggttgtacg gagggaatca aggacagacg taccaggccc tgaagcatcg ctacgacccg 1380

aacgggagat tgctggacct gtacgccaag tgcgttcaag cgaggtga 1428

<210> 62

<211> 475

<212> PRT

<213> 未知的

<220>

<223> 拉格西斯链霉菌

<400> 62

Met Ile Thr Leu Ala Gly Arg Ala Gly Ala Arg Asp His Gly Cys Met

1 5 10 15

Ala Phe Gly Ala Ala Ile Pro Thr Gly Ser Gly His Ala Gly Tyr Ala

20 25 30

Glu Arg Val Ala Thr Leu Arg Ala His Leu Ala Asp Leu Pro Glu Gly

35 40 45

Thr Pro Val Arg Leu Ala Lys Gly Thr Ser Asn Leu Phe Arg Pro Arg

50 55 60

Ser Arg Ala Thr Ala Gly Leu Asp Val Ser Ala Phe Asp His Val Leu

65 70 75 80

Ser Ile Asp Pro Gln Asn Arg Thr Ala Asp Val Glu Gly Met Val Thr

85 90 95

Tyr Glu Arg Leu Val Asp Ala Thr Leu Pro His Gly Leu Met Pro Leu

100 105 110

Val Val Pro Gln Leu Lys Thr Ile Thr Leu Gly Gly Ala Val Thr Gly

115 120 125

Leu Gly Ile Glu Ser Ser Ser Phe Arg Glu Gly Met Pro His Glu Ser

130 135 140

Val Val Glu Met Asp Ile Leu Thr Gly Ala Gly Asp Val Val Thr Ala

145 150 155 160

Thr Pro Asp Gly Glu His Ser Asp Leu Phe Phe Gly Phe Pro Asn Ser

165 170 175

Tyr Gly Thr Leu Gly Tyr Ala Leu Arg Leu Arg Ile Glu Leu Ala Pro

180 185 190

Val Arg Pro Tyr Val Arg Leu Glu His Leu Arg Phe Ser Asp Pro Ala

195 200 205

Arg Tyr Phe Glu Arg Leu Ala Arg Ala Cys Arg Asp Arg Glu Ala Asp

210 215 220

Phe Val Asp Gly Thr Val Phe Ala Pro Asp Glu Leu Tyr Leu Thr Leu

225 230 235 240

Ala Thr Phe Ser Gly Glu Pro Asp Glu Val Ser Asp Tyr Thr Trp Met

245 250 255

Asp Val Tyr Tyr Arg Ser Ile Arg Glu Lys Thr Val Asp His Leu Pro

260 265 270

Ile Arg Asp Tyr Leu Trp Arg Trp Asp Thr Asp Trp Phe Trp Cys Ser

275 280 285

Arg Ala Leu Gly Ala Gln Asn Arg Leu Val Arg Leu Leu Ala Gly Pro

290 295 300

Arg Leu Leu Arg Ser Asp Val Tyr Trp Lys Ile Val Gly Phe Glu Arg

305 310 315 320

Arg His Arg Leu Trp Glu Arg Ala Ser Arg Leu Leu Gly Arg Pro Glu

325 330 335

Arg Glu Ala Val Met Gln Asp Ile Glu Val Pro Val His Arg Ala Glu

340 345 350

Glu Phe Leu Thr Phe Leu His Arg Glu Ile Pro Ile Ser Pro Val Trp

355 360 365

Ile Cys Pro Leu Ser Gly Arg Asp Ala Arg Arg Trp Pro Leu Tyr Glu

370 375 380

Leu Asp Pro Asp Glu Leu Tyr Val Asn Phe Gly Phe Trp Gly Thr Val

385 390 395 400

Pro Leu Glu Pro Gly Glu Pro Gln Gly Ser His Asn Arg Arg Val Glu

405 410 415

Asn Val Val Thr Glu Leu Asp Gly Arg Lys Ser Leu Tyr Ser Glu Ser

420 425 430

Phe Tyr Asp Arg Asp Thr Phe Trp Arg Leu Tyr Gly Gly Asn Gln Gly

435 440 445

Gln Thr Tyr Gln Ala Leu Lys His Arg Tyr Asp Pro Asn Gly Arg Leu

450 455 460

Leu Asp Leu Tyr Ala Lys Cys Val Gln Ala Arg

465 470 475

<210> 63

<211> 1317

<212> DNA

<213> 未知的

<220>

<223> 拉格西斯链霉菌

<400> 63

ttggcgtcgt cggggccacc gctgcccgcc agggcggggt cccgatcggc tgactcgacg 60

gcgttggacg cgatcctgcg ccgcgtgctc ggggacgacc cgcccgtggc cgtgaccgcg 120

ttcgacggca cggtggtcgg tgacccggac tcggcgctgc agctgcacat ccgcacgccg 180

acggccctga gctacgtgct caccgcgccc aacgaactcg ggttggcgcg ggcctacgtc 240

acgggacatc tcgacgtgac cggcgacgtc taccaggtgc tgcgcgcact gacgagcgtg 300

gccgagaacc tcacgacggc cgatcggatg tggctggccg gccgtctcgc acgggacttc 360

accgaccggc tgcggccggt gccgatcccc gtcgaggagg cgccgtcgcg gctccgcagg 420

accgcacgtg gcctccggca ttccaaggcg cgcgacagcg acgcgatctc ccggcactac 480

gacgtctcga accgcttcta cgagctggtg ctcggcccgt cgatggccta cacgtgcgcc 540

tgctacccgg aggatgcggc cacgctggag caggcacagt tccacaagtt cgacctcgtg 600

tgccgaaagc tcggtctgaa gccggggatg cgcctgctcg acgtgggctg cggttggggc 660

ggcatggtcg cccacgccgt ggagcactac ggggtgcggg cgatcggcgt caccctctcg 720

cgccagcagg cggagtgggg acagcgggac ctcgaggcca ggggcctggc cgatcgcggc 780

gagatccgcc atctggacta ccgcgacgtg cccgagaccg ggttcgacgc ggtgtcgtcc 840

atcgggctca ccgaacacat cggcgcgcgg aacctgccgt cgtacttccg cttcctgcac 900

tcgaagttgc gtcccggcgg acggttgctc aaccactgca tcgtgcgccc gcacacctac 960

gactcccatc ggacgggccc gttcatcgac cgctacgtct tcccggacgg cgaactcgag 1020

ggcgtcggga cgatcgtgtc ggcgatgcag gaccacgggt tcgaggtacg gcacgcggag 1080

aacctgcggg aacactacgg gcgcaccctc gcggcgtggt gcgccaatct cgacgcgcac 1140

tgggaggcgg cggtggccga ggcgggcgtg cagcgggcca gggtgtgggc gctgtacatg 1200

gcggcctccc ggctgtcgtt cgaacgtcat gagctcgagc tgcagcaggt gctcggcgtg 1260

aaacccgacg ccgcgggcgg gtcgtcgatg ccgcttcgcc cggactgggg ggtgtga 1317

<210> 64

<211> 438

<212> PRT

<213> 未知的

<220>

<223> 拉格西斯链霉菌

<400> 64

Leu Ala Ser Ser Gly Pro Pro Leu Pro Ala Arg Ala Gly Ser Arg Ser

1 5 10 15

Ala Asp Ser Thr Ala Leu Asp Ala Ile Leu Arg Arg Val Leu Gly Asp

20 25 30

Asp Pro Pro Val Ala Val Thr Ala Phe Asp Gly Thr Val Val Gly Asp

35 40 45

Pro Asp Ser Ala Leu Gln Leu His Ile Arg Thr Pro Thr Ala Leu Ser

50 55 60

Tyr Val Leu Thr Ala Pro Asn Glu Leu Gly Leu Ala Arg Ala Tyr Val

65 70 75 80

Thr Gly His Leu Asp Val Thr Gly Asp Val Tyr Gln Val Leu Arg Ala

85 90 95

Leu Thr Ser Val Ala Glu Asn Leu Thr Thr Ala Asp Arg Met Trp Leu

100 105 110

Ala Gly Arg Leu Ala Arg Asp Phe Thr Asp Arg Leu Arg Pro Val Pro

115 120 125

Ile Pro Val Glu Glu Ala Pro Ser Arg Leu Arg Arg Thr Ala Arg Gly

130 135 140

Leu Arg His Ser Lys Ala Arg Asp Ser Asp Ala Ile Ser Arg His Tyr

145 150 155 160

Asp Val Ser Asn Arg Phe Tyr Glu Leu Val Leu Gly Pro Ser Met Ala

165 170 175

Tyr Thr Cys Ala Cys Tyr Pro Glu Asp Ala Ala Thr Leu Glu Gln Ala

180 185 190

Gln Phe His Lys Phe Asp Leu Val Cys Arg Lys Leu Gly Leu Lys Pro

195 200 205

Gly Met Arg Leu Leu Asp Val Gly Cys Gly Trp Gly Gly Met Val Ala

210 215 220

His Ala Val Glu His Tyr Gly Val Arg Ala Ile Gly Val Thr Leu Ser

225 230 235 240

Arg Gln Gln Ala Glu Trp Gly Gln Arg Asp Leu Glu Ala Arg Gly Leu

245 250 255

Ala Asp Arg Gly Glu Ile Arg His Leu Asp Tyr Arg Asp Val Pro Glu

260 265 270

Thr Gly Phe Asp Ala Val Ser Ser Ile Gly Leu Thr Glu His Ile Gly

275 280 285

Ala Arg Asn Leu Pro Ser Tyr Phe Arg Phe Leu His Ser Lys Leu Arg

290 295 300

Pro Gly Gly Arg Leu Leu Asn His Cys Ile Val Arg Pro His Thr Tyr

305 310 315 320

Asp Ser His Arg Thr Gly Pro Phe Ile Asp Arg Tyr Val Phe Pro Asp

325 330 335

Gly Glu Leu Glu Gly Val Gly Thr Ile Val Ser Ala Met Gln Asp His

340 345 350

Gly Phe Glu Val Arg His Ala Glu Asn Leu Arg Glu His Tyr Gly Arg

355 360 365

Thr Leu Ala Ala Trp Cys Ala Asn Leu Asp Ala His Trp Glu Ala Ala

370 375 380

Val Ala Glu Ala Gly Val Gln Arg Ala Arg Val Trp Ala Leu Tyr Met

385 390 395 400

Ala Ala Ser Arg Leu Ser Phe Glu Arg His Glu Leu Glu Leu Gln Gln

405 410 415

Val Leu Gly Val Lys Pro Asp Ala Ala Gly Gly Ser Ser Met Pro Leu

420 425 430

Arg Pro Asp Trp Gly Val

435

<210> 65

<211> 501

<212> DNA

<213> 未知的

<220>

<223> 拉格西斯链霉菌

<400> 65

gtgcgcgtgg caccgccccg catcggtgcc acacccggcg cggtgggcgc accggactac 60

gcctccgcct tccgcgtgcc gacggcggcg gcccgcaggc gttcgccgcg ggaatggacg 120

cgtgcggtgt tcgagggcgc gcccgcgccg ttggcgctgt tcgtgcgttg gggatggctg 180

gccgtgctcc ggttgcgcct cagtgaggac cccgaggcgg tggcgggctg gagacccacg 240

acgctcgacc ccggcacctc cgacgccccc gacacctctg agacagccgg aaactccgac 300

gctgccgcac tggaggccga atcgccgctg ctggaggcgt gcaacgtggc gttcgtcgac 360

gacgacggtg tcacgtgggc gacctacgtc cggttccgtg gtggcctcgg ccgcgcggtg 420

tgggcggtgg cggcgcggat ccaccacgtc gtcatcccct acctgctgcg gcgggcggtg 480

cggcgcacgg aacgggagtg a 501

<210> 66

<211> 166

<212> PRT

<213> 未知的

<220>

<223> 拉格西斯链霉菌

<400> 66

Val Arg Val Ala Pro Pro Arg Ile Gly Ala Thr Pro Gly Ala Val Gly

1 5 10 15

Ala Pro Asp Tyr Ala Ser Ala Phe Arg Val Pro Thr Ala Ala Ala Arg

20 25 30

Arg Arg Ser Pro Arg Glu Trp Thr Arg Ala Val Phe Glu Gly Ala Pro

35 40 45

Ala Pro Leu Ala Leu Phe Val Arg Trp Gly Trp Leu Ala Val Leu Arg

50 55 60

Leu Arg Leu Ser Glu Asp Pro Glu Ala Val Ala Gly Trp Arg Pro Thr

65 70 75 80

Thr Leu Asp Pro Gly Thr Ser Asp Ala Pro Asp Thr Ser Glu Thr Ala

85 90 95

Gly Asn Ser Asp Ala Ala Ala Leu Glu Ala Glu Ser Pro Leu Leu Glu

100 105 110

Ala Cys Asn Val Ala Phe Val Asp Asp Asp Gly Val Thr Trp Ala Thr

115 120 125

Tyr Val Arg Phe Arg Gly Gly Leu Gly Arg Ala Val Trp Ala Val Ala

130 135 140

Ala Arg Ile His His Val Val Ile Pro Tyr Leu Leu Arg Arg Ala Val

145 150 155 160

Arg Arg Thr Glu Arg Glu

165

<210> 67

<211> 1413

<212> DNA

<213> 未知的

<220>

<223> 嗜热子囊菌

<400> 67

gtgaactgtc agtcttccgc gtccaacctc gccaaccaca tcaacgcggt gtacgagctg 60

cgccgcgcct atgcgcggct gtccgccgac aagccggtgc gcctggcgaa gaccacctcc 120

aacctcttcc gcttccgcag ccgggacgat gccgcgcgtc tcgacgtcag cgctttcacc 180

tcggtgatca gcatcgacac ggaggcgcgg gtcgcggagg tgggcggcat gaccacctac 240

gaggacctgg tcgccgccac cctgcggcat ggcctgatgc cgccggtggt tccgcaactg 300

cgcacgatca ccctgggcgg tgcggtcacc gggctgggga tcgaatcctc gtccttccgc 360

aacgggctcc cgcacgagtc agtggaagag atggagatcc tcaccggcag cggccaggtg 420

gtggtggccc ggcgcgacaa cgagcaccgc gacctgttct acggtttccc caactcgtac 480

ggcaccctcg gttacgcgct gcggctccgc atccagctcg aaccggtccg cccctacgtc 540

cacctgcggc acctgcggtt caccgatgcc gcagcggcca tggccgcgct ggagcagatc 600

tgcgcggacc gcacccacga cggggagacc gtcgacttcg tcgacggcgt cgtgttcgcc 660

cgcaacgagc tgtacctgac cttggggacg ttcaccgacc gggctccgtg gaccagcgac 720

tacaccggaa ccgacatcta ctaccggtcg atcccccgct acgcgggccc cggccccggc 780

gactacctca ccacgcacga ctacctgtgg cggtgggaca ccgactggtt ctggtgctcc 840

cgcgccttcg gactgcagca tcccgtggtg cgccgcctgt ggccgcgttc cttgaaacgc 900

tccgacgtct accgcaagct cgtcgcctgg gaccggcgca ctgacgcgag ccgcctgctc 960

gactactacc gcgggcgccc gcccaaggaa ccggtgatcc aggacatcga ggttgaggtg 1020

gggcgggctg ccgagttcct cgacttcttc cacaccgaga tcggcatgtc cccggtgtgg 1080

ctgtgcccgc tgcggctgcg agaagacaca gccgacgata cggaaccggt ctggccgctc 1140

taccccctca aaccccgccg cctctacgtc aacttcgggt tttggggcct cgttccgatc 1200

cgtcccggtg gaggcaggac ataccacaac cggctgatcg aaaaagaagt gacccggttg 1260

ggcgggcaca agtcgctcta ctcggacgcc ttctacgacg aggacgagtt ctgggagctc 1320

tacaacgggg agatctaccg caagctcaaa gctgcctacg accccgacgg tcgactgctc 1380

gacctgtaca ccaagtgcgt cggcggcggg tga 1413

<210> 68

<211> 470

<212> PRT

<213> 未知的

<220>

<223> 嗜热子囊菌

<400> 68

Val Asn Cys Gln Ser Ser Ala Ser Asn Leu Ala Asn His Ile Asn Ala

1 5 10 15

Val Tyr Glu Leu Arg Arg Ala Tyr Ala Arg Leu Ser Ala Asp Lys Pro

20 25 30

Val Arg Leu Ala Lys Thr Thr Ser Asn Leu Phe Arg Phe Arg Ser Arg

35 40 45

Asp Asp Ala Ala Arg Leu Asp Val Ser Ala Phe Thr Ser Val Ile Ser

50 55 60

Ile Asp Thr Glu Ala Arg Val Ala Glu Val Gly Gly Met Thr Thr Tyr

65 70 75 80

Glu Asp Leu Val Ala Ala Thr Leu Arg His Gly Leu Met Pro Pro Val

85 90 95

Val Pro Gln Leu Arg Thr Ile Thr Leu Gly Gly Ala Val Thr Gly Leu

100 105 110

Gly Ile Glu Ser Ser Ser Phe Arg Asn Gly Leu Pro His Glu Ser Val

115 120 125

Glu Glu Met Glu Ile Leu Thr Gly Ser Gly Gln Val Val Val Ala Arg

130 135 140

Arg Asp Asn Glu His Arg Asp Leu Phe Tyr Gly Phe Pro Asn Ser Tyr

145 150 155 160

Gly Thr Leu Gly Tyr Ala Leu Arg Leu Arg Ile Gln Leu Glu Pro Val

165 170 175

Arg Pro Tyr Val His Leu Arg His Leu Arg Phe Thr Asp Ala Ala Ala

180 185 190

Ala Met Ala Ala Leu Glu Gln Ile Cys Ala Asp Arg Thr His Asp Gly

195 200 205

Glu Thr Val Asp Phe Val Asp Gly Val Val Phe Ala Arg Asn Glu Leu

210 215 220

Tyr Leu Thr Leu Gly Thr Phe Thr Asp Arg Ala Pro Trp Thr Ser Asp

225 230 235 240

Tyr Thr Gly Thr Asp Ile Tyr Tyr Arg Ser Ile Pro Arg Tyr Ala Gly

245 250 255

Pro Gly Pro Gly Asp Tyr Leu Thr Thr His Asp Tyr Leu Trp Arg Trp

260 265 270

Asp Thr Asp Trp Phe Trp Cys Ser Arg Ala Phe Gly Leu Gln His Pro

275 280 285

Val Val Arg Arg Leu Trp Pro Arg Ser Leu Lys Arg Ser Asp Val Tyr

290 295 300

Arg Lys Leu Val Ala Trp Asp Arg Arg Thr Asp Ala Ser Arg Leu Leu

305 310 315 320

Asp Tyr Tyr Arg Gly Arg Pro Pro Lys Glu Pro Val Ile Gln Asp Ile

325 330 335

Glu Val Glu Val Gly Arg Ala Ala Glu Phe Leu Asp Phe Phe His Thr

340 345 350

Glu Ile Gly Met Ser Pro Val Trp Leu Cys Pro Leu Arg Leu Arg Glu

355 360 365

Asp Thr Ala Asp Asp Thr Glu Pro Val Trp Pro Leu Tyr Pro Leu Lys

370 375 380

Pro Arg Arg Leu Tyr Val Asn Phe Gly Phe Trp Gly Leu Val Pro Ile

385 390 395 400

Arg Pro Gly Gly Gly Arg Thr Tyr His Asn Arg Leu Ile Glu Lys Glu

405 410 415

Val Thr Arg Leu Gly Gly His Lys Ser Leu Tyr Ser Asp Ala Phe Tyr

420 425 430

Asp Glu Asp Glu Phe Trp Glu Leu Tyr Asn Gly Glu Ile Tyr Arg Lys

435 440 445

Leu Lys Ala Ala Tyr Asp Pro Asp Gly Arg Leu Leu Asp Leu Tyr Thr

450 455 460

Lys Cys Val Gly Gly Gly

465 470

<210> 69

<211> 1272

<212> DNA

<213> 未知的

<220>

<223> 嗜热子囊菌

<400> 69

atgcgactgg cggaggtatt cgaacgtgtc gtcggacccg atgcgcccgt ccacttccgg 60

gcctacgacg gcagcactgc gggagatcca cgcagtgaag tcgctatcgt ggttcgccac 120

ccggcagccg tcaactacat cgtccaagcg ccgggagcac tcggtttgac ccgcgcctac 180

gtggcgggat acctcgacgt cgaaggggac atgtacaccg cgctgcgggc aatggccgac 240

gtggtgttcc aggaccggcc gcggctgtcc cccggggaac tgctgcggat catccgcggg 300

atcgggtggg tgaagttcgt caaccggctt ccaccgccgc cgcaggaggt gcgccagtcc 360

cgcctcgccg ccctgggctg gcgccactcc aagcagcgcg acgccgaagc catccagcac 420

cactacgacg tctccaacgc cttctacgcc ctggtcttgg gcgagtcgat gacctacacc 480

tgcgcggtct acccgaccga gcaggccacg ctggagcagg cacagttctt caagcacgag 540

ctgatcgccc gcaagctcgg tcttgcccct gggatacgac tgctggatgt ggggtgcggc 600

tggggcggca tggtcatcca cgcggcccgg gagcacgggg tcaaagccct gggggtgacc 660

ctgtccaaag agcaggctga gtgggcgcag aagcggatcg cccacgaggg cctgggcgac 720

ctggcagaag tccggcacat ggactaccgg gacctgcccg acggcgagta cgacgcgatc 780

agctcgatcg ggttgaccga gcacgtcggc aaaaagaacg tgcccgccta cttcgcgtcg 840

ctgtaccgca agctcgtccc gggaggccgc ctgctcaacc actgcatcac ccggccccgc 900

aacgacctgc cgcccttcaa acgcggcggg gtgatcaacc gctacgtctt ccccgatggg 960

gagctggaag ggcccggctg gctgcaggcg gcgatgaacg acgccgggtt cgaaatccgc 1020

caccaggaga acctgcggga gcactacgca cggaccctgc gggactggct ggccaacctg 1080

gaccgcaact gggatgccgc ggtgcgggaa gtgggggagg gcacggcccg agtgtggcgg 1140

ctctacatgg ccgggtgcgt gctcggcttc gaacgcaacg tggtgcaact gcaccagatc 1200

ctcggggtga agctcgacgg gaccgaggcg cggatgccgc tgcgccccga cttcgaaccg 1260

ccgctgcctt aa 1272

<210> 70

<211> 423

<212> PRT

<213> 未知的

<220>

<223> 嗜热子囊菌

<400> 70

Met Arg Leu Ala Glu Val Phe Glu Arg Val Val Gly Pro Asp Ala Pro

1 5 10 15

Val His Phe Arg Ala Tyr Asp Gly Ser Thr Ala Gly Asp Pro Arg Ser

20 25 30

Glu Val Ala Ile Val Val Arg His Pro Ala Ala Val Asn Tyr Ile Val

35 40 45

Gln Ala Pro Gly Ala Leu Gly Leu Thr Arg Ala Tyr Val Ala Gly Tyr

50 55 60

Leu Asp Val Glu Gly Asp Met Tyr Thr Ala Leu Arg Ala Met Ala Asp

65 70 75 80

Val Val Phe Gln Asp Arg Pro Arg Leu Ser Pro Gly Glu Leu Leu Arg

85 90 95

Ile Ile Arg Gly Ile Gly Trp Val Lys Phe Val Asn Arg Leu Pro Pro

100 105 110

Pro Pro Gln Glu Val Arg Gln Ser Arg Leu Ala Ala Leu Gly Trp Arg

115 120 125

His Ser Lys Gln Arg Asp Ala Glu Ala Ile Gln His His Tyr Asp Val

130 135 140

Ser Asn Ala Phe Tyr Ala Leu Val Leu Gly Glu Ser Met Thr Tyr Thr

145 150 155 160

Cys Ala Val Tyr Pro Thr Glu Gln Ala Thr Leu Glu Gln Ala Gln Phe

165 170 175

Phe Lys His Glu Leu Ile Ala Arg Lys Leu Gly Leu Ala Pro Gly Ile

180 185 190

Arg Leu Leu Asp Val Gly Cys Gly Trp Gly Gly Met Val Ile His Ala

195 200 205

Ala Arg Glu His Gly Val Lys Ala Leu Gly Val Thr Leu Ser Lys Glu

210 215 220

Gln Ala Glu Trp Ala Gln Lys Arg Ile Ala His Glu Gly Leu Gly Asp

225 230 235 240

Leu Ala Glu Val Arg His Met Asp Tyr Arg Asp Leu Pro Asp Gly Glu

245 250 255

Tyr Asp Ala Ile Ser Ser Ile Gly Leu Thr Glu His Val Gly Lys Lys

260 265 270

Asn Val Pro Ala Tyr Phe Ala Ser Leu Tyr Arg Lys Leu Val Pro Gly

275 280 285

Gly Arg Leu Leu Asn His Cys Ile Thr Arg Pro Arg Asn Asp Leu Pro

290 295 300

Pro Phe Lys Arg Gly Gly Val Ile Asn Arg Tyr Val Phe Pro Asp Gly

305 310 315 320

Glu Leu Glu Gly Pro Gly Trp Leu Gln Ala Ala Met Asn Asp Ala Gly

325 330 335

Phe Glu Ile Arg His Gln Glu Asn Leu Arg Glu His Tyr Ala Arg Thr

340 345 350

Leu Arg Asp Trp Leu Ala Asn Leu Asp Arg Asn Trp Asp Ala Ala Val

355 360 365

Arg Glu Val Gly Glu Gly Thr Ala Arg Val Trp Arg Leu Tyr Met Ala

370 375 380

Gly Cys Val Leu Gly Phe Glu Arg Asn Val Val Gln Leu His Gln Ile

385 390 395 400

Leu Gly Val Lys Leu Asp Gly Thr Glu Ala Arg Met Pro Leu Arg Pro

405 410 415

Asp Phe Glu Pro Pro Leu Pro

420

<210> 71

<211> 447

<212> DNA

<213> 未知的

<220>

<223> 嗜热子囊菌

<400> 71

atggctgcga ccgatgacga ccggcaccac accaccgtcg ccctcgacct catcgacgcg 60

tatgtgcgcg ccgaccgcag aatgatcggt gaacgttccg cggggatcag cgcggaggcg 120

ggggagcgga tcgtctccac cctgaaagtg tgcgcggcct tccttgcccg ccgggtccag 180

gagaccgggg tgccgtggcg cgccgcggac tcccgggaag cggtcgcccg caccgtcgcc 240

gacctgctgg aacccgaggt ggaattcgcg gtcgtctccg cctgggaggc gtacgcgatc 300

ggggagcacg aggccgcctg ggtccgggcg cacggcgatc cgctggtctt cgtccacatg 360

ctggccgcgt tctccgctgc tatcggcaca gcggtctacg gccgtgagga gctgctgccc 420

acgctgcgca gggtgacagc acgataa 447

<210> 72

<211> 148

<212> PRT

<213> 未知的

<220>

<223> 嗜热子囊菌

<400> 72

Met Ala Ala Thr Asp Asp Asp Arg His His Thr Thr Val Ala Leu Asp

1 5 10 15

Leu Ile Asp Ala Tyr Val Arg Ala Asp Arg Arg Met Ile Gly Glu Arg

20 25 30

Ser Ala Gly Ile Ser Ala Glu Ala Gly Glu Arg Ile Val Ser Thr Leu

35 40 45

Lys Val Cys Ala Ala Phe Leu Ala Arg Arg Val Gln Glu Thr Gly Val

50 55 60

Pro Trp Arg Ala Ala Asp Ser Arg Glu Ala Val Ala Arg Thr Val Ala

65 70 75 80

Asp Leu Leu Glu Pro Glu Val Glu Phe Ala Val Val Ser Ala Trp Glu

85 90 95

Ala Tyr Ala Ile Gly Glu His Glu Ala Ala Trp Val Arg Ala His Gly

100 105 110

Asp Pro Leu Val Phe Val His Met Leu Ala Ala Phe Ser Ala Ala Ile

115 120 125

Gly Thr Ala Val Tyr Gly Arg Glu Glu Leu Leu Pro Thr Leu Arg Arg

130 135 140

Val Thr Ala Arg

145

<210> 73

<211> 1368

<212> DNA

<213> 弯曲嗜热单胞菌

<400> 73

atgtcacagc tggcggtcac agaccaccac gagcgagcgg tcgaggcgct gcgcaggtcg 60

tatgcggcga tcccgccggg cacaccggtc cgcttggcca agcagacctc caacctgttc 120

cgcttccgcg agccgacggc cgcgcccggc ctggacgtgt ccggcttcaa ccgggtgctg 180

gcggtggacc cggatgcgcg caccgccgac gtgcagggca tgaccaccta cgaggacctg 240

gtcgacgcca ccctgccgca cgggctgatg ccgctggtgg tgccccagct caagacgatc 300

acgctgggcg gggcggtgac cggcctgggc atcgagtcca cctccttccg caacggcctg 360

ccgcacgagt cggtgctgga gatgcagatc atcaccggcg ccggcgaagt ggtcaccgcc 420

accccggacg gggagcactc cgacctgttc tggggcttcc ccaactccta cgggacgctg 480

gggtacgccc tgaagctgaa gatcgaactg gagccggtca agccgtacgt ccggctgcgg 540

cacctgcgct tcgacgacgc cggcgagtgc gccgccaagc tcgccgagct gagcgaaagc 600

cgcgagcacg agggcgatga ggtgcacttt ttggacggca ccttcttcgg gccgcgcgag 660

atgtacctga cgctcggcac gttcaccgac accgccccct atgtgtcgga ctacaccggg 720

cagcacatct actaccggtc gatccagcag cggtcgatcg actttttgac catccgcgac 780

tacctgtggc gctgggacac cgactggttc tggtgctcgc gcgccctggg cgtgcagaac 840

ccgctgatcc ggcgggtgtg gccgaagagc gccaagcggt cggatgtgta ccgcaagctg 900

gtggcctacg aaaagcgcta ccagttcaag gcgcgcatcg accggtggac gggcaagccg 960

ccgcgcgagg acgtcatcca ggacatcgag gtgccggcag aacgcctgcc ggagttcctg 1020

gagttcttcc acgacaagat cgggatgagc ccggtgtggc tgtgcccgct gcgggcgcgc 1080

caccgctggc cgctgtaccc gctcaagccc ggcgtcacct acgtcaacgc cggcttctgg 1140

gggacggtgc cgctgcagcc ggggcagatg cccgagtacc acaaccggct gatcgaacgg 1200

aaggtcgccc aactggacgg ccacaagtct ctgtactcga cggcgttcta ctcgcgtgag 1260

gagttctggc ggcactacga cggggaaacc taccggcgtc tgaaggacac ctacgacccc 1320

gacgcgcgcc tgctcgacct ctacgacaag tgcgtgcggg gacgctga 1368

<210> 74

<211> 455

<212> PRT

<213> 弯曲嗜热单胞菌

<400> 74

Met Ser Gln Leu Ala Val Thr Asp His His Glu Arg Ala Val Glu Ala

1 5 10 15

Leu Arg Arg Ser Tyr Ala Ala Ile Pro Pro Gly Thr Pro Val Arg Leu

20 25 30

Ala Lys Gln Thr Ser Asn Leu Phe Arg Phe Arg Glu Pro Thr Ala Ala

35 40 45

Pro Gly Leu Asp Val Ser Gly Phe Asn Arg Val Leu Ala Val Asp Pro

50 55 60

Asp Ala Arg Thr Ala Asp Val Gln Gly Met Thr Thr Tyr Glu Asp Leu

65 70 75 80

Val Asp Ala Thr Leu Pro His Gly Leu Met Pro Leu Val Val Pro Gln

85 90 95

Leu Lys Thr Ile Thr Leu Gly Gly Ala Val Thr Gly Leu Gly Ile Glu

100 105 110

Ser Thr Ser Phe Arg Asn Gly Leu Pro His Glu Ser Val Leu Glu Met

115 120 125

Gln Ile Ile Thr Gly Ala Gly Glu Val Val Thr Ala Thr Pro Asp Gly

130 135 140

Glu His Ser Asp Leu Phe Trp Gly Phe Pro Asn Ser Tyr Gly Thr Leu

145 150 155 160

Gly Tyr Ala Leu Lys Leu Lys Ile Glu Leu Glu Pro Val Lys Pro Tyr

165 170 175

Val Arg Leu Arg His Leu Arg Phe Asp Asp Ala Gly Glu Cys Ala Ala

180 185 190

Lys Leu Ala Glu Leu Ser Glu Ser Arg Glu His Glu Gly Asp Glu Val

195 200 205

His Phe Leu Asp Gly Thr Phe Phe Gly Pro Arg Glu Met Tyr Leu Thr

210 215 220

Leu Gly Thr Phe Thr Asp Thr Ala Pro Tyr Val Ser Asp Tyr Thr Gly

225 230 235 240

Gln His Ile Tyr Tyr Arg Ser Ile Gln Gln Arg Ser Ile Asp Phe Leu

245 250 255

Thr Ile Arg Asp Tyr Leu Trp Arg Trp Asp Thr Asp Trp Phe Trp Cys

260 265 270

Ser Arg Ala Leu Gly Val Gln Asn Pro Leu Ile Arg Arg Val Trp Pro

275 280 285

Lys Ser Ala Lys Arg Ser Asp Val Tyr Arg Lys Leu Val Ala Tyr Glu

290 295 300

Lys Arg Tyr Gln Phe Lys Ala Arg Ile Asp Arg Trp Thr Gly Lys Pro

305 310 315 320

Pro Arg Glu Asp Val Ile Gln Asp Ile Glu Val Pro Ala Glu Arg Leu

325 330 335

Pro Glu Phe Leu Glu Phe Phe His Asp Lys Ile Gly Met Ser Pro Val

340 345 350

Trp Leu Cys Pro Leu Arg Ala Arg His Arg Trp Pro Leu Tyr Pro Leu

355 360 365

Lys Pro Gly Val Thr Tyr Val Asn Ala Gly Phe Trp Gly Thr Val Pro

370 375 380

Leu Gln Pro Gly Gln Met Pro Glu Tyr His Asn Arg Leu Ile Glu Arg

385 390 395 400

Lys Val Ala Gln Leu Asp Gly His Lys Ser Leu Tyr Ser Thr Ala Phe

405 410 415

Tyr Ser Arg Glu Glu Phe Trp Arg His Tyr Asp Gly Glu Thr Tyr Arg

420 425 430

Arg Leu Lys Asp Thr Tyr Asp Pro Asp Ala Arg Leu Leu Asp Leu Tyr

435 440 445

Asp Lys Cys Val Arg Gly Arg

450 455

<210> 75

<211> 1263

<212> DNA

<213> 弯曲嗜热单胞菌

<400> 75

atgacgctgg ccaaggtctt cgaggagctg gtcggggcgg acgcccctgt ggagctcacc 60

gcctacgacg gatcgagagc cggacgcctg ggcagtgatc tgcgggtcca cgtgaagtcg 120

ccgtacgcgg tgtcctacct ggtgcactcg ccgagcgcgc tcgggctggc ccgcgcgtac 180

gtggccgggc acctggacgc ctacggcgac atgtacacgc tgctgcggga gatgacgcag 240

ctgaccgagg cgctgacgcc caaggcccgg ctgcggctgc tggccggtgt cctgcaggat 300

ccgctgctgc gcgcggcggc cagccgccgt ctgccgcccc cgccgcagga ggtgcggacc 360

ggccgcacct cctggttccg gcacaccaag cggcgggacg ccaaggccat ctcccaccac 420

tacgacgtgt ccaacacctt ctatgagtgg gtgctgggcc cgtcgatgac ctacacctgc 480

gcctgtttcc ccaccgagga cgccaccttg gaggaggcgc agttccacaa gcacgacctg 540

gtcgccaaga agctcgggct gcggccgggc atgcggctgc tggacgtggg ctgcggctgg 600

ggcggcatgg tgatgcacgc cgccaagcac tacggggtgc gggcgctggg cgtcacgctg 660

tccaagcagc aggccgagtg ggcgcagaag gccatcgccg aggcgggcct gagcgacctg 720

gccgaggtcc gccaccagga ctaccgggac gtcaccgagg gcgacttcga cgccatcagc 780

tcgatcggcc tcaccgagca catcggcaag gccaacctgc cgtcctactt cggcttcctg 840

tacggcaagc tcaagccggg cgggcggctg ctcaaccact gcatcacccg gcccgacaac 900

acccagccgg ccatgaagaa ggacgggttc atcaaccggt acgtcttccc cgacggggag 960

ctggaggggc ccggctacct gcagacccag atgaacgacg ccggttttga gatccgccac 1020

caggagaacc tgcgcgagca ctacgcccgc accctggccg gatggtgccg caacctcgat 1080

gagcactggg acgaggcggt ggccgaggtc ggcgagggca ccgcgcgggt gtggcggctg 1140

tacatggccg gcagccggct cggtttcgag ctcaactgga tccagctgca ccagatcctg 1200

ggcgtcaagc tcggcgagcg cggcgagtcc cgcatgccgt tgcggcccga ctggggcgtg 1260

tga 1263

<210> 76

<211> 420

<212> PRT

<213> 弯曲嗜热单胞菌

<400> 76

Met Thr Leu Ala Lys Val Phe Glu Glu Leu Val Gly Ala Asp Ala Pro

1 5 10 15

Val Glu Leu Thr Ala Tyr Asp Gly Ser Arg Ala Gly Arg Leu Gly Ser

20 25 30

Asp Leu Arg Val His Val Lys Ser Pro Tyr Ala Val Ser Tyr Leu Val

35 40 45

His Ser Pro Ser Ala Leu Gly Leu Ala Arg Ala Tyr Val Ala Gly His

50 55 60

Leu Asp Ala Tyr Gly Asp Met Tyr Thr Leu Leu Arg Glu Met Thr Gln

65 70 75 80

Leu Thr Glu Ala Leu Thr Pro Lys Ala Arg Leu Arg Leu Leu Ala Gly

85 90 95

Val Leu Gln Asp Pro Leu Leu Arg Ala Ala Ala Ser Arg Arg Leu Pro

100 105 110

Pro Pro Pro Gln Glu Val Arg Thr Gly Arg Thr Ser Trp Phe Arg His

115 120 125

Thr Lys Arg Arg Asp Ala Lys Ala Ile Ser His His Tyr Asp Val Ser

130 135 140

Asn Thr Phe Tyr Glu Trp Val Leu Gly Pro Ser Met Thr Tyr Thr Cys

145 150 155 160

Ala Cys Phe Pro Thr Glu Asp Ala Thr Leu Glu Glu Ala Gln Phe His

165 170 175

Lys His Asp Leu Val Ala Lys Lys Leu Gly Leu Arg Pro Gly Met Arg

180 185 190

Leu Leu Asp Val Gly Cys Gly Trp Gly Gly Met Val Met His Ala Ala

195 200 205

Lys His Tyr Gly Val Arg Ala Leu Gly Val Thr Leu Ser Lys Gln Gln

210 215 220

Ala Glu Trp Ala Gln Lys Ala Ile Ala Glu Ala Gly Leu Ser Asp Leu

225 230 235 240

Ala Glu Val Arg His Gln Asp Tyr Arg Asp Val Thr Glu Gly Asp Phe

245 250 255

Asp Ala Ile Ser Ser Ile Gly Leu Thr Glu His Ile Gly Lys Ala Asn

260 265 270

Leu Pro Ser Tyr Phe Gly Phe Leu Tyr Gly Lys Leu Lys Pro Gly Gly

275 280 285

Arg Leu Leu Asn His Cys Ile Thr Arg Pro Asp Asn Thr Gln Pro Ala

290 295 300

Met Lys Lys Asp Gly Phe Ile Asn Arg Tyr Val Phe Pro Asp Gly Glu

305 310 315 320

Leu Glu Gly Pro Gly Tyr Leu Gln Thr Gln Met Asn Asp Ala Gly Phe

325 330 335

Glu Ile Arg His Gln Glu Asn Leu Arg Glu His Tyr Ala Arg Thr Leu

340 345 350

Ala Gly Trp Cys Arg Asn Leu Asp Glu His Trp Asp Glu Ala Val Ala

355 360 365

Glu Val Gly Glu Gly Thr Ala Arg Val Trp Arg Leu Tyr Met Ala Gly

370 375 380

Ser Arg Leu Gly Phe Glu Leu Asn Trp Ile Gln Leu His Gln Ile Leu

385 390 395 400

Gly Val Lys Leu Gly Glu Arg Gly Glu Ser Arg Met Pro Leu Arg Pro

405 410 415

Asp Trp Gly Val

420

<210> 77

<211> 7102

<212> DNA

<213> 人工序列

<220>

<223> 合成核酸

<400> 77

gtttgtggaa gcggtattcg caatttaatt aaagctggtg acaattaatc atcggctcgt 60

ataatgtgtg gaattgaatc gatataagga ggttaatcat gtgtctgtgg ttactactga 120

cgcacaggct gcccatgccg ccggcgtctc gcgtcttctg gccagctacc gggcgatccc 180

gcccagcgcg acagtgcgcc ttgcgaaacc gacgtccaac ctgttccgcg cccgcgcccg 240

caccaatgtg aagggtctcg acgtctcggg cctgaccggt gtgatcggtg tcgacccgga 300

cgcgcgcacc gccgatgtgg cgggcatgtg cacctacgag gacctggtgg cggccacgct 360

tccgtacggc cttgccccac tggtggtgcc gcagctcaag accatcacgc tcggtggcgc 420

ggtcaccggt ctgggcatcg agtccacgtc gttccgcaac ggtctgccgc acgaaagtgt 480

cctggagatg gacatcttga ccggttcggg cgagatcgtc acggcctcac cggatcagca 540

ctcggatctg ttccatgcgt tccccaattc atatggaacc cttggttatt ccacccggct 600

gcgcatcgaa ctggagcccg tgcacccgtt tgtggcgttg cgccacctgc gctttcactc 660

gatcaccgat ctggtcgcgg cgatggaccg gatcatcgag accggcgggc tggacggtga 720

acccgtcgac tacctcgacg gcgtggtgtt cagcgcgact gagagttacc tgtgtgttgg 780

cttcaagacg aaaacgccgg ggccggtcag cgattacaca ggtcagcaga tcttctaccg 840

gtcgatccag catgacggcg acaccggcgc cgagaaacac gaccggctga ccatccacga 900

ctacctgtgg cgctgggaca ccgactggtt ctggtgctca cgggcattcg gcgctcagca 960

tccggtgatc cgcaggttct ggccgcggcg gctgcgccgc agcagcttct actggaagct 1020

ggtggcctac gaccagcggt acgacatcgc cgaccgtatc gagaagcgca acgggcgccc 1080

gccgcgcgag cgggtggtcc aggacgtcga ggtgcccatc gagcggtgcg cggacttcgt 1140

cgagtggttc ctgcagaatg tgccgatcga gccgatctgg ctgtgccccc tacggttgcg 1200

tgacagcgcc gacggcggtg cctcgtggcc cctgtatccg ctgaaggcgc accacaccta 1260

cgtcaacatc ggtttctggt catcagtgcc ggtgggcccc gaggagggcc acaccaaccg 1320

cctcatcgag aaaaaagtcg cggagctgga cgggcacaaa tctttgtact cggacgctta 1380

ttacacacgt gacgaattcg acgagctgta cggcggtgag gtctacaaca ccgtcaagaa 1440

gacgtacgac ccggattcac gtctgctaga cctgtattcg aaggcggtgc aaagacaatg 1500

accacattca aagaacgcga gacgtccaca gcggaccgca agctcaccct ggccgagatc 1560

ctcgagatct tcgccgcggg taaggagccg ctgaagttca ctgcgtacga cggcagctcg 1620

gccggtcccg aggacgccac gatgggtctg gacctcaaga ccccgcgtgg gaccacctat 1680

ctggccacgg cacccggcga tctgggcctg gcccgtgcgt atgtctccgg tgacctggag 1740

ccgcacggcg tgcatcccgg cgatccctac ccgctgctgc gcgccctggc cgaacgcatg 1800

gagttcaagc gcccgcctgc gcgtgtgctg gcgaacatcg tgcgctccat cggcatcgag 1860

cacctcaagc cgatcgcacc gccgccgcag gaggcgctgc cccggtggcg ccgcatcatg 1920

gagggcctgc ggcacagcaa gacccgcgac gccgaggcca tccaccacca ctacgacgtg 1980

tcgaacacgt tctacgagtg ggtgctgggc ccgtcgatga cctacacgtg cgcgtgctac 2040

cccaccgagg acgcgaccct cgaagaggcc caggacaaca agtaccgcct ggtgttcgag 2100

aagctgcgcc tgaagcccgg tgaccggttg ctcgacgtgg gctgcggctg gggcggcatg 2160

gtccgctacg cggcccgcca cggcgtcaag gcgctcggtg tcacgctcag ccgcgaacag 2220

gcgacgtggg cgcagaaggc catcgcccag gaaggtctca ccgatctggc cgaggtgcgt 2280

cacggtgatt accgcgacgt catcgaatcc gggttcgacg cggtgtcctc gatcgggctg 2340

accgagcaca tcggcgtgca caactacccg gcgtacttca acttcctcaa gtcgaagctg 2400

cgcaccggtg gcctgctgct caaccactgc atcacccgcc cggacaaccg gtcggcgcca 2460

tcggccggcg ggttcatcga caggtacgtg ttccccgacg gggagctcac cggctcgggc 2520

cgcatcatca ccgaggccca ggacgtgggc cttgaggtga tccacgagga gaacctacgc 2580

aatcactatg cgatgacgct gcgcgactgg tgccgcaacc tggtcgagca ctgggacgag 2640

gcggtcgaag aggtcgggct gcccaccgcg aaggtgtggg gcctgtacat ggccggctca 2700

cgtctgggct tcgagaccaa tgtggttcag ctgcaccagg ttctggcggt caagcttgac 2760

gatcagggca aggacggcgg actgccgttg cggccctggt ggtccgccta gcctcaaaat 2820

atattttccc tctatcttct cgttgcgctt aatttgacta attctcatta gcgaggcgcg 2880

cctttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg 2940

tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg 3000

cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga 3060

agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc 3120

tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt 3180

aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact 3240

ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg 3300

cctaactacg gctacactag aagaacagta tttggtatct gcgctctgct gaagccagtt 3360

accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt 3420

ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct 3480

ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg 3540

gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt 3600

aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg cttaatcagt 3660

gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg actccccgtc 3720

gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc aatgataccg 3780

cgagacccac gctcaccggc tccagattta tcagcaataa accagccagc cggaagggcc 3840

gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa ttgttgccgg 3900

gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc cattgctaca 3960

ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg ttcccaacga 4020

tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc cttcggtcct 4080

ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat ggcagcactg 4140

cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg tgagtactca 4200

accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata 4260

cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg aaaacgttct 4320

tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat gtaacccact 4380

cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg gtgagcaaaa 4440

acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg ttgaatactc 4500

atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct catgagcgga 4560

tacatatttg aatgtattta gaaaaataaa cagcgatcgc gcggccgcgg gtaataactg 4620

atataattaa attgaagctc taatttgtga gtttagtata catgcattta cttataatac 4680

agttttttag ttttgctggc cgcatcttct caaatatgct tcccagcctg cttttctgta 4740

acgttcaccc tctaccttag catcccttcc ctttgcaaat agtcctcttc caacaataat 4800

aatgtcagat cctgtagaga ccacatcatc cacggttcta tactgttgac ccaatgcgtc 4860

tcccttgtca tctaaaccca caccgggtgt cataatcaac caatcgtaac cttcatctct 4920

tccacccatg tctctttgag caataaagcc gataacaaaa tctttgtcgc tcttcgcaat 4980

gtcaacagta cccttagtat attctccagt agctagggag cccttgcatg acaattctgc 5040

taacatcaaa aggcctctag gttcctttgt tacttcttcc gccgcctgct tcaaaccgct 5100

aacaatacct gggcccacca caccgtgtgc attcgtaatg tctgcccatt ctgctattct 5160

gtatacaccc gcagagtact gcaatttgac tgtattacca atgtcagcaa attttctgtc 5220

ttcgaagagt aaaaaattgt acttggcgga taatgccttt agcggcttaa ctgtgccctc 5280

catggaaaaa tcagtcaaga tatccacatg tgtttttagt aaacaaattt tgggacctaa 5340

tgcttcaact aactccagta attccttggt ggtacgaaca tccaatgaag cacacaagtt 5400

tgtttgcttt tcgtgcatga tattaaatag cttggcagca acaggactag gatgagtagc 5460

agcacgttcc ttatatgtag ctttcgacat gatttatctt cgtttcctgc aggtttttgt 5520

tctgtgcagt tgggttaaga atactgggca atttcatgtt tcttcaacac cacatatgcg 5580

tatatatacc aatctaagtc tgtgctcctt ccttcgttct tccttctgct cggagattac 5640

cgaatcaaag ctagcttatc gatgataagc tgtcaaagat gagaattaat tccacggact 5700

atagactata ctagatactc cgtctactgt acgatacact tccgctcagg tccttgtcct 5760

ttaacgaggc cttaccactc ttttgttact ctattgatcc agctcagcaa aggcagtgtg 5820

atctaagatt ctatcttcgc gatgtagtaa aactagctag accgagaaag agactagaaa 5880

tgcaaaaggc acttctacaa tggctgccat cattattatc cgatgtgacg ctgcagcttc 5940

tcaatgatat tcgaatacgc tttgaggaga tacagcctaa tatccgacaa actgttttac 6000

agatttacga tcgtacttgt tacccatcat tgaattttga acatccgaac ctgggagttt 6060

tccctgaaac agatagtata tttgaacctg tataataata tatagtctag cgctttacgg 6120

aagacaatgt atgtatttcg gttcctggag aaactattgc atctattgca taggtaatct 6180

tgcacgtcgc atccccggtt cattttctgc gtttccatct tgcacttcaa tagcatatct 6240

ttgttaacga agcatctgtg cttcattttg tagaacaaaa atgcaacgcg agagcgctaa 6300

tttttcaaac aaagaatctg agctgcattt ttacagaaca gaaatgcaac gcgaaagcgc 6360

tattttacca acgaagaatc tgtgcttcat ttttgtaaaa caaaaatgca acgcgacgag 6420

agcgctaatt tttcaaacaa agaatctgag ctgcattttt acagaacaga aatgcaacgc 6480

gagagcgcta ttttaccaac aaagaatcta tacttctttt ttgttctaca aaaatgcatc 6540

ccgagagcgc tatttttcta acaaagcatc ttagattact ttttttctcc tttgtgcgct 6600

ctataatgca gtctcttgat aactttttgc actgtaggtc cgttaaggtt agaagaaggc 6660

tactttggtg tctattttct cttccataaa aaaagcctga ctccacttcc cgcgtttact 6720

gattactagc gaagctgcgg gtgcattttt tcaagataaa ggcatccccg attatattct 6780

ataccgatgt ggattgcgca tactttgtga acagaaagtg atagcgttga tgattcttca 6840

ttggtcagaa aattatgaac ggtttcttct attttgtctc tatatactac gtataggaaa 6900

tgtttacatt ttcgtattgt tttcgattca ctctatgaat agttcttact acaatttttt 6960

tgtctaaaga gtaatactag agataaacat aaaaaatgta gaggtcgagt ttagatgcaa 7020

gttcaaggag cgaaaggtgg atgggtaggt tatataggga tatagcacag agatatatag 7080

caaagagata cttttgagca at 7102

<210> 78

<211> 10766

<212> DNA

<213> 人工序列

<220>

<223> 合成核酸

<400> 78

ttatcgatga taagctgtca aagatgagaa ttaattccac ggactataga ctatactaga 60

tactccgtct actgtacgat acacttccgc tcaggtcctt gtcctttaac gaggccttac 120

cactcttttg ttactctatt gatccagctc agcaaaggca gtgtgatcta agattctatc 180

ttcgcgatgt agtaaaacta gctagaccga gaaagagact agaaatgcaa aaggcacttc 240

tacaatggct gccatcatta ttatccgatg tgacgctgca gcttctcaat gatattcgaa 300

tacgctttga ggagatacag cctaatatcc gacaaactgt tttacagatt tacgatcgta 360

cttgttaccc atcattgaat tttgaacatc cgaacctggg agttttccct gaaacagata 420

gtatatttga acctgtataa taatatatag tctagcgctt tacggaagac aatgtatgta 480

tttcggttcc tggagaaact attgcatcta ttgcataggt aatcttgcac gtcgcatccc 540

cggttcattt tctgcgtttc catcttgcac ttcaatagca tatctttgtt aacgaagcat 600

ctgtgcttca ttttgtagaa caaaaatgca acgcgagagc gctaattttt caaacaaaga 660

atctgagctg catttttaca gaacagaaat gcaacgcgaa agcgctattt taccaacgaa 720

gaatctgtgc ttcatttttg taaaacaaaa atgcaacgcg acgagagcgc taatttttca 780

aacaaagaat ctgagctgca tttttacaga acagaaatgc aacgcgagag cgctatttta 840

ccaacaaaga atctatactt cttttttgtt ctacaaaaat gcatcccgag agcgctattt 900

ttctaacaaa gcatcttaga ttactttttt tctcctttgt gcgctctata atgcagtctc 960

ttgataactt tttgcactgt aggtccgtta aggttagaag aaggctactt tggtgtctat 1020

tttctcttcc ataaaaaaag cctgactcca cttcccgcgt ttactgatta ctagcgaagc 1080

tgcgggtgca ttttttcaag ataaaggcat ccccgattat attctatacc gatgtggatt 1140

gcgcatactt tgtgaacaga aagtgatagc gttgatgatt cttcattggt cagaaaatta 1200

tgaacggttt cttctatttt gtctctatat actacgtata ggaaatgttt acattttcgt 1260

attgttttcg attcactcta tgaatagttc ttactacaat ttttttgtct aaagagtaat 1320

actagagata aacataaaaa atgtagaggt cgagtttaga tgcaagttca aggagcgaaa 1380

ggtggatggg taggttatat agggatatag cacagagata tatagcaaag agatactttt 1440

gagcaatgtt tgtggaagcg gtattcgcaa tgtttaaact gcgtcggaac gggatatgca 1500

ttcccctagt ttcgccgcag tgcagaatca ggcggtttct ttgcaccaca ccacatacgg 1560

aggatgacgg gcattattga tgttgaatag taacctgatc gtgactagta tgacggaacc 1620

caacagcaac agccgaccgt ttgtgagcgt ttttgcggcc ggtcaggcga gtttttccgg 1680

cctgccaatg gtccttccgt accctttacc ctgtacgctg tacctgccac ggataggccg 1740

tgctccacct gctcactatg gtgggtgcgg ggaaaacaac aggcaggctc aattgctctg 1800

caaatgggtt gagggggtga ttgatgtcac tggtacacca acaggggaat gctcggcgtt 1860

gattttgggc cacctctttt gtttgccaga gcttgtctct attgtcaaat ttaacggtct 1920

gcaactgttg cccaaaatgg gacaatgatc cgatgcctgc atagacaccc tgcttgaggg 1980

tgcgatcgcc ctaatacgag gcaaaccaag ttttccaatt gaccttcaat tgacgagcgg 2040

ttgttgcgac aggggactgg agtgctacct gtttagagtt caaatccgtc acccagcatt 2100

gaaagttttt ccccgcattg gatgattgca atgccgctaa cccgctcatc cgccaaagtt 2160

catagtccca ccctgcctcg acttatcgga ccacatgggg ctcccttatg cgcgcgcata 2220

tggcgcttga ttgctttttg gtcaacgttt gggacaaatt tcctttgtta aggcggaccc 2280

gccagcagat acgaaggtat aaatagggct cactttcacc atcttgtcca ttcaattgca 2340

agactcaaaa gtaataatga ccactctgga tgacaccgct taccgatacc gaacttccgt 2400

tcctggcgat gccgaggcta ttgaggctct ggatggatct ttcaccactg acaccgtttt 2460

ccgagtgacc gctactggcg acggcttcac cctgcgagag gtgcctgtcg accctcctct 2520

caccaaggtt ttccctgacg atgagtcgga cgatgagtct gacgctggag aggacggcga 2580

ccctgactct cgaactttcg tggcttacgg cgacgatgga gacctggccg gctttgtggt 2640

cgtttcttac tccggatgga accgacgact gaccgtggag gacatcgagg tcgctcctga 2700

gcaccgaggt catggtgtcg gacgagctct gatgggtctc gctactgagt tcgctcgaga 2760

gcgaggtgct ggccacctgt ggctcgaggt caccaacgtt aacgcccctg ctattcatgc 2820

ctaccgacga atgggtttta ccctgtgtgg cctcgatact gccctgtacg acggaaccgc 2880

ttccgatgga gagcaggccc tctacatgtc gatgccctgc ccttaaacag gccccttttc 2940

ctttgtcgat atcatgtaat tagttatgtc acgcttacat tcacgccctc ctcccacatc 3000

cgctctaacc gaaaaggaag gagttagaca acctgaagtc taggtcccta tttatttttt 3060

ttaatagtta tgttagtatt aagaacgtta tttatatttc aaatttttct tttttttctg 3120

tacaaacgcg tgtacgcatg taacattata ctgaaaacct tgcttgagaa ggttttggga 3180

cgctcgaagg ctttaatttg cagagaccgg gttggcggcg catttgtgtc ccaaaaaaca 3240

gccccaattg ccccaattga ccccaaattg acccagtagc gggcccaacc ccggcgagag 3300

cccccttctc cccacatatc aaacctcccc cggttcccac acttgccgtt aagggcgtag 3360

ggtactgcag tctggaatct acgcttgttc agactttgta ctagtttctt tgtctggcca 3420

tccgggtaac ccatgccgga cgcaaaatag actactgaaa atttttttgc tttgtggttg 3480

ggactttagc caagggtata aaagaccacc gtccccgaat tacctttcct cttcttttct 3540

ctctctcctt gtcaactcac acccgaaatc gttaagcatt tccttctgag tataagaatc 3600

attcaaaatg tccgttgtta ccaccgatgc tcaagctgct catgctgctg gtgtttctag 3660

attattggct tcttatagag ccattccacc atctgctact gttagattgg ctaagccaac 3720

ttctaatttg ttcagagcta gagctagaac taacgttaag ggtttggatg tttctggttt 3780

gactggtgtt attggtgttg atccagatgc tagaactgct gatgttgctg gtatgtgtac 3840

ttacgaagat ttggttgctg ctactttgcc atatggtttg gctccattgg ttgttccaca 3900

attgaaaact attactttgg gtggtgctgt taccggtttg ggtattgaat ctacttcttt 3960

cagaaacggt ttgccacacg aatctgtttt ggaaatggat attttgaccg gttccggtga 4020

aatagttact gcttctccag atcaacactc cgatttgttt catgcttttc caaactctta 4080

cggtacattg ggttactcta ccagattgag aattgaattg gaaccagttc atccattcgt 4140

tgccttgaga catttgagat tccattccat tactgatttg gtcgcagcca tggatagaat 4200

tattgaaact ggtggtttag acggtgaacc agttgattat ttggatggtg ttgttttctc 4260

tgccaccgaa tcatatttgt gtgttggttt caaaactaag accccaggtc cagtttctga 4320

ttatactggt caacaaatct tctacagatc catccaacat gatggtgata ctggtgctga 4380

aaaacatgat agattgacca tccatgacta cttgtggaga tgggatactg attggttttg 4440

gtgttctaga gcttttggtg ctcaacatcc agttattaga agattctggc caagaagatt 4500

aagaagatcc tccttctact ggaaattggt tgcttacgat caaagatacg atatcgccga 4560

tagaatcgaa aagagaaatg gtagaccacc aagagaaaga gttgttcaag acgttgaagt 4620

tccaattgaa agatgcgctg atttcgttga atggttcttg caaaatgttc caatcgaacc 4680

tatttggttg tgcccattga gattgagaga ttctgctgat ggtggtgctt catggccatt 4740

atatccattg aaagctcatc acacctacgt caatattggt ttctggtcat ctgttccagt 4800

tggtccagaa gaaggtcata ccaatagatt gattgaaaaa aaggtcgccg aattggacgg 4860

tcacaaatca ttatattctg atgcctacta caccagagat gaattcgatg aattatacgg 4920

tggtgaagtt tacaacaccg tcaaaaaaac ttacgaccca gactcaagat tattagactt 4980

gtactctaag gccgtccaaa gacaatgagc tgcttgtacc tagtgcaacc ccagtttgtt 5040

aaaaattagt agtcaaaaac ttctgagtta gaaatttgtg agtgtagtga gattgtagag 5100

tatcatgtgt gtccgtaagt gaagtgttat tgactcttag ttagtttatc tagtactcgt 5160

ttagttgaca ctgatctagt attttacgag gcgtatgact ttagccaagt gttgtactta 5220

gtcttctctc caaacatgag agggctctgt cactcagtcg gcctatgggt gagatggctt 5280

ggtgagatct ttcgatagtc tcgtcaagat ggtaggatga tgggggaata cattactgct 5340

ctcgtcaagg aaaccacaat cagatcacac catcctccat ggtatccgat gactctcttc 5400

tccacagtcg cagtaggatg tcctgcacgg gtctttttgt ggggtgtgga gaaaggggtg 5460

cttggagatg gaagccggta gaaccgggct gcttgggggg atttggggcc gctgggctcc 5520

aaagaggggt aggcatttcg ttggggttac gtaattgcgg catttgggtc ctgcgcgcat 5580

gtcccattgg tcagaattag tccggatagg agacttatca gccaatcaca gcgccggatc 5640

cacctgtagg ttgggttggg tgggagcacc cctccacaga gtagagtcaa acagcagcag 5700

caacgtgata gttgggggtg tgcgtgttaa aggaaaaaaa aagaagcttg ggttatattc 5760

ccgctctatt tagaggttgc gggatagacg ccgacggagg gcaatggcgc catggaacct 5820

tgcggatatc gatacgccgc ggcggactgc gtccgaacca gctccagcag cgttttttcc 5880

gggccattga gccgactgcg accccgccaa cgtgtcttgg cccacgcact catgtcatgt 5940

tggtgttggg aggccacttt ttaagtagca caaggcacct agctcgcggc agggtgtccg 6000

aaccaaagaa gcggctgcag tggtgcaaac ggggcggaaa cggcgggaaa aagccacggg 6060

ggcacgaatt gaggcacgcc ctcgaatttg agacgagtca cggccccatt cgcccgcgca 6120

atggctcgcc aacgcccggt cttttgcacc acatcaggtt accccaagcc aaacctttgt 6180

gttaaaaagc ttaacatatt ataccgaacg taggtttggg cgggcttgct ccgtctgtcc 6240

aaggcaacat ttatataagg gtctgcatcg ccggctcaat tgaatctttt ttcttcttct 6300

cttctctata ttcattcttg aattaaacac acatcaacaa tgaccacctt caaagaaaga 6360

gaaacttcta ccgctgatag aaagttgacc ttggctgaaa ttttggaaat tttcgctgct 6420

ggtaaagaac cattgaagtt cactgcttat gatggttctt ctgctggtcc tgaagatgct 6480

actatgggtt tggatttgaa aactccaaga ggtactactt acttggctac tgctccaggt 6540

gatttgggtt tggctagagc ttatgtttct ggtgacttgg aaccacatgg tgttcatcct 6600

ggtgatccat atccattatt gagagcttta gccgaaagaa tggaattcaa aagaccacca 6660

gctagagttt tggctaacat cgttagatcc attggtatcg aacatttgaa gccaattgct 6720

ccaccaccac aagaagcttt gccaagatgg agaagaatta tggaaggttt gagacactct 6780

aagaccagag atgctgaagc tattcatcat cactacgatg tttctaacac cttctacgaa 6840

tgggttttgg gtccatctat gacttatact tgtgcttgtt acccaacaga agatgccact 6900

ttggaagaag ctcaagataa caagtacaga ttggtctttg aaaagttgag attgaagcca 6960

ggtgacagat tattggatgt tggttgtggt tggggtggta tggttagata tgctgctaga 7020

catggtgtaa aagctttggg tgttactttg tctagagaac aagctacttg ggctcaaaaa 7080

gctattgctc aagaaggttt aaccgatttg gctgaagtta gacacggtga ttacagagat 7140

gttatcgaat ctggtttcga tgccgtttct tctattggtt tgactgaaca tatcggtgtt 7200

cataactatc cagcctactt caacttcttg aagtctaagt tgagaaccgg tggtttgttg 7260

ttgaaccatt gcattactag accagataac agatctgctc catctgctgg tggttttatt 7320

gatagatacg ttttcccaga tggtgaattg actggttccg gtagaattat tactgaagca 7380

caagatgtcg gtttggaagt tatccatgaa gaaaacttga gaaaccatta cgccatgact 7440

ttgagagatt ggtgtagaaa cttggttgaa cattgggatg aagccgttga agaagttggt 7500

ttgccaactg ctaaagtttg gggtttgtat atggctggtt ctagattagg ttttgaaact 7560

aacgttgtcc aattgcacca agttttggca gttaagttgg atgatcaagg taaagatggt 7620

ggtttgcctt taagaccatg gtggtctgct tgagcattag cgactactaa tatatatttg 7680

aatccatgga attataacaa acaagcatca aaacaagaat tagcgacatt atacttgaaa 7740

tcagcattag cgatactact aatatagttt attctatgta atgatccatg gaagttcgat 7800

tgatttgcca agttaatttg atagattatg catgccattt agtcgacgca ggtacgatct 7860

acagcgataa agaagaggtt gtgggtcatt caattttgca ccaattttgc accatcatag 7920

atcataatac atttacaagg cctacaattc ttacagggtc ttctcgagag caattcctta 7980

attaaggcgc gcctttccat aggctccgcc cccctgacga gcatcacaaa aatcgacgct 8040

caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt ccccctggaa 8100

gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc 8160

tcccttcggg aagcgtggcg ctttctcata gctcacgctg taggtatctc agttcggtgt 8220

aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg 8280

ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta tcgccactgg 8340

cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct acagagttct 8400

tgaagtggtg gcctaactac ggctacacta gaagaacagt atttggtatc tgcgctctgc 8460

tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa caaaccaccg 8520

ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa aaaggatctc 8580

aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa aactcacgtt 8640

aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac ctagatcctt ttaaattaaa 8700

aatgaagttt taaatcaatc taaagtatat atgagtaaac ttggtctgac agttaccaat 8760

gcttaatcag tgaggcacct atctcagcga tctgtctatt tcgttcatcc atagttgcct 8820

gactccccgt cgtgtagata actacgatac gggagggctt accatctggc cccagtgctg 8880

caatgatacc gcgagaccca cgctcaccgg ctccagattt atcagcaata aaccagccag 8940

ccggaagggc cgagcgcaga agtggtcctg caactttatc cgcctccatc cagtctatta 9000

attgttgccg ggaagctaga gtaagtagtt cgccagttaa tagtttgcgc aacgttgttg 9060

ccattgctac aggcatcgtg gtgtcacgct cgtcgtttgg tatggcttca ttcagctccg 9120

gttcccaacg atcaaggcga gttacatgat cccccatgtt gtgcaaaaaa gcggttagct 9180

ccttcggtcc tccgatcgtt gtcagaagta agttggccgc agtgttatca ctcatggtta 9240

tggcagcact gcataattct cttactgtca tgccatccgt aagatgcttt tctgtgactg 9300

gtgagtactc aaccaagtca ttctgagaat agtgtatgcg gcgaccgagt tgctcttgcc 9360

cggcgtcaat acgggataat accgcgccac atagcagaac tttaaaagtg ctcatcattg 9420

gaaaacgttc ttcggggcga aaactctcaa ggatcttacc gctgttgaga tccagttcga 9480

tgtaacccac tcgtgcaccc aactgatctt cagcatcttt tactttcacc agcgtttctg 9540

ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg aataagggcg acacggaaat 9600

gttgaatact catactcttc ctttttcaat attattgaag catttatcag ggttattgtc 9660

tcatgagcgg atacatattt gaatgtattt agaaaaataa acagcgatcg cgcggccgcg 9720

ggtaataact gatataatta aattgaagct ctaatttgtg agtttagtat acatgcattt 9780

acttataata cagtttttta gttttgctgg ccgcatcttc tcaaatatgc ttcccagcct 9840

gcttttctgt aacgttcacc ctctacctta gcatcccttc cctttgcaaa tagtcctctt 9900

ccaacaataa taatgtcaga tcctgtagag accacatcat ccacggttct atactgttga 9960

cccaatgcgt ctcccttgtc atctaaaccc acaccgggtg tcataatcaa ccaatcgtaa 10020

ccttcatctc ttccacccat gtctctttga gcaataaagc cgataacaaa atctttgtcg 10080

ctcttcgcaa tgtcaacagt acccttagta tattctccag tagctaggga gcccttgcat 10140

gacaattctg ctaacatcaa aaggcctcta ggttcctttg ttacttcttc cgccgcctgc 10200

ttcaaaccgc taacaatacc tgggcccacc acaccgtgtg cattcgtaat gtctgcccat 10260

tctgctattc tgtatacacc cgcagagtac tgcaatttga ctgtattacc aatgtcagca 10320

aattttctgt cttcgaagag taaaaaattg tacttggcgg ataatgcctt tagcggctta 10380

actgtgccct ccatggaaaa atcagtcaag atatccacat gtgtttttag taaacaaatt 10440

ttgggaccta atgcttcaac taactccagt aattccttgg tggtacgaac atccaatgaa 10500

gcacacaagt ttgtttgctt ttcgtgcatg atattaaata gcttggcagc aacaggacta 10560

ggatgagtag cagcacgttc cttatatgta gctttcgaca tgatttatct tcgtttcctg 10620

caggtttttg ttctgtgcag ttgggttaag aatactgggc aatttcatgt ttcttcaaca 10680

ccacatatgc gtatatatac caatctaagt ctgtgctcct tccttcgttc ttccttctgc 10740

tcggagatta ccgaatcaaa gctagc 10766

<210> 79

<211> 10970

<212> DNA

<213> 人工序列

<220>

<223> 合成核酸

<400> 79

ttatcgatga taagctgtca aagatgagaa ttaattccac ggactataga ctatactaga 60

tactccgtct actgtacgat acacttccgc tcaggtcctt gtcctttaac gaggccttac 120

cactcttttg ttactctatt gatccagctc agcaaaggca gtgtgatcta agattctatc 180

ttcgcgatgt agtaaaacta gctagaccga gaaagagact agaaatgcaa aaggcacttc 240

tacaatggct gccatcatta ttatccgatg tgacgctgca gcttctcaat gatattcgaa 300

tacgctttga ggagatacag cctaatatcc gacaaactgt tttacagatt tacgatcgta 360

cttgttaccc atcattgaat tttgaacatc cgaacctggg agttttccct gaaacagata 420

gtatatttga acctgtataa taatatatag tctagcgctt tacggaagac aatgtatgta 480

tttcggttcc tggagaaact attgcatcta ttgcataggt aatcttgcac gtcgcatccc 540

cggttcattt tctgcgtttc catcttgcac ttcaatagca tatctttgtt aacgaagcat 600

ctgtgcttca ttttgtagaa caaaaatgca acgcgagagc gctaattttt caaacaaaga 660

atctgagctg catttttaca gaacagaaat gcaacgcgaa agcgctattt taccaacgaa 720

gaatctgtgc ttcatttttg taaaacaaaa atgcaacgcg acgagagcgc taatttttca 780

aacaaagaat ctgagctgca tttttacaga acagaaatgc aacgcgagag cgctatttta 840

ccaacaaaga atctatactt cttttttgtt ctacaaaaat gcatcccgag agcgctattt 900

ttctaacaaa gcatcttaga ttactttttt tctcctttgt gcgctctata atgcagtctc 960

ttgataactt tttgcactgt aggtccgtta aggttagaag aaggctactt tggtgtctat 1020

tttctcttcc ataaaaaaag cctgactcca cttcccgcgt ttactgatta ctagcgaagc 1080

tgcgggtgca ttttttcaag ataaaggcat ccccgattat attctatacc gatgtggatt 1140

gcgcatactt tgtgaacaga aagtgatagc gttgatgatt cttcattggt cagaaaatta 1200

tgaacggttt cttctatttt gtctctatat actacgtata ggaaatgttt acattttcgt 1260

attgttttcg attcactcta tgaatagttc ttactacaat ttttttgtct aaagagtaat 1320

actagagata aacataaaaa atgtagaggt cgagtttaga tgcaagttca aggagcgaaa 1380

ggtggatggg taggttatat agggatatag cacagagata tatagcaaag agatactttt 1440

gagcaatgtt tgtggaagcg gtattcgcaa tgtttaaact gcgtcggaac gggatatgca 1500

ttcccctagt ttcgccgcag tgcagaatca ggcggtttct ttgcaccaca ccacatacgg 1560

aggatgacgg gcattattga tgttgaatag taacctgatc gtgactagta tgacggaacc 1620

caacagcaac agccgaccgt ttgtgagcgt ttttgcggcc ggtcaggcga gtttttccgg 1680

cctgccaatg gtccttccgt accctttacc ctgtacgctg tacctgccac ggataggccg 1740

tgctccacct gctcactatg gtgggtgcgg ggaaaacaac aggcaggctc aattgctctg 1800

caaatgggtt gagggggtga ttgatgtcac tggtacacca acaggggaat gctcggcgtt 1860

gattttgggc cacctctttt gtttgccaga gcttgtctct attgtcaaat ttaacggtct 1920

gcaactgttg cccaaaatgg gacaatgatc cgatgcctgc atagacaccc tgcttgaggg 1980

tgcgatcgcc ctaatacgag gcaaaccaag ttttccaatt gaccttcaat tgacgagcgg 2040

ttgttgcgac aggggactgg agtgctacct gtttagagtt caaatccgtc acccagcatt 2100

gaaagttttt ccccgcattg gatgattgca atgccgctaa cccgctcatc cgccaaagtt 2160

catagtccca ccctgcctcg acttatcgga ccacatgggg ctcccttatg cgcgcgcata 2220

tggcgcttga ttgctttttg gtcaacgttt gggacaaatt tcctttgtta aggcggaccc 2280

gccagcagat acgaaggtat aaatagggct cactttcacc atcttgtcca ttcaattgca 2340

agactcaaaa gtaataatga ccactctgga tgacaccgct taccgatacc gaacttccgt 2400

tcctggcgat gccgaggcta ttgaggctct ggatggatct ttcaccactg acaccgtttt 2460

ccgagtgacc gctactggcg acggcttcac cctgcgagag gtgcctgtcg accctcctct 2520

caccaaggtt ttccctgacg atgagtcgga cgatgagtct gacgctggag aggacggcga 2580

ccctgactct cgaactttcg tggcttacgg cgacgatgga gacctggccg gctttgtggt 2640

cgtttcttac tccggatgga accgacgact gaccgtggag gacatcgagg tcgctcctga 2700

gcaccgaggt catggtgtcg gacgagctct gatgggtctc gctactgagt tcgctcgaga 2760

gcgaggtgct ggccacctgt ggctcgaggt caccaacgtt aacgcccctg ctattcatgc 2820

ctaccgacga atgggtttta ccctgtgtgg cctcgatact gccctgtacg acggaaccgc 2880

ttccgatgga gagcaggccc tctacatgtc gatgccctgc ccttaaacag gccccttttc 2940

ctttgtcgat atcatgtaat tagttatgtc acgcttacat tcacgccctc ctcccacatc 3000

cgctctaacc gaaaaggaag gagttagaca acctgaagtc taggtcccta tttatttttt 3060

ttaatagtta tgttagtatt aagaacgtta tttatatttc aaatttttct tttttttctg 3120

tacaaacgcg tgtacgcatg taacattata ctgaaaacct tgcttgagaa ggttttggga 3180

cgctcgaagg ctttaatttg cagagaccgg gttggcggcg catttgtgtc ccaaaaaaca 3240

gccccaattg ccccaattga ccccaaattg acccagtagc gggcccaacc ccggcgagag 3300

cccccttctc cccacatatc aaacctcccc cggttcccac acttgccgtt aagggcgtag 3360

ggtactgcag tctggaatct acgcttgttc agactttgta ctagtttctt tgtctggcca 3420

tccgggtaac ccatgccgga cgcaaaatag actactgaaa atttttttgc tttgtggttg 3480

ggactttagc caagggtata aaagaccacc gtccccgaat tacctttcct cttcttttct 3540

ctctctcctt gtcaactcac acccgaaatc gttaagcatt tccttctgag tataagaatc 3600

attcaaaatg aagttctcta tgccatcttg gggtgttgtt ttttacgctt tgttggtttg 3660

tttgttgcca ttcttgtcta aggctggtgt tcaagctatg tccgttgtta ccaccgatgc 3720

tcaagctgct catgctgctg gtgtttctag attattggct tcttatagag ccattccacc 3780

atctgctact gttagattgg ctaagccaac ttctaatttg ttcagagcta gagctagaac 3840

taacgttaag ggtttggatg tttctggttt gactggtgtt attggtgttg atccagatgc 3900

tagaactgct gatgttgctg gtatgtgtac ttacgaagat ttggttgctg ctactttgcc 3960

atatggtttg gctccattgg ttgttccaca attgaaaact attactttgg gtggtgctgt 4020

taccggtttg ggtattgaat ctacttcttt cagaaacggt ttgccacacg aatctgtttt 4080

ggaaatggat attttgaccg gttccggtga aatagttact gcttctccag atcaacactc 4140

cgatttgttt catgcttttc caaactctta cggtacattg ggttactcta ccagattgag 4200

aattgaattg gaaccagttc atccattcgt tgccttgaga catttgagat tccattccat 4260

tactgatttg gtcgcagcca tggatagaat tattgaaact ggtggtttag acggtgaacc 4320

agttgattat ttggatggtg ttgttttctc tgccaccgaa tcatatttgt gtgttggttt 4380

caaaactaag accccaggtc cagtttctga ttatactggt caacaaatct tctacagatc 4440

catccaacat gatggtgata ctggtgctga aaaacatgat agattgacca tccatgacta 4500

cttgtggaga tgggatactg attggttttg gtgttctaga gcttttggtg ctcaacatcc 4560

agttattaga agattctggc caagaagatt aagaagatcc tccttctact ggaaattggt 4620

tgcttacgat caaagatacg atatcgccga tagaatcgaa aagagaaatg gtagaccacc 4680

aagagaaaga gttgttcaag acgttgaagt tccaattgaa agatgcgctg atttcgttga 4740

atggttcttg caaaatgttc caatcgaacc tatttggttg tgcccattga gattgagaga 4800

ttctgctgat ggtggtgctt catggccatt atatccattg aaagctcatc acacctacgt 4860

caatattggt ttctggtcat ctgttccagt tggtccagaa gaaggtcata ccaatagatt 4920

gattgaaaaa aaggtcgccg aattggacgg tcacaaatca ttatattctg atgcctacta 4980

caccagagat gaattcgatg aattatacgg tggtgaagtt tacaacaccg tcaaaaaaac 5040

ttacgaccca gactcaagat tattagactt gtactctaag gccgtccaaa gacaacatga 5100

tgaattgtga gctgcttgta cctagtgcaa ccccagtttg ttaaaaatta gtagtcaaaa 5160

acttctgagt tagaaatttg tgagtgtagt gagattgtag agtatcatgt gtgtccgtaa 5220

gtgaagtgtt attgactctt agttagttta tctagtactc gtttagttga cactgatcta 5280

gtattttacg aggcgtatga ctttagccaa gtgttgtact tagtcttctc tccaaacatg 5340

agagggctct gtcactcagt cggcctatgg gtgagatggc ttggtgagat ctttcgatag 5400

tctcgtcaag atggtaggat gatgggggaa tacattactg ctctcgtcaa ggaaaccaca 5460

atcagatcac accatcctcc atggtatccg atgactctct tctccacagt cgcagtagga 5520

tgtcctgcac gggtcttttt gtggggtgtg gagaaagggg tgcttggaga tggaagccgg 5580

tagaaccggg ctgcttgggg ggatttgggg ccgctgggct ccaaagaggg gtaggcattt 5640

cgttggggtt acgtaattgc ggcatttggg tcctgcgcgc atgtcccatt ggtcagaatt 5700

agtccggata ggagacttat cagccaatca cagcgccgga tccacctgta ggttgggttg 5760

ggtgggagca cccctccaca gagtagagtc aaacagcagc agcaacgtga tagttggggg 5820

tgtgcgtgtt aaaggaaaaa aaaagaagct tgggttatat tcccgctcta tttagaggtt 5880

gcgggataga cgccgacgga gggcaatggc gccatggaac cttgcggata tcgatacgcc 5940

gcggcggact gcgtccgaac cagctccagc agcgtttttt ccgggccatt gagccgactg 6000

cgaccccgcc aacgtgtctt ggcccacgca ctcatgtcat gttggtgttg ggaggccact 6060

ttttaagtag cacaaggcac ctagctcgcg gcagggtgtc cgaaccaaag aagcggctgc 6120

agtggtgcaa acggggcgga aacggcggga aaaagccacg ggggcacgaa ttgaggcacg 6180

ccctcgaatt tgagacgagt cacggcccca ttcgcccgcg caatggctcg ccaacgcccg 6240

gtcttttgca ccacatcagg ttaccccaag ccaaaccttt gtgttaaaaa gcttaacata 6300

ttataccgaa cgtaggtttg ggcgggcttg ctccgtctgt ccaaggcaac atttatataa 6360

gggtctgcat cgccggctca attgaatctt ttttcttctt ctcttctcta tattcattct 6420

tgaattaaac acacatcaac aatgaagttc tctatgccat cttggggtgt tgttttttac 6480

gctttgttgg tttgtttgtt gccattcttg tctaaggctg gtgttcaagc tatgaccacc 6540

ttcaaagaaa gagaaacttc taccgctgat agaaagttga ccttggctga aattttggaa 6600

attttcgctg ctggtaaaga accattgaag ttcactgctt atgatggttc ttctgctggt 6660

cctgaagatg ctactatggg tttggatttg aaaactccaa gaggtactac ttacttggct 6720

actgctccag gtgatttggg tttggctaga gcttatgttt ctggtgactt ggaaccacat 6780

ggtgttcatc ctggtgatcc atatccatta ttgagagctt tagccgaaag aatggaattc 6840

aaaagaccac cagctagagt tttggctaac atcgttagat ccattggtat cgaacatttg 6900

aagccaattg ctccaccacc acaagaagct ttgccaagat ggagaagaat tatggaaggt 6960

ttgagacact ctaagaccag agatgctgaa gctattcatc atcactacga tgtttctaac 7020

accttctacg aatgggtttt gggtccatct atgacttata cttgtgcttg ttacccaaca 7080

gaagatgcca ctttggaaga agctcaagat aacaagtaca gattggtctt tgaaaagttg 7140

agattgaagc caggtgacag attattggat gttggttgtg gttggggtgg tatggttaga 7200

tatgctgcta gacatggtgt aaaagctttg ggtgttactt tgtctagaga acaagctact 7260

tgggctcaaa aagctattgc tcaagaaggt ttaaccgatt tggctgaagt tagacacggt 7320

gattacagag atgttatcga atctggtttc gatgccgttt cttctattgg tttgactgaa 7380

catatcggtg ttcataacta tccagcctac ttcaacttct tgaagtctaa gttgagaacc 7440

ggtggtttgt tgttgaacca ttgcattact agaccagata acagatctgc tccatctgct 7500

ggtggtttta ttgatagata cgttttccca gatggtgaat tgactggttc cggtagaatt 7560

attactgaag cacaagatgt cggtttggaa gttatccatg aagaaaactt gagaaaccat 7620

tacgccatga ctttgagaga ttggtgtaga aacttggttg aacattggga tgaagccgtt 7680

gaagaagttg gtttgccaac tgctaaagtt tggggtttgt atatggctgg ttctagatta 7740

ggttttgaaa ctaacgttgt ccaattgcac caagttttgg cagttaagtt ggatgatcaa 7800

ggtaaagatg gtggtttgcc tttaagacca tggtggtctg ctcatgatga attgtgagca 7860

ttagcgacta ctaatatata tttgaatcca tggaattata acaaacaagc atcaaaacaa 7920

gaattagcga cattatactt gaaatcagca ttagcgatac tactaatata gtttattcta 7980

tgtaatgatc catggaagtt cgattgattt gccaagttaa tttgatagat tatgcatgcc 8040

atttagtcga cgcaggtacg atctacagcg ataaagaaga ggttgtgggt cattcaattt 8100

tgcaccaatt ttgcaccatc atagatcata atacatttac aaggcctaca attcttacag 8160

ggtcttctcg agagcaattc cttaattaag gcgcgccttt ccataggctc cgcccccctg 8220

acgagcatca caaaaatcga cgctcaagtc agaggtggcg aaacccgaca ggactataaa 8280

gataccaggc gtttccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc 8340

ttaccggata cctgtccgcc tttctccctt cgggaagcgt ggcgctttct catagctcac 8400

gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac 8460

cccccgttca gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag tccaacccgg 8520

taagacacga cttatcgcca ctggcagcag ccactggtaa caggattagc agagcgaggt 8580

atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa ctacggctac actagaagaa 8640

cagtatttgg tatctgcgct ctgctgaagc cagttacctt cggaaaaaga gttggtagct 8700

cttgatccgg caaacaaacc accgctggta gcggtggttt ttttgtttgc aagcagcaga 8760

ttacgcgcag aaaaaaagga tctcaagaag atcctttgat cttttctacg gggtctgacg 8820

ctcagtggaa cgaaaactca cgttaaggga ttttggtcat gagattatca aaaaggatct 8880

tcacctagat ccttttaaat taaaaatgaa gttttaaatc aatctaaagt atatatgagt 8940

aaacttggtc tgacagttac caatgcttaa tcagtgaggc acctatctca gcgatctgtc 9000

tatttcgttc atccatagtt gcctgactcc ccgtcgtgta gataactacg atacgggagg 9060

gcttaccatc tggccccagt gctgcaatga taccgcgaga cccacgctca ccggctccag 9120

atttatcagc aataaaccag ccagccggaa gggccgagcg cagaagtggt cctgcaactt 9180

tatccgcctc catccagtct attaattgtt gccgggaagc tagagtaagt agttcgccag 9240

ttaatagttt gcgcaacgtt gttgccattg ctacaggcat cgtggtgtca cgctcgtcgt 9300

ttggtatggc ttcattcagc tccggttccc aacgatcaag gcgagttaca tgatccccca 9360

tgttgtgcaa aaaagcggtt agctccttcg gtcctccgat cgttgtcaga agtaagttgg 9420

ccgcagtgtt atcactcatg gttatggcag cactgcataa ttctcttact gtcatgccat 9480

ccgtaagatg cttttctgtg actggtgagt actcaaccaa gtcattctga gaatagtgta 9540

tgcggcgacc gagttgctct tgcccggcgt caatacggga taataccgcg ccacatagca 9600

gaactttaaa agtgctcatc attggaaaac gttcttcggg gcgaaaactc tcaaggatct 9660

taccgctgtt gagatccagt tcgatgtaac ccactcgtgc acccaactga tcttcagcat 9720

cttttacttt caccagcgtt tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa 9780

agggaataag ggcgacacgg aaatgttgaa tactcatact cttccttttt caatattatt 9840

gaagcattta tcagggttat tgtctcatga gcggatacat atttgaatgt atttagaaaa 9900

ataaacagcg atcgcgcggc cgcgggtaat aactgatata attaaattga agctctaatt 9960

tgtgagttta gtatacatgc atttacttat aatacagttt tttagttttg ctggccgcat 10020

cttctcaaat atgcttccca gcctgctttt ctgtaacgtt caccctctac cttagcatcc 10080

cttccctttg caaatagtcc tcttccaaca ataataatgt cagatcctgt agagaccaca 10140

tcatccacgg ttctatactg ttgacccaat gcgtctccct tgtcatctaa acccacaccg 10200

ggtgtcataa tcaaccaatc gtaaccttca tctcttccac ccatgtctct ttgagcaata 10260

aagccgataa caaaatcttt gtcgctcttc gcaatgtcaa cagtaccctt agtatattct 10320

ccagtagcta gggagccctt gcatgacaat tctgctaaca tcaaaaggcc tctaggttcc 10380

tttgttactt cttccgccgc ctgcttcaaa ccgctaacaa tacctgggcc caccacaccg 10440

tgtgcattcg taatgtctgc ccattctgct attctgtata cacccgcaga gtactgcaat 10500

ttgactgtat taccaatgtc agcaaatttt ctgtcttcga agagtaaaaa attgtacttg 10560

gcggataatg cctttagcgg cttaactgtg ccctccatgg aaaaatcagt caagatatcc 10620

acatgtgttt ttagtaaaca aattttggga cctaatgctt caactaactc cagtaattcc 10680

ttggtggtac gaacatccaa tgaagcacac aagtttgttt gcttttcgtg catgatatta 10740

aatagcttgg cagcaacagg actaggatga gtagcagcac gttccttata tgtagctttc 10800

gacatgattt atcttcgttt cctgcaggtt tttgttctgt gcagttgggt taagaatact 10860

gggcaatttc atgtttcttc aacaccacat atgcgtatat ataccaatct aagtctgtgc 10920

tccttccttc gttcttcctt ctgctcggag attaccgaat caaagctagc 10970

<210> 80

<211> 1410

<212> DNA

<213> 人工序列

<220>

<223> 合成核酸

<400> 80

atgtccgttg ttaccaccga tgctcaagct gctcatgctg ctggtgtttc tagattattg 60

gcttcttata gagccattcc accatctgct actgttagat tggctaagcc aacttctaat 120

ttgttcagag ctagagctag aactaacgtt aagggtttgg atgtttctgg tttgactggt 180

gttattggtg ttgatccaga tgctagaact gctgatgttg ctggtatgtg tacttacgaa 240

gatttggttg ctgctacttt gccatatggt ttggctccat tggttgttcc acaattgaaa 300

actattactt tgggtggtgc tgttaccggt ttgggtattg aatctacttc tttcagaaac 360

ggtttgccac acgaatctgt tttggaaatg gatattttga ccggttccgg tgaaatagtt 420

actgcttctc cagatcaaca ctccgatttg tttcatgctt ttccaaactc ttacggtaca 480

ttgggttact ctaccagatt gagaattgaa ttggaaccag ttcatccatt cgttgccttg 540

agacatttga gattccattc cattactgat ttggtcgcag ccatggatag aattattgaa 600

actggtggtt tagacggtga accagttgat tatttggatg gtgttgtttt ctctgccacc 660

gaatcatatt tgtgtgttgg tttcaaaact aagaccccag gtccagtttc tgattatact 720

ggtcaacaaa tcttctacag atccatccaa catgatggtg atactggtgc tgaaaaacat 780

gatagattga ccatccatga ctacttgtgg agatgggata ctgattggtt ttggtgttct 840

agagcttttg gtgctcaaca tccagttatt agaagattct ggccaagaag attaagaaga 900

tcctccttct actggaaatt ggttgcttac gatcaaagat acgatatcgc cgatagaatc 960

gaaaagagaa atggtagacc accaagagaa agagttgttc aagacgttga agttccaatt 1020

gaaagatgcg ctgatttcgt tgaatggttc ttgcaaaatg ttccaatcga acctatttgg 1080

ttgtgcccat tgagattgag agattctgct gatggtggtg cttcatggcc attatatcca 1140

ttgaaagctc atcacaccta cgtcaatatt ggtttctggt catctgttcc agttggtcca 1200

gaagaaggtc ataccaatag attgattgaa aaaaaggtcg ccgaattgga cggtcacaaa 1260

tcattatatt ctgatgccta ctacaccaga gatgaattcg atgaattata cggtggtgaa 1320

gtttacaaca ccgtcaaaaa aacttacgac ccagactcaa gattattaga cttgtactct 1380

aaggccgtcc aaagacaaca tgatgaattg 1410

<210> 81

<211> 1311

<212> DNA

<213> 人工序列

<220>

<223> 合成核酸

<400> 81

atgaccacct tcaaagaaag agaaacttct accgctgata gaaagttgac cttggctgaa 60

attttggaaa ttttcgctgc tggtaaagaa ccattgaagt tcactgctta tgatggttct 120

tctgctggtc ctgaagatgc tactatgggt ttggatttga aaactccaag aggtactact 180

tacttggcta ctgctccagg tgatttgggt ttggctagag cttatgtttc tggtgacttg 240

gaaccacatg gtgttcatcc tggtgatcca tatccattat tgagagcttt agccgaaaga 300

atggaattca aaagaccacc agctagagtt ttggctaaca tcgttagatc cattggtatc 360

gaacatttga agccaattgc tccaccacca caagaagctt tgccaagatg gagaagaatt 420

atggaaggtt tgagacactc taagaccaga gatgctgaag ctattcatca tcactacgat 480

gtttctaaca ccttctacga atgggttttg ggtccatcta tgacttatac ttgtgcttgt 540

tacccaacag aagatgccac tttggaagaa gctcaagata acaagtacag attggtcttt 600

gaaaagttga gattgaagcc aggtgacaga ttattggatg ttggttgtgg ttggggtggt 660

atggttagat atgctgctag acatggtgta aaagctttgg gtgttacttt gtctagagaa 720

caagctactt gggctcaaaa agctattgct caagaaggtt taaccgattt ggctgaagtt 780

agacacggtg attacagaga tgttatcgaa tctggtttcg atgccgtttc ttctattggt 840

ttgactgaac atatcggtgt tcataactat ccagcctact tcaacttctt gaagtctaag 900

ttgagaaccg gtggtttgtt gttgaaccat tgcattacta gaccagataa cagatctgct 960

ccatctgctg gtggttttat tgatagatac gttttcccag atggtgaatt gactggttcc 1020

ggtagaatta ttactgaagc acaagatgtc ggtttggaag ttatccatga agaaaacttg 1080

agaaaccatt acgccatgac tttgagagat tggtgtagaa acttggttga acattgggat 1140

gaagccgttg aagaagttgg tttgccaact gctaaagttt ggggtttgta tatggctggt 1200

tctagattag gttttgaaac taacgttgtc caattgcacc aagttttggc agttaagttg 1260

gatgatcaag gtaaagatgg tggtttgcct ttaagaccat ggtggtctgc t 1311

<210> 82

<211> 4399

<212> DNA

<213> 人工序列

<220>

<223> 合成核酸

<400> 82

tgggtaggtt atatagggat atagcacaga gatatatagc aaagagatac ttttgagcaa 60

tgtttgtgga agcggtattc gcaatttaat taaagctggt gacaattaat catcggctcg 120

tataatgtgt ggaattgaat cgatataagg aggttaatca tgtttaaacc ctcaaaatat 180

attttccctc tatcttctcg ttgcgcttaa tttgactaat tctcattagc gaggcgcgcc 240

tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg 300

gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct ccctcgtgcg 360

ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc cttcgggaag 420

cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc 480

caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct tatccggtaa 540

ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag cagccactgg 600

taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga agtggtggcc 660

taactacggc tacactagaa gaacagtatt tggtatctgc gctctgctga agccagttac 720

cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg gtagcggtgg 780

tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag aagatccttt 840

gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag ggattttggt 900

catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat gaagttttaa 960

atcaatctaa agtatatatg agtaaacttg gtctgacagt taccaatgct taatcagtga 1020

ggcacctatc tcagcgatct gtctatttcg ttcatccata gttgcctgac tccccgtcgt 1080

gtagataact acgatacggg agggcttacc atctggcccc agtgctgcaa tgataccgcg 1140

agacccacgc tcaccggctc cagatttatc agcaataaac cagccagccg gaagggccga 1200

gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag tctattaatt gttgccggga 1260

agctagagta agtagttcgc cagttaatag tttgcgcaac gttgttgcca ttgctacagg 1320

catcgtggtg tcacgctcgt cgtttggtat ggcttcattc agctccggtt cccaacgatc 1380

aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg gttagctcct tcggtcctcc 1440

gatcgttgtc agaagtaagt tggccgcagt gttatcactc atggttatgg cagcactgca 1500

taattctctt actgtcatgc catccgtaag atgcttttct gtgactggtg agtactcaac 1560

caagtcattc tgagaatagt gtatgcggcg accgagttgc tcttgcccgg cgtcaatacg 1620

ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa aacgttcttc 1680

ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt aacccactcg 1740

tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt gagcaaaaac 1800

aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt gaatactcat 1860

actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca tgagcggata 1920

catatttgaa tgtatttaga aaaataaaca gcgatcgcgc ggccgcgggt aataactgat 1980

ataattaaat tgaagctcta atttgtgagt ttagtataca tgcatttact tataatacag 2040

ttttttagtt ttgctggccg catcttctca aatatgcttc ccagcctgct tttctgtaac 2100

gttcaccctc taccttagca tcccttccct ttgcaaatag tcctcttcca acaataataa 2160

tgtcagatcc tgtagagacc acatcatcca cggttctata ctgttgaccc aatgcgtctc 2220

ccttgtcatc taaacccaca ccgggtgtca taatcaacca atcgtaacct tcatctcttc 2280

cacccatgtc tctttgagca ataaagccga taacaaaatc tttgtcgctc ttcgcaatgt 2340

caacagtacc cttagtatat tctccagtag ctagggagcc cttgcatgac aattctgcta 2400

acatcaaaag gcctctaggt tcctttgtta cttcttccgc cgcctgcttc aaaccgctaa 2460

caatacctgg gcccaccaca ccgtgtgcat tcgtaatgtc tgcccattct gctattctgt 2520

atacacccgc agagtactgc aatttgactg tattaccaat gtcagcaaat tttctgtctt 2580

cgaagagtaa aaaattgtac ttggcggata atgcctttag cggcttaact gtgccctcca 2640

tggaaaaatc agtcaagata tccacatgtg tttttagtaa acaaattttg ggacctaatg 2700

cttcaactaa ctccagtaat tccttggtgg tacgaacatc caatgaagca cacaagtttg 2760

tttgcttttc gtgcatgata ttaaatagct tggcagcaac aggactagga tgagtagcag 2820

cacgttcctt atatgtagct ttcgacatga tttatcttcg tttcctgcag gtttttgttc 2880

tgtgcagttg ggttaagaat actgggcaat ttcatgtttc ttcaacacca catatgcgta 2940

tatataccaa tctaagtctg tgctccttcc ttcgttcttc cttctgctcg gagattaccg 3000

aatcaaagct agcttatcga tgataagctg tcaaagatga gaattaattc cacggactat 3060

agactatact agatactccg tctactgtac gatacacttc cgctcaggtc cttgtccttt 3120

aacgaggcct taccactctt ttgttactct attgatccag ctcagcaaag gcagtgtgat 3180

ctaagattct atcttcgcga tgtagtaaaa ctagctagac cgagaaagag actagaaatg 3240

caaaaggcac ttctacaatg gctgccatca ttattatccg atgtgacgct gcagcttctc 3300

aatgatattc gaatacgctt tgaggagata cagcctaata tccgacaaac tgttttacag 3360

atttacgatc gtacttgtta cccatcattg aattttgaac atccgaacct gggagttttc 3420

cctgaaacag atagtatatt tgaacctgta taataatata tagtctagcg ctttacggaa 3480

gacaatgtat gtatttcggt tcctggagaa actattgcat ctattgcata ggtaatcttg 3540

cacgtcgcat ccccggttca ttttctgcgt ttccatcttg cacttcaata gcatatcttt 3600

gttaacgaag catctgtgct tcattttgta gaacaaaaat gcaacgcgag agcgctaatt 3660

tttcaaacaa agaatctgag ctgcattttt acagaacaga aatgcaacgc gaaagcgcta 3720

ttttaccaac gaagaatctg tgcttcattt ttgtaaaaca aaaatgcaac gcgacgagag 3780

cgctaatttt tcaaacaaag aatctgagct gcatttttac agaacagaaa tgcaacgcga 3840

gagcgctatt ttaccaacaa agaatctata cttctttttt gttctacaaa aatgcatccc 3900

gagagcgcta tttttctaac aaagcatctt agattacttt ttttctcctt tgtgcgctct 3960

ataatgcagt ctcttgataa ctttttgcac tgtaggtccg ttaaggttag aagaaggcta 4020

ctttggtgtc tattttctct tccataaaaa aagcctgact ccacttcccg cgtttactga 4080

ttactagcga agctgcgggt gcattttttc aagataaagg catccccgat tatattctat 4140

accgatgtgg attgcgcata ctttgtgaac agaaagtgat agcgttgatg attcttcatt 4200

ggtcagaaaa ttatgaacgg tttcttctat tttgtctcta tatactacgt ataggaaatg 4260

tttacatttt cgtattgttt tcgattcact ctatgaatag ttcttactac aatttttttg 4320

tctaaagagt aatactagag ataaacataa aaaatgtaga ggtcgagttt agatgcaagt 4380

tcaaggagcg aaaggtgga 4399

<210> 83

<211> 7531

<212> DNA

<213> 人工序列

<220>

<223> 合成核酸

<400> 83

gtttgtggaa gcggtattcg caatttaatt aaagctggtg acaattaatc atcggctcgt 60

ataatgtgtg gaattgaatc gatataagga ggttaatcat gtgtctgttc cttcgaccga 120

cgcacgttct gctcacgccg acggcgtgca gcggcttctc gccagctatc gggcgattcc 180

ccaagacgcc acggtccggc tggccaaacc cacgtcgaac ctcttccgtg cccgcgcgaa 240

aaccaggacc aagggtctgg acacgtctgg gttgacgaac gtgatcgcgg tcgacgcgga 300

ggcacgcacc gccgatgtgg cagggatgtg cacctacgaa gacctggtcg cggccacgct 360

gccgcatgga ctttcgccgc tggtggtgcc gcagttgaag acgatcaccc tcggcggggc 420

ggtcaccgga ctcgggatcg agtccgcctc gttccgcaac ggcctgccac acgaatcggt 480

tctcgagatg gacgtcctca ccggcaccgg tgatgtcgtg cgcgcctccc ccgacgagaa 540

ccctgacctg tttcgggcgt ttccgaattc ctatggcacg ttgggctatt cggttcggct 600

caagatcgag ctggaaccgg tgaagccgtt cgtcgcgctg cgccacctcc gtttccattc 660

gctgtcggct ctcatcgagg cgatggaccg catcgtcgaa accggcggcc tcaacggcga 720

accggtggac tacctcgacg gcgtcgtgtt cagtgccgag gagagttacc tgtgcgtggg 780

gcagcgctcc gcgacaccgg gcccggtcag cgactacacg ggcaagcaga tctactaccg 840

ctcgattcag cacgacggcc cgaccgatgg cgccgagaag cacgaccggc tgaccatcca 900

cgactacctg tggcgctggg acaccgactg gttctggtgc tcaagggcat tcggcgcgca 960

gaacccgcgg atccggcgct ggtggccgcg ccggtaccgg cgcagcagtg tgtactggaa 1020

gctgatcggc tacgaccggc gtttcggtat cgccgatcgc atcgagaagc gcaacggccg 1080

acccccgcgc gagcgggtgg tccaggacat cgaggtgccc atcgagcgga ccgtcgagtt 1140

tctgcagtgg tttctcgaca ccgtgcccat cgaaccgatc tggttgtgcc cgttgcggct 1200

ccgcgacgac cgcgattggc ccctgtatcc gatccgaccc caccacacct acgtcaacgt 1260

gggtttctgg tcgtcggtgc cggtgggccc ggaggagggc tacaccaaca ggatgatcga 1320

acggaaagtc agcgacctcg acggtcacaa atcgctgtat tccgatgcgt actactcgcc 1380

ggaagagttt gattcgctct atggcgggga gacgtacaag acggtgaaga agacatacga 1440

cccagactct cgtttcctgg acctgtacgg caaagcagtg gggcggcaat gagcgttgac 1500

gcgaagaacg gaggccacag ttgacgacat ttcgggacgg cgcggccgac accggcctgc 1560

acggagaccg caagctcacc ctggcggagg tcttggaggt cttcgcctcg ggccgactgc 1620

ctctgaagtt cacggcgtac gacggcagca gcgcgggccc ggacgacgcc acgctcgggc 1680

tggacctgct gaccccccgc gggaccacgt acctcgcaac ggctcccggc gatctcggcc 1740

tggcccgggc ctacgtctcc ggtgacctgc agttgcaggg ggtgcaccct ggcgacccgt 1800

acgacctgct caacgcactg gtgcagaaac tggacttcaa gcgaccgtcc gcccgggtgc 1860

tggcgcaggt cgtccgatcg atcgggatcg agcacctgaa accgatcgcg ccaccgccgc 1920

aggaggcgct gccgcggtgg cggcgcatcg cagaaggact gcggcacagc aagacccgtg 1980

acgccgacgc gatccaccac cattacgatg tctccaacac cttctacgag tgggtgctcg 2040

ggccgtcgat gacctacacc tgcgcctgct acccgcatcc cgacgccacc ctcgaggagg 2100

cgcaggagaa caaatatcgg ctggtgttcg agaaactgcg cctcaagccg ggcgaccgcc 2160

ttctcgacgt gggttgcggg tggggcggaa tggtgcgcta cgcggcccgt cacggcgtca 2220

aggcgatcgg ggtgacgctg tccagggagc aggcgcagtg ggcacgcgcc gccatcgaac 2280

gggacggcct gggtgacctc gccgaggtcc gccacagcga ctaccgcgat gtgcgcgagt 2340

cccagttcga cgccgtgtct tcgctggggc tcaccgagca catcggggtc gccaactatc 2400

cgtcgtactt ccggttcctc aagtcgaagt tgcgcccggg cggcctactg ctcaaccact 2460

gcatcacccg gcacaacaat cgcaccggcc ccgccgccgg gggattcatc gaccggtatg 2520

tgttcccgga cggggagctg accggatcgg gccggatcat caccgagatc caggacgtcg 2580

gtttggaggt gatgcacgaa gagaacctgc gccggcacta tgcgctgaca cttcgggact 2640

ggtgccggaa tctggtgcag cactgggacg aagcggtcgc agaggtcggc ctgcccaccg 2700

ccaaggtgtg gggtctgtac atggctgcct cgcgggtcgg cttcgagcag aacagcattc 2760

agctgcatca ggtactggcg gtgaagctcg acgaacgtgg cggggacggc ggtttgccgt 2820

tgcggccctg gtggaccgcg tagcaactat gctcaccgtg tgatccgctt tctgctgcgc 2880

gtcgcggtct ttctcggatc gtcggcgatc gggctactgg tggccggctg gctggtgccg 2940

ggggtgtcgc tgtcggtgct gggcttcgtc accgcggtgg tgatcttcac ggtggcacaa 3000

gggattctgt cgccgttctt cctgaagatg gccagccgct acgcgtcggc cttcctcggc 3060

ggcatcggcc tggtgtccac gttcgtggcg ctgctgctcg cgtcgctgct gtccaacggg 3120

ctcagcatcc gcggcgtcgg gtcgtggatc gcggccacgg tggtggtctg gctggtcaca 3180

gccctggcga ccgtcgtgct gcccgttctg gtgctgcggg agaagaagaa agcagcctga 3240

cctcaaaata tattttccct ctatcttctc gttgcgctta atttgactaa ttctcattag 3300

cgaggcgcgc ctttccatag gctccgcccc cctgacgagc atcacaaaaa tcgacgctca 3360

agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc ccctggaagc 3420

tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc cgcctttctc 3480

ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta ggtatctcag ttcggtgtag 3540

gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc 3600

ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc gccactggca 3660

gcagccactg gtaacaggat tagcagagcg aggtatgtag gcggtgctac agagttcttg 3720

aagtggtggc ctaactacgg ctacactaga agaacagtat ttggtatctg cgctctgctg 3780

aagccagtta ccttcggaaa aagagttggt agctcttgat ccggcaaaca aaccaccgct 3840

ggtagcggtg gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa 3900

gaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa 3960

gggattttgg tcatgagatt atcaaaaagg atcttcacct agatcctttt aaattaaaaa 4020

tgaagtttta aatcaatcta aagtatatat gagtaaactt ggtctgacag ttaccaatgc 4080

ttaatcagtg aggcacctat ctcagcgatc tgtctatttc gttcatccat agttgcctga 4140

ctccccgtcg tgtagataac tacgatacgg gagggcttac catctggccc cagtgctgca 4200

atgataccgc gagacccacg ctcaccggct ccagatttat cagcaataaa ccagccagcc 4260

ggaagggccg agcgcagaag tggtcctgca actttatccg cctccatcca gtctattaat 4320

tgttgccggg aagctagagt aagtagttcg ccagttaata gtttgcgcaa cgttgttgcc 4380

attgctacag gcatcgtggt gtcacgctcg tcgtttggta tggcttcatt cagctccggt 4440

tcccaacgat caaggcgagt tacatgatcc cccatgttgt gcaaaaaagc ggttagctcc 4500

ttcggtcctc cgatcgttgt cagaagtaag ttggccgcag tgttatcact catggttatg 4560

gcagcactgc ataattctct tactgtcatg ccatccgtaa gatgcttttc tgtgactggt 4620

gagtactcaa ccaagtcatt ctgagaatag tgtatgcggc gaccgagttg ctcttgcccg 4680

gcgtcaatac gggataatac cgcgccacat agcagaactt taaaagtgct catcattgga 4740

aaacgttctt cggggcgaaa actctcaagg atcttaccgc tgttgagatc cagttcgatg 4800

taacccactc gtgcacccaa ctgatcttca gcatctttta ctttcaccag cgtttctggg 4860

tgagcaaaaa caggaaggca aaatgccgca aaaaagggaa taagggcgac acggaaatgt 4920

tgaatactca tactcttcct ttttcaatat tattgaagca tttatcaggg ttattgtctc 4980

atgagcggat acatatttga atgtatttag aaaaataaac agcgatcgcg cggccgcggg 5040

taataactga tataattaaa ttgaagctct aatttgtgag tttagtatac atgcatttac 5100

ttataataca gttttttagt tttgctggcc gcatcttctc aaatatgctt cccagcctgc 5160

ttttctgtaa cgttcaccct ctaccttagc atcccttccc tttgcaaata gtcctcttcc 5220

aacaataata atgtcagatc ctgtagagac cacatcatcc acggttctat actgttgacc 5280

caatgcgtct cccttgtcat ctaaacccac accgggtgtc ataatcaacc aatcgtaacc 5340

ttcatctctt ccacccatgt ctctttgagc aataaagccg ataacaaaat ctttgtcgct 5400

cttcgcaatg tcaacagtac ccttagtata ttctccagta gctagggagc ccttgcatga 5460

caattctgct aacatcaaaa ggcctctagg ttcctttgtt acttcttccg ccgcctgctt 5520

caaaccgcta acaatacctg ggcccaccac accgtgtgca ttcgtaatgt ctgcccattc 5580

tgctattctg tatacacccg cagagtactg caatttgact gtattaccaa tgtcagcaaa 5640

ttttctgtct tcgaagagta aaaaattgta cttggcggat aatgccttta gcggcttaac 5700

tgtgccctcc atggaaaaat cagtcaagat atccacatgt gtttttagta aacaaatttt 5760

gggacctaat gcttcaacta actccagtaa ttccttggtg gtacgaacat ccaatgaagc 5820

acacaagttt gtttgctttt cgtgcatgat attaaatagc ttggcagcaa caggactagg 5880

atgagtagca gcacgttcct tatatgtagc tttcgacatg atttatcttc gtttcctgca 5940

ggtttttgtt ctgtgcagtt gggttaagaa tactgggcaa tttcatgttt cttcaacacc 6000

acatatgcgt atatatacca atctaagtct gtgctccttc cttcgttctt ccttctgctc 6060

ggagattacc gaatcaaagc tagcttatcg atgataagct gtcaaagatg agaattaatt 6120

ccacggacta tagactatac tagatactcc gtctactgta cgatacactt ccgctcaggt 6180

ccttgtcctt taacgaggcc ttaccactct tttgttactc tattgatcca gctcagcaaa 6240

ggcagtgtga tctaagattc tatcttcgcg atgtagtaaa actagctaga ccgagaaaga 6300

gactagaaat gcaaaaggca cttctacaat ggctgccatc attattatcc gatgtgacgc 6360

tgcagcttct caatgatatt cgaatacgct ttgaggagat acagcctaat atccgacaaa 6420

ctgttttaca gatttacgat cgtacttgtt acccatcatt gaattttgaa catccgaacc 6480

tgggagtttt ccctgaaaca gatagtatat ttgaacctgt ataataatat atagtctagc 6540

gctttacgga agacaatgta tgtatttcgg ttcctggaga aactattgca tctattgcat 6600

aggtaatctt gcacgtcgca tccccggttc attttctgcg tttccatctt gcacttcaat 6660

agcatatctt tgttaacgaa gcatctgtgc ttcattttgt agaacaaaaa tgcaacgcga 6720

gagcgctaat ttttcaaaca aagaatctga gctgcatttt tacagaacag aaatgcaacg 6780

cgaaagcgct attttaccaa cgaagaatct gtgcttcatt tttgtaaaac aaaaatgcaa 6840

cgcgacgaga gcgctaattt ttcaaacaaa gaatctgagc tgcattttta cagaacagaa 6900

atgcaacgcg agagcgctat tttaccaaca aagaatctat acttcttttt tgttctacaa 6960

aaatgcatcc cgagagcgct atttttctaa caaagcatct tagattactt tttttctcct 7020

ttgtgcgctc tataatgcag tctcttgata actttttgca ctgtaggtcc gttaaggtta 7080

gaagaaggct actttggtgt ctattttctc ttccataaaa aaagcctgac tccacttccc 7140

gcgtttactg attactagcg aagctgcggg tgcatttttt caagataaag gcatccccga 7200

ttatattcta taccgatgtg gattgcgcat actttgtgaa cagaaagtga tagcgttgat 7260

gattcttcat tggtcagaaa attatgaacg gtttcttcta ttttgtctct atatactacg 7320

tataggaaat gtttacattt tcgtattgtt ttcgattcac tctatgaata gttcttacta 7380

caattttttt gtctaaagag taatactaga gataaacata aaaaatgtag aggtcgagtt 7440

tagatgcaag ttcaaggagc gaaaggtgga tgggtaggtt atatagggat atagcacaga 7500

gatatatagc aaagagatac ttttgagcaa t 7531

<210> 84

<211> 7126

<212> DNA

<213> 人工序列

<220>

<223> 合成核酸

<400> 84

gtttgtggaa gcggtattcg caatttaatt aaagctggtg acaattaatc atcggctcgt 60

ataatgtgtg gaattgaatc gatataagga ggttaatcat atgacgcctg aagctagtgc 120

ggcggcgcac gccgctgcgg tggatcgcct catccatagc tatcgggcga ttcctgatga 180

cgcgccggtg cggctggcga agaagacgtc aaacctattc cgccacaggg aaaagacttc 240

tgctcctggg cttgacgtat ccggcctggc tcgcgtgatt gggatcgact cagacactcg 300

cactgccgac gttggcggca tgtgcacata cgaggacctt gtcgcggcga cgctcgaata 360

cgatctggtc cccctggtcg tcccgcaact caaaacgatc actctcggcg gcgcggtgac 420

gggcctggga attgagtcca cctcgttccg caatgggctt ccccatgaat ctgttctcga 480

aatggatatc ctgacgggcg ccggggaggt cgtcacggcc ggcccggaag gcccccatag 540

cgatttgtac tgggggtttc cgaattcgta cggcacgctc ggctatgcga cgcgcctgcg 600

catcgaacta gaaccggtcg agccgtacgt cgaactcagg cacctgcggt tcactagcct 660

cgatgagctt caggagacac ttgacaccgt ttcgtacgaa cacacgtatg acggggaacc 720

cgttcattac gtcgatggag tcatgttctc agccacggaa agctacctca cgcttggccg 780

tcagacgagc gaacccggcc cggtcagcga ctacaccgga aaccagatct actaccgttc 840

aatacagcac ggtggcgctg aaactcccgt cgtcgaccgg atgaccattc atgactatct 900

atggcgctgg gatactgact ggttctggtg ctcgcgtgcc ttcggaacgc aacacccagt 960

ggtccggaga ttctggccac gccgctatcg ccgcagcagc ttctactgga agctgatcgc 1020

gcttgaccgc caggttgggc tcgcggactt catcgaacaa cggaagggca acctcccccg 1080

ggaacgcgta gtccaggaca tcgaggtccc gatcgagaac actgcgagct tcttgcggtg 1140

gttcttggcg aacgtgccga tcgagccggt atggctatgc ccgctgcgcc tgcgaaaaac 1200

acgcagcccc ggcctgcctt cgccgacgtc cccggcttca cgcccatggc ccctctatcc 1260

gctcgagcct cagcgcacat acgtcaatgt tggcttctgg tcagcggtgc cggtcgtggc 1320

cggccagccc gaggggcaca ccaaccggat gatcgagaac gaagtcgatc gccttgacgg 1380

tcacaaatcg ctgtactcag atgcgtttta cgagcgaaaa gagtttgacg cgctgtacgg 1440

cggcgatacc tatagagaac tcaaagagac ctacgaccca aacagccggt tacttgatct 1500

ctatgcaaag gcggtgcaag gacgatgaag gcagtgttga cggcgtttac ggctccccaa 1560

ctcgaaagga tgaacgtcgc tgagatactc agcgcggtac tcgggcgaga tttcccgatc 1620

cggttcactg cgtacgacgg cagcgcgctc ggccccgaaa ccgcccgcta cggcttgcac 1680

ctcacgacgc cgcgcgggct gacctacctc gctaccgcgc ccggtgatct cgggctcgca 1740

cgcgcgtacg tgtccggcga cctcgaggtc agtggggttc atcagggtga cccgtacgag 1800

ataatgaaga tcctcgcgca tgacgtccgg gtgcggcggc cctcgccagc aacgatcgct 1860

tcgatcatgc ggtccctcgg ctgggaacgc ttgcgaccgg tcgcgccgcc cccgcaagag 1920

aacatgcccc gttggcgccg gatggccctt ggcctgctgc actcgaagag ccgtgatgct 1980

gcggcaatcc accatcatta cgacgtgtcg aacgagtttt acgagcacat cctcggcccg 2040

tcgatgacgt acacatgcgc ggcctacccc agcgcagaca gttccctgga ggaagcacag 2100

gacaacaagt accgactcgt cttcgagaaa cttggcctga aagccgggga tcgcctgctt 2160

gacgtcgggt gcgggtgggg cggcatggtg cggttcgccg ctaagcgcgg cgttcatgtc 2220

atcggtgcga cattgtcccg caaacaggcg gaatgggctc agaagatgat tgcccatgaa 2280

ggattgggcg atctggcgga agtccgtttc tgcgactacc gcgatgtcac agaggcgggc 2340

ttcgacgcag tgtcgtcgat cggcctcact gaacacatcg gtttggcgaa ctacccgtcg 2400

tacttcggct tcctgaagga caagttgcgg ccaggcggac gactgctgaa ccattgcatc 2460

actcgcccga acaaccttca aagcaaccgc gcaggtgact tcattgaccg gtacgttttc 2520

cctgacggag agctcgccgg acctggcttc atcatttcag ctgtccacga cgccggtttc 2580

gaggtgcggc acgaagagaa cctccgcgag cactacgcac tgacgctgcg ggactggaac 2640

cgcaacctcg ctcgcgactg ggacgcgtgt gtgcacgcct ccgacgaggg caccgcccgc 2700

gtctggggac tgtacatttc cggttcacga gtcgcgtttg aaacgaactc gattcagctg 2760

caccaggtcc tggcggtcaa aaccgcgcgg aatggcgaag cgcaggtccc gttgggtcag 2820

tggtggaccc gctgacctca aaatatattt tccctctatc ttctcgttgc gcttaatttg 2880

actaattctc attagcgagg cgcgcctttc cataggctcc gcccccctga cgagcatcac 2940

aaaaatcgac gctcaagtca gaggtggcga aacccgacag gactataaag ataccaggcg 3000

tttccccctg gaagctccct cgtgcgctct cctgttccga ccctgccgct taccggatac 3060

ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc atagctcacg ctgtaggtat 3120

ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag 3180

cccgaccgct gcgccttatc cggtaactat cgtcttgagt ccaacccggt aagacacgac 3240

ttatcgccac tggcagcagc cactggtaac aggattagca gagcgaggta tgtaggcggt 3300

gctacagagt tcttgaagtg gtggcctaac tacggctaca ctagaagaac agtatttggt 3360

atctgcgctc tgctgaagcc agttaccttc ggaaaaagag ttggtagctc ttgatccggc 3420

aaacaaacca ccgctggtag cggtggtttt tttgtttgca agcagcagat tacgcgcaga 3480

aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg ggtctgacgc tcagtggaac 3540

gaaaactcac gttaagggat tttggtcatg agattatcaa aaaggatctt cacctagatc 3600

cttttaaatt aaaaatgaag ttttaaatca atctaaagta tatatgagta aacttggtct 3660

gacagttacc aatgcttaat cagtgaggca cctatctcag cgatctgtct atttcgttca 3720

tccatagttg cctgactccc cgtcgtgtag ataactacga tacgggaggg cttaccatct 3780

ggccccagtg ctgcaatgat accgcgagac ccacgctcac cggctccaga tttatcagca 3840

ataaaccagc cagccggaag ggccgagcgc agaagtggtc ctgcaacttt atccgcctcc 3900

atccagtcta ttaattgttg ccgggaagct agagtaagta gttcgccagt taatagtttg 3960

cgcaacgttg ttgccattgc tacaggcatc gtggtgtcac gctcgtcgtt tggtatggct 4020

tcattcagct ccggttccca acgatcaagg cgagttacat gatcccccat gttgtgcaaa 4080

aaagcggtta gctccttcgg tcctccgatc gttgtcagaa gtaagttggc cgcagtgtta 4140

tcactcatgg ttatggcagc actgcataat tctcttactg tcatgccatc cgtaagatgc 4200

ttttctgtga ctggtgagta ctcaaccaag tcattctgag aatagtgtat gcggcgaccg 4260

agttgctctt gcccggcgtc aatacgggat aataccgcgc cacatagcag aactttaaaa 4320

gtgctcatca ttggaaaacg ttcttcgggg cgaaaactct caaggatctt accgctgttg 4380

agatccagtt cgatgtaacc cactcgtgca cccaactgat cttcagcatc ttttactttc 4440

accagcgttt ctgggtgagc aaaaacagga aggcaaaatg ccgcaaaaaa gggaataagg 4500

gcgacacgga aatgttgaat actcatactc ttcctttttc aatattattg aagcatttat 4560

cagggttatt gtctcatgag cggatacata tttgaatgta tttagaaaaa taaacagcga 4620

tcgcgcggcc gcgggtaata actgatataa ttaaattgaa gctctaattt gtgagtttag 4680

tatacatgca tttacttata atacagtttt ttagttttgc tggccgcatc ttctcaaata 4740

tgcttcccag cctgcttttc tgtaacgttc accctctacc ttagcatccc ttccctttgc 4800

aaatagtcct cttccaacaa taataatgtc agatcctgta gagaccacat catccacggt 4860

tctatactgt tgacccaatg cgtctccctt gtcatctaaa cccacaccgg gtgtcataat 4920

caaccaatcg taaccttcat ctcttccacc catgtctctt tgagcaataa agccgataac 4980

aaaatctttg tcgctcttcg caatgtcaac agtaccctta gtatattctc cagtagctag 5040

ggagcccttg catgacaatt ctgctaacat caaaaggcct ctaggttcct ttgttacttc 5100

ttccgccgcc tgcttcaaac cgctaacaat acctgggccc accacaccgt gtgcattcgt 5160

aatgtctgcc cattctgcta ttctgtatac acccgcagag tactgcaatt tgactgtatt 5220

accaatgtca gcaaattttc tgtcttcgaa gagtaaaaaa ttgtacttgg cggataatgc 5280

ctttagcggc ttaactgtgc cctccatgga aaaatcagtc aagatatcca catgtgtttt 5340

tagtaaacaa attttgggac ctaatgcttc aactaactcc agtaattcct tggtggtacg 5400

aacatccaat gaagcacaca agtttgtttg cttttcgtgc atgatattaa atagcttggc 5460

agcaacagga ctaggatgag tagcagcacg ttccttatat gtagctttcg acatgattta 5520

tcttcgtttc ctgcaggttt ttgttctgtg cagttgggtt aagaatactg ggcaatttca 5580

tgtttcttca acaccacata tgcgtatata taccaatcta agtctgtgct ccttccttcg 5640

ttcttccttc tgctcggaga ttaccgaatc aaagctagct tatcgatgat aagctgtcaa 5700

agatgagaat taattccacg gactatagac tatactagat actccgtcta ctgtacgata 5760

cacttccgct caggtccttg tcctttaacg aggccttacc actcttttgt tactctattg 5820

atccagctca gcaaaggcag tgtgatctaa gattctatct tcgcgatgta gtaaaactag 5880

ctagaccgag aaagagacta gaaatgcaaa aggcacttct acaatggctg ccatcattat 5940

tatccgatgt gacgctgcag cttctcaatg atattcgaat acgctttgag gagatacagc 6000

ctaatatccg acaaactgtt ttacagattt acgatcgtac ttgttaccca tcattgaatt 6060

ttgaacatcc gaacctggga gttttccctg aaacagatag tatatttgaa cctgtataat 6120

aatatatagt ctagcgcttt acggaagaca atgtatgtat ttcggttcct ggagaaacta 6180

ttgcatctat tgcataggta atcttgcacg tcgcatcccc ggttcatttt ctgcgtttcc 6240

atcttgcact tcaatagcat atctttgtta acgaagcatc tgtgcttcat tttgtagaac 6300

aaaaatgcaa cgcgagagcg ctaatttttc aaacaaagaa tctgagctgc atttttacag 6360

aacagaaatg caacgcgaaa gcgctatttt accaacgaag aatctgtgct tcatttttgt 6420

aaaacaaaaa tgcaacgcga cgagagcgct aatttttcaa acaaagaatc tgagctgcat 6480

ttttacagaa cagaaatgca acgcgagagc gctattttac caacaaagaa tctatacttc 6540

ttttttgttc tacaaaaatg catcccgaga gcgctatttt tctaacaaag catcttagat 6600

tacttttttt ctcctttgtg cgctctataa tgcagtctct tgataacttt ttgcactgta 6660

ggtccgttaa ggttagaaga aggctacttt ggtgtctatt ttctcttcca taaaaaaagc 6720

ctgactccac ttcccgcgtt tactgattac tagcgaagct gcgggtgcat tttttcaaga 6780

taaaggcatc cccgattata ttctataccg atgtggattg cgcatacttt gtgaacagaa 6840

agtgatagcg ttgatgattc ttcattggtc agaaaattat gaacggtttc ttctattttg 6900

tctctatata ctacgtatag gaaatgttta cattttcgta ttgttttcga ttcactctat 6960

gaatagttct tactacaatt tttttgtcta aagagtaata ctagagataa acataaaaaa 7020

tgtagaggtc gagtttagat gcaagttcaa ggagcgaaag gtggatgggt aggttatata 7080

gggatatagc acagagatat atagcaaaga gatacttttg agcaat 7126

<210> 85

<211> 7925

<212> DNA

<213> 人工序列

<220>

<223> 合成核酸

<400> 85

gtttgtggaa gcggtattcg caatttaatt aaagctggtg acaattaatc atcggctcgt 60

ataatgtgtg gaattgaatc gatataagga ggttaatcat gtgaccgtcg ccggcaggat 120

cactgacgcg gtacgcatag gaaatggact tgaccagcga gatctagccc ccgtcgggtg 180

gtacgcacac gaacaggccg tggcgcgact gaaggccagt ttcgacgcgg tccccgccgg 240

gcgtcgcgtg cggctggcga agaagacgtc caaccttttc cgcgggcgtt ccggcgaggc 300

agtcgggctc gacgtgtcgg ggctgcacgg cgtcatcgcc gtcgaccccg ttgagggcac 360

cgctgacgtc cagggcatgt gcacgtacga ggacctggtg gacgtcctgc tgccctacgg 420

tctggcgccc accgtcgttc cgcagctgaa gaccatcact ctcggcggtg cggtgaccgg 480

catgggggtg gaatccacct ccttccgcaa cggcctgccg cacgaagccg tcctggaaat 540

ggatgtgctc accggtaccg gagacatcct cacctgttcg ccgacccaga acaccgacct 600

ctaccgcggc ttccccaact cctacggttc cctgggatac agcgtgcggc tgaaggtgcg 660

gtgcgaacgg gtggaaccct acgtcgacct gcggcatgta cgcttcgatg acgttcagtc 720

gctcaccgac gccctcgaca acatcgtcgt ggacaaggag tacgagggtg aacgggtcga 780

ctatctcgac ggtgtggtct tcagcctgga ggagagctac ctcgtcctgg gacgggcgac 840

cagcgaggcc ggccccgtta gcgactacac ccgcgagcgc agttactacc gttctctgca 900

gcatccgtcg ggggtcctgc gcgacaagtt gaccatccgc gactacctct ggcggtggga 960

cgtcgactgg ttctggtgca accgggcctt cggtacccag aaccccacca tccgtactct 1020

gtggccgcgg gatctcctgc ggtcgagctt ctactggaag atcatcggct gggaccgacg 1080

cttcgacatc gcggaccgga tcgaggcaca caacgggcgc cccgcacgcg agcgcgtcgt 1140

ccaggacatc gaggtcaccc ccgacaacct gccggagttc ctcacgtggt tcttcaccca 1200

ctgcgagatc gagccggtgt ggctgtgccc cattcgactg gccgacgact cgggcgagcg 1260

gacaccgtgg cccctgtacc cgctgtcacc cggcgacacc tgggtcaacg tgggattctg 1320

gagctcggtg cccgccgacc tgatggggaa ggacgccccg accggagcct tcaaccggga 1380

ggtggagaga gtcgtctcgg acctcggcgg acacaagtcg ttgtactccg aggcattcta 1440

ttctgaggaa cagttcgccg ccctctacgg cggtgaacgt cccgcacaac tcaaggcggt 1500

cttcgacccg gatgaccggt tccccgggtt gtacgagaag accgtgggcg gcgtctgacg 1560

acacgcacga cgacgcacac cgagcacgat gacgcacgac aagcacgatg acgcatgatg 1620

accaagagga gagagatgag caggggattc acgccgctga cggtgggaca gatcgtggac 1680

aaggtcatca caccgccggc accgttccgg gtgaccgctt tcgacggatc caccgcgggg 1740

ccggcagacg cggaactggc actggagatc acatcgccgg acgccctggc ctatatcgtg 1800

accgcgccgg gcgacctcgg actggcacgc gcctacatca ccggaagcct ccgcgtcacc 1860

ggtgacgagc ccggccaccc gtacctcgtc tttgaccacc tccagcacct ttacgaccag 1920

atccgacgcc cctcggcgaa ggacctgctg gatatcgccc gctcgctgaa ggccatgggg 1980

gcgatcaagg tgcagccggc accggagcag gagaccctcc cgggctggaa gagggccata 2040

ctcgaggggc tgtcccggca ctctccggaa cgggacaagg aggtcgtgag ccgccactac 2100

gacgtgggca atgacttcta cgagctcttc ctcggcgatt ccatggccta cacctgtgcc 2160

tactatcccg agtttgacgg tgagaaccag gtcaccggtc ccaccggcgg gtggcggtac 2220

gacgactggg agaaagggcc gaccgccaac gggccgttga cccaggcgca ggacaacaag 2280

catcgcctgg tcttcgacaa gctgcgactc aacccgggtg accggttgtt ggacgtcggc 2340

tgcgggtggg gcggtatggt gcggtacgcc gcccgccacg gcgtgaaggc catcggtgtc 2400

acgctgtccc gagagcagta cgagtggggt aaggcgaaga tcgaggagga gggtctgcag 2460

gacctcgccg aggtccggtg tatggactac cgtgacgtgc cggagtccga cttcgacgcg 2520

gtcagtgcca tcggcatcct cgagcacatc ggcgtgccca actacgagga ctacttcacc 2580

cgcctgttcg ccaagctgcg cccgggcggt cggatgctga accactgcat cacccgtccg 2640

cacaaccgga agacgaagac cggccagttc atcgaccgct acatcttccc cgacggtgag 2700

ctgaccggct cgggccggat catcacgatc atgcaggaca ccggattcga cgtcgtccac 2760

gaggagaatc tgcgaccgca ctaccagcgc acgttgcatg actggtgtga actgttggcc 2820

accaactggg accaggccgt ccatctcgtg ggcgaggaga cggctcgtct gttcggcctg 2880

tacatggcgg ggtcggaatg gggtttcgaa cacaacgtga tccagctcca ccaggttctc 2940

ggcgtgaagc cggacgcggc aggcagttcc ggggtgccgg tccgccagtg gtggaggtcc 3000

tgacggtaac gtcgggacga tgagacggat caccagaggc gctgcggtgg cggtgctgtg 3060

cacaccgttg ctgctcggag cctgcaccat cggcgacgcg ggaccggggg acgagaccac 3120

ggaccctgtc gtggacactg aagcaccgcc cgataaaccg gtgccggact ctgcggcgga 3180

atccggcgct gaagacggac ctgattctga ggtgccggac gaccccgacc agcctgatgc 3240

tgagccggtg gagactgatc ccgacgcccc gggggcccgg ggactggcga tcggtgactg 3300

cgtcgccgac atggaccagc tcgacggcac cggcgacatc gacgtcgtcg actgcgccgg 3360

cccccatgcc ggcgaggtgt acgcacaggc ggatatcgca ggtaagaacc tgttccccgg 3420

caacgagccg ttggggcagg aggcgggagc gatctgcggg ggtgactcct tcaccggcta 3480

tgtcggcatc ggattccccg agtcctcgct ggacgtcgtc acgatgatgc cgtccaagga 3540

gagctgggcg caggaggacc ggacggtgac ctgtgtggtc accgacccga acctcgagca 3600

gatcgccggc acgctcgagc agagctggcg ttagcctcaa aatatatttt ccctctatct 3660

tctcgttgcg cttaatttga ctaattctca ttagcgaggc gcgcctttcc ataggctccg 3720

cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg 3780

actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac 3840

cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca 3900

tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt 3960

gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc 4020

caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag 4080

agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac 4140

tagaagaaca gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt 4200

tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa 4260

gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg 4320

gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa 4380

aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat 4440

atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc 4500

gatctgtcta tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat 4560

acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc 4620

ggctccagat ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc 4680

tgcaacttta tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag 4740

ttcgccagtt aatagtttgc gcaacgttgt tgccattgct acaggcatcg tggtgtcacg 4800

ctcgtcgttt ggtatggctt cattcagctc cggttcccaa cgatcaaggc gagttacatg 4860

atcccccatg ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg ttgtcagaag 4920

taagttggcc gcagtgttat cactcatggt tatggcagca ctgcataatt ctcttactgt 4980

catgccatcc gtaagatgct tttctgtgac tggtgagtac tcaaccaagt cattctgaga 5040

atagtgtatg cggcgaccga gttgctcttg cccggcgtca atacgggata ataccgcgcc 5100

acatagcaga actttaaaag tgctcatcat tggaaaacgt tcttcggggc gaaaactctc 5160

aaggatctta ccgctgttga gatccagttc gatgtaaccc actcgtgcac ccaactgatc 5220

ttcagcatct tttactttca ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc 5280

cgcaaaaaag ggaataaggg cgacacggaa atgttgaata ctcatactct tcctttttca 5340

atattattga agcatttatc agggttattg tctcatgagc ggatacatat ttgaatgtat 5400

ttagaaaaat aaacagcgat cgcgcggccg cgggtaataa ctgatataat taaattgaag 5460

ctctaatttg tgagtttagt atacatgcat ttacttataa tacagttttt tagttttgct 5520

ggccgcatct tctcaaatat gcttcccagc ctgcttttct gtaacgttca ccctctacct 5580

tagcatccct tccctttgca aatagtcctc ttccaacaat aataatgtca gatcctgtag 5640

agaccacatc atccacggtt ctatactgtt gacccaatgc gtctcccttg tcatctaaac 5700

ccacaccggg tgtcataatc aaccaatcgt aaccttcatc tcttccaccc atgtctcttt 5760

gagcaataaa gccgataaca aaatctttgt cgctcttcgc aatgtcaaca gtacccttag 5820

tatattctcc agtagctagg gagcccttgc atgacaattc tgctaacatc aaaaggcctc 5880

taggttcctt tgttacttct tccgccgcct gcttcaaacc gctaacaata cctgggccca 5940

ccacaccgtg tgcattcgta atgtctgccc attctgctat tctgtataca cccgcagagt 6000

actgcaattt gactgtatta ccaatgtcag caaattttct gtcttcgaag agtaaaaaat 6060

tgtacttggc ggataatgcc tttagcggct taactgtgcc ctccatggaa aaatcagtca 6120

agatatccac atgtgttttt agtaaacaaa ttttgggacc taatgcttca actaactcca 6180

gtaattcctt ggtggtacga acatccaatg aagcacacaa gtttgtttgc ttttcgtgca 6240

tgatattaaa tagcttggca gcaacaggac taggatgagt agcagcacgt tccttatatg 6300

tagctttcga catgatttat cttcgtttcc tgcaggtttt tgttctgtgc agttgggtta 6360

agaatactgg gcaatttcat gtttcttcaa caccacatat gcgtatatat accaatctaa 6420

gtctgtgctc cttccttcgt tcttccttct gctcggagat taccgaatca aagctagctt 6480

atcgatgata agctgtcaaa gatgagaatt aattccacgg actatagact atactagata 6540

ctccgtctac tgtacgatac acttccgctc aggtccttgt cctttaacga ggccttacca 6600

ctcttttgtt actctattga tccagctcag caaaggcagt gtgatctaag attctatctt 6660

cgcgatgtag taaaactagc tagaccgaga aagagactag aaatgcaaaa ggcacttcta 6720

caatggctgc catcattatt atccgatgtg acgctgcagc ttctcaatga tattcgaata 6780

cgctttgagg agatacagcc taatatccga caaactgttt tacagattta cgatcgtact 6840

tgttacccat cattgaattt tgaacatccg aacctgggag ttttccctga aacagatagt 6900

atatttgaac ctgtataata atatatagtc tagcgcttta cggaagacaa tgtatgtatt 6960

tcggttcctg gagaaactat tgcatctatt gcataggtaa tcttgcacgt cgcatccccg 7020

gttcattttc tgcgtttcca tcttgcactt caatagcata tctttgttaa cgaagcatct 7080

gtgcttcatt ttgtagaaca aaaatgcaac gcgagagcgc taatttttca aacaaagaat 7140

ctgagctgca tttttacaga acagaaatgc aacgcgaaag cgctatttta ccaacgaaga 7200

atctgtgctt catttttgta aaacaaaaat gcaacgcgac gagagcgcta atttttcaaa 7260

caaagaatct gagctgcatt tttacagaac agaaatgcaa cgcgagagcg ctattttacc 7320

aacaaagaat ctatacttct tttttgttct acaaaaatgc atcccgagag cgctattttt 7380

ctaacaaagc atcttagatt actttttttc tcctttgtgc gctctataat gcagtctctt 7440

gataactttt tgcactgtag gtccgttaag gttagaagaa ggctactttg gtgtctattt 7500

tctcttccat aaaaaaagcc tgactccact tcccgcgttt actgattact agcgaagctg 7560

cgggtgcatt ttttcaagat aaaggcatcc ccgattatat tctataccga tgtggattgc 7620

gcatactttg tgaacagaaa gtgatagcgt tgatgattct tcattggtca gaaaattatg 7680

aacggtttct tctattttgt ctctatatac tacgtatagg aaatgtttac attttcgtat 7740

tgttttcgat tcactctatg aatagttctt actacaattt ttttgtctaa agagtaatac 7800

tagagataaa cataaaaaat gtagaggtcg agtttagatg caagttcaag gagcgaaagg 7860

tggatgggta ggttatatag ggatatagca cagagatata tagcaaagag atacttttga 7920

gcaat 7925

<210> 86

<211> 7141

<212> DNA

<213> 人工序列

<220>

<223> 合成核酸

<400> 86

gtttgtggaa gcggtattcg caatttaatt aaagctggtg acaattaatc atcggctcgt 60

ataatgtgtg gaattgaatc gatataagga ggttaatcat atgcgggagg gtggacgccc 120

cttccgtgcg catcgcactc tgcccgtcac cgggatcgac gctcaccgcg ccggcgtcga 180

acggcttctc gcgtcctacc gcgcgattcc cacggacgcc accgtgcgac tcgcgaagaa 240

gacgtccaac ctgttccggg cgcgggccca gaccagcgca cccggcctcg acgtctccgg 300

gctcggcgga gtcatctcgg tcgacgagca ggaccggacc gcggatgtcg ccggaatgtg 360

cacgtacgaa gacctggtgg acgccaccct cccgtacggg ctggcgccgc tggtggttcc 420

gcaactcaag accatcacac tcggcggcgc ggtcaccggc ctcggcatcg agtcgacgtc 480

gttccgcaac gggctccccc acgaatcggt cctcgagatc gacgtcctga ccggaagcgg 540

cgacatcgtc accgcgagac cggaaggcga gaactccgac ctgttctggg ggttccccaa 600

ctcctacgga accctcggct actccacccg actgcgcatc cagctcgaac ccgtcaaacg 660

gtatgtggca ctgcgccatc tgcgtttcga ctccctggac gagctgcagt cggcaatgga 720

tcgcatcgtc accgagcgcg tccacgacgg catccccgtc gactatctgg acggcgtcgt 780

gttcaccgcg tccgagagtt acctgacact gggccatcag accgacgagg gcggccccgt 840

cagcgactac accgggcaga acatcttcta ccggtccatc cagcacagtt ccgtgaacca 900

ccccaaaacg gacaaactca ccatccgaga ctacctgtgg cgctgggaca ccgactggtt 960

ctggtgctcg cgcgccttcg gcgcccagaa ccccaccatc cgccggctgt ggccgaagaa 1020

cctcctccgc agcagcttct actggaagct catcgccctc gaccacaagt acgacatcgg 1080

cgaccgactc gagaagcgca agggcaaccc gccacgcgaa cgcgtcgtgc aggacgtcga 1140

agtgcccatc gagcgcaccg cggacttcgt ccgctggttc ctcgacgaaa tcccgatcga 1200

accgctgtgg ctgtgcccgt tgcggttgcg ggaacctgcc cccgccggcg cgtcctcgca 1260

acgcccctgg cccctgtacc ccctcgaacc gaaacgcacg tacgtgaaca tcggattctg 1320

gtcatcggtg cccatcgttc cgggccgacc cgagggggcc gcgaatcggc tgatcgaaga 1380

caaggtcagt gacttcgacg gacacaagtc cctctactcc gattcgtact attcacgcga 1440

agatttcgaa cgcctctact acggcggcga tcgatacacg gaactgaaaa aacgctacga 1500

cccgaaatca cgattactgg accttttctc caaggcggtg caacgtcgat gacaactctg 1560

aaagcttcac gctcccagga ccacaagctg accatcgcag agattctcga aactctgtcc 1620

gacggcatgc tccccctgcg gttctccgcc tacgacggca gcgccgccgg cccggaggac 1680

gccccctacg gtctccacct caagacgacc cgaggcacca cctacctggc gaccgccccc 1740

ggcgacctcg gcatggcccg ggcctacgtg tccggcgacc tcgaggcccg cggcgtccac 1800

cccggcgacc cgtacgagat cctccgcgtg atgggcgacg aactgcactt ccgccgtccg 1860

tccgcgctca cgctcgccgc catcacgcgc tcgctcggct gggatctgct gcgccccatc 1920

gcccctcccc cgcaggagca tctcccgcgg tggcgtcgag tcgcggaagg gttgcggcac 1980

tccaagtccc gcgacgccga ggtcatccac caccactacg acgtctcgaa caccttctac 2040

gagtatgtcc tcggcccgtc catgacgtac acgtgcgcct gctacgagaa cgccgagcag 2100

accctcgaag aggcacagga caacaagtac cgcctcgtct tcgagaagct cggcctccag 2160

cccggcgacc gactgctcga catcggttgc ggctggggat cgatggtccg gtacgccgcc 2220

cgccgcggcg tcaaggtcat cggcgccacc ctgtcccgag agcaggccga atgggcacag 2280

aaggccatcg ccgaagaagg actgtccgac ctcgccgagg tccggttctc cgactaccgt 2340

gacgtccccg agaccggatt cgacgccatc tcctcgatcg gcctgaccga gcacatcggc 2400

gtcggcaact accccgccta cttcggactg ctgcagagca agctccgcga gggcggccgg 2460

ctgctgaacc actgcatcac ccggcccgac aaccagagtc aggcacgcgc gggcggcttc 2520

atcgaccggt acgtcttccc cgacggcgaa ctcaccggct ccggacgcat catcaccgag 2580

atccagaacg tcggactcga ggtgcggcac gaggagaatc tgcgcgagca ctacgcactc 2640

accctcgccg gctggtgcca gaacctcgtc gacaactggg acgcctgcgt cgccgaggtc 2700

ggcgaaggca ccgcacgtgt gtggggtctc tacatggccg ggtcgcgact gggcttcgaa 2760

cgcaacgtcg ttcagctgca ccaggtcctc gccgtcaagc tcggacccaa gggcgaggcg 2820

catgtgccgc tgcgtccgtg gtggaagtag cctcaaaata tattttccct ctatcttctc 2880

gttgcgctta atttgactaa ttctcattag cgaggcgcgc ctttccatag gctccgcccc 2940

cctgacgagc atcacaaaaa tcgacgctca agtcagaggt ggcgaaaccc gacaggacta 3000

taaagatacc aggcgtttcc ccctggaagc tccctcgtgc gctctcctgt tccgaccctg 3060

ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa gcgtggcgct ttctcatagc 3120

tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac 3180

gaaccccccg ttcagcccga ccgctgcgcc ttatccggta actatcgtct tgagtccaac 3240

ccggtaagac acgacttatc gccactggca gcagccactg gtaacaggat tagcagagcg 3300

aggtatgtag gcggtgctac agagttcttg aagtggtggc ctaactacgg ctacactaga 3360

agaacagtat ttggtatctg cgctctgctg aagccagtta ccttcggaaa aagagttggt 3420

agctcttgat ccggcaaaca aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag 3480

cagattacgc gcagaaaaaa aggatctcaa gaagatcctt tgatcttttc tacggggtct 3540

gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg tcatgagatt atcaaaaagg 3600

atcttcacct agatcctttt aaattaaaaa tgaagtttta aatcaatcta aagtatatat 3660

gagtaaactt ggtctgacag ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc 3720

tgtctatttc gttcatccat agttgcctga ctccccgtcg tgtagataac tacgatacgg 3780

gagggcttac catctggccc cagtgctgca atgataccgc gagacccacg ctcaccggct 3840

ccagatttat cagcaataaa ccagccagcc ggaagggccg agcgcagaag tggtcctgca 3900

actttatccg cctccatcca gtctattaat tgttgccggg aagctagagt aagtagttcg 3960

ccagttaata gtttgcgcaa cgttgttgcc attgctacag gcatcgtggt gtcacgctcg 4020

tcgtttggta tggcttcatt cagctccggt tcccaacgat caaggcgagt tacatgatcc 4080

cccatgttgt gcaaaaaagc ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag 4140

ttggccgcag tgttatcact catggttatg gcagcactgc ataattctct tactgtcatg 4200

ccatccgtaa gatgcttttc tgtgactggt gagtactcaa ccaagtcatt ctgagaatag 4260

tgtatgcggc gaccgagttg ctcttgcccg gcgtcaatac gggataatac cgcgccacat 4320

agcagaactt taaaagtgct catcattgga aaacgttctt cggggcgaaa actctcaagg 4380

atcttaccgc tgttgagatc cagttcgatg taacccactc gtgcacccaa ctgatcttca 4440

gcatctttta ctttcaccag cgtttctggg tgagcaaaaa caggaaggca aaatgccgca 4500

aaaaagggaa taagggcgac acggaaatgt tgaatactca tactcttcct ttttcaatat 4560

tattgaagca tttatcaggg ttattgtctc atgagcggat acatatttga atgtatttag 4620

aaaaataaac agcgatcgcg cggccgcggg taataactga tataattaaa ttgaagctct 4680

aatttgtgag tttagtatac atgcatttac ttataataca gttttttagt tttgctggcc 4740

gcatcttctc aaatatgctt cccagcctgc ttttctgtaa cgttcaccct ctaccttagc 4800

atcccttccc tttgcaaata gtcctcttcc aacaataata atgtcagatc ctgtagagac 4860

cacatcatcc acggttctat actgttgacc caatgcgtct cccttgtcat ctaaacccac 4920

accgggtgtc ataatcaacc aatcgtaacc ttcatctctt ccacccatgt ctctttgagc 4980

aataaagccg ataacaaaat ctttgtcgct cttcgcaatg tcaacagtac ccttagtata 5040

ttctccagta gctagggagc ccttgcatga caattctgct aacatcaaaa ggcctctagg 5100

ttcctttgtt acttcttccg ccgcctgctt caaaccgcta acaatacctg ggcccaccac 5160

accgtgtgca ttcgtaatgt ctgcccattc tgctattctg tatacacccg cagagtactg 5220

caatttgact gtattaccaa tgtcagcaaa ttttctgtct tcgaagagta aaaaattgta 5280

cttggcggat aatgccttta gcggcttaac tgtgccctcc atggaaaaat cagtcaagat 5340

atccacatgt gtttttagta aacaaatttt gggacctaat gcttcaacta actccagtaa 5400

ttccttggtg gtacgaacat ccaatgaagc acacaagttt gtttgctttt cgtgcatgat 5460

attaaatagc ttggcagcaa caggactagg atgagtagca gcacgttcct tatatgtagc 5520

tttcgacatg atttatcttc gtttcctgca ggtttttgtt ctgtgcagtt gggttaagaa 5580

tactgggcaa tttcatgttt cttcaacacc acatatgcgt atatatacca atctaagtct 5640

gtgctccttc cttcgttctt ccttctgctc ggagattacc gaatcaaagc tagcttatcg 5700

atgataagct gtcaaagatg agaattaatt ccacggacta tagactatac tagatactcc 5760

gtctactgta cgatacactt ccgctcaggt ccttgtcctt taacgaggcc ttaccactct 5820

tttgttactc tattgatcca gctcagcaaa ggcagtgtga tctaagattc tatcttcgcg 5880

atgtagtaaa actagctaga ccgagaaaga gactagaaat gcaaaaggca cttctacaat 5940

ggctgccatc attattatcc gatgtgacgc tgcagcttct caatgatatt cgaatacgct 6000

ttgaggagat acagcctaat atccgacaaa ctgttttaca gatttacgat cgtacttgtt 6060

acccatcatt gaattttgaa catccgaacc tgggagtttt ccctgaaaca gatagtatat 6120

ttgaacctgt ataataatat atagtctagc gctttacgga agacaatgta tgtatttcgg 6180

ttcctggaga aactattgca tctattgcat aggtaatctt gcacgtcgca tccccggttc 6240

attttctgcg tttccatctt gcacttcaat agcatatctt tgttaacgaa gcatctgtgc 6300

ttcattttgt agaacaaaaa tgcaacgcga gagcgctaat ttttcaaaca aagaatctga 6360

gctgcatttt tacagaacag aaatgcaacg cgaaagcgct attttaccaa cgaagaatct 6420

gtgcttcatt tttgtaaaac aaaaatgcaa cgcgacgaga gcgctaattt ttcaaacaaa 6480

gaatctgagc tgcattttta cagaacagaa atgcaacgcg agagcgctat tttaccaaca 6540

aagaatctat acttcttttt tgttctacaa aaatgcatcc cgagagcgct atttttctaa 6600

caaagcatct tagattactt tttttctcct ttgtgcgctc tataatgcag tctcttgata 6660

actttttgca ctgtaggtcc gttaaggtta gaagaaggct actttggtgt ctattttctc 6720

ttccataaaa aaagcctgac tccacttccc gcgtttactg attactagcg aagctgcggg 6780

tgcatttttt caagataaag gcatccccga ttatattcta taccgatgtg gattgcgcat 6840

actttgtgaa cagaaagtga tagcgttgat gattcttcat tggtcagaaa attatgaacg 6900

gtttcttcta ttttgtctct atatactacg tataggaaat gtttacattt tcgtattgtt 6960

ttcgattcac tctatgaata gttcttacta caattttttt gtctaaagag taatactaga 7020

gataaacata aaaaatgtag aggtcgagtt tagatgcaag ttcaaggagc gaaaggtgga 7080

tgggtaggtt atatagggat atagcacaga gatatatagc aaagagatac ttttgagcaa 7140

t 7141

<210> 87

<211> 7588

<212> DNA

<213> 人工序列

<220>

<223> 合成核酸

<400> 87

gtttgtggaa gcggtattcg caatttaatt aaagctggtg acaattaatc atcggctcgt 60

ataatgtgtg gaattgaatc gatataagga ggttaatcat gtgaactgtc agtcttccgc 120

gtccaacctc gccaaccaca tcaacgcggt gtacgagctg cgccgcgcct atgcgcggct 180

gtccgccgac aagccggtgc gcctggcgaa gaccacctcc aacctcttcc gcttccgcag 240

ccgggacgat gccgcgcgtc tcgacgtcag cgctttcacc tcggtgatca gcatcgacac 300

ggaggcgcgg gtcgcggagg tgggcggcat gaccacctac gaggacctgg tcgccgccac 360

cctgcggcat ggcctgatgc cgccggtggt tccgcaactg cgcacgatca ccctgggcgg 420

tgcggtcacc gggctgggga tcgaatcctc gtccttccgc aacgggctcc cgcacgagtc 480

agtggaagag atggagatcc tcaccggcag cggccaggtg gtggtggccc ggcgcgacaa 540

cgagcaccgc gacctgttct acggtttccc caactcgtac ggcaccctcg gttacgcgct 600

gcggctccgc atccagctcg aaccggtccg cccctacgtc cacctgcggc acctgcggtt 660

caccgatgcc gcagcggcca tggccgcgct ggagcagatc tgcgcggacc gcacccacga 720

cggggagacc gtcgacttcg tcgacggcgt cgtgttcgcc cgcaacgagc tgtacctgac 780

cttggggacg ttcaccgacc gggctccgtg gaccagcgac tacaccggaa ccgacatcta 840

ctaccggtcg atcccccgct acgcgggccc cggccccggc gactacctca ccacgcacga 900

ctacctgtgg cggtgggaca ccgactggtt ctggtgctcc cgcgccttcg gactgcagca 960

tcccgtggtg cgccgcctgt ggccgcgttc cttgaaacgc tccgacgtct accgcaagct 1020

cgtcgcctgg gaccggcgca ctgacgcgag ccgcctgctc gactactacc gcgggcgccc 1080

gcccaaggaa ccggtgatcc aggacatcga ggttgaggtg gggcgggctg ccgagttcct 1140

cgacttcttc cacaccgaga tcggcatgtc cccggtgtgg ctgtgcccgc tgcggctgcg 1200

agaagacaca gccgacgata cggaaccggt ctggccgctc taccccctca aaccccgccg 1260

cctctacgtc aacttcgggt tttggggcct cgttccgatc cgtcccggtg gaggcaggac 1320

ataccacaac cggctgatcg aaaaagaagt gacccggttg ggcgggcaca agtcgctcta 1380

ctcggacgcc ttctacgacg aggacgagtt ctgggagctc tacaacgggg agatctaccg 1440

caagctcaaa gctgcctacg accccgacgg tcgactgctc gacctgtaca ccaagtgcgt 1500

cggcggcggg tgagaaagga tgagggatgc gactggcgga ggtattcgaa cgtgtcgtcg 1560

gacccgatgc gcccgtccac ttccgggcct acgacggcag cactgcggga gatccacgca 1620

gtgaagtcgc tatcgtggtt cgccacccgg cagccgtcaa ctacatcgtc caagcgccgg 1680

gagcactcgg tttgacccgc gcctacgtgg cgggatacct cgacgtcgaa ggggacatgt 1740

acaccgcgct gcgggcaatg gccgacgtgg tgttccagga ccggccgcgg ctgtcccccg 1800

gggaactgct gcggatcatc cgcgggatcg ggtgggtgaa gttcgtcaac cggcttccac 1860

cgccgccgca ggaggtgcgc cagtcccgcc tcgccgccct gggctggcgc cactccaagc 1920

agcgcgacgc cgaagccatc cagcaccact acgacgtctc caacgccttc tacgccctgg 1980

tcttgggcga gtcgatgacc tacacctgcg cggtctaccc gaccgagcag gccacgctgg 2040

agcaggcaca gttcttcaag cacgagctga tcgcccgcaa gctcggtctt gcccctggga 2100

tacgactgct ggatgtgggg tgcggctggg gcggcatggt catccacgcg gcccgggagc 2160

acggggtcaa agccctgggg gtgaccctgt ccaaagagca ggctgagtgg gcgcagaagc 2220

ggatcgccca cgagggcctg ggcgacctgg cagaagtccg gcacatggac taccgggacc 2280

tgcccgacgg cgagtacgac gcgatcagct cgatcgggtt gaccgagcac gtcggcaaaa 2340

agaacgtgcc cgcctacttc gcgtcgctgt accgcaagct cgtcccggga ggccgcctgc 2400

tcaaccactg catcacccgg ccccgcaacg acctgccgcc cttcaaacgc ggcggggtga 2460

tcaaccgcta cgtcttcccc gatggggagc tggaagggcc cggctggctg caggcggcga 2520

tgaacgacgc cgggttcgaa atccgccacc aggagaacct gcgggagcac tacgcacgga 2580

ccctgcggga ctggctggcc aacctggacc gcaactggga tgccgcggtg cgggaagtgg 2640

gggagggcac ggcccgagtg tggcggctct acatggccgg gtgcgtgctc ggcttcgaac 2700

gcaacgtggt gcaactgcac cagatcctcg gggtgaagct cgacgggacc gaggcgcgga 2760

tgccgctgcg ccccgacttc gaaccgccgc tgccttaacc gcggtgcaca gccgggggat 2820

atcagtcgcg gaaccgggca tgatgagccc atggctgcga ccgatgacga ccggcaccac 2880

accaccgtcg ccctcgacct catcgacgcg tatgtgcgcg ccgaccgcag aatgatcggt 2940

gaacgttccg cggggatcag cgcggaggcg ggggagcgga tcgtctccac cctgaaagtg 3000

tgcgcggcct tccttgcccg ccgggtccag gagaccgggg tgccgtggcg cgcagcggac 3060

tcccgggaag cggtcgcccg caccgtcgcc gacctgctgg aacccgaggt ggaattcgcg 3120

gtcgtctccg cctgggaggc gtacgcgatc ggggagcacg aggccgcctg ggtccgggcg 3180

cacggcgatc cgctggtctt cgtccacatg ctggccgcgt tctccgctgc tatcggcaca 3240

gcggtctacg gccgtgagga gctgctgccc acgctgcgca gggtgacagc acgataacct 3300

caaaatatat tttccctcta tcttctcgtt gcgcttaatt tgactaattc tcattagcga 3360

ggcgcgcctt tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt 3420

cagaggtggc gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc 3480

ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct 3540

tcgggaagcg tggcgctttc tcatagctca cgctgtaggt atctcagttc ggtgtaggtc 3600

gttcgctcca agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta 3660

tccggtaact atcgtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca 3720

gccactggta acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag 3780

tggtggccta actacggcta cactagaaga acagtatttg gtatctgcgc tctgctgaag 3840

ccagttacct tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt 3900

agcggtggtt tttttgtttg caagcagcag attacgcgca gaaaaaaagg atctcaagaa 3960

gatcctttga tcttttctac ggggtctgac gctcagtgga acgaaaactc acgttaaggg 4020

attttggtca tgagattatc aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga 4080

agttttaaat caatctaaag tatatatgag taaacttggt ctgacagtta ccaatgctta 4140

atcagtgagg cacctatctc agcgatctgt ctatttcgtt catccatagt tgcctgactc 4200

cccgtcgtgt agataactac gatacgggag ggcttaccat ctggccccag tgctgcaatg 4260

ataccgcgag acccacgctc accggctcca gatttatcag caataaacca gccagccgga 4320

agggccgagc gcagaagtgg tcctgcaact ttatccgcct ccatccagtc tattaattgt 4380

tgccgggaag ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt 4440

gctacaggca tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag ctccggttcc 4500

caacgatcaa ggcgagttac atgatccccc atgttgtgca aaaaagcggt tagctccttc 4560

ggtcctccga tcgttgtcag aagtaagttg gccgcagtgt tatcactcat ggttatggca 4620

gcactgcata attctcttac tgtcatgcca tccgtaagat gcttttctgt gactggtgag 4680

tactcaacca agtcattctg agaatagtgt atgcggcgac cgagttgctc ttgcccggcg 4740

tcaatacggg ataataccgc gccacatagc agaactttaa aagtgctcat cattggaaaa 4800

cgttcttcgg ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa 4860

cccactcgtg cacccaactg atcttcagca tcttttactt tcaccagcgt ttctgggtga 4920

gcaaaaacag gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg gaaatgttga 4980

atactcatac tcttcctttt tcaatattat tgaagcattt atcagggtta ttgtctcatg 5040

agcggataca tatttgaatg tatttagaaa aataaacagc gatcgcgcgg ccgcgggtaa 5100

taactgatat aattaaattg aagctctaat ttgtgagttt agtatacatg catttactta 5160

taatacagtt ttttagtttt gctggccgca tcttctcaaa tatgcttccc agcctgcttt 5220

tctgtaacgt tcaccctcta ccttagcatc ccttcccttt gcaaatagtc ctcttccaac 5280

aataataatg tcagatcctg tagagaccac atcatccacg gttctatact gttgacccaa 5340

tgcgtctccc ttgtcatcta aacccacacc gggtgtcata atcaaccaat cgtaaccttc 5400

atctcttcca cccatgtctc tttgagcaat aaagccgata acaaaatctt tgtcgctctt 5460

cgcaatgtca acagtaccct tagtatattc tccagtagct agggagccct tgcatgacaa 5520

ttctgctaac atcaaaaggc ctctaggttc ctttgttact tcttccgccg cctgcttcaa 5580

accgctaaca atacctgggc ccaccacacc gtgtgcattc gtaatgtctg cccattctgc 5640

tattctgtat acacccgcag agtactgcaa tttgactgta ttaccaatgt cagcaaattt 5700

tctgtcttcg aagagtaaaa aattgtactt ggcggataat gcctttagcg gcttaactgt 5760

gccctccatg gaaaaatcag tcaagatatc cacatgtgtt tttagtaaac aaattttggg 5820

acctaatgct tcaactaact ccagtaattc cttggtggta cgaacatcca atgaagcaca 5880

caagtttgtt tgcttttcgt gcatgatatt aaatagcttg gcagcaacag gactaggatg 5940

agtagcagca cgttccttat atgtagcttt cgacatgatt tatcttcgtt tcctgcaggt 6000

ttttgttctg tgcagttggg ttaagaatac tgggcaattt catgtttctt caacaccaca 6060

tatgcgtata tataccaatc taagtctgtg ctccttcctt cgttcttcct tctgctcgga 6120

gattaccgaa tcaaagctag cttatcgatg ataagctgtc aaagatgaga attaattcca 6180

cggactatag actatactag atactccgtc tactgtacga tacacttccg ctcaggtcct 6240

tgtcctttaa cgaggcctta ccactctttt gttactctat tgatccagct cagcaaaggc 6300

agtgtgatct aagattctat cttcgcgatg tagtaaaact agctagaccg agaaagagac 6360

tagaaatgca aaaggcactt ctacaatggc tgccatcatt attatccgat gtgacgctgc 6420

agcttctcaa tgatattcga atacgctttg aggagataca gcctaatatc cgacaaactg 6480

ttttacagat ttacgatcgt acttgttacc catcattgaa ttttgaacat ccgaacctgg 6540

gagttttccc tgaaacagat agtatatttg aacctgtata ataatatata gtctagcgct 6600

ttacggaaga caatgtatgt atttcggttc ctggagaaac tattgcatct attgcatagg 6660

taatcttgca cgtcgcatcc ccggttcatt ttctgcgttt ccatcttgca cttcaatagc 6720

atatctttgt taacgaagca tctgtgcttc attttgtaga acaaaaatgc aacgcgagag 6780

cgctaatttt tcaaacaaag aatctgagct gcatttttac agaacagaaa tgcaacgcga 6840

aagcgctatt ttaccaacga agaatctgtg cttcattttt gtaaaacaaa aatgcaacgc 6900

gacgagagcg ctaatttttc aaacaaagaa tctgagctgc atttttacag aacagaaatg 6960

caacgcgaga gcgctatttt accaacaaag aatctatact tcttttttgt tctacaaaaa 7020

tgcatcccga gagcgctatt tttctaacaa agcatcttag attacttttt ttctcctttg 7080

tgcgctctat aatgcagtct cttgataact ttttgcactg taggtccgtt aaggttagaa 7140

gaaggctact ttggtgtcta ttttctcttc cataaaaaaa gcctgactcc acttcccgcg 7200

tttactgatt actagcgaag ctgcgggtgc attttttcaa gataaaggca tccccgatta 7260

tattctatac cgatgtggat tgcgcatact ttgtgaacag aaagtgatag cgttgatgat 7320

tcttcattgg tcagaaaatt atgaacggtt tcttctattt tgtctctata tactacgtat 7380

aggaaatgtt tacattttcg tattgttttc gattcactct atgaatagtt cttactacaa 7440

tttttttgtc taaagagtaa tactagagat aaacataaaa aatgtagagg tcgagtttag 7500

atgcaagttc aaggagcgaa aggtggatgg gtaggttata tagggatata gcacagagat 7560

atatagcaaa gagatacttt tgagcaat 7588

<210> 88

<211> 7074

<212> DNA

<213> 人工序列

<220>

<223> 合成核酸

<400> 88

gtttgtggaa gcggtattcg caatttaatt aaagctggtg acaattaatc atcggctcgt 60

ataatgtgtg gaattgaatc gatataagga ggttaatcat atgtcacagc tggcggtcac 120

agaccaccac gagcgagcgg tcgaggcgct gcgcaggtcg tatgcggcga tcccgccggg 180

cacaccggtc cgcttggcca agcagacctc caacctgttc cgcttccgcg agccgacggc 240

cgcgcccggc ctggacgtgt ccggcttcaa ccgggtgctg gcggtggacc cggatgcgcg 300

caccgccgac gtgcagggca tgaccaccta cgaggacctg gtcgacgcca ccctgccgca 360

cgggctgatg ccgctggtgg tgccccagct caagacgatc acgctgggcg gggcggtgac 420

cggcctgggc atcgagtcca cctccttccg caacggcctg ccgcacgagt cggtgctgga 480

gatgcagatc atcaccggcg ccggcgaagt ggtcaccgcc accccggacg gggagcactc 540

cgacctgttc tggggcttcc ccaactccta cgggacgctg gggtacgccc tgaagctgaa 600

gatcgaactg gagccggtca agccgtacgt ccggctgcgg cacctgcgct tcgacgacgc 660

cggcgagtgc gccgccaagc tcgccgagct gagcgaaagc cgcgagcacg agggcgatga 720

ggtgcacttt ttggacggca ccttcttcgg gccgcgcgag atgtacctga cgctcggcac 780

gttcaccgac accgccccct atgtgtcgga ctacaccggg cagcacatct actaccggtc 840

gatccagcag cggtcgatcg actttttgac catccgcgac tacctgtggc gctgggacac 900

cgactggttc tggtgctcgc gcgccctggg cgtgcagaac ccgctgatcc ggcgggtgtg 960

gccgaagagc gccaagcggt cggatgtgta ccgcaagctg gtggcctacg aaaagcgcta 1020

ccagttcaag gcgcgcatcg accggtggac gggcaagccg ccgcgcgagg acgtcatcca 1080

ggacatcgag gtgccggcag aacgcctgcc ggagttcctg gagttcttcc acgacaagat 1140

cgggatgagc ccggtgtggc tgtgcccgct gcgggcgcgc caccgctggc cgctgtaccc 1200

gctcaagccc ggcgtcacct acgtcaacgc cggcttctgg gggacggtgc cgctgcagcc 1260

ggggcagatg cccgagtacc acaaccggct gatcgaacgg aaggtcgccc aactggacgg 1320

ccacaagtct ctgtactcga cggcgttcta ctcgcgtgag gagttctggc ggcactacga 1380

cggggaaacc taccggcgtc tgaaggacac ctacgacccc gacgcgcgcc tgctcgacct 1440

ctacgacaag tgcgtgcggg gacgctgacc ggggcggcgg cgatgaagac ccgcggggcg 1500

ggacggacag gagggaagcg atgacgctgg ccaaggtctt cgaggagctg gtcggggcgg 1560

acgcccctgt ggagctcacc gcctacgacg gatcgagagc cggacgcctg ggcagtgatc 1620

tgcgggtcca cgtgaagtcg ccgtacgcgg tgtcctacct ggtgcactcg ccgagcgcgc 1680

tcgggctggc ccgcgcgtac gtggccgggc acctggacgc ctacggcgac atgtacacgc 1740

tgctgcggga gatgacgcag ctgaccgagg cgctgacgcc caaggcccgg ctgcggctgc 1800

tggccggtgt cctgcaggat ccgctgctgc gcgcggcggc cagccgccgt ctgccgcccc 1860

cgccgcagga ggtgcggacc ggccgcacct cctggttccg gcacaccaag cggcgggacg 1920

ccaaggccat ctcccaccac tacgacgtgt ccaacacctt ctatgagtgg gtgctgggcc 1980

cgtcgatgac ctacacctgc gcctgtttcc ccaccgagga cgccaccttg gaggaggcgc 2040

agttccacaa gcacgacctg gtcgccaaga agctcgggct gcggccgggc atgcggctgc 2100

tggacgtggg ctgcggctgg ggcggcatgg tgatgcacgc cgccaagcac tacggggtgc 2160

gggcgctggg cgtcacgctg tccaagcagc aggccgagtg ggcgcagaag gccatcgccg 2220

aggcgggcct gagcgacctg gccgaggtcc gccaccagga ctaccgggac gtcaccgagg 2280

gcgacttcga cgccatcagc tcgatcggcc tcaccgagca catcggcaag gccaacctgc 2340

cgtcctactt cggcttcctg tacggcaagc tcaagccggg cgggcggctg ctcaaccact 2400

gcatcacccg gcccgacaac acccagccgg ccatgaagaa ggacgggttc atcaaccggt 2460

acgtcttccc cgacggggag ctggaggggc ccggctacct gcagacccag atgaacgacg 2520

ccggttttga gatccgccac caggagaacc tgcgcgagca ctacgcccgc accctggccg 2580

gatggtgccg caacctcgat gagcactggg acgaggcggt ggccgaggtc ggcgagggca 2640

ccgcgcgggt gtggcggctg tacatggccg gcagccggct cggtttcgag ctcaactgga 2700

tccagctgca ccagatcctg ggcgtcaagc tcggcgagcg cggcgagtcc cgcatgccgt 2760

tgcggcccga ctggggcgtg tgacctcaaa atatattttc cctctatctt ctcgttgcgc 2820

ttaatttgac taattctcat tagcgaggcg cgcctttcca taggctccgc ccccctgacg 2880

agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat 2940

accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta 3000

ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct 3060

gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc 3120

ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa 3180

gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg 3240

taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact agaagaacag 3300

tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt 3360

gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta 3420

cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc 3480

agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca 3540

cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa 3600

cttggtctga cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat 3660

ttcgttcatc catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct 3720

taccatctgg ccccagtgct gcaatgatac cgcgagaccc acgctcaccg gctccagatt 3780

tatcagcaat aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat 3840

ccgcctccat ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta 3900

atagtttgcg caacgttgtt gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg 3960

gtatggcttc attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt 4020

tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg 4080

cagtgttatc actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg 4140

taagatgctt ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc 4200

ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca catagcagaa 4260

ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac 4320

cgctgttgag atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt 4380

ttactttcac cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg 4440

gaataagggc gacacggaaa tgttgaatac tcatactctt cctttttcaa tattattgaa 4500

gcatttatca gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata 4560

aacagcgatc gcgcggccgc gggtaataac tgatataatt aaattgaagc tctaatttgt 4620

gagtttagta tacatgcatt tacttataat acagtttttt agttttgctg gccgcatctt 4680

ctcaaatatg cttcccagcc tgcttttctg taacgttcac cctctacctt agcatccctt 4740

ccctttgcaa atagtcctct tccaacaata ataatgtcag atcctgtaga gaccacatca 4800

tccacggttc tatactgttg acccaatgcg tctcccttgt catctaaacc cacaccgggt 4860

gtcataatca accaatcgta accttcatct cttccaccca tgtctctttg agcaataaag 4920

ccgataacaa aatctttgtc gctcttcgca atgtcaacag tacccttagt atattctcca 4980

gtagctaggg agcccttgca tgacaattct gctaacatca aaaggcctct aggttccttt 5040

gttacttctt ccgccgcctg cttcaaaccg ctaacaatac ctgggcccac cacaccgtgt 5100

gcattcgtaa tgtctgccca ttctgctatt ctgtatacac ccgcagagta ctgcaatttg 5160

actgtattac caatgtcagc aaattttctg tcttcgaaga gtaaaaaatt gtacttggcg 5220

gataatgcct ttagcggctt aactgtgccc tccatggaaa aatcagtcaa gatatccaca 5280

tgtgttttta gtaaacaaat tttgggacct aatgcttcaa ctaactccag taattccttg 5340

gtggtacgaa catccaatga agcacacaag tttgtttgct tttcgtgcat gatattaaat 5400

agcttggcag caacaggact aggatgagta gcagcacgtt ccttatatgt agctttcgac 5460

atgatttatc ttcgtttcct gcaggttttt gttctgtgca gttgggttaa gaatactggg 5520

caatttcatg tttcttcaac accacatatg cgtatatata ccaatctaag tctgtgctcc 5580

ttccttcgtt cttccttctg ctcggagatt accgaatcaa agctagctta tcgatgataa 5640

gctgtcaaag atgagaatta attccacgga ctatagacta tactagatac tccgtctact 5700

gtacgataca cttccgctca ggtccttgtc ctttaacgag gccttaccac tcttttgtta 5760

ctctattgat ccagctcagc aaaggcagtg tgatctaaga ttctatcttc gcgatgtagt 5820

aaaactagct agaccgagaa agagactaga aatgcaaaag gcacttctac aatggctgcc 5880

atcattatta tccgatgtga cgctgcagct tctcaatgat attcgaatac gctttgagga 5940

gatacagcct aatatccgac aaactgtttt acagatttac gatcgtactt gttacccatc 6000

attgaatttt gaacatccga acctgggagt tttccctgaa acagatagta tatttgaacc 6060

tgtataataa tatatagtct agcgctttac ggaagacaat gtatgtattt cggttcctgg 6120

agaaactatt gcatctattg cataggtaat cttgcacgtc gcatccccgg ttcattttct 6180

gcgtttccat cttgcacttc aatagcatat ctttgttaac gaagcatctg tgcttcattt 6240

tgtagaacaa aaatgcaacg cgagagcgct aatttttcaa acaaagaatc tgagctgcat 6300

ttttacagaa cagaaatgca acgcgaaagc gctattttac caacgaagaa tctgtgcttc 6360

atttttgtaa aacaaaaatg caacgcgacg agagcgctaa tttttcaaac aaagaatctg 6420

agctgcattt ttacagaaca gaaatgcaac gcgagagcgc tattttacca acaaagaatc 6480

tatacttctt ttttgttcta caaaaatgca tcccgagagc gctatttttc taacaaagca 6540

tcttagatta ctttttttct cctttgtgcg ctctataatg cagtctcttg ataacttttt 6600

gcactgtagg tccgttaagg ttagaagaag gctactttgg tgtctatttt ctcttccata 6660

aaaaaagcct gactccactt cccgcgttta ctgattacta gcgaagctgc gggtgcattt 6720

tttcaagata aaggcatccc cgattatatt ctataccgat gtggattgcg catactttgt 6780

gaacagaaag tgatagcgtt gatgattctt cattggtcag aaaattatga acggtttctt 6840

ctattttgtc tctatatact acgtatagga aatgtttaca ttttcgtatt gttttcgatt 6900

cactctatga atagttctta ctacaatttt tttgtctaaa gagtaatact agagataaac 6960

ataaaaaatg tagaggtcga gtttagatgc aagttcaagg agcgaaaggt ggatgggtag 7020

gttatatagg gatatagcac agagatatat agcaaagaga tacttttgag caat 7074

<210> 89

<211> 7331

<212> DNA

<213> 人工序列

<220>

<223> 合成核酸

<400> 89

gtttgtggaa gcggtattcg caatttaatt aaagctggtg acaattaatc atcggctcgt 60

ataatgtgtg gaattgaatc gatataagga ggttaatcat atgagcggat tagttgaccc 120

ggatagtact tttttaaaga ccatcggaaa actgagcaac agcttgtcca ttggtcgtgg 180

agtagatcaa aaagaggtaa tccccaaagg ctggaacgcc cattgggagg caattacaaa 240

gcttaagaga agctttgacg cgattcctgc tggggagcgg gtgcgtttag ctaagaaaac 300

ctccaacctg ttccgtggac gctccgatgc aggtcacggc ctagatgtgg cagcgcttgg 360

gggagtgatt gccattgatc cggtcaatgc caccgccgat gtacagggca tgtgcacgta 420

tgaagacctg gtagatgcca ctttaagtta tggtctgatg ccgttggttg tgcctcaact 480

gaaaaccatc acgcttggtg gcgcagtgac cggaatgggc gtggaatcca catccttccg 540

caacggtttg ccacacgaat cagtgctgga gatggatatt tttaccggca ctggtgagat 600

cgtgacttgc tcgcccacag aaaatgtcga cctttacaga ggttttccca actcttatgg 660

ttcgctggga tacgcggtgc ggctaaaaat tgagctggaa ccagtgcaag attacgtcca 720

gctgcgccac gtgcgcttca acgatttaga gtctttgacc aaagcgattg aggaagtcgc 780

gtcttctctg gagtttgata accaacccgt cgattacctt gacggcgtgg tgttttcacc 840

cacggaagcc tacttagttc ttggcacgca aacctcacaa cctggcccca ccagcgatta 900

caccagggat ttaagctact accgctccct gcaacaccca gagggcatca cctatgaccg 960

cctgacaatc cgcgattaca tctggcgctg ggacaccgac tggttctggt gttcacgcgc 1020

attcggcacc caaaaccccg tggtgcgcaa actctggccc agggatctgc tgcgctcgag 1080

tttctattgg aagatcatcg gctgggatcg aaaatactcc atcgctgatc gcctggaaga 1140

gcgcaaaggc cgcccggcta gggaacgggt ggtccaagac gtggaagtta cgattgataa 1200

actgccagaa tttttgaaat ggttctttga aagcagcgac atcgagccgc tgtggctgtg 1260

cccgatcaag cttcgggagg taccaggtag ttcggttggt gctggagaaa ttttgagctc 1320

cgctgaagca atcgactccg gtgctgctga acacccttgg ccgctgtatc ccttgaagaa 1380

ggacgtgctg tgggtcaaca tcggattctg gtcctcagtg ccggttgatc tgatgggctc 1440

cgatgcacca gagggagcat ttaacagaga aatcgaacgc gtcatggcag agctaggcgg 1500

acataaatcg ctgtactccg aagcgttcta caccagggaa gactttgaaa aactttatgg 1560

cggaaccatc ccggcgctgc taaaaaagca gtgggatccc cacagccgat tccccggttt 1620

gtatgaaaag acagtaaaag gcgcctagga tcgctcactg taggtagagg cttgtggtca 1680

ctacttgtgg ccacatttta aaaaaatgca caagaagaga aagcaaagca ttatgagtaa 1740

cgccgtagcg caggacctca tgaccatcgc cgacatcgtc gaggccacga ccactgcacc 1800

catcccattc cacatcactg ccttcgatgg aagcttcact ggccctgaag atgctcccta 1860

ccagctgttt gttgccaaca cggatgcagt atcctacatc gcaacagcgc caggagattt 1920

gggtttggca cgtgcctacc tcatgggaga cctcatcgtg gaaggtgagc atcccggcca 1980

tccttatggg atctttgatg cgttgaagga gttctaccgc tgcttcaaac gcccagatgc 2040

atccaccacc ttgcagatca tgtggactct gcggaaaatg aatgccttaa aattccagga 2100

aattccacca atggaacaag cccctgcatg gcgtaaagca ctgatcaacg ggctagcatc 2160

caggcactcg aaatcccgcg acaagaaagc cattagctac cactacgacg tgggcaatga 2220

gttctactcc ctgtttttag atgattccat gacctatacc tgcgcgtatt atccaacgcc 2280

agaatcaagt ttggaagaag cccaagaaaa caaataccgc ctcatctttg aaaaactgcg 2340

tctgaaagaa ggcgatcgcc tcctagacgt gggatgcggt tggggaggca tggtccgcta 2400

cgccgccaaa cacggtgtga aagccatcgg agttacgctg tctgaacagc aatatgagtg 2460

gggtcaagca gagatcaaac gccaaggttt ggaagacctc gcggaaattc gcttcatgga 2520

ttaccgcgat gttccagaaa ctggattcga tgcgatctca gcaatcggca tcattgaaca 2580

catcggtgtg aacaactatc ccgactactt tgaattgctc agcagcaaac tcaaaacagg 2640

cggactgatg ctcaaccaca gcatcaccta cccagacaac cgcccccgcc acgcaggtgc 2700

atttattgat cgctacattt tccccgacgg tgaactcact ggctctggca ccctgatcaa 2760

gcacatgcag gacaacggtt tcgaagtgct gcacgaagaa aacctccgct ttgattacca 2820

acgcaccctg cacgcgtggt gcgaaaacct caaagaaaat tgggaggaag cagttgaact 2880

cgccggtgaa cccactgcac gactctttgg cctgtacatg gcaggttcgg aatggggatt 2940

tgcccacaac atcgtccagc tgcaccaagt actgggtgtg aaactcgatg agcagggaag 3000

tcgcggagaa gttcctgaaa gaatgtggtg gactatctaa cctcaaaata tattttccct 3060

ctatcttctc gttgcgctta atttgactaa ttctcattag cgaggcgcgc ctttccatag 3120

gctccgcccc cctgacgagc atcacaaaaa tcgacgctca agtcagaggt ggcgaaaccc 3180

gacaggacta taaagatacc aggcgtttcc ccctggaagc tccctcgtgc gctctcctgt 3240

tccgaccctg ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa gcgtggcgct 3300

ttctcatagc tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct ccaagctggg 3360

ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc ttatccggta actatcgtct 3420

tgagtccaac ccggtaagac acgacttatc gccactggca gcagccactg gtaacaggat 3480

tagcagagcg aggtatgtag gcggtgctac agagttcttg aagtggtggc ctaactacgg 3540

ctacactaga agaacagtat ttggtatctg cgctctgctg aagccagtta ccttcggaaa 3600

aagagttggt agctcttgat ccggcaaaca aaccaccgct ggtagcggtg gtttttttgt 3660

ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa gaagatcctt tgatcttttc 3720

tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg tcatgagatt 3780

atcaaaaagg atcttcacct agatcctttt aaattaaaaa tgaagtttta aatcaatcta 3840

aagtatatat gagtaaactt ggtctgacag ttaccaatgc ttaatcagtg aggcacctat 3900

ctcagcgatc tgtctatttc gttcatccat agttgcctga ctccccgtcg tgtagataac 3960

tacgatacgg gagggcttac catctggccc cagtgctgca atgataccgc gagacccacg 4020

ctcaccggct ccagatttat cagcaataaa ccagccagcc ggaagggccg agcgcagaag 4080

tggtcctgca actttatccg cctccatcca gtctattaat tgttgccggg aagctagagt 4140

aagtagttcg ccagttaata gtttgcgcaa cgttgttgcc attgctacag gcatcgtggt 4200

gtcacgctcg tcgtttggta tggcttcatt cagctccggt tcccaacgat caaggcgagt 4260

tacatgatcc cccatgttgt gcaaaaaagc ggttagctcc ttcggtcctc cgatcgttgt 4320

cagaagtaag ttggccgcag tgttatcact catggttatg gcagcactgc ataattctct 4380

tactgtcatg ccatccgtaa gatgcttttc tgtgactggt gagtactcaa ccaagtcatt 4440

ctgagaatag tgtatgcggc gaccgagttg ctcttgcccg gcgtcaatac gggataatac 4500

cgcgccacat agcagaactt taaaagtgct catcattgga aaacgttctt cggggcgaaa 4560

actctcaagg atcttaccgc tgttgagatc cagttcgatg taacccactc gtgcacccaa 4620

ctgatcttca gcatctttta ctttcaccag cgtttctggg tgagcaaaaa caggaaggca 4680

aaatgccgca aaaaagggaa taagggcgac acggaaatgt tgaatactca tactcttcct 4740

ttttcaatat tattgaagca tttatcaggg ttattgtctc atgagcggat acatatttga 4800

atgtatttag aaaaataaac agcgatcgcg cggccgcggg taataactga tataattaaa 4860

ttgaagctct aatttgtgag tttagtatac atgcatttac ttataataca gttttttagt 4920

tttgctggcc gcatcttctc aaatatgctt cccagcctgc ttttctgtaa cgttcaccct 4980

ctaccttagc atcccttccc tttgcaaata gtcctcttcc aacaataata atgtcagatc 5040

ctgtagagac cacatcatcc acggttctat actgttgacc caatgcgtct cccttgtcat 5100

ctaaacccac accgggtgtc ataatcaacc aatcgtaacc ttcatctctt ccacccatgt 5160

ctctttgagc aataaagccg ataacaaaat ctttgtcgct cttcgcaatg tcaacagtac 5220

ccttagtata ttctccagta gctagggagc ccttgcatga caattctgct aacatcaaaa 5280

ggcctctagg ttcctttgtt acttcttccg ccgcctgctt caaaccgcta acaatacctg 5340

ggcccaccac accgtgtgca ttcgtaatgt ctgcccattc tgctattctg tatacacccg 5400

cagagtactg caatttgact gtattaccaa tgtcagcaaa ttttctgtct tcgaagagta 5460

aaaaattgta cttggcggat aatgccttta gcggcttaac tgtgccctcc atggaaaaat 5520

cagtcaagat atccacatgt gtttttagta aacaaatttt gggacctaat gcttcaacta 5580

actccagtaa ttccttggtg gtacgaacat ccaatgaagc acacaagttt gtttgctttt 5640

cgtgcatgat attaaatagc ttggcagcaa caggactagg atgagtagca gcacgttcct 5700

tatatgtagc tttcgacatg atttatcttc gtttcctgca ggtttttgtt ctgtgcagtt 5760

gggttaagaa tactgggcaa tttcatgttt cttcaacacc acatatgcgt atatatacca 5820

atctaagtct gtgctccttc cttcgttctt ccttctgctc ggagattacc gaatcaaagc 5880

tagcttatcg atgataagct gtcaaagatg agaattaatt ccacggacta tagactatac 5940

tagatactcc gtctactgta cgatacactt ccgctcaggt ccttgtcctt taacgaggcc 6000

ttaccactct tttgttactc tattgatcca gctcagcaaa ggcagtgtga tctaagattc 6060

tatcttcgcg atgtagtaaa actagctaga ccgagaaaga gactagaaat gcaaaaggca 6120

cttctacaat ggctgccatc attattatcc gatgtgacgc tgcagcttct caatgatatt 6180

cgaatacgct ttgaggagat acagcctaat atccgacaaa ctgttttaca gatttacgat 6240

cgtacttgtt acccatcatt gaattttgaa catccgaacc tgggagtttt ccctgaaaca 6300

gatagtatat ttgaacctgt ataataatat atagtctagc gctttacgga agacaatgta 6360

tgtatttcgg ttcctggaga aactattgca tctattgcat aggtaatctt gcacgtcgca 6420

tccccggttc attttctgcg tttccatctt gcacttcaat agcatatctt tgttaacgaa 6480

gcatctgtgc ttcattttgt agaacaaaaa tgcaacgcga gagcgctaat ttttcaaaca 6540

aagaatctga gctgcatttt tacagaacag aaatgcaacg cgaaagcgct attttaccaa 6600

cgaagaatct gtgcttcatt tttgtaaaac aaaaatgcaa cgcgacgaga gcgctaattt 6660

ttcaaacaaa gaatctgagc tgcattttta cagaacagaa atgcaacgcg agagcgctat 6720

tttaccaaca aagaatctat acttcttttt tgttctacaa aaatgcatcc cgagagcgct 6780

atttttctaa caaagcatct tagattactt tttttctcct ttgtgcgctc tataatgcag 6840

tctcttgata actttttgca ctgtaggtcc gttaaggtta gaagaaggct actttggtgt 6900

ctattttctc ttccataaaa aaagcctgac tccacttccc gcgtttactg attactagcg 6960

aagctgcggg tgcatttttt caagataaag gcatccccga ttatattcta taccgatgtg 7020

gattgcgcat actttgtgaa cagaaagtga tagcgttgat gattcttcat tggtcagaaa 7080

attatgaacg gtttcttcta ttttgtctct atatactacg tataggaaat gtttacattt 7140

tcgtattgtt ttcgattcac tctatgaata gttcttacta caattttttt gtctaaagag 7200

taatactaga gataaacata aaaaatgtag aggtcgagtt tagatgcaag ttcaaggagc 7260

gaaaggtgga tgggtaggtt atatagggat atagcacaga gatatatagc aaagagatac 7320

ttttgagcaa t 7331

<210> 90

<211> 7126

<212> DNA

<213> 人工序列

<220>

<223> 合成核酸

<400> 90

gtttgtggaa gcggtattcg caatttaatt aaagctggtg acaattaatc atcggctcgt 60

ataatgtgtg gaattgaatc gatataagga ggttaatcat gtgtccgctc ctgcgaccga 120

tgcacgaacc gcccacgccg acggcgtgga gcgattgctc gagagttatc gggcggtgcc 180

ggcggccgca tcggtgcggc tcgccaagcg cacctcgaac ctcttccggt cccgagcggc 240

gacggatgcc cctggcctcg acacctccgg cctgacccac gtcatcgcgg tcgaccccgg 300

ggcgcgcacg gccgacgtcg ccggcatgtg cacctacgac gacctcgtcg ccgcgacact 360

gccgcatggg ctcgcgccac tcgtggtgcc gcaactgaag accatcaccc tcgggggcgc 420

cgtaacggga ctcggcatcg agtcgacgtc gttccgcaac ggtctgccgc acgagtcggt 480

gctcgagatc gacgtgctca ccggcgcagg cgagatcatc acggcgtcgc cgatcgagca 540

cgcagagctg ttccgcgcct tccccaactc gtacggcacc ctcggctacg ccgtgcgcct 600

gcgcatcgag ctcgagccgg tcgagccgtt cgtcgcactc acgcaccttc ggttccatgc 660

gctcaccgac ctcatcgagg caatggagcg catcatcgag accggtcgac tcgacggggt 720

tgccgtcgat tccctcgacg gcgtggtgtt cagcgctgaa gagagctacc tgtgcgtcgg 780

cacgcagacc gcggcatccg gcccggtcag cgactacacc cgccagcaga tcttctatcg 840

ctccatccag catgacgacg gtgcgaagca cgaccggctc accatgcacg actacctgtg 900

gcgctgggac gccgactggt tctggtgctc gcaggcgttc ggcgcgcagc atccgctgat 960

tcgccggttc tggccgcggc gataccggcg cagccgctcg tactcgacgc tcatgcgcct 1020

cgaacggcga ttcgacctcg gcgatcgcct cgagaagctc aagggccggc cggcgcgcga 1080

acgcgtgatc caagacgtcg aggtgccgat cgggcgcacc gtcggcttcc tcgaatggtt 1140

cctcgcgaac gtgccgatcg agccgatctg gttgtgcccg ctgcgcctgc ggggcgaccg 1200

cggctggcct ctctacccga tccggccgca gcagacctac gtcaacatcg gcttctggtc 1260

gacggttccg gtgggcggct ccgagggcga gacgaaccgc tcgatcgagc gcgccgtgag 1320

cgagttcgac ggacacaagt cgctgtactc cgactcgtac tactcgcgcg aggagttcga 1380

ggagctctac ggcggcgagg cgtaccgggc cgtgaagcgg cgatacgacc ccgactctcg 1440

actgctcgac ctctatgcga aggcggtgca acggcgatga ccacgaccaa acgccaggcg 1500

acagcggggc aggctgagac cgcgccgacg acggatgcgg cggccgcacc cgactcgtcg 1560

gcgaagctca ccctcgccga gatcctcgag atcgtcgtcg ccggtcggct gccgctgagg 1620

ttcaccgcct acgacgggag ctcggcgggg ccgcctgacg ccctgttcgg cctcgacctg 1680

aagactccgc gaggaacgac ctatctcgcc accggccgcg gcgatctcgg cctcgcccgc 1740

gcctacatcg cgggcgacct cgagatacag ggggtgcacc ccggagaccc ctacgagctg 1800

ctcaaggcac tcgccgacag cctggtcttc aagctgccac cgccgcgggt gatgacccag 1860

atcatccgtt cgatcggcgt cgaacatctg cggccgatcg cgccgccgcc gcaagaggtg 1920

ccgccccggt ggcgccgcat cgccgagggg ctccgacaca gcaagggccg cgacgccgaa 1980

gcgatccacc accactacga cgtgtcgaac accttctacg aatgggtgct cgggccgtcg 2040

atgacctaca cgtgcgcgtg ctacccgggc ctcgacgcat ccctcgacga ggcgcagcag 2100

aacaagtacc ggctcgtgtt cgagaagctg cggctgaagc cgggcgaccg actgctcgac 2160

gtcggctgcg ggtggggcgg catggtgcgc tacgccgcgc gccacggcgt gcaggcgttg 2220

ggcgtgaccc tgtcgcgaga gcagacggcg tgggcgcagc aggcgatcgc cgtcgagggc 2280

ctcgccgacc tcgccgaggt gcgctacggc gactaccgcg acatcgccga agacggcttc 2340

gatgcggtgt catcgatcgg gctgctcgag cacatcggcg tgcgcaacta cgcttcgtat 2400

ttcggctttc tgcagtcgcg cttgcggccc gggggactct tgctcaacca ctgcatcacc 2460

cggcccgaca atcgctccga gccgtcggcg cgcggcttca tcgaccggta cgtgttcccc 2520

gacggagagc tcaccggctc gggccgcatc atcaccgagg cgcaggatgt cggcttcgaa 2580

gtgctgcacg aagagaacct gcgtcagcat tatgcactga cactgcgcga ttggtgcgcc 2640

aacctcgtcg cgcactggga agaggcggtc gccgaggtcg ggctgccgac cgcgaaggtg 2700

tggggcctct acatggccgg gtcacggctc gcgttcgaga gcggcggcat ccagttgcac 2760

caggtgctgg cggtcagacc agacgatcgc agcgacgccg cccagctgcc gctgcggccg 2820

tggtggacgc catagcctca aaatatattt tccctctatc ttctcgttgc gcttaatttg 2880

actaattctc attagcgagg cgcgcctttc cataggctcc gcccccctga cgagcatcac 2940

aaaaatcgac gctcaagtca gaggtggcga aacccgacag gactataaag ataccaggcg 3000

tttccccctg gaagctccct cgtgcgctct cctgttccga ccctgccgct taccggatac 3060

ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc atagctcacg ctgtaggtat 3120

ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag 3180

cccgaccgct gcgccttatc cggtaactat cgtcttgagt ccaacccggt aagacacgac 3240

ttatcgccac tggcagcagc cactggtaac aggattagca gagcgaggta tgtaggcggt 3300

gctacagagt tcttgaagtg gtggcctaac tacggctaca ctagaagaac agtatttggt 3360

atctgcgctc tgctgaagcc agttaccttc ggaaaaagag ttggtagctc ttgatccggc 3420

aaacaaacca ccgctggtag cggtggtttt tttgtttgca agcagcagat tacgcgcaga 3480

aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg ggtctgacgc tcagtggaac 3540

gaaaactcac gttaagggat tttggtcatg agattatcaa aaaggatctt cacctagatc 3600

cttttaaatt aaaaatgaag ttttaaatca atctaaagta tatatgagta aacttggtct 3660

gacagttacc aatgcttaat cagtgaggca cctatctcag cgatctgtct atttcgttca 3720

tccatagttg cctgactccc cgtcgtgtag ataactacga tacgggaggg cttaccatct 3780

ggccccagtg ctgcaatgat accgcgagac ccacgctcac cggctccaga tttatcagca 3840

ataaaccagc cagccggaag ggccgagcgc agaagtggtc ctgcaacttt atccgcctcc 3900

atccagtcta ttaattgttg ccgggaagct agagtaagta gttcgccagt taatagtttg 3960

cgcaacgttg ttgccattgc tacaggcatc gtggtgtcac gctcgtcgtt tggtatggct 4020

tcattcagct ccggttccca acgatcaagg cgagttacat gatcccccat gttgtgcaaa 4080

aaagcggtta gctccttcgg tcctccgatc gttgtcagaa gtaagttggc cgcagtgtta 4140

tcactcatgg ttatggcagc actgcataat tctcttactg tcatgccatc cgtaagatgc 4200

ttttctgtga ctggtgagta ctcaaccaag tcattctgag aatagtgtat gcggcgaccg 4260

agttgctctt gcccggcgtc aatacgggat aataccgcgc cacatagcag aactttaaaa 4320

gtgctcatca ttggaaaacg ttcttcgggg cgaaaactct caaggatctt accgctgttg 4380

agatccagtt cgatgtaacc cactcgtgca cccaactgat cttcagcatc ttttactttc 4440

accagcgttt ctgggtgagc aaaaacagga aggcaaaatg ccgcaaaaaa gggaataagg 4500

gcgacacgga aatgttgaat actcatactc ttcctttttc aatattattg aagcatttat 4560

cagggttatt gtctcatgag cggatacata tttgaatgta tttagaaaaa taaacagcga 4620

tcgcgcggcc gcgggtaata actgatataa ttaaattgaa gctctaattt gtgagtttag 4680

tatacatgca tttacttata atacagtttt ttagttttgc tggccgcatc ttctcaaata 4740

tgcttcccag cctgcttttc tgtaacgttc accctctacc ttagcatccc ttccctttgc 4800

aaatagtcct cttccaacaa taataatgtc agatcctgta gagaccacat catccacggt 4860

tctatactgt tgacccaatg cgtctccctt gtcatctaaa cccacaccgg gtgtcataat 4920

caaccaatcg taaccttcat ctcttccacc catgtctctt tgagcaataa agccgataac 4980

aaaatctttg tcgctcttcg caatgtcaac agtaccctta gtatattctc cagtagctag 5040

ggagcccttg catgacaatt ctgctaacat caaaaggcct ctaggttcct ttgttacttc 5100

ttccgccgcc tgcttcaaac cgctaacaat acctgggccc accacaccgt gtgcattcgt 5160

aatgtctgcc cattctgcta ttctgtatac acccgcagag tactgcaatt tgactgtatt 5220

accaatgtca gcaaattttc tgtcttcgaa gagtaaaaaa ttgtacttgg cggataatgc 5280

ctttagcggc ttaactgtgc cctccatgga aaaatcagtc aagatatcca catgtgtttt 5340

tagtaaacaa attttgggac ctaatgcttc aactaactcc agtaattcct tggtggtacg 5400

aacatccaat gaagcacaca agtttgtttg cttttcgtgc atgatattaa atagcttggc 5460

agcaacagga ctaggatgag tagcagcacg ttccttatat gtagctttcg acatgattta 5520

tcttcgtttc ctgcaggttt ttgttctgtg cagttgggtt aagaatactg ggcaatttca 5580

tgtttcttca acaccacata tgcgtatata taccaatcta agtctgtgct ccttccttcg 5640

ttcttccttc tgctcggaga ttaccgaatc aaagctagct tatcgatgat aagctgtcaa 5700

agatgagaat taattccacg gactatagac tatactagat actccgtcta ctgtacgata 5760

cacttccgct caggtccttg tcctttaacg aggccttacc actcttttgt tactctattg 5820

atccagctca gcaaaggcag tgtgatctaa gattctatct tcgcgatgta gtaaaactag 5880

ctagaccgag aaagagacta gaaatgcaaa aggcacttct acaatggctg ccatcattat 5940

tatccgatgt gacgctgcag cttctcaatg atattcgaat acgctttgag gagatacagc 6000

ctaatatccg acaaactgtt ttacagattt acgatcgtac ttgttaccca tcattgaatt 6060

ttgaacatcc gaacctggga gttttccctg aaacagatag tatatttgaa cctgtataat 6120

aatatatagt ctagcgcttt acggaagaca atgtatgtat ttcggttcct ggagaaacta 6180

ttgcatctat tgcataggta atcttgcacg tcgcatcccc ggttcatttt ctgcgtttcc 6240

atcttgcact tcaatagcat atctttgtta acgaagcatc tgtgcttcat tttgtagaac 6300

aaaaatgcaa cgcgagagcg ctaatttttc aaacaaagaa tctgagctgc atttttacag 6360

aacagaaatg caacgcgaaa gcgctatttt accaacgaag aatctgtgct tcatttttgt 6420

aaaacaaaaa tgcaacgcga cgagagcgct aatttttcaa acaaagaatc tgagctgcat 6480

ttttacagaa cagaaatgca acgcgagagc gctattttac caacaaagaa tctatacttc 6540

ttttttgttc tacaaaaatg catcccgaga gcgctatttt tctaacaaag catcttagat 6600

tacttttttt ctcctttgtg cgctctataa tgcagtctct tgataacttt ttgcactgta 6660

ggtccgttaa ggttagaaga aggctacttt ggtgtctatt ttctcttcca taaaaaaagc 6720

ctgactccac ttcccgcgtt tactgattac tagcgaagct gcgggtgcat tttttcaaga 6780

taaaggcatc cccgattata ttctataccg atgtggattg cgcatacttt gtgaacagaa 6840

agtgatagcg ttgatgattc ttcattggtc agaaaattat gaacggtttc ttctattttg 6900

tctctatata ctacgtatag gaaatgttta cattttcgta ttgttttcga ttcactctat 6960

gaatagttct tactacaatt tttttgtcta aagagtaata ctagagataa acataaaaaa 7020

tgtagaggtc gagtttagat gcaagttcaa ggagcgaaag gtggatgggt aggttatata 7080

gggatatagc acagagatat atagcaaaga gatacttttg agcaat 7126

<210> 91

<211> 7505

<212> DNA

<213> 人工序列

<220>

<223> 合成核酸

<400> 91

gtttgtggaa gcggtattcg caatttaatt aaagctggtg acaattaatc atcggctcgt 60

ataatgtgtg gaattgaatc gatataagga ggttaatcat gtgtctgttg ccgtaaccga 120

cgcacgatcc gcctacgccc acggcgtgca gcggctggtc gcgagttacc gcgccatccc 180

cgccggcgcc accgtccgcc tggccaaacc cacgtccaac ctgttccgcg ccagggcgaa 240

gagcaccgcg gcgggcctcg acacctccgg cctgacacat gtgatcgccg tggaccccga 300

gacgcgcacc gccgaggtcg cggggatgtg cacctacgag gacctggtgg cggcgacgct 360

gccccacggg ctttcaccgc tggtggtccc gcaactcaag acgatcaccc tcggcggcgc 420

cgtcaccggg ctcggcatcg agtcggcgtc gttccgcaac ggccttccgc acgaatcggt 480

cctggagatg gacatcctca ccgggaccgg cgacatcgtg cgcgccgcgc ccgacgagaa 540

tcccgacctt ttccgcacct tcccgaattc ttatggaacg ctgggttact cggttcggct 600

gaagatcgag ctggagccgg tgaagccgtt cgtggcgtta cgccatctcc gcttccactc 660

actgtcgaca ctcatcgcga cgatggaccg catcgtcgac accgggagtc tcgacggtga 720

gcaggtcgac tatctcgacg gagtggtgtt cagcgccgag gagagctacc tgtgcgtcgg 780

aacacgttcc gcgacaccgg gtcctgtcag cgactacacc ggcgagcaca tcttctaccg 840

gtcgatccag cacgattgcc cgaccgaagg cggacagaag cacgaccggc tgacggcgca 900

cgactacttc tggcgctggg acaccgactg gttctggtgc tcaagggcat tcggcgcgca 960

gaacccgaag gtccgtcggt ggtggccccg acggctccgg cgcagcagct tctactggaa 1020

gctcgtcggc tacgaccagc gtttcggcat cgccgaccgg atcgagaaac accacggccg 1080

gccaccgcgc gaacgcgtcg tccaggacgt cgaggtcccc atcgagcgca ccgtcgaatt 1140

cctgcagtgg ttcctcgaca cgatcccgat agagccgctc tggttgtgcc cgttgcgact 1200

tcgcgatgac aacagctggt cgctgtaccc gctccggccc catcgcacgt atgtcaacgt 1260

gggattctgg tcgtcggtgc ccgtcgggcc ggaggagggt cacaccaaca agctgatcga 1320

acgcaggatc agcgagctgg agggacacaa gtcgctgtac tccgacgcct tctattcggc 1380

cgacgagttc gacgcgctgt acggcggcga gatctaccgg accgtgaaga agacctacga 1440

cccagattct cgtttcctcg acctctatgc gaaggcggtg cgacggcaat gacgactttt 1500

cgggaacata ccgacagttc ggcgtccgac ccggatcgga aactcacttt ggcagaggtg 1560

ttggagatct tcgccgcggg tcgccgtccg ctgaagttca ccgcctatga cggaagtagt 1620

tgcgggcctg aggatgcgac actgggcctc gacctgctga ccccgcgggg cacgacctac 1680

ctggccacgg cgccgggtga tctcggcctg gcgcgggcct acatcgccgg cgatctgcgc 1740

ctcagtggtg tgcatcccgg cgatccccat gacctgctca cggcgctgac ggaacgcctg 1800

gagtacaggc gtccgccggt gcgagtgctg gccaatgttc tgcgctccat cgggatcgag 1860

cacctcaagc ccgtcgcgcc gccaccccag gagcacctgc cgcggtggcg gcggatcgca 1920

gaggggttgc ggcacagcaa gacccgtgac gctgaggcca tccagcacca ctacgacgtc 1980

tcgaacacgt tctactcatg ggtcctgggt ccgtcgatga cctacacctg cgcctgctat 2040

ccacacccgg atgccacgct ggaggaggcg caggagaaca agtaccggct ggtgttcgag 2100

aagcttcgac tcaagcccgg tgaccggctg ctcgacgtcg gttgcggctg gggcggaatg 2160

gtccgctacg ccgcccggca cggggtcaag gtcctggggg tgacgctgtc gaaggagcag 2220

gcgcagtggg cggccgacgc agtcgagcgg gacggcctgg gtgagttggc cgaggtccgc 2280

cacggcgact accgcgacgt gcgcgagtcg cacttcgacg cagtgtcctc gctcgggctc 2340

accgagcaca tcggcgtcgc gaactacccg tcgtacttcc gcttcctgaa gtcgaaactg 2400

cggccgggtg gcctgctgct caaccactgc atcacccgaa acaacaaccg gagtcacgcc 2460

accgcaggcg gattcatcga tcgctatgtc tttcccgacg gggagctgac ggggtcgggg 2520

cgaatcatca ccgaaatgca ggacgtcgga ctcgaggtcg tgcacgagga gaatctgcgt 2580

caccactacg cgctgacgct gcgcgactgg agccgcaacc tggtcgcgca ctgggacgac 2640

gcggtgaccg aggtcggtct gccgactgcc aaggtgtggg gcctctacat cgccgcgtcg 2700

cgagtcggct tcgagcagaa cgccattcag ctgcaccagg tgctgtcggt caagctcgac 2760

gagcgtggct cggacggcgg actgccgtta cgaccctggt ggaacgccta gccactatgc 2820

tctgcccatg atccggttcc tgctgcgcat cgcggtcttt ctgggctcat cagcgatcgg 2880

gctcctcgtc gccggatggc tggtgcccgg ggtgtcgctg tcggtgtggg gcttcgtcac 2940

ggcagtggtg atcttcaccg tggcgcaggc gatcctgtcc ccgttcttcc tcaagatggc 3000

cagccgctac gcctcggcgt tcctcggcgg gatcggtctg gtgtcgacgt ttgccgcgct 3060

gctgctcgtc tcgctgctgt ccaacggtct gagcatccgc ggcatcggat cctggatcgc 3120

cgcaaccgtg gtggtctggt tggtgaccgc cctggcgacg ctggtgctgc cgatgttggt 3180

gctgcgcgag aagaaaaccg cgtcgcgcgt ctgacctcaa aatatatttt ccctctatct 3240

tctcgttgcg cttaatttga ctaattctca ttagcgaggc gcgcctttcc ataggctccg 3300

cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg 3360

actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac 3420

cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca 3480

tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt 3540

gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc 3600

caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag 3660

agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac 3720

tagaagaaca gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt 3780

tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa 3840

gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg 3900

gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa 3960

aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat 4020

atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc 4080

gatctgtcta tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat 4140

acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc 4200

ggctccagat ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc 4260

tgcaacttta tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag 4320

ttcgccagtt aatagtttgc gcaacgttgt tgccattgct acaggcatcg tggtgtcacg 4380

ctcgtcgttt ggtatggctt cattcagctc cggttcccaa cgatcaaggc gagttacatg 4440

atcccccatg ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg ttgtcagaag 4500

taagttggcc gcagtgttat cactcatggt tatggcagca ctgcataatt ctcttactgt 4560

catgccatcc gtaagatgct tttctgtgac tggtgagtac tcaaccaagt cattctgaga 4620

atagtgtatg cggcgaccga gttgctcttg cccggcgtca atacgggata ataccgcgcc 4680

acatagcaga actttaaaag tgctcatcat tggaaaacgt tcttcggggc gaaaactctc 4740

aaggatctta ccgctgttga gatccagttc gatgtaaccc actcgtgcac ccaactgatc 4800

ttcagcatct tttactttca ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc 4860

cgcaaaaaag ggaataaggg cgacacggaa atgttgaata ctcatactct tcctttttca 4920

atattattga agcatttatc agggttattg tctcatgagc ggatacatat ttgaatgtat 4980

ttagaaaaat aaacagcgat cgcgcggccg cgggtaataa ctgatataat taaattgaag 5040

ctctaatttg tgagtttagt atacatgcat ttacttataa tacagttttt tagttttgct 5100

ggccgcatct tctcaaatat gcttcccagc ctgcttttct gtaacgttca ccctctacct 5160

tagcatccct tccctttgca aatagtcctc ttccaacaat aataatgtca gatcctgtag 5220

agaccacatc atccacggtt ctatactgtt gacccaatgc gtctcccttg tcatctaaac 5280

ccacaccggg tgtcataatc aaccaatcgt aaccttcatc tcttccaccc atgtctcttt 5340

gagcaataaa gccgataaca aaatctttgt cgctcttcgc aatgtcaaca gtacccttag 5400

tatattctcc agtagctagg gagcccttgc atgacaattc tgctaacatc aaaaggcctc 5460

taggttcctt tgttacttct tccgccgcct gcttcaaacc gctaacaata cctgggccca 5520

ccacaccgtg tgcattcgta atgtctgccc attctgctat tctgtataca cccgcagagt 5580

actgcaattt gactgtatta ccaatgtcag caaattttct gtcttcgaag agtaaaaaat 5640

tgtacttggc ggataatgcc tttagcggct taactgtgcc ctccatggaa aaatcagtca 5700

agatatccac atgtgttttt agtaaacaaa ttttgggacc taatgcttca actaactcca 5760

gtaattcctt ggtggtacga acatccaatg aagcacacaa gtttgtttgc ttttcgtgca 5820

tgatattaaa tagcttggca gcaacaggac taggatgagt agcagcacgt tccttatatg 5880

tagctttcga catgatttat cttcgtttcc tgcaggtttt tgttctgtgc agttgggtta 5940

agaatactgg gcaatttcat gtttcttcaa caccacatat gcgtatatat accaatctaa 6000

gtctgtgctc cttccttcgt tcttccttct gctcggagat taccgaatca aagctagctt 6060

atcgatgata agctgtcaaa gatgagaatt aattccacgg actatagact atactagata 6120

ctccgtctac tgtacgatac acttccgctc aggtccttgt cctttaacga ggccttacca 6180

ctcttttgtt actctattga tccagctcag caaaggcagt gtgatctaag attctatctt 6240

cgcgatgtag taaaactagc tagaccgaga aagagactag aaatgcaaaa ggcacttcta 6300

caatggctgc catcattatt atccgatgtg acgctgcagc ttctcaatga tattcgaata 6360

cgctttgagg agatacagcc taatatccga caaactgttt tacagattta cgatcgtact 6420

tgttacccat cattgaattt tgaacatccg aacctgggag ttttccctga aacagatagt 6480

atatttgaac ctgtataata atatatagtc tagcgcttta cggaagacaa tgtatgtatt 6540

tcggttcctg gagaaactat tgcatctatt gcataggtaa tcttgcacgt cgcatccccg 6600

gttcattttc tgcgtttcca tcttgcactt caatagcata tctttgttaa cgaagcatct 6660

gtgcttcatt ttgtagaaca aaaatgcaac gcgagagcgc taatttttca aacaaagaat 6720

ctgagctgca tttttacaga acagaaatgc aacgcgaaag cgctatttta ccaacgaaga 6780

atctgtgctt catttttgta aaacaaaaat gcaacgcgac gagagcgcta atttttcaaa 6840

caaagaatct gagctgcatt tttacagaac agaaatgcaa cgcgagagcg ctattttacc 6900

aacaaagaat ctatacttct tttttgttct acaaaaatgc atcccgagag cgctattttt 6960

ctaacaaagc atcttagatt actttttttc tcctttgtgc gctctataat gcagtctctt 7020

gataactttt tgcactgtag gtccgttaag gttagaagaa ggctactttg gtgtctattt 7080

tctcttccat aaaaaaagcc tgactccact tcccgcgttt actgattact agcgaagctg 7140

cgggtgcatt ttttcaagat aaaggcatcc ccgattatat tctataccga tgtggattgc 7200

gcatactttg tgaacagaaa gtgatagcgt tgatgattct tcattggtca gaaaattatg 7260

aacggtttct tctattttgt ctctatatac tacgtatagg aaatgtttac attttcgtat 7320

tgttttcgat tcactctatg aatagttctt actacaattt ttttgtctaa agagtaatac 7380

tagagataaa cataaaaaat gtagaggtcg agtttagatg caagttcaag gagcgaaagg 7440

tggatgggta ggttatatag ggatatagca cagagatata tagcaaagag atacttttga 7500

gcaat 7505

<210> 92

<211> 7123

<212> DNA

<213> 人工序列

<220>

<223> 合成核酸

<400> 92

gtttgtggaa gcggtattcg caatttaatt aaagctggtg acaattaatc atcggctcgt 60

ataatgtgtg gaattgaatc gatataagga ggttaatcat atgcacgggc tgttgtcgaa 120

gactagggta tatgtggtgc ctgtccttgg atctgcactc tcggcccaca agtcgggcgt 180

tgaccggctg ctggcaagct atcgatccat tcccgcaacg tccgcggtcc ggctggccaa 240

accgacgtca aacctgttcc gcgcccgcac caaacgtgac gcgcccggct tggacacctc 300

ggggctgacc ggcgtcctga gcgtggatcc cgaaacccgc accgcggacg tcgccggcat 360

gtgcacctac gcggacctgg tggccgcaac gctgccctac ggcctgtcgc cgctggtcgt 420

cccgcagctg aagaccatca ccctcggcgg ggcggtcagc ggcctgggga tcgagtcggc 480

gtcgtttcgc aacgggctgc cgcacgaatc ggtgctggag atggatatcc tcaccggcgc 540

tggcgatttg ctcaccgcat cacgtaccca gcacccggac ctgttccgcg ccttcccgaa 600

ttcctatggg acactggggt attcgacccg gcttcggatc gagctggaac ccgtcgcacc 660

gttcgtcgcg ctgcgccaca tccgcttccg ctcgctgccc gcgctgatcg ccgcggccga 720

acgcatcgtc gacaccggcg ggcagggcgg aaccccggtc gactacctcg acggggtggt 780

cttcagcgcc gacgaaagct acctgtgcgt gggccggcgg accaccaccc ccggcccggt 840

cagcgactac accggcaagg acatctacta ccagtccatc cggcacgacg ccccgggcct 900

ggaggcgacc aaggatgacc ggctgaccat gcacgactac ttctggcgct gggacaccga 960

ttggttctgg tgctcgcgcg cgttcggcgt gcaggacccg cgggtgcgac gcttctggcc 1020

gcgccgttat cggcgcagca gcttctactg gaagctgatt tccctggacc ggcgcttcgg 1080

gatctccgac cgcatcgagg cgcgcaacgg gcggccccca cgcgaacggg tggtgcaaga 1140

catcgagatt ccaatcgaac ggacctgcga cttcctggag tggttcctgg acaacgtgcc 1200

aatcacgccg atctggttgt gcccgttgcg ccttcgcgac cgcgacggct ggccgttgta 1260

cccgatgcgg ccggatcaca cgtacgtcaa cgtcggcttc tggtcgtcgg tgccgggggg 1320

cgcgaccgag ggcgccgcca accggatgat cgaagaaaag gtgagcgaac tcgacgggca 1380

caagtccctg tactccgatt ccttctactc ccgcgaggac ttcgacgagc tgtacggcgg 1440

cgagacctac aacaccgtca agaaaaccta cgaccccgat tctcgtttac tcgacctcta 1500

cgcaaaggcg gtgcaacggc gatgacgact accaaggaac cccaccgcac gtcgcacggg 1560

aaactgagca tggccgagat cctggaggtc ttcgccgcca ccggccgaca tccgctgaag 1620

ttcaccgcct acgacggcag catcgccggc aacgaggacg ccgaactggg cctggacctt 1680

cgcagccccc gcggcgccac ctatctggcg accgcccccg gcgaactcgg cctcgcccgc 1740

gcctacgtgt cgggcgacct gcaggcctac ggcgtccatc ccggcgaccc gtaccaactg 1800

ctcaagacgc tcaccgatcg ggtggaattc aagcggcccc cggtgcgggt gctggccaac 1860

gtcgtgcggt cgctggggtt cgagcggttg ctgccggtcg cgccgccccc gcaggaggcg 1920

ctgccccggt ggcggcgcat cgccgacggg ctgatgcaca cgaggacccg cgacgccgag 1980

gccatccacc accactacga cgtgtccaac accttctacg aattggtgtt ggggccgtcg 2040

atgacctaca cctgcgcggt gtatcccgat gccgacgcga cactcgaaca ggcgcaggag 2100

aacaagtacc ggctgatctt cgagaagctg cggctgaagg cgggcgaccg gctgctcgac 2160

gtcggctgcg gctggggcgg catggtgcgc tacgcggccc ggcgcggcgt ccgggccacc 2220

ggcgccaccc tgtcggccga acaggcgaag tgggcgcaga aggcgatcgc cgaggaaggc 2280

cttgcggacc tggccgaggt gcgccacacc gactatcggg acgtgggcga ggcggcgttc 2340

gacgccgtgt cctcgatcgg gctgaccgag cacatcggcg tcaagaatta ccccgcctac 2400

ttcggcttct tgaagtcgaa gctgcgcacc ggcggcctgc tgctcaatca ctgcatcacc 2460

cgccacgaca acacgtcgac gtcgttcgcg ggcggattca ccgatcgcta tgtcttcccg 2520

gacggggagc tgaccggctc gggccgcatc acctgcgacg tccaggactg cggcttcgag 2580

gtgctgcacg cggagaactt ccgccaccac tacgcgatga cgctgcgcga ctggtgccgc 2640

aatctggtcg agaactggga cgccgcggtc agcgaggtcg gcctaccgac cgcgaaggtc 2700

tggggcctgt acatggcggc gtcacgggtt gcgttcgagc agaacaacct tcagctgcat 2760

cacgtgctgg cggccaagac cgacgcgcgg ggcgacgacg acctgccgct gcggccgtgg 2820

tggacggcct gacctcaaaa tatattttcc ctctatcttc tcgttgcgct taatttgact 2880

aattctcatt agcgaggcgc gcctttccat aggctccgcc cccctgacga gcatcacaaa 2940

aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt 3000

ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg 3060

tccgcctttc tcccttcggg aagcgtggcg ctttctcata gctcacgctg taggtatctc 3120

agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc 3180

gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta 3240

tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct 3300

acagagttct tgaagtggtg gcctaactac ggctacacta gaagaacagt atttggtatc 3360

tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa 3420

caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa 3480

aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa 3540

aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac ctagatcctt 3600

ttaaattaaa aatgaagttt taaatcaatc taaagtatat atgagtaaac ttggtctgac 3660

agttaccaat gcttaatcag tgaggcacct atctcagcga tctgtctatt tcgttcatcc 3720

atagttgcct gactccccgt cgtgtagata actacgatac gggagggctt accatctggc 3780

cccagtgctg caatgatacc gcgagaccca cgctcaccgg ctccagattt atcagcaata 3840

aaccagccag ccggaagggc cgagcgcaga agtggtcctg caactttatc cgcctccatc 3900

cagtctatta attgttgccg ggaagctaga gtaagtagtt cgccagttaa tagtttgcgc 3960

aacgttgttg ccattgctac aggcatcgtg gtgtcacgct cgtcgtttgg tatggcttca 4020

ttcagctccg gttcccaacg atcaaggcga gttacatgat cccccatgtt gtgcaaaaaa 4080

gcggttagct ccttcggtcc tccgatcgtt gtcagaagta agttggccgc agtgttatca 4140

ctcatggtta tggcagcact gcataattct cttactgtca tgccatccgt aagatgcttt 4200

tctgtgactg gtgagtactc aaccaagtca ttctgagaat agtgtatgcg gcgaccgagt 4260

tgctcttgcc cggcgtcaat acgggataat accgcgccac atagcagaac tttaaaagtg 4320

ctcatcattg gaaaacgttc ttcggggcga aaactctcaa ggatcttacc gctgttgaga 4380

tccagttcga tgtaacccac tcgtgcaccc aactgatctt cagcatcttt tactttcacc 4440

agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg aataagggcg 4500

acacggaaat gttgaatact catactcttc ctttttcaat attattgaag catttatcag 4560

ggttattgtc tcatgagcgg atacatattt gaatgtattt agaaaaataa acagcgatcg 4620

cgcggccgcg ggtaataact gatataatta aattgaagct ctaatttgtg agtttagtat 4680

acatgcattt acttataata cagtttttta gttttgctgg ccgcatcttc tcaaatatgc 4740

ttcccagcct gcttttctgt aacgttcacc ctctacctta gcatcccttc cctttgcaaa 4800

tagtcctctt ccaacaataa taatgtcaga tcctgtagag accacatcat ccacggttct 4860

atactgttga cccaatgcgt ctcccttgtc atctaaaccc acaccgggtg tcataatcaa 4920

ccaatcgtaa ccttcatctc ttccacccat gtctctttga gcaataaagc cgataacaaa 4980

atctttgtcg ctcttcgcaa tgtcaacagt acccttagta tattctccag tagctaggga 5040

gcccttgcat gacaattctg ctaacatcaa aaggcctcta ggttcctttg ttacttcttc 5100

cgccgcctgc ttcaaaccgc taacaatacc tgggcccacc acaccgtgtg cattcgtaat 5160

gtctgcccat tctgctattc tgtatacacc cgcagagtac tgcaatttga ctgtattacc 5220

aatgtcagca aattttctgt cttcgaagag taaaaaattg tacttggcgg ataatgcctt 5280

tagcggctta actgtgccct ccatggaaaa atcagtcaag atatccacat gtgtttttag 5340

taaacaaatt ttgggaccta atgcttcaac taactccagt aattccttgg tggtacgaac 5400

atccaatgaa gcacacaagt ttgtttgctt ttcgtgcatg atattaaata gcttggcagc 5460

aacaggacta ggatgagtag cagcacgttc cttatatgta gctttcgaca tgatttatct 5520

tcgtttcctg caggtttttg ttctgtgcag ttgggttaag aatactgggc aatttcatgt 5580

ttcttcaaca ccacatatgc gtatatatac caatctaagt ctgtgctcct tccttcgttc 5640

ttccttctgc tcggagatta ccgaatcaaa gctagcttat cgatgataag ctgtcaaaga 5700

tgagaattaa ttccacggac tatagactat actagatact ccgtctactg tacgatacac 5760

ttccgctcag gtccttgtcc tttaacgagg ccttaccact cttttgttac tctattgatc 5820

cagctcagca aaggcagtgt gatctaagat tctatcttcg cgatgtagta aaactagcta 5880

gaccgagaaa gagactagaa atgcaaaagg cacttctaca atggctgcca tcattattat 5940

ccgatgtgac gctgcagctt ctcaatgata ttcgaatacg ctttgaggag atacagccta 6000

atatccgaca aactgtttta cagatttacg atcgtacttg ttacccatca ttgaattttg 6060

aacatccgaa cctgggagtt ttccctgaaa cagatagtat atttgaacct gtataataat 6120

atatagtcta gcgctttacg gaagacaatg tatgtatttc ggttcctgga gaaactattg 6180

catctattgc ataggtaatc ttgcacgtcg catccccggt tcattttctg cgtttccatc 6240

ttgcacttca atagcatatc tttgttaacg aagcatctgt gcttcatttt gtagaacaaa 6300

aatgcaacgc gagagcgcta atttttcaaa caaagaatct gagctgcatt tttacagaac 6360

agaaatgcaa cgcgaaagcg ctattttacc aacgaagaat ctgtgcttca tttttgtaaa 6420

acaaaaatgc aacgcgacga gagcgctaat ttttcaaaca aagaatctga gctgcatttt 6480

tacagaacag aaatgcaacg cgagagcgct attttaccaa caaagaatct atacttcttt 6540

tttgttctac aaaaatgcat cccgagagcg ctatttttct aacaaagcat cttagattac 6600

tttttttctc ctttgtgcgc tctataatgc agtctcttga taactttttg cactgtaggt 6660

ccgttaaggt tagaagaagg ctactttggt gtctattttc tcttccataa aaaaagcctg 6720

actccacttc ccgcgtttac tgattactag cgaagctgcg ggtgcatttt ttcaagataa 6780

aggcatcccc gattatattc tataccgatg tggattgcgc atactttgtg aacagaaagt 6840

gatagcgttg atgattcttc attggtcaga aaattatgaa cggtttcttc tattttgtct 6900

ctatatacta cgtataggaa atgtttacat tttcgtattg ttttcgattc actctatgaa 6960

tagttcttac tacaattttt ttgtctaaag agtaatacta gagataaaca taaaaaatgt 7020

agaggtcgag tttagatgca agttcaagga gcgaaaggtg gatgggtagg ttatataggg 7080

atatagcaca gagatatata gcaaagagat acttttgagc aat 7123

<210> 93

<211> 9807

<212> DNA

<213> 人工序列

<220>

<223> 合成核酸

<400> 93

ggttatatag ggatatagca cagagatata tagcaaagag atacttttga gcaatgtttg 60

tggaagcggt attcgcaatt taattaacgc ttaccttggc cgttagacat catggtaaat 120

ctgcgcagac agccctgtgc agctgaaacg cggttacgta tagcttgcca tatgtctagc 180

catacgtaac cgcaggtaaa aggcatattt ttcgcgtgtc atggctagta aataacaccg 240

gtgtcattta gagtcaggga aagacaatga aaaacgaaga aagccaccgg gcggcaaccc 300

gatgactttc gcttatcacc cagcacacac ctgggagaaa tcacggtcat gagtttacag 360

actcatgcgc agaatgcgca cactaaaaca cctacccgcg tcgagcgcga ccgtggtgga 420

ctggacaaca ccccagcatc tgccagtgac cgcgaccttt tacgcgatca tctaggccgc 480

gatgtactcc acggttcagt cacacgagac tttaaaaagg cctatcgacg caacgctgac 540

ggcacgaact cgccgcgtat gtatcgcttc gagactgatg ctttaggacg gtgcgagtac 600

gccatgctca ccaccaagca gtacgccgcc gtcctggtcg tagacgttga ccaagtaggt 660

accgcaggcg gtgaccccgc agacttaaac ccgtacgtcc gcgacgtggt gcgctcactg 720

attactcata gcgtcgggcc agcctgggtg ggtattaacc caactaacgg caaagcccag 780

ttcatatggc ttattgaccc tgtctacgct gaccgtaacg gtaaatctgc gcagatgaag 840

cttcttgcag caaccacgcg tgtgctgggt gagcttttag accatgaccc gcacttttcc 900

caccgcttta gccgcaaccc gttctacaca ggcaaagccc ctaccgctta tcgttggtat 960

aggcagcaca accgggtgat gcgccttgga gacttgataa agcaggtaag ggatatggca 1020

ggacacgacc agttcaaccc caccccacgc cagcaattca gctctggccg cgaacttatc 1080

aacgcggtca agacccgccg tgaagaagcc caagcattca aagcactcgc ccaggacgta 1140

gacgcggaaa tcgccggtgg tctcgaccag tatgacccgg aacttatcga cggtgtgcgt 1200

gtgctctgga ttgtccaagg aaccgcagca cgcgacgaaa cagcctttag acatgcgctt 1260

aagactggcc accgcttgcg ccagcaaggc caacgcctga cagacgcagc aatcatcgac 1320

gcctatgagc acgcctacaa cgtcgcacac acccacggcg gtgcaggccg cgacaacgag 1380

atgccaccca tgcgcgaccg ccaaaccatg gcaaggcgcg tgcgcgggta tgtcgcccaa 1440

tccaagagcg agacctacag cggctctaac gcaccaggta aagccaccag cagcgagcgg 1500

aaagccttgg ccacgatggg acgcagaggc ggacaaaaag ccgcacaacg ctggaaaaca 1560

gaccccgagg gcaaatatgc gcaagcacaa aggtcgaagc ttgaaaagac gcaccgtaag 1620

aaaaaggctc aaggacgatc tacgaagtcc cgtattagcc aaatggtgaa cgatcagtat 1680

ttccagacag ggacagttcc cacgtgggct gaaatagggg cagaggtagg agtctctcgc 1740

gccacggttg ctaggcatgt cgcggagcta aagaagagcg gtgactatcc ggacgtttaa 1800

ggggtctcat accgtaagca atatacggtt cccctgccgt taggcagtta gataaaacct 1860

cacttgaaga aaaccttgag gggcagggca gcttatatgc ttcaaagcat gacttcctct 1920

gttctcctag acctcgcaac cctccgccat aacctcaccc tgctctgcga ggctggccgg 1980

ctaccgccgg cgtaacagat gagggcaagc ggatggctga tgaaaccaag ccgcggccgg 2040

gaagccgatc tcggcttgaa cgaattgtta ggtggcggta cttgggtcga tatcaaagtg 2100

catcacttct tcccgtatgc ccaactttgt atagagagcc actgcgggat cgtcaccgta 2160

atctgcttgc acgtagatca cataagcacc aagcgcgttg gcctcatgct tgaggagatt 2220

gatgagcgcg gtggcaatgc cctgcctccg gtgctcgccg gagactgcga gatcatagat 2280

atagatctca ctacgcggct gctcaaactt gggcagaacg taagccgcga gagcgccaac 2340

aaccgcttct tggtcgaagg cagcaagcgc gatgaatgtc ttactacgga gcaagttccc 2400

gaggtaatcg gagtccggct gatgttggga gtaggtggct acgtctccga actcacgacc 2460

gaaaagatca agagcagccc gcatggattt gacttggtca gggccgagcc tacatgtgcg 2520

aatgatgccc atacttgagc cacctaactt tgttttaggg cgactgccct gctgcgtaac 2580

atcgttgctg ctccataaca tcaaacatcg acccacggcg taacgcgctt gctgcttgga 2640

tgcccgaggc atagactgta caaaaaaaca gtcataacaa gccatgaaaa ccgccactgc 2700

gccgttacca ccgctgcgtt cggtcaaggt tctggaccag ttgcgtgagc gcatacgcta 2760

cttgcattac agtttacgaa ccgagtttaa acagctggtg acaattaatc atcggctcgt 2820

ataatgtgtg gaattgaatc gatataagga ggttaatcat gtgtctgtgg ttactactga 2880

cgcacaggct gcccatgccg ccggcgtctc gcgtcttctg gccagctacc gggcgatccc 2940

gcccagcgcg acagtgcgcc ttgcgaaacc gacgtccaac ctgttccgcg cccgcgcccg 3000

caccaatgtg aagggtctcg acgtctcggg cctgaccggt gtgatcggtg tcgacccgga 3060

cgcgcgcacc gccgatgtgg cgggcatgtg cacctacgag gacctggtgg cggccacgct 3120

tccgtacggc cttgccccac tggtggtgcc gcagctcaag accatcacgc tcggtggcgc 3180

ggtcaccggt ctgggcatcg agtccacgtc gttccgcaac ggtctgccgc acgaaagtgt 3240

cctggagatg gacatcttga ccggttcggg cgagatcgtc acggcctcac cggatcagca 3300

ctcggatctg ttccatgcgt tccccaattc atatggaacc cttggttatt ccacccggct 3360

gcgcatcgaa ctggagcccg tgcacccgtt tgtggcgttg cgccacctgc gctttcactc 3420

gatcaccgat ctggtcgcgg cgatggaccg gatcatcgag accggcgggc tggacggtga 3480

acccgtcgac tacctcgacg gcgtggtgtt cagcgcgact gagagttacc tgtgtgttgg 3540

cttcaagacg aaaacgccgg ggccggtcag cgattacaca ggtcagcaga tcttctaccg 3600

gtcgatccag catgacggcg acaccggcgc cgagaaacac gaccggctga ccatccacga 3660

ctacctgtgg cgctgggaca ccgactggtt ctggtgctca cgggcattcg gcgctcagca 3720

tccggtgatc cgcaggttct ggccgcggcg gctgcgccgc agcagcttct actggaagct 3780

ggtggcctac gaccagcggt acgacatcgc cgaccgtatc gagaagcgca acgggcgccc 3840

gccgcgcgag cgggtggtcc aggacgtcga ggtgcccatc gagcggtgcg cggacttcgt 3900

cgagtggttc ctgcagaatg tgccgatcga gccgatctgg ctgtgccccc tacggttgcg 3960

tgacagcgcc gacggcggtg cctcgtggcc cctgtatccg ctgaaggcgc accacaccta 4020

cgtcaacatc ggtttctggt catcagtgcc ggtgggcccc gaggagggcc acaccaaccg 4080

cctcatcgag aaaaaagtcg cggagctgga cgggcacaaa tctttgtact cggacgctta 4140

ttacacacgt gacgaattcg acgagctgta cggcggtgag gtctacaaca ccgtcaagaa 4200

gacgtacgac ccggattcac gtctgctaga cctgtattcg aaggcggtgc aaagacaatg 4260

accacattca aagaacgcga gacgtccaca gcggaccgca agctcaccct ggccgagatc 4320

ctcgagatct tcgccgcggg taaggagccg ctgaagttca ctgcgtacga cggcagctcg 4380

gccggtcccg aggacgccac gatgggtctg gacctcaaga ccccgcgtgg gaccacctat 4440

ctggccacgg cacccggcga tctgggcctg gcccgtgcgt atgtctccgg tgacctggag 4500

ccgcacggcg tgcatcccgg cgatccctac ccgctgctgc gcgccctggc cgaacgcatg 4560

gagttcaagc gcccgcctgc gcgtgtgctg gcgaacatcg tgcgctccat cggcatcgag 4620

cacctcaagc cgatcgcacc gccgccgcag gaggcgctgc cccggtggcg ccgcatcatg 4680

gagggcctgc ggcacagcaa gacccgcgac gccgaggcca tccaccacca ctacgacgtg 4740

tcgaacacgt tctacgagtg ggtgctgggc ccgtcgatga cctacacgtg cgcgtgctac 4800

cccaccgagg acgcgaccct cgaagaggcc caggacaaca agtaccgcct ggtgttcgag 4860

aagctgcgcc tgaagcccgg tgaccggttg ctcgacgtgg gctgcggctg gggcggcatg 4920

gtccgctacg cggcccgcca cggcgtcaag gcgctcggtg tcacgctcag ccgcgaacag 4980

gcgacgtggg cgcagaaggc catcgcccag gaaggtctca ccgatctggc cgaggtgcgt 5040

cacggtgatt accgcgacgt catcgaatcc gggttcgacg cggtgtcctc gatcgggctg 5100

accgagcaca tcggcgtgca caactacccg gcgtacttca acttcctcaa gtcgaagctg 5160

cgcaccggtg gcctgctgct caaccactgc atcacccgcc cggacaaccg gtcggcgcca 5220

tcggccggcg ggttcatcga caggtacgtg ttccccgacg gggagctcac cggctcgggc 5280

cgcatcatca ccgaggccca ggacgtgggc cttgaggtga tccacgagga gaacctacgc 5340

aatcactatg cgatgacgct gcgcgactgg tgccgcaacc tggtcgagca ctgggacgag 5400

gcggtcgaag aggtcgggct gcccaccgcg aaggtgtggg gcctgtacat ggccggctca 5460

cgtctgggct tcgagaccaa tgtggttcag ctgcaccagg ttctggcggt caagcttgac 5520

gatcagggca aggacggcgg actgccgttg cggccctggt ggtccgccta gcctcaaaat 5580

atattttccc tctatcttct cgttgcgctt aatttgacta attctcatta gcgaggcgcg 5640

cctttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg 5700

tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg 5760

cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga 5820

agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc 5880

tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt 5940

aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact 6000

ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg 6060

cctaactacg gctacactag aagaacagta tttggtatct gcgctctgct gaagccagtt 6120

accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt 6180

ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct 6240

ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg 6300

gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt 6360

aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg cttaatcagt 6420

gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg actccccgtc 6480

gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc aatgataccg 6540

cgagacccac gctcaccggc tccagattta tcagcaataa accagccagc cggaagggcc 6600

gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa ttgttgccgg 6660

gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc cattgctaca 6720

ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg ttcccaacga 6780

tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc cttcggtcct 6840

ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat ggcagcactg 6900

cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg tgagtactca 6960

accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata 7020

cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg aaaacgttct 7080

tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat gtaacccact 7140

cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg gtgagcaaaa 7200

acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg ttgaatactc 7260

atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct catgagcgga 7320

tacatatttg aatgtattta gaaaaataaa cagcgatcgc gcggccgcgg gtaataactg 7380

atataattaa attgaagctc taatttgtga gtttagtata catgcattta cttataatac 7440

agttttttag ttttgctggc cgcatcttct caaatatgct tcccagcctg cttttctgta 7500

acgttcaccc tctaccttag catcccttcc ctttgcaaat agtcctcttc caacaataat 7560

aatgtcagat cctgtagaga ccacatcatc cacggttcta tactgttgac ccaatgcgtc 7620

tcccttgtca tctaaaccca caccgggtgt cataatcaac caatcgtaac cttcatctct 7680

tccacccatg tctctttgag caataaagcc gataacaaaa tctttgtcgc tcttcgcaat 7740

gtcaacagta cccttagtat attctccagt agctagggag cccttgcatg acaattctgc 7800

taacatcaaa aggcctctag gttcctttgt tacttcttcc gccgcctgct tcaaaccgct 7860

aacaatacct gggcccacca caccgtgtgc attcgtaatg tctgcccatt ctgctattct 7920

gtatacaccc gcagagtact gcaatttgac tgtattacca atgtcagcaa attttctgtc 7980

ttcgaagagt aaaaaattgt acttggcgga taatgccttt agcggcttaa ctgtgccctc 8040

catggaaaaa tcagtcaaga tatccacatg tgtttttagt aaacaaattt tgggacctaa 8100

tgcttcaact aactccagta attccttggt ggtacgaaca tccaatgaag cacacaagtt 8160

tgtttgcttt tcgtgcatga tattaaatag cttggcagca acaggactag gatgagtagc 8220

agcacgttcc ttatatgtag ctttcgacat gatttatctt cgtttcctgc aggtttttgt 8280

tctgtgcagt tgggttaaga atactgggca atttcatgtt tcttcaacac cacatatgcg 8340

tatatatacc aatctaagtc tgtgctcctt ccttcgttct tccttctgct cggagattac 8400

cgaatcaaag ctagcttatc gatgataagc tgtcaaagat gagaattaat tccacggact 8460

atagactata ctagatactc cgtctactgt acgatacact tccgctcagg tccttgtcct 8520

ttaacgaggc cttaccactc ttttgttact ctattgatcc agctcagcaa aggcagtgtg 8580

atctaagatt ctatcttcgc gatgtagtaa aactagctag accgagaaag agactagaaa 8640

tgcaaaaggc acttctacaa tggctgccat cattattatc cgatgtgacg ctgcagcttc 8700

tcaatgatat tcgaatacgc tttgaggaga tacagcctaa tatccgacaa actgttttac 8760

agatttacga tcgtacttgt tacccatcat tgaattttga acatccgaac ctgggagttt 8820

tccctgaaac agatagtata tttgaacctg tataataata tatagtctag cgctttacgg 8880

aagacaatgt atgtatttcg gttcctggag aaactattgc atctattgca taggtaatct 8940

tgcacgtcgc atccccggtt cattttctgc gtttccatct tgcacttcaa tagcatatct 9000

ttgttaacga agcatctgtg cttcattttg tagaacaaaa atgcaacgcg agagcgctaa 9060

tttttcaaac aaagaatctg agctgcattt ttacagaaca gaaatgcaac gcgaaagcgc 9120

tattttacca acgaagaatc tgtgcttcat ttttgtaaaa caaaaatgca acgcgacgag 9180

agcgctaatt tttcaaacaa agaatctgag ctgcattttt acagaacaga aatgcaacgc 9240

gagagcgcta ttttaccaac aaagaatcta tacttctttt ttgttctaca aaaatgcatc 9300

ccgagagcgc tatttttcta acaaagcatc ttagattact ttttttctcc tttgtgcgct 9360

ctataatgca gtctcttgat aactttttgc actgtaggtc cgttaaggtt agaagaaggc 9420

tactttggtg tctattttct cttccataaa aaaagcctga ctccacttcc cgcgtttact 9480

gattactagc gaagctgcgg gtgcattttt tcaagataaa ggcatccccg attatattct 9540

ataccgatgt ggattgcgca tactttgtga acagaaagtg atagcgttga tgattcttca 9600

ttggtcagaa aattatgaac ggtttcttct attttgtctc tatatactac gtataggaaa 9660

tgtttacatt ttcgtattgt tttcgattca ctctatgaat agttcttact acaatttttt 9720

tgtctaaaga gtaatactag agataaacat aaaaaatgta gaggtcgagt ttagatgcaa 9780

gttcaaggag cgaaaggtgg atgggta 9807

<210> 94

<211> 10293

<212> DNA

<213> 人工序列

<220>

<223> 合成核酸

<400> 94

gtttgtggaa gcggtattcg caatttaatt aacgcttacc ttggccgtta gacatcatgg 60

taaatctgcg cagacagccc tgtgcagctg aaacgcggtt acgtatagct tgccatatgt 120

ctagccatac gtaaccgcag gtaaaaggca tatttttcgc gtgtcatggc tagtaaataa 180

caccggtgtc atttagagtc agggaaagac aatgaaaaac gaagaaagcc accgggcggc 240

aacccgatga ctttcgctta tcacccagca cacacctggg agaaatcacg gtcatgagtt 300

tacagactca tgcgcagaat gcgcacacta aaacacctac ccgcgtcgag cgcgaccgtg 360

gtggactgga caacacccca gcatctgcca gtgaccgcga ccttttacgc gatcatctag 420

gccgcgatgt actccacggt tcagtcacac gagactttaa aaaggcctat cgacgcaacg 480

ctgacggcac gaactcgccg cgtatgtatc gcttcgagac tgatgcttta ggacggtgcg 540

agtacgccat gctcaccacc aagcagtacg ccgccgtcct ggtcgtagac gttgaccaag 600

taggtaccgc aggcggtgac cccgcagact taaacccgta cgtccgcgac gtggtgcgct 660

cactgattac tcatagcgtc gggccagcct gggtgggtat taacccaact aacggcaaag 720

cccagttcat atggcttatt gaccctgtct acgctgaccg taacggtaaa tctgcgcaga 780

tgaagcttct tgcagcaacc acgcgtgtgc tgggtgagct tttagaccat gacccgcact 840

tttcccaccg ctttagccgc aacccgttct acacaggcaa agcccctacc gcttatcgtt 900

ggtataggca gcacaaccgg gtgatgcgcc ttggagactt gataaagcag gtaagggata 960

tggcaggaca cgaccagttc aaccccaccc cacgccagca attcagctct ggccgcgaac 1020

ttatcaacgc ggtcaagacc cgccgtgaag aagcccaagc attcaaagca ctcgcccagg 1080

acgtagacgc ggaaatcgcc ggtggtctcg accagtatga cccggaactt atcgacggtg 1140

tgcgtgtgct ctggattgtc caaggaaccg cagcacgcga cgaaacagcc tttagacatg 1200

cgcttaagac tggccaccgc ttgcgccagc aaggccaacg cctgacagac gcagcaatca 1260

tcgacgccta tgagcacgcc tacaacgtcg cacacaccca cggcggtgca ggccgcgaca 1320

acgagatgcc acccatgcgc gaccgccaaa ccatggcaag gcgcgtgcgc gggtatgtcg 1380

cccaatccaa gagcgagacc tacagcggct ctaacgcacc aggtaaagcc accagcagcg 1440

agcggaaagc cttggccacg atgggacgca gaggcggaca aaaagccgca caacgctgga 1500

aaacagaccc cgagggcaaa tatgcgcaag cacaaaggtc gaagcttgaa aagacgcacc 1560

gtaagaaaaa ggctcaagga cgatctacga agtcccgtat tagccaaatg gtgaacgatc 1620

agtatttcca gacagggaca gttcccacgt gggctgaaat aggggcagag gtaggagtct 1680

ctcgcgccac ggttgctagg catgtcgcgg agctaaagaa gagcggtgac tatccggacg 1740

tttaaggggt ctcataccgt aagcaatata cggttcccct gccgttaggc agttagataa 1800

aacctcactt gaagaaaacc ttgaggggca gggcagctta tatgcttcaa agcatgactt 1860

cctctgttct cctagacctc gcaaccctcc gccataacct caccctgctc tgcgaggctg 1920

gccggctacc gccggcgtaa cagatgaggg caagcggatg gctgatgaaa ccaagccgcg 1980

gccgggaagc cgatctcggc ttgaacgaat tgttaggtgg cggtacttgg gtcgatatca 2040

aagtgcatca cttcttcccg tatgcccaac tttgtataga gagccactgc gggatcgtca 2100

ccgtaatctg cttgcacgta gatcacataa gcaccaagcg cgttggcctc atgcttgagg 2160

agattgatga gcgcggtggc aatgccctgc ctccggtgct cgccggagac tgcgagatca 2220

tagatataga tctcactacg cggctgctca aacttgggca gaacgtaagc cgcgagagcg 2280

ccaacaaccg cttcttggtc gaaggcagca agcgcgatga atgtcttact acggagcaag 2340

ttcccgaggt aatcggagtc cggctgatgt tgggagtagg tggctacgtc tccgaactca 2400

cgaccgaaaa gatcaagagc agcccgcatg gatttgactt ggtcagggcc gagcctacat 2460

gtgcgaatga tgcccatact tgagccacct aactttgttt tagggcgact gccctgctgc 2520

gtaacatcgt tgctgctcca taacatcaaa catcgaccca cggcgtaacg cgcttgctgc 2580

ttggatgccc gaggcataga ctgtacaaaa aaacagtcat aacaagccat gaaaaccgcc 2640

actgcgccgt taccaccgct gcgttcggtc aaggttctgg accagttgcg tgagcgcata 2700

cgctacttgc attacagttt acgaaccgag tttaaacagc tggtgacaat taatcatcgg 2760

ctcgtataat gtgtggaatt gaatcgatat aaggaggtta atcatgtgaa ctgtcagtct 2820

tccgcgtcca acctcgccaa ccacatcaac gcggtgtacg agctgcgccg cgcctatgcg 2880

cggctgtccg ccgacaagcc ggtgcgcctg gcgaagacca cctccaacct cttccgcttc 2940

cgcagccggg acgatgccgc gcgtctcgac gtcagcgctt tcacctcggt gatcagcatc 3000

gacacggagg cgcgggtcgc ggaggtgggc ggcatgacca cctacgagga cctggtcgcc 3060

gccaccctgc ggcatggcct gatgccgccg gtggttccgc aactgcgcac gatcaccctg 3120

ggcggtgcgg tcaccgggct ggggatcgaa tcctcgtcct tccgcaacgg gctcccgcac 3180

gagtcagtgg aagagatgga gatcctcacc ggcagcggcc aggtggtggt ggcccggcgc 3240

gacaacgagc accgcgacct gttctacggt ttccccaact cgtacggcac cctcggttac 3300

gcgctgcggc tccgcatcca gctcgaaccg gtccgcccct acgtccacct gcggcacctg 3360

cggttcaccg atgccgcagc ggccatggcc gcgctggagc agatctgcgc ggaccgcacc 3420

cacgacgggg agaccgtcga cttcgtcgac ggcgtcgtgt tcgcccgcaa cgagctgtac 3480

ctgaccttgg ggacgttcac cgaccgggct ccgtggacca gcgactacac cggaaccgac 3540

atctactacc ggtcgatccc ccgctacgcg ggccccggcc ccggcgacta cctcaccacg 3600

cacgactacc tgtggcggtg ggacaccgac tggttctggt gctcccgcgc cttcggactg 3660

cagcatcccg tggtgcgccg cctgtggccg cgttccttga aacgctccga cgtctaccgc 3720

aagctcgtcg cctgggaccg gcgcactgac gcgagccgcc tgctcgacta ctaccgcggg 3780

cgcccgccca aggaaccggt gatccaggac atcgaggttg aggtggggcg ggctgccgag 3840

ttcctcgact tcttccacac cgagatcggc atgtccccgg tgtggctgtg cccgctgcgg 3900

ctgcgagaag acacagccga cgatacggaa ccggtctggc cgctctaccc cctcaaaccc 3960

cgccgcctct acgtcaactt cgggttttgg ggcctcgttc cgatccgtcc cggtggaggc 4020

aggacatacc acaaccggct gatcgaaaaa gaagtgaccc ggttgggcgg gcacaagtcg 4080

ctctactcgg acgccttcta cgacgaggac gagttctggg agctctacaa cggggagatc 4140

taccgcaagc tcaaagctgc ctacgacccc gacggtcgac tgctcgacct gtacaccaag 4200

tgcgtcggcg gcgggtgaga aaggatgagg gatgcgactg gcggaggtat tcgaacgtgt 4260

cgtcggaccc gatgcgcccg tccacttccg ggcctacgac ggcagcactg cgggagatcc 4320

acgcagtgaa gtcgctatcg tggttcgcca cccggcagcc gtcaactaca tcgtccaagc 4380

gccgggagca ctcggtttga cccgcgccta cgtggcggga tacctcgacg tcgaagggga 4440

catgtacacc gcgctgcggg caatggccga cgtggtgttc caggaccggc cgcggctgtc 4500

ccccggggaa ctgctgcgga tcatccgcgg gatcgggtgg gtgaagttcg tcaaccggct 4560

tccaccgccg ccgcaggagg tgcgccagtc ccgcctcgcc gccctgggct ggcgccactc 4620

caagcagcgc gacgccgaag ccatccagca ccactacgac gtctccaacg ccttctacgc 4680

cctggtcttg ggcgagtcga tgacctacac ctgcgcggtc tacccgaccg agcaggccac 4740

gctggagcag gcacagttct tcaagcacga gctgatcgcc cgcaagctcg gtcttgcccc 4800

tgggatacga ctgctggatg tggggtgcgg ctggggcggc atggtcatcc acgcggcccg 4860

ggagcacggg gtcaaagccc tgggggtgac cctgtccaaa gagcaggctg agtgggcgca 4920

gaagcggatc gcccacgagg gcctgggcga cctggcagaa gtccggcaca tggactaccg 4980

ggacctgccc gacggcgagt acgacgcgat cagctcgatc gggttgaccg agcacgtcgg 5040

caaaaagaac gtgcccgcct acttcgcgtc gctgtaccgc aagctcgtcc cgggaggccg 5100

cctgctcaac cactgcatca cccggccccg caacgacctg ccgcccttca aacgcggcgg 5160

ggtgatcaac cgctacgtct tccccgatgg ggagctggaa gggcccggct ggctgcaggc 5220

ggcgatgaac gacgccgggt tcgaaatccg ccaccaggag aacctgcggg agcactacgc 5280

acggaccctg cgggactggc tggccaacct ggaccgcaac tgggatgccg cggtgcggga 5340

agtgggggag ggcacggccc gagtgtggcg gctctacatg gccgggtgcg tgctcggctt 5400

cgaacgcaac gtggtgcaac tgcaccagat cctcggggtg aagctcgacg ggaccgaggc 5460

gcggatgccg ctgcgccccg acttcgaacc gccgctgcct taaccgcggt gcacagccgg 5520

gggatatcag tcgcggaacc gggcatgatg agcccatggc tgcgaccgat gacgaccggc 5580

accacaccac cgtcgccctc gacctcatcg acgcgtatgt gcgcgccgac cgcagaatga 5640

tcggtgaacg ttccgcgggg atcagcgcgg aggcggggga gcggatcgtc tccaccctga 5700

aagtgtgcgc ggccttcctt gcccgccggg tccaggagac cggggtgccg tggcgcgcag 5760

cggactcccg ggaagcggtc gcccgcaccg tcgccgacct gctggaaccc gaggtggaat 5820

tcgcggtcgt ctccgcctgg gaggcgtacg cgatcgggga gcacgaggcc gcctgggtcc 5880

gggcgcacgg cgatccgctg gtcttcgtcc acatgctggc cgcgttctcc gctgctatcg 5940

gcacagcggt ctacggccgt gaggagctgc tgcccacgct gcgcagggtg acagcacgat 6000

aacctcaaaa tatattttcc ctctatcttc tcgttgcgct taatttgact aattctcatt 6060

agcgaggcgc gcctttccat aggctccgcc cccctgacga gcatcacaaa aatcgacgct 6120

caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt ccccctggaa 6180

gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc 6240

tcccttcggg aagcgtggcg ctttctcata gctcacgctg taggtatctc agttcggtgt 6300

aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg 6360

ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta tcgccactgg 6420

cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct acagagttct 6480

tgaagtggtg gcctaactac ggctacacta gaagaacagt atttggtatc tgcgctctgc 6540

tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa caaaccaccg 6600

ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa aaaggatctc 6660

aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa aactcacgtt 6720

aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac ctagatcctt ttaaattaaa 6780

aatgaagttt taaatcaatc taaagtatat atgagtaaac ttggtctgac agttaccaat 6840

gcttaatcag tgaggcacct atctcagcga tctgtctatt tcgttcatcc atagttgcct 6900

gactccccgt cgtgtagata actacgatac gggagggctt accatctggc cccagtgctg 6960

caatgatacc gcgagaccca cgctcaccgg ctccagattt atcagcaata aaccagccag 7020

ccggaagggc cgagcgcaga agtggtcctg caactttatc cgcctccatc cagtctatta 7080

attgttgccg ggaagctaga gtaagtagtt cgccagttaa tagtttgcgc aacgttgttg 7140

ccattgctac aggcatcgtg gtgtcacgct cgtcgtttgg tatggcttca ttcagctccg 7200

gttcccaacg atcaaggcga gttacatgat cccccatgtt gtgcaaaaaa gcggttagct 7260

ccttcggtcc tccgatcgtt gtcagaagta agttggccgc agtgttatca ctcatggtta 7320

tggcagcact gcataattct cttactgtca tgccatccgt aagatgcttt tctgtgactg 7380

gtgagtactc aaccaagtca ttctgagaat agtgtatgcg gcgaccgagt tgctcttgcc 7440

cggcgtcaat acgggataat accgcgccac atagcagaac tttaaaagtg ctcatcattg 7500

gaaaacgttc ttcggggcga aaactctcaa ggatcttacc gctgttgaga tccagttcga 7560

tgtaacccac tcgtgcaccc aactgatctt cagcatcttt tactttcacc agcgtttctg 7620

ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg aataagggcg acacggaaat 7680

gttgaatact catactcttc ctttttcaat attattgaag catttatcag ggttattgtc 7740

tcatgagcgg atacatattt gaatgtattt agaaaaataa acagcgatcg cgcggccgcg 7800

ggtaataact gatataatta aattgaagct ctaatttgtg agtttagtat acatgcattt 7860

acttataata cagtttttta gttttgctgg ccgcatcttc tcaaatatgc ttcccagcct 7920

gcttttctgt aacgttcacc ctctacctta gcatcccttc cctttgcaaa tagtcctctt 7980

ccaacaataa taatgtcaga tcctgtagag accacatcat ccacggttct atactgttga 8040

cccaatgcgt ctcccttgtc atctaaaccc acaccgggtg tcataatcaa ccaatcgtaa 8100

ccttcatctc ttccacccat gtctctttga gcaataaagc cgataacaaa atctttgtcg 8160

ctcttcgcaa tgtcaacagt acccttagta tattctccag tagctaggga gcccttgcat 8220

gacaattctg ctaacatcaa aaggcctcta ggttcctttg ttacttcttc cgccgcctgc 8280

ttcaaaccgc taacaatacc tgggcccacc acaccgtgtg cattcgtaat gtctgcccat 8340

tctgctattc tgtatacacc cgcagagtac tgcaatttga ctgtattacc aatgtcagca 8400

aattttctgt cttcgaagag taaaaaattg tacttggcgg ataatgcctt tagcggctta 8460

actgtgccct ccatggaaaa atcagtcaag atatccacat gtgtttttag taaacaaatt 8520

ttgggaccta atgcttcaac taactccagt aattccttgg tggtacgaac atccaatgaa 8580

gcacacaagt ttgtttgctt ttcgtgcatg atattaaata gcttggcagc aacaggacta 8640

ggatgagtag cagcacgttc cttatatgta gctttcgaca tgatttatct tcgtttcctg 8700

caggtttttg ttctgtgcag ttgggttaag aatactgggc aatttcatgt ttcttcaaca 8760

ccacatatgc gtatatatac caatctaagt ctgtgctcct tccttcgttc ttccttctgc 8820

tcggagatta ccgaatcaaa gctagcttat cgatgataag ctgtcaaaga tgagaattaa 8880

ttccacggac tatagactat actagatact ccgtctactg tacgatacac ttccgctcag 8940

gtccttgtcc tttaacgagg ccttaccact cttttgttac tctattgatc cagctcagca 9000

aaggcagtgt gatctaagat tctatcttcg cgatgtagta aaactagcta gaccgagaaa 9060

gagactagaa atgcaaaagg cacttctaca atggctgcca tcattattat ccgatgtgac 9120

gctgcagctt ctcaatgata ttcgaatacg ctttgaggag atacagccta atatccgaca 9180

aactgtttta cagatttacg atcgtacttg ttacccatca ttgaattttg aacatccgaa 9240

cctgggagtt ttccctgaaa cagatagtat atttgaacct gtataataat atatagtcta 9300

gcgctttacg gaagacaatg tatgtatttc ggttcctgga gaaactattg catctattgc 9360

ataggtaatc ttgcacgtcg catccccggt tcattttctg cgtttccatc ttgcacttca 9420

atagcatatc tttgttaacg aagcatctgt gcttcatttt gtagaacaaa aatgcaacgc 9480

gagagcgcta atttttcaaa caaagaatct gagctgcatt tttacagaac agaaatgcaa 9540

cgcgaaagcg ctattttacc aacgaagaat ctgtgcttca tttttgtaaa acaaaaatgc 9600

aacgcgacga gagcgctaat ttttcaaaca aagaatctga gctgcatttt tacagaacag 9660

aaatgcaacg cgagagcgct attttaccaa caaagaatct atacttcttt tttgttctac 9720

aaaaatgcat cccgagagcg ctatttttct aacaaagcat cttagattac tttttttctc 9780

ctttgtgcgc tctataatgc agtctcttga taactttttg cactgtaggt ccgttaaggt 9840

tagaagaagg ctactttggt gtctattttc tcttccataa aaaaagcctg actccacttc 9900

ccgcgtttac tgattactag cgaagctgcg ggtgcatttt ttcaagataa aggcatcccc 9960

gattatattc tataccgatg tggattgcgc atactttgtg aacagaaagt gatagcgttg 10020

atgattcttc attggtcaga aaattatgaa cggtttcttc tattttgtct ctatatacta 10080

cgtataggaa atgtttacat tttcgtattg ttttcgattc actctatgaa tagttcttac 10140

tacaattttt ttgtctaaag agtaatacta gagataaaca taaaaaatgt agaggtcgag 10200

tttagatgca agttcaagga gcgaaaggtg gatgggtagg ttatataggg atatagcaca 10260

gagatatata gcaaagagat acttttgagc aat 10293

<210> 95

<211> 5654

<212> DNA

<213> 人工序列

<220>

<223> 合成核酸

<400> 95

tgggtaggtt atatagggat atagcacaga gatatatagc aaagagatac ttttgagcaa 60

tgtttgtgga agcggtattc gcaatttaat taaagctggt gacaattaat catcggctcg 120

tataatgtgt ggaattgaat cgatataagg aggttaatca tatgacgctg gccaaggtct 180

tcgaggagct ggtcggggcg gacgcccctg tggagctcac cgcctacgac ggatcgagag 240

ccggacgcct gggcagtgat ctgcgggtcc acgtgaagtc gccgtacgcg gtgtcctacc 300

tggtgcactc gccgagcgcg ctcgggctgg cccgcgcgta cgtggccggg cacctggacg 360

cctacggcga catgtacacg ctgctgcggg agatgacgca gctgaccgag gcgctgacgc 420

ccaaggcccg gctgcggctg ctggccggtg tcctgcagga tccgctgctg cgcgcggcgg 480

ccagccgccg tctgccgccc ccgccgcagg aggtgcggac cggccgcacc tcctggttcc 540

ggcacaccaa gcggcgggac gccaaggcca tctcccacca ctacgacgtg tccaacacct 600

tctatgagtg ggtgctgggc ccgtcgatga cctacacctg cgcctgtttc cccaccgagg 660

acgccacctt ggaggaggcg cagttccaca agcacgacct ggtcgccaag aagctcgggc 720

tgcggccggg catgcggctg ctggacgtgg gctgcggctg gggcggcatg gtgatgcacg 780

ccgccaagca ctacggggtg cgggcgctgg gcgtcacgct gtccaagcag caggccgagt 840

gggcgcagaa ggccatcgcc gaggcgggcc tgagcgacct ggccgaggtc cgccaccagg 900

actaccggga cgtcaccgag ggcgacttcg acgccatcag ctcgatcggc ctcaccgagc 960

acatcggcaa ggccaacctg ccgtcctact tcggcttcct gtacggcaag ctcaagccgg 1020

gcgggcggct gctcaaccac tgcatcaccc ggcccgacaa cacccagccg gccatgaaga 1080

aggacgggtt catcaaccgg tacgtcttcc ccgacgggga gctggagggg cccggctacc 1140

tgcagaccca gatgaacgac gccggttttg agatccgcca ccaggagaac ctgcgcgagc 1200

actacgcccg caccctggcc ggatggtgcc gcaacctcga tgagcactgg gacgaggcgg 1260

tggccgaggt cggcgagggc accgcgcggg tgtggcggct gtacatggcc ggcagccggc 1320

tcggtttcga gctcaactgg atccagctgc accagatcct gggcgtcaag ctcggcgagc 1380

gcggcgagtc ccgcatgccg ttgcggcccg actggggcgt gtgacctcaa aatatatttt 1440

ccctctatct tctcgttgcg cttaatttga ctaattctca ttagcgaggc gcgcctttcc 1500

ataggctccg cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa 1560

acccgacagg actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc 1620

ctgttccgac cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg 1680

cgctttctca tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc 1740

tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc 1800

gtcttgagtc caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca 1860

ggattagcag agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact 1920

acggctacac tagaagaaca gtatttggta tctgcgctct gctgaagcca gttaccttcg 1980

gaaaaagagt tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt 2040

ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct 2100

tttctacggg gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga 2160

gattatcaaa aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa 2220

tctaaagtat atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac 2280

ctatctcagc gatctgtcta tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga 2340

taactacgat acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcgagacc 2400

cacgctcacc ggctccagat ttatcagcaa taaaccagcc agccggaagg gccgagcgca 2460

gaagtggtcc tgcaacttta tccgcctcca tccagtctat taattgttgc cgggaagcta 2520

gagtaagtag ttcgccagtt aatagtttgc gcaacgttgt tgccattgct acaggcatcg 2580

tggtgtcacg ctcgtcgttt ggtatggctt cattcagctc cggttcccaa cgatcaaggc 2640

gagttacatg atcccccatg ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg 2700

ttgtcagaag taagttggcc gcagtgttat cactcatggt tatggcagca ctgcataatt 2760

ctcttactgt catgccatcc gtaagatgct tttctgtgac tggtgagtac tcaaccaagt 2820

cattctgaga atagtgtatg cggcgaccga gttgctcttg cccggcgtca atacgggata 2880

ataccgcgcc acatagcaga actttaaaag tgctcatcat tggaaaacgt tcttcggggc 2940

gaaaactctc aaggatctta ccgctgttga gatccagttc gatgtaaccc actcgtgcac 3000

ccaactgatc ttcagcatct tttactttca ccagcgtttc tgggtgagca aaaacaggaa 3060

ggcaaaatgc cgcaaaaaag ggaataaggg cgacacggaa atgttgaata ctcatactct 3120

tcctttttca atattattga agcatttatc agggttattg tctcatgagc ggatacatat 3180

ttgaatgtat ttagaaaaat aaacagcgat cgcgcggccg cgggtaataa ctgatataat 3240

taaattgaag ctctaatttg tgagtttagt atacatgcat ttacttataa tacagttttt 3300

tagttttgct ggccgcatct tctcaaatat gcttcccagc ctgcttttct gtaacgttca 3360

ccctctacct tagcatccct tccctttgca aatagtcctc ttccaacaat aataatgtca 3420

gatcctgtag agaccacatc atccacggtt ctatactgtt gacccaatgc gtctcccttg 3480

tcatctaaac ccacaccggg tgtcataatc aaccaatcgt aaccttcatc tcttccaccc 3540

atgtctcttt gagcaataaa gccgataaca aaatctttgt cgctcttcgc aatgtcaaca 3600

gtacccttag tatattctcc agtagctagg gagcccttgc atgacaattc tgctaacatc 3660

aaaaggcctc taggttcctt tgttacttct tccgccgcct gcttcaaacc gctaacaata 3720

cctgggccca ccacaccgtg tgcattcgta atgtctgccc attctgctat tctgtataca 3780

cccgcagagt actgcaattt gactgtatta ccaatgtcag caaattttct gtcttcgaag 3840

agtaaaaaat tgtacttggc ggataatgcc tttagcggct taactgtgcc ctccatggaa 3900

aaatcagtca agatatccac atgtgttttt agtaaacaaa ttttgggacc taatgcttca 3960

actaactcca gtaattcctt ggtggtacga acatccaatg aagcacacaa gtttgtttgc 4020

ttttcgtgca tgatattaaa tagcttggca gcaacaggac taggatgagt agcagcacgt 4080

tccttatatg tagctttcga catgatttat cttcgtttcc tgcaggtttt tgttctgtgc 4140

agttgggtta agaatactgg gcaatttcat gtttcttcaa caccacatat gcgtatatat 4200

accaatctaa gtctgtgctc cttccttcgt tcttccttct gctcggagat taccgaatca 4260

aagctagctt atcgatgata agctgtcaaa gatgagaatt aattccacgg actatagact 4320

atactagata ctccgtctac tgtacgatac acttccgctc aggtccttgt cctttaacga 4380

ggccttacca ctcttttgtt actctattga tccagctcag caaaggcagt gtgatctaag 4440

attctatctt cgcgatgtag taaaactagc tagaccgaga aagagactag aaatgcaaaa 4500

ggcacttcta caatggctgc catcattatt atccgatgtg acgctgcagc ttctcaatga 4560

tattcgaata cgctttgagg agatacagcc taatatccga caaactgttt tacagattta 4620

cgatcgtact tgttacccat cattgaattt tgaacatccg aacctgggag ttttccctga 4680

aacagatagt atatttgaac ctgtataata atatatagtc tagcgcttta cggaagacaa 4740

tgtatgtatt tcggttcctg gagaaactat tgcatctatt gcataggtaa tcttgcacgt 4800

cgcatccccg gttcattttc tgcgtttcca tcttgcactt caatagcata tctttgttaa 4860

cgaagcatct gtgcttcatt ttgtagaaca aaaatgcaac gcgagagcgc taatttttca 4920

aacaaagaat ctgagctgca tttttacaga acagaaatgc aacgcgaaag cgctatttta 4980

ccaacgaaga atctgtgctt catttttgta aaacaaaaat gcaacgcgac gagagcgcta 5040

atttttcaaa caaagaatct gagctgcatt tttacagaac agaaatgcaa cgcgagagcg 5100

ctattttacc aacaaagaat ctatacttct tttttgttct acaaaaatgc atcccgagag 5160

cgctattttt ctaacaaagc atcttagatt actttttttc tcctttgtgc gctctataat 5220

gcagtctctt gataactttt tgcactgtag gtccgttaag gttagaagaa ggctactttg 5280

gtgtctattt tctcttccat aaaaaaagcc tgactccact tcccgcgttt actgattact 5340

agcgaagctg cgggtgcatt ttttcaagat aaaggcatcc ccgattatat tctataccga 5400

tgtggattgc gcatactttg tgaacagaaa gtgatagcgt tgatgattct tcattggtca 5460

gaaaattatg aacggtttct tctattttgt ctctatatac tacgtatagg aaatgtttac 5520

attttcgtat tgttttcgat tcactctatg aatagttctt actacaattt ttttgtctaa 5580

agagtaatac tagagataaa cataaaaaat gtagaggtcg agtttagatg caagttcaag 5640

gagcgaaagg tgga 5654

<210> 96

<211> 5759

<212> DNA

<213> 人工序列

<220>

<223> 合成核酸

<400> 96

tgggtaggtt atatagggat atagcacaga gatatatagc aaagagatac ttttgagcaa 60

tgtttgtgga agcggtattc gcaatttaat taaagctggt gacaattaat catcggctcg 120

tataatgtgt ggaattgaat cgatataagg aggttaatca tatgtcacag ctggcggtca 180

cagaccacca cgagcgagcg gtcgaggcgc tgcgcaggtc gtatgcggcg atcccgccgg 240

gcacaccggt ccgcttggcc aagcagacct ccaacctgtt ccgcttccgc gagccgacgg 300

ccgcgcccgg cctggacgtg tccggcttca accgggtgct ggcggtggac ccggatgcgc 360

gcaccgccga cgtgcagggc atgaccacct acgaggacct ggtcgacgcc accctgccgc 420

acgggctgat gccgctggtg gtgccccagc tcaagacgat cacgctgggc ggggcggtga 480

ccggcctggg catcgagtcc acctccttcc gcaacggcct gccgcacgag tcggtgctgg 540

agatgcagat catcaccggc gccggcgaag tggtcaccgc caccccggac ggggagcact 600

ccgacctgtt ctggggcttc cccaactcct acgggacgct ggggtacgcc ctgaagctga 660

agatcgaact ggagccggtc aagccgtacg tccggctgcg gcacctgcgc ttcgacgacg 720

ccggcgagtg cgccgccaag ctcgccgagc tgagcgaaag ccgcgagcac gagggcgatg 780

aggtgcactt tttggacggc accttcttcg ggccgcgcga gatgtacctg acgctcggca 840

cgttcaccga caccgccccc tatgtgtcgg actacaccgg gcagcacatc tactaccggt 900

cgatccagca gcggtcgatc gactttttga ccatccgcga ctacctgtgg cgctgggaca 960

ccgactggtt ctggtgctcg cgcgccctgg gcgtgcagaa cccgctgatc cggcgggtgt 1020

ggccgaagag cgccaagcgg tcggatgtgt accgcaagct ggtggcctac gaaaagcgct 1080

accagttcaa ggcgcgcatc gaccggtgga cgggcaagcc gccgcgcgag gacgtcatcc 1140

aggacatcga ggtgccggca gaacgcctgc cggagttcct ggagttcttc cacgacaaga 1200

tcgggatgag cccggtgtgg ctgtgcccgc tgcgggcgcg ccaccgctgg ccgctgtacc 1260

cgctcaagcc cggcgtcacc tacgtcaacg ccggcttctg ggggacggtg ccgctgcagc 1320

cggggcagat gcccgagtac cacaaccggc tgatcgaacg gaaggtcgcc caactggacg 1380

gccacaagtc tctgtactcg acggcgttct actcgcgtga ggagttctgg cggcactacg 1440

acggggaaac ctaccggcgt ctgaaggaca cctacgaccc cgacgcgcgc ctgctcgacc 1500

tctacgacaa gtgcgtgcgg ggacgctgac ctcaaaatat attttccctc tatcttctcg 1560

ttgcgcttaa tttgactaat tctcattagc gaggcgcgcc tttccatagg ctccgccccc 1620

ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg acaggactat 1680

aaagatacca ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc 1740

cgcttaccgg atacctgtcc gcctttctcc cttcgggaag cgtggcgctt tctcatagct 1800

cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg 1860

aaccccccgt tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc 1920

cggtaagaca cgacttatcg ccactggcag cagccactgg taacaggatt agcagagcga 1980

ggtatgtagg cggtgctaca gagttcttga agtggtggcc taactacggc tacactagaa 2040

gaacagtatt tggtatctgc gctctgctga agccagttac cttcggaaaa agagttggta 2100

gctcttgatc cggcaaacaa accaccgctg gtagcggtgg tttttttgtt tgcaagcagc 2160

agattacgcg cagaaaaaaa ggatctcaag aagatccttt gatcttttct acggggtctg 2220

acgctcagtg gaacgaaaac tcacgttaag ggattttggt catgagatta tcaaaaagga 2280

tcttcaccta gatcctttta aattaaaaat gaagttttaa atcaatctaa agtatatatg 2340

agtaaacttg gtctgacagt taccaatgct taatcagtga ggcacctatc tcagcgatct 2400

gtctatttcg ttcatccata gttgcctgac tccccgtcgt gtagataact acgatacggg 2460

agggcttacc atctggcccc agtgctgcaa tgataccgcg agacccacgc tcaccggctc 2520

cagatttatc agcaataaac cagccagccg gaagggccga gcgcagaagt ggtcctgcaa 2580

ctttatccgc ctccatccag tctattaatt gttgccggga agctagagta agtagttcgc 2640

cagttaatag tttgcgcaac gttgttgcca ttgctacagg catcgtggtg tcacgctcgt 2700

cgtttggtat ggcttcattc agctccggtt cccaacgatc aaggcgagtt acatgatccc 2760

ccatgttgtg caaaaaagcg gttagctcct tcggtcctcc gatcgttgtc agaagtaagt 2820

tggccgcagt gttatcactc atggttatgg cagcactgca taattctctt actgtcatgc 2880

catccgtaag atgcttttct gtgactggtg agtactcaac caagtcattc tgagaatagt 2940

gtatgcggcg accgagttgc tcttgcccgg cgtcaatacg ggataatacc gcgccacata 3000

gcagaacttt aaaagtgctc atcattggaa aacgttcttc ggggcgaaaa ctctcaagga 3060

tcttaccgct gttgagatcc agttcgatgt aacccactcg tgcacccaac tgatcttcag 3120

catcttttac tttcaccagc gtttctgggt gagcaaaaac aggaaggcaa aatgccgcaa 3180

aaaagggaat aagggcgaca cggaaatgtt gaatactcat actcttcctt tttcaatatt 3240

attgaagcat ttatcagggt tattgtctca tgagcggata catatttgaa tgtatttaga 3300

aaaataaaca gcgatcgcgc ggccgcgggt aataactgat ataattaaat tgaagctcta 3360

atttgtgagt ttagtataca tgcatttact tataatacag ttttttagtt ttgctggccg 3420

catcttctca aatatgcttc ccagcctgct tttctgtaac gttcaccctc taccttagca 3480

tcccttccct ttgcaaatag tcctcttcca acaataataa tgtcagatcc tgtagagacc 3540

acatcatcca cggttctata ctgttgaccc aatgcgtctc ccttgtcatc taaacccaca 3600

ccgggtgtca taatcaacca atcgtaacct tcatctcttc cacccatgtc tctttgagca 3660

ataaagccga taacaaaatc tttgtcgctc ttcgcaatgt caacagtacc cttagtatat 3720

tctccagtag ctagggagcc cttgcatgac aattctgcta acatcaaaag gcctctaggt 3780

tcctttgtta cttcttccgc cgcctgcttc aaaccgctaa caatacctgg gcccaccaca 3840

ccgtgtgcat tcgtaatgtc tgcccattct gctattctgt atacacccgc agagtactgc 3900

aatttgactg tattaccaat gtcagcaaat tttctgtctt cgaagagtaa aaaattgtac 3960

ttggcggata atgcctttag cggcttaact gtgccctcca tggaaaaatc agtcaagata 4020

tccacatgtg tttttagtaa acaaattttg ggacctaatg cttcaactaa ctccagtaat 4080

tccttggtgg tacgaacatc caatgaagca cacaagtttg tttgcttttc gtgcatgata 4140

ttaaatagct tggcagcaac aggactagga tgagtagcag cacgttcctt atatgtagct 4200

ttcgacatga tttatcttcg tttcctgcag gtttttgttc tgtgcagttg ggttaagaat 4260

actgggcaat ttcatgtttc ttcaacacca catatgcgta tatataccaa tctaagtctg 4320

tgctccttcc ttcgttcttc cttctgctcg gagattaccg aatcaaagct agcttatcga 4380

tgataagctg tcaaagatga gaattaattc cacggactat agactatact agatactccg 4440

tctactgtac gatacacttc cgctcaggtc cttgtccttt aacgaggcct taccactctt 4500

ttgttactct attgatccag ctcagcaaag gcagtgtgat ctaagattct atcttcgcga 4560

tgtagtaaaa ctagctagac cgagaaagag actagaaatg caaaaggcac ttctacaatg 4620

gctgccatca ttattatccg atgtgacgct gcagcttctc aatgatattc gaatacgctt 4680

tgaggagata cagcctaata tccgacaaac tgttttacag atttacgatc gtacttgtta 4740

cccatcattg aattttgaac atccgaacct gggagttttc cctgaaacag atagtatatt 4800

tgaacctgta taataatata tagtctagcg ctttacggaa gacaatgtat gtatttcggt 4860

tcctggagaa actattgcat ctattgcata ggtaatcttg cacgtcgcat ccccggttca 4920

ttttctgcgt ttccatcttg cacttcaata gcatatcttt gttaacgaag catctgtgct 4980

tcattttgta gaacaaaaat gcaacgcgag agcgctaatt tttcaaacaa agaatctgag 5040

ctgcattttt acagaacaga aatgcaacgc gaaagcgcta ttttaccaac gaagaatctg 5100

tgcttcattt ttgtaaaaca aaaatgcaac gcgacgagag cgctaatttt tcaaacaaag 5160

aatctgagct gcatttttac agaacagaaa tgcaacgcga gagcgctatt ttaccaacaa 5220

agaatctata cttctttttt gttctacaaa aatgcatccc gagagcgcta tttttctaac 5280

aaagcatctt agattacttt ttttctcctt tgtgcgctct ataatgcagt ctcttgataa 5340

ctttttgcac tgtaggtccg ttaaggttag aagaaggcta ctttggtgtc tattttctct 5400

tccataaaaa aagcctgact ccacttcccg cgtttactga ttactagcga agctgcgggt 5460

gcattttttc aagataaagg catccccgat tatattctat accgatgtgg attgcgcata 5520

ctttgtgaac agaaagtgat agcgttgatg attcttcatt ggtcagaaaa ttatgaacgg 5580

tttcttctat tttgtctcta tatactacgt ataggaaatg tttacatttt cgtattgttt 5640

tcgattcact ctatgaatag ttcttactac aatttttttg tctaaagagt aatactagag 5700

ataaacataa aaaatgtaga ggtcgagttt agatgcaagt tcaaggagcg aaaggtgga 5759

<210> 97

<211> 2664

<212> DNA

<213> 弯曲嗜热单胞菌

<400> 97

atgtcacagc tggcggtcac agaccaccac gagcgagcgg tcgaggcgct gcgcaggtcg 60

tatgcggcga tcccgccggg cacaccggtc cgcttggcca agcagacctc caacctgttc 120

cgcttccgcg agccgacggc cgcgcccggc ctggacgtgt ccggcttcaa ccgggtgctg 180

gcggtggacc cggatgcgcg caccgccgac gtgcagggca tgaccaccta cgaggacctg 240

gtcgacgcca ccctgccgca cgggctgatg ccgctggtgg tgccccagct caagacgatc 300

acgctgggcg gggcggtgac cggcctgggc atcgagtcca cctccttccg caacggcctg 360

ccgcacgagt cggtgctgga gatgcagatc atcaccggcg ccggcgaagt ggtcaccgcc 420

accccggacg gggagcactc cgacctgttc tggggcttcc ccaactccta cgggacgctg 480

gggtacgccc tgaagctgaa gatcgaactg gagccggtca agccgtacgt ccggctgcgg 540

cacctgcgct tcgacgacgc cggcgagtgc gccgccaagc tcgccgagct gagcgaaagc 600

cgcgagcacg agggcgatga ggtgcacttt ttggacggca ccttcttcgg gccgcgcgag 660

atgtacctga cgctcggcac gttcaccgac accgccccct atgtgtcgga ctacaccggg 720

cagcacatct actaccggtc gatccagcag cggtcgatcg actttttgac catccgcgac 780

tacctgtggc gctgggacac cgactggttc tggtgctcgc gcgccctggg cgtgcagaac 840

ccgctgatcc ggcgggtgtg gccgaagagc gccaagcggt cggatgtgta ccgcaagctg 900

gtggcctacg aaaagcgcta ccagttcaag gcgcgcatcg accggtggac gggcaagccg 960

ccgcgcgagg acgtcatcca ggacatcgag gtgccggcag aacgcctgcc ggagttcctg 1020

gagttcttcc acgacaagat cgggatgagc ccggtgtggc tgtgcccgct gcgggcgcgc 1080

caccgctggc cgctgtaccc gctcaagccc ggcgtcacct acgtcaacgc cggcttctgg 1140

gggacggtgc cgctgcagcc ggggcagatg cccgagtacc acaaccggct gatcgaacgg 1200

aaggtcgccc aactggacgg ccacaagtct ctgtactcga cggcgttcta ctcgcgtgag 1260

gagttctggc ggcactacga cggggaaacc taccggcgtc tgaaggacac ctacgacccc 1320

gacgcgcgcc tgctcgacct ctacgacaag tgcgtgcggg gacgcgctgg tggtgccgag 1380

ggtggcaatg gcggtggcgc catgacgctg gccaaggtct tcgaggagct ggtcggggcg 1440

gacgcccctg tggagctcac cgcctacgac ggatcgagag ccggacgcct gggcagtgat 1500

ctgcgggtcc acgtgaagtc gccgtacgcg gtgtcctacc tggtgcactc gccgagcgcg 1560

ctcgggctgg cccgcgcgta cgtggccggg cacctggacg cctacggcga catgtacacg 1620

ctgctgcggg agatgacgca gctgaccgag gcgctgacgc ccaaggcccg gctgcggctg 1680

ctggccggtg tcctgcagga tccgctgctg cgcgcggcgg ccagccgccg tctgccgccc 1740

ccgccgcagg aggtgcggac cggccgcacc tcctggttcc ggcacaccaa gcggcgggac 1800

gccaaggcca tctcccacca ctacgacgtg tccaacacct tctatgagtg ggtgctgggc 1860

ccgtcgatga cctacacctg cgcctgtttc cccaccgagg acgccacctt ggaggaggcg 1920

cagttccaca agcacgacct ggtcgccaag aagctcgggc tgcggccggg catgcggctg 1980

ctggacgtgg gctgcggctg gggcggcatg gtgatgcacg ccgccaagca ctacggggtg 2040

cgggcgctgg gcgtcacgct gtccaagcag caggccgagt gggcgcagaa ggccatcgcc 2100

gaggcgggcc tgagcgacct ggccgaggtc cgccaccagg actaccggga cgtcaccgag 2160

ggcgacttcg acgccatcag ctcgatcggc ctcaccgagc acatcggcaa ggccaacctg 2220

ccgtcctact tcggcttcct gtacggcaag ctcaagccgg gcgggcggct gctcaaccac 2280

tgcatcaccc ggcccgacaa cacccagccg gccatgaaga aggacgggtt catcaaccgg 2340

tacgtcttcc ccgacgggga gctggagggg cccggctacc tgcagaccca gatgaacgac 2400

gccggttttg agatccgcca ccaggagaac ctgcgcgagc actacgcccg caccctggcc 2460

ggatggtgcc gcaacctcga tgagcactgg gacgaggcgg tggccgaggt cggcgagggc 2520

accgcgcggg tgtggcggct gtacatggcc ggcagccggc tcggtttcga gctcaactgg 2580

atccagctgc accagatcct gggcgtcaag ctcggcgagc gcggcgagtc ccgcatgccg 2640

ttgcggcccg actggggcgt gtga 2664

<210> 98

<211> 2664

<212> DNA

<213> 弯曲嗜热单胞菌

<400> 98

atgacgctgg ccaaggtctt cgaggagctg gtcggggcgg acgcccctgt ggagctcacc 60

gcctacgacg gatcgagagc cggacgcctg ggcagtgatc tgcgggtcca cgtgaagtcg 120

ccgtacgcgg tgtcctacct ggtgcactcg ccgagcgcgc tcgggctggc ccgcgcgtac 180

gtggccgggc acctggacgc ctacggcgac atgtacacgc tgctgcggga gatgacgcag 240

ctgaccgagg cgctgacgcc caaggcccgg ctgcggctgc tggccggtgt cctgcaggat 300

ccgctgctgc gcgcggcggc cagccgccgt ctgccgcccc cgccgcagga ggtgcggacc 360

ggccgcacct cctggttccg gcacaccaag cggcgggacg ccaaggccat ctcccaccac 420

tacgacgtgt ccaacacctt ctatgagtgg gtgctgggcc cgtcgatgac ctacacctgc 480

gcctgtttcc ccaccgagga cgccaccttg gaggaggcgc agttccacaa gcacgacctg 540

gtcgccaaga agctcgggct gcggccgggc atgcggctgc tggacgtggg ctgcggctgg 600

ggcggcatgg tgatgcacgc cgccaagcac tacggggtgc gggcgctggg cgtcacgctg 660

tccaagcagc aggccgagtg ggcgcagaag gccatcgccg aggcgggcct gagcgacctg 720

gccgaggtcc gccaccagga ctaccgggac gtcaccgagg gcgacttcga cgccatcagc 780

tcgatcggcc tcaccgagca catcggcaag gccaacctgc cgtcctactt cggcttcctg 840

tacggcaagc tcaagccggg cgggcggctg ctcaaccact gcatcacccg gcccgacaac 900

acccagccgg ccatgaagaa ggacgggttc atcaaccggt acgtcttccc cgacggggag 960

ctggaggggc ccggctacct gcagacccag atgaacgacg ccggttttga gatccgccac 1020

caggagaacc tgcgcgagca ctacgcccgc accctggccg gatggtgccg caacctcgat 1080

gagcactggg acgaggcggt ggccgaggtc ggcgagggca ccgcgcgggt gtggcggctg 1140

tacatggccg gcagccggct cggtttcgag ctcaactgga tccagctgca ccagatcctg 1200

ggcgtcaagc tcggcgagcg cggcgagtcc cgcatgccgt tgcggcccga ctggggcgtg 1260

gctggtggtg ccgagggtgg caatggcggt ggcgccatgt cacagctggc ggtcacagac 1320

caccacgagc gagcggtcga ggcgctgcgc aggtcgtatg cggcgatccc gccgggcaca 1380

ccggtccgct tggccaagca gacctccaac ctgttccgct tccgcgagcc gacggccgcg 1440

cccggcctgg acgtgtccgg cttcaaccgg gtgctggcgg tggacccgga tgcgcgcacc 1500

gccgacgtgc agggcatgac cacctacgag gacctggtcg acgccaccct gccgcacggg 1560

ctgatgccgc tggtggtgcc ccagctcaag acgatcacgc tgggcggggc ggtgaccggc 1620

ctgggcatcg agtccacctc cttccgcaac ggcctgccgc acgagtcggt gctggagatg 1680

cagatcatca ccggcgccgg cgaagtggtc accgccaccc cggacgggga gcactccgac 1740

ctgttctggg gcttccccaa ctcctacggg acgctggggt acgccctgaa gctgaagatc 1800

gaactggagc cggtcaagcc gtacgtccgg ctgcggcacc tgcgcttcga cgacgccggc 1860

gagtgcgccg ccaagctcgc cgagctgagc gaaagccgcg agcacgaggg cgatgaggtg 1920

cactttttgg acggcacctt cttcgggccg cgcgagatgt acctgacgct cggcacgttc 1980

accgacaccg ccccctatgt gtcggactac accgggcagc acatctacta ccggtcgatc 2040

cagcagcggt cgatcgactt tttgaccatc cgcgactacc tgtggcgctg ggacaccgac 2100

tggttctggt gctcgcgcgc cctgggcgtg cagaacccgc tgatccggcg ggtgtggccg 2160

aagagcgcca agcggtcgga tgtgtaccgc aagctggtgg cctacgaaaa gcgctaccag 2220

ttcaaggcgc gcatcgaccg gtggacgggc aagccgccgc gcgaggacgt catccaggac 2280

atcgaggtgc cggcagaacg cctgccggag ttcctggagt tcttccacga caagatcggg 2340

atgagcccgg tgtggctgtg cccgctgcgg gcgcgccacc gctggccgct gtacccgctc 2400

aagcccggcg tcacctacgt caacgccggc ttctggggga cggtgccgct gcagccgggg 2460

cagatgcccg agtaccacaa ccggctgatc gaacggaagg tcgcccaact ggacggccac 2520

aagtctctgt actcgacggc gttctactcg cgtgaggagt tctggcggca ctacgacggg 2580

gaaacctacc ggcgtctgaa ggacacctac gaccccgacg cgcgcctgct cgacctctac 2640

gacaagtgcg tgcggggacg ctga 2664

Claims

1.一种细胞，其包括重组甲基转移酶基因和支化(甲基)脂质，其中：

所述支化(甲基)脂质是羧酸、羧酸酯、酯、硫酯或酰胺；并且

所述支化(甲基)脂质包括包含支化甲基的饱和或不饱和支化脂肪族链。

2.根据权利要求1所述的细胞，其中所述支化(甲基)脂质包括具有14-20个碳的链长度和在Δ9、Δ10或Δ11位置的甲基分支的线性脂质。

3.根据权利要求2所述的细胞，其中所述支化(甲基)脂质是二酰甘油、三酰甘油或磷脂，并且所述二酰甘油、三酰甘油或磷脂包括10-甲基硬脂酸酯的酯。

4.一种细胞，其包括重组甲基转移酶基因和环外亚甲基取代的脂质，其中：

所述环外亚甲基取代的脂质是羧酸、羧酸酯、酯、硫酯或酰胺；

所述环外亚甲基取代的脂质包括支化脂肪族链；并且

所述脂肪族链是支化的是因为所述脂肪族链经环外亚甲基取代。

5.根据权利要求4所述的细胞，其中所述环外亚甲基取代的脂质包括具有14-20个碳的链长度和在Δ9、Δ10或Δ11位置的亚甲基部分的线性脂质。

6.根据权利要求5所述的细胞，其中所述环外亚甲基取代的脂质是二酰甘油、三酰甘油或磷脂，并且所述二酰甘油、三酰甘油或磷脂包括10-亚甲基硬脂酸酯的酯。

7.根据权利要求1到6中任一项所述的细胞，其中所述细胞的以重量计至少约1％的脂肪酸是一种或多种具有14-20个碳的链长度和在Δ9、Δ10或Δ11位置的甲基分支的线性脂肪酸。

8.根据权利要求1到7中任一项所述的细胞，其中如通过细胞干重％所测量，所述细胞包括至少约1％脂质。

9.根据权利要求1到8中任一项所述的细胞，其中所述重组甲基转移酶基因编码来自放线菌的革兰氏阳性物种的甲基转移酶蛋白质。

10.根据权利要求9所述的细胞，其中所述放线菌的革兰氏阳性物种是分枝杆菌属(Mycobacteria)、棒杆菌属(Corynebacteria)、诺卡尔菌属(Nocardia)、链霉菌属(Streptomyces)或红球菌属(Rhodococcus)。

11.根据权利要求1到10中任一项所述的细胞，其中所述重组甲基转移酶基因编码选自以下的甲基转移酶蛋白质：耻垢分枝杆菌(Mycobacterium smegmatis)酶tmsB、苏别蒂山农霉菌(Agromyces subbeticus)酶tmsB、浅黄拟无枝酸球菌(Amycolicicoccus subflavus)酶tmsB、谷氨酸棒状杆菌(Corynebacterium glutamicum)酶tmsB、甘氨酸棒状杆菌(Corynebacterium glyciniphilium)酶tmsB、气生诺尔氏菌(Knoella aerolata)酶tmsB、南非分枝杆菌(Mycobacterium austroafricanum)酶tmsB、淡黄分枝杆菌(Mycobacteriumgilvum)酶tmsB、普拉尼亚分枝杆菌(Mycobacterium indicus pranii)酶tmsB、草分枝杆菌(Mycobacterium phlei)酶tmsB、结核分枝杆菌(Mycobacterium tuberculosis)酶tmsB、范巴伦氏分枝杆菌(Mycobacterium vanbaalenii)酶tmsB、浑浊红球菌(Rhodococcusopacus)酶tmsB、拉格西斯链霉菌(Streptomyces regnsis)酶tmsB、嗜热子囊菌(Thermobifida fusca)酶tmsB和弯曲嗜热单胞菌(Thermomonospora curvata)酶tmsB。

12.根据权利要求1到11中任一项所述的细胞，其进一步包括重组还原酶基因。

13.根据权利要求12所述的细胞，其中所述重组还原酶基因编码选自以下的还原酶蛋白质：耻垢分枝杆菌酶tmsA、苏别蒂山农霉菌酶tmsA、浅黄拟无枝酸球菌酶tmsA、谷氨酸棒状杆菌酶tmsA、甘氨酸棒状杆菌酶tmsA、气生诺尔氏菌酶tmsA、南非分枝杆菌酶tmsA、淡黄分枝杆菌酶tmsA、普拉尼亚分枝杆菌酶tmsA、草分枝杆菌酶tmsA、结核分枝杆菌酶tmsA、范巴伦氏分枝杆菌酶tmsA、浑浊红球菌酶tmsA、拉格西斯链霉菌酶tmsA、嗜热子囊菌酶tmsA和弯曲嗜热单胞菌酶tmsA。

14.根据权利要求1到13中任一项所述的细胞，其中：

所述重组甲基转移酶基因针对所述细胞经密码子优化；或

所述细胞进一步包括重组还原酶基因并且所述重组还原酶基因针对所述细胞经密码子优化。

15.根据权利要求1到14中任一项所述的细胞，其中：

所述重组甲基转移酶基因操作性连接到能在所述细胞中驱动所述重组甲基转移酶基因转录的启动子；或

所述细胞进一步包括重组还原酶基因并且所述重组还原酶基因操作性连接到能在所述细胞中驱动所述重组还原酶基因转录的启动子。

16.根据权利要求15所述的细胞，其中：

所述细胞是酵母物种并且所述启动子是酵母启动子；

所述细胞是细菌物种并且所述启动子是细菌启动子；

所述细胞是藻类物种并且所述启动子是藻类启动子；或

所述细胞是植物物种并且所述启动子是植物启动子。

17.根据权利要求15或16所述的细胞，其中所述启动子是组成型启动子。

18.根据权利要求1到17中任一项所述的细胞，其中所述细胞选自由藻类、细菌、霉菌、真菌、植物和酵母组成的组。

19.根据权利要求18所述的细胞，其中所述细胞是酵母、真菌或酵母样藻类。

20.根据权利要求19所述的细胞，其中所述细胞选自由以下组成的组：阿氏酵母属(Arxula)、曲霉属(Aspegillus)、橙壶菌属(Aurantiochytrium)、念珠菌属(Candida)、麦角菌属(Claviceps)、隐球菌属(Cryptococcus)、小克银汉霉属(Cunninghamella)、地丝菌属(Geotrichum)、汉逊酵母属(Hansenula)、克鲁维酵母属(Kluyveromyces)、柯达酵母属(Kodamaea)、白冬孢酵母属(Leucosporidiella)、油脂酵母属(Lipomyces)、被孢霉属(Mortierella)、欧格酵母属(Ogataea)、毕赤酵母属(Pichia)、原壁菌属(Prototheca)、根霉菌属(Rhizopus)、红冬孢酵母属(Rhodosporidium)、红酵母属(Rhodotorula)、酵母菌属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)、银耳属(Tremella)、毛孢子菌属(Trichosporon)、威克汉姆酵母属(Wickerhamomyces)和耶氏酵母属(Yarrowia)。

21.根据权利要求20所述的细胞，其中所述细胞选自由以下组成的组：腺嘌呤阿氏酵母(Arxula adeninivorans)、黑曲霉菌(Aspergillus niger)、米曲霉菌(Aspergillusorzyae)、土曲霉菌(Aspergillus terreus)、裂殖壶菌(Aurantiochytrium limacinum)、产朊假丝酵母(Candida utilis)、紫麦角菌(Claviceps purpurea)、浅白隐球菌(Cryptococcus albidus)、弯曲隐球菌(Cryptococcus curvatus)、拉米隐球菌(Cryptococcus ramirezgomezianus)、土生隐球菌(Cryptococcus terreus)、威氏隐球菌(Cryptococcus wieringae)、刺孢小克银汉霉(Cunninghamella echinulata)、山茶小克银汉霉(Cunninghamella japonica)、发酵地霉酵母(Geotrichum fermentans)、多形汉逊酵母(Hansenula polymorpha)、乳酸克鲁维酵母(Kluyveromyces lactis)、马克斯克鲁维酵母(Kluyveromyces marxianus)、奥默柯达酵母(Kodamaea ohmeri)、克雷氏白冬孢酵母(Leucosporidiella creatinivora)、产油油脂酵母(Lipomyces lipofer)、斯达油脂酵母(Lipomyces starkeyi)、子囊菌油脂酵母(Lipomyces tetrasporus)、深黄被孢霉(Mortierella isabellina)、高山被孢霉(Mortierella alpina)、多形欧格酵母(Ogataeapolymorpha)、西弗毕赤酵母(Pichia ciferrii)、季也蒙毕赤酵母(Pichiaguilliermondii)、巴斯德毕赤酵母(Pichia pastoris)、树干毕赤酵母(Pichiastipites)、饶氏原壁菌(Prototheca zopfii)、少根根霉(Rhizopus arrhizus)、贝吉维红冬孢酵母(Rhodosporidium babjevae)、圆红冬孢酵母(Rhodosporidium toruloides)、沼泽生红冬孢酵母(Rhodosporidium paludigenum)、黏红酵母(Rhodotorula glutinis)、胶红酵母(Rhodotorula mucilaginosa)、酿酒酵母(Saccharomyces cerevisiae)、粟酒裂殖酵母(Schizosaccharomyces pombe)、恩氏银耳(Tremella enchepala)、皮肤毛孢子菌(Trichosporon cutaneum)、发酵性丝孢酵母(Trichosporon fermentans)、威克汉姆西弗酵母(Wickerhamomyces ciferrii)和解脂耶氏酵母(Yarrowia lipolytica)。

22.根据权利要求21所述的细胞，其中所述细胞选自由以下组成的组：腺嘌呤阿氏酵母、酿酒酵母和解脂耶氏酵母。

23.根据权利要求1到22中任一项所述的细胞，其中所述细胞包括由所述重组甲基转移酶基因编码的甲基转移酶蛋白质，并且所述甲基转移酶蛋白质包括以下两者中的任一项：

与SEQ ID NO:4、SEQ ID NO:8、SEQ ID NO:12、SEQ ID NO:16、SEQ ID NO:20、SEQ IDNO:26、SEQ ID NO:30、SEQ ID NO:36、SEQ ID NO:42、SEQ ID NO:46、SEQ ID NO:50、SEQ IDNO:54、SEQ ID NO:60、SEQ ID NO:64、SEQ ID NO:70或SEQ ID NO:76中所示氨基酸序列具有至少约95％序列同一性的氨基酸序列；或

SEQ ID NO:4、SEQ ID NO:8、SEQ ID NO:12、SEQ ID NO:16、SEQ ID NO:20、SEQ ID NO:26、SEQ ID NO:30、SEQ ID NO:36、SEQ ID NO:42、SEQ ID NO:46、SEQ ID NO:50、SEQ IDNO:54、SEQ ID NO:60、SEQ ID NO:64、SEQ ID NO:70或SEQ ID NO:76中所示的氨基酸序列。

24.根据权利要求1到23中任一项所述的细胞，其中所述重组甲基转移酶基因包括以下两者中的任一项：

与SEQ ID NO:3、SEQ ID NO:7、SEQ ID NO:11、SEQ ID NO:15、SEQ ID NO:19、SEQ IDNO:25、SEQ ID NO:29、SEQ ID NO:35、SEQ ID NO:41、SEQ ID NO:45、SEQ ID NO:49、SEQ IDNO:53、SEQ ID NO:59、SEQ ID NO:63、SEQ ID NO:69、SEQ ID NO:75或SEQ ID NO:81中所示核苷酸序列具有至少约95％序列同一性的核苷酸序列；或

SEQ ID NO:3、SEQ ID NO:7、SEQ ID NO:11、SEQ ID NO:15、SEQ ID NO:19、SEQ ID NO:25、SEQ ID NO:29、SEQ ID NO:35、SEQ ID NO:41、SEQ ID NO:45、SEQ ID NO:49、SEQ IDNO:53、SEQ ID NO:59、SEQ ID NO:63、SEQ ID NO:69、SEQ ID NO:75或SEQ ID NO:81中所示的核苷酸序列。

25.根据权利要求1到24中任一项所述的细胞，其中所述细胞包括由重组还原酶基因编码的还原酶蛋白质，并且所述还原酶蛋白质包括以下两者中的任一项：

与SEQ ID NO:2、SEQ ID NO:6、SEQ ID NO:10、SEQ ID NO:14、SEQ ID NO:18、SEQ IDNO:24、SEQ ID NO:28、SEQ ID NO:34、SEQ ID NO:40、SEQ ID NO:44、SEQ ID NO:48、SEQ IDNO:52、SEQ ID NO:58、SEQ ID NO:62、SEQ ID NO:68或SEQ ID NO:74中所示氨基酸序列具有至少约95％序列同一性的氨基酸序列；或

SEQ ID NO:2、SEQ ID NO:6、SEQ ID NO:10、SEQ ID NO:14、SEQ ID NO:18、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NO:34、SEQ ID NO:40、SEQ ID NO:44、SEQ ID NO:48、SEQ IDNO:52、SEQ ID NO:58、SEQ ID NO:62、SEQ ID NO:68或SEQ ID NO:74中所示的序列。

26.根据权利要求1到25中任一项所述的细胞，其中所述细胞包括重组还原酶基因，并且所述重组还原酶基因包括以下两者中的任一项：

与SEQ ID NO:1、SEQ ID NO:5、SEQ ID NO:9、SEQ ID NO:13、SEQ ID NO:17、SEQ IDNO:23、SEQ ID NO:27、SEQ ID NO:33、SEQ ID NO:39、SEQ ID NO:43、SEQ ID NO:47、SEQ IDNO:51、SEQ ID NO:57、SEQ ID NO:61、SEQ ID NO:67、SEQ ID NO:73或SEQ ID NO:80中所示核苷酸序列具有至少约95％序列同一性的核苷酸序列；或

SEQ ID NO:1、SEQ ID NO:5、SEQ ID NO:9、SEQ ID NO:13、SEQ ID NO:17、SEQ ID NO:23、SEQ ID NO:27、SEQ ID NO:33、SEQ ID NO:39、SEQ ID NO:43、SEQ ID NO:47、SEQ IDNO:51、SEQ ID NO:57、SEQ ID NO:61、SEQ ID NO:67、SEQ ID NO:73或SEQ ID NO:80中所示的核苷酸序列。

27.根据权利要求1到26中任一项所述的细胞，其中与所述细胞为相同物种的未经修饰的细胞不包括所述支化(甲基)脂质或环外亚甲基取代的脂质。

28.根据权利要求1到27中任一项所述的细胞，其中所述细胞组成型表达由所述重组甲基转移酶基因编码的蛋白质。

29.一种产生支化(甲基)脂质或环外亚甲基取代的脂质的方法，其包括使根据权利要求1到28中任一项所述的细胞与油酸、甲硫氨酸或油酸和甲硫氨酸二者接触。

30.一种核酸，其包括重组甲基转移酶基因和操作性连接到所述重组甲基转移酶基因的组成型启动子，其中所述启动子是真核启动子，并且所述重组甲基转移酶基因编码以下两者中的任一项：

31.根据权利要求30所述的核酸，其中：

所述重组甲基转移酶基因编码来自放线菌的革兰氏阳性物种的蛋白质；并且

所述重组甲基转移酶基因针对在酵母、藻类或植物中的表达经密码子优化。

32.根据权利要求30或31所述的核酸，其进一步包括重组还原酶基因，其中所述重组还原酶基因编码以下两者中的任一项：

33.一种核酸，其包括重组还原酶基因和操作性连接到所述重组还原酶基因的组成型启动子，其中所述启动子是真核启动子，并且所述重组还原酶基因编码以下两者中的任一项：

34.根据权利要求33所述的核酸，其中：

所述重组还原酶基因编码来自放线菌的革兰氏阳性物种的蛋白质；并且

所述重组还原酶基因针对在酵母、藻类或植物中的表达经密码子优化。

35.根据权利要求33或34所述的核酸，其进一步包括重组甲基转移酶基因，其中所述重组甲基转移酶基因编码以下两者中的任一项：

36.根据权利要求35所述的核酸，其中：

37.根据权利要求35或36所述的核酸，其中所述重组甲基转移酶基因和所述重组还原酶基因是编码融合蛋白质的单一开放阅读框的一部分。

38.根据权利要求25所述的细胞，其中所述还原酶蛋白质和所述甲基转移酶蛋白质是单一融合蛋白质的一部分。

39.根据权利要求26所述的细胞，其中所述重组还原酶基因和所述重组甲基转移酶基因是编码融合蛋白质的单一开放阅读框的一部分。

40.一种油组合物，其是通过培养包括根据权利要求1到28中任一项所述的细胞的细胞培养物和从所述细胞培养物回收所述油组合物来产生的。

41.根据权利要求40所述的油组合物，其包含具有14-20个碳的链长度和在Δ9、Δ10或Δ11位置的甲基分支的一种或多种脂肪酸。

42.根据权利要求41所述的油组合物，其中所述一种或多种脂肪酸占所述油组合物中总脂肪酸的重量的至少1％。

43.根据权利要求46或47所述的油组合物，其中所述一种或多种脂肪酸占所述组合物中总脂肪酸的重量的至少约15％。

44.一种油组合物，其是通过培养细胞培养物和从所述细胞培养物回收所述油组合物来产生，其中所述油组合物包含10-甲基脂肪酸，并且其中所述10-甲基脂肪酸占所述油组合物中总脂肪酸的重量的至少约1％。

45.根据权利要求49所述的油组合物，其中所述10-甲基脂肪酸占所述油组合物中总脂肪酸的重量的至少约15％。

46.根据权利要求44所述的油组合物，其中所述细胞培养物包括根据权利要求1到28中任一项所述的细胞。

47.一种产生油组合物的方法，所述方法包括：

培养包括根据权利要求1到28中任一项所述的细胞的细胞培养物；

从所述细胞培养物回收所述油组合物。

48.根据权利要求47所述的方法，其进一步包括使所述细胞培养物与油酸、甲硫氨酸或油酸和甲硫氨酸二者接触。

49.根据权利要求47或48所述的方法，其中从所述细胞培养物回收所述油组合物包括回收已由所述细胞分泌的脂质。