CN109996874A - 10-甲基硬脂酸的异源性产生 - Google Patents

10-甲基硬脂酸的异源性产生 Download PDF

Info

Publication number
CN109996874A
CN109996874A CN201780071492.5A CN201780071492A CN109996874A CN 109996874 A CN109996874 A CN 109996874A CN 201780071492 A CN201780071492 A CN 201780071492A CN 109996874 A CN109996874 A CN 109996874A
Authority
CN
China
Prior art keywords
seq
cell
gene
recombination
enzyme
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201780071492.5A
Other languages
English (en)
Inventor
A·J·肖
H·布里特不劳
D·V·克拉柏翠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ginkgo Bioworks Inc
Original Assignee
Novogy Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Novogy Inc filed Critical Novogy Inc
Publication of CN109996874A publication Critical patent/CN109996874A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/64Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
    • C12P7/6409Fatty acids
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23DEDIBLE OILS OR FATS, e.g. MARGARINES, SHORTENINGS, COOKING OILS
    • A23D9/00Other edible oils or fats, e.g. shortenings, cooking oils
    • A23D9/02Other edible oils or fats, e.g. shortenings, cooking oils characterised by the production or working-up
    • CCHEMISTRY; METALLURGY
    • C11ANIMAL OR VEGETABLE OILS, FATS, FATTY SUBSTANCES OR WAXES; FATTY ACIDS THEREFROM; DETERGENTS; CANDLES
    • C11BPRODUCING, e.g. BY PRESSING RAW MATERIALS OR BY EXTRACTION FROM WASTE MATERIALS, REFINING OR PRESERVING FATS, FATTY SUBSTANCES, e.g. LANOLIN, FATTY OILS OR WAXES; ESSENTIAL OILS; PERFUMES
    • C11B1/00Production of fats or fatty oils from raw materials
    • C11B1/10Production of fats or fatty oils from raw materials by extracting
    • CCHEMISTRY; METALLURGY
    • C11ANIMAL OR VEGETABLE OILS, FATS, FATTY SUBSTANCES OR WAXES; FATTY ACIDS THEREFROM; DETERGENTS; CANDLES
    • C11CFATTY ACIDS FROM FATS, OILS OR WAXES; CANDLES; FATS, OILS OR FATTY ACIDS BY CHEMICAL MODIFICATION OF FATS, OILS, OR FATTY ACIDS OBTAINED THEREFROM
    • C11C3/00Fats, oils, or fatty acids by chemical modification of fats, oils, or fatty acids obtained therefrom
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/001Oxidoreductases (1.) acting on the CH-CH group of donors (1.3)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1003Transferases (2.) transferring one-carbon groups (2.1)
    • C12N9/1007Methyltransferases (general) (2.1.1.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/686Polymerase chain reaction [PCR]

Abstract

本发明公开包括甲基转移酶基因和/或还原酶基因的核酸和细胞。这些核酸和细胞可用于产生支化(甲基)脂质,例如10‑甲基硬脂酸酯。

Description

10-甲基硬脂酸的异源性产生
相关申请的交叉引用
本申请要求对2016年9月20日提交的美国临时专利申请序列第62/396,870号的优先权,所述临时申请以引用方式整体并入本文。
背景技术
衍生自农业植物油和动物油的脂肪酸可用作工业润滑剂、液压液、油脂和其他专用流体以及加工用油化学原料。这些脂肪酸的物理和化学性质的大部分源自其碳链长度和不饱和双键数。脂肪酸通常为16:0(16个碳,0个双键)、16:1(16个碳,1个双键)、18:0、18:1、18:2或18:3。重要的是,无双键(饱和)脂肪酸具有高氧化稳定性,但其在低温下固化。双键提高低温流动性,但降低氧化稳定性。这种折衷对润滑剂和其他专用流体制剂造成困难,因为需要在宽范围操作温度下的一致性长期性能(高氧化稳定性)。高18:1(油酸)脂肪酸油提供低温流动性和相对良好的氧化稳定性。因此,已研发具有高油酸组成的若干种商品,例如高油酸大豆油、高油酸葵花油和高油酸藻油。但油酸是烯烃,并且易发生氧化降解。
发明内容
本文所述的核酸、细胞和方法通常可用于产生支化(甲基)脂质,例如10-甲基硬脂酸,以及包括所述脂质的组合物。如10-甲基硬脂酸的饱和支化(甲基)脂质具有有利的低温流动性和有利的氧化稳定性,这是润滑剂和专用流体所需的性质。
各个方面涉及核酸,包括编码甲基转移酶蛋白质的重组tmsB基因、编码还原酶蛋白质的重组tmsA基因和/或编码tmsC蛋白质的重组tmsC基因。甲基转移酶蛋白质、还原酶蛋白质和/或tmsC蛋白质可以是由放线菌(Actinobacteria)物种表达的蛋白质,并且重组tmsB基因、重组tmsA基因和/或重组tmsC基因可进行密码子优化以用于在不同细菌门(例如,变形菌门(Proteobacterium))中或在真核生物(例如,酵母,例如腺嘌呤阿氏酵母(Arxula adeninivorans)(也称作腺嘌呤芽生葡萄孢酵母(Blastobotrys adeninivorans)或腺嘌呤毛孢子菌(Trichosporon adeninivorans))、酿酒酵母(Saccharomycescerevisiae)或解脂耶氏酵母(Yarrowia lipolytica))中的表达。重组tmsB基因、重组tmsA基因或重组tmsC基因可以可操作连接到能驱动在除了放线菌(例如,变形菌门)以外的细菌门中或在真核生物(例如,酵母)中表达的启动子。核酸可以是质粒或染色体。
一些方面涉及包括如本文所述核酸的细胞。细胞可包括支化(甲基)脂质,例如10-甲基硬脂酸;和/或环外亚甲基取代的脂质,例如10-亚甲基硬脂酸。细胞可以是真核细胞,例如藻类细胞、酵母细胞或植物细胞。
一些方面涉及通过培养包括如本文所述细胞的细胞培养物来产生的组合物。油组合物可包含支化(甲基)脂质,例如10-甲基硬脂酸;和/或环外亚甲基取代的脂质,例如10-亚甲基硬脂酸。
附图说明
图1描绘油酸转化为10-甲基硬脂酸的一种可能机制。油酸底物可作为甘油脂或磷脂的酰基链存在。捐献甲基的甲硫氨酸底物可作为S-腺苷甲硫氨酸存在。油酸和甲硫氨酸底物可转化为10-亚甲基硬脂酸(例如,作为甘油脂或磷脂的酰基链存在)和高半胱氨酸(例如,作为S-腺苷高半胱氨酸存在)。该反应可由如本文所述的tmsB蛋白质催化,见下文。10-亚甲基硬脂酸(例如,作为甘油脂或磷脂的酰基链存在)可还原为10-甲基硬脂酸。该反应可由如本文所述的tmsA蛋白质催化,见下文,例如使用NADPH作为还原剂。但说明书和权利要求书的语言并不限于任何特定反应机制。
图2描绘油酸转化为10-甲基硬脂酸的一种可能机制。作为羧酸存于胞质溶胶中的油酸可添加到单酰甘油-3-磷酸酯以形成包括油酸酰基的二酰甘油-3-磷酸酯。“10-甲基合酶”可将包括油酸酰基的二酰甘油-3-磷酸酯转化为包括10-甲基硬脂酸酰基的二酰甘油-3-磷酸酯。二酰基-3-磷酸酯可随后转化为三酰甘油,转化为另一磷脂,例如磷脂酰胆碱,或转化回单酰甘油-3-磷酸酯(例如,由此将游离的10-甲基硬脂酸根释放到胞质溶胶中)。但说明书和权利要求书的语言并不限于任何特定反应机制。
图3描绘来自16个不同细菌物种的编码催化甲基转移到烷基链的酶的原核操纵子,标记为A-P。tmsA和tmsB基因对于甲基化烷基链特别重要。tmsC基因对于甲基化烷基链也可很重要。这些基因的核苷酸序列和其所编码的氨基酸序列显示于SEQ ID NO:1-76中。
图4是质粒pNC704的图谱,其可用于在大肠杆菌(E.coli)中表达耻垢分枝杆菌(Mycobacterium smegmatis)基因tmsA(SEQ ID NO:1)和tmsB(SEQ ID NO:3)。质粒pNC738的核苷酸序列显示于SEQ ID NO:77中。
图5是质粒pNC738的图谱,其可用于在酵母(例如腺嘌呤阿氏酵母、酿酒酵母和解脂耶氏酵母)中表达耻垢分枝杆菌基因tmsA(SEQ ID NO:80)和tmsB(SEQ ID NO:81)的密码子优化形式。质粒pNC738的核苷酸序列显示于SEQ ID NO:78中。
图6是质粒BS-10MS_ER的图谱,其可用于在酵母(例如腺嘌呤阿氏酵母、酿酒酵母和解脂耶氏酵母)中表达耻垢分枝杆菌基因tmsA(SEQ ID NO:80)和tmsB(SEQ ID NO:81)的密码子优化形式。质粒BS-10MS_ER的核苷酸序列显示于SEQ ID NO:79中。
图7A和7B由多种脂肪酸标准品和从多个样品提取的脂质的重叠的气相色谱(GC)迹线组成。标准品为硬脂酸、10-甲基硬脂酸和油酸。在分析前将每一样品和标准品转酯化为脂肪酸甲基酯(FAME)。图7A描绘从表达来自耻垢分枝杆菌的tmsA和tmsB基因的大肠杆菌制备的FAME的GC迹线以及每一标准品的GC迹线。tmsA/tmsB样品显示在约10.777分钟的峰,对应于10-甲基硬脂酸标准品。图7B描绘图7A的每个迹线和两个额外迹线。第一额外迹线对应于从表达来自结核分枝杆菌(Mycobacterium tuberculosis)的ufa基因的大肠杆菌制备的FAME。该样品显示在约10.777分钟的峰,对应于10-甲基硬脂酸标准品。第二额外迹线对应于从已经空载体转染的大肠杆菌制备的FAME。该对照不显示在10.777分钟的峰,表明在经转化大肠杆菌中tmsA和tmsB基因合成10-甲基硬脂酸。
图8A和8B描绘GC-MS结果。图8A是从GC柱洗脱的脂质的气相色谱(GC)迹线。脂质是从已经编码耻垢分枝杆菌基因tmsA和tmsB的pNC704转染的大肠杆菌纯化,并且脂质转化为脂肪酸甲基酯。图8B是20.388到20.447分钟的A组在GC运行期间洗脱的脂质的质谱图。针对具有312的分子量的10-甲基硬脂酸脂肪酸甲基酯对质谱图进行选通。光谱还显示在313m/z的峰,对应于包括天然丰度同位素(例如,单一13C)的10-甲基硬脂酸甲基酯。
图9A-9D描绘以下载体的图谱,所述载体可用于表达所指示物种的tmsA和tmsB基因:pNC721(范巴伦氏分枝杆菌(Mycobacterium vanbaaleni))(SEQ ID NO:83)、pNC755(浅黄拟无枝酸球菌(Amycolicicoccus subflavus))(SEQ ID NO:84)、pNC757(甘氨酸棒状杆菌(Corynebacterium glyciniphilum))(SEQ ID NO:85)、pNC 904(浑浊红球菌(Rhodococcus opacus))(SEQ ID NO:86)、pNC905(嗜热子囊菌(Thermobifida fusca))(SEQ ID NO:87)、pNC906(弯曲嗜热单胞菌(Thermomonospora curvata))(SEQ ID NO:88)、pNC907(谷氨酸棒状杆菌(Corynebacterium glutamicum))(SEQ ID NO:89)、pNC908(苏别蒂山农霉菌(Agromycies subbeticus))(SEQ ID NO:90)、pNC910(淡黄分枝杆菌(Mycobacterium gilvum))(SEQ ID NO:91)、pNC911(紫檀分枝杆菌(Mycobacteriumsp.indicus))(SEQ ID NO:92)。
图10描绘以下载体的图谱:pNC985(SEQ ID NO:93),其可用于在红球菌属(Rhodococcus)细菌中表达耻垢分枝杆菌tmsAB基因,和pNC986(SEQ ID NO:94),其可用于在红球菌属细菌中表达嗜热子囊菌tmsAB基因。
图11描绘以下载体的图谱:pNC963(SEQ ID NO:95),其编码在组成型tac启动子控制下的弯曲嗜热单胞菌tmsB基因,和pNC964(SEQ ID NO:96),其编码在组成型tac启动子控制下的弯曲嗜热单胞菌tmsA基因。
图12是显示表达来自多种生物体的tmsB基因的解脂假丝酵母中的10-亚甲基硬脂酸的气相色谱检测的图表。
图13是显示在含有编码弯曲嗜热单胞菌tmsB的质粒的腺嘌呤阿氏酵母的8种转化体中,10-亚甲基脂肪酸与总脂肪酸相比的百分比的图表。最右侧的两种分离物经空载体对照转化。
图14是显示在含有弯曲嗜热单胞菌tmsB基因的稳定整合拷贝,并且经表达来自谷氨酸棒状杆菌(C.gl.)、弯曲嗜热单胞菌(T.cu.)或嗜热子囊菌(T.fu.)的tmsA的质粒或空载体对照(最右侧的两种转化体)转化的解脂耶氏酵母中,10-亚甲基脂肪酸和10-甲基脂肪酸的重量百分比的图表。
图15是显示在经空载体(-)或编码弯曲嗜热单胞菌tmsA(T.cu.tmsA)、弯曲嗜热单胞菌tmsB(T.cu.tmsB)或弯曲嗜热单胞菌tmsA和tmsB二者(T.cu.tmsA+tmsB)的载体转化的酿酒酵母的转化体中,10-亚甲基脂肪酸和10-甲基脂肪酸与总脂肪酸相比的重量百分比的图表。
图16是显示在含有tmsA-B融合蛋白质、tmsB-A融合蛋白质或空载体(-)的酿酒酵母的转化体中,10-亚甲基脂肪酸和10-甲基脂肪酸与总脂肪酸相比的重量百分比的图表。
图17是显示在含有tmsA-B融合蛋白质、tmsB-A融合蛋白质或空载体(-)的解脂假丝酵母的转化体中,10-亚甲基脂肪酸和10-甲基脂肪酸与总脂肪酸相比的重量百分比的图表。
图18是显示在含有tmsA-B融合蛋白质或空载体(-)的腺嘌呤阿氏酵母的转化体中,10-亚甲基脂肪酸和10-甲基脂肪酸与总脂肪酸相比的重量百分比的图表。
图19A-19D显示对以下序列的CLUSTAL OMEGA比对:由来自耻垢分枝杆菌(SEQ IDNO:4)、范巴伦氏分枝杆菌(SEQ ID NO:54)、浅黄拟无枝酸球菌(SEQ ID NO:12)、甘氨酸棒状杆菌(SEQ ID NO:20)、谷氨酸棒状杆菌(SEQ ID NO:16)、浑浊红球菌(SEQ ID NO:60)、苏别蒂山农霉菌(SEQ ID NO:8)、气生诺尔氏菌(Knoellia aerolata)(SEQ ID NO:26)、淡黄分枝杆菌(SEQ ID NO:36)、紫檀分枝杆菌(SEQ ID NO:42)、嗜热子囊菌(SEQ ID NO:70)和弯曲嗜热单胞菌(SEQ ID NO:76)的tmsB基因编码的tmsB蛋白质序列,以及来自大肠杆菌(Escherichia coli)的环丙烷脂肪酸合酶(Cfa)酶。
图20A-20E显示对以下序列的CLUSTAL OMEGA比对:由来自耻垢分枝杆菌(SEQ IDNO:2)、范巴伦氏分枝杆菌(SEQ ID NO:52)、浅黄拟无枝酸球菌(SEQ ID NO:10)、甘氨酸棒状杆菌(SEQ ID NO:18)、谷氨酸棒状杆菌(SEQ ID NO:14)、浑浊红球菌(SEQ ID NO:58)、苏别蒂山农霉菌(SEQ ID NO:6)、气生诺尔氏菌(SEQ ID NO:24)、淡黄分枝杆菌(SEQ ID NO:34)、紫檀分枝杆菌(SEQ ID NO:40)、嗜热子囊菌(SEQ ID NO:68)和弯曲嗜热单胞菌(SEQID NO:74)的tmsA基因编码的tmsA蛋白质序列,以及来自大肠杆菌的乙醇酸氧化酶亚单位GlcD酶。
具体实施方式
定义
冠词“一(a)”和“一(an)”在本文中用于指一个或多于一个(即,至少一个)所述冠词的语法宾语。例如,“一要素”一个要素或多于一个要素。
术语“生物活性部分”是指氨基酸序列,其小于全长氨基酸序列,但展现全长序列的至少一种活性。例如,甲基转移酶的生物活性部分可是指tmsB的一个或多个结构域,其具有将油酸(例如,包括油酸酯的磷脂)和甲硫氨酸(例如,S-腺苷甲硫氨酸)转化为10-亚甲基硬脂酸(例如,包括10-亚甲基硬脂酸酯的磷脂)的生物活性。还原酶的生物活性部分可是指tmsA的一个或多个结构域,其具有将10-亚甲基硬脂酸(例如,包括10-亚甲基硬脂酸酯的磷脂)和还原剂(例如,NADH、NADPH、FAD、FADH2、FMNH2)转化为10-甲基硬脂酸(例如,包括10-甲基硬脂酸酯的磷脂)的生物活性。蛋白质的生物活性部分包括肽或多肽,其包括与所述蛋白质的氨基酸序列足够同一或衍生自所述蛋白质的氨基酸序列的氨基酸序列,例如以下序列中所示的氨基酸序列:SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74或76,其包括少于全长蛋白质的氨基酸,并展现所述蛋白质的至少一种活性,尤其是甲基转移酶或还原酶活性。蛋白质的生物活性部分可包括、包括至少或包括至多例如100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206、207、208、209、210、211、212、213、214、215、216、217、218、219、220、221、222、223、224、225、226、227、228、229、230、231、232、233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、250、251、252、253、254、255、256、257、258、259、260、261、262、263、264、265、266、267、268、269、270、271、272、273、274、275、276、277、278、279、280、281、282、283、284、285、286、287、288、289、290、291、292、293、294、295、296、297、298、299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、316、317、318、319、320、321、322、323、324、325、326、327、328、329、330、331、332、333、334、335、336、337、338、339、340、341、342、343、344、345、346、347、348、349、350、351、352、353、354、355、356、357、358、359、360、361、362、363、364、365、366、367、368、369、370、371、372、373、374、375、376、377、378、379、380、381、382、383、384、385、386、387、388、389、390、391、392、393、394、395、396、397、398、399、400、401、402、403、404、405、406、407、408、409、410、411、412、413、414、415、416、417、418、419、420、421、422、423、424、425、426、427、428、429、430、431、432、433、434、435、436、437、438、439、440、441、442、443、444、445、446、447、448、449、450、451、452、453、454、455、456、457、458、459、460、461、462、463、464、465、466、467、468、469、470、471、472、473、474、475、476、477、478、479、480、481、482、483、484、485、486、487、488、489、490、491、492、493、494、495、496、497、498、499、500或更多氨基酸,或其中可导出的任何范围。通常,生物活性部分包括结构域或基序,其具有催化活性,例如产生10-亚甲基硬脂酸或10-甲基硬脂酸的催化活性。蛋白质的生物活性部分包括与全长肽具有相同活性的蛋白质部分和具有高于背景的活性的每一部分。例如,相对于全长酶,酶的生物活性部分可具有、具有至少或具有至多0.1%、0.5%、1%、2%、3%、4%、5%、10%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%、100%、100.1%、100.2%、100.3%、100.4%、100.5%、100.6%、100.7%、100.8%、100.9%、101%、105%、110%、115%、120%、125%、130%、135%、140%、145%、150%、160%、170%、180%、190%、200%、220%、240%、260%、280%、300%、320%、340%、360%、380%、400%或更高活性(或其中可导出的任何范围)。蛋白质的生物活性部分可包括缺少将蛋白质靶向细胞隔室的结构域的蛋白质部分。
术语“密码子优化”和“针对细胞进行密码子优化”是指编码核苷酸序列(例如,基因),其已经改变以用在宿主细胞中相对普遍的同义密码子替换在所需宿主细胞中相对罕见的至少一个密码子。密码子优化由此容许通过使重组基因的密码子与宿主细胞的tRNA相匹配更好地利用宿主细胞的tRNA。例如,放线菌(原核生物)物种的密码子使用与酵母(真核生物)的密码子使用不同。编码放线菌蛋白质的mRNA在酵母宿主细胞中的翻译效率可通过用在特定酵母物种中更普遍的密码子替换相应放线菌基因的密码子来提高。密码子优化的基因由此具有与天然存在的基因不同的核苷酸序列。
术语“组成型启动子”是指独立于特定刺激(例如,独立于诸如异丙基β-D-1-硫代半乳糖吡喃糖苷等试剂的存在)介导可操作连接的基因的转录的启动子。
术语“DGAT1”是指编码1型二酰甘油酰基转移酶蛋白质的基因,例如编码酵母DGA2蛋白质的基因。
术语“DGAT2”是指编码2型二酰甘油酰基转移酶蛋白质的基因,例如编码酵母DGA1蛋白质的基因。
“二酰基甘油酯”、“二酰甘油”和“甘油二酯”是包括甘油和两个脂肪酸的酯。
术语“二酰甘油酰基转移酶”和“DGA”是指催化从二酰甘油形成三酰基甘油酯的任何蛋白质。二酰甘油酰基转移酶包括1型二酰甘油酰基转移酶(DGA2)、2型二酰甘油酰基转移酶(DGA1)和3型二酰甘油酰基转移酶(DGA3)和催化上文所提到的反应的所有同系物。
术语“二酰甘油酰基转移酶,1型”和“1型二酰甘油酰基转移酶”是指DGA2和DGA2同源体。
术语“二酰甘油酰基转移酶,2型”和“2型二酰甘油酰基转移酶”是指DGA1和DGA1同源体。
术语“结构域”是指蛋白质的氨基酸序列的一部分,其能折叠成独立于蛋白质的其余部分的稳定三维结构。
术语“药物”是指任何分子,其抑制细胞生长或增殖,由此提供针对含有赋予针对所述药物的抗性的基因的细胞的选择性优点。药物包括抗生素、抗微生物剂、毒素和杀虫剂。
“干重”和“细胞干重”意指在水的相对不存在下确定的重量。例如,提到产油细胞包括以干重计指定百分比的特定组分时意指,所述百分比是基于在移除基本上全部水后细胞的重量来计算。术语“干重%”在涉及具体脂肪酸(例如,油酸或10-甲基硬脂酸)时包括作为羧酸根、酯、硫酯和酰胺存在的脂肪酸。例如,以细胞干重%计以总脂肪酸的百分比包括10-甲基硬脂酸的细胞包括10-甲基硬脂酸、10-甲基硬脂酸根、包括10-甲基硬脂酸酯的二酰甘油的10-甲基硬脂酸根部分、包括10-甲基硬脂酸酯的三酰甘油的10-甲基硬脂酸根部分、包括10-甲基硬脂酸酯的磷脂的10-甲基硬脂酸根部分和10-甲基硬脂酸CoA的10-甲基硬脂酸根部分。术语“干重%”在涉及具体类型的脂肪酸(例如,C16脂肪酸、C18脂肪酸)时包括作为如上文所述的羧酸根、酯、硫酯和酰胺存在的脂肪酸(例如,对于10甲基硬脂酸)。
术语“编码”是指包括编码区、编码区的部分或其补体的核酸。DNA和RNA都可编码基因。DNA和RNA都可编码蛋白质。
如本文所用的术语“酶”是指可催化化学反应的蛋白质。
术语“表达”是指细胞中的核酸或氨基酸序列(例如,肽、多肽或蛋白质)的量。基因的表达增加是指该基因的转录增加。氨基酸序列、肽、多肽或蛋白质的表达增加是指编码所述氨基酸序列、肽、多肽或蛋白质的核酸的翻译增加。
如本文所用的术语“基因”可涵盖含有外显子的基因组序列,尤其是编码具体活性中所涉及的多肽序列的多核苷酸序列。所述术语进一步涵盖并非衍生自基因组序列的合成核酸。在某些实施方案中,基因缺少内含子,因为所述基因是基于cDNA和蛋白质序列的已知DNA序列来合成。在其他实施方案中,基因是合成的非天然cDNA,其中密码子已基于密码子使用针对在解脂假丝酵母或腺嘌呤阿氏酵母中的表达经优化。所述术语还可进一步包括包含上游、下游和/或内含子核苷酸序列的核酸分子。
术语“诱导型启动子”是指响应特定刺激介导可操作连接的基因的转录的启动子。
术语“整合的”是指作为细胞基因组中的插入物维持于细胞中的核酸,例如染色体中的插入物,包括质体基因组中的插入物。
“呈可操作连接”是指两个核酸序列之间,例如控制序列(通常启动子)与所连接序列(通常编码蛋白质的序列,也称为编码序列)之间的功能性连接。如果启动子可介导基因的转录,那么所述启动子与所述基因呈可操作连接。
术语“敲除突变”或“敲除”是指阻止天然基因转录并翻译为功能蛋白质的遗传修饰。
术语“核酸”是指任何长度的核苷酸的聚合形式,所述核苷酸为脱氧核糖核苷酸或核糖核苷酸或其类似物。多核苷酸可具有任何三维结构,并且可实施任何功能。以下是多核苷酸的非限制性示例:基因或基因片段的编码区或非编码区、根据连接分析确定的基因座(loci)(基因座(locus))、外显子、内含子、信使RNA(mRNA)、转移RNA、核糖体RNA、核酶、cDNA、重组多核苷酸、支化多核苷酸、质粒、载体、任何序列的经分离DNA、任何序列的经分离RNA、核酸探针和引物。多核苷酸可包括经修饰核苷酸,例如甲基化核苷酸和核苷酸类似物。如果存在,可在聚合物装配之前或之后给予对核苷酸结构的修饰。多核苷酸可进一步经修饰,例如通过与标记组分接合来修饰。在本文中提供的所有核酸序列中,U核苷酸可与T核苷酸互换。
术语“磷脂”是指包括甘油、两个脂肪酸和磷酸根的酯。磷酸根可共价连接到甘油的碳-3并且不包括进一步取代,即磷脂可以是磷脂酸。磷酸根可经以下基团取代:乙醇胺(例如,磷脂酰乙醇胺)、胆碱(例如,磷脂酰胆碱)、丝氨酸(例如,磷脂酰丝氨酸)、肌醇(例如,磷脂酰肌醇)、磷酸肌醇(例如,磷脂酰肌醇-3-磷酸、磷脂酰肌醇-4-磷酸、磷脂酰肌醇-5-磷酸)、肌醇二磷酸(例如,磷脂酰肌醇-4,5-二磷酸)或肌醇三磷酸(例如,磷脂酰肌醇-3,4,5-二磷酸)。
如本文所用,术语“质粒”是指物理上与生物体的基因组DNA分离的环状DNA分子。质粒可在引入宿主细胞中之前经线性化(在本文中称作线性化质粒)。线性化质粒可能无法自复制,但可整合到生物体的基因组DNA中并用所述基因组DNA来复制。
“启动子”是引导核酸转录的核酸控制序列。如本文所用,启动子包括在转录起始位点附近的必需核酸序列。
术语“蛋白质”是指包括氨基酸序列的分子,其中所述氨基酸通过肽键连接。
“转化”是指核酸转移到宿主生物体中或转移到宿主生物体的基因组中,得到遗传上稳定的继承性。含有经转化核酸的宿主生物体称为“重组”、“转基因”或“经转化”生物体。因此,可将本发明的核酸纳入能引入宿主细胞中并在所述宿主细胞中复制的重组构建体(通常DNA构建体)中。所述构建体可以是载体,其包括复制系统和能在给定宿主细胞中转录并翻译多肽编码序列的序列。通常,表达载体包括例如在5'和3'调节序列的转录控制下的一个或多个经克隆基因以及可选择标记物。所述载体还可含有启动子调节区(例如,控制诱导型或组成型、环境调节或发育调节、或位置特异性表达的调节区)、转录起始位点、核糖体结合位点、转录终止位点和/或多聚腺苷酸化信号。
术语“经转化细胞”是指已经历转化的细胞。因此,经转化细胞包括亲代基因组和可遗传的遗传修饰。
术语“三酰基甘油酯”、“三酰甘油”、“甘油三酯”和“TAG”是包括甘油和三个脂肪酸的酯。
微生物工程化
A.概述
基因和基因产物可引入微生物宿主细胞中。适用于表达基因和核酸分子的宿主细胞是可在真菌或细菌家族内广泛发现的微生物宿主。适宜宿主菌株的示例包括但不限于真菌或酵母物种,例如阿氏酵母属(Arxula)、曲霉菌属(Aspegillus)、橙壶菌属(Aurantiochytrium)、念珠菌属(Candida)、麦角菌属(Claviceps)、隐球菌属(Cryptococcus)、小克银霉属(Cunninghamella)、汉逊酵母属(Hansenula)、克鲁维酵母属(Kluyveromyces)、白冬孢酵母属(Leucosporidiella)、油脂酵母属(Lipomyces)、被孢霉属(Mortierella)、欧格酵母属(Ogataea)、毕赤酵母属(Pichia)、原壁菌属(Prototheca)、根霉菌属(Rhizopus)、红冬孢酵母属(Rhodosporidium)、红酵母属(Rhodotorula)、酵母菌属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)、银耳属(Tremella)、毛孢子菌属(Trichosporon)、耶氏酵母属(Yarrowia);或细菌物种,例如蛋白菌和放线菌的成员,以及以下属:不动杆菌属(Acinetobacter)、节杆菌属(Arthrobacter)、短颈细菌属(Brevibacterium)、食酸菌属(Acidovorax)、芽孢杆菌属(Bacillus)、梭菌属(Clostridia)、链霉菌属(Streptomyces)、埃希氏菌属(Escherichia)、沙门菌属(Salmonella)、假单胞菌属(Pseudomonas)和棒状杆菌属(Cornyebacterium)。解脂耶氏酵母和腺嘌呤阿氏酵母适合用作宿主微生物,因为其可将其重量的大部分积累为三酰甘油。
含有引导外来蛋白质高水准表达的调节序列的微生物表达系统和表达载体是本领域技术人员已知的。这些中的任一者可用于构建嵌合基因以产生瞬时序列的任一种基因产物。随后可通过转化技术将这些嵌合基因引入适当微生物中,以提供酶的高水准表达。
例如,可将编码酶的基因克隆于适宜质粒中,并且作为宿主的上述起始亲代菌株可经所得质粒转化。该方法可增加每一编码酶的基因的拷贝数,并且因此可增加酶的活性。质粒并不特定受限,只要其赋予可遗传给微生物后代的所需遗传修饰即可。
可用于转化适宜宿主细胞的载体或盒众所周知。通常,载体或盒含有引导相关基因转录和翻译的序列、可选择标记物以及容许自主复制或染色体整合的序列。适宜载体包括基因5'的具有转录起始控制序列的区域,以及DNA片段3'的控制转录终止的区域。在某些实施方案中,两个控制区域都衍生自与经转化宿主细胞同源的基因,但应理解,所述控制区域无需衍生自对于选择作为产生宿主的具体物种为天然的基因。
载体的启动子、cDNA和3'UTR以及其他元件可通过克隆技术使用从天然来源分离的片段生成(参见,例如,Green和Sambrook,分子克隆:实验室手册(Molecular Cloning:A Laboratory Manual),(第4版,2012);美国专利第4,683,202号(以引用方式并入))。或者,元件可使用已知方法以合成方式生成(参见,例如,Gene 164:49-53(1995))。
B.同源重组
同源重组是互补DNA序列比对并交换同源性区域的能力。将含有与所靶向基因组序列(“模板”)同源的序列的转基因DNA(“供体”)引入生物体中,并随后使其经历在相应同源基因组序列的位点重组到基因组中。
在宿主生物体中实施同源重组的能力对可在分子遗传水平上进行的过程具有多种实际影响,并且可用于生成可产生所需产物的微生物。就性质而言,同源重组是精确基因靶向事件,并且因此大多数以相同靶向序列生成的转基因系将在表型方面基本同一,使得筛选显著更少的转化事件成为必需。同源重组还靶向宿主染色体中的基因插入事件,即使在遗传选择不存在下也可能获得极佳遗传稳定性。由于不同染色体基因座将可能影响基因表达,即使来自外源启动子/UTR,同源重组可以是在不熟悉的基因组环境中询问基因座并评价这些环境因素对基因表达的影响的方法。
特别有用的使用同源重组的遗传工程化方法是增选特异性宿主调节元件,例如启动子/UTR,以用高特异性方式驱动异源基因表达。
由于同源重组是精确基因靶向事件,其可用于精确修饰所关注基因或区域内的任何核苷酸,只要已鉴别足够的侧翼区域即可。因此,同源重组可用作修饰影响RNA和/或蛋白质的基因表达的调节序列的手段。其可还可用于修饰蛋白质编码区,致力于修饰酶活性,例如底物特异性、亲和性和Km,由此影响宿主细胞代谢中的所需变化。同源重组提供操作宿主基因组的有效手段,从而实现基因靶向、基因转化、基因缺失、基因复制、基因倒位,以及交换基因表达调节元件,例如启动子、增强子和3'UTR。
同源重组可通过使用靶向构建体来实现,所述靶向构建体含有内源序列的碎片以“靶向”内源宿主细胞基因组内的所关注基因或区域。所述靶向序列可位于所关注基因或区域的5',所关注基因/区域的3',或甚至所关注基因/区域的侧翼。所述靶向构建体可作为具有额外载体主链的超螺旋质粒DNA、无载体主链的PCR产物或作为线性化分子,转化到宿主细胞中。在一些情形中,可有利地首先通过用限制性酶切割转基因DNA暴露转基因DNA(供体DNA)内的同源序列。该步骤可增加重组效率并减少不需要事件的发生率。其他增加重组效率的方法包括使用PCR生成含有与所靶向基因组序列同源的线性末端的转化转基因DNA。
C.载体和载体组分
用于根据本发明转化微生物的载体可通过本领域技术人员熟悉的已知技术根据本文公开内容来制备。载体通常含有一个或多个基因,其中每一基因编码所需产物(基因产物)的表达,并且可操作连接到一个或多个调节基因表达或将基因产物靶向到重组细胞中的特定位置的控制序列。
1.控制序列
控制序列是调节编码序列的表达或将基因产物引导到细胞内或细胞外的特定位置的核酸。调节表达的控制序列包括例如调节编码序列的转录的启动子和终止编码序列的转录的终止子。另一控制序列是位于编码序列末端的编码多聚腺苷酸化信号的3'非翻译序列。将基因产物引导到特定位置的控制序列包括编码信号肽的那些控制序列,其将其所附接的蛋白质引导到细胞内侧或外侧的特定位置。
因此,用于微生物中的基因表达的示例性载体设计含有所需基因产物(例如,可选择标记物,或酶)的编码序列,其与在酵母中具有活性的启动子可操作连接。或者,如果载体不含与所关注编码序列可操作连接的启动子,那么可将编码序列转化到细胞中,使得其在载体整合时与内源启动子可操作连接。
用于表达基因的启动子可以是天然连接到该基因的启动子或不同启动子。
启动子通常可表征为组成型或诱导型。组成型启动子通常在所有时间(或在细胞生命周期的某些时间)以相同水准具有活性或起作用以驱动表达。相反,诱导型启动子仅响应刺激而具有活性(或变得无活性)或被显著上调或下调。两种类型的启动子都可应用于本发明方法中。可用于本发明中的诱导型启动子包括那些响应刺激介导可操作连接的基因的转录的启动子,所述刺激例如外源提供的小分子、温度(热或冷)、培养基中缺少氮等。适宜启动子可激活基本上沉默的基因的转录,或上调(例如显著地)以低水准转录的可操作连接的基因的转录。
包括终止区控制序列是可选的,并且如果采用,那么所述选择主要是便利性选择,因为终止区是相对可互换的。终止区可针对转录起始区(启动子)是天然的,可针对所关注DNA序列是天然的,或可从另一来源获得(参见,例如,Chen和Orozco,Nucleic AcidsResearch 16:8411(1988))。
2.基因和密码子优化
通常,基因包括启动子、编码序列和终止控制序列。在通过重组DNA技术装配时,基因可称作表达盒并且可侧接限制性位点,以便于插入用于将重组基因引入宿主细胞中的载体中。表达盒可侧接来自基因组或其他核酸靶的DNA序列,以有利于通过同源重组将表达盒稳定整合到基因组中。或者,载体和其表达盒可保持未整合(例如,附加体),在所述情形中,载体通常包括能提供载体DNA的复制的复制原点。
存于载体上的常见基因是编码蛋白质的基因,其表达容许含有所述蛋白质的重组细胞与不表达所述蛋白质的细胞相区分。所述基因和其相应的基因产物称为可选择标记物或选择标记物。众多种可选择标记物中的任一种可用于转基因构建体中,所述转基因构建体可用于转化本发明生物体。
对于重组蛋白质的最佳表达,有益地采用产生具有待转化宿主细胞最佳使用的密码子的mRNA的编码序列。因此,转基因的适当表达可能需要,转基因的密码子使用与所述转基因在其中表达的生物体的具体密码子偏好相匹配。产生该效应的准确机制有很多,但包括可用氨基酰化tRNA池与在细胞中合成的蛋白质的适当平衡,且在满足该需求时与转基因信使RNA(mRNA)的更有效翻译相偶联。在转基因中的密码子使用未经优化时,可用tRNA池不足以容许转基因mRNA的有效翻译,导致核糖体失速和终止以及可能的转基因mRNA不稳定。基因序列的密码子优化的资源描述于Puigbo等(Nucleic Acids Research 35:W126-31(2007))中,并且密码子优化策略的基础原理描述于Angov(Biotechnology Jornal 6:650-69(2011))中。提供不同生物体的密码子使用的统计学的公共数据库是可用的,包括www.kazusa.or.jp/codon/和其他公众可用的数据库和资源。
D.转化
可通过任何适宜技术转化细胞,包括例如生物弹道学、电穿孔、玻璃珠转化和碳化硅晶须转化。本发明中可采用将转基因引入微生物中的任何便捷技术。转化可通过例如以下方法来实现:D.M.Morrison的方法(Methods in Enzymology 68:326(1979))、用氯化钙增加受体细胞对DNA的通透性的方法(Mandel和Higa,J.Molecular Biology,53:159(1970))等。
在产油酵母(例如,解脂耶氏酵母)中表达转基因的示例可发现于文献中(Bordes等,J.Microbiological Methods,70:493(2007);Chen等,Applied Microbiology&Biotechnology 48:232(1997))。在诸如大肠杆菌等细菌中表达外源基因的示例众所周知(Green和Sambrook,分子克隆:实验室手册(第4版,2012))。
用于根据本发明转化微生物的载体可通过本领域技术人员熟悉的已知技术来制备。在一个实施方案中,用于在微生物中表达基因的示例性载体设计含有与在所述微生物中具有活性的启动子可操作连接的编码酶的基因。或者,如果载体不含与所关注基因可操作连接的启动子,那么可将基因转化到细胞中,使得其在载体整合时与天然启动子可操作连接。载体还可含有编码蛋白质的第二基因。任选地,一个或两个基因之后是含有多聚腺苷酸化信号的3'非翻译序列。编码两个基因的表达盒可物理上连接于载体中或连接在单独载体上。还可使用微生物的共转化,其中同时使用不同载体分子来转化细胞(Protist 155:381-93(2004))。经转化细胞可任选地基于在缺少抗性盒的细胞不会生长的条件下在抗生素或其他可选择标记物存在下生长的能力来选择。
示例性细胞、核酸、组合物和方法
A.经转化细胞
在一些实施方案中,经转化细胞是原核细胞,例如细菌细胞。在一些实施方案中,细胞是真核细胞,例如哺乳动物细胞、酵母细胞、丝状真菌细胞、原生动物细胞、藻类细胞、禽类细胞、植物细胞或昆虫细胞。在一些实施方案中,细胞是酵母。本领域技术人员将认识到,丝状真菌的多种形式产生酵母样生长,并且本文中酵母的定义涵盖所述细胞。细胞可选自由藻类、细菌、霉菌、真菌、植物和酵母组成的组。细胞可以是酵母、真菌或酵母样藻类。细胞可选自破囊壶菌(橙壶菌属)和无叶绿素单细胞藻类(原壁菌属)。
细胞可选自由以下组成的组:阿氏酵母属、曲霉菌属、橙壶菌属、念珠菌属、麦角菌属、隐球菌属、小克银霉属、地丝菌属(Geotrichum)、汉逊酵母属、克鲁维酵母属、柯达酵母属(Kodamaea)、白冬孢酵母属、油脂酵母属、被孢霉属、欧格酵母属、毕赤酵母属、原壁菌属、根霉菌属、红冬孢酵母属、红酵母属、酵母菌属、裂殖酵母属、银耳属、毛孢子菌属、威克汉姆酵母属(Wickerhamomyces)和耶氏酵母属。明确预期,这些细胞类型中的一种或多种可从本发明的实施方案中排除。
细胞可选自由以下组成的组:腺嘌呤阿氏酵母、黑曲霉菌(Aspergillus niger)、米曲霉菌(Aspergillus orzyae)、土曲霉菌(Aspergillus terreus)、裂殖壶菌(Aurantiochytrium limacinum)、产朊假丝酵母(Candida utilis)、紫麦角菌(Clavicepspurpurea)、浅白隐球菌(Cryptococcus albidus)、弯曲隐球菌(Cryptococcus curvatus)、拉米隐球菌(Cryptococcus ramirezgomezianus)、土生隐球菌(Cryptococcus terreus)、威氏隐球菌(Cryptococcus wieringae)、刺孢小克银汉霉(Cunninghamella echinulata)、山茶小克银汉霉(Cunninghamella japonica)、发酵地霉酵母(Geotrichum fermentans)、多形汉逊酵母(Hansenula polymorpha)、乳酸克鲁维酵母(Kluyveromyces lactis)、马克斯克鲁维酵母(Kluyveromyces marxianus)、奥默柯达酵母(Kodamaea ohmeri)、克雷氏白冬孢酵母(Leucosporidiella creatinivora)、产油油脂酵母(Lipomyces lipofer)、斯达油脂酵母(Lipomyces starkeyi)、子囊菌油脂酵母(Lipomyces tetrasporus)、深黄被孢霉(Mortierella isabellina)、高山被孢霉(Mortierella alpina)、多形欧格酵母(Ogataeapolymorpha)、西弗毕赤酵母(Pichia ciferrii)、季也蒙毕赤酵母(Pichiaguilliermondii)、巴斯德毕赤酵母(Pichia pastoris)、树干毕赤酵母(Pichiastipites)、饶氏原壁菌(Prototheca zopfii)、少根根霉(Rhizopus arrhizus)、贝吉维红冬孢酵母(Rhodosporidium babjevae)、圆红冬孢酵母(Rhodosporidium toruloides)、沼泽生红冬孢酵母(Rhodosporidium paludigenum)、黏红酵母(Rhodotorula glutinis)、胶红酵母(Rhodotorula mucilaginosa)、酿酒酵母(Saccharomyces cerevisiae)、粟酒裂殖酵母(Schizosaccharomyces pombe)、恩氏银耳(Tremella enchepala)、皮肤毛孢子菌(Trichosporon cutaneum)、发酵性丝孢酵母(Trichosporon fermentans)、威克汉姆西弗酵母(Wickerhamomyces ciferrii)和解脂耶氏酵母(Yarrowia lipolytica)。明确预期,这些细胞类型中的一种或多种可从本发明的实施方案中排除。
细胞可以是酿酒酵母、解脂耶氏酵母或腺嘌呤阿氏酵母。
在某些实施方案中,如通过细胞干重%所测量,经转化细胞包括至少5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%或更多脂质,或其中可导出的任何范围。在一些实施方案中,经转化细胞包括以下作为细胞中总C16和C18脂肪酸的百分比的浓度的C18脂肪酸:至少5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%或更高,或其中可导出的任何范围。
在一些实施方案中,经转化细胞包括以下作为细胞中总C16和C18脂肪酸的百分比的浓度的油酸:至少5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%或更高,或其中可导出的任何范围。在一些实施方案中,经转化细胞包括以下作为细胞中总脂肪酸的百分比的浓度的链长度为14-20个碳并且在Δ9、Δ10或Δ11位置具有甲基分支的线性脂肪酸(例如,10-甲基硬脂酸):以重量计至少1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更高,或其中可导出的任何范围。在一些实施方案中,脂肪酸的链长度为14、15、16、17、18、19或20个碳,或其中可导出的任何范围。
细胞可经修饰以提高其油酸酯含量,其用作10-甲基硬脂酸酯合成的底物。提高油酸脂含量的遗传修饰是已知的(参见,例如,2016年6月16日公开的PCT专利申请公开第WO16/094520号,其在此以引用方式整体并入)。例如,细胞可包括Δ12去饱和酶敲低或敲除,其有利于积累油酸酯并且不利于产生亚油酸酯。细胞可包括重组Δ9去饱和酶基因,其有利于产生油酸酯并且不利于积累硬脂酸酯。重组Δ9去饱和酶基因可以是例如来自解脂假丝酵母、腺嘌呤阿氏酵母或禾柄锈菌(Puccinia graminis)的Δ9去饱和酶基因。细胞可包括重组延长酶1基因,其有利于产生油酸酯并且不利于积累棕榈酸酯和棕榈油酸酯。重组延长酶1基因可以是来自解脂假丝酵母的延长酶1基因。细胞可包括重组延长酶2基因,其有利于产生油酸酯并且不利于积累棕榈酸酯和棕榈油酸酯。重组延长酶2基因可以是来自褐鼠(R.norvegicus)的延长酶2基因。
细胞可经修饰以提高其三酰甘油含量,由此提高其10-甲基硬脂酸酯含量。提高三酰甘油含量的遗传修饰是已知的(参见,例如,2016年6月16日公开的PCT专利申请公开第WO16/094520号,其在此以引用方式整体并入)。细胞可包括重组二酰甘油酰基转移酶基因(例如,DGAT1、DGAT2或DGAT3),其有利于产生三酰甘油并且不利于积累二酰甘油。重组二酰甘油酰基转移酶基因可以是例如来自解脂假丝酵母的DGAT2(编码蛋白质DGA1)、来自紫麦角菌的DGAT1(编码蛋白质DGA2)或来自圆红冬孢酵母的DGAT2(编码蛋白质DGA1)。细胞可包括甘油-3-磷酸酯酰基转移酶基因(Sct1)敲低或敲除,根据细胞类型,其可有利于积累三酰甘油。细胞可包括重组甘油-3-磷酸酯酰基转移酶基因(Sct1),例如来自腺嘌呤阿氏酵母的Sct1基因,其可有利于积累三酰甘油。细胞可包括三酰甘油脂肪酶基因(TGL)敲低或敲除,其可有利于在细胞中积累三酰甘油。
本发明的各个方面涉及经转化细胞。经转化细胞可包括重组甲基转移酶基因(例如,tmsB基因)、重组还原酶基因(例如,tmsA基因)、环外亚甲基替换的脂质和/或支化(甲基)脂质。经转化细胞可包括tmsC基因。支化(甲基)脂质可以是羧酸(例如,10-甲基硬脂酸、10-甲基棕榈酸、12-甲基油酸、13-甲基油酸、10-甲基-十八-12-烯酸)、羧酸酯(例如,10-甲基硬脂酸盐、10-甲基棕榈酸盐、12-甲基油酸盐、13-甲基油酸盐、10-甲基-十八-12-烯酸盐)、酯(例如,二酰甘油、三酰甘油、磷脂)、硫酯(例如,10-甲基硬脂酰基CoA、10-甲基棕榈酰基CoA、12-甲基油酰基CoA、13-甲基油酰基CoA、10-甲基-十八-12-烯酰基CoA)或酰胺。环外亚甲基替换的脂质可以是羧酸(例如,10-亚甲基硬脂酸、10-亚甲基棕榈酸、12-亚甲基油酸、13-亚甲基油酸、10-亚甲基-十八-12-烯酸)、羧酸盐(例如,10-亚甲基硬脂酸盐、10-亚甲基棕榈酸盐、12-亚甲基油酸盐、13-亚甲基油酸盐、10-亚甲基-十八-12-烯酸盐)、酯(例如,二酰甘油、三酰甘油、磷脂)、硫酯(例如,10-亚甲基硬脂酰基CoA、10-亚甲基棕榈酰基CoA、12-亚甲基油酰基CoA、13-亚甲基油酰基CoA、10-亚甲基-十八-12-烯酰基CoA)或酰胺。明确预期,上述脂质中的一种或多种可从本发明的实施方案中排除。
“脂肪酸”通常作为磷脂或三酰甘油存在于细胞中,但其也可作为单酰甘油或二酰甘油存在,例如作为代谢中间产物存在。游离脂肪酸也以相对丰富的羧酸根阴离子与相对稀少的电中性酸之间的平衡存在于细胞中。在生物合成或氧化期间,脂肪酸可作为硫酯、尤其作为具有辅酶A(CoA)的硫酯存在于细胞中。例如在共价结合到蛋白质以将蛋白质锚定到膜时,脂肪酸可作为酰胺存在于细胞中。
细胞可包括本文所述的任一核酸,见下文(参见,例如,下文章节B)。
支化(甲基)脂质可包括饱和支化脂肪族链(例如,10-甲基硬脂酸、10-甲基棕榈酸)或不饱和支化脂肪族链(例如,12-甲基油酸、13-甲基油酸、10-甲基-十八-12-烯酸)。支化(甲基)脂质可包括包含支化甲基的饱和或不饱和支化脂肪族链。
环外亚甲基取代的脂质可包括支化脂肪族链(例如,10-亚甲基硬脂酸、10-亚甲基棕榈酸、12-亚甲基油酸、13-亚甲基油酸、10-亚甲基-十八-12-烯酸)。脂肪族链可因脂肪族链经环外亚甲基取代而经支化。
支化(甲基)脂质可以是10-甲基硬脂酸根,或其酸(10-甲基硬脂酸)、酯(例如,二酰甘油、三酰甘油、磷脂)、硫酯(例如,10-甲基硬脂酰基CoA)或酰胺(例如,10-甲基硬脂酰基酰胺)。例如,支化(甲基)脂质可以是二酰甘油、三酰甘油或磷脂,并且所述二酰甘油、三酰甘油或磷脂可包括10-甲基硬脂酸酯。
环外亚甲基取代的脂质可以是10-亚甲基硬脂酸根,或其酸(10-亚甲基硬脂酸)、酯(例如,二酰甘油、三酰甘油、磷脂)、硫酯(例如,10-亚甲基硬脂酰基CoA)或酰胺(例如,10-亚甲基硬脂酰基酰胺)。例如,环外亚甲基取代的脂质可以是二酰甘油、三酰甘油或磷脂,并且所述二酰甘油、三酰甘油或磷脂可包括10-亚甲基硬脂酸酯。
在一些实施方案中,如通过细胞干重%所测量,细胞中约、至多约或至少约1%的脂肪酸可以是10-甲基硬脂酸。如通过细胞干重%所测量,细胞中约、至少约或至多约2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的脂肪酸可以是10-甲基硬脂酸,或其中可导出的任何范围。
在一些实施方案中,如通过细胞干重%所测量,细胞中约、至少约或至多约1%的脂肪酸可以是10-亚甲基硬脂酸。如通过细胞干重%所测量,细胞中约、至少约或至多约2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的脂肪酸可以是10-亚甲基硬脂酸,或其中可导出的任何范围。
在一些实施方案中,细胞中以重量计约、至少约或至多约1%的脂肪酸可以是本文所述支化(甲基)脂质中的一种或多种。细胞中以重量计约、至少约或至多约2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的脂肪酸可以是本文所述支化(甲基)脂质中的一种或多种,或其中可导出的任何范围。
在一些实施方案中,细胞中以重量计约、至少约或至多约1%的脂肪酸可以是本文所述支化(甲基)脂质中的一种或多种(例如,链长度为14-20个碳并且在Δ9、Δ10或Δ11位置具有甲基分支的线性脂肪酸)。细胞中约、至少约或至多约2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的脂肪酸可以是本文所述支化(甲基)脂质中的一种或多种(例如,链长度为14-20个碳并且在Δ9、Δ10或Δ11位置具有甲基分支的线性脂肪酸),或其中可导出的任何范围。
在一些实施方案中,如通过细胞干重%所测量,细胞可包括约、至少约或至多约1%的10-甲基硬脂酸。如通过细胞干重%所测量,细胞可包括约、至少约或至多约2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%或50%的10-甲基硬脂酸,或其中可导出的任何范围。
在一些实施方案中,如通过细胞干重%所测量,细胞可包括约、至少约或至多约1%的10-亚甲基硬脂酸。如通过细胞干重%所测量,细胞可包括约、至少约或至多约2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%或50%的10-亚甲基硬脂酸,或其中可导出的任何范围。
与本发明细胞具有相同类型(例如,物种)的未经修饰细胞可不包括10-甲基硬脂酸酯,或其酸(10-甲基硬脂酸)、酯(例如,二酰甘油、三酰甘油、磷脂)、硫酯(例如,10-甲基硬脂酰基CoA)或酰胺(例如,10-甲基硬脂酰基酰胺)(例如,其中未经修饰的细胞不包括重组甲基转移酶基因或重组还原酶基因)。与本发明细胞具有相同类型(例如,物种)的未经修饰细胞可不包括10-亚甲基硬脂酸酯,或其酸(10-亚甲基硬脂酸)、酯(例如,二酰甘油、三酰甘油、磷脂)、硫酯(例如,10-亚甲基硬脂酰基CoA)或酰胺(例如,10-亚甲基硬脂酰基酰胺)(例如,其中未经修饰的细胞不包括重组甲基转移酶基因或重组还原酶基因)。在一些实施方案中,与所述细胞为相同物种的未经修饰的细胞不包括支化(甲基)脂质和/或环外亚甲基取代的脂质。在一些实施方案中,与所述细胞为相同物种的未经修饰的细胞不包括本文所述支化(甲基)脂质或环外亚甲基取代的脂质中的一种或多种。
细胞可组成型表达由重组甲基转移酶基因编码的蛋白质。细胞可组成型表达由重组还原酶基因编码的蛋白质。细胞可组成型表达由重组tmsC基因编码的蛋白质。细胞可组成型表达甲基转移酶蛋白质。细胞可组成型表达还原酶蛋白质。细胞可组成型表达tmsC蛋白质。
B.核酸
本发明的各个方面涉及包括重组甲基转移酶基因、重组还原酶基因或二者的核酸。核酸可以是例如质粒。在一些实施方案中,重组甲基转移酶基因和/或重组还原酶基因整合到细胞基因组中,并且因此核酸可以是染色体。在一些实施方案中,本发明涉及包括重组甲基转移酶基因的细胞,例如其中重组甲基转移酶基因存于质粒或染色体中。在一些实施方案中,本发明涉及包括重组还原酶基因的细胞,例如其中重组还原酶基因存于质粒或染色体中。重组甲基转移酶基因和重组还原酶基因可存于细胞中的同一核酸(例如,同一质粒或染色体)中或不同核酸(例如,不同质粒或染色体)中。
核酸可能可遗传给经转化细胞的后代。例如重组甲基转移酶基因或重组还原酶基因的基因可以是可遗传的,因为其驻留在质粒或染色体上。在某些实施方案中,基因可以是可遗传的,因为其整合到经转化细胞的基因组中。
基因可包括保守替换、缺失和/或插入,同时仍编码具有活性的蛋白质。例如,可针对特定宿主细胞优化密码子,不同密码子可以是便捷起见经替换,例如以引入限制位点或产生最佳PCR引物,或者密码子可以是另一目的经替换。类似地,核苷酸序列可经改变以产生保守氨基酸替换、缺失和/或插入。
蛋白质可包括保守替换、缺失和/或插入,同时仍维持活性。保守替换表为本领域所熟知(Creighton,蛋白质(Proteins)(第2d版,1992))。
氨基酸替换、缺失和/或插入可使用重组DNA操作技术容易地实现。操作DNA序列以产生蛋白质的替换、插入或缺失变体的方法为本领域所熟知。这些方法包括M13诱变、T7-Gen体外诱变(USB,Cleveland,OH)、快速变化定点诱变(Stratagene,San Diego,CA)、PCR介导定点诱变和其他定点诱变方案。
为了确定两个氨基酸序列或两个核酸序列的同一性百分比,可比对序列用于最佳比较目的(例如,可在第一和第二氨基酸或核酸序列中的一个或两个中引入空位以获得最佳比对,并且为了比较目的可忽视不相同序列)。为了比较目的比对的参考序列的长度可以是所述参考序列的长度的至少95%。随后可比较在相应氨基酸位置或核苷酸位置的氨基酸残基或核苷酸。在第一序列中的位置由与第二序列中的相应位置相同的氨基酸残基或核苷酸占据时,那么所述分子在该位置同一(如本文所用,氨基酸或核酸“同一性”等同于氨基酸或核酸“同源性”)。两个序列之间的同一性百分比随序列共有的同一性位置数而变,并考虑为了两个序列的最佳比对需要引入的空位数和每个空位的长度。
序列的比较和两个序列之间的同一性百分比的确定可使用数学算法来完成。除非另外指定,否则在本文中提到两个氨基酸序列之间的同一性百分比时是指如使用Needleman和Wunsch(J.Molecular Biology 48:444-453(1970))算法确定的同一性百分比,所述算法已并入GCG软件包(可在http://www.gcg.com获得)的GAP程序中,使用Blosum62矩阵、空位权重为10,并且长度权重为4。在一些实施方案中,两个氨基酸序列之间的同一性百分比是通过Needleman和Wunsch算法使用Blosum 62矩阵或PAM250矩阵来确定,并且空位权重为16、14、12、10、8、6或4,且长度权重为1、2、3、4、5或6。除非另外指定,否则在本文中提到两个核苷酸序列之间的同一性百分比时是指如使用GCG软件包(可在http://www.gcg.com获得)的GAP程序确定的同一性百分比,其使用NWSgapdna.CMP矩阵,并且空位权重为60,且长度权重为4。在另一实施方案中,两个核苷酸序列之间的同一性百分比可使用40、50、60、70或80的空位权重和1、2、3、4、5或6的长度权重来确定。在另一实施方案中,两个氨基酸或核苷酸序列之间的同一性百分比可使用E.Meyers和W.Miller的算法(ComputerApplications in the Biosciences 4:11-17(1988))来确定,所述算法已并入ALIGN程序(2.0或2.0U版)中,其使用PAM120权重残基表、12的空位长度罚分和4的空位罚分。
可用于确定两个序列之间的同一性的示例性电脑程序包括但不限于BLAST程序套件,例如BLASTN、MEGABLAST、BLASTX、TBLASTN、TBLASTX和BLASTP,以及Clustal程序,例如ClustalW、ClustalX和Clustal Omega。
在相对于GenBank DNA序列和其他公众数据库中的核酸序列评估给定核酸序列时,序列搜索通常是使用BLASTN程序来实施。BLASTX程序可有效针对GenBank蛋白质序列和其他公众数据库中的氨基酸序列搜索已在所有阅读框中经翻译的核酸序列。
比对所选序列以确定两个或更多个序列之间的“同一性%”是使用例如CLUSTAL-W程序来进行。
“编码序列”或“编码区”是指具有在表达序列时产生蛋白质产物(例如氨基酸或多肽)所需的序列信息的核酸分子。编码序列可包括翻译区内的非翻译序列(包括内含子或5'或3'非翻译区)和/或由其组成,或可缺少所述介入的非翻译序列(例如,如在cDNA中)。
在说明书通篇中用于提到包括核苷酸序列和/或由核苷酸序列组成的核酸的缩写是常规的单字母缩写。因此,当包括于核酸中时,天然存在的编码核苷酸缩写如下:腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)、胸腺嘧啶(T)和尿嘧啶(U)。同样,除非另外指定,否则本文中呈现的核酸序列是5'→3'方向。
如本文所用,术语“互补”和其衍生词用于指通过熟知规则进行核酸配对,其中A与T或U配对,C与G配对。互补物可以是“部分”或“完整”互补物。在部分互补物中,仅一些核酸碱基根据碱基配对原则匹配;而在完整或完全互补物中,所有碱基都根据配对原则匹配。核酸链之间的互补程度可对核酸链之间的杂交效率和强度具有显著影响,如本领域所熟知。所述杂交的效率和强度取决于检测方法。
在本文中称作与SEQ ID NO中所述的序列具有一定序列同一性百分比的任何核酸包括与SEQ ID NO中所述序列的互补物具有一定序列同一性百分比的核酸。
i.包括重组甲基转移酶基因的核酸
甲基转移酶基因(例如,重组甲基转移酶基因)编码甲基转移酶蛋白质,其为能将碳原子和一个或多个与其结合的质子从例如S-腺苷甲硫氨酸的底物转移到例如油酸的脂肪酸的酶(例如,其中脂肪酸是作为游离脂肪酸、羧酸酯、磷脂、二酰甘油或三酰甘油存在)。甲基转移酶基因(例如,重组甲基转移酶基因)可包括以下序列中所述的任一核苷酸序列:SEQ ID NO:3、SEQ ID NO:7、SEQ ID NO:11、SEQ ID NO:15、SEQ ID NO:19、SEQ ID NO:25、SEQ ID NO:29、SEQ ID NO:35、SEQ ID NO:41、SEQ ID NO:45、SEQ ID NO:49、SEQ ID NO:53、SEQ ID NO:59、SEQ ID NO:63、SEQ ID NO:69、SEQ ID NO:75和SEQ ID NO:81。甲基转移酶基因(例如,重组甲基转移酶基因)可以是如本文所述的10-甲基硬脂酸B基因(tmsB)或其生物活性部分(即,其中其生物活性部分包括甲基转移酶活性)。
甲基转移酶基因(例如,重组甲基转移酶基因)可衍生自放线菌的革兰氏阳性物种,例如分枝杆菌属(Mycobacteria)、棒杆菌属(Corynebacteria)、诺卡尔菌属(Nocardia)、链霉菌属或红球菌属。甲基转移酶基因(例如,重组甲基转移酶基因)可选自由以下组成的组:耻垢分枝杆菌基因tmsB、苏别蒂山农霉菌基因tmsB、浅黄拟无枝酸球菌基因tmsB、谷氨酸棒状杆菌基因tmsB、甘氨酸棒杆菌(Corynebacterium glyciniphilium)基因tmsB、气生诺尔氏菌(Knoella aerolata)基因tmsB、南非分枝杆菌(Mycobacteriumaustroafricanum)基因tmsB、淡黄分枝杆菌基因tmsB、普拉尼亚分枝杆菌(Mycobacteriumindicus pranii)基因tmsB、草分枝杆菌(Mycobacterium phlei)基因tmsB、结核分枝杆菌基因tmsB、范巴伦氏分枝杆菌基因tmsB、浑浊红球菌基因tmsB、拉格西斯链霉菌(Streptomyces regnsis)基因tmsB、嗜热子囊菌基因tmsB和弯曲嗜热单胞菌基因tmsB。明确预期,可从本发明的实施方案排除上文一种或多种甲基转移酶基因。
重组甲基转移酶基因可以是重组体,因为其可操作连接到甲基转移酶基因的天然存在的启动子以外的启动子。所述基因可用于驱动特定物种细胞中的转录。重组甲基转移酶基因可以是重组体,因为其相对于天然存在的甲基转移酶基因含有一个或多个核苷酸替换。所述基因可用于提高特定物种细胞中的甲基转移酶基因的mRNA转录物的翻译效率。
核酸可包括重组甲基转移酶基因和启动子,其中重组甲基转移酶基因和启动子是可操作连接。重组甲基转移酶基因和启动子可衍生自不同物种。例如,重组甲基转移酶基因可编码放线菌的革兰氏阳性物种的甲基转移酶蛋白质,并且重组甲基转移酶基因可以可操作连接到启动子,所述启动子可驱动另一细菌门(例如,变形菌门,例如大肠杆菌)或真核生物(例如,藻类细胞、酵母细胞或植物细胞)中的转录。启动子可以是真核启动子。细胞可包括核酸,并且启动子可能够驱动所述细胞中的转录。细胞可包括重组甲基转移酶基因,并且重组甲基转移酶基因可以可操作连接到能在细胞中驱动重组甲基转移酶基因转录的启动子。细胞可以是酵母物种,并且启动子可以是酵母启动子。细胞可以是细菌物种,并且启动子可以是细菌启动子(例如,其中细菌启动子并非来自放线菌的启动子)。细胞可以是藻类物种,并且启动子可以是藻类启动子。细胞可以是植物物种,并且启动子可以是植物启动子。
重组甲基转移酶基因可以可操作连接到无法驱动重组甲基转移酶基因在为重组甲基转移酶基因的来源的细胞中转录的启动子。例如,启动子可不能结合重组甲基转移酶基因源自的细胞的RNA聚合酶。在一些实施方案中,启动子无法结合原核RNA聚合酶和/或起始由原核RNA聚合酶介导的转录。在一些实施方案中,重组甲基转移酶基因可操作连接到无法驱动所述基因编码的蛋白质在该基因起源的的细胞中的转录的启动子。例如,启动子可不能结合天然表达由重组甲基转移酶基因编码的甲基转移酶的细胞的RNA聚合酶。
启动子可以是诱导型启动子或组成型启动子。启动子可以是2016年1月28日公开的PCT专利申请公开第WO 2016/014900号(其在此以引用方式整体并入)中所述的任一启动子。WO 2016/014900描述衍生自酵母物种解脂耶氏酵母和腺嘌呤阿氏酵母的多种启动子,其可特别可用作用于驱动酵母细胞中的重组基因的转录的启动子。启动子可以是来自编码以下产物的基因的启动子:翻译延长因子EF-1α;甘油-3-磷酸酯脱氢酶;磷酸丙糖异构酶1;果糖-1,6-二磷酸醛缩酶;磷酸甘油酸酯变位酶;丙酮酸激酶;输出蛋白质EXP1;核糖体蛋白质S7;醇脱氢酶;磷酸甘油酸酯激酶;己糖转运蛋白;一般氨基酸通透酶;丝氨酸蛋白酶;异柠檬酸裂合酶;酰基-CoA氧化酶;ATP-硫酸化酶;己糖激酶;3-磷酸甘油酸酯脱氢酶;丙酮酸脱氢酶α亚基;丙酮酸脱氢酶β亚基;顺乌头酸酶;烯醇化酶;肌动蛋白;多药耐药蛋白(ABC转运蛋白);泛素;GTP酶;质膜Na+/Pi协同转运蛋白;丙酮酸脱羧酶;植酸酶;或α-淀粉酶,例如其中所述基因是酵母基因,例如来自解脂耶氏酵母或腺嘌呤阿氏酵母的基因。
重组甲基转移酶基因可包括与SEQ ID NO:3、SEQ ID NO:7、SEQ ID NO:11、SEQ IDNO:15、SEQ ID NO:19、SEQ ID NO:25、SEQ ID NO:29、SEQ ID NO:35、SEQ ID NO:41、SEQ IDNO:45、SEQ ID NO:49、SEQ ID NO:53、SEQ ID NO:59、SEQ ID NO:63、SEQ ID NO:69、SEQ IDNO:75或SEQ ID NO:81中所述核苷酸序列具有至少约65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的核苷酸序列。重组甲基转移酶基因可包括与SEQ ID NO:3、SEQ ID NO:7、SEQID NO:11、SEQ ID NO:15、SEQ ID NO:19、SEQ ID NO:25、SEQ ID NO:29、SEQ ID NO:35、SEQID NO:41、SEQ ID NO:45、SEQ ID NO:49、SEQ ID NO:53、SEQ ID NO:59、SEQ ID NO:63、SEQID NO:69、SEQ ID NO:75或SEQ ID NO:81中所述核苷酸序列的在以下核苷酸位置开始的150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250或1300个连续碱基对(或其中可导出的任何范围)具有、具有至少或具有至多65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性(或其中可导出的任何范围)的核苷酸序列:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206、207、208、209、210、211、212、213、214、215、216、217、218、219、220、221、222、223、224、225、226、227、228、229、230、231、232、233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、250、251、252、253、254、255、256、257、258、259、260、261、262、263、264、265、266、267、268、269、270、271、272、273、274、275、276、277、278、279、280、281、282、283、284、285、286、287、288、289、290、291、292、293、294、295、296、297、298、299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、316、317、318、319、320、321、322、323、324、325、326、327、328、329、330、331、332、333、334、335、336、337、338、339、340、341、342、343、344、345、346、347、348、349、350、351、352、353、354、355、356、357、358、359、360、361、362、363、364、365、366、367、368、369、370、371、372、373、374、375、376、377、378、379、380、381、382、383、384、385、386、387、388、389、390、391、392、393、394、395、396、397、398、399、400、401、402、403、404、405、406、407、408、409、410、411、412、413、414、415、416、417、418、419、420、421、422、423、424、425、426、427、428、429、430、431、432、433、434、435、436、437、438、439、440、441、442、443、444、445、446、447、448、449、450、451、452、453、454、455、456、457、458、459、460、461、462、463、464、465、466、467、468、469、470、471、472、473、474、475、476、477、478、479、480、481、482、483、484、485、486、487、488、489、490、491、492、493、494、495、496、497、498、499、500、501、502、503、504、505、506、507、508、509、510、511、512、513、514、515、516、517、518、519、520、521、522、523、524、525、526、527、528、529、530、531、532、533、534、535、536、537、538、539、540、541、542、543、544、545、546、547、548、549、550、551、552、553、554、555、556、557、558、559、560、561、562、563、564、565、566、567、568、569、570、571、572、573、574、575、576、577、578、579、580、581、582、583、584、585、586、587、588、589、590、591、592、593、594、595、596、597、598、599、600、601、602、603、604、605、606、607、608、609、610、611、612、613、614、615、616、617、618、619、620、621、622、623、624、625、626、627、628、629、630、631、632、633、634、635、636、637、638、639、640、641、642、643、644、645、646、647、648、649、650、651、652、653、654、655、656、657、658、659、660、661、662、663、664、665、666、667、668、669、670、671、672、673、674、675、676、677、678、679、680、681、682、683、684、685、686、687、688、689、690、691、692、693、694、695、696、697、698、699、700、701、702、703、704、705、706、707、708、709、710、711、712、713、714、715、716、717、718、719、720、721、722、723、724、725、726、727、728、729、730、731、732、733、734、735、736、737、738、739、740、741、742、743、744、745、746、747、748、749、750、751、752、753、754、755、756、757、758、759、760、761、762、763、764、765、766、767、768、769、770、771、772、773、774、775、776、777、778、779、780、781、782、783、784、785、786、787、788、789、790、791、792、793、794、795、796、797、798、799、800、801、802、803、804、805、806、807、808、809、810、811、812、813、814、815、816、817、818、819、820、821、822、823、824、825、826、827、828、829、830、831、832、833、834、835、836、837、838、839、840、841、842、843、844、845、846、847、848、849、850、851、852、853、854、855、856、857、858、859、860、861、862、863、864、865、866、867、868、869、870、871、872、873、874、875、876、877、878、879、880、881、882、883、884、885、886、887、888、889、890、891、892、893、894、895、896、897、898、899、900、901、902、903、904、905、906、907、908、909、910、911、912、913、914、915、916、917、918、919、920、921、922、923、924、925、926、927、928、929、930、931、932、933、934、935、936、937、938、939、940、941、942、943、944、945、946、947、948、949、950、951、952、953、954、955、956、957、958、959、960、961、962、963、964、965、966、967、968、969、970、971、972、973、974、975、976、977、978、979、980、981、982、983、984、985、986、987、988、989、990、991、992、993、994、995、996、997、998、999、1000、1001、1002、1003、1004、1005、1006、1007、1008、1009、1010、1011、1012、1013、1014、1015、1016、1017、1018、1019、1020、1021、1022、1023、1024、1025、1026、1027、1028、1029、1030、1031、1032、1033、1034、1035、1036、1037、1038、1039、1040、1041、1042、1043、1044、1045、1046、1047、1048、1049、1050、1051、1052、1053、1054、1055、1056、1057、1058、1059、1060、1061、1062、1063、1064、1065、1066、1067、1068、1069、1070、1071、1072、1073、1074、1075、1076、1077、1078、1079、1080、1081、1082、1083、1084、1085、1086、1087、1088、1089、1090、1091、1092、1093、1094、1095、1096、1097、1098、1099、1100、1101、1102、1103、1104、1105、1106、1107、1108、1109、1110、1111、1112、1113、1114、1115、1116、1117、1118、1119、1120、1121、1122、1123、1124、1125、1126、1127、1128、1129、1130、1131、1132、1133、1134、1135、1136、1137、1138、1139、1140、1141、1142、1143、1144、1145、1146、1147、1148、1149、1150、1151、1152、1153、1154、1155、1156、1157、1158、1159、1160、1161、1162、1163、1164、1165、1166、1167、1168、1169、1170、1171、1172、1173、1174、1175、1176、1177、1178、1179、1180、1181、1182、1183、1184、1185、1186、1187、1188、1189、1190、1191、1192、1193、1194、1195、1196、1197、1198、1199或1200。重组甲基转移酶可具有或可不具有与SEQ ID NO:3、SEQ ID NO:7、SEQ ID NO:11、SEQ ID NO:15、SEQ ID NO:19、SEQ ID NO:25、SEQ ID NO:29、SEQ ID NO:35、SEQ ID NO:41、SEQ ID NO:45、SEQ ID NO:49、SEQ ID NO:53、SEQ ID NO:59、SEQ ID NO:63、SEQ ID NO:69、SEQ ID NO:75或SEQ IDNO:81中所述任一核苷酸序列的100%序列同一性。重组甲基转移酶基因可具有或可不具有与SEQ ID NO:3、SEQ ID NO:7、SEQ ID NO:11、SEQ ID NO:15、SEQ ID NO:19、SEQ ID NO:25、SEQ ID NO:29、SEQ ID NO:35、SEQ ID NO:41、SEQ ID NO:45、SEQ ID NO:49、SEQ IDNO:53、SEQ ID NO:59、SEQ ID NO:63、SEQ ID NO:69、SEQ ID NO:75或SEQ ID NO:81中所述核苷酸序列的150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250或1300个连续碱基对的100%序列同一性。重组甲基转移酶基因可包括与SEQ ID NO:3、SEQ ID NO:7、SEQ ID NO:11、SEQ ID NO:15、SEQ IDNO:19、SEQ ID NO:25、SEQ ID NO:29、SEQ ID NO:35、SEQ ID NO:41、SEQ ID NO:45、SEQ IDNO:49、SEQ ID NO:53、SEQ ID NO:59、SEQ ID NO:63、SEQ ID NO:69、SEQ ID NO:75或SEQID NO:81中所述核苷酸序列具有、具有至少或具有至多65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的核苷酸序列,并且重组甲基转移酶基因可编码与SEQ ID NO:4、SEQ ID NO:8、SEQ ID NO:12、SEQ ID NO:16、SEQ ID NO:20、SEQ ID NO:26、SEQ ID NO:30、SEQ ID NO:36、SEQ ID NO:42、SEQ ID NO:46、SEQ ID NO:50、SEQ ID NO:54、SEQ ID NO:60、SEQ IDNO:64、SEQ ID NO:70或SEQ ID NO:76中所述氨基酸序列具有、具有至少或具有至多65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的甲基转移酶蛋白质。例如,SEQ ID NO:81是针对酵母中的表达经密码子优化的基因。SEQ ID NO:81与SEQ ID NO:3具有约70%序列同一性(69.86%序列同一性),并且SEQ ID NO:81编码的蛋白质与SEQ ID NO:4中所述氨基酸序列具有100%序列同一性。因此,即使SEQ ID NO:81与SEQ ID NO:3具有69.86%序列同一性,但是所述两个核苷酸序列编码相同氨基酸序列。
重组甲基转移酶基因可与天然存在的甲基转移酶基因不同,因为重组甲基转移酶基因可经密码子优化以在真核细胞,例如植物细胞、藻类细胞或酵母细胞中表达。细胞可包括重组甲基转移酶基因,其中重组甲基转移酶基因针对所述细胞经密码子优化。
确切地,重组甲基转移酶基因的至少或至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206、207、208、209、210、211、212、213、214、215、216、217、218、219、220、221、222、223、224、225、226、227、228、229、230、231、232、233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、250、251、252、253、254、255、256、257、258、259、260、261、262、263、264、265、266、267、268、269、270、271、272、273、274、275、276、277、278、279、280、281、282、283、284、285、286、287、288、289、290、291、292、293、294、295、296、297、298、299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、316、317、318、319、320、321、322、323、324、325、326、327、328、329、330、331、332、333、334、335、336、337、338、339、340、341、342、343、344、345、346、347、348、349、350、351、352、353、354、355、356、357、358、359、360、361、362、363、364、365、366、367、368、369、370、371、372、373、374、375、376、377、378、379、380、381、382、383、384、385、386、387、388、389、390、391、392、393、394、395、396、397、398、399、400、401、402、403、404、405、406、407、408、409、410、411、412、413、414、415、416、417、418、419、420、421、422、423、424、425、426、427、428、429、430、431、432、433、434、435、436、437、438、439、440、441、442、443、444、445、446、447、448、449、450、451、452、453、454、455、456、457、458、459、460、461、462、463、464、465、466、467、468、469、470、471、472、473、474、475、476、477、478、479、480、481、482、483、484、485、486、487、488、489、490、491、492、493、494、495、496、497、498、499或500个密码子可与天然存在的甲基转移酶基因不同或可相对于天然存在的甲基转移酶基因不变。例如,重组甲基转移酶基因可包括与SEQID NO:3、SEQ ID NO:7、SEQ ID NO:11、SEQ ID NO:15、SEQ ID NO:19、SEQ ID NO:25、SEQID NO:29、SEQ ID NO:35、SEQ ID NO:41、SEQ ID NO:45、SEQ ID NO:49、SEQ ID NO:53、SEQID NO:59、SEQ ID NO:63、SEQ ID NO:69或SEQ ID NO:75中所述天然存在的核苷酸序列具有至少约65%序列同一性(例如,至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性)的核苷酸序列,并且重组甲基转移酶基因的核苷酸序列的至少5个密码子可与天然存在的核苷酸序列不同(例如,至少10、15、20、25、30、35、40、45、50、60、70、80、90或100个密码子(其中可导出的任何范围))。
甲基转移酶基因编码甲基转移酶蛋白质。甲基转移酶蛋白质可以是由放线菌的革兰氏阳性物种表达的蛋白质,例如分枝杆菌属、棒杆菌属、诺卡尔菌属、链霉菌属或红球菌属。即使重组甲基转移酶基因并非天然存在的甲基转移酶基因,所述重组甲基转移酶基因也可编码天然存在的甲基转移酶蛋白质。例如,重组甲基转移酶基因可与天然存在的甲基转移酶基因不同,因为重组甲基转移酶基因针对在具体细胞中的表达经密码子优化。然而,经密码子优化的重组甲基转移酶基因和天然存在的甲基转移酶基因可编码相同的天然存在的甲基转移酶蛋白质。
重组甲基转移酶基因可编码选自以下的甲基转移酶蛋白质:耻垢分枝杆菌酶tmsB、苏别蒂山农霉菌酶tmsB、浅黄拟无枝酸球菌酶tmsB、谷氨酸棒状杆菌酶tmsB、甘氨酸棒状杆菌酶tmsB、气生诺尔氏菌酶tmsB、南非分枝杆菌酶tmsB、淡黄分枝杆菌酶tmsB、普拉尼亚分枝杆菌酶tmsB、草分枝杆菌酶tmsB、结核分枝杆菌酶tmsB、范巴伦氏分枝杆菌酶tmsB、浑浊红球菌酶tmsB、拉格西斯链霉菌酶tmsB、嗜热子囊菌酶tmsB和弯曲嗜热单胞菌酶tmsB。明确预期,可从本发明的实施方案排除上文一种或多种甲基转移酶蛋白质。重组甲基转移酶基因可编码甲基转移酶蛋白质,并且甲基转移酶蛋白质可与前述任一种酶基本上相同,但重组甲基转移酶基因可与编码所述酶的天然存在的基因不同。重组甲基转移酶基因可与天然存在的基因不同,因为重组甲基转移酶基因可针对在细胞的具体门、纲、目、科、属、种或菌株中的表达经密码子优化。
天然存在的甲基转移酶蛋白质的序列陈述于SEQ ID NO:4、SEQ ID NO:8、SEQ IDNO:12、SEQ ID NO:16、SEQ ID NO:20、SEQ ID NO:26、SEQ ID NO:30、SEQ ID NO:36、SEQ IDNO:42、SEQ ID NO:46、SEQ ID NO:50、SEQ ID NO:54、SEQ ID NO:60、SEQ ID NO:64、SEQ IDNO:70或SEQ ID NO:76中。重组甲基转移酶基因可编码或可不编码包括与SEQ ID NO:4、SEQID NO:8、SEQ ID NO:12、SEQ ID NO:16、SEQ ID NO:20、SEQ ID NO:26、SEQ ID NO:30、SEQID NO:36、SEQ ID NO:42、SEQ ID NO:46、SEQ ID NO:50、SEQ ID NO:54、SEQ ID NO:60、SEQID NO:64、SEQ ID NO:70或SEQ ID NO:76中所述氨基酸序列的100%序列同一性的蛋白质。例如,重组甲基转移酶基因可编码与SEQ ID NO:4、SEQ ID NO:8、SEQ ID NO:12、SEQ IDNO:16、SEQ ID NO:20、SEQ ID NO:26、SEQ ID NO:30、SEQ ID NO:36、SEQ ID NO:42、SEQ IDNO:46、SEQ ID NO:50、SEQ ID NO:54、SEQ ID NO:60、SEQ ID NO:64、SEQ ID NO:70或SEQID NO:76中所述氨基酸序列的生物活性部分具有100%序列同一性的蛋白质。
重组甲基转移酶基因可编码与SEQ ID NO:4、SEQ ID NO:8、SEQ ID NO:12、SEQ IDNO:16、SEQ ID NO:20、SEQ ID NO:26、SEQ ID NO:30、SEQ ID NO:36、SEQ ID NO:42、SEQ IDNO:46、SEQ ID NO:50、SEQ ID NO:54、SEQ ID NO:60、SEQ ID NO:64、SEQ ID NO:70或SEQID NO:76中所述氨基酸序列或其生物活性部分具有、具有至少或具有至多65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性(或其中可导出的任何范围)的甲基转移酶蛋白质。重组甲基转移酶基因可编码相对于包括SEQ ID NO:4、SEQ ID NO:8、SEQ ID NO:12、SEQ IDNO:16、SEQ ID NO:20、SEQ ID NO:26、SEQ ID NO:30、SEQ ID NO:36、SEQ ID NO:42、SEQ IDNO:46、SEQ ID NO:50、SEQ ID NO:54、SEQ ID NO:60、SEQ ID NO:64、SEQ ID NO:70或SEQID NO:76中所述氨基酸序列的蛋白质具有至少约0.1%、0.5%、1%、2%、3%、4%、5%、10%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%、100%、100.1%、100.2%、100.3%、100.4%、100.5%、100.6%、100.7%、100.8%、100.9%、101%、105%、110%、115%、120%、125%、130%、135%、140%、145%、150%、160%、170%、180%、190%、200%、220%、240%、260%、280%、300%、320%、340%、360%、380%或400%甲基转移酶活性(其中可导出的任何范围)的甲基转移酶蛋白质。重组甲基转移酶基因可编码与在SEQ ID NO:4、SEQ ID NO:8、SEQID NO:12、SEQ ID NO:16、SEQ ID NO:20、SEQ ID NO:26、SEQ ID NO:30、SEQ ID NO:36、SEQID NO:42、SEQ ID NO:46、SEQ ID NO:50、SEQ ID NO:54、SEQ ID NO:60、SEQ ID NO:64、SEQID NO:70或SEQ ID NO:76的以下氨基酸位置开始的10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400、410、420、430、440、450、460、470、480、490或500个连续氨基酸具有至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.9%或100%序列同一性的蛋白质:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206、207、208、209、210、211、212、213、214、215、216、217、218、219、220、221、222、223、224、225、226、227、228、229、230、231、232、233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、250、251、252、253、254、255、256、257、258、259、260、261、262、263、264、265、266、267、268、269、270、271、272、273、274、275、276、277、278、279、280、281、282、283、284、285、286、287、288、289、290、291、292、293、294、295、296、297、298、299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、316、317、318、319、320、321、322、323、324、325、326、327、328、329、330、331、332、333、334、335、336、337、338、339、340、341、342、343、344、345、346、347、348、349、350、351、352、353、354、355、356、357、358、359、360、361、362、363、364、365、366、367、368、369、370、371、372、373、374、375、376、377、378、379、380、381、382、383、384、385、386、387、388、389、390、391、392、393、394、395、396、397、398、399、400、401、402、403、404、405、406、407、408、409、410、411、412、413、414、415、416、417、418、419、420、421、422、423、424、425、426、427、428、429、430、431、432、433、434、435、436、437、438、439、440、441、442、443、444、445、446、447、448、449、450、451、452、453、454、455、456、457、458、459、460、461、462、463、464、465、466、467、468、469、470、471、472、473、474、475、476、477、478、479、480、481、482、483、484、485、486、487、488、489、490、491、492、493、494、495、496、497、498、499或500。
甲基转移酶蛋白质的底物可包括长14到20个碳并在Δ9、Δ10或Δ11位置具有不饱和双键的任何脂肪酸。甲基转移酶蛋白质可能够催化在所述底物的Δ9、Δ10或Δ11位置的亚甲基取代的形成。
在一些实施方案中,重组甲基转移酶基因编码包括S-腺苷甲硫氨酸依赖性甲基转移酶结构域的甲基转移酶蛋白质。在一些实施方案中,根据图19A-D中所示的比对,S-腺苷甲硫氨酸依赖性甲基转移酶结构域与弯曲嗜热单胞菌tmsB(SEQ ID NO:76)的氨基酸192-291或与来自耻垢分枝杆菌、范巴伦氏分枝杆菌、浅黄拟无枝酸球菌、甘氨酸棒状杆菌、谷氨酸棒状杆菌、浑浊红球菌、苏别蒂山农霉菌、气生诺尔氏菌、淡黄分枝杆菌、紫檀分枝杆菌或嗜热子囊菌的TmsB的相应部分具有、具有至少或具有至多70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.9%或100%序列同一性。
在一些实施方案中,重组甲基转移酶基因编码具有相对于SEQ ID NO:4、SEQ IDNO:8、SEQ ID NO:12、SEQ ID NO:16、SEQ ID NO:20、SEQ ID NO:26、SEQ ID NO:30、SEQ IDNO:36、SEQ ID NO:42、SEQ ID NO:46、SEQ ID NO:50、SEQ ID NO:54、SEQ ID NO:60、SEQ IDNO:64、SEQ ID NO:70或SEQ ID NO:76中所述氨基酸序列不变的具体氨基酸的甲基转移酶蛋白质。根据图19A-D中所示的比对,不变的氨基酸可包括1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28或29个选自以下的氨基酸:弯曲嗜热单胞菌tmsB(SEQ ID NO:76)的D23、G24、A59、H128、F147、Y148、L180、L193、M203、G236、A241、R313、R318、E320、L359、L400、V196、G197、C198、G199、W200、G201、G202、T219、L220、Q246、D247、Y248和D262,或来自耻垢分枝杆菌、范巴伦氏分枝杆菌、浅黄拟无枝酸球菌、甘氨酸棒状杆菌、谷氨酸棒状杆菌、浑浊红球菌、苏别蒂山农霉菌、气生诺尔氏菌、淡黄分枝杆菌、紫檀分枝杆菌或嗜热子囊菌的TmsB中的相应氨基酸。
ii.包括重组还原酶基因的核酸
还原酶基因(例如,重组还原酶基因)编码还原酶蛋白质,其为能通常以NADPH依赖性方式还原脂肪酸的双键的酶(例如,其中脂肪酸是作为游离脂肪酸、羧酸酯、磷脂、二酰甘油或三酰甘油存在)。还原酶基因(例如,重组还原酶基因)可包括以下序列中所述的任一核苷酸序列:SEQ ID NO:1、SEQ ID NO:5、SEQ ID NO:9、SEQ ID NO:13、SEQ ID NO:17、SEQ IDNO:23、SEQ ID NO:27、SEQ ID NO:33、SEQ ID NO:39、SEQ ID NO:43、SEQ ID NO:47、SEQ IDNO:51、SEQ ID NO:57、SEQ ID NO:61、SEQ ID NO:67、SEQ ID NO:73和SEQ ID NO:80。还原酶基因(例如,重组还原酶基因)可以是如本文所述的10-甲基硬脂酸A基因(tmsA)或其生物活性部分(即,其中其生物活性部分包括还原酶活性)。
还原酶基因(例如,重组还原酶基因)可衍生自放线菌的革兰氏阳性物种,例如分枝杆菌属、棒杆菌属、诺卡尔菌属、链霉菌属或红球菌属。还原酶基因(例如,重组还原酶基因)可选自由以下组成的组:耻垢分枝杆菌基因tmsA、苏别蒂山农霉菌基因tmsA、浅黄拟无枝酸球菌基因tmsA、谷氨酸棒状杆菌基因tmsA、甘氨酸棒状杆菌基因tmsA、气生诺尔氏菌基因tmsA、南非分枝杆菌基因tmsA、淡黄分枝杆菌基因tmsA、普拉尼亚分枝杆菌基因tmsA、草分枝杆菌基因tmsA、结核分枝杆菌基因tmsA、范巴伦氏分枝杆菌基因tmsA、浑浊红球菌基因tmsA、拉格西斯链霉菌基因tmsA、嗜热子囊菌基因tmsA和弯曲嗜热单胞菌基因tmsA。明确预期,可从本发明的实施方案排除上文一种或多种还原酶基因。
重组还原酶基因可以是重组体,因为其可操作连接到还原酶基因的天然存在的启动子以外的启动子。所述基因可用于驱动特定物种细胞中的转录。重组还原酶基因可以是重组体,因为其相对于天然存在的还原酶基因含有一个或多个核苷酸替换。所述基因可用于提高特定物种的细胞中还原酶基因的mRNA转录物的翻译效率。
核酸可包括重组还原酶基因和启动子,其中重组还原酶基因和启动子可操作连接。重组还原酶基因和启动子可衍生自不同物种。例如,重组还原酶基因可编码放线菌的革兰氏阳性物种的还原酶蛋白质,并且重组还原酶基因可以可操作连接到启动子,所述启动子可驱动另一细菌门(例如,变形菌门,例如大肠杆菌)或真核生物(例如,藻类细胞、酵母细胞或植物细胞)中的转录。启动子可以是真核启动子。细胞可包括核酸,并且启动子可能够驱动所述细胞中的转录。细胞可包括重组还原酶基因,并且重组还原酶基因可以可操作连接到能驱动细胞中的重组还原酶基因的转录的启动子。细胞可以是酵母物种,并且启动子可以是酵母启动子。细胞可以是细菌物种,并且启动子可以是细菌启动子(例如,其中细菌启动子并非来自放线菌的启动子)。细胞可以是藻类物种,并且启动子可以是藻类启动子。细胞可以是植物物种,并且启动子可以是植物启动子。
重组还原酶基因可以可操作连接到无法驱动重组还原酶基因在该重组还原酶基因起源的细胞中转录的启动子。例如,启动子可不能结合重组还原酶基因起源的细胞的RNA聚合酶。在一些实施方案中,启动子无法结合原核RNA聚合酶和/或起始由原核RNA聚合酶介导的转录。在一些实施方案中,重组还原酶基因可操作连接到无法在所述基因编码的蛋白质起源的细胞中驱动转录的启动子。例如,启动子可不能结合天然表达由重组还原酶基因编码的还原酶的细胞的RNA聚合酶。
启动子可以是诱导型启动子或组成型启动子。启动子可以是2016年1月28日公开的PCT专利申请公开第WO 2016/014900号(其在此以引用方式整体并入)中所述的任一启动子。WO 2016/014900描述衍生自酵母物种解脂耶氏酵母和腺嘌呤阿氏酵母的多种启动子,其可特别可用作用于驱动酵母细胞中的重组基因的转录的启动子。启动子可以是来自编码以下产物的基因的启动子:翻译延长因子EF-1α;甘油-3-磷酸酯脱氢酶;磷酸丙糖异构酶1;果糖-1,6-二磷酸醛缩酶;磷酸甘油酸酯变位酶;丙酮酸激酶;输出蛋白质EXP1;核糖体蛋白质S7;醇脱氢酶;磷酸甘油酸酯激酶;己糖转运蛋白;一般氨基酸通透酶;丝氨酸蛋白酶;异柠檬酸裂合酶;酰基-CoA氧化酶;ATP-硫酸化酶;己糖激酶;3-磷酸甘油酸酯脱氢酶;丙酮酸脱氢酶α亚基;丙酮酸脱氢酶β亚基;顺乌头酸酶;烯醇化酶;肌动蛋白;多药耐药蛋白(ABC转运蛋白);泛素;GTP酶;质膜Na+/Pi协同转运蛋白;丙酮酸脱羧酶;植酸酶;或α-淀粉酶,例如其中所述基因是酵母基因,例如来自解脂耶氏酵母或腺嘌呤阿氏酵母的基因。
重组还原酶基因可包括与SEQ ID NO:1、SEQ ID NO:5、SEQ ID NO:9、SEQ ID NO:13、SEQ ID NO:17、SEQ ID NO:23、SEQ ID NO:27、SEQ ID NO:33、SEQ ID NO:39、SEQ IDNO:43、SEQ ID NO:47、SEQ ID NO:51、SEQ ID NO:57、SEQ ID NO:61、SEQ ID NO:67、SEQ IDNO:73或SEQ ID NO:80中所述核苷酸序列具有、具有至少或具有至多65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的核苷酸序列。重组还原酶基因可包括与SEQ ID NO:1、SEQID NO:5、SEQ ID NO:9、SEQ ID NO:13、SEQ ID NO:17、SEQ ID NO:23、SEQ ID NO:27、SEQID NO:33、SEQ ID NO:39、SEQ ID NO:43、SEQ ID NO:47、SEQ ID NO:51、SEQ ID NO:57、SEQID NO:61、SEQ ID NO:67、SEQ ID NO:73或SEQ ID NO:80中所述核苷酸序列的在以下核苷酸位置开始的150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250或1300个连续碱基对具有、具有至少、具有至多65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的核苷酸序列:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206、207、208、209、210、211、212、213、214、215、216、217、218、219、220、221、222、223、224、225、226、227、228、229、230、231、232、233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、250、251、252、253、254、255、256、257、258、259、260、261、262、263、264、265、266、267、268、269、270、271、272、273、274、275、276、277、278、279、280、281、282、283、284、285、286、287、288、289、290、291、292、293、294、295、296、297、298、299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、316、317、318、319、320、321、322、323、324、325、326、327、328、329、330、331、332、333、334、335、336、337、338、339、340、341、342、343、344、345、346、347、348、349、350、351、352、353、354、355、356、357、358、359、360、361、362、363、364、365、366、367、368、369、370、371、372、373、374、375、376、377、378、379、380、381、382、383、384、385、386、387、388、389、390、391、392、393、394、395、396、397、398、399、400、401、402、403、404、405、406、407、408、409、410、411、412、413、414、415、416、417、418、419、420、421、422、423、424、425、426、427、428、429、430、431、432、433、434、435、436、437、438、439、440、441、442、443、444、445、446、447、448、449、450、451、452、453、454、455、456、457、458、459、460、461、462、463、464、465、466、467、468、469、470、471、472、473、474、475、476、477、478、479、480、481、482、483、484、485、486、487、488、489、490、491、492、493、494、495、496、497、498、499、500、501、502、503、504、505、506、507、508、509、510、511、512、513、514、515、516、517、518、519、520、521、522、523、524、525、526、527、528、529、530、531、532、533、534、535、536、537、538、539、540、541、542、543、544、545、546、547、548、549、550、551、552、553、554、555、556、557、558、559、560、561、562、563、564、565、566、567、568、569、570、571、572、573、574、575、576、577、578、579、580、581、582、583、584、585、586、587、588、589、590、591、592、593、594、595、596、597、598、599、600、601、602、603、604、605、606、607、608、609、610、611、612、613、614、615、616、617、618、619、620、621、622、623、624、625、626、627、628、629、630、631、632、633、634、635、636、637、638、639、640、641、642、643、644、645、646、647、648、649、650、651、652、653、654、655、656、657、658、659、660、661、662、663、664、665、666、667、668、669、670、671、672、673、674、675、676、677、678、679、680、681、682、683、684、685、686、687、688、689、690、691、692、693、694、695、696、697、698、699、700、701、702、703、704、705、706、707、708、709、710、711、712、713、714、715、716、717、718、719、720、721、722、723、724、725、726、727、728、729、730、731、732、733、734、735、736、737、738、739、740、741、742、743、744、745、746、747、748、749、750、751、752、753、754、755、756、757、758、759、760、761、762、763、764、765、766、767、768、769、770、771、772、773、774、775、776、777、778、779、780、781、782、783、784、785、786、787、788、789、790、791、792、793、794、795、796、797、798、799、800、801、802、803、804、805、806、807、808、809、810、811、812、813、814、815、816、817、818、819、820、821、822、823、824、825、826、827、828、829、830、831、832、833、834、835、836、837、838、839、840、841、842、843、844、845、846、847、848、849、850、851、852、853、854、855、856、857、858、859、860、861、862、863、864、865、866、867、868、869、870、871、872、873、874、875、876、877、878、879、880、881、882、883、884、885、886、887、888、889、890、891、892、893、894、895、896、897、898、899、900、901、902、903、904、905、906、907、908、909、910、911、912、913、914、915、916、917、918、919、920、921、922、923、924、925、926、927、928、929、930、931、932、933、934、935、936、937、938、939、940、941、942、943、944、945、946、947、948、949、950、951、952、953、954、955、956、957、958、959、960、961、962、963、964、965、966、967、968、969、970、971、972、973、974、975、976、977、978、979、980、981、982、983、984、985、986、987、988、989、990、991、992、993、994、995、996、997、998、999、1000、1001、1002、1003、1004、1005、1006、1007、1008、1009、1010、1011、1012、1013、1014、1015、1016、1017、1018、1019、1020、1021、1022、1023、1024、1025、1026、1027、1028、1029、1030、1031、1032、1033、1034、1035、1036、1037、1038、1039、1040、1041、1042、1043、1044、1045、1046、1047、1048、1049、1050、1051、1052、1053、1054、1055、1056、1057、1058、1059、1060、1061、1062、1063、1064、1065、1066、1067、1068、1069、1070、1071、1072、1073、1074、1075、1076、1077、1078、1079、1080、1081、1082、1083、1084、1085、1086、1087、1088、1089、1090、1091、1092、1093、1094、1095、1096、1097、1098、1099、1100、1101、1102、1103、1104、1105、1106、1107、1108、1109、1110、1111、1112、1113、1114、1115、1116、1117、1118、1119、1120、1121、1122、1123、1124、1125、1126、1127、1128、1129、1130、1131、1132、1133、1134、1135、1136、1137、1138、1139、1140、1141、1142、1143、1144、1145、1146、1147、1148、1149、1150、1151、1152、1153、1154、1155、1156、1157、1158、1159、1160、1161、1162、1163、1164、1165、1166、1167、1168、1169、1170、1171、1172、1173、1174、1175、1176、1177、1178、1179、1180、1181、1182、1183、1184、1185、1186、1187、1188、1189、1190、1191、1192、1193、1194、1195、1196、1197、1198、1199或1200。重组还原酶可具有或可不具有与SEQ ID NO:1、SEQ ID NO:5、SEQ ID NO:9、SEQ ID NO:13、SEQ ID NO:17、SEQ ID NO:23、SEQ ID NO:27、SEQ ID NO:33、SEQ ID NO:39、SEQ ID NO:43、SEQ ID NO:47、SEQ ID NO:51、SEQ ID NO:57、SEQ ID NO:61、SEQ ID NO:67、SEQ ID NO:73或SEQ ID NO:80中所述任一核苷酸序列的100%序列同一性。重组还原酶基因可具有或可不具有与SEQ ID NO:1、SEQID NO:5、SEQ ID NO:9、SEQ ID NO:13、SEQ ID NO:17、SEQ ID NO:23、SEQ ID NO:27、SEQID NO:33、SEQ ID NO:39、SEQ ID NO:43、SEQ ID NO:47、SEQ ID NO:51、SEQ ID NO:57、SEQID NO:61、SEQ ID NO:67、SEQ ID NO:73或SEQ ID NO:80中所述核苷酸序列的150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250或1300个连续碱基对的100%序列同一性。重组还原酶基因可包括与SEQID NO:1、SEQ ID NO:5、SEQ ID NO:9、SEQ ID NO:13、SEQ ID NO:17、SEQ ID NO:23、SEQ IDNO:27、SEQ ID NO:33、SEQ ID NO:39、SEQ ID NO:43、SEQ ID NO:47、SEQ ID NO:51、SEQ IDNO:57、SEQ ID NO:61、SEQ ID NO:67、SEQ ID NO:73或SEQ ID NO:80中所述核苷酸序列具有、具有至少或具有至多65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的核苷酸序列,并且重组还原酶基因可编码与SEQ ID NO:2、SEQ ID NO:6、SEQ ID NO:10、SEQ ID NO:14、SEQID NO:18、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NO:34、SEQ ID NO:40、SEQ ID NO:44、SEQID NO:48、SEQ ID NO:52、SEQ ID NO:58、SEQ ID NO:62、SEQ ID NO:68或SEQ ID NO:74中所述氨基酸序列具有至少约95%、96%、97%、98%、99%或100%序列同一性的还原酶蛋白质。例如,SEQ ID NO:80是针对酵母中的表达经密码子优化的基因。SEQ ID NO:80与SEQ IDNO:1具有约70%序列同一性(70.09%序列同一性),并且SEQ ID NO:80编码的蛋白质与SEQID NO:2中所述氨基酸序列具有至少约99%序列同一性。SEQ ID NO:1编码的蛋白质与SEQID NO:2中所述氨基酸序列具有100%序列同一性。
重组还原酶基因可与天然存在的还原酶基因不同,因为重组还原酶基因可针对真核细胞,例如植物细胞、藻类细胞或酵母细胞中的表达经密码子优化。细胞可包括重组还原酶基因,其中重组还原酶基因针对所述细胞经密码子优化。
确切地,重组还原酶基因的至少或至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206、207、208、209、210、211、212、213、214、215、216、217、218、219、220、221、222、223、224、225、226、227、228、229、230、231、232、233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、250、251、252、253、254、255、256、257、258、259、260、261、262、263、264、265、266、267、268、269、270、271、272、273、274、275、276、277、278、279、280、281、282、283、284、285、286、287、288、289、290、291、292、293、294、295、296、297、298、299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、316、317、318、319、320、321、322、323、324、325、326、327、328、329、330、331、332、333、334、335、336、337、338、339、340、341、342、343、344、345、346、347、348、349、350、351、352、353、354、355、356、357、358、359、360、361、362、363、364、365、366、367、368、369、370、371、372、373、374、375、376、377、378、379、380、381、382、383、384、385、386、387、388、389、390、391、392、393、394、395、396、397、398、399、400、401、402、403、404、405、406、407、408、409、410、411、412、413、414、415、416、417、418、419、420、421、422、423、424、425、426、427、428、429、430、431、432、433、434、435、436、437、438、439、440、441、442、443、444、445、446、447、448、449、450、451、452、453、454、455、456、457、458、459、460、461、462、463、464、465、466、467、468、469、470、471、472、473、474、475、476、477、478、479、480、481、482、483、484、485、486、487、488、489、490、491、492、493、494、495、496、497、498、499或500个密码子可与天然存在的还原酶基因不同或可相对于天然存在的还原酶基因不变。例如,重组还原酶基因可包括与SEQ ID NO:1、SEQ IDNO:5、SEQ ID NO:9、SEQ ID NO:13、SEQ ID NO:17、SEQ ID NO:23、SEQ ID NO:27、SEQ IDNO:33、SEQ ID NO:39、SEQ ID NO:43、SEQ ID NO:47、SEQ ID NO:51、SEQ ID NO:57、SEQ IDNO:61、SEQ ID NO:67或SEQ ID NO:73中所述天然存在的核苷酸序列具有至少65%序列同一性的核苷酸序列(例如,至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性),并且重组还原酶基因的核苷酸序列的至少5个密码子可与天然存在的核苷酸序列不同(例如,至少10、15、20、25、30、35、40、45、50、60、70、80、90或100个密码子)。
还原酶基因编码还原酶蛋白质。还原酶蛋白质可以是由放线菌的革兰氏阳性物种表达的蛋白质,例如分枝杆菌属、棒杆菌属、诺卡尔菌属、链霉菌属或红球菌属。即使重组还原酶基因并非天然存在的还原酶基因,所述重组还原酶基因也可编码天然存在的还原酶蛋白质。例如,重组还原酶基因可与天然存在的还原酶基因不同,因为重组还原酶基因针对具体细胞中的表达经密码子优化。然而,经密码子优化的重组还原酶基因和天然存在的还原酶基因可编码相同的天然存在的还原酶蛋白质。
重组还原酶基因可编码选自以下的还原酶蛋白质:耻垢分枝杆菌酶tmsA、苏别蒂山农霉菌酶tmsA、浅黄拟无枝酸球菌酶tmsA、谷氨酸棒状杆菌酶tmsA、甘氨酸棒状杆菌酶tmsA、气生诺尔氏菌酶tmsA、南非分枝杆菌酶tmsA、淡黄分枝杆菌酶tmsA、普拉尼亚分枝杆菌酶tmsA、草分枝杆菌酶tmsA、结核分枝杆菌酶tmsA、范巴伦氏分枝杆菌酶tmsA、浑浊红球菌酶tmsA、拉格西斯链霉菌酶tmsA、嗜热子囊菌酶tmsA和弯曲嗜热单胞菌酶tmsA。明确预期,可从本发明的实施方案排除上文一种或多种还原酶蛋白质。重组还原酶基因可编码还原酶蛋白质,并且还原酶蛋白质可与前述任一种酶基本上相同,但重组还原酶基因可与编码所述酶的天然存在的基因不同。重组还原酶基因可与天然存在的基因不同,因为重组还原酶基因可针对在具体门、纲、目、科、属、种或菌株的细胞中的表达经密码子优化。
天然存在的还原酶蛋白质的序列陈述于SEQ ID NO:2、SEQ ID NO:6、SEQ ID NO:10、SEQ ID NO:14、SEQ ID NO:18、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NO:34、SEQ IDNO:40、SEQ ID NO:44、SEQ ID NO:48、SEQ ID NO:52、SEQ ID NO:58、SEQ ID NO:62、SEQ IDNO:68或SEQ ID NO:74中。重组还原酶基因可编码或可不编码包括与SEQ ID NO:2、SEQ IDNO:6、SEQ ID NO:10、SEQ ID NO:14、SEQ ID NO:18、SEQ ID NO:24、SEQ ID NO:28、SEQ IDNO:34、SEQ ID NO:40、SEQ ID NO:44、SEQ ID NO:48、SEQ ID NO:52、SEQ ID NO:58、SEQ IDNO:62、SEQ ID NO:68或SEQ ID NO:74中所述氨基酸序列的100%序列同一性的蛋白质。例如,重组还原酶基因可编码与SEQ ID NO:2、SEQ ID NO:6、SEQ ID NO:10、SEQ ID NO:14、SEQ ID NO:18、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NO:34、SEQ ID NO:40、SEQ ID NO:44、SEQ ID NO:48、SEQ ID NO:52、SEQ ID NO:58、SEQ ID NO:62、SEQ ID NO:68或SEQ IDNO:74中所述氨基酸序列的生物活性部分具有100%序列同一性的蛋白质。
重组还原酶基因可编码与SEQ ID NO:2、SEQ ID NO:6、SEQ ID NO:10、SEQ ID NO:14、SEQ ID NO:18、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NO:34、SEQ ID NO:40、SEQ IDNO:44、SEQ ID NO:48、SEQ ID NO:52、SEQ ID NO:58、SEQ ID NO:62、SEQ ID NO:68或SEQID NO:74中所述氨基酸序列或其生物活性部分具有、具有至少或具有至多65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的还原酶蛋白质。重组还原酶基因可编码相对于包括SEQ ID NO:2、SEQ ID NO:6、SEQ ID NO:10、SEQ ID NO:14、SEQ ID NO:18、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NO:34、SEQ ID NO:40、SEQ ID NO:44、SEQ ID NO:48、SEQ ID NO:52、SEQ ID NO:58、SEQ ID NO:62、SEQ ID NO:68或SEQ ID NO:74中所述氨基酸序列的蛋白质具有约、至少约或至多约0.1%、0.5%、1%、2%、3%、4%、5%、10%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%、100%、100.1%、100.2%、100.3%、100.4%、100.5%、100.6%、100.7%、100.8%、100.9%、101%、105%、110%、115%、120%、125%、130%、135%、140%、145%、150%、160%、170%、180%、190%、200%、220%、240%、260%、280%、300%、320%、340%、360%、380%或400%还原酶活性的还原酶蛋白质。重组还原酶基因可编码与SEQ ID NO:2、SEQ ID NO:6、SEQ ID NO:10、SEQ ID NO:14、SEQ ID NO:18、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NO:34、SEQ ID NO:40、SEQ ID NO:44、SEQ ID NO:48、SEQ ID NO:52、SEQ ID NO:58、SEQ ID NO:62、SEQ ID NO:68或SEQ ID NO:74中所述氨基酸序列的在以下氨基酸位置开始的10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400、410、420、430、440、450、460、470、480、490或500个连续氨基酸具有、具有至少或具有至多65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的蛋白质:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206、207、208、209、210、211、212、213、214、215、216、217、218、219、220、221、222、223、224、225、226、227、228、229、230、231、232、233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、250、251、252、253、254、255、256、257、258、259、260、261、262、263、264、265、266、267、268、269、270、271、272、273、274、275、276、277、278、279、280、281、282、283、284、285、286、287、288、289、290、291、292、293、294、295、296、297、298、299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、316、317、318、319、320、321、322、323、324、325、326、327、328、329、330、331、332、333、334、335、336、337、338、339、340、341、342、343、344、345、346、347、348、349、350、351、352、353、354、355、356、357、358、359、360、361、362、363、364、365、366、367、368、369、370、371、372、373、374、375、376、377、378、379、380、381、382、383、384、385、386、387、388、389、390、391、392、393、394、395、396、397、398、399、400、401、402、403、404、405、406、407、408、409、410、411、412、413、414、415、416、417、418、419、420、421、422、423、424、425、426、427、428、429、430、431、432、433、434、435、436、437、438、439、440、441、442、443、444、445、446、447、448、449、450、451、452、453、454、455、456、457、458、459、460、461、462、463、464、465、466、467、468、469、470、471、472、473、474、475、476、477、478、479、480、481、482、483、484、485、486、487、488、489、490、491、492、493、494、495、496、497、498、499或500。
还原酶蛋白质的底物可包括长14到20个碳并在Δ9、Δ10或Δ11位置中具有亚甲基替换的任何脂肪酸。脂肪酸底物的长度可以是14、15、16、17、18、19或20个碳或其中可导出的任何范围。还原酶蛋白质可能够催化亚甲基替换的脂肪酸底物到(甲基)脂质的还原。还原酶蛋白质与甲基转移酶蛋白质一起可能够催化来自长14到20个碳并在Δ9、Δ10或Δ11位置中具有不饱和双键的任何脂肪酸的甲基化分支的产生。
在一些实施方案中,重组还原酶基因编码包括黄素腺嘌呤二核苷酸(FAD)结合结构域的还原酶蛋白质。在一些实施方案中,根据图20A-E中所示的比对,FAD结合结构域与弯曲嗜热单胞菌tmsA(SEQ ID NO:74)的氨基酸9-141或与来自耻垢分枝杆菌、范巴伦氏分枝杆菌、浅黄拟无枝酸球菌、甘氨酸棒状杆菌、谷氨酸棒状杆菌、浑浊红球菌、苏别蒂山农霉菌、气生诺尔氏菌、淡黄分枝杆菌、紫檀分枝杆菌或嗜热子囊菌的TmsA的相应部分具有至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.9%或100%序列同一性。
在一些实施方案中,重组还原酶基因编码包括含有FAD/FMN的脱氢酶结构域的还原酶蛋白质。在一些实施方案中,根据图20A-E中所示的比对,含有FAD/FMN的脱氢酶结构域与弯曲嗜热单胞菌tmsA(SEQ ID NO:74)的氨基酸22-444或与来自耻垢分枝杆菌、范巴伦氏分枝杆菌、浅黄拟无枝酸球菌、甘氨酸棒状杆菌、谷氨酸棒状杆菌、浑浊红球菌、苏别蒂山农霉菌、气生诺尔氏菌、淡黄分枝杆菌、紫檀分枝杆菌或嗜热子囊菌的TmsA的相应部分具有、具有至少或具有至多65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性。
在一些实施方案中,重组还原酶基因编码具有相对于SEQ ID NO:2、SEQ ID NO:6、SEQ ID NO:10、SEQ ID NO:14、SEQ ID NO:18、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NO:34、SEQ ID NO:40、SEQ ID NO:44、SEQ ID NO:48、SEQ ID NO:52、SEQ ID NO:58、SEQ IDNO:62、SEQ ID NO:68或SEQ ID NO:74中所述氨基酸序列不变的具体氨基酸的还原酶蛋白质。根据图20A-E中所示的比对,不变的氨基酸可包括弯曲嗜热单胞菌tmsA(SEQ ID NO:74)的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113个或氨基酸或氨基酸R31、A33、S37、N38、L39、F40、R43、D52、V59、D63、G73、M74、T76、Y77、D79、L80、V81、L85、P91、V93、V94、Q96、L97、T99、I100、T101、A105、G108、G110、E112、S113、S115、F116、R117、N118、P121、H122、E123、V125、E127、G133、P154、N155、Y157、Y162、L166、E171、V173、V177、H181、V208、G213、F216、Y222、L223、S236、D237、Y238、T239、Y245、S247、D254、T257、Y261、W263、R264、W265、D266、D268、W269、C272、A275、G277、Q279、R284、W287、R293、S294、G318、E232、V325、P328、E330、F339、F343、W353、C355、P356、W363、L365、Y366、P367、N376、F379、W380、V383、P384、N395、E399、G407、H408、K409、S410、L411、Y412、S413、Y417、F422、Y426、G428、R443、L447和V452或来自耻垢分枝杆菌、范巴伦氏分枝杆菌、浅黄拟无枝酸球菌、甘氨酸棒状杆菌、谷氨酸棒状杆菌、浑浊红球菌、苏别蒂山农霉菌、气生诺尔氏菌、淡黄分枝杆菌、紫檀分枝杆菌或嗜热子囊菌的TmsA中的相应氨基酸。
iii.包含重组tmsC基因的核酸.
核酸可包括如本文所述的10-甲基硬脂酸C基因(tmsC)。tmsC基因(例如,重组tmsC基因)可包括SEQ ID NO:21、SEQ ID NO:31、SEQ ID NO:37、SEQ ID NO:55、SEQ ID NO:65和SEQ ID NO:71中所述的任一核苷酸序列。tmsC基因(例如,重组tmsC基因)可衍生自放线菌的革兰氏阳性物种,例如分枝杆菌属、棒杆菌属、诺卡尔菌属、链霉菌属或红球菌属。tmsC基因(例如,重组tmsC基因)可选自由以下组成的组:甘氨酸棒状杆菌基因tmsC、南非分枝杆菌基因tmsC、淡黄分枝杆菌基因tmsC、范巴伦氏分枝杆菌基因tmsC、拉格西斯链霉菌基因tmsC和嗜热子囊菌基因tmsC。
重组tmsC基因可以是重组体,因为其可操作连接到tmsC基因的天然存在的启动子以外的启动子。所述基因可用于驱动特定物种细胞中的转录。重组tmsC基因可以是重组体,因为其相对于天然存在的tmsC基因含有一个或多个核苷酸替换。所述基因可用于提高特定物种的细胞中tmsC基因的mRNA转录物的翻译效率。
核酸可包括重组tmsC基因和启动子,其中重组tmsC基因和启动子可操作连接。重组tmsC基因和启动子可衍生自不同物种。例如,重组tmsC基因可编码放线菌的革兰氏阳性物种的tmsC蛋白质,并且重组tmsC基因可以可操作连接到启动子,所述启动子可驱动另一细菌门(例如,变形菌门,例如大肠杆菌)或真核生物(例如,藻类细胞、酵母细胞或植物细胞)中的转录。启动子可以是真核启动子。细胞可包括核酸,并且启动子可能够驱动所述细胞中的转录。细胞可包括重组tmsC基因,并且重组tmsC基因可以可操作连接到能驱动细胞中的重组tmsC基因的转录的启动子。细胞可以是酵母物种,并且启动子可以是酵母启动子。细胞可以是细菌物种,并且启动子可以是细菌启动子(例如,其中细菌启动子并非来自放线菌的启动子)。细胞可以是藻类物种,并且启动子可以是藻类启动子。细胞可以是植物物种,并且启动子可以是植物启动子。
重组tmsC基因可以可操作连接到无法驱动在重组tmsC基因起源的细胞中的转录的启动子。例如,启动子可不能结合重组tmsC基因源起源的细胞的RNA聚合酶。在一些实施方案中,启动子无法结合原核RNA聚合酶和/或起始由原核RNA聚合酶介导的转录。在一些实施方案中,重组tmsC基因可操作连接到无法在所述基因编码的蛋白质起源的细胞中驱动转录的启动子。例如,启动子可不能结合天然表达由重组tmsC基因编码的tmsC酶的细胞的RNA聚合酶。
启动子可以是诱导型启动子或组成型启动子。启动子可以是2016年1月28日公开的PCT专利申请公开第WO 2016/014900号(其在此以引用方式整体并入)中所述的任一启动子。WO 2016/014900描述衍生自酵母物种解脂耶氏酵母和腺嘌呤阿氏酵母的多种启动子,其可特别可用作用于驱动酵母细胞中的重组基因的转录的启动子。启动子可以是来自编码以下产物的基因的启动子:翻译延长因子EF-1α;甘油-3-磷酸酯脱氢酶;磷酸丙糖异构酶1;果糖-1,6-二磷酸醛缩酶;磷酸甘油酸酯变位酶;丙酮酸激酶;输出蛋白质EXP1;核糖体蛋白质S7;醇脱氢酶;磷酸甘油酸酯激酶;己糖转运蛋白;一般氨基酸通透酶;丝氨酸蛋白酶;异柠檬酸裂合酶;酰基-CoA氧化酶;ATP-硫酸化酶;己糖激酶;3-磷酸甘油酸酯脱氢酶;丙酮酸脱氢酶α亚基;丙酮酸脱氢酶β亚基;顺乌头酸酶;烯醇化酶;肌动蛋白;多药耐药蛋白(ABC转运蛋白);泛素;GTP酶;质膜Na+/Pi协同转运蛋白;丙酮酸脱羧酶;植酸酶;或α-淀粉酶,例如其中所述基因是酵母基因,例如来自解脂耶氏酵母或腺嘌呤阿氏酵母的基因。
重组tmsC基因可包括与SEQ ID NO:21、SEQ ID NO:31、SEQ ID NO:37、SEQ ID NO:55、SEQ ID NO:65或SEQ ID NO:71中所述核苷酸序列具有、具有至少或具有至多65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的核苷酸序列。重组tmsC可与SEQ ID NO:21、SEQID NO:31、SEQ ID NO:37、SEQ ID NO:55、SEQ ID NO:65和SEQ ID NO:71中所述任一核苷酸序列具有或可不具有100%序列同一性。重组tmsC基因可包括与SEQ ID NO:21、SEQ ID NO:31、SEQ ID NO:37、SEQ ID NO:55、SEQ ID NO:65和SEQ ID NO:71中所述核苷酸序列具有、具有至少或具有至多65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的核苷酸序列,并且重组tmsC基因可编码与SEQ ID NO:22、SEQ ID NO:32、SEQ ID NO:38、SEQ ID NO:56、SEQID NO:66和SEQ ID NO:72中所述氨基酸序列具有至少约95%、96%、97%、98%、99%或100%序列同一性的tmsC蛋白质。
重组tmsC基因可与天然存在的tmsC基因不同,因为重组tmsC基因可针对真核细胞,例如植物细胞、藻类细胞或酵母细胞中的表达经密码子优化。细胞可包括重组tmsC基因,其中重组tmsC基因针对所述细胞经密码子优化。
确切地,重组tmsC基因的至少或至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206、207、208、209、210、211、212、213、214、215、216、217、218、219、220、221、222、223、224、225、226、227、228、229、230、231、232、233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、250、251、252、253、254、255、256、257、258、259、260、261、262、263、264、265、266、267、268、269、270、271、272、273、274、275、276、277、278、279、280、281、282、283、284、285、286、287、288、289、290、291、292、293、294、295、296、297、298、299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、316、317、318、319、320、321、322、323、324、325、326、327、328、329、330、331、332、333、334、335、336、337、338、339、340、341、342、343、344、345、346、347、348、349、350、351、352、353、354、355、356、357、358、359、360、361、362、363、364、365、366、367、368、369、370、371、372、373、374、375、376、377、378、379、380、381、382、383、384、385、386、387、388、389、390、391、392、393、394、395、396、397、398、399、400、401、402、403、404、405、406、407、408、409、410、411、412、413、414、415、416、417、418、419、420、421、422、423、424、425、426、427、428、429、430、431、432、433、434、435、436、437、438、439、440、441、442、443、444、445、446、447、448、449、450、451、452、453、454、455、456、457、458、459、460、461、462、463、464、465、466、467、468、469、470、471、472、473、474、475、476、477、478、479、480、481、482、483、484、485、486、487、488、489、490、491、492、493、494、495、496、497、498、499或500个密码子可与天然存在的tmsC基因不同或可相对于天然存在的tmsC基因保持不变。例如,重组tmsC基因可包括与SEQ ID NO:21、SEQ IDNO:31、SEQ ID NO:37、SEQ ID NO:55、SEQ ID NO:65或SEQ ID NO:71中所述天然存在的核苷酸序列具有至少约65%序列同一性的核苷酸序列(例如,至少约70%、75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性),并且重组tmsC基因的核苷酸序列的至少5个密码子可与天然存在的核苷酸序列不同(例如,至少约10、15、20、25、30、35、40、45、50、60、70、80、90或100个密码子)。
tmsC基因编码tmsC蛋白质。tmsC蛋白质可以是由放线菌的革兰氏阳性物种表达的蛋白质,例如分枝杆菌属、棒杆菌属、诺卡尔菌属、链霉菌属或红球菌属。即使重组tmsC基因并非天然存在的tmsC基因,所述重组tmsC基因也可编码天然存在的tmsC蛋白质。例如,重组tmsC基因可与天然存在的tmsC基因不同,因为重组tmsC基因针对具体细胞中的表达经密码子优化。然而,经密码子优化的重组tmsC基因和天然存在的tmsC基因可编码相同的天然存在的tmsC蛋白质。
重组tmsC基因可编码选自以下的tmsC蛋白质:甘氨酸棒状杆菌酶tmsC、南非分枝杆菌酶tmsC、淡黄分枝杆菌酶tmsC、范巴伦氏分枝杆菌酶tmsC、拉格西斯链霉菌酶tmsC和嗜热子囊菌酶tmsC。重组tmsC基因可编码tmsC蛋白质,并且tmsC蛋白质可与前述任一种酶基本上相同,但重组tmsC基因可与编码所述酶的天然存在的基因不同。重组tmsC基因可与天然存在的基因不同,因为重组tmsC基因可针对在具体门、纲、目、科、属、种或菌株的细胞中的表达经密码子优化。
天然存在的tmsC蛋白质的序列陈述于SEQ ID NO:22、SEQ ID NO:32、SEQ ID NO:38、SEQ ID NO:56、SEQ ID NO:66和SEQ ID NO:72中。重组tmsC基因可编码或可不编码包括与SEQ ID NO:22、SEQ ID NO:32、SEQ ID NO:38、SEQ ID NO:56、SEQ ID NO:66和SEQ IDNO:72中所述氨基酸序列的100%序列同一性的蛋白质。例如,重组tmsC基因可编码与SEQID NO:22、SEQ ID NO:32、SEQ ID NO:38、SEQ ID NO:38、SEQ ID NO:56、SEQ ID NO:66和SEQ ID NO:72中所述氨基酸序列的生物活性部分具有100%序列同一性的蛋白质。重组tmsC基因可编码与SEQ ID NO:22、SEQ ID NO:32、SEQ ID NO:38、SEQ ID NO:56、SEQ IDNO:66或SEQ ID NO:72中所述氨基酸序列或其生物活性部分具有至少约95%、96%、97%、98%或99%序列同一性的tmsC蛋白质。
iv.包括重组甲基转移酶基因和重组还原酶基因的核酸
核酸可包括重组甲基转移酶基因和重组还原酶基因二者。重组甲基转移酶基因和重组还原酶基因可编码来自相同物种或来自不同物种的蛋白质。核酸可包括重组甲基转移酶基因、重组还原酶基因和/或tmsC基因。重组甲基转移酶基因、重组还原酶基因和tmsC基因可编码来自1、2或3个不同物种的蛋白质(即,基因可各自来自相同物种,两个基因可来自相同物种,或所有三个基因可来自不同物种)。
核酸可包括SEQ ID NO:77、SEQ ID NO:78或SEQ ID NO:79中所述的核苷酸序列。核酸可包括与SEQ ID NO:77、SEQ ID NO:78、SEQ ID NO:79、SEQ ID NO:83、SEQ ID NO:84、、SEQ ID NO:85、、SEQ ID NO:86、SEQ ID NO:87、SEQ ID NO:88、SEQ ID NO:89、SEQ IDNO:90、SEQ ID NO:91或SEQ ID NO:92中所述核苷酸序列具有、具有至少或具有至多65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的核苷酸序列。
在一些实施方案中,核酸编码同时包括甲基转移酶和还原酶或其片段的融合蛋白质。在本发明上下文中,“融合蛋白质”意指单一蛋白质分子,其含有通过单一肽链中的肽键共价连接的两种或更多种不同蛋白质或其片段。在一些实施方案中,融合蛋白质包括来自甲基转移酶蛋白质和还原酶蛋白质二者的酶活性结构域。核酸可进一步编码甲基转移酶与还原酶之间的连接体肽。在一些实施方案中,连接体肽包括氨基酸序列AGGAEGGNGGGA。连接体可包括约或至少约2、3、4、5、6、7、8、9、10、15、20、25或30个氨基酸或其中可导出的任何范围。核酸可包括本文所述甲基转移酶和还原酶基因中的任一种,并且所述核酸编码的融合蛋白质可包括本文所述甲基转移酶和还原酶蛋白质中的任一种,包括其生物活性片段。在一些实施方案中,融合蛋白质是tmsA-B蛋白质,其中tmsA蛋白质比tmsB蛋白质更靠近N末端。所述tmsA-B蛋白质的示例是由SEQ ID NO:97的核酸序列编码。在一些实施方案中,融合蛋白质是tmsB-A蛋白质,其中tmsB蛋白质比tmsA蛋白质更靠近N末端。所述tmsB-A蛋白质的示例是由SEQ ID NO:98的核酸序列编码。在一些实施方案中,融合蛋白质与SEQ ID NO:97或SEQ ID NO:98编码的融合蛋白质的氨基酸序列具有至少约80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或99.9%同一性。
C.组合物
本发明的各个方面涉及通过本文所述细胞产生的组合物。组合物可以是包括约或至少约75%、80%、85%、90%、95%或99%脂质的油组合物。组合物可包含支化(甲基)脂质和/或环外亚甲基取代的脂质。支化(甲基)脂质可以是羧酸(例如,10-甲基硬脂酸、10-甲基棕榈酸、12-甲基油酸、13-甲基油酸、10-甲基-十八-12-烯酸)、羧酸酯(例如,10-甲基硬脂酸酯、10-甲基棕榈酸酯、12-甲基油酸酯、13-甲基油酸酯、10-甲基-十八-12-烯酸酯)、酯(例如,二酰甘油、三酰甘油、磷脂)、硫酯(例如,10-甲基硬脂酰基CoA、10-甲基棕榈酰基CoA、12-甲基油酰基CoA、13-甲基油酰基CoA、10-甲基-十八-12-烯酰基CoA)或酰胺。环外亚甲基取代的脂质可以是羧酸(例如,10-亚甲基硬脂酸、10-亚甲基棕榈酸、12-亚甲基油酸、13-亚甲基油酸、10-亚甲基-十八-12-烯酸)、羧酸酯(例如,10-亚甲基硬脂酸酯、10-亚甲基棕榈酸酯、12-亚甲基油酸酯、13-亚甲基油酸酯、10-亚甲基-十八-12-烯酸酯)、酯(例如,二酰甘油、三酰甘油、磷脂)、硫酯(例如,10-亚甲基硬脂酰基CoA、10-亚甲基棕榈酰基CoA、12-亚甲基油酰基CoA、13-亚甲基油酰基CoA、10-亚甲基-十八-12-烯酰基CoA)或酰胺。10-甲基脂质、10-亚甲基脂质或二者。明确预期,可从某些实施方案排除上文一种或多种脂质。
在一些方面中,组合物是通过以下方式来产生:培养包括本文所述任何细胞的培养物,和从细胞培养物回收油组合物。培养物中的细胞可含有本文所述任何重组甲基转移酶基因和/或本文所述任何重组还原酶基因。培养基和条件可基于要培养的细胞的种类来选择,并且可经优化以提供所需脂质谱的最大产量。
已知从细胞培养物回收油组合物的多种方法。例如,脂质、脂质衍生物和烃可用例如己烷的疏水溶剂萃取。脂质和脂质衍生物也可使用液化、油液化和超临界CO2萃取来萃取。回收过程可包括例如通过过滤或离心收获所培养细胞,溶解细胞以产生溶解物,和使用疏水溶剂萃取脂质/烃组分。
除了在细胞内积累以外,本文所述脂质可由细胞分泌。在该情形中,回收脂质的过程可能不需要从细胞产生溶解物,而是从培养基收集所分泌的脂质。因此,本文所述组合物可通过培养分泌本文所述脂质之一的细胞来制造,所述脂质例如链长度为14-20个碳并且在Δ9、Δ10或Δ11位置具有甲基分支的线性脂肪酸。
在一些实施方案中,油组合物包含以重量计约、至少约或至多约1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的支化(甲基)脂质(例如10-甲基脂肪酸)或其中可导出的任何范围。在一些实施方案中,10-甲基脂肪酸占组合物中的脂肪酸以重量计约、至少约或至多约1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或其中可导出的任何范围。
D.产生支化(甲基)脂质的方法
本发明的各个方面涉及产生支化(甲基)脂质的方法。所述方法可包括用培养基孵育如上文所述的细胞或多个细胞。培养基可任选地补充有未支化不饱和脂肪酸,例如油酸,其用作甲基化的底物。培养基可任选地补充有甲硫氨酸或s-腺苷甲硫氨酸,其可类似地用作底物。因此,所述方法可包括使细胞或多个细胞与油酸、甲硫氨酸或二者接触。所述方法可包括在生物反应器中孵育如上文所述的细胞或多个细胞。所述方法可包括例如通过用有机溶剂萃取从细胞和/或从培养基回收脂质。
所述方法可包括使细胞或多个细胞脱胶,例如以移除蛋白质。所述方法可包括对细胞的脂质进行转酯化或酯化。可使用例如甲醇或乙醇的醇进行转酯化或酯化,例如由此产生脂肪酸甲基酯或脂肪酸乙基酯。
实施例
通过以下实施例进一步阐释本说明书,所述实施例不应视为以任何方式进行限制。
实施例1:10-甲基硬脂酸基因tmsA、tmsB和tmsC的鉴别
已鉴别两种不同基因负责结核分枝杆菌中的10-甲基硬脂酸酯产生(参见Meena,L.S.和P.E.Kolattukudy,Biotechnology&Applied Biochemistry 60(4):412(2013);和Meena,L.S.等Biological Chemistry 394(7):871(2013))。令人好奇的是,两种基因在每个产生10-甲基硬脂酸酯的放线菌物种中都不保守。虽然放线菌的不同物种可能各自独立地进化合成10-甲基硬脂酸酯的基因,但所述趋同进化较为罕见。较简单的解释是,单一共同基因或基因集负责放线菌中的10-甲基硬脂酸酯产生。
为了鉴别可能负责放线菌中10-甲基硬脂酸酯产生的基因,将来自产生10-甲基硬脂酸酯的放线菌的多个物种的与编码催化脂质合成反应的酶的基因具有序列同源性的基因比对。鉴别出两种独特基因并命名为10-甲基硬脂酸A(tmsA)和10-甲基硬脂酸B(tmsB),其各自在放线菌的每一产生10-甲基硬脂酸酯的物种内的相同操纵子中出现(图3)。第三种基因名为10-甲基硬脂酸C(tmsC),对于一些产生10-甲基硬脂酸酯的物种,经鉴别为在与tmsA和tmsB相同的操纵子中出现。
10-甲基硬脂酸酯B基因与环丙烷合酶具有序列同源性,这表明10-甲基硬脂酸酯B基因可能够将甲基转移到脂肪酸。10-甲基硬脂酸A基因与氧化还原酶具有序列同源性,这表明其可能够还原支化脂肪酸的环外亚甲基。
将来自耻垢分枝杆菌的10-甲基硬脂酸酯A和10-甲基硬脂酸酯B基因克隆到质粒(名为pNC704)中用于在大肠杆菌中表达(图4)。使用具有耻垢分枝杆菌tmsA和tmsB的pNC704质粒转化大肠杆菌。使经转化细胞在37℃下在补充有100μg/mL油酸的LB培养基中生长20小时。将大肠杆菌用空载体pNC53(SEQ ID NO:81)转化并平行生长作为对照。两个经pNC704转化的大肠杆菌集落各自以占细胞中总脂肪酸的2.0%和2.1%的浓度产生10-甲基硬脂酸酯(表1)。对照未产生10-甲基硬脂酸酯。
表1.以总细胞脂肪酸百分比计的脂肪酸浓度。
“10-MS”对应于10-甲基硬脂酸酯
在HCl的甲醇溶液中将细胞脂质转酯化以产生脂肪酸甲基酯(FAME)。将硬脂酸、10-甲基硬脂酸和油酸转酯化为FAME作为标准品。将每一样品/标准品萃取到异辛烷中并通过各种气相色谱法来分析(图7和8)。首先通过毛细管气相色谱使用火焰离子化检测器(GC-FID)分析FAME。从大肠杆菌产生的FAME展示对应于10-甲基硬脂酸FAME标准品的GC峰,其表明耻垢分枝杆菌tmsA和tmsB基因表达能合成10-甲基硬脂酸的蛋白质(图7A)。
FAME也从经空载体pNC53转化的大肠杆菌产生并如上文通过GC-FID加以分析。这个样品未展示对应于10-甲基硬脂酸FAME的GC峰,从而进一步表明耻垢分枝杆菌tmsA和tmsB基因表达能合成10-甲基硬脂酸的蛋白质(图7B)。
使用以单离子监测模式(SIM)配置的GC-MS分析从tmsA/tmsB样品产生的FAME,其监测在312.3和313.3amu处的m/z。质谱图展示在312.3amu处的峰,对应于10-甲基硬脂酸甲基酯的分子量(图8B)。另外,在312.3amu的峰与在313.3amu的峰的比率表明,在312.3amu处观察到的离子含有20.6个碳,其对应于10-甲基硬脂酸甲基酯中的实际碳数(20)。
实施例2:使用来自不同供体生物体的tmsB和tmsA基因在大肠杆菌中10-甲基脂肪 酸的产生
方法:
供体细菌基因组DNA是从德国微生物保藏中心(DSMZ,德国)获得。质粒是通过标准分子生物学技术使用“酵母缺口修复”方法来构建(Shanks,等,Appl.Microbiol.Biotechnol.,48:232(1997))。将空大肠杆菌表达载体pNC53(SEQ ID NO:82)用酶PmeI(New England Biolabs,MA)限制性消化,在该载体上的tac启动子与trpT的终止子序列之间产生双链断裂。将tmsAB基因操纵子从基因组DNA用引物侧翼序列进行PCR扩增,使得tmsB ATG开始位点通过同源重组整合到tac启动子末端中。大肠杆菌转录和翻译是由tac启动子驱动。tmsA基因的终止密码子类似地整合到trpT的终止子区的开始部分中。嵌入操纵子的tmsA基因的大肠杆菌翻译依赖于来自供体生物体DNA的天然翻译信号。如果需要,将tmsB的第一个密码子从GTG或TTG改变为ATG;否则天然密码子序列保持在大肠杆菌表达载体中。
通过DNA测序和限制性消化检查载体的正确构建。针对该实施例产生的载体图解说明于图9中。然后使用转化到大肠杆菌Top10(Invitrogen)中的载体进行发酵研究。将细胞接种于50mL补充有100mg/L氨苄西林和100mg/L油酸的LB培养基中,所述油酸来自100mg/mL油酸于乙醇中的原液。将培养物在37℃和200rpm下于三角瓶中孵育41小时。在培养结束时,通过在Eppendorf 5810 R医用离心机中以4000rpm离心15分钟来收获细胞,用等体积的去离子水洗涤一次,再悬浮于0.1mL去离子水中,并在-80℃下冷冻。然后将细胞冻干到干燥并用于以0.5N HCl于甲醇中的溶液(20x 1mL安瓿,Sigma)在85℃下进行酸催化的转酯化90分钟。在转酯化完成后,通过添加水和异辛烷使用双液相体系萃取将反应混合物中的脂质可溶组分与水溶性组分分离,并且之后用配备有机器人注射器、火焰离子化检测器(Agilent Technologies 7890B GC系统和7396自动采样器)和HP-INNOWAX毛细管柱(30m x0.25mm x 0.15微米,Agilent)的毛细管气相色谱(GC)来分析。10-甲基硬脂酸参考标准品是从Larodan AB(Sweden)获得。
结果:
对于所测试11种载体中的4种观察到油酸转化为10-甲基硬脂酸。使用来自嗜热子囊菌(22%)和弯曲嗜热单胞菌(38%)的tmsAB基因时出现最高转化百分比,如下表2中所指示。
表2
实施例3:浑浊红球菌PD630中的tmsB和tmsA表达
产油细菌浑浊红球菌可天然以低水平产生10-甲基脂肪酸(总脂肪酸的0.2%(等,Microbiology,72:5027(2006)),并且另外具有tmsB和tmsA基因的天然同系物,但所述同系物尚未在文献中得到鉴别。在这个实施例中,发明人测试浑浊红球菌中tmsB和tmsA基因的过表达是否可增加10-甲基支化脂肪酸含量。
方法:
浑浊红球菌PD630是从德国微生物保藏中心(DSMZ)的原料DSM 44193获得。通过用4mL LB培养基稀释来使培养物复苏,并在鼓式滚筒中在30℃下孵育3天。一旦出现明显生长,将10μL肉汤加入LB平板上的单一集落中并在30℃下再孵育3天。分离一个集落并命名为菌株NS1104。
所有浑浊红球菌生长都是在30℃下进行。在补充有适当抗生素的LB培养基中进行常规培养。在如Kalscheuer等所改良的营养肉汤培养基中进行遗传转化(Appl.Microbiol.and Biotechnol.,52:508(1999)),所述营养肉汤含有5g/L蛋白胨、2g/L酵母提取物、1g/L牛肉膏、5g/L NaCl、8.5g/L甘氨酸和10g/L蔗糖。脂质产生是在含有以下组分并用NaOH调节到pH 7.6并在使用前经过滤灭菌的确定成分培养基中进行。
浑浊红球菌发酵培养基
质粒是通过标准分子生物学技术使用“酵母缺口修复”方法来构建(Shanks等,Applied and Environmental Biology 72:5207-36(2006))。使用含有红球菌属repA复制起点和庆大霉素抗性标记物的合成DNA序列(Lessard,BMC Microbiol.,4:15(2004))从两种含有在tac启动子控制下的来自耻垢分枝杆菌和嗜热子囊菌的tmsAB基因的质粒产生浑浊红球菌-大肠杆菌-酿酒酵母穿梭载体。简单来说,repA和genR合成DNA是用tmsAB目的质粒的约50bp侧翼同源性区域来构建。用PacI对目的质粒进行限制性消化,并且侧翼同源性区域修复缺口,使得能通过酿酒酵母中的ura3基因进行遗传选择。从酿酒酵母通过苯酚/氯仿萃取和乙醇沉淀来分离DNA,并用于转化大肠杆菌。通过mini-prep(Qiagen,USA)分离正确质粒构建体,并通过限制性消化进行筛选。分离含有耻垢分枝杆菌tmsAB的质粒pNC985(SEQ ID NO:93)和含有嗜热子囊菌tmsAB的pNC986(SEQ ID NO:94)(图10)并用于转化浑浊红球菌。
遵循Kalscheuer等(Kalscheuer 1999)所述的方案转化浑浊红球菌。使细胞在改良营养肉汤中生长过夜,随后以0.13的起始光学密度转移到50mL改良营养肉汤培养基中。在OD 0.36收获细胞,在50mL冰冷水中洗涤两次,并且再悬浮于1.7mL冰冷水中。然后将细胞细分为350μL体积加入2μL 400-600ng/μL浓度的质粒DNA。将细胞加DNA在39℃下孵育5分钟,之后立即在冰上冷却并进行电转化。使用2mm间隙杯以2kV脉冲(600Ω,25μF,12ms时间常数)递送电脉冲。然后用600μL SOC培养基稀释细胞并在30℃下孵育过夜。然后将200μL过夜细胞肉汤平铺于含有10μg/mL庆大霉素的LB琼脂上,并在30℃下再孵育4天以供形成集落。挑选庆大霉素抗性集落用于进一步分析,在不添加质粒DNA的对照板上未见到抗性集落。
在30℃下在250mL摇瓶中以200rpm进行4天发酵(25mL工作体积,使用确定成分培养基,酌情添加10μg/mL庆大霉素)。从LB+10μg/mL庆大霉素中的48小时生长培养物制备接种物。接种量为最终体积的1:25v/v。在发酵结束时,收获细胞并再悬浮于1mL蒸馏水中并在-80℃下冷冻。冷冻后,将细胞冻干到干燥,并随后用甲醇HCl在80℃下将完整细胞原位转酯化,之后萃取到异辛烷中并通过气相色谱法和火焰离子化检测进行定量。
结果:
浑浊红球菌经两种载体转化,这两种载体是表达耻垢分枝杆菌tmsAB基因的pNC985和表达嗜热子囊菌tmsAB基因的pNC986。如下表3中所示,pNC986转化的一种分离物菌株NS1155以总脂肪酸的7.2重量%产生10-甲基硬脂酸,与之相比,对照菌株NS1104以总脂肪酸的3.6重量%产生10-甲基硬脂酸。
表3:在经tmsAB表达载体转化的浑浊红球菌菌株中测量的10-甲基硬脂酸的重量百分比。
实施例4:用于tmsB和tmsA的酰基链底物范围
发明人进行以下实验以确定来自弯曲嗜热单胞菌的tmsB和tmsA酶的酰基链底物范围,特别是脂肪酸链长度和双键位置。
方法:
不饱和脂肪酸购自Nu-Check Prep公司,Elysian MN。将脂肪酸以100mg/mL的浓度溶解于DMSO中,棕榈油酸、油酸和异油酸除外,将其以100mg/mL的浓度溶解于乙醇中。10-甲基硬脂酸参考标准品是从Larodan AB(Sweden)获得。
大肠杆菌菌株NS1161和NS1162用于该实验中;菌株NS1161是通过将对照(空)载体质粒转化到保持天然大肠杆菌环丙烷脂肪酸合酶(cfa)基因的kanR断裂的大肠杆菌CGSC9407(也称为JW1653-1Keio保藏物)中来构建。菌株NS1162是通过将含有在组成型tac启动子控制下的弯曲嗜热单胞菌tmsB和tmsA基因的质粒pNC906(SEQ ID NO:88)(图9B)转化到大肠杆菌CGSC 9407中来构建。
使大肠杆菌菌株在补充有100mg/L氨苄西林和100mg/L脂肪酸的LB培养基中生长。用过夜预培养物的1:1000稀释物接种培养物并使其在37℃下在旋转鼓式滚筒中在具有5mL工作体积的14mL塑料培养管中生长24小时。在培养结束时,通过在Eppendorf 5810 R医用离心机中以4000rpm离心15分钟来收获细胞,用等体积的去离子水洗涤一次,再悬浮于0.1mL去离子水中,并在-80℃下冷冻。然后将细胞冻干到干燥并用于进行HCl-甲醇催化的转酯化反应以产生脂肪酸甲基酯(FAME)。将这些样品溶解于异辛烷中并注入配备有火焰离子化检测器的气相色谱系统(Agilent Technologies)中。
结果:
在饲喂外源游离脂肪酸时,大肠杆菌可将所述游离脂肪酸纳入其磷脂和其他脂质结构中。将菌株NS1161和NS1162与18种不同的不饱和脂肪酸一起并在不补充脂肪酸的对照培养基中培养,并且比较两种菌株的FAME谱。为了鉴别新的不饱和脂肪酸,通过如与无补充的参考培养物相比的菌株NS1161 FAME谱来鉴别对应于所补充脂肪酸的GC峰。并且随后针对相同GC峰检查菌株NS1162 FAME谱,并且检查对应于甲基化脂肪酸的在特征性保留时间漂移的新峰(0.24向前漂移到0.08分钟,且相对漂移随着总保留时间增加而减小)。使用10-甲基硬脂酸参考标准品(Larodan AB,Sweden)作为对照以将保留时间分配给10-甲基硬脂酸。
如下表4中所观察到的,甲基化发生于具有14、15、16、17、18、19和20个碳的脂肪酸上,并且发生于Δ9、Δ10和Δ11双键位置上。转化为甲基化脂肪酸的最高百分比发生在16和18个碳的脂肪酸上,在Δ9和Δ11位置处。
表4
实施例5:tmsA辅因子使用
发明人进行以下实验以确定tmsA酶(10-亚甲基还原酶)使用哪种氧化还原辅因子从中间体10-亚甲基脂肪酸产生全饱和10-甲基脂肪酸。
方法:
大肠杆菌菌株NS1161、NS1163和NS1164用于该实验中;菌株NS1161是通过将对照(空)载体质粒pNC53转化到保持天然大肠杆菌环丙烷脂肪酸合酶(cfa)基因的kanR断裂的大肠杆菌CGSC 9407(也称为JW1653-1Keio保藏物)中来构建。菌株NS1163是通过将含有在组成型tac启动子控制下的弯曲嗜热单胞菌tmsB基因的质粒pNC963(SEQ ID NO:95)(图11)转化到大肠杆菌CGSC 9407中来构建。菌株NS1164是通过将含有在组成型tac启动子控制下的弯曲嗜热单胞菌tmsA基因的质粒pNC964(SEQ ID NO:96)(图11)转化到大肠杆菌CGSC9407中来构建。
使菌株NS1163在37℃下在1L补充有100mg/L氨苄西林的LB培养基中生长24小时(2x500mL,在2L三角瓶中)。培养后,通过在Eppendorf 5810 R医用离心机中以4000rpm离心15分钟来收获细胞,并在100mL PBS缓冲液中洗涤两次。在浓缩到40mL PBS缓冲液中之后,将细胞在85℃下热灭活30min。然后将灭活细胞分配到1mL等份中并用0.3克0.1mm玻璃珠使用“大肠杆菌”设定的MP fastprep-24(MP biomedicals,LLC)粉碎。通过以2000xg微离心30秒以移除珠粒来收集全细胞溶解悬浮液,并且之后将每管0.7mL悬浮液转移到新管中并在-80℃下冷冻直到进一步使用为止。
在测定当天,通过在37℃和200rpm下在三角摇瓶中在50mL补充有100mg/L氨苄西林的LB培养基中接种过夜培养物(1:1000稀释)来使菌株NS1161和NS1164生长。在培养4小时后,在5℃下收获细胞,在冰冷PBS中洗涤1x并且随后再悬浮于1mL塑料螺旋管中的750μLPBS中。添加0.3克0.1mm玻璃珠粒并用“大肠杆菌”设定的MP fastprep-24溶解细胞。然后将细胞悬浮液以12,000xg微量离心5min,并将上清液转移到新管中并且保持在冰上直到测定为止。
测定反应:700μL NS1163全溶解物、200μL 37.2mg/mL NADPH溶液(测定浓度10mM)、33.2mg/mL NADH溶液(测定浓度10mM)或PBS缓冲液,以及100μL无细胞提取物或PBS缓冲液。将测定管密封并在37℃下在鼓式滚筒上旋转16小时。为了结束测定,将管在-80℃下冷冻,然后冻干到干燥,之后用甲醇HCL进行原位萃取和转酯化。通过具有火焰离子化检测的GC确定脂肪酸谱,并且比较10-甲基脂肪酸峰面积与总脂肪酸峰面积以确定测定活性。
结果:
使通过表达弯曲嗜热单胞菌tmsB基因积累10-亚甲基中间体脂肪酸的菌株NS1163生长,将其收获、灭活并溶解,以用作tmsA(10-亚甲基还原酶)测定的底物。向该底物无细胞提取物添加表达弯曲嗜热单胞菌tmsA基因的大肠杆菌菌株NS1164或含有空表达载体的大肠杆菌菌株NS1161,以及NADPH或NADH。如下表5中所观察到的,在此测定中仅弯曲嗜热单胞菌tmsA和NADPH的存在导致10-甲基脂肪酸的合成。
表5
ND=该测定未检测
实施例6:tmsB基因在酵母解脂耶氏酵母和腺嘌呤阿氏酵母中的表达
将编码来自耻垢分枝杆菌、范巴伦氏分枝杆菌、浅黄拟无枝酸球菌、甘氨酸棒状杆菌、浑浊红球菌、苏别蒂山农霉菌、气生诺尔氏菌、淡黄分枝杆菌、紫檀分枝杆菌、嗜热子囊菌和弯曲嗜热单胞菌的天然细菌密码子tmsB序列的序列克隆到标准耶氏酵母属表达载体中,所述标准耶氏酵母属表达载体由解脂假丝酵母TEF1启动子驱动并且含有ARS68解脂假丝酵母复制起点、用于选择的诺尔斯菌素抗生素抗性基因以及用于在酿酒酵母中的高拷贝维持的2μ起点和URA3基因。克隆是使用酵母缺口修复方法(Shanks 2006)和在尿嘧啶缺陷型培养基上选择来进行。遵循标准乙酸锂热激方案和在补充有500μg/mL诺尔丝菌素(nourseothricin)的YPD培养基上选择来转化解脂假丝酵母。选择集落并转移到每孔含有300μL氮限制脂质产生培养基的96孔板中,并在30℃和900rpm振荡下孵育96小时。培养基含有100g/L葡萄糖、0.5g/L尿素、1.5g/L酵母提取物、0.85g/L酪蛋白氨基酸、1.7g/L无氨基酸YNB基料和5.1g/L邻苯二甲酸氢钾,pH 5.5。发酵后,将细胞离心,用蒸馏水洗涤,并在-80℃下冷冻,之后冻干到干燥。用0.5N HCl的甲醇溶液将干燥细胞在85℃下原位转酯化90分钟,以产生适合进行气相色谱分析的脂肪酸甲基酯(FAME)。将这些样品溶解于异辛烷中并注入配备有火焰离子化检测器的气相色谱系统(Agilent Technologies)中。基于已知标准品以及在大肠杆菌tms表达实验中鉴别的10亚甲基和10甲基脂肪酸对总C16和C18支化脂肪酸进行鉴别和定量。在独立实验中通过质谱验证10-甲基脂肪酸和10-亚甲基脂肪酸身份。图12显示,用来自嗜热子囊菌和弯曲嗜热单胞菌的tmsB转化的解脂假丝酵母产生最高量的10-亚甲基硬脂酸。
为了测试腺嘌呤阿氏酵母中的tmsB活性,将来自耶氏酵母属弯曲嗜热单胞菌tmsB(SEQ ID NO:75)的表现最好的tmsB基因克隆到在阿氏酵母属ADH1启动子控制下的组成型表达载体中,得到质粒pNC1065。分离个别转化体集落并使其在40℃下在标准工业培养基(具有高C:N比率以促进脂质积累)中生长4天。分离细胞沉淀,用水洗涤一次并冻干。如同耶氏酵母属菌株一样,将总C16和C18脂肪酸转酯化并通过GC分析。图13显示,用来自弯曲嗜热单胞菌的tmsB转化的腺嘌呤阿氏酵母产生10-亚甲基脂肪酸。
实施例7:解脂耶氏酵母和酿酒酵母中的tmsA和tmsB共表达
发明人发现,在酵母菌属和耶氏酵母属酵母菌株中,tmsA和tmsB基因的同时表达可分别产生支化10-甲基和10-亚甲基脂肪酸。对于在耶氏酵母属中的表达,将组成型表达来自弯曲嗜热单胞菌(pNC984)、嗜热子囊菌(pNC983)和谷氨酸棒状杆菌(pNC991)的tmsA的天然细菌序列的质粒各自转化到含有弯曲嗜热单胞菌tmsB基因(从上文实施例6分离)的稳定整合拷贝的菌株NS1117中。分离个别转化体并使其在30℃下在摇瓶培养基中生长4天。分离脂肪酸并如实施例6中通过GC分析。如图14中所示,与亲代菌株相比,所分析的所有tmsA基因都在耶氏酵母属中以可检测水平产生10甲基脂肪酸。弯曲嗜热单胞菌tmsA基因产生的10-甲基脂肪酸多于所分析的其他tmsA基因。
对于在酵母菌属中的表达,将在耶氏酵母属中具有已证实基因活性的质粒pNC984(具有NAT标记物的弯曲嗜热单胞菌tmsA)和pNC1025(具有HYG标记物的弯曲嗜热单胞菌tmsB)个别且一起地转化到酿酒酵母菌株NS20中,并且在含有适当抗生素的培养基上选择转化体。使个别转化分离物在YPD培养基中在30℃下生长2天。加工细胞沉淀,并且如同耶氏酵母属分析总脂肪酸。如图15中所示,仅用tmsB转化的菌株仅产生10-亚甲基脂肪酸,并且用tmsA和tmsB二者转化的菌株产生相对高百分比的10-甲基脂肪酸。
实施例8:tmsA-B融合蛋白质在大肠杆菌、酿酒酵母、解脂耶氏酵母和腺嘌呤阿氏 酵母中的表达
发明人发现,在单一多肽中表达tmsA和tmsB酶提高10-亚甲基脂肪酸到10-甲基脂肪酸的转化率。同时含有tmsA和tmsB的活性的单一蛋白质是通过在框中融合弯曲嗜热单胞菌tmsA和tmsB的基因来产生,两个基因通过柔性连接体结构域隔开。选择弯曲嗜热单胞菌tmsA和tmsB酶是因为其在酵母中产生的10-甲基支化脂肪酸最多。选择在耶氏酵母属FAS2基因中天然存在的具有序列AGGAEGGNGGGA的12个氨基酸的短连接体来连接两种酶。测试两种融合酶在细菌和酵母中的活性,即tmsA-B(NG540;由SEQ ID NO:97编码)和tmsB-A(NG541;由SEQ ID NO:98编码)。
对于大肠杆菌表达,将含有弯曲嗜热单胞菌tmsA-B和tmsB-A基因以及tac启动子和trpT的终止子的质粒pNC1069和pNC1070各自转化到大肠杆菌CGSC 9407中。使个别转化的菌株生长并如上文实施例2中测定总脂肪酸。如下表6中所示,tmsA-B和tmsB-A基因二者都导致在大肠杆菌中产生甲基化硬脂酸。
表6.将油酸和异油酸的甲基化计算为转化为10-甲基脂肪酸和12-甲基脂肪酸的C18:1脂肪酸的百分比。
对于酿酒酵母和解脂耶氏酵母表达,将NG540(SEQ ID NO:97)和NG541(SEQ IDNO:98)各自克隆到含有用于酵母菌属中的高拷贝保持的酵母2u复制起点的标准耶氏酵母属表达载体中,得到相应载体pNC1067和pNC1068。
通过标准方案将质粒pNC1067和pNC1068转化到酵母菌属菌株NS20中,并且选择个别转化的菌株用于支化脂肪酸产生的测定。使菌株在30℃下在25ml YPD培养基中生长2天。冻干细胞沉淀并如实施例2中通过基本转酯化和GC分析对总脂肪酸进行分析。图16显示,tmsA-B和tmsB-A二者在酿酒酵母中的表达都导致产生10甲基脂肪酸。
通过标准热激方案将质粒pNC1067和pNC1068转化到解脂耶氏酵母中。选择个别得到的转化体菌株用于10-亚甲基和10-甲基脂肪酸产生的分析。使菌株生长并如在实施例7中通过GC分析。图17显示,tmsA-B和tmsB-A二者在解脂假丝酵母中的表达都导致产生10甲基脂肪酸,但tmsA-B在将10-亚甲基脂肪酸转化为10-甲基脂肪酸方面更有效。
为了在腺嘌呤阿氏酵母中表达,将NG540克隆到含有组成型阿氏酵母属ADH1启动子的标准表达载体中,得到pNC1151。将pNC1151转化到阿氏酵母属菌株NS1166中,并选择个别转化体以测定10-甲基脂肪酸的产生。使阿氏酵母属菌株生长并如在实施例7中通过GC分析。
这些实验显示,在大肠杆菌(表6)、酿酒酵母(图16)、解脂耶氏酵母(图17)和腺嘌呤阿氏酵母(图18)中检测到10-甲基C16和C18脂肪酸,指示融合酶同时含有tmsA和tmsB活性。10-亚甲基中间体的低产量(在大肠杆菌和酿酒酵母菌中没有检测到,在解脂耶氏酵母和腺嘌呤阿氏酵母属中为低水平)指示,融合蛋白质有效地将不饱和脂肪酸转化为10甲基脂肪酸。
实施例9:tmsB序列分析
用CLUSTAL OMEGA软件程序(European Molecular Biology Laboratory,EMBL)将由来自耻垢分枝杆菌、范巴伦氏分枝杆菌、浅黄拟无枝酸球菌、甘氨酸棒状杆菌、谷氨酸棒状杆菌、浑浊红球菌、苏别蒂山农霉菌、气生诺尔氏菌、淡黄分枝杆菌、紫檀分枝杆菌、嗜热子囊菌和弯曲嗜热单胞菌的tmsB基因编码的tmsB蛋白质序列与来自大肠杆菌的环丙烷脂肪酸合酶(Cfa)酶比对。图19A-D显示这些蛋白质序列的比对。大肠杆菌Cfa与TmsB酶共享同源性并实施与TmsB类似的反应,使脂肪酸磷脂双键甲基化,但产生环丙烷部分而不是亚甲基部分。
大肠杆菌Cfa酶的某些氨基酸被认为结合活性位点碳酸氢根离子。Iwig等,J.Am.Chem.Soc.127:11612-13(2005)。这些氨基酸是大肠杆菌酶的C139、E239、H266、I268和Y317,其在共有tmsB蛋白质序列中是保守的(弯曲嗜热单胞菌tmsB序列SEQ ID NO:76上的C160、E266、H293、I295和Y348)。
另外,有16个氨基酸残基对于所有12种tmsB蛋白质序列是保守的,但在大肠杆菌Cfa序列中不保守。这些氨基酸可特异性用于10-亚甲基加成到脂肪酸磷脂,而不是由大肠杆菌Cfa蛋白质进行的环丙烷加成。这些根据弯曲嗜热单胞菌tmsB序列编号的保守氨基酸是SEQ ID NO:76的D23、G24、A59、H128、F147、Y148、L180、L193、M203、G236、A241、R313、R318、E320、L359、L400。
BLASTp保守结构域分析(National Center for Biotechnology Information,NCBI)鉴别来自弯曲嗜热单胞菌tmsB的氨基酸192-291的S-腺苷甲硫氨酸依赖性甲基转移酶结构域。S-腺苷甲硫氨酸结合位点氨基酸残基经鉴别为V196、G197、C198、G199、W200、G201、G202、T219、L220、Q246、D247、Y248和D262。
表7显示所指示蛋白质相对于弯曲嗜热单胞菌tmsB的序列同一性百分比:
表7.
如表7中所示,在来自不同物种的tmsB蛋白质序列之间存在大量变异。然而,虽然序列有变异,但若干种蛋白质在本文中显示具有相同的催化亚甲基取代的脂质产生的能力。
实施例10:tmsA序列分析
用CLUSTAL OMEGA软件程序(European Molecular Biology Laboratory,EMBL)将来自耻垢分枝杆菌、范巴伦氏分枝杆菌、浅黄拟无枝酸球菌、甘氨酸棒状杆菌、谷氨酸棒状杆菌、浑浊红球菌、苏别蒂山农霉菌、气生诺尔氏菌、淡黄分枝杆菌、紫檀分枝杆菌、嗜热子囊菌和弯曲嗜热单胞菌的tmsA基因编码的tmsA蛋白质序列与来自大肠杆菌的乙醇酸氧化酶亚单位GlcD酶比对。大肠杆菌GlcD酶似乎不进行与TmsA相似的酶反应,但其为与大肠杆菌基因组中的TmsA最密切同源的蛋白质。
图20A-E显示tmsA蛋白质的比对。有114个氨基酸残基对于所有12种tmsA蛋白质序列是保守的,但在大肠杆菌GlcD序列中不保守。这些氨基酸是(根据弯曲嗜热单胞菌序列(SEQ ID NO:74)编号):R31、A33、S37、N38、L39、F40、R43、D52、V59、D63、G73、M74、T76、Y77、D79、L80、V81、L85、P91、V93、V94、Q96、L97、T99、I100、T101、A105、G108、G110、E112、S113、S115、F116、R117、N118、P121、H122、E123、V125、E127、G133、P154、N155、Y157、Y162、L166、E171、V173、V177、H181、V208、G213、F216、Y222、L223、S236、D237、Y238、T239、Y245、S247、D254、T257、Y261、W263、R264、W265、D266、D268、W269、C272、A275、G277、Q279、R284、W287、R293、S294、G318、E232、V325、P328、E330、F339、F343、W353、C355、P356、W363、L365、Y366、P367、N376、F379、W380、V383、P384、N395、E399、G407、H408、K409、S410、L411、Y412、S413、Y417、F422、Y426、G428、R443、L447和V452。
BLASTp保守结构域分析(National Center for Biotechnology Information,NCBI)鉴别来自弯曲嗜热单胞菌tmsA(SEQ ID NO:74)的氨基酸9-141的黄素腺嘌呤二核苷酸(FAD)结合结构域,以及来自氨基酸22-444的含有FAD/FMN的脱氢酶结构域。表8显示所指示蛋白质相对于弯曲嗜热单胞菌tmsA的序列同一性百分比:
表8.
如表8中所示,在来自不同物种的tmsA蛋白质序列之间存在大量变异。然而,虽然序列有变异,但若干种蛋白质在本文中显示具有相同的催化甲基取代的脂质产生的能力。
以引用方式并入
本文引用的每一专利、已公开专利申请和非专利参考文献在此以引用方式整体并入。
等同内容
本领域技术人员将认识到,或仅使用常规实验就能确定本文所述的发明的具体实施方案的多种等同方案。以下权利要求书计划涵盖所述等同方案。
序列表
<110> 诺沃吉公司
<120> 10-甲基硬脂酸的异源性产生
<130> NOVG.P0005WO
<140> 未知的
<141> 2017-09-20
<150> 62396870
<151> 2016-09-20
<160> 98
<170> PatentIn version 3.5
<210> 1
<211> 1401
<212> DNA
<213> 耻垢分枝杆菌
<400> 1
gtgtctgtgg ttactactga cgcacaggct gcccatgccg ccggcgtctc gcgtcttctg 60
gccagctacc gggcgatccc gcccagcgcg acagtgcgcc ttgcgaaacc gacgtccaac 120
ctgttccgcg cccgcgcccg caccaatgtg aagggtctcg acgtctcggg cctgaccggt 180
gtgatcggtg tcgacccgga cgcgcgcacc gccgatgtgg cgggcatgtg cacctacgag 240
gacctggtgg cggccacgct tccgtacggc cttgccccac tggtggtgcc gcagctcaag 300
accatcacgc tcggtggcgc ggtcaccggt ctgggcatcg agtccacgtc gttccgcaac 360
ggtctgccgc acgaaagtgt cctggagatg gacatcttga ccggttcggg cgagatcgtc 420
acggcctcac cggatcagca ctcggatctg ttccatgcgt tccccaattc atatggaacc 480
cttggttatt ccacccggct gcgcatcgaa ctggagcccg tgcacccgtt tgtggcgttg 540
cgccacctgc gctttcactc gatcaccgat ctggtcgcgg cgatggaccg gatcatcgag 600
accggcgggc tggacggtga acccgtcgac tacctcgacg gcgtggtgtt cagcgcgact 660
gagagttacc tgtgtgttgg cttcaagacg aaaacgccgg ggccggtcag cgattacaca 720
ggtcagcaga tcttctaccg gtcgatccag catgacggcg acaccggcgc cgagaaacac 780
gaccggctga ccatccacga ctacctgtgg cgctgggaca ccgactggtt ctggtgctca 840
cgggcattcg gcgctcagca tccggtgatc cgcaggttct ggccgcggcg gctgcgccgc 900
agcagcttct actggaagct ggtggcctac gaccagcggt acgacatcgc cgaccgtatc 960
gagaagcgca acgggcgccc gccgcgcgag cgggtggtcc aggacgtcga ggtgcccatc 1020
gagcggtgcg cggacttcgt cgagtggttc ctgcagaatg tgccgatcga gccgatctgg 1080
ctgtgccccc tacggttgcg tgacagcgcc gacggcggtg cctcgtggcc cctgtatccg 1140
ctgaaggcgc accacaccta cgtcaacatc ggtttctggt catcagtgcc ggtgggcccc 1200
gaggagggcc acaccaaccg cctcatcgag aaaaaagtcg cggagctgga cgggcacaaa 1260
tctttgtact cggacgctta ttacacacgt gacgaattcg acgagctgta cggcggtgag 1320
gtctacaaca ccgtcaagaa gacgtacgac ccggattcac gtctgctaga cctgtattcg 1380
aaggcggtgc aaagacaatg a 1401
<210> 2
<211> 466
<212> PRT
<213> 耻垢分枝杆菌
<400> 2
Val Ser Val Val Thr Thr Asp Ala Gln Ala Ala His Ala Ala Gly Val
1 5 10 15
Ser Arg Leu Leu Ala Ser Tyr Arg Ala Ile Pro Pro Ser Ala Thr Val
20 25 30
Arg Leu Ala Lys Pro Thr Ser Asn Leu Phe Arg Ala Arg Ala Arg Thr
35 40 45
Asn Val Lys Gly Leu Asp Val Ser Gly Leu Thr Gly Val Ile Gly Val
50 55 60
Asp Pro Asp Ala Arg Thr Ala Asp Val Ala Gly Met Cys Thr Tyr Glu
65 70 75 80
Asp Leu Val Ala Ala Thr Leu Pro Tyr Gly Leu Ala Pro Leu Val Val
85 90 95
Pro Gln Leu Lys Thr Ile Thr Leu Gly Gly Ala Val Thr Gly Leu Gly
100 105 110
Ile Glu Ser Thr Ser Phe Arg Asn Gly Leu Pro His Glu Ser Val Leu
115 120 125
Glu Met Asp Ile Leu Thr Gly Ser Gly Glu Ile Val Thr Ala Ser Pro
130 135 140
Asp Gln His Ser Asp Leu Phe His Ala Phe Pro Asn Ser Tyr Gly Thr
145 150 155 160
Leu Gly Tyr Ser Thr Arg Leu Arg Ile Glu Leu Glu Pro Val His Pro
165 170 175
Phe Val Ala Leu Arg His Leu Arg Phe His Ser Ile Thr Asp Leu Val
180 185 190
Ala Ala Met Asp Arg Ile Ile Glu Thr Gly Gly Leu Asp Gly Glu Pro
195 200 205
Val Asp Tyr Leu Asp Gly Val Val Phe Ser Ala Thr Glu Ser Tyr Leu
210 215 220
Cys Val Gly Phe Lys Thr Lys Thr Pro Gly Pro Val Ser Asp Tyr Thr
225 230 235 240
Gly Gln Gln Ile Phe Tyr Arg Ser Ile Gln His Asp Gly Asp Thr Gly
245 250 255
Ala Glu Lys His Asp Arg Leu Thr Ile His Asp Tyr Leu Trp Arg Trp
260 265 270
Asp Thr Asp Trp Phe Trp Cys Ser Arg Ala Phe Gly Ala Gln His Pro
275 280 285
Val Ile Arg Arg Phe Trp Pro Arg Arg Leu Arg Arg Ser Ser Phe Tyr
290 295 300
Trp Lys Leu Val Ala Tyr Asp Gln Arg Tyr Asp Ile Ala Asp Arg Ile
305 310 315 320
Glu Lys Arg Asn Gly Arg Pro Pro Arg Glu Arg Val Val Gln Asp Val
325 330 335
Glu Val Pro Ile Glu Arg Cys Ala Asp Phe Val Glu Trp Phe Leu Gln
340 345 350
Asn Val Pro Ile Glu Pro Ile Trp Leu Cys Pro Leu Arg Leu Arg Asp
355 360 365
Ser Ala Asp Gly Gly Ala Ser Trp Pro Leu Tyr Pro Leu Lys Ala His
370 375 380
His Thr Tyr Val Asn Ile Gly Phe Trp Ser Ser Val Pro Val Gly Pro
385 390 395 400
Glu Glu Gly His Thr Asn Arg Leu Ile Glu Lys Lys Val Ala Glu Leu
405 410 415
Asp Gly His Lys Ser Leu Tyr Ser Asp Ala Tyr Tyr Thr Arg Asp Glu
420 425 430
Phe Asp Glu Leu Tyr Gly Gly Glu Val Tyr Asn Thr Val Lys Lys Thr
435 440 445
Tyr Asp Pro Asp Ser Arg Leu Leu Asp Leu Tyr Ser Lys Ala Val Gln
450 455 460
Arg Gln
465
<210> 3
<211> 1314
<212> DNA
<213> 耻垢分枝杆菌
<400> 3
atgaccacat tcaaagaacg cgagacgtcc acagcggacc gcaagctcac cctggccgag 60
atcctcgaga tcttcgccgc gggtaaggag ccgctgaagt tcactgcgta cgacggcagc 120
tcggccggtc ccgaggacgc cacgatgggt ctggacctca agaccccgcg tgggaccacc 180
tatctggcca cggcacccgg cgatctgggc ctggcccgtg cgtatgtctc cggtgacctg 240
gagccgcacg gcgtgcatcc cggcgatccc tacccgctgc tgcgcgccct ggccgaacgc 300
atggagttca agcgcccgcc tgcgcgtgtg ctggcgaaca tcgtgcgctc catcggcatc 360
gagcacctca agccgatcgc accgccgccg caggaggcgc tgccccggtg gcgccgcatc 420
atggagggcc tgcggcacag caagacccgc gacgccgagg ccatccacca ccactacgac 480
gtgtcgaaca cgttctacga gtgggtgctg ggcccgtcga tgacctacac gtgcgcgtgc 540
taccccaccg aggacgcgac cctcgaagag gcccaggaca acaagtaccg cctggtgttc 600
gagaagctgc gcctgaagcc cggtgaccgg ttgctcgacg tgggctgcgg ctggggcggc 660
atggtccgct acgcggcccg ccacggcgtc aaggcgctcg gtgtcacgct cagccgcgaa 720
caggcgacgt gggcgcagaa ggccatcgcc caggaaggtc tcaccgatct ggccgaggtg 780
cgtcacggtg attaccgcga cgtcatcgaa tccgggttcg acgcggtgtc ctcgatcggg 840
ctgaccgagc acatcggcgt gcacaactac ccggcgtact tcaacttcct caagtcgaag 900
ctgcgcaccg gtggcctgct gctcaaccac tgcatcaccc gcccggacaa ccggtcggcg 960
ccatcggccg gcgggttcat cgacaggtac gtgttccccg acggggagct caccggctcg 1020
ggccgcatca tcaccgaggc ccaggacgtg ggccttgagg tgatccacga ggagaaccta 1080
cgcaatcact atgcgatgac gctgcgcgac tggtgccgca acctggtcga gcactgggac 1140
gaggcggtcg aagaggtcgg gctgcccacc gcgaaggtgt ggggcctgta catggccggc 1200
tcacgtctgg gcttcgagac caatgtggtt cagctgcacc aggttctggc ggtcaagctt 1260
gacgatcagg gcaaggacgg cggactgccg ttgcggccct ggtggtccgc ctag 1314
<210> 4
<211> 437
<212> PRT
<213> 耻垢分枝杆菌
<400> 4
Met Thr Thr Phe Lys Glu Arg Glu Thr Ser Thr Ala Asp Arg Lys Leu
1 5 10 15
Thr Leu Ala Glu Ile Leu Glu Ile Phe Ala Ala Gly Lys Glu Pro Leu
20 25 30
Lys Phe Thr Ala Tyr Asp Gly Ser Ser Ala Gly Pro Glu Asp Ala Thr
35 40 45
Met Gly Leu Asp Leu Lys Thr Pro Arg Gly Thr Thr Tyr Leu Ala Thr
50 55 60
Ala Pro Gly Asp Leu Gly Leu Ala Arg Ala Tyr Val Ser Gly Asp Leu
65 70 75 80
Glu Pro His Gly Val His Pro Gly Asp Pro Tyr Pro Leu Leu Arg Ala
85 90 95
Leu Ala Glu Arg Met Glu Phe Lys Arg Pro Pro Ala Arg Val Leu Ala
100 105 110
Asn Ile Val Arg Ser Ile Gly Ile Glu His Leu Lys Pro Ile Ala Pro
115 120 125
Pro Pro Gln Glu Ala Leu Pro Arg Trp Arg Arg Ile Met Glu Gly Leu
130 135 140
Arg His Ser Lys Thr Arg Asp Ala Glu Ala Ile His His His Tyr Asp
145 150 155 160
Val Ser Asn Thr Phe Tyr Glu Trp Val Leu Gly Pro Ser Met Thr Tyr
165 170 175
Thr Cys Ala Cys Tyr Pro Thr Glu Asp Ala Thr Leu Glu Glu Ala Gln
180 185 190
Asp Asn Lys Tyr Arg Leu Val Phe Glu Lys Leu Arg Leu Lys Pro Gly
195 200 205
Asp Arg Leu Leu Asp Val Gly Cys Gly Trp Gly Gly Met Val Arg Tyr
210 215 220
Ala Ala Arg His Gly Val Lys Ala Leu Gly Val Thr Leu Ser Arg Glu
225 230 235 240
Gln Ala Thr Trp Ala Gln Lys Ala Ile Ala Gln Glu Gly Leu Thr Asp
245 250 255
Leu Ala Glu Val Arg His Gly Asp Tyr Arg Asp Val Ile Glu Ser Gly
260 265 270
Phe Asp Ala Val Ser Ser Ile Gly Leu Thr Glu His Ile Gly Val His
275 280 285
Asn Tyr Pro Ala Tyr Phe Asn Phe Leu Lys Ser Lys Leu Arg Thr Gly
290 295 300
Gly Leu Leu Leu Asn His Cys Ile Thr Arg Pro Asp Asn Arg Ser Ala
305 310 315 320
Pro Ser Ala Gly Gly Phe Ile Asp Arg Tyr Val Phe Pro Asp Gly Glu
325 330 335
Leu Thr Gly Ser Gly Arg Ile Ile Thr Glu Ala Gln Asp Val Gly Leu
340 345 350
Glu Val Ile His Glu Glu Asn Leu Arg Asn His Tyr Ala Met Thr Leu
355 360 365
Arg Asp Trp Cys Arg Asn Leu Val Glu His Trp Asp Glu Ala Val Glu
370 375 380
Glu Val Gly Leu Pro Thr Ala Lys Val Trp Gly Leu Tyr Met Ala Gly
385 390 395 400
Ser Arg Leu Gly Phe Glu Thr Asn Val Val Gln Leu His Gln Val Leu
405 410 415
Ala Val Lys Leu Asp Asp Gln Gly Lys Asp Gly Gly Leu Pro Leu Arg
420 425 430
Pro Trp Trp Ser Ala
435
<210> 5
<211> 1380
<212> DNA
<213> 未知的
<220>
<223> 苏别蒂山农霉菌
<400> 5
gtgtccgctc ctgcgaccga tgcacgaacc gcccacgccg acggcgtgga gcgattgctc 60
gagagttatc gggcggtgcc ggcggccgca tcggtgcggc tcgccaagcg cacctcgaac 120
ctcttccggt cccgagcggc gacggatgcc cctggcctcg acacctccgg cctgacccac 180
gtcatcgcgg tcgaccccgg ggcgcgcacg gccgacgtcg ccggcatgtg cacctacgac 240
gacctcgtcg ccgcgacact gccgcatggg ctcgcgccac tcgtggtgcc gcaactgaag 300
accatcaccc tcgggggcgc cgtaacggga ctcggcatcg agtcgacgtc gttccgcaac 360
ggtctgccgc acgagtcggt gctcgagatc gacgtgctca ccggcgcagg cgagatcatc 420
acggcgtcgc cgatcgagca cgcagagctg ttccgcgcct tccccaactc gtacggcacc 480
ctcggctacg ccgtgcgcct gcgcatcgag ctcgagccgg tcgagccgtt cgtcgcactc 540
acgcaccttc ggttccatgc gctcaccgac ctcatcgagg caatggagcg catcatcgag 600
accggtcgac tcgacggggt tgccgtcgat tccctcgacg gcgtggtgtt cagcgctgaa 660
gagagctacc tgtgcgtcgg cacgcagacc gcggcatccg gcccggtcag cgactacacc 720
cgccagcaga tcttctatcg ctccatccag catgacgacg gtgcgaagca cgaccggctc 780
accatgcacg actacctgtg gcgctgggac gccgactggt tctggtgctc gcaggcgttc 840
ggcgcgcagc atccgctgat tcgccggttc tggccgcggc gataccggcg cagccgctcg 900
tactcgacgc tcatgcgcct cgaacggcga ttcgacctcg gcgatcgcct cgagaagctc 960
aagggccggc cggcgcgcga acgcgtgatc caagacgtcg aggtgccgat cgggcgcacc 1020
gtcggcttcc tcgaatggtt cctcgcgaac gtgccgatcg agccgatctg gttgtgcccg 1080
ctgcgcctgc ggggcgaccg cggctggcct ctctacccga tccggccgca gcagacctac 1140
gtcaacatcg gcttctggtc gacggttccg gtgggcggct ccgagggcga gacgaaccgc 1200
tcgatcgagc gcgccgtgag cgagttcgac ggacacaagt cgctgtactc cgactcgtac 1260
tactcgcgcg aggagttcga ggagctctac ggcggcgagg cgtaccgggc cgtgaagcgg 1320
cgatacgacc ccgactctcg actgctcgac ctctatgcga aggcggtgca acggcgatga 1380
<210> 6
<211> 459
<212> PRT
<213> 未知的
<220>
<223> 苏别蒂山农霉菌
<400> 6
Val Ser Ala Pro Ala Thr Asp Ala Arg Thr Ala His Ala Asp Gly Val
1 5 10 15
Glu Arg Leu Leu Glu Ser Tyr Arg Ala Val Pro Ala Ala Ala Ser Val
20 25 30
Arg Leu Ala Lys Arg Thr Ser Asn Leu Phe Arg Ser Arg Ala Ala Thr
35 40 45
Asp Ala Pro Gly Leu Asp Thr Ser Gly Leu Thr His Val Ile Ala Val
50 55 60
Asp Pro Gly Ala Arg Thr Ala Asp Val Ala Gly Met Cys Thr Tyr Asp
65 70 75 80
Asp Leu Val Ala Ala Thr Leu Pro His Gly Leu Ala Pro Leu Val Val
85 90 95
Pro Gln Leu Lys Thr Ile Thr Leu Gly Gly Ala Val Thr Gly Leu Gly
100 105 110
Ile Glu Ser Thr Ser Phe Arg Asn Gly Leu Pro His Glu Ser Val Leu
115 120 125
Glu Ile Asp Val Leu Thr Gly Ala Gly Glu Ile Ile Thr Ala Ser Pro
130 135 140
Ile Glu His Ala Glu Leu Phe Arg Ala Phe Pro Asn Ser Tyr Gly Thr
145 150 155 160
Leu Gly Tyr Ala Val Arg Leu Arg Ile Glu Leu Glu Pro Val Glu Pro
165 170 175
Phe Val Ala Leu Thr His Leu Arg Phe His Ala Leu Thr Asp Leu Ile
180 185 190
Glu Ala Met Glu Arg Ile Ile Glu Thr Gly Arg Leu Asp Gly Val Ala
195 200 205
Val Asp Ser Leu Asp Gly Val Val Phe Ser Ala Glu Glu Ser Tyr Leu
210 215 220
Cys Val Gly Thr Gln Thr Ala Ala Ser Gly Pro Val Ser Asp Tyr Thr
225 230 235 240
Arg Gln Gln Ile Phe Tyr Arg Ser Ile Gln His Asp Asp Gly Ala Lys
245 250 255
His Asp Arg Leu Thr Met His Asp Tyr Leu Trp Arg Trp Asp Ala Asp
260 265 270
Trp Phe Trp Cys Ser Gln Ala Phe Gly Ala Gln His Pro Leu Ile Arg
275 280 285
Arg Phe Trp Pro Arg Arg Tyr Arg Arg Ser Arg Ser Tyr Ser Thr Leu
290 295 300
Met Arg Leu Glu Arg Arg Phe Asp Leu Gly Asp Arg Leu Glu Lys Leu
305 310 315 320
Lys Gly Arg Pro Ala Arg Glu Arg Val Ile Gln Asp Val Glu Val Pro
325 330 335
Ile Gly Arg Thr Val Gly Phe Leu Glu Trp Phe Leu Ala Asn Val Pro
340 345 350
Ile Glu Pro Ile Trp Leu Cys Pro Leu Arg Leu Arg Gly Asp Arg Gly
355 360 365
Trp Pro Leu Tyr Pro Ile Arg Pro Gln Gln Thr Tyr Val Asn Ile Gly
370 375 380
Phe Trp Ser Thr Val Pro Val Gly Gly Ser Glu Gly Glu Thr Asn Arg
385 390 395 400
Ser Ile Glu Arg Ala Val Ser Glu Phe Asp Gly His Lys Ser Leu Tyr
405 410 415
Ser Asp Ser Tyr Tyr Ser Arg Glu Glu Phe Glu Glu Leu Tyr Gly Gly
420 425 430
Glu Ala Tyr Arg Ala Val Lys Arg Arg Tyr Asp Pro Asp Ser Arg Leu
435 440 445
Leu Asp Leu Tyr Ala Lys Ala Val Gln Arg Arg
450 455
<210> 7
<211> 1254
<212> DNA
<213> 未知的
<220>
<223> 苏别蒂山农霉菌
<400> 7
atcctcgaga tcgtcgtcgc cggtcggctg ccgctgaggt tcaccgccta cgacgggagc 60
tcggcggggc cgcctgacgc cctgttcggc ctcgacctga agactccgcg aggaacgacc 120
tatctcgcca ccggccgcgg cgatctcggc ctcgcccgcg cctacatcgc gggcgacctc 180
gagatacagg gggtgcaccc cggagacccc tacgagctgc tcaaggcact cgccgacagc 240
ctggtcttca agctgccacc gccgcgggtg atgacccaga tcatccgttc gatcggcgtc 300
gaacatctgc ggccgatcgc gccgccgccg caagaggtgc cgccccggtg gcgccgcatc 360
gccgaggggc tccgacacag caagggccgc gacgccgaag cgatccacca ccactacgac 420
gtgtcgaaca ccttctacga atgggtgctc gggccgtcga tgacctacac gtgcgcgtgc 480
tacccgggcc tcgacgcatc cctcgacgag gcgcagcaga acaagtaccg gctcgtgttc 540
gagaagctgc ggctgaagcc gggcgaccga ctgctcgacg tcggctgcgg gtggggcggc 600
atggtgcgct acgccgcgcg ccacggcgtg caggcgttgg gcgtgaccct gtcgcgagag 660
cagacggcgt gggcgcagca ggcgatcgcc gtcgagggcc tcgccgacct cgccgaggtg 720
cgctacggcg actaccgcga catcgccgaa gacggcttcg atgcggtgtc atcgatcggg 780
ctgctcgagc acatcggcgt gcgcaactac gcttcgtatt tcggctttct gcagtcgcgc 840
ttgcggcccg ggggactctt gctcaaccac tgcatcaccc ggcccgacaa tcgctccgag 900
ccgtcggcgc gcggcttcat cgaccggtac gtgttccccg acggagagct caccggctcg 960
ggccgcatca tcaccgaggc gcaggatgtc ggcttcgaag tgctgcacga agagaacctg 1020
cgtcagcatt atgcactgac actgcgcgat tggtgcgcca acctcgtcgc gcactgggaa 1080
gaggcggtcg ccgaggtcgg gctgccgacc gcgaaggtgt ggggcctcta catggccggg 1140
tcacggctcg cgttcgagag cggcggcatc cagttgcacc aggtgctggc ggtcagacca 1200
gacgatcgca gcgacgccgc ccagctgccg ctgcggccgt ggtggacgcc atag 1254
<210> 8
<211> 417
<212> PRT
<213> 未知的
<220>
<223> 苏别蒂山农霉菌
<400> 8
Ile Leu Glu Ile Val Val Ala Gly Arg Leu Pro Leu Arg Phe Thr Ala
1 5 10 15
Tyr Asp Gly Ser Ser Ala Gly Pro Pro Asp Ala Leu Phe Gly Leu Asp
20 25 30
Leu Lys Thr Pro Arg Gly Thr Thr Tyr Leu Ala Thr Gly Arg Gly Asp
35 40 45
Leu Gly Leu Ala Arg Ala Tyr Ile Ala Gly Asp Leu Glu Ile Gln Gly
50 55 60
Val His Pro Gly Asp Pro Tyr Glu Leu Leu Lys Ala Leu Ala Asp Ser
65 70 75 80
Leu Val Phe Lys Leu Pro Pro Pro Arg Val Met Thr Gln Ile Ile Arg
85 90 95
Ser Ile Gly Val Glu His Leu Arg Pro Ile Ala Pro Pro Pro Gln Glu
100 105 110
Val Pro Pro Arg Trp Arg Arg Ile Ala Glu Gly Leu Arg His Ser Lys
115 120 125
Gly Arg Asp Ala Glu Ala Ile His His His Tyr Asp Val Ser Asn Thr
130 135 140
Phe Tyr Glu Trp Val Leu Gly Pro Ser Met Thr Tyr Thr Cys Ala Cys
145 150 155 160
Tyr Pro Gly Leu Asp Ala Ser Leu Asp Glu Ala Gln Gln Asn Lys Tyr
165 170 175
Arg Leu Val Phe Glu Lys Leu Arg Leu Lys Pro Gly Asp Arg Leu Leu
180 185 190
Asp Val Gly Cys Gly Trp Gly Gly Met Val Arg Tyr Ala Ala Arg His
195 200 205
Gly Val Gln Ala Leu Gly Val Thr Leu Ser Arg Glu Gln Thr Ala Trp
210 215 220
Ala Gln Gln Ala Ile Ala Val Glu Gly Leu Ala Asp Leu Ala Glu Val
225 230 235 240
Arg Tyr Gly Asp Tyr Arg Asp Ile Ala Glu Asp Gly Phe Asp Ala Val
245 250 255
Ser Ser Ile Gly Leu Leu Glu His Ile Gly Val Arg Asn Tyr Ala Ser
260 265 270
Tyr Phe Gly Phe Leu Gln Ser Arg Leu Arg Pro Gly Gly Leu Leu Leu
275 280 285
Asn His Cys Ile Thr Arg Pro Asp Asn Arg Ser Glu Pro Ser Ala Arg
290 295 300
Gly Phe Ile Asp Arg Tyr Val Phe Pro Asp Gly Glu Leu Thr Gly Ser
305 310 315 320
Gly Arg Ile Ile Thr Glu Ala Gln Asp Val Gly Phe Glu Val Leu His
325 330 335
Glu Glu Asn Leu Arg Gln His Tyr Ala Leu Thr Leu Arg Asp Trp Cys
340 345 350
Ala Asn Leu Val Ala His Trp Glu Glu Ala Val Ala Glu Val Gly Leu
355 360 365
Pro Thr Ala Lys Val Trp Gly Leu Tyr Met Ala Gly Ser Arg Leu Ala
370 375 380
Phe Glu Ser Gly Gly Ile Gln Leu His Gln Val Leu Ala Val Arg Pro
385 390 395 400
Asp Asp Arg Ser Asp Ala Ala Gln Leu Pro Leu Arg Pro Trp Trp Thr
405 410 415
Pro
<210> 9
<211> 1428
<212> DNA
<213> 未知的
<220>
<223> 浅黄拟无枝酸球菌
<400> 9
atgacgcctg aagctagtgc ggcggcgcac gccgctgcgg tggatcgcct catccatagc 60
tatcgggcga ttcctgatga cgcgccggtg cggctggcga agaagacgtc aaacctattc 120
cgccacaggg aaaagacttc tgctcctggg cttgacgtat ccggcctggc tcgcgtgatt 180
gggatcgact cagacactcg cactgccgac gttggcggca tgtgcacata cgaggacctt 240
gtcgcggcga cgctcgaata cgatctggtc cccctggtcg tcccgcaact caaaacgatc 300
actctcggcg gcgcggtgac gggcctggga attgagtcca cctcgttccg caatgggctt 360
ccccatgaat ctgttctcga aatggatatc ctgacgggcg ccggggaggt cgtcacggcc 420
ggcccggaag gcccccatag cgatttgtac tgggggtttc cgaattcgta cggcacgctc 480
ggctatgcga cgcgcctgcg catcgaacta gaaccggtcg agccgtacgt cgaactcagg 540
cacctgcggt tcactagcct cgatgagctt caggagacac ttgacaccgt ttcgtacgaa 600
cacacgtatg acggggaacc cgttcattac gtcgatggag tcatgttctc agccacggaa 660
agctacctca cgcttggccg tcagacgagc gaacccggcc cggtcagcga ctacaccgga 720
aaccagatct actaccgttc aatacagcac ggtggcgctg aaactcccgt cgtcgaccgg 780
atgaccattc atgactatct atggcgctgg gatactgact ggttctggtg ctcgcgtgcc 840
ttcggaacgc aacacccagt ggtccggaga ttctggccac gccgctatcg ccgcagcagc 900
ttctactgga agctgatcgc gcttgaccgc caggttgggc tcgcggactt catcgaacaa 960
cggaagggca acctcccccg ggaacgcgta gtccaggaca tcgaggtccc gatcgagaac 1020
actgcgagct tcttgcggtg gttcttggcg aacgtgccga tcgagccggt atggctatgc 1080
ccgctgcgcc tgcgaaaaac acgcagcccc ggcctgcctt cgccgacgtc cccggcttca 1140
cgcccatggc ccctctatcc gctcgagcct cagcgcacat acgtcaatgt tggcttctgg 1200
tcagcggtgc cggtcgtggc cggccagccc gaggggcaca ccaaccggat gatcgagaac 1260
gaagtcgatc gccttgacgg tcacaaatcg ctgtactcag atgcgtttta cgagcgaaaa 1320
gagtttgacg cgctgtacgg cggcgatacc tatagagaac tcaaagagac ctacgaccca 1380
aacagccggt tacttgatct ctatgcaaag gcggtgcaag gacgatga 1428
<210> 10
<211> 475
<212> PRT
<213> 未知的
<220>
<223> 浅黄拟无枝酸球菌
<400> 10
Met Thr Pro Glu Ala Ser Ala Ala Ala His Ala Ala Ala Val Asp Arg
1 5 10 15
Leu Ile His Ser Tyr Arg Ala Ile Pro Asp Asp Ala Pro Val Arg Leu
20 25 30
Ala Lys Lys Thr Ser Asn Leu Phe Arg His Arg Glu Lys Thr Ser Ala
35 40 45
Pro Gly Leu Asp Val Ser Gly Leu Ala Arg Val Ile Gly Ile Asp Ser
50 55 60
Asp Thr Arg Thr Ala Asp Val Gly Gly Met Cys Thr Tyr Glu Asp Leu
65 70 75 80
Val Ala Ala Thr Leu Glu Tyr Asp Leu Val Pro Leu Val Val Pro Gln
85 90 95
Leu Lys Thr Ile Thr Leu Gly Gly Ala Val Thr Gly Leu Gly Ile Glu
100 105 110
Ser Thr Ser Phe Arg Asn Gly Leu Pro His Glu Ser Val Leu Glu Met
115 120 125
Asp Ile Leu Thr Gly Ala Gly Glu Val Val Thr Ala Gly Pro Glu Gly
130 135 140
Pro His Ser Asp Leu Tyr Trp Gly Phe Pro Asn Ser Tyr Gly Thr Leu
145 150 155 160
Gly Tyr Ala Thr Arg Leu Arg Ile Glu Leu Glu Pro Val Glu Pro Tyr
165 170 175
Val Glu Leu Arg His Leu Arg Phe Thr Ser Leu Asp Glu Leu Gln Glu
180 185 190
Thr Leu Asp Thr Val Ser Tyr Glu His Thr Tyr Asp Gly Glu Pro Val
195 200 205
His Tyr Val Asp Gly Val Met Phe Ser Ala Thr Glu Ser Tyr Leu Thr
210 215 220
Leu Gly Arg Gln Thr Ser Glu Pro Gly Pro Val Ser Asp Tyr Thr Gly
225 230 235 240
Asn Gln Ile Tyr Tyr Arg Ser Ile Gln His Gly Gly Ala Glu Thr Pro
245 250 255
Val Val Asp Arg Met Thr Ile His Asp Tyr Leu Trp Arg Trp Asp Thr
260 265 270
Asp Trp Phe Trp Cys Ser Arg Ala Phe Gly Thr Gln His Pro Val Val
275 280 285
Arg Arg Phe Trp Pro Arg Arg Tyr Arg Arg Ser Ser Phe Tyr Trp Lys
290 295 300
Leu Ile Ala Leu Asp Arg Gln Val Gly Leu Ala Asp Phe Ile Glu Gln
305 310 315 320
Arg Lys Gly Asn Leu Pro Arg Glu Arg Val Val Gln Asp Ile Glu Val
325 330 335
Pro Ile Glu Asn Thr Ala Ser Phe Leu Arg Trp Phe Leu Ala Asn Val
340 345 350
Pro Ile Glu Pro Val Trp Leu Cys Pro Leu Arg Leu Arg Lys Thr Arg
355 360 365
Ser Pro Gly Leu Pro Ser Pro Thr Ser Pro Ala Ser Arg Pro Trp Pro
370 375 380
Leu Tyr Pro Leu Glu Pro Gln Arg Thr Tyr Val Asn Val Gly Phe Trp
385 390 395 400
Ser Ala Val Pro Val Val Ala Gly Gln Pro Glu Gly His Thr Asn Arg
405 410 415
Met Ile Glu Asn Glu Val Asp Arg Leu Asp Gly His Lys Ser Leu Tyr
420 425 430
Ser Asp Ala Phe Tyr Glu Arg Lys Glu Phe Asp Ala Leu Tyr Gly Gly
435 440 445
Asp Thr Tyr Arg Glu Leu Lys Glu Thr Tyr Asp Pro Asn Ser Arg Leu
450 455 460
Leu Asp Leu Tyr Ala Lys Ala Val Gln Gly Arg
465 470 475
<210> 11
<211> 1311
<212> DNA
<213> 未知的
<220>
<223> 浅黄拟无枝酸球菌
<400> 11
atgaaggcag tgttgacggc gtttacggct ccccaactcg aaaggatgaa cgtcgctgag 60
atactcagcg cggtactcgg gcgagatttc ccgatccggt tcactgcgta cgacggcagc 120
gcgctcggcc ccgaaaccgc ccgctacggc ttgcacctca cgacgccgcg cgggctgacc 180
tacctcgcta ccgcgcccgg tgatctcggg ctcgcacgcg cgtacgtgtc cggcgacctc 240
gaggtcagtg gggttcatca gggtgacccg tacgagataa tgaagatcct cgcgcatgac 300
gtccgggtgc ggcggccctc gccagcaacg atcgcttcga tcatgcggtc cctcggctgg 360
gaacgcttgc gaccggtcgc gccgcccccg caagagaaca tgccccgttg gcgccggatg 420
gcccttggcc tgctgcactc gaagagccgt gatgctgcgg caatccacca tcattacgac 480
gtgtcgaacg agttttacga gcacatcctc ggcccgtcga tgacgtacac atgcgcggcc 540
taccccagcg cagacagttc cctggaggaa gcacaggaca acaagtaccg actcgtcttc 600
gagaaacttg gcctgaaagc cggggatcgc ctgcttgacg tcgggtgcgg gtggggcggc 660
atggtgcggt tcgccgctaa gcgcggcgtt catgtcatcg gtgcgacatt gtcccgcaaa 720
caggcggaat gggctcagaa gatgattgcc catgaaggat tgggcgatct ggcggaagtc 780
cgtttctgcg actaccgcga tgtcacagag gcgggcttcg acgcagtgtc gtcgatcggc 840
ctcactgaac acatcggttt ggcgaactac ccgtcgtact tcggcttcct gaaggacaag 900
ttgcggccag gcggacgact gctgaaccat tgcatcactc gcccgaacaa ccttcaaagc 960
aaccgcgcag gtgacttcat tgaccggtac gttttccctg acggagagct cgccggacct 1020
ggcttcatca tttcagctgt ccacgacgcc ggtttcgagg tgcggcacga agagaacctc 1080
cgcgagcact acgcactgac gctgcgggac tggaaccgca acctcgctcg cgactgggac 1140
gcgtgtgtgc acgcctccga cgagggcacc gcccgcgtct ggggactgta catttccggt 1200
tcacgagtcg cgtttgaaac gaactcgatt cagctgcacc aggtcctggc ggtcaaaacc 1260
gcgcggaatg gcgaagcgca ggtcccgttg ggtcagtggt ggacccgctg a 1311
<210> 12
<211> 436
<212> PRT
<213> 未知的
<220>
<223> 浅黄拟无枝酸球菌
<400> 12
Met Lys Ala Val Leu Thr Ala Phe Thr Ala Pro Gln Leu Glu Arg Met
1 5 10 15
Asn Val Ala Glu Ile Leu Ser Ala Val Leu Gly Arg Asp Phe Pro Ile
20 25 30
Arg Phe Thr Ala Tyr Asp Gly Ser Ala Leu Gly Pro Glu Thr Ala Arg
35 40 45
Tyr Gly Leu His Leu Thr Thr Pro Arg Gly Leu Thr Tyr Leu Ala Thr
50 55 60
Ala Pro Gly Asp Leu Gly Leu Ala Arg Ala Tyr Val Ser Gly Asp Leu
65 70 75 80
Glu Val Ser Gly Val His Gln Gly Asp Pro Tyr Glu Ile Met Lys Ile
85 90 95
Leu Ala His Asp Val Arg Val Arg Arg Pro Ser Pro Ala Thr Ile Ala
100 105 110
Ser Ile Met Arg Ser Leu Gly Trp Glu Arg Leu Arg Pro Val Ala Pro
115 120 125
Pro Pro Gln Glu Asn Met Pro Arg Trp Arg Arg Met Ala Leu Gly Leu
130 135 140
Leu His Ser Lys Ser Arg Asp Ala Ala Ala Ile His His His Tyr Asp
145 150 155 160
Val Ser Asn Glu Phe Tyr Glu His Ile Leu Gly Pro Ser Met Thr Tyr
165 170 175
Thr Cys Ala Ala Tyr Pro Ser Ala Asp Ser Ser Leu Glu Glu Ala Gln
180 185 190
Asp Asn Lys Tyr Arg Leu Val Phe Glu Lys Leu Gly Leu Lys Ala Gly
195 200 205
Asp Arg Leu Leu Asp Val Gly Cys Gly Trp Gly Gly Met Val Arg Phe
210 215 220
Ala Ala Lys Arg Gly Val His Val Ile Gly Ala Thr Leu Ser Arg Lys
225 230 235 240
Gln Ala Glu Trp Ala Gln Lys Met Ile Ala His Glu Gly Leu Gly Asp
245 250 255
Leu Ala Glu Val Arg Phe Cys Asp Tyr Arg Asp Val Thr Glu Ala Gly
260 265 270
Phe Asp Ala Val Ser Ser Ile Gly Leu Thr Glu His Ile Gly Leu Ala
275 280 285
Asn Tyr Pro Ser Tyr Phe Gly Phe Leu Lys Asp Lys Leu Arg Pro Gly
290 295 300
Gly Arg Leu Leu Asn His Cys Ile Thr Arg Pro Asn Asn Leu Gln Ser
305 310 315 320
Asn Arg Ala Gly Asp Phe Ile Asp Arg Tyr Val Phe Pro Asp Gly Glu
325 330 335
Leu Ala Gly Pro Gly Phe Ile Ile Ser Ala Val His Asp Ala Gly Phe
340 345 350
Glu Val Arg His Glu Glu Asn Leu Arg Glu His Tyr Ala Leu Thr Leu
355 360 365
Arg Asp Trp Asn Arg Asn Leu Ala Arg Asp Trp Asp Ala Cys Val His
370 375 380
Ala Ser Asp Glu Gly Thr Ala Arg Val Trp Gly Leu Tyr Ile Ser Gly
385 390 395 400
Ser Arg Val Ala Phe Glu Thr Asn Ser Ile Gln Leu His Gln Val Leu
405 410 415
Ala Val Lys Thr Ala Arg Asn Gly Glu Ala Gln Val Pro Leu Gly Gln
420 425 430
Trp Trp Thr Arg
435
<210> 13
<211> 1548
<212> DNA
<213> 谷氨酸棒状杆菌
<400> 13
atgagcggat tagttgaccc ggatagtact tttttaaaga ccatcggaaa actgagcaac 60
agcttgtcca ttggtcgtgg agtagatcaa aaagaggtaa tccccaaagg ctggaacgcc 120
cattgggagg caattacaaa gcttaagaga agctttgacg cgattcctgc tggggagcgg 180
gtgcgtttag ctaagaaaac ctccaacctg ttccgtggac gctccgatgc aggtcacggc 240
ctagatgtgg cagcgcttgg gggagtgatt gccattgatc cggtcaatgc caccgccgat 300
gtacagggca tgtgcacgta tgaagacctg gtagatgcca ctttaagtta tggtctgatg 360
ccgttggttg tgcctcaact gaaaaccatc acgcttggtg gcgcagtgac cggaatgggc 420
gtggaatcca catccttccg caacggtttg ccacacgaat cagtgctgga gatggatatt 480
tttaccggca ctggtgagat cgtgacttgc tcgcccacag aaaatgtcga cctttacaga 540
ggttttccca actcttatgg ttcgctggga tacgcggtgc ggctaaaaat tgagctggaa 600
ccagtgcaag attacgtcca gctgcgccac gtgcgcttca acgatttaga gtctttgacc 660
aaagcgattg aggaagtcgc gtcttctctg gagtttgata accaacccgt cgattacctt 720
gacggcgtgg tgttttcacc cacggaagcc tacttagttc ttggcacgca aacctcacaa 780
cctggcccca ccagcgatta caccagggat ttaagctact accgctccct gcaacaccca 840
gagggcatca cctatgaccg cctgacaatc cgcgattaca tctggcgctg ggacaccgac 900
tggttctggt gttcacgcgc attcggcacc caaaaccccg tggtgcgcaa actctggccc 960
agggatctgc tgcgctcgag tttctattgg aagatcatcg gctgggatcg aaaatactcc 1020
atcgctgatc gcctggaaga gcgcaaaggc cgcccggcta gggaacgggt ggtccaagac 1080
gtggaagtta cgattgataa actgccagaa tttttgaaat ggttctttga aagcagcgac 1140
atcgagccgc tgtggctgtg cccgatcaag cttcgggagg taccaggtag ttcggttggt 1200
gctggagaaa ttttgagctc cgctgaagca atcgactccg gtgctgctga acacccttgg 1260
ccgctgtatc ccttgaagaa ggacgtgctg tgggtcaaca tcggattctg gtcctcagtg 1320
ccggttgatc tgatgggctc cgatgcacca gagggagcat ttaacagaga aatcgaacgc 1380
gtcatggcag agctaggcgg acataaatcg ctgtactccg aagcgttcta caccagggaa 1440
gactttgaaa aactttatgg cggaaccatc ccggcgctgc taaaaaagca gtgggatccc 1500
cacagccgat tccccggttt gtatgaaaag acagtaaaag gcgcctag 1548
<210> 14
<211> 515
<212> PRT
<213> 谷氨酸棒状杆菌
<400> 14
Met Ser Gly Leu Val Asp Pro Asp Ser Thr Phe Leu Lys Thr Ile Gly
1 5 10 15
Lys Leu Ser Asn Ser Leu Ser Ile Gly Arg Gly Val Asp Gln Lys Glu
20 25 30
Val Ile Pro Lys Gly Trp Asn Ala His Trp Glu Ala Ile Thr Lys Leu
35 40 45
Lys Arg Ser Phe Asp Ala Ile Pro Ala Gly Glu Arg Val Arg Leu Ala
50 55 60
Lys Lys Thr Ser Asn Leu Phe Arg Gly Arg Ser Asp Ala Gly His Gly
65 70 75 80
Leu Asp Val Ala Ala Leu Gly Gly Val Ile Ala Ile Asp Pro Val Asn
85 90 95
Ala Thr Ala Asp Val Gln Gly Met Cys Thr Tyr Glu Asp Leu Val Asp
100 105 110
Ala Thr Leu Ser Tyr Gly Leu Met Pro Leu Val Val Pro Gln Leu Lys
115 120 125
Thr Ile Thr Leu Gly Gly Ala Val Thr Gly Met Gly Val Glu Ser Thr
130 135 140
Ser Phe Arg Asn Gly Leu Pro His Glu Ser Val Leu Glu Met Asp Ile
145 150 155 160
Phe Thr Gly Thr Gly Glu Ile Val Thr Cys Ser Pro Thr Glu Asn Val
165 170 175
Asp Leu Tyr Arg Gly Phe Pro Asn Ser Tyr Gly Ser Leu Gly Tyr Ala
180 185 190
Val Arg Leu Lys Ile Glu Leu Glu Pro Val Gln Asp Tyr Val Gln Leu
195 200 205
Arg His Val Arg Phe Asn Asp Leu Glu Ser Leu Thr Lys Ala Ile Glu
210 215 220
Glu Val Ala Ser Ser Leu Glu Phe Asp Asn Gln Pro Val Asp Tyr Leu
225 230 235 240
Asp Gly Val Val Phe Ser Pro Thr Glu Ala Tyr Leu Val Leu Gly Thr
245 250 255
Gln Thr Ser Gln Pro Gly Pro Thr Ser Asp Tyr Thr Arg Asp Leu Ser
260 265 270
Tyr Tyr Arg Ser Leu Gln His Pro Glu Gly Ile Thr Tyr Asp Arg Leu
275 280 285
Thr Ile Arg Asp Tyr Ile Trp Arg Trp Asp Thr Asp Trp Phe Trp Cys
290 295 300
Ser Arg Ala Phe Gly Thr Gln Asn Pro Val Val Arg Lys Leu Trp Pro
305 310 315 320
Arg Asp Leu Leu Arg Ser Ser Phe Tyr Trp Lys Ile Ile Gly Trp Asp
325 330 335
Arg Lys Tyr Ser Ile Ala Asp Arg Leu Glu Glu Arg Lys Gly Arg Pro
340 345 350
Ala Arg Glu Arg Val Val Gln Asp Val Glu Val Thr Ile Asp Lys Leu
355 360 365
Pro Glu Phe Leu Lys Trp Phe Phe Glu Ser Ser Asp Ile Glu Pro Leu
370 375 380
Trp Leu Cys Pro Ile Lys Leu Arg Glu Val Pro Gly Ser Ser Val Gly
385 390 395 400
Ala Gly Glu Ile Leu Ser Ser Ala Glu Ala Ile Asp Ser Gly Ala Ala
405 410 415
Glu His Pro Trp Pro Leu Tyr Pro Leu Lys Lys Asp Val Leu Trp Val
420 425 430
Asn Ile Gly Phe Trp Ser Ser Val Pro Val Asp Leu Met Gly Ser Asp
435 440 445
Ala Pro Glu Gly Ala Phe Asn Arg Glu Ile Glu Arg Val Met Ala Glu
450 455 460
Leu Gly Gly His Lys Ser Leu Tyr Ser Glu Ala Phe Tyr Thr Arg Glu
465 470 475 480
Asp Phe Glu Lys Leu Tyr Gly Gly Thr Ile Pro Ala Leu Leu Lys Lys
485 490 495
Gln Trp Asp Pro His Ser Arg Phe Pro Gly Leu Tyr Glu Lys Thr Val
500 505 510
Lys Gly Ala
515
<210> 15
<211> 1308
<212> DNA
<213> 谷氨酸棒状杆菌
<400> 15
atgagtaacg ccgtagcgca ggacctcatg accatcgccg acatcgtcga ggccacgacc 60
actgcaccca tcccattcca catcactgcc ttcgatggaa gcttcactgg ccctgaagat 120
gctccctacc agctgtttgt tgccaacacg gatgcagtat cctacatcgc aacagcgcca 180
ggagatttgg gtttggcacg tgcctacctc atgggagacc tcatcgtgga aggtgagcat 240
cccggccatc cttatgggat ctttgatgcg ttgaaggagt tctaccgctg cttcaaacgc 300
ccagatgcat ccaccacctt gcagatcatg tggactctgc ggaaaatgaa tgccttaaaa 360
ttccaggaaa ttccaccaat ggaacaagcc cctgcatggc gtaaagcact gatcaacggg 420
ctagcatcca ggcactcgaa atcccgcgac aagaaagcca ttagctacca ctacgacgtg 480
ggcaatgagt tctactccct gtttttagat gattccatga cctatacctg cgcgtattat 540
ccaacgccag aatcaagttt ggaagaagcc caagaaaaca aataccgcct catctttgaa 600
aaactgcgtc tgaaagaagg cgatcgcctc ctagacgtgg gatgcggttg gggaggcatg 660
gtccgctacg ccgccaaaca cggtgtgaaa gccatcggag ttacgctgtc tgaacagcaa 720
tatgagtggg gtcaagcaga gatcaaacgc caaggtttgg aagacctcgc ggaaattcgc 780
ttcatggatt accgcgatgt tccagaaact ggattcgatg cgatctcagc aatcggcatc 840
attgaacaca tcggtgtgaa caactatccc gactactttg aattgctcag cagcaaactc 900
aaaacaggcg gactgatgct caaccacagc atcacctacc cagacaaccg cccccgccac 960
gcaggtgcat ttattgatcg ctacattttc cccgacggtg aactcactgg ctctggcacc 1020
ctgatcaagc acatgcagga caacggtttc gaagtgctgc acgaagaaaa cctccgcttt 1080
gattaccaac gcaccctgca cgcgtggtgc gaaaacctca aagaaaattg ggaggaagca 1140
gttgaactcg ccggtgaacc cactgcacga ctctttggcc tgtacatggc aggttcggaa 1200
tggggatttg cccacaacat cgtccagctg caccaagtac tgggtgtgaa actcgatgag 1260
cagggaagtc gcggagaagt tcctgaaaga atgtggtgga ctatctaa 1308
<210> 16
<211> 435
<212> PRT
<213> 谷氨酸棒状杆菌
<400> 16
Met Ser Asn Ala Val Ala Gln Asp Leu Met Thr Ile Ala Asp Ile Val
1 5 10 15
Glu Ala Thr Thr Thr Ala Pro Ile Pro Phe His Ile Thr Ala Phe Asp
20 25 30
Gly Ser Phe Thr Gly Pro Glu Asp Ala Pro Tyr Gln Leu Phe Val Ala
35 40 45
Asn Thr Asp Ala Val Ser Tyr Ile Ala Thr Ala Pro Gly Asp Leu Gly
50 55 60
Leu Ala Arg Ala Tyr Leu Met Gly Asp Leu Ile Val Glu Gly Glu His
65 70 75 80
Pro Gly His Pro Tyr Gly Ile Phe Asp Ala Leu Lys Glu Phe Tyr Arg
85 90 95
Cys Phe Lys Arg Pro Asp Ala Ser Thr Thr Leu Gln Ile Met Trp Thr
100 105 110
Leu Arg Lys Met Asn Ala Leu Lys Phe Gln Glu Ile Pro Pro Met Glu
115 120 125
Gln Ala Pro Ala Trp Arg Lys Ala Leu Ile Asn Gly Leu Ala Ser Arg
130 135 140
His Ser Lys Ser Arg Asp Lys Lys Ala Ile Ser Tyr His Tyr Asp Val
145 150 155 160
Gly Asn Glu Phe Tyr Ser Leu Phe Leu Asp Asp Ser Met Thr Tyr Thr
165 170 175
Cys Ala Tyr Tyr Pro Thr Pro Glu Ser Ser Leu Glu Glu Ala Gln Glu
180 185 190
Asn Lys Tyr Arg Leu Ile Phe Glu Lys Leu Arg Leu Lys Glu Gly Asp
195 200 205
Arg Leu Leu Asp Val Gly Cys Gly Trp Gly Gly Met Val Arg Tyr Ala
210 215 220
Ala Lys His Gly Val Lys Ala Ile Gly Val Thr Leu Ser Glu Gln Gln
225 230 235 240
Tyr Glu Trp Gly Gln Ala Glu Ile Lys Arg Gln Gly Leu Glu Asp Leu
245 250 255
Ala Glu Ile Arg Phe Met Asp Tyr Arg Asp Val Pro Glu Thr Gly Phe
260 265 270
Asp Ala Ile Ser Ala Ile Gly Ile Ile Glu His Ile Gly Val Asn Asn
275 280 285
Tyr Pro Asp Tyr Phe Glu Leu Leu Ser Ser Lys Leu Lys Thr Gly Gly
290 295 300
Leu Met Leu Asn His Ser Ile Thr Tyr Pro Asp Asn Arg Pro Arg His
305 310 315 320
Ala Gly Ala Phe Ile Asp Arg Tyr Ile Phe Pro Asp Gly Glu Leu Thr
325 330 335
Gly Ser Gly Thr Leu Ile Lys His Met Gln Asp Asn Gly Phe Glu Val
340 345 350
Leu His Glu Glu Asn Leu Arg Phe Asp Tyr Gln Arg Thr Leu His Ala
355 360 365
Trp Cys Glu Asn Leu Lys Glu Asn Trp Glu Glu Ala Val Glu Leu Ala
370 375 380
Gly Glu Pro Thr Ala Arg Leu Phe Gly Leu Tyr Met Ala Gly Ser Glu
385 390 395 400
Trp Gly Phe Ala His Asn Ile Val Gln Leu His Gln Val Leu Gly Val
405 410 415
Lys Leu Asp Glu Gln Gly Ser Arg Gly Glu Val Pro Glu Arg Met Trp
420 425 430
Trp Thr Ile
435
<210> 17
<211> 1458
<212> DNA
<213> 未知的
<220>
<223> 甘氨酸棒状杆菌
<400> 17
gtgaccgtcg ccggcaggat cactgacgcg gtacgcatag gaaatggact tgaccagcga 60
gatctagccc ccgtcgggtg gtacgcacac gaacaggccg tggcgcgact gaaggccagt 120
ttcgacgcgg tccccgccgg gcgtcgcgtg cggctggcga agaagacgtc caaccttttc 180
cgcgggcgtt ccggcgaggc agtcgggctc gacgtgtcgg ggctgcacgg cgtcatcgcc 240
gtcgaccccg ttgagggcac cgctgacgtc cagggcatgt gcacgtacga ggacctggtg 300
gacgtcctgc tgccctacgg tctggcgccc accgtcgttc cgcagctgaa gaccatcact 360
ctcggcggtg cggtgaccgg catgggggtg gaatccacct ccttccgcaa cggcctgccg 420
cacgaagccg tcctggaaat ggatgtgctc accggtaccg gagacatcct cacctgttcg 480
ccgacccaga acaccgacct ctaccgcggc ttccccaact cctacggttc cctgggatac 540
agcgtgcggc tgaaggtgcg gtgcgaacgg gtggaaccct acgtcgacct gcggcatgta 600
cgcttcgatg acgttcagtc gctcaccgac gccctcgaca acatcgtcgt ggacaaggag 660
tacgagggtg aacgggtcga ctatctcgac ggtgtggtct tcagcctgga ggagagctac 720
ctcgtcctgg gacgggcgac cagcgaggcc ggccccgtta gcgactacac ccgcgagcgc 780
agttactacc gttctctgca gcatccgtcg ggggtcctgc gcgacaagtt gaccatccgc 840
gactacctct ggcggtggga cgtcgactgg ttctggtgca accgggcctt cggtacccag 900
aaccccacca tccgtactct gtggccgcgg gatctcctgc ggtcgagctt ctactggaag 960
atcatcggct gggaccgacg cttcgacatc gcggaccgga tcgaggcaca caacgggcgc 1020
cccgcacgcg agcgcgtcgt ccaggacatc gaggtcaccc ccgacaacct gccggagttc 1080
ctcacgtggt tcttcaccca ctgcgagatc gagccggtgt ggctgtgccc cattcgactg 1140
gccgacgact cgggcgagcg gacaccgtgg cccctgtacc cgctgtcacc cggcgacacc 1200
tgggtcaacg tgggattctg gagctcggtg cccgccgacc tgatggggaa ggacgccccg 1260
accggagcct tcaaccggga ggtggagaga gtcgtctcgg acctcggcgg acacaagtcg 1320
ttgtactccg aggcattcta ttctgaggaa cagttcgccg ccctctacgg cggtgaacgt 1380
cccgcacaac tcaaggcggt cttcgacccg gatgaccggt tccccgggtt gtacgagaag 1440
accgtgggcg gcgtctga 1458
<210> 18
<211> 485
<212> PRT
<213> 未知的
<220>
<223> 甘氨酸棒状杆菌
<400> 18
Val Thr Val Ala Gly Arg Ile Thr Asp Ala Val Arg Ile Gly Asn Gly
1 5 10 15
Leu Asp Gln Arg Asp Leu Ala Pro Val Gly Trp Tyr Ala His Glu Gln
20 25 30
Ala Val Ala Arg Leu Lys Ala Ser Phe Asp Ala Val Pro Ala Gly Arg
35 40 45
Arg Val Arg Leu Ala Lys Lys Thr Ser Asn Leu Phe Arg Gly Arg Ser
50 55 60
Gly Glu Ala Val Gly Leu Asp Val Ser Gly Leu His Gly Val Ile Ala
65 70 75 80
Val Asp Pro Val Glu Gly Thr Ala Asp Val Gln Gly Met Cys Thr Tyr
85 90 95
Glu Asp Leu Val Asp Val Leu Leu Pro Tyr Gly Leu Ala Pro Thr Val
100 105 110
Val Pro Gln Leu Lys Thr Ile Thr Leu Gly Gly Ala Val Thr Gly Met
115 120 125
Gly Val Glu Ser Thr Ser Phe Arg Asn Gly Leu Pro His Glu Ala Val
130 135 140
Leu Glu Met Asp Val Leu Thr Gly Thr Gly Asp Ile Leu Thr Cys Ser
145 150 155 160
Pro Thr Gln Asn Thr Asp Leu Tyr Arg Gly Phe Pro Asn Ser Tyr Gly
165 170 175
Ser Leu Gly Tyr Ser Val Arg Leu Lys Val Arg Cys Glu Arg Val Glu
180 185 190
Pro Tyr Val Asp Leu Arg His Val Arg Phe Asp Asp Val Gln Ser Leu
195 200 205
Thr Asp Ala Leu Asp Asn Ile Val Val Asp Lys Glu Tyr Glu Gly Glu
210 215 220
Arg Val Asp Tyr Leu Asp Gly Val Val Phe Ser Leu Glu Glu Ser Tyr
225 230 235 240
Leu Val Leu Gly Arg Ala Thr Ser Glu Ala Gly Pro Val Ser Asp Tyr
245 250 255
Thr Arg Glu Arg Ser Tyr Tyr Arg Ser Leu Gln His Pro Ser Gly Val
260 265 270
Leu Arg Asp Lys Leu Thr Ile Arg Asp Tyr Leu Trp Arg Trp Asp Val
275 280 285
Asp Trp Phe Trp Cys Asn Arg Ala Phe Gly Thr Gln Asn Pro Thr Ile
290 295 300
Arg Thr Leu Trp Pro Arg Asp Leu Leu Arg Ser Ser Phe Tyr Trp Lys
305 310 315 320
Ile Ile Gly Trp Asp Arg Arg Phe Asp Ile Ala Asp Arg Ile Glu Ala
325 330 335
His Asn Gly Arg Pro Ala Arg Glu Arg Val Val Gln Asp Ile Glu Val
340 345 350
Thr Pro Asp Asn Leu Pro Glu Phe Leu Thr Trp Phe Phe Thr His Cys
355 360 365
Glu Ile Glu Pro Val Trp Leu Cys Pro Ile Arg Leu Ala Asp Asp Ser
370 375 380
Gly Glu Arg Thr Pro Trp Pro Leu Tyr Pro Leu Ser Pro Gly Asp Thr
385 390 395 400
Trp Val Asn Val Gly Phe Trp Ser Ser Val Pro Ala Asp Leu Met Gly
405 410 415
Lys Asp Ala Pro Thr Gly Ala Phe Asn Arg Glu Val Glu Arg Val Val
420 425 430
Ser Asp Leu Gly Gly His Lys Ser Leu Tyr Ser Glu Ala Phe Tyr Ser
435 440 445
Glu Glu Gln Phe Ala Ala Leu Tyr Gly Gly Glu Arg Pro Ala Gln Leu
450 455 460
Lys Ala Val Phe Asp Pro Asp Asp Arg Phe Pro Gly Leu Tyr Glu Lys
465 470 475 480
Thr Val Gly Gly Val
485
<210> 19
<211> 1368
<212> DNA
<213> 未知的
<220>
<223> 甘氨酸棒状杆菌
<400> 19
atgagcaggg gattcacgcc gctgacggtg ggacagatcg tggacaaggt catcacaccg 60
ccggcaccgt tccgggtgac cgctttcgac ggatccaccg cggggccggc agacgcggaa 120
ctggcactgg agatcacatc gccggacgcc ctggcctata tcgtgaccgc gccgggcgac 180
ctcggactgg cacgcgccta catcaccgga agcctccgcg tcaccggtga cgagcccggc 240
cacccgtacc tcgtctttga ccacctccag cacctttacg accagatccg acgcccctcg 300
gcgaaggacc tgctggatat cgcccgctcg ctgaaggcca tgggggcgat caaggtgcag 360
ccggcaccgg agcaggagac cctcccgggc tggaagaggg ccatactcga ggggctgtcc 420
cggcactctc cggaacggga caaggaggtc gtgagccgcc actacgacgt gggcaatgac 480
ttctacgagc tcttcctcgg cgattccatg gcctacacct gtgcctacta tcccgagttt 540
gacggtgaga accaggtcac cggtcccacc ggcgggtggc ggtacgacga ctgggagaaa 600
gggccgaccg ccaacgggcc gttgacccag gcgcaggaca acaagcatcg cctggtcttc 660
gacaagctgc gactcaaccc gggtgaccgg ttgttggacg tcggctgcgg gtggggcggt 720
atggtgcggt acgccgcccg ccacggcgtg aaggccatcg gtgtcacgct gtcccgagag 780
cagtacgagt ggggtaaggc gaagatcgag gaggagggtc tgcaggacct cgccgaggtc 840
cggtgtatgg actaccgtga cgtgccggag tccgacttcg acgcggtcag tgccatcggc 900
atcctcgagc acatcggcgt gcccaactac gaggactact tcacccgcct gttcgccaag 960
ctgcgcccgg gcggtcggat gctgaaccac tgcatcaccc gtccgcacaa ccggaagacg 1020
aagaccggcc agttcatcga ccgctacatc ttccccgacg gtgagctgac cggctcgggc 1080
cggatcatca cgatcatgca ggacaccgga ttcgacgtcg tccacgagga gaatctgcga 1140
ccgcactacc agcgcacgtt gcatgactgg tgtgaactgt tggccaccaa ctgggaccag 1200
gccgtccatc tcgtgggcga ggagacggct cgtctgttcg gcctgtacat ggcggggtcg 1260
gaatggggtt tcgaacacaa cgtgatccag ctccaccagg ttctcggcgt gaagccggac 1320
gcggcaggca gttccggggt gccggtccgc cagtggtgga ggtcctga 1368
<210> 20
<211> 455
<212> PRT
<213> 未知的
<220>
<223> 甘氨酸棒状杆菌
<400> 20
Met Ser Arg Gly Phe Thr Pro Leu Thr Val Gly Gln Ile Val Asp Lys
1 5 10 15
Val Ile Thr Pro Pro Ala Pro Phe Arg Val Thr Ala Phe Asp Gly Ser
20 25 30
Thr Ala Gly Pro Ala Asp Ala Glu Leu Ala Leu Glu Ile Thr Ser Pro
35 40 45
Asp Ala Leu Ala Tyr Ile Val Thr Ala Pro Gly Asp Leu Gly Leu Ala
50 55 60
Arg Ala Tyr Ile Thr Gly Ser Leu Arg Val Thr Gly Asp Glu Pro Gly
65 70 75 80
His Pro Tyr Leu Val Phe Asp His Leu Gln His Leu Tyr Asp Gln Ile
85 90 95
Arg Arg Pro Ser Ala Lys Asp Leu Leu Asp Ile Ala Arg Ser Leu Lys
100 105 110
Ala Met Gly Ala Ile Lys Val Gln Pro Ala Pro Glu Gln Glu Thr Leu
115 120 125
Pro Gly Trp Lys Arg Ala Ile Leu Glu Gly Leu Ser Arg His Ser Pro
130 135 140
Glu Arg Asp Lys Glu Val Val Ser Arg His Tyr Asp Val Gly Asn Asp
145 150 155 160
Phe Tyr Glu Leu Phe Leu Gly Asp Ser Met Ala Tyr Thr Cys Ala Tyr
165 170 175
Tyr Pro Glu Phe Asp Gly Glu Asn Gln Val Thr Gly Pro Thr Gly Gly
180 185 190
Trp Arg Tyr Asp Asp Trp Glu Lys Gly Pro Thr Ala Asn Gly Pro Leu
195 200 205
Thr Gln Ala Gln Asp Asn Lys His Arg Leu Val Phe Asp Lys Leu Arg
210 215 220
Leu Asn Pro Gly Asp Arg Leu Leu Asp Val Gly Cys Gly Trp Gly Gly
225 230 235 240
Met Val Arg Tyr Ala Ala Arg His Gly Val Lys Ala Ile Gly Val Thr
245 250 255
Leu Ser Arg Glu Gln Tyr Glu Trp Gly Lys Ala Lys Ile Glu Glu Glu
260 265 270
Gly Leu Gln Asp Leu Ala Glu Val Arg Cys Met Asp Tyr Arg Asp Val
275 280 285
Pro Glu Ser Asp Phe Asp Ala Val Ser Ala Ile Gly Ile Leu Glu His
290 295 300
Ile Gly Val Pro Asn Tyr Glu Asp Tyr Phe Thr Arg Leu Phe Ala Lys
305 310 315 320
Leu Arg Pro Gly Gly Arg Met Leu Asn His Cys Ile Thr Arg Pro His
325 330 335
Asn Arg Lys Thr Lys Thr Gly Gln Phe Ile Asp Arg Tyr Ile Phe Pro
340 345 350
Asp Gly Glu Leu Thr Gly Ser Gly Arg Ile Ile Thr Ile Met Gln Asp
355 360 365
Thr Gly Phe Asp Val Val His Glu Glu Asn Leu Arg Pro His Tyr Gln
370 375 380
Arg Thr Leu His Asp Trp Cys Glu Leu Leu Ala Thr Asn Trp Asp Gln
385 390 395 400
Ala Val His Leu Val Gly Glu Glu Thr Ala Arg Leu Phe Gly Leu Tyr
405 410 415
Met Ala Gly Ser Glu Trp Gly Phe Glu His Asn Val Ile Gln Leu His
420 425 430
Gln Val Leu Gly Val Lys Pro Asp Ala Ala Gly Ser Ser Gly Val Pro
435 440 445
Val Arg Gln Trp Trp Arg Ser
450 455
<210> 21
<211> 588
<212> DNA
<213> 未知的
<220>
<223> 甘氨酸棒状杆菌
<400> 21
gtggcggtgc tgtgcacacc gttgctgctc ggagcctgca ccatcggcga cgcgggaccg 60
ggggacgaga ccacggaccc tgtcgtggac actgaagcac cgcccgataa accggtgccg 120
gactctgcgg cggaatccgg cgctgaagac ggacctgatt ctgaggtgcc ggacgacccc 180
gaccagcctg atgctgagcc ggtggagact gatcccgacg ccccgggggc ccggggactg 240
gcgatcggtg actgcgtcgc cgacatggac cagctcgacg gcaccggcga catcgacgtc 300
gtcgactgcg ccggccccca tgccggcgag gtgtacgcac aggcggatat cgcaggtaag 360
aacctgttcc ccggcaacga gccgttgggg caggaggcgg gagcgatctg cgggggtgac 420
tccttcaccg gctatgtcgg catcggattc cccgagtcct cgctggacgt cgtcacgatg 480
atgccgtcca aggagagctg ggcgcaggag gaccggacgg tgacctgtgt ggtcaccgac 540
ccgaacctcg agcagatcgc cggcacgctc gagcagagct ggcgttag 588
<210> 22
<211> 195
<212> PRT
<213> 未知的
<220>
<223> 甘氨酸棒状杆菌
<400> 22
Val Ala Val Leu Cys Thr Pro Leu Leu Leu Gly Ala Cys Thr Ile Gly
1 5 10 15
Asp Ala Gly Pro Gly Asp Glu Thr Thr Asp Pro Val Val Asp Thr Glu
20 25 30
Ala Pro Pro Asp Lys Pro Val Pro Asp Ser Ala Ala Glu Ser Gly Ala
35 40 45
Glu Asp Gly Pro Asp Ser Glu Val Pro Asp Asp Pro Asp Gln Pro Asp
50 55 60
Ala Glu Pro Val Glu Thr Asp Pro Asp Ala Pro Gly Ala Arg Gly Leu
65 70 75 80
Ala Ile Gly Asp Cys Val Ala Asp Met Asp Gln Leu Asp Gly Thr Gly
85 90 95
Asp Ile Asp Val Val Asp Cys Ala Gly Pro His Ala Gly Glu Val Tyr
100 105 110
Ala Gln Ala Asp Ile Ala Gly Lys Asn Leu Phe Pro Gly Asn Glu Pro
115 120 125
Leu Gly Gln Glu Ala Gly Ala Ile Cys Gly Gly Asp Ser Phe Thr Gly
130 135 140
Tyr Val Gly Ile Gly Phe Pro Glu Ser Ser Leu Asp Val Val Thr Met
145 150 155 160
Met Pro Ser Lys Glu Ser Trp Ala Gln Glu Asp Arg Thr Val Thr Cys
165 170 175
Val Val Thr Asp Pro Asn Leu Glu Gln Ile Ala Gly Thr Leu Glu Gln
180 185 190
Ser Trp Arg
195
<210> 23
<211> 1395
<212> DNA
<213> 未知的
<220>
<223> 气生诺尔氏菌
<400> 23
atgagcatgg accggaccgg accggccagg gtgcggaccg tgggggagcg gcggctgctc 60
gagagcttcg ccgccgtccc cccgggcgaa cgcgtgcggc tggccaagcg cacgtccaac 120
ctcttccgcg cccgggaggg cacctcgaca cgcgggctcg acacgagcgg actgaccggc 180
gtgcgcgtgg tcgacgcagg caccctcacg gccgacgtcg acggaatgtg cacgtacgag 240
gacctcgtcg ccgcaacgct gccgctcggg ctcgcgccgc tcgtcgtgcc ccagctgcgg 300
accatcaccg tcggcggggc ggtcaccggt ctcgggatcg agtcgacgtc gttccgcaac 360
gggttgccgc acgagtccgt cctcgagatg gacgtcctca cgggtgccgg cgagatcgtc 420
actgccacag cggacaacga gcacgccgac ctcttccgcg gcttccccaa ctcctacggg 480
tcgctgggct acgcgacgtg cctgcgcatc gagctcgagc gtgtgggtac ctgtgtggag 540
gtgaggcacg tccgcttcca cgacctcgac gccctgtgcg ccgccatcgc cgaggtcgtg 600
gcgacgagat cgcacgaggg cgaggaggtc gaccacgtgg acggggtggt cttctcccgc 660
gacgaggcgt acctcacgct gggtcgtcac tccgaccgga ccggaccgac cagcgactac 720
accgggcagc aggtctacta ccggtcgatc cagcacgacg gcccctctcc acggcgcgac 780
ctgctcacca ctcacgacta cctctggcgc tgggacaccg actggttctg gtgctcgcgc 840
gccttcgggg cccaggaccc gcgcgtccgg cggtggtggc cgcgccggtg gcgccggtcg 900
agcgtgtact ggaggctcgt ggcggcggac cggcgcgtcg ggttctcgga ccgcctcgag 960
gcacgtcggg gcaacccgcc gcgggagcgg gtggtccagg acgtcgagat cccgctcggg 1020
cagaccgcgg ccttcctcca ctggttcctc gacgaggtgc cgatcgaacc gatctggctg 1080
tgcccgttgc gtcttcgcga ccatcagagg tggccgctct atccgctcga gcccggacgc 1140
acctacgtca acgtggggtt ctggtcgacc gtgccggggc ccggaccggg cgaggagctg 1200
ggcgccacca accgcgccat cgagcgccgt gtcgacgagg tcggcggcca caagtccctg 1260
tactccgact cctactactc ccggtccgac ttcgacgccc tctacggcgg ggacgcgtat 1320
gccgtgctga aggccaccta cgacccggac gggcggttcc ctcacctcta cgacaaggcg 1380
gtgcgacacg catga 1395
<210> 24
<211> 464
<212> PRT
<213> 未知的
<220>
<223> 气生诺尔氏菌
<400> 24
Met Ser Met Asp Arg Thr Gly Pro Ala Arg Val Arg Thr Val Gly Glu
1 5 10 15
Arg Arg Leu Leu Glu Ser Phe Ala Ala Val Pro Pro Gly Glu Arg Val
20 25 30
Arg Leu Ala Lys Arg Thr Ser Asn Leu Phe Arg Ala Arg Glu Gly Thr
35 40 45
Ser Thr Arg Gly Leu Asp Thr Ser Gly Leu Thr Gly Val Arg Val Val
50 55 60
Asp Ala Gly Thr Leu Thr Ala Asp Val Asp Gly Met Cys Thr Tyr Glu
65 70 75 80
Asp Leu Val Ala Ala Thr Leu Pro Leu Gly Leu Ala Pro Leu Val Val
85 90 95
Pro Gln Leu Arg Thr Ile Thr Val Gly Gly Ala Val Thr Gly Leu Gly
100 105 110
Ile Glu Ser Thr Ser Phe Arg Asn Gly Leu Pro His Glu Ser Val Leu
115 120 125
Glu Met Asp Val Leu Thr Gly Ala Gly Glu Ile Val Thr Ala Thr Ala
130 135 140
Asp Asn Glu His Ala Asp Leu Phe Arg Gly Phe Pro Asn Ser Tyr Gly
145 150 155 160
Ser Leu Gly Tyr Ala Thr Cys Leu Arg Ile Glu Leu Glu Arg Val Gly
165 170 175
Thr Cys Val Glu Val Arg His Val Arg Phe His Asp Leu Asp Ala Leu
180 185 190
Cys Ala Ala Ile Ala Glu Val Val Ala Thr Arg Ser His Glu Gly Glu
195 200 205
Glu Val Asp His Val Asp Gly Val Val Phe Ser Arg Asp Glu Ala Tyr
210 215 220
Leu Thr Leu Gly Arg His Ser Asp Arg Thr Gly Pro Thr Ser Asp Tyr
225 230 235 240
Thr Gly Gln Gln Val Tyr Tyr Arg Ser Ile Gln His Asp Gly Pro Ser
245 250 255
Pro Arg Arg Asp Leu Leu Thr Thr His Asp Tyr Leu Trp Arg Trp Asp
260 265 270
Thr Asp Trp Phe Trp Cys Ser Arg Ala Phe Gly Ala Gln Asp Pro Arg
275 280 285
Val Arg Arg Trp Trp Pro Arg Arg Trp Arg Arg Ser Ser Val Tyr Trp
290 295 300
Arg Leu Val Ala Ala Asp Arg Arg Val Gly Phe Ser Asp Arg Leu Glu
305 310 315 320
Ala Arg Arg Gly Asn Pro Pro Arg Glu Arg Val Val Gln Asp Val Glu
325 330 335
Ile Pro Leu Gly Gln Thr Ala Ala Phe Leu His Trp Phe Leu Asp Glu
340 345 350
Val Pro Ile Glu Pro Ile Trp Leu Cys Pro Leu Arg Leu Arg Asp His
355 360 365
Gln Arg Trp Pro Leu Tyr Pro Leu Glu Pro Gly Arg Thr Tyr Val Asn
370 375 380
Val Gly Phe Trp Ser Thr Val Pro Gly Pro Gly Pro Gly Glu Glu Leu
385 390 395 400
Gly Ala Thr Asn Arg Ala Ile Glu Arg Arg Val Asp Glu Val Gly Gly
405 410 415
His Lys Ser Leu Tyr Ser Asp Ser Tyr Tyr Ser Arg Ser Asp Phe Asp
420 425 430
Ala Leu Tyr Gly Gly Asp Ala Tyr Ala Val Leu Lys Ala Thr Tyr Asp
435 440 445
Pro Asp Gly Arg Phe Pro His Leu Tyr Asp Lys Ala Val Arg His Ala
450 455 460
<210> 25
<211> 1284
<212> DNA
<213> 未知的
<220>
<223> 气生诺尔氏菌
<400> 25
atgagccaca cgaccgatga gatccgcacg gtcgccgacc tcgtcgacga ggtggtcgtc 60
ggcccgctgc cggtgcgggt cacggcctac gacgggtcga agacggggcc ggacagcgcc 120
ccgcgaacca tccacatcgc caaccagcga gcggtcgcct acctcgccac cgcgcccggg 180
gacctcggca tggcccgcgc ctacaccacc ggtgacctcg tcgtcgaggg cgtgcacccg 240
ggcaacccct acgaggccct ggtcgacctc gaacgtgtgc acttccgccg cccggacccg 300
cggctgctcc tcgacctcgc gcgcatcgtc gggccacgca acctcgcgcc cccgcccccg 360
ccgccgcagg aggctgtgcc gaggtggcgg cgggtggccg agggcctgcg ccactcgtac 420
gggcgggaca gcgaggcgat ccgccaccac tacgacgtct ccaaccactt ctacgagcag 480
gtgctcggcc cgagcatgac ctacacctgc gcggtcttcc ccgaccacga caccgggctc 540
gacgaggcgc aggaggagaa gtaccgcctc gtcttcgaga agctcgcgct gcgtcccggt 600
gaccggttgc tcgacatcgg ctgcgggtgg ggcgggatgg tccggtacgc cgcacggcgg 660
ggggtgcgag cgctcggcgt gacactgtcc ggtgagcagg cggcgtgggc acaggtcgcc 720
atcgcccgcg aggggctggg ggagctcgcc gccgtccggc acgaggacta ccgccacgtc 780
gccgagaccg ggttcgacgc catctcctcg atcggcatca ccgagcacat cggggtgcgc 840
aactacccca cgtacttcga ctggatgctc caccacgtca agccgggagg gctcgtgctc 900
aaccactgca tcaccagacc cgagaaccgg gccaagagcg tcggccggtt catcgaccgc 960
tacatcttcc ccgacggcga gctcaccggg tccggccgga tcatcacgac catgcaggac 1020
aacggtttcg aggtcgtgca ctccgagaac ctgcgagagc actacgccct caccctggcg 1080
gcctggggcg agaacctcgt cgagcactgg gcctcctgcg tggccgacgt gggggagggg 1140
acggcgaagg tctggggcct ctacctcgcg ggctcgcgtc gtggcttcga gcgcaacgtc 1200
gtccagctgc accaggtgct ggccgcgagg ccggtgccgt cccgactccc gcaggtgccg 1260
ctgcgccagt ggtggacctc gtga 1284
<210> 26
<211> 427
<212> PRT
<213> 未知的
<220>
<223> 气生诺尔氏菌
<400> 26
Met Ser His Thr Thr Asp Glu Ile Arg Thr Val Ala Asp Leu Val Asp
1 5 10 15
Glu Val Val Val Gly Pro Leu Pro Val Arg Val Thr Ala Tyr Asp Gly
20 25 30
Ser Lys Thr Gly Pro Asp Ser Ala Pro Arg Thr Ile His Ile Ala Asn
35 40 45
Gln Arg Ala Val Ala Tyr Leu Ala Thr Ala Pro Gly Asp Leu Gly Met
50 55 60
Ala Arg Ala Tyr Thr Thr Gly Asp Leu Val Val Glu Gly Val His Pro
65 70 75 80
Gly Asn Pro Tyr Glu Ala Leu Val Asp Leu Glu Arg Val His Phe Arg
85 90 95
Arg Pro Asp Pro Arg Leu Leu Leu Asp Leu Ala Arg Ile Val Gly Pro
100 105 110
Arg Asn Leu Ala Pro Pro Pro Pro Pro Pro Gln Glu Ala Val Pro Arg
115 120 125
Trp Arg Arg Val Ala Glu Gly Leu Arg His Ser Tyr Gly Arg Asp Ser
130 135 140
Glu Ala Ile Arg His His Tyr Asp Val Ser Asn His Phe Tyr Glu Gln
145 150 155 160
Val Leu Gly Pro Ser Met Thr Tyr Thr Cys Ala Val Phe Pro Asp His
165 170 175
Asp Thr Gly Leu Asp Glu Ala Gln Glu Glu Lys Tyr Arg Leu Val Phe
180 185 190
Glu Lys Leu Ala Leu Arg Pro Gly Asp Arg Leu Leu Asp Ile Gly Cys
195 200 205
Gly Trp Gly Gly Met Val Arg Tyr Ala Ala Arg Arg Gly Val Arg Ala
210 215 220
Leu Gly Val Thr Leu Ser Gly Glu Gln Ala Ala Trp Ala Gln Val Ala
225 230 235 240
Ile Ala Arg Glu Gly Leu Gly Glu Leu Ala Ala Val Arg His Glu Asp
245 250 255
Tyr Arg His Val Ala Glu Thr Gly Phe Asp Ala Ile Ser Ser Ile Gly
260 265 270
Ile Thr Glu His Ile Gly Val Arg Asn Tyr Pro Thr Tyr Phe Asp Trp
275 280 285
Met Leu His His Val Lys Pro Gly Gly Leu Val Leu Asn His Cys Ile
290 295 300
Thr Arg Pro Glu Asn Arg Ala Lys Ser Val Gly Arg Phe Ile Asp Arg
305 310 315 320
Tyr Ile Phe Pro Asp Gly Glu Leu Thr Gly Ser Gly Arg Ile Ile Thr
325 330 335
Thr Met Gln Asp Asn Gly Phe Glu Val Val His Ser Glu Asn Leu Arg
340 345 350
Glu His Tyr Ala Leu Thr Leu Ala Ala Trp Gly Glu Asn Leu Val Glu
355 360 365
His Trp Ala Ser Cys Val Ala Asp Val Gly Glu Gly Thr Ala Lys Val
370 375 380
Trp Gly Leu Tyr Leu Ala Gly Ser Arg Arg Gly Phe Glu Arg Asn Val
385 390 395 400
Val Gln Leu His Gln Val Leu Ala Ala Arg Pro Val Pro Ser Arg Leu
405 410 415
Pro Gln Val Pro Leu Arg Gln Trp Trp Thr Ser
420 425
<210> 27
<211> 1392
<212> DNA
<213> 南非分枝杆菌
<400> 27
gtgtctgttc cttcgaccga cgcacgttct gctcacgccg acggcgtgca gcggcttctc 60
gccagctatc gggcgattcc ccaagacgcc acggtccggc tggccaaacc cacgtcgaac 120
ctcttccgtg cccgcgcgaa aaccaggacc aagggtctgg acacgtctgg gttgacgaac 180
gtgatcgcgg tcgacgcgga ggcacgcacc gccgatgtgg cagggatgtg cacctacgaa 240
gacctggtcg cggccacgct gccgcatgga ctttcgccgc tggtggtgcc gcagttgaag 300
acgatcaccc tcggcggggc ggtcaccgga ctcgggatcg agtccgcctc gttccgcaac 360
ggcctgccac acgaatcggt tctcgagatg gacgtcctca ccggcaccgg tgatgtcgtg 420
cgcgcctccc ccgacgagaa ccctgacctg tttcgggcgt ttccgaattc ctatggcacg 480
ttgggctatt cggttcggct caagatcgag ctggaaccgg tgaagccgtt cgtcgcgctg 540
cgccacctcc gtttccattc gctgtcggct ctcatcgagg cgatggaccg catcgtcgaa 600
accggcggcc tcaacggcga accggtggac tacctcgacg gcgtcgtgtt cagtgccgag 660
gagagttacc tgtgcgtggg gcagcgctcc gcgacaccgg gcccggtcag cgactacacg 720
ggcaagcaga tctactaccg ctcgattcag cacgacggcc cgaccgatgg cgccgagaag 780
cacgaccggc tgaccatcca cgactacctg tggcgctggg acaccgactg gttctggtgc 840
tcaagggcat tcggcgcgca gaacccgcgg atccggcgct ggtggccgcg ccggtaccgg 900
cgcagcagtg tgtactggaa gctgatcggc tacgaccggc gtttcggtat cgccgatcgc 960
atcgagaagc gcaacggccg acccccgcgc gagcgggtgg tccaggacat cgaggtgccc 1020
atcgagcgga ccgtcgagtt tctgcagtgg tttctcgaca ccgtgcccat cgaaccgatc 1080
tggttgtgcc cgttgcggct ccgcgacgac cgcgattggc ccctgtatcc gatccgaccc 1140
caccacacct acgtcaacgt gggtttctgg tcgtcggtgc cggtgggccc ggaggagggc 1200
tacaccaaca ggatgatcga acggaaagtc agcgacctcg acggtcacaa atcgctgtat 1260
tccgatgcgt actactcgcc ggaagagttt gattcgctct atggcgggga gacgtacaag 1320
acggtgaaga agacatacga cccagactct cgtttcctgg acctgtacgg caaagcagtg 1380
gggcggcaat ga 1392
<210> 28
<211> 463
<212> PRT
<213> 南非分枝杆菌
<400> 28
Val Ser Val Pro Ser Thr Asp Ala Arg Ser Ala His Ala Asp Gly Val
1 5 10 15
Gln Arg Leu Leu Ala Ser Tyr Arg Ala Ile Pro Gln Asp Ala Thr Val
20 25 30
Arg Leu Ala Lys Pro Thr Ser Asn Leu Phe Arg Ala Arg Ala Lys Thr
35 40 45
Arg Thr Lys Gly Leu Asp Thr Ser Gly Leu Thr Asn Val Ile Ala Val
50 55 60
Asp Ala Glu Ala Arg Thr Ala Asp Val Ala Gly Met Cys Thr Tyr Glu
65 70 75 80
Asp Leu Val Ala Ala Thr Leu Pro His Gly Leu Ser Pro Leu Val Val
85 90 95
Pro Gln Leu Lys Thr Ile Thr Leu Gly Gly Ala Val Thr Gly Leu Gly
100 105 110
Ile Glu Ser Ala Ser Phe Arg Asn Gly Leu Pro His Glu Ser Val Leu
115 120 125
Glu Met Asp Val Leu Thr Gly Thr Gly Asp Val Val Arg Ala Ser Pro
130 135 140
Asp Glu Asn Pro Asp Leu Phe Arg Ala Phe Pro Asn Ser Tyr Gly Thr
145 150 155 160
Leu Gly Tyr Ser Val Arg Leu Lys Ile Glu Leu Glu Pro Val Lys Pro
165 170 175
Phe Val Ala Leu Arg His Leu Arg Phe His Ser Leu Ser Ala Leu Ile
180 185 190
Glu Ala Met Asp Arg Ile Val Glu Thr Gly Gly Leu Asn Gly Glu Pro
195 200 205
Val Asp Tyr Leu Asp Gly Val Val Phe Ser Ala Glu Glu Ser Tyr Leu
210 215 220
Cys Val Gly Gln Arg Ser Ala Thr Pro Gly Pro Val Ser Asp Tyr Thr
225 230 235 240
Gly Lys Gln Ile Tyr Tyr Arg Ser Ile Gln His Asp Gly Pro Thr Asp
245 250 255
Gly Ala Glu Lys His Asp Arg Leu Thr Ile His Asp Tyr Leu Trp Arg
260 265 270
Trp Asp Thr Asp Trp Phe Trp Cys Ser Arg Ala Phe Gly Ala Gln Asn
275 280 285
Pro Arg Ile Arg Arg Trp Trp Pro Arg Arg Tyr Arg Arg Ser Ser Val
290 295 300
Tyr Trp Lys Leu Ile Gly Tyr Asp Arg Arg Phe Gly Ile Ala Asp Arg
305 310 315 320
Ile Glu Lys Arg Asn Gly Arg Pro Pro Arg Glu Arg Val Val Gln Asp
325 330 335
Ile Glu Val Pro Ile Glu Arg Thr Val Glu Phe Leu Gln Trp Phe Leu
340 345 350
Asp Thr Val Pro Ile Glu Pro Ile Trp Leu Cys Pro Leu Arg Leu Arg
355 360 365
Asp Asp Arg Asp Trp Pro Leu Tyr Pro Ile Arg Pro His His Thr Tyr
370 375 380
Val Asn Val Gly Phe Trp Ser Ser Val Pro Val Gly Pro Glu Glu Gly
385 390 395 400
Tyr Thr Asn Arg Met Ile Glu Arg Lys Val Ser Asp Leu Asp Gly His
405 410 415
Lys Ser Leu Tyr Ser Asp Ala Tyr Tyr Ser Pro Glu Glu Phe Asp Ser
420 425 430
Leu Tyr Gly Gly Glu Thr Tyr Lys Thr Val Lys Lys Thr Tyr Asp Pro
435 440 445
Asp Ser Arg Phe Leu Asp Leu Tyr Gly Lys Ala Val Gly Arg Gln
450 455 460
<210> 29
<211> 1323
<212> DNA
<213> 南非分枝杆菌
<400> 29
ttgacgacat ttcgggacgg cgcggccgac accggcctgc acggagaccg caagctcacc 60
ctggcggagg tcttggaggt cttcgcctcg ggccgactgc ctctgaagtt cacggcgtac 120
gacggcagca gcgcgggccc ggacgacgcc acgctcgggc tggacctgct gaccccccgc 180
gggaccacgt acctcgcaac ggctcccggc gatctcggcc tggcccgggc ctacgtctcc 240
ggtgacctgc agttgcaggg ggtgcaccct ggcgacccgt acgacctgct caacgcactg 300
gtgcagaaac tggacttcaa gcgaccgtcc gcccgggtgc tggcgcaggt cgtccgatcg 360
atcgggatcg agcacctgaa accgatcgcg ccaccgccgc aggaggcgct gccgcggtgg 420
cggcgcatcg cagaaggact gcggcacagc aagacccgtg acgccgacgc gatccaccac 480
cattacgatg tctccaacac cttctacgag tgggtgctcg ggccgtcgat gacctacacc 540
tgcgcctgct acccgcatcc cgacgccacc ctcgaggagg cgcaggagaa caaatatcgg 600
ctggtgttcg agaaactgcg cctcaagccg ggcgaccgcc ttctcgacgt gggttgcggg 660
tggggcggaa tggtgcgcta cgcggcccgt cacggcgtca aggcgatcgg ggtgacgctg 720
tccagggagc aggcgcagtg ggcacgcgcc gccatcgaac gggacggcct gggtgacctc 780
gccgaggtcc gccacagcga ctaccgcgat gtgcgcgagt cccagttcga cgccgtgtct 840
tcgctggggc tcaccgagca catcggggtc gccaactatc cgtcgtactt ccggttcctc 900
aagtcgaagt tgcgcccggg cggcctactg ctcaaccact gcatcacccg gcacaacaat 960
cgcaccggcc ccgccgccgg gggattcatc gaccggtatg tgttcccgga cggggagctg 1020
accggatcgg gccggatcat caccgagatc caggacgtcg gtttggaggt gatgcacgaa 1080
gagaacctgc gccggcacta tgcgctgaca cttcgggact ggtgccggaa tctggtgcag 1140
cactgggacg aagcggtcgc agaggtcggc ctgcccaccg ccaaggtgtg gggtctgtac 1200
atggctgcct cgcgggtcgg cttcgagcag aacagcattc agctgcatca ggtactggcg 1260
gtgaagctcg acgaacgtgg cggggacggc ggtttgccgt tgcggccctg gtggaccgcg 1320
tag 1323
<210> 30
<211> 440
<212> PRT
<213> 南非分枝杆菌
<400> 30
Leu Thr Thr Phe Arg Asp Gly Ala Ala Asp Thr Gly Leu His Gly Asp
1 5 10 15
Arg Lys Leu Thr Leu Ala Glu Val Leu Glu Val Phe Ala Ser Gly Arg
20 25 30
Leu Pro Leu Lys Phe Thr Ala Tyr Asp Gly Ser Ser Ala Gly Pro Asp
35 40 45
Asp Ala Thr Leu Gly Leu Asp Leu Leu Thr Pro Arg Gly Thr Thr Tyr
50 55 60
Leu Ala Thr Ala Pro Gly Asp Leu Gly Leu Ala Arg Ala Tyr Val Ser
65 70 75 80
Gly Asp Leu Gln Leu Gln Gly Val His Pro Gly Asp Pro Tyr Asp Leu
85 90 95
Leu Asn Ala Leu Val Gln Lys Leu Asp Phe Lys Arg Pro Ser Ala Arg
100 105 110
Val Leu Ala Gln Val Val Arg Ser Ile Gly Ile Glu His Leu Lys Pro
115 120 125
Ile Ala Pro Pro Pro Gln Glu Ala Leu Pro Arg Trp Arg Arg Ile Ala
130 135 140
Glu Gly Leu Arg His Ser Lys Thr Arg Asp Ala Asp Ala Ile His His
145 150 155 160
His Tyr Asp Val Ser Asn Thr Phe Tyr Glu Trp Val Leu Gly Pro Ser
165 170 175
Met Thr Tyr Thr Cys Ala Cys Tyr Pro His Pro Asp Ala Thr Leu Glu
180 185 190
Glu Ala Gln Glu Asn Lys Tyr Arg Leu Val Phe Glu Lys Leu Arg Leu
195 200 205
Lys Pro Gly Asp Arg Leu Leu Asp Val Gly Cys Gly Trp Gly Gly Met
210 215 220
Val Arg Tyr Ala Ala Arg His Gly Val Lys Ala Ile Gly Val Thr Leu
225 230 235 240
Ser Arg Glu Gln Ala Gln Trp Ala Arg Ala Ala Ile Glu Arg Asp Gly
245 250 255
Leu Gly Asp Leu Ala Glu Val Arg His Ser Asp Tyr Arg Asp Val Arg
260 265 270
Glu Ser Gln Phe Asp Ala Val Ser Ser Leu Gly Leu Thr Glu His Ile
275 280 285
Gly Val Ala Asn Tyr Pro Ser Tyr Phe Arg Phe Leu Lys Ser Lys Leu
290 295 300
Arg Pro Gly Gly Leu Leu Leu Asn His Cys Ile Thr Arg His Asn Asn
305 310 315 320
Arg Thr Gly Pro Ala Ala Gly Gly Phe Ile Asp Arg Tyr Val Phe Pro
325 330 335
Asp Gly Glu Leu Thr Gly Ser Gly Arg Ile Ile Thr Glu Ile Gln Asp
340 345 350
Val Gly Leu Glu Val Met His Glu Glu Asn Leu Arg Arg His Tyr Ala
355 360 365
Leu Thr Leu Arg Asp Trp Cys Arg Asn Leu Val Gln His Trp Asp Glu
370 375 380
Ala Val Ala Glu Val Gly Leu Pro Thr Ala Lys Val Trp Gly Leu Tyr
385 390 395 400
Met Ala Ala Ser Arg Val Gly Phe Glu Gln Asn Ser Ile Gln Leu His
405 410 415
Gln Val Leu Ala Val Lys Leu Asp Glu Arg Gly Gly Asp Gly Gly Leu
420 425 430
Pro Leu Arg Pro Trp Trp Thr Ala
435 440
<210> 31
<211> 381
<212> DNA
<213> 南非分枝杆菌
<400> 31
gtgatccgct ttctgctgcg cgtcgcggtc tttctcggat cgtcggcgat cgggctactg 60
gtggccggct ggctggtgcc gggggtgtcg ctgtcggtgc tgggcttcgt caccgcggtg 120
gtgatcttca cggtggcaca agggattctg tcgccgttct tcctgaagat ggccagccgc 180
tacgcgtcgg ccttcctcgg cggcatcggc ctggtgtcca cgttcgtggc gctgctgctc 240
gcgtcgctgc tgtccaacgg gctcagcatc cgcggcgtcg ggtcgtggat cgcggccacg 300
gtggtggtct ggctggtcac agccctggcg accgtcgtgc tgcccgttct ggtgctgcgg 360
gagaagaaga aagcagcctg a 381
<210> 32
<211> 126
<212> PRT
<213> 南非分枝杆菌
<400> 32
Val Ile Arg Phe Leu Leu Arg Val Ala Val Phe Leu Gly Ser Ser Ala
1 5 10 15
Ile Gly Leu Leu Val Ala Gly Trp Leu Val Pro Gly Val Ser Leu Ser
20 25 30
Val Leu Gly Phe Val Thr Ala Val Val Ile Phe Thr Val Ala Gln Gly
35 40 45
Ile Leu Ser Pro Phe Phe Leu Lys Met Ala Ser Arg Tyr Ala Ser Ala
50 55 60
Phe Leu Gly Gly Ile Gly Leu Val Ser Thr Phe Val Ala Leu Leu Leu
65 70 75 80
Ala Ser Leu Leu Ser Asn Gly Leu Ser Ile Arg Gly Val Gly Ser Trp
85 90 95
Ile Ala Ala Thr Val Val Val Trp Leu Val Thr Ala Leu Ala Thr Val
100 105 110
Val Leu Pro Val Leu Val Leu Arg Glu Lys Lys Lys Ala Ala
115 120 125
<210> 33
<211> 1392
<212> DNA
<213> 淡黄分枝杆菌
<400> 33
gtgtctgttg ccgtaaccga cgcacgatcc gcctacgccc acggcgtgca gcggctggtc 60
gcgagttacc gcgccatccc cgccggcgcc accgtccgcc tggccaaacc cacgtccaac 120
ctgttccgcg ccagggcgaa gagcaccgcg gcgggcctcg acacctccgg cctgacacat 180
gtgatcgccg tggaccccga gacgcgcacc gccgaggtcg cggggatgtg cacctacgag 240
gacctggtgg cggcgacgct gccccacggg ctttcaccgc tggtggtccc gcaactcaag 300
acgatcaccc tcggcggcgc cgtcaccggg ctcggcatcg agtcggcgtc gttccgcaac 360
ggccttccgc acgaatcggt cctggagatg gacatcctca ccgggaccgg cgacatcgtg 420
cgcgccgcgc ccgacgagaa tcccgacctt ttccgcacct tcccgaattc ttatggaacg 480
ctgggttact cggttcggct gaagatcgag ctggagccgg tgaagccgtt cgtggcgtta 540
cgccatctcc gcttccactc actgtcgaca ctcatcgcga cgatggaccg catcgtcgac 600
accgggagtc tcgacggtga gcaggtcgac tatctcgacg gagtggtgtt cagcgccgag 660
gagagctacc tgtgcgtcgg aacacgttcc gcgacaccgg gtcctgtcag cgactacacc 720
ggcgagcaca tcttctaccg gtcgatccag cacgattgcc cgaccgaagg cggacagaag 780
cacgaccggc tgacggcgca cgactacttc tggcgctggg acaccgactg gttctggtgc 840
tcaagggcat tcggcgcgca gaacccgaag gtccgtcggt ggtggccccg acggctccgg 900
cgcagcagct tctactggaa gctcgtcggc tacgaccagc gtttcggcat cgccgaccgg 960
atcgagaaac accacggccg gccaccgcgc gaacgcgtcg tccaggacgt cgaggtcccc 1020
atcgagcgca ccgtcgaatt cctgcagtgg ttcctcgaca cgatcccgat agagccgctc 1080
tggttgtgcc cgttgcgact tcgcgatgac aacagctggt cgctgtaccc gctccggccc 1140
catcgcacgt atgtcaacgt gggattctgg tcgtcggtgc ccgtcgggcc ggaggagggt 1200
cacaccaaca agctgatcga acgcaggatc agcgagctgg agggacacaa gtcgctgtac 1260
tccgacgcct tctattcggc cgacgagttc gacgcgctgt acggcggcga gatctaccgg 1320
accgtgaaga agacctacga cccagattct cgtttcctcg acctctatgc gaaggcggtg 1380
cgacggcaat ga 1392
<210> 34
<211> 463
<212> PRT
<213> 淡黄分枝杆菌
<400> 34
Val Ser Val Ala Val Thr Asp Ala Arg Ser Ala Tyr Ala His Gly Val
1 5 10 15
Gln Arg Leu Val Ala Ser Tyr Arg Ala Ile Pro Ala Gly Ala Thr Val
20 25 30
Arg Leu Ala Lys Pro Thr Ser Asn Leu Phe Arg Ala Arg Ala Lys Ser
35 40 45
Thr Ala Ala Gly Leu Asp Thr Ser Gly Leu Thr His Val Ile Ala Val
50 55 60
Asp Pro Glu Thr Arg Thr Ala Glu Val Ala Gly Met Cys Thr Tyr Glu
65 70 75 80
Asp Leu Val Ala Ala Thr Leu Pro His Gly Leu Ser Pro Leu Val Val
85 90 95
Pro Gln Leu Lys Thr Ile Thr Leu Gly Gly Ala Val Thr Gly Leu Gly
100 105 110
Ile Glu Ser Ala Ser Phe Arg Asn Gly Leu Pro His Glu Ser Val Leu
115 120 125
Glu Met Asp Ile Leu Thr Gly Thr Gly Asp Ile Val Arg Ala Ala Pro
130 135 140
Asp Glu Asn Pro Asp Leu Phe Arg Thr Phe Pro Asn Ser Tyr Gly Thr
145 150 155 160
Leu Gly Tyr Ser Val Arg Leu Lys Ile Glu Leu Glu Pro Val Lys Pro
165 170 175
Phe Val Ala Leu Arg His Leu Arg Phe His Ser Leu Ser Thr Leu Ile
180 185 190
Ala Thr Met Asp Arg Ile Val Asp Thr Gly Ser Leu Asp Gly Glu Gln
195 200 205
Val Asp Tyr Leu Asp Gly Val Val Phe Ser Ala Glu Glu Ser Tyr Leu
210 215 220
Cys Val Gly Thr Arg Ser Ala Thr Pro Gly Pro Val Ser Asp Tyr Thr
225 230 235 240
Gly Glu His Ile Phe Tyr Arg Ser Ile Gln His Asp Cys Pro Thr Glu
245 250 255
Gly Gly Gln Lys His Asp Arg Leu Thr Ala His Asp Tyr Phe Trp Arg
260 265 270
Trp Asp Thr Asp Trp Phe Trp Cys Ser Arg Ala Phe Gly Ala Gln Asn
275 280 285
Pro Lys Val Arg Arg Trp Trp Pro Arg Arg Leu Arg Arg Ser Ser Phe
290 295 300
Tyr Trp Lys Leu Val Gly Tyr Asp Gln Arg Phe Gly Ile Ala Asp Arg
305 310 315 320
Ile Glu Lys His His Gly Arg Pro Pro Arg Glu Arg Val Val Gln Asp
325 330 335
Val Glu Val Pro Ile Glu Arg Thr Val Glu Phe Leu Gln Trp Phe Leu
340 345 350
Asp Thr Ile Pro Ile Glu Pro Leu Trp Leu Cys Pro Leu Arg Leu Arg
355 360 365
Asp Asp Asn Ser Trp Ser Leu Tyr Pro Leu Arg Pro His Arg Thr Tyr
370 375 380
Val Asn Val Gly Phe Trp Ser Ser Val Pro Val Gly Pro Glu Glu Gly
385 390 395 400
His Thr Asn Lys Leu Ile Glu Arg Arg Ile Ser Glu Leu Glu Gly His
405 410 415
Lys Ser Leu Tyr Ser Asp Ala Phe Tyr Ser Ala Asp Glu Phe Asp Ala
420 425 430
Leu Tyr Gly Gly Glu Ile Tyr Arg Thr Val Lys Lys Thr Tyr Asp Pro
435 440 445
Asp Ser Arg Phe Leu Asp Leu Tyr Ala Lys Ala Val Arg Arg Gln
450 455 460
<210> 35
<211> 1323
<212> DNA
<213> 淡黄分枝杆菌
<400> 35
atgacgactt ttcgggaaca taccgacagt tcggcgtccg acccggatcg gaaactcact 60
ttggcagagg tgttggagat cttcgccgcg ggtcgccgtc cgctgaagtt caccgcctat 120
gacggaagta gttgcgggcc tgaggatgcg acactgggcc tcgacctgct gaccccgcgg 180
ggcacgacct acctggccac ggcgccgggt gatctcggcc tggcgcgggc ctacatcgcc 240
ggcgatctgc gcctcagtgg tgtgcatccc ggcgatcccc atgacctgct cacggcgctg 300
acggaacgcc tggagtacag gcgtccgccg gtgcgagtgc tggccaatgt tctgcgctcc 360
atcgggatcg agcacctcaa gcccgtcgcg ccgccacccc aggagcacct gccgcggtgg 420
cggcggatcg cagaggggtt gcggcacagc aagacccgtg acgctgaggc catccagcac 480
cactacgacg tctcgaacac gttctactca tgggtcctgg gtccgtcgat gacctacacc 540
tgcgcctgct atccacaccc ggatgccacg ctggaggagg cgcaggagaa caagtaccgg 600
ctggtgttcg agaagcttcg actcaagccc ggtgaccggc tgctcgacgt cggttgcggc 660
tggggcggaa tggtccgcta cgccgcccgg cacggggtca aggtcctggg ggtgacgctg 720
tcgaaggagc aggcgcagtg ggcggccgac gcagtcgagc gggacggcct gggtgagttg 780
gccgaggtcc gccacggcga ctaccgcgac gtgcgcgagt cgcacttcga cgcagtgtcc 840
tcgctcgggc tcaccgagca catcggcgtc gcgaactacc cgtcgtactt ccgcttcctg 900
aagtcgaaac tgcggccggg tggcctgctg ctcaaccact gcatcacccg aaacaacaac 960
cggagtcacg ccaccgcagg cggattcatc gatcgctatg tctttcccga cggggagctg 1020
acggggtcgg ggcgaatcat caccgaaatg caggacgtcg gactcgaggt cgtgcacgag 1080
gagaatctgc gtcaccacta cgcgctgacg ctgcgcgact ggagccgcaa cctggtcgcg 1140
cactgggacg acgcggtgac cgaggtcggt ctgccgactg ccaaggtgtg gggcctctac 1200
atcgccgcgt cgcgagtcgg cttcgagcag aacgccattc agctgcacca ggtgctgtcg 1260
gtcaagctcg acgagcgtgg ctcggacggc ggactgccgt tacgaccctg gtggaacgcc 1320
tag 1323
<210> 36
<211> 440
<212> PRT
<213> 淡黄分枝杆菌
<400> 36
Met Thr Thr Phe Arg Glu His Thr Asp Ser Ser Ala Ser Asp Pro Asp
1 5 10 15
Arg Lys Leu Thr Leu Ala Glu Val Leu Glu Ile Phe Ala Ala Gly Arg
20 25 30
Arg Pro Leu Lys Phe Thr Ala Tyr Asp Gly Ser Ser Cys Gly Pro Glu
35 40 45
Asp Ala Thr Leu Gly Leu Asp Leu Leu Thr Pro Arg Gly Thr Thr Tyr
50 55 60
Leu Ala Thr Ala Pro Gly Asp Leu Gly Leu Ala Arg Ala Tyr Ile Ala
65 70 75 80
Gly Asp Leu Arg Leu Ser Gly Val His Pro Gly Asp Pro His Asp Leu
85 90 95
Leu Thr Ala Leu Thr Glu Arg Leu Glu Tyr Arg Arg Pro Pro Val Arg
100 105 110
Val Leu Ala Asn Val Leu Arg Ser Ile Gly Ile Glu His Leu Lys Pro
115 120 125
Val Ala Pro Pro Pro Gln Glu His Leu Pro Arg Trp Arg Arg Ile Ala
130 135 140
Glu Gly Leu Arg His Ser Lys Thr Arg Asp Ala Glu Ala Ile Gln His
145 150 155 160
His Tyr Asp Val Ser Asn Thr Phe Tyr Ser Trp Val Leu Gly Pro Ser
165 170 175
Met Thr Tyr Thr Cys Ala Cys Tyr Pro His Pro Asp Ala Thr Leu Glu
180 185 190
Glu Ala Gln Glu Asn Lys Tyr Arg Leu Val Phe Glu Lys Leu Arg Leu
195 200 205
Lys Pro Gly Asp Arg Leu Leu Asp Val Gly Cys Gly Trp Gly Gly Met
210 215 220
Val Arg Tyr Ala Ala Arg His Gly Val Lys Val Leu Gly Val Thr Leu
225 230 235 240
Ser Lys Glu Gln Ala Gln Trp Ala Ala Asp Ala Val Glu Arg Asp Gly
245 250 255
Leu Gly Glu Leu Ala Glu Val Arg His Gly Asp Tyr Arg Asp Val Arg
260 265 270
Glu Ser His Phe Asp Ala Val Ser Ser Leu Gly Leu Thr Glu His Ile
275 280 285
Gly Val Ala Asn Tyr Pro Ser Tyr Phe Arg Phe Leu Lys Ser Lys Leu
290 295 300
Arg Pro Gly Gly Leu Leu Leu Asn His Cys Ile Thr Arg Asn Asn Asn
305 310 315 320
Arg Ser His Ala Thr Ala Gly Gly Phe Ile Asp Arg Tyr Val Phe Pro
325 330 335
Asp Gly Glu Leu Thr Gly Ser Gly Arg Ile Ile Thr Glu Met Gln Asp
340 345 350
Val Gly Leu Glu Val Val His Glu Glu Asn Leu Arg His His Tyr Ala
355 360 365
Leu Thr Leu Arg Asp Trp Ser Arg Asn Leu Val Ala His Trp Asp Asp
370 375 380
Ala Val Thr Glu Val Gly Leu Pro Thr Ala Lys Val Trp Gly Leu Tyr
385 390 395 400
Ile Ala Ala Ser Arg Val Gly Phe Glu Gln Asn Ala Ile Gln Leu His
405 410 415
Gln Val Leu Ser Val Lys Leu Asp Glu Arg Gly Ser Asp Gly Gly Leu
420 425 430
Pro Leu Arg Pro Trp Trp Asn Ala
435 440
<210> 37
<211> 387
<212> DNA
<213> 淡黄分枝杆菌
<400> 37
atgatccggt tcctgctgcg catcgcggtc tttctgggct catcagcgat cgggctcctc 60
gtcgccggat ggctggtgcc cggggtgtcg ctgtcggtgt ggggcttcgt cacggcagtg 120
gtgatcttca ccgtggcgca ggcgatcctg tccccgttct tcctcaagat ggccagccgc 180
tacgcctcgg cgttcctcgg cgggatcggt ctggtgtcga cgtttgccgc gctgctgctc 240
gtctcgctgc tgtccaacgg tctgagcatc cgcggcatcg gatcctggat cgccgcaacc 300
gtggtggtct ggttggtgac cgccctggcg acgctggtgc tgccgatgtt ggtgctgcgc 360
gagaagaaaa ccgcgtcgcg cgtctga 387
<210> 38
<211> 128
<212> PRT
<213> 淡黄分枝杆菌
<400> 38
Met Ile Arg Phe Leu Leu Arg Ile Ala Val Phe Leu Gly Ser Ser Ala
1 5 10 15
Ile Gly Leu Leu Val Ala Gly Trp Leu Val Pro Gly Val Ser Leu Ser
20 25 30
Val Trp Gly Phe Val Thr Ala Val Val Ile Phe Thr Val Ala Gln Ala
35 40 45
Ile Leu Ser Pro Phe Phe Leu Lys Met Ala Ser Arg Tyr Ala Ser Ala
50 55 60
Phe Leu Gly Gly Ile Gly Leu Val Ser Thr Phe Ala Ala Leu Leu Leu
65 70 75 80
Val Ser Leu Leu Ser Asn Gly Leu Ser Ile Arg Gly Ile Gly Ser Trp
85 90 95
Ile Ala Ala Thr Val Val Val Trp Leu Val Thr Ala Leu Ala Thr Leu
100 105 110
Val Leu Pro Met Leu Val Leu Arg Glu Lys Lys Thr Ala Ser Arg Val
115 120 125
<210> 39
<211> 1425
<212> DNA
<213> 未知的
<220>
<223> 普拉尼亚分枝杆菌
<400> 39
atgcacgggc tgttgtcgaa gactagggta tatgtggtgc ctgtccttgg atctgcactc 60
tcggcccaca agtcgggcgt tgaccggctg ctggcaagct atcgatccat tcccgcaacg 120
tccgcggtcc ggctggccaa accgacgtca aacctgttcc gcgcccgcac caaacgtgac 180
gcgcccggct tggacacctc ggggctgacc ggcgtcctga gcgtggatcc cgaaacccgc 240
accgcggacg tcgccggcat gtgcacctac gcggacctgg tggccgcaac gctgccctac 300
ggcctgtcgc cgctggtcgt cccgcagctg aagaccatca ccctcggcgg ggcggtcagc 360
ggcctgggga tcgagtcggc gtcgtttcgc aacgggctgc cgcacgaatc ggtgctggag 420
atggatatcc tcaccggcgc tggcgatttg ctcaccgcat cacgtaccca gcacccggac 480
ctgttccgcg ccttcccgaa ttcctatggg acactggggt attcgacccg gcttcggatc 540
gagctggaac ccgtcgcacc gttcgtcgcg ctgcgccaca tccgcttccg ctcgctgccc 600
gcgctgatcg ccgcggccga acgcatcgtc gacaccggcg ggcagggcgg aaccccggtc 660
gactacctcg acggggtggt cttcagcgcc gacgaaagct acctgtgcgt gggccggcgg 720
accaccaccc ccggcccggt cagcgactac accggcaagg acatctacta ccagtccatc 780
cggcacgacg ccccgggcct ggaggcgacc aaggatgacc ggctgaccat gcacgactac 840
ttctggcgct gggacaccga ttggttctgg tgctcgcgcg cgttcggcgt gcaggacccg 900
cgggtgcgac gcttctggcc gcgccgttat cggcgcagca gcttctactg gaagctgatt 960
tccctggacc ggcgcttcgg gatctccgac cgcatcgagg cgcgcaacgg gcggccccca 1020
cgcgaacggg tggtgcaaga catcgagatt ccaatcgaac ggacctgcga cttcctggag 1080
tggttcctgg acaacgtgcc aatcacgccg atctggttgt gcccgttgcg ccttcgcgac 1140
cgcgacggct ggccgttgta cccgatgcgg ccggatcaca cgtacgtcaa cgtcggcttc 1200
tggtcgtcgg tgccgggggg cgcgaccgag ggcgccgcca accggatgat cgaagaaaag 1260
gtgagcgaac tcgacgggca caagtccctg tactccgatt ccttctactc ccgcgaggac 1320
ttcgacgagc tgtacggcgg cgagacctac aacaccgtca agaaaaccta cgaccccgat 1380
tctcgtttac tcgacctcta cgcaaaggcg gtgcaacggc gatga 1425
<210> 40
<211> 474
<212> PRT
<213> 未知的
<220>
<223> 普拉尼亚分枝杆菌
<400> 40
Met His Gly Leu Leu Ser Lys Thr Arg Val Tyr Val Val Pro Val Leu
1 5 10 15
Gly Ser Ala Leu Ser Ala His Lys Ser Gly Val Asp Arg Leu Leu Ala
20 25 30
Ser Tyr Arg Ser Ile Pro Ala Thr Ser Ala Val Arg Leu Ala Lys Pro
35 40 45
Thr Ser Asn Leu Phe Arg Ala Arg Thr Lys Arg Asp Ala Pro Gly Leu
50 55 60
Asp Thr Ser Gly Leu Thr Gly Val Leu Ser Val Asp Pro Glu Thr Arg
65 70 75 80
Thr Ala Asp Val Ala Gly Met Cys Thr Tyr Ala Asp Leu Val Ala Ala
85 90 95
Thr Leu Pro Tyr Gly Leu Ser Pro Leu Val Val Pro Gln Leu Lys Thr
100 105 110
Ile Thr Leu Gly Gly Ala Val Ser Gly Leu Gly Ile Glu Ser Ala Ser
115 120 125
Phe Arg Asn Gly Leu Pro His Glu Ser Val Leu Glu Met Asp Ile Leu
130 135 140
Thr Gly Ala Gly Asp Leu Leu Thr Ala Ser Arg Thr Gln His Pro Asp
145 150 155 160
Leu Phe Arg Ala Phe Pro Asn Ser Tyr Gly Thr Leu Gly Tyr Ser Thr
165 170 175
Arg Leu Arg Ile Glu Leu Glu Pro Val Ala Pro Phe Val Ala Leu Arg
180 185 190
His Ile Arg Phe Arg Ser Leu Pro Ala Leu Ile Ala Ala Ala Glu Arg
195 200 205
Ile Val Asp Thr Gly Gly Gln Gly Gly Thr Pro Val Asp Tyr Leu Asp
210 215 220
Gly Val Val Phe Ser Ala Asp Glu Ser Tyr Leu Cys Val Gly Arg Arg
225 230 235 240
Thr Thr Thr Pro Gly Pro Val Ser Asp Tyr Thr Gly Lys Asp Ile Tyr
245 250 255
Tyr Gln Ser Ile Arg His Asp Ala Pro Gly Leu Glu Ala Thr Lys Asp
260 265 270
Asp Arg Leu Thr Met His Asp Tyr Phe Trp Arg Trp Asp Thr Asp Trp
275 280 285
Phe Trp Cys Ser Arg Ala Phe Gly Val Gln Asp Pro Arg Val Arg Arg
290 295 300
Phe Trp Pro Arg Arg Tyr Arg Arg Ser Ser Phe Tyr Trp Lys Leu Ile
305 310 315 320
Ser Leu Asp Arg Arg Phe Gly Ile Ser Asp Arg Ile Glu Ala Arg Asn
325 330 335
Gly Arg Pro Pro Arg Glu Arg Val Val Gln Asp Ile Glu Ile Pro Ile
340 345 350
Glu Arg Thr Cys Asp Phe Leu Glu Trp Phe Leu Asp Asn Val Pro Ile
355 360 365
Thr Pro Ile Trp Leu Cys Pro Leu Arg Leu Arg Asp Arg Asp Gly Trp
370 375 380
Pro Leu Tyr Pro Met Arg Pro Asp His Thr Tyr Val Asn Val Gly Phe
385 390 395 400
Trp Ser Ser Val Pro Gly Gly Ala Thr Glu Gly Ala Ala Asn Arg Met
405 410 415
Ile Glu Glu Lys Val Ser Glu Leu Asp Gly His Lys Ser Leu Tyr Ser
420 425 430
Asp Ser Phe Tyr Ser Arg Glu Asp Phe Asp Glu Leu Tyr Gly Gly Glu
435 440 445
Thr Tyr Asn Thr Val Lys Lys Thr Tyr Asp Pro Asp Ser Arg Leu Leu
450 455 460
Asp Leu Tyr Ala Lys Ala Val Gln Arg Arg
465 470
<210> 41
<211> 1263
<212> DNA
<213> 未知的
<220>
<223> 普拉尼亚分枝杆菌
<400> 41
atggccgaga tcctggaggt cttcgccgcc accggccgac atccgctgaa gttcaccgcc 60
tacgacggca gcatcgccgg caacgaggac gccgaactgg gcctggacct tcgcagcccc 120
cgcggcgcca cctatctggc gaccgccccc ggcgaactcg gcctcgcccg cgcctacgtg 180
tcgggcgacc tgcaggccta cggcgtccat cccggcgacc cgtaccaact gctcaagacg 240
ctcaccgatc gggtggaatt caagcggccc ccggtgcggg tgctggccaa cgtcgtgcgg 300
tcgctggggt tcgagcggtt gctgccggtc gcgccgcccc cgcaggaggc gctgccccgg 360
tggcggcgca tcgccgacgg gctgatgcac acgaggaccc gcgacgccga ggccatccac 420
caccactacg acgtgtccaa caccttctac gaattggtgt tggggccgtc gatgacctac 480
acctgcgcgg tgtatcccga tgccgacgcg acactcgaac aggcgcagga gaacaagtac 540
cggctgatct tcgagaagct gcggctgaag gcgggcgacc ggctgctcga cgtcggctgc 600
ggctggggcg gcatggtgcg ctacgcggcc cggcgcggcg tccgggccac cggcgccacc 660
ctgtcggccg aacaggcgaa gtgggcgcag aaggcgatcg ccgaggaagg ccttgcggac 720
ctggccgagg tgcgccacac cgactatcgg gacgtgggcg aggcggcgtt cgacgccgtg 780
tcctcgatcg ggctgaccga gcacatcggc gtcaagaatt accccgccta cttcggcttc 840
ttgaagtcga agctgcgcac cggcggcctg ctgctcaatc actgcatcac ccgccacgac 900
aacacgtcga cgtcgttcgc gggcggattc accgatcgct atgtcttccc ggacggggag 960
ctgaccggct cgggccgcat cacctgcgac gtccaggact gcggcttcga ggtgctgcac 1020
gcggagaact tccgccacca ctacgcgatg acgctgcgcg actggtgccg caatctggtc 1080
gagaactggg acgccgcggt cagcgaggtc ggcctaccga ccgcgaaggt ctggggcctg 1140
tacatggcgg cgtcacgggt tgcgttcgag cagaacaacc ttcagctgca tcacgtgctg 1200
gcggccaaga ccgacgcgcg gggcgacgac gacctgccgc tgcggccgtg gtggacggcc 1260
tga 1263
<210> 42
<211> 420
<212> PRT
<213> 未知的
<220>
<223> 普拉尼亚分枝杆菌
<400> 42
Met Ala Glu Ile Leu Glu Val Phe Ala Ala Thr Gly Arg His Pro Leu
1 5 10 15
Lys Phe Thr Ala Tyr Asp Gly Ser Ile Ala Gly Asn Glu Asp Ala Glu
20 25 30
Leu Gly Leu Asp Leu Arg Ser Pro Arg Gly Ala Thr Tyr Leu Ala Thr
35 40 45
Ala Pro Gly Glu Leu Gly Leu Ala Arg Ala Tyr Val Ser Gly Asp Leu
50 55 60
Gln Ala Tyr Gly Val His Pro Gly Asp Pro Tyr Gln Leu Leu Lys Thr
65 70 75 80
Leu Thr Asp Arg Val Glu Phe Lys Arg Pro Pro Val Arg Val Leu Ala
85 90 95
Asn Val Val Arg Ser Leu Gly Phe Glu Arg Leu Leu Pro Val Ala Pro
100 105 110
Pro Pro Gln Glu Ala Leu Pro Arg Trp Arg Arg Ile Ala Asp Gly Leu
115 120 125
Met His Thr Arg Thr Arg Asp Ala Glu Ala Ile His His His Tyr Asp
130 135 140
Val Ser Asn Thr Phe Tyr Glu Leu Val Leu Gly Pro Ser Met Thr Tyr
145 150 155 160
Thr Cys Ala Val Tyr Pro Asp Ala Asp Ala Thr Leu Glu Gln Ala Gln
165 170 175
Glu Asn Lys Tyr Arg Leu Ile Phe Glu Lys Leu Arg Leu Lys Ala Gly
180 185 190
Asp Arg Leu Leu Asp Val Gly Cys Gly Trp Gly Gly Met Val Arg Tyr
195 200 205
Ala Ala Arg Arg Gly Val Arg Ala Thr Gly Ala Thr Leu Ser Ala Glu
210 215 220
Gln Ala Lys Trp Ala Gln Lys Ala Ile Ala Glu Glu Gly Leu Ala Asp
225 230 235 240
Leu Ala Glu Val Arg His Thr Asp Tyr Arg Asp Val Gly Glu Ala Ala
245 250 255
Phe Asp Ala Val Ser Ser Ile Gly Leu Thr Glu His Ile Gly Val Lys
260 265 270
Asn Tyr Pro Ala Tyr Phe Gly Phe Leu Lys Ser Lys Leu Arg Thr Gly
275 280 285
Gly Leu Leu Leu Asn His Cys Ile Thr Arg His Asp Asn Thr Ser Thr
290 295 300
Ser Phe Ala Gly Gly Phe Thr Asp Arg Tyr Val Phe Pro Asp Gly Glu
305 310 315 320
Leu Thr Gly Ser Gly Arg Ile Thr Cys Asp Val Gln Asp Cys Gly Phe
325 330 335
Glu Val Leu His Ala Glu Asn Phe Arg His His Tyr Ala Met Thr Leu
340 345 350
Arg Asp Trp Cys Arg Asn Leu Val Glu Asn Trp Asp Ala Ala Val Ser
355 360 365
Glu Val Gly Leu Pro Thr Ala Lys Val Trp Gly Leu Tyr Met Ala Ala
370 375 380
Ser Arg Val Ala Phe Glu Gln Asn Asn Leu Gln Leu His His Val Leu
385 390 395 400
Ala Ala Lys Thr Asp Ala Arg Gly Asp Asp Asp Leu Pro Leu Arg Pro
405 410 415
Trp Trp Thr Ala
420
<210> 43
<211> 1380
<212> DNA
<213> 草分枝杆菌
<400> 43
gtgtctgaac cccgaaccga cgcacgtgtt gttcaggccg cgggcgtgca caagctgctg 60
gagagctacc gcgcgatccc gcccgaggcc accgtccggc tggccaaacc cacctcgaac 120
ctgttccggg cgcgcgccaa gacctcggtc aagggtctcg atgtctcggg cctgacccat 180
gtgatctccg tcgaccccga cgagcgcacc gctgaggtgg ccgggatgtg cacctacgag 240
gacctggtcg ccgcgacgct gccgtacggg ctgtcaccgc tggtggtgcc gcagctcaag 300
accatcaccc tcggcggcgc cgtgacgggt ctgggcatcg agtcggcgtc gttccgtaac 360
ggcctgccgc acgagtcggt gctggagatg gacatcctca ccggatcggg cgagatcctc 420
accgcctccc gcgaccagca ccccgacctg ttccgggcgt tcccgaactc ctatggcacg 480
ctgggctatt cggtgcggct gaagatcgag ttggagaccg tcaaaccgtt cgtcgcggtc 540
cgtcacctgc ggttccacga catcgaggac ctggtcgccg agatggaccg cattgtcgag 600
accggcggct acgacggcac cccggtcgac tatctcgacg gtgtggtgtt ctcggcccgc 660
gagagctacc tgacgctggg cttccagacc gccaccccgg gcccggtcag cgactacacc 720
ggccagcaga tctactaccg ctcgatccag cacgaggacg gcgtcaagga cgaccggctg 780
acgatccacg actacttctg gcgctgggac accgactggt tctggtgctc gcgggcgttc 840
ggcgtgcaga acccgacgat ccgccggttc tggccgcgcc ggctcaagcg cagcagcttc 900
tactggaagc tggtcgccta cgaccgcaag ttcaacatcg ccgatcgcat cgagatgcac 960
aacggccgcc cgccccgcga gcgcgtcgtg caggacatcg aggtgccgat cgagcgggtc 1020
gccgagtttt tgggctggtt cctcgacaac gtgccgatcg agccgatctg gctgtgcccg 1080
ttgcgtcttc gcgacgacgc cggctggccg ctgtacccga tccgggcgca gcacacctac 1140
gtcaacgtgg ggttctggtc ctcggtgccg gtggggccca ccgaggggca cacgaaccgg 1200
ctgatcgagc gcaaggtcag cgagctcgac gggcacaagt cgctgtactc ggacgcgtac 1260
tactcgcgcg acgagttcga ccagctctac ggcggcgaaa tctacaaaac cgttaaaaag 1320
gcctacgatc cagattcacg actgctcgac ctgtacgcga aggcggtgca gcgccagtga 1380
<210> 44
<211> 459
<212> PRT
<213> 草分枝杆菌
<400> 44
Val Ser Glu Pro Arg Thr Asp Ala Arg Val Val Gln Ala Ala Gly Val
1 5 10 15
His Lys Leu Leu Glu Ser Tyr Arg Ala Ile Pro Pro Glu Ala Thr Val
20 25 30
Arg Leu Ala Lys Pro Thr Ser Asn Leu Phe Arg Ala Arg Ala Lys Thr
35 40 45
Ser Val Lys Gly Leu Asp Val Ser Gly Leu Thr His Val Ile Ser Val
50 55 60
Asp Pro Asp Glu Arg Thr Ala Glu Val Ala Gly Met Cys Thr Tyr Glu
65 70 75 80
Asp Leu Val Ala Ala Thr Leu Pro Tyr Gly Leu Ser Pro Leu Val Val
85 90 95
Pro Gln Leu Lys Thr Ile Thr Leu Gly Gly Ala Val Thr Gly Leu Gly
100 105 110
Ile Glu Ser Ala Ser Phe Arg Asn Gly Leu Pro His Glu Ser Val Leu
115 120 125
Glu Met Asp Ile Leu Thr Gly Ser Gly Glu Ile Leu Thr Ala Ser Arg
130 135 140
Asp Gln His Pro Asp Leu Phe Arg Ala Phe Pro Asn Ser Tyr Gly Thr
145 150 155 160
Leu Gly Tyr Ser Val Arg Leu Lys Ile Glu Leu Glu Thr Val Lys Pro
165 170 175
Phe Val Ala Val Arg His Leu Arg Phe His Asp Ile Glu Asp Leu Val
180 185 190
Ala Glu Met Asp Arg Ile Val Glu Thr Gly Gly Tyr Asp Gly Thr Pro
195 200 205
Val Asp Tyr Leu Asp Gly Val Val Phe Ser Ala Arg Glu Ser Tyr Leu
210 215 220
Thr Leu Gly Phe Gln Thr Ala Thr Pro Gly Pro Val Ser Asp Tyr Thr
225 230 235 240
Gly Gln Gln Ile Tyr Tyr Arg Ser Ile Gln His Glu Asp Gly Val Lys
245 250 255
Asp Asp Arg Leu Thr Ile His Asp Tyr Phe Trp Arg Trp Asp Thr Asp
260 265 270
Trp Phe Trp Cys Ser Arg Ala Phe Gly Val Gln Asn Pro Thr Ile Arg
275 280 285
Arg Phe Trp Pro Arg Arg Leu Lys Arg Ser Ser Phe Tyr Trp Lys Leu
290 295 300
Val Ala Tyr Asp Arg Lys Phe Asn Ile Ala Asp Arg Ile Glu Met His
305 310 315 320
Asn Gly Arg Pro Pro Arg Glu Arg Val Val Gln Asp Ile Glu Val Pro
325 330 335
Ile Glu Arg Val Ala Glu Phe Leu Gly Trp Phe Leu Asp Asn Val Pro
340 345 350
Ile Glu Pro Ile Trp Leu Cys Pro Leu Arg Leu Arg Asp Asp Ala Gly
355 360 365
Trp Pro Leu Tyr Pro Ile Arg Ala Gln His Thr Tyr Val Asn Val Gly
370 375 380
Phe Trp Ser Ser Val Pro Val Gly Pro Thr Glu Gly His Thr Asn Arg
385 390 395 400
Leu Ile Glu Arg Lys Val Ser Glu Leu Asp Gly His Lys Ser Leu Tyr
405 410 415
Ser Asp Ala Tyr Tyr Ser Arg Asp Glu Phe Asp Gln Leu Tyr Gly Gly
420 425 430
Glu Ile Tyr Lys Thr Val Lys Lys Ala Tyr Asp Pro Asp Ser Arg Leu
435 440 445
Leu Asp Leu Tyr Ala Lys Ala Val Gln Arg Gln
450 455
<210> 45
<211> 1314
<212> DNA
<213> 草分枝杆菌
<400> 45
atgacggcga tcaaagagaa cccggtcctg acttcggcca ggaagctgtc cctggccgag 60
attctggaaa tccttgccgg gggcgaactc ccggtgcgtt tcacggccta cgacggcagc 120
tcggcgggcc cggcggactc cccgctcggc ctggagctgc tgaccccgcg cggcaccacc 180
tatctggcca ccgccccggg cgatctcggg ctggcacgcg cctacatcgc cggtgacctg 240
cagccgcacg gcgtgcatcc gggcgatccg tacgagctgc tcaaggccct gtcggagaag 300
atggagttca agcggccgcc cgcgaaggtg ctggccaaca tcgtgcgctc catcggtatc 360
gagcacctca agccgatcgc accgccgccg caggaggcgc agccgcgctg gcgccggatc 420
gcggaagggt tgcggcacag caagactcgc gacgccgagg cgatccacca ccactacgac 480
gtgtccaaca cgttctacga gtgggtgctc ggcccgtcga tgacctacac ctgcgcgtgc 540
tacccggacg tcgacgcaac cctggagcag gcgcaggaga acaagtaccg cctggtgttc 600
gagaagctgc gcctgaagcc gggcgaccgg ctgctcgacg tgggctgcgg ctggggcggc 660
atggtgcgct acgccgccca gcacggggtc aaggccatcg gcgtcacgct gtctcgggag 720
caggcgacgt gggcgcagaa ggcgatcgcc gagcaggggc tcagcgatct ggccgaggtc 780
cgccacggcg actaccgcga cattcgcgag tccgggttcg acgcggtgtc ctcgatcggg 840
ctgaccgagc acatcggcgt ggccaactac ccgtcgtact tccggttcct gcagtccaag 900
ctgcgtgtcg gcgggctgct gctcaaccac tgcatcaccc ggccggacaa caagtcgcag 960
gccagcgcgg gcgggttcat cgaccgctac gtgttccccg acggggagct caccgggtcc 1020
ggccgcatca tcgccgcggc ccaggacgtc ggcctcgagg tggtgcacga ggagaacctg 1080
cgccagcact acgcgatgac gctgcgcgac tggtgccgca acctcgtcga gcactgggac 1140
gaggcggtcg ccgaggtcgg cctggaacgc gccaagatct ggggcctgta catggccggc 1200
tcccggctcg gcttcgagac gaacatcgtg cagctgcacc aggtgctggc ggtcaagctg 1260
gaccgcaggg gcggcgacgg cgggctgccg ttgcgcccgt ggtggacgcc ctag 1314
<210> 46
<211> 437
<212> PRT
<213> 草分枝杆菌
<400> 46
Met Thr Ala Ile Lys Glu Asn Pro Val Leu Thr Ser Ala Arg Lys Leu
1 5 10 15
Ser Leu Ala Glu Ile Leu Glu Ile Leu Ala Gly Gly Glu Leu Pro Val
20 25 30
Arg Phe Thr Ala Tyr Asp Gly Ser Ser Ala Gly Pro Ala Asp Ser Pro
35 40 45
Leu Gly Leu Glu Leu Leu Thr Pro Arg Gly Thr Thr Tyr Leu Ala Thr
50 55 60
Ala Pro Gly Asp Leu Gly Leu Ala Arg Ala Tyr Ile Ala Gly Asp Leu
65 70 75 80
Gln Pro His Gly Val His Pro Gly Asp Pro Tyr Glu Leu Leu Lys Ala
85 90 95
Leu Ser Glu Lys Met Glu Phe Lys Arg Pro Pro Ala Lys Val Leu Ala
100 105 110
Asn Ile Val Arg Ser Ile Gly Ile Glu His Leu Lys Pro Ile Ala Pro
115 120 125
Pro Pro Gln Glu Ala Gln Pro Arg Trp Arg Arg Ile Ala Glu Gly Leu
130 135 140
Arg His Ser Lys Thr Arg Asp Ala Glu Ala Ile His His His Tyr Asp
145 150 155 160
Val Ser Asn Thr Phe Tyr Glu Trp Val Leu Gly Pro Ser Met Thr Tyr
165 170 175
Thr Cys Ala Cys Tyr Pro Asp Val Asp Ala Thr Leu Glu Gln Ala Gln
180 185 190
Glu Asn Lys Tyr Arg Leu Val Phe Glu Lys Leu Arg Leu Lys Pro Gly
195 200 205
Asp Arg Leu Leu Asp Val Gly Cys Gly Trp Gly Gly Met Val Arg Tyr
210 215 220
Ala Ala Gln His Gly Val Lys Ala Ile Gly Val Thr Leu Ser Arg Glu
225 230 235 240
Gln Ala Thr Trp Ala Gln Lys Ala Ile Ala Glu Gln Gly Leu Ser Asp
245 250 255
Leu Ala Glu Val Arg His Gly Asp Tyr Arg Asp Ile Arg Glu Ser Gly
260 265 270
Phe Asp Ala Val Ser Ser Ile Gly Leu Thr Glu His Ile Gly Val Ala
275 280 285
Asn Tyr Pro Ser Tyr Phe Arg Phe Leu Gln Ser Lys Leu Arg Val Gly
290 295 300
Gly Leu Leu Leu Asn His Cys Ile Thr Arg Pro Asp Asn Lys Ser Gln
305 310 315 320
Ala Ser Ala Gly Gly Phe Ile Asp Arg Tyr Val Phe Pro Asp Gly Glu
325 330 335
Leu Thr Gly Ser Gly Arg Ile Ile Ala Ala Ala Gln Asp Val Gly Leu
340 345 350
Glu Val Val His Glu Glu Asn Leu Arg Gln His Tyr Ala Met Thr Leu
355 360 365
Arg Asp Trp Cys Arg Asn Leu Val Glu His Trp Asp Glu Ala Val Ala
370 375 380
Glu Val Gly Leu Glu Arg Ala Lys Ile Trp Gly Leu Tyr Met Ala Gly
385 390 395 400
Ser Arg Leu Gly Phe Glu Thr Asn Ile Val Gln Leu His Gln Val Leu
405 410 415
Ala Val Lys Leu Asp Arg Arg Gly Gly Asp Gly Gly Leu Pro Leu Arg
420 425 430
Pro Trp Trp Thr Pro
435
<210> 47
<211> 1413
<212> DNA
<213> 结核分枝杆菌
<400> 47
atgcaggggc agttgtcgag gactagggta tatacggtgc ctgtccctgg atctgcacag 60
tcggcttacg cctgcggcgt cgagcggttg ctggcgagct atcgatccat ccccgcgact 120
gcatccatcc ggcttgccaa gcccacctca aatctgttcc gcgcccgcgt caaacacgat 180
gcacgcggcc tggacgcatc gggactgacc ggtgtcatcg gtatcgatcc cgaggcccgc 240
accgccgacg tggccggcat gtgcacatac gaggacctaa tcgccgcgac actgcactac 300
ggtctgtcac cattggtggt tccgcagctg aggacgatca cattgggcgg agcggtcacc 360
ggcttgggta tcgagtcggc gtcgttccgc aacggcctgc cccacgagtc ggtgctggag 420
atggatatcc tcaccggcgc aggagaactt ctcaccgtct cgcccggaca gcactccgac 480
ttgtaccgtg cattccctaa ctcgtatggg acactgggct attcaacccg gcttcgaatc 540
cagctggagc cggtccggcc gtttgtcgcg ctgcggcaca tccgatttag ctcgttgacg 600
gcgatggtgg ccgcaatgga gcgcatcatc gacaccggcg gactggacgg cgaatcggtg 660
gactatctcg acggggtggt tttcagcgct gacgaaagct acctgtgcat cggcatgcag 720
acgagcgtac cgggcccggt cagcgactac accggacaag acatctacta ccggtcgatc 780
caacacgagg cggggatcaa ggaagaccgg ttgaccatcc acgattactt ctggcgctgg 840
gacaccgatt ggttctggtg ctcacgatcg tttggtgccc aaaacccgcg gctgcgccgc 900
tggtggccgc ggcgctaccg gcgtagcagt gtctactgga ggttgatggc gctcgatcag 960
cgcttcggga tcgccgaccg gttcgagaac agcaggggtc gtcccgcgcg tgaacgggtg 1020
gtgcaggata tcgaagtgcc gatcgaacgg acctgcgagt ttctggagtg gttcggggaa 1080
aacgtgccca tttcgccaat ctggttgtgc ccgttgcggc tacgcgatca cgccggctgg 1140
ccgctgtacc cgatccggcc tgaccgtagc tatgtcaaca tcgggttctg gtcgtcggtg 1200
ccggttggcg ccaccgaggg cgccaccaac cgcaagatcg agaacaaggt gagtgcgctc 1260
gacgggcaca agtcgctcta ctccgactcc ttctataccc gcgaggagtt cgacgagctc 1320
tacggcggcg agacttacaa cactgtgaag aaagcctacg atcccgattc gcgtctcctc 1380
gatctttacg caaaggcggt gcaacgacga tga 1413
<210> 48
<211> 470
<212> PRT
<213> 结核分枝杆菌
<400> 48
Met Gln Gly Gln Leu Ser Arg Thr Arg Val Tyr Thr Val Pro Val Pro
1 5 10 15
Gly Ser Ala Gln Ser Ala Tyr Ala Cys Gly Val Glu Arg Leu Leu Ala
20 25 30
Ser Tyr Arg Ser Ile Pro Ala Thr Ala Ser Ile Arg Leu Ala Lys Pro
35 40 45
Thr Ser Asn Leu Phe Arg Ala Arg Val Lys His Asp Ala Arg Gly Leu
50 55 60
Asp Ala Ser Gly Leu Thr Gly Val Ile Gly Ile Asp Pro Glu Ala Arg
65 70 75 80
Thr Ala Asp Val Ala Gly Met Cys Thr Tyr Glu Asp Leu Ile Ala Ala
85 90 95
Thr Leu His Tyr Gly Leu Ser Pro Leu Val Val Pro Gln Leu Arg Thr
100 105 110
Ile Thr Leu Gly Gly Ala Val Thr Gly Leu Gly Ile Glu Ser Ala Ser
115 120 125
Phe Arg Asn Gly Leu Pro His Glu Ser Val Leu Glu Met Asp Ile Leu
130 135 140
Thr Gly Ala Gly Glu Leu Leu Thr Val Ser Pro Gly Gln His Ser Asp
145 150 155 160
Leu Tyr Arg Ala Phe Pro Asn Ser Tyr Gly Thr Leu Gly Tyr Ser Thr
165 170 175
Arg Leu Arg Ile Gln Leu Glu Pro Val Arg Pro Phe Val Ala Leu Arg
180 185 190
His Ile Arg Phe Ser Ser Leu Thr Ala Met Val Ala Ala Met Glu Arg
195 200 205
Ile Ile Asp Thr Gly Gly Leu Asp Gly Glu Ser Val Asp Tyr Leu Asp
210 215 220
Gly Val Val Phe Ser Ala Asp Glu Ser Tyr Leu Cys Ile Gly Met Gln
225 230 235 240
Thr Ser Val Pro Gly Pro Val Ser Asp Tyr Thr Gly Gln Asp Ile Tyr
245 250 255
Tyr Arg Ser Ile Gln His Glu Ala Gly Ile Lys Glu Asp Arg Leu Thr
260 265 270
Ile His Asp Tyr Phe Trp Arg Trp Asp Thr Asp Trp Phe Trp Cys Ser
275 280 285
Arg Ser Phe Gly Ala Gln Asn Pro Arg Leu Arg Arg Trp Trp Pro Arg
290 295 300
Arg Tyr Arg Arg Ser Ser Val Tyr Trp Arg Leu Met Ala Leu Asp Gln
305 310 315 320
Arg Phe Gly Ile Ala Asp Arg Phe Glu Asn Ser Arg Gly Arg Pro Ala
325 330 335
Arg Glu Arg Val Val Gln Asp Ile Glu Val Pro Ile Glu Arg Thr Cys
340 345 350
Glu Phe Leu Glu Trp Phe Gly Glu Asn Val Pro Ile Ser Pro Ile Trp
355 360 365
Leu Cys Pro Leu Arg Leu Arg Asp His Ala Gly Trp Pro Leu Tyr Pro
370 375 380
Ile Arg Pro Asp Arg Ser Tyr Val Asn Ile Gly Phe Trp Ser Ser Val
385 390 395 400
Pro Val Gly Ala Thr Glu Gly Ala Thr Asn Arg Lys Ile Glu Asn Lys
405 410 415
Val Ser Ala Leu Asp Gly His Lys Ser Leu Tyr Ser Asp Ser Phe Tyr
420 425 430
Thr Arg Glu Glu Phe Asp Glu Leu Tyr Gly Gly Glu Thr Tyr Asn Thr
435 440 445
Val Lys Lys Ala Tyr Asp Pro Asp Ser Arg Leu Leu Asp Leu Tyr Ala
450 455 460
Lys Ala Val Gln Arg Arg
465 470
<210> 49
<211> 1263
<212> DNA
<213> 结核分枝杆菌
<400> 49
atggccgaga tcctggagat cttcaccgcg accgggcaac acccgctgaa gttcaccgcg 60
tatgacggca gcaccgcggg acaagacgac gccacactgg gcctggatct tcggacgccc 120
cgcggcgcca cctacttagc taccgctccc ggcgaactcg gcctggcccg cgcttatgtg 180
tcgggtgacc tacaggcaca cggagtacat cccggcgatc cgtacgaact gctcaaaacg 240
ctgaccgaaa gggtcgactt caaacggccg tcggcgcggg tgctggctaa tgtggtgcgc 300
tcgatcggcg ttgagcacat actgcccatc gcgccgccac cccaggaggc gcgaccccgg 360
tggcgtcgaa tggctaatgg cttgctgcac agcaagaccc gtgacgccga ggctatccat 420
caccactacg acgtctccaa caacttctac gagtgggtgc tcgggccatc gatgacctac 480
acgtgcgcgg tgtttccgaa cgctgaggct tcgctggagc aggcccaaga gaacaaatac 540
cgactcattt tcgaaaagct acggctagag ccgggtgacc ggctactcga cgtcggctgc 600
ggctggggcg gcatggtgcg ctacgccgcc cgacgcggtg tccgggtgat cggcgccacg 660
ctctcggccg agcaggccaa gtggggccag aaagcagtcg aggacgaggg attgagcgac 720
ctcgcgcagg tgcggcattc cgactaccgc gacgtagccg agaccggttt cgacgccgtt 780
tcttcgatcg ggctaaccga gcacatcggc gtcaagaatt acccgttcta cttcgggttt 840
ctcaagtcga agttgcgcac cggcggcttg ctgctcaatc actgcatcac ccgccacgac 900
aacaggtcga cgtcctttgc cggcgggttc accgaccgtt acgttttccc cgacggggag 960
ctgacgggct cgggacgtat taccaccgag atccagcagg tcggcttgga agtgctgcac 1020
gaggagaact tccgccatca ctacgcgatg acgctgcgcg actggtgcgg caacctcgtc 1080
gaacactggg acgacgcggt cgccgaggtc ggtctgccga ccgccaaggt gtggggcctg 1140
tacatggcgg cttcgcgggt ggccttcgaa cgaaacaacc tgcagctaca tcacgtattg 1200
gcgaccaagg tggacccccg gggcgacgac agcttgccac tgcggccctg gtggcagccc 1260
tag 1263
<210> 50
<211> 420
<212> PRT
<213> 结核分枝杆菌
<400> 50
Met Ala Glu Ile Leu Glu Ile Phe Thr Ala Thr Gly Gln His Pro Leu
1 5 10 15
Lys Phe Thr Ala Tyr Asp Gly Ser Thr Ala Gly Gln Asp Asp Ala Thr
20 25 30
Leu Gly Leu Asp Leu Arg Thr Pro Arg Gly Ala Thr Tyr Leu Ala Thr
35 40 45
Ala Pro Gly Glu Leu Gly Leu Ala Arg Ala Tyr Val Ser Gly Asp Leu
50 55 60
Gln Ala His Gly Val His Pro Gly Asp Pro Tyr Glu Leu Leu Lys Thr
65 70 75 80
Leu Thr Glu Arg Val Asp Phe Lys Arg Pro Ser Ala Arg Val Leu Ala
85 90 95
Asn Val Val Arg Ser Ile Gly Val Glu His Ile Leu Pro Ile Ala Pro
100 105 110
Pro Pro Gln Glu Ala Arg Pro Arg Trp Arg Arg Met Ala Asn Gly Leu
115 120 125
Leu His Ser Lys Thr Arg Asp Ala Glu Ala Ile His His His Tyr Asp
130 135 140
Val Ser Asn Asn Phe Tyr Glu Trp Val Leu Gly Pro Ser Met Thr Tyr
145 150 155 160
Thr Cys Ala Val Phe Pro Asn Ala Glu Ala Ser Leu Glu Gln Ala Gln
165 170 175
Glu Asn Lys Tyr Arg Leu Ile Phe Glu Lys Leu Arg Leu Glu Pro Gly
180 185 190
Asp Arg Leu Leu Asp Val Gly Cys Gly Trp Gly Gly Met Val Arg Tyr
195 200 205
Ala Ala Arg Arg Gly Val Arg Val Ile Gly Ala Thr Leu Ser Ala Glu
210 215 220
Gln Ala Lys Trp Gly Gln Lys Ala Val Glu Asp Glu Gly Leu Ser Asp
225 230 235 240
Leu Ala Gln Val Arg His Ser Asp Tyr Arg Asp Val Ala Glu Thr Gly
245 250 255
Phe Asp Ala Val Ser Ser Ile Gly Leu Thr Glu His Ile Gly Val Lys
260 265 270
Asn Tyr Pro Phe Tyr Phe Gly Phe Leu Lys Ser Lys Leu Arg Thr Gly
275 280 285
Gly Leu Leu Leu Asn His Cys Ile Thr Arg His Asp Asn Arg Ser Thr
290 295 300
Ser Phe Ala Gly Gly Phe Thr Asp Arg Tyr Val Phe Pro Asp Gly Glu
305 310 315 320
Leu Thr Gly Ser Gly Arg Ile Thr Thr Glu Ile Gln Gln Val Gly Leu
325 330 335
Glu Val Leu His Glu Glu Asn Phe Arg His His Tyr Ala Met Thr Leu
340 345 350
Arg Asp Trp Cys Gly Asn Leu Val Glu His Trp Asp Asp Ala Val Ala
355 360 365
Glu Val Gly Leu Pro Thr Ala Lys Val Trp Gly Leu Tyr Met Ala Ala
370 375 380
Ser Arg Val Ala Phe Glu Arg Asn Asn Leu Gln Leu His His Val Leu
385 390 395 400
Ala Thr Lys Val Asp Pro Arg Gly Asp Asp Ser Leu Pro Leu Arg Pro
405 410 415
Trp Trp Gln Pro
420
<210> 51
<211> 1392
<212> DNA
<213> 未知的
<220>
<223> 范巴伦氏分枝杆菌
<400> 51
gtgtctgttc cttcgaccga cgcacgttct gctcacgccg acggcgtgca gcggcttctc 60
gccagctatc gggcgattcc ccaagacgcc acggtccggc tggccaaacc cacgtcgaac 120
ctcttccgtg cccgcgcgaa aaccaggacc aagggtctgg acacgtctgg gttgacgaac 180
gtgatcgcgg tcgacgcgga ggcacgcacc gccgatgtgg cagggatgtg cacctacgaa 240
gacctggtcg cggccacgct gccgcatgga ctttcgccgc tggtggtgcc gcagttgaag 300
acgatcaccc tcggcggggc ggtcaccgga ctcgggatcg agtccgcctc gttccgcaac 360
ggcctgccac acgaatcggt tctcgagatg gacgtcctca ccggcaccgg tgatgtcgtg 420
cgcgcctccc ccgacgagaa ccctgacctg tttcgggcgt ttccgaattc ctatggcacg 480
ttgggctatt cggttcggct caagatcgag ctggaaccgg tgaagccgtt cgtcgcgctg 540
cgccacctcc gtttccattc gctgtcggct ctcatcgagg cgatggaccg catcgtcgaa 600
accggcggcc tcaacggcga accggtggac tacctcgacg gcgtcgtgtt cagtgccgag 660
gagagttacc tgtgcgtggg gcagcgctcc gcgacaccgg gcccggtcag cgactacacg 720
ggcaagcaga tctactaccg ctcgattcag cacgacggcc cgaccgatgg cgccgagaag 780
cacgaccggc tgaccatcca cgactacctg tggcgctggg acaccgactg gttctggtgc 840
tcaagggcat tcggcgcgca gaacccgcgg atccggcgct ggtggccgcg ccggtaccgg 900
cgcagcagtg tgtactggaa gctgatcggc tacgaccggc gtttcggtat cgccgatcgc 960
atcgagaagc gcaacggccg acccccgcgc gagcgggtgg tccaggacat cgaggtgccc 1020
atcgagcgga ccgtcgagtt tctgcagtgg tttctcgaca ccgtgcccat cgaaccgatc 1080
tggttgtgcc cgttgcggct ccgcgacgac cgcgattggc ccctgtatcc gatccgaccc 1140
caccacacct acgtcaacgt gggtttctgg tcgtcggtgc cggtgggccc ggaggagggc 1200
tacaccaaca ggatgatcga acggaaagtc agcgacctcg acggtcacaa atcgctgtat 1260
tccgatgcgt actactcgcc ggaagagttt gattcgctct atggcgggga gacgtacaag 1320
acggtgaaga agacatacga cccagactct cgtttcctgg acctgtacgg caaagcagtg 1380
gggcggcaat ga 1392
<210> 52
<211> 463
<212> PRT
<213> 未知的
<220>
<223> 范巴伦氏分枝杆菌
<400> 52
Val Ser Val Pro Ser Thr Asp Ala Arg Ser Ala His Ala Asp Gly Val
1 5 10 15
Gln Arg Leu Leu Ala Ser Tyr Arg Ala Ile Pro Gln Asp Ala Thr Val
20 25 30
Arg Leu Ala Lys Pro Thr Ser Asn Leu Phe Arg Ala Arg Ala Lys Thr
35 40 45
Arg Thr Lys Gly Leu Asp Thr Ser Gly Leu Thr Asn Val Ile Ala Val
50 55 60
Asp Ala Glu Ala Arg Thr Ala Asp Val Ala Gly Met Cys Thr Tyr Glu
65 70 75 80
Asp Leu Val Ala Ala Thr Leu Pro His Gly Leu Ser Pro Leu Val Val
85 90 95
Pro Gln Leu Lys Thr Ile Thr Leu Gly Gly Ala Val Thr Gly Leu Gly
100 105 110
Ile Glu Ser Ala Ser Phe Arg Asn Gly Leu Pro His Glu Ser Val Leu
115 120 125
Glu Met Asp Val Leu Thr Gly Thr Gly Asp Val Val Arg Ala Ser Pro
130 135 140
Asp Glu Asn Pro Asp Leu Phe Arg Ala Phe Pro Asn Ser Tyr Gly Thr
145 150 155 160
Leu Gly Tyr Ser Val Arg Leu Lys Ile Glu Leu Glu Pro Val Lys Pro
165 170 175
Phe Val Ala Leu Arg His Leu Arg Phe His Ser Leu Ser Ala Leu Ile
180 185 190
Glu Ala Met Asp Arg Ile Val Glu Thr Gly Gly Leu Asn Gly Glu Pro
195 200 205
Val Asp Tyr Leu Asp Gly Val Val Phe Ser Ala Glu Glu Ser Tyr Leu
210 215 220
Cys Val Gly Gln Arg Ser Ala Thr Pro Gly Pro Val Ser Asp Tyr Thr
225 230 235 240
Gly Lys Gln Ile Tyr Tyr Arg Ser Ile Gln His Asp Gly Pro Thr Asp
245 250 255
Gly Ala Glu Lys His Asp Arg Leu Thr Ile His Asp Tyr Leu Trp Arg
260 265 270
Trp Asp Thr Asp Trp Phe Trp Cys Ser Arg Ala Phe Gly Ala Gln Asn
275 280 285
Pro Arg Ile Arg Arg Trp Trp Pro Arg Arg Tyr Arg Arg Ser Ser Val
290 295 300
Tyr Trp Lys Leu Ile Gly Tyr Asp Arg Arg Phe Gly Ile Ala Asp Arg
305 310 315 320
Ile Glu Lys Arg Asn Gly Arg Pro Pro Arg Glu Arg Val Val Gln Asp
325 330 335
Ile Glu Val Pro Ile Glu Arg Thr Val Glu Phe Leu Gln Trp Phe Leu
340 345 350
Asp Thr Val Pro Ile Glu Pro Ile Trp Leu Cys Pro Leu Arg Leu Arg
355 360 365
Asp Asp Arg Asp Trp Pro Leu Tyr Pro Ile Arg Pro His His Thr Tyr
370 375 380
Val Asn Val Gly Phe Trp Ser Ser Val Pro Val Gly Pro Glu Glu Gly
385 390 395 400
Tyr Thr Asn Arg Met Ile Glu Arg Lys Val Ser Asp Leu Asp Gly His
405 410 415
Lys Ser Leu Tyr Ser Asp Ala Tyr Tyr Ser Pro Glu Glu Phe Asp Ser
420 425 430
Leu Tyr Gly Gly Glu Thr Tyr Lys Thr Val Lys Lys Thr Tyr Asp Pro
435 440 445
Asp Ser Arg Phe Leu Asp Leu Tyr Gly Lys Ala Val Gly Arg Gln
450 455 460
<210> 53
<211> 1323
<212> DNA
<213> 未知的
<220>
<223> 范巴伦氏分枝杆菌
<400> 53
ttgacgacat ttcgggacgg cgcggccgac accggcctgc acggagaccg caagctcacc 60
ctggcggagg tcttggaggt cttcgcctcg ggccgactgc ctctgaagtt cacggcgtac 120
gacggcagca gcgcgggccc ggacgacgcc acgctcgggc tggacctgct gaccccccgc 180
gggaccacgt acctcgcaac ggctcccggc gatctcggcc tggcccgggc ctacgtctcc 240
ggtgacctgc agttgcaggg ggtgcaccct ggcgacccgt acgacctgct caacgcactg 300
gtgcagaaac tggacttcaa gcgaccgtcc gcccgggtgc tggcgcaggt cgtccgatcg 360
atcgggatcg agcacctgaa accgatcgcg ccaccgccgc aggaggcgct gccgcggtgg 420
cggcgcatcg cagaaggact gcggcacagc aagacccgtg acgccgacgc gatccaccac 480
cattacgatg tctccaacac cttctacgag tgggtgctcg ggccgtcgat gacctacacc 540
tgcgcctgct acccgcatcc cgacgccacc ctcgaggagg cgcaggagaa caaatatcgg 600
ctggtgttcg agaaactgcg cctcaagccg ggcgaccgcc ttctcgacgt gggttgcggg 660
tggggcggaa tggtgcgcta cgcggcccgt cacggcgtca aggcgatcgg ggtgacgctg 720
tccagggagc aggcgcagtg ggcacgcgcc gccatcgaac gggacggcct gggtgacctc 780
gccgaggtcc gccacagcga ctaccgcgat gtgcgcgagt cccagttcga cgccgtgtct 840
tcgctggggc tcaccgagca catcggggtc gccaactatc cgtcgtactt ccggttcctc 900
aagtcgaagt tgcgcccggg cggcctactg ctcaaccact gcatcacccg gcacaacaat 960
cgcaccggcc ccgccgccgg gggattcatc gaccggtatg tgttcccgga cggggagctg 1020
accggatcgg gccggatcat caccgagatc caggacgtcg gtttggaggt gatgcacgaa 1080
gagaacctgc gccggcacta tgcgctgaca cttcgggact ggtgccggaa tctggtgcag 1140
cactgggacg aagcggtcgc agaggtcggc ctgcccaccg ccaaggtgtg gggtctgtac 1200
atggctgcct cgcgggtcgg cttcgagcag aacagcattc agctgcatca ggtactggcg 1260
gtgaagctcg acgaacgtgg cggggacggc ggtttgccgt tgcggccctg gtggaccgcg 1320
tag 1323
<210> 54
<211> 440
<212> PRT
<213> 未知的
<220>
<223> 范巴伦氏分枝杆菌
<400> 54
Leu Thr Thr Phe Arg Asp Gly Ala Ala Asp Thr Gly Leu His Gly Asp
1 5 10 15
Arg Lys Leu Thr Leu Ala Glu Val Leu Glu Val Phe Ala Ser Gly Arg
20 25 30
Leu Pro Leu Lys Phe Thr Ala Tyr Asp Gly Ser Ser Ala Gly Pro Asp
35 40 45
Asp Ala Thr Leu Gly Leu Asp Leu Leu Thr Pro Arg Gly Thr Thr Tyr
50 55 60
Leu Ala Thr Ala Pro Gly Asp Leu Gly Leu Ala Arg Ala Tyr Val Ser
65 70 75 80
Gly Asp Leu Gln Leu Gln Gly Val His Pro Gly Asp Pro Tyr Asp Leu
85 90 95
Leu Asn Ala Leu Val Gln Lys Leu Asp Phe Lys Arg Pro Ser Ala Arg
100 105 110
Val Leu Ala Gln Val Val Arg Ser Ile Gly Ile Glu His Leu Lys Pro
115 120 125
Ile Ala Pro Pro Pro Gln Glu Ala Leu Pro Arg Trp Arg Arg Ile Ala
130 135 140
Glu Gly Leu Arg His Ser Lys Thr Arg Asp Ala Asp Ala Ile His His
145 150 155 160
His Tyr Asp Val Ser Asn Thr Phe Tyr Glu Trp Val Leu Gly Pro Ser
165 170 175
Met Thr Tyr Thr Cys Ala Cys Tyr Pro His Pro Asp Ala Thr Leu Glu
180 185 190
Glu Ala Gln Glu Asn Lys Tyr Arg Leu Val Phe Glu Lys Leu Arg Leu
195 200 205
Lys Pro Gly Asp Arg Leu Leu Asp Val Gly Cys Gly Trp Gly Gly Met
210 215 220
Val Arg Tyr Ala Ala Arg His Gly Val Lys Ala Ile Gly Val Thr Leu
225 230 235 240
Ser Arg Glu Gln Ala Gln Trp Ala Arg Ala Ala Ile Glu Arg Asp Gly
245 250 255
Leu Gly Asp Leu Ala Glu Val Arg His Ser Asp Tyr Arg Asp Val Arg
260 265 270
Glu Ser Gln Phe Asp Ala Val Ser Ser Leu Gly Leu Thr Glu His Ile
275 280 285
Gly Val Ala Asn Tyr Pro Ser Tyr Phe Arg Phe Leu Lys Ser Lys Leu
290 295 300
Arg Pro Gly Gly Leu Leu Leu Asn His Cys Ile Thr Arg His Asn Asn
305 310 315 320
Arg Thr Gly Pro Ala Ala Gly Gly Phe Ile Asp Arg Tyr Val Phe Pro
325 330 335
Asp Gly Glu Leu Thr Gly Ser Gly Arg Ile Ile Thr Glu Ile Gln Asp
340 345 350
Val Gly Leu Glu Val Met His Glu Glu Asn Leu Arg Arg His Tyr Ala
355 360 365
Leu Thr Leu Arg Asp Trp Cys Arg Asn Leu Val Gln His Trp Asp Glu
370 375 380
Ala Val Ala Glu Val Gly Leu Pro Thr Ala Lys Val Trp Gly Leu Tyr
385 390 395 400
Met Ala Ala Ser Arg Val Gly Phe Glu Gln Asn Ser Ile Gln Leu His
405 410 415
Gln Val Leu Ala Val Lys Leu Asp Glu Arg Gly Gly Asp Gly Gly Leu
420 425 430
Pro Leu Arg Pro Trp Trp Thr Ala
435 440
<210> 55
<211> 381
<212> DNA
<213> 未知的
<220>
<223> 范巴伦氏分枝杆菌
<400> 55
gtgatccgct ttctgctgcg cgtcgcggtc tttctcggat cgtcggcgat cgggctactg 60
gtggccggct ggctggtgcc gggggtgtcg ctgtcggtgc tgggcttcgt caccgcggtg 120
gtgatcttca cggtggcaca agggattctg tcgccgttct tcctgaagat ggccagccgc 180
tacgcgtcgg ccttcctcgg cggcatcggc ctggtgtcca cgttcgtggc gctgctgctc 240
gcgtcgctgc tgtccaacgg gctcagcatc cgcggcgtcg ggtcgtggat cgcggccacg 300
gtggtggtct ggctggtcac agccctggcg accgtcgtgc tgcccgttct ggtgctgcgg 360
gagaagaaga aagcagcctg a 381
<210> 56
<211> 126
<212> PRT
<213> 未知的
<220>
<223> 范巴伦氏分枝杆菌
<400> 56
Val Ile Arg Phe Leu Leu Arg Val Ala Val Phe Leu Gly Ser Ser Ala
1 5 10 15
Ile Gly Leu Leu Val Ala Gly Trp Leu Val Pro Gly Val Ser Leu Ser
20 25 30
Val Leu Gly Phe Val Thr Ala Val Val Ile Phe Thr Val Ala Gln Gly
35 40 45
Ile Leu Ser Pro Phe Phe Leu Lys Met Ala Ser Arg Tyr Ala Ser Ala
50 55 60
Phe Leu Gly Gly Ile Gly Leu Val Ser Thr Phe Val Ala Leu Leu Leu
65 70 75 80
Ala Ser Leu Leu Ser Asn Gly Leu Ser Ile Arg Gly Val Gly Ser Trp
85 90 95
Ile Ala Ala Thr Val Val Val Trp Leu Val Thr Ala Leu Ala Thr Val
100 105 110
Val Leu Pro Val Leu Val Leu Arg Glu Lys Lys Lys Ala Ala
115 120 125
<210> 57
<211> 1452
<212> DNA
<213> 浑浊红球菌
<400> 57
atgcgggagg gtggacgccc cttccgtgcg catcgcactc tgcccgtcac cgggatcgac 60
gctcaccgcg ccggcgtcga acggcttctc gcgtcctacc gcgcgattcc cacggacgcc 120
accgtgcgac tcgcgaagaa gacgtccaac ctgttccggg cgcgggccca gaccagcgca 180
cccggcctcg acgtctccgg gctcggcgga gtcatctcgg tcgacgagca ggaccggacc 240
gcggatgtcg ccggaatgtg cacgtacgaa gacctggtgg acgccaccct cccgtacggg 300
ctggcgccgc tggtggttcc gcaactcaag accatcacac tcggcggcgc ggtcaccggc 360
ctcggcatcg agtcgacgtc gttccgcaac gggctccccc acgaatcggt cctcgagatc 420
gacgtcctga ccggaagcgg cgacatcgtc accgcgagac cggaaggcga gaactccgac 480
ctgttctggg ggttccccaa ctcctacgga accctcggct actccacccg actgcgcatc 540
cagctcgaac ccgtcaaacg gtatgtggca ctgcgccatc tgcgtttcga ctccctggac 600
gagctgcagt cggcaatgga tcgcatcgtc accgagcgcg tccacgacgg catccccgtc 660
gactatctgg acggcgtcgt gttcaccgcg tccgagagtt acctgacact gggccatcag 720
accgacgagg gcggccccgt cagcgactac accgggcaga acatcttcta ccggtccatc 780
cagcacagtt ccgtgaacca ccccaaaacg gacaaactca ccatccgaga ctacctgtgg 840
cgctgggaca ccgactggtt ctggtgctcg cgcgccttcg gcgcccagaa ccccaccatc 900
cgccggctgt ggccgaagaa cctcctccgc agcagcttct actggaagct catcgccctc 960
gaccacaagt acgacatcgg cgaccgactc gagaagcgca agggcaaccc gccacgcgaa 1020
cgcgtcgtgc aggacgtcga agtgcccatc gagcgcaccg cggacttcgt ccgctggttc 1080
ctcgacgaaa tcccgatcga accgctgtgg ctgtgcccgt tgcggttgcg ggaacctgcc 1140
cccgccggcg cgtcctcgca acgcccctgg cccctgtacc ccctcgaacc gaaacgcacg 1200
tacgtgaaca tcggattctg gtcatcggtg cccatcgttc cgggccgacc cgagggggcc 1260
gcgaatcggc tgatcgaaga caaggtcagt gacttcgacg gacacaagtc cctctactcc 1320
gattcgtact attcacgcga agatttcgaa cgcctctact acggcggcga tcgatacacg 1380
gaactgaaaa aacgctacga cccgaaatca cgattactgg accttttctc caaggcggtg 1440
caacgtcgat ga 1452
<210> 58
<211> 483
<212> PRT
<213> 浑浊红球菌
<400> 58
Met Arg Glu Gly Gly Arg Pro Phe Arg Ala His Arg Thr Leu Pro Val
1 5 10 15
Thr Gly Ile Asp Ala His Arg Ala Gly Val Glu Arg Leu Leu Ala Ser
20 25 30
Tyr Arg Ala Ile Pro Thr Asp Ala Thr Val Arg Leu Ala Lys Lys Thr
35 40 45
Ser Asn Leu Phe Arg Ala Arg Ala Gln Thr Ser Ala Pro Gly Leu Asp
50 55 60
Val Ser Gly Leu Gly Gly Val Ile Ser Val Asp Glu Gln Asp Arg Thr
65 70 75 80
Ala Asp Val Ala Gly Met Cys Thr Tyr Glu Asp Leu Val Asp Ala Thr
85 90 95
Leu Pro Tyr Gly Leu Ala Pro Leu Val Val Pro Gln Leu Lys Thr Ile
100 105 110
Thr Leu Gly Gly Ala Val Thr Gly Leu Gly Ile Glu Ser Thr Ser Phe
115 120 125
Arg Asn Gly Leu Pro His Glu Ser Val Leu Glu Ile Asp Val Leu Thr
130 135 140
Gly Ser Gly Asp Ile Val Thr Ala Arg Pro Glu Gly Glu Asn Ser Asp
145 150 155 160
Leu Phe Trp Gly Phe Pro Asn Ser Tyr Gly Thr Leu Gly Tyr Ser Thr
165 170 175
Arg Leu Arg Ile Gln Leu Glu Pro Val Lys Arg Tyr Val Ala Leu Arg
180 185 190
His Leu Arg Phe Asp Ser Leu Asp Glu Leu Gln Ser Ala Met Asp Arg
195 200 205
Ile Val Thr Glu Arg Val His Asp Gly Ile Pro Val Asp Tyr Leu Asp
210 215 220
Gly Val Val Phe Thr Ala Ser Glu Ser Tyr Leu Thr Leu Gly His Gln
225 230 235 240
Thr Asp Glu Gly Gly Pro Val Ser Asp Tyr Thr Gly Gln Asn Ile Phe
245 250 255
Tyr Arg Ser Ile Gln His Ser Ser Val Asn His Pro Lys Thr Asp Lys
260 265 270
Leu Thr Ile Arg Asp Tyr Leu Trp Arg Trp Asp Thr Asp Trp Phe Trp
275 280 285
Cys Ser Arg Ala Phe Gly Ala Gln Asn Pro Thr Ile Arg Arg Leu Trp
290 295 300
Pro Lys Asn Leu Leu Arg Ser Ser Phe Tyr Trp Lys Leu Ile Ala Leu
305 310 315 320
Asp His Lys Tyr Asp Ile Gly Asp Arg Leu Glu Lys Arg Lys Gly Asn
325 330 335
Pro Pro Arg Glu Arg Val Val Gln Asp Val Glu Val Pro Ile Glu Arg
340 345 350
Thr Ala Asp Phe Val Arg Trp Phe Leu Asp Glu Ile Pro Ile Glu Pro
355 360 365
Leu Trp Leu Cys Pro Leu Arg Leu Arg Glu Pro Ala Pro Ala Gly Ala
370 375 380
Ser Ser Gln Arg Pro Trp Pro Leu Tyr Pro Leu Glu Pro Lys Arg Thr
385 390 395 400
Tyr Val Asn Ile Gly Phe Trp Ser Ser Val Pro Ile Val Pro Gly Arg
405 410 415
Pro Glu Gly Ala Ala Asn Arg Leu Ile Glu Asp Lys Val Ser Asp Phe
420 425 430
Asp Gly His Lys Ser Leu Tyr Ser Asp Ser Tyr Tyr Ser Arg Glu Asp
435 440 445
Phe Glu Arg Leu Tyr Tyr Gly Gly Asp Arg Tyr Thr Glu Leu Lys Lys
450 455 460
Arg Tyr Asp Pro Lys Ser Arg Leu Leu Asp Leu Phe Ser Lys Ala Val
465 470 475 480
Gln Arg Arg
<210> 59
<211> 1302
<212> DNA
<213> 浑浊红球菌
<400> 59
atgacaactc tgaaagcttc acgctcccag gaccacaagc tgaccatcgc agagattctc 60
gaaactctgt ccgacggcat gctccccctg cggttctccg cctacgacgg cagcgccgcc 120
ggcccggagg acgcccccta cggtctccac ctcaagacga cccgaggcac cacctacctg 180
gcgaccgccc ccggcgacct cggcatggcc cgggcctacg tgtccggcga cctcgaggcc 240
cgcggcgtcc accccggcga cccgtacgag atcctccgcg tgatgggcga cgaactgcac 300
ttccgccgtc cgtccgcgct cacgctcgcc gccatcacgc gctcgctcgg ctgggatctg 360
ctgcgcccca tcgcccctcc cccgcaggag catctcccgc ggtggcgtcg agtcgcggaa 420
gggttgcggc actccaagtc ccgcgacgcc gaggtcatcc accaccacta cgacgtctcg 480
aacaccttct acgagtatgt cctcggcccg tccatgacgt acacgtgcgc ctgctacgag 540
aacgccgagc agaccctcga agaggcacag gacaacaagt accgcctcgt cttcgagaag 600
ctcggcctcc agcccggcga ccgactgctc gacatcggtt gcggctgggg atcgatggtc 660
cggtacgccg cccgccgcgg cgtcaaggtc atcggcgcca ccctgtcccg agagcaggcc 720
gaatgggcac agaaggccat cgccgaagaa ggactgtccg acctcgccga ggtccggttc 780
tccgactacc gtgacgtccc cgagaccgga ttcgacgcca tctcctcgat cggcctgacc 840
gagcacatcg gcgtcggcaa ctaccccgcc tacttcggac tgctgcagag caagctccgc 900
gagggcggcc ggctgctgaa ccactgcatc acccggcccg acaaccagag tcaggcacgc 960
gcgggcggct tcatcgaccg gtacgtcttc cccgacggcg aactcaccgg ctccggacgc 1020
atcatcaccg agatccagaa cgtcggactc gaggtgcggc acgaggagaa tctgcgcgag 1080
cactacgcac tcaccctcgc cggctggtgc cagaacctcg tcgacaactg ggacgcctgc 1140
gtcgccgagg tcggcgaagg caccgcacgt gtgtggggtc tctacatggc cgggtcgcga 1200
ctgggcttcg aacgcaacgt cgttcagctg caccaggtcc tcgccgtcaa gctcggaccc 1260
aagggcgagg cgcatgtgcc gctgcgtccg tggtggaagt ag 1302
<210> 60
<211> 433
<212> PRT
<213> 浑浊红球菌
<400> 60
Met Thr Thr Leu Lys Ala Ser Arg Ser Gln Asp His Lys Leu Thr Ile
1 5 10 15
Ala Glu Ile Leu Glu Thr Leu Ser Asp Gly Met Leu Pro Leu Arg Phe
20 25 30
Ser Ala Tyr Asp Gly Ser Ala Ala Gly Pro Glu Asp Ala Pro Tyr Gly
35 40 45
Leu His Leu Lys Thr Thr Arg Gly Thr Thr Tyr Leu Ala Thr Ala Pro
50 55 60
Gly Asp Leu Gly Met Ala Arg Ala Tyr Val Ser Gly Asp Leu Glu Ala
65 70 75 80
Arg Gly Val His Pro Gly Asp Pro Tyr Glu Ile Leu Arg Val Met Gly
85 90 95
Asp Glu Leu His Phe Arg Arg Pro Ser Ala Leu Thr Leu Ala Ala Ile
100 105 110
Thr Arg Ser Leu Gly Trp Asp Leu Leu Arg Pro Ile Ala Pro Pro Pro
115 120 125
Gln Glu His Leu Pro Arg Trp Arg Arg Val Ala Glu Gly Leu Arg His
130 135 140
Ser Lys Ser Arg Asp Ala Glu Val Ile His His His Tyr Asp Val Ser
145 150 155 160
Asn Thr Phe Tyr Glu Tyr Val Leu Gly Pro Ser Met Thr Tyr Thr Cys
165 170 175
Ala Cys Tyr Glu Asn Ala Glu Gln Thr Leu Glu Glu Ala Gln Asp Asn
180 185 190
Lys Tyr Arg Leu Val Phe Glu Lys Leu Gly Leu Gln Pro Gly Asp Arg
195 200 205
Leu Leu Asp Ile Gly Cys Gly Trp Gly Ser Met Val Arg Tyr Ala Ala
210 215 220
Arg Arg Gly Val Lys Val Ile Gly Ala Thr Leu Ser Arg Glu Gln Ala
225 230 235 240
Glu Trp Ala Gln Lys Ala Ile Ala Glu Glu Gly Leu Ser Asp Leu Ala
245 250 255
Glu Val Arg Phe Ser Asp Tyr Arg Asp Val Pro Glu Thr Gly Phe Asp
260 265 270
Ala Ile Ser Ser Ile Gly Leu Thr Glu His Ile Gly Val Gly Asn Tyr
275 280 285
Pro Ala Tyr Phe Gly Leu Leu Gln Ser Lys Leu Arg Glu Gly Gly Arg
290 295 300
Leu Leu Asn His Cys Ile Thr Arg Pro Asp Asn Gln Ser Gln Ala Arg
305 310 315 320
Ala Gly Gly Phe Ile Asp Arg Tyr Val Phe Pro Asp Gly Glu Leu Thr
325 330 335
Gly Ser Gly Arg Ile Ile Thr Glu Ile Gln Asn Val Gly Leu Glu Val
340 345 350
Arg His Glu Glu Asn Leu Arg Glu His Tyr Ala Leu Thr Leu Ala Gly
355 360 365
Trp Cys Gln Asn Leu Val Asp Asn Trp Asp Ala Cys Val Ala Glu Val
370 375 380
Gly Glu Gly Thr Ala Arg Val Trp Gly Leu Tyr Met Ala Gly Ser Arg
385 390 395 400
Leu Gly Phe Glu Arg Asn Val Val Gln Leu His Gln Val Leu Ala Val
405 410 415
Lys Leu Gly Pro Lys Gly Glu Ala His Val Pro Leu Arg Pro Trp Trp
420 425 430
Lys
<210> 61
<211> 1428
<212> DNA
<213> 未知的
<220>
<223> 拉格西斯链霉菌
<400> 61
atgatcacac tggcaggccg ggccggtgcg cgcgatcatg ggtgtatggc cttcggtgcc 60
gccatcccca cggggtcggg acacgccggg tacgccgagc gcgtcgcaac ccttcgcgcc 120
cacctggccg acctcccgga ggggacgccg gtccggctgg cgaagggcac ctcgaacctg 180
ttccggccgc ggtcccgcgc cacggcgggg ctcgacgtgt cggccttcga ccacgtgctg 240
tcgatcgatc cgcagaaccg gaccgccgac gtcgagggca tggtcaccta cgagcggctc 300
gtcgacgcga cgttgccgca cggcctgatg ccgctcgtcg ttccgcagct caagacgatc 360
acgctgggcg gggcggtcac gggactgggc atcgagtcgt cgtcgttccg cgagggcatg 420
ccccacgaat ccgtggtgga gatggacatc ctcacgggtg cgggagacgt ggtgaccgcg 480
accccggacg gcgagcacag cgacctgttc ttcgggttcc ccaactccta cggaacgctg 540
ggatacgcgc tgcgcctgcg gatcgaactc gcgccggtgc gcccgtacgt acgactcgaa 600
cacctgcgtt tctccgatcc ggcacgctac ttcgagcgcc tggcgcgtgc gtgccgcgac 660
cgggaggccg acttcgtcga cggcaccgtc ttcgctcccg acgagctgta cctgacgttg 720
gccacgttca gcggcgagcc cgacgaggtc agcgactaca cgtggatgga cgtctactac 780
cgctcgatca gggagaagac ggtcgaccat ctgccgatcc gcgactacct gtggcggtgg 840
gacaccgact ggttctggtg ttcgcgcgcg ctcggagcgc agaaccggct cgtgcggctg 900
ctcgcgggtc cacgtctgct gcgttccgat gtgtactgga agatcgtcgg tttcgaacgc 960
aggcaccggc tgtgggagcg tgcgagccgg ctgctgggca ggcccgagcg cgaagcggtg 1020
atgcaggaca tcgaggtgcc ggtgcaccgc gccgaggagt tcctgacgtt cctgcaccgg 1080
gagatcccca tcagtccggt gtggatctgc ccgctgagtg ggcgggacgc gcgccggtgg 1140
ccgctgtacg agctcgaccc ggacgagctg tacgtcaact tcggtttctg gggcacggtg 1200
ccgctcgagc caggcgaacc gcagggttcg cacaaccggc gggtggagaa cgtggttacc 1260
gaactcgacg gacggaaatc cctgtactcg gagagtttct acgaccgcga cacgttctgg 1320
cggttgtacg gagggaatca aggacagacg taccaggccc tgaagcatcg ctacgacccg 1380
aacgggagat tgctggacct gtacgccaag tgcgttcaag cgaggtga 1428
<210> 62
<211> 475
<212> PRT
<213> 未知的
<220>
<223> 拉格西斯链霉菌
<400> 62
Met Ile Thr Leu Ala Gly Arg Ala Gly Ala Arg Asp His Gly Cys Met
1 5 10 15
Ala Phe Gly Ala Ala Ile Pro Thr Gly Ser Gly His Ala Gly Tyr Ala
20 25 30
Glu Arg Val Ala Thr Leu Arg Ala His Leu Ala Asp Leu Pro Glu Gly
35 40 45
Thr Pro Val Arg Leu Ala Lys Gly Thr Ser Asn Leu Phe Arg Pro Arg
50 55 60
Ser Arg Ala Thr Ala Gly Leu Asp Val Ser Ala Phe Asp His Val Leu
65 70 75 80
Ser Ile Asp Pro Gln Asn Arg Thr Ala Asp Val Glu Gly Met Val Thr
85 90 95
Tyr Glu Arg Leu Val Asp Ala Thr Leu Pro His Gly Leu Met Pro Leu
100 105 110
Val Val Pro Gln Leu Lys Thr Ile Thr Leu Gly Gly Ala Val Thr Gly
115 120 125
Leu Gly Ile Glu Ser Ser Ser Phe Arg Glu Gly Met Pro His Glu Ser
130 135 140
Val Val Glu Met Asp Ile Leu Thr Gly Ala Gly Asp Val Val Thr Ala
145 150 155 160
Thr Pro Asp Gly Glu His Ser Asp Leu Phe Phe Gly Phe Pro Asn Ser
165 170 175
Tyr Gly Thr Leu Gly Tyr Ala Leu Arg Leu Arg Ile Glu Leu Ala Pro
180 185 190
Val Arg Pro Tyr Val Arg Leu Glu His Leu Arg Phe Ser Asp Pro Ala
195 200 205
Arg Tyr Phe Glu Arg Leu Ala Arg Ala Cys Arg Asp Arg Glu Ala Asp
210 215 220
Phe Val Asp Gly Thr Val Phe Ala Pro Asp Glu Leu Tyr Leu Thr Leu
225 230 235 240
Ala Thr Phe Ser Gly Glu Pro Asp Glu Val Ser Asp Tyr Thr Trp Met
245 250 255
Asp Val Tyr Tyr Arg Ser Ile Arg Glu Lys Thr Val Asp His Leu Pro
260 265 270
Ile Arg Asp Tyr Leu Trp Arg Trp Asp Thr Asp Trp Phe Trp Cys Ser
275 280 285
Arg Ala Leu Gly Ala Gln Asn Arg Leu Val Arg Leu Leu Ala Gly Pro
290 295 300
Arg Leu Leu Arg Ser Asp Val Tyr Trp Lys Ile Val Gly Phe Glu Arg
305 310 315 320
Arg His Arg Leu Trp Glu Arg Ala Ser Arg Leu Leu Gly Arg Pro Glu
325 330 335
Arg Glu Ala Val Met Gln Asp Ile Glu Val Pro Val His Arg Ala Glu
340 345 350
Glu Phe Leu Thr Phe Leu His Arg Glu Ile Pro Ile Ser Pro Val Trp
355 360 365
Ile Cys Pro Leu Ser Gly Arg Asp Ala Arg Arg Trp Pro Leu Tyr Glu
370 375 380
Leu Asp Pro Asp Glu Leu Tyr Val Asn Phe Gly Phe Trp Gly Thr Val
385 390 395 400
Pro Leu Glu Pro Gly Glu Pro Gln Gly Ser His Asn Arg Arg Val Glu
405 410 415
Asn Val Val Thr Glu Leu Asp Gly Arg Lys Ser Leu Tyr Ser Glu Ser
420 425 430
Phe Tyr Asp Arg Asp Thr Phe Trp Arg Leu Tyr Gly Gly Asn Gln Gly
435 440 445
Gln Thr Tyr Gln Ala Leu Lys His Arg Tyr Asp Pro Asn Gly Arg Leu
450 455 460
Leu Asp Leu Tyr Ala Lys Cys Val Gln Ala Arg
465 470 475
<210> 63
<211> 1317
<212> DNA
<213> 未知的
<220>
<223> 拉格西斯链霉菌
<400> 63
ttggcgtcgt cggggccacc gctgcccgcc agggcggggt cccgatcggc tgactcgacg 60
gcgttggacg cgatcctgcg ccgcgtgctc ggggacgacc cgcccgtggc cgtgaccgcg 120
ttcgacggca cggtggtcgg tgacccggac tcggcgctgc agctgcacat ccgcacgccg 180
acggccctga gctacgtgct caccgcgccc aacgaactcg ggttggcgcg ggcctacgtc 240
acgggacatc tcgacgtgac cggcgacgtc taccaggtgc tgcgcgcact gacgagcgtg 300
gccgagaacc tcacgacggc cgatcggatg tggctggccg gccgtctcgc acgggacttc 360
accgaccggc tgcggccggt gccgatcccc gtcgaggagg cgccgtcgcg gctccgcagg 420
accgcacgtg gcctccggca ttccaaggcg cgcgacagcg acgcgatctc ccggcactac 480
gacgtctcga accgcttcta cgagctggtg ctcggcccgt cgatggccta cacgtgcgcc 540
tgctacccgg aggatgcggc cacgctggag caggcacagt tccacaagtt cgacctcgtg 600
tgccgaaagc tcggtctgaa gccggggatg cgcctgctcg acgtgggctg cggttggggc 660
ggcatggtcg cccacgccgt ggagcactac ggggtgcggg cgatcggcgt caccctctcg 720
cgccagcagg cggagtgggg acagcgggac ctcgaggcca ggggcctggc cgatcgcggc 780
gagatccgcc atctggacta ccgcgacgtg cccgagaccg ggttcgacgc ggtgtcgtcc 840
atcgggctca ccgaacacat cggcgcgcgg aacctgccgt cgtacttccg cttcctgcac 900
tcgaagttgc gtcccggcgg acggttgctc aaccactgca tcgtgcgccc gcacacctac 960
gactcccatc ggacgggccc gttcatcgac cgctacgtct tcccggacgg cgaactcgag 1020
ggcgtcggga cgatcgtgtc ggcgatgcag gaccacgggt tcgaggtacg gcacgcggag 1080
aacctgcggg aacactacgg gcgcaccctc gcggcgtggt gcgccaatct cgacgcgcac 1140
tgggaggcgg cggtggccga ggcgggcgtg cagcgggcca gggtgtgggc gctgtacatg 1200
gcggcctccc ggctgtcgtt cgaacgtcat gagctcgagc tgcagcaggt gctcggcgtg 1260
aaacccgacg ccgcgggcgg gtcgtcgatg ccgcttcgcc cggactgggg ggtgtga 1317
<210> 64
<211> 438
<212> PRT
<213> 未知的
<220>
<223> 拉格西斯链霉菌
<400> 64
Leu Ala Ser Ser Gly Pro Pro Leu Pro Ala Arg Ala Gly Ser Arg Ser
1 5 10 15
Ala Asp Ser Thr Ala Leu Asp Ala Ile Leu Arg Arg Val Leu Gly Asp
20 25 30
Asp Pro Pro Val Ala Val Thr Ala Phe Asp Gly Thr Val Val Gly Asp
35 40 45
Pro Asp Ser Ala Leu Gln Leu His Ile Arg Thr Pro Thr Ala Leu Ser
50 55 60
Tyr Val Leu Thr Ala Pro Asn Glu Leu Gly Leu Ala Arg Ala Tyr Val
65 70 75 80
Thr Gly His Leu Asp Val Thr Gly Asp Val Tyr Gln Val Leu Arg Ala
85 90 95
Leu Thr Ser Val Ala Glu Asn Leu Thr Thr Ala Asp Arg Met Trp Leu
100 105 110
Ala Gly Arg Leu Ala Arg Asp Phe Thr Asp Arg Leu Arg Pro Val Pro
115 120 125
Ile Pro Val Glu Glu Ala Pro Ser Arg Leu Arg Arg Thr Ala Arg Gly
130 135 140
Leu Arg His Ser Lys Ala Arg Asp Ser Asp Ala Ile Ser Arg His Tyr
145 150 155 160
Asp Val Ser Asn Arg Phe Tyr Glu Leu Val Leu Gly Pro Ser Met Ala
165 170 175
Tyr Thr Cys Ala Cys Tyr Pro Glu Asp Ala Ala Thr Leu Glu Gln Ala
180 185 190
Gln Phe His Lys Phe Asp Leu Val Cys Arg Lys Leu Gly Leu Lys Pro
195 200 205
Gly Met Arg Leu Leu Asp Val Gly Cys Gly Trp Gly Gly Met Val Ala
210 215 220
His Ala Val Glu His Tyr Gly Val Arg Ala Ile Gly Val Thr Leu Ser
225 230 235 240
Arg Gln Gln Ala Glu Trp Gly Gln Arg Asp Leu Glu Ala Arg Gly Leu
245 250 255
Ala Asp Arg Gly Glu Ile Arg His Leu Asp Tyr Arg Asp Val Pro Glu
260 265 270
Thr Gly Phe Asp Ala Val Ser Ser Ile Gly Leu Thr Glu His Ile Gly
275 280 285
Ala Arg Asn Leu Pro Ser Tyr Phe Arg Phe Leu His Ser Lys Leu Arg
290 295 300
Pro Gly Gly Arg Leu Leu Asn His Cys Ile Val Arg Pro His Thr Tyr
305 310 315 320
Asp Ser His Arg Thr Gly Pro Phe Ile Asp Arg Tyr Val Phe Pro Asp
325 330 335
Gly Glu Leu Glu Gly Val Gly Thr Ile Val Ser Ala Met Gln Asp His
340 345 350
Gly Phe Glu Val Arg His Ala Glu Asn Leu Arg Glu His Tyr Gly Arg
355 360 365
Thr Leu Ala Ala Trp Cys Ala Asn Leu Asp Ala His Trp Glu Ala Ala
370 375 380
Val Ala Glu Ala Gly Val Gln Arg Ala Arg Val Trp Ala Leu Tyr Met
385 390 395 400
Ala Ala Ser Arg Leu Ser Phe Glu Arg His Glu Leu Glu Leu Gln Gln
405 410 415
Val Leu Gly Val Lys Pro Asp Ala Ala Gly Gly Ser Ser Met Pro Leu
420 425 430
Arg Pro Asp Trp Gly Val
435
<210> 65
<211> 501
<212> DNA
<213> 未知的
<220>
<223> 拉格西斯链霉菌
<400> 65
gtgcgcgtgg caccgccccg catcggtgcc acacccggcg cggtgggcgc accggactac 60
gcctccgcct tccgcgtgcc gacggcggcg gcccgcaggc gttcgccgcg ggaatggacg 120
cgtgcggtgt tcgagggcgc gcccgcgccg ttggcgctgt tcgtgcgttg gggatggctg 180
gccgtgctcc ggttgcgcct cagtgaggac cccgaggcgg tggcgggctg gagacccacg 240
acgctcgacc ccggcacctc cgacgccccc gacacctctg agacagccgg aaactccgac 300
gctgccgcac tggaggccga atcgccgctg ctggaggcgt gcaacgtggc gttcgtcgac 360
gacgacggtg tcacgtgggc gacctacgtc cggttccgtg gtggcctcgg ccgcgcggtg 420
tgggcggtgg cggcgcggat ccaccacgtc gtcatcccct acctgctgcg gcgggcggtg 480
cggcgcacgg aacgggagtg a 501
<210> 66
<211> 166
<212> PRT
<213> 未知的
<220>
<223> 拉格西斯链霉菌
<400> 66
Val Arg Val Ala Pro Pro Arg Ile Gly Ala Thr Pro Gly Ala Val Gly
1 5 10 15
Ala Pro Asp Tyr Ala Ser Ala Phe Arg Val Pro Thr Ala Ala Ala Arg
20 25 30
Arg Arg Ser Pro Arg Glu Trp Thr Arg Ala Val Phe Glu Gly Ala Pro
35 40 45
Ala Pro Leu Ala Leu Phe Val Arg Trp Gly Trp Leu Ala Val Leu Arg
50 55 60
Leu Arg Leu Ser Glu Asp Pro Glu Ala Val Ala Gly Trp Arg Pro Thr
65 70 75 80
Thr Leu Asp Pro Gly Thr Ser Asp Ala Pro Asp Thr Ser Glu Thr Ala
85 90 95
Gly Asn Ser Asp Ala Ala Ala Leu Glu Ala Glu Ser Pro Leu Leu Glu
100 105 110
Ala Cys Asn Val Ala Phe Val Asp Asp Asp Gly Val Thr Trp Ala Thr
115 120 125
Tyr Val Arg Phe Arg Gly Gly Leu Gly Arg Ala Val Trp Ala Val Ala
130 135 140
Ala Arg Ile His His Val Val Ile Pro Tyr Leu Leu Arg Arg Ala Val
145 150 155 160
Arg Arg Thr Glu Arg Glu
165
<210> 67
<211> 1413
<212> DNA
<213> 未知的
<220>
<223> 嗜热子囊菌
<400> 67
gtgaactgtc agtcttccgc gtccaacctc gccaaccaca tcaacgcggt gtacgagctg 60
cgccgcgcct atgcgcggct gtccgccgac aagccggtgc gcctggcgaa gaccacctcc 120
aacctcttcc gcttccgcag ccgggacgat gccgcgcgtc tcgacgtcag cgctttcacc 180
tcggtgatca gcatcgacac ggaggcgcgg gtcgcggagg tgggcggcat gaccacctac 240
gaggacctgg tcgccgccac cctgcggcat ggcctgatgc cgccggtggt tccgcaactg 300
cgcacgatca ccctgggcgg tgcggtcacc gggctgggga tcgaatcctc gtccttccgc 360
aacgggctcc cgcacgagtc agtggaagag atggagatcc tcaccggcag cggccaggtg 420
gtggtggccc ggcgcgacaa cgagcaccgc gacctgttct acggtttccc caactcgtac 480
ggcaccctcg gttacgcgct gcggctccgc atccagctcg aaccggtccg cccctacgtc 540
cacctgcggc acctgcggtt caccgatgcc gcagcggcca tggccgcgct ggagcagatc 600
tgcgcggacc gcacccacga cggggagacc gtcgacttcg tcgacggcgt cgtgttcgcc 660
cgcaacgagc tgtacctgac cttggggacg ttcaccgacc gggctccgtg gaccagcgac 720
tacaccggaa ccgacatcta ctaccggtcg atcccccgct acgcgggccc cggccccggc 780
gactacctca ccacgcacga ctacctgtgg cggtgggaca ccgactggtt ctggtgctcc 840
cgcgccttcg gactgcagca tcccgtggtg cgccgcctgt ggccgcgttc cttgaaacgc 900
tccgacgtct accgcaagct cgtcgcctgg gaccggcgca ctgacgcgag ccgcctgctc 960
gactactacc gcgggcgccc gcccaaggaa ccggtgatcc aggacatcga ggttgaggtg 1020
gggcgggctg ccgagttcct cgacttcttc cacaccgaga tcggcatgtc cccggtgtgg 1080
ctgtgcccgc tgcggctgcg agaagacaca gccgacgata cggaaccggt ctggccgctc 1140
taccccctca aaccccgccg cctctacgtc aacttcgggt tttggggcct cgttccgatc 1200
cgtcccggtg gaggcaggac ataccacaac cggctgatcg aaaaagaagt gacccggttg 1260
ggcgggcaca agtcgctcta ctcggacgcc ttctacgacg aggacgagtt ctgggagctc 1320
tacaacgggg agatctaccg caagctcaaa gctgcctacg accccgacgg tcgactgctc 1380
gacctgtaca ccaagtgcgt cggcggcggg tga 1413
<210> 68
<211> 470
<212> PRT
<213> 未知的
<220>
<223> 嗜热子囊菌
<400> 68
Val Asn Cys Gln Ser Ser Ala Ser Asn Leu Ala Asn His Ile Asn Ala
1 5 10 15
Val Tyr Glu Leu Arg Arg Ala Tyr Ala Arg Leu Ser Ala Asp Lys Pro
20 25 30
Val Arg Leu Ala Lys Thr Thr Ser Asn Leu Phe Arg Phe Arg Ser Arg
35 40 45
Asp Asp Ala Ala Arg Leu Asp Val Ser Ala Phe Thr Ser Val Ile Ser
50 55 60
Ile Asp Thr Glu Ala Arg Val Ala Glu Val Gly Gly Met Thr Thr Tyr
65 70 75 80
Glu Asp Leu Val Ala Ala Thr Leu Arg His Gly Leu Met Pro Pro Val
85 90 95
Val Pro Gln Leu Arg Thr Ile Thr Leu Gly Gly Ala Val Thr Gly Leu
100 105 110
Gly Ile Glu Ser Ser Ser Phe Arg Asn Gly Leu Pro His Glu Ser Val
115 120 125
Glu Glu Met Glu Ile Leu Thr Gly Ser Gly Gln Val Val Val Ala Arg
130 135 140
Arg Asp Asn Glu His Arg Asp Leu Phe Tyr Gly Phe Pro Asn Ser Tyr
145 150 155 160
Gly Thr Leu Gly Tyr Ala Leu Arg Leu Arg Ile Gln Leu Glu Pro Val
165 170 175
Arg Pro Tyr Val His Leu Arg His Leu Arg Phe Thr Asp Ala Ala Ala
180 185 190
Ala Met Ala Ala Leu Glu Gln Ile Cys Ala Asp Arg Thr His Asp Gly
195 200 205
Glu Thr Val Asp Phe Val Asp Gly Val Val Phe Ala Arg Asn Glu Leu
210 215 220
Tyr Leu Thr Leu Gly Thr Phe Thr Asp Arg Ala Pro Trp Thr Ser Asp
225 230 235 240
Tyr Thr Gly Thr Asp Ile Tyr Tyr Arg Ser Ile Pro Arg Tyr Ala Gly
245 250 255
Pro Gly Pro Gly Asp Tyr Leu Thr Thr His Asp Tyr Leu Trp Arg Trp
260 265 270
Asp Thr Asp Trp Phe Trp Cys Ser Arg Ala Phe Gly Leu Gln His Pro
275 280 285
Val Val Arg Arg Leu Trp Pro Arg Ser Leu Lys Arg Ser Asp Val Tyr
290 295 300
Arg Lys Leu Val Ala Trp Asp Arg Arg Thr Asp Ala Ser Arg Leu Leu
305 310 315 320
Asp Tyr Tyr Arg Gly Arg Pro Pro Lys Glu Pro Val Ile Gln Asp Ile
325 330 335
Glu Val Glu Val Gly Arg Ala Ala Glu Phe Leu Asp Phe Phe His Thr
340 345 350
Glu Ile Gly Met Ser Pro Val Trp Leu Cys Pro Leu Arg Leu Arg Glu
355 360 365
Asp Thr Ala Asp Asp Thr Glu Pro Val Trp Pro Leu Tyr Pro Leu Lys
370 375 380
Pro Arg Arg Leu Tyr Val Asn Phe Gly Phe Trp Gly Leu Val Pro Ile
385 390 395 400
Arg Pro Gly Gly Gly Arg Thr Tyr His Asn Arg Leu Ile Glu Lys Glu
405 410 415
Val Thr Arg Leu Gly Gly His Lys Ser Leu Tyr Ser Asp Ala Phe Tyr
420 425 430
Asp Glu Asp Glu Phe Trp Glu Leu Tyr Asn Gly Glu Ile Tyr Arg Lys
435 440 445
Leu Lys Ala Ala Tyr Asp Pro Asp Gly Arg Leu Leu Asp Leu Tyr Thr
450 455 460
Lys Cys Val Gly Gly Gly
465 470
<210> 69
<211> 1272
<212> DNA
<213> 未知的
<220>
<223> 嗜热子囊菌
<400> 69
atgcgactgg cggaggtatt cgaacgtgtc gtcggacccg atgcgcccgt ccacttccgg 60
gcctacgacg gcagcactgc gggagatcca cgcagtgaag tcgctatcgt ggttcgccac 120
ccggcagccg tcaactacat cgtccaagcg ccgggagcac tcggtttgac ccgcgcctac 180
gtggcgggat acctcgacgt cgaaggggac atgtacaccg cgctgcgggc aatggccgac 240
gtggtgttcc aggaccggcc gcggctgtcc cccggggaac tgctgcggat catccgcggg 300
atcgggtggg tgaagttcgt caaccggctt ccaccgccgc cgcaggaggt gcgccagtcc 360
cgcctcgccg ccctgggctg gcgccactcc aagcagcgcg acgccgaagc catccagcac 420
cactacgacg tctccaacgc cttctacgcc ctggtcttgg gcgagtcgat gacctacacc 480
tgcgcggtct acccgaccga gcaggccacg ctggagcagg cacagttctt caagcacgag 540
ctgatcgccc gcaagctcgg tcttgcccct gggatacgac tgctggatgt ggggtgcggc 600
tggggcggca tggtcatcca cgcggcccgg gagcacgggg tcaaagccct gggggtgacc 660
ctgtccaaag agcaggctga gtgggcgcag aagcggatcg cccacgaggg cctgggcgac 720
ctggcagaag tccggcacat ggactaccgg gacctgcccg acggcgagta cgacgcgatc 780
agctcgatcg ggttgaccga gcacgtcggc aaaaagaacg tgcccgccta cttcgcgtcg 840
ctgtaccgca agctcgtccc gggaggccgc ctgctcaacc actgcatcac ccggccccgc 900
aacgacctgc cgcccttcaa acgcggcggg gtgatcaacc gctacgtctt ccccgatggg 960
gagctggaag ggcccggctg gctgcaggcg gcgatgaacg acgccgggtt cgaaatccgc 1020
caccaggaga acctgcggga gcactacgca cggaccctgc gggactggct ggccaacctg 1080
gaccgcaact gggatgccgc ggtgcgggaa gtgggggagg gcacggcccg agtgtggcgg 1140
ctctacatgg ccgggtgcgt gctcggcttc gaacgcaacg tggtgcaact gcaccagatc 1200
ctcggggtga agctcgacgg gaccgaggcg cggatgccgc tgcgccccga cttcgaaccg 1260
ccgctgcctt aa 1272
<210> 70
<211> 423
<212> PRT
<213> 未知的
<220>
<223> 嗜热子囊菌
<400> 70
Met Arg Leu Ala Glu Val Phe Glu Arg Val Val Gly Pro Asp Ala Pro
1 5 10 15
Val His Phe Arg Ala Tyr Asp Gly Ser Thr Ala Gly Asp Pro Arg Ser
20 25 30
Glu Val Ala Ile Val Val Arg His Pro Ala Ala Val Asn Tyr Ile Val
35 40 45
Gln Ala Pro Gly Ala Leu Gly Leu Thr Arg Ala Tyr Val Ala Gly Tyr
50 55 60
Leu Asp Val Glu Gly Asp Met Tyr Thr Ala Leu Arg Ala Met Ala Asp
65 70 75 80
Val Val Phe Gln Asp Arg Pro Arg Leu Ser Pro Gly Glu Leu Leu Arg
85 90 95
Ile Ile Arg Gly Ile Gly Trp Val Lys Phe Val Asn Arg Leu Pro Pro
100 105 110
Pro Pro Gln Glu Val Arg Gln Ser Arg Leu Ala Ala Leu Gly Trp Arg
115 120 125
His Ser Lys Gln Arg Asp Ala Glu Ala Ile Gln His His Tyr Asp Val
130 135 140
Ser Asn Ala Phe Tyr Ala Leu Val Leu Gly Glu Ser Met Thr Tyr Thr
145 150 155 160
Cys Ala Val Tyr Pro Thr Glu Gln Ala Thr Leu Glu Gln Ala Gln Phe
165 170 175
Phe Lys His Glu Leu Ile Ala Arg Lys Leu Gly Leu Ala Pro Gly Ile
180 185 190
Arg Leu Leu Asp Val Gly Cys Gly Trp Gly Gly Met Val Ile His Ala
195 200 205
Ala Arg Glu His Gly Val Lys Ala Leu Gly Val Thr Leu Ser Lys Glu
210 215 220
Gln Ala Glu Trp Ala Gln Lys Arg Ile Ala His Glu Gly Leu Gly Asp
225 230 235 240
Leu Ala Glu Val Arg His Met Asp Tyr Arg Asp Leu Pro Asp Gly Glu
245 250 255
Tyr Asp Ala Ile Ser Ser Ile Gly Leu Thr Glu His Val Gly Lys Lys
260 265 270
Asn Val Pro Ala Tyr Phe Ala Ser Leu Tyr Arg Lys Leu Val Pro Gly
275 280 285
Gly Arg Leu Leu Asn His Cys Ile Thr Arg Pro Arg Asn Asp Leu Pro
290 295 300
Pro Phe Lys Arg Gly Gly Val Ile Asn Arg Tyr Val Phe Pro Asp Gly
305 310 315 320
Glu Leu Glu Gly Pro Gly Trp Leu Gln Ala Ala Met Asn Asp Ala Gly
325 330 335
Phe Glu Ile Arg His Gln Glu Asn Leu Arg Glu His Tyr Ala Arg Thr
340 345 350
Leu Arg Asp Trp Leu Ala Asn Leu Asp Arg Asn Trp Asp Ala Ala Val
355 360 365
Arg Glu Val Gly Glu Gly Thr Ala Arg Val Trp Arg Leu Tyr Met Ala
370 375 380
Gly Cys Val Leu Gly Phe Glu Arg Asn Val Val Gln Leu His Gln Ile
385 390 395 400
Leu Gly Val Lys Leu Asp Gly Thr Glu Ala Arg Met Pro Leu Arg Pro
405 410 415
Asp Phe Glu Pro Pro Leu Pro
420
<210> 71
<211> 447
<212> DNA
<213> 未知的
<220>
<223> 嗜热子囊菌
<400> 71
atggctgcga ccgatgacga ccggcaccac accaccgtcg ccctcgacct catcgacgcg 60
tatgtgcgcg ccgaccgcag aatgatcggt gaacgttccg cggggatcag cgcggaggcg 120
ggggagcgga tcgtctccac cctgaaagtg tgcgcggcct tccttgcccg ccgggtccag 180
gagaccgggg tgccgtggcg cgccgcggac tcccgggaag cggtcgcccg caccgtcgcc 240
gacctgctgg aacccgaggt ggaattcgcg gtcgtctccg cctgggaggc gtacgcgatc 300
ggggagcacg aggccgcctg ggtccgggcg cacggcgatc cgctggtctt cgtccacatg 360
ctggccgcgt tctccgctgc tatcggcaca gcggtctacg gccgtgagga gctgctgccc 420
acgctgcgca gggtgacagc acgataa 447
<210> 72
<211> 148
<212> PRT
<213> 未知的
<220>
<223> 嗜热子囊菌
<400> 72
Met Ala Ala Thr Asp Asp Asp Arg His His Thr Thr Val Ala Leu Asp
1 5 10 15
Leu Ile Asp Ala Tyr Val Arg Ala Asp Arg Arg Met Ile Gly Glu Arg
20 25 30
Ser Ala Gly Ile Ser Ala Glu Ala Gly Glu Arg Ile Val Ser Thr Leu
35 40 45
Lys Val Cys Ala Ala Phe Leu Ala Arg Arg Val Gln Glu Thr Gly Val
50 55 60
Pro Trp Arg Ala Ala Asp Ser Arg Glu Ala Val Ala Arg Thr Val Ala
65 70 75 80
Asp Leu Leu Glu Pro Glu Val Glu Phe Ala Val Val Ser Ala Trp Glu
85 90 95
Ala Tyr Ala Ile Gly Glu His Glu Ala Ala Trp Val Arg Ala His Gly
100 105 110
Asp Pro Leu Val Phe Val His Met Leu Ala Ala Phe Ser Ala Ala Ile
115 120 125
Gly Thr Ala Val Tyr Gly Arg Glu Glu Leu Leu Pro Thr Leu Arg Arg
130 135 140
Val Thr Ala Arg
145
<210> 73
<211> 1368
<212> DNA
<213> 弯曲嗜热单胞菌
<400> 73
atgtcacagc tggcggtcac agaccaccac gagcgagcgg tcgaggcgct gcgcaggtcg 60
tatgcggcga tcccgccggg cacaccggtc cgcttggcca agcagacctc caacctgttc 120
cgcttccgcg agccgacggc cgcgcccggc ctggacgtgt ccggcttcaa ccgggtgctg 180
gcggtggacc cggatgcgcg caccgccgac gtgcagggca tgaccaccta cgaggacctg 240
gtcgacgcca ccctgccgca cgggctgatg ccgctggtgg tgccccagct caagacgatc 300
acgctgggcg gggcggtgac cggcctgggc atcgagtcca cctccttccg caacggcctg 360
ccgcacgagt cggtgctgga gatgcagatc atcaccggcg ccggcgaagt ggtcaccgcc 420
accccggacg gggagcactc cgacctgttc tggggcttcc ccaactccta cgggacgctg 480
gggtacgccc tgaagctgaa gatcgaactg gagccggtca agccgtacgt ccggctgcgg 540
cacctgcgct tcgacgacgc cggcgagtgc gccgccaagc tcgccgagct gagcgaaagc 600
cgcgagcacg agggcgatga ggtgcacttt ttggacggca ccttcttcgg gccgcgcgag 660
atgtacctga cgctcggcac gttcaccgac accgccccct atgtgtcgga ctacaccggg 720
cagcacatct actaccggtc gatccagcag cggtcgatcg actttttgac catccgcgac 780
tacctgtggc gctgggacac cgactggttc tggtgctcgc gcgccctggg cgtgcagaac 840
ccgctgatcc ggcgggtgtg gccgaagagc gccaagcggt cggatgtgta ccgcaagctg 900
gtggcctacg aaaagcgcta ccagttcaag gcgcgcatcg accggtggac gggcaagccg 960
ccgcgcgagg acgtcatcca ggacatcgag gtgccggcag aacgcctgcc ggagttcctg 1020
gagttcttcc acgacaagat cgggatgagc ccggtgtggc tgtgcccgct gcgggcgcgc 1080
caccgctggc cgctgtaccc gctcaagccc ggcgtcacct acgtcaacgc cggcttctgg 1140
gggacggtgc cgctgcagcc ggggcagatg cccgagtacc acaaccggct gatcgaacgg 1200
aaggtcgccc aactggacgg ccacaagtct ctgtactcga cggcgttcta ctcgcgtgag 1260
gagttctggc ggcactacga cggggaaacc taccggcgtc tgaaggacac ctacgacccc 1320
gacgcgcgcc tgctcgacct ctacgacaag tgcgtgcggg gacgctga 1368
<210> 74
<211> 455
<212> PRT
<213> 弯曲嗜热单胞菌
<400> 74
Met Ser Gln Leu Ala Val Thr Asp His His Glu Arg Ala Val Glu Ala
1 5 10 15
Leu Arg Arg Ser Tyr Ala Ala Ile Pro Pro Gly Thr Pro Val Arg Leu
20 25 30
Ala Lys Gln Thr Ser Asn Leu Phe Arg Phe Arg Glu Pro Thr Ala Ala
35 40 45
Pro Gly Leu Asp Val Ser Gly Phe Asn Arg Val Leu Ala Val Asp Pro
50 55 60
Asp Ala Arg Thr Ala Asp Val Gln Gly Met Thr Thr Tyr Glu Asp Leu
65 70 75 80
Val Asp Ala Thr Leu Pro His Gly Leu Met Pro Leu Val Val Pro Gln
85 90 95
Leu Lys Thr Ile Thr Leu Gly Gly Ala Val Thr Gly Leu Gly Ile Glu
100 105 110
Ser Thr Ser Phe Arg Asn Gly Leu Pro His Glu Ser Val Leu Glu Met
115 120 125
Gln Ile Ile Thr Gly Ala Gly Glu Val Val Thr Ala Thr Pro Asp Gly
130 135 140
Glu His Ser Asp Leu Phe Trp Gly Phe Pro Asn Ser Tyr Gly Thr Leu
145 150 155 160
Gly Tyr Ala Leu Lys Leu Lys Ile Glu Leu Glu Pro Val Lys Pro Tyr
165 170 175
Val Arg Leu Arg His Leu Arg Phe Asp Asp Ala Gly Glu Cys Ala Ala
180 185 190
Lys Leu Ala Glu Leu Ser Glu Ser Arg Glu His Glu Gly Asp Glu Val
195 200 205
His Phe Leu Asp Gly Thr Phe Phe Gly Pro Arg Glu Met Tyr Leu Thr
210 215 220
Leu Gly Thr Phe Thr Asp Thr Ala Pro Tyr Val Ser Asp Tyr Thr Gly
225 230 235 240
Gln His Ile Tyr Tyr Arg Ser Ile Gln Gln Arg Ser Ile Asp Phe Leu
245 250 255
Thr Ile Arg Asp Tyr Leu Trp Arg Trp Asp Thr Asp Trp Phe Trp Cys
260 265 270
Ser Arg Ala Leu Gly Val Gln Asn Pro Leu Ile Arg Arg Val Trp Pro
275 280 285
Lys Ser Ala Lys Arg Ser Asp Val Tyr Arg Lys Leu Val Ala Tyr Glu
290 295 300
Lys Arg Tyr Gln Phe Lys Ala Arg Ile Asp Arg Trp Thr Gly Lys Pro
305 310 315 320
Pro Arg Glu Asp Val Ile Gln Asp Ile Glu Val Pro Ala Glu Arg Leu
325 330 335
Pro Glu Phe Leu Glu Phe Phe His Asp Lys Ile Gly Met Ser Pro Val
340 345 350
Trp Leu Cys Pro Leu Arg Ala Arg His Arg Trp Pro Leu Tyr Pro Leu
355 360 365
Lys Pro Gly Val Thr Tyr Val Asn Ala Gly Phe Trp Gly Thr Val Pro
370 375 380
Leu Gln Pro Gly Gln Met Pro Glu Tyr His Asn Arg Leu Ile Glu Arg
385 390 395 400
Lys Val Ala Gln Leu Asp Gly His Lys Ser Leu Tyr Ser Thr Ala Phe
405 410 415
Tyr Ser Arg Glu Glu Phe Trp Arg His Tyr Asp Gly Glu Thr Tyr Arg
420 425 430
Arg Leu Lys Asp Thr Tyr Asp Pro Asp Ala Arg Leu Leu Asp Leu Tyr
435 440 445
Asp Lys Cys Val Arg Gly Arg
450 455
<210> 75
<211> 1263
<212> DNA
<213> 弯曲嗜热单胞菌
<400> 75
atgacgctgg ccaaggtctt cgaggagctg gtcggggcgg acgcccctgt ggagctcacc 60
gcctacgacg gatcgagagc cggacgcctg ggcagtgatc tgcgggtcca cgtgaagtcg 120
ccgtacgcgg tgtcctacct ggtgcactcg ccgagcgcgc tcgggctggc ccgcgcgtac 180
gtggccgggc acctggacgc ctacggcgac atgtacacgc tgctgcggga gatgacgcag 240
ctgaccgagg cgctgacgcc caaggcccgg ctgcggctgc tggccggtgt cctgcaggat 300
ccgctgctgc gcgcggcggc cagccgccgt ctgccgcccc cgccgcagga ggtgcggacc 360
ggccgcacct cctggttccg gcacaccaag cggcgggacg ccaaggccat ctcccaccac 420
tacgacgtgt ccaacacctt ctatgagtgg gtgctgggcc cgtcgatgac ctacacctgc 480
gcctgtttcc ccaccgagga cgccaccttg gaggaggcgc agttccacaa gcacgacctg 540
gtcgccaaga agctcgggct gcggccgggc atgcggctgc tggacgtggg ctgcggctgg 600
ggcggcatgg tgatgcacgc cgccaagcac tacggggtgc gggcgctggg cgtcacgctg 660
tccaagcagc aggccgagtg ggcgcagaag gccatcgccg aggcgggcct gagcgacctg 720
gccgaggtcc gccaccagga ctaccgggac gtcaccgagg gcgacttcga cgccatcagc 780
tcgatcggcc tcaccgagca catcggcaag gccaacctgc cgtcctactt cggcttcctg 840
tacggcaagc tcaagccggg cgggcggctg ctcaaccact gcatcacccg gcccgacaac 900
acccagccgg ccatgaagaa ggacgggttc atcaaccggt acgtcttccc cgacggggag 960
ctggaggggc ccggctacct gcagacccag atgaacgacg ccggttttga gatccgccac 1020
caggagaacc tgcgcgagca ctacgcccgc accctggccg gatggtgccg caacctcgat 1080
gagcactggg acgaggcggt ggccgaggtc ggcgagggca ccgcgcgggt gtggcggctg 1140
tacatggccg gcagccggct cggtttcgag ctcaactgga tccagctgca ccagatcctg 1200
ggcgtcaagc tcggcgagcg cggcgagtcc cgcatgccgt tgcggcccga ctggggcgtg 1260
tga 1263
<210> 76
<211> 420
<212> PRT
<213> 弯曲嗜热单胞菌
<400> 76
Met Thr Leu Ala Lys Val Phe Glu Glu Leu Val Gly Ala Asp Ala Pro
1 5 10 15
Val Glu Leu Thr Ala Tyr Asp Gly Ser Arg Ala Gly Arg Leu Gly Ser
20 25 30
Asp Leu Arg Val His Val Lys Ser Pro Tyr Ala Val Ser Tyr Leu Val
35 40 45
His Ser Pro Ser Ala Leu Gly Leu Ala Arg Ala Tyr Val Ala Gly His
50 55 60
Leu Asp Ala Tyr Gly Asp Met Tyr Thr Leu Leu Arg Glu Met Thr Gln
65 70 75 80
Leu Thr Glu Ala Leu Thr Pro Lys Ala Arg Leu Arg Leu Leu Ala Gly
85 90 95
Val Leu Gln Asp Pro Leu Leu Arg Ala Ala Ala Ser Arg Arg Leu Pro
100 105 110
Pro Pro Pro Gln Glu Val Arg Thr Gly Arg Thr Ser Trp Phe Arg His
115 120 125
Thr Lys Arg Arg Asp Ala Lys Ala Ile Ser His His Tyr Asp Val Ser
130 135 140
Asn Thr Phe Tyr Glu Trp Val Leu Gly Pro Ser Met Thr Tyr Thr Cys
145 150 155 160
Ala Cys Phe Pro Thr Glu Asp Ala Thr Leu Glu Glu Ala Gln Phe His
165 170 175
Lys His Asp Leu Val Ala Lys Lys Leu Gly Leu Arg Pro Gly Met Arg
180 185 190
Leu Leu Asp Val Gly Cys Gly Trp Gly Gly Met Val Met His Ala Ala
195 200 205
Lys His Tyr Gly Val Arg Ala Leu Gly Val Thr Leu Ser Lys Gln Gln
210 215 220
Ala Glu Trp Ala Gln Lys Ala Ile Ala Glu Ala Gly Leu Ser Asp Leu
225 230 235 240
Ala Glu Val Arg His Gln Asp Tyr Arg Asp Val Thr Glu Gly Asp Phe
245 250 255
Asp Ala Ile Ser Ser Ile Gly Leu Thr Glu His Ile Gly Lys Ala Asn
260 265 270
Leu Pro Ser Tyr Phe Gly Phe Leu Tyr Gly Lys Leu Lys Pro Gly Gly
275 280 285
Arg Leu Leu Asn His Cys Ile Thr Arg Pro Asp Asn Thr Gln Pro Ala
290 295 300
Met Lys Lys Asp Gly Phe Ile Asn Arg Tyr Val Phe Pro Asp Gly Glu
305 310 315 320
Leu Glu Gly Pro Gly Tyr Leu Gln Thr Gln Met Asn Asp Ala Gly Phe
325 330 335
Glu Ile Arg His Gln Glu Asn Leu Arg Glu His Tyr Ala Arg Thr Leu
340 345 350
Ala Gly Trp Cys Arg Asn Leu Asp Glu His Trp Asp Glu Ala Val Ala
355 360 365
Glu Val Gly Glu Gly Thr Ala Arg Val Trp Arg Leu Tyr Met Ala Gly
370 375 380
Ser Arg Leu Gly Phe Glu Leu Asn Trp Ile Gln Leu His Gln Ile Leu
385 390 395 400
Gly Val Lys Leu Gly Glu Arg Gly Glu Ser Arg Met Pro Leu Arg Pro
405 410 415
Asp Trp Gly Val
420
<210> 77
<211> 7102
<212> DNA
<213> 人工序列
<220>
<223> 合成核酸
<400> 77
gtttgtggaa gcggtattcg caatttaatt aaagctggtg acaattaatc atcggctcgt 60
ataatgtgtg gaattgaatc gatataagga ggttaatcat gtgtctgtgg ttactactga 120
cgcacaggct gcccatgccg ccggcgtctc gcgtcttctg gccagctacc gggcgatccc 180
gcccagcgcg acagtgcgcc ttgcgaaacc gacgtccaac ctgttccgcg cccgcgcccg 240
caccaatgtg aagggtctcg acgtctcggg cctgaccggt gtgatcggtg tcgacccgga 300
cgcgcgcacc gccgatgtgg cgggcatgtg cacctacgag gacctggtgg cggccacgct 360
tccgtacggc cttgccccac tggtggtgcc gcagctcaag accatcacgc tcggtggcgc 420
ggtcaccggt ctgggcatcg agtccacgtc gttccgcaac ggtctgccgc acgaaagtgt 480
cctggagatg gacatcttga ccggttcggg cgagatcgtc acggcctcac cggatcagca 540
ctcggatctg ttccatgcgt tccccaattc atatggaacc cttggttatt ccacccggct 600
gcgcatcgaa ctggagcccg tgcacccgtt tgtggcgttg cgccacctgc gctttcactc 660
gatcaccgat ctggtcgcgg cgatggaccg gatcatcgag accggcgggc tggacggtga 720
acccgtcgac tacctcgacg gcgtggtgtt cagcgcgact gagagttacc tgtgtgttgg 780
cttcaagacg aaaacgccgg ggccggtcag cgattacaca ggtcagcaga tcttctaccg 840
gtcgatccag catgacggcg acaccggcgc cgagaaacac gaccggctga ccatccacga 900
ctacctgtgg cgctgggaca ccgactggtt ctggtgctca cgggcattcg gcgctcagca 960
tccggtgatc cgcaggttct ggccgcggcg gctgcgccgc agcagcttct actggaagct 1020
ggtggcctac gaccagcggt acgacatcgc cgaccgtatc gagaagcgca acgggcgccc 1080
gccgcgcgag cgggtggtcc aggacgtcga ggtgcccatc gagcggtgcg cggacttcgt 1140
cgagtggttc ctgcagaatg tgccgatcga gccgatctgg ctgtgccccc tacggttgcg 1200
tgacagcgcc gacggcggtg cctcgtggcc cctgtatccg ctgaaggcgc accacaccta 1260
cgtcaacatc ggtttctggt catcagtgcc ggtgggcccc gaggagggcc acaccaaccg 1320
cctcatcgag aaaaaagtcg cggagctgga cgggcacaaa tctttgtact cggacgctta 1380
ttacacacgt gacgaattcg acgagctgta cggcggtgag gtctacaaca ccgtcaagaa 1440
gacgtacgac ccggattcac gtctgctaga cctgtattcg aaggcggtgc aaagacaatg 1500
accacattca aagaacgcga gacgtccaca gcggaccgca agctcaccct ggccgagatc 1560
ctcgagatct tcgccgcggg taaggagccg ctgaagttca ctgcgtacga cggcagctcg 1620
gccggtcccg aggacgccac gatgggtctg gacctcaaga ccccgcgtgg gaccacctat 1680
ctggccacgg cacccggcga tctgggcctg gcccgtgcgt atgtctccgg tgacctggag 1740
ccgcacggcg tgcatcccgg cgatccctac ccgctgctgc gcgccctggc cgaacgcatg 1800
gagttcaagc gcccgcctgc gcgtgtgctg gcgaacatcg tgcgctccat cggcatcgag 1860
cacctcaagc cgatcgcacc gccgccgcag gaggcgctgc cccggtggcg ccgcatcatg 1920
gagggcctgc ggcacagcaa gacccgcgac gccgaggcca tccaccacca ctacgacgtg 1980
tcgaacacgt tctacgagtg ggtgctgggc ccgtcgatga cctacacgtg cgcgtgctac 2040
cccaccgagg acgcgaccct cgaagaggcc caggacaaca agtaccgcct ggtgttcgag 2100
aagctgcgcc tgaagcccgg tgaccggttg ctcgacgtgg gctgcggctg gggcggcatg 2160
gtccgctacg cggcccgcca cggcgtcaag gcgctcggtg tcacgctcag ccgcgaacag 2220
gcgacgtggg cgcagaaggc catcgcccag gaaggtctca ccgatctggc cgaggtgcgt 2280
cacggtgatt accgcgacgt catcgaatcc gggttcgacg cggtgtcctc gatcgggctg 2340
accgagcaca tcggcgtgca caactacccg gcgtacttca acttcctcaa gtcgaagctg 2400
cgcaccggtg gcctgctgct caaccactgc atcacccgcc cggacaaccg gtcggcgcca 2460
tcggccggcg ggttcatcga caggtacgtg ttccccgacg gggagctcac cggctcgggc 2520
cgcatcatca ccgaggccca ggacgtgggc cttgaggtga tccacgagga gaacctacgc 2580
aatcactatg cgatgacgct gcgcgactgg tgccgcaacc tggtcgagca ctgggacgag 2640
gcggtcgaag aggtcgggct gcccaccgcg aaggtgtggg gcctgtacat ggccggctca 2700
cgtctgggct tcgagaccaa tgtggttcag ctgcaccagg ttctggcggt caagcttgac 2760
gatcagggca aggacggcgg actgccgttg cggccctggt ggtccgccta gcctcaaaat 2820
atattttccc tctatcttct cgttgcgctt aatttgacta attctcatta gcgaggcgcg 2880
cctttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg 2940
tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg 3000
cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga 3060
agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc 3120
tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt 3180
aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact 3240
ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg 3300
cctaactacg gctacactag aagaacagta tttggtatct gcgctctgct gaagccagtt 3360
accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt 3420
ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct 3480
ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg 3540
gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt 3600
aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg cttaatcagt 3660
gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg actccccgtc 3720
gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc aatgataccg 3780
cgagacccac gctcaccggc tccagattta tcagcaataa accagccagc cggaagggcc 3840
gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa ttgttgccgg 3900
gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc cattgctaca 3960
ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg ttcccaacga 4020
tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc cttcggtcct 4080
ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat ggcagcactg 4140
cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg tgagtactca 4200
accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata 4260
cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg aaaacgttct 4320
tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat gtaacccact 4380
cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg gtgagcaaaa 4440
acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg ttgaatactc 4500
atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct catgagcgga 4560
tacatatttg aatgtattta gaaaaataaa cagcgatcgc gcggccgcgg gtaataactg 4620
atataattaa attgaagctc taatttgtga gtttagtata catgcattta cttataatac 4680
agttttttag ttttgctggc cgcatcttct caaatatgct tcccagcctg cttttctgta 4740
acgttcaccc tctaccttag catcccttcc ctttgcaaat agtcctcttc caacaataat 4800
aatgtcagat cctgtagaga ccacatcatc cacggttcta tactgttgac ccaatgcgtc 4860
tcccttgtca tctaaaccca caccgggtgt cataatcaac caatcgtaac cttcatctct 4920
tccacccatg tctctttgag caataaagcc gataacaaaa tctttgtcgc tcttcgcaat 4980
gtcaacagta cccttagtat attctccagt agctagggag cccttgcatg acaattctgc 5040
taacatcaaa aggcctctag gttcctttgt tacttcttcc gccgcctgct tcaaaccgct 5100
aacaatacct gggcccacca caccgtgtgc attcgtaatg tctgcccatt ctgctattct 5160
gtatacaccc gcagagtact gcaatttgac tgtattacca atgtcagcaa attttctgtc 5220
ttcgaagagt aaaaaattgt acttggcgga taatgccttt agcggcttaa ctgtgccctc 5280
catggaaaaa tcagtcaaga tatccacatg tgtttttagt aaacaaattt tgggacctaa 5340
tgcttcaact aactccagta attccttggt ggtacgaaca tccaatgaag cacacaagtt 5400
tgtttgcttt tcgtgcatga tattaaatag cttggcagca acaggactag gatgagtagc 5460
agcacgttcc ttatatgtag ctttcgacat gatttatctt cgtttcctgc aggtttttgt 5520
tctgtgcagt tgggttaaga atactgggca atttcatgtt tcttcaacac cacatatgcg 5580
tatatatacc aatctaagtc tgtgctcctt ccttcgttct tccttctgct cggagattac 5640
cgaatcaaag ctagcttatc gatgataagc tgtcaaagat gagaattaat tccacggact 5700
atagactata ctagatactc cgtctactgt acgatacact tccgctcagg tccttgtcct 5760
ttaacgaggc cttaccactc ttttgttact ctattgatcc agctcagcaa aggcagtgtg 5820
atctaagatt ctatcttcgc gatgtagtaa aactagctag accgagaaag agactagaaa 5880
tgcaaaaggc acttctacaa tggctgccat cattattatc cgatgtgacg ctgcagcttc 5940
tcaatgatat tcgaatacgc tttgaggaga tacagcctaa tatccgacaa actgttttac 6000
agatttacga tcgtacttgt tacccatcat tgaattttga acatccgaac ctgggagttt 6060
tccctgaaac agatagtata tttgaacctg tataataata tatagtctag cgctttacgg 6120
aagacaatgt atgtatttcg gttcctggag aaactattgc atctattgca taggtaatct 6180
tgcacgtcgc atccccggtt cattttctgc gtttccatct tgcacttcaa tagcatatct 6240
ttgttaacga agcatctgtg cttcattttg tagaacaaaa atgcaacgcg agagcgctaa 6300
tttttcaaac aaagaatctg agctgcattt ttacagaaca gaaatgcaac gcgaaagcgc 6360
tattttacca acgaagaatc tgtgcttcat ttttgtaaaa caaaaatgca acgcgacgag 6420
agcgctaatt tttcaaacaa agaatctgag ctgcattttt acagaacaga aatgcaacgc 6480
gagagcgcta ttttaccaac aaagaatcta tacttctttt ttgttctaca aaaatgcatc 6540
ccgagagcgc tatttttcta acaaagcatc ttagattact ttttttctcc tttgtgcgct 6600
ctataatgca gtctcttgat aactttttgc actgtaggtc cgttaaggtt agaagaaggc 6660
tactttggtg tctattttct cttccataaa aaaagcctga ctccacttcc cgcgtttact 6720
gattactagc gaagctgcgg gtgcattttt tcaagataaa ggcatccccg attatattct 6780
ataccgatgt ggattgcgca tactttgtga acagaaagtg atagcgttga tgattcttca 6840
ttggtcagaa aattatgaac ggtttcttct attttgtctc tatatactac gtataggaaa 6900
tgtttacatt ttcgtattgt tttcgattca ctctatgaat agttcttact acaatttttt 6960
tgtctaaaga gtaatactag agataaacat aaaaaatgta gaggtcgagt ttagatgcaa 7020
gttcaaggag cgaaaggtgg atgggtaggt tatataggga tatagcacag agatatatag 7080
caaagagata cttttgagca at 7102
<210> 78
<211> 10766
<212> DNA
<213> 人工序列
<220>
<223> 合成核酸
<400> 78
ttatcgatga taagctgtca aagatgagaa ttaattccac ggactataga ctatactaga 60
tactccgtct actgtacgat acacttccgc tcaggtcctt gtcctttaac gaggccttac 120
cactcttttg ttactctatt gatccagctc agcaaaggca gtgtgatcta agattctatc 180
ttcgcgatgt agtaaaacta gctagaccga gaaagagact agaaatgcaa aaggcacttc 240
tacaatggct gccatcatta ttatccgatg tgacgctgca gcttctcaat gatattcgaa 300
tacgctttga ggagatacag cctaatatcc gacaaactgt tttacagatt tacgatcgta 360
cttgttaccc atcattgaat tttgaacatc cgaacctggg agttttccct gaaacagata 420
gtatatttga acctgtataa taatatatag tctagcgctt tacggaagac aatgtatgta 480
tttcggttcc tggagaaact attgcatcta ttgcataggt aatcttgcac gtcgcatccc 540
cggttcattt tctgcgtttc catcttgcac ttcaatagca tatctttgtt aacgaagcat 600
ctgtgcttca ttttgtagaa caaaaatgca acgcgagagc gctaattttt caaacaaaga 660
atctgagctg catttttaca gaacagaaat gcaacgcgaa agcgctattt taccaacgaa 720
gaatctgtgc ttcatttttg taaaacaaaa atgcaacgcg acgagagcgc taatttttca 780
aacaaagaat ctgagctgca tttttacaga acagaaatgc aacgcgagag cgctatttta 840
ccaacaaaga atctatactt cttttttgtt ctacaaaaat gcatcccgag agcgctattt 900
ttctaacaaa gcatcttaga ttactttttt tctcctttgt gcgctctata atgcagtctc 960
ttgataactt tttgcactgt aggtccgtta aggttagaag aaggctactt tggtgtctat 1020
tttctcttcc ataaaaaaag cctgactcca cttcccgcgt ttactgatta ctagcgaagc 1080
tgcgggtgca ttttttcaag ataaaggcat ccccgattat attctatacc gatgtggatt 1140
gcgcatactt tgtgaacaga aagtgatagc gttgatgatt cttcattggt cagaaaatta 1200
tgaacggttt cttctatttt gtctctatat actacgtata ggaaatgttt acattttcgt 1260
attgttttcg attcactcta tgaatagttc ttactacaat ttttttgtct aaagagtaat 1320
actagagata aacataaaaa atgtagaggt cgagtttaga tgcaagttca aggagcgaaa 1380
ggtggatggg taggttatat agggatatag cacagagata tatagcaaag agatactttt 1440
gagcaatgtt tgtggaagcg gtattcgcaa tgtttaaact gcgtcggaac gggatatgca 1500
ttcccctagt ttcgccgcag tgcagaatca ggcggtttct ttgcaccaca ccacatacgg 1560
aggatgacgg gcattattga tgttgaatag taacctgatc gtgactagta tgacggaacc 1620
caacagcaac agccgaccgt ttgtgagcgt ttttgcggcc ggtcaggcga gtttttccgg 1680
cctgccaatg gtccttccgt accctttacc ctgtacgctg tacctgccac ggataggccg 1740
tgctccacct gctcactatg gtgggtgcgg ggaaaacaac aggcaggctc aattgctctg 1800
caaatgggtt gagggggtga ttgatgtcac tggtacacca acaggggaat gctcggcgtt 1860
gattttgggc cacctctttt gtttgccaga gcttgtctct attgtcaaat ttaacggtct 1920
gcaactgttg cccaaaatgg gacaatgatc cgatgcctgc atagacaccc tgcttgaggg 1980
tgcgatcgcc ctaatacgag gcaaaccaag ttttccaatt gaccttcaat tgacgagcgg 2040
ttgttgcgac aggggactgg agtgctacct gtttagagtt caaatccgtc acccagcatt 2100
gaaagttttt ccccgcattg gatgattgca atgccgctaa cccgctcatc cgccaaagtt 2160
catagtccca ccctgcctcg acttatcgga ccacatgggg ctcccttatg cgcgcgcata 2220
tggcgcttga ttgctttttg gtcaacgttt gggacaaatt tcctttgtta aggcggaccc 2280
gccagcagat acgaaggtat aaatagggct cactttcacc atcttgtcca ttcaattgca 2340
agactcaaaa gtaataatga ccactctgga tgacaccgct taccgatacc gaacttccgt 2400
tcctggcgat gccgaggcta ttgaggctct ggatggatct ttcaccactg acaccgtttt 2460
ccgagtgacc gctactggcg acggcttcac cctgcgagag gtgcctgtcg accctcctct 2520
caccaaggtt ttccctgacg atgagtcgga cgatgagtct gacgctggag aggacggcga 2580
ccctgactct cgaactttcg tggcttacgg cgacgatgga gacctggccg gctttgtggt 2640
cgtttcttac tccggatgga accgacgact gaccgtggag gacatcgagg tcgctcctga 2700
gcaccgaggt catggtgtcg gacgagctct gatgggtctc gctactgagt tcgctcgaga 2760
gcgaggtgct ggccacctgt ggctcgaggt caccaacgtt aacgcccctg ctattcatgc 2820
ctaccgacga atgggtttta ccctgtgtgg cctcgatact gccctgtacg acggaaccgc 2880
ttccgatgga gagcaggccc tctacatgtc gatgccctgc ccttaaacag gccccttttc 2940
ctttgtcgat atcatgtaat tagttatgtc acgcttacat tcacgccctc ctcccacatc 3000
cgctctaacc gaaaaggaag gagttagaca acctgaagtc taggtcccta tttatttttt 3060
ttaatagtta tgttagtatt aagaacgtta tttatatttc aaatttttct tttttttctg 3120
tacaaacgcg tgtacgcatg taacattata ctgaaaacct tgcttgagaa ggttttggga 3180
cgctcgaagg ctttaatttg cagagaccgg gttggcggcg catttgtgtc ccaaaaaaca 3240
gccccaattg ccccaattga ccccaaattg acccagtagc gggcccaacc ccggcgagag 3300
cccccttctc cccacatatc aaacctcccc cggttcccac acttgccgtt aagggcgtag 3360
ggtactgcag tctggaatct acgcttgttc agactttgta ctagtttctt tgtctggcca 3420
tccgggtaac ccatgccgga cgcaaaatag actactgaaa atttttttgc tttgtggttg 3480
ggactttagc caagggtata aaagaccacc gtccccgaat tacctttcct cttcttttct 3540
ctctctcctt gtcaactcac acccgaaatc gttaagcatt tccttctgag tataagaatc 3600
attcaaaatg tccgttgtta ccaccgatgc tcaagctgct catgctgctg gtgtttctag 3660
attattggct tcttatagag ccattccacc atctgctact gttagattgg ctaagccaac 3720
ttctaatttg ttcagagcta gagctagaac taacgttaag ggtttggatg tttctggttt 3780
gactggtgtt attggtgttg atccagatgc tagaactgct gatgttgctg gtatgtgtac 3840
ttacgaagat ttggttgctg ctactttgcc atatggtttg gctccattgg ttgttccaca 3900
attgaaaact attactttgg gtggtgctgt taccggtttg ggtattgaat ctacttcttt 3960
cagaaacggt ttgccacacg aatctgtttt ggaaatggat attttgaccg gttccggtga 4020
aatagttact gcttctccag atcaacactc cgatttgttt catgcttttc caaactctta 4080
cggtacattg ggttactcta ccagattgag aattgaattg gaaccagttc atccattcgt 4140
tgccttgaga catttgagat tccattccat tactgatttg gtcgcagcca tggatagaat 4200
tattgaaact ggtggtttag acggtgaacc agttgattat ttggatggtg ttgttttctc 4260
tgccaccgaa tcatatttgt gtgttggttt caaaactaag accccaggtc cagtttctga 4320
ttatactggt caacaaatct tctacagatc catccaacat gatggtgata ctggtgctga 4380
aaaacatgat agattgacca tccatgacta cttgtggaga tgggatactg attggttttg 4440
gtgttctaga gcttttggtg ctcaacatcc agttattaga agattctggc caagaagatt 4500
aagaagatcc tccttctact ggaaattggt tgcttacgat caaagatacg atatcgccga 4560
tagaatcgaa aagagaaatg gtagaccacc aagagaaaga gttgttcaag acgttgaagt 4620
tccaattgaa agatgcgctg atttcgttga atggttcttg caaaatgttc caatcgaacc 4680
tatttggttg tgcccattga gattgagaga ttctgctgat ggtggtgctt catggccatt 4740
atatccattg aaagctcatc acacctacgt caatattggt ttctggtcat ctgttccagt 4800
tggtccagaa gaaggtcata ccaatagatt gattgaaaaa aaggtcgccg aattggacgg 4860
tcacaaatca ttatattctg atgcctacta caccagagat gaattcgatg aattatacgg 4920
tggtgaagtt tacaacaccg tcaaaaaaac ttacgaccca gactcaagat tattagactt 4980
gtactctaag gccgtccaaa gacaatgagc tgcttgtacc tagtgcaacc ccagtttgtt 5040
aaaaattagt agtcaaaaac ttctgagtta gaaatttgtg agtgtagtga gattgtagag 5100
tatcatgtgt gtccgtaagt gaagtgttat tgactcttag ttagtttatc tagtactcgt 5160
ttagttgaca ctgatctagt attttacgag gcgtatgact ttagccaagt gttgtactta 5220
gtcttctctc caaacatgag agggctctgt cactcagtcg gcctatgggt gagatggctt 5280
ggtgagatct ttcgatagtc tcgtcaagat ggtaggatga tgggggaata cattactgct 5340
ctcgtcaagg aaaccacaat cagatcacac catcctccat ggtatccgat gactctcttc 5400
tccacagtcg cagtaggatg tcctgcacgg gtctttttgt ggggtgtgga gaaaggggtg 5460
cttggagatg gaagccggta gaaccgggct gcttgggggg atttggggcc gctgggctcc 5520
aaagaggggt aggcatttcg ttggggttac gtaattgcgg catttgggtc ctgcgcgcat 5580
gtcccattgg tcagaattag tccggatagg agacttatca gccaatcaca gcgccggatc 5640
cacctgtagg ttgggttggg tgggagcacc cctccacaga gtagagtcaa acagcagcag 5700
caacgtgata gttgggggtg tgcgtgttaa aggaaaaaaa aagaagcttg ggttatattc 5760
ccgctctatt tagaggttgc gggatagacg ccgacggagg gcaatggcgc catggaacct 5820
tgcggatatc gatacgccgc ggcggactgc gtccgaacca gctccagcag cgttttttcc 5880
gggccattga gccgactgcg accccgccaa cgtgtcttgg cccacgcact catgtcatgt 5940
tggtgttggg aggccacttt ttaagtagca caaggcacct agctcgcggc agggtgtccg 6000
aaccaaagaa gcggctgcag tggtgcaaac ggggcggaaa cggcgggaaa aagccacggg 6060
ggcacgaatt gaggcacgcc ctcgaatttg agacgagtca cggccccatt cgcccgcgca 6120
atggctcgcc aacgcccggt cttttgcacc acatcaggtt accccaagcc aaacctttgt 6180
gttaaaaagc ttaacatatt ataccgaacg taggtttggg cgggcttgct ccgtctgtcc 6240
aaggcaacat ttatataagg gtctgcatcg ccggctcaat tgaatctttt ttcttcttct 6300
cttctctata ttcattcttg aattaaacac acatcaacaa tgaccacctt caaagaaaga 6360
gaaacttcta ccgctgatag aaagttgacc ttggctgaaa ttttggaaat tttcgctgct 6420
ggtaaagaac cattgaagtt cactgcttat gatggttctt ctgctggtcc tgaagatgct 6480
actatgggtt tggatttgaa aactccaaga ggtactactt acttggctac tgctccaggt 6540
gatttgggtt tggctagagc ttatgtttct ggtgacttgg aaccacatgg tgttcatcct 6600
ggtgatccat atccattatt gagagcttta gccgaaagaa tggaattcaa aagaccacca 6660
gctagagttt tggctaacat cgttagatcc attggtatcg aacatttgaa gccaattgct 6720
ccaccaccac aagaagcttt gccaagatgg agaagaatta tggaaggttt gagacactct 6780
aagaccagag atgctgaagc tattcatcat cactacgatg tttctaacac cttctacgaa 6840
tgggttttgg gtccatctat gacttatact tgtgcttgtt acccaacaga agatgccact 6900
ttggaagaag ctcaagataa caagtacaga ttggtctttg aaaagttgag attgaagcca 6960
ggtgacagat tattggatgt tggttgtggt tggggtggta tggttagata tgctgctaga 7020
catggtgtaa aagctttggg tgttactttg tctagagaac aagctacttg ggctcaaaaa 7080
gctattgctc aagaaggttt aaccgatttg gctgaagtta gacacggtga ttacagagat 7140
gttatcgaat ctggtttcga tgccgtttct tctattggtt tgactgaaca tatcggtgtt 7200
cataactatc cagcctactt caacttcttg aagtctaagt tgagaaccgg tggtttgttg 7260
ttgaaccatt gcattactag accagataac agatctgctc catctgctgg tggttttatt 7320
gatagatacg ttttcccaga tggtgaattg actggttccg gtagaattat tactgaagca 7380
caagatgtcg gtttggaagt tatccatgaa gaaaacttga gaaaccatta cgccatgact 7440
ttgagagatt ggtgtagaaa cttggttgaa cattgggatg aagccgttga agaagttggt 7500
ttgccaactg ctaaagtttg gggtttgtat atggctggtt ctagattagg ttttgaaact 7560
aacgttgtcc aattgcacca agttttggca gttaagttgg atgatcaagg taaagatggt 7620
ggtttgcctt taagaccatg gtggtctgct tgagcattag cgactactaa tatatatttg 7680
aatccatgga attataacaa acaagcatca aaacaagaat tagcgacatt atacttgaaa 7740
tcagcattag cgatactact aatatagttt attctatgta atgatccatg gaagttcgat 7800
tgatttgcca agttaatttg atagattatg catgccattt agtcgacgca ggtacgatct 7860
acagcgataa agaagaggtt gtgggtcatt caattttgca ccaattttgc accatcatag 7920
atcataatac atttacaagg cctacaattc ttacagggtc ttctcgagag caattcctta 7980
attaaggcgc gcctttccat aggctccgcc cccctgacga gcatcacaaa aatcgacgct 8040
caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt ccccctggaa 8100
gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc 8160
tcccttcggg aagcgtggcg ctttctcata gctcacgctg taggtatctc agttcggtgt 8220
aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg 8280
ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta tcgccactgg 8340
cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct acagagttct 8400
tgaagtggtg gcctaactac ggctacacta gaagaacagt atttggtatc tgcgctctgc 8460
tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa caaaccaccg 8520
ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa aaaggatctc 8580
aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa aactcacgtt 8640
aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac ctagatcctt ttaaattaaa 8700
aatgaagttt taaatcaatc taaagtatat atgagtaaac ttggtctgac agttaccaat 8760
gcttaatcag tgaggcacct atctcagcga tctgtctatt tcgttcatcc atagttgcct 8820
gactccccgt cgtgtagata actacgatac gggagggctt accatctggc cccagtgctg 8880
caatgatacc gcgagaccca cgctcaccgg ctccagattt atcagcaata aaccagccag 8940
ccggaagggc cgagcgcaga agtggtcctg caactttatc cgcctccatc cagtctatta 9000
attgttgccg ggaagctaga gtaagtagtt cgccagttaa tagtttgcgc aacgttgttg 9060
ccattgctac aggcatcgtg gtgtcacgct cgtcgtttgg tatggcttca ttcagctccg 9120
gttcccaacg atcaaggcga gttacatgat cccccatgtt gtgcaaaaaa gcggttagct 9180
ccttcggtcc tccgatcgtt gtcagaagta agttggccgc agtgttatca ctcatggtta 9240
tggcagcact gcataattct cttactgtca tgccatccgt aagatgcttt tctgtgactg 9300
gtgagtactc aaccaagtca ttctgagaat agtgtatgcg gcgaccgagt tgctcttgcc 9360
cggcgtcaat acgggataat accgcgccac atagcagaac tttaaaagtg ctcatcattg 9420
gaaaacgttc ttcggggcga aaactctcaa ggatcttacc gctgttgaga tccagttcga 9480
tgtaacccac tcgtgcaccc aactgatctt cagcatcttt tactttcacc agcgtttctg 9540
ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg aataagggcg acacggaaat 9600
gttgaatact catactcttc ctttttcaat attattgaag catttatcag ggttattgtc 9660
tcatgagcgg atacatattt gaatgtattt agaaaaataa acagcgatcg cgcggccgcg 9720
ggtaataact gatataatta aattgaagct ctaatttgtg agtttagtat acatgcattt 9780
acttataata cagtttttta gttttgctgg ccgcatcttc tcaaatatgc ttcccagcct 9840
gcttttctgt aacgttcacc ctctacctta gcatcccttc cctttgcaaa tagtcctctt 9900
ccaacaataa taatgtcaga tcctgtagag accacatcat ccacggttct atactgttga 9960
cccaatgcgt ctcccttgtc atctaaaccc acaccgggtg tcataatcaa ccaatcgtaa 10020
ccttcatctc ttccacccat gtctctttga gcaataaagc cgataacaaa atctttgtcg 10080
ctcttcgcaa tgtcaacagt acccttagta tattctccag tagctaggga gcccttgcat 10140
gacaattctg ctaacatcaa aaggcctcta ggttcctttg ttacttcttc cgccgcctgc 10200
ttcaaaccgc taacaatacc tgggcccacc acaccgtgtg cattcgtaat gtctgcccat 10260
tctgctattc tgtatacacc cgcagagtac tgcaatttga ctgtattacc aatgtcagca 10320
aattttctgt cttcgaagag taaaaaattg tacttggcgg ataatgcctt tagcggctta 10380
actgtgccct ccatggaaaa atcagtcaag atatccacat gtgtttttag taaacaaatt 10440
ttgggaccta atgcttcaac taactccagt aattccttgg tggtacgaac atccaatgaa 10500
gcacacaagt ttgtttgctt ttcgtgcatg atattaaata gcttggcagc aacaggacta 10560
ggatgagtag cagcacgttc cttatatgta gctttcgaca tgatttatct tcgtttcctg 10620
caggtttttg ttctgtgcag ttgggttaag aatactgggc aatttcatgt ttcttcaaca 10680
ccacatatgc gtatatatac caatctaagt ctgtgctcct tccttcgttc ttccttctgc 10740
tcggagatta ccgaatcaaa gctagc 10766
<210> 79
<211> 10970
<212> DNA
<213> 人工序列
<220>
<223> 合成核酸
<400> 79
ttatcgatga taagctgtca aagatgagaa ttaattccac ggactataga ctatactaga 60
tactccgtct actgtacgat acacttccgc tcaggtcctt gtcctttaac gaggccttac 120
cactcttttg ttactctatt gatccagctc agcaaaggca gtgtgatcta agattctatc 180
ttcgcgatgt agtaaaacta gctagaccga gaaagagact agaaatgcaa aaggcacttc 240
tacaatggct gccatcatta ttatccgatg tgacgctgca gcttctcaat gatattcgaa 300
tacgctttga ggagatacag cctaatatcc gacaaactgt tttacagatt tacgatcgta 360
cttgttaccc atcattgaat tttgaacatc cgaacctggg agttttccct gaaacagata 420
gtatatttga acctgtataa taatatatag tctagcgctt tacggaagac aatgtatgta 480
tttcggttcc tggagaaact attgcatcta ttgcataggt aatcttgcac gtcgcatccc 540
cggttcattt tctgcgtttc catcttgcac ttcaatagca tatctttgtt aacgaagcat 600
ctgtgcttca ttttgtagaa caaaaatgca acgcgagagc gctaattttt caaacaaaga 660
atctgagctg catttttaca gaacagaaat gcaacgcgaa agcgctattt taccaacgaa 720
gaatctgtgc ttcatttttg taaaacaaaa atgcaacgcg acgagagcgc taatttttca 780
aacaaagaat ctgagctgca tttttacaga acagaaatgc aacgcgagag cgctatttta 840
ccaacaaaga atctatactt cttttttgtt ctacaaaaat gcatcccgag agcgctattt 900
ttctaacaaa gcatcttaga ttactttttt tctcctttgt gcgctctata atgcagtctc 960
ttgataactt tttgcactgt aggtccgtta aggttagaag aaggctactt tggtgtctat 1020
tttctcttcc ataaaaaaag cctgactcca cttcccgcgt ttactgatta ctagcgaagc 1080
tgcgggtgca ttttttcaag ataaaggcat ccccgattat attctatacc gatgtggatt 1140
gcgcatactt tgtgaacaga aagtgatagc gttgatgatt cttcattggt cagaaaatta 1200
tgaacggttt cttctatttt gtctctatat actacgtata ggaaatgttt acattttcgt 1260
attgttttcg attcactcta tgaatagttc ttactacaat ttttttgtct aaagagtaat 1320
actagagata aacataaaaa atgtagaggt cgagtttaga tgcaagttca aggagcgaaa 1380
ggtggatggg taggttatat agggatatag cacagagata tatagcaaag agatactttt 1440
gagcaatgtt tgtggaagcg gtattcgcaa tgtttaaact gcgtcggaac gggatatgca 1500
ttcccctagt ttcgccgcag tgcagaatca ggcggtttct ttgcaccaca ccacatacgg 1560
aggatgacgg gcattattga tgttgaatag taacctgatc gtgactagta tgacggaacc 1620
caacagcaac agccgaccgt ttgtgagcgt ttttgcggcc ggtcaggcga gtttttccgg 1680
cctgccaatg gtccttccgt accctttacc ctgtacgctg tacctgccac ggataggccg 1740
tgctccacct gctcactatg gtgggtgcgg ggaaaacaac aggcaggctc aattgctctg 1800
caaatgggtt gagggggtga ttgatgtcac tggtacacca acaggggaat gctcggcgtt 1860
gattttgggc cacctctttt gtttgccaga gcttgtctct attgtcaaat ttaacggtct 1920
gcaactgttg cccaaaatgg gacaatgatc cgatgcctgc atagacaccc tgcttgaggg 1980
tgcgatcgcc ctaatacgag gcaaaccaag ttttccaatt gaccttcaat tgacgagcgg 2040
ttgttgcgac aggggactgg agtgctacct gtttagagtt caaatccgtc acccagcatt 2100
gaaagttttt ccccgcattg gatgattgca atgccgctaa cccgctcatc cgccaaagtt 2160
catagtccca ccctgcctcg acttatcgga ccacatgggg ctcccttatg cgcgcgcata 2220
tggcgcttga ttgctttttg gtcaacgttt gggacaaatt tcctttgtta aggcggaccc 2280
gccagcagat acgaaggtat aaatagggct cactttcacc atcttgtcca ttcaattgca 2340
agactcaaaa gtaataatga ccactctgga tgacaccgct taccgatacc gaacttccgt 2400
tcctggcgat gccgaggcta ttgaggctct ggatggatct ttcaccactg acaccgtttt 2460
ccgagtgacc gctactggcg acggcttcac cctgcgagag gtgcctgtcg accctcctct 2520
caccaaggtt ttccctgacg atgagtcgga cgatgagtct gacgctggag aggacggcga 2580
ccctgactct cgaactttcg tggcttacgg cgacgatgga gacctggccg gctttgtggt 2640
cgtttcttac tccggatgga accgacgact gaccgtggag gacatcgagg tcgctcctga 2700
gcaccgaggt catggtgtcg gacgagctct gatgggtctc gctactgagt tcgctcgaga 2760
gcgaggtgct ggccacctgt ggctcgaggt caccaacgtt aacgcccctg ctattcatgc 2820
ctaccgacga atgggtttta ccctgtgtgg cctcgatact gccctgtacg acggaaccgc 2880
ttccgatgga gagcaggccc tctacatgtc gatgccctgc ccttaaacag gccccttttc 2940
ctttgtcgat atcatgtaat tagttatgtc acgcttacat tcacgccctc ctcccacatc 3000
cgctctaacc gaaaaggaag gagttagaca acctgaagtc taggtcccta tttatttttt 3060
ttaatagtta tgttagtatt aagaacgtta tttatatttc aaatttttct tttttttctg 3120
tacaaacgcg tgtacgcatg taacattata ctgaaaacct tgcttgagaa ggttttggga 3180
cgctcgaagg ctttaatttg cagagaccgg gttggcggcg catttgtgtc ccaaaaaaca 3240
gccccaattg ccccaattga ccccaaattg acccagtagc gggcccaacc ccggcgagag 3300
cccccttctc cccacatatc aaacctcccc cggttcccac acttgccgtt aagggcgtag 3360
ggtactgcag tctggaatct acgcttgttc agactttgta ctagtttctt tgtctggcca 3420
tccgggtaac ccatgccgga cgcaaaatag actactgaaa atttttttgc tttgtggttg 3480
ggactttagc caagggtata aaagaccacc gtccccgaat tacctttcct cttcttttct 3540
ctctctcctt gtcaactcac acccgaaatc gttaagcatt tccttctgag tataagaatc 3600
attcaaaatg aagttctcta tgccatcttg gggtgttgtt ttttacgctt tgttggtttg 3660
tttgttgcca ttcttgtcta aggctggtgt tcaagctatg tccgttgtta ccaccgatgc 3720
tcaagctgct catgctgctg gtgtttctag attattggct tcttatagag ccattccacc 3780
atctgctact gttagattgg ctaagccaac ttctaatttg ttcagagcta gagctagaac 3840
taacgttaag ggtttggatg tttctggttt gactggtgtt attggtgttg atccagatgc 3900
tagaactgct gatgttgctg gtatgtgtac ttacgaagat ttggttgctg ctactttgcc 3960
atatggtttg gctccattgg ttgttccaca attgaaaact attactttgg gtggtgctgt 4020
taccggtttg ggtattgaat ctacttcttt cagaaacggt ttgccacacg aatctgtttt 4080
ggaaatggat attttgaccg gttccggtga aatagttact gcttctccag atcaacactc 4140
cgatttgttt catgcttttc caaactctta cggtacattg ggttactcta ccagattgag 4200
aattgaattg gaaccagttc atccattcgt tgccttgaga catttgagat tccattccat 4260
tactgatttg gtcgcagcca tggatagaat tattgaaact ggtggtttag acggtgaacc 4320
agttgattat ttggatggtg ttgttttctc tgccaccgaa tcatatttgt gtgttggttt 4380
caaaactaag accccaggtc cagtttctga ttatactggt caacaaatct tctacagatc 4440
catccaacat gatggtgata ctggtgctga aaaacatgat agattgacca tccatgacta 4500
cttgtggaga tgggatactg attggttttg gtgttctaga gcttttggtg ctcaacatcc 4560
agttattaga agattctggc caagaagatt aagaagatcc tccttctact ggaaattggt 4620
tgcttacgat caaagatacg atatcgccga tagaatcgaa aagagaaatg gtagaccacc 4680
aagagaaaga gttgttcaag acgttgaagt tccaattgaa agatgcgctg atttcgttga 4740
atggttcttg caaaatgttc caatcgaacc tatttggttg tgcccattga gattgagaga 4800
ttctgctgat ggtggtgctt catggccatt atatccattg aaagctcatc acacctacgt 4860
caatattggt ttctggtcat ctgttccagt tggtccagaa gaaggtcata ccaatagatt 4920
gattgaaaaa aaggtcgccg aattggacgg tcacaaatca ttatattctg atgcctacta 4980
caccagagat gaattcgatg aattatacgg tggtgaagtt tacaacaccg tcaaaaaaac 5040
ttacgaccca gactcaagat tattagactt gtactctaag gccgtccaaa gacaacatga 5100
tgaattgtga gctgcttgta cctagtgcaa ccccagtttg ttaaaaatta gtagtcaaaa 5160
acttctgagt tagaaatttg tgagtgtagt gagattgtag agtatcatgt gtgtccgtaa 5220
gtgaagtgtt attgactctt agttagttta tctagtactc gtttagttga cactgatcta 5280
gtattttacg aggcgtatga ctttagccaa gtgttgtact tagtcttctc tccaaacatg 5340
agagggctct gtcactcagt cggcctatgg gtgagatggc ttggtgagat ctttcgatag 5400
tctcgtcaag atggtaggat gatgggggaa tacattactg ctctcgtcaa ggaaaccaca 5460
atcagatcac accatcctcc atggtatccg atgactctct tctccacagt cgcagtagga 5520
tgtcctgcac gggtcttttt gtggggtgtg gagaaagggg tgcttggaga tggaagccgg 5580
tagaaccggg ctgcttgggg ggatttgggg ccgctgggct ccaaagaggg gtaggcattt 5640
cgttggggtt acgtaattgc ggcatttggg tcctgcgcgc atgtcccatt ggtcagaatt 5700
agtccggata ggagacttat cagccaatca cagcgccgga tccacctgta ggttgggttg 5760
ggtgggagca cccctccaca gagtagagtc aaacagcagc agcaacgtga tagttggggg 5820
tgtgcgtgtt aaaggaaaaa aaaagaagct tgggttatat tcccgctcta tttagaggtt 5880
gcgggataga cgccgacgga gggcaatggc gccatggaac cttgcggata tcgatacgcc 5940
gcggcggact gcgtccgaac cagctccagc agcgtttttt ccgggccatt gagccgactg 6000
cgaccccgcc aacgtgtctt ggcccacgca ctcatgtcat gttggtgttg ggaggccact 6060
ttttaagtag cacaaggcac ctagctcgcg gcagggtgtc cgaaccaaag aagcggctgc 6120
agtggtgcaa acggggcgga aacggcggga aaaagccacg ggggcacgaa ttgaggcacg 6180
ccctcgaatt tgagacgagt cacggcccca ttcgcccgcg caatggctcg ccaacgcccg 6240
gtcttttgca ccacatcagg ttaccccaag ccaaaccttt gtgttaaaaa gcttaacata 6300
ttataccgaa cgtaggtttg ggcgggcttg ctccgtctgt ccaaggcaac atttatataa 6360
gggtctgcat cgccggctca attgaatctt ttttcttctt ctcttctcta tattcattct 6420
tgaattaaac acacatcaac aatgaagttc tctatgccat cttggggtgt tgttttttac 6480
gctttgttgg tttgtttgtt gccattcttg tctaaggctg gtgttcaagc tatgaccacc 6540
ttcaaagaaa gagaaacttc taccgctgat agaaagttga ccttggctga aattttggaa 6600
attttcgctg ctggtaaaga accattgaag ttcactgctt atgatggttc ttctgctggt 6660
cctgaagatg ctactatggg tttggatttg aaaactccaa gaggtactac ttacttggct 6720
actgctccag gtgatttggg tttggctaga gcttatgttt ctggtgactt ggaaccacat 6780
ggtgttcatc ctggtgatcc atatccatta ttgagagctt tagccgaaag aatggaattc 6840
aaaagaccac cagctagagt tttggctaac atcgttagat ccattggtat cgaacatttg 6900
aagccaattg ctccaccacc acaagaagct ttgccaagat ggagaagaat tatggaaggt 6960
ttgagacact ctaagaccag agatgctgaa gctattcatc atcactacga tgtttctaac 7020
accttctacg aatgggtttt gggtccatct atgacttata cttgtgcttg ttacccaaca 7080
gaagatgcca ctttggaaga agctcaagat aacaagtaca gattggtctt tgaaaagttg 7140
agattgaagc caggtgacag attattggat gttggttgtg gttggggtgg tatggttaga 7200
tatgctgcta gacatggtgt aaaagctttg ggtgttactt tgtctagaga acaagctact 7260
tgggctcaaa aagctattgc tcaagaaggt ttaaccgatt tggctgaagt tagacacggt 7320
gattacagag atgttatcga atctggtttc gatgccgttt cttctattgg tttgactgaa 7380
catatcggtg ttcataacta tccagcctac ttcaacttct tgaagtctaa gttgagaacc 7440
ggtggtttgt tgttgaacca ttgcattact agaccagata acagatctgc tccatctgct 7500
ggtggtttta ttgatagata cgttttccca gatggtgaat tgactggttc cggtagaatt 7560
attactgaag cacaagatgt cggtttggaa gttatccatg aagaaaactt gagaaaccat 7620
tacgccatga ctttgagaga ttggtgtaga aacttggttg aacattggga tgaagccgtt 7680
gaagaagttg gtttgccaac tgctaaagtt tggggtttgt atatggctgg ttctagatta 7740
ggttttgaaa ctaacgttgt ccaattgcac caagttttgg cagttaagtt ggatgatcaa 7800
ggtaaagatg gtggtttgcc tttaagacca tggtggtctg ctcatgatga attgtgagca 7860
ttagcgacta ctaatatata tttgaatcca tggaattata acaaacaagc atcaaaacaa 7920
gaattagcga cattatactt gaaatcagca ttagcgatac tactaatata gtttattcta 7980
tgtaatgatc catggaagtt cgattgattt gccaagttaa tttgatagat tatgcatgcc 8040
atttagtcga cgcaggtacg atctacagcg ataaagaaga ggttgtgggt cattcaattt 8100
tgcaccaatt ttgcaccatc atagatcata atacatttac aaggcctaca attcttacag 8160
ggtcttctcg agagcaattc cttaattaag gcgcgccttt ccataggctc cgcccccctg 8220
acgagcatca caaaaatcga cgctcaagtc agaggtggcg aaacccgaca ggactataaa 8280
gataccaggc gtttccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc 8340
ttaccggata cctgtccgcc tttctccctt cgggaagcgt ggcgctttct catagctcac 8400
gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac 8460
cccccgttca gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag tccaacccgg 8520
taagacacga cttatcgcca ctggcagcag ccactggtaa caggattagc agagcgaggt 8580
atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa ctacggctac actagaagaa 8640
cagtatttgg tatctgcgct ctgctgaagc cagttacctt cggaaaaaga gttggtagct 8700
cttgatccgg caaacaaacc accgctggta gcggtggttt ttttgtttgc aagcagcaga 8760
ttacgcgcag aaaaaaagga tctcaagaag atcctttgat cttttctacg gggtctgacg 8820
ctcagtggaa cgaaaactca cgttaaggga ttttggtcat gagattatca aaaaggatct 8880
tcacctagat ccttttaaat taaaaatgaa gttttaaatc aatctaaagt atatatgagt 8940
aaacttggtc tgacagttac caatgcttaa tcagtgaggc acctatctca gcgatctgtc 9000
tatttcgttc atccatagtt gcctgactcc ccgtcgtgta gataactacg atacgggagg 9060
gcttaccatc tggccccagt gctgcaatga taccgcgaga cccacgctca ccggctccag 9120
atttatcagc aataaaccag ccagccggaa gggccgagcg cagaagtggt cctgcaactt 9180
tatccgcctc catccagtct attaattgtt gccgggaagc tagagtaagt agttcgccag 9240
ttaatagttt gcgcaacgtt gttgccattg ctacaggcat cgtggtgtca cgctcgtcgt 9300
ttggtatggc ttcattcagc tccggttccc aacgatcaag gcgagttaca tgatccccca 9360
tgttgtgcaa aaaagcggtt agctccttcg gtcctccgat cgttgtcaga agtaagttgg 9420
ccgcagtgtt atcactcatg gttatggcag cactgcataa ttctcttact gtcatgccat 9480
ccgtaagatg cttttctgtg actggtgagt actcaaccaa gtcattctga gaatagtgta 9540
tgcggcgacc gagttgctct tgcccggcgt caatacggga taataccgcg ccacatagca 9600
gaactttaaa agtgctcatc attggaaaac gttcttcggg gcgaaaactc tcaaggatct 9660
taccgctgtt gagatccagt tcgatgtaac ccactcgtgc acccaactga tcttcagcat 9720
cttttacttt caccagcgtt tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa 9780
agggaataag ggcgacacgg aaatgttgaa tactcatact cttccttttt caatattatt 9840
gaagcattta tcagggttat tgtctcatga gcggatacat atttgaatgt atttagaaaa 9900
ataaacagcg atcgcgcggc cgcgggtaat aactgatata attaaattga agctctaatt 9960
tgtgagttta gtatacatgc atttacttat aatacagttt tttagttttg ctggccgcat 10020
cttctcaaat atgcttccca gcctgctttt ctgtaacgtt caccctctac cttagcatcc 10080
cttccctttg caaatagtcc tcttccaaca ataataatgt cagatcctgt agagaccaca 10140
tcatccacgg ttctatactg ttgacccaat gcgtctccct tgtcatctaa acccacaccg 10200
ggtgtcataa tcaaccaatc gtaaccttca tctcttccac ccatgtctct ttgagcaata 10260
aagccgataa caaaatcttt gtcgctcttc gcaatgtcaa cagtaccctt agtatattct 10320
ccagtagcta gggagccctt gcatgacaat tctgctaaca tcaaaaggcc tctaggttcc 10380
tttgttactt cttccgccgc ctgcttcaaa ccgctaacaa tacctgggcc caccacaccg 10440
tgtgcattcg taatgtctgc ccattctgct attctgtata cacccgcaga gtactgcaat 10500
ttgactgtat taccaatgtc agcaaatttt ctgtcttcga agagtaaaaa attgtacttg 10560
gcggataatg cctttagcgg cttaactgtg ccctccatgg aaaaatcagt caagatatcc 10620
acatgtgttt ttagtaaaca aattttggga cctaatgctt caactaactc cagtaattcc 10680
ttggtggtac gaacatccaa tgaagcacac aagtttgttt gcttttcgtg catgatatta 10740
aatagcttgg cagcaacagg actaggatga gtagcagcac gttccttata tgtagctttc 10800
gacatgattt atcttcgttt cctgcaggtt tttgttctgt gcagttgggt taagaatact 10860
gggcaatttc atgtttcttc aacaccacat atgcgtatat ataccaatct aagtctgtgc 10920
tccttccttc gttcttcctt ctgctcggag attaccgaat caaagctagc 10970
<210> 80
<211> 1410
<212> DNA
<213> 人工序列
<220>
<223> 合成核酸
<400> 80
atgtccgttg ttaccaccga tgctcaagct gctcatgctg ctggtgtttc tagattattg 60
gcttcttata gagccattcc accatctgct actgttagat tggctaagcc aacttctaat 120
ttgttcagag ctagagctag aactaacgtt aagggtttgg atgtttctgg tttgactggt 180
gttattggtg ttgatccaga tgctagaact gctgatgttg ctggtatgtg tacttacgaa 240
gatttggttg ctgctacttt gccatatggt ttggctccat tggttgttcc acaattgaaa 300
actattactt tgggtggtgc tgttaccggt ttgggtattg aatctacttc tttcagaaac 360
ggtttgccac acgaatctgt tttggaaatg gatattttga ccggttccgg tgaaatagtt 420
actgcttctc cagatcaaca ctccgatttg tttcatgctt ttccaaactc ttacggtaca 480
ttgggttact ctaccagatt gagaattgaa ttggaaccag ttcatccatt cgttgccttg 540
agacatttga gattccattc cattactgat ttggtcgcag ccatggatag aattattgaa 600
actggtggtt tagacggtga accagttgat tatttggatg gtgttgtttt ctctgccacc 660
gaatcatatt tgtgtgttgg tttcaaaact aagaccccag gtccagtttc tgattatact 720
ggtcaacaaa tcttctacag atccatccaa catgatggtg atactggtgc tgaaaaacat 780
gatagattga ccatccatga ctacttgtgg agatgggata ctgattggtt ttggtgttct 840
agagcttttg gtgctcaaca tccagttatt agaagattct ggccaagaag attaagaaga 900
tcctccttct actggaaatt ggttgcttac gatcaaagat acgatatcgc cgatagaatc 960
gaaaagagaa atggtagacc accaagagaa agagttgttc aagacgttga agttccaatt 1020
gaaagatgcg ctgatttcgt tgaatggttc ttgcaaaatg ttccaatcga acctatttgg 1080
ttgtgcccat tgagattgag agattctgct gatggtggtg cttcatggcc attatatcca 1140
ttgaaagctc atcacaccta cgtcaatatt ggtttctggt catctgttcc agttggtcca 1200
gaagaaggtc ataccaatag attgattgaa aaaaaggtcg ccgaattgga cggtcacaaa 1260
tcattatatt ctgatgccta ctacaccaga gatgaattcg atgaattata cggtggtgaa 1320
gtttacaaca ccgtcaaaaa aacttacgac ccagactcaa gattattaga cttgtactct 1380
aaggccgtcc aaagacaaca tgatgaattg 1410
<210> 81
<211> 1311
<212> DNA
<213> 人工序列
<220>
<223> 合成核酸
<400> 81
atgaccacct tcaaagaaag agaaacttct accgctgata gaaagttgac cttggctgaa 60
attttggaaa ttttcgctgc tggtaaagaa ccattgaagt tcactgctta tgatggttct 120
tctgctggtc ctgaagatgc tactatgggt ttggatttga aaactccaag aggtactact 180
tacttggcta ctgctccagg tgatttgggt ttggctagag cttatgtttc tggtgacttg 240
gaaccacatg gtgttcatcc tggtgatcca tatccattat tgagagcttt agccgaaaga 300
atggaattca aaagaccacc agctagagtt ttggctaaca tcgttagatc cattggtatc 360
gaacatttga agccaattgc tccaccacca caagaagctt tgccaagatg gagaagaatt 420
atggaaggtt tgagacactc taagaccaga gatgctgaag ctattcatca tcactacgat 480
gtttctaaca ccttctacga atgggttttg ggtccatcta tgacttatac ttgtgcttgt 540
tacccaacag aagatgccac tttggaagaa gctcaagata acaagtacag attggtcttt 600
gaaaagttga gattgaagcc aggtgacaga ttattggatg ttggttgtgg ttggggtggt 660
atggttagat atgctgctag acatggtgta aaagctttgg gtgttacttt gtctagagaa 720
caagctactt gggctcaaaa agctattgct caagaaggtt taaccgattt ggctgaagtt 780
agacacggtg attacagaga tgttatcgaa tctggtttcg atgccgtttc ttctattggt 840
ttgactgaac atatcggtgt tcataactat ccagcctact tcaacttctt gaagtctaag 900
ttgagaaccg gtggtttgtt gttgaaccat tgcattacta gaccagataa cagatctgct 960
ccatctgctg gtggttttat tgatagatac gttttcccag atggtgaatt gactggttcc 1020
ggtagaatta ttactgaagc acaagatgtc ggtttggaag ttatccatga agaaaacttg 1080
agaaaccatt acgccatgac tttgagagat tggtgtagaa acttggttga acattgggat 1140
gaagccgttg aagaagttgg tttgccaact gctaaagttt ggggtttgta tatggctggt 1200
tctagattag gttttgaaac taacgttgtc caattgcacc aagttttggc agttaagttg 1260
gatgatcaag gtaaagatgg tggtttgcct ttaagaccat ggtggtctgc t 1311
<210> 82
<211> 4399
<212> DNA
<213> 人工序列
<220>
<223> 合成核酸
<400> 82
tgggtaggtt atatagggat atagcacaga gatatatagc aaagagatac ttttgagcaa 60
tgtttgtgga agcggtattc gcaatttaat taaagctggt gacaattaat catcggctcg 120
tataatgtgt ggaattgaat cgatataagg aggttaatca tgtttaaacc ctcaaaatat 180
attttccctc tatcttctcg ttgcgcttaa tttgactaat tctcattagc gaggcgcgcc 240
tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg 300
gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct ccctcgtgcg 360
ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc cttcgggaag 420
cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc 480
caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct tatccggtaa 540
ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag cagccactgg 600
taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga agtggtggcc 660
taactacggc tacactagaa gaacagtatt tggtatctgc gctctgctga agccagttac 720
cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg gtagcggtgg 780
tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag aagatccttt 840
gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag ggattttggt 900
catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat gaagttttaa 960
atcaatctaa agtatatatg agtaaacttg gtctgacagt taccaatgct taatcagtga 1020
ggcacctatc tcagcgatct gtctatttcg ttcatccata gttgcctgac tccccgtcgt 1080
gtagataact acgatacggg agggcttacc atctggcccc agtgctgcaa tgataccgcg 1140
agacccacgc tcaccggctc cagatttatc agcaataaac cagccagccg gaagggccga 1200
gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag tctattaatt gttgccggga 1260
agctagagta agtagttcgc cagttaatag tttgcgcaac gttgttgcca ttgctacagg 1320
catcgtggtg tcacgctcgt cgtttggtat ggcttcattc agctccggtt cccaacgatc 1380
aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg gttagctcct tcggtcctcc 1440
gatcgttgtc agaagtaagt tggccgcagt gttatcactc atggttatgg cagcactgca 1500
taattctctt actgtcatgc catccgtaag atgcttttct gtgactggtg agtactcaac 1560
caagtcattc tgagaatagt gtatgcggcg accgagttgc tcttgcccgg cgtcaatacg 1620
ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa aacgttcttc 1680
ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt aacccactcg 1740
tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt gagcaaaaac 1800
aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt gaatactcat 1860
actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca tgagcggata 1920
catatttgaa tgtatttaga aaaataaaca gcgatcgcgc ggccgcgggt aataactgat 1980
ataattaaat tgaagctcta atttgtgagt ttagtataca tgcatttact tataatacag 2040
ttttttagtt ttgctggccg catcttctca aatatgcttc ccagcctgct tttctgtaac 2100
gttcaccctc taccttagca tcccttccct ttgcaaatag tcctcttcca acaataataa 2160
tgtcagatcc tgtagagacc acatcatcca cggttctata ctgttgaccc aatgcgtctc 2220
ccttgtcatc taaacccaca ccgggtgtca taatcaacca atcgtaacct tcatctcttc 2280
cacccatgtc tctttgagca ataaagccga taacaaaatc tttgtcgctc ttcgcaatgt 2340
caacagtacc cttagtatat tctccagtag ctagggagcc cttgcatgac aattctgcta 2400
acatcaaaag gcctctaggt tcctttgtta cttcttccgc cgcctgcttc aaaccgctaa 2460
caatacctgg gcccaccaca ccgtgtgcat tcgtaatgtc tgcccattct gctattctgt 2520
atacacccgc agagtactgc aatttgactg tattaccaat gtcagcaaat tttctgtctt 2580
cgaagagtaa aaaattgtac ttggcggata atgcctttag cggcttaact gtgccctcca 2640
tggaaaaatc agtcaagata tccacatgtg tttttagtaa acaaattttg ggacctaatg 2700
cttcaactaa ctccagtaat tccttggtgg tacgaacatc caatgaagca cacaagtttg 2760
tttgcttttc gtgcatgata ttaaatagct tggcagcaac aggactagga tgagtagcag 2820
cacgttcctt atatgtagct ttcgacatga tttatcttcg tttcctgcag gtttttgttc 2880
tgtgcagttg ggttaagaat actgggcaat ttcatgtttc ttcaacacca catatgcgta 2940
tatataccaa tctaagtctg tgctccttcc ttcgttcttc cttctgctcg gagattaccg 3000
aatcaaagct agcttatcga tgataagctg tcaaagatga gaattaattc cacggactat 3060
agactatact agatactccg tctactgtac gatacacttc cgctcaggtc cttgtccttt 3120
aacgaggcct taccactctt ttgttactct attgatccag ctcagcaaag gcagtgtgat 3180
ctaagattct atcttcgcga tgtagtaaaa ctagctagac cgagaaagag actagaaatg 3240
caaaaggcac ttctacaatg gctgccatca ttattatccg atgtgacgct gcagcttctc 3300
aatgatattc gaatacgctt tgaggagata cagcctaata tccgacaaac tgttttacag 3360
atttacgatc gtacttgtta cccatcattg aattttgaac atccgaacct gggagttttc 3420
cctgaaacag atagtatatt tgaacctgta taataatata tagtctagcg ctttacggaa 3480
gacaatgtat gtatttcggt tcctggagaa actattgcat ctattgcata ggtaatcttg 3540
cacgtcgcat ccccggttca ttttctgcgt ttccatcttg cacttcaata gcatatcttt 3600
gttaacgaag catctgtgct tcattttgta gaacaaaaat gcaacgcgag agcgctaatt 3660
tttcaaacaa agaatctgag ctgcattttt acagaacaga aatgcaacgc gaaagcgcta 3720
ttttaccaac gaagaatctg tgcttcattt ttgtaaaaca aaaatgcaac gcgacgagag 3780
cgctaatttt tcaaacaaag aatctgagct gcatttttac agaacagaaa tgcaacgcga 3840
gagcgctatt ttaccaacaa agaatctata cttctttttt gttctacaaa aatgcatccc 3900
gagagcgcta tttttctaac aaagcatctt agattacttt ttttctcctt tgtgcgctct 3960
ataatgcagt ctcttgataa ctttttgcac tgtaggtccg ttaaggttag aagaaggcta 4020
ctttggtgtc tattttctct tccataaaaa aagcctgact ccacttcccg cgtttactga 4080
ttactagcga agctgcgggt gcattttttc aagataaagg catccccgat tatattctat 4140
accgatgtgg attgcgcata ctttgtgaac agaaagtgat agcgttgatg attcttcatt 4200
ggtcagaaaa ttatgaacgg tttcttctat tttgtctcta tatactacgt ataggaaatg 4260
tttacatttt cgtattgttt tcgattcact ctatgaatag ttcttactac aatttttttg 4320
tctaaagagt aatactagag ataaacataa aaaatgtaga ggtcgagttt agatgcaagt 4380
tcaaggagcg aaaggtgga 4399
<210> 83
<211> 7531
<212> DNA
<213> 人工序列
<220>
<223> 合成核酸
<400> 83
gtttgtggaa gcggtattcg caatttaatt aaagctggtg acaattaatc atcggctcgt 60
ataatgtgtg gaattgaatc gatataagga ggttaatcat gtgtctgttc cttcgaccga 120
cgcacgttct gctcacgccg acggcgtgca gcggcttctc gccagctatc gggcgattcc 180
ccaagacgcc acggtccggc tggccaaacc cacgtcgaac ctcttccgtg cccgcgcgaa 240
aaccaggacc aagggtctgg acacgtctgg gttgacgaac gtgatcgcgg tcgacgcgga 300
ggcacgcacc gccgatgtgg cagggatgtg cacctacgaa gacctggtcg cggccacgct 360
gccgcatgga ctttcgccgc tggtggtgcc gcagttgaag acgatcaccc tcggcggggc 420
ggtcaccgga ctcgggatcg agtccgcctc gttccgcaac ggcctgccac acgaatcggt 480
tctcgagatg gacgtcctca ccggcaccgg tgatgtcgtg cgcgcctccc ccgacgagaa 540
ccctgacctg tttcgggcgt ttccgaattc ctatggcacg ttgggctatt cggttcggct 600
caagatcgag ctggaaccgg tgaagccgtt cgtcgcgctg cgccacctcc gtttccattc 660
gctgtcggct ctcatcgagg cgatggaccg catcgtcgaa accggcggcc tcaacggcga 720
accggtggac tacctcgacg gcgtcgtgtt cagtgccgag gagagttacc tgtgcgtggg 780
gcagcgctcc gcgacaccgg gcccggtcag cgactacacg ggcaagcaga tctactaccg 840
ctcgattcag cacgacggcc cgaccgatgg cgccgagaag cacgaccggc tgaccatcca 900
cgactacctg tggcgctggg acaccgactg gttctggtgc tcaagggcat tcggcgcgca 960
gaacccgcgg atccggcgct ggtggccgcg ccggtaccgg cgcagcagtg tgtactggaa 1020
gctgatcggc tacgaccggc gtttcggtat cgccgatcgc atcgagaagc gcaacggccg 1080
acccccgcgc gagcgggtgg tccaggacat cgaggtgccc atcgagcgga ccgtcgagtt 1140
tctgcagtgg tttctcgaca ccgtgcccat cgaaccgatc tggttgtgcc cgttgcggct 1200
ccgcgacgac cgcgattggc ccctgtatcc gatccgaccc caccacacct acgtcaacgt 1260
gggtttctgg tcgtcggtgc cggtgggccc ggaggagggc tacaccaaca ggatgatcga 1320
acggaaagtc agcgacctcg acggtcacaa atcgctgtat tccgatgcgt actactcgcc 1380
ggaagagttt gattcgctct atggcgggga gacgtacaag acggtgaaga agacatacga 1440
cccagactct cgtttcctgg acctgtacgg caaagcagtg gggcggcaat gagcgttgac 1500
gcgaagaacg gaggccacag ttgacgacat ttcgggacgg cgcggccgac accggcctgc 1560
acggagaccg caagctcacc ctggcggagg tcttggaggt cttcgcctcg ggccgactgc 1620
ctctgaagtt cacggcgtac gacggcagca gcgcgggccc ggacgacgcc acgctcgggc 1680
tggacctgct gaccccccgc gggaccacgt acctcgcaac ggctcccggc gatctcggcc 1740
tggcccgggc ctacgtctcc ggtgacctgc agttgcaggg ggtgcaccct ggcgacccgt 1800
acgacctgct caacgcactg gtgcagaaac tggacttcaa gcgaccgtcc gcccgggtgc 1860
tggcgcaggt cgtccgatcg atcgggatcg agcacctgaa accgatcgcg ccaccgccgc 1920
aggaggcgct gccgcggtgg cggcgcatcg cagaaggact gcggcacagc aagacccgtg 1980
acgccgacgc gatccaccac cattacgatg tctccaacac cttctacgag tgggtgctcg 2040
ggccgtcgat gacctacacc tgcgcctgct acccgcatcc cgacgccacc ctcgaggagg 2100
cgcaggagaa caaatatcgg ctggtgttcg agaaactgcg cctcaagccg ggcgaccgcc 2160
ttctcgacgt gggttgcggg tggggcggaa tggtgcgcta cgcggcccgt cacggcgtca 2220
aggcgatcgg ggtgacgctg tccagggagc aggcgcagtg ggcacgcgcc gccatcgaac 2280
gggacggcct gggtgacctc gccgaggtcc gccacagcga ctaccgcgat gtgcgcgagt 2340
cccagttcga cgccgtgtct tcgctggggc tcaccgagca catcggggtc gccaactatc 2400
cgtcgtactt ccggttcctc aagtcgaagt tgcgcccggg cggcctactg ctcaaccact 2460
gcatcacccg gcacaacaat cgcaccggcc ccgccgccgg gggattcatc gaccggtatg 2520
tgttcccgga cggggagctg accggatcgg gccggatcat caccgagatc caggacgtcg 2580
gtttggaggt gatgcacgaa gagaacctgc gccggcacta tgcgctgaca cttcgggact 2640
ggtgccggaa tctggtgcag cactgggacg aagcggtcgc agaggtcggc ctgcccaccg 2700
ccaaggtgtg gggtctgtac atggctgcct cgcgggtcgg cttcgagcag aacagcattc 2760
agctgcatca ggtactggcg gtgaagctcg acgaacgtgg cggggacggc ggtttgccgt 2820
tgcggccctg gtggaccgcg tagcaactat gctcaccgtg tgatccgctt tctgctgcgc 2880
gtcgcggtct ttctcggatc gtcggcgatc gggctactgg tggccggctg gctggtgccg 2940
ggggtgtcgc tgtcggtgct gggcttcgtc accgcggtgg tgatcttcac ggtggcacaa 3000
gggattctgt cgccgttctt cctgaagatg gccagccgct acgcgtcggc cttcctcggc 3060
ggcatcggcc tggtgtccac gttcgtggcg ctgctgctcg cgtcgctgct gtccaacggg 3120
ctcagcatcc gcggcgtcgg gtcgtggatc gcggccacgg tggtggtctg gctggtcaca 3180
gccctggcga ccgtcgtgct gcccgttctg gtgctgcggg agaagaagaa agcagcctga 3240
cctcaaaata tattttccct ctatcttctc gttgcgctta atttgactaa ttctcattag 3300
cgaggcgcgc ctttccatag gctccgcccc cctgacgagc atcacaaaaa tcgacgctca 3360
agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc ccctggaagc 3420
tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc cgcctttctc 3480
ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta ggtatctcag ttcggtgtag 3540
gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc 3600
ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc gccactggca 3660
gcagccactg gtaacaggat tagcagagcg aggtatgtag gcggtgctac agagttcttg 3720
aagtggtggc ctaactacgg ctacactaga agaacagtat ttggtatctg cgctctgctg 3780
aagccagtta ccttcggaaa aagagttggt agctcttgat ccggcaaaca aaccaccgct 3840
ggtagcggtg gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa 3900
gaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa 3960
gggattttgg tcatgagatt atcaaaaagg atcttcacct agatcctttt aaattaaaaa 4020
tgaagtttta aatcaatcta aagtatatat gagtaaactt ggtctgacag ttaccaatgc 4080
ttaatcagtg aggcacctat ctcagcgatc tgtctatttc gttcatccat agttgcctga 4140
ctccccgtcg tgtagataac tacgatacgg gagggcttac catctggccc cagtgctgca 4200
atgataccgc gagacccacg ctcaccggct ccagatttat cagcaataaa ccagccagcc 4260
ggaagggccg agcgcagaag tggtcctgca actttatccg cctccatcca gtctattaat 4320
tgttgccggg aagctagagt aagtagttcg ccagttaata gtttgcgcaa cgttgttgcc 4380
attgctacag gcatcgtggt gtcacgctcg tcgtttggta tggcttcatt cagctccggt 4440
tcccaacgat caaggcgagt tacatgatcc cccatgttgt gcaaaaaagc ggttagctcc 4500
ttcggtcctc cgatcgttgt cagaagtaag ttggccgcag tgttatcact catggttatg 4560
gcagcactgc ataattctct tactgtcatg ccatccgtaa gatgcttttc tgtgactggt 4620
gagtactcaa ccaagtcatt ctgagaatag tgtatgcggc gaccgagttg ctcttgcccg 4680
gcgtcaatac gggataatac cgcgccacat agcagaactt taaaagtgct catcattgga 4740
aaacgttctt cggggcgaaa actctcaagg atcttaccgc tgttgagatc cagttcgatg 4800
taacccactc gtgcacccaa ctgatcttca gcatctttta ctttcaccag cgtttctggg 4860
tgagcaaaaa caggaaggca aaatgccgca aaaaagggaa taagggcgac acggaaatgt 4920
tgaatactca tactcttcct ttttcaatat tattgaagca tttatcaggg ttattgtctc 4980
atgagcggat acatatttga atgtatttag aaaaataaac agcgatcgcg cggccgcggg 5040
taataactga tataattaaa ttgaagctct aatttgtgag tttagtatac atgcatttac 5100
ttataataca gttttttagt tttgctggcc gcatcttctc aaatatgctt cccagcctgc 5160
ttttctgtaa cgttcaccct ctaccttagc atcccttccc tttgcaaata gtcctcttcc 5220
aacaataata atgtcagatc ctgtagagac cacatcatcc acggttctat actgttgacc 5280
caatgcgtct cccttgtcat ctaaacccac accgggtgtc ataatcaacc aatcgtaacc 5340
ttcatctctt ccacccatgt ctctttgagc aataaagccg ataacaaaat ctttgtcgct 5400
cttcgcaatg tcaacagtac ccttagtata ttctccagta gctagggagc ccttgcatga 5460
caattctgct aacatcaaaa ggcctctagg ttcctttgtt acttcttccg ccgcctgctt 5520
caaaccgcta acaatacctg ggcccaccac accgtgtgca ttcgtaatgt ctgcccattc 5580
tgctattctg tatacacccg cagagtactg caatttgact gtattaccaa tgtcagcaaa 5640
ttttctgtct tcgaagagta aaaaattgta cttggcggat aatgccttta gcggcttaac 5700
tgtgccctcc atggaaaaat cagtcaagat atccacatgt gtttttagta aacaaatttt 5760
gggacctaat gcttcaacta actccagtaa ttccttggtg gtacgaacat ccaatgaagc 5820
acacaagttt gtttgctttt cgtgcatgat attaaatagc ttggcagcaa caggactagg 5880
atgagtagca gcacgttcct tatatgtagc tttcgacatg atttatcttc gtttcctgca 5940
ggtttttgtt ctgtgcagtt gggttaagaa tactgggcaa tttcatgttt cttcaacacc 6000
acatatgcgt atatatacca atctaagtct gtgctccttc cttcgttctt ccttctgctc 6060
ggagattacc gaatcaaagc tagcttatcg atgataagct gtcaaagatg agaattaatt 6120
ccacggacta tagactatac tagatactcc gtctactgta cgatacactt ccgctcaggt 6180
ccttgtcctt taacgaggcc ttaccactct tttgttactc tattgatcca gctcagcaaa 6240
ggcagtgtga tctaagattc tatcttcgcg atgtagtaaa actagctaga ccgagaaaga 6300
gactagaaat gcaaaaggca cttctacaat ggctgccatc attattatcc gatgtgacgc 6360
tgcagcttct caatgatatt cgaatacgct ttgaggagat acagcctaat atccgacaaa 6420
ctgttttaca gatttacgat cgtacttgtt acccatcatt gaattttgaa catccgaacc 6480
tgggagtttt ccctgaaaca gatagtatat ttgaacctgt ataataatat atagtctagc 6540
gctttacgga agacaatgta tgtatttcgg ttcctggaga aactattgca tctattgcat 6600
aggtaatctt gcacgtcgca tccccggttc attttctgcg tttccatctt gcacttcaat 6660
agcatatctt tgttaacgaa gcatctgtgc ttcattttgt agaacaaaaa tgcaacgcga 6720
gagcgctaat ttttcaaaca aagaatctga gctgcatttt tacagaacag aaatgcaacg 6780
cgaaagcgct attttaccaa cgaagaatct gtgcttcatt tttgtaaaac aaaaatgcaa 6840
cgcgacgaga gcgctaattt ttcaaacaaa gaatctgagc tgcattttta cagaacagaa 6900
atgcaacgcg agagcgctat tttaccaaca aagaatctat acttcttttt tgttctacaa 6960
aaatgcatcc cgagagcgct atttttctaa caaagcatct tagattactt tttttctcct 7020
ttgtgcgctc tataatgcag tctcttgata actttttgca ctgtaggtcc gttaaggtta 7080
gaagaaggct actttggtgt ctattttctc ttccataaaa aaagcctgac tccacttccc 7140
gcgtttactg attactagcg aagctgcggg tgcatttttt caagataaag gcatccccga 7200
ttatattcta taccgatgtg gattgcgcat actttgtgaa cagaaagtga tagcgttgat 7260
gattcttcat tggtcagaaa attatgaacg gtttcttcta ttttgtctct atatactacg 7320
tataggaaat gtttacattt tcgtattgtt ttcgattcac tctatgaata gttcttacta 7380
caattttttt gtctaaagag taatactaga gataaacata aaaaatgtag aggtcgagtt 7440
tagatgcaag ttcaaggagc gaaaggtgga tgggtaggtt atatagggat atagcacaga 7500
gatatatagc aaagagatac ttttgagcaa t 7531
<210> 84
<211> 7126
<212> DNA
<213> 人工序列
<220>
<223> 合成核酸
<400> 84
gtttgtggaa gcggtattcg caatttaatt aaagctggtg acaattaatc atcggctcgt 60
ataatgtgtg gaattgaatc gatataagga ggttaatcat atgacgcctg aagctagtgc 120
ggcggcgcac gccgctgcgg tggatcgcct catccatagc tatcgggcga ttcctgatga 180
cgcgccggtg cggctggcga agaagacgtc aaacctattc cgccacaggg aaaagacttc 240
tgctcctggg cttgacgtat ccggcctggc tcgcgtgatt gggatcgact cagacactcg 300
cactgccgac gttggcggca tgtgcacata cgaggacctt gtcgcggcga cgctcgaata 360
cgatctggtc cccctggtcg tcccgcaact caaaacgatc actctcggcg gcgcggtgac 420
gggcctggga attgagtcca cctcgttccg caatgggctt ccccatgaat ctgttctcga 480
aatggatatc ctgacgggcg ccggggaggt cgtcacggcc ggcccggaag gcccccatag 540
cgatttgtac tgggggtttc cgaattcgta cggcacgctc ggctatgcga cgcgcctgcg 600
catcgaacta gaaccggtcg agccgtacgt cgaactcagg cacctgcggt tcactagcct 660
cgatgagctt caggagacac ttgacaccgt ttcgtacgaa cacacgtatg acggggaacc 720
cgttcattac gtcgatggag tcatgttctc agccacggaa agctacctca cgcttggccg 780
tcagacgagc gaacccggcc cggtcagcga ctacaccgga aaccagatct actaccgttc 840
aatacagcac ggtggcgctg aaactcccgt cgtcgaccgg atgaccattc atgactatct 900
atggcgctgg gatactgact ggttctggtg ctcgcgtgcc ttcggaacgc aacacccagt 960
ggtccggaga ttctggccac gccgctatcg ccgcagcagc ttctactgga agctgatcgc 1020
gcttgaccgc caggttgggc tcgcggactt catcgaacaa cggaagggca acctcccccg 1080
ggaacgcgta gtccaggaca tcgaggtccc gatcgagaac actgcgagct tcttgcggtg 1140
gttcttggcg aacgtgccga tcgagccggt atggctatgc ccgctgcgcc tgcgaaaaac 1200
acgcagcccc ggcctgcctt cgccgacgtc cccggcttca cgcccatggc ccctctatcc 1260
gctcgagcct cagcgcacat acgtcaatgt tggcttctgg tcagcggtgc cggtcgtggc 1320
cggccagccc gaggggcaca ccaaccggat gatcgagaac gaagtcgatc gccttgacgg 1380
tcacaaatcg ctgtactcag atgcgtttta cgagcgaaaa gagtttgacg cgctgtacgg 1440
cggcgatacc tatagagaac tcaaagagac ctacgaccca aacagccggt tacttgatct 1500
ctatgcaaag gcggtgcaag gacgatgaag gcagtgttga cggcgtttac ggctccccaa 1560
ctcgaaagga tgaacgtcgc tgagatactc agcgcggtac tcgggcgaga tttcccgatc 1620
cggttcactg cgtacgacgg cagcgcgctc ggccccgaaa ccgcccgcta cggcttgcac 1680
ctcacgacgc cgcgcgggct gacctacctc gctaccgcgc ccggtgatct cgggctcgca 1740
cgcgcgtacg tgtccggcga cctcgaggtc agtggggttc atcagggtga cccgtacgag 1800
ataatgaaga tcctcgcgca tgacgtccgg gtgcggcggc cctcgccagc aacgatcgct 1860
tcgatcatgc ggtccctcgg ctgggaacgc ttgcgaccgg tcgcgccgcc cccgcaagag 1920
aacatgcccc gttggcgccg gatggccctt ggcctgctgc actcgaagag ccgtgatgct 1980
gcggcaatcc accatcatta cgacgtgtcg aacgagtttt acgagcacat cctcggcccg 2040
tcgatgacgt acacatgcgc ggcctacccc agcgcagaca gttccctgga ggaagcacag 2100
gacaacaagt accgactcgt cttcgagaaa cttggcctga aagccgggga tcgcctgctt 2160
gacgtcgggt gcgggtgggg cggcatggtg cggttcgccg ctaagcgcgg cgttcatgtc 2220
atcggtgcga cattgtcccg caaacaggcg gaatgggctc agaagatgat tgcccatgaa 2280
ggattgggcg atctggcgga agtccgtttc tgcgactacc gcgatgtcac agaggcgggc 2340
ttcgacgcag tgtcgtcgat cggcctcact gaacacatcg gtttggcgaa ctacccgtcg 2400
tacttcggct tcctgaagga caagttgcgg ccaggcggac gactgctgaa ccattgcatc 2460
actcgcccga acaaccttca aagcaaccgc gcaggtgact tcattgaccg gtacgttttc 2520
cctgacggag agctcgccgg acctggcttc atcatttcag ctgtccacga cgccggtttc 2580
gaggtgcggc acgaagagaa cctccgcgag cactacgcac tgacgctgcg ggactggaac 2640
cgcaacctcg ctcgcgactg ggacgcgtgt gtgcacgcct ccgacgaggg caccgcccgc 2700
gtctggggac tgtacatttc cggttcacga gtcgcgtttg aaacgaactc gattcagctg 2760
caccaggtcc tggcggtcaa aaccgcgcgg aatggcgaag cgcaggtccc gttgggtcag 2820
tggtggaccc gctgacctca aaatatattt tccctctatc ttctcgttgc gcttaatttg 2880
actaattctc attagcgagg cgcgcctttc cataggctcc gcccccctga cgagcatcac 2940
aaaaatcgac gctcaagtca gaggtggcga aacccgacag gactataaag ataccaggcg 3000
tttccccctg gaagctccct cgtgcgctct cctgttccga ccctgccgct taccggatac 3060
ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc atagctcacg ctgtaggtat 3120
ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag 3180
cccgaccgct gcgccttatc cggtaactat cgtcttgagt ccaacccggt aagacacgac 3240
ttatcgccac tggcagcagc cactggtaac aggattagca gagcgaggta tgtaggcggt 3300
gctacagagt tcttgaagtg gtggcctaac tacggctaca ctagaagaac agtatttggt 3360
atctgcgctc tgctgaagcc agttaccttc ggaaaaagag ttggtagctc ttgatccggc 3420
aaacaaacca ccgctggtag cggtggtttt tttgtttgca agcagcagat tacgcgcaga 3480
aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg ggtctgacgc tcagtggaac 3540
gaaaactcac gttaagggat tttggtcatg agattatcaa aaaggatctt cacctagatc 3600
cttttaaatt aaaaatgaag ttttaaatca atctaaagta tatatgagta aacttggtct 3660
gacagttacc aatgcttaat cagtgaggca cctatctcag cgatctgtct atttcgttca 3720
tccatagttg cctgactccc cgtcgtgtag ataactacga tacgggaggg cttaccatct 3780
ggccccagtg ctgcaatgat accgcgagac ccacgctcac cggctccaga tttatcagca 3840
ataaaccagc cagccggaag ggccgagcgc agaagtggtc ctgcaacttt atccgcctcc 3900
atccagtcta ttaattgttg ccgggaagct agagtaagta gttcgccagt taatagtttg 3960
cgcaacgttg ttgccattgc tacaggcatc gtggtgtcac gctcgtcgtt tggtatggct 4020
tcattcagct ccggttccca acgatcaagg cgagttacat gatcccccat gttgtgcaaa 4080
aaagcggtta gctccttcgg tcctccgatc gttgtcagaa gtaagttggc cgcagtgtta 4140
tcactcatgg ttatggcagc actgcataat tctcttactg tcatgccatc cgtaagatgc 4200
ttttctgtga ctggtgagta ctcaaccaag tcattctgag aatagtgtat gcggcgaccg 4260
agttgctctt gcccggcgtc aatacgggat aataccgcgc cacatagcag aactttaaaa 4320
gtgctcatca ttggaaaacg ttcttcgggg cgaaaactct caaggatctt accgctgttg 4380
agatccagtt cgatgtaacc cactcgtgca cccaactgat cttcagcatc ttttactttc 4440
accagcgttt ctgggtgagc aaaaacagga aggcaaaatg ccgcaaaaaa gggaataagg 4500
gcgacacgga aatgttgaat actcatactc ttcctttttc aatattattg aagcatttat 4560
cagggttatt gtctcatgag cggatacata tttgaatgta tttagaaaaa taaacagcga 4620
tcgcgcggcc gcgggtaata actgatataa ttaaattgaa gctctaattt gtgagtttag 4680
tatacatgca tttacttata atacagtttt ttagttttgc tggccgcatc ttctcaaata 4740
tgcttcccag cctgcttttc tgtaacgttc accctctacc ttagcatccc ttccctttgc 4800
aaatagtcct cttccaacaa taataatgtc agatcctgta gagaccacat catccacggt 4860
tctatactgt tgacccaatg cgtctccctt gtcatctaaa cccacaccgg gtgtcataat 4920
caaccaatcg taaccttcat ctcttccacc catgtctctt tgagcaataa agccgataac 4980
aaaatctttg tcgctcttcg caatgtcaac agtaccctta gtatattctc cagtagctag 5040
ggagcccttg catgacaatt ctgctaacat caaaaggcct ctaggttcct ttgttacttc 5100
ttccgccgcc tgcttcaaac cgctaacaat acctgggccc accacaccgt gtgcattcgt 5160
aatgtctgcc cattctgcta ttctgtatac acccgcagag tactgcaatt tgactgtatt 5220
accaatgtca gcaaattttc tgtcttcgaa gagtaaaaaa ttgtacttgg cggataatgc 5280
ctttagcggc ttaactgtgc cctccatgga aaaatcagtc aagatatcca catgtgtttt 5340
tagtaaacaa attttgggac ctaatgcttc aactaactcc agtaattcct tggtggtacg 5400
aacatccaat gaagcacaca agtttgtttg cttttcgtgc atgatattaa atagcttggc 5460
agcaacagga ctaggatgag tagcagcacg ttccttatat gtagctttcg acatgattta 5520
tcttcgtttc ctgcaggttt ttgttctgtg cagttgggtt aagaatactg ggcaatttca 5580
tgtttcttca acaccacata tgcgtatata taccaatcta agtctgtgct ccttccttcg 5640
ttcttccttc tgctcggaga ttaccgaatc aaagctagct tatcgatgat aagctgtcaa 5700
agatgagaat taattccacg gactatagac tatactagat actccgtcta ctgtacgata 5760
cacttccgct caggtccttg tcctttaacg aggccttacc actcttttgt tactctattg 5820
atccagctca gcaaaggcag tgtgatctaa gattctatct tcgcgatgta gtaaaactag 5880
ctagaccgag aaagagacta gaaatgcaaa aggcacttct acaatggctg ccatcattat 5940
tatccgatgt gacgctgcag cttctcaatg atattcgaat acgctttgag gagatacagc 6000
ctaatatccg acaaactgtt ttacagattt acgatcgtac ttgttaccca tcattgaatt 6060
ttgaacatcc gaacctggga gttttccctg aaacagatag tatatttgaa cctgtataat 6120
aatatatagt ctagcgcttt acggaagaca atgtatgtat ttcggttcct ggagaaacta 6180
ttgcatctat tgcataggta atcttgcacg tcgcatcccc ggttcatttt ctgcgtttcc 6240
atcttgcact tcaatagcat atctttgtta acgaagcatc tgtgcttcat tttgtagaac 6300
aaaaatgcaa cgcgagagcg ctaatttttc aaacaaagaa tctgagctgc atttttacag 6360
aacagaaatg caacgcgaaa gcgctatttt accaacgaag aatctgtgct tcatttttgt 6420
aaaacaaaaa tgcaacgcga cgagagcgct aatttttcaa acaaagaatc tgagctgcat 6480
ttttacagaa cagaaatgca acgcgagagc gctattttac caacaaagaa tctatacttc 6540
ttttttgttc tacaaaaatg catcccgaga gcgctatttt tctaacaaag catcttagat 6600
tacttttttt ctcctttgtg cgctctataa tgcagtctct tgataacttt ttgcactgta 6660
ggtccgttaa ggttagaaga aggctacttt ggtgtctatt ttctcttcca taaaaaaagc 6720
ctgactccac ttcccgcgtt tactgattac tagcgaagct gcgggtgcat tttttcaaga 6780
taaaggcatc cccgattata ttctataccg atgtggattg cgcatacttt gtgaacagaa 6840
agtgatagcg ttgatgattc ttcattggtc agaaaattat gaacggtttc ttctattttg 6900
tctctatata ctacgtatag gaaatgttta cattttcgta ttgttttcga ttcactctat 6960
gaatagttct tactacaatt tttttgtcta aagagtaata ctagagataa acataaaaaa 7020
tgtagaggtc gagtttagat gcaagttcaa ggagcgaaag gtggatgggt aggttatata 7080
gggatatagc acagagatat atagcaaaga gatacttttg agcaat 7126
<210> 85
<211> 7925
<212> DNA
<213> 人工序列
<220>
<223> 合成核酸
<400> 85
gtttgtggaa gcggtattcg caatttaatt aaagctggtg acaattaatc atcggctcgt 60
ataatgtgtg gaattgaatc gatataagga ggttaatcat gtgaccgtcg ccggcaggat 120
cactgacgcg gtacgcatag gaaatggact tgaccagcga gatctagccc ccgtcgggtg 180
gtacgcacac gaacaggccg tggcgcgact gaaggccagt ttcgacgcgg tccccgccgg 240
gcgtcgcgtg cggctggcga agaagacgtc caaccttttc cgcgggcgtt ccggcgaggc 300
agtcgggctc gacgtgtcgg ggctgcacgg cgtcatcgcc gtcgaccccg ttgagggcac 360
cgctgacgtc cagggcatgt gcacgtacga ggacctggtg gacgtcctgc tgccctacgg 420
tctggcgccc accgtcgttc cgcagctgaa gaccatcact ctcggcggtg cggtgaccgg 480
catgggggtg gaatccacct ccttccgcaa cggcctgccg cacgaagccg tcctggaaat 540
ggatgtgctc accggtaccg gagacatcct cacctgttcg ccgacccaga acaccgacct 600
ctaccgcggc ttccccaact cctacggttc cctgggatac agcgtgcggc tgaaggtgcg 660
gtgcgaacgg gtggaaccct acgtcgacct gcggcatgta cgcttcgatg acgttcagtc 720
gctcaccgac gccctcgaca acatcgtcgt ggacaaggag tacgagggtg aacgggtcga 780
ctatctcgac ggtgtggtct tcagcctgga ggagagctac ctcgtcctgg gacgggcgac 840
cagcgaggcc ggccccgtta gcgactacac ccgcgagcgc agttactacc gttctctgca 900
gcatccgtcg ggggtcctgc gcgacaagtt gaccatccgc gactacctct ggcggtggga 960
cgtcgactgg ttctggtgca accgggcctt cggtacccag aaccccacca tccgtactct 1020
gtggccgcgg gatctcctgc ggtcgagctt ctactggaag atcatcggct gggaccgacg 1080
cttcgacatc gcggaccgga tcgaggcaca caacgggcgc cccgcacgcg agcgcgtcgt 1140
ccaggacatc gaggtcaccc ccgacaacct gccggagttc ctcacgtggt tcttcaccca 1200
ctgcgagatc gagccggtgt ggctgtgccc cattcgactg gccgacgact cgggcgagcg 1260
gacaccgtgg cccctgtacc cgctgtcacc cggcgacacc tgggtcaacg tgggattctg 1320
gagctcggtg cccgccgacc tgatggggaa ggacgccccg accggagcct tcaaccggga 1380
ggtggagaga gtcgtctcgg acctcggcgg acacaagtcg ttgtactccg aggcattcta 1440
ttctgaggaa cagttcgccg ccctctacgg cggtgaacgt cccgcacaac tcaaggcggt 1500
cttcgacccg gatgaccggt tccccgggtt gtacgagaag accgtgggcg gcgtctgacg 1560
acacgcacga cgacgcacac cgagcacgat gacgcacgac aagcacgatg acgcatgatg 1620
accaagagga gagagatgag caggggattc acgccgctga cggtgggaca gatcgtggac 1680
aaggtcatca caccgccggc accgttccgg gtgaccgctt tcgacggatc caccgcgggg 1740
ccggcagacg cggaactggc actggagatc acatcgccgg acgccctggc ctatatcgtg 1800
accgcgccgg gcgacctcgg actggcacgc gcctacatca ccggaagcct ccgcgtcacc 1860
ggtgacgagc ccggccaccc gtacctcgtc tttgaccacc tccagcacct ttacgaccag 1920
atccgacgcc cctcggcgaa ggacctgctg gatatcgccc gctcgctgaa ggccatgggg 1980
gcgatcaagg tgcagccggc accggagcag gagaccctcc cgggctggaa gagggccata 2040
ctcgaggggc tgtcccggca ctctccggaa cgggacaagg aggtcgtgag ccgccactac 2100
gacgtgggca atgacttcta cgagctcttc ctcggcgatt ccatggccta cacctgtgcc 2160
tactatcccg agtttgacgg tgagaaccag gtcaccggtc ccaccggcgg gtggcggtac 2220
gacgactggg agaaagggcc gaccgccaac gggccgttga cccaggcgca ggacaacaag 2280
catcgcctgg tcttcgacaa gctgcgactc aacccgggtg accggttgtt ggacgtcggc 2340
tgcgggtggg gcggtatggt gcggtacgcc gcccgccacg gcgtgaaggc catcggtgtc 2400
acgctgtccc gagagcagta cgagtggggt aaggcgaaga tcgaggagga gggtctgcag 2460
gacctcgccg aggtccggtg tatggactac cgtgacgtgc cggagtccga cttcgacgcg 2520
gtcagtgcca tcggcatcct cgagcacatc ggcgtgccca actacgagga ctacttcacc 2580
cgcctgttcg ccaagctgcg cccgggcggt cggatgctga accactgcat cacccgtccg 2640
cacaaccgga agacgaagac cggccagttc atcgaccgct acatcttccc cgacggtgag 2700
ctgaccggct cgggccggat catcacgatc atgcaggaca ccggattcga cgtcgtccac 2760
gaggagaatc tgcgaccgca ctaccagcgc acgttgcatg actggtgtga actgttggcc 2820
accaactggg accaggccgt ccatctcgtg ggcgaggaga cggctcgtct gttcggcctg 2880
tacatggcgg ggtcggaatg gggtttcgaa cacaacgtga tccagctcca ccaggttctc 2940
ggcgtgaagc cggacgcggc aggcagttcc ggggtgccgg tccgccagtg gtggaggtcc 3000
tgacggtaac gtcgggacga tgagacggat caccagaggc gctgcggtgg cggtgctgtg 3060
cacaccgttg ctgctcggag cctgcaccat cggcgacgcg ggaccggggg acgagaccac 3120
ggaccctgtc gtggacactg aagcaccgcc cgataaaccg gtgccggact ctgcggcgga 3180
atccggcgct gaagacggac ctgattctga ggtgccggac gaccccgacc agcctgatgc 3240
tgagccggtg gagactgatc ccgacgcccc gggggcccgg ggactggcga tcggtgactg 3300
cgtcgccgac atggaccagc tcgacggcac cggcgacatc gacgtcgtcg actgcgccgg 3360
cccccatgcc ggcgaggtgt acgcacaggc ggatatcgca ggtaagaacc tgttccccgg 3420
caacgagccg ttggggcagg aggcgggagc gatctgcggg ggtgactcct tcaccggcta 3480
tgtcggcatc ggattccccg agtcctcgct ggacgtcgtc acgatgatgc cgtccaagga 3540
gagctgggcg caggaggacc ggacggtgac ctgtgtggtc accgacccga acctcgagca 3600
gatcgccggc acgctcgagc agagctggcg ttagcctcaa aatatatttt ccctctatct 3660
tctcgttgcg cttaatttga ctaattctca ttagcgaggc gcgcctttcc ataggctccg 3720
cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg 3780
actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac 3840
cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca 3900
tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt 3960
gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc 4020
caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag 4080
agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac 4140
tagaagaaca gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt 4200
tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa 4260
gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg 4320
gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa 4380
aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat 4440
atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc 4500
gatctgtcta tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat 4560
acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc 4620
ggctccagat ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc 4680
tgcaacttta tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag 4740
ttcgccagtt aatagtttgc gcaacgttgt tgccattgct acaggcatcg tggtgtcacg 4800
ctcgtcgttt ggtatggctt cattcagctc cggttcccaa cgatcaaggc gagttacatg 4860
atcccccatg ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg ttgtcagaag 4920
taagttggcc gcagtgttat cactcatggt tatggcagca ctgcataatt ctcttactgt 4980
catgccatcc gtaagatgct tttctgtgac tggtgagtac tcaaccaagt cattctgaga 5040
atagtgtatg cggcgaccga gttgctcttg cccggcgtca atacgggata ataccgcgcc 5100
acatagcaga actttaaaag tgctcatcat tggaaaacgt tcttcggggc gaaaactctc 5160
aaggatctta ccgctgttga gatccagttc gatgtaaccc actcgtgcac ccaactgatc 5220
ttcagcatct tttactttca ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc 5280
cgcaaaaaag ggaataaggg cgacacggaa atgttgaata ctcatactct tcctttttca 5340
atattattga agcatttatc agggttattg tctcatgagc ggatacatat ttgaatgtat 5400
ttagaaaaat aaacagcgat cgcgcggccg cgggtaataa ctgatataat taaattgaag 5460
ctctaatttg tgagtttagt atacatgcat ttacttataa tacagttttt tagttttgct 5520
ggccgcatct tctcaaatat gcttcccagc ctgcttttct gtaacgttca ccctctacct 5580
tagcatccct tccctttgca aatagtcctc ttccaacaat aataatgtca gatcctgtag 5640
agaccacatc atccacggtt ctatactgtt gacccaatgc gtctcccttg tcatctaaac 5700
ccacaccggg tgtcataatc aaccaatcgt aaccttcatc tcttccaccc atgtctcttt 5760
gagcaataaa gccgataaca aaatctttgt cgctcttcgc aatgtcaaca gtacccttag 5820
tatattctcc agtagctagg gagcccttgc atgacaattc tgctaacatc aaaaggcctc 5880
taggttcctt tgttacttct tccgccgcct gcttcaaacc gctaacaata cctgggccca 5940
ccacaccgtg tgcattcgta atgtctgccc attctgctat tctgtataca cccgcagagt 6000
actgcaattt gactgtatta ccaatgtcag caaattttct gtcttcgaag agtaaaaaat 6060
tgtacttggc ggataatgcc tttagcggct taactgtgcc ctccatggaa aaatcagtca 6120
agatatccac atgtgttttt agtaaacaaa ttttgggacc taatgcttca actaactcca 6180
gtaattcctt ggtggtacga acatccaatg aagcacacaa gtttgtttgc ttttcgtgca 6240
tgatattaaa tagcttggca gcaacaggac taggatgagt agcagcacgt tccttatatg 6300
tagctttcga catgatttat cttcgtttcc tgcaggtttt tgttctgtgc agttgggtta 6360
agaatactgg gcaatttcat gtttcttcaa caccacatat gcgtatatat accaatctaa 6420
gtctgtgctc cttccttcgt tcttccttct gctcggagat taccgaatca aagctagctt 6480
atcgatgata agctgtcaaa gatgagaatt aattccacgg actatagact atactagata 6540
ctccgtctac tgtacgatac acttccgctc aggtccttgt cctttaacga ggccttacca 6600
ctcttttgtt actctattga tccagctcag caaaggcagt gtgatctaag attctatctt 6660
cgcgatgtag taaaactagc tagaccgaga aagagactag aaatgcaaaa ggcacttcta 6720
caatggctgc catcattatt atccgatgtg acgctgcagc ttctcaatga tattcgaata 6780
cgctttgagg agatacagcc taatatccga caaactgttt tacagattta cgatcgtact 6840
tgttacccat cattgaattt tgaacatccg aacctgggag ttttccctga aacagatagt 6900
atatttgaac ctgtataata atatatagtc tagcgcttta cggaagacaa tgtatgtatt 6960
tcggttcctg gagaaactat tgcatctatt gcataggtaa tcttgcacgt cgcatccccg 7020
gttcattttc tgcgtttcca tcttgcactt caatagcata tctttgttaa cgaagcatct 7080
gtgcttcatt ttgtagaaca aaaatgcaac gcgagagcgc taatttttca aacaaagaat 7140
ctgagctgca tttttacaga acagaaatgc aacgcgaaag cgctatttta ccaacgaaga 7200
atctgtgctt catttttgta aaacaaaaat gcaacgcgac gagagcgcta atttttcaaa 7260
caaagaatct gagctgcatt tttacagaac agaaatgcaa cgcgagagcg ctattttacc 7320
aacaaagaat ctatacttct tttttgttct acaaaaatgc atcccgagag cgctattttt 7380
ctaacaaagc atcttagatt actttttttc tcctttgtgc gctctataat gcagtctctt 7440
gataactttt tgcactgtag gtccgttaag gttagaagaa ggctactttg gtgtctattt 7500
tctcttccat aaaaaaagcc tgactccact tcccgcgttt actgattact agcgaagctg 7560
cgggtgcatt ttttcaagat aaaggcatcc ccgattatat tctataccga tgtggattgc 7620
gcatactttg tgaacagaaa gtgatagcgt tgatgattct tcattggtca gaaaattatg 7680
aacggtttct tctattttgt ctctatatac tacgtatagg aaatgtttac attttcgtat 7740
tgttttcgat tcactctatg aatagttctt actacaattt ttttgtctaa agagtaatac 7800
tagagataaa cataaaaaat gtagaggtcg agtttagatg caagttcaag gagcgaaagg 7860
tggatgggta ggttatatag ggatatagca cagagatata tagcaaagag atacttttga 7920
gcaat 7925
<210> 86
<211> 7141
<212> DNA
<213> 人工序列
<220>
<223> 合成核酸
<400> 86
gtttgtggaa gcggtattcg caatttaatt aaagctggtg acaattaatc atcggctcgt 60
ataatgtgtg gaattgaatc gatataagga ggttaatcat atgcgggagg gtggacgccc 120
cttccgtgcg catcgcactc tgcccgtcac cgggatcgac gctcaccgcg ccggcgtcga 180
acggcttctc gcgtcctacc gcgcgattcc cacggacgcc accgtgcgac tcgcgaagaa 240
gacgtccaac ctgttccggg cgcgggccca gaccagcgca cccggcctcg acgtctccgg 300
gctcggcgga gtcatctcgg tcgacgagca ggaccggacc gcggatgtcg ccggaatgtg 360
cacgtacgaa gacctggtgg acgccaccct cccgtacggg ctggcgccgc tggtggttcc 420
gcaactcaag accatcacac tcggcggcgc ggtcaccggc ctcggcatcg agtcgacgtc 480
gttccgcaac gggctccccc acgaatcggt cctcgagatc gacgtcctga ccggaagcgg 540
cgacatcgtc accgcgagac cggaaggcga gaactccgac ctgttctggg ggttccccaa 600
ctcctacgga accctcggct actccacccg actgcgcatc cagctcgaac ccgtcaaacg 660
gtatgtggca ctgcgccatc tgcgtttcga ctccctggac gagctgcagt cggcaatgga 720
tcgcatcgtc accgagcgcg tccacgacgg catccccgtc gactatctgg acggcgtcgt 780
gttcaccgcg tccgagagtt acctgacact gggccatcag accgacgagg gcggccccgt 840
cagcgactac accgggcaga acatcttcta ccggtccatc cagcacagtt ccgtgaacca 900
ccccaaaacg gacaaactca ccatccgaga ctacctgtgg cgctgggaca ccgactggtt 960
ctggtgctcg cgcgccttcg gcgcccagaa ccccaccatc cgccggctgt ggccgaagaa 1020
cctcctccgc agcagcttct actggaagct catcgccctc gaccacaagt acgacatcgg 1080
cgaccgactc gagaagcgca agggcaaccc gccacgcgaa cgcgtcgtgc aggacgtcga 1140
agtgcccatc gagcgcaccg cggacttcgt ccgctggttc ctcgacgaaa tcccgatcga 1200
accgctgtgg ctgtgcccgt tgcggttgcg ggaacctgcc cccgccggcg cgtcctcgca 1260
acgcccctgg cccctgtacc ccctcgaacc gaaacgcacg tacgtgaaca tcggattctg 1320
gtcatcggtg cccatcgttc cgggccgacc cgagggggcc gcgaatcggc tgatcgaaga 1380
caaggtcagt gacttcgacg gacacaagtc cctctactcc gattcgtact attcacgcga 1440
agatttcgaa cgcctctact acggcggcga tcgatacacg gaactgaaaa aacgctacga 1500
cccgaaatca cgattactgg accttttctc caaggcggtg caacgtcgat gacaactctg 1560
aaagcttcac gctcccagga ccacaagctg accatcgcag agattctcga aactctgtcc 1620
gacggcatgc tccccctgcg gttctccgcc tacgacggca gcgccgccgg cccggaggac 1680
gccccctacg gtctccacct caagacgacc cgaggcacca cctacctggc gaccgccccc 1740
ggcgacctcg gcatggcccg ggcctacgtg tccggcgacc tcgaggcccg cggcgtccac 1800
cccggcgacc cgtacgagat cctccgcgtg atgggcgacg aactgcactt ccgccgtccg 1860
tccgcgctca cgctcgccgc catcacgcgc tcgctcggct gggatctgct gcgccccatc 1920
gcccctcccc cgcaggagca tctcccgcgg tggcgtcgag tcgcggaagg gttgcggcac 1980
tccaagtccc gcgacgccga ggtcatccac caccactacg acgtctcgaa caccttctac 2040
gagtatgtcc tcggcccgtc catgacgtac acgtgcgcct gctacgagaa cgccgagcag 2100
accctcgaag aggcacagga caacaagtac cgcctcgtct tcgagaagct cggcctccag 2160
cccggcgacc gactgctcga catcggttgc ggctggggat cgatggtccg gtacgccgcc 2220
cgccgcggcg tcaaggtcat cggcgccacc ctgtcccgag agcaggccga atgggcacag 2280
aaggccatcg ccgaagaagg actgtccgac ctcgccgagg tccggttctc cgactaccgt 2340
gacgtccccg agaccggatt cgacgccatc tcctcgatcg gcctgaccga gcacatcggc 2400
gtcggcaact accccgccta cttcggactg ctgcagagca agctccgcga gggcggccgg 2460
ctgctgaacc actgcatcac ccggcccgac aaccagagtc aggcacgcgc gggcggcttc 2520
atcgaccggt acgtcttccc cgacggcgaa ctcaccggct ccggacgcat catcaccgag 2580
atccagaacg tcggactcga ggtgcggcac gaggagaatc tgcgcgagca ctacgcactc 2640
accctcgccg gctggtgcca gaacctcgtc gacaactggg acgcctgcgt cgccgaggtc 2700
ggcgaaggca ccgcacgtgt gtggggtctc tacatggccg ggtcgcgact gggcttcgaa 2760
cgcaacgtcg ttcagctgca ccaggtcctc gccgtcaagc tcggacccaa gggcgaggcg 2820
catgtgccgc tgcgtccgtg gtggaagtag cctcaaaata tattttccct ctatcttctc 2880
gttgcgctta atttgactaa ttctcattag cgaggcgcgc ctttccatag gctccgcccc 2940
cctgacgagc atcacaaaaa tcgacgctca agtcagaggt ggcgaaaccc gacaggacta 3000
taaagatacc aggcgtttcc ccctggaagc tccctcgtgc gctctcctgt tccgaccctg 3060
ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa gcgtggcgct ttctcatagc 3120
tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac 3180
gaaccccccg ttcagcccga ccgctgcgcc ttatccggta actatcgtct tgagtccaac 3240
ccggtaagac acgacttatc gccactggca gcagccactg gtaacaggat tagcagagcg 3300
aggtatgtag gcggtgctac agagttcttg aagtggtggc ctaactacgg ctacactaga 3360
agaacagtat ttggtatctg cgctctgctg aagccagtta ccttcggaaa aagagttggt 3420
agctcttgat ccggcaaaca aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag 3480
cagattacgc gcagaaaaaa aggatctcaa gaagatcctt tgatcttttc tacggggtct 3540
gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg tcatgagatt atcaaaaagg 3600
atcttcacct agatcctttt aaattaaaaa tgaagtttta aatcaatcta aagtatatat 3660
gagtaaactt ggtctgacag ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc 3720
tgtctatttc gttcatccat agttgcctga ctccccgtcg tgtagataac tacgatacgg 3780
gagggcttac catctggccc cagtgctgca atgataccgc gagacccacg ctcaccggct 3840
ccagatttat cagcaataaa ccagccagcc ggaagggccg agcgcagaag tggtcctgca 3900
actttatccg cctccatcca gtctattaat tgttgccggg aagctagagt aagtagttcg 3960
ccagttaata gtttgcgcaa cgttgttgcc attgctacag gcatcgtggt gtcacgctcg 4020
tcgtttggta tggcttcatt cagctccggt tcccaacgat caaggcgagt tacatgatcc 4080
cccatgttgt gcaaaaaagc ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag 4140
ttggccgcag tgttatcact catggttatg gcagcactgc ataattctct tactgtcatg 4200
ccatccgtaa gatgcttttc tgtgactggt gagtactcaa ccaagtcatt ctgagaatag 4260
tgtatgcggc gaccgagttg ctcttgcccg gcgtcaatac gggataatac cgcgccacat 4320
agcagaactt taaaagtgct catcattgga aaacgttctt cggggcgaaa actctcaagg 4380
atcttaccgc tgttgagatc cagttcgatg taacccactc gtgcacccaa ctgatcttca 4440
gcatctttta ctttcaccag cgtttctggg tgagcaaaaa caggaaggca aaatgccgca 4500
aaaaagggaa taagggcgac acggaaatgt tgaatactca tactcttcct ttttcaatat 4560
tattgaagca tttatcaggg ttattgtctc atgagcggat acatatttga atgtatttag 4620
aaaaataaac agcgatcgcg cggccgcggg taataactga tataattaaa ttgaagctct 4680
aatttgtgag tttagtatac atgcatttac ttataataca gttttttagt tttgctggcc 4740
gcatcttctc aaatatgctt cccagcctgc ttttctgtaa cgttcaccct ctaccttagc 4800
atcccttccc tttgcaaata gtcctcttcc aacaataata atgtcagatc ctgtagagac 4860
cacatcatcc acggttctat actgttgacc caatgcgtct cccttgtcat ctaaacccac 4920
accgggtgtc ataatcaacc aatcgtaacc ttcatctctt ccacccatgt ctctttgagc 4980
aataaagccg ataacaaaat ctttgtcgct cttcgcaatg tcaacagtac ccttagtata 5040
ttctccagta gctagggagc ccttgcatga caattctgct aacatcaaaa ggcctctagg 5100
ttcctttgtt acttcttccg ccgcctgctt caaaccgcta acaatacctg ggcccaccac 5160
accgtgtgca ttcgtaatgt ctgcccattc tgctattctg tatacacccg cagagtactg 5220
caatttgact gtattaccaa tgtcagcaaa ttttctgtct tcgaagagta aaaaattgta 5280
cttggcggat aatgccttta gcggcttaac tgtgccctcc atggaaaaat cagtcaagat 5340
atccacatgt gtttttagta aacaaatttt gggacctaat gcttcaacta actccagtaa 5400
ttccttggtg gtacgaacat ccaatgaagc acacaagttt gtttgctttt cgtgcatgat 5460
attaaatagc ttggcagcaa caggactagg atgagtagca gcacgttcct tatatgtagc 5520
tttcgacatg atttatcttc gtttcctgca ggtttttgtt ctgtgcagtt gggttaagaa 5580
tactgggcaa tttcatgttt cttcaacacc acatatgcgt atatatacca atctaagtct 5640
gtgctccttc cttcgttctt ccttctgctc ggagattacc gaatcaaagc tagcttatcg 5700
atgataagct gtcaaagatg agaattaatt ccacggacta tagactatac tagatactcc 5760
gtctactgta cgatacactt ccgctcaggt ccttgtcctt taacgaggcc ttaccactct 5820
tttgttactc tattgatcca gctcagcaaa ggcagtgtga tctaagattc tatcttcgcg 5880
atgtagtaaa actagctaga ccgagaaaga gactagaaat gcaaaaggca cttctacaat 5940
ggctgccatc attattatcc gatgtgacgc tgcagcttct caatgatatt cgaatacgct 6000
ttgaggagat acagcctaat atccgacaaa ctgttttaca gatttacgat cgtacttgtt 6060
acccatcatt gaattttgaa catccgaacc tgggagtttt ccctgaaaca gatagtatat 6120
ttgaacctgt ataataatat atagtctagc gctttacgga agacaatgta tgtatttcgg 6180
ttcctggaga aactattgca tctattgcat aggtaatctt gcacgtcgca tccccggttc 6240
attttctgcg tttccatctt gcacttcaat agcatatctt tgttaacgaa gcatctgtgc 6300
ttcattttgt agaacaaaaa tgcaacgcga gagcgctaat ttttcaaaca aagaatctga 6360
gctgcatttt tacagaacag aaatgcaacg cgaaagcgct attttaccaa cgaagaatct 6420
gtgcttcatt tttgtaaaac aaaaatgcaa cgcgacgaga gcgctaattt ttcaaacaaa 6480
gaatctgagc tgcattttta cagaacagaa atgcaacgcg agagcgctat tttaccaaca 6540
aagaatctat acttcttttt tgttctacaa aaatgcatcc cgagagcgct atttttctaa 6600
caaagcatct tagattactt tttttctcct ttgtgcgctc tataatgcag tctcttgata 6660
actttttgca ctgtaggtcc gttaaggtta gaagaaggct actttggtgt ctattttctc 6720
ttccataaaa aaagcctgac tccacttccc gcgtttactg attactagcg aagctgcggg 6780
tgcatttttt caagataaag gcatccccga ttatattcta taccgatgtg gattgcgcat 6840
actttgtgaa cagaaagtga tagcgttgat gattcttcat tggtcagaaa attatgaacg 6900
gtttcttcta ttttgtctct atatactacg tataggaaat gtttacattt tcgtattgtt 6960
ttcgattcac tctatgaata gttcttacta caattttttt gtctaaagag taatactaga 7020
gataaacata aaaaatgtag aggtcgagtt tagatgcaag ttcaaggagc gaaaggtgga 7080
tgggtaggtt atatagggat atagcacaga gatatatagc aaagagatac ttttgagcaa 7140
t 7141
<210> 87
<211> 7588
<212> DNA
<213> 人工序列
<220>
<223> 合成核酸
<400> 87
gtttgtggaa gcggtattcg caatttaatt aaagctggtg acaattaatc atcggctcgt 60
ataatgtgtg gaattgaatc gatataagga ggttaatcat gtgaactgtc agtcttccgc 120
gtccaacctc gccaaccaca tcaacgcggt gtacgagctg cgccgcgcct atgcgcggct 180
gtccgccgac aagccggtgc gcctggcgaa gaccacctcc aacctcttcc gcttccgcag 240
ccgggacgat gccgcgcgtc tcgacgtcag cgctttcacc tcggtgatca gcatcgacac 300
ggaggcgcgg gtcgcggagg tgggcggcat gaccacctac gaggacctgg tcgccgccac 360
cctgcggcat ggcctgatgc cgccggtggt tccgcaactg cgcacgatca ccctgggcgg 420
tgcggtcacc gggctgggga tcgaatcctc gtccttccgc aacgggctcc cgcacgagtc 480
agtggaagag atggagatcc tcaccggcag cggccaggtg gtggtggccc ggcgcgacaa 540
cgagcaccgc gacctgttct acggtttccc caactcgtac ggcaccctcg gttacgcgct 600
gcggctccgc atccagctcg aaccggtccg cccctacgtc cacctgcggc acctgcggtt 660
caccgatgcc gcagcggcca tggccgcgct ggagcagatc tgcgcggacc gcacccacga 720
cggggagacc gtcgacttcg tcgacggcgt cgtgttcgcc cgcaacgagc tgtacctgac 780
cttggggacg ttcaccgacc gggctccgtg gaccagcgac tacaccggaa ccgacatcta 840
ctaccggtcg atcccccgct acgcgggccc cggccccggc gactacctca ccacgcacga 900
ctacctgtgg cggtgggaca ccgactggtt ctggtgctcc cgcgccttcg gactgcagca 960
tcccgtggtg cgccgcctgt ggccgcgttc cttgaaacgc tccgacgtct accgcaagct 1020
cgtcgcctgg gaccggcgca ctgacgcgag ccgcctgctc gactactacc gcgggcgccc 1080
gcccaaggaa ccggtgatcc aggacatcga ggttgaggtg gggcgggctg ccgagttcct 1140
cgacttcttc cacaccgaga tcggcatgtc cccggtgtgg ctgtgcccgc tgcggctgcg 1200
agaagacaca gccgacgata cggaaccggt ctggccgctc taccccctca aaccccgccg 1260
cctctacgtc aacttcgggt tttggggcct cgttccgatc cgtcccggtg gaggcaggac 1320
ataccacaac cggctgatcg aaaaagaagt gacccggttg ggcgggcaca agtcgctcta 1380
ctcggacgcc ttctacgacg aggacgagtt ctgggagctc tacaacgggg agatctaccg 1440
caagctcaaa gctgcctacg accccgacgg tcgactgctc gacctgtaca ccaagtgcgt 1500
cggcggcggg tgagaaagga tgagggatgc gactggcgga ggtattcgaa cgtgtcgtcg 1560
gacccgatgc gcccgtccac ttccgggcct acgacggcag cactgcggga gatccacgca 1620
gtgaagtcgc tatcgtggtt cgccacccgg cagccgtcaa ctacatcgtc caagcgccgg 1680
gagcactcgg tttgacccgc gcctacgtgg cgggatacct cgacgtcgaa ggggacatgt 1740
acaccgcgct gcgggcaatg gccgacgtgg tgttccagga ccggccgcgg ctgtcccccg 1800
gggaactgct gcggatcatc cgcgggatcg ggtgggtgaa gttcgtcaac cggcttccac 1860
cgccgccgca ggaggtgcgc cagtcccgcc tcgccgccct gggctggcgc cactccaagc 1920
agcgcgacgc cgaagccatc cagcaccact acgacgtctc caacgccttc tacgccctgg 1980
tcttgggcga gtcgatgacc tacacctgcg cggtctaccc gaccgagcag gccacgctgg 2040
agcaggcaca gttcttcaag cacgagctga tcgcccgcaa gctcggtctt gcccctggga 2100
tacgactgct ggatgtgggg tgcggctggg gcggcatggt catccacgcg gcccgggagc 2160
acggggtcaa agccctgggg gtgaccctgt ccaaagagca ggctgagtgg gcgcagaagc 2220
ggatcgccca cgagggcctg ggcgacctgg cagaagtccg gcacatggac taccgggacc 2280
tgcccgacgg cgagtacgac gcgatcagct cgatcgggtt gaccgagcac gtcggcaaaa 2340
agaacgtgcc cgcctacttc gcgtcgctgt accgcaagct cgtcccggga ggccgcctgc 2400
tcaaccactg catcacccgg ccccgcaacg acctgccgcc cttcaaacgc ggcggggtga 2460
tcaaccgcta cgtcttcccc gatggggagc tggaagggcc cggctggctg caggcggcga 2520
tgaacgacgc cgggttcgaa atccgccacc aggagaacct gcgggagcac tacgcacgga 2580
ccctgcggga ctggctggcc aacctggacc gcaactggga tgccgcggtg cgggaagtgg 2640
gggagggcac ggcccgagtg tggcggctct acatggccgg gtgcgtgctc ggcttcgaac 2700
gcaacgtggt gcaactgcac cagatcctcg gggtgaagct cgacgggacc gaggcgcgga 2760
tgccgctgcg ccccgacttc gaaccgccgc tgccttaacc gcggtgcaca gccgggggat 2820
atcagtcgcg gaaccgggca tgatgagccc atggctgcga ccgatgacga ccggcaccac 2880
accaccgtcg ccctcgacct catcgacgcg tatgtgcgcg ccgaccgcag aatgatcggt 2940
gaacgttccg cggggatcag cgcggaggcg ggggagcgga tcgtctccac cctgaaagtg 3000
tgcgcggcct tccttgcccg ccgggtccag gagaccgggg tgccgtggcg cgcagcggac 3060
tcccgggaag cggtcgcccg caccgtcgcc gacctgctgg aacccgaggt ggaattcgcg 3120
gtcgtctccg cctgggaggc gtacgcgatc ggggagcacg aggccgcctg ggtccgggcg 3180
cacggcgatc cgctggtctt cgtccacatg ctggccgcgt tctccgctgc tatcggcaca 3240
gcggtctacg gccgtgagga gctgctgccc acgctgcgca gggtgacagc acgataacct 3300
caaaatatat tttccctcta tcttctcgtt gcgcttaatt tgactaattc tcattagcga 3360
ggcgcgcctt tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt 3420
cagaggtggc gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc 3480
ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct 3540
tcgggaagcg tggcgctttc tcatagctca cgctgtaggt atctcagttc ggtgtaggtc 3600
gttcgctcca agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta 3660
tccggtaact atcgtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca 3720
gccactggta acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag 3780
tggtggccta actacggcta cactagaaga acagtatttg gtatctgcgc tctgctgaag 3840
ccagttacct tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt 3900
agcggtggtt tttttgtttg caagcagcag attacgcgca gaaaaaaagg atctcaagaa 3960
gatcctttga tcttttctac ggggtctgac gctcagtgga acgaaaactc acgttaaggg 4020
attttggtca tgagattatc aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga 4080
agttttaaat caatctaaag tatatatgag taaacttggt ctgacagtta ccaatgctta 4140
atcagtgagg cacctatctc agcgatctgt ctatttcgtt catccatagt tgcctgactc 4200
cccgtcgtgt agataactac gatacgggag ggcttaccat ctggccccag tgctgcaatg 4260
ataccgcgag acccacgctc accggctcca gatttatcag caataaacca gccagccgga 4320
agggccgagc gcagaagtgg tcctgcaact ttatccgcct ccatccagtc tattaattgt 4380
tgccgggaag ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt 4440
gctacaggca tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag ctccggttcc 4500
caacgatcaa ggcgagttac atgatccccc atgttgtgca aaaaagcggt tagctccttc 4560
ggtcctccga tcgttgtcag aagtaagttg gccgcagtgt tatcactcat ggttatggca 4620
gcactgcata attctcttac tgtcatgcca tccgtaagat gcttttctgt gactggtgag 4680
tactcaacca agtcattctg agaatagtgt atgcggcgac cgagttgctc ttgcccggcg 4740
tcaatacggg ataataccgc gccacatagc agaactttaa aagtgctcat cattggaaaa 4800
cgttcttcgg ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa 4860
cccactcgtg cacccaactg atcttcagca tcttttactt tcaccagcgt ttctgggtga 4920
gcaaaaacag gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg gaaatgttga 4980
atactcatac tcttcctttt tcaatattat tgaagcattt atcagggtta ttgtctcatg 5040
agcggataca tatttgaatg tatttagaaa aataaacagc gatcgcgcgg ccgcgggtaa 5100
taactgatat aattaaattg aagctctaat ttgtgagttt agtatacatg catttactta 5160
taatacagtt ttttagtttt gctggccgca tcttctcaaa tatgcttccc agcctgcttt 5220
tctgtaacgt tcaccctcta ccttagcatc ccttcccttt gcaaatagtc ctcttccaac 5280
aataataatg tcagatcctg tagagaccac atcatccacg gttctatact gttgacccaa 5340
tgcgtctccc ttgtcatcta aacccacacc gggtgtcata atcaaccaat cgtaaccttc 5400
atctcttcca cccatgtctc tttgagcaat aaagccgata acaaaatctt tgtcgctctt 5460
cgcaatgtca acagtaccct tagtatattc tccagtagct agggagccct tgcatgacaa 5520
ttctgctaac atcaaaaggc ctctaggttc ctttgttact tcttccgccg cctgcttcaa 5580
accgctaaca atacctgggc ccaccacacc gtgtgcattc gtaatgtctg cccattctgc 5640
tattctgtat acacccgcag agtactgcaa tttgactgta ttaccaatgt cagcaaattt 5700
tctgtcttcg aagagtaaaa aattgtactt ggcggataat gcctttagcg gcttaactgt 5760
gccctccatg gaaaaatcag tcaagatatc cacatgtgtt tttagtaaac aaattttggg 5820
acctaatgct tcaactaact ccagtaattc cttggtggta cgaacatcca atgaagcaca 5880
caagtttgtt tgcttttcgt gcatgatatt aaatagcttg gcagcaacag gactaggatg 5940
agtagcagca cgttccttat atgtagcttt cgacatgatt tatcttcgtt tcctgcaggt 6000
ttttgttctg tgcagttggg ttaagaatac tgggcaattt catgtttctt caacaccaca 6060
tatgcgtata tataccaatc taagtctgtg ctccttcctt cgttcttcct tctgctcgga 6120
gattaccgaa tcaaagctag cttatcgatg ataagctgtc aaagatgaga attaattcca 6180
cggactatag actatactag atactccgtc tactgtacga tacacttccg ctcaggtcct 6240
tgtcctttaa cgaggcctta ccactctttt gttactctat tgatccagct cagcaaaggc 6300
agtgtgatct aagattctat cttcgcgatg tagtaaaact agctagaccg agaaagagac 6360
tagaaatgca aaaggcactt ctacaatggc tgccatcatt attatccgat gtgacgctgc 6420
agcttctcaa tgatattcga atacgctttg aggagataca gcctaatatc cgacaaactg 6480
ttttacagat ttacgatcgt acttgttacc catcattgaa ttttgaacat ccgaacctgg 6540
gagttttccc tgaaacagat agtatatttg aacctgtata ataatatata gtctagcgct 6600
ttacggaaga caatgtatgt atttcggttc ctggagaaac tattgcatct attgcatagg 6660
taatcttgca cgtcgcatcc ccggttcatt ttctgcgttt ccatcttgca cttcaatagc 6720
atatctttgt taacgaagca tctgtgcttc attttgtaga acaaaaatgc aacgcgagag 6780
cgctaatttt tcaaacaaag aatctgagct gcatttttac agaacagaaa tgcaacgcga 6840
aagcgctatt ttaccaacga agaatctgtg cttcattttt gtaaaacaaa aatgcaacgc 6900
gacgagagcg ctaatttttc aaacaaagaa tctgagctgc atttttacag aacagaaatg 6960
caacgcgaga gcgctatttt accaacaaag aatctatact tcttttttgt tctacaaaaa 7020
tgcatcccga gagcgctatt tttctaacaa agcatcttag attacttttt ttctcctttg 7080
tgcgctctat aatgcagtct cttgataact ttttgcactg taggtccgtt aaggttagaa 7140
gaaggctact ttggtgtcta ttttctcttc cataaaaaaa gcctgactcc acttcccgcg 7200
tttactgatt actagcgaag ctgcgggtgc attttttcaa gataaaggca tccccgatta 7260
tattctatac cgatgtggat tgcgcatact ttgtgaacag aaagtgatag cgttgatgat 7320
tcttcattgg tcagaaaatt atgaacggtt tcttctattt tgtctctata tactacgtat 7380
aggaaatgtt tacattttcg tattgttttc gattcactct atgaatagtt cttactacaa 7440
tttttttgtc taaagagtaa tactagagat aaacataaaa aatgtagagg tcgagtttag 7500
atgcaagttc aaggagcgaa aggtggatgg gtaggttata tagggatata gcacagagat 7560
atatagcaaa gagatacttt tgagcaat 7588
<210> 88
<211> 7074
<212> DNA
<213> 人工序列
<220>
<223> 合成核酸
<400> 88
gtttgtggaa gcggtattcg caatttaatt aaagctggtg acaattaatc atcggctcgt 60
ataatgtgtg gaattgaatc gatataagga ggttaatcat atgtcacagc tggcggtcac 120
agaccaccac gagcgagcgg tcgaggcgct gcgcaggtcg tatgcggcga tcccgccggg 180
cacaccggtc cgcttggcca agcagacctc caacctgttc cgcttccgcg agccgacggc 240
cgcgcccggc ctggacgtgt ccggcttcaa ccgggtgctg gcggtggacc cggatgcgcg 300
caccgccgac gtgcagggca tgaccaccta cgaggacctg gtcgacgcca ccctgccgca 360
cgggctgatg ccgctggtgg tgccccagct caagacgatc acgctgggcg gggcggtgac 420
cggcctgggc atcgagtcca cctccttccg caacggcctg ccgcacgagt cggtgctgga 480
gatgcagatc atcaccggcg ccggcgaagt ggtcaccgcc accccggacg gggagcactc 540
cgacctgttc tggggcttcc ccaactccta cgggacgctg gggtacgccc tgaagctgaa 600
gatcgaactg gagccggtca agccgtacgt ccggctgcgg cacctgcgct tcgacgacgc 660
cggcgagtgc gccgccaagc tcgccgagct gagcgaaagc cgcgagcacg agggcgatga 720
ggtgcacttt ttggacggca ccttcttcgg gccgcgcgag atgtacctga cgctcggcac 780
gttcaccgac accgccccct atgtgtcgga ctacaccggg cagcacatct actaccggtc 840
gatccagcag cggtcgatcg actttttgac catccgcgac tacctgtggc gctgggacac 900
cgactggttc tggtgctcgc gcgccctggg cgtgcagaac ccgctgatcc ggcgggtgtg 960
gccgaagagc gccaagcggt cggatgtgta ccgcaagctg gtggcctacg aaaagcgcta 1020
ccagttcaag gcgcgcatcg accggtggac gggcaagccg ccgcgcgagg acgtcatcca 1080
ggacatcgag gtgccggcag aacgcctgcc ggagttcctg gagttcttcc acgacaagat 1140
cgggatgagc ccggtgtggc tgtgcccgct gcgggcgcgc caccgctggc cgctgtaccc 1200
gctcaagccc ggcgtcacct acgtcaacgc cggcttctgg gggacggtgc cgctgcagcc 1260
ggggcagatg cccgagtacc acaaccggct gatcgaacgg aaggtcgccc aactggacgg 1320
ccacaagtct ctgtactcga cggcgttcta ctcgcgtgag gagttctggc ggcactacga 1380
cggggaaacc taccggcgtc tgaaggacac ctacgacccc gacgcgcgcc tgctcgacct 1440
ctacgacaag tgcgtgcggg gacgctgacc ggggcggcgg cgatgaagac ccgcggggcg 1500
ggacggacag gagggaagcg atgacgctgg ccaaggtctt cgaggagctg gtcggggcgg 1560
acgcccctgt ggagctcacc gcctacgacg gatcgagagc cggacgcctg ggcagtgatc 1620
tgcgggtcca cgtgaagtcg ccgtacgcgg tgtcctacct ggtgcactcg ccgagcgcgc 1680
tcgggctggc ccgcgcgtac gtggccgggc acctggacgc ctacggcgac atgtacacgc 1740
tgctgcggga gatgacgcag ctgaccgagg cgctgacgcc caaggcccgg ctgcggctgc 1800
tggccggtgt cctgcaggat ccgctgctgc gcgcggcggc cagccgccgt ctgccgcccc 1860
cgccgcagga ggtgcggacc ggccgcacct cctggttccg gcacaccaag cggcgggacg 1920
ccaaggccat ctcccaccac tacgacgtgt ccaacacctt ctatgagtgg gtgctgggcc 1980
cgtcgatgac ctacacctgc gcctgtttcc ccaccgagga cgccaccttg gaggaggcgc 2040
agttccacaa gcacgacctg gtcgccaaga agctcgggct gcggccgggc atgcggctgc 2100
tggacgtggg ctgcggctgg ggcggcatgg tgatgcacgc cgccaagcac tacggggtgc 2160
gggcgctggg cgtcacgctg tccaagcagc aggccgagtg ggcgcagaag gccatcgccg 2220
aggcgggcct gagcgacctg gccgaggtcc gccaccagga ctaccgggac gtcaccgagg 2280
gcgacttcga cgccatcagc tcgatcggcc tcaccgagca catcggcaag gccaacctgc 2340
cgtcctactt cggcttcctg tacggcaagc tcaagccggg cgggcggctg ctcaaccact 2400
gcatcacccg gcccgacaac acccagccgg ccatgaagaa ggacgggttc atcaaccggt 2460
acgtcttccc cgacggggag ctggaggggc ccggctacct gcagacccag atgaacgacg 2520
ccggttttga gatccgccac caggagaacc tgcgcgagca ctacgcccgc accctggccg 2580
gatggtgccg caacctcgat gagcactggg acgaggcggt ggccgaggtc ggcgagggca 2640
ccgcgcgggt gtggcggctg tacatggccg gcagccggct cggtttcgag ctcaactgga 2700
tccagctgca ccagatcctg ggcgtcaagc tcggcgagcg cggcgagtcc cgcatgccgt 2760
tgcggcccga ctggggcgtg tgacctcaaa atatattttc cctctatctt ctcgttgcgc 2820
ttaatttgac taattctcat tagcgaggcg cgcctttcca taggctccgc ccccctgacg 2880
agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat 2940
accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta 3000
ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct 3060
gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc 3120
ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa 3180
gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg 3240
taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact agaagaacag 3300
tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt 3360
gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta 3420
cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc 3480
agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca 3540
cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa 3600
cttggtctga cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat 3660
ttcgttcatc catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct 3720
taccatctgg ccccagtgct gcaatgatac cgcgagaccc acgctcaccg gctccagatt 3780
tatcagcaat aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat 3840
ccgcctccat ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta 3900
atagtttgcg caacgttgtt gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg 3960
gtatggcttc attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt 4020
tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg 4080
cagtgttatc actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg 4140
taagatgctt ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc 4200
ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca catagcagaa 4260
ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac 4320
cgctgttgag atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt 4380
ttactttcac cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg 4440
gaataagggc gacacggaaa tgttgaatac tcatactctt cctttttcaa tattattgaa 4500
gcatttatca gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata 4560
aacagcgatc gcgcggccgc gggtaataac tgatataatt aaattgaagc tctaatttgt 4620
gagtttagta tacatgcatt tacttataat acagtttttt agttttgctg gccgcatctt 4680
ctcaaatatg cttcccagcc tgcttttctg taacgttcac cctctacctt agcatccctt 4740
ccctttgcaa atagtcctct tccaacaata ataatgtcag atcctgtaga gaccacatca 4800
tccacggttc tatactgttg acccaatgcg tctcccttgt catctaaacc cacaccgggt 4860
gtcataatca accaatcgta accttcatct cttccaccca tgtctctttg agcaataaag 4920
ccgataacaa aatctttgtc gctcttcgca atgtcaacag tacccttagt atattctcca 4980
gtagctaggg agcccttgca tgacaattct gctaacatca aaaggcctct aggttccttt 5040
gttacttctt ccgccgcctg cttcaaaccg ctaacaatac ctgggcccac cacaccgtgt 5100
gcattcgtaa tgtctgccca ttctgctatt ctgtatacac ccgcagagta ctgcaatttg 5160
actgtattac caatgtcagc aaattttctg tcttcgaaga gtaaaaaatt gtacttggcg 5220
gataatgcct ttagcggctt aactgtgccc tccatggaaa aatcagtcaa gatatccaca 5280
tgtgttttta gtaaacaaat tttgggacct aatgcttcaa ctaactccag taattccttg 5340
gtggtacgaa catccaatga agcacacaag tttgtttgct tttcgtgcat gatattaaat 5400
agcttggcag caacaggact aggatgagta gcagcacgtt ccttatatgt agctttcgac 5460
atgatttatc ttcgtttcct gcaggttttt gttctgtgca gttgggttaa gaatactggg 5520
caatttcatg tttcttcaac accacatatg cgtatatata ccaatctaag tctgtgctcc 5580
ttccttcgtt cttccttctg ctcggagatt accgaatcaa agctagctta tcgatgataa 5640
gctgtcaaag atgagaatta attccacgga ctatagacta tactagatac tccgtctact 5700
gtacgataca cttccgctca ggtccttgtc ctttaacgag gccttaccac tcttttgtta 5760
ctctattgat ccagctcagc aaaggcagtg tgatctaaga ttctatcttc gcgatgtagt 5820
aaaactagct agaccgagaa agagactaga aatgcaaaag gcacttctac aatggctgcc 5880
atcattatta tccgatgtga cgctgcagct tctcaatgat attcgaatac gctttgagga 5940
gatacagcct aatatccgac aaactgtttt acagatttac gatcgtactt gttacccatc 6000
attgaatttt gaacatccga acctgggagt tttccctgaa acagatagta tatttgaacc 6060
tgtataataa tatatagtct agcgctttac ggaagacaat gtatgtattt cggttcctgg 6120
agaaactatt gcatctattg cataggtaat cttgcacgtc gcatccccgg ttcattttct 6180
gcgtttccat cttgcacttc aatagcatat ctttgttaac gaagcatctg tgcttcattt 6240
tgtagaacaa aaatgcaacg cgagagcgct aatttttcaa acaaagaatc tgagctgcat 6300
ttttacagaa cagaaatgca acgcgaaagc gctattttac caacgaagaa tctgtgcttc 6360
atttttgtaa aacaaaaatg caacgcgacg agagcgctaa tttttcaaac aaagaatctg 6420
agctgcattt ttacagaaca gaaatgcaac gcgagagcgc tattttacca acaaagaatc 6480
tatacttctt ttttgttcta caaaaatgca tcccgagagc gctatttttc taacaaagca 6540
tcttagatta ctttttttct cctttgtgcg ctctataatg cagtctcttg ataacttttt 6600
gcactgtagg tccgttaagg ttagaagaag gctactttgg tgtctatttt ctcttccata 6660
aaaaaagcct gactccactt cccgcgttta ctgattacta gcgaagctgc gggtgcattt 6720
tttcaagata aaggcatccc cgattatatt ctataccgat gtggattgcg catactttgt 6780
gaacagaaag tgatagcgtt gatgattctt cattggtcag aaaattatga acggtttctt 6840
ctattttgtc tctatatact acgtatagga aatgtttaca ttttcgtatt gttttcgatt 6900
cactctatga atagttctta ctacaatttt tttgtctaaa gagtaatact agagataaac 6960
ataaaaaatg tagaggtcga gtttagatgc aagttcaagg agcgaaaggt ggatgggtag 7020
gttatatagg gatatagcac agagatatat agcaaagaga tacttttgag caat 7074
<210> 89
<211> 7331
<212> DNA
<213> 人工序列
<220>
<223> 合成核酸
<400> 89
gtttgtggaa gcggtattcg caatttaatt aaagctggtg acaattaatc atcggctcgt 60
ataatgtgtg gaattgaatc gatataagga ggttaatcat atgagcggat tagttgaccc 120
ggatagtact tttttaaaga ccatcggaaa actgagcaac agcttgtcca ttggtcgtgg 180
agtagatcaa aaagaggtaa tccccaaagg ctggaacgcc cattgggagg caattacaaa 240
gcttaagaga agctttgacg cgattcctgc tggggagcgg gtgcgtttag ctaagaaaac 300
ctccaacctg ttccgtggac gctccgatgc aggtcacggc ctagatgtgg cagcgcttgg 360
gggagtgatt gccattgatc cggtcaatgc caccgccgat gtacagggca tgtgcacgta 420
tgaagacctg gtagatgcca ctttaagtta tggtctgatg ccgttggttg tgcctcaact 480
gaaaaccatc acgcttggtg gcgcagtgac cggaatgggc gtggaatcca catccttccg 540
caacggtttg ccacacgaat cagtgctgga gatggatatt tttaccggca ctggtgagat 600
cgtgacttgc tcgcccacag aaaatgtcga cctttacaga ggttttccca actcttatgg 660
ttcgctggga tacgcggtgc ggctaaaaat tgagctggaa ccagtgcaag attacgtcca 720
gctgcgccac gtgcgcttca acgatttaga gtctttgacc aaagcgattg aggaagtcgc 780
gtcttctctg gagtttgata accaacccgt cgattacctt gacggcgtgg tgttttcacc 840
cacggaagcc tacttagttc ttggcacgca aacctcacaa cctggcccca ccagcgatta 900
caccagggat ttaagctact accgctccct gcaacaccca gagggcatca cctatgaccg 960
cctgacaatc cgcgattaca tctggcgctg ggacaccgac tggttctggt gttcacgcgc 1020
attcggcacc caaaaccccg tggtgcgcaa actctggccc agggatctgc tgcgctcgag 1080
tttctattgg aagatcatcg gctgggatcg aaaatactcc atcgctgatc gcctggaaga 1140
gcgcaaaggc cgcccggcta gggaacgggt ggtccaagac gtggaagtta cgattgataa 1200
actgccagaa tttttgaaat ggttctttga aagcagcgac atcgagccgc tgtggctgtg 1260
cccgatcaag cttcgggagg taccaggtag ttcggttggt gctggagaaa ttttgagctc 1320
cgctgaagca atcgactccg gtgctgctga acacccttgg ccgctgtatc ccttgaagaa 1380
ggacgtgctg tgggtcaaca tcggattctg gtcctcagtg ccggttgatc tgatgggctc 1440
cgatgcacca gagggagcat ttaacagaga aatcgaacgc gtcatggcag agctaggcgg 1500
acataaatcg ctgtactccg aagcgttcta caccagggaa gactttgaaa aactttatgg 1560
cggaaccatc ccggcgctgc taaaaaagca gtgggatccc cacagccgat tccccggttt 1620
gtatgaaaag acagtaaaag gcgcctagga tcgctcactg taggtagagg cttgtggtca 1680
ctacttgtgg ccacatttta aaaaaatgca caagaagaga aagcaaagca ttatgagtaa 1740
cgccgtagcg caggacctca tgaccatcgc cgacatcgtc gaggccacga ccactgcacc 1800
catcccattc cacatcactg ccttcgatgg aagcttcact ggccctgaag atgctcccta 1860
ccagctgttt gttgccaaca cggatgcagt atcctacatc gcaacagcgc caggagattt 1920
gggtttggca cgtgcctacc tcatgggaga cctcatcgtg gaaggtgagc atcccggcca 1980
tccttatggg atctttgatg cgttgaagga gttctaccgc tgcttcaaac gcccagatgc 2040
atccaccacc ttgcagatca tgtggactct gcggaaaatg aatgccttaa aattccagga 2100
aattccacca atggaacaag cccctgcatg gcgtaaagca ctgatcaacg ggctagcatc 2160
caggcactcg aaatcccgcg acaagaaagc cattagctac cactacgacg tgggcaatga 2220
gttctactcc ctgtttttag atgattccat gacctatacc tgcgcgtatt atccaacgcc 2280
agaatcaagt ttggaagaag cccaagaaaa caaataccgc ctcatctttg aaaaactgcg 2340
tctgaaagaa ggcgatcgcc tcctagacgt gggatgcggt tggggaggca tggtccgcta 2400
cgccgccaaa cacggtgtga aagccatcgg agttacgctg tctgaacagc aatatgagtg 2460
gggtcaagca gagatcaaac gccaaggttt ggaagacctc gcggaaattc gcttcatgga 2520
ttaccgcgat gttccagaaa ctggattcga tgcgatctca gcaatcggca tcattgaaca 2580
catcggtgtg aacaactatc ccgactactt tgaattgctc agcagcaaac tcaaaacagg 2640
cggactgatg ctcaaccaca gcatcaccta cccagacaac cgcccccgcc acgcaggtgc 2700
atttattgat cgctacattt tccccgacgg tgaactcact ggctctggca ccctgatcaa 2760
gcacatgcag gacaacggtt tcgaagtgct gcacgaagaa aacctccgct ttgattacca 2820
acgcaccctg cacgcgtggt gcgaaaacct caaagaaaat tgggaggaag cagttgaact 2880
cgccggtgaa cccactgcac gactctttgg cctgtacatg gcaggttcgg aatggggatt 2940
tgcccacaac atcgtccagc tgcaccaagt actgggtgtg aaactcgatg agcagggaag 3000
tcgcggagaa gttcctgaaa gaatgtggtg gactatctaa cctcaaaata tattttccct 3060
ctatcttctc gttgcgctta atttgactaa ttctcattag cgaggcgcgc ctttccatag 3120
gctccgcccc cctgacgagc atcacaaaaa tcgacgctca agtcagaggt ggcgaaaccc 3180
gacaggacta taaagatacc aggcgtttcc ccctggaagc tccctcgtgc gctctcctgt 3240
tccgaccctg ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa gcgtggcgct 3300
ttctcatagc tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct ccaagctggg 3360
ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc ttatccggta actatcgtct 3420
tgagtccaac ccggtaagac acgacttatc gccactggca gcagccactg gtaacaggat 3480
tagcagagcg aggtatgtag gcggtgctac agagttcttg aagtggtggc ctaactacgg 3540
ctacactaga agaacagtat ttggtatctg cgctctgctg aagccagtta ccttcggaaa 3600
aagagttggt agctcttgat ccggcaaaca aaccaccgct ggtagcggtg gtttttttgt 3660
ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa gaagatcctt tgatcttttc 3720
tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg tcatgagatt 3780
atcaaaaagg atcttcacct agatcctttt aaattaaaaa tgaagtttta aatcaatcta 3840
aagtatatat gagtaaactt ggtctgacag ttaccaatgc ttaatcagtg aggcacctat 3900
ctcagcgatc tgtctatttc gttcatccat agttgcctga ctccccgtcg tgtagataac 3960
tacgatacgg gagggcttac catctggccc cagtgctgca atgataccgc gagacccacg 4020
ctcaccggct ccagatttat cagcaataaa ccagccagcc ggaagggccg agcgcagaag 4080
tggtcctgca actttatccg cctccatcca gtctattaat tgttgccggg aagctagagt 4140
aagtagttcg ccagttaata gtttgcgcaa cgttgttgcc attgctacag gcatcgtggt 4200
gtcacgctcg tcgtttggta tggcttcatt cagctccggt tcccaacgat caaggcgagt 4260
tacatgatcc cccatgttgt gcaaaaaagc ggttagctcc ttcggtcctc cgatcgttgt 4320
cagaagtaag ttggccgcag tgttatcact catggttatg gcagcactgc ataattctct 4380
tactgtcatg ccatccgtaa gatgcttttc tgtgactggt gagtactcaa ccaagtcatt 4440
ctgagaatag tgtatgcggc gaccgagttg ctcttgcccg gcgtcaatac gggataatac 4500
cgcgccacat agcagaactt taaaagtgct catcattgga aaacgttctt cggggcgaaa 4560
actctcaagg atcttaccgc tgttgagatc cagttcgatg taacccactc gtgcacccaa 4620
ctgatcttca gcatctttta ctttcaccag cgtttctggg tgagcaaaaa caggaaggca 4680
aaatgccgca aaaaagggaa taagggcgac acggaaatgt tgaatactca tactcttcct 4740
ttttcaatat tattgaagca tttatcaggg ttattgtctc atgagcggat acatatttga 4800
atgtatttag aaaaataaac agcgatcgcg cggccgcggg taataactga tataattaaa 4860
ttgaagctct aatttgtgag tttagtatac atgcatttac ttataataca gttttttagt 4920
tttgctggcc gcatcttctc aaatatgctt cccagcctgc ttttctgtaa cgttcaccct 4980
ctaccttagc atcccttccc tttgcaaata gtcctcttcc aacaataata atgtcagatc 5040
ctgtagagac cacatcatcc acggttctat actgttgacc caatgcgtct cccttgtcat 5100
ctaaacccac accgggtgtc ataatcaacc aatcgtaacc ttcatctctt ccacccatgt 5160
ctctttgagc aataaagccg ataacaaaat ctttgtcgct cttcgcaatg tcaacagtac 5220
ccttagtata ttctccagta gctagggagc ccttgcatga caattctgct aacatcaaaa 5280
ggcctctagg ttcctttgtt acttcttccg ccgcctgctt caaaccgcta acaatacctg 5340
ggcccaccac accgtgtgca ttcgtaatgt ctgcccattc tgctattctg tatacacccg 5400
cagagtactg caatttgact gtattaccaa tgtcagcaaa ttttctgtct tcgaagagta 5460
aaaaattgta cttggcggat aatgccttta gcggcttaac tgtgccctcc atggaaaaat 5520
cagtcaagat atccacatgt gtttttagta aacaaatttt gggacctaat gcttcaacta 5580
actccagtaa ttccttggtg gtacgaacat ccaatgaagc acacaagttt gtttgctttt 5640
cgtgcatgat attaaatagc ttggcagcaa caggactagg atgagtagca gcacgttcct 5700
tatatgtagc tttcgacatg atttatcttc gtttcctgca ggtttttgtt ctgtgcagtt 5760
gggttaagaa tactgggcaa tttcatgttt cttcaacacc acatatgcgt atatatacca 5820
atctaagtct gtgctccttc cttcgttctt ccttctgctc ggagattacc gaatcaaagc 5880
tagcttatcg atgataagct gtcaaagatg agaattaatt ccacggacta tagactatac 5940
tagatactcc gtctactgta cgatacactt ccgctcaggt ccttgtcctt taacgaggcc 6000
ttaccactct tttgttactc tattgatcca gctcagcaaa ggcagtgtga tctaagattc 6060
tatcttcgcg atgtagtaaa actagctaga ccgagaaaga gactagaaat gcaaaaggca 6120
cttctacaat ggctgccatc attattatcc gatgtgacgc tgcagcttct caatgatatt 6180
cgaatacgct ttgaggagat acagcctaat atccgacaaa ctgttttaca gatttacgat 6240
cgtacttgtt acccatcatt gaattttgaa catccgaacc tgggagtttt ccctgaaaca 6300
gatagtatat ttgaacctgt ataataatat atagtctagc gctttacgga agacaatgta 6360
tgtatttcgg ttcctggaga aactattgca tctattgcat aggtaatctt gcacgtcgca 6420
tccccggttc attttctgcg tttccatctt gcacttcaat agcatatctt tgttaacgaa 6480
gcatctgtgc ttcattttgt agaacaaaaa tgcaacgcga gagcgctaat ttttcaaaca 6540
aagaatctga gctgcatttt tacagaacag aaatgcaacg cgaaagcgct attttaccaa 6600
cgaagaatct gtgcttcatt tttgtaaaac aaaaatgcaa cgcgacgaga gcgctaattt 6660
ttcaaacaaa gaatctgagc tgcattttta cagaacagaa atgcaacgcg agagcgctat 6720
tttaccaaca aagaatctat acttcttttt tgttctacaa aaatgcatcc cgagagcgct 6780
atttttctaa caaagcatct tagattactt tttttctcct ttgtgcgctc tataatgcag 6840
tctcttgata actttttgca ctgtaggtcc gttaaggtta gaagaaggct actttggtgt 6900
ctattttctc ttccataaaa aaagcctgac tccacttccc gcgtttactg attactagcg 6960
aagctgcggg tgcatttttt caagataaag gcatccccga ttatattcta taccgatgtg 7020
gattgcgcat actttgtgaa cagaaagtga tagcgttgat gattcttcat tggtcagaaa 7080
attatgaacg gtttcttcta ttttgtctct atatactacg tataggaaat gtttacattt 7140
tcgtattgtt ttcgattcac tctatgaata gttcttacta caattttttt gtctaaagag 7200
taatactaga gataaacata aaaaatgtag aggtcgagtt tagatgcaag ttcaaggagc 7260
gaaaggtgga tgggtaggtt atatagggat atagcacaga gatatatagc aaagagatac 7320
ttttgagcaa t 7331
<210> 90
<211> 7126
<212> DNA
<213> 人工序列
<220>
<223> 合成核酸
<400> 90
gtttgtggaa gcggtattcg caatttaatt aaagctggtg acaattaatc atcggctcgt 60
ataatgtgtg gaattgaatc gatataagga ggttaatcat gtgtccgctc ctgcgaccga 120
tgcacgaacc gcccacgccg acggcgtgga gcgattgctc gagagttatc gggcggtgcc 180
ggcggccgca tcggtgcggc tcgccaagcg cacctcgaac ctcttccggt cccgagcggc 240
gacggatgcc cctggcctcg acacctccgg cctgacccac gtcatcgcgg tcgaccccgg 300
ggcgcgcacg gccgacgtcg ccggcatgtg cacctacgac gacctcgtcg ccgcgacact 360
gccgcatggg ctcgcgccac tcgtggtgcc gcaactgaag accatcaccc tcgggggcgc 420
cgtaacggga ctcggcatcg agtcgacgtc gttccgcaac ggtctgccgc acgagtcggt 480
gctcgagatc gacgtgctca ccggcgcagg cgagatcatc acggcgtcgc cgatcgagca 540
cgcagagctg ttccgcgcct tccccaactc gtacggcacc ctcggctacg ccgtgcgcct 600
gcgcatcgag ctcgagccgg tcgagccgtt cgtcgcactc acgcaccttc ggttccatgc 660
gctcaccgac ctcatcgagg caatggagcg catcatcgag accggtcgac tcgacggggt 720
tgccgtcgat tccctcgacg gcgtggtgtt cagcgctgaa gagagctacc tgtgcgtcgg 780
cacgcagacc gcggcatccg gcccggtcag cgactacacc cgccagcaga tcttctatcg 840
ctccatccag catgacgacg gtgcgaagca cgaccggctc accatgcacg actacctgtg 900
gcgctgggac gccgactggt tctggtgctc gcaggcgttc ggcgcgcagc atccgctgat 960
tcgccggttc tggccgcggc gataccggcg cagccgctcg tactcgacgc tcatgcgcct 1020
cgaacggcga ttcgacctcg gcgatcgcct cgagaagctc aagggccggc cggcgcgcga 1080
acgcgtgatc caagacgtcg aggtgccgat cgggcgcacc gtcggcttcc tcgaatggtt 1140
cctcgcgaac gtgccgatcg agccgatctg gttgtgcccg ctgcgcctgc ggggcgaccg 1200
cggctggcct ctctacccga tccggccgca gcagacctac gtcaacatcg gcttctggtc 1260
gacggttccg gtgggcggct ccgagggcga gacgaaccgc tcgatcgagc gcgccgtgag 1320
cgagttcgac ggacacaagt cgctgtactc cgactcgtac tactcgcgcg aggagttcga 1380
ggagctctac ggcggcgagg cgtaccgggc cgtgaagcgg cgatacgacc ccgactctcg 1440
actgctcgac ctctatgcga aggcggtgca acggcgatga ccacgaccaa acgccaggcg 1500
acagcggggc aggctgagac cgcgccgacg acggatgcgg cggccgcacc cgactcgtcg 1560
gcgaagctca ccctcgccga gatcctcgag atcgtcgtcg ccggtcggct gccgctgagg 1620
ttcaccgcct acgacgggag ctcggcgggg ccgcctgacg ccctgttcgg cctcgacctg 1680
aagactccgc gaggaacgac ctatctcgcc accggccgcg gcgatctcgg cctcgcccgc 1740
gcctacatcg cgggcgacct cgagatacag ggggtgcacc ccggagaccc ctacgagctg 1800
ctcaaggcac tcgccgacag cctggtcttc aagctgccac cgccgcgggt gatgacccag 1860
atcatccgtt cgatcggcgt cgaacatctg cggccgatcg cgccgccgcc gcaagaggtg 1920
ccgccccggt ggcgccgcat cgccgagggg ctccgacaca gcaagggccg cgacgccgaa 1980
gcgatccacc accactacga cgtgtcgaac accttctacg aatgggtgct cgggccgtcg 2040
atgacctaca cgtgcgcgtg ctacccgggc ctcgacgcat ccctcgacga ggcgcagcag 2100
aacaagtacc ggctcgtgtt cgagaagctg cggctgaagc cgggcgaccg actgctcgac 2160
gtcggctgcg ggtggggcgg catggtgcgc tacgccgcgc gccacggcgt gcaggcgttg 2220
ggcgtgaccc tgtcgcgaga gcagacggcg tgggcgcagc aggcgatcgc cgtcgagggc 2280
ctcgccgacc tcgccgaggt gcgctacggc gactaccgcg acatcgccga agacggcttc 2340
gatgcggtgt catcgatcgg gctgctcgag cacatcggcg tgcgcaacta cgcttcgtat 2400
ttcggctttc tgcagtcgcg cttgcggccc gggggactct tgctcaacca ctgcatcacc 2460
cggcccgaca atcgctccga gccgtcggcg cgcggcttca tcgaccggta cgtgttcccc 2520
gacggagagc tcaccggctc gggccgcatc atcaccgagg cgcaggatgt cggcttcgaa 2580
gtgctgcacg aagagaacct gcgtcagcat tatgcactga cactgcgcga ttggtgcgcc 2640
aacctcgtcg cgcactggga agaggcggtc gccgaggtcg ggctgccgac cgcgaaggtg 2700
tggggcctct acatggccgg gtcacggctc gcgttcgaga gcggcggcat ccagttgcac 2760
caggtgctgg cggtcagacc agacgatcgc agcgacgccg cccagctgcc gctgcggccg 2820
tggtggacgc catagcctca aaatatattt tccctctatc ttctcgttgc gcttaatttg 2880
actaattctc attagcgagg cgcgcctttc cataggctcc gcccccctga cgagcatcac 2940
aaaaatcgac gctcaagtca gaggtggcga aacccgacag gactataaag ataccaggcg 3000
tttccccctg gaagctccct cgtgcgctct cctgttccga ccctgccgct taccggatac 3060
ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc atagctcacg ctgtaggtat 3120
ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag 3180
cccgaccgct gcgccttatc cggtaactat cgtcttgagt ccaacccggt aagacacgac 3240
ttatcgccac tggcagcagc cactggtaac aggattagca gagcgaggta tgtaggcggt 3300
gctacagagt tcttgaagtg gtggcctaac tacggctaca ctagaagaac agtatttggt 3360
atctgcgctc tgctgaagcc agttaccttc ggaaaaagag ttggtagctc ttgatccggc 3420
aaacaaacca ccgctggtag cggtggtttt tttgtttgca agcagcagat tacgcgcaga 3480
aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg ggtctgacgc tcagtggaac 3540
gaaaactcac gttaagggat tttggtcatg agattatcaa aaaggatctt cacctagatc 3600
cttttaaatt aaaaatgaag ttttaaatca atctaaagta tatatgagta aacttggtct 3660
gacagttacc aatgcttaat cagtgaggca cctatctcag cgatctgtct atttcgttca 3720
tccatagttg cctgactccc cgtcgtgtag ataactacga tacgggaggg cttaccatct 3780
ggccccagtg ctgcaatgat accgcgagac ccacgctcac cggctccaga tttatcagca 3840
ataaaccagc cagccggaag ggccgagcgc agaagtggtc ctgcaacttt atccgcctcc 3900
atccagtcta ttaattgttg ccgggaagct agagtaagta gttcgccagt taatagtttg 3960
cgcaacgttg ttgccattgc tacaggcatc gtggtgtcac gctcgtcgtt tggtatggct 4020
tcattcagct ccggttccca acgatcaagg cgagttacat gatcccccat gttgtgcaaa 4080
aaagcggtta gctccttcgg tcctccgatc gttgtcagaa gtaagttggc cgcagtgtta 4140
tcactcatgg ttatggcagc actgcataat tctcttactg tcatgccatc cgtaagatgc 4200
ttttctgtga ctggtgagta ctcaaccaag tcattctgag aatagtgtat gcggcgaccg 4260
agttgctctt gcccggcgtc aatacgggat aataccgcgc cacatagcag aactttaaaa 4320
gtgctcatca ttggaaaacg ttcttcgggg cgaaaactct caaggatctt accgctgttg 4380
agatccagtt cgatgtaacc cactcgtgca cccaactgat cttcagcatc ttttactttc 4440
accagcgttt ctgggtgagc aaaaacagga aggcaaaatg ccgcaaaaaa gggaataagg 4500
gcgacacgga aatgttgaat actcatactc ttcctttttc aatattattg aagcatttat 4560
cagggttatt gtctcatgag cggatacata tttgaatgta tttagaaaaa taaacagcga 4620
tcgcgcggcc gcgggtaata actgatataa ttaaattgaa gctctaattt gtgagtttag 4680
tatacatgca tttacttata atacagtttt ttagttttgc tggccgcatc ttctcaaata 4740
tgcttcccag cctgcttttc tgtaacgttc accctctacc ttagcatccc ttccctttgc 4800
aaatagtcct cttccaacaa taataatgtc agatcctgta gagaccacat catccacggt 4860
tctatactgt tgacccaatg cgtctccctt gtcatctaaa cccacaccgg gtgtcataat 4920
caaccaatcg taaccttcat ctcttccacc catgtctctt tgagcaataa agccgataac 4980
aaaatctttg tcgctcttcg caatgtcaac agtaccctta gtatattctc cagtagctag 5040
ggagcccttg catgacaatt ctgctaacat caaaaggcct ctaggttcct ttgttacttc 5100
ttccgccgcc tgcttcaaac cgctaacaat acctgggccc accacaccgt gtgcattcgt 5160
aatgtctgcc cattctgcta ttctgtatac acccgcagag tactgcaatt tgactgtatt 5220
accaatgtca gcaaattttc tgtcttcgaa gagtaaaaaa ttgtacttgg cggataatgc 5280
ctttagcggc ttaactgtgc cctccatgga aaaatcagtc aagatatcca catgtgtttt 5340
tagtaaacaa attttgggac ctaatgcttc aactaactcc agtaattcct tggtggtacg 5400
aacatccaat gaagcacaca agtttgtttg cttttcgtgc atgatattaa atagcttggc 5460
agcaacagga ctaggatgag tagcagcacg ttccttatat gtagctttcg acatgattta 5520
tcttcgtttc ctgcaggttt ttgttctgtg cagttgggtt aagaatactg ggcaatttca 5580
tgtttcttca acaccacata tgcgtatata taccaatcta agtctgtgct ccttccttcg 5640
ttcttccttc tgctcggaga ttaccgaatc aaagctagct tatcgatgat aagctgtcaa 5700
agatgagaat taattccacg gactatagac tatactagat actccgtcta ctgtacgata 5760
cacttccgct caggtccttg tcctttaacg aggccttacc actcttttgt tactctattg 5820
atccagctca gcaaaggcag tgtgatctaa gattctatct tcgcgatgta gtaaaactag 5880
ctagaccgag aaagagacta gaaatgcaaa aggcacttct acaatggctg ccatcattat 5940
tatccgatgt gacgctgcag cttctcaatg atattcgaat acgctttgag gagatacagc 6000
ctaatatccg acaaactgtt ttacagattt acgatcgtac ttgttaccca tcattgaatt 6060
ttgaacatcc gaacctggga gttttccctg aaacagatag tatatttgaa cctgtataat 6120
aatatatagt ctagcgcttt acggaagaca atgtatgtat ttcggttcct ggagaaacta 6180
ttgcatctat tgcataggta atcttgcacg tcgcatcccc ggttcatttt ctgcgtttcc 6240
atcttgcact tcaatagcat atctttgtta acgaagcatc tgtgcttcat tttgtagaac 6300
aaaaatgcaa cgcgagagcg ctaatttttc aaacaaagaa tctgagctgc atttttacag 6360
aacagaaatg caacgcgaaa gcgctatttt accaacgaag aatctgtgct tcatttttgt 6420
aaaacaaaaa tgcaacgcga cgagagcgct aatttttcaa acaaagaatc tgagctgcat 6480
ttttacagaa cagaaatgca acgcgagagc gctattttac caacaaagaa tctatacttc 6540
ttttttgttc tacaaaaatg catcccgaga gcgctatttt tctaacaaag catcttagat 6600
tacttttttt ctcctttgtg cgctctataa tgcagtctct tgataacttt ttgcactgta 6660
ggtccgttaa ggttagaaga aggctacttt ggtgtctatt ttctcttcca taaaaaaagc 6720
ctgactccac ttcccgcgtt tactgattac tagcgaagct gcgggtgcat tttttcaaga 6780
taaaggcatc cccgattata ttctataccg atgtggattg cgcatacttt gtgaacagaa 6840
agtgatagcg ttgatgattc ttcattggtc agaaaattat gaacggtttc ttctattttg 6900
tctctatata ctacgtatag gaaatgttta cattttcgta ttgttttcga ttcactctat 6960
gaatagttct tactacaatt tttttgtcta aagagtaata ctagagataa acataaaaaa 7020
tgtagaggtc gagtttagat gcaagttcaa ggagcgaaag gtggatgggt aggttatata 7080
gggatatagc acagagatat atagcaaaga gatacttttg agcaat 7126
<210> 91
<211> 7505
<212> DNA
<213> 人工序列
<220>
<223> 合成核酸
<400> 91
gtttgtggaa gcggtattcg caatttaatt aaagctggtg acaattaatc atcggctcgt 60
ataatgtgtg gaattgaatc gatataagga ggttaatcat gtgtctgttg ccgtaaccga 120
cgcacgatcc gcctacgccc acggcgtgca gcggctggtc gcgagttacc gcgccatccc 180
cgccggcgcc accgtccgcc tggccaaacc cacgtccaac ctgttccgcg ccagggcgaa 240
gagcaccgcg gcgggcctcg acacctccgg cctgacacat gtgatcgccg tggaccccga 300
gacgcgcacc gccgaggtcg cggggatgtg cacctacgag gacctggtgg cggcgacgct 360
gccccacggg ctttcaccgc tggtggtccc gcaactcaag acgatcaccc tcggcggcgc 420
cgtcaccggg ctcggcatcg agtcggcgtc gttccgcaac ggccttccgc acgaatcggt 480
cctggagatg gacatcctca ccgggaccgg cgacatcgtg cgcgccgcgc ccgacgagaa 540
tcccgacctt ttccgcacct tcccgaattc ttatggaacg ctgggttact cggttcggct 600
gaagatcgag ctggagccgg tgaagccgtt cgtggcgtta cgccatctcc gcttccactc 660
actgtcgaca ctcatcgcga cgatggaccg catcgtcgac accgggagtc tcgacggtga 720
gcaggtcgac tatctcgacg gagtggtgtt cagcgccgag gagagctacc tgtgcgtcgg 780
aacacgttcc gcgacaccgg gtcctgtcag cgactacacc ggcgagcaca tcttctaccg 840
gtcgatccag cacgattgcc cgaccgaagg cggacagaag cacgaccggc tgacggcgca 900
cgactacttc tggcgctggg acaccgactg gttctggtgc tcaagggcat tcggcgcgca 960
gaacccgaag gtccgtcggt ggtggccccg acggctccgg cgcagcagct tctactggaa 1020
gctcgtcggc tacgaccagc gtttcggcat cgccgaccgg atcgagaaac accacggccg 1080
gccaccgcgc gaacgcgtcg tccaggacgt cgaggtcccc atcgagcgca ccgtcgaatt 1140
cctgcagtgg ttcctcgaca cgatcccgat agagccgctc tggttgtgcc cgttgcgact 1200
tcgcgatgac aacagctggt cgctgtaccc gctccggccc catcgcacgt atgtcaacgt 1260
gggattctgg tcgtcggtgc ccgtcgggcc ggaggagggt cacaccaaca agctgatcga 1320
acgcaggatc agcgagctgg agggacacaa gtcgctgtac tccgacgcct tctattcggc 1380
cgacgagttc gacgcgctgt acggcggcga gatctaccgg accgtgaaga agacctacga 1440
cccagattct cgtttcctcg acctctatgc gaaggcggtg cgacggcaat gacgactttt 1500
cgggaacata ccgacagttc ggcgtccgac ccggatcgga aactcacttt ggcagaggtg 1560
ttggagatct tcgccgcggg tcgccgtccg ctgaagttca ccgcctatga cggaagtagt 1620
tgcgggcctg aggatgcgac actgggcctc gacctgctga ccccgcgggg cacgacctac 1680
ctggccacgg cgccgggtga tctcggcctg gcgcgggcct acatcgccgg cgatctgcgc 1740
ctcagtggtg tgcatcccgg cgatccccat gacctgctca cggcgctgac ggaacgcctg 1800
gagtacaggc gtccgccggt gcgagtgctg gccaatgttc tgcgctccat cgggatcgag 1860
cacctcaagc ccgtcgcgcc gccaccccag gagcacctgc cgcggtggcg gcggatcgca 1920
gaggggttgc ggcacagcaa gacccgtgac gctgaggcca tccagcacca ctacgacgtc 1980
tcgaacacgt tctactcatg ggtcctgggt ccgtcgatga cctacacctg cgcctgctat 2040
ccacacccgg atgccacgct ggaggaggcg caggagaaca agtaccggct ggtgttcgag 2100
aagcttcgac tcaagcccgg tgaccggctg ctcgacgtcg gttgcggctg gggcggaatg 2160
gtccgctacg ccgcccggca cggggtcaag gtcctggggg tgacgctgtc gaaggagcag 2220
gcgcagtggg cggccgacgc agtcgagcgg gacggcctgg gtgagttggc cgaggtccgc 2280
cacggcgact accgcgacgt gcgcgagtcg cacttcgacg cagtgtcctc gctcgggctc 2340
accgagcaca tcggcgtcgc gaactacccg tcgtacttcc gcttcctgaa gtcgaaactg 2400
cggccgggtg gcctgctgct caaccactgc atcacccgaa acaacaaccg gagtcacgcc 2460
accgcaggcg gattcatcga tcgctatgtc tttcccgacg gggagctgac ggggtcgggg 2520
cgaatcatca ccgaaatgca ggacgtcgga ctcgaggtcg tgcacgagga gaatctgcgt 2580
caccactacg cgctgacgct gcgcgactgg agccgcaacc tggtcgcgca ctgggacgac 2640
gcggtgaccg aggtcggtct gccgactgcc aaggtgtggg gcctctacat cgccgcgtcg 2700
cgagtcggct tcgagcagaa cgccattcag ctgcaccagg tgctgtcggt caagctcgac 2760
gagcgtggct cggacggcgg actgccgtta cgaccctggt ggaacgccta gccactatgc 2820
tctgcccatg atccggttcc tgctgcgcat cgcggtcttt ctgggctcat cagcgatcgg 2880
gctcctcgtc gccggatggc tggtgcccgg ggtgtcgctg tcggtgtggg gcttcgtcac 2940
ggcagtggtg atcttcaccg tggcgcaggc gatcctgtcc ccgttcttcc tcaagatggc 3000
cagccgctac gcctcggcgt tcctcggcgg gatcggtctg gtgtcgacgt ttgccgcgct 3060
gctgctcgtc tcgctgctgt ccaacggtct gagcatccgc ggcatcggat cctggatcgc 3120
cgcaaccgtg gtggtctggt tggtgaccgc cctggcgacg ctggtgctgc cgatgttggt 3180
gctgcgcgag aagaaaaccg cgtcgcgcgt ctgacctcaa aatatatttt ccctctatct 3240
tctcgttgcg cttaatttga ctaattctca ttagcgaggc gcgcctttcc ataggctccg 3300
cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg 3360
actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac 3420
cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca 3480
tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt 3540
gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc 3600
caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag 3660
agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac 3720
tagaagaaca gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt 3780
tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa 3840
gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg 3900
gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa 3960
aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat 4020
atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc 4080
gatctgtcta tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat 4140
acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc 4200
ggctccagat ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc 4260
tgcaacttta tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag 4320
ttcgccagtt aatagtttgc gcaacgttgt tgccattgct acaggcatcg tggtgtcacg 4380
ctcgtcgttt ggtatggctt cattcagctc cggttcccaa cgatcaaggc gagttacatg 4440
atcccccatg ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg ttgtcagaag 4500
taagttggcc gcagtgttat cactcatggt tatggcagca ctgcataatt ctcttactgt 4560
catgccatcc gtaagatgct tttctgtgac tggtgagtac tcaaccaagt cattctgaga 4620
atagtgtatg cggcgaccga gttgctcttg cccggcgtca atacgggata ataccgcgcc 4680
acatagcaga actttaaaag tgctcatcat tggaaaacgt tcttcggggc gaaaactctc 4740
aaggatctta ccgctgttga gatccagttc gatgtaaccc actcgtgcac ccaactgatc 4800
ttcagcatct tttactttca ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc 4860
cgcaaaaaag ggaataaggg cgacacggaa atgttgaata ctcatactct tcctttttca 4920
atattattga agcatttatc agggttattg tctcatgagc ggatacatat ttgaatgtat 4980
ttagaaaaat aaacagcgat cgcgcggccg cgggtaataa ctgatataat taaattgaag 5040
ctctaatttg tgagtttagt atacatgcat ttacttataa tacagttttt tagttttgct 5100
ggccgcatct tctcaaatat gcttcccagc ctgcttttct gtaacgttca ccctctacct 5160
tagcatccct tccctttgca aatagtcctc ttccaacaat aataatgtca gatcctgtag 5220
agaccacatc atccacggtt ctatactgtt gacccaatgc gtctcccttg tcatctaaac 5280
ccacaccggg tgtcataatc aaccaatcgt aaccttcatc tcttccaccc atgtctcttt 5340
gagcaataaa gccgataaca aaatctttgt cgctcttcgc aatgtcaaca gtacccttag 5400
tatattctcc agtagctagg gagcccttgc atgacaattc tgctaacatc aaaaggcctc 5460
taggttcctt tgttacttct tccgccgcct gcttcaaacc gctaacaata cctgggccca 5520
ccacaccgtg tgcattcgta atgtctgccc attctgctat tctgtataca cccgcagagt 5580
actgcaattt gactgtatta ccaatgtcag caaattttct gtcttcgaag agtaaaaaat 5640
tgtacttggc ggataatgcc tttagcggct taactgtgcc ctccatggaa aaatcagtca 5700
agatatccac atgtgttttt agtaaacaaa ttttgggacc taatgcttca actaactcca 5760
gtaattcctt ggtggtacga acatccaatg aagcacacaa gtttgtttgc ttttcgtgca 5820
tgatattaaa tagcttggca gcaacaggac taggatgagt agcagcacgt tccttatatg 5880
tagctttcga catgatttat cttcgtttcc tgcaggtttt tgttctgtgc agttgggtta 5940
agaatactgg gcaatttcat gtttcttcaa caccacatat gcgtatatat accaatctaa 6000
gtctgtgctc cttccttcgt tcttccttct gctcggagat taccgaatca aagctagctt 6060
atcgatgata agctgtcaaa gatgagaatt aattccacgg actatagact atactagata 6120
ctccgtctac tgtacgatac acttccgctc aggtccttgt cctttaacga ggccttacca 6180
ctcttttgtt actctattga tccagctcag caaaggcagt gtgatctaag attctatctt 6240
cgcgatgtag taaaactagc tagaccgaga aagagactag aaatgcaaaa ggcacttcta 6300
caatggctgc catcattatt atccgatgtg acgctgcagc ttctcaatga tattcgaata 6360
cgctttgagg agatacagcc taatatccga caaactgttt tacagattta cgatcgtact 6420
tgttacccat cattgaattt tgaacatccg aacctgggag ttttccctga aacagatagt 6480
atatttgaac ctgtataata atatatagtc tagcgcttta cggaagacaa tgtatgtatt 6540
tcggttcctg gagaaactat tgcatctatt gcataggtaa tcttgcacgt cgcatccccg 6600
gttcattttc tgcgtttcca tcttgcactt caatagcata tctttgttaa cgaagcatct 6660
gtgcttcatt ttgtagaaca aaaatgcaac gcgagagcgc taatttttca aacaaagaat 6720
ctgagctgca tttttacaga acagaaatgc aacgcgaaag cgctatttta ccaacgaaga 6780
atctgtgctt catttttgta aaacaaaaat gcaacgcgac gagagcgcta atttttcaaa 6840
caaagaatct gagctgcatt tttacagaac agaaatgcaa cgcgagagcg ctattttacc 6900
aacaaagaat ctatacttct tttttgttct acaaaaatgc atcccgagag cgctattttt 6960
ctaacaaagc atcttagatt actttttttc tcctttgtgc gctctataat gcagtctctt 7020
gataactttt tgcactgtag gtccgttaag gttagaagaa ggctactttg gtgtctattt 7080
tctcttccat aaaaaaagcc tgactccact tcccgcgttt actgattact agcgaagctg 7140
cgggtgcatt ttttcaagat aaaggcatcc ccgattatat tctataccga tgtggattgc 7200
gcatactttg tgaacagaaa gtgatagcgt tgatgattct tcattggtca gaaaattatg 7260
aacggtttct tctattttgt ctctatatac tacgtatagg aaatgtttac attttcgtat 7320
tgttttcgat tcactctatg aatagttctt actacaattt ttttgtctaa agagtaatac 7380
tagagataaa cataaaaaat gtagaggtcg agtttagatg caagttcaag gagcgaaagg 7440
tggatgggta ggttatatag ggatatagca cagagatata tagcaaagag atacttttga 7500
gcaat 7505
<210> 92
<211> 7123
<212> DNA
<213> 人工序列
<220>
<223> 合成核酸
<400> 92
gtttgtggaa gcggtattcg caatttaatt aaagctggtg acaattaatc atcggctcgt 60
ataatgtgtg gaattgaatc gatataagga ggttaatcat atgcacgggc tgttgtcgaa 120
gactagggta tatgtggtgc ctgtccttgg atctgcactc tcggcccaca agtcgggcgt 180
tgaccggctg ctggcaagct atcgatccat tcccgcaacg tccgcggtcc ggctggccaa 240
accgacgtca aacctgttcc gcgcccgcac caaacgtgac gcgcccggct tggacacctc 300
ggggctgacc ggcgtcctga gcgtggatcc cgaaacccgc accgcggacg tcgccggcat 360
gtgcacctac gcggacctgg tggccgcaac gctgccctac ggcctgtcgc cgctggtcgt 420
cccgcagctg aagaccatca ccctcggcgg ggcggtcagc ggcctgggga tcgagtcggc 480
gtcgtttcgc aacgggctgc cgcacgaatc ggtgctggag atggatatcc tcaccggcgc 540
tggcgatttg ctcaccgcat cacgtaccca gcacccggac ctgttccgcg ccttcccgaa 600
ttcctatggg acactggggt attcgacccg gcttcggatc gagctggaac ccgtcgcacc 660
gttcgtcgcg ctgcgccaca tccgcttccg ctcgctgccc gcgctgatcg ccgcggccga 720
acgcatcgtc gacaccggcg ggcagggcgg aaccccggtc gactacctcg acggggtggt 780
cttcagcgcc gacgaaagct acctgtgcgt gggccggcgg accaccaccc ccggcccggt 840
cagcgactac accggcaagg acatctacta ccagtccatc cggcacgacg ccccgggcct 900
ggaggcgacc aaggatgacc ggctgaccat gcacgactac ttctggcgct gggacaccga 960
ttggttctgg tgctcgcgcg cgttcggcgt gcaggacccg cgggtgcgac gcttctggcc 1020
gcgccgttat cggcgcagca gcttctactg gaagctgatt tccctggacc ggcgcttcgg 1080
gatctccgac cgcatcgagg cgcgcaacgg gcggccccca cgcgaacggg tggtgcaaga 1140
catcgagatt ccaatcgaac ggacctgcga cttcctggag tggttcctgg acaacgtgcc 1200
aatcacgccg atctggttgt gcccgttgcg ccttcgcgac cgcgacggct ggccgttgta 1260
cccgatgcgg ccggatcaca cgtacgtcaa cgtcggcttc tggtcgtcgg tgccgggggg 1320
cgcgaccgag ggcgccgcca accggatgat cgaagaaaag gtgagcgaac tcgacgggca 1380
caagtccctg tactccgatt ccttctactc ccgcgaggac ttcgacgagc tgtacggcgg 1440
cgagacctac aacaccgtca agaaaaccta cgaccccgat tctcgtttac tcgacctcta 1500
cgcaaaggcg gtgcaacggc gatgacgact accaaggaac cccaccgcac gtcgcacggg 1560
aaactgagca tggccgagat cctggaggtc ttcgccgcca ccggccgaca tccgctgaag 1620
ttcaccgcct acgacggcag catcgccggc aacgaggacg ccgaactggg cctggacctt 1680
cgcagccccc gcggcgccac ctatctggcg accgcccccg gcgaactcgg cctcgcccgc 1740
gcctacgtgt cgggcgacct gcaggcctac ggcgtccatc ccggcgaccc gtaccaactg 1800
ctcaagacgc tcaccgatcg ggtggaattc aagcggcccc cggtgcgggt gctggccaac 1860
gtcgtgcggt cgctggggtt cgagcggttg ctgccggtcg cgccgccccc gcaggaggcg 1920
ctgccccggt ggcggcgcat cgccgacggg ctgatgcaca cgaggacccg cgacgccgag 1980
gccatccacc accactacga cgtgtccaac accttctacg aattggtgtt ggggccgtcg 2040
atgacctaca cctgcgcggt gtatcccgat gccgacgcga cactcgaaca ggcgcaggag 2100
aacaagtacc ggctgatctt cgagaagctg cggctgaagg cgggcgaccg gctgctcgac 2160
gtcggctgcg gctggggcgg catggtgcgc tacgcggccc ggcgcggcgt ccgggccacc 2220
ggcgccaccc tgtcggccga acaggcgaag tgggcgcaga aggcgatcgc cgaggaaggc 2280
cttgcggacc tggccgaggt gcgccacacc gactatcggg acgtgggcga ggcggcgttc 2340
gacgccgtgt cctcgatcgg gctgaccgag cacatcggcg tcaagaatta ccccgcctac 2400
ttcggcttct tgaagtcgaa gctgcgcacc ggcggcctgc tgctcaatca ctgcatcacc 2460
cgccacgaca acacgtcgac gtcgttcgcg ggcggattca ccgatcgcta tgtcttcccg 2520
gacggggagc tgaccggctc gggccgcatc acctgcgacg tccaggactg cggcttcgag 2580
gtgctgcacg cggagaactt ccgccaccac tacgcgatga cgctgcgcga ctggtgccgc 2640
aatctggtcg agaactggga cgccgcggtc agcgaggtcg gcctaccgac cgcgaaggtc 2700
tggggcctgt acatggcggc gtcacgggtt gcgttcgagc agaacaacct tcagctgcat 2760
cacgtgctgg cggccaagac cgacgcgcgg ggcgacgacg acctgccgct gcggccgtgg 2820
tggacggcct gacctcaaaa tatattttcc ctctatcttc tcgttgcgct taatttgact 2880
aattctcatt agcgaggcgc gcctttccat aggctccgcc cccctgacga gcatcacaaa 2940
aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt 3000
ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg 3060
tccgcctttc tcccttcggg aagcgtggcg ctttctcata gctcacgctg taggtatctc 3120
agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc 3180
gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta 3240
tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct 3300
acagagttct tgaagtggtg gcctaactac ggctacacta gaagaacagt atttggtatc 3360
tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa 3420
caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa 3480
aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa 3540
aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac ctagatcctt 3600
ttaaattaaa aatgaagttt taaatcaatc taaagtatat atgagtaaac ttggtctgac 3660
agttaccaat gcttaatcag tgaggcacct atctcagcga tctgtctatt tcgttcatcc 3720
atagttgcct gactccccgt cgtgtagata actacgatac gggagggctt accatctggc 3780
cccagtgctg caatgatacc gcgagaccca cgctcaccgg ctccagattt atcagcaata 3840
aaccagccag ccggaagggc cgagcgcaga agtggtcctg caactttatc cgcctccatc 3900
cagtctatta attgttgccg ggaagctaga gtaagtagtt cgccagttaa tagtttgcgc 3960
aacgttgttg ccattgctac aggcatcgtg gtgtcacgct cgtcgtttgg tatggcttca 4020
ttcagctccg gttcccaacg atcaaggcga gttacatgat cccccatgtt gtgcaaaaaa 4080
gcggttagct ccttcggtcc tccgatcgtt gtcagaagta agttggccgc agtgttatca 4140
ctcatggtta tggcagcact gcataattct cttactgtca tgccatccgt aagatgcttt 4200
tctgtgactg gtgagtactc aaccaagtca ttctgagaat agtgtatgcg gcgaccgagt 4260
tgctcttgcc cggcgtcaat acgggataat accgcgccac atagcagaac tttaaaagtg 4320
ctcatcattg gaaaacgttc ttcggggcga aaactctcaa ggatcttacc gctgttgaga 4380
tccagttcga tgtaacccac tcgtgcaccc aactgatctt cagcatcttt tactttcacc 4440
agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg aataagggcg 4500
acacggaaat gttgaatact catactcttc ctttttcaat attattgaag catttatcag 4560
ggttattgtc tcatgagcgg atacatattt gaatgtattt agaaaaataa acagcgatcg 4620
cgcggccgcg ggtaataact gatataatta aattgaagct ctaatttgtg agtttagtat 4680
acatgcattt acttataata cagtttttta gttttgctgg ccgcatcttc tcaaatatgc 4740
ttcccagcct gcttttctgt aacgttcacc ctctacctta gcatcccttc cctttgcaaa 4800
tagtcctctt ccaacaataa taatgtcaga tcctgtagag accacatcat ccacggttct 4860
atactgttga cccaatgcgt ctcccttgtc atctaaaccc acaccgggtg tcataatcaa 4920
ccaatcgtaa ccttcatctc ttccacccat gtctctttga gcaataaagc cgataacaaa 4980
atctttgtcg ctcttcgcaa tgtcaacagt acccttagta tattctccag tagctaggga 5040
gcccttgcat gacaattctg ctaacatcaa aaggcctcta ggttcctttg ttacttcttc 5100
cgccgcctgc ttcaaaccgc taacaatacc tgggcccacc acaccgtgtg cattcgtaat 5160
gtctgcccat tctgctattc tgtatacacc cgcagagtac tgcaatttga ctgtattacc 5220
aatgtcagca aattttctgt cttcgaagag taaaaaattg tacttggcgg ataatgcctt 5280
tagcggctta actgtgccct ccatggaaaa atcagtcaag atatccacat gtgtttttag 5340
taaacaaatt ttgggaccta atgcttcaac taactccagt aattccttgg tggtacgaac 5400
atccaatgaa gcacacaagt ttgtttgctt ttcgtgcatg atattaaata gcttggcagc 5460
aacaggacta ggatgagtag cagcacgttc cttatatgta gctttcgaca tgatttatct 5520
tcgtttcctg caggtttttg ttctgtgcag ttgggttaag aatactgggc aatttcatgt 5580
ttcttcaaca ccacatatgc gtatatatac caatctaagt ctgtgctcct tccttcgttc 5640
ttccttctgc tcggagatta ccgaatcaaa gctagcttat cgatgataag ctgtcaaaga 5700
tgagaattaa ttccacggac tatagactat actagatact ccgtctactg tacgatacac 5760
ttccgctcag gtccttgtcc tttaacgagg ccttaccact cttttgttac tctattgatc 5820
cagctcagca aaggcagtgt gatctaagat tctatcttcg cgatgtagta aaactagcta 5880
gaccgagaaa gagactagaa atgcaaaagg cacttctaca atggctgcca tcattattat 5940
ccgatgtgac gctgcagctt ctcaatgata ttcgaatacg ctttgaggag atacagccta 6000
atatccgaca aactgtttta cagatttacg atcgtacttg ttacccatca ttgaattttg 6060
aacatccgaa cctgggagtt ttccctgaaa cagatagtat atttgaacct gtataataat 6120
atatagtcta gcgctttacg gaagacaatg tatgtatttc ggttcctgga gaaactattg 6180
catctattgc ataggtaatc ttgcacgtcg catccccggt tcattttctg cgtttccatc 6240
ttgcacttca atagcatatc tttgttaacg aagcatctgt gcttcatttt gtagaacaaa 6300
aatgcaacgc gagagcgcta atttttcaaa caaagaatct gagctgcatt tttacagaac 6360
agaaatgcaa cgcgaaagcg ctattttacc aacgaagaat ctgtgcttca tttttgtaaa 6420
acaaaaatgc aacgcgacga gagcgctaat ttttcaaaca aagaatctga gctgcatttt 6480
tacagaacag aaatgcaacg cgagagcgct attttaccaa caaagaatct atacttcttt 6540
tttgttctac aaaaatgcat cccgagagcg ctatttttct aacaaagcat cttagattac 6600
tttttttctc ctttgtgcgc tctataatgc agtctcttga taactttttg cactgtaggt 6660
ccgttaaggt tagaagaagg ctactttggt gtctattttc tcttccataa aaaaagcctg 6720
actccacttc ccgcgtttac tgattactag cgaagctgcg ggtgcatttt ttcaagataa 6780
aggcatcccc gattatattc tataccgatg tggattgcgc atactttgtg aacagaaagt 6840
gatagcgttg atgattcttc attggtcaga aaattatgaa cggtttcttc tattttgtct 6900
ctatatacta cgtataggaa atgtttacat tttcgtattg ttttcgattc actctatgaa 6960
tagttcttac tacaattttt ttgtctaaag agtaatacta gagataaaca taaaaaatgt 7020
agaggtcgag tttagatgca agttcaagga gcgaaaggtg gatgggtagg ttatataggg 7080
atatagcaca gagatatata gcaaagagat acttttgagc aat 7123
<210> 93
<211> 9807
<212> DNA
<213> 人工序列
<220>
<223> 合成核酸
<400> 93
ggttatatag ggatatagca cagagatata tagcaaagag atacttttga gcaatgtttg 60
tggaagcggt attcgcaatt taattaacgc ttaccttggc cgttagacat catggtaaat 120
ctgcgcagac agccctgtgc agctgaaacg cggttacgta tagcttgcca tatgtctagc 180
catacgtaac cgcaggtaaa aggcatattt ttcgcgtgtc atggctagta aataacaccg 240
gtgtcattta gagtcaggga aagacaatga aaaacgaaga aagccaccgg gcggcaaccc 300
gatgactttc gcttatcacc cagcacacac ctgggagaaa tcacggtcat gagtttacag 360
actcatgcgc agaatgcgca cactaaaaca cctacccgcg tcgagcgcga ccgtggtgga 420
ctggacaaca ccccagcatc tgccagtgac cgcgaccttt tacgcgatca tctaggccgc 480
gatgtactcc acggttcagt cacacgagac tttaaaaagg cctatcgacg caacgctgac 540
ggcacgaact cgccgcgtat gtatcgcttc gagactgatg ctttaggacg gtgcgagtac 600
gccatgctca ccaccaagca gtacgccgcc gtcctggtcg tagacgttga ccaagtaggt 660
accgcaggcg gtgaccccgc agacttaaac ccgtacgtcc gcgacgtggt gcgctcactg 720
attactcata gcgtcgggcc agcctgggtg ggtattaacc caactaacgg caaagcccag 780
ttcatatggc ttattgaccc tgtctacgct gaccgtaacg gtaaatctgc gcagatgaag 840
cttcttgcag caaccacgcg tgtgctgggt gagcttttag accatgaccc gcacttttcc 900
caccgcttta gccgcaaccc gttctacaca ggcaaagccc ctaccgctta tcgttggtat 960
aggcagcaca accgggtgat gcgccttgga gacttgataa agcaggtaag ggatatggca 1020
ggacacgacc agttcaaccc caccccacgc cagcaattca gctctggccg cgaacttatc 1080
aacgcggtca agacccgccg tgaagaagcc caagcattca aagcactcgc ccaggacgta 1140
gacgcggaaa tcgccggtgg tctcgaccag tatgacccgg aacttatcga cggtgtgcgt 1200
gtgctctgga ttgtccaagg aaccgcagca cgcgacgaaa cagcctttag acatgcgctt 1260
aagactggcc accgcttgcg ccagcaaggc caacgcctga cagacgcagc aatcatcgac 1320
gcctatgagc acgcctacaa cgtcgcacac acccacggcg gtgcaggccg cgacaacgag 1380
atgccaccca tgcgcgaccg ccaaaccatg gcaaggcgcg tgcgcgggta tgtcgcccaa 1440
tccaagagcg agacctacag cggctctaac gcaccaggta aagccaccag cagcgagcgg 1500
aaagccttgg ccacgatggg acgcagaggc ggacaaaaag ccgcacaacg ctggaaaaca 1560
gaccccgagg gcaaatatgc gcaagcacaa aggtcgaagc ttgaaaagac gcaccgtaag 1620
aaaaaggctc aaggacgatc tacgaagtcc cgtattagcc aaatggtgaa cgatcagtat 1680
ttccagacag ggacagttcc cacgtgggct gaaatagggg cagaggtagg agtctctcgc 1740
gccacggttg ctaggcatgt cgcggagcta aagaagagcg gtgactatcc ggacgtttaa 1800
ggggtctcat accgtaagca atatacggtt cccctgccgt taggcagtta gataaaacct 1860
cacttgaaga aaaccttgag gggcagggca gcttatatgc ttcaaagcat gacttcctct 1920
gttctcctag acctcgcaac cctccgccat aacctcaccc tgctctgcga ggctggccgg 1980
ctaccgccgg cgtaacagat gagggcaagc ggatggctga tgaaaccaag ccgcggccgg 2040
gaagccgatc tcggcttgaa cgaattgtta ggtggcggta cttgggtcga tatcaaagtg 2100
catcacttct tcccgtatgc ccaactttgt atagagagcc actgcgggat cgtcaccgta 2160
atctgcttgc acgtagatca cataagcacc aagcgcgttg gcctcatgct tgaggagatt 2220
gatgagcgcg gtggcaatgc cctgcctccg gtgctcgccg gagactgcga gatcatagat 2280
atagatctca ctacgcggct gctcaaactt gggcagaacg taagccgcga gagcgccaac 2340
aaccgcttct tggtcgaagg cagcaagcgc gatgaatgtc ttactacgga gcaagttccc 2400
gaggtaatcg gagtccggct gatgttggga gtaggtggct acgtctccga actcacgacc 2460
gaaaagatca agagcagccc gcatggattt gacttggtca gggccgagcc tacatgtgcg 2520
aatgatgccc atacttgagc cacctaactt tgttttaggg cgactgccct gctgcgtaac 2580
atcgttgctg ctccataaca tcaaacatcg acccacggcg taacgcgctt gctgcttgga 2640
tgcccgaggc atagactgta caaaaaaaca gtcataacaa gccatgaaaa ccgccactgc 2700
gccgttacca ccgctgcgtt cggtcaaggt tctggaccag ttgcgtgagc gcatacgcta 2760
cttgcattac agtttacgaa ccgagtttaa acagctggtg acaattaatc atcggctcgt 2820
ataatgtgtg gaattgaatc gatataagga ggttaatcat gtgtctgtgg ttactactga 2880
cgcacaggct gcccatgccg ccggcgtctc gcgtcttctg gccagctacc gggcgatccc 2940
gcccagcgcg acagtgcgcc ttgcgaaacc gacgtccaac ctgttccgcg cccgcgcccg 3000
caccaatgtg aagggtctcg acgtctcggg cctgaccggt gtgatcggtg tcgacccgga 3060
cgcgcgcacc gccgatgtgg cgggcatgtg cacctacgag gacctggtgg cggccacgct 3120
tccgtacggc cttgccccac tggtggtgcc gcagctcaag accatcacgc tcggtggcgc 3180
ggtcaccggt ctgggcatcg agtccacgtc gttccgcaac ggtctgccgc acgaaagtgt 3240
cctggagatg gacatcttga ccggttcggg cgagatcgtc acggcctcac cggatcagca 3300
ctcggatctg ttccatgcgt tccccaattc atatggaacc cttggttatt ccacccggct 3360
gcgcatcgaa ctggagcccg tgcacccgtt tgtggcgttg cgccacctgc gctttcactc 3420
gatcaccgat ctggtcgcgg cgatggaccg gatcatcgag accggcgggc tggacggtga 3480
acccgtcgac tacctcgacg gcgtggtgtt cagcgcgact gagagttacc tgtgtgttgg 3540
cttcaagacg aaaacgccgg ggccggtcag cgattacaca ggtcagcaga tcttctaccg 3600
gtcgatccag catgacggcg acaccggcgc cgagaaacac gaccggctga ccatccacga 3660
ctacctgtgg cgctgggaca ccgactggtt ctggtgctca cgggcattcg gcgctcagca 3720
tccggtgatc cgcaggttct ggccgcggcg gctgcgccgc agcagcttct actggaagct 3780
ggtggcctac gaccagcggt acgacatcgc cgaccgtatc gagaagcgca acgggcgccc 3840
gccgcgcgag cgggtggtcc aggacgtcga ggtgcccatc gagcggtgcg cggacttcgt 3900
cgagtggttc ctgcagaatg tgccgatcga gccgatctgg ctgtgccccc tacggttgcg 3960
tgacagcgcc gacggcggtg cctcgtggcc cctgtatccg ctgaaggcgc accacaccta 4020
cgtcaacatc ggtttctggt catcagtgcc ggtgggcccc gaggagggcc acaccaaccg 4080
cctcatcgag aaaaaagtcg cggagctgga cgggcacaaa tctttgtact cggacgctta 4140
ttacacacgt gacgaattcg acgagctgta cggcggtgag gtctacaaca ccgtcaagaa 4200
gacgtacgac ccggattcac gtctgctaga cctgtattcg aaggcggtgc aaagacaatg 4260
accacattca aagaacgcga gacgtccaca gcggaccgca agctcaccct ggccgagatc 4320
ctcgagatct tcgccgcggg taaggagccg ctgaagttca ctgcgtacga cggcagctcg 4380
gccggtcccg aggacgccac gatgggtctg gacctcaaga ccccgcgtgg gaccacctat 4440
ctggccacgg cacccggcga tctgggcctg gcccgtgcgt atgtctccgg tgacctggag 4500
ccgcacggcg tgcatcccgg cgatccctac ccgctgctgc gcgccctggc cgaacgcatg 4560
gagttcaagc gcccgcctgc gcgtgtgctg gcgaacatcg tgcgctccat cggcatcgag 4620
cacctcaagc cgatcgcacc gccgccgcag gaggcgctgc cccggtggcg ccgcatcatg 4680
gagggcctgc ggcacagcaa gacccgcgac gccgaggcca tccaccacca ctacgacgtg 4740
tcgaacacgt tctacgagtg ggtgctgggc ccgtcgatga cctacacgtg cgcgtgctac 4800
cccaccgagg acgcgaccct cgaagaggcc caggacaaca agtaccgcct ggtgttcgag 4860
aagctgcgcc tgaagcccgg tgaccggttg ctcgacgtgg gctgcggctg gggcggcatg 4920
gtccgctacg cggcccgcca cggcgtcaag gcgctcggtg tcacgctcag ccgcgaacag 4980
gcgacgtggg cgcagaaggc catcgcccag gaaggtctca ccgatctggc cgaggtgcgt 5040
cacggtgatt accgcgacgt catcgaatcc gggttcgacg cggtgtcctc gatcgggctg 5100
accgagcaca tcggcgtgca caactacccg gcgtacttca acttcctcaa gtcgaagctg 5160
cgcaccggtg gcctgctgct caaccactgc atcacccgcc cggacaaccg gtcggcgcca 5220
tcggccggcg ggttcatcga caggtacgtg ttccccgacg gggagctcac cggctcgggc 5280
cgcatcatca ccgaggccca ggacgtgggc cttgaggtga tccacgagga gaacctacgc 5340
aatcactatg cgatgacgct gcgcgactgg tgccgcaacc tggtcgagca ctgggacgag 5400
gcggtcgaag aggtcgggct gcccaccgcg aaggtgtggg gcctgtacat ggccggctca 5460
cgtctgggct tcgagaccaa tgtggttcag ctgcaccagg ttctggcggt caagcttgac 5520
gatcagggca aggacggcgg actgccgttg cggccctggt ggtccgccta gcctcaaaat 5580
atattttccc tctatcttct cgttgcgctt aatttgacta attctcatta gcgaggcgcg 5640
cctttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg 5700
tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg 5760
cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga 5820
agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc 5880
tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt 5940
aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact 6000
ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg 6060
cctaactacg gctacactag aagaacagta tttggtatct gcgctctgct gaagccagtt 6120
accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt 6180
ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct 6240
ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg 6300
gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt 6360
aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg cttaatcagt 6420
gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg actccccgtc 6480
gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc aatgataccg 6540
cgagacccac gctcaccggc tccagattta tcagcaataa accagccagc cggaagggcc 6600
gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa ttgttgccgg 6660
gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc cattgctaca 6720
ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg ttcccaacga 6780
tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc cttcggtcct 6840
ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat ggcagcactg 6900
cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg tgagtactca 6960
accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata 7020
cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg aaaacgttct 7080
tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat gtaacccact 7140
cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg gtgagcaaaa 7200
acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg ttgaatactc 7260
atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct catgagcgga 7320
tacatatttg aatgtattta gaaaaataaa cagcgatcgc gcggccgcgg gtaataactg 7380
atataattaa attgaagctc taatttgtga gtttagtata catgcattta cttataatac 7440
agttttttag ttttgctggc cgcatcttct caaatatgct tcccagcctg cttttctgta 7500
acgttcaccc tctaccttag catcccttcc ctttgcaaat agtcctcttc caacaataat 7560
aatgtcagat cctgtagaga ccacatcatc cacggttcta tactgttgac ccaatgcgtc 7620
tcccttgtca tctaaaccca caccgggtgt cataatcaac caatcgtaac cttcatctct 7680
tccacccatg tctctttgag caataaagcc gataacaaaa tctttgtcgc tcttcgcaat 7740
gtcaacagta cccttagtat attctccagt agctagggag cccttgcatg acaattctgc 7800
taacatcaaa aggcctctag gttcctttgt tacttcttcc gccgcctgct tcaaaccgct 7860
aacaatacct gggcccacca caccgtgtgc attcgtaatg tctgcccatt ctgctattct 7920
gtatacaccc gcagagtact gcaatttgac tgtattacca atgtcagcaa attttctgtc 7980
ttcgaagagt aaaaaattgt acttggcgga taatgccttt agcggcttaa ctgtgccctc 8040
catggaaaaa tcagtcaaga tatccacatg tgtttttagt aaacaaattt tgggacctaa 8100
tgcttcaact aactccagta attccttggt ggtacgaaca tccaatgaag cacacaagtt 8160
tgtttgcttt tcgtgcatga tattaaatag cttggcagca acaggactag gatgagtagc 8220
agcacgttcc ttatatgtag ctttcgacat gatttatctt cgtttcctgc aggtttttgt 8280
tctgtgcagt tgggttaaga atactgggca atttcatgtt tcttcaacac cacatatgcg 8340
tatatatacc aatctaagtc tgtgctcctt ccttcgttct tccttctgct cggagattac 8400
cgaatcaaag ctagcttatc gatgataagc tgtcaaagat gagaattaat tccacggact 8460
atagactata ctagatactc cgtctactgt acgatacact tccgctcagg tccttgtcct 8520
ttaacgaggc cttaccactc ttttgttact ctattgatcc agctcagcaa aggcagtgtg 8580
atctaagatt ctatcttcgc gatgtagtaa aactagctag accgagaaag agactagaaa 8640
tgcaaaaggc acttctacaa tggctgccat cattattatc cgatgtgacg ctgcagcttc 8700
tcaatgatat tcgaatacgc tttgaggaga tacagcctaa tatccgacaa actgttttac 8760
agatttacga tcgtacttgt tacccatcat tgaattttga acatccgaac ctgggagttt 8820
tccctgaaac agatagtata tttgaacctg tataataata tatagtctag cgctttacgg 8880
aagacaatgt atgtatttcg gttcctggag aaactattgc atctattgca taggtaatct 8940
tgcacgtcgc atccccggtt cattttctgc gtttccatct tgcacttcaa tagcatatct 9000
ttgttaacga agcatctgtg cttcattttg tagaacaaaa atgcaacgcg agagcgctaa 9060
tttttcaaac aaagaatctg agctgcattt ttacagaaca gaaatgcaac gcgaaagcgc 9120
tattttacca acgaagaatc tgtgcttcat ttttgtaaaa caaaaatgca acgcgacgag 9180
agcgctaatt tttcaaacaa agaatctgag ctgcattttt acagaacaga aatgcaacgc 9240
gagagcgcta ttttaccaac aaagaatcta tacttctttt ttgttctaca aaaatgcatc 9300
ccgagagcgc tatttttcta acaaagcatc ttagattact ttttttctcc tttgtgcgct 9360
ctataatgca gtctcttgat aactttttgc actgtaggtc cgttaaggtt agaagaaggc 9420
tactttggtg tctattttct cttccataaa aaaagcctga ctccacttcc cgcgtttact 9480
gattactagc gaagctgcgg gtgcattttt tcaagataaa ggcatccccg attatattct 9540
ataccgatgt ggattgcgca tactttgtga acagaaagtg atagcgttga tgattcttca 9600
ttggtcagaa aattatgaac ggtttcttct attttgtctc tatatactac gtataggaaa 9660
tgtttacatt ttcgtattgt tttcgattca ctctatgaat agttcttact acaatttttt 9720
tgtctaaaga gtaatactag agataaacat aaaaaatgta gaggtcgagt ttagatgcaa 9780
gttcaaggag cgaaaggtgg atgggta 9807
<210> 94
<211> 10293
<212> DNA
<213> 人工序列
<220>
<223> 合成核酸
<400> 94
gtttgtggaa gcggtattcg caatttaatt aacgcttacc ttggccgtta gacatcatgg 60
taaatctgcg cagacagccc tgtgcagctg aaacgcggtt acgtatagct tgccatatgt 120
ctagccatac gtaaccgcag gtaaaaggca tatttttcgc gtgtcatggc tagtaaataa 180
caccggtgtc atttagagtc agggaaagac aatgaaaaac gaagaaagcc accgggcggc 240
aacccgatga ctttcgctta tcacccagca cacacctggg agaaatcacg gtcatgagtt 300
tacagactca tgcgcagaat gcgcacacta aaacacctac ccgcgtcgag cgcgaccgtg 360
gtggactgga caacacccca gcatctgcca gtgaccgcga ccttttacgc gatcatctag 420
gccgcgatgt actccacggt tcagtcacac gagactttaa aaaggcctat cgacgcaacg 480
ctgacggcac gaactcgccg cgtatgtatc gcttcgagac tgatgcttta ggacggtgcg 540
agtacgccat gctcaccacc aagcagtacg ccgccgtcct ggtcgtagac gttgaccaag 600
taggtaccgc aggcggtgac cccgcagact taaacccgta cgtccgcgac gtggtgcgct 660
cactgattac tcatagcgtc gggccagcct gggtgggtat taacccaact aacggcaaag 720
cccagttcat atggcttatt gaccctgtct acgctgaccg taacggtaaa tctgcgcaga 780
tgaagcttct tgcagcaacc acgcgtgtgc tgggtgagct tttagaccat gacccgcact 840
tttcccaccg ctttagccgc aacccgttct acacaggcaa agcccctacc gcttatcgtt 900
ggtataggca gcacaaccgg gtgatgcgcc ttggagactt gataaagcag gtaagggata 960
tggcaggaca cgaccagttc aaccccaccc cacgccagca attcagctct ggccgcgaac 1020
ttatcaacgc ggtcaagacc cgccgtgaag aagcccaagc attcaaagca ctcgcccagg 1080
acgtagacgc ggaaatcgcc ggtggtctcg accagtatga cccggaactt atcgacggtg 1140
tgcgtgtgct ctggattgtc caaggaaccg cagcacgcga cgaaacagcc tttagacatg 1200
cgcttaagac tggccaccgc ttgcgccagc aaggccaacg cctgacagac gcagcaatca 1260
tcgacgccta tgagcacgcc tacaacgtcg cacacaccca cggcggtgca ggccgcgaca 1320
acgagatgcc acccatgcgc gaccgccaaa ccatggcaag gcgcgtgcgc gggtatgtcg 1380
cccaatccaa gagcgagacc tacagcggct ctaacgcacc aggtaaagcc accagcagcg 1440
agcggaaagc cttggccacg atgggacgca gaggcggaca aaaagccgca caacgctgga 1500
aaacagaccc cgagggcaaa tatgcgcaag cacaaaggtc gaagcttgaa aagacgcacc 1560
gtaagaaaaa ggctcaagga cgatctacga agtcccgtat tagccaaatg gtgaacgatc 1620
agtatttcca gacagggaca gttcccacgt gggctgaaat aggggcagag gtaggagtct 1680
ctcgcgccac ggttgctagg catgtcgcgg agctaaagaa gagcggtgac tatccggacg 1740
tttaaggggt ctcataccgt aagcaatata cggttcccct gccgttaggc agttagataa 1800
aacctcactt gaagaaaacc ttgaggggca gggcagctta tatgcttcaa agcatgactt 1860
cctctgttct cctagacctc gcaaccctcc gccataacct caccctgctc tgcgaggctg 1920
gccggctacc gccggcgtaa cagatgaggg caagcggatg gctgatgaaa ccaagccgcg 1980
gccgggaagc cgatctcggc ttgaacgaat tgttaggtgg cggtacttgg gtcgatatca 2040
aagtgcatca cttcttcccg tatgcccaac tttgtataga gagccactgc gggatcgtca 2100
ccgtaatctg cttgcacgta gatcacataa gcaccaagcg cgttggcctc atgcttgagg 2160
agattgatga gcgcggtggc aatgccctgc ctccggtgct cgccggagac tgcgagatca 2220
tagatataga tctcactacg cggctgctca aacttgggca gaacgtaagc cgcgagagcg 2280
ccaacaaccg cttcttggtc gaaggcagca agcgcgatga atgtcttact acggagcaag 2340
ttcccgaggt aatcggagtc cggctgatgt tgggagtagg tggctacgtc tccgaactca 2400
cgaccgaaaa gatcaagagc agcccgcatg gatttgactt ggtcagggcc gagcctacat 2460
gtgcgaatga tgcccatact tgagccacct aactttgttt tagggcgact gccctgctgc 2520
gtaacatcgt tgctgctcca taacatcaaa catcgaccca cggcgtaacg cgcttgctgc 2580
ttggatgccc gaggcataga ctgtacaaaa aaacagtcat aacaagccat gaaaaccgcc 2640
actgcgccgt taccaccgct gcgttcggtc aaggttctgg accagttgcg tgagcgcata 2700
cgctacttgc attacagttt acgaaccgag tttaaacagc tggtgacaat taatcatcgg 2760
ctcgtataat gtgtggaatt gaatcgatat aaggaggtta atcatgtgaa ctgtcagtct 2820
tccgcgtcca acctcgccaa ccacatcaac gcggtgtacg agctgcgccg cgcctatgcg 2880
cggctgtccg ccgacaagcc ggtgcgcctg gcgaagacca cctccaacct cttccgcttc 2940
cgcagccggg acgatgccgc gcgtctcgac gtcagcgctt tcacctcggt gatcagcatc 3000
gacacggagg cgcgggtcgc ggaggtgggc ggcatgacca cctacgagga cctggtcgcc 3060
gccaccctgc ggcatggcct gatgccgccg gtggttccgc aactgcgcac gatcaccctg 3120
ggcggtgcgg tcaccgggct ggggatcgaa tcctcgtcct tccgcaacgg gctcccgcac 3180
gagtcagtgg aagagatgga gatcctcacc ggcagcggcc aggtggtggt ggcccggcgc 3240
gacaacgagc accgcgacct gttctacggt ttccccaact cgtacggcac cctcggttac 3300
gcgctgcggc tccgcatcca gctcgaaccg gtccgcccct acgtccacct gcggcacctg 3360
cggttcaccg atgccgcagc ggccatggcc gcgctggagc agatctgcgc ggaccgcacc 3420
cacgacgggg agaccgtcga cttcgtcgac ggcgtcgtgt tcgcccgcaa cgagctgtac 3480
ctgaccttgg ggacgttcac cgaccgggct ccgtggacca gcgactacac cggaaccgac 3540
atctactacc ggtcgatccc ccgctacgcg ggccccggcc ccggcgacta cctcaccacg 3600
cacgactacc tgtggcggtg ggacaccgac tggttctggt gctcccgcgc cttcggactg 3660
cagcatcccg tggtgcgccg cctgtggccg cgttccttga aacgctccga cgtctaccgc 3720
aagctcgtcg cctgggaccg gcgcactgac gcgagccgcc tgctcgacta ctaccgcggg 3780
cgcccgccca aggaaccggt gatccaggac atcgaggttg aggtggggcg ggctgccgag 3840
ttcctcgact tcttccacac cgagatcggc atgtccccgg tgtggctgtg cccgctgcgg 3900
ctgcgagaag acacagccga cgatacggaa ccggtctggc cgctctaccc cctcaaaccc 3960
cgccgcctct acgtcaactt cgggttttgg ggcctcgttc cgatccgtcc cggtggaggc 4020
aggacatacc acaaccggct gatcgaaaaa gaagtgaccc ggttgggcgg gcacaagtcg 4080
ctctactcgg acgccttcta cgacgaggac gagttctggg agctctacaa cggggagatc 4140
taccgcaagc tcaaagctgc ctacgacccc gacggtcgac tgctcgacct gtacaccaag 4200
tgcgtcggcg gcgggtgaga aaggatgagg gatgcgactg gcggaggtat tcgaacgtgt 4260
cgtcggaccc gatgcgcccg tccacttccg ggcctacgac ggcagcactg cgggagatcc 4320
acgcagtgaa gtcgctatcg tggttcgcca cccggcagcc gtcaactaca tcgtccaagc 4380
gccgggagca ctcggtttga cccgcgccta cgtggcggga tacctcgacg tcgaagggga 4440
catgtacacc gcgctgcggg caatggccga cgtggtgttc caggaccggc cgcggctgtc 4500
ccccggggaa ctgctgcgga tcatccgcgg gatcgggtgg gtgaagttcg tcaaccggct 4560
tccaccgccg ccgcaggagg tgcgccagtc ccgcctcgcc gccctgggct ggcgccactc 4620
caagcagcgc gacgccgaag ccatccagca ccactacgac gtctccaacg ccttctacgc 4680
cctggtcttg ggcgagtcga tgacctacac ctgcgcggtc tacccgaccg agcaggccac 4740
gctggagcag gcacagttct tcaagcacga gctgatcgcc cgcaagctcg gtcttgcccc 4800
tgggatacga ctgctggatg tggggtgcgg ctggggcggc atggtcatcc acgcggcccg 4860
ggagcacggg gtcaaagccc tgggggtgac cctgtccaaa gagcaggctg agtgggcgca 4920
gaagcggatc gcccacgagg gcctgggcga cctggcagaa gtccggcaca tggactaccg 4980
ggacctgccc gacggcgagt acgacgcgat cagctcgatc gggttgaccg agcacgtcgg 5040
caaaaagaac gtgcccgcct acttcgcgtc gctgtaccgc aagctcgtcc cgggaggccg 5100
cctgctcaac cactgcatca cccggccccg caacgacctg ccgcccttca aacgcggcgg 5160
ggtgatcaac cgctacgtct tccccgatgg ggagctggaa gggcccggct ggctgcaggc 5220
ggcgatgaac gacgccgggt tcgaaatccg ccaccaggag aacctgcggg agcactacgc 5280
acggaccctg cgggactggc tggccaacct ggaccgcaac tgggatgccg cggtgcggga 5340
agtgggggag ggcacggccc gagtgtggcg gctctacatg gccgggtgcg tgctcggctt 5400
cgaacgcaac gtggtgcaac tgcaccagat cctcggggtg aagctcgacg ggaccgaggc 5460
gcggatgccg ctgcgccccg acttcgaacc gccgctgcct taaccgcggt gcacagccgg 5520
gggatatcag tcgcggaacc gggcatgatg agcccatggc tgcgaccgat gacgaccggc 5580
accacaccac cgtcgccctc gacctcatcg acgcgtatgt gcgcgccgac cgcagaatga 5640
tcggtgaacg ttccgcgggg atcagcgcgg aggcggggga gcggatcgtc tccaccctga 5700
aagtgtgcgc ggccttcctt gcccgccggg tccaggagac cggggtgccg tggcgcgcag 5760
cggactcccg ggaagcggtc gcccgcaccg tcgccgacct gctggaaccc gaggtggaat 5820
tcgcggtcgt ctccgcctgg gaggcgtacg cgatcgggga gcacgaggcc gcctgggtcc 5880
gggcgcacgg cgatccgctg gtcttcgtcc acatgctggc cgcgttctcc gctgctatcg 5940
gcacagcggt ctacggccgt gaggagctgc tgcccacgct gcgcagggtg acagcacgat 6000
aacctcaaaa tatattttcc ctctatcttc tcgttgcgct taatttgact aattctcatt 6060
agcgaggcgc gcctttccat aggctccgcc cccctgacga gcatcacaaa aatcgacgct 6120
caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt ccccctggaa 6180
gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc 6240
tcccttcggg aagcgtggcg ctttctcata gctcacgctg taggtatctc agttcggtgt 6300
aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg 6360
ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta tcgccactgg 6420
cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct acagagttct 6480
tgaagtggtg gcctaactac ggctacacta gaagaacagt atttggtatc tgcgctctgc 6540
tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa caaaccaccg 6600
ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa aaaggatctc 6660
aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa aactcacgtt 6720
aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac ctagatcctt ttaaattaaa 6780
aatgaagttt taaatcaatc taaagtatat atgagtaaac ttggtctgac agttaccaat 6840
gcttaatcag tgaggcacct atctcagcga tctgtctatt tcgttcatcc atagttgcct 6900
gactccccgt cgtgtagata actacgatac gggagggctt accatctggc cccagtgctg 6960
caatgatacc gcgagaccca cgctcaccgg ctccagattt atcagcaata aaccagccag 7020
ccggaagggc cgagcgcaga agtggtcctg caactttatc cgcctccatc cagtctatta 7080
attgttgccg ggaagctaga gtaagtagtt cgccagttaa tagtttgcgc aacgttgttg 7140
ccattgctac aggcatcgtg gtgtcacgct cgtcgtttgg tatggcttca ttcagctccg 7200
gttcccaacg atcaaggcga gttacatgat cccccatgtt gtgcaaaaaa gcggttagct 7260
ccttcggtcc tccgatcgtt gtcagaagta agttggccgc agtgttatca ctcatggtta 7320
tggcagcact gcataattct cttactgtca tgccatccgt aagatgcttt tctgtgactg 7380
gtgagtactc aaccaagtca ttctgagaat agtgtatgcg gcgaccgagt tgctcttgcc 7440
cggcgtcaat acgggataat accgcgccac atagcagaac tttaaaagtg ctcatcattg 7500
gaaaacgttc ttcggggcga aaactctcaa ggatcttacc gctgttgaga tccagttcga 7560
tgtaacccac tcgtgcaccc aactgatctt cagcatcttt tactttcacc agcgtttctg 7620
ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg aataagggcg acacggaaat 7680
gttgaatact catactcttc ctttttcaat attattgaag catttatcag ggttattgtc 7740
tcatgagcgg atacatattt gaatgtattt agaaaaataa acagcgatcg cgcggccgcg 7800
ggtaataact gatataatta aattgaagct ctaatttgtg agtttagtat acatgcattt 7860
acttataata cagtttttta gttttgctgg ccgcatcttc tcaaatatgc ttcccagcct 7920
gcttttctgt aacgttcacc ctctacctta gcatcccttc cctttgcaaa tagtcctctt 7980
ccaacaataa taatgtcaga tcctgtagag accacatcat ccacggttct atactgttga 8040
cccaatgcgt ctcccttgtc atctaaaccc acaccgggtg tcataatcaa ccaatcgtaa 8100
ccttcatctc ttccacccat gtctctttga gcaataaagc cgataacaaa atctttgtcg 8160
ctcttcgcaa tgtcaacagt acccttagta tattctccag tagctaggga gcccttgcat 8220
gacaattctg ctaacatcaa aaggcctcta ggttcctttg ttacttcttc cgccgcctgc 8280
ttcaaaccgc taacaatacc tgggcccacc acaccgtgtg cattcgtaat gtctgcccat 8340
tctgctattc tgtatacacc cgcagagtac tgcaatttga ctgtattacc aatgtcagca 8400
aattttctgt cttcgaagag taaaaaattg tacttggcgg ataatgcctt tagcggctta 8460
actgtgccct ccatggaaaa atcagtcaag atatccacat gtgtttttag taaacaaatt 8520
ttgggaccta atgcttcaac taactccagt aattccttgg tggtacgaac atccaatgaa 8580
gcacacaagt ttgtttgctt ttcgtgcatg atattaaata gcttggcagc aacaggacta 8640
ggatgagtag cagcacgttc cttatatgta gctttcgaca tgatttatct tcgtttcctg 8700
caggtttttg ttctgtgcag ttgggttaag aatactgggc aatttcatgt ttcttcaaca 8760
ccacatatgc gtatatatac caatctaagt ctgtgctcct tccttcgttc ttccttctgc 8820
tcggagatta ccgaatcaaa gctagcttat cgatgataag ctgtcaaaga tgagaattaa 8880
ttccacggac tatagactat actagatact ccgtctactg tacgatacac ttccgctcag 8940
gtccttgtcc tttaacgagg ccttaccact cttttgttac tctattgatc cagctcagca 9000
aaggcagtgt gatctaagat tctatcttcg cgatgtagta aaactagcta gaccgagaaa 9060
gagactagaa atgcaaaagg cacttctaca atggctgcca tcattattat ccgatgtgac 9120
gctgcagctt ctcaatgata ttcgaatacg ctttgaggag atacagccta atatccgaca 9180
aactgtttta cagatttacg atcgtacttg ttacccatca ttgaattttg aacatccgaa 9240
cctgggagtt ttccctgaaa cagatagtat atttgaacct gtataataat atatagtcta 9300
gcgctttacg gaagacaatg tatgtatttc ggttcctgga gaaactattg catctattgc 9360
ataggtaatc ttgcacgtcg catccccggt tcattttctg cgtttccatc ttgcacttca 9420
atagcatatc tttgttaacg aagcatctgt gcttcatttt gtagaacaaa aatgcaacgc 9480
gagagcgcta atttttcaaa caaagaatct gagctgcatt tttacagaac agaaatgcaa 9540
cgcgaaagcg ctattttacc aacgaagaat ctgtgcttca tttttgtaaa acaaaaatgc 9600
aacgcgacga gagcgctaat ttttcaaaca aagaatctga gctgcatttt tacagaacag 9660
aaatgcaacg cgagagcgct attttaccaa caaagaatct atacttcttt tttgttctac 9720
aaaaatgcat cccgagagcg ctatttttct aacaaagcat cttagattac tttttttctc 9780
ctttgtgcgc tctataatgc agtctcttga taactttttg cactgtaggt ccgttaaggt 9840
tagaagaagg ctactttggt gtctattttc tcttccataa aaaaagcctg actccacttc 9900
ccgcgtttac tgattactag cgaagctgcg ggtgcatttt ttcaagataa aggcatcccc 9960
gattatattc tataccgatg tggattgcgc atactttgtg aacagaaagt gatagcgttg 10020
atgattcttc attggtcaga aaattatgaa cggtttcttc tattttgtct ctatatacta 10080
cgtataggaa atgtttacat tttcgtattg ttttcgattc actctatgaa tagttcttac 10140
tacaattttt ttgtctaaag agtaatacta gagataaaca taaaaaatgt agaggtcgag 10200
tttagatgca agttcaagga gcgaaaggtg gatgggtagg ttatataggg atatagcaca 10260
gagatatata gcaaagagat acttttgagc aat 10293
<210> 95
<211> 5654
<212> DNA
<213> 人工序列
<220>
<223> 合成核酸
<400> 95
tgggtaggtt atatagggat atagcacaga gatatatagc aaagagatac ttttgagcaa 60
tgtttgtgga agcggtattc gcaatttaat taaagctggt gacaattaat catcggctcg 120
tataatgtgt ggaattgaat cgatataagg aggttaatca tatgacgctg gccaaggtct 180
tcgaggagct ggtcggggcg gacgcccctg tggagctcac cgcctacgac ggatcgagag 240
ccggacgcct gggcagtgat ctgcgggtcc acgtgaagtc gccgtacgcg gtgtcctacc 300
tggtgcactc gccgagcgcg ctcgggctgg cccgcgcgta cgtggccggg cacctggacg 360
cctacggcga catgtacacg ctgctgcggg agatgacgca gctgaccgag gcgctgacgc 420
ccaaggcccg gctgcggctg ctggccggtg tcctgcagga tccgctgctg cgcgcggcgg 480
ccagccgccg tctgccgccc ccgccgcagg aggtgcggac cggccgcacc tcctggttcc 540
ggcacaccaa gcggcgggac gccaaggcca tctcccacca ctacgacgtg tccaacacct 600
tctatgagtg ggtgctgggc ccgtcgatga cctacacctg cgcctgtttc cccaccgagg 660
acgccacctt ggaggaggcg cagttccaca agcacgacct ggtcgccaag aagctcgggc 720
tgcggccggg catgcggctg ctggacgtgg gctgcggctg gggcggcatg gtgatgcacg 780
ccgccaagca ctacggggtg cgggcgctgg gcgtcacgct gtccaagcag caggccgagt 840
gggcgcagaa ggccatcgcc gaggcgggcc tgagcgacct ggccgaggtc cgccaccagg 900
actaccggga cgtcaccgag ggcgacttcg acgccatcag ctcgatcggc ctcaccgagc 960
acatcggcaa ggccaacctg ccgtcctact tcggcttcct gtacggcaag ctcaagccgg 1020
gcgggcggct gctcaaccac tgcatcaccc ggcccgacaa cacccagccg gccatgaaga 1080
aggacgggtt catcaaccgg tacgtcttcc ccgacgggga gctggagggg cccggctacc 1140
tgcagaccca gatgaacgac gccggttttg agatccgcca ccaggagaac ctgcgcgagc 1200
actacgcccg caccctggcc ggatggtgcc gcaacctcga tgagcactgg gacgaggcgg 1260
tggccgaggt cggcgagggc accgcgcggg tgtggcggct gtacatggcc ggcagccggc 1320
tcggtttcga gctcaactgg atccagctgc accagatcct gggcgtcaag ctcggcgagc 1380
gcggcgagtc ccgcatgccg ttgcggcccg actggggcgt gtgacctcaa aatatatttt 1440
ccctctatct tctcgttgcg cttaatttga ctaattctca ttagcgaggc gcgcctttcc 1500
ataggctccg cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa 1560
acccgacagg actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc 1620
ctgttccgac cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg 1680
cgctttctca tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc 1740
tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc 1800
gtcttgagtc caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca 1860
ggattagcag agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact 1920
acggctacac tagaagaaca gtatttggta tctgcgctct gctgaagcca gttaccttcg 1980
gaaaaagagt tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt 2040
ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct 2100
tttctacggg gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga 2160
gattatcaaa aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa 2220
tctaaagtat atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac 2280
ctatctcagc gatctgtcta tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga 2340
taactacgat acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcgagacc 2400
cacgctcacc ggctccagat ttatcagcaa taaaccagcc agccggaagg gccgagcgca 2460
gaagtggtcc tgcaacttta tccgcctcca tccagtctat taattgttgc cgggaagcta 2520
gagtaagtag ttcgccagtt aatagtttgc gcaacgttgt tgccattgct acaggcatcg 2580
tggtgtcacg ctcgtcgttt ggtatggctt cattcagctc cggttcccaa cgatcaaggc 2640
gagttacatg atcccccatg ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg 2700
ttgtcagaag taagttggcc gcagtgttat cactcatggt tatggcagca ctgcataatt 2760
ctcttactgt catgccatcc gtaagatgct tttctgtgac tggtgagtac tcaaccaagt 2820
cattctgaga atagtgtatg cggcgaccga gttgctcttg cccggcgtca atacgggata 2880
ataccgcgcc acatagcaga actttaaaag tgctcatcat tggaaaacgt tcttcggggc 2940
gaaaactctc aaggatctta ccgctgttga gatccagttc gatgtaaccc actcgtgcac 3000
ccaactgatc ttcagcatct tttactttca ccagcgtttc tgggtgagca aaaacaggaa 3060
ggcaaaatgc cgcaaaaaag ggaataaggg cgacacggaa atgttgaata ctcatactct 3120
tcctttttca atattattga agcatttatc agggttattg tctcatgagc ggatacatat 3180
ttgaatgtat ttagaaaaat aaacagcgat cgcgcggccg cgggtaataa ctgatataat 3240
taaattgaag ctctaatttg tgagtttagt atacatgcat ttacttataa tacagttttt 3300
tagttttgct ggccgcatct tctcaaatat gcttcccagc ctgcttttct gtaacgttca 3360
ccctctacct tagcatccct tccctttgca aatagtcctc ttccaacaat aataatgtca 3420
gatcctgtag agaccacatc atccacggtt ctatactgtt gacccaatgc gtctcccttg 3480
tcatctaaac ccacaccggg tgtcataatc aaccaatcgt aaccttcatc tcttccaccc 3540
atgtctcttt gagcaataaa gccgataaca aaatctttgt cgctcttcgc aatgtcaaca 3600
gtacccttag tatattctcc agtagctagg gagcccttgc atgacaattc tgctaacatc 3660
aaaaggcctc taggttcctt tgttacttct tccgccgcct gcttcaaacc gctaacaata 3720
cctgggccca ccacaccgtg tgcattcgta atgtctgccc attctgctat tctgtataca 3780
cccgcagagt actgcaattt gactgtatta ccaatgtcag caaattttct gtcttcgaag 3840
agtaaaaaat tgtacttggc ggataatgcc tttagcggct taactgtgcc ctccatggaa 3900
aaatcagtca agatatccac atgtgttttt agtaaacaaa ttttgggacc taatgcttca 3960
actaactcca gtaattcctt ggtggtacga acatccaatg aagcacacaa gtttgtttgc 4020
ttttcgtgca tgatattaaa tagcttggca gcaacaggac taggatgagt agcagcacgt 4080
tccttatatg tagctttcga catgatttat cttcgtttcc tgcaggtttt tgttctgtgc 4140
agttgggtta agaatactgg gcaatttcat gtttcttcaa caccacatat gcgtatatat 4200
accaatctaa gtctgtgctc cttccttcgt tcttccttct gctcggagat taccgaatca 4260
aagctagctt atcgatgata agctgtcaaa gatgagaatt aattccacgg actatagact 4320
atactagata ctccgtctac tgtacgatac acttccgctc aggtccttgt cctttaacga 4380
ggccttacca ctcttttgtt actctattga tccagctcag caaaggcagt gtgatctaag 4440
attctatctt cgcgatgtag taaaactagc tagaccgaga aagagactag aaatgcaaaa 4500
ggcacttcta caatggctgc catcattatt atccgatgtg acgctgcagc ttctcaatga 4560
tattcgaata cgctttgagg agatacagcc taatatccga caaactgttt tacagattta 4620
cgatcgtact tgttacccat cattgaattt tgaacatccg aacctgggag ttttccctga 4680
aacagatagt atatttgaac ctgtataata atatatagtc tagcgcttta cggaagacaa 4740
tgtatgtatt tcggttcctg gagaaactat tgcatctatt gcataggtaa tcttgcacgt 4800
cgcatccccg gttcattttc tgcgtttcca tcttgcactt caatagcata tctttgttaa 4860
cgaagcatct gtgcttcatt ttgtagaaca aaaatgcaac gcgagagcgc taatttttca 4920
aacaaagaat ctgagctgca tttttacaga acagaaatgc aacgcgaaag cgctatttta 4980
ccaacgaaga atctgtgctt catttttgta aaacaaaaat gcaacgcgac gagagcgcta 5040
atttttcaaa caaagaatct gagctgcatt tttacagaac agaaatgcaa cgcgagagcg 5100
ctattttacc aacaaagaat ctatacttct tttttgttct acaaaaatgc atcccgagag 5160
cgctattttt ctaacaaagc atcttagatt actttttttc tcctttgtgc gctctataat 5220
gcagtctctt gataactttt tgcactgtag gtccgttaag gttagaagaa ggctactttg 5280
gtgtctattt tctcttccat aaaaaaagcc tgactccact tcccgcgttt actgattact 5340
agcgaagctg cgggtgcatt ttttcaagat aaaggcatcc ccgattatat tctataccga 5400
tgtggattgc gcatactttg tgaacagaaa gtgatagcgt tgatgattct tcattggtca 5460
gaaaattatg aacggtttct tctattttgt ctctatatac tacgtatagg aaatgtttac 5520
attttcgtat tgttttcgat tcactctatg aatagttctt actacaattt ttttgtctaa 5580
agagtaatac tagagataaa cataaaaaat gtagaggtcg agtttagatg caagttcaag 5640
gagcgaaagg tgga 5654
<210> 96
<211> 5759
<212> DNA
<213> 人工序列
<220>
<223> 合成核酸
<400> 96
tgggtaggtt atatagggat atagcacaga gatatatagc aaagagatac ttttgagcaa 60
tgtttgtgga agcggtattc gcaatttaat taaagctggt gacaattaat catcggctcg 120
tataatgtgt ggaattgaat cgatataagg aggttaatca tatgtcacag ctggcggtca 180
cagaccacca cgagcgagcg gtcgaggcgc tgcgcaggtc gtatgcggcg atcccgccgg 240
gcacaccggt ccgcttggcc aagcagacct ccaacctgtt ccgcttccgc gagccgacgg 300
ccgcgcccgg cctggacgtg tccggcttca accgggtgct ggcggtggac ccggatgcgc 360
gcaccgccga cgtgcagggc atgaccacct acgaggacct ggtcgacgcc accctgccgc 420
acgggctgat gccgctggtg gtgccccagc tcaagacgat cacgctgggc ggggcggtga 480
ccggcctggg catcgagtcc acctccttcc gcaacggcct gccgcacgag tcggtgctgg 540
agatgcagat catcaccggc gccggcgaag tggtcaccgc caccccggac ggggagcact 600
ccgacctgtt ctggggcttc cccaactcct acgggacgct ggggtacgcc ctgaagctga 660
agatcgaact ggagccggtc aagccgtacg tccggctgcg gcacctgcgc ttcgacgacg 720
ccggcgagtg cgccgccaag ctcgccgagc tgagcgaaag ccgcgagcac gagggcgatg 780
aggtgcactt tttggacggc accttcttcg ggccgcgcga gatgtacctg acgctcggca 840
cgttcaccga caccgccccc tatgtgtcgg actacaccgg gcagcacatc tactaccggt 900
cgatccagca gcggtcgatc gactttttga ccatccgcga ctacctgtgg cgctgggaca 960
ccgactggtt ctggtgctcg cgcgccctgg gcgtgcagaa cccgctgatc cggcgggtgt 1020
ggccgaagag cgccaagcgg tcggatgtgt accgcaagct ggtggcctac gaaaagcgct 1080
accagttcaa ggcgcgcatc gaccggtgga cgggcaagcc gccgcgcgag gacgtcatcc 1140
aggacatcga ggtgccggca gaacgcctgc cggagttcct ggagttcttc cacgacaaga 1200
tcgggatgag cccggtgtgg ctgtgcccgc tgcgggcgcg ccaccgctgg ccgctgtacc 1260
cgctcaagcc cggcgtcacc tacgtcaacg ccggcttctg ggggacggtg ccgctgcagc 1320
cggggcagat gcccgagtac cacaaccggc tgatcgaacg gaaggtcgcc caactggacg 1380
gccacaagtc tctgtactcg acggcgttct actcgcgtga ggagttctgg cggcactacg 1440
acggggaaac ctaccggcgt ctgaaggaca cctacgaccc cgacgcgcgc ctgctcgacc 1500
tctacgacaa gtgcgtgcgg ggacgctgac ctcaaaatat attttccctc tatcttctcg 1560
ttgcgcttaa tttgactaat tctcattagc gaggcgcgcc tttccatagg ctccgccccc 1620
ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg acaggactat 1680
aaagatacca ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc 1740
cgcttaccgg atacctgtcc gcctttctcc cttcgggaag cgtggcgctt tctcatagct 1800
cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg 1860
aaccccccgt tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc 1920
cggtaagaca cgacttatcg ccactggcag cagccactgg taacaggatt agcagagcga 1980
ggtatgtagg cggtgctaca gagttcttga agtggtggcc taactacggc tacactagaa 2040
gaacagtatt tggtatctgc gctctgctga agccagttac cttcggaaaa agagttggta 2100
gctcttgatc cggcaaacaa accaccgctg gtagcggtgg tttttttgtt tgcaagcagc 2160
agattacgcg cagaaaaaaa ggatctcaag aagatccttt gatcttttct acggggtctg 2220
acgctcagtg gaacgaaaac tcacgttaag ggattttggt catgagatta tcaaaaagga 2280
tcttcaccta gatcctttta aattaaaaat gaagttttaa atcaatctaa agtatatatg 2340
agtaaacttg gtctgacagt taccaatgct taatcagtga ggcacctatc tcagcgatct 2400
gtctatttcg ttcatccata gttgcctgac tccccgtcgt gtagataact acgatacggg 2460
agggcttacc atctggcccc agtgctgcaa tgataccgcg agacccacgc tcaccggctc 2520
cagatttatc agcaataaac cagccagccg gaagggccga gcgcagaagt ggtcctgcaa 2580
ctttatccgc ctccatccag tctattaatt gttgccggga agctagagta agtagttcgc 2640
cagttaatag tttgcgcaac gttgttgcca ttgctacagg catcgtggtg tcacgctcgt 2700
cgtttggtat ggcttcattc agctccggtt cccaacgatc aaggcgagtt acatgatccc 2760
ccatgttgtg caaaaaagcg gttagctcct tcggtcctcc gatcgttgtc agaagtaagt 2820
tggccgcagt gttatcactc atggttatgg cagcactgca taattctctt actgtcatgc 2880
catccgtaag atgcttttct gtgactggtg agtactcaac caagtcattc tgagaatagt 2940
gtatgcggcg accgagttgc tcttgcccgg cgtcaatacg ggataatacc gcgccacata 3000
gcagaacttt aaaagtgctc atcattggaa aacgttcttc ggggcgaaaa ctctcaagga 3060
tcttaccgct gttgagatcc agttcgatgt aacccactcg tgcacccaac tgatcttcag 3120
catcttttac tttcaccagc gtttctgggt gagcaaaaac aggaaggcaa aatgccgcaa 3180
aaaagggaat aagggcgaca cggaaatgtt gaatactcat actcttcctt tttcaatatt 3240
attgaagcat ttatcagggt tattgtctca tgagcggata catatttgaa tgtatttaga 3300
aaaataaaca gcgatcgcgc ggccgcgggt aataactgat ataattaaat tgaagctcta 3360
atttgtgagt ttagtataca tgcatttact tataatacag ttttttagtt ttgctggccg 3420
catcttctca aatatgcttc ccagcctgct tttctgtaac gttcaccctc taccttagca 3480
tcccttccct ttgcaaatag tcctcttcca acaataataa tgtcagatcc tgtagagacc 3540
acatcatcca cggttctata ctgttgaccc aatgcgtctc ccttgtcatc taaacccaca 3600
ccgggtgtca taatcaacca atcgtaacct tcatctcttc cacccatgtc tctttgagca 3660
ataaagccga taacaaaatc tttgtcgctc ttcgcaatgt caacagtacc cttagtatat 3720
tctccagtag ctagggagcc cttgcatgac aattctgcta acatcaaaag gcctctaggt 3780
tcctttgtta cttcttccgc cgcctgcttc aaaccgctaa caatacctgg gcccaccaca 3840
ccgtgtgcat tcgtaatgtc tgcccattct gctattctgt atacacccgc agagtactgc 3900
aatttgactg tattaccaat gtcagcaaat tttctgtctt cgaagagtaa aaaattgtac 3960
ttggcggata atgcctttag cggcttaact gtgccctcca tggaaaaatc agtcaagata 4020
tccacatgtg tttttagtaa acaaattttg ggacctaatg cttcaactaa ctccagtaat 4080
tccttggtgg tacgaacatc caatgaagca cacaagtttg tttgcttttc gtgcatgata 4140
ttaaatagct tggcagcaac aggactagga tgagtagcag cacgttcctt atatgtagct 4200
ttcgacatga tttatcttcg tttcctgcag gtttttgttc tgtgcagttg ggttaagaat 4260
actgggcaat ttcatgtttc ttcaacacca catatgcgta tatataccaa tctaagtctg 4320
tgctccttcc ttcgttcttc cttctgctcg gagattaccg aatcaaagct agcttatcga 4380
tgataagctg tcaaagatga gaattaattc cacggactat agactatact agatactccg 4440
tctactgtac gatacacttc cgctcaggtc cttgtccttt aacgaggcct taccactctt 4500
ttgttactct attgatccag ctcagcaaag gcagtgtgat ctaagattct atcttcgcga 4560
tgtagtaaaa ctagctagac cgagaaagag actagaaatg caaaaggcac ttctacaatg 4620
gctgccatca ttattatccg atgtgacgct gcagcttctc aatgatattc gaatacgctt 4680
tgaggagata cagcctaata tccgacaaac tgttttacag atttacgatc gtacttgtta 4740
cccatcattg aattttgaac atccgaacct gggagttttc cctgaaacag atagtatatt 4800
tgaacctgta taataatata tagtctagcg ctttacggaa gacaatgtat gtatttcggt 4860
tcctggagaa actattgcat ctattgcata ggtaatcttg cacgtcgcat ccccggttca 4920
ttttctgcgt ttccatcttg cacttcaata gcatatcttt gttaacgaag catctgtgct 4980
tcattttgta gaacaaaaat gcaacgcgag agcgctaatt tttcaaacaa agaatctgag 5040
ctgcattttt acagaacaga aatgcaacgc gaaagcgcta ttttaccaac gaagaatctg 5100
tgcttcattt ttgtaaaaca aaaatgcaac gcgacgagag cgctaatttt tcaaacaaag 5160
aatctgagct gcatttttac agaacagaaa tgcaacgcga gagcgctatt ttaccaacaa 5220
agaatctata cttctttttt gttctacaaa aatgcatccc gagagcgcta tttttctaac 5280
aaagcatctt agattacttt ttttctcctt tgtgcgctct ataatgcagt ctcttgataa 5340
ctttttgcac tgtaggtccg ttaaggttag aagaaggcta ctttggtgtc tattttctct 5400
tccataaaaa aagcctgact ccacttcccg cgtttactga ttactagcga agctgcgggt 5460
gcattttttc aagataaagg catccccgat tatattctat accgatgtgg attgcgcata 5520
ctttgtgaac agaaagtgat agcgttgatg attcttcatt ggtcagaaaa ttatgaacgg 5580
tttcttctat tttgtctcta tatactacgt ataggaaatg tttacatttt cgtattgttt 5640
tcgattcact ctatgaatag ttcttactac aatttttttg tctaaagagt aatactagag 5700
ataaacataa aaaatgtaga ggtcgagttt agatgcaagt tcaaggagcg aaaggtgga 5759
<210> 97
<211> 2664
<212> DNA
<213> 弯曲嗜热单胞菌
<400> 97
atgtcacagc tggcggtcac agaccaccac gagcgagcgg tcgaggcgct gcgcaggtcg 60
tatgcggcga tcccgccggg cacaccggtc cgcttggcca agcagacctc caacctgttc 120
cgcttccgcg agccgacggc cgcgcccggc ctggacgtgt ccggcttcaa ccgggtgctg 180
gcggtggacc cggatgcgcg caccgccgac gtgcagggca tgaccaccta cgaggacctg 240
gtcgacgcca ccctgccgca cgggctgatg ccgctggtgg tgccccagct caagacgatc 300
acgctgggcg gggcggtgac cggcctgggc atcgagtcca cctccttccg caacggcctg 360
ccgcacgagt cggtgctgga gatgcagatc atcaccggcg ccggcgaagt ggtcaccgcc 420
accccggacg gggagcactc cgacctgttc tggggcttcc ccaactccta cgggacgctg 480
gggtacgccc tgaagctgaa gatcgaactg gagccggtca agccgtacgt ccggctgcgg 540
cacctgcgct tcgacgacgc cggcgagtgc gccgccaagc tcgccgagct gagcgaaagc 600
cgcgagcacg agggcgatga ggtgcacttt ttggacggca ccttcttcgg gccgcgcgag 660
atgtacctga cgctcggcac gttcaccgac accgccccct atgtgtcgga ctacaccggg 720
cagcacatct actaccggtc gatccagcag cggtcgatcg actttttgac catccgcgac 780
tacctgtggc gctgggacac cgactggttc tggtgctcgc gcgccctggg cgtgcagaac 840
ccgctgatcc ggcgggtgtg gccgaagagc gccaagcggt cggatgtgta ccgcaagctg 900
gtggcctacg aaaagcgcta ccagttcaag gcgcgcatcg accggtggac gggcaagccg 960
ccgcgcgagg acgtcatcca ggacatcgag gtgccggcag aacgcctgcc ggagttcctg 1020
gagttcttcc acgacaagat cgggatgagc ccggtgtggc tgtgcccgct gcgggcgcgc 1080
caccgctggc cgctgtaccc gctcaagccc ggcgtcacct acgtcaacgc cggcttctgg 1140
gggacggtgc cgctgcagcc ggggcagatg cccgagtacc acaaccggct gatcgaacgg 1200
aaggtcgccc aactggacgg ccacaagtct ctgtactcga cggcgttcta ctcgcgtgag 1260
gagttctggc ggcactacga cggggaaacc taccggcgtc tgaaggacac ctacgacccc 1320
gacgcgcgcc tgctcgacct ctacgacaag tgcgtgcggg gacgcgctgg tggtgccgag 1380
ggtggcaatg gcggtggcgc catgacgctg gccaaggtct tcgaggagct ggtcggggcg 1440
gacgcccctg tggagctcac cgcctacgac ggatcgagag ccggacgcct gggcagtgat 1500
ctgcgggtcc acgtgaagtc gccgtacgcg gtgtcctacc tggtgcactc gccgagcgcg 1560
ctcgggctgg cccgcgcgta cgtggccggg cacctggacg cctacggcga catgtacacg 1620
ctgctgcggg agatgacgca gctgaccgag gcgctgacgc ccaaggcccg gctgcggctg 1680
ctggccggtg tcctgcagga tccgctgctg cgcgcggcgg ccagccgccg tctgccgccc 1740
ccgccgcagg aggtgcggac cggccgcacc tcctggttcc ggcacaccaa gcggcgggac 1800
gccaaggcca tctcccacca ctacgacgtg tccaacacct tctatgagtg ggtgctgggc 1860
ccgtcgatga cctacacctg cgcctgtttc cccaccgagg acgccacctt ggaggaggcg 1920
cagttccaca agcacgacct ggtcgccaag aagctcgggc tgcggccggg catgcggctg 1980
ctggacgtgg gctgcggctg gggcggcatg gtgatgcacg ccgccaagca ctacggggtg 2040
cgggcgctgg gcgtcacgct gtccaagcag caggccgagt gggcgcagaa ggccatcgcc 2100
gaggcgggcc tgagcgacct ggccgaggtc cgccaccagg actaccggga cgtcaccgag 2160
ggcgacttcg acgccatcag ctcgatcggc ctcaccgagc acatcggcaa ggccaacctg 2220
ccgtcctact tcggcttcct gtacggcaag ctcaagccgg gcgggcggct gctcaaccac 2280
tgcatcaccc ggcccgacaa cacccagccg gccatgaaga aggacgggtt catcaaccgg 2340
tacgtcttcc ccgacgggga gctggagggg cccggctacc tgcagaccca gatgaacgac 2400
gccggttttg agatccgcca ccaggagaac ctgcgcgagc actacgcccg caccctggcc 2460
ggatggtgcc gcaacctcga tgagcactgg gacgaggcgg tggccgaggt cggcgagggc 2520
accgcgcggg tgtggcggct gtacatggcc ggcagccggc tcggtttcga gctcaactgg 2580
atccagctgc accagatcct gggcgtcaag ctcggcgagc gcggcgagtc ccgcatgccg 2640
ttgcggcccg actggggcgt gtga 2664
<210> 98
<211> 2664
<212> DNA
<213> 弯曲嗜热单胞菌
<400> 98
atgacgctgg ccaaggtctt cgaggagctg gtcggggcgg acgcccctgt ggagctcacc 60
gcctacgacg gatcgagagc cggacgcctg ggcagtgatc tgcgggtcca cgtgaagtcg 120
ccgtacgcgg tgtcctacct ggtgcactcg ccgagcgcgc tcgggctggc ccgcgcgtac 180
gtggccgggc acctggacgc ctacggcgac atgtacacgc tgctgcggga gatgacgcag 240
ctgaccgagg cgctgacgcc caaggcccgg ctgcggctgc tggccggtgt cctgcaggat 300
ccgctgctgc gcgcggcggc cagccgccgt ctgccgcccc cgccgcagga ggtgcggacc 360
ggccgcacct cctggttccg gcacaccaag cggcgggacg ccaaggccat ctcccaccac 420
tacgacgtgt ccaacacctt ctatgagtgg gtgctgggcc cgtcgatgac ctacacctgc 480
gcctgtttcc ccaccgagga cgccaccttg gaggaggcgc agttccacaa gcacgacctg 540
gtcgccaaga agctcgggct gcggccgggc atgcggctgc tggacgtggg ctgcggctgg 600
ggcggcatgg tgatgcacgc cgccaagcac tacggggtgc gggcgctggg cgtcacgctg 660
tccaagcagc aggccgagtg ggcgcagaag gccatcgccg aggcgggcct gagcgacctg 720
gccgaggtcc gccaccagga ctaccgggac gtcaccgagg gcgacttcga cgccatcagc 780
tcgatcggcc tcaccgagca catcggcaag gccaacctgc cgtcctactt cggcttcctg 840
tacggcaagc tcaagccggg cgggcggctg ctcaaccact gcatcacccg gcccgacaac 900
acccagccgg ccatgaagaa ggacgggttc atcaaccggt acgtcttccc cgacggggag 960
ctggaggggc ccggctacct gcagacccag atgaacgacg ccggttttga gatccgccac 1020
caggagaacc tgcgcgagca ctacgcccgc accctggccg gatggtgccg caacctcgat 1080
gagcactggg acgaggcggt ggccgaggtc ggcgagggca ccgcgcgggt gtggcggctg 1140
tacatggccg gcagccggct cggtttcgag ctcaactgga tccagctgca ccagatcctg 1200
ggcgtcaagc tcggcgagcg cggcgagtcc cgcatgccgt tgcggcccga ctggggcgtg 1260
gctggtggtg ccgagggtgg caatggcggt ggcgccatgt cacagctggc ggtcacagac 1320
caccacgagc gagcggtcga ggcgctgcgc aggtcgtatg cggcgatccc gccgggcaca 1380
ccggtccgct tggccaagca gacctccaac ctgttccgct tccgcgagcc gacggccgcg 1440
cccggcctgg acgtgtccgg cttcaaccgg gtgctggcgg tggacccgga tgcgcgcacc 1500
gccgacgtgc agggcatgac cacctacgag gacctggtcg acgccaccct gccgcacggg 1560
ctgatgccgc tggtggtgcc ccagctcaag acgatcacgc tgggcggggc ggtgaccggc 1620
ctgggcatcg agtccacctc cttccgcaac ggcctgccgc acgagtcggt gctggagatg 1680
cagatcatca ccggcgccgg cgaagtggtc accgccaccc cggacgggga gcactccgac 1740
ctgttctggg gcttccccaa ctcctacggg acgctggggt acgccctgaa gctgaagatc 1800
gaactggagc cggtcaagcc gtacgtccgg ctgcggcacc tgcgcttcga cgacgccggc 1860
gagtgcgccg ccaagctcgc cgagctgagc gaaagccgcg agcacgaggg cgatgaggtg 1920
cactttttgg acggcacctt cttcgggccg cgcgagatgt acctgacgct cggcacgttc 1980
accgacaccg ccccctatgt gtcggactac accgggcagc acatctacta ccggtcgatc 2040
cagcagcggt cgatcgactt tttgaccatc cgcgactacc tgtggcgctg ggacaccgac 2100
tggttctggt gctcgcgcgc cctgggcgtg cagaacccgc tgatccggcg ggtgtggccg 2160
aagagcgcca agcggtcgga tgtgtaccgc aagctggtgg cctacgaaaa gcgctaccag 2220
ttcaaggcgc gcatcgaccg gtggacgggc aagccgccgc gcgaggacgt catccaggac 2280
atcgaggtgc cggcagaacg cctgccggag ttcctggagt tcttccacga caagatcggg 2340
atgagcccgg tgtggctgtg cccgctgcgg gcgcgccacc gctggccgct gtacccgctc 2400
aagcccggcg tcacctacgt caacgccggc ttctggggga cggtgccgct gcagccgggg 2460
cagatgcccg agtaccacaa ccggctgatc gaacggaagg tcgcccaact ggacggccac 2520
aagtctctgt actcgacggc gttctactcg cgtgaggagt tctggcggca ctacgacggg 2580
gaaacctacc ggcgtctgaa ggacacctac gaccccgacg cgcgcctgct cgacctctac 2640
gacaagtgcg tgcggggacg ctga 2664

Claims (49)

1.一种细胞,其包括重组甲基转移酶基因和支化(甲基)脂质,其中:
所述支化(甲基)脂质是羧酸、羧酸酯、酯、硫酯或酰胺;并且
所述支化(甲基)脂质包括包含支化甲基的饱和或不饱和支化脂肪族链。
2.根据权利要求1所述的细胞,其中所述支化(甲基)脂质包括具有14-20个碳的链长度和在Δ9、Δ10或Δ11位置的甲基分支的线性脂质。
3.根据权利要求2所述的细胞,其中所述支化(甲基)脂质是二酰甘油、三酰甘油或磷脂,并且所述二酰甘油、三酰甘油或磷脂包括10-甲基硬脂酸酯的酯。
4.一种细胞,其包括重组甲基转移酶基因和环外亚甲基取代的脂质,其中:
所述环外亚甲基取代的脂质是羧酸、羧酸酯、酯、硫酯或酰胺;
所述环外亚甲基取代的脂质包括支化脂肪族链;并且
所述脂肪族链是支化的是因为所述脂肪族链经环外亚甲基取代。
5.根据权利要求4所述的细胞,其中所述环外亚甲基取代的脂质包括具有14-20个碳的链长度和在Δ9、Δ10或Δ11位置的亚甲基部分的线性脂质。
6.根据权利要求5所述的细胞,其中所述环外亚甲基取代的脂质是二酰甘油、三酰甘油或磷脂,并且所述二酰甘油、三酰甘油或磷脂包括10-亚甲基硬脂酸酯的酯。
7.根据权利要求1到6中任一项所述的细胞,其中所述细胞的以重量计至少约1%的脂肪酸是一种或多种具有14-20个碳的链长度和在Δ9、Δ10或Δ11位置的甲基分支的线性脂肪酸。
8.根据权利要求1到7中任一项所述的细胞,其中如通过细胞干重%所测量,所述细胞包括至少约1%脂质。
9.根据权利要求1到8中任一项所述的细胞,其中所述重组甲基转移酶基因编码来自放线菌的革兰氏阳性物种的甲基转移酶蛋白质。
10.根据权利要求9所述的细胞,其中所述放线菌的革兰氏阳性物种是分枝杆菌属(Mycobacteria)、棒杆菌属(Corynebacteria)、诺卡尔菌属(Nocardia)、链霉菌属(Streptomyces)或红球菌属(Rhodococcus)。
11.根据权利要求1到10中任一项所述的细胞,其中所述重组甲基转移酶基因编码选自以下的甲基转移酶蛋白质:耻垢分枝杆菌(Mycobacterium smegmatis)酶tmsB、苏别蒂山农霉菌(Agromyces subbeticus)酶tmsB、浅黄拟无枝酸球菌(Amycolicicoccus subflavus)酶tmsB、谷氨酸棒状杆菌(Corynebacterium glutamicum)酶tmsB、甘氨酸棒状杆菌(Corynebacterium glyciniphilium)酶tmsB、气生诺尔氏菌(Knoella aerolata)酶tmsB、南非分枝杆菌(Mycobacterium austroafricanum)酶tmsB、淡黄分枝杆菌(Mycobacteriumgilvum)酶tmsB、普拉尼亚分枝杆菌(Mycobacterium indicus pranii)酶tmsB、草分枝杆菌(Mycobacterium phlei)酶tmsB、结核分枝杆菌(Mycobacterium tuberculosis)酶tmsB、范巴伦氏分枝杆菌(Mycobacterium vanbaalenii)酶tmsB、浑浊红球菌(Rhodococcusopacus)酶tmsB、拉格西斯链霉菌(Streptomyces regnsis)酶tmsB、嗜热子囊菌(Thermobifida fusca)酶tmsB和弯曲嗜热单胞菌(Thermomonospora curvata)酶tmsB。
12.根据权利要求1到11中任一项所述的细胞,其进一步包括重组还原酶基因。
13.根据权利要求12所述的细胞,其中所述重组还原酶基因编码选自以下的还原酶蛋白质:耻垢分枝杆菌酶tmsA、苏别蒂山农霉菌酶tmsA、浅黄拟无枝酸球菌酶tmsA、谷氨酸棒状杆菌酶tmsA、甘氨酸棒状杆菌酶tmsA、气生诺尔氏菌酶tmsA、南非分枝杆菌酶tmsA、淡黄分枝杆菌酶tmsA、普拉尼亚分枝杆菌酶tmsA、草分枝杆菌酶tmsA、结核分枝杆菌酶tmsA、范巴伦氏分枝杆菌酶tmsA、浑浊红球菌酶tmsA、拉格西斯链霉菌酶tmsA、嗜热子囊菌酶tmsA和弯曲嗜热单胞菌酶tmsA。
14.根据权利要求1到13中任一项所述的细胞,其中:
所述重组甲基转移酶基因针对所述细胞经密码子优化;或
所述细胞进一步包括重组还原酶基因并且所述重组还原酶基因针对所述细胞经密码子优化。
15.根据权利要求1到14中任一项所述的细胞,其中:
所述重组甲基转移酶基因操作性连接到能在所述细胞中驱动所述重组甲基转移酶基因转录的启动子;或
所述细胞进一步包括重组还原酶基因并且所述重组还原酶基因操作性连接到能在所述细胞中驱动所述重组还原酶基因转录的启动子。
16.根据权利要求15所述的细胞,其中:
所述细胞是酵母物种并且所述启动子是酵母启动子;
所述细胞是细菌物种并且所述启动子是细菌启动子;
所述细胞是藻类物种并且所述启动子是藻类启动子;或
所述细胞是植物物种并且所述启动子是植物启动子。
17.根据权利要求15或16所述的细胞,其中所述启动子是组成型启动子。
18.根据权利要求1到17中任一项所述的细胞,其中所述细胞选自由藻类、细菌、霉菌、真菌、植物和酵母组成的组。
19.根据权利要求18所述的细胞,其中所述细胞是酵母、真菌或酵母样藻类。
20.根据权利要求19所述的细胞,其中所述细胞选自由以下组成的组:阿氏酵母属(Arxula)、曲霉属(Aspegillus)、橙壶菌属(Aurantiochytrium)、念珠菌属(Candida)、麦角菌属(Claviceps)、隐球菌属(Cryptococcus)、小克银汉霉属(Cunninghamella)、地丝菌属(Geotrichum)、汉逊酵母属(Hansenula)、克鲁维酵母属(Kluyveromyces)、柯达酵母属(Kodamaea)、白冬孢酵母属(Leucosporidiella)、油脂酵母属(Lipomyces)、被孢霉属(Mortierella)、欧格酵母属(Ogataea)、毕赤酵母属(Pichia)、原壁菌属(Prototheca)、根霉菌属(Rhizopus)、红冬孢酵母属(Rhodosporidium)、红酵母属(Rhodotorula)、酵母菌属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)、银耳属(Tremella)、毛孢子菌属(Trichosporon)、威克汉姆酵母属(Wickerhamomyces)和耶氏酵母属(Yarrowia)。
21.根据权利要求20所述的细胞,其中所述细胞选自由以下组成的组:腺嘌呤阿氏酵母(Arxula adeninivorans)、黑曲霉菌(Aspergillus niger)、米曲霉菌(Aspergillusorzyae)、土曲霉菌(Aspergillus terreus)、裂殖壶菌(Aurantiochytrium limacinum)、产朊假丝酵母(Candida utilis)、紫麦角菌(Claviceps purpurea)、浅白隐球菌(Cryptococcus albidus)、弯曲隐球菌(Cryptococcus curvatus)、拉米隐球菌(Cryptococcus ramirezgomezianus)、土生隐球菌(Cryptococcus terreus)、威氏隐球菌(Cryptococcus wieringae)、刺孢小克银汉霉(Cunninghamella echinulata)、山茶小克银汉霉(Cunninghamella japonica)、发酵地霉酵母(Geotrichum fermentans)、多形汉逊酵母(Hansenula polymorpha)、乳酸克鲁维酵母(Kluyveromyces lactis)、马克斯克鲁维酵母(Kluyveromyces marxianus)、奥默柯达酵母(Kodamaea ohmeri)、克雷氏白冬孢酵母(Leucosporidiella creatinivora)、产油油脂酵母(Lipomyces lipofer)、斯达油脂酵母(Lipomyces starkeyi)、子囊菌油脂酵母(Lipomyces tetrasporus)、深黄被孢霉(Mortierella isabellina)、高山被孢霉(Mortierella alpina)、多形欧格酵母(Ogataeapolymorpha)、西弗毕赤酵母(Pichia ciferrii)、季也蒙毕赤酵母(Pichiaguilliermondii)、巴斯德毕赤酵母(Pichia pastoris)、树干毕赤酵母(Pichiastipites)、饶氏原壁菌(Prototheca zopfii)、少根根霉(Rhizopus arrhizus)、贝吉维红冬孢酵母(Rhodosporidium babjevae)、圆红冬孢酵母(Rhodosporidium toruloides)、沼泽生红冬孢酵母(Rhodosporidium paludigenum)、黏红酵母(Rhodotorula glutinis)、胶红酵母(Rhodotorula mucilaginosa)、酿酒酵母(Saccharomyces cerevisiae)、粟酒裂殖酵母(Schizosaccharomyces pombe)、恩氏银耳(Tremella enchepala)、皮肤毛孢子菌(Trichosporon cutaneum)、发酵性丝孢酵母(Trichosporon fermentans)、威克汉姆西弗酵母(Wickerhamomyces ciferrii)和解脂耶氏酵母(Yarrowia lipolytica)。
22.根据权利要求21所述的细胞,其中所述细胞选自由以下组成的组:腺嘌呤阿氏酵母、酿酒酵母和解脂耶氏酵母。
23.根据权利要求1到22中任一项所述的细胞,其中所述细胞包括由所述重组甲基转移酶基因编码的甲基转移酶蛋白质,并且所述甲基转移酶蛋白质包括以下两者中的任一项:
与SEQ ID NO:4、SEQ ID NO:8、SEQ ID NO:12、SEQ ID NO:16、SEQ ID NO:20、SEQ IDNO:26、SEQ ID NO:30、SEQ ID NO:36、SEQ ID NO:42、SEQ ID NO:46、SEQ ID NO:50、SEQ IDNO:54、SEQ ID NO:60、SEQ ID NO:64、SEQ ID NO:70或SEQ ID NO:76中所示氨基酸序列具有至少约95%序列同一性的氨基酸序列;或
SEQ ID NO:4、SEQ ID NO:8、SEQ ID NO:12、SEQ ID NO:16、SEQ ID NO:20、SEQ ID NO:26、SEQ ID NO:30、SEQ ID NO:36、SEQ ID NO:42、SEQ ID NO:46、SEQ ID NO:50、SEQ IDNO:54、SEQ ID NO:60、SEQ ID NO:64、SEQ ID NO:70或SEQ ID NO:76中所示的氨基酸序列。
24.根据权利要求1到23中任一项所述的细胞,其中所述重组甲基转移酶基因包括以下两者中的任一项:
与SEQ ID NO:3、SEQ ID NO:7、SEQ ID NO:11、SEQ ID NO:15、SEQ ID NO:19、SEQ IDNO:25、SEQ ID NO:29、SEQ ID NO:35、SEQ ID NO:41、SEQ ID NO:45、SEQ ID NO:49、SEQ IDNO:53、SEQ ID NO:59、SEQ ID NO:63、SEQ ID NO:69、SEQ ID NO:75或SEQ ID NO:81中所示核苷酸序列具有至少约95%序列同一性的核苷酸序列;或
SEQ ID NO:3、SEQ ID NO:7、SEQ ID NO:11、SEQ ID NO:15、SEQ ID NO:19、SEQ ID NO:25、SEQ ID NO:29、SEQ ID NO:35、SEQ ID NO:41、SEQ ID NO:45、SEQ ID NO:49、SEQ IDNO:53、SEQ ID NO:59、SEQ ID NO:63、SEQ ID NO:69、SEQ ID NO:75或SEQ ID NO:81中所示的核苷酸序列。
25.根据权利要求1到24中任一项所述的细胞,其中所述细胞包括由重组还原酶基因编码的还原酶蛋白质,并且所述还原酶蛋白质包括以下两者中的任一项:
与SEQ ID NO:2、SEQ ID NO:6、SEQ ID NO:10、SEQ ID NO:14、SEQ ID NO:18、SEQ IDNO:24、SEQ ID NO:28、SEQ ID NO:34、SEQ ID NO:40、SEQ ID NO:44、SEQ ID NO:48、SEQ IDNO:52、SEQ ID NO:58、SEQ ID NO:62、SEQ ID NO:68或SEQ ID NO:74中所示氨基酸序列具有至少约95%序列同一性的氨基酸序列;或
SEQ ID NO:2、SEQ ID NO:6、SEQ ID NO:10、SEQ ID NO:14、SEQ ID NO:18、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NO:34、SEQ ID NO:40、SEQ ID NO:44、SEQ ID NO:48、SEQ IDNO:52、SEQ ID NO:58、SEQ ID NO:62、SEQ ID NO:68或SEQ ID NO:74中所示的序列。
26.根据权利要求1到25中任一项所述的细胞,其中所述细胞包括重组还原酶基因,并且所述重组还原酶基因包括以下两者中的任一项:
与SEQ ID NO:1、SEQ ID NO:5、SEQ ID NO:9、SEQ ID NO:13、SEQ ID NO:17、SEQ IDNO:23、SEQ ID NO:27、SEQ ID NO:33、SEQ ID NO:39、SEQ ID NO:43、SEQ ID NO:47、SEQ IDNO:51、SEQ ID NO:57、SEQ ID NO:61、SEQ ID NO:67、SEQ ID NO:73或SEQ ID NO:80中所示核苷酸序列具有至少约95%序列同一性的核苷酸序列;或
SEQ ID NO:1、SEQ ID NO:5、SEQ ID NO:9、SEQ ID NO:13、SEQ ID NO:17、SEQ ID NO:23、SEQ ID NO:27、SEQ ID NO:33、SEQ ID NO:39、SEQ ID NO:43、SEQ ID NO:47、SEQ IDNO:51、SEQ ID NO:57、SEQ ID NO:61、SEQ ID NO:67、SEQ ID NO:73或SEQ ID NO:80中所示的核苷酸序列。
27.根据权利要求1到26中任一项所述的细胞,其中与所述细胞为相同物种的未经修饰的细胞不包括所述支化(甲基)脂质或环外亚甲基取代的脂质。
28.根据权利要求1到27中任一项所述的细胞,其中所述细胞组成型表达由所述重组甲基转移酶基因编码的蛋白质。
29.一种产生支化(甲基)脂质或环外亚甲基取代的脂质的方法,其包括使根据权利要求1到28中任一项所述的细胞与油酸、甲硫氨酸或油酸和甲硫氨酸二者接触。
30.一种核酸,其包括重组甲基转移酶基因和操作性连接到所述重组甲基转移酶基因的组成型启动子,其中所述启动子是真核启动子,并且所述重组甲基转移酶基因编码以下两者中的任一项:
与SEQ ID NO:4、SEQ ID NO:8、SEQ ID NO:12、SEQ ID NO:16、SEQ ID NO:20、SEQ IDNO:26、SEQ ID NO:30、SEQ ID NO:36、SEQ ID NO:42、SEQ ID NO:46、SEQ ID NO:50、SEQ IDNO:54、SEQ ID NO:60、SEQ ID NO:64、SEQ ID NO:70或SEQ ID NO:76中所示氨基酸序列具有至少约95%序列同一性的氨基酸序列;或
SEQ ID NO:4、SEQ ID NO:8、SEQ ID NO:12、SEQ ID NO:16、SEQ ID NO:20、SEQ ID NO:26、SEQ ID NO:30、SEQ ID NO:36、SEQ ID NO:42、SEQ ID NO:46、SEQ ID NO:50、SEQ IDNO:54、SEQ ID NO:60、SEQ ID NO:64、SEQ ID NO:70或SEQ ID NO:76中所示的氨基酸序列。
31.根据权利要求30所述的核酸,其中:
所述重组甲基转移酶基因编码来自放线菌的革兰氏阳性物种的蛋白质;并且
所述重组甲基转移酶基因针对在酵母、藻类或植物中的表达经密码子优化。
32.根据权利要求30或31所述的核酸,其进一步包括重组还原酶基因,其中所述重组还原酶基因编码以下两者中的任一项:
与SEQ ID NO:2、SEQ ID NO:6、SEQ ID NO:10、SEQ ID NO:14、SEQ ID NO:18、SEQ IDNO:24、SEQ ID NO:28、SEQ ID NO:34、SEQ ID NO:40、SEQ ID NO:44、SEQ ID NO:48、SEQ IDNO:52、SEQ ID NO:58、SEQ ID NO:62、SEQ ID NO:68或SEQ ID NO:74中所示氨基酸序列具有至少约95%序列同一性的氨基酸序列;或
SEQ ID NO:2、SEQ ID NO:6、SEQ ID NO:10、SEQ ID NO:14、SEQ ID NO:18、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NO:34、SEQ ID NO:40、SEQ ID NO:44、SEQ ID NO:48、SEQ IDNO:52、SEQ ID NO:58、SEQ ID NO:62、SEQ ID NO:68或SEQ ID NO:74中所示的序列。
33.一种核酸,其包括重组还原酶基因和操作性连接到所述重组还原酶基因的组成型启动子,其中所述启动子是真核启动子,并且所述重组还原酶基因编码以下两者中的任一项:
与SEQ ID NO:2、SEQ ID NO:6、SEQ ID NO:10、SEQ ID NO:14、SEQ ID NO:18、SEQ IDNO:24、SEQ ID NO:28、SEQ ID NO:34、SEQ ID NO:40、SEQ ID NO:44、SEQ ID NO:48、SEQ IDNO:52、SEQ ID NO:58、SEQ ID NO:62、SEQ ID NO:68或SEQ ID NO:74中所示氨基酸序列具有至少约95%序列同一性的氨基酸序列;或
SEQ ID NO:2、SEQ ID NO:6、SEQ ID NO:10、SEQ ID NO:14、SEQ ID NO:18、SEQ ID NO:24、SEQ ID NO:28、SEQ ID NO:34、SEQ ID NO:40、SEQ ID NO:44、SEQ ID NO:48、SEQ IDNO:52、SEQ ID NO:58、SEQ ID NO:62、SEQ ID NO:68或SEQ ID NO:74中所示的序列。
34.根据权利要求33所述的核酸,其中:
所述重组还原酶基因编码来自放线菌的革兰氏阳性物种的蛋白质;并且
所述重组还原酶基因针对在酵母、藻类或植物中的表达经密码子优化。
35.根据权利要求33或34所述的核酸,其进一步包括重组甲基转移酶基因,其中所述重组甲基转移酶基因编码以下两者中的任一项:
与SEQ ID NO:4、SEQ ID NO:8、SEQ ID NO:12、SEQ ID NO:16、SEQ ID NO:20、SEQ IDNO:26、SEQ ID NO:30、SEQ ID NO:36、SEQ ID NO:42、SEQ ID NO:46、SEQ ID NO:50、SEQ IDNO:54、SEQ ID NO:60、SEQ ID NO:64、SEQ ID NO:70或SEQ ID NO:76中所示氨基酸序列具有至少约95%序列同一性的氨基酸序列;或
SEQ ID NO:4、SEQ ID NO:8、SEQ ID NO:12、SEQ ID NO:16、SEQ ID NO:20、SEQ ID NO:26、SEQ ID NO:30、SEQ ID NO:36、SEQ ID NO:42、SEQ ID NO:46、SEQ ID NO:50、SEQ IDNO:54、SEQ ID NO:60、SEQ ID NO:64、SEQ ID NO:70或SEQ ID NO:76中所示的氨基酸序列。
36.根据权利要求35所述的核酸,其中:
所述重组甲基转移酶基因编码来自放线菌的革兰氏阳性物种的蛋白质;并且
所述重组甲基转移酶基因针对在酵母、藻类或植物中的表达经密码子优化。
37.根据权利要求35或36所述的核酸,其中所述重组甲基转移酶基因和所述重组还原酶基因是编码融合蛋白质的单一开放阅读框的一部分。
38.根据权利要求25所述的细胞,其中所述还原酶蛋白质和所述甲基转移酶蛋白质是单一融合蛋白质的一部分。
39.根据权利要求26所述的细胞,其中所述重组还原酶基因和所述重组甲基转移酶基因是编码融合蛋白质的单一开放阅读框的一部分。
40.一种油组合物,其是通过培养包括根据权利要求1到28中任一项所述的细胞的细胞培养物和从所述细胞培养物回收所述油组合物来产生的。
41.根据权利要求40所述的油组合物,其包含具有14-20个碳的链长度和在Δ9、Δ10或Δ11位置的甲基分支的一种或多种脂肪酸。
42.根据权利要求41所述的油组合物,其中所述一种或多种脂肪酸占所述油组合物中总脂肪酸的重量的至少1%。
43.根据权利要求46或47所述的油组合物,其中所述一种或多种脂肪酸占所述组合物中总脂肪酸的重量的至少约15%。
44.一种油组合物,其是通过培养细胞培养物和从所述细胞培养物回收所述油组合物来产生,其中所述油组合物包含10-甲基脂肪酸,并且其中所述10-甲基脂肪酸占所述油组合物中总脂肪酸的重量的至少约1%。
45.根据权利要求49所述的油组合物,其中所述10-甲基脂肪酸占所述油组合物中总脂肪酸的重量的至少约15%。
46.根据权利要求44所述的油组合物,其中所述细胞培养物包括根据权利要求1到28中任一项所述的细胞。
47.一种产生油组合物的方法,所述方法包括:
培养包括根据权利要求1到28中任一项所述的细胞的细胞培养物;
从所述细胞培养物回收所述油组合物。
48.根据权利要求47所述的方法,其进一步包括使所述细胞培养物与油酸、甲硫氨酸或油酸和甲硫氨酸二者接触。
49.根据权利要求47或48所述的方法,其中从所述细胞培养物回收所述油组合物包括回收已由所述细胞分泌的脂质。
CN201780071492.5A 2016-09-20 2017-09-20 10-甲基硬脂酸的异源性产生 Pending CN109996874A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201662396870P 2016-09-20 2016-09-20
US62/396,870 2016-09-20
PCT/US2017/052491 WO2018057607A1 (en) 2016-09-20 2017-09-20 Heterologous production of 10-methylstearic acid

Publications (1)

Publication Number Publication Date
CN109996874A true CN109996874A (zh) 2019-07-09

Family

ID=61690648

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780071492.5A Pending CN109996874A (zh) 2016-09-20 2017-09-20 10-甲基硬脂酸的异源性产生

Country Status (6)

Country Link
US (4) US10457963B2 (zh)
EP (1) EP3516049A4 (zh)
CN (1) CN109996874A (zh)
BR (1) BR112019005270A2 (zh)
CA (1) CA3036903A1 (zh)
WO (1) WO2018057607A1 (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2937376A1 (en) 2014-02-26 2015-09-03 Elevance Renewable Sciences, Inc. Low-voc compositions and methods of making and using the same
US9988624B2 (en) 2015-12-07 2018-06-05 Zymergen Inc. Microbial strain improvement by a HTP genomic engineering platform
US11208649B2 (en) 2015-12-07 2021-12-28 Zymergen Inc. HTP genomic engineering platform
CN109996874A (zh) * 2016-09-20 2019-07-09 诺沃吉公司 10-甲基硬脂酸的异源性产生
BR112020005278A2 (pt) * 2017-09-20 2020-09-24 Novogy, Inc. produção heteróloga de ácido 10-metil esteárico por células que expressam metil transferase recombinante
WO2020193681A1 (en) 2019-03-26 2020-10-01 Novogy, Inc. Derivatives of 10-methylene lipids, process for preparing such derivatives and use thereof
US11781159B2 (en) 2019-10-15 2023-10-10 ExxonMobil Technology and Engineering Company Formation and isolation of hydroxycarboxylic acids via a sophorolipid intermediate
EP4136124A1 (en) 2020-04-17 2023-02-22 Totalenergies Onetech Monomers, oligomers and polymers of sugars functionalized with straight or branched fatty acids and derivatives, their compositions and uses

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1108790A2 (en) * 1999-12-16 2001-06-20 Kyowa Hakko Kogyo Co., Ltd. Novel polynucleotides
US7166766B1 (en) * 2000-04-03 2007-01-23 Total Raffinage Distribution S.A. Method for producing branched fatty acids using genetically modified plants
US20100115669A1 (en) * 2004-01-30 2010-05-06 Michigan State University Plant Cyclopropane Fatty Acid Synthase Genes, Proteins, And Uses Thereof
WO2015168531A1 (en) * 2014-05-01 2015-11-05 Novogy, Inc. Increasing cellular lipid production by increasingthe activity of diacylglycerol acyltransferase and decreasing the activity of triacylglycerol lipase

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000061740A1 (en) 1999-04-10 2000-10-19 Maxygen, Inc. Modified lipid production
US9096813B2 (en) * 2008-09-30 2015-08-04 Shell Oil Company Grease composition
US8530221B2 (en) * 2010-01-14 2013-09-10 Ls9, Inc. Production of branched chain fatty acids and derivatives thereof in recombinant microbial cells
AU2015266785B2 (en) 2014-05-29 2021-11-18 Ginkgo Bioworks, Inc. Increasing lipid production and optimizing lipid composition
CN109996874A (zh) * 2016-09-20 2019-07-09 诺沃吉公司 10-甲基硬脂酸的异源性产生

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1108790A2 (en) * 1999-12-16 2001-06-20 Kyowa Hakko Kogyo Co., Ltd. Novel polynucleotides
US7166766B1 (en) * 2000-04-03 2007-01-23 Total Raffinage Distribution S.A. Method for producing branched fatty acids using genetically modified plants
US20100115669A1 (en) * 2004-01-30 2010-05-06 Michigan State University Plant Cyclopropane Fatty Acid Synthase Genes, Proteins, And Uses Thereof
WO2015168531A1 (en) * 2014-05-01 2015-11-05 Novogy, Inc. Increasing cellular lipid production by increasingthe activity of diacylglycerol acyltransferase and decreasing the activity of triacylglycerol lipase

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
GENBANK: BAB97966.1: "Cyclopropane fatty acid synthase and related methyltransferases [Corynebacterium glutamicum ATCC 13032]", 《GENBANK》 *
NCBI: "cyclopropane-fatty-acyl-phospholipid synthase [Thermomonospora curvata WP_012851934.1", NCBI *
NCBI: "FAD linked oxidase domain-containing protein [Thermomonospora curvata] WP_012851933.1", NCBI *
NCBI: "Thermomonospora curvata DSM 43183, complete genome CP001738.1", NCBI *

Also Published As

Publication number Publication date
BR112019005270A2 (pt) 2019-06-04
EP3516049A4 (en) 2020-08-19
US10975398B2 (en) 2021-04-13
US10457963B2 (en) 2019-10-29
WO2018057607A1 (en) 2018-03-29
EP3516049A1 (en) 2019-07-31
CA3036903A1 (en) 2018-03-29
WO2018057607A9 (en) 2019-04-25
US20180105848A1 (en) 2018-04-19
US20210269835A1 (en) 2021-09-02
US20200123579A1 (en) 2020-04-23
US20240084340A1 (en) 2024-03-14

Similar Documents

Publication Publication Date Title
KR102319845B1 (ko) 조류 숙주 세포에 대한 crispr-cas 시스템
RU2763170C2 (ru) Производство олигосахаридов человеческого молока в микроорганизмах-хозяевах с модифицированным импортом/экспортом
CN108026523B (zh) 向导rna组装载体
DK2087105T3 (da) Delta 17-desaturase og anvendelse heraf ved fremstilling af flerumættede fedtsyrer
KR102628801B1 (ko) 세포내 유전자 변형 및 증가된 상동 재조합을 위한 보호 dna 주형 및 이용 방법
CN101437953B (zh) 用于改变含油生物的多不饱和脂肪酸和油含量的二酰基甘油酰基转移酶
AU2016203445B2 (en) Integration of a polynucleotide encoding a polypeptide that catalyzes pyruvate to acetolactate conversion
DK2087106T3 (en) MUTATING DELTA8 DESATURATION GENES CONSTRUCTED BY TARGETED MUTAGENES AND USE THEREOF IN THE MANUFACTURE OF MULTI-Saturated FAT ACIDS
CN109996874A (zh) 10-甲基硬脂酸的异源性产生
CN109563505A (zh) 用于真核细胞的组装系统
DK2324119T3 (en) Mutant DELTA5 Desaturases AND USE THEREOF FOR THE PRODUCTION OF polyunsaturated fatty acids
DK2576605T3 (en) PREPARATION OF METABOLITES
DK2443248T3 (en) IMPROVEMENT OF LONG-CHAIN POLYUM Saturated OMEGA-3 AND OMEGA-6 FATTY ACID BIOS SYNTHESIS BY EXPRESSION OF ACYL-CoA LYSOPHOSPHOLIPID ACYL TRANSFERASES
CN101646766B (zh) △17去饱和酶及其用于制备多不饱和脂肪酸的用途
KR20120099509A (ko) 재조합 숙주 세포에서 육탄당 키나아제의 발현
KR20140099224A (ko) 케토-아이소발레레이트 데카르복실라제 효소 및 이의 이용 방법
KR20130138760A (ko) 고농도의 에이코사펜타엔산 생성을 위한 재조합 미생물 숙주 세포
CA3109035A1 (en) Microorganisms engineered to use unconventional sources of nitrogen
KR20220012327A (ko) 피토칸나비노이드 및 피토칸나비노이드 전구체의 생산을 위한 방법 및 세포
KR20200022486A (ko) 조작되고 완전-기능 맞춤 당단백질
CN115927299A (zh) 增加双链rna产生的方法和组合物
CN109843909B (zh) 利用替代的葡萄糖转运蛋白产生鼠李糖脂的细胞和方法
CN115698297A (zh) 多模块生物合成酶基因组合文库的制备方法
DK2935601T3 (en) RECOMBINANT MICROBELL CELLS PRODUCING AT LEAST 28% EICOSAPENTAIC ACID AS DRY WEIGHT
CN101883843A (zh) 破坏过氧化物酶体生物合成因子蛋白(pex)以改变含油真核生物中多不饱和脂肪酸和总脂质含量

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20211222

Address after: Massachusetts

Applicant after: Ginkgo Biological Products Co.

Address before: Massachusetts

Applicant before: NOVOGY, Inc.

WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20190709