丝状真菌来源的赖氨酰氧化酶
技术领域
本发明涉及丝状真菌来源的赖氨酰氧化酶及编码它的DNA,及其应用。
技术背景
丝状真菌中尤其是包含米曲霉(黄色曲霉属)等的曲霉在日本传统上用于酿造业,制备清酒、豆酱、酱油、米酒(mirin)等,是可直接食用的菌类,是美国FDA(食品及药物管理局)归属到GRAS(GenerallyRecognized as Safe)的安全的基因来源。
普通真菌来源的基因用到食品时所进行的必要的慢性毒性检查等安全审查时,普通真菌来源的基因大约花费10亿日元,与此相对,上述GRAS级别的基因具有这样的优点:其花费大约是普通真菌的1/3,并且审查花费的时间也短。
因此,从安全性和经济性观点来看,可以说丝状真菌尤其是曲霉是利用价值极高的基因宝库。与本发明相关的技术公开在下述文献中。专利第2796114号公报(专利文献1),专利第2977245号公报(专利文献2)。
发明公开
通过阐明这些真菌基因组DNA信息,阐明其编码的基因等的功能,可如利用生物技术的物质生产那样,在食品生产中提供安全基因资源的有效应用方法,在农药及医药领域提供对各种基因筛选有用的信息。
此外,还可提供分析黄曲霉(Aspergillus flavus)、烟曲霉(Aspergillus fumigatus)等近源谷物污染菌、人感染菌的基因组信息有用的工具。
为了上述课题本发明者们进行了研究,结果成功地分析了米曲霉(曲霉菌的一种)的基因组,确定出其碱基序列(及其编码的氨基酸序列)及其各种功能等。在所得结果基础上,本发明公开了原专利(专利2001-403261)中米曲霉来源的各种DNA,以及由这些DNA制备的核苷酸序列组成的扩增GRAS级别的丝状真菌基因用的引物及检测丝状真菌基因用的探针。
本发明者们以所得曲霉菌基因组信息为基础进行了进一步研究。即,本发明者们注意到赖氨酰氧化酶,从所得碱基序列中确定出编码赖氨酰氧化酶的序列,另外还尝试确定该序列编码的蛋白质的氨基酸序列。另外,赖氨酰氧化酶是胺氧化酶的一种,通过氧化蛋白质中的赖氨酸残基而使赖氨酸残基间形成交联。很久以来人们知道存在动物来源的赖氨酰氧化酶,赖氨酰氧化酶通过蛋白质间的交联作用而用于提高食感(例如参照上述专利文献1和2)。近年来人们对微生物来源的赖氨酰氧化酶有所研究,从巴斯德毕赤酵母(Pichia Pastoris)来源的赖氨酰氧化酶与哺乳动物来源的具有类似的底物特异性(FEBSLett.1988,238,74-76)。人们发现毕赤酵母来源赖氨酰氧化酶不仅与哺乳动物来源的性质相似,而且与细菌类,如大肠杆菌(Escherichiacoli)、球形节杆菌(Arthrobacter globiformis)等的胺氧化酶具有类似的结构(J Inorg Biochem.2001,83(2-3):193-204)。但是,到目前为止尚没有从与酵母同为高等微生物的丝状真菌成功分离赖氨酰氧化酶的报道。
本发明者们进行了认真研究,结果在曲霉菌的基因组中成功发现了与已报道的巴斯德毕赤酵母(Pichia Pastoris)来源的赖氨酰氧化酶基因同源性高的序列。当用丝状真菌为宿主表达该序列编码的蛋白质时显示赖氨酰氧化酶活性。由该结果可实验性确认该序列编码赖氨酰氧化酶。另一方面,成功确定了该序列中的编码区域,发现该下列编码的蛋白质具有新型的氨基酸序列。如此,本发明者们首次成功鉴定了丝状真菌来源的赖氨酰氧化酶基因及其氨基酸序列。
本发明是在以上结果的基础上完成的,本发明中具体的课题是提供丝状真菌来源的赖氨酰氧化酶及编码它的DNA,以及该丝状真菌来源的赖氨酰氧化酶的生产方法。为了解决上述课题,提供以下配置:
[1]由以下(a)或(b)的蛋白质组成的赖氨酰氧化酶:
(a)具有序列号2中所示氨基酸序列的蛋白质;
(b)具有序列号2中所示氨基酸序列经部分改变的氨基酸序列、能作为赖氨酰氧化酶发挥作用的蛋白质。
[2]以下(A)或(B)的DNA:
(A)编码[1]中记载的赖氨酰氧化酶的DNA;
(B)在严紧条件下与(A)中的DNA杂交,其编码的蛋白质能作为赖氨酰氧化酶发挥作用的DNA。
[3]具有以下(i)-(iii)中任一序列的DNA:
(i)序列号3中所示碱基序列;
(ii)序列号4中所示碱基序列;
(iii)序列号5中所示碱基序列;
(iv)序列号6中所示碱基序列;
(v)序列号1中所示碱基序列;
(vi)序列号7中所示碱基序列。
[4]携带[2]或[3]中DNA的载体。
[5]外源导入了[2]或[3]中DNA的丝状真菌。
[6]包括下面步骤(1)和(2)的赖氨酰氧化酶的生产方法:
(1)在可能产生前述DNA编码的蛋白质的条件下培养[5]中丝状真菌的步骤,及
(2)回收产生的蛋白质的步骤。
本发明中的“DNA”不限于双链,还包括构成它的单链DNA(正义链和反义链)。另外,本发明的DNA包含考虑到简并密码子的任意碱基序列。而且其形式也不限定,包括cDNA、基因组DNA和合成DNA。
本发明中“编码蛋白质的DNA”是指当表达该DNA时能获得该蛋白质的DNA,具有与该蛋白质的氨基酸序列相对应的碱基序列的DNA自不用说,它还包括向上述DNA中添加了不编码氨基酸序列的序列的DNA(例如,包含1个或多个内含子的DNA)。
本发明中“丝状真菌来源的赖氨酰氧化酶”是指以丝状真菌为原始材料制备的赖氨酰氧化酶,或者在获得的过程中利用丝状真菌保持赖氨酰氧化酶的信息(氨基酸序列和DNA序列而制备的赖氨酰氧化酶,它不仅包括用物理方法和化学方法等从丝状真菌制备出的赖氨酰氧化酶,而且包括利用基因工程学技术用本发明中公开的赖氨酰氧化酶的氨基酸序列或DNA序列而制备的赖氨酰氧化酶。
附图简述
图1是载体pBALO的构建程序模式图。
图2表示用载体pBALO转化的丝状真菌进行赖氨酰氧化酶活性测定的结果表(上部分)和图(下部分)。ABPU1表示对照(应用构巢曲霉ABPU1株的培养上清的样品)。
图3是以从携带赖氨酰氧化酶基因的转化体中提取的RNA为模板,用该基因特异的引物扩增的3’DNA片段的序列。下划线部分表示使用引物(LO-3’)的位置。
图4是载体pBALO-D的构建程序模式图。
图5表示用载体pBALO-D转化的丝状真菌进行赖氨酰氧化酶活性测定的结果表(上部分)和图(下部分)。ABPU1表示对照(应用构巢曲霉ABPU1株的培养上清的样品)。
实施发明的最佳状态
(蛋白质)
本发明的第1方面涉及丝状真菌来源的赖氨酰氧化酶。本发明提供的赖氨酰氧化酶由例如具有序列号2中氨基酸序列的蛋白质组成。如后述的实施例所示,应用丝状真菌的表达体系,可证实该蛋白质确实显示赖氨酰氧化酶活性。
这里,通常对某种蛋白质的氨基酸序列实施部分改变时,改变后的蛋白质与改变前的蛋白质具有同等的功能。即,氨基酸序列的改变基本上对蛋白质的功能无影响,改变前后能维持蛋白质的功能。考虑到这一点,部分改变上述具有赖氨酰氧化酶活性的蛋白质的氨基酸序列(序列号2),即便是拥有改变氨基酸序列的蛋白质(以下,叫做“改变蛋白质”)只要其具有赖氨酰氧化酶功能也可构成本发明的赖氨酰氧化酶(蛋白质)。换言之,只要是能维持赖氨酰氧化酶的功能允许部分氨基酸的改变。另外,优选改变前后赖氨酰氧化酶的活性未降低,但多少有些变动(上升或降低)也可以。
这里所讲的“氨基酸序列的一部分可以被改变”指氨基酸序列中1个或多个氨基酸被删除、替换、添加和/或插入。只要是能维持赖氨酰氧化酶的功能,氨基酸序列改变(突变)的位置无特殊限定,此外也可有多个位置发生改变。被改变的氨基酸数可以是,例如占总氨基酸数的10%以内,优选在总氨基酸数目的5%以内。此外,优选占总氨基酸数的1%以内。如上改变蛋白质可用基因工程学技术进行制备,例如制备给序列号2中氨基酸序列的碱基序列加入改变的核酸片段,在适当的表达体系中使之表达等。
本发明的蛋白质(包含改变蛋白质)中对于天然丝状真菌中存在的,可通过从丝状真菌中提取、纯化等进行制备。另外,可在本说明书中公开的赖氨酰氧化酶信息的基础上,利用基因工程学技术制备本发明的蛋白质(包含改变蛋白质)。例如,可用编码本发明蛋白质的DNA转化适当的宿主细胞,回收在转化体内表达的蛋白质。根据需要适当纯化回收的蛋白质。作为重组蛋白质进行制备时可进行各种修饰。例如,编码本发明蛋白质的DNA与其它的适当DNA插入到同一载体,当用该载体进行重组蛋白质的生产时,可得到本发明的蛋白质上连接了其他肽或蛋白质的重组蛋白质。通过这样的修饰可使重组蛋白质的提取、纯化简便化或付与生物学功能等。
(编码赖氨酰氧化酶的DNA)
本发明的第2方面是提供编码丝状真菌来源的赖氨酰氧化酶的DNA。作为这样的DNA的具体实例可例举具有序列号3中所示碱基序列的DNA,或具有序列号4中所示碱基序列的DNA。前者是来源于编码赖氨酰氧化酶的基因组DNA(赖氨酰氧化酶基因)的序列,后者是该基因组DNA除去内含子区域的序列。作为本发明DNA的其他具体实例可例举具有序列号5中所示碱基序列的DNA,或具有序列号6中所示碱基序列的DNA。前者包含序列号3中所示赖氨酰氧化酶基因和其推定的启动子序列。后者包含序列号4中所示DNA(赖氨酰氧化酶基因除去内含子区域的DNA)和其推定的启动子序列。由于这些DNA中启动子与结构基因的组合是理想的组合,所以当利用该DNA进行赖氨酰氧化酶的生产时期待有良好的基因表达。因此,可构建高效的赖氨酰氧化酶生产体系。
作为本发明DNA的其他具体实例可例举具有序列号1中所示碱基序列的DNA,或具有序列号7中所示碱基序列的DNA。前者包含序列号3中所示赖氨酰氧化酶基因和其推定的启动子序列及其终止区域。后者包含序列号4中所示DNA(赖氨酰氧化酶基因除去内含子区域的DNA)和其推定的启动子序列及其终止区域。利用这样的DNA可构建高效的赖氨酰氧化酶生产体系。
这里序列号1、5、6、或7的序列中推定的启动子区域大约1600bp,作为启动子区域太长,所以考虑与启动子活性直接相关的是其一部分区域。考虑到这一点,这些序列内推定的启动子区域(5’侧的1600bp)即便有一段连续的区域,只要能验证其具有与赖氨酰氧化酶基因相对应的启动子功能,也可作为本发明DNA中的启动子使用。因此,通过联合,例如这样的特定启动子区域与序列号3中所示序列的结构基因,可构建成本发明的DNA(编码赖氨酰氧化酶的DNA)。这里,考虑到通常启动子功能区多直接位于结构基因前面,碱基,例如序列号1的序列中569-1568位的碱基,优选769-1568位的碱基是功能区的有力侯选。
以上本发明的DNA,可适当利用与本发明的编码赖氨酰氧化酶的基因(例如具有序列号3中所示氨基酸序列的DNA)特异性杂交的探针、引物等,从适当的本发明的丝状真菌基因组DNA文库或cDNA文库,或者从丝状真菌的菌体内提取液制备。另外,由于制备本发明DNA的丝状真菌基因组DNA文库或cDNA文库的制备方法可参照例如Molecular Cloning,Third Edition,Cold Spring HarborLaboratory Press,New York。
具体而言,本发明DNA的制备可,例如按以下程序进行。首先,在预定时间内培养预期保有目的DNA的丝状真菌,过滤收集菌株。洗涤后,将菌体冷冻干燥。接着,用乳钵等将菌体粉碎后,加入适当量的提取用缓冲液(例如含有SDS的Tris-HCl缓冲液)作为提取液。然后,通过酚抽提、乙醇沉淀等进行基因组DNA的提取、纯化。以所得基因组DNA为模板,应用目的DNA特异的引物通过PCR得到目的DNA的扩增产物。
当可获得适当的丝状真菌基因组DNA文库或cDNA文库时,可利用它们进行本发明DNA的制备。根据所使用文库的种类可利用斑点杂交法或集落杂交法(参照Molecular Cloning,Third Edition,ColdSpring Harbor Laboratory Press,New York等)。例如,以用质粒构建的文库时可利用集落杂交法。筛选保有目的DNA的克隆时,可应用有本发明DNA特异序列的探针。筛选出目的克隆后,可以该克隆保有的DNA为模板,应用目的DNA特异的引物,通过PCR法等得到本发明DNA的扩增产物。
可将所得克隆保有的DNA亚克隆到适当的载体中供以后使用。如此,例如可构建转化用的重组载体,或构建适于解读碱基序列用的质粒。
这里,通常对编码某种蛋白质的DNA实施部分改变时,改变后的DNA所编码的蛋白质与改变前的DNA所编码蛋白质具有同等的功能。即,DNA序列的改变基本上对其编码蛋白质的功能无影响,改变前后能维持其编码的蛋白质的功能。考虑到这一点,即便是拥有上述本发明DNA经部分改变的碱基序列的DNA(以下,叫做“改变的DNA”)只要其所编码的蛋白质具有赖氨酰氧化酶功能也可构成本发明的DNA。换言之,只要是编码的蛋白质能维持赖氨酰氧化酶的功能允许部分序列的改变。另外,优选改变前后编码的蛋白质赖氨酰氧化酶的活性未降低,但多少有些变动(上升或降低)也可以。
这里所讲的“部分改变”典型地指改变前的碱基序列中1个或多个碱基被替换、删除、添加或插入。这种改变可在多个位置发生。这里“多个”根据改变的位置和改变的种类而异,例如2-100个,优选2-50个,更优选2-10个。上述改变的DNA的获得可,例如通过限制性酶处理、核酸外切酶和DNA连接酶等处理、点定位突变导入法(Molecular Cloning,Third Edition,Chapter 13,Cold Spring HarborLaboratory Press,New York)和随机突变导入法(Molecular Cloning,Third Edition,Chapter 13,Cold Spring Harbor Laboratory Press,NewYork)导入突变等。另外,可用紫外线处理保有赖氨酰氧化酶基因的丝状杆菌,随后利用分离改变的基因等众所周知的突变处理方法而获得。
另外,上述碱基的替换、删除、插入、添加或逆位等突变中也包含基于携带赖氨酰氧化酶的微生物个体差异、种属差异而天然产生的突变。
作为改变的DNA的制备方法的实例包括,从保有改变的DNA的天然丝状真菌(例如米曲霉)提取基因组(染色体)DNA,用适当的限制性酶处理后,筛选、分离出用本发明的DNA(例如具有序列号3中所示序列的DNA)或其一部分作探针进行筛选的过程中,严谨条件下进行杂交的DNA的方法。当可利用含保有改变的DNA克隆的基因组(染色体)DNA文库时,可通过用本发明的DNA(例如具有序列号3中所示序列的DNA)或其一部分作探针,在严谨条件下筛选该文库而获得。
严谨条件下与上述本发明的DNA(例如具有序列号3中所示序列的DNA和加入上述改变而得的DNA)杂交,且其编码的蛋白质作为赖氨酰氧化酶发挥功能的DNA可作为本发明的DNA。这里所讲的“严谨条件下”是指所谓形成特异杂交而不形成非特异杂交的条件。严谨条件要根据序列的长度和构成碱基的种类而变动,例如用杂交液(50%甲醛,10 X SSC(0.15M NaCl,15mM柠檬酸钠,pH7.0),5 XDenhardt溶液,1%SDS,1%硫酸葡聚糖,10μg/ml变性鲑鱼精子DNA,50mM磷酸缓冲液(pH7.5))42℃温育,其后用0.1 X SSC、0.1%SDS 68℃洗涤的条件。优选的严谨条件是用50%甲醛,5 XSSC(0.15M NaCl,15mM柠檬酸钠,pH7.0),1 X Denhardt溶液,1%SDS,10%硫酸葡聚糖,10μg/ml变性鲑鱼精子DNA,50mM磷酸缓冲液(pH7.5)的杂交液。
(载体)
本发明的其它方面提供携带上述本发明DNA(包含改变的DNA)的载体。载体的制备可通过将本发明的改变的DNA整合到已经存在的载体内或对其实施改变了的载体内。原则上只要是携带本发明DNA的载体任何载体均可作为原始材料,但可根据使用目的(克隆、多肽的表达)或考虑宿主细胞的种类而适当选择。将本发明的DNA整合到载体时,可通过应用限制性酶及DNA连接酶的众所周知的方法(Molecular Cloning,Third Edition,1.84,Cold Spring Harbor LaboratoryPress,New York))进行。
另外,应用含启动子区域的DNA(例如具有序列号1,5,6,7任一序列的DNA)时,可通过将个别准备的启动子区域与结构基因(及其终止子)整合到载体而构建重组载体。该情况下,作为适宜发挥启动子功能的条件,可在载体内二者之间插入其它序列。另外,可首先构建携带启动子区域的载体,其后进行结构基因的连接。
转化用的载体,经典地,包含赖氨酰氧化酶基因(例如具有序列号3中所示序列的DNA)、启动子及终止子。为了达到启动子对结构基因的适当转录,启动子、赖氨酰氧化酶基因及终止子按上游到下游的方向顺序排列。载体内也可包含选择标志和具有增强子功能的序列,编码信号肽的序列等。
(转化体)
转化用载体可用于丝状真菌的转化。即,用上述转化用载体可构建丝状真菌转化体的制备方法。通过该制备方法可获得外源导入了本发明DNA的丝状真菌。所得丝状真菌转化体可用于赖氨酰氧化酶的生产。具体而言,将外源导入了本发明DNA的丝状真菌转化体,在该DNA编码的蛋白质(赖氨酰氧化酶)能表达的条件下进行培养,可生产出赖氨酰氧化酶。例如,可应用市售的各种培养基或向其中添加了精氨酸、尿苷等促进转化体生长、选择、蛋白质表达等必要成分的培养基。
从按预定时间培养后的培养液或菌体中可回收目的蛋白质(赖氨酰氧化酶)。当产生在菌体外时可从培养液回收,除此之外,从菌体内回收。从培养液回收时,可通过联合应用例如过滤培养上清、离心去除不溶物之后,硫酸铵沉淀等的盐析、透析、各种色谱等进行分离、纯化,得到目的蛋白质。另一方面,从菌体回收时,可通过例如通过加压处理、超声波处理等将菌体破碎后,与上面同样进行分离、纯化,得到目的蛋白质。另外,通过过滤、离心等处理预先从培养液回收菌体后,也可进行上述一系列步骤(菌体的破碎、分离、纯化)。由于本发明的赖氨酰氧化酶通常在菌体外产生,所以分离、纯化比较容易。
对供转化的宿主丝状真菌的种类无特殊限定,可应用曲霉属(米曲霉、黑曲霉、构巢曲霉、酱油曲霉、泡盛曲霉、川地曲霉、寄生曲霉、黄曲霉、nomius曲霉、烟曲霉等)、青霉属、木霉属、根霉菌属、毛霉菌属、镰刀菌属等的丝状真菌。优选应用曲霉属丝状真菌。从安全性考虑其中优选米曲霉或黑曲霉。
可用众所周知的方法将转化用载体导入宿主丝状真菌。例如,可应用原生质化菌体的Turner等方法(Gene,36,321-331(1985))。此外也可采用五味等的方法(Agric.Biol.Chem.,51,323-328(1987))等。
以下,通过实施例对本发明进一步进行具体说明,但本发明并不限定于此。需要指出的是实施例中的各种基因操作按照上述Currentprotocols in molecular biology(Frederick M.Ausubel等编著)中记载的方法。
<实施例1>
[整个基因组基因枪文库的制备方法]
1.插入侧的制备
(1)染色体DNA的获得
将丝状真菌米曲霉RIB-40株(ATCC 42149)的孢子接种到YPD培养基(0.5%酵母提取物,1%蛋白胨,2%葡萄糖),30℃振荡培养一晚上。其后,按照饭村(Agric.Biol.Chem.,51,323-328(1987))的方法进行基因组DNA的提取。按照Watson等的方法(Methods Enzymol.57-75 118(1986))),通过氯化铯超速离心纯化混在基因组DNA中的线粒体DNA,仅获得染色体DNA。
(2)染色体DNA的片段化
将所得纯化染色体DNA上随机DNA片段化装置HydroShear(Tomy精工),将染色体DNA的片段化成1-2kb左右。
(3)片段化DNA的末端处理
用BAL31核酸酶(TAKARA公司)处理片段化的染色体DNA,其后进行Klenow片段(TAKARA公司)处理,是末端平化。
(4)将Adaptor加到末端
用T4 DNA连接酶(TAKARA公司)将由(P)5’-CGAGAGCGGCCGCTAC-3’和(P)5’-GTAGCGGCCGCTC-3’构成的接头连接到末端平化的染色体DNA片段两端。
2.转化
用限制性酶SalI(TAKARA公司)酶切pUC19以后,用Taq DNA聚合酶(Roche Diagnostics K.K.)将dT插入到SalI切断部分。用碱性磷酸酶(TAKARA公司)处理如此制备的质粒作为去磷酸化质粒应用。用T4 DNA连接酶连接质粒与上面制备的染色体DNA片段,通过电穿孔法转化大肠杆菌DH10B(Gibco)。
3.碱基序列的测定
用2 X YP培养基37℃、10小时培养大肠杆菌转化体,收集菌落,在灭菌水中,99℃加热处理10分钟。其上清用作模板DNA水溶液,经过98℃20秒、68℃2分30个循环的PCR扩增包含测序用引物退火部位的插入片段全长。所得DNA片段用作Sangaer法的模板,应用M13通用引物或M13逆向引物与Perkin Elmer公司的PRISMDye-Terminator kit,按试剂盒中的说明书进行测序反应。用过滤等方法除去反应产物中的未反应Dye-Terminator,然后用Perkin Elmer公司的3700 DNA Sequencer解读DNA片段的碱基序列。用Phred(PhilGreen)再解析3700 DNA Sequencer所出波形,除去载体和接头序列后,使用SPS Phrap(Southwest Parallel Software)进行装配,构建曲霉菌基因组DNA碱基序列的Contig。
<实施例2>
[基因的鉴定]
用以下技术从基因组DNA碱基序列鉴定基因。在基因的鉴定技术中,对于基因组DNA碱基序列的Contig而言,考虑与已经获得的EST序列信息、已知的蛋白质氨基酸序列数据库的同源性时,可联合应用以浅井洁等的运算法则(Pacific Symposium on Biocomputing98,228-239)为基础的基因区域预测系统GeneDecoder和以后藤修的运算法则(Bioinformatics 2000 16:190-202.)为基础的基因区域预测系统LAN进行。另外,tRNA基因的预测用tRNA-scan。
第1[选取BLAST同源基因候补区域]
从基因组DNA碱基序列的Contig中选出与已知的蛋白质氨基酸序列高度同源的区域。氨基酸序列的同源性根据Karlin and Altschul的运算法则BLAST(Proc.Natl.Acad.Sei.USA 87:2264-2268,1990;Proc.Natl.Acad.Sei.USA 90:5873-5877,1993)确定。在该运算法则的基础上,开发了叫做BLASTX的程序(Altschul et al.J.Mol.Biol.215:403-410,1990),可直接检索基因组DNA碱基序列翻译成氨基酸序列时同源性高的区域。这些解析方法的具体技术是众知的(http://www.ncbi.nlm.nih.gov.)。该技术中,基因组DNA碱基序列的毗连(contig)序列作为询问序列,以SWISSPROT version 39(Bairoch,A.& Apweiler,R.Nucleic Acids Res.28,45-48(2000).)和Nraa为数据库进行BLASTX检索,BLAST法则中同源性指标为E-value,选出E-value在10-30(E-value值越低表示同源性越高)以下的区域。从这些区域中给同源性高的部分以优先权,从而选出互不重叠的BLAST同源基因候补区域。
第2[ALN基因候补区域的选取]
BLAST同源基因候补区域中,以与成为同源对象的蛋白质氨基酸序列全长90%以上区域具有同源性的区域为核心,用适于毗连序列的基因区域预测系统ALN选出ALN基因候补区域。ALN是通过排列成为毗连序列同源对象的蛋白质氨基酸序列全长时确定剪切位点而预测基因区域。
第3[GD同源性基因候补区域的选取]
BLAST同源基因候补区域中,以与成为同源对象的蛋白质氨基酸序列残长的20%以上90%以下区域具有同源性的区域为核心,用适于毗连序列的基因区域预测系统GeneDecoder选出GD同源性基因候补区域。GeneDecoder预测基因区域是通过整合BLASTX的E-value与2系列密码子统计量(蛋白质编码区域方向性指标),还考虑剪切位点的位置依赖性首次Markov Model分数。
第4[EST-GD基因候补区域的选取]
对于通过与毗连序列对应的EST认证基因表达的区域,通过对其附近的毗连序列应用GeneDecoder,不仅可预测EST序列决定的基因区域,而且可预测基因区域全长,于是作为EST-GD基因候补区域。
第5[一般GD基因候补区域的选取]
对于不包含第1到第4的基因候补区域的毗连序列,通过应用GeneDecoder预测基因区域。
第6[tRNA基因候补区域的选取]
用适于整个毗连序列的tRNA-scan选出tRNA基因候补区域。
第7[基因候补区域的综合]
按以下顺序综合第2到第6的基因候补区域。首先,从第2到第6的基因候补区域中除去预测的与EST决定的剪切位点相矛盾的基因区域。除去相互重叠的区域后,综合剩余的基因候补区域。此时,按tRNA、ALN同源性基因候补区域、GD同源性基因候补区域、GD-EST基因候补区域、一般GD基因候补区域的顺序优先综合。将如此综合的基因候补区域作为一套预测基因。
通过上述程序,从同源性观点看,可以保证与已知蛋白质全长同源的基因、与已知蛋白质部分同源的基因、与已知蛋白质不同源的基因按该顺序进行可靠性鉴定。另外,从认证表达的观点看,用EST认证表达的基因、用EST认证不表达的基因按该顺序进行可靠性鉴定。另外,保证所有的候补基因不与EST决定的剪切位点相矛盾。
所用技术均采用不允许蛋白质编码区域中包含终止密码子这一法则,将伪基因预测为基因的可能性极小。
关于功能预测,对于预测的基因区域,用以Nraa为数据库的BLAST进行同源性检索,以足够的同源性(E-value:10-30)作阈值来决定功能。
<实施例3>
[检索编码赖氨酰氧化酶的序列]
从实施例2的结果曲霉基因组DNA中预测具有特定功能的序列(功能序列),并选出。这些功能序列中,以预想编码蛋白质的全部序列为对象,用NCBI提供的BLAST检索(Standard protein-proteinBLAST:blastp)检索与巴斯德毕赤酵母(Pichia Pastoris)来源的赖氨酰氧化酶基因同源性高的区域。结果,在序列号24中所示序列内(该序列包含前专利中序列号36845所示序列(序列号8)成功发现与巴斯德毕赤酵母(Pichia Pastoris)来源的赖氨酰氧化酶基因同源性高的区域。于是,为了分析该区域的功能以及为了确定该区域编码的蛋白质的氨基酸序列,进行了以下各种实验。
<实施例4>
[染色体基因的获得]
将米曲霉(Aspergillus oryzae)RIB-40株加入到100ml马铃薯葡萄糖培养基(Difco)中,用坂口培养瓶30℃培养一晚后,用巴克纳漏斗和Nutsche吸引瓶过滤培养液,得到菌体。用300ml水洗涤菌体,-80℃冷冻后,进行冷冻干燥。将所得重约0.3g的菌体与1杯药匙的海砂一起在乳钵内用乳棒研碎,悬浮到8mlTE(10mM Tris-HCl(pH8.0),1mM EDTA)溶液中。向其中加入4ml 10%SDS水溶液,激烈搅拌。然后,加入等量的酚∶氯仿∶异戊醇(25∶24∶1)溶液,搅拌后离心(1500g,5min,室温),得到上清。向该上清中加入含20mg/ml蛋白酶K(Roche)的TE溶液100μl,搅拌,37℃培养30分钟。其后,再加入等量的酚∶氯仿∶异戊醇溶液,搅拌后离心(1500g,5min,室温),向所得上清中逐渐加入等量的异丙醇。用巴氏吸管吸取这样处理后析出到界面的染色体DNA,用70%乙醇洗涤,风干。再将所得染色体DNA溶解到3mlTE溶液中,加入10mg/ml Rnase A(SIGMA)100μl后,37℃培养30分钟。接着,加入20mg/ml蛋白酶K溶液25μ1,37℃培养30分钟,然后加入等量的酚∶氯仿∶异戊醇(25∶24∶1)溶液,搅拌后离心(1500g,5min,室温),得到上清。该洗涤操作重复2次后,向所得上清中加入等量的氯仿∶异戊醇(24∶1)溶液,搅拌后离心(1500g,5min,室温)。向所得上清中加入其1/10体积的3M NaOAc(pH4.8)和2倍体积的乙醇,-80℃冷冻使染色体DNA析出。通过离心(1500g,5min,室温)回收析出的染色体DNA。用70%乙醇洗涤回收的染色体DNA,真空干燥,最后溶解到300μl TE溶液中,得到浓度约1mg/ml的染色体DNA溶液。
<实施例5>
[制备集落杂交的探针]
以实施例1所得曲霉基因组DNA毗连序列信息为基础,如下设计扩增存在于限制性酶BalI片段(序列号24)包含一部分目的基因(推定赖氨酰氧化酶基因)区域的基因组DNA片段的引物对。
LO-25’-TAGCACCATCTACTCTGAGTGGC-3’(序列号11)
LOR-25’-CCTGGTCATATAGTCGTAGTTGC-3’(序列号12)
应用该引物对进行PCR反应。反应液的组成如下:
灭菌水:36.75μl
Pyrobest DNA聚合酶用10 X buffer:5μl
2.5mM dNTP溶液:4μl
10pmol/μl LO-2:1μl
10pmol/μl LOR-2:1μl
60ng/μl RIB40染色体DNA:2μl
5U/μl Pyrobest DNA聚合酶(宝酒造):0.25μl/50μl
将50μl石蜡油滴到上述反应液中,用PE BioSystem公司的GeneAmpTM PCR System PJ9600,在以下条件下进行PCR。
(1)94℃1分钟,(2)94℃30秒、50℃30秒及72℃2分钟的循环,30个循环,(3)4℃放置。
PCR反应结果是特异地扩增出约900bp的DNA片段,琼脂糖凝胶电泳后用GeneCleanIII(BIO 101)提取扩增的DNA片段。将提取的DNA片段亚克隆到pUC19中后,用DIG High Prime(Roche)对插入DNA片段进行DIG标记,作为推定的赖氨酰氧化酶基因的探针。
<实施例6>
[集落杂交]
用限制性酶BalI(宝酒造)50U 37℃完全消化实施例4中所得40μg染色体DNA后,通过琼脂糖凝胶电泳切出链长约9.1kbp的DNA片段,接着用GeneCleanIII(BIO 101)进行抽提,作为制备文库的插入片段。另一方面,用Smal(宝酒造)80U完全消化(30℃温育一晚)pUC19,用碱性磷酸酶(宝酒造)脱磷酸后,作为制备文库的载体。用Ligation kit ver.2(宝酒造)连接如上制备的插入DNA和载体DNA,用它转化大肠杆菌DH5株活性细胞(TOYOBO)。以每枚LA板(氨苄西林(SIGMA)100μg/ml)大约形成200个集落的标准接种氨苄西林耐性转化株,37℃培养一晚上,使集落生成。将生成的总共约4000个集落移到集落和噬菌斑杂交尼龙膜(Roche)上,使DNA固定到膜上。用实施例5中制备的探针进行集落杂交,用DIG核酸检测试剂盒(Roche)检测有强信号的集落。集落杂交的结果,将选择出的克隆保持的质粒命名为pULO,作为包含推定赖氨酰氧化酶基因的质粒。另外,以上各种操作按照使用的试剂或试剂盒附加的说明进行。
<实施例7>
[包含推定赖氨酰氧化酶基因的克隆的碱基序列分析]
如实施例1-3所阐明的,以包含设想编码赖氨酰氧化酶区域的序列(序列号24:BalI片段(该序列包含推定的启动子区域和推定的终止子区域))的信息为基础,制作以下10种合成引物,用它们测定克隆pULO插入片段的碱基序列。用BigDyeTM Terminator CycleSequencing FS Ready Kit VER.2(Applied Biosystem)进行测序反应,用ABI PRISM 310测序仪(Applied Biosystem)进行解析。
L-1:5’-GCTAGCTTATACTAACCC-3’(序列号13)
L-2:5’-GACTATGTTCTCGTGCGC-3’(序列号14)
L-3:5’-TCTTTGCATTTGTCCAGG-3’(序列号15)
L-4:5’-TCTGCGTCGTTGGACAAC-3’(序列号16)
L-5:5’-GACTGACCCTCATTATGC-3’(序列号17)
L-6:5’-AACACCGAGGGACCATGG-3’(序列号18)
L-7:5’-TACCTCACCCTCCGATCC-3’(序列号19)
L-8:5’-GGGACAGCACACCTGACG-3’(序列号20)
L-9:5’-AACCCGAATGATCCGTAC-3’(序列号21)
L-10:5’-AGAGAATAATCGAAATGG-3’(序列号22)
确定的碱基序列的一部分与序列号8中所示序列(包含推定的赖氨酰氧化酶的结构基因及其启动子和终止子序列)完全一致。因此,可以判断质粒pULO保持完全覆盖序列号8中所示序列(包含赖氨酰氧化酶的推定启动子、推定结构基因、推定终止子的序列)的DNA片段。
<实施例8>
[表达载体pBALO的构建]
用限制性酶BgIII(宝酒造)消化3μg的pULO,得到约7.0kbp的DNA片段(序列号10。以下叫做“推定的赖氨酰氧化酶DNA片段”)。用T4 DNA聚合酶(宝酒造)使所得DNA片段的末端平化,作为插入DNA。另一方面,用SmaI(宝酒造)80U完全消化(30℃培养一晚上)75μg表达载体pBAR,该载体在pBluescript II KS(+)的Sall-Xhol位点插入了构巢曲霉(Aspergillus nidulans)的ArgB基因。其后,用碱性磷酸酶(宝酒造)脱磷酸化,作为载体DNA。用Ligation Kitver.2(宝酒造)连接如上制备的插入DNA和载体DNA,用它转化大肠杆菌DH5株活性细胞(TOYOBO),得到氨苄西林耐性转化体。将所得克隆保持的质粒命名为pBALO,作为表达载体。
<实施例9>
[构巢曲霉(Aspergillus nidulans)的转化]
用以下培养基培养精氨酸要求株构巢曲霉(Aspergillusnidulans)ABPU1株(构巢曲霉的鸟氨酸氨基甲酰转移酶基因缺陷株),37℃培养一晚上。
<完全培养基>
麦芽提取物:20g
葡萄糖:20g
细菌蛋白胨:1g
尿嘧啶核苷:2g
对氨基安息香酸:2.5mg
核黄素:2.5mg
维生素B6:2.5mg
生物素:2.5mg
盐酸精氨酸:055g/L(pH6.5)
用玻璃滤器(100过滤在上述条件下培养所得培养液200ml,收集菌体。将菌体悬浮到以下组成的原生质制备液中。
灭菌MillQ水 37ml
氯化钠 1.9g
0.4M磷酸钠水溶液(pH5.8) 1ml
1M氯化钙水溶液 0.8ml
Novozyme 234(NOVO NORDISK) 150mg/40ml
(用硝酸纤维素滤器(0.45μm)过滤除菌)
用上述悬浮液30℃、78rpm条件下进行1小时原生质化处理。用尼龙滤器(230目)过滤所得原生质悬浮液,离心分离滤液(400g,5min,室温),得到原生质。用10ml 0.8M NaCl洗涤原生质,再离心分离(400g,5min,室温),接着用10ml 0.8M NaCl-50mM CaCl2洗涤,离心分离(400g,5min,室温),将所得原生质沉淀悬浮到200μl 0.8MNaCl-50mM CaCl2中作为原生质液。通过显微镜观察算出原生质的浓度。用大约稀释成2 X 108/ml的原生质悬浮液按以下步骤进行转化。向50μl原生质悬浮液中加入5μl pBALO溶液(3μg/μl),混悬后,加入12.5μl PEG溶液(25%PEG6000、50mM CaCl2、10mM Tris-HCl(pH7.5))再度混悬,冰中放置20分钟。然后,加入500μl 25%PEG6000、50mM CaCl2、10mM Tris-HCl(pH7.5)再度混悬,冰中放置5分钟。最后,加入1ml 0.8M NaCl-50mM CaCl2混悬,将0.5ml悬浮液放到平皿中后,倾入以下所示再生培养基,使之固化成板。37℃培养3-4天后,用以下所示最少培养基分离单菌,获得形成的转化体,得到导入了推定赖氨酰氧化酶DNA片段的转化株。
<再生培养基>
硝酸钠:6g
磷酸钾:1.52g
氯化钾:0.52g
山梨糖醇:218.6g
尿苷:2.0g
对氨基安息香酸:2.5mg
核黄素:2.5mg
维生素B6:2.5mg
生物素:2.5mg
琼脂:20g/L(pH6.5)
(灭菌(121℃、20分钟)后添加以下成分)
50%葡萄糖 20ml
5.2%7水硫酸镁 10ml
<最少培养基>
硝酸钠:0.85g
磷酸钾:1.525g
氯化钾:0.525g
微量元素 1.5ml
尿苷:2.0g
对氨基安息香酸:2.5mg
核黄素:2.5mg
维生素B6:2.5mg
生物素:2.5mg
琼脂:15g/L(pH6.5)
(灭菌(121℃、20分钟)后添加以下成分)
50%葡萄糖 20ml
5.2%7水硫酸镁 10ml
[0055]
<微量元素>
4硼酸钠-10水 40mg
硫酸铜-5水 0.4g
硫酸铁-7水 1.6g
硫酸镁-4水 0.8g
钼酸钠-2水 0.8g
硫酸锌-7水 8g/L
<实施例10>
[转化体的培养]
用以下所示培养基培养转化体,30℃振荡培养3天。
<SPY培养基+维生素类>
淀粉 30g
多聚蛋白胨 10g
酵母提取物 5g
氯化钾 2g
磷酸钾 1g
乙醇发酵残余物 0.1g
尿苷 2.0g
对氨基安息香酸 2.5mg
核黄素 2.5mg
维生素B6 2.5mg
生物素 2.5mg
(灭菌(121℃、20分钟)后添加以下成分)
5.2%硫酸镁-7水10ml/L(pH6.5)
将上述条件下培养的培养基10ml离心(2400g,10min,4℃),获得培养上清。
<实施例11>
[赖氨酰氧化酶的酶活性测定]
按以下程序,用所得各培养上清测定赖氨酰氧化酶的酶活性。向上述培养基中添加浓度0.55g/L的盐酸精氨酸,用该培养基同样培养未转化的构巢曲霉(Aspergillus nidulans)ABPU1株,用培养所得上清作对照。
赖氨酰氧化酶的酶活性通过底物赖氨酸被赖氨酰氧化酶氧化产生的蒜素与赖氨酸聚合形成二聚体的生成量求出。用LC-MS(Agilent)测定二聚体的量。
首先,用各培养上清(粗酶样品)准备以下反应液。
0.1M磷酸钾缓冲液 (pH7.0)235μl
1.0M赖氨酸盐酸水溶液 60μl
培养上清 6μl
合计 301μl
将各反应液37℃保温,1、2、4、8、24小时后各取样30μl。将取样的反应液100℃热处理15分钟停止反应,此后用LC移动相10倍稀释,作为测定用样品。使用预先经100℃热处理15分钟使酶失活的培养上清作同样处理,所得样品作为空白。
使用Agilent1100系列LC/MSD系统(Agilent)测定各测定用样品中赖氨酸二聚体的量。用supelco ABZ plus(Spelco)作为分离柱,从Positive mode中作为赖氨酸二聚体检测出的质荷比(m/Z)275的峰面积值减去空白样品的值,作为个样品的测定值。
测定的结果,用任何转化体的培养上清中可看到测定值与反应时间成比例升高。即,可看到赖氨酸二聚体量与反应时间成比例增大。用反应时间为24小时的样品测定的结果如图2的表及图所示。需要指出的是,只选出了赖氨酸二聚体量证实增大的结果显示。如该表及图所示,与对照(ABPU1株)相比,用转化体LO-3、10、17、26、48的培养上清的样品活性高6倍以上。由此验证,这些转化体含有赖氨酰氧化酶基因。
<实施例12>
[赖氨酰氧化酶基因转录终止点的确定]
与实施例10同样培养米曲霉(Aspergillus oryzae)RIB-40株及上述活性测定中显示最大赖氨酰氧化酶活性的转化体LO-3(Aspergillus nidulans ABPU1),制备菌体。用Trisol试剂(Gibco BRL)从所得各菌体提取总RNA,以此为模板用3’-Full RACE Core Set(宝酒造)扩增3’DNA片段。下面是该情况下根据赖氨酰氧化酶基因组信息设计的合成引物中的特异序列。
LO-3’:5’-TGGCTGAACCTGGGGATGCACCAC-3’(序列号23)
分析扩增的DNA片段碱基序列的结果:该DNA片段的碱基序列(序列号9)与实施例1-3最初的赖氨酰氧化酶基因的结构基因和预想区域(推定赖氨酰氧化酶基因结构基因)碱基序列的一部分一致,另外还有polyA序列。这些事实表明该DNA片段是推定的赖氨酰氧化酶结构基因3’末端的DNA片段。由此,澄清了该推定赖氨酰氧化酶结构基因的转录终点,位于当初预测的3’末端。即,从以上结果表明,所得结构基因的序列与当初确定的结构基因的序列在3’末端区域不同。需要指出的是,序列号3及序列号2中分别显示了在以上结果基础上新鉴定出的赖氨酰氧化酶的结构基因和氨基酸序列。
<实施例13>
[携带缺失3’区域的插入DNA的表达载体的构建]
由实施例12的结果表明,插入到表达载体pBALO的约7.0kbp的插入DNA中,其3’区域存在赖氨酰氧化酶活性不必要的区域。因此,为了缩小对赖氨酰氧化酶活性必要的区域,如下构建携带缺失上述插入DNA3’区域的插入DNA的(以下叫做“缺失插入DNA”)表达载体。用限制性酶AccIII、AfIII(宝酒造)消化3μg pBALO,分成认为表达不需要的约2.2kbp的3’区域和包含缺失插入DNA的约9.4kbp的载体片段。然后,仅提取载体片段,用T4 DNA聚合酶(宝酒造)使其末端平化,然后用Ligation Kit ver.2(宝酒造)进行自身连接。用所得表达载体转化大肠杆菌DH5株(TOYOBO),选择氨苄西林耐性转化株。将选出的克隆保持的质粒命名为pBALO-D,作为新的表达载体用于以后的实验(图4)。
<实施例14>
[转化体的获得和赖氨酰氧化酶活性的测定]
按与实施例9-11同样的方法,测定导入了pBALO-D的转化体的赖氨酰氧化酶活性。用反应时间为8小时的测定样品测定的结果如图5所示。需要指出的是,只选出了赖氨酸二聚体量证实增大的结果进行显示。如这些表及图所示,与实施例11是结果同样,与对照(ABPU1株)相比,转化体LO-9、16显示高5倍以上的活性。由此验证,pBALO-D含有能够表达的赖氨酰氧化酶基因。因此,可以判断pBALO-D含有的缺失插入DNA(序列号1)有对赖氨酰氧化酶基因的表达必要的序列。如上,通过本实施例进一步确定了表达赖氨酰氧化酶基因所必要的最小区域。
本发明并不限定于任何上述发明的实施方案及实施例说明。业内人士容易想到的不脱离权利要求范围的各种变化方案均包含在本发明内。
产业上利用的可能性
本发明提供丝状真菌来源的赖氨酰氧化酶及编码它的DNA。利用本发明的DNA可构建安全性高的应用丝状真菌的赖氨酰氧化酶生产体系。
序列表
<110>National Institute of Advanced Industrial Science and Technology
National Institute of Technology and Evaluation
National Research Institute of Brewing
YUUKI,Kensuke
TOUMOTO,Atsuki
MACHIDA,Masayuki
ABE,Keietsu
GOMI,Katsuya
ASAI,Kiyoshi
SANO,Motoaki
KIN,Taishin
NAGASAKI,Hideki
HOSOYAMA,Akira
AKITA,Osamu
OGASAWARA,Naotake
HISAHARA,Satoru
<120>丝状真菌来源的赖氨酰氧化酶
<130>P02069
<150>JP P2001-403261
<151>2001-12-27
<160>24
<170>PatentIn version 3.1
<210>1
<211>4650
<212>DNA
<213>米曲霉
<220>
<221>CDS
<222>(1569)..(1900)
<223>
<220>
<221>CDS
<222>(1940)..(3106)
<223>
<220>
<221>CDS
<222>(3164)..(4091)
<223>
<400>1
agatctcgct ttttaaagtt cgtacagttc ccactttttc attactcggt caacagcttt 60
gctagcttat actaacccag tgaatcaaac aatcgataat gtattgacag agctgtctgg 120
aaggatggaa ataatataca acaaaagtac cgttctcaac tctcactgct caaagcccgc 180
ccatgtcctc caccttagcg agcacctcgt cacccaaaaa gagcagacca catcctgaaa 240
cgatgccctt caagatcgaa acaactaccc tcctctacta gcgtacatct tctctaacaa 300
ttttctctca tataacctag atcaacaatg gcaggcattc ttcgagtgga agaattcaca 360
cgctatccgc ttaatccgag ataagttccg atactgtggt cttcgaagtc ttcacaatag 420
ggcatagcct tccaaggatt ggaattatag ggataataca taagaattat agctagggta 480
tcagaggagt tacttcgctc cttagagaga gcacttaccc gagccaaata ccaaggatag 540
aaatgattag aagatagact atgttctcgt gcgcttagcc ccttatgatt atgtttctca 600
atttcgcatc atttcagggt attggcgttc ctccagtaaa cgaggggtaa actattctgc 660
tagtttgatg gtcgcttata ggctgaagat aaccaacaag aagatacact tcgcttagat 720
cctcgaccat ggtgagcagc cactctgtcc aactttctga aatggcggtg ctaagtatag 780
gaacttgatg atgcaatgac tacaacaagc atcaaaagac cgataaacag cctcggcaaa 840
gcccagcgat caacctctgt ctccaaactg gcatactatg caagtctaac catagtgaaa 900
tactatcaga cgaagtacat catgtatttc atagataaag ctcatgctat ggaacaatta 960
catctcaaca cttctttcat tgaagctgtg acttgatgcc tccgttgctt tgcagcagag 1020
atatgtcccg atacttccgt gacctttgtt tctctttgca tttgtccagg gactgtctcc 1080
ccgcagggtc tatcaacgtg ggacgcgata agccccattc ttgacaactg aacggattcg 1140
ctggagataa tcgcaaccgg ttccgatctc atcttcatat acaaagcacg gtcacgctaa 1200
atctctacga ggcccaaccg tatggaaaaa tatcgctacg ggctgaatgt atggggtctt 1260
ggatctatgc taagtcattg tatccagtga gagcatctgc atcattgaca tttccgcctg 1320
taccttctgg tttaggaaaa ttcaacagcg ggctgacgcg atgcacctgg cgggttatgg 1380
tattaggaat cgaagagtga tgaaaatagt tgacaagaca gtctgatatt ggctgagatg 1440
atactcttta ttaaatttta gcttagctag ttccgagcag gccgaatgag acaagtataa 1500
agccatgacc ctggcactta atctcgtccg tctcacaaca gccagtgttt tctgcgtcgt 1560
tggacaac atg agg cta acg atc tcc gcg gca gta ttg cct tcg ttg ctt 1610
Met Arg Leu Thr Ile Ser Ala Ala Val Leu Pro Ser Leu Leu
1 5 10
ctt ctc ccc tgc ttc tta gga gat gct cta gct cat ccg aga cct gat 1658
Leu Leu Pro Cys Phe Leu Gly Asp Ala Leu Ala His Pro Arg Pro Asp
15 20 25 30
cct aag aca gca tgg gtg cgt caa ggt cgg aga agg aag agt tcc ccg 1706
Pro Lys Thr Ala Trp Val Arg Gln Gly Arg Arg Arg Lys Ser Ser Pro
35 40 45
cgg aac ctg caa gtc cat tcg tct atg ctc tcg acc tgc gtc gag agc 1754
Arg Asn Leu Gln Val His Ser Ser Met Leu Ser Thr Cys Val Glu Ser
50 55 60
aat gcc act gtg atc aaa gca ccc aag cat aat gtt tgg gaa ggc atg 1802
Asn Ala Thr Val Ile Lys Ala Pro Lys His Asn Val Trp Glu Gly Met
65 70 75
acg gac gag gaa aca gcc tct gtg gtt aag tgg ctc ttc caa caa ccg 1850
Thr Asp Glu Glu Thr Ala Ser Val Val Lys Trp Leu Phe Gln Gln Pro
80 85 90
acg ctg aac ctg act gtc acg gaa ggc gcc gga gag tgg gat aac acg 1898
Thr Leu Asn Leu Thr Val Thr Glu Gly Ala Gly Glu Trp Asp Asn Thr
95 100 105 110
at gtaagcgcca actttcggat cactctcggt ggctaacag g acc agt gcc ctc 1952
Met Thr Ser Ala Leu
115
gtc gag ctg atg cgc ccc aac aag acg gat gtt tta agc tat ctc gat 2000
Val Glu Leu Met Arg Pro Asn Lys Thr Asp Val Leu Ser Tyr Leu Asp
120 125 130
cac caa ggc cca gca cct agc cgt tac gcg cat gtt gtc ctt gac aac 2048
His Gln Gly Pro Ala Pro Ser Arg Tyr Ala His Val Val Leu Asp Asn
135 140 145
cgc gcc acg act gac cct cat tat gct gat ctt ttg gtc ggg cct cta 2096
Arg Ala Thr Thr Asp Pro His Tyr Ala Asp Leu Leu Val Gly Pro Leu
150 155 160
gcc atc acc aat cag tct acc cct tct tgg acg cca tta gag tat cct 2144
Ala Ile Thr Asn Gln Ser Thr Pro Ser Trp Thr Pro Leu Glu Tyr Pro
165 170 175
tac acg cgc aag act cac ggt cga gtg cgc aat ctc gac gct gac tat 2192
Tyr Thr Arg Lys Thr His Gly Arg Val Arg Asn Leu Asp Ala Asp Tyr
180 185 190 195
agc acc atc tac tct gag tgg ctg tat aag att agc gca tcc att gca 2240
Ser Thr Ile Tyr Ser Glu Trp Leu Tyr Lys Ile Ser Ala Ser Ile Ala
200 205 210
gat atc acc ctg gac ctg ttc aat ggg act gca ttg ggc tta gac aac 2288
Asp Ile Thr Leu Asp Leu Phe Asn Gly Thr Ala Leu Gly Leu Asp Asn
215 220 225
gac act ctt gat ata tgg ggg att gac ccc ctc tgg cag gat gac ggc 2336
Asp Thr Leu Asp Ile Trp Gly Ile Asp Pro Leu Trp Gln Asp Asp Gly
230 235 240
cgg atc atc cgc tgg gac aca ttc tgg aac atg cca acg gat gag ttc 2384
Arg Ile Ile Arg Trp Asp Thr Phe Trp Asn Met Pro Thr Asp Glu Phe
245 250 255
gac acc ggc agc atc cta ccg ctg gga cta ttc ttc aaa tcc gac gtg 2432
Asp Thr Gly Ser Ile Leu Pro Leu Gly Leu Phe Phe Lys Ser Asp Val
260 265 270 275
act ggg cgt gat cct tct cag tgg aag ctt gaa ggc tgg ctt tac aac 2480
Thr Gly Arg Asp Pro Ser Gln Trp Lys Leu Glu Gly Trp Leu Tyr Asn
280 285 290
gac atc ttc tat gaa acg aca gag gct ttt cgc cat gca ttc ttc tcg 2528
Asp Ile Phe Tyr Glu Thr Thr Glu Ala Phe Arg His Ala Phe Phe Ser
295 300 305
acc gga ttt gtc aag cta aag ccc aac acc gag gga cca tgg gcg cag 2576
Thr Gly Phe Val Lys Leu Lys Pro Asn Thr Glu Gly Pro Trp Ala Gln
310 315 320
acg gac caa cgg ggc cct ata ctt cca caa gac aag cag caa tcg cct 2624
Thr Asp Gln Arg Gly Pro Ile Leu Pro Gln Asp Lys Gln Gln Ser Pro
325 330 335
ctc atg gta gcg ccg tca gga gca cgg tac tct gtg gac ctc gac cgc 2672
Leu Met Val Ala Pro Ser Gly Ala Arg Tyr Ser Val Asp Leu Asp Arg
340 345 350 355
aaa tac gtg aca tgg atg gac ttc tcg ttt tac atc agc ttc tct cgt 2720
Lys Tyr Val Thr Trp Met Asp Phe Ser Phe Tyr Ile Ser Phe Ser Arg
360 365 370
gat acc ggc gta tca gtg ttt gat atc cgc tat aaa ggt cag cgc gtg 2768
Asp Thr Gly Val Ser Val Phe Asp Ile Arg Tyr Lys Gly Gln Arg Val
375 380 385
ctg tac gag ttg ggt cta caa gag gca ctc gcc cac tat gcg ggc aac 2816
Leu Tyr Glu Leu Gly Leu Gln Glu Ala Leu Ala His Tyr Ala Gly Asn
390 395 400
gat cca atc caa tcc agc gtc gca tat ctg gac tca tac tac ggc ttt 2864
Asp Pro Ile Gln Ser Ser Val Ala Tyr Leu Asp Ser Tyr Tyr Gly Phe
405 410 415
gga ccg tac gcc ttt gag cta gtc aaa ggc tac gac tgt ccg gtc tat 2912
Gly Pro Tyr Ala Phe Glu Leu Val Lys Gly Tyr Asp Cys Pro Val Tyr
420 425 430 435
gca acc tac ctc aac agc tcc ttc tac gtt tcc gag aca aca cac acg 2960
Ala Thr Tyr Leu Asn Ser Ser Phe Tyr Val Ser Glu Thr Thr His Thr
440 445 450
cac att gac agt ctc tgt gtg ttt gag tac gat gcc gac tat cct att 3008
His Ile Asp Ser Leu Cys Val Phe Glu Tyr Asp Ala Asp Tyr Pro Ile
455 460 465
cag cgc cac agc acg tcc gac tac gtc agc agt acg aag aac gta tac 3056
Gln Arg His Ser Thr Ser Asp Tyr Val Ser Ser Thr Lys Asn Val Tyr
470 475 480
ctc acc ctc cga tcc gtg tcc acg atc ggc aac tac gac tat atg acc 3104
Leu Thr Leu Arg Ser Val Ser Thr Ile Gly Asn Tyr Asp Tyr Met Thr
485 490 495
ag gtgagttcca cgccccgaaa gacgcatgaa atcacacccc attaaccatg 3156
Ser
cttccag c tac acg ttc cac atg gat ggc acg att ggc gtc gaa gtc cgc 3206
Tyr Thr Phe His Met Asp Gly Thr Ile Gly Val Glu Val Arg
505 510
gcc tcc ggc tac atc caa gcc gcc tac tac gcg cac aac gaa gac ttc 3254
Ala Ser Gly Tyr Ile Gln Ala Ala Tyr Tyr Ala His Asn Glu Asp Phe
515 520 525 530
ggc tac cgc atc cac gat gcg ttg tcc ggc agc atg cac gac cac gtc 3302
Gly Tyr Arg Ile His Asp Ala Leu Ser Gly Ser Met His Asp His Val
535 540 545
ctc aac ttc aag gcc gac ttc gac atc ctc ggc gtg aac aac agc atc 3350
Leu Asn Phe Lys Ala Asp Phe Asp Ile Leu Gly Val Asn Asn Ser Ile
550 555 560
gag ctc act acg gtg gcc ccg gtc acc cgc acc ttc acc tgg tcc ggc 3398
Glu Leu Thr Thr Val Ala Pro Val Thr Arg Thr Phe Thr Trp Ser Gly
565 570 575
ggc cgc tcg cgc aac acc atg acc ctg gaa cgg tcc atc cta tcg tcc 3446
Gly Arg Ser Arg Asn Thr Met Thr Leu Glu Arg Ser Ile Leu Ser Ser
580 585 590
gaa gac gaa ggc cgc ttc aac tgg ggc ccc aac ggg gcg acg atg atg 3494
Glu Asp Glu Gly Arg Phe Asn Trp Gly Pro Asn Gly Ala Thr Met Met
595 600 605 610
cac gtc atc aac cag gac gcc cgc aac ccg tac ggc gag tac cgg ggc 3542
His Val Ile Asn Gln Asp Ala Arg Asn Pro Tyr Gly Glu Tyr Arg Gly
615 620 625
tac cgc gtg ctg ccg gcg gcc ggg aca gca cac ctg acg gtc cag gac 3590
Tyr Arg Val Leu Pro Ala Ala Gly Thr Ala His Leu Thr Val Gln Asp
630 635 640
tcc agc aac ctg gcg cac gcg gcg cac tgg gcc gag tac gac atc cag 3638
Ser Ser Asn Leu Ala His Ala Ala His Trp Ala Glu Tyr Asp Ile Gln
645 650 655
gtc acg cgg cag cac gac cac gag ccg cgc gcc gcg cac gcc tac aac 3686
Val Thr Arg Gln His Asp His Glu Pro Arg Ala Ala His Ala Tyr Asn
660 665 670
agc cag gac atc cac aac ccg ccc gtc aac ttc gcc gag ttc ttc gac 3734
Ser Gln Asp Ile His Asn Pro Pro Val Asn Phe Ala Glu Phe Phe Asp
675 680 685 690
ggc gag ccg ctc aac cag acc gat ctg gtc gtg tgg ctg aac ctg ggg 3782
Gly Glu Pro Leu Asn Gln Thr Asp Leu Val Val Trp Leu Asn Leu Gly
695 700 705
atg cac cac gtc ccg cac acg ggc gac ctg ccg aac acg gtg ttc acg 3830
Met His His Val Pro His Thr Gly Asp Leu Pro Asn Thr Val Phe Thr
710 715 720
acg gcc cgc tcc ggg gtg cag ttc acg ccg ctg aac tac ctc gcc ggg 3878
Thr Ala Arg Ser Gly Val Gln Phe Thr Pro Leu Asn Tyr Leu Ala Gly
725 730 735
gac ccg agc cgg cag acg gtg aac atg gtg cga gtg aat tat gcg aat 3926
Asp Pro Ser Arg Gln Thr Val Asn Met Val Arg Val Asn Tyr Ala Asn
740 745 750
ggg tcg gcg acg gag gtg aag acg ttc ggg cag gcg gag gag gtc tgt 3974
Gly Ser Ala Thr Glu Val Lys Thr Phe Gly Gln Ala Glu Glu Val Cys
755 760 765 770
acg gta ccc atc acc ggg atc ggg gag gag cta tgg cgg tat cag ggg 4022
Thr Val Pro Ile Thr Gly Ile Gly Glu Glu Leu Trp Arg Tyr Gln Gly
775 780 785
gat gta gtg gtg cgg aaa ttc ccg tat aac ccg aat gat ccg tac tat 4070
Asp Val Val Val Arg Lys Phe Pro Tyr Asn Pro Asn Asp Pro Tyr Tyr
790 795 800
gag atg gag ggg gat gca tgatgcacat gtagatagat ttcctacagg 4118
Glu Met Glu Gly Asp Ala
805
ccgaatctgc atcggctccg tgacaaaaac aattttttta aaagattaaa aaaagataac 4178
cctaatggag atatttggaa aaataaaaaa taaaaataca agagaagact atataaaaga 4238
ctaataataa aatagagtag cagaatacct attctaagtc acgttatcta ggggtcaggt 4298
gacacaaaag cctttgcggg attcatcccg cagaccctag aacctactaa gtagcgcact 4358
agacagccta agatcaccgc gtgtgcctta cacctataaa tactaaaaat cttaaaaata 4418
ataaactcta aaatagtgaa atatctatgt agtaaaatta acaattaacc agagaataga 4478
ataataacta aagtataata gaagtggaat atatatataa tagacaagtt ccgatgccga 4538
attgatagct cttgagagaa taatcgaaat ggagatagaa agaagtaagc ctagggtgtg 4598
taataccagt ggcgtattgg tcaatatctg ataattattg actgagtccg ga 4650
<210>2
<211>808
<212>PRT
<213>米曲霉
<400>2
Met Arg Leu Thr Ile Ser Ala Ala Val Leu Pro Ser Leu Leu Leu Leu
1 5 10 15
Pro Cys Phe Leu Gly Asp Ala Leu Ala His Pro Arg Pro Asp Pro Lys
20 25 30
Thr Ala Trp Val Arg Gln Gly Arg Arg Arg Lys Ser Ser Pro Arg Asn
35 40 45
Leu Gln Val His Ser Ser Met Leu Ser Thr Cys Val Glu Ser Asn Ala
50 55 60
Thr Val Ile Lys Ala Pro Lys His Asn Val Trp Glu Gly Met Thr Asp
65 70 75 80
Glu Glu Thr Ala Ser Val Val Lys Trp Leu Phe Gln Gln Pro Thr Leu
85 90 95
Asn Leu Thr Val Thr Glu Gly Ala Gly Glu Trp Asp Asn Thr Met Thr
100 105 110
Ser Ala Leu Val Glu Leu Met Arg Pro Asn Lys Thr Asp Val Leu Ser
115 120 125
Tyr Leu Asp His Gln Gly Pro Ala Pro Ser Arg Tyr Ala His Val Val
130 135 140
Leu Asp Asn Arg Ala Thr Thr Asp Pro His Tyr Ala Asp Leu Leu Val
145 150 155 160
Gly Pro Leu Ala Ile Thr Asn Gln Ser Thr Pro Ser Trp Thr Pro Leu
165 170 175
Glu Tyr Pro Tyr Thr Arg Lys Thr His Gly Arg Val Arg Asn Leu Asp
180 185 190
Ala Asp Tyr Ser Thr Ile Tyr Ser Glu Trp Leu Tyr Lys Ile Ser Ala
195 200 205
Ser Ile Ala Asp Ile Thr Leu Asp Leu Phe Asn Gly Thr Ala Leu Gly
210 215 220
Leu Asp Asn Asp Thr Leu Asp Ile Trp Gly Ile Asp Pro Leu Trp Gln
225 230 235 240
Asp Asp Gly Arg Ile Ile Arg Trp Asp Thr Phe Trp Asn Met Pro Thr
245 250 255
Asp Glu Phe Asp Thr Gly Ser Ile Leu Pro Leu Gly Leu Phe Phe Lys
260 265 270
Ser Asp Val Thr Gly Arg Asp Pro Ser Gln Trp Lys Leu Glu Gly Trp
275 280 285
Leu Tyr Asn Asp Ile Phe Tyr Glu Thr Thr Glu Ala Phe Arg His Ala
290 295 300
Phe Phe Ser Thr Gly Phe Val Lys Leu Lys Pro Asn Thr Glu Gly Pro
305 310 315 320
Trp Ala Gln Thr Asp Gln Arg Gly Pro Ile Leu Pro Gln Asp Lys Gln
325 330 335
Gln Ser Pro Leu Met Val Ala Pro Ser Gly Ala Arg Tyr Ser Val Asp
340 345 350
Leu Asp Arg Lys Tyr Val Thr Trp Met Asp Phe Ser Phe Tyr Ile Ser
355 360 365
Phe Ser Arg Asp Thr Gly Val Ser Val Phe Asp Ile Arg Tyr Lys Gly
370 375 380
Gln Arg Val Leu Tyr Glu Leu Gly Leu Gln Glu Ala Leu Ala His Tyr
385 390 395 400
Ala Gly Asn Asp Pro Ile Gln Ser Ser Val Ala Tyr Leu Asp Ser Tyr
405 410 415
Tyr Gly Phe Gly Pro Tyr Ala Phe Glu Leu Val Lys Gly Tyr Asp Cys
420 425 430
Pro Val Tyr Ala Thr Tyr Leu Asn Ser Ser Phe Tyr Val Ser Glu Thr
435 440 445
Thr His Thr His Ile Asp Ser Leu Cys Val Phe Glu Tyr Asp Ala Asp
450 455 460
Tyr Pro Ile Gln Arg His Ser Thr Ser Asp Tyr Val Ser Ser Thr Lys
465 470 475 480
Asn Val Tyr Leu Thr Leu Arg Ser Val Ser Thr Ile Gly Asn Tyr Asp
485 490 495
Tyr Met Thr Ser Tyr Thr Phe His Met Asp Gly Thr Ile Gly Val Glu
500 505 510
Val Arg Ala Ser Gly Tyr Ile Gln Ala Ala Tyr Tyr Ala His Asn Glu
515 520 525
Asp Phe Gly Tyr Arg Ile His Asp Ala Leu Ser Gly Ser Met His Asp
530 535 540
His Val Leu Asn Phe Lys Ala Asp Phe Asp Ile Leu Gly Val Asn Asn
545 550 555 560
Ser Ile Glu Leu Thr Thr Val Ala Pro Val Thr Arg Thr Phe Thr Trp
565 570 575
Ser Gly Gly Arg Ser Arg Asn Thr Met Thr Leu Glu Arg Ser Ile Leu
580 585 590
Ser Ser Glu Asp Glu Gly Arg Phe Asn Trp Gly Pro Asn Gly Ala Thr
595 600 605
Met Met His Val Ile Asn Gln Asp Ala Arg Asn Pro Tyr Gly Glu Tyr
610 615 620
Arg Gly Tyr Arg Val Leu Pro Ala Ala Gly Thr Ala His Leu Thr Val
625 630 635 640
Gln Asp Ser Ser Asn Leu Ala His Ala Ala His Trp Ala Glu Tyr Asp
645 650 655
Ile Gln Val Thr Arg Gln His Asp His Glu Pro Arg Ala Ala His Ala
660 665 670
Tyr Asn Ser Gln Asp Ile His Asn Pro Pro Val Asn Phe Ala Glu Phe
675 680 685
Phe Asp Gly Glu Pro Leu Asn Gln Thr Asp Leu Val Val Trp Leu Asn
690 695 700
Leu Gly Met His His Val Pro His Thr Gly Asp Leu Pro Asn Thr Val
705 710 715 720
Phe Thr Thr Ala Arg Ser Gly Val Gln Phe Thr Pro Leu Asn Tyr Leu
725 730 735
Ala Gly Asp Pro Ser Arg Gln Thr Val Asn Met Val Arg Val Asn Tyr
740 745 750
Ala Asn Gly Ser Ala Thr Glu Val Lys Thr Phe Gly Gln Ala Glu Glu
755 760 765
Val Cys Thr Val Pro Ile Thr Gly Ile Gly Glu Glu Leu Trp Arg Tyr
770 775 780
Gln Gly Asp Val Val Val Arg Lys Phe Pro Tyr Asn Pro Asn Asp Pro
785 790 795 800
Tyr Tyr Glu Met Glu Gly Asp Ala
805
<210>3
<211>2523
<212>DNA
<213>米曲霉
<400>3
atgaggctaa cgatctccgc ggcagtattg ccttcgttgc ttcttctccc ctgcttctta 60
ggagatgctc tagctcatcc gagacctgat cctaagacag catgggtgcg tcaaggtcgg 120
agaaggaaga gttccccgcg gaacctgcaa gtccattcgt ctatgctctc gacctgcgtc 180
gagagcaatg ccactgtgat caaagcaccc aagcataatg tttgggaagg catgacggac 240
gaggaaacag cctctgtggt taagtggctc ttccaacaac cgacgctgaa cctgactgtc 300
acggaaggcg ccggagagtg ggataacacg atgtaagcgc caactttcgg atcactctcg 360
gtggctaaca ggaccagtgc cctcgtcgag ctgatgcgcc ccaacaagac ggatgtttta 420
agctatctcg atcaccaagg cccagcacct agccgttacg cgcatgttgt ccttgacaac 480
cgcgccacga ctgaccctca ttatgctgat cttttggtcg ggcctctagc catcaccaat 540
cagtctaccc cttcttggac gccattagag tatccttaca cgcgcaagac tcacggtcga 600
gtgcgcaatc tcgacgctga ctatagcacc atctactctg agtggctgta taagattagc 660
gcatccattg cagatatcac cctggacctg ttcaatggga ctgcattggg cttagacaac 720
gacactcttg atatatgggg gattgacccc ctctggcagg atgacggccg gatcatccgc 780
tgggacacat tctggaacat gccaacggat gagttcgaca ccggcagcat cctaccgctg 840
ggactattct tcaaatccga cgtgactggg cgtgatcctt ctcagtggaa gcttgaaggc 900
tggctttaca acgacatctt ctatgaaacg acagaggctt ttcgccatgc attcttctcg 960
accggatttg tcaagctaaa gcccaacacc gagggaccat gggcgcagac ggaccaacgg 1020
ggccctatac ttccacaaga caagcagcaa tcgcctctca tggtagcgcc gtcaggagca 1080
cggtactctg tggacctcga ccgcaaatac gtgacatgga tggacttctc gttttacatc 1140
agcttctctc gtgataccgg cgtatcagtg tttgatatcc gctataaagg tcagcgcgtg 1200
ctgtacgagt tgggtctaca agaggcactc gcccactatg cgggcaacga tccaatccaa 1260
tccagcgtcg catatctgga ctcatactac ggctttggac cgtacgcctt tgagctagtc 1320
aaaggctacg actgtccggt ctatgcaacc tacctcaaca gctccttcta cgtttccgag 1380
acaacacaca cgcacattga cagtctctgt gtgtttgagt acgatgccga ctatcctatt 1440
cagcgccaca gcacgtccga ctacgtcagc agtacgaaga acgtatacct caccctccga 1500
tccgtgtcca cgatcggcaa ctacgactat atgaccaggt gagttccacg ccccgaaaga 1560
cgcatgaaat cacaccccat taaccatgct tccagctaca cgttccacat ggatggcacg 1620
attggcgtcg aagtccgcgc ctccggctac atccaagccg cctactacgc gcacaacgaa 1680
gacttcggct accgcatcca cgatgcgttg tccggcagca tgcacgacca cgtcctcaac 1740
ttcaaggccg acttcgacat cctcggcgtg aacaacagca tcgagctcac tacggtggcc 1800
ccggtcaccc gcaccttcac ctggtccggc ggccgctcgc gcaacaccat gaccctggaa 1860
cggtccatcc tatcgtccga agacgaaggc cgcttcaact ggggccccaa cggggcgacg 1920
atgatgcacg tcatcaacca ggacgcccgc aacccgtacg gcgagtaccg gggctaccgc 1980
gtgctgccgg cggccgggac agcacacctg acggtccagg actccagcaa cctggcgcac 2040
gcggcgcact gggccgagta cgacatccag gtcacgcggc agcacgacca cgagccgcgc 2100
gccgcgcacg cctacaacag ccaggacatc cacaacccgc ccgtcaactt cgccgagttc 2160
ttcgacggcg agccgctcaa ccagaccgat ctggtcgtgt ggctgaacct ggggatgcac 2220
cacgtcccgc acacgggcga cctgccgaac acggtgttca cgacggcccg ctccggggtg 2280
cagttcacgc cgctgaacta cctcgccggg gacccgagcc ggcagacggt gaacatggtg 2340
cgagtgaatt atgcgaatgg gtcggcgacg gaggtgaaga cgttcgggca ggcggaggag 2400
gtctgtacgg tacccatcac cgggatcggg gaggagctat ggcggtatca gggggatgta 2460
gtggtgcgga aattcccgta taacccgaat gatccgtact atgagatgga gggggatgca 2520
tga 2523
<210>4
<211>2427
<212>DNA
<213>米曲霉
<400>4
atgaggctaa cgatctccgc ggcagtattg ccttcgttgc ttcttctccc ctgcttctta 60
ggagatgctc tagctcatcc gagacctgat cctaagacag catgggtgcg tcaaggtcgg 120
agaaggaaga gttccccgcg gaacctgcaa gtccattcgt ctatgctctc gacctgcgtc 180
gagagcaatg ccactgtgat caaagcaccc aagcataatg tttgggaagg catgacggac 240
gaggaaacag cctctgtggt taagtggctc ttccaacaac cgacgctgaa cctgactgtc 300
acggaaggcg ccggagagtg ggataacacg atgaccagtg ccctcgtcga gctgatgcgc 360
cccaacaaga cggatgtttt aagctatctc gatcaccaag gcccagcacc tagccgttac 420
gcgcatgttg tccttgacaa ccgcgccacg actgaccctc attatgctga tcttttggtc 480
gggcctctag ccatcaccaa tcagtctacc ccttcttgga cgccattaga gtatccttac 540
acgcgcaaga ctcacggtcg agtgcgcaat ctcgacgctg actatagcac catctactct 600
gagtggctgt ataagattag cgcatccatt gcagatatca ccctggacct gttcaatggg 660
actgcattgg gcttagacaa cgacactctt gatatatggg ggattgaccc cctctggcag 720
gatgacggcc ggatcatccg ctgggacaca ttctggaaca tgccaacgga tgagttcgac 780
accggcagca tcctaccgct gggactattc ttcaaatccg acgtgactgg gcgtgatcct 840
tctcagtgga agcttgaagg ctggctttac aacgacatct tctatgaaac gacagaggct 900
tttcgccatg cattcttctc gaccggattt gtcaagctaa agcccaacac cgagggacca 960
tgggcgcaga cggaccaacg gggccctata cttccacaag acaagcagca atcgcctctc 1020
atggtagcgc cgtcaggagc acggtactct gtggacctcg accgcaaata cgtgacatgg 1080
atggacttct cgttttacat cagcttctct cgtgataccg gcgtatcagt gtttgatatc 1140
cgctataaag gtcagcgcgt gctgtacgag ttgggtctac aagaggcact cgcccactat 1200
gcgggcaacg atccaatcca atccagcgtc gcatatctgg actcatacta cggctttgga 1260
ccgtacgcct ttgagctagt caaaggctac gactgtccgg tctatgcaac ctacctcaac 1320
agctccttct acgtttccga gacaacacac acgcacattg acagtctctg tgtgtttgag 1380
tacgatgccg actatcctat tcagcgccac agcacgtccg actacgtcag cagtacgaag 1440
aacgtatacc tcaccctccg atccgtgtcc acgatcggca actacgacta tatgaccagc 1500
tacacgttcc acatggatgg cacgattggc gtcgaagtcc gcgcctccgg ctacatccaa 1560
gccgcctact acgcgcacaa cgaagacttc ggctaccgca tccacgatgc gttgtccggc 1620
agcatgcacg accacgtcct caacttcaag gccgacttcg acatcctcgg cgtgaacaac 1680
agcatcgagc tcactacggt ggccccggtc acccgcacct tcacctggtc cggcggccgc 1740
tcgcgcaaca ccatgaccct ggaacggtcc atcctatcgt ccgaagacga aggccgcttc 1800
aactggggcc ccaacggggc gacgatgatg cacgtcatca accaggacgc ccgcaacccg 1860
tacggcgagt accggggcta ccgcgtgctg ccggcggccg ggacagcaca cctgacggtc 1920
caggactcca gcaacctggc gcacgcggcg cactgggccg agtacgacat ccaggtcacg 1980
cggcagcacg accacgagcc gcgcgccgcg cacgcctaca acagccagga catccacaac 2040
ccgcccgtca acttcgccga gttcttcgac ggcgagccgc tcaaccagac cgatctggtc 2100
gtgtggctga acctggggat gcaccacgtc ccgcacacgg gcgacctgcc gaacacggtg 2160
ttcacgacgg cccgctccgg ggtgcagttc acgccgctga actacctcgc cggggacccg 2220
agccggcaga cggtgaacat ggtgcgagtg aattatgcga atgggtcggc gacggaggtg 2280
aagacgttcg ggcaggcgga ggaggtctgt acggtaccca tcaccgggat cggggaggag 2340
ctatggcggt atcaggggga tgtagtggtg cggaaattcc cgtataaccc gaatgatccg 2400
tactatgaga tggaggggga tgcatga 2427
<210>5
<211>4091
<212>DNA
<213>米曲霉
<400>5
agatctcgct ttttaaagtt cgtacagttc ccactttttc attactcggt caacagcttt 60
gctagcttat actaacccag tgaatcaaac aatcgataat gtattgacag agctgtctgg 120
aaggatggaa ataatataca acaaaagtac cgttctcaac tctcactgct caaagcccgc 180
ccatgtcctc caccttagcg agcacctcgt cacccaaaaa gagcagacca catcctgaaa 240
cgatgccctt caagatcgaa acaactaccc tcctctacta gcgtacatct tctctaacaa 300
ttttctctca tataacctag atcaacaatg gcaggcattc ttcgagtgga agaattcaca 360
cgctatccgc ttaatccgag ataagttccg atactgtggt cttcgaagtc ttcacaatag 420
ggcatagcct tccaaggatt ggaattatag ggataataca taagaattat agctagggta 480
tcagaggagt tacttcgctc cttagagaga gcacttaccc gagccaaata ccaaggatag 540
aaatgattag aagatagact atgttctcgt gcgcttagcc ccttatgatt atgtttctca 600
atttcgcatc atttcagggt attggcgttc ctccagtaaa cgaggggtaa actattctgc 660
tagtttgatg gtcgcttata ggctgaagat aaccaacaag aagatacact tcgcttagat 720
cctcgaccat ggtgagcagc cactctgtcc aactttctga aatggcggtg ctaagtatag 780
gaacttgatg atgcaatgac tacaacaagc atcaaaagac cgataaacag cctcggcaaa 840
gcccagcgat caacctctgt ctccaaactg gcatactatg caagtctaac catagtgaaa 900
tactatcaga cgaagtacat catgtatttc atagataaag ctcatgctat ggaacaatta 960
catctcaaca cttctttcat tgaagctgtg acttgatgcc tccgttgctt tgcagcagag 1020
atatgtcccg atacttccgt gacctttgtt tctctttgca tttgtccagg gactgtctcc 1080
ccgcagggtc tatcaacgtg ggacgcgata agccccattc ttgacaactg aacggattcg 1140
ctggagataa tcgcaaccgg ttccgatctc atcttcatat acaaagcacg gtcacgctaa 1200
atctctacga ggcccaaccg tatggaaaaa tatcgctacg ggctgaatgt atggggtctt 1260
ggatctatgc taagtcattg tatccagtga gagcatctgc atcattgaca tttccgcctg 1320
taccttctgg tttaggaaaa ttcaacagcg ggctgacgcg atgcacctgg cgggttatgg 1380
tattaggaat cgaagagtga tgaaaatagt tgacaagaca gtctgatatt ggctgagatg 1440
atactcttta ttaaatttta gcttagctag ttccgagcag gccgaatgag acaagtataa 1500
agccatgacc ctggcactta atctcgtccg tctcacaaca gccagtgttt tctgcgtcgt 1560
tggacaacat gaggctaacg atctccgcgg cagtattgcc ttcgttgctt cttctcccct 1620
gcttcttagg agatgctcta gctcatccga gacctgatcc taagacagca tgggtgcgtc 1680
aaggtcggag aaggaagagt tccccgcgga acctgcaagt ccattcgtct atgctctcga 1740
cctgcgtcga gagcaatgcc actgtgatca aagcacccaa gcataatgtt tgggaaggca 1800
tgacggacga ggaaacagcc tctgtggtta agtggctctt ccaacaaccg acgctgaacc 1860
tgactgtcac ggaaggcgcc ggagagtggg ataacacgat gtaagcgcca actttcggat 1920
cactctcggt ggctaacagg accagtgccc tcgtcgagct gatgcgcccc aacaagacgg 1980
atgttttaag ctatctcgat caccaaggcc cagcacctag ccgttacgcg catgttgtcc 2040
ttgacaaccg cgccacgact gaccctcatt atgctgatct tttggtcggg cctctagcca 2100
tcaccaatca gtctacccct tcttggacgc cattagagta tccttacacg cgcaagactc 2160
acggtcgagt gcgcaatctc gacgctgact atagcaccat ctactctgag tggctgtata 2220
agattagcgc atccattgca gatatcaccc tggacctgtt caatgggact gcattgggct 2280
tagacaacga cactcttgat atatggggga ttgaccccct ctggcaggat gacggccgga 2340
tcatccgctg ggacacattc tggaacatgc caacggatga gttcgacacc ggcagcatcc 2400
taccgctggg actattcttc aaatccgacg tgactgggcg tgatccttct cagtggaagc 2460
ttgaaggctg gctttacaac gacatcttct atgaaacgac agaggctttt cgccatgcat 2520
tcttctcgac cggatttgtc aagctaaagc ccaacaccga gggaccatgg gcgcagacgg 2580
accaacgggg ccctatactt ccacaagaca agcagcaatc gcctctcatg gtagcgccgt 2640
caggagcacg gtactctgtg gacctcgacc gcaaatacgt gacatggatg gacttctcgt 2700
tttacatcag cttctctcgt gataccggcg tatcagtgtt tgatatccgc tataaaggtc 2760
agcgcgtgct gtacgagttg ggtctacaag aggcactcgc ccactatgcg ggcaacgatc 2820
caatccaatc cagcgtcgca tatctggact catactacgg ctttggaccg tacgcctttg 2880
agctagtcaa aggctacgac tgtccggtct atgcaaccta cctcaacagc tccttctacg 2940
tttccgagac aacacacacg cacattgaca gtctctgtgt gtttgagtac gatgccgact 3000
atcctattca gcgccacagc acgtccgact acgtcagcag tacgaagaac gtatacctca 3060
ccctccgatc cgtgtccacg atcggcaact acgactatat gaccaggtga gttccacgcc 3120
ccgaaagacg catgaaatca caccccatta accatgcttc cagctacacg ttccacatgg 3180
atggcacgat tggcgtcgaa gtccgcgcct ccggctacat ccaagccgcc tactacgcgc 3240
acaacgaaga cttcggctac cgcatccacg atgcgttgtc cggcagcatg cacgaccacg 3300
tcctcaactt caaggccgac ttcgacatcc tcggcgtgaa caacagcatc gagctcacta 3360
cggtggcccc ggtcacccgc accttcacct ggtccggcgg ccgctcgcgc aacaccatga 3420
ccctggaacg gtccatccta tcgtccgaag acgaaggccg cttcaactgg ggccccaacg 3480
gggcgacgat gatgcacgtc atcaaccagg acgcccgcaa cccgtacggc gagtaccggg 3540
gctaccgcgt gctgccggcg gccgggacag cacacctgac ggtccaggac tccagcaacc 3600
tggcgcacgc ggcgcactgg gccgagtacg acatccaggt cacgcggcag cacgaccacg 3660
agccgcgcgc cgcgcacgcc tacaacagcc aggacatcca caacccgccc gtcaacttcg 3720
ccgagttctt cgacggcgag ccgctcaacc agaccgatct ggtcgtgtgg ctgaacctgg 3780
ggatgcacca cgtcccgcac acgggcgacc tgccgaacac ggtgttcacg acggcccgct 3840
ccggggtgca gttcacgccg ctgaactacc tcgccgggga cccgagccgg cagacggtga 3900
acatggtgcg agtgaattat gcgaatgggt cggcgacgga ggtgaagacg ttcgggcagg 3960
cggaggaggt ctgtacggta cccatcaccg ggatcgggga ggagctatgg cggtatcagg 4020
gggatgtagt ggtgcggaaa ttcccgtata acccgaatga tccgtactat gagatggagg 4080
gggatgcatg a 4091
<210>6
<211>3995
<212>DNA
<213>米曲霉
<400>6
agatctcgct ttttaaagtt cgtacagttc ccactttttc attactcggt caacagcttt 60
gctagcttat actaacccag tgaatcaaac aatcgataat gtattgacag agctgtctgg 120
aaggatggaa ataatataca acaaaagtac cgttctcaac tctcactgct caaagcccgc 180
ccatgtcctc caccttagcg agcacctcgt cacccaaaaa gagcagacca catcctgaaa 240
cgatgccctt caagatcgaa acaactaccc tcctctacta gcgtacatct tctctaacaa 300
ttttctctca tataacctag atcaacaatg gcaggcattc ttcgagtgga agaattcaca 360
cgctatccgc ttaatccgag ataagttccg atactgtggt cttcgaagtc ttcacaatag 420
ggcatagcct tccaaggatt ggaattatag ggataataca taagaattat agctagggta 480
tcagaggagt tacttcgctc cttagagaga gcacttaccc gagccaaata ccaaggatag 540
aaatgattag aagatagact atgttctcgt gcgcttagcc ccttatgatt atgtttctca 600
atttcgcatc atttcagggt attggcgttc ctccagtaaa cgaggggtaa actattctgc 660
tagtttgatg gtcgcttata ggctgaagat aaccaacaag aagatacact tcgcttagat 720
cctcgaccat ggtgagcagc cactctgtcc aactttctga aatggcggtg ctaagtatag 780
gaacttgatg atgcaatgac tacaacaagc atcaaaagac cgataaacag cctcggcaaa 840
gcccagcgat caacctctgt ctccaaactg gcatactatg caagtctaac catagtgaaa 900
tactatcaga cgaagtacat catgtatttc atagataaag ctcatgctat ggaacaatta 960
catctcaaca cttctttcat tgaagctgtg acttgatgcc tccgttgctt tgcagcagag 1020
atatgtcccg atacttccgt gacctttgtt tctctttgca tttgtccagg gactgtctcc 1080
ccgcagggtc tatcaacgtg ggacgcgata agccccattc ttgacaactg aacggattcg 1140
ctggagataa tcgcaaccgg ttccgatctc atcttcatat acaaagcacg gtcacgctaa 1200
atctctacga ggcccaaccg tatggaaaaa tatcgctacg ggctgaatgt atggggtctt 1260
ggatctatgc taagtcattg tatccagtga gagcatctgc atcattgaca tttccgcctg 1320
taccttctgg tttaggaaaa ttcaacagcg ggctgacgcg atgcacctgg cgggttatgg 1380
tattaggaat cgaagagtga tgaaaatagt tgacaagaca gtctgatatt ggctgagatg 1440
atactcttta ttaaatttta gcttagctag ttccgagcag gccgaatgag acaagtataa 1500
agccatgacc ctggcactta atctcgtccg tctcacaaca gccagtgttt tctgcgtcgt 1560
tggacaacat gaggctaacg atctccgcgg cagtattgcc ttcgttgctt cttctcccct 1620
gcttcttagg agatgctcta gctcatccga gacctgatcc taagacagca tgggtgcgtc 1680
aaggtcggag aaggaagagt tccccgcgga acctgcaagt ccattcgtct atgctctcga 1740
cctgcgtcga gagcaatgcc actgtgatca aagcacccaa gcataatgtt tgggaaggca 1800
tgacggacga ggaaacagcc tctgtggtta agtggctctt ccaacaaccg acgctgaacc 1860
tgactgtcac ggaaggcgcc ggagagtggg ataacacgat gaccagtgcc ctcgtcgagc 1920
tgatgcgccc caacaagacg gatgttttaa gctatctcga tcaccaaggc ccagcaccta 1980
gccgttacgc gcatgttgtc cttgacaacc gcgccacgac tgaccctcat tatgctgatc 2040
ttttggtcgg gcctctagcc atcaccaatc agtctacccc ttcttggacg ccattagagt 2100
atccttacac gcgcaagact cacggtcgag tgcgcaatct cgacgctgac tatagcacca 2160
tctactctga gtggctgtat aagattagcg catccattgc agatatcacc ctggacctgt 2220
tcaatgggac tgcattgggc ttagacaacg acactcttga tatatggggg attgaccccc 2280
tctggcagga tgacggccgg atcatccgct gggacacatt ctggaacatg ccaacggatg 2340
agttcgacac cggcagcatc ctaccgctgg gactattctt caaatccgac gtgactgggc 2400
gtgatccttc tcagtggaag cttgaaggct ggctttacaa cgacatcttc tatgaaacga 2460
cagaggcttt tcgccatgca ttcttctcga ccggatttgt caagctaaag cccaacaccg 2520
agggaccatg ggcgcagacg gaccaacggg gccctatact tccacaagac aagcagcaat 2580
cgcctctcat ggtagcgccg tcaggagcac ggtactctgt ggacctcgac cgcaaatacg 2640
tgacatggat ggacttctcg ttttacatca gcttctctcg tgataccggc gtatcagtgt 2700
ttgatatccg ctataaaggt cagcgcgtgc tgtacgagtt gggtctacaa gaggcactcg 2760
cccactatgc gggcaacgat ccaatccaat ccagcgtcgc atatctggac tcatactacg 2820
gctttggacc gtacgccttt gagctagtca aaggctacga ctgtccggtc tatgcaacct 2880
acctcaacag ctccttctac gtttccgaga caacacacac gcacattgac agtctctgtg 2940
tgtttgagta cgatgccgac tatcctattc agcgccacag cacgtccgac tacgtcagca 3000
gtacgaagaa cgtatacctc accctccgat ccgtgtccac gatcggcaac tacgactata 3060
tgaccagcta cacgttccac atggatggca cgattggcgt cgaagtccgc gcctccggct 3120
acatccaagc cgcctactac gcgcacaacg aagacttcgg ctaccgcatc cacgatgcgt 3180
tgtccggcag catgcacgac cacgtcctca acttcaaggc cgacttcgac atcctcggcg 3240
tgaacaacag catcgagctc actacggtgg ccccggtcac ccgcaccttc acctggtccg 3300
gcggccgctc gcgcaacacc atgaccctgg aacggtccat cctatcgtcc gaagacgaag 3360
gccgcttcaa ctggggcccc aacggggcga cgatgatgca cgtcatcaac caggacgccc 3420
gcaacccgta cggcgagtac cggggctacc gcgtgctgcc ggcggccggg acagcacacc 3480
tgacggtcca ggactccagc aacctggcgc acgcggcgca ctgggccgag tacgacatcc 3540
aggtcacgcg gcagcacgac cacgagccgc gcgccgcgca cgcctacaac agccaggaca 3600
tccacaaccc gcccgtcaac ttcgccgagt tcttcgacgg cgagccgctc aaccagaccg 3660
atctggtcgt gtggctgaac ctggggatgc accacgtccc gcacacgggc gacctgccga 3720
acacggtgtt cacgacggcc cgctccgggg tgcagttcac gccgctgaac tacctcgccg 3780
gggacccgag ccggcagacg gtgaacatgg tgcgagtgaa ttatgcgaat gggtcggcga 3840
cggaggtgaa gacgttcggg caggcggagg aggtctgtac ggtacccatc accgggatcg 3900
gggaggagct atggcggtat cagggggatg tagtggtgcg gaaattcccg tataacccga 3960
atgatccgta ctatgagatg gagggggatg catga 3995
<210>7
<211>4554
<212>DNA
<213>米曲霉
<400>7
agatctcgct ttttaaagtt cgtacagttc ccactttttc attactcggt caacagcttt 60
gctagcttat actaacccag tgaatcaaac aatcgataat gtattgacag agctgtctgg 120
aaggatggaa ataatataca acaaaagtac cgttctcaac tctcactgct caaagcccgc 180
ccatgtcctc caccttagcg agcacctcgt cacccaaaaa gagcagacca catcctgaaa 240
cgatgccctt caagatcgaa acaactaccc tcctctacta gcgtacatct tctctaacaa 300
ttttctctca tataacctag atcaacaatg gcaggcattc ttcgagtgga agaattcaca 360
cgctatccgc ttaatccgag ataagttccg atactgtggt cttcgaagtc ttcacaatag 420
ggcatagcct tccaaggatt ggaattatag ggataataca taagaattat agctagggta 480
tcagaggagt tacttcgctc cttagagaga gcacttaccc gagccaaata ccaaggatag 540
aaatgattag aagatagact atgttctcgt gcgcttagcc ccttatgatt atgtttctca 600
atttcgcatc atttcagggt attggcgttc ctccagtaaa cgaggggtaa actattctgc 660
tagtttgatg gtcgcttata ggctgaagat aaccaacaag aagatacact tcgcttagat 720
cctcgaccat ggtgagcagc cactctgtcc aactttctga aatggcggtg ctaagtatag 780
gaacttgatg atgcaatgac tacaacaagc atcaaaagac cgataaacag cctcggcaaa 840
gcccagcgat caacctctgt ctccaaactg gcatactatg caagtctaac catagtgaaa 900
tactatcaga cgaagtacat catgtatttc atagataaag ctcatgctat ggaacaatta 960
catctcaaca cttctttcat tgaagctgtg acttgatgcc tccgttgctt tgcagcagag 1020
atatgtcccg atacttccgt gacctttgtt tctctttgca tttgtccagg gactgtctcc 1080
ccgcagggtc tatcaacgtg ggacgcgata agccccattc ttgacaactg aacggattcg 1140
ctggagataa tcgcaaccgg ttccgatctc atcttcatat acaaagcacg gtcacgctaa 1200
atctctacga ggcccaaccg tatggaaaaa tatcgctacg ggctgaatgt atggggtctt 1260
ggatctatgc taagtcattg tatccagtga gagcatctgc atcattgaca tttccgcctg 1320
taccttctgg tttaggaaaa ttcaacagcg ggctgacgcg atgcacctgg cgggttatgg 1380
tattaggaat cgaagagtga tgaaaatagt tgacaagaca gtctgatatt ggctgagatg 1440
atactcttta ttaaatttta gcttagctag ttccgagcag gccgaatgag acaagtataa 1500
agccatgacc ctggcactta atctcgtccg tctcacaaca gccagtgttt tctgcgtcgt 1560
tggacaacat gaggctaacg atctccgcgg cagtattgcc ttcgttgctt cttctcccct 1620
gcttcttagg agatgctcta gctcatccga gacctgatcc taagacagca tgggtgcgtc 1680
aaggtcggag aaggaagagt tccccgcgga acctgcaagt ccattcgtct atgctctcga 1740
cctgcgtcga gagcaatgcc actgtgatca aagcacccaa gcataatgtt tgggaaggca 1800
tgacggacga ggaaacagcc tctgtggtta agtggctctt ccaacaaccg acgctgaacc 1860
tgactgtcac ggaaggcgcc ggagagtggg ataacacgat gaccagtgcc ctcgtcgagc 1920
tgatgcgccc caacaagacg gatgttttaa gctatctcga tcaccaaggc ccagcaccta 1980
gccgttacgc gcatgttgtc cttgacaacc gcgccacgac tgaccctcat tatgctgatc 2040
ttttggtcgg gcctctagcc atcaccaatc agtctacccc ttcttggacg ccattagagt 2100
atccttacac gcgcaagact cacggtcgag tgcgcaatct cgacgctgac tatagcacca 2160
tctactctga gtggctgtat aagattagcg catccattgc agatatcacc ctggacctgt 2220
tcaatgggac tgcattgggc ttagacaacg acactcttga tatatggggg attgaccccc 2280
tctggcagga tgacggccgg atcatccgct gggacacatt ctggaacatg ccaacggatg 2340
agttcgacac cggcagcatc ctaccgctgg gactattctt caaatccgac gtgactgggc 2400
gtgatccttc tcagtggaag cttgaaggct ggctttacaa cgacatcttc tatgaaacga 2460
cagaggcttt tcgccatgca ttcttctcga ccggatttgt caagctaaag cccaacaccg 2520
agggaccatg ggcgcagacg gaccaacggg gccctatact tccacaagac aagcagcaat 2580
cgcctctcat ggtagcgccg tcaggagcac ggtactctgt ggacctcgac cgcaaatacg 2640
tgacatggat ggacttctcg ttttacatca gcttctctcg tgataccggc gtatcagtgt 2700
ttgatatccg ctataaaggt cagcgcgtgc tgtacgagtt gggtctacaa gaggcactcg 2760
cccactatgc gggcaacgat ccaatccaat ccagcgtcgc atatctggac tcatactacg 2820
gctttggacc gtacgccttt gagctagtca aaggctacga ctgtccggtc tatgcaacct 2880
acctcaacag ctccttctac gtttccgaga caacacacac gcacattgac agtctctgtg 2940
tgtttgagta cgatgccgac tatcctattc agcgccacag cacgtccgac tacgtcagca 3000
gtacgaagaa cgtatacctc accctccgat ccgtgtccac gatcggcaac tacgactata 3060
tgaccagcta cacgttccac atggatggca cgattggcgt cgaagtccgc gcctccggct 3120
acatccaagc cgcctactac gcgcacaacg aagacttcgg ctaccgcatc cacgatgcgt 3180
tgtccggcag catgcacgac cacgtcctca acttcaaggc cgacttcgac atcctcggcg 3240
tgaacaacag catcgagctc actacggtgg ccccggtcac ccgcaccttc acctggtccg 3300
gcggccgctc gcgcaacacc atgaccctgg aacggtccat cctatcgtcc gaagacgaag 3360
gccgcttcaa ctggggcccc aacggggcga cgatgatgca cgtcatcaac caggacgccc 3420
gcaacccgta cggcgagtac cggggctacc gcgtgctgcc ggcggccggg acagcacacc 3480
tgacggtcca ggactccagc aacctggcgc acgcggcgca ctgggccgag tacgacatcc 3540
aggtcacgcg gcagcacgac cacgagccgc gcgccgcgca cgcctacaac agccaggaca 3600
tccacaaccc gcccgtcaac ttcgccgagt tcttcgacgg cgagccgctc aaccagaccg 3660
atctggtcgt gtggctgaac ctggggatgc accacgtccc gcacacgggc gacctgccga 3720
acacggtgtt cacgacggcc cgctccgggg tgcagttcac gccgctgaac tacctcgccg 3780
gggacccgag ccggcagacg gtgaacatgg tgcgagtgaa ttatgcgaat gggtcggcga 3840
cggaggtgaa gacgttcggg caggcggagg aggtctgtac ggtacccatc accgggatcg 3900
gggaggagct atggcggtat cagggggatg tagtggtgcg gaaattcccg tataacccga 3960
atgatccgta ctatgagatg gagggggatg catgatgcac atgtagatag atttcctaca 4020
ggccgaatct gcatcggctc cgtgacaaaa acaatttttt taaaagatta aaaaaagata 4080
accctaatgg agatatttgg aaaaataaaa aataaaaata caagagaaga ctatataaaa 4140
gactaataat aaaatagagt agcagaatac ctattctaag tcacgttatc taggggtcag 4200
gtgacacaaa agcctttgcg ggattcatcc cgcagaccct agaacctact aagtagcgca 4260
ctagacagcc taagatcacc gcgtgtgcct tacacctata aatactaaaa atcttaaaaa 4320
taataaactc taaaatagtg aaatatctat gtagtaaaat taacaattaa ccagagaata 4380
gaataataac taaagtataa tagaagtgga atatatatat aatagacaag ttccgatgcc 4440
gaattgatag ctcttgagag aataatcgaa atggagatag aaagaagtaa gcctagggtg 4500
tgtaatacca gtggcgtatt ggtcaatatc tgataattat tgactgagtc cgga 4554
<210>8
<211>6007
<212>DNA
<213>米曲霉
<400>8
gtgcgcttag ccccttatga ttatgtttct caatttcgca tcatttcagg gtattggcgt 60
tcctccagta aacgaggggt aaactattct gctagtttga tggtcgctta taggctgaag 120
ataaccaaca agaagataca cttcgcttag atcctcgacc atggtgagca gccactctgt 180
ccaactttct gaaatggcgg tgctaagtat aggaacttga tgatgcaatg actacaacaa 240
gcatcaaaag accgataaac agcctcggca aagcccagcg atcaacctct gtctccaaac 300
tggcatacta tgcaagtcta accatagtga aatactatca gacgaagtac atcatgtatt 360
tcatagataa agctcatgct atggaacaat tacatctcaa cacttctttc attgaagctg 420
tgacttgatg cctccgttgc tttgcagcag agatatgtcc cgatacttcc gtgacctttg 480
tttctctttg catttgtcca gggactgtct ccccgcaggg tctatcaacg tgggacgcga 540
taagccccat tcttgacaac tgaacggatt cgctggagat aatcgcaacc ggttccgatc 600
tcatcttcat atacaaagca cggtcacgct aaatctctac gaggcccaac cgtatggaaa 660
aatatcgcta cgggctgaat gtatggggtc ttggatctat gctaagtcat tgtatccagt 720
gagagcatct gcatcattga catttccgcc tgtaccttct ggtttaggaa aattcaacag 780
cgggctgacg cgatgcacct ggcgggttat ggtattagga atcgaagagt gatgaaaata 840
gttgacaaga cagtctgata ttggctgaga tgatactctt tattaaattt tagcttagct 900
agttccgagc aggccgaatg agacaagtat aaagccatga ccctggcact taatctcgtc 960
cgtctcacaa cagccagtgt tttctgcgtc gttggacaac atgaggctaa cgatctccgc 1020
ggcagtattg ccttcgttgc ttcttctccc ctgcttctta ggagatgctc tagctcatcc 1080
gagacctgat cctaagacag catgggtgcg tcaaggtcgg agaaggaaga gttccccgcg 1140
gaacctgcaa gtccattcgt ctatgctctc gacctgcgtc gagagcaatg ccactgtgat 1200
caaagcaccc aagcataatg tttgggaagg catgacggac gaggaaacag cctctgtggt 1260
taagtggctc ttccaacaac cgacgctgaa cctgactgtc acggaaggcg ccggagagtg 1320
ggataacacg atgtaagcgc caactttcgg atcactctcg gtggctaaca ggaccagtgc 1380
cctcgtcgag ctgatgcgcc ccaacaagac ggatgtttta agctatctcg atcaccaagg 1440
cccagcacct agccgttacg cgcatgttgt ccttgacaac cgcgccacga ctgaccctca 1500
ttatgctgat cttttggtcg ggcctctagc catcaccaat cagtctaccc cttcttggac 1560
gccattagag tatccttaca cgcgcaagac tcacggtcga gtgcgcaatc tcgacgctga 1620
ctatagcacc atctactctg agtggctgta taagattagc gcatccattg cagatatcac 1680
cctggacctg ttcaatggga ctgcattggg cttagacaac gacactcttg atatatgggg 1740
gattgacccc ctctggcagg atgacggccg gatcatccgc tgggacacat tctggaacat 1800
gccaacggat gagttcgaca ccggcagcat cctaccgctg ggactattct tcaaatccga 1860
cgtgactggg cgtgatcctt ctcagtggaa gcttgaaggc tggctttaca acgacatctt 1920
ctatgaaacg acagaggctt ttcgccatgc attcttctcg accggatttg tcaagctaaa 1980
gcccaacacc gagggaccat gggcgcagac ggaccaacgg ggccctatac ttccacaaga 2040
caagcagcaa tcgcctctca tggtagcgcc gtcaggagca cggtactctg tggacctcga 2100
ccgcaaatac gtgacatgga tggacttctc gttttacatc agcttctctc gtgataccgg 2160
cgtatcagtg tttgatatcc gctataaagg tcagcgcgtg ctgtacgagt tgggtctaca 2220
agaggcactc gcccactatg cgggcaacga tccaatccaa tccagcgtcg catatctgga 2280
ctcatactac ggctttggac cgtacgcctt tgagctagtc aaaggctacg actgtccggt 2340
ctatgcaacc tacctcaaca gctccttcta cgtttccgag acaacacaca cgcacattga 2400
cagtctctgt gtgtttgagt acgatgccga ctatcctatt cagcgccaca gcacgtccga 2460
ctacgtcagc agtacgaaga acgtatacct caccctccga tccgtgtcca cgatcggcaa 2520
ctacgactat atgaccaggt gagttccacg ccccgaaaga cgcatgaaat cacaccccat 2580
taaccatgct tccagctaca cgttccacat ggatggcacg attggcgtcg aagtccgcgc 2640
ctccggctac atccaagccg cctactacgc gcacaacgaa gacttcggct accgcatcca 2700
cgatgcgttg tccggcagca tgcacgacca cgtcctcaac ttcaaggccg acttcgacat 2760
cctcggcgtg aacaacagca tcgagctcac tacggtggcc ccggtcaccc gcaccttcac 2820
ctggtccggc ggccgctcgc gcaacaccat gaccctggaa cggtccatcc tatcgtccga 2880
agacgaaggc cgcttcaact ggggccccaa cggggcgacg atgatgcacg tcatcaacca 2940
ggacgcccgc aacccgtacg gcgagtaccg gggctaccgc gtgctgccgg cggccgggac 3000
agcacacctg acggtccagg actccagcaa cctggcgcac gcggcgcact gggccgagta 3060
cgacatccag gtcacgcggc agcacgacca cgagccgcgc gccgcgcacg cctacaacag 3120
ccaggacatc cacaacccgc ccgtcaactt cgccgagttc ttcgacggcg agccgctcaa 3180
ccagaccgat ctggtcgtgt ggctgaacct ggggatgcac cacgtcccgc acacgggcga 3240
cctgccgaac acggtgttca cgacggcccg ctccggggtg cagttcacgc cgctgaacta 3300
cctcgccggg gacccgagcc ggcagacggt gaacatggtg cgagtgaatt atgcgaatgg 3360
gtcggcgacg gaggtgaaga cgttcgggca ggcggaggag gtctgtacgg tacccatcac 3420
cgggatcggg gaggagctat ggcggtatca gggggatgta gtggtgcgga aattcccgta 3480
taacccgaat gatccgtact atgagatgga gggggatgca tgatgcacat gtagatagat 3540
ttcctacagg ccgaatctgc atcggctccg tgacaaaaac aattttttta aaagattaaa 3600
aaaagataac cctaatggag atatttggaa aaataaaaaa taaaaataca agagaagact 3660
atataaaaga ctaataataa aatagagtag cagaatacct attctaagtc acgttatcta 3720
ggggtcaggt gacacaaaag cctttgcggg attcatcccg cagaccctag aacctactaa 3780
gtagcgcact agacagccta agatcaccgc gtgtgcctta cacctataaa tactaaaaat 3840
cttaaaaata ataaactcta aaatagtgaa atatctatgt agtaaaatta acaattaacc 3900
agagaataga ataataacta aagtataata gaagtggaat atatatataa tagacaagtt 3960
ccgatgccga attgatagct cttgagagaa taatcgaaat ggagatagaa agaagtaagc 4020
ctagggtgtg taataccagt ggcgtattgg tcaatatctg ataattattg actgagtccg 4080
gagtgttcgc accagaatcg ggagtcggag tccacccgat gtcacgagaa caggtacaaa 4140
gaggaaggga ttgccccggt ggaggccaga ttctcaaagc ccattccagc tcaacgggtt 4200
tggtttgttt gcatgcgacc gaccattcta gacacggtcg ccaattcaaa gagcttctgc 4260
tgccaagatt cacctataaa tagaatctgt aatcaagtaa gaattaaaag ttgtatctat 4320
cattatctat ctctatatcg cacttttctt gtaaaaccct tcccgtataa cacatacaaa 4380
gaaaacgtaa atatcagaga cccaggtata ccgtatatat taagccaaga gcgccgtgta 4440
gtggcgctta gtcaatgtac ttgggaagcg tcttcaggat gccgtcccgg gcgatgtcct 4500
ccatcgcttt ggtgatttcc tggaggaacc tcttgtcgcc gcgcaagtcg tcaccgaaca 4560
ggctcttgat gctgaggagc tcggccgggc tggtgcctcc tgcgcgagcc ttggcctgga 4620
gctcctcgcg catcgggtcg tcgacctcga acttcttgcc gctgtcgtcg acgccgttaa 4680
tgtaatggaa ccaggcagcc gcaacgaaac acaggcggcg gaatgggcca gtaacccaga 4740
tcgcctcagc aatcgaaggc atgataaatt gtgggatctt gcccgaagcg ttgaggcaga 4800
tgcggggcag ttggtccatg atggtggggt tggagaagcg ctcgatgagc gtcttgcaat 4860
actcatcaat gttgacgccc gggatctcgg gcaacaacgg cttcacctcg tcctgcatca 4920
tttgccacac aaacttgctg aacagtgggt tctccatcac ctcgtggaca tatttgaagc 4980
cggccagctg ccctgggtag ccgatggccg agtggctgcc gttgagcagg cgcagcttgt 5040
gcttctcgaa ttcctcgacg tcatggacat tcttgaccac ctgggcacca accttctcga 5100
atggtgggcg gccatcggag aactgatcct caattaccca ctgcataaag ggctctgtga 5160
cgacgggcca cgagtcctcg atggcaaagt tgtctgcgag tgccgtttta tcggtggcgg 5220
atgtctgagg ggtgatacgg tcgaccatgg cgttggggaa ggcgccctgt tcggcaatcc 5280
acttcgcgat ctcggggttg cgcaggcgcg caaaggactc gagcatgtgg cgagtgatgg 5340
aaccgttctt ctgcatgttg tcacacgaca tgacggtaaa gggcttgagc ccttgctggt 5400
agcggcgtgc cagagcggca tagaggaagc cgaacgtggt gcgcggggac ttctcgttcg 5460
ctggttggag gtcgaactga atgtcagggt gctcactttg gagctcgtgt gtgttctcgt 5520
tgtagtagta accgctctcg gtgatagtga gcgacacaat gtgggtatcc gggtgcgcca 5580
tcttggcgat gacggcctcg cggttatcgg gggcaaagag ataggaattg atgctcccaa 5640
caacatgggc aaagctgccc ttggccgaac gctcaatgac ggtgtagagg tggtcctgcg 5700
accctaaggc gtcgcgcatg gcggcgtcaa agggctgcaa accaacacca caaatcgcgt 5760
agtcagtcac accatgcttc tgcatcaact ggtcgacata aacggccaag tgagctctgt 5820
ggaagccgcc gacgccgacg tggacaattc cctccttcac gtcgccacca cgcttgtagg 5880
ttgggacctt gacttgggtc tcacctgccg ccgcaatttg cgacaggttt ttgttgttga 5940
gcttcagggg agccattgtg aatgtgtgaa gagtgagaga gaggaattga aagaaagaca 6000
agggcga 6007
<210>9
<211>453
<212>DNA
<213>米曲霉
<400>9
tggctgaacc tggggatgca ccacgtcccg cacacgggcg acctgccgaa cacggtgttc 60
acgacggccc gctccggggt gcagttcacg ccgctgaact acctcgccgg ggacccgagc 120
cggcagacgg tgaacatggt gcgagtgaat tatgcgaatg ggtcggcgac ggaggtgaag 180
acgttcgggc aggcggagga ggtctgtacg gtacccatca ccgggatcgg ggaggagcta 240
tggcggtatc agggggatgt agtggtgcgg aaattcccgt ataacccgaa tgatccgtac 300
tatgagatgg agggggatgc atgatgcaca tgtagataga tttcctacag gccgaatctg 360
catcggctcc gtgacaaaaa caattttttt aaaagattaa aaaaagataa ccctaatgga 420
gatatttgga aaaataaaaa aaaaaaaaaa aaa 453
<210>10
<211>6960
<212>DNA
<213>米曲霉
<400>10
agatctcgct ttttaaagtt cgtacagttc ccactttttc attactcggt caacagcttt 60
gctagcttat actaacccag tgaatcaaac aatcgataat gtattgacag agctgtctgg 120
aaggatggaa ataatataca acaaaagtac cgttctcaac tctcactgct caaagcccgc 180
ccatgtcctc caccttagcg agcacctcgt cacccaaaaa gagcagacca catcctgaaa 240
cgatgccctt caagatcgaa acaactaccc tcctctacta gcgtacatct tctctaacaa 300
ttttctctca tataacctag atcaacaatg gcaggcattc ttcgagtgga agaattcaca 360
cgctatccgc ttaatccgag ataagttccg atactgtggt cttcgaagtc ttcacaatag 420
ggcatagcct tccaaggatt ggaattatag ggataataca taagaattat agctagggta 480
tcagaggagt tacttcgctc cttagagaga gcacttaccc gagccaaata ccaaggatag 540
aaatgattag aagatagact atgttctcgt gcgcttagcc ccttatgatt atgtttctca 600
atttcgcatc atttcagggt attggcgttc ctccagtaaa cgaggggtaa actattctgc 660
tagtttgatg gtcgcttata ggctgaagat aaccaacaag aagatacact tcgcttagat 720
cctcgaccat ggtgagcagc cactctgtcc aactttctga aatggcggtg ctaagtatag 780
gaacttgatg atgcaatgac tacaacaagc atcaaaagac cgataaacag cctcggcaaa 840
gcccagcgat caacctctgt ctccaaactg gcatactatg caagtctaac catagtgaaa 900
tactatcaga cgaagtacat catgtatttc atagataaag ctcatgctat ggaacaatta 960
catctcaaca cttctttcat tgaagctgtg acttgatgcc tccgttgctt tgcagcagag 1020
atatgtcccg atacttccgt gacctttgtt tctctttgca tttgtccagg gactgtctcc 1080
ccgcagggtc tatcaacgtg ggacgcgata agccccattc ttgacaactg aacggattcg 1140
ctggagataa tcgcaaccgg ttccgatctc atcttcatat acaaagcacg gtcacgctaa 1200
atctctacga ggcccaaccg tatggaaaaa tatcgctacg ggctgaatgt atggggtctt 1260
ggatctatgc taagtcattg tatccagtga gagcatctgc atcattgaca tttccgcctg 1320
taccttctgg tttaggaaaa ttcaacagcg ggctgacgcg atgcacctgg cgggttatgg 1380
tattaggaat cgaagagtga tgaaaatagt tgacaagaca gtctgatatt ggctgagatg 1440
atactcttta ttaaatttta gcttagctag ttccgagcag gccgaatgag acaagtataa 1500
agccatgacc ctggcactta atctcgtccg tctcacaaca gccagtgttt tctgcgtcgt 1560
tggacaacat gaggctaacg atctccgcgg cagtattgcc ttcgttgctt cttctcccct 1620
gcttcttagg agatgctcta gctcatccga gacctgatcc taagacagca tgggtgcgtc 1680
aaggtcggag aaggaagagt tccccgcgga acctgcaagt ccattcgtct atgctctcga 1740
cctgcgtcga gagcaatgcc actgtgatca aagcacccaa gcataatgtt tgggaaggca 1800
tgacggacga ggaaacagcc tctgtggtta agtggctctt ccaacaaccg acgctgaacc 1860
tgactgtcac ggaaggcgcc ggagagtggg ataacacgat gtaagcgcca actttcggat 1920
cactctcggt ggctaacagg accagtgccc tcgtcgagct gatgcgcccc aacaagacgg 1980
atgttttaag ctatctcgat caccaaggcc cagcacctag ccgttacgcg catgttgtcc 2040
ttgacaaccg cgccacgact gaccctcatt atgctgatct tttggtcggg cctctagcca 2100
tcaccaatca gtctacccct tcttggacgc cattagagta tccttacacg cgcaagactc 2160
acggtcgagt gcgcaatctc gacgctgact atagcaccat ctactctgag tggctgtata 2220
agattagcgc atccattgca gatatcaccc tggacctgtt caatgggact gcattgggct 2280
tagacaacga cactcttgat atatggggga ttgaccccct ctggcaggat gacggccgga 2340
tcatccgctg ggacacattc tggaacatgc caacggatga gttcgacacc ggcagcatcc 2400
taccgctggg actattcttc aaatccgacg tgactgggcg tgatccttct cagtggaagc 2460
ttgaaggctg gctttacaac gacatcttct atgaaacgac agaggctttt cgccatgcat 2520
tcttctcgac cggatttgtc aagctaaagc ccaacaccga gggaccatgg gcgcagacgg 2580
accaacgggg ccctatactt ccacaagaca agcagcaatc gcctctcatg gtagcgccgt 2640
caggagcacg gtactctgtg gacctcgacc gcaaatacgt gacatggatg gacttctcgt 2700
tttacatcag cttctctcgt gataccggcg tatcagtgtt tgatatccgc tataaaggtc 2760
agcgcgtgct gtacgagttg ggtctacaag aggcactcgc ccactatgcg ggcaacgatc 2820
caatccaatc cagcgtcgca tatctggact catactacgg ctttggaccg tacgcctttg 2880
agctagtcaa aggctacgac tgtccggtct atgcaaccta cctcaacagc tccttctacg 2940
tttccgagac aacacacacg cacattgaca gtctctgtgt gtttgagtac gatgccgact 3000
atcctattca gcgccacagc acgtccgact acgtcagcag tacgaagaac gtatacctca 3060
ccctccgatc cgtgtccacg atcggcaact acgactatat gaccaggtga gttccacgcc 3120
ccgaaagacg catgaaatca caccccatta accatgcttc cagctacacg ttccacatgg 3180
atggcacgat tggcgtcgaa gtccgcgcct ccggctacat ccaagccgcc tactacgcgc 3240
acaacgaaga cttcggctac cgcatccacg atgcgttgtc cggcagcatg cacgaccacg 3300
tcctcaactt caaggccgac ttcgacatcc tcggcgtgaa caacagcatc gagctcacta 3360
cggtggcccc ggtcacccgc accttcacct ggtccggcgg ccgctcgcgc aacaccatga 3420
ccctggaacg gtccatccta tcgtccgaag acgaaggccg cttcaactgg ggccccaacg 3480
gggcgacgat gatgcacgtc atcaaccagg acgcccgcaa cccgtacggc gagtaccggg 3540
gctaccgcgt gctgccggcg gccgggacag cacacctgac ggtccaggac tccagcaacc 3600
tggcgcacgc ggcgcactgg gccgagtacg acatccaggt cacgcggcag cacgaccacg 3660
agccgcgcgc cgcgcacgcc tacaacagcc aggacatcca caacccgccc gtcaacttcg 3720
ccgagttctt cgacggcgag ccgctcaacc agaccgatct ggtcgtgtgg ctgaacctgg 3780
ggatgcacca cgtcccgcac acgggcgacc tgccgaacac ggtgttcacg acggcccgct 3840
ccggggtgca gttcacgccg ctgaactacc tcgccgggga cccgagccgg cagacggtga 3900
acatggtgcg agtgaattat gcgaatgggt cggcgacgga ggtgaagacg ttcgggcagg 3960
cggaggaggt ctgtacggta cccatcaccg ggatcgggga ggagctatgg cggtatcagg 4020
gggatgtagt ggtgcggaaa ttcccgtata acccgaatga tccgtactat gagatggagg 4080
gggatgcatg atgcacatgt agatagattt cctacaggcc gaatctgcat cggctccgtg 4140
acaaaaacaa tttttttaaa agattaaaaa aagataaccc taatggagat atttggaaaa 4200
ataaaaaata aaaatacaag agaagactat ataaaagact aataataaaa tagagtagca 4260
gaatacctat tctaagtcac gttatctagg ggtcaggtga cacaaaagcc tttgcgggat 4320
tcatcccgca gaccctagaa cctactaagt agcgcactag acagcctaag atcaccgcgt 4380
gtgccttaca cctataaata ctaaaaatct taaaaataat aaactctaaa atagtgaaat 4440
atctatgtag taaaattaac aattaaccag agaatagaat aataactaaa gtataataga 4500
agtggaatat atatataata gacaagttcc gatgccgaat tgatagctct tgagagaata 4560
atcgaaatgg agatagaaag aagtaagcct agggtgtgta ataccagtgg cgtattggtc 4620
aatatctgat aattattgac tgagtccgga gtgttcgcac cagaatcggg agtcggagtc 4680
cacccgatgt cacgagaaca ggtacaaaga ggaagggatt gccccggtgg aggccagatt 4740
ctcaaagccc attccagctc aacgggtttg gtttgtttgc atgcgaccga ccattctaga 4800
cacggtcgcc aattcaaaga gcttctgctg ccaagattca cctataaata gaatctgtaa 4860
tcaagtaaga attaaaagtt gtatctatca ttatctatct ctatatcgca cttttcttgt 4920
aaaacccttc ccgtataaca catacaaaga aaacgtaaat atcagagacc caggtatacc 4980
gtatatatta agccaagagc gccgtgtagt ggcgcttagt caatgtactt gggaagcgtc 5040
ttcaggatgc cgtcccgggc gatgtcctcc atcgctttgg tgatttcctg gaggaacctc 5100
ttgtcgccgc gcaagtcgtc accgaacagg ctcttgatgc tgaggagctc ggccgggctg 5160
gtgcctcctg cgcgagcctt ggcctggagc tcctcgcgca tcgggtcgtc gacctcgaac 5220
ttcttgccgc tgtcgtcgac gccgttaatg taatggaacc aggcagccgc aacgaaacac 5280
aggcggcgga atgggccagt aacccagatc gcctcagcaa tcgaaggcat gataaattgt 5340
gggatcttgc ccgaagcgtt gaggcagatg cggggcagtt ggtccatgat ggtggggttg 5400
gagaagcgct cgatgagcgt cttgcaatac tcatcaatgt tgacgcccgg gatctcgggc 5460
aacaacggct tcacctcgtc ctgcatcatt tgccacacaa acttgctgaa cagtgggttc 5520
tccatcacct cgtggacata tttgaagccg gccagctgcc ctgggtagcc gatggccgag 5580
tggctgccgt tgagcaggcg cagcttgtgc ttctcgaatt cctcgacgtc atggacattc 5640
ttgaccacct gggcaccaac cttctcgaat ggtgggcggc catcggagaa ctgatcctca 5700
attacccact gcataaaggg ctctgtgacg acgggccacg agtcctcgat ggcaaagttg 5760
tctgcgagtg ccgttttatc ggtggcggat gtctgagggg tgatacggtc gaccatggcg 5820
ttggggaagg cgccctgttc ggcaatccac ttcgcgatct cggggttgcg caggcgcgca 5880
aaggactcga gcatgtggcg agtgatggaa ccgttcttct gcatgttgtc acacgacatg 5940
acggtaaagg gcttgagccc ttgctggtag cggcgtgcca gagcggcata gaggaagccg 6000
aacgtggtgc gcggggactt ctcgttcgct ggttggaggt cgaactgaat gtcagggtgc 6060
tcactttgga gctcgtgtgt gttctcgttg tagtagtaac cgctctcggt gatagtgagc 6120
gacacaatgt gggtatccgg gtgcgccatc ttggcgatga cggcctcgcg gttatcgggg 6180
gcaaagagat aggaattgat gctcccaaca acatgggcaa agctgccctt ggccgaacgc 6240
tcaatgacgg tgtagaggtg gtcctgcgac cctaaggcgt cgcgcatggc ggcgtcaaag 6300
ggctgcaaac caacaccaca aatcgcgtag tcagtcacac catgcttctg catcaactgg 6360
tcgacataaa cggccaagtg agctctgtgg aagccgccga cgccgacgtg gacaattccc 6420
tccttcacgt cgccaccacg cttgtaggtt gggaccttga cttgggtctc acctgccgcc 6480
gcaatttgcg acaggttttt gttgttgagc ttcaggggag ccattgtgaa tgtgtgaaga 6540
gtgagagaga ggaattgaaa gaaagacaag ggcgagaagg cgagagagaa aagggggttt 6600
gttgtttttt ttctggctgg ggcgctgagt cgacgagggt caccgccagt ttttgaccgc 6660
tggttggaac agattacatc atgtggtggg gagctgatct cacgaggttc tcgaattttt 6720
ttagccactt gataaaaaaa aatcaaaagt acagtgcaat tagataagca ttcctttttt 6780
ctttttttat ttcttggttg ccgctctcgg tcgccgtatc acattttaaa ctcaacgtgc 6840
ttaaggtttt catgttcgaa gtcacctttt gtcaatggaa caaaaagaaa aactctgaga 6900
tccacccaca taaaacccta aaagaagtca gctgttgaaa atgaacaaag atatagatct 6960
<210>11
<211>23
<212>DNA
<213>人工
<220>
<223>引物
<400>11
tagcaccatc tactctgagt ggc 23
<210>12
<211>23
<212>DNA
<213>人工
<220>
<223>引物
<400>12
cctggtcata tagtcgtagt tgc 23
<210>13
<211>18
<212>DNA
<213>人工
<220>
<223>引物
<400>13
gctagcttat actaaccc 18
<210>14
<211>18
<212>DNA
<213>人工
<220>
<223>引物
<400>14
gactatgttc tcgtgcgc 18
<210>15
<211>18
<212>DNA
<213>人工
<220>
<223>引物
<400>15
tctttgcatt tgtccagg 18
<210>16
<211>18
<212>DNA
<213>人工
<220>
<223>引物
<400>16
tctgcgtcgt tggacaac 18
<210>17
<211>18
<212>DNA
<213>人工
<220>
<223>引物
<400>17
gactgaccct cattatgc 18
<210>18
<211>18
<212>DNA
<213>人工
<220>
<223>引物
<400>18
aacaccgagg gaccatgg 18
<210>19
<211>18
<212>DNA
<213>人工
<220>
<223>引物
<400>19
tacctcaccc tccgatcc 18
<210>20
<211>18
<212>DNA
<213>人工
<220>
<223>引物
<400>20
gggacagcac acctgacg 18
<210>21
<211>18
<212>DNA
<213>人工
<220>
<223>引物
<400>21
aacccgaatg atccgtac 18
<210>22
<211>18
<212>DNA
<213>人工
<220>
<223>引物
<400>22
agagaataat cgaaatgg 18
<210>23
<211>24
<212>DNA
<213>人工
<220>
<223>引物
<400>23
tggctgaacc tggggatgca ccac 24
<210>24
<211>9135
<212>DNA
<213>米曲霉
<400>24
tggccaccgt ggtggcttaa actaccggag ttttacagta ggaacatcag ggggtaacag 60
aaacattttt gcttttggac caacggcatt cggatcggga taccgacttt agcagggtat 120
atcctcatgc ggtccacgga agagggttga aaagtatcat aagttattgt cattattttc 180
cttcagaagg tggaatggaa tcaagtcaaa cactattcat agctttaagg aagagtactt 240
ttggtataaa aactaacttg ggatacctct tactgccgtc gcggagggtc caggacggga 300
cgatccgaag acgaacatcc tccagctcgt gtatcagtgg ctgtaatgaa cgagggccat 360
tagtgaggca tggatcaatc ctgctcacat cgcgaaatgc tccggcggca cggaatctgg 420
tgggggcgat attacttgct aaacatcctc acttgtggcc ttcgtacagt ttgctttgaa 480
caccttatct ccactaaaaa gagctcaaat gatggattct catatcgggg actgccaggt 540
aatatagata gtataccagc gaatcagtca agctcctcga gcgagagagt tagccaatcc 600
gactacggaa aggagctact gtggtcacaa tgcagcgaga taccccaccc ttggcaattg 660
aattagccct ctataacaaa gctgcgagtt ggtacttacc tttttttttt tttaaaaaaa 720
aaaaaactgt atttgtcttt atacaaagta ttgctatcgc tttaccagca gagcttgacc 780
aaaatgtccc tagaattcca gcgtatagag agatctcgct ttttaaagtt cgtacagttc 840
ccactttttc attactcggt caacagcttt gctagcttat actaacccag tgaatcaaac 900
aatcgataat gtattgacag agctgtctgg aaggatggaa ataatataca acaaaagtac 960
cgttctcaac tctcactgct caaagcccgc ccatgtcctc caccttagcg agcacctcgt 1020
cacccaaaaa gagcagacca catcctgaaa cgatgccctt caagatcgaa acaactaccc 1080
tcctctacta gcgtacatct tctctaacaa ttttctctca tataacctag atcaacaatg 1140
gcaggcattc ttcgagtgga agaattcaca cgctatccgc ttaatccgag ataagttccg 1200
atactgtggt cttcgaagtc ttcacaatag ggcatagcct tccaaggatt ggaattatag 1260
ggataataca taagaattat agctagggta tcagaggagt tacttcgctc cttagagaga 1320
gcacttaccc gagccaaata ccaaggatag aaatgattag aagatagact atgttctcgt 1380
gcgcttagcc ccttatgatt atgtttctca atttcgcatc atttcagggt attggcgttc 1440
ctccagtaaa cgaggggtaa actattctgc tagtttgatg gtcgcttata ggctgaagat 1500
aaccaacaag aagatacact tcgcttagat cctcgaccat ggtgagcagc cactctgtcc 1560
aactttctga aatggcggtg ctaagtatag gaacttgatg atgcaatgac tacaacaagc 1620
atcaaaagac cgataaacag cctcggcaaa gcccagcgat caacctctgt ctccaaactg 1680
gcatactatg caagtctaac catagtgaaa tactatcaga cgaagtacat catgtatttc 1740
atagataaag ctcatgctat ggaacaatta catctcaaca cttctttcat tgaagctgtg 1800
acttgatgcc tccgttgctt tgcagcagag atatgtcccg atacttccgt gacctttgtt 1860
tctctttgca tttgtccagg gactgtctcc ccgcagggtc tatcaacgtg ggacgcgata 1920
agccccattc ttgacaactg aacggattcg ctggagataa tcgcaaccgg ttccgatctc 1980
atcttcatat acaaagcacg gtcacgctaa atctctacga ggcccaaccg tatggaaaaa 2040
tatcgctacg ggctgaatgt atggggtctt ggatctatgc taagtcattg tatccagtga 2100
gagcatctgc atcattgaca tttccgcctg taccttctgg tttaggaaaa ttcaacagcg 2160
ggctgacgcg atgcacctgg cgggttatgg tattaggaat cgaagagtga tgaaaatagt 2220
tgacaagaca gtctgatatt ggctgagatg atactcttta ttaaatttta gcttagctag 2280
ttccgagcag gccgaatgag acaagtataa agccatgacc ctggcactta atctcgtccg 2340
tctcacaaca gccagtgttt tctgcgtcgt tggacaacat gaggctaacg atctccgcgg 2400
cagtattgcc ttcgttgctt cttctcccct gcttcttagg agatgctcta gctcatccga 2460
gacctgatcc taagacagca tgggtgcgtc aaggtcggag aaggaagagt tccccgcgga 2520
acctgcaagt ccattcgtct atgctctcga cctgcgtcga gagcaatgcc actgtgatca 2580
aagcacccaa gcataatgtt tgggaaggca tgacggacga ggaaacagcc tctgtggtta 2640
agtggctctt ccaacaaccg acgctgaacc tgactgtcac ggaaggcgcc ggagagtggg 2700
ataacacgat gtaagcgcca actttcggat cactctcggt ggctaacagg accagtgccc 2760
tcgtcgagct gatgcgcccc aacaagacgg atgttttaag ctatctcgat caccaaggcc 2820
cagcacctag ccgttacgcg catgttgtcc ttgacaaccg cgccacgact gaccctcatt 2880
atgctgatct tttggtcggg cctctagcca tcaccaatca gtctacccct tcttggacgc 2940
cattagagta tccttacacg cgcaagactc acggtcgagt gcgcaatctc gacgctgact 3000
atagcaccat ctactctgag tggctgtata agattagcgc atccattgca gatatcaccc 3060
tggacctgtt caatgggact gcattgggct tagacaacga cactcttgat atatggggga 3120
ttgaccccct ctggcaggat gacggccgga tcatccgctg ggacacattc tggaacatgc 3180
caacggatga gttcgacacc ggcagcatcc taccgctggg actattcttc aaatccgacg 3240
tgactgggcg tgatccttct cagtggaagc ttgaaggctg gctttacaac gacatcttct 3300
atgaaacgac agaggctttt cgccatgcat tcttctcgac cggatttgtc aagctaaagc 3360
ccaacaccga gggaccatgg gcgcagacgg accaacgggg ccctatactt ccacaagaca 3420
agcagcaatc gcctctcatg gtagcgccgt caggagcacg gtactctgtg gacctcgacc 3480
gcaaatacgt gacatggatg gacttctcgt tttacatcag cttctctcgt gataccggcg 3540
tatcagtgtt tgatatccgc tataaaggtc agcgcgtgct gtacgagttg ggtctacaag 3600
aggcactcgc ccactatgcg ggcaacgatc caatccaatc cagcgtcgca tatctggact 3660
catactacgg ctttggaccg tacgcctttg agctagtcaa aggctacgac tgtccggtct 3720
atgcaaccta cctcaacagc tccttctacg tttccgagac aacacacacg cacattgaca 3780
gtctctgtgt gtttgagtac gatgccgact atcctattca gcgccacagc acgtccgact 3840
acgtcagcag tacgaagaac gtatacctca ccctccgatc cgtgtccacg atcggcaact 3900
acgactatat gaccaggtga gttccacgcc ccgaaagacg catgaaatca caccccatta 3960
accatgcttc cagctacacg ttccacatgg atggcacgat tggcgtcgaa gtccgcgcct 4020
ccggctacat ccaagccgcc tactacgcgc acaacgaaga cttcggctac cgcatccacg 4080
atgcgttgtc cggcagcatg cacgaccacg tcctcaactt caaggccgac ttcgacatcc 4140
tcggcgtgaa caacagcatc gagctcacta cggtggcccc ggtcacccgc accttcacct 4200
ggtccggcgg ccgctcgcgc aacaccatga ccctggaacg gtccatccta tcgtccgaag 4260
acgaaggccg cttcaactgg ggccccaacg gggcgacgat gatgcacgtc atcaaccagg 4320
acgcccgcaa cccgtacggc gagtaccggg gctaccgcgt gctgccggcg gccgggacag 4380
cacacctgac ggtccaggac tccagcaacc tggcgcacgc ggcgcactgg gccgagtacg 4440
acatccaggt cacgcggcag cacgaccacg agccgcgcgc cgcgcacgcc tacaacagcc 4500
aggacatcca caacccgccc gtcaacttcg ccgagttctt cgacggcgag ccgctcaacc 4560
agaccgatct ggtcgtgtgg ctgaacctgg ggatgcacca cgtcccgcac acgggcgacc 4620
tgccgaacac ggtgttcacg acggcccgct ccggggtgca gttcacgccg ctgaactacc 4680
tcgccgggga cccgagccgg cagacggtga acatggtgcg agtgaattat gcgaatgggt 4740
cggcgacgga ggtgaagacg ttcgggcagg cggaggaggt ctgtacggta cccatcaccg 4800
ggatcgggga ggagctatgg cggtatcagg gggatgtagt ggtgcggaaa ttcccgtata 4860
acccgaatga tccgtactat gagatggagg gggatgcatg atgcacatgt agatagattt 4920
cctacaggcc gaatctgcat cggctccgtg acaaaaacaa tttttttaaa agattaaaaa 4980
aagataaccc taatggagat atttggaaaa ataaaaaata aaaatacaag agaagactat 5040
ataaaagact aataataaaa tagagtagca gaatacctat tctaagtcac gttatctagg 5100
ggtcaggtga cacaaaagcc tttgcgggat tcatcccgca gaccctagaa cctactaagt 5160
agcgcactag acagcctaag atcaccgcgt gtgccttaca cctataaata ctaaaaatct 5220
taaaaataat aaactctaaa atagtgaaat atctatgtag taaaattaac aattaaccag 5280
agaatagaat aataactaaa gtataataga agtggaatat atatataata gacaagttcc 5340
gatgccgaat tgatagctct tgagagaata atcgaaatgg agatagaaag aagtaagcct 5400
agggtgtgta ataccagtgg cgtattggtc aatatctgat aattattgac tgagtccgga 5460
gtgttcgcac cagaatcggg agtcggagtc cacccgatgt cacgagaaca ggtacaaaga 5520
ggaagggatt gccccggtgg aggccagatt ctcaaagccc attccagctc aacgggtttg 5580
gtttgtttgc atgcgaccga ccattctaga cacggtcgcc aattcaaaga gcttctgctg 5640
ccaagattca cctataaata gaatctgtaa tcaagtaaga attaaaagtt gtatctatca 5700
ttatctatct ctatatcgca cttttcttgt aaaacccttc ccgtataaca catacaaaga 5760
aaacgtaaat atcagagacc caggtatacc gtatatatta agccaagagc gccgtgtagt 5820
ggcgcttagt caatgtactt gggaagcgtc ttcaggatgc cgtcccgggc gatgtcctcc 5880
atcgctttgg tgatttcctg gaggaacctc ttgtcgccgc gcaagtcgtc accgaacagg 5940
ctcttgatgc tgaggagctc ggccgggctg gtgcctcctg cgcgagcctt ggcctggagc 6000
tcctcgcgca tcgggtcgtc gacctcgaac ttcttgccgc tgtcgtcgac gccgttaatg 6060
taatggaacc aggcagccgc aacgaaacac aggcggcgga atgggccagt aacccagatc 6120
gcctcagcaa tcgaaggcat gataaattgt gggatcttgc ccgaagcgtt gaggcagatg 6180
cggggcagtt ggtccatgat ggtggggttg gagaagcgct cgatgagcgt cttgcaatac 6240
tcatcaatgt tgacgcccgg gatctcgggc aacaacggct tcacctcgtc ctgcatcatt 6300
tgccacacaa acttgctgaa cagtgggttc tccatcacct cgtggacata tttgaagccg 6360
gccagctgcc ctgggtagcc gatggccgag tggctgccgt tgagcaggcg cagcttgtgc 6420
ttctcgaatt cctcgacgtc atggacattc ttgaccacct gggcaccaac cttctcgaat 6480
ggtgggcggc catcggagaa ctgatcctca attacccact gcataaaggg ctctgtgacg 6540
acgggccacg agtcctcgat ggcaaagttg tctgcgagtg ccgttttatc ggtggcggat 6600
gtctgagggg tgatacggtc gaccatggcg ttggggaagg cgccctgttc ggcaatccac 6660
ttcgcgatct cggggttgcg caggcgcgca aaggactcga gcatgtggcg agtgatggaa 6720
ccgttcttct gcatgttgtc acacgacatg acggtaaagg gcttgagccc ttgctggtag 6780
cggcgtgcca gagcggcata gaggaagccg aacgtggtgc gcggggactt ctcgttcgct 6840
ggttggaggt cgaactgaat gtcagggtgc tcactttgga gctcgtgtgt gttctcgttg 6900
tagtagtaac cgctctcggt gatagtgagc gacacaatgt gggtatccgg gtgcgccatc 6960
ttggcgatga cggcctcgcg gttatcgggg gcaaagagat aggaattgat gctcccaaca 7020
acatgggcaa agctgccctt ggccgaacgc tcaatgacgg tgtagaggtg gtcctgcgac 7080
cctaaggcgt cgcgcatggc ggcgtcaaag ggctgcaaac caacaccaca aatcgcgtag 7140
tcagtcacac catgcttctg catcaactgg tcgacataaa cggccaagtg agctctgtgg 7200
aagccgccga cgccgacgtg gacaattccc tccttcacgt cgccaccacg cttgtaggtt 7260
gggaccttga cttgggtctc acctgccgcc gcaatttgcg acaggttttt gttgttgagc 7320
ttcaggggag ccattgtgaa tgtgtgaaga gtgagagaga ggaattgaaa gaaagacaag 7380
ggcgagaagg cgagagagaa aagggggttt gttgtttttt ttctggctgg ggcgctgagt 7440
cgacgagggt caccgccagt ttttgaccgc tggttggaac agattacatc atgtggtggg 7500
gagctgatct cacgaggttc tcgaattttt ttagccactt gataaaaaaa aatcaaaagt 7560
acagtgcaat tagataagca ttcctttttt ctttttttat ttcttggttg ccgctctcgg 7620
tcgccgtatc acattttaaa ctcaacgtgc ttaaggtttt catgttcgaa gtcacctttt 7680
gtcaatggaa caaaaagaaa aactctgaga tccacccaca taaaacccta aaagaagtca 7740
gctgttgaaa atgaacaaag atatagatct ctggtattaa attcccatca tacctgaccc 7800
caattcaagc caaaattcgg gcaataaggg gaaaacaccg acggcaggct ggaatcatct 7860
tggttgcgat gatggcaaag tatcggggac actccacaac cccagtacct ccctggaccc 7920
acgaagaggc cggggcaacc cactgagcca tagaacatga tcgaagcctc ccccgaatcc 7980
tgtcattgtt gtcaatcacc gtgggaactc gtgtgtttgg acggaccaaa gtgggcagga 8040
gctgatcggg ccgagaccgt attggtagca aggagtgggt tcctggcaat gaacccacat 8100
gacctgggtc agagggacga gcacggttgg tattcccatg atgggggtgg ctcctgcgac 8160
cctcttccca tcgatcccaa taaattgccc agtatcatat cggtctcccc gagggcgact 8220
attgaagtat ccctgagcat agtctcgtgg ctagtaacta gtatagactg gctatacaca 8280
tcatcatcat cacaccggga tttccgacaa ggctcgcaag aggtggtctt tccatttgcg 8340
gcgtcgcgag tttctggtac ggtttcagca tcacaaagat atgagggggg ttgatgggat 8400
gctatatacg tatttgttag tgtaaaaatt tccgatcgga gattccaagt gaggtatgac 8460
tgctgattga tctcctagga ggtattaaga agggaagtta ttttgttcta ctatgagggg 8520
ttctgtacac aacccctctc accagatacc cacgtgaccg tcggccgagg tcttgtcagg 8580
tgcattcaat tgccacgtat tacatctgct acctccaccg cttatccact gcatattcct 8640
catgactcgc gtggatgtga catgtaaccc tgtgtgcatt tttacccgat acccttttct 8700
gcaaattatt gacacctatc gacgcccgca tcaaagtcgg cgaacaacct tatcggatgc 8760
aggggtggct tcgatagcga catgcatagg tgtcagtcgg aagtctctcg tgacctgaag 8820
cggtgtgcgt ttgttatcat tttgagcttg caagtcaatt ccatgctcca ataaggttac 8880
gccaaacatc tcgttgtcaa ccgtgacaca ctagtgcaaa atcatggact actcaatgcc 8940
cgatatcgcg taaccagctg cccatgacgg actcctatct ccaagaatct cctaaagatc 9000
gacagtattc atgctcactc gtacactttg tttcagccaa cgggtgacaa ctcggagcca 9060
tttctttgac gttgtcatcc aagattaagc ttgcatcgtc ggaaggaggc atgtgcgtca 9120
atgcctcttt ggcca 9135