基因扩增方法
技术区域
本发明涉及一种高速扩增基因的方法以及使用扩增后的基因来制造蛋白质的方法。
背景技术
在为了人为地引起基因扩增而使用动物培养细胞来进行时(专利文献1等),有以下几个问题:(i)耗时(半年~一年)、(ii)未扩增的克隆也较多、(iii)扩增机制不明而依赖于经验等。另一方面,没有利用酵母进行基因扩增的体系,通常都是使用质粒来达到这一目的,但拷贝数达到一定程度以后就难以再增加。
本发明的体系是基于由生物所具有的被称为BIR(断裂诱导性复制,Break-Induced-Replication)的能力诱导的、被称为DRCR(双滚环式复制,double rolling-circle replication)的复制反应(非专利文献1、2)。这种复制反应被认为是当染色体被切断时,被切断的染色体会寻找与自身相同的序列,利用其同源性而侵入其中以构建复制点并开始复制,从而进行自身救济。所有生物都被认为具有这种能力。
另外,有报道在自然的环状DNA中,通过重组来引起DRCR(非专利文献3)。
专利文献1:日本特表平8-504585(WO94/14968)
专利文献2:WO2005/061703
非专利文献1:PNAS,vol.98,no.15,8255-8262(July 17,2001)
非专利文献2:Genes Dev 12,3831-3842(1998)
非专利文献3:Cell.1986 Aug 15;46(4):541-50.
发明内容
本发明提供为了高速扩增基因而特别构建的双链DNA和使用了所述DNA的基因扩增方法以及蛋白质的合成方法。本发明的特征为:完全人为地构建扩增体系,能够同步地扩增,扩增时间短(大概1代),以及扩增机制清楚等。
本发明的扩增体系利用了被称为双滚环式复制(DRCR)的复制反应。认为这样可以在一个细胞周期内使其爆发性地扩增,通过重组等来终止反应,从而将扩增产物维持在细胞内。本发明人等为了有效地诱导这种DRCR而利用了Cre-lox体系等的位点特异性重组酶及其靶序列。即,本发明人等在酵母菌内构建了图3所示结构的复制单元,利用当复制叉在一对lox序列之间行进时由位点特异性重组酶Cre重组酶(以下称“Cre”)所引起的重组,成功地引起DRCR诱导,从而完成了本发明。
即,本发明为一种用a-b-c-d或a-c-b-d表示的双链DNA(式中,a和b中的一个表示包含位点特异性重组酶的第一靶序列的双链DNA片段,另一个表示与该第一靶序列反方向地排列而成的双链DNA片段,c和d中的一个表示包含位点特异性重组酶的第二靶序列的双链DNA片段,另一个表示与该第二靶序列反方向地排列而成的双链DNA片段,在a-d之间的任何一处插入复制起始点和至少一个扩增目标基因。也可以在它们之间插入任意的DNA序列)。
本发明还是一种含有该双链DNA的重组载体,进而,还是一种导入了该双链DNA的转化体(transformant)。
另外,本发明为一种包含用e-a-A-b-f表示的双链DNA和用g-c-B-d-h表示的双链DNA的一组双链DNA(式中,a和b中的一个表示包含位点特异性重组酶的第一靶序列的双链DNA片段,另一个表示该第一靶序列反方向地排列而成的双链DNA片段,c和d中的一个表示包含位点特异性重组酶的第二靶序列的双链DNA片段,另一个表示该第二靶序列反方向地排列而成的双链DNA片段,e~h分别表示在设想导入所述的一组双链DNA的细胞染色体或染色体外因子上按照e、f、所述细胞染色体或染色体外因子的复制起始点、g、h的顺序排列的、包含至少50bp的碱基序列的双链DNA片段,A和B中的至少一个表示扩增目标基因。其中,该复制起始点或其一部分也可以包含在f或g中,在它们之间也可以插入任意的DNA序列)。
本发明为一种分别含有所述两种双链DNA的一组重组载体,进而,为一种导入了所述两种双链DNA的转化体,其是上述复制起始点存在于其宿主染色体或染色体外因子上的转化体。
另外,本发明为一种扩增上述扩增目标基因的基因扩增法,其包括准备上述任一转化体的步骤以及使位点特异性重组酶作用于该转化体的步骤,进而,本发明为一种制造扩增目标基因所编码的蛋白质的方法,其包括将利用上述方法得到的转化细胞进行培养的步骤。
本发明的扩增体系由于确立了高性能蛋白质生产体系而具有优异的特征。由于DRCR可以在一个细胞周期内实现高速扩增,且扩增机制明确,因而可以期待目标基因的可靠扩增。并且,虽然目前生物种类不同,但Cre-lox扩增体系可以以目前使用的动物细胞体系的10~100倍以上的频率形成高度扩增产物。进而,本扩增体系也可以适用于原本即使选择药剂也不引起扩增的原代培养的普通细胞,可以在以普通细胞为靶的基因治疗中应用基因扩增而使导入基因的表达强化并持续化。
附图说明
图1为表示DRCR反应的图。黑色箭头表示复制叉。
图2为表示使用位点特异性重组酶及其靶序列的扩增起始反应的图。三角箭头(a~d)表示位点特异性重组酶的靶序列(例如loxP序列)及其方向,X表示复制起始点(以下相同)。x~z和x’~z’表示扩增目标基因,黑色箭头表示复制叉。
图3为表示用于扩增的结构的图。CEN:着丝粒,TEL:端粒。
图4为表示用于Cre表达的质粒(pSH47)的图。
图5为表示菌落形成率的图。Glc:葡萄糖,Gal:半乳糖。
图6为表示Southern印迹分析的图。(a)表示使用leu2d探针、用PFGE分离的染色体DNA,(b)表示用SmaI消化后用FIGE分离的染色体DNA。#19~58表示由用半乳糖诱导Cre表达后、涂布在不含亮氨酸的筛选培养基上而出现的菌落制备得到的DNA,NS表示由在非筛选培养基上培养的对照菌落制备得到的DNA,P表示宿主细胞株。认为在本实验的PFGE条件下,约650kb以上的染色体集中存在于分离限。
图7为表示染色体上的扩增产物的图。(a)表示通过DRCR最初形成的结构。a~f表示限制性酶SmaI的剪切位点,数字表示其片段长度(kb)。但是,由于由d-e剪切产生的5.3kb的片段不含leu2d,因而用Southern印迹法检测不到。(b)表示在lox间的序列伴有反转(在反方向上重新排列)时的构造。a’~f’表示由于反转而变化的剪切部位,其数字表示可生成的片段长度(kb)。例如,通过a-b剪切而生成10.9kb的片段,但含有a的区域发生反转时,由a’-b剪切而生成16.8kb的片段。同样地,由a-b’剪切生成5.3kb的片段,由a’-b’剪切生成11.1kb的片段。但是,不含leu2d的5.3kb的片段用Southern印迹法检测不到。
图8为表示迷你染色体(图6(ii))上的扩增产物的图。由端粒侧开始的复制通过loxP间的重组而反方向进行,从而形成两端具有端粒的迷你染色体(约18kb)。由于SamI剪切位点g~i、以及可通过反转而改变的剪切位点h’,含有leu2d的片段长度变为6.3kb(来源于g-h’或h-i的片段。即使因反转而位置改变,h或h’的任一个也可以被剪切,因此不会有g-i片段。)。
图9为表示迷你染色体(图6(ii))上的扩增产物的图。由端粒侧开始的复制通过loxm2间的重组而反方向进行,从而形成迷你染色体(约40kb)。j~n表示SamI剪切部位,k’~m’表示可通过反转而改变的剪切部位,数字表示可生成的片段长度(kb)。但是,不含leu2d的5.3kb的片段用Southern印迹法检测不到。
图10为表示Cre重组对未扩增结构的影响的图。各个lox间的序列高频率地发生反转。o~r表示SamI剪切位点,p’和q’表示可通过反转而变化的剪切位点,数字表示可生成的片段长度(kb)。但是,不含leu2d的5.3kb的片段用Southern印迹法检测不到。
具体实施方式
对于本发明的基因扩增法,作为扩增机制,利用的是被认为对出芽酵母和动物细胞两者都能发挥作用的、可以高速扩增的双滚环式复制(DRCR)。如图1所示,该扩增体系是两个复制叉连续地复制环状DNA的反应。首先,复制叉(1)复制w,复制叉(2)复制y((a)、(b)、(c)),接着,复制叉(1)复制x,复制叉(2)复制z((c)、(d)、(e))。这样,用于一个复制叉的模板由另一个复制叉依次合成,因此复制持续地继续下去。扩增进行后,认为可以通过重组反应等来除去中央的环状构造,从而反应结束(f)。
在本发明的扩增体系中,为了诱导DRCR,设计了利用已知在动物细胞中也能有效发挥作用的位点特异性重组反应的体系。其是将在复制叉通过一组靶序列时发生重组的反应和发生复制叉反方向进行的反应两者组合来利用。
即,在本发明的扩增体系中,在图2(a)所示构成的扩增单元中开始复制之后,在黑色箭头表示的复制叉通过两组位点特异性重组酶的靶序列(lox序列)之间时,在位于亲本DNA链x和新生DNA链y的靶序列(例如loxP序列)间、以及位于亲本DNA链x’和新生DNA链y’的靶序列(例如loxP序列)间引起利用位点特异性重组酶(例如Cre)进行的重组(b)。通过重组x和y链替换,x’和y’链也替换,则一个复制叉由x链合成y、z链,另一个复制叉由x’链合成y’、z’链(c)。由此,叉反方向进行,将已经复制过的DNA链再次复制(d)。通过这两个反应来诱导DRCR。
本发明中使用的双链DNA可以用a-b-c-d或a-c-b-d表示,优选用a-b-c-d表示。
a和b中的一个表示包含位点特异性重组酶的第一靶序列的双链DNA片段,另一个表示该第一靶序列反方向地排列而成的双链DNA片段。
c和d中的一个表示包含位点特异性重组酶的第二靶序列的双链DNA片段,另一个表示该第二靶序列反方向地排列而成的双链DNA片段。
第一靶序列和第二靶序列可以相同,但优选不同。
并且,也可以在它们之间插入任意的DNA序列。
也可以所述b兼作c,用a-b-d(这种情况下,d表示与a方向相同的同一靶序列)表示。
并且,该序列也可以用a-b-X-c-d或a-c-X-b-d表示,优选用a-b-X-c-d表示。
此处,X表示复制起始点。对于复制起始点,存在于二氢叶酸还原酶(DHFR)基因的3’下游区域的Ori beta、EBV的latent origin(OriP)、c-myc基因附近的origin等可以作为候补,但只要在动物细胞内具有复制起始活性就可以是任意位置。
进而,该序列也可以用a-A-b-X-c-B-d或a-A-c-X-b-B-d表示,优选用a-A-b-X-c-B-d表示。
此处,A和B中的至少一个表示扩增目标基因。使用多个扩增基因的情况下,它们可以相同或不同。
对于这些,上述(图2)说明的DRCR也可以同样被诱导。
位点特异性重组酶对两个短的共有(consensus)DNA序列(靶序列)之间的重组进行催化。该位点特异性重组酶在靶序列之间引起位点特异性重组,可以进一步改变这些靶位点或对插入的基因加以变化。
本发明中,可以使用以下的位点特异性重组酶以及对该酶特异性的靶序列(例如参照Developmental Cell,Vol.6,7-28,January,2004等)。
(1)Cre重组酶或其衍生物
细菌病毒P1的Cre重组酶被最广泛地用于小鼠的基因导入或基因破坏。Cre蛋白对两个长度为34个碱基的loxP识别位点之间的重组进行催化。所述loxP的序列采取了用两个13个碱基的回文序列夹住成为8个碱基的核的序列而形成的独特的构造。这8个碱基的非对称序列对loxP位点赋予方向性。利用Cre酶进行的loxP位点之间的DNA链的剪切和重组发生在核序列的8个碱基中的第一个碱基之后和最后一个碱基之前。
对该Cre酶利用氨基酸取代而制备衍生物。所谓衍生物是指,在野生型Cre重组酶中导入氨基酸取代而使功能、性质发生了改变的位点特异性重组酶,以及在野生型Cre重组酶基因的碱基序列中导入突变而使与CpG含量、翻译起始效率相关的Kozak序列、密码子使用(codon-usage)在宿主细胞中最优化、从而提高了表达效率和表达量的位点特异性重组酶及其基因。至今为止,对Cre酶已经制备了至少29种衍生物。这些衍生物有的活性不同,有的可以识别不同的靶序列。并且,对Cre酶识别的靶序列lox也同样制备了很多突变序列。本发明中,这些全部可以使用。
作为这样的靶序列,可以列举出loxP、lox511、lox5171、lox2272、lox2372、loxm2(也称m2)、loxFAS、lox71、lox66以及它们的突变体。所谓突变体是指,在野生型的loxP序列等的一处以上的碱基中导入了突变的位点特异性重组反应的靶序列。
一般来说,无论Lox序列如何改变,重组效率也都非常敏感,但发现了保持功能的突变。在这种情况下,相同序列彼此的loxP之间可以在细胞内有效地发生重组,但在不同序列彼此之间,重组效率显著降低。
(2)Flp重组酶或其衍生物
该重组酶是取自出芽酵母的Flp重组酶。该酶的活性与Cre/loxP相同或差一些。但是,最近开发出的活性型Flp(Flpe)使这种酶的效率得到改良,与Cre的效率相同。34个碱基的共有性重组序列被称为FRT。FRT与loxP具有相同的构造,但序列不同。
所谓衍生物是指,在野生型Flp重组酶中导入氨基酸取代而使功能、形质发生了改变的位点特异性重组酶,以及在野生型Flp重组酶基因的碱基序列中导入突变而使与CpG含量、翻译起始效率相关的Kozak序列、密码子使用在宿主细胞中最优化、从而提高了表达效率和表达量的位点特异性重组酶及其基因。至今为止,对Flp酶已经制备了至少28种衍生物。
对该Flp酶及其识别序列也制备了很多衍生物。作为靶序列,可以列举出FRT、F3、F5、FRT突变体-10、FRT突变体+10以及它们的突变体。所谓突变体是指,在野生型的FRT序列等的一处以上的碱基中导入了突变的位点特异性重组反应的靶序列。
与Cre相同,Flp酶对FRT位点的序列变化非常敏感。但是,若几个突变FRT位点是相同的序列对,就能有效地鉴定发生重组的序列对。但是,不同的突变FRT位点之间或野生型位点和突变位点之间几乎不发生重组。
(3)PhiC31整合酶或其衍生物
PhiC31整合酶来源于链霉菌的细菌病毒,并在人的细胞内发挥作用。
作为该靶序列,可以列举出attP、attB及它们的突变体。所谓突变体是指,在野生型的attP序列等的一处以上的碱基中导入了突变的位点特异性重组反应的靶序列。
该体系是在attPP’和attBB’之间的ttg三个碱基引起重组的酶。由于该ttg的重组序列的两侧是独特的序列,因此在重组之后形成了与最初的识别序列不同的序列。由此,该酶的识别序列已经没有了。因此,该酶的重组只能进行一次。
所谓PhiC31整合酶体系的衍生物是指,在野生型PhiC31整合酶中导入氨基酸取代而使功能、性质发生了改变的位点特异性重组酶,以及在野生型PhiC31整合酶基因的碱基序列中导入突变而使与CpG含量、翻译起始效率相关的Kozak序列、密码子使用在宿主细胞中最优化、从而提高了表达效率和表达量的位点特异性重组酶及其基因。
在这些位点特异性重组酶及其靶序列中,优选Cre/Lox体系。
另外,也可以在这些构造内的任意位置插入想要使其表达的目标基因、用于筛选染色体或染色体外因子上插入了主构造的细胞的基因(针对遗传霉素、新霉素、潮霉素、Zeocin、杀稻瘟菌素等的耐药性基因等)、用于筛选发生了基因扩增的细胞的标记基因(二氢叶酸还原酶(DHFR)、谷氨酰胺合成酶(GS)、天冬氨酸转氨甲酰酶(CAD)、金属硫蛋白(MT)、腺苷脱氨酶(ADA)、腺苷酸脱氨酶(AMPD1,2)、UMP合成酶、P-糖蛋白(P-gp)、天冬酰胺合成酶(AS)、鸟氨酸脱羧酶(ODC)等)。优选也能插入被认为对于动物细胞的扩增很重要的核基质附着区域(nuclear matrix attachmentregion,MAR)。
另外,在这些各片段之间也可以插入任意的DNA序列。
适当依照常用的基因工程学的方法来结合这些片段。
用病毒、脂质体法、电穿孔法等方法将这样得到的双链DNA片段导入适宜的细胞内。进而,优选用与用于筛选染色体或染色体外因子上插入了主构造的细胞的基因(针对遗传霉素、新霉素、潮霉素、Zeocin、杀稻瘟菌素等的耐药性基因等)相对应的药物来进行筛选以建立细胞株。作为其宿主,可以列举出酵母细胞或动物细胞等,但在生产作为药品的蛋白质时,优选动物细胞,这是出于可以对蛋白质附加与人型类似的糖链、且诱发不需要的免疫反应的危险性较低的理由。作为动物细胞,可以使用以蛋白质生产中常用的CHO(中国仓鼠卵巢)细胞为代表的人、小鼠、大鼠和其他动物来源的所有细胞。
并且,本发明的双链DNA也可以是将上述的任何一个双链DNA分割为至少2个、优选2~5个、更优选2个而成的一组双链DNA片段,该片段在其两端分别具有包含宿主的染色体或染色体外因子的部分序列、且具有至少50bp、优选500~1Kbp的碱基序列的同源性重组用双链DNA片段。所述的同源性重组用双链DNA片段可以通过其同源性重组而在宿主的染色体或染色体外因子上形成上述双链DNA。
该复制起始点可以是该宿主的染色体或染色体外因子的复制起始点,也可以是外来的复制起始点。
另外,所谓染色体外因子是指可以在宿主细胞内复制的质粒、病毒来源的序列、宿主染色体部分片段以及人工染色体。
作为这样的一组双链DNA片段,例如可以列举出以下例子。
(1)用e-a-A-b-f表示的双链DNA,以及用g-c-B-d-h表示的双链DNA
(2)用e-a-A-f表示的双链DNA,以及用g-b-c-B-d-h表示的双链DNA
(3)用e-a-f表示的双链DNA,以及用g-A-b-c-B-d-h表示的双链DNA
(4)用e-a-A-b-c-f表示的双链DNA,以及用g-B-d-h表示的双链DNA
(5)用e-a-A-b-c-B-f表示的双链DNA,以及用g-d-h表示的双链DNA
(6)用e-a-A-b-B-f表示的双链DNA,以及用g-d-h表示的双链DNA
(7)用e-a-A-f表示的双链DNA,以及用g-B-d-h表示的双链DNA
(8)用e-a-f表示的双链DNA,以及用g-A-b-B-d-h表示的双链DNA等。
其中,a~d、A、B与上述相同。但是,(6)~(9)中的d表示与a方向相同的同一靶序列。
e~h分别表示在细胞染色体或染色体外因子上按照e、f、复制起始点、g、h的顺序(中间也可以插入任意的序列。另外,复制起始点或其一部分也可以包含在f或g中。)排列的、包含至少50bp、优选500~1Kbp的碱基序列的双链DNA片段。
这些片段按照上述相同方法结合。
将如此得到的至少2个双链DNA片段用病毒、脂质体法、电穿孔法等方法导入适宜的细胞内。进而,优选用与用于筛选染色体或染色体外因子上插入了主构造的细胞的基因(针对遗传霉素、新霉素、潮霉素、Zeocin、杀稻瘟菌素等的耐药性基因等)相对应的药物来进行筛选以建立细胞株。作为其宿主,可以列举出酵母细胞或动物细胞等,但在生产作为药品的蛋白质时,优选动物细胞,这是出于可以对蛋白质附加与人型类似的糖链、且诱发不需要的免疫反应的危险性较低的理由。
通过e~h按照该顺序排列,它们与宿主染色体或染色体外因子的相当的部分进行同源性重组,从而与上述相同的结构被配置在宿主的染色体或染色体外因子上。
使位点特异性重组酶作用于如上所述得到的转化细胞。此时,由于优选细胞周期处于复制期(S期)的细胞的比例较多,因此优选使位点特异性重组酶作用于处于旺盛增殖、细胞周期正在进行中的状态的细胞,或者作用于进入S期时与细胞周期同步的细胞。
作为使上述位点特异性重组酶作用的方法,例如可以列举出以下方法。
(1)将以使位点特异性重组酶表达的方式而构建的质粒导入
在宿主细胞内发挥作用的启动子序列的下游,在各种表达载体中插入连接了编码位点特异性重组酶的基因的结构。将其通过脂质体法、电穿孔法等方法导入至上述的转化细胞中。此处,为了能在复制活跃进行的状态下使位点特异性重组酶发挥作用,优选使用能够诱导表达的启动子。
(2)将上述转化体进一步进行转化以使位点特异性酶表达。
在宿主细胞内发挥作用的启动子序列的下游,构建含有连接连编码位点特异性重组酶的基因的片段、用于筛选在染色体或染色体外因子上插入了主构造的细胞的基因(针对遗传霉素、新霉素、潮霉素、Zeocin、杀稻瘟菌素等的耐药性基因等的任一种)的结构,将其通过脂质体法、电穿孔法等方法导入至上述的转化细胞中。此时,为了提高在染色体或染色体外因子中的插入效率,导入的结构优选为线状。另外,此处,为了能在复制活跃进行的状态下使位点特异性重组酶发挥作用,优选使用能够诱导表达的启动子。
(3)直接导入位点特异性重组酶的蛋白质
准备使位点特异性重组酶大量表达并精制而得到的产物,将其用市售的蛋白质导入试剂(例如Targeting system公司、Profect、Genlantis公司、BioPORTER Protein Delivery Regient)等导入上述的转化细胞中。此处,为了能在复制活跃进行的状态下使位点特异性重组酶发挥作用,优选将位点特异性重组酶导入处于旺盛增殖、细胞周期正在进行中的细胞,或者导入进入S期时与细胞周期同步的细胞。
使位点特异性重组酶发挥作用的时期需要处于复制开始后一个复制叉在两个第一靶序列之间、且另一个复制叉在两个第一靶序列之间(图2(b))。但是,不需要在准备的细胞全部处于这个严密的时期下才使位点特异性重组酶起作用。这是由于,实际上在大部分细胞中,复制进行的时间各不相同,只要其中的一部分细胞处于这样的状态即可。虽然偶尔只有复制叉满足上述条件的细胞才爆发性地进行基因复制,但即使准备的细胞中的一部分是这样,为了扩增也是足够的。
如上所述诱导扩增,优选使用与扩增标记基因(二氢叶酸还原酶(DHFR)、谷氨酰胺合成酶(GS)、天冬氨酸转氨甲酰酶(CAD)、金属硫蛋白(MT)、腺苷脱氨酶(ADA)、腺苷酸脱氨酶(AMPD1,2)、UMP合成酶、P-糖蛋白(P-gp)、天冬酰胺合成酶(AS)、鸟氨酸脱羧酶(ODC)等)相对应的药物来进行筛选。这样可以筛选目标基因的表达量高的细胞株,通过培养该细胞、并由其培养基或其上清液、或者将它们进行精制来大量制造扩增目标基因所编码的蛋白质。
以下,用实施例举例证明本发明,但并不用于限制本发明。
实施例1
在本实施例中构建用于扩增的结构(图3)。
首先,构建含有相互反方向的一对loxP序列、扩增筛选标记基因leu2d以及TRP1基因的DNA片段结构1(端粒侧的构造)(序列号1,其1-34为loxP序列,36-1988为扩增标记基因leu2d,1993-2845(互补链)为TRP1基因,5699-5732为反方向的loxP序列。)。
制备在该DNA片段结构1的上游侧连接第VI染色体(GenebankAccession No.NC 001138)的碱基序列263177-264016(序列号3)的PCR片段、在下游侧同样连接264017-264685(序列号4)的PCR片段而成的片段,通过该片段,使用Frozen-EZ酵母转化II(Yeast Transformation II,ZYMORESEARCH公司)进行宿主酵母细胞株的转化。通过TRP1标记基因的作用,筛选能够在不含色氨酸的琼脂培养基上形成菌落的细胞,分析其染色体结构,确立插入了被loxP对夹住的结构的细胞株。
接着,构建含有相互反方向的一对loxm2序列、扩增筛选标记基因leu2d以及LYS5基因的DNA片段结构2(着丝粒侧的构造)(序列号2,其1-34为loxm2序列,3936-5888(互补链)为扩增标记基因leu2d,2891-3930为LYS5基因,5890-5923为反方向的loxm2序列。)。
制备在该DNA片段结构2的上游侧连接有碱基序列257941-258821(序列号5)的PCR片段、在下游侧连接有258822-259719(序列号6)的PCR片段而成的片段,通过该片段,与具有上述DNA片段结构1(用loxP对夹住的构造)的细胞同样地进行转化。通过LYS5标记基因的作用,筛选能够在不含赖氨酸的琼脂培养基上形成菌落的细胞,分析其染色体结构,建立插入了被loxP对夹住的结构和被loxm2对夹住的结构的细胞株。
另外,扩增筛选标记基因leu2d由于缺少启动子序列的大部分,因而表达量非常低,它只在扩增为多拷贝时才能够与亮氨酸需求性相互补。
在位于以上两个构造之间的区域(碱基序列258822-264016)中曾观察到与复制起始相关的蛋白质Orc1发生结合(Nature,424:1078,2003),认为其作为复制起始点发挥作用。另外,在该区域中含有出芽酵母酿酒酵母菌(Saccharomyces cerevisiae)内的复制起始点的共有序列WTTTAYRTTTWB(序列号7)(碱基序列258889-258900)。
实施例2
在本实施例中,将实施例1中得到的结构(图3)插入出芽酵母第VI染色体中,使Cre基因表达,从而诱导双滚环式复制(DRCR)。使用Frozen-EZ酵母转化II(Yeast Transformation II,ZYMORESEARCH公司),将Cre基因(序列号8)连接到GAL启动子下游而形成的质粒(图4,pSH47,Genebank Accession No.AF298782,由华盛顿大学Yeast Resource Center提供)导入实施例1中得到的出芽酵母细胞株中。然后,通过URA3标记基因的作用,筛选能够在不含尿嘧啶的琼脂培养基上形成菌落的细胞。
在如上所述得到的导入了质粒的Ura+细胞的液体培养基中添加诱导Cre表达的半乳糖或作为对照的抑制Cre表达的葡萄糖,培养3小时。将这些细胞涂布在不含亮氨酸的葡萄糖琼脂培养基上,计数出现的Leu+菌落。继续培养得到的Leu+菌落的细胞,在低熔点琼脂糖内制备染色体DNA。
通过脉冲电场凝胶电泳(PFGE、BIO-RAD公司,CHEF Mapper XA,Auto Algorithm,范围:220-500kb)分离该染色体DNA,或者通过电场转换凝胶电泳(FIGE、BIO-RAD公司,CHEF Mapper XA,Auto Algorithm,范围:3-50kb)分离被限制性酶SmaI消化了的DNA,并通过Southern印迹法进行分析。
结果及其解释
计数出现的Leu+菌落,结果可见,与对照实验(添加葡萄糖)比较,诱导了Cre表达时,如图5所示,菌落形成率大幅度上升至约7倍。这强烈表明利用Cre的重组有助于扩增。
接着,使用leu2d探针、通过Southern印迹法对由PFGE分离的染色体DNA进行结构解析,结果如图6(a)所示。
由图6(a)可知,插入了用于扩增的结构的第VI染色体增长而成的扩增产物(i)和多拷贝化而成的迷你染色体(ii)被检测到。进而,在345kb中发现了含有leu2片段的宿主细胞株的第III染色体(*)、在290~320kb中发现了具有用于扩增的结构的第VI染色体(NS)微量扩增而成的染色体。
接着,用限制性酶(SmaI)消化上述染色体DNA,用FIGE分离SmaI片段,将得到的染色体DNA片段用leu2d探针、通过Southern印迹法进行结构解析,结果如图6(b)所示。
由这些结果可以明确扩增产物的结构。
从染色体上的扩增产物(i)中显示了大分子尺寸的强信号的菌落(图6(a)(i)#32、48、52、53:黑道)检测到了约11Kb(10.9、11.1Kb)和17Kb(16.8Kb)的SmaI片段。如图7所示,这些是来源于计划的DRCR扩增中伴随了lox序列间的反转(在反方向上重新排列)的结构的片段,认为其具有含有至少数十拷贝以上的leu2d的高度重复序列。
另一方面,在超过半数的菌落(灰道)中发现的迷你染色体(图6(ii))形成了约6.3kb的SmaI扩增片段。如图8所示,认为这是通过由用于扩增的结构引起的自端粒侧开始的复制和利用Cre-loxP重组引起的副反应而形成的片段,在多拷贝中存在。
除此之外,还发现了不伴有反转的染色体上的扩增产物(图7(a),#34、41、47)以及通过与上述类似的副反应生成的其它迷你染色体(图9,#29-31,49,56),并且还有很多菌落都同时具有染色体上的扩增产物和迷你染色体(#22,31,34,41,47,58)。另外,由未扩增的构造可以确认,除了来源于宿主细胞株的两个SmaI片段(图6(b)的*)以外,有4个片段显示了较弱的信号(图6(b)的NS,图10)。
如上所述,观察到了被认为与设想的分子机制相关的高度扩增反应(#32,48,52,53)。由于在10%的分析菌落中可见该高度扩增反应,因此该反应以整体的菌落形成率4.4%的1/10、即0.44%的高频率发生。
序列表
<110>大学共同利用机关法人自然科学研究机构
<120>基因扩增方法
<130>FS06-459PCT
<160>8
<170>PatentIn version 3.3
<210>1
<211>5732
<212>DNA
<213>artificial sequence
<220>
<223>replication unit
<400>1
ataacttcgt ataatgtatg ctatacgaag ttatggatct agaggttaac taagcgaatt 60
tcttatgatt tatgattttt attattaaat aagttataaa aaaaataagt gtatacaaat 120
tttaaagtga ctcttaggtt ttaaaacgaa aattcttatt cttgagtaac tctttcctgt 180
aggtcaggtt gctttctcag gtatagcatg aggtcgctct tattgaccac atctctaccg 240
gcatgccgag caaatgcctg caaatcgctc cccatttcac ccaattgtag atatgctaac 300
tccagcaatg agttgatgaa tctcggtgtg tattttatgt cctcagagga caacacctgt 360
tgtaatcgtt cttccacacg gatcttatat atatttcaag gatataccat tctaatgtct 420
gcccctaaga agatcgtcgt tttgccaggt gaccacgttg gtcaagaaat cacagccgaa 480
gccattaagg ttcttaaagc tatttctgat gttcgttcca atgtcaagtt cgatttcgaa 540
aatcatttaa ttggtggtgc tgctatcgat gctacaggtg tcccacttcc agatgaggcg 600
ctggaagcct ccaagaaggt tgatgccgtt ttgttaggtg ctgtgggtgg tcctaaatgg 660
ggtaccggta gtgttagacc tgaacaaggt ttactaaaaa tccgtaaaga acttcaattg 720
tacgccaact taagaccatg taactttgca tccgactctc ttttagactt atctccaatc 780
aagccacaat ttgctaaagg tactgacttc gttgttgtca gagaattagt gggaggtatt 840
tactttggta agagaaagga agacgatggt gatggtgtcg cttgggatag tgaacaatac 900
accgttccag aagtgcaaag aatcacaaga atggccgctt tcatggccct acaacatgag 960
ccaccattgc ctatttggtc cttggataaa gctaatgttt tggcctcttc aagattatgg 1020
agaaaaactg tggaggaaac catcaagaac gaattcccta cattgaaggt tcaacatcaa 1080
ttgattgatt ctgccgccat gatcctagtt aagaacccaa cccacctaaa tggtattata 1140
atcaccagca acatgtttgg tgatatcatc tccgatgaag cctccgttat cccaggttcc 1200
ttgggtttgt tgccatctgc gtccttggcc tctttgccag acaagaacac cgcatttggt 1260
ttgtacgaac catgccacgg ttctgctcca gatttgccaa agaataaggt caaccctatc 1320
gccactatct tgtctgctgc aatgatgttg aaattgtcat tgaacttgcc tgaagaaggt 1380
aaggccattg aagatgcagt taaaaaggtt ttggatgcag gtatcagaac tggtgattta 1440
ggtggttcca acagtaccac ggaagtcggt gatgctgtcg ccgaagaagt taagaaaatc 1500
cttgcttaaa aagattctct ttttttatga tatttgtaca taaactttat aaatgaaatt 1560
cataatagaa acgacacgaa attacaaaat ggaatatgtt catagggtag acgaaactat 1620
atacgcaatc tacatacatt tatcaagaag gagaaaaagg aggatgtaaa ggaatacagg 1680
taagcaaatt gatactaatg gctcaacgtg ataaggaaaa agaattgcac tttaacatta 1740
atattgacaa ggaggagggc accacacaaa aagttaggtg taacagaaaa tcatgaaact 1800
atgattccta atttatatat tggaggattt tctctaaaaa aaaaaaaata caacaaataa 1860
aaaacactca atgacctgac catttgatgg agtttaagtc aataccttct tgaaccattt 1920
cccataatgg tgaaagttcc ctcaagaatt ttactctgtc agaaacggcc ttaacgacgt 1980
agtcgacgga tcgatctttt atgcttgctt ttcaaaaggc ctgcaggcaa gtgcacaaac 2040
aatacttaaa taaatactac tcagtaataa cctatttctt agcatttttg acgaaatttg 2100
ctattttgtt agagtctttt acaccatttg tctccacacc tccgcttaca tcaacaccaa 2160
taacgccatt taatctaagc gcatcaccaa cattttctgg cgtcagtcca ccagctaaca 2220
taaaatgtaa gctttcgggg ctctcttgcc ttccaaccca gtcagaaatc gagttccaat 2280
ccaaaagttc acctgtccca cctgcttctg aatcaaacaa gggaataaac gaatgaggtt 2340
tctgtgaagc tgcactgagt agtatgttgc agtcttttgg aaatacgagt cttttaataa 2400
ctggcaaacc gaggaactct tggtattctt gccacgactc atctccatgc agttggacga 2460
tatcaatgcc gtaatcattg accagagcca aaacatcctc cttaggttga ttacgaaaca 2520
cgccaaccaa gtatttcgga gtgcctgaac tatttttata tgcttttaca agacttgaaa 2580
ttttccttgc aataaccggg tcaattgttc tctttctatt gggcacacat ataataccca 2640
gcaagtcagc atcggaatct agagcacatt ctgcggcctc tgtgctctgc aagccgcaaa 2700
ctttcaccaa tggaccagaa ctacctgtga aattaataac agacatactc caagctgcct 2760
ttgtgtgctt aatcacgtat actcacgtgc tcaatagtca ccaatgccct ccctcttggc 2820
cctctccttt tcttttttcg accgatccgt cgaccgatgc ccttgagagc cttcaaccca 2880
gtcagctcct tccggtgggc gcggggcatg actatcgtcg ccgcacttat gactgtcttc 2940
tttatcatgc aactcgtagg acaggtgccg gcagcgctct tccgcttcct cgctcactga 3000
ctcgctgcgc tcggtcgttc ggctgcggcg agcggtatca gctcactcaa aggcggtaat 3060
acggttatcc acagaatcag gggataacgc aggaaagaac atgtgagcaa aaggccagca 3120
aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc tccgcccccc 3180
tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata 3240
aagataccag gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc 3300
gcttaccgga tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcatagctc 3360
acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga 3420
accccccgtt cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc 3480
ggtaagacac gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag 3540
gtatgtaggc ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag 3600
aacagtattt ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag 3660
ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca 3720
gattacgcgc agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga 3780
cgctcagtgg aacgaaaact cacgttaagg gattttggtc atgagattat caaaaaggat 3840
cttcacctag atccttttaa attaaaaatg aagttttaaa tcaatctaaa gtatatatga 3900
gtaaacttgg tctgacagtt accaatgctt aatcagtgag gcacctatct cagcgatctg 3960
tctatttcgt tcatccatag ttgcctgact ccccgtcgtg tagataacta cgatacggga 4020
gggcttacca tctggcccca gtgctgcaat gataccgcga gacccacgct caccggctcc 4080
agatttatca gcaataaacc agccagccgg aagggccgag cgcagaagtg gtcctgcaac 4140
tttatccgcc tccatccagt ctattaattg ttgccgggaa gctagagtaa gtagttcgcc 4200
agttaatagt ttgcgcaacg ttgttgccat tgctacaggc atcgtggtgt cacgctcgtc 4260
gtttggtatg gcttcattca gctccggttc ccaacgatca aggcgagtta catgatcccc 4320
catgttgtgc aaaaaagcgg ttagctcctt cggtcctccg atcgttgtca gaagtaagtt 4380
ggccgcagtg ttatcactca tggttatggc agcactgcat aattctctta ctgtcatgcc 4440
atccgtaaga tgcttttctg tgactggtga gtactcaacc aagtcattct gagaatagtg 4500
tatgcggcga ccgagttgct cttgcccggc gtcaatacgg gataataccg cgccacatag 4560
cagaacttta aaagtgctca tcattggaaa acgttcttcg gggcgaaaac tctcaaggat 4620
cttaccgctg ttgagatcca gttcgatgta acccactcgt gcacccaact gatcttcagc 4680
atcttttact ttcaccagcg tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa 4740
aaagggaata agggcgacac ggaaatgttg aatactcata ctcttccttt ttcaatatta 4800
ttgaagcatt tatcagggtt attgtctcat gagcggatac atatttgaat gtatttagaa 4860
aaataaacaa ataggggttc cgcgcacatt tccccgaaaa gtgccacctg acgcgccctg 4920
tagcggcgca ttaagcgcgg cgggtgtggt ggttacgcgc agcgtgaccg ctacacttgc 4980
cagcgcccta gcgcccgctc ctttcgcttt cttcccttcc tttctcgcca cgttcgccgg 5040
ctttccccgt caagctctaa atcgggggct ccctttaggg ttccgattta gtgctttacg 5100
gcacctcgac cccaaaaaac ttgattaggg tgatggttca cgtagtgggc catcgccctg 5160
atagacggtt tttcgccctt tgacgttgga gtccacgttc tttaatagtg gactcttgtt 5220
ccaaactgga acaacactca accctatctc ggtctattct tttgatttat aagggatttt 5280
gccgatttcg gcctattggt taaaaaatga gctgatttaa caaaaattta acgcgaattt 5340
taacaaaata ttaacgctta caatttgcca ttcgccattc aggctgcgca actgttggga 5400
agggcgatcg gtgcgggcct cttcgctatt acgccagccc aagctaccat gataagtaag 5460
taatattaag gtacgggagg tacttggagc ggccgcaata aaatatcttt attttcatta 5520
catctgtgtg ttggtttttt gtgtgaatcg atagtactaa catacgctct ccatcaaaac 5580
aaaacgaaac aaaacaaact agcaaaatag gctgtcccca gtgcaagtgc aggtgccaga 5640
acatttctct atcgataggt accgagctct tacgcgtgct agcccgggct cgagatctat 5700
aacttcgtat agcatacatt atacgaagtt at 5732
<210>2
<211>5923
<212>DNA
<213>artificial sequence
<220>
<223>replication unit
<400>2
ataacttcgt ataagaaacc atatacgaag ttatagatct cgagcccggg ctagcacgcg 60
taagagctcg gtacctatcg atagagaaat gttctggcac ctgcacttgc actggggaca 120
gcctattttg ctagtttgtt ttgtttcgtt ttgttttgat ggagagcgta tgttagtact 180
atcgattcac acaaaaaacc aacacacaga tgtaatgaaa ataaagatat tttattgcgg 240
ccgctccaag tacctcccgt accttaatat tacttactta tcatggtagc ttgggctggc 300
gtaatagcga agaggcccgc accgatcgcc cttcccaaca gttgcgcagc ctgaatggcg 360
aatggcaaat tgtaagcgtt aatattttgt taaaattcgc gttaaatttt tgttaaatca 420
gctcattttt taaccaatag gccgaaatcg gcaaaatccc ttataaatca aaagaataga 480
ccgagatagg gttgagtgtt gttccagttt ggaacaagag tccactatta aagaacgtgg 540
actccaacgt caaagggcga aaaaccgtct atcagggcga tggcccacta cgtgaaccat 600
caccctaatc aagttttttg gggtcgaggt gccgtaaagc actaaatcgg aaccctaaag 660
ggagcccccg atttagagct tgacggggaa agccggcgaa cgtggcgaga aaggaaggga 720
agaaagcgaa aggagcgggc gctagggcgc tggcaagtgt agcggtcacg ctgcgcgtaa 780
ccaccacacc cgccgcgctt aatgcgccgc tacagggcgc gtcaggtggc acttttcggg 840
gaaatgtgcg cggaacccct atttgtttat ttttctaaat acattcaaat atgtatccgc 900
tcatgagaca ataaccctga taaatgcttc aataatattg aaaaaggaag agtatgagta 960
ttcaacattt ccgtgtcgcc cttattccct tttttgcggc attttgcctt cctgtttttg 1020
ctcacccaga aacgctggtg aaagtaaaag atgctgaaga tcagttgggt gcacgagtgg 1080
gttacatcga actggatctc aacagcggta agatccttga gagttttcgc cccgaagaac 1140
gttttccaat gatgagcact tttaaagttc tgctatgtgg cgcggtatta tcccgtattg 1200
acgccgggca agagcaactc ggtcgccgca tacactattc tcagaatgac ttggttgagt 1260
actcaccagt cacagaaaag catcttacgg atggcatgac agtaagagaa ttatgcagtg 1320
ctgccataac catgagtgat aacactgcgg ccaacttact tctgacaacg atcggaggac 1380
cgaaggagct aaccgctttt ttgcacaaca tgggggatca tgtaactcgc cttgatcgtt 1440
gggaaccgga gctgaatgaa gccataccaa acgacgagcg tgacaccacg atgcctgtag 1500
caatggcaac aacgttgcgc aaactattaa ctggcgaact acttactcta gcttcccggc 1560
aacaattaat agactggatg gaggcggata aagttgcagg accacttctg cgctcggccc 1620
ttccggctgg ctggtttatt gctgataaat ctggagccgg tgagcgtggg tctcgcggta 1680
tcattgcagc actggggcca gatggtaagc cctcccgtat cgtagttatc tacacgacgg 1740
ggagtcaggc aactatggat gaacgaaata gacagatcgc tgagataggt gcctcactga 1800
ttaagcattg gtaactgtca gaccaagttt actcatatat actttagatt gatttaaaac 1860
ttcattttta atttaaaagg atctaggtga agatcctttt tgataatctc atgaccaaaa 1920
tcccttaacg tgagttttcg ttccactgag cgtcagaccc cgtagaaaag atcaaaggat 1980
cttcttgaga tccttttttt ctgcgcgtaa tctgctgctt gcaaacaaaa aaaccaccgc 2040
taccagcggt ggtttgtttg ccggatcaag agctaccaac tctttttccg aaggtaactg 2100
gcttcagcag agcgcagata ccaaatactg ttcttctagt gtagccgtag ttaggccacc 2160
acttcaagaa ctctgtagca ccgcctacat acctcgctct gctaatcctg ttaccagtgg 2220
ctgctgccag tggcgataag tcgtgtctta ccgggttgga ctcaagacga tagttaccgg 2280
ataaggcgca gcggtcgggc tgaacggggg gttcgtgcac acagcccagc ttggagcgaa 2340
cgacctacac cgaactgaga tacctacagc gtgagctatg agaaagcgcc acgcttcccg 2400
aagggagaaa ggcggacagg tatccggtaa gcggcagggt cggaacagga gagcgcacga 2460
gggagcttcc agggggaaac gcctggtatc tttatagtcc tgtcgggttt cgccacctct 2520
gacttgagcg tcgatttttg tgatgctcgt caggggggcg gagcctatgg aaaaacgcca 2580
gcaacgcggc ctttttacgg ttcctggcct tttgctggcc ttttgctcac atgttctttc 2640
ctgcgttatc ccctgattct gtggataacc gtattaccgc ctttgagtga gctgataccg 2700
ctcgccgcag ccgaacgacc gagcgcagcg agtcagtgag cgaggaagcg gaagagcgct 2760
gccggcacct gtcctacgag ttgcatgata aagaagacag tcataagtgc ggcgacgata 2820
gtcatgcccc gcgcccaccg gaaggagctg actgggttga aggctctcaa gggcatcggt 2880
cgacggatcc tacataaatg tgagcaagcg aaaaaaaaaa attggcatta taaaccatca 2940
ttttcgatga aataatcaat caacgtagat aagctgatat tatataattt tggtctgttc 3000
gtgttgattt tatcactgat ggactttggc atacagatag tgacaatttc gttattgaac 3060
cattgagaat ggaaaatcaa tggaacttca tccagagtta tgcacataga agctccctca 3120
gccggaaaaa agctgatagc gccaaaatct attagtgaca agtctgtgtt aaggccagtt 3180
ccagtaaatt ttgtatacga ctccttcaag gaccataagt aagtaaatat tgtgcatgga 3240
tcagacgctt tcagtaaacc gttaaattct ctttcactaa aaacttcttt aaatagctcc 3300
aactcttccc tcccgccata attgcacgga gaagcgatat caattccgac atcctggtat 3360
tcatctgtac ttacacattt tacgaggaac atagctacat attgttcacc gatggtcatg 3420
ctaaatggaa gaaaacgatt gttgtctaag aatggcttac cgaagctgcc cttgtcaaat 3480
ttcagctctt gaaaatttaa gcccgttact atagagcagc caaacaactg cagcagctgg 3540
ctgcatagat ttgaacatct atcgtgaaac gattttttat tgaggattct ggcttgagac 3600
gccaatggca aagttctcat taatgcctcg aacgtaaact catccgcgag tatatcctct 3660
tgaatttcaa caacgaatat acctgcccat ggtcttacac ctgccacctt tgaaacttcg 3720
cttactactt cagtcgtttt aaccatccac ggtttttttg ctgagtgatt ctctttctcc 3780
tcattctcat tttagtcata gcggttttaa taagcgcccg aaagataatt gtaaaacata 3840
tattcaatgc ttaaaaatat aagaaattgc ccatcaattt gaaaactcaa gtaaaacaga 3900
gaagttgtaa ggtgaataag gaatgagtga ggatccgtcg actacgtcgt taaggccgtt 3960
tctgacagag taaaattctt gagggaactt tcaccattat gggaaatggt tcaagaaggt 4020
attgacttaa actccatcaa atggtcaggt cattgagtgt tttttatttg ttgtattttt 4080
ttttttttag agaaaatcct ccaatatata aattaggaat catagtttca tgattttctg 4140
ttacacctaa ctttttgtgt ggtgccctcc tccttgtcaa tattaatgtt aaagtgcaat 4200
tctttttcct tatcacgttg agccattagt atcaatttgc ttacctgtat tcctttacat 4260
cctccttttt ctccttcttg ataaatgtat gtagattgcg tatatagttt cgtctaccct 4320
atgaacatat tccattttgt aatttcgtgt cgtttctatt atgaatttca tttataaagt 4380
ttatgtacaa atatcataaa aaaagagaat ctttttaagc aaggattttc ttaacttctt 4440
cggcgacagc atcaccgact tccgtggtac tgttggaacc acctaaatca ccagttctga 4500
tacctgcatc caaaaccttt ttaactgcat cttcaatggc cttaccttct tcaggcaagt 4560
tcaatgacaa tttcaacatc attgcagcag acaagatagt ggcgataggg ttgaccttat 4620
tctttggcaa atctggagca gaaccgtggc atggttcgta caaaccaaat gcggtgttct 4680
tgtctggcaa agaggccaag gacgcagatg gcaacaaacc caaggaacct gggataacgg 4740
aggcttcatc ggagatgata tcaccaaaca tgttgctggt gattataata ccatttaggt 4800
gggttgggtt cttaactagg atcatggcgg cagaatcaat caattgatgt tgaaccttca 4860
atgtagggaa ctcgttcttg atggtttcct ccacagtttt tctccataat cttgaagagg 4920
ccaaaacatt agctttatcc aaggaccaaa taggcaatgg tggctcatgt tgtagggcca 4980
tgaaagcggc cattcttgtg attctttgca cttctggaac ggtgtattgt tcactatccc 5040
aagcgacacc atcaccatcg tcttcctttc tcttaccaaa gtaaatacct cccactaatt 5100
ctctgacaac aacgaagtca gtacctttag caaattgtgg cttgattgga gataagtcta 5160
aaagagagtc ggatgcaaag ttacatggtc ttaagttggc gtacaattga agttctttac 5220
ggatttttag taaaccttgt tcaggtctaa cactaccggt accccattta ggaccaccca 5280
cagcacctaa caaaacggca tcaaccttct tggaggcttc cagcgcctca tctggaagtg 5340
ggacacctgt agcatcgata gcagcaccac caattaaatg attttcgaaa tcgaacttga 5400
cattggaacg aacatcagaa atagctttaa gaaccttaat ggcttcggct gtgatttctt 5460
gaccaacgtg gtcacctggc aaaacgacga tcttcttagg ggcagacatt agaatggtat 5520
atccttgaaa tatatataag atccgtgtgg aagaacgatt acaacaggtg ttgtcctctg 5580
aggacataaa atacacaccg agattcatca actcattgct ggagttagca tatctacaat 5640
tgggtgaaat ggggagcgat ttgcaggcat ttgctcggca tgccggtaga gatgtggtca 5700
ataagagcga cctcatgcta tacctgagaa agcaacctga cctacaggaa agagttactc 5760
aagaataaga attttcgttt taaaacctaa gagtcacttt aaaatttgta tacacttatt 5820
ttttttataa cttatttaat aataaaaatc ataaatcata agaaattcgc ttagttaacc 5880
tctagatcca taacttcgta tatggtttct tatacgaagt tat 5923
<210>3
<211>840
<212>DNA
<213>Saccharomyces cerevisiae
<400>3
aggtggagcg caggtcatag gtatgccggc tcattgtttt ctattttaaa aagtaaaaaa 60
tatgctgcta aaggaacacg tgagaaatta cattctccct aggtctgcga taacgcggta 120
atattacact gccgccgcct tccatgcctt tggaaagcag acaatgatgc taggcggcgc 180
ccagcagtat aaacttttct tgcttataac cagaacctct atcacaaaat tagaaactgc 240
gatactatgg gtcagatcga cacataggga gcactattag gcgcaaggcg tatacatagg 300
cattgcgtgt tcaaaaattg tcgtatgaga aaagttccaa actttccacc attactcacc 360
aacaacttac accagcccgg atttaagatt tagcttccga gaatattgtg actcagccac 420
tggtctcttg aatgttgcgt gtagcttgat taagattatg gcataaccgt tttttttact 480
tggcaagagt gaacgtcctt ttactccaaa aggctcctga tgaaactgga gagtctcttt 540
gttctgaaat ttttaaagtt tagcacacca tattcacgct cgaggtgaac ccaagttttc 600
ctgaaaaatg tgccatgaac ctgaaaaaaa gaattattct cgaaaataaa aaaggcaatc 660
aagatcggaa agataagcat tttttttcaa tccgtatcta acattcataa agtgataaaa 720
aaattgataa cgattttatt gtcgcctctt gttttgagta tattttttta acgttctttt 780
tcggcattca aattccgtat aatcaactca attgtaaggc gccgtagcat ccaaataatg 840
<210>4
<211>669
<212>DNA
<213>Saccharomyces cerevisiae
<400>4
ttgaaagtgc caatttgctc atcagtgcta aatattcctt gataaaaata tagaagacaa 60
ggacatataa aaagaaagac tgctctagtg ttgggacacc acaatgaaaa aatacttaac 120
gtgtttcgaa actgtgaata taaaattcca gcaaaaacca aaatattcac tacaatgatt 180
gatcgtaccg agttatcgaa gtttggtatt actacgcaac tgtctgttat tggacgtaat 240
ccagatgaac aaagtggctt tgttaatcca cctttgtata aggggtcaac catcattctt 300
aaaaaactta gtgatttaga acaaaggaaa ggaagatttt acgggacagc aggttctcca 360
actattgaca atttagaaaa tgcctggacg catttaaccg gcggtgctgg gacagtgcta 420
tcagcttctg ggcttggttc tatctctttg gcgctattgg ccctttcgaa agctggtgat 480
catatcttga tgactgatag tgtctacgtg ccaacacgta tgctatgtga tggtttattg 540
gccaagttcg gtgttgaaac ggattattat gacccatcaa tagggaagga tatagaaaaa 600
ctagttaagc caaatacaac cgtcattttc ctcgaaagcc cgggttctgg gaccatggaa 660
gtacaggat 669
<210>5
<211>881
<212>DNA
<213>Saccharomyces cerevisiae
<400>5
gcaactaaaa cgcccgtgga ttgaggttca gatttgctac tgtcgctttc gaagaagcta 60
gatgaaccac gggtaaagta ttctgcatct aatgtgttca ataaatattg agtgacgtta 120
tcgtaatgtt acagtactaa caccgctaga aaatgctggt gtgaatgtga atgacgatag 180
acggactgat gcacttttcc attgtacgat aacattactt acaagattgg gagaagcatg 240
attgaaaatt tgactggaag aaccacttat attaggagtg gcggtattag tagaaaattg 300
actaaacgca tccgaaaatt aaatagaatt taaagtttcc ttgggtgcac tgttttgggc 360
tgcagtgcta aaatccagaa gtgttggagt caggttactt gtttgcatac agacattact 420
gaagttttca gaaggccttt gaatcgagaa cgagataagg aagtgtcctc taaatgcaat 480
tttagagctc aaagtgagga tagtggcact gaaacttgat ttagttaatg gcctttagat 540
ttgctgctgt ctgaaaagct catcatcgag aagctcacaa aatggagttc tagttgccct 600
ttcactatac aatcgatgta aagatggctt ataagtattt gaattgtaag ttttgtgcta 660
gctgaggaat caaaaaatgt atttagtgct tccttactgg tcaattgtgt attatttcca 720
gatgaaacag aaaatatgta ttttatggat tgactaatca agtcacttgc tgattgtgta 780
atagtggtgg ttaaagaaag tacagtaagt ttgcttgaaa tacaggcagg attcctggaa 840
tactgcctac tactgcttat tgaatagagt gtaatctcgc c 881
<210>6
<211>898
<212>DNA
<213>Saccharomyces cerevisiae
<400>6
aaacccagta atagcatcgt ttaagaaatg gtgcttactt gtaggtaaaa cttctgaagg 60
atactgagta aatgtaaaat tatatgagtt aaggcagaat gactgtaaac ttttgtgacg 120
aatctggaag atgcattcgt cgattggcct tcattaagtg aagattggta acctattgca 180
tccaaaccag aagtaataca accagaatgt ggagatgagg agccaacagg tgtgtatcca 240
gaaggttcag ccacaggttg gtcatcaata ccactggggg agcatgcaat ataatcagat 300
ggttgcgagg aatagctagt agagctaaaa ctgaacacat tagttaagat tagactagcc 360
atgctcaaag aaacaattag agaggcacct acatgttcgt tatccatttt tgaggaaaaa 420
atagaagtga taataataat tttgctcgaa ctactcgtaa agctacttga aaaacggctc 480
gagattacgg aagagtcggt agtaaaccga ctctcagtgt cacggaatgg aagcgccttg 540
aaactactaa tatcaggtat gcattgaggg gcaaggcaac ctgaatatgc aaagagcata 600
gtcttaactt tcgtagtacg taatacttcg gcattaattt ggcctaccgc tttgccacag 660
ttgagtggtc actggagtat tagccatgaa aaaatgatcc cttgtatatc caggcccaaa 720
gtctaaaatg tacttcctgc caatggttgt cacagctaat attccatttt gaattgactt 780
gatttttaga ttattatcat ggaaccaagt tgatgtcttg caatttctga tttttaacga 840
tgtactggag gttgacgact aggcaaatct gcgaaacatc ctagtacaat ggcatttg 898
<210>7
<211>12
<212>DNA
<213>Saccharomyces cerevisiae
<220>
<221>misc_feature
<222>(1)..(12)
<223>w means a or t,y means c or t,r means a or g,and b means c,g
or t.
<400>7
wtttayrttt wb 12
<210>8
<211>1032
<212>DNA
<213>bacteriophage P1
<400>8
atgtccaatt tactgaccgt acaccaaaat ttgcctgcattaccggtcga tgcaacgagt 60
gatgaggttc gcaagaacct gatggacatg ttcagggatc gccaggcgtt ttctgagcat 120
acctggaaaa tgcttctgtc cgtttgccgg tcgtgggcgg catggtgcaa gttgaataac 180
cggaaatggt ttcccgcaga acctgaagat gttcgcgatt atcttctata tcttcaggcg 240
cgcggtctgg cagtaaaaac tatccagcaa catttgggcc agctaaacat gcttcatcgt 300
cggtccgggc tgccacgacc aagtgacagc aatgctgttt cactggttat gcggcggatc 360
cgaaaagaaa acgttgatgc cggtgaacgt gcaaaacagg ctctagcgtt cgaacgcact 420
gatttcgacc aggttcgttc actcatggaa aatagcgatc gctgccagga tatacgtaat 480
ctggcatttc tggggattgc ttataacacc ctgttacgta tagccgaaat tgccaggatc 540
agggttaaag atatctcacg tactgacggt gggagaatgt taatccatat tggcagaacg 600
aaaacgctgg ttagcaccgc aggtgtagag aaggcactta gcctgggggt aactaaactg 660
gtcgagcgat ggatttccgt ctctggtgta gctgatgatc cgaataacta cctgttttgc 720
cgggtcagaa aaaatggtgt tgccgcgcca tctgccacca gccagctatc aactcgcgcc 780
ctggaaggga tttttgaagc aactcatcga ttgatttacg gcgctaagga tgactctggt 840
cagagatacc tggcctggtc tggacacagt gcccgtgtcg gagccgcgcg agatatggcc 900
cgcgctggag tttcaatacc ggagatcatg caagctggtg gctggaccaa tgtaaatatt 960
gtcatgaact atatccgtac cctggatagt gaaacagggg caatggtgcg cctgctggaa 1020
gatggcgatt ag 1032