CN107002020B - 使用rna引导的内切核酸酶在非常规酵母中基因靶向 - Google Patents
使用rna引导的内切核酸酶在非常规酵母中基因靶向 Download PDFInfo
- Publication number
- CN107002020B CN107002020B CN201580056204.XA CN201580056204A CN107002020B CN 107002020 B CN107002020 B CN 107002020B CN 201580056204 A CN201580056204 A CN 201580056204A CN 107002020 B CN107002020 B CN 107002020B
- Authority
- CN
- China
- Prior art keywords
- sequence
- rna
- ribozyme
- dna
- seq
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
- C12N15/905—Stable introduction of foreign DNA into chromosome using homologous recombination in yeast
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
- C12N15/81—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/12—Type of nucleic acid catalytic nucleic acids, e.g. ribozymes
- C12N2310/121—Hammerhead
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/10—Plasmid DNA
- C12N2800/108—Plasmid DNA episomal vectors
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Biomedical Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Zoology (AREA)
- Organic Chemistry (AREA)
- Wood Science & Technology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- Plant Pathology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Mycology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Medicinal Chemistry (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
本文公开了非常规酵母,其包含至少一种RNA引导的内切核酸酶(RGEN),所述RNA引导的内切核酸酶包含至少一种不具有5’端的RNA组分。该未封端的RNA组分包含与酵母中的染色体或附加体中的靶位点序列互补的序列。RGEN可结合到,并任选地切割靶位点序列处的一个或两个DNA链。本文的RGEN的示例是Cas9蛋白质与向导RNA的复合物。在某些实施方案中使用核酶以提供缺乏5’端的RNA组分。本文还公开了在非常规酵母中基因靶向的方法。
Description
本申请要求2014年8月13日提交的美国临时申请62/036652的权益,该文献全文以引用方式并入本文。
技术领域
本发明涉及分子生物学领域。具体地,本发明涉及使用RNA引导的内切核酸酶(RGEN)在非常规酵母中基因靶向。
以电子方式递交的序列表的引用
通过EFS-Web以电子方式将序列表的正式文本作为ASCII格式的序列表递交,该文件名称为“20150721_CL6272WOPCT_SequenceListing_ST25.txt”,创建日期为2015年7月21日,文件大小为411千字节,并且该文件与本说明书同时提交。在这一ASCII格式的文件中包含的序列表为所述说明书的一部分并且全文以引用方式并入本文。
背景技术
理解基因在生物体内的功能的有效方法是抑制其表达。基因表达的抑制可例如通过中断或删除基因的DNA序列,产生基因的“敲除”来实现(Austin等人,Nat.Genetics 36:921-924)。基因敲除主要通过同源重组(HR)(适用于从细菌到哺乳动物的大量生物体的技术)来进行。用于研究基因功能的另一种工具可通过基因“敲入”,其也通常由HR来进行。用于基因靶向目的的HR(敲除或敲入)可利用外源提供的DNA的存在,所述DNA具有与靶位点的同源性。
虽然由HR靶向基因是有效的工具,但其可能是复杂的劳动密集型程序。使用HR的大部分研究通常已经限为敲除路径中的单个基因而不是多个基因,因为HR通常难以以高性价比方式放大。该困难在其中HR不是有效的生物体中加剧。此类低效率通常迫使实践者依赖可选的表型或外源性标记物来帮助鉴定发生期望的HR事件的细胞。
已经示出用于基因靶向的HR在靶向DNA位点包含双链断裂时增强(Rudin等人,Genetics 122:519-534;Smih等人,Nucl.Acids Res.23:5012-5019)。用于引入双链断裂的策略因此有利于开发HR介导的DNA靶向。例如,已将锌指核酸酶工程化来切割特异性DNA位点,从而导致当供体DNA存在时在该位点处增强的HR水平(Bibikova等人,Science300:764;Bibikova等人,Mol.Cell.Biol21:289-297)。类似地,还已经开发了人造大范围核酸酶(归位内切核酸酶)和转录激活因子样效应物(TALE)核酸酶用于HR介导的DNA靶向(Epinat等人,Nucleic Acids Res.31:2952-2962;Miller等人,Nat.Biotech.29:143-148)。
编码CRISPR(聚集状规则间隔的短回文重复序列)DNA切割体系的基因座唯一地存在于约40%细菌基因组和大多数古细菌基因组中(Horvath和Barrangou,Science 327:167-170;Karginov和Hannon,Mol.Cell 37:7-19)。具体地讲,已经开发了II型CRIPSR体系的CRISPR缔合的(Cas)RNA引导的内切核酸酶(RGEN),Cas9,作为引入位点特异性DNA链断裂的方式((2015年3月19日公布的国专利申请US 2015-0082478 A1和2015年2月26日公布的US2015-0059010A1,两者均全文以引用方式并入本文)。可设计Cas9的RNA组分的序列使得Cas9识别并切割包含下列的DNA:(i)与RNA组分的一部分互补的序列和(ii)前间区序列邻近基序(PAM)序列。
天然Cas9/RNA复合物包含两个RNA序列,CRISPR RNA(crRNA)和反式激活CRISPRRNA(tracrRNA)。crRNA包含,在5’-至-3’方向上,与DNA靶位点互补的独特序列和由CRISPR基因座(crRNA源自所述基因座)的重复区编码的序列的一部分。tracrRNA包含,在5’-至-3’方向上,与crRNA的重复区退火的序列和包含茎环的部分。目前的工作已经导致了向导RNA(gRNA)的开发,所述向导RNA为嵌合序列,其包含在5’-至-3’方向上连接至tracrRNA的crRNA(美国临时专利申请61/868,706,提交于2013年8月22日)。
在真核细胞中表达RNA组分,诸如gRNA以进行Cas9介导的DNA靶向的方法已经使用RNA聚合酶III(Pol III)启动子,其允许具有预先限定的未修饰的5’-端和3’-端的RNA的转录(DiCarlo等人,Nucleic Acids Res.41:4336-4343;Ma等人,Mol.Ther.Nucleic Acids3:e161)。该策略已经成功应用于多种不同物种的细胞,包括玉米和大豆(美国临时专利申请61/868,706,2013年8月22日提交),以及人类、小鼠、斑马鱼、木霉属和酿酒酵母。
然而,如现在在本专利申请中所公开的,使用Pol III启动子-转录gRNA在非常规酵母诸如解脂耶氏酵母中进行Cas9-介导的DNA靶向已被证明是困难的。因此,用于产生Cas9的RNA组分的其它方式对于在非常规酵母中提供Cas9介导的DNA靶向是有意义的。
发明内容
在一个实施方案中,本公开涉及一种非常规酵母,其包含至少一种RNA引导的内切核酸酶(RGEN),所述RNA引导的内切核酸酶包含至少一种不具有5’-端的RNA组分,其中所述RNA组分包含与酵母中的染色体或附加体上的靶位点序列互补的序列,其中所述RGEN可结合到靶位点序列。RGEN还可结合到并切割靶位点。
在一个实施方案中,非常规酵母为选自下列属的成员:耶氏酵母属、毕赤酵母属、许旺氏酵母属、克鲁维酵母属、Arxula属、丝孢酵母属、假丝酵母属、黑粉菌属、球拟酵母属、接合酵母属、三角酵母属、隐球酵母属、红酵母属、法夫酵母属、掷孢酵母属和管囊酵母属。
在一个实施方案中,所述RGEN包含CRISPR(聚集状规则间隔的短回文重复序列)-缔合的(Cas)蛋白质-9(Cas9)氨基酸序列。Cas9蛋白质可以为链球菌Cas9蛋白质,然而RNA组分可包含向导RNA(gRNA),所述向导RNA包含可操作地连接至反式激活CRISPR RNA(tracrRNA)的CRISPR RNA(crRNA)。PAM(前间区序列邻近基序)序列可邻近靶位点序列。RGEN还可结合到并切割靶位点。由核苷酸序列转录的RNA可自催化地去除核酶以产生所述RNA组分,其中所述RNA组分不具有5’端。所述核酶可包括锤头核酶、丁型肝炎病毒核酶、I组内含子核酶、RnaseP核酶、或发夹型核酶。由核苷酸序列转录的RNA可以为不自催化地去除核酶从而产生不具有5’端的核酶-RNA组分融合分子的RNA分子。
在一个实施方案中,本公开涉及一种非常规酵母,其包含Cas内切核酸酶和多核苷酸序列,所述多核苷酸序列包含可操作地连接至至少一个核苷酸序列的启动子,其中所述核苷酸序列包含编码在编码RNA组分的DNA序列上游的核酶的DNA序列,其中所述RNA组分包含与酵母中染色体或附加体上的靶位点序列互补的可变靶向结构域,其中所述RNA组分可与Cas内切核酸酶形成RNA-引导的内切核酸酶(RGEN),其中所述RGEN可结合到靶位点序列。
在一个实施方案中,本文所述的方法包括一种用于修饰非常规酵母中的染色体或附加体上的靶位点的方法,所述方法包括向非常规酵母提供第一重组DNA构建体,所述第一重组DNA构建体包含编码Cas内切核酸酶的DNA序列,和第二重组DNA构建体,所述第二重组DNA构建体包含编码RNA组分上游的核酶的DNA序列,其中由第二重组DNA构建体转录的RNA自催化地去除核酶以产生所述RNA组分,其中所述Cas9内切核酸酶在所述靶位点处引入单链或双链断裂。
在一个实施方案中,本文所述的方法包括一种用于修饰非常规酵母中的染色体或附加体上的靶位点的方法,所述方法包括向非常规酵母提供第一重组DNA构建体,所述第一重组DNA构建体包含编码Cas内切核酸酶的DNA序列,和第二重组DNA构建体,所述第二重组DNA构建体包含编码核酶-RNA组分融合分子的DNA序列,其中所述核酶-RNA组分融合分子和Cas9内切核酸酶可形成RGEN,所述RGEN在所述靶位点处引入单链或双链断裂。
所述方法还可包括鉴定在所述靶位点处具有修饰的至少一种非常规酵母细胞,其中所述修饰包括所述靶位点中的一个或多个核苷酸的至少一个缺失或替换。所述方法还可包括向所述酵母提供供体DNA,其中所述供体DNA包含目的多核苷酸。
在一个实施方案中,本文所述的方法包括一种用于编辑非常规酵母中的染色体或附加体上的核苷酸序列的方法,所述方法包括向非常规酵母提供多核苷酸修饰模板DNA,包含编码Cas内切核酸酶的DNA序列的第一重组DNA构建体,和包含编码RNA组分上游的核酶的DNA序列的第二重组DNA构建体,其中由第二重组DNA构建体转录的RNA自催化地去除核酶以产生所述RNA组分,其中所述Cas9内切核酸酶在所述酵母的染色体或附加体中的所述靶位点处引入单链或双链断裂,其中所述多核苷酸修饰模板DNA包含所述核苷酸序列的至少一个核苷酸修饰。
在一个实施方案中,本文所述的方法包括一种用于使非常规酵母中的染色体或附加体上的核苷酸序列沉默的方法,所述方法包括向非常规酵母提供至少第一重组DNA构建体,所述第一重组DNA构建体包含编码失活的Cas9内切核酸酶的DNA序列,和至少第二重组DNA构建体,所述第二重组DNA构建体包含可操作地连接至至少一个多核苷酸的启动子,其中所述至少一个多核苷酸编码核酶-RNA组分融合分子,其中所述核酶-RNA组分融合分子和失活的Cas9内切核酸酶可形成RGEN,所述RGEN结合到所述酵母的染色体或附加体中的所述核苷酸序列,从而阻断所述核苷酸序列的转录。
在一个实施方案中,本文所述的方法包括用于产生非常规酵母中基因修饰用多重向导RNA的高通量方法,所述方法包括:a)提供重组DNA构建体,所述重组DNA构建体包含以5’至3’的顺序可操作地连接至下列的启动子:编码核酶的第一DNA序列、编码反向选择剂的第二DNA序列、编码向导RNA的CER结构域的第三DNA序列和终止子序列;b)向(a)的重组DNA构建体提供至少一个寡核苷酸双链体,其中所述寡核苷酸双链体源自包含能够编码向导RNA靶序列的可变靶向结构域(VT)的DNA序列的第一单链寡核苷酸与包含编码可变靶向结构域的DNA序列的互补序列的第二单链寡核苷酸的组合;c)将(a)的反向选择剂与(b)的至少一个寡双链体交换,从而形成重组DNA构建体库,其各自包含能够编码向导RNA的可变靶向结构域的DNA序列;以及,
d)转录(c)的重组DNA构建体库,从而形成核酶-向导RNA库。
附图和序列简述
图1:单向导多核苷酸诸如单向导RNA(sgRNA)的结构模型。可变靶向(VT)结构域示为灰色。Cas9内切核酸酶识别(CER)结构域示为黑色。
图2A:经耶氏酵母密码子优化的Cas9表达盒。FBA1启动子示为黑色,并且编码具有C末端SV40核定位信号(NLS)的Cas9的开放阅读框示为浅灰色。
图2B:经耶氏酵母优化的pre-sgRNA RGR表达盒(RGR,核酶-sgRNA-核酶)。FBA1启动子示为黑色,锤头(HH)核酶示为深灰色,单向导RNA(sgRNA)示为浅灰色,并且HDV核酶以竖条纹形式示出。
图2C:经耶氏酵母优化的pre-sgRNA RG表达盒(RG,核酶-sgRNA)。FBA1启动子示为黑色,锤头(HH)核酶示为深灰色,单向导RNA(sgRNA)示为浅灰色,并且Sup4终止子以竖条纹形式示出。
图3A:pZUFCas9(SEQ ID NO:14)质粒包含图2A中所示的经耶氏酵母密码子优化的Cas9表达盒。复制起点(ARS 18,f1 ori,ColE1)以交叉影线示出,并且可选标记物(Ura3,Amp)呈灰色。
图3B:pZUFCas9/PolIII-sgRNA质粒包含图2A中所示的经耶氏酵母密码子优化的Cas9表达盒,和用于在耶氏酵母中靶向Leu2-3的Yl Snr52(Pol III启动子,表示为“Yl52”)-sgRNA表达盒。尽管未示出,但sgRNA盒还包含酿酒酵母Sup4基因转录终止子序列。复制起点(ARS 18,f1 ori,ColE1)以交叉影线示出,并且可选标记物(Ura3,Amp)呈灰色。
图3C:pRF38质粒(SEQ ID NO:19)包含用于靶向解脂耶氏酵母中CAN1基因的序列SEQ ID NO:18的经耶氏酵母优化的pre-sgRNA表达盒(FBA1启动子以白色示出,RGR pre-sgRNA以斜条纹示出)。复制起点(ARS 18,f1 ori,ColE1)以交叉影线示出,并且可选标记物(Ura3,Amp)呈灰色。
图4B:利用(i)仅pZUFCas9(SEQ ID NO:14)或者(ii)pZUFCas9和包含SEQ ID NO:18的经耶氏酵母优化的pre-sgRNA表达盒的线性DNA转化的解脂耶氏酵母细胞中的瞬时靶向效率(参见实施例3)。y轴指示利用pZUFCas9转化的细胞的频率(即,Ura+细胞),所述细胞也是刀豆氨酸抗性的(CanR)。误差线表示标准偏差。
图5:利用pZUFCas9(SEQ ID NO:14)和包含SEQ ID NO:18的经耶氏酵母优化的pre-sgRNA表达盒的线性DNA转化的解脂耶氏酵母细胞的CAN1编码区中的Cas9/sgRNA切割位点的序列图(参见实施例3)。参见野生型(WT)CAN1序列,Can1-1靶位点序列以粗体示出,PAM序列加下划线。预测切割位点紧接PAM上游的第三核苷酸的5′。插入的核苷酸以斜体表示。每一类突变体(1-18)的数目和频率在右侧表示。该图中示出的序列以SEQ ID NO:71-89包括在序列表中,如图中所编号的。
图6:利用(i)仅pZUFCas9(SEQ ID NO:14),(ii)pZUFCas9和包含SEQ ID NO:18的经耶氏酵母优化的pre-sgRNA表达盒(RGR)的线性DNA,或(iii)pZUFCas9和包含SEQ ID NO:25的经耶氏酵母优化的pre-sgRNA表达盒(RG)的线性DNA转化的解脂耶氏酵母细胞中的瞬时靶向效率(参见实施例4)。y轴指示利用pZUFCas9转化的细胞的频率(即,Ura+细胞),所述细胞也是刀豆氨酸抗性的(CanR)。误差线表示标准偏差。
图7:比较通过HR和NHEJ DNA修复路径的突变频率。测定在转化中提供多核苷酸修饰模板DNA序列时,由HR(深灰)和NHEJ(浅灰)进行的Cas9/sgRNA-介导的DNA双链断裂修复的总频率(参见实施例5)。误差线表示标准偏差。
图8:由于多核苷酸修饰模板DNA序列的类型,在Cas9/sgRNA-介导的DNA双链断裂位点处的HR频率。示出使用点突变模板DNA(深灰)、移码模板DNA(浅灰)、和大缺失模板DNA(白色)的HR频率(参见实施例5)。误差线表示标准偏差。
图9:耶氏酵母中在CAN1基因座处的突变频率(在被Cas9/sgRNA切割的Can1-1位点处修复)不受多核苷酸修饰模板DNA存在的影响。由不包括多核苷酸修饰模板DNA(深灰色,无模板DNA)或包括多核苷酸修饰模板DNA(浅灰色,具有模板DNA)(两个转化组均包括pZUFCas9(SEQ ID NO:14)和RGR表达盒[SEQ ID NO:18])的转化产生的细胞的刀豆氨酸抗性频率(参见实施例5)。y轴指示利用pZUFCas9转化的细胞的频率(即,Ura+细胞),所述细胞也是刀豆氨酸抗性的(CanR)。误差线表示标准偏差。
图10A:pRF84质粒(SEQ ID NO:41)包含图2A中所示的经耶氏酵母密码子优化的Cas9表达盒和SEQ ID NO:18的经耶氏酵母优化的RGR pre-sgRNA盒(RGR pre-sgRNA编码区[“Can1 RGR”]由斜线示出)。复制起点(ARS 18,f1 ori,ColE1)以交叉影线示出,并且可选标记物(Ura3,Amp)呈灰色。
图10B:pRF85质粒(SEQ ID NO:42)包含图2A中所示的经耶氏酵母密码子优化的Cas9表达盒和SEQ ID NO:25的经耶氏酵母优化的RG pre-sgRNA盒(RG pre-sgRNA编码区[“Can1 RG”]由斜线示出)。复制起点(ARS 18,f1 ori,ColE1)以交叉影线示出,并且可选标记物(Ura3,Amp)呈灰色。
图11:通过仅表达Cas9(pZUFCas9,SEQ ID NO:14),或表达(i)Cas9和(ii)RGRpre-sgRNA(pRF84)或RG sgRNA(pRF85),在耶氏酵母中在CAN1基因座处的突变频率(参见实施例6)。y轴指示利用每种相应载体转化的细胞的频率(即,Ura+细胞),所述细胞也是刀豆氨酸抗性的(CanR)。误差线表示标准偏差。
图12A-12B:构建HDV-sgRNA融合表达盒的高通量克隆盒的示例。图12-A以黑色框示出启动子序列,以灰色框示出编码HDV核酶的DNA序列,以水平阴影框示出的是侧接有II型限制性位点的克隆菌株的反向可选择标记物,以黑色虚线框示出的是与Cas9相互作用的sgRNA的CER结构域,并且以斜线阴影框示出的是转录终止子。当包含编码可变靶向结构域的DNA序列和II型限制性位点的适当突出物的DNA双链体(竖直阴影线框VT)与质粒,DNA连接酶和II型酶混合时,编码可变靶向结构域(VT)的DNA序列将置换反向可选择标记物,从而形成HDV-sgRNA表达盒(启动子-HDV-VT-CER-终止子)。当转录HDV-sgRNA表达盒时,其产生RNA转录物(HDV-VT-CER转录物),其中HDV核酶切割任何5’序列。图12-B示出双链DNA分子(SEQ ID NO:99和SEQ ID NO:100的寡聚双链)的一个示例,其包含编码Can1-1靶位点的DNA序列和克隆入质粒pRF291中的适当突出物。
图13A-13B:构建HH-sgRNA表达盒的高通量克隆盒的示例。图13-以黑色框示出启动子序列;以水平阴影框示出侧接有II型限制性位点的克隆菌株的反向可选择标记物;以黑色虚线框示出的是与Cas9相互作用的sgRNA的CER结构域,以斜线阴影框示出的是转录终止子。当包含编码DNA的靶位点特异性锤头核酶的DNA双链体(竖直阴影框HH、靶向序列和II型位点的适当突出物(虚线框TS))与质粒、DNA连接酶和II型酶混合时,HH--靶位点双链体置换反向可选择标记物,从而形成HH-sgRNA表达盒。当转录表达盒时,其产生转录体并且HH核酶切除其本身和任何5’序列。图13B示出双链DNA分子(SEQ ID NO:162和SEQ ID NO:163)的示例,其包含用于靶向ds-temp-1靶位点的可变靶向结构域(VT)和编码DNA(HH)的序列特异性HH核酶,以及克隆入质粒pRF291中的适当突出物。
图14:来自由pRF303(SEQ ID NO:103)和Can1短编辑模板(SEQ ID NO:157)转化的细胞的Can1基因座的凝胶电泳的示例。标记MW的泳道是分子量标记物。泳道1-16表示来自划线纯化的转化体的单独菌落。较高MW带是WT Can1基因座(SEQ ID NO:160)或具有小插入缺失(indel)突变的Can1基因座的正确尺寸。较小分子量带是由短Can1编辑模板(SEQ IDNO:157)编辑的Can1基因座(SEQ ID NO:161)的正确尺寸。
图15示出来自菌落PCR的质粒和基因组URA3基因的代表性测序结果及其比对。虚线和粗体分别示出缺失和插入。PAM序列加下划线。
图16-A示出耶氏酵母URA3基因内RGR-URA3.1、RGR-URA3.2和RGR-URA3.3的靶向序列的相对位置。
图16-B示出在包含5-FOA的SC培养基上生长的pYRH222转化体的菌落PCR的测序结果和序列比对。粗体表示插入。PAM序列加下划线。“N”表示混合序列。图16-C示出在包含5-FOA的SC培养基上生长的pYRH282转化体的菌落PCR的测序结果和序列比对。虚线表示缺失。PAM序列加下划线。“N”表示混合序列。图16-D示出在包含5-FOA的SC培养基上生长的pYRH283转化体的菌落PCR的测序结果和序列比对。虚线表示缺失。PAM序列加下划线。“N”表示混合序列。
图17示出来自pYRH282(菌落号23和24)和pYRH283(菌落号27和36)转化体的PCR产物的不同迁移。来自梯状物的DNA尺寸在右侧示出。
图18示出Can1靶序列的代表性测序结果。虚线分别指示缺失。PAM序列以粗体示出。
表1
核酸和蛋白质序列号概述
具体实施方式
本文引用的所有专利和非专利文献的公开全文以引用方式并入本文。
如本文所用,术语“发明”或“所公开的本发明”不旨在限制但一般适用于权利要求中所限定的或本文所述的任何发明。这些术语在本文中可互换使用。
本文的术语“非常规酵母”是指不是酵母属(Saccharomyces)(例如,酿酒酵母(S.cerevisiae))或裂殖(Schizosaccharomyces)酵母物种的任何酵母。非常规酵母描述于以下文献中:Non-Conventional Yeasts in Genetics,Biochemistry andBiotechnology:Practical Protocols(K.Wolf、K.D.Breunig、G.Barth编辑,Springer-Verlag,Berlin,Germany,2003),其以引用方式并入本文。在某些实施方案中,非常规酵母可另外(或另选地)为比由同源重组(HR)介导的修复过程更偏好非同源末端接合(NHEJ)DNA修复过程的酵母。沿这些线索(比HR优选NHEJ)定义非常规酵母-还由Chen等人(PLoS ONE8:e57952)公开,其以引用方式并入本文。本文优选的非常规酵母为耶氏酵母属(例如,解脂耶氏酵母)的那些。本文的术语“酵母”是指主要以单细胞形式存在的真菌物种。酵母可另选地在本文中被称为“酵母细胞”。
本文中,术语“RNA引导的内切核酸酶”(RGEN)是指包含至少一个CRISPR(聚集状规则间隔的短回文重复序列)缔合(Cas)蛋白质和至少一种RNA组分的复合物。简单地讲,RGEN的RNA组分包含与靶位点序列中的DNA序列互补的序列。基于该互补性,RGEN可特异性识别并切割特定DNA靶位点序列。本文的RGEN可包含四种已知的CRISPR体系(Horvath和Barrangou,Science 327:167-170)诸如I型、II型或III型CRISPR体系中任一种的一种或多种Cas蛋白质和一种或多种合适的RNA组分。在优选的实施方案中,RGEN包含Cas9内切核酸酶(CRISPR II体系)和至少一种RNA组分(例如,crRNA和tracrRNA,或gRNA)。
术语“CRISPR”(聚集状规则间隔的短回文重复序列)是指I类、II类或III类DNA切割体系的某些遗传基因座编码因子,其例如由细菌或古细菌细胞使用以破坏外来DNA(Horvath和Barrangou,Science 327:167-170)。本文利用CRISPR体系的组分用于非常规酵母细胞中的DNA靶向。
本文术语“II型CRISPR体系”和“II型CRISPR-Cas体系”互换使用并且是指利用与至少一种RNA组分复合的Cas9内切核酸酶的DNA切割体系。例如,Cas9可与CRISPR RNA(crRNA)和反式激活CRISPR RNA(tracrRNA)复合。在另一个示例中,Cas9可与向导RNA复合。因此,crRNA、tracrRNA和向导RNA是本文中RNA组分的非限制性示例。
本文的术语CRISPR缔合的(“Cas”)内切核酸酶是指由Cas基因编码的Cas蛋白质。在某些实施方案中,当与合适RNA组分复合时,Cas内切核酸酶能够切割全部或部分特定DNA靶序列。例如,其能够在特定DNA靶序列中引入单链或双链断裂;其可另选地被表征为能够切割特定DNA靶序列的一个或两条链。Cas内切核酸酶在靶序列处使DNA双链体解旋并且切割至少一个DNA链,如通过由与Cas复合的crRNA或向导RNA识别靶序列介导的。此类通过Cas内切核酸酶识别并切割靶序列通常在正确的前间区序列邻近基序(PAM)位于或邻近DNA靶序列的3′端时进行。另选地,本文的Cas蛋白质可缺乏DNA切割或切口活性,但当与合适的RNA组分复合时,仍然能够特异性结合到DNA靶序列。本文的优选的Cas蛋白质为Cas9。
本文的“Cas9”(以前称为Cas5、Csn1或Csxl2)是指为了特异性识别和切割全部或部分DNA靶序列,与crRNA和tracrRNA,或与向导RNA形成复合物的II型CRISPR体系的Cas内切核酸酶。Cas9蛋白质包含RuvC核酸酶结构域和HNH(H-N-H)核酸酶结构域,其各自在靶序列处切割单DNA链(两个结构域的协同作用导致DNA双链切割,然而一个结构域的活性导致切口)。一般来讲,RuvC结构域包含亚结构域I、II和III,其中结构域I位于Cas9的N末端附近,并且亚结构域II和III位于蛋白质的中间,HNH结构域的旁侧(Hsu等人,Cell 157:1262-1278)。“Apo-Cas9”是指不与RNA组分复合的Cas9。Apo-Cas9可结合DNA,但以非特异性方式进行该结合,并且不能切割DNA(Stemberg等人,Nature 507:62-67)。
在一些实施方案中,Cas内切核酸酶可包含Cas9多肽的改性形式。Cas9多肽的改性形式可包括降低Cas9蛋白质的天然存在的核酸酶活性的氨基酸变化(例如,缺失、插入或替换)。例如,在一些情况下,Cas9蛋白质的改性形式具有小于50%、小于40%、小于30%、小于20%、小于10%、小于5%、或小于1%的对应野生型Cas9多肽的核酸酶活性(2014年3月6日公布的美国专利申请US20140068797 A1)。在一些情况下,Cas9多肽的改性形式不具有显著的核酸酶活性并且被称为催化上“失活的Cas9”或“灭活的cas9(dCas9)。”无催化活性的Cas9变体包括在HNH和RuvC核酸酶结构域中包含突变的Cas9变体。这些无催化活性的Cas9变体能够与sgRNA相互作用并且结合到体内的靶位点但不能切割靶DNA的任一条链。该作用模式,结合但不使DNA断裂可用于瞬时减少染色体中特异性基因座的表达,但不导致永久性基因改变。
无催化活性的Cas9可融合至异源序列(2014年3月6日公布的美国专利申请US20140068797 A1)。合适的融合对象包括但不限于多肽,所述多肽提供通过直接作用于靶DNA或与靶DNA缔合的多肽(例如,组蛋白或其它DNA结合蛋白)而间接增加转录的活性。另外合适的融合对象包括但不限于,提供以下活性的多肽:甲基转移酶活性、脱甲基酶活性、乙酰转移酶活性、脱乙酰酶活性、激酶活性、磷酸酶活性、泛素连接酶活性、去泛素化活性、腺苷酰化活性、去腺苷酰化活性、SUMO化活性、去SUMO化活性、核糖基化活性、去核糖基化活性、豆蔻酰化活性、或去豆蔻酰化活性。其它合适的融合对象包括但不限于直接提供靶核酸的增加的转录的多肽(例如,转录激活因子或其片段,募集转录激活因子的蛋白质或其片段,小分子/药物应答转录调控因子等)。无催化活性的Cas9也可融合至FokI核酸酶以产生双链断裂(Guilinger等人,Nature biotechnology,第32卷,第6号,2014年6月)。
本文的术语“RNA组分”是指包含与DNA靶序列的链互补的核糖核酸序列的RGEN的RNA组分。该互补序列在本文中被称为“向导序列”或“可变靶向结构域”序列。本文的合适的RNA组分的示例包括crRNA和向导RNA。另外,本文的RNA组分不具有5’-端。
本文的术语“CRISPR RNA”(crRNA)是指可与一种或多种Cas蛋白质(例如,Cas9)形成复合物并且向所述复合物提供DNA结合特异性的RNA序列。crRNA提供DNA结合特异性,因为其包含与DNA靶序列的链互补的“向导序列”(“可变靶向结构域”[VT])。crRNA还包含由crRNA源自其中的CRISPR基因座的重复区编码的“重复序列”(“tracr RNA匹配序列”)。crRNA的重复序列可与tracrRNA的5’端处的序列退火。天然CRISPR体系中的crRNA源自由CRISPR基因座转录的“pre-crRNA”。pre-crRNA包含间隔区和重复区;间隔区包含与DNA靶位点序列互补的独特序列。天然体系中的Pre-crRNA被加工成多个不同的crRNA,其各自具有向导序列连同重复序列的一部分。CRISPR体系利用crRNA,例如用于DNA靶向特异性。
本文的术语“反式激活CRISPR RNA”(tracrRNA)是指用于II型CRISPR体系的非编码RNA,并且在5’-至-3’方向上,包含:(i)与CRISPR II型crRNA的重复区退火的序列,和(ii)包含茎环的部分(Deltcheva等人,Nature 471:602-607)。
术语“向导RNA”(gRNA)和“单向导RNA”(sgRNA)在本文中可互换使用。本文的gRNA可指包含可操作地连接至tracrRNA的crRNA的嵌合序列。另选地,gRNA可指例如crRNA和tracrRNA的合成融合体。Jinek等人(Science 337:816-821)公开了一些gRNA特征。gRNA还可根据以下特征来表征:具有向导序列(可变靶向结构域),之后是Cas内切核酸酶识别(CER)结构域[2015年2月26日公布的WO2015026883,2015年3月19日公布的美国专利申请US2015-0082478 A1,和2015年2月26日公布的US 2015-0059010 A1,其全部以引用方式全文并入本文]。CER结构域包含tracrRNA配对序列,之后是tracrRNA序列。
术语“靶位点序列”、“靶位点”、“靶序列”、“靶DNA”、“DNA靶序列”、“靶基因座”、“基因组靶位点”、“基因组靶序列”、“基因组靶基因座”和“前间区序列”在本文中可互换使用。靶位点序列是指在非常规酵母的基因组中的染色体、附加体、或任何其它DNA分子上的多核苷酸序列,本文的RGEN可对其识别、结合并任选地切口或切割。靶位点可以为:(i)酵母中的内源性/天然位点,(ii)对酵母异源的,并且因此不是天然存在于基因组中的,或(iii)与其天然存在之处相比,存在于异源基因组位置中。
本文的靶位点序列的长度为至少13个核苷酸并具有链,所述链具有与(crRNA或gRNA)的向导序列的足够互补性从而能够与向导序列杂交并引导Cas蛋白质或Cas蛋白质复合物与靶序列的序列-特异性结合(在某些实施方案中,在合适的PAM邻近靶序列时)。切割/切口位点(适用于内切核酸Cas或切口Cas)可在靶序列内(,例如使用Cas9)或者切割/切口位点可在靶序列外(例如,使用融合至异源内切核酸酶结构域的Cas9,诸如源自FokI酶的Cas9)。
本文的“人工靶位点”或“人工靶序列”是指已被引入非常规酵母的基因组中的靶序列。在一些实施方案中,人工靶序列可以为在序列上与酵母的基因组中的天然靶序列相同,但位于基因组中的不同位置(异源位置)处,或者如果位于酵母的基因组中的相同位置处,则其可不同于天然靶序列。
本文的“附加体”是指除了酵母细胞的染色体之外,可自主存在于酵母细胞中的DNA分子(可复制和传递到子细胞)。附加DNA可以是天然的或与酵母细胞异源的。本文的天然附加体的示例包括线粒体DNA(mtDNA)。本文的异源附加体的示例包括质粒和酵母人工染色体(YAC)。
本文的“前间区序列邻近基序(PAM)”是指通过本文的RGEN识别的短序列。本文的PAM的序列和长度可根据所用的Cas蛋白质或Cas蛋白质复合物而不同,但通常例如为2、3、4、5、6、7或8个核苷酸长。
术语“5’-端”和“7-甲基鸟苷酸(m7G)端”在本文中可互换使用。7-甲基鸟苷酸残基位于真核生物中信使RNA(mRNA)的5′末端。RNA聚合酶II(Pol II)转录真核生物中的mRNA。信使RNA封端通常如下进行:通过RNA末端磷酸酶去除mRNA转录物的最末端5’磷酸酯基团,保留两个末端磷酸酯。通过鸟苷酰转移酶将鸟苷一磷酸酯(GMP)添加到转录物的末端磷酸酯,从而在转录物末端处保留5′-5′三磷酸酯连接的鸟嘌呤。最终,该末端胍基的7-氮被甲基转移酶甲基化。
本文的术语“不具有5’-端”用来指具有例如5’-羟基基团,而不是5’-端的RNA。此类RNA可被称为例如“未封端的RNA”。未封端的RNA可以在转录后在核中更好的积聚,因为5′-封端的RNA经受核输出。本文的一种或多种RNA组分未封端。
术语“核酶”和“核糖核酸酶”在本文中可互换使用。核酶是指形成次级、三级和/或四级结构的一个或多个RNA序列,其可在特定位点处切割RNA。核酶包括能够在相对于核酶序列的顺式位点处切割RNA(即,自催化,或自切割)的“自切割核酶”。已经描述了核酶裂解活性的一般性质(例如,Lilley,Biochem.Soc.Trans.39:641-646)。本文的“锤头核酶”(HHR)可包含由三个碱基配对的茎和催化时涉及的高度保守的非互补核苷酸的芯组成的小催化RNA基序。Pley等人(Nature 372:68-74)和Hammann等人(RNA 18:871-885)(所述文献以引用方式并入本文)公开了锤头核酶结构和活性。本文的锤头核酶可包含“最小锤头”序列,如例如由Scott等人所公开的(Cell 81:991-1002,以引用方式并入本文)。
在本公开的一个实施方案中,所述方法包括将RNA引导的内切核酸酶(RGEN)靶向到非常规酵母中的染色体或附加体上的靶位点序列的方法,所述方法包括向所述酵母提供第一重组DNA构建体,所述第一重组DNA构建体包含编码Cas内切核酸酶的DNA序列,和至少第二重组DNA构建体,所述第二重组DNA构建体包含编码RNA组分上游的核酶的DNA序列,其中由第二重组DNA构建体转录的RNA自催化地去除核酶以产生所述RNA组分,其中RNA组分和Cas9内切核酸酶可形成RGEN,所述RGEN可结合到全部或部分靶位点序列。
在本公开的一个实施方案中,非常规酵母包含多核苷酸序列,所述多核苷酸序列包含可操作地连接至至少一个核苷酸序列的启动子,其中所述核苷酸序列包含编码在编码RNA组分的DNA序列上游的核酶的DNA序列,其中所述RNA组分包含与酵母中染色体或附加体上的靶位点序列互补的可变靶向结构域,其中所述RNA组分可形成RNA-引导的内切核酸酶(RGEN),其中所述RGEN可结合到全部或部分靶位点序列,其中由核苷酸序列转录的RNA自催化地去除核酶以产生所述RNA组分,其中所述RNA组分不具有5’端。
核酶还包括切割其自身序列的5’,去除任何前述转录物但保留完整核酶序列的核酶。
在本公开的一个实施方案中,非常规酵母包含多核苷酸序列,所述多核苷酸序列包含可操作地连接至至少一个核苷酸序列的启动子,其中所述核苷酸序列包含编码在编码RNA组分的DNA序列上游的核酶的DNA序列,其中所述RNA组分包含与酵母中染色体或附加体上的靶位点序列互补的可变靶向结构域,其中所述RNA组分可形成RNA-引导的内切核酸酶(RGEN),其中所述RGEN可结合到全部或部分靶位点序列,其中由核苷酸序列转录的RNA自催化地去除核酶以产生所述RNA组分,其中由核苷酸序列转录的RNA不自催化地去除核酶,从而产生不具有5’端的核酶-RNA组分融合分子。
术语“靶向”、“基因靶向”、“DNA靶向”、“编辑”、“基因编辑”和“DNA编辑”在本文中可互换使用。本文的DNA靶向可以为在特定DNA序列处,诸如在非常规酵母的染色体或附加体中,特异性引入插入缺失(indel)、敲除或敲入。一般来讲,DNA靶向在本文中可通过利用与合适的RNA组分缔合的Cas蛋白质在非常规酵母中的特定DNA序列处切割一个或两条链来进行。此类DNA切割,如果是双链断裂(DSB),则可促进NHEJ过程,这可导致靶位点处插入缺失(indel)形成。另外,不考虑切割是单链断裂(SSB)或DSB,在DNA缺口或切割位点处提供合适的供体DNA多核苷酸时,可促进HR过程。取决于供体DNA多核苷酸的序列,此类HR方法可用于在靶位点处引入敲除或敲入。
另选地,本文的DNA靶向可指本文的Cas/RNA组分复合物与靶DNA序列的特异性缔合,其中Cas蛋白质切割或不切割DNA链(取决于Cas蛋白质的内切核酸酶结构域的状态)。
本文的术语“插入缺失(indel)”是指在染色体或附加体的靶DNA序列中的核苷酸碱基的插入或缺失。此类插入或缺失可具有例如1、2、3、4、5、6、7、8、9、10或更多个碱基。在某些实施方案中,插入缺失可甚至更大,至少约20、30、40、50、60、70p、80、90或100个碱基,如果在基因的开放阅读框(ORF)内引入插入缺失时,则有时插入缺失通过形成移码突变来破坏由ORF编码的蛋白质的野生型表达。
术语“敲除”、“基因敲除”和“基因组敲除”在本文中可互换使用。敲除表示通过利用Cas蛋白质靶向而使本文的非常规酵母的DNA序列部分或完全不起作用;此类DNA序列在敲除之前例如可编码氨基酸序列,或可具有调控功能(例如,启动子)。可通过插入缺失(通过NHEJ)或通过特异性去除序列产生敲除,其减少或完全破坏靶位点处或附近的序列功能。本文的敲除DNA多核苷酸序列可另选地表征为例如部分或完全破坏或减量调节。
在一个实施方案中,本公开涉及一种非常规酵母,其包含Cas9内切核酸酶和多核苷酸序列,所述多核苷酸序列包含可操作地连接至至少一个核苷酸序列的启动子,其中所述核苷酸序列包含编码在编码RNA组分的DNA序列上游的核酶的DNA序列,其中所述RNA组分包含与酵母中染色体或附加体上的靶位点序列互补的可变靶向结构域,其中所述RNA组分可与Cas内切核酸酶形成RNA-引导的内切核酸酶(RGEN),其中所述RGEN可结合到靶位点序列。Cas9内切核酸酶可作为蛋白质引入酵母中或可经由重组DNA构建体引入。Cas9内切核酸酶可通过本领域已知的任何方法以稳定或瞬时方式表达。
术语“敲入”、“基因敲入”和“基因组敲入”在本文中可互换使用。敲入表示通过利用Cas蛋白质靶向置换或插入非常规酵母中的特定DNA序列处的DNA序列。敲入的示例为在基因的编码区中特异性插入异源氨基酸编码序列,或在遗传基因座中特异性插入转录调控元件。
术语“供体多核苷酸”、“供体DNA”、“靶向多核苷酸”和“靶向DNA”在本文中可互换使用。供体多核苷酸是指包含与位于或靠近DNA靶位点处的序列同源的至少一个序列的DNA序列(例如,由本文的Cas蛋白质特异性靶向的序列)。包括多核苷酸(在与待编辑的核苷酸序列相比时,包含至少一个核苷酸修饰)的供体DNA多核苷酸也称为“多核苷酸修饰模板”、“多核苷酸修饰模板DNA”或“模板DNA”。核苷酸修饰可为至少一个核苷酸的替换、添加或缺失。任选地,多核苷酸修饰模板还可包含至少一种核苷酸修饰旁侧的同源核苷酸序列,其中旁侧同源核苷酸序列向待编辑的所需核苷酸序列提供充分的同源性。
本文的供体多核苷酸内的“同源序列”可包含或由至少约25个核苷酸的序列组成,所述序列与位于或靠近靶位点处的序列具有100%同一性,或与位于或靠近靶位点处的序列具有至少约95%、96%、97%、98%或99%同一性。
在某些实施方案中,供体DNA多核苷酸可具有由与靶位点处的序列异源的序列隔开的两个同源序列。此类供体多核苷酸的这两个同源序列可被称为“同源臂”,其侧接异源序列。靶位点与具有两个同源臂的供体多核苷酸之间的HR通常导致靶位点处的序列被供体多核苷酸的异源序列置换(位于与供体多核苷酸的同源臂同源的DNA序列之间的靶位点序列由供体多核苷酸的异源序列置换)。在具有两个同源臂的供体多核苷酸中,所述臂可由1个或多个核苷酸隔开(即,供体多核苷酸中的异源序列的长度可以为至少1个核苷酸)。可在本文的非常规酵母中进行的各种HR程序公开于例如,DNA Recombination:Methods and Protocols:第1版(H.Tsubouchi编辑,Springer-Verlag,New York,2011)中,其以引用方式并入本文。
在一个实施方案中,供体DNA构建体包含待插入Cas内切核酸酶的靶位点中的目的多核苷酸,其中供体DNA构建体还包括侧接目的多核苷酸的第一同源性区域和第二同源性区域。供体DNA的第一同源性区域和第二同源性区域分别与存在于植物基因组的靶位点中或旁侧的第一基因组区域和第二基因组区域共享同源性。
术语“以体积计的百分比”、“体积百分比”、“体积%”和“v/v%”在本文中可互换使用。溶液中溶质的体积百分比可使用下式确定:[(溶质体积)/(溶液体积)]×100%。
术语“以重量计的百分比”、“重量百分比(重量%)”以及“重量-重量百分比(重量/重量%)”在本文中可互换使用。重量%是指物质在其被包含于组合物、混合物或溶液中时以质量计的百分比。
术语“多核苷酸”、“多核苷酸序列”和“核酸序列”在本文中可互换使用。这些术语涵盖核苷酸序列等。多核苷酸可为DNA或RNA的聚合物,所述DNA或RNA可为单链或双链,任选地包含合成的、非天然的或改变的核苷酸碱基。多核苷酸可由cDNA、基因组DNA、合成DNA、或它们的混合物的一个或多个片段构成。核苷酸(核糖核苷酸或脱氧核糖核苷酸)可以用如下单字母名称来表示:“A”表示腺苷酸或脱氧腺苷酸(分别针对RNA或DNA),“C”表示胞苷酸或脱氧胞苷酸(分别针对RNA或DNA),“G”表示鸟苷酸或脱氧鸟苷酸(分别针对RNA或DNA),“U”表示尿苷酸(针对RNA),“T”表示脱氧胸苷酸(针对DNA),“R”表示嘌呤(A或G),“Y”表示嘧啶(C或T),“K”表示G或T,“H”表示A或C或T,“I”表示肌苷,“W”表示A或T,并且“N”表示任意核苷酸(例如,如果涉及DNA序列,N可以为A、C、T或G;如果涉及RNA序列,N可以为A、C、U或G)。本文所公开的任何RNA序列(例如,crRNA、tracrRNA、gRNA)可通过合适的DNA序列编码。
如本文所用,术语“分离的”是指已经从其天然来源全部或部分纯化的多核苷酸或多肽分子。在一些情况下,分离的多核苷酸或多肽分子是较大组合物、缓冲体系或试剂混合物的一部分。例如,分离的多核苷酸或多肽分子可以异源方式包含在细胞或生物体内。
如本文所用,术语“基因”是指由编码区表达RNA(RNA由DNA多核苷酸序列转录)的DNA多核苷酸序列,所述RNA可以为信使RNA(编码蛋白质)或非蛋白质编码RNA(例如,本文的crRNA、tracrRNA或gRNA)。基因可指单独的编码区,或可包括在编码区上游和/或下游的调控序列(例如,启动子、5’-非翻译区、3’-翻译终止子区)。编码蛋白质的编码区可另选地在本文中被称为“开放阅读框”[ORF]。“天然的”或“内源性的”基因是指天然存在的具有其自身调控序列的基因;此类基因位于其在宿主细胞的基因组中的天然位置处。“嵌合基因”是指不是天然基因的任何基因,包含在天然情况下不是一起存在的调控序列和编码序列(即,调控区和编码区彼此异源)。因此,嵌合基因可包括源于不同来源的调控序列和编码序列,或者包括源于同一来源但以不同于天然存在的方式排列的调控序列和编码序列。“外来”或“异源”基因是指通过基因转移引入宿主生物体中的基因。外来基因可包括插入非天然生物体内的天然基因、引入天然宿主内的新位置中的天然基因、或嵌合基因。本文所公开的某些实施方案中的多核苷酸序列为异源的。“转基因”是已通过转化方法被引入基因组中的基因。“密码子优化的”开放阅读框具有经设计用以模仿宿主细胞优选的密码子使用频率的其密码子使用频率。
天然氨基酸序列或多核苷酸序列是天然存在的,而非天然氨基酸序列或多核苷酸序列在自然界中不存在。
如本文所用的“调控序列”是指位于基因的转录起始位点上游(例如启动子)、5′非翻译区和3′非编码区的核苷酸序列,并且其可影响由基因转录的RNA的转录、加工或稳定性,或者翻译。本文的调控序列可包括启动子、增强子、沉默子、5′非翻译前导序列、内含子、多腺苷酸化识别序列、RNA加工位点、效应子结合位点、茎-环结构以及参与基因表达调控的其它元件。本文的一个或多个调控元件可以是与本文的编码区异源的。
如本文所用,“启动子”是指能够控制由基因转录RNA的DNA序列。一般来讲,启动子序列在基因的转录起始位点的上游。启动子可整个源于原生基因,或者由源于天然存在的不同启动子的不同元件构成,或者甚至包含合成的DNA片段。造成基因在大多数时间在大多数细胞类型中表达的启动子通常称为“组成型启动子”。本文的一个或多个启动子可以是与本文的编码区异源的。
如本文所用,“强启动子”是指每单位时间可引导相对大量的生产性启动的启动子,和/或为驱动比酵母中基因的平均转录水平更高基因转录水平的启动子。
如本文所用,术语“3′非编码序列”、“转录终止子”和“终止子”是指位于编码序列下游的DNA序列。这包括多腺苷酸化识别序列和编码能够影响mRNA加工或基因表达的调控信号的其它序列。
如本文所用,术语“盒”是指可操作地连接至编码蛋白质的序列或非蛋白质编码RNA的启动子。盒可任选地可操作地连接至3’非编码序列。
如本文所用,与多核苷酸相关的术语“上游”和“下游”分别是指“5’的”和“3’的”。
如本文所用,术语“表达”是指(i)由编码区转录RNA(例如,mRNA或非蛋白质编码RNA,诸如crRNA、tracrRNA或gRNA),或(ii)由mRNA翻译多核苷酸。
当用于描述基因或多核苷酸序列的表达时,术语“减量调节”、“破坏”、“抑制”、“失活”和“沉默”在本文中可互换使用,是指多核苷酸序列的转录减少或消除的情况。这导致减少或消除来自多核苷酸序列的RNA转录物,从而导致减少或消除源自多核苷酸序列的蛋白质表达(在基因包含ORF时)。另选地,减量调节可指其中来自由多核苷酸序列产生的转录物的蛋白质翻译减少或消除的情况。另选地,减量调节可指其中由多核苷酸序列表达的蛋白质活性下降的情况。细胞中上述过程中任一种(转录、翻译、蛋白质活性)的减少可以为相对于合适的对照细胞的转录、翻译或蛋白质活性减少约40%、50%、60%、70%、80%、90%、95%或100%。减量调节可以为如本文所公开的靶向事件的结果(例如,插入缺失、敲除)。
术语“对照细胞”和“合适的对照细胞”在本文中互换使用并且可指其中已经进行了特定修饰的细胞(例如过表达的多核苷酸、减量调节的多核苷酸)(即,“实验细胞”)。对照细胞可为不具有或不表达实验细胞的特定修饰的任何细胞。因此,对照细胞可为未转化的野生型细胞或可为经基因转化但不表达基因转化的细胞。例如,对照细胞可为实验细胞的直系亲本,该直系亲本细胞不具有实验细胞中的特定修饰。作为另外一种选择,对照细胞可为通过一代或多代去除的实验细胞的亲本。作为另外一种选择,对照细胞可为实验细胞的同胞细胞,该同胞细胞不包含存在于实验细胞中的特定修饰。
如本文所用,术语“增加”可指增加的数量或活性与相比较的数量或活性相比,数量或活性高至少1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%或20%。术语“增加的”、“大于”、和“提高的”本文互换使用。术语“增加的”可用于表征编码蛋白质的多核苷酸的表达,例如,其中“提高的表达”也可意指“过表达”。
如本文所用,术语“可操作地连接”是指两个或更多个核酸序列缔合使得一个核酸序列的功能受另一个核酸序列影响。例如,当启动子能够影响编码序列的表达时,它可操作地与编码序列连接。即,编码序列处于启动子的转录控制下。编码序列可例如可操作地连接至调控序列。另外,例如,crRNA可以可操作地连接(融合至)本文的tracrRNA,使得crRNA的tracrRNA配对序列与tracrRNA的5’序列退火。此类可操作的连接可包含合适的成环序列,诸如GAAA(SEQ ID NO:43)、CAAA(SEQ ID NO:44)、或AAAG(SEQ ID NO:45)。
如本文所用,术语“重组”是指例如通过化学合成或通过用基因工程技术操纵分离的核酸片段而实现的两个原本分离的序列片段的人工组合。术语“重组的”、“转基因的”、“转化的”、“工程化的”或“修饰用于外源基因表达的”在本文中可互换使用。
用于制备本文的重组构建体/载体(例如,编码本文的核酶-RNA组分盒的DNA多核苷酸,或编码本文的Cas蛋白质的DNA多核苷酸)的方法可按照标准重组DNA和分子克隆技术,如由J.Sambrook和D.Russell(Molecular Cloning:A Laboratory Manual,第3版,ColdSpring Harbor Laboratory Press,Cold Spring Harbor,NY,2001);T.J.Silhavy等人(Experiments with Gene Fusions,Cold Spring Harbor Laboratory Press,ColdSpring Harbor,NY,1984);和F.M.Ausubel等人(Short Protocols in Molecular Biology,第5版,Current Protocols,John Wiley and Sons,Inc.,NY,2002)所述的。
如本文所用,术语“转化”指将核酸分子转移至宿主生物体或宿主细胞中。例如,核酸分子可以为在细胞中自主复制,或整合到宿主生物体/细胞的基因组中,或在细胞中瞬时存在但不复制或整合的核酸分子。适用于转化的核酸分子的非限制性示例在本文中公开,诸如质粒和线性DNA分子。包含转化的核酸片段的宿主生物体/细胞(例如本文的非常规酵母)可被称为“转基因”、“重组”、“转化”或“转化体”。
如本文所用,相对于多核苷酸或多肽序列的术语“序列同一性”或“同一性”是指在指定的比较窗口上为获得最大对应而比对时两个序列中相同的核酸残基或氨基酸残基。因此,“序列同一性百分比”或“同一性百分比”指通过在比较窗口上比较两个最佳对齐的序列而测得的值,其中在与参考序列(其不包含添加或缺失)进行比较时,比较窗口中的多核苷酸或多肽序列的部分可包含添加或缺失(即空位)以实现两个序列的最佳比对。通过以下方式计算这种百分比:确定在两个序列中出现相同核酸碱基或氨基酸残基的位置的数目以得到匹配的位置的数目,将匹配的位置的数目除以比较窗口中位置的总数目,然后将结果乘以100以得到序列同一性百分比。应当理解,当计算DNA序列和RNA序列之间的序列同一性时,将DNA序列的T残基与RNA的U残基比对,并且可认为与RNA序列的U残基“相同”。出于测定第一核苷酸和第二核苷酸的互补度百分比的目的,可通过测定下列来获得该百分比:(i)例如,第一多核苷酸和第二多核苷酸的互补序列之间的同一性百分比(或反之亦然),和/或(ii)可形成标准Watson和Crick碱基对的第一多核苷酸和第二多核苷酸之间的碱基的百分比。
在National Center for Biotechnology Information(NCBI)网站在线可用的Basic Local Alignment Search Tool(BLAST)算法可用于例如测量本文所公开的两个或更多个多核苷酸序列(BLASTN算法)或多肽序列(BLASTP算法)之间的同一性百分比。另选地,序列间的同一性百分比可使用Clustal算法(例如ClustalW或ClustalV)进行计算。对于使用Clustal比对方法的多重比对,默认值可对应于空位罚分=10、以及空位长度罚分=10。用Clustal方法进行成对比对和蛋白质序列的同一性百分比计算的默认参数可为KTUPLE=1、空位罚分=3、窗口=5、以及保留对角线=5。对于核酸,这些参数可为KTUPLE=2,空位罚分=5,窗口=4、以及保留对角线=4。另选地,序列间的同一性百分比可以利用EMBOSS算法(例如,needle)进行,其中参数诸如空位开放=10、空位延伸=0.5、END GAPPENALTY=false、END GAP OPEN=10、END GAP EXTEND=0.5,利用BLOSUM矩阵(例如,BLOSUM62)。
本文中,与第二序列“互补”的第一序列可另选地被称为与第二序列呈“反义”取向。
本文公开了多种多肽氨基酸序列和多核苷酸序列作为所公开发明的某些实施方案的特征。可使用这些序列的与本文公开的序列至少约70%-85%、85%-90%或90%-95%相同的变体。或者,变体氨基酸序列或多核苷酸序列可与本文公开的序列具有至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。变体氨基酸序列或多核苷酸序列可具有与公开序列相同的功能/活性,或者具有公开序列的功能/活性的至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%。
例举了在本文的Cas9蛋白质的每个氨基酸位置处的本文所公开的所有氨基酸残基。鉴于某些氨基酸彼此共享类似的结构和/或电荷特征(即保守的),在Cas9中的每个位置处的氨基酸可以公开的序列提供或用保守的氨基酸残基替换(“保守氨基酸替换”),如下:
1.下列小的脂族、非极性或微极性残基可以相互替换:Ala(A)、Ser(S)、Thr(T)、Pro(P)、Gly(G);
2.下列极性、带负电的残基和它们的酰胺可相互替换:Asp(D)、Asn(N)、Glu(E)、Gln(Q);
3.下列极性、带正电的残基可相互替换:His(H)、Arg(R)、Lys(K);
4.下列脂族、非极性的残基可相互替换:Ala(A)、Leu(L)、Ile(I)、Val(V)、Cys(C)、Met(M);并且
5.下列大的芳族残基可相互替换:Phe(F)、Tyr(Y)、Trp(W)。
如下文实施例1中所示,使用Pol III启动子-转录gRNA在非常规酵母诸如解脂耶氏酵母中进行Cas9-介导的DNA靶向已被证明是困难的。因此,用于产生Cas9的RNA组分的其它方式对于在非常规酵母中提供Cas9介导的DNA靶向是有意义的。
所公开发明的实施方案涉及非常规酵母,其包含至少一种RNA引导的内切核酸酶(RGEN),所述RNA引导的内切核酸酶包含至少一种不具有5’端的RNA组分。该未封端的RNA组分包含与酵母中染色体或附加体中的靶位点序列互补的序列。RGEN可结合到,并任选地切割全部或部分靶位点序列。
显著地,RGEN介导的DNA靶向在这些非常规酵母中进行,如通过在RGEN靶位点序列和外源提供的供体DNA序列之间的插入缺失形成或增加的同源重组(HR)水平所表现的。在本公开之前,非常规酵母通常难以通过HR基因靶向,通常依赖于靶位点处的随机的不频繁DNA断裂来促进其利用供体DNA进行HR。这是由于非常规酵母具有低HR活性并且反而有利于非同源端部接合(NHEJ)活性。因此,在非常规酵母中通过HR进行基因靶向现在可如在与NHEJ过程相比偏好HR的常规酵母诸如酿酒酵母中一样可行。虽然不受任何理论的束缚,但据信在非常规酵母细胞中提供至少一种不具有5’端的RNA组分导致RNA组分在所述RNA可参与RGEN介导的DNA靶向的核中更好的积聚。
已经描述了RNA处理工具,诸如基于Csy4(Cas6)的RNA处理工具(Nissim等人,2014,Molecular Cell 54:698-710)。Csy4结合pre-crRNA茎环重复序列并特异性切割其同源底物以产生包含侧接有重复序列的片段的间隔序列的成熟crRNA(Sternberg等人,2012.RNA,18(4):661-72)。本文公开了(实施例12)使用Csy4以处理向导RNA,使得其产生不具有5’端的RNA组分(向导RNA),其中RNA组分可形成RGEN,所述RGEN可结合到并切割非常规酵母的基因组中的靶位点。
本文的非常规酵母不是“常规”(“模型”)酵母,诸如酵母属(例如酿酒酵母,也称为芽殖酵母、面包酵母、和/或啤酒酵母)或裂殖酵母(例如,粟酒裂殖酵母(S.pombe),其也称为裂殖酵母)物种。在某些实施方案中,常规酵母是与由NHEJ介导的修复过程相比偏好HRDNA修复过程的酵母。
在某些实施方案中,非常规酵母可以是与由HR介导的修复过程相比偏好NHEJ DNA修复过程的酵母。常规酵母诸如酿酒酵母和粟酒裂殖酵母通常表现出供体DNA与短旁侧同源臂(30-50bp)以超过70%的常规效率特异性整合,然而非常规酵母如巴斯德毕赤酵母、多形汉逊酵母、解脂耶氏酵母、树干毕赤酵母和乳酸克鲁维酵母通常示出与相似结构化供体DNA以小于1%的效率特异性整合(Chen等人,PLoS ONE 8:e57952)。因此,可以例如通过利用合适的供体DNA转化酵母并确定其与预测由供体DNA靶向的基因组位点特异性重组的程度来判定对HR过程的偏好。例如,如果此类测定在酵母基因组中产生供体DNA的高度随机整合,则可表现出对NHEJ的偏好(或对HR的低偏好)。用于确定酵母中DNA的特异性(HR-介导的)和/或随机(NHEJ-介导的)整合率的测定是本领域已知的(例如,Ferreira和Cooper,Genes Dev.18:2249-2254;Corrigan等人,PLoS ONE 8:e69628;Weaver等人,Proc.Natl.Acad.Sci.U.S.A.78:6354-6358;Keeney和Boeke,Genetics 136:849-856)。
鉴于其低水平的HR活性,本文的非常规酵母可(i)表现出例如小于约1%、2%、3%、4%、5%、6%、7%或8%的由具有30-50bp旁侧同源臂的适宜供体DNA进行的特异性靶向率,和/或(ii)表现出例如大于约65%、66%、67%、68%、69%、70%、71%、72%、73%、74%或75%的前述供体DNA的随机整合率。适宜供体DNA的这些(i)特异性靶向率和/或(ii)随机整合率可在非常规酵母被提供如本文所公开的RGEN之前存在时来表征所述非常规酵母。在某些实施方案中,对非常规酵母提供RGEM的目的是形成位点特异性DNA单链断裂(SSB)或双链断裂(DSB),用于使酵母在特定位点处偏向HR。因此,包含本文的适宜RGEN的非常规酵母通常应表现出利用特定供体DNA的增加的HR率。此类增加的比率可以比合适的对照(例如,利用相同供体DNA,但缺乏合适RGEN转化的相同非常规酵母)中的HR率高至少约2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍或10倍。
在本文的某些方面,非常规酵母可以是无性繁殖(无性型)或有性繁殖(有性型)的非常规酵母。虽然本文的非常规酵母通常以单细胞形式存在,但这些酵母的某些类型可任选地能够形成假菌丝(连接的芽殖细胞串)。在其它方面,非常规酵母可以为单倍体或二倍体,和/或可以具有以这些倍数性形式中的任一种存在的能力。
本文的非常规酵母可以本领域中已知的任何方式培养,诸如Non-Conventional Yeasts in Genetics,Biochemistry and Biotechnology:Practical Protocols(K.Wolf、K.D.Breunig、G.Barth编辑,Springer-Verlag,Berlin,Germany,2003),Yeasts in Natural and Artificial Habitats(J.F.T.Spencer、D.M.Spencer编辑,Springer-Verlag,Berlin,Germany,1997),和/或Yeast Biotechnology:Diversity and Applications(T.Satyanarayana、G.Kunze编辑,Springer,2009)中所述的,其全部均以引用方式全文并入本文。
本文的非常规酵母的非限制性示例包括以下属的酵母:耶氏酵母属、毕赤酵母属、许旺氏酵母属、克鲁维酵母属、Arxula属、丝孢酵母属、假丝酵母属、黑粉菌属、球拟酵母属、接合酵母属、三角酵母属、隐球酵母属、红酵母属、法夫酵母属、掷孢酵母属和管囊酵母属。耶氏酵母属物种的合适的示例为解脂耶氏酵母。毕赤酵母属物种的适宜示例包括:巴斯德毕赤酵母、甲醇毕赤酵母、木糖发酵酵母、异常毕赤酵母和安格斯毕赤酵母。许旺氏酵母属(Schwanniomyces)物种的合适示例包括卡斯坦氏许旺酵母(S.castellii)、河岸许旺酵母(S.alluvius)、人许旺酵母(S.hominis)、西方许旺酵母(S.occidentalis)、S.capriottii、埃切许旺酵母(S.etchellsii)、多形许旺酵母(S.polymorphus)、拟多形许旺酵母(S.pseudopolymorphus)、范丽德许旺酵母(S.vanrijiae)和山田许旺酵母(S.yamadae)。克鲁维酵母属(Kluyveromyces)物种的合适示例包括乳酸克鲁维酵母(K.lactis)、马克斯克鲁维酵母(K.marxianus)、脆壁克鲁维酵母(K.fragilis)、果蝇克鲁维酵母(K.drosophilarum)、耐热克鲁维酵母(K.thermotolerans)、K.phaseolosporus、范式克鲁维酵母(K.vanudenii)、克鲁雄酵母(K.waltii)、非洲克鲁维酵母(K.africanus)和多孢克鲁维酵母(K.polysporus)。Arxula物种的合适示例包括A.adeninivorans和A.terrestre。丝孢酵母属(Trichosporon)物种的合适示例包括皮状丝孢酵母(T.cutaneum)、头状丝孢酵母(T.capttatum)、皮瘤丝孢酵母(T.inkin)和T.beemeri。假丝酵母属(Candida)物种的合适示例包括白假丝酵母(C.albicans)、C.ascalaphidarum、C.amphixiae、南极假丝酵母(C.antarctica)、C.argentea、大西洋假丝酵母(C.atlantica)、C.atmosphaerica、蟑螂假丝酵母(C.blattae)、C.bromeliacearum、果生假丝酵母(C.carpophila)、C.carvajalis、C.cerambycidarum、C.chauliodes、延胡索假丝酵母(C.corydali)、C.dosseyi、都柏林假丝酵母(C.dubliniensis)、C.ergatensis、C.fructus、光滑假丝酵母(C.glabrata)、发酵假丝酵母(C.fermentati)、吉利蒙假丝酵母(C.guilliermondii)、黑马朗假丝酵母(C.haemulonii)、C.insectamens、昆虫假丝酵母(C.insectorum)、中型假丝酵母(C.intermedia)、C.jeffresii、乳酒假丝酵母(C.kefyr)、C.keroseneae、克鲁斯假丝酵母(C.krusei)、葡萄牙假丝酵母(C.lusitaniae)、C.lyxosophila、麦芽糖假丝酵母(C.maltosa)、C.marina、璞膜假丝酵母(C.membranlfaciens)、梅林假丝酵母(C.milleri)、莫格假丝酵母(C.mogii)、嗜油假丝酵母(C.oleophila)、俄勒同假丝酵母(C.oregonensis)、近平滑假丝酵母(C.parapsilosis)、桔假丝酵母(C.quercitrusa)、皱褶假丝酵母(C.rugosa)、清酒假丝酵母(C.sake)、休哈塔假丝酵母(C.shehatea)、C.temnochilae、纤细假丝酵母(C.tenuis)、C.theae、C.tolerans、热带假丝酵母(C.tropicalis)、C.tsuchiyae、C.sinolaborantium、酱油假丝酵母(C.sojae)、C.subhashii、维斯假丝酵母(C.viswanathii)、产朊假丝酵母(C.utilis)、C.ubatubensis和酵母类假丝酵母(C.zemplinina)。黑粉菌属(Ustilago)物种的合适示例包括燕麦散黑粉菌(U.avenae)、菰黑粉菌(U.esculenta)、大麦坚黑粉菌(U.hordei)、玉米黑粉菌(U.maydis)、大麦散黑粉菌(U.nuda)和小麦散黑粉菌(U.tritici)。球拟酵母属(Torulopsis)物种的合适示例包括T.Geochares、T.azyma、光滑球拟酵母(T.glabrata)和白球拟酵母(T.candida)。接合酵母属(Zygosaccharomyces)物种的合适示例包括拜耳接合酵母(Z.bailii)、二孢接合酵母(Z.bisporus)、产香接合酵母(Z.cidri)、发酵接合酵母(Z.fermentati)、佛罗伦萨接合酵母(Z.florentinus)、Z.kombuchaensis、缓慢接合酵母(Z.lentus)、蜂蜜接合酵母(Z.mellis)、小椭圆接合酵母(Z.microellipsoides)、Z.mrakii、假鲁氏接合酵母(Z.pseudorouxii)和鲁氏接合酵母(Z.rouxii)。三角酵母属(Trigonopsis)物种的合适示例包括变异三角酵母(T.variabilis)。隐球酵母属(Cryptococcus)物种的合适示例包括罗伦隐球酵母(C.laurentii)、浅白隐球酵母(C.albidus)、新型隐球酵母(C.neoformans)、格特隐球酵母(C.gattii)、指甲隐球酵母(C.uniguttulatus)、C.adeliensis、浅黄隐球酵母(C.aerius)、C.albidosimilis、南极隐球酵母(C.antarcticus)、水生隐球酵母(C.aquaticus)、黑隐球酵母(C.ater)、C.bhutanensis、C.consortionis、弯曲隐球酵母(C.curvatus)、C.phenolicuS、斯金纳隐球酵母(C.skinneri)、地生隐球酵母(C.terreus)和C.Vishniacci。红酵母属(Rhodotorula)物种的合适示例包括瘦果红酵母(R.acheniorum)、R.tula、R.acuta、美洲红酵母(R.americana)、南美杉红酵母(R.araucariae)、北极红酵母(R.arctica)、R.armeniaca、橙黄红酵母(R.aurantiaca)、黑木耳红酵母(R.auriculariae)、R.bacarum、海洋红酵母(R.benthica)、R.biourgei、茂物红酵母(R.bogoriensis)、R.bronchialis、巴方氏红酵母(R.buffonii)、巨白蛤红酵母(R.calyptogenae)、R.chungnamensis、R.cladiensis、珊瑚红酵母(R.corallina)、R.cresolica、R.crocea、R.cycloclastica、R.dairenensis、流散红酵母(Rdiffluens)、R.evergladiensis、R.ferulica、R.foliorum、草莓红酵母(R.fragaria)、粪球红酵母(R.fujisanensis)、R.futronensis、R.gelatinosa、R.glacialis、胶粘红酵母(R.glutinis)、瘦弱红酵母(R.gracilis)、禾本红酵母(R.graminis)、R.grinbergsii、R.himalayensis、R.hinnulea、R.histolytica、R.hylophila、R.incarnata、牧草红酵母(R.mgeniosa)、爪哇红酵母(R.javanica)、小石川氏红酵母(R.koishikawensis)、乳糖红酵母(R.lactosa)、瓣鳃红酵母(R.lamellibrachiae)、R.laryngis、木生红酵母(Rlignophila)、亚麻红酵母(R.lini)、R.longissima、路德氏红酵母(R.ludwigii)、R.lysinophila、海滨红酵母(R.marina)、R.martyniae-fragantis、R.matritensis、R.meli、小红酵母(R.minuta)、胶红酵母(R.mucilaginosa)、R.nitens、R.nothofagi、R.oryzae、太平洋红酵母(R.pacifica)、浅红红酵母(R.pallida)、对虾红酵母(R.peneaus)、R.philyla、R.phylloplana、皮拉特红酵母(R.pilatii)、果蝇红酵母(R.pilimanae)、松树红酵母(R.pinicola)、R.plicata、多形红酵母(R.polymorpha)、R.psychrophenolica、R.psychrophila、R.pustula、R.retinophila、R.rosacea、R.rosulata、R.rubefaciens、R.rubella、R.rubescens、深红酵母(R.rubra)、R.rubrorugosa、R.rufula、R.rutila、R.sanguinea、R.sanniei、R.sartoryi、R.silvestris、单纯红酵母(R.simplex)、中国红酵母(R.sinensis)、斯鲁菲亚红酵母(R.slooffiae)、R.sonckii、R.straminea、R.subericola、R.suganii、台湾红酵母(R.taiwanensis)、R.taiwaniana、R.terpenoidalis、R.terrea、R.texensis、R.tokyoensis、R.ulzamae、R.vanillica、R.vuilleminii、亚罗红酵母(R.yarrowii)、云南红酵母(R.yunnanensis)和R.Zsoltii。法夫酵母属(Phaffia)物种的合适示例包括红法夫酵母(P.rhodozyma)。掷孢酵母属(Sporobolomyces)物种的合适示例包括浅红掷孢酵母(S.alborubescens)、版纳掷孢酵母(S.bannaensis)、北京掷孢酵母(S.beijingensis)、秋枫掷孢酵母(S.bischofiae)、棒状掷孢酵母(S.clavatus)、S.coprosmae、S.coprosmicola、S.corallinus、S.dimmenae、S.dracophylli、长形掷孢酵母(S.elongatus)、纤细掷孢酵母(S.gracilis)、肌醇掷孢酵母(S.inositophilus)、约氏掷孢酵母(S.johnsonii)、S.koalae、S.magnisporus、S.novozealandicus、香气掷孢酵母(S.odorus)、S.patagonicus、S.productus、玫红掷孢酵母(S.roseus)、S.sasicola、S.shibatanus、独特掷孢酵母(S.singularis)、S.subbrunneus、对称掷孢酵母(S.symmetricus)、S.syzygii、S.taupoensis、铁杉布勒掷抱酵母(S.tsugae)、S.Xanthus和云南掷孢酵母(S.yunnanensis)。管囊酵母属(Pachysolen)物种的合适示例包括嗜鞣管囊酵母(P.tannophilus)。
在本文所公开的某些实施方案中,优选解脂耶氏酵母。合适的解脂耶氏酵母的示例包括以下得自美国典型培养物保藏中心(ATCC,Manassas,VA)的分离物:菌株名称:ATCC#20362、#8862、#8661、#8662、#9773、#15586、#16617、#16618、#18942、#18943、#18944、#18945、#20114、#20177、#20182、#20225、#20226、#20228、#20327、#20255、#20287、#20297、#20315、#20320、#20324、#20336、#20341、#20346、#20348、#20363、#20364、#20372、#20373、#20383、#20390、#20400、#20460、#20461、#20462、#20496、#20510、#20628、#20688、#20774、#20775、#20776、#20777、#20778、#20779、#20780、#20781、#20794、#20795、#20875、#20241、#20422、#20423、#32338、#32339、#32340、#32341、#34342、#32343、#32935、#34017、#34018、#34088、#34922、#34922、#38295、#42281、#44601、#46025、#46026、#46027、#46028、#46067、#46068、#46069、#46070、#46330、#46482、#46483、#46484、#46436、#60594、#62385、#64042、#74234、#76598、#76861、#76862、#76982、#90716、#90811、#90812、#90813、#90814、#90903、#90904、#90905、#96028、#201241、#201242、#201243、#201244、#201245、#201246、#201247、#201249、和/或#201847。
解脂耶氏酵母以及本文的任何其它非常规酵母可以是产油的(例如,产生其干细胞重量的至少25%的油)和/或产生一种或多种多不饱和脂肪酸(例如ω-6或ω-3)。此类油性可以是由于将酵母遗传工程化以产生与其野生型形式相比升高的脂质的量。产油解脂耶氏酵母菌株的示例公开与美国专利申请公布2009/0093543、2010/0317072、2012/0052537和2014/0186906中,所述文献均以引用方式并入本文。
本文所公开的非常规酵母的实施方案还可应用于其它微生物,诸如真菌。在某些实施方案中,真菌可以是相比于由HR介导的修复过程偏好NHEJ DNA修复过程的真菌。本文的真菌可以为担子菌、接合菌、壶菌纲或子囊菌真菌。本文所述的丝状真菌的示例包括以下属的那些:木霉属、金孢子菌属、梭孢壳菌属、脉孢菌(例如,粗糙脉孢菌、好食链孢霉)、栗疫属(例如,栗疫病菌)、短梗霉属(例如,出芽短梗霉菌)、Filibasidium、Piromyces、隐球菌、支顶孢属、Tolypocladium、小柱孢属、裂褶菌、侧孢霉属、青霉属(例如,比莱青霉、沙门柏干酪青霉菌、石斛青霉、产黄青霉、扩展青霉、绳状青霉菌、灰绿青霉、马尔尼菲青霉、娄地青霉、纯绿青霉、鲜绿青霉)、赤霉属(例如,G.acuminata、燕麦赤霉、桑生浆果赤霉、G.circinata、G.cyanogena、藤仓赤霉、错综赤霉、G.pulicaris、束梗镰孢赤霉、G.tricincta、玉米赤霉)、毁丝霉属、毛霉属(例如,鲁西氏毛霉菌、卷枝毛霉菌)、曲霉属(例如黑曲霉、米曲霉、构巢曲霉、黄曲霉、浅曲霉、土曲霉、棒曲霉、烟曲霉)、镰孢属(例如禾谷镰刀菌、尖孢镰刀菌、F.bubigenum、茄腐镰孢菌、尖孢镰刀菌、轮枝样镰刀菌、层生镰刀菌、F.venenatum)、和腐质霉属、以及其无性型和有性型。如果需要,可通过如Barnett和Hunter(Illustrated Genera of Imperfect Fungi,第3版,Burgess Publishing Company,1972)中所公开的形态来限定本文真菌的属和物种。真菌可以任选地被表征为有害生物/病原体,诸如动物(例如,人类)的有害生物/病原体。
在本文的某些方面,木霉属(Trichoderma)物种包括侵占木霉(T.aggresslvum)、T.amazonlcum、棘孢木霉(T.asperellum)、深绿木霉(T.atroviride)、黄绿木霉(T.aureoviride)、澳洲康宁木霉(T.austrokoningii)、短蜜木霉(T.brevicompactum)、雪白木霉(T.candidum)、加勒比木霉(T.caribbaeum)、低头木霉(T.catoptron)、奶油木霉(T.cremeum)、陶瓷木霉(T.ceramicum)、蜡素木霉(T.cerinum)、绿孢木霉(T.chlorosporum)、色精木霉(T.chromospermum)、肉桂色木霉(T.cinnamomeum)、橘绿木霉(T.citrinoviride)、厚木霉(T.crassum)、奶油木霉(T.cremeum)、丁莉亚木霉(T.dingleyeae)、多罗西木霉(T.dorotheae)、平展木霉(T.effusum)、猬木霉(T.erinaceum)、爱莎尼亚木霉(T.estonicum)、可育木霉(T.fertile)、明胶木霉(T.gelatinosus)、加纳木霉(T.ghanense)、钩状木霉(T.hamatum)、哈茨木霉(T.harzianum)、旋状木霉(T.helicum)、交织木霉(T.intricatum)、长枝康宁木霉(T.konilangbra)、康宁木霉(T.koningii)、拟康宁木霉(T.koningiopsis)、长枝木霉(T.longibrachiatum)、长毛木霉(T.longipile)、微孢木霉(T.minutisporum)、矩孢木霉(T.oblongisporum)、卵孢木霉(T.ovalisporum)、彼得森木霉(T.petersenii)、竹生木霉(T.phyllostahydis)、洋大戟草木霉(T.piluliferum)、侧耳木霉(T.pleuroticola)、平菇木霉(T.pleurotum)、多孢木霉(T.polysporum)、假康宁木霉(T.pseudokoningii)、软毛木霉(T.pubescens)、里氏木霉(T.reesei)、罗杰氏木霉(T.rogersonii)、俄罗斯木霉(T.rossicum)、土星孢木霉(T.saturnisporum)、中国木霉(T.sinensis)、弯梗木霉(T.Sinuosum)、螺旋木霉(T.spirale)、草黄木霉(T.stramineum)、硬毛木霉(T.strigosum)、子座木霉(T.stromaticum)、球座木霉(T.surrotundum)、台湾木霉(T.taiwanense)、泰国木霉(T.thailandicum)、革菌木霉(T.thelephoricolum)、可可木霉(T.theobromicola)、绒毛木霉(T.tomentosum)、毛簇木霉(T.velutinum)、绿木霉(T.virens)、绿色木霉(T.viride)和渐绿木霉(T.viridescens)。本文的木霉属物种可例如,如Trichoderma:Biology and Applications(P.K.Mukherjee等人编辑,CABI,Oxfordshire,UK,2013)中所述培养和/或操纵,所述文献以引用方式并入本文。
在某些实施方案中,微生物细胞为藻类细胞。例如,藻类细胞可以来自下列中任一种:绿藻类(绿藻类(green algae))、红藻类(红藻类(red algae))、褐藻类(褐藻类(brownalgae))、硅藻类(硅藻类(diatoms))和鞭毛藻类(鞭毛藻类(dinoflagellates))。在其它方面,藻类细胞可以是微藻类(例如浮游植物、微球藻或浮游藻类)或大型藻类(海带、海藻)。又如,本文的藻类细胞可以为紫菜属(紫菜)、红皮藻属如掌状红皮藻(掌状红皮藻(dulse))、节旋属如钝顶节旋藻(钝顶节旋藻(spirulina))、小球藻(例如,海水小球藻(C.protothecoides)、角叉菜属诸如角叉菜(爱尔兰藓(Irish moss))、丝囊藻属、马尾藻属、Cochayuyo、葡萄藻属(例如布朗葡萄藻)、杜氏藻属(例如,杜氏盐藻)、Gracilaria、颗石藻属(例如,颗石藻)、针形纤维藻、小环藻属、汉坦草属、Nannochloris、微拟球藻、菱形藻属、褐指藻属(例如,三角褐指藻)、栅藻属、Stichococcus、扁藻属(例如,肩突四鞭藻)、海链藻属(例如,伪矮海链藻)、隐甲藻属(例如,隐甲藻)、Neochloris(例如,N.oleoabundans)、或裂壶藻。本文的藻类物种可例如,如Thompson(Algal Cell Culture.Encyclopedia of Life Support System(EOLSS)Biotechnology,第1卷中所述培养和/或操纵,可在eolss.net/sample-chapters互联网网站获得),其以引用方式并入本文。
本文的包含至少一种RGEN的非常规酵母不存在于自然界中,所述RGEN包含至少一种不具有5’端的RNA组分。不受任何特定理论的束缚,据信此类酵母不天然存在,因为已经发现本文的RGEN仅在例如原核生物中出现。另外,据信酵母的某些实施方案由于包含具有含gRNA的RNA组分的RGEN,所以不天然存在,所述gRNA表示crRNA与tracrRNA的异源连接。
本文的RGEN是指包含至少一种Cas蛋白质和至少一种RNA组分的复合物。合适的Cas蛋白质的示例包括I型、II型或III型CRISPR体系的一种或多种Cas内切核酸酶(Bhaya等人,Annu.Rev.Genet.45:273-297,其以引用方式并入本文)。I型CRISPR Cas蛋白质可以为,例如Cas3或Cas4蛋白质。II型CRISPR Cas蛋白质可以为,例如Cas9蛋白质。III型CRISPRCas蛋白质可以为,例如Cas10蛋白质。在优选的实施方案中,使用Cas9蛋白质。在某些实施方案中,Cas蛋白质可以为细菌或古细菌蛋白质。本文的I-III型CRISPR Cas蛋白质通常来源于原核生物;I型和III型Cas蛋白质可源自细菌或古细菌物种,然而II型Cas蛋白质(即,Cas9)可源自例如细菌物种。在其它实施方案中,合适的Cas蛋白质包括下列中的一种或多种:Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9、Cas10、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4、其同源物、或其修饰型式。
在所公开发明的其它方面,本文的Cas蛋白质可以为以下属中的任一种:Aeropyrum、Pyrobaculum、硫化裂片菌(Sulfolobus)、古球状菌属(Archaeoglobus)、嗜盐小盒菌属(Haloarcula)、甲烷杆菌属(Methanobacteriumn)、产甲烷球菌属(Methanococcus)、甲烷八叠球菌属(Methanosarcina)、Methanopyrus、火球菌属(Pyrococcus)、灼热嗜酸古菌(Picrophilus)、Thernioplasnia、棒状杆菌(Corynebacterium)、分支杆菌(Mycobacterium)、链霉菌(Streptomyces)、产液菌属(Aquifrx)、卟啉单胞菌属(Porphvromonas)、绿菌属(Chlorobium)、栖热菌属(Thermus)、杆菌(Bacillus)、利斯特菌(Listeria)、葡萄球菌(Staphylococcus)、梭菌属(Clostridium)、热厌氧杆菌属(Thermoanaerobacter)、支原体属(Mycoplasma)、梭杆菌属(Fusobacterium)、蓝细菌属(Azarcus)、色杆菌属(Chromobacterium)、奈瑟菌属(Neisseria)、亚硝化单胞菌属(Nitrosomonas)、脱硫弧菌(Desulfovibrio)、地杆菌(Geobacter)、Myrococcus、弯曲杆菌(Campylobacter)、Wolinella、不动细菌属(Acinetobacter)、欧文氏菌(Erwinia)、埃希氏菌属(Escherichia)、军团杆菌(Legionella)、甲基球菌属(Methylococcus)、巴斯德氏菌属(Pasteurella)、光杆菌属(Photobacterium)、沙门氏菌属(Salmonella)、黄单胞菌属(Xanthomonas)、耶尔森菌属(Yersinia)、链球菌属(Streptococcus)、密螺旋体属(Treponema)、氟朗西斯氏菌属(Francisella)或栖热袍菌属(Thermotoga)。另选地,本文的Cas蛋白质可例如通过SEQ ID NO:462-465、467-472、474-477、479-487、489-492、494-497、499-503、505-508、510-516或517-521中任一个编码,如美国专利申请公布2010/0093617中所公开的,该文献以引用的方式并入本文。
在某些实施方案中,RGEN包含Cas9氨基酸序列。本文的Cas9蛋白质的氨基酸序列,以及本文的某些其它Cas蛋白质可源自例如链球菌(例如,化脓链球菌、肺炎链球菌、嗜热链球菌、无乳链球菌、副溶血链球菌、口腔链球菌、唾液链球菌、猕猴链球菌、停乳链球菌、咽峡炎链球菌、星座链球菌、S.pseudoporcinus、变形链球菌)、李斯特菌(例如无害利斯特氏菌)、螺原体属(例如,蜂螺旋原体、S.syrphidicola)、消化链球菌、Atopobium、卟啉单胞菌属(例如P.catoniae)、普雷沃菌属(例如中间普雷沃菌)、韦荣球菌属、密螺旋体(例如,T.socranskii、齿垢密螺旋体)、噬二氧化碳菌、大芬戈尔德菌(例如,大芬戈尔德菌)、Coriobacteriaceae(例如,C.bacterium)、Olsenella(例如,O.profusa)、嗜血杆菌属(例如,唾液嗜血杆菌、H.pittmamae)、巴斯德菌属(例如,贝氏巴斯德菌)、Olivibacter(例如,O.sitiensis)、Epilithonimonas(例如,E.tenax)、Mesonia(例如,M.mobilis)、乳酸菌属(例如,胚牙乳杆菌)、杆菌属(例如,蜡样芽胞杆菌)、Aquimarina(例如,A.muelleri)、金黄杆菌属(例如,C.palustre)、多形杆状菌(例如,B.graminisolvens)、奈瑟氏菌属(例如,脑膜炎奈瑟氏菌)、弗朗西斯氏菌属(例如,F.novicida)、或者黄杆菌属(例如,黄杆菌属、土壤杆菌)物种。在本文的某些方面,优选化脓链球菌Cas9。又如,Cas9蛋白质可以为Chylinski等人(RNA Biology 10:726-737)中所公开的Cas9蛋白质中任一种,所述文献以引用方式并入本文。
因此,本文的Cas9蛋白质的序列可包含例如以如下GenBank登录号所公开的Cas9氨基酸序列中任一种:G3ECR1(嗜热链球菌)、WP_026709422、WP_027202655、WP_027318179、WP_027347504、WP_027376815、WP_027414302、WP_027821588、WP_027886314、WP_027963583、WP_028123848、WP_028298935、Q03JI6(嗜热链球菌)、EGP66723、EGS38969、EGV05092、EHI65578(S.pseudoporcinus)、EIC75614(口腔链球菌)、EID22027(星座链球菌)、EIJ69711,EJP22331(口腔链球菌)、EJP26004(咽峡炎链球菌)、EJP30321、EPZ44001(化脓链球菌)、EPZ46028(化脓链球菌)、EQL78043(化脓链球菌)、EQL78548(化脓链球菌)、ERL10511、ERL12345、ERL19088(化脓链球菌)、ESA57807(化脓链球菌)、ESA59254(化脓链球菌)、ESU85303(化脓链球菌)、ETS96804、UC75522、EGR87316(停乳链球菌)、EGS33732、EGV01468(口腔链球菌)、EHJ52063(猕猴链球菌)、EID26207(口腔链球菌)、EID33364、EIG27013(副溶血链球菌)、EJF37476、EJO19166(链球菌属BS35b)、EJU16049、EJU32481、YP_006298249、ERF61304、ERK04546、ETJ95568(无乳链球菌)、TS89875、ETS90967(链球菌属SR4)、ETS92439、EUB27844(链球菌属BS21)、AFJ08616、EUC82735(链球菌属CM6)、EWC92088、EWC94390、EJP25691、YP_008027038、YP_008868573、AGM26527、AHK22391、AHB36273、Q927P4、G3ECR1或Q99ZW2(化脓链球菌),其以引用方式并入。可使用这些Cas9蛋白质序列中任一种的变体,但当与本文的RNA组分缔合时,应具有针对DNA的特异性结合活性,和任选的内切核酸酶活性。此类变体可包含与参考Cas9的氨基酸序列至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的氨基酸序列。
另选地,本文的Cas9蛋白质可由例如以下SEQ ID NO中的任一个编码:462(嗜热链球菌)、474(嗜热链球菌)、489(无乳链球菌)、494(无乳链球菌)、499(变形链球菌)、505(化脓链球菌)或518(化脓链球菌),如美国专利申请公布2010/0093617所述(以引用方式并入本文)。另选地,本文的Cas9蛋白质可包含,例如SEQ ID NO:11的氨基酸序列,或SEQ ID NO:11的残基1-1368。另选地,Cas9蛋白质可包含例如与前述氨基酸序列中的任一个至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的氨基酸序列。当与本文的RNA组分缔合时,此类变体Cas9蛋白质应具有针对DNA的特异性结合活性,和任选地切割或切口活性。
本文所用的Cas蛋白质(例如Cas9)的起源可来自RNA组分源自其中的相同物种,或其可来自不同物种。例如,包含源自链球菌物种(例如,化脓链球菌或嗜热链球菌)的Cas9蛋白质的RGEN可与具有源自相同链球菌物种的序列(例如crRNA重复序列、tracrRNA序列)的至少一种RNA组分复合。另选地,本文所用的Cas蛋白质(例如Cas9)的起源可来自RNA组分源自其中的不同物种(Cas蛋白质和RNA组分可彼此异源);此类异源Cas/RNA组分RGEN应具有DNA靶向活性。
可以通过本领域已知的任何合适的测定法来评估确定本文的Cas蛋白质针对特异性靶DNA序列的结合活性和/或内切核酸酶活性,例如美国专利号8697359中所公开的,其以引用方式在本文中公开。可例如通过以下方法来进行测定:在非常规酵母中表达Cas蛋白质和合适的RNA组分,并且然后检查预测的DNA靶位点的插入缺失存在(该特定测定法中的Cas蛋白质可具有完整的内切核酸酶活性[双链切割活性])。可例如经由DNA测序方法或通过测定靶序列的功能丧失来推测插入缺失形成来进行对于预测的靶位点处插入缺失的存在的检查。在另一个示例中,可通过在非常规酵母中表达Cas蛋白质和合适的RNA组分来测定Cas蛋白质活性,已向所述非常规酵母提供供体DNA,所述供体DNA包含与靶位点处或附近的序列同源的序列。在靶位点处的供体DNA序列的存在(诸如可通过供体和靶序列之间的成功HR所预测的)可指示靶向存在。
本文的Cas蛋白质诸如Cas9通常还包含异源核定位序列(NLS)。例如,本文的异源NLS氨基酸序列可具有足够的强度以驱动Cas蛋白质以可检测的量在本文酵母细胞的核中积累。NLS可包含碱基的一个(单倍体)或多个(例如,二倍体)短序列(例如,2至20个残基)、带正电的残基(例如,赖氨酸和/或精氨酸),并且可位于Cas氨基酸序列的任何位置处但使得其暴露于蛋白质表面上。例如,NLS可以可操作地连接至本文Cas蛋白质的N末端或C末端。例如,两个或更多个NLS序列可连接至Cas蛋白质,诸如在Cas蛋白质的N末端和C末端两者上。本文的适宜NLS序列的非限制性示例包括在美国专利6660830和7309576中公开的那些(例如,其中的表1),上述文献均以引用方式并入本文。可用于本文的NLS的另一个示例包括SEQ ID NO:11的氨基酸残基1373-1379。
在某些实施方案中,Cas蛋白质及其通过Cas蛋白质引导DNA特异性靶向的相应RNA组分(例如crRNA)与本发明所公开的非常规酵母异源。这些RGEN组分的异源性质是由于以下事实:Cas蛋白质及其相应RNA组分仅已知存在于原核生物(细菌和古细菌)中。
本文的Cas蛋白质可任选地使用其经密码子优化以在酵母细胞中表达的开放阅读框(ORF)在非常规酵母细胞中表达。本文的“经密码子优化的”序列是其密码子使用频率经设计用以模仿宿主细胞优选的密码子使用频率的ORF。在其中解脂耶氏酵母为非常规酵母细胞的方面,ORF的密码子优化可按照如美国专利7125672中提供的解脂耶氏酵母密码子使用特征图来进行,所述专利文献以引用方式并入本文。
在一些实施方案中,Cas蛋白质为包含一个或多个异源蛋白质结构域(例如,除了Cas蛋白质之外,1个、2个、3个或更多个结构域)的融合蛋白的部分。此类融合蛋白可包含任何附加的蛋白质序列,和任选地在任何两个结构域之间,诸如在Cas和第一异源结构域之间的接头序列。可融合至本文的Cas蛋白质的蛋白质结构域的示例包括但不限于表位标签(例如组氨酸[His]、V5、FLAG、流感血凝素[HA]、myc、VSV-G、硫氧还蛋白[Trx]),报告分子(例如谷胱甘肽-5-转移酶[GST]、辣根过氧化物酶[HR]、氯霉素乙酰转移酶[CAT]、β-半乳糖苷酶、β-葡糖醛酸糖苷酶[GUS]、荧光素酶、绿色荧光蛋白[GFP]、HcRed、DsRed、青色荧光蛋白[CFP]、黄色荧光蛋白[YFP]、蓝色荧光蛋白[BFP]),以及具有以下活性中一个或多个活性的结构域:甲基化酶活性、脱甲基酶活性、转录激活活性(例如,VP16或VP64)、转录抑制活性、转录释放因子活性、组蛋白修饰活性、RNA切割活性和核酸结合活性。在其它实施方案中,Cas蛋白质可与结合DNA分子或其它分子的蛋白质,诸如麦芽糖结合蛋白(MBP)、S-tag、LexA DNA结合结构域(DBD)、GAL4A DNA结合结构域、和单纯疱疹病毒(HSV)VP16融合。可以为包含本文的Cas蛋白质的融合蛋白质的部分的附加结构域公开于美国专利申请公布2011/0059502中,该文献以引用的方式并入本文。在其中Cas蛋白质融合至异源蛋白质(例如转录因子)的某些实施方案中,Cas蛋白质具有DNA识别和结合活性(当与本文的合适的RNA组分复合时),但不具有DNA切口活性或切割活性。
本文的RGEN可结合到,并且任选地切割DNA靶序列处的DNA链。在某些实施方案中,RGEN可切割DNA靶序列的一个或两条链。例如,RGEN可切割DNA靶序列的两条链。
本文可切割DNA靶序列的两条链的RGEN通常包含其全部内切核酸酶结构域处于功能态的Cas蛋白质(例如,保留每个内切核酸酶结构域中的一些或全部活性的野生型内切核酸酶结构域或其变体)。因此,保留Cas蛋白质的每个内切核酸酶结构域中的一些或全部活性的野生型Cas蛋白质(例如,本文所公开的Cas9蛋白质)或其变体是可切割DNA靶序列的两条链的RGEN的适宜示例。包含功能性RuvC和HNH核酸酶结构域的Cas9蛋白质是可切割DNA靶序列的两条链的Cas蛋白质的示例。本文可切割DNA靶序列的两条链的RGEN通常在相同位置处切割两条链,使得在切割位点处形成平端(即,无核苷酸突出物)。
本文可切割DNA靶序列的一条链的RGEN可在本文中表征为具有切口酶活性(例如,部分切割能力)。本文的Cas切口酶(例如,Cas9切口酶)通常包含使得Cas仅切割DNA靶序列的一条链(即,形成切口)的一个功能性内切核酸酶结构域。例如,Cas9切口酶可包含(i)突变的、功能失调的RuvC结构域和(ii)功能性HNH结构域(例如野生型HNH结构域)。又如,Cas9切口酶可包含(i)功能性RuvC结构域(例如,野生型RuvC结构域)和(ii)突变的、功能失调的HNH结构域。
适用于本文的Cas9切口酶的非限制性示例由Gasiunas等人(Proc.Natl.Acad.Sci.U.S.A.109:E2579-E2586),Jinek等人(Science 337:816-821),Sapranauskas等人(Nucleic Acids Res.39:9275-9282)和美国专利申请公布2014/0189896中所描述的,这些申请以引用的方式并入本文。例如,本文的Cas9切口酶可包含嗜热链球菌Cas9,其具有Asp-31替换(例如,Asp-31-Ala)(突变的RuvC结构域的示例)、或His-865替换(例如,His-865-Ala)、Asn-882替换(例如,Asn-882-Ala)、或Asn-891替换(例如,Asn-891-Ala)(突变的HNH结构域的示例)。另外,例如,本文的Cas9切口酶可包含化脓链球菌Cas9,其具有Asp-10替换(例如,Asp-10-Ala)、Glu-762替换(例如Glu-762-Ala)、或Asp-986替换(例如,Asp-986-Ala)(突变的RuvC结构域的示例)、或His-840替换(例如,His-840-Ala)、Asn-854替换(例如,Asn-854-Ala)、或Asn-863替换(例如,Asn-863-Ala)(突变的HNH结构域的示例)。关于化脓链球菌Cas9,三个RuvC亚结构域一般分别位于氨基酸残基1-59、718-769和909-1098处,并且HNH结构域位于氨基酸残基775-908处(Nishimasu等人,Cell156:935-949)。
本文的Cas9切口酶可出于各种目的用于所公开发明的非常规酵母中。例如,Cas9切口酶可用于利用合适的供体多核苷酸在DNA靶位点序列处或附近刺激HR。因为经切口的DNA不是NHEJ过程的底物,但通过HR过程识别,所以在特定靶位点处将DNA切口应当使所述位点更易接受利用合适的供体多核苷酸进行HR。
又如,一对Cas9切口酶可用于增加DNA靶向的特异性。一般来讲,这可通过提供两个Cas9切口酶来进行,由于与具有不同向导序列的RNA组分缔合,所以两个Cas9切口酶在期望靶向的区域中的相对链上的DNA序列附近靶向和切口。这种每个DNA链附近的切割形成DSB(即,具有单链突出物的DSB),这然后被识别为NHEJ的底物(导致插入缺失形成)或HR的底物(则导致与合适的供体多核苷酸(如果提供)重组)。在这些实施方案中,每个切口可以为例如彼此分开的至少约5个、10个、15个、20个、30个、40个、50个、60个、70个、80个、90个或100个(或介于5和100之间的任何整数)碱基。本文的一个或两个Cas9切口酶蛋白质可用于如上所述的Cas9切口酶对。例如,可使用具有突变RuvC结构域,但功能性HNH结构域的Cas9切口酶(即,Cas9HNH+/RuvC-)(例如,化脓链球菌Cas9HNH+/RuvC-)。可通过使用具有将每个切口酶靶向到每个特异性DNA位点的向导RNA序列的本文的适宜RNA组分,将每个Cas9切口酶(例如,Cas9HNH+/RuvC-)引导至彼此附近的特异性DNA位点(至多间隔100个碱基对)。
在某些实施方案中,RGEN可结合到DNA靶位点序列,但不切割靶位点序列处的任何链。此类RGEN可包含Cas蛋白质,其中其核酸酶结构域全部均是突变的、功能失调的。例如,本文可结合到DNA靶位点序列,但不切割靶位点序列处的任何链的Cas9蛋白质可包含突变的功能失调的RuvC结构域和突变的功能失调的HNH结构域两者。此类Cas9蛋白质的非限制性示例包含上文所公开的RuvC和HNH核酸酶结构域突变体中任一个(例如,具有Asp-10替换(诸如Asp-10-Ala)和His-840替换(诸如His-840-Ala)的化脓链球菌Cas9)。本文结合但不切割靶DNA序列的Cas蛋白质可用于调节基因表达,例如,在这种情况下,Cas蛋白质可以与转录因子(或其部分)(例如,阻遏物或激活子,例如本文所公开的那些中的任一种)融合。例如,包含具有Asp-10替换(例如Asp-10-Ala)和His-840替换(例如His-840-Ala)的化脓链球菌Cas9的Cas9可融合至VP16或VP64转录激活结构域。用于此类RGEN的RNA组分中的向导序列可例如与基因启动子或其它调控元件(例如,内含子)中的DNA序列互补。
在某些方面,酵母可包含(i)可切割DNA靶序列的一个或两个DNA链的RGEN,和(ii)包含与DNA靶位点序列处或附近的序列同源的至少一个序列的供体多核苷酸(通过本文的Cas蛋白质特异性靶向的序列)。如果靶位点包含SSB或DSB(诸如可使用本文Cas蛋白质引入),则合适的供体多核苷酸能够经历由DNA靶位点处或附近的序列进行的HR。本文的供体多核苷酸内的“同源序列”可包含或由至少约25、50、75、100、150、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000或10000个核苷酸,或约50-500、50-550、50-600、50-650或50-700个核苷酸的序列组成,所述序列与靶位点序列处或附近的序列具有100%的同一性,或与靶位点序列处或附近的序列具有例如至少约95%、96%、97%、98%或99%同一性。
本文的供体多核苷酸可具有两个同源序列(同源臂),所述同源序列例如由与靶位点序列处或附近的序列异源的序列隔开。此类供体多核苷酸和靶位点序列之间的HR通常导致靶位点处的序列被供体多核苷酸的异源序列置换(位于与供体多核苷酸的同源臂同源的靶位点序列之间的靶位点序列被供体多核苷酸的异源序列置换)。在具有两个同源臂的供体多核苷酸中,所述臂可由例如,至少约1、2、3、4、5、10、20、30、40、50、75、100、250、500、1000、2500、5000、10000、15000、20000、25000或30000个核苷酸隔开(即,供体多核苷酸中的异源序列的长度为至少约1、2、3、4、5、10、20、30、40、50、75、100、250、500、1000、2500、5000、10000、15000、20000、25000或30000个核苷酸)。每个同源臂的长度(例如上文所公开的同源序列的长度中的任一个)可以相同或不同。每个臂与靶位点处或附近的相应同源序列的同一性百分比(例如,上文所公开的同原序列的同一性%中任一个)可以相同或不同。
与供体多核苷酸的对应同源序列同源的在靶位点序列处或附近(另选地,本地或附近)的DNA序列可以距靶序列中预测Cas蛋白质切割位点(DSB或切口)例如在约1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90、100、150、200、250、300、450、500、750、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、20000、30000、40000、50000或60000(或介于1和60000之间的任何整数)个核苷酸内(例如,约1-1000、100-1000、500-1000、1-500或100-500个核苷酸)。这些核苷酸距离可以沿切割位点的上游或下游方向,从切割位点到同源序列的第一个核苷酸标记。例如,与供体多核苷酸中的对应序列同源的靶序列附近的序列可在靶序列的预测Cas蛋白质切割位点下游的500个核苷酸碱基对处起始。例如,在本文采用具有两个同源臂(例如,由异源序列分开的第一同源臂和第二同源臂)的供体多核苷酸的实施方案中,同源序列(对应于与供体的第一同源臂的同源性)可在预测的Cas切割位点的上游,并且同源序列(对应于与供体的第二同源臂的同源性)可在预测的Cas切割位点的下游。例如,这些上游和下游的同源序列中每一个距预测切割位点的核苷酸距离可以相同或不同,并且可以为上文所公开的核苷酸距离中的任一个。例如,同源序列的3’端(对应于与供体的第一同源臂的同源性)可位于预测Cas切割位点上游600个核苷酸碱基对处,并且同源序列的5’端(对应于与供体的第二同源臂的同源性)可位于预测Cas切割位点下游400个核苷酸碱基对处。
本文的RGEN可结合到,并任选地切割非常规酵母的基因组中染色体、附加体或任何其它DNA分子中的靶位点序列处的DNA链。鉴于RGEN的RNA组分包含与靶序列的链互补的序列(向导序列),靶序列的这种识别和结合是特异性的。在某些实施方案中,靶位点可以是独特的(即,在目标基因组中存在靶位点序列的单次出现)。
本文的靶序列的长度可以为例如,至少13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个核苷酸;介于13-30个核苷酸之间;介于17-25个核苷酸之间,或介于17-20个核苷酸之间。该长度可包括或排除PAM序列。另外,本文靶序列的链具有与(crRNA或gRNA的)向导序列的足够互补性从而与向导序列杂交并引导Cas蛋白质或Cas蛋白质复合物与靶序列的序列-特异性结合(在合适的PAM邻近靶序列时,参见下文)。向导序列及其对应DNA靶序列的链之间的互补度为例如,至少约90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。本文的靶位点可位于例如编码基因产品(例如蛋白质或RNA)的序列或非编码序列(例如,调控序列或“垃圾”序列)中。
PAM(前间区序列邻近基序)序列可邻近靶位点序列。PAM序列是由本文的RGEN识别的短DNA序列。DNA靶序列的缔合PAM和前11个核苷酸对于Cas9/gRNA靶向和切割可能是重要的(Jiang等人,Nat.Biotech.31:233-239)。本文的PAM序列的长度可根据所用的Cas蛋白质或Cas蛋白质复合物而不同,但通常例如为2、3、4、5、6、7或8个核苷酸的长度。例如,PAM序列紧接靶位点序列的下游、或在靶位点序列下游的2个或3个核苷酸内,所述靶位点序列与靶位点中的链互补,所述靶位点中的链继而与RNA组分向导序列互补。在本文的实施方案中,其中RGEN为与RNA组分复合的内切核酸酶活性Cas9蛋白质,Cas9按照RNA组分引导而结合到靶序列,并切割紧邻PAM序列上游的第三核苷酸位置的5’的两条链。考虑靶位点:PAM序列的以下示例:
在该示例性序列中,N可以为A、C、T或G,并且X可以为A、C、T或G(X也可被称为NPAM)。该示例中的PAM序列为XGG(加下划线)。合适的Cas9/RNA组分复合物可切割紧接双下划线N的5’的该靶。SEQ ID NO:46中N的串表示靶序列,所述靶序列与本文RNA组分的向导序列为例如至少约90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同(其中,DNA靶序列的任何T可与RNA向导序列的任何U比对)。在该靶序列(其代表本文的靶位点)处识别和结合时,Cas9复合物的RNA组分的向导序列可与N的串的互补序列退火;向导序列和靶位点互补序列之间的互补度百分比为例如至少约90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。如果Cas9切口酶用于靶向基因组中的SEQ ID NO:46,则切口酶可紧邻双下划线N的5’或在互补链的相同位置处切口,这取决于切口酶中哪个内切核酸酶结构域是功能失调的。如果不具有溶核活性的Cas9(RuvC和HNH结构域两者均功能失调)用于靶向基因组中的SEQ ID NO:46,在其可识别并结合靶序列,但不对所述序列进行任何切割。
本文的PAM通常根据所用RGEN的类型来选择。例如,本文的PAM序列可以为通过RGEN识别的PAM序列,所述RGEN包含Cas,诸如Cas9,其源自Cas可源自其中的本文所公开的物种中的任一种。在某些实施方案中,PAM序列可以为由RGEN识别的PAM序列,所述RGEN包含源自化脓链球菌、嗜热链球菌、无乳链球菌、脑膜炎奈瑟菌、牙质齿菌或新凶手弗氏杆菌的Cas9。例如,源自化脓链球菌的适宜Cas9可用于靶向具有NGG的PAM序列的基因组序列(SEQID NO:47;N可以为A、C、T或G)。又如,当靶向具有以下PAM序列的DNA序列时,合适的Cas9可源自以下物种中的任一种:嗜热链球菌(NNAGAA[SEQ ID NO:48])、无乳链球菌(NGG[SEQ IDNO:47])、NNAGAAW[SEQ ID NO:49,W为A或T]、NGGNG[SEQ ID NO:50])、脑膜炎奈瑟菌(NNNNGATT[SEQ ID NO:51])、牙质齿菌(NAAAAC[SEQ ID NO:52])、或新凶手弗氏杆菌(NG[SEQ ID NO:53])(其中所有这些特定PAM序列中的N为A、C、T或G)。可用于本文的Cas9/PAM的其它示例包括在Shah等人(RNA Biology 10:891-899)和Esvelt等人(Nature Methods10:1116-1121)中公开的那些,所述文献以引用方式并入本文。本文的靶序列的示例遵循SEQ ID NO:46,但其中‘XGG’PAM由前述PAM中任一个置换。
在本文实施方案中,至少一种不具有5’端的RNA组分包含于RGEN中。该未封端的RNA组分包含与非常规酵母中的染色体或附加体的靶位点序列互补的序列。基于该序列互补度,RGEN特异性结合到并任选地切割该靶位点处的DNA链。因此,在本发明所公开的实施方案中,RNA组分的互补序列还可被称为向导序列或可变靶向结构域。
本文的RNA组分的向导序列(例如,crRNA或gRNA)的长度可以为至少13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个核糖核苷酸,介于13-30个核糖核苷酸的长度之间;介于17-25个核糖核苷酸的长度之间;或介于17-20个核糖核苷酸的长度之间。一般来讲,本文的向导序列具有与靶DNA序列的链足够的互补性从而与靶序列杂交并引导Cas蛋白质或Cas蛋白质复合物与靶序列的序列-特异性结合(在合适的PAM邻近靶序列时)。向导序列及其对应DNA靶序列之间的互补度为例如,至少约90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。可相应地将向导序列工程化以将RGEN靶向到酵母细胞中的DNA靶序列。
本文的RNA组分可包含例如crRNA,其包含向导序列和重复(tracrRNA配对)序列。向导序列通常位于crRNA的5’端处或附近(在1、2、3、4、5、6、7、8、9、10或更多个碱基内)。crRNA的向导序列的下游是“重复”或“tracrRNA配对”序列,其与tracrRNA的5’端处的序列互补并与所述序列杂交。向导序列和tracrRNA配对序列可紧邻,或通过例如1、2、3、4或更多个碱基隔开。tracrRNA配对序列具有例如与tracrRNA的5’端的至少50%、60%、70%、80%、90%、95%、96%、97%、98%或99%序列互补度。一般来讲,互补度可参考tracrRNA配对序列与tracrRNA序列的最佳比对,连同两个序列中较短者的长度。本文的tracrRNA配对序列的长度可以为,例如至少8、9、10、11、12、13、14、15、16、17或18个核糖核苷酸,并且与tracrRNA的5’端处的相同或相似长度的序列杂交(例如,加上或减去1、2、3、4或5个碱基)。本文的tracrRNA配对序列的适宜示例包含SEQ ID NO:54(guuuuuguacucucaagauuua)、SEQID NO:55(guuuuuguacucuca)、SEQ ID NO:56(guuuuagagcua,参见实施例)、或SEQ ID NO:57(guuuuagagcuag),或其变体,其(i)具有至少约90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性,并且(ii)可与tracrRNA的5’端序列退火。本文的crRNA的长度可以为例如至少约18、20、22、24、26、28、30、32、34、36、38、40、42、44、46或48个核糖核苷酸;或约18-48个核糖核苷酸;或约25-50个核糖核苷酸。
tracrRNA应当连同crRNA一起包含于实施方案中,在该实施方案中II型CRISPR体系的Cas9蛋白质包含于RGEN中。本文的tracrRNA包含,在5’-至-3’方向上,(i)与crRNA的重复区(tracrRNA配对序列)退火的序列和(ii)包含茎环的部分。(i)的序列长度可以例如与上文所公开的tracrRNA配对序列长度中的任一个相同或相似(例如,加上或减去1、2、3、4、或5个碱基)。本文的tracrRNA的总长度(即,序列组分[i]和[ii])可为例如至少约30、35、40、45、50、55、60、65、70、75、80、85或90(或者介于30和90之间的任何整数)个核糖核苷酸。tracrRNA还可包括3′端处的1、2、3、4、5或更多个尿嘧啶残基,其可借助于利用转录终止子序列表达tracrRNA而存在。
例如,本文的tracrRNA可源自上文所列的菌种中任一种,Cas9序列可源自所述菌种。合适的tracrRNA序列的示例包括美国专利8697359和Chylinski等人(RNA Biology 10:726-737)中所公开的那些,所述文献以引用方式并入本文。本文的优选tracrRNA可源自链球菌属物种tracrRNA(例如,化脓链球菌、嗜热链球菌)。本文的tracrRNA的其它合适的示例可包括:
SEQ ID NO:58:
uagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugc(参见实施例),
SEQ ID NO:59:
uagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaagug,或
SEQ ID NO:60:
uagcaaguuaaaauaaggcuaguccguuauca,
其可源自化脓链球菌tracrRNA。本文的tracrRNA的其它合适的示例可包括:
SEQ ID NO:61:
uaaaucuugcagaagcuacaaagauaaggcuucaugccgaaaucaacacccugucauuuuauggcaggguguuuucguuauuuaa,
SEQ ID NO:62:
ugcagaagcuacaaagauaaggcuucaugccgaaaucaacacccugucauuuuauggcaggguguuuucguuauuua、或
SEQ ID NO:63:
ugcagaagcuacaaagauaaggcuucaugccgaaaucaacacccugucauuuuauggcagggugu,
其可源自嗜热链球菌tracrRNA。
本文的tracrRNA的其它示例为这些tracrRNA SEQ ID NO的变体,其(i)与其具有至少约80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性,和(ii)可用作tracrRNA(例如,5’端序列可与crRNA的tracrRNA配对序列退火,5’端序列下游的序列可形成一个或多个发夹状物,变体tracrRNA可与Cas9蛋白质形成复合物)。
本文所公开的RGEN的RNA组分可包含例如,向导RNA(gRNA),其包含可操作地连接至,或融合至tracrRNA的crRNA。在某些优选的实施方案中,gRNA的crRNA组分在tracrRNA组分的上游(即,此类gRNA包含在5’-至-3’方向上,可操作地连接tracrRNA的crRNA)。如本文(例如,上述实施方案)所公开的任何crRNA和/或tracrRNA(和/或其部分,诸如crRNA重复序列、tracrRNA配对序列、或tracrRNA 5’端序列)可例如包含在gRNA中。
本文gRNA的crRNA组分的tracrRNA配对序列应当能够与tracrRNA组分的5’端退火,从而形成发夹状结构。例如,关于(crRNA组分的)tracrRNA配对序列和(tracrRNA组分的)5’端序列的长度和两者之间互补度百分比的上文公开内容中的任一个可表征gRNA的crRNA和tracrRNA组分。为有利于该退火,crRNA和tracrRNA组分的可操作连接或融合优选包含合适的成环核糖核苷酸序列(即,成环序列可将crRNA和tracrRNA组分连接在一起,从而形成gRNA)。RNA成环序列的合适的示例包括GAAA(SEQ ID NO:43,参见实施例)、CAAA(SEQID NO:44)和AAAG(SEQ ID NO:45)。然而,可使用较长或较短的环序列,如可交替环序列。环序列优选包含核糖核苷酸三联体(例如,AAA)和在所述三联体的任一端处的附加核糖核苷酸(例如,C或G)。
本文的gRNA形成发夹状物(“第一发夹状物),其中其(crRNA组分的)tracrRNA配对序列和tracrRNA 5’端序列部分退火。一个或多个(例如、1、2、3或4个)附加发夹状结构可在该第一发夹状物下游形成,这取决于gRNA的tracrRNA组分的序列。因此,gRNA可具有例如至多五个发夹状结构。例如,gRNA还可包括在gRNA序列末端之后的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30或更多个残基,其可借助于利用转录终止子序列表达gRNA而存在。这些附加残基可以全部为U残基,或例如至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%为U残基,其取决于终止序列的选择。
可用于所公开发明中的适宜gRNA的非限制性示例可包括:
SEQ ID NO:64:
NNNNNNNNNNNNNNNNNNNNguuuuuguacucucaagauuuaGAAA uaaggcuucaugccgaaaucaacacccugucauuuuauggcaggguguuuucguuauuuaa、
SEQ ID NO:65:
NNNNNNNNNNNNNNNNNNNNguuuuuguacucucaGAAAuaaggcuucaugccgaaaucaacacccugucauuuuauggcaggguguuuucguuauuuaa、
SEQ ID NO:66:
SEQ ID NO:67:
SEQ ID NO:68:
SEQ ID NO:69:
SEQ ID NO:70:
在SEQ ID NO:64-70的每一个中,加单下划线的序列表示gRNA的crRNA部分。每个“N”表示合适向导序列的核糖核苷酸碱基(A、U、G或C)。第一块小写字母表示tracrRNA配对序列。第二块小写字母表示gRNA的tracrRNA部分。双下划线序列近似与tracrRNA配对序列退火以形成第一发夹状物的tracrRNA序列的部分。环序列(GAAA,SEQ ID NO:43)以大写字母示出,其可操作地连接每个gRNA的crRNA和tracrRNA部分。本文gRNA的其它示例包括前述gRNA的变体,所述变体(i)与这些序列具有至少约80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性(在该计算中排除向导序列),并且(ii)可用作gRNA,其特异性靶向Cas9蛋白质以与靶DNA序列结合并任选地切口或切割靶DNA序列。
本文的gRNA还可根据具有向导序列(VT结构域),之后是Cas内切核酸酶识别(CER)结构域来表征。CER结构域包含tracrRNA配对序列,之后是tracrRNA序列。可用于本文的CER结构域的示例包括上述SEQ ID NO:64-70中所包含的那些(每个中的CER结构域是VT结构域的N之后的序列)。CER结构域的另一合适示例是SEQ ID NO:1(参见实施例),其在5’-至-3’方向上包含SEQ ID NO:56的tracrRNA配对序列、SEQ ID NO:43的成环序列(GAAA)、以及SEQID NO:58的tracrRNA序列。
本发明所公开的RGEN的RNA组分不具有5’端(7-甲基鸟苷酸[m7G]端)。因此,本文的RNA组分不具有在其5’末端处的7-甲基鸟苷酸[m7G]端。本文的RNA组分可具有,例如5′-羟基基团而不是5′-端。另选地,本文的RNA组分可具有,例如5′-磷酸酯而不是5′-端。据信RNA组分可在转录之后在核中更好的积聚,因为5’-封端的RNA(例如,具有5’m7G端的RNA)经受核输出。本文未封端的RNA组分的优选示例包括合适的gRNA、crRNA、和/或tracrRNA。在某些实施方案中,本文的RNA组分缺乏5’端,并且任选地具有替代的5’-羟基基团,这是由于RNA由RNA组分前体的5’端处的核酶序列进行自加工(即,在RNA组分的上游包含核酶序列的前体RNA,诸如gRNA经历核酶介导的自加工以去除核酶序列,从而保留不具有5’端的下游RNA组分)。在某些其它实施方案中,本文的RNA组分不通过由RNA聚合酶III(Pol III)启动子转录来产生。
在某些实施方案中,酵母还包含DNA多核苷酸序列,所述DNA多核苷酸序列包含(i)可操作地连接至(ii)编码RNA组分的核苷酸序列的启动子。该多核苷酸序列由酵母使用以表达与Cas蛋白质复合从而形成RGEN的RNA组分。此类多核苷酸序列可以呈下列形式:例如,质粒、酵母人工染色体(YAC)、粘粒、噬菌粒、细菌人工染色体(BAC)、病毒或线性DNA(例如线性PCR产物)、或可用于将多核苷酸序列转移到非常规酵母细胞中的任何其它类型的载体或构建体。该多核苷酸序列可瞬时(即,不整合到基因组中)或稳定(即,整合到基因组中)存在于本文的酵母细胞中。另外,该多核苷酸序列可包括或缺乏一种或多种合适的标记物序列(例如,选择或表型标记物)。
适用于表达本文RNA组分的包含于多核苷酸序列中的启动子可在非常规酵母细胞中操作,并且可以是例如组成型或诱导型的。在某些方面,启动子可包含强启动子,其是每单位时间可引导相对大量的生产性启动的启动子,和/或驱动比包含酵母的酵母中基因的平均转录水平更高转录水平的启动子。
可用于本文的强启动子的示例包括在公开于以下专利申请公布中的那些:2012/0252079(DGAT2)、2012/0252093(EL1)、2013/0089910(ALK2)、2013/0089911(SPS19)、2006/0019297(GPD和GPM)、201I/0059496(GPD和GPM)、2005/0130280(FBA、FBAIN、FBAINm)、2006/0057690(GPAT)和2010/0068789(YAT1),所述专利文献以引用方式并入本文。合适的强启动子的其它示例包括列于表2中的那些。
表2:强启动子
a该表中的每个参考序列以引用方式并入本文。
尽管上文所列的强启动子来自解脂耶氏酵母,但据信例如来自本文所公开的任何非常规酵母的其相应启动子(例如,同源物)均可以用作强启动子。因此,强启动子可包含例如XPR2、TEF、GPD、GPM、GPDIN、FBA、FBAIN、FBAINm、GPAT、YAT1、EXP1、DGAT2、EL1、ALK2或SPS19启动子。另选地,强启动子诸如对应于前述启动子中任一种的任一种可来自其它类型的酵母(例如,酿酒酵母、粟酒裂殖酵母)(例如,在美国专利申请公布2010/0150871中所公开的强启动子中的任一种,该文献以引用的方式并入本文)。可用于本文的强启动子的其它示例包括PGK1、ADH1、TDH3、TEF1、PHO5、LEU2和GAL1启动子,以及在Velculescu等人(Cell88:243-251)中所公开的强酵母启动子,其以引用方式并入本文。可用于本文的强启动子的另一个示例可包含SEQ ID NO:12(耶氏酵母FBA1启动子序列)。
在某些实施方案中,本文的启动子可包含RNA聚合酶II(Pol II)启动子。据信,所有上文所列的强启动子均为合适的Pol II启动子的示例。例如,由Pol II启动子转录可涉及至少约12个蛋白质(例如,RPB1-RPN12个蛋白质)的RNA聚合酶II复合物的形成。由本文的Pol II启动子转录的RNA通常为5’-封端的(例如,在5’端处包含m7G基团)。因为本文RNA组分不具有5’端,因此如果其由本文的Pol II启动子表达,则应当采用从RNA组分去除5’端的方式。适用于从本文Pol II-转录的RNA组分有效去除5’端的方式包括适当使用一种或多种核酶(参见下文),例如,组1自剪接内含子和组2自剪接内含子。
例如,编码RNA组分的本文的核苷酸序列还可编码在编码RNA组分的序列上游的核酶。因此,在某些实施方案中,酵母还包含DNA多核苷酸序列,所述DNA多核苷酸序列包含(i)启动子,其可操作地连接至(ii)在5’-至-3’方向上编码核酶和RNA组分的核苷酸序列。由此类多核苷酸序列表达的转录物自催化地去除核酶序列以产生RNA,所述RNA不具有5’端但包含RNA组分序列。这种“自加工”RNA可以包含例如crRNA或gRNA,并且可与Cas蛋白质如Cas9复合,从而形成RGEN。
本文核酶可以为例如锤头(HH)核酶、丁型肝炎病毒(HDV)核酶、I组内含子核酶、RnaseP核酶、或发夹型核酶。本文核酶的其它非限制性示例包括Varkud卫星(VS)核酶、葡糖胺-6-磷酸激活核酶(glmS)、和CPEB3核酶。Lilley(Biochem.Soc.Trans.39:641-646)公开了涉及核酶结构和活性的信息。应当适用于本文的核酶的示例包括公开于EP0707638和美国专利6063566、5580967、5616459和5688670中的核酶,其以引用方式并入本文。
在某些优选的实施方案中,使用锤头核酶。该类型的核酶可以为I型、II型或III型锤头核酶,例如,如Hammann等人(RNA 18:871-885)中所公开的,其以引用方式并入本文。鉴定编码锤头核酶的DNA的多种方式公开于Hammann等人中,其可相应地用于本文。本文的锤头核酶可源自例如病毒、类病毒、植物病毒卫星RNA、原核生物(例如古细菌、蓝藻细菌、酸杆菌)或真核生物诸如植物(例如拟南芥、康乃馨)、原生生物(例如变形虫、眼虫)、真菌(例如曲霉属、解脂耶氏酵母)、两栖动物(例如蝾螈、青蛙)、血吸虫、昆虫(例如蟋蟀)、软体动物、哺乳动物(例如小鼠、人类)、或线虫。
本文的锤头核酶通常包含三个碱基配对的螺旋体,其各自分别被称为螺旋体I、螺旋体II和螺旋体III,由保守序列的短接头分开。锤头核酶(I-III)的三种类型通常基于核酶的5’和3’端包含于哪个螺旋体中。例如,如果锤头核酶序列的5′和3′端有助于茎I,则其可以被称为I型锤头核酶。在三种可能形貌类型中,I型可存在于原核生物、真核生物和RNA植物病原体的基因组中,然而II型锤头核酶仅描述于原核生物中,并且III型锤头核酶大多数存在于植物、植物病原体和原核生物中。在某些实施方案中,锤头核酶为I型锤头核酶。
在某些实施方案中,编码锤头核酶的序列可包含至少约40、50、60、70、80、90、100、110、120、130、140或150个(或者介于40和150之间的任何整数)核苷酸,40-100个核苷酸,或40-60个核苷酸。
编码锤头核酶的序列在编码RNA组分的序列的上游。编码本文的锤头核酶的序列可以为例如紧接编码RNA组分的向导序列(例如,向导序列可以为crRNA或gRNA的向导序列)的序列的5’,或在5’的至少2、3、4、5、6、7、8、9或10个核苷酸处。锤头核酶的前5、6、7、8、9、10、11、12、13、14或15个核糖核苷酸应当分别与紧邻锤头核酶序列下游的序列的第一相同编号的核糖核苷酸互补。例如,如果本文的多核苷酸序列编码包含紧邻RNA组分的向导序列上游的锤头核酶序列的RNA,则核酶的例如前6个核糖核苷酸可与向导序列的前6个核糖核苷酸互补。在该示例中,锤头核酶可切割紧邻向导序列的第一位置上游的RNA转录物(或以另一方式来说,锤头核酶可切割紧邻核酶序列下游的RNA转录物)。该逻辑同样适用于其它前述示例性实施方案。例如,如果本文的多核苷酸序列编码包含为RNA组分的向导序列上游的8个残基的锤头核酶序列的RNA(例如,存在8个残基间隔序列),则核酶的例如前6个核糖核苷酸可与紧接核酶序列的3’的6个核糖核苷酸互补。在该示例中,锤头核酶可切割紧邻核酶序列下游的RNA转录物。又如,如果本文的多核苷酸序列编码包含紧邻RNA组分的向导序列上游的锤头核酶序列的RNA,则核酶的例如前10个核糖核苷酸可与向导序列的前10个核糖核苷酸互补。在该示例中,锤头核酶可切割紧邻向导序列的第一位置上游的RNA转录物(或以另一方式来说,锤头核酶可切割紧邻核酶序列下游的RNA转录物)。
锤头核酶序列的示例如下表示:
NNNNNNcugaugaguccgugaggacgaauaagc(SEQ ID NO:15,N可以为A、U、C或G;参见实施例)。SEQ ID NO:15的前6个残基可被设计成与紧接由本文DNA多核苷酸表达的RNA转录物中的SEQ ID NO:15之后的(例如,本文所公开的crRNA或gRNA向导序列的)前6个残基互补(退火)。核酶可切割紧接SEQ ID NO:15之后的转录物。虽然SEQ ID NO:15示出具有用于与紧接SEQ ID NO:15之后的序列残基退火的6个残基(“N”),但出于该目的,在该核酶的开始处可具有5至15个“N”残基。应注意,在RNA转录物包含SEQ ID NO:15的情况下,(i)锤头核酶的螺旋体I可通过N残基与紧接转录物中SEQ ID NO:15之后的前6个残基退火而形成,(ii)螺旋体II可通过由单下划线指示的互补序列的退火形成,并且(iii)螺旋体III可通过由双下划线指示的互补序列退火形成。因此,在某些实施方案中,锤头核酶可以为SEQ ID NO:15的变体,其具有(i)与SEQ ID NO:15至少约80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性(在计算中排除“N”序列);以及(ii)与彼此退火以形成螺旋体II和III的SEQ ID NO:15的单下划线和双下划线区对齐的区域(螺旋体I由适当选择“N”残基形成)。
可连接至SEQ ID NO:15的序列的示例及其各种实施方案(上述)包括包含SEQ IDNO:64-70中一个的gRNA。
本文编码包含连接至RNA组分的5’锤头核酶的RNA序列的DNA多核苷酸(本文的“核酶-RNA组分盒”)可被设计成驱动5’-端紧接锤头核酶序列起始的转录物的转录(即核酶序列在转录起始位点处起始)。另选地,DNA多核苷酸可被设计成驱动具有核酶-RNA组分盒上游的非核酶序列的转录物的转录。例如,此类5’非核酶转录物序列可短至几个核苷酸(1-10个)长,最多长达5000-20000个核苷酸(当核酶从RNA组分切割自身时,从RNA组分去除核酶的该5’序列)。
在某些实施方案中,包含核酶-RNA组分盒的DNA多核苷酸可包含RNA组分序列下游的合适的转录终止序列。可用于本文中的转录终止序列的示例公开于美国专利申请公布2014/0186906中,该专利以引用方式并入本文。例如,可使用酿酒酵母Sup4基因转录终止序列(例如,SEQ ID NO:8)。此类实施方案通常不包含位于核酶-RNA组分盒下游的核酶序列。另外,取决于终止序列的选择,此类实施方案通常包含在RNA组分序列的端部之后的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30或更多个残基。这些附加残基可以全部为U残基,或例如至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%为U残基,其取决于终止序列的选择。另选地,核酶序列(例如,锤头核酶或HDV核酶)可以为RNA组分序列的3’(例如,1、2、3、4、5、6、7、8、9、10或更多个核苷酸);此类实施方案中的RNA组分序列可侧接有上游和下游核酶。3’核酶序列可相应地定位成使得其从RNA组分序列切割自身;此类切割可使得转录物正好在RNA组分序列的端部处终止,或具有在RNA组分序列的端部之后例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15或更多个残基。
在某些实施方案中,DNA多核苷酸可包含(i)启动子,所述启动子可操作地连接至(ii)包含多于一个核酶-RNA组分盒(即,串联盒)的序列。由此类DNA多核苷酸表达的转录物可具有例如2、3、4、5、6、7、8、9、10或更多个核酶-RNA组分盒。在每个RNA组分序列之后可任选地包含3’核酶序列(例如,如上所述)以允许从下游转录物序列切割和分离RNA组分。此类实施方案中的每个RNA组分通常被设计成将本文RGEN引导至独特的DNA靶位点。因此,此类DNA多核苷酸可相应地用于非常规酵母中以同时靶向例如多个不同的靶位点;此类使用可任选地表征为多路方法。连接至RNA组分(其连接至3’核酶)的5’锤头核酶可在本文中被称为“核酶-RNA组分-核酶盒”。可设计本文用于表达包含串联核酶-RNA组分-核酶盒的转录物的DNA多核苷酸,使得在每个盒之间存在约10、20、30、40、50、60、70、80、90、100或更多个核苷酸(例如,非编码间隔序列)。每个盒之间的距离可以相同或不同。
虽然上述实施方案中某些已经根据锤头核酶序列来进行描述,但此类实施方案还可相应地根据本文任何其它核酶序列(例如,HDV核酶),而不是锤头核酶序列来表征。本领域普通技术人员应当理解如何定位此类其它核酶序列以在特定位点处切割。
在某些实施方案中,酵母还包含DNA多核苷酸序列,所述DNA多核苷酸序列包含(i)启动子,所述启动子可操作地连接至(ii)编码Cas蛋白质(例如Cas9)的核苷酸序列。该多核苷酸序列由酵母使用以表达与RNA组分复合从而形成RGEN的Cas蛋白质。此类多核苷酸序列可以呈下列形式:质粒、YAC、粘粒、噬菌粒、BAC、病毒或线性DNA(例如线性PCR产物)、或可用于将多核苷酸序列转移到非常规酵母细胞中的任何其它类型的载体或构建体。例如,可使用本文所公开的任何Pol II启动子。上文关于用于表达RNA组分的DNA多核苷酸序列所公开的任何特征因此可应用于用于表达Cas蛋白质的DNA多核苷酸序列。该多核苷酸序列可瞬时(即,不整合到基因组中)或稳定(即,整合到基因组中)存在于本文的酵母细胞中。在其它方面,除了用于表达Cas蛋白质的DNA多核苷酸之外,酵母还可具有用于表达RNA组分的DNA多核苷酸(例如,如上所述的)。这些DNA多核苷酸均可以对酵母是稳定或瞬时的;另选地,用于表达Cas蛋白质的DNA多核苷酸可以是稳定的,并且用于表达RNA组分的DNA多核苷酸可以是瞬时的(或反之亦然)。
DNA多核苷酸序列可另选地为用于表达Cas蛋白质和适用于在酵母细胞中提供RGEN的RNA组分两者的DNA多核苷酸序列。此类DNA多核苷酸可包含,例如,(i)可操作地连接至编码(RGEN的)RNA组分的核苷酸序列的启动子(RNA组分盒),和(ii)可操作地连接至编码Cas蛋白质(例如,Cas9)的核苷酸序列的启动子(Cas盒)。关于用于表达Cas蛋白质或RNA组分的DNA多核苷酸的上述特征中的任一个可例如应用于用于在非常规酵母细胞中表达Cas蛋白质和合适的RNA组分两者的DNA多核苷酸序列。另外,本文所公开的Cas蛋白质和RNA组分(例如,crRNA或gRNA)中的任一个可由该DNA多核苷酸序列表达。在某些实施方案中,一种或多种RNA组分和/或Cas盒可包含在DNA多核苷酸序列内。在其它方面,一个或多个RNA组分可如上所述串联表达。用于Cas盒和RNA盒的启动子可以相同或不同。设想此类DNA多核苷酸序列可用于在非常规酵母和常规酵母两者中表达RGEN。
公开的发明还涉及将RNA引导的内切核酸酶(RGEN)靶向到非常规酵母中的染色体或附加体中的靶位点序列的方法。该方法包括向酵母的核提供RGEN,所述RGEN包含至少一种不具有5’端的RNA组分,其中所述RNA组分包含与靶位点序列互补的序列,并且其中RGEN结合到,并任选地切割全部或部分靶位点序列。
例如,可使用关于方法特征中每一个(例如,酵母类型、RGEN、RNA组分等)的上文所公开的实施方案或下文实施例中的任一个来进行该靶向方法。因此,上文或实施例中所公开的特征中的任一个,或这些特征的任何组合可适当用于表征本文靶向方法的实施方案。以下靶向方法特征是示例。
在本文靶向方法的某些实施方案中,非常规酵母可以为以下属中任一个的成员:耶氏酵母属、毕赤酵母属、许旺氏酵母属、克鲁维酵母属、Arxula属、丝孢酵母属、假丝酵母属、黑粉菌属、球拟酵母属、接合酵母属、三角酵母属、隐球酵母属、红酵母属、法夫酵母属、掷孢酵母属和管囊酵母属。解脂耶氏酵母是本文的合适的耶氏酵母。可用于靶向方法的非常规酵母的其它非限制性示例公开于本文中。
适用于本文靶向方法的RGEN可包含I型、II型或III型CRISPR体系的Cas蛋白质。Cas9蛋白质可用于某些实施方案中,诸如链球菌Cas9。适用于靶向方法中的链球菌Cas9蛋白质的示例包括包含源自下列的氨基酸序列的Cas9蛋白质:化脓链球菌、嗜热链球菌、肺炎链球菌、无乳链球菌、副溶血链球菌、口腔链球菌、唾液链球菌、猕猴链球菌、停乳链球菌、咽峡炎链球菌、星座链球菌、S.pseudoporcinus或变形链球菌Cas9蛋白质。可用于本文靶向方法的RGEN和Cas9蛋白质的其它非限制性示例公开于本文中。例如,可使用可切割DNA靶序列处的一个或两条链的RGEN。
用于本文靶向方法的RGEN的RNA组分可包含例如,gRNA,其包含可操作地连接至,或融合至tracrRNA的crRNA。如本文所公开的任何crRNA和/或tracrRNA(和/或其部分,诸如crRNA配对序列、或tracrRNA5’端序列)可例如包含在gRNA中。另外,例如,本文所公开的任何gRNA可用于靶向方法。
例如,PAM(前间区序列邻近基序)序列可邻近靶位点序列。在本文靶向方法的某些实施方案中,PAM序列紧接靶位点序列的下游、或在靶位点序列的下游的2个或3个核苷酸内,所述靶位点序列与靶位点中的链互补,所述靶位点中的链继而与RNA组分向导序列互补。在本文的实施方案中,其中RGEN为与RNA组分复合的内切核酸酶活性Cas9蛋白质,Cas9按照RNA组分引导而结合到靶序列,并切割紧邻PAM序列上游的第三核苷酸位置的5’的两条链。合适的PAM序列的示例包括化脓链球菌(NGG[SEQ ID NO:47])和嗜热链球菌(NNAGAA[SEQ ID NO:48])PAM序列,其可分别用于利用源自每个物种的Cas9蛋白质靶向。另外,例如,如本文所公开的任何PAM序列可用于靶向方法。
在本文的靶向方法的某些实施方案中,酵母还包含DNA多核苷酸序列,所述DNA多核苷酸序列包含(i)启动子,所述启动子可操作地连接至(ii)编码RNA组分的核苷酸序列。利用此类DNA多核苷酸可向酵母的核提供RGEN的RNA组分,因为RNA组分由DNA多核苷酸转录。适用于在酵母核中表达(RGEN)的RNA组分的DNA多核苷酸序列的示例在本文中公开。如本文所公开的启动子中任一种可用于此类DNA多核苷酸序列中,例如,强启动子和/或包含Pol II启动子序列的启动子。在某些实施方案中,编码RNA组分的DNA多核苷酸可用于在酵母中提供RNA组分,所述RNA组分已被工程化来表达Cas蛋白质(例如,稳定的Cas表达)。
例如,编码RNA组分的本文的核苷酸序列还可编码在编码RNA组分的序列上游的核酶。因此,在本文靶向方法的某些实施方案中,酵母可包含DNA多核苷酸序列,所述DNA多核苷酸序列包含(i)启动子,所述启动子可操作地连接至(ii)在5’-至-3’方向上编码核酶和RNA组分的核苷酸序列。利用此类DNA多核苷酸可向酵母的核提供RGEN的RNA组分,因为RNA组分由DNA多核苷酸转录。本文核酶可以为例如锤头核酶、丁型肝炎病毒(HDV)核酶、I组内含子核酶、RnaseP核酶、或发夹型核酶。例如,如本文所公开的任何核酶,以及如本文所公开的编码连接至RNA组分的核酶的任何多核苷酸序列可用于靶向方法。
在本文靶向方法的某些实施方案中,酵母还包含DNA多核苷酸序列,所述DNA多核苷酸序列包含(i)启动子,所述启动子可操作地连接至(ii)编码Cas蛋白质(例如Cas9)的核苷酸序列。利用此类DNA多核苷酸,可在酵母中提供RGEN的Cas蛋白质组分。适用于在酵母中表达(RGEN的)Cas蛋白质组分的DNA多核苷酸序列的示例在本文中公开。如本文所公开的启动子中任一种可用于此类DNA多核苷酸序列中,例如,强启动子。
在靶向方法的某些实施方案中,还可向酵母提供包含与DNA靶位点序列处或附近的序列同源的至少一个序列的供体多核苷酸(连同提供在靶位点序列处切口或切割的RGEN)。合适的示例包括具有同源臂的供体多核苷酸。例如,如本文所公开的任何供体多核苷酸可用于靶向方法中。该方法的此类实施方案通常涉及供体多核苷酸和靶序列之间的HR(在靶序列的RGEN介导的切口或切割之后);因此,这些方法还可任选地被称为在非常规酵母中进行HR的方法。本文公开了可通过该方法进行的HR策略的示例。用于在酵母细胞中靶向的供体DHA多核苷酸的合适量可以为至少约300、400、500、600、700或800分子的供体DNA/酵母细胞。
包含本文所述用于表达RGEN组分的DNA多核苷酸的任何构建体或载体可通过任何标准技术引入非常规酵母细胞中。这些技术包括例如转化(例如,乙酸锂转化(Methods inEnzymology,194:186-187)、基因枪轰击、电穿孔和显微注射。例如,美国专利4880741和5071764,和Chen等人(Appl.Microbiol.Biotechnol.48:232-235),上述文献以引用方式并入本文,描述了用于解脂耶氏酵母的DNA转化技术。
可进行本文靶向方法,以用于在非常规酵母中形成插入缺失的目的。此类方法可如上文所公开的进行,但不另外提供可在靶DNA位点处或附近经历HR的供体DNA多核苷酸(即,在该方法中诱导NHEJ)。可形成的插入缺失的示例在本文中公开。插入缺失的尺寸可以为例如1、2、3、4、5、6、7、8、9、10或更多个碱基。在某些实施方案中,插入缺失可以甚至更大,诸如至少约20、30、40、50、60、70、80、90、100、110、120、130、140或150个碱基。在其它实施方案中,插入或缺失可以为至少约500、750、1000或1500个碱基。在某些实施方案中,当试图形成插入缺失时,单碱基替换可替代地在靶位点序列中形成。因此,可进行本文的靶向方法以例如用于形成单碱基替换的目的。
在目的在于插入缺失形成的本文靶向方法的某些实施方案中,非常规酵母(例如,解脂耶氏酵母)中的插入缺失形成频率显著高于可在常规酵母诸如酿酒酵母中使用相同或相似靶向策略观察到的。例如,虽然常规酵母中的插入缺失形成频率可以为约0.0001至0.001(DiCarlo等人,Nucleic Acids Res.41:4336-4343),但本文非常规酵母中的频率可以为至少约0.05、0.10、0.15、0.20、0.25、0.30、0.35、0.40、0.45、0.50、0.55、0.60、0.65、0.70、0.75或0.80。因此,在本文非常规剂酵母中的插入缺失形成频率可以比可在常规酵母中使用相同或相似Cas介导的靶向策略观察到的高例如至少约50、100、250、500、750、1000、2000、4000或8000倍。这些实施方案的某些方面可关于不包括供体DNA,和/或其中RGEN组分(Cas和合适的RNA组分)由相同载体/构建体表达的靶向方法。
本文的靶向方法可例如以在所述方法中靶向2个或更多个DNA靶位点的方式来进行。此类方法可包括向酵母提供DNA多核苷酸,其表达包含如本文所公开的串联核酶-RNA组成盒(例如,串联核酶-RNA组分-核酶盒)的转录物。该方法可靶向非常接近相同序列的DNA位点(例如,启动子或开放阅读框,和/或彼此间隔的位点(例如,在不同基因和/或染色体中))。取决于期望的靶向结果,此类方法可在具有(对于HR)或不具有(对于导致插入缺失和/或碱基替换的NHEJ)合适的供体DNA多核苷酸的情况下进行。
在某些实施方案中,可进行靶向方法以破坏编码蛋白质和非编码RNA的一个或多个DNA多核苷酸序列。可被靶向用于破坏的此类序列的示例为编码标记物的序列(例如,标记基因)。本文标记物的非限制性示例包括可筛选标记物和可选择标记物。本文的可筛选标记物可以为在合适条件下使酵母在视觉上不同的标记物。可筛选标记物的示例包括编码β-葡糖醛酸糖苷酶(GUS)、β-半乳糖苷酶(lacZ)和荧光蛋白(例如GFP、RFP、YFP、BFP)的多核苷酸。本文的可选择标记物可以为使得酵母对选择性试剂或选择性环境具有抗性的标记物。可选择标记物的示例为营养缺陷型标记物,诸如HIS3、LEU2、TRP1、MET15或URA3,其使得酵母在不存在外源提供的组氨酸、亮氨酸、色氨酸、甲硫氨酸或尿嘧啶的情况下存活。可选择标记物的其它示例是抗生素(抗真菌)-抗性标记物,诸如对潮霉素B、诺尔丝菌素、腐草霉素、嘌呤霉素或新霉素(例如G418)具有酵母抗性的那些。
在某些实施方案中,破坏标记物的至少一个目的可以是用于标记物再循环。标记物再循环是一种方法,例如,包括(i)用标记物和异源DNA序列转化酵母,(ii)选择包含标记物和异源DNA序列的经转化酵母(其中标记物可选择酵母通常具有包含异源DNA序列的更高机会),(iii)破坏标记物,并且然后根据需要重复步骤(i)-(iii)多次(使用相同的标记物,但每次循环使用不同的异源DNA序列)以利用多个异源DNA序列转化酵母。在该过程中,一个或多个异源序列可包含呈供体多核苷酸形式的标记物本身(例如,侧接有用于靶向特定基因座的同源臂的标记物)。本文的标记物再循环方法的示例包括使用URA3作为非常规酵母诸如解脂耶氏酵母中的标记物的那些。
本文所公开的组合物和方法的非限制性示例如下:
1.一种非常规酵母,其包含至少一种RNA引导的内切核酸酶(RGEN),所述RNA引导的内切核酸酶包含至少一种不具有5’-端的RNA组分,其中所述RNA组分包含与酵母中的染色体或附加体上的靶位点序列互补的序列,其中所述RGEN可结合到全部或部分靶位点序列。
2.根据实施方案1所述的非常规酵母,其中所述RGEN可结合到并切割全部或部分靶位点序列。
3.根据实施方案1所述的酵母,其中所述酵母为选自下列属的成员:耶氏酵母属,毕赤酵母属、许旺氏酵母属、克鲁维酵母属、Arxula属、丝孢酵母属、假丝酵母属、黑粉菌属、球拟酵母属、接合酵母属、三角酵母属、隐球酵母属、红酵母属性、法夫酵母属、掷孢酵母属和管囊酵母属。
4.根据实施方案1所述的酵母,其中所述RGEN包含CRISPR(聚集状规则间隔的短回文重复序列)-缔合的(Cas)蛋白质-9(Cas9)氨基酸序列。
5.根据实施方案4所述的酵母,其中所述Cas9蛋白质为链球菌Cas9蛋白质。
6.根据实施方案4所述的酵母,其中所述RNA组分包含向导RNA(gRNA),所述向导RNA包含可操作地连接至反式激活CRISPR RNA(tracrRNA)的CRISPR RNA(crRNA)。
7.根据实施方案4所述的酵母,其中PAM(前间区序列邻近基序)序列邻近靶位点序列。
8.一种非常规酵母,其包含多核苷酸序列,所述多核苷酸序列包含可操作地连接至至少一个核苷酸序列的启动子,其中所述核苷酸序列包含编码在编码RNA组分的DNA序列上游的核酶的DNA序列,其中所述RNA组分包含与酵母中染色体或附加体上的靶位点序列互补的可变靶向结构域,其中所述RNA组分可形成RNA-引导的内切核酸酶(RGEN),其中所述RGEN可结合到全部或部分靶位点序列。
9.根据实施方案8所述的非常规酵母,其中所述RGEN可结合到并切割全部或部分靶位点序列。
10.根据实施方案8所述的非常规酵母,其中由核苷酸序列转录的RNA自催化地去除核酶以产生所述RNA组分,其中所述RNA组分不具有5’端。
11.根据实施方案10所述的非常规酵母,其中所述核酶为锤头核酶、丁型肝炎病毒核酶、I组内含子核酶、RnaseP核酶、或发夹型核酶。
12.根据实施方案8所述的非常规酵母,其中由核苷酸序列转录的RNA不自催化地去除核酶以产生不具有5’端的核酶-RNA组分融合分子。
13.根据实施方案12所述的非常规酵母,其中所述核酶为HDV核酶。
14.根据实施方案8所述的非常规酵母,其中所述启动子为强启动子。
15.根据实施方案8所述的非常规酵母,其中所述启动子包含Poi II启动子序列。
16.一种将RNA引导的内切核酸酶(RGEN)靶向到非常规酵母中的染色体或附加体上的靶位点序列的方法,所述方法包括向所述酵母提供RGEN,所述RGEN包含至少一种不具有5’端的RNA组分,其中所述RNA组分包含与靶位点序列互补的序列,其中所述RGEN结合到全部或部分靶位点序列。
17.根据实施方案16所述的方法,其中所述RGEN可结合到并切割全部或部分靶位点序列。
18.一种将RNA引导的内切核酸酶(RGEN)靶向到非常规酵母中的染色体或附加体上的靶位点序列的方法,所述方法包括向所述酵母提供RGEN,所述RGEN包含至少一个核酶-RNA组分融合分子,其中所述RNA组分包含与靶位点序列互补的序列,其中所述RGEN结合到全部或部分靶位点序列。
19.根据实施方案18所述的方法,其中所述RGEN可结合到并切割全部或部分靶位点序列。
20.一种将RNA引导的内切核酸酶(RGEN)靶向到非常规酵母中的染色体或附加体上的靶位点序列的方法,所述方法包括向所述酵母提供第一重组DNA构建体,所述第一重组DNA构建体包含编码Cas内切核酸酶的DNA序列,和至少第二重组DNA构建体,所述第二重组DNA构建体包含编码RNA组分上游的核酶的DNA序列,其中由所述第二重组DNA构建体转录的RNA自催化地去除核酶以产生所述RNA组分,其中所述RNA组分和Cas9内切核酸酶可形成RGEN,所述RGEN可结合到全部或部分靶位点序列。
21.根据实施方案20所述的方法,其中所述RGEN可结合到并切割全部或部分靶位点序列。
22.一种将RNA引导的内切核酸酶(RGEN)靶向到非常规酵母中的染色体或附加体上的靶位点序列的方法,所述方法包括向所述酵母提供第一重组DNA构建体,所述第一重组DNA构建体包含编码Cas内切核酸酶的DNA序列,和至少第二重组DNA构建体,所述第二重组DNA构建体包含编码核酶-RNA组分融合分子的DNA序列,其中所述核酶-RNA组分融合分子和Cas9内切核酸酶可形成RGEN,所述RGEN可结合到并任选地切割全部或部分靶位点序列。
23.根据实施方案22所述的方法,其中所述RGEN可结合到并切割全部或部分靶位点序列。
24.一种用于修饰非常规酵母中的染色体或附加体上的靶位点的方法,所述方法包括向非常规酵母提供第一重组DNA构建体,所述第一重组DNA构建体包含编码Cas内切核酸酶的DNA序列,和第二重组DNA构建体,所述第二重组DNA构建体包含编码RNA组分上游的核酶的DNA序列,其中由所述第二重组DNA构建体转录的RNA自催化地去除核酶以产生不具有5’端的所述RNA组分,其中所述Cas9内切核酸酶在所述靶位点处引入单链或双链断裂。
25.一种用于修饰非常规酵母中的染色体或附加体上的靶位点的方法,所述方法包括向非常规酵母提供第一重组DNA构建体,所述第一重组DNA构建体包含编码Cas内切核酸酶的DNA序列,和第二重组DNA构建体,所述第二重组DNA构建体包含编码不具有5’端的核酶-RNA组分融合分子的DNA序列,其中所述核酶-RNA组分融合分子和Cas9内切核酸酶可形成RGEN,所述RGEN在所述靶位点处引入单链或双链断裂。
26.一种用于修饰非常规酵母中的染色体或附加体上的多个靶位点的方法,所述方法包括向非常规酵母提供至少第一重组DNA构建体,所述第一重组DNA构建体包含编码Cas内切核酸酶的DNA序列,和至少第二重组DNA构建体,所述第二重组DNA构建体包含可操作地连接至至少一个多核苷酸的启动子,其中所述至少一个多核苷酸编码包含RNA组分上游的核酶的RNA分子,其中所述RNA分子自催化地去除核酶以产生所述RNA组分,其中Cas9内切核酸酶在所述靶位点处引入单链或双链断裂。
27.一种用于修饰非常规酵母中的染色体或附加体上的多个靶位点的方法,所述方法包括向非常规酵母提供至少第一重组DNA构建体,所述第一重组DNA构建体包含编码Cas内切核酸酶的DNA序列,和至少第二重组DNA构建体,所述第二重组DNA构建体包含可操作地连接至至少一个多核苷酸的启动子,其中所述至少一个多核苷酸编码核酶-RNA组分融合分子,其中所述核酶-RNA组分融合分子和Cas9内切核酸酶可形成RGEN,所述RGEN在所述靶位点处引入单链或双链断裂。
28.根据实施方案22-25中任一项所述的方法,所述方法还包括鉴定在所述靶位点处具有修饰的至少一种非常规酵母细胞,其中所述修饰包括所述靶位点中的一个或多个核苷酸的至少一个缺失、添加或替换。
29.根据实施方案24-28中任一项所述的方法,所述方法还包括向所述酵母提供供体DNA,其中所述供体DNA包含目的多核苷酸。
30.根据实施方案29所述的方法,所述方法还包括鉴定在其染色体或附加体中包含整合在所述靶位点处的目的多核苷酸的至少一种酵母细胞。
31.一种用于编辑非常规酵母中的染色体或附加体上的核苷酸序列的方法,所述方法包括向非常规酵母提供多核苷酸修饰模板DNA,第一重组DNA构建体,所述第一重组DNA构建体包含编码Cas内切核酸酶的DNA序列,和第二重组DNA构建体,所述第二重组DNA构建体包含编码RNA组分上游的核酶的DNA序列,其中由第二重组DNA构建体转录的RNA自催化地去除核酶以产生不具有5’端的所述RNA组分,其中所述Cas9内切核酸酶在所述酵母的染色体或附加体中的靶位点处引入单链或双链断裂,其中所述多核苷酸修饰模板DNA包含所述核苷酸序列的至少一个核苷酸修饰。
32.一种用于编辑非常规酵母中的染色体或附加体上的核苷酸序列的方法,所述方法包括向非常规酵母提供多核苷酸修饰模板DNA,第一重组DNA构建体,所述第一重组DNA构建体包含编码Cas内切核酸酶的DNA序列,和第二重组DNA构建体,所述第二重组DNA构建体包含编码不具有5’端的核酶-RNA组分融合分子的DNA序列,其中所述核酶-RNA组分融合分子和Cas9内切核酸酶可形成RGEN,所述RGEN在所述酵母的染色体或附加体中的靶位点处引入单链或双链断裂,其中所述多核苷酸修饰模板DNA包含所述核苷酸序列的至少一个核苷酸修饰。
33.一种用于编辑非常规酵母中的染色体或附加体上的核苷酸序列的方法,所述方法包括向非常规酵母提供至少一种多核苷酸修饰模板DNA、至少第一重组DNA构建体,所述第一重组DNA构建体包含编码Cas内切核酸酶的DNA序列,和至少第二重组DNA构建体,所述第二重组DNA构建体包含可操作地连接至至少一个多核苷酸的启动子,其中所述至少一个多核苷酸编码包含RNA组分上游的核酶的RNA分子,其中所述RNA分子自催化地去除核酶以产生不具有5’端的所述RNA组分,其中所述Cas9内切核酸酶在所述酵母的染色体或附加体中的靶位点处引入单链或双链断裂,其中所述多核苷酸修饰模板DNA包含所述核苷酸序列的至少一个核苷酸修饰。
34.一种用于编辑非常规酵母中的染色体或附加体上的核苷酸序列的方法,所述方法包括向非常规酵母提供至少一个多核苷酸修饰模板DNA、至少第一重组DNA构建体,所述第一重组DNA构建体包含编码Cas内切核酸酶的DNA序列的,和至少第二重组DNA构建体,所述第二重组DNA构建体包含可操作地连接至至少一个多核苷酸的启动子,其中所述至少一个多核苷酸编码不具有5’端的核酶-RNA组分融合分子,其中所述核酶-RNA组分融合分子和Cas9内切核酸酶可形成RGEN,所述RGEN在所述酵母的染色体或附加体中的靶位点处引入单链或双链断裂,其中所述多核苷酸修饰模板DNA包含所述核苷酸序列的至少一个核苷酸修饰。
35.根据实施方案24-34中任一项所述的方法,其中所述第一重组DNA和第二重组DNA位于相同质粒上。
36.根据实施方案24-34中任一项所述的方法,其中所述第一重组DNA和第二重组DNA位于独立的质粒上。
37.一种用于使非常规酵母中的染色体或附加体上的核苷酸序列沉默的方法,所述方法包括向非常规酵母提供至少第一重组DNA构建体,所述第一重组DNA构建体包含编码失活的Cas内切核酸酶的DNA序列,和至少第二重组DNA构建体,所述第二重组DNA构建体包含可操作地连接至至少一个多核苷酸的启动子,其中至少一个多核苷酸编码不具有5’端的核酶-RNA组分融合分子,其中所述核酶-RNA组分融合分子和失活的Cas9内切核酸酶可形成RGEN,所述RGEN结合到所述酵母的染色体或附加体中的所述核苷酸序列,从而阻断所述核苷酸序列的转录。
38.一种用于生产非常规酵母中的基因修饰用多重向导RNA的高通量方法,所述方法包括:
a)提供重组DNA构建体,其包含以5’至3’的顺序可操作地连接至下列的启动子:编码核酶的第一DNA序列、编码反向选择剂的第二DNA序列、编码向导RNA的CER结构域的第三DNA序列和终止序列;
b)向(a)的重组DNA构建体提供至少一个寡核苷酸双链体,其中所述寡核苷酸双链体源自包含能够编码向导RNA靶序列的可变靶向结构域(VT)的DNA序列的第一单链寡核苷酸与包含编码可变靶向结构域的DNA序列的互补序列的第二单链寡核苷酸的组合;
c)将(a)的反向选择剂与(b)的至少一个寡双链体交换,从而形成重组DNA构建体库,其各自包含能够编码向导RNA的可变靶向结构域的DNA序列;以及,
d)转录(c)的重组DNA构建体库,从而形成核酶-向导RNA分子库。
39.根据实施方案38所述的方法,所述方法还包括诱导核酶-向导RNA分子库使得所述分子自催化地去除核酶和核酶上游的任何RNA序列,以产生不包含5’端的向导RNA分子库。
40.根据实施方案38所述的方法,所述方法还包括诱导核酶-向导RNA分子库使得所述分子切割核酶上游的任何RNA序列,以产生不包含5’端的核酶-gRNA融合分子。
41.一种重组DNA序列,其包含(i)聚合酶II启动子,所述聚合酶II启动子可操作地连接至(ii)编码核酶和向导RNA的核苷酸序列,其中所述核酶在所述向导RNA上游,其中由(ii)的核苷酸序列转录的RNA自催化地去除核酶以产生所述向导RNA,并且其中所述向导RNA可形成RGEN,所述RGEN可识别、结合到、和任选地切割非常规酵母的基因组中的靶位点。
42.一种重组RNA序列,其包含核酶和向导RNA,其中所述核酶在所述向导RNA的上游,其中所述核酶可被自催化地去除以产生所述向导RNA,并且其中所述向导RNA可形成RGEN,所述RGEN可识别、结合到和任选地切割非常规酵母的基因组中的靶位点。
43.一种重组DNA序列,其包含(i)聚合酶II启动子,所述聚合酶II启动子可操作地连接至(ii)编码核酶和向导RNA的核苷酸序列,其中所述核酶在所述向导RNA的上游,其中由(ii)的核苷酸序列转录的RNA产生核酶-向导RNA融合分子,并且其中所述核酶-向导融合分子可形成RGEN,所述RGEN可识别、结合到和任选地切割非常规酵母的基因组中的靶位点。
44.一种重组RNA序列,其包含核酶-向导RNA融合分子,其中所述核酶-向导RNA融合分子可形成RGEN,所述RGEN可识别、结合到和任选地切割非常规酵母的基因组中的靶位点。
实施例
所公开的本发明将在以下的实施例中进一步阐述。应该理解,尽管这些实施例说明了本发明的某些优选方面,但仅是以例证的方式给出的。通过上述论述和这些实施例,本领域的技术人员可确定本发明的必要特征,并且在不脱离本发明的实质和范围内的前提下,可对本发明进行各种变化和修改以适应多种用途和条件。
实施例1
由耶氏酵母中的Pol III启动子表达的sgRNA不将Cas9引导至靶位点并介导DNA切
割
该示例公开了被设计用于表达靶向Leu2基因座的解脂耶氏酵母中的sgRNA和Cas9蛋白质的载体和盒。如果该酵母中产生的sgRNA和Cas9可与靶位点相互作用、找到并切割靶位点,则突变应当经由靶位点处的易错非同源末端接合(NHEJ)产生。
图1示出了sgRNA分子,其为单个RNA分子,所述RNA分子包含两个区域,可变靶向结构域(VT)(向导序列)和Cas内切核酸酶识别结构域(CER)。VT区可以为具有与靶核酸分子同一性的RNA多核苷酸的20聚体。VT结构域指定了用于在位于PAM基序(例如NGG,SEQ ID NO:47)的5’的靶位点中切割的靶位点。CER结构域与Cas9蛋白质相互作用并使得VT结构域相互作用并引导Cas9蛋白质切割(Jinek等人,Science 337:816-821)。VT结构域和CER结构域两者都是sgRNA的功能所需要的
编码将Cas9靶向到耶氏酵母的LEU2基因座的编码区中的三个独立靶位点(Leu2-1、Leu2-2、Leu2-3)的VT结构域的DNA序列列于表3中。表3还列出了编码靶向耶氏酵母CAN1基因座的编码区的VT结构域的DNA序列。
表3
编码用于利用Cas9靶向耶氏酵母中的LEU2或CAN1基因座的sgRNAVT结构域的DNA
序列
Leu2-1<sup>a</sup>(SEQ ID NO:2) | TCCAAGAAGATTGTTCTTCT |
Leu2-2<sup>a</sup>(SEQ ID NO:3) | CTCCGTCATCCCCGGTTCTC |
Leu2-3<sup>a</sup>(SEQ ID NO:4) | CGGCGACTTCTGTGGCCCCG |
Can1-1<sup>b</sup>(SEQ ID NO:17) | TCAAACGATTACCCACCCTC |
a由Leu2-1、Leu2-2和Leu2-3靶向的LEU2基因位点分别具有CGG、TGG或AGG作为PAM位点。
b由Can1-1靶向的CAN1基因位点具有CGG作为PAM位点。
表3中LEU2靶向DNA序列中的每一个独立地融合至编码CER结构域(SEQ ID NO:1)的DNA序列,所述CER结构域与化脓链球菌Cas9蛋白质相互作用,从而形成编码具有CER结构域和VT结构域两者的完整sgRNA的DNA序列(注意,SEQ ID NO:1在5’-至-3’方向上包含SEQID NO:56的tracrRNA配对序列、SEQ ID NO:43成环序列(GAAA)、和SEQ ID NO:58的tracrRNA序列)。为了在细胞核中表达这些sgRNA,并且回避核输出和5’修饰体系,将编码sgRNA的DNA序列置于对来自酿酒酵母(Snr52[SEQ ID NO:5]或Rpr1[SEQ ID NO:6])或解脂耶氏酵母(Snr52[SEQ ID NO:7])的RNA Pol III启动子的控制下。具体地讲,将Sc Snr52融合至Leu2-1,将Sc Rprl融合至Leu2-2,并且将Yl Snr52融合至Leu2-3。将编码每种sgRNA的DNA序列的3’端融合至来自酿酒酵母的Sup4基因的强终止子(SEQ ID NO:8)。因此,制备三种不同的Pol III-驱动的sgRNA盒。
按照标准技术,将来自化脓链球菌M1 GAS(SF370)的Cas9基因的开放阅读框经密码子优化以在耶氏酵母中表达,产生SEQ ID NO:9。在SEQ ID NO:9的最后有义密码子之后掺入编码猿猴病毒40(SV40)单倍体核定位信号(NLS)加上短接头(4个氨基酸)的DNA序列以得到SEQ ID NO:10。SEQ ID NO:10编码以SEQ ID NO:11示出的氨基酸序列。SEQ ID NO:11的最后七个氨基酸编码附加的NLS,然而在SEQ ID NO:11的位置1369-1372处的残基编码附加的接头。通过标准分子生物学技术,将经耶氏酵母密码子优化的Cas9-NLS序列(SEQ IDNO:10)融合至耶氏酵母组成型启动子,FBA1(SEQ ID NO:12)。经耶氏酵母密码子优化的Cas9表达盒(SEQ ID NO:13)的示例示于图2A中,其包含组成型FBA1启动子、经耶氏酵母密码子优化的Cas9和SV40NLS。将该Cas9表达盒(SEQ ID NO:13)克隆到质粒pZUF中,得到构建体pZUFCas9(图3A,SEQ ID NO:14)。
将sgRNA表达盒(上述)中的每个独立地克隆到pZUFCas9(SEQ ID NO:14)的PacI/ClaI位点中,以获得pZUFCas9/sgRNA构建体,所述构建体可用于利用经耶氏酵母密码子优化的Cas9表达盒和Pol III驱动的sgRNA表达盒共转化酵母细胞。此类构建体的示例为pZUFCas9/PolIII-sgRNA(图3B),其包含用于在耶氏酵母中靶向Leu2-3的Yl Snr52-sgRNA表达盒。
利用200ng质粒pZUFCas9(SEQ ID NO:14)或特定的pZUFCas9/sgRNA(例如pZUFCas9/PolIII-sgRNA,图3B)转化尿嘧啶营养缺陷型解脂耶氏酵母细胞,并在缺乏尿嘧啶的完整最小板(CM-ura)上选择尿嘧啶原养型。在缺乏亮氨酸的完整最小板(CM-leu)上对在CM-ura板上产生的群落筛选亮氨酸营养缺陷型。尿嘧啶原养型转化体均不显示出亮氨酸营养缺陷型。这些结果表示经耶氏酵母密码子优化的Cas9和Pol III启动子驱动的sgRNA不被表达、不产生、不相互作用、不靶向DNA、和/或不切割DNA。如果该实验产生了亮氨酸营养缺陷型,则该结果可能指示Cas9/sgRNA复合物靶向并切割Leu2编码区,导致易错NHEJ和随后的插入缺失形成,从而形成移码突变。
因此,其显示sgRNA的Pol III驱动表达不可用于在耶氏酵母中提供功能性Cas9-sgRNA复合物。
实施例2
包含由DNA聚合酶II启动子驱动的5’-和3’-核酶的经耶氏酵母优化的sgRNA表达
盒
该实施例公开了经优化用于在耶氏酵母中表达和Cas9-介导的靶向的sgRNA。用于此类表达的每个盒包含Pol II启动子,其用于驱动融合至5’-核酶和3’-核酶的sgRNA(核酶-sgRNA-核酶,或RGR)的转录。提供5’和3’核酶以从sgRNA去除Pol II启动子相关的转录修饰物,诸如5’端结构,仅保留sgRNA序列。这些表达盒允许用于sgRNA表达的更宽的启动子选择。另外,由这些盒转录的sgRNA不经受核输出,因为其缺乏5’-端结构。这些特征允许sgRNA在耶氏酵母细胞中的稳健表达,因此它们可以将Cas9内切核酸酶引导到体内基因组的靶区域。
将5’-锤头(HH)核酶和3’-丁型肝炎病毒(HDV)核酶加入sgRNA序列中使得sgRNA由任何启动子表达但不考虑在由一些RNA聚合酶(例如Pol II)转录的启动子处发生的后转录修饰并绕过了当前对用于sgRNA表达的启动子的有限选择。当表达此类sgRNA时,核酶在pre-sgRNA转录自切割时存在,从而与转录物分离,留下未修饰的sgRNA。
对于每个测试的sgRNA,编码sgRNA的DNA序列(i)在其5’端处融合至编码5’HH核酶的序列(SEQ ID NO:15)并且(ii)在其3’端处融合至编码3’HDV核酶的序列(SEQ ID NO:16)。HH核酶的5′-连接是使得HH核酶的前6个核苷酸为sgRNA的VT区(向导序列)的前6个核苷酸的反向互补序列这样的连接。使用标准分子生物学技术将每个核酶侧接的pre-sgRNA(RGR)融合至FBA1启动子(SEQ ID NO:12)以产生经耶氏酵母优化的sgRNA表达盒(最终的盒描述于图2B中)。此类盒的示例性序列以SEQ ID NO:18示出,其包含可操作地连接至编码RGR(HH-sgRNA-HDV)的序列的FBA1启动子(SEQ ID NO:12),其中sgRNA包含由SEQ ID NO:17(Can1-1)编码的VT结构域和SEQ ID NO:1作为其CER结构域(注意,SEQ ID NO:18的CER结构域-编码区、pRF38(SEQ ID NO:19)和pRF84(SEQ ID NO:41)中的每个具有附加的“TGG”,其中此类“TGG”介于对应于SEQ ID NO:1(CER结构域)的位置73-74的残基位置之间)。该VT结构域靶向耶氏酵母CAN1基因开放阅读框(GenBank登录号NC_006068,YALI0B19338g,染色体B的~bp 2557513-2559231)的编码区中的位点。编码的HH核酶的前6个残基与sgRNA的前6个残基(即,VT结构域的前6个残基)互补。注意,在SEQ ID NO:18中存在紧接SEQ ID NO:12(FBA1启动子)之后的三个残基(ATG),据信其不影响pre-sgRNA的表达和核酶介导的自催化。将SEQ ID NO:18克隆到称为pRF38的构建体中(图3C,SEQ ID NO:19)。
因此,制备用于表达不具有5’和3’pol II启动子相关转录修饰的sgRNA的DNA盒。这些类型的盒用于实施例3中用于耶氏酵母中的Cas9基因靶向。
实施例3
经耶氏酵母优化的sgRNA可用于sgRNA/Cas9内切核酸酶体系中以切割染色体DNA
该实施例公开了使用如实施例2中所述的经耶氏酵母优化的sgRNA表达盒以表达sgRNA,所述sgRNA可与Cas9一起用于识别和切割耶氏酵母中的染色体DNA。此类切割通过预测的DNA切割位点的区域中突变的出现来表现,这是由于切割位点处的易错NHEJ DNA修复。
靶向解脂耶氏酵母的CAN1基因用于切割。分别通过表型(刀豆氨酸抗性)和对突变频率和频谱的测序来检查耶氏酵母转化体中CAN1的成功靶向。
Ura-解脂耶氏酵母细胞(菌株Y2224,直接源自菌株ATCC 20362的尿嘧啶营养缺陷型,公开于美国专利申请公布2010/0062502中,其以引用方式并入本文)通过利用pZUFCas9(图3A,SEQ ID NO:14)和由包含用于靶向CAN1基因座的经耶氏酵母优化的RGR pre-sgRNA盒(包含于SEQ ID NO:18)的pRF38(图3C,SEQ ID NO:19)扩增的线性PCR产物,通过锂离子介导的转化(Ito等人,J.Bacteriology 153:163-168)来共转化。用于该PCR扩增的引物为SEQ ID NO:20(正向)和SEQ ID NO:21(反向)。仅利用pZUFCas9(SEQ ID NO:14)转化的Ura-解脂耶氏酵母细胞(Y2224)用作阴性对照。在CM-ura培养基上选择利用pZUFCas9(SEQ IDNO:14)和RGR pre-sgRNA表达盒转化的细胞作为尿嘧啶原养型。通过将CM-ura板平板复制到缺乏尿嘧啶、缺乏精氨酸并补充有60μg/ml有毒精氨酸类似物,刀豆氨酸的完整最小培养基(CM+can)上,筛选在CAN1基因中包含功能丧失突变的细胞。具有功能性CAN1基因的细胞可将刀豆氨酸传输到细胞中导致细胞死亡。在CAN1基因中具有功能丧失等位基因的细胞不传输刀豆氨酸并且能够在CM+can板上生长。
对于仅利用Cas9转化的细胞,通过刀豆氨酸抗性的表型筛选回收的功能丧失突变体的频率为零(图4)。然而,当利用RGR pre-sgRNA表达盒共转化Cas9时,刀豆氨酸抗性转化体的频率增加至10%(图4)。
使用正向(SEQ ID NO:22)和反向(SEQ ID NO:23)PCR引物扩增刀豆氨酸抗性菌落的CAN1基因座。使用ZymocleanTM和浓缩柱(Zymo Research,Irvine,CA)纯化PCR产物。使用测序引物SEQ ID NO:24对PCR产物进行测序(Sanger法)。将序列与包含靶位点的野生型(WT)耶氏酵母CAN1编码序列进行比对(图5)。在表达Cas9和sgRNA两者的细胞中的CAN1基因座处的主要功能丧失突变(测序分离物的73%)为Cas9切割位点处的-1移码突变(图5)。少量其它缺失和插入组成CAN1基因座处的剩余突变。总之,90%的突变为小缺失和插入(图5)。很少发生其它事件,诸如插入少量来自另一染色体的序列(4%),在切割位点处插入经耶氏酵母优化的sgRNA表达盒(1.5%),或较大缺失(1%)。3.5%经筛选的刀豆氨酸抗性菌落在CAN1基因座处具有复杂的重组,其不通过测序确定。总之,在CAN1靶位点处观察到的突变指示易错NHEJ用于细胞中以修复由Cas9/sgRNA复合物形成的切割。
(i)在转化以表达CAN1-特异性Cas9内切核酸酶的细胞中刀豆氨酸抗性菌落的频率增加,和(ii)指示刀豆氨酸抗性突变是由于预测Cas9切割位点处的易错NHEJ事件的测序数据两者均确认实施例2中所述的经耶氏酵母优化的Cas9和RGR pre-sgRNA表达盒切割耶氏酵母染色体DNA并形成突变。
因此,表达不具有5’端的RGEN(例如Cas9)的RNA组分(例如,sgRNA),其中RNA组分的5’端通过核酶自催化地去除,允许在非常规酵母中对DNA序列进行RGEN-介导的靶向。
实施例4
由5’核酶但不由3’核酶表达的经耶氏酵母优化的sgRNA可用于sgRNA/Cas9内切核
酸酶体系中用于切割染色体DNA
在该实施例中,评价由经耶氏酵母优化的盒(其仅包含5’HH核酶,但不具有3’核酶)产生的sgRNA的功能性,以确定sgRNA是否可与Cas9相互作用、识别DNA靶序列、通过Cas9诱导DNA切割、并由易错NHEJ导致突变。
由Pol II启动子转录的RNA在其5′和3′端两者处被重加工和修饰,表明为了由PolII启动子产生功能性sgRNA,必须切除5′和3′端。先前已经示出,在体外由旁侧区产生的sgRNA:(i)如果存在5′-旁侧区则是非功能性的,和(ii)如果存在3′旁侧区则是显著功能缺陷的(Gao等人,J.Integr.Plant Biol.56:343-349)。如果包含5′核酶和3′旁侧区的pre-sgRNA连同Cas9一起表达酿酒酵母,则sgRNA不用于将Cas9引导至靶位点用于切割(Gao等人,同上)。
为测试5′核酶-侧接的sgRNA(缺乏3′-定位的核酶)是否可在非常规酵母中起作用,构建经耶氏酵母优化的sgRNA表达盒(SEQ ID NO:25),其包含在5’-至-3’方向上的FBA1启动子(SEQ ID NO:12),所述启动子融合至HH核酶(SEQ ID NO:15),所述核酶融合至编码靶向Can1-1靶位点(SEQ ID NO:17)的sgRNA(示例为SEQ ID NO:70)的序列,所述Can1-1靶位点融合至来自酿酒酵母Sup4基因(SEQ ID NO:8)的强转录终止子(该盒可以表征为表达RG[核酶-sgRNA]RNA)。在RG表达盒中编码的sgRNA包含对应于SEQ ID NO:17的VT结构域,其连接至CER结构域(SEQ ID NO:1)。编码的HH核酶的前6个残基与sgRNA的前6个残基(即,VT结构域的前6个残基)互补。注意,在SEQ ID NO:25中存在紧接SEQ ID NO:12(FBA1启动子)之后的三个残基(ATG),据信其不影响pre-sgRNA的表达和核酶介导的自催化。该经耶氏酵母优化的RG表达盒(SEQ ID NO:25)示于图2C中。
为测试经耶氏酵母优化的RG盒表达sgRNA的能力,所述sgRNA可与Cas9相互作用,将Cas9引导到DNA靶序列用于由Cas9切割,包含RG构建体(SEQ ID NO:25)或RGR构建体(SEQID NO:18,实施例2)的PCR产物利用pZUFCas9(SEQ ID NO:14)通过锂离子介导的转化共转化到Ura-解脂耶氏酵母细胞(Y2224)中(Ito等人,同上)。将Ura+转化体平板复制到CM+can板上以筛选刀豆氨酸抗性细胞(如实施例3中所示),其中由RG或RGR pre-sgRNA产生的sgRNA用于引导Cas9以切割CAN1靶序列,从而导致通过NHEJ进行易错修复。经耶氏酵母优化的RG或RGR盒引导对靶位点的Cas9介导的切割的频率相同(图6)指示与使用酿酒酵母的Gao等人(J.Integr.Plant Biol.56:343-349)的结果相反,3’核酶不是耶氏酵母中有效Cas9/sgRNA靶切割和突变所必需的。
该实施例展示,在非常规酵母诸如耶氏酵母中,当使用核酶策略时,仅5’-侧接核酶看起来是由Pol II启动子产生功能性sgRNA所必需的。该结果与酿酒酵母(常规酵母)中所观察的相反,其中5’和3’核酶两者均是由Cas9进行靶序列的有效切割和突变所要求的(Gao等人,同上)。
因此,该实施例还展示表达不具有5’端的RGEN(例如Cas9)的RNA组分(例如,sgRNA),其中RNA组分的5’端通过核酶自催化地去除,允许在非常规酵母中对DNA序列进行RGEN-介导的靶向。
实施例5
使用线性多核苷酸修饰模板以促进Cas9/sgRNA-诱导的DNA双链断裂的同源重组
(HR)修复
该示例公开了测试HR机制在耶氏酵母中使用线性多核苷酸修饰模板DNA序列修复由表达经耶氏酵母优化的Cas9和pre-sgRNA表达盒产生的双链断裂(DSB)的能力。制备三种不同的线性模板序列,其各自具有与染色体DNA中的Cas9/sgRNA靶向位点外的区域同源的5’臂序列和3’臂序列。
由互补的合成寡核苷酸产生前两种类型的多核苷酸修饰模板序列。将互补寡核苷酸退火,并且然后通过乙醇沉淀纯化。
使用互补寡核苷酸(SEQ ID NO:28和29)产生第一多核苷酸修饰模板并且其被设计成删除20-核苷酸Can1-1靶位点(SEQ ID NO:17)、3-核苷酸PAM结构域和紧接Can1-1靶位点上游的两个核苷酸,从而删除8个密码子和1个碱基对,从而在CAN1基因中产生-1bp移码。第一多核苷酸修饰模板通过退火SEQ ID NO:28和其反向互补序列SEQ ID NO:29来组装。第一供体DNA的同源臂(各自约50-bp)彼此直接靠近;在它们之间不具有异源序列。
第二多核苷酸修饰模板使用互补寡核苷酸(SEQ ID NO:30和31)产生,并且被设计成在CAN1开放阅读框中产生两个框内翻译终止密码子(即,无义突变)。其还被设计成破坏Can1-1靶位点下游的PAM序列(利用ATG置换CGG)和种子序列的第一个核苷酸(即,SEQ IDNO:17的Can1-1靶序列的最后残基)(用G置换C)。该多核苷酸修饰模板通过退火SEQ ID NO:30和其反向互补序列SEQ ID NO:31来形成。如可由上文搜集的,第二供体DNA的同源臂(各自约50-bp)由异源序列的一些碱基对分隔开。
第三多核苷酸修饰模板通过产生两个PCR产物部分地形成。在使用引物SEQ IDNO:33[正向]和SEQ ID NO:34[反向]由解脂耶氏酵母ATCC 20362基因组DNA扩增的一个PCR产物(SEQ ID NO:32)中,SEQ ID NO:32的位置638对应于CAN1开放阅读框起始密码子上游3bp的核苷酸。反向引物(SEQ ID NO:34)添加与位于CAN1开放阅读框下游37bp的序列互补的17个核苷酸。第二PCR产物(SEQ ID NO:35,使用引物SEQ ID NO:36[正向]和SEQ ID NO:37[反向]由解脂耶氏酵母ATCC 20362基因组DNA扩增),包含在CAN1开放阅读框的终止密码子下游14个碱基对处起始的637个碱基对。正向引物(SEQ ID NO:36)添加与在CAN1开放阅读框上游2个碱基对终止的区域互补的20个核苷酸。上游(SEQ ID NO:32)和下游PCR产物(SEQ ID NO:35)两者均使用ZymocleanTM和浓缩柱纯化。这些PCR产物(各自10ng)在新的PCR反应中混合。上游产物的3′-最多37个核苷酸与下游产物的5′-最多37个核苷酸相同。上游和下游片段用于彼此引发,从而通过由包含上游序列和下游序列两者的重叠末端合成来产生单一产物(SEQ ID NO:38)(由Horton等人在Biotechniques 54:129-133中描述的技术)。SEQ ID NO:38供体DNA的同源臂(各自约600-bp)彼此直接靠近;在它们之间不具有异源序列。该多核苷酸修饰模板可获得大缺失,所述缺失包括在Can1-1靶位点处的Cas9/sgRNA介导的双链断裂区中的整个CAN1开放阅读框。
利用以下物质使用上述锂离子转化方法转化Ura-解脂耶氏酵母细胞(Y2224):(i)pZUFCas9(SEQ ID NO:14),(ii)1μg的经耶氏酵母优化的RGR pre-sgRNA表达盒(SEQ IDNO:18),和(iii)1nmol的“移码模板”DNA(SEQ ID NO:28)、1nmol的“点突变模板”DNA(SEQID NO:30)、或1μg的“大缺失模板”DNA(SEQ ID NO:38)。转化细胞作为CM-ura板上尿嘧啶的原养型回收。通过平板复制到CM+can鉴定具有CAN1突变的刀豆氨酸抗性细胞来筛选原养型菌落。来自每个转化的CanR菌落的CAN1基因座通过使用正向引物(SEQ ID NO:22)和反向引物(SEQ ID NO:23)的PCR扩增来筛选。每种PCR产物使用(Affymetrix,SantaClara,CA)纯化,并且使用测序引物SEQ ID NO:24进行测序(Sanger方法)。CanR菌落总数之外的表现出预测的同源重组事件的菌落频率(根据在转化中使用了哪种特定模板DNA)为约15%(图7)。
三种不同多核苷酸修饰模板DNA序列具有略不同的HR修复效率(图8)。具体地讲,这些模板中每一个的HR频率大约在11%(大缺失和移码供体)和22%(点突变模板)之间(图8),这指示当提供多核苷酸修饰模板DNA时,使用HR路径以高确限度方式修复Can1-1靶位点处的一些Cas9/sgRNA产生的切割事件。
使用DNA修复的两种主要途径,NHEJ或HR,展示出在耶氏酵母中对NHEJ的明显偏好(图7),这不同于对常规酵母中Cas9/sgRNA-介导的切割事件的修复的研究时所观察到的。例如,DiCarlo等人(Nucleic Acids Res.41:4336-4343)示出在提供供体DNA以修复Cas9/sgRNA介导的DNA切割时获得的几乎所有酿酒酵母突变体均经由HR产生,然而当不提供供体DNA时频率下降4至5个数量级,指示对HR的明显偏好。相反,在Cas9/sgRNA(sgRNA由RCR盒表达)切割位点处在耶氏酵母中的总突变频率不在接受或不接受多核苷酸修饰模板DNA的转化体之间变化(图9,示出对两种转化体的~15%突变率),并且在提供供体DNA时,HR仅占产生的突变转化体的约15%(图7)。因此,如上文所观察的耶氏酵母中利用多核苷酸修饰模板DNA序列的HR的频率仅为约2.25%,这与在常规酵母中具有供体DNA的情况下观察到的几乎100%HR介导的突变率形成鲜明对比(DiCarlo等人,同上)。
因此,该示例还展示表达不具有5’端的RGEN(例如Cas9)的RNA组分(例如,sgRNA),其中RNA组分的5’端通过核酶自催化地去除,允许在非常规酵母中对DNA序列进行RGEN-介导的靶向。该实施例还展示如果提供合适的供体DNA(多核苷酸修饰模板),则可以通过HR以一定比率修复非常规酵母中的RGEN介导的切割。
实施例6
由单个稳定的载体表达Cas9和经耶氏酵母优化的RGR或RG Pre-sgRNA提供Cas9/
sgRNA-介导的靶DNA切割
在该实施例中,经耶氏酵母优化的RGR或RG Pre-sgRNA表达盒各自独立地移动到相同稳定表达质粒中作为经耶氏酵母优化的Cas9表达盒。具体地讲,SEQ ID NO:18(对于RGR表达)或SEQ ID NO:25(对于RG表达)各自独立地克隆到pZUFCas9中(图3A,SEQ ID NO:14)。这允许单组分转化以在细胞中表达Cas9内切核酸酶和RG或RGR pre-sgRNA,从而提供Cas9/sgRNA-介导的靶位点切割,之后进行易错NHEJ修复。
使用正向(SEQ ID NO:39)和反向(SEQ ID NO:40)引物通过PCR扩增经耶氏酵母优化的RGR(SEQ ID NO:18)或RG(SEQ ID NO:25)sgRNA表达盒。将每个产物独立地克隆到PacI/ClaI限制位点处的质粒pZUFCas9(SEQ ID NO:14)中以形成两个新质粒,所述新质粒各自携带相应的盒用于Cas9表达和表达优化的RGR pre-sgRNA(pRF84,SEQ ID NO:41,图10A)或优化的RG pre-sgRNA(pRF85,SEQ ID NO:42,图10B)。
为测试pRF84(SEQ ID NO:41)和pRF85(SEQ ID NO:42)质粒构建体各自有效地表达Cas9和sgRNA以提供Cas9/sgRNA介导的靶位点(Can1-1)切割的能力,使用上述锂离子转化方法利用200ng的pRF84(SEQ ID NO:41)、pRF85(SEQ ID NO:42)、或pZUFCas9(SEQ IDNO:14)转化Ura-解脂耶氏酵母细胞(Y2224)。选择由每种质粒转化的细胞作为CM-ura培养基上的尿嘧啶原养型。通过在CM+can上平板复制对于CAN1突变体筛选来自每个转化的尿嘧啶原养型。对于由pZUFCas9(仅表达Cas9)、pRF84(表达Cas9和RGR pre-sgRNA)、或pRF85(表达Cas9和RG pre-sgRNA)转化的细胞,将CM+can板上生长的菌落数用于产生CAN1突变频率(图11)。由pZUFCas9(SEQ ID NO:14)转化的耶氏酵母细胞具有CAN1基因座处的Cas9/sgRNA介导的突变的0频率,然而表达(i)Cas9和(ii)RGR pre-sgRNA(pRF84)或RG sgRNA(pRF85)的细胞具有如由刀豆氨酸抗性所指示的类似的CAN1突变频率(□69%)(图11)。
这些结果指示,由相同载体表达Cas9和pre-sgRNA导致显著更高的Cas9/sgRNA介导的切割率,从而因此导致显著更高的在预测切割位点处的NHEJ介导的突变率。虽然由编码Cas9和pre-sgRNA(RGR或RG pre-sgRNA)的单独序列转化的耶氏酵母细胞表现出约5%的靶向突变频率(实施例4,图6),在用于转化的相同载体上放置Cas9和sgRNA编码序列两者导致约69%的靶向突变频率(图11)。
因此,与使用独立的构建体表达RGEN蛋白质和RNA组分相比,由用于转化非常规酵母的相同构建体表达Cas蛋白质及其对应的RNA组分导致在酵母中Cas介导的DNA靶向的更高比率。
实施例7
在解脂耶氏酵母中使用HDV核酶-sgRNA融合体的高效基因靶向
该实施例讨论了使用单个向导RNA(由HDV核酶侧接于5’端上的sgRNA(核酶-单向导RNA融合体)。当表达时,HDB核酶切割其自身序列的5′,去除任何先前的转录物,但保留融合至sgRNA的5′端的HDV序列。
质粒pZuf-Cas9(SEQ ID NO:14)使用Agilent QuickChange和以下引物AarI-去除-1(AGAAGTATCCTACCATCTACcatctccGAAAGAAACTCGTCGATTCC,SEQ ID NO:90)和AarI-去除-2(GGAATCGACGAGTTTCTTTCggagatgGTAGATGGTAGGATACTTCT,SEQ ID NO:91)诱变以去除存在于pZuf-Cas9(SEQ ID NO:14)上的Cas9基因(SEQ ID NO:10)中的内切核酸酶AarI位点并产生pRF109(SEQ ID NO:92)。以来自pRF109的NcoI/NotI片段形式将修饰的Aarl-Cas9基因(SEQ ID NO:93)克隆到pZufCas9的NcoI/NotI位点中,从而利用Aar1-Cas9基因置换存在的Cas9基因(SEQ ID NO:10)以产生pRF141(SEQ ID NO:94)。
高通量克隆盒(图12A,SEQ ID NO:95)由y152启动子(SEQ ID NO:96)、HDV核酶(SEQ ID NO:16)、大肠杆菌反向选择盒rpsL(SEQ ID NO:97)、编码向导RNA CER结构域(SEQID NO:1)的DNA和酿酒酵母Sup4终止子(SEQ ID NO:8)构成。侧接高通量克隆盒(SEQ IDNO:95)端部的是PacI和ClaI限制性酶识别位点。将高通量克隆盒克隆到pRF141(SEQ IDNO:94)的PacI/ClaI位点中以生成pRF291(SEQ ID NO:98)。rpsL反向选择盒(SEQ ID NO:97)包含编码S12核糖体蛋白亚基的大肠杆菌基因rpsL的WT拷贝(Escherichia coli andSalmonella typhimurium:Cellular and Molecular Biology,1987,第一版,AmericanSociety of Microbiology,Washington,DC)。S12亚基中的一些突变导致对抗生素链霉素的抗性(Ozaki M,Mizushima S,Nomura M.,1969.Identification and functionalcharacterization of the protein controlled by the streptomycin-resistantlocus in E.coli.Nature 222:333-339),其以隐形方式进行(LederbergJ.1951.Streptomycin resistance;a genetically recessive mutation.Journal ofbacteriology 61:549-550),使得如果rpsL基因的野生型拷贝存在,则菌株是对链霉素在表型上敏感的。常见克隆菌株诸如Top10(Life technologies)在其染色体上具有rpsL的突变拷贝,使得细胞对链霉素具有抗性。
将编码向导RNA的可变靶向结构域的DNA片段克隆到质粒(诸如pRF291)中,要求两个部分互补的寡核苷酸在退火时,包含编码可变靶向结构域的DNA片段,以及用于克隆到存在于高通量克隆盒中的两个AarI位点中的正确突出物。将两种寡核苷酸Can1-1F(AATGGGACtcaaacgattacccaccctcGTTT,SEQ ID NO:99)和Can1-1R(TCTAAAACgagggtgggtaatcgtttgaGTCC,SEQ ID NO:100)以100μM重新悬浮于双重缓冲液(30mM HEPES,pH 7.5,100mM乙酸钠)中。在单个试管中,以50μM的最终浓度将Can1-1F(SEQ ID NO:99)和Can1-1R(SEQ IDNO:100)混合,加热至95℃并持续5分钟,并且以0.1℃/min冷却至25℃,以使两个寡核苷酸退火以形成小双链体DNA分子(图12B),其包含编码能够靶向Can1-1靶位点的向导RNA的可变靶向结构域的DNA片段(示为SEQ ID NO:101,其包括PAM序列CGG)。形成单管消化/连接反应物,其包含50ng的pRF291,由Can1-1F和Can1-1R 1x T4连接酶缓冲液(50mM Tris-HCl,10mM MgCl2,1mM ATP,10mM DTT,pH 7.5)构成的2.5μM小双链体DNA,0.5μM AarI寡核苷酸,2单位AarI,40单位T4DNA连接酶,最终体积为20ul。还组装缺乏双重Can1-1F和Can1-1R双链体的第二对照反应物。反应物在37℃下温育30分钟。将10μl的每种反应物转化到Top10大肠杆菌细胞中,如前所述(Green MR,Sambrook J.,2012,Molecular Cloning:A LaboratoryManual,第四版,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NY)。为了对pRF291(其中Can1-1F和Can1-1R的双链体已经置换侧接有AarI限制性位点的rpsL反向选择标记物物(图12))的存在进行选择,将细胞接种于溶原性液体培养基上,所述培养基由包含100μg/ml氨苄青霉素和50μg/ml链霉素的1.5%(w/v)Bacto琼脂固化。包含高通量克隆盒的pRF291的存在产生对抗生素氨苄青霉素具有表型抗性但对抗生素链霉素具有敏感性的菌落,这是由于质粒上存在反向选择盒。然而,在其中反向选择盒经由AarI酶去除并且Can1-1双链体DNA连接到位点中的情况下(去除AarI的识别序列),由质粒转化的细胞具有氨苄青霉素抗性、链霉素抗性表型(图12A)。包含编码Can1-1可变靶向结构域的DNA片段的pRF291靶向(置换反向选择盒)形成重组HDV-sgRNA表达盒(SEQ ID NO:102),所述表达盒包含融合至编码HDV核酶(SEQ ID NO:16)的DNA的yl52启动子,所述HDV核酶融合至编码Can1-1可变靶向结构域(SEQ ID NO:17)的DNA、所述Can1-1可变靶向结构域融合至编码向导CER结构域(SEQ ID NO:1)的DNA,所述向导CER结构域融合至sup4终止子(SEQ ID NO:8)。包含该构建体的质粒,pRF303(SEQ ID NO:103)用于编码HDV核酶-向导RNA(SEQ ID NO:104),其能够(当与Cas9内切核酸酶复合时)靶向解脂耶氏酵母的Can1基因(SEQ ID NO:21)用于诱变。
在以下情况下转化解脂耶氏酵母(如Richard M,Quijano RR,Bezzate S,Bordon-Pallier F,Gaillardin C.2001.Journal of bacteriology 183:3098-3107):不具有质粒,或者100ng的不携带sgRNA表达盒(pRF291,SEQ ID NO:98)的质粒,携带RGR表达盒(SEQID NO:41)的pRF84质粒,携带RG盒的pRF85质粒,其中5’核酶自身从sgRNA(SEQ ID NO:42)去除,或携带HDV-sgRNA融合表达盒(SEQ ID NO:102)的pRF303(SEQ ID NO:103),所述HDV-sgRNA融合表达盒靶向耶氏酵母中的Can1-1靶位点。选择尿嘧啶原养型的转化体,并通过对精氨酸类似物刀豆氨酸的表型抗性对Can1基因中的突变进行评级。表达HDV-sgRNA融合体的质粒以表达从核酶释放的任一个sgRNA的质粒的相同频率造成Can1基因中的功能丧失突变,这表明HDV核酶对靶向Can1-1的sgRNA的5’融合不影响sgRNA功能(表4)。
表4
经由不同sgRNA变体的Can1-1靶序列的突变频率。
使用如上所述和图12A中所示的相同策略,将编码靶向多个附加靶位点的可变靶向结构域的多个附加DNA片段(表5)克隆到pRF291(SEQ ID NO:98)质粒中。包括编码在Can1基因(SEQ ID NO:105)内靶向的可变靶向结构域的DNA片段,所述可变靶向结构域靶向第二靶位点、can1-2靶位点(SEQ ID NO:106)和其它靶位点,诸如sou2-1(SEQ ID NO:107)、Sou2-2(SEQ ID NO:108)、Tgl1-1(SEQ ID NO:112)、Acos10-1(SEQ ID NO:113)、Fatl-1(SEQ ID NO:114)和Ura3-1(SEQ ID NO:116)。
表5
编码利用Cas9靶向耶氏酵母中的不同基因座的sgRNA VT结构域的DNA序列
靶位点的突变频率指示所有HDV-sgRNA融合体均能够形成与Cas9内切核酸酶的复合物,其继而在相应靶位点处生成切割,这导致经由NHEJ的突变(表6)。
表6
使用HDV-sgRNA融合体在解脂耶氏酵母中的不同靶位点处的突变频率
实施例8
使用失活的Cas9和HDV-sgRNA融合体进行基因沉默。
包含HNH和RuvC核酸酶结构域(SEQ ID NO:117)中突变的无催化活性的Cas9变体能够与sgRNA相互作用并且结合到体内的靶位点但不能切割靶DNA的任一条链。该作用模式,结合但不使DNA断裂可用于瞬时减少染色体中特异性基因座的表达,但不导致永久性基因改变。
为了生成解脂耶氏酵母的无催化活性的Cas9表达盒,将D10A突变引入质粒pZufCas9(SEQ ID NO:14),其使用快变定点诱变(Stratagene)来进行,如由引物D10AF(GAAATACTCCATCGGCCTGGCCATTGGAACCAACTCTGTCG,SEQ ID NO:118)和D10AR(CGACAGAGTTGGTTCCAATGGCCAGGCCGATGGAGTATTTC,SEQ ID NO:119)描述。这利用使RuvC核酸酶(SEQ ID NO:120)失活的D10A突变和包含该构建体的相应质粒,pRF111(SEQ ID NO:121)产生经耶氏酵母密码子优化的Cas9基因。为了使第二核酸酶结构域(HNH)失活,使用以下物质进行另一轮的快变诱变(Stratagene):引物H840A1(TCAGCGACTACGATGTGGACGCCATTGTCCCTCAATCCTTTCT,SEQ ID NO:122)和H840A2(AGAAAGGATTGAGGGACAATGGCGTCCACATCGTAGTCGCTGA,SEQ IDNO:123),其将H840A突变引入经耶氏酵母密码子优化的D10A基因中从而形成经耶氏酵母密码子优化的Cas9失活基因(SEQ ID NO:124),以及携带用于在耶氏酵母中表达的基因的质粒,pRF143(SEQ ID NO:125)。
为了评估解脂耶氏酵母中的基因沉默,形成经耶氏酵母密码子优化的dsREDexpress开放阅读框(SEQ ID NO:126)作为具有5′NcoI限制性位点和3′NotI限制性位点的克隆片段(SEQ ID NO:127)。将克隆片段(SEQ ID NO:127)克隆到pZufCas9的NcoI/NotI位点中以形成FBA1启动子(SEQ ID NO:12),所述启动子融合至经耶氏酵母优化的dsREDexpress克隆片段(SEQ ID NO:127),从而形成FABl-dsRED融合盒(SEQ ID NO:128),所述融合盒被包含于质粒pRF165(SEQ ID NO:129)上。为了将FBA1-dsREDexpress盒(SEQID NO:128)整合到染色体中,将包含盒(SEQ ID NO:130)的PmeI-NotI片段连接到整合质粒p2P069(SEQ ID NO:131)的PmeI/NotI位点中以形成携带FBA1-dsREDexpress表达盒的整合载体,pRF201(SEQ ID NO:132)。通过使用标准技术选择亮氨酸原养型,将携带FBA1-dsREDexpress融合体的pRF201的SphI/AscI片段和Leu2基因(SEQ ID NO:133)的拷贝整合到耶氏酵母的染色体中(Richard M,Quijano RR,Bezzate S,Bordon-Pallier F,Gaillardin C,2001.Tagging morphogenetic genes by insertional mutagenesis inthe yeast Yarrowia lipolytica.Journal of bacteriology 183:3098-3107)。使用标准PCR技术和引物HY026(GCGCGTTTAAACCATCATCTAAGGGCCTCAAAACTACC,SEQ ID NO:134)和HY027(GAGAGCGGCCGCTTAAAGAAACAGATGGTGTCTTCCCT,SEQ ID NO:135)确认耶氏酵母基因组中FBA1-dsREDexpress表达盒的存在。为进一步使用,选择包含FBA1-dsREDexpress盒(SEQID NO:128)的两个独立菌株,YRF41和YRF42。
为形成用于靶向经耶氏酵母优化的dsREDexpress表达盒(SEQ ID NO:128)的sgRNA,使用类似于实施例12的策略。质粒构建体,pRF169(SEQ ID NO:136)包含来自耶氏酵母的GPD启动子(SEQ ID NO:137)反向选择标记物、编码向导RNA CER结构域(SEQ ID NO:1)的DNA和Sup4终止子(SEQ ID NO:8)盒(SEQ ID NO:138),如图13A所示。将编码靶向耶氏酵母中靶位点的sgRNA的可变靶向结构域的DNA(连接至编码HH核酶的DNA片段)克隆到pRF169(SEQ ID NO:136)中,如实施例12所述,不同的是编码HH核酶的DNA片段为锤头核酶的前6个核苷酸是可变靶向结构域的前6个核苷酸的反向互补序列那样的DNA片段,如图13B所示。当具有正确突出物的双链寡核苷酸置换AarI位点之间的反向选择盒时,产生核酶-向导RNA(RG)表达盒(图13-A)。当转录时,HH核酶从核酶-向导RNA分子中去除5′转录物及自身,在细胞中保留完整的sgRNA。形成靶向dsREDexpress开放阅读框(SEQ ID NO:126)的三个向导RNA;两个靶向模板链,ds-temp-1(SEQ ID NO:139)、ds-temp-2(SEQ ID NO:140);并且一个靶向非模板链,ds-nontemp-1(SEQ ID NO:141)。
就每个靶位点而言,设计两种寡核苷酸,其包含编码靶特异性锤头核酶的DNA序列、可变靶向结构域(VTD)和用于克隆到pRF169的AarI位点中的正确重叠端。每个位点的寡核苷酸;ds-temp-1F(SEQ ID NO:144)、ds-temp-1R(SEQ ID NO:145)、ds-temp-2F(SEQ IDNO:146)、ds-temp-2R(SEQ ID NO:147)、ds-nontemp-1F(SEQ ID NO:148)、和ds-nontemp-1R(SEQ ID NO:149)双链化以形成具有正确突出物的双链DNA分子,所述突出物用于克隆到pRF169的高通量盒(图13A和13B)中保留的AarI突出物中,并且如实施例12对于克隆到pRF291中所述来进行。插入编码sgRNA的可变靶向结构域的DNA片段,置换反向选择盒,对于每个靶位点产生新质粒,所述质粒携带融合至锤头核酶-靶位点双链DNA的GPD启动子,所述锤头核酶-靶位点双链DNA融合至编码向导RNA CER结构域的DNA,所述向导RNA CER结构域融合至图13A的Sup4终止子。包含这些双链体的质粒为pRF296(ds-temp-1,SEQ ID NO:150)、pRF298(ds-temp-2,SEQ ID NO:151)、pRF300(ds-nontemp-1,SEQ ID NO:152)。
为了形成用于基因沉默的构建体,使用标准技术将来自pRF143(SEQ ID NO:125)的失活Cas9克隆到pRF296、pRF298和pRF300中作为NcoI/NotI片段并且置换位于那些质粒的NcoI/NotI位点中的功能性Cas9(SEQ ID NO:93)以分别形成质粒pRF339(SEQ ID NO:153)、pRF341(SEQ ID NO:154)和pRF342(SEQ ID NO:155)。
使用标准技术由pRF339、pRF341和pRF343将菌株YRF41和YRF42转化成尿嘧啶原养型(Richard M,Quijano RR,Bezzate S。Bordon-Pallier F,Gaillardin C.2001.Taggingmorphogenetic genes by insertional mutagenesis in the yeast Yarrowialipolytica.Journal of bacteriology 183:3098-3107)。对于每次转化,将12个转化体在缺乏尿嘧啶的板上进行划线纯化以保持质粒。每个分离物用于接种2ml的CM-ura液体培养基(Teknova),并在30℃,250RPM下生长过夜。将每个过夜物中的2-5μl稀释到200μl ddH2O中,并在Accuri流动细胞仪的dsREDexpress通道中分析,以评估每个细胞内的dsREDexpress蛋白质的量。从每个培养物分析7,151和10,000个之间的细胞。从分析的每种培养物的平均荧光中减去不具有dsREDexpress表达盒的耶氏酵母细胞的平均荧光,以获得每个菌株/质粒组合内的经校正的平均荧光,将其平均并测定标准偏差(表7)。与核酶-SgRBA(RG)组合的失活的Cas9通过靶向目的基因的表达载体来表达,使2至10个折叠之间的基因的表达沉默。折叠沉默根据靶位点的位置和成链度和/或侧接sgRNA的核酶在耶氏酵母细胞中以功能形式由DNA聚合酶启动子表达的能力而变化(表7)。
表7
通过两个FBA-dsREDexpress整合菌株中的三个靶位点进行的基因沉默
菌株 | 质粒 | 靶位点 | 平均荧光±SD | 无靶的折叠 |
YRF41 | 无 | 无 | 540.6±2.9 | 1 |
YRF41 | pRF339(SEQ ID NO:69) | ds-temp-1 | 299.2±138.7 | 0.55±0.26 |
YRF41 | pRF341(SEQ ID NO:70) | ds-temp-2 | 257.9±139.3 | 0.48±0.26 |
YRF41 | pRF343(SEQ ID NO:71) | ds-nontemp-1 | 169.4±45.3 | 0.31±0.08 |
YRF42 | 无 | 无 | 871.2±36.9 | 1 |
YRF42 | pRF339(SEQ ID NO:69) | ds-temp-1 | 194.3±121.1 | 0.22±0.14 |
YRF42 | pRF341(SEQ ID NO:70) | ds-temp-2 | 168.7±191.6 | 0.19±0.22 |
YRF42 | pRF343(SEQ ID NO:71) | ds-nomemp-1 | 94.9±109.6 | 0.11±0.13 |
实施例9
使用由单一质粒表达的Cas9和HDV核酶-sgRNA融合体(RG)进行精确基因编辑
在该实施例中,展示出由相同稳定载体表达的Cas9和HDV-sgRNA融合体的稳定表达可在耶氏酵母的靶位点中形成DNA双链断裂,其可以为用于通过同源重组进行精确基因编辑的底物。
描述于实施例4中的Can1缺失多核苷酸修饰模板DNA(SEQ ID NO:38)由HinDIII消化并且使用标准技术克隆到pUC18的HinDIII位点中以形成pRF80(SEQ ID NO:156)。较短的Can1缺失编辑模板(SEQ ID NO:157)使用标准PCR技术和引物80F(AGCTTGCTACGTTAGGAGAA,SEQ ID NO:158)和80R(TATGAGCTTATCCTGTATCG,SEQ ID NO:159)由pRF80扩增以形成大量编辑模板。
使用标准技术转化Ura营养缺陷型耶氏酵母细胞(Richard M,Quijano RR,Bezzate S,Bordon-Pallier F,Gaillardin C.2001.Tagging morphogenetic genes byinsertional mutagenesis in the yeast Yarrowia lipolytica.Journal ofbacteriology 183:3098-3107),其利用100ng的携带Cas9基因的拷贝但不具有sgRNA的质粒pRF291和携带Cas9基因的拷贝和Can1-1靶位点HDV-sgRNA表达盒的pRF303,连同没有编辑模板DNA或1000ng的短Can1缺失编辑模板(SEQ ID NO:157)。在CM-ura培养基(Teknova)上选择转化体。对于每个转化体,将20个单独菌落在CM-ura培养基(Teknova)上进行划线纯化。对于每个划线纯化的菌落,将4个单独菌落(每次转化共计80个)贴片到包含60μg/ml的L-刀豆氨酸的CM-arg板上,以筛选在Can1基因中包含功能丧失等位基因的菌落。对展示刀豆氨酸抗性的贴片进行评级并且对基因失活的频率进行评级(表8)。为了确定哪些菌落由于同源重组而丧失Can1功能以及哪些菌落由于NHEJ而丧失Can1功能,Can1基因座(SEQ IDNO:160)使用Can1-PCRF(GGAAGGCACATATGGCAAGG,SEQ ID NO:22)和Can 1-PCRR(GTAAGAGTGGTTTGCTCCAGG,SEQ ID NO:23)来扩增。在如先前实施例中所述的具有小插入缺失的细胞中,PCR产物应当与包含缺失的菌株中的WT Can1基因座(SEQ ID NO:160)的尺寸(2125bp)非常相似,所述缺失是由于与Can1缺失编辑模板同源重组,具有Can1-PCRF(SEQID NO:22)和Can1-PCRR(SEQ ID NO:23)的PCR片段(SEQ ID NO:161)将更小(392bp)。通过电泳分辨2μl的PCR产物,并使用标准技术成像(图14)。使用在划线纯化时(具有对应于由编辑模板(SEQ ID NO:161)重组的短带)产生1或多个菌落的最初20个划线菌落的百分比来测定HR的频率(表8)。在接收pRF303(SEQ ID NO:103)的细胞中,无论细胞是否接收编辑模板,刀豆氨酸抗性菌落的频率是相似的(表8)。在总转化细胞群中,在接收pRF303(SEQ ID NO:103)和Can1短编辑模板(SEQ ID NO:157)两者的细胞中,约1/10包含由编辑模板(SEQ IDNO:157)对Can1基因座的精确编辑(表8)。
表8
刀豆氨酸抗性频率和精确编辑的频率
实施例10
耶氏酵母中的URA3基因失活
本实施例描述了分别或一起表达单向导RNA(sgRNA)和Cas9内切核酸酶的质粒的构建和其用于耶氏酵母中的URA3基因失活的用途。
pYRH235和pYRH236分别表达侧接靶向URA3.1靶序列(5’-ctgttcagagacagtttcct-3;SEQ ID NO:165)的pre-sgRNA(RGR-URA3.1;SEQ ID NO:164)的核酶和侧接靶向URA3.2靶序列(5’-taacatccagagaagcacac-3’;SEQ ID NO:167)的pre-sgRNA(RGR-URA3.2;SEQ IDNO:166)的核酶。将编码RGR-URA3.1的DNA片段的NcoI-NotI限制性消化片段和编码RGR-URA3.2的BspHI-NotI限制性消化片段融合至FBA1L启动子(SEQ ID NO:168)以分别产生pYRH235和pYRH236。pYRH235和pYRH236质粒包含天然乙酰羟酸合酶的标记物基因(AHAS或乙酰乳酸合酶;E.C.4.1.3.18;SEQ ID NO:169),其具有赋予磺酰脲抗性的单氨基酸变化(W497L)。
耶氏酵母菌株ATCC20362的Ura-负衍生物(Y2224)首先利用线性化的pZufCas9(SEQ ID NO:14)通过SphI-BsiWI限制性消化来转化,并且在缺乏尿嘧啶的完整最小(CM)板上选择转化体。将线性化Cas9表达盒随机整合到耶氏酵母基因组中,并且因此转化体包含URA3基因的至少两个拷贝。随后,将表达sgRNA的pYRH235或pYRH236转化到表达Cas9的耶氏酵母菌株中,并且在包含600mg/L磺酰脲的CM板上选择转化体。将50个转化体在CM-ura板和具有5-FOA的SC板上进行贴片,以发现通过URA3的Cas9和sgRNA进行URA3基因失活的频率。94%和100%的pYRH235和pYRH236转化体分别变成尿嘧啶营养缺陷型。
进行靶位点URA3.1或URA3.2处突变的测序确认。随机选择pZufCas9和pYRH235的20个转化体用于测序分析,并且对每个菌落分析质粒pZufCas9和来自天然基因组URA3的URA3基因的突变。为对来自质粒pZufCas9的URA3基因进行测序,将URA3的引物RHO705(SEQID NO:170)和FBA1启动子序列的RHO719(SEQ ID NO:171)用于区域的PCR扩增,并且将引物RHO733(SEQ ID NO:172)或RHO734(SEQ ID NO:173)用于利用PCR扩增产物作为模板的测序。为对天然基因组源的URA3基因进行测序,将引物RHO705(SEQ ID NO:170)和RHO707(SEQID NO:174)用于PCR扩增,并且将引物RHO733(SEQ ID NO:172)和RHO734(SEQ ID NO:173)用于利用PCR扩增产物作为模板的测序。所有20个菌落均包含在质粒和基因组来源的URA3基因两者处的突变(图15)。对于5个代表性菌落的质粒和基因组来源的URA3基因(菌落1、2、3、5和6;分别为SEQ ID NO:176、177、178、179和180和SEQ ID NO:181、182、183、184和185)与野生型URA3.1(SEQ ID NO:175)的测序结果的片段比对在图15中示出。这些结果示出由耶氏酵母中的sgRNA/Cas9内切核酸酶体系靶向并使相同细胞中基因的多个拷贝突变。
实施例11
耶氏酵母中URA3基因突变或缺失。
本实施例描述了构造并使用在相同载体体系上表达两种sgRNA和Cas9内切核酸酶的质粒,用于耶氏酵母中的URA3基因突变或缺失,以用于标记物再循环。
pYRH222在FBA1启动子(SEQ ID NO:12)和FBA1L启动子下表达Cas9内切核酸酶(SEQ ID NO:10),所述启动子驱动编码侧接靶向URA3.2靶序列(SEQ ID NO:167)的pre-sgRNA(RGR-URA3.2;SEQ ID NO:166)的核酶的DNA片段,其示于图16A中。pYRH222载体包含在TDH1(也称为GPD)启动子(SEQ ID NO:187)下表达的潮霉素抗生素抗性选择标记物(SEQID NO:186),以及适应质粒的染色体外复制的自主复制序列(ARS18;SEQ ID NO:208)(PNAS,Fournier,P.等人,1993,90:4912-4916)。当不存在选择压力时,ARS18的存在使得细胞损失质粒。
pYRH282源自pYRH222。融合至编码来自pYRH235的RGR-URA3.1(SEQ ID NO:164)的DNA片段的FBA1L启动子(SEQ ID NO:168)使用引物RHO804(SEQ ID NO:188)和RHO805(SEQID NO:189)进行PCR扩增。然后PCR产物利用BsiWI消化,并且克隆到pYRH222中。通过测序确认克隆基因的取向和序列同一性,并且将构建体命名为pYRH282。
pYRH283源自pYRH222。由融合至编码RGR-URA3.3(SEQ ID NO:191)的DNA的TDH1启动子(SEQ ID NO:187)构成的,侧接有BsiWI位点(SEQ ID NO:190)的合成DNA片段由IDT(Coralville,Iowa)合成并且在BsiWI位点处克隆到pYRH222中。通过测序确认克隆基因的取向和序列同一性,并且将构建体命名为pYRH283。
利用pYRH222、pYRH282和pYRH283转化耶氏酵母菌株ATCC20362的后代,并在包含300mg/L潮霉素的YPD板上选择转化体。在无DNA对照板上观察到相对高的背景生长(表9)。随机选择每种构建体的30个转化体,并且在具有5-FOA的SC板上划线以对尿嘧啶营养缺陷型进行反选择。在来自无DNA对照板的菌落的情况下,没有观察到生长。在pYRH222、pYRH282和pYRH283转化体的情况下,4至11个贴片示出生长。利用引物RHO610(SEQ ID NO:192)和RHO611(SEQ ID NO:193)进行菌落PCR以扩增包含sgRNA靶位点的DNA区,并且经PCR扩增的产物示出在琼脂糖凝胶上的不同迁移(图17)。利用PCR产物作为模板和测序引物RHO704(SEQ ID NO:194)进行测序。
在pYRH222转化体的情况下,11次测序中的6次成功进行,并且其全部在URA3.2靶位点处突变(图16B;SEQ ID NO:195-201)。在pYRH282的情况下,所有的成功测序示出在一个或多个靶位点处的突变,并且其中2个示出两个靶位点之间的缺失(图16C;SEQ ID NO:202-204)。就pYRH283而言,8次成功测序中的7次示出在一个或多个靶位点处的突变,并且其中2个示出两个靶位点之间的缺失(图16D;SEQ ID NO:205-207),从而形成URA3基因的几乎完全缺失。
该实施例示出在相同质粒上表达两个向导RNA,以使用耶氏酵母中的sgRNA/Cas9内切核酸酶体系,在两个靶位点之间形成靶向缺失,其中通过运行凝胶或通过测序进行鉴定。在没有选择压力时,在这些质粒上存在ARS18(SEQ ID NO:208)使细胞损失质粒,使得质粒可以重复地用于URA3标记物再循环。
表9:
pYRH222、pYRH282和pYRH283转化体的分析。记录不包括DNA对照在内的每个转化 板的转化体数。
实施例12
在耶氏酵母中使用Csy4(Cas6)用于基因失活
本发明实施例描述了使用Csy4(也称为Cas6)以形成不具有5′端的向导RNA,其能够在非常规酵母中形成可靶向DNA序列(诸如但不限于,CAN1)的RGEN复合物。
将编码Csy4(也称为Cas6)的基因与编码靶向侧接有28bp Csy4识别位点的sgRNA的CAN1的DNA一起引入Cas9表达质粒上,用于耶氏酵母中的CAN1基因失活。
pYRH290在FBA1启动子(SEQ ID NO:12)下表达Cas9内切核酸酶(SEQ ID NO:10)并且经解脂耶氏酵母密码子优化的基因用于在FBA1启动子(SEQ ID NO:210)下的Csy4表达(SEQ ID NO:209)。pYRH290还包含编码28bp Csy4内切核酸酶识别序列(SEQ ID:212)的DNA片段(TDH1:28bp-gCAN1-28bp;SEQ ID NO:211),所述内切核酸酶识别序列侧接靶向CAN1靶序列(SEQ ID NO:214)的pre-sgRNA(SEQ ID NO:213)。在由Csy4加工之后,所得的sgRNA(SEQ ID NO:222)包含8-核苷酸5’-旁侧序列(SEQ ID NO:223)和20-核苷酸3’-旁侧序列(SEQ ID NO:224)。
利用pYRH290转化耶氏酵母菌株ATCC20362的Ura-负衍生物(Y2224),并在缺乏尿嘧啶的CM板上选择转化体。将86个转化体平板复制到包含刀豆氨酸的CM板以选择can1突变体。86个转化体中40个在包含刀豆氨酸的CM板上赋予生长。对40个刀豆氨酸抗性菌落中的16个进行测序以确认在CAN1靶位点处(SEQ ID NO:214)的突变,并且确认14个菌落在CAN1靶位点处具有突变。图18示出包含CAN1靶位点(SEQ ID NO:215)的野生型CAN1基因的片段与菌落14、16、18、19、24和25中CAN1靶序列处的突变(分别为SEQ ID NO:216-221)的比对。
序列表
<110> E. I. du Pont de Nemours and Company
Fan, Xiaochun
Frisch, Ryan
Hong, Seung-Pyo
<120> 使用RNA引导的内切核酸酶在非常规酵母中基因靶向
<130> CL6272
<150> 62/036652
<151> 2014-08-13
<160> 224
<170> 专利版本3.5
<210> 1
<211> 80
<212> RNA
<213> 人工序列
<220>
<223> Cas9内切核酸酶识别(CER)结构域
<400> 1
guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc cguuaucaac uugaaaaagu 60
ggcaccgagu cggugcuuuu 80
<210> 2
<211> 20
<212> DNA
<213> 解脂耶氏酵母
<400> 2
tccaagaaga ttgttcttct 20
<210> 3
<211> 20
<212> DNA
<213> 解脂耶氏酵母
<400> 3
ctccgtcatc cccggttctc 20
<210> 4
<211> 20
<212> DNA
<213> 解脂耶氏酵母
<400> 4
cggcgacttc tgtggccccg 20
<210> 5
<211> 300
<212> DNA
<213> 酿酒酵母
<400> 5
aacaattatc tcaaaattca cccactcttc atctttgaaa agataatgta tgattatgct 60
ttcactcata tttatacaga aacttgatgt tttctttcga gtatatacaa ggtgattaca 120
tgtacgtttg aagtacaact ctagattttg tagtgccctc ttgggctagc ggtaaaggtg 180
cgcatttttt cacaccctac aatgttctgt tcaaaagatt ttggtcaaac gctgtagaag 240
tgaaagttgg tgcgcatgtt tcggcgttcg aaacttctcc gcagtgaaag ataaatgatc 300
<210> 6
<211> 300
<212> DNA
<213> 酿酒酵母
<400> 6
taaaaatcaa tcaatcatcg tgtgttttat atgtctctta tctaagtata agaatatcca 60
tagttaatat tcacttacgc taccttttaa cctgtaatca ttgtcaacag gatatgttaa 120
cgacccacat tgataaacgc tagtatttct ttttcctctt cttattggcc ggctgtctct 180
atactcccct atagtctgtt tcttttcgtt tcgattgttt tacgtttgag gcctcgtggc 240
gcacatggta cgctgtggtg ctcgcggctg ggaacgaaac tctgggagct gcgattggca 300
<210> 7
<211> 300
<212> DNA
<213> 解脂耶氏酵母
<400> 7
attttttttg attttctttt ttgaccccgt cttcaattac acttcccaac tgggaacacc 60
cctctttatc gacccatttt aggtaattta ccctagccca ttgtctccat aaggaatatt 120
accctaaccc acagtccagg gtgcccaggt ccttctttgg ccaaatttta acttcggtcc 180
tatggcacag cggtagcgcg tgagattgca aatcttaagg tcccgagttc gaatctcggt 240
gggacctagt tatttttgat agataatttc gtgatgatta gaaacttaac gcaaaataat 300
<210> 8
<211> 20
<212> DNA
<213> 酿酒酵母
<400> 8
tttttttgtt ttttatgtct 20
<210> 9
<211> 4107
<212> DNA
<213> 人工序列
<220>
<223> 化脓链球菌Cas9
<400> 9
atggacaaga aatactccat cggcctggac attggaacca actctgtcgg ctgggctgtc 60
atcaccgacg agtacaaggt gccctccaag aaattcaagg tcctcggaaa caccgatcga 120
cactccatca agaaaaacct cattggtgcc ctgttgttcg attctggcga gactgccgaa 180
gctaccagac tcaagcgaac tgctcggcga cgttacaccc gacggaagaa ccgaatctgc 240
tacctgcagg agatcttttc caacgagatg gccaaggtgg acgattcgtt ctttcatcga 300
ctggaggaat ccttcctcgt cgaggaagac aagaaacacg agcgtcatcc catctttggc 360
aacattgtgg acgaggttgc ttaccacgag aagtatccta ccatctacca cctgcgaaag 420
aaactcgtcg attccaccga caaggcggat ctcagactta tctacctcgc tctggcacac 480
atgatcaagt ttcgaggtca tttcctcatc gagggcgatc tcaatcccga caacagcgat 540
gtggacaagc tgttcattca gctcgttcag acctacaacc agctgttcga ggaaaacccc 600
atcaatgcct ccggagtcga tgcaaaggcc atcttgtctg ctcgactctc gaagagcaga 660
cgactggaga acctcattgc ccaacttcct ggcgagaaaa agaacggact gtttggcaac 720
ctcattgccc tttctcttgg tctcacaccc aacttcaagt ccaacttcga tctggcggag 780
gacgccaagc tccagctgtc caaggacacc tacgacgatg acctcgacaa cctgcttgca 840
cagattggcg atcagtacgc cgacctgttt ctcgctgcca agaacctttc ggatgctatt 900
ctcttgtctg acattctgcg agtcaacacc gagatcacaa aggctcccct ttctgcctcc 960
atgatcaagc gatacgacga gcaccatcag gatctcacac tgctcaaggc tcttgtccga 1020
cagcaactgc ccgagaagta caaggagatc tttttcgatc agtcgaagaa cggctacgct 1080
ggatacatcg acggcggagc ctctcaggaa gagttctaca agttcatcaa gccaattctc 1140
gagaagatgg acggaaccga ggaactgctt gtcaagctca atcgagagga tctgcttcgg 1200
aagcaacgaa ccttcgacaa cggcagcatt cctcatcaga tccacctcgg tgagctgcac 1260
gccattcttc gacgtcagga agacttctac ccctttctca aggacaaccg agagaagatc 1320
gagaagattc ttacctttcg aatcccctac tatgttggtc ctcttgccag aggaaactct 1380
cgatttgctt ggatgactcg aaagtccgag gaaaccatca ctccctggaa cttcgaggaa 1440
gtcgtggaca agggtgcctc tgcacagtcc ttcatcgagc gaatgaccaa cttcgacaag 1500
aatctgccca acgagaaggt tcttcccaag cattcgctgc tctacgagta ctttacagtc 1560
tacaacgaac tcaccaaagt caagtacgtt accgagggaa tgcgaaagcc tgccttcttg 1620
tctggcgaac agaagaaagc cattgtcgat ctcctgttca agaccaaccg aaaggtcact 1680
gttaagcagc tcaaggagga ctacttcaag aaaatcgagt gtttcgacag cgtcgagatt 1740
tccggagttg aggaccgatt caacgcctct ttgggcacct atcacgatct gctcaagatt 1800
atcaaggaca aggattttct cgacaacgag gaaaacgagg acattctgga ggacatcgtg 1860
ctcactctta ccctgttcga agatcgggag atgatcgagg aacgactcaa gacatacgct 1920
cacctgttcg acgacaaggt catgaaacaa ctcaagcgac gtagatacac cggctgggga 1980
agactttcgc gaaagctcat caacggcatc agagacaagc agtccggaaa gaccattctg 2040
gactttctca agtccgatgg ctttgccaac cgaaacttca tgcagctcat tcacgacgat 2100
tctcttacct tcaaggagga catccagaag gcacaagtgt ccggtcaggg cgacagcttg 2160
cacgaacata ttgccaacct ggctggttcg ccagccatca agaaaggcat tctccagact 2220
gtcaaggttg tcgacgagct ggtgaaggtc atgggacgtc acaagcccga gaacattgtg 2280
atcgagatgg ccagagagaa ccagacaact caaaagggtc agaaaaactc gcgagagcgg 2340
atgaagcgaa tcgaggaagg catcaaggag ctgggatccc agattctcaa ggagcatccc 2400
gtcgagaaca ctcaactgca gaacgagaag ctgtatctct actatctgca gaatggtcga 2460
gacatgtacg tggatcagga actggacatc aatcgtctca gcgactacga tgtggaccac 2520
attgtccctc aatcctttct caaggacgat tctatcgaca acaaggtcct tacacgatcc 2580
gacaagaaca gaggcaagtc ggacaacgtt cccagcgaag aggtggtcaa aaagatgaag 2640
aactactggc gacagctgct caacgccaag ctcattaccc agcgaaagtt cgacaatctt 2700
accaaggccg agcgaggcgg tctgtccgag ctcgacaagg ctggcttcat caagcgtcaa 2760
ctcgtcgaga ccagacagat cacaaagcac gtcgcacaga ttctcgattc tcggatgaac 2820
accaagtacg acgagaacga caagctcatc cgagaggtca aggtgattac tctcaagtcc 2880
aaactggtct ccgatttccg aaaggacttt cagttctaca aggtgcgaga gatcaacaat 2940
taccaccatg cccacgatgc ttacctcaac gccgtcgttg gcactgcgct catcaagaaa 3000
taccccaagc tcgaaagcga gttcgtttac ggcgattaca aggtctacga cgttcgaaag 3060
atgattgcca agtccgaaca ggagattggc aaggctactg ccaagtactt cttttactcc 3120
aacatcatga actttttcaa gaccgagatc accttggcca acggagagat tcgaaagaga 3180
ccacttatcg agaccaacgg cgaaactgga gagatcgtgt gggacaaggg tcgagacttt 3240
gcaaccgtgc gaaaggttct gtcgatgcct caggtcaaca tcgtcaagaa aaccgaggtt 3300
cagactggcg gattctccaa ggagtcgatt ctgcccaagc gaaactccga caagctcatc 3360
gctcgaaaga aagactggga tcccaagaaa tacggtggct tcgattctcc taccgtcgcc 3420
tattccgtgc ttgtcgttgc gaaggtcgag aagggcaagt ccaaaaagct caagtccgtc 3480
aaggagctgc tcggaattac catcatggag cgatcgagct tcgagaagaa tcccatcgac 3540
ttcttggaag ccaagggtta caaggaggtc aagaaagacc tcattatcaa gctgcccaag 3600
tactctctgt tcgaactgga gaacggtcga aagcgtatgc tcgcctccgc tggcgagctg 3660
cagaagggaa acgagcttgc cttgccttcg aagtacgtca actttctcta tctggcttct 3720
cactacgaga agctcaaggg ttctcccgag gacaacgaac agaagcaact cttcgttgag 3780
cagcacaaac attacctcga cgagattatc gagcagattt ccgagttttc gaagcgagtc 3840
atcctggctg atgccaactt ggacaaggtg ctctctgcct acaacaagca tcgggacaaa 3900
cccattcgag aacaggcgga gaacatcatt cacctgttta ctcttaccaa cctgggtgct 3960
cctgcagctt tcaagtactt cgataccact atcgaccgaa agcggtacac atccaccaag 4020
gaggttctcg atgccaccct gattcaccag tccatcactg gcctgtacga gacccgaatc 4080
gacctgtctc agcttggtgg cgactaa 4107
<210> 10
<211> 4140
<212> DNA
<213> 人工序列
<220>
<223> 具有NLS的化脓链球菌Cas9
<400> 10
atggacaaga aatactccat cggcctggac attggaacca actctgtcgg ctgggctgtc 60
atcaccgacg agtacaaggt gccctccaag aaattcaagg tcctcggaaa caccgatcga 120
cactccatca agaaaaacct cattggtgcc ctgttgttcg attctggcga gactgccgaa 180
gctaccagac tcaagcgaac tgctcggcga cgttacaccc gacggaagaa ccgaatctgc 240
tacctgcagg agatcttttc caacgagatg gccaaggtgg acgattcgtt ctttcatcga 300
ctggaggaat ccttcctcgt cgaggaagac aagaaacacg agcgtcatcc catctttggc 360
aacattgtgg acgaggttgc ttaccacgag aagtatccta ccatctacca cctgcgaaag 420
aaactcgtcg attccaccga caaggcggat ctcagactta tctacctcgc tctggcacac 480
atgatcaagt ttcgaggtca tttcctcatc gagggcgatc tcaatcccga caacagcgat 540
gtggacaagc tgttcattca gctcgttcag acctacaacc agctgttcga ggaaaacccc 600
atcaatgcct ccggagtcga tgcaaaggcc atcttgtctg ctcgactctc gaagagcaga 660
cgactggaga acctcattgc ccaacttcct ggcgagaaaa agaacggact gtttggcaac 720
ctcattgccc tttctcttgg tctcacaccc aacttcaagt ccaacttcga tctggcggag 780
gacgccaagc tccagctgtc caaggacacc tacgacgatg acctcgacaa cctgcttgca 840
cagattggcg atcagtacgc cgacctgttt ctcgctgcca agaacctttc ggatgctatt 900
ctcttgtctg acattctgcg agtcaacacc gagatcacaa aggctcccct ttctgcctcc 960
atgatcaagc gatacgacga gcaccatcag gatctcacac tgctcaaggc tcttgtccga 1020
cagcaactgc ccgagaagta caaggagatc tttttcgatc agtcgaagaa cggctacgct 1080
ggatacatcg acggcggagc ctctcaggaa gagttctaca agttcatcaa gccaattctc 1140
gagaagatgg acggaaccga ggaactgctt gtcaagctca atcgagagga tctgcttcgg 1200
aagcaacgaa ccttcgacaa cggcagcatt cctcatcaga tccacctcgg tgagctgcac 1260
gccattcttc gacgtcagga agacttctac ccctttctca aggacaaccg agagaagatc 1320
gagaagattc ttacctttcg aatcccctac tatgttggtc ctcttgccag aggaaactct 1380
cgatttgctt ggatgactcg aaagtccgag gaaaccatca ctccctggaa cttcgaggaa 1440
gtcgtggaca agggtgcctc tgcacagtcc ttcatcgagc gaatgaccaa cttcgacaag 1500
aatctgccca acgagaaggt tcttcccaag cattcgctgc tctacgagta ctttacagtc 1560
tacaacgaac tcaccaaagt caagtacgtt accgagggaa tgcgaaagcc tgccttcttg 1620
tctggcgaac agaagaaagc cattgtcgat ctcctgttca agaccaaccg aaaggtcact 1680
gttaagcagc tcaaggagga ctacttcaag aaaatcgagt gtttcgacag cgtcgagatt 1740
tccggagttg aggaccgatt caacgcctct ttgggcacct atcacgatct gctcaagatt 1800
atcaaggaca aggattttct cgacaacgag gaaaacgagg acattctgga ggacatcgtg 1860
ctcactctta ccctgttcga agatcgggag atgatcgagg aacgactcaa gacatacgct 1920
cacctgttcg acgacaaggt catgaaacaa ctcaagcgac gtagatacac cggctgggga 1980
agactttcgc gaaagctcat caacggcatc agagacaagc agtccggaaa gaccattctg 2040
gactttctca agtccgatgg ctttgccaac cgaaacttca tgcagctcat tcacgacgat 2100
tctcttacct tcaaggagga catccagaag gcacaagtgt ccggtcaggg cgacagcttg 2160
cacgaacata ttgccaacct ggctggttcg ccagccatca agaaaggcat tctccagact 2220
gtcaaggttg tcgacgagct ggtgaaggtc atgggacgtc acaagcccga gaacattgtg 2280
atcgagatgg ccagagagaa ccagacaact caaaagggtc agaaaaactc gcgagagcgg 2340
atgaagcgaa tcgaggaagg catcaaggag ctgggatccc agattctcaa ggagcatccc 2400
gtcgagaaca ctcaactgca gaacgagaag ctgtatctct actatctgca gaatggtcga 2460
gacatgtacg tggatcagga actggacatc aatcgtctca gcgactacga tgtggaccac 2520
attgtccctc aatcctttct caaggacgat tctatcgaca acaaggtcct tacacgatcc 2580
gacaagaaca gaggcaagtc ggacaacgtt cccagcgaag aggtggtcaa aaagatgaag 2640
aactactggc gacagctgct caacgccaag ctcattaccc agcgaaagtt cgacaatctt 2700
accaaggccg agcgaggcgg tctgtccgag ctcgacaagg ctggcttcat caagcgtcaa 2760
ctcgtcgaga ccagacagat cacaaagcac gtcgcacaga ttctcgattc tcggatgaac 2820
accaagtacg acgagaacga caagctcatc cgagaggtca aggtgattac tctcaagtcc 2880
aaactggtct ccgatttccg aaaggacttt cagttctaca aggtgcgaga gatcaacaat 2940
taccaccatg cccacgatgc ttacctcaac gccgtcgttg gcactgcgct catcaagaaa 3000
taccccaagc tcgaaagcga gttcgtttac ggcgattaca aggtctacga cgttcgaaag 3060
atgattgcca agtccgaaca ggagattggc aaggctactg ccaagtactt cttttactcc 3120
aacatcatga actttttcaa gaccgagatc accttggcca acggagagat tcgaaagaga 3180
ccacttatcg agaccaacgg cgaaactgga gagatcgtgt gggacaaggg tcgagacttt 3240
gcaaccgtgc gaaaggttct gtcgatgcct caggtcaaca tcgtcaagaa aaccgaggtt 3300
cagactggcg gattctccaa ggagtcgatt ctgcccaagc gaaactccga caagctcatc 3360
gctcgaaaga aagactggga tcccaagaaa tacggtggct tcgattctcc taccgtcgcc 3420
tattccgtgc ttgtcgttgc gaaggtcgag aagggcaagt ccaaaaagct caagtccgtc 3480
aaggagctgc tcggaattac catcatggag cgatcgagct tcgagaagaa tcccatcgac 3540
ttcttggaag ccaagggtta caaggaggtc aagaaagacc tcattatcaa gctgcccaag 3600
tactctctgt tcgaactgga gaacggtcga aagcgtatgc tcgcctccgc tggcgagctg 3660
cagaagggaa acgagcttgc cttgccttcg aagtacgtca actttctcta tctggcttct 3720
cactacgaga agctcaaggg ttctcccgag gacaacgaac agaagcaact cttcgttgag 3780
cagcacaaac attacctcga cgagattatc gagcagattt ccgagttttc gaagcgagtc 3840
atcctggctg atgccaactt ggacaaggtg ctctctgcct acaacaagca tcgggacaaa 3900
cccattcgag aacaggcgga gaacatcatt cacctgttta ctcttaccaa cctgggtgct 3960
cctgcagctt tcaagtactt cgataccact atcgaccgaa agcggtacac atccaccaag 4020
gaggttctcg atgccaccct gattcaccag tccatcactg gcctgtacga gacccgaatc 4080
gacctgtctc agcttggtgg cgactccaga gccgatccca agaaaaagcg aaaggtctaa 4140
<210> 11
<211> 1379
<212> PRT
<213> 人工序列
<220>
<223> 具有NLS的化脓链球菌Cas9
<400> 11
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
Ser Arg Ala Asp Pro Lys Lys Lys Arg Lys Val
1370 1375
<210> 12
<211> 543
<212> DNA
<213> 解脂耶氏酵母
<400> 12
tcgacgttta aaccatcatc taagggcctc aaaactacct cggaactgct gcgctgatct 60
ggacaccaca gaggttccga gcactttagg ttgcaccaaa tgtcccacca ggtgcaggca 120
gaaaacgctg gaacagcgtg tacagtttgt cttaacaaaa agtgagggcg ctgaggtcga 180
gcagggtggt gtgacttgtt atagccttta gagctgcgaa agcgcgtatg gatttggctc 240
atcaggccag attgagggtc tgtggacaca tgtcatgtta gtgtacttca atcgccccct 300
ggatatagcc ccgacaatag gccgtggcct catttttttg ccttccgcac atttccattg 360
ctcggtaccc acaccttgct tctcctgcac ttgccaacct taatactggt ttacattgac 420
caacatctta caagcggggg gcttgtctag ggtatatata aacagtggct ctcccaatcg 480
gttgccagtc tcttttttcc tttctttccc cacagattcg aaatctaaac tacacatcac 540
acc 543
<210> 13
<211> 4683
<212> DNA
<213> 人工序列
<220>
<223> Cas9-NLS表达盒
<400> 13
tcgacgttta aaccatcatc taagggcctc aaaactacct cggaactgct gcgctgatct 60
ggacaccaca gaggttccga gcactttagg ttgcaccaaa tgtcccacca ggtgcaggca 120
gaaaacgctg gaacagcgtg tacagtttgt cttaacaaaa agtgagggcg ctgaggtcga 180
gcagggtggt gtgacttgtt atagccttta gagctgcgaa agcgcgtatg gatttggctc 240
atcaggccag attgagggtc tgtggacaca tgtcatgtta gtgtacttca atcgccccct 300
ggatatagcc ccgacaatag gccgtggcct catttttttg ccttccgcac atttccattg 360
ctcggtaccc acaccttgct tctcctgcac ttgccaacct taatactggt ttacattgac 420
caacatctta caagcggggg gcttgtctag ggtatatata aacagtggct ctcccaatcg 480
gttgccagtc tcttttttcc tttctttccc cacagattcg aaatctaaac tacacatcac 540
accatggaca agaaatactc catcggcctg gacattggaa ccaactctgt cggctgggct 600
gtcatcaccg acgagtacaa ggtgccctcc aagaaattca aggtcctcgg aaacaccgat 660
cgacactcca tcaagaaaaa cctcattggt gccctgttgt tcgattctgg cgagactgcc 720
gaagctacca gactcaagcg aactgctcgg cgacgttaca cccgacggaa gaaccgaatc 780
tgctacctgc aggagatctt ttccaacgag atggccaagg tggacgattc gttctttcat 840
cgactggagg aatccttcct cgtcgaggaa gacaagaaac acgagcgtca tcccatcttt 900
ggcaacattg tggacgaggt tgcttaccac gagaagtatc ctaccatcta ccacctgcga 960
aagaaactcg tcgattccac cgacaaggcg gatctcagac ttatctacct cgctctggca 1020
cacatgatca agtttcgagg tcatttcctc atcgagggcg atctcaatcc cgacaacagc 1080
gatgtggaca agctgttcat tcagctcgtt cagacctaca accagctgtt cgaggaaaac 1140
cccatcaatg cctccggagt cgatgcaaag gccatcttgt ctgctcgact ctcgaagagc 1200
agacgactgg agaacctcat tgcccaactt cctggcgaga aaaagaacgg actgtttggc 1260
aacctcattg ccctttctct tggtctcaca cccaacttca agtccaactt cgatctggcg 1320
gaggacgcca agctccagct gtccaaggac acctacgacg atgacctcga caacctgctt 1380
gcacagattg gcgatcagta cgccgacctg tttctcgctg ccaagaacct ttcggatgct 1440
attctcttgt ctgacattct gcgagtcaac accgagatca caaaggctcc cctttctgcc 1500
tccatgatca agcgatacga cgagcaccat caggatctca cactgctcaa ggctcttgtc 1560
cgacagcaac tgcccgagaa gtacaaggag atctttttcg atcagtcgaa gaacggctac 1620
gctggataca tcgacggcgg agcctctcag gaagagttct acaagttcat caagccaatt 1680
ctcgagaaga tggacggaac cgaggaactg cttgtcaagc tcaatcgaga ggatctgctt 1740
cggaagcaac gaaccttcga caacggcagc attcctcatc agatccacct cggtgagctg 1800
cacgccattc ttcgacgtca ggaagacttc tacccctttc tcaaggacaa ccgagagaag 1860
atcgagaaga ttcttacctt tcgaatcccc tactatgttg gtcctcttgc cagaggaaac 1920
tctcgatttg cttggatgac tcgaaagtcc gaggaaacca tcactccctg gaacttcgag 1980
gaagtcgtgg acaagggtgc ctctgcacag tccttcatcg agcgaatgac caacttcgac 2040
aagaatctgc ccaacgagaa ggttcttccc aagcattcgc tgctctacga gtactttaca 2100
gtctacaacg aactcaccaa agtcaagtac gttaccgagg gaatgcgaaa gcctgccttc 2160
ttgtctggcg aacagaagaa agccattgtc gatctcctgt tcaagaccaa ccgaaaggtc 220
actgttaagc agctcaagga ggactacttc aagaaaatcg agtgtttcga cagcgtcgag 2280
atttccggag ttgaggaccg attcaacgcc tctttgggca cctatcacga tctgctcaag 2340
attatcaagg acaaggattt tctcgacaac gaggaaaacg aggacattct ggaggacatc 2400
gtgctcactc ttaccctgtt cgaagatcgg gagatgatcg aggaacgact caagacatac 2460
gctcacctgt tcgacgacaa ggtcatgaaa caactcaagc gacgtagata caccggctgg 2520
ggaagacttt cgcgaaagct catcaacggc atcagagaca agcagtccgg aaagaccatt 2580
ctggactttc tcaagtccga tggctttgcc aaccgaaact tcatgcagct cattcacgac 2640
gattctctta ccttcaagga ggacatccag aaggcacaag tgtccggtca gggcgacagc 2700
ttgcacgaac atattgccaa cctggctggt tcgccagcca tcaagaaagg cattctccag 2760
actgtcaagg ttgtcgacga gctggtgaag gtcatgggac gtcacaagcc cgagaacatt 2820
gtgatcgaga tggccagaga gaaccagaca actcaaaagg gtcagaaaaa ctcgcgagag 2880
cggatgaagc gaatcgagga aggcatcaag gagctgggat cccagattct caaggagcat 2940
cccgtcgaga acactcaact gcagaacgag aagctgtatc tctactatct gcagaatggt 3000
cgagacatgt acgtggatca ggaactggac atcaatcgtc tcagcgacta cgatgtggac 3060
cacattgtcc ctcaatcctt tctcaaggac gattctatcg acaacaaggt ccttacacga 3120
tccgacaaga acagaggcaa gtcggacaac gttcccagcg aagaggtggt caaaaagatg 3180
aagaactact ggcgacagct gctcaacgcc aagctcatta cccagcgaaa gttcgacaat 3240
cttaccaagg ccgagcgagg cggtctgtcc gagctcgaca aggctggctt catcaagcgt 3300
caactcgtcg agaccagaca gatcacaaag cacgtcgcac agattctcga ttctcggatg 3360
aacaccaagt acgacgagaa cgacaagctc atccgagagg tcaaggtgat tactctcaag 3420
tccaaactgg tctccgattt ccgaaaggac tttcagttct acaaggtgcg agagatcaac 3480
aattaccacc atgcccacga tgcttacctc aacgccgtcg ttggcactgc gctcatcaag 3540
aaatacccca agctcgaaag cgagttcgtt tacggcgatt acaaggtcta cgacgttcga 3600
aagatgattg ccaagtccga acaggagatt ggcaaggcta ctgccaagta cttcttttac 3660
tccaacatca tgaacttttt caagaccgag atcaccttgg ccaacggaga gattcgaaag 3720
agaccactta tcgagaccaa cggcgaaact ggagagatcg tgtgggacaa gggtcgagac 3780
tttgcaaccg tgcgaaaggt tctgtcgatg cctcaggtca acatcgtcaa gaaaaccgag 3840
gttcagactg gcggattctc caaggagtcg attctgccca agcgaaactc cgacaagctc 3900
atcgctcgaa agaaagactg ggatcccaag aaatacggtg gcttcgattc tcctaccgtc 3960
gcctattccg tgcttgtcgt tgcgaaggtc gagaagggca agtccaaaaa gctcaagtcc 4020
gtcaaggagc tgctcggaat taccatcatg gagcgatcga gcttcgagaa gaatcccatc 4080
gacttcttgg aagccaaggg ttacaaggag gtcaagaaag acctcattat caagctgccc 4140
aagtactctc tgttcgaact ggagaacggt cgaaagcgta tgctcgcctc cgctggcgag 4200
ctgcagaagg gaaacgagct tgccttgcct tcgaagtacg tcaactttct ctatctggct 4260
tctcactacg agaagctcaa gggttctccc gaggacaacg aacagaagca actcttcgtt 4320
gagcagcaca aacattacct cgacgagatt atcgagcaga tttccgagtt ttcgaagcga 4380
gtcatcctgg ctgatgccaa cttggacaag gtgctctctg cctacaacaa gcatcgggac 4440
aaacccattc gagaacaggc ggagaacatc attcacctgt ttactcttac caacctgggt 4500
gctcctgcag ctttcaagta cttcgatacc actatcgacc gaaagcggta cacatccacc 4560
aaggaggttc tcgatgccac cctgattcac cagtccatca ctggcctgta cgagacccga 4620
atcgacctgt ctcagcttgg tggcgactcc agagccgatc ccaagaaaaa gcgaaaggtc 4680
taa 4683
<210> 14
<211> 10706
<212> DNA
<213> 人工序列
<220>
<223> pZUFCas9质粒
<400> 14
catggacaag aaatactcca tcggcctgga cattggaacc aactctgtcg gctgggctgt 60
catcaccgac gagtacaagg tgccctccaa gaaattcaag gtcctcggaa acaccgatcg 120
acactccatc aagaaaaacc tcattggtgc cctgttgttc gattctggcg agactgccga 180
agctaccaga ctcaagcgaa ctgctcggcg acgttacacc cgacggaaga accgaatctg 240
ctacctgcag gagatctttt ccaacgagat ggccaaggtg gacgattcgt tctttcatcg 300
actggaggaa tccttcctcg tcgaggaaga caagaaacac gagcgtcatc ccatctttgg 360
caacattgtg gacgaggttg cttaccacga gaagtatcct accatctacc acctgcgaaa 420
gaaactcgtc gattccaccg acaaggcgga tctcagactt atctacctcg ctctggcaca 480
catgatcaag tttcgaggtc atttcctcat cgagggcgat ctcaatcccg acaacagcga 540
tgtggacaag ctgttcattc agctcgttca gacctacaac cagctgttcg aggaaaaccc 600
catcaatgcc tccggagtcg atgcaaaggc catcttgtct gctcgactct cgaagagcag 660
acgactggag aacctcattg cccaacttcc tggcgagaaa aagaacggac tgtttggcaa 720
cctcattgcc ctttctcttg gtctcacacc caacttcaag tccaacttcg atctggcgga 780
ggacgccaag ctccagctgt ccaaggacac ctacgacgat gacctcgaca acctgcttgc 840
acagattggc gatcagtacg ccgacctgtt tctcgctgcc aagaaccttt cggatgctat 900
tctcttgtct gacattctgc gagtcaacac cgagatcaca aaggctcccc tttctgcctc 960
catgatcaag cgatacgacg agcaccatca ggatctcaca ctgctcaagg ctcttgtccg 1020
acagcaactg cccgagaagt acaaggagat ctttttcgat cagtcgaaga acggctacgc 1080
tggatacatc gacggcggag cctctcagga agagttctac aagttcatca agccaattct 1140
cgagaagatg gacggaaccg aggaactgct tgtcaagctc aatcgagagg atctgcttcg 1200
gaagcaacga accttcgaca acggcagcat tcctcatcag atccacctcg gtgagctgca 1260
cgccattctt cgacgtcagg aagacttcta cccctttctc aaggacaacc gagagaagat 1320
cgagaagatt cttacctttc gaatccccta ctatgttggt cctcttgcca gaggaaactc 1380
tcgatttgct tggatgactc gaaagtccga ggaaaccatc actccctgga acttcgagga 1440
agtcgtggac aagggtgcct ctgcacagtc cttcatcgag cgaatgacca acttcgacaa 1500
gaatctgccc aacgagaagg ttcttcccaa gcattcgctg ctctacgagt actttacagt 1560
ctacaacgaa ctcaccaaag tcaagtacgt taccgaggga atgcgaaagc ctgccttctt 1620
gtctggcgaa cagaagaaag ccattgtcga tctcctgttc aagaccaacc gaaaggtcac 1680
tgttaagcag ctcaaggagg actacttcaa gaaaatcgag tgtttcgaca gcgtcgagat 1740
ttccggagtt gaggaccgat tcaacgcctc tttgggcacc tatcacgatc tgctcaagat 1800
tatcaaggac aaggattttc tcgacaacga ggaaaacgag gacattctgg aggacatcgt 1860
gctcactctt accctgttcg aagatcggga gatgatcgag gaacgactca agacatacgc 1920
tcacctgttc gacgacaagg tcatgaaaca actcaagcga cgtagataca ccggctgggg 1980
aagactttcg cgaaagctca tcaacggcat cagagacaag cagtccggaa agaccattct 2040
ggactttctc aagtccgatg gctttgccaa ccgaaacttc atgcagctca ttcacgacga 2100
ttctcttacc ttcaaggagg acatccagaa ggcacaagtg tccggtcagg gcgacagctt 2160
gcacgaacat attgccaacc tggctggttc gccagccatc aagaaaggca ttctccagac 2220
tgtcaaggtt gtcgacgagc tggtgaaggt catgggacgt cacaagcccg agaacattgt 2280
gatcgagatg gccagagaga accagacaac tcaaaagggt cagaaaaact cgcgagagcg 2340
gatgaagcga atcgaggaag gcatcaagga gctgggatcc cagattctca aggagcatcc 2400
cgtcgagaac actcaactgc agaacgagaa gctgtatctc tactatctgc agaatggtcg 2460
agacatgtac gtggatcagg aactggacat caatcgtctc agcgactacg atgtggacca 2520
cattgtccct caatcctttc tcaaggacga ttctatcgac aacaaggtcc ttacacgatc 2580
cgacaagaac agaggcaagt cggacaacgt tcccagcgaa gaggtggtca aaaagatgaa 2640
gaactactgg cgacagctgc tcaacgccaa gctcattacc cagcgaaagt tcgacaatct 2700
taccaaggcc gagcgaggcg gtctgtccga gctcgacaag gctggcttca tcaagcgtca 2760
actcgtcgag accagacaga tcacaaagca cgtcgcacag attctcgatt ctcggatgaa 2820
caccaagtac gacgagaacg acaagctcat ccgagaggtc aaggtgatta ctctcaagtc 2880
caaactggtc tccgatttcc gaaaggactt tcagttctac aaggtgcgag agatcaacaa 2940
ttaccaccat gcccacgatg cttacctcaa cgccgtcgtt ggcactgcgc tcatcaagaa 3000
ataccccaag ctcgaaagcg agttcgttta cggcgattac aaggtctacg acgttcgaaa 3060
gatgattgcc aagtccgaac aggagattgg caaggctact gccaagtact tcttttactc 3120
caacatcatg aactttttca agaccgagat caccttggcc aacggagaga ttcgaaagag 3180
accacttatc gagaccaacg gcgaaactgg agagatcgtg tgggacaagg gtcgagactt 3240
tgcaaccgtg cgaaaggttc tgtcgatgcc tcaggtcaac atcgtcaaga aaaccgaggt 3300
tcagactggc ggattctcca aggagtcgat tctgcccaag cgaaactccg acaagctcat 3360
cgctcgaaag aaagactggg atcccaagaa atacggtggc ttcgattctc ctaccgtcgc 3420
ctattccgtg cttgtcgttg cgaaggtcga gaagggcaag tccaaaaagc tcaagtccgt 3480
caaggagctg ctcggaatta ccatcatgga gcgatcgagc ttcgagaaga atcccatcga 3540
cttcttggaa gccaagggtt acaaggaggt caagaaagac ctcattatca agctgcccaa 3600
gtactctctg ttcgaactgg agaacggtcg aaagcgtatg ctcgcctccg ctggcgagct 3660
gcagaaggga aacgagcttg ccttgccttc gaagtacgtc aactttctct atctggcttc 3720
tcactacgag aagctcaagg gttctcccga ggacaacgaa cagaagcaac tcttcgttga 3780
gcagcacaaa cattacctcg acgagattat cgagcagatt tccgagtttt cgaagcgagt 3840
catcctggct gatgccaact tggacaaggt gctctctgcc tacaacaagc atcgggacaa 3900
acccattcga gaacaggcgg agaacatcat tcacctgttt actcttacca acctgggtgc 3960
tcctgcagct ttcaagtact tcgataccac tatcgaccga aagcggtaca catccaccaa 4020
ggaggttctc gatgccaccc tgattcacca gtccatcact ggcctgtacg agacccgaat 4080
cgacctgtct cagcttggtg gcgactccag agccgatccc aagaaaaagc gaaaggtcta 4140
agcggccgca agtgtggatg gggaagtgag tgcccggttc tgtgtgcaca attggcaatc 4200
caagatggat ggattcaaca cagggatata gcgagctacg tggtggtgcg aggatatagc 4260
aacggatatt tatgtttgac acttgagaat gtacgataca agcactgtcc aagtacaata 4320
ctaaacatac tgtacatact catactcgta cccgggcaac ggtttcactt gagtgcagtg 4380
gctagtgctc ttactcgtac agtgtgcaat actgcgtatc atagtctttg atgtatatcg 4440
tattcattca tgttagttgc gtacgagccg gaagcataaa gtgtaaagcc tggggtgcct 4500
aatgagtgag ctaactcaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa 4560
acctgtcgtg ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta 4620
ttgggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc 4680
gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg 4740
caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt 4800
tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa 4860
gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct 4920
ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc 4980
cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg 5040
tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct 5100
tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag 5160
cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga 5220
agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc gctctgctga 5280
agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg 5340
gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag 5400
aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag 5460
ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat 5520
gaagttttaa atcaatctaa agtatatatg agtaaacttg gtctgacagt taccaatgct 5580
taatcagtga ggcacctatc tcagcgatct gtctatttcg ttcatccata gttgcctgac 5640
tccccgtcgt gtagataact acgatacggg agggcttacc atctggcccc agtgctgcaa 5700
tgataccgcg agacccacgc tcaccggctc cagatttatc agcaataaac cagccagccg 5760
gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag tctattaatt 5820
gttgccggga agctagagta agtagttcgc cagttaatag tttgcgcaac gttgttgcca 5880
ttgctacagg catcgtggtg tcacgctcgt cgtttggtat ggcttcattc agctccggtt 5940
cccaacgatc aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg gttagctcct 6000
tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt gttatcactc atggttatgg 6060
cagcactgca taattctctt actgtcatgc catccgtaag atgcttttct gtgactggtg 6120
agtactcaac caagtcattc tgagaatagt gtatgcggcg accgagttgc tcttgcccgg 6180
cgtcaatacg ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa 6240
aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt 6300
aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt 6360
gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt 6420
gaatactcat actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca 6480
tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 6540
ttccccgaaa agtgccacct gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg 6600
tggttacgcg cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt 6660
tcttcccttc ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc 6720
tccctttagg gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg 6780
gtgatggttc acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg 6840
agtccacgtt ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct 6900
cggtctattc ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg 6960
agctgattta acaaaaattt aacgcgaatt ttaacaaaat attaacgctt acaatttcca 7020
ttcgccattc aggctgcgca actgttggga agggcgatcg gtgcgggcct cttcgctatt 7080
acgccagctg gcgaaagggg gatgtgctgc aaggcgatta agttgggtaa cgccagggtt 7140
ttcccagtca cgacgttgta aaacgacggc cagtgaattg taatacgact cactataggg 7200
cgaattgggt accgggcccc ccctcgaggt cgatggtgtc gataagcttg atatcgaatt 7260
catgtcacac aaaccgatct tcgcctcaag gaaacctaat tctacatccg agagactgcc 7320
gagatccagt ctacactgat taattttcgg gccaataatt taaaaaaatc gtgttatata 7380
atattatatg tattatatat atacatcatg atgatactga cagtcatgtc ccattgctaa 7440
atagacagac tccatctgcc gcctccaact gatgttctca atatttaagg ggtcatctcg 7500
cattgtttaa taataaacag actccatcta ccgcctccaa atgatgttct caaaatatat 7560
tgtatgaact tatttttatt acttagtatt attagacaac ttacttgctt tatgaaaaac 7620
acttcctatt taggaaacaa tttataatgg cagttcgttc atttaacaat ttatgtagaa 7680
taaatgttat aaatgcgtat gggaaatctt aaatatggat agcataaatg atatctgcat 7740
tgcctaattc gaaatcaaca gcaacgaaaa aaatcccttg tacaacataa atagtcatcg 7800
agaaatatca actatcaaag aacagctatt cacacgttac tattgagatt attattggac 7860
gagaatcaca cactcaactg tctttctctc ttctagaaat acaggtacaa gtatgtacta 7920
ttctcattgt tcatacttct agtcatttca tcccacatat tccttggatt tctctccaat 7980
gaatgacatt ctatcttgca aattcaacaa ttataataag atataccaaa gtagcggtat 8040
agtggcaatc aaaaagcttc tctggtgtgc ttctcgtatt tatttttatt ctaatgatcc 8100
attaaaggta tatatttatt tcttgttata taatcctttt gtttattaca tgggctggat 8160
acataaaggt attttgattt aattttttgc ttaaattcaa tcccccctcg ttcagtgtca 8220
actgtaatgg taggaaatta ccatactttt gaagaagcaa aaaaaatgaa agaaaaaaaa 8280
aatcgtattt ccaggttaga cgttccgcag aatctagaat gcggtatgcg gtacattgtt 8340
cttcgaacgt aaaagttgcg ctccctgaga tattgtacat ttttgctttt acaagtacaa 8400
gtacatcgta caactatgta ctactgttga tgcatccaca acagtttgtt ttgttttttt 8460
ttgttttttt tttttctaat gattcattac cgctatgtat acctacttgt acttgtagta 8520
agccgggtta ttggcgttca attaatcata gacttatgaa tctgcacggt gtgcgctgcg 8580
agttactttt agcttatgca tgctacttgg gtgtaatatt gggatctgtt cggaaatcaa 8640
cggatgctca atcgatttcg acagtaatta attaagtcat acacaagtca gctttcttcg 8700
agcctcatat aagtataagt agttcaacgt attagcactg tacccagcat ctccgtatcg 8760
agaaacacaa caacatgccc cattggacag atcatgcgga tacacaggtt gtgcagtatc 8820
atacatactc gatcagacag gtcgtctgac catcatacaa gctgaacaag cgctccatac 8880
ttgcacgctc tctatataca cagttaaatt acatatccat agtctaacct ctaacagtta 8940
atcttctggt aagcctccca gccagccttc tggtatcgct tggcctcctc aataggatct 9000
cggttctggc cgtacagacc tcggccgaca attatgatat ccgttccggt agacatgaca 9060
tcctcaacag ttcggtactg ctgtccgaga gcgtctccct tgtcgtcaag acccaccccg 9120
ggggtcagaa taagccagtc ctcagagtcg cccttaggtc ggttctgggc aatgaagcca 9180
accacaaact cggggtcgga tcgggcaagc tcaatggtct gcttggagta ctcgccagtg 9240
gccagagagc ccttgcaaga cagctcggcc agcatgagca gacctctggc cagcttctcg 9300
ttgggagagg ggactaggaa ctccttgtac tgggagttct cgtagtcaga gacgtcctcc 9360
ttcttctgtt cagagacagt ttcctcggca ccagctcgca ggccagcaat gattccggtt 9420
ccgggtacac cgtgggcgtt ggtgatatcg gaccactcgg cgattcggtg acaccggtac 9480
tggtgcttga cagtgttgcc aatatctgcg aactttctgt cctcgaacag gaagaaaccg 9540
tgcttaagag caagttcctt gagggggagc acagtgccgg cgtaggtgaa gtcgtcaatg 9600
atgtcgatat gggttttgat catgcacaca taaggtccga ccttatcggc aagctcaatg 9660
agctccttgg tggtggtaac atccagagaa gcacacaggt tggttttctt ggctgccacg 9720
agcttgagca ctcgagcggc aaaggcggac ttgtggacgt tagctcgagc ttcgtaggag 9780
ggcattttgg tggtgaagag gagactgaaa taaatttagt ctgcagaact ttttatcgga 9840
accttatctg gggcagtgaa gtatatgtta tggtaatagt tacgagttag ttgaacttat 9900
agatagactg gactatacgg ctatcggtcc aaattagaaa gaacgtcaat ggctctctgg 9960
gcgtcgcctt tgccgacaaa aatgtgatca tgatgaaagc cagcaatgac gttgcagctg 10020
atattgttgt cggccaaccg cgccgaaaac gcagctgtca gacccacagc ctccaacgaa 10080
gaatgtatcg tcaaagtgat ccaagcacac tcatagttgg agtcgtactc caaaggcggc 10140
aatgacgagt cagacagata ctcgtcgacg tttaaaccat catctaaggg cctcaaaact 10200
acctcggaac tgctgcgctg atctggacac cacagaggtt ccgagcactt taggttgcac 10260
caaatgtccc accaggtgca ggcagaaaac gctggaacag cgtgtacagt ttgtcttaac 10320
aaaaagtgag ggcgctgagg tcgagcaggg tggtgtgact tgttatagcc tttagagctg 10380
cgaaagcgcg tatggatttg gctcatcagg ccagattgag ggtctgtgga cacatgtcat 10440
gttagtgtac ttcaatcgcc ccctggatat agccccgaca ataggccgtg gcctcatttt 10500
tttgccttcc gcacatttcc attgctcggt acccacacct tgcttctcct gcacttgcca 10560
accttaatac tggtttacat tgaccaacat cttacaagcg gggggcttgt ctagggtata 10620
tataaacagt ggctctccca atcggttgcc agtctctttt ttcctttctt tccccacaga 10680
ttcgaaatct aaactacaca tcacac 10706
<210> 15
<211> 43
<212> RNA
<213> 人工序列
<220>
<223> 锤头(HH)核酶
<220>
<221> misc_feature
<222> (1)..(6)
<223> n = A、C、U或G
<400> 15
nnnnnncuga ugaguccgug aggacgaaac gaguaagcuc guc 43
<210> 16
<211> 68
<212> RNA
<213> 丁型肝炎病毒
<400> 16
ggccggcaug gucccagccu ccucgcuggc gccggcuggg caacaugcuu cggcauggcg 60
aaugggac 68
<210> 17
<211> 20
<212> DNA
<213> 解脂耶氏酵母
<400> 17
tcaaacgatt acccaccctc 20
<210> 18
<211> 760
<212> DNA
<213> 人工序列
<220>
<223> RGR表达盒
<400> 18
tcgacgttta aaccatcatc taagggcctc aaaactacct cggaactgct gcgctgatct 60
ggacaccaca gaggttccga gcactttagg ttgcaccaaa tgtcccacca ggtgcaggca 120
gaaaacgctg gaacagcgtg tacagtttgt cttaacaaaa agtgagggcg ctgaggtcga 180
gcagggtggt gtgacttgtt atagccttta gagctgcgaa agcgcgtatg gatttggctc 240
atcaggccag attgagggtc tgtggacaca tgtcatgtta gtgtacttca atcgccccct 300
ggatatagcc ccgacaatag gccgtggcct catttttttg ccttccgcac atttccattg 360
ctcggtaccc acaccttgct tctcctgcac ttgccaacct taatactggt ttacattgac 420
caacatctta caagcggggg gcttgtctag ggtatatata aacagtggct ctcccaatcg 480
gttgccagtc tcttttttcc tttctttccc cacagattcg aaatctaaac tacacatcac 540
accatggttt gactgatgag tccgtgagga cgaaacgagt aagctcgtct caaacgatta 600
cccaccctcg ttttagagct agaaatagca agttaaaata aggctagtcc gttatcaact 660
tgaaaaagtg gcaccgagtc ggtggtgctt ttggccggca tggtcccagc ctcctcgctg 720
gcgccggctg ggcaacatgc ttcggcatgg cgaatgggac 760
<210> 19
<211> 6793
<212> DNA
<213> 人工序列
<220>
<223> pRF38质粒
<400> 19
catggtttga ctgatgagtc cgtgaggacg aaacgagtaa gctcgtctca aacgattacc 60
caccctcgtt ttagagctag aaatagcaag ttaaaataag gctagtccgt tatcaacttg 120
aaaaagtggc accgagtcgg tggtgctttt ggccggcatg gtcccagcct cctcgctggc 180
gccggctggg caacatgctt cggcatggcg aatgggacaa gcttgggggc ggccgcaagt 240
gtggatgggg aagtgagtgc ccggttctgt gtgcacaatt ggcaatccaa gatggatgga 300
ttcaacacag ggatatagcg agctacgtgg tggtgcgagg atatagcaac ggatatttat 360
gtttgacact tgagaatgta cgatacaagc actgtccaag tacaatacta aacatactgt 420
acatactcat actcgtaccc gggcaacggt ttcacttgag tgcagtggct agtgctctta 480
ctcgtacagt gtgcaatact gcgtatcata gtctttgatg tatatcgtat tcattcatgt 540
tagttgcgta cgagccggaa gcataaagtg taaagcctgg ggtgcctaat gagtgagcta 600
actcacatta attgcgttgc gctcactgcc cgctttccag tcgggaaacc tgtcgtgcca 660
gctgcattaa tgaatcggcc aacgcgcggg gagaggcggt ttgcgtattg ggcgctcttc 720
cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg ctgcggcgag cggtatcagc 780
tcactcaaag gcggtaatac ggttatccac agaatcaggg gataacgcag gaaagaacat 840
gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt 900
ccataggctc cgcccccctg acgagcatca caaaaatcga cgctcaagtc agaggtggcg 960
aaacccgaca ggactataaa gataccaggc gtttccccct ggaagctccc tcgtgcgctc 1020
tcctgttccg accctgccgc ttaccggata cctgtccgcc tttctccctt cgggaagcgt 1080
ggcgctttct catagctcac gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa 1140
gctgggctgt gtgcacgaac cccccgttca gcccgaccgc tgcgccttat ccggtaacta 1200
tcgtcttgag tccaacccgg taagacacga cttatcgcca ctggcagcag ccactggtaa 1260
caggattagc agagcgaggt atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa 1320
ctacggctac actagaagga cagtatttgg tatctgcgct ctgctgaagc cagttacctt 1380
cggaaaaaga gttggtagct cttgatccgg caaacaaacc accgctggta gcggtggttt 1440
ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga tctcaagaag atcctttgat 1500
cttttctacg gggtctgacg ctcagtggaa cgaaaactca cgttaaggga ttttggtcat 1560
gagattatca aaaaggatct tcacctagat ccttttaaat taaaaatgaa gttttaaatc 1620
aatctaaagt atatatgagt aaacttggtc tgacagttac caatgcttaa tcagtgaggc 1680
acctatctca gcgatctgtc tatttcgttc atccatagtt gcctgactcc ccgtcgtgta 1740
gataactacg atacgggagg gcttaccatc tggccccagt gctgcaatga taccgcgaga 1800
cccacgctca ccggctccag atttatcagc aataaaccag ccagccggaa gggccgagcg 1860
cagaagtggt cctgcaactt tatccgcctc catccagtct attaattgtt gccgggaagc 1920
tagagtaagt agttcgccag ttaatagttt gcgcaacgtt gttgccattg ctacaggcat 1980
cgtggtgtca cgctcgtcgt ttggtatggc ttcattcagc tccggttccc aacgatcaag 2040
gcgagttaca tgatccccca tgttgtgcaa aaaagcggtt agctccttcg gtcctccgat 2100
cgttgtcaga agtaagttgg ccgcagtgtt atcactcatg gttatggcag cactgcataa 2160
ttctcttact gtcatgccat ccgtaagatg cttttctgtg actggtgagt actcaaccaa 2220
gtcattctga gaatagtgta tgcggcgacc gagttgctct tgcccggcgt caatacggga 2280
taataccgcg ccacatagca gaactttaaa agtgctcatc attggaaaac gttcttcggg 2340
gcgaaaactc tcaaggatct taccgctgtt gagatccagt tcgatgtaac ccactcgtgc 2400
acccaactga tcttcagcat cttttacttt caccagcgtt tctgggtgag caaaaacagg 2460
aaggcaaaat gccgcaaaaa agggaataag ggcgacacgg aaatgttgaa tactcatact 2520
cttccttttt caatattatt gaagcattta tcagggttat tgtctcatga gcggatacat 2580
atttgaatgt atttagaaaa ataaacaaat aggggttccg cgcacatttc cccgaaaagt 2640
gccacctgac gcgccctgta gcggcgcatt aagcgcggcg ggtgtggtgg ttacgcgcag 2700
cgtgaccgct acacttgcca gcgccctagc gcccgctcct ttcgctttct tcccttcctt 2760
tctcgccacg ttcgccggct ttccccgtca agctctaaat cgggggctcc ctttagggtt 2820
ccgatttagt gctttacggc acctcgaccc caaaaaactt gattagggtg atggttcacg 2880
tagtgggcca tcgccctgat agacggtttt tcgccctttg acgttggagt ccacgttctt 2940
taatagtgga ctcttgttcc aaactggaac aacactcaac cctatctcgg tctattcttt 3000
tgatttataa gggattttgc cgatttcggc ctattggtta aaaaatgagc tgatttaaca 3060
aaaatttaac gcgaatttta acaaaatatt aacgcttaca atttccattc gccattcagg 3120
ctgcgcaact gttgggaagg gcgatcggtg cgggcctctt cgctattacg ccagctggcg 3180
aaagggggat gtgctgcaag gcgattaagt tgggtaacgc cagggttttc ccagtcacga 3240
cgttgtaaaa cgacggccag tgaattgtaa tacgactcac tatagggcga attgggtacc 3300
gggccccccc tcgaggtcga tggtgtcgat aagcttgata tcgaattcat gtcacacaaa 3360
ccgatcttcg cctcaaggaa acctaattct acatccgaga gactgccgag atccagtcta 3420
cactgattaa ttttcgggcc aataatttaa aaaaatcgtg ttatataata ttatatgtat 3480
tatatatata catcatgatg atactgacag tcatgtccca ttgctaaata gacagactcc 3540
atctgccgcc tccaactgat gttctcaata tttaaggggt catctcgcat tgtttaataa 3600
taaacagact ccatctaccg cctccaaatg atgttctcaa aatatattgt atgaacttat 3660
ttttattact tagtattatt agacaactta cttgctttat gaaaaacact tcctatttag 3720
gaaacaattt ataatggcag ttcgttcatt taacaattta tgtagaataa atgttataaa 3780
tgcgtatggg aaatcttaaa tatggatagc ataaatgata tctgcattgc ctaattcgaa 3840
atcaacagca acgaaaaaaa tcccttgtac aacataaata gtcatcgaga aatatcaact 3900
atcaaagaac agctattcac acgttactat tgagattatt attggacgag aatcacacac 3960
tcaactgtct ttctctcttc tagaaataca ggtacaagta tgtactattc tcattgttca 4020
tacttctagt catttcatcc cacatattcc ttggatttct ctccaatgaa tgacattcta 4080
tcttgcaaat tcaacaatta taataagata taccaaagta gcggtatagt ggcaatcaaa 4140
aagcttctct ggtgtgcttc tcgtatttat ttttattcta atgatccatt aaaggtatat 4200
atttatttct tgttatataa tccttttgtt tattacatgg gctggataca taaaggtatt 4260
ttgatttaat tttttgctta aattcaatcc cccctcgttc agtgtcaact gtaatggtag 4320
gaaattacca tacttttgaa gaagcaaaaa aaatgaaaga aaaaaaaaat cgtatttcca 4380
ggttagacgt tccgcagaat ctagaatgcg gtatgcggta cattgttctt cgaacgtaaa 4440
agttgcgctc cctgagatat tgtacatttt tgcttttaca agtacaagta catcgtacaa 4500
ctatgtacta ctgttgatgc atccacaaca gtttgttttg tttttttttg tttttttttt 4560
ttctaatgat tcattaccgc tatgtatacc tacttgtact tgtagtaagc cgggttattg 4620
gcgttcaatt aatcatagac ttatgaatct gcacggtgtg cgctgcgagt tacttttagc 4680
ttatgcatgc tacttgggtg taatattggg atctgttcgg aaatcaacgg atgctcaatc 4740
gatttcgaca gtaattaatt aagtcataca caagtcagct ttcttcgagc ctcatataag 4800
tataagtagt tcaacgtatt agcactgtac ccagcatctc cgtatcgaga aacacaacaa 4860
catgccccat tggacagatc atgcggatac acaggttgtg cagtatcata catactcgat 4920
cagacaggtc gtctgaccat catacaagct gaacaagcgc tccatacttg cacgctctct 4980
atatacacag ttaaattaca tatccatagt ctaacctcta acagttaatc ttctggtaag 5040
cctcccagcc agccttctgg tatcgcttgg cctcctcaat aggatctcgg ttctggccgt 5100
acagacctcg gccgacaatt atgatatccg ttccggtaga catgacatcc tcaacagttc 5160
ggtactgctg tccgagagcg tctcccttgt cgtcaagacc caccccgggg gtcagaataa 5220
gccagtcctc agagtcgccc ttaggtcggt tctgggcaat gaagccaacc acaaactcgg 5280
ggtcggatcg ggcaagctca atggtctgct tggagtactc gccagtggcc agagagccct 5340
tgcaagacag ctcggccagc atgagcagac ctctggccag cttctcgttg ggagagggga 5400
ctaggaactc cttgtactgg gagttctcgt agtcagagac gtcctccttc ttctgttcag 5460
agacagtttc ctcggcacca gctcgcaggc cagcaatgat tccggttccg ggtacaccgt 5520
gggcgttggt gatatcggac cactcggcga ttcggtgaca ccggtactgg tgcttgacag 5580
tgttgccaat atctgcgaac tttctgtcct cgaacaggaa gaaaccgtgc ttaagagcaa 5640
gttccttgag ggggagcaca gtgccggcgt aggtgaagtc gtcaatgatg tcgatatggg 5700
ttttgatcat gcacacataa ggtccgacct tatcggcaag ctcaatgagc tccttggtgg 5760
tggtaacatc cagagaagca cacaggttgg ttttcttggc tgccacgagc ttgagcactc 5820
gagcggcaaa ggcggacttg tggacgttag ctcgagcttc gtaggagggc attttggtgg 5880
tgaagaggag actgaaataa atttagtctg cagaactttt tatcggaacc ttatctgggg 5940
cagtgaagta tatgttatgg taatagttac gagttagttg aacttataga tagactggac 6000
tatacggcta tcggtccaaa ttagaaagaa cgtcaatggc tctctgggcg tcgcctttgc 6060
cgacaaaaat gtgatcatga tgaaagccag caatgacgtt gcagctgata ttgttgtcgg 6120
ccaaccgcgc cgaaaacgca gctgtcagac ccacagcctc caacgaagaa tgtatcgtca 6180
aagtgatcca agcacactca tagttggagt cgtactccaa aggcggcaat gacgagtcag 6240
acagatactc gtcgacgttt aaaccatcat ctaagggcct caaaactacc tcggaactgc 6300
tgcgctgatc tggacaccac agaggttccg agcactttag gttgcaccaa atgtcccacc 6360
aggtgcaggc agaaaacgct ggaacagcgt gtacagtttg tcttaacaaa aagtgagggc 6420
gctgaggtcg agcagggtgg tgtgacttgt tatagccttt agagctgcga aagcgcgtat 6480
ggatttggct catcaggcca gattgagggt ctgtggacac atgtcatgtt agtgtacttc 6540
aatcgccccc tggatatagc cccgacaata ggccgtggcc tcattttttt gccttccgca 6600
catttccatt gctcggtacc cacaccttgc ttctcctgca cttgccaacc ttaatactgg 6660
tttacattga ccaacatctt acaagcgggg ggcttgtcta gggtatatat aaacagtggc 6720
tctcccaatc ggttgccagt ctcttttttc ctttctttcc ccacagattc gaaatctaaa 6780
ctacacatca cac 6793
<210> 20
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> RGR正向PCR引物
<400> 20
cgagtcagac agatactcg 19
<210> 21
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> RGR反向PCR引物
<400> 21
ccctgtgttg aatccatcc 19
<210> 22
<211> 20
<212> DNA
<213> 解脂耶氏酵母
<400> 22
ggaaggcaca tatggcaagg 20
<210> 23
<211> 21
<212> DNA
<213> 解脂耶氏酵母
<400> 23
gtaagagtgg tttgctccag g 21
<210> 24
<211> 21
<212> DNA
<213> 解脂耶氏酵母
<400> 24
gcacaggtat ttctgccctt c 21
<210> 25
<211> 709
<212> DNA
<213> 人工序列
<220>
<223> RG表达盒
<400> 25
tcgacgttta aaccatcatc taagggcctc aaaactacct cggaactgct gcgctgatct 60
ggacaccaca gaggttccga gcactttagg ttgcaccaaa tgtcccacca ggtgcaggca 120
gaaaacgctg gaacagcgtg tacagtttgt cttaacaaaa agtgagggcg ctgaggtcga 180
gcagggtggt gtgacttgtt atagccttta gagctgcgaa agcgcgtatg gatttggctc 240
atcaggccag attgagggtc tgtggacaca tgtcatgtta gtgtacttca atcgccccct 300
ggatatagcc ccgacaatag gccgtggcct catttttttg ccttccgcac atttccattg 360
ctcggtaccc acaccttgct tctcctgcac ttgccaacct taatactggt ttacattgac 420
caacatctta caagcggggg gcttgtctag ggtatatata aacagtggct ctcccaatcg 480
gttgccagtc tcttttttcc tttctttccc cacagattcg aaatctaaac tacacatcac 540
accatggttt gactgatgag tccgtgagga cgaaacgagt aagctcgtct caaacgatta 600
cccaccctcg ttttagagct agaaatagca agttaaaata aggctagtcc gttatcaact 660
tgaaaaagtg gcaccgagtc ggtgcttttt ttttttgttt tttatgtct 709
<210> 26
<211> 10
<212> DNA
<213> 未知
<220>
<223> 聚-A
<400> 26
aaaaaaaaaa 10
<210> 27
<211> 10
<212> DNA
<213> 未知
<220>
<223> 聚-T
<400> 27
tttttttttt 10
<210> 28
<211> 100
<212> DNA
<213> 人工序列
<220>
<223> CAN1移码供体
<400> 28
ccttaacgac cctgccgtct ccatccatcc gaccacaatg gaaaagacat gactgaggcc 60
cacatccaca tcaaccacac ggcccactcg gatgactcag 100
<210> 29
<211> 100
<212> DNA
<213> 人工序列
<220>
<223> CAN1移码供体互补序列
<400> 29
ctgagtcatc cgagtgggcc gtgtggttga tgtggatgtg ggcctcagtc atgtcttttc 60
cattgtggtc ggatggatgg agacggcagg gtcgttaagg 100
<210> 30
<211> 106
<212> DNA
<213> 人工序列
<220>
<223> CAN1点突变供体
<400> 30
ccatccatcc gaccacaatg gaaaagacat tttcaaacga ttacccaccc tgatgaactg 60
aggcccacat ccacatcaac cacacggccc actcggatga ctcaga 106
<210> 31
<211> 106
<212> DNA
<213> 人工序列
<220>
<223> CAN1点突变供体互补序列
<400> 31
tctgagtcat ccgagtgggc cgtgtggttg atgtggatgt gggcctcagt tcatcagggt 60
gggtaatcgt ttgaaaatgt cttttccatt gtggtcggat ggatgg 106
<210> 32
<211> 655
<212> DNA
<213> 人工序列
<220>
<223> CAN1上游供体臂
<400> 32
gggaagcctt gctacgttag gagaagacgc acggcgatga tacgggtacc cctcatgaca 60
tcaatatccg ctgcccctct tgccagcaag gcgtcagcag gtgctttttt cgctattttc 120
accagaccac agcctttttc cttgtgtctc atcttggatt ccttcaaagg caactcaccg 180
cacctccgag tcgtgtgaac aatgtaataa taggctattg acttttttcc cacctgttta 240
gcgccaaacc caaagcgctt ttcgccccca ctgcagcccg atggaaggca catatggcaa 300
gggaaaagtc ttcaggtaat acatgcctgc tgcaactata tgtactctga ctcattccct 360
cagacgtggg tcatagacag ctgttttaaa ccgggcaaat caatctctgt cgcacaggta 420
tttctgccct tcaaaaccag gttgccacat cagattccat caaagttttt cagactaact 480
tcaatcttaa acggcatctc acaacaagcg aattggacgg aaaaaaagcg tctatcatta 540
ccggcaccta tccacactaa gacagtacta aaggacgacg ctccccacga aacgacgttt 600
cgaccttaac gaccctgccg tctccatcca tccgaccact cccgacgctc tctcc 655
<210> 33
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 用于扩增CAN1上游供体臂的正向PCR引物
<400> 33
gggaagcttg ctacgttagg agaagacgc 29
<210> 34
<211> 37
<212> DNA
<213> 人工序列
<220>
<223> 用于扩增CAN1上游供体臂的反向PCR引物
<400> 34
ggagagagcg tcgggagtgg tcggatggat ggagacg 37
<210> 35
<211> 658
<212> DNA
<213> 人工序列
<220>
<223> CAN1下游供体臂
<400> 35
cgtctccatc catccgacca ctcccgacgc tctctcctgg agcaaaccac tcttaccaag 60
catatagcat atataataac gtattgaatt tattaactga ttgaattgag agtaaagcca 120
gtagcgttgt acggctgtag ctttttagaa aagtggcaga tgagcgatgg tggatatgaa 180
agtaccttta cggcatgtag cgacacaaga tcgcttccaa gaactcgaca ttcaagccca 240
gctcgtacaa gaaaatgaac tagccaatca tatgaactag cacattgaag tcaccgcatc 300
atctctgttg gaaacgacgc gcatgtactc gtgcgtagta aatccgtatc tgtacactcg 360
aaagattaca gtatgtagta gtagcatgac taacgatgta acgtccaaat aacgctctgt 420
gcctactcct gtagatgcat tagaccacct gctaacgtct acacgttatg tccgttagct 480
ccaagattgc acttttccct caaagactct gctgggttac gtcatggtct ctttcgggtc 540
tctggtccgt tctctgcccg cccatatccg cccaggctgc tacgatacag gataagctca 600
taagcttaga ttatttttcc ggaatgacat cacgatgcag tggtggaagg atgtatgg 658
<210> 36
<211> 37
<212> DNA
<213> 人工序列
<220>
<223> 用于扩增CAN1下游供体臂的正向PCR引物
<400> 36
cgtctccatc catccgacca ctcccgacgc tctctcc 37
<210> 37
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 用于扩增CAN1下游供体臂的反向PCR引物
<400> 37
ccatacatcc ttccaccact gc 22
<210> 38
<211> 1276
<212> DNA
<213> 人工序列
<220>
<223> CAN1大缺失供体
<400> 38
gggaagcctt gctacgttag gagaagacgc acggcgatga tacgggtacc cctcatgaca 60
tcaatatccg ctgcccctct tgccagcaag gcgtcagcag gtgctttttt cgctattttc 120
accagaccac agcctttttc cttgtgtctc atcttggatt ccttcaaagg caactcaccg 180
cacctccgag tcgtgtgaac aatgtaataa taggctattg acttttttcc cacctgttta 240
gcgccaaacc caaagcgctt ttcgccccca ctgcagcccg atggaaggca catatggcaa 300
gggaaaagtc ttcaggtaat acatgcctgc tgcaactata tgtactctga ctcattccct 360
cagacgtggg tcatagacag ctgttttaaa ccgggcaaat caatctctgt cgcacaggta 420
tttctgccct tcaaaaccag gttgccacat cagattccat caaagttttt cagactaact 480
tcaatcttaa acggcatctc acaacaagcg aattggacgg aaaaaaagcg tctatcatta 540
ccggcaccta tccacactaa gacagtacta aaggacgacg ctccccacga aacgacgttt 600
cgaccttaac gaccctgccg tctccatcca tccgaccact cccgacgctc tctcctggag 660
caaaccactc ttaccaagca tatagcatat ataataacgt attgaattta ttaactgatt 720
gaattgagag taaagccagt agcgttgtac ggctgtagct ttttagaaaa gtggcagatg 780
agcgatggtg gatatgaaag tacctttacg gcatgtagcg acacaagatc gcttccaaga 840
actcgacatt caagcccagc tcgtacaaga aaatgaacta gccaatcata tgaactagca 900
cattgaagtc accgcatcat ctctgttgga aacgacgcgc atgtactcgt gcgtagtaaa 960
tccgtatctg tacactcgaa agattacagt atgtagtagt agcatgacta acgatgtaac 1020
gtccaaataa cgctctgtgc ctactcctgt agatgcatta gaccacctgc taacgtctac 1080
acgttatgtc cgttagctcc aagattgcac ttttccctca aagactctgc tgggttacgt 1140
catggtctct ttcgggtctc tggtccgttc tctgcccgcc catatccgcc caggctgcta 1200
cgatacagga taagctcata agcttagatt atttttccgg aatgacatca cgatgcagtg 1260
gtggaaggat gtatgg 1276
<210> 39
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> RG/RGR正向PCR引物
<400> 39
ggggttaatt aacgagtcag acagatactc g 31
<210> 40
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> RG/RGR反向PCR引物
<400> 40
ggggatcgat ccctgtgttg aatccatcc 29
<210> 41
<211> 11568
<212> DNA
<213> 人工序列
<220>
<223> pRF84质粒
<400> 41
cgatccctgt gttgaatcca tccatcttgg attgccaatt gtgcacacag aaccgggcac 60
tcacttcccc atccacactt gcggccgccc ccaagcttgt cccattcgcc atgccgaagc 120
atgttgccca gccggcgcca gcgaggaggc tgggaccatg ccggccaaaa gcaccaccga 180
ctcggtgcca ctttttcaag ttgataacgg actagcctta ttttaacttg ctatttctag 240
ctctaaaacg agggtgggta atcgtttgag acgagcttac tcgtttcgtc ctcacggact 300
catcagtcaa accatggtgt gatgtgtagt ttagatttcg aatctgtggg gaaagaaagg 360
aaaaaagaga ctggcaaccg attgggagag ccactgttta tatataccct agacaagccc 420
cccgcttgta agatgttggt caatgtaaac cagtattaag gttggcaagt gcaggagaag 480
caaggtgtgg gtaccgagca atggaaatgt gcggaaggca aaaaaatgag gccacggcct 540
attgtcgggg ctatatccag ggggcgattg aagtacacta acatgacatg tgtccacaga 600
ccctcaatct ggcctgatga gccaaatcca tacgcgcttt cgcagctcta aaggctataa 660
caagtcacac caccctgctc gacctcagcg ccctcacttt ttgttaagac aaactgtaca 720
cgctgttcca gcgttttctg cctgcacctg gtgggacatt tggtgcaacc taaagtgctc 780
ggaacctctg tggtgtccag atcagcgcag cagttccgag gtagttttga ggcccttaga 840
tgatggttta aacgtcgacg agtatctgtc tgactcgtta attaagtcat acacaagtca 900
gctttcttcg agcctcatat aagtataagt agttcaacgt attagcactg tacccagcat 960
ctccgtatcg agaaacacaa caacatgccc cattggacag atcatgcgga tacacaggtt 1020
gtgcagtatc atacatactc gatcagacag gtcgtctgac catcatacaa gctgaacaag 1080
cgctccatac ttgcacgctc tctatataca cagttaaatt acatatccat agtctaacct 1140
ctaacagtta atcttctggt aagcctccca gccagccttc tggtatcgct tggcctcctc 1200
aataggatct cggttctggc cgtacagacc tcggccgaca attatgatat ccgttccggt 1260
agacatgaca tcctcaacag ttcggtactg ctgtccgaga gcgtctccct tgtcgtcaag 1320
acccaccccg ggggtcagaa taagccagtc ctcagagtcg cccttaggtc ggttctgggc 1380
aatgaagcca accacaaact cggggtcgga tcgggcaagc tcaatggtct gcttggagta 1440
ctcgccagtg gccagagagc ccttgcaaga cagctcggcc agcatgagca gacctctggc 1500
cagcttctcg ttgggagagg ggactaggaa ctccttgtac tgggagttct cgtagtcaga 1560
gacgtcctcc ttcttctgtt cagagacagt ttcctcggca ccagctcgca ggccagcaat 1620
gattccggtt ccgggtacac cgtgggcgtt ggtgatatcg gaccactcgg cgattcggtg 1680
acaccggtac tggtgcttga cagtgttgcc aatatctgcg aactttctgt cctcgaacag 1740
gaagaaaccg tgcttaagag caagttcctt gagggggagc acagtgccgg cgtaggtgaa 1800
gtcgtcaatg atgtcgatat gggttttgat catgcacaca taaggtccga ccttatcggc 1860
aagctcaatg agctccttgg tggtggtaac atccagagaa gcacacaggt tggttttctt 1920
ggctgccacg agcttgagca ctcgagcggc aaaggcggac ttgtggacgt tagctcgagc 1980
ttcgtaggag ggcattttgg tggtgaagag gagactgaaa taaatttagt ctgcagaact 2040
ttttatcgga accttatctg gggcagtgaa gtatatgtta tggtaatagt tacgagttag 2100
ttgaacttat agatagactg gactatacgg ctatcggtcc aaattagaaa gaacgtcaat 2160
ggctctctgg gcgtcgcctt tgccgacaaa aatgtgatca tgatgaaagc cagcaatgac 2220
gttgcagctg atattgttgt cggccaaccg cgccgaaaac gcagctgtca gacccacagc 2280
ctccaacgaa gaatgtatcg tcaaagtgat ccaagcacac tcatagttgg agtcgtactc 2340
caaaggcggc aatgacgagt cagacagata ctcgtcgacg tttaaaccat catctaaggg 2400
cctcaaaact acctcggaac tgctgcgctg atctggacac cacagaggtt ccgagcactt 2460
taggttgcac caaatgtccc accaggtgca ggcagaaaac gctggaacag cgtgtacagt 2520
ttgtcttaac aaaaagtgag ggcgctgagg tcgagcaggg tggtgtgact tgttatagcc 2580
tttagagctg cgaaagcgcg tatggatttg gctcatcagg ccagattgag ggtctgtgga 2640
cacatgtcat gttagtgtac ttcaatcgcc ccctggatat agccccgaca ataggccgtg 2700
gcctcatttt tttgccttcc gcacatttcc attgctcggt acccacacct tgcttctcct 2760
gcacttgcca accttaatac tggtttacat tgaccaacat cttacaagcg gggggcttgt 2820
ctagggtata tataaacagt ggctctccca atcggttgcc agtctctttt ttcctttctt 2880
tccccacaga ttcgaaatct aaactacaca tcacaccatg gacaagaaat actccatcgg 2940
cctggacatt ggaaccaact ctgtcggctg ggctgtcatc accgacgagt acaaggtgcc 3000
ctccaagaaa ttcaaggtcc tcggaaacac cgatcgacac tccatcaaga aaaacctcat 3060
tggtgccctg ttgttcgatt ctggcgagac tgccgaagct accagactca agcgaactgc 3120
tcggcgacgt tacacccgac ggaagaaccg aatctgctac ctgcaggaga tcttttccaa 3180
cgagatggcc aaggtggacg attcgttctt tcatcgactg gaggaatcct tcctcgtcga 3240
ggaagacaag aaacacgagc gtcatcccat ctttggcaac attgtggacg aggttgctta 3300
ccacgagaag tatcctacca tctaccacct gcgaaagaaa ctcgtcgatt ccaccgacaa 3360
ggcggatctc agacttatct acctcgctct ggcacacatg atcaagtttc gaggtcattt 3420
cctcatcgag ggcgatctca atcccgacaa cagcgatgtg gacaagctgt tcattcagct 3480
cgttcagacc tacaaccagc tgttcgagga aaaccccatc aatgcctccg gagtcgatgc 3540
aaaggccatc ttgtctgctc gactctcgaa gagcagacga ctggagaacc tcattgccca 3600
acttcctggc gagaaaaaga acggactgtt tggcaacctc attgcccttt ctcttggtct 3660
cacacccaac ttcaagtcca acttcgatct ggcggaggac gccaagctcc agctgtccaa 3720
ggacacctac gacgatgacc tcgacaacct gcttgcacag attggcgatc agtacgccga 3780
cctgtttctc gctgccaaga acctttcgga tgctattctc ttgtctgaca ttctgcgagt 3840
caacaccgag atcacaaagg ctcccctttc tgcctccatg atcaagcgat acgacgagca 3900
ccatcaggat ctcacactgc tcaaggctct tgtccgacag caactgcccg agaagtacaa 3960
ggagatcttt ttcgatcagt cgaagaacgg ctacgctgga tacatcgacg gcggagcctc 4020
tcaggaagag ttctacaagt tcatcaagcc aattctcgag aagatggacg gaaccgagga 4080
actgcttgtc aagctcaatc gagaggatct gcttcggaag caacgaacct tcgacaacgg 4140
cagcattcct catcagatcc acctcggtga gctgcacgcc attcttcgac gtcaggaaga 4200
cttctacccc tttctcaagg acaaccgaga gaagatcgag aagattctta cctttcgaat 4260
cccctactat gttggtcctc ttgccagagg aaactctcga tttgcttgga tgactcgaaa 4320
gtccgaggaa accatcactc cctggaactt cgaggaagtc gtggacaagg gtgcctctgc 4380
acagtccttc atcgagcgaa tgaccaactt cgacaagaat ctgcccaacg agaaggttct 4440
tcccaagcat tcgctgctct acgagtactt tacagtctac aacgaactca ccaaagtcaa 4500
gtacgttacc gagggaatgc gaaagcctgc cttcttgtct ggcgaacaga agaaagccat 4560
tgtcgatctc ctgttcaaga ccaaccgaaa ggtcactgtt aagcagctca aggaggacta 4620
cttcaagaaa atcgagtgtt tcgacagcgt cgagatttcc ggagttgagg accgattcaa 4680
cgcctctttg ggcacctatc acgatctgct caagattatc aaggacaagg attttctcga 4740
caacgaggaa aacgaggaca ttctggagga catcgtgctc actcttaccc tgttcgaaga 4800
tcgggagatg atcgaggaac gactcaagac atacgctcac ctgttcgacg acaaggtcat 4860
gaaacaactc aagcgacgta gatacaccgg ctggggaaga ctttcgcgaa agctcatcaa 4920
cggcatcaga gacaagcagt ccggaaagac cattctggac tttctcaagt ccgatggctt 4980
tgccaaccga aacttcatgc agctcattca cgacgattct cttaccttca aggaggacat 5040
ccagaaggca caagtgtccg gtcagggcga cagcttgcac gaacatattg ccaacctggc 5100
tggttcgcca gccatcaaga aaggcattct ccagactgtc aaggttgtcg acgagctggt 5160
gaaggtcatg ggacgtcaca agcccgagaa cattgtgatc gagatggcca gagagaacca 5220
gacaactcaa aagggtcaga aaaactcgcg agagcggatg aagcgaatcg aggaaggcat 5280
caaggagctg ggatcccaga ttctcaagga gcatcccgtc gagaacactc aactgcagaa 5340
cgagaagctg tatctctact atctgcagaa tggtcgagac atgtacgtgg atcaggaact 5400
ggacatcaat cgtctcagcg actacgatgt ggaccacatt gtccctcaat cctttctcaa 5460
ggacgattct atcgacaaca aggtccttac acgatccgac aagaacagag gcaagtcgga 5520
caacgttccc agcgaagagg tggtcaaaaa gatgaagaac tactggcgac agctgctcaa 5580
cgccaagctc attacccagc gaaagttcga caatcttacc aaggccgagc gaggcggtct 5640
gtccgagctc gacaaggctg gcttcatcaa gcgtcaactc gtcgagacca gacagatcac 5700
aaagcacgtc gcacagattc tcgattctcg gatgaacacc aagtacgacg agaacgacaa 5760
gctcatccga gaggtcaagg tgattactct caagtccaaa ctggtctccg atttccgaaa 5820
ggactttcag ttctacaagg tgcgagagat caacaattac caccatgccc acgatgctta 5880
cctcaacgcc gtcgttggca ctgcgctcat caagaaatac cccaagctcg aaagcgagtt 5940
cgtttacggc gattacaagg tctacgacgt tcgaaagatg attgccaagt ccgaacagga 6000
gattggcaag gctactgcca agtacttctt ttactccaac atcatgaact ttttcaagac 6060
cgagatcacc ttggccaacg gagagattcg aaagagacca cttatcgaga ccaacggcga 6120
aactggagag atcgtgtggg acaagggtcg agactttgca accgtgcgaa aggttctgtc 6180
gatgcctcag gtcaacatcg tcaagaaaac cgaggttcag actggcggat tctccaagga 6240
gtcgattctg cccaagcgaa actccgacaa gctcatcgct cgaaagaaag actgggatcc 6300
caagaaatac ggtggcttcg attctcctac cgtcgcctat tccgtgcttg tcgttgcgaa 6360
ggtcgagaag ggcaagtcca aaaagctcaa gtccgtcaag gagctgctcg gaattaccat 6420
catggagcga tcgagcttcg agaagaatcc catcgacttc ttggaagcca agggttacaa 6480
ggaggtcaag aaagacctca ttatcaagct gcccaagtac tctctgttcg aactggagaa 6540
cggtcgaaag cgtatgctcg cctccgctgg cgagctgcag aagggaaacg agcttgcctt 6600
gccttcgaag tacgtcaact ttctctatct ggcttctcac tacgagaagc tcaagggttc 6660
tcccgaggac aacgaacaga agcaactctt cgttgagcag cacaaacatt acctcgacga 6720
gattatcgag cagatttccg agttttcgaa gcgagtcatc ctggctgatg ccaacttgga 6780
caaggtgctc tctgcctaca acaagcatcg ggacaaaccc attcgagaac aggcggagaa 6840
catcattcac ctgtttactc ttaccaacct gggtgctcct gcagctttca agtacttcga 6900
taccactatc gaccgaaagc ggtacacatc caccaaggag gttctcgatg ccaccctgat 6960
tcaccagtcc atcactggcc tgtacgagac ccgaatcgac ctgtctcagc ttggtggcga 7020
ctccagagcc gatcccaaga aaaagcgaaa ggtctaagcg gccgcaagtg tggatgggga 7080
agtgagtgcc cggttctgtg tgcacaattg gcaatccaag atggatggat tcaacacagg 7140
gatatagcga gctacgtggt ggtgcgagga tatagcaacg gatatttatg tttgacactt 7200
gagaatgtac gatacaagca ctgtccaagt acaatactaa acatactgta catactcata 7260
ctcgtacccg ggcaacggtt tcacttgagt gcagtggcta gtgctcttac tcgtacagtg 7320
tgcaatactg cgtatcatag tctttgatgt atatcgtatt cattcatgtt agttgcgtac 7380
gagccggaag cataaagtgt aaagcctggg gtgcctaatg agtgagctaa ctcacattaa 7440
ttgcgttgcg ctcactgccc gctttccagt cgggaaacct gtcgtgccag ctgcattaat 7500
gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg gcgctcttcc gcttcctcgc 7560
tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg 7620
cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg tgagcaaaag 7680
gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc 7740
gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga aacccgacag 7800
gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct cctgttccga 7860
ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc 7920
atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg 7980
tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat cgtcttgagt 8040
ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac aggattagca 8100
gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac tacggctaca 8160
ctagaaggac agtatttggt atctgcgctc tgctgaagcc agttaccttc ggaaaaagag 8220
ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt tttgtttgca 8280
agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg 8340
ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg agattatcaa 8400
aaaggatctt cacctagatc cttttaaatt aaaaatgaag ttttaaatca atctaaagta 8460
tatatgagta aacttggtct gacagttacc aatgcttaat cagtgaggca cctatctcag 8520
cgatctgtct atttcgttca tccatagttg cctgactccc cgtcgtgtag ataactacga 8580
tacgggaggg cttaccatct ggccccagtg ctgcaatgat accgcgagac ccacgctcac 8640
cggctccaga tttatcagca ataaaccagc cagccggaag ggccgagcgc agaagtggtc 8700
ctgcaacttt atccgcctcc atccagtcta ttaattgttg ccgggaagct agagtaagta 8760
gttcgccagt taatagtttg cgcaacgttg ttgccattgc tacaggcatc gtggtgtcac 8820
gctcgtcgtt tggtatggct tcattcagct ccggttccca acgatcaagg cgagttacat 8880
gatcccccat gttgtgcaaa aaagcggtta gctccttcgg tcctccgatc gttgtcagaa 8940
gtaagttggc cgcagtgtta tcactcatgg ttatggcagc actgcataat tctcttactg 9000
tcatgccatc cgtaagatgc ttttctgtga ctggtgagta ctcaaccaag tcattctgag 9060
aatagtgtat gcggcgaccg agttgctctt gcccggcgtc aatacgggat aataccgcgc 9120
cacatagcag aactttaaaa gtgctcatca ttggaaaacg ttcttcgggg cgaaaactct 9180
caaggatctt accgctgttg agatccagtt cgatgtaacc cactcgtgca cccaactgat 9240
cttcagcatc ttttactttc accagcgttt ctgggtgagc aaaaacagga aggcaaaatg 9300
ccgcaaaaaa gggaataagg gcgacacgga aatgttgaat actcatactc ttcctttttc 9360
aatattattg aagcatttat cagggttatt gtctcatgag cggatacata tttgaatgta 9420
tttagaaaaa taaacaaata ggggttccgc gcacatttcc ccgaaaagtg ccacctgacg 9480
cgccctgtag cggcgcatta agcgcggcgg gtgtggtggt tacgcgcagc gtgaccgcta 9540
cacttgccag cgccctagcg cccgctcctt tcgctttctt cccttccttt ctcgccacgt 9600
tcgccggctt tccccgtcaa gctctaaatc gggggctccc tttagggttc cgatttagtg 9660
ctttacggca cctcgacccc aaaaaacttg attagggtga tggttcacgt agtgggccat 9720
cgccctgata gacggttttt cgccctttga cgttggagtc cacgttcttt aatagtggac 9780
tcttgttcca aactggaaca acactcaacc ctatctcggt ctattctttt gatttataag 9840
ggattttgcc gatttcggcc tattggttaa aaaatgagct gatttaacaa aaatttaacg 9900
cgaattttaa caaaatatta acgcttacaa tttccattcg ccattcaggc tgcgcaactg 9960
ttgggaaggg cgatcggtgc gggcctcttc gctattacgc cagctggcga aagggggatg 10020
tgctgcaagg cgattaagtt gggtaacgcc agggttttcc cagtcacgac gttgtaaaac 10080
gacggccagt gaattgtaat acgactcact atagggcgaa ttgggtaccg ggccccccct 10140
cgaggtcgat ggtgtcgata agcttgatat cgaattcatg tcacacaaac cgatcttcgc 10200
ctcaaggaaa cctaattcta catccgagag actgccgaga tccagtctac actgattaat 10260
tttcgggcca ataatttaaa aaaatcgtgt tatataatat tatatgtatt atatatatac 10320
atcatgatga tactgacagt catgtcccat tgctaaatag acagactcca tctgccgcct 10380
ccaactgatg ttctcaatat ttaaggggtc atctcgcatt gtttaataat aaacagactc 10440
catctaccgc ctccaaatga tgttctcaaa atatattgta tgaacttatt tttattactt 10500
agtattatta gacaacttac ttgctttatg aaaaacactt cctatttagg aaacaattta 10560
taatggcagt tcgttcattt aacaatttat gtagaataaa tgttataaat gcgtatggga 10620
aatcttaaat atggatagca taaatgatat ctgcattgcc taattcgaaa tcaacagcaa 10680
cgaaaaaaat cccttgtaca acataaatag tcatcgagaa atatcaacta tcaaagaaca 10740
gctattcaca cgttactatt gagattatta ttggacgaga atcacacact caactgtctt 10800
tctctcttct agaaatacag gtacaagtat gtactattct cattgttcat acttctagtc 10860
atttcatccc acatattcct tggatttctc tccaatgaat gacattctat cttgcaaatt 10920
caacaattat aataagatat accaaagtag cggtatagtg gcaatcaaaa agcttctctg 10980
gtgtgcttct cgtatttatt tttattctaa tgatccatta aaggtatata tttatttctt 11040
gttatataat ccttttgttt attacatggg ctggatacat aaaggtattt tgatttaatt 11100
ttttgcttaa attcaatccc ccctcgttca gtgtcaactg taatggtagg aaattaccat 11160
acttttgaag aagcaaaaaa aatgaaagaa aaaaaaaatc gtatttccag gttagacgtt 11220
ccgcagaatc tagaatgcgg tatgcggtac attgttcttc gaacgtaaaa gttgcgctcc 11280
ctgagatatt gtacattttt gcttttacaa gtacaagtac atcgtacaac tatgtactac 11340
tgttgatgca tccacaacag tttgttttgt ttttttttgt tttttttttt tctaatgatt 11400
cattaccgct atgtatacct acttgtactt gtagtaagcc gggttattgg cgttcaatta 11460
atcatagact tatgaatctg cacggtgtgc gctgcgagtt acttttagct tatgcatgct 11520
acttgggtgt aatattggga tctgttcgga aatcaacgga tgctcaat 11568
<210> 42
<211> 11507
<212> DNA
<213> 人工序列
<220>
<223> pRF85质粒
<400> 42
cgatccctgt gttgaatcca tccatcttgg attgccaatt gtgcacacag aaccgggcac 60
tcacttcccc atccacactt gcggccgcag acataaaaaa caaaaaaaaa aagcaccgac 120
tcggtgccac tttttcaagt tgataacgga ctagccttat tttaacttgc tatttctagc 180
tctaaaacga gggtgggtaa tcgtttgaga cgagcttact cgtttcgtcc tcacggactc 240
atcagtcaaa ccatggtgtg atgtgtagtt tagatttcga atctgtgggg aaagaaagga 300
aaaaagagac tggcaaccga ttgggagagc cactgtttat atatacccta gacaagcccc 360
ccgcttgtaa gatgttggtc aatgtaaacc agtattaagg ttggcaagtg caggagaagc 420
aaggtgtggg taccgagcaa tggaaatgtg cggaaggcaa aaaaatgagg ccacggccta 480
ttgtcggggc tatatccagg gggcgattga agtacactaa catgacatgt gtccacagac 540
cctcaatctg gcctgatgag ccaaatccat acgcgctttc gcagctctaa aggctataac 600
aagtcacacc accctgctcg acctcagcgc cctcactttt tgttaagaca aactgtacac 660
gctgttccag cgttttctgc ctgcacctgg tgggacattt ggtgcaacct aaagtgctcg 720
gaacctctgt ggtgtccaga tcagcgcagc agttccgagg tagttttgag gcccttagat 780
gatggtttaa acgtcgacga gtatctgtct gactcgttaa ttaagtcata cacaagtcag 840
ctttcttcga gcctcatata agtataagta gttcaacgta ttagcactgt acccagcatc 900
tccgtatcga gaaacacaac aacatgcccc attggacaga tcatgcggat acacaggttg 960
tgcagtatca tacatactcg atcagacagg tcgtctgacc atcatacaag ctgaacaagc 1020
gctccatact tgcacgctct ctatatacac agttaaatta catatccata gtctaacctc 1080
taacagttaa tcttctggta agcctcccag ccagccttct ggtatcgctt ggcctcctca 1140
ataggatctc ggttctggcc gtacagacct cggccgacaa ttatgatatc cgttccggta 1200
gacatgacat cctcaacagt tcggtactgc tgtccgagag cgtctccctt gtcgtcaaga 1260
cccaccccgg gggtcagaat aagccagtcc tcagagtcgc ccttaggtcg gttctgggca 1320
atgaagccaa ccacaaactc ggggtcggat cgggcaagct caatggtctg cttggagtac 1380
tcgccagtgg ccagagagcc cttgcaagac agctcggcca gcatgagcag acctctggcc 1440
agcttctcgt tgggagaggg gactaggaac tccttgtact gggagttctc gtagtcagag 1500
acgtcctcct tcttctgttc agagacagtt tcctcggcac cagctcgcag gccagcaatg 1560
attccggttc cgggtacacc gtgggcgttg gtgatatcgg accactcggc gattcggtga 1620
caccggtact ggtgcttgac agtgttgcca atatctgcga actttctgtc ctcgaacagg 1680
aagaaaccgt gcttaagagc aagttccttg agggggagca cagtgccggc gtaggtgaag 1740
tcgtcaatga tgtcgatatg ggttttgatc atgcacacat aaggtccgac cttatcggca 1800
agctcaatga gctccttggt ggtggtaaca tccagagaag cacacaggtt ggttttcttg 1860
gctgccacga gcttgagcac tcgagcggca aaggcggact tgtggacgtt agctcgagct 1920
tcgtaggagg gcattttggt ggtgaagagg agactgaaat aaatttagtc tgcagaactt 1980
tttatcggaa ccttatctgg ggcagtgaag tatatgttat ggtaatagtt acgagttagt 2040
tgaacttata gatagactgg actatacggc tatcggtcca aattagaaag aacgtcaatg 2100
gctctctggg cgtcgccttt gccgacaaaa atgtgatcat gatgaaagcc agcaatgacg 2160
ttgcagctga tattgttgtc ggccaaccgc gccgaaaacg cagctgtcag acccacagcc 2220
tccaacgaag aatgtatcgt caaagtgatc caagcacact catagttgga gtcgtactcc 2280
aaaggcggca atgacgagtc agacagatac tcgtcgacgt ttaaaccatc atctaagggc 2340
ctcaaaacta cctcggaact gctgcgctga tctggacacc acagaggttc cgagcacttt 2400
aggttgcacc aaatgtccca ccaggtgcag gcagaaaacg ctggaacagc gtgtacagtt 2460
tgtcttaaca aaaagtgagg gcgctgaggt cgagcagggt ggtgtgactt gttatagcct 2520
ttagagctgc gaaagcgcgt atggatttgg ctcatcaggc cagattgagg gtctgtggac 2580
acatgtcatg ttagtgtact tcaatcgccc cctggatata gccccgacaa taggccgtgg 2640
cctcattttt ttgccttccg cacatttcca ttgctcggta cccacacctt gcttctcctg 2700
cacttgccaa ccttaatact ggtttacatt gaccaacatc ttacaagcgg ggggcttgtc 2760
tagggtatat ataaacagtg gctctcccaa tcggttgcca gtctcttttt tcctttcttt 2820
ccccacagat tcgaaatcta aactacacat cacaccatgg acaagaaata ctccatcggc 2880
ctggacattg gaaccaactc tgtcggctgg gctgtcatca ccgacgagta caaggtgccc 2940
tccaagaaat tcaaggtcct cggaaacacc gatcgacact ccatcaagaa aaacctcatt 3000
ggtgccctgt tgttcgattc tggcgagact gccgaagcta ccagactcaa gcgaactgct 3060
cggcgacgtt acacccgacg gaagaaccga atctgctacc tgcaggagat cttttccaac 3120
gagatggcca aggtggacga ttcgttcttt catcgactgg aggaatcctt cctcgtcgag 3180
gaagacaaga aacacgagcg tcatcccatc tttggcaaca ttgtggacga ggttgcttac 3240
cacgagaagt atcctaccat ctaccacctg cgaaagaaac tcgtcgattc caccgacaag 3300
gcggatctca gacttatcta cctcgctctg gcacacatga tcaagtttcg aggtcatttc 3360
ctcatcgagg gcgatctcaa tcccgacaac agcgatgtgg acaagctgtt cattcagctc 3420
gttcagacct acaaccagct gttcgaggaa aaccccatca atgcctccgg agtcgatgca 3480
aaggccatct tgtctgctcg actctcgaag agcagacgac tggagaacct cattgcccaa 3540
cttcctggcg agaaaaagaa cggactgttt ggcaacctca ttgccctttc tcttggtctc 3600
acacccaact tcaagtccaa cttcgatctg gcggaggacg ccaagctcca gctgtccaag 3660
gacacctacg acgatgacct cgacaacctg cttgcacaga ttggcgatca gtacgccgac 3720
ctgtttctcg ctgccaagaa cctttcggat gctattctct tgtctgacat tctgcgagtc 3780
aacaccgaga tcacaaaggc tcccctttct gcctccatga tcaagcgata cgacgagcac 3840
catcaggatc tcacactgct caaggctctt gtccgacagc aactgcccga gaagtacaag 3900
gagatctttt tcgatcagtc gaagaacggc tacgctggat acatcgacgg cggagcctct 3960
caggaagagt tctacaagtt catcaagcca attctcgaga agatggacgg aaccgaggaa 4020
ctgcttgtca agctcaatcg agaggatctg cttcggaagc aacgaacctt cgacaacggc 4080
agcattcctc atcagatcca cctcggtgag ctgcacgcca ttcttcgacg tcaggaagac 4140
ttctacccct ttctcaagga caaccgagag aagatcgaga agattcttac ctttcgaatc 4200
ccctactatg ttggtcctct tgccagagga aactctcgat ttgcttggat gactcgaaag 4260
tccgaggaaa ccatcactcc ctggaacttc gaggaagtcg tggacaaggg tgcctctgca 4320
cagtccttca tcgagcgaat gaccaacttc gacaagaatc tgcccaacga gaaggttctt 4380
cccaagcatt cgctgctcta cgagtacttt acagtctaca acgaactcac caaagtcaag 4440
tacgttaccg agggaatgcg aaagcctgcc ttcttgtctg gcgaacagaa gaaagccatt 4500
gtcgatctcc tgttcaagac caaccgaaag gtcactgtta agcagctcaa ggaggactac 4560
ttcaagaaaa tcgagtgttt cgacagcgtc gagatttccg gagttgagga ccgattcaac 4620
gcctctttgg gcacctatca cgatctgctc aagattatca aggacaagga ttttctcgac 4680
aacgaggaaa acgaggacat tctggaggac atcgtgctca ctcttaccct gttcgaagat 4740
cgggagatga tcgaggaacg actcaagaca tacgctcacc tgttcgacga caaggtcatg 4800
aaacaactca agcgacgtag atacaccggc tggggaagac tttcgcgaaa gctcatcaac 4860
ggcatcagag acaagcagtc cggaaagacc attctggact ttctcaagtc cgatggcttt 4920
gccaaccgaa acttcatgca gctcattcac gacgattctc ttaccttcaa ggaggacatc 4980
cagaaggcac aagtgtccgg tcagggcgac agcttgcacg aacatattgc caacctggct 5040
ggttcgccag ccatcaagaa aggcattctc cagactgtca aggttgtcga cgagctggtg 5100
aaggtcatgg gacgtcacaa gcccgagaac attgtgatcg agatggccag agagaaccag 5160
acaactcaaa agggtcagaa aaactcgcga gagcggatga agcgaatcga ggaaggcatc 5220
aaggagctgg gatcccagat tctcaaggag catcccgtcg agaacactca actgcagaac 5280
gagaagctgt atctctacta tctgcagaat ggtcgagaca tgtacgtgga tcaggaactg 5340
gacatcaatc gtctcagcga ctacgatgtg gaccacattg tccctcaatc ctttctcaag 5400
gacgattcta tcgacaacaa ggtccttaca cgatccgaca agaacagagg caagtcggac 5460
aacgttccca gcgaagaggt ggtcaaaaag atgaagaact actggcgaca gctgctcaac 5520
gccaagctca ttacccagcg aaagttcgac aatcttacca aggccgagcg aggcggtctg 5580
tccgagctcg acaaggctgg cttcatcaag cgtcaactcg tcgagaccag acagatcaca 5640
aagcacgtcg cacagattct cgattctcgg atgaacacca agtacgacga gaacgacaag 5700
ctcatccgag aggtcaaggt gattactctc aagtccaaac tggtctccga tttccgaaag 5760
gactttcagt tctacaaggt gcgagagatc aacaattacc accatgccca cgatgcttac 5820
ctcaacgccg tcgttggcac tgcgctcatc aagaaatacc ccaagctcga aagcgagttc 5880
gtttacggcg attacaaggt ctacgacgtt cgaaagatga ttgccaagtc cgaacaggag 5940
attggcaagg ctactgccaa gtacttcttt tactccaaca tcatgaactt tttcaagacc 6000
gagatcacct tggccaacgg agagattcga aagagaccac ttatcgagac caacggcgaa 6060
actggagaga tcgtgtggga caagggtcga gactttgcaa ccgtgcgaaa ggttctgtcg 6120
atgcctcagg tcaacatcgt caagaaaacc gaggttcaga ctggcggatt ctccaaggag 6180
tcgattctgc ccaagcgaaa ctccgacaag ctcatcgctc gaaagaaaga ctgggatccc 6240
aagaaatacg gtggcttcga ttctcctacc gtcgcctatt ccgtgcttgt cgttgcgaag 6300
gtcgagaagg gcaagtccaa aaagctcaag tccgtcaagg agctgctcgg aattaccatc 6360
atggagcgat cgagcttcga gaagaatccc atcgacttct tggaagccaa gggttacaag 6420
gaggtcaaga aagacctcat tatcaagctg cccaagtact ctctgttcga actggagaac 6480
ggtcgaaagc gtatgctcgc ctccgctggc gagctgcaga agggaaacga gcttgccttg 6540
ccttcgaagt acgtcaactt tctctatctg gcttctcact acgagaagct caagggttct 6600
cccgaggaca acgaacagaa gcaactcttc gttgagcagc acaaacatta cctcgacgag 6660
attatcgagc agatttccga gttttcgaag cgagtcatcc tggctgatgc caacttggac 6720
aaggtgctct ctgcctacaa caagcatcgg gacaaaccca ttcgagaaca ggcggagaac 6780
atcattcacc tgtttactct taccaacctg ggtgctcctg cagctttcaa gtacttcgat 6840
accactatcg accgaaagcg gtacacatcc accaaggagg ttctcgatgc caccctgatt 6900
caccagtcca tcactggcct gtacgagacc cgaatcgacc tgtctcagct tggtggcgac 6960
tccagagccg atcccaagaa aaagcgaaag gtctaagcgg ccgcaagtgt ggatggggaa 7020
gtgagtgccc ggttctgtgt gcacaattgg caatccaaga tggatggatt caacacaggg 7080
atatagcgag ctacgtggtg gtgcgaggat atagcaacgg atatttatgt ttgacacttg 7140
agaatgtacg atacaagcac tgtccaagta caatactaaa catactgtac atactcatac 7200
tcgtacccgg gcaacggttt cacttgagtg cagtggctag tgctcttact cgtacagtgt 7260
gcaatactgc gtatcatagt ctttgatgta tatcgtattc attcatgtta gttgcgtacg 7320
agccggaagc ataaagtgta aagcctgggg tgcctaatga gtgagctaac tcacattaat 7380
tgcgttgcgc tcactgcccg ctttccagtc gggaaacctg tcgtgccagc tgcattaatg 7440
aatcggccaa cgcgcgggga gaggcggttt gcgtattggg cgctcttccg cttcctcgct 7500
cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc 7560
ggtaatacgg ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg 7620
ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg 7680
cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg 7740
actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac 7800
cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca 7860
tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt 7920
gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc 7980
caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag 8040
agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac 8100
tagaaggaca gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt 8160
tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa 8220
gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg 8280
gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa 8340
aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat 8400
atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc 8460
gatctgtcta tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat 8520
acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc 8580
ggctccagat ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc 8640
tgcaacttta tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag 8700
ttcgccagtt aatagtttgc gcaacgttgt tgccattgct acaggcatcg tggtgtcacg 8760
ctcgtcgttt ggtatggctt cattcagctc cggttcccaa cgatcaaggc gagttacatg 8820
atcccccatg ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg ttgtcagaag 8880
taagttggcc gcagtgttat cactcatggt tatggcagca ctgcataatt ctcttactgt 8940
catgccatcc gtaagatgct tttctgtgac tggtgagtac tcaaccaagt cattctgaga 9000
atagtgtatg cggcgaccga gttgctcttg cccggcgtca atacgggata ataccgcgcc 9060
acatagcaga actttaaaag tgctcatcat tggaaaacgt tcttcggggc gaaaactctc 9120
aaggatctta ccgctgttga gatccagttc gatgtaaccc actcgtgcac ccaactgatc 9180
ttcagcatct tttactttca ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc 9240
cgcaaaaaag ggaataaggg cgacacggaa atgttgaata ctcatactct tcctttttca 9300
atattattga agcatttatc agggttattg tctcatgagc ggatacatat ttgaatgtat 9360
ttagaaaaat aaacaaatag gggttccgcg cacatttccc cgaaaagtgc cacctgacgc 9420
gccctgtagc ggcgcattaa gcgcggcggg tgtggtggtt acgcgcagcg tgaccgctac 9480
acttgccagc gccctagcgc ccgctccttt cgctttcttc ccttcctttc tcgccacgtt 9540
cgccggcttt ccccgtcaag ctctaaatcg ggggctccct ttagggttcc gatttagtgc 9600
tttacggcac ctcgacccca aaaaacttga ttagggtgat ggttcacgta gtgggccatc 9660
gccctgatag acggtttttc gccctttgac gttggagtcc acgttcttta atagtggact 9720
cttgttccaa actggaacaa cactcaaccc tatctcggtc tattcttttg atttataagg 9780
gattttgccg atttcggcct attggttaaa aaatgagctg atttaacaaa aatttaacgc 9840
gaattttaac aaaatattaa cgcttacaat ttccattcgc cattcaggct gcgcaactgt 9900
tgggaagggc gatcggtgcg ggcctcttcg ctattacgcc agctggcgaa agggggatgt 9960
gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg 10020
acggccagtg aattgtaata cgactcacta tagggcgaat tgggtaccgg gccccccctc 10080
gaggtcgatg gtgtcgataa gcttgatatc gaattcatgt cacacaaacc gatcttcgcc 10140
tcaaggaaac ctaattctac atccgagaga ctgccgagat ccagtctaca ctgattaatt 10200
ttcgggccaa taatttaaaa aaatcgtgtt atataatatt atatgtatta tatatataca 10260
tcatgatgat actgacagtc atgtcccatt gctaaataga cagactccat ctgccgcctc 10320
caactgatgt tctcaatatt taaggggtca tctcgcattg tttaataata aacagactcc 10380
atctaccgcc tccaaatgat gttctcaaaa tatattgtat gaacttattt ttattactta 10440
gtattattag acaacttact tgctttatga aaaacacttc ctatttagga aacaatttat 10500
aatggcagtt cgttcattta acaatttatg tagaataaat gttataaatg cgtatgggaa 10560
atcttaaata tggatagcat aaatgatatc tgcattgcct aattcgaaat caacagcaac 10620
gaaaaaaatc ccttgtacaa cataaatagt catcgagaaa tatcaactat caaagaacag 10680
ctattcacac gttactattg agattattat tggacgagaa tcacacactc aactgtcttt 10740
ctctcttcta gaaatacagg tacaagtatg tactattctc attgttcata cttctagtca 10800
tttcatccca catattcctt ggatttctct ccaatgaatg acattctatc ttgcaaattc 10860
aacaattata ataagatata ccaaagtagc ggtatagtgg caatcaaaaa gcttctctgg 10920
tgtgcttctc gtatttattt ttattctaat gatccattaa aggtatatat ttatttcttg 10980
ttatataatc cttttgttta ttacatgggc tggatacata aaggtatttt gatttaattt 11040
tttgcttaaa ttcaatcccc cctcgttcag tgtcaactgt aatggtagga aattaccata 11100
cttttgaaga agcaaaaaaa atgaaagaaa aaaaaaatcg tatttccagg ttagacgttc 11160
cgcagaatct agaatgcggt atgcggtaca ttgttcttcg aacgtaaaag ttgcgctccc 11220
tgagatattg tacatttttg cttttacaag tacaagtaca tcgtacaact atgtactact 11280
gttgatgcat ccacaacagt ttgttttgtt tttttttgtt tttttttttt ctaatgattc 11340
attaccgcta tgtataccta cttgtacttg tagtaagccg ggttattggc gttcaattaa 11400
tcatagactt atgaatctgc acggtgtgcg ctgcgagtta cttttagctt atgcatgcta 11460
cttgggtgta atattgggat ctgttcggaa atcaacggat gctcaat 11507
<210> 43
<211> 4
<212> RNA
<213> 未知
<220>
<223> RNA成环序列(GAAA)
<400> 43
gaaa 4
<210> 44
<211> 4
<212> RNA
<213> 未知
<220>
<223> RNA成环序列(CAAA)
<400> 44
caaa 4
<210> 45
<211> 4
<212> RNA
<213> 未知
<220>
<223> RNA成环序列(AAAG)
<400> 45
aaag 4
<210> 46
<211> 23
<212> DNA
<213> 未知
<220>
<223> Cas9靶位点:PAM序列的示例
<220>
<221> misc_feature
<222> (1)..(20)
<223> n = A、C、T或G
<220>
<221> misc_feature
<222> (21)..(21)
<223> n = A、C、T或G(在规格中表示为“X”)
<400> 46
nnnnnnnnnn nnnnnnnnnn ngg 23
<210> 47
<211> 3
<212> DNA
<213> 未知
<220>
<223> PAM序列NGG
<220>
<221> misc_feature
<222> (1)..(1)
<223> n = A、C、T或G
<400> 47
ngg 3
<210> 48
<211> 6
<212> DNA
<213> 未知
<220>
<223> PAM序列NNAGAA
<220>
<221> misc_feature
<222> (1)..(2)
<223> n = A、C、T或G
<400> 48
nnagaa 6
<210> 49
<211> 7
<212> DNA
<213> 未知
<220>
<223> PAM序列NNAGAAW
<220>
<221> misc_feature
<222> (1)..(2)
<223> n = A、C、T或G
<220>
<221> misc_feature
<222> (7)..(7)
<223> W=A或T
<400> 49
nnagaaw 7
<210> 50
<211> 5
<212> DNA
<213> 未知
<220>
<223> PAM序列NGGNG
<220>
<221> misc_feature
<222> (1)..(1)
<223> n = A、C、T或G
<220>
<221> misc_feature
<222> (4)..(4)
<223> n = A、C、T或G
<400> 50
nggng 5
<210> 51
<211> 8
<212> DNA
<213> 未知
<220>
<223> PAM序列NNNNGATT
<220>
<221> misc_feature
<222> (1)..(4)
<223> n = A、C、T或G
<400> 51
nnnngatt 8
<210> 52
<211> 6
<212> DNA
<213> 未知
<220>
<223> PAM序列NAAAAC
<220>
<221> misc_feature
<222> (1)..(1)
<223> n = A、C、T或G
<400> 52
naaaac 6
<210> 53
<211> 2
<212> DNA
<213> 未知
<220>
<223> PAM序列NG
<220>
<221> misc_feature
<222> (1)..(1)
<223> n = A、C、T或G
<400> 53
ng 2
<210> 54
<211> 22
<212> RNA
<213> 未知
<220>
<223> TracrRNA配对序列示例1
<400> 54
guuuuuguac ucucaagauu ua 22
<210> 55
<211> 15
<212> RNA
<213> 未知
<220>
<223> TracrRNA配对序列示例2
<400> 55
guuuuuguac ucuca 15
<210> 56
<211> 12
<212> RNA
<213> 未知
<220>
<223> TracrRNA配对序列示例3
<400> 56
guuuuagagc ua 12
<210> 57
<211> 13
<212> RNA
<213> 未知
<220>
<223> TracrRNA配对序列示例4
<400> 57
guuuuagagc uag 13
<210> 58
<211> 60
<212> RNA
<213> 化脓链球菌
<400> 58
uagcaaguua aaauaaggcu aguccguuau caacuugaaa aaguggcacc gagucggugc 60
<210> 59
<211> 45
<212> RNA
<213> 化脓链球菌
<400> 59
uagcaaguua aaauaaggcu aguccguuau caacuugaaa aagug 45
<210> 60
<211> 32
<212> RNA
<213> 化脓链球菌
<400> 60
uagcaaguua aaauaaggcu aguccguuau ca 32
<210> 61
<211> 85
<212> RNA
<213> 嗜热链球菌
<400> 61
uaaaucuugc agaagcuaca aagauaaggc uucaugccga aaucaacacc cugucauuuu 60
auggcagggu guuuucguua uuuaa 85
<210> 62
<211> 77
<212> RNA
<213> 嗜热链球菌
<400> 62
ugcagaagcu acaaagauaa ggcuucaugc cgaaaucaac acccugucau uuuauggcag 60
gguguuuucg uuauuua 77
<210> 63
<211> 65
<212> RNA
<213> 嗜热链球菌
<400> 63
ugcagaagcu acaaagauaa ggcuucaugc cgaaaucaac acccugucau uuuauggcag 60
ggugu 65
<210> 64
<211> 131
<212> RNA
<213> 人工序列
<220>
<223> gRNA示例1
<220>
<221> misc_feature
<222> (1)..(20)
<223> n = A、C、U或G
<400> 64
nnnnnnnnnn nnnnnnnnnn guuuuuguac ucucaagauu uagaaauaaa ucuugcagaa 60
gcuacaaaga uaaggcuuca ugccgaaauc aacacccugu cauuuuaugg caggguguuu 120
ucguuauuua a 131
<210> 65
<211> 117
<212> RNA
<213> 人工序列
<220>
<223> gRNA示例2
<220>
<221> misc_feature
<222> (1)..(20)
<223> n = A、C、U或G
<400> 65
nnnnnnnnnn nnnnnnnnnn guuuuuguac ucucagaaau gcagaagcua caaagauaag 60
gcuucaugcc gaaaucaaca cccugucauu uuauggcagg guguuuucgu uauuuaa 117
<210> 66
<211> 104
<212> RNA
<213> 人工序列
<220>
<223> gRNA示例3
<220>
<221> misc_feature
<222> (1)..(20)
<223> n = A、C、U或G
<400> 66
nnnnnnnnnn nnnnnnnnnn guuuuuguac ucucagaaau gcagaagcua caaagauaag 60
gcuucaugcc gaaaucaaca cccugucauu uuauggcagg gugu 104
<210> 67
<211> 99
<212> RNA
<213> 人工序列
<220>
<223> gRNA示例4
<220>
<221> misc_feature
<222> (1)..(20)
<223> n = A、C、U或G
<400> 67
nnnnnnnnnn nnnnnnnnnn guuuuuguac ucucagaaau agcaaguuaa aauaaggcua 60
guccguuauc aacuugaaaa aguggcaccg agucggugc 99
<210> 68
<211> 81
<212> RNA
<213> 人工序列
<220>
<223> gRNA示例5
<220>
<221> misc_feature
<222> (1)..(20)
<223> n = A、C、U或G
<400> 68
nnnnnnnnnn nnnnnnnnnn guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu g 81
<210> 69
<211> 68
<212> RNA
<213> 人工序列
<220>
<223> gRNA示例6
<220>
<221> misc_feature
<222> (1)..(20)
<223> n = A、C、U或G
<400> 69
nnnnnnnnnn nnnnnnnnnn guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuauca 68
<210> 70
<211> 100
<212> RNA
<213> 人工序列
<220>
<223> gRNA示例7
<220>
<221> misc_feature
<222> (1)..(20)
<223> n = A、C、U或G
<400> 70
nnnnnnnnnn nnnnnnnnnn guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100
<210> 71
<211> 53
<212> DNA
<213> 解脂耶氏酵母
<400> 71
caatggaaaa gacattttca aacgattacc caccctccgg gactgaggcc cac 53
<210> 72
<211> 52
<212> DNA
<213> 人工序列
<220>
<223> 序列1示于图5中
<400> 72
caatggaaaa gacattttca aacgattacc cacctccggg actgaggccc ac 52
<210> 73
<211> 51
<212> DNA
<213> 人工序列
<220>
<223> 序列2示于图5中
<400> 73
caatggaaaa gacattttca aacgattacc cactccggga ctgaggccca c 51
<210> 74
<211> 49
<212> DNA
<213> 人工序列
<220>
<223> 序列3示于图5中
<400> 74
caatggaaaa gacattttca aacgattacc caccgggact gaggcccac 49
<210> 75
<211> 46
<212> DNA
<213> 人工序列
<220>
<223> 序列4示于图5中
<400> 75
caatggaaaa gacattttca aacgattacc cgggactgag gcccac 46
<210> 76
<211> 13
<212> DNA
<213> 人工序列
<220>
<223> 序列5示于图5中
<400> 76
cactgaggcc cac 13
<210> 77
<211> 54
<212> DNA
<213> 人工序列
<220>
<223> 序列6示于图5中
<400> 77
caatggaaaa gacattttca aacgattacc caccactccg ggactgaggc ccac 54
<210> 78
<211> 48
<212> DNA
<213> 人工序列
<220>
<223> 序列7示于图5中
<400> 78
caatggaaaa gacattttca aacgattacc tccgggactg aggcccac 48
<210> 79
<211> 46
<212> DNA
<213> 人工序列
<220>
<223> 序列8示于图5中
<400> 79
caatggaaaa gacattttca aacgattacc cgggactgag gcccac 46
<210> 80
<211> 44
<212> DNA
<213> 人工序列
<220>
<223> 序列9示于图5中
<400> 80
caatggaaaa gacattttca aacgattacc cacctgaggc ccac 44
<210> 81
<211> 48
<212> DNA
<213> 人工序列
<220>
<223> 序列10示于图5中
<400> 81
caatggaaaa gacattttca aacgattacc cacgggactg aggcccac 48
<210> 82
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> 序列11示于图5中
<400> 82
caatggaaaa gacattttca aacgattaca cacggcccac 40
<210> 83
<211> 37
<212> DNA
<213> 人工序列
<220>
<223> 序列12示于图5中
<400> 83
caatggaaaa gacattttct ccgggactga ggcccac 37
<210> 84
<211> 43
<212> DNA
<213> 人工序列
<220>
<223> 序列13示于图5中
<400> 84
caatggaaaa gacattttca aacgctccgg gactgaggcc cac 43
<210> 85
<211> 43
<212> DNA
<213> 人工序列
<220>
<223> 序列14示于图5中
<400> 85
caatggaaaa gacattttca aacgatccgg gactgaggcc cac 43
<210> 86
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> 序列15示于图5中
<400> 86
caatggaaaa gacattttca aacgataccc cac 33
<210> 87
<211> 54
<212> DNA
<213> 人工序列
<220>
<223> 序列16示于图5中
<400> 87
caatggaaaa gacattttca aacgattacc cacccctccg ggactgaggc ccac 54
<210> 88
<211> 49
<212> DNA
<213> 人工序列
<220>
<223> 序列17示于图5中
<400> 88
caatggaaaa gacattttca aacgattacc ctccgggact gaggcccac 49
<210> 89
<211> 54
<212> DNA
<213> 人工序列
<220>
<223> 序列18示于图5中
<400> 89
caatggaaaa gacattttca aacgattacc cacccctccg ggactgaggc ccac 54
<210> 90
<211> 47
<212> DNA
<213> 人工序列
<220>
<223> AarI-去除-1
<400> 90
agaagtatcc taccatctac catctccgaa agaaactcgt cgattcc 47
<210> 91
<211> 47
<212> DNA
<213> 人工序列
<220>
<223> AarI-去除-2
<400> 91
ggaatcgacg agtttctttc ggagatggta gatggtagga tacttct 47
<210> 92
<211> 10706
<212> DNA
<213> 人工序列
<220>
<223> pRF109
<400> 92
catggacaag aaatactcca tcggcctgga cattggaacc aactctgtcg gctgggctgt 60
catcaccgac gagtacaagg tgccctccaa gaaattcaag gtcctcggaa acaccgatcg 120
acactccatc aagaaaaacc tcattggtgc cctgttgttc gattctggcg agactgccga 180
agctaccaga ctcaagcgaa ctgctcggcg acgttacacc cgacggaaga accgaatctg 240
ctacctgcag gagatctttt ccaacgagat ggccaaggtg gacgattcgt tctttcatcg 300
actggaggaa tccttcctcg tcgaggaaga caagaaacac gagcgtcatc ccatctttgg 360
caacattgtg gacgaggttg cttaccacga gaagtatcct accatctacc atctccgaaa 420
gaaactcgtc gattccaccg acaaggcgga tctcagactt atctacctcg ctctggcaca 480
catgatcaag tttcgaggtc atttcctcat cgagggcgat ctcaatcccg acaacagcga 540
tgtggacaag ctgttcattc agctcgttca gacctacaac cagctgttcg aggaaaaccc 600
catcaatgcc tccggagtcg atgcaaaggc catcttgtct gctcgactct cgaagagcag 660
acgactggag aacctcattg cccaacttcc tggcgagaaa aagaacggac tgtttggcaa 720
cctcattgcc ctttctcttg gtctcacacc caacttcaag tccaacttcg atctggcgga 780
ggacgccaag ctccagctgt ccaaggacac ctacgacgat gacctcgaca acctgcttgc 840
acagattggc gatcagtacg ccgacctgtt tctcgctgcc aagaaccttt cggatgctat 900
tctcttgtct gacattctgc gagtcaacac cgagatcaca aaggctcccc tttctgcctc 960
catgatcaag cgatacgacg agcaccatca ggatctcaca ctgctcaagg ctcttgtccg 1020
acagcaactg cccgagaagt acaaggagat ctttttcgat cagtcgaaga acggctacgc 1080
tggatacatc gacggcggag cctctcagga agagttctac aagttcatca agccaattct 1140
cgagaagatg gacggaaccg aggaactgct tgtcaagctc aatcgagagg atctgcttcg 1200
gaagcaacga accttcgaca acggcagcat tcctcatcag atccacctcg gtgagctgca 1260
cgccattctt cgacgtcagg aagacttcta cccctttctc aaggacaacc gagagaagat 1320
cgagaagatt cttacctttc gaatccccta ctatgttggt cctcttgcca gaggaaactc 1380
tcgatttgct tggatgactc gaaagtccga ggaaaccatc actccctgga acttcgagga 1440
agtcgtggac aagggtgcct ctgcacagtc cttcatcgag cgaatgacca acttcgacaa 1500
gaatctgccc aacgagaagg ttcttcccaa gcattcgctg ctctacgagt actttacagt 1560
ctacaacgaa ctcaccaaag tcaagtacgt taccgaggga atgcgaaagc ctgccttctt 1620
gtctggcgaa cagaagaaag ccattgtcga tctcctgttc aagaccaacc gaaaggtcac 1680
tgttaagcag ctcaaggagg actacttcaa gaaaatcgag tgtttcgaca gcgtcgagat 1740
ttccggagtt gaggaccgat tcaacgcctc tttgggcacc tatcacgatc tgctcaagat 1800
tatcaaggac aaggattttc tcgacaacga ggaaaacgag gacattctgg aggacatcgt 1860
gctcactctt accctgttcg aagatcggga gatgatcgag gaacgactca agacatacgc 1920
tcacctgttc gacgacaagg tcatgaaaca actcaagcga cgtagataca ccggctgggg 1980
aagactttcg cgaaagctca tcaacggcat cagagacaag cagtccggaa agaccattct 2040
ggactttctc aagtccgatg gctttgccaa ccgaaacttc atgcagctca ttcacgacga 2100
ttctcttacc ttcaaggagg acatccagaa ggcacaagtg tccggtcagg gcgacagctt 2160
gcacgaacat attgccaacc tggctggttc gccagccatc aagaaaggca ttctccagac 2220
tgtcaaggtt gtcgacgagc tggtgaaggt catgggacgt cacaagcccg agaacattgt 2280
gatcgagatg gccagagaga accagacaac tcaaaagggt cagaaaaact cgcgagagcg 2340
gatgaagcga atcgaggaag gcatcaagga gctgggatcc cagattctca aggagcatcc 2400
cgtcgagaac actcaactgc agaacgagaa gctgtatctc tactatctgc agaatggtcg 2460
agacatgtac gtggatcagg aactggacat caatcgtctc agcgactacg atgtggacca 2520
cattgtccct caatcctttc tcaaggacga ttctatcgac aacaaggtcc ttacacgatc 2580
cgacaagaac agaggcaagt cggacaacgt tcccagcgaa gaggtggtca aaaagatgaa 2640
gaactactgg cgacagctgc tcaacgccaa gctcattacc cagcgaaagt tcgacaatct 2700
taccaaggcc gagcgaggcg gtctgtccga gctcgacaag gctggcttca tcaagcgtca 2760
actcgtcgag accagacaga tcacaaagca cgtcgcacag attctcgatt ctcggatgaa 2820
caccaagtac gacgagaacg acaagctcat ccgagaggtc aaggtgatta ctctcaagtc 2880
caaactggtc tccgatttcc gaaaggactt tcagttctac aaggtgcgag agatcaacaa 2940
ttaccaccat gcccacgatg cttacctcaa cgccgtcgtt ggcactgcgc tcatcaagaa 3000
ataccccaag ctcgaaagcg agttcgttta cggcgattac aaggtctacg acgttcgaaa 3060
gatgattgcc aagtccgaac aggagattgg caaggctact gccaagtact tcttttactc 3120
caacatcatg aactttttca agaccgagat caccttggcc aacggagaga ttcgaaagag 3180
accacttatc gagaccaacg gcgaaactgg agagatcgtg tgggacaagg gtcgagactt 3240
tgcaaccgtg cgaaaggttc tgtcgatgcc tcaggtcaac atcgtcaaga aaaccgaggt 3300
tcagactggc ggattctcca aggagtcgat tctgcccaag cgaaactccg acaagctcat 3360
cgctcgaaag aaagactggg atcccaagaa atacggtggc ttcgattctc ctaccgtcgc 3420
ctattccgtg cttgtcgttg cgaaggtcga gaagggcaag tccaaaaagc tcaagtccgt 3480
caaggagctg ctcggaatta ccatcatgga gcgatcgagc ttcgagaaga atcccatcga 3540
cttcttggaa gccaagggtt acaaggaggt caagaaagac ctcattatca agctgcccaa 3600
gtactctctg ttcgaactgg agaacggtcg aaagcgtatg ctcgcctccg ctggcgagct 3660
gcagaaggga aacgagcttg ccttgccttc gaagtacgtc aactttctct atctggcttc 3720
tcactacgag aagctcaagg gttctcccga ggacaacgaa cagaagcaac tcttcgttga 3780
gcagcacaaa cattacctcg acgagattat cgagcagatt tccgagtttt cgaagcgagt 3840
catcctggct gatgccaact tggacaaggt gctctctgcc tacaacaagc atcgggacaa 3900
acccattcga gaacaggcgg agaacatcat tcacctgttt actcttacca acctgggtgc 3960
tcctgcagct ttcaagtact tcgataccac tatcgaccga aagcggtaca catccaccaa 4020
ggaggttctc gatgccaccc tgattcacca gtccatcact ggcctgtacg agacccgaat 4080
cgacctgtct cagcttggtg gcgactccag agccgatccc aagaaaaagc gaaaggtcta 4140
agcggccgca agtgtggatg gggaagtgag tgcccggttc tgtgtgcaca attggcaatc 4200
caagatggat ggattcaaca cagggatata gcgagctacg tggtggtgcg aggatatagc 4260
aacggatatt tatgtttgac acttgagaat gtacgataca agcactgtcc aagtacaata 4320
ctaaacatac tgtacatact catactcgta cccgggcaac ggtttcactt gagtgcagtg 4380
gctagtgctc ttactcgtac agtgtgcaat actgcgtatc atagtctttg atgtatatcg 4440
tattcattca tgttagttgc gtacgagccg gaagcataaa gtgtaaagcc tggggtgcct 4500
aatgagtgag ctaactcaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa 4560
acctgtcgtg ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta 4620
ttgggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc 4680
gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg 4740
caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt 4800
tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa 4860
gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct 4920
ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc 4980
cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg 5040
tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct 5100
tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag 5160
cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga 5220
agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc gctctgctga 5280
agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg 5340
gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag 5400
aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag 5460
ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat 5520
gaagttttaa atcaatctaa agtatatatg agtaaacttg gtctgacagt taccaatgct 5580
taatcagtga ggcacctatc tcagcgatct gtctatttcg ttcatccata gttgcctgac 5640
tccccgtcgt gtagataact acgatacggg agggcttacc atctggcccc agtgctgcaa 5700
tgataccgcg agacccacgc tcaccggctc cagatttatc agcaataaac cagccagccg 5760
gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag tctattaatt 5820
gttgccggga agctagagta agtagttcgc cagttaatag tttgcgcaac gttgttgcca 5880
ttgctacagg catcgtggtg tcacgctcgt cgtttggtat ggcttcattc agctccggtt 5940
cccaacgatc aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg gttagctcct 6000
tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt gttatcactc atggttatgg 6060
cagcactgca taattctctt actgtcatgc catccgtaag atgcttttct gtgactggtg 6120
agtactcaac caagtcattc tgagaatagt gtatgcggcg accgagttgc tcttgcccgg 6180
cgtcaatacg ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa 6240
aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt 6300
aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt 6360
gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt 6420
gaatactcat actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca 6480
tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 6540
ttccccgaaa agtgccacct gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg 6600
tggttacgcg cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt 6660
tcttcccttc ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc 6720
tccctttagg gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg 6780
gtgatggttc acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg 6840
agtccacgtt ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct 6900
cggtctattc ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg 6960
agctgattta acaaaaattt aacgcgaatt ttaacaaaat attaacgctt acaatttcca 7020
ttcgccattc aggctgcgca actgttggga agggcgatcg gtgcgggcct cttcgctatt 7080
acgccagctg gcgaaagggg gatgtgctgc aaggcgatta agttgggtaa cgccagggtt 7140
ttcccagtca cgacgttgta aaacgacggc cagtgaattg taatacgact cactataggg 7200
cgaattgggt accgggcccc ccctcgaggt cgatggtgtc gataagcttg atatcgaatt 7260
catgtcacac aaaccgatct tcgcctcaag gaaacctaat tctacatccg agagactgcc 7320
gagatccagt ctacactgat taattttcgg gccaataatt taaaaaaatc gtgttatata 7380
atattatatg tattatatat atacatcatg atgatactga cagtcatgtc ccattgctaa 7440
atagacagac tccatctgcc gcctccaact gatgttctca atatttaagg ggtcatctcg 7500
cattgtttaa taataaacag actccatcta ccgcctccaa atgatgttct caaaatatat 7560
tgtatgaact tatttttatt acttagtatt attagacaac ttacttgctt tatgaaaaac 7620
acttcctatt taggaaacaa tttataatgg cagttcgttc atttaacaat ttatgtagaa 7680
taaatgttat aaatgcgtat gggaaatctt aaatatggat agcataaatg atatctgcat 7740
tgcctaattc gaaatcaaca gcaacgaaaa aaatcccttg tacaacataa atagtcatcg 7800
agaaatatca actatcaaag aacagctatt cacacgttac tattgagatt attattggac 7860
gagaatcaca cactcaactg tctttctctc ttctagaaat acaggtacaa gtatgtacta 7920
ttctcattgt tcatacttct agtcatttca tcccacatat tccttggatt tctctccaat 7980
gaatgacatt ctatcttgca aattcaacaa ttataataag atataccaaa gtagcggtat 8040
agtggcaatc aaaaagcttc tctggtgtgc ttctcgtatt tatttttatt ctaatgatcc 8100
attaaaggta tatatttatt tcttgttata taatcctttt gtttattaca tgggctggat 8160
acataaaggt attttgattt aattttttgc ttaaattcaa tcccccctcg ttcagtgtca 8220
actgtaatgg taggaaatta ccatactttt gaagaagcaa aaaaaatgaa agaaaaaaaa 8280
aatcgtattt ccaggttaga cgttccgcag aatctagaat gcggtatgcg gtacattgtt 8340
cttcgaacgt aaaagttgcg ctccctgaga tattgtacat ttttgctttt acaagtacaa 8400
gtacatcgta caactatgta ctactgttga tgcatccaca acagtttgtt ttgttttttt 8460
ttgttttttt tttttctaat gattcattac cgctatgtat acctacttgt acttgtagta 8520
agccgggtta ttggcgttca attaatcata gacttatgaa tctgcacggt gtgcgctgcg 8580
agttactttt agcttatgca tgctacttgg gtgtaatatt gggatctgtt cggaaatcaa 8640
cggatgctca atcgatttcg acagtaatta attaagtcat acacaagtca gctttcttcg 8700
agcctcatat aagtataagt agttcaacgt attagcactg tacccagcat ctccgtatcg 8760
agaaacacaa caacatgccc cattggacag atcatgcgga tacacaggtt gtgcagtatc 8820
atacatactc gatcagacag gtcgtctgac catcatacaa gctgaacaag cgctccatac 8880
ttgcacgctc tctatataca cagttaaatt acatatccat agtctaacct ctaacagtta 8940
atcttctggt aagcctccca gccagccttc tggtatcgct tggcctcctc aataggatct 9000
cggttctggc cgtacagacc tcggccgaca attatgatat ccgttccggt agacatgaca 9060
tcctcaacag ttcggtactg ctgtccgaga gcgtctccct tgtcgtcaag acccaccccg 9120
ggggtcagaa taagccagtc ctcagagtcg cccttaggtc ggttctgggc aatgaagcca 9180
accacaaact cggggtcgga tcgggcaagc tcaatggtct gcttggagta ctcgccagtg 9240
gccagagagc ccttgcaaga cagctcggcc agcatgagca gacctctggc cagcttctcg 9300
ttgggagagg ggactaggaa ctccttgtac tgggagttct cgtagtcaga gacgtcctcc 9360
ttcttctgtt cagagacagt ttcctcggca ccagctcgca ggccagcaat gattccggtt 9420
ccgggtacac cgtgggcgtt ggtgatatcg gaccactcgg cgattcggtg acaccggtac 9480
tggtgcttga cagtgttgcc aatatctgcg aactttctgt cctcgaacag gaagaaaccg 9540
tgcttaagag caagttcctt gagggggagc acagtgccgg cgtaggtgaa gtcgtcaatg 9600
atgtcgatat gggttttgat catgcacaca taaggtccga ccttatcggc aagctcaatg 9660
agctccttgg tggtggtaac atccagagaa gcacacaggt tggttttctt ggctgccacg 9720
agcttgagca ctcgagcggc aaaggcggac ttgtggacgt tagctcgagc ttcgtaggag 9780
ggcattttgg tggtgaagag gagactgaaa taaatttagt ctgcagaact ttttatcgga 9840
accttatctg gggcagtgaa gtatatgtta tggtaatagt tacgagttag ttgaacttat 9900
agatagactg gactatacgg ctatcggtcc aaattagaaa gaacgtcaat ggctctctgg 9960
gcgtcgcctt tgccgacaaa aatgtgatca tgatgaaagc cagcaatgac gttgcagctg 10020
atattgttgt cggccaaccg cgccgaaaac gcagctgtca gacccacagc ctccaacgaa 10080
gaatgtatcg tcaaagtgat ccaagcacac tcatagttgg agtcgtactc caaaggcggc 10140
aatgacgagt cagacagata ctcgtcgacg tttaaaccat catctaaggg cctcaaaact 10200
acctcggaac tgctgcgctg atctggacac cacagaggtt ccgagcactt taggttgcac 10260
caaatgtccc accaggtgca ggcagaaaac gctggaacag cgtgtacagt ttgtcttaac 10320
aaaaagtgag ggcgctgagg tcgagcaggg tggtgtgact tgttatagcc tttagagctg 10380
cgaaagcgcg tatggatttg gctcatcagg ccagattgag ggtctgtgga cacatgtcat 10440
gttagtgtac ttcaatcgcc ccctggatat agccccgaca ataggccgtg gcctcatttt 10500
tttgccttcc gcacatttcc attgctcggt acccacacct tgcttctcct gcacttgcca 10560
accttaatac tggtttacat tgaccaacat cttacaagcg gggggcttgt ctagggtata 10620
tataaacagt ggctctccca atcggttgcc agtctctttt ttcctttctt tccccacaga 10680
ttcgaaatct aaactacaca tcacac 10706
<210> 93
<211> 4140
<212> DNA
<213> 人工序列
<220>
<223> Aar1- Cas9基因
<400> 93
atggacaaga aatactccat cggcctggac attggaacca actctgtcgg ctgggctgtc 60
atcaccgacg agtacaaggt gccctccaag aaattcaagg tcctcggaaa caccgatcga 120
cactccatca agaaaaacct cattggtgcc ctgttgttcg attctggcga gactgccgaa 180
gctaccagac tcaagcgaac tgctcggcga cgttacaccc gacggaagaa ccgaatctgc 240
tacctgcagg agatcttttc caacgagatg gccaaggtgg acgattcgtt ctttcatcga 300
ctggaggaat ccttcctcgt cgaggaagac aagaaacacg agcgtcatcc catctttggc 360
aacattgtgg acgaggttgc ttaccacgag aagtatccta ccatctacca tctccgaaag 420
aaactcgtcg attccaccga caaggcggat ctcagactta tctacctcgc tctggcacac 480
atgatcaagt ttcgaggtca tttcctcatc gagggcgatc tcaatcccga caacagcgat 540
gtggacaagc tgttcattca gctcgttcag acctacaacc agctgttcga ggaaaacccc 600
atcaatgcct ccggagtcga tgcaaaggcc atcttgtctg ctcgactctc gaagagcaga 660
cgactggaga acctcattgc ccaacttcct ggcgagaaaa agaacggact gtttggcaac 720
ctcattgccc tttctcttgg tctcacaccc aacttcaagt ccaacttcga tctggcggag 780
gacgccaagc tccagctgtc caaggacacc tacgacgatg acctcgacaa cctgcttgca 840
cagattggcg atcagtacgc cgacctgttt ctcgctgcca agaacctttc ggatgctatt 900
ctcttgtctg acattctgcg agtcaacacc gagatcacaa aggctcccct ttctgcctcc 960
atgatcaagc gatacgacga gcaccatcag gatctcacac tgctcaaggc tcttgtccga 1020
cagcaactgc ccgagaagta caaggagatc tttttcgatc agtcgaagaa cggctacgct 1080
ggatacatcg acggcggagc ctctcaggaa gagttctaca agttcatcaa gccaattctc 1140
gagaagatgg acggaaccga ggaactgctt gtcaagctca atcgagagga tctgcttcgg 1200
aagcaacgaa ccttcgacaa cggcagcatt cctcatcaga tccacctcgg tgagctgcac 1260
gccattcttc gacgtcagga agacttctac ccctttctca aggacaaccg agagaagatc 1320
gagaagattc ttacctttcg aatcccctac tatgttggtc ctcttgccag aggaaactct 1380
cgatttgctt ggatgactcg aaagtccgag gaaaccatca ctccctggaa cttcgaggaa 1440
gtcgtggaca agggtgcctc tgcacagtcc ttcatcgagc gaatgaccaa cttcgacaag 1500
aatctgccca acgagaaggt tcttcccaag cattcgctgc tctacgagta ctttacagtc 1560
tacaacgaac tcaccaaagt caagtacgtt accgagggaa tgcgaaagcc tgccttcttg 1620
tctggcgaac agaagaaagc cattgtcgat ctcctgttca agaccaaccg aaaggtcact 1680
gttaagcagc tcaaggagga ctacttcaag aaaatcgagt gtttcgacag cgtcgagatt 1740
tccggagttg aggaccgatt caacgcctct ttgggcacct atcacgatct gctcaagatt 1800
atcaaggaca aggattttct cgacaacgag gaaaacgagg acattctgga ggacatcgtg 1860
ctcactctta ccctgttcga agatcgggag atgatcgagg aacgactcaa gacatacgct 1920
cacctgttcg acgacaaggt catgaaacaa ctcaagcgac gtagatacac cggctgggga 1980
agactttcgc gaaagctcat caacggcatc agagacaagc agtccggaaa gaccattctg 2040
gactttctca agtccgatgg ctttgccaac cgaaacttca tgcagctcat tcacgacgat 2100
tctcttacct tcaaggagga catccagaag gcacaagtgt ccggtcaggg cgacagcttg 2160
cacgaacata ttgccaacct ggctggttcg ccagccatca agaaaggcat tctccagact 2220
gtcaaggttg tcgacgagct ggtgaaggtc atgggacgtc acaagcccga gaacattgtg 2280
atcgagatgg ccagagagaa ccagacaact caaaagggtc agaaaaactc gcgagagcgg 2340
atgaagcgaa tcgaggaagg catcaaggag ctgggatccc agattctcaa ggagcatccc 2400
gtcgagaaca ctcaactgca gaacgagaag ctgtatctct actatctgca gaatggtcga 2460
gacatgtacg tggatcagga actggacatc aatcgtctca gcgactacga tgtggaccac 2520
attgtccctc aatcctttct caaggacgat tctatcgaca acaaggtcct tacacgatcc 2580
gacaagaaca gaggcaagtc ggacaacgtt cccagcgaag aggtggtcaa aaagatgaag 2640
aactactggc gacagctgct caacgccaag ctcattaccc agcgaaagtt cgacaatctt 2700
accaaggccg agcgaggcgg tctgtccgag ctcgacaagg ctggcttcat caagcgtcaa 2760
ctcgtcgaga ccagacagat cacaaagcac gtcgcacaga ttctcgattc tcggatgaac 2820
accaagtacg acgagaacga caagctcatc cgagaggtca aggtgattac tctcaagtcc 2880
aaactggtct ccgatttccg aaaggacttt cagttctaca aggtgcgaga gatcaacaat 2940
taccaccatg cccacgatgc ttacctcaac gccgtcgttg gcactgcgct catcaagaaa 3000
taccccaagc tcgaaagcga gttcgtttac ggcgattaca aggtctacga cgttcgaaag 3060
atgattgcca agtccgaaca ggagattggc aaggctactg ccaagtactt cttttactcc 3120
aacatcatga actttttcaa gaccgagatc accttggcca acggagagat tcgaaagaga 3180
ccacttatcg agaccaacgg cgaaactgga gagatcgtgt gggacaaggg tcgagacttt 3240
gcaaccgtgc gaaaggttct gtcgatgcct caggtcaaca tcgtcaagaa aaccgaggtt 3300
cagactggcg gattctccaa ggagtcgatt ctgcccaagc gaaactccga caagctcatc 3360
gctcgaaaga aagactggga tcccaagaaa tacggtggct tcgattctcc taccgtcgcc 3420
tattccgtgc ttgtcgttgc gaaggtcgag aagggcaagt ccaaaaagct caagtccgtc 3480
aaggagctgc tcggaattac catcatggag cgatcgagct tcgagaagaa tcccatcgac 3540
ttcttggaag ccaagggtta caaggaggtc aagaaagacc tcattatcaa gctgcccaag 3600
tactctctgt tcgaactgga gaacggtcga aagcgtatgc tcgcctccgc tggcgagctg 3660
cagaagggaa acgagcttgc cttgccttcg aagtacgtca actttctcta tctggcttct 3720
cactacgaga agctcaaggg ttctcccgag gacaacgaac agaagcaact cttcgttgag 3780
cagcacaaac attacctcga cgagattatc gagcagattt ccgagttttc gaagcgagtc 3840
atcctggctg atgccaactt ggacaaggtg ctctctgcct acaacaagca tcgggacaaa 3900
cccattcgag aacaggcgga gaacatcatt cacctgttta ctcttaccaa cctgggtgct 3960
cctgcagctt tcaagtactt cgataccact atcgaccgaa agcggtacac atccaccaag 4020
gaggttctcg atgccaccct gattcaccag tccatcactg gcctgtacga gacccgaatc 4080
gacctgtctc agcttggtgg cgactccaga gccgatccca agaaaaagcg aaaggtctaa 4140
<210> 94
<211> 10706
<212> DNA
<213> 人工序列
<220>
<223> pRF141
<400> 94
catggacaag aaatactcca tcggcctgga cattggaacc aactctgtcg gctgggctgt 60
catcaccgac gagtacaagg tgccctccaa gaaattcaag gtcctcggaa acaccgatcg 120
acactccatc aagaaaaacc tcattggtgc cctgttgttc gattctggcg agactgccga 180
agctaccaga ctcaagcgaa ctgctcggcg acgttacacc cgacggaaga accgaatctg 240
ctacctgcag gagatctttt ccaacgagat ggccaaggtg gacgattcgt tctttcatcg 300
actggaggaa tccttcctcg tcgaggaaga caagaaacac gagcgtcatc ccatctttgg 360
caacattgtg gacgaggttg cttaccacga gaagtatcct accatctacc atctccgaaa 420
gaaactcgtc gattccaccg acaaggcgga tctcagactt atctacctcg ctctggcaca 480
catgatcaag tttcgaggtc atttcctcat cgagggcgat ctcaatcccg acaacagcga 540
tgtggacaag ctgttcattc agctcgttca gacctacaac cagctgttcg aggaaaaccc 600
catcaatgcc tccggagtcg atgcaaaggc catcttgtct gctcgactct cgaagagcag 660
acgactggag aacctcattg cccaacttcc tggcgagaaa aagaacggac tgtttggcaa 720
cctcattgcc ctttctcttg gtctcacacc caacttcaag tccaacttcg atctggcgga 780
ggacgccaag ctccagctgt ccaaggacac ctacgacgat gacctcgaca acctgcttgc 840
acagattggc gatcagtacg ccgacctgtt tctcgctgcc aagaaccttt cggatgctat 900
tctcttgtct gacattctgc gagtcaacac cgagatcaca aaggctcccc tttctgcctc 960
catgatcaag cgatacgacg agcaccatca ggatctcaca ctgctcaagg ctcttgtccg 1020
acagcaactg cccgagaagt acaaggagat ctttttcgat cagtcgaaga acggctacgc 1080
tggatacatc gacggcggag cctctcagga agagttctac aagttcatca agccaattct 1140
cgagaagatg gacggaaccg aggaactgct tgtcaagctc aatcgagagg atctgcttcg 1200
gaagcaacga accttcgaca acggcagcat tcctcatcag atccacctcg gtgagctgca 1260
cgccattctt cgacgtcagg aagacttcta cccctttctc aaggacaacc gagagaagat 1320
cgagaagatt cttacctttc gaatccccta ctatgttggt cctcttgcca gaggaaactc 1380
tcgatttgct tggatgactc gaaagtccga ggaaaccatc actccctgga acttcgagga 1440
agtcgtggac aagggtgcct ctgcacagtc cttcatcgag cgaatgacca acttcgacaa 1500
gaatctgccc aacgagaagg ttcttcccaa gcattcgctg ctctacgagt actttacagt 1560
ctacaacgaa ctcaccaaag tcaagtacgt taccgaggga atgcgaaagc ctgccttctt 1620
gtctggcgaa cagaagaaag ccattgtcga tctcctgttc aagaccaacc gaaaggtcac 1680
tgttaagcag ctcaaggagg actacttcaa gaaaatcgag tgtttcgaca gcgtcgagat 1740
ttccggagtt gaggaccgat tcaacgcctc tttgggcacc tatcacgatc tgctcaagat 1800
tatcaaggac aaggattttc tcgacaacga ggaaaacgag gacattctgg aggacatcgt 1860
gctcactctt accctgttcg aagatcggga gatgatcgag gaacgactca agacatacgc 1920
tcacctgttc gacgacaagg tcatgaaaca actcaagcga cgtagataca ccggctgggg 1980
aagactttcg cgaaagctca tcaacggcat cagagacaag cagtccggaa agaccattct 2040
ggactttctc aagtccgatg gctttgccaa ccgaaacttc atgcagctca ttcacgacga 2100
ttctcttacc ttcaaggagg acatccagaa ggcacaagtg tccggtcagg gcgacagctt 2160
gcacgaacat attgccaacc tggctggttc gccagccatc aagaaaggca ttctccagac 2220
tgtcaaggtt gtcgacgagc tggtgaaggt catgggacgt cacaagcccg agaacattgt 2280
gatcgagatg gccagagaga accagacaac tcaaaagggt cagaaaaact cgcgagagcg 2340
gatgaagcga atcgaggaag gcatcaagga gctgggatcc cagattctca aggagcatcc 2400
cgtcgagaac actcaactgc agaacgagaa gctgtatctc tactatctgc agaatggtcg 2460
agacatgtac gtggatcagg aactggacat caatcgtctc agcgactacg atgtggacca 2520
cattgtccct caatcctttc tcaaggacga ttctatcgac aacaaggtcc ttacacgatc 2580
cgacaagaac agaggcaagt cggacaacgt tcccagcgaa gaggtggtca aaaagatgaa 2640
gaactactgg cgacagctgc tcaacgccaa gctcattacc cagcgaaagt tcgacaatct 2700
taccaaggcc gagcgaggcg gtctgtccga gctcgacaag gctggcttca tcaagcgtca 2760
actcgtcgag accagacaga tcacaaagca cgtcgcacag attctcgatt ctcggatgaa 2820
caccaagtac gacgagaacg acaagctcat ccgagaggtc aaggtgatta ctctcaagtc 2880
caaactggtc tccgatttcc gaaaggactt tcagttctac aaggtgcgag agatcaacaa 2940
ttaccaccat gcccacgatg cttacctcaa cgccgtcgtt ggcactgcgc tcatcaagaa 3000
ataccccaag ctcgaaagcg agttcgttta cggcgattac aaggtctacg acgttcgaaa 3060
gatgattgcc aagtccgaac aggagattgg caaggctact gccaagtact tcttttactc 3120
caacatcatg aactttttca agaccgagat caccttggcc aacggagaga ttcgaaagag 3180
accacttatc gagaccaacg gcgaaactgg agagatcgtg tgggacaagg gtcgagactt 3240
tgcaaccgtg cgaaaggttc tgtcgatgcc tcaggtcaac atcgtcaaga aaaccgaggt 3300
tcagactggc ggattctcca aggagtcgat tctgcccaag cgaaactccg acaagctcat 3360
cgctcgaaag aaagactggg atcccaagaa atacggtggc ttcgattctc ctaccgtcgc 3420
ctattccgtg cttgtcgttg cgaaggtcga gaagggcaag tccaaaaagc tcaagtccgt 3480
caaggagctg ctcggaatta ccatcatgga gcgatcgagc ttcgagaaga atcccatcga 3540
cttcttggaa gccaagggtt acaaggaggt caagaaagac ctcattatca agctgcccaa 3600
gtactctctg ttcgaactgg agaacggtcg aaagcgtatg ctcgcctccg ctggcgagct 3660
gcagaaggga aacgagcttg ccttgccttc gaagtacgtc aactttctct atctggcttc 3720
tcactacgag aagctcaagg gttctcccga ggacaacgaa cagaagcaac tcttcgttga 3780
gcagcacaaa cattacctcg acgagattat cgagcagatt tccgagtttt cgaagcgagt 3840
catcctggct gatgccaact tggacaaggt gctctctgcc tacaacaagc atcgggacaa 3900
acccattcga gaacaggcgg agaacatcat tcacctgttt actcttacca acctgggtgc 3960
tcctgcagct ttcaagtact tcgataccac tatcgaccga aagcggtaca catccaccaa 4020
ggaggttctc gatgccaccc tgattcacca gtccatcact ggcctgtacg agacccgaat 4080
cgacctgtct cagcttggtg gcgactccag agccgatccc aagaaaaagc gaaaggtcta 4140
agcggccgca agtgtggatg gggaagtgag tgcccggttc tgtgtgcaca attggcaatc 4200
caagatggat ggattcaaca cagggatata gcgagctacg tggtggtgcg aggatatagc 4260
aacggatatt tatgtttgac acttgagaat gtacgataca agcactgtcc aagtacaata 4320
ctaaacatac tgtacatact catactcgta cccgggcaac ggtttcactt gagtgcagtg 4380
gctagtgctc ttactcgtac agtgtgcaat actgcgtatc atagtctttg atgtatatcg 4440
tattcattca tgttagttgc gtacgagccg gaagcataaa gtgtaaagcc tggggtgcct 4500
aatgagtgag ctaactcaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa 4560
acctgtcgtg ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta 4620
ttgggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc 4680
gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg 4740
caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt 4800
tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa 4860
gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct 4920
ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc 4980
cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg 5040
tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct 5100
tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag 5160
cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga 5220
agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc gctctgctga 5280
agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg 5340
gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag 5400
aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag 5460
ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat 5520
gaagttttaa atcaatctaa agtatatatg agtaaacttg gtctgacagt taccaatgct 5580
taatcagtga ggcacctatc tcagcgatct gtctatttcg ttcatccata gttgcctgac 5640
tccccgtcgt gtagataact acgatacggg agggcttacc atctggcccc agtgctgcaa 5700
tgataccgcg agacccacgc tcaccggctc cagatttatc agcaataaac cagccagccg 5760
gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag tctattaatt 5820
gttgccggga agctagagta agtagttcgc cagttaatag tttgcgcaac gttgttgcca 5880
ttgctacagg catcgtggtg tcacgctcgt cgtttggtat ggcttcattc agctccggtt 5940
cccaacgatc aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg gttagctcct 6000
tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt gttatcactc atggttatgg 6060
cagcactgca taattctctt actgtcatgc catccgtaag atgcttttct gtgactggtg 6120
agtactcaac caagtcattc tgagaatagt gtatgcggcg accgagttgc tcttgcccgg 6180
cgtcaatacg ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa 6240
aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt 6300
aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt 6360
gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt 6420
gaatactcat actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca 6480
tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 6540
ttccccgaaa agtgccacct gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg 6600
tggttacgcg cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt 6660
tcttcccttc ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc 6720
tccctttagg gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg 6780
gtgatggttc acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg 6840
agtccacgtt ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct 6900
cggtctattc ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg 6960
agctgattta acaaaaattt aacgcgaatt ttaacaaaat attaacgctt acaatttcca 7020
ttcgccattc aggctgcgca actgttggga agggcgatcg gtgcgggcct cttcgctatt 7080
acgccagctg gcgaaagggg gatgtgctgc aaggcgatta agttgggtaa cgccagggtt 7140
ttcccagtca cgacgttgta aaacgacggc cagtgaattg taatacgact cactataggg 7200
cgaattgggt accgggcccc ccctcgaggt cgatggtgtc gataagcttg atatcgaatt 7260
catgtcacac aaaccgatct tcgcctcaag gaaacctaat tctacatccg agagactgcc 7320
gagatccagt ctacactgat taattttcgg gccaataatt taaaaaaatc gtgttatata 7380
atattatatg tattatatat atacatcatg atgatactga cagtcatgtc ccattgctaa 7440
atagacagac tccatctgcc gcctccaact gatgttctca atatttaagg ggtcatctcg 7500
cattgtttaa taataaacag actccatcta ccgcctccaa atgatgttct caaaatatat 7560
tgtatgaact tatttttatt acttagtatt attagacaac ttacttgctt tatgaaaaac 7620
acttcctatt taggaaacaa tttataatgg cagttcgttc atttaacaat ttatgtagaa 7680
taaatgttat aaatgcgtat gggaaatctt aaatatggat agcataaatg atatctgcat 7740
tgcctaattc gaaatcaaca gcaacgaaaa aaatcccttg tacaacataa atagtcatcg 7800
agaaatatca actatcaaag aacagctatt cacacgttac tattgagatt attattggac 7860
gagaatcaca cactcaactg tctttctctc ttctagaaat acaggtacaa gtatgtacta 7920
ttctcattgt tcatacttct agtcatttca tcccacatat tccttggatt tctctccaat 7980
gaatgacatt ctatcttgca aattcaacaa ttataataag atataccaaa gtagcggtat 8040
agtggcaatc aaaaagcttc tctggtgtgc ttctcgtatt tatttttatt ctaatgatcc 8100
attaaaggta tatatttatt tcttgttata taatcctttt gtttattaca tgggctggat 8160
acataaaggt attttgattt aattttttgc ttaaattcaa tcccccctcg ttcagtgtca 8220
actgtaatgg taggaaatta ccatactttt gaagaagcaa aaaaaatgaa agaaaaaaaa 8280
aatcgtattt ccaggttaga cgttccgcag aatctagaat gcggtatgcg gtacattgtt 8340
cttcgaacgt aaaagttgcg ctccctgaga tattgtacat ttttgctttt acaagtacaa 8400
gtacatcgta caactatgta ctactgttga tgcatccaca acagtttgtt ttgttttttt 8460
ttgttttttt tttttctaat gattcattac cgctatgtat acctacttgt acttgtagta 8520
agccgggtta ttggcgttca attaatcata gacttatgaa tctgcacggt gtgcgctgcg 8580
agttactttt agcttatgca tgctacttgg gtgtaatatt gggatctgtt cggaaatcaa 8640
cggatgctca atcgatttcg acagtaatta attaagtcat acacaagtca gctttcttcg 8700
agcctcatat aagtataagt agttcaacgt attagcactg tacccagcat ctccgtatcg 8760
agaaacacaa caacatgccc cattggacag atcatgcgga tacacaggtt gtgcagtatc 8820
atacatactc gatcagacag gtcgtctgac catcatacaa gctgaacaag cgctccatac 8880
ttgcacgctc tctatataca cagttaaatt acatatccat agtctaacct ctaacagtta 8940
atcttctggt aagcctccca gccagccttc tggtatcgct tggcctcctc aataggatct 9000
cggttctggc cgtacagacc tcggccgaca attatgatat ccgttccggt agacatgaca 9060
tcctcaacag ttcggtactg ctgtccgaga gcgtctccct tgtcgtcaag acccaccccg 9120
ggggtcagaa taagccagtc ctcagagtcg cccttaggtc ggttctgggc aatgaagcca 9180
accacaaact cggggtcgga tcgggcaagc tcaatggtct gcttggagta ctcgccagtg 9240
gccagagagc ccttgcaaga cagctcggcc agcatgagca gacctctggc cagcttctcg 9300
ttgggagagg ggactaggaa ctccttgtac tgggagttct cgtagtcaga gacgtcctcc 9360
ttcttctgtt cagagacagt ttcctcggca ccagctcgca ggccagcaat gattccggtt 9420
ccgggtacac cgtgggcgtt ggtgatatcg gaccactcgg cgattcggtg acaccggtac 9480
tggtgcttga cagtgttgcc aatatctgcg aactttctgt cctcgaacag gaagaaaccg 9540
tgcttaagag caagttcctt gagggggagc acagtgccgg cgtaggtgaa gtcgtcaatg 9600
atgtcgatat gggttttgat catgcacaca taaggtccga ccttatcggc aagctcaatg 9660
agctccttgg tggtggtaac atccagagaa gcacacaggt tggttttctt ggctgccacg 9720
agcttgagca ctcgagcggc aaaggcggac ttgtggacgt tagctcgagc ttcgtaggag 9780
ggcattttgg tggtgaagag gagactgaaa taaatttagt ctgcagaact ttttatcgga 9840
accttatctg gggcagtgaa gtatatgtta tggtaatagt tacgagttag ttgaacttat 9900
agatagactg gactatacgg ctatcggtcc aaattagaaa gaacgtcaat ggctctctgg 9960
gcgtcgcctt tgccgacaaa aatgtgatca tgatgaaagc cagcaatgac gttgcagctg 10020
atattgttgt cggccaaccg cgccgaaaac gcagctgtca gacccacagc ctccaacgaa 10080
gaatgtatcg tcaaagtgat ccaagcacac tcatagttgg agtcgtactc caaaggcggc 10140
aatgacgagt cagacagata ctcgtcgacg tttaaaccat catctaaggg cctcaaaact 10200
acctcggaac tgctgcgctg atctggacac cacagaggtt ccgagcactt taggttgcac 10260
caaatgtccc accaggtgca ggcagaaaac gctggaacag cgtgtacagt ttgtcttaac 10320
aaaaagtgag ggcgctgagg tcgagcaggg tggtgtgact tgttatagcc tttagagctg 10380
cgaaagcgcg tatggatttg gctcatcagg ccagattgag ggtctgtgga cacatgtcat 10440
gttagtgtac ttcaatcgcc ccctggatat agccccgaca ataggccgtg gcctcatttt 10500
tttgccttcc gcacatttcc attgctcggt acccacacct tgcttctcct gcacttgcca 10560
accttaatac tggtttacat tgaccaacat cttacaagcg gggggcttgt ctagggtata 10620
tataaacagt ggctctccca atcggttgcc agtctctttt ttcctttctt tccccacaga 10680
ttcgaaatct aaactacaca tcacac 10706
<210> 95
<211> 1048
<212> DNA
<213> 人工序列
<220>
<223> 高通量克隆盒
<400> 95
gcgcacgtta attaaatttt ttttgatttt cttttttgac cccgtcttca attacacttc 60
ccaactggga acacccctct ttatcgaccc attttaggta atttacccta gcccattgtc 120
tccataagga atattaccct aacccacagt ccagggtgcc caggtccttc tttggccaaa 180
ttttaacttc ggtcctatgg cacagcggta gcgcgtgaga ttgcaaatct taaggtcccg 240
agttcgaatc tcggtgggac ctagttattt ttgatagata atttcgtgat gattagaaac 300
ttaacgcaaa ataatggccg gcatggtccc agcctcctcg ctggcgccgg ctgggcaaca 360
tgcttcggca tggcgaatgg gacgcaggtg atggcgggat cgttgtatat ttcttgacac 420
cttttcggca tcgccctaaa ttcggcgtcc tcatattgtg tgaggacgtt ttattacgtg 480
tttacgaagc aaaagctaaa accaggagct atttaatggc aacagttaac cagctggtac 540
gcaaaccacg tgctcgcaaa gttgcgaaaa gcaacgtgcc tgcgctggaa gcatgcccgc 600
aaaaacgtgg cgtatgtact cgtgtatata ctaccactcc taaaaaaccg aactccgcgc 660
tgcgtaaagt atgccgtgtt cgtctgacta acggtttcga agtgacttcc tacatcggtg 720
gtgaaggtca caacctgcag gagcactccg tgatcctgat ccgtggcggt cgtgttaaag 780
acctcccggg tgttcgttac cacaccgtac gtggtgcgct tgactgctcc ggcgttaaag 840
accgtaagca ggctcgttcc aagtatggcg tgaagcgtcc taaggcttag gttaataaca 900
ggcctgctgg taatcgcagg cctttttatt tttacacctg cgttttagag ctagaaatag 960
caagttaaaa taaggctagt ccgttatcaa cttgaaaaag tggcaccgag tcggtgcttt 1020
tttttttgtt ttttatcgat gcgcgcac 1048
<210> 96
<211> 300
<212> DNA
<213> 解脂耶氏酵母
<400> 96
attttttttg attttctttt ttgaccccgt cttcaattac acttcccaac tgggaacacc 60
cctctttatc gacccatttt aggtaattta ccctagccca ttgtctccat aaggaatatt 120
accctaaccc acagtccagg gtgcccaggt ccttctttgg ccaaatttta acttcggtcc 180
tatggcacag cggtagcgcg tgagattgca aatcttaagg tcccgagttc gaatctcggt 240
gggacctagt tatttttgat agataatttc gtgatgatta gaaacttaac gcaaaataat 300
<210> 97
<211> 544
<212> DNA
<213> 大肠杆菌
<220>
<221> misc_feature
<222> (1)..(544)
<223> rpsL反向选择盒
<400> 97
atggcgggat cgttgtatat ttcttgacac cttttcggca tcgccctaaa ttcggcgtcc 60
tcatattgtg tgaggacgtt ttattacgtg tttacgaagc aaaagctaaa accaggagct 120
atttaatggc aacagttaac cagctggtac gcaaaccacg tgctcgcaaa gttgcgaaaa 180
gcaacgtgcc tgcgctggaa gcatgcccgc aaaaacgtgg cgtatgtact cgtgtatata 240
ctaccactcc taaaaaaccg aactccgcgc tgcgtaaagt atgccgtgtt cgtctgacta 300
acggtttcga agtgacttcc tacatcggtg gtgaaggtca caacctgcag gagcactccg 360
tgatcctgat ccgtggcggt cgtgttaaag acctcccggg tgttcgttac cacaccgtac 420
gtggtgcgct tgactgctcc ggcgttaaag accgtaagca ggctcgttcc aagtatggcg 480
tgaagcgtcc taaggcttag gttaataaca ggcctgctgg taatcgcagg cctttttatt 540
ttta 544
<210> 98
<211> 11714
<212> DNA
<213> 人工序列
<220>
<223> pRF291
<400> 98
cgataaaaaa caaaaaaaaa agcaccgact cggtgccact ttttcaagtt gataacggac 60
tagccttatt ttaacttgct atttctagct ctaaaacgca ggtgtaaaaa taaaaaggcc 120
tgcgattacc agcaggcctg ttattaacct aagccttagg acgcttcacg ccatacttgg 180
aacgagcctg cttacggtct ttaacgccgg agcagtcaag cgcaccacgt acggtgtggt 240
aacgaacacc cgggaggtct ttaacacgac cgccacggat caggatcacg gagtgctcct 300
gcaggttgtg accttcacca ccgatgtagg aagtcacttc gaaaccgtta gtcagacgaa 360
cacggcatac tttacgcagc gcggagttcg gttttttagg agtggtagta tatacacgag 420
tacatacgcc acgtttttgc gggcatgctt ccagcgcagg cacgttgctt ttcgcaactt 480
tgcgagcacg tggtttgcgt accagctggt taactgttgc cattaaatag ctcctggttt 540
tagcttttgc ttcgtaaaca cgtaataaaa cgtcctcaca caatatgagg acgccgaatt 600
tagggcgatg ccgaaaaggt gtcaagaaat atacaacgat cccgccatca cctgcgtccc 660
attcgccatg ccgaagcatg ttgcccagcc ggcgccagcg aggaggctgg gaccatgccg 720
gccattattt tgcgttaagt ttctaatcat cacgaaatta tctatcaaaa ataactaggt 780
cccaccgaga ttcgaactcg ggaccttaag atttgcaatc tcacgcgcta ccgctgtgcc 840
ataggaccga agttaaaatt tggccaaaga aggacctggg caccctggac tgtgggttag 900
ggtaatattc cttatggaga caatgggcta gggtaaatta cctaaaatgg gtcgataaag 960
aggggtgttc ccagttggga agtgtaattg aagacggggt caaaaaagaa aatcaaaaaa 1020
aatttaatta agtcatacac aagtcagctt tcttcgagcc tcatataagt ataagtagtt 1080
caacgtatta gcactgtacc cagcatctcc gtatcgagaa acacaacaac atgccccatt 1140
ggacagatca tgcggataca caggttgtgc agtatcatac atactcgatc agacaggtcg 1200
tctgaccatc atacaagctg aacaagcgct ccatacttgc acgctctcta tatacacagt 1260
taaattacat atccatagtc taacctctaa cagttaatct tctggtaagc ctcccagcca 1320
gccttctggt atcgcttggc ctcctcaata ggatctcggt tctggccgta cagacctcgg 1380
ccgacaatta tgatatccgt tccggtagac atgacatcct caacagttcg gtactgctgt 1440
ccgagagcgt ctcccttgtc gtcaagaccc accccggggg tcagaataag ccagtcctca 1500
gagtcgccct taggtcggtt ctgggcaatg aagccaacca caaactcggg gtcggatcgg 1560
gcaagctcaa tggtctgctt ggagtactcg ccagtggcca gagagccctt gcaagacagc 1620
tcggccagca tgagcagacc tctggccagc ttctcgttgg gagaggggac taggaactcc 1680
ttgtactggg agttctcgta gtcagagacg tcctccttct tctgttcaga gacagtttcc 1740
tcggcaccag ctcgcaggcc agcaatgatt ccggttccgg gtacaccgtg ggcgttggtg 1800
atatcggacc actcggcgat tcggtgacac cggtactggt gcttgacagt gttgccaata 1860
tctgcgaact ttctgtcctc gaacaggaag aaaccgtgct taagagcaag ttccttgagg 1920
gggagcacag tgccggcgta ggtgaagtcg tcaatgatgt cgatatgggt tttgatcatg 1980
cacacataag gtccgacctt atcggcaagc tcaatgagct ccttggtggt ggtaacatcc 2040
agagaagcac acaggttggt tttcttggct gccacgagct tgagcactcg agcggcaaag 2100
gcggacttgt ggacgttagc tcgagcttcg taggagggca ttttggtggt gaagaggaga 2160
ctgaaataaa tttagtctgc agaacttttt atcggaacct tatctggggc agtgaagtat 2220
atgttatggt aatagttacg agttagttga acttatagat agactggact atacggctat 2280
cggtccaaat tagaaagaac gtcaatggct ctctgggcgt cgcctttgcc gacaaaaatg 2340
tgatcatgat gaaagccagc aatgacgttg cagctgatat tgttgtcggc caaccgcgcc 2400
gaaaacgcag ctgtcagacc cacagcctcc aacgaagaat gtatcgtcaa agtgatccaa 2460
gcacactcat agttggagtc gtactccaaa ggcggcaatg acgagtcaga cagatactcg 2520
tcgacgttta aaccatcatc taagggcctc aaaactacct cggaactgct gcgctgatct 2580
ggacaccaca gaggttccga gcactttagg ttgcaccaaa tgtcccacca ggtgcaggca 2640
gaaaacgctg gaacagcgtg tacagtttgt cttaacaaaa agtgagggcg ctgaggtcga 2700
gcagggtggt gtgacttgtt atagccttta gagctgcgaa agcgcgtatg gatttggctc 2760
atcaggccag attgagggtc tgtggacaca tgtcatgtta gtgtacttca atcgccccct 2820
ggatatagcc ccgacaatag gccgtggcct catttttttg ccttccgcac atttccattg 2880
ctcggtaccc acaccttgct tctcctgcac ttgccaacct taatactggt ttacattgac 2940
caacatctta caagcggggg gcttgtctag ggtatatata aacagtggct ctcccaatcg 3000
gttgccagtc tcttttttcc tttctttccc cacagattcg aaatctaaac tacacatcac 3060
accatggaca agaaatactc catcggcctg gacattggaa ccaactctgt cggctgggct 3120
gtcatcaccg acgagtacaa ggtgccctcc aagaaattca aggtcctcgg aaacaccgat 3180
cgacactcca tcaagaaaaa cctcattggt gccctgttgt tcgattctgg cgagactgcc 3240
gaagctacca gactcaagcg aactgctcgg cgacgttaca cccgacggaa gaaccgaatc 3300
tgctacctgc aggagatctt ttccaacgag atggccaagg tggacgattc gttctttcat 3360
cgactggagg aatccttcct cgtcgaggaa gacaagaaac acgagcgtca tcccatcttt 3420
ggcaacattg tggacgaggt tgcttaccac gagaagtatc ctaccatcta ccatctccga 3480
aagaaactcg tcgattccac cgacaaggcg gatctcagac ttatctacct cgctctggca 3540
cacatgatca agtttcgagg tcatttcctc atcgagggcg atctcaatcc cgacaacagc 3600
gatgtggaca agctgttcat tcagctcgtt cagacctaca accagctgtt cgaggaaaac 3660
cccatcaatg cctccggagt cgatgcaaag gccatcttgt ctgctcgact ctcgaagagc 3720
agacgactgg agaacctcat tgcccaactt cctggcgaga aaaagaacgg actgtttggc 3780
aacctcattg ccctttctct tggtctcaca cccaacttca agtccaactt cgatctggcg 3840
gaggacgcca agctccagct gtccaaggac acctacgacg atgacctcga caacctgctt 3900
gcacagattg gcgatcagta cgccgacctg tttctcgctg ccaagaacct ttcggatgct 3960
attctcttgt ctgacattct gcgagtcaac accgagatca caaaggctcc cctttctgcc 4020
tccatgatca agcgatacga cgagcaccat caggatctca cactgctcaa ggctcttgtc 4080
cgacagcaac tgcccgagaa gtacaaggag atctttttcg atcagtcgaa gaacggctac 4140
gctggataca tcgacggcgg agcctctcag gaagagttct acaagttcat caagccaatt 4200
ctcgagaaga tggacggaac cgaggaactg cttgtcaagc tcaatcgaga ggatctgctt 4260
cggaagcaac gaaccttcga caacggcagc attcctcatc agatccacct cggtgagctg 4320
cacgccattc ttcgacgtca ggaagacttc tacccctttc tcaaggacaa ccgagagaag 4380
atcgagaaga ttcttacctt tcgaatcccc tactatgttg gtcctcttgc cagaggaaac 4440
tctcgatttg cttggatgac tcgaaagtcc gaggaaacca tcactccctg gaacttcgag 4500
gaagtcgtgg acaagggtgc ctctgcacag tccttcatcg agcgaatgac caacttcgac 4560
aagaatctgc ccaacgagaa ggttcttccc aagcattcgc tgctctacga gtactttaca 4620
gtctacaacg aactcaccaa agtcaagtac gttaccgagg gaatgcgaaa gcctgccttc 4680
ttgtctggcg aacagaagaa agccattgtc gatctcctgt tcaagaccaa ccgaaaggtc 4740
actgttaagc agctcaagga ggactacttc aagaaaatcg agtgtttcga cagcgtcgag 4800
atttccggag ttgaggaccg attcaacgcc tctttgggca cctatcacga tctgctcaag 4860
attatcaagg acaaggattt tctcgacaac gaggaaaacg aggacattct ggaggacatc 4920
gtgctcactc ttaccctgtt cgaagatcgg gagatgatcg aggaacgact caagacatac 4980
gctcacctgt tcgacgacaa ggtcatgaaa caactcaagc gacgtagata caccggctgg 5040
ggaagacttt cgcgaaagct catcaacggc atcagagaca agcagtccgg aaagaccatt 5100
ctggactttc tcaagtccga tggctttgcc aaccgaaact tcatgcagct cattcacgac 5160
gattctctta ccttcaagga ggacatccag aaggcacaag tgtccggtca gggcgacagc 5220
ttgcacgaac atattgccaa cctggctggt tcgccagcca tcaagaaagg cattctccag 5280
actgtcaagg ttgtcgacga gctggtgaag gtcatgggac gtcacaagcc cgagaacatt 5340
gtgatcgaga tggccagaga gaaccagaca actcaaaagg gtcagaaaaa ctcgcgagag 5400
cggatgaagc gaatcgagga aggcatcaag gagctgggat cccagattct caaggagcat 5460
cccgtcgaga acactcaact gcagaacgag aagctgtatc tctactatct gcagaatggt 5520
cgagacatgt acgtggatca ggaactggac atcaatcgtc tcagcgacta cgatgtggac 5580
cacattgtcc ctcaatcctt tctcaaggac gattctatcg acaacaaggt ccttacacga 5640
tccgacaaga acagaggcaa gtcggacaac gttcccagcg aagaggtggt caaaaagatg 5700
aagaactact ggcgacagct gctcaacgcc aagctcatta cccagcgaaa gttcgacaat 5760
cttaccaagg ccgagcgagg cggtctgtcc gagctcgaca aggctggctt catcaagcgt 5820
caactcgtcg agaccagaca gatcacaaag cacgtcgcac agattctcga ttctcggatg 5880
aacaccaagt acgacgagaa cgacaagctc atccgagagg tcaaggtgat tactctcaag 5940
tccaaactgg tctccgattt ccgaaaggac tttcagttct acaaggtgcg agagatcaac 6000
aattaccacc atgcccacga tgcttacctc aacgccgtcg ttggcactgc gctcatcaag 6060
aaatacccca agctcgaaag cgagttcgtt tacggcgatt acaaggtcta cgacgttcga 6120
aagatgattg ccaagtccga acaggagatt ggcaaggcta ctgccaagta cttcttttac 6180
tccaacatca tgaacttttt caagaccgag atcaccttgg ccaacggaga gattcgaaag 6240
agaccactta tcgagaccaa cggcgaaact ggagagatcg tgtgggacaa gggtcgagac 6300
tttgcaaccg tgcgaaaggt tctgtcgatg cctcaggtca acatcgtcaa gaaaaccgag 6360
gttcagactg gcggattctc caaggagtcg attctgccca agcgaaactc cgacaagctc 6420
atcgctcgaa agaaagactg ggatcccaag aaatacggtg gcttcgattc tcctaccgtc 6480
gcctattccg tgcttgtcgt tgcgaaggtc gagaagggca agtccaaaaa gctcaagtcc 6540
gtcaaggagc tgctcggaat taccatcatg gagcgatcga gcttcgagaa gaatcccatc 6600
gacttcttgg aagccaaggg ttacaaggag gtcaagaaag acctcattat caagctgccc 6660
aagtactctc tgttcgaact ggagaacggt cgaaagcgta tgctcgcctc cgctggcgag 6720
ctgcagaagg gaaacgagct tgccttgcct tcgaagtacg tcaactttct ctatctggct 6780
tctcactacg agaagctcaa gggttctccc gaggacaacg aacagaagca actcttcgtt 6840
gagcagcaca aacattacct cgacgagatt atcgagcaga tttccgagtt ttcgaagcga 6900
gtcatcctgg ctgatgccaa cttggacaag gtgctctctg cctacaacaa gcatcgggac 6960
aaacccattc gagaacaggc ggagaacatc attcacctgt ttactcttac caacctgggt 7020
gctcctgcag ctttcaagta cttcgatacc actatcgacc gaaagcggta cacatccacc 7080
aaggaggttc tcgatgccac cctgattcac cagtccatca ctggcctgta cgagacccga 7140
atcgacctgt ctcagcttgg tggcgactcc agagccgatc ccaagaaaaa gcgaaaggtc 7200
taagcggccg caagtgtgga tggggaagtg agtgcccggt tctgtgtgca caattggcaa 7260
tccaagatgg atggattcaa cacagggata tagcgagcta cgtggtggtg cgaggatata 7320
gcaacggata tttatgtttg acacttgaga atgtacgata caagcactgt ccaagtacaa 7380
tactaaacat actgtacata ctcatactcg tacccgggca acggtttcac ttgagtgcag 7440
tggctagtgc tcttactcgt acagtgtgca atactgcgta tcatagtctt tgatgtatat 7500
cgtattcatt catgttagtt gcgtacgagc cggaagcata aagtgtaaag cctggggtgc 7560
ctaatgagtg agctaactca cattaattgc gttgcgctca ctgcccgctt tccagtcggg 7620
aaacctgtcg tgccagctgc attaatgaat cggccaacgc gcggggagag gcggtttgcg 7680
tattgggcgc tcttccgctt cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg 7740
gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa 7800
cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc 7860
gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc 7920
aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag 7980
ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct 8040
cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta 8100
ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc 8160
cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc 8220
agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt 8280
gaagtggtgg cctaactacg gctacactag aaggacagta tttggtatct gcgctctgct 8340
gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc 8400
tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca 8460
agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta 8520
agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa 8580
atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg 8640
cttaatcagt gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg 8700
actccccgtc gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc 8760
aatgataccg cgagacccac gctcaccggc tccagattta tcagcaataa accagccagc 8820
cggaagggcc gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa 8880
ttgttgccgg gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc 8940
cattgctaca ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg 9000
ttcccaacga tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc 9060
cttcggtcct ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat 9120
ggcagcactg cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg 9180
tgagtactca accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc 9240
ggcgtcaata cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg 9300
aaaacgttct tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat 9360
gtaacccact cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg 9420
gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg 9480
ttgaatactc atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct 9540
catgagcgga tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac 9600
atttccccga aaagtgccac ctgacgcgcc ctgtagcggc gcattaagcg cggcgggtgt 9660
ggtggttacg cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg ctcctttcgc 9720
tttcttccct tcctttctcg ccacgttcgc cggctttccc cgtcaagctc taaatcgggg 9780
gctcccttta gggttccgat ttagtgcttt acggcacctc gaccccaaaa aacttgatta 9840
gggtgatggt tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc ctttgacgtt 9900
ggagtccacg ttctttaata gtggactctt gttccaaact ggaacaacac tcaaccctat 9960
ctcggtctat tcttttgatt tataagggat tttgccgatt tcggcctatt ggttaaaaaa 10020
tgagctgatt taacaaaaat ttaacgcgaa ttttaacaaa atattaacgc ttacaatttc 10080
cattcgccat tcaggctgcg caactgttgg gaagggcgat cggtgcgggc ctcttcgcta 10140
ttacgccagc tggcgaaagg gggatgtgct gcaaggcgat taagttgggt aacgccaggg 10200
ttttcccagt cacgacgttg taaaacgacg gccagtgaat tgtaatacga ctcactatag 10260
ggcgaattgg gtaccgggcc ccccctcgag gtcgatggtg tcgataagct tgatatcgaa 10320
ttcatgtcac acaaaccgat cttcgcctca aggaaaccta attctacatc cgagagactg 10380
ccgagatcca gtctacactg attaattttc gggccaataa tttaaaaaaa tcgtgttata 10440
taatattata tgtattatat atatacatca tgatgatact gacagtcatg tcccattgct 10500
aaatagacag actccatctg ccgcctccaa ctgatgttct caatatttaa ggggtcatct 10560
cgcattgttt aataataaac agactccatc taccgcctcc aaatgatgtt ctcaaaatat 10620
attgtatgaa cttattttta ttacttagta ttattagaca acttacttgc tttatgaaaa 10680
acacttccta tttaggaaac aatttataat ggcagttcgt tcatttaaca atttatgtag 10740
aataaatgtt ataaatgcgt atgggaaatc ttaaatatgg atagcataaa tgatatctgc 10800
attgcctaat tcgaaatcaa cagcaacgaa aaaaatccct tgtacaacat aaatagtcat 10860
cgagaaatat caactatcaa agaacagcta ttcacacgtt actattgaga ttattattgg 10920
acgagaatca cacactcaac tgtctttctc tcttctagaa atacaggtac aagtatgtac 10980
tattctcatt gttcatactt ctagtcattt catcccacat attccttgga tttctctcca 11040
atgaatgaca ttctatcttg caaattcaac aattataata agatatacca aagtagcggt 11100
atagtggcaa tcaaaaagct tctctggtgt gcttctcgta tttattttta ttctaatgat 11160
ccattaaagg tatatattta tttcttgtta tataatcctt ttgtttatta catgggctgg 11220
atacataaag gtattttgat ttaatttttt gcttaaattc aatcccccct cgttcagtgt 11280
caactgtaat ggtaggaaat taccatactt ttgaagaagc aaaaaaaatg aaagaaaaaa 11340
aaaatcgtat ttccaggtta gacgttccgc agaatctaga atgcggtatg cggtacattg 11400
ttcttcgaac gtaaaagttg cgctccctga gatattgtac atttttgctt ttacaagtac 11460
aagtacatcg tacaactatg tactactgtt gatgcatcca caacagtttg ttttgttttt 11520
ttttgttttt tttttttcta atgattcatt accgctatgt atacctactt gtacttgtag 11580
taagccgggt tattggcgtt caattaatca tagacttatg aatctgcacg gtgtgcgctg 11640
cgagttactt ttagcttatg catgctactt gggtgtaata ttgggatctg ttcggaaatc 11700
aacggatgct caat 11714
<210> 99
<211> 32
<212> DNA
<213> 人工序列
<220>
<223> Can1-1F
<400> 99
aatgggactc aaacgattac ccaccctcgt tt 32
<210> 100
<211> 32
<212> DNA
<213> 人工序列
<220>
<223> Can1-1R
<400> 100
tctaaaacga gggtgggtaa tcgtttgagt cc 32
<210> 101
<211> 23
<212> DNA
<213> 解脂耶氏酵母
<220>
<221> misc_feature
<222> (1)..(23)
<223> Can1-1靶位点和PAM
<400> 101
tcaaacgatt acccaccctc cgg 23
<210> 102
<211> 480
<212> DNA
<213> 人工序列
<220>
<223> Can1-1 gRNA表达盒
<400> 102
attttttttg attttctttt ttgaccccgt cttcaattac acttcccaac tgggaacacc 60
cctctttatc gacccatttt aggtaattta ccctagccca ttgtctccat aaggaatatt 120
accctaaccc acagtccagg gtgcccaggt ccttctttgg ccaaatttta acttcggtcc 180
tatggcacag cggtagcgcg tgagattgca aatcttaagg tcccgagttc gaatctcggt 240
gggacctagt tatttttgat agataatttc gtgatgatta gaaacttaac gcaaaataat 300
ggccggcatg gtcccagcct cctcgctggc gccggctggg caacatgctt cggcatggcg 360
aatgggactc aaacgattac ccaccctcgt tttagagcta gaaatagcaa ttaaaataag 420
gctagtccgt tatcaacttg aaaaagtggc accgagtcgg tgcttttttt tttgtttttt 480
<210> 103
<211> 11176
<212> DNA
<213> 人工序列
<220>
<223> pRF303
<400> 103
tctaaaacga gggtgggtaa tcgtttgagt cccattcgcc atgccgaagc atgttgccca 60
gccggcgcca gcgaggaggc tgggaccatg ccggccatta ttttgcgtta agtttctaat 120
catcacgaaa ttatctatca aaaataacta ggtcccaccg agattcgaac tcgggacctt 180
aagatttgca atctcacgcg ctaccgctgt gccataggac cgaagttaaa atttggccaa 240
agaaggacct gggcaccctg gactgtgggt tagggtaata ttccttatgg agacaatggg 300
ctagggtaaa ttacctaaaa tgggtcgata aagaggggtg ttcccagttg ggaagtgtaa 360
ttgaagacgg ggtcaaaaaa gaaaatcaaa aaaaatttaa ttaagtcata cacaagtcag 420
ctttcttcga gcctcatata agtataagta gttcaacgta ttagcactgt acccagcatc 480
tccgtatcga gaaacacaac aacatgcccc attggacaga tcatgcggat acacaggttg 540
tgcagtatca tacatactcg atcagacagg tcgtctgacc atcatacaag ctgaacaagc 600
gctccatact tgcacgctct ctatatacac agttaaatta catatccata gtctaacctc 660
taacagttaa tcttctggta agcctcccag ccagccttct ggtatcgctt ggcctcctca 720
ataggatctc ggttctggcc gtacagacct cggccgacaa ttatgatatc cgttccggta 780
gacatgacat cctcaacagt tcggtactgc tgtccgagag cgtctccctt gtcgtcaaga 840
cccaccccgg gggtcagaat aagccagtcc tcagagtcgc ccttaggtcg gttctgggca 900
atgaagccaa ccacaaactc ggggtcggat cgggcaagct caatggtctg cttggagtac 960
tcgccagtgg ccagagagcc cttgcaagac agctcggcca gcatgagcag acctctggcc 1020
agcttctcgt tgggagaggg gactaggaac tccttgtact gggagttctc gtagtcagag 1080
acgtcctcct tcttctgttc agagacagtt tcctcggcac cagctcgcag gccagcaatg 1140
attccggttc cgggtacacc gtgggcgttg gtgatatcgg accactcggc gattcggtga 1200
caccggtact ggtgcttgac agtgttgcca atatctgcga actttctgtc ctcgaacagg 1260
aagaaaccgt gcttaagagc aagttccttg agggggagca cagtgccggc gtaggtgaag 1320
tcgtcaatga tgtcgatatg ggttttgatc atgcacacat aaggtccgac cttatcggca 1380
agctcaatga gctccttggt ggtggtaaca tccagagaag cacacaggtt ggttttcttg 1440
gctgccacga gcttgagcac tcgagcggca aaggcggact tgtggacgtt agctcgagct 1500
tcgtaggagg gcattttggt ggtgaagagg agactgaaat aaatttagtc tgcagaactt 1560
tttatcggaa ccttatctgg ggcagtgaag tatatgttat ggtaatagtt acgagttagt 1620
tgaacttata gatagactgg actatacggc tatcggtcca aattagaaag aacgtcaatg 1680
gctctctggg cgtcgccttt gccgacaaaa atgtgatcat gatgaaagcc agcaatgacg 1740
ttgcagctga tattgttgtc ggccaaccgc gccgaaaacg cagctgtcag acccacagcc 1800
tccaacgaag aatgtatcgt caaagtgatc caagcacact catagttgga gtcgtactcc 1860
aaaggcggca atgacgagtc agacagatac tcgtcgacgt ttaaaccatc atctaagggc 1920
ctcaaaacta cctcggaact gctgcgctga tctggacacc acagaggttc cgagcacttt 1980
aggttgcacc aaatgtccca ccaggtgcag gcagaaaacg ctggaacagc gtgtacagtt 2040
tgtcttaaca aaaagtgagg gcgctgaggt cgagcagggt ggtgtgactt gttatagcct 2100
ttagagctgc gaaagcgcgt atggatttgg ctcatcaggc cagattgagg gtctgtggac 2160
acatgtcatg ttagtgtact tcaatcgccc cctggatata gccccgacaa taggccgtgg 2220
cctcattttt ttgccttccg cacatttcca ttgctcggta cccacacctt gcttctcctg 2280
cacttgccaa ccttaatact ggtttacatt gaccaacatc ttacaagcgg ggggcttgtc 2340
tagggtatat ataaacagtg gctctcccaa tcggttgcca gtctcttttt tcctttcttt 2400
ccccacagat tcgaaatcta aactacacat cacaccatgg acaagaaata ctccatcggc 2460
ctggacattg gaaccaactc tgtcggctgg gctgtcatca ccgacgagta caaggtgccc 2520
tccaagaaat tcaaggtcct cggaaacacc gatcgacact ccatcaagaa aaacctcatt 2580
ggtgccctgt tgttcgattc tggcgagact gccgaagcta ccagactcaa gcgaactgct 2640
cggcgacgtt acacccgacg gaagaaccga atctgctacc tgcaggagat cttttccaac 2700
gagatggcca aggtggacga ttcgttcttt catcgactgg aggaatcctt cctcgtcgag 2760
gaagacaaga aacacgagcg tcatcccatc tttggcaaca ttgtggacga ggttgcttac 2820
cacgagaagt atcctaccat ctaccatctc cgaaagaaac tcgtcgattc caccgacaag 2880
gcggatctca gacttatcta cctcgctctg gcacacatga tcaagtttcg aggtcatttc 2940
ctcatcgagg gcgatctcaa tcccgacaac agcgatgtgg acaagctgtt cattcagctc 3000
gttcagacct acaaccagct gttcgaggaa aaccccatca atgcctccgg agtcgatgca 3060
aaggccatct tgtctgctcg actctcgaag agcagacgac tggagaacct cattgcccaa 3120
cttcctggcg agaaaaagaa cggactgttt ggcaacctca ttgccctttc tcttggtctc 3180
acacccaact tcaagtccaa cttcgatctg gcggaggacg ccaagctcca gctgtccaag 3240
gacacctacg acgatgacct cgacaacctg cttgcacaga ttggcgatca gtacgccgac 3300
ctgtttctcg ctgccaagaa cctttcggat gctattctct tgtctgacat tctgcgagtc 3360
aacaccgaga tcacaaaggc tcccctttct gcctccatga tcaagcgata cgacgagcac 3420
catcaggatc tcacactgct caaggctctt gtccgacagc aactgcccga gaagtacaag 3480
gagatctttt tcgatcagtc gaagaacggc tacgctggat acatcgacgg cggagcctct 3540
caggaagagt tctacaagtt catcaagcca attctcgaga agatggacgg aaccgaggaa 3600
ctgcttgtca agctcaatcg agaggatctg cttcggaagc aacgaacctt cgacaacggc 3660
agcattcctc atcagatcca cctcggtgag ctgcacgcca ttcttcgacg tcaggaagac 3720
ttctacccct ttctcaagga caaccgagag aagatcgaga agattcttac ctttcgaatc 3780
ccctactatg ttggtcctct tgccagagga aactctcgat ttgcttggat gactcgaaag 3840
tccgaggaaa ccatcactcc ctggaacttc gaggaagtcg tggacaaggg tgcctctgca 3900
cagtccttca tcgagcgaat gaccaacttc gacaagaatc tgcccaacga gaaggttctt 3960
cccaagcatt cgctgctcta cgagtacttt acagtctaca acgaactcac caaagtcaag 4020
tacgttaccg agggaatgcg aaagcctgcc ttcttgtctg gcgaacagaa gaaagccatt 4080
gtcgatctcc tgttcaagac caaccgaaag gtcactgtta agcagctcaa ggaggactac 4140
ttcaagaaaa tcgagtgttt cgacagcgtc gagatttccg gagttgagga ccgattcaac 4200
gcctctttgg gcacctatca cgatctgctc aagattatca aggacaagga ttttctcgac 4260
aacgaggaaa acgaggacat tctggaggac atcgtgctca ctcttaccct gttcgaagat 4320
cgggagatga tcgaggaacg actcaagaca tacgctcacc tgttcgacga caaggtcatg 4380
aaacaactca agcgacgtag atacaccggc tggggaagac tttcgcgaaa gctcatcaac 4440
ggcatcagag acaagcagtc cggaaagacc attctggact ttctcaagtc cgatggcttt 4500
gccaaccgaa acttcatgca gctcattcac gacgattctc ttaccttcaa ggaggacatc 4560
cagaaggcac aagtgtccgg tcagggcgac agcttgcacg aacatattgc caacctggct 4620
ggttcgccag ccatcaagaa aggcattctc cagactgtca aggttgtcga cgagctggtg 4680
aaggtcatgg gacgtcacaa gcccgagaac attgtgatcg agatggccag agagaaccag 4740
acaactcaaa agggtcagaa aaactcgcga gagcggatga agcgaatcga ggaaggcatc 4800
aaggagctgg gatcccagat tctcaaggag catcccgtcg agaacactca actgcagaac 4860
gagaagctgt atctctacta tctgcagaat ggtcgagaca tgtacgtgga tcaggaactg 4920
gacatcaatc gtctcagcga ctacgatgtg gaccacattg tccctcaatc ctttctcaag 4980
gacgattcta tcgacaacaa ggtccttaca cgatccgaca agaacagagg caagtcggac 5040
aacgttccca gcgaagaggt ggtcaaaaag atgaagaact actggcgaca gctgctcaac 5100
gccaagctca ttacccagcg aaagttcgac aatcttacca aggccgagcg aggcggtctg 5160
tccgagctcg acaaggctgg cttcatcaag cgtcaactcg tcgagaccag acagatcaca 5220
aagcacgtcg cacagattct cgattctcgg atgaacacca agtacgacga gaacgacaag 5280
ctcatccgag aggtcaaggt gattactctc aagtccaaac tggtctccga tttccgaaag 5340
gactttcagt tctacaaggt gcgagagatc aacaattacc accatgccca cgatgcttac 5400
ctcaacgccg tcgttggcac tgcgctcatc aagaaatacc ccaagctcga aagcgagttc 5460
gtttacggcg attacaaggt ctacgacgtt cgaaagatga ttgccaagtc cgaacaggag 5520
attggcaagg ctactgccaa gtacttcttt tactccaaca tcatgaactt tttcaagacc 5580
gagatcacct tggccaacgg agagattcga aagagaccac ttatcgagac caacggcgaa 5640
actggagaga tcgtgtggga caagggtcga gactttgcaa ccgtgcgaaa ggttctgtcg 5700
atgcctcagg tcaacatcgt caagaaaacc gaggttcaga ctggcggatt ctccaaggag 5760
tcgattctgc ccaagcgaaa ctccgacaag ctcatcgctc gaaagaaaga ctgggatccc 5820
aagaaatacg gtggcttcga ttctcctacc gtcgcctatt ccgtgcttgt cgttgcgaag 5880
gtcgagaagg gcaagtccaa aaagctcaag tccgtcaagg agctgctcgg aattaccatc 5940
atggagcgat cgagcttcga gaagaatccc atcgacttct tggaagccaa gggttacaag 6000
gaggtcaaga aagacctcat tatcaagctg cccaagtact ctctgttcga actggagaac 6060
ggtcgaaagc gtatgctcgc ctccgctggc gagctgcaga agggaaacga gcttgccttg 6120
ccttcgaagt acgtcaactt tctctatctg gcttctcact acgagaagct caagggttct 6180
cccgaggaca acgaacagaa gcaactcttc gttgagcagc acaaacatta cctcgacgag 6240
attatcgagc agatttccga gttttcgaag cgagtcatcc tggctgatgc caacttggac 6300
aaggtgctct ctgcctacaa caagcatcgg gacaaaccca ttcgagaaca ggcggagaac 6360
atcattcacc tgtttactct taccaacctg ggtgctcctg cagctttcaa gtacttcgat 6420
accactatcg accgaaagcg gtacacatcc accaaggagg ttctcgatgc caccctgatt 6480
caccagtcca tcactggcct gtacgagacc cgaatcgacc tgtctcagct tggtggcgac 6540
tccagagccg atcccaagaa aaagcgaaag gtctaagcgg ccgcaagtgt ggatggggaa 6600
gtgagtgccc ggttctgtgt gcacaattgg caatccaaga tggatggatt caacacaggg 6660
atatagcgag ctacgtggtg gtgcgaggat atagcaacgg atatttatgt ttgacacttg 6720
agaatgtacg atacaagcac tgtccaagta caatactaaa catactgtac atactcatac 6780
tcgtacccgg gcaacggttt cacttgagtg cagtggctag tgctcttact cgtacagtgt 6840
gcaatactgc gtatcatagt ctttgatgta tatcgtattc attcatgtta gttgcgtacg 6900
agccggaagc ataaagtgta aagcctgggg tgcctaatga gtgagctaac tcacattaat 6960
tgcgttgcgc tcactgcccg ctttccagtc gggaaacctg tcgtgccagc tgcattaatg 7020
aatcggccaa cgcgcgggga gaggcggttt gcgtattggg cgctcttccg cttcctcgct 7080
cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc 7140
ggtaatacgg ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg 7200
ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg 7260
cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg 7320
actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac 7380
cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca 7440
tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt 7500
gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc 7560
caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag 7620
agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac 7680
tagaaggaca gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt 7740
tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa 7800
gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg 7860
gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa 7920
aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat 7980
atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc 8040
gatctgtcta tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat 8100
acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc 8160
ggctccagat ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc 8220
tgcaacttta tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag 8280
ttcgccagtt aatagtttgc gcaacgttgt tgccattgct acaggcatcg tggtgtcacg 8340
ctcgtcgttt ggtatggctt cattcagctc cggttcccaa cgatcaaggc gagttacatg 8400
atcccccatg ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg ttgtcagaag 8460
taagttggcc gcagtgttat cactcatggt tatggcagca ctgcataatt ctcttactgt 8520
catgccatcc gtaagatgct tttctgtgac tggtgagtac tcaaccaagt cattctgaga 8580
atagtgtatg cggcgaccga gttgctcttg cccggcgtca atacgggata ataccgcgcc 8640
acatagcaga actttaaaag tgctcatcat tggaaaacgt tcttcggggc gaaaactctc 8700
aaggatctta ccgctgttga gatccagttc gatgtaaccc actcgtgcac ccaactgatc 8760
ttcagcatct tttactttca ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc 8820
cgcaaaaaag ggaataaggg cgacacggaa atgttgaata ctcatactct tcctttttca 8880
atattattga agcatttatc agggttattg tctcatgagc ggatacatat ttgaatgtat 8940
ttagaaaaat aaacaaatag gggttccgcg cacatttccc cgaaaagtgc cacctgacgc 9000
gccctgtagc ggcgcattaa gcgcggcggg tgtggtggtt acgcgcagcg tgaccgctac 9060
acttgccagc gccctagcgc ccgctccttt cgctttcttc ccttcctttc tcgccacgtt 9120
cgccggcttt ccccgtcaag ctctaaatcg ggggctccct ttagggttcc gatttagtgc 9180
tttacggcac ctcgacccca aaaaacttga ttagggtgat ggttcacgta gtgggccatc 9240
gccctgatag acggtttttc gccctttgac gttggagtcc acgttcttta atagtggact 9300
cttgttccaa actggaacaa cactcaaccc tatctcggtc tattcttttg atttataagg 9360
gattttgccg atttcggcct attggttaaa aaatgagctg atttaacaaa aatttaacgc 9420
gaattttaac aaaatattaa cgcttacaat ttccattcgc cattcaggct gcgcaactgt 9480
tgggaagggc gatcggtgcg ggcctcttcg ctattacgcc agctggcgaa agggggatgt 9540
gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg 9600
acggccagtg aattgtaata cgactcacta tagggcgaat tgggtaccgg gccccccctc 9660
gaggtcgatg gtgtcgataa gcttgatatc gaattcatgt cacacaaacc gatcttcgcc 9720
tcaaggaaac ctaattctac atccgagaga ctgccgagat ccagtctaca ctgattaatt 9780
ttcgggccaa taatttaaaa aaatcgtgtt atataatatt atatgtatta tatatataca 9840
tcatgatgat actgacagtc atgtcccatt gctaaataga cagactccat ctgccgcctc 9900
caactgatgt tctcaatatt taaggggtca tctcgcattg tttaataata aacagactcc 9960
atctaccgcc tccaaatgat gttctcaaaa tatattgtat gaacttattt ttattactta 10020
gtattattag acaacttact tgctttatga aaaacacttc ctatttagga aacaatttat 10080
aatggcagtt cgttcattta acaatttatg tagaataaat gttataaatg cgtatgggaa 10140
atcttaaata tggatagcat aaatgatatc tgcattgcct aattcgaaat caacagcaac 10200
gaaaaaaatc ccttgtacaa cataaatagt catcgagaaa tatcaactat caaagaacag 10260
ctattcacac gttactattg agattattat tggacgagaa tcacacactc aactgtcttt 10320
ctctcttcta gaaatacagg tacaagtatg tactattctc attgttcata cttctagtca 10380
tttcatccca catattcctt ggatttctct ccaatgaatg acattctatc ttgcaaattc 10440
aacaattata ataagatata ccaaagtagc ggtatagtgg caatcaaaaa gcttctctgg 10500
tgtgcttctc gtatttattt ttattctaat gatccattaa aggtatatat ttatttcttg 10560
ttatataatc cttttgttta ttacatgggc tggatacata aaggtatttt gatttaattt 10620
tttgcttaaa ttcaatcccc cctcgttcag tgtcaactgt aatggtagga aattaccata 10680
cttttgaaga agcaaaaaaa atgaaagaaa aaaaaaatcg tatttccagg ttagacgttc 10740
cgcagaatct agaatgcggt atgcggtaca ttgttcttcg aacgtaaaag ttgcgctccc 10800
tgagatattg tacatttttg cttttacaag tacaagtaca tcgtacaact atgtactact 10860
gttgatgcat ccacaacagt ttgttttgtt tttttttgtt tttttttttt ctaatgattc 10920
attaccgcta tgtataccta cttgtacttg tagtaagccg ggttattggc gttcaattaa 10980
tcatagactt atgaatctgc acggtgtgcg ctgcgagtta cttttagctt atgcatgcta 11040
cttgggtgta atattgggat ctgttcggaa atcaacggat gctcaatcga taaaaaacaa 11100
aaaaaaaagc accgactcgg tgccactttt tcaagttgat aacggactag ccttatttta 11160
acttgctatt tctagc 11176
<210> 104
<211> 168
<212> RNA
<213> 人工序列
<220>
<223> Cas1-1的核酶-向导RNA
<400> 104
ggccggcaug gucccagccu ccucgcuggc gccggcuggg caacaugcuu cggcauggcg 60
aaugggacuc aaacgauuac ccacccucgu uuuagagcua gaaauagcaa guuaaaauaa 120
ggcuaguccg uuaucaacuu gaaaaagugg caccgagucg gugcuuuu 168
<210> 105
<211> 1719
<212> DNA
<213> 解脂耶氏酵母
<220>
<221> misc_feature
<222> (1)..(1719)
<223> Can1基因
<400> 105
atggaaaaga cattttcaaa cgattaccca ccctccggga ctgaggccca catccacatc 60
aaccacacgg cccactcgga tgactcagag gaggtgccct cgcacaagga aaattacaac 120
accagtggcc acgacctgga ggagtccgac ccggataacc atgtcggtga gaccctcgag 180
gtcaagcgag gtctcaagat gcgacacatc tccatgatct cgcttggagg aaccattggt 240
accggtctct tcattggtac cggaggagct ctccagcagg ccggtccctg tggcgccctc 300
gtcgcctacg tgttcatggc caccattgtc tactctgttg ccgagtctct tggagaactg 360
gctacgtaca ttcccatcac cggctccttt gccgtcttta ctacccgata tctgtcacag 420
tcgtttggtg cctccatggg ctggctatac tggttctcgt gggcgatcac cttcgccatc 480
gagctcaaca ccattggtcc cgtgattgag tactggactg acgccgttcc tactgctgcc 540
tggattgcca tcttcttcgt catcctcact accatcaact tcttccccgt gggcttctat 600
ggcgaagtcg agttctgggt ggcctccgtg aaggtcattg ccatcattgg atggctcatc 660
tacgcgctct gcatgacgtg tggagcaggt gtaacaggtc ctgtgggatt cagatactgg 720
aaccaccccg gacccatggg agacggaatc tggaccgacg gcgtgcccat tgtgcgaaac 780
gcgcccggtc gacgattcat gggatggctc aattcgctcg ttaacgccgc cttcacctac 840
cagggctgtg agctggtcgg agtcactgcc ggtgaggccc agaaccccag aaagtccgtc 900
cctcgagcca tcaaccgagt ctttgctcga atttgcatct tctacattgg ctctatcttc 960
ttcatgggca tgctcgtgcc ctttaacgac cccaagctga ccgatgactc ctccgtcatc 1020
gcctcctctc cttttgttat tgccattatc aactctggca ccaaggtgct ccctcacatt 1080
ttcaacgccg tcattctcat caccctgatt tcggcaggaa actccaacgt ctacattggc 1140
tcgcgagtgg tctacgccct ggctgactcc ggaaccgcac caaagttctt caagcgaacc 1200
accaagaagg gagtgccgta cgtggcagtc tgcttcacct cggcgtttgg tctgctggcc 1260
ttcatgtctg tgtccgagtc gtcgtccact gtcttcgact ggttcatcaa catctccgct 1320
gtggccggcc tcatctgttg ggccttcatc tctgcctccc acatccgatt catgcaagtg 1380
cttaagcaca gagggatctc cagagatacg ctgcccttca aggcacgatg gcagccattc 1440
tactcatggt acgcgctcgt ctccatcatc ttcatcactc tcatccaggg cttcacgtcc 1500
ttctggcact ttaccgccgc caagttcatg actgcataca tctccgtcat tgtctgggtc 1560
ggtttgtaca ttatcttcca gtgtctgttc cgatgcaagt tccttatccc tattgaggat 1620
gtggacattg acaccggccg acgagagatt gacgacgatg tgtgggagga gaagatcccc 1680
acaaagtggt acgagaagtt ttggaatatt attgcataa 1719
<210> 106
<211> 23
<212> DNA
<213> 解脂耶氏酵母
<220>
<221> misc_feature
<222> (1)..(23)
<223> Can1-2靶位点和PAM
<400> 106
ggcccactcg gatgactcag agg 23
<210> 107
<211> 27
<212> DNA
<213> 解脂耶氏酵母
<220>
<221> misc_feature
<222> (1)..(17)
<223> Sou2-1靶位点和PAM
<400> 107
gtctggacct tccaccctcg ccacggg 27
<210> 108
<211> 25
<212> DNA
<213> 解脂耶氏酵母
<220>
<221> misc_feature
<222> (1)..(25)
<223> Sou2-2靶位点和PAM
<400> 108
gcagtcccgt ggcgagggtg gaagg 25
<210> 109
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> Can1-2的可变靶向结构域
<400> 109
ggcccacucg gaugacucag 20
<210> 110
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> Sou2-1的可变靶向结构域
<400> 110
gucuggaccu uccacccucg ccac 24
<210> 111
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> Sou2-2的可变靶向结构域
<400> 111
gcagucccgu ggcgagggug ga 22
<210> 112
<211> 23
<212> DNA
<213> 解脂耶氏酵母
<400> 112
cagctcgaga cgtcctagaa cgg 23
<210> 113
<211> 23
<212> DNA
<213> 解脂耶氏酵母
<400> 113
ttcctctgtc acagacgttt cgg 23
<210> 114
<211> 23
<212> DNA
<213> 解脂耶氏酵母
<400> 114
gaaaagtgcg ttttgattct cgg 23
<210> 115
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> ura3-1的可变靶向结构域
<400> 115
gccgcucgag ugcucaagc 19
<210> 116
<211> 22
<212> DNA
<213> 解脂耶氏酵母
<220>
<221> misc_feature
<222> (1)..(22)
<223> URa3-1靶位点和PAM
<400> 116
gccgctcgag tgctcaagct cg 22
<210> 117
<211> 1379
<212> PRT
<213> 人工序列
<220>
<223> Cas9-SV40 NLS D10A H840A
<400> 117
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
Ser Arg Ala Asp Pro Lys Lys Lys Arg Lys Val
1370 1375
<210> 118
<211> 41
<212> DNA
<213> 人工序列
<220>
<223> D10AF
<400> 118
gaaatactcc atcggcctgg ccattggaac caactctgtc g 41
<210> 119
<211> 41
<212> DNA
<213> 人工序列
<220>
<223> D10AR
<400> 119
cgacagagtt ggttccaatg gccaggccga tggagtattt c 41
<210> 120
<211> 4140
<212> DNA
<213> 人工序列
<220>
<223> 经耶氏酵母优化的Cas9 D10A
<400> 120
atggacaaga aatactccat cggcctggcc attggaacca actctgtcgg ctgggctgtc 60
atcaccgacg agtacaaggt gccctccaag aaattcaagg tcctcggaaa caccgatcga 120
cactccatca agaaaaacct cattggtgcc ctgttgttcg attctggcga gactgccgaa 180
gctaccagac tcaagcgaac tgctcggcga cgttacaccc gacggaagaa ccgaatctgc 240
tacctgcagg agatcttttc caacgagatg gccaaggtgg acgattcgtt ctttcatcga 300
ctggaggaat ccttcctcgt cgaggaagac aagaaacacg agcgtcatcc catctttggc 360
aacattgtgg acgaggttgc ttaccacgag aagtatccta ccatctacca cctgcgaaag 420
aaactcgtcg attccaccga caaggcggat ctcagactta tctacctcgc tctggcacac 480
atgatcaagt ttcgaggtca tttcctcatc gagggcgatc tcaatcccga caacagcgat 540
gtggacaagc tgttcattca gctcgttcag acctacaacc agctgttcga ggaaaacccc 600
atcaatgcct ccggagtcga tgcaaaggcc atcttgtctg ctcgactctc gaagagcaga 660
cgactggaga acctcattgc ccaacttcct ggcgagaaaa agaacggact gtttggcaac 720
ctcattgccc tttctcttgg tctcacaccc aacttcaagt ccaacttcga tctggcggag 780
gacgccaagc tccagctgtc caaggacacc tacgacgatg acctcgacaa cctgcttgca 840
cagattggcg atcagtacgc cgacctgttt ctcgctgcca agaacctttc ggatgctatt 900
ctcttgtctg acattctgcg agtcaacacc gagatcacaa aggctcccct ttctgcctcc 960
atgatcaagc gatacgacga gcaccatcag gatctcacac tgctcaaggc tcttgtccga 1020
cagcaactgc ccgagaagta caaggagatc tttttcgatc agtcgaagaa cggctacgct 1080
ggatacatcg acggcggagc ctctcaggaa gagttctaca agttcatcaa gccaattctc 1140
gagaagatgg acggaaccga ggaactgctt gtcaagctca atcgagagga tctgcttcgg 1200
aagcaacgaa ccttcgacaa cggcagcatt cctcatcaga tccacctcgg tgagctgcac 1260
gccattcttc gacgtcagga agacttctac ccctttctca aggacaaccg agagaagatc 1320
gagaagattc ttacctttcg aatcccctac tatgttggtc ctcttgccag aggaaactct 1380
cgatttgctt ggatgactcg aaagtccgag gaaaccatca ctccctggaa cttcgaggaa 1440
gtcgtggaca agggtgcctc tgcacagtcc ttcatcgagc gaatgaccaa cttcgacaag 1500
aatctgccca acgagaaggt tcttcccaag cattcgctgc tctacgagta ctttacagtc 1560
tacaacgaac tcaccaaagt caagtacgtt accgagggaa tgcgaaagcc tgccttcttg 1620
tctggcgaac agaagaaagc cattgtcgat ctcctgttca agaccaaccg aaaggtcact 1680
gttaagcagc tcaaggagga ctacttcaag aaaatcgagt gtttcgacag cgtcgagatt 1740
tccggagttg aggaccgatt caacgcctct ttgggcacct atcacgatct gctcaagatt 1800
atcaaggaca aggattttct cgacaacgag gaaaacgagg acattctgga ggacatcgtg 1860
ctcactctta ccctgttcga agatcgggag atgatcgagg aacgactcaa gacatacgct 1920
cacctgttcg acgacaaggt catgaaacaa ctcaagcgac gtagatacac cggctgggga 1980
agactttcgc gaaagctcat caacggcatc agagacaagc agtccggaaa gaccattctg 2040
gactttctca agtccgatgg ctttgccaac cgaaacttca tgcagctcat tcacgacgat 2100
tctcttacct tcaaggagga catccagaag gcacaagtgt ccggtcaggg cgacagcttg 2160
cacgaacata ttgccaacct ggctggttcg ccagccatca agaaaggcat tctccagact 2220
gtcaaggttg tcgacgagct ggtgaaggtc atgggacgtc acaagcccga gaacattgtg 2280
atcgagatgg ccagagagaa ccagacaact caaaagggtc agaaaaactc gcgagagcgg 2340
atgaagcgaa tcgaggaagg catcaaggag ctgggatccc agattctcaa ggagcatccc 2400
gtcgagaaca ctcaactgca gaacgagaag ctgtatctct actatctgca gaatggtcga 2460
gacatgtacg tggatcagga actggacatc aatcgtctca gcgactacga tgtggaccac 2520
attgtccctc aatcctttct caaggacgat tctatcgaca acaaggtcct tacacgatcc 2580
gacaagaaca gaggcaagtc ggacaacgtt cccagcgaag aggtggtcaa aaagatgaag 2640
aactactggc gacagctgct caacgccaag ctcattaccc agcgaaagtt cgacaatctt 2700
accaaggccg agcgaggcgg tctgtccgag ctcgacaagg ctggcttcat caagcgtcaa 2760
ctcgtcgaga ccagacagat cacaaagcac gtcgcacaga ttctcgattc tcggatgaac 2820
accaagtacg acgagaacga caagctcatc cgagaggtca aggtgattac tctcaagtcc 2880
aaactggtct ccgatttccg aaaggacttt cagttctaca aggtgcgaga gatcaacaat 2940
taccaccatg cccacgatgc ttacctcaac gccgtcgttg gcactgcgct catcaagaaa 3000
taccccaagc tcgaaagcga gttcgtttac ggcgattaca aggtctacga cgttcgaaag 3060
atgattgcca agtccgaaca ggagattggc aaggctactg ccaagtactt cttttactcc 3120
aacatcatga actttttcaa gaccgagatc accttggcca acggagagat tcgaaagaga 3180
ccacttatcg agaccaacgg cgaaactgga gagatcgtgt gggacaaggg tcgagacttt 3240
gcaaccgtgc gaaaggttct gtcgatgcct caggtcaaca tcgtcaagaa aaccgaggtt 3300
cagactggcg gattctccaa ggagtcgatt ctgcccaagc gaaactccga caagctcatc 3360
gctcgaaaga aagactggga tcccaagaaa tacggtggct tcgattctcc taccgtcgcc 3420
tattccgtgc ttgtcgttgc gaaggtcgag aagggcaagt ccaaaaagct caagtccgtc 3480
aaggagctgc tcggaattac catcatggag cgatcgagct tcgagaagaa tcccatcgac 3540
ttcttggaag ccaagggtta caaggaggtc aagaaagacc tcattatcaa gctgcccaag 3600
tactctctgt tcgaactgga gaacggtcga aagcgtatgc tcgcctccgc tggcgagctg 3660
cagaagggaa acgagcttgc cttgccttcg aagtacgtca actttctcta tctggcttct 3720
cactacgaga agctcaaggg ttctcccgag gacaacgaac agaagcaact cttcgttgag 3780
cagcacaaac attacctcga cgagattatc gagcagattt ccgagttttc gaagcgagtc 3840
atcctggctg atgccaactt ggacaaggtg ctctctgcct acaacaagca tcgggacaaa 3900
cccattcgag aacaggcgga gaacatcatt cacctgttta ctcttaccaa cctgggtgct 3960
cctgcagctt tcaagtactt cgataccact atcgaccgaa agcggtacac atccaccaag 4020
gaggttctcg atgccaccct gattcaccag tccatcactg gcctgtacga gacccgaatc 4080
gacctgtctc agcttggtgg cgactccaga gccgatccca agaaaaagcg aaaggtctaa 4140
<210> 121
<211> 10706
<212> DNA
<213> 人工序列
<220>
<223> pRF111
<400> 121
catggacaag aaatactcca tcggcctggc cattggaacc aactctgtcg gctgggctgt 60
catcaccgac gagtacaagg tgccctccaa gaaattcaag gtcctcggaa acaccgatcg 120
acactccatc aagaaaaacc tcattggtgc cctgttgttc gattctggcg agactgccga 180
agctaccaga ctcaagcgaa ctgctcggcg acgttacacc cgacggaaga accgaatctg 240
ctacctgcag gagatctttt ccaacgagat ggccaaggtg gacgattcgt tctttcatcg 300
actggaggaa tccttcctcg tcgaggaaga caagaaacac gagcgtcatc ccatctttgg 360
caacattgtg gacgaggttg cttaccacga gaagtatcct accatctacc acctgcgaaa 420
gaaactcgtc gattccaccg acaaggcgga tctcagactt atctacctcg ctctggcaca 480
catgatcaag tttcgaggtc atttcctcat cgagggcgat ctcaatcccg acaacagcga 540
tgtggacaag ctgttcattc agctcgttca gacctacaac cagctgttcg aggaaaaccc 600
catcaatgcc tccggagtcg atgcaaaggc catcttgtct gctcgactct cgaagagcag 660
acgactggag aacctcattg cccaacttcc tggcgagaaa aagaacggac tgtttggcaa 720
cctcattgcc ctttctcttg gtctcacacc caacttcaag tccaacttcg atctggcgga 780
ggacgccaag ctccagctgt ccaaggacac ctacgacgat gacctcgaca acctgcttgc 840
acagattggc gatcagtacg ccgacctgtt tctcgctgcc aagaaccttt cggatgctat 900
tctcttgtct gacattctgc gagtcaacac cgagatcaca aaggctcccc tttctgcctc 960
catgatcaag cgatacgacg agcaccatca ggatctcaca ctgctcaagg ctcttgtccg 1020
acagcaactg cccgagaagt acaaggagat ctttttcgat cagtcgaaga acggctacgc 1080
tggatacatc gacggcggag cctctcagga agagttctac aagttcatca agccaattct 1140
cgagaagatg gacggaaccg aggaactgct tgtcaagctc aatcgagagg atctgcttcg 1200
gaagcaacga accttcgaca acggcagcat tcctcatcag atccacctcg gtgagctgca 1260
cgccattctt cgacgtcagg aagacttcta cccctttctc aaggacaacc gagagaagat 1320
cgagaagatt cttacctttc gaatccccta ctatgttggt cctcttgcca gaggaaactc 1380
tcgatttgct tggatgactc gaaagtccga ggaaaccatc actccctgga acttcgagga 1440
agtcgtggac aagggtgcct ctgcacagtc cttcatcgag cgaatgacca acttcgacaa 1500
gaatctgccc aacgagaagg ttcttcccaa gcattcgctg ctctacgagt actttacagt 1560
ctacaacgaa ctcaccaaag tcaagtacgt taccgaggga atgcgaaagc ctgccttctt 1620
gtctggcgaa cagaagaaag ccattgtcga tctcctgttc aagaccaacc gaaaggtcac 1680
tgttaagcag ctcaaggagg actacttcaa gaaaatcgag tgtttcgaca gcgtcgagat 1740
ttccggagtt gaggaccgat tcaacgcctc tttgggcacc tatcacgatc tgctcaagat 1800
tatcaaggac aaggattttc tcgacaacga ggaaaacgag gacattctgg aggacatcgt 1860
gctcactctt accctgttcg aagatcggga gatgatcgag gaacgactca agacatacgc 1920
tcacctgttc gacgacaagg tcatgaaaca actcaagcga cgtagataca ccggctgggg 1980
aagactttcg cgaaagctca tcaacggcat cagagacaag cagtccggaa agaccattct 2040
ggactttctc aagtccgatg gctttgccaa ccgaaacttc atgcagctca ttcacgacga 2100
ttctcttacc ttcaaggagg acatccagaa ggcacaagtg tccggtcagg gcgacagctt 2160
gcacgaacat attgccaacc tggctggttc gccagccatc aagaaaggca ttctccagac 2220
tgtcaaggtt gtcgacgagc tggtgaaggt catgggacgt cacaagcccg agaacattgt 2280
gatcgagatg gccagagaga accagacaac tcaaaagggt cagaaaaact cgcgagagcg 2340
gatgaagcga atcgaggaag gcatcaagga gctgggatcc cagattctca aggagcatcc 2400
cgtcgagaac actcaactgc agaacgagaa gctgtatctc tactatctgc agaatggtcg 2460
agacatgtac gtggatcagg aactggacat caatcgtctc agcgactacg atgtggacca 2520
cattgtccct caatcctttc tcaaggacga ttctatcgac aacaaggtcc ttacacgatc 2580
cgacaagaac agaggcaagt cggacaacgt tcccagcgaa gaggtggtca aaaagatgaa 2640
gaactactgg cgacagctgc tcaacgccaa gctcattacc cagcgaaagt tcgacaatct 2700
taccaaggcc gagcgaggcg gtctgtccga gctcgacaag gctggcttca tcaagcgtca 2760
actcgtcgag accagacaga tcacaaagca cgtcgcacag attctcgatt ctcggatgaa 2820
caccaagtac gacgagaacg acaagctcat ccgagaggtc aaggtgatta ctctcaagtc 2880
caaactggtc tccgatttcc gaaaggactt tcagttctac aaggtgcgag agatcaacaa 2940
ttaccaccat gcccacgatg cttacctcaa cgccgtcgtt ggcactgcgc tcatcaagaa 3000
ataccccaag ctcgaaagcg agttcgttta cggcgattac aaggtctacg acgttcgaaa 3060
gatgattgcc aagtccgaac aggagattgg caaggctact gccaagtact tcttttactc 3120
caacatcatg aactttttca agaccgagat caccttggcc aacggagaga ttcgaaagag 3180
accacttatc gagaccaacg gcgaaactgg agagatcgtg tgggacaagg gtcgagactt 3240
tgcaaccgtg cgaaaggttc tgtcgatgcc tcaggtcaac atcgtcaaga aaaccgaggt 3300
tcagactggc ggattctcca aggagtcgat tctgcccaag cgaaactccg acaagctcat 3360
cgctcgaaag aaagactggg atcccaagaa atacggtggc ttcgattctc ctaccgtcgc 3420
ctattccgtg cttgtcgttg cgaaggtcga gaagggcaag tccaaaaagc tcaagtccgt 3480
caaggagctg ctcggaatta ccatcatgga gcgatcgagc ttcgagaaga atcccatcga 3540
cttcttggaa gccaagggtt acaaggaggt caagaaagac ctcattatca agctgcccaa 3600
gtactctctg ttcgaactgg agaacggtcg aaagcgtatg ctcgcctccg ctggcgagct 3660
gcagaaggga aacgagcttg ccttgccttc gaagtacgtc aactttctct atctggcttc 3720
tcactacgag aagctcaagg gttctcccga ggacaacgaa cagaagcaac tcttcgttga 3780
gcagcacaaa cattacctcg acgagattat cgagcagatt tccgagtttt cgaagcgagt 3840
catcctggct gatgccaact tggacaaggt gctctctgcc tacaacaagc atcgggacaa 3900
acccattcga gaacaggcgg agaacatcat tcacctgttt actcttacca acctgggtgc 3960
tcctgcagct ttcaagtact tcgataccac tatcgaccga aagcggtaca catccaccaa 4020
ggaggttctc gatgccaccc tgattcacca gtccatcact ggcctgtacg agacccgaat 4080
cgacctgtct cagcttggtg gcgactccag agccgatccc aagaaaaagc gaaaggtcta 4140
agcggccgca agtgtggatg gggaagtgag tgcccggttc tgtgtgcaca attggcaatc 4200
caagatggat ggattcaaca cagggatata gcgagctacg tggtggtgcg aggatatagc 4260
aacggatatt tatgtttgac acttgagaat gtacgataca agcactgtcc aagtacaata 4320
ctaaacatac tgtacatact catactcgta cccgggcaac ggtttcactt gagtgcagtg 4380
gctagtgctc ttactcgtac agtgtgcaat actgcgtatc atagtctttg atgtatatcg 4440
tattcattca tgttagttgc gtacgagccg gaagcataaa gtgtaaagcc tggggtgcct 4500
aatgagtgag ctaactcaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa 4560
acctgtcgtg ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta 4620
ttgggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc 4680
gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg 4740
caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt 4800
tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa 4860
gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct 4920
ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc 4980
cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg 5040
tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct 5100
tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag 5160
cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga 5220
agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc gctctgctga 5280
agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg 5340
gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag 5400
aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag 5460
ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat 5520
gaagttttaa atcaatctaa agtatatatg agtaaacttg gtctgacagt taccaatgct 5580
taatcagtga ggcacctatc tcagcgatct gtctatttcg ttcatccata gttgcctgac 5640
tccccgtcgt gtagataact acgatacggg agggcttacc atctggcccc agtgctgcaa 5700
tgataccgcg agacccacgc tcaccggctc cagatttatc agcaataaac cagccagccg 5760
gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag tctattaatt 5820
gttgccggga agctagagta agtagttcgc cagttaatag tttgcgcaac gttgttgcca 5880
ttgctacagg catcgtggtg tcacgctcgt cgtttggtat ggcttcattc agctccggtt 5940
cccaacgatc aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg gttagctcct 6000
tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt gttatcactc atggttatgg 6060
cagcactgca taattctctt actgtcatgc catccgtaag atgcttttct gtgactggtg 6120
agtactcaac caagtcattc tgagaatagt gtatgcggcg accgagttgc tcttgcccgg 6180
cgtcaatacg ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa 6240
aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt 6300
aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt 6360
gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt 6420
gaatactcat actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca 6480
tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 6540
ttccccgaaa agtgccacct gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg 6600
tggttacgcg cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt 6660
tcttcccttc ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc 6720
tccctttagg gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg 6780
gtgatggttc acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg 6840
agtccacgtt ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct 6900
cggtctattc ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg 6960
agctgattta acaaaaattt aacgcgaatt ttaacaaaat attaacgctt acaatttcca 7020
ttcgccattc aggctgcgca actgttggga agggcgatcg gtgcgggcct cttcgctatt 7080
acgccagctg gcgaaagggg gatgtgctgc aaggcgatta agttgggtaa cgccagggtt 7140
ttcccagtca cgacgttgta aaacgacggc cagtgaattg taatacgact cactataggg 7200
cgaattgggt accgggcccc ccctcgaggt cgatggtgtc gataagcttg atatcgaatt 7260
catgtcacac aaaccgatct tcgcctcaag gaaacctaat tctacatccg agagactgcc 7320
gagatccagt ctacactgat taattttcgg gccaataatt taaaaaaatc gtgttatata 7380
atattatatg tattatatat atacatcatg atgatactga cagtcatgtc ccattgctaa 7440
atagacagac tccatctgcc gcctccaact gatgttctca atatttaagg ggtcatctcg 7500
cattgtttaa taataaacag actccatcta ccgcctccaa atgatgttct caaaatatat 7560
tgtatgaact tatttttatt acttagtatt attagacaac ttacttgctt tatgaaaaac 7620
acttcctatt taggaaacaa tttataatgg cagttcgttc atttaacaat ttatgtagaa 7680
taaatgttat aaatgcgtat gggaaatctt aaatatggat agcataaatg atatctgcat 7740
tgcctaattc gaaatcaaca gcaacgaaaa aaatcccttg tacaacataa atagtcatcg 7800
agaaatatca actatcaaag aacagctatt cacacgttac tattgagatt attattggac 7860
gagaatcaca cactcaactg tctttctctc ttctagaaat acaggtacaa gtatgtacta 7920
ttctcattgt tcatacttct agtcatttca tcccacatat tccttggatt tctctccaat 7980
gaatgacatt ctatcttgca aattcaacaa ttataataag atataccaaa gtagcggtat 8040
agtggcaatc aaaaagcttc tctggtgtgc ttctcgtatt tatttttatt ctaatgatcc 8100
attaaaggta tatatttatt tcttgttata taatcctttt gtttattaca tgggctggat 8160
acataaaggt attttgattt aattttttgc ttaaattcaa tcccccctcg ttcagtgtca 8220
actgtaatgg taggaaatta ccatactttt gaagaagcaa aaaaaatgaa agaaaaaaaa 8280
aatcgtattt ccaggttaga cgttccgcag aatctagaat gcggtatgcg gtacattgtt 8340
cttcgaacgt aaaagttgcg ctccctgaga tattgtacat ttttgctttt acaagtacaa 8400
gtacatcgta caactatgta ctactgttga tgcatccaca acagtttgtt ttgttttttt 8460
ttgttttttt tttttctaat gattcattac cgctatgtat acctacttgt acttgtagta 8520
agccgggtta ttggcgttca attaatcata gacttatgaa tctgcacggt gtgcgctgcg 8580
agttactttt agcttatgca tgctacttgg gtgtaatatt gggatctgtt cggaaatcaa 8640
cggatgctca atcgatttcg acagtaatta attaagtcat acacaagtca gctttcttcg 8700
agcctcatat aagtataagt agttcaacgt attagcactg tacccagcat ctccgtatcg 8760
agaaacacaa caacatgccc cattggacag atcatgcgga tacacaggtt gtgcagtatc 8820
atacatactc gatcagacag gtcgtctgac catcatacaa gctgaacaag cgctccatac 8880
ttgcacgctc tctatataca cagttaaatt acatatccat agtctaacct ctaacagtta 8940
atcttctggt aagcctccca gccagccttc tggtatcgct tggcctcctc aataggatct 9000
cggttctggc cgtacagacc tcggccgaca attatgatat ccgttccggt agacatgaca 9060
tcctcaacag ttcggtactg ctgtccgaga gcgtctccct tgtcgtcaag acccaccccg 9120
ggggtcagaa taagccagtc ctcagagtcg cccttaggtc ggttctgggc aatgaagcca 9180
accacaaact cggggtcgga tcgggcaagc tcaatggtct gcttggagta ctcgccagtg 9240
gccagagagc ccttgcaaga cagctcggcc agcatgagca gacctctggc cagcttctcg 9300
ttgggagagg ggactaggaa ctccttgtac tgggagttct cgtagtcaga gacgtcctcc 9360
ttcttctgtt cagagacagt ttcctcggca ccagctcgca ggccagcaat gattccggtt 9420
ccgggtacac cgtgggcgtt ggtgatatcg gaccactcgg cgattcggtg acaccggtac 9480
tggtgcttga cagtgttgcc aatatctgcg aactttctgt cctcgaacag gaagaaaccg 9540
tgcttaagag caagttcctt gagggggagc acagtgccgg cgtaggtgaa gtcgtcaatg 9600
atgtcgatat gggttttgat catgcacaca taaggtccga ccttatcggc aagctcaatg 9660
agctccttgg tggtggtaac atccagagaa gcacacaggt tggttttctt ggctgccacg 9720
agcttgagca ctcgagcggc aaaggcggac ttgtggacgt tagctcgagc ttcgtaggag 9780
ggcattttgg tggtgaagag gagactgaaa taaatttagt ctgcagaact ttttatcgga 9840
accttatctg gggcagtgaa gtatatgtta tggtaatagt tacgagttag ttgaacttat 9900
agatagactg gactatacgg ctatcggtcc aaattagaaa gaacgtcaat ggctctctgg 9960
gcgtcgcctt tgccgacaaa aatgtgatca tgatgaaagc cagcaatgac gttgcagctg 10020
atattgttgt cggccaaccg cgccgaaaac gcagctgtca gacccacagc ctccaacgaa 10080
gaatgtatcg tcaaagtgat ccaagcacac tcatagttgg agtcgtactc caaaggcggc 10140
aatgacgagt cagacagata ctcgtcgacg tttaaaccat catctaaggg cctcaaaact 10200
acctcggaac tgctgcgctg atctggacac cacagaggtt ccgagcactt taggttgcac 10260
caaatgtccc accaggtgca ggcagaaaac gctggaacag cgtgtacagt ttgtcttaac 10320
aaaaagtgag ggcgctgagg tcgagcaggg tggtgtgact tgttatagcc tttagagctg 10380
cgaaagcgcg tatggatttg gctcatcagg ccagattgag ggtctgtgga cacatgtcat 10440
gttagtgtac ttcaatcgcc ccctggatat agccccgaca ataggccgtg gcctcatttt 10500
tttgccttcc gcacatttcc attgctcggt acccacacct tgcttctcct gcacttgcca 10560
accttaatac tggtttacat tgaccaacat cttacaagcg gggggcttgt ctagggtata 10620
tataaacagt ggctctccca atcggttgcc agtctctttt ttcctttctt tccccacaga 10680
ttcgaaatct aaactacaca tcacac 10706
<210> 122
<211> 43
<212> DNA
<213> 人工序列
<220>
<223> H840A1
<400> 122
tcagcgacta cgatgtggac gccattgtcc ctcaatcctt tct 43
<210> 123
<211> 43
<212> DNA
<213> 人工序列
<220>
<223> H840A2
<400> 123
agaaaggatt gagggacaat ggcgtccaca tcgtagtcgc tga 43
<210> 124
<211> 4140
<212> DNA
<213> 人工序列
<220>
<223> 经耶氏酵母密码子优化的失活的Cas9
<400> 124
atggacaaga aatactccat cggcctggcc attggaacca actctgtcgg ctgggctgtc 60
atcaccgacg agtacaaggt gccctccaag aaattcaagg tcctcggaaa caccgatcga 120
cactccatca agaaaaacct cattggtgcc ctgttgttcg attctggcga gactgccgaa 180
gctaccagac tcaagcgaac tgctcggcga cgttacaccc gacggaagaa ccgaatctgc 240
tacctgcagg agatcttttc caacgagatg gccaaggtgg acgattcgtt ctttcatcga 300
ctggaggaat ccttcctcgt cgaggaagac aagaaacacg agcgtcatcc catctttggc 360
aacattgtgg acgaggttgc ttaccacgag aagtatccta ccatctacca cctgcgaaag 420
aaactcgtcg attccaccga caaggcggat ctcagactta tctacctcgc tctggcacac 480
atgatcaagt ttcgaggtca tttcctcatc gagggcgatc tcaatcccga caacagcgat 540
gtggacaagc tgttcattca gctcgttcag acctacaacc agctgttcga ggaaaacccc 600
atcaatgcct ccggagtcga tgcaaaggcc atcttgtctg ctcgactctc gaagagcaga 660
cgactggaga acctcattgc ccaacttcct ggcgagaaaa agaacggact gtttggcaac 720
ctcattgccc tttctcttgg tctcacaccc aacttcaagt ccaacttcga tctggcggag 780
gacgccaagc tccagctgtc caaggacacc tacgacgatg acctcgacaa cctgcttgca 840
cagattggcg atcagtacgc cgacctgttt ctcgctgcca agaacctttc ggatgctatt 900
ctcttgtctg acattctgcg agtcaacacc gagatcacaa aggctcccct ttctgcctcc 960
atgatcaagc gatacgacga gcaccatcag gatctcacac tgctcaaggc tcttgtccga 1020
cagcaactgc ccgagaagta caaggagatc tttttcgatc agtcgaagaa cggctacgct 1080
ggatacatcg acggcggagc ctctcaggaa gagttctaca agttcatcaa gccaattctc 1140
gagaagatgg acggaaccga ggaactgctt gtcaagctca atcgagagga tctgcttcgg 1200
aagcaacgaa ccttcgacaa cggcagcatt cctcatcaga tccacctcgg tgagctgcac 1260
gccattcttc gacgtcagga agacttctac ccctttctca aggacaaccg agagaagatc 1320
gagaagattc ttacctttcg aatcccctac tatgttggtc ctcttgccag aggaaactct 1380
cgatttgctt ggatgactcg aaagtccgag gaaaccatca ctccctggaa cttcgaggaa 1440
gtcgtggaca agggtgcctc tgcacagtcc ttcatcgagc gaatgaccaa cttcgacaag 1500
aatctgccca acgagaaggt tcttcccaag cattcgctgc tctacgagta ctttacagtc 1560
tacaacgaac tcaccaaagt caagtacgtt accgagggaa tgcgaaagcc tgccttcttg 1620
tctggcgaac agaagaaagc cattgtcgat ctcctgttca agaccaaccg aaaggtcact 1680
gttaagcagc tcaaggagga ctacttcaag aaaatcgagt gtttcgacag cgtcgagatt 1740
tccggagttg aggaccgatt caacgcctct ttgggcacct atcacgatct gctcaagatt 1800
atcaaggaca aggattttct cgacaacgag gaaaacgagg acattctgga ggacatcgtg 1860
ctcactctta ccctgttcga agatcgggag atgatcgagg aacgactcaa gacatacgct 1920
cacctgttcg acgacaaggt catgaaacaa ctcaagcgac gtagatacac cggctgggga 1980
agactttcgc gaaagctcat caacggcatc agagacaagc agtccggaaa gaccattctg 2040
gactttctca agtccgatgg ctttgccaac cgaaacttca tgcagctcat tcacgacgat 2100
tctcttacct tcaaggagga catccagaag gcacaagtgt ccggtcaggg cgacagcttg 2160
cacgaacata ttgccaacct ggctggttcg ccagccatca agaaaggcat tctccagact 2220
gtcaaggttg tcgacgagct ggtgaaggtc atgggacgtc acaagcccga gaacattgtg 2280
atcgagatgg ccagagagaa ccagacaact caaaagggtc agaaaaactc gcgagagcgg 2340
atgaagcgaa tcgaggaagg catcaaggag ctgggatccc agattctcaa ggagcatccc 2400
gtcgagaaca ctcaactgca gaacgagaag ctgtatctct actatctgca gaatggtcga 2460
gacatgtacg tggatcagga actggacatc aatcgtctca gcgactacga tgtggacgcc 2520
attgtccctc aatcctttct caaggacgat tctatcgaca acaaggtcct tacacgatcc 2580
gacaagaaca gaggcaagtc ggacaacgtt cccagcgaag aggtggtcaa aaagatgaag 2640
aactactggc gacagctgct caacgccaag ctcattaccc agcgaaagtt cgacaatctt 2700
accaaggccg agcgaggcgg tctgtccgag ctcgacaagg ctggcttcat caagcgtcaa 2760
ctcgtcgaga ccagacagat cacaaagcac gtcgcacaga ttctcgattc tcggatgaac 2820
accaagtacg acgagaacga caagctcatc cgagaggtca aggtgattac tctcaagtcc 2880
aaactggtct ccgatttccg aaaggacttt cagttctaca aggtgcgaga gatcaacaat 2940
taccaccatg cccacgatgc ttacctcaac gccgtcgttg gcactgcgct catcaagaaa 3000
taccccaagc tcgaaagcga gttcgtttac ggcgattaca aggtctacga cgttcgaaag 3060
atgattgcca agtccgaaca ggagattggc aaggctactg ccaagtactt cttttactcc 3120
aacatcatga actttttcaa gaccgagatc accttggcca acggagagat tcgaaagaga 3180
ccacttatcg agaccaacgg cgaaactgga gagatcgtgt gggacaaggg tcgagacttt 3240
gcaaccgtgc gaaaggttct gtcgatgcct caggtcaaca tcgtcaagaa aaccgaggtt 3300
cagactggcg gattctccaa ggagtcgatt ctgcccaagc gaaactccga caagctcatc 3360
gctcgaaaga aagactggga tcccaagaaa tacggtggct tcgattctcc taccgtcgcc 3420
tattccgtgc ttgtcgttgc gaaggtcgag aagggcaagt ccaaaaagct caagtccgtc 3480
aaggagctgc tcggaattac catcatggag cgatcgagct tcgagaagaa tcccatcgac 3540
ttcttggaag ccaagggtta caaggaggtc aagaaagacc tcattatcaa gctgcccaag 3600
tactctctgt tcgaactgga gaacggtcga aagcgtatgc tcgcctccgc tggcgagctg 3660
cagaagggaa acgagcttgc cttgccttcg aagtacgtca actttctcta tctggcttct 3720
cactacgaga agctcaaggg ttctcccgag gacaacgaac agaagcaact cttcgttgag 3780
cagcacaaac attacctcga cgagattatc gagcagattt ccgagttttc gaagcgagtc 3840
atcctggctg atgccaactt ggacaaggtg ctctctgcct acaacaagca tcgggacaaa 3900
cccattcgag aacaggcgga gaacatcatt cacctgttta ctcttaccaa cctgggtgct 3960
cctgcagctt tcaagtactt cgataccact atcgaccgaa agcggtacac atccaccaag 4020
gaggttctcg atgccaccct gattcaccag tccatcactg gcctgtacga gacccgaatc 4080
gacctgtctc agcttggtgg cgactccaga gccgatccca agaaaaagcg aaaggtctaa 4140
<210> 125
<211> 10706
<212> DNA
<213> 人工序列
<220>
<223> pRF143
<400> 125
catggacaag aaatactcca tcggcctggc cattggaacc aactctgtcg gctgggctgt 60
catcaccgac gagtacaagg tgccctccaa gaaattcaag gtcctcggaa acaccgatcg 120
acactccatc aagaaaaacc tcattggtgc cctgttgttc gattctggcg agactgccga 180
agctaccaga ctcaagcgaa ctgctcggcg acgttacacc cgacggaaga accgaatctg 240
ctacctgcag gagatctttt ccaacgagat ggccaaggtg gacgattcgt tctttcatcg 300
actggaggaa tccttcctcg tcgaggaaga caagaaacac gagcgtcatc ccatctttgg 360
caacattgtg gacgaggttg cttaccacga gaagtatcct accatctacc acctgcgaaa 420
gaaactcgtc gattccaccg acaaggcgga tctcagactt atctacctcg ctctggcaca 480
catgatcaag tttcgaggtc atttcctcat cgagggcgat ctcaatcccg acaacagcga 540
tgtggacaag ctgttcattc agctcgttca gacctacaac cagctgttcg aggaaaaccc 600
catcaatgcc tccggagtcg atgcaaaggc catcttgtct gctcgactct cgaagagcag 660
acgactggag aacctcattg cccaacttcc tggcgagaaa aagaacggac tgtttggcaa 720
cctcattgcc ctttctcttg gtctcacacc caacttcaag tccaacttcg atctggcgga 780
ggacgccaag ctccagctgt ccaaggacac ctacgacgat gacctcgaca acctgcttgc 840
acagattggc gatcagtacg ccgacctgtt tctcgctgcc aagaaccttt cggatgctat 900
tctcttgtct gacattctgc gagtcaacac cgagatcaca aaggctcccc tttctgcctc 960
catgatcaag cgatacgacg agcaccatca ggatctcaca ctgctcaagg ctcttgtccg 1020
acagcaactg cccgagaagt acaaggagat ctttttcgat cagtcgaaga acggctacgc 1080
tggatacatc gacggcggag cctctcagga agagttctac aagttcatca agccaattct 1140
cgagaagatg gacggaaccg aggaactgct tgtcaagctc aatcgagagg atctgcttcg 1200
gaagcaacga accttcgaca acggcagcat tcctcatcag atccacctcg gtgagctgca 1260
cgccattctt cgacgtcagg aagacttcta cccctttctc aaggacaacc gagagaagat 1320
cgagaagatt cttacctttc gaatccccta ctatgttggt cctcttgcca gaggaaactc 1380
tcgatttgct tggatgactc gaaagtccga ggaaaccatc actccctgga acttcgagga 1440
agtcgtggac aagggtgcct ctgcacagtc cttcatcgag cgaatgacca acttcgacaa 1500
gaatctgccc aacgagaagg ttcttcccaa gcattcgctg ctctacgagt actttacagt 1560
ctacaacgaa ctcaccaaag tcaagtacgt taccgaggga atgcgaaagc ctgccttctt 1620
gtctggcgaa cagaagaaag ccattgtcga tctcctgttc aagaccaacc gaaaggtcac 1680
tgttaagcag ctcaaggagg actacttcaa gaaaatcgag tgtttcgaca gcgtcgagat 1740
ttccggagtt gaggaccgat tcaacgcctc tttgggcacc tatcacgatc tgctcaagat 1800
tatcaaggac aaggattttc tcgacaacga ggaaaacgag gacattctgg aggacatcgt 1860
gctcactctt accctgttcg aagatcggga gatgatcgag gaacgactca agacatacgc 1920
tcacctgttc gacgacaagg tcatgaaaca actcaagcga cgtagataca ccggctgggg 1980
aagactttcg cgaaagctca tcaacggcat cagagacaag cagtccggaa agaccattct 2040
ggactttctc aagtccgatg gctttgccaa ccgaaacttc atgcagctca ttcacgacga 2100
ttctcttacc ttcaaggagg acatccagaa ggcacaagtg tccggtcagg gcgacagctt 2160
gcacgaacat attgccaacc tggctggttc gccagccatc aagaaaggca ttctccagac 2220
tgtcaaggtt gtcgacgagc tggtgaaggt catgggacgt cacaagcccg agaacattgt 2280
gatcgagatg gccagagaga accagacaac tcaaaagggt cagaaaaact cgcgagagcg 2340
gatgaagcga atcgaggaag gcatcaagga gctgggatcc cagattctca aggagcatcc 2400
cgtcgagaac actcaactgc agaacgagaa gctgtatctc tactatctgc agaatggtcg 2460
agacatgtac gtggatcagg aactggacat caatcgtctc agcgactacg atgtggacgc 2520
cattgtccct caatcctttc tcaaggacga ttctatcgac aacaaggtcc ttacacgatc 2580
cgacaagaac agaggcaagt cggacaacgt tcccagcgaa gaggtggtca aaaagatgaa 2640
gaactactgg cgacagctgc tcaacgccaa gctcattacc cagcgaaagt tcgacaatct 2700
taccaaggcc gagcgaggcg gtctgtccga gctcgacaag gctggcttca tcaagcgtca 2760
actcgtcgag accagacaga tcacaaagca cgtcgcacag attctcgatt ctcggatgaa 2820
caccaagtac gacgagaacg acaagctcat ccgagaggtc aaggtgatta ctctcaagtc 2880
caaactggtc tccgatttcc gaaaggactt tcagttctac aaggtgcgag agatcaacaa 2940
ttaccaccat gcccacgatg cttacctcaa cgccgtcgtt ggcactgcgc tcatcaagaa 3000
ataccccaag ctcgaaagcg agttcgttta cggcgattac aaggtctacg acgttcgaaa 3060
gatgattgcc aagtccgaac aggagattgg caaggctact gccaagtact tcttttactc 3120
caacatcatg aactttttca agaccgagat caccttggcc aacggagaga ttcgaaagag 3180
accacttatc gagaccaacg gcgaaactgg agagatcgtg tgggacaagg gtcgagactt 3240
tgcaaccgtg cgaaaggttc tgtcgatgcc tcaggtcaac atcgtcaaga aaaccgaggt 3300
tcagactggc ggattctcca aggagtcgat tctgcccaag cgaaactccg acaagctcat 3360
cgctcgaaag aaagactggg atcccaagaa atacggtggc ttcgattctc ctaccgtcgc 3420
ctattccgtg cttgtcgttg cgaaggtcga gaagggcaag tccaaaaagc tcaagtccgt 3480
caaggagctg ctcggaatta ccatcatgga gcgatcgagc ttcgagaaga atcccatcga 3540
cttcttggaa gccaagggtt acaaggaggt caagaaagac ctcattatca agctgcccaa 3600
gtactctctg ttcgaactgg agaacggtcg aaagcgtatg ctcgcctccg ctggcgagct 3660
gcagaaggga aacgagcttg ccttgccttc gaagtacgtc aactttctct atctggcttc 3720
tcactacgag aagctcaagg gttctcccga ggacaacgaa cagaagcaac tcttcgttga 3780
gcagcacaaa cattacctcg acgagattat cgagcagatt tccgagtttt cgaagcgagt 3840
catcctggct gatgccaact tggacaaggt gctctctgcc tacaacaagc atcgggacaa 3900
acccattcga gaacaggcgg agaacatcat tcacctgttt actcttacca acctgggtgc 3960
tcctgcagct ttcaagtact tcgataccac tatcgaccga aagcggtaca catccaccaa 4020
ggaggttctc gatgccaccc tgattcacca gtccatcact ggcctgtacg agacccgaat 4080
cgacctgtct cagcttggtg gcgactccag agccgatccc aagaaaaagc gaaaggtcta 4140
agcggccgca agtgtggatg gggaagtgag tgcccggttc tgtgtgcaca attggcaatc 4200
caagatggat ggattcaaca cagggatata gcgagctacg tggtggtgcg aggatatagc 4260
aacggatatt tatgtttgac acttgagaat gtacgataca agcactgtcc aagtacaata 4320
ctaaacatac tgtacatact catactcgta cccgggcaac ggtttcactt gagtgcagtg 4380
gctagtgctc ttactcgtac agtgtgcaat actgcgtatc atagtctttg atgtatatcg 4440
tattcattca tgttagttgc gtacgagccg gaagcataaa gtgtaaagcc tggggtgcct 4500
aatgagtgag ctaactcaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa 4560
acctgtcgtg ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta 4620
ttgggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc 4680
gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg 4740
caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt 4800
tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa 4860
gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct 4920
ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc 4980
cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg 5040
tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct 5100
tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag 5160
cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga 5220
agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc gctctgctga 5280
agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg 5340
gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag 5400
aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag 5460
ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat 5520
gaagttttaa atcaatctaa agtatatatg agtaaacttg gtctgacagt taccaatgct 5580
taatcagtga ggcacctatc tcagcgatct gtctatttcg ttcatccata gttgcctgac 5640
tccccgtcgt gtagataact acgatacggg agggcttacc atctggcccc agtgctgcaa 5700
tgataccgcg agacccacgc tcaccggctc cagatttatc agcaataaac cagccagccg 5760
gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag tctattaatt 5820
gttgccggga agctagagta agtagttcgc cagttaatag tttgcgcaac gttgttgcca 5880
ttgctacagg catcgtggtg tcacgctcgt cgtttggtat ggcttcattc agctccggtt 5940
cccaacgatc aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg gttagctcct 6000
tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt gttatcactc atggttatgg 6060
cagcactgca taattctctt actgtcatgc catccgtaag atgcttttct gtgactggtg 6120
agtactcaac caagtcattc tgagaatagt gtatgcggcg accgagttgc tcttgcccgg 6180
cgtcaatacg ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa 6240
aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt 6300
aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt 6360
gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt 6420
gaatactcat actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca 6480
tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 6540
ttccccgaaa agtgccacct gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg 6600
tggttacgcg cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt 6660
tcttcccttc ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc 6720
tccctttagg gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg 6780
gtgatggttc acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg 6840
agtccacgtt ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct 6900
cggtctattc ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg 6960
agctgattta acaaaaattt aacgcgaatt ttaacaaaat attaacgctt acaatttcca 7020
ttcgccattc aggctgcgca actgttggga agggcgatcg gtgcgggcct cttcgctatt 7080
acgccagctg gcgaaagggg gatgtgctgc aaggcgatta agttgggtaa cgccagggtt 7140
ttcccagtca cgacgttgta aaacgacggc cagtgaattg taatacgact cactataggg 7200
cgaattgggt accgggcccc ccctcgaggt cgatggtgtc gataagcttg atatcgaatt 7260
catgtcacac aaaccgatct tcgcctcaag gaaacctaat tctacatccg agagactgcc 7320
gagatccagt ctacactgat taattttcgg gccaataatt taaaaaaatc gtgttatata 7380
atattatatg tattatatat atacatcatg atgatactga cagtcatgtc ccattgctaa 7440
atagacagac tccatctgcc gcctccaact gatgttctca atatttaagg ggtcatctcg 7500
cattgtttaa taataaacag actccatcta ccgcctccaa atgatgttct caaaatatat 7560
tgtatgaact tatttttatt acttagtatt attagacaac ttacttgctt tatgaaaaac 7620
acttcctatt taggaaacaa tttataatgg cagttcgttc atttaacaat ttatgtagaa 7680
taaatgttat aaatgcgtat gggaaatctt aaatatggat agcataaatg atatctgcat 7740
tgcctaattc gaaatcaaca gcaacgaaaa aaatcccttg tacaacataa atagtcatcg 7800
agaaatatca actatcaaag aacagctatt cacacgttac tattgagatt attattggac 7860
gagaatcaca cactcaactg tctttctctc ttctagaaat acaggtacaa gtatgtacta 7920
ttctcattgt tcatacttct agtcatttca tcccacatat tccttggatt tctctccaat 7980
gaatgacatt ctatcttgca aattcaacaa ttataataag atataccaaa gtagcggtat 8040
agtggcaatc aaaaagcttc tctggtgtgc ttctcgtatt tatttttatt ctaatgatcc 8100
attaaaggta tatatttatt tcttgttata taatcctttt gtttattaca tgggctggat 8160
acataaaggt attttgattt aattttttgc ttaaattcaa tcccccctcg ttcagtgtca 8220
actgtaatgg taggaaatta ccatactttt gaagaagcaa aaaaaatgaa agaaaaaaaa 8280
aatcgtattt ccaggttaga cgttccgcag aatctagaat gcggtatgcg gtacattgtt 8340
cttcgaacgt aaaagttgcg ctccctgaga tattgtacat ttttgctttt acaagtacaa 8400
gtacatcgta caactatgta ctactgttga tgcatccaca acagtttgtt ttgttttttt 8460
ttgttttttt tttttctaat gattcattac cgctatgtat acctacttgt acttgtagta 8520
agccgggtta ttggcgttca attaatcata gacttatgaa tctgcacggt gtgcgctgcg 8580
agttactttt agcttatgca tgctacttgg gtgtaatatt gggatctgtt cggaaatcaa 8640
cggatgctca atcgatttcg acagtaatta attaagtcat acacaagtca gctttcttcg 8700
agcctcatat aagtataagt agttcaacgt attagcactg tacccagcat ctccgtatcg 8760
agaaacacaa caacatgccc cattggacag atcatgcgga tacacaggtt gtgcagtatc 8820
atacatactc gatcagacag gtcgtctgac catcatacaa gctgaacaag cgctccatac 8880
ttgcacgctc tctatataca cagttaaatt acatatccat agtctaacct ctaacagtta 8940
atcttctggt aagcctccca gccagccttc tggtatcgct tggcctcctc aataggatct 9000
cggttctggc cgtacagacc tcggccgaca attatgatat ccgttccggt agacatgaca 9060
tcctcaacag ttcggtactg ctgtccgaga gcgtctccct tgtcgtcaag acccaccccg 9120
ggggtcagaa taagccagtc ctcagagtcg cccttaggtc ggttctgggc aatgaagcca 9180
accacaaact cggggtcgga tcgggcaagc tcaatggtct gcttggagta ctcgccagtg 9240
gccagagagc ccttgcaaga cagctcggcc agcatgagca gacctctggc cagcttctcg 9300
ttgggagagg ggactaggaa ctccttgtac tgggagttct cgtagtcaga gacgtcctcc 9360
ttcttctgtt cagagacagt ttcctcggca ccagctcgca ggccagcaat gattccggtt 9420
ccgggtacac cgtgggcgtt ggtgatatcg gaccactcgg cgattcggtg acaccggtac 9480
tggtgcttga cagtgttgcc aatatctgcg aactttctgt cctcgaacag gaagaaaccg 9540
tgcttaagag caagttcctt gagggggagc acagtgccgg cgtaggtgaa gtcgtcaatg 9600
atgtcgatat gggttttgat catgcacaca taaggtccga ccttatcggc aagctcaatg 9660
agctccttgg tggtggtaac atccagagaa gcacacaggt tggttttctt ggctgccacg 9720
agcttgagca ctcgagcggc aaaggcggac ttgtggacgt tagctcgagc ttcgtaggag 9780
ggcattttgg tggtgaagag gagactgaaa taaatttagt ctgcagaact ttttatcgga 9840
accttatctg gggcagtgaa gtatatgtta tggtaatagt tacgagttag ttgaacttat 9900
agatagactg gactatacgg ctatcggtcc aaattagaaa gaacgtcaat ggctctctgg 9960
gcgtcgcctt tgccgacaaa aatgtgatca tgatgaaagc cagcaatgac gttgcagctg 10020
atattgttgt cggccaaccg cgccgaaaac gcagctgtca gacccacagc ctccaacgaa 10080
gaatgtatcg tcaaagtgat ccaagcacac tcatagttgg agtcgtactc caaaggcggc 10140
aatgacgagt cagacagata ctcgtcgacg tttaaaccat catctaaggg cctcaaaact 10200
acctcggaac tgctgcgctg atctggacac cacagaggtt ccgagcactt taggttgcac 10260
caaatgtccc accaggtgca ggcagaaaac gctggaacag cgtgtacagt ttgtcttaac 10320
aaaaagtgag ggcgctgagg tcgagcaggg tggtgtgact tgttatagcc tttagagctg 10380
cgaaagcgcg tatggatttg gctcatcagg ccagattgag ggtctgtgga cacatgtcat 10440
gttagtgtac ttcaatcgcc ccctggatat agccccgaca ataggccgtg gcctcatttt 10500
tttgccttcc gcacatttcc attgctcggt acccacacct tgcttctcct gcacttgcca 10560
accttaatac tggtttacat tgaccaacat cttacaagcg gggggcttgt ctagggtata 10620
tataaacagt ggctctccca atcggttgcc agtctctttt ttcctttctt tccccacaga 10680
ttcgaaatct aaactacaca tcacac 10706
<210> 126
<211> 678
<212> DNA
<213> 人工序列
<220>
<223> 经耶氏酵母优化的dsREDexpress ORF
<400> 126
atggcctcct cggaggacgt catcaaggag ttcatgcgat tcaaggtccg aatggaaggc 60
tccgtgaacg gtcacgagtt tgagattgag ggagagggtg aaggccgacc ctacgaaggc 120
acccagaccg cgaagctgaa ggtgaccaag ggtggacccc tgcccttcgc ctgggacatt 180
ctgtctcctc agtttcagta cggttctaag gtgtacgtga agcaccctgc tgacattccc 240
gactacaaga aactttcctt tcccgagggc ttcaagtggg agcgagttat gaacttcgag 300
gatggcggtg tcgttaccgt tactcaggac tcctcgctcc aggacggctc gttcatctac 360
aaggttaagt tcatcggtgt caacttccct agcgatggac ccgtcatgca aaagaaaact 420
atgggatggg aagcctctac agagcggctg taccctcgag acggagtgtt gaagggcgag 480
attcacaagg ccctgaagct caaggacggt ggacactatc tcgttgagtt taagtctatc 540
tacatggcaa agaaacccgt gcagcttcca ggctactatt acgtcgattc caagctcgat 600
atcaccagcc ataatgagga ctacactatt gtcgaacagt acgagcgtgc tgagggaaga 660
caccatctgt ttctttaa 678
<210> 127
<211> 696
<212> DNA
<213> 人工序列
<220>
<223> 经耶氏酵母优化的dsREDexpress克隆片段
<400> 127
ggggccatgg cctcctcgga ggacgtcatc aaggagttca tgcgattcaa ggtccgaatg 60
gaaggctccg tgaacggtca cgagtttgag attgagggag agggtgaagg ccgaccctac 120
gaaggcaccc agaccgcgaa gctgaaggtg accaagggtg gacccctgcc cttcgcctgg 180
gacattctgt ctcctcagtt tcagtacggt tctaaggtgt acgtgaagca ccctgctgac 240
attcccgact acaagaaact ttcctttccc gagggcttca agtgggagcg agttatgaac 300
ttcgaggatg gcggtgtcgt taccgttact caggactcct cgctccagga cggctcgttc 360
atctacaagg ttaagttcat cggtgtcaac ttccctagcg atggacccgt catgcaaaag 420
aaaactatgg gatgggaagc ctctacagag cggctgtacc ctcgagacgg agtgttgaag 480
ggcgagattc acaaggccct gaagctcaag gacggtggac actatctcgt tgagtttaag 540
tctatctaca tggcaaagaa acccgtgcag cttccaggct actattacgt cgattccaag 600
ctcgatatca ccagccataa tgaggactac actattgtcg aacagtacga gcgtgctgag 660
ggaagacacc atctgtttct ttaagcggcc gcgggg 696
<210> 128
<211> 1212
<212> DNA
<213> 人工序列
<220>
<223> FBA1-dsREDexpress表达盒
<400> 128
aaaccatcat ctaagggcct caaaactacc tcggaactgc tgcgctgatc tggacaccac 60
agaggttccg agcactttag gttgcaccaa atgtcccacc aggtgcaggc agaaaacgct 120
ggaacagcgt gtacagtttg tcttaacaaa aagtgagggc gctgaggtcg agcagggtgg 180
tgtgacttgt tatagccttt agagctgcga aagcgcgtat ggatttggct catcaggcca 240
gattgagggt ctgtggacac atgtcatgtt agtgtacttc aatcgccccc tggatatagc 300
cccgacaata ggccgtggcc tcattttttt gccttccgca catttccatt gctcggtacc 360
cacaccttgc ttctcctgca cttgccaacc ttaatactgg tttacattga ccaacatctt 420
acaagcgggg ggcttgtcta gggtatatat aaacagtggc tctcccaatc ggttgccagt 480
ctcttttttc ctttctttcc ccacagattc gaaatctaaa ctacacatca caccatggcc 540
tcctcggagg acgtcatcaa ggagttcatg cgattcaagg tccgaatgga aggctccgtg 600
aacggtcacg agtttgagat tgagggagag ggtgaaggcc gaccctacga aggcacccag 660
accgcgaagc tgaaggtgac caagggtgga cccctgccct tcgcctggga cattctgtct 720
cctcagtttc agtacggttc taaggtgtac gtgaagcacc ctgctgacat tcccgactac 780
aagaaacttt cctttcccga gggcttcaag tgggagcgag ttatgaactt cgaggatggc 840
ggtgtcgtta ccgttactca ggactcctcg ctccaggacg gctcgttcat ctacaaggtt 900
aagttcatcg gtgtcaactt ccctagcgat ggacccgtca tgcaaaagaa aactatggga 960
tgggaagcct ctacagagcg gctgtaccct cgagacggag tgttgaaggg cgagattcac 1020
aaggccctga agctcaagga cggtggacac tatctcgttg agtttaagtc tatctacatg 1080
gcaaagaaac ccgtgcagct tccaggctac tattacgtcg attccaagct cgatatcacc 1140
agccataatg aggactacac tattgtcgaa cagtacgagc gtgctgaggg aagacaccat 1200
ctgtttcttt aa 1212
<210> 129
<211> 7244
<212> DNA
<213> 人工序列
<220>
<223> pRF165
<400> 129
ggccgcaagt gtggatgggg aagtgagtgc ccggttctgt gtgcacaatt ggcaatccaa 60
gatggatgga ttcaacacag ggatatagcg agctacgtgg tggtgcgagg atatagcaac 120
ggatatttat gtttgacact tgagaatgta cgatacaagc actgtccaag tacaatacta 180
aacatactgt acatactcat actcgtaccc gggcaacggt ttcacttgag tgcagtggct 240
agtgctctta ctcgtacagt gtgcaatact gcgtatcata gtctttgatg tatatcgtat 300
tcattcatgt tagttgcgta cgagccggaa gcataaagtg taaagcctgg ggtgcctaat 360
gagtgagcta actcacatta attgcgttgc gctcactgcc cgctttccag tcgggaaacc 420
tgtcgtgcca gctgcattaa tgaatcggcc aacgcgcggg gagaggcggt ttgcgtattg 480
ggcgctcttc cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg ctgcggcgag 540
cggtatcagc tcactcaaag gcggtaatac ggttatccac agaatcaggg gataacgcag 600
gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc 660
tggcgttttt ccataggctc cgcccccctg acgagcatca caaaaatcga cgctcaagtc 720
agaggtggcg aaacccgaca ggactataaa gataccaggc gtttccccct ggaagctccc 780
tcgtgcgctc tcctgttccg accctgccgc ttaccggata cctgtccgcc tttctccctt 840
cgggaagcgt ggcgctttct catagctcac gctgtaggta tctcagttcg gtgtaggtcg 900
ttcgctccaa gctgggctgt gtgcacgaac cccccgttca gcccgaccgc tgcgccttat 960
ccggtaacta tcgtcttgag tccaacccgg taagacacga cttatcgcca ctggcagcag 1020
ccactggtaa caggattagc agagcgaggt atgtaggcgg tgctacagag ttcttgaagt 1080
ggtggcctaa ctacggctac actagaagga cagtatttgg tatctgcgct ctgctgaagc 1140
cagttacctt cggaaaaaga gttggtagct cttgatccgg caaacaaacc accgctggta 1200
gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga tctcaagaag 1260
atcctttgat cttttctacg gggtctgacg ctcagtggaa cgaaaactca cgttaaggga 1320
ttttggtcat gagattatca aaaaggatct tcacctagat ccttttaaat taaaaatgaa 1380
gttttaaatc aatctaaagt atatatgagt aaacttggtc tgacagttac caatgcttaa 1440
tcagtgaggc acctatctca gcgatctgtc tatttcgttc atccatagtt gcctgactcc 1500
ccgtcgtgta gataactacg atacgggagg gcttaccatc tggccccagt gctgcaatga 1560
taccgcgaga cccacgctca ccggctccag atttatcagc aataaaccag ccagccggaa 1620
gggccgagcg cagaagtggt cctgcaactt tatccgcctc catccagtct attaattgtt 1680
gccgggaagc tagagtaagt agttcgccag ttaatagttt gcgcaacgtt gttgccattg 1740
ctacaggcat cgtggtgtca cgctcgtcgt ttggtatggc ttcattcagc tccggttccc 1800
aacgatcaag gcgagttaca tgatccccca tgttgtgcaa aaaagcggtt agctccttcg 1860
gtcctccgat cgttgtcaga agtaagttgg ccgcagtgtt atcactcatg gttatggcag 1920
cactgcataa ttctcttact gtcatgccat ccgtaagatg cttttctgtg actggtgagt 1980
actcaaccaa gtcattctga gaatagtgta tgcggcgacc gagttgctct tgcccggcgt 2040
caatacggga taataccgcg ccacatagca gaactttaaa agtgctcatc attggaaaac 2100
gttcttcggg gcgaaaactc tcaaggatct taccgctgtt gagatccagt tcgatgtaac 2160
ccactcgtgc acccaactga tcttcagcat cttttacttt caccagcgtt tctgggtgag 2220
caaaaacagg aaggcaaaat gccgcaaaaa agggaataag ggcgacacgg aaatgttgaa 2280
tactcatact cttccttttt caatattatt gaagcattta tcagggttat tgtctcatga 2340
gcggatacat atttgaatgt atttagaaaa ataaacaaat aggggttccg cgcacatttc 2400
cccgaaaagt gccacctgac gcgccctgta gcggcgcatt aagcgcggcg ggtgtggtgg 2460
ttacgcgcag cgtgaccgct acacttgcca gcgccctagc gcccgctcct ttcgctttct 2520
tcccttcctt tctcgccacg ttcgccggct ttccccgtca agctctaaat cgggggctcc 2580
ctttagggtt ccgatttagt gctttacggc acctcgaccc caaaaaactt gattagggtg 2640
atggttcacg tagtgggcca tcgccctgat agacggtttt tcgccctttg acgttggagt 2700
ccacgttctt taatagtgga ctcttgttcc aaactggaac aacactcaac cctatctcgg 2760
tctattcttt tgatttataa gggattttgc cgatttcggc ctattggtta aaaaatgagc 2820
tgatttaaca aaaatttaac gcgaatttta acaaaatatt aacgcttaca atttccattc 2880
gccattcagg ctgcgcaact gttgggaagg gcgatcggtg cgggcctctt cgctattacg 2940
ccagctggcg aaagggggat gtgctgcaag gcgattaagt tgggtaacgc cagggttttc 3000
ccagtcacga cgttgtaaaa cgacggccag tgaattgtaa tacgactcac tatagggcga 3060
attgggtacc gggccccccc tcgaggtcga tggtgtcgat aagcttgata tcgaattcat 3120
gtcacacaaa ccgatcttcg cctcaaggaa acctaattct acatccgaga gactgccgag 3180
atccagtcta cactgattaa ttttcgggcc aataatttaa aaaaatcgtg ttatataata 3240
ttatatgtat tatatatata catcatgatg atactgacag tcatgtccca ttgctaaata 3300
gacagactcc atctgccgcc tccaactgat gttctcaata tttaaggggt catctcgcat 3360
tgtttaataa taaacagact ccatctaccg cctccaaatg atgttctcaa aatatattgt 3420
atgaacttat ttttattact tagtattatt agacaactta cttgctttat gaaaaacact 3480
tcctatttag gaaacaattt ataatggcag ttcgttcatt taacaattta tgtagaataa 3540
atgttataaa tgcgtatggg aaatcttaaa tatggatagc ataaatgata tctgcattgc 3600
ctaattcgaa atcaacagca acgaaaaaaa tcccttgtac aacataaata gtcatcgaga 3660
aatatcaact atcaaagaac agctattcac acgttactat tgagattatt attggacgag 3720
aatcacacac tcaactgtct ttctctcttc tagaaataca ggtacaagta tgtactattc 3780
tcattgttca tacttctagt catttcatcc cacatattcc ttggatttct ctccaatgaa 3840
tgacattcta tcttgcaaat tcaacaatta taataagata taccaaagta gcggtatagt 3900
ggcaatcaaa aagcttctct ggtgtgcttc tcgtatttat ttttattcta atgatccatt 3960
aaaggtatat atttatttct tgttatataa tccttttgtt tattacatgg gctggataca 4020
taaaggtatt ttgatttaat tttttgctta aattcaatcc cccctcgttc agtgtcaact 4080
gtaatggtag gaaattacca tacttttgaa gaagcaaaaa aaatgaaaga aaaaaaaaat 4140
cgtatttcca ggttagacgt tccgcagaat ctagaatgcg gtatgcggta cattgttctt 4200
cgaacgtaaa agttgcgctc cctgagatat tgtacatttt tgcttttaca agtacaagta 4260
catcgtacaa ctatgtacta ctgttgatgc atccacaaca gtttgttttg tttttttttg 4320
tttttttttt ttctaatgat tcattaccgc tatgtatacc tacttgtact tgtagtaagc 4380
cgggttattg gcgttcaatt aatcatagac ttatgaatct gcacggtgtg cgctgcgagt 4440
tacttttagc ttatgcatgc tacttgggtg taatattggg atctgttcgg aaatcaacgg 4500
atgctcaatc gatttcgaca gtaattaatt aagtcataca caagtcagct ttcttcgagc 4560
ctcatataag tataagtagt tcaacgtatt agcactgtac ccagcatctc cgtatcgaga 4620
aacacaacaa catgccccat tggacagatc atgcggatac acaggttgtg cagtatcata 4680
catactcgat cagacaggtc gtctgaccat catacaagct gaacaagcgc tccatacttg 4740
cacgctctct atatacacag ttaaattaca tatccatagt ctaacctcta acagttaatc 4800
ttctggtaag cctcccagcc agccttctgg tatcgcttgg cctcctcaat aggatctcgg 4860
ttctggccgt acagacctcg gccgacaatt atgatatccg ttccggtaga catgacatcc 4920
tcaacagttc ggtactgctg tccgagagcg tctcccttgt cgtcaagacc caccccgggg 4980
gtcagaataa gccagtcctc agagtcgccc ttaggtcggt tctgggcaat gaagccaacc 5040
acaaactcgg ggtcggatcg ggcaagctca atggtctgct tggagtactc gccagtggcc 5100
agagagccct tgcaagacag ctcggccagc atgagcagac ctctggccag cttctcgttg 5160
ggagagggga ctaggaactc cttgtactgg gagttctcgt agtcagagac gtcctccttc 5220
ttctgttcag agacagtttc ctcggcacca gctcgcaggc cagcaatgat tccggttccg 5280
ggtacaccgt gggcgttggt gatatcggac cactcggcga ttcggtgaca ccggtactgg 5340
tgcttgacag tgttgccaat atctgcgaac tttctgtcct cgaacaggaa gaaaccgtgc 5400
ttaagagcaa gttccttgag ggggagcaca gtgccggcgt aggtgaagtc gtcaatgatg 5460
tcgatatggg ttttgatcat gcacacataa ggtccgacct tatcggcaag ctcaatgagc 5520
tccttggtgg tggtaacatc cagagaagca cacaggttgg ttttcttggc tgccacgagc 5580
ttgagcactc gagcggcaaa ggcggacttg tggacgttag ctcgagcttc gtaggagggc 5640
attttggtgg tgaagaggag actgaaataa atttagtctg cagaactttt tatcggaacc 5700
ttatctgggg cagtgaagta tatgttatgg taatagttac gagttagttg aacttataga 5760
tagactggac tatacggcta tcggtccaaa ttagaaagaa cgtcaatggc tctctgggcg 5820
tcgcctttgc cgacaaaaat gtgatcatga tgaaagccag caatgacgtt gcagctgata 5880
ttgttgtcgg ccaaccgcgc cgaaaacgca gctgtcagac ccacagcctc caacgaagaa 5940
tgtatcgtca aagtgatcca agcacactca tagttggagt cgtactccaa aggcggcaat 6000
gacgagtcag acagatactc gtcgacgttt aaaccatcat ctaagggcct caaaactacc 6060
tcggaactgc tgcgctgatc tggacaccac agaggttccg agcactttag gttgcaccaa 6120
atgtcccacc aggtgcaggc agaaaacgct ggaacagcgt gtacagtttg tcttaacaaa 6180
aagtgagggc gctgaggtcg agcagggtgg tgtgacttgt tatagccttt agagctgcga 6240
aagcgcgtat ggatttggct catcaggcca gattgagggt ctgtggacac atgtcatgtt 6300
agtgtacttc aatcgccccc tggatatagc cccgacaata ggccgtggcc tcattttttt 6360
gccttccgca catttccatt gctcggtacc cacaccttgc ttctcctgca cttgccaacc 6420
ttaatactgg tttacattga ccaacatctt acaagcgggg ggcttgtcta gggtatatat 6480
aaacagtggc tctcccaatc ggttgccagt ctcttttttc ctttctttcc ccacagattc 6540
gaaatctaaa ctacacatca caccatggcc tcctcggagg acgtcatcaa ggagttcatg 6600
cgattcaagg tccgaatgga aggctccgtg aacggtcacg agtttgagat tgagggagag 6660
ggtgaaggcc gaccctacga aggcacccag accgcgaagc tgaaggtgac caagggtgga 6720
cccctgccct tcgcctggga cattctgtct cctcagtttc agtacggttc taaggtgtac 6780
gtgaagcacc ctgctgacat tcccgactac aagaaacttt cctttcccga gggcttcaag 6840
tgggagcgag ttatgaactt cgaggatggc ggtgtcgtta ccgttactca ggactcctcg 6900
ctccaggacg gctcgttcat ctacaaggtt aagttcatcg gtgtcaactt ccctagcgat 6960
ggacccgtca tgcaaaagaa aactatggga tgggaagcct ctacagagcg gctgtaccct 7020
cgagacggag tgttgaaggg cgagattcac aaggccctga agctcaagga cggtggacac 7080
tatctcgttg agtttaagtc tatctacatg gcaaagaaac ccgtgcagct tccaggctac 7140
tattacgtcg attccaagct cgatatcacc agccataatg aggactacac tattgtcgaa 7200
cagtacgagc gtgctgaggg aagacaccat ctgtttcttt aagc 7244
<210> 130
<211> 1214
<212> DNA
<213> 人工序列
<220>
<223> 来自PmeI NotI片段上的pRF165的FBA1耶氏酵母dsREDexpress盒
<400> 130
aaaccatcat ctaagggcct caaaactacc tcggaactgc tgcgctgatc tggacaccac 60
agaggttccg agcactttag gttgcaccaa atgtcccacc aggtgcaggc agaaaacgct 120
ggaacagcgt gtacagtttg tcttaacaaa aagtgagggc gctgaggtcg agcagggtgg 180
tgtgacttgt tatagccttt agagctgcga aagcgcgtat ggatttggct catcaggcca 240
gattgagggt ctgtggacac atgtcatgtt agtgtacttc aatcgccccc tggatatagc 300
cccgacaata ggccgtggcc tcattttttt gccttccgca catttccatt gctcggtacc 360
cacaccttgc ttctcctgca cttgccaacc ttaatactgg tttacattga ccaacatctt 420
acaagcgggg ggcttgtcta gggtatatat aaacagtggc tctcccaatc ggttgccagt 480
ctcttttttc ctttctttcc ccacagattc gaaatctaaa ctacacatca caccatggcc 540
tcctcggagg acgtcatcaa ggagttcatg cgattcaagg tccgaatgga aggctccgtg 600
aacggtcacg agtttgagat tgagggagag ggtgaaggcc gaccctacga aggcacccag 660
accgcgaagc tgaaggtgac caagggtgga cccctgccct tcgcctggga cattctgtct 720
cctcagtttc agtacggttc taaggtgtac gtgaagcacc ctgctgacat tcccgactac 780
aagaaacttt cctttcccga gggcttcaag tgggagcgag ttatgaactt cgaggatggc 840
ggtgtcgtta ccgttactca ggactcctcg ctccaggacg gctcgttcat ctacaaggtt 900
aagttcatcg gtgtcaactt ccctagcgat ggacccgtca tgcaaaagaa aactatggga 960
tgggaagcct ctacagagcg gctgtaccct cgagacggag tgttgaaggg cgagattcac 1020
aaggccctga agctcaagga cggtggacac tatctcgttg agtttaagtc tatctacatg 1080
gcaaagaaac ccgtgcagct tccaggctac tattacgtcg attccaagct cgatatcacc 1140
agccataatg aggactacac tattgtcgaa cagtacgagc gtgctgaggg aagacaccat 1200
ctgtttcttt aagc 1214
<210> 131
<211> 11526
<212> DNA
<213> 人工序列
<220>
<223> p2PO69整合载体
<400> 131
ggccgcaagt gtggatgggg aagtgagtgc ccggttctgt gtgcacaatt ggcaatccaa 60
gatggatgga ttcaacacag ggatatagcg agctacgtgg tggtgcgagg atatagcaac 120
ggatatttat gtttgacact tgagaatgta cgatacaagc actgtccaag tacaatacta 180
aacatactgt acatactcat actcgtaccc gggcaacggt ttcacttgag tgcagtggct 240
agtgctctta ctcgtacagt gtgcaatact gcgtatcata gtctttgatg tatatcgtat 300
tcattcatgt tagttgcgta cgggcgtcgt tgcttgtgtg atttttgagg acccatccct 360
ttggtatata agtatactct ggggttaagg ttgcccgtgt agtctaggtt atagttttca 420
tgtgaaatac cgagagccga gggagaataa acgggggtat ttggacttgt ttttttcgcg 480
gaaaagcgtc gaatcaaccc tgcgggcctt gcaccatgtc cacgacgtgt ttctcgcccc 540
aattcgcccc ttgcacgtca aaattaggcc tccatctaga cccctccata acatgtgact 600
gtggggaaaa gtataaggga aaccatgcaa ccatagacga cgtgaaagac ggggaggaac 660
caatggaggc caaagaaatg gggtagcaac agtccaggag acagacaagg agacaaggag 720
agggcgcccg aaagatcgga aaaacaaaca tgtccaattg gggcagtgac ggaaacgaca 780
cggacacttc agtacaatgg accgaccatc tccaagccag ggttattccg gtatcacctt 840
ggccgtaacc tcccgctggt acctgatatt gtacacgttc acattcaata tactttcagc 900
tacaataaga gaggctgttt gtcgggcatg tgtgtccgtc gtatggggtg atgtccgagg 960
gcgaaattcg ctacaagctt aactctggcg cttgtccagt atgaatagac aagtcaagac 1020
cagtggtgcc atgattgaca gggaggtaca agacttcgat actcgagcat tactcggact 1080
tgtggcgatt gaacagacgg gcgatcgctt ctcccccgta ttgccggcgc gccagctgca 1140
ttaatgaatc ggccaacgcg cggggagagg cggtttgcgt attgggcgct cttccgcttc 1200
ctcgctcact gactcgctgc gctcggtcgt tcggctgcgg cgagcggtat cagctcactc 1260
aaaggcggta atacggttat ccacagaatc aggggataac gcaggaaaga acatgtgagc 1320
aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt ttttccatag 1380
gctccgcccc cctgacgagc atcacaaaaa tcgacgctca agtcagaggt ggcgaaaccc 1440
gacaggacta taaagatacc aggcgtttcc ccctggaagc tccctcgtgc gctctcctgt 1500
tccgaccctg ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa gcgtggcgct 1560
ttctcatagc tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct ccaagctggg 1620
ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc ttatccggta actatcgtct 1680
tgagtccaac ccggtaagac acgacttatc gccactggca gcagccactg gtaacaggat 1740
tagcagagcg aggtatgtag gcggtgctac agagttcttg aagtggtggc ctaactacgg 1800
ctacactaga agaacagtat ttggtatctg cgctctgctg aagccagtta ccttcggaaa 1860
aagagttggt agctcttgat ccggcaaaca aaccaccgct ggtagcggtg gtttttttgt 1920
ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa gaagatcctt tgatcttttc 1980
tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg tcatgagatt 2040
atcaaaaagg atcttcacct agatcctttt aaattaaaaa tgaagtttta aatcaatcta 2100
aagtatatat gagtaaactt ggtctgacag ttaccaatgc ttaatcagtg aggcacctat 2160
ctcagcgatc tgtctatttc gttcatccat agttgcctga ctccccgtcg tgtagataac 2220
tacgatacgg gagggcttac catctggccc cagtgctgca atgataccgc gagacccacg 2280
ctcaccggct ccagatttat cagcaataaa ccagccagcc ggaagggccg agcgcagaag 2340
tggtcctgca actttatccg cctccatcca gtctattaat tgttgccggg aagctagagt 2400
aagtagttcg ccagttaata gtttgcgcaa cgttgttgcc attgctacag gcatcgtggt 2460
gtcacgctcg tcgtttggta tggcttcatt cagctccggt tcccaacgat caaggcgagt 2520
tacatgatcc cccatgttgt gcaaaaaagc ggttagctcc ttcggtcctc cgatcgttgt 2580
cagaagtaag ttggccgcag tgttatcact catggttatg gcagcactgc ataattctct 2640
tactgtcatg ccatccgtaa gatgcttttc tgtgactggt gagtactcaa ccaagtcatt 2700
ctgagaatag tgtatgcggc gaccgagttg ctcttgcccg gcgtcaatac gggataatac 2760
cgcgccacat agcagaactt taaaagtgct catcattgga aaacgttctt cggggcgaaa 2820
actctcaagg atcttaccgc tgttgagatc cagttcgatg taacccactc gtgcacccaa 2880
ctgatcttca gcatctttta ctttcaccag cgtttctggg tgagcaaaaa caggaaggca 2940
aaatgccgca aaaaagggaa taagggcgac acggaaatgt tgaatactca tactcttcct 3000
ttttcaatat tattgaagca tttatcaggg ttattgtctc atgagcggat acatatttga 3060
atgtatttag aaaaataaac aaataggggt tccgcgcaca tttccccgaa aagtgccacc 3120
tgatgcggtg tgaaataccg cacagatgcg taaggagaaa ataccgcatc aggaaattgt 3180
aagcgttaat attttgttaa aattcgcgtt aaatttttgt taaatcagct cattttttaa 3240
ccaataggcc gaaatcggca aaatccctta taaatcaaaa gaatagaccg agatagggtt 3300
gagtgttgtt ccagtttgga acaagagtcc actattaaag aacgtggact ccaacgtcaa 3360
agggcgaaaa accgtctatc agggcgatgg cccactacgt gaaccatcac cctaatcaag 3420
ttttttgggg tcgaggtgcc gtaaagcact aaatcggaac cctaaaggga gcccccgatt 3480
tagagcttga cggggaaagc cggcgaacgt ggcgagaaag gaagggaaga aagcgaaagg 3540
agcgggcgct agggcgctgg caagtgtagc ggtcacgctg cgcgtaacca ccacacccgc 3600
cgcgcttaat gcgccgctac agggcgcgtc cattcgccat tcaggctgcg caactgttgg 3660
gaagggcgat cggtgcgggc ctcttcgcta ttacgccagc tggcgaaagg gggatgtgct 3720
gcaaggcgat taagttgggt aacgccaggg ttttcccagt cacgacgttg taaaacgacg 3780
gccagtgaat tgtaatacga ctcactatag ggcgaattgg gcccgacgtc gcatgcgctg 3840
atgacacttt ggtctgaaag agatgcattt tgaatcccaa acttgcagtg cccaagtgac 3900
atacatctcc gcgttttgga aaatgttcag aaacagttga ttgtgttgga atggggaatg 3960
gggaatggaa aaatgactca agtatcaatt ccaaaaactt ctctggctgg cagtacctac 4020
tgtccatact actgcatttt ctccagtcag gccactctat actcgacgac acagtagtaa 4080
aacccagata atttcgacat aaacaagaaa acagacccaa taatatttat atatagtcag 4140
ccgtttgtcc agttcagact gtaatagccg aaaaaaaatc caaagtttct attctaggaa 4200
aatatattcc aatattttta attcttaatc tcatttattt tattctagcg aaatacattt 4260
cagctacttg agacatgtga tacccacaaa tcggattcgg actcggttgt tcagaagagc 4320
atatggcatt cgtgctcgct tgttcacgta ttcttcctgt tccatctctt ggccgacaat 4380
cacacaaaaa tggggttttt tttttaattc taatgattca ttacagcaaa attgagatat 4440
agcagaccac gtattccata atcaccaagg aagttcttgg gcgtcttaat taagttgcga 4500
cacatgtctt gatagtatct tggcttctct ctcttgagct tttccataac aagttcttct 4560
gcctccagga agtccatggt gaatgattct tatactcaga aggaaatgct taacgatttc 4620
gggtgtgagt tgacaaggag agagagaaaa gaagaggaaa ggtaattcgg ggacggtggt 4680
cttttatacc cttggctaaa gtcccaacca caaagcaaaa aaattttcag tagtctattt 4740
tgcgtccggc atgggttacc cggatggcca gacaaagaaa ctagtacaaa gtctgaacaa 4800
gcgtagattc cagactgcag taccctacgc ccttaacggc aagtgtggga accgggggag 4860
gtttgatatg tggggtgaag ggggctctcg ccggggttgg gcccgctact gggtcaattt 4920
ggggtcaatt ggggcaattg gggctgtttt ttgggacaca aatacgccgc caacccggtc 4980
tctcctgaat tctgcagatg ggctgcagga attccgtcgt cgcctgagtc gacatcattt 5040
atttaccagt tggccacaaa cccttgacga tctcgtatgt cccctccgac atactcccgg 5100
ccggctgggg tacgttcgat agcgctatcg gcatcgacaa ggtttgggtc cctagccgat 5160
accgcactac ctgagtcaca atcttcggag gtttagtctt ccacatagca cgggcaaaag 5220
tgcgtatata tacaagagcg tttgccagcc acagattttc actccacaca ccacatcaca 5280
catacaacca cacacatcca caatggaacc cgaaactaag aagaccaaga ctgactccaa 5340
gaagattgtt cttctcggcg gcgacttctg tggccccgag gtgattgccg aggccgtcaa 5400
ggtgctcaag tctgttgctg aggcctccgg caccgagttt gtgtttgagg accgactcat 5460
tggaggagct gccattgaga aggagggcga gcccatcacc gacgctactc tcgacatctg 5520
ccgaaaggct gactctatta tgctcggtgc tgtcggaggc gctgccaaca ccgtatggac 5580
cactcccgac ggacgaaccg acgtgcgacc cgagcagggt ctcctcaagc tgcgaaagga 5640
cctgaacctg tacgccaacc tgcgaccctg ccagctgctg tcgcccaagc tcgccgatct 5700
ctcccccatc cgaaacgttg agggcaccga cttcatcatt gtccgagagc tcgtcggagg 5760
tatctacttt ggagagcgaa aggaggatga cggatctggc gtcgcttccg acaccgagac 5820
ctactccgtt cctgaggttg agcgaattgc ccgaatggcc gccttcctgg cccttcagca 5880
caacccccct cttcccgtgt ggtctcttga caaggccaac gtgctggcct cctctcgact 5940
ttggcgaaag actgtcactc gagtcctcaa ggacgaattc ccccagctcg agctcaacca 6000
ccagctgatc gactcggccg ccatgatcct catcaagcag ccctccaaga tgaatggtat 6060
catcatcacc accaacatgt ttggcgatat catctccgac gaggcctccg tcatccccgg 6120
ttctctgggt ctgctgccct ccgcctctct ggcttctctg cccgacacca acgaggcgtt 6180
cggtctgtac gagccctgtc acggatctgc ccccgatctc ggcaagcaga aggtcaaccc 6240
cattgccacc attctgtctg ccgccatgat gctcaagttc tctcttaaca tgaagcccgc 6300
cggtgacgct gttgaggctg ccgtcaagga gtccgtcgag gctggtatca ctaccgccga 6360
tatcggaggc tcttcctcca cctccgaggt cggagacttg ttgccaacaa ggtcaaggag 6420
ctgctcaaga aggagtaagt cgtttctacg acgcattgat ggaaggagca aactgacgcg 6480
cctgcgggtt ggtctaccgg cagggtccgc tagtgtataa gactctataa aaagggccct 6540
gccctgctaa tgaaatgatg atttataatt taccggtgta gcaaccttga ctagaagaag 6600
cagattgggt gtgtttgtag tggaggacag tggtacgttt tggaaacagt cttcttgaaa 6660
gtgtcttgtc tacagtatat tcactcataa cctcaatagc caagggtgta gtcggtttat 6720
taaaggaagg gagttgtggc tgatgtggat agatatcttt aagctggcga ctgcacccaa 6780
cgagtgtggt ggtagcttgt tagatctgta tattcggtaa gatatatttt gtggggtttt 6840
agtggtgttt aaaccatcat ctaagggcct caaaactacc tcggaactgc tgcgctgatc 6900
tggacaccac agaggttccg agcactttag gttgcaccaa atgtcccacc aggtgcaggc 6960
agaaaacgct ggaacagcgt gtacagtttg tcttaacaaa aagtgagggc gctgaggtcg 7020
agcagggtgg tgtgacttgt tatagccttt agagctgcga aagcgcgtat ggatttggct 7080
catcaggcca gattgagggt ctgtggacac atgtcatgtt agtgtacttc aatcgccccc 7140
tggatatagc cccgacaata ggccgtggcc tcattttttt gccttccgca catttccatt 7200
gctcggtacc cacaccttgc ttctcctgca cttgccaacc ttaatactgg tttacattga 7260
ccaacatctt acaagcgggg ggcttgtcta gggtatatat aaacagtggc tctcccaatc 7320
ggttgccagt ctcttttttc ctttctttcc ccacagattc gaaatctaaa ctacacatca 7380
caccatggac aagaaatact ccatcggcct ggacattgga accaactctg tcggctgggc 7440
tgtcatcacc gacgagtaca aggtgccctc caagaaattc aaggtcctcg gaaacaccga 7500
tcgacactcc atcaagaaaa acctcattgg tgccctgttg ttcgattctg gcgagactgc 7560
cgaagctacc agactcaagc gaactgctcg gcgacgttac acccgacgga agaaccgaat 7620
ctgctacctg caggagatct tttccaacga gatggccaag gtggacgatt cgttctttca 7680
tcgactggag gaatccttcc tcgtcgagga agacaagaaa cacgagcgtc atcccatctt 7740
tggcaacatt gtggacgagg ttgcttacca cgagaagtat cctaccatct accacctgcg 7800
aaagaaactc gtcgattcca ccgacaaggc ggatctcaga cttatctacc tcgctctggc 7860
acacatgatc aagtttcgag gtcatttcct catcgagggc gatctcaatc ccgacaacag 7920
cgatgtggac aagctgttca ttcagctcgt tcagacctac aaccagctgt tcgaggaaaa 7980
ccccatcaat gcctccggag tcgatgcaaa ggccatcttg tctgctcgac tctcgaagag 8040
cagacgactg gagaacctca ttgcccaact tcctggcgag aaaaagaacg gactgtttgg 8100
caacctcatt gccctttctc ttggtctcac acccaacttc aagtccaact tcgatctggc 8160
ggaggacgcc aagctccagc tgtccaagga cacctacgac gatgacctcg acaacctgct 8220
tgcacagatt ggcgatcagt acgccgacct gtttctcgct gccaagaacc tttcggatgc 8280
tattctcttg tctgacattc tgcgagtcaa caccgagatc acaaaggctc ccctttctgc 8340
ctccatgatc aagcgatacg acgagcacca tcaggatctc acactgctca aggctcttgt 8400
ccgacagcaa ctgcccgaga agtacaagga gatctttttc gatcagtcga agaacggcta 8460
cgctggatac atcgacggcg gagcctctca ggaagagttc tacaagttca tcaagccaat 8520
tctcgagaag atggacggaa ccgaggaact gcttgtcaag ctcaatcgag aggatctgct 8580
tcggaagcaa cgaaccttcg acaacggcag cattcctcat cagatccacc tcggtgagct 8640
gcacgccatt cttcgacgtc aggaagactt ctaccccttt ctcaaggaca accgagagaa 8700
gatcgagaag attcttacct ttcgaatccc ctactatgtt ggtcctcttg ccagaggaaa 8760
ctctcgattt gcttggatga ctcgaaagtc cgaggaaacc atcactccct ggaacttcga 8820
ggaagtcgtg gacaagggtg cctctgcaca gtccttcatc gagcgaatga ccaacttcga 8880
caagaatctg cccaacgaga aggttcttcc caagcattcg ctgctctacg agtactttac 8940
agtctacaac gaactcacca aagtcaagta cgttaccgag ggaatgcgaa agcctgcctt 9000
cttgtctggc gaacagaaga aagccattgt cgatctcctg ttcaagacca accgaaaggt 9060
cactgttaag cagctcaagg aggactactt caagaaaatc gagtgtttcg acagcgtcga 9120
gatttccgga gttgaggacc gattcaacgc ctctttgggc acctatcacg atctgctcaa 9180
gattatcaag gacaaggatt ttctcgacaa cgaggaaaac gaggacattc tggaggacat 9240
cgtgctcact cttaccctgt tcgaagatcg ggagatgatc gaggaacgac tcaagacata 9300
cgctcacctg ttcgacgaca aggtcatgaa acaactcaag cgacgtagat acaccggctg 9360
gggaagactt tcgcgaaagc tcatcaacgg catcagagac aagcagtccg gaaagaccat 9420
tctggacttt ctcaagtccg atggctttgc caaccgaaac ttcatgcagc tcattcacga 9480
cgattctctt accttcaagg aggacatcca gaaggcacaa gtgtccggtc agggcgacag 9540
cttgcacgaa catattgcca acctggctgg ttcgccagcc atcaagaaag gcattctcca 9600
gactgtcaag gttgtcgacg agctggtgaa ggtcatggga cgtcacaagc ccgagaacat 9660
tgtgatcgag atggccagag agaaccagac aactcaaaag ggtcagaaaa actcgcgaga 9720
gcggatgaag cgaatcgagg aaggcatcaa ggagctggga tcccagattc tcaaggagca 9780
tcccgtcgag aacactcaac tgcagaacga gaagctgtat ctctactatc tgcagaatgg 9840
tcgagacatg tacgtggatc aggaactgga catcaatcgt ctcagcgact acgatgtgga 9900
ccacattgtc cctcaatcct ttctcaagga cgattctatc gacaacaagg tccttacacg 9960
atccgacaag aacagaggca agtcggacaa cgttcccagc gaagaggtgg tcaaaaagat 10020
gaagaactac tggcgacagc tgctcaacgc caagctcatt acccagcgaa agttcgacaa 10080
tcttaccaag gccgagcgag gcggtctgtc cgagctcgac aaggctggct tcatcaagcg 10140
tcaactcgtc gagaccagac agatcacaaa gcacgtcgca cagattctcg attctcggat 10200
gaacaccaag tacgacgaga acgacaagct catccgagag gtcaaggtga ttactctcaa 10260
gtccaaactg gtctccgatt tccgaaagga ctttcagttc tacaaggtgc gagagatcaa 10320
caattaccac catgcccacg atgcttacct caacgccgtc gttggcactg cgctcatcaa 10380
gaaatacccc aagctcgaaa gcgagttcgt ttacggcgat tacaaggtct acgacgttcg 10440
aaagatgatt gccaagtccg aacaggagat tggcaaggct actgccaagt acttctttta 10500
ctccaacatc atgaactttt tcaagaccga gatcaccttg gccaacggag agattcgaaa 10560
gagaccactt atcgagacca acggcgaaac tggagagatc gtgtgggaca agggtcgaga 10620
ctttgcaacc gtgcgaaagg ttctgtcgat gcctcaggtc aacatcgtca agaaaaccga 10680
ggttcagact ggcggattct ccaaggagtc gattctgccc aagcgaaact ccgacaagct 10740
catcgctcga aagaaagact gggatcccaa gaaatacggt ggcttcgatt ctcctaccgt 10800
cgcctattcc gtgcttgtcg ttgcgaaggt cgagaagggc aagtccaaaa agctcaagtc 10860
cgtcaaggag ctgctcggaa ttaccatcat ggagcgatcg agcttcgaga agaatcccat 10920
cgacttcttg gaagccaagg gttacaagga ggtcaagaaa gacctcatta tcaagctgcc 10980
caagtactct ctgttcgaac tggagaacgg tcgaaagcgt atgctcgcct ccgctggcga 11040
gctgcagaag ggaaacgagc ttgccttgcc ttcgaagtac gtcaactttc tctatctggc 11100
ttctcactac gagaagctca agggttctcc cgaggacaac gaacagaagc aactcttcgt 11160
tgagcagcac aaacattacc tcgacgagat tatcgagcag atttccgagt tttcgaagcg 11220
agtcatcctg gctgatgcca acttggacaa ggtgctctct gcctacaaca agcatcggga 11280
caaacccatt cgagaacagg cggagaacat cattcacctg tttactctta ccaacctggg 11340
tgctcctgca gctttcaagt acttcgatac cactatcgac cgaaagcggt acacatccac 11400
caaggaggtt ctcgatgcca ccctgattca ccagtccatc actggcctgt acgagacccg 11460
aatcgacctg tctcagcttg gtggcgactc cagagccgat cccaagaaaa agcgaaaggt 11520
ctaagc 11526
<210> 132
<211> 8064
<212> DNA
<213> 人工序列
<220>
<223> pRF201
<400> 132
aaaccatcat ctaagggcct caaaactacc tcggaactgc tgcgctgatc tggacaccac 60
agaggttccg agcactttag gttgcaccaa atgtcccacc aggtgcaggc agaaaacgct 120
ggaacagcgt gtacagtttg tcttaacaaa aagtgagggc gctgaggtcg agcagggtgg 180
tgtgacttgt tatagccttt agagctgcga aagcgcgtat ggatttggct catcaggcca 240
gattgagggt ctgtggacac atgtcatgtt agtgtacttc aatcgccccc tggatatagc 300
cccgacaata ggccgtggcc tcattttttt gccttccgca catttccatt gctcggtacc 360
cacaccttgc ttctcctgca cttgccaacc ttaatactgg tttacattga ccaacatctt 420
acaagcgggg ggcttgtcta gggtatatat aaacagtggc tctcccaatc ggttgccagt 480
ctcttttttc ctttctttcc ccacagattc gaaatctaaa ctacacatca caccatggcc 540
tcctcggagg acgtcatcaa ggagttcatg cgattcaagg tccgaatgga aggctccgtg 600
aacggtcacg agtttgagat tgagggagag ggtgaaggcc gaccctacga aggcacccag 660
accgcgaagc tgaaggtgac caagggtgga cccctgccct tcgcctggga cattctgtct 720
cctcagtttc agtacggttc taaggtgtac gtgaagcacc ctgctgacat tcccgactac 780
aagaaacttt cctttcccga gggcttcaag tgggagcgag ttatgaactt cgaggatggc 840
ggtgtcgtta ccgttactca ggactcctcg ctccaggacg gctcgttcat ctacaaggtt 900
aagttcatcg gtgtcaactt ccctagcgat ggacccgtca tgcaaaagaa aactatggga 960
tgggaagcct ctacagagcg gctgtaccct cgagacggag tgttgaaggg cgagattcac 1020
aaggccctga agctcaagga cggtggacac tatctcgttg agtttaagtc tatctacatg 1080
gcaaagaaac ccgtgcagct tccaggctac tattacgtcg attccaagct cgatatcacc 1140
agccataatg aggactacac tattgtcgaa cagtacgagc gtgctgaggg aagacaccat 1200
ctgtttcttt aagcggccgc aagtgtggat ggggaagtga gtgcccggtt ctgtgtgcac 1260
aattggcaat ccaagatgga tggattcaac acagggatat agcgagctac gtggtggtgc 1320
gaggatatag caacggatat ttatgtttga cacttgagaa tgtacgatac aagcactgtc 1380
caagtacaat actaaacata ctgtacatac tcatactcgt acccgggcaa cggtttcact 1440
tgagtgcagt ggctagtgct cttactcgta cagtgtgcaa tactgcgtat catagtcttt 1500
gatgtatatc gtattcattc atgttagttg cgtacgggcg tcgttgcttg tgtgattttt 1560
gaggacccat ccctttggta tataagtata ctctggggtt aaggttgccc gtgtagtcta 1620
ggttatagtt ttcatgtgaa ataccgagag ccgagggaga ataaacgggg gtatttggac 1680
ttgttttttt cgcggaaaag cgtcgaatca accctgcggg ccttgcacca tgtccacgac 1740
gtgtttctcg ccccaattcg ccccttgcac gtcaaaatta ggcctccatc tagacccctc 1800
cataacatgt gactgtgggg aaaagtataa gggaaaccat gcaaccatag acgacgtgaa 1860
agacggggag gaaccaatgg aggccaaaga aatggggtag caacagtcca ggagacagac 1920
aaggagacaa ggagagggcg cccgaaagat cggaaaaaca aacatgtcca attggggcag 1980
tgacggaaac gacacggaca cttcagtaca atggaccgac catctccaag ccagggttat 2040
tccggtatca ccttggccgt aacctcccgc tggtacctga tattgtacac gttcacattc 2100
aatatacttt cagctacaat aagagaggct gtttgtcggg catgtgtgtc cgtcgtatgg 2160
ggtgatgtcc gagggcgaaa ttcgctacaa gcttaactct ggcgcttgtc cagtatgaat 2220
agacaagtca agaccagtgg tgccatgatt gacagggagg tacaagactt cgatactcga 2280
gcattactcg gacttgtggc gattgaacag acgggcgatc gcttctcccc cgtattgccg 2340
gcgcgccagc tgcattaatg aatcggccaa cgcgcgggga gaggcggttt gcgtattggg 2400
cgctcttccg cttcctcgct cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg 2460
gtatcagctc actcaaaggc ggtaatacgg ttatccacag aatcagggga taacgcagga 2520
aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg 2580
gcgtttttcc ataggctccg cccccctgac gagcatcaca aaaatcgacg ctcaagtcag 2640
aggtggcgaa acccgacagg actataaaga taccaggcgt ttccccctgg aagctccctc 2700
gtgcgctctc ctgttccgac cctgccgctt accggatacc tgtccgcctt tctcccttcg 2760
ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt 2820
cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc 2880
ggtaactatc gtcttgagtc caacccggta agacacgact tatcgccact ggcagcagcc 2940
actggtaaca ggattagcag agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg 3000
tggcctaact acggctacac tagaagaaca gtatttggta tctgcgctct gctgaagcca 3060
gttaccttcg gaaaaagagt tggtagctct tgatccggca aacaaaccac cgctggtagc 3120
ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat 3180
cctttgatct tttctacggg gtctgacgct cagtggaacg aaaactcacg ttaagggatt 3240
ttggtcatga gattatcaaa aaggatcttc acctagatcc ttttaaatta aaaatgaagt 3300
tttaaatcaa tctaaagtat atatgagtaa acttggtctg acagttacca atgcttaatc 3360
agtgaggcac ctatctcagc gatctgtcta tttcgttcat ccatagttgc ctgactcccc 3420
gtcgtgtaga taactacgat acgggagggc ttaccatctg gccccagtgc tgcaatgata 3480
ccgcgagacc cacgctcacc ggctccagat ttatcagcaa taaaccagcc agccggaagg 3540
gccgagcgca gaagtggtcc tgcaacttta tccgcctcca tccagtctat taattgttgc 3600
cgggaagcta gagtaagtag ttcgccagtt aatagtttgc gcaacgttgt tgccattgct 3660
acaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt cattcagctc cggttcccaa 3720
cgatcaaggc gagttacatg atcccccatg ttgtgcaaaa aagcggttag ctccttcggt 3780
cctccgatcg ttgtcagaag taagttggcc gcagtgttat cactcatggt tatggcagca 3840
ctgcataatt ctcttactgt catgccatcc gtaagatgct tttctgtgac tggtgagtac 3900
tcaaccaagt cattctgaga atagtgtatg cggcgaccga gttgctcttg cccggcgtca 3960
atacgggata ataccgcgcc acatagcaga actttaaaag tgctcatcat tggaaaacgt 4020
tcttcggggc gaaaactctc aaggatctta ccgctgttga gatccagttc gatgtaaccc 4080
actcgtgcac ccaactgatc ttcagcatct tttactttca ccagcgtttc tgggtgagca 4140
aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg cgacacggaa atgttgaata 4200
ctcatactct tcctttttca atattattga agcatttatc agggttattg tctcatgagc 4260
ggatacatat ttgaatgtat ttagaaaaat aaacaaatag gggttccgcg cacatttccc 4320
cgaaaagtgc cacctgatgc ggtgtgaaat accgcacaga tgcgtaagga gaaaataccg 4380
catcaggaaa ttgtaagcgt taatattttg ttaaaattcg cgttaaattt ttgttaaatc 4440
agctcatttt ttaaccaata ggccgaaatc ggcaaaatcc cttataaatc aaaagaatag 4500
accgagatag ggttgagtgt tgttccagtt tggaacaaga gtccactatt aaagaacgtg 4560
gactccaacg tcaaagggcg aaaaaccgtc tatcagggcg atggcccact acgtgaacca 4620
tcaccctaat caagtttttt ggggtcgagg tgccgtaaag cactaaatcg gaaccctaaa 4680
gggagccccc gatttagagc ttgacgggga aagccggcga acgtggcgag aaaggaaggg 4740
aagaaagcga aaggagcggg cgctagggcg ctggcaagtg tagcggtcac gctgcgcgta 4800
accaccacac ccgccgcgct taatgcgccg ctacagggcg cgtccattcg ccattcaggc 4860
tgcgcaactg ttgggaaggg cgatcggtgc gggcctcttc gctattacgc cagctggcga 4920
aagggggatg tgctgcaagg cgattaagtt gggtaacgcc agggttttcc cagtcacgac 4980
gttgtaaaac gacggccagt gaattgtaat acgactcact atagggcgaa ttgggcccga 5040
cgtcgcatgc gctgatgaca ctttggtctg aaagagatgc attttgaatc ccaaacttgc 5100
agtgcccaag tgacatacat ctccgcgttt tggaaaatgt tcagaaacag ttgattgtgt 5160
tggaatgggg aatggggaat ggaaaaatga ctcaagtatc aattccaaaa acttctctgg 5220
ctggcagtac ctactgtcca tactactgca ttttctccag tcaggccact ctatactcga 5280
cgacacagta gtaaaaccca gataatttcg acataaacaa gaaaacagac ccaataatat 5340
ttatatatag tcagccgttt gtccagttca gactgtaata gccgaaaaaa aatccaaagt 5400
ttctattcta ggaaaatata ttccaatatt tttaattctt aatctcattt attttattct 5460
agcgaaatac atttcagcta cttgagacat gtgataccca caaatcggat tcggactcgg 5520
ttgttcagaa gagcatatgg cattcgtgct cgcttgttca cgtattcttc ctgttccatc 5580
tcttggccga caatcacaca aaaatggggt ttttttttta attctaatga ttcattacag 5640
caaaattgag atatagcaga ccacgtattc cataatcacc aaggaagttc ttgggcgtct 5700
taattaagtt gcgacacatg tcttgatagt atcttggctt ctctctcttg agcttttcca 5760
taacaagttc ttctgcctcc aggaagtcca tggtgaatga ttcttatact cagaaggaaa 5820
tgcttaacga tttcgggtgt gagttgacaa ggagagagag aaaagaagag gaaaggtaat 5880
tcggggacgg tggtctttta tacccttggc taaagtccca accacaaagc aaaaaaattt 5940
tcagtagtct attttgcgtc cggcatgggt tacccggatg gccagacaaa gaaactagta 6000
caaagtctga acaagcgtag attccagact gcagtaccct acgcccttaa cggcaagtgt 6060
gggaaccggg ggaggtttga tatgtggggt gaagggggct ctcgccgggg ttgggcccgc 6120
tactgggtca atttggggtc aattggggca attggggctg ttttttggga cacaaatacg 6180
ccgccaaccc ggtctctcct gaattctgca gatgggctgc aggaattccg tcgtcgcctg 6240
agtcgacatc atttatttac cagttggcca caaacccttg acgatctcgt atgtcccctc 6300
cgacatactc ccggccggct ggggtacgtt cgatagcgct atcggcatcg acaaggtttg 6360
ggtccctagc cgataccgca ctacctgagt cacaatcttc ggaggtttag tcttccacat 6420
agcacgggca aaagtgcgta tatatacaag agcgtttgcc agccacagat tttcactcca 6480
cacaccacat cacacataca accacacaca tccacaatgg aacccgaaac taagaagacc 6540
aagactgact ccaagaagat tgttcttctc ggcggcgact tctgtggccc cgaggtgatt 6600
gccgaggccg tcaaggtgct caagtctgtt gctgaggcct ccggcaccga gtttgtgttt 6660
gaggaccgac tcattggagg agctgccatt gagaaggagg gcgagcccat caccgacgct 6720
actctcgaca tctgccgaaa ggctgactct attatgctcg gtgctgtcgg aggcgctgcc 6780
aacaccgtat ggaccactcc cgacggacga accgacgtgc gacccgagca gggtctcctc 6840
aagctgcgaa aggacctgaa cctgtacgcc aacctgcgac cctgccagct gctgtcgccc 6900
aagctcgccg atctctcccc catccgaaac gttgagggca ccgacttcat cattgtccga 6960
gagctcgtcg gaggtatcta ctttggagag cgaaaggagg atgacggatc tggcgtcgct 7020
tccgacaccg agacctactc cgttcctgag gttgagcgaa ttgcccgaat ggccgccttc 7080
ctggcccttc agcacaaccc ccctcttccc gtgtggtctc ttgacaaggc caacgtgctg 7140
gcctcctctc gactttggcg aaagactgtc actcgagtcc tcaaggacga attcccccag 7200
ctcgagctca accaccagct gatcgactcg gccgccatga tcctcatcaa gcagccctcc 7260
aagatgaatg gtatcatcat caccaccaac atgtttggcg atatcatctc cgacgaggcc 7320
tccgtcatcc ccggttctct gggtctgctg ccctccgcct ctctggcttc tctgcccgac 7380
accaacgagg cgttcggtct gtacgagccc tgtcacggat ctgcccccga tctcggcaag 7440
cagaaggtca accccattgc caccattctg tctgccgcca tgatgctcaa gttctctctt 7500
aacatgaagc ccgccggtga cgctgttgag gctgccgtca aggagtccgt cgaggctggt 7560
atcactaccg ccgatatcgg aggctcttcc tccacctccg aggtcggaga cttgttgcca 7620
acaaggtcaa ggagctgctc aagaaggagt aagtcgtttc tacgacgcat tgatggaagg 7680
agcaaactga cgcgcctgcg ggttggtcta ccggcagggt ccgctagtgt ataagactct 7740
ataaaaaggg ccctgccctg ctaatgaaat gatgatttat aatttaccgg tgtagcaacc 7800
ttgactagaa gaagcagatt gggtgtgttt gtagtggagg acagtggtac gttttggaaa 7860
cagtcttctt gaaagtgtct tgtctacagt atattcactc ataacctcaa tagccaaggg 7920
tgtagtcggt ttattaaagg aagggagttg tggctgatgt ggatagatat ctttaagctg 7980
gcgactgcac ccaacgagtg tggtggtagc ttgttagatc tgtatattcg gtaagatata 8040
ttttgtgggg ttttagtggt gttt 8064
<210> 133
<211> 5356
<212> DNA
<213> 人工序列
<220>
<223> 来自pRF201的AscI/SphI整合片段
<400> 133
cgctgatgac actttggtct gaaagagatg cattttgaat cccaaacttg cagtgcccaa 60
gtgacataca tctccgcgtt ttggaaaatg ttcagaaaca gttgattgtg ttggaatggg 120
gaatggggaa tggaaaaatg actcaagtat caattccaaa aacttctctg gctggcagta 180
cctactgtcc atactactgc attttctcca gtcaggccac tctatactcg acgacacagt 240
agtaaaaccc agataatttc gacataaaca agaaaacaga cccaataata tttatatata 300
gtcagccgtt tgtccagttc agactgtaat agccgaaaaa aaatccaaag tttctattct 360
aggaaaatat attccaatat ttttaattct taatctcatt tattttattc tagcgaaata 420
catttcagct acttgagaca tgtgataccc acaaatcgga ttcggactcg gttgttcaga 480
agagcatatg gcattcgtgc tcgcttgttc acgtattctt cctgttccat ctcttggccg 540
acaatcacac aaaaatgggg tttttttttt aattctaatg attcattaca gcaaaattga 600
gatatagcag accacgtatt ccataatcac caaggaagtt cttgggcgtc ttaattaagt 660
tgcgacacat gtcttgatag tatcttggct tctctctctt gagcttttcc ataacaagtt 720
cttctgcctc caggaagtcc atggtgaatg attcttatac tcagaaggaa atgcttaacg 780
atttcgggtg tgagttgaca aggagagaga gaaaagaaga ggaaaggtaa ttcggggacg 840
gtggtctttt atacccttgg ctaaagtccc aaccacaaag caaaaaaatt ttcagtagtc 900
tattttgcgt ccggcatggg ttacccggat ggccagacaa agaaactagt acaaagtctg 960
aacaagcgta gattccagac tgcagtaccc tacgccctta acggcaagtg tgggaaccgg 1020
gggaggtttg atatgtgggg tgaagggggc tctcgccggg gttgggcccg ctactgggtc 1080
aatttggggt caattggggc aattggggct gttttttggg acacaaatac gccgccaacc 1140
cggtctctcc tgaattctgc agatgggctg caggaattcc gtcgtcgcct gagtcgacat 1200
catttattta ccagttggcc acaaaccctt gacgatctcg tatgtcccct ccgacatact 1260
cccggccggc tggggtacgt tcgatagcgc tatcggcatc gacaaggttt gggtccctag 1320
ccgataccgc actacctgag tcacaatctt cggaggttta gtcttccaca tagcacgggc 1380
aaaagtgcgt atatatacaa gagcgtttgc cagccacaga ttttcactcc acacaccaca 1440
tcacacatac aaccacacac atccacaatg gaacccgaaa ctaagaagac caagactgac 1500
tccaagaaga ttgttcttct cggcggcgac ttctgtggcc ccgaggtgat tgccgaggcc 1560
gtcaaggtgc tcaagtctgt tgctgaggcc tccggcaccg agtttgtgtt tgaggaccga 1620
ctcattggag gagctgccat tgagaaggag ggcgagccca tcaccgacgc tactctcgac 1680
atctgccgaa aggctgactc tattatgctc ggtgctgtcg gaggcgctgc caacaccgta 1740
tggaccactc ccgacggacg aaccgacgtg cgacccgagc agggtctcct caagctgcga 1800
aaggacctga acctgtacgc caacctgcga ccctgccagc tgctgtcgcc caagctcgcc 1860
gatctctccc ccatccgaaa cgttgagggc accgacttca tcattgtccg agagctcgtc 1920
ggaggtatct actttggaga gcgaaaggag gatgacggat ctggcgtcgc ttccgacacc 1980
gagacctact ccgttcctga ggttgagcga attgcccgaa tggccgcctt cctggccctt 2040
cagcacaacc cccctcttcc cgtgtggtct cttgacaagg ccaacgtgct ggcctcctct 2100
cgactttggc gaaagactgt cactcgagtc ctcaaggacg aattccccca gctcgagctc 2160
aaccaccagc tgatcgactc ggccgccatg atcctcatca agcagccctc caagatgaat 2220
ggtatcatca tcaccaccaa catgtttggc gatatcatct ccgacgaggc ctccgtcatc 2280
cccggttctc tgggtctgct gccctccgcc tctctggctt ctctgcccga caccaacgag 2340
gcgttcggtc tgtacgagcc ctgtcacgga tctgcccccg atctcggcaa gcagaaggtc 2400
aaccccattg ccaccattct gtctgccgcc atgatgctca agttctctct taacatgaag 2460
cccgccggtg acgctgttga ggctgccgtc aaggagtccg tcgaggctgg tatcactacc 2520
gccgatatcg gaggctcttc ctccacctcc gaggtcggag acttgttgcc aacaaggtca 2580
aggagctgct caagaaggag taagtcgttt ctacgacgca ttgatggaag gagcaaactg 2640
acgcgcctgc gggttggtct accggcaggg tccgctagtg tataagactc tataaaaagg 2700
gccctgccct gctaatgaaa tgatgattta taatttaccg gtgtagcaac cttgactaga 2760
agaagcagat tgggtgtgtt tgtagtggag gacagtggta cgttttggaa acagtcttct 2820
tgaaagtgtc ttgtctacag tatattcact cataacctca atagccaagg gtgtagtcgg 2880
tttattaaag gaagggagtt gtggctgatg tggatagata tctttaagct ggcgactgca 2940
cccaacgagt gtggtggtag cttgttagat ctgtatattc ggtaagatat attttgtggg 3000
gttttagtgg tgtttaaacc atcatctaag ggcctcaaaa ctacctcgga actgctgcgc 3060
tgatctggac accacagagg ttccgagcac tttaggttgc accaaatgtc ccaccaggtg 3120
caggcagaaa acgctggaac agcgtgtaca gtttgtctta acaaaaagtg agggcgctga 3180
ggtcgagcag ggtggtgtga cttgttatag cctttagagc tgcgaaagcg cgtatggatt 3240
tggctcatca ggccagattg agggtctgtg gacacatgtc atgttagtgt acttcaatcg 3300
ccccctggat atagccccga caataggccg tggcctcatt tttttgcctt ccgcacattt 3360
ccattgctcg gtacccacac cttgcttctc ctgcacttgc caaccttaat actggtttac 3420
attgaccaac atcttacaag cggggggctt gtctagggta tatataaaca gtggctctcc 3480
caatcggttg ccagtctctt ttttcctttc tttccccaca gattcgaaat ctaaactaca 3540
catcacacca tggcctcctc ggaggacgtc atcaaggagt tcatgcgatt caaggtccga 3600
atggaaggct ccgtgaacgg tcacgagttt gagattgagg gagagggtga aggccgaccc 3660
tacgaaggca cccagaccgc gaagctgaag gtgaccaagg gtggacccct gcccttcgcc 3720
tgggacattc tgtctcctca gtttcagtac ggttctaagg tgtacgtgaa gcaccctgct 3780
gacattcccg actacaagaa actttccttt cccgagggct tcaagtggga gcgagttatg 3840
aacttcgagg atggcggtgt cgttaccgtt actcaggact cctcgctcca ggacggctcg 3900
ttcatctaca aggttaagtt catcggtgtc aacttcccta gcgatggacc cgtcatgcaa 3960
aagaaaacta tgggatggga agcctctaca gagcggctgt accctcgaga cggagtgttg 4020
aagggcgaga ttcacaaggc cctgaagctc aaggacggtg gacactatct cgttgagttt 4080
aagtctatct acatggcaaa gaaacccgtg cagcttccag gctactatta cgtcgattcc 4140
aagctcgata tcaccagcca taatgaggac tacactattg tcgaacagta cgagcgtgct 4200
gagggaagac accatctgtt tctttaagcg gccgcaagtg tggatgggga agtgagtgcc 4260
cggttctgtg tgcacaattg gcaatccaag atggatggat tcaacacagg gatatagcga 4320
gctacgtggt ggtgcgagga tatagcaacg gatatttatg tttgacactt gagaatgtac 4380
gatacaagca ctgtccaagt acaatactaa acatactgta catactcata ctcgtacccg 4440
ggcaacggtt tcacttgagt gcagtggcta gtgctcttac tcgtacagtg tgcaatactg 4500
cgtatcatag tctttgatgt atatcgtatt cattcatgtt agttgcgtac gggcgtcgtt 4560
gcttgtgtga tttttgagga cccatccctt tggtatataa gtatactctg gggttaaggt 4620
tgcccgtgta gtctaggtta tagttttcat gtgaaatacc gagagccgag ggagaataaa 4680
cgggggtatt tggacttgtt tttttcgcgg aaaagcgtcg aatcaaccct gcgggccttg 4740
caccatgtcc acgacgtgtt tctcgcccca attcgcccct tgcacgtcaa aattaggcct 4800
ccatctagac ccctccataa catgtgactg tggggaaaag tataagggaa accatgcaac 4860
catagacgac gtgaaagacg gggaggaacc aatggaggcc aaagaaatgg ggtagcaaca 4920
gtccaggaga cagacaagga gacaaggaga gggcgcccga aagatcggaa aaacaaacat 4980
gtccaattgg ggcagtgacg gaaacgacac ggacacttca gtacaatgga ccgaccatct 5040
ccaagccagg gttattccgg tatcaccttg gccgtaacct cccgctggta cctgatattg 5100
tacacgttca cattcaatat actttcagct acaataagag aggctgtttg tcgggcatgt 5160
gtgtccgtcg tatggggtga tgtccgaggg cgaaattcgc tacaagctta actctggcgc 5220
ttgtccagta tgaatagaca agtcaagacc agtggtgcca tgattgacag ggaggtacaa 5280
gacttcgata ctcgagcatt actcggactt gtggcgattg aacagacggg cgatcgcttc 5340
tcccccgtat tgccgg 5356
<210> 134
<211> 38
<212> DNA
<213> 人工序列
<220>
<223> HY026
<400> 134
gcgcgtttaa accatcatct aagggcctca aaactacc 38
<210> 135
<211> 38
<212> DNA
<213> 人工序列
<220>
<223> HY027
<400> 135
gagagcggcc gcttaaagaa acagatggtg tcttccct 38
<210> 136
<211> 11952
<212> DNA
<213> 人工序列
<220>
<223> pRF169
<400> 136
catggacaag aaatactcca tcggcctgga cattggaacc aactctgtcg gctgggctgt 60
catcaccgac gagtacaagg tgccctccaa gaaattcaag gtcctcggaa acaccgatcg 120
acactccatc aagaaaaacc tcattggtgc cctgttgttc gattctggcg agactgccga 180
agctaccaga ctcaagcgaa ctgctcggcg acgttacacc cgacggaaga accgaatctg 240
ctacctgcag gagatctttt ccaacgagat ggccaaggtg gacgattcgt tctttcatcg 300
actggaggaa tccttcctcg tcgaggaaga caagaaacac gagcgtcatc ccatctttgg 360
caacattgtg gacgaggttg cttaccacga gaagtatcct accatctacc atctccgaaa 420
gaaactcgtc gattccaccg acaaggcgga tctcagactt atctacctcg ctctggcaca 480
catgatcaag tttcgaggtc atttcctcat cgagggcgat ctcaatcccg acaacagcga 540
tgtggacaag ctgttcattc agctcgttca gacctacaac cagctgttcg aggaaaaccc 600
catcaatgcc tccggagtcg atgcaaaggc catcttgtct gctcgactct cgaagagcag 660
acgactggag aacctcattg cccaacttcc tggcgagaaa aagaacggac tgtttggcaa 720
cctcattgcc ctttctcttg gtctcacacc caacttcaag tccaacttcg atctggcgga 780
ggacgccaag ctccagctgt ccaaggacac ctacgacgat gacctcgaca acctgcttgc 840
acagattggc gatcagtacg ccgacctgtt tctcgctgcc aagaaccttt cggatgctat 900
tctcttgtct gacattctgc gagtcaacac cgagatcaca aaggctcccc tttctgcctc 960
catgatcaag cgatacgacg agcaccatca ggatctcaca ctgctcaagg ctcttgtccg 1020
acagcaactg cccgagaagt acaaggagat ctttttcgat cagtcgaaga acggctacgc 1080
tggatacatc gacggcggag cctctcagga agagttctac aagttcatca agccaattct 1140
cgagaagatg gacggaaccg aggaactgct tgtcaagctc aatcgagagg atctgcttcg 1200
gaagcaacga accttcgaca acggcagcat tcctcatcag atccacctcg gtgagctgca 1260
cgccattctt cgacgtcagg aagacttcta cccctttctc aaggacaacc gagagaagat 1320
cgagaagatt cttacctttc gaatccccta ctatgttggt cctcttgcca gaggaaactc 1380
tcgatttgct tggatgactc gaaagtccga ggaaaccatc actccctgga acttcgagga 1440
agtcgtggac aagggtgcct ctgcacagtc cttcatcgag cgaatgacca acttcgacaa 1500
gaatctgccc aacgagaagg ttcttcccaa gcattcgctg ctctacgagt actttacagt 1560
ctacaacgaa ctcaccaaag tcaagtacgt taccgaggga atgcgaaagc ctgccttctt 1620
gtctggcgaa cagaagaaag ccattgtcga tctcctgttc aagaccaacc gaaaggtcac 1680
tgttaagcag ctcaaggagg actacttcaa gaaaatcgag tgtttcgaca gcgtcgagat 1740
ttccggagtt gaggaccgat tcaacgcctc tttgggcacc tatcacgatc tgctcaagat 1800
tatcaaggac aaggattttc tcgacaacga ggaaaacgag gacattctgg aggacatcgt 1860
gctcactctt accctgttcg aagatcggga gatgatcgag gaacgactca agacatacgc 1920
tcacctgttc gacgacaagg tcatgaaaca actcaagcga cgtagataca ccggctgggg 1980
aagactttcg cgaaagctca tcaacggcat cagagacaag cagtccggaa agaccattct 2040
ggactttctc aagtccgatg gctttgccaa ccgaaacttc atgcagctca ttcacgacga 2100
ttctcttacc ttcaaggagg acatccagaa ggcacaagtg tccggtcagg gcgacagctt 2160
gcacgaacat attgccaacc tggctggttc gccagccatc aagaaaggca ttctccagac 2220
tgtcaaggtt gtcgacgagc tggtgaaggt catgggacgt cacaagcccg agaacattgt 2280
gatcgagatg gccagagaga accagacaac tcaaaagggt cagaaaaact cgcgagagcg 2340
gatgaagcga atcgaggaag gcatcaagga gctgggatcc cagattctca aggagcatcc 2400
cgtcgagaac actcaactgc agaacgagaa gctgtatctc tactatctgc agaatggtcg 2460
agacatgtac gtggatcagg aactggacat caatcgtctc agcgactacg atgtggacca 2520
cattgtccct caatcctttc tcaaggacga ttctatcgac aacaaggtcc ttacacgatc 2580
cgacaagaac agaggcaagt cggacaacgt tcccagcgaa gaggtggtca aaaagatgaa 2640
gaactactgg cgacagctgc tcaacgccaa gctcattacc cagcgaaagt tcgacaatct 2700
taccaaggcc gagcgaggcg gtctgtccga gctcgacaag gctggcttca tcaagcgtca 2760
actcgtcgag accagacaga tcacaaagca cgtcgcacag attctcgatt ctcggatgaa 2820
caccaagtac gacgagaacg acaagctcat ccgagaggtc aaggtgatta ctctcaagtc 2880
caaactggtc tccgatttcc gaaaggactt tcagttctac aaggtgcgag agatcaacaa 2940
ttaccaccat gcccacgatg cttacctcaa cgccgtcgtt ggcactgcgc tcatcaagaa 3000
ataccccaag ctcgaaagcg agttcgttta cggcgattac aaggtctacg acgttcgaaa 3060
gatgattgcc aagtccgaac aggagattgg caaggctact gccaagtact tcttttactc 3120
caacatcatg aactttttca agaccgagat caccttggcc aacggagaga ttcgaaagag 3180
accacttatc gagaccaacg gcgaaactgg agagatcgtg tgggacaagg gtcgagactt 3240
tgcaaccgtg cgaaaggttc tgtcgatgcc tcaggtcaac atcgtcaaga aaaccgaggt 3300
tcagactggc ggattctcca aggagtcgat tctgcccaag cgaaactccg acaagctcat 3360
cgctcgaaag aaagactggg atcccaagaa atacggtggc ttcgattctc ctaccgtcgc 3420
ctattccgtg cttgtcgttg cgaaggtcga gaagggcaag tccaaaaagc tcaagtccgt 3480
caaggagctg ctcggaatta ccatcatgga gcgatcgagc ttcgagaaga atcccatcga 3540
cttcttggaa gccaagggtt acaaggaggt caagaaagac ctcattatca agctgcccaa 3600
gtactctctg ttcgaactgg agaacggtcg aaagcgtatg ctcgcctccg ctggcgagct 3660
gcagaaggga aacgagcttg ccttgccttc gaagtacgtc aactttctct atctggcttc 3720
tcactacgag aagctcaagg gttctcccga ggacaacgaa cagaagcaac tcttcgttga 3780
gcagcacaaa cattacctcg acgagattat cgagcagatt tccgagtttt cgaagcgagt 3840
catcctggct gatgccaact tggacaaggt gctctctgcc tacaacaagc atcgggacaa 3900
acccattcga gaacaggcgg agaacatcat tcacctgttt actcttacca acctgggtgc 3960
tcctgcagct ttcaagtact tcgataccac tatcgaccga aagcggtaca catccaccaa 4020
ggaggttctc gatgccaccc tgattcacca gtccatcact ggcctgtacg agacccgaat 4080
cgacctgtct cagcttggtg gcgactccag agccgatccc aagaaaaagc gaaaggtcta 4140
agcggccgca agtgtggatg gggaagtgag tgcccggttc tgtgtgcaca attggcaatc 4200
caagatggat ggattcaaca cagggatata gcgagctacg tggtggtgcg aggatatagc 4260
aacggatatt tatgtttgac acttgagaat gtacgataca agcactgtcc aagtacaata 4320
ctaaacatac tgtacatact catactcgta cccgggcaac ggtttcactt gagtgcagtg 4380
gctagtgctc ttactcgtac agtgtgcaat actgcgtatc atagtctttg atgtatatcg 4440
tattcattca tgttagttgc gtacgagccg gaagcataaa gtgtaaagcc tggggtgcct 4500
aatgagtgag ctaactcaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa 4560
acctgtcgtg ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta 4620
ttgggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc 4680
gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg 4740
caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt 4800
tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa 4860
gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct 4920
ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc 4980
cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg 5040
tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct 5100
tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag 5160
cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga 5220
agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc gctctgctga 5280
agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg 5340
gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag 5400
aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag 5460
ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat 5520
gaagttttaa atcaatctaa agtatatatg agtaaacttg gtctgacagt taccaatgct 5580
taatcagtga ggcacctatc tcagcgatct gtctatttcg ttcatccata gttgcctgac 5640
tccccgtcgt gtagataact acgatacggg agggcttacc atctggcccc agtgctgcaa 5700
tgataccgcg agacccacgc tcaccggctc cagatttatc agcaataaac cagccagccg 5760
gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag tctattaatt 5820
gttgccggga agctagagta agtagttcgc cagttaatag tttgcgcaac gttgttgcca 5880
ttgctacagg catcgtggtg tcacgctcgt cgtttggtat ggcttcattc agctccggtt 5940
cccaacgatc aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg gttagctcct 6000
tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt gttatcactc atggttatgg 6060
cagcactgca taattctctt actgtcatgc catccgtaag atgcttttct gtgactggtg 6120
agtactcaac caagtcattc tgagaatagt gtatgcggcg accgagttgc tcttgcccgg 6180
cgtcaatacg ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa 6240
aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt 6300
aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt 6360
gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt 6420
gaatactcat actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca 6480
tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 6540
ttccccgaaa agtgccacct gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg 6600
tggttacgcg cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt 6660
tcttcccttc ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc 6720
tccctttagg gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg 6780
gtgatggttc acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg 6840
agtccacgtt ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct 6900
cggtctattc ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg 6960
agctgattta acaaaaattt aacgcgaatt ttaacaaaat attaacgctt acaatttcca 7020
ttcgccattc aggctgcgca actgttggga agggcgatcg gtgcgggcct cttcgctatt 7080
acgccagctg gcgaaagggg gatgtgctgc aaggcgatta agttgggtaa cgccagggtt 7140
ttcccagtca cgacgttgta aaacgacggc cagtgaattg taatacgact cactataggg 7200
cgaattgggt accgggcccc ccctcgaggt cgatggtgtc gataagcttg atatcgaatt 7260
catgtcacac aaaccgatct tcgcctcaag gaaacctaat tctacatccg agagactgcc 7320
gagatccagt ctacactgat taattttcgg gccaataatt taaaaaaatc gtgttatata 7380
atattatatg tattatatat atacatcatg atgatactga cagtcatgtc ccattgctaa 7440
atagacagac tccatctgcc gcctccaact gatgttctca atatttaagg ggtcatctcg 7500
cattgtttaa taataaacag actccatcta ccgcctccaa atgatgttct caaaatatat 7560
tgtatgaact tatttttatt acttagtatt attagacaac ttacttgctt tatgaaaaac 7620
acttcctatt taggaaacaa tttataatgg cagttcgttc atttaacaat ttatgtagaa 7680
taaatgttat aaatgcgtat gggaaatctt aaatatggat agcataaatg atatctgcat 7740
tgcctaattc gaaatcaaca gcaacgaaaa aaatcccttg tacaacataa atagtcatcg 7800
agaaatatca actatcaaag aacagctatt cacacgttac tattgagatt attattggac 7860
gagaatcaca cactcaactg tctttctctc ttctagaaat acaggtacaa gtatgtacta 7920
ttctcattgt tcatacttct agtcatttca tcccacatat tccttggatt tctctccaat 7980
gaatgacatt ctatcttgca aattcaacaa ttataataag atataccaaa gtagcggtat 8040
agtggcaatc aaaaagcttc tctggtgtgc ttctcgtatt tatttttatt ctaatgatcc 8100
attaaaggta tatatttatt tcttgttata taatcctttt gtttattaca tgggctggat 8160
acataaaggt attttgattt aattttttgc ttaaattcaa tcccccctcg ttcagtgtca 8220
actgtaatgg taggaaatta ccatactttt gaagaagcaa aaaaaatgaa agaaaaaaaa 8280
aatcgtattt ccaggttaga cgttccgcag aatctagaat gcggtatgcg gtacattgtt 8340
cttcgaacgt aaaagttgcg ctccctgaga tattgtacat ttttgctttt acaagtacaa 8400
gtacatcgta caactatgta ctactgttga tgcatccaca acagtttgtt ttgttttttt 8460
ttgttttttt tttttctaat gattcattac cgctatgtat acctacttgt acttgtagta 8520
agccgggtta ttggcgttca attaatcata gacttatgaa tctgcacggt gtgcgctgcg 8580
agttactttt agcttatgca tgctacttgg gtgtaatatt gggatctgtt cggaaatcaa 8640
cggatgctca atcgatcgcc agcaacgcgg ccttagacat aaaaaacaaa aaaaaaaagc 8700
accgactcgg tgccactttt tcaagttgat aacggactag ccttatttta acttgctatt 8760
tctagctcta aaacgcaggt gtaaaaataa aaaggcctgc gattaccagc aggcctgtta 8820
ttaacctaag ccttaggacg cttcacgcca tacttggaac gagcctgctt acggtcttta 8880
acgccggagc agtcaagcgc accacgtacg gtgtggtaac gaacacccgg gaggtcttta 8940
acacgaccgc cacggatcag gatcacggag tgctcctgca ggttgtgacc ttcaccaccg 9000
atgtaggaag tcacttcgaa accgttagtc agacgaacac ggcatacttt acgcagcgcg 9060
gagttcggtt ttttaggagt ggtagtatat acacgagtac atacgccacg tttttgcggg 9120
catgcttcca gcgcaggcac gttgcttttc gcaactttgc gagcacgtgg tttgcgtacc 9180
agctggttaa ctgttgccat taaatagctc ctggttttag cttttgcttc gtaaacacgt 9240
aataaaacgt cctcacacaa tatgaggacg ccgaatttag ggcgatgccg aaaaggtgtc 9300
aagaaatata caacgatccc gccatcggcg cgcccacctg ctacgcatgg ttgatgtgtg 9360
tttaattcaa gaatgaatat agagaagaga agaagaaaaa agattcaatt gagccggcga 9420
tgcagaccct tatataaatg ttgccttgga cagacggagc aagcccgccc aaacctacgt 9480
tcggtataat atgttaagct ttttaacaca aaggtttggc ttggggtaac ctgatgtggt 9540
gcaaaagacc gggcgttggc gagccattgc gcgggcgaat ggggtcgtga ctcgtctcaa 9600
attcgagggc gtgcctcaat tcgtgccccc gtggcttttt cccgccgttt ccgccccgtt 9660
tgcaccactg cagccgcttc tttggttcgg acaccttgct gcgagctagg tgccttgtgc 9720
tacttaaaaa gtggcctccc aacaccaaca tgacatgagt gcgtgggcca agacacgttg 9780
gcggggtcgc agtcggctca atggcccgga aaaaacgctg ctggagctgg ttcggacgca 9840
gtccgccgcg gcgtatggat atccgcaagg ttccatagcg ccattgccct ccgtcggcgt 9900
ctatcccgca accttaatta agtcatacac aagtcagctt tcttcgagcc tcatataagt 9960
ataagtagtt caacgtatta gcactgtacc cagcatctcc gtatcgagaa acacaacaac 10020
atgccccatt ggacagatca tgcggataca caggttgtgc agtatcatac atactcgatc 10080
agacaggtcg tctgaccatc atacaagctg aacaagcgct ccatacttgc acgctctcta 10140
tatacacagt taaattacat atccatagtc taacctctaa cagttaatct tctggtaagc 10200
ctcccagcca gccttctggt atcgcttggc ctcctcaata ggatctcggt tctggccgta 10260
cagacctcgg ccgacaatta tgatatccgt tccggtagac atgacatcct caacagttcg 10320
gtactgctgt ccgagagcgt ctcccttgtc gtcaagaccc accccggggg tcagaataag 10380
ccagtcctca gagtcgccct taggtcggtt ctgggcaatg aagccaacca caaactcggg 10440
gtcggatcgg gcaagctcaa tggtctgctt ggagtactcg ccagtggcca gagagccctt 10500
gcaagacagc tcggccagca tgagcagacc tctggccagc ttctcgttgg gagaggggac 10560
taggaactcc ttgtactggg agttctcgta gtcagagacg tcctccttct tctgttcaga 10620
gacagtttcc tcggcaccag ctcgcaggcc agcaatgatt ccggttccgg gtacaccgtg 10680
ggcgttggtg atatcggacc actcggcgat tcggtgacac cggtactggt gcttgacagt 10740
gttgccaata tctgcgaact ttctgtcctc gaacaggaag aaaccgtgct taagagcaag 10800
ttccttgagg gggagcacag tgccggcgta ggtgaagtcg tcaatgatgt cgatatgggt 10860
tttgatcatg cacacataag gtccgacctt atcggcaagc tcaatgagct ccttggtggt 10920
ggtaacatcc agagaagcac acaggttggt tttcttggct gccacgagct tgagcactcg 10980
agcggcaaag gcggacttgt ggacgttagc tcgagcttcg taggagggca ttttggtggt 11040
gaagaggaga ctgaaataaa tttagtctgc agaacttttt atcggaacct tatctggggc 11100
agtgaagtat atgttatggt aatagttacg agttagttga acttatagat agactggact 11160
atacggctat cggtccaaat tagaaagaac gtcaatggct ctctgggcgt cgcctttgcc 11220
gacaaaaatg tgatcatgat gaaagccagc aatgacgttg cagctgatat tgttgtcggc 11280
caaccgcgcc gaaaacgcag ctgtcagacc cacagcctcc aacgaagaat gtatcgtcaa 11340
agtgatccaa gcacactcat agttggagtc gtactccaaa ggcggcaatg acgagtcaga 11400
cagatactcg tcgacgttta aaccatcatc taagggcctc aaaactacct cggaactgct 11460
gcgctgatct ggacaccaca gaggttccga gcactttagg ttgcaccaaa tgtcccacca 11520
ggtgcaggca gaaaacgctg gaacagcgtg tacagtttgt cttaacaaaa agtgagggcg 11580
ctgaggtcga gcagggtggt gtgacttgtt atagccttta gagctgcgaa agcgcgtatg 11640
gatttggctc atcaggccag attgagggtc tgtggacaca tgtcatgtta gtgtacttca 11700
atcgccccct ggatatagcc ccgacaatag gccgtggcct catttttttg ccttccgcac 11760
atttccattg ctcggtaccc acaccttgct tctcctgcac ttgccaacct taatactggt 11820
ttacattgac caacatctta caagcggggg gcttgtctag ggtatatata aacagtggct 11880
ctcccaatcg gttgccagtc tcttttttcc tttctttccc cacagattcg aaatctaaac 11940
tacacatcac ac 11952
<210> 137
<211> 564
<212> DNA
<213> 解脂耶氏酵母
<220>
<221> misc_feature
<222> (1)..(564)
<223> GPD启动子
<400> 137
ggttgcggga tagacgccga cggagggcaa tggcgctatg gaaccttgcg gatatccata 60
cgccgcggcg gactgcgtcc gaaccagctc cagcagcgtt ttttccgggc cattgagccg 120
actgcgaccc cgccaacgtg tcttggccca cgcactcatg tcatgttggt gttgggaggc 180
cactttttaa gtagcacaag gcacctagct cgcagcaagg tgtccgaacc aaagaagcgg 240
ctgcagtggt gcaaacgggg cggaaacggc gggaaaaagc cacgggggca cgaattgagg 300
cacgccctcg aatttgagac gagtcacgac cccattcgcc cgcgcaatgg ctcgccaacg 360
cccggtcttt tgcaccacat caggttaccc caagccaaac ctttgtgtta aaaagcttaa 420
catattatac cgaacgtagg tttgggcggg cttgctccgt ctgtccaagg caacatttat 480
ataagggtct gcatcgccgg ctcaattgaa tcttttttct tcttctcttc tctatattca 540
ttcttgaatt aaacacacat caac 564
<210> 138
<211> 1271
<212> DNA
<213> 人工序列
<220>
<223> GPD启动子-反向可选择标记物-CER-终止子
<400> 138
ttaattaagg ttgcgggata gacgccgacg gagggcaatg gcgctatgga accttgcgga 60
tatccatacg ccgcggcgga ctgcgtccga accagctcca gcagcgtttt ttccgggcca 120
ttgagccgac tgcgaccccg ccaacgtgtc ttggcccacg cactcatgtc atgttggtgt 180
tgggaggcca ctttttaagt agcacaaggc acctagctcg cagcaaggtg tccgaaccaa 240
agaagcggct gcagtggtgc aaacggggcg gaaacggcgg gaaaaagcca cgggggcacg 300
aattgaggca cgccctcgaa tttgagacga gtcacgaccc cattcgcccg cgcaatggct 360
cgccaacgcc cggtcttttg caccacatca ggttacccca agccaaacct ttgtgttaaa 420
aagcttaaca tattataccg aacgtaggtt tgggcgggct tgctccgtct gtccaaggca 480
acatttatat aagggtctgc atcgccggct caattgaatc ttttttcttc ttctcttctc 540
tatattcatt cttgaattaa acacacatca accatgcgta gcaggtgggc gcgccgatgg 600
cgggatcgtt gtatatttct tgacaccttt tcggcatcgc cctaaattcg gcgtcctcat 660
attgtgtgag gacgttttat tacgtgttta cgaagcaaaa gctaaaacca ggagctattt 720
aatggcaaca gttaaccagc tggtacgcaa accacgtgct cgcaaagttg cgaaaagcaa 780
cgtgcctgcg ctggaagcat gcccgcaaaa acgtggcgta tgtactcgtg tatatactac 840
cactcctaaa aaaccgaact ccgcgctgcg taaagtatgc cgtgttcgtc tgactaacgg 900
tttcgaagtg acttcctaca tcggtggtga aggtcacaac ctgcaggagc actccgtgat 960
cctgatccgt ggcggtcgtg ttaaagacct cccgggtgtt cgttaccaca ccgtacgtgg 1020
tgcgcttgac tgctccggcg ttaaagaccg taagcaggct cgttccaagt atggcgtgaa 1080
gcgtcctaag gcttaggtta ataacaggcc tgctggtaat cgcaggcctt tttattttta 1140
cacctgcgtt ttagagctag aaatagcaag ttaaaataag gctagtccgt tatcaacttg 1200
aaaaagtggc accgagtcgg tgcttttttt ttttgttttt tatgtctaag gccgcgttgc 1260
tggcgatcga t 1271
<210> 139
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> ds-temp-1靶位点
<400> 139
tcagtttcag tacggttcta agg 23
<210> 140
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> ds-temp-2靶位点
<400> 140
cggtgtcgtt accgttactc agg 23
<210> 141
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> ds-nontemp-3靶位点
<400> 141
cttggtcacc ttcagcttcg cgg 23
<210> 142
<211> 63
<212> DNA
<213> 人工序列
<220>
<223> 锤头核酶-VT融合体
<220>
<221> misc_feature
<222> (1)..(6)
<223> N是a、c、g、或t
<220>
<221> misc_feature
<222> (44)..(63)
<223> N是a、c、g、或t
<400> 142
nnnnnnctga tgagtccgtg aggacgaaac gagtaagctc gtcnnnnnnn nnnnnnnnnn 60
nnn 63
<210> 143
<211> 63
<212> RNA
<213> 人工序列
<220>
<223> 锤头核酶-VT融合体
<220>
<221> misc_feature
<222> (1)..(6)
<223> n是a、c、g、或u
<220>
<221> misc_feature
<222> (44)..(63)
<223> n是a、c、g、或u
<400> 143
nnnnnncuga ugaguccgug aggacgaaac gaguaagcuc gucnnnnnnn nnnnnnnnnn 60
nnn 63
<210> 144
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> ds-temp-1F
<400> 144
catgcgtaaa ctgactgatg agtccgtgag gacgaaacga gtaagctcgt ctcagtttca 60
gtacggttct agttt 75
<210> 145
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 145 ds-temp-1R
<400> 145
tctaaaacta gaaccgtact gaaactgaga cgagcttact cgtttcgtcc tcacggactc 60
atcagtcagt ttacg 75
<210> 146
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 146 ds-temp-2F
<400> 146
catgcgtaac accgctgatg agtccgtgag gacgaaacga gtaagctcgt ccggtgtcgt 60
taccgttact cgttt 75
<210> 147
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> ds-temp-2R
<400> 147
tctaaaacga gtaacggtaa cgacaccgga cgagcttact cgtttcgtcc tcacggactc 60
atcagcggtg ttacg 75
<210> 148
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> ds-nontemp-1F
<400> 148
catgcgtaac caggctgatg agtccgtgag gacgaaacga gtaagctcgt ccttggtcac 60
cttcagcttc ggttt 75
<210> 149
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> ds-nontemp-1R
<400> 149
tctaaaaccg aagctgaagg tgaccaagga cgagcttact cgtttcgtcc tcacggactc 60
atcagcctgg ttacg 75
<210> 150
<211> 11448
<212> DNA
<213> 人工序列
<220>
<223> pRF296
<400> 150
catggacaag aaatactcca tcggcctgga cattggaacc aactctgtcg gctgggctgt 60
catcaccgac gagtacaagg tgccctccaa gaaattcaag gtcctcggaa acaccgatcg 120
acactccatc aagaaaaacc tcattggtgc cctgttgttc gattctggcg agactgccga 180
agctaccaga ctcaagcgaa ctgctcggcg acgttacacc cgacggaaga accgaatctg 240
ctacctgcag gagatctttt ccaacgagat ggccaaggtg gacgattcgt tctttcatcg 300
actggaggaa tccttcctcg tcgaggaaga caagaaacac gagcgtcatc ccatctttgg 360
caacattgtg gacgaggttg cttaccacga gaagtatcct accatctacc atctccgaaa 420
gaaactcgtc gattccaccg acaaggcgga tctcagactt atctacctcg ctctggcaca 480
catgatcaag tttcgaggtc atttcctcat cgagggcgat ctcaatcccg acaacagcga 540
tgtggacaag ctgttcattc agctcgttca gacctacaac cagctgttcg aggaaaaccc 600
catcaatgcc tccggagtcg atgcaaaggc catcttgtct gctcgactct cgaagagcag 660
acgactggag aacctcattg cccaacttcc tggcgagaaa aagaacggac tgtttggcaa 720
cctcattgcc ctttctcttg gtctcacacc caacttcaag tccaacttcg atctggcgga 780
ggacgccaag ctccagctgt ccaaggacac ctacgacgat gacctcgaca acctgcttgc 840
acagattggc gatcagtacg ccgacctgtt tctcgctgcc aagaaccttt cggatgctat 900
tctcttgtct gacattctgc gagtcaacac cgagatcaca aaggctcccc tttctgcctc 960
catgatcaag cgatacgacg agcaccatca ggatctcaca ctgctcaagg ctcttgtccg 1020
acagcaactg cccgagaagt acaaggagat ctttttcgat cagtcgaaga acggctacgc 1080
tggatacatc gacggcggag cctctcagga agagttctac aagttcatca agccaattct 1140
cgagaagatg gacggaaccg aggaactgct tgtcaagctc aatcgagagg atctgcttcg 1200
gaagcaacga accttcgaca acggcagcat tcctcatcag atccacctcg gtgagctgca 1260
cgccattctt cgacgtcagg aagacttcta cccctttctc aaggacaacc gagagaagat 1320
cgagaagatt cttacctttc gaatccccta ctatgttggt cctcttgcca gaggaaactc 1380
tcgatttgct tggatgactc gaaagtccga ggaaaccatc actccctgga acttcgagga 1440
agtcgtggac aagggtgcct ctgcacagtc cttcatcgag cgaatgacca acttcgacaa 1500
gaatctgccc aacgagaagg ttcttcccaa gcattcgctg ctctacgagt actttacagt 1560
ctacaacgaa ctcaccaaag tcaagtacgt taccgaggga atgcgaaagc ctgccttctt 1620
gtctggcgaa cagaagaaag ccattgtcga tctcctgttc aagaccaacc gaaaggtcac 1680
tgttaagcag ctcaaggagg actacttcaa gaaaatcgag tgtttcgaca gcgtcgagat 1740
ttccggagtt gaggaccgat tcaacgcctc tttgggcacc tatcacgatc tgctcaagat 1800
tatcaaggac aaggattttc tcgacaacga ggaaaacgag gacattctgg aggacatcgt 1860
gctcactctt accctgttcg aagatcggga gatgatcgag gaacgactca agacatacgc 1920
tcacctgttc gacgacaagg tcatgaaaca actcaagcga cgtagataca ccggctgggg 1980
aagactttcg cgaaagctca tcaacggcat cagagacaag cagtccggaa agaccattct 2040
ggactttctc aagtccgatg gctttgccaa ccgaaacttc atgcagctca ttcacgacga 2100
ttctcttacc ttcaaggagg acatccagaa ggcacaagtg tccggtcagg gcgacagctt 2160
gcacgaacat attgccaacc tggctggttc gccagccatc aagaaaggca ttctccagac 2220
tgtcaaggtt gtcgacgagc tggtgaaggt catgggacgt cacaagcccg agaacattgt 2280
gatcgagatg gccagagaga accagacaac tcaaaagggt cagaaaaact cgcgagagcg 2340
gatgaagcga atcgaggaag gcatcaagga gctgggatcc cagattctca aggagcatcc 2400
cgtcgagaac actcaactgc agaacgagaa gctgtatctc tactatctgc agaatggtcg 2460
agacatgtac gtggatcagg aactggacat caatcgtctc agcgactacg atgtggacca 2520
cattgtccct caatcctttc tcaaggacga ttctatcgac aacaaggtcc ttacacgatc 2580
cgacaagaac agaggcaagt cggacaacgt tcccagcgaa gaggtggtca aaaagatgaa 2640
gaactactgg cgacagctgc tcaacgccaa gctcattacc cagcgaaagt tcgacaatct 2700
taccaaggcc gagcgaggcg gtctgtccga gctcgacaag gctggcttca tcaagcgtca 2760
actcgtcgag accagacaga tcacaaagca cgtcgcacag attctcgatt ctcggatgaa 2820
caccaagtac gacgagaacg acaagctcat ccgagaggtc aaggtgatta ctctcaagtc 2880
caaactggtc tccgatttcc gaaaggactt tcagttctac aaggtgcgag agatcaacaa 2940
ttaccaccat gcccacgatg cttacctcaa cgccgtcgtt ggcactgcgc tcatcaagaa 3000
ataccccaag ctcgaaagcg agttcgttta cggcgattac aaggtctacg acgttcgaaa 3060
gatgattgcc aagtccgaac aggagattgg caaggctact gccaagtact tcttttactc 3120
caacatcatg aactttttca agaccgagat caccttggcc aacggagaga ttcgaaagag 3180
accacttatc gagaccaacg gcgaaactgg agagatcgtg tgggacaagg gtcgagactt 3240
tgcaaccgtg cgaaaggttc tgtcgatgcc tcaggtcaac atcgtcaaga aaaccgaggt 3300
tcagactggc ggattctcca aggagtcgat tctgcccaag cgaaactccg acaagctcat 3360
cgctcgaaag aaagactggg atcccaagaa atacggtggc ttcgattctc ctaccgtcgc 3420
ctattccgtg cttgtcgttg cgaaggtcga gaagggcaag tccaaaaagc tcaagtccgt 3480
caaggagctg ctcggaatta ccatcatgga gcgatcgagc ttcgagaaga atcccatcga 3540
cttcttggaa gccaagggtt acaaggaggt caagaaagac ctcattatca agctgcccaa 3600
gtactctctg ttcgaactgg agaacggtcg aaagcgtatg ctcgcctccg ctggcgagct 3660
gcagaaggga aacgagcttg ccttgccttc gaagtacgtc aactttctct atctggcttc 3720
tcactacgag aagctcaagg gttctcccga ggacaacgaa cagaagcaac tcttcgttga 3780
gcagcacaaa cattacctcg acgagattat cgagcagatt tccgagtttt cgaagcgagt 3840
catcctggct gatgccaact tggacaaggt gctctctgcc tacaacaagc atcgggacaa 3900
acccattcga gaacaggcgg agaacatcat tcacctgttt actcttacca acctgggtgc 3960
tcctgcagct ttcaagtact tcgataccac tatcgaccga aagcggtaca catccaccaa 4020
ggaggttctc gatgccaccc tgattcacca gtccatcact ggcctgtacg agacccgaat 4080
cgacctgtct cagcttggtg gcgactccag agccgatccc aagaaaaagc gaaaggtcta 4140
agcggccgca agtgtggatg gggaagtgag tgcccggttc tgtgtgcaca attggcaatc 4200
caagatggat ggattcaaca cagggatata gcgagctacg tggtggtgcg aggatatagc 4260
aacggatatt tatgtttgac acttgagaat gtacgataca agcactgtcc aagtacaata 4320
ctaaacatac tgtacatact catactcgta cccgggcaac ggtttcactt gagtgcagtg 4380
gctagtgctc ttactcgtac agtgtgcaat actgcgtatc atagtctttg atgtatatcg 4440
tattcattca tgttagttgc gtacgagccg gaagcataaa gtgtaaagcc tggggtgcct 4500
aatgagtgag ctaactcaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa 4560
acctgtcgtg ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta 4620
ttgggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc 4680
gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg 4740
caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt 4800
tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa 4860
gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct 4920
ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc 4980
cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg 5040
tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct 5100
tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag 5160
cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga 5220
agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc gctctgctga 5280
agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg 5340
gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag 5400
aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag 5460
ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat 5520
gaagttttaa atcaatctaa agtatatatg agtaaacttg gtctgacagt taccaatgct 5580
taatcagtga ggcacctatc tcagcgatct gtctatttcg ttcatccata gttgcctgac 5640
tccccgtcgt gtagataact acgatacggg agggcttacc atctggcccc agtgctgcaa 5700
tgataccgcg agacccacgc tcaccggctc cagatttatc agcaataaac cagccagccg 5760
gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag tctattaatt 5820
gttgccggga agctagagta agtagttcgc cagttaatag tttgcgcaac gttgttgcca 5880
ttgctacagg catcgtggtg tcacgctcgt cgtttggtat ggcttcattc agctccggtt 5940
cccaacgatc aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg gttagctcct 6000
tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt gttatcactc atggttatgg 6060
cagcactgca taattctctt actgtcatgc catccgtaag atgcttttct gtgactggtg 6120
agtactcaac caagtcattc tgagaatagt gtatgcggcg accgagttgc tcttgcccgg 6180
cgtcaatacg ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa 6240
aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt 6300
aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt 6360
gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt 6420
gaatactcat actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca 6480
tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 6540
ttccccgaaa agtgccacct gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg 6600
tggttacgcg cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt 6660
tcttcccttc ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc 6720
tccctttagg gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg 6780
gtgatggttc acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg 6840
agtccacgtt ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct 6900
cggtctattc ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg 6960
agctgattta acaaaaattt aacgcgaatt ttaacaaaat attaacgctt acaatttcca 7020
ttcgccattc aggctgcgca actgttggga agggcgatcg gtgcgggcct cttcgctatt 7080
acgccagctg gcgaaagggg gatgtgctgc aaggcgatta agttgggtaa cgccagggtt 7140
ttcccagtca cgacgttgta aaacgacggc cagtgaattg taatacgact cactataggg 7200
cgaattgggt accgggcccc ccctcgaggt cgatggtgtc gataagcttg atatcgaatt 7260
catgtcacac aaaccgatct tcgcctcaag gaaacctaat tctacatccg agagactgcc 7320
gagatccagt ctacactgat taattttcgg gccaataatt taaaaaaatc gtgttatata 7380
atattatatg tattatatat atacatcatg atgatactga cagtcatgtc ccattgctaa 7440
atagacagac tccatctgcc gcctccaact gatgttctca atatttaagg ggtcatctcg 7500
cattgtttaa taataaacag actccatcta ccgcctccaa atgatgttct caaaatatat 7560
tgtatgaact tatttttatt acttagtatt attagacaac ttacttgctt tatgaaaaac 7620
acttcctatt taggaaacaa tttataatgg cagttcgttc atttaacaat ttatgtagaa 7680
taaatgttat aaatgcgtat gggaaatctt aaatatggat agcataaatg atatctgcat 7740
tgcctaattc gaaatcaaca gcaacgaaaa aaatcccttg tacaacataa atagtcatcg 7800
agaaatatca actatcaaag aacagctatt cacacgttac tattgagatt attattggac 7860
gagaatcaca cactcaactg tctttctctc ttctagaaat acaggtacaa gtatgtacta 7920
ttctcattgt tcatacttct agtcatttca tcccacatat tccttggatt tctctccaat 7980
gaatgacatt ctatcttgca aattcaacaa ttataataag atataccaaa gtagcggtat 8040
agtggcaatc aaaaagcttc tctggtgtgc ttctcgtatt tatttttatt ctaatgatcc 8100
attaaaggta tatatttatt tcttgttata taatcctttt gtttattaca tgggctggat 8160
acataaaggt attttgattt aattttttgc ttaaattcaa tcccccctcg ttcagtgtca 8220
actgtaatgg taggaaatta ccatactttt gaagaagcaa aaaaaatgaa agaaaaaaaa 8280
aatcgtattt ccaggttaga cgttccgcag aatctagaat gcggtatgcg gtacattgtt 8340
cttcgaacgt aaaagttgcg ctccctgaga tattgtacat ttttgctttt acaagtacaa 8400
gtacatcgta caactatgta ctactgttga tgcatccaca acagtttgtt ttgttttttt 8460
ttgttttttt tttttctaat gattcattac cgctatgtat acctacttgt acttgtagta 8520
agccgggtta ttggcgttca attaatcata gacttatgaa tctgcacggt gtgcgctgcg 8580
agttactttt agcttatgca tgctacttgg gtgtaatatt gggatctgtt cggaaatcaa 8640
cggatgctca atcgatcgcc agcaacgcgg ccttagacat aaaaaacaaa aaaaaaaagc 8700
accgactcgg tgccactttt tcaagttgat aacggactag ccttatttta acttgctatt 8760
tctagctcta aaactagaac cgtactgaaa ctgagacgag cttactcgtt tcgtcctcac 8820
ggactcatca gtcagtttac gcatggttga tgtgtgttta attcaagaat gaatatagag 8880
aagagaagaa gaaaaaagat tcaattgagc cggcgatgca gacccttata taaatgttgc 8940
cttggacaga cggagcaagc ccgcccaaac ctacgttcgg tataatatgt taagcttttt 9000
aacacaaagg tttggcttgg ggtaacctga tgtggtgcaa aagaccgggc gttggcgagc 9060
cattgcgcgg gcgaatgggg tcgtgactcg tctcaaattc gagggcgtgc ctcaattcgt 9120
gcccccgtgg ctttttcccg ccgtttccgc cccgtttgca ccactgcagc cgcttctttg 9180
gttcggacac cttgctgcga gctaggtgcc ttgtgctact taaaaagtgg cctcccaaca 9240
ccaacatgac atgagtgcgt gggccaagac acgttggcgg ggtcgcagtc ggctcaatgg 9300
cccggaaaaa acgctgctgg agctggttcg gacgcagtcc gccgcggcgt atggatatcc 9360
gcaaggttcc atagcgccat tgccctccgt cggcgtctat cccgcaacct taattaagtc 9420
atacacaagt cagctttctt cgagcctcat ataagtataa gtagttcaac gtattagcac 9480
tgtacccagc atctccgtat cgagaaacac aacaacatgc cccattggac agatcatgcg 9540
gatacacagg ttgtgcagta tcatacatac tcgatcagac aggtcgtctg accatcatac 9600
aagctgaaca agcgctccat acttgcacgc tctctatata cacagttaaa ttacatatcc 9660
atagtctaac ctctaacagt taatcttctg gtaagcctcc cagccagcct tctggtatcg 9720
cttggcctcc tcaataggat ctcggttctg gccgtacaga cctcggccga caattatgat 9780
atccgttccg gtagacatga catcctcaac agttcggtac tgctgtccga gagcgtctcc 9840
cttgtcgtca agacccaccc cgggggtcag aataagccag tcctcagagt cgcccttagg 9900
tcggttctgg gcaatgaagc caaccacaaa ctcggggtcg gatcgggcaa gctcaatggt 9960
ctgcttggag tactcgccag tggccagaga gcccttgcaa gacagctcgg ccagcatgag 10020
cagacctctg gccagcttct cgttgggaga ggggactagg aactccttgt actgggagtt 10080
ctcgtagtca gagacgtcct ccttcttctg ttcagagaca gtttcctcgg caccagctcg 10140
caggccagca atgattccgg ttccgggtac accgtgggcg ttggtgatat cggaccactc 10200
ggcgattcgg tgacaccggt actggtgctt gacagtgttg ccaatatctg cgaactttct 10260
gtcctcgaac aggaagaaac cgtgcttaag agcaagttcc ttgaggggga gcacagtgcc 10320
ggcgtaggtg aagtcgtcaa tgatgtcgat atgggttttg atcatgcaca cataaggtcc 10380
gaccttatcg gcaagctcaa tgagctcctt ggtggtggta acatccagag aagcacacag 10440
gttggttttc ttggctgcca cgagcttgag cactcgagcg gcaaaggcgg acttgtggac 10500
gttagctcga gcttcgtagg agggcatttt ggtggtgaag aggagactga aataaattta 10560
gtctgcagaa ctttttatcg gaaccttatc tggggcagtg aagtatatgt tatggtaata 10620
gttacgagtt agttgaactt atagatagac tggactatac ggctatcggt ccaaattaga 10680
aagaacgtca atggctctct gggcgtcgcc tttgccgaca aaaatgtgat catgatgaaa 10740
gccagcaatg acgttgcagc tgatattgtt gtcggccaac cgcgccgaaa acgcagctgt 10800
cagacccaca gcctccaacg aagaatgtat cgtcaaagtg atccaagcac actcatagtt 10860
ggagtcgtac tccaaaggcg gcaatgacga gtcagacaga tactcgtcga cgtttaaacc 10920
atcatctaag ggcctcaaaa ctacctcgga actgctgcgc tgatctggac accacagagg 10980
ttccgagcac tttaggttgc accaaatgtc ccaccaggtg caggcagaaa acgctggaac 11040
agcgtgtaca gtttgtctta acaaaaagtg agggcgctga ggtcgagcag ggtggtgtga 11100
cttgttatag cctttagagc tgcgaaagcg cgtatggatt tggctcatca ggccagattg 11160
agggtctgtg gacacatgtc atgttagtgt acttcaatcg ccccctggat atagccccga 11220
caataggccg tggcctcatt tttttgcctt ccgcacattt ccattgctcg gtacccacac 11280
cttgcttctc ctgcacttgc caaccttaat actggtttac attgaccaac atcttacaag 11340
cggggggctt gtctagggta tatataaaca gtggctctcc caatcggttg ccagtctctt 11400
ttttcctttc tttccccaca gattcgaaat ctaaactaca catcacac 11448
<210> 151
<211> 11448
<212> DNA
<213> 人工序列
<220>
<223> pRF298
<400> 151
catggacaag aaatactcca tcggcctgga cattggaacc aactctgtcg gctgggctgt 60
catcaccgac gagtacaagg tgccctccaa gaaattcaag gtcctcggaa acaccgatcg 120
acactccatc aagaaaaacc tcattggtgc cctgttgttc gattctggcg agactgccga 180
agctaccaga ctcaagcgaa ctgctcggcg acgttacacc cgacggaaga accgaatctg 240
ctacctgcag gagatctttt ccaacgagat ggccaaggtg gacgattcgt tctttcatcg 300
actggaggaa tccttcctcg tcgaggaaga caagaaacac gagcgtcatc ccatctttgg 360
caacattgtg gacgaggttg cttaccacga gaagtatcct accatctacc atctccgaaa 420
gaaactcgtc gattccaccg acaaggcgga tctcagactt atctacctcg ctctggcaca 480
catgatcaag tttcgaggtc atttcctcat cgagggcgat ctcaatcccg acaacagcga 540
tgtggacaag ctgttcattc agctcgttca gacctacaac cagctgttcg aggaaaaccc 600
catcaatgcc tccggagtcg atgcaaaggc catcttgtct gctcgactct cgaagagcag 660
acgactggag aacctcattg cccaacttcc tggcgagaaa aagaacggac tgtttggcaa 720
cctcattgcc ctttctcttg gtctcacacc caacttcaag tccaacttcg atctggcgga 780
ggacgccaag ctccagctgt ccaaggacac ctacgacgat gacctcgaca acctgcttgc 840
acagattggc gatcagtacg ccgacctgtt tctcgctgcc aagaaccttt cggatgctat 900
tctcttgtct gacattctgc gagtcaacac cgagatcaca aaggctcccc tttctgcctc 960
catgatcaag cgatacgacg agcaccatca ggatctcaca ctgctcaagg ctcttgtccg 1020
acagcaactg cccgagaagt acaaggagat ctttttcgat cagtcgaaga acggctacgc 1080
tggatacatc gacggcggag cctctcagga agagttctac aagttcatca agccaattct 1140
cgagaagatg gacggaaccg aggaactgct tgtcaagctc aatcgagagg atctgcttcg 1200
gaagcaacga accttcgaca acggcagcat tcctcatcag atccacctcg gtgagctgca 1260
cgccattctt cgacgtcagg aagacttcta cccctttctc aaggacaacc gagagaagat 1320
cgagaagatt cttacctttc gaatccccta ctatgttggt cctcttgcca gaggaaactc 1380
tcgatttgct tggatgactc gaaagtccga ggaaaccatc actccctgga acttcgagga 1440
agtcgtggac aagggtgcct ctgcacagtc cttcatcgag cgaatgacca acttcgacaa 1500
gaatctgccc aacgagaagg ttcttcccaa gcattcgctg ctctacgagt actttacagt 1560
ctacaacgaa ctcaccaaag tcaagtacgt taccgaggga atgcgaaagc ctgccttctt 1620
gtctggcgaa cagaagaaag ccattgtcga tctcctgttc aagaccaacc gaaaggtcac 1680
tgttaagcag ctcaaggagg actacttcaa gaaaatcgag tgtttcgaca gcgtcgagat 1740
ttccggagtt gaggaccgat tcaacgcctc tttgggcacc tatcacgatc tgctcaagat 1800
tatcaaggac aaggattttc tcgacaacga ggaaaacgag gacattctgg aggacatcgt 1860
gctcactctt accctgttcg aagatcggga gatgatcgag gaacgactca agacatacgc 1920
tcacctgttc gacgacaagg tcatgaaaca actcaagcga cgtagataca ccggctgggg 1980
aagactttcg cgaaagctca tcaacggcat cagagacaag cagtccggaa agaccattct 2040
ggactttctc aagtccgatg gctttgccaa ccgaaacttc atgcagctca ttcacgacga 2100
ttctcttacc ttcaaggagg acatccagaa ggcacaagtg tccggtcagg gcgacagctt 2160
gcacgaacat attgccaacc tggctggttc gccagccatc aagaaaggca ttctccagac 2220
tgtcaaggtt gtcgacgagc tggtgaaggt catgggacgt cacaagcccg agaacattgt 2280
gatcgagatg gccagagaga accagacaac tcaaaagggt cagaaaaact cgcgagagcg 2340
gatgaagcga atcgaggaag gcatcaagga gctgggatcc cagattctca aggagcatcc 2400
cgtcgagaac actcaactgc agaacgagaa gctgtatctc tactatctgc agaatggtcg 2460
agacatgtac gtggatcagg aactggacat caatcgtctc agcgactacg atgtggacca 2520
cattgtccct caatcctttc tcaaggacga ttctatcgac aacaaggtcc ttacacgatc 2580
cgacaagaac agaggcaagt cggacaacgt tcccagcgaa gaggtggtca aaaagatgaa 2640
gaactactgg cgacagctgc tcaacgccaa gctcattacc cagcgaaagt tcgacaatct 2700
taccaaggcc gagcgaggcg gtctgtccga gctcgacaag gctggcttca tcaagcgtca 2760
actcgtcgag accagacaga tcacaaagca cgtcgcacag attctcgatt ctcggatgaa 2820
caccaagtac gacgagaacg acaagctcat ccgagaggtc aaggtgatta ctctcaagtc 2880
caaactggtc tccgatttcc gaaaggactt tcagttctac aaggtgcgag agatcaacaa 2940
ttaccaccat gcccacgatg cttacctcaa cgccgtcgtt ggcactgcgc tcatcaagaa 3000
ataccccaag ctcgaaagcg agttcgttta cggcgattac aaggtctacg acgttcgaaa 3060
gatgattgcc aagtccgaac aggagattgg caaggctact gccaagtact tcttttactc 3120
caacatcatg aactttttca agaccgagat caccttggcc aacggagaga ttcgaaagag 3180
accacttatc gagaccaacg gcgaaactgg agagatcgtg tgggacaagg gtcgagactt 3240
tgcaaccgtg cgaaaggttc tgtcgatgcc tcaggtcaac atcgtcaaga aaaccgaggt 3300
tcagactggc ggattctcca aggagtcgat tctgcccaag cgaaactccg acaagctcat 3360
cgctcgaaag aaagactggg atcccaagaa atacggtggc ttcgattctc ctaccgtcgc 3420
ctattccgtg cttgtcgttg cgaaggtcga gaagggcaag tccaaaaagc tcaagtccgt 3480
caaggagctg ctcggaatta ccatcatgga gcgatcgagc ttcgagaaga atcccatcga 3540
cttcttggaa gccaagggtt acaaggaggt caagaaagac ctcattatca agctgcccaa 3600
gtactctctg ttcgaactgg agaacggtcg aaagcgtatg ctcgcctccg ctggcgagct 3660
gcagaaggga aacgagcttg ccttgccttc gaagtacgtc aactttctct atctggcttc 3720
tcactacgag aagctcaagg gttctcccga ggacaacgaa cagaagcaac tcttcgttga 3780
gcagcacaaa cattacctcg acgagattat cgagcagatt tccgagtttt cgaagcgagt 3840
catcctggct gatgccaact tggacaaggt gctctctgcc tacaacaagc atcgggacaa 3900
acccattcga gaacaggcgg agaacatcat tcacctgttt actcttacca acctgggtgc 3960
tcctgcagct ttcaagtact tcgataccac tatcgaccga aagcggtaca catccaccaa 4020
ggaggttctc gatgccaccc tgattcacca gtccatcact ggcctgtacg agacccgaat 4080
cgacctgtct cagcttggtg gcgactccag agccgatccc aagaaaaagc gaaaggtcta 4140
agcggccgca agtgtggatg gggaagtgag tgcccggttc tgtgtgcaca attggcaatc 4200
caagatggat ggattcaaca cagggatata gcgagctacg tggtggtgcg aggatatagc 4260
aacggatatt tatgtttgac acttgagaat gtacgataca agcactgtcc aagtacaata 4320
ctaaacatac tgtacatact catactcgta cccgggcaac ggtttcactt gagtgcagtg 4380
gctagtgctc ttactcgtac agtgtgcaat actgcgtatc atagtctttg atgtatatcg 4440
tattcattca tgttagttgc gtacgagccg gaagcataaa gtgtaaagcc tggggtgcct 4500
aatgagtgag ctaactcaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa 4560
acctgtcgtg ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta 4620
ttgggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc 4680
gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg 4740
caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt 4800
tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa 4860
gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct 4920
ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc 4980
cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg 5040
tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct 5100
tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag 5160
cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga 5220
agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc gctctgctga 5280
agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg 5340
gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag 5400
aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag 5460
ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat 5520
gaagttttaa atcaatctaa agtatatatg agtaaacttg gtctgacagt taccaatgct 5580
taatcagtga ggcacctatc tcagcgatct gtctatttcg ttcatccata gttgcctgac 5640
tccccgtcgt gtagataact acgatacggg agggcttacc atctggcccc agtgctgcaa 5700
tgataccgcg agacccacgc tcaccggctc cagatttatc agcaataaac cagccagccg 5760
gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag tctattaatt 5820
gttgccggga agctagagta agtagttcgc cagttaatag tttgcgcaac gttgttgcca 5880
ttgctacagg catcgtggtg tcacgctcgt cgtttggtat ggcttcattc agctccggtt 5940
cccaacgatc aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg gttagctcct 6000
tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt gttatcactc atggttatgg 6060
cagcactgca taattctctt actgtcatgc catccgtaag atgcttttct gtgactggtg 6120
agtactcaac caagtcattc tgagaatagt gtatgcggcg accgagttgc tcttgcccgg 6180
cgtcaatacg ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa 6240
aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt 6300
aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt 6360
gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt 6420
gaatactcat actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca 6480
tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 6540
ttccccgaaa agtgccacct gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg 6600
tggttacgcg cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt 6660
tcttcccttc ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc 6720
tccctttagg gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg 6780
gtgatggttc acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg 6840
agtccacgtt ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct 6900
cggtctattc ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg 6960
agctgattta acaaaaattt aacgcgaatt ttaacaaaat attaacgctt acaatttcca 7020
ttcgccattc aggctgcgca actgttggga agggcgatcg gtgcgggcct cttcgctatt 7080
acgccagctg gcgaaagggg gatgtgctgc aaggcgatta agttgggtaa cgccagggtt 7140
ttcccagtca cgacgttgta aaacgacggc cagtgaattg taatacgact cactataggg 7200
cgaattgggt accgggcccc ccctcgaggt cgatggtgtc gataagcttg atatcgaatt 7260
catgtcacac aaaccgatct tcgcctcaag gaaacctaat tctacatccg agagactgcc 7320
gagatccagt ctacactgat taattttcgg gccaataatt taaaaaaatc gtgttatata 7380
atattatatg tattatatat atacatcatg atgatactga cagtcatgtc ccattgctaa 7440
atagacagac tccatctgcc gcctccaact gatgttctca atatttaagg ggtcatctcg 7500
cattgtttaa taataaacag actccatcta ccgcctccaa atgatgttct caaaatatat 7560
tgtatgaact tatttttatt acttagtatt attagacaac ttacttgctt tatgaaaaac 7620
acttcctatt taggaaacaa tttataatgg cagttcgttc atttaacaat ttatgtagaa 7680
taaatgttat aaatgcgtat gggaaatctt aaatatggat agcataaatg atatctgcat 7740
tgcctaattc gaaatcaaca gcaacgaaaa aaatcccttg tacaacataa atagtcatcg 7800
agaaatatca actatcaaag aacagctatt cacacgttac tattgagatt attattggac 7860
gagaatcaca cactcaactg tctttctctc ttctagaaat acaggtacaa gtatgtacta 7920
ttctcattgt tcatacttct agtcatttca tcccacatat tccttggatt tctctccaat 7980
gaatgacatt ctatcttgca aattcaacaa ttataataag atataccaaa gtagcggtat 8040
agtggcaatc aaaaagcttc tctggtgtgc ttctcgtatt tatttttatt ctaatgatcc 8100
attaaaggta tatatttatt tcttgttata taatcctttt gtttattaca tgggctggat 8160
acataaaggt attttgattt aattttttgc ttaaattcaa tcccccctcg ttcagtgtca 8220
actgtaatgg taggaaatta ccatactttt gaagaagcaa aaaaaatgaa agaaaaaaaa 8280
aatcgtattt ccaggttaga cgttccgcag aatctagaat gcggtatgcg gtacattgtt 8340
cttcgaacgt aaaagttgcg ctccctgaga tattgtacat ttttgctttt acaagtacaa 8400
gtacatcgta caactatgta ctactgttga tgcatccaca acagtttgtt ttgttttttt 8460
ttgttttttt tttttctaat gattcattac cgctatgtat acctacttgt acttgtagta 8520
agccgggtta ttggcgttca attaatcata gacttatgaa tctgcacggt gtgcgctgcg 8580
agttactttt agcttatgca tgctacttgg gtgtaatatt gggatctgtt cggaaatcaa 8640
cggatgctca atcgatcgcc agcaacgcgg ccttagacat aaaaaacaaa aaaaaaaagc 8700
accgactcgg tgccactttt tcaagttgat aacggactag ccttatttta acttgctatt 8760
tctagctcta aaacgagtaa cggtaacgac accggacgag cttactcgtt tcgtcctcac 8820
ggactcatca gcggtgttac gcatggttga tgtgtgttta attcaagaat gaatatagag 8880
aagagaagaa gaaaaaagat tcaattgagc cggcgatgca gacccttata taaatgttgc 8940
cttggacaga cggagcaagc ccgcccaaac ctacgttcgg tataatatgt taagcttttt 9000
aacacaaagg tttggcttgg ggtaacctga tgtggtgcaa aagaccgggc gttggcgagc 9060
cattgcgcgg gcgaatgggg tcgtgactcg tctcaaattc gagggcgtgc ctcaattcgt 9120
gcccccgtgg ctttttcccg ccgtttccgc cccgtttgca ccactgcagc cgcttctttg 9180
gttcggacac cttgctgcga gctaggtgcc ttgtgctact taaaaagtgg cctcccaaca 9240
ccaacatgac atgagtgcgt gggccaagac acgttggcgg ggtcgcagtc ggctcaatgg 9300
cccggaaaaa acgctgctgg agctggttcg gacgcagtcc gccgcggcgt atggatatcc 9360
gcaaggttcc atagcgccat tgccctccgt cggcgtctat cccgcaacct taattaagtc 9420
atacacaagt cagctttctt cgagcctcat ataagtataa gtagttcaac gtattagcac 9480
tgtacccagc atctccgtat cgagaaacac aacaacatgc cccattggac agatcatgcg 9540
gatacacagg ttgtgcagta tcatacatac tcgatcagac aggtcgtctg accatcatac 9600
aagctgaaca agcgctccat acttgcacgc tctctatata cacagttaaa ttacatatcc 9660
atagtctaac ctctaacagt taatcttctg gtaagcctcc cagccagcct tctggtatcg 9720
cttggcctcc tcaataggat ctcggttctg gccgtacaga cctcggccga caattatgat 9780
atccgttccg gtagacatga catcctcaac agttcggtac tgctgtccga gagcgtctcc 9840
cttgtcgtca agacccaccc cgggggtcag aataagccag tcctcagagt cgcccttagg 9900
tcggttctgg gcaatgaagc caaccacaaa ctcggggtcg gatcgggcaa gctcaatggt 9960
ctgcttggag tactcgccag tggccagaga gcccttgcaa gacagctcgg ccagcatgag 10020
cagacctctg gccagcttct cgttgggaga ggggactagg aactccttgt actgggagtt 10080
ctcgtagtca gagacgtcct ccttcttctg ttcagagaca gtttcctcgg caccagctcg 10140
caggccagca atgattccgg ttccgggtac accgtgggcg ttggtgatat cggaccactc 10200
ggcgattcgg tgacaccggt actggtgctt gacagtgttg ccaatatctg cgaactttct 10260
gtcctcgaac aggaagaaac cgtgcttaag agcaagttcc ttgaggggga gcacagtgcc 10320
ggcgtaggtg aagtcgtcaa tgatgtcgat atgggttttg atcatgcaca cataaggtcc 10380
gaccttatcg gcaagctcaa tgagctcctt ggtggtggta acatccagag aagcacacag 10440
gttggttttc ttggctgcca cgagcttgag cactcgagcg gcaaaggcgg acttgtggac 10500
gttagctcga gcttcgtagg agggcatttt ggtggtgaag aggagactga aataaattta 10560
gtctgcagaa ctttttatcg gaaccttatc tggggcagtg aagtatatgt tatggtaata 10620
gttacgagtt agttgaactt atagatagac tggactatac ggctatcggt ccaaattaga 10680
aagaacgtca atggctctct gggcgtcgcc tttgccgaca aaaatgtgat catgatgaaa 10740
gccagcaatg acgttgcagc tgatattgtt gtcggccaac cgcgccgaaa acgcagctgt 10800
cagacccaca gcctccaacg aagaatgtat cgtcaaagtg atccaagcac actcatagtt 10860
ggagtcgtac tccaaaggcg gcaatgacga gtcagacaga tactcgtcga cgtttaaacc 10920
atcatctaag ggcctcaaaa ctacctcgga actgctgcgc tgatctggac accacagagg 10980
ttccgagcac tttaggttgc accaaatgtc ccaccaggtg caggcagaaa acgctggaac 11040
agcgtgtaca gtttgtctta acaaaaagtg agggcgctga ggtcgagcag ggtggtgtga 11100
cttgttatag cctttagagc tgcgaaagcg cgtatggatt tggctcatca ggccagattg 11160
agggtctgtg gacacatgtc atgttagtgt acttcaatcg ccccctggat atagccccga 11220
caataggccg tggcctcatt tttttgcctt ccgcacattt ccattgctcg gtacccacac 11280
cttgcttctc ctgcacttgc caaccttaat actggtttac attgaccaac atcttacaag 11340
cggggggctt gtctagggta tatataaaca gtggctctcc caatcggttg ccagtctctt 11400
ttttcctttc tttccccaca gattcgaaat ctaaactaca catcacac 11448
<210> 152
<211> 11448
<212> DNA
<213> 人工序列
<220>
<223> pRF300
<400> 152
catggacaag aaatactcca tcggcctgga cattggaacc aactctgtcg gctgggctgt 60
catcaccgac gagtacaagg tgccctccaa gaaattcaag gtcctcggaa acaccgatcg 120
acactccatc aagaaaaacc tcattggtgc cctgttgttc gattctggcg agactgccga 180
agctaccaga ctcaagcgaa ctgctcggcg acgttacacc cgacggaaga accgaatctg 240
ctacctgcag gagatctttt ccaacgagat ggccaaggtg gacgattcgt tctttcatcg 300
actggaggaa tccttcctcg tcgaggaaga caagaaacac gagcgtcatc ccatctttgg 360
caacattgtg gacgaggttg cttaccacga gaagtatcct accatctacc atctccgaaa 420
gaaactcgtc gattccaccg acaaggcgga tctcagactt atctacctcg ctctggcaca 480
catgatcaag tttcgaggtc atttcctcat cgagggcgat ctcaatcccg acaacagcga 540
tgtggacaag ctgttcattc agctcgttca gacctacaac cagctgttcg aggaaaaccc 600
catcaatgcc tccggagtcg atgcaaaggc catcttgtct gctcgactct cgaagagcag 660
acgactggag aacctcattg cccaacttcc tggcgagaaa aagaacggac tgtttggcaa 720
cctcattgcc ctttctcttg gtctcacacc caacttcaag tccaacttcg atctggcgga 780
ggacgccaag ctccagctgt ccaaggacac ctacgacgat gacctcgaca acctgcttgc 840
acagattggc gatcagtacg ccgacctgtt tctcgctgcc aagaaccttt cggatgctat 900
tctcttgtct gacattctgc gagtcaacac cgagatcaca aaggctcccc tttctgcctc 960
catgatcaag cgatacgacg agcaccatca ggatctcaca ctgctcaagg ctcttgtccg 1020
acagcaactg cccgagaagt acaaggagat ctttttcgat cagtcgaaga acggctacgc 1080
tggatacatc gacggcggag cctctcagga agagttctac aagttcatca agccaattct 1140
cgagaagatg gacggaaccg aggaactgct tgtcaagctc aatcgagagg atctgcttcg 1200
gaagcaacga accttcgaca acggcagcat tcctcatcag atccacctcg gtgagctgca 1260
cgccattctt cgacgtcagg aagacttcta cccctttctc aaggacaacc gagagaagat 1320
cgagaagatt cttacctttc gaatccccta ctatgttggt cctcttgcca gaggaaactc 1380
tcgatttgct tggatgactc gaaagtccga ggaaaccatc actccctgga acttcgagga 1440
agtcgtggac aagggtgcct ctgcacagtc cttcatcgag cgaatgacca acttcgacaa 1500
gaatctgccc aacgagaagg ttcttcccaa gcattcgctg ctctacgagt actttacagt 1560
ctacaacgaa ctcaccaaag tcaagtacgt taccgaggga atgcgaaagc ctgccttctt 1620
gtctggcgaa cagaagaaag ccattgtcga tctcctgttc aagaccaacc gaaaggtcac 1680
tgttaagcag ctcaaggagg actacttcaa gaaaatcgag tgtttcgaca gcgtcgagat 1740
ttccggagtt gaggaccgat tcaacgcctc tttgggcacc tatcacgatc tgctcaagat 1800
tatcaaggac aaggattttc tcgacaacga ggaaaacgag gacattctgg aggacatcgt 1860
gctcactctt accctgttcg aagatcggga gatgatcgag gaacgactca agacatacgc 1920
tcacctgttc gacgacaagg tcatgaaaca actcaagcga cgtagataca ccggctgggg 1980
aagactttcg cgaaagctca tcaacggcat cagagacaag cagtccggaa agaccattct 2040
ggactttctc aagtccgatg gctttgccaa ccgaaacttc atgcagctca ttcacgacga 2100
ttctcttacc ttcaaggagg acatccagaa ggcacaagtg tccggtcagg gcgacagctt 2160
gcacgaacat attgccaacc tggctggttc gccagccatc aagaaaggca ttctccagac 2220
tgtcaaggtt gtcgacgagc tggtgaaggt catgggacgt cacaagcccg agaacattgt 2280
gatcgagatg gccagagaga accagacaac tcaaaagggt cagaaaaact cgcgagagcg 2340
gatgaagcga atcgaggaag gcatcaagga gctgggatcc cagattctca aggagcatcc 2400
cgtcgagaac actcaactgc agaacgagaa gctgtatctc tactatctgc agaatggtcg 2460
agacatgtac gtggatcagg aactggacat caatcgtctc agcgactacg atgtggacca 2520
cattgtccct caatcctttc tcaaggacga ttctatcgac aacaaggtcc ttacacgatc 2580
cgacaagaac agaggcaagt cggacaacgt tcccagcgaa gaggtggtca aaaagatgaa 2640
gaactactgg cgacagctgc tcaacgccaa gctcattacc cagcgaaagt tcgacaatct 2700
taccaaggcc gagcgaggcg gtctgtccga gctcgacaag gctggcttca tcaagcgtca 2760
actcgtcgag accagacaga tcacaaagca cgtcgcacag attctcgatt ctcggatgaa 2820
caccaagtac gacgagaacg acaagctcat ccgagaggtc aaggtgatta ctctcaagtc 2880
caaactggtc tccgatttcc gaaaggactt tcagttctac aaggtgcgag agatcaacaa 2940
ttaccaccat gcccacgatg cttacctcaa cgccgtcgtt ggcactgcgc tcatcaagaa 3000
ataccccaag ctcgaaagcg agttcgttta cggcgattac aaggtctacg acgttcgaaa 3060
gatgattgcc aagtccgaac aggagattgg caaggctact gccaagtact tcttttactc 3120
caacatcatg aactttttca agaccgagat caccttggcc aacggagaga ttcgaaagag 3180
accacttatc gagaccaacg gcgaaactgg agagatcgtg tgggacaagg gtcgagactt 3240
tgcaaccgtg cgaaaggttc tgtcgatgcc tcaggtcaac atcgtcaaga aaaccgaggt 3300
tcagactggc ggattctcca aggagtcgat tctgcccaag cgaaactccg acaagctcat 3360
cgctcgaaag aaagactggg atcccaagaa atacggtggc ttcgattctc ctaccgtcgc 3420
ctattccgtg cttgtcgttg cgaaggtcga gaagggcaag tccaaaaagc tcaagtccgt 3480
caaggagctg ctcggaatta ccatcatgga gcgatcgagc ttcgagaaga atcccatcga 3540
cttcttggaa gccaagggtt acaaggaggt caagaaagac ctcattatca agctgcccaa 3600
gtactctctg ttcgaactgg agaacggtcg aaagcgtatg ctcgcctccg ctggcgagct 3660
gcagaaggga aacgagcttg ccttgccttc gaagtacgtc aactttctct atctggcttc 3720
tcactacgag aagctcaagg gttctcccga ggacaacgaa cagaagcaac tcttcgttga 3780
gcagcacaaa cattacctcg acgagattat cgagcagatt tccgagtttt cgaagcgagt 3840
catcctggct gatgccaact tggacaaggt gctctctgcc tacaacaagc atcgggacaa 3900
acccattcga gaacaggcgg agaacatcat tcacctgttt actcttacca acctgggtgc 3960
tcctgcagct ttcaagtact tcgataccac tatcgaccga aagcggtaca catccaccaa 4020
ggaggttctc gatgccaccc tgattcacca gtccatcact ggcctgtacg agacccgaat 4080
cgacctgtct cagcttggtg gcgactccag agccgatccc aagaaaaagc gaaaggtcta 4140
agcggccgca agtgtggatg gggaagtgag tgcccggttc tgtgtgcaca attggcaatc 4200
caagatggat ggattcaaca cagggatata gcgagctacg tggtggtgcg aggatatagc 4260
aacggatatt tatgtttgac acttgagaat gtacgataca agcactgtcc aagtacaata 4320
ctaaacatac tgtacatact catactcgta cccgggcaac ggtttcactt gagtgcagtg 4380
gctagtgctc ttactcgtac agtgtgcaat actgcgtatc atagtctttg atgtatatcg 4440
tattcattca tgttagttgc gtacgagccg gaagcataaa gtgtaaagcc tggggtgcct 4500
aatgagtgag ctaactcaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa 4560
acctgtcgtg ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta 4620
ttgggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc 4680
gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg 4740
caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt 4800
tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa 4860
gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct 4920
ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc 4980
cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg 5040
tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct 5100
tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag 5160
cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga 5220
agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc gctctgctga 5280
agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg 5340
gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag 5400
aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag 5460
ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat 5520
gaagttttaa atcaatctaa agtatatatg agtaaacttg gtctgacagt taccaatgct 5580
taatcagtga ggcacctatc tcagcgatct gtctatttcg ttcatccata gttgcctgac 5640
tccccgtcgt gtagataact acgatacggg agggcttacc atctggcccc agtgctgcaa 5700
tgataccgcg agacccacgc tcaccggctc cagatttatc agcaataaac cagccagccg 5760
gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag tctattaatt 5820
gttgccggga agctagagta agtagttcgc cagttaatag tttgcgcaac gttgttgcca 5880
ttgctacagg catcgtggtg tcacgctcgt cgtttggtat ggcttcattc agctccggtt 5940
cccaacgatc aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg gttagctcct 6000
tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt gttatcactc atggttatgg 6060
cagcactgca taattctctt actgtcatgc catccgtaag atgcttttct gtgactggtg 6120
agtactcaac caagtcattc tgagaatagt gtatgcggcg accgagttgc tcttgcccgg 6180
cgtcaatacg ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa 6240
aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt 6300
aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt 6360
gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt 6420
gaatactcat actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca 6480
tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 6540
ttccccgaaa agtgccacct gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg 6600
tggttacgcg cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt 6660
tcttcccttc ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc 6720
tccctttagg gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg 6780
gtgatggttc acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg 6840
agtccacgtt ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct 6900
cggtctattc ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg 6960
agctgattta acaaaaattt aacgcgaatt ttaacaaaat attaacgctt acaatttcca 7020
ttcgccattc aggctgcgca actgttggga agggcgatcg gtgcgggcct cttcgctatt 7080
acgccagctg gcgaaagggg gatgtgctgc aaggcgatta agttgggtaa cgccagggtt 7140
ttcccagtca cgacgttgta aaacgacggc cagtgaattg taatacgact cactataggg 7200
cgaattgggt accgggcccc ccctcgaggt cgatggtgtc gataagcttg atatcgaatt 7260
catgtcacac aaaccgatct tcgcctcaag gaaacctaat tctacatccg agagactgcc 7320
gagatccagt ctacactgat taattttcgg gccaataatt taaaaaaatc gtgttatata 7380
atattatatg tattatatat atacatcatg atgatactga cagtcatgtc ccattgctaa 7440
atagacagac tccatctgcc gcctccaact gatgttctca atatttaagg ggtcatctcg 7500
cattgtttaa taataaacag actccatcta ccgcctccaa atgatgttct caaaatatat 7560
tgtatgaact tatttttatt acttagtatt attagacaac ttacttgctt tatgaaaaac 7620
acttcctatt taggaaacaa tttataatgg cagttcgttc atttaacaat ttatgtagaa 7680
taaatgttat aaatgcgtat gggaaatctt aaatatggat agcataaatg atatctgcat 7740
tgcctaattc gaaatcaaca gcaacgaaaa aaatcccttg tacaacataa atagtcatcg 7800
agaaatatca actatcaaag aacagctatt cacacgttac tattgagatt attattggac 7860
gagaatcaca cactcaactg tctttctctc ttctagaaat acaggtacaa gtatgtacta 7920
ttctcattgt tcatacttct agtcatttca tcccacatat tccttggatt tctctccaat 7980
gaatgacatt ctatcttgca aattcaacaa ttataataag atataccaaa gtagcggtat 8040
agtggcaatc aaaaagcttc tctggtgtgc ttctcgtatt tatttttatt ctaatgatcc 8100
attaaaggta tatatttatt tcttgttata taatcctttt gtttattaca tgggctggat 8160
acataaaggt attttgattt aattttttgc ttaaattcaa tcccccctcg ttcagtgtca 8220
actgtaatgg taggaaatta ccatactttt gaagaagcaa aaaaaatgaa agaaaaaaaa 8280
aatcgtattt ccaggttaga cgttccgcag aatctagaat gcggtatgcg gtacattgtt 8340
cttcgaacgt aaaagttgcg ctccctgaga tattgtacat ttttgctttt acaagtacaa 8400
gtacatcgta caactatgta ctactgttga tgcatccaca acagtttgtt ttgttttttt 8460
ttgttttttt tttttctaat gattcattac cgctatgtat acctacttgt acttgtagta 8520
agccgggtta ttggcgttca attaatcata gacttatgaa tctgcacggt gtgcgctgcg 8580
agttactttt agcttatgca tgctacttgg gtgtaatatt gggatctgtt cggaaatcaa 8640
cggatgctca atcgatcgcc agcaacgcgg ccttagacat aaaaaacaaa aaaaaaaagc 8700
accgactcgg tgccactttt tcaagttgat aacggactag ccttatttta acttgctatt 8760
tctagctcta aaaccgaagc tgaaggtgac caaggacgag cttactcgtt tcgtcctcac 8820
ggactcatca gcctggttac gcatggttga tgtgtgttta attcaagaat gaatatagag 8880
aagagaagaa gaaaaaagat tcaattgagc cggcgatgca gacccttata taaatgttgc 8940
cttggacaga cggagcaagc ccgcccaaac ctacgttcgg tataatatgt taagcttttt 9000
aacacaaagg tttggcttgg ggtaacctga tgtggtgcaa aagaccgggc gttggcgagc 9060
cattgcgcgg gcgaatgggg tcgtgactcg tctcaaattc gagggcgtgc ctcaattcgt 9120
gcccccgtgg ctttttcccg ccgtttccgc cccgtttgca ccactgcagc cgcttctttg 9180
gttcggacac cttgctgcga gctaggtgcc ttgtgctact taaaaagtgg cctcccaaca 9240
ccaacatgac atgagtgcgt gggccaagac acgttggcgg ggtcgcagtc ggctcaatgg 9300
cccggaaaaa acgctgctgg agctggttcg gacgcagtcc gccgcggcgt atggatatcc 9360
gcaaggttcc atagcgccat tgccctccgt cggcgtctat cccgcaacct taattaagtc 9420
atacacaagt cagctttctt cgagcctcat ataagtataa gtagttcaac gtattagcac 9480
tgtacccagc atctccgtat cgagaaacac aacaacatgc cccattggac agatcatgcg 9540
gatacacagg ttgtgcagta tcatacatac tcgatcagac aggtcgtctg accatcatac 9600
aagctgaaca agcgctccat acttgcacgc tctctatata cacagttaaa ttacatatcc 9660
atagtctaac ctctaacagt taatcttctg gtaagcctcc cagccagcct tctggtatcg 9720
cttggcctcc tcaataggat ctcggttctg gccgtacaga cctcggccga caattatgat 9780
atccgttccg gtagacatga catcctcaac agttcggtac tgctgtccga gagcgtctcc 9840
cttgtcgtca agacccaccc cgggggtcag aataagccag tcctcagagt cgcccttagg 9900
tcggttctgg gcaatgaagc caaccacaaa ctcggggtcg gatcgggcaa gctcaatggt 9960
ctgcttggag tactcgccag tggccagaga gcccttgcaa gacagctcgg ccagcatgag 10020
cagacctctg gccagcttct cgttgggaga ggggactagg aactccttgt actgggagtt 10080
ctcgtagtca gagacgtcct ccttcttctg ttcagagaca gtttcctcgg caccagctcg 10140
caggccagca atgattccgg ttccgggtac accgtgggcg ttggtgatat cggaccactc 10200
ggcgattcgg tgacaccggt actggtgctt gacagtgttg ccaatatctg cgaactttct 10260
gtcctcgaac aggaagaaac cgtgcttaag agcaagttcc ttgaggggga gcacagtgcc 10320
ggcgtaggtg aagtcgtcaa tgatgtcgat atgggttttg atcatgcaca cataaggtcc 10380
gaccttatcg gcaagctcaa tgagctcctt ggtggtggta acatccagag aagcacacag 10440
gttggttttc ttggctgcca cgagcttgag cactcgagcg gcaaaggcgg acttgtggac 10500
gttagctcga gcttcgtagg agggcatttt ggtggtgaag aggagactga aataaattta 10560
gtctgcagaa ctttttatcg gaaccttatc tggggcagtg aagtatatgt tatggtaata 10620
gttacgagtt agttgaactt atagatagac tggactatac ggctatcggt ccaaattaga 10680
aagaacgtca atggctctct gggcgtcgcc tttgccgaca aaaatgtgat catgatgaaa 10740
gccagcaatg acgttgcagc tgatattgtt gtcggccaac cgcgccgaaa acgcagctgt 10800
cagacccaca gcctccaacg aagaatgtat cgtcaaagtg atccaagcac actcatagtt 10860
ggagtcgtac tccaaaggcg gcaatgacga gtcagacaga tactcgtcga cgtttaaacc 10920
atcatctaag ggcctcaaaa ctacctcgga actgctgcgc tgatctggac accacagagg 10980
ttccgagcac tttaggttgc accaaatgtc ccaccaggtg caggcagaaa acgctggaac 11040
agcgtgtaca gtttgtctta acaaaaagtg agggcgctga ggtcgagcag ggtggtgtga 11100
cttgttatag cctttagagc tgcgaaagcg cgtatggatt tggctcatca ggccagattg 11160
agggtctgtg gacacatgtc atgttagtgt acttcaatcg ccccctggat atagccccga 11220
caataggccg tggcctcatt tttttgcctt ccgcacattt ccattgctcg gtacccacac 11280
cttgcttctc ctgcacttgc caaccttaat actggtttac attgaccaac atcttacaag 11340
cggggggctt gtctagggta tatataaaca gtggctctcc caatcggttg ccagtctctt 11400
ttttcctttc tttccccaca gattcgaaat ctaaactaca catcacac 11448
<210> 153
<211> 11448
<212> DNA
<213> 人工序列
<220>
<223> pRF339
<400> 153
catggacaag aaatactcca tcggcctggc cattggaacc aactctgtcg gctgggctgt 60
catcaccgac gagtacaagg tgccctccaa gaaattcaag gtcctcggaa acaccgatcg 120
acactccatc aagaaaaacc tcattggtgc cctgttgttc gattctggcg agactgccga 180
agctaccaga ctcaagcgaa ctgctcggcg acgttacacc cgacggaaga accgaatctg 240
ctacctgcag gagatctttt ccaacgagat ggccaaggtg gacgattcgt tctttcatcg 300
actggaggaa tccttcctcg tcgaggaaga caagaaacac gagcgtcatc ccatctttgg 360
caacattgtg gacgaggttg cttaccacga gaagtatcct accatctacc acctgcgaaa 420
gaaactcgtc gattccaccg acaaggcgga tctcagactt atctacctcg ctctggcaca 480
catgatcaag tttcgaggtc atttcctcat cgagggcgat ctcaatcccg acaacagcga 540
tgtggacaag ctgttcattc agctcgttca gacctacaac cagctgttcg aggaaaaccc 600
catcaatgcc tccggagtcg atgcaaaggc catcttgtct gctcgactct cgaagagcag 660
acgactggag aacctcattg cccaacttcc tggcgagaaa aagaacggac tgtttggcaa 720
cctcattgcc ctttctcttg gtctcacacc caacttcaag tccaacttcg atctggcgga 780
ggacgccaag ctccagctgt ccaaggacac ctacgacgat gacctcgaca acctgcttgc 840
acagattggc gatcagtacg ccgacctgtt tctcgctgcc aagaaccttt cggatgctat 900
tctcttgtct gacattctgc gagtcaacac cgagatcaca aaggctcccc tttctgcctc 960
catgatcaag cgatacgacg agcaccatca ggatctcaca ctgctcaagg ctcttgtccg 1020
acagcaactg cccgagaagt acaaggagat ctttttcgat cagtcgaaga acggctacgc 1080
tggatacatc gacggcggag cctctcagga agagttctac aagttcatca agccaattct 1140
cgagaagatg gacggaaccg aggaactgct tgtcaagctc aatcgagagg atctgcttcg 1200
gaagcaacga accttcgaca acggcagcat tcctcatcag atccacctcg gtgagctgca 1260
cgccattctt cgacgtcagg aagacttcta cccctttctc aaggacaacc gagagaagat 1320
cgagaagatt cttacctttc gaatccccta ctatgttggt cctcttgcca gaggaaactc 1380
tcgatttgct tggatgactc gaaagtccga ggaaaccatc actccctgga acttcgagga 1440
agtcgtggac aagggtgcct ctgcacagtc cttcatcgag cgaatgacca acttcgacaa 1500
gaatctgccc aacgagaagg ttcttcccaa gcattcgctg ctctacgagt actttacagt 1560
ctacaacgaa ctcaccaaag tcaagtacgt taccgaggga atgcgaaagc ctgccttctt 1620
gtctggcgaa cagaagaaag ccattgtcga tctcctgttc aagaccaacc gaaaggtcac 1680
tgttaagcag ctcaaggagg actacttcaa gaaaatcgag tgtttcgaca gcgtcgagat 1740
ttccggagtt gaggaccgat tcaacgcctc tttgggcacc tatcacgatc tgctcaagat 1800
tatcaaggac aaggattttc tcgacaacga ggaaaacgag gacattctgg aggacatcgt 1860
gctcactctt accctgttcg aagatcggga gatgatcgag gaacgactca agacatacgc 1920
tcacctgttc gacgacaagg tcatgaaaca actcaagcga cgtagataca ccggctgggg 1980
aagactttcg cgaaagctca tcaacggcat cagagacaag cagtccggaa agaccattct 2040
ggactttctc aagtccgatg gctttgccaa ccgaaacttc atgcagctca ttcacgacga 2100
ttctcttacc ttcaaggagg acatccagaa ggcacaagtg tccggtcagg gcgacagctt 2160
gcacgaacat attgccaacc tggctggttc gccagccatc aagaaaggca ttctccagac 2220
tgtcaaggtt gtcgacgagc tggtgaaggt catgggacgt cacaagcccg agaacattgt 2280
gatcgagatg gccagagaga accagacaac tcaaaagggt cagaaaaact cgcgagagcg 2340
gatgaagcga atcgaggaag gcatcaagga gctgggatcc cagattctca aggagcatcc 2400
cgtcgagaac actcaactgc agaacgagaa gctgtatctc tactatctgc agaatggtcg 2460
agacatgtac gtggatcagg aactggacat caatcgtctc agcgactacg atgtggacgc 2520
cattgtccct caatcctttc tcaaggacga ttctatcgac aacaaggtcc ttacacgatc 2580
cgacaagaac agaggcaagt cggacaacgt tcccagcgaa gaggtggtca aaaagatgaa 2640
gaactactgg cgacagctgc tcaacgccaa gctcattacc cagcgaaagt tcgacaatct 2700
taccaaggcc gagcgaggcg gtctgtccga gctcgacaag gctggcttca tcaagcgtca 2760
actcgtcgag accagacaga tcacaaagca cgtcgcacag attctcgatt ctcggatgaa 2820
caccaagtac gacgagaacg acaagctcat ccgagaggtc aaggtgatta ctctcaagtc 2880
caaactggtc tccgatttcc gaaaggactt tcagttctac aaggtgcgag agatcaacaa 2940
ttaccaccat gcccacgatg cttacctcaa cgccgtcgtt ggcactgcgc tcatcaagaa 3000
ataccccaag ctcgaaagcg agttcgttta cggcgattac aaggtctacg acgttcgaaa 3060
gatgattgcc aagtccgaac aggagattgg caaggctact gccaagtact tcttttactc 3120
caacatcatg aactttttca agaccgagat caccttggcc aacggagaga ttcgaaagag 3180
accacttatc gagaccaacg gcgaaactgg agagatcgtg tgggacaagg gtcgagactt 3240
tgcaaccgtg cgaaaggttc tgtcgatgcc tcaggtcaac atcgtcaaga aaaccgaggt 3300
tcagactggc ggattctcca aggagtcgat tctgcccaag cgaaactccg acaagctcat 3360
cgctcgaaag aaagactggg atcccaagaa atacggtggc ttcgattctc ctaccgtcgc 3420
ctattccgtg cttgtcgttg cgaaggtcga gaagggcaag tccaaaaagc tcaagtccgt 3480
caaggagctg ctcggaatta ccatcatgga gcgatcgagc ttcgagaaga atcccatcga 3540
cttcttggaa gccaagggtt acaaggaggt caagaaagac ctcattatca agctgcccaa 3600
gtactctctg ttcgaactgg agaacggtcg aaagcgtatg ctcgcctccg ctggcgagct 3660
gcagaaggga aacgagcttg ccttgccttc gaagtacgtc aactttctct atctggcttc 3720
tcactacgag aagctcaagg gttctcccga ggacaacgaa cagaagcaac tcttcgttga 3780
gcagcacaaa cattacctcg acgagattat cgagcagatt tccgagtttt cgaagcgagt 3840
catcctggct gatgccaact tggacaaggt gctctctgcc tacaacaagc atcgggacaa 3900
acccattcga gaacaggcgg agaacatcat tcacctgttt actcttacca acctgggtgc 3960
tcctgcagct ttcaagtact tcgataccac tatcgaccga aagcggtaca catccaccaa 4020
ggaggttctc gatgccaccc tgattcacca gtccatcact ggcctgtacg agacccgaat 4080
cgacctgtct cagcttggtg gcgactccag agccgatccc aagaaaaagc gaaaggtcta 4140
agcggccgca agtgtggatg gggaagtgag tgcccggttc tgtgtgcaca attggcaatc 4200
caagatggat ggattcaaca cagggatata gcgagctacg tggtggtgcg aggatatagc 4260
aacggatatt tatgtttgac acttgagaat gtacgataca agcactgtcc aagtacaata 4320
ctaaacatac tgtacatact catactcgta cccgggcaac ggtttcactt gagtgcagtg 4380
gctagtgctc ttactcgtac agtgtgcaat actgcgtatc atagtctttg atgtatatcg 4440
tattcattca tgttagttgc gtacgagccg gaagcataaa gtgtaaagcc tggggtgcct 4500
aatgagtgag ctaactcaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa 4560
acctgtcgtg ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta 4620
ttgggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc 4680
gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg 4740
caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt 4800
tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa 4860
gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct 4920
ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc 4980
cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg 5040
tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct 5100
tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag 5160
cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga 5220
agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc gctctgctga 5280
agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg 5340
gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag 5400
aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag 5460
ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat 5520
gaagttttaa atcaatctaa agtatatatg agtaaacttg gtctgacagt taccaatgct 5580
taatcagtga ggcacctatc tcagcgatct gtctatttcg ttcatccata gttgcctgac 5640
tccccgtcgt gtagataact acgatacggg agggcttacc atctggcccc agtgctgcaa 5700
tgataccgcg agacccacgc tcaccggctc cagatttatc agcaataaac cagccagccg 5760
gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag tctattaatt 5820
gttgccggga agctagagta agtagttcgc cagttaatag tttgcgcaac gttgttgcca 5880
ttgctacagg catcgtggtg tcacgctcgt cgtttggtat ggcttcattc agctccggtt 5940
cccaacgatc aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg gttagctcct 6000
tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt gttatcactc atggttatgg 6060
cagcactgca taattctctt actgtcatgc catccgtaag atgcttttct gtgactggtg 6120
agtactcaac caagtcattc tgagaatagt gtatgcggcg accgagttgc tcttgcccgg 6180
cgtcaatacg ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa 6240
aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt 6300
aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt 6360
gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt 6420
gaatactcat actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca 6480
tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 6540
ttccccgaaa agtgccacct gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg 6600
tggttacgcg cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt 6660
tcttcccttc ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc 6720
tccctttagg gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg 6780
gtgatggttc acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg 6840
agtccacgtt ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct 6900
cggtctattc ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg 6960
agctgattta acaaaaattt aacgcgaatt ttaacaaaat attaacgctt acaatttcca 7020
ttcgccattc aggctgcgca actgttggga agggcgatcg gtgcgggcct cttcgctatt 7080
acgccagctg gcgaaagggg gatgtgctgc aaggcgatta agttgggtaa cgccagggtt 7140
ttcccagtca cgacgttgta aaacgacggc cagtgaattg taatacgact cactataggg 7200
cgaattgggt accgggcccc ccctcgaggt cgatggtgtc gataagcttg atatcgaatt 7260
catgtcacac aaaccgatct tcgcctcaag gaaacctaat tctacatccg agagactgcc 7320
gagatccagt ctacactgat taattttcgg gccaataatt taaaaaaatc gtgttatata 7380
atattatatg tattatatat atacatcatg atgatactga cagtcatgtc ccattgctaa 7440
atagacagac tccatctgcc gcctccaact gatgttctca atatttaagg ggtcatctcg 7500
cattgtttaa taataaacag actccatcta ccgcctccaa atgatgttct caaaatatat 7560
tgtatgaact tatttttatt acttagtatt attagacaac ttacttgctt tatgaaaaac 7620
acttcctatt taggaaacaa tttataatgg cagttcgttc atttaacaat ttatgtagaa 7680
taaatgttat aaatgcgtat gggaaatctt aaatatggat agcataaatg atatctgcat 7740
tgcctaattc gaaatcaaca gcaacgaaaa aaatcccttg tacaacataa atagtcatcg 7800
agaaatatca actatcaaag aacagctatt cacacgttac tattgagatt attattggac 7860
gagaatcaca cactcaactg tctttctctc ttctagaaat acaggtacaa gtatgtacta 7920
ttctcattgt tcatacttct agtcatttca tcccacatat tccttggatt tctctccaat 7980
gaatgacatt ctatcttgca aattcaacaa ttataataag atataccaaa gtagcggtat 8040
agtggcaatc aaaaagcttc tctggtgtgc ttctcgtatt tatttttatt ctaatgatcc 8100
attaaaggta tatatttatt tcttgttata taatcctttt gtttattaca tgggctggat 8160
acataaaggt attttgattt aattttttgc ttaaattcaa tcccccctcg ttcagtgtca 8220
actgtaatgg taggaaatta ccatactttt gaagaagcaa aaaaaatgaa agaaaaaaaa 8280
aatcgtattt ccaggttaga cgttccgcag aatctagaat gcggtatgcg gtacattgtt 8340
cttcgaacgt aaaagttgcg ctccctgaga tattgtacat ttttgctttt acaagtacaa 8400
gtacatcgta caactatgta ctactgttga tgcatccaca acagtttgtt ttgttttttt 8460
ttgttttttt tttttctaat gattcattac cgctatgtat acctacttgt acttgtagta 8520
agccgggtta ttggcgttca attaatcata gacttatgaa tctgcacggt gtgcgctgcg 8580
agttactttt agcttatgca tgctacttgg gtgtaatatt gggatctgtt cggaaatcaa 8640
cggatgctca atcgatcgcc agcaacgcgg ccttagacat aaaaaacaaa aaaaaaaagc 8700
accgactcgg tgccactttt tcaagttgat aacggactag ccttatttta acttgctatt 8760
tctagctcta aaactagaac cgtactgaaa ctgagacgag cttactcgtt tcgtcctcac 8820
ggactcatca gtcagtttac gcatggttga tgtgtgttta attcaagaat gaatatagag 8880
aagagaagaa gaaaaaagat tcaattgagc cggcgatgca gacccttata taaatgttgc 8940
cttggacaga cggagcaagc ccgcccaaac ctacgttcgg tataatatgt taagcttttt 9000
aacacaaagg tttggcttgg ggtaacctga tgtggtgcaa aagaccgggc gttggcgagc 9060
cattgcgcgg gcgaatgggg tcgtgactcg tctcaaattc gagggcgtgc ctcaattcgt 9120
gcccccgtgg ctttttcccg ccgtttccgc cccgtttgca ccactgcagc cgcttctttg 9180
gttcggacac cttgctgcga gctaggtgcc ttgtgctact taaaaagtgg cctcccaaca 9240
ccaacatgac atgagtgcgt gggccaagac acgttggcgg ggtcgcagtc ggctcaatgg 9300
cccggaaaaa acgctgctgg agctggttcg gacgcagtcc gccgcggcgt atggatatcc 9360
gcaaggttcc atagcgccat tgccctccgt cggcgtctat cccgcaacct taattaagtc 9420
atacacaagt cagctttctt cgagcctcat ataagtataa gtagttcaac gtattagcac 9480
tgtacccagc atctccgtat cgagaaacac aacaacatgc cccattggac agatcatgcg 9540
gatacacagg ttgtgcagta tcatacatac tcgatcagac aggtcgtctg accatcatac 9600
aagctgaaca agcgctccat acttgcacgc tctctatata cacagttaaa ttacatatcc 9660
atagtctaac ctctaacagt taatcttctg gtaagcctcc cagccagcct tctggtatcg 9720
cttggcctcc tcaataggat ctcggttctg gccgtacaga cctcggccga caattatgat 9780
atccgttccg gtagacatga catcctcaac agttcggtac tgctgtccga gagcgtctcc 9840
cttgtcgtca agacccaccc cgggggtcag aataagccag tcctcagagt cgcccttagg 9900
tcggttctgg gcaatgaagc caaccacaaa ctcggggtcg gatcgggcaa gctcaatggt 9960
ctgcttggag tactcgccag tggccagaga gcccttgcaa gacagctcgg ccagcatgag 10020
cagacctctg gccagcttct cgttgggaga ggggactagg aactccttgt actgggagtt 10080
ctcgtagtca gagacgtcct ccttcttctg ttcagagaca gtttcctcgg caccagctcg 10140
caggccagca atgattccgg ttccgggtac accgtgggcg ttggtgatat cggaccactc 10200
ggcgattcgg tgacaccggt actggtgctt gacagtgttg ccaatatctg cgaactttct 10260
gtcctcgaac aggaagaaac cgtgcttaag agcaagttcc ttgaggggga gcacagtgcc 10320
ggcgtaggtg aagtcgtcaa tgatgtcgat atgggttttg atcatgcaca cataaggtcc 10380
gaccttatcg gcaagctcaa tgagctcctt ggtggtggta acatccagag aagcacacag 10440
gttggttttc ttggctgcca cgagcttgag cactcgagcg gcaaaggcgg acttgtggac 10500
gttagctcga gcttcgtagg agggcatttt ggtggtgaag aggagactga aataaattta 10560
gtctgcagaa ctttttatcg gaaccttatc tggggcagtg aagtatatgt tatggtaata 10620
gttacgagtt agttgaactt atagatagac tggactatac ggctatcggt ccaaattaga 10680
aagaacgtca atggctctct gggcgtcgcc tttgccgaca aaaatgtgat catgatgaaa 10740
gccagcaatg acgttgcagc tgatattgtt gtcggccaac cgcgccgaaa acgcagctgt 10800
cagacccaca gcctccaacg aagaatgtat cgtcaaagtg atccaagcac actcatagtt 10860
ggagtcgtac tccaaaggcg gcaatgacga gtcagacaga tactcgtcga cgtttaaacc 10920
atcatctaag ggcctcaaaa ctacctcgga actgctgcgc tgatctggac accacagagg 10980
ttccgagcac tttaggttgc accaaatgtc ccaccaggtg caggcagaaa acgctggaac 11040
agcgtgtaca gtttgtctta acaaaaagtg agggcgctga ggtcgagcag ggtggtgtga 11100
cttgttatag cctttagagc tgcgaaagcg cgtatggatt tggctcatca ggccagattg 11160
agggtctgtg gacacatgtc atgttagtgt acttcaatcg ccccctggat atagccccga 11220
caataggccg tggcctcatt tttttgcctt ccgcacattt ccattgctcg gtacccacac 11280
cttgcttctc ctgcacttgc caaccttaat actggtttac attgaccaac atcttacaag 11340
cggggggctt gtctagggta tatataaaca gtggctctcc caatcggttg ccagtctctt 11400
ttttcctttc tttccccaca gattcgaaat ctaaactaca catcacac 11448
<210> 154
<211> 11448
<212> DNA
<213> 人工序列
<220>
<223> pRF341
<400> 154
catggacaag aaatactcca tcggcctggc cattggaacc aactctgtcg gctgggctgt 60
catcaccgac gagtacaagg tgccctccaa gaaattcaag gtcctcggaa acaccgatcg 120
acactccatc aagaaaaacc tcattggtgc cctgttgttc gattctggcg agactgccga 180
agctaccaga ctcaagcgaa ctgctcggcg acgttacacc cgacggaaga accgaatctg 240
ctacctgcag gagatctttt ccaacgagat ggccaaggtg gacgattcgt tctttcatcg 300
actggaggaa tccttcctcg tcgaggaaga caagaaacac gagcgtcatc ccatctttgg 360
caacattgtg gacgaggttg cttaccacga gaagtatcct accatctacc acctgcgaaa 420
gaaactcgtc gattccaccg acaaggcgga tctcagactt atctacctcg ctctggcaca 480
catgatcaag tttcgaggtc atttcctcat cgagggcgat ctcaatcccg acaacagcga 540
tgtggacaag ctgttcattc agctcgttca gacctacaac cagctgttcg aggaaaaccc 600
catcaatgcc tccggagtcg atgcaaaggc catcttgtct gctcgactct cgaagagcag 660
acgactggag aacctcattg cccaacttcc tggcgagaaa aagaacggac tgtttggcaa 720
cctcattgcc ctttctcttg gtctcacacc caacttcaag tccaacttcg atctggcgga 780
ggacgccaag ctccagctgt ccaaggacac ctacgacgat gacctcgaca acctgcttgc 840
acagattggc gatcagtacg ccgacctgtt tctcgctgcc aagaaccttt cggatgctat 900
tctcttgtct gacattctgc gagtcaacac cgagatcaca aaggctcccc tttctgcctc 960
catgatcaag cgatacgacg agcaccatca ggatctcaca ctgctcaagg ctcttgtccg 1020
acagcaactg cccgagaagt acaaggagat ctttttcgat cagtcgaaga acggctacgc 1080
tggatacatc gacggcggag cctctcagga agagttctac aagttcatca agccaattct 1140
cgagaagatg gacggaaccg aggaactgct tgtcaagctc aatcgagagg atctgcttcg 1200
gaagcaacga accttcgaca acggcagcat tcctcatcag atccacctcg gtgagctgca 1260
cgccattctt cgacgtcagg aagacttcta cccctttctc aaggacaacc gagagaagat 1320
cgagaagatt cttacctttc gaatccccta ctatgttggt cctcttgcca gaggaaactc 1380
tcgatttgct tggatgactc gaaagtccga ggaaaccatc actccctgga acttcgagga 1440
agtcgtggac aagggtgcct ctgcacagtc cttcatcgag cgaatgacca acttcgacaa 1500
gaatctgccc aacgagaagg ttcttcccaa gcattcgctg ctctacgagt actttacagt 1560
ctacaacgaa ctcaccaaag tcaagtacgt taccgaggga atgcgaaagc ctgccttctt 1620
gtctggcgaa cagaagaaag ccattgtcga tctcctgttc aagaccaacc gaaaggtcac 1680
tgttaagcag ctcaaggagg actacttcaa gaaaatcgag tgtttcgaca gcgtcgagat 1740
ttccggagtt gaggaccgat tcaacgcctc tttgggcacc tatcacgatc tgctcaagat 1800
tatcaaggac aaggattttc tcgacaacga ggaaaacgag gacattctgg aggacatcgt 1860
gctcactctt accctgttcg aagatcggga gatgatcgag gaacgactca agacatacgc 1920
tcacctgttc gacgacaagg tcatgaaaca actcaagcga cgtagataca ccggctgggg 1980
aagactttcg cgaaagctca tcaacggcat cagagacaag cagtccggaa agaccattct 2040
ggactttctc aagtccgatg gctttgccaa ccgaaacttc atgcagctca ttcacgacga 2100
ttctcttacc ttcaaggagg acatccagaa ggcacaagtg tccggtcagg gcgacagctt 2160
gcacgaacat attgccaacc tggctggttc gccagccatc aagaaaggca ttctccagac 2220
tgtcaaggtt gtcgacgagc tggtgaaggt catgggacgt cacaagcccg agaacattgt 2280
gatcgagatg gccagagaga accagacaac tcaaaagggt cagaaaaact cgcgagagcg 2340
gatgaagcga atcgaggaag gcatcaagga gctgggatcc cagattctca aggagcatcc 2400
cgtcgagaac actcaactgc agaacgagaa gctgtatctc tactatctgc agaatggtcg 2460
agacatgtac gtggatcagg aactggacat caatcgtctc agcgactacg atgtggacgc 2520
cattgtccct caatcctttc tcaaggacga ttctatcgac aacaaggtcc ttacacgatc 2580
cgacaagaac agaggcaagt cggacaacgt tcccagcgaa gaggtggtca aaaagatgaa 2640
gaactactgg cgacagctgc tcaacgccaa gctcattacc cagcgaaagt tcgacaatct 2700
taccaaggcc gagcgaggcg gtctgtccga gctcgacaag gctggcttca tcaagcgtca 2760
actcgtcgag accagacaga tcacaaagca cgtcgcacag attctcgatt ctcggatgaa 2820
caccaagtac gacgagaacg acaagctcat ccgagaggtc aaggtgatta ctctcaagtc 2880
caaactggtc tccgatttcc gaaaggactt tcagttctac aaggtgcgag agatcaacaa 2940
ttaccaccat gcccacgatg cttacctcaa cgccgtcgtt ggcactgcgc tcatcaagaa 3000
ataccccaag ctcgaaagcg agttcgttta cggcgattac aaggtctacg acgttcgaaa 3060
gatgattgcc aagtccgaac aggagattgg caaggctact gccaagtact tcttttactc 3120
caacatcatg aactttttca agaccgagat caccttggcc aacggagaga ttcgaaagag 3180
accacttatc gagaccaacg gcgaaactgg agagatcgtg tgggacaagg gtcgagactt 3240
tgcaaccgtg cgaaaggttc tgtcgatgcc tcaggtcaac atcgtcaaga aaaccgaggt 3300
tcagactggc ggattctcca aggagtcgat tctgcccaag cgaaactccg acaagctcat 3360
cgctcgaaag aaagactggg atcccaagaa atacggtggc ttcgattctc ctaccgtcgc 3420
ctattccgtg cttgtcgttg cgaaggtcga gaagggcaag tccaaaaagc tcaagtccgt 3480
caaggagctg ctcggaatta ccatcatgga gcgatcgagc ttcgagaaga atcccatcga 3540
cttcttggaa gccaagggtt acaaggaggt caagaaagac ctcattatca agctgcccaa 3600
gtactctctg ttcgaactgg agaacggtcg aaagcgtatg ctcgcctccg ctggcgagct 3660
gcagaaggga aacgagcttg ccttgccttc gaagtacgtc aactttctct atctggcttc 3720
tcactacgag aagctcaagg gttctcccga ggacaacgaa cagaagcaac tcttcgttga 3780
gcagcacaaa cattacctcg acgagattat cgagcagatt tccgagtttt cgaagcgagt 3840
catcctggct gatgccaact tggacaaggt gctctctgcc tacaacaagc atcgggacaa 3900
acccattcga gaacaggcgg agaacatcat tcacctgttt actcttacca acctgggtgc 3960
tcctgcagct ttcaagtact tcgataccac tatcgaccga aagcggtaca catccaccaa 4020
ggaggttctc gatgccaccc tgattcacca gtccatcact ggcctgtacg agacccgaat 4080
cgacctgtct cagcttggtg gcgactccag agccgatccc aagaaaaagc gaaaggtcta 4140
agcggccgca agtgtggatg gggaagtgag tgcccggttc tgtgtgcaca attggcaatc 4200
caagatggat ggattcaaca cagggatata gcgagctacg tggtggtgcg aggatatagc 4260
aacggatatt tatgtttgac acttgagaat gtacgataca agcactgtcc aagtacaata 4320
ctaaacatac tgtacatact catactcgta cccgggcaac ggtttcactt gagtgcagtg 4380
gctagtgctc ttactcgtac agtgtgcaat actgcgtatc atagtctttg atgtatatcg 4440
tattcattca tgttagttgc gtacgagccg gaagcataaa gtgtaaagcc tggggtgcct 4500
aatgagtgag ctaactcaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa 4560
acctgtcgtg ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta 4620
ttgggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc 4680
gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg 4740
caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt 4800
tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa 4860
gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct 4920
ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc 4980
cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg 5040
tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct 5100
tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag 5160
cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga 5220
agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc gctctgctga 5280
agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg 5340
gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag 5400
aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag 5460
ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat 5520
gaagttttaa atcaatctaa agtatatatg agtaaacttg gtctgacagt taccaatgct 5580
taatcagtga ggcacctatc tcagcgatct gtctatttcg ttcatccata gttgcctgac 5640
tccccgtcgt gtagataact acgatacggg agggcttacc atctggcccc agtgctgcaa 5700
tgataccgcg agacccacgc tcaccggctc cagatttatc agcaataaac cagccagccg 5760
gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag tctattaatt 5820
gttgccggga agctagagta agtagttcgc cagttaatag tttgcgcaac gttgttgcca 5880
ttgctacagg catcgtggtg tcacgctcgt cgtttggtat ggcttcattc agctccggtt 5940
cccaacgatc aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg gttagctcct 6000
tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt gttatcactc atggttatgg 6060
cagcactgca taattctctt actgtcatgc catccgtaag atgcttttct gtgactggtg 6120
agtactcaac caagtcattc tgagaatagt gtatgcggcg accgagttgc tcttgcccgg 6180
cgtcaatacg ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa 6240
aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt 6300
aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt 6360
gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt 6420
gaatactcat actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca 6480
tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 6540
ttccccgaaa agtgccacct gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg 6600
tggttacgcg cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt 6660
tcttcccttc ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc 6720
tccctttagg gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg 6780
gtgatggttc acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg 6840
agtccacgtt ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct 6900
cggtctattc ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg 6960
agctgattta acaaaaattt aacgcgaatt ttaacaaaat attaacgctt acaatttcca 7020
ttcgccattc aggctgcgca actgttggga agggcgatcg gtgcgggcct cttcgctatt 7080
acgccagctg gcgaaagggg gatgtgctgc aaggcgatta agttgggtaa cgccagggtt 7140
ttcccagtca cgacgttgta aaacgacggc cagtgaattg taatacgact cactataggg 7200
cgaattgggt accgggcccc ccctcgaggt cgatggtgtc gataagcttg atatcgaatt 7260
catgtcacac aaaccgatct tcgcctcaag gaaacctaat tctacatccg agagactgcc 7320
gagatccagt ctacactgat taattttcgg gccaataatt taaaaaaatc gtgttatata 7380
atattatatg tattatatat atacatcatg atgatactga cagtcatgtc ccattgctaa 7440
atagacagac tccatctgcc gcctccaact gatgttctca atatttaagg ggtcatctcg 7500
cattgtttaa taataaacag actccatcta ccgcctccaa atgatgttct caaaatatat 7560
tgtatgaact tatttttatt acttagtatt attagacaac ttacttgctt tatgaaaaac 7620
acttcctatt taggaaacaa tttataatgg cagttcgttc atttaacaat ttatgtagaa 7680
taaatgttat aaatgcgtat gggaaatctt aaatatggat agcataaatg atatctgcat 7740
tgcctaattc gaaatcaaca gcaacgaaaa aaatcccttg tacaacataa atagtcatcg 7800
agaaatatca actatcaaag aacagctatt cacacgttac tattgagatt attattggac 7860
gagaatcaca cactcaactg tctttctctc ttctagaaat acaggtacaa gtatgtacta 7920
ttctcattgt tcatacttct agtcatttca tcccacatat tccttggatt tctctccaat 7980
gaatgacatt ctatcttgca aattcaacaa ttataataag atataccaaa gtagcggtat 8040
agtggcaatc aaaaagcttc tctggtgtgc ttctcgtatt tatttttatt ctaatgatcc 8100
attaaaggta tatatttatt tcttgttata taatcctttt gtttattaca tgggctggat 8160
acataaaggt attttgattt aattttttgc ttaaattcaa tcccccctcg ttcagtgtca 8220
actgtaatgg taggaaatta ccatactttt gaagaagcaa aaaaaatgaa agaaaaaaaa 8280
aatcgtattt ccaggttaga cgttccgcag aatctagaat gcggtatgcg gtacattgtt 8340
cttcgaacgt aaaagttgcg ctccctgaga tattgtacat ttttgctttt acaagtacaa 8400
gtacatcgta caactatgta ctactgttga tgcatccaca acagtttgtt ttgttttttt 8460
ttgttttttt tttttctaat gattcattac cgctatgtat acctacttgt acttgtagta 8520
agccgggtta ttggcgttca attaatcata gacttatgaa tctgcacggt gtgcgctgcg 8580
agttactttt agcttatgca tgctacttgg gtgtaatatt gggatctgtt cggaaatcaa 8640
cggatgctca atcgatcgcc agcaacgcgg ccttagacat aaaaaacaaa aaaaaaaagc 8700
accgactcgg tgccactttt tcaagttgat aacggactag ccttatttta acttgctatt 8760
tctagctcta aaacgagtaa cggtaacgac accggacgag cttactcgtt tcgtcctcac 8820
ggactcatca gcggtgttac gcatggttga tgtgtgttta attcaagaat gaatatagag 8880
aagagaagaa gaaaaaagat tcaattgagc cggcgatgca gacccttata taaatgttgc 8940
cttggacaga cggagcaagc ccgcccaaac ctacgttcgg tataatatgt taagcttttt 9000
aacacaaagg tttggcttgg ggtaacctga tgtggtgcaa aagaccgggc gttggcgagc 9060
cattgcgcgg gcgaatgggg tcgtgactcg tctcaaattc gagggcgtgc ctcaattcgt 9120
gcccccgtgg ctttttcccg ccgtttccgc cccgtttgca ccactgcagc cgcttctttg 9180
gttcggacac cttgctgcga gctaggtgcc ttgtgctact taaaaagtgg cctcccaaca 9240
ccaacatgac atgagtgcgt gggccaagac acgttggcgg ggtcgcagtc ggctcaatgg 9300
cccggaaaaa acgctgctgg agctggttcg gacgcagtcc gccgcggcgt atggatatcc 9360
gcaaggttcc atagcgccat tgccctccgt cggcgtctat cccgcaacct taattaagtc 9420
atacacaagt cagctttctt cgagcctcat ataagtataa gtagttcaac gtattagcac 9480
tgtacccagc atctccgtat cgagaaacac aacaacatgc cccattggac agatcatgcg 9540
gatacacagg ttgtgcagta tcatacatac tcgatcagac aggtcgtctg accatcatac 9600
aagctgaaca agcgctccat acttgcacgc tctctatata cacagttaaa ttacatatcc 9660
atagtctaac ctctaacagt taatcttctg gtaagcctcc cagccagcct tctggtatcg 9720
cttggcctcc tcaataggat ctcggttctg gccgtacaga cctcggccga caattatgat 9780
atccgttccg gtagacatga catcctcaac agttcggtac tgctgtccga gagcgtctcc 9840
cttgtcgtca agacccaccc cgggggtcag aataagccag tcctcagagt cgcccttagg 9900
tcggttctgg gcaatgaagc caaccacaaa ctcggggtcg gatcgggcaa gctcaatggt 9960
ctgcttggag tactcgccag tggccagaga gcccttgcaa gacagctcgg ccagcatgag 10020
cagacctctg gccagcttct cgttgggaga ggggactagg aactccttgt actgggagtt 10080
ctcgtagtca gagacgtcct ccttcttctg ttcagagaca gtttcctcgg caccagctcg 10140
caggccagca atgattccgg ttccgggtac accgtgggcg ttggtgatat cggaccactc 10200
ggcgattcgg tgacaccggt actggtgctt gacagtgttg ccaatatctg cgaactttct 10260
gtcctcgaac aggaagaaac cgtgcttaag agcaagttcc ttgaggggga gcacagtgcc 10320
ggcgtaggtg aagtcgtcaa tgatgtcgat atgggttttg atcatgcaca cataaggtcc 10380
gaccttatcg gcaagctcaa tgagctcctt ggtggtggta acatccagag aagcacacag 10440
gttggttttc ttggctgcca cgagcttgag cactcgagcg gcaaaggcgg acttgtggac 10500
gttagctcga gcttcgtagg agggcatttt ggtggtgaag aggagactga aataaattta 10560
gtctgcagaa ctttttatcg gaaccttatc tggggcagtg aagtatatgt tatggtaata 10620
gttacgagtt agttgaactt atagatagac tggactatac ggctatcggt ccaaattaga 10680
aagaacgtca atggctctct gggcgtcgcc tttgccgaca aaaatgtgat catgatgaaa 10740
gccagcaatg acgttgcagc tgatattgtt gtcggccaac cgcgccgaaa acgcagctgt 10800
cagacccaca gcctccaacg aagaatgtat cgtcaaagtg atccaagcac actcatagtt 10860
ggagtcgtac tccaaaggcg gcaatgacga gtcagacaga tactcgtcga cgtttaaacc 10920
atcatctaag ggcctcaaaa ctacctcgga actgctgcgc tgatctggac accacagagg 10980
ttccgagcac tttaggttgc accaaatgtc ccaccaggtg caggcagaaa acgctggaac 11040
agcgtgtaca gtttgtctta acaaaaagtg agggcgctga ggtcgagcag ggtggtgtga 11100
cttgttatag cctttagagc tgcgaaagcg cgtatggatt tggctcatca ggccagattg 11160
agggtctgtg gacacatgtc atgttagtgt acttcaatcg ccccctggat atagccccga 11220
caataggccg tggcctcatt tttttgcctt ccgcacattt ccattgctcg gtacccacac 11280
cttgcttctc ctgcacttgc caaccttaat actggtttac attgaccaac atcttacaag 11340
cggggggctt gtctagggta tatataaaca gtggctctcc caatcggttg ccagtctctt 11400
ttttcctttc tttccccaca gattcgaaat ctaaactaca catcacac 11448
<210> 155
<211> 11448
<212> DNA
<213> 人工序列
<220>
<223> pRF343
<400> 155
catggacaag aaatactcca tcggcctggc cattggaacc aactctgtcg gctgggctgt 60
catcaccgac gagtacaagg tgccctccaa gaaattcaag gtcctcggaa acaccgatcg 120
acactccatc aagaaaaacc tcattggtgc cctgttgttc gattctggcg agactgccga 180
agctaccaga ctcaagcgaa ctgctcggcg acgttacacc cgacggaaga accgaatctg 240
ctacctgcag gagatctttt ccaacgagat ggccaaggtg gacgattcgt tctttcatcg 300
actggaggaa tccttcctcg tcgaggaaga caagaaacac gagcgtcatc ccatctttgg 360
caacattgtg gacgaggttg cttaccacga gaagtatcct accatctacc acctgcgaaa 420
gaaactcgtc gattccaccg acaaggcgga tctcagactt atctacctcg ctctggcaca 480
catgatcaag tttcgaggtc atttcctcat cgagggcgat ctcaatcccg acaacagcga 540
tgtggacaag ctgttcattc agctcgttca gacctacaac cagctgttcg aggaaaaccc 600
catcaatgcc tccggagtcg atgcaaaggc catcttgtct gctcgactct cgaagagcag 660
acgactggag aacctcattg cccaacttcc tggcgagaaa aagaacggac tgtttggcaa 720
cctcattgcc ctttctcttg gtctcacacc caacttcaag tccaacttcg atctggcgga 780
ggacgccaag ctccagctgt ccaaggacac ctacgacgat gacctcgaca acctgcttgc 840
acagattggc gatcagtacg ccgacctgtt tctcgctgcc aagaaccttt cggatgctat 900
tctcttgtct gacattctgc gagtcaacac cgagatcaca aaggctcccc tttctgcctc 960
catgatcaag cgatacgacg agcaccatca ggatctcaca ctgctcaagg ctcttgtccg 1020
acagcaactg cccgagaagt acaaggagat ctttttcgat cagtcgaaga acggctacgc 1080
tggatacatc gacggcggag cctctcagga agagttctac aagttcatca agccaattct 1140
cgagaagatg gacggaaccg aggaactgct tgtcaagctc aatcgagagg atctgcttcg 1200
gaagcaacga accttcgaca acggcagcat tcctcatcag atccacctcg gtgagctgca 1260
cgccattctt cgacgtcagg aagacttcta cccctttctc aaggacaacc gagagaagat 1320
cgagaagatt cttacctttc gaatccccta ctatgttggt cctcttgcca gaggaaactc 1380
tcgatttgct tggatgactc gaaagtccga ggaaaccatc actccctgga acttcgagga 1440
agtcgtggac aagggtgcct ctgcacagtc cttcatcgag cgaatgacca acttcgacaa 1500
gaatctgccc aacgagaagg ttcttcccaa gcattcgctg ctctacgagt actttacagt 1560
ctacaacgaa ctcaccaaag tcaagtacgt taccgaggga atgcgaaagc ctgccttctt 1620
gtctggcgaa cagaagaaag ccattgtcga tctcctgttc aagaccaacc gaaaggtcac 1680
tgttaagcag ctcaaggagg actacttcaa gaaaatcgag tgtttcgaca gcgtcgagat 1740
ttccggagtt gaggaccgat tcaacgcctc tttgggcacc tatcacgatc tgctcaagat 1800
tatcaaggac aaggattttc tcgacaacga ggaaaacgag gacattctgg aggacatcgt 1860
gctcactctt accctgttcg aagatcggga gatgatcgag gaacgactca agacatacgc 1920
tcacctgttc gacgacaagg tcatgaaaca actcaagcga cgtagataca ccggctgggg 1980
aagactttcg cgaaagctca tcaacggcat cagagacaag cagtccggaa agaccattct 2040
ggactttctc aagtccgatg gctttgccaa ccgaaacttc atgcagctca ttcacgacga 2100
ttctcttacc ttcaaggagg acatccagaa ggcacaagtg tccggtcagg gcgacagctt 2160
gcacgaacat attgccaacc tggctggttc gccagccatc aagaaaggca ttctccagac 2220
tgtcaaggtt gtcgacgagc tggtgaaggt catgggacgt cacaagcccg agaacattgt 2280
gatcgagatg gccagagaga accagacaac tcaaaagggt cagaaaaact cgcgagagcg 2340
gatgaagcga atcgaggaag gcatcaagga gctgggatcc cagattctca aggagcatcc 2400
cgtcgagaac actcaactgc agaacgagaa gctgtatctc tactatctgc agaatggtcg 2460
agacatgtac gtggatcagg aactggacat caatcgtctc agcgactacg atgtggacgc 2520
cattgtccct caatcctttc tcaaggacga ttctatcgac aacaaggtcc ttacacgatc 2580
cgacaagaac agaggcaagt cggacaacgt tcccagcgaa gaggtggtca aaaagatgaa 2640
gaactactgg cgacagctgc tcaacgccaa gctcattacc cagcgaaagt tcgacaatct 2700
taccaaggcc gagcgaggcg gtctgtccga gctcgacaag gctggcttca tcaagcgtca 2760
actcgtcgag accagacaga tcacaaagca cgtcgcacag attctcgatt ctcggatgaa 2820
caccaagtac gacgagaacg acaagctcat ccgagaggtc aaggtgatta ctctcaagtc 2880
caaactggtc tccgatttcc gaaaggactt tcagttctac aaggtgcgag agatcaacaa 2940
ttaccaccat gcccacgatg cttacctcaa cgccgtcgtt ggcactgcgc tcatcaagaa 3000
ataccccaag ctcgaaagcg agttcgttta cggcgattac aaggtctacg acgttcgaaa 3060
gatgattgcc aagtccgaac aggagattgg caaggctact gccaagtact tcttttactc 3120
caacatcatg aactttttca agaccgagat caccttggcc aacggagaga ttcgaaagag 3180
accacttatc gagaccaacg gcgaaactgg agagatcgtg tgggacaagg gtcgagactt 3240
tgcaaccgtg cgaaaggttc tgtcgatgcc tcaggtcaac atcgtcaaga aaaccgaggt 3300
tcagactggc ggattctcca aggagtcgat tctgcccaag cgaaactccg acaagctcat 3360
cgctcgaaag aaagactggg atcccaagaa atacggtggc ttcgattctc ctaccgtcgc 3420
ctattccgtg cttgtcgttg cgaaggtcga gaagggcaag tccaaaaagc tcaagtccgt 3480
caaggagctg ctcggaatta ccatcatgga gcgatcgagc ttcgagaaga atcccatcga 3540
cttcttggaa gccaagggtt acaaggaggt caagaaagac ctcattatca agctgcccaa 3600
gtactctctg ttcgaactgg agaacggtcg aaagcgtatg ctcgcctccg ctggcgagct 3660
gcagaaggga aacgagcttg ccttgccttc gaagtacgtc aactttctct atctggcttc 3720
tcactacgag aagctcaagg gttctcccga ggacaacgaa cagaagcaac tcttcgttga 3780
gcagcacaaa cattacctcg acgagattat cgagcagatt tccgagtttt cgaagcgagt 3840
catcctggct gatgccaact tggacaaggt gctctctgcc tacaacaagc atcgggacaa 3900
acccattcga gaacaggcgg agaacatcat tcacctgttt actcttacca acctgggtgc 3960
tcctgcagct ttcaagtact tcgataccac tatcgaccga aagcggtaca catccaccaa 4020
ggaggttctc gatgccaccc tgattcacca gtccatcact ggcctgtacg agacccgaat 4080
cgacctgtct cagcttggtg gcgactccag agccgatccc aagaaaaagc gaaaggtcta 4140
agcggccgca agtgtggatg gggaagtgag tgcccggttc tgtgtgcaca attggcaatc 4200
caagatggat ggattcaaca cagggatata gcgagctacg tggtggtgcg aggatatagc 4260
aacggatatt tatgtttgac acttgagaat gtacgataca agcactgtcc aagtacaata 4320
ctaaacatac tgtacatact catactcgta cccgggcaac ggtttcactt gagtgcagtg 4380
gctagtgctc ttactcgtac agtgtgcaat actgcgtatc atagtctttg atgtatatcg 4440
tattcattca tgttagttgc gtacgagccg gaagcataaa gtgtaaagcc tggggtgcct 4500
aatgagtgag ctaactcaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa 4560
acctgtcgtg ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta 4620
ttgggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc 4680
gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg 4740
caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt 4800
tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa 4860
gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct 4920
ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc 4980
cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg 5040
tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct 5100
tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag 5160
cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga 5220
agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc gctctgctga 5280
agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg 5340
gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag 5400
aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag 5460
ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat 5520
gaagttttaa atcaatctaa agtatatatg agtaaacttg gtctgacagt taccaatgct 5580
taatcagtga ggcacctatc tcagcgatct gtctatttcg ttcatccata gttgcctgac 5640
tccccgtcgt gtagataact acgatacggg agggcttacc atctggcccc agtgctgcaa 5700
tgataccgcg agacccacgc tcaccggctc cagatttatc agcaataaac cagccagccg 5760
gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag tctattaatt 5820
gttgccggga agctagagta agtagttcgc cagttaatag tttgcgcaac gttgttgcca 5880
ttgctacagg catcgtggtg tcacgctcgt cgtttggtat ggcttcattc agctccggtt 5940
cccaacgatc aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg gttagctcct 6000
tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt gttatcactc atggttatgg 6060
cagcactgca taattctctt actgtcatgc catccgtaag atgcttttct gtgactggtg 6120
agtactcaac caagtcattc tgagaatagt gtatgcggcg accgagttgc tcttgcccgg 6180
cgtcaatacg ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa 6240
aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt 6300
aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt 6360
gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt 6420
gaatactcat actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca 6480
tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 6540
ttccccgaaa agtgccacct gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg 6600
tggttacgcg cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt 6660
tcttcccttc ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc 6720
tccctttagg gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg 6780
gtgatggttc acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg 6840
agtccacgtt ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct 6900
cggtctattc ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg 6960
agctgattta acaaaaattt aacgcgaatt ttaacaaaat attaacgctt acaatttcca 7020
ttcgccattc aggctgcgca actgttggga agggcgatcg gtgcgggcct cttcgctatt 7080
acgccagctg gcgaaagggg gatgtgctgc aaggcgatta agttgggtaa cgccagggtt 7140
ttcccagtca cgacgttgta aaacgacggc cagtgaattg taatacgact cactataggg 7200
cgaattgggt accgggcccc ccctcgaggt cgatggtgtc gataagcttg atatcgaatt 7260
catgtcacac aaaccgatct tcgcctcaag gaaacctaat tctacatccg agagactgcc 7320
gagatccagt ctacactgat taattttcgg gccaataatt taaaaaaatc gtgttatata 7380
atattatatg tattatatat atacatcatg atgatactga cagtcatgtc ccattgctaa 7440
atagacagac tccatctgcc gcctccaact gatgttctca atatttaagg ggtcatctcg 7500
cattgtttaa taataaacag actccatcta ccgcctccaa atgatgttct caaaatatat 7560
tgtatgaact tatttttatt acttagtatt attagacaac ttacttgctt tatgaaaaac 7620
acttcctatt taggaaacaa tttataatgg cagttcgttc atttaacaat ttatgtagaa 7680
taaatgttat aaatgcgtat gggaaatctt aaatatggat agcataaatg atatctgcat 7740
tgcctaattc gaaatcaaca gcaacgaaaa aaatcccttg tacaacataa atagtcatcg 7800
agaaatatca actatcaaag aacagctatt cacacgttac tattgagatt attattggac 7860
gagaatcaca cactcaactg tctttctctc ttctagaaat acaggtacaa gtatgtacta 7920
ttctcattgt tcatacttct agtcatttca tcccacatat tccttggatt tctctccaat 7980
gaatgacatt ctatcttgca aattcaacaa ttataataag atataccaaa gtagcggtat 8040
agtggcaatc aaaaagcttc tctggtgtgc ttctcgtatt tatttttatt ctaatgatcc 8100
attaaaggta tatatttatt tcttgttata taatcctttt gtttattaca tgggctggat 8160
acataaaggt attttgattt aattttttgc ttaaattcaa tcccccctcg ttcagtgtca 8220
actgtaatgg taggaaatta ccatactttt gaagaagcaa aaaaaatgaa agaaaaaaaa 8280
aatcgtattt ccaggttaga cgttccgcag aatctagaat gcggtatgcg gtacattgtt 8340
cttcgaacgt aaaagttgcg ctccctgaga tattgtacat ttttgctttt acaagtacaa 8400
gtacatcgta caactatgta ctactgttga tgcatccaca acagtttgtt ttgttttttt 8460
ttgttttttt tttttctaat gattcattac cgctatgtat acctacttgt acttgtagta 8520
agccgggtta ttggcgttca attaatcata gacttatgaa tctgcacggt gtgcgctgcg 8580
agttactttt agcttatgca tgctacttgg gtgtaatatt gggatctgtt cggaaatcaa 8640
cggatgctca atcgatcgcc agcaacgcgg ccttagacat aaaaaacaaa aaaaaaaagc 8700
accgactcgg tgccactttt tcaagttgat aacggactag ccttatttta acttgctatt 8760
tctagctcta aaaccgaagc tgaaggtgac caaggacgag cttactcgtt tcgtcctcac 8820
ggactcatca gcctggttac gcatggttga tgtgtgttta attcaagaat gaatatagag 8880
aagagaagaa gaaaaaagat tcaattgagc cggcgatgca gacccttata taaatgttgc 8940
cttggacaga cggagcaagc ccgcccaaac ctacgttcgg tataatatgt taagcttttt 9000
aacacaaagg tttggcttgg ggtaacctga tgtggtgcaa aagaccgggc gttggcgagc 9060
cattgcgcgg gcgaatgggg tcgtgactcg tctcaaattc gagggcgtgc ctcaattcgt 9120
gcccccgtgg ctttttcccg ccgtttccgc cccgtttgca ccactgcagc cgcttctttg 9180
gttcggacac cttgctgcga gctaggtgcc ttgtgctact taaaaagtgg cctcccaaca 9240
ccaacatgac atgagtgcgt gggccaagac acgttggcgg ggtcgcagtc ggctcaatgg 9300
cccggaaaaa acgctgctgg agctggttcg gacgcagtcc gccgcggcgt atggatatcc 9360
gcaaggttcc atagcgccat tgccctccgt cggcgtctat cccgcaacct taattaagtc 9420
atacacaagt cagctttctt cgagcctcat ataagtataa gtagttcaac gtattagcac 9480
tgtacccagc atctccgtat cgagaaacac aacaacatgc cccattggac agatcatgcg 9540
gatacacagg ttgtgcagta tcatacatac tcgatcagac aggtcgtctg accatcatac 9600
aagctgaaca agcgctccat acttgcacgc tctctatata cacagttaaa ttacatatcc 9660
atagtctaac ctctaacagt taatcttctg gtaagcctcc cagccagcct tctggtatcg 9720
cttggcctcc tcaataggat ctcggttctg gccgtacaga cctcggccga caattatgat 9780
atccgttccg gtagacatga catcctcaac agttcggtac tgctgtccga gagcgtctcc 9840
cttgtcgtca agacccaccc cgggggtcag aataagccag tcctcagagt cgcccttagg 9900
tcggttctgg gcaatgaagc caaccacaaa ctcggggtcg gatcgggcaa gctcaatggt 9960
ctgcttggag tactcgccag tggccagaga gcccttgcaa gacagctcgg ccagcatgag 10020
cagacctctg gccagcttct cgttgggaga ggggactagg aactccttgt actgggagtt 10080
ctcgtagtca gagacgtcct ccttcttctg ttcagagaca gtttcctcgg caccagctcg 10140
caggccagca atgattccgg ttccgggtac accgtgggcg ttggtgatat cggaccactc 10200
ggcgattcgg tgacaccggt actggtgctt gacagtgttg ccaatatctg cgaactttct 10260
gtcctcgaac aggaagaaac cgtgcttaag agcaagttcc ttgaggggga gcacagtgcc 10320
ggcgtaggtg aagtcgtcaa tgatgtcgat atgggttttg atcatgcaca cataaggtcc 10380
gaccttatcg gcaagctcaa tgagctcctt ggtggtggta acatccagag aagcacacag 10440
gttggttttc ttggctgcca cgagcttgag cactcgagcg gcaaaggcgg acttgtggac 10500
gttagctcga gcttcgtagg agggcatttt ggtggtgaag aggagactga aataaattta 10560
gtctgcagaa ctttttatcg gaaccttatc tggggcagtg aagtatatgt tatggtaata 10620
gttacgagtt agttgaactt atagatagac tggactatac ggctatcggt ccaaattaga 10680
aagaacgtca atggctctct gggcgtcgcc tttgccgaca aaaatgtgat catgatgaaa 10740
gccagcaatg acgttgcagc tgatattgtt gtcggccaac cgcgccgaaa acgcagctgt 10800
cagacccaca gcctccaacg aagaatgtat cgtcaaagtg atccaagcac actcatagtt 10860
ggagtcgtac tccaaaggcg gcaatgacga gtcagacaga tactcgtcga cgtttaaacc 10920
atcatctaag ggcctcaaaa ctacctcgga actgctgcgc tgatctggac accacagagg 10980
ttccgagcac tttaggttgc accaaatgtc ccaccaggtg caggcagaaa acgctggaac 11040
agcgtgtaca gtttgtctta acaaaaagtg agggcgctga ggtcgagcag ggtggtgtga 11100
cttgttatag cctttagagc tgcgaaagcg cgtatggatt tggctcatca ggccagattg 11160
agggtctgtg gacacatgtc atgttagtgt acttcaatcg ccccctggat atagccccga 11220
caataggccg tggcctcatt tttttgcctt ccgcacattt ccattgctcg gtacccacac 11280
cttgcttctc ctgcacttgc caaccttaat actggtttac attgaccaac atcttacaag 11340
cggggggctt gtctagggta tatataaaca gtggctctcc caatcggttg ccagtctctt 11400
ttttcctttc tttccccaca gattcgaaat ctaaactaca catcacac 11448
<210> 156
<211> 3901
<212> DNA
<213> 人工序列
<220>
<223> pRF80
<400> 156
agcttgctac gttaggagaa gacgcacggc gatgatacgg gtacccctca tgacatcaat 60
atccgctgcc cctcttgcca gcaaggcgtc agcaggtgct tttttcgcta ttttcaccag 120
accacagcct ttttccttgt gtctcatctt ggattccttc aaaggcaact caccgcacct 180
ccgagtcgtg tgaacaatgt aataataggc tattgacttt tttcccacct gtttagcgcc 240
aaacccaaag cgcttttcgc ccccactgca gcccgatgga aggcacatat ggcaagggaa 300
aagtcttcag gtaatacatg cctgctgcaa ctatatgtac tctgactcat tccctcagac 360
gtgggtcata gacagctgtt ttaaaccggg caaatcaatc tctgtcgcac aggtatttct 420
gcccttcaaa accaggttgc cacatcagat tccatcaaag tttttcagac taacttcaat 480
cttaaacggc atctcacaac aagcgaattg gacggaaaaa aagcgtctat cattaccggc 540
acctatccac actaagacag tactaaagga cgacgctccc cacgaaacga cgtttcgacc 600
ttaacgaccc tgccgtctcc atccatccga ccactcccga cgctctctcc tggagcaaac 660
cactcttacc aagcatatag catatataat aacgtattga atttattaac tgattgaatt 720
gagagtaaag ccagtagcgt tgtacggctg tagcttttta gaaaagtggc agatgagcga 780
tggtggatat gaaagtacct ttacggcatg tagcgacaca agatcgcttc caagaactcg 840
acattcaagc ccagctcgta caagaaaatg aactagccaa tcatatgaac tagcacattg 900
aagtcaccgc atcatctctg ttggaaacga cgcgcatgta ctcgtgcgta gtaaatccgt 960
atctgtacac tcgaaagatt acagtatgta gtagtagcat gactaacgat gtaacgtcca 1020
aataacgctc tgtgcctact cctgtagatg cattagacca cctgctaacg tctacacgtt 1080
atgtccgtta gctccaagat tgcacttttc cctcaaagac tctgctgggt tacgtcatgg 1140
tctctttcgg gtctctggtc cgttctctgc ccgcccatat ccgcccaggc tgctacgata 1200
caggataagc tcataagctt gcatgcctgc aggtcgactc tagaggatcc ccgggtaccg 1260
agctcgaatt cgtaatcatg gtcatagctg tttcctgtgt gaaattgtta tccgctcaca 1320
attccacaca acatacgagc cggaagcata aagtgtaaag cctggggtgc ctaatgagtg 1380
agctaactca cattaattgc gttgcgctca ctgcccgctt tccagtcggg aaacctgtcg 1440
tgccagctgc attaatgaat cggccaacgc gcggggagag gcggtttgcg tattgggcgc 1500
tcttccgctt cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta 1560
tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag 1620
aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg 1680
tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg 1740
tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg 1800
cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga 1860
agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc 1920
tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt 1980
aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact 2040
ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg 2100
cctaactacg gctacactag aaggacagta tttggtatct gcgctctgct gaagccagtt 2160
accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt 2220
ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct 2280
ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg 2340
gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt 2400
aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg cttaatcagt 2460
gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg actccccgtc 2520
gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc aatgataccg 2580
cgagacccac gctcaccggc tccagattta tcagcaataa accagccagc cggaagggcc 2640
gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa ttgttgccgg 2700
gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc cattgctaca 2760
ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg ttcccaacga 2820
tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc cttcggtcct 2880
ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat ggcagcactg 2940
cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg tgagtactca 3000
accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata 3060
cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg aaaacgttct 3120
tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat gtaacccact 3180
cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg gtgagcaaaa 3240
acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg ttgaatactc 3300
atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct catgagcgga 3360
tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac atttccccga 3420
aaagtgccac ctgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg 3480
cgtatcacga ggccctttcg tctcgcgcgt ttcggtgatg acggtgaaaa cctctgacac 3540
atgcagctcc cggagacggt cacagcttgt ctgtaagcgg atgccgggag cagacaagcc 3600
cgtcagggcg cgtcagcggg tgttggcggg tgtcggggct ggcttaacta tgcggcatca 3660
gagcagattg tactgagagt gcaccatatg cggtgtgaaa taccgcacag atgcgtaagg 3720
agaaaatacc gcatcaggcg ccattcgcca ttcaggctgc gcaactgttg ggaagggcga 3780
tcggtgcggg cctcttcgct attacgccag ctggcgaaag ggggatgtgc tgcaaggcga 3840
ttaagttggg taacgccagg gttttcccag tcacgacgtt gtaaaacgac ggccagtgcc 3900
a 3901
<210> 157
<211> 1215
<212> DNA
<213> 人工序列
<220>
<223> 短Can1缺失编码模板
<400> 157
agcttgctac gttaggagaa gacgcacggc gatgatacgg gtacccctca tgacatcaat 60
atccgctgcc cctcttgcca gcaaggcgtc agcaggtgct tttttcgcta ttttcaccag 120
accacagcct ttttccttgt gtctcatctt ggattccttc aaaggcaact caccgcacct 180
ccgagtcgtg tgaacaatgt aataataggc tattgacttt tttcccacct gtttagcgcc 240
aaacccaaag cgcttttcgc ccccactgca gcccgatgga aggcacatat ggcaagggaa 300
aagtcttcag gtaatacatg cctgctgcaa ctatatgtac tctgactcat tccctcagac 360
gtgggtcata gacagctgtt ttaaaccggg caaatcaatc tctgtcgcac aggtatttct 420
gcccttcaaa accaggttgc cacatcagat tccatcaaag tttttcagac taacttcaat 480
cttaaacggc atctcacaac aagcgaattg gacggaaaaa aagcgtctat cattaccggc 540
acctatccac actaagacag tactaaagga cgacgctccc cacgaaacga cgtttcgacc 600
ttaacgaccc tgccgtctcc atccatccga ccactcccga cgctctctcc tggagcaaac 660
cactcttacc aagcatatag catatataat aacgtattga atttattaac tgattgaatt 720
gagagtaaag ccagtagcgt tgtacggctg tagcttttta gaaaagtggc agatgagcga 780
tggtggatat gaaagtacct ttacggcatg tagcgacaca agatcgcttc caagaactcg 840
acattcaagc ccagctcgta caagaaaatg aactagccaa tcatatgaac tagcacattg 900
aagtcaccgc atcatctctg ttggaaacga cgcgcatgta ctcgtgcgta gtaaatccgt 960
atctgtacac tcgaaagatt acagtatgta gtagtagcat gactaacgat gtaacgtcca 1020
aataacgctc tgtgcctact cctgtagatg cattagacca cctgctaacg tctacacgtt 1080
atgtccgtta gctccaagat tgcacttttc cctcaaagac tctgctgggt tacgtcatgg 1140
tctctttcgg gtctctggtc cgttctctgc ccgcccatat ccgcccaggc tgctacgata 1200
caggataagc tcata 1215
<210> 158
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物80F
<400> 158
agcttgctac gttaggagaa 20
<210> 159
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物80R
<400> 159
tatgagctta tcctgtatcg 20
<210> 160
<211> 2125
<212> DNA
<213> 解脂耶氏酵母
<220>
<221> misc_feature
<222> (1)..(2125)
<223> Can1基因座WT(野生型)
<400> 160
ggaaggcaca tatggcaagg gaaaagtctt caggtaatac atgcctgctg caactatatg 60
tactctgact cattccctca gacgtgggtc atagacagct gttttaaacc gggcaaatca 120
atctctgtcg cacaggtatt tctgcccttc aaaaccaggt tgccacatca gattccatca 180
aagtttttca gactaacttc aatcttaaac ggcatctcac aacaagcgaa ttggacggaa 240
aaaaagcgtc tatcattacc ggcacctatc cacactaaga cagtactaaa ggacgacgct 300
ccccacgaaa cgacgtttcg accttaacga ccctgccgtc tccatccatc cgaccacaat 360
ggaaaagaca ttttcaaacg attacccacc ctccgggact gaggcccaca tccacatcaa 420
ccacacggcc cactcggatg actcagagga ggtgccctcg cacaaggaaa attacaacac 480
cagtggccac gacctggagg agtccgaccc ggataaccat gtcggtgaga ccctcgaggt 540
caagcgaggt ctcaagatgc gacacatctc catgatctcg cttggaggaa ccattggtac 600
cggtctcttc attggtaccg gaggagctct ccagcaggcc ggtccctgtg gcgccctcgt 660
cgcctacgtg ttcatggcca ccattgtcta ctctgttgcc gagtctcttg gagaactggc 720
tacgtacatt cccatcaccg gctcctttgc cgtctttact acccgatatc tgtcacagtc 780
gtttggtgcc tccatgggct ggctatactg gttctcgtgg gcgatcacct tcgccatcga 840
gctcaacacc attggtcccg tgattgagta ctggactgac gccgttccta ctgctgcctg 900
gattgccatc ttcttcgtca tcctcactac catcaacttc ttccccgtgg gcttctatgg 960
cgaagtcgag ttctgggtgg cctccgtgaa ggtcattgcc atcattggat ggctcatcta 1020
cgcgctctgc atgacgtgtg gagcaggtgt aacaggtcct gtgggattca gatactggaa 1080
ccaccccgga cccatgggag acggaatctg gaccgacggc gtgcccattg tgcgaaacgc 1140
gcccggtcga cgattcatgg gatggctcaa ttcgctcgtt aacgccgcct tcacctacca 1200
gggctgtgag ctggtcggag tcactgccgg tgaggcccag aaccccagaa agtccgtccc 1260
tcgagccatc aaccgagtct ttgctcgaat ttgcatcttc tacattggct ctatcttctt 1320
catgggcatg ctcgtgccct ttaacgaccc caagctgacc gatgactcct ccgtcatcgc 1380
ctcctctcct tttgttattg ccattatcaa ctctggcacc aaggtgctcc ctcacatttt 1440
caacgccgtc attctcatca ccctgatttc ggcaggaaac tccaacgtct acattggctc 1500
gcgagtggtc tacgccctgg ctgactccgg aaccgcacca aagttcttca agcgaaccac 1560
caagaaggga gtgccgtacg tggcagtctg cttcacctcg gcgtttggtc tgctggcctt 1620
catgtctgtg tccgagtcgt cgtccactgt cttcgactgg ttcatcaaca tctccgctgt 1680
ggccggcctc atctgttggg ccttcatctc tgcctcccac atccgattca tgcaagtgct 1740
taagcacaga gggatctcca gagatacgct gcccttcaag gcacgatggc agccattcta 1800
ctcatggtac gcgctcgtct ccatcatctt catcactctc atccagggct tcacgtcctt 1860
ctggcacttt accgccgcca agttcatgac tgcatacatc tccgtcattg tctgggtcgg 1920
tttgtacatt atcttccagt gtctgttccg atgcaagttc cttatcccta ttgaggatgt 1980
ggacattgac accggccgac gagagattga cgacgatgtg tgggaggaga agatccccac 2040
aaagtggtac gagaagtttt ggaatattat tgcataagaa gatcggggat tcccgacgct 2100
ctctcctgga gcaaaccact cttac 2125
<210> 161
<211> 392
<212> DNA
<213> 人工序列
<220>
<223> Can1基因座缺失菌株
<400> 161
ggaaggcaca tatggcaagg gaaaagtctt caggtaatac atgcctgctg caactatatg 60
tactctgact cattccctca gacgtgggtc atagacagct gttttaaacc gggcaaatca 120
atctctgtcg cacaggtatt tctgcccttc aaaaccaggt tgccacatca gattccatca 180
aagtttttca gactaacttc aatcttaaac ggcatctcac aacaagcgaa ttggacggaa 240
aaaaagcgtc tatcattacc ggcacctatc cacactaaga cagtactaaa ggacgacgct 300
ccccacgaaa cgacgtttcg accttaacga ccctgccgtc tccatccatc cgaccactcc 360
cgacgctctc tcctggagca aaccactctt ac 392
<210> 162
<211> 73
<212> DNA
<213> 人工序列
<220>
<223> 图13-B的正向寡核苷酸
<400> 162
catgcgtaaa ctgactgatg agtccgtgag gacgaaacga gtaagctcgt cagtttcagt 60
acggttctag ttt 73
<210> 163
<211> 75
<212> DNA
<213> 人工序列
<220>
<223> 图13-B的反向寡核苷酸
<400> 163
tctaaaacta gaaccgtact gaaactgaga cgagcttact cgtttcgtcc tcacggactc 60
atcagtcagt ttacg 75
<210> 164
<211> 211
<212> RNA
<213> 人工序列
<220>
<223> pre-sgRNA URA3.1(RGR-URA3.1)
<400> 164
gaacagcuga ugaguccgug aggacgaaac gaguaagcuc guccuguuca gagacaguuu 60
ccuguuuuag agcuagaaau agcaaguuaa aauaaggcua guccguuauc aacuugaaaa 120
aguggcaccg agucggugcu uuuggccggc auggucccag ccuccucgcu ggcgccggcu 180
gggcaacaug cuucggcaug gcgaauggga c 211
<210> 165
<211> 20
<212> DNA
<213> 解脂耶氏酵母
<400> 165
ctgttcagag acagtttcct 20
<210> 166
<211> 211
<212> RNA
<213> 人工序列
<220>
<223> pre-sgRNA URA3.2 (RGR-URA3.2
<400> 166
auguuacuga ugaguccgug aggacgaaac gaguaagcuc gucuaacauc cagagaagca 60
cacguuuuag agcuagaaau agcaaguuaa aauaaggcua guccguuauc aacuugaaaa 120
aguggcaccg agucggugcu uuuggccggc auggucccag ccuccucgcu ggcgccggcu 180
gggcaacaug cuucggcaug gcgaauggga c 211
<210> 167
<211> 20
<212> DNA
<213> 解脂耶氏酵母
<400> 167
taacatccag agaagcacac 20
<210> 168
<211> 838
<212> DNA
<213> 人工序列
<220>
<223> FBA1L启动子
<400> 168
gtttaaacag tgtacgcagt actatagagg aacaattgcc ccggagaaga cggccaggcc 60
gcctagatga caaattcaac aactcacagc tgactttctg ccattgccac tagggggggg 120
cctttttata tggccaagcc aagctctcca cgtcggttgg gctgcaccca acaataaatg 180
ggtagggttg caccaacaaa gggatgggat ggggggtaga agatacgagg ataacggggc 240
tcaatggcac aaataagaac gaatactgcc attaagactc gtgatccagc gactgacacc 300
attgcatcat ctaagggcct caaaactacc tcggaactgc tgcgctgatc tggacaccac 360
agaggttccg agcactttag gttgcaccaa atgtcccacc aggtgcaggc agaaaacgct 420
ggaacagcgt gtacagtttg tcttaacaaa aagtgagggc gctgaggtcg agcagggtgg 480
tgtgacttgt tatagccttt agagctgcga aagcgcgtat ggatttggct catcaggcca 540
gattgagggt ctgtggacac atgtcatgtt agtgtacttc aatcgccccc tggatatagc 600
cccgacaata ggccgtggcc tcattttttt gccttccgca catttccatt gctcggtacc 660
cacaccttgc ttctcctgca cttgccaacc ttaatactgg tttacattga ccaacatctt 720
acaagcgggg ggcttgtcta gggtatatat aaacagtggc tctcccaatc ggttgccagt 780
ctcttttttc ctttctttcc ccacagattc gaaatctaaa ctacacatca caccatgg 838
<210> 169
<211> 1839
<212> DNA
<213> 人工序列
<220>
<223> 乙酰羟酸合酶基因
<400> 169
atggacgagt ccttcatcgg aatgtctgga ggagagatct tccacgagat gatgctgcga 60
cacaacgtcg acactgtctt cggttacccc ggtggagcca ttctccccgt ctttgacgcc 120
attcacaact ctgaatactt caactttgtg ctccctcgac acgagcaggg tgccggccac 180
atggccgagg gctacgctcg agcctctggt aagcccggtg tcgttctcgt cacctctggc 240
cccggtgcca ccaacgtcat cacccccatg caggacgctc tttccgatgg tacccctatg 300
gttgtcttca ccggtcaggt cctgacctcc gttatcggca ctgacgcctt ccaggaggcc 360
gatgttgtcg gcatctcccg atcttgcacc aagtggaacg tcatggtcaa gaacgttgct 420
gagctccccc gacgaatcaa cgaggccttt gagattgcta cttccggccg acccggtccc 480
gttctcgtcg atctgcccaa ggatgttact gctgccatcc tgcgagagcc catccccacc 540
aagtccacca ttccctcgca ttctctgacc aacctcacct ctgccgccgc caccgagttc 600
cagaagcagg ctatccagcg agccgccaac ctcatcaacc agtccaagaa gcccgtcctt 660
tacgtcggac agggtatcct tggctccgag gagggtccta agctgcttaa ggagctggct 720
gagaaggccg agattcccgt caccactact ctgcagggtc ttggtgcctt tgacgagcga 780
gaccccaagt ctctgcacat gctcggtatg cacggttccg gctacgccaa catggccatg 840
cagaacgctg actgtatcat tgctctcggc gcccgatttg atgaccgagt taccggctcc 900
atccccaagt ttgcccccga ggctcgagcc gctgcccttg agggtcgagg tggtattgtt 960
cactttgaga tccaggccaa gaacatcaac aaggttgttc aggccaccga agccgttgag 1020
ggagacgtta ccgagtctgt ccgacagctc atccccctca tcaacaaggt ctctgccgct 1080
gagcgagctc cctggactga gactatccag tcctggaagc agcagttccc cttcctcttc 1140
gaggctgaag gtgaggatgg tgttatcaag ccccagtccg tcattgctct gctctctgac 1200
ctgacagaga acaacaagga caagaccatc atcaccaccg gtgttggtca gcatcagatg 1260
tggactgccc agcatttccg atggcgacac cctcgaacca tgatcacttc tggtggtctt 1320
ggaactatgg gttacggcct gcccgccgct atcggcgcca aggttgcccg acctgactgc 1380
gacgtcattg acattgatgg tgacgcttct ttcaacatga ctctgaccga gctgtccacc 1440
gccgttcagt tcaacattgg cgtcaaggct attgtcctca acaacgagga acagggtatg 1500
gtcacccagc tgcagtctct cttctacgag aaccgatact gccacactca tcagaagaac 1560
cccgacttca tgaagctggc cgagtcgatg ggcatgaagg gtatccgaat cactcacatt 1620
gaccagctgg aggccggtct caaggagatg ctcgcataca agggccctgt gctcgttgag 1680
gttgttgtcg acaagaagat ccccgttctt cctatggttc ccgctggtaa ggctttgcat 1740
gagttccttg tctacgacgc tgacgccgag gctgcttctc gacccgatcg actgaagaat 1800
gcccccgccc ctcacgtcca ccagaccacc tttgagaac 1839
<210> 170
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> RHO705
<400> 170
gtacagacct cggccgacaa ttatgatatc 30
<210> 171
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> RHO719
<400> 171
gttccgaggt agttttgagg cccttagatg 30
<210> 172
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> RHO733
<400> 172
gttgggagag gggactagga actccttgta 30
<210> 173
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> RHO734
<400> 173
ctacgaagct cgagctaacg tccacaagtc 30
<210> 174
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> RHO707
<400> 174
gtcggtggct acaatacgtg agtcagaagg 30
<210> 175
<211> 53
<212> DNA
<213> 解脂耶氏酵母
<400> 175
cgtcctcctt cttctgttca gagacagttt cctcggcacc agctcgcagg cca 53
<210> 176
<211> 52
<212> DNA
<213> 人工序列
<220>
<223> 来自菌落1的质粒URA3的片段
<400> 176
cgtcctcctt cttctgttca gagacagttc ctcggcacca gctcgcaggc ca 52
<210> 177
<211> 51
<212> DNA
<213> 人工序列
<220>
<223> 来自菌落2的质粒URA3的片段
<400> 177
cgtcctcctt cttctgttca gagacagtcc tcggcaccag ctcgcaggcc a 51
<210> 178
<211> 52
<212> DNA
<213> 人工序列
<220>
<223> 来自菌落3的质粒URA3的片段
<400> 178
cgtcctcctt cttctgttca gagacagttc ctcggcacca gctcgcaggc ca 52
<210> 179
<211> 52
<212> DNA
<213> 人工序列
<220>
<223> 来自菌落5的质粒URA3的片段
<400> 179
cgtcctcctt cttctgttca gagacagttc ctcggcacca gctcgcaggc ca 52
<210> 180
<211> 52
<212> DNA
<213> 人工序列
<220>
<223> 来自菌落6的质粒URA3的片段
<400> 180
cgtcctcctt cttctgttca gagacagttc ctcggcacca gctcgcaggc ca 52
<210> 181
<211> 39
<212> DNA
<213> 人工序列
<220>
<223> 来自菌落1的基因组URA3的片段
<220>
<221> misc_feature
<222> (29)..(29)
<223> N是a、c、g、或t
<220>
<221> misc_feature
<222> (32)..(32)
<223> N是a、c、g、或t
<400> 181
cgtcctcctt cttctgttca gagacagtnc cncggcccc 39
<210> 182
<211> 54
<212> DNA
<213> 人工序列
<220>
<223> 来自菌落2的基因组URA3的片段
<400> 182
cgtcctcctt cttctgttca gagacagttt acctcggcac cagctcgcag gcca 54
<210> 183
<211> 44
<212> DNA
<213> 人工序列
<220>
<223> 来自菌落3的基因组URA3的片段
<400> 183
cgtcctcctt cttctgttca gagacagttt cagctcgcag gcca 44
<210> 184
<211> 49
<212> DNA
<213> 人工序列
<220>
<223> 来自菌落5的基因组URA3的片段
<220>
<221> misc_feature
<222> (23)..(23)
<223> N是a、c、g、或t
<220>
<221> misc_feature
<222> (38)..(38)
<223> N是a、c、g、或t
<400> 184
cgtcctcctt cttctgttca ganacagttt ggcaccanct cgcaggcca 49
<210> 185
<211> 54
<212> DNA
<213> 人工序列
<220>
<223> 来自菌落6的基因组URA3的片段
<400> 185
cgtcctcctt cttctgttca gagacagttt ccctcggcac cagctcgcag gcca 54
<210> 186
<211> 1029
<212> DNA
<213> 人工序列
<220>
<223> 潮霉素抗生素抗性选择标记物
<400> 186
atggccaaaa agcctgaact caccgcgacg tctgtcgaga agtttctgat cgaaaagttc 60
gacagcgtct ccgacctgat gcagctctcg gagggcgaag aatctcgtgc tttcagcttc 120
gatgtaggag ggcgtggata tgtcctgcgg gtaaatagct gcgccgatgg tttctacaaa 180
gatcgttatg tttatcggca ctttgcatcg gccgcgctcc cgattccgga agtgcttgac 240
attggggagt tcagcgagag cctgacctat tgcatctccc gccgtgcaca gggtgtcacg 300
ttgcaagacc tgcctgaaac cgaactgccc gctgttctgc agccggtcgc ggaggctatg 360
gatgcgatcg ctgcggccga tcttagccag acgagcgggt tcggcccatt cggaccgcaa 420
ggaatcggtc aatacactac atggcgtgat ttcatatgcg cgattgctga tccccatgtg 480
tatcactggc aaactgtgat ggacgacacc gtcagtgcgt ccgtcgcgca ggctctcgat 540
gagctgatgc tttgggccga ggactgcccc gaagtccggc acctcgtgca cgcggatttc 600
ggctccaaca atgtcctgac ggacaatggc cgcataacag cggtcattga ctggagcgag 660
gcgatgttcg gggattccca atacgaggtc gccaacatct tcttctggag gccgtggttg 720
gcttgtatgg agcagcagac gcgctacttc gagcggaggc atccggagct tgcaggatcg 780
ccgcggctcc gggcgtatat gctccgcatt ggtcttgacc aactctatca gagcttggtt 840
gacggcaatt tcgatgatgc agcttgggcg cagggtcgat gcgacgcaat cgtccgatcc 900
ggagccggga ctgtcgggcg tacacaaatc gcccgcagaa gcgcggccgt ctggaccgat 960
ggctgtgtag aagtactcgc cgatagtgga aaccgacgcc ccagcactcg tccgagggca 1020
aaggaatag 1029
<210> 187
<211> 565
<212> DNA
<213> 人工序列
<220>
<223> TDH1或GPD启动子
<400> 187
ggttgcggga tagacgccga cggagggcaa tggcgctatg gaaccttgcg gatatccata 60
cgccgcggcg gactgcgtcc gaaccagctc cagcagcgtt ttttccgggc cattgagccg 120
actgcgaccc cgccaacgtg tcttggccca cgcactcatg tcatgttggt gttgggaggc 180
cactttttaa gtagcacaag gcacctagct cgcagcaagg tgtccgaacc aaagaagcgg 240
ctgcagtggt gcaaacgggg cggaaacggc gggaaaaagc cacgggggca cgaattgagg 300
cacgccctcg aatttgagac gagtcacggc cccattcgcc cgcgcaatgg ctcgccaacg 360
cccggtcttt tgcaccacat caggttaccc caagccaaac ctttgtgtta aaaagcttaa 420
catattatac cgaacgtagg tttgggcggg cttgctccgt ctgtccaagg caacatttat 480
ataagggtct gcatcgccgg ctcaattgaa tcttttttct tcttctcttc tctatattca 540
ttcttgaatt aaacacacat caacc 565
<210> 188
<211> 43
<212> DNA
<213> 人工序列
<220>
<223> RHO804
<400> 188
gatcaacgta cgagtgtacg cagtactata gaggaacaat tgc 43
<210> 189
<211> 44
<212> DNA
<213> 人工序列
<220>
<223> RHO805
<400> 189
gatcaacgta cgccccaagc ttgtcccatt cgccatgccg aagc 44
<210> 190
<211> 746
<212> DNA
<213> 人工序列
<220>
<223> TDH1启动子-RGR-URA3.3融合体
<400> 190
gatcaacgta cgatacgccg cggcggactg cgtccgaacc agctccagca gcgttttttc 60
cgggccattg agccgactgc gaccccgcca acgtgtcttg gcccacgcac tcatgtcatg 120
ttggtgttgg gaggccactt tttaagtagc acaaggcacc tagctcgcag caaggtgtcc 180
gaaccaaaga agcggctgca gtggtgcaaa cggggcggaa acggcgggaa aaagccacgg 240
gggcacgaat tgaggcacgc cctcgaattt gagacgagtc acggccccat tcgcccgcgc 300
aatggctcgc caacgcccgg tcttttgcac cacatcaggt taccccaagc caaacctttg 360
tgttaaaaag cttaacatat tataccgaac gtaggtttgg gcgggcttgc tccgtctgtc 420
caaggcaaca tttatataag ggtctgcatc gccggctcaa ttgaatcttt tttcttcttc 480
tcttctctat attcattctt gaattaaaca cacatcaaca atgacagttc tgatgagtcc 540
gtgaggacga aacgagtaag ctcgtcaact gttagaggtt agactagttt tagagctaga 600
aatagcaagt taaaataagg ctagtccgtt atcaacttga aaaagtggca ccgagtcggt 660
gcttttggcc ggcatggtcc cagcctcctc gctggcgccg gctgggcaac atgcttcggc 720
atggcgaatg ggaccgtacg agtcag 746
<210> 191
<211> 211
<212> RNA
<213> 人工序列
<220>
<223> pre-sgRNA URA3.3 (RGR-URA3.3)
<400> 191
acaguucuga ugaguccgug aggacgaaac gaguaagcuc gucaacuguu agagguuaga 60
cuaguuuuag agcuagaaau agcaaguuaa aauaaggcua guccguuauc aacuugaaaa 120
aguggcaccg agucggugcu uuuggccggc auggucccag ccuccucgcu ggcgccggcu 180
gggcaacaug cuucggcaug gcgaauggga c 211
<210> 192
<211> 43
<212> DNA
<213> 人工序列
<220>
<223> RHO610
<400> 192
ggcggcttaa ttaagttgcg acacatgtct tgatagtatc ttg 43
<210> 193
<211> 44
<212> DNA
<213> 人工序列
<220>
<223> RHO611
<400> 193
ggcggcttaa ttaacgagta tctgtctgac tcgtcattgc cgcc 44
<210> 194
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> RHO704
<400> 194
catatacttc actgccccag ataaggttcc 30
<210> 195
<211> 39
<212> DNA
<213> 解脂耶氏酵母
<400> 195
aaaccaacct gtgtgcttct ctggatgtta ccaccacca 39
<210> 196
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 来自菌落3的URA3序列的片段
<220>
<221> misc_feature
<222> (17)..(17)
<223> N是a、c、g、或t
<220>
<221> misc_feature
<222> (19)..(23)
<223> N是a、c、g、或t
<400> 196
aaaccaacct gtgttgntnn nnng 24
<210> 197
<211> 37
<212> DNA
<213> 人工序列
<220>
<223> 来自菌落4的URA3序列的片段
<220>
<221> misc_feature
<222> (21)..(21)
<223> N是a、c、g、或t
<220>
<221> misc_feature
<222> (24)..(25)
<223> N是a、c、g、或t
<220>
<221> misc_feature
<222> (27)..(29)
<223> N是a、c、g、或t
<400> 197
aaaccaacct gtgtgtttct nggnntnnnc ccccccc 37
<210> 198
<211> 39
<212> DNA
<213> 人工序列
<220>
<223> 来自菌落5的URA3序列的片段
<220>
<221> misc_feature
<222> (38)..(39)
<223> N是a、c、g、或t
<400> 198
aaaccaacct gtgtgtgtct ctggatgtta ccaccacnn 39
<210> 199
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 来自菌落6的URA3序列的片段
<220>
<221> misc_feature
<222> (21)..(22)
<223> N是a、c、g、或t
<220>
<221> misc_feature
<222> (25)..(27)
<223> N是a、c、g、或t
<400> 199
aaaccaacct gtgtgttttc nnggnnnt 28
<210> 200
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 来自菌落9的URA3序列的片段
<400> 200
aaaccaacct gtgttgcttc tctggatgt 29
<210> 201
<211> 39
<212> DNA
<213> 人工序列
<220>
<223> 来自菌落10的URA3序列的片段
<220>
<221> misc_feature
<222> (14)..(15)
<223> N是a、c、g、或t
<220>
<221> misc_feature
<222> (19)..(22)
<223> N是a、c、g、或t
<220>
<221> misc_feature
<222> (24)..(27)
<223> N是a、c、g、或t
<220>
<221> misc_feature
<222> (29)..(29)
<223> N是a、c、g、或t
<220>
<221> misc_feature
<222> (32)..(32)
<223> N是a、c、g、或t
<220>
<221> misc_feature
<222> (38)..(38)
<223> N是a、c、g、或t
<400> 201
aaaccaacct gtgnnttcnn nngnnnntnc cncccccna 39
<210> 202
<211> 351
<212> DNA
<213> 解脂耶氏酵母
<400> 202
aaaccaacct gtgtgcttct ctggatgtta ccaccaccaa ggagctcatt gagcttgccg 60
ataaggtcgg accttatgtg tgcatgatca agacccatat cgacatcatt gacgacttca 120
cctacgccgg cactgtgctc cccctcaagg agcttgctct taagcacggt ttcttcctgt 180
tcgaggacag aaagttcgca gatattggca acactgtcaa gcaccagtac aagaacggtg 240
tctaccgaat cgccgagtgg tccgatatca ccaacgccca cggtgtaccc ggagccggaa 300
tcattgctgg cctgcgagct ggtgccgagg aaactgtctc tgaacagaag a 351
<210> 203
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> 来自菌落23的URA3序列的片段
<400> 203
aaaccaacct gtgaaactgt ctctgaacag aaga 34
<210> 204
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> 来自菌落24的URA3序列的片段
<400> 204
aaaccaacct gtgaaactgt ctctgaacag aaga 34
<210> 205
<211> 803
<212> DNA
<213> 解脂耶氏酵母
<400> 205
aaaccaacct gtgtgcttct ctggatgtta ccaccaccaa ggagctcatt gagcttgccg 60
ataaggtcgg accttatgtg tgcatgatca agacccatat cgacatcatt gacgacttca 120
cctacgccgg cactgtgctc cccctcaagg agcttgctct taagcacggt ttcttcctgt 180
tcgaggacag aaagttcgca gatattggca acactgtcaa gcaccagtac aagaacggtg 240
tctaccgaat cgccgagtgg tccgatatca ccaacgccca cggtgtaccc ggagccggaa 300
tcattgctgg cctgcgagct ggtgccgagg aaactgtctc tgaacagaag aaggaggacg 360
tctctgacta cgagaactcc cagtacaagg agttcctggt cccctctccc aacgagaagc 420
tggccagagg tctgctcatg ctggccgagc tgtcttgcaa gggctctctg gccactggcg 480
agtactccaa gcagaccatt gagcttgccc gatccgaccc cgagtttgtg gttggcttca 540
ttgcccagaa ccgacctaag ggcgactctg aggactggct tattctgacc cccggggtgg 600
gtcttgacga caagggagac gctctcggac agcagtaccg aactgttgag gatgtcatgt 660
ctaccggaac ggatatcata attgtcggcc gaggtctgta cggccagaac cgagatccta 720
ttgaggaggc caagcgatac cagaaggctg gctgggaggc ttaccagaag attaactgtt 780
agaggttaga ctatggatat gta 803
<210> 206
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 来自菌落27的URA3序列的片段
<400> 206
aaaccaacct gtgtctatgg atatgta 27
<210> 207
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 来自菌落36的URA3序列的片段
<400> 207
aaaccaacct gtggatatgt a 21
<210> 208
<211> 1346
<212> DNA
<213> 人工序列
<220>
<223> ARS18序列
<400> 208
aattcatgtc acacaaaccg atcttcgcct caaggaaacc taattctaca tccgagagac 60
tgccgagatc cagtctacac tgattaattt tcgggccaat aatttaaaaa aatcgtgtta 120
tataatatta tatgtattat atatatacat catgatgata ctgacagtca tgtcccattg 180
ctaaatagac agactccatc tgccgcctcc aactgatgtt ctcaatattt aaggggtcat 240
ctcgcattgt ttaataataa acagactcca tctaccgcct ccaaatgatg ttctcaaaat 300
atattgtatg aacttatttt tattacttag tattattaga caacttactt gctttatgaa 360
aaacacttcc tatttaggaa acaatttata atggcagttc gttcatttaa caatttatgt 420
agaataaatg ttataaatgc gtatgggaaa tcttaaatat ggatagcata aatgatatct 480
gcattgccta attcgaaatc aacagcaacg aaaaaaatcc cttgtacaac ataaatagtc 540
atcgagaaat atcaactatc aaagaacagc tattcacacg ttactattga gattattatt 600
ggacgagaat cacacactca actgtctttc tctcttctag aaatacaggt acaagtatgt 660
actattctca ttgttcatac ttctagtcat ttcatcccac atattccttg gatttctctc 720
caatgaatga cattctatct tgcaaattca acaattataa taagatatac caaagtagcg 780
gtatagtggc aatcaaaaag cttctctggt gtgcttctcg tatttatttt tattctaatg 840
atccattaaa ggtatatatt tatttcttgt tatataatcc ttttgtttat tacatgggct 900
ggatacataa aggtattttg atttaatttt ttgcttaaat tcaatccccc ctcgttcagt 960
gtcaactgta atggtaggaa attaccatac ttttgaagaa gcaaaaaaaa tgaaagaaaa 1020
aaaaaatcgt atttccaggt tagacgttcc gcagaatcta gaatgcggta tgcggtacat 1080
tgttcttcga acgtaaaagt tgcgctccct gagatattgt acatttttgc ttttacaagt 1140
acaagtacat cgtacaacta tgtactactg ttgatgcatc cacaacagtt tgttttgttt 1200
ttttttgttt tttttttttc taatgattca ttaccgctat gtatacctac ttgtacttgt 1260
agtaagccgg gttattggcg ttcaattaat catagactta tgaatctgca cggtgtgcgc 1320
tgcgagttac ttttagctta tgcatg 1346
<210> 209
<211> 564
<212> DNA
<213> 人工序列
<220>
<223> 经耶氏酵母密码子优化的铜绿假单胞菌Csy4
<400> 209
atggaccact acctggatat cagactccga cccgacccag agttccctcc tgcccagctc 60
atgtccgtct tgtttggcaa gctgcaccaa gctctcgtgg cccagggtgg agaccgaatt 120
ggcgtgtcgt tccccgattt ggacgagtcc cgttctcgac ttggagaaag actccgtatt 180
catgcttctg cagacgatct cagagctctg cttgcccgac cctggctgga gggtctccga 240
gatcatctgc agttcggcga gcctgccgtg gttccccatc ctaccccata ccgacaggtg 300
tctcgggttc aggccaaaag caaccccgag cgactcagac ggcgtcttat gcgaagacac 360
gacctgtccg aggaggaagc ccgaaagcgg atccccgaca ccgttgctcg agcgttggac 420
cttcctttcg tcacactgcg atctcaatcg actggtcagc actttcgact gttcatcaga 480
cacggacccc tgcaggtcac cgcagaggaa ggcggtttta cttgctatgg actgtccaag 540
ggtggctttg tcccctggtt ctaa 564
<210> 210
<211> 530
<212> DNA
<213> 人工序列
<220>
<223> 耶氏酵母FBA1启动子
<400> 210
catcatctaa gggcctcaaa actacctcgg aactgctgcg ctgatctgga caccacagag 60
gttccgagca ctttaggttg caccaaatgt cccaccaggt gcaggcagaa aacgctggaa 120
cagcgtgtac agtttgtctt aacaaaaagt gagggcgctg aggtcgagca gggtggtgtg 180
acttgttata gcctttagag ctgcgaaagc gcgtatggat ttggctcatc aggccagatt 240
gagggtctgt ggacacatgt catgttagtg tacttcaatc gccccctgga tatagccccg 300
acaataggcc gtggcctcat ttttttgcct tccgcacatt tccattgctc ggtacccaca 360
ccttgcttct cctgcacttg ccaaccttaa tactggttta cattgaccaa catcttacaa 420
gcggggggct tgtctagggt atatataaac agtggctctc ccaatcggtt gccagtctct 480
tttttccttt ctttccccac agattcgaaa tctaaactac acatcacacc 530
<210> 211
<211> 659
<212> DNA
<213> 人工序列
<220>
<223> TDH1:28bp-gCAN1-28bp
<400> 211
cggcggactg cgtccgaacc agctccagca gcgttttttc cgggccattg agccgactgc 60
gaccccgcca acgtgtcttg gcccacgcac tcatgtcatg ttggtgttgg gaggccactt 120
tttaagtagc acaaggcacc tagctcgcag caaggtgtcc gaaccaaaga agcggctgca 180
gtggtgcaaa cggggcggaa acggcgggaa aaagccacgg gggcacgaat tgaggcacgc 240
cctcgaattt gagacgagtc acggccccat tcgcccgcgc aatggctcgc caacgcccgg 300
tcttttgcac cacatcaggt taccccaagc caaacctttg tgttaaaaag cttaacatat 360
tataccgaac gtaggtttgg gcgggcttgc tccgtctgtc caaggcaaca tttatataag 420
ggtctgcatc gccggctcaa ttgaatcttt tttcttcttc tcttctctat attcattctt 480
gaattaaaca cacatcaaca atggttcact gccgtatagg cagctaagaa atcaaacgat 540
tacccaccct cgttttagag ctagaaatag caagttaaaa taaggctagt ccgttatcaa 600
cttgaaaaag tggcaccgag tcggtgcttt tgttcactgc cgtataggca gctaagaaa 659
<210> 212
<211> 28
<212> RNA
<213> 铜绿假单胞菌
<400> 212
guucacugcc guauaggcag cuaagaaa 28
<210> 213
<211> 156
<212> RNA
<213> 人工序列
<220>
<223> 与Csy4识别序列侧接的sgRNA
<400> 213
guucacugcc guauaggcag cuaagaaauc aaacgauuac ccacccucgu uuuagagcua 60
gaaauagcaa guuaaaauaa ggcuaguccg uuaucaacuu gaaaaagugg caccgagucg 120
gugcuuuugu ucacugccgu auaggcagcu aagaaa 156
<210> 214
<211> 23
<212> DNA
<213> 解脂耶氏酵母
<400> 214
tcaaacgatt acccaccctc cgg 23
<210> 215
<211> 45
<212> DNA
<213> 解脂耶氏酵母
<400> 215
gaaaagacat tttcaaacga ttacccaccc tccgggactg aggcc 45
<210> 216
<211> 44
<212> DNA
<213> 人工序列
<220>
<223> 来自菌落14的CAN1的片段
<400> 216
gaaaagacat tttcaaacga ttacccacct ccgggactga ggcc 44
<210> 217
<211> 44
<212> DNA
<213> 人工序列
<220>
<223> 来自菌落16的CAN1的片段
<400> 217
gaaaagacat tttcaaacga ttacccacct ccgggactga ggcc 44
<210> 218
<211> 44
<212> DNA
<213> 人工序列
<220>
<223> 来自菌落18的CAN1的片段
<400> 218
gaaaagacat tttcaaacga ttacccacct ccgggactga ggcc 44
<210> 219
<211> 44
<212> DNA
<213> 人工序列
<220>
<223> 来自菌落19的CAN1的片段
<400> 219
gaaaagacat tttcaaacga ttacccacct ccgggactga ggcc 44
<210> 220
<211> 44
<212> DNA
<213> 人工序列
<220>
<223> 来自菌落24的CAN1的片段
<400> 220
gaaaagacat tttcaaacga ttacccacct ccgggactga ggcc 44
<210> 221
<211> 44
<212> DNA
<213> 人工序列
<220>
<223> 来自菌落25的CAN1的片段
<400> 221
gaaaagacat tttcaaacga ttacccacct ccgggactga ggcc 44
<210> 222
<211> 128
<212> RNA
<213> 人工序列
<220>
<223> 由Csy4处理的gRNA
<400> 222
cuaagaaauc aaacgauuac ccacccucgu uuuagagcua gaaauagcaa guuaaaauaa 60
ggcuaguccg uuaucaacuu gaaaaagugg caccgagucg gugcuuuugu ucacugccgu 120
auaggcag 128
<210> 223
<211> 8
<212> RNA
<213> 人工序列
<220>
<223> Csy4切割后的5’旁侧序列
<400> 223
cuaagaaa 8
<210> 224
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> Csy4切割后的3’旁侧序列
<400> 224
guucacugcc guauaggcag 20
Claims (15)
1.一种不是糖酵母属(Saccharomyces)或裂殖酵母属(Schizosaccharomyces)物种的酵母,其包含Cas内切核酸酶和多核苷酸序列,所述多核苷酸序列包含可操作地连接至至少一个核苷酸序列的RNA聚合酶II启动子,其中所述核苷酸序列包含编码核酶的DNA序列、编码RNA组分的DNA序列和转录终止序列,其中所述编码核酶的DNA序列位于所述编码RNA组分的DNA序列的上游,且所述转录终止序列位于所述编码RNA组分的DNA序列的下游,并且所述核苷酸序列不包含位于核酶-RNA组分下游的核酶序列,其中所述RNA组分包含与所述酵母中的染色体或附加体上的靶位点序列互补的可变靶向结构域,且其中所述RNA组分和所述Cas内切核酸酶能够形成RNA-引导的内切核酸酶(RGEN),其中所述RGEN能够结合到所述靶位点序列。
2.权利要求1的酵母,其中(i)所述RGEN能够结合到并切割所述靶位点序列,和/或(ii)所述酵母为选自下列的属的成员:耶氏酵母属、毕赤酵母属、许旺氏酵母属、克鲁维酵母属、Arxula属、丝孢酵母属、假丝酵母属、黑粉菌属、球拟酵母属、接合酵母属、三角酵母属、隐球酵母属、红酵母属、法夫酵母属、掷孢酵母属和管囊酵母属。
3.权利要求1或权利要求2的酵母,其中所述RGEN包含CRISPR-缔合的Cas9氨基酸序列,其中CRISPR是指聚集状规则间隔的短回文重复序列,且Cas9是指Cas蛋白质-9。
4.权利要求1或2的酵母,其中由所述核苷酸序列转录的RNA自催化地去除所述核酶以产生所述RNA组分,其中所述RNA组分不具有5’帽。
5.权利要求1或2的酵母,其中所述核酶为锤头核酶、丁型肝炎病毒核酶、I组内含子核酶、RnaseP核酶、或发夹型核酶。
6.权利要求1或2的酵母,其中由所述核苷酸序列转录的RNA不自催化地去除所述核酶,切割所述核酶的5'的任何RNA序列,和产生不具有5’帽的核酶-RNA组分融合分子。
7.一种用于修饰不是糖酵母属或裂殖酵母属物种的酵母中的染色体或附加体上的靶位点的方法,所述方法包括向所述酵母提供第一重组DNA构建体和第二重组DNA构建体,所述第一重组DNA构建体包含编码Cas内切核酸酶的DNA序列,且所述第二重组DNA构建体包含(i)编码RNA组分上游的核酶的DNA序列和RNA组分序列下游的转录终止序列,所述RNA组分含有与所述靶位点中的DNA序列互补的序列,其中所述第二重组DNA构建体不包含位于核酶-RNA组分下游的核酶序列,其中由所述第二重组DNA构建体转录的RNA自催化地去除所述核酶以产生所述RNA组分,且其中所述RNA组分和所述Cas内切核酸酶形成在所述靶位点处引入单链或双链断裂的RGEN;或(ii)编码核酶-RNA组分融合分子的DNA序列,其中所述第二重组DNA构建体不包含位于所述核酶-RNA组分下游的核酶序列,其中所述核酶-RNA组分融合分子和Cas内切核酸酶能够形成在所述靶位点处引入单链或双链断裂的RGEN,且其中所述RNA组分通过从RNA聚合酶II启动子转录而产生,其中RGEN是指RNA-引导的内切核酸酶。
8.权利要求7的方法,所述方法还包括鉴定至少一种在所述靶位点处具有修饰的酵母细胞,其中所述修饰包括所述靶位点中的一个或多个核苷酸的至少一个缺失、添加或替换。
9.权利要求7的方法,所述方法还包括向所述酵母提供供体DNA,其中所述供体DNA包含目的多核苷酸。
10.权利要求9的方法,所述方法还包括鉴定至少一种在其染色体或附加体中包含整合在所述靶位点处的所述目的多核苷酸的酵母细胞。
11.一种用于编辑不是糖酵母属或裂殖酵母属物种的酵母中的染色体或附加体上的核苷酸序列的方法,所述方法包括向所述酵母提供多核苷酸修饰模板DNA,第一重组DNA构建体,和第二重组DNA构建体,所述第一重组DNA构建体包含编码Cas内切核酸酶的DNA序列,所述第二重组DNA构建体包含编码RNA组分上游的核酶的DNA序列和RNA组分序列下游的转录终止序列,所述RNA组分含有与靶位点中的DNA序列互补的序列,其中由所述第二重组DNA构建体转录的RNA自催化地去除所述核酶以产生所述RNA组分,其中所述DNA序列不包含位于核酶-RNA组分下游的核酶序列,且其中所述RNA组分和所述Cas内切核酸酶形成在所述酵母的所述染色体或附加体中的靶位点处引入单链或双链断裂的RGEN,其中所述多核苷酸修饰模板DNA包含所述核苷酸序列的至少一个核苷酸修饰,且其中所述RNA组分通过从RNA聚合酶II启动子转录而产生,其中RGEN是指RNA-引导的内切核酸酶。
12.一种用于使不是糖酵母属或裂殖酵母属物种的酵母中的染色体或附加体上的核苷酸序列沉默的方法,所述方法包括向所述酵母提供至少第一重组DNA构建体和至少第二重组DNA构建体,所述第一重组DNA构建体包含编码失活的Cas9内切核酸酶的DNA序列,且所述第二重组DNA构建体包含可操作地连接至至少一个多核苷酸的启动子和RNA组分序列下游的转录终止序列,其中所述至少一个多核苷酸编码核酶-RNA组分融合分子,其中所述多核苷酸不包含位于所述核酶-RNA组分下游的核酶序列,且其中所述核酶-RNA组分融合分子和所述失活的Cas9内切核酸酶能够形成RGEN,所述RGEN结合到所述酵母的所述染色体或附加体中的所述核苷酸序列,从而阻断所述核苷酸序列的转录,且其中所述RNA组分通过从RNA聚合酶II启动子转录而产生,其中RGEN是指RNA-引导的内切核酸酶。
13.一种用于产生多重引导RNA用于不是糖酵母属或裂殖酵母属物种的酵母中的基因修饰的高通量方法,所述方法包括:
(a) 提供重组DNA构建体,所述重组DNA构建体包含以5’至3’的顺序可操作地连接的下列序列:RNA聚合酶II启动子、编码核酶的第一DNA序列、编码反向选择剂的第二DNA序列、编码引导RNA的CER结构域的第三DNA序列和终止子序列;
(b) 向(a)的所述重组DNA构建体提供至少一个寡核苷酸双链体,其中所述寡核苷酸双链体源自包含能够编码引导RNA靶序列的可变靶向结构域(VT)的DNA序列的第一单链寡核苷酸与包含编码所述可变靶向结构域的所述DNA序列的互补序列的第二单链寡核苷酸的组合;
(c) 将(a)的所述反向选择剂与(b)的所述至少一个寡双链体交换,从而形成重组DNA构建体库,所述重组DNA构建体各自包含能够编码引导RNA的可变靶向结构域的DNA序列;以及,
(d) 转录(c)的所述重组DNA构建体库,从而产生核酶-引导RNA分子库。
14.根据权利要求13所述的方法,所述方法还包括诱导所述核酶-引导RNA分子库,使得(i)所述分子自催化地去除所述核酶和所述核酶上游的任何RNA序列,以产生不包含5’帽的引导RNA分子库;或(ii)所述分子切割所述核酶上游的任何RNA序列,以产生不包含5’帽的核酶-gRNA融合分子。
15.一种重组DNA分子,其包含(i) RNA聚合酶II启动子,所述RNA聚合酶II启动子可操作地连接至(ii)编码核酶和引导RNA的核苷酸序列,以及RNA组分序列下游的转录终止序列,其中所述核酶在所述引导RNA的上游,其中由(ii)的所述核苷酸序列转录的RNA自催化地去除所述核酶以产生所述引导RNA,其中所述重组DNA序列不包含位于所述核酶-RNA组分下游的核酶序列,并且其中所述引导RNA能够形成RGEN,所述RGEN能够识别、结合到和任选地切割不是糖酵母属或裂殖酵母属物种的酵母的基因组中的靶位点,其中RGEN是指RNA-引导的内切核酸酶。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201462036652P | 2014-08-13 | 2014-08-13 | |
US62/036652 | 2014-08-13 | ||
PCT/US2015/041256 WO2016025131A1 (en) | 2014-08-13 | 2015-07-21 | Genetic targeting in non-conventional yeast using an rna-guided endonuclease |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107002020A CN107002020A (zh) | 2017-08-01 |
CN107002020B true CN107002020B (zh) | 2021-12-21 |
Family
ID=53783981
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201580056204.XA Active CN107002020B (zh) | 2014-08-13 | 2015-07-21 | 使用rna引导的内切核酸酶在非常规酵母中基因靶向 |
Country Status (9)
Country | Link |
---|---|
US (2) | US10513711B2 (zh) |
EP (2) | EP3686278A1 (zh) |
JP (1) | JP6811707B2 (zh) |
KR (1) | KR102381610B1 (zh) |
CN (1) | CN107002020B (zh) |
AU (1) | AU2015302213B2 (zh) |
CA (1) | CA2957684C (zh) |
DK (1) | DK3180425T3 (zh) |
WO (1) | WO2016025131A1 (zh) |
Families Citing this family (70)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2853829C (en) | 2011-07-22 | 2023-09-26 | President And Fellows Of Harvard College | Evaluation and improvement of nuclease cleavage specificity |
US20150044192A1 (en) | 2013-08-09 | 2015-02-12 | President And Fellows Of Harvard College | Methods for identifying a target site of a cas9 nuclease |
US9359599B2 (en) | 2013-08-22 | 2016-06-07 | President And Fellows Of Harvard College | Engineered transcription activator-like effector (TALE) domains and uses thereof |
US9228207B2 (en) | 2013-09-06 | 2016-01-05 | President And Fellows Of Harvard College | Switchable gRNAs comprising aptamers |
US9388430B2 (en) | 2013-09-06 | 2016-07-12 | President And Fellows Of Harvard College | Cas9-recombinase fusion proteins and uses thereof |
US9737604B2 (en) | 2013-09-06 | 2017-08-22 | President And Fellows Of Harvard College | Use of cationic lipids to deliver CAS9 |
US11053481B2 (en) | 2013-12-12 | 2021-07-06 | President And Fellows Of Harvard College | Fusions of Cas9 domains and nucleic acid-editing domains |
EP4063503A1 (en) | 2014-02-11 | 2022-09-28 | The Regents of the University of Colorado, a body corporate | Crispr enabled multiplexed genome engineering |
US10077453B2 (en) | 2014-07-30 | 2018-09-18 | President And Fellows Of Harvard College | CAS9 proteins including ligand-dependent inteins |
WO2016073559A1 (en) * | 2014-11-05 | 2016-05-12 | The Regents Of The University Of California | Methods for autocatalytic genome editing and neutralizing autocatalytic genome editing |
US10208298B2 (en) | 2014-11-06 | 2019-02-19 | E.I. Du Pont De Nemours And Company | Peptide-mediated delivery of RNA-guided endonuclease into cells |
AU2015362784B2 (en) * | 2014-12-16 | 2021-05-13 | Danisco Us Inc | Fungal genome modification systems and methods of use |
WO2016183402A2 (en) * | 2015-05-13 | 2016-11-17 | President And Fellows Of Harvard College | Methods of making and using guide rna for use with cas9 systems |
IL294014B2 (en) | 2015-10-23 | 2024-07-01 | Harvard College | Nucleobase editors and their uses |
WO2017079026A1 (en) | 2015-11-06 | 2017-05-11 | E. I. Du Pont De Nemours And Company | Generation of complex trait loci in soybean and methods of use |
EP3699280A3 (en) | 2016-03-11 | 2020-11-18 | Pioneer Hi-Bred International, Inc. | Novel cas9 systems and methods of use |
WO2017155715A1 (en) | 2016-03-11 | 2017-09-14 | Pioneer Hi-Bred International, Inc. | Novel cas9 systems and methods of use |
WO2017155714A1 (en) | 2016-03-11 | 2017-09-14 | Pioneer Hi-Bred International, Inc. | Novel cas9 systems and methods of use |
CA3022854A1 (en) | 2016-06-14 | 2017-12-21 | Pioneer Hi-Bred International, Inc. | Use of cpf1 endonuclease for plant genome modifications |
US20190323038A1 (en) * | 2016-06-17 | 2019-10-24 | Montana State Univesity | Bidirectional targeting for genome editing |
JP2019518478A (ja) | 2016-06-24 | 2019-07-04 | ザ リージェンツ オブ ザ ユニバーシティ オブ コロラド,ア ボディー コーポレイトTHE REGENTS OF THE UNIVERSITY OF COLORADO,a body corporate | バーコードを付けたコンビナトリアルライブラリーを生成する方法 |
WO2018010516A1 (zh) * | 2016-07-13 | 2018-01-18 | 陈奇涵 | 一种基因组dna特异性编辑方法和应用 |
IL308426A (en) | 2016-08-03 | 2024-01-01 | Harvard College | Adenosine nuclear base editors and their uses |
US11661590B2 (en) | 2016-08-09 | 2023-05-30 | President And Fellows Of Harvard College | Programmable CAS9-recombinase fusion proteins and uses thereof |
CN110114461A (zh) | 2016-08-17 | 2019-08-09 | 博德研究所 | 新型crispr酶和系统 |
US11542509B2 (en) | 2016-08-24 | 2023-01-03 | President And Fellows Of Harvard College | Incorporation of unnatural amino acids into proteins using base editing |
CA3037560A1 (en) | 2016-10-13 | 2018-04-19 | Pioneer Hi-Bred International, Inc. | Generating northern leaf blight resistant maize |
SG11201903089RA (en) | 2016-10-14 | 2019-05-30 | Harvard College | Aav delivery of nucleobase editors |
WO2018119359A1 (en) | 2016-12-23 | 2018-06-28 | President And Fellows Of Harvard College | Editing of ccr5 receptor gene to protect against hiv infection |
JP7142637B2 (ja) * | 2016-12-29 | 2022-09-27 | ヨハン ウォルフガング ゲーテ-ウニベルジテート フランクフルト アム マイン | より高次のゲノム編集ライブラリーを生成する方法 |
US20200048646A1 (en) * | 2017-03-07 | 2020-02-13 | The Regents Of The University Of California | Gene editing and transgene free mutant plants |
US11898179B2 (en) | 2017-03-09 | 2024-02-13 | President And Fellows Of Harvard College | Suppression of pain by gene editing |
EP3592777A1 (en) | 2017-03-10 | 2020-01-15 | President and Fellows of Harvard College | Cytosine to guanine base editor |
JP7191388B2 (ja) | 2017-03-23 | 2022-12-19 | プレジデント アンド フェローズ オブ ハーバード カレッジ | 核酸によってプログラム可能なdna結合蛋白質を含む核酸塩基編集因子 |
EP3601579B1 (en) | 2017-03-31 | 2023-10-04 | Pioneer Hi-Bred International, Inc. | Expression modulating elements and use thereof |
EP3615552A1 (en) | 2017-04-24 | 2020-03-04 | DuPont Nutrition Biosciences ApS | Methods and compositions of anti-crispr proteins for use in plants |
WO2018204777A2 (en) | 2017-05-05 | 2018-11-08 | The Broad Institute, Inc. | Methods for identification and modification of lncrna associated with target genotypes and phenotypes |
US11560566B2 (en) | 2017-05-12 | 2023-01-24 | President And Fellows Of Harvard College | Aptazyme-embedded guide RNAs for use with CRISPR-Cas9 in genome editing and transcriptional activation |
US10011849B1 (en) | 2017-06-23 | 2018-07-03 | Inscripta, Inc. | Nucleic acid-guided nucleases |
US9982279B1 (en) | 2017-06-23 | 2018-05-29 | Inscripta, Inc. | Nucleic acid-guided nucleases |
BR112020000839A2 (pt) * | 2017-07-14 | 2020-07-21 | Oncorus, Inc. | polinucleotídeos encapsulados e métodos de uso |
CN111801345A (zh) | 2017-07-28 | 2020-10-20 | 哈佛大学的校长及成员们 | 使用噬菌体辅助连续进化(pace)的进化碱基编辑器的方法和组合物 |
CN107299114B (zh) * | 2017-08-23 | 2021-08-27 | 中国科学院分子植物科学卓越创新中心 | 一种高效的酵母菌染色体融合方法 |
US20200392538A1 (en) * | 2017-08-30 | 2020-12-17 | President And Fellows Of Harvard College | Iterative genome assembly |
US11319532B2 (en) | 2017-08-30 | 2022-05-03 | President And Fellows Of Harvard College | High efficiency base editors comprising Gam |
CN111757937A (zh) | 2017-10-16 | 2020-10-09 | 布罗德研究所股份有限公司 | 腺苷碱基编辑器的用途 |
AU2018386002B2 (en) * | 2017-12-15 | 2024-07-25 | Danisco Us Inc | CAS9 variants and methods of use |
CN110055283B (zh) * | 2018-01-19 | 2020-09-08 | 中国科学院微生物研究所 | 目的基因多拷贝整合的方法、重组菌、白藜芦醇以及重组人血清白蛋白的制备方法 |
WO2019173125A1 (en) | 2018-03-09 | 2019-09-12 | Pioneer Hi-Bred International, Inc. | Compositions and methods for modification of fatty acids in soybean |
CA3099445A1 (en) * | 2018-05-09 | 2019-11-14 | Renaissance Bioscience Corp. | Yeast for producing and delivering rna bioactive molecules and methods and uses thereof |
EP3802887A2 (en) | 2018-05-25 | 2021-04-14 | Pioneer Hi-Bred International, Inc. | Systems and methods for improved breeding by modulating recombination rates |
EP3578658A1 (en) * | 2018-06-08 | 2019-12-11 | Johann Wolfgang Goethe-Universität Frankfurt | Method for generating a gene editing vector with fixed guide rna pairs |
MX2020013293A (es) * | 2018-06-08 | 2021-05-12 | Intellia Therapeutics Inc | Guías modificadas de arn para edición génica. |
US20210324398A1 (en) | 2018-06-29 | 2021-10-21 | Pioneer Hi-Bred International, Inc. | Edited nac genes in plants |
BR112021007306A2 (pt) | 2018-10-16 | 2021-07-27 | Pioneer Hi-Bred International, Inc. | mapeamento fino por edição genômica e identificação de gene causal |
KR20210084557A (ko) | 2018-10-31 | 2021-07-07 | 파이어니어 하이 부렛드 인터내쇼날 인코포레이팃드 | 오크로박트럼-매개 유전자 편집을 위한 조성물 및 방법 |
WO2020191243A1 (en) | 2019-03-19 | 2020-09-24 | The Broad Institute, Inc. | Methods and compositions for editing nucleotide sequences |
WO2020236967A1 (en) | 2019-05-20 | 2020-11-26 | The Broad Institute, Inc. | Random crispr-cas deletion mutant |
US20220298501A1 (en) | 2019-08-30 | 2022-09-22 | The Broad Institute, Inc. | Crispr-associated mu transposase systems |
WO2021087394A1 (en) * | 2019-11-01 | 2021-05-06 | The Broad Institute, Inc. | Type i-b crispr-associated transposase systems |
EP4063500A4 (en) * | 2019-11-18 | 2023-12-27 | Suzhou Qi Biodesign biotechnology Company Limited | GENE EDITING SYSTEM DERIVED FROM BACTERIA OF THE GENUS FLAVOBACTERIUM |
DE112021002672T5 (de) | 2020-05-08 | 2023-04-13 | President And Fellows Of Harvard College | Vefahren und zusammensetzungen zum gleichzeitigen editieren beider stränge einer doppelsträngigen nukleotid-zielsequenz |
WO2021242774A1 (en) * | 2020-05-26 | 2021-12-02 | Zymergen Inc. | Methods of transient protein and gene expression in cells |
US20230220409A1 (en) | 2020-06-12 | 2023-07-13 | Pioneer Hi-Bred International, Inc. | Alteration of seed composition in plants |
EP4200425A1 (en) | 2020-08-18 | 2023-06-28 | Pioneer Hi-Bred International, Inc. | Multiple disease resistance genes and genomic stacks thereof |
US20240336945A1 (en) | 2021-07-26 | 2024-10-10 | Flagship Pioneering Innovations Vi, Llc | Trem compositions and uses thereof |
EP4441208A1 (en) | 2021-11-30 | 2024-10-09 | Pioneer Hi-Bred International, Inc. | High efficiency large scale chromosomal genome manipulation |
WO2024036190A2 (en) | 2022-08-09 | 2024-02-15 | Pioneer Hi-Bred International, Inc. | Guide polynucleotide multiplexing |
WO2024123786A1 (en) | 2022-12-06 | 2024-06-13 | Pioneer Hi-Bred International, Inc. | Methods and compositions for co-delivery of t-dnas expressing multiple guide polynucleotides into plants |
WO2024196921A1 (en) | 2023-03-20 | 2024-09-26 | Pioneer Hi-Bred International, Inc. | Cas polypeptides with altered pam recognition |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103945689A (zh) * | 2011-09-19 | 2014-07-23 | 科马布有限公司 | 免疫球蛋白基因多样性的操纵及多抗体治疗剂 |
Family Cites Families (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5071764A (en) | 1983-10-06 | 1991-12-10 | Pfizer Inc. | Process for integrative transformation of yarrowia lipolytica |
US4880741A (en) | 1983-10-06 | 1989-11-14 | Pfizer Inc. | Process for transformation of Yarrowia lipolytica |
DE69131942T2 (de) | 1990-07-16 | 2000-06-29 | The Public Health Research Institute Of The City Of New York, Inc. | Auswahl von effizient ziel-rns spaltenden ribozymen |
AU679525B2 (en) | 1992-12-04 | 1997-07-03 | Innovir Laboratories, Inc. | Regulatable nucleic acid therapeutic and methods of use thereof |
US5580967A (en) | 1994-05-13 | 1996-12-03 | The Scripps Research Institute | Optimized catalytic DNA-cleaving ribozymes |
US6063566A (en) | 1994-05-13 | 2000-05-16 | The Scripps Research Institute | Catalytic RNA molecules |
US5688670A (en) | 1994-09-01 | 1997-11-18 | The General Hospital Corporation | Self-modifying RNA molecules and methods of making |
AU727662B2 (en) | 1996-03-26 | 2000-12-21 | Razvan T. Radulescu | Peptides having antiproliferative properties |
CA2521946C (en) | 2002-04-12 | 2013-10-15 | Brian F. O'dowd | Method of identifying transmembrane protein-interacting compounds |
US7125672B2 (en) | 2003-05-07 | 2006-10-24 | E. I. Du Pont De Nemours And Company | Codon-optimized genes for the production of polyunsaturated fatty acids in oleaginous yeasts |
US7459546B2 (en) | 2003-06-25 | 2008-12-02 | E.I. Du Pont De Nemours And Company | Glyceraldehyde-3-phosphate dehydrogenase and phosphoglycerate mutase regulatory sequences for gene expression in oleaginous yeast |
US20110059496A1 (en) | 2003-06-25 | 2011-03-10 | E. I. Du Pont De Nemours And Company | Glyceraldehyde-3-phosphate dehydrogenase and phosphoglycerate mutase promoters for gene expression in oleaginous yeast |
US7202356B2 (en) | 2003-11-14 | 2007-04-10 | E. I. Du Pont De Nemours And Company | Fructose-bisphosphate aldolase regulatory sequences for gene expression in oleaginous yeast |
US7264949B2 (en) | 2004-09-15 | 2007-09-04 | E.I. Du Pont De Nemours And Company | Glycerol-3-phosphate o-acyltransferase promoter for gene expression in oleaginous yeast |
FR2877011B1 (fr) | 2004-10-27 | 2010-08-27 | Centre Nat Rech Scient | Souche de levure genetiquement modifiee presentant une production et une excretion accrue de s-adenosylmethionine (sam) |
US20060094102A1 (en) | 2004-11-04 | 2006-05-04 | Zhixiong Xue | Ammonium transporter promoter for gene expression in oleaginous yeast |
US10066233B2 (en) | 2005-08-26 | 2018-09-04 | Dupont Nutrition Biosciences Aps | Method of modulating cell resistance |
WO2009046231A1 (en) | 2007-10-03 | 2009-04-09 | E. I. Du Pont De Nemours And Company | Optimized strains of yarrowia lipolytica for high eicosapentaenoic acid production |
US8435758B2 (en) | 2008-08-29 | 2013-05-07 | E I Du Pont De Nemours And Company | Manipulation of SNF1 kinase for altered oil content in oleaginous organisms |
US8637298B2 (en) | 2009-06-16 | 2014-01-28 | E I Du Pont De Nemours And Company | Optimized strains of yarrowia lipolytica for high eicosapentaenoic acid production |
US8889394B2 (en) | 2009-09-07 | 2014-11-18 | Empire Technology Development Llc | Multiple domain proteins |
AU2011293180B2 (en) | 2010-08-26 | 2017-03-02 | E. I. Du Pont De Nemours And Company | Recombinant microbial host cells for high eicosapentaenoic acid production |
US8969049B2 (en) | 2011-03-31 | 2015-03-03 | E I Du Pont De Nemours And Company | Yarrowia diacylglycerol acyltransferase promoter regions for gene expression in yeast |
WO2012135777A1 (en) | 2011-04-01 | 2012-10-04 | E. I. Du Pont De Nemours And Company | Yarrowia esterase/lipase promoter regions for gene expression in yeast |
WO2012138613A1 (en) | 2011-04-05 | 2012-10-11 | E. I. Du Pont De Nemours And Company | Yarrowia n-alkane-hydroxylating cytochrome p450 promoter regions for gene expression in yeast |
US8609369B2 (en) | 2011-04-07 | 2013-12-17 | E I Du Pont De Nemours And Company | Yarrowia peroxisomal 2,4-dienoyl-CoA reductase promoter regions for gene expression in yeast |
DK2800811T3 (en) | 2012-05-25 | 2017-07-17 | Univ Vienna | METHODS AND COMPOSITIONS FOR RNA DIRECTIVE TARGET DNA MODIFICATION AND FOR RNA DIRECTIVE MODULATION OF TRANSCRIPTION |
US8697359B1 (en) | 2012-12-12 | 2014-04-15 | The Broad Institute, Inc. | CRISPR-Cas systems and methods for altering expression of gene products |
EP4286402A3 (en) | 2012-12-12 | 2024-02-14 | The Broad Institute, Inc. | Crispr-cas component systems, methods and compositions for sequence manipulation |
BR112015014781A2 (pt) | 2012-12-21 | 2017-10-10 | Du Pont | célula microbiana recombinante e método de produção de um óleo microbiano |
MX2016002306A (es) | 2013-08-22 | 2016-07-08 | Du Pont | Promotor u6 de polimerasa iii de soja y metodos de uso. |
WO2015138855A1 (en) | 2014-03-14 | 2015-09-17 | The Regents Of The University Of California | Vectors and methods for fungal genome engineering by crispr-cas9 |
-
2015
- 2015-07-05 US US15/503,383 patent/US10513711B2/en active Active
- 2015-07-21 DK DK15747678.9T patent/DK3180425T3/da active
- 2015-07-21 JP JP2017507714A patent/JP6811707B2/ja not_active Expired - Fee Related
- 2015-07-21 AU AU2015302213A patent/AU2015302213B2/en active Active
- 2015-07-21 WO PCT/US2015/041256 patent/WO2016025131A1/en active Application Filing
- 2015-07-21 KR KR1020177006429A patent/KR102381610B1/ko active IP Right Grant
- 2015-07-21 EP EP20158059.4A patent/EP3686278A1/en not_active Withdrawn
- 2015-07-21 CN CN201580056204.XA patent/CN107002020B/zh active Active
- 2015-07-21 CA CA2957684A patent/CA2957684C/en active Active
- 2015-07-21 EP EP15747678.9A patent/EP3180425B1/en active Active
-
2019
- 2019-10-30 US US16/668,528 patent/US20200190540A1/en not_active Abandoned
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103945689A (zh) * | 2011-09-19 | 2014-07-23 | 科马布有限公司 | 免疫球蛋白基因多样性的操纵及多抗体治疗剂 |
Non-Patent Citations (7)
Title |
---|
CRISPR干扰:一种由假说到现实的基因沉默技术;齐波;《遵义医学院学报》;20140630;第37卷(第3期);第348-352页 * |
Genome engineering in Saccharomyces cerevisiae using CRISPR-Cas systems;James E.DiCarlo等;《Nucleic Acids Research》;20130304;第41卷(第7期);全文 * |
Implementation of the CRISPR-Cas9 system;Jake Z. Jacobs;《NATURE COMMUNICATIONS》;20141029;全文 * |
Self‐processing of ribozyme‐flanked RNAs into guide RNAs in vitro and in vivo for CRISPR‐mediated genome editing;Yangbin Gao等;《Journal of Integrative Plant Biology》;20140430;第56卷(第4期);摘要左栏,第347页左栏讨论第1-2句,图3,第343-344页,第345页图1A和1B、第347页右栏最后1段、第347页右栏第4段 * |
Sequence- and Structure-Specific RNA Processing by a CRISPR Endonuclease;Rachel E. Haurwitz等;《SCIENCE》;20100910;第329卷(第1355期);全文 * |
Thematic section ‘Biochemistry, Genetics, Biotechnology and Ecology of Non-conventional Yeasts’;Andrei A.Sibirny等;《FEMS Yeast Research》;20020711;第2卷;全文 * |
Yangbin Gao等.Self‐processing of ribozyme‐flanked RNAs into guide RNAs in vitro and in vivo for CRISPR‐mediated genome editing.《Journal of Integrative Plant Biology》.2014,第56卷(第4期), * |
Also Published As
Publication number | Publication date |
---|---|
EP3180425A1 (en) | 2017-06-21 |
WO2016025131A8 (en) | 2017-06-08 |
WO2016025131A1 (en) | 2016-02-18 |
US20170226533A1 (en) | 2017-08-10 |
US10513711B2 (en) | 2019-12-24 |
DK3180425T3 (da) | 2020-06-29 |
JP2017522897A (ja) | 2017-08-17 |
CA2957684C (en) | 2023-02-21 |
AU2015302213A1 (en) | 2017-03-02 |
KR102381610B1 (ko) | 2022-04-01 |
KR20170036792A (ko) | 2017-04-03 |
EP3180425B1 (en) | 2020-03-25 |
CN107002020A (zh) | 2017-08-01 |
AU2015302213A9 (en) | 2019-08-01 |
EP3686278A1 (en) | 2020-07-29 |
US20200190540A1 (en) | 2020-06-18 |
AU2015302213B2 (en) | 2021-05-13 |
JP6811707B2 (ja) | 2021-01-13 |
CA2957684A1 (en) | 2016-02-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107002020B (zh) | 使用rna引导的内切核酸酶在非常规酵母中基因靶向 | |
KR102628801B1 (ko) | 세포내 유전자 변형 및 증가된 상동 재조합을 위한 보호 dna 주형 및 이용 방법 | |
CN111172133B (zh) | 一种碱基编辑工具及其用途 | |
KR102370675B1 (ko) | 표적 핵산의 변형을 위한 개선된 방법 | |
CN101365788B (zh) | Δ-9延伸酶及其在制备多不饱和脂肪酸中的用途 | |
CN102695796B (zh) | 细胞、核酸、酶和它们用于生产槐糖脂的用途以及方法 | |
DK2324119T3 (en) | Mutant DELTA5 Desaturases AND USE THEREOF FOR THE PRODUCTION OF polyunsaturated fatty acids | |
DK2140006T3 (en) | DELTA-5 desaturases AND USE THEREOF FOR THE PRODUCTION OF polyunsaturated fatty acids | |
DK2443248T3 (en) | IMPROVEMENT OF LONG-CHAIN POLYUM Saturated OMEGA-3 AND OMEGA-6 FATTY ACID BIOS SYNTHESIS BY EXPRESSION OF ACYL-CoA LYSOPHOSPHOLIPID ACYL TRANSFERASES | |
DK2576605T3 (en) | PREPARATION OF METABOLITES | |
KR20180081618A (ko) | 유전자 편집에 의한 인간 디스트로핀 유전자의 교정을 위한 치료용 표적 및 사용 방법 | |
CN108779480A (zh) | 生产鞘氨醇碱和鞘脂类的方法 | |
KR20130138760A (ko) | 고농도의 에이코사펜타엔산 생성을 위한 재조합 미생물 숙주 세포 | |
KR20140099224A (ko) | 케토-아이소발레레이트 데카르복실라제 효소 및 이의 이용 방법 | |
CN111836825A (zh) | 优化的植物crispr/cpf1系统 | |
KR20070085665A (ko) | 도코사헥사엔산을 생성하는 야로위아 리폴리티카 균주 | |
KR20130032897A (ko) | 알코올 발효 시의 알코올 에스테르의 생성 및 원위치에서의 생성물 제거 | |
CN101646766B (zh) | △17去饱和酶及其用于制备多不饱和脂肪酸的用途 | |
CN111465689B (zh) | Cas9变体和使用方法 | |
KR20140092759A (ko) | 숙주 세포 및 아이소부탄올의 제조 방법 | |
CN112204147A (zh) | 基于Cpf1的植物转录调控系统 | |
CN109996874A (zh) | 10-甲基硬脂酸的异源性产生 | |
AU2022402777A1 (en) | C2c9 nuclease-based novel genome editing system and application thereof | |
CN101883843A (zh) | 破坏过氧化物酶体生物合成因子蛋白(pex)以改变含油真核生物中多不饱和脂肪酸和总脂质含量 | |
CN112852849B (zh) | 一种用于大片段dna无缝组装的系统及组装方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CP01 | Change in the name or title of a patent holder |
Address after: Delaware Patentee after: International essence&Fragrance America Group Co.,Ltd. Address before: Delaware Patentee before: E. I. du Pont de Nemours and Co. |
|
CP01 | Change in the name or title of a patent holder |