CN109715804A - 用于宿主细胞的指导rna表达系统 - Google Patents

用于宿主细胞的指导rna表达系统 Download PDF

Info

Publication number
CN109715804A
CN109715804A CN201780058371.7A CN201780058371A CN109715804A CN 109715804 A CN109715804 A CN 109715804A CN 201780058371 A CN201780058371 A CN 201780058371A CN 109715804 A CN109715804 A CN 109715804A
Authority
CN
China
Prior art keywords
rna polymerase
cell
promoter
sequence
rna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201780058371.7A
Other languages
English (en)
Inventor
埃里克·莫舍·杨
阿马尔·格达萨拉
瑞内·维尔瓦尔
约翰尼斯·安德列什·劳博斯
比安卡·伊丽莎白·玛丽亚·吉勒森
布伦达·沃恩克
亚力克·A·K·尼尔森
克里斯托弗·阿什比·沃伊特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
DSM IP Assets BV
Massachusetts Institute of Technology
Original Assignee
DSM IP Assets BV
Massachusetts Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by DSM IP Assets BV, Massachusetts Institute of Technology filed Critical DSM IP Assets BV
Publication of CN109715804A publication Critical patent/CN109715804A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/66General methods for inserting a gene into a vector to form a recombinant vector using cleavage and ligation; Use of non-functional linkers or adaptors, e.g. linkers containing the sequence for a restriction endonuclease
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]

Abstract

本发明涉及分子生物学和细胞生物学领域。更具体地,本发明涉及一种用于真核宿主细胞的指导RNA表达系统。

Description

用于宿主细胞的指导RNA表达系统
技术领域
本发明涉及分子生物学和细胞生物学领域。更具体地,本发明涉及一种用于宿主细胞的指导RNA表达系统。
背景技术
RNA指导的核酸酶系统(RNA-guided nuclease system)中最著名的是CRISPR/Cas9系统,其是一种用于基因组编辑和基因调控的强大工具。该工具需要表达Cas9蛋白和指导RNA(gRNA或sgRNA),所述指导RNA使Cas9能够靶向特定DNA序列。在例如真核宿主系统中,指导RNA往往从RNA聚合酶III(POLIII)启动子表达,所述RNA聚合酶III(POLIII)启动子募集用于转录的内源RNA聚合酶III,所述内源RNA聚合酶III是产生没有5'帽的指导RNA的RNA聚合酶。其他方法已经将RNA聚合酶II(POLII)启动子与核酶组合使用,以产生没有5'帽的指导RNA(未加帽的RNA)。然而,现有技术的指导RNA表达需要复杂且庞大的表达盒,并且缺乏对指导RNA的量的直接调谐。此外,可以在宿主细胞中引入体外转录的指导RNA。然而,这种引入的瞬时性限制了该方法用于基因组编辑和基因组调控的用途。因此,一直迫切需要开发用于细胞内指导RNA的改进和简化的表达系统。
发明内容
本发明提供了单亚基DNA依赖性RNA聚合酶,优选病毒单亚基DNA依赖性RNA聚合酶,更优选T3、SP6、K11或T7RNA聚合酶,用于在细胞内表达用于RNA指导的核酸酶系统的指导RNA的用途,其中所述指导RNA由这样的多核苷酸编码,所述多核苷酸可操作地连接到单亚基DNA依赖性RNA聚合酶启动子,优选病毒单亚基DNA依赖性RNA聚合酶启动子,更优选T3、SP6、K11或T7RNA聚合酶启动子。
本发明还提供了一种用于在细胞内表达用于RNA指导的核酸酶系统的指导RNA的方法,其中所述指导RNA由这样的多核苷酸编码,所述多核苷酸可操作地连接到单亚基DNA依赖性RNA聚合酶启动子,优选病毒单亚基DNA依赖性RNA聚合酶启动子,更优选T3、SP6、K11或T7RNA聚合酶启动子,并且其中所述指导RNA的转录由单亚基DNA依赖性RNA聚合酶执行,优选由病毒单亚基DNA依赖性RNA聚合酶执行,更优选由T3、SP6、K11或T7RNA聚合酶执行。
本发明还提供了一种组合物,所述组合物包含所述细胞、所述RNA聚合酶和所述编码指导RNA的多核苷酸,所述多核苷酸可操作地连接到根据本发明的启动子。
本发明还提供了一种可通过根据本发明的方法获得的细胞。
本发明还提供了一种细胞,所述细胞包含至少所述RNA聚合酶和所述编码指导RNA的多核苷酸,所述多核苷酸可操作地连接到根据本发明的启动子,所述细胞优选能够产生目的化合物。
本发明还提供了一种用于生产目的化合物的方法,所述方法包括在有助于生产所述目的化合物的条件下培养根据本发明的细胞,以及任选地纯化或分离所述目的化合物。
附图说明
图1示出了整合的绿色荧光蛋白(GFP)报告基因、潮霉素B(HygB)选择标记和dCas9-Mxi1(dCas9-Mxi)表达单元的图形表示。dCas9-Mxi1由半乳糖诱导的(GAL)启动子表达。
图2示出了整合的绿色荧光蛋白(GFP)报告基因、潮霉素B(HygB)选择标记和dCas9-Mxi1(dCas9-Mxi)/T7-RNA聚合酶(T7-RNAP)表达单元的图谱。使用2A病毒肽(2A)来从半乳糖诱导的(GAL)启动子共表达dCas9-Mxi1和T7-RNA聚合酶。
图3示出了多拷贝(2微米)载体pRN1120-AG1的载体图谱。所述载体上存在诺尔丝菌素(NatMX)和氨苄青霉素(ampR)标记。所述载体含有驱动gRNA表达的SNR52启动子(SNR52p)。示出了20个核苷酸(nt)的指导序列(基因组靶序列)和gRNA结构部件。所述指导RNA序列之后是SUP4终止子(SUP4 3’侧翼区)。
图4示出了多拷贝(2微米)载体pAG701的载体图谱。所述载体上存在诺尔丝菌素(NatMX)和氨苄青霉素(ampR)标记。载体含有驱动gRNA表达的T7启动子。示出了20nt指导序列(基因组靶序列)和gRNA结构部件。gRNA序列之后是3’自切割(自加工)核酶(HDV)和T7终止子。
图5示出了与T7产生的gRNA(乱序的(T7-乱序的)和非乱序的(T7))相比,SNR52产生的gRNA(乱序的(SNR52-乱序的)和非乱序的(SNR52-靶3))的抑制效率。示出了三次单独实验的平均值和标准偏差。
图6示出了以下所有测试菌株在半乳糖诱导后的细胞密度(在600nm处测量的光密度):SNR52产生的gRNA(乱序的(SNR52-乱序的)和非乱序的(SNR52))、T7产生的gRNA(乱序的(T7-乱序的)和非乱序的(T7))。示出了三次单独实验的平均值和标准偏差。
图7示出了具有SNR52产生的靶向和乱序gRNA的菌株的细胞群。
图8示出了具有T7产生的靶向和乱序gRNA的菌株的细胞群。
图9示出了由不同强度的T7启动子(T7-高、T7-中、T7-低和T7-乱序的)产生的gRNA的抑制效率。示出了三次单独实验的平均值和标准偏差。
图10示出了单拷贝(CEN/ARS)载体pCSN061的载体图谱,所述单拷贝(CEN/ARS)载体pCSN061表达经密码子对优化的CAS9以用于在S.cerevisiae中表达。载体上存在KanMX标记。
图11示出了多拷贝(2微米)载体pRN1120的载体图谱。载体上存在NatMX标记。
图12示出了单拷贝(CEN/ARS)载体pCSN070的载体图谱,所述单拷贝(CEN/ARS)载体pCSN070表达经密码子对优化的CAS9和在SbTDH3启动子控制下的T7RNAP以用于在S.cerevisiae中表达。载体上存在KanMX标记。
图13示出了单拷贝(CEN/ARS)载体pCSN071的载体图谱,所述单拷贝(CEN/ARS)载体pCSN071表达经密码子对优化的CAS9和在enoI启动子控制下的T7RNAP以用于在S.cerevisiae中表达。载体上存在KanMX标记。
图14示出了TOPO供体DNA fwnA的质粒图谱
图15示出了BG-AMA17的质粒图谱
图16示出了BG-AMA18的质粒图谱
图17示出了BG-AMA19的质粒图谱
序列说明
SEQ ID NO:1列出了用于扩增5’区段以供整合到INT1基因座中的正向引物序列。
SEQ ID NO:2列出了用于扩增5’区段以供整合到INT1基因座中的反向引物序列。
SEQ ID NO:3列出了用于扩增3’区段以供整合到INT1基因座中的正向引物序列。
SEQ ID NO:4列出了用于扩增3’区段以供整合到INT1基因座中的反向引物序列。
SEQ ID NO:5列出了整合在基因组中的GFP-dCas9-Mxi1表达单元的核苷酸序列,所述核苷酸序列包含以下元件(指示的核苷酸位置):5’INT1整合位点(1-418);接头序列(419-468)、GFP表达盒(473-1814);接头序列(1819-1868);接头序列(1869-1918);潮霉素B抗性标记盒(1923-3735);接头序列(3747-3796);GAL1启动子(3797-4401);dCas9-Mxi1(4402-8736);终止子(8737-8977);接头序列(8798-9028);3’INT1整合位点(9029-9362)。
SEQ ID NO:6列出了整合在基因组中的GFP-dCas9-Mxi1-T7RNAp表达单元的核苷酸序列,所述核苷酸序列包含以下元件(指示的核苷酸位置):5’INT1整合位点(1-418);接头序列(419-468)、GFP表达盒(473-1814);接头序列(1819-1868);接头序列(1869-1918);潮霉素B抗性标记盒(1923-3735);接头序列(3747-3796);GAL1启动子(3797-4401);dCas9-Mxi1(4402-8733);T2A肽序列(8734-8787);T7RNA聚合酶(8788-10617);T7-RNAp的SV40核定位信号N末端(8791–8811);终止子(10618-10858);接头序列(10859-10909);3’INT1整合位点(10910-11243)。
SEQ ID NO:7列出了SNR52gRNA表达载体pRN1120-AG1的核苷酸序列。20nt指导序列(基因组靶序列)是加下划线的。
SEQ ID NO:8列出了T7gRNA表达载体pAG701的核苷酸序列。T7启动子序列以粗体示出(1-18),并且20nt指导序列(基因组靶序列)是加下划线的(18-38)。T7启动子3'末端的‘G’被转录,并且是所得gRNA的组成部分。指导RNA结构部件存在于核苷酸序列39-118处。终止单元由自切割(自加工)核酶(HDVr,119-186)和T7终止子(187-233)组成,其以大写和小写下划线斜体示出。
SEQ ID NO:9列出了20nt指导序列的核苷酸序列,所述20nt指导序列靶向用于在测试菌株AG1和AG2中组成型表达GFP的Saccharomyces bayanus TDH3(SbTDH3)启动子。
SEQ ID NO:10列出了用于归一化的随机20nt指导序列的核苷酸序列。
SEQ ID NO:11列出了用于gRNA表达的强T7启动子的核苷酸序列。该序列取代SEQID NO:8中以粗体指示的T7启动子序列(TAATACGACTCACTATAG)。
SEQ ID NO:12列出了用于gRNA表达的中等强度T7启动子的核苷酸序列。该序列取代SEQ ID NO:8中以粗体指示的T7启动子序列(TAATACGACTCACTATAG)。
SEQ ID NO:13列出了用于gRNA表达的弱强度T7启动子的核苷酸序列。该序列取代SEQ ID NO:8中以粗体指示的T7启动子序列(TAATACGACTCACTATAG)。
SEQ ID NO:14列出了CAS9的核苷酸序列,所述CAS9包含经密码子对优化的C末端SV40核定位信号以用于在Saccharomyces cerevisiae中表达。所述序列包含来自Kluyveromyces lactis的Kl11启动子和来自Saccharomyces cerevisiae的GND2终止子序列。
SEQ ID NO:15列出了载体pCSN061的核苷酸序列。
SEQ ID NO:16列出了载体pRN1120的核苷酸序列
SEQ ID NO:17列出了T7-RNA聚合酶(T7RNAP)表达单元的核苷酸序列。所述序列包含在TDH3启动子和EnoI终止子序列控制下的经密码子对优化的T7RNAP基因以用于在S.cerevisiae中表达
SEQ ID NO:18列出了T7-RNA聚合酶(T7RNAP)表达单元的核苷酸序列。所述序列包含在enoI启动子和EnoI终止子序列控制下的经密码子对优化的T7RNAP基因以用于在S.cerevisiae中表达
SEQ ID NO:19列出了用于在酵母中表达的经密码子对优化的T7RNAP基因的序列
SEQ ID NO:20列出了S.cerevisiae的tdh3启动子(Ptdh3)的核苷酸序列
SEQ ID NO:21列出了S.cerevisiae的enoI启动子(PenoI)的核苷酸序列
SEQ ID NO:22列出了S.cerevisiae的enoI终止子(TenoI)的核苷酸序列
SEQ ID NO:23列出了pCSN061骨架到T7RNAP表达盒的5’转换的正向引物的核苷酸序列
SEQ ID NO:24列出了pCSN061骨架到T7RNAP表达盒的5’转换的反向引物的核苷酸序列
SEQ ID NO:25列出了pCSN061骨架到T7RNAP表达盒的3’转换的正向引物的核苷酸序列
SEQ ID NO:26列出了pCSN061骨架到T7RNAP表达盒的3’转换的反向引物的核苷酸序列
SEQ ID NO:27列出了载体pCSN070的核苷酸序列
SEQ ID NO:28列出了载体pCSN071的核苷酸序列
SEQ ID NO:29列出了INT1基因组靶的核苷酸序列
SEQ ID NO:30列出了丁型肝炎病毒核酶(HDVr)的核苷酸序列
SEQ ID NO:31列出了T7终止子的核苷酸序列
SEQ ID NO:32列出了用于gRNA表达的弱强度T7启动子的核苷酸序列
SEQ ID NO:33列出了用于gRNA表达的中等强度T7启动子的核苷酸序列
SEQ ID NO:34列出了用于gRNA表达的强T7启动子的核苷酸序列
SEQ ID NO:35列出了用于gRNA表达的野生型强度T7启动子的核苷酸序列
SEQ ID NO:36列出了在强T7启动子控制下的指导RNA表达盒的核苷酸序列
SEQ ID NO:37列出了在中等强度T7启动子控制下的指导RNA表达盒的核苷酸序列
SEQ ID NO:38列出了在弱T7启动子控制下的指导RNA表达盒的核苷酸序列
SEQ ID NO:39列出了在野生型T7启动子控制下的指导RNA表达盒的核苷酸序列
SEQ ID NO:40列出了用于获得在转化中使用的T7控制的指导RNA片段的正向引物的核苷酸序列
SEQ ID NO:41列出了用于获得在转化中使用的T7控制的指导RNA片段的反向引物的核苷酸序列
SEQ ID NO:42列出了在转化中使用的由强T7启动子控制的指导RNA片段的核苷酸序列,所述指导RNA片段的侧翼为在5’侧上84bp的pRN1120序列和在3’侧上93bp的pRN1120序列,以用于体内组装到载体pRN1120中
SEQ ID NO:43列出了在转化中使用的由中等强度T7启动子控制的指导RNA片段的核苷酸序列,所述指导RNA片段的侧翼为在5’侧上84bp的pRN1120序列和在3’侧上93bp的pRN1120序列,以用于体内组装到载体pRN1120中
SEQ ID NO:44列出了在转化中使用的由弱T7启动子控制的指导RNA片段的核苷酸序列,所述指导RNA片段的侧翼为在5’侧上84bp的pRN1120序列和在3’侧上93bp的pRN1120序列,以用于体内组装到载体pRN1120中
SEQ ID NO:45列出了在转化中使用的由野生型T7启动子控制的指导RNA片段的核苷酸序列,所述指导RNA片段的侧翼为在5’侧上84bp的pRN1120序列和在3’侧上93bp的pRN1120序列,以用于体内组装到载体pRN1120中
SEQ ID NO:46列出了100bp左侧翼的上游链的核苷酸序列
SEQ ID NO:47列出了与SEQ ID NO:46反向互补的100bp左侧翼的核苷酸序列
SEQ ID NO:48列出了正向上的100bp右侧翼的核苷酸序列
SEQ ID NO:49列出了与SEQ ID NO:48反向互补的100bp右侧翼的核苷酸序列
SEQ ID NO:50列出了YFP供体DNA表达盒的核苷酸序列
SEQ ID NO:51列出了用以获得用于整合YFP供体DNA盒的577bp左侧翼的正向引物的核苷酸序列
SEQ ID NO:52列出了用以获得用于整合YFP供体DNA盒的577bp左侧翼的反向引物的核苷酸序列
SEQ ID NO:53列出了用于在S.cerevisiae的INT1基因座中整合YFP供体表达盒的左侧翼的核苷酸序列
SEQ ID NO:54列出了用以获得用于整合YFP供体DNA表达盒的581bp右侧翼的正向引物的核苷酸序列
SEQ ID NO:55列出了用以获得用于整合YFP供体DNA表达盒的581bp右侧翼的反向引物的核苷酸序列
SEQ ID NO:56列出了用于在S.cerevisiae的INT1基因座中整合YFP供体表达盒的右侧翼的核苷酸序列
SEQ ID NO:57列出了用于扩增YFP表达盒的正向引物的核苷酸序列
SEQ ID NO:58列出了用于扩增YFP表达盒的反向引物的核苷酸序列
SEQ ID NO:59列出了用于扩增在5’侧上包括接头5的YFP供体DNA表达盒的正向引物的核苷酸序列
SEQ ID NO:60列出了用于扩增在3’侧上包括接头3的YFP供体DNA表达盒的反向引物的核苷酸序列
SEQ ID NO:61列出了由DiCarlo描述的指导RNA结构元件的序列
SEQ ID NO:62列出了以fwnA为靶标的有序gBlock供体DNA的核苷酸序列
SEQ ID NO:63列出了TOPO载体的核苷酸序列,其中供体DNA(靶fwnA)为在TOPO载体中克隆gBlock供体DNA的结果
SEQ ID NO:64列出了用于扩增供体DNA(靶fwnA)的正向引物序列
SEQ ID NO:65列出了用于扩增供体DNA(靶fwnA)的反向引物序列
SEQ ID NO:66列出了用于扩增具有用于连接在AMA载体中的附加KpnI侧翼的Cas9盒的正向引物序列
SEQ ID NO:67列出了用于扩增具有用于连接在AMA载体中的附加KpnI侧翼的Cas9盒的反向引物序列
SEQ ID NO:68列出了BG-AMA17(Cas9/hygB)的核苷酸序列,所述BG-AMA17(Cas9/hygB)为连接PCR片段(具有KpnI侧翼的Cas9盒)与BG-AMA8的结果
SEQ ID NO:69列出了具有T7gRNA盒——T7.pro WT sgRNA fwnA——的有序gBlock的核苷酸序列
SEQ ID NO:70列出了具有T7 gRNA盒——T7.pro强sgRNA fwnA——的有序gBlock的核苷酸序列
SEQ ID NO:71列出了BG-AMA18(Cas9/hygB/T7 wt sgRNA fwnA)——具有gBlockT7.pro WT sgRNA fwnA的Golden Gate产物BG-AMA17——的核苷酸序列
SEQ ID NO:72列出了BG-AMA19(Cas9/hygB/T7强sgRNA fwnA)——具有gBlockT7.pro强sgRNA fwnA的Golden Gate产物BG-AMA17——的核苷酸序列
SEQ ID NO:73列出了用于通过GoldenGate检查AMA载体(BG-AMA18和BG-AMA19)中克隆的T7 gRNA盒的正向引物序列
SEQ ID NO:74列出了用于通过GoldenGate检查AMA载体(BG-AMA18和BG-AMA19)中克隆的T7 gRNA盒的反向引物序列
SEQ ID NO:75列出了用于扩增fwnA基因的部分以产生用于测序的DNA片段的正向引物序列,以及还用于测序反应以检查门DNA在基因组中的正确整合的引物
SEQ ID NO:76列出了用于扩增fwnA基因的部分以产生用于测序的DNA片段的反向引物序列
序列
SEQ ID NO:7
SEQ ID NO:8
具体实施方式
本发明涉及单亚基DNA依赖性RNA聚合酶,优选病毒单亚基DNA依赖性RNA聚合酶,更优选T3、SP6、K11或T7 RNA聚合酶,用于在细胞内表达用于RNA指导的核酸酶系统的指导RNA的用途,其中所述指导RNA由这样的多核苷酸编码,所述多核苷酸可操作地连接到单亚基DNA依赖性RNA聚合酶启动子,优选病毒单亚基DNA依赖性RNA聚合酶启动子,更优选T3、SP6、K11或T7 RNA聚合酶启动子。
所述用途,所述单亚基DNA依赖性RNA聚合酶,所述病毒单亚基DNA依赖性RNA聚合酶,所述T3、SP6、K11和T7 RNA聚合酶,所述指导RNA,所述RNA指导的核酸酶系统,所述单亚基DNA依赖性RNA聚合酶启动子,病毒单亚基DNA依赖性RNA聚合酶启动子和所述T3、SP6、K11或T7 RNA聚合酶启动子在本文中称为根据本发明的单亚基DNA依赖性RNA聚合酶,病毒单亚基DNA依赖性RNA聚合酶,T3、SP6、K11和T7RNA聚合酶,指导RNA,RNA指导的核酸酶系统,单亚基DNA依赖性RNA聚合酶启动子,病毒单亚基DNA依赖性RNA聚合酶启动子和T3、SP6、K11或T7RNA聚合酶启动子。根据本发明的指导RNA优选是未加帽的RNA;即它不具有5'帽((参见一般定义))。
为了完整起见,不使用定冠词时表示“至少一个(种)”;例如,单亚基DNA依赖性RNA聚合酶因此被解释为一种、两种、三种或更多种单亚基DNA依赖性RNA聚合酶。指导RNA优选是具有预定序列的指导RNA;因此,排除任何天然的过程,并且仅工程化(人造)过程和产物被认为是在本发明的范围内。
根据本发明的单亚基DNA依赖性RNA聚合酶是这样的RNA聚合酶,所述RNA聚合酶从DNA模板转录并且是单亚基RNA聚合酶的成员。这种RNA聚合酶是本领域的技术人员已知的。优选的单亚基DNA依赖性RNA聚合酶是病毒单亚基DNA依赖性RNA聚合酶,优选来自噬菌体。更优选的病毒单亚基DNA依赖性RNA聚合酶选自由以下项组成的组:T3、SP6、K11和T7RNA聚合酶,或它们的仍然具有单亚基DNA依赖性RNA聚合酶活性的变体。根据本发明的细胞可以是一般定义中所定义的任何细胞。在根据本发明的用途中,细胞可以是任何合适的细胞,并且优选是原核细胞,优选芽孢杆菌细胞,或是真核细胞,优选哺乳动物细胞,更优选真菌细胞;所有这些都如在本文的一般定义中所定义的。
术语“表达”是本领域的技术人员已知的,并且在本发明的上下文中定义为多核苷酸从多核苷酸模板转录的过程(例如DNA模板多核苷酸被转录成mRNA多核苷酸转录物或其他RNA转录物)和/或随后将mRNA转录物翻译成肽、多肽或蛋白质的过程。转录物和编码的多肽可统称为“基因产物”。如果多核苷酸转录物来源于基因组模板DNA,则表达可包括在宿主细胞中剪接mRNA转录物。术语“调控表达”在本文中是指与亲本宿主细胞相比升高或降低的表达,所述亲本宿主细胞中当使用相同条件测定时表达不被调控。降低的表达可以是减少量的转录物,诸如mRNA,和/或减少量的翻译产物,诸如多肽。由此可见,增加的表达可以是增加量的转录物,诸如mRNA,和/或增加量的翻译产物,诸如多肽。为了清楚起见,指导RNA的表达意指通过根据本发明的单亚基DNA依赖性RNA聚合酶从DNA模板产生根据本发明的指导RNA。
指导RNA(也称为gRNA或sgRNA)是由核糖核苷酸组成的指导多核苷酸,并且包含至少这样的指导序列,所述指导序列能够与靶多核苷酸杂交并且能够指导RNA指导的核酸酶系统与靶多核苷酸的序列特异性结合。本领域的技术人员熟悉指导RNA,参见例如Qi等人,2013和Tycko等人,2016。在根据本发明的用途中,启动子和RNA聚合酶是相容的组。换句话说,根据本发明的指导RNA的表达由根据本发明的启动子驱动,所述启动子能够从其编码DNA模板启动指导RNA的转录,并且所述转录通过根据本发明的RNA聚合酶执行,所述RNA聚合酶识别所述启动子以从所述启动子启动表达。作为示例,根据本发明的指导RNA的表达可以由T7启动子驱动,并且转录由T7RNA聚合酶执行。
在根据本发明的用途中,根据本发明的RNA聚合酶可以作为多肽以其活性形式进入细胞,或者作为在递送入细胞后被激活的前肽而进入细胞。根据本发明的RNA聚合酶还可以在细胞内从多核苷酸(诸如表达构建体)表达。这种表达构建体可以是任何类型的表达构建体,诸如线性核酸构建体、基因组或载体,优选质粒。优选的核酸构建体,即质粒载体,包含选择性标记。选择性标记是目的多核苷酸的产物,该产物提供生物杀灭剂(biocide)抗性或病毒抗性、重金属抗性、使原养型变成营养缺陷型等。选择性标记包括但不限于amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰转移酶)、bar(草胺膦乙酰转移酶)、hygB(潮霉素磷酸转移酶)、niaD(硝酸盐还原酶)、pyrG(乳清酸核苷-5'-磷酸脱羧酶)、sC(硫酸腺苷酰转移酶)、trpC(邻氨基苯甲酸合成酶)、ble(腐草霉素抗性蛋白)、hyg(潮霉素)、NAT或NTC(诺尔丝菌素)以及它们的等同物。
在根据本发明的用途中,指导RNA由(DNA)多核苷酸编码,所述(DNA)多核苷酸可操作地连接到根据本发明的单亚基DNA依赖性RNA聚合酶启动子。所述包含编码指导RNA的多核苷酸和根据本发明的启动子(所述指导RNA从其表达)的所述构建体可以是线性核酸构建体、基因组或载体,优选地所述载体是质粒,优选地是包含选择性标记的质粒。线性核酸也可以是已经线性化的质粒。
根据本发明的RNA指导的核酸酶系统可以是本领域的技术人员已知的任何RNA指导的核酸酶系统。RNA指导的核酸酶系统尤其在Hsu等人,2014;Sander和Joung,2014;以及Tycko等人,2016……中进行了综述。在根据本发明的用途中优选的众所周知的RNA指导的核酸酶系统基于成簇规律间隔短回文重复序列(CRISPR),诸如CRISPR/Cas和CRISPR/Cpf1。CRISPR/Cas变体是本领域的技术人员已知的(参见例如Nelson等人,2016)。本领域的技术人员应理解,根据本发明的RNA指导的核酸酶系统可方便地用于基因组编辑,例如插入、缺失和/或突变细胞基因组中的序列,优选使用外源多核苷酸(诸如供体DNA分子)来进行。因此,本发明还提供了一种外源多核苷酸,其在由RNA指导的核酸酶系统切割靶多核苷酸后与所述靶多核苷酸重组,从而产生经修饰的靶多核苷酸。这种外源多核苷酸可以是单链或双链的。在本文中,供体DNA分子也可称为外源核酸分子、修复模板或外源多核苷酸。术语“外源的”在本文中被解释为外源核酸分子本身不是天然存在于细胞中;所述外源核酸分子从外部进入细胞。外源核酸分子将大部分对细胞而言是外源的。然而,在某些实施方案中,外源核酸分子可以是对于细胞天然的,但已经在细胞外部工程化并进入细胞中;在这种情况下,外源核酸分子可被认为是对于细胞天然的。
在根据本发明的用途中,RNA聚合酶当在细胞中表达时从表达构建体表达,在所述表达构建体上编码RNA聚合酶的多核苷酸可操作地连接到启动子。这种启动子是本领域的技术人员已知的,并且可以是任何合适的启动子,诸如诱导型启动子和组成型启动子。诱导型启动子使得能够瞬时表达根据本发明的RNA聚合酶和/或调控RNA聚合酶的表达水平。RNA聚合酶还可以与来自单个启动子的另一种蛋白质(诸如Cas蛋白质)一起表达。在这种情况下,所述两个编码序列可以由允许表达多种蛋白质的序列分开,所述序列为诸如病毒2A序列,例如病毒T2A序列。图2示出了这种构建体的一个示例。
根据本发明的RNA聚合酶的密码子使用可以经调适以与特定宿主细胞的密码子使用更相容。因此,在根据本发明的用途中,RNA聚合酶优选是密码子优化的RNA聚合酶,优选地密码子对优化的RNA聚合酶。在替代方案或与密码子优化的RNA聚合酶的组合中,RNA聚合酶可以是变体RNA聚合酶,诸如断裂RNA聚合酶。这种断裂RNA聚合酶是本领域的技术人员已知的,并且包含几个(诸如一个、两个、三个或甚至四个)结构域,所述结构域可以单独表达,并且仅当所有结构域均表达时才聚集形成功能性RNA聚合酶。变体单亚基DNA依赖性RNA聚合酶,诸如变体T3和T7聚合酶是本领域的技术人员已知的,并且尤其描述于US2013224793、US2015024435、US5102802、US5869320,Shis等人、2014,Imburgio等人、2000,Temme等人、2012中;所有这些参考文献都以引用方式并入本文)。
在一个实施方案中,根据本发明的RNA聚合酶包含核定位信号(NLS,也称为核靶向信号,参见例如Benton等人,1989),优选地在RNA聚合酶的C末端或N末端,优选地在RNA聚合酶的N末端。优选的NLS是SV40NLS,并且优选存在于RNA聚合酶的N末端处。
在细胞中表达不止一种指导RNA在本发明的范围内。如果表达多种不同的指导RNA,则它们可以从单个单亚基DNA依赖性RNA聚合酶启动子或从多个单亚基DNA依赖性RNA聚合酶启动子表达。因此,两种或更多种指导RNA从由单个单亚基DNA依赖性RNA聚合酶启动子驱动的操纵子样结构表达,或者两种或更多种指导RNA各自从单亚基DNA依赖性RNA聚合酶启动子表达;所述多个启动子甚至是不同的启动子。
在一个实施方案中,指导RNA从来自单亚基DNA依赖性RNA聚合酶启动子文库的一个或多个单亚基DNA依赖性RNA聚合酶启动子表达。
在根据本发明的用途中,单亚基DNA依赖性RNA聚合酶启动子可以是本领域的技术人员已知的任何合适的单亚基DNA依赖性RNA聚合酶启动子。这种启动子可以是变体启动子,诸如嵌合启动子。变体启动子是与天然存在的野生型启动子相比具有序列差异同时仍保留启动子活性的启动子。变体启动子由Jones等人,2015,Temme等人,2012,Imburgio等人,2000)描述。嵌合或杂合启动子是包含不同启动子的至少两个部分同时保留启动子活性的启动子。此类变体启动子尤其描述于Romanienko等人,2016和US5,017,488中,所述文献以引用方式并入本文。在本发明的所有实施方案中,优选的变体T7启动子是具有如SEQ IDNO:11、SEQ ID NO:12和SEQ ID NO:13中所述序列的启动子。
本领域的技术人员知道,正确表达编码序列需要几个控制序列。具体地,在根据本发明的用途中,指导RNA优选由多核苷酸编码,所述多核苷酸可操作地连接到根据本发明的单亚基DNA依赖性RNA聚合酶启动子并且可操作地连接到自加工核酶和/或单亚基DNA依赖性RNA聚合酶终止子。这种自加工核酶和单亚基DNA依赖性RNA聚合酶终止子是本领域的技术人员已知的。在本文的示例中给出了优选的构建体,其中指导RNA由多核苷酸编码,所述多核苷酸可操作地连接到根据本发明的单亚基DNA依赖性RNA聚合酶启动子并且可操作地连接到自加工核酶和单亚基DNA依赖性RNA聚合酶终止子。
在本发明的范围内,如果指导RNA由可操作地连接到单亚基DNA依赖性RNA聚合酶启动子的多核苷酸编码并且所述多核苷酸和单亚基DNA依赖性RNA聚合酶启动子存在于质粒上,则通过将包含指导多核苷酸的靶序列的单链或双链寡核苷酸整合到所述质粒中而将所述质粒组装到细胞内。这详细描述于EP16181781.2中并且极大地促进了指导RNA的表达,因为可以避免一个或多个克隆步骤。EP16181781.2以引用方式并入本文。除了前者之外或与前者组合,整个指导RNA编码序列还可以作为双链寡核苷酸或作为两条单链互补寡核苷酸提供,并且因此组装进细胞内的表达构建体中,所述表达构建体优选存在于质粒上。
在根据本发明的用途中,所述细胞优选缺乏NHEJ(非同源末端连接)部件。所述与NHEJ相关的部件优选是Ku70、Ku80、MRE11、RAD50、RAD51、RAD52、XRS2、SIR4和/或LIG4的同源物或直系同源物。或者,在根据本发明的细胞中,可以通过使用抑制RNA连接酶IV的化合物(诸如SCR7)来使NHEJ缺乏。本领域中的技术人员知道如何调控NHEJ及其对RNA指导的核酸酶系统的影响,参见例如WO2014130955A1;Chu等人,2015;Maruyama等人,2015;Song等人,2015和Yu等人,2015;所有这些以引用方式并入本文。缺乏在下文中定义。
在本发明的范围内,作为RNA指导的核酸酶系统的组成部分的异源基因组编辑酶作为蛋白质存在于细胞中并且因此可以被引入细胞内,或者所述异源基因组编辑酶在细胞内从编码序列表达。因此,在根据本发明的用途中,细胞表达功能性异源基因组编辑酶,优选Cas酶,优选Cas9、Cas9切口酶或dCas9,或者在细胞中存在异源基因组编辑酶,优选Cas酶,优选Cas9、Cas9切口酶或dCas9。
取决于具体的基本原理,本领域的技术人员可以自由使用各种Cas酶,诸如众所周知的野生型Cas9和Cpf1(Zetsche等人,2015),以及Cas9切口酶或dCas9(由Sander和Young评论))。
Cpf1介导稳健的DNA干扰,具有与Cas9不同的特征。Cpf1是缺乏tracrRNA的单个RNA指导的内切核酸酶,并且其利用富含T的与原型间隔区相邻的基序(T-richprotospacer-adjacent motif)。Cpf1经由交错的DNA双链断裂切割DNA。已经鉴定出了两种来自Acidaminococcus和Lachnospiraceae的候选Cpf1酶,它们在人类细胞中具有有效的基因组编辑活性。
野生型Cas9核酸酶在与gRNA的5'末端互补的DNA靶位点处产生双链断裂。切割靶DNA位点的一条链而不是两条链的Cas9变体被称为切口酶。Cas9含有RuvC核酸酶结构域和HNH核酸酶结构域。通过使用D10A突变使RuvC核酸酶结构域突变而产生的Cas9切口酶仅切割与gRNA互补并被gRNA识别的DNA链。通过HNH核酸酶结构域突变和H840A突变产生的Cas9切口酶仅切割不与gRNA相互作用的DNA链。为了改善Cas9特异性,两种D10A Cas9切口酶可以配对并由一对适当定向的gRNA指导。这导致对两个切口的诱导,所述两个切口如果同时被引入,则将预期产生5'悬突。催化失活或“死亡”的Cas9(dCas9)(例如,在RuvC结构域和HNH结构域两者中都具有突变)。这可以由gRNA募集,而无需切割靶DNA位点。催化失活的dCas9可以与异源效应结构域融合,例如以允许对基因表达的激活或抑制,如Didovyk等人,2016所评论的。
在本发明的实施方案中,根据本发明的细胞中将在某些阶段存在至少几种如本文所定义的部件,诸如根据本发明的编码指导RNA的多核苷酸、根据本发明的RNA聚合酶。这些部件可以同时或连续引入细胞中。这同样适用于其他部件,诸如RNA指导的核酸酶系统的部件。本领域的技术人员知道这一点并且了解如何设置这样的系统。
本发明可方便地用于在细胞内表达指导RNA。因此,在第二方面,本发明提供了一种用于在细胞内表达用于RNA指导的核酸酶系统的指导RNA的方法,其中所述指导RNA由这样的多核苷酸编码,所述多核苷酸可操作地连接到单亚基DNA依赖性RNA聚合酶启动子,优选病毒单亚基DNA依赖性RNA聚合酶启动子,更优选T3、SP6、K11或T7RNA聚合酶启动子,并且其中所述指导RNA的转录由单亚基DNA依赖性RNA聚合酶执行,优选由病毒单亚基DNA依赖性RNA聚合酶执行,更优选由T3、SP6、K11或T7RNA聚合酶执行。所述方法在本文中称为根据本发明的方法。本发明该方面的所有特征优选地是在本发明的第一方面中定义的相应特征。优选地,在根据本发明的方法中,RNA聚合酶在细胞内从线性核酸构建体表达,从基因组表达或从载体表达,所述载体优选为质粒。优选的核酸构建体,即质粒载体,包含选择性标记。选择性标记是目的多核苷酸的产物,该产物提供生物杀灭剂抗性或病毒抗性、重金属抗性、使原养型变成营养缺陷型等。选择性标记包括但不限于amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰转移酶)、bar(草胺膦乙酰转移酶)、hygB(潮霉素磷酸转移酶)、niaD(硝酸盐还原酶)、pyrG(乳清酸核苷-5'-磷酸脱羧酶)、sC(硫酸腺苷酰转移酶)、trpC(邻氨基苯甲酸合成酶)、ble(腐草霉素抗性蛋白)、hyg(潮霉素)、NAT或NTC(诺尔丝菌素)以及它们的等同物。
优选地,在根据本发明的方法中,指导RNA从线性核酸构建体表达,从基因组表达或从载体表达,所述载体优选为质粒,所述质粒优选包含本文其他地方所定义的选择性标记。
优选地,在根据本发明的方法中,RNA指导的核酸酶系统基于CRISPR,诸如本文其他地方所定义的CRISPR/Cas和CRISPR/Cpf1。
根据本发明的细胞可以是一般定义中所定义的任何细胞。优选地,在根据本发明的方法中,细胞是原核细胞,优选芽孢杆菌细胞,或细胞是真核细胞,优选哺乳动物细胞,更优选真菌细胞。
优选地,在根据本发明的方法中,RNA聚合酶由本文其他地方所定义的诱导型启动子表达。
优选地,在根据本发明的方法中,RNA聚合酶是如本文其他地方所定义的密码子优化的RNA聚合酶和/或如本文其他地方所定义的断裂RNA聚合酶。
优选地,在根据本发明的方法中,RNA聚合酶在C末端或N末端具有核定位信号(NLS),更优选地在RNA聚合酶的N末端具有SV40NLS;全部如本文其他地方所定义。
优选地,在根据本发明的方法中,多个不同的指导RNA从单一的单亚基DNA依赖性RNA聚合酶启动子或从多个单亚基DNA依赖性RNA聚合酶启动子表达;全部如本文其他地方所定义。
优选地,在根据本发明的方法中,指导RNA从来自单亚基DNA依赖性RNA聚合酶启动子文库的一个或多个单亚基DNA依赖性RNA聚合酶启动子表达;全部如本文其他地方所定义。
优选地,在根据本发明的方法中,单亚基DNA依赖性RNA聚合酶启动子是变异的单亚基DNA依赖性RNA聚合酶启动子,诸如嵌合启动子;全部如本文其他地方所定义。
优选地,在根据本发明的方法中,指导RNA由多核苷酸编码,所述多核苷酸可操作地连接到单亚基DNA依赖性RNA聚合酶启动子并且可操作地连接到自加工核酶和/或单亚基DNA依赖性RNA聚合酶终止子;全部如本文其他地方所定义。
优选地,在根据本发明的方法中,指导RNA由多核苷酸编码,所述多核苷酸可操作地连接到单亚基DNA依赖性RNA聚合酶启动子,其中所述多核苷酸和单亚基DNA依赖性RNA聚合酶启动子存在于质粒上,并且其中通过将包含指导多核苷酸的靶序列的单链或双链寡核苷酸整合到所述质粒中而将所述质粒组装到细胞内;全部如本文其他地方所定义。
优选地,在根据本发明的方法中,细胞缺乏NHEJ(非同源末端连接)部件。所述与NHEJ相关的部件优选是酵母Ku70、Ku80、MRE11、RAD50、RAD51、RAD52、XRS2、SIR4和/或LIG4的同源物或直系同源物。或者,在根据本发明的细胞中,可以通过使用抑制RNA连接酶IV的化合物(诸如SCR7)来使NHEJ缺乏。缺乏在本文其他地方定义。
优选地,在根据本发明的方法中,细胞表达功能性异源基因组编辑酶,优选Cas酶,优选Cas9、Cas9切口酶或dCas9,或者其中在细胞中存在异源基因组编辑酶,优选Cas酶,优选Cas9、Cas9切口酶或dCas9;全部如本文其他地方所定义。
在第三方面,本发明提供了一种组合物,所述组合物包含所述细胞、所述RNA聚合酶和所述编码指导RNA的多核苷酸,所述多核苷酸可操作地连接到如本发明的第一方面中所定义的启动子。所述组合物在本文中称为根据本发明的组合物。
在第四方面,本发明提供了一种可通过根据本发明的第二方面的方法获得的细胞,或者通过根据本发明的第二方面的方法获得的细胞。此外,提供了一种细胞,所述细胞包含至少所述RNA聚合酶和所述编码指导RNA的多核苷酸,所述多核苷酸可操作地连接到启动子;所有这些都在本发明的第一方面中定义。优选地,所述细胞能够产生目的化合物。优选地,所述细胞还包含如本文先前所定义的RNA指导的核酸酶系统。
还提供了一种生产目的化合物的方法,所述方法包括在有助于产生所述目的化合物的条件下培养所述能够产生目的化合物的细胞,以及任选地分离或纯化所述目的化合物。
在本发明的所有实施方案的上下文中,目的化合物可以是任何生物化合物。所述生物化合物可以是生物质或生物聚合物或代谢物。生物化合物可以由构成生物合成或代谢途径的单个多核苷酸或一系列多核苷酸编码,或者可以是单个多核苷酸的产物或一系列多核苷酸的产物的直接结果,所述多核苷酸可以是基因,所述一系列多核苷酸可以是基因簇。在本发明的所有实施方案中,编码目的生物化合物的单个多核苷酸或一系列多核苷酸或与目的生物化合物相关的生物合成或代谢途径是根据本发明的组合物和方法的优选靶标。生物化合物可以是对于宿主细胞天然的或对于宿主细胞异源的。
术语“异源生物化合物”在本文中定义为对细胞不是天然的生物化合物;或这样的天然生物化合物,所述天然生物化合物中已经进行结构修饰以改变所述天然生物化合物。
术语“生物聚合物”在本文中定义为具有相同、相似或不相似的亚基(单体)的链(或聚合物)。所述生物聚合物可以是任何生物聚合物。生物聚合物可以是例如但不限于核酸、聚胺、多元醇,多肽(或聚酰胺),或多糖。
生物聚合物可以是多肽。多肽可以是具有目的生物活性的任何多肽。术语“多肽”在本文中并不是指特定长度的编码产物,因此涵盖肽、寡肽和蛋白质。术语多肽是指任何长度的氨基酸聚合物。所述聚合物可以是直链或支链的,其可以包含经修饰的氨基酸,并且其可以被非氨基酸中断。所述术语还涵盖已被修饰的氨基酸聚合物;例如二硫键形成、糖基化、脂化、乙酰化、磷酸化或任何其他操纵,诸如与标记部件缀合。如本文所用,术语“氨基酸”包括天然和/或非天然或合成的氨基酸,包括甘氨酸和D或L光学异构体两者,以及氨基酸类似物和肽模拟物。多肽还包括上述多肽和杂合多肽的天然存在的等位基因和工程化变体。所述多肽可以是对于宿主细胞天然的或可以是对于宿主细胞异源的。多肽可以是胶原蛋白或明胶,或它们的变体或杂合体。多肽可以是抗体或其部分、抗原、凝血因子、酶、激素或激素变体、受体或其部分、调节蛋白、结构蛋白、报告分子或转运蛋白、参与分泌过程的蛋白质、参与折叠过程的蛋白质、伴侣蛋白、肽氨基酸转运蛋白、糖基化因子、转录因子、合成肽或寡肽、细胞内蛋白质。细胞内蛋白质可以是酶,诸如蛋白酶、神经酰胺酶、环氧化物水解酶、氨肽酶、酰基转移酶、醛缩酶、羟化酶、氨肽酶、脂肪酶。多肽也可以是细胞外分泌的酶。此类酶可以属于氧化还原酶、转移酶、水解酶、裂解酶、异构酶、连接酶、过氧化氢酶、纤维素酶、几丁质酶、角质酶、脱氧核糖核酸酶、葡聚糖酶、酯酶的组。所述酶可以是糖酶,例如纤维素酶(诸如内切葡聚糖酶、β-葡聚糖酶、纤维二糖水解酶或β-葡糖苷酶)、半纤维素酶或果胶酶(诸如木聚糖酶、木糖苷酶、甘露聚糖酶、半乳聚糖酶、半乳糖苷酶、果胶甲基酯酶、果胶裂解酶、果胶酸裂解酶、内多聚半乳糖醛酸酶、外多聚半乳糖醛酸酶、鼠李糖半乳糖醛酸酶、阿拉伯聚糖酶、阿拉伯糖呋喃糖苷酶、阿拉伯糖基木聚糖水解酶、半乳糖醛酸酶)、裂解酶,或淀粉分解酶;水解酶、异构酶或连接酶、磷酸酶(诸如植酸酶)、酯酶(诸如脂肪酶)、蛋白水解酶、氧化还原酶(诸如氧化酶)、转移酶或异构酶。所述酶可以是植酸酶。所述酶可以是氨肽酶、天冬酰胺酶、淀粉酶、麦芽糖淀粉酶、糖酶、羧肽酶、内切蛋白酶、金属蛋白酶、丝氨酸蛋白酶、过氧化氢酶、几丁质酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、卤过氧化物酶、蛋白质脱氨酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变构酶(mutanase)、氧化酶、果胶酶、过氧化物酶、磷脂酶、半乳糖脂酶、叶绿素酶、多酚氧化酶、核糖核酸酶、转谷氨酰胺酶,或葡糖氧化酶、己糖氧化酶、单加氧酶。
根据本发明,目的化合物可以是具有改进的分泌特征的多肽或酶,如WO2010/102982中所述。根据本发明,目的化合物可以是融合或杂合多肽,另一种多肽在所述多肽或其片段的N末端或C末端处融合到所述多肽。融合多肽是通过将编码一种多肽的核酸序列(或其部分)与编码另一种多肽的核酸序列(或其部分)融合而产生的。
用于产生融合多肽的技术是本领域中已知的,并且包括连接编码所述多肽的编码序列,使得它们符合读框并且融合多肽的表达在相同的启动子和终止子的控制下。杂合多肽可包含从至少两种不同多肽获得的部分或完整多肽序列的组合,其中一种或多种多肽对于宿主细胞可为异源的。融合多肽和信号序列融合物的示例为例如如WO2010/121933中所述。
生物聚合物可以是多糖。多糖可以是任何多糖,包括但不限于粘多糖(例如,肝素和透明质酸)和含氮多糖(例如,几丁质)。在一个优选的选项中,所述多糖是透明质酸。
编码目的化合物或编码参与根据本发明的目的化合物的生产的化合物的多核苷酸可以编码参与初级代谢物或次级代谢物(诸如有机酸类、类胡萝卜素类、(β-内酰胺)抗生素类和维生素类)合成的酶。这种代谢物可以被认为是根据本发明的生物化合物。
术语“代谢物”涵盖初级代谢物和次级代谢物;所述代谢物可以是任何代谢物。优选的代谢物是柠檬酸、葡糖酸、己二酸、富马酸、衣康酸和琥珀酸。
代谢物可以由一种或多种基因编码,诸如在生物合成途径或代谢途径中由一种或多种基因编码。初级代谢物是细胞的初级代谢或全身代谢的产物,所述产物涉及能量代谢、生长和结构。次级代谢物是次级代谢的产物(参见例如R.B.Herbert,The Biosynthesis ofSecondary Metabolites,Chapman and Hall,New York,1981)。
初级代谢物可以是但不限于氨基酸、脂肪酸、核苷、核苷酸、糖、甘油三酯,或维生素。
次级代谢物可以是但不限于生物碱、香豆素、类黄酮、聚酮化合物、奎宁、类固醇、肽或萜烯。次级代谢物可以是抗生素、拒食剂、引诱剂、杀菌剂、杀真菌剂、激素、杀虫剂或灭鼠剂。优选的抗生素是头孢菌素和β-内酰胺。其他优选的代谢物是外代谢物。外代谢物的示例是Aurasperone B、Funalenone、克他命(Kotanin)、Nigragillin、Orlandin、其他萘并-γ-吡喃酮、Pyranonigrin A、Tensidol B、伏马菌素B2和赭曲霉素A。
生物化合物也可以是选择性标记的产物。选择性标记是目的多核苷酸的产物,该产物提供杀生体抗性或病毒抗性、重金属抗性、使原养型变成营养缺陷型等。选择性标记包括但不限于amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰转移酶)、bar(草胺膦乙酰转移酶)、hygB(潮霉素磷酸转移酶)、niaD(硝酸盐还原酶)、pyrG(乳清酸核苷-5'-磷酸脱羧酶)、sC(硫酸腺苷酰转移酶)、trpC(邻氨基苯甲酸合成酶)、ble(腐草霉素抗性蛋白)、hyg(潮霉素)、NAT或NTC(诺尔丝菌素)以及它们的等同物。
根据本发明,目的化合物优选是目的化合物列表中描述的多肽。
根据本发明的另一实施方案,目的化合物优选是代谢物。
根据本发明的细胞可能已经能够产生目的化合物。根据本发明的细胞还可以具有编码多肽的同源或异源核酸构建体,其中所述多肽可以是目的化合物或参与目的化合物生产的多肽。本领域的技术人员知道如何修饰微生物宿主细胞,使其能够产生目的化合物。
实施方案
提供了本发明的以下实施方案;这些实施方案中的特征优选为本文先前所定义的那些。
1.单亚基DNA依赖性RNA聚合酶,优选病毒单亚基DNA依赖性RNA聚合酶,更优选T3、SP6、K11或T7RNA聚合酶,用于在细胞内表达用于RNA指导的核酸酶系统的指导RNA的用途,其中所述指导RNA由这样的多核苷酸编码,所述多核苷酸可操作地连接到单亚基DNA依赖性RNA聚合酶启动子,优选病毒单亚基DNA依赖性RNA聚合酶启动子,更优选T3、SP6、K11或T7RNA聚合酶启动子。
2.根据实施方案1所述的用途,其中所述RNA聚合酶在所述细胞内从线性核酸构建体表达,从基因组表达或从载体表达,所述载体优选为质粒。
3.根据实施方案1或2所述的用途,其中所述指导RNA从线性核酸构建体表达,从基因组表达或从载体表达,所述载体优选为质粒。
4.根据实施方案1–3中任一项所述的用途,其中所述RNA指导的核酸酶系统基于CRISPR,诸如CRISPR/Cas和CRISPR/Cpf1。
5.根据实施方案1–4中任一项所述的用途,其中所述细胞是原核细胞,优选芽孢杆菌细胞,或者其中所述细胞是真核细胞,优选哺乳动物细胞,更优选真菌细胞。
6.根据实施方案1–5中任一项所述的用途,其中所述RNA聚合酶从诱导型启动子表达。
7.根据实施方案1–6中任一项所述的用途,其中所述RNA聚合酶是密码子优化的RNA聚合酶和/或断裂RNA聚合酶。
8.根据实施方案1–7中任一项所述的用途,其中所述RNA聚合酶在C末端或N末端具有核定位信号(NLS),更优选地在所述RNA聚合酶的N末端具有SV40NLS。
9.根据实施方案1–8中任一项所述的用途,其中从单个单亚基DNA依赖性RNA聚合酶启动子或从多个单亚基DNA依赖性RNA聚合酶启动子表达多种不同的指导RNA。
10.根据实施方案1–9中任一项所述的用途,其中所述指导RNA从来自单亚基DNA依赖性RNA聚合酶启动子文库的一个或多个单亚基DNA依赖性RNA聚合酶启动子表达。
11.根据实施方案1–10中任一项所述的用途,其中所述单亚基DNA依赖性RNA聚合酶启动子是变体启动子,诸如嵌合启动子。
12.根据实施方案1–11中任一项所述的用途,其中所述指导RNA由多核苷酸编码,所述多核苷酸可操作地连接到单亚基DNA依赖性RNA聚合酶启动子并且可操作地连接到自加工核酶和/或单亚基DNA依赖性RNA聚合酶终止子。
13.根据实施方案1–12中任一项所述的用途,其中所述指导RNA由多核苷酸编码,所述多核苷酸可操作地连接到单亚基DNA依赖性RNA聚合酶启动子,其中所述多核苷酸和单亚基DNA依赖性RNA聚合酶启动子存在于质粒上,并且其中通过将包含所述指导多核苷酸的所述靶序列的单链或双链寡核苷酸整合到所述质粒中而将所述质粒组装到所述细胞内。
14.根据实施方案1–13中任一项所述的用途,其中所述细胞缺乏NHEJ(非同源末端连接)部件。
15.根据实施方案1–14中任一项所述的用途,其中所述细胞表达功能性异源基因组编辑酶,优选Cas酶,优选Cas9、Cas9切口酶或dCas9,或者其中在所述细胞中存在异源基因组编辑酶,优选Cas酶,优选Cas9、Cas9切口酶或dCas9。
16.一种用于在细胞内表达用于RNA指导的核酸酶系统的指导RNA的方法,其中所述指导RNA由这样的多核苷酸编码,所述多核苷酸可操作地连接到单亚基DNA依赖性RNA聚合酶启动子,优选病毒单亚基DNA依赖性RNA聚合酶启动子,更优选T3、SP6、K11或T7RNA聚合酶启动子,并且其中所述指导RNA的转录由单亚基DNA依赖性RNA聚合酶执行,优选由病毒单亚基DNA依赖性RNA聚合酶执行,更优选由T3、SP6、K11或T7RNA聚合酶执行。
17.根据实施方案16所述的方法,其中所述RNA聚合酶在所述细胞内从线性核酸构建体表达,从基因组表达或从载体表达,所述载体优选为质粒,优选为包含选择性标记的质粒。
18.根据实施方案16或17所述的方法,其中所述指导RNA从线性核酸构建体表达,从基因组表达或从载体表达,所述载体优选为质粒。
19.根据实施方案16–18中任一项所述的方法,其中所述RNA指导的核酸酶系统基于CRISPR,诸如CRISPR/Cas和CRISPR/Cpf1。
20.根据实施方案16–19中任一项所述的方法,其中所述细胞是原核细胞,优选芽孢杆菌细胞,或者其中所述细胞是真核细胞,优选哺乳动物细胞,更优选真菌细胞。
21.根据实施方案16–20中任一项所述的方法,其中所述RNA聚合酶从诱导型启动子表达。
22.根据实施方案16–21中任一项所述的方法,其中所述RNA聚合酶是密码子优化的RNA聚合酶和/或断裂RNA聚合酶。
23.根据实施方案16–22中任一项所述的方法,其中所述RNA聚合酶在C末端或N末端具有核定位信号(NLS),更优选地在所述RNA聚合酶的N末端具有SV40NLS。
24.根据实施方案16–23中任一项所述的方法,其中从单个单亚基DNA依赖性RNA聚合酶启动子或从多个单亚基DNA依赖性RNA聚合酶启动子表达多种不同的指导RNA。
25.根据实施方案16–24中任一项所述的方法,其中所述指导RNA从来自单亚基DNA依赖性RNA聚合酶启动子文库的一个或多个单亚基DNA依赖性RNA聚合酶启动子表达。
26.根据实施方案16–25中任一项所述的方法,其中所述单亚基DNA依赖性RNA聚合酶启动子是变体单亚基DNA依赖性RNA聚合酶启动子,诸如嵌合启动子。
27.根据实施方案16–26中任一项所述的方法,其中所述指导RNA由多核苷酸编码,所述多核苷酸可操作地连接到单亚基DNA依赖性RNA聚合酶启动子并且可操作地连接到自加工核酶和/或单亚基DNA依赖性RNA聚合酶终止子。
28.根据实施方案16-27中任一项所述的方法,其中所述指导RNA由多核苷酸编码,所述多核苷酸可操作地连接到单亚基DNA依赖性RNA聚合酶启动子,其中所述多核苷酸和单亚基DNA依赖性RNA聚合酶启动子存在于质粒上,并且其中通过将包含所述指导多核苷酸的所述靶序列的单链或双链寡核苷酸整合到所述质粒中而将所述质粒组装到所述细胞内。
29.根据实施方案16-28中任一项所述的方法,其中所述细胞缺乏NHEJ(非同源末端连接)部件。
30.根据实施方案16–29中任一项所述的方法,其中所述细胞表达功能性异源基因组编辑酶,优选Cas酶,优选Cas9、Cas9切口酶或dCas9,或者其中在所述细胞中存在异源基因组编辑酶,优选Cas酶,优选Cas9、Cas9切口酶或dCas9。
31.一种组合物,包含所述细胞、所述RNA聚合酶和所述编码指导RNA的多核苷酸,所述多核苷酸可操作地连接到如在实施方案1–30中任一项所定义的启动子。
32.一种可通过根据实施方案16-30中任一项所述的方法获得的细胞。
33.一种细胞,包含至少所述RNA聚合酶和所述编码指导RNA的多核苷酸,所述多核苷酸可操作地连接到如在实施方案1-30中任一项所定义的启动子,所述细胞优选能够产生目的化合物。
34.一种用于生产目的化合物的方法,包括在有助于生产所述目的化合物的条件下培养根据实施方案32或33所述的细胞,以及任选地纯化或分离所述目的化合物。
一般定义
在整个本说明书和所附权利要求书中,词语“包括”和“具有”以及诸如“包含”的变型将被包含性地解释。也就是说,这些词语旨在传达在上下文允许的情况下可能包括未具体叙述的其他要素或整数。
在本文中不使用定冠词时表示语法对象为一个或多于一个(即一个或至少一个)。举例而言,“要素”可以指一个要素或多于一个要素。
当与数值(例如,约10)结合使用时,词语“约”或“近似”优选地意味着该值可以是给定值(10)加减该值的1%。
CRISPR干扰(CRISPRi)是一种遗传扰动技术,该遗传扰动技术允许对原核和真核细胞中的基因表达进行序列特异性抑制或激活。
多核苷酸在本文中是指脱氧核糖核苷酸或核糖核苷酸或它们的混合物或类似物的任何长度或确定的特定长度范围或长度的核苷酸聚合形式。多核苷酸可以具有任何三维结构,并且可以执行任何已知或未知的功能。以下是多核苷酸的非限制性示例:基因或基因片段的编码或非编码区,根据连锁分析定义的一个或多个基因座、外显子、内含子、信使RNA(mRNA)、转移RNA(tRNA)、核糖体RNA(rRNA)、短干扰RNA(siRNA)、短发夹RNA(shRNA)、微RNA(miRNA)、核酶、cDNA、重组多核苷酸、支链多核苷酸、质粒、载体、具有任何序列的分离DNA、具有任何序列的分离RNA、核酸探针,寡核苷酸和引物。多核苷酸可包含天然和非天然核苷酸,并且可包含一个或多个修饰的核苷酸,诸如甲基化核苷酸和核苷酸类似物或核苷酸等同物,其中核苷酸类似物或等同物被定义为具有经修饰的碱基、和/或经修饰的骨架、和/或非天然的核苷间键、或这些修饰的组合的残基。根据需要,可以在组装多核苷酸之前或之后引入对核苷酸结构的修饰。聚合后可以进一步修饰多核苷酸,诸如通过与标记化合物缀合来修饰。
通常,密码子优化是指通过以下方式来修饰核酸序列以增强目的宿主细胞中的表达的过程:用在所述宿主细胞的基因中更频繁或最频繁使用的密码子替换天然序列的至少一个密码子(例如,多于1个、2个、3个、4个、5个、10个、15个、20个、25个、50个或更多个密码子),同时保持天然氨基酸序列。不同物种对特定氨基酸的某些密码子表现出特定偏倚。密码子偏倚(生物体之间密码子使用的差异)通常与信使RNA(mRNA)的翻译效率相关,而信使RNA(mRNA)的翻译效率据信又尤其取决于被翻译的密码子的特性和特定转移RNA(tRNA)分子的可用性。所选择的tRNA在细胞中主导通常反映了肽合成中最常使用的密码子。因此,可以基于密码子优化来定制基因以实现给定生物中的最佳基因表达。密码子使用表是容易例如在“密码子使用数据库(Codon Usage Database)”中获得的,并且这些表可以以多种方式进行调整。参见例如Nakamura,Y.等人,2000。用于对特定序列进行密码子优化以在特定宿主细胞中表达的计算机算法,诸如Gene Forge(Aptagen;Jacobus,PA),也是可得的。优选地,编码Cas蛋白的序列中的一个或多个密码子(例如,1个、2个、3个、4个、5个、10个、15个、20个、25个、50个或更多个,或所有密码子)对应于特定氨基酸的最频繁使用的密码子。用于密码子优化的优选方法描述于WO2006/077258和WO2008/000632中)。WO2008/000632涉及密码子对优化。密码子对优化是这样的一种方法,在所述方法中编码多肽的核苷酸序列已经在其密码子使用方面被修饰,特别是在所使用的密码子对方面被修饰,以获得编码多肽的核苷酸序列的改善表达和/或所编码多肽的改善产生。密码子对被定义为编码序列中的一组两个紧接的三联体(密码子)。根据本发明的组合物中的来源中Cas蛋白的量可以变化,并且可以进行优化以实现最佳性能。
在具有5'-帽的RNA分子中,7-甲基鸟苷酸残基位于RNA的5'末端上(诸如通常在真核细胞中的mRNA中)。RNA聚合酶II(Pol II)在真核细胞中转录mRNA。信使RNA加帽通常发生如下:由RNA末端磷酸酶去除mRNA转录物的最末端5'磷酸基团,留下两个末端磷酸酯。由鸟苷酰转移酶将单磷酸鸟苷(GMP)加入到转录物的末端磷酸酯中,在转录物末端处留下5'-5'三磷酸酯连接的鸟嘌呤。最后,用甲基转移酶甲基化该末端鸟嘌呤的7-氮。本文中术语“不具有5'-帽”用于指具有例如5'-羟基而不是5'-帽的RNA。例如,这种RNA可称为“未加帽的RNA”。未加帽的RNA可以在转录后在细胞核中更好地积累,因为5'-加帽的RNA经受核输出。
核酶是指这样的一种或多种RNA序列,所述一种或多种RNA序列形成能够在特定位点处切割RNA的二级、三级和/或四级结构。核酶包括“自切割核酶或自加工核酶”,其能够在相对于核酶序列的c/s位点处切割RNA(即,自动催化或自切割的)。核酶溶核活性的一般性质是本领域的技术人员已知的。用于RNA指导的核酸酶系统(诸如CRISPR/Cas)的指导RNA的生产中的自加工核酶尤其由Gao等人,2014描述。
核苷酸类似物或等同物通常包含经修饰的骨架。此类骨架的示例由吗啉代骨架、氨基甲酸酯骨架、硅氧烷骨架、硫化物骨架、亚砜骨架和砜骨架、甲酰乙酰基(formacetyl)和硫代甲酰乙酰基骨架、亚甲基甲酰乙酰基骨架、核乙酰基(riboacetyl)骨架、含烯烃的骨架、氨基磺酸酯骨架、磺酸酯骨架和磺酰胺骨架、亚甲基亚氨基骨架和亚甲基肼基骨架,以及酰胺骨架提供。进一步优选的是,骨架中残基之间的键不包含磷原子,诸如由短链烷基或环烷基核苷间键、混合的杂原子和烷基或环烷基核苷间键、或一个或多个短链杂原子或杂环核苷间键形成的键。
优选的核苷酸类似物或等同物包含具有经修饰的聚酰胺骨架的肽核酸(PNA)(Nielsen等人,(1991)Science 254,1497-1500)。基于PNA的分子是DNA分子在碱基对识别方面的真实模拟物。PNA的骨架由通过肽键连接的N-(2-氨基乙基)-甘氨酸单元组成,其中核碱基通过亚甲基羰基键与骨架连接。替代的骨架包括一个碳延伸的吡咯烷PNA单体(Govindaraju和Kumar(2005)Chem.Commun,495–497)。因为PNA分子的骨架不含带电荷的磷酸基团,所以PNA-RNA杂合体通常分别比RNA-RNA或RNA-DNA杂合体更稳定(Egholm等人(1993)Nature 365,566-568)。
进一步优选的骨架包含吗啉代核苷酸类似物或等同物,其中核糖或脱氧核糖被6元吗啉代环取代。最优选的核苷酸类似物或等同物包括磷酰二胺吗啉代寡聚物(PMO),其中核糖或脱氧核糖被6元吗啉代环取代,并且相邻吗啉代环之间的阴离子磷酸二酯键被非离子磷酰二胺键取代。
进一步优选的核苷酸类似物或等同物包括对磷酸二酯键中的至少一个非桥连氧的取代。这种修饰稍微破坏了碱基配对稳定性,但增加了对核酸酶降解的显著抗性。优选的核苷酸类似物或等同物包括硫代磷酸酯、手性硫代磷酸酯、二硫代磷酸酯、磷酸三酯、氨基烷基磷酸酯、H-膦酸酯、甲基膦酸酯和其他烷基膦酸酯(包括3'-亚烷基膦酸酯、5'-亚烷基膦酸酯和手性膦酸酯)、次膦酸酯、氨基磷酸酯(包括3'-氨基氨基磷酸酯和氨基烷基氨基磷酸酯)、硫代氨基磷酸酯、硫代烷基膦酸酯、硫代烷基磷酸酯、硒代磷酸酯或硼代磷酸酯。
进一步优选的核苷酸类似物或等同物包含一个或多个在2'、3'和/或5'位置处被单取代或二取代的糖部分,诸如-OH;-F;取代或未取代的、直链或支链的低级(C1-C10)烷基、烯基、炔基、烷芳基、烯丙基、芳基或芳烷基,所述基团可被一个或多个杂原子中断;O-烷基、S-烷基或N-烷基;O-烯基、S-烯基或N-烯基;O-炔基、S-炔基或N-炔基;O-烯丙基、S-烯丙基或N-烯丙基;O-烷基-O-烷基,O-烷基-O-甲氧基,O-烷基-O-氨基丙氧基;氨氧基、甲氧基乙氧基;-二甲氨基氧基乙氧基;以及-二甲氨基乙氧基乙氧基。糖部分可以是吡喃糖或其衍生物,或脱氧吡喃糖或其衍生物,优选核糖或其衍生物,或脱氧核糖或其衍生物。这种优选的衍生糖部分包括锁核酸(Locked Nucleic Acid,LNA),其中2'-碳原子与糖环的3'或4'碳原子连接,从而形成双环糖部分。优选的LNA包含2'-O,4'-C-亚乙基桥连核酸(Morita等人,2001.Nucleic Acid Res增刊No.1:241-242)。这些取代使得核苷酸类似物或等同物具有对RNA酶H和核酸酶的抗性并增加了对靶标的亲和力。
本发明上下文中氨基酸序列或核酸序列的“序列同一性”或“同一性”在本文中被定义为两个或更多个氨基酸(肽、多肽或蛋白质)序列或两个或更多个核酸(核苷酸、寡核苷酸、多核苷酸)序列之间的关系,如通过比较所述序列确定的。在本领域中,“同一性”还表示视情况而定的氨基酸或核苷酸序列之间的序列相关程度,如通过这些序列的串之间的匹配所确定的。在本发明中,与特定序列的序列同一性优选是指在所述特定多肽或多核苷酸序列的整个长度上的序列同一性。
两个氨基酸序列之间的“相似性”是通过比较一种肽或多肽的氨基酸序列及其保守氨基酸替代物与第二种肽或多肽的序列来确定的。在一个优选的实施方案中,计算整个序列(SEQ ID NO:)的同一性或相似性,如在本文中所鉴定的。“同一性”和“相似性”可以通过已知方法容易地计算,所述已知方法包括但不限于在Computational MolecularBiology,Lesk,A.M.编辑,Oxford University Press,New York,1988;Biocomputing:Informatics and Genome Projects,Smith,D.W.,编辑,Academic Press,New York,1993;Computer Analysis of Sequence Data,第I部分,Griffin,A.M.,和Griffin,H.G.编辑,Humana Press,New Jersey,1994;Sequence Analysis in Molecular Biology,vonHeine,G.,Academic Press,1987;和Sequence Analysis Primer,Gribskov,M.和Devereux,J.,编辑,M Stockton Press,New York,1991;以及Carillo,H.,和Lipman,D.,SIAM J.Applied Math.,48:1073(1988)中描述的那些方法。
用于确定同一性的优选方法被设计成给出所测试的序列之间的最大匹配。用于确定同一性和相似性的方法被编入了公开可用的计算机程序中。用于确定两个序列之间的同一性和相似性的优选计算机程序方法包括例如GCG程序包(Devereux,J.,等人,NucleicAcids Research 12(1):387(1984))、BestFit、BLASTP、BLASTN和FASTA(Altschul,S.F.等人,J.Mol.Biol.215:403-410(1990)。BLAST X程序可从NCBI和其他来源(BLAST Manual,Altschul,S.等人,NCBI NLM NIH Bethesda,MD20894;Altschul,S.等人,J.Mol.Biol.215:403-410(1990)公开获得。还可以使用众所周知的史密斯-沃特曼算法(Smith Watermanalgorithm)来确定同一性。
多肽序列比较的优选参数包括以下:算法:Needleman和Wunsch,J.Mol.Biol.48:443-453(1970);比较矩阵:BLOSSUM62,来自Hentikoff和Hentikoff,Proc.Natl.Acad.Sci.USA.89:10915-10919(1992);空位罚分:12;以及空位长度罚分:4。使用这些参数的可用程序可作为来自位于Madison,WI的Genetics Computer Group的“Ogap”程序公开获得。上述参数是用于氨基酸比较的默认参数(并且没有针对末端空位的罚分)。
用于核酸比较的优选参数包括以下:算法:Needleman和Wunsch,J.Mol.Biol.48:443-453(1970);比较矩阵:匹配=+10,不匹配=0;空位罚分:50;空位长度罚分:3。可从位于Madison,Wis的Genetics Computer Group获得Gap程序。以上给出了用于核酸比较的默认参数。
任选地,在确定氨基酸相似性程度时,技术人员还可以考虑所谓的“保守”氨基酸取代,如本领域的技术人员应当清楚的。保守氨基酸取代是指具有相似侧链的残基的可互换性。例如,具有脂肪族侧链的一组氨基酸是甘氨酸、丙氨酸、缬氨酸、亮氨酸和异亮氨酸;具有脂肪族-羟基侧链的一组氨基酸是丝氨酸和苏氨酸;具有含酰胺侧链的一组氨基酸是天冬酰胺和谷氨酰胺;具有芳香族侧链的一组氨基酸是苯丙氨酸、酪氨酸和色氨酸;具有碱性侧链的一组氨基酸是赖氨酸、精氨酸和组氨酸;具有含硫侧链的一组氨基酸是半胱氨酸和甲硫氨酸。优选的保守氨基酸取代组是:缬氨酸-亮氨酸-异亮氨酸、苯丙氨酸-酪氨酸、赖氨酸-精氨酸、丙氨酸-缬氨酸和天冬酰胺-谷氨酰胺。本文公开的氨基酸序列的取代变体是已去除了所公开序列中的至少一个残基并在所述至少一个残基的位置中插入不同残基的那些变体。优选地,氨基酸变化是保守的。每种天然存在的氨基酸的优选保守取代如下:Ala至ser;Arg至lys;Asn至gln或his;Asp至glu;Cys至ser或ala;Gln至asn;Glu至asp;Gly至pro;His至asn或gln;Ile至leu或val;Leu至ile或val;Lys至arg;gln或glu;Met至leu或ile;Phe至met、leu或tyr;Ser至thr;Thr至ser;Trp至tyr;Tyr至trp或phe;以及Val至ile或leu。
根据本发明的多核苷酸由核苷酸序列表示。根据本发明的多肽由氨基酸序列表示。根据本发明的核酸构建体被定义为从天然存在的基因中分离的多核苷酸,或者经过修饰以含有多个多核苷酸分段(segment)的多核苷酸,所述多核苷酸分段以天然不存在的方式组合或并置。
本文提供的序列信息不应如此狭窄地解释为需要包含错误鉴定的碱基。技术人员能够辨别出这种错误鉴定的碱基并且知道如何校正这种错误。
本发明的所有实施方案,优选地指细胞,而不是指无细胞的体外系统;换句话说,根据本发明的系统优选是细胞系统,而不是无细胞的体外系统。
在本发明的所有实施方案中,例如,根据本发明的细胞可以是单倍体细胞、二倍体细胞或多倍体细胞。
根据本发明的细胞在本文中可互换地称为“细胞”、“根据本发明的细胞”、“宿主细胞”和“根据本发明的宿主细胞”;所述细胞可以是任何细胞,优选真菌,即酵母细胞或丝状真菌细胞。优选地,细胞缺乏NHEJ(非同源末端连接)部件。所述与NHEJ相关的部件优选是酵母Ku70、Ku80、MRE11、RAD50、RAD51、RAD52、XRS2、SIR4和/或LIG4的同源物或直系同源物。或者,在根据本发明的细胞中,可以通过使用抑制RNA连接酶IV的化合物(诸如SCR7)来使NHEJ缺乏。缺乏在本文其他地方定义。
当根据本发明的细胞是酵母细胞时,优选的酵母细胞来自选自由以下项组成的组的属:Candida、Hansenula、Issatchenkia、Kluyveromyces、Pichia、Saccharomyces、Schizosaccharomyces、Yarrowia或Zygosaccharomyces;更优选地酵母宿主细胞选自由以下项组成的组:Kluyveromyces lactis、Kluyveromyces lactis NRRL Y-1140、Kluyveromyces marxianus、Kluyveromyces、thermotolerans、Candida krusei、Candidasonorensis、Candida glabrata、Saccharomyces cerevisiae、Saccharomyces cerevisiaeCEN.PK113-7D、Schizosaccharomyces pombe、Hansenula polymorpha、Issatchenkiaorientalis、Yarrowia lipolytica、Yarrowia lipolytica CLIB122、Pichia stipidis和Pichia pastoris。
根据本发明的宿主细胞是丝状真菌宿主细胞。如本文所定义的丝状真菌包括Eumycota亚门和Oomycota亚门的所有丝状形式(如由Hawksworth等人在Ainsworth andBisby's Dictionary of The Fungi,第8版,1995,CAB International,UniversityPress,Cambridge,UK中所定义的)。
丝状真菌宿主细胞可以是分类单位Trichocomaceae的任何丝状形式的细胞(如由Houbraken和Samson在Studies in Mycology 70:1–51.2011中所定义的)。在另一个优选的实施方案中,丝状真菌宿主细胞可以是三个科Aspergillaceae、Thermoascaceae和Trichocomaceae中的任一科的任何丝状形式的细胞,所述三个科容纳在分类单位Trichocomaceae中。
丝状真菌的特征在于由几丁质、纤维素、葡聚糖、脱乙酰几丁质、甘露聚糖和其他复合多糖组成的菌丝体壁。营养生长是通过菌丝伸长而实现的,并且碳分解代谢是专性好氧的。丝状真菌菌株包括但不限于以下菌株:Acremonium、Agaricus、Aspergillus、Aureobasidium、Chrysosporium、Coprinus、Cryptococcus、Filibasidium、Fusarium、Humicola、Magnaporthe、Mortierella、Mucor、Myceliophthora、Neocallimastix、Neurospora、Paecilomyces、Penicillium、Piromyces、Panerochaete、Pleurotus、Schizophyllum、Talaromyces、Rasamsonia、Thermoascus、Thielavia、Tolypocladium,以及Trichoderma。根据本发明的优选丝状真菌宿主细胞来自选自由以下项组成的组的属:Acremonium、Aspergillus、Chrysosporium、Myceliophthora、Penicillium、Talaromyces、Rasamsonia、Thielavia、Fusarium和Trichoderma;更优选地来自选自由以下项组成的组的物种:Aspergillus niger、Acremonium alabamense、Aspergillus awamori、Aspergillusfoetidus、Aspergillus sojae、Aspergillusfumigatus、Talaromyces emersonii、Rasamsonia emersonii、Rasamsonia emersonii CBS393.64、Aspergillus oryzae、Chrysosporium lucknowense、Fusarium oxysporum、Mortierella alpina、Mortierellaalpina ATCC 32222、Myceliophthora thermophila、Trichoderma reesei、Thielaviaterrestris、Penicillium chrysogenum和P.chrysogenum Wisconsin 54-1255(ATCC28089);甚至更优选地,根据本发明的丝状真菌宿主细胞是Aspergillus niger。当根据本发明的宿主细胞是Aspergillus niger宿主细胞时,宿主细胞优选是CBS 513.88、CBS124.903,或它们的衍生物。
丝状真菌的几种菌株对公众来说是易于在一些菌种保藏中心得到的,所述菌种保藏中心诸如美国典型培养物保藏中心(ATCC)、Deutsche Sammlung von Mikroorganismenund Zellkulturen GmbH(DSM)、Centraalbureau Voor Schimmelcultures(CBS)、农业研究机构保藏中心(Agricultural Research Service Patent Culture Collection)、北方地区研究中心(Northern Regional Research Center)(NRRL),以及全俄微生物保藏中心(All-Russian Collection of Microorganisms of Russian Academy of Sciences)(俄文缩写-VKM,英文缩写-RCM)莫斯科,俄罗斯。作为根据本发明的宿主细胞的优选菌株是Aspergillus niger CBS 513.88、CBS124.903,Aspergillus oryzae ATCC 20423、IFO4177、ATCC 1011、CBS205.89、ATCC 9576、ATCC14488-14491、ATCC 11601、ATCC12892,P.chrysogenum CBS 455.95、P.chrysogenum Wisconsin54-1255(ATCC28089)、Penicillium citrinum ATCC 38065、Penicillium chrysogenum P2、Thielaviaterrestris NRRL8126、Rasamsonia emersonii CBS393.64、Talaromyces emersonii CBS124.902、Acremonium chrysogenum ATCC 36225或ATCC 48272、Trichoderma reesei ATCC26921或ATCC 56765或ATCC 26921、Aspergillus sojae ATCC11906、Myceliophthorathermophila C1、Garg 27K、VKM-F 3500D、Chrysosporium lucknowense C1、Garg 27K、VKM-F 3500 D、ATCC44006,以及它们的衍生物。
在本发明的实施方案中,宿主细胞可以是藻类、微藻类或海洋真核生物。宿主细胞可以是Labyrinthulomycetes宿主细胞,优选为Thraustochytriales目的宿主细胞,更优选地为Thraustochytriaceae科的宿主细胞,更优选地为选自由以下项组成的组的属的成员:Aurantiochytrium、Oblongichytrium、Schizochytrium、Thraustochytrium和Ulkenia,甚至更优选地为Schizochytrium sp.ATCC#20888。
优选地,根据本发明的宿主细胞具有修饰,优选在其基因组中具有修饰,所述修饰导致如果与未修饰的亲本宿主细胞相比,当在相同的条件下进行分析时,如本文所定义的不需要的化合物的产生减少或不产生。
可以通过本领域的技术人员已知的任何方法引入修饰,所述方法诸如但不限于传统菌株改良、随机诱变,之后进行选择。也可以通过定点诱变来引入修饰。
修饰可以通过在多核苷酸序列中一个或多个核苷酸的引入(插入)、取代(置换)或去除(缺失)来完成。可以实现编码不需要的化合物(诸如多肽)的多核苷酸的完全或部分缺失。不需要的化合物可以是本文其他地方列出的任何不需要的化合物;它也可以是合成不需要的化合物(诸如代谢物)的生物学途径中的蛋白质和/或酶。或者,编码所述不需要的化合物的多核苷酸可以部分或完全地用不编码所述不需要的化合物的多核苷酸序列替换,或用编码所述不需要的化合物的部分或完全失活形式的多核苷酸序列替换。在另一个替代方案中,可以将一个或多个核苷酸插入编码所述不需要的化合物的多核苷酸中,以导致对所述多核苷酸的破坏,由此使由所述被破坏的多核苷酸编码的所述不需要的化合物部分或完全失活。
在一个实施方案中,根据本发明的宿主细胞在其基因组中包含选自以下项的修饰:
a)完全或部分缺失编码不需要的化合物的多核苷酸,
b)用不编码不需要的化合物或编码所述不需要的化合物的部分或完全失活形式的多核苷酸序列完全或部分替代编码所述不需要的化合物的多核苷酸。
c)通过在多核苷酸序列中插入一个或多个核苷酸来破坏编码不需要的化合物的多核苷酸,由此通过所述被破坏的多核苷酸使所述不需要的化合物部分或完全失活。
该修饰可以例如在编码序列中或者在所述不需要的化合物的转录或翻译所需的调节元件中。例如,可以插入或去除核苷酸,以便导致终止密码子的引入、起始密码子的去除或编码序列的开放阅读框的改变或移码。编码序列或其调节元件的修饰可以通过定点或随机诱变、DNA改组方法、DNA重组方法、基因合成(参见例如Young和Dong,(2004),NucleicAcids Research 32(7)或Gupta等人.(1968),Proc.Natl.Acad.Sci USA,60:1338-1344;Scarpulla等人.(1982),Anal.Biochem.121:356-365;Stemmer等人.(1995),Gene 164:49-53),或根据本领域中已知的方法的PCR产生的诱变来实现。随机诱变程序的示例是本领域中熟知的,诸如化学(例如NTG)诱变或物理(例如UV)诱变。定点诱变程序的示例是QuickChangeTM定点诱变试剂盒(Stratagene Cloning Systems,La Jolla,CA),‘TheAltered II体外诱变系统(The Altered II in vitro MutagenesisSystems)’(Promega Corporation),或者通过使用如在Gene.1989年4月15日;77(1):51-9(Ho SN,Hunt HD,Horton RM,Pullen JK,Pease LR“Site-directed mutagenesis byoverlap extension using the polymerase chain reaction”)中描述的PCR或使用如在Molecular Biology:Current Innovations and Future Trends.(A.M.Griffin和H.G.Griffin编辑,ISBN 1-898486-01-8;1995Horizon Scientific Press,PO Box 1,Wymondham,Norfolk,U.K.)中描述的PCR进行重叠延伸。
优选的修饰方法基于重组遗传操纵技术,诸如部分或完全基因置换或部分或完全基因缺失。
例如,在置换多核苷酸、核酸构建体或表达盒的情况下,可以在待替换的靶基因座处引入合适的DNA序列。合适的DNA序列优选存在于克隆载体上。优选的整合克隆载体包含这样的DNA片段,所述DNA片段与待替换基因座侧翼的多核苷酸同源和/或具有与待替换基因座侧翼的多核苷酸的同源性,以靶向克隆载体到该预定基因座的整合。为了促进靶向整合,优选在转化细胞之前将克隆载体线性化。优选地,执行线性化,使得克隆载体的至少一个末端但优选任一末端侧接与待替换的DNA序列(或其侧翼序列)同源的序列。该过程被称为同源重组,并且该技术也可用于实现(部分)基因缺失。
例如,对应于内源多核苷酸的多核苷酸可以被缺陷多核苷酸取代,缺陷多核苷酸是不能产生(全功能)多肽的多核苷酸。通过同源重组,缺陷多核苷酸取代内源多核苷酸。可能需要缺陷多核苷酸也编码标记,所述标记可用于选择其中核酸序列经修饰的转化体。
替代地或与其他提及的技术组合,可以使用基于E.coli细胞中粘粒重组的技术,如A rapid method for efficient gene replacement in the filamentous fungusAspergillus nidulans(2000)Chaveroche,M-K.,Ghico,J-M.和d’Enfert C;Nucleicacids Research,第28卷,no 22中所述。
或者,可以使用与多核苷酸的核酸序列互补的核苷酸序列,通过已建立的反义技术来执行修饰,在所述修饰中所述宿主细胞产生较少蛋白质或不产生蛋白质,所述蛋白质为诸如具有淀粉酶活性,优选如本文所述的α-淀粉酶活性并且由如本文所述的多核苷酸编码的多肽。更具体地,可以通过引入与多核苷酸的核酸序列互补的核苷酸序列来减少或消除宿主细胞对多核苷酸的表达,所述核苷酸序列可以在细胞中转录并且能够与细胞中产生的mRNA杂合。在允许互补反义核苷酸序列与mRNA杂交的条件下,翻译的蛋白质的量由此被减少或消除。表达反义RNA的示例显示于Appl.Environ.Microbiol.2000年2月;66(2):775-82中。(Characterization of a foldase,protein disulfide isomerase A,in theprotein secretory pathway of Aspergillus niger.Ngiam C,Jeenes DJ,Punt PJ,VanDen Hondel CA,Archer DB)或(Zrenner R,Willmitzer L,Sonnewald U.Analysis of theexpression of potato uridinediphosphate-glucose pyrophosphorylase and itsinhibition by antisense RNA.Planta.(1993);190(2):247-52.)
导致减少或不产生不需要的化合物的修饰优选是由于如果与未经修饰的亲本微生物宿主细胞相比并且在相同条件下测量时,编码所述不需要的化合物的mRNA的产生减少。
可以通过RNA干扰(RNAi)技术(Mouyna等人,2004)获得导致从编码不需要的化合物的多核苷酸转录的mRNA量减少的修饰。在该方法中,将表达受影响的核苷酸序列的相同有义和反义部分克隆到彼此后面,中间具有核苷酸间隔区,并插入表达载体中。在转录此类分子后,小核苷酸片段的形成将导致有待被影响的mRNA的靶向降解。特定mRNA的消除可以是不同程度的。RNA干扰技术描述于例如WO2008/053019、WO2005/05672A1和WO2005/026356A1中。
可以通过不同的方法获得导致不需要的化合物的产生减少或不产生的修饰,例如通过针对这种不需要的化合物的抗体或化学抑制剂或蛋白质抑制剂或物理抑制剂(TourO.等人,(2003)Nat.Biotech:Genetically targeted chromophore-assisted lightinactivation.第21卷.no.12:1505-1508)或肽抑制剂或反义分子或RNAi分子(R.S.Kamath_等人,(2003)Nature:Systematic functional analysis of theCaenorhabditis elegans genome using RNAi.第421卷,231-237)。
除了上述技术之外或作为替代方案,还可以抑制不需要的化合物的活性,或者借助于替代信号序列(Ramon de Lucas,J.,Martinez O,Perez P.,Isabel Lopez,M.,Valenciano,S.和Laborda,F.The Aspergillus nidulans carnitine carrier encodedby the acuH gene is exclusively located in the mitochondria.FEMS MicrobiolLett.2001年7月24日;201(2):193-8.)或驻留信号(Derkx,P.M.和Madrid,S.M.Thefoldase CYPB is a component of the secretory pathway of Aspergillus niger andcontains the endoplasmic reticulum retention signalHEEL.Mol.Genet.Genomics.2001年12月;266(4):537-545)来重新定位不需要的化合物(诸如蛋白质),或者通过将不需要的化合物如多肽靶向过氧化物酶体,所述过氧化物酶体能够与细胞分泌途径中涉及的细胞膜结构融合,从而导致多肽在细胞外分泌(例如,如在WO2006/040340中所述)。
可替代地或与上述技术组合,也可以获得不需要的化合物减少产生或不产生,例如通过UV诱变或化学诱变(Mattern,I.E.,van Noort J.M.,van den Berg,P.,Archer,D.B.,Roberts,I.N.和van den Hondel,C.A.,Isolation and characterization ofmutants of Aspergillus niger deficient in extracellular proteases.Mol GenGenet.1992年8月;234(2):332-6.)或者通过使用如本文所述的抑制不需要的多肽的酶活性的抑制剂(例如,野尻霉素,其用作β-葡糖苷酶的抑制剂(Carrel F.L.Y.和CanevasciniG.Canadian Journal of Microbiology(1991)37(6):459-464;Reese E.T.,Parrish F.W.和Ettlinger M.Carbohydrate Research(1971)381-388))。
在本发明的一个实施方案中,根据本发明的宿主细胞的基因组中的修饰是编码不需要的化合物的多核苷酸的至少一个位置中的修饰。
缺乏化合物(例如不需要的化合物,诸如不需要的多肽和/或酶)产生的细胞在本文中定义为突变的微生物宿主细胞,其已被修饰,优选地在其基因组中已被修饰,以导致表型特征,其中所述细胞:a)产生较少的不需要的化合物或基本上不产生任何不需要的化合物,和/或b)产生当在相同条件下分析时,与未修饰的亲本宿主细胞相比,具有降低的活性或降低的比活性的不需要的化合物或不具有活性或没有特定活性的不需要的化合物,以及这些可能性中的一种或多种的组合。
优选地,如果与未修饰的亲本宿主细胞相比并且当在相同条件下进行测量时,根据本发明的经修饰的宿主细胞产生少1%的不需要的化合物,至少少5%的不需要的化合物,至少少10%的不需要的化合物,至少少20%的不需要的化合物,至少少30%的不需要的化合物,至少少40%的不需要的化合物,至少少50%的不需要的化合物,至少少60%的不需要的化合物,至少少70%的不需要的化合物,至少少80%的不需要的化合物,至少少90%的不需要的化合物,至少少91%的不需要的化合物,至少少92%的不需要的化合物,至少少93%的不需要的化合物,至少少94%的不需要的化合物,至少少95%的不需要的化合物,至少少96%的不需要的化合物,至少少97%的不需要的化合物,至少少98%的不需要的化合物,至少少99%的不需要的化合物,至少少99.9%的不需要的化合物,或最优选少100%的不需要的化合物。
本文对作为现有技术给出的专利文件或其他事项的引用不应被视为承认该文件或事项是已知的,或者该文件或事项所包含的信息在任何权利要求的优先权日时是普通常识的一部分。
本文提供的序列信息不应如此狭窄地解释为需要包含错误鉴定的碱基。技术人员能够辨别出这种错误鉴定的碱基并且知道如何校正这种错误。
本文阐述的每个参考文献的公开内容全文以引用方式并入本文。
通过以下实施例来进一步说明本发明:
实施例
在以下实施例中,说明了本发明的各种实施方案。从以上描述和这些实施例,本领域的技术人员可以对本公开进行各种改变和修改以使其适应各种用途和条件。
为了使用RNA指导的CRISPR/Cas9系统在细胞中实现基因组精密工程化,应当在细胞内同时表达主要部件Cas9蛋白和crRNA-tracrRNA融合转录物(称为指导RNA或gRNA)。类似地,为了实现表达调节,诸如通过CRISPR干扰(CRISPRi)实现表达调节,dCas9蛋白必须与gRNA同时表达(Qi等人,2013)。CRISPR/Cas系统的其他用途还需要同时表达Cas9(或Cas9的变体)和gRNA。以类似的方式,对于其他RNA指导的内切核酸酶,指导Cpf1和对应的crRNA或crRNA阵列(Zetsche等人,2015)。
实施例1:构建dCas9/SNR52启动子/T7启动子–T7RNA聚合酶测试菌株和gRNA表达载体
用于所有实验的亲本测试菌株是CEN.PK113-7D(MATa URA3 HIS3 LEU2 TRP1MAL2-8 SUC2)。菌株CEN.PK113-7D可从EUROSCARF保藏中心(www.euroscarf.de,德国法兰克福)或从Centraal Bureau voor Schimmelcultures(荷兰乌得勒支,保藏号CBS 8340)获得。CEN.PK科菌株的起源由van Dijken等人,2000描述。通过转化下述表达构建体来构建测试菌株AG1和AG2,所述表达构建体通过PCR扩增并体内装配在Saccharomyces cerevisiae中(在下面详细描述)。在INT1基因座(位于染色体XV上的NTR1(YOR071c)和GYP1(YOR070c)之间的非编码区处)处执行DNA到基因组中的整合。通过在AG1和AF2测试菌株中转化PCR片段来体内装配所有gRNA表达载体,从而产生指导RNA表达载体pRN1120-AG1和pAG701。
通过体内装配到基因组DNA中来整合表达元件
使用PCR产生三个线性片段,将所述三个线性片段在体内组装并整合到菌株CEN.PK113-7D的基因组DNA中,从而产生测试菌株AG1和AG2。设计引物以产生与相邻区段和5'和3'接头序列的约50bp重叠,所述重叠与INT1基因座具有同源性。5’片段的正向PCR引物和反向PCR引物显示在SEQ ID NO:1和SEQ ID NO:2中,而3’片段的正向PCR引物和反向PCR引物显示在SEQ ID NO:3和SEQ ID NO:4中。高度同源(约50bp重叠)区段和DNA侧翼序列的存在允许通过体内同源重组(空位修复,Orr-Weaver等人,1983)在所需的位置处和以所需的顺序进入基因组DNA中而装配成一段DNA。
根据制造商的说明书使用Phusion DNA聚合酶(New England Biolabs,USA)产生供体DNA表达盒序列的PCR片段。根据制造商的说明,使用DNA Clean&ConcentratorTM-5试剂盒(由荷兰莱顿Baseclear Lab Products分销)纯化所有PCR片段。使用基因组DNA(使用醋酸锂SDS方法(等人,2011)从酵母菌株CEN.PK113-7D分离)作为模板,通过PCR产生5'片段和3'片段。
菌株说明
存在于菌株AG1中的DNA序列在图1中图示,并且在体内装配到菌株CEN.PK113-7D的基因组DNA中后获得的最终DNA序列在SEQ ID NO:5中提供。菌株AG1组成型地表达GFP。驱动GFP表达的启动子是来自Saccharomyces bayanus的TDH3启动子(SbTDH3)。菌株AG1从半乳糖诱导型启动子(GAL1p)表达dCas9-Mxi1。dCas9-Mxi1的核苷酸序列获取自Gilbert等人,2013。菌株AG1含有潮霉素选择性标记,所述潮霉素选择性标记最初用于选择正确装配的菌株;然而,在实施例2中描述的抑制测定中未使用潮霉素进行选择。
存在于菌株AG2中的DNA序列在图2中图示,并且在体内装配到菌株CEN.PK113-7D的基因组DNA中后获得的最终DNA序列在SEQ ID NO:6中提供。菌株AG2组成型地表达GFP。驱动GFP表达的启动子是来自Saccharomyces bayanus的TDH3启动子(SbTDH3)。菌株AG2从半乳糖诱导型启动子(GAL1p)表达dCas9-Mxi1和T7-RNAp。两种编码序列dCas9-Mxi1和T7RNA聚合酶(T7-RNAp)由病毒T2A序列分开,所述病毒T2A序列使得能够从单个启动子共表达多种蛋白质。T2A序列来源于Thosea asigna病毒。据说提高切割效率的氨基酸SGS(Kim等人,2011)不是由本实施例中使用的T2A核苷酸序列编码的。dCas9-Mxi1的核苷酸序列获取自Gilbert等人,2013。从来自New England Biolabs的Escherichia coli BL21-DE3菌株(产品ID:C2527I)中直接PCR扩增T7-RNAp核苷酸序列。菌株AG2含有潮霉素选择性标记,所述潮霉素选择性标记最初用于选择正确装配的菌株;然而,在实施例2和实施例3中描述的抑制测定中未使用潮霉素进行选择。
载体说明
用于AG1菌株中的实验的亲本载体是pRN1120-AG1(SEQ ID NO:7,图3),其含有2微米酵母复制起点和NatMX抗生素选择性标记。载体还含有指导RNA表达盒,所述指导RNA表达盒由以下项组成:SNR52启动子;靶向用于在AG1菌株中进行组成型GFP表达的所述SbTDH3启动子的指导序列;指导RNA结构部件;以及SUP4终止子,如在DiCarlo等人,2013中所述。
用于AG2菌株中的实验的亲本载体是pAG701(SEQ ID NO:8,图4),其含有2微米酵母复制起点和NatMX抗生素选择性标记。通过用T7启动子替代来自pRN1120-AG1的SNR52启动子,来构建T7启动子gRNA表达载体。用丁型肝炎病毒核酶(HDVr)和T7终止子替代SUP4终止子,产生载体pAG701。HDVr是一种自切割的RNA元件,其可校正由弱终止引起的连缀(run-on)转录形式T7(Szafraniec等人,2012)。指导序列和指导RNA结构部件保持完整。gRNA靶向用于在菌株AG2中进行组成型GFP表达的SbTDH3启动子。
使用PCR构建所有gRNA表达载体以产生线性DNA片段并在Saccharomycescerevisiae中体内组装(如下所述)。
为了测试抑制效率,使用因特网上的gRNA设计工具(benchling.com)来设计靶向(SbTDH3)启动子的gRNA(SEQ ID NO:9)。将所有抑制结果归一化为靶向在酵母基因组中未发现的随机20nt DNA序列的乱序gRNA(SEQ ID NO:10)。
体内载体装配
使用PCR来产生载体区段的线性片段。使用引发与相邻区段的50bp重叠的引物来执行PCR。当被转化时,所述区段通过体内同源重组(空位修复,Orr-Weaver等人,1983)而装配到环状载体中,这允许对转化体进行诺尔丝菌素选择。
T7gRNA转录单位(SEQ ID NO:8的一部分)是作为合成DNA盒(gBlock)在比利时鲁汶的Integrated DNA Technologies订购的。该盒含有与亲本载体的50bp的同源性,其在没有SNR52启动子的情况下进行PCR扩增,并通过体内重组而装配在酵母中。将载体pRN1120-AG1装配所需的线性DNA片段转化到测试菌株AG1中。将载体pAG701装配所需的线性DNA片段转化到测试菌株AG2中。
转化条件
使用LiAc/鲑鱼精子(SS)载体DNA/PEG方法(Gietz和Woods,2002)将载体骨架和线性DNA区段(用于整合到基因组DNA中或装配到载体中)转化到S.cerevisiae菌株CEN-PK1137D中。在转化混合物中,使用等摩尔浓度的每个DNA区段(归一化为1微克反应中使用的最短DNA区段)。将转化混合物接种在YPD-琼脂(10克/升酵母提取物、20克/升蛋白胨、20克/升葡萄糖、20克/升琼脂)上。为了构建菌株AG1和AG2,将200微克/ml的潮霉素(SigmaAldrich,荷兰Zwijndrecht)加入到所述YPD-琼脂中。为了进行酵母体内载体装配,将100微克/ml诺尔丝菌素(Sigma Aldrich,荷兰Zwijndrecht)加入所述琼脂中。在30℃下生长三到四天后,在转化平板上出现菌落。
实施例2:T7产生的gRNA的效能
抑制测定
用线性DNA片段转化菌株AG1和AG2,以允许体内装配以产生载体pRN1120-AG1(图3)和pAG701(图4)。挑取来自转化平板的三个菌落,并在补充有诺尔丝菌素选择(100微克/ml)的5ml YPD培养基(10克/升酵母提取物、20克/升蛋白胨、20克/升葡萄糖)中培养16小时。随后将培养物以1/200稀释到含有2%半乳糖(Sigma Aldrich,荷兰Zwijndrecht)、补充有诺尔丝菌素选择(100微克/ml)的YEP培养基(10克/升酵母提取物、20克/升蛋白胨)中,以诱导AG1转化体中dCas9-Mxi1的表达和AG2转化体中dCas9-Mxi1和T7-RNA聚合酶(T7-RNAp)的表达。
在半乳糖培养基上生长20小时后,将细胞以1/20稀释到无菌水中。将稀释的培养物在Tecan F200平板读数器(Tecan Trading AG,瑞士)上运行以定量GFP荧光(激发480nm,发射515nm)和OD600。还将稀释的培养物在MACSQuant VYB流式细胞仪(德国MiltenyiBiotec)上运行以基于每个细胞定量GFP荧光并观察细胞群分布。
为了显示与SNR52产生的gRNA相比T7产生的gRNA的功能性,我们直接比较GFP荧光,作为dCas9-Mxi1活性的量度。如实施例1中所述,将载体pRN1120-AG1体内装配在菌株AG1中,在所述载体pRN1120-AG1中靶向SbTDH3启动子的gRNA从SNR52启动子表达。如实施例1中所述,将载体pAG701体内装配在菌株AG2中,在所述载体pAG701中靶向SbTDH3启动子上的相同位点的gRNA(在SEQ ID NO:9中指示的指导序列)从T7启动子表达。将用于SNR52系统和T7系统的乱序gRNA载体体内装配在适当的菌株中以进行抑制归一化。乱序的gRNA载体是菌株上的载体维持负荷和启动子负荷的对照,因为乱序的gRNA(SEQ ID NO:10中所示的指导序列)将在细胞中产生,但将不会靶向驱动GFP表达的SbTDH3启动子。
对所测试的每种载体的抑制倍数(使用流式细胞术数据计算)示出于图5中。两种测试菌株AG1和AG2的乱序对照以相同水平表达GFP。通过使用不同的gRNA生产方法靶向驱动GFP表达的启动子上的相同位置而实现的抑制倍数是几乎相同的。抑制倍数是通过将靶向菌株的几何平均值除以相应的乱序菌株的几何平均值来计算的。
结果表明,在该系统中可以使用用于表达指导RNA的SNR52启动子来抑制GFP表达。此外,结果表明使用T7启动子诱导指导RNA的表达也导致使用上述系统抑制GFP信号,表明用于表达指导RNA的T7RNA聚合酶和T7启动子在S.cerevisiae中起作用。
图6示出了所有菌株之间的生长差异。T7-RNAp的表达对细胞生长没有影响。与乱序gRNA(其靶向随机序列)相比,靶向gRNA的表达也对生长没有影响。
图7示出了通过流式细胞术测定的与SNR52乱序菌株相比,靶向SbTDH3启动子的SNR52产生的gRNA的菌株的细胞群。两种细胞群都是单峰的(关于每个细胞群观察到单个峰),表明了菌株和载体稳定性。
图8示出了与T7产生的乱序菌株相比,靶向SbTDH3启动子的T7产生的gRNA的菌株的细胞群(流式细胞术)。两种细胞群都是单峰的,表明了菌株和载体稳定性。
实施例3:调节T7产生的gRNA的表达
如在E.coli中所表征的(Jones等人,2015),使用不同强度的T7启动子来表达gRNA,并且定量化所得到的GFP基因敲低水平。使用具有高、中和低转录率的三种不同T7启动子(SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13),替代在SEQ ID NO:8中以粗体表示的T7启动子序列。所述T7启动子相差3-5bp。
如实施例1中所述,将允许体内装配到功能性载体中的不同PCR片段转化到菌株AG2中,得到载体pAG701的变体(图4,SEQ ID NO:8),其中T7启动子被在SEQ ID NO:11、SEQID NO:12和SEQ ID NO:13中指示的序列替代。使三个单独的转化体生长,并如实施例2中的抑制测定所述分析GFP表达。
图9中示出的结果表明,当用于在S.cerevisiae中表达gRNA时,如在E.coli中所表征的(Jones等人,2015)的T7启动子强度与靶基因抑制相关。将所有抑制结果归一化为从靶向随机20nt DNA序列的强T7启动子表达的乱序gRNA(在SEQ ID NO:10中指示的指导序列)。结果表明,不同强度的T7启动子可用于在S.cerevisiae中进行指导RNA的功能性表达以及T7RNA聚合酶的表达。
通过构建简并碱基文库(Temme等人,2012)或选择预先表征的T7启动子来调谐T7启动子强度的简易性和多功能性允许通过调控gRNA表达水平进行精确的基因表达调谐/调节。如果与Cas9核酸酶一起使用,本发明可以在代谢途径优化和基因组编辑中具有应用。
实施例4:在S.cerevisiae中在T7启动子控制下的指导RNA的功能性
该实施例描述了当使用T7表达系统进行指导RNA表达时,S.cerevisiae中CRISPRCas系统的功能性。通过转化包含在T7启动子控制下的指导RNA盒的PCR片段,而在体内装配所有gRNA表达载体。将其中预表达Cas9以及T7RNAP的S.cerevisiae菌株CSN007和CSN008用于转化,从而用于评估T7表达系统的用于指导RNA表达的功能性。
构建表达Cas9和T7 RNAP的Saccharomyces cerevisiae菌株CSN007和CSN008
酵母载体pCSN061是单拷贝载体(CEN/ARS),其含有CAS9表达盒和赋予G418抗性的功能性KanMX标记盒,所述CAS9表达盒由从Kl11启动子(KLLA0F20031g的Kluyveromyceslactis启动子)和S.cerevisiae GND2终止子表达的CAS9密码子优化变体组成。将CAS9表达盒通过KpnI/NotI连接到pRS414(Sikorski和Hieter,1989),得到中间载体pCSN004。随后,将赋予G418抗性的功能性表达盒(参见http://www.euroscarf.de)从载体pUG7-KanMX进行NotI限制性切割,并且通过NotI连接到pCSN004,产生在图10中示出并且序列在SEQ ID NO:15中列出的载体pCSN061。
将含有Cas9表达盒的载体pCSN061进行SpeI/SacII限制性切割,并将100ng线性化的pCSN061载体与105ng的T7RNAP表达盒(SEQ ID NO:17或SEQ ID NO:18)转化到S.cerevisiae菌株CEN.PK113-7D(MATa URA3 HIS3 LEU2 TRP1 MAL2-8 SUC2)中。T7 RNAP表达盒作为合成DNA订购(在DNA2.0,Menlo Park,CA,USA订购),并且包含密码子对优化的T7RNAP ORF(SEQ ID NO:19)以在Ptdh3(SEQ ID NO:20)或PenoI(SEQ ID NO:21)的控制下在S.cerevisiae中表达,以实现T7RNAP基因的高或中等表达水平。为了结束基因的转录,将TenoI终止子(SEQ ID NO:22)置于终止密码子之后。T7RNAP表达盒以在5'侧上与线性pCSN061的64bp同源性侧接于5'侧上,并且以与线性pCSN061的59bp同源性侧接在3'侧上,以通过体内同源重组(空位修复,Orr-Weaver等人,1983)装配成环状载体pCSN070或pCSN071。使用的转化方法是LiAc/鲑鱼精子(SS)载体DNA/PEG方法(Gietz和Woods,2002),并在每毫升含200微克(μg)G418(Sigma Aldrich,荷兰Zwijndrecht)的YPD琼脂(10克/升酵母提取物、20克/升蛋白胨、20克/升葡萄糖、20克/升琼脂)上选择转化体。在30℃下生长二到四天后,在转化平板上出现了转化体。在得到的转化体中,通过PCR测试8个菌落,以便在pCSN061质粒骨架中正确装配T7RNAP表达盒。如等人,2011所述地分离出转化体的总DNA,并在PCR反应中用作模板。用于确认pCSN061质粒骨架向T7RNAP转换的引物是用于T7RNAP表达盒到pCSN061骨架中的5’转换的SEQ ID NO:23和SEQ ID NO:24以及用于T7RNAP表达盒到pCSN061骨架中的3’转换的SEQ ID NO:25和SEQ ID NO:26。根据制造商的说明和本领域的技术人员已知的PCR程序,使用MyTaqTM Red Mix(Catno BIO-25044,Bioline德国)执行PCR反应。5'转换934bp和3'转换467bp的片段证明了装配正确。使用1x TAE缓冲液(50x TAE(Tris/乙酸/EDTA),1升,产品目录号1610743,BioRad,荷兰)和520-Nancy(产品目录号01494,Sigma Aldrich,德国)在0.8%琼脂糖凝胶上分析所得的PCR片段,以对dsDNA进行染色。
在测试T7RNAP表达盒在pCSN061骨架中正确装配的8个转化体中,在PenoI-T7RNAP-TenoI装配的情况下100%是正确的,并且在Ptdh3-T7RNAP-TenoI装配的情况下87.5%是正确的。
确认存在T7RNAP的转化体在Ptdh3控制的T7RNAP表达(质粒pCSN070,SEQ ID NO:27)的情况下被指定为CSN007,并且在PenoI控制的T7RNAP表达(质粒pCSN071,SEQ ID NO:28)的情况下被指定为CSN008。
菌株CSN007和CSN008用于转化以评估T7系统用于在CRISPR Cas系统中表达指导RNA的功能性。
T7控制的指导RNA表达盒
T7启动子指导RNA表达盒是作为合成DNA(gBlocks)在Integrated DNATechnologies(IDT,Leuven,Belgium)订购的,包括与pRN1120在5'侧和3'侧上的同源性以用于体内装配。表1中提供了序列的概述。T7启动子指导RNA由T7启动子、指导序列(也称为基因组靶序列;SEQ ID NO:29)、gRNA结构部件DiCarlo等人,2013(SEQ ID NO:61)和丁型肝炎病毒核酶(HDVr)(SEQ ID NO:30)以及T7终止子(SEQ ID NO:31)组成。HDVr是一种自切割的RNA元件,其可校正由弱终止引起的连缀转录形式T7(Szafraniec等人,2012)。对于指导RNA表达,测试具有可变强度的一组T7启动子,弱T7启动子具有SEQ ID NO:32,中和强T7启动子分别呈现在SEQ ID NO:33和SEQ ID NO:34中。野生型T7启动子也包括在所述一组测试的T7启动子中,并具有SEQ ID NO:35。
INT1基因座被所有4个指导RNA盒靶向,以用于整合供体YFP表达盒/ds断裂。INT1整合位点位于染色体XV上的NTR1(YOR071c)和GYP1(YOR070c)之间的非编码区中。
为获得用于转化的T7控制的指导RNA表达盒而进行的PCR反应的概述示于表1中。根据供应商的说明书和本领域的技术人员已知的PCR程序,使用PrimeStar GXL DNA聚合酶(Takara/产品目录号R050A)进行PCR反应。根据制造商的说明,使用NucleoSpin Gel和PCRClean-up试剂盒(Machery-Nagel,由荷兰莱顿Bioké分销)纯化产生的T7控制的指导RNA表达盒PCR片段。随后,使用NanoDrop(ND-1000分光光度计,Thermo Scientific,荷兰Bleiswijk)测量纯化的T7控制的指导RNA片段的DNA浓度。
表1.用于转化的T7控制的指导RNA序列的序列概述。使用在表1中指示的引物,将在IDT(比利时鲁汶)订购的gBlock用作PCR的模板,以获得用于转化实验的T7控制的指导RNA片段。
pRN1120载体构建(多拷贝表达载体,NatMX标记)
酵母载体pRN1120是多拷贝载体(2微米),其含有赋予诺尔丝菌素抗性的功能性NatMX标记盒。该载体的骨架基于pRS305(Sikorski和Hieter,1989),并包括功能性2微米ORI序列和功能性NatMX标记盒(参见http://www.euroscarf.de)。载体pRN1120如图11所示,并且序列如SEQ ID NO:16所示。
整合位点
INT1整合位点位于染色体XV上的NTR1(YOR071c)和GYP1(YOR070c)之间的非编码区中。
100bp ssODN侧翼序列
为了靶向供体YFP表达盒(SEQ ID NO:46)的整合,在转化中提供所谓的100bp的侧翼。这些左侧翼(LF)和右侧翼(RF)序列与YFP供体盒的5'-末端和3'-末端具有50bp的同源性,并且与基因组具有50bp的同源性。100bp侧翼中的每一者由2个互补的单链DNA(ssODN)片段组成。LF由SEQ ID NO:46和SEQ ID NO:47组成并且RF由SEQ ID NO:48和SEQ ID NO:49组成。通过整合YFP盒的整合,在INT1基因座处敲除一段1kbp的基因组DNA。
500bp双链侧翼序列
为了靶向供体YFP表达盒(SEQ ID NO:50)的整合,在转化中提供所谓的577或581bp的侧翼。这些左侧翼(LF)和右侧翼(RF)序列与YFP供体盒的5'-末端和3'-末端具有50bp的同源性,并且与基因组具有527bp(LF)和531bp(RF)的同源性。使用CEN.PK113-7D的基因组DNA作为模板,通过PCR扩增这些侧翼,所述CEN.PK113-7D的基因组DNA是如等人,2011所述地分离的。使用引物组SEQ ID NO:51和SEQ ID NO:52扩增LF,从而产生577bp片段(SEQ ID NO:53)。使用引物组SEQ ID NO:54和SEQ ID NO:55扩增RF,从而产生581bp片段(SEQ ID NO:56)。
根据供应商的说明书和本领域的技术人员已知的PCR程序,使用PrimeStar GXLDNA聚合酶(Takara/产品目录号R050A)进行PCR反应。根据制造商的说明,使用NucleoSpinGel和PCR Clean-up试剂盒(Machery-Nagel,由荷兰莱顿Bioké分销)纯化LF PCR片段和RFPCR片段。通过整合YFP盒,在INT1基因座处敲除一段1kbp的基因组DNA。
具有50bp接头侧翼的双链DNA(ds-DNA)供体YFP表达盒
经由适当E.coli载体中的单独启动子(P)、orf(O)和终止子(T)序列的Golden-Gate装配反应,来制备编码黄色荧光蛋白(YFP)变体Venus(Nagai等人,2002)的双链供体DNA盒。经由PCR反应用SEQ ID NO:57和SEQ ID NO:58中所示的引物扩增装配的POT盒。在第二PCR中,使用SEQ ID NO:59和SEQ ID NO:60中所示的引物组加入50bp接头序列。这产生了这样的YFP表达盒,所述YFP表达盒在所述表达盒(SEQ ID NO:50)的5'末端和3'末端包含50bp接头序列。在PCR反应中使用Q5DNA聚合酶(High-Fidelity 2X Master Mix的一部分,New England Biolabs,由荷兰莱顿Bioké供应,产品目录号M0492S),所述PCR反应是根据制造商的说明书执行的。根据制造商的说明,使用NucleoSpin Gel和PCR Clean-up试剂盒(Machery-Nagel,由荷兰莱顿Bioké分销)纯化PCR片段。
DNA浓度
使用NanoDrop装置(ThermoFisher,Life Technologies,荷兰Bleiswijk)测定所有DNA浓度、侧翼(LF和RF),包括指导RNA表达盒PCR片段和pRN1120,以提供以纳克/微升计的浓度。基于这些测量,在转化实验中使用1μg T7控制的指导RNA片段、100ng EcoRI/XhoI限制性pRN1120、100ng YFP供体表达盒和2x 100ng侧翼(长)或4x50ng侧翼(100bp侧翼)的量。
酵母转化
将预先表达CAS9和T7RNAP的菌株CSN007和CSN008接种在YPD-G418培养基(10克/升酵母提取物、20克/升蛋白胨、20克/升葡萄糖、200微克(μg)/毫升G418(Sigma Aldrich,荷兰Zwijndrecht))中。随后,用如表2所示的1μg T7指导RNA盒、100ng XhoI/EcoRI限制性pRN1120、100ng各个侧翼(LF和RF)和100ng YFP表达盒供体,使用LiAc/SS载体DNA/PEG方法(Gietz和Woods,2002)来转化菌株CSN007和CSN008。除了作为单次测量进行的对照之外,所有转化一式三份执行。将转化混合物接种在在每毫升含有200μg诺尔丝菌素(NTC,JenaBioscience,德国)和200μg G418(Sigma Aldrich,Zwijndrecht,荷兰)的YPD-琼脂(10克/升酵母提取物、20克/升蛋白胨、20克/升葡萄糖、20克/升琼脂)上。将平板在30摄氏度温育,直至菌落出现在平板上。
表2.用于转化的T7控制的指导RNA的概述
结果
进行上表2中概述的转化实验,并且在转化后,将细胞置于YPD选择性平板上。为了证实YFP表达盒供体在INT1处的整合,在Qpix450上分析每次转化的转化体的YFP荧光。
表3.通过Qpix450进行的转化体分析的概述
转化结果表明,当指导RNA在T7启动子的控制下表达时,CRISPR Cas系统增强了YFP表达供体盒的整合。野生型T7启动子在所测试的T7启动子组中是最有效的,在此对于YFP盒的整合具有45%的最大编辑频率。当T7RNAP以更高水平表达(在Ptdh3的控制下,菌株CSN007)时,获得了更高水平的YFP盒整合。以上结果证明了T7系统在S.cerevisiae中进行指导RNA表达的功能性。
实施例5:使用具有T7启动子部分A的sgRNA表达盒在Aspergillus niger中表达sgRNA
该实施例描述了使用CAS9与单指导RNA(sgRNA)表达盒前面的T7启动子与供体DNA的组合,来破坏A.niger基因组DNA中的fnwA基因座。具有fwnA基因突变的菌株将在孢子中具有从黑色到浅黄褐色的颜色变化(等人,2011)。
供体DNA
在IDT(基因片段,Integrated DNA Technologies,Inc)合成gBlock片段,其含有用于所需突变的供体DNA(SEQ ID NO:62)。用Invitrogen的Zero Blunt TOPOPCR克隆试剂盒将该DNA克隆到TOPO Zero Blunt载体中,并命名为TOPO供体DNA fwnA(SEQID NO:63)。TOPO供体DNA fwnA的质粒图谱如图14所示。根据标准PCR方案,用Phusion DNA聚合酶(New England Biolabs),使用如SEQ ID NO:64中所示的正向引物和如SEQ ID NO:65中所示的反向引物,对来自TOPO载体的供体DNA进行PCR扩增。根据制造商的说明书,用来自Macherey Nagel的PCR纯化试剂盒纯化PCR片段。使用NanoDrop(ND-1000分光光度计,Thermo Scientific)来测量DNA浓度。
构建BG-AMA17质粒
使用如SEQ ID NO:66中所示的正向引物和如SEQ ID NO:67中所示的反向引物,执行Cas9表达盒的PCR扩增(在WO2016110453A1中描述了BG-C20Cas9表达盒的构建)。两种引物均含有具有KpnI限制性位点的侧翼。根据制造商的说明书,用来自Macherey Nagel的PCR纯化试剂盒(由荷兰莱顿Bioké分销)纯化PCR产物。使用NanoDrop(ND-1000分光光度计,Thermo Fisher Scientific)测量DNA浓度。
将骨架载体BG-AMA8(在WO2016110453A1中描述)和所获得的带有侧接KpnI的Cas9表达盒的PCR片段用KpnI(NEB酶)消化,并用来自Macherey Nagel的PCR纯化试剂盒(由荷兰莱顿Bioké分销)纯化。根据制造商的说明书,用T4连接(Invitrogen)将消化的BG-AMA8骨架载体和Cas9盒PCR产物进行连接。根据制造商的说明书,将连接混合物转化到ccdB抗性E.coli细胞(Invitrogen)中。用限制酶分析检查几个克隆,并将具有正确限制性模式的克隆命名为BG-AMA17(SEQ ID NO:68)。图15中提供了BG-AMA17的质粒图谱。质粒BG-AMA17含有从启动子和终止子表达的Cas9表达盒、dsRED盒,以及用于在A.niger中进行选择的HygB标记。
构建质粒BG-AMA18和BG-AMA19
在IDT(基因片段,Integrated DNA Technologies,Inc)合成gBlock片段,其含有靶向具有T7wt启动子(SEQ ID NO:69)和T7强启动子(SEQ ID NO:70)的fwnA的T7sgRNA表达盒。用Invitrogen的Zero Blunt TOPO PCR克隆试剂盒将这些DNA片段克隆到TOPO Zero Blunt载体中。使用Golden Gate反应(根据专利申请WO2013/144257中的实施例1)将构建的TOPO DNA载体克隆到接收骨架载体BG-AMA17中。这产生了具有T7wt启动子的命名为BG-AMA18的载体→(SEQ ID NO:71)和具有T7强启动子的命名为BG-AMA19的载体→(SEQ ID NO:72)。通过E.coli菌落PCR检查BG-AMA18和BG-AMA19载体,以检查克隆的sgRNAfwnA盒的大小。根据标准PCR方案,使用Phusion聚合酶(New England Biolabs),使用如SEQID NO:73中所示的正向引物和如SEQ ID NO:74中所示的反向引物来进行PCR。BG-AMA18和BG-AMA19的质粒图谱示出于图16和图17中。
菌株
在该实施例中,在转化实验中使用Aspergillus niger菌株GBA 302(ΔglaA、ΔpepA、ΔhdfA)。GBA 302的构建描述于专利申请WO2011/009700中。
转化
除了在转化混合物中使用ATA(金精三羧酸=核酸酶抑制剂)之外,如专利申请WO1999/32617和WO1998/46772中所述进行原生质体转化。
转化中使用的AMA载体(1.5μg/转化):
1.AMA载体BG-AMA17(SEQ ID NO:68;图15)→AMA hygB/Cas9
2.AMA载体BG-AMA18(SEQ ID NO:71;图16)→AMA hygB/Cas9/T7WT sgRNA盒
3.AMA载体BG-AMA19(SEQ ID NO:72;图17)→AMA hygB/Cas9/T7强sgRNA盒
表4示出了在每次单独转化中转化到菌株GBA 302的DNA的具体量。
表4:所执行的转化的概述。执行到菌株GBA 302的转化。使用不同的AMA质粒作为环状质粒。作为供体DNA,含有所需突变的PCR片段包括在一些转化中,如下表所示。总共进行6次转化。
转化后,将原生质体接种在含有60μg/ml潮霉素B(Invitrogen)的再生培养基平板上。将所有平板在30℃下孵育4-6天。
转化结果可见于表5。
表5:6次转化实验的结果,其中含有fwnA表型的转化体的数目/获得的转化体的总数,以及在转化体的总数中鉴定的含有fwnA表型的浅黄色菌落的百分比。
对来自所有转化平板的转化体进行计数,并对fwnA突变的浅黄褐色孢子表型特征进行评分。
在没有供体DNA的所有转化中(转化编号1、3和4),没有获得浅黄褐色的转化体。在没有sgRNA盒的转化2中,也没有获得浅黄褐色的转化体。
在转化5和6中(GBA 302、Cas9、sgRNA→WT或强T7启动子在sgRNA前面,并且具有供体DNA),13%-10%的转化体具有fwnA表型。
当比较转化2与5和6时,唯一的区别是AMA质粒中存在T7sgRNA盒。似乎A.niger能够在sgRNA前面诱导T7启动子,所述T7启动子与Cas9和供体DNA一起引起一些转化体(13%-10%的转化体)的浅黄褐色着色。
当将转化5(T7wt sgRNA)与6(T7强sgRNA)进行比较时,获得相等百分比的浅黄褐色着色。
用于产生用于测序的DNA片段的菌落PCR
将转化体5和6的孢子接种在PDA平板(Difco)上,并在30℃下在培养箱中孵育2-3天。对于每个测试的菌落,用接种环取菌落样品并置于Eppendorf杯中的25μl GlucanexTM溶液(50mg/ml GlucanexTM溶解于KC缓冲液(60g/l KCl、2g/l柠檬酸,用KOH/HCl调节至pH6.2))中。在37℃孵育1小时后,向每个杯中加入75μl DNA稀释缓冲液,然后在具有加热盖的PCR设备中煮沸5分钟。煮沸后,加入100μl millQ水,并通过上下吹打三次非常温和地进行混合。随后,从溶液顶部小心移取5μl染色体DNA模板,并加入每次反应的PCR混合物中(不从底部移取以免吸取到细胞碎片)。根据标准PCR方案,使用Phusion聚合酶(New EnglandBiolabs),通过使用如SEQ ID NO:75中所示的正向引物和如SEQ ID NO:76中所示的反向引物来执行PCR反应,从而扩增基因组fwnA6位置。根据手册,用来自Macherey Nagel的PCR纯化试剂盒纯化PCR片段。
通过测序确认fwnA中的基因组突变
根据手册,通过使用如SEQ ID NO:75中所示的正向引物并使用纯化的菌落PCR片段作为模板,使用Applied Biosystems的BigDye Terminator v3.1循环测序试剂盒进行PCR测序。根据供应商手册,通过乙醇/EDTA沉淀来清洁测序PCR产物。将fwnA6序列PCR片段沉淀溶解于10μl Applied Biosystems的HiDi甲酰胺中,并将悬浮液用于使用AppliedBiosystems的3500遗传分析仪(Sanger测序仪)进行序列分析。对于每次转化,对最多10个显示fwnA表型的转化体进行测序。
表6:测序结果表示为fwnA表型转化体总数中含有设计的5bp缺失的转化体的百分比,以及转化体总数中所设计的5bp缺失的百分比。
所有测序的浅黄褐色的转化体在fwnA基因中具有设计的5bp缺失。
实施例编号6:使用具有T7启动子的sgRNA表达盒与T7RNAP蛋白的组合在Aspergillus niger中表达sgRNA
该实施例描述了使用CAS9、在单指导RNA(sgRNA)表达盒前面的T7启动子、T7RNAP蛋白与供体DNA的组合来破坏A.niger基因组DNA中的fnwA基因座。具有fwnA基因突变的菌株将在孢子具有中从黑色到浅黄褐色的颜色变化(等人,2011)。
供体DNA
与实施例5相同
构建BG-AMA17
与实施例5相同
构建质粒BG-AMA18和BG-AMA19
与实施例5相同
菌株
与实施例5相同
转化
除了在转化混合物中使用ATA(金精三羧酸=核酸酶抑制剂)之外,如专利申请WO1999/32617和WO1998/46772中所述进行原生质体转化。在一些转化中,使用T7RNAP蛋白(New England BioLabs)。
转化中使用的AMA载体(1.5μg/转化):
4.AMA载体BG-AMA17(SEQ ID NO:68;图15)→AMA hygB/Cas9
5.AMA载体BG-AMA18(SEQ ID NO:71;图16)→AMA hygB/Cas9/T7WT sgRNA盒
6.AMA载体BG-AMA19(SEQ ID NO:72;图17)→AMA hygB/Cas9/T7强sgRNA盒
表7示出了在每次单独转化中转化到菌株GBA 302的DNA/蛋白质的具体量。
表7:所执行的转化的概述。执行到菌株GBA 302的转化。使用不同的AMA质粒作为环状质粒,并且在一些情况下使用T7RNAP蛋白。作为供体DNA,含有所需突变的PCR片段包括在一些转化中,如下表所示。总共进行8次转化。
转化后,将原生质体接种在含有60μg/ml潮霉素B(Invitrogen)的再生培养基平板上。将所有平板在30℃下孵育4-6天。
转化结果可见于表8。
表8:8次转化实验的结果,其中含有fwnA表型的转化体的数目/获得的转化体的总数,以及在转化体的总数中鉴定的含有fwnA表型的浅黄色菌落的百分比。
对来自所有转化平板的转化体进行计数,并对fwnA突变的浅黄褐色孢子表型特征进行评分。
在没有供体DNA的所有转化中(转化编号1、5和6),没有获得浅黄褐色的转化体。在没有指导RNA的转化2中,也没有获得浅黄褐色的转化体。
在转化3和4中(GBA 302、Cas9、sgRNA→WT或强T7启动子在sgRNA前面,并且具有供体DNA),4%的转化体具有fwnA表型。在转化7和8中(GBA 302、Cas9、sgRNAWT或强T7启动子在sgRNA前面,T7RNAP蛋白质,并且具有供体DNA),8%–6%的转化体具有fwnA表型。
当比较转化2与3(都是没有sgRNA的对照)和4时,唯一的区别是AMA质粒中存在T7sgRNA盒。似乎A.niger能够在sgRNA前面使用T7启动子并表达功能性指导RNA。与Cas9和供体DNA一起,所述系统引起一些转化体(4%的转化体)的浅黄褐色着色。
这表明在sgRNA前面的T7启动子可以成功地用于在A.niger中进行基因组编辑。当比较转化3+4与7+8时,结果表明在转化中加入T7RNAP蛋白增加了浅黄褐色转化体的百分比。因此,通过加入T7RNAP蛋白,CRISPR/Cas介导的fwn突变效率增大。
用于产生用于测序的DNA片段的菌落PCR SDS/LiAC
将转化体3、4、7和8的孢子接种在PDA平板(Difco)上,并在30℃下在培养箱中孵育2-3天。对于每个测试的菌落,用接种环取菌落样品并置于Eppendorf杯中的25μlGlucanexTM溶液(50mg/ml GlucanexTM溶解于KC缓冲液(60g/l KCl、2g/l柠檬酸,用KOH/HCl调节至pH6.2))中。在37℃孵育1小时后,向每个杯中加入75μl DNA稀释缓冲液,然后在具有加热盖的PCR设备中煮沸5分钟。煮沸后,加入100μl millQ水,并通过上下吹打三次非常温和地进行混合。随后,从溶液顶部小心移取5μl染色体DNA模板,并加入每次反应的PCR混合物中(不从底部移取以免吸取到细胞碎片)。根据标准PCR方案,使用Phusion聚合酶(NewEngland Biolabs),通过使用如SEQ ID NO:75中所示的正向引物和如SEQ ID NO:76中所示的反向引物来执行PCR反应,从而扩增基因组fwnA6位置。根据手册,用来自Macherey Nagel的PCR纯化试剂盒纯化PCR片段。
通过测序确认fwnA中的基因组突变
根据手册,通过使用如SEQ ID NO:71中所示的正向引物并使用纯化的菌落PCR片段作为模板,使用Applied Biosystems的BigDye Terminator v3.1循环测序试剂盒进行PCR测序。根据供应商手册,通过乙醇/EDTA沉淀来清洁测序PCR产物。将fwnA6序列PCR片段沉淀溶解于10μl Applied Biosystems的HiDi甲酰胺中,并将悬浮液用于使用AppliedBiosystems的3500遗传分析仪(Sanger测序仪)进行序列分析。
对于每次转化,对最多16个显示fwnA表型的转化体进行测序。
表9:测序结果表示为fwnA表型转化体总数中含有设计的5bp缺失的转化体的百分比,以及转化体总数中所设计的5bp缺失的百分比。
所有测序的浅黄褐色的转化体在fwnA基因中具有设计的5bp缺失。
参考文献
1.Qi et al.,“Repurposing CRISPR as an RNA-Guided Platform forSequence-Specific Control of Gene Expression,”Cell 152,no.5(February 28,2013):1173–83,doi:10.1016/j.cell.2013.02.022.
2.van Dijken et al.,“An interlaboratory comparison of physiologicaland genetic properties of four Saccharomyces cerevisiae strains,”EnzymeMicrob Technol.2000Jun 1;26(9-10):706-714.
3.Gilbert et al.,“CRISPR-Mediated Modular RNA-Guided Regulation ofTranscription in Eukaryotes,”Cell 154,no.2(July 18,2013):442–51,doi:10.1016/j.cell.2013.06.044.
4.Kim et al.,“High Cleavage Efficiency of a 2A Peptide Derived fromPorcine Teschovirus-1in Human Cell Lines,Zebrafish and Mice,”PLOS ONE 6,no.4(April 29,2011):e18556,doi:10.1371/journal.pone.0018556.
6.Szafraniec et al.,“Trans-Acting Antigenomic HDV Ribozyme forProduction of in Vitro Transcripts with Homogenous 3’Ends,”Methods inMolecular Biology(Clifton,N.J.)941(2012):99–111,doi:10.1007/978-1-62703-113-4_8.
7.Orr-Weaver et al.,“Genetic applications of yeast transformationwith linear and gapped plasmids,”Methods Enzymol.1983;101:228-45.
8. et al.Biotechniques.2011May;50(5):325-8.Extraction ofgenomic DNA from yeasts for PCR-based applications.
9.Gietz and Woods.,“Transformation of yeast by lithium acetate/single-stranded carrier DNA/polyethylene glycol method,”Methods Enzymol.2002;350:87-96.
10.Sikorski and Hieter.“A system of shuttle vectors and yeast hoststrains designed for efficient manipulation of DNA in Saccharomycescerevisiae,”Genetics.1989 May;122(1):19-27.
11.Jones,J.Andrew et al.,“ePathOptimize:A Combinatorial Approach forTranscriptional Balancing of Metabolic Pathways,”Scientific Reports.2015 5June:11301-6.
12.Temme,Karsetn et al.,“Modular Control of Multiple Pathways UsingEngineered Orthogonal T7 Polymerases.Nucleic Acids Research 2012 40(17):8773–8781.
13.Gao Y and Zhao Y.J Integr Plant Biol.2014 Apr;56(4):343-9.Self-processing of ribozyme-flanked RNAs into guide RNAs in vitro and in vivo forCRISPR-mediated genome editing.
14.Chu et al.Nat Biotechnol.2015 May;33(5):543-8.
15.Maruyana et al.Nat Biotechnol.2015 May;33(5):538–542.
16.Song et al.Nature communications|doi:10.1038/ncomms10548
17.Yu et al.Cell Stem Cell.2015 February 5;16(2):142–147.
18.Tycko J,Myer VE,Hsu PD.Methods for Optimizing CRISPR-Cas9GenomeEditing Specificity.Mol Cell.2016 Aug 4;63(3):355-70.
19.Nelson CE,Gersbach CA.Cas9 loosens its grip on off-targetsites.Nat Biotechnol.2016 Mar;34(3):298-9.
20.Benton et al.,Molecular and cellular biology,Jan.1990,p.353-360.
21.Shis et al.,Molecular Systems Biology 10:745|2014
22.Romanienko et al.PLOS ONE|DOI:10.1371/journal.pone.0148362February5,2016.
23.Hsu PD,Lander ES,Zhang F.Cell.2014 Jun 5;157(6):1262-78.Development and applications of CRISPR-Cas9 for genome engineering.
24.Sander JD,Joung JK.Nat Biotechnol.2014 Apr;32(4):347-55.doi:10.1038/nbt.2842.Epub 2014 Mar 2.CRISPR-Cas systems for editing,regulatingand targeting genomes.
25.Zetsche B,Gootenberg JS,Abudayyeh OO,Slaymaker IM,Makarova KS,Essletzbichler P,Volz SE,Joung J,van der Oost J,Regev A,Koonin EV,ZhangF.Cpf1 is a single RNA-guided endonuclease of a class 2 CRISPR-Cassystem.Cell.2015 Oct 22;163(3):759-71.doi:10.1016/j.cell.2015.09.038.Epub2015 Sep 25.
26.Didovyk A,Borek B,Tsimring L,Hasty J.Transcriptional regulationwith CRISPR-Cas9:principles,advances,and applications.Curr OpinBiotechnol.2016 Aug;40:177-84.doi:10.1016/j.copbio.2016.06.003.Epub2016 Jun23.
27.Young and Dong,(2004),Nucleic Acids Research 32,(7)electronicaccess http://nar.oupjournals.org/cgi/reprint/32/7/e59 or Gupta et al.(1968),Proc.Natl.Acad.Sci USA,60:1338-1344;Scarpulla et al.(1982),Anal.Biochem.121:356-365;Stemmer et al.(1995),Gene 164:49-53.
28.Ho SN,Hunt HD,Horton RM,Pullen JK,Pease LR“Site-directedmutagenesis by overlap extension using the polymerase chain reaction”
29.Molecular Biology:Current Innovations and Future Trends.(Eds.A.M.Griffin and H.G.Griffin.ISBN 1-898486-01-8;1995 Horizon ScientificPress,PO Box 1,Wymondham,Norfolk,U.K.
30. TR,Park J,Arentshorst M,van Welzen AM,Lamers G,VankuykPA,Damveld RA,van den Hondel CA,Nielsen KF,Frisvad JC,Ram AF.Fungal GenetBiol.2011 May;48(5):544-53.The molecular and genetic basis of conidialpigmentation in Aspergillus niger.
31.DiCarlo JE,Norville JE,Mali P,Rios X,Aach J,Church GM.Genomeengineering in Saccharomyces cerevisiae using CRISPR-Cas systems.NucleicAcids Res.2013;41(7):4336-4
序列表
<110> 帝斯曼知识产权资产管理有限公司,麻省理工学院
<120> 用于宿主细胞的指导RNA表达系统
<130> 32246-WO-PCT
<150> US62/399127
<151> 2016-09-23
<160> 76
<170> PatentIn version 3.5
<210> 1
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> Nucleotide sequence of forward primer used to amplify the 5'
piece for integration into the INT1 locus
<400> 1
ttaccaatcc tttcataagc taattatg 28
<210> 2
<211> 80
<212> DNA
<213> 人工序列
<220>
<223> Nucleotide sequence of reverse primer used to amplify the 5'
piece for integration into the INT1 locus
<400> 2
ggcacaaacg cctgtgggtg tggtactgga tatgcaaagc gattggaagt cgcttagggt 60
ttcaaagatc catacttctc 80
<210> 3
<211> 80
<212> DNA
<213> 人工序列
<220>
<223> Nucleotide sequence of forward primer used to amplify the 3'
piece for integration into the INT1 locus
<400> 3
tgtttcttgt atatagtaat atgtaatatt tgcttcgtac gcttagtcct cattttactt 60
tttttagaat gacctgttcc 80
<210> 4
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> Nucleotide sequence of reverse primer used to amplify the 3'
piece for integration into the INT1 locus
<400> 4
ttgtgaccgc cctgctgcaa aac 23
<210> 5
<211> 9360
<212> DNA
<213> 人工序列
<220>
<223> Nucleotide sequence of the GFP-dCas9-Mxi1 expression unit
integrated in the genome
<220>
<221> misc_feature
<222> (1)..(418)
<223> 5' INT1 integration site
<220>
<221> misc_feature
<222> (419)..(1814)
<223> GFP表达盒
<220>
<221> misc_feature
<222> (1819)..(1864)
<223> connector sequence
<220>
<221> misc_feature
<222> (1869)..(1918)
<223> connector sequence
<220>
<221> misc_feature
<222> (1923)..(3735)
<223> hygromycin B resistance marker cassette
<220>
<221> misc_feature
<222> (3747)..(3796)
<223> connector sequence
<220>
<221> misc_feature
<222> (3797)..(4401)
<223> GAL1 promoter
<220>
<221> misc_feature
<222> (4402)..(8736)
<223> dCAS9-Mxi1
<220>
<221> misc_feature
<222> (8737)..(8977)
<223> terminator
<220>
<221> misc_feature
<222> (8798)..(9028)
<223> connector sequence
<220>
<221> misc_feature
<222> (9029)..(9360)
<223> 3' INT1 integration site
<400> 5
ttaccaatcc tttcataagc taattatgcc atccatatag caagagaatc cggtgggggc 60
gccatgccta tccggcggca acattattac tctggtatac gggcgtaact ccataatatg 120
ccaccactta cctttaacat gttcatggta ggtaccccac ccagccataa ggaaattttc 180
aaaggcgttg gatcaaaaaa taggccttta tttcatcgcg tgattgagga gcataacatg 240
tttagtgaag gtttcttttg gaaaacttca gtcgctcatt attagaacca gggaggtcca 300
ggctttgctg gtgggagaga aagcttatga agctggggtt gcagatttgt cgattggtcg 360
ccagtacaca gttttaaaaa gtcagagaat gtagagaagt atggatcttt gaaaccctaa 420
gcgacttcca atcgctttgc atatccagta ccacacccac aggcgtttgt gccattcatc 480
tttcacctgc cattagtaac ccgacttctc attgagcggg ttacggcagc cacaggccac 540
attccgaatg tctgggtgag cggtcccttt tccagcatcc actaaatatc tcggatcccg 600
ctttttaatc tggcttcctg aaaaaaatca atggagtgat gcaaactgac tggagcaaaa 660
agctgacaca aggcaatcga cctacgtgtc tgtctatttt ctcacacctt ctattacctt 720
ctaactctct gggttggaaa aaactgaaaa aaaggttgtc tccagtttcc acaaatcatc 780
cccctgtttg attaataaat atataaagac gacaactatc gatcataaac tcataaaact 840
ataactcctt tacacttctt attttatagt tattctattt taattcttat tgattttaaa 900
accccaagaa cttagtttcg aaaacacaca cacacaaaca attaaaaatg tctaaaggtg 960
aagaattatt cactggtgtt gtcccaattt tggttgaatt agatggtgat gttaatggtc 1020
acaaattttc tgtctccggt gaaggtgaag gtgatgctac ttacggtaaa ttgaccttaa 1080
aattgatttg tactactggt aaattgccag ttccatggcc aaccttagtc actactttag 1140
gttatggttt gcaatgtttt gctagatacc cagatcatat gaaacaacat gactttttca 1200
agtctgccat gccagaaggt tatgttcaag aaagaactat ttttttcaaa gatgacggta 1260
actacaagac cagagctgaa gtcaagtttg aaggtgatac cttagttaat agaatcgaat 1320
taaaaggtat tgattttaaa gaagatggta acattttagg tcacaaattg gaatacaact 1380
ataactctca caatgtttac atcactgctg acaaacaaaa gaatggtatc aaagctaact 1440
tcaaaattag acacaacatt gaagatggtg gtgttcaatt agctgaccat tatcaacaaa 1500
atactccaat tggtgatggt ccagtcttgt taccagacaa ccattactta tcctatcaat 1560
ctgccttatc caaagatcca aacgaaaaga gagatcacat ggtcttgtta gaatttgtta 1620
ctgctgctgg tattacccat ggtatggatg aattgtacaa ataaactggt tgatggaaaa 1680
tataatttta ttgggcaaac ttttgtttat ctgatgtgtt ttatactatt atctttttaa 1740
ttaatgattc tatatacaaa cctgtatatt ttttctttaa ccaatttttt tttttataga 1800
cctagagctg tactcctcaa cgttgtccag gtttgtatcc acgtgtgtcc gttccgccaa 1860
tattccgccg gatcgatgta cacaaccgac tgcacccaaa cgaacacaaa tcttagcagt 1920
gctatttaaa aacctgtgtt atgctcaaat aacggttact gatccaaaac cttatatatg 1980
acggcaagtg tctcactgtt gcattacgcg ttgtttcttt tctttgttct tgtaagcgcg 2040
attttaccag aactagatgg cgctcgtgat cctgaaacgg ggagaaattt tgagaacacc 2100
gctttattag gcgaagcggt gggcacagct cacgcgtaag gtgttcccat tatttctcaa 2160
agtgatgcga atttcagaga acacattaac ctgggggcca taaacgcgac gtgctaccat 2220
tttcgttacg tatacttagg ccagagatta caacatgact actaatatca aacataactc 2280
tatatataag ggatgaagat gtatgctttc ttagaatttc aaacatgttc cgttaaagtt 2340
ttacttttcg atttcaattt cgactgcatg atgcttttct tagagagtgt tttgttatta 2400
aatagtatca taaattcttg tctttttaca taagaattag gaaagtacag aacaagagca 2460
aatttaatat ataatgggta aaaagcctga actcaccgcg acgtctgtcg agaagtttct 2520
gatcgaaaag ttcgacagcg tctccgacct gatgcagctc tcggagggcg aagaatctcg 2580
tgctttcagc ttcgatgtag gagggcgtgg atatgtcctg cgggtaaata gctgcgccga 2640
tggtttctac aaagatcgtt atgtttatcg gcactttgca tcggccgcgc tcccgattcc 2700
ggaagtgctt gacattgggg aattcagcga gagcctgacc tattgcatct cccgccgtgc 2760
acagggtgtc acgttgcaag acctgcctga aaccgaactg cccgctgttc tgcagccggt 2820
cgcggaggca atggatgcga tcgctgcggc cgatcttagc cagacgagcg ggttcggccc 2880
attcggaccg caaggaatcg gtcaatacac tacatggcgt gatttcatat gcgcgattgc 2940
tgatccccat gtgtatcact ggcaaactgt gatggacgac accgtcagtg cgtccgtcgc 3000
gcaggctctc gatgagctga tgctttgggc cgaggactgc cccgaagtcc ggcacctcgt 3060
gcacgcggat ttcggctcca acaatgtcct gacggacaat ggccgcataa cagcggtcat 3120
tgactggagc gaggcgatgt tcggggattc ccaatacgag gtcgccaaca tcttcttctg 3180
gaggccgtgg ttggcttgta tggagcagca gacgcgctac ttcgagcgga ggcatccgga 3240
gcttgcagga tcgccgcggc tccgggcgta tatgctccgc attggtcttg accaactcta 3300
tcagagcttg gttgacggca atttcgatga tgcagcttgg gcgcagggtc gatgcgacgc 3360
aatcgtccga tccggagccg ggactgtcgg gcgtacacaa atcgcccgca gaagcgcggc 3420
cgtctggacc gatggctgtg tagaagtact cgccgatagt ggaaaccgac gccccagcac 3480
tcgtccgagg gcaaaggaat aaacagtact gacaataaaa agattcttgt tttcaagaac 3540
ttgtcatttg tatagttttt ttatattgta gttgttctat tttaatcaaa tgttagcgtg 3600
atttatattt tttttcgcct cgacatcatc tgcccagatg cgaagttaag tgcgcagaaa 3660
gtaatatcat gcgtcaatcg tatgtgaatg ctggtcgcta tactgctgtc gattcgatac 3720
taacgccgcc atccagtgtc gacctcacgc tttccggcat cttccagacc acagtatatc 3780
catccgcctc ctgttggtgc acatggcatt accaccatat acatatccat atctaatctt 3840
acttatatgt tgtggaaatg taaagagccc cattatctta gcctaaaaaa accttctctt 3900
tggaactttc agtaatacgc ttaactgctc attgctatat tgaagtacgg attagaagcc 3960
gccgagcggg cgacagccct ccgacggaag tctctcctcc gtgcgtcctc gtgttcaccg 4020
gtcgcgttcc tgaaacgcag atgtgcctcg cgccgcactg ctccgaacaa taaagattct 4080
acaatactag cttttatggt tatgaagagg aaaaattggc agtaacctgg ccccacaaac 4140
cttcaaatca acgaatcaaa ttaacaacca taggataata atgcgattag ttttttagcc 4200
ttatttctgg ggtaattaat cagcgaagcg atgatttttg atctattaac agatatataa 4260
atgcaaaagc tgcataacca ctttaactaa tactttcaac attttcggtt tgtattactt 4320
cttattcaaa tgtcataaaa gtatcaacaa aaaattgtta atatacctct atactttaac 4380
gtcaaggaga aaaaactata aatgtctaga gccccaaaga agaagagaaa agttagaccc 4440
ggggataaga aatactctat tggtttggct atcggtacaa actctgttgg ttgggctgtt 4500
attactgatg aatacaaggt tccatccaag aagttcaagg ttttgggtaa cactgataga 4560
cactccatca aaaagaactt gattggtgcc ttgttgttcg attctggtga aactgctgaa 4620
gctactagat tgaaaagaac cgctagaaga agatacacca gaagaaagaa cagaatctgc 4680
tacttgcaag aaatcttctc caacgaaatg gccaaggttg atgattcatt cttccacaga 4740
ttggaagaat ccttcttggt cgaagaagat aagaagcacg aaagacatcc aatcttcggt 4800
aacatcgttg atgaagttgc ttaccacgaa aagtacccaa ctatctacca tttgagaaag 4860
aagttggttg actctaccga taaggctgat ttgagattga tctatttggc tttggcccac 4920
atgattaagt tcagaggtca tttcttgatc gaaggtgatt tgaacccaga taactccgat 4980
gttgataagt tgttcatcca attagtccaa acctacaatc aattattcga agaaaaccca 5040
atcaacgcct ctggtgttga tgctaaagct attttgtctg ccagattgtc caagtccaga 5100
agattagaaa atttgatcgc ccaattacca ggtgaaaaga agaatggttt gttcggtaat 5160
ttgattgcct tgtctttggg tttgactcca aacttcaagt ccaatttcga tttggctgaa 5220
gatgccaagt tgcaattatc taaggatacc tacgatgacg atttggataa cttgttggct 5280
caaatcggtg atcaatacgc tgatttgttt ttggctgcta agaacttgtc cgatgccatt 5340
ttgttgtccg atattttgag agtcaacacc gaaattacta aggctccatt gtctgcctct 5400
atgatcaaaa gatacgatga acaccaccaa gacttgactt tgttgaaggc tttggtcaga 5460
caacaattac ctgaaaagta caaagaaatt ttcttcgatc aatccaagaa cggttacgcc 5520
ggttatattg atggtggtgc ttctcaagaa gaattttaca agttcatcaa gccaatcttg 5580
gaaaagatgg acggtactga agaattattg gtcaagttga acagagaaga tttgttgaga 5640
aagcaaagaa ccttcgacaa cggttctatt ccacatcaaa ttcacttggg tgaattgcac 5700
gcaattttga gaagacaaga agatttttat ccattcttga aggacaacag agaaaagatc 5760
gaaaagattc tgaccttcag aatcccttac tacgttggtc cattggctag aggtaattca 5820
agatttgcct ggatgactag aaagtccgaa gaaactatta ctccttggaa cttcgaagaa 5880
gttgtagata agggtgcttc tgcccaatcc tttattgaaa gaatgaccaa cttcgacaag 5940
aacttgccaa acgaaaaggt tttgccaaag cactctttgt tgtacgaata cttcaccgtc 6000
tacaacgaat tgactaaggt taagtacgtc accgaaggta tgagaaaacc agctttttta 6060
tccggtgaac aaaagaaggc tatcgtcgat ttgttgttca agaccaacag aaaggttact 6120
gtcaagcaat taaaagaaga ttacttcaag aaaatcgaat gcttcgactc cgttgaaatt 6180
tctggtgtcg aagatagatt caatgcctct ttaggtactt accatgactt gttgaaaatc 6240
atcaaggaca aggatttctt ggacaacgaa gaaaacgaag atattttgga agatattgtc 6300
ttgacattga ccttgtttga agatagagaa atgattgaag aaagattgaa aacctacgcc 6360
cacttgttcg atgataaggt tatgaagcaa ttaaagagaa gaagatacac tggttggggt 6420
agattgtcca gaaaattgat taacggtatc agagacaagc aatccggtaa gaccattttg 6480
gactttttga agtctgatgg tttcgctaac agaaacttca tgcaattaat ccacgacgat 6540
tccttgactt tcaaagaaga tatacaaaag gcccaagtct ctggtcaagg tgattcttta 6600
catgaacata tcgctaactt ggctggttct ccagctatta agaagggtat tttacaaacc 6660
gttaaggtcg ttgacgaatt ggtcaaagtt atgggtagac ataagccaga aaacatcgtt 6720
atcgaaatgg ctagagaaaa tcaaaccacc caaaagggtc aaaagaactc cagagaaaga 6780
atgaagagaa tcgaagaagg tatcaaagaa ttgggttccc aaattttgaa agaacaccca 6840
gttgaaaaca cccaattaca aaacgaaaag ttgtacttgt actacttgca aaacggtaga 6900
gatatgtacg ttgaccaaga attggacatc aacagattgt ctgattacga tgttgacgct 6960
atcgttccac aatctttttt gaaggatgac tccattgaca acaaggtctt gactagatcc 7020
gataagaata gaggtaagtc cgataacgtt ccatctgaag aagtcgttaa gaaaatgaag 7080
aactattgga gacaattatt gaacgccaag ttgatcaccc aaagaaagtt tgacaatttg 7140
accaaggctg aaagaggtgg tttgtctgaa ttggataagg caggtttcat caaaagacaa 7200
ttagtagaaa ccagacaaat caccaagcac gttgctcaaa ttttggatag tagaatgaac 7260
actaagtacg acgaaaacga caaattgatc agagaagtta aggtcattac cttgaagtcc 7320
aagttggttt ccgatttcag aaaggacttc caattctaca aggtcagaga aatcaacaac 7380
taccatcatg cacatgatgc ttacttgaat gctgttgttg gtactgcctt gattaagaag 7440
tatccaaagt tggaatccga atttgtctac ggtgattaca aggtttacga cgttagaaag 7500
atgatcgcca agtccgaaca agaaattggt aaagctactg ccaaatactt cttctactcc 7560
aatattatga atttctttaa gaccgaaatc actttggcca acggtgaaat tagaaaaaga 7620
ccattgattg aaactaatgg tgaaacaggt gaaatcgttt gggataaggg tagagatttt 7680
gccactgtta gaaaggtatt gtccatgcca caagtaaaca tcgtcaaaaa gaccgaagtt 7740
caaactggtg gtttctccaa agaatccatt ttgcctaaga gaaactccga taagttgatc 7800
gctagaaaaa aagactggga cccaaaaaag tacggtggtt ttgattctcc aactgttgct 7860
tactctgttt tggttgttgc taaggtcgaa aagggtaaga gtaagaagtt gaagtccgtc 7920
aaagaattat taggtatcac tatcatggaa agatcctcat tcgaaaagaa tcctatcgac 7980
tttttggaag ccaagggtta caaagaagtc aagaaggact tgatcattaa gttgccaaag 8040
tacagtttgt tcgaattgga aaatggtaga aagagaatgt tggcttctgc cggtgaatta 8100
caaaagggta atgaattggc tttgccatcc aagtacgtta atttcttata cttggcctcc 8160
cactacgaaa aattgaaagg ttctcctgaa gataacgaac aaaagcaatt atttgtcgaa 8220
caacacaagc actacttgga cgaaatcatt gaacaaattt ccgaattttc caaaagagtc 8280
attttggctg acgccaattt ggacaaagtt ttgtcagctt acaacaagca cagagataag 8340
ccaattagag aacaagctga aaacatcatt cacttgttca ctttgactaa cttgggtgct 8400
ccagctgctt ttaagtattt cgataccact atcgacagaa agagatacac ctctaccaaa 8460
gaagttttgg acgctacttt gatccaccaa tctattactg gtttgtacga aactagaatc 8520
gacttgtctc aattaggtgg tgatgaggga gctcccaaga aaaagcgcaa ggtaggtagt 8580
tccaagcttg gcggcagcgg cggcagcatg gaacgtgtga gaatgattaa tgtgcaaagg 8640
ctgttagaag ccgcagagtt tttagaaaga agagaaagag aatgcgaaca cgggtatgcc 8700
agttctttcc ctagcatgcc ctctcccaga ggctaaatag gctaatatga atgtatttga 8760
tctctatttt attaatacga aaccccttaa taattgatat tttcgataca tatttggcag 8820
tagttagcta cgtaacagag tattattttc atttcaagtt atgcatgaac tctctaattt 8880
cacataccat gctaccacta cccttggagg ttttgttcat atcttttata ataaagctaa 8940
aaccgaaaag gtgaagggaa aaaaaactat tagagcctgt ttcttgtata tagtaatatg 9000
taatatttgc ttcgtacgct tagtcctcat tttacttttt ttagaatgac ctgttcccga 9060
cactatgtaa gatctagctt ttaacatatt atggaaacct gaaatgtaaa atctgaattt 9120
ttgtatatgt gtttatattt gggtagttct tttgaggaaa gcatgcatag acttgctgta 9180
cgaactttat gtgacttgta gtgacgctgt ttcatgagac tttagccctt tgaacatatt 9240
atcatatctc agcttgaaat actatagatt tacttttgca gccatttctt ggtgctccaa 9300
ggttgtgcgt atctattact taatttctgt ccttgccaag ttttgcagca gggcggtcac 9360
<210> 6
<211> 11243
<212> DNA
<213> 人工序列
<220>
<223> Nucleotide sequence of the GFP-dCas9-Mxi1-T7RNAp expression unit
integrated in the genome
<220>
<221> misc_feature
<222> (1)..(418)
<223> 5' INT1 integration site
<220>
<221> misc_feature
<222> (419)..(468)
<223> connector sequence
<220>
<221> misc_feature
<222> (473)..(1814)
<223> GFP表达盒
<220>
<221> misc_feature
<222> (1819)..(1868)
<223> connector sequence
<220>
<221> misc_feature
<222> (1869)..(1918)
<223> connector sequence
<220>
<221> misc_feature
<222> (1923)..(3735)
<223> hygromycin B resistance marker cassette
<220>
<221> misc_feature
<222> (3747)..(3796)
<223> connector sequence
<220>
<221> misc_feature
<222> (3797)..(4401)
<223> GAL1 promoter
<220>
<221> misc_feature
<222> (4402)..(8733)
<223> dCAS9-Mxi1
<220>
<221> misc_feature
<222> (8734)..(8787)
<223> 2A peptide sequence
<220>
<221> misc_feature
<222> (8788)..(10617)
<223> T7 RNA polymerase
<220>
<221> misc_feature
<222> (10618)..(10858)
<223> terminator
<220>
<221> misc_feature
<222> (10859)..(10909)
<223> connector sequence
<220>
<221> misc_feature
<222> (10910)..(11243)
<223> 3' INT1 integration site
<400> 6
ttaccaatcc tttcataagc taattatgcc atccatatag caagagaatc cggtgggggc 60
gccatgccta tccggcggca acattattac tctggtatac gggcgtaact ccataatatg 120
ccaccactta cctttaacat gttcatggta ggtaccccac ccagccataa ggaaattttc 180
aaaggcgttg gatcaaaaaa taggccttta tttcatcgcg tgattgagga gcataacatg 240
tttagtgaag gtttcttttg gaaaacttca gtcgctcatt attagaacca gggaggtcca 300
ggctttgctg gtgggagaga aagcttatga agctggggtt gcagatttgt cgattggtcg 360
ccagtacaca gttttaaaaa gtcagagaat gtagagaagt atggatcttt gaaaccctaa 420
gcgacttcca atcgctttgc atatccagta ccacacccac aggcgtttgt gccattcatc 480
tttcacctgc cattagtaac ccgacttctc attgagcggg ttacggcagc cacaggccac 540
attccgaatg tctgggtgag cggtcccttt tccagcatcc actaaatatc tcggatcccg 600
ctttttaatc tggcttcctg aaaaaaatca atggagtgat gcaaactgac tggagcaaaa 660
agctgacaca aggcaatcga cctacgtgtc tgtctatttt ctcacacctt ctattacctt 720
ctaactctct gggttggaaa aaactgaaaa aaaggttgtc tccagtttcc acaaatcatc 780
cccctgtttg attaataaat atataaagac gacaactatc gatcataaac tcataaaact 840
ataactcctt tacacttctt attttatagt tattctattt taattcttat tgattttaaa 900
accccaagaa cttagtttcg aaaacacaca cacacaaaca attaaaaatg tctaaaggtg 960
aagaattatt cactggtgtt gtcccaattt tggttgaatt agatggtgat gttaatggtc 1020
acaaattttc tgtctccggt gaaggtgaag gtgatgctac ttacggtaaa ttgaccttaa 1080
aattgatttg tactactggt aaattgccag ttccatggcc aaccttagtc actactttag 1140
gttatggttt gcaatgtttt gctagatacc cagatcatat gaaacaacat gactttttca 1200
agtctgccat gccagaaggt tatgttcaag aaagaactat ttttttcaaa gatgacggta 1260
actacaagac cagagctgaa gtcaagtttg aaggtgatac cttagttaat agaatcgaat 1320
taaaaggtat tgattttaaa gaagatggta acattttagg tcacaaattg gaatacaact 1380
ataactctca caatgtttac atcactgctg acaaacaaaa gaatggtatc aaagctaact 1440
tcaaaattag acacaacatt gaagatggtg gtgttcaatt agctgaccat tatcaacaaa 1500
atactccaat tggtgatggt ccagtcttgt taccagacaa ccattactta tcctatcaat 1560
ctgccttatc caaagatcca aacgaaaaga gagatcacat ggtcttgtta gaatttgtta 1620
ctgctgctgg tattacccat ggtatggatg aattgtacaa ataaactggt tgatggaaaa 1680
tataatttta ttgggcaaac ttttgtttat ctgatgtgtt ttatactatt atctttttaa 1740
ttaatgattc tatatacaaa cctgtatatt ttttctttaa ccaatttttt tttttataga 1800
cctagagctg tactcctcaa cgttgtccag gtttgtatcc acgtgtgtcc gttccgccaa 1860
tattccgccg gatcgatgta cacaaccgac tgcacccaaa cgaacacaaa tcttagcagt 1920
gctatttaaa aacctgtgtt atgctcaaat aacggttact gatccaaaac cttatatatg 1980
acggcaagtg tctcactgtt gcattacgcg ttgtttcttt tctttgttct tgtaagcgcg 2040
attttaccag aactagatgg cgctcgtgat cctgaaacgg ggagaaattt tgagaacacc 2100
gctttattag gcgaagcggt gggcacagct cacgcgtaag gtgttcccat tatttctcaa 2160
agtgatgcga atttcagaga acacattaac ctgggggcca taaacgcgac gtgctaccat 2220
tttcgttacg tatacttagg ccagagatta caacatgact actaatatca aacataactc 2280
tatatataag ggatgaagat gtatgctttc ttagaatttc aaacatgttc cgttaaagtt 2340
ttacttttcg atttcaattt cgactgcatg atgcttttct tagagagtgt tttgttatta 2400
aatagtatca taaattcttg tctttttaca taagaattag gaaagtacag aacaagagca 2460
aatttaatat ataatgggta aaaagcctga actcaccgcg acgtctgtcg agaagtttct 2520
gatcgaaaag ttcgacagcg tctccgacct gatgcagctc tcggagggcg aagaatctcg 2580
tgctttcagc ttcgatgtag gagggcgtgg atatgtcctg cgggtaaata gctgcgccga 2640
tggtttctac aaagatcgtt atgtttatcg gcactttgca tcggccgcgc tcccgattcc 2700
ggaagtgctt gacattgggg aattcagcga gagcctgacc tattgcatct cccgccgtgc 2760
acagggtgtc acgttgcaag acctgcctga aaccgaactg cccgctgttc tgcagccggt 2820
cgcggaggca atggatgcga tcgctgcggc cgatcttagc cagacgagcg ggttcggccc 2880
attcggaccg caaggaatcg gtcaatacac tacatggcgt gatttcatat gcgcgattgc 2940
tgatccccat gtgtatcact ggcaaactgt gatggacgac accgtcagtg cgtccgtcgc 3000
gcaggctctc gatgagctga tgctttgggc cgaggactgc cccgaagtcc ggcacctcgt 3060
gcacgcggat ttcggctcca acaatgtcct gacggacaat ggccgcataa cagcggtcat 3120
tgactggagc gaggcgatgt tcggggattc ccaatacgag gtcgccaaca tcttcttctg 3180
gaggccgtgg ttggcttgta tggagcagca gacgcgctac ttcgagcgga ggcatccgga 3240
gcttgcagga tcgccgcggc tccgggcgta tatgctccgc attggtcttg accaactcta 3300
tcagagcttg gttgacggca atttcgatga tgcagcttgg gcgcagggtc gatgcgacgc 3360
aatcgtccga tccggagccg ggactgtcgg gcgtacacaa atcgcccgca gaagcgcggc 3420
cgtctggacc gatggctgtg tagaagtact cgccgatagt ggaaaccgac gccccagcac 3480
tcgtccgagg gcaaaggaat aaacagtact gacaataaaa agattcttgt tttcaagaac 3540
ttgtcatttg tatagttttt ttatattgta gttgttctat tttaatcaaa tgttagcgtg 3600
atttatattt tttttcgcct cgacatcatc tgcccagatg cgaagttaag tgcgcagaaa 3660
gtaatatcat gcgtcaatcg tatgtgaatg ctggtcgcta tactgctgtc gattcgatac 3720
taacgccgcc atccagtgtc gacctcacgc tttccggcat cttccagacc acagtatatc 3780
catccgcctc ctgttggtgc acatggcatt accaccatat acatatccat atctaatctt 3840
acttatatgt tgtggaaatg taaagagccc cattatctta gcctaaaaaa accttctctt 3900
tggaactttc agtaatacgc ttaactgctc attgctatat tgaagtacgg attagaagcc 3960
gccgagcggg cgacagccct ccgacggaag tctctcctcc gtgcgtcctc gtgttcaccg 4020
gtcgcgttcc tgaaacgcag atgtgcctcg cgccgcactg ctccgaacaa taaagattct 4080
acaatactag cttttatggt tatgaagagg aaaaattggc agtaacctgg ccccacaaac 4140
cttcaaatca acgaatcaaa ttaacaacca taggataata atgcgattag ttttttagcc 4200
ttatttctgg ggtaattaat cagcgaagcg atgatttttg atctattaac agatatataa 4260
atgcaaaagc tgcataacca ctttaactaa tactttcaac attttcggtt tgtattactt 4320
cttattcaaa tgtcataaaa gtatcaacaa aaaattgtta atatacctct atactttaac 4380
gtcaaggaga aaaaactata aatgtctaga gccccaaaga agaagagaaa agttagaccc 4440
ggggataaga aatactctat tggtttggct atcggtacaa actctgttgg ttgggctgtt 4500
attactgatg aatacaaggt tccatccaag aagttcaagg ttttgggtaa cactgataga 4560
cactccatca aaaagaactt gattggtgcc ttgttgttcg attctggtga aactgctgaa 4620
gctactagat tgaaaagaac cgctagaaga agatacacca gaagaaagaa cagaatctgc 4680
tacttgcaag aaatcttctc caacgaaatg gccaaggttg atgattcatt cttccacaga 4740
ttggaagaat ccttcttggt cgaagaagat aagaagcacg aaagacatcc aatcttcggt 4800
aacatcgttg atgaagttgc ttaccacgaa aagtacccaa ctatctacca tttgagaaag 4860
aagttggttg actctaccga taaggctgat ttgagattga tctatttggc tttggcccac 4920
atgattaagt tcagaggtca tttcttgatc gaaggtgatt tgaacccaga taactccgat 4980
gttgataagt tgttcatcca attagtccaa acctacaatc aattattcga agaaaaccca 5040
atcaacgcct ctggtgttga tgctaaagct attttgtctg ccagattgtc caagtccaga 5100
agattagaaa atttgatcgc ccaattacca ggtgaaaaga agaatggttt gttcggtaat 5160
ttgattgcct tgtctttggg tttgactcca aacttcaagt ccaatttcga tttggctgaa 5220
gatgccaagt tgcaattatc taaggatacc tacgatgacg atttggataa cttgttggct 5280
caaatcggtg atcaatacgc tgatttgttt ttggctgcta agaacttgtc cgatgccatt 5340
ttgttgtccg atattttgag agtcaacacc gaaattacta aggctccatt gtctgcctct 5400
atgatcaaaa gatacgatga acaccaccaa gacttgactt tgttgaaggc tttggtcaga 5460
caacaattac ctgaaaagta caaagaaatt ttcttcgatc aatccaagaa cggttacgcc 5520
ggttatattg atggtggtgc ttctcaagaa gaattttaca agttcatcaa gccaatcttg 5580
gaaaagatgg acggtactga agaattattg gtcaagttga acagagaaga tttgttgaga 5640
aagcaaagaa ccttcgacaa cggttctatt ccacatcaaa ttcacttggg tgaattgcac 5700
gcaattttga gaagacaaga agatttttat ccattcttga aggacaacag agaaaagatc 5760
gaaaagattc tgaccttcag aatcccttac tacgttggtc cattggctag aggtaattca 5820
agatttgcct ggatgactag aaagtccgaa gaaactatta ctccttggaa cttcgaagaa 5880
gttgtagata agggtgcttc tgcccaatcc tttattgaaa gaatgaccaa cttcgacaag 5940
aacttgccaa acgaaaaggt tttgccaaag cactctttgt tgtacgaata cttcaccgtc 6000
tacaacgaat tgactaaggt taagtacgtc accgaaggta tgagaaaacc agctttttta 6060
tccggtgaac aaaagaaggc tatcgtcgat ttgttgttca agaccaacag aaaggttact 6120
gtcaagcaat taaaagaaga ttacttcaag aaaatcgaat gcttcgactc cgttgaaatt 6180
tctggtgtcg aagatagatt caatgcctct ttaggtactt accatgactt gttgaaaatc 6240
atcaaggaca aggatttctt ggacaacgaa gaaaacgaag atattttgga agatattgtc 6300
ttgacattga ccttgtttga agatagagaa atgattgaag aaagattgaa aacctacgcc 6360
cacttgttcg atgataaggt tatgaagcaa ttaaagagaa gaagatacac tggttggggt 6420
agattgtcca gaaaattgat taacggtatc agagacaagc aatccggtaa gaccattttg 6480
gactttttga agtctgatgg tttcgctaac agaaacttca tgcaattaat ccacgacgat 6540
tccttgactt tcaaagaaga tatacaaaag gcccaagtct ctggtcaagg tgattcttta 6600
catgaacata tcgctaactt ggctggttct ccagctatta agaagggtat tttacaaacc 6660
gttaaggtcg ttgacgaatt ggtcaaagtt atgggtagac ataagccaga aaacatcgtt 6720
atcgaaatgg ctagagaaaa tcaaaccacc caaaagggtc aaaagaactc cagagaaaga 6780
atgaagagaa tcgaagaagg tatcaaagaa ttgggttccc aaattttgaa agaacaccca 6840
gttgaaaaca cccaattaca aaacgaaaag ttgtacttgt actacttgca aaacggtaga 6900
gatatgtacg ttgaccaaga attggacatc aacagattgt ctgattacga tgttgacgct 6960
atcgttccac aatctttttt gaaggatgac tccattgaca acaaggtctt gactagatcc 7020
gataagaata gaggtaagtc cgataacgtt ccatctgaag aagtcgttaa gaaaatgaag 7080
aactattgga gacaattatt gaacgccaag ttgatcaccc aaagaaagtt tgacaatttg 7140
accaaggctg aaagaggtgg tttgtctgaa ttggataagg caggtttcat caaaagacaa 7200
ttagtagaaa ccagacaaat caccaagcac gttgctcaaa ttttggatag tagaatgaac 7260
actaagtacg acgaaaacga caaattgatc agagaagtta aggtcattac cttgaagtcc 7320
aagttggttt ccgatttcag aaaggacttc caattctaca aggtcagaga aatcaacaac 7380
taccatcatg cacatgatgc ttacttgaat gctgttgttg gtactgcctt gattaagaag 7440
tatccaaagt tggaatccga atttgtctac ggtgattaca aggtttacga cgttagaaag 7500
atgatcgcca agtccgaaca agaaattggt aaagctactg ccaaatactt cttctactcc 7560
aatattatga atttctttaa gaccgaaatc actttggcca acggtgaaat tagaaaaaga 7620
ccattgattg aaactaatgg tgaaacaggt gaaatcgttt gggataaggg tagagatttt 7680
gccactgtta gaaaggtatt gtccatgcca caagtaaaca tcgtcaaaaa gaccgaagtt 7740
caaactggtg gtttctccaa agaatccatt ttgcctaaga gaaactccga taagttgatc 7800
gctagaaaaa aagactggga cccaaaaaag tacggtggtt ttgattctcc aactgttgct 7860
tactctgttt tggttgttgc taaggtcgaa aagggtaaga gtaagaagtt gaagtccgtc 7920
aaagaattat taggtatcac tatcatggaa agatcctcat tcgaaaagaa tcctatcgac 7980
tttttggaag ccaagggtta caaagaagtc aagaaggact tgatcattaa gttgccaaag 8040
tacagtttgt tcgaattgga aaatggtaga aagagaatgt tggcttctgc cggtgaatta 8100
caaaagggta atgaattggc tttgccatcc aagtacgtta atttcttata cttggcctcc 8160
cactacgaaa aattgaaagg ttctcctgaa gataacgaac aaaagcaatt atttgtcgaa 8220
caacacaagc actacttgga cgaaatcatt gaacaaattt ccgaattttc caaaagagtc 8280
attttggctg acgccaattt ggacaaagtt ttgtcagctt acaacaagca cagagataag 8340
ccaattagag aacaagctga aaacatcatt cacttgttca ctttgactaa cttgggtgct 8400
ccagctgctt ttaagtattt cgataccact atcgacagaa agagatacac ctctaccaaa 8460
gaagttttgg acgctacttt gatccaccaa tctattactg gtttgtacga aactagaatc 8520
gacttgtctc aattaggtgg tgatgaggga gctcccaaga aaaagcgcaa ggtaggtagt 8580
tccaagcttg gcggcagcgg cggcagcatg gaacgtgtga gaatgattaa tgtgcaaagg 8640
ctgttagaag ccgcagagtt tttagaaaga agagaaagag aatgcgaaca cgggtatgcc 8700
agttctttcc ctagcatgcc ctctcccaga ggcgagggta ggggtagtct gttgacttgt 8760
ggggacgttg aggagaatcc tggacccatg ccaaagaaga aaaggaaggt tcgtcctggg 8820
aacacgatta acatcgctaa gaacgacttc tctgacatcg aactggctgc tatcccgttc 8880
aacactctgg ctgaccatta cggtgagcgt ttagctcgcg aacagttggc ccttgagcat 8940
gagtcttacg agatgggtga agcacgcttc cgcaagatgt ttgagcgtca acttaaagct 9000
ggtgaggttg cggataacgc tgccgccaag cctctcatca ctaccctact ccctaagatg 9060
attgcacgca tcaacgactg gtttgaggaa gtgaaagcta agcgcggcaa gcgcccgaca 9120
gccttccagt tcctgcaaga aatcaagccg gaagccgtag cgtacatcac cattaagacc 9180
actctggctt gcctaaccag tgctgacaat acaaccgttc aggctgtagc aagcgcaatc 9240
ggtcgggcca ttgaggacga ggctcgcttc ggtcgtatcc gtgaccttga agctaagcac 9300
ttcaagaaaa acgttgagga acaactcaac aagcgcgtag ggcacgtcta caagaaagca 9360
tttatgcaag ttgtcgaggc tgacatgctc tctaagggtc tactcggtgg cgaggcgtgg 9420
tcttcgtggc ataaggaaga ctctattcat gtaggagtac gctgcatcga gatgctcatt 9480
gagtcaaccg gaatggttag cttacaccgc caaaatgctg gcgtagtagg tcaagactct 9540
gagactatcg aactcgcacc tgaatacgct gaggctatcg caacccgtgc aggtgcgctg 9600
gctggcatct ctccgatgtt ccaaccttgc gtagttcctc ctaagccgtg gactggcatt 9660
actggtggtg gctattgggc taacggtcgt cgtcctctgg cgctggtgcg tactcacagt 9720
aagaaagcac tgatgcgcta cgaagacgtt tacatgcctg aggtgtacaa agcgattaac 9780
attgcgcaaa acaccgcatg gaaaatcaac aagaaagtcc tagcggtcgc caacgtaatc 9840
accaagtgga agcattgtcc ggtcgaggac atccctgcga ttgagcgtga agaactcccg 9900
atgaaaccgg aagacatcga catgaatcct gaggctctca ccgcgtggaa acgtgctgcc 9960
gctgctgtgt accgcaagga caaggctcgc aagtctcgcc gtatcagcct tgagttcatg 10020
cttgagcaag ccaataagtt tgctaaccat aaggccatct ggttccctta caacatggac 10080
tggcgcggtc gtgtttacgc tgtgtcaatg ttcaacccgc aaggtaacga tatgaccaaa 10140
ggactgctta cgctggcgaa aggtaaacca atcggtaagg aaggttacta ctggctgaaa 10200
atccacggtg caaactgtgc gggtgtcgat aaggttccgt tccctgagcg catcaagttc 10260
attgaggaaa accacgagaa catcatggct tgcgctaagt ctccactgga gaacacttgg 10320
tgggctgagc aagattctcc gttctgcttc cttgcgttct gctttgagta cgctggggta 10380
cagcaccacg gcctgagcta taactgctcc cttccgctgg cgtttgacgg gtcttgctct 10440
ggcatccagc acttctccgc gatgctccga gatgaggtag gtggtcgcgc ggttaacttg 10500
cttcctagtg aaaccgttca ggacatctac gggattgttg ctaacacgat taacatcgct 10560
aagaacgaag aaagtcaacg agattctaca agcagacgca atcaatggga ccgataaata 10620
ggctaatatg aatgtatttg atctctattt tattaatacg aaacccctta ataattgata 10680
ttttcgatac atatttggca gtagttagct acgtaacaga gtattatttt catttcaagt 10740
tatgcatgaa ctctctaatt tcacatacca tgctaccact acccttggag gttttgttca 10800
tatcttttat aataaagcta aaaccgaaaa ggtgaaggga aaaaaaacta ttagagcctg 10860
tttcttgtat atagtaatat gtaatatttg cttcgtacgc ttagtcctca ttttactttt 10920
tttagaatga cctgttcccg acactatgta agatctagct tttaacatat tatggaaacc 10980
tgaaatgtaa aatctgaatt tttgtatatg tgtttatatt tgggtagttc ttttgaggaa 11040
agcatgcata gacttgctgt acgaacttta tgtgacttgt agtgacgctg tttcatgaga 11100
ctttagccct ttgaacatat tatcatatct cagcttgaaa tactatagat ttacttttgc 11160
agccatttct tggtgctcca aggttgtgcg tatctattac ttaatttctg tccttgccaa 11220
gttttgcagc agggcggtca caa 11243
<210> 7
<211> 6063
<212> DNA
<213> 人工序列
<220>
<223> Nucleotide sequence of the SNR52 gRNA expression vector
pRN1120-AG1
<220>
<221> misc_feature
<222> (2)..(21)
<223> guide-sequence (genomic target sequence)
<400> 7
catatattta ttaatcaaac agttttagag ctagaaatag caagttaaaa taaggctagt 60
ccgttatcaa cttgaaaaag tggcaccgag tcggtgcttt tgtttttttg ttttttatgt 120
ctggggggcc cggtacccag cttttgttcc ctttagtgag ggttaattcc gagcttggcg 180
taatcatggt catagctgtt tcctgtgtga aattgttatc cgctcacaat tccacacaac 240
ataggagccg gaagcataaa gtgtaaagcc tggggtgcct aatgagtgag gtaactcaca 300
ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa acctgtcgtg ccagctgcat 360
taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta ttgggcgctc ttccgcttcc 420
tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc agctcactca 480
aaggcggtaa tacggttatc cacagaatca ggggataacg caggaaagaa catgtgagca 540
aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg 600
ctcggccccc ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg 660
acaggactat aaagatacca ggcgttcccc cctggaagct ccctcgtgcg ctctcctgtt 720
ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc cttcgggaag cgtggcgctt 780
tctcaatgct cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc caagctgggc 840
tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt 900
gagtccaacc cggtaagaca cgacttatcg ccactggcag cagccactgg taacaggatt 960
agcagagcga ggtatgtagg cggtgctaca gagttcttga agtggtggcc taactacggc 1020
tacactagaa ggacagtatt tggtatctgc gctctgctga agccagttac cttcggaaaa 1080
agagttggta gctcttgatc cggcaaacaa accaccgctg gtagcggtgg tttttttgtt 1140
tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag aagatccttt gatcttttct 1200
acggggtctg acgctcagtg gaacgaaaac tcacgttaag ggattttggt catgagatta 1260
tcaaaaagga tcttcaccta gatcctttta aattaaaaat gaagttttaa atcaatctaa 1320
agtatatatg agtaaacttg gtctgacagt taccaatgct taatcagtga ggcacctatc 1380
tcagcgatct gtctatttcg ttcatccata gttgcctgac tgcccgtcgt gtagataact 1440
acgatacggg agggcttacc atctggcccc agtgctgcaa tgataccgcg agacccacgc 1500
tcaccggctc cagatttatc agcaataaac cagccagccg gaagggccga gcgcagaagt 1560
ggtcctgcaa ctttatccgc ctccatccag tctattaatt gttgccggga agctagagta 1620
agtagttcgc cagttaatag tttgcgcaac gttgttgcca ttgctacagg catcgtggtg 1680
tcacgctcgt cgtttggtat ggcttcattc agctccggtt cccaacgatc aaggcgagtt 1740
acatgatccc ccatgttgtg aaaaaaagcg gttagctcct tcggtcctcc gatcgttgtc 1800
agaagtaagt tggccgcagt gttatcactc atggttatgg cagcactgca taattctctt 1860
actgtcatgc catccgtaag atgcttttct gtgactggtg agtactcaac caagtcattc 1920
tgagaatagt gtatgcggcg accgagttgc tcttgcccgg cgtcaatacg ggataatacc 1980
gcgccacata gcagaacttt aaaagtgctc atcattggaa aacgttcttc ggggcgaaaa 2040
ctctcaagga tcttaccgct gttgagatcc agttcgatgt aacccactcg tgcacccaac 2100
tgatcttcag catcttttac tttcaccagc gtttctgggt gagcaaaaac aggaaggcaa 2160
aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt gaatactcat actcttcctt 2220
tttcaatatt attgaagcat ttatcagggt tattgtctca tgagcggata catatttgaa 2280
tgtatttaga aaaataaaca aataggggtt ccgcgcacat ttccccgaaa agtgccacct 2340
gacgtctaag aaaccattat tatcatgaca ttaacctata aaaataggcg tatcacgagg 2400
ccctttcgtc tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg 2460
gagacggtca cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg 2520
tcagcgggtg ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta 2580
ctgagagtgc accatatcga ctacgtcgta aggccgtttc tgacagagta aaattcttga 2640
gggaactttc accattatgg gaaatggttc aagaaggtat tgacttaaac tccatcaaat 2700
ggtcaggtca ttgagtgttt tttatttgtt gtattttttt ttttttagag aaaatcctcc 2760
aatatcaaat taggaatcgt agtttcatga ttttctgtta cacctaactt tttgtgtggt 2820
gccctcctcc ttgtcaatat taatgttaaa gtgcaattct ttttccttat cacgttgagc 2880
cattagtatc aatttgctta cctgtattcc tttactatcc tcctttttct ccttcttgat 2940
aaatgtatgt agattgcgta tatagtttcg tctaccctat gaacatattc cattttgtaa 3000
tttcgtgtcg tttctattat gaatttcatt tataaagttt atgtacacct aggatccgtc 3060
gacactggat ggcggcgtta gtatcgaatc gacagcagta tagcgaccag cattcacata 3120
cgattgacgc atgatattac tttctgcgca cttaacttcg catctgggca gatgatgtcg 3180
aggcgaaaaa aaatataaat cacgctaaca tttgattaaa atagaacaac tacaatataa 3240
aaaaactata caaatgacaa gttcttgaaa acaagaatct ttttattgtc agtactaggg 3300
gcagggcatg ctcatgtaga gcgcctgctc gccgtccgag gcggtgccgt cgtacagggc 3360
ggtgtccagg ccgcagaggg tgaaccccat ccgccggtac gcgtggatcg ccggtgcgtt 3420
gacgttggtg acctccagcc agaggtgccc ggcgccccgc tcgcgggcga actccgtcgc 3480
gagccccatc aacgcgcgcc cgaccccgtg cccccggtgc tccggggcga cctcgatgtc 3540
ctcgacggtc agccggcggt tccagccgga gtacgagacg accacgaagc ccgccaggtc 3600
gccgtcgtcc ccgtacgcga cgaacgtccg ggagtccggg tcgccgtcct ccccggcgtc 3660
cgattcgtcg tccgattcgt cgtcggggaa caccttggtc aggggcgggt ccaccggcac 3720
ctcccgcagg gtgaagccgt ccccggtggc ggtgacgcgg aagacggtgt cggtggtgaa 3780
ggacccatcc agtgcctcga tggcctcggc gtcccccggg acactggtgc ggtaccggta 3840
agccgtgtcg tcaagagtgg tcattttaca tggttgttta tgttcggatg tgatgtgaga 3900
actgtatcct agcaagattt taaaaggaag tatatgaaag aagaacctca gtggcaaatc 3960
ctaacctttt atatttctct acaggggcgc ggcgtgggga caattcaacg cgtctgtgag 4020
gggagcgttt ccctgctcgc aggtctgcag cgaggagccg taatttttgc ttcgcgccgt 4080
gcggccatca aaatgtatgg atgcaaatga ttatacatgg ggatgtatgg gctaaatgta 4140
cgggcgacag tcacatcatg cccctgagct gcgcacgtca agactgtcaa ggagggtatt 4200
ctgggcctcc atgtcgctgg ccgggtgacc cggcggggac gaggccttaa gttcgaacgt 4260
acgagctccg gcattgcgaa taccgctttc cacaaacatt gctcaaaagt atctctttgc 4320
tatatatctc tgtgctatat ccctatataa cctacccatc cacctttcgc tccttgaact 4380
tgcatctaaa ctcgacctct acatttttta tgtttatctc tagtattact ctttagacaa 4440
aaaaattgta gtaagaacta ttcatagagt gaatcgaaaa caatacgaaa atgtaaacat 4500
ttcctatacg tagtatatag agacaaaata gaagaaaccg ttcataattt tctgaccaat 4560
gaagaatcat caacgctatc actttctgtt cacaaagtat gcgcaatcca catcggtata 4620
gaatataatc ggggatgcct ttatcttgaa aaaatgcacc cgcagcttcg ctagtaatca 4680
gtaaacgcgg gaagtggagt caggcttttt ttatggaaga gaaaatagac accaaagtag 4740
ccttcttcta accttaacgg acctacagtg caaaaagtta tcaagagact gcattataga 4800
gcgcacaaag gagaaaaaaa gtaatctaag atgctttgtt agaaaaatag cgctctcggg 4860
atgcattttt gtagaacaaa aaagaagtat agattctttg ttggtaaaat agcgctctcg 4920
cgttgcattt ctgttctgta aaaatgcagc tcagattctt tgtttgaaaa attagcgctc 4980
tcgcgttgca tttttgtttt acaaaaatga agcacagatt cttcgttggt aaaatagcgc 5040
tttcgcgttg catttctgtt ctgtaaaaat gcagctcaga ttctttgttt gaaaaattag 5100
cgctctcgcg ttgcattttt gttctacaaa atgaagcaca gatgcttcgt taacaaagat 5160
atgctattga agtgcaagat ggaaacgcag aaaatgaacc ggggatgcga cgtgcaagat 5220
tacctatgca atagatgcaa tagtttctcc aggaaccgaa atacatacat tgtcttccgt 5280
aaagcgctag actatatatt attatacagg ttcaaatata ctatctgttt cagggaaaac 5340
tcccaggttc ggatgttcaa aattcaatga tgggtaacaa gtacgatcgt aaatctgtaa 5400
aacagtttgt cggatattag gctgtatctc ctcaaagcgt attcgaatat cattgagaag 5460
ctgcagcgtc acatcggata ataatgatgg cagccattgt agaagtgcct tttgcatttc 5520
tagtctcttt ctcggtctag ctagttttac tacatcgcga agatagaatc ttagatcaca 5580
ctgcctttgc tgagctggat caatagagta acaaaagagt ggtaaggcct cgttaaagga 5640
caaggacctg agcggaagtg tatcgtacag tagacggagt atactaggta tagtctatag 5700
tccgtggaat taattctcat gtttgacagc ttatcatcga taatccggag ctagcatgcg 5760
gccgctctag aactagtgga tcccccgggc tgcagtcttt gaaaagataa tgtatgatta 5820
tgctttcact catatttata cagaaacttg atgttttctt tcgagtatat acaaggtgat 5880
tacatgtacg tttgaagtac aactctagat tttgtagtgc cctcttgggc tagcggtaaa 5940
ggtgcgcatt ttttcacacc ctacaatgtt ctgttcaaaa gattttggtc aaacgctgta 6000
gaagtgaaag ttggtgcgca tgtttcggcg ttcgaaactt ctccgcagtg aaagataaat 6060
gat 6063
<210> 8
<211> 5906
<212> DNA
<213> 人工序列
<220>
<223> Nucleotide sequence of the T7 gRNA expression vector pAG701
<220>
<221> misc_feature
<222> (1)..(18)
<223> T7 promoter
<220>
<221> misc_feature
<222> (18)..(38)
<223> guide-sequence (genomic target sequence)
<220>
<221> misc_feature
<222> (39)..(118)
<223> guide RNA structural component
<220>
<221> misc_feature
<222> (119)..(186)
<223> self-cleaving ribozyme (HDVr)
<220>
<221> misc_feature
<222> (187)..(233)
<223> T7 terminator
<400> 8
taatacgact cactatagat atatttatta atcaaacagt tttagagcta gaaatagcaa 60
gttaaaataa ggctagtccg ttatcaactt gaaaaagtgg caccgagtcg gtgcttttgg 120
ccggcatggt cccagcctcc tcgctggcgc cggctgggca acatgcttcg gcatggcgaa 180
tgggacaaaa aatcaaactg gctcaccttc gggtgggcct ttttgcgttt ataggggggc 240
ccggtaccca gcttttgttc cctttagtga gggttaattc cgagcttggc gtaatcatgg 300
tcatagctgt ttcctgtgtg aaattgttat ccgctcacaa ttccacacaa cataggagcc 360
ggaagcataa agtgtaaagc ctggggtgcc taatgagtga ggtaactcac attaattgcg 420
ttgcgctcac tgcccgcttt ccagtcggga aacctgtcgt gccagctgca ttaatgaatc 480
ggccaacgcg cggggagagg cggtttgcgt attgggcgct cttccgcttc ctcgctcact 540
gactcgctgc gctcggtcgt tcggctgcgg cgagcggtat cagctcactc aaaggcggta 600
atacggttat ccacagaatc aggggataac gcaggaaaga acatgtgagc aaaaggccag 660
caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt ttttccatag gctcggcccc 720
cctgacgagc atcacaaaaa tcgacgctca agtcagaggt ggcgaaaccc gacaggacta 780
taaagatacc aggcgttccc ccctggaagc tccctcgtgc gctctcctgt tccgaccctg 840
ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa gcgtggcgct ttctcaatgc 900
tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac 960
gaaccccccg ttcagcccga ccgctgcgcc ttatccggta actatcgtct tgagtccaac 1020
ccggtaagac acgacttatc gccactggca gcagccactg gtaacaggat tagcagagcg 1080
aggtatgtag gcggtgctac agagttcttg aagtggtggc ctaactacgg ctacactaga 1140
aggacagtat ttggtatctg cgctctgctg aagccagtta ccttcggaaa aagagttggt 1200
agctcttgat ccggcaaaca aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag 1260
cagattacgc gcagaaaaaa aggatctcaa gaagatcctt tgatcttttc tacggggtct 1320
gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg tcatgagatt atcaaaaagg 1380
atcttcacct agatcctttt aaattaaaaa tgaagtttta aatcaatcta aagtatatat 1440
gagtaaactt ggtctgacag ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc 1500
tgtctatttc gttcatccat agttgcctga ctgcccgtcg tgtagataac tacgatacgg 1560
gagggcttac catctggccc cagtgctgca atgataccgc gagacccacg ctcaccggct 1620
ccagatttat cagcaataaa ccagccagcc ggaagggccg agcgcagaag tggtcctgca 1680
actttatccg cctccatcca gtctattaat tgttgccggg aagctagagt aagtagttcg 1740
ccagttaata gtttgcgcaa cgttgttgcc attgctacag gcatcgtggt gtcacgctcg 1800
tcgtttggta tggcttcatt cagctccggt tcccaacgat caaggcgagt tacatgatcc 1860
cccatgttgt gaaaaaaagc ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag 1920
ttggccgcag tgttatcact catggttatg gcagcactgc ataattctct tactgtcatg 1980
ccatccgtaa gatgcttttc tgtgactggt gagtactcaa ccaagtcatt ctgagaatag 2040
tgtatgcggc gaccgagttg ctcttgcccg gcgtcaatac gggataatac cgcgccacat 2100
agcagaactt taaaagtgct catcattgga aaacgttctt cggggcgaaa actctcaagg 2160
atcttaccgc tgttgagatc cagttcgatg taacccactc gtgcacccaa ctgatcttca 2220
gcatctttta ctttcaccag cgtttctggg tgagcaaaaa caggaaggca aaatgccgca 2280
aaaaagggaa taagggcgac acggaaatgt tgaatactca tactcttcct ttttcaatat 2340
tattgaagca tttatcaggg ttattgtctc atgagcggat acatatttga atgtatttag 2400
aaaaataaac aaataggggt tccgcgcaca tttccccgaa aagtgccacc tgacgtctaa 2460
gaaaccatta ttatcatgac attaacctat aaaaataggc gtatcacgag gccctttcgt 2520
ctcgcgcgtt tcggtgatga cggtgaaaac ctctgacaca tgcagctccc ggagacggtc 2580
acagcttgtc tgtaagcgga tgccgggagc agacaagccc gtcagggcgc gtcagcgggt 2640
gttggcgggt gtcggggctg gcttaactat gcggcatcag agcagattgt actgagagtg 2700
caccatatcg actacgtcgt aaggccgttt ctgacagagt aaaattcttg agggaacttt 2760
caccattatg ggaaatggtt caagaaggta ttgacttaaa ctccatcaaa tggtcaggtc 2820
attgagtgtt ttttatttgt tgtatttttt tttttttaga gaaaatcctc caatatcaaa 2880
ttaggaatcg tagtttcatg attttctgtt acacctaact ttttgtgtgg tgccctcctc 2940
cttgtcaata ttaatgttaa agtgcaattc tttttcctta tcacgttgag ccattagtat 3000
caatttgctt acctgtattc ctttactatc ctcctttttc tccttcttga taaatgtatg 3060
tagattgcgt atatagtttc gtctacccta tgaacatatt ccattttgta atttcgtgtc 3120
gtttctatta tgaatttcat ttataaagtt tatgtacacc taggatccgt cgacactgga 3180
tggcggcgtt agtatcgaat cgacagcagt atagcgacca gcattcacat acgattgacg 3240
catgatatta ctttctgcgc acttaacttc gcatctgggc agatgatgtc gaggcgaaaa 3300
aaaatataaa tcacgctaac atttgattaa aatagaacaa ctacaatata aaaaaactat 3360
acaaatgaca agttcttgaa aacaagaatc tttttattgt cagtactagg ggcagggcat 3420
gctcatgtag agcgcctgct cgccgtccga ggcggtgccg tcgtacaggg cggtgtccag 3480
gccgcagagg gtgaacccca tccgccggta cgcgtggatc gccggtgcgt tgacgttggt 3540
gacctccagc cagaggtgcc cggcgccccg ctcgcgggcg aactccgtcg cgagccccat 3600
caacgcgcgc ccgaccccgt gcccccggtg ctccggggcg acctcgatgt cctcgacggt 3660
cagccggcgg ttccagccgg agtacgagac gaccacgaag cccgccaggt cgccgtcgtc 3720
cccgtacgcg acgaacgtcc gggagtccgg gtcgccgtcc tccccggcgt ccgattcgtc 3780
gtccgattcg tcgtcgggga acaccttggt caggggcggg tccaccggca cctcccgcag 3840
ggtgaagccg tccccggtgg cggtgacgcg gaagacggtg tcggtggtga aggacccatc 3900
cagtgcctcg atggcctcgg cgtcccccgg gacactggtg cggtaccggt aagccgtgtc 3960
gtcaagagtg gtcattttac atggttgttt atgttcggat gtgatgtgag aactgtatcc 4020
tagcaagatt ttaaaaggaa gtatatgaaa gaagaacctc agtggcaaat cctaaccttt 4080
tatatttctc tacaggggcg cggcgtgggg acaattcaac gcgtctgtga ggggagcgtt 4140
tccctgctcg caggtctgca gcgaggagcc gtaatttttg cttcgcgccg tgcggccatc 4200
aaaatgtatg gatgcaaatg attatacatg gggatgtatg ggctaaatgt acgggcgaca 4260
gtcacatcat gcccctgagc tgcgcacgtc aagactgtca aggagggtat tctgggcctc 4320
catgtcgctg gccgggtgac ccggcgggga cgaggcctta agttcgaacg tacgagctcc 4380
ggcattgcga ataccgcttt ccacaaacat tgctcaaaag tatctctttg ctatatatct 4440
ctgtgctata tccctatata acctacccat ccacctttcg ctccttgaac ttgcatctaa 4500
actcgacctc tacatttttt atgtttatct ctagtattac tctttagaca aaaaaattgt 4560
agtaagaact attcatagag tgaatcgaaa acaatacgaa aatgtaaaca tttcctatac 4620
gtagtatata gagacaaaat agaagaaacc gttcataatt ttctgaccaa tgaagaatca 4680
tcaacgctat cactttctgt tcacaaagta tgcgcaatcc acatcggtat agaatataat 4740
cggggatgcc tttatcttga aaaaatgcac ccgcagcttc gctagtaatc agtaaacgcg 4800
ggaagtggag tcaggctttt tttatggaag agaaaataga caccaaagta gccttcttct 4860
aaccttaacg gacctacagt gcaaaaagtt atcaagagac tgcattatag agcgcacaaa 4920
ggagaaaaaa agtaatctaa gatgctttgt tagaaaaata gcgctctcgg gatgcatttt 4980
tgtagaacaa aaaagaagta tagattcttt gttggtaaaa tagcgctctc gcgttgcatt 5040
tctgttctgt aaaaatgcag ctcagattct ttgtttgaaa aattagcgct ctcgcgttgc 5100
atttttgttt tacaaaaatg aagcacagat tcttcgttgg taaaatagcg ctttcgcgtt 5160
gcatttctgt tctgtaaaaa tgcagctcag attctttgtt tgaaaaatta gcgctctcgc 5220
gttgcatttt tgttctacaa aatgaagcac agatgcttcg ttaacaaaga tatgctattg 5280
aagtgcaaga tggaaacgca gaaaatgaac cggggatgcg acgtgcaaga ttacctatgc 5340
aatagatgca atagtttctc caggaaccga aatacataca ttgtcttccg taaagcgcta 5400
gactatatat tattatacag gttcaaatat actatctgtt tcagggaaaa ctcccaggtt 5460
cggatgttca aaattcaatg atgggtaaca agtacgatcg taaatctgta aaacagtttg 5520
tcggatatta ggctgtatct cctcaaagcg tattcgaata tcattgagaa gctgcagcgt 5580
cacatcggat aataatgatg gcagccattg tagaagtgcc ttttgcattt ctagtctctt 5640
tctcggtcta gctagtttta ctacatcgcg aagatagaat cttagatcac actgcctttg 5700
ctgagctgga tcaatagagt aacaaaagag tggtaaggcc tcgttaaagg acaaggacct 5760
gagcggaagt gtatcgtaca gtagacggag tatactaggt atagtctata gtccgtggaa 5820
ttaattctca tgtttgacag cttatcatcg ataatccgga gctagcatgc ggccgctcta 5880
gaactagtgg atcccccggg ctgcag 5906
<210> 9
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> Nucleotide sequence of the 20-nt guide-sequence that targets the
Saccharomyces bayanus TDH3 (SbTDH3) promoter that was used for
constitutive expression of GFP in tester strains AG1 and AG2
<400> 9
atatatttat taatcaaaca 20
<210> 10
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> Nucleotide sequence of a random 20-nt guide-sequence that was
used for normalization
<400> 10
gctagatgga cttgccgctg 20
<210> 11
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> Nucleotide sequence of a strong T7 promoter that was used for
gRNA expression; this sequence replaced the T7 promoter sequence
that is indicated in bold in SEQ ID NO: 8
<400> 11
taatacgact cactataggg gaa 23
<210> 12
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> Nucleotide sequence of a medium strength T7 promoter that was
used for gRNA expression; this sequence replaced the T7 promoter
sequence that is indicated in bold in SEQ ID NO: 8
<400> 12
taatacgact cactataggg gaa 23
<210> 13
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> Nucleotide sequence of a weak strength T7 promoter that was used
for gRNA expression; this sequence replaced the T7 promoter
sequence that is indicated in bold in SEQ ID NO: 8
<400> 13
taatacgact cactaatact gaa 23
<210> 14
<211> 5441
<212> DNA
<213> 人工序列
<220>
<223> Nucleotide sequence of CAS9 including a C-terminal SV40 nuclear
localization signal codon pair optimized for expression in S.
cerevisiae. The sequence includes the Kl11 promoter from K.
lactis and GND2 terminator sequence from S. cerevisiae.
<400> 14
ttttcttttt ttgcggtcac ccccatgtgg cggggaggca gaggagtagg tagagcaacg 60
aatcctacta tttatccaaa ttagtctagg aactcttttt ctagattttt tagatttgag 120
ggcaagcgct gttaacgact cagaaatgta agcactacgg agtagaacga gaaatccgcc 180
ataggtggaa atcctagcaa aatcttgctt accctagcta gcctcaggta agctagcctt 240
agcctgtcaa atttttttca aaatttggta agtttctact agcaaagcaa acacggttca 300
acaaaccgaa aactccactc attatacgtg gaaaccgaaa caaaaaaaca aaaaccaaaa 360
tactcgccaa tgagaaagtt gctgcgtttc tactttcgag gaagaggaac tgagaggatt 420
gactacgaaa ggggcaaaaa cgagtcgtat tctcccatta ttgtctgcta ccacgcggtc 480
tagtagaata agcaaccagt caacgctaag acaggtaatc aaaataccag tctgctggct 540
acgggctagt ttttacctct tttagaaccc actgtaaaag tccgttgtaa agcccgttct 600
cactgttggc gttttttttt ttttggttta gtttcttatt tttcattttt ttctttcatg 660
accaaaaaca aacaaatctc gcgatttgta ctgcggccac tggggcgtgg ccaaaaaaat 720
gacaaattta gaaaccttag tttctgattt ttcctgttat gaggagatat gataaaaaat 780
attactgctt tattgttttt tttttatcta ctgaaataga gaaacttacc caaggaggag 840
gcaaaaaaaa gagtatatat acagcagcta ccattcagat tttaatatat tcttttctct 900
tcttctacac tattattata ataattttac tatattcatt tttagcttaa aacctcatag 960
aatattattc ttcagtcact cgcttaaata cttatcaaaa atggacaaga aatactctat 1020
tggtttggat atcgggacca actccgtcgg ttgggctgtc atcaccgacg aatacaaggt 1080
tccatccaag aaattcaagg tcttgggtaa cactgacaga cactctatca agaagaattt 1140
gatcggtgct ttgttgttcg actccggtga aaccgctgaa gctaccagat tgaagcgtac 1200
cgctcgtcgt agatacacta gacgtaaaaa ccgtatttgt tacttgcaag aaatcttttc 1260
taacgaaatg gccaaggttg acgactcttt cttccacaga ttggaagaat ctttcttggt 1320
tgaagaagac aagaagcacg aaagacatcc aatcttcggt aacatcgttg acgaagttgc 1380
ttaccacgaa aaatacccta ccatctacca tttgagaaag aagttggtcg attccaccga 1440
caaggctgat ttgagattga tctatttggc cttggctcac atgatcaagt tcagaggtca 1500
cttcttgatt gaaggtgact tgaacccaga caactctgac gtcgacaaat tgttcatcca 1560
attggtccaa acctacaacc aattattcga ggaaaaccca attaacgctt ctggtgttga 1620
tgctaaggcc atcttatctg cccgtttgtc caagtctaga cgtttggaaa acttgattgc 1680
tcaattgcct ggtgaaaaga aaaacggttt gttcggtaac ttgatcgctt tgtccttggg 1740
tttgacccca aacttcaagt ccaacttcga cttggctgaa gatgccaagt tgcaattgtc 1800
caaggacacc tacgacgacg acttagacaa cttgttggct caaatcggtg accaatacgc 1860
cgacttgttc ttggctgcca aaaacttatc tgacgctatc ttgttgtctg acatcttgag 1920
agttaacact gaaattacca aggctccatt gtctgcttct atgatcaaaa gatacgacga 1980
acaccaccaa gatctgactt tgttgaaggc tttggttaga caacaattgc cagaaaagta 2040
caaggaaatc ttcttcgacc aatccaaaaa tggttacgcc ggttacattg acggtggtgc 2100
ttctcaggaa gaattctaca agttcatcaa gccaattttg gaaaagatgg atggtactga 2160
agaattattg gttaagttga acagagaaga cttattgaga aagcaacgta ccttcgataa 2220
cggttctatc ccacaccaaa tccacttggg tgaattgcac gccattttga gaagacagga 2280
agatttctat ccattcctaa aggacaacag agaaaagatc gaaaagatct taactttcag 2340
aatcccatac tacgtcggtc cattggccag aggtaattct agattcgctt ggatgaccag 2400
aaagtctgaa gaaaccatca ccccatggaa cttcgaagaa gtcgtcgaca agggtgcttc 2460
tgcccaatct ttcatcgaaa gaatgaccaa ctttgataag aacttgccaa acgagaaggt 2520
cttgccaaag cactctttgt tgtacgaata cttcaccgtc tacaacgaat taaccaaggt 2580
taaatacgtt actgaaggta tgagaaagcc agctttccta tccggtgaac aaaagaaggc 2640
tattgttgac ttgttgttta agaccaacag aaaggtcact gttaagcaat tgaaggaaga 2700
ctacttcaag aagattgaat gtttcgattc cgtcgaaatc tccggtgttg aagaccgttt 2760
caatgcttct ttgggcacct accacgattt gttaaagatc atcaaggaca aggacttttt 2820
agataacgaa gaaaacgaag acatcttgga agatatcgtt ttgaccttga ctcttttcga 2880
ggacagagaa atgattgaag agagattgaa gacctacgct cacttgttcg acgataaagt 2940
tatgaagcaa ctaaagagaa gaagatacac tggttggggt agattgtcca gaaagttgat 3000
taacggtatc agagacaagc aatccggtaa gactatttta gactttttga aatccgatgg 3060
tttcgctaac agaaacttta tgcaattgat tcacgacgat tctttgactt tcaaggaaga 3120
cattcaaaaa gcccaagtct ctggtcaagg tgattctttg cacgaacaca tcgctaactt 3180
ggctggttct ccagctatta agaagggtat cttacaaacc gtcaaggtcg ttgatgaatt 3240
ggtcaaagtc atgggtagac acaagccaga aaatattgtc atcgaaatgg ctagagaaaa 3300
ccaaactact caaaagggtc aaaagaactc tagagaacgt atgaagagaa ttgaagaagg 3360
tatcaaggag ttgggttctc aaattttgaa agaacaccca gtcgaaaaca ctcaattaca 3420
aaacgaaaag ctatacttgt actacttgca aaacggtcgt gacatgtacg tcgaccaaga 3480
attggatatc aacagattgt ctgactacga tgtcgatcat atcgtcccac aatcgttctt 3540
gaaggacgat tccattgaca acaaagtttt gactagatct gacaagaaca gaggtaagtc 3600
tgataacgtt ccatctgaag aagttgttaa gaagatgaag aactactgga gacaattgtt 3660
gaatgctaag ttgatcactc aaagaaagtt cgacaacttg accaaggctg aaagaggtgg 3720
tttgtccgaa ttggacaaag ccggtttcat caagagacaa ttagtcgaaa ctagacaaat 3780
caccaagcat gttgctcaaa tcttggattc cagaatgaac actaagtacg atgaaaacga 3840
caaactaatt agagaagtta aggtcatcac tttgaagtct aagttggttt ctgacttcag 3900
aaaggacttc caattttaca aggtcagaga aatcaacaac taccatcacg ctcacgatgc 3960
ctacttgaac gctgttgtcg gtactgcctt aatcaaaaag tacccaaagt tggaatctga 4020
attcgtttac ggtgactaca aggtttacga tgttagaaag atgatcgcca agtctgaaca 4080
agaaattggt aaggccactg ctaagtactt cttctactct aacatcatga actttttcaa 4140
gactgaaatc actttagcta acggtgaaat tagaaagcgt ccattgattg aaaccaatgg 4200
tgaaactggt gaaattgtct gggacaaggg tagagatttc gctaccgtca gaaaggtttt 4260
gtctatgcca caagttaaca tcgtcaagaa gactgaagtt caaactggtg gtttctctaa 4320
ggaatccatt ttgccaaaga gaaactctga caagttgatt gctagaaaga aggactggga 4380
tcctaagaag tacggtggtt tcgactctcc aactgttgct tactccgttt tggtcgttgc 4440
taaggttgaa aagggtaagt ctaagaagtt gaagtctgtt aaggaattgt tgggtatcac 4500
catcatggaa agatcctcct tcgaaaagaa cccaatcgac tttttggaag ctaagggtta 4560
caaggaagtc aagaaggatt tgatcattaa gttaccaaaa tactccttgt tcgaattgga 4620
aaacggtaga aagagaatgt tggcctccgc tggtgaacta caaaaaggta acgaattggc 4680
tttaccatct aagtacgtta acttcttgta cttggcttcc cactacgaaa agttgaaagg 4740
ttccccagaa gacaacgaac aaaagcaatt gtttgttgaa caacacaagc actacttgga 4800
tgaaattatt gaacaaatct ccgaattctc caagagagtc attttggctg atgctaactt 4860
agataaggtt ttatccgctt acaacaagca cagagacaaa ccaatcagag aacaagctga 4920
aaacatcatt catttgttca ctttaaccaa cttgggtgct ccagctgctt tcaaatactt 4980
cgacactacc attgacagaa agagatacac ttccaccaaa gaagttttag atgctacttt 5040
gattcaccaa tctattaccg gtttgtacga aaccagaatt gacttgtctc aattgggtgg 5100
tgattccaga gctgatccaa agaagaagag aaaggtgtaa aggagttaaa ggcaaagttt 5160
tcttttctag agccgttccc acaaataatt atacgtatat gcttcttttc gtttactata 5220
tatctatatt tacaagcctt tattcactga tgcaatttgt ttccaaatac ttttttggag 5280
atctcataac tagatatcat gatggcgcaa cttggcgcta tcttaattac tctggctgcc 5340
aggcccgtgt agagggccgc aagaccttct gtacgccata tagtctctaa gaacttgaac 5400
aagtttctag acctattgcc gcctttcgga tcgctattgt t 5441
<210> 15
<211> 11742
<212> DNA
<213> 人工序列
<220>
<223> Nucleotide sequence of vector pCSN061.
<400> 15
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accataaacg acattactat atatataata taggaagcat ttaatagaca gcatcgtaat 240
atatgtgtac tttgcagtta tgacgccaga tggcagtagt ggaagatatt ctttattgaa 300
aaatagcttg tcaccttacg tacaatcttg atccggagct tttctttttt tgccgattaa 360
gaattaattc ggtcgaaaaa agaaaaggag agggccaaga gggagggcat tggtgactat 420
tgagcacgtg agtatacgtg attaagcaca caaaggcagc ttggagtatg tctgttatta 480
atttcacagg tagttctggt ccattggtga aagtttgcgg cttgcagagc acagaggccg 540
cagaatgtgc tctagattcc gatgctgact tgctgggtat tatatgtgtg cccaatagaa 600
agagaacaat tgacccggtt attgcaagga aaatttcaag tcttgtaaaa gcatataaaa 660
atagttcagg cactccgaaa tacttggttg gcgtgtttcg taatcaacct aaggaggatg 720
ttttggctct ggtcaatgat tacggcattg atatcgtcca actgcatgga gatgagtcgt 780
ggcaagaata ccaagagttc ctcggtttgc cagttattaa aagactcgta tttccaaaag 840
actgcaacat actactcagt gcagcttcac agaaacctca ttcgtttatt cccttgtttg 900
attcagaagc aggtgggaca ggtgaacttt tggattggaa ctcgatttct gactgggttg 960
gaaggcaaga gagccccgaa agcttacatt ttatgttagc tggtggactg acgccagaaa 1020
atgttggtga tgcgcttaga ttaaatggcg ttattggtgt tgatgtaagc ggaggtgtgg 1080
agacaaatgg tgtaaaagac tctaacaaaa tagcaaattt cgtcaaaaat gctaagaaat 1140
aggttattac tgagtagtat ttatttaagt attgtttgtg cacttgccta tgcggtgtga 1200
aataccgcac agatgcgtaa ggagaaaata ccgcatcagg aaattgtaaa cgttaatatt 1260
ttgttaaaat tcgcgttaaa tttttgttaa atcagctcat tttttaacca ataggccgaa 1320
atcggcaaaa tcccttataa atcaaaagaa tagaccgaga tagggttgag tgttgttcca 1380
gtttggaaca agagtccact attaaagaac gtggactcca acgtcaaagg gcgaaaaacc 1440
gtctatcagg gcgatggccc actacgtgaa ccatcaccct aatcaagttt tttggggtcg 1500
aggtgccgta aagcactaaa tcggaaccct aaagggagcc cccgatttag agcttgacgg 1560
ggaaagccgg cgaacgtggc gagaaaggaa gggaagaaag cgaaaggagc gggcgctagg 1620
gcgctggcaa gtgtagcggt cacgctgcgc gtaaccacca cacccgccgc gcttaatgcg 1680
ccgctacagg gcgcgtcgcg ccattcgcca ttcaggctgc gcaactgttg ggaagggcga 1740
tcggtgcggg cctcttcgct attacgccag ctggcgaaag ggggatgtgc tgcaaggcga 1800
ttaagttggg taacgccagg gttttcccag tcacgacgtt gtaaaacgac ggccagtgag 1860
cgcgcgtaat acgactcact atagggcgaa ttgggtacct tttctttttt tgcggtcacc 1920
cccatgtggc ggggaggcag aggagtaggt agagcaacga atcctactat ttatccaaat 1980
tagtctagga actctttttc tagatttttt agatttgagg gcaagcgctg ttaacgactc 2040
agaaatgtaa gcactacgga gtagaacgag aaatccgcca taggtggaaa tcctagcaaa 2100
atcttgctta ccctagctag cctcaggtaa gctagcctta gcctgtcaaa tttttttcaa 2160
aatttggtaa gtttctacta gcaaagcaaa cacggttcaa caaaccgaaa actccactca 2220
ttatacgtgg aaaccgaaac aaaaaaacaa aaaccaaaat actcgccaat gagaaagttg 2280
ctgcgtttct actttcgagg aagaggaact gagaggattg actacgaaag gggcaaaaac 2340
gagtcgtatt ctcccattat tgtctgctac cacgcggtct agtagaataa gcaaccagtc 2400
aacgctaaga caggtaatca aaataccagt ctgctggcta cgggctagtt tttacctctt 2460
ttagaaccca ctgtaaaagt ccgttgtaaa gcccgttctc actgttggcg tttttttttt 2520
tttggtttag tttcttattt ttcatttttt tctttcatga ccaaaaacaa acaaatctcg 2580
cgatttgtac tgcggccact ggggcgtggc caaaaaaatg acaaatttag aaaccttagt 2640
ttctgatttt tcctgttatg aggagatatg ataaaaaata ttactgcttt attgtttttt 2700
ttttatctac tgaaatagag aaacttaccc aaggaggagg caaaaaaaag agtatatata 2760
cagcagctac cattcagatt ttaatatatt cttttctctt cttctacact attattataa 2820
taattttact atattcattt ttagcttaaa acctcataga atattattct tcagtcactc 2880
gcttaaatac ttatcaaaaa tggacaagaa atactctatt ggtttggata tcgggaccaa 2940
ctccgtcggt tgggctgtca tcaccgacga atacaaggtt ccatccaaga aattcaaggt 3000
cttgggtaac actgacagac actctatcaa gaagaatttg atcggtgctt tgttgttcga 3060
ctccggtgaa accgctgaag ctaccagatt gaagcgtacc gctcgtcgta gatacactag 3120
acgtaaaaac cgtatttgtt acttgcaaga aatcttttct aacgaaatgg ccaaggttga 3180
cgactctttc ttccacagat tggaagaatc tttcttggtt gaagaagaca agaagcacga 3240
aagacatcca atcttcggta acatcgttga cgaagttgct taccacgaaa aataccctac 3300
catctaccat ttgagaaaga agttggtcga ttccaccgac aaggctgatt tgagattgat 3360
ctatttggcc ttggctcaca tgatcaagtt cagaggtcac ttcttgattg aaggtgactt 3420
gaacccagac aactctgacg tcgacaaatt gttcatccaa ttggtccaaa cctacaacca 3480
attattcgag gaaaacccaa ttaacgcttc tggtgttgat gctaaggcca tcttatctgc 3540
ccgtttgtcc aagtctagac gtttggaaaa cttgattgct caattgcctg gtgaaaagaa 3600
aaacggtttg ttcggtaact tgatcgcttt gtccttgggt ttgaccccaa acttcaagtc 3660
caacttcgac ttggctgaag atgccaagtt gcaattgtcc aaggacacct acgacgacga 3720
cttagacaac ttgttggctc aaatcggtga ccaatacgcc gacttgttct tggctgccaa 3780
aaacttatct gacgctatct tgttgtctga catcttgaga gttaacactg aaattaccaa 3840
ggctccattg tctgcttcta tgatcaaaag atacgacgaa caccaccaag atctgacttt 3900
gttgaaggct ttggttagac aacaattgcc agaaaagtac aaggaaatct tcttcgacca 3960
atccaaaaat ggttacgccg gttacattga cggtggtgct tctcaggaag aattctacaa 4020
gttcatcaag ccaattttgg aaaagatgga tggtactgaa gaattattgg ttaagttgaa 4080
cagagaagac ttattgagaa agcaacgtac cttcgataac ggttctatcc cacaccaaat 4140
ccacttgggt gaattgcacg ccattttgag aagacaggaa gatttctatc cattcctaaa 4200
ggacaacaga gaaaagatcg aaaagatctt aactttcaga atcccatact acgtcggtcc 4260
attggccaga ggtaattcta gattcgcttg gatgaccaga aagtctgaag aaaccatcac 4320
cccatggaac ttcgaagaag tcgtcgacaa gggtgcttct gcccaatctt tcatcgaaag 4380
aatgaccaac tttgataaga acttgccaaa cgagaaggtc ttgccaaagc actctttgtt 4440
gtacgaatac ttcaccgtct acaacgaatt aaccaaggtt aaatacgtta ctgaaggtat 4500
gagaaagcca gctttcctat ccggtgaaca aaagaaggct attgttgact tgttgtttaa 4560
gaccaacaga aaggtcactg ttaagcaatt gaaggaagac tacttcaaga agattgaatg 4620
tttcgattcc gtcgaaatct ccggtgttga agaccgtttc aatgcttctt tgggcaccta 4680
ccacgatttg ttaaagatca tcaaggacaa ggacttttta gataacgaag aaaacgaaga 4740
catcttggaa gatatcgttt tgaccttgac tcttttcgag gacagagaaa tgattgaaga 4800
gagattgaag acctacgctc acttgttcga cgataaagtt atgaagcaac taaagagaag 4860
aagatacact ggttggggta gattgtccag aaagttgatt aacggtatca gagacaagca 4920
atccggtaag actattttag actttttgaa atccgatggt ttcgctaaca gaaactttat 4980
gcaattgatt cacgacgatt ctttgacttt caaggaagac attcaaaaag cccaagtctc 5040
tggtcaaggt gattctttgc acgaacacat cgctaacttg gctggttctc cagctattaa 5100
gaagggtatc ttacaaaccg tcaaggtcgt tgatgaattg gtcaaagtca tgggtagaca 5160
caagccagaa aatattgtca tcgaaatggc tagagaaaac caaactactc aaaagggtca 5220
aaagaactct agagaacgta tgaagagaat tgaagaaggt atcaaggagt tgggttctca 5280
aattttgaaa gaacacccag tcgaaaacac tcaattacaa aacgaaaagc tatacttgta 5340
ctacttgcaa aacggtcgtg acatgtacgt cgaccaagaa ttggatatca acagattgtc 5400
tgactacgat gtcgatcata tcgtcccaca atcgttcttg aaggacgatt ccattgacaa 5460
caaagttttg actagatctg acaagaacag aggtaagtct gataacgttc catctgaaga 5520
agttgttaag aagatgaaga actactggag acaattgttg aatgctaagt tgatcactca 5580
aagaaagttc gacaacttga ccaaggctga aagaggtggt ttgtccgaat tggacaaagc 5640
cggtttcatc aagagacaat tagtcgaaac tagacaaatc accaagcatg ttgctcaaat 5700
cttggattcc agaatgaaca ctaagtacga tgaaaacgac aaactaatta gagaagttaa 5760
ggtcatcact ttgaagtcta agttggtttc tgacttcaga aaggacttcc aattttacaa 5820
ggtcagagaa atcaacaact accatcacgc tcacgatgcc tacttgaacg ctgttgtcgg 5880
tactgcctta atcaaaaagt acccaaagtt ggaatctgaa ttcgtttacg gtgactacaa 5940
ggtttacgat gttagaaaga tgatcgccaa gtctgaacaa gaaattggta aggccactgc 6000
taagtacttc ttctactcta acatcatgaa ctttttcaag actgaaatca ctttagctaa 6060
cggtgaaatt agaaagcgtc cattgattga aaccaatggt gaaactggtg aaattgtctg 6120
ggacaagggt agagatttcg ctaccgtcag aaaggttttg tctatgccac aagttaacat 6180
cgtcaagaag actgaagttc aaactggtgg tttctctaag gaatccattt tgccaaagag 6240
aaactctgac aagttgattg ctagaaagaa ggactgggat cctaagaagt acggtggttt 6300
cgactctcca actgttgctt actccgtttt ggtcgttgct aaggttgaaa agggtaagtc 6360
taagaagttg aagtctgtta aggaattgtt gggtatcacc atcatggaaa gatcctcctt 6420
cgaaaagaac ccaatcgact ttttggaagc taagggttac aaggaagtca agaaggattt 6480
gatcattaag ttaccaaaat actccttgtt cgaattggaa aacggtagaa agagaatgtt 6540
ggcctccgct ggtgaactac aaaaaggtaa cgaattggct ttaccatcta agtacgttaa 6600
cttcttgtac ttggcttccc actacgaaaa gttgaaaggt tccccagaag acaacgaaca 6660
aaagcaattg tttgttgaac aacacaagca ctacttggat gaaattattg aacaaatctc 6720
cgaattctcc aagagagtca ttttggctga tgctaactta gataaggttt tatccgctta 6780
caacaagcac agagacaaac caatcagaga acaagctgaa aacatcattc atttgttcac 6840
tttaaccaac ttgggtgctc cagctgcttt caaatacttc gacactacca ttgacagaaa 6900
gagatacact tccaccaaag aagttttaga tgctactttg attcaccaat ctattaccgg 6960
tttgtacgaa accagaattg acttgtctca attgggtggt gattccagag ctgatccaaa 7020
gaagaagaga aaggtgtaaa ggagttaaag gcaaagtttt cttttctaga gccgttccca 7080
caaataatta tacgtatatg cttcttttcg tttactatat atctatattt acaagccttt 7140
attcactgat gcaatttgtt tccaaatact tttttggaga tctcataact agatatcatg 7200
atggcgcaac ttggcgctat cttaattact ctggctgcca ggcccgtgta gagggccgca 7260
agaccttctg tacgccatat agtctctaag aacttgaaca agtttctaga cctattgccg 7320
cctttcggat cgctattgtt gcggccgcca gctgaagctt cgtacgctgc aggtcgacga 7380
attctaccgt tcgtataatg tatgctatac gaagttatag atctgtttag cttgcctcgt 7440
ccccgccggg tcacccggcc agcgacatgg aggcccagaa taccctcctt gacagtcttg 7500
acgtgcgcag ctcaggggca tgatgtgact gtcgcccgta catttagccc atacatcccc 7560
atgtataatc atttgcatcc atacattttg atggccgcac ggcgcgaagc aaaaattacg 7620
gctcctcgct gcagacctgc gagcagggaa acgctcccct cacagacgcg ttgaattgtc 7680
cccacgccgc gcccctgtag agaaatataa aaggttagga tttgccactg aggttcttct 7740
ttcatatact tccttttaaa atcttgctag gatacagttc tcacatcaca tccgaacata 7800
aacaaccatg ggtaaggaaa agactcacgt ttcgaggccg cgattaaatt ccaacatgga 7860
tgctgattta tatgggtata aatgggctcg cgataatgtc gggcaatcag gtgcgacaat 7920
ctatcgattg tatgggaagc ccgatgcgcc agagttgttt ctgaaacatg gcaaaggtag 7980
cgttgccaat gatgttacag atgagatggt cagactaaac tggctgacgg aatttatgcc 8040
tcttccgacc atcaagcatt ttatccgtac tcctgatgat gcatggttac tcaccactgc 8100
gatccccggc aaaacagcat tccaggtatt agaagaatat cctgattcag gtgaaaatat 8160
tgttgatgcg ctggcagtgt tcctgcgccg gttgcattcg attcctgttt gtaattgtcc 8220
ttttaacagc gatcgcgtat ttcgtctcgc tcaggcgcaa tcacgaatga ataacggttt 8280
ggttgatgcg agtgattttg atgacgagcg taatggctgg cctgttgaac aagtctggaa 8340
agaaatgcat aagcttttgc cattctcacc ggattcagtc gtcactcatg gtgatttctc 8400
acttgataac cttatttttg acgaggggaa attaataggt tgtattgatg ttggacgagt 8460
cggaatcgca gaccgatacc aggatcttgc catcctatgg aactgcctcg gtgagttttc 8520
tccttcatta cagaaacggc tttttcaaaa atatggtatt gataatcctg atatgaataa 8580
attgcagttt catttgatgc tcgatgagtt tttctaatca gtactgacaa taaaaagatt 8640
cttgttttca agaacttgtc atttgtatag tttttttata ttgtagttgt tctattttaa 8700
tcaaatgtta gcgtgattta tatttttttt cgcctcgaca tcatctgccc agatgcgaag 8760
ttaagtgcgc agaaagtaat atcatgcgtc aatcgtatgt gaatgctggt cgctatactg 8820
ctgtcgattc gatactaacg ccgccatcca gtgtcgaaaa cgagctcata acttcgtata 8880
atgtatgcta tacgaacggt agaattcgaa tcagatccac tagtggccta tgcggccgcc 8940
accgcggtgg agctccagct tttgttccct ttagtgaggg ttaattgcgc gcttggcgta 9000
atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc cacacaacat 9060
aggagccgga agcataaagt gtaaagcctg gggtgcctaa tgagtgaggt aactcacatt 9120
aattgcgttg cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc agctgcatta 9180
atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt ccgcttcctc 9240
gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa 9300
ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa 9360
aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct 9420
ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac 9480
aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc 9540
gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg tggcgctttc 9600
tcatagctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg 9660
tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga 9720
gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta acaggattag 9780
cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta actacggcta 9840
cactagaagg acagtatttg gtatctgcgc tctgctgaag ccagttacct tcggaaaaag 9900
agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt tttttgtttg 9960
caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga tcttttctac 10020
ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca tgagattatc 10080
aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat caatctaaag 10140
tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg cacctatctc 10200
agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt agataactac 10260
gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag acccacgctc 10320
accggctcca gatttatcag caataaacca gccagccgga agggccgagc gcagaagtgg 10380
tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag ctagagtaag 10440
tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctacaggca tcgtggtgtc 10500
acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa ggcgagttac 10560
atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga tcgttgtcag 10620
aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata attctcttac 10680
tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca agtcattctg 10740
agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaatacggg ataataccgc 10800
gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg ggcgaaaact 10860
ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg cacccaactg 10920
atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag gaaggcaaaa 10980
tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac tcttcctttt 11040
tcaatattat tgaagcattt atcagggtta ttgtctcatg agcggataca tatttgaatg 11100
tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag tgccacctgg 11160
gtccttttca tcacgtgcta taaaaataat tataatttaa attttttaat ataaatatat 11220
aaattaaaaa tagaaagtaa aaaaagaaat taaagaaaaa atagtttttg ttttccgaag 11280
atgtaaaaga ctctaggggg atcgccaaca aatactacct tttatcttgc tcttcctgct 11340
ctcaggtatt aatgccgaat tgtttcatct tgtctgtgta gaagaccaca cacgaaaatc 11400
ctgtgatttt acattttact tatcgttaat cgaatgtata tctatttaat ctgcttttct 11460
tgtctaataa atatatatgt aaagtacgct ttttgttgaa attttttaaa cctttgttta 11520
tttttttttc ttcattccgt aactcttcta ccttctttat ttactttcta aaatccaaat 11580
acaaaacata aaaataaata aacacagagt aaattcccaa attattccat cattaaaaga 11640
tacgaggcgc gtgtaagtta caggcaagcg atccgtccta agaaaccatt attatcatga 11700
cattaaccta taaaaatagg cgtatcacga ggccctttcg tc 11742
<210> 16
<211> 5712
<212> DNA
<213> 人工序列
<220>
<223> Nucleotide sequence of vector pRN1120
<400> 16
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accatatcga ctacgtcgta aggccgtttc tgacagagta aaattcttga gggaactttc 240
accattatgg gaaatggttc aagaaggtat tgacttaaac tccatcaaat ggtcaggtca 300
ttgagtgttt tttatttgtt gtattttttt ttttttagag aaaatcctcc aatatcaaat 360
taggaatcgt agtttcatga ttttctgtta cacctaactt tttgtgtggt gccctcctcc 420
ttgtcaatat taatgttaaa gtgcaattct ttttccttat cacgttgagc cattagtatc 480
aatttgctta cctgtattcc tttactatcc tcctttttct ccttcttgat aaatgtatgt 540
agattgcgta tatagtttcg tctaccctat gaacatattc cattttgtaa tttcgtgtcg 600
tttctattat gaatttcatt tataaagttt atgtacacct aggatccgtc gacactggat 660
ggcggcgtta gtatcgaatc gacagcagta tagcgaccag cattcacata cgattgacgc 720
atgatattac tttctgcgca cttaacttcg catctgggca gatgatgtcg aggcgaaaaa 780
aaatataaat cacgctaaca tttgattaaa atagaacaac tacaatataa aaaaactata 840
caaatgacaa gttcttgaaa acaagaatct ttttattgtc agtactaggg gcagggcatg 900
ctcatgtaga gcgcctgctc gccgtccgag gcggtgccgt cgtacagggc ggtgtccagg 960
ccgcagaggg tgaaccccat ccgccggtac gcgtggatcg ccggtgcgtt gacgttggtg 1020
acctccagcc agaggtgccc ggcgccccgc tcgcgggcga actccgtcgc gagccccatc 1080
aacgcgcgcc cgaccccgtg cccccggtgc tccggggcga cctcgatgtc ctcgacggtc 1140
agccggcggt tccagccgga gtacgagacg accacgaagc ccgccaggtc gccgtcgtcc 1200
ccgtacgcga cgaacgtccg ggagtccggg tcgccgtcct ccccggcgtc cgattcgtcg 1260
tccgattcgt cgtcggggaa caccttggtc aggggcgggt ccaccggcac ctcccgcagg 1320
gtgaagccgt ccccggtggc ggtgacgcgg aagacggtgt cggtggtgaa ggacccatcc 1380
agtgcctcga tggcctcggc gtcccccggg acactggtgc ggtaccggta agccgtgtcg 1440
tcaagagtgg tcattttaca tggttgttta tgttcggatg tgatgtgaga actgtatcct 1500
agcaagattt taaaaggaag tatatgaaag aagaacctca gtggcaaatc ctaacctttt 1560
atatttctct acaggggcgc ggcgtgggga caattcaacg cgtctgtgag gggagcgttt 1620
ccctgctcgc aggtctgcag cgaggagccg taatttttgc ttcgcgccgt gcggccatca 1680
aaatgtatgg atgcaaatga ttatacatgg ggatgtatgg gctaaatgta cgggcgacag 1740
tcacatcatg cccctgagct gcgcacgtca agactgtcaa ggagggtatt ctgggcctcc 1800
atgtcgctgg ccgggtgacc cggcggggac gaggccttaa gttcgaacgt acgagctccg 1860
gcattgcgaa taccgctttc cacaaacatt gctcaaaagt atctctttgc tatatatctc 1920
tgtgctatat ccctatataa cctacccatc cacctttcgc tccttgaact tgcatctaaa 1980
ctcgacctct acatttttta tgtttatctc tagtattact ctttagacaa aaaaattgta 2040
gtaagaacta ttcatagagt gaatcgaaaa caatacgaaa atgtaaacat ttcctatacg 2100
tagtatatag agacaaaata gaagaaaccg ttcataattt tctgaccaat gaagaatcat 2160
caacgctatc actttctgtt cacaaagtat gcgcaatcca catcggtata gaatataatc 2220
ggggatgcct ttatcttgaa aaaatgcacc cgcagcttcg ctagtaatca gtaaacgcgg 2280
gaagtggagt caggcttttt ttatggaaga gaaaatagac accaaagtag ccttcttcta 2340
accttaacgg acctacagtg caaaaagtta tcaagagact gcattataga gcgcacaaag 2400
gagaaaaaaa gtaatctaag atgctttgtt agaaaaatag cgctctcggg atgcattttt 2460
gtagaacaaa aaagaagtat agattctttg ttggtaaaat agcgctctcg cgttgcattt 2520
ctgttctgta aaaatgcagc tcagattctt tgtttgaaaa attagcgctc tcgcgttgca 2580
tttttgtttt acaaaaatga agcacagatt cttcgttggt aaaatagcgc tttcgcgttg 2640
catttctgtt ctgtaaaaat gcagctcaga ttctttgttt gaaaaattag cgctctcgcg 2700
ttgcattttt gttctacaaa atgaagcaca gatgcttcgt taacaaagat atgctattga 2760
agtgcaagat ggaaacgcag aaaatgaacc ggggatgcga cgtgcaagat tacctatgca 2820
atagatgcaa tagtttctcc aggaaccgaa atacatacat tgtcttccgt aaagcgctag 2880
actatatatt attatacagg ttcaaatata ctatctgttt cagggaaaac tcccaggttc 2940
ggatgttcaa aattcaatga tgggtaacaa gtacgatcgt aaatctgtaa aacagtttgt 3000
cggatattag gctgtatctc ctcaaagcgt attcgaatat cattgagaag ctgcagcgtc 3060
acatcggata ataatgatgg cagccattgt agaagtgcct tttgcatttc tagtctcttt 3120
ctcggtctag ctagttttac tacatcgcga agatagaatc ttagatcaca ctgcctttgc 3180
tgagctggat caatagagta acaaaagagt ggtaaggcct cgttaaagga caaggacctg 3240
agcggaagtg tatcgtacag tagacggagt atactaggta tagtctatag tccgtggaat 3300
taattctcat gtttgacagc ttatcatcga taatccggag ctagcatgcg gccgctctag 3360
aactagtgga tcccccgggc tgcaggaatt cgatatcaag cttatcgata ccgtcgacct 3420
cgaggggggg cccggtaccc agcttttgtt ccctttagtg agggttaatt ccgagcttgg 3480
cgtaatcatg gtcatagctg tttcctgtgt gaaattgtta tccgctcaca attccacaca 3540
acataggagc cggaagcata aagtgtaaag cctggggtgc ctaatgagtg aggtaactca 3600
cattaattgc gttgcgctca ctgcccgctt tccagtcggg aaacctgtcg tgccagctgc 3660
attaatgaat cggccaacgc gcggggagag gcggtttgcg tattgggcgc tcttccgctt 3720
cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta tcagctcact 3780
caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag aacatgtgag 3840
caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg tttttccata 3900
ggctcggccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg tggcgaaacc 3960
cgacaggact ataaagatac caggcgttcc cccctggaag ctccctcgtg cgctctcctg 4020
ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga agcgtggcgc 4080
tttctcaatg ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc tccaagctgg 4140
gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt aactatcgtc 4200
ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact ggtaacagga 4260
ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg cctaactacg 4320
gctacactag aaggacagta tttggtatct gcgctctgct gaagccagtt accttcggaa 4380
aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt ggtttttttg 4440
tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct ttgatctttt 4500
ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg gtcatgagat 4560
tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt aaatcaatct 4620
aaagtatata tgagtaaact tggtctgaca gttaccaatg cttaatcagt gaggcaccta 4680
tctcagcgat ctgtctattt cgttcatcca tagttgcctg actgcccgtc gtgtagataa 4740
ctacgatacg ggagggctta ccatctggcc ccagtgctgc aatgataccg cgagacccac 4800
gctcaccggc tccagattta tcagcaataa accagccagc cggaagggcc gagcgcagaa 4860
gtggtcctgc aactttatcc gcctccatcc agtctattaa ttgttgccgg gaagctagag 4920
taagtagttc gccagttaat agtttgcgca acgttgttgc cattgctaca ggcatcgtgg 4980
tgtcacgctc gtcgtttggt atggcttcat tcagctccgg ttcccaacga tcaaggcgag 5040
ttacatgatc ccccatgttg tgaaaaaaag cggttagctc cttcggtcct ccgatcgttg 5100
tcagaagtaa gttggccgca gtgttatcac tcatggttat ggcagcactg cataattctc 5160
ttactgtcat gccatccgta agatgctttt ctgtgactgg tgagtactca accaagtcat 5220
tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata cgggataata 5280
ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa 5340
aactctcaag gatcttaccg ctgttgagat ccagttcgat gtaacccact cgtgcaccca 5400
actgatcttc agcatctttt actttcacca gcgtttctgg gtgagcaaaa acaggaaggc 5460
aaaatgccgc aaaaaaggga ataagggcga cacggaaatg ttgaatactc atactcttcc 5520
tttttcaata ttattgaagc atttatcagg gttattgtct catgagcgga tacatatttg 5580
aatgtattta gaaaaataaa caaatagggg ttccgcgcac atttccccga aaagtgccac 5640
ctgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg cgtatcacga 5700
ggccctttcg tc 5712
<210> 17
<211> 3705
<212> DNA
<213> 人工序列
<220>
<223> Nucleotide sequence of T7-RNA polymerase (T7 RNAP) expression
unit. The sequence includes the codon pair optimized T7 RNAP gene
under control of TDH3 promoter and EnoI terminator sequence for
expression in S. cerevisiae
<400> 17
cgagctcata acttcgtata atgtatgcta tacgaacggt agaattcgaa tcagatccac 60
tagtgtgctt agtcaaaaaa ttagcctttt aattctgctg taacccgtac atgcccaaaa 120
tagggggcgg gttacacaga atatataaca tcgtaggtgt ctgggtgaac agtttattcc 180
tggcatccac taaatataat ggagcccgct ttttaagctg gcatccagaa aaaaaaagaa 240
tcccagcacc aaaatattgt tttcttcacc aaccatcagt tcataggtcc attctcttag 300
cgcaactaca gagaacaggg gcacaaacag gcaaaaaacg ggcacaacct caatggagtg 360
atgcaacctg cctggagtaa atgatgacac aaggcaattg acccacgcat gtatctatct 420
cattttctta caccttctat taccttctgc tctctctgat ttggaaaaag ctgaaaaaaa 480
aggttgaaac cagttccctg aaattattcc cctacttgac taataagtat ataaagacgg 540
taggtattga ttgtaattct gtaaatctat ttcttaaact tcttaaattc tacttttata 600
gttagtcttt tttttagttt taaaacacca agaacttagt ttcgaataaa cacacataaa 660
caaacaaaat gaacacaatc aatattgcca aaaatgaccc caagaaaaaa cgtaaggttt 720
ttagcgatat cgagctagct gcaattcctt tcaacacgct agctgatcat tatggtgagc 780
gtctggcaag agaacagctg gccctagagc acgaaagtta tgaaatggga gaagccaggt 840
ttagaaaaat gttcgaaaga caactaaaag ccggcgaggt ggctgacaac gcagccgcta 900
agcccctgat cacgacatta ctaccaaaaa tgattgcccg tataaacgac tggtttgagg 960
aggtgaaagc taagcgtggc aagaggccca cagcgttcca gttccttcaa gaaattaagc 1020
ctgaagcggt cgcatatatt acgattaaaa ccactctagc ttgtcttaca agcgcggata 1080
acacaacagt acaggctgta gctagcgcga taggcagggc aatagaggac gaggccaggt 1140
tcgggcgtat tcgtgatcta gaagctaaac attttaaaaa aaacgtggaa gaacagttaa 1200
acaagagagt tgggcatgtg tacaagaaag cgttcatgca ggtcgtggag gctgacatgc 1260
tttcaaaagg cctgttggga ggagaagcat ggagtagctg gcacaaggag gactcaatcc 1320
atgtcggcgt gaggtgtatt gagatgttga tagagagtac aggcatggtg tcattacacc 1380
gtcaaaacgc aggtgttgtg ggccaagatt ctgagacgat cgaattagca ccagaatacg 1440
cggaggccat agcgactcgt gccggggcgt tggcaggaat atctccaatg tttcagccat 1500
gtgtagtacc tccgaagcca tggactggaa ttaccggtgg gggctattgg gctaatggta 1560
gaaggccgtt ggcactggtc agaacccact caaaaaaagc tttgatgcgt tatgaagatg 1620
tttacatgcc cgaggtctat aaggctatca atatcgctca aaacactgcg tggaaaatta 1680
ataagaaagt tttggctgtt gcgaacgtta taacaaagtg gaaacactgc ccagtcgagg 1740
acatccctgc gatcgagcgt gaagaattgc ccatgaaacc tgaagatatt gatatgaacc 1800
ctgaagctct gacagcgtgg aaaagagcag cagccgctgt ttacagaaaa gataaggcaa 1860
gaaaaagtag gaggatctca ctagagttca tgcttgagca ggccaataag tttgccaacc 1920
acaaggccat ctggtttcct tataacatgg actggcgtgg tagggtttac gcagtctcca 1980
tgtttaatcc tcaaggcaac gatatgacca aggggctgct taccttagca aaggggaaac 2040
ccattgggaa ggagggatac tactggctaa aaatacatgg tgcaaattgt gcaggggttg 2100
ataaagtccc atttccggaa agaataaaat tcattgagga gaaccatgag aacataatgg 2160
cctgtgctaa atcaccactt gagaatacat ggtgggcgga gcaagacagt cccttttgtt 2220
ttctggcatt ctgctttgag tatgcagggg tgcagcacca tggattgagc tataactgtt 2280
cactaccctt ggcatttgat gggagttgta gtgggattca acatttcagc gctatgttga 2340
gggatgaagt cggaggtagg gccgtcaatc ttctaccgtc tgagacggtt caagacattt 2400
acgggatagt ggctaaaaaa gtcaacgaga ttcttcaggc cgacgcgatt aatggcactg 2460
ataacgaggt agtaacagtg actgacgaaa acacgggaga aatatccgag aaagttaaac 2520
ttgggaccaa ggcgctggca ggtcaatggc tggcgtacgg cgttacgagg tctgttacga 2580
aaaggagtgt catgacatta gcgtatggat ctaaggaatt tggatttaga cagcaggtac 2640
tggaggacac catacagcca gcgatcgact ctggcaaagg tttaatgttt acacaaccca 2700
accaggctgc tgggtatatg gcaaaattga tctgggaatc cgtttcagta actgtagtag 2760
ctgcagttga ggctatgaac tggctgaaaa gcgccgccaa actgttagcg gcagaggtaa 2820
aggacaagaa aacgggcgaa atattgagaa agagatgcgc ggtccattgg gtcacgcctg 2880
atgggttccc agtctggcag gaatacaaga aaccaattca aaccagactg aaccttatgt 2940
ttctggggca gtttcgtttg cagcccacca tcaataccaa caaagattca gaaattgacg 3000
cgcacaaaca agagtcaggg atagctccaa acttcgtgca ttcacaagac gggagtcacc 3060
tgagaaagac ggtggtttgg gcccatgaga agtatggtat cgagtctttc gccctgattc 3120
acgactcctt tggtactata ccagcagacg ctgcaaacct tttcaaagct gttagagaga 3180
ctatggtcga cacatatgag tcttgcgatg tattagctga cttctatgac caattcgcgg 3240
accagctaca tgaatcccag ctagacaaaa tgccggcatt acccgccaaa gggaatctga 3300
atctaagaga tattctggaa agcgatttcg ccttcgctta aaagcttttg attaagcctt 3360
ctagtccaaa aaacacgttt ttttgtcatt tatttcattt tcttagaata gtttagttta 3420
ttcattttat agtcacgaat gttttatgat tctatatagg gttgcaaaca agcatttttc 3480
attttatgtt aaaacaattt caggtttacc ttttattctg cttgtggtga cgcgtgtatc 3540
cgcccgctct tttggtcacc catgtattta attgcataaa taattcttaa aagtggagct 3600
agtctatttc tatttacata cctctcattt ctcatttcct cccctcccgc ggtggagctc 3660
cagcttttgt tccctttagt gagggttaat tgcgcgcttg gcgta 3705
<210> 18
<211> 3705
<212> DNA
<213> 人工序列
<220>
<223> Nucleotide sequence of T7-RNApolymerase (T7 RNAP) expression
unit. The sequence includes the codon pair optimized T7 RNAP gene
under control of enoI promoter and EnoI terminator sequence for
expression in S. cerevisiae
<400> 18
cgagctcata acttcgtata atgtatgcta tacgaacggt agaattcgaa tcagatccac 60
tagtgtgccc gcggaaccgc cagatattca ttacttgacg caaaagcgtt tgaaataatg 120
acgaaaaaga aggaagaaaa aaaaagaaaa ataccgcttc taggcgggtt atctactgat 180
ccgagcttcc actaggatag cacccaaaca cctgcatatt tggacgacct ttacttacac 240
caccaaaaac cactttcgcc tctcccgccc ctgataacgt ccactaattg agcgattacc 300
tgagcggtcc tcttttgttt gcagcatgag acttgcatac tgcaaatcgt aagtagcaac 360
gtgtcaaggt caaaactgta tggaaacctt gtcacctcac ttaattctag ctagcctacc 420
ctgcaagtca agaggtgtcc gtgattccta gccacctcaa ggtatgcctc tccccggaaa 480
ctgtggcctt ttctggcaca catgatctcc acgatttcaa catataaata gcttttgata 540
atggcaatat taatcaaatt tattttactt ctttcttgta acatctctct tgtaatccct 600
tattccttct agctattttt cataaaaaac caagcaactg cttatcaaca cacaaacact 660
aaatcaaaat gaacacaatc aatattgcca aaaatgaccc caagaaaaaa cgtaaggttt 720
ttagcgatat cgagctagct gcaattcctt tcaacacgct agctgatcat tatggtgagc 780
gtctggcaag agaacagctg gccctagagc acgaaagtta tgaaatggga gaagccaggt 840
ttagaaaaat gttcgaaaga caactaaaag ccggcgaggt ggctgacaac gcagccgcta 900
agcccctgat cacgacatta ctaccaaaaa tgattgcccg tataaacgac tggtttgagg 960
aggtgaaagc taagcgtggc aagaggccca cagcgttcca gttccttcaa gaaattaagc 1020
ctgaagcggt cgcatatatt acgattaaaa ccactctagc ttgtcttaca agcgcggata 1080
acacaacagt acaggctgta gctagcgcga taggcagggc aatagaggac gaggccaggt 1140
tcgggcgtat tcgtgatcta gaagctaaac attttaaaaa aaacgtggaa gaacagttaa 1200
acaagagagt tgggcatgtg tacaagaaag cgttcatgca ggtcgtggag gctgacatgc 1260
tttcaaaagg cctgttggga ggagaagcat ggagtagctg gcacaaggag gactcaatcc 1320
atgtcggcgt gaggtgtatt gagatgttga tagagagtac aggcatggtg tcattacacc 1380
gtcaaaacgc aggtgttgtg ggccaagatt ctgagacgat cgaattagca ccagaatacg 1440
cggaggccat agcgactcgt gccggggcgt tggcaggaat atctccaatg tttcagccat 1500
gtgtagtacc tccgaagcca tggactggaa ttaccggtgg gggctattgg gctaatggta 1560
gaaggccgtt ggcactggtc agaacccact caaaaaaagc tttgatgcgt tatgaagatg 1620
tttacatgcc cgaggtctat aaggctatca atatcgctca aaacactgcg tggaaaatta 1680
ataagaaagt tttggctgtt gcgaacgtta taacaaagtg gaaacactgc ccagtcgagg 1740
acatccctgc gatcgagcgt gaagaattgc ccatgaaacc tgaagatatt gatatgaacc 1800
ctgaagctct gacagcgtgg aaaagagcag cagccgctgt ttacagaaaa gataaggcaa 1860
gaaaaagtag gaggatctca ctagagttca tgcttgagca ggccaataag tttgccaacc 1920
acaaggccat ctggtttcct tataacatgg actggcgtgg tagggtttac gcagtctcca 1980
tgtttaatcc tcaaggcaac gatatgacca aggggctgct taccttagca aaggggaaac 2040
ccattgggaa ggagggatac tactggctaa aaatacatgg tgcaaattgt gcaggggttg 2100
ataaagtccc atttccggaa agaataaaat tcattgagga gaaccatgag aacataatgg 2160
cctgtgctaa atcaccactt gagaatacat ggtgggcgga gcaagacagt cccttttgtt 2220
ttctggcatt ctgctttgag tatgcagggg tgcagcacca tggattgagc tataactgtt 2280
cactaccctt ggcatttgat gggagttgta gtgggattca acatttcagc gctatgttga 2340
gggatgaagt cggaggtagg gccgtcaatc ttctaccgtc tgagacggtt caagacattt 2400
acgggatagt ggctaaaaaa gtcaacgaga ttcttcaggc cgacgcgatt aatggcactg 2460
ataacgaggt agtaacagtg actgacgaaa acacgggaga aatatccgag aaagttaaac 2520
ttgggaccaa ggcgctggca ggtcaatggc tggcgtacgg cgttacgagg tctgttacga 2580
aaaggagtgt catgacatta gcgtatggat ctaaggaatt tggatttaga cagcaggtac 2640
tggaggacac catacagcca gcgatcgact ctggcaaagg tttaatgttt acacaaccca 2700
accaggctgc tgggtatatg gcaaaattga tctgggaatc cgtttcagta actgtagtag 2760
ctgcagttga ggctatgaac tggctgaaaa gcgccgccaa actgttagcg gcagaggtaa 2820
aggacaagaa aacgggcgaa atattgagaa agagatgcgc ggtccattgg gtcacgcctg 2880
atgggttccc agtctggcag gaatacaaga aaccaattca aaccagactg aaccttatgt 2940
ttctggggca gtttcgtttg cagcccacca tcaataccaa caaagattca gaaattgacg 3000
cgcacaaaca agagtcaggg atagctccaa acttcgtgca ttcacaagac gggagtcacc 3060
tgagaaagac ggtggtttgg gcccatgaga agtatggtat cgagtctttc gccctgattc 3120
acgactcctt tggtactata ccagcagacg ctgcaaacct tttcaaagct gttagagaga 3180
ctatggtcga cacatatgag tcttgcgatg tattagctga cttctatgac caattcgcgg 3240
accagctaca tgaatcccag ctagacaaaa tgccggcatt acccgccaaa gggaatctga 3300
atctaagaga tattctggaa agcgatttcg ccttcgctta aaagcttttg attaagcctt 3360
ctagtccaaa aaacacgttt ttttgtcatt tatttcattt tcttagaata gtttagttta 3420
ttcattttat agtcacgaat gttttatgat tctatatagg gttgcaaaca agcatttttc 3480
attttatgtt aaaacaattt caggtttacc ttttattctg cttgtggtga cgcgtgtatc 3540
cgcccgctct tttggtcacc catgtattta attgcataaa taattcttaa aagtggagct 3600
agtctatttc tatttacata cctctcattt ctcatttcct cccctcccgc ggtggagctc 3660
cagcttttgt tccctttagt gagggttaat tgcgcgcttg gcgta 3705
<210> 19
<211> 2673
<212> DNA
<213> 人工序列
<220>
<223> Nucleotide sequence of the codon pair optimized T7 RNAP gene for
expression in yeast
<400> 19
atgaacacaa tcaatattgc caaaaatgac cccaagaaaa aacgtaaggt ttttagcgat 60
atcgagctag ctgcaattcc tttcaacacg ctagctgatc attatggtga gcgtctggca 120
agagaacagc tggccctaga gcacgaaagt tatgaaatgg gagaagccag gtttagaaaa 180
atgttcgaaa gacaactaaa agccggcgag gtggctgaca acgcagccgc taagcccctg 240
atcacgacat tactaccaaa aatgattgcc cgtataaacg actggtttga ggaggtgaaa 300
gctaagcgtg gcaagaggcc cacagcgttc cagttccttc aagaaattaa gcctgaagcg 360
gtcgcatata ttacgattaa aaccactcta gcttgtctta caagcgcgga taacacaaca 420
gtacaggctg tagctagcgc gataggcagg gcaatagagg acgaggccag gttcgggcgt 480
attcgtgatc tagaagctaa acattttaaa aaaaacgtgg aagaacagtt aaacaagaga 540
gttgggcatg tgtacaagaa agcgttcatg caggtcgtgg aggctgacat gctttcaaaa 600
ggcctgttgg gaggagaagc atggagtagc tggcacaagg aggactcaat ccatgtcggc 660
gtgaggtgta ttgagatgtt gatagagagt acaggcatgg tgtcattaca ccgtcaaaac 720
gcaggtgttg tgggccaaga ttctgagacg atcgaattag caccagaata cgcggaggcc 780
atagcgactc gtgccggggc gttggcagga atatctccaa tgtttcagcc atgtgtagta 840
cctccgaagc catggactgg aattaccggt gggggctatt gggctaatgg tagaaggccg 900
ttggcactgg tcagaaccca ctcaaaaaaa gctttgatgc gttatgaaga tgtttacatg 960
cccgaggtct ataaggctat caatatcgct caaaacactg cgtggaaaat taataagaaa 1020
gttttggctg ttgcgaacgt tataacaaag tggaaacact gcccagtcga ggacatccct 1080
gcgatcgagc gtgaagaatt gcccatgaaa cctgaagata ttgatatgaa ccctgaagct 1140
ctgacagcgt ggaaaagagc agcagccgct gtttacagaa aagataaggc aagaaaaagt 1200
aggaggatct cactagagtt catgcttgag caggccaata agtttgccaa ccacaaggcc 1260
atctggtttc cttataacat ggactggcgt ggtagggttt acgcagtctc catgtttaat 1320
cctcaaggca acgatatgac caaggggctg cttaccttag caaaggggaa acccattggg 1380
aaggagggat actactggct aaaaatacat ggtgcaaatt gtgcaggggt tgataaagtc 1440
ccatttccgg aaagaataaa attcattgag gagaaccatg agaacataat ggcctgtgct 1500
aaatcaccac ttgagaatac atggtgggcg gagcaagaca gtcccttttg ttttctggca 1560
ttctgctttg agtatgcagg ggtgcagcac catggattga gctataactg ttcactaccc 1620
ttggcatttg atgggagttg tagtgggatt caacatttca gcgctatgtt gagggatgaa 1680
gtcggaggta gggccgtcaa tcttctaccg tctgagacgg ttcaagacat ttacgggata 1740
gtggctaaaa aagtcaacga gattcttcag gccgacgcga ttaatggcac tgataacgag 1800
gtagtaacag tgactgacga aaacacggga gaaatatccg agaaagttaa acttgggacc 1860
aaggcgctgg caggtcaatg gctggcgtac ggcgttacga ggtctgttac gaaaaggagt 1920
gtcatgacat tagcgtatgg atctaaggaa tttggattta gacagcaggt actggaggac 1980
accatacagc cagcgatcga ctctggcaaa ggtttaatgt ttacacaacc caaccaggct 2040
gctgggtata tggcaaaatt gatctgggaa tccgtttcag taactgtagt agctgcagtt 2100
gaggctatga actggctgaa aagcgccgcc aaactgttag cggcagaggt aaaggacaag 2160
aaaacgggcg aaatattgag aaagagatgc gcggtccatt gggtcacgcc tgatgggttc 2220
ccagtctggc aggaatacaa gaaaccaatt caaaccagac tgaaccttat gtttctgggg 2280
cagtttcgtt tgcagcccac catcaatacc aacaaagatt cagaaattga cgcgcacaaa 2340
caagagtcag ggatagctcc aaacttcgtg cattcacaag acgggagtca cctgagaaag 2400
acggtggttt gggcccatga gaagtatggt atcgagtctt tcgccctgat tcacgactcc 2460
tttggtacta taccagcaga cgctgcaaac cttttcaaag ctgttagaga gactatggtc 2520
gacacatatg agtcttgcga tgtattagct gacttctatg accaattcgc ggaccagcta 2580
catgaatccc agctagacaa aatgccggca ttacccgcca aagggaatct gaatctaaga 2640
gatattctgg aaagcgattt cgccttcgct taa 2673
<210> 20
<211> 604
<212> DNA
<213> 人工序列
<220>
<223> Nucleotide sequence of the S. cerevisiae tdh3 promoter (Ptdh3)
<400> 20
gtgcttagtc aaaaaattag ccttttaatt ctgctgtaac ccgtacatgc ccaaaatagg 60
gggcgggtta cacagaatat ataacatcgt aggtgtctgg gtgaacagtt tattcctggc 120
atccactaaa tataatggag cccgcttttt aagctggcat ccagaaaaaa aaagaatccc 180
agcaccaaaa tattgttttc ttcaccaacc atcagttcat aggtccattc tcttagcgca 240
actacagaga acaggggcac aaacaggcaa aaaacgggca caacctcaat ggagtgatgc 300
aacctgcctg gagtaaatga tgacacaagg caattgaccc acgcatgtat ctatctcatt 360
ttcttacacc ttctattacc ttctgctctc tctgatttgg aaaaagctga aaaaaaaggt 420
tgaaaccagt tccctgaaat tattccccta cttgactaat aagtatataa agacggtagg 480
tattgattgt aattctgtaa atctatttct taaacttctt aaattctact tttatagtta 540
gtcttttttt tagttttaaa acaccaagaa cttagtttcg aataaacaca cataaacaaa 600
caaa 604
<210> 21
<211> 604
<212> DNA
<213> 人工序列
<220>
<223> Nucleotide sequence of the S. cerevisiae enoI promoter (PenoI)
<400> 21
gtgcccgcgg aaccgccaga tattcattac ttgacgcaaa agcgtttgaa ataatgacga 60
aaaagaagga agaaaaaaaa agaaaaatac cgcttctagg cgggttatct actgatccga 120
gcttccacta ggatagcacc caaacacctg catatttgga cgacctttac ttacaccacc 180
aaaaaccact ttcgcctctc ccgcccctga taacgtccac taattgagcg attacctgag 240
cggtcctctt ttgtttgcag catgagactt gcatactgca aatcgtaagt agcaacgtgt 300
caaggtcaaa actgtatgga aaccttgtca cctcacttaa ttctagctag cctaccctgc 360
aagtcaagag gtgtccgtga ttcctagcca cctcaaggta tgcctctccc cggaaactgt 420
ggccttttct ggcacacatg atctccacga tttcaacata taaatagctt ttgataatgg 480
caatattaat caaatttatt ttacttcttt cttgtaacat ctctcttgta atcccttatt 540
ccttctagct atttttcata aaaaaccaag caactgctta tcaacacaca aacactaaat 600
caaa 604
<210> 22
<211> 305
<212> DNA
<213> 人工序列
<220>
<223> Nucleotide sequence of the S. cerevisiae enoI terminator (TenoI)
<400> 22
aagcttttga ttaagccttc tagtccaaaa aacacgtttt tttgtcattt atttcatttt 60
cttagaatag tttagtttat tcattttata gtcacgaatg ttttatgatt ctatataggg 120
ttgcaaacaa gcatttttca ttttatgtta aaacaatttc aggtttacct tttattctgc 180
ttgtggtgac gcgtgtatcc gcccgctctt ttggtcaccc atgtatttaa ttgcataaat 240
aattcttaaa agtggagcta gtctatttct atttacatac ctctcatttc tcatttcctc 300
ccctc 305
<210> 23
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> Nucleotide sequence of forward primer to the 5' transition of the
pCSN061 backbone to the T7 RNAP expression cassette
<400> 23
ctgtcgattc gatactaacg c 21
<210> 24
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> Nucleotide sequence of reverse primer to the 5' transition of the
pCSN061 backbone to the T7 RNAP expression cassette
<400> 24
ctgcgttgtc agccacctc 19
<210> 25
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> Nucleotide sequence of forward primer to the 3' transition of the
pCSN061 backbone to the T7 RNAP expression cassette
<400> 25
cacacaggaa acagctatga c 21
<210> 26
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> Nucleotide sequence of reverse primer to the 3' transition of the
pCSN061 backbone to the T7 RNAP expression cassette
<400> 26
ccggcattac ccgccaaagg 20
<210> 27
<211> 15307
<212> DNA
<213> 人工序列
<220>
<223> Nucleotide sequence of vector pCSN070
<400> 27
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accataaacg acattactat atatataata taggaagcat ttaatagaca gcatcgtaat 240
atatgtgtac tttgcagtta tgacgccaga tggcagtagt ggaagatatt ctttattgaa 300
aaatagcttg tcaccttacg tacaatcttg atccggagct tttctttttt tgccgattaa 360
gaattaattc ggtcgaaaaa agaaaaggag agggccaaga gggagggcat tggtgactat 420
tgagcacgtg agtatacgtg attaagcaca caaaggcagc ttggagtatg tctgttatta 480
atttcacagg tagttctggt ccattggtga aagtttgcgg cttgcagagc acagaggccg 540
cagaatgtgc tctagattcc gatgctgact tgctgggtat tatatgtgtg cccaatagaa 600
agagaacaat tgacccggtt attgcaagga aaatttcaag tcttgtaaaa gcatataaaa 660
atagttcagg cactccgaaa tacttggttg gcgtgtttcg taatcaacct aaggaggatg 720
ttttggctct ggtcaatgat tacggcattg atatcgtcca actgcatgga gatgagtcgt 780
ggcaagaata ccaagagttc ctcggtttgc cagttattaa aagactcgta tttccaaaag 840
actgcaacat actactcagt gcagcttcac agaaacctca ttcgtttatt cccttgtttg 900
attcagaagc aggtgggaca ggtgaacttt tggattggaa ctcgatttct gactgggttg 960
gaaggcaaga gagccccgaa agcttacatt ttatgttagc tggtggactg acgccagaaa 1020
atgttggtga tgcgcttaga ttaaatggcg ttattggtgt tgatgtaagc ggaggtgtgg 1080
agacaaatgg tgtaaaagac tctaacaaaa tagcaaattt cgtcaaaaat gctaagaaat 1140
aggttattac tgagtagtat ttatttaagt attgtttgtg cacttgccta tgcggtgtga 1200
aataccgcac agatgcgtaa ggagaaaata ccgcatcagg aaattgtaaa cgttaatatt 1260
ttgttaaaat tcgcgttaaa tttttgttaa atcagctcat tttttaacca ataggccgaa 1320
atcggcaaaa tcccttataa atcaaaagaa tagaccgaga tagggttgag tgttgttcca 1380
gtttggaaca agagtccact attaaagaac gtggactcca acgtcaaagg gcgaaaaacc 1440
gtctatcagg gcgatggccc actacgtgaa ccatcaccct aatcaagttt tttggggtcg 1500
aggtgccgta aagcactaaa tcggaaccct aaagggagcc cccgatttag agcttgacgg 1560
ggaaagccgg cgaacgtggc gagaaaggaa gggaagaaag cgaaaggagc gggcgctagg 1620
gcgctggcaa gtgtagcggt cacgctgcgc gtaaccacca cacccgccgc gcttaatgcg 1680
ccgctacagg gcgcgtcgcg ccattcgcca ttcaggctgc gcaactgttg ggaagggcga 1740
tcggtgcggg cctcttcgct attacgccag ctggcgaaag ggggatgtgc tgcaaggcga 1800
ttaagttggg taacgccagg gttttcccag tcacgacgtt gtaaaacgac ggccagtgag 1860
cgcgcgtaat acgactcact atagggcgaa ttgggtacct tttctttttt tgcggtcacc 1920
cccatgtggc ggggaggcag aggagtaggt agagcaacga atcctactat ttatccaaat 1980
tagtctagga actctttttc tagatttttt agatttgagg gcaagcgctg ttaacgactc 2040
agaaatgtaa gcactacgga gtagaacgag aaatccgcca taggtggaaa tcctagcaaa 2100
atcttgctta ccctagctag cctcaggtaa gctagcctta gcctgtcaaa tttttttcaa 2160
aatttggtaa gtttctacta gcaaagcaaa cacggttcaa caaaccgaaa actccactca 2220
ttatacgtgg aaaccgaaac aaaaaaacaa aaaccaaaat actcgccaat gagaaagttg 2280
ctgcgtttct actttcgagg aagaggaact gagaggattg actacgaaag gggcaaaaac 2340
gagtcgtatt ctcccattat tgtctgctac cacgcggtct agtagaataa gcaaccagtc 2400
aacgctaaga caggtaatca aaataccagt ctgctggcta cgggctagtt tttacctctt 2460
ttagaaccca ctgtaaaagt ccgttgtaaa gcccgttctc actgttggcg tttttttttt 2520
tttggtttag tttcttattt ttcatttttt tctttcatga ccaaaaacaa acaaatctcg 2580
cgatttgtac tgcggccact ggggcgtggc caaaaaaatg acaaatttag aaaccttagt 2640
ttctgatttt tcctgttatg aggagatatg ataaaaaata ttactgcttt attgtttttt 2700
ttttatctac tgaaatagag aaacttaccc aaggaggagg caaaaaaaag agtatatata 2760
cagcagctac cattcagatt ttaatatatt cttttctctt cttctacact attattataa 2820
taattttact atattcattt ttagcttaaa acctcataga atattattct tcagtcactc 2880
gcttaaatac ttatcaaaaa tggacaagaa atactctatt ggtttggata tcgggaccaa 2940
ctccgtcggt tgggctgtca tcaccgacga atacaaggtt ccatccaaga aattcaaggt 3000
cttgggtaac actgacagac actctatcaa gaagaatttg atcggtgctt tgttgttcga 3060
ctccggtgaa accgctgaag ctaccagatt gaagcgtacc gctcgtcgta gatacactag 3120
acgtaaaaac cgtatttgtt acttgcaaga aatcttttct aacgaaatgg ccaaggttga 3180
cgactctttc ttccacagat tggaagaatc tttcttggtt gaagaagaca agaagcacga 3240
aagacatcca atcttcggta acatcgttga cgaagttgct taccacgaaa aataccctac 3300
catctaccat ttgagaaaga agttggtcga ttccaccgac aaggctgatt tgagattgat 3360
ctatttggcc ttggctcaca tgatcaagtt cagaggtcac ttcttgattg aaggtgactt 3420
gaacccagac aactctgacg tcgacaaatt gttcatccaa ttggtccaaa cctacaacca 3480
attattcgag gaaaacccaa ttaacgcttc tggtgttgat gctaaggcca tcttatctgc 3540
ccgtttgtcc aagtctagac gtttggaaaa cttgattgct caattgcctg gtgaaaagaa 3600
aaacggtttg ttcggtaact tgatcgcttt gtccttgggt ttgaccccaa acttcaagtc 3660
caacttcgac ttggctgaag atgccaagtt gcaattgtcc aaggacacct acgacgacga 3720
cttagacaac ttgttggctc aaatcggtga ccaatacgcc gacttgttct tggctgccaa 3780
aaacttatct gacgctatct tgttgtctga catcttgaga gttaacactg aaattaccaa 3840
ggctccattg tctgcttcta tgatcaaaag atacgacgaa caccaccaag atctgacttt 3900
gttgaaggct ttggttagac aacaattgcc agaaaagtac aaggaaatct tcttcgacca 3960
atccaaaaat ggttacgccg gttacattga cggtggtgct tctcaggaag aattctacaa 4020
gttcatcaag ccaattttgg aaaagatgga tggtactgaa gaattattgg ttaagttgaa 4080
cagagaagac ttattgagaa agcaacgtac cttcgataac ggttctatcc cacaccaaat 4140
ccacttgggt gaattgcacg ccattttgag aagacaggaa gatttctatc cattcctaaa 4200
ggacaacaga gaaaagatcg aaaagatctt aactttcaga atcccatact acgtcggtcc 4260
attggccaga ggtaattcta gattcgcttg gatgaccaga aagtctgaag aaaccatcac 4320
cccatggaac ttcgaagaag tcgtcgacaa gggtgcttct gcccaatctt tcatcgaaag 4380
aatgaccaac tttgataaga acttgccaaa cgagaaggtc ttgccaaagc actctttgtt 4440
gtacgaatac ttcaccgtct acaacgaatt aaccaaggtt aaatacgtta ctgaaggtat 4500
gagaaagcca gctttcctat ccggtgaaca aaagaaggct attgttgact tgttgtttaa 4560
gaccaacaga aaggtcactg ttaagcaatt gaaggaagac tacttcaaga agattgaatg 4620
tttcgattcc gtcgaaatct ccggtgttga agaccgtttc aatgcttctt tgggcaccta 4680
ccacgatttg ttaaagatca tcaaggacaa ggacttttta gataacgaag aaaacgaaga 4740
catcttggaa gatatcgttt tgaccttgac tcttttcgag gacagagaaa tgattgaaga 4800
gagattgaag acctacgctc acttgttcga cgataaagtt atgaagcaac taaagagaag 4860
aagatacact ggttggggta gattgtccag aaagttgatt aacggtatca gagacaagca 4920
atccggtaag actattttag actttttgaa atccgatggt ttcgctaaca gaaactttat 4980
gcaattgatt cacgacgatt ctttgacttt caaggaagac attcaaaaag cccaagtctc 5040
tggtcaaggt gattctttgc acgaacacat cgctaacttg gctggttctc cagctattaa 5100
gaagggtatc ttacaaaccg tcaaggtcgt tgatgaattg gtcaaagtca tgggtagaca 5160
caagccagaa aatattgtca tcgaaatggc tagagaaaac caaactactc aaaagggtca 5220
aaagaactct agagaacgta tgaagagaat tgaagaaggt atcaaggagt tgggttctca 5280
aattttgaaa gaacacccag tcgaaaacac tcaattacaa aacgaaaagc tatacttgta 5340
ctacttgcaa aacggtcgtg acatgtacgt cgaccaagaa ttggatatca acagattgtc 5400
tgactacgat gtcgatcata tcgtcccaca atcgttcttg aaggacgatt ccattgacaa 5460
caaagttttg actagatctg acaagaacag aggtaagtct gataacgttc catctgaaga 5520
agttgttaag aagatgaaga actactggag acaattgttg aatgctaagt tgatcactca 5580
aagaaagttc gacaacttga ccaaggctga aagaggtggt ttgtccgaat tggacaaagc 5640
cggtttcatc aagagacaat tagtcgaaac tagacaaatc accaagcatg ttgctcaaat 5700
cttggattcc agaatgaaca ctaagtacga tgaaaacgac aaactaatta gagaagttaa 5760
ggtcatcact ttgaagtcta agttggtttc tgacttcaga aaggacttcc aattttacaa 5820
ggtcagagaa atcaacaact accatcacgc tcacgatgcc tacttgaacg ctgttgtcgg 5880
tactgcctta atcaaaaagt acccaaagtt ggaatctgaa ttcgtttacg gtgactacaa 5940
ggtttacgat gttagaaaga tgatcgccaa gtctgaacaa gaaattggta aggccactgc 6000
taagtacttc ttctactcta acatcatgaa ctttttcaag actgaaatca ctttagctaa 6060
cggtgaaatt agaaagcgtc cattgattga aaccaatggt gaaactggtg aaattgtctg 6120
ggacaagggt agagatttcg ctaccgtcag aaaggttttg tctatgccac aagttaacat 6180
cgtcaagaag actgaagttc aaactggtgg tttctctaag gaatccattt tgccaaagag 6240
aaactctgac aagttgattg ctagaaagaa ggactgggat cctaagaagt acggtggttt 6300
cgactctcca actgttgctt actccgtttt ggtcgttgct aaggttgaaa agggtaagtc 6360
taagaagttg aagtctgtta aggaattgtt gggtatcacc atcatggaaa gatcctcctt 6420
cgaaaagaac ccaatcgact ttttggaagc taagggttac aaggaagtca agaaggattt 6480
gatcattaag ttaccaaaat actccttgtt cgaattggaa aacggtagaa agagaatgtt 6540
ggcctccgct ggtgaactac aaaaaggtaa cgaattggct ttaccatcta agtacgttaa 6600
cttcttgtac ttggcttccc actacgaaaa gttgaaaggt tccccagaag acaacgaaca 6660
aaagcaattg tttgttgaac aacacaagca ctacttggat gaaattattg aacaaatctc 6720
cgaattctcc aagagagtca ttttggctga tgctaactta gataaggttt tatccgctta 6780
caacaagcac agagacaaac caatcagaga acaagctgaa aacatcattc atttgttcac 6840
tttaaccaac ttgggtgctc cagctgcttt caaatacttc gacactacca ttgacagaaa 6900
gagatacact tccaccaaag aagttttaga tgctactttg attcaccaat ctattaccgg 6960
tttgtacgaa accagaattg acttgtctca attgggtggt gattccagag ctgatccaaa 7020
gaagaagaga aaggtgtaaa ggagttaaag gcaaagtttt cttttctaga gccgttccca 7080
caaataatta tacgtatatg cttcttttcg tttactatat atctatattt acaagccttt 7140
attcactgat gcaatttgtt tccaaatact tttttggaga tctcataact agatatcatg 7200
atggcgcaac ttggcgctat cttaattact ctggctgcca ggcccgtgta gagggccgca 7260
agaccttctg tacgccatat agtctctaag aacttgaaca agtttctaga cctattgccg 7320
cctttcggat cgctattgtt gcggccgcca gctgaagctt cgtacgctgc aggtcgacga 7380
attctaccgt tcgtataatg tatgctatac gaagttatag atctgtttag cttgcctcgt 7440
ccccgccggg tcacccggcc agcgacatgg aggcccagaa taccctcctt gacagtcttg 7500
acgtgcgcag ctcaggggca tgatgtgact gtcgcccgta catttagccc atacatcccc 7560
atgtataatc atttgcatcc atacattttg atggccgcac ggcgcgaagc aaaaattacg 7620
gctcctcgct gcagacctgc gagcagggaa acgctcccct cacagacgcg ttgaattgtc 7680
cccacgccgc gcccctgtag agaaatataa aaggttagga tttgccactg aggttcttct 7740
ttcatatact tccttttaaa atcttgctag gatacagttc tcacatcaca tccgaacata 7800
aacaaccatg ggtaaggaaa agactcacgt ttcgaggccg cgattaaatt ccaacatgga 7860
tgctgattta tatgggtata aatgggctcg cgataatgtc gggcaatcag gtgcgacaat 7920
ctatcgattg tatgggaagc ccgatgcgcc agagttgttt ctgaaacatg gcaaaggtag 7980
cgttgccaat gatgttacag atgagatggt cagactaaac tggctgacgg aatttatgcc 8040
tcttccgacc atcaagcatt ttatccgtac tcctgatgat gcatggttac tcaccactgc 8100
gatccccggc aaaacagcat tccaggtatt agaagaatat cctgattcag gtgaaaatat 8160
tgttgatgcg ctggcagtgt tcctgcgccg gttgcattcg attcctgttt gtaattgtcc 8220
ttttaacagc gatcgcgtat ttcgtctcgc tcaggcgcaa tcacgaatga ataacggttt 8280
ggttgatgcg agtgattttg atgacgagcg taatggctgg cctgttgaac aagtctggaa 8340
agaaatgcat aagcttttgc cattctcacc ggattcagtc gtcactcatg gtgatttctc 8400
acttgataac cttatttttg acgaggggaa attaataggt tgtattgatg ttggacgagt 8460
cggaatcgca gaccgatacc aggatcttgc catcctatgg aactgcctcg gtgagttttc 8520
tccttcatta cagaaacggc tttttcaaaa atatggtatt gataatcctg atatgaataa 8580
attgcagttt catttgatgc tcgatgagtt tttctaatca gtactgacaa taaaaagatt 8640
cttgttttca agaacttgtc atttgtatag tttttttata ttgtagttgt tctattttaa 8700
tcaaatgtta gcgtgattta tatttttttt cgcctcgaca tcatctgccc agatgcgaag 8760
ttaagtgcgc agaaagtaat atcatgcgtc aatcgtatgt gaatgctggt cgctatactg 8820
ctgtcgattc gatactaacg ccgccatcca gtgtcgaaaa cgagctcata acttcgtata 8880
atgtatgcta tacgaacggt agaattcgaa tcagatccac tagtgtgctt agtcaaaaaa 8940
ttagcctttt aattctgctg taacccgtac atgcccaaaa tagggggcgg gttacacaga 9000
atatataaca tcgtaggtgt ctgggtgaac agtttattcc tggcatccac taaatataat 9060
ggagcccgct ttttaagctg gcatccagaa aaaaaaagaa tcccagcacc aaaatattgt 9120
tttcttcacc aaccatcagt tcataggtcc attctcttag cgcaactaca gagaacaggg 9180
gcacaaacag gcaaaaaacg ggcacaacct caatggagtg atgcaacctg cctggagtaa 9240
atgatgacac aaggcaattg acccacgcat gtatctatct cattttctta caccttctat 9300
taccttctgc tctctctgat ttggaaaaag ctgaaaaaaa aggttgaaac cagttccctg 9360
aaattattcc cctacttgac taataagtat ataaagacgg taggtattga ttgtaattct 9420
gtaaatctat ttcttaaact tcttaaattc tacttttata gttagtcttt tttttagttt 9480
taaaacacca agaacttagt ttcgaataaa cacacataaa caaacaaaat gaacacaatc 9540
aatattgcca aaaatgaccc caagaaaaaa cgtaaggttt ttagcgatat cgagctagct 9600
gcaattcctt tcaacacgct agctgatcat tatggtgagc gtctggcaag agaacagctg 9660
gccctagagc acgaaagtta tgaaatggga gaagccaggt ttagaaaaat gttcgaaaga 9720
caactaaaag ccggcgaggt ggctgacaac gcagccgcta agcccctgat cacgacatta 9780
ctaccaaaaa tgattgcccg tataaacgac tggtttgagg aggtgaaagc taagcgtggc 9840
aagaggccca cagcgttcca gttccttcaa gaaattaagc ctgaagcggt cgcatatatt 9900
acgattaaaa ccactctagc ttgtcttaca agcgcggata acacaacagt acaggctgta 9960
gctagcgcga taggcagggc aatagaggac gaggccaggt tcgggcgtat tcgtgatcta 10020
gaagctaaac attttaaaaa aaacgtggaa gaacagttaa acaagagagt tgggcatgtg 10080
tacaagaaag cgttcatgca ggtcgtggag gctgacatgc tttcaaaagg cctgttggga 10140
ggagaagcat ggagtagctg gcacaaggag gactcaatcc atgtcggcgt gaggtgtatt 10200
gagatgttga tagagagtac aggcatggtg tcattacacc gtcaaaacgc aggtgttgtg 10260
ggccaagatt ctgagacgat cgaattagca ccagaatacg cggaggccat agcgactcgt 10320
gccggggcgt tggcaggaat atctccaatg tttcagccat gtgtagtacc tccgaagcca 10380
tggactggaa ttaccggtgg gggctattgg gctaatggta gaaggccgtt ggcactggtc 10440
agaacccact caaaaaaagc tttgatgcgt tatgaagatg tttacatgcc cgaggtctat 10500
aaggctatca atatcgctca aaacactgcg tggaaaatta ataagaaagt tttggctgtt 10560
gcgaacgtta taacaaagtg gaaacactgc ccagtcgagg acatccctgc gatcgagcgt 10620
gaagaattgc ccatgaaacc tgaagatatt gatatgaacc ctgaagctct gacagcgtgg 10680
aaaagagcag cagccgctgt ttacagaaaa gataaggcaa gaaaaagtag gaggatctca 10740
ctagagttca tgcttgagca ggccaataag tttgccaacc acaaggccat ctggtttcct 10800
tataacatgg actggcgtgg tagggtttac gcagtctcca tgtttaatcc tcaaggcaac 10860
gatatgacca aggggctgct taccttagca aaggggaaac ccattgggaa ggagggatac 10920
tactggctaa aaatacatgg tgcaaattgt gcaggggttg ataaagtccc atttccggaa 10980
agaataaaat tcattgagga gaaccatgag aacataatgg cctgtgctaa atcaccactt 11040
gagaatacat ggtgggcgga gcaagacagt cccttttgtt ttctggcatt ctgctttgag 11100
tatgcagggg tgcagcacca tggattgagc tataactgtt cactaccctt ggcatttgat 11160
gggagttgta gtgggattca acatttcagc gctatgttga gggatgaagt cggaggtagg 11220
gccgtcaatc ttctaccgtc tgagacggtt caagacattt acgggatagt ggctaaaaaa 11280
gtcaacgaga ttcttcaggc cgacgcgatt aatggcactg ataacgaggt agtaacagtg 11340
actgacgaaa acacgggaga aatatccgag aaagttaaac ttgggaccaa ggcgctggca 11400
ggtcaatggc tggcgtacgg cgttacgagg tctgttacga aaaggagtgt catgacatta 11460
gcgtatggat ctaaggaatt tggatttaga cagcaggtac tggaggacac catacagcca 11520
gcgatcgact ctggcaaagg tttaatgttt acacaaccca accaggctgc tgggtatatg 11580
gcaaaattga tctgggaatc cgtttcagta actgtagtag ctgcagttga ggctatgaac 11640
tggctgaaaa gcgccgccaa actgttagcg gcagaggtaa aggacaagaa aacgggcgaa 11700
atattgagaa agagatgcgc ggtccattgg gtcacgcctg atgggttccc agtctggcag 11760
gaatacaaga aaccaattca aaccagactg aaccttatgt ttctggggca gtttcgtttg 11820
cagcccacca tcaataccaa caaagattca gaaattgacg cgcacaaaca agagtcaggg 11880
atagctccaa acttcgtgca ttcacaagac gggagtcacc tgagaaagac ggtggtttgg 11940
gcccatgaga agtatggtat cgagtctttc gccctgattc acgactcctt tggtactata 12000
ccagcagacg ctgcaaacct tttcaaagct gttagagaga ctatggtcga cacatatgag 12060
tcttgcgatg tattagctga cttctatgac caattcgcgg accagctaca tgaatcccag 12120
ctagacaaaa tgccggcatt acccgccaaa gggaatctga atctaagaga tattctggaa 12180
agcgatttcg ccttcgctta aaagcttttg attaagcctt ctagtccaaa aaacacgttt 12240
ttttgtcatt tatttcattt tcttagaata gtttagttta ttcattttat agtcacgaat 12300
gttttatgat tctatatagg gttgcaaaca agcatttttc attttatgtt aaaacaattt 12360
caggtttacc ttttattctg cttgtggtga cgcgtgtatc cgcccgctct tttggtcacc 12420
catgtattta attgcataaa taattcttaa aagtggagct agtctatttc tatttacata 12480
cctctcattt ctcatttcct cccctcccgc ggtggagctc cagcttttgt tccctttagt 12540
gagggttaat tgcgcgcttg gcgtaatcat ggtcatagct gtttcctgtg tgaaattgtt 12600
atccgctcac aattccacac aacataggag ccggaagcat aaagtgtaaa gcctggggtg 12660
cctaatgagt gaggtaactc acattaattg cgttgcgctc actgcccgct ttccagtcgg 12720
gaaacctgtc gtgccagctg cattaatgaa tcggccaacg cgcggggaga ggcggtttgc 12780
gtattgggcg ctcttccgct tcctcgctca ctgactcgct gcgctcggtc gttcggctgc 12840
ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa tcaggggata 12900
acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg 12960
cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa aatcgacgct 13020
caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt ccccctggaa 13080
gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc 13140
tcccttcggg aagcgtggcg ctttctcata gctcacgctg taggtatctc agttcggtgt 13200
aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg 13260
ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta tcgccactgg 13320
cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct acagagttct 13380
tgaagtggtg gcctaactac ggctacacta gaaggacagt atttggtatc tgcgctctgc 13440
tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa caaaccaccg 13500
ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa aaaggatctc 13560
aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa aactcacgtt 13620
aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac ctagatcctt ttaaattaaa 13680
aatgaagttt taaatcaatc taaagtatat atgagtaaac ttggtctgac agttaccaat 13740
gcttaatcag tgaggcacct atctcagcga tctgtctatt tcgttcatcc atagttgcct 13800
gactccccgt cgtgtagata actacgatac gggagggctt accatctggc cccagtgctg 13860
caatgatacc gcgagaccca cgctcaccgg ctccagattt atcagcaata aaccagccag 13920
ccggaagggc cgagcgcaga agtggtcctg caactttatc cgcctccatc cagtctatta 13980
attgttgccg ggaagctaga gtaagtagtt cgccagttaa tagtttgcgc aacgttgttg 14040
ccattgctac aggcatcgtg gtgtcacgct cgtcgtttgg tatggcttca ttcagctccg 14100
gttcccaacg atcaaggcga gttacatgat cccccatgtt gtgcaaaaaa gcggttagct 14160
ccttcggtcc tccgatcgtt gtcagaagta agttggccgc agtgttatca ctcatggtta 14220
tggcagcact gcataattct cttactgtca tgccatccgt aagatgcttt tctgtgactg 14280
gtgagtactc aaccaagtca ttctgagaat agtgtatgcg gcgaccgagt tgctcttgcc 14340
cggcgtcaat acgggataat accgcgccac atagcagaac tttaaaagtg ctcatcattg 14400
gaaaacgttc ttcggggcga aaactctcaa ggatcttacc gctgttgaga tccagttcga 14460
tgtaacccac tcgtgcaccc aactgatctt cagcatcttt tactttcacc agcgtttctg 14520
ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg aataagggcg acacggaaat 14580
gttgaatact catactcttc ctttttcaat attattgaag catttatcag ggttattgtc 14640
tcatgagcgg atacatattt gaatgtattt agaaaaataa acaaataggg gttccgcgca 14700
catttccccg aaaagtgcca cctgggtcct tttcatcacg tgctataaaa ataattataa 14760
tttaaatttt ttaatataaa tatataaatt aaaaatagaa agtaaaaaaa gaaattaaag 14820
aaaaaatagt ttttgttttc cgaagatgta aaagactcta gggggatcgc caacaaatac 14880
taccttttat cttgctcttc ctgctctcag gtattaatgc cgaattgttt catcttgtct 14940
gtgtagaaga ccacacacga aaatcctgtg attttacatt ttacttatcg ttaatcgaat 15000
gtatatctat ttaatctgct tttcttgtct aataaatata tatgtaaagt acgctttttg 15060
ttgaaatttt ttaaaccttt gtttattttt ttttcttcat tccgtaactc ttctaccttc 15120
tttatttact ttctaaaatc caaatacaaa acataaaaat aaataaacac agagtaaatt 15180
cccaaattat tccatcatta aaagatacga ggcgcgtgta agttacaggc aagcgatccg 15240
tcctaagaaa ccattattat catgacatta acctataaaa ataggcgtat cacgaggccc 15300
tttcgtc 15307
<210> 28
<211> 15307
<212> DNA
<213> 人工序列
<220>
<223> Nucleotide sequence of vector pCSN071
<400> 28
tgccgaattg tttcatcttg tctgtgtaga agaccacaca cgaaaatcct gtgattttac 60
attttactta tcgttaatcg aatgtatatc tatttaatct gcttttcttg tctaataaat 120
atatatgtaa agtacgcttt ttgttgaaat tttttaaacc tttgtttatt tttttttctt 180
cattccgtaa ctcttctacc ttctttattt actttctaaa atccaaatac aaaacataaa 240
aataaataaa cacagagtaa attcccaaat tattccatca ttaaaagata cgaggcgcgt 300
gtaagttaca ggcaagcgat ccgtcctaag aaaccattat tatcatgaca ttaacctata 360
aaaataggcg tatcacgagg ccctttcgtc tcgcgcgttt cggtgatgac ggtgaaaacc 420
tctgacacat gcagctcccg gagacggtca cagcttgtct gtaagcggat gccgggagca 480
gacaagcccg tcagggcgcg tcagcgggtg ttggcgggtg tcggggctgg cttaactatg 540
cggcatcaga gcagattgta ctgagagtgc accataaacg acattactat atatataata 600
taggaagcat ttaatagaca gcatcgtaat atatgtgtac tttgcagtta tgacgccaga 660
tggcagtagt ggaagatatt ctttattgaa aaatagcttg tcaccttacg tacaatcttg 720
atccggagct tttctttttt tgccgattaa gaattaattc ggtcgaaaaa agaaaaggag 780
agggccaaga gggagggcat tggtgactat tgagcacgtg agtatacgtg attaagcaca 840
caaaggcagc ttggagtatg tctgttatta atttcacagg tagttctggt ccattggtga 900
aagtttgcgg cttgcagagc acagaggccg cagaatgtgc tctagattcc gatgctgact 960
tgctgggtat tatatgtgtg cccaatagaa agagaacaat tgacccggtt attgcaagga 1020
aaatttcaag tcttgtaaaa gcatataaaa atagttcagg cactccgaaa tacttggttg 1080
gcgtgtttcg taatcaacct aaggaggatg ttttggctct ggtcaatgat tacggcattg 1140
atatcgtcca actgcatgga gatgagtcgt ggcaagaata ccaagagttc ctcggtttgc 1200
cagttattaa aagactcgta tttccaaaag actgcaacat actactcagt gcagcttcac 1260
agaaacctca ttcgtttatt cccttgtttg attcagaagc aggtgggaca ggtgaacttt 1320
tggattggaa ctcgatttct gactgggttg gaaggcaaga gagccccgaa agcttacatt 1380
ttatgttagc tggtggactg acgccagaaa atgttggtga tgcgcttaga ttaaatggcg 1440
ttattggtgt tgatgtaagc ggaggtgtgg agacaaatgg tgtaaaagac tctaacaaaa 1500
tagcaaattt cgtcaaaaat gctaagaaat aggttattac tgagtagtat ttatttaagt 1560
attgtttgtg cacttgccta tgcggtgtga aataccgcac agatgcgtaa ggagaaaata 1620
ccgcatcagg aaattgtaaa cgttaatatt ttgttaaaat tcgcgttaaa tttttgttaa 1680
atcagctcat tttttaacca ataggccgaa atcggcaaaa tcccttataa atcaaaagaa 1740
tagaccgaga tagggttgag tgttgttcca gtttggaaca agagtccact attaaagaac 1800
gtggactcca acgtcaaagg gcgaaaaacc gtctatcagg gcgatggccc actacgtgaa 1860
ccatcaccct aatcaagttt tttggggtcg aggtgccgta aagcactaaa tcggaaccct 1920
aaagggagcc cccgatttag agcttgacgg ggaaagccgg cgaacgtggc gagaaaggaa 1980
gggaagaaag cgaaaggagc gggcgctagg gcgctggcaa gtgtagcggt cacgctgcgc 2040
gtaaccacca cacccgccgc gcttaatgcg ccgctacagg gcgcgtcgcg ccattcgcca 2100
ttcaggctgc gcaactgttg ggaagggcga tcggtgcggg cctcttcgct attacgccag 2160
ctggcgaaag ggggatgtgc tgcaaggcga ttaagttggg taacgccagg gttttcccag 2220
tcacgacgtt gtaaaacgac ggccagtgag cgcgcgtaat acgactcact atagggcgaa 2280
ttgggtacct tttctttttt tgcggtcacc cccatgtggc ggggaggcag aggagtaggt 2340
agagcaacga atcctactat ttatccaaat tagtctagga actctttttc tagatttttt 2400
agatttgagg gcaagcgctg ttaacgactc agaaatgtaa gcactacgga gtagaacgag 2460
aaatccgcca taggtggaaa tcctagcaaa atcttgctta ccctagctag cctcaggtaa 2520
gctagcctta gcctgtcaaa tttttttcaa aatttggtaa gtttctacta gcaaagcaaa 2580
cacggttcaa caaaccgaaa actccactca ttatacgtgg aaaccgaaac aaaaaaacaa 2640
aaaccaaaat actcgccaat gagaaagttg ctgcgtttct actttcgagg aagaggaact 2700
gagaggattg actacgaaag gggcaaaaac gagtcgtatt ctcccattat tgtctgctac 2760
cacgcggtct agtagaataa gcaaccagtc aacgctaaga caggtaatca aaataccagt 2820
ctgctggcta cgggctagtt tttacctctt ttagaaccca ctgtaaaagt ccgttgtaaa 2880
gcccgttctc actgttggcg tttttttttt tttggtttag tttcttattt ttcatttttt 2940
tctttcatga ccaaaaacaa acaaatctcg cgatttgtac tgcggccact ggggcgtggc 3000
caaaaaaatg acaaatttag aaaccttagt ttctgatttt tcctgttatg aggagatatg 3060
ataaaaaata ttactgcttt attgtttttt ttttatctac tgaaatagag aaacttaccc 3120
aaggaggagg caaaaaaaag agtatatata cagcagctac cattcagatt ttaatatatt 3180
cttttctctt cttctacact attattataa taattttact atattcattt ttagcttaaa 3240
acctcataga atattattct tcagtcactc gcttaaatac ttatcaaaaa tggacaagaa 3300
atactctatt ggtttggata tcgggaccaa ctccgtcggt tgggctgtca tcaccgacga 3360
atacaaggtt ccatccaaga aattcaaggt cttgggtaac actgacagac actctatcaa 3420
gaagaatttg atcggtgctt tgttgttcga ctccggtgaa accgctgaag ctaccagatt 3480
gaagcgtacc gctcgtcgta gatacactag acgtaaaaac cgtatttgtt acttgcaaga 3540
aatcttttct aacgaaatgg ccaaggttga cgactctttc ttccacagat tggaagaatc 3600
tttcttggtt gaagaagaca agaagcacga aagacatcca atcttcggta acatcgttga 3660
cgaagttgct taccacgaaa aataccctac catctaccat ttgagaaaga agttggtcga 3720
ttccaccgac aaggctgatt tgagattgat ctatttggcc ttggctcaca tgatcaagtt 3780
cagaggtcac ttcttgattg aaggtgactt gaacccagac aactctgacg tcgacaaatt 3840
gttcatccaa ttggtccaaa cctacaacca attattcgag gaaaacccaa ttaacgcttc 3900
tggtgttgat gctaaggcca tcttatctgc ccgtttgtcc aagtctagac gtttggaaaa 3960
cttgattgct caattgcctg gtgaaaagaa aaacggtttg ttcggtaact tgatcgcttt 4020
gtccttgggt ttgaccccaa acttcaagtc caacttcgac ttggctgaag atgccaagtt 4080
gcaattgtcc aaggacacct acgacgacga cttagacaac ttgttggctc aaatcggtga 4140
ccaatacgcc gacttgttct tggctgccaa aaacttatct gacgctatct tgttgtctga 4200
catcttgaga gttaacactg aaattaccaa ggctccattg tctgcttcta tgatcaaaag 4260
atacgacgaa caccaccaag atctgacttt gttgaaggct ttggttagac aacaattgcc 4320
agaaaagtac aaggaaatct tcttcgacca atccaaaaat ggttacgccg gttacattga 4380
cggtggtgct tctcaggaag aattctacaa gttcatcaag ccaattttgg aaaagatgga 4440
tggtactgaa gaattattgg ttaagttgaa cagagaagac ttattgagaa agcaacgtac 4500
cttcgataac ggttctatcc cacaccaaat ccacttgggt gaattgcacg ccattttgag 4560
aagacaggaa gatttctatc cattcctaaa ggacaacaga gaaaagatcg aaaagatctt 4620
aactttcaga atcccatact acgtcggtcc attggccaga ggtaattcta gattcgcttg 4680
gatgaccaga aagtctgaag aaaccatcac cccatggaac ttcgaagaag tcgtcgacaa 4740
gggtgcttct gcccaatctt tcatcgaaag aatgaccaac tttgataaga acttgccaaa 4800
cgagaaggtc ttgccaaagc actctttgtt gtacgaatac ttcaccgtct acaacgaatt 4860
aaccaaggtt aaatacgtta ctgaaggtat gagaaagcca gctttcctat ccggtgaaca 4920
aaagaaggct attgttgact tgttgtttaa gaccaacaga aaggtcactg ttaagcaatt 4980
gaaggaagac tacttcaaga agattgaatg tttcgattcc gtcgaaatct ccggtgttga 5040
agaccgtttc aatgcttctt tgggcaccta ccacgatttg ttaaagatca tcaaggacaa 5100
ggacttttta gataacgaag aaaacgaaga catcttggaa gatatcgttt tgaccttgac 5160
tcttttcgag gacagagaaa tgattgaaga gagattgaag acctacgctc acttgttcga 5220
cgataaagtt atgaagcaac taaagagaag aagatacact ggttggggta gattgtccag 5280
aaagttgatt aacggtatca gagacaagca atccggtaag actattttag actttttgaa 5340
atccgatggt ttcgctaaca gaaactttat gcaattgatt cacgacgatt ctttgacttt 5400
caaggaagac attcaaaaag cccaagtctc tggtcaaggt gattctttgc acgaacacat 5460
cgctaacttg gctggttctc cagctattaa gaagggtatc ttacaaaccg tcaaggtcgt 5520
tgatgaattg gtcaaagtca tgggtagaca caagccagaa aatattgtca tcgaaatggc 5580
tagagaaaac caaactactc aaaagggtca aaagaactct agagaacgta tgaagagaat 5640
tgaagaaggt atcaaggagt tgggttctca aattttgaaa gaacacccag tcgaaaacac 5700
tcaattacaa aacgaaaagc tatacttgta ctacttgcaa aacggtcgtg acatgtacgt 5760
cgaccaagaa ttggatatca acagattgtc tgactacgat gtcgatcata tcgtcccaca 5820
atcgttcttg aaggacgatt ccattgacaa caaagttttg actagatctg acaagaacag 5880
aggtaagtct gataacgttc catctgaaga agttgttaag aagatgaaga actactggag 5940
acaattgttg aatgctaagt tgatcactca aagaaagttc gacaacttga ccaaggctga 6000
aagaggtggt ttgtccgaat tggacaaagc cggtttcatc aagagacaat tagtcgaaac 6060
tagacaaatc accaagcatg ttgctcaaat cttggattcc agaatgaaca ctaagtacga 6120
tgaaaacgac aaactaatta gagaagttaa ggtcatcact ttgaagtcta agttggtttc 6180
tgacttcaga aaggacttcc aattttacaa ggtcagagaa atcaacaact accatcacgc 6240
tcacgatgcc tacttgaacg ctgttgtcgg tactgcctta atcaaaaagt acccaaagtt 6300
ggaatctgaa ttcgtttacg gtgactacaa ggtttacgat gttagaaaga tgatcgccaa 6360
gtctgaacaa gaaattggta aggccactgc taagtacttc ttctactcta acatcatgaa 6420
ctttttcaag actgaaatca ctttagctaa cggtgaaatt agaaagcgtc cattgattga 6480
aaccaatggt gaaactggtg aaattgtctg ggacaagggt agagatttcg ctaccgtcag 6540
aaaggttttg tctatgccac aagttaacat cgtcaagaag actgaagttc aaactggtgg 6600
tttctctaag gaatccattt tgccaaagag aaactctgac aagttgattg ctagaaagaa 6660
ggactgggat cctaagaagt acggtggttt cgactctcca actgttgctt actccgtttt 6720
ggtcgttgct aaggttgaaa agggtaagtc taagaagttg aagtctgtta aggaattgtt 6780
gggtatcacc atcatggaaa gatcctcctt cgaaaagaac ccaatcgact ttttggaagc 6840
taagggttac aaggaagtca agaaggattt gatcattaag ttaccaaaat actccttgtt 6900
cgaattggaa aacggtagaa agagaatgtt ggcctccgct ggtgaactac aaaaaggtaa 6960
cgaattggct ttaccatcta agtacgttaa cttcttgtac ttggcttccc actacgaaaa 7020
gttgaaaggt tccccagaag acaacgaaca aaagcaattg tttgttgaac aacacaagca 7080
ctacttggat gaaattattg aacaaatctc cgaattctcc aagagagtca ttttggctga 7140
tgctaactta gataaggttt tatccgctta caacaagcac agagacaaac caatcagaga 7200
acaagctgaa aacatcattc atttgttcac tttaaccaac ttgggtgctc cagctgcttt 7260
caaatacttc gacactacca ttgacagaaa gagatacact tccaccaaag aagttttaga 7320
tgctactttg attcaccaat ctattaccgg tttgtacgaa accagaattg acttgtctca 7380
attgggtggt gattccagag ctgatccaaa gaagaagaga aaggtgtaaa ggagttaaag 7440
gcaaagtttt cttttctaga gccgttccca caaataatta tacgtatatg cttcttttcg 7500
tttactatat atctatattt acaagccttt attcactgat gcaatttgtt tccaaatact 7560
tttttggaga tctcataact agatatcatg atggcgcaac ttggcgctat cttaattact 7620
ctggctgcca ggcccgtgta gagggccgca agaccttctg tacgccatat agtctctaag 7680
aacttgaaca agtttctaga cctattgccg cctttcggat cgctattgtt gcggccgcca 7740
gctgaagctt cgtacgctgc aggtcgacga attctaccgt tcgtataatg tatgctatac 7800
gaagttatag atctgtttag cttgcctcgt ccccgccggg tcacccggcc agcgacatgg 7860
aggcccagaa taccctcctt gacagtcttg acgtgcgcag ctcaggggca tgatgtgact 7920
gtcgcccgta catttagccc atacatcccc atgtataatc atttgcatcc atacattttg 7980
atggccgcac ggcgcgaagc aaaaattacg gctcctcgct gcagacctgc gagcagggaa 8040
acgctcccct cacagacgcg ttgaattgtc cccacgccgc gcccctgtag agaaatataa 8100
aaggttagga tttgccactg aggttcttct ttcatatact tccttttaaa atcttgctag 8160
gatacagttc tcacatcaca tccgaacata aacaaccatg ggtaaggaaa agactcacgt 8220
ttcgaggccg cgattaaatt ccaacatgga tgctgattta tatgggtata aatgggctcg 8280
cgataatgtc gggcaatcag gtgcgacaat ctatcgattg tatgggaagc ccgatgcgcc 8340
agagttgttt ctgaaacatg gcaaaggtag cgttgccaat gatgttacag atgagatggt 8400
cagactaaac tggctgacgg aatttatgcc tcttccgacc atcaagcatt ttatccgtac 8460
tcctgatgat gcatggttac tcaccactgc gatccccggc aaaacagcat tccaggtatt 8520
agaagaatat cctgattcag gtgaaaatat tgttgatgcg ctggcagtgt tcctgcgccg 8580
gttgcattcg attcctgttt gtaattgtcc ttttaacagc gatcgcgtat ttcgtctcgc 8640
tcaggcgcaa tcacgaatga ataacggttt ggttgatgcg agtgattttg atgacgagcg 8700
taatggctgg cctgttgaac aagtctggaa agaaatgcat aagcttttgc cattctcacc 8760
ggattcagtc gtcactcatg gtgatttctc acttgataac cttatttttg acgaggggaa 8820
attaataggt tgtattgatg ttggacgagt cggaatcgca gaccgatacc aggatcttgc 8880
catcctatgg aactgcctcg gtgagttttc tccttcatta cagaaacggc tttttcaaaa 8940
atatggtatt gataatcctg atatgaataa attgcagttt catttgatgc tcgatgagtt 9000
tttctaatca gtactgacaa taaaaagatt cttgttttca agaacttgtc atttgtatag 9060
tttttttata ttgtagttgt tctattttaa tcaaatgtta gcgtgattta tatttttttt 9120
cgcctcgaca tcatctgccc agatgcgaag ttaagtgcgc agaaagtaat atcatgcgtc 9180
aatcgtatgt gaatgctggt cgctatactg ctgtcgattc gatactaacg ccgccatcca 9240
gtgtcgaaaa cgagctcata acttcgtata atgtatgcta tacgaacggt agaattcgaa 9300
tcagatccac tagtgtgccc gcggaaccgc cagatattca ttacttgacg caaaagcgtt 9360
tgaaataatg acgaaaaaga aggaagaaaa aaaaagaaaa ataccgcttc taggcgggtt 9420
atctactgat ccgagcttcc actaggatag cacccaaaca cctgcatatt tggacgacct 9480
ttacttacac caccaaaaac cactttcgcc tctcccgccc ctgataacgt ccactaattg 9540
agcgattacc tgagcggtcc tcttttgttt gcagcatgag acttgcatac tgcaaatcgt 9600
aagtagcaac gtgtcaaggt caaaactgta tggaaacctt gtcacctcac ttaattctag 9660
ctagcctacc ctgcaagtca agaggtgtcc gtgattccta gccacctcaa ggtatgcctc 9720
tccccggaaa ctgtggcctt ttctggcaca catgatctcc acgatttcaa catataaata 9780
gcttttgata atggcaatat taatcaaatt tattttactt ctttcttgta acatctctct 9840
tgtaatccct tattccttct agctattttt cataaaaaac caagcaactg cttatcaaca 9900
cacaaacact aaatcaaaat gaacacaatc aatattgcca aaaatgaccc caagaaaaaa 9960
cgtaaggttt ttagcgatat cgagctagct gcaattcctt tcaacacgct agctgatcat 10020
tatggtgagc gtctggcaag agaacagctg gccctagagc acgaaagtta tgaaatggga 10080
gaagccaggt ttagaaaaat gttcgaaaga caactaaaag ccggcgaggt ggctgacaac 10140
gcagccgcta agcccctgat cacgacatta ctaccaaaaa tgattgcccg tataaacgac 10200
tggtttgagg aggtgaaagc taagcgtggc aagaggccca cagcgttcca gttccttcaa 10260
gaaattaagc ctgaagcggt cgcatatatt acgattaaaa ccactctagc ttgtcttaca 10320
agcgcggata acacaacagt acaggctgta gctagcgcga taggcagggc aatagaggac 10380
gaggccaggt tcgggcgtat tcgtgatcta gaagctaaac attttaaaaa aaacgtggaa 10440
gaacagttaa acaagagagt tgggcatgtg tacaagaaag cgttcatgca ggtcgtggag 10500
gctgacatgc tttcaaaagg cctgttggga ggagaagcat ggagtagctg gcacaaggag 10560
gactcaatcc atgtcggcgt gaggtgtatt gagatgttga tagagagtac aggcatggtg 10620
tcattacacc gtcaaaacgc aggtgttgtg ggccaagatt ctgagacgat cgaattagca 10680
ccagaatacg cggaggccat agcgactcgt gccggggcgt tggcaggaat atctccaatg 10740
tttcagccat gtgtagtacc tccgaagcca tggactggaa ttaccggtgg gggctattgg 10800
gctaatggta gaaggccgtt ggcactggtc agaacccact caaaaaaagc tttgatgcgt 10860
tatgaagatg tttacatgcc cgaggtctat aaggctatca atatcgctca aaacactgcg 10920
tggaaaatta ataagaaagt tttggctgtt gcgaacgtta taacaaagtg gaaacactgc 10980
ccagtcgagg acatccctgc gatcgagcgt gaagaattgc ccatgaaacc tgaagatatt 11040
gatatgaacc ctgaagctct gacagcgtgg aaaagagcag cagccgctgt ttacagaaaa 11100
gataaggcaa gaaaaagtag gaggatctca ctagagttca tgcttgagca ggccaataag 11160
tttgccaacc acaaggccat ctggtttcct tataacatgg actggcgtgg tagggtttac 11220
gcagtctcca tgtttaatcc tcaaggcaac gatatgacca aggggctgct taccttagca 11280
aaggggaaac ccattgggaa ggagggatac tactggctaa aaatacatgg tgcaaattgt 11340
gcaggggttg ataaagtccc atttccggaa agaataaaat tcattgagga gaaccatgag 11400
aacataatgg cctgtgctaa atcaccactt gagaatacat ggtgggcgga gcaagacagt 11460
cccttttgtt ttctggcatt ctgctttgag tatgcagggg tgcagcacca tggattgagc 11520
tataactgtt cactaccctt ggcatttgat gggagttgta gtgggattca acatttcagc 11580
gctatgttga gggatgaagt cggaggtagg gccgtcaatc ttctaccgtc tgagacggtt 11640
caagacattt acgggatagt ggctaaaaaa gtcaacgaga ttcttcaggc cgacgcgatt 11700
aatggcactg ataacgaggt agtaacagtg actgacgaaa acacgggaga aatatccgag 11760
aaagttaaac ttgggaccaa ggcgctggca ggtcaatggc tggcgtacgg cgttacgagg 11820
tctgttacga aaaggagtgt catgacatta gcgtatggat ctaaggaatt tggatttaga 11880
cagcaggtac tggaggacac catacagcca gcgatcgact ctggcaaagg tttaatgttt 11940
acacaaccca accaggctgc tgggtatatg gcaaaattga tctgggaatc cgtttcagta 12000
actgtagtag ctgcagttga ggctatgaac tggctgaaaa gcgccgccaa actgttagcg 12060
gcagaggtaa aggacaagaa aacgggcgaa atattgagaa agagatgcgc ggtccattgg 12120
gtcacgcctg atgggttccc agtctggcag gaatacaaga aaccaattca aaccagactg 12180
aaccttatgt ttctggggca gtttcgtttg cagcccacca tcaataccaa caaagattca 12240
gaaattgacg cgcacaaaca agagtcaggg atagctccaa acttcgtgca ttcacaagac 12300
gggagtcacc tgagaaagac ggtggtttgg gcccatgaga agtatggtat cgagtctttc 12360
gccctgattc acgactcctt tggtactata ccagcagacg ctgcaaacct tttcaaagct 12420
gttagagaga ctatggtcga cacatatgag tcttgcgatg tattagctga cttctatgac 12480
caattcgcgg accagctaca tgaatcccag ctagacaaaa tgccggcatt acccgccaaa 12540
gggaatctga atctaagaga tattctggaa agcgatttcg ccttcgctta aaagcttttg 12600
attaagcctt ctagtccaaa aaacacgttt ttttgtcatt tatttcattt tcttagaata 12660
gtttagttta ttcattttat agtcacgaat gttttatgat tctatatagg gttgcaaaca 12720
agcatttttc attttatgtt aaaacaattt caggtttacc ttttattctg cttgtggtga 12780
cgcgtgtatc cgcccgctct tttggtcacc catgtattta attgcataaa taattcttaa 12840
aagtggagct agtctatttc tatttacata cctctcattt ctcatttcct cccctcccgc 12900
ggtggagctc cagcttttgt tccctttagt gagggttaat tgcgcgcttg gcgtaatcat 12960
ggtcatagct gtttcctgtg tgaaattgtt atccgctcac aattccacac aacataggag 13020
ccggaagcat aaagtgtaaa gcctggggtg cctaatgagt gaggtaactc acattaattg 13080
cgttgcgctc actgcccgct ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa 13140
tcggccaacg cgcggggaga ggcggtttgc gtattgggcg ctcttccgct tcctcgctca 13200
ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg 13260
taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc 13320
agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc 13380
cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac 13440
tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc 13500
tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcata 13560
gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc 13620
acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca 13680
acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag 13740
cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta 13800
gaaggacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg 13860
gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc 13920
agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt 13980
ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa 14040
ggatcttcac ctagatcctt ttaaattaaa aatgaagttt taaatcaatc taaagtatat 14100
atgagtaaac ttggtctgac agttaccaat gcttaatcag tgaggcacct atctcagcga 14160
tctgtctatt tcgttcatcc atagttgcct gactccccgt cgtgtagata actacgatac 14220
gggagggctt accatctggc cccagtgctg caatgatacc gcgagaccca cgctcaccgg 14280
ctccagattt atcagcaata aaccagccag ccggaagggc cgagcgcaga agtggtcctg 14340
caactttatc cgcctccatc cagtctatta attgttgccg ggaagctaga gtaagtagtt 14400
cgccagttaa tagtttgcgc aacgttgttg ccattgctac aggcatcgtg gtgtcacgct 14460
cgtcgtttgg tatggcttca ttcagctccg gttcccaacg atcaaggcga gttacatgat 14520
cccccatgtt gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt gtcagaagta 14580
agttggccgc agtgttatca ctcatggtta tggcagcact gcataattct cttactgtca 14640
tgccatccgt aagatgcttt tctgtgactg gtgagtactc aaccaagtca ttctgagaat 14700
agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaat acgggataat accgcgccac 14760
atagcagaac tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga aaactctcaa 14820
ggatcttacc gctgttgaga tccagttcga tgtaacccac tcgtgcaccc aactgatctt 14880
cagcatcttt tactttcacc agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg 14940
caaaaaaggg aataagggcg acacggaaat gttgaatact catactcttc ctttttcaat 15000
attattgaag catttatcag ggttattgtc tcatgagcgg atacatattt gaatgtattt 15060
agaaaaataa acaaataggg gttccgcgca catttccccg aaaagtgcca cctgggtcct 15120
tttcatcacg tgctataaaa ataattataa tttaaatttt ttaatataaa tatataaatt 15180
aaaaatagaa agtaaaaaaa gaaattaaag aaaaaatagt ttttgttttc cgaagatgta 15240
aaagactcta gggggatcgc caacaaatac taccttttat cttgctcttc ctgctctcag 15300
gtattaa 15307
<210> 29
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> Nucleotide sequence of the INT1 genomic target
<400> 29
tattagaacc agggaggtcc 20
<210> 30
<211> 68
<212> DNA
<213> 人工序列
<220>
<223> Nucleotide sequence of the Hepatitis Delta Virus ribozyme (HDVr)
<400> 30
ggccggcatg gtcccagcct cctcgctggc gccggctggg caacatgctt cggcatggcg 60
aatgggac 68
<210> 31
<211> 47
<212> DNA
<213> 人工序列
<220>
<223> Nucleotide sequence of the T7 terminator
<400> 31
aaaaaatcaa actggctcac cttcgggtgg gcctttttgc gtttata 47
<210> 32
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> Nucleotide sequence of a weak strength T7 promoter that was used
for gRNA expression
<400> 32
taatacgact cactaatact gaa 23
<210> 33
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> Nucleotide sequence of a medium strength T7 promoter that was
used for gRNA expression
<400> 33
taatacgact cactacggaa gaa 23
<210> 34
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> Nucleotide sequence of a strong T7 promoter that was used for
gRNA expression
<400> 34
taatacgact cactataggg gaa 23
<210> 35
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> Nucleotide sequence of a wild type strength T7 promoter that was
used for gRNA expression
<400> 35
taatacgact cactatag 18
<210> 36
<211> 238
<212> DNA
<213> 人工序列
<220>
<223> Nucleotide sequence of a guide RNA expression cassette under
control of the strong T7 promoter
<400> 36
taatacgact cactataggg gaatattaga accagggagg tccgttttag agctagaaat 60
agcaagttaa aataaggcta gtccgttatc aacttgaaaa agtggcaccg agtcggtgct 120
tttggccggc atggtcccag cctcctcgct ggcgccggct gggcaacatg cttcggcatg 180
gcgaatggga caaaaaatca aactggctca ccttcgggtg ggcctttttg cgtttata 238
<210> 37
<211> 238
<212> DNA
<213> 人工序列
<220>
<223> Nucleotide sequence of a guide RNA expression cassette under
control of the medium T7 promoter
<400> 37
taatacgact cactacggaa gaatattaga accagggagg tccgttttag agctagaaat 60
agcaagttaa aataaggcta gtccgttatc aacttgaaaa agtggcaccg agtcggtgct 120
tttggccggc atggtcccag cctcctcgct ggcgccggct gggcaacatg cttcggcatg 180
gcgaatggga caaaaaatca aactggctca ccttcgggtg ggcctttttg cgtttata 238
<210> 38
<211> 238
<212> DNA
<213> 人工序列
<220>
<223> Nucleotide sequence of a guide RNA expression cassette under
control of the weak T7 promoter
<400> 38
taatacgact cactaatact gaatattaga accagggagg tccgttttag agctagaaat 60
agcaagttaa aataaggcta gtccgttatc aacttgaaaa agtggcaccg agtcggtgct 120
tttggccggc atggtcccag cctcctcgct ggcgccggct gggcaacatg cttcggcatg 180
gcgaatggga caaaaaatca aactggctca ccttcgggtg ggcctttttg cgtttata 238
<210> 39
<211> 233
<212> DNA
<213> 人工序列
<220>
<223> Nucleotide sequence of a guide RNA expression cassette under
control of the wildtype T7 promoter
<400> 39
taatacgact cactatagta ttagaaccag ggaggtccgt tttagagcta gaaatagcaa 60
gttaaaataa ggctagtccg ttatcaactt gaaaaagtgg caccgagtcg gtgcttttgg 120
ccggcatggt cccagcctcc tcgctggcgc cggctgggca acatgcttcg gcatggcgaa 180
tgggacaaaa aatcaaactg gctcaccttc gggtgggcct ttttgcgttt ata 233
<210> 40
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> Nucleotide sequence of the forward primer used to obtain the T7
controlled guide RNA fragment used in transformation
<400> 40
catgtttgac agcttatcat c 21
<210> 41
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> Nucleotide sequence of the reverse primer used to obtain the T7
controlled guide RNA fragment used in transformation
<400> 41
cacacaggaa acagctatga c 21
<210> 42
<211> 415
<212> DNA
<213> 人工序列
<220>
<223> Nucleotide sequence of the guide RNA fragment controlled by
strong T7 promoter used in transformation flanked by 84 bp
sequence of pRN1120 on the 5' side and 93 bp sequence of pRN1120
on the 3' side for in vivo assembly into the vector pRN1120
<400> 42
catgtttgac agcttatcat cgataatccg gagctagcat gcggccgctc tagaactagt 60
ggatcccccg ggctgcagga attctaatac gactcactat aggggaatat tagaaccagg 120
gaggtccgtt ttagagctag aaatagcaag ttaaaataag gctagtccgt tatcaacttg 180
aaaaagtggc accgagtcgg tgcttttggc cggcatggtc ccagcctcct cgctggcgcc 240
ggctgggcaa catgcttcgg catggcgaat gggacaaaaa atcaaactgg ctcaccttcg 300
ggtgggcctt tttgcgttta tactcgaggg ggggcccggt acccagcttt tgttcccttt 360
agtgagggtt aattccgagc ttggcgtaat catggtcata gctgtttcct gtgtg 415
<210> 43
<211> 415
<212> DNA
<213> 人工序列
<220>
<223> Nucleotide sequence of the guide RNA fragment controlled by
medium T7 promoter used in transformation flanked by 84 bp
sequence of pRN1120 on the 5' side and 93 bp sequence of pRN1120
on the 3' side for in vivo assembly into the vector pRN1120
<400> 43
catgtttgac agcttatcat cgataatccg gagctagcat gcggccgctc tagaactagt 60
ggatcccccg ggctgcagga attctaatac gactcactac ggaagaatat tagaaccagg 120
gaggtccgtt ttagagctag aaatagcaag ttaaaataag gctagtccgt tatcaacttg 180
aaaaagtggc accgagtcgg tgcttttggc cggcatggtc ccagcctcct cgctggcgcc 240
ggctgggcaa catgcttcgg catggcgaat gggacaaaaa atcaaactgg ctcaccttcg 300
ggtgggcctt tttgcgttta tactcgaggg ggggcccggt acccagcttt tgttcccttt 360
agtgagggtt aattccgagc ttggcgtaat catggtcata gctgtttcct gtgtg 415
<210> 44
<211> 415
<212> DNA
<213> 人工序列
<220>
<223> Nucleotide sequence of the guide RNA fragment controlled by weak
T7 promoter used in transformation flanked by 84 bp sequence of
pRN1120 on the 5' side and 93 bp sequence of pRN1120 on the 3'
side for in vivo assembly into the vector pRN1120
<400> 44
catgtttgac agcttatcat cgataatccg gagctagcat gcggccgctc tagaactagt 60
ggatcccccg ggctgcagga attctaatac gactcactaa tactgaatat tagaaccagg 120
gaggtccgtt ttagagctag aaatagcaag ttaaaataag gctagtccgt tatcaacttg 180
aaaaagtggc accgagtcgg tgcttttggc cggcatggtc ccagcctcct cgctggcgcc 240
ggctgggcaa catgcttcgg catggcgaat gggacaaaaa atcaaactgg ctcaccttcg 300
ggtgggcctt tttgcgttta tactcgaggg ggggcccggt acccagcttt tgttcccttt 360
agtgagggtt aattccgagc ttggcgtaat catggtcata gctgtttcct gtgtg 415
<210> 45
<211> 410
<212> DNA
<213> 人工序列
<220>
<223> Nucleotide sequence of the guide RNA fragment controlled by wild
type T7 promoter used in transformation flanked by 84 bp sequence
of pRN1120 on the 5' side and 93 bp sequence of pRN1120 on the 3'
side for in vivo assembly into the vector pRN1120
<400> 45
catgtttgac agcttatcat cgataatccg gagctagcat gcggccgctc tagaactagt 60
ggatcccccg ggctgcagga attctaatac gactcactat agtattagaa ccagggaggt 120
ccgttttaga gctagaaata gcaagttaaa ataaggctag tccgttatca acttgaaaaa 180
gtggcaccga gtcggtgctt ttggccggca tggtcccagc ctcctcgctg gcgccggctg 240
ggcaacatgc ttcggcatgg cgaatgggac aaaaaatcaa actggctcac cttcgggtgg 300
gcctttttgc gtttatactc gagggggggc ccggtaccca gcttttgttc cctttagtga 360
gggttaattc cgagcttggc gtaatcatgg tcatagctgt ttcctgtgtg 410
<210> 46
<211> 100
<212> DNA
<213> 人工序列
<220>
<223> Nucleotide sequence of upper strand of the 100 bp left flank
<400> 46
cttcatgcca gcaatagttg cgtgctgagc tcaacagtgc ccaacccttg aagcgacttc 60
caatcgcttt gcatatccag taccacaccc acaggcgttt 100
<210> 47
<211> 100
<212> DNA
<213> 人工序列
<220>
<223> Nucleotide sequence of the 100 bp left flank in the reverse
orientation complementary to SEQ ID NO: 46
<400> 47
aaacgcctgt gggtgtggta ctggatatgc aaagcgattg gaagtcgctt caagggttgg 60
gcactgttga gctcagcacg caactattgc tggcatgaag 100
<210> 48
<211> 100
<212> DNA
<213> 人工序列
<220>
<223> Nucleotide sequence of the 100 bp right flank in the forward
orientation
<400> 48
agaaagcctg tatgcgaagc cacaatcctt tccaacagac catactaagt attctttgtc 60
atcagacaac ttgttgagtg gtactaaagg agtgcttttc 100
<210> 49
<211> 100
<212> DNA
<213> 人工序列
<220>
<223> Nucleotide sequence of the 100 bp right flank in the reverse
orientation complementary to SEQ ID NO: 48
<400> 49
gaaaagcact cctttagtac cactcaacaa gttgtctgat gacaaagaat acttagtatg 60
gtctgttgga aaggattgtg gcttcgcata caggctttct 100
<210> 50
<211> 1726
<212> DNA
<213> 人工序列
<220>
<223> Nucleotide sequence of the YFP donor DNA expression cassette
<400> 50
aagcgacttc caatcgcttt gcatatccag taccacaccc acaggcgttt gtgcttagtc 60
aaaaaattag ccttttaatt ctgctgtaac ccgtacatgc ccaaaatagg gggcgggtta 120
cacagaatat ataacatcgt aggtgtctgg gtgaacagtt tattcctggc atccactaaa 180
tataatggag cccgcttttt aagctggcat ccagaaaaaa aaagaatccc agcaccaaaa 240
tattgttttc ttcaccaacc atcagttcat aggtccattc tcttagcgca actacagaga 300
acaggggcac aaacaggcaa aaaacgggca caacctcaat ggagtgatgc aacctgcctg 360
gagtaaatga tgacacaagg caattgaccc acgcatgtat ctatctcatt ttcttacacc 420
ttctattacc ttctgctctc tctgatttgg aaaaagctga aaaaaaaggt tgaaaccagt 480
tccctgaaat tattccccta cttgactaat aagtatataa agacggtagg tattgattgt 540
aattctgtaa atctatttct taaacttctt aaattctact tttatagtta gtcttttttt 600
tagttttaaa acaccaagaa cttagtttcg aataaacaca cataaacaaa caaaatgtct 660
aaaggtgaag aattattcac tggtgttgtc ccaattttgg ttgaattaga tggtgatgtt 720
aatggtcaca aattttctgt ctccggtgaa ggtgaaggtg atgctactta cggtaaattg 780
accttaaaat tgatttgtac tactggtaaa ttgccagttc catggccaac cttagtcact 840
actttaggtt atggtttgca atgttttgct agatacccag atcatatgaa acaacatgac 900
tttttcaagt ctgccatgcc agaaggttat gttcaagaaa gaactatttt tttcaaagat 960
gacggtaact acaagaccag agctgaagtc aagtttgaag gtgatacctt agttaataga 1020
atcgaattaa aaggtattga ttttaaagaa gatggtaaca ttttaggtca caaattggaa 1080
tacaactata actctcacaa tgtttacatc actgctgaca aacaaaagaa tggtatcaaa 1140
gctaacttca aaattagaca caacattgaa gatggtggtg ttcaattagc tgaccattat 1200
caacaaaata ctccaattgg tgatggtcca gtcttgttac cagacaacca ttacttatcc 1260
tatcaatctg ccttatccaa agatccaaac gaaaagagag atcacatggt cttgttagaa 1320
tttgttactg ctgctggtat tacccatggt atggatgaat tgtacaaata aaagcttttg 1380
attaagcctt ctagtccaaa aaacacgttt ttttgtcatt tatttcattt tcttagaata 1440
gtttagttta ttcattttat agtcacgaat gttttatgat tctatatagg gttgcaaaca 1500
agcatttttc attttatgtt aaaacaattt caggtttacc ttttattctg cttgtggtga 1560
cgcgtgtatc cgcccgctct tttggtcacc catgtattta attgcataaa taattcttaa 1620
aagtggagct agtctatttc tatttacata cctctcattt ctcatttcct cccctcagaa 1680
agcctgtatg cgaagccaca atcctttcca acagaccata ctaagt 1726
<210> 51
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> Nucleotide sequence forward primer to obtain the 577 bp left
flank for integration of the YFP donor DNA cassette
<400> 51
cactatagca atctggctat atg 23
<210> 52
<211> 70
<212> DNA
<213> 人工序列
<220>
<223> Nucleotide sequence reverse primer to obtain the 577 bp left
flank for integration of the YFP donor DNA cassette
<400> 52
aaacgcctgt gggtgtggta ctggatatgc aaagcgattg gaagtcgctt gactcctctg 60
ccgtcattcc 70
<210> 53
<211> 577
<212> DNA
<213> 人工序列
<220>
<223> Nucleotide sequence of the left flank for integration of YFP
donor expression cassette in INT1 locus of S. cerevisiae
<400> 53
cactatagca atctggctat atgatatgca gaaaatagtg attactgtgc tctttgctgc 60
atcatgcatc atatgtttgg cattctgtcc tgtcagatga atgggcgaaa caattcgggg 120
agctttgttg cgacttggta cccggcaagc cgcgacctat attttgcatt aaacgagttc 180
atcgtggatt tatcgccatg agccttagct tatcaagcct ctcacagaca attaagcaat 240
gaaaaaggta taccatcggc gcagaatggt taactagtgg gttcatactg ctgtgttata 300
gattgttacc taagtgatca ccaaaaaaaa gtgcaaaaag gaaaaaaaaa taagagacag 360
gtaacttcca caagcttatt cttccaaaaa tcaatcttat cttcatgcca gcaatagttg 420
cgtgctgagc tcaacagtgc ccaacccttg tgcaccgtag aattgtagaa tacaaataca 480
taaataagtg tgttcccgaa ggactaagga atgacggcag aggagtcaag cgacttccaa 540
tcgctttgca tatccagtac cacacccaca ggcgttt 577
<210> 54
<211> 72
<212> DNA
<213> 人工序列
<220>
<223> Nucleotide sequence forward primer to obtain the 581 bp right
flank for integration of the YFP donor DNA expression cassette
<400> 54
agaaagcctg tatgcgaagc cacaatcctt tccaacagac catactaagt aagcgttgaa 60
gtttcctctt tg 72
<210> 55
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> Nucleotide sequence reverse primer to obtain the 581 bp right
flank for integration of the YFP donor DNA expression cassette
<400> 55
tgtcaactgg agagctatcg 20
<210> 56
<211> 581
<212> DNA
<213> 人工序列
<220>
<223> Nucleotide sequence of the right flank for integration of YFP
donor expression cassette in INT1 locus of S. cerevisiae
<400> 56
agaaagcctg tatgcgaagc cacaatcctt tccaacagac catactaagt aagcgttgaa 60
gtttcctctt tgtatatttg agatcttcat tttatcggat tctttgtcat cagacaactt 120
gttgagtggt actaaaggag tgcttttcat catccttttg gtgaacgatt tcaaatacgt 180
tagtgttttc tgagctagtt ttgatcaatt caggtgattc gttatcagaa ctctcaggtt 240
tgtattcgtg tccagttgtg tagcattcgc ctaacgtgta agcacggatt tcttcctcag 300
aaatttcact gtatggaatc atgcccttct ttctcgcttc ttcgtcggta aatgcaccat 360
agtaatcttt gtcatcatgt ctaacagtaa ttttgaatgg gaagaagaca catagccccc 420
agtaaacgaa aaaagaaatc aaaaaggaga agaaagaatc accataaaag aatttaacaa 480
tacctgagtc gtggaaatag ttattgttga cttcccaagc gataccaggt agaccgggag 540
ccataccaca cacccaggca acgatagctc tccagttgac a 581
<210> 57
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> Nucleotide sequence of the forward primer for amplification of
the YFP expression cassette
<400> 57
gtgcttagtc aaaaaattag ccttttaatt c 31
<210> 58
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> Nucleotide sequence of the reverse primer for amplification of
the YFP expression cassette
<400> 58
gaggggagga aatgagaaat gag 23
<210> 59
<211> 72
<212> DNA
<213> 人工序列
<220>
<223> Nucleotide sequence of the forward primer for amplification of
the YFP donor DNA expression cassette including connector 5 on
the 5' side
<400> 59
aagcgacttc caatcgcttt gcatatccag taccacaccc acaggcgttt gtgcttagtc 60
aaaaaattag cc 72
<210> 60
<211> 73
<212> DNA
<213> 人工序列
<220>
<223> Nucleotide sequence of the reverse primer for amplification of
the YFP donor DNA expression cassette including connector 3 on
the 3' side
<400> 60
acttagtatg gtctgttgga aaggattgtg gcttcgcata caggctttct gaggggagga 60
aatgagaaat gag 73
<210> 61
<211> 80
<212> DNA
<213> 人工序列
<220>
<223> Nucleotide sequence of the guide RNA structural element as
described by DiCarlo
<400> 61
gttttagagc tagaaatagc aagttaaaat aaggctagtc cgttatcaac ttgaaaaagt 60
ggcaccgagt cggtgctttt 80
<210> 62
<211> 998
<212> DNA
<213> 人工序列
<220>
<223> Nucleotide sequence of ordered gBlock donor DNA with fwnA as
target
<400> 62
caactggaag caatatcacc aggactttag ctcctctctc caggtcctcc gcctcccagc 60
ctacaagtgg gatctcaaga actactggat tccctatacc aacaacttct gcctgagcaa 120
gggcgctcca gttgcgacag tagcggcagg gccacagcat gagtacctga caaccgcggc 180
tcagaaggtc attgagactc gaagtgatgg agcaacagct acagtcgtga tagagaacga 240
cattgctgat cccgagctca accgcgtcat tcaaggccat aaggtcaacg gtactgcttt 300
gtgtccctca tcactatatg ccgacatctc tcaaacgctt gcagagtatc tcatcaaaaa 360
gtacaagcct gagtacgacg gacttggact ggatgtgtgt gaggtcacag tgccacgacc 420
actgattgcg aaaggcggac agcagctctt tagagtatct gcgacagcgg attgggcgga 480
gaagaagaca acccatatat tcagtcactg ccgaggggaa gaagacggct gaccacgcaa 540
cttgcactgt ccgattcttt gactgcgctg ctgcggaggc ggaatggaaa cgagtttcct 600
accttgtcaa gaggagcatt gaccgactgc atgatatcgc cgaaaatggt gacgctcacc 660
gtcttggtag aggcatggtt tacaaactct tcgctgcctt ggttgattat gacgacaact 720
tcaagtccat tcgcgaggtt attcttgaca gtgaacagca cgaagcgact gcacgcgtca 780
agttccaagc accacaaggc aatttccacc gaaacccgtt ctggattgac agttttggac 840
acctgtctgg gttcatcatg aacgcaagcg atgcaaccga ctccaagaac caggtctttg 900
tcaatcacgg atgggactcc atgcgttgtt tgaagaagtt ctcgcctgat gtcacctaca 960
ggacttatgt tagaatgcag ccttggaaag actccatc 998
<210> 63
<211> 4517
<212> DNA
<213> 人工序列
<220>
<223> Nucleotide sequence of TOPO vector with donor DNA (target fwnA)
result of cloning gBlock donor DNA in TOPO-vector
<400> 63
agcgcccaat acgcaaaccg cctctccccg cgcgttggcc gattcattaa tgcagctggc 60
acgacaggtt tcccgactgg aaagcgggca gtgagcgcaa cgcaattaat gtgagttagc 120
tcactcatta ggcaccccag gctttacact ttatgcttcc ggctcgtatg ttgtgtggaa 180
ttgtgagcgg ataacaattt cacacaggaa acagctatga ccatgattac gccaagctat 240
ttaggtgaca ctatagaata ctcaagctat gcatcaagct tggtaccgag ctcggatcca 300
ctagtaacgg ccgccagtgt gctggaattc gcccttcaac tggaagcaat atcaccagga 360
ctttagctcc tctctccagg tcctccgcct cccagcctac aagtgggatc tcaagaacta 420
ctggattccc tataccaaca acttctgcct gagcaagggc gctccagttg cgacagtagc 480
ggcagggcca cagcatgagt acctgacaac cgcggctcag aaggtcattg agactcgaag 540
tgatggagca acagctacag tcgtgataga gaacgacatt gctgatcccg agctcaaccg 600
cgtcattcaa ggccataagg tcaacggtac tgctttgtgt ccctcatcac tatatgccga 660
catctctcaa acgcttgcag agtatctcat caaaaagtac aagcctgagt acgacggact 720
tggactggat gtgtgtgagg tcacagtgcc acgaccactg attgcgaaag gcggacagca 780
gctctttaga gtatctgcga cagcggattg ggcggagaag aagacaaccc atatattcag 840
tcactgccga ggggaagaag acggctgacc acgcaacttg cactgtccga ttctttgact 900
gcgctgctgc ggaggcggaa tggaaacgag tttcctacct tgtcaagagg agcattgacc 960
gactgcatga tatcgccgaa aatggtgacg ctcaccgtct tggtagaggc atggtttaca 1020
aactcttcgc tgccttggtt gattatgacg acaacttcaa gtccattcgc gaggttattc 1080
ttgacagtga acagcacgaa gcgactgcac gcgtcaagtt ccaagcacca caaggcaatt 1140
tccaccgaaa cccgttctgg attgacagtt ttggacacct gtctgggttc atcatgaacg 1200
caagcgatgc aaccgactcc aagaaccagg tctttgtcaa tcacggatgg gactccatgc 1260
gttgtttgaa gaagttctcg cctgatgtca cctacaggac ttatgttaga atgcagcctt 1320
ggaaagactc catcaagggc gaattctgca gatatccatc acactggcgg ccgctcgagc 1380
atgcatctag agggcccaat tcgccctata gtgagtcgta ttacaattca ctggccgtcg 1440
ttttacaacg tcgtgactgg gaaaaccctg gcgttaccca acttaatcgc cttgcagcac 1500
atcccccttt cgccagctgg cgtaatagcg aagaggcccg caccgatcgc ccttcccaac 1560
agttgcgcag cctatacgta cggcagttta aggtttacac ctataaaaga gagagccgtt 1620
atcgtctgtt tgtggatgta cagagtgata ttattgacac gccggggcga cggatggtga 1680
tccccctggc cagtgcacgt ctgctgtcag ataaagtctc ccgtgaactt tacccggtgg 1740
tgcatatcgg ggatgaaagc tggcgcatga tgaccaccga tatggccagt gtgccggtct 1800
ccgttatcgg ggaagaagtg gctgatctca gccaccgcga aaatgacatc aaaaacgcca 1860
ttaacctgat gttctgggga atataaatgt caggcatgag attatcaaaa aggatcttca 1920
cctagatcct tttcacgtag aaagccagtc cgcagaaacg gtgctgaccc cggatgaatg 1980
tcagctactg ggctatctgg acaagggaaa acgcaagcgc aaagagaaag caggtagctt 2040
gcagtgggct tacatggcga tagctagact gggcggtttt atggacagca agcgaaccgg 2100
aattgccagc tggggcgccc tctggtaagg ttgggaagcc ctgcaaagta aactggatgg 2160
ctttctcgcc gccaaggatc tgatggcgca ggggatcaag ctctgatcaa gagacaggat 2220
gaggatcgtt tcgcatgatt gaacaagatg gattgcacgc aggttctccg gccgcttggg 2280
tggagaggct attcggctat gactgggcac aacagacaat cggctgctct gatgccgccg 2340
tgttccggct gtcagcgcag gggcgcccgg ttctttttgt caagaccgac ctgtccggtg 2400
ccctgaatga actgcaagac gaggcagcgc ggctatcgtg gctggccacg acgggcgttc 2460
cttgcgcagc tgtgctcgac gttgtcactg aagcgggaag ggactggctg ctattgggcg 2520
aagtgccggg gcaggatctc ctgtcatctc accttgctcc tgccgagaaa gtatccatca 2580
tggctgatgc aatgcggcgg ctgcatacgc ttgatccggc tacctgccca ttcgaccacc 2640
aagcgaaaca tcgcatcgag cgagcacgta ctcggatgga agccggtctt gtcgatcagg 2700
atgatctgga cgaagagcat caggggctcg cgccagccga actgttcgcc aggctcaagg 2760
cgagcatgcc cgacggcgag gatctcgtcg tgacccatgg cgatgcctgc ttgccgaata 2820
tcatggtgga aaatggccgc ttttctggat tcatcgactg tggccggctg ggtgtggcgg 2880
accgctatca ggacatagcg ttggctaccc gtgatattgc tgaagagctt ggcggcgaat 2940
gggctgaccg cttcctcgtg ctttacggta tcgccgctcc cgattcgcag cgcatcgcct 3000
tctatcgcct tcttgacgag ttcttctgaa ttattaacgc ttacaatttc ctgatgcggt 3060
attttctcct tacgcatctg tgcggtattt cacaccgcat acaggtggca cttttcgggg 3120
aaatgtgcgc ggaaccccta tttgtttatt tttctaaata cattcaaata tgtatccgct 3180
catgagacaa taaccctgat aaatgcttca ataatagcac gtgaggaggg ccaccatggc 3240
caagttgacc agtgccgttc cggtgctcac cgcgcgcgac gtcgccggag cggtcgagtt 3300
ctggaccgac cggctcgggt tctcccggga cttcgtggag gacgacttcg ccggtgtggt 3360
ccgggacgac gtgaccctgt tcatcagcgc ggtccaggac caggtggtgc cggacaacac 3420
cctggcctgg gtgtgggtgc gcggcctgga cgagctgtac gccgagtggt cggaggtcgt 3480
gtccacgaac ttccgggacg cctccgggcc ggccatgacc gagatcggcg agcagccgtg 3540
ggggcgggag ttcgccctgc gcgacccggc cggcaactgc gtgcacttcg tggccgagga 3600
gcaggactga cacgtgctaa aacttcattt ttaatttaaa aggatctagg tgaagatcct 3660
ttttgataat ctcatgacca aaatccctta acgtgagttt tcgttccact gagcgtcaga 3720
ccccgtagaa aagatcaaag gatcttcttg agatcctttt tttctgcgcg taatctgctg 3780
cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc aagagctacc 3840
aactcttttt ccgaaggtaa ctggcttcag cagagcgcag ataccaaata ctgtccttct 3900
agtgtagccg tagttaggcc accacttcaa gaactctgta gcaccgccta catacctcgc 3960
tctgctaatc ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt 4020
ggactcaaga cgatagttac cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg 4080
cacacagccc agcttggagc gaacgaccta caccgaactg agatacctac agcgtgagct 4140
atgagaaagc gccacgcttc ccgaagggag aaaggcggac aggtatccgg taagcggcag 4200
ggtcggaaca ggagagcgca cgagggagct tccaggggga aacgcctggt atctttatag 4260
tcctgtcggg tttcgccacc tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg 4320
gcggagccta tggaaaaacg ccagcaacgc ggccttttta cggttcctgg gcttttgctg 4380
gccttttgct cacatgttct ttcctgcgtt atcccctgat tctgtggata accgtattac 4440
cgcctttgag tgagctgata ccgctcgccg cagccgaacg accgagcgca gcgagtcagt 4500
gagcgaggaa gcggaag 4517
<210> 64
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> Nucleotide sequence of forward primer donor DNA PCR fragment
(target fwnA)
<400> 64
caactggaag caatatcacc agg 23
<210> 65
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> Nucleotide sequence of reverse primer donor DNA PCR fragment
(target fwnA)
<400> 65
gatggagtct ttccaaggct g 21
<210> 66
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> Nucleotide sequence of forward primer to amplify the Cas9
cassette with additional KpnI-flank for ligation in AMA-vector
<400> 66
cccggtaccg caactctctg gaaatgaagg c 31
<210> 67
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> Nucleotide sequence of reverse primer to amplify the Cas9
cassette with additional KpnI-flank for ligation in AMA-vector
<400> 67
cccggtaccg aggttcatgg tatgggcacg 30
<210> 68
<211> 19569
<212> DNA
<213> 人工序列
<220>
<223> Nucleotide sequence of BG-AMA17 (Cas9/hygB) - result of ligation
PCR-fragment (Cas9-cassette with KpnI-flanks) and BG-AMA8
<400> 68
ggtaccgagg ttcatggtat gggcacgaat gtcaaaaatt ttcaggctca aacgggtatg 60
tattcagtat ctatctccgt gtacgacggc taattgagcc cagctgcatt tcgaactctt 120
ctcccagcgc attttgtgtg ggagttcttc gatgctgacc atgactgcga ggctgctgag 180
ggagtgcgcg gtatctaccc cggcccgtat ctggcttcta caaggagtga aactagttta 240
tactttgtag ttcggaatcc aatgctatta accgttttta ctttttcttt tgttcgagct 300
aagcgcttgt ttaaaccttg cgcttcttct tgggatcggc acgagagtca ccaccgagct 360
gagacaggtc gatacgagtc tcgtacagac cggtaatcga ctggtggatc agagtcgcat 420
caagcacttc cttggtggag gtgtaacgct tgcggtcgat ggtggtgtca aagtacttga 480
aagcagcagg agcacccagg ttggtgaggg tgaacaggtg gatgatgttc tccgcctgct 540
cgcggatggg cttgtcacgg tgcttgttgt aggcagagag gaccttgtca aggttggcat 600
cggccaggat gacacgcttg ctgaactcgg agatctgctc gatgatctca tccaggtagt 660
gcttgtgctg ctcgacaaag agctgcttct gctcgttgtc ctcgggagag cccttgagct 720
tctcgtagtg ggaggccagg tagaggaagt tgacgtactt ggaggggagg gcaagctcgt 780
tacccttctg gagctcaccg gcggaagcaa gcatgcgctt acggccgttc tccagctcga 840
acagagagta cttggggagc ttgatgatga ggtccttctt gacctctttg taacccttgg 900
cctccaggaa gtcgataggg ttcttctcga agctgctgcg ttccatgatg gtgataccga 960
ggagttcctt cacactcttc agcttcttgc tcttgccctt ctcgaccttg gcgacaacca 1020
agacggagta ggcaacggta ggcgaatcga atccaccgta cttcttgggg tcccaatcct 1080
tcttgcgagc gatcagcttg tcggagttgc gcttgggaag aatcgactcc ttggagaaac 1140
caccagtctg cacctcggtc ttcttgacaa tgttgacctg gggcatagaa aggaccttgc 1200
ggacggtagc gaagtcacgg cccttgtccc agacgatctc accggtttcg ccgttagtct 1260
caatcaaggg acgcttgcga atctcgccgt tggccaatgt tatttcggtc ttgaagaagt 1320
tcatgatgtt gctgtagaag aagtacttgg cagtggcctt tccgatctcc tgctcggact 1380
tagcgatcat cttgcgcacg tcgtacacct tgtagtcacc gtagacgaac tcggactcga 1440
gcttgggata cttcttaatc aaagcagtac cgacgacggc gttgaggtag gcatcgtgag 1500
cgtggtggta gttgttgatc tcgcggacct tgtagaactg gaagtctttc ctaaagtcac 1560
tgaccagctt gctctttaag gtgatgacct tgacctcacg gatgagcttg tcgttctcgt 1620
cgtacttggt gttcatgcga gagtccagga tctgggcaac gtgcttagtg atctgacggg 1680
tttcaaccaa ttgacgcttg atgaaaccgg ccttgtcgag ctcggagagt ccgccacgct 1740
cggccttggt aaggttgtcg aacttgcgct gagtgatgag cttagcgttg agcaattgtc 1800
tccagtagtt cttcatcttc ttaacaacct cttccgaggg gacgttatcg ctcttgccac 1860
gattcttgtc ggaacgggtg agcaccttgt tgtcaatgct gtcatccttg aggaaggact 1920
gggggacgat gtggtcaaca tcgtagtcgg agaggcggtt gatatccagc tcctggtcga 1980
cgtacatgtc acgtccgttc tgcaagtagt agaggtagag cttctcattc tgcagctggg 2040
tgttctcgac ggggtgttcc ttgagaatct gggaaccgag ctccttgatg ccttcctcga 2100
tacgcttcat gcgctcacgg ctgttcttct gacccttctg agtggtctgg ttctcacgag 2160
ccatttcgat gacgatgttc tcgggcttgt gacgacccat gaccttcaca agctcgtcaa 2220
caaccttcac agtctgcagg atacccttct tgatagcggg ggaaccagcc aggttggcaa 2280
tgtgttcgtg tagcgagtca ccctggccgg agacttgggc cttctggatg tcctctttga 2340
aggtcagaga gtcgtcgtgg atgagctgca tgaagttgcg gttggcgaag ccgtcggact 2400
tcaggaagtc aaggatggtc ttgccagact gcttatcacg gataccgtta atcaacttgc 2460
gagagaggcg accccagcca gtgtaacggc ggcgcttcaa ctgcttcatg accttgtcgt 2520
cgaagaggtg agcgtaggtc ttcagacgtt cttcgatcat ctcacggtcc tcgaagaggg 2580
tgagggtaag aacaatgtcc tcaagaatgt cttcgttctc ctcgttgtca aggaagtcct 2640
tgtccttgat gatcttgagc agatcgtggt aggtgccgag agaagcgttg aagcggtcct 2700
caacaccgga gatctcaacg gagtcaaagc actcgatctt cttgaagtag tcttccttga 2760
gctgcttgac ggtcaccttg cggttagtct tgaacagcag gtcgacaatg gccttcttct 2820
gttcgccgga gaggaaagca ggcttgcgca tgccctcggt cacgtacttg accttggtca 2880
gctcgttgta gacagtgaag tactcgtaca agagggagtg cttgggcagg actttctcgt 2940
tgggcaggtt cttgtcgaag ttggtcatac gctcaatgaa gctctgagcg gaggcaccct 3000
tgtcgacgac ttcctcgaag ttccaggggg tgatggtttc ctcggacttg cgggtcatcc 3060
aggcgaagcg ggagttaccg cgagccagag gaccgacgta gtaggggata cggaaggtca 3120
ggatcttctc aatcttctca cggttgtcct tcaagaaagg gtagaagtct tcctggcgac 3180
gaaggatggc gtgcaattca cccaggtgga tctggtgggg gatgctgccg ttgtcgaaag 3240
tacgctgctt gcgcagaagg tcctcacggt tcagcttaac aagaagctcc tcagtgccat 3300
ccatcttctc gaggataggc ttaatgaact tgtagaattc ttcctgggaa gcaccaccgt 3360
cgatgtaacc ggcgtagccg ttcttggact ggtcgaagaa gatctccttg tacttttcgg 3420
ggagctgctg gcggaccaga gccttgagta gggtgaggtc ctggtggtgc tcatcgtatc 3480
tcttgatcat agaggcggag agaggggcct tggtgatctc agtgttgaca cggaggatat 3540
ctgacaggag aatggcatcg gagaggttct tggcagctag gaagaggtcg gcgtactgat 3600
ctcctatctg ggcgagaagg ttatcaaggt cgtcgtcgta ggtatccttg gaaagttgta 3660
acttagcatc ctcagcaaga tcgaagttgc tcttgaagtt gggagtcagt ccgagggaca 3720
gggcaataag gttgccgaaa agaccgttct tcttctcacc agggagctgg gcaatcaagt 3780
tctcaagacg gcgggacttg ctcaggcgag cggagaggat ggccttggca tccacgccag 3840
acgcgttgat ggggttttcc tcgaaaagct ggttgtaggt ctgaacgagc tggatgaaga 3900
gtttatcaac atcggagttg tcggggttga ggtcaccctc gatcaggaag tgaccacgga 3960
acttgatcat gtgcgccaga gccaggtaaa tgaggcggag gtcagccttg tcggtgctgt 4020
cgacgagctt tttgcgtagg tggtagatgg tggggtactt ctcgtggtaa gcgacctcat 4080
cgacaatgtt accgaagata gggtgacgct cgtgcttctt gtcttcttca acaaggaacg 4140
actcctccag acggtggaag aaagagtcat caaccttggc catctcgttg gagaaaatct 4200
cctggaggta gcagatacgg ttcttgcggc gagtgtaacg acggcgagcg gtacgcttca 4260
gacgggtggc ctcagcagtc tcaccggagt cgaagagaag cgcaccaatg aggttcttct 4320
tgatggagtg acgatcggtg tttcccagga ccttgaattt cttgctagga accttgtact 4380
cgtcggtgat gacagcccag ccaacggagt tggtgccaat gtccagaccg atgctatact 4440
tcttgtccat tttgacggtg gaaggtgagt tggggttggt gtcatcgtgg gggaagaact 4500
tggcttttat atgggtgcag gtgaggggac ttaagccacg tgaaagttca ttcgagagag 4560
ctaaggcata ttaatgcaca tgtgtgggag ttgcatggaa cttgcatgaa aggtgcatga 4620
aaggtgcatg gtattgcaga atgcgctcgg gggtctgcgg agaaatccgt taggaaaaga 4680
tcgtcatcct tctgctgcat caccgttagc ttgaaattta gttccagcgc tagtcaaggg 4740
cttcagttca gattctgcaa gtatcaggtc catcattact ctcttcagca ggcggatcga 4800
atatcccccg aggcacatgg gaggtcttat tatccgatcg ttgatcacca tgccaatcgc 4860
ttcgaccgac cacaagttgc atcaagcact aactgcctca agcagatgcc gagtcttcat 4920
ctccgatatt taatcccgtt gaatctccgc cccctgtcat ctccaccgtt taatctgggg 4980
tggtggcgga tgtccaccaa ttagccggct aaattatccc catcgtcagc acgctagacc 5040
tgccttggaa ctagcgcttt ggtgagaaat ctcttggttg tgagtctgat accacattcc 5100
ttgacttcca tgttgttctg gaggtgtgaa agtataaaca atgccacaga tggactaatc 5160
tccggagaga tgaccctctt caagactggt gcagtgccta ggatcgctag tatcccaaaa 5220
cttcggggct gccttcattt ccagagagtt gcggtacctt gcccatcgaa cgtacaagta 5280
ctcctctgtt ctctccttcc tttgctttgt gcggagaccg gcttactaaa agccagataa 5340
cagtatgcat atttgcgcgc tgatttttgc ggtataagaa tatatactga tatgtatacc 5400
cgaagtatgt caaaaagagg tatgctatga agcagcgtat tacagtgaca gttgacagcg 5460
acagctatca gttgctcaag gcatatatga tgtcaatatc tccggtctgg taagcacaac 5520
catgcagaat gaagcccgtc gtctgcgtgc cgaacgctgg aaagcggaaa atcaggaagg 5580
gatggctgag gtcgcccggt ttattgaaat gaacggctct tttgctgacg agaacagggg 5640
ctggtgaaat gcagtttaag gtttacacct ataaaagaga gagccgttat cgtctgtttg 5700
tggatgtaca gagtgatatt attgacacgc ccgggcgacg gatggtgatc cccctggcca 5760
gtgcacgtct gctgtcagat aaagtctccc gtgaacttta cccggtggtg catatcgggg 5820
atgaaagctg gcgcatgatg accaccgata tggccagtgt gccggtttcc gttatcgggg 5880
aagaagtggc tgatctcagc caccgcgaaa atgacatcaa aaacgccatt aacctgatgt 5940
tctggggaat ataaggtctc gcctccggat cgatgtacac aaccgactgc acccaaacga 6000
acacaaatct tagcagtgcc ctcgccggat agcttggact gtcctttacc gtcgccagca 6060
caagaagggt atctctgagg tccgtaccgc cttttcttta ccactggatt cgattttcgc 6120
agttggaatg atacatctgg ggactgcgaa tggtttaccc ctcggccgat actatgggtc 6180
gtgaagagat ggaacattcc gaaagtgttt tgcggataac attggtggca tcgaaaacag 6240
aatgctgacc attgatttca acacgaacag gaggttgcca agaagcgtac ccgccgtgtc 6300
gtcaagtccc agcgtgccat cgtcggtgct tccctcgacg tgatcaagga gcgccgctcc 6360
cagcgccccg aggcccgtgc cgccgcccgc cagcaggcca tcaaggacgc caaggagaag 6420
aaggctgccg ctgagtccaa gaagaaggct gagaaggcta agaacgccgc tgctggtgcc 6480
aagggtgctg ctcagcgcat ccagagcaag cagggtgcta agggttctgc tcccaaggtc 6540
gctgccaagt ctcgttaagg aatgaataac ggttcggctt gggattgggt gcggaaggca 6600
agagtttcat ggacgaattt tgggaggtta ctggagctgg aatatgtgtt ttccctacca 6660
ccaaaaatga aatgttccaa aactatcggc gtgcaagacg gcctcttacg ggtttaacgg 6720
ctctcagata agctctatca atcgcgccac ggatgcatga atgaagatcc agatggccgc 6780
gggatatatc gtgctagtgt aattcctaca tgatcttgct gttcactcca tgcgcatcca 6840
gatattccag gggtcgactg ttaattgata tgcctgggct tgagactccg tagacgccca 6900
gtcaatgtgc aattaatacg agggtgctgt tatcggcagc aaccttgtac ttctccataa 6960
gatgggggaa tgccatggac ctgagtgatc aattgacgca agtctcccat aacgcggcgg 7020
cttgacctaa aatccatata ccgccccgtt gagcctccgc gctccagagt cctgtcccgg 7080
aatagggcac aaacctaggc taacctaatt cgtcgtccgc gtctgagttc agacaaaaga 7140
acttccaagt atcagcagag tacgctgata ttgataagta ggcaaacata agaccaataa 7200
gcaagtagaa taaaaaatta taaggacact gcctccataa agcgccctcc caagacctca 7260
gggacaaaac ttctcaagtg gcaattcact gcctcaggcc gtgtccagtg aagtgacgaa 7320
gcgacactgt tgcctgctga ctcagccgct ttccgccctg ccgaatttgc catctcgctt 7380
acaggtcagc actagcgcga ttcgcccaca gatgctcagc gcaaagtggt gactcagtca 7440
aaccccccct acaagattcc acctcgattt ttcaacttcc catctcgatc cgacaagttc 7500
tacatccacc gtcaaaatgg cctccagcga agatgtcatc aaggagttca tgcgcttcaa 7560
ggtccgcatg gaaggatccg tcaacggcca cgagttcgag attgagggtg agggtgaggg 7620
ccgcccctac gaaggcaccc agactgccaa gctcaaggtc accaagggtg gtcctctccc 7680
cttcgcttgg gatatcctgt ctcctcagtt ccagtacggc tccaaggtct acgtcaagca 7740
ccccgccgac atccccgact acaagaagct ttctttcccc gagggtttca agtgggagcg 7800
tgtcatgaac ttcgaggatg gtggtgttgt gaccgttact caggacagca gcttgcagga 7860
tggctctttc atctacaagg tcaagttcat tggtgtcaac ttcccctccg acggccctgt 7920
catgcagaag aagaccatgg gctgggaagc gtcgactgag cgtctgtacc cccgtgacgg 7980
tgttctcaag ggtgagatcc acaaggctct caagctcaag gacggtggtc actaccttgt 8040
tgagttcaag tccatctaca tggccaagaa gcctgtgcag ctgcccggat actactacgt 8100
ggactccaag cttgacatca cctcccacaa cgaagactac accattgttg agcagtacga 8160
gcgtgctgag ggccgccacc acctcttcct gacccacgga atggatgagc tgtacaagtc 8220
gaaactataa ataaatggtt tgcgttgcga ttgactgaaa cgaaaaaaag cgaaaatgat 8280
tctgggaatg aattgataaa gcgcgggctc tgcggtacgg ttacggttgc ggtcgcggac 8340
gaatggactg ggctgagctg ggctggagga agtccatcga acaaggacaa ggggtggaat 8400
atggcacggg tcgattttgt tatacatacc ctaccatcca tctatccatt taaataccaa 8460
atgagttgtt gaatggattc gcggtcttct cggtttattt ttgcttgctt gcgtgcttaa 8520
gggatagtgt gcctcacgct ttccggcatc ttccagacca cagtatatcc atccgcctcc 8580
tgttgaagct tattttttgt atactgtttt gtgatagcac gaagtttttc cacggtatct 8640
tgttaaaaat atatatttgt ggcgggctta cctacatcaa attaataaga gactaattat 8700
aaactaaaca cacaagcaag ctactttagg gtaaaagttt ataaatgctt ttgacgtata 8760
aacgttgctt gtatttatta ttacaattaa aggtggatag aaaacctaga gactagttag 8820
aaactaatct caggtttgcg ttaaactaaa tcagagcccg agaggttaac agaacctaga 8880
aggggactag atatccgggt agggaaacaa aaaaaaaaaa caagacagcc acatattagg 8940
gagactagtt agaagctagt tccaggacta ggaaaataaa agacaatgat accacagtct 9000
agttgacaac tagatagatt ctagattgag gccaaagtct ctgagatcca ggttagttgc 9060
aactaatact agttagtatc tagtctccta taactctgaa gctagaataa cttactacta 9120
ttatcctcac cactgttcag ctgcgcaaac ggagtgattg caaggtgttc agagactagt 9180
tattgactag tcagtgacta gcaataacta acaaggtatt aacctaccat gtctgccatc 9240
accctgcact tcctcgggct cagcagcctt ttcctcctca ttttcatgct cattttcctt 9300
gtttaagact gtgactagtc aaagactagt ccagaaccac aaaggagaaa tgtcttacca 9360
ctttcttcat tgcttgtctc ttttgcatta tccatgtctg caactagtta gagtctagtt 9420
agtgactagt ccgacgagga cttgcttgtc tccggattgt tggaggaact ctccagggcc 9480
tcaagatcca caacagagcc ttctagaaga ctggtcaata actagttggt ctttgtctga 9540
gtctgactta cgaggttgca tactcgctcc ctttgcctcg tcaatcgatg agaaaaagcg 9600
ccaaaactcg caatatggct ttgaaccaca cggtgctgag actagttaga atctagtccc 9660
aaactagctt ggatagctta cctttgccct ttgcgttgcg acaggtcttg cagggtatgg 9720
ttcctttctc accagctgat ttagctgcct tgctaccctc acggcggatc tgcataaaga 9780
gtggctagag gttataaatt agcactgatc ctaggtacgg ggctgaatgt aacttgcctt 9840
tcctttctca tcgcgcggca agacaggctt gctcaaattc ctaccagtca caggggtatg 9900
cacggcgtac ggaccacttg aactagtcac agattagtta gcaactagtc tgcattgaat 9960
ggctgtactt acgggccctc gccattgtcc tgatcatttc cagcttcacc ctcgttgctg 10020
caaagtagtt agtgactagt caaggactag ttgaaatggg agaagaaact cacgaattct 10080
cgacaccctt agtattgtgg tccttggact tggtgctgct atatattagc taatacacta 10140
gttagactca cagaaactta cgcagctcgc ttgcgcttct tggtaggagt cggggttggg 10200
agaacagtgc cttcaaacaa gccttcatac catgctactt gactagtcag ggactagtca 10260
ccaagtaatc tagataggac ttgcctttgg cctccatcag ttccttcata gtgggaggtc 10320
cattgtgcaa tgtaaactcc atgccgtggg agttcttgtc cttcaagtgc ttgaccaata 10380
tgtttctgtt ggcagaggga acctgtcaac tagttaataa ctagtcagaa actagtatag 10440
cagtagactc actgtacgct tgaggcatcc cttcactcgg cagtagactt catatggatg 10500
gatatcaggc acgccattgt cgtcctgtgg actagtcagt aactaggctt aaagctagtc 10560
gggtcggctt actatcttga aatccggcag cgtaagctcc ccgtccttaa ctgcctcgag 10620
atagtgacag tactctgggg actttcggag atcgttatcg cgaatgctcg gcatactaat 10680
cgttgactag tcttggacta gtcccgagca aaaaggattg gaggaggagg aggaaggtga 10740
gagtgagaca aagagcgaaa taagagcttc aaaggctatc tctaagcagt atgaaggtta 10800
agtatctagt tcttgactag atttaaaaga gatttcgact agttatgtac ctggagtttg 10860
gatataggaa tgtgttgtgg taacgaaatg taagggggag gaaagaaaaa gtcggtcaag 10920
aggtaactct aagtcggcca ttcctttttg ggaggcgcta accataaacg gcatggtcga 10980
cttagagtta gctcagggaa tttagggagt tatctgcgac caccgaggaa cggcggaatg 11040
ccaaagaatc ccgatggagc tctagctggc ggttgacaac cccacctttt ggcgtttctg 11100
cggcgttgca ggcgggactg gatacttcgt agaaccagaa aggcaaggca gaacgcgctc 11160
agcaagagtg ttggaagtga tagcatgatg tgccttgtta actaggtcaa aatctgcagt 11220
atgcttgatg ttatccaaag tgtgagagag gaaggtccaa acatacacga ttgggagagg 11280
gcctaggtat aagagttttt gagtagaacg catgtgagcc cagccatctc gaggagatta 11340
aacacgggcc ggcatttgat ggctatgtta gtaccccaat ggaaagcctg agagtccagt 11400
ggtcgcagat aactccctaa attccctgag ctaactctaa gtcgaccatg ccgtttatgg 11460
ttagcgcctc ccaaaaagga atggccgact tagagttacc tcttgaccga ctttttcttt 11520
cctccccctt acatttcgtt accacaacac attcctatat ccaaactcca ggtacataac 11580
tagtcgaaat ctcttttaaa tctagtcaag aactagatac ttaaccttca tactgcttag 11640
agatagcctt tgaagctctt atttcgctct ttgtctcact ctcaccttcc tcctcctcct 11700
ccaatccttt ttgctcggga ctagtccaag actagtcaac gattagtatg ccgagcattc 11760
gcgataacga tctccgaaag tccccagagt actgtcacta tctcgaggca gttaaggacg 11820
gggagcttac gctgccggat ttcaagatag taagccgacc cgactagctt taagcctagt 11880
tactgactag tccacaggac gacaatggcg tgcctgatat ccatccatat gaagtctact 11940
gccgagtgaa gggatgcctc aagcgtacag tgagtctact gctatactag tttctgacta 12000
gttattaact agttgacagg ttccctctgc caacagaaac atattggtca agcacttgaa 12060
ggacaagaac tcccacggca tggagtttac attgcacaat ggacctccca ctatgaagga 12120
actgatggag gccaaaggca agtcctatct agattacttg gtgactagtc cctgactagt 12180
caagtagcat ggtatgaagg cttgtttgaa ggcactgttc tcccaacccc gactcctacc 12240
aagaagcgca agcgagctgc gtaagtttct gtgagtctaa ctagtgtatt agctaatata 12300
tagcagcacc aagtccaagg accacaatac taagggtgtc gagaattcgt gagtttcttc 12360
tcccatttca actagtcctt gactagtcac taactacttt gcagcaacga gggtgaagct 12420
ggaaatgatc aggacaatgg cgagggcccg taagtacagc cattcaatgc agactagttg 12480
ctaactaatc tgtgactagt tcaagtggtc cgtacgccgt gcatacccct gtgactggta 12540
ggaatttgag caagcctgtc ttgccgcgcg atgagaaagg aaaggcaagt tacattcagc 12600
cccgtaccta ggatcagtgc taatttataa cctctagcca ctctttatgc agatccgccg 12660
tgagggtagc aaggcagcta aatcagctgg tgagaaagga accataccct gcaagacctg 12720
tcgcaacgca aagggcaaag gtaagctatc caagctagtt tgggactaga ttctaactag 12780
tctcagcacc gtgtggttca aagccatatt gcgagttttg gcgctttttc tcatcgattg 12840
acgaggcaaa gggagcgagt atgcaacctc gtaagtcaga ctcagacaaa gaccaactag 12900
ttattgacca gtcttctaga aggctctgtt gtggatcttg aggccctgga gagttcctcc 12960
aacaatccgg agacaagcaa gtcctcgtcg gactagtcac taactagact ctaactagtt 13020
gcagacatgg ataatgcaaa agagacaagc aatgaagaaa gtggtaagac atttctcctt 13080
tgtggttctg gactagtctt tgactagtca cagtcttaaa caaggaaaat gagcatgaaa 13140
atgaggagga aaaggctgct gagcccgagg aagtgcaggg tgatggcaga catggtaggt 13200
taataccttg ttagttattg ctagtcactg actagtcaat aactagtctc tgaacacctt 13260
gcaatcactc cgtttgcgca gctgaacagt ggtgaggata atagtagtaa gttattctag 13320
cttcagagtt ataggagact agatactaac tagtattagt tgcaactaac ctggatctca 13380
gagactttgg cctcaatcta gaatctatct agttgtcaac tagactgtgg tatcattgtc 13440
ttttattttc ctagtcctgg aactagcttc taactagtct ccctaatatg tggctgtctt 13500
gttttttttt tttgtttccc tacccggata tctagtcccc ttctaggttc tgttaacctc 13560
tcgggctctg atttagttta acgcaaacct gagattagtt tctaactagt ctctaggttt 13620
tctatccacc tttaattgta ataataaata caagcaacgt ttatacgtca aaagcattta 13680
taaactttta ccctaaagta gcttgcttgt gtgtttagtt tataattagt ctcttattaa 13740
tttgatgtag gtaagcccgc cacaaatata tatttttaac aagataccgt ggaaaaactt 13800
cgtgctatca caaaacagta tacaaaaaat aagctatcga attcctgcag agatcatcct 13860
gtcttcagtc ttaagacttc tctcctatat cacccgcact taccctagag tgccgcttag 13920
gtgctaaggg cacattgagt attggccgtg tagaatatat agcttaagta cggccaagca 13980
gacgggaagc cctgttctcc acaccctatg gtcgtatata tcaggcttct accgggaaac 14040
gattaagagt gtataatgga ctgaaaatca atatgaacgg gacaatgctc aagttaaatt 14100
agttaggcat cctaatctct actaaatgtt ctatctagag atcggggtac tataggcccg 14160
tacgttaatc actctacgct tctctccctt aggtatagtg taggtagggg ctagacattt 14220
atatgagtca gatggtacaa acggtaggca gtgcgggcga agaagtgaag acggagtcgg 14280
ttgaagctac atacaaaaga tgcattggct cgtcatgaag agcctcccgg gtttattcct 14340
ttgccctcgg acgagtgctg gggcgtcggt ttccactatc ggcgagtact tctacacagc 14400
catcggtcca gacggccgcg cttctgcggg cgatttgtgt acgcccgaca gtcccggctc 14460
cggatcggac gattgcgtcg catcgaccct gcgcccaagc tgcatcatcg aaattgccgt 14520
caaccaagct ctgatagagt tggtcaagac caatgcggag catatacgcc cggagccgcg 14580
gcgatcctgc aagctccgga tgcctccgct cgaagtagcg cgtctgctgc tccatacaag 14640
ccaaccacgg cctccagaag aagatgttgg cgacctcgta ttgggaatcc ccgaacatcg 14700
cctcgctcca gtcaatgacc gctgttatgc ggccattgtc cgtcaggaca ttgttggagc 14760
cgaaatccgc gtgcacgagg tgccggactt cggggcagtc ctcggcccaa agcatcagct 14820
catcgagagc ctgcgcgacg gacgcactga cggtgtcgtc catcacagtt tgccagtgat 14880
acacatgggg atcagcaatc gcgcatatga aatcacgcca tgtagtgtat tgaccgattc 14940
cttgcggtcc gaatgggccg aacccgctcg tctggctaag atcggccgca gcgatcgcat 15000
ccatggcctc cgcgaccggc tgcagaacag cgggcagttc ggtttcaggc aggtcttgca 15060
acgtgacacc ctgtgcacgg cgggagatgc aataggtcag gctctcgctg aattccccaa 15120
tgtcaagcac ttccggaatc gggagcgcgg ccgatgcaaa gtgccgataa acataacgat 15180
ctttgtagaa accatcggcg cagctattta cccgcaggac atatccacgc cctcctacat 15240
cgaagctgaa agcacgagat tcttcgccct ccgagagctg catcaggtcg gagacgctgt 15300
cgaacttttc gatcagaaac ttctcgacag acgtcgcggt gagttcaggc attttgacgg 15360
tgggatcctg tgatgtctgc tcaagcgggg tagctgttag tcaagctgcg atgaagtggg 15420
aaagctcgaa ctgaaaggtt caaaggaata agggatggga aggatggagt atggatgtag 15480
caaagtactt acttagggga aataaaggtt cttggatggg aagatgaata tactgaagat 15540
gggaaaagaa agagaaaaga aaagagcagc tggtggggag agcaggaaaa tatggcaaca 15600
aatgttggac tgacgcaacg accttgtcaa ccccgccgac acaccgggcg gacagacggg 15660
gcaaagctgc ctaccaggga ctgagggacc tcagcaggtc gagtgcagag caccggatgg 15720
gtcgactgcc agcttgtgtt cccggtctgc gccgctggcc agctcctgag cggcctttcc 15780
ggtttcatac accgggcaaa gcaggagagg cacgatattt ggacgcccta cagatgccgg 15840
atgggccaat tagggagctt acgcgccggg tactcgctct acctacttcg gagaaggtac 15900
tatctcgtga atcttttacc agatcggaag caattggact tctgtaccta ggttaatggc 15960
atgctatttc gccgacggct atacacccct ggcttcacat tctccttcgc ttactgccgg 16020
tgattcgatg aagctccata ttctccgatg atgcaataga ttcttggtca acgaggggca 16080
caccagcctt tccacttcgg ggcggagggg cggccggtcc cggattaata atcatccact 16140
gcacctcaga gccgccagag ctgtctggcg cagtggcgct tattactcag cccttctctc 16200
tgcgtccgtc cgtctctccg catgccagaa agagtcaccg gtcactgtac agagcggccg 16260
ccaccgcggt ggagctccaa ttcgccctat agtgagtcgt attacgcgcg ctcactggcc 16320
gtcgttttac aacgtcgtga ctgggaaaac cctggcgtta cccaacttaa tcgccttgca 16380
gcacatcccc ctttcgccag ctggcgtaat agcgaagagg cccgcaccga tcgcccttcc 16440
caacagttgc gcagcctgaa tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg 16500
gcgggtgtgg tggttacgcg cagcgtgacc gctacacttg ccagcgccct agcgcccgct 16560
cctttcgctt tcttcccttc ctttctcgcc acgttcgccg gctttccccg tcaagctcta 16620
aatcgggggc tccctttagg gttccgattt agtgctttac ggcacctcga ccccaaaaaa 16680
cttgattagg gtgatggttc acgtagtggg ccatcgccct gatagacggt ttttcgccct 16740
ttgacgttgg agtccacgtt ctttaatagt ggactcttgt tccaaactgg aacaacactc 16800
aaccctatct cggtctattc ttttgattta taagggattt tgccgatttc ggcctattgg 16860
ttaaaaaatg agctgattta acaaaaattt aacgcgaatt ttaacaaaat attaacgctt 16920
acaatttagg tggcactttt cggggaaatg tgcgcggaac ccctatttgt ttatttttct 16980
aaatacattc aaatatgtat ccgctcatga gacaataacc ctgataaatg cttcaataat 17040
attgaaaaag gaagagtatg agtattcaac atttccgtgt cgcccttatt cccttttttg 17100
cggcattttg ccttcctgtt tttgctcacc cagaaacgct ggtgaaagta aaagatgctg 17160
aagatcagtt gggtgcacga gtgggttaca tcgaactgga tctcaacagc ggtaagatcc 17220
ttgagagttt tcgccccgaa gaacgttttc caatgatgag cacttttcga ccgaataaat 17280
acctgtgacg gaagatcact tcgcagaata aataaatcct ggtgtccctg ttgataccgg 17340
gaagccctgg gccaactttt ggcgaaaatg agacgttgat cggcacgtaa gaggttccaa 17400
ctttcaccat aatgaaataa gatcactacc gggcgtattt tttgagttgt cgagattttc 17460
aggagctaag gaagctaaaa tggagaaaaa aatcactgga tataccaccg ttgatatatc 17520
ccaatggcat cgtaaagaac attttgaggc atttcagtca gttgctcaat gtacctataa 17580
ccagaccgtt cagctggata ttacggcctt tttaaagacc gtaaagaaaa ataagcacaa 17640
gttttatccg gcctttattc acattcttgc ccgcctgatg aatgctcatc cggaattacg 17700
tatggcaatg aaagacggtg agctggtgat atgggatagt gttcaccctt gttacaccgt 17760
tttccatgag caaactgaaa cgttttcatc gctctggagt gaataccacg acgatttccg 17820
gcagtttcta cacatatatt cgcaagatgt ggcgtgttac ggtgaaaacc tggcctattt 17880
ccctaaaggg tttattgaga atatgttttt cgtctcagcc aatccctggg tgagtttcac 17940
cagttttgat ttaaacgtgg ccaatatgga caacttcttc gcccccgttt tcaccatggg 18000
caaatattat acgcaaggcg acaaggtgct gatgccgctg gcgattcagg ttcatcatgc 18060
cgtttgtgat ggcttccatg tcggcagaat gcttaatgaa ttacaacagt actgcgatga 18120
gtggcagggc ggggcgtaat ttttttaagg cagttattgg tgcccttaaa cgcctggttg 18180
ctacgcctga ataagtgata ataagcggat gaatggcaga aattcgaaag caaattcgac 18240
ccggtcgtcg gttcagggca gggtcgttaa atagccgctt atgtctattg ctggtttacc 18300
ggtttattga ctaccggaag cagtgtgacc gtgtgcttct caaatgcctg aggccagttt 18360
gctcaggctc tccccgtgga ggtaataatt gacgatatga tccttttttt ctgatcaaaa 18420
aggatctagg tgaagatcct ttttgataat ctcatgacca aaatccctta acgtgagttt 18480
tcgttccact gagcgtcaga ccccgtagaa aagatcaaag gatcttcttg agatcctttt 18540
tttctgcgcg taatctgctg cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt 18600
ttgccggatc aagagctacc aactcttttt ccgaaggtaa ctggcttcag cagagcgcag 18660
ataccaaata ctgttcttct agtgtagccg tagttaggcc accacttcaa gaactctgta 18720
gcaccgccta catacctcgc tctgctaatc ctgttaccag tggctgctgc cagtggcgat 18780
aagtcgtgtc ttaccgggtt ggactcaaga cgatagttac cggataaggc gcagcggtcg 18840
ggctgaacgg ggggttcgtg cacacagccc agcttggagc gaacgaccta caccgaactg 18900
agatacctac agcgtgagct atgagaaagc gccacgcttc ccgaagggag aaaggcggac 18960
aggtatccgg taagcggcag ggtcggaaca ggagagcgca cgagggagct tccaggggga 19020
aacgcctggt atctttatag tcctgtcggg tttcgccacc tctgacttga gcgtcgattt 19080
ttgtgatgct cgtcaggggg gcggagccta tggaaaaacg ccagcaacgc ggccttttta 19140
cggttcctgg ccttttgctg gccttttgct cacatgttct ttcctgcgtt atcccctgat 19200
tctgtggata accgtattac cgcctttgag tgagctgata ccgctcgccg cagccgaacg 19260
accgagcgca gcgagtcagt gagcgaggaa gcggaagagc gcccaatacg caaaccgcct 19320
ctccccgcgc gttggccgat tcattaatgc agctggcacg acaggtttcc cgactggaaa 19380
gcgggcagtg agcgcaacgc aattaatgtg agttagctca ctcattaggc accccaggct 19440
ttacacttta tgctcccggc tcgtatgttg tgtggaattg tgagcggata acaatttcac 19500
acaggaaaca gctatgacca tgattacgcc aagcgcgcaa ttaaccctca ctaaagggaa 19560
caaaagctg 19569
<210> 69
<211> 262
<212> DNA
<213> 人工序列
<220>
<223> Nucleotide sequence of ordered gBlock with T7 gRNA cassette -
T7.pro WT sgRNA fwnA
<400> 69
gggggtctcg gtgctaatac gactcactat agtcagatat attcagtcac tggttttaga 60
gctagaaata gcaagttaaa ataaggctag tccgttatca acttgaaaaa gtggcaccga 120
gtcggtgctt ttggccggca tggtcccagc ctcctcgctg gcgccggctg ggcaacatgc 180
ttcggcatgg cgaatgggac aaaaaatcaa actggctcac cttcgggtgg gcctttttgc 240
gtttatacct cggagaccgg gg 262
<210> 70
<211> 267
<212> DNA
<213> 人工序列
<220>
<223> Nucleotide sequence of ordered gBlock with T7 gRNA cassette -
T7.pro strong sgRNA fwnA
<400> 70
gggggtctcg gtgctaatac gactcactat aggggaatca gatatattca gtcactggtt 60
ttagagctag aaatagcaag ttaaaataag gctagtccgt tatcaacttg aaaaagtggc 120
accgagtcgg tgcttttggc cggcatggtc ccagcctcct cgctggcgcc ggctgggcaa 180
catgcttcgg catggcgaat gggacaaaaa atcaaactgg ctcaccttcg ggtgggcctt 240
tttgcgttta tacctcggag accgggg 267
<210> 71
<211> 19153
<212> DNA
<213> 人工序列
<220>
<223> Nucleotide sequence of BG-AMA18 (Cas9/hygB/T7 wt sgRNA fwnA) -
Golden Gate product BG-AMA17 with gBlock T7.pro WT sgRNA fwnA
<400> 71
ggtaccgagg ttcatggtat gggcacgaat gtcaaaaatt ttcaggctca aacgggtatg 60
tattcagtat ctatctccgt gtacgacggc taattgagcc cagctgcatt tcgaactctt 120
ctcccagcgc attttgtgtg ggagttcttc gatgctgacc atgactgcga ggctgctgag 180
ggagtgcgcg gtatctaccc cggcccgtat ctggcttcta caaggagtga aactagttta 240
tactttgtag ttcggaatcc aatgctatta accgttttta ctttttcttt tgttcgagct 300
aagcgcttgt ttaaaccttg cgcttcttct tgggatcggc acgagagtca ccaccgagct 360
gagacaggtc gatacgagtc tcgtacagac cggtaatcga ctggtggatc agagtcgcat 420
caagcacttc cttggtggag gtgtaacgct tgcggtcgat ggtggtgtca aagtacttga 480
aagcagcagg agcacccagg ttggtgaggg tgaacaggtg gatgatgttc tccgcctgct 540
cgcggatggg cttgtcacgg tgcttgttgt aggcagagag gaccttgtca aggttggcat 600
cggccaggat gacacgcttg ctgaactcgg agatctgctc gatgatctca tccaggtagt 660
gcttgtgctg ctcgacaaag agctgcttct gctcgttgtc ctcgggagag cccttgagct 720
tctcgtagtg ggaggccagg tagaggaagt tgacgtactt ggaggggagg gcaagctcgt 780
tacccttctg gagctcaccg gcggaagcaa gcatgcgctt acggccgttc tccagctcga 840
acagagagta cttggggagc ttgatgatga ggtccttctt gacctctttg taacccttgg 900
cctccaggaa gtcgataggg ttcttctcga agctgctgcg ttccatgatg gtgataccga 960
ggagttcctt cacactcttc agcttcttgc tcttgccctt ctcgaccttg gcgacaacca 1020
agacggagta ggcaacggta ggcgaatcga atccaccgta cttcttgggg tcccaatcct 1080
tcttgcgagc gatcagcttg tcggagttgc gcttgggaag aatcgactcc ttggagaaac 1140
caccagtctg cacctcggtc ttcttgacaa tgttgacctg gggcatagaa aggaccttgc 1200
ggacggtagc gaagtcacgg cccttgtccc agacgatctc accggtttcg ccgttagtct 1260
caatcaaggg acgcttgcga atctcgccgt tggccaatgt tatttcggtc ttgaagaagt 1320
tcatgatgtt gctgtagaag aagtacttgg cagtggcctt tccgatctcc tgctcggact 1380
tagcgatcat cttgcgcacg tcgtacacct tgtagtcacc gtagacgaac tcggactcga 1440
gcttgggata cttcttaatc aaagcagtac cgacgacggc gttgaggtag gcatcgtgag 1500
cgtggtggta gttgttgatc tcgcggacct tgtagaactg gaagtctttc ctaaagtcac 1560
tgaccagctt gctctttaag gtgatgacct tgacctcacg gatgagcttg tcgttctcgt 1620
cgtacttggt gttcatgcga gagtccagga tctgggcaac gtgcttagtg atctgacggg 1680
tttcaaccaa ttgacgcttg atgaaaccgg ccttgtcgag ctcggagagt ccgccacgct 1740
cggccttggt aaggttgtcg aacttgcgct gagtgatgag cttagcgttg agcaattgtc 1800
tccagtagtt cttcatcttc ttaacaacct cttccgaggg gacgttatcg ctcttgccac 1860
gattcttgtc ggaacgggtg agcaccttgt tgtcaatgct gtcatccttg aggaaggact 1920
gggggacgat gtggtcaaca tcgtagtcgg agaggcggtt gatatccagc tcctggtcga 1980
cgtacatgtc acgtccgttc tgcaagtagt agaggtagag cttctcattc tgcagctggg 2040
tgttctcgac ggggtgttcc ttgagaatct gggaaccgag ctccttgatg ccttcctcga 2100
tacgcttcat gcgctcacgg ctgttcttct gacccttctg agtggtctgg ttctcacgag 2160
ccatttcgat gacgatgttc tcgggcttgt gacgacccat gaccttcaca agctcgtcaa 2220
caaccttcac agtctgcagg atacccttct tgatagcggg ggaaccagcc aggttggcaa 2280
tgtgttcgtg tagcgagtca ccctggccgg agacttgggc cttctggatg tcctctttga 2340
aggtcagaga gtcgtcgtgg atgagctgca tgaagttgcg gttggcgaag ccgtcggact 2400
tcaggaagtc aaggatggtc ttgccagact gcttatcacg gataccgtta atcaacttgc 2460
gagagaggcg accccagcca gtgtaacggc ggcgcttcaa ctgcttcatg accttgtcgt 2520
cgaagaggtg agcgtaggtc ttcagacgtt cttcgatcat ctcacggtcc tcgaagaggg 2580
tgagggtaag aacaatgtcc tcaagaatgt cttcgttctc ctcgttgtca aggaagtcct 2640
tgtccttgat gatcttgagc agatcgtggt aggtgccgag agaagcgttg aagcggtcct 2700
caacaccgga gatctcaacg gagtcaaagc actcgatctt cttgaagtag tcttccttga 2760
gctgcttgac ggtcaccttg cggttagtct tgaacagcag gtcgacaatg gccttcttct 2820
gttcgccgga gaggaaagca ggcttgcgca tgccctcggt cacgtacttg accttggtca 2880
gctcgttgta gacagtgaag tactcgtaca agagggagtg cttgggcagg actttctcgt 2940
tgggcaggtt cttgtcgaag ttggtcatac gctcaatgaa gctctgagcg gaggcaccct 3000
tgtcgacgac ttcctcgaag ttccaggggg tgatggtttc ctcggacttg cgggtcatcc 3060
aggcgaagcg ggagttaccg cgagccagag gaccgacgta gtaggggata cggaaggtca 3120
ggatcttctc aatcttctca cggttgtcct tcaagaaagg gtagaagtct tcctggcgac 3180
gaaggatggc gtgcaattca cccaggtgga tctggtgggg gatgctgccg ttgtcgaaag 3240
tacgctgctt gcgcagaagg tcctcacggt tcagcttaac aagaagctcc tcagtgccat 3300
ccatcttctc gaggataggc ttaatgaact tgtagaattc ttcctgggaa gcaccaccgt 3360
cgatgtaacc ggcgtagccg ttcttggact ggtcgaagaa gatctccttg tacttttcgg 3420
ggagctgctg gcggaccaga gccttgagta gggtgaggtc ctggtggtgc tcatcgtatc 3480
tcttgatcat agaggcggag agaggggcct tggtgatctc agtgttgaca cggaggatat 3540
ctgacaggag aatggcatcg gagaggttct tggcagctag gaagaggtcg gcgtactgat 3600
ctcctatctg ggcgagaagg ttatcaaggt cgtcgtcgta ggtatccttg gaaagttgta 3660
acttagcatc ctcagcaaga tcgaagttgc tcttgaagtt gggagtcagt ccgagggaca 3720
gggcaataag gttgccgaaa agaccgttct tcttctcacc agggagctgg gcaatcaagt 3780
tctcaagacg gcgggacttg ctcaggcgag cggagaggat ggccttggca tccacgccag 3840
acgcgttgat ggggttttcc tcgaaaagct ggttgtaggt ctgaacgagc tggatgaaga 3900
gtttatcaac atcggagttg tcggggttga ggtcaccctc gatcaggaag tgaccacgga 3960
acttgatcat gtgcgccaga gccaggtaaa tgaggcggag gtcagccttg tcggtgctgt 4020
cgacgagctt tttgcgtagg tggtagatgg tggggtactt ctcgtggtaa gcgacctcat 4080
cgacaatgtt accgaagata gggtgacgct cgtgcttctt gtcttcttca acaaggaacg 4140
actcctccag acggtggaag aaagagtcat caaccttggc catctcgttg gagaaaatct 4200
cctggaggta gcagatacgg ttcttgcggc gagtgtaacg acggcgagcg gtacgcttca 4260
gacgggtggc ctcagcagtc tcaccggagt cgaagagaag cgcaccaatg aggttcttct 4320
tgatggagtg acgatcggtg tttcccagga ccttgaattt cttgctagga accttgtact 4380
cgtcggtgat gacagcccag ccaacggagt tggtgccaat gtccagaccg atgctatact 4440
tcttgtccat tttgacggtg gaaggtgagt tggggttggt gtcatcgtgg gggaagaact 4500
tggcttttat atgggtgcag gtgaggggac ttaagccacg tgaaagttca ttcgagagag 4560
ctaaggcata ttaatgcaca tgtgtgggag ttgcatggaa cttgcatgaa aggtgcatga 4620
aaggtgcatg gtattgcaga atgcgctcgg gggtctgcgg agaaatccgt taggaaaaga 4680
tcgtcatcct tctgctgcat caccgttagc ttgaaattta gttccagcgc tagtcaaggg 4740
cttcagttca gattctgcaa gtatcaggtc catcattact ctcttcagca ggcggatcga 4800
atatcccccg aggcacatgg gaggtcttat tatccgatcg ttgatcacca tgccaatcgc 4860
ttcgaccgac cacaagttgc atcaagcact aactgcctca agcagatgcc gagtcttcat 4920
ctccgatatt taatcccgtt gaatctccgc cccctgtcat ctccaccgtt taatctgggg 4980
tggtggcgga tgtccaccaa ttagccggct aaattatccc catcgtcagc acgctagacc 5040
tgccttggaa ctagcgcttt ggtgagaaat ctcttggttg tgagtctgat accacattcc 5100
ttgacttcca tgttgttctg gaggtgtgaa agtataaaca atgccacaga tggactaatc 5160
tccggagaga tgaccctctt caagactggt gcagtgccta ggatcgctag tatcccaaaa 5220
cttcggggct gccttcattt ccagagagtt gcggtacctt gcccatcgaa cgtacaagta 5280
ctcctctgtt ctctccttcc tttgctttgt gctaatacga ctcactatag tcagatatat 5340
tcagtcactg gttttagagc tagaaatagc aagttaaaat aaggctagtc cgttatcaac 5400
ttgaaaaagt ggcaccgagt cggtgctttt ggccggcatg gtcccagcct cctcgctggc 5460
gccggctggg caacatgctt cggcatggcg aatgggacaa aaaatcaaac tggctcacct 5520
tcgggtgggc ctttttgcgt ttatacctcc ggatcgatgt acacaaccga ctgcacccaa 5580
acgaacacaa atcttagcag tgccctcgcc ggatagcttg gactgtcctt taccgtcgcc 5640
agcacaagaa gggtatctct gaggtccgta ccgccttttc tttaccactg gattcgattt 5700
tcgcagttgg aatgatacat ctggggactg cgaatggttt acccctcggc cgatactatg 5760
ggtcgtgaag agatggaaca ttccgaaagt gttttgcgga taacattggt ggcatcgaaa 5820
acagaatgct gaccattgat ttcaacacga acaggaggtt gccaagaagc gtacccgccg 5880
tgtcgtcaag tcccagcgtg ccatcgtcgg tgcttccctc gacgtgatca aggagcgccg 5940
ctcccagcgc cccgaggccc gtgccgccgc ccgccagcag gccatcaagg acgccaagga 6000
gaagaaggct gccgctgagt ccaagaagaa ggctgagaag gctaagaacg ccgctgctgg 6060
tgccaagggt gctgctcagc gcatccagag caagcagggt gctaagggtt ctgctcccaa 6120
ggtcgctgcc aagtctcgtt aaggaatgaa taacggttcg gcttgggatt gggtgcggaa 6180
ggcaagagtt tcatggacga attttgggag gttactggag ctggaatatg tgttttccct 6240
accaccaaaa atgaaatgtt ccaaaactat cggcgtgcaa gacggcctct tacgggttta 6300
acggctctca gataagctct atcaatcgcg ccacggatgc atgaatgaag atccagatgg 6360
ccgcgggata tatcgtgcta gtgtaattcc tacatgatct tgctgttcac tccatgcgca 6420
tccagatatt ccaggggtcg actgttaatt gatatgcctg ggcttgagac tccgtagacg 6480
cccagtcaat gtgcaattaa tacgagggtg ctgttatcgg cagcaacctt gtacttctcc 6540
ataagatggg ggaatgccat ggacctgagt gatcaattga cgcaagtctc ccataacgcg 6600
gcggcttgac ctaaaatcca tataccgccc cgttgagcct ccgcgctcca gagtcctgtc 6660
ccggaatagg gcacaaacct aggctaacct aattcgtcgt ccgcgtctga gttcagacaa 6720
aagaacttcc aagtatcagc agagtacgct gatattgata agtaggcaaa cataagacca 6780
ataagcaagt agaataaaaa attataagga cactgcctcc ataaagcgcc ctcccaagac 6840
ctcagggaca aaacttctca agtggcaatt cactgcctca ggccgtgtcc agtgaagtga 6900
cgaagcgaca ctgttgcctg ctgactcagc cgctttccgc cctgccgaat ttgccatctc 6960
gcttacaggt cagcactagc gcgattcgcc cacagatgct cagcgcaaag tggtgactca 7020
gtcaaacccc ccctacaaga ttccacctcg atttttcaac ttcccatctc gatccgacaa 7080
gttctacatc caccgtcaaa atggcctcca gcgaagatgt catcaaggag ttcatgcgct 7140
tcaaggtccg catggaagga tccgtcaacg gccacgagtt cgagattgag ggtgagggtg 7200
agggccgccc ctacgaaggc acccagactg ccaagctcaa ggtcaccaag ggtggtcctc 7260
tccccttcgc ttgggatatc ctgtctcctc agttccagta cggctccaag gtctacgtca 7320
agcaccccgc cgacatcccc gactacaaga agctttcttt ccccgagggt ttcaagtggg 7380
agcgtgtcat gaacttcgag gatggtggtg ttgtgaccgt tactcaggac agcagcttgc 7440
aggatggctc tttcatctac aaggtcaagt tcattggtgt caacttcccc tccgacggcc 7500
ctgtcatgca gaagaagacc atgggctggg aagcgtcgac tgagcgtctg tacccccgtg 7560
acggtgttct caagggtgag atccacaagg ctctcaagct caaggacggt ggtcactacc 7620
ttgttgagtt caagtccatc tacatggcca agaagcctgt gcagctgccc ggatactact 7680
acgtggactc caagcttgac atcacctccc acaacgaaga ctacaccatt gttgagcagt 7740
acgagcgtgc tgagggccgc caccacctct tcctgaccca cggaatggat gagctgtaca 7800
agtcgaaact ataaataaat ggtttgcgtt gcgattgact gaaacgaaaa aaagcgaaaa 7860
tgattctggg aatgaattga taaagcgcgg gctctgcggt acggttacgg ttgcggtcgc 7920
ggacgaatgg actgggctga gctgggctgg aggaagtcca tcgaacaagg acaaggggtg 7980
gaatatggca cgggtcgatt ttgttataca taccctacca tccatctatc catttaaata 8040
ccaaatgagt tgttgaatgg attcgcggtc ttctcggttt atttttgctt gcttgcgtgc 8100
ttaagggata gtgtgcctca cgctttccgg catcttccag accacagtat atccatccgc 8160
ctcctgttga agcttatttt ttgtatactg ttttgtgata gcacgaagtt tttccacggt 8220
atcttgttaa aaatatatat ttgtggcggg cttacctaca tcaaattaat aagagactaa 8280
ttataaacta aacacacaag caagctactt tagggtaaaa gtttataaat gcttttgacg 8340
tataaacgtt gcttgtattt attattacaa ttaaaggtgg atagaaaacc tagagactag 8400
ttagaaacta atctcaggtt tgcgttaaac taaatcagag cccgagaggt taacagaacc 8460
tagaagggga ctagatatcc gggtagggaa acaaaaaaaa aaaacaagac agccacatat 8520
tagggagact agttagaagc tagttccagg actaggaaaa taaaagacaa tgataccaca 8580
gtctagttga caactagata gattctagat tgaggccaaa gtctctgaga tccaggttag 8640
ttgcaactaa tactagttag tatctagtct cctataactc tgaagctaga ataacttact 8700
actattatcc tcaccactgt tcagctgcgc aaacggagtg attgcaaggt gttcagagac 8760
tagttattga ctagtcagtg actagcaata actaacaagg tattaaccta ccatgtctgc 8820
catcaccctg cacttcctcg ggctcagcag ccttttcctc ctcattttca tgctcatttt 8880
ccttgtttaa gactgtgact agtcaaagac tagtccagaa ccacaaagga gaaatgtctt 8940
accactttct tcattgcttg tctcttttgc attatccatg tctgcaacta gttagagtct 9000
agttagtgac tagtccgacg aggacttgct tgtctccgga ttgttggagg aactctccag 9060
ggcctcaaga tccacaacag agccttctag aagactggtc aataactagt tggtctttgt 9120
ctgagtctga cttacgaggt tgcatactcg ctccctttgc ctcgtcaatc gatgagaaaa 9180
agcgccaaaa ctcgcaatat ggctttgaac cacacggtgc tgagactagt tagaatctag 9240
tcccaaacta gcttggatag cttacctttg ccctttgcgt tgcgacaggt cttgcagggt 9300
atggttcctt tctcaccagc tgatttagct gccttgctac cctcacggcg gatctgcata 9360
aagagtggct agaggttata aattagcact gatcctaggt acggggctga atgtaacttg 9420
cctttccttt ctcatcgcgc ggcaagacag gcttgctcaa attcctacca gtcacagggg 9480
tatgcacggc gtacggacca cttgaactag tcacagatta gttagcaact agtctgcatt 9540
gaatggctgt acttacgggc cctcgccatt gtcctgatca tttccagctt caccctcgtt 9600
gctgcaaagt agttagtgac tagtcaagga ctagttgaaa tgggagaaga aactcacgaa 9660
ttctcgacac ccttagtatt gtggtccttg gacttggtgc tgctatatat tagctaatac 9720
actagttaga ctcacagaaa cttacgcagc tcgcttgcgc ttcttggtag gagtcggggt 9780
tgggagaaca gtgccttcaa acaagccttc ataccatgct acttgactag tcagggacta 9840
gtcaccaagt aatctagata ggacttgcct ttggcctcca tcagttcctt catagtggga 9900
ggtccattgt gcaatgtaaa ctccatgccg tgggagttct tgtccttcaa gtgcttgacc 9960
aatatgtttc tgttggcaga gggaacctgt caactagtta ataactagtc agaaactagt 10020
atagcagtag actcactgta cgcttgaggc atcccttcac tcggcagtag acttcatatg 10080
gatggatatc aggcacgcca ttgtcgtcct gtggactagt cagtaactag gcttaaagct 10140
agtcgggtcg gcttactatc ttgaaatccg gcagcgtaag ctccccgtcc ttaactgcct 10200
cgagatagtg acagtactct ggggactttc ggagatcgtt atcgcgaatg ctcggcatac 10260
taatcgttga ctagtcttgg actagtcccg agcaaaaagg attggaggag gaggaggaag 10320
gtgagagtga gacaaagagc gaaataagag cttcaaaggc tatctctaag cagtatgaag 10380
gttaagtatc tagttcttga ctagatttaa aagagatttc gactagttat gtacctggag 10440
tttggatata ggaatgtgtt gtggtaacga aatgtaaggg ggaggaaaga aaaagtcggt 10500
caagaggtaa ctctaagtcg gccattcctt tttgggaggc gctaaccata aacggcatgg 10560
tcgacttaga gttagctcag ggaatttagg gagttatctg cgaccaccga ggaacggcgg 10620
aatgccaaag aatcccgatg gagctctagc tggcggttga caaccccacc ttttggcgtt 10680
tctgcggcgt tgcaggcggg actggatact tcgtagaacc agaaaggcaa ggcagaacgc 10740
gctcagcaag agtgttggaa gtgatagcat gatgtgcctt gttaactagg tcaaaatctg 10800
cagtatgctt gatgttatcc aaagtgtgag agaggaaggt ccaaacatac acgattggga 10860
gagggcctag gtataagagt ttttgagtag aacgcatgtg agcccagcca tctcgaggag 10920
attaaacacg ggccggcatt tgatggctat gttagtaccc caatggaaag cctgagagtc 10980
cagtggtcgc agataactcc ctaaattccc tgagctaact ctaagtcgac catgccgttt 11040
atggttagcg cctcccaaaa aggaatggcc gacttagagt tacctcttga ccgacttttt 11100
ctttcctccc ccttacattt cgttaccaca acacattcct atatccaaac tccaggtaca 11160
taactagtcg aaatctcttt taaatctagt caagaactag atacttaacc ttcatactgc 11220
ttagagatag cctttgaagc tcttatttcg ctctttgtct cactctcacc ttcctcctcc 11280
tcctccaatc ctttttgctc gggactagtc caagactagt caacgattag tatgccgagc 11340
attcgcgata acgatctccg aaagtcccca gagtactgtc actatctcga ggcagttaag 11400
gacggggagc ttacgctgcc ggatttcaag atagtaagcc gacccgacta gctttaagcc 11460
tagttactga ctagtccaca ggacgacaat ggcgtgcctg atatccatcc atatgaagtc 11520
tactgccgag tgaagggatg cctcaagcgt acagtgagtc tactgctata ctagtttctg 11580
actagttatt aactagttga caggttccct ctgccaacag aaacatattg gtcaagcact 11640
tgaaggacaa gaactcccac ggcatggagt ttacattgca caatggacct cccactatga 11700
aggaactgat ggaggccaaa ggcaagtcct atctagatta cttggtgact agtccctgac 11760
tagtcaagta gcatggtatg aaggcttgtt tgaaggcact gttctcccaa ccccgactcc 11820
taccaagaag cgcaagcgag ctgcgtaagt ttctgtgagt ctaactagtg tattagctaa 11880
tatatagcag caccaagtcc aaggaccaca atactaaggg tgtcgagaat tcgtgagttt 11940
cttctcccat ttcaactagt ccttgactag tcactaacta ctttgcagca acgagggtga 12000
agctggaaat gatcaggaca atggcgaggg cccgtaagta cagccattca atgcagacta 12060
gttgctaact aatctgtgac tagttcaagt ggtccgtacg ccgtgcatac ccctgtgact 12120
ggtaggaatt tgagcaagcc tgtcttgccg cgcgatgaga aaggaaaggc aagttacatt 12180
cagccccgta cctaggatca gtgctaattt ataacctcta gccactcttt atgcagatcc 12240
gccgtgaggg tagcaaggca gctaaatcag ctggtgagaa aggaaccata ccctgcaaga 12300
cctgtcgcaa cgcaaagggc aaaggtaagc tatccaagct agtttgggac tagattctaa 12360
ctagtctcag caccgtgtgg ttcaaagcca tattgcgagt tttggcgctt tttctcatcg 12420
attgacgagg caaagggagc gagtatgcaa cctcgtaagt cagactcaga caaagaccaa 12480
ctagttattg accagtcttc tagaaggctc tgttgtggat cttgaggccc tggagagttc 12540
ctccaacaat ccggagacaa gcaagtcctc gtcggactag tcactaacta gactctaact 12600
agttgcagac atggataatg caaaagagac aagcaatgaa gaaagtggta agacatttct 12660
cctttgtggt tctggactag tctttgacta gtcacagtct taaacaagga aaatgagcat 12720
gaaaatgagg aggaaaaggc tgctgagccc gaggaagtgc agggtgatgg cagacatggt 12780
aggttaatac cttgttagtt attgctagtc actgactagt caataactag tctctgaaca 12840
ccttgcaatc actccgtttg cgcagctgaa cagtggtgag gataatagta gtaagttatt 12900
ctagcttcag agttatagga gactagatac taactagtat tagttgcaac taacctggat 12960
ctcagagact ttggcctcaa tctagaatct atctagttgt caactagact gtggtatcat 13020
tgtcttttat tttcctagtc ctggaactag cttctaacta gtctccctaa tatgtggctg 13080
tcttgttttt tttttttgtt tccctacccg gatatctagt ccccttctag gttctgttaa 13140
cctctcgggc tctgatttag tttaacgcaa acctgagatt agtttctaac tagtctctag 13200
gttttctatc cacctttaat tgtaataata aatacaagca acgtttatac gtcaaaagca 13260
tttataaact tttaccctaa agtagcttgc ttgtgtgttt agtttataat tagtctctta 13320
ttaatttgat gtaggtaagc ccgccacaaa tatatatttt taacaagata ccgtggaaaa 13380
acttcgtgct atcacaaaac agtatacaaa aaataagcta tcgaattcct gcagagatca 13440
tcctgtcttc agtcttaaga cttctctcct atatcacccg cacttaccct agagtgccgc 13500
ttaggtgcta agggcacatt gagtattggc cgtgtagaat atatagctta agtacggcca 13560
agcagacggg aagccctgtt ctccacaccc tatggtcgta tatatcaggc ttctaccggg 13620
aaacgattaa gagtgtataa tggactgaaa atcaatatga acgggacaat gctcaagtta 13680
aattagttag gcatcctaat ctctactaaa tgttctatct agagatcggg gtactatagg 13740
cccgtacgtt aatcactcta cgcttctctc ccttaggtat agtgtaggta ggggctagac 13800
atttatatga gtcagatggt acaaacggta ggcagtgcgg gcgaagaagt gaagacggag 13860
tcggttgaag ctacatacaa aagatgcatt ggctcgtcat gaagagcctc ccgggtttat 13920
tcctttgccc tcggacgagt gctggggcgt cggtttccac tatcggcgag tacttctaca 13980
cagccatcgg tccagacggc cgcgcttctg cgggcgattt gtgtacgccc gacagtcccg 14040
gctccggatc ggacgattgc gtcgcatcga ccctgcgccc aagctgcatc atcgaaattg 14100
ccgtcaacca agctctgata gagttggtca agaccaatgc ggagcatata cgcccggagc 14160
cgcggcgatc ctgcaagctc cggatgcctc cgctcgaagt agcgcgtctg ctgctccata 14220
caagccaacc acggcctcca gaagaagatg ttggcgacct cgtattggga atccccgaac 14280
atcgcctcgc tccagtcaat gaccgctgtt atgcggccat tgtccgtcag gacattgttg 14340
gagccgaaat ccgcgtgcac gaggtgccgg acttcggggc agtcctcggc ccaaagcatc 14400
agctcatcga gagcctgcgc gacggacgca ctgacggtgt cgtccatcac agtttgccag 14460
tgatacacat ggggatcagc aatcgcgcat atgaaatcac gccatgtagt gtattgaccg 14520
attccttgcg gtccgaatgg gccgaacccg ctcgtctggc taagatcggc cgcagcgatc 14580
gcatccatgg cctccgcgac cggctgcaga acagcgggca gttcggtttc aggcaggtct 14640
tgcaacgtga caccctgtgc acggcgggag atgcaatagg tcaggctctc gctgaattcc 14700
ccaatgtcaa gcacttccgg aatcgggagc gcggccgatg caaagtgccg ataaacataa 14760
cgatctttgt agaaaccatc ggcgcagcta tttacccgca ggacatatcc acgccctcct 14820
acatcgaagc tgaaagcacg agattcttcg ccctccgaga gctgcatcag gtcggagacg 14880
ctgtcgaact tttcgatcag aaacttctcg acagacgtcg cggtgagttc aggcattttg 14940
acggtgggat cctgtgatgt ctgctcaagc ggggtagctg ttagtcaagc tgcgatgaag 15000
tgggaaagct cgaactgaaa ggttcaaagg aataagggat gggaaggatg gagtatggat 15060
gtagcaaagt acttacttag gggaaataaa ggttcttgga tgggaagatg aatatactga 15120
agatgggaaa agaaagagaa aagaaaagag cagctggtgg ggagagcagg aaaatatggc 15180
aacaaatgtt ggactgacgc aacgaccttg tcaaccccgc cgacacaccg ggcggacaga 15240
cggggcaaag ctgcctacca gggactgagg gacctcagca ggtcgagtgc agagcaccgg 15300
atgggtcgac tgccagcttg tgttcccggt ctgcgccgct ggccagctcc tgagcggcct 15360
ttccggtttc atacaccggg caaagcagga gaggcacgat atttggacgc cctacagatg 15420
ccggatgggc caattaggga gcttacgcgc cgggtactcg ctctacctac ttcggagaag 15480
gtactatctc gtgaatcttt taccagatcg gaagcaattg gacttctgta cctaggttaa 15540
tggcatgcta tttcgccgac ggctatacac ccctggcttc acattctcct tcgcttactg 15600
ccggtgattc gatgaagctc catattctcc gatgatgcaa tagattcttg gtcaacgagg 15660
ggcacaccag cctttccact tcggggcgga ggggcggccg gtcccggatt aataatcatc 15720
cactgcacct cagagccgcc agagctgtct ggcgcagtgg cgcttattac tcagcccttc 15780
tctctgcgtc cgtccgtctc tccgcatgcc agaaagagtc accggtcact gtacagagcg 15840
gccgccaccg cggtggagct ccaattcgcc ctatagtgag tcgtattacg cgcgctcact 15900
ggccgtcgtt ttacaacgtc gtgactggga aaaccctggc gttacccaac ttaatcgcct 15960
tgcagcacat ccccctttcg ccagctggcg taatagcgaa gaggcccgca ccgatcgccc 16020
ttcccaacag ttgcgcagcc tgaatggcga atgggacgcg ccctgtagcg gcgcattaag 16080
cgcggcgggt gtggtggtta cgcgcagcgt gaccgctaca cttgccagcg ccctagcgcc 16140
cgctcctttc gctttcttcc cttcctttct cgccacgttc gccggctttc cccgtcaagc 16200
tctaaatcgg gggctccctt tagggttccg atttagtgct ttacggcacc tcgaccccaa 16260
aaaacttgat tagggtgatg gttcacgtag tgggccatcg ccctgataga cggtttttcg 16320
ccctttgacg ttggagtcca cgttctttaa tagtggactc ttgttccaaa ctggaacaac 16380
actcaaccct atctcggtct attcttttga tttataaggg attttgccga tttcggccta 16440
ttggttaaaa aatgagctga tttaacaaaa atttaacgcg aattttaaca aaatattaac 16500
gcttacaatt taggtggcac ttttcgggga aatgtgcgcg gaacccctat ttgtttattt 16560
ttctaaatac attcaaatat gtatccgctc atgagacaat aaccctgata aatgcttcaa 16620
taatattgaa aaaggaagag tatgagtatt caacatttcc gtgtcgccct tattcccttt 16680
tttgcggcat tttgccttcc tgtttttgct cacccagaaa cgctggtgaa agtaaaagat 16740
gctgaagatc agttgggtgc acgagtgggt tacatcgaac tggatctcaa cagcggtaag 16800
atccttgaga gttttcgccc cgaagaacgt tttccaatga tgagcacttt tcgaccgaat 16860
aaatacctgt gacggaagat cacttcgcag aataaataaa tcctggtgtc cctgttgata 16920
ccgggaagcc ctgggccaac ttttggcgaa aatgagacgt tgatcggcac gtaagaggtt 16980
ccaactttca ccataatgaa ataagatcac taccgggcgt attttttgag ttgtcgagat 17040
tttcaggagc taaggaagct aaaatggaga aaaaaatcac tggatatacc accgttgata 17100
tatcccaatg gcatcgtaaa gaacattttg aggcatttca gtcagttgct caatgtacct 17160
ataaccagac cgttcagctg gatattacgg cctttttaaa gaccgtaaag aaaaataagc 17220
acaagtttta tccggccttt attcacattc ttgcccgcct gatgaatgct catccggaat 17280
tacgtatggc aatgaaagac ggtgagctgg tgatatggga tagtgttcac ccttgttaca 17340
ccgttttcca tgagcaaact gaaacgtttt catcgctctg gagtgaatac cacgacgatt 17400
tccggcagtt tctacacata tattcgcaag atgtggcgtg ttacggtgaa aacctggcct 17460
atttccctaa agggtttatt gagaatatgt ttttcgtctc agccaatccc tgggtgagtt 17520
tcaccagttt tgatttaaac gtggccaata tggacaactt cttcgccccc gttttcacca 17580
tgggcaaata ttatacgcaa ggcgacaagg tgctgatgcc gctggcgatt caggttcatc 17640
atgccgtttg tgatggcttc catgtcggca gaatgcttaa tgaattacaa cagtactgcg 17700
atgagtggca gggcggggcg taattttttt aaggcagtta ttggtgccct taaacgcctg 17760
gttgctacgc ctgaataagt gataataagc ggatgaatgg cagaaattcg aaagcaaatt 17820
cgacccggtc gtcggttcag ggcagggtcg ttaaatagcc gcttatgtct attgctggtt 17880
taccggttta ttgactaccg gaagcagtgt gaccgtgtgc ttctcaaatg cctgaggcca 17940
gtttgctcag gctctccccg tggaggtaat aattgacgat atgatccttt ttttctgatc 18000
aaaaaggatc taggtgaaga tcctttttga taatctcatg accaaaatcc cttaacgtga 18060
gttttcgttc cactgagcgt cagaccccgt agaaaagatc aaaggatctt cttgagatcc 18120
tttttttctg cgcgtaatct gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt 18180
ttgtttgccg gatcaagagc taccaactct ttttccgaag gtaactggct tcagcagagc 18240
gcagatacca aatactgttc ttctagtgta gccgtagtta ggccaccact tcaagaactc 18300
tgtagcaccg cctacatacc tcgctctgct aatcctgtta ccagtggctg ctgccagtgg 18360
cgataagtcg tgtcttaccg ggttggactc aagacgatag ttaccggata aggcgcagcg 18420
gtcgggctga acggggggtt cgtgcacaca gcccagcttg gagcgaacga cctacaccga 18480
actgagatac ctacagcgtg agctatgaga aagcgccacg cttcccgaag ggagaaaggc 18540
ggacaggtat ccggtaagcg gcagggtcgg aacaggagag cgcacgaggg agcttccagg 18600
gggaaacgcc tggtatcttt atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg 18660
atttttgtga tgctcgtcag gggggcggag cctatggaaa aacgccagca acgcggcctt 18720
tttacggttc ctggcctttt gctggccttt tgctcacatg ttctttcctg cgttatcccc 18780
tgattctgtg gataaccgta ttaccgcctt tgagtgagct gataccgctc gccgcagccg 18840
aacgaccgag cgcagcgagt cagtgagcga ggaagcggaa gagcgcccaa tacgcaaacc 18900
gcctctcccc gcgcgttggc cgattcatta atgcagctgg cacgacaggt ttcccgactg 18960
gaaagcgggc agtgagcgca acgcaattaa tgtgagttag ctcactcatt aggcacccca 19020
ggctttacac tttatgctcc cggctcgtat gttgtgtgga attgtgagcg gataacaatt 19080
tcacacagga aacagctatg accatgatta cgccaagcgc gcaattaacc ctcactaaag 19140
ggaacaaaag ctg 19153
<210> 72
<211> 19158
<212> DNA
<213> 人工序列
<220>
<223> Nucleotide sequence of BG-AMA19 (Cas9/hygB/T7 strong sgRNA fwnA)
G- olden Gate product BG-AMA17 with gBlock T7.pro strong sgRNA
fwnA
<400> 72
ggtaccgagg ttcatggtat gggcacgaat gtcaaaaatt ttcaggctca aacgggtatg 60
tattcagtat ctatctccgt gtacgacggc taattgagcc cagctgcatt tcgaactctt 120
ctcccagcgc attttgtgtg ggagttcttc gatgctgacc atgactgcga ggctgctgag 180
ggagtgcgcg gtatctaccc cggcccgtat ctggcttcta caaggagtga aactagttta 240
tactttgtag ttcggaatcc aatgctatta accgttttta ctttttcttt tgttcgagct 300
aagcgcttgt ttaaaccttg cgcttcttct tgggatcggc acgagagtca ccaccgagct 360
gagacaggtc gatacgagtc tcgtacagac cggtaatcga ctggtggatc agagtcgcat 420
caagcacttc cttggtggag gtgtaacgct tgcggtcgat ggtggtgtca aagtacttga 480
aagcagcagg agcacccagg ttggtgaggg tgaacaggtg gatgatgttc tccgcctgct 540
cgcggatggg cttgtcacgg tgcttgttgt aggcagagag gaccttgtca aggttggcat 600
cggccaggat gacacgcttg ctgaactcgg agatctgctc gatgatctca tccaggtagt 660
gcttgtgctg ctcgacaaag agctgcttct gctcgttgtc ctcgggagag cccttgagct 720
tctcgtagtg ggaggccagg tagaggaagt tgacgtactt ggaggggagg gcaagctcgt 780
tacccttctg gagctcaccg gcggaagcaa gcatgcgctt acggccgttc tccagctcga 840
acagagagta cttggggagc ttgatgatga ggtccttctt gacctctttg taacccttgg 900
cctccaggaa gtcgataggg ttcttctcga agctgctgcg ttccatgatg gtgataccga 960
ggagttcctt cacactcttc agcttcttgc tcttgccctt ctcgaccttg gcgacaacca 1020
agacggagta ggcaacggta ggcgaatcga atccaccgta cttcttgggg tcccaatcct 1080
tcttgcgagc gatcagcttg tcggagttgc gcttgggaag aatcgactcc ttggagaaac 1140
caccagtctg cacctcggtc ttcttgacaa tgttgacctg gggcatagaa aggaccttgc 1200
ggacggtagc gaagtcacgg cccttgtccc agacgatctc accggtttcg ccgttagtct 1260
caatcaaggg acgcttgcga atctcgccgt tggccaatgt tatttcggtc ttgaagaagt 1320
tcatgatgtt gctgtagaag aagtacttgg cagtggcctt tccgatctcc tgctcggact 1380
tagcgatcat cttgcgcacg tcgtacacct tgtagtcacc gtagacgaac tcggactcga 1440
gcttgggata cttcttaatc aaagcagtac cgacgacggc gttgaggtag gcatcgtgag 1500
cgtggtggta gttgttgatc tcgcggacct tgtagaactg gaagtctttc ctaaagtcac 1560
tgaccagctt gctctttaag gtgatgacct tgacctcacg gatgagcttg tcgttctcgt 1620
cgtacttggt gttcatgcga gagtccagga tctgggcaac gtgcttagtg atctgacggg 1680
tttcaaccaa ttgacgcttg atgaaaccgg ccttgtcgag ctcggagagt ccgccacgct 1740
cggccttggt aaggttgtcg aacttgcgct gagtgatgag cttagcgttg agcaattgtc 1800
tccagtagtt cttcatcttc ttaacaacct cttccgaggg gacgttatcg ctcttgccac 1860
gattcttgtc ggaacgggtg agcaccttgt tgtcaatgct gtcatccttg aggaaggact 1920
gggggacgat gtggtcaaca tcgtagtcgg agaggcggtt gatatccagc tcctggtcga 1980
cgtacatgtc acgtccgttc tgcaagtagt agaggtagag cttctcattc tgcagctggg 2040
tgttctcgac ggggtgttcc ttgagaatct gggaaccgag ctccttgatg ccttcctcga 2100
tacgcttcat gcgctcacgg ctgttcttct gacccttctg agtggtctgg ttctcacgag 2160
ccatttcgat gacgatgttc tcgggcttgt gacgacccat gaccttcaca agctcgtcaa 2220
caaccttcac agtctgcagg atacccttct tgatagcggg ggaaccagcc aggttggcaa 2280
tgtgttcgtg tagcgagtca ccctggccgg agacttgggc cttctggatg tcctctttga 2340
aggtcagaga gtcgtcgtgg atgagctgca tgaagttgcg gttggcgaag ccgtcggact 2400
tcaggaagtc aaggatggtc ttgccagact gcttatcacg gataccgtta atcaacttgc 2460
gagagaggcg accccagcca gtgtaacggc ggcgcttcaa ctgcttcatg accttgtcgt 2520
cgaagaggtg agcgtaggtc ttcagacgtt cttcgatcat ctcacggtcc tcgaagaggg 2580
tgagggtaag aacaatgtcc tcaagaatgt cttcgttctc ctcgttgtca aggaagtcct 2640
tgtccttgat gatcttgagc agatcgtggt aggtgccgag agaagcgttg aagcggtcct 2700
caacaccgga gatctcaacg gagtcaaagc actcgatctt cttgaagtag tcttccttga 2760
gctgcttgac ggtcaccttg cggttagtct tgaacagcag gtcgacaatg gccttcttct 2820
gttcgccgga gaggaaagca ggcttgcgca tgccctcggt cacgtacttg accttggtca 2880
gctcgttgta gacagtgaag tactcgtaca agagggagtg cttgggcagg actttctcgt 2940
tgggcaggtt cttgtcgaag ttggtcatac gctcaatgaa gctctgagcg gaggcaccct 3000
tgtcgacgac ttcctcgaag ttccaggggg tgatggtttc ctcggacttg cgggtcatcc 3060
aggcgaagcg ggagttaccg cgagccagag gaccgacgta gtaggggata cggaaggtca 3120
ggatcttctc aatcttctca cggttgtcct tcaagaaagg gtagaagtct tcctggcgac 3180
gaaggatggc gtgcaattca cccaggtgga tctggtgggg gatgctgccg ttgtcgaaag 3240
tacgctgctt gcgcagaagg tcctcacggt tcagcttaac aagaagctcc tcagtgccat 3300
ccatcttctc gaggataggc ttaatgaact tgtagaattc ttcctgggaa gcaccaccgt 3360
cgatgtaacc ggcgtagccg ttcttggact ggtcgaagaa gatctccttg tacttttcgg 3420
ggagctgctg gcggaccaga gccttgagta gggtgaggtc ctggtggtgc tcatcgtatc 3480
tcttgatcat agaggcggag agaggggcct tggtgatctc agtgttgaca cggaggatat 3540
ctgacaggag aatggcatcg gagaggttct tggcagctag gaagaggtcg gcgtactgat 3600
ctcctatctg ggcgagaagg ttatcaaggt cgtcgtcgta ggtatccttg gaaagttgta 3660
acttagcatc ctcagcaaga tcgaagttgc tcttgaagtt gggagtcagt ccgagggaca 3720
gggcaataag gttgccgaaa agaccgttct tcttctcacc agggagctgg gcaatcaagt 3780
tctcaagacg gcgggacttg ctcaggcgag cggagaggat ggccttggca tccacgccag 3840
acgcgttgat ggggttttcc tcgaaaagct ggttgtaggt ctgaacgagc tggatgaaga 3900
gtttatcaac atcggagttg tcggggttga ggtcaccctc gatcaggaag tgaccacgga 3960
acttgatcat gtgcgccaga gccaggtaaa tgaggcggag gtcagccttg tcggtgctgt 4020
cgacgagctt tttgcgtagg tggtagatgg tggggtactt ctcgtggtaa gcgacctcat 4080
cgacaatgtt accgaagata gggtgacgct cgtgcttctt gtcttcttca acaaggaacg 4140
actcctccag acggtggaag aaagagtcat caaccttggc catctcgttg gagaaaatct 4200
cctggaggta gcagatacgg ttcttgcggc gagtgtaacg acggcgagcg gtacgcttca 4260
gacgggtggc ctcagcagtc tcaccggagt cgaagagaag cgcaccaatg aggttcttct 4320
tgatggagtg acgatcggtg tttcccagga ccttgaattt cttgctagga accttgtact 4380
cgtcggtgat gacagcccag ccaacggagt tggtgccaat gtccagaccg atgctatact 4440
tcttgtccat tttgacggtg gaaggtgagt tggggttggt gtcatcgtgg gggaagaact 4500
tggcttttat atgggtgcag gtgaggggac ttaagccacg tgaaagttca ttcgagagag 4560
ctaaggcata ttaatgcaca tgtgtgggag ttgcatggaa cttgcatgaa aggtgcatga 4620
aaggtgcatg gtattgcaga atgcgctcgg gggtctgcgg agaaatccgt taggaaaaga 4680
tcgtcatcct tctgctgcat caccgttagc ttgaaattta gttccagcgc tagtcaaggg 4740
cttcagttca gattctgcaa gtatcaggtc catcattact ctcttcagca ggcggatcga 4800
atatcccccg aggcacatgg gaggtcttat tatccgatcg ttgatcacca tgccaatcgc 4860
ttcgaccgac cacaagttgc atcaagcact aactgcctca agcagatgcc gagtcttcat 4920
ctccgatatt taatcccgtt gaatctccgc cccctgtcat ctccaccgtt taatctgggg 4980
tggtggcgga tgtccaccaa ttagccggct aaattatccc catcgtcagc acgctagacc 5040
tgccttggaa ctagcgcttt ggtgagaaat ctcttggttg tgagtctgat accacattcc 5100
ttgacttcca tgttgttctg gaggtgtgaa agtataaaca atgccacaga tggactaatc 5160
tccggagaga tgaccctctt caagactggt gcagtgccta ggatcgctag tatcccaaaa 5220
cttcggggct gccttcattt ccagagagtt gcggtacctt gcccatcgaa cgtacaagta 5280
ctcctctgtt ctctccttcc tttgctttgt gctaatacga ctcactatag gggaatcaga 5340
tatattcagt cactggtttt agagctagaa atagcaagtt aaaataaggc tagtccgtta 5400
tcaacttgaa aaagtggcac cgagtcggtg cttttggccg gcatggtccc agcctcctcg 5460
ctggcgccgg ctgggcaaca tgcttcggca tggcgaatgg gacaaaaaat caaactggct 5520
caccttcggg tgggcctttt tgcgtttata cctccggatc gatgtacaca accgactgca 5580
cccaaacgaa cacaaatctt agcagtgccc tcgccggata gcttggactg tcctttaccg 5640
tcgccagcac aagaagggta tctctgaggt ccgtaccgcc ttttctttac cactggattc 5700
gattttcgca gttggaatga tacatctggg gactgcgaat ggtttacccc tcggccgata 5760
ctatgggtcg tgaagagatg gaacattccg aaagtgtttt gcggataaca ttggtggcat 5820
cgaaaacaga atgctgacca ttgatttcaa cacgaacagg aggttgccaa gaagcgtacc 5880
cgccgtgtcg tcaagtccca gcgtgccatc gtcggtgctt ccctcgacgt gatcaaggag 5940
cgccgctccc agcgccccga ggcccgtgcc gccgcccgcc agcaggccat caaggacgcc 6000
aaggagaaga aggctgccgc tgagtccaag aagaaggctg agaaggctaa gaacgccgct 6060
gctggtgcca agggtgctgc tcagcgcatc cagagcaagc agggtgctaa gggttctgct 6120
cccaaggtcg ctgccaagtc tcgttaagga atgaataacg gttcggcttg ggattgggtg 6180
cggaaggcaa gagtttcatg gacgaatttt gggaggttac tggagctgga atatgtgttt 6240
tccctaccac caaaaatgaa atgttccaaa actatcggcg tgcaagacgg cctcttacgg 6300
gtttaacggc tctcagataa gctctatcaa tcgcgccacg gatgcatgaa tgaagatcca 6360
gatggccgcg ggatatatcg tgctagtgta attcctacat gatcttgctg ttcactccat 6420
gcgcatccag atattccagg ggtcgactgt taattgatat gcctgggctt gagactccgt 6480
agacgcccag tcaatgtgca attaatacga gggtgctgtt atcggcagca accttgtact 6540
tctccataag atgggggaat gccatggacc tgagtgatca attgacgcaa gtctcccata 6600
acgcggcggc ttgacctaaa atccatatac cgccccgttg agcctccgcg ctccagagtc 6660
ctgtcccgga atagggcaca aacctaggct aacctaattc gtcgtccgcg tctgagttca 6720
gacaaaagaa cttccaagta tcagcagagt acgctgatat tgataagtag gcaaacataa 6780
gaccaataag caagtagaat aaaaaattat aaggacactg cctccataaa gcgccctccc 6840
aagacctcag ggacaaaact tctcaagtgg caattcactg cctcaggccg tgtccagtga 6900
agtgacgaag cgacactgtt gcctgctgac tcagccgctt tccgccctgc cgaatttgcc 6960
atctcgctta caggtcagca ctagcgcgat tcgcccacag atgctcagcg caaagtggtg 7020
actcagtcaa acccccccta caagattcca cctcgatttt tcaacttccc atctcgatcc 7080
gacaagttct acatccaccg tcaaaatggc ctccagcgaa gatgtcatca aggagttcat 7140
gcgcttcaag gtccgcatgg aaggatccgt caacggccac gagttcgaga ttgagggtga 7200
gggtgagggc cgcccctacg aaggcaccca gactgccaag ctcaaggtca ccaagggtgg 7260
tcctctcccc ttcgcttggg atatcctgtc tcctcagttc cagtacggct ccaaggtcta 7320
cgtcaagcac cccgccgaca tccccgacta caagaagctt tctttccccg agggtttcaa 7380
gtgggagcgt gtcatgaact tcgaggatgg tggtgttgtg accgttactc aggacagcag 7440
cttgcaggat ggctctttca tctacaaggt caagttcatt ggtgtcaact tcccctccga 7500
cggccctgtc atgcagaaga agaccatggg ctgggaagcg tcgactgagc gtctgtaccc 7560
ccgtgacggt gttctcaagg gtgagatcca caaggctctc aagctcaagg acggtggtca 7620
ctaccttgtt gagttcaagt ccatctacat ggccaagaag cctgtgcagc tgcccggata 7680
ctactacgtg gactccaagc ttgacatcac ctcccacaac gaagactaca ccattgttga 7740
gcagtacgag cgtgctgagg gccgccacca cctcttcctg acccacggaa tggatgagct 7800
gtacaagtcg aaactataaa taaatggttt gcgttgcgat tgactgaaac gaaaaaaagc 7860
gaaaatgatt ctgggaatga attgataaag cgcgggctct gcggtacggt tacggttgcg 7920
gtcgcggacg aatggactgg gctgagctgg gctggaggaa gtccatcgaa caaggacaag 7980
gggtggaata tggcacgggt cgattttgtt atacataccc taccatccat ctatccattt 8040
aaataccaaa tgagttgttg aatggattcg cggtcttctc ggtttatttt tgcttgcttg 8100
cgtgcttaag ggatagtgtg cctcacgctt tccggcatct tccagaccac agtatatcca 8160
tccgcctcct gttgaagctt attttttgta tactgttttg tgatagcacg aagtttttcc 8220
acggtatctt gttaaaaata tatatttgtg gcgggcttac ctacatcaaa ttaataagag 8280
actaattata aactaaacac acaagcaagc tactttaggg taaaagttta taaatgcttt 8340
tgacgtataa acgttgcttg tatttattat tacaattaaa ggtggataga aaacctagag 8400
actagttaga aactaatctc aggtttgcgt taaactaaat cagagcccga gaggttaaca 8460
gaacctagaa ggggactaga tatccgggta gggaaacaaa aaaaaaaaac aagacagcca 8520
catattaggg agactagtta gaagctagtt ccaggactag gaaaataaaa gacaatgata 8580
ccacagtcta gttgacaact agatagattc tagattgagg ccaaagtctc tgagatccag 8640
gttagttgca actaatacta gttagtatct agtctcctat aactctgaag ctagaataac 8700
ttactactat tatcctcacc actgttcagc tgcgcaaacg gagtgattgc aaggtgttca 8760
gagactagtt attgactagt cagtgactag caataactaa caaggtatta acctaccatg 8820
tctgccatca ccctgcactt cctcgggctc agcagccttt tcctcctcat tttcatgctc 8880
attttccttg tttaagactg tgactagtca aagactagtc cagaaccaca aaggagaaat 8940
gtcttaccac tttcttcatt gcttgtctct tttgcattat ccatgtctgc aactagttag 9000
agtctagtta gtgactagtc cgacgaggac ttgcttgtct ccggattgtt ggaggaactc 9060
tccagggcct caagatccac aacagagcct tctagaagac tggtcaataa ctagttggtc 9120
tttgtctgag tctgacttac gaggttgcat actcgctccc tttgcctcgt caatcgatga 9180
gaaaaagcgc caaaactcgc aatatggctt tgaaccacac ggtgctgaga ctagttagaa 9240
tctagtccca aactagcttg gatagcttac ctttgccctt tgcgttgcga caggtcttgc 9300
agggtatggt tcctttctca ccagctgatt tagctgcctt gctaccctca cggcggatct 9360
gcataaagag tggctagagg ttataaatta gcactgatcc taggtacggg gctgaatgta 9420
acttgccttt cctttctcat cgcgcggcaa gacaggcttg ctcaaattcc taccagtcac 9480
aggggtatgc acggcgtacg gaccacttga actagtcaca gattagttag caactagtct 9540
gcattgaatg gctgtactta cgggccctcg ccattgtcct gatcatttcc agcttcaccc 9600
tcgttgctgc aaagtagtta gtgactagtc aaggactagt tgaaatggga gaagaaactc 9660
acgaattctc gacaccctta gtattgtggt ccttggactt ggtgctgcta tatattagct 9720
aatacactag ttagactcac agaaacttac gcagctcgct tgcgcttctt ggtaggagtc 9780
ggggttggga gaacagtgcc ttcaaacaag ccttcatacc atgctacttg actagtcagg 9840
gactagtcac caagtaatct agataggact tgcctttggc ctccatcagt tccttcatag 9900
tgggaggtcc attgtgcaat gtaaactcca tgccgtggga gttcttgtcc ttcaagtgct 9960
tgaccaatat gtttctgttg gcagagggaa cctgtcaact agttaataac tagtcagaaa 10020
ctagtatagc agtagactca ctgtacgctt gaggcatccc ttcactcggc agtagacttc 10080
atatggatgg atatcaggca cgccattgtc gtcctgtgga ctagtcagta actaggctta 10140
aagctagtcg ggtcggctta ctatcttgaa atccggcagc gtaagctccc cgtccttaac 10200
tgcctcgaga tagtgacagt actctgggga ctttcggaga tcgttatcgc gaatgctcgg 10260
catactaatc gttgactagt cttggactag tcccgagcaa aaaggattgg aggaggagga 10320
ggaaggtgag agtgagacaa agagcgaaat aagagcttca aaggctatct ctaagcagta 10380
tgaaggttaa gtatctagtt cttgactaga tttaaaagag atttcgacta gttatgtacc 10440
tggagtttgg atataggaat gtgttgtggt aacgaaatgt aagggggagg aaagaaaaag 10500
tcggtcaaga ggtaactcta agtcggccat tcctttttgg gaggcgctaa ccataaacgg 10560
catggtcgac ttagagttag ctcagggaat ttagggagtt atctgcgacc accgaggaac 10620
ggcggaatgc caaagaatcc cgatggagct ctagctggcg gttgacaacc ccaccttttg 10680
gcgtttctgc ggcgttgcag gcgggactgg atacttcgta gaaccagaaa ggcaaggcag 10740
aacgcgctca gcaagagtgt tggaagtgat agcatgatgt gccttgttaa ctaggtcaaa 10800
atctgcagta tgcttgatgt tatccaaagt gtgagagagg aaggtccaaa catacacgat 10860
tgggagaggg cctaggtata agagtttttg agtagaacgc atgtgagccc agccatctcg 10920
aggagattaa acacgggccg gcatttgatg gctatgttag taccccaatg gaaagcctga 10980
gagtccagtg gtcgcagata actccctaaa ttccctgagc taactctaag tcgaccatgc 11040
cgtttatggt tagcgcctcc caaaaaggaa tggccgactt agagttacct cttgaccgac 11100
tttttctttc ctccccctta catttcgtta ccacaacaca ttcctatatc caaactccag 11160
gtacataact agtcgaaatc tcttttaaat ctagtcaaga actagatact taaccttcat 11220
actgcttaga gatagccttt gaagctctta tttcgctctt tgtctcactc tcaccttcct 11280
cctcctcctc caatcctttt tgctcgggac tagtccaaga ctagtcaacg attagtatgc 11340
cgagcattcg cgataacgat ctccgaaagt ccccagagta ctgtcactat ctcgaggcag 11400
ttaaggacgg ggagcttacg ctgccggatt tcaagatagt aagccgaccc gactagcttt 11460
aagcctagtt actgactagt ccacaggacg acaatggcgt gcctgatatc catccatatg 11520
aagtctactg ccgagtgaag ggatgcctca agcgtacagt gagtctactg ctatactagt 11580
ttctgactag ttattaacta gttgacaggt tccctctgcc aacagaaaca tattggtcaa 11640
gcacttgaag gacaagaact cccacggcat ggagtttaca ttgcacaatg gacctcccac 11700
tatgaaggaa ctgatggagg ccaaaggcaa gtcctatcta gattacttgg tgactagtcc 11760
ctgactagtc aagtagcatg gtatgaaggc ttgtttgaag gcactgttct cccaaccccg 11820
actcctacca agaagcgcaa gcgagctgcg taagtttctg tgagtctaac tagtgtatta 11880
gctaatatat agcagcacca agtccaagga ccacaatact aagggtgtcg agaattcgtg 11940
agtttcttct cccatttcaa ctagtccttg actagtcact aactactttg cagcaacgag 12000
ggtgaagctg gaaatgatca ggacaatggc gagggcccgt aagtacagcc attcaatgca 12060
gactagttgc taactaatct gtgactagtt caagtggtcc gtacgccgtg catacccctg 12120
tgactggtag gaatttgagc aagcctgtct tgccgcgcga tgagaaagga aaggcaagtt 12180
acattcagcc ccgtacctag gatcagtgct aatttataac ctctagccac tctttatgca 12240
gatccgccgt gagggtagca aggcagctaa atcagctggt gagaaaggaa ccataccctg 12300
caagacctgt cgcaacgcaa agggcaaagg taagctatcc aagctagttt gggactagat 12360
tctaactagt ctcagcaccg tgtggttcaa agccatattg cgagttttgg cgctttttct 12420
catcgattga cgaggcaaag ggagcgagta tgcaacctcg taagtcagac tcagacaaag 12480
accaactagt tattgaccag tcttctagaa ggctctgttg tggatcttga ggccctggag 12540
agttcctcca acaatccgga gacaagcaag tcctcgtcgg actagtcact aactagactc 12600
taactagttg cagacatgga taatgcaaaa gagacaagca atgaagaaag tggtaagaca 12660
tttctccttt gtggttctgg actagtcttt gactagtcac agtcttaaac aaggaaaatg 12720
agcatgaaaa tgaggaggaa aaggctgctg agcccgagga agtgcagggt gatggcagac 12780
atggtaggtt aataccttgt tagttattgc tagtcactga ctagtcaata actagtctct 12840
gaacaccttg caatcactcc gtttgcgcag ctgaacagtg gtgaggataa tagtagtaag 12900
ttattctagc ttcagagtta taggagacta gatactaact agtattagtt gcaactaacc 12960
tggatctcag agactttggc ctcaatctag aatctatcta gttgtcaact agactgtggt 13020
atcattgtct tttattttcc tagtcctgga actagcttct aactagtctc cctaatatgt 13080
ggctgtcttg tttttttttt ttgtttccct acccggatat ctagtcccct tctaggttct 13140
gttaacctct cgggctctga tttagtttaa cgcaaacctg agattagttt ctaactagtc 13200
tctaggtttt ctatccacct ttaattgtaa taataaatac aagcaacgtt tatacgtcaa 13260
aagcatttat aaacttttac cctaaagtag cttgcttgtg tgtttagttt ataattagtc 13320
tcttattaat ttgatgtagg taagcccgcc acaaatatat atttttaaca agataccgtg 13380
gaaaaacttc gtgctatcac aaaacagtat acaaaaaata agctatcgaa ttcctgcaga 13440
gatcatcctg tcttcagtct taagacttct ctcctatatc acccgcactt accctagagt 13500
gccgcttagg tgctaagggc acattgagta ttggccgtgt agaatatata gcttaagtac 13560
ggccaagcag acgggaagcc ctgttctcca caccctatgg tcgtatatat caggcttcta 13620
ccgggaaacg attaagagtg tataatggac tgaaaatcaa tatgaacggg acaatgctca 13680
agttaaatta gttaggcatc ctaatctcta ctaaatgttc tatctagaga tcggggtact 13740
ataggcccgt acgttaatca ctctacgctt ctctccctta ggtatagtgt aggtaggggc 13800
tagacattta tatgagtcag atggtacaaa cggtaggcag tgcgggcgaa gaagtgaaga 13860
cggagtcggt tgaagctaca tacaaaagat gcattggctc gtcatgaaga gcctcccggg 13920
tttattcctt tgccctcgga cgagtgctgg ggcgtcggtt tccactatcg gcgagtactt 13980
ctacacagcc atcggtccag acggccgcgc ttctgcgggc gatttgtgta cgcccgacag 14040
tcccggctcc ggatcggacg attgcgtcgc atcgaccctg cgcccaagct gcatcatcga 14100
aattgccgtc aaccaagctc tgatagagtt ggtcaagacc aatgcggagc atatacgccc 14160
ggagccgcgg cgatcctgca agctccggat gcctccgctc gaagtagcgc gtctgctgct 14220
ccatacaagc caaccacggc ctccagaaga agatgttggc gacctcgtat tgggaatccc 14280
cgaacatcgc ctcgctccag tcaatgaccg ctgttatgcg gccattgtcc gtcaggacat 14340
tgttggagcc gaaatccgcg tgcacgaggt gccggacttc ggggcagtcc tcggcccaaa 14400
gcatcagctc atcgagagcc tgcgcgacgg acgcactgac ggtgtcgtcc atcacagttt 14460
gccagtgata cacatgggga tcagcaatcg cgcatatgaa atcacgccat gtagtgtatt 14520
gaccgattcc ttgcggtccg aatgggccga acccgctcgt ctggctaaga tcggccgcag 14580
cgatcgcatc catggcctcc gcgaccggct gcagaacagc gggcagttcg gtttcaggca 14640
ggtcttgcaa cgtgacaccc tgtgcacggc gggagatgca ataggtcagg ctctcgctga 14700
attccccaat gtcaagcact tccggaatcg ggagcgcggc cgatgcaaag tgccgataaa 14760
cataacgatc tttgtagaaa ccatcggcgc agctatttac ccgcaggaca tatccacgcc 14820
ctcctacatc gaagctgaaa gcacgagatt cttcgccctc cgagagctgc atcaggtcgg 14880
agacgctgtc gaacttttcg atcagaaact tctcgacaga cgtcgcggtg agttcaggca 14940
ttttgacggt gggatcctgt gatgtctgct caagcggggt agctgttagt caagctgcga 15000
tgaagtggga aagctcgaac tgaaaggttc aaaggaataa gggatgggaa ggatggagta 15060
tggatgtagc aaagtactta cttaggggaa ataaaggttc ttggatggga agatgaatat 15120
actgaagatg ggaaaagaaa gagaaaagaa aagagcagct ggtggggaga gcaggaaaat 15180
atggcaacaa atgttggact gacgcaacga ccttgtcaac cccgccgaca caccgggcgg 15240
acagacgggg caaagctgcc taccagggac tgagggacct cagcaggtcg agtgcagagc 15300
accggatggg tcgactgcca gcttgtgttc ccggtctgcg ccgctggcca gctcctgagc 15360
ggcctttccg gtttcataca ccgggcaaag caggagaggc acgatatttg gacgccctac 15420
agatgccgga tgggccaatt agggagctta cgcgccgggt actcgctcta cctacttcgg 15480
agaaggtact atctcgtgaa tcttttacca gatcggaagc aattggactt ctgtacctag 15540
gttaatggca tgctatttcg ccgacggcta tacacccctg gcttcacatt ctccttcgct 15600
tactgccggt gattcgatga agctccatat tctccgatga tgcaatagat tcttggtcaa 15660
cgaggggcac accagccttt ccacttcggg gcggaggggc ggccggtccc ggattaataa 15720
tcatccactg cacctcagag ccgccagagc tgtctggcgc agtggcgctt attactcagc 15780
ccttctctct gcgtccgtcc gtctctccgc atgccagaaa gagtcaccgg tcactgtaca 15840
gagcggccgc caccgcggtg gagctccaat tcgccctata gtgagtcgta ttacgcgcgc 15900
tcactggccg tcgttttaca acgtcgtgac tgggaaaacc ctggcgttac ccaacttaat 15960
cgccttgcag cacatccccc tttcgccagc tggcgtaata gcgaagaggc ccgcaccgat 16020
cgcccttccc aacagttgcg cagcctgaat ggcgaatggg acgcgccctg tagcggcgca 16080
ttaagcgcgg cgggtgtggt ggttacgcgc agcgtgaccg ctacacttgc cagcgcccta 16140
gcgcccgctc ctttcgcttt cttcccttcc tttctcgcca cgttcgccgg ctttccccgt 16200
caagctctaa atcgggggct ccctttaggg ttccgattta gtgctttacg gcacctcgac 16260
cccaaaaaac ttgattaggg tgatggttca cgtagtgggc catcgccctg atagacggtt 16320
tttcgccctt tgacgttgga gtccacgttc tttaatagtg gactcttgtt ccaaactgga 16380
acaacactca accctatctc ggtctattct tttgatttat aagggatttt gccgatttcg 16440
gcctattggt taaaaaatga gctgatttaa caaaaattta acgcgaattt taacaaaata 16500
ttaacgctta caatttaggt ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt 16560
tatttttcta aatacattca aatatgtatc cgctcatgag acaataaccc tgataaatgc 16620
ttcaataata ttgaaaaagg aagagtatga gtattcaaca tttccgtgtc gcccttattc 16680
ccttttttgc ggcattttgc cttcctgttt ttgctcaccc agaaacgctg gtgaaagtaa 16740
aagatgctga agatcagttg ggtgcacgag tgggttacat cgaactggat ctcaacagcg 16800
gtaagatcct tgagagtttt cgccccgaag aacgttttcc aatgatgagc acttttcgac 16860
cgaataaata cctgtgacgg aagatcactt cgcagaataa ataaatcctg gtgtccctgt 16920
tgataccggg aagccctggg ccaacttttg gcgaaaatga gacgttgatc ggcacgtaag 16980
aggttccaac tttcaccata atgaaataag atcactaccg ggcgtatttt ttgagttgtc 17040
gagattttca ggagctaagg aagctaaaat ggagaaaaaa atcactggat ataccaccgt 17100
tgatatatcc caatggcatc gtaaagaaca ttttgaggca tttcagtcag ttgctcaatg 17160
tacctataac cagaccgttc agctggatat tacggccttt ttaaagaccg taaagaaaaa 17220
taagcacaag ttttatccgg cctttattca cattcttgcc cgcctgatga atgctcatcc 17280
ggaattacgt atggcaatga aagacggtga gctggtgata tgggatagtg ttcacccttg 17340
ttacaccgtt ttccatgagc aaactgaaac gttttcatcg ctctggagtg aataccacga 17400
cgatttccgg cagtttctac acatatattc gcaagatgtg gcgtgttacg gtgaaaacct 17460
ggcctatttc cctaaagggt ttattgagaa tatgtttttc gtctcagcca atccctgggt 17520
gagtttcacc agttttgatt taaacgtggc caatatggac aacttcttcg cccccgtttt 17580
caccatgggc aaatattata cgcaaggcga caaggtgctg atgccgctgg cgattcaggt 17640
tcatcatgcc gtttgtgatg gcttccatgt cggcagaatg cttaatgaat tacaacagta 17700
ctgcgatgag tggcagggcg gggcgtaatt tttttaaggc agttattggt gcccttaaac 17760
gcctggttgc tacgcctgaa taagtgataa taagcggatg aatggcagaa attcgaaagc 17820
aaattcgacc cggtcgtcgg ttcagggcag ggtcgttaaa tagccgctta tgtctattgc 17880
tggtttaccg gtttattgac taccggaagc agtgtgaccg tgtgcttctc aaatgcctga 17940
ggccagtttg ctcaggctct ccccgtggag gtaataattg acgatatgat cctttttttc 18000
tgatcaaaaa ggatctaggt gaagatcctt tttgataatc tcatgaccaa aatcccttaa 18060
cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga 18120
gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg 18180
gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc 18240
agagcgcaga taccaaatac tgttcttcta gtgtagccgt agttaggcca ccacttcaag 18300
aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc 18360
agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg 18420
cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac 18480
accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga 18540
aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt 18600
ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag 18660
cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg 18720
gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta 18780
tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc 18840
agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cccaatacgc 18900
aaaccgcctc tccccgcgcg ttggccgatt cattaatgca gctggcacga caggtttccc 18960
gactggaaag cgggcagtga gcgcaacgca attaatgtga gttagctcac tcattaggca 19020
ccccaggctt tacactttat gctcccggct cgtatgttgt gtggaattgt gagcggataa 19080
caatttcaca caggaaacag ctatgaccat gattacgcca agcgcgcaat taaccctcac 19140
taaagggaac aaaagctg 19158
<210> 73
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> Nucleotide sequence of forward primer used to check the cloned T7
gRNA cassette in AMA-vector (BG-AMA18 and BG-AMA19) by GoldenGate
<400> 73
ttgcccatcg aacgtacaag 20
<210> 74
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> Nucleotide sequence of reverse primer used to check the cloned T7
gRNA cassette in AMA-vector (BG-AMA18 and BG-AMA19) by GoldenGate
<400> 74
tgctaagatt tgtgttcgtt tgg 23
<210> 75
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> Nucleotide sequence of forward primer to amplify part of the fwnA
gene to produce DNA fragments for sequencing and primer also used
for sequencing reaction to check correct integration of door DNA
in the genome
<400> 75
acagtcttgc gagccttcat c 21
<210> 76
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> Nucleotide sequence of reverse primer to amplify part of the fwnA
gene to produce DNA fragments for sequencing
<400> 76
caactggagg taggaccgta tcg 23

Claims (34)

1.单亚基DNA依赖性RNA聚合酶,优选病毒单亚基DNA依赖性RNA聚合酶,更优选T3、SP6、K11或T7RNA聚合酶,用于在细胞内表达用于RNA指导的核酸酶系统的指导RNA的用途,其中所述指导RNA由这样的多核苷酸编码,所述多核苷酸可操作地连接到单亚基DNA依赖性RNA聚合酶启动子,优选病毒单亚基DNA依赖性RNA聚合酶启动子,更优选T3、SP6、K11或T7RNA聚合酶启动子。
2.根据权利要求1所述的用途,其中所述RNA聚合酶在所述细胞内从线性核酸构建体表达,从基因组表达或从载体表达,所述载体优选为质粒。
3.根据权利要求1或2所述的用途,其中所述指导RNA从线性核酸构建体表达,从基因组表达或从载体表达,所述载体优选为质粒。
4.根据权利要求1–3中任一项所述的用途,其中所述RNA指导的核酸酶系统基于CRISPR,诸如CRISPR/Cas和CRISPR/Cpf1。
5.根据权利要求1–4中任一项所述的用途,其中所述细胞是原核细胞,优选芽孢杆菌细胞,或者其中所述细胞是真核细胞,优选哺乳动物细胞,更优选真菌细胞。
6.根据权利要求1–5中任一项所述的用途,其中所述RNA聚合酶从诱导型启动子表达。
7.根据权利要求1–6中任一项所述的用途,其中所述RNA聚合酶是密码子优化的RNA聚合酶和/或断裂RNA聚合酶。
8.根据权利要求1–7中任一项所述的用途,其中所述RNA聚合酶在C末端或N末端具有核定位信号(NLS),更优选地在所述RNA聚合酶的N末端具有SV40NLS。
9.根据权利要求1–8中任一项所述的用途,其中从单个单亚基DNA依赖性RNA聚合酶启动子或从多个单亚基DNA依赖性RNA聚合酶启动子表达多种不同的指导RNA。
10.根据权利要求1–9中任一项所述的用途,其中所述指导RNA从来自单亚基DNA依赖性RNA聚合酶启动子文库的一个或多个单亚基DNA依赖性RNA聚合酶启动子表达。
11.根据权利要求1–10中任一项所述的用途,其中所述单亚基DNA依赖性RNA聚合酶启动子是变体启动子,诸如嵌合启动子。
12.根据权利要求1–11中任一项所述的用途,其中所述指导RNA由多核苷酸编码,所述多核苷酸可操作地连接到单亚基DNA依赖性RNA聚合酶启动子并且可操作地连接到自加工核酶和/或单亚基DNA依赖性RNA聚合酶终止子。
13.根据权利要求1–12中任一项所述的用途,其中所述指导RNA由多核苷酸编码,所述多核苷酸可操作地连接到单亚基DNA依赖性RNA聚合酶启动子,其中所述多核苷酸和单亚基DNA依赖性RNA聚合酶启动子存在于质粒上,并且其中通过将包含所述指导多核苷酸的靶序列的单链或双链寡核苷酸整合到所述质粒中而将所述质粒组装到所述细胞内。
14.根据权利要求1–13中任一项所述的用途,其中所述细胞缺乏NHEJ(非同源末端连接)部件。
15.根据权利要求1–14中任一项所述的用途,其中所述细胞表达功能性异源基因组编辑酶,优选Cas酶,优选Cas9、Cas9切口酶或dCas9,或者其中在所述细胞中存在异源基因组编辑酶,优选Cas酶,优选Cas9、Cas9切口酶或dCas9。
16.一种用于在细胞内表达用于RNA指导的核酸酶系统的指导RNA的方法,其中所述指导RNA由这样的多核苷酸编码,所述多核苷酸可操作地连接到单亚基DNA依赖性RNA聚合酶启动子,优选病毒单亚基DNA依赖性RNA聚合酶启动子,更优选T3、SP6、K11或T7RNA聚合酶启动子,并且其中所述指导RNA的转录由单亚基DNA依赖性RNA聚合酶执行,优选由病毒单亚基DNA依赖性RNA聚合酶执行,更优选由T3、SP6、K11或T7RNA聚合酶执行。
17.根据权利要求16所述的方法,其中所述RNA聚合酶在所述细胞内从线性核酸构建体表达,从基因组表达或从载体表达,所述载体优选为质粒,优选为包含选择性标记的质粒。
18.根据权利要求16或17所述的方法,其中所述指导RNA从线性核酸构建体表达,从基因组表达或从载体表达,所述载体优选为质粒。
19.根据权利要求16–18中任一项所述的方法,其中所述RNA指导的核酸酶系统基于CRISPR,诸如CRISPR/Cas和CRISPR/Cpf1。
20.根据权利要求16–19中任一项所述的方法,其中所述细胞是原核细胞,优选芽孢杆菌细胞,或者其中所述细胞是真核细胞,优选哺乳动物细胞,更优选真菌细胞。
21.根据权利要求16–20中任一项所述的方法,其中所述RNA聚合酶从诱导型启动子表达。
22.根据权利要求16–21中任一项所述的方法,其中所述RNA聚合酶是密码子优化的RNA聚合酶和/或断裂RNA聚合酶。
23.根据权利要求16–22中任一项所述的方法,其中所述RNA聚合酶在C末端或N末端具有核定位信号(NLS),更优选地在所述RNA聚合酶的N末端具有SV40NLS。
24.根据权利要求16–23中任一项所述的方法,其中从单个单亚基DNA依赖性RNA聚合酶启动子或从多个单亚基DNA依赖性RNA聚合酶启动子表达多种不同的指导RNA。
25.根据权利要求16–24中任一项所述的方法,其中所述指导RNA从来自单亚基DNA依赖性RNA聚合酶启动子文库的一个或多个单亚基DNA依赖性RNA聚合酶启动子表达。
26.根据权利要求16–25中任一项所述的方法,其中所述单亚基DNA依赖性RNA聚合酶启动子是变体单亚基DNA依赖性RNA聚合酶启动子,诸如嵌合启动子。
27.根据权利要求16–26中任一项所述的方法,其中所述指导RNA由多核苷酸编码,所述多核苷酸可操作地连接到单亚基DNA依赖性RNA聚合酶启动子并且可操作地连接到自加工核酶和/或单亚基DNA依赖性RNA聚合酶终止子。
28.根据权利要求16-27中任一项所述的方法,其中所述指导RNA由多核苷酸编码,所述多核苷酸可操作地连接到单亚基DNA依赖性RNA聚合酶启动子,其中所述多核苷酸和单亚基DNA依赖性RNA聚合酶启动子存在于质粒上,并且其中通过将包含所述指导多核苷酸的靶序列的单链或双链寡核苷酸整合到所述质粒中而将所述质粒组装到所述细胞内。
29.根据权利要求16-28中任一项所述的方法,其中所述细胞缺乏NHEJ(非同源末端连接)部件。
30.根据权利要求16–29中任一项所述的方法,其中所述细胞表达功能性异源基因组编辑酶,优选Cas酶,优选Cas9、Cas9切口酶或dCas9,或者其中在所述细胞中存在异源基因组编辑酶,优选Cas酶,优选Cas9、Cas9切口酶或dCas9。
31.一种组合物,包含所述细胞、所述RNA聚合酶和所述编码指导RNA的多核苷酸,所述多核苷酸可操作地连接到如在权利要求1–30中任一项所定义的启动子。
32.一种可通过根据权利要求16-30中任一项所述的方法获得的细胞。
33.一种细胞,包含至少所述RNA聚合酶和所述编码指导RNA的多核苷酸,所述多核苷酸可操作地连接到如在权利要求1-30中任一项所定义的启动子,所述细胞优选能够产生目的化合物。
34.一种用于生产目的化合物的方法,包括在有助于生产所述目的化合物的条件下培养根据权利要求32或33所述的细胞,以及任选地纯化或分离所述目的化合物。
CN201780058371.7A 2016-09-23 2017-07-17 用于宿主细胞的指导rna表达系统 Pending CN109715804A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201662399127P 2016-09-23 2016-09-23
US62/399,127 2016-09-23
PCT/EP2017/068014 WO2017216392A1 (en) 2016-09-23 2017-07-17 A guide-rna expression system for a host cell

Publications (1)

Publication Number Publication Date
CN109715804A true CN109715804A (zh) 2019-05-03

Family

ID=59520863

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780058371.7A Pending CN109715804A (zh) 2016-09-23 2017-07-17 用于宿主细胞的指导rna表达系统

Country Status (4)

Country Link
US (2) US20200199599A1 (zh)
EP (1) EP3516056A1 (zh)
CN (1) CN109715804A (zh)
WO (1) WO2017216392A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111349649A (zh) * 2020-03-16 2020-06-30 三峡大学 一种用于双孢蘑菇的基因编辑的方法及应用

Families Citing this family (55)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6261500B2 (ja) 2011-07-22 2018-01-17 プレジデント アンド フェローズ オブ ハーバード カレッジ ヌクレアーゼ切断特異性の評価および改善
US20150044192A1 (en) 2013-08-09 2015-02-12 President And Fellows Of Harvard College Methods for identifying a target site of a cas9 nuclease
US9359599B2 (en) 2013-08-22 2016-06-07 President And Fellows Of Harvard College Engineered transcription activator-like effector (TALE) domains and uses thereof
US9340799B2 (en) 2013-09-06 2016-05-17 President And Fellows Of Harvard College MRNA-sensing switchable gRNAs
US9526784B2 (en) 2013-09-06 2016-12-27 President And Fellows Of Harvard College Delivery system for functional nucleases
US9388430B2 (en) 2013-09-06 2016-07-12 President And Fellows Of Harvard College Cas9-recombinase fusion proteins and uses thereof
US9840699B2 (en) 2013-12-12 2017-12-12 President And Fellows Of Harvard College Methods for nucleic acid editing
WO2016022363A2 (en) 2014-07-30 2016-02-11 President And Fellows Of Harvard College Cas9 proteins including ligand-dependent inteins
US20190225955A1 (en) 2015-10-23 2019-07-25 President And Fellows Of Harvard College Evolved cas9 proteins for gene editing
US11293021B1 (en) 2016-06-23 2022-04-05 Inscripta, Inc. Automated cell processing methods, modules, instruments, and systems
KR102547316B1 (ko) 2016-08-03 2023-06-23 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 아데노신 핵염기 편집제 및 그의 용도
AU2017308889B2 (en) 2016-08-09 2023-11-09 President And Fellows Of Harvard College Programmable Cas9-recombinase fusion proteins and uses thereof
US11542509B2 (en) 2016-08-24 2023-01-03 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
KR20240007715A (ko) 2016-10-14 2024-01-16 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 핵염기 에디터의 aav 전달
US10745677B2 (en) 2016-12-23 2020-08-18 President And Fellows Of Harvard College Editing of CCR5 receptor gene to protect against HIV infection
US11898179B2 (en) 2017-03-09 2024-02-13 President And Fellows Of Harvard College Suppression of pain by gene editing
EP3592777A1 (en) 2017-03-10 2020-01-15 President and Fellows of Harvard College Cytosine to guanine base editor
US11268082B2 (en) 2017-03-23 2022-03-08 President And Fellows Of Harvard College Nucleobase editors comprising nucleic acid programmable DNA binding proteins
EP3615672A1 (en) 2017-04-28 2020-03-04 Editas Medicine, Inc. Methods and systems for analyzing guide rna molecules
US11560566B2 (en) 2017-05-12 2023-01-24 President And Fellows Of Harvard College Aptazyme-embedded guide RNAs for use with CRISPR-Cas9 in genome editing and transcriptional activation
US9982279B1 (en) 2017-06-23 2018-05-29 Inscripta, Inc. Nucleic acid-guided nucleases
US10011849B1 (en) 2017-06-23 2018-07-03 Inscripta, Inc. Nucleic acid-guided nucleases
US20190002874A1 (en) 2017-06-30 2019-01-03 Inscripta, Inc. Cell libraries created using rationally designed nucleic acids
WO2019023680A1 (en) 2017-07-28 2019-01-31 President And Fellows Of Harvard College METHODS AND COMPOSITIONS FOR EVOLUTION OF BASIC EDITORS USING PHAGE-ASSISTED CONTINUOUS EVOLUTION (PACE)
WO2019139645A2 (en) 2017-08-30 2019-07-18 President And Fellows Of Harvard College High efficiency base editors comprising gam
US11795443B2 (en) 2017-10-16 2023-10-24 The Broad Institute, Inc. Uses of adenosine base editors
US10858761B2 (en) 2018-04-24 2020-12-08 Inscripta, Inc. Nucleic acid-guided editing of exogenous polynucleotides in heterologous cells
US10501738B2 (en) 2018-04-24 2019-12-10 Inscripta, Inc. Automated instrumentation for production of peptide libraries
US10557216B2 (en) 2018-04-24 2020-02-11 Inscripta, Inc. Automated instrumentation for production of T-cell receptor peptide libraries
WO2019215102A1 (en) * 2018-05-09 2019-11-14 Dsm Ip Assets B.V. Crispr transient expression construct (ctec)
CN114854720A (zh) 2018-06-30 2022-08-05 因思科瑞普特公司 用于改进活细胞中编辑序列的检测的仪器、模块和方法
US11142740B2 (en) 2018-08-14 2021-10-12 Inscripta, Inc. Detection of nuclease edited sequences in automated modules and instruments
WO2020086475A1 (en) 2018-10-22 2020-04-30 Inscripta, Inc. Engineered enzymes
US11214781B2 (en) 2018-10-22 2022-01-04 Inscripta, Inc. Engineered enzyme
CA3130488A1 (en) 2019-03-19 2020-09-24 David R. Liu Methods and compositions for editing nucleotide sequences
US10815467B2 (en) 2019-03-25 2020-10-27 Inscripta, Inc. Simultaneous multiplex genome editing in yeast
US11001831B2 (en) 2019-03-25 2021-05-11 Inscripta, Inc. Simultaneous multiplex genome editing in yeast
WO2020198641A2 (en) * 2019-03-28 2020-10-01 Intellia Therapeutics, Inc. Polynucleotides, compositions, and methods for polypeptide expression
EP3947662A1 (en) * 2019-04-05 2022-02-09 Danisco US Inc. Methods for integrating a donor dna sequence into the genome of bacillus using linear recombinant dna constructs and compositions thereof
WO2020247587A1 (en) 2019-06-06 2020-12-10 Inscripta, Inc. Curing for recursive nucleic acid-guided cell editing
AU2020297499A1 (en) 2019-06-21 2022-02-03 Inscripta, Inc. Genome-wide rationally-designed mutations leading to enhanced lysine production in E. coli
US10927385B2 (en) 2019-06-25 2021-02-23 Inscripta, Inc. Increased nucleic-acid guided cell editing in yeast
WO2021102059A1 (en) 2019-11-19 2021-05-27 Inscripta, Inc. Methods for increasing observed editing in bacteria
CA3157131A1 (en) 2019-12-10 2021-06-17 Inscripta, Inc. Novel mad nucleases
AU2020407048A1 (en) 2019-12-18 2022-06-09 Inscripta, Inc. Cascade/dCas3 complementation assays for in vivo detection of nucleic acid-guided nuclease edited cells
KR20220133257A (ko) 2020-01-27 2022-10-04 인스크립타 인코포레이티드 전기천공 모듈 및 기구
US20210332388A1 (en) 2020-04-24 2021-10-28 Inscripta, Inc. Compositions, methods, modules and instruments for automated nucleic acid-guided nuclease editing in mammalian cells
GB2614813A (en) 2020-05-08 2023-07-19 Harvard College Methods and compositions for simultaneous editing of both strands of a target double-stranded nucleotide sequence
US11787841B2 (en) 2020-05-19 2023-10-17 Inscripta, Inc. Rationally-designed mutations to the thrA gene for enhanced lysine production in E. coli
EP4214314A1 (en) 2020-09-15 2023-07-26 Inscripta, Inc. Crispr editing to embed nucleic acid landing pads into genomes of live cells
US11512297B2 (en) 2020-11-09 2022-11-29 Inscripta, Inc. Affinity tag for recombination protein recruitment
EP4271802A1 (en) 2021-01-04 2023-11-08 Inscripta, Inc. Mad nucleases
EP4274890A1 (en) 2021-01-07 2023-11-15 Inscripta, Inc. Mad nucleases
US11884924B2 (en) 2021-02-16 2024-01-30 Inscripta, Inc. Dual strand nucleic acid-guided nickase editing
WO2023172495A2 (en) * 2022-03-07 2023-09-14 Mazef Biosciences Llc Methods and compositions for production of biological substances in a genetically modified cell

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014093701A1 (en) * 2012-12-12 2014-06-19 The Broad Institute, Inc. Functional genomics using crispr-cas systems, compositions, methods, knock out libraries and applications thereof
WO2014204724A1 (en) * 2013-06-17 2014-12-24 The Broad Institute Inc. Delivery, engineering and optimization of tandem guide systems, methods and compositions for sequence manipulation
US20160032295A1 (en) * 2013-05-01 2016-02-04 DNA 2.0, Inc. Methods, compositions and kits for a one-step dna cloning system
WO2016110453A1 (en) * 2015-01-06 2016-07-14 Dsm Ip Assets B.V. A crispr-cas system for a filamentous fungal host cell
CN105861552A (zh) * 2016-04-25 2016-08-17 西北农林科技大学 一种T7 RNA 聚合酶介导的CRISPR/Cas9基因编辑系统的构建方法
CN105950639A (zh) * 2016-05-04 2016-09-21 广州美格生物科技有限公司 金黄色葡萄球菌CRISPR/Cas9系统的制备及其在构建小鼠模型中的应用

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5693489A (en) 1984-03-30 1997-12-02 Associated Universities, Inc. Cloning and expression of the gene for bacteriophage T7 RNA polymerase
US5102802A (en) 1986-04-01 1992-04-07 University Of Medicine And Dentistry Of New Jersey Gene coding for a protein having T3 polymerase activity
US5017488A (en) 1986-04-01 1991-05-21 University Of Medicine And Dentistry Of New Jersey Highly efficient dual T7/T3 promoter vector PJKF16 and dual SP6/T3 promoter vector PJFK15
JP5303084B2 (ja) 1997-04-11 2013-10-02 コニンクリーケ デーエスエム ナムローゼ フェンノートシャップ 工業的組み換え生物を溝築するための手段としての遺伝子変換
ATE367439T1 (de) 1997-12-22 2007-08-15 Dsm Ip Assets Bv Expressionsklonierung in filamentösen pilzen
CN100417733C (zh) 2003-07-15 2008-09-10 明特克公司 氧化浸提方法
CA2568603A1 (en) 2003-09-12 2005-03-24 Commonwealth Scientific And Industrial Research Organisation Modified gene-silencing nucleic acid molecules and uses thereof
EP1799829B1 (en) 2004-10-15 2012-01-18 DSM IP Assets B.V. Method for production of a compound in a eukaryotic cell
JP2008527985A (ja) 2005-01-24 2008-07-31 ディーエスエム アイピー アセッツ ビー.ブイ. 糸状菌細胞において目的の化合物を産生させるための方法
ES2534282T3 (es) 2006-06-29 2015-04-21 Dsm Ip Assets B.V. Un método para lograr la expresión polipeptídica mejorada
WO2008053019A2 (en) 2006-11-02 2008-05-08 Dsm Ip Assets B.V. Method for reducing the expression of a gene in a filamentous fungal cell
BRPI1009189A2 (pt) 2009-03-10 2015-09-15 Dsm Ip Assets Bv método para melhorar o rendimento de um polipetídeo
US20120041171A1 (en) 2009-04-22 2012-02-16 Dsm Ip Assets B.V. Process for the production of a recombinant polypeptide of interest
EP2456872B1 (en) 2009-07-22 2017-08-30 DSM IP Assets B.V. Improved host cell for the production of a compound of interest
FR2981088B1 (fr) 2011-10-06 2013-11-29 Biomerieux Sa Arn polymerases mutees
US9045740B2 (en) 2012-02-24 2015-06-02 University Of Massachusetts Modified T7-related RNA polymerases and methods of use thereof
US9738890B2 (en) 2012-03-27 2017-08-22 Dsm Ip Assets B.V. Cloning method
EP4299741A3 (en) * 2012-12-12 2024-02-28 The Broad Institute, Inc. Delivery, engineering and optimization of systems, methods and compositions for sequence manipulation and therapeutic applications
JP6491113B2 (ja) 2013-02-25 2019-03-27 サンガモ セラピューティクス, インコーポレイテッド ヌクレアーゼ媒介性遺伝子破壊を増強するための方法および組成物
EP4245853A3 (en) * 2013-06-17 2023-10-18 The Broad Institute, Inc. Optimized crispr-cas double nickase systems, methods and compositions for sequence manipulation
BR112016013547A2 (pt) * 2013-12-12 2017-10-03 Broad Inst Inc Composições e métodos de uso de sistemas crispr-cas em distúrbios de repetições de nucleotídeos
JP2017501149A (ja) * 2013-12-12 2017-01-12 ザ・ブロード・インスティテュート・インコーポレイテッド 粒子送達構成成分を用いた障害及び疾患の標的化のためのcrispr−cas系及び組成物の送達、使用及び治療適用
CN104651399B (zh) * 2014-12-31 2018-11-16 广西大学 一种利用CRISPR/Cas系统在猪胚胎细胞中实现基因敲除的方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014093701A1 (en) * 2012-12-12 2014-06-19 The Broad Institute, Inc. Functional genomics using crispr-cas systems, compositions, methods, knock out libraries and applications thereof
US20160032295A1 (en) * 2013-05-01 2016-02-04 DNA 2.0, Inc. Methods, compositions and kits for a one-step dna cloning system
WO2014204724A1 (en) * 2013-06-17 2014-12-24 The Broad Institute Inc. Delivery, engineering and optimization of tandem guide systems, methods and compositions for sequence manipulation
WO2016110453A1 (en) * 2015-01-06 2016-07-14 Dsm Ip Assets B.V. A crispr-cas system for a filamentous fungal host cell
CN105861552A (zh) * 2016-04-25 2016-08-17 西北农林科技大学 一种T7 RNA 聚合酶介导的CRISPR/Cas9基因编辑系统的构建方法
CN105950639A (zh) * 2016-05-04 2016-09-21 广州美格生物科技有限公司 金黄色葡萄球菌CRISPR/Cas9系统的制备及其在构建小鼠模型中的应用

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
B HOBL: "Bacteriophage T7 RNA polymerase-based expression in Pichia pastoris", 《PROTEIN EXPR PURIF.》 *
E SOMAYEH: "T7-RNA polymerase dependent RNAi system in Aspergillus fumigatus: A proof of concept study", 《FEMS MICROBIOL LETT.》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111349649A (zh) * 2020-03-16 2020-06-30 三峡大学 一种用于双孢蘑菇的基因编辑的方法及应用

Also Published As

Publication number Publication date
WO2017216392A1 (en) 2017-12-21
US20200199599A1 (en) 2020-06-25
US20230287436A1 (en) 2023-09-14
EP3516056A1 (en) 2019-07-31

Similar Documents

Publication Publication Date Title
CN109715804A (zh) 用于宿主细胞的指导rna表达系统
CN108026523B (zh) 向导rna组装载体
DK2087106T3 (en) MUTATING DELTA8 DESATURATION GENES CONSTRUCTED BY TARGETED MUTAGENES AND USE THEREOF IN THE MANUFACTURE OF MULTI-Saturated FAT ACIDS
KR102319845B1 (ko) 조류 숙주 세포에 대한 crispr-cas 시스템
CN109563505A (zh) 用于真核细胞的组装系统
KR102628801B1 (ko) 세포내 유전자 변형 및 증가된 상동 재조합을 위한 보호 dna 주형 및 이용 방법
AU2016203445B2 (en) Integration of a polynucleotide encoding a polypeptide that catalyzes pyruvate to acetolactate conversion
RU2763170C2 (ru) Производство олигосахаридов человеческого молока в микроорганизмах-хозяевах с модифицированным импортом/экспортом
CN101939434B (zh) 用于在大豆中提高种子贮藏油脂的生成和改变脂肪酸谱的来自解脂耶氏酵母的dgat基因
CN101365788B (zh) Δ-9延伸酶及其在制备多不饱和脂肪酸中的用途
JP2023018093A (ja) 標的核酸の改変のための改善された方法
DK2087105T3 (da) Delta 17-desaturase og anvendelse heraf ved fremstilling af flerumættede fedtsyrer
DK2140006T3 (en) DELTA-5 desaturases AND USE THEREOF FOR THE PRODUCTION OF polyunsaturated fatty acids
KR20120099509A (ko) 재조합 숙주 세포에서 육탄당 키나아제의 발현
DK2576605T3 (en) PREPARATION OF METABOLITES
DK2443248T3 (en) IMPROVEMENT OF LONG-CHAIN POLYUM Saturated OMEGA-3 AND OMEGA-6 FATTY ACID BIOS SYNTHESIS BY EXPRESSION OF ACYL-CoA LYSOPHOSPHOLIPID ACYL TRANSFERASES
KR20140099224A (ko) 케토-아이소발레레이트 데카르복실라제 효소 및 이의 이용 방법
KR20070085665A (ko) 도코사헥사엔산을 생성하는 야로위아 리폴리티카 균주
KR20140092759A (ko) 숙주 세포 및 아이소부탄올의 제조 방법
CA2486392A1 (en) Method for the stable expression of nucleic acids in transgenic plants, controlled by a parsley-ubiquitin promoter
CN109996874A (zh) 10-甲基硬脂酸的异源性产生
CN108779480A (zh) 生产鞘氨醇碱和鞘脂类的方法
KR20130138760A (ko) 고농도의 에이코사펜타엔산 생성을 위한 재조합 미생물 숙주 세포
CN115927299A (zh) 增加双链rna产生的方法和组合物
CN115698297A (zh) 多模块生物合成酶基因组合文库的制备方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20190503

WD01 Invention patent application deemed withdrawn after publication