CN112088215A - Crispr瞬时表达构建体(ctec) - Google Patents

Crispr瞬时表达构建体(ctec) Download PDF

Info

Publication number
CN112088215A
CN112088215A CN201980030758.0A CN201980030758A CN112088215A CN 112088215 A CN112088215 A CN 112088215A CN 201980030758 A CN201980030758 A CN 201980030758A CN 112088215 A CN112088215 A CN 112088215A
Authority
CN
China
Prior art keywords
ctec
sequence
guide rna
polynucleotide
seq
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980030758.0A
Other languages
English (en)
Inventor
约翰尼斯·安德列什·劳博斯
瑞内·维尔瓦尔
布伦达·沃恩克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
DSM IP Assets BV
Original Assignee
DSM IP Assets BV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by DSM IP Assets BV filed Critical DSM IP Assets BV
Publication of CN112088215A publication Critical patent/CN112088215A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/111General methods applicable to biologically active non-coding nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2330/00Production
    • C12N2330/50Biochemical production, i.e. in a transformed host cell
    • C12N2330/51Specially adapted vectors

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Biomedical Technology (AREA)
  • Zoology (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Mycology (AREA)
  • Medicinal Chemistry (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明涉及分子生物学和细胞生物学领域。更具体地,本发明涉及一种用于基因组编辑系统的CRISPR瞬时表达构建体(CTEC)。

Description

CRISPR瞬时表达构建体(CTEC)
技术领域
本发明涉及分子生物学和细胞生物学领域。更具体地,本发明涉及一种用于基因组编辑系统的CRISPR瞬时表达构建体。
背景技术
多核苷酸引导的(polynucleotide-guided)核酸酶系统,也称为多核苷酸引导的基因组编辑系统,是已用于基因组编辑和基因调控(例如以在宿主细胞内产生靶向突变、靶向插入或靶向缺失/敲除)的强大工具,其中最著名的是CRISPR/Cas9系统和CRISPR/Cpf1系统。该工具至少需要多核苷酸引导的核酸酶(例如Cas9和Cpf1)和引导多核苷酸(guide-polynucleotide,例如引导RNA,亦称向导RNA),所述引导多核苷酸使得基因组编辑酶能够靶向DNA的特定序列。此外,为了以精确方式编辑基因组,主要需要供体多核苷酸,例如供体DNA,尤其是当依赖于用于在基因组中的所需位点进行精确编辑的同源重组而不是依赖于通过随机修复过程(例如非同源末端连接)进行的修复时。对于每个靶位点,需要设计和合成供体多核苷酸。另外,对基因组中的靶位点特异的引导多核苷酸需要进行设计,并且需要在细胞内表达或需要在体外表达再引入细胞中。对于使用多核苷酸引导的基因组编辑系统的靶向修饰,需要使用对靶标特异的引导多核苷酸和供体多核苷酸的组合。尤其是对于多重方法,例如当筛选例如敲除文库、敲低文库或启动子替换文库时,因为包含引导多核苷酸或引导多核苷酸表达构建体的匹配组合物和匹配供体多核苷酸将必须一起转化,所以实验工作非常艰辛。为了在一个实验中筛选多种靶标和/或多种修饰,现有技术方案需要加入和使用大量多核苷酸,以及甚至更高量的对包含所需性质的细胞的筛选。因此,持续迫切需要开发改进且简化的引导多核苷酸和供体多核苷酸工具。
附图说明
图1描绘了单拷贝(CEN/ARS)载体pCSN061的载体图谱,所述单拷贝(CEN/ARS)载体pCSN061编码经密码子对优化(CPO)的Cas9以用于在酿酒酵母(S.cerevisiae)中表达。CPOCas9由乳酸克鲁维酵母(Kluyveromyces lactis)KLLA0F20031g启动子和酿酒酵母GND2终止子表达。
KanMX标记盒存在于载体上,其赋予对G418的抗性以允许在平板上或在液体培养物中选择转化体。TRP1标记允许用trp1营养缺陷型来在酵母菌株中选择质粒。
图2描绘了多拷贝(2微米)载体pRN1120的载体图谱。NatMX标记盒存在于载体上,其赋予对诺尔丝菌素(nourseothricin)的抗性以允许在平板上或在液体培养物中选择转化体。该载体用于用于在使用EcoRI和XhoI进行线性化后与sgRNA表达盒体内(在细胞内)重组。
图3描绘了用于Cas9编辑的CTEC DNA片段的设计。CTEC DNA片段由sgRNA表达盒组成,所述sgRNA表达盒包含SNR52p RNA聚合酶III启动子、引导序列(也称为基因组靶序列;靶向INT1基因组基因座或YFP基因)、gRNA结构部件和SUP4 3'侧翼区域(如在DiCarlo等人,2013中所述的),以及编码DNA碱基取代(INT1)或导致移码的DNA碱基缺失(YFP)的供体DNA。
图4描绘了用于Cpf1编辑的CTEC DNA片段的设计。CTEC DNA片段由crRNA表达盒组成,所述crRNA表达盒包含SNR52p RNA聚合酶III启动子、由正向重复序列和靶向INT1基因组基因座或YFP基因的基因组靶序列组成的引导RNA序列,之后是SUP4终止子(如在Zetsche等人,2015中所述的),以及编码3bp取代(INT1)或导致移码的2个碱基对缺失(YFP)的供体DNA。
图5描绘了表达LbCpf1(来自毛螺菌科(|Lachnospiraceae)细菌ND2006)的单拷贝(CEN/ARS)载体pCSN067的载体图谱。KanMX标记存在于载体上。
图6描绘了用于Cpf1编辑的CTEC DNA片段的设计。CTEC DNA片段由crRNA表达盒组成,所述crRNA表达盒包含SNR52p RNA聚合酶III启动子、由正向重复序列和靶向YFP基因的基因组靶序列组成的引导RNA序列,之后是SUP4终止子(如在Zetsche等人,2015中所述的),以及编码导致YFP基因中的移码的2个碱基对缺失的供体DNA。为了能够使用相同的引物组扩增不同的CTEC片段,将连接物5和/或连接物3附接至所述CTEC片段。
图7描绘了用于Cpf1编辑的CTEC DNA片段的设计。CTEC DNA片段由crRNA表达盒组成,所述crRNA表达盒包含SNR52p RNA聚合酶III启动子、由正向重复序列和靶向YFP基因的基因组靶序列组成的引导RNA序列,之后是SUP4终止子(如在Zetsche等人,2015中所述的),以及供体DNA。供体DNA编码导致YFP基因中的移码的2个碱基对缺失(CTEC-31、CTEC-32和CTEC-33),或者编码恰好在YFP表达盒外的侧翼区域(CTEC-34、CTEC-35和CTEC-36)。
图8描绘了根据本发明的CRISPR瞬时表达构建体(CTEC)的离体用途。
在8A中,CTEC与其上具有选择性标记的自主复制质粒一起应用于转化中,并用于预先表达Cas蛋白质(例如,Cas9、Cpf,这些或其他Cas蛋白质的变体)的细胞中。
在8B中,CTEC与其上具有选择性标记和用于Cas蛋白质(例如,Cas9、Cpf,这些或其他Cas蛋白质的变体)的表达盒的自主复制质粒一起应用于转化中。
在8C中,CTEC与具有选择性标记的自主复制质粒一起并且与CAS蛋白质(例如,Cas9、Cpf,这些或其他Cas蛋白质的变体)一起应用于转化中。
图9描绘了根据本发明的CRISPR瞬时表达构建体(CTEC)。
在9A中,CTEC是一个双链DNA片段。
在9B中,CTEC片段基于所提供的两个或更多个片段在细胞中重组,在此以使用编码供体DNA(例如编码靶向的SNP、InDel、在染色体处的DNA的敲除或插入)的另外的多核苷酸元件上的DNA同源性段进行体内装配描述。
在9c中,CTEC片段基于所提供的2个或更多个片段在细胞中重组,在此以使用引导RNA表达盒上的DNA同源性段进行体内装配描述。
在9D中,提供了两个(或更多个)CTEC以在染色体处产生两个(或更多个)多重事件。
在9E中,提供了两个(或更多个)分裂的CTEC,以在染色体处产生一个(或多个)事件,在此具有多个引导RNA表达盒,所述多个引导RNA表达盒可在CTEC处重组,例如以使两个或更多个RNA引导物(guide)作用于染色体上的一个或多个位点的。
在9F中,描绘了9E的变体,其中提供了两个(或更多个)分裂的CTEC,以在染色体处产生一个(或多个)事件,在此具有多个引导RNA表达盒,所述多个引导RNA表达盒可在CTEC处重组,例如以使两个或更多个RNA引导物作用于染色体上的一个或多个位点的。
在9G中,提供了两个(或更多个)分裂的CTEC,以在染色体处产生一个(或多个)事件,在此具有引导RNA表达盒,所述引导RNA表达盒可与编码供体DNA(例如编码靶向的SNP、InDel、在染色体处的DNA的敲除或插入)的另外的多核苷酸元件的多个变体重组。
图10描绘了根据本发明的CRISPR瞬时表达构建体(CTEC)的离体用途。
在10A中,描绘了引导RNA表达盒和另外的多核苷酸元件,其中所述另外的多核苷酸元件从右到左彼此相邻地编码。
在10B中,描述了引导RNA表达盒和另外的多核苷酸元件,其中所述另外的多核苷酸元件通过接头连接至所述引导RNA表达盒,所述接头编码引导RNA靶序列,所述引导RNA靶序列被编码在所述表达盒上的引导RNA识别,并且因此CTEC可离体分裂。
在10C中,示出了10A的变体,其中在CTEC处元件为不同次序。在10D中,示出了10B的变体,其中在CTEC处元件为不同次序。
图11描绘了根据本发明的CRISPR瞬时表达构建体(CTEC)的离体用途。
在11A至11H中,示出了具有和不具有接头序列的CTEC变体,其中在所述CTEC中指示出了左侧(LF)和右侧(RF)同源侧翼,所述同源侧翼可用于制造DNA敲除,例如使用50bp的左和右同源侧翼、使用在染色体处之间的RNA靶向切割,或者例如当接头编码启动子序列时,用于制造该启动子的靶向插入,或者使用以CTEC进行的RNA引导的DNA编辑在基因组上插入由所述接头编码的另一序列。
图12描绘了如图10中所描述的构建体的变体。在此,在CTEC的5'端和3'端处添加了侧翼DNA序列。这些侧翼DNA序列可以应用以具有通用的侧翼,例如以促进简单的PCR或来自CTEC盒的文库(混合物)的PCR。
图13描绘了如在图11中所描绘的构建体的变体。在此,在CTEC的5'端和3'端处添加了侧翼DNA序列。这些侧翼DNA序列可以应用以具有通用的侧翼,例如以促进简单的PCR或来自CTEC盒的文库(混合物)的PCR。
图14描绘了根据本发明的CRISPR瞬时表达构建体(CTEC)的离体用途。
在14A中,CTEC与其上具有选择性标记的线性化自主复制质粒(或其线性部分)一起应用于转化中。CTEC将在细胞中与其上具有选择性标记的线性化的自主复制质粒(或其线性部分)重组。该CTEC的使用将通过选择能够进行同源重组(例如由于细胞周期阶段)的细胞来促进基因组编辑,并且将因此促进基因组编辑过程。
在14B中,描绘了14A的变异用途,其中多个CTEC因为它们的接头彼此重叠而整合在一个载体中,以进一步促进多重编辑。
图15描绘了通过离体使用根据本发明的CRISPR瞬时表达构建体(CTEC)进行的基因组编辑。CTEC被引入到表达RNA引导的基因组编辑酶(例如,Cas9、Cpf,这些或其他Cas样蛋白质的变体)的细胞中,例如通过与包括选择性标记和用于Cas9或Cpf1的表达盒的自主复制质粒一起转化,或者通过与具有选择性标记的自主复制质粒以及Cas9或Cpf1蛋白质一起转化。
图16描绘了通过离体使用根据本发明的CRISPR瞬时表达构建体(CTEC)进行的基因组编辑。CTEC被引入到预先表达RNA引导的基因组编辑酶(例如,Cas9、Cpf,这些或其他Cas样蛋白质的变体)的细胞中,例如通过与包括选择性标记和用于Cas9或Cpf1的表达盒的自主复制质粒一起转化,或者通过与具有选择性标记的自主复制质粒一起并且与Cas9蛋白质或Cpf1蛋白质一起转化。
图17描绘了用于Cas9编辑的CTEC DNA片段的设计。CTEC DNA片段由sgRNA表达盒组成,所述sgRNA表达盒包含SNR52p RNA聚合酶III启动子、靶向YFP基因的引导序列(也称为基因组靶序列)、之后是gRNA结构部件和SUP4 3'侧翼区域(如在DiCarlo等人,2013中所述的),以及供体DNA。供体编码移码,1个DNA碱基缺失或编码恰好在YFP表达盒外的在供体DNA中彼此相邻的2个侧翼区域,从而导致YFP表达盒被完全敲除。供体DNA的长度大小在60bp至100bp之间变化,用于完全敲除YFP基因以及引入移码,在这两种情况下,当掺入供体DNA时,YFP荧光都会失去。所用的CTEC片段在任一侧上均具有与线性化pRN1120载体骨架(由EcoRI和XhoI消化的)同源的50bp序列,以用于含CTEC片段的pRN1120质粒的体内环化。在3'侧上,连接物F(CONF)被包含在供体DNA和与线性化pRN1120片段同源的50bp序列之间。
图18描绘了经密码子优化以在解脂耶氏酵母(Yarrowia lipolytica)中表达的编码Cas9的单拷贝(CEN/ARS)载体MB7452的载体图谱。经密码子优化的Cas9是从解脂耶氏酵母007启动子和解脂耶氏酵母GPD终止子表达的。NatMX标记盒存在于载体上,其赋予对诺尔丝菌素的抗性以允许在琼脂平板上或在液体培养物中选择转化体。β内酰胺酶标记允许在大肠杆菌(E.coli.)中选择质粒。
图19描绘了载体pSTV089的载体图谱。HygB标记盒存在于载体上,其赋予对潮霉素B的抗性以允许在琼脂平板上或在液体培养物中选择转化体。该载体表达Cas9(经密码子优化以在解脂耶氏酵母中表达)以及靶向耶氏酵母属(Yarrowia)KU70基因的sgRNA表达盒。sgRNA表达盒包含耶氏酵母属Y1-HYPO启动子、KU70基因组靶标的6bp反向重复序列、HH核酶(ribozyme)、KU70基因组靶标、HDV核酶和耶氏酵母属PGM终止子。
图20描绘了载体pSTV086的载体图谱。HygB标记盒存在于载体上,其赋予对潮霉素B的抗性以允许在琼脂平板上或在液体培养物中选择转化体。该载体表达Cas9(经密码子优化以在解脂耶氏酵母中表达)以及靶向耶氏酵母属(Yarrowia)基因组中的INT05基因座的sgRNA表达盒。sgRNA表达盒包含耶氏酵母属Y1-HYPO启动子、INT05基因组靶标的6bp反向重复序列、HH核酶、INT05基因组靶标、HDV核酶和耶氏酵母属PGM终止子。
图21描绘了载体pSTV077的载体图谱。HygB标记盒存在于载体上,其赋予对潮霉素B的抗性以允许在琼脂平板上或在液体培养物中选择解脂耶氏酵母转化体。β内酰胺酶标记允许在大肠杆菌(E.coli.)中选择质粒。
序列说明
SEQ ID NO:1列出了Cas9的核苷酸序列,所述核苷酸序列包含经密码子对优化以用于在酿酒酵母(Saccharomyces cerevisiae)中表达的C末端SV40核定位信号。该序列包含来自乳酸克鲁维酵母(Kluyveromyces lactis)的Kl11启动子(KLLA0F20031g的启动子)和来自酿酒酵母的GND2终止子序列。
SEQ ID NO:2列出了载体pCSN061的核苷酸序列。
SEQ ID NO:3列出了载体pRN1120的核苷酸序列。
SEQ ID NO:4列出了用于获得Pthd3-YFP-TenoI表达盒的正向引物的核苷酸序列。
SEQ ID NO:5列出了用于获得Pthd3-YFP-TenoI表达盒的反向引物的核苷酸序列。
SEQ ID NO:6列出了用于将连接物5附接至Pthd3-YFP-TenoI表达盒的正向引物的核苷酸序列。
SEQ ID NO:7列出了用于将连接物3附接至Pthd3-YFP-TenoI表达盒的反向引物的核苷酸序列。
SEQ ID NO:8列出了侧接有连接物5(CON5)和连接物3(CON3)的Pthd3-YFP-TenoI表达盒,即CON5-Pthd3-YFP-TenoI-CON3的核苷酸序列。
SEQ ID NO:9列出了用于将50bp的基因组DNA侧翼附接至YFP表达盒(即CON5-Pthd3-YFP-TenoI-CON3)的连接物5的正向引物的核苷酸序列。
SEQ ID NO:10列出了用于将50bp的基因组DNA侧翼附接至YFP表达盒(即CON5-Pthd3-YFP-TenoI-CON3)的连接物3的反向引物的核苷酸序列。
SEQ ID NO:11列出了在5'侧和3'侧含有50bp的基因组DNA侧翼以用于整合到基因组中的CON5-Pthd3-YFP-TenoI-CON3表达盒的核苷酸序列。
SEQ ID NO:12列出了用于Cas9的INT1的引导序列(基因组靶序列)的核苷酸序列。
SEQ ID NO:13列出了用于将CAS9靶向基因组中的INT1基因座的完整引导RNA盒的核苷酸序列,所述核苷酸序列含有与载体骨架pRN1120的同源性以用于进行同源重组。
SEQ ID NO:14列出了CTEC-1的核苷酸序列,所述核苷酸序列包含用于将Cas9靶向到INT1的引导RNA盒(sgRNA)和在3'侧上的供体DNA。
SEQ ID NO:15列出了CTEC-2的核苷酸序列,所述核苷酸序列包含用于将Cas9靶向到INT1的引导RNA盒(sgRNA)、连接物A和在3'侧上的供体DNA。
SEQ ID NO:16列出了CTEC-3的核苷酸序列,所述核苷酸序列包含用于将Cas9靶向到INT1的引导RNA盒(sgRNA)和在5'侧上的供体DNA。
SEQ ID NO:17列出了CTEC-4的核苷酸序列,所述核苷酸序列包含用于将Cas9靶向到INT1的引导RNA盒(sgRNA)、连接物A和在5'侧上的供体DNA。
SEQ ID NO:18列出了CTEC-5的核苷酸序列,所述核苷酸序列包含用于将Cas9靶向到INT1的引导RNA盒(sgRNA)、PAM和引导靶序列以及在5'侧上的供体DNA。
SEQ ID NO:19列出了CTEC-6B的核苷酸序列,所述核苷酸序列包含用于将Cas9靶向到INT1的引导RNA盒(sgRNA)、PAM和引导靶序列以及在3'侧上的供体DNA。
SEQ ID NO:20列出了CTEC-1的核苷酸序列,所述核苷酸序列包含用于将Cas9靶向到YFP基因的引导RNA盒(sgRNA)和在3'侧上的供体DNA。
SEQ ID NO:21列出了CTEC-2的核苷酸序列,所述核苷酸序列包含用于将Cas9靶向到YFP基因的引导RNA盒(sgRNA)、连接物A和在3'侧上的供体DNA。
SEQ ID NO:22列出了CTEC-3的核苷酸序列,所述核苷酸序列包含用于将Cas9靶向到YFP基因的引导RNA盒(sgRNA)和在5'侧上的供体DNA。
SEQ ID NO:23列出了CTEC-4的核苷酸序列,所述核苷酸序列包含用于将Cas9靶向到YFP基因的引导RNA盒(sgRNA)、连接物A和在5'侧上的供体DNA。
SEQ ID NO:24列出了CTEC-5的核苷酸序列,所述核苷酸序列包含用于将Cas9靶向到YFP基因的引导RNA盒(sgRNA)、PAM和引导靶序列以及在5'侧上的供体DNA。
SEQ ID NO:25列出了CTEC-6A的核苷酸序列,所述核苷酸序列包含用于将Cas9靶向到YFP基因的引导RNA盒(sgRNA)、引导靶标和PAM序列以及在3'侧上的供体DNA。
SEQ ID NO:26列出了用于Cas9的INT1的引导序列(基因组靶序列)的核苷酸序列。
SEQ ID NO:27列出了用于Cas9的YFP的引导序列(基因组靶序列)的核苷酸序列。
SEQ ID NO:28列出了连接物A的核苷酸序列。
SEQ ID NO:29列出了用于将Cas9靶向到CSN009基因组中的YFP表达盒的完整引导RNA表达盒的核苷酸序列。
SEQ ID NO:30列出了用于将Cas9靶向到CSN001基因组中的INT1基因座的完整引导RNA表达盒的核苷酸序列。
SEQ ID NO:31列出了作为用于Cas9编辑的CTEC片段的一部分的YFP供体DNA的核苷酸序列。
SEQ ID NO:32列出了作为用于Cas9编辑的CTEC片段的一部分的INT1供体DNA的核苷酸序列。
SEQ ID NO:33列出了用于扩增在3'侧上含有供体DNA的CTEC片段的正向引物的核苷酸序列。
SEQ ID NO:34列出了用于扩增在5'侧上含有YFP供体DNA的CTEC片段的正向引物的核苷酸序列。
SEQ ID NO:35列出了用于扩增在3'侧上含有YFP供体DNA的CTEC片段的反向引物的核苷酸序列。
SEQ ID NO:36列出了用于扩增在5'侧上含有供体DNA的CTEC片段的反向引物的核苷酸序列。
SEQ ID NO:37列出了用于扩增在5'侧上含有INT1供体DNA的CTEC片段的正向引物的核苷酸序列。
SEQ ID NO:38列出了用于扩增在3'侧上含有INT1供体DNA的CTEC片段的反向引物的核苷酸序列。
SEQ ID NO:39列出了用于扩增YFP ORF的正向引物的核苷酸序列。
SEQ ID NO:40列出了用于扩增YFP ORF的反向引物的核苷酸序列。
SEQ ID NO:41列出了用于对YFP ORF进行测序的正向引物的核苷酸序列。
SEQ ID NO:42列出了用于扩增INT1基因座的一部分的正向引物的核苷酸序列。
SEQ ID NO:43列出了用于扩增INT1基因座的一部分的反向引物的核苷酸序列。
SEQ ID NO:44列出了用于对INT1基因座的一部分进行测序的正向引物的核苷酸序列。
SEQ ID NO:45列出了用于扩增Kl11p-pCSN061骨架-GND2t PCR片段的正向引物的核苷酸序列。
SEQ ID NO:46列出了用于扩增Kl11p-pCSN061骨架-GND2t PCR片段的反向引物的核苷酸序列。
SEQ ID NO:47列出了包含C末端NLS的LbCpf1(来自毛螺菌科细菌ND2006)的蛋白质序列。
SEQ ID NO:48列出了包含C末端NLS的核苷酸序列CPO LbCpf1。
SEQ ID NO:49列出了用于扩增LbCpf1表达盒的正向引物的核苷酸序列。
SEQ ID NO:50列出了用于扩增LbCpf1表达盒的反向引物的核苷酸序列。
SEQ ID NO:51列出了编码LbCpf1的载体pCSN067的核苷酸序列。
SEQ ID NO:52列出了LbCpf1的crRNA盒的正向重复部分的核苷酸序列。
SEQ ID NO:53列出了用于LbCpf1的INT1的引导序列(基因组靶序列)的核苷酸序列。
SEQ ID NO:54列出了用于将LbCpf1靶向到基因组中的INT1基因座的完整引导RNA盒的核苷酸序列,所述核苷酸序列含有与载体骨架pRN1120的同源性以用于进行同源重组。
SEQ ID NO:55列出了CTEC-7的核苷酸序列,所述核苷酸序列包含用于将LbCpf1靶向到YFP基因的引导RNA盒(crRNA)和在3'侧上的供体DNA。
SEQ ID NO:56列出了CTEC-8的核苷酸序列,所述核苷酸序列包含用于将LbCpf1靶向到YFP基因的引导RNA盒(crRNA)、连接物A和在3'侧上的供体DNA。
SEQ ID NO:57列出了CTEC-9的核苷酸序列,所述核苷酸序列包含用于将LbCpf1靶向到YFP基因的引导RNA盒(crRNA)和在5'侧上的供体DNA。
SEQ ID NO:58列出了CTEC-10的核苷酸序列,所述核苷酸序列包含用于将LbCpf1靶向到YFP基因的引导RNA盒(crRNA)、连接物A和在5'侧上的供体DNA。
SEQ ID NO:59列出了CTEC-11的核苷酸序列,所述核苷酸序包括用于将LbCpf1靶向到YFP基因的引导RNA盒(crRNA)、PAM和引导靶序列以及在3'侧上的供体DNA(2×18bp引导物)。
SEQ ID NO:60列出了CTEC-11的核苷酸序列,所述核苷酸序包括用于将LbCpf1靶向到YFP基因的引导RNA盒(crRNA)、PAM和引导靶序列以及在3'侧上的供体DNA(2×20bp引导物)。
SEQ ID NO:61列出了CTEC-12的核苷酸序列,所述核苷酸序包括用于将LbCpf1靶向到YFP基因的引导RNA盒(crRNA)、PAM和引导靶序列以及在5'侧上的供体DNA(2×18bp引导物)。
SEQ ID NO:62列出了CTEC-12的核苷酸序列,所述核苷酸序包括用于将LbCpf1靶向到YFP基因的引导RNA盒(crRNA)、PAM和引导靶序列以及在5'侧上的供体DNA(2×20bp引导物)。
SEQ ID NO:63列出了CTEC-7的核苷酸序列,所述核苷酸序列包含用于将LbCpf1靶向到INT1的引导RNA盒(crRNA)和在3'侧上的供体DNA。
SEQ ID NO:64列出了CTEC-8的核苷酸序列,所述核苷酸序列包含用于将LbCpf1靶向到INT1的引导RNA盒(crRNA)、连接物A和在3'侧上的供体DNA。
SEQ ID NO:67列出了CTEC-11的核苷酸序列,所述核苷酸序列包含用于将LbCpf1靶向到INT1的引导RNA盒(crRNA)、PAM和引导靶序列以及在3'侧上的供体DNA(1×20bp、1×18bp引导物)。
SEQ ID NO:68列出了CTEC-11的核苷酸序列,所述核苷酸序列包含用于将LbCpf1靶向到INT1的引导RNA盒(crRNA)、PAM和引导靶序列以及在3'侧上的供体DNA(2×20bp引导物)。
SEQ ID NO:69列出了菌株CSN010中通过LbCpf1靶向YFP的CTEC片段的引导序列(基因组靶标)的核苷酸序列。
SEQ ID NO:70列出了菌株CSN004中通过LbCpf1靶向INT1的CTEC片段的引导序列(基因组靶标)的核苷酸序列。
SEQ ID NO:71列出了YFP供体DNA的核苷酸序列,所述YFP供体DNA是用于在菌株CSN010中进行LbCpf1介导的编辑的CTEC片段的一部分。
SEQ ID NO:72列出了INT供体DNA的核苷酸序列,所述INT供体DNA是用于在菌株CSN004中进行LbCpf1介导的编辑的CTEC片段的一部分。
SEQ ID NO:73列出了用于将LbCpf1靶向到CSN004的基因组中的INT1基因座的完整引导RNA表达盒的核苷酸序列。
SEQ ID NO:74列出了用于将LbCpf1靶向到CSN010的基因组中的YFP表达盒的完整引导RNA表达盒的核苷酸序列。
SEQ ID NO:75列出了用于通过LbCpf1消化CTEC片段,从而将INT1供体DNA与引导RNA表达盒分离的18bp引导序列(基因组靶序列)的核苷酸序列。
SEQ ID NO:76列出了用于通过LbCpf1消化CTEC片段,从而将YFP供体DNA与引导RNA表达盒分离的18bp引导序列(基因组靶序列)的核苷酸序列。
SEQ ID NO:77列出了用于通过LbCpf1消化CTEC片段,从而将INT1供体DNA与引导RNA表达盒分离的20bp引导序列(基因组靶序列)的核苷酸序列。
SEQ ID NO:78列出了用于通过LbCpf1消化CTEC片段,从而将YFP供体DNA与引导RNA表达盒分离的20bp引导序列(基因组靶序列)的核苷酸序列。
SEQ ID NO:79列出了包含用于通过LbCpf1消化CTEC片段,从而将INT1供体DNA与引导RNA表达盒分离的PAM序列的18bp引导序列(基因组靶序列)的核苷酸序列。
SEQ ID NO:80列出了包含用于通过LbCpf1消化CTEC片段,从而将INT1供体DNA与引导RNA表达盒分离的PAM序列的20bp引导序列(基因组靶序列)的核苷酸序列。
SEQ ID NO:81列出了包含用于通过LbCpf1消化CTEC片段,从而将YFP供体DNA与引导RNA表达盒分离的PAM的18bp引导序列(基因组靶序列)的核苷酸序列。
SEQ ID NO:82列出了包含用于通过LbCpf1消化CTEC片段,从而将YFP供体DNA与引导RNA表达盒分离的PAM序列的20bp引导序列(基因组靶序列)的核苷酸序列。
SEQ ID NO:83列出了用于扩增具有在5'侧上的YFP供体和用于LbCpf1的20bp引导序列的CTEC片段的反向引物的核苷酸序列。
SEQ ID NO:84列出了用于扩增具有在5'侧上的YFP供体和用于LbCpf1的18bp引导序列的CTEC片段的反向引物的核苷酸序列。
SEQ ID NO:85列出了用于扩增具有在5'侧上的INT1供体以供进行LbCpf1编辑的CTEC片段的正向引物的核苷酸序列。
SEQ ID NO:86列出了用于扩增具有在3'侧上的INT1供体以供进行LbCpf1编辑的CTEC片段的反向引物的核苷酸序列。
SEQ ID NO:87列出了CTEC-7的核苷酸序列,所述核苷酸序列包含用于将LbCpf1靶向到YFP基因的引导RNA盒(crRNA)和在3'侧上的供体DNA,在5'侧上侧接有连接物5序列并且在3'侧上侧接有连接物3。
SEQ ID NO:88列出了CTEC-8的核苷酸序列,所述核苷酸序列包含用于将LbCpf1靶向到YFP基因的引导RNA盒(crRNA)、连接物A和在3'侧上的供体DNA,在5'侧上侧接有连接物5序列并且在3'侧上侧接有连接物3。
SEQ ID NO:89列出了CTEC-9的核苷酸序列,所述核苷酸序列包含用于将LbCpf1靶向到YFP基因的引导RNA盒(crRNA)和在5'侧上的供体DNA,在5'侧上侧接有连接物5序列并且在3'侧上侧接有连接物3。
SEQ ID NO:90列出了CTEC-10的核苷酸序列,所述核苷酸序列包含用于将LbCpf1靶向到YFP基因的引导RNA盒(crRNA)、连接物A和在5'侧上的供体DNA,在5'侧上侧接有连接物5序列并且在3'侧上侧接有连接物3。
SEQ ID NO:91列出了CTEC-11的核苷酸序列,所述核苷酸序列包含用于将LbCpf1靶向到YFP基因的引导RNA盒(crRNA)、PAM和引导靶序列以及在3'侧上的供体DNA(2×18bp引导物),在5'侧上侧接有连接物5序列并且在3'侧上侧接有连接物3。
SEQ ID NO:92列出了CTEC-11的核苷酸序列,所述核苷酸序列包含用于将LbCpf1靶向到YFP基因的引导RNA盒(crRNA)、PAM和引导靶序列以及在3'侧上的供体DNA(2×20bp引导物),在5'侧上侧接有连接物5序列并且在3'侧上侧接有连接物3。
SEQ ID NO:93列出了CTEC-12的核苷酸序列,所述核苷酸序列包含用于将LbCpf1靶向到YFP基因的引导RNA盒(crRNA)、PAM和引导靶序列以及在5'侧上的供体DNA(2×18bp引导物),在5'侧上侧接有连接物5序列并且在3'侧上侧接有连接物3。
SEQ ID NO:94列出了CTEC-12的核苷酸序列,所述核苷酸序列包含用于将LbCpf1靶向到YFP基因的引导RNA盒(crRNA)、PAM和引导靶序列以及在5'侧上的供体DNA(2×20bp引导物),在5'侧上侧接有连接物5序列并且在3'侧上侧接有连接物3。
SEQ ID NO:95列出了用于扩增具有在5'侧上的连接物5的CTEC片段的正向引物的核苷酸序列。
SEQ ID NO:96列出了用于扩增具有在3'侧上的连接器3的CTEC片段的反向引物的核苷酸序列。
SEQ ID NO:97列出了连接物5的核苷酸序列。
SEQ ID NO:98列出了连接物3的核苷酸序列。
SEQ ID NO:99列出了CTEC-7的核苷酸序列,所述核苷酸序列包含用于将LbCpf1靶向到YFP基因的引导RNA盒(crRNA)和在3'侧上的供体DNA,在5'侧上侧接有连接物5序列。
SEQ ID NO:100列出了CTEC-8的核苷酸序列,所述核苷酸序列包含用于将LbCpf1靶向到YFP基因的引导RNA盒(crRNA)、连接物A和在3'侧上的供体DNA,在5'侧上侧接有连接物5序列。
SEQ ID NO:101列出了CTEC-9的核苷酸序列,所述核苷酸序列包含用于将LbCpf1靶向到YFP基因的引导RNA盒(crRNA)和在5'侧上的供体DNA,在5'侧上侧接有连接物5序列。
SEQ ID NO:102列出了CTEC-10的核苷酸序列,所述核苷酸序列包含用于将LbCpf1靶向到YFP基因的引导RNA盒(crRNA)、连接物A和在5'侧上的供体DNA,在5'侧上侧接有连接物5序列。
SEQ ID NO:103列出了CTEC-11的核苷酸序列,所述核苷酸序列包含用于将LbCpf1靶向到YFP基因的引导RNA盒(crRNA)、PAM和引导靶序列以及在3'侧上的供体DNA(2×18bp引导物),在5'侧上侧接有连接物5序列。
SEQ ID NO:104列出了CTEC-11的核苷酸序列,所述核苷酸序列包含用于将LbCpf1靶向到YFP基因的引导RNA盒(crRNA)、PAM和引导靶序列以及在3'侧上的供体DNA(2×20bp引导物),在5'侧上侧接有连接物5序列。
SEQ ID NO:105列出了CTEC-12的核苷酸序列,所述核苷酸序列包含用于将LbCpf1靶向到YFP基因的引导RNA盒(crRNA)、PAM和引导靶序列以及在5'侧上的供体DNA(2×18bp引导物),在5'侧上侧接有连接物5序列。
SEQ ID NO:106列出了CTEC-12的核苷酸序列,所述核苷酸序列包含用于将LbCpf1靶向到YFP基因的引导RNA盒(crRNA)、PAM和引导靶序列以及在5'侧上的供体DNA(2×20bp引导物),在5'侧上侧接有连接物5序列。
SEQ ID NO:107列出了CTEC-7的核苷酸序列,所述核苷酸序列包含用于将LbCpf1靶向到YFP基因的引导RNA盒(crRNA)和在3'侧上的供体DNA,在3'侧上侧接有连接物3序列。
SEQ ID NO:108列出了CTEC-8的核苷酸序列,所述核苷酸序列包含用于将LbCpf1靶向到YFP基因的引导RNA盒(crRNA)、连接物A和在3'侧上的供体DNA,在3'侧上侧接有连接物3序列。
SEQ ID NO:109列出了CTEC-9的核苷酸序列,所述核苷酸序列包含用于将LbCpf1靶向到YFP基因的引导RNA盒(crRNA)和在5'侧上的供体DNA,在3'侧上侧接有连接物3序列。
SEQ ID NO:110列出了CTEC-10的核苷酸序列,所述核苷酸序列包含用于将LbCpf1靶向到YFP基因的引导RNA盒(crRNA)、连接物A和在5'侧上的供体DNA,在3'侧上侧接有连接物3序列。
SEQ ID NO:111列出了CTEC-11的核苷酸序列,所述核苷酸序列包含用于将LbCpf1靶向到YFP基因的引导RNA盒(crRNA)、PAM和引导靶序列以及在3'侧上的供体DNA(2×18bp引导物),在3'侧上侧接有连接物3序列。
SEQ ID NO:112列出了CTEC-11的核苷酸序列,所述核苷酸序列包含用于将LbCpf1靶向到YFP基因的引导RNA盒(crRNA)、PAM和引导靶序列以及在3'侧上的供体DNA(2×20bp引导物),在3'侧上侧接有连接物3序列。
SEQ ID NO:113列出了CTEC-12的核苷酸序列,所述核苷酸序列包含用于将LbCpf1靶向到YFP基因的引导RNA盒(crRNA)、PAM和引导靶序列以及在5'侧上的供体DNA(2×18bp引导物),在3'侧上侧接有连接物3序列。
SEQ ID NO:114列出了CTEC-12的核苷酸序列,所述核苷酸序列包含用于将LbCpf1靶向到YFP基因的引导RNA盒(crRNA)、PAM和引导靶序列以及在5'侧上的供体DNA(2×20bp引导物),在3'侧上侧接有连接物3序列。
SEQ ID NO:115列出了CTEC-1的核苷酸序列,所述核苷酸序列包含用于将Cas9靶向到YFP基因的引导RNA盒(sgRNA)和在3'侧上的编码移码的60bp供体DNA。CTEC片段在任一侧上均含有与线性化pRN1120载体片段(经EcoRI和XhoI消化的)同源的50bp以用于体内环化。在3'侧上,连接物F(CONF)被包含在供体DNA和与线性化pRN1120载体骨架片段同源的50bp之间。
SEQ ID NO:116列出了CTEC-1的核苷酸序列,所述核苷酸序列包含用于将Cas9靶向到YFP基因的引导RNA盒(sgRNA)和在3'侧上的编码移码的80bp供体DNA。CTEC片段在任一侧上均含有与线性化pRN1120载体片段(经EcoRI和XhoI消化的)同源的50bp以用于体内环化。在3'侧上,连接物F(CONF)被包含在供体DNA和与线性化pRN1120载体骨架片段同源的50bp之间。
SEQ ID NO:117列出了CTEC-1的核苷酸序列,所述核苷酸序列包含用于将Cas9靶向到YFP基因的引导RNA盒(sgRNA)和在3'侧上的编码移码的100bp供体DNA。CTEC片段在任一侧上均含有与线性化pRN1120载体片段(经EcoRI和XhoI消化的)同源的50bp以用于体内环化。在3'侧上,连接物F(CONF)被包含在供体DNA和与线性化pRN1120载体骨架片段同源的50bp之间。
SEQ ID NO:118列出了CTEC-1的核苷酸序列,所述核苷酸序列包含用于将Cas9靶向到YFP基因的引导RNA盒(sgRNA)和在3'侧上的编码YFP表达盒的完全敲除的60bp供体DNA。CTEC片段在任一侧上均含有与线性化pRN1120载体片段(经EcoRI和XhoI消化的)同源的50bp以用于体内环化。在3'侧上,连接物F(CONF)被包含在供体DNA和与线性化pRN1120载体骨架片段同源的50bp之间。
SEQ ID NO:119列出了CTEC-1的核苷酸序列,所述核苷酸序列包含用于将Cas9靶向到YFP基因的引导RNA盒(sgRNA)和在3'侧上的编码YFP表达盒的完全敲除的80bp供体DNA。CTEC片段在任一侧上均含有与线性化pRN1120载体片段(经EcoRI和XhoI消化的)同源的50bp以用于体内环化。在3'侧上,连接物F(CONF)被包含在供体DNA和与线性化pRN1120载体骨架片段同源的50bp之间。
SEQ ID NO:120列出了CTEC-1的核苷酸序列,所述核苷酸序列包含用于将Cas9靶向到YFP基因的引导RNA盒(sgRNA)和在3'侧上的编码YFP表达盒的完全敲除的100bp供体DNA。CTEC片段在任一侧上均含有与线性化pRN1120载体片段(经EcoRI和XhoI消化的)同源的50bp以用于体内环化。在3'侧上,连接物F(CONF)被包含在供体DNA和与线性化pRN1120载体骨架片段同源的50bp之间。
SEQ ID NO:121列出了用于将Cas9靶向到CSN009基因组中的YFP表达盒的完整引导RNA表达盒(sgRNA)的核苷酸序列。
SEQ ID NO:122列出了菌株CSN009中通过Cas9靶向YFP的CTEC片段的引导序列(基因组靶标)的核苷酸序列。
SEQ ID NO:123列出了编码YFP基因中的移码的60bp供体DNA的核苷酸序列。
SEQ ID NO:124列出了编码YFP基因中的移码的80bp供体DNA的核苷酸序列。
SEQ ID NO:125列出了编码YFP基因中的移码的100bp供体DNA的核苷酸序列。
SEQ ID NO:126列出了编码YFP表达盒的敲除的60bp供体DNA的核苷酸序列。
SEQ ID NO:127列出了编码YFP表达盒的敲除的80bp供体DNA的核苷酸序列。
SEQ ID NO:128列出了编码YFP表达盒的敲除的100bp供体DNA的核苷酸序列。
SEQ ID NO:129列出了用于扩增侧接有与线性化pRN1120载体骨架片段(经EcoRI和XhoI消化的)同源的50bp序列的CTEC片段(SEQ ID NO:115、SEQ ID NO:116、SEQ ID NO:117、SEQ ID NO:118、SEQ ID NO:119和SEQ ID NO:120)的正向引物的核苷酸序列。
SEQ ID NO:130列出了用于扩增侧接有与线性化pRN1120载体骨架片段(经EcoRI和XhoI消化的)同源的50bp序列的CTEC片段(SEQ ID NO:115、SEQ ID NO:116、SEQ ID NO:117、SEQ ID NO:118、SEQ ID NO:119和SEQ ID NO:120)的反向引物的核苷酸序列。
SEQ ID NO:131列出了连接物F(CONF)的核苷酸序列。
SEQ ID NO:132列出了野生型基因组靶标的核苷酸序列(实施例4)
SEQ ID NO:133列出了经修饰的基因组靶标的核苷酸序列(实施例4)
SEQ ID NO:134列出了CTEC DNA片段3的核苷酸序列,所述核苷酸序列包含用于将Cas9靶向到GFP基因的引导RNA表达盒(sgRNA)和在3'侧上的100bp供体DNA,所述供体DNA编码PAM序列中的2个碱基修饰,将其从CGG改变至TAG。
SEQ ID NO:135列出了CTEC DNA片段4的核苷酸序列,所述核苷酸序列包含用于将Cas9靶向到GFP基因的引导RNA表达盒(sgRNA)和100bp的供体DNA,所述供体DNA通过将PAM序列从CGG改变至CGA来编码GFP基因中的沉默突变。除了PAM突变,在供体DNA中还编码了从T至A的碱基变化,由此引入了终止密码子。供体DNA位于CTEC DNA片段4的3'侧。
SEQ ID NO:136列出了耶氏酵母属Yl_HYPO启动子的核苷酸序列。
SEQ ID NO:137列出了GFP基因的引导序列的6bp反向重复序列的核苷酸序列。
SEQ ID NO:138列出了HH核酶的核苷酸序列。
SEQ ID NO:139列出了HDV核酶的核苷酸序列。
SEQ ID NO:140列出了GFP基因的20bp基因组靶序列的核苷酸序列。
SEQ ID NO:141列出了耶氏酵母属Y1-PGM终止子的核苷酸序列。
SEQ ID NO:142列出了靶向GFP基因的引导RNA表达盒(sgRNA)的核苷酸序列。
SEQ ID NO:143列出了CTEC DNA片段1的100bp供体DNA的核苷酸序列。
SEQ ID NO:144列出了CTEC DNA片段2的100bp供体DNA的核苷酸序列。
SEQ ID NO:145列出了CTEC DNA片段3的100bp供体DNA的核苷酸序列。
SEQ ID NO:146列出了CTEC DNA片段4的100bp供体DNA的核苷酸序列。
SEQ ID NO:147列出了质粒MB7452的核苷酸序列。
SEQ ID NO:148列出了Cas9的核苷酸序列,所述核苷酸序列包含经密码子对优化以用于在解脂耶氏酵母中表达的C末端SV40核定位信号。该序列包含均来自解脂耶氏酵母的007启动子序列和GPD终止子序列。
SEQ ID NO:149列出了耶氏酵母属Y1-007启动子的核苷酸序列。
SEQ ID NO:150列出了耶氏酵母属Y1-GPD终止子的核苷酸序列。
SEQ ID NO:151列出了pSTV089的核苷酸序列。
SEQ ID NO:152列出了KU70基因的20bp基因组靶标的核苷酸序列。
SEQ ID NO:153列出了用于敲除耶氏酵母属基因组中的KU70基因的100bp供体DNA片段的核苷酸序列。
SEQ ID NO:154列出了用于确认耶氏酵母属基因组中的KU70基因的敲除的正向引物的核苷酸序列。
SEQ ID NO:155列出了用于确认耶氏酵母属基因组中的KU70基因的敲除的反向引物的核苷酸序列。
SEQ ID NO:156列出了GFP表达盒(Yl_HSP.pro-A.vic_eGFP ORF-Yl_GPD.ter)的核苷酸序列。
SEQ ID NO:157列出了质粒pSTV086的核苷酸序列。
SEQ ID NO:158列出了GFP表达盒(Yl_HSP.pro-A.vic_eGFP ORF-Yl_GPD.ter)的核苷酸序列,所述GFP表达盒在任一侧上侧接有50bp的基因组DNA序列以用于靶向整合到INT05基因座中。
SEQ ID NO:159列出了用于确认GFP表达盒在耶氏酵母属基因组中的INT05基因座中的整合的正向引物的核苷酸序列。
SEQ ID NO:160列出了用于确认GFP表达盒在耶氏酵母属基因组中的INT05基因座中的整合的反向引物的核苷酸序列。
SEQ ID NO:161列出了质粒pSTV077的核苷酸序列。
SEQ ID NO:162列出了耶氏酵母属Y1-HSP启动子的核苷酸序列。
SEQ ID NO:163列出了维多利亚多管发光水母(Aequorea victoria)eGFP基因(A.vic_eGFP ORF)的核苷酸序列。
SEQ ID NO:164列出了耶氏酵母属Y1-GPD终止子的核苷酸序列。
SEQ ID NO:165列出了用于扩增来自耶氏酵母属基因组的经编辑的GFP ORF的正向引物的核苷酸序列。
SEQ ID NO:166列出了用于扩增来自耶氏酵母属基因组的经编辑的GFP ORF的反向引物的核苷酸序列。
SEQ ID NO:167列出了KU70基因组靶标的6bp反向重复序列的核苷酸序列。
SEQ ID NO:168列出了INT05基因组靶标的6bp反向重复序列的核苷酸序列。
SEQ ID NO:169列出了INT05基因座的20bp基因组靶序列的核苷酸序列。
SEQ ID NO:170列出了CTEC DNA片段1的核苷酸序列,所述核苷酸序列包含用于将Cas9靶向到GFP基因的引导RNA表达盒(sgRNA)和在3'侧上的编码GFP ORF的完全敲除的100bp供体DNA。
SEQ ID NO:171列出了CTEC DNA片段2的核苷酸序列,所述核苷酸序列包含将Cas9靶向到GFP基因的引导RNA表达盒(sgRNA)和在3'侧上的100bp供体DNA,所述供体DNA编码PAM序列中的碱基缺失,将其从CGG改变至CG。
具体实施方式
发明人已发现,根据本发明的CRISPR瞬时表达构建体(CTEC)提供了相对于现有技术的巨大改进。在该系统中,引导RNA(guide-RNA)最初并且瞬时地从CTEC表达。所表达的引导RNA促进将断裂诱导到靶基因组中的靶序列处,随后供体多核苷酸整合到靶基因组中。该系统可以例如使用CTEC文库来方便地使用,其中在与引导RNA连接的构建体上存在不同的另外功能性或非功能性多核苷酸元件。本发明可以方便地用于例如在宿主细胞内产生靶向突变、靶向插入或靶向缺失/敲除。如本文所提供的CTEC可以被视为如在例如CRISPR/Cas和CRISPR/Cpf1基因编辑领域中已知的意义上的供体多核苷酸,所述供体多核苷酸含有其特异的引导RNA表达盒。根据本发明的CTEC的特定布局使CTEC的引导RNA部分整合到(被编辑的)基因组中的机会最小化。这是相对于现有技术(例如PCT/EP2018/058612)的重大优点,因为不再需要去除引导RNA盒。此外,它使创建基因驱动(gene drives)的风险最小化。
通过使用多核苷酸引导的核酸酶/编辑系统(例如CRISPR/Cas9系统),有可能开发这样的基因驱动,所述基因驱动能够经由有性复制而由生物体自发地扩散基因组改变,例如由DiCarlo等人,2015所解释的。发明人和申请人都并非已经旨在、旨在或将旨在创建此类基因驱动或类似的自主基因编辑工具(也称为诱变链式反应或活性遗传学)。
在第一方面中,提供了CRISPR瞬时表达构建体(CTEC)用于在宿主细胞中表达特异于靶基因组中的靶序列的功能性引导RNA或其部分的离体用途,其中所述CTEC是线性的并且包含:
-引导RNA表达盒,和
-另外的多核苷酸元件,并且
其中所述引导RNA表达盒能够表达特异于靶基因组中的靶序列的功能性引导RNA或其部分,并且其中所述另外的多核苷酸元件与所述靶基因组中的所述靶序列具有序列同一性(sequence identity)。
在本发明所有实施方式的上下文中,CRISPR瞬时表达构建体(CTEC)是一种多核苷酸构建体,所述多核苷酸构建体不是自主复制实体;其不包含自主复制序列。CTEC可以通过两个或更多个分开的线性构件的重组而在体内(在细胞内)形成。术语多核苷酸在本文的“一般定义”中定义。
细胞中靶基因组中的靶序列是功能性多核苷酸引导的基因组编辑酶和引导RNA的复合物结合的位置,并且是(如果适用的话)创建(诱导)双链断裂或单链断裂(切口)的位置。在本文中,“靶序列”在本文中也称为“引导RNA靶标”。“引导RNA表达盒”在本文中也称为“crRNA盒”。
在本发明的所有实施方式中,术语“靶向突变”、“靶向插入”和“靶向缺失/敲除”是指在宿主细胞的基因组中的预定位置处制造的突变、插入、缺失/敲除。突变可以是沉默突变或导致氨基酸变化的突变。突变不限于单个核苷酸的突变,两个或更多个核苷酸可以被突变。插入是指将至少一个核苷酸添加至靶基因组中。插入可以与突变和/或缺失组合,只要所得的基因组与CTEC编辑之前的靶基因组不同即可。缺失是指从靶基因组中缺失至少一个核苷酸。可以将缺失与突变和/或缺失组合,只要所得的基因组与编辑前的靶基因组不同即可。插入可具有任何合适的长度,例如至少一个核苷酸、至少10个核苷酸、至少20个、30个、40个、50个、60个、70个、80个、90个、100个、110个、120个、130个、140个、150个、160个、170个、180个、190个、200个、250个、300个、400个、500个、600个、700个、800个、900个、或至少1000个核苷酸。插入可具有至多20个、30个、40个、50个、60个、70个、80个、90个、100个、110个、120个、130个、140个、150个、160个、170个、180个、190个、200个、250个、300个、400个、500个、600个、700个、800个、900个或至少1000个核苷酸。插入可以在20-1000个、100-1000个、100-500个或200-500个核苷酸的范围内。缺失可以具有任何合适的长度,例如至少一个、两个、三个、四个、五个、六个、七个、八个、九个核苷酸、至少10个核苷酸、至少20个、30个、40个、50个、60个、70个、80个、90个、100个、110个、120个、130个、140个、150个、160个、170个、180个、190个、200个、250个、300个、400个、500个、600个、700个、800个、900个、或至少1000个核苷酸。缺失可以为至多20个、30个、40个、50个、60个、70个、80个、90个、100个、110个、120个、130个、140个、150个、160个、170个、180个、190个、200个、250个、300个、400个、500个、600个、700个、800个、900个、1000个、2000个、3000个、4000个或5000个核苷酸。缺失可以在20-5000个、100-1000个、100-500个或200-500个核苷酸的范围内。
在本发明的所有实施方式中,CRISPR瞬时表达构建体(CTEC)是线性CRISPR瞬时表达构建体。线性具有本领域已知的用于多核苷酸的含义;应理解为多核苷酸不是环状的,具有两个明确限定的末端——5'末端和3'末端,所述末端优选均为平末端。根据本发明的CTEC可以从头合成,其也可以通过例如PCR或通过用限制酶消化而从载体(诸如质粒)、从文库或其他系统产生。根据本发明的引导RNA表达盒是多核苷酸表达构建体,所述多核苷酸表达构建体包含在体内(诸如细胞内)表达功能性引导RNA或其部分所需的除RNA聚合酶之外的部件。所述部件包括但不限于启动子、编码引导RNA或其部分的编码序列,以及终止子。此类部件是本领域技术人员已知的,并且优选是如本文所定义的那些部件。所述引导RNA的“部分”优选是包含引导序列或由引导序列组成的部分。引导序列是识别序列,即这样的序列,所述序列对靶基因组中的靶序列是特异的(即基本上互补的)并且允许将功能性多核苷酸引导的基因组编辑酶和功能性引导RNA的复合物靶向到靶基因组中的靶序列。在引导RNA或其部分中的引导序列的上下文中的术语“特异性”应解释为引导序列与靶基因组中的靶序列基本上互补,其中“基本上互补”意指在靶序列与引导序列之间存在足够的互补性(序列同一性),以允许在细胞中在生理条件下进行杂交;通常允许一个或两个错配仍允许充分杂交。当使用合适的比对算法进行最佳比对时,互补性(序列同一性)程度优选高于50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%或高于99%。不同的序列可以引导核酸酶,所述序列如用于Cas9的引导RNA(Mali等人,2013;Cong等人,2013)和用于Cpf1的引导RNA(Zetsche等人,2015),如本领域技术人员已知的。当CTEC中的编码序列不编码完整且功能性的引导RNA,而是编码引导RNA的包含引导序列或由引导序列组成的部分时,引导RNA的其他部分与引导序列一起形成功能性引导RNA,所述功能性引导RNA在不同构建体上编码或在细胞内原样存在。编码引导RNA的其余部件的构建体可以存在于基因组中或可以存在于载体上或可以原样存在于细胞中或可以原样递送至细胞中。
功能性多核苷酸引导的基因组编辑酶可以是本领域技术人员已知的任何系统。用于本发明所有实施方式中的合适功能性基因组编辑系统包括:RNA引导的内切核酸酶,如CRISPR/Cas(Mali等人,2013;Cong等人,2013)或CRISPR/Cpf1(Zetsche等人,2015)。功能性基因组编辑酶可以是天然酶或异源酶,并且可以是例如以下酶:Cas酶,优选地Cas9或Cas9切口酶;Cpf1。
在根据本发明的用途中,在CTEC中,另外的多核苷酸元件位于引导RNA表达盒的3'端或引导RNA表达盒的5'端;这意味着引导RNA表达盒在其5'端或其3'端侧接有与靶基因组中的靶序列具有序列同一性的另外的多核苷酸元件。此类构建体的非限制性示例尤其在图3、图4、图8和图9中示出。
在其5'端或其3'端侧接有另外的多核苷酸元件应解释为该另外的多核苷酸元件位于引导RNA表达盒的5'末端侧或3'末端侧附近。为避免疑义,CTEC是单个多核苷酸,其中以下部分是可识别的:另外的多核苷酸元件--引导RNA表达盒引导RNA表达盒--另外的多 核苷酸元件,但由单串连续核苷酸组成。“另外的多核苷酸元件”在本文中也称为“供体多核苷酸”或“供体DNA”。
所述另外的多核苷酸元件可以是任何合适的功能性或非功能性的另外的多核苷酸元件,例如控制序列、标记、编码如本文其他地方所定义的感兴趣的化合物的感兴趣的基因,或破坏构建体。控制序列可以是任何控制序列或控制序列的组合,诸如启动子、KOZAK序列、信号序列、终止子、前序列、前原序列、前导序列、激活物序列、阻遏物序列、HIS标签、分裂GFP标签,或任何其他N端标签。优选的控制序列是启动子序列。这例如使得能够插入启动子或用另一种启动子替换内源启动子或其部分。引入的启动子可以比内源启动子更强或更弱和/或可以是诱导型启动子。此类启动子是本领域技术人员已知的。标记可以是任何类型的标记,只要其可以被鉴定并因此用作标记即可。标记可以是例如选择性标记,或可以是例如具有要用作条形码的已知序列的可鉴定多核苷酸,或可以是标签,诸如HIS标签、GFP标签、分裂GFP标签、溶解度标签。应当注意的是,自引导整合构建体由于其独特的引导序列而已经本身提供条形码标记,所述条形码标记表示自引导整合构建体的整合位点处的条形码。感兴趣的基因可以是任何感兴趣的基因,并且优选是如小节“一般定义”中所定义的感兴趣的基因。感兴趣的基因可以是包含启动子、编码序列和终止子的完整表达构建体,或者可以至少包含编码序列。
另外的多核苷酸元件与靶基因组中的靶序列具有序列同一性。根据本发明的CTEC中的另外的多核苷酸元件的序列同一性优选地使得所述另外的多核苷酸元件和靶基因组中的靶序列可以在体内(例如在细胞内)重组,使得根据本发明的CTEC整合到靶基因组中。然而,通常,仅另外的多核苷酸元件整合到基因组中;引导RNA表达盒通常并且优选地不整合到基因组中。本领域技术人员应理解,所述另外的多核苷酸元件可以不物理整合到基因组中,但是至少所述另外的多核苷酸元件的序列被引入到基因组中的靶位点处。
如果另外的多核苷酸元件具有与靶基因组中的靶序列中的原型间隔区相邻基序(Protospacer Adjacent Motif,PAM)具有序列同一性的序列,则所述另外的多核苷酸元件中与PAM具有序列同一性的部分可包含针对PAM的突变,使得当所述另外的多核苷酸元件的序列整合到基因组中时,其将不会被基因组编辑酶复合物识别和切割。如果另外的多核苷酸元件具有与靶基因组中的引导RNA靶序列具有序列同一性的序列,则所述另外的多核苷酸元件中与引导RNA靶序列具有序列同一性的部分可包含针对引导RNA靶标的突变,使得当所述另外的多核苷酸元件的序列整合到基因组中时,其将不会被基因组编辑酶复合物识别和切割。
所述另外的多核苷酸元件不需要在其整个长度上具有序列同一性,使所述另外的多核苷酸元件的一部分(或多个部分)具有(足够的)序列同一性来允许与靶基因组中的靶序列重组就足够了。
本领域技术人员知道一些错配是可允许的,同时仍然允许重组。优选地,如本文所公开的CTEC的另外的多核苷酸元件与靶基因组中的靶序列的序列同一性为至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、97%、98%或99%,并且最优选地100%。根据本发明的另外的多核苷酸元件可以具有任何长度,只要允许在体内(例如在细胞内)重组,使得如本文所公开的CTEC的另外的多核苷酸元件或CTEC整合到靶基因组中即可。在本发明的实施方式中,另外的多核苷酸元件的长度可为至少10个、15个、20个、25个、30个、35个、40个、45个、50个、55个、60个、65个、70个、75个、80个、85个、90个、95个、100个、110个、120个、130个、140个、150个、160个、170个、180个、190个、200个、210个、220个、230个、240个、250个、260个、270个、280个、290个、300个、350个、400个、450个、500个、600个、700个、800个、900个或1000个核苷酸。优选地,另外的多核苷酸元件的长度为至多1000个、900个、800个、700个、600个、500个、450个、400个、350个、300个、290个、280个、270个、260个、250个、240个、230个、220个、210个、200个、190个、180个、170个、160个、150个、140个、130个、120个、110个、100个、95个、90个、85个、80个、75个、70个、65个、60个、55个、50个、45个、40个、35个、30个、25个、20个、15个或10个核苷酸。另外的多核苷酸元件的长度可例如大于40个核苷酸或50个核苷酸,并且在约40个核苷酸或约50个核苷酸至约1千个核苷酸、约40个核苷酸或约50个核苷酸至约500个核苷酸、约40个核苷酸或约50个核苷酸至约300个核苷酸、约40个核苷酸或约50个核苷酸至约250个核苷酸、或约40个核苷酸或约50个核苷酸至约200个核苷酸的范围内。另外的多核苷酸元件的长度可以为35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、50个、51个、52个、53个、54个、55个、56个、57个、58个、59个、60个、61个、62个、63个、64个、65个、66个、67个、68个、69个、70个、71个、72个、73个、74个、75个、76个、77个、78个、79个、80个、81个、82个、83个、84个、85个、86个、87个、88个、89个、90个、91个、92个、93个、94个、95个、96个、97个、98个、99个、100个、101个、102个、103个、104个、105个、106个、107个、108个、109个、110个、111个、112个、113个、114个、115个、116个、117个、118个、119个、120个、121个、122个、123个、124个、125个、126个、127个、128个、129个、130个、131个、132个、133个、134个、135个、136个、137个、138个、139个、140个、141个、142个、143个、144个、145个、146个、147个、148个、149个、150个、151个、152个、153个、154个、155个、156个、157个、158个、159个、160个、161个、162个、163个、164个、165个、166个、167个、168个、169个、170个、171个、172个、173个、174个、175个、176个、177个、178个、179个、180个、181个、182个、183个、184个、185个、186个、187个、188个、189个、190个、191个、192个、193个、194个、195个、196个、197个、198个、199个、200个、201个、202个、203个、203个、204个、205个、206个、207个、208个、209个、210个、220个、221个、222个、223个、224个、225个、226个、227个、228个、229个、230个、231个、232个、233个、234个、235个、236个、237个、238个、239个、240个、241个、242个、243个、244个、245个、246个、247个、248个或250个核苷酸。
本发明中包括这样的用途,其中提供了两个或更多个CTEC,所述两个或更多个CTEC包含另外的多核苷酸元件和相同的引导RNA表达盒,并且其中所述另外的多核苷酸元件与靶基因组中的靶序列具有序列同一性,所述靶序列对于所述两个或更多个CTEC中的每一者是不同的。此类CTEC的非限制性示例尤其在图9E中示出。
在本发明中包括这样的用途,其中提供了两个或更多个CTEC,所述两个或更多个CTEC各自包含不同的引导RNA表达盒和另外的多核苷酸元件,所述另外的多核苷酸元件与靶基因组中的靶序列具有序列同一性,所述靶序列对于所述两个或更多个CTEC中的每一者是相同的。在该实施方式中,减少了NHEJ修复的频率,因为如果通过NHEJ修复由第一CTEC和多核苷酸引导的编辑酶介导的断裂,则靶位点将仍存在并且将是另一CTEC的靶标。在此类迭代中,NHEJ的概率将是用于单个CTEC介导的编辑事件的NHEJ概率的平方。此类CTEC的非限制性示例尤其在图9F和图9G中示出。
CTEC中的另外的多核苷酸元件与靶基因组中的靶序列具有序列同一性。另外的多核苷酸元件的序列同一性可以是与靶序列本身,即基因组中功能性多核苷酸引导的基因组编辑酶和引导RNA的复合物结合的序列。CTEC中的另外的多核苷酸元件的序列同一性也可以是与靶序列侧翼的序列或与靶序列并且与靶序列侧翼的序列,只要使得能够在另外的多核苷酸元件与靶序列之间进行重组,以及如果是靶序列侧翼的序列的情况下,使得能够在另外的多核苷酸元件与靶序列侧翼的序列之间进行重组即可。作为示例,可以是200bp的另外的多核苷酸元件在其5'端具有与同靶基因组中的靶序列的3'端相邻的50bp部分具有序列同一性的50bp部分,并且另外的多核苷酸元件在其3'端具有与同靶基因组中的靶序列的5'端相邻的50bp部分具有序列同一性的50bp部分。在这种情况下,当由功能性多核苷酸引导的基因组编辑酶与由CTEC编码的引导RNA的复合物引发双链断裂时,另外的多核苷酸元件与靶基因组中的靶序列周围的区域之间的重组可以有效地发生。作为另一个示例,可以是100bp的另外的多核苷酸元件在其5'端具有与同靶基因组中的靶序列的3'端相邻的50bp部分具有序列同一性的50bp部分,并且另外的多核苷酸元件在其3'端具有与同靶基因组中的靶序列的5'端相邻的50bp部分具有序列同一性的50bp部分。在这种情况下,当由功能性多核苷酸引导的基因组编辑酶与由CTEC编码的引导RNA的复合物引发双链断裂时,另外的多核苷酸元件与靶基因组中的靶序列周围的区域之间的重组可以有效地发生。本领域技术人员将理解许多变化是可能的,这些变化中的一些在本文的示例和附图中示出,但不限于此。在本文中,另外的多核苷酸元件的所述5'部分和3'部分可以描绘为侧翼。
靶基因组中与靶序列相邻的部分可以在靶基因组中与靶序列紧邻地定位。靶基因组中与靶序列相邻的部分也可以远离靶序列定位。基因组中与靶序列相邻的部分可以距离靶序列约1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、15个、20个、30个、40个、50个、100个、200个、300个、400个、500个、1000个、5000个、10000个核苷酸。
在本发明的实施方式中,标记可用于促进包含根据本发明的CTEC的宿主细胞的选择或促进已经由根据本发明的CTEC编辑的宿主细胞的选择。此类标记可以存在于CTEC上,但是优选地存在于单独的多核苷酸,例如质粒,例如自主复制质粒上。
在根据本发明的用途中,根据本发明的功能性引导RNA或其部分可仅从自引导整合构建体表达,这意味着宿主细胞中不存在其他引导RNA表达构建体(不在基因组中并且不在载体上)。最初从自引导整合构建体表达对靶基因组中的靶序列特异的引导RNA或其部分。所表达的引导RNA促进将断裂诱导到靶基因组中的靶序列处,随后自引导整合构建体整合到靶基因组中。
在根据本发明的用途中,CTEC可以由两个或更多个能够彼此重组以产生根据本发明的CTEC的多核苷酸组成,所述CTEC包含:
-引导RNA表达盒,和
-另外的多核苷酸元件,
其中所述引导RNA表达盒能够表达特异于靶基因组中的靶序列的功能性引导RNA或其部分,其中所述另外的多核苷酸元件与所述靶基因组中的所述靶序列具有序列同一性。此类CTEC的非限制性示例尤其在图9B和图9C中描绘。
在本发明的实施方式中,CTEC中的另外的多核苷酸元件可以直接定位在引导RNA表达盒的5'末端侧或3'末端侧,或者接头可以存在于另外的多核苷酸元件与引导RNA表达构建体之间。在本发明的实施方式中,接头也被称为连接物。接头可以具有任何长度,并且可以是非编码区。接头的长度可以是1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个或50个核苷酸。接头的长度可以是至少约5个、10个、15个、20个、25个或30个核苷酸。接头的长度可以是至多约30个、25个、20个、15个、10个或5个核苷酸。此类CTEC的非限制性示例尤其在图3中描绘(CTEC-2和CTEC 3)。
在本发明的实施方式中,接头可以是特殊的接头;在CTEC中,引导RNA表达盒和另外的多核苷酸元件可通过包含与引导RNA的引导序列对应的靶序列的多核苷酸连接,从而允许从所述另外的多核苷酸元件体内切割所述引导RNA表达盒。不受理论的束缚,从另外的多核苷酸元件中分离引导RNA表达盒可增加另外的多核苷酸元件整合到基因组中的靶位点处的机会,而来自另外的多核苷酸元件的引导RNA表达盒保持附加型(episomal)。此类CTEC的非限制性示例尤其在图3中描绘(CTEC-5、CTEC-6A和CTEC-6B)。
在本发明的实施方式中,CTEC优选地包含能够表达功能性引导RNA的引导RNA表达盒。
本发明的实施方式的引导RNA表达盒是一种多核苷酸表达构建体,所述多核苷酸表达构建体包含在体内(诸如细胞内)表达功能性引导RNA或其部分所需的除RNA聚合酶之外的所有部件。所述部件包括但不限于启动子、编码引导RNA或其部分的编码序列,以及终止子。存在用于在体内(诸如在细胞内)表达引导RNA的几种方式。引导RNA可以从任何合适的启动子(例如真核启动子)表达。引导RNA可以从RNA聚合酶II启动子表达。此类启动子是本领域技术人员已知的。优选的RNA聚合酶II启动子列出于WO2016/50136、WO2016/50135和WO2016/110453中。引导RNA可以从RNA聚合酶III启动子表达。此类启动子是本领域技术人员已知的。优选的RNA聚合酶III启动子列出于WO2016/50136、WO2016/50135和WO2016/110453中。当使用RNA聚合酶III启动子时,优选使用自加工核酶将原始转录产物转化为成熟的引导RNA。引导RNA可以从单亚基DNA依赖性RNA聚合酶启动子表达。此类启动子是本领域技术人员已知的。优选的单亚基DNA依赖性RNA聚合酶启动子是病毒单亚基DNA依赖性RNA聚合酶启动子,例如T3、SP6、K11或T7 RNA聚合酶启动子。此类优选的单亚基DNA依赖性RNA聚合酶启动子列出于US62/399127中。
本发明的实施方式中的CTEC可包含能够与载体,优选地与质粒重组以体内产生整合到载体中的CTEC的两个或更多个多核苷酸序列。此类CTEC的非限制性示例尤其在图14A和图14B中描绘。
为了使用例如聚合酶链式反应(PCR)促进根据本发明的CTEC的合成,CTEC可以侧接有PCR引物(primer)可以与其退火的序列。这些序列可以定位在引导RNA表达构建体中或另外的多核苷酸元件中,或者可以作为单独的序列添加。所添加的序列可以描述为5'侧翼和3'侧翼。此类CTEC的非限制性示例尤其在图6A至图6C中描绘。优选的是,这些侧翼与引导RNA表达构建体、另外的多核苷酸元件或基因组几乎没有同源性或没有同源性。5'侧翼和3'侧翼可以具有任何长度,同时仍然能够与PCR引物退火。5'侧翼或3'侧翼的长度可为例如10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个或50个核苷酸长。
本发明还提供了包含根据本发明的CTEC的组合物或包含根据本发明的CTEC文库的组合物用于在宿主细胞中表达特异于靶基因组中的一个或多个靶序列的功能性引导RNA或其部分的离体用途。此类用途包括但不限于将CTEC或CTEC文库引入宿主细胞中。本发明的实施方式中的CTEC文库可含有均特异于相同靶序列的CTEC,并且例如各自包含不同的另外的多核苷酸元件。CTEC文库可以包含均特异于不同靶序列的CTEC,并且例如各自包含相同的另外的多核苷酸元件。
如本文所定义的CTEC或包含CTEC或CTEC文库的组合物的根据本发明的离体用途还可包括使用功能性多核苷酸引导的基因组编辑酶或能够表达功能性多核苷酸引导的基因组编辑酶的表达构建体,并且其中所述功能性多核苷酸引导的基因组编辑酶优选地为Cas9或Cpf1,全部如上文所定义。
在CRISPR瞬时表达构建体(CTEC)根据本发明的实施方式的用于在宿主细胞中表达功能性引导RNA或其部分的离体用途中,宿主细胞可缺乏非同源末端连接(NHEJ)。
在第二方面中,本发明提供了一种宿主细胞,所述宿主细胞包含如在第一方面和本发明的其他实施方式中所定义的CTEC。在本发明的该方面中,所有特征优选是如在本发明的第一方面中所定义的那些特征。宿主细胞可以是任何宿主细胞。优选的宿主细胞是真菌、藻类、微藻或海洋真核生物,更优选是酵母细胞、丝状真菌细胞和网黏菌纲(Labyrinthulomycetes)细胞;所有这些都如在小节“一般定义”中所定义。宿主细胞应被解释为至少一种宿主细胞,并且根据本发明的CTEC应被解释为至少一种根据本发明的CTEC。因此,这样的宿主细胞群在本发明的范围内,所述宿主细胞群包含根据本发明的CTEC文库,并且优选地包含2个、3个、4个、5个、6个、7个、8个、9个、10个或更多个CTEC。宿主细胞和宿主细胞群在本文中称为根据本发明的宿主细胞。
根据本发明的该方面的宿主细胞还可包含表达构建体,所述表达构建体能够表达功能性多核苷酸引导的基因组编辑酶,例如功能性多核苷酸引导的异源基因组编辑酶,其中所述功能性多核苷酸引导的基因组编辑酶优选地为Cas9或Cpf1,全部如上文所定义。
在根据本发明的宿主细胞中,可以将另外的多核苷酸元件的序列引入到基因组中所述另外的多核苷酸元件与在靶基因组中的靶序列侧翼的序列具有序列同一性的位点处。
根据本发明的该方面的宿主细胞可缺乏非同源末端连接(NHEJ)。
在第三方面中,本发明提供了一种用于生产宿主细胞的离体方法,所述方法包括将根据本发明并且在上文定义的CTEC或如上文所定义的组合物引入宿主细胞中。在该方法中,来自CTEC的引导RNA表达盒可不整合到宿主细胞的基因组中。在本发明的该方面,所有特征优选地是在本发明的第一方面和第二方面中所定义的那些特征。
宿主细胞应被解释为至少一种宿主细胞,并且根据本发明的CTEC应被解释为至少一种根据本发明的CTEC。因此,在根据本发明的离体方法的一个实施方式中,将CRISPR瞬时表达构建体(CTEC)的文库引入宿主细胞群中。此类方法可以方便地用于筛选目的。
在根据本发明的离体方法中,在宿主细胞中可以存在功能性多核苷酸引导的基因组编辑酶,或者可以将其单独地或与CRISPR瞬时表达构建体(CTEC)或CRISPR瞬时表达构建体(CTEC)文库同时引入宿主细胞中;功能性多核苷酸引导的基因组编辑酶优选地可为Cas9或Cpf1,全部如上文所定义。
在本发明的该方面的一个实施方式中,在宿主细胞中存在载体,例如质粒,包含两个或更多个能够与所述载体重组以产生整合到所述载体中的CTEC的多核苷酸序列的CTEC可以整合到所述载体中。
在根据本发明的离体方法中,可以将另外的多核苷酸元件的序列引入到基因组中所述另外的多核苷酸元件与在靶基因组中的靶序列侧翼的序列具有序列同一性的位点处。
在根据本发明的离体方法中,特异于靶基因组中的靶序列的功能性引导RNA或其部分可仅从引入的CRISPR瞬时表达构建体(CTEC)表达。
在根据本发明的离体方法中,所述方法还可包括确定CRISPR瞬时表达构建体(CTEC)的另外的多核苷酸元件的序列是否已经被引入到宿主细胞的基因组中和/或CRISPR瞬时表达构建体(CTEC)的另外的多核苷酸元件的序列已经被引入到宿主细胞的基因组中的何处。可以使用本领域技术人员已知的任何技术来执行此类确定,所述技术为诸如但不限于PCR分析和测序,诸如允许在使用自引导整合构建体的文库时进行容易筛选的下一代测序。所述确定可通过分析由优选通过使用选择性生长条件所产生的宿主细胞生产的基因产物来进行。此类选择性生长条件可以例如允许对具有感兴趣性质的宿主进行阳性选择、允许筛选已引入自引导整合构建体的文库的宿主细胞群。基因产物可以是例如代谢物、酶(例如葡糖淀粉酶或解决营养缺陷型的酶)或标记)。在本发明的该方面中,可以分离所产生的具有感兴趣的特性的宿主细胞。
根据本发明的宿主细胞可以是缺乏非同源末端连接(NHEJ)的宿主细胞。
在第四方面中,本发明提供了一种根据本发明的第二方面的宿主细胞或可通过根据本发明的第三方面的方法获得的宿主细胞或通过根据本发明的第三方面的方法获得的宿主细胞,其中所述宿主细胞包含编码感兴趣的化合物的多核苷酸。在该方面的一个实施方式中,宿主细胞表达感兴趣的化合物。在本发明的该方面,所有特征优选地是如在本发明的第一方面、第二方面和第三方面中所定义的那些特征。所述感兴趣的化合物优选为如在小节“一般定义”中所定义的感兴趣的化合物。
还提供了一种用于生产感兴趣的化合物的方法,所述方法包括在有助于所述感兴趣的化合物的生产的条件下培养该方面的宿主细胞,以及任选地纯化或分离所述感兴趣的化合物。
本发明还提供了如上文所定义并且如本文附图、序列表和实施例中所定义的线性CRISPR瞬时表达构建体(CTEC)。下文列出了根据本发明的CTEC的非限制性例示示例。
一种线性CRISPR瞬时表达构建体(CTEC),所述线性CTEC包含:
-引导RNA表达盒,和
-另外的多核苷酸元件,
其中所述引导RNA表达盒能够表达特异于靶基因组中的靶序列的功能性引导RNA或其部分,其中所述另外的多核苷酸元件与所述靶基因组中的所述靶序列具有序列同一性。
一种CRISPR瞬时表达构建体(CTEC),所述CTEC包含:
两个或更多个能够彼此重组以产生以下物质的线性多核苷酸:
-引导RNA表达盒,和
-另外的多核苷酸元件,
其中所述引导RNA表达盒能够表达特异于靶基因组中的靶序列的功能性引导RNA或其部分,其中所述另外的多核苷酸元件与所述靶基因组中的所述靶序列具有序列同一性。
如上文所列出的CRISPR瞬时表达构建体(CTEC),其中所述引导RNA表达盒和所述另外的多核苷酸元件通过包含与所述引导RNA的所述引导序列对应的靶序列的多核苷酸连接,从而允许从所述另外的多核苷酸元件体内切割所述引导RNA表达盒。
如上文所列出的CRISPR瞬时表达构建体(CTEC),其中所述引导RNA表达盒能够表达功能性引导RNA。
一种组合物,所述组合物包含两种或更多种多核苷酸构件,其中这些构件彼此具有序列同一性,所述序列同一性允许它们在体内重组,例如在宿主细胞中重组,以产生如上文所列出的CRISPR瞬时表达构建体(CTEC)。
如上文所列出的CRISPR瞬时表达构建体(CTEC)或如上文所列出的组合物,其中所述引导RNA表达盒包含真核启动子。
如上文所列出的CRISPR瞬时表达构建体(CTEC)或如上文所列出的组合物,其中所述功能性引导RNA或其部分由所述引导RNA表达盒上的多核苷酸编码,并且所述多核苷酸可操作地连接至RNA聚合酶II启动子、RNA聚合酶III启动子以及自加工核酶或单亚基DNA依赖性RNA聚合酶启动子,所述单亚基DNA依赖性RNA聚合酶启动子优选地为病毒单亚基DNA依赖性RNA聚合酶启动子,更优选地T3 RNA聚合酶启动子、SP6 RNA聚合酶启动子、K11 RNA聚合酶启动子或T7RNA聚合酶启动子。
如上文所列出的CRISPR瞬时表达构建体(CTEC)或如上文所列出的组合物,其中所述引导RNA表达盒位于所述另外的多核苷酸元件的3'端。
如上文所列出的CRISPR瞬时表达构建体(CTEC)或如上文所列出的组合物,其中所述引导RNA表达盒位于所述另外的多核苷酸元件的5'端。
如上文所列出的CRISPR瞬时表达构建体(CTEC)或如上文所列出的组合物,其中所述CTEC包含能够与载体,优选地与质粒重组,以体内产生整合到所述载体中的所述CTEC的两个或更多个多核苷酸序列。
实施方式
提供以下本发明的实施方式;这些实施方式中的特征优选为本文前面定义的那些。
1.CRISPR瞬时表达构建体(CTEC)用于在宿主细胞中表达特异于靶基因组中的靶序列的功能性引导RNA或其部分的离体用途,其中所述CRISPR瞬时表达构建体是线性的并且包含:
-引导RNA表达盒,和
-另外的多核苷酸元件,并且
其中所述引导RNA表达盒能够表达特异于靶基因组中的靶序列的功能性引导RNA或其部分,并且其中所述另外的多核苷酸元件与所述靶基因组中的所述靶序列具有序列同一性。
2.根据实施方式1所述的CRISPR瞬时表达构建体(CTEC)的离体用途,其中特异于靶基因组中的靶序列的所述功能性引导RNA或其部分是从所述CTEC专有表达的。
3.根据实施方式1或2所述的CRISPR瞬时表达构建体(CTEC)的离体用途,其中所述CTEC由能够彼此重组以产生以下物质的两个或更多个多核苷酸组成:
-引导RNA表达盒,和
-另外的多核苷酸元件,
其中所述引导RNA表达盒能够表达特异于靶基因组中的靶序列的功能性引导RNA或其部分,其中所述另外的多核苷酸元件与所述靶基因组中的所述靶序列具有序列同一性。
4.根据实施方式1至3中任一项所述的CRISPR瞬时表达构建体(CTEC)的离体用途,其中在所述CTEC中,所述引导RNA表达盒和所述另外的多核苷酸元件通过包含与所述引导RNA的所述引导序列对应的靶序列的多核苷酸连接,从而允许从所述另外的多核苷酸元件体内切割所述引导RNA表达盒。
5.根据实施方式1至4中任一项所述的CRISPR瞬时表达构建体(CTEC)的离体用途,其中所述引导RNA表达盒能够表达功能性引导RNA。
6.根据实施方式1至5中任一项所述的CRISPR瞬时表达构建体(CTEC)的离体用途,其中所述引导RNA表达盒包含真核启动子。
7.根据实施方式1至5中任一项所述的CRISPR瞬时表达构建体(CTEC)的离体用途,其中所述功能性引导RNA或其部分由所述引导RNA表达盒上的多核苷酸编码,并且所述多核苷酸可操作地连接至RNA聚合酶II启动子、RNA聚合酶III启动子以及自加工核酶或单亚基DNA依赖性RNA聚合酶启动子,所述单亚基DNA依赖性RNA聚合酶启动子优选地为病毒单亚基DNA依赖性RNA聚合酶启动子,更优选地T3 RNA聚合酶启动子、SP6 RNA聚合酶启动子、K11RNA聚合酶启动子或T7 RNA聚合酶启动子。
8.根据实施方式1至7中任一项所述的CRISPR瞬时表达构建体(CTEC)的离体用途,其中所述引导RNA表达盒位于所述另外的多核苷酸元件的3'末端。
9.根据实施方式1至7中任一项所述的CRISPR瞬时表达构建体(CTEC)的离体用途,其中所述引导RNA表达盒位于所述另外的多核苷酸元件的5'末端。
10.根据实施方式1至9中任一项所述的CRISPR瞬时表达构建体(CTEC)的离体用途,其中所述CTEC包含能够与载体,优选地与质粒重组,以体内产生整合到所述载体中的所述CTEC的两个或更多个多核苷酸序列。
11.包含如在实施方式1至10中任一项中所定义的CRISPR瞬时表达构建体(CTEC)或包含如在实施方式1至10中任一项中所定义的CRISPR瞬时表达构建体(CTEC)的文库的组合物用于在宿主细胞中表达特异于靶基因组中的一个或多个靶序列的功能性引导RNA或其部分的离体用途。
12.根据实施方式1至10中任一项所述的CRISPR瞬时表达构建体(CTEC)的离体用途或根据实施方式11所述的组合物的离体用途,所述离体用途还包括使用功能性多核苷酸引导的基因组编辑酶或能够表达功能性多核苷酸引导的基因组编辑酶的表达构建体,并且其中所述功能性多核苷酸引导的基因组编辑酶优选地为Cas9或Cpf1。
13.根据实施方式1至12中任一项所述的离体用途,其中所述宿主细胞缺乏非同源末端连接(NHEJ)。
14.一种宿主细胞,所述宿主细胞包含如在实施方式1-10中任一项中所定义的CRISPR瞬时表达构建体(CTEC)或包括如在实施方式11中所定义的组合物。
15.根据实施方式14所述的宿主细胞,所述宿主细胞还包含:
功能性多核苷酸引导的基因组编辑酶,优选地功能性多核苷酸引导的异源基因组编辑酶,或者
还包含能够表达功能性多核苷酸引导的基因组编辑酶,优选地功能性多核苷酸引导的异源基因组编辑酶的表达构建体,
其中所述功能性多核苷酸引导的基因组编辑酶优选地为Cas9或Cpf1。
16.根据实施方式15所述的宿主细胞,其中所述另外的多核苷酸元件的序列被引入到所述基因组中所述另外的多核苷酸元件与在所述靶基因组中的所述靶序列侧翼的序列具有序列同一性的位点处。
17.根据实施方式14至16中任一项所述的宿主细胞,其中所述宿主细胞缺乏非同源末端连接(NHEJ)。
18.一种用于生产宿主细胞的离体方法,所述方法包括将如在实施方式1至10中任一项中所定义的CRISPR瞬时表达构建体(CTEC)或如在实施方式11中所定义的组合物引入宿主细胞中,其中来自所述CTEC的所述引导RNA表达盒优选地不整合到所述宿主细胞的所述基因组中。
19.根据实施方式18所述的离体方法,其中将CRISPR瞬时表达构建体(CTEC)的文库引入宿主细胞群中。
20.根据实施方式18或19所述的离体方法,其中在所述宿主细胞中存在功能性多核苷酸引导的基因组编辑酶,或者将其单独地或与所述CRISPR瞬时表达构建体(CTEC)或CRISPR瞬时表达构建体(CTEC)文库同时引入所述宿主细胞中,并且其中所述功能性多核苷酸引导的基因组编辑酶优选地为Cas9或Cpf1。
21.根据实施方式18至20中任一项所述的离体方法,其中在所述宿主细胞中存在载体,优选地质粒,包含两个或更多个能够与所述载体重组以产生整合到所述载体中的CTEC的多核苷酸序列的CTEC可以整合到所述载体中。
22.根据实施方式18至21中任一项所述的离体方法,其中所述另外的多核苷酸元件的序列被引入到所述基因组中所述另外的多核苷酸元件与在所述靶基因组中的所述靶序列侧翼的序列具有序列同一性的位点处。
23.根据实施方式18至22中任一项所述的离体方法,其中特异于靶基因组中的靶序列的所述功能性引导RNA或其部分仅从所述引入的CRISPR瞬时表达构建体(CTEC)表达。
24.根据实施方式18至23中任一项所述的离体方法,所述方法还包括确定CRISPR瞬时表达构建体(CTEC)的另外的多核苷酸元件的序列是否已经被引入到宿主细胞的基因组中和/或CRISPR瞬时表达构建体(CTEC)的另外的多核苷酸元件的序列已经被引入到宿主细胞的基因组中的何处的步骤。
25.根据实施方式24所述的离体方法,其中所述确定是通过分析由优选通过使用选择性生长条件所产生的宿主细胞生产的基因产物而进行的。
26.根据实施方式18至25中任一项所述的离体方法,其中所述宿主细胞缺乏非同源末端连接(NHEJ)。
27.根据实施方式14至17中任一项所述的宿主细胞或可通过根据实施方式18至26中任一项所述的方法获得的宿主细胞或通过根据实施方式18至26中任一项所述的方法获得的宿主细胞,所述宿主细胞包含编码感兴趣的化合物的多核苷酸。
28.根据实施方式27所述的宿主细胞,所述宿主细胞表达感兴趣的化合物。
29.一种用于生产感兴趣的化合物的方法,所述方法包括在有助于所述感兴趣的化合物的生产的条件下培养根据实施方式27或28所述的宿主细胞,以及任选地纯化或分离所述感兴趣的化合物。
30.一种线性CRISPR瞬时表达构建体(CTEC),所述线性CTEC包含:
-引导RNA表达盒,和
-另外的多核苷酸元件,
其中所述引导RNA表达盒能够表达特异于靶基因组中的靶序列的功能性引导RNA或其部分,其中所述另外的多核苷酸元件与所述靶基因组中的所述靶序列具有序列同一性。
31.一种CRISPR瞬时表达构建体(CTEC),所述CTEC包含:
两个或更多个能够彼此重组以产生以下物质的线性多核苷酸:
-引导RNA表达盒,和
-另外的多核苷酸元件,
其中所述引导RNA表达盒能够表达特异于靶基因组中的靶序列的功能性引导RNA或其部分,其中所述另外的多核苷酸元件与所述靶基因组中的所述靶序列具有序列同一性。
32.根据实施方式30或31所述的CRISPR瞬时表达构建体(CTEC),其中所述引导RNA表达盒和所述另外的多核苷酸元件通过包含与所述引导RNA的所述引导序列对应的靶序列的多核苷酸连接,从而允许从所述另外的多核苷酸元件体内切割所述引导RNA表达盒。
33.根据实施方式30至32中任一项所述的CRISPR瞬时表达构建体(CTEC),其中所述引导RNA表达盒能够表达功能性引导RNA。
34.一种组合物,所述组合物包含两种或更多种多核苷酸构件,其中这些构件彼此具有序列同一性,所述序列同一性允许它们在体内重组,例如在宿主细胞中重组,以产生根据实施方式30至33中任一项所述的CRISPR瞬时表达构建体(CTEC)。
35.根据实施方式30至33中任一项所述的CRISPR瞬时表达构建体(CTEC)或根据实施方式34所述的组合物,其中所述引导RNA表达盒包含真核启动子。
36.根据实施方式30至33和35中任一项所述的CRISPR瞬时表达构建体(CTEC)或根据实施方式34所述的组合物,其中所述功能性引导RNA或其部分由所述引导RNA表达盒上的多核苷酸编码,并且所述多核苷酸可操作地连接至RNA聚合酶II启动子、RNA聚合酶III启动子以及自加工核酶或单亚基DNA依赖性RNA聚合酶启动子,所述单亚基DNA依赖性RNA聚合酶启动子优选地为病毒单亚基DNA依赖性RNA聚合酶启动子,更优选地T3 RNA聚合酶启动子、SP6 RNA聚合酶启动子、K11 RNA聚合酶启动子或T7 RNA聚合酶启动子。
37.根据实施方式30至33和35至36中任一项所述的CRISPR瞬时表达构建体(CTEC)或根据实施方式34所述的组合物,其中所述引导RNA表达盒位于所述另外的多核苷酸元件的3'端。
38.根据实施方式30至33和35至36中任一项所述的CRISPR瞬时表达构建体(CTEC)或根据实施方式34所述的组合物,其中所述引导RNA表达盒位于所述另外的多核苷酸元件的5'端。
39.根据实施方式30至33和35至38中任一项所述的CRISPR瞬时表达构建体(CTEC)或根据实施方式34所述的组合物,其中所述CTEC包含能够与载体,优选地与质粒重组,以体内产生整合到所述载体中的所述CTEC的两个或更多个多核苷酸序列。
一般定义
在整个说明书和所附权利要求书中,词语“包括(comprise)”、“包含(include)”和“具有(having)”以及诸如“包括(comprises/comprising)”和“包含(includes/including)”的变型将被包含性地解释。也就是说,在上下文允许的情况下,这些词语旨在传达可能包括未具体叙述的其他要素或整数。
在本文中不用冠词修饰的名词(英文说明书中用“a”或“an”修饰的名词)用于指代一个或多于一个(即,一个或至少一个)该语法对象。举例来说,“要素”可以表示一个要素或多于一个要素。
当与数值(例如,约10)结合使用时,词语“约”或“近似”优选地意味值可以是给定值(10)加减该值的1%。
CRISPR干扰(CRISPRi)是一种遗传扰动技术,该遗传扰动技术允许对原核和真核细胞中的基因表达进行序列特异性抑制或激活。
当本文中提及术语“0kbp”缺失时,这不是精确的“0kbp”;取决于SGIC的具体情况,将在整合SGIC后从基因组中缺失几个碱基对,例如约80个、90个、100个、110个、120个、130个、140个或150个碱基对。
多核苷酸在本文中是指任何长度或确定的特定长度范围或确定的特定长度的脱氧核糖核苷酸或核糖核苷酸或它们的混合物或类似物的核苷酸聚合形式。多核苷酸可以具有任何三维结构,并且可以执行任何已知或未知的功能。以下是多核苷酸的非限制性示例:基因或基因片段的编码或非编码区、根据连锁分析定义的一个或多个基因座、外显子、内含子、信使RNA(mRNA)、转移RNA(tRNA)、核糖体RNA(rRNA)、短干扰RNA(siRNA)、短发夹RNA(shRNA)、微RNA(miRNA)、核酶、cDNA、重组多核苷酸、支链多核苷酸、质粒、载体、具有任何序列的分离DNA、具有任何序列的分离RNA、核酸探针、寡核苷酸和引物。多核苷酸可包含天然和非天然核苷酸,并且可包含一个或多个修饰的核苷酸,诸如甲基化核苷酸和核苷酸类似物或核苷酸等同物,其中核苷酸类似物或等同物被定义为具有经修饰的碱基、和/或经修饰的骨架、和/或非天然的核苷间键、或这些修饰的组合的残基。根据需要,可以在装配多核苷酸之前或之后引入对核苷酸结构的修饰。多核苷酸可以在聚合后进一步修饰,诸如通过与标记化合物缀合。
通常,密码子优化是指通过以下方式来修饰核酸序列以增强在感兴趣的宿主细胞中的表达的过程:用在所述宿主细胞的基因中更频繁或最频繁使用的密码子替换天然序列的至少一个密码子(例如,多于1个、2个、3个、4个、5个、10个、15个、20个、25个、50个或更多个密码子),同时保持天然氨基酸序列。不同物种对特定氨基酸的某些密码子表现出特定偏倚。密码子偏倚(生物体之间密码子使用的差异)通常与信使RNA(mRNA)的翻译效率相关,而信使RNA(mRNA)的翻译效率据信又尤其取决于被翻译的密码子的性质和特定转移RNA(tRNA)分子的可用性。所选择的tRNA在细胞中主导通常反映了肽合成中最常使用的密码子。因此,可以基于密码子优化来定制基因以实现给定生物中的最佳基因表达。密码子使用表是容易例如在“密码子使用数据库(Codon Usage Database)”中获得的,并且这些表可以以多种方式进行调整。参见例如Nakamura,Y.等人,2000。用于对特定序列进行密码子优化以在特定宿主细胞中表达的计算机算法,例如Gene Forge(Aptagen;Jacobus,PA),也是可得的。优选地,编码Cas蛋白的序列中的一个或多个密码子(例如,1个、2个、3个、4个、5个、10个、15个、20个、25个、50个或更多个,或所有密码子)对应于特定氨基酸的最频繁使用的密码子。用于密码子优化的优选方法描述于WO2006/077258和WO2008/000632中)。WO2008/000632涉及密码子对优化。密码子对优化是这样的一种方法,在所述方法中,编码多肽的核苷酸序列在密码子使用方面(特别是所使用的密码子对)被修饰,以获得编码所述多肽的核苷酸序列的改善表达和/或所编码多肽的改进产生。密码子对被定义为编码序列中的一组两个紧接三联体(密码子)。根据本发明的组合物中的来源中Cas蛋白的量可以变化,并且可以进行优化以实现最佳性能。
在具有5'-帽的RNA分子中,7-甲基鸟苷酸残基位于RNA的5'末端上(诸如通常在真核细胞中的mRNA中)。RNA聚合酶II(Pol II)在真核细胞中转录mRNA。信使RNA加帽通常发生如下:由RNA末端磷酸酶去除mRNA转录物的最末端5'磷酸基团,留下两个末端磷酸酯。由鸟苷酰转移酶将单磷酸鸟苷(GMP)加入到转录物的末端磷酸酯中,从而在转录物末端处留下5'-5'三磷酸酯连接的鸟嘌呤。最后,用甲基转移酶甲基化该末端鸟嘌呤的7-氮。本文中术语“不具有5'-帽”用于指具有例如5'-羟基而不是5'-帽的RNA。例如,此类RNA可称为“未加帽的RNA”。未加帽的RNA可以在转录后在细胞核中更好地积累,因为5'-加帽的RNA经受核输出。
核酶(ribozyme)是指这样的一种或多种RNA序列,所述一种或多种RNA序列形成能够在特定位点处切割RNA的二级、三级和/或四级结构。核酶包括“自切割核酶或自加工核酶”,其能够在相对于核酶序列的c/s位点处切割RNA(即,自动催化或自切割的)。核酶溶核活性的一般性质是本领域的技术人员已知的。用于RNA引导的核酸酶系统(例如CRISPR/Cas)的引导RNA的生产中的自加工核酶的使用尤其由Gao等人,2014描述。
核苷酸类似物或等同物通常包含经修饰的骨架。此类骨架的示例由吗啉代骨架、氨基甲酸酯骨架、硅氧烷骨架、硫化物骨架、亚砜骨架和砜骨架、甲酰乙酰基(formacetyl)和硫代甲酰乙酰基骨架、亚甲基甲酰乙酰基骨架、核乙酰基(riboacetyl)骨架、含烯烃的骨架、氨基磺酸酯骨架、磺酸酯骨架和磺酰胺骨架、亚甲基亚氨基骨架和亚甲基肼基骨架,以及酰胺骨架提供。进一步优选的是,骨架中残基之间的键不包含磷原子,诸如由短链烷基或环烷基核苷间键、混合的杂原子和烷基或环烷基核苷间键、或一个或多个短链杂原子或杂环核苷间键形成的键。
优选的核苷酸类似物或等同物包含具有经修饰的聚酰胺骨架的肽核酸(PNA)(Nielsen等人,1991.Science 254,1497-1500)。基于PNA的分子是DNA分子在碱基对识别方面的真实模拟物。PNA的骨架由通过肽键连接的N-(2-氨基乙基)-甘氨酸单元组成,其中核碱基通过亚甲基羰基键与骨架连接。替代的骨架包括一个碳延伸的吡咯烷PNA单体(Govindaraju和Kumar,2005.Chem.Commun,495-497)。因为PNA分子的骨架不含带电荷的磷酸基团,所以PNA-RNA杂合体通常分别比RNA-RNA或RNA-DNA杂合体更稳定(Egholm等人,1993.Nature365,566-568)。
进一步优选的骨架包含吗啉代核苷酸类似物或等同物,其中核糖或脱氧核糖被6元吗啉代环替换。最优选的核苷酸类似物或等同物包括磷酰二胺吗啉代寡聚物(PMO),其中核糖或脱氧核糖被6元吗啉代环替换,并且相邻吗啉代环之间的阴离子磷酸二酯键被非离子磷酰二胺键替换。
进一步优选的核苷酸类似物或等同物包括对磷酸二酯键中的至少一个非桥连氧的取代。这种修饰稍微破坏了碱基配对稳定性,但增加了对核酸酶降解的显著抗性。优选的核苷酸类似物或等同物包括硫代磷酸酯、手性硫代磷酸酯、二硫代磷酸酯、磷酸三酯、氨基烷基磷酸三酯、H-膦酸酯、甲基膦酸酯和其他烷基膦酸酯(包括3'-亚烷基膦酸酯、5'-亚烷基膦酸酯和手性膦酸酯)、次膦酸酯、磷酸酰胺酯(包括3'-氨基磷酸酰胺酯和氨基烷基磷酸酰胺酯)、硫代磷酸酰胺酯、硫代烷基膦酸酯、硫代烷基磷酸三酯、硒代磷酸酯或硼代磷酸酯。
进一步优选的核苷酸类似物或等同物包含一个或多个在2'、3'和/或5'位置处被单取代或二取代的糖部分,诸如-OH;-F;取代或未取代的、直链或支链的低级(C1-C10)烷基、烯基、炔基、烷芳基、烯丙基、芳基或芳烷基,所述基团可被一个或多个杂原子中断;O-烷基、S-烷基或N-烷基;O-烯基、S-烯基或N-烯基;O-炔基、S-炔基或N-炔基;O-烯丙基、S-烯丙基或N-烯丙基;O-烷基-O-烷基,O-烷基-O-甲氧基,O-烷基-O-氨基丙氧基;氨氧基、甲氧基乙氧基;-二甲基氨基氧基乙氧基;以及-二甲氨基乙氧基乙氧基。糖部分可以是吡喃糖或其衍生物,或脱氧吡喃糖或其衍生物,优选核糖或其衍生物,或脱氧核糖或其衍生物。这种优选的衍生糖部分包括锁定核酸(Locked Nucleic Acid,LNA),其中2'-碳原子与糖环的3'或4'碳原子连接,从而形成双环糖部分。优选的LNA包含2'-O,4'-C-亚乙基桥连核酸(Morita等人,2001.Nucleic Acid Res增刊No.1:241-242)。这些取代使得核苷酸类似物或等同物具有对RNA酶H和核酸酶的抗性并增加了对靶标的亲和力。
本发明上下文中氨基酸序列或核酸序列的“序列同一性”或“同一性”在本文中被定义为两个或更多个氨基酸(肽、多肽或蛋白质)序列或两个或更多个核酸(核苷酸、寡核苷酸、多核苷酸)序列之间的关系,如通过比较所述序列确定的。在本领域中,“同一性”还意指氨基酸或核苷酸序列(视情况而定)之间的序列相关性程度,如通过具有此类序列的链之间的匹配所确定的。在本发明中,与特定序列的序列同一性优选是指在所述特定多肽或多核苷酸序列的整个长度上的序列同一性。
两个氨基酸序列之间的“相似性”是通过比较一种肽或多肽的氨基酸序列及其保守氨基酸取代物与第二种肽或多肽的序列来确定的。在一个优选的实施方式中,计算整个序列(SEQ ID NO:)的同一性或相似性,如在本文中所鉴定的。“同一性”和“相似性”可以通过已知方法容易地计算,所述已知方法包括但不限于在Computational MolecularBiology,Lesk,A.M.编辑,Oxford University Press,New York,1988;Biocomputing:Informatics and Genome Projects,Smith,D.W.编辑,Academic Press,New York,1993;Computer Analysis of Sequence Data,第I部分,Griffin,A.M.和Griffin,H.G.编辑,Humana Press,New Jersey,1994;Sequence Analysis in Molecular Biology,vonHeine,G.,Academic Press,1987;和Sequence Analysis Primer,Gribskov,M.和Devereux,J.编辑,M Stockton Press,New York,1991;以及Carillo,H.和Lipman,D.,SIAMJ.Applied Math.,48:1073(1988)中描述的那些方法。
用于确定同一性的优选方法被设计成给出所测试的序列之间的最大匹配。用于确定同一性和相似性的方法被编入了公开可用的计算机程序中。用于确定两个序列之间的同一性和相似性的优选计算机程序方法包括例如GCG程序包(Devereux,J.等人,NucleicAcids Research 12(1):387(1984))、BestFit、BLASTP、BLASTN和FASTA(Altschul,S.F.等人,J.Mol.Biol.215:403-410(1990)。BLAST X程序可从NCBI和其他来源(BLAST Manual,Altschul,S.等人,NCBI NLM NIH Bethesda,MD20894;Altschul,S.等人,J.Mol.Biol.215:403-410(1990)公开获得。还可以使用众所周知的史密斯-沃特曼算法(Smith Watermanalgorithm)来确定同一性。
多肽序列比较的优选参数包括以下:算法:Needleman和Wunsch,J.Mol.Biol.48:443-453(1970);比较矩阵:BLOSSUM62,来自Hentikoff和Hentikoff,Proc.Natl.Acad.Sci.USA.89:10915-10919(1992);空位罚分:12;以及空位长度罚分:4。使用这些参数的可用程序可作为来自位于Madison,WI的Genetics Computer Group的“Ogap”程序公开获得。上述参数是用于氨基酸比较的默认参数(并且没有针对末端空位的罚分)。
用于核酸比较的优选参数包括以下:算法:Needleman和Wunsch,J.Mol.Biol.48:443-453(1970);比较矩阵:匹配=+10,不匹配=0;空位罚分:50;空位长度罚分:3。可从位于Madison,Wis的Genetics Computer Group获得Gap程序。以上给出了用于核酸比较的默认参数。
任选地,在确定氨基酸相似性程度时,技术人员还可以考虑所谓的“保守性”氨基酸取代,如本领域技术人员所清楚的。保守氨基酸取代是指具有相似侧链的残基的可互换性。例如,一组具有脂肪族侧链的氨基酸是甘氨酸、丙氨酸、缬氨酸、亮氨酸和异亮氨酸;一组具有脂肪族-羟基侧链的氨基酸是丝氨酸和苏氨酸;一组具有含酰胺侧链的氨基酸是天冬酰胺和谷氨酰胺;一组具有芳族侧链的氨基酸是苯丙氨酸、酪氨酸和色氨酸;一组具有碱性侧链的氨基酸是赖氨酸、精氨酸和组氨酸;并且一组具有含硫侧链的氨基酸是半胱氨酸和甲硫氨酸。优选的保守氨基酸取代组是:缬氨酸-亮氨酸-异亮氨酸、苯丙氨酸-酪氨酸、赖氨酸-精氨酸、丙氨酸-缬氨酸,以及天冬酰胺-谷氨酰胺。本文公开的氨基酸序列的取代变体是这样的变体,在该等变体中已去除了所公开序列中的至少一个残基并在该至少一个残基的位置插入不同残基。优选地,氨基酸变化是保守性的。每种天然存在的氨基酸的优选保守取代如下:Ala至ser;Arg至lys;Asn至gln或his;Asp至glu;Cys至ser或ala;Gln至asn;Glu至asp;Gly至pro;His至asn或gln;Ile至leu或val;Leu至ile或val;Lys至arg;gln或glu;Met至leu或ile;Phe至met、leu或tyr;Ser至thr;Thr至ser;Trp至tyr;Tyr至trp或phe;以及Val至ile或leu。
根据本发明的多核苷酸由核苷酸序列表示。根据本发明的多肽由氨基酸序列表示。根据本发明的核酸构建体被定义为从天然存在的基因中分离的多核苷酸,或者经过修饰以含有多个多核苷酸区段(segment)的多核苷酸,所述多核苷酸区段以天然不存在的方式组合或并置。
本文提供的序列信息不应如此狭窄地解释为需要包含错误鉴定的碱基。技术人员能够辨别出此类错误鉴定的碱基并且知道如何校正此类错误。
在本发明所有实施方式的上下文中,感兴趣的化合物可以是任何生物化合物。生物化合物可以是生物质或生物聚合物或代谢物。生物化合物可以由构成生物合成或代谢途径的单个多核苷酸或一系列多核苷酸编码,或者可以是单个多核苷酸的产物或一系列多核苷酸的产物的直接结果,所述多核苷酸可以是基因,所述一系列多核苷酸可以是基因簇。在本发明的所有实施方式中,编码感兴趣的生物化合物或与所述感兴趣的生物化合物相关的生物合成或代谢途径的单个多核苷酸或一系列多核苷酸是根据本发明的组合物和方法的优选靶标。生物化合物可以是对于宿主细胞天然的或对于宿主细胞异源的。
术语“异源生物化合物”在本文中定义为对细胞不是天然的生物化合物;或这样的天然生物化合物,在所述天然生物化合物中已经进行结构修饰以改变所述天然生物化合物。
术语“生物聚合物”在本文中被定义为具有相同、相似或不相似的亚单元(单体)的链(或聚合物)。生物聚合物可以是任何生物聚合物。生物聚合物可以是例如但不限于核酸、多胺、多元醇、多肽(或聚酰胺),或多糖。
生物聚合物可以是多肽。多肽可以是具有感兴趣的生物活性的任何多肽。术语“多肽”在本文中并不是指特定长度的编码产物,因此涵盖肽、寡肽和蛋白质。术语多肽是指任何长度的氨基酸聚合物。聚合物可以是直链或支链的,其可以包含经修饰的氨基酸,并且其可以被非氨基酸中断。该术语还包括已经修饰的氨基酸聚合物;所述修饰为例如,二硫键形成、糖基化、脂化、乙酰化、磷酸化,或任何其他操纵,诸如与标记组分缀合。如本文所用,术语“氨基酸”包括天然和/或非天然或合成的氨基酸,包括甘氨酸和D或L旋光异构体,以及氨基酸类似物和肽模拟物。多肽还包括上述多肽和杂合多肽的天然存在的等位基因变体和工程化变体。多肽可以是对于宿主细胞天然的或可以是对于宿主细胞异源的。多肽可以是胶原蛋白或明胶,或它们的变体或杂合体。多肽可以是抗体或其部分、抗原、凝血因子、酶、激素或激素变体、受体或其部分、调节蛋白、结构蛋白、报道分子、或转运蛋白、参与分泌过程的蛋白质、参与折叠过程的蛋白质、分子伴侣、肽氨基酸转运蛋白、糖基化因子、转录因子、合成肽或寡肽、细胞内蛋白质。细胞内蛋白质可以是酶,诸如蛋白酶、神经酰胺酶、环氧化物水解酶、氨肽酶、酰基转移酶、醛缩酶、羟化酶、氨肽酶、脂肪酶。多肽也可以是细胞外分泌的酶。此类酶可以属于以下项的组:氧化还原酶、转移酶、水解酶、裂解酶、异构酶、连接酶、过氧化氢酶、纤维素酶、几丁质酶、角质酶、脱氧核糖核酸酶、葡聚糖酶、酯酶。所述酶可以是糖酶,例如纤维素酶(诸如内切葡聚糖酶、β-葡聚糖酶、纤维二糖水解酶或β-葡糖苷酶)、半纤维素酶或果胶酶(诸如木聚糖酶、木糖苷酶、甘露聚糖酶、半乳聚糖酶、半乳糖苷酶、果胶甲基酯酶、果胶裂解酶、果胶酸裂解酶、内多聚半乳糖醛酸酶、外多聚半乳糖醛酸酶、鼠李半乳糖醛酸酶、阿拉伯聚糖酶、阿拉伯糖呋喃糖苷酶、阿拉伯糖基木聚糖水解酶、半乳糖醛酸酶、裂解酶或淀粉分解酶);水解酶、异构酶或连接酶、磷酸酶(诸如植酸酶)、酯酶(诸如脂肪酶)、蛋白水解酶、氧化还原酶(诸如氧化酶)、转移酶,或异构酶。酶可以是植酸酶。所述酶可以是氨肽酶、天冬酰胺酶、淀粉酶、麦芽糖淀粉酶、糖酶、羧肽酶、内切蛋白酶、金属蛋白酶、丝氨酸蛋白酶过氧化氢酶、几丁质酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、卤过氧化物酶、蛋白质脱氨酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变构酶、氧化酶、果胶酶、过氧化物酶、磷脂酶、半乳糖脂酶、叶绿素酶、多酚氧化酶、核糖核酸酶、转谷氨酰胺酶、或葡糖氧化酶、己糖氧化酶、单加氧酶。
根据本发明,感兴趣的化合物可以是具有改进的分泌特征的多肽或酶,如WO2010/102982中所述。根据本发明,感兴趣的化合物可以是融合或杂合多肽,另一种多肽在所述多肽或其片段的N末端或C末端处融合。通过将编码一种多肽的核酸序列(或其部分)与编码另一种多肽的核酸序列(或其部分)融合来产生融合多肽。
用于产生融合多肽的技术是本领域已知的,并且包括连接编码多肽的编码序列,以使得它们符合读框(in frame)并且融合多肽的表达在相同的启动子和终止子的控制下。杂合多肽可包含从至少两种不同多肽获得的部分或完整多肽序列的组合,其中一种或多种所述多肽可与宿主细胞是异源的。融合多肽和信号序列融合体的示例例如如WO2010/121933中所述。
生物聚合物可以是多糖。多糖可以是任何多糖,包括但不限于粘多糖(例如,肝素和透明质酸)和含氮多糖(例如,几丁质)。在优选的选项中,多糖是透明质酸。
根据本发明的编码感兴趣的化合物或编码参与感兴趣的化合物产生的化合物的多核苷酸可以编码参与初级或次级代谢产物(诸如有机酸、类胡萝卜素、(β-内酰胺)抗生素和维生素)的合成的酶。此类代谢物可以被认为是根据本发明的生物化合物。
术语“代谢物”包括初级和次级代谢物两者;代谢物可以是任何代谢物。优选的代谢物是柠檬酸、葡糖酸、己二酸、富马酸、衣康酸和琥珀酸。
代谢物可以由一种或多种基因编码,诸如在生物合成或代谢途径中。初级代谢产物是细胞的初级代谢或全身代谢的产物,所述产物涉及能量代谢、生长和结构。次级代谢产物是次级代谢的产物(参见例如,R.B.Herbert,The Biosynthesis of SecondaryMetabolites,Chapman and Hall,New York,1981)。
初级代谢产物可以是但不限于氨基酸、脂肪酸、核苷、核苷酸、糖、甘油三酯,或维生素。
次级代谢产物可以是但不限于生物碱、香豆素、类黄酮、聚酮化合物、奎宁、类固醇、肽,或萜烯。次级代谢产物可以是抗生素、拒食素、引诱剂、杀细菌剂、杀真菌剂、激素、杀虫剂,或杀鼠剂。优选的抗生素是头孢菌素类和β-内酰胺。其他优选的代谢物是外代谢产物。外代谢产物的示例是Aurasperone B、Funalenone、Kotanin、Nigragillin、Orlandin、其他萘酚-γ-吡喃酮、吡喃黑杆菌素A(Pyranonigrin A)、Tensidol B、伏马菌素B2和赭曲霉素A。
生物化合物也可以是选择性标记的产物。选择性标记是感兴趣的多核苷酸的产物,该产物提供杀生物剂或病毒抗性、重金属抗性、营养缺陷体的原营养等。选择性标记包括但不限于amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰转移酶)、bar(草胺膦乙酰转移酶)、hygB(潮霉素磷酸转移酶)、niaD(硝酸盐还原酶)、pyrG(乳清酸核苷-5'-磷酸脱羧酶),sC(硫酸腺苷酰转移酶)、trpC(邻氨基苯甲酸合成酶)、ble(腐草霉素抗性蛋白)、hyg(潮霉素)、NAT或NTC(诺尔丝菌素),以及它们的等同物。
根据本发明,感兴趣的化合物优选是感兴趣的化合物列表中描述的多肽。
根据本发明的另一个实施方式,感兴趣的化合物优选是代谢物。
根据本发明的细胞可能已经能够产生感兴趣的化合物。根据本发明的细胞还可以具有编码多肽的同源或异源核酸构建体,其中所述多肽可以是感兴趣的化合物或参与感兴趣的化合物生产的多肽。本领域技术人员知道如何修饰微生物宿主细胞,以使所述微生物宿主细胞能够产生感兴趣的化合物。
本发明的所有实施方式是指细胞,而不是指无细胞的体外系统;换句话说,根据本发明的系统优选是细胞系统,而不是无细胞的体外系统。
在本发明的所有实施方式中,例如,根据本发明的细胞可以是单倍体细胞、二倍体细胞或多倍体细胞。
根据本发明的细胞在本文中可互换地称为“细胞”、“根据本发明的细胞”、“宿主细胞”和“根据本发明的宿主细胞”;所述细胞可以是任何细胞,原核或真核细胞。优选地,所述细胞不是哺乳动物细胞。优选地,所述细胞是真菌,即酵母细胞或丝状真菌细胞。优选地,细胞缺乏NHEJ(非同源末端连接)。由于细胞缺乏与NHEJ相关的部件,因此所述细胞可能缺乏NHEJ。所述与NHEJ相关的部件可为酵母Ku70、Ku80、MRE11、RAD50、RAD51、RAD52、XRS2、SIR4和/或LIG4的同源物或直系同源物。或者,在根据本发明的细胞中,可以通过使用抑制DNA连接酶IV的化合物(例如SCR7)来使NHEJ缺乏(Vartak SV和Raghavan,2015)。本领域技术人员知道如何调节NHEJ及其对RNA引导的核酸酶系统的影响,参见例如WO2014130955A1;Chu等人,2015;等人,2015;Song等人,2015和Yu等人,2015;所有这些文献都以引用方式并入本文。术语“缺陷”在本文其他地方定义。
当根据本发明的细胞是酵母细胞时,优选的酵母细胞来自选自由以下项组成的组的属:假丝酵母属(Candida)、汉逊酵母属(Hansenula)、伊萨酵母属(Issatchenkia)、克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)、耶氏酵母属(Yarrowia)或接合酵母属(Zygosaccharomyces);更优选地,酵母宿主细胞选自由以下项组成的组:乳酸克鲁维酵母(Kluyveromyces lactis)、乳酸克鲁维酵母NRRL Y-1140、马克斯克鲁维酵母(Kluyveromyces marxianus)、耐热克鲁维酵母(Kluyveromyces.thermotolerans)、克鲁斯假丝酵母(Candida krusei)、萨纳瑞西斯假丝酵母(Candida sonorensis)、光滑假丝酵母(Candida glabrata)、酿酒酵母(Saccharomyces cerevisiae)、酿酒酵母CEN.PK113-7D)、粟酒裂殖酵母(Schizosaccharomyces pombe)、多形汉逊酵母(Hansenula polymorpha)、东方伊萨酵母(Issatchenkia orientalis)、解脂耶氏酵母(Yarrowia lipolytica)、解脂耶氏酵母CLIB122、解脂耶氏酵母ATCC18943、树干毕赤酵母(Pichia stipidis)和巴斯德毕赤酵母(Pichia pastoris)。
根据本发明的宿主细胞是丝状真菌宿主细胞。如本文所定义的丝状真菌包括亚门真菌门(Eumycota)和卵菌门(Oomycota)的所有丝状形式(如由Hawksworth等人在Ainsworth and Bisby's Dictionary of The Fungi,第8版,1995,CAB International,University Press,Cambridge,UK中所定义)。
丝状真菌宿主细胞可以是分类单位发菌科(Trichocomaceae)的任何丝状形式的细胞(如由Houbraken和Samson在Studies in Mycology 70:1-51.2011中所定义的)。在另一个优选实施方式中,丝状真菌宿主细胞可以是三个科曲霉科(Aspergillaceae)、嗜热子囊菌科(Thermoascaceae)和发菌科中的任一科的任何丝状形式的细胞,所述三个科容纳在分类单位发菌科中。
丝状真菌的特征在于由几丁质、纤维素、葡聚糖、壳聚糖、甘露聚糖和其他复合多糖组成的菌丝体壁。营养生长是通过菌丝伸长进行的,并且碳分解代谢是专性需氧的。丝状真菌菌株包括但不限于以下属的菌株:支顶孢属(cremonium)、伞菌属(Agaricus)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、金孢子菌属(Chrysosporium)、鬼伞属(Coprinus)、隐球菌属(Cryptococcus)、丝梗霉属(Filibasidium)、镰刀菌属(Fusarium)、腐质霉属(Humicola)、巨座壳属(Magnaporthe)、被孢霉属(Mortierella)、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、新美鞭菌属(Neocallimastix)、脉孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉菌属(Penicillium)、瘤胃壶菌属(Piromyces)、原毛平革菌属(Panerochaete)、侧耳属(Pleurotus)、裂褶菌属(Schizophyllum)、篮状菌属(Talaromyces)、踝节菌属(Rasamsonia)、热子囊菌属(Thermoascus)、梭孢壳属(Thielavia)、弯颈霉属(Tolypocladium)、以及木霉属(Trichoderma)。根据本发明的优选丝状真菌宿主细胞来自选自由以下项组成的组的属:支顶孢属、曲霉属、金孢子菌属、毁丝霉属、青霉菌属、篮状菌属、踝节菌属、梭孢壳属、镰刀菌属和木霉属;更优选地来自选自由以下项组成的组的物种:黑曲霉(Aspergillus niger)、亚拉巴马枝顶孢(Acremoniumalabamense)、泡盛曲霉(Aspergillus awamori)、臭曲霉(Aspergillus foetidus)、酱油曲霉(Aspergillus sojae)、烟曲霉菌(Aspergillus fumigatus)、埃默森篮状菌(Talaromyces emersonii)、踝节菌属埃默森蓝状菌(Rasamsonia emersonii)、踝节菌属埃默森蓝状菌CBS393.64、米曲霉(Aspergillus oryzae)、鲁克文金孢子菌(Chrysosporiumlucknowense)、尖孢镰刀菌(Fusarium oxysporum)、高山被孢霉(Mortierella alpina)、高山被孢霉ATCC 32222、嗜热毁丝霉(Myceliophthora thermophila)、里氏木霉(Trichoderma reesei)、太瑞斯梭孢壳(Thielavia terrestris)、产黄青霉菌(Penicillium chrysogenum)和产黄青霉菌(P.chrysogenum)Wisconsin54-1255(ATCC28089);甚至更优选地,根据本发明的丝状真菌宿主细胞是黑曲霉。当根据本发明的宿主细胞是黑曲霉宿主细胞时,所述宿主细胞优选是CBS 513.88、CBS124.903或它们的衍生物。
在许多菌种保藏单位中几种丝状真菌菌株是公众可容易获得的,所述菌种保藏单位为例如美国典型培养物保藏中心(American Type Culture Collection,ATCC)、德意志微生物保藏中心(Deutsche Sammlung von Mikroorganismen and Zellkulturen GmbH,DSM)、Centraalbureau Voor Schimmelcultures(CBS)、农业研究服务专利菌种保藏所(Agricultural Research Service Patent Culture Collection)、北方地区研究中心(Northern Regional Research Center,NRRL),以及俄罗斯科学院全俄微生物保藏中心(All-Russian Collection of Microorganisms of Russian Academy of Sciences,俄文缩写-VKM,英文缩写-RCM),Moscow,Russia。作为根据本发明的宿主细胞的优选菌株是黑曲霉CBS 513.88、CBS124.903,米曲霉ATCC 20423、IFO 4177、ATCC 1011、CBS205.89、ATCC9576、ATCC14488-14491、ATCC 11601、ATCC12892、产黄青霉菌CBS 455.95、产黄青霉菌Wisconsin54-1255(ATCC28089)、产黄青霉菌ATCC 38065、产黄青霉菌P2、太瑞斯梭孢壳NRRL8126、踝节菌属埃默森蓝状菌CBS393.64、埃默森篮状菌CBS 124.902、产黄头孢霉(Acremonium chrysogenum)ATCC 36225或ATCC 48272、里氏木霉ATCC 26921或ATCC 56765或ATCC 26921、酱油曲霉ATCC11906、嗜热毁丝霉C1、Garg 27K、VKM-F 3500D、鲁克文金孢子菌C1、Garg 27K、VKM-F 3500D、ATCC44006,以及它们的衍生物。
优选地,根据本发明的宿主细胞具有这样的修饰,优选在其基因组中具有这样的修饰,所述修饰导致如果当在相同条件下分析时与未经修饰的亲本宿主细胞相比,产生减少的或者不产生如本文所定义的不期望的化合物。
可以通过本领域技术人员已知的任何手段来引入修饰,之后进行选择,所述手段为诸如但不限于传统菌株改良、随机诱变。也可以通过定点诱变来引入修饰。
可以通过引入(插入)、取代(置换)或去除(缺失)多核苷酸序列中的一个或多个核苷酸来完成修饰。可以实现编码不期望的化合物(诸如多肽)的多核苷酸的完全或部分缺失。不期望的化合物可以是本文其他地方列出的任何不期望的化合物;其也可以是合成不期望的化合物(诸如代谢物)的生物学途径中的蛋白质和/或酶。或者,编码所述不期望的化合物的多核苷酸可以部分或完全地被这样的多核苷酸序列替换,所述多核苷酸序列不编码所述不期望的化合物或编码所述不期望的化合物的部分或完全失活形式。在另一个替代方案中,可以将一个或多个核苷酸插入编码所述不期望的化合物的多核苷酸中,从而导致对所述多核苷酸的破坏以及因此使由被破坏的多核苷酸编码的所述不期望的化合物的部分或完全失活。
在一个实施方式中,根据本发明的宿主细胞在其基因组中包含选自以下的修饰
a)编码不期望的化合物的多核苷酸的完全或部分缺失,
b)将编码不期望的化合物的多核苷酸用这样的多核苷酸序列完全或部分地替换,所述多核苷酸序列不编码所述不期望的化合物或编码所述不期望的化合物的部分或完全失活形式。
c)通过在多核苷酸序列中插入一个或多个核苷酸来破坏编码不期望的化合物的多核苷酸,并因此通过被破坏的多核苷酸使所述不期望的化合物部分或完全失活。
该修饰可以例如在所述不期望的化合物的转录或翻译所需的编码序列或调节元件中。例如,可以插入或去除核苷酸以导致终止密码子的引入、起始密码子的去除,或编码序列的开放阅读框的改变或移码。对编码序列或其调节元件的修饰可以根据本领域已知的方法通过定点或随机诱变、DNA改组方法、DNA重装配方法、基因合成(参见例如Young和Dong,(2004),Nucleic Acids Research 32(7)或Gupta等人,(1968),Proc.Natl.Acad.SciUSA,60:1338-1344;Scarpulla等人,(1982),Anal.Biochem.121:356-365;Stemmer等人,(1995),Gene 164:49-53)或进行PCR产生的诱变来完成。随机诱变程序的示例是本领域熟知的,诸如化学(例如NTG)诱变或物理(例如UV)诱变。定点诱变程序的示例是QuickChangeTM定点诱变试剂盒(Stratagene Cloning Systems,La Jolla,CA)、Altered
Figure BDA0002764477840000591
II体外诱变系统(Promega Corporation),或通过使用如在Gene.1989年4月15日;77(1):51-9.(HoSN、Hunt HD、Horton RM、Pullen JK、Pease LR“Site-directed mutagenesis by overlapextension using the polymerase chain reaction(使用聚合酶链式反应通过重叠延伸进行定点诱变)”)中所述的PCR进行重叠延伸或使用如在Molecular Biology:CurrentInnovations and Future Trends.(A.M.Griffin和H.G.Griffin编辑,ISBN 1-898486-01-8;1995Horizon Scientific Press,PO Box 1,Wymondham,Norfolk,U.K.)中所述的PCR进行重叠延伸。
优选的修饰方法为基于重组遗传操纵技术,诸如部分或完全基因替换或部分或完全基因缺失。
例如,在替换多核苷酸、核酸构建体或表达盒的情况下,可以在待替换的靶基因座处引入合适的DNA序列。合适的DNA序列优选存在于克隆载体上。优选的整合克隆载体包含这样的DNA片段,所述DNA片段与多核苷酸同源和/或与待替换基因座侧翼的多核苷酸具有同源性,以将克隆载体的整合靶向至该预定基因座。为了促进靶向整合,优选在转化细胞之前将克隆载体线性化。优选地,执行线性化,使得克隆载体的至少一个但优选任一端侧接与待替换的DNA序列(或侧翼序列)同源的序列。该过程称为同源重组,并且该技术也可用于实现(部分)基因缺失。
例如,与内源多核苷酸对应的多核苷酸可以被缺陷型多核苷酸替换;所述缺陷型多核苷酸是不能生产(全功能性)多肽的多核苷酸。通过同源重组,缺陷型多核苷酸替换内源多核苷酸。可能有利的是,缺陷型多核苷酸还编码标记,所述标记可用于选择核酸序列已被修饰的转化体。
替代地或与其他提到的技术组合,可以使用基于E.coli细胞中粘粒的重组的技术,如在以下中所述:A rapid method for efficient gene replacement in thefilamentous fungus Aspergillus nidulans(2000)Chaveroche,M-K.,Ghico,J-M.和d’Enfert C;Nucleic acids Research,第28卷,第22期。
或者,可以通过使用与多核苷酸的核酸序列互补的核苷酸序列进行已建立的反义技术来执行修饰,在所述修饰中所述宿主细胞产生较少或不产生蛋白质,诸如如本文所描述且由本文所述的多核苷酸编码的具有淀粉酶活性,优选α-淀粉酶活性的多肽。更具体地,可以通过引入与多核苷酸的核酸序列互补的核苷酸序列来减少或消除宿主细胞对所述多核苷酸的表达,所述与所述多核苷酸的核酸序列互补的核苷酸序列可以在细胞中转录并且能够与所述细胞中产生的mRNA杂交。因此在允许互补反义核苷酸序列与mRNA杂交的条件下,翻译的蛋白质的量减少或被消除。表达反义RNA的示例显示于Appl.Environ.Microbiol.2000年2月;66(2):775-82中。(Characterization of afoldase,protein disulfide isomerase A,在the protein secretory pathway ofAspergillus niger.Ngiam C,Jeenes DJ,Punt PJ,Van Den Hondel CA,Archer DB中)或(Zrenner R、Willmitzer L、Sonnewald U.Analysis of the expression of potatouridinediphosphate-glucose pyrophosphorylase and its inhibition by antisenseRNA.Planta.(1993);190(2):247-52.)。
导致不期望的化合物的产生减少或不产生的修饰优选是由于如果与未经修饰的亲本微生物宿主细胞相比并且在相同条件下测量时,编码所述不期望的化合物的mRNA的产生减少。
可以经由RNA干扰(RNAi)技术(Mouyna等人,2004)来获得导致从编码不期望的化合物的多核苷酸转录的mRNA量减少的修饰。在该方法中,将表达要受影响的核苷酸序列的相同有义(identical sense)和反义部分彼此克隆为在其间具有核苷酸间隔区,并插入到表达载体中。在转录此类分子后,小核苷酸片段的形成将导致要影响的mRNA的靶向降解。特定mRNA的消除可以是不同程度的。RNA干扰技术描述于例如WO2008/053019、WO2005/05672A1和WO2005/026356A1中。
可以通过不同方法来获得导致不期望的化合物的产生减少或不产生的修饰,例如通过针对此类不期望的化合物的抗体或化学抑制剂或蛋白质抑制剂或物理抑制剂(TourO.等人,(2003)Nat.Biotech:Genetically targeted chromophore-assisted lightinactivation.,第21卷,编号12:1505-1508)或肽抑制剂或反义分子或RNAi分子(R.S.Kamath等人,(2003)Nature:Systematic functional analysis of theCaenorhabditis elegans genome using RNAi.,第421卷,231-237)。
除了上述技术之外或作为替代方案,还可以抑制不期望的化合物的活性,或借助于替代信号序列(Ramon de Lucas、J.,Martinez O,Perez P.,Isabel Lopez,M.,Valenciano,S.和Laborda,F.The Aspergillus nidulans carnitine carrier encodedby the acuH gene is exclusively located in the mitochondria.FEMS MicrobiolLett.2001年7月24日;201(2):193-8.)或保留信号(Derkx,P.M.和Madrid,S.M.Thefoldase CYPB is a component of the secretory pathway of Aspergillus niger andcontains the endoplasmic reticulum retention signalHEEL.Mol.Genet.Genomics.2001年12月;266(4):537-545)或通过将诸如多肽等不期望的化合物靶向到能够与参与细胞分泌途径的细胞膜结构融合而导致细胞外分泌所述多肽的过氧化物酶体(例如,如在WO2006/040340中所述)来重新定位诸如蛋白质等不期望的化合物。
替代地或与上述技术组合,还可以获得不期望的化合物的产生减少或不产生,例如通过UV或化学诱变(Mattern,I.E.、van Noort J.M.、van den Berg,P.、Archer,D.B.、Roberts,I.N.和van den Hondel,C.A.,Isolation and characterization of mutantsof Aspergillus niger deficient in extracellular proteases.Mol Gen Genet.1992年8月;234(2):332-6.)或通过使用抑制如本文所述的不期望的多肽的酶促活性的抑制剂(例如,野尻霉素,其用作β-葡糖苷酶的抑制剂(Carrel F.L.Y.和Canevascini G.CanadianJournal of Microbiology(1991)37(6):459-464;Reese E.T.、Parrish F.W.和EttlingerM.Carbohydrate Research(1971)381-388))。
在本发明的一个实施方式中,根据本发明的宿主细胞的基因组中的修饰是对编码不期望的化合物的多核苷酸的至少一个位置的修饰。
在化合物(例如不期望的化合物,诸如不期望的多肽和/或酶)产生方面有缺陷的细胞在本文中定义为这样的突变微生物宿主细胞,所述突变微生物宿主细胞已经修饰,优选在其基因组中经修饰,以产生表型特征,其中所述细胞与未修饰的亲本宿主细胞相比,当在相同条件下分析时:a)产生更少的不期望的化合物或基本上不产生任何不期望的化合物,和/或b)产生具有降低的活性或降低的比活性的不期望的化合物或不具有活性或不具有比活性的不期望的化合物,以及这些可能性中的一种或多种的组合。
优选地,根据本发明的经修饰的宿主细胞如果与未经修饰且在相同条件下测量的亲本宿主细胞相比,则产生少1%的不期望的化合物、至少少5%的不期望的化合物、至少少10%的不期望的化合物、至少少20%的不期望的化合物、至少少30%的不期望的化合物、至少少40%的不期望的化合物、至少少50%的不期望的化合物、至少少60%的不期望的化合物、至少少70%的不期望的化合物、至少少80%的不期望的化合物、至少少90%的不期望的化合物、至少少91%的不期望的化合物、至少少92%的不期望的化合物、至少少93%的不期望的化合物、至少少94%的不期望的化合物、至少少95%的不期望的化合物、至少少96%的不期望的化合物、至少少97%的不期望的化合物、至少少98%的不期望的化合物、至少少99%的不期望的化合物、至少少99.9%的不期望的化合物,或最优选少100%的不期望的化合物。
本文中提及的专利文献或作为现有技术给出的其他事项不应被视为承认该文献或事项是已知的,或者该文献或事项所包含的信息是在任何请求项的优先权日期时的公知常识的一部分。
本文所述的每篇参考文献的公开内容均以引用方式整体并入本文。
通过以下实施例进一步说明本发明:
实施例
在以下实施例中,说明了本发明的各种实施方式。根据以上描述和这些实施例中,本领域技术人员可以对本发明进行各种改变和修改以使其适应各种用途和条件。
实施例1:通过CRISPR瞬时编辑构建体(CTEC)在酿酒酵母中进行Cas9基因组编辑
该实施例描述了通过使用CRISPR/Cas9系统和引导RNA的瞬时表达进行编码所需突变的供体DNA片段的整合而进行的酿酒酵母的基因组编辑。所使用的一个或多个CTECDNA片段包含具有如先前由DiCarlo等人,2013所描述的控制元件的引导RNA表达盒以用于在酿酒酵母中表达引导RNA;以及用于编辑靶向基因组序列的供体DNA序列。本实施例中使用的Cas9引导RNA表达盒包含SNR52启动子、由引导序列(也称为基因组靶序列)和引导RNA结构部件组成的引导RNA序列,之后是SUP4终止子。当靶向基因组中的INT1基因座时,供体DNA为100bp,并且编码将PAM序列从AGG改变至ATG的DNA碱基取代。当靶向YFP基因时,供体DNA为111bp并且编码移码;基因组靶序列中一个DNA碱基的缺失,从而导致了荧光丢失。该设置在图15中直观表示。
构建表达Cas9的酿酒酵母菌株
酵母载体pCSN061是单拷贝载体(CEN/ARS),所述单拷贝载体(CEN/ARS)含有Cas9表达盒,所述Cas9表达盒由从Kl11启动子(KLLA0F20031g的乳酸克鲁维酵母启动子)表达的经密码子优化的Cas9变体(WO2016/110512)、酿酒酵母GND2终止子以及赋予对G418的抗性的功能性KanMX标记盒组成。Cas9表达盒被KpnI/NotI连接到pRS414中(Sikorski和Hieter,1989),从而得到中间载体pCSN004。随后,赋予G418抗性的功能性表达盒(参见:www.euroscarf.de)是从载体pUG7-KanMX限制性切下NotI并将NotI连接到pCSN004中,从而产生图1中描绘的载体pCSN061;序列在SEQ ID NO:2中示出。
首先使用LiAc/鲑鱼精(SS)载体DNA/PEG方法(Gietz和Woods,2002)将含有Cas9表达盒的载体pCSN061转化至S.cerevisiae菌株CEN.PK113-7D(MATa URA3 HIS3 LEU2 TRP1MAL2-8 SUC2)中。菌株CEN.PK113-7D可从EUROSCARF保藏中心(http://www.euroscarf.de,Frankfurt,Germany)获得。van Dijken等人,2000描述了CEN.PK菌株家族的起源。在转化混合物中,使用1微克的载体pCNS061。将转化混合物在每ml含有200微克(μg)G418(SigmaAldrich,Zwijndrecht,the Netherlands)的YPD-琼脂(10克/升酵母提取物、20克/升蛋白胨、20克/升右旋糖、20克/升琼脂)上铺板。在30℃下生长两天至四天后,转化体在转化平板上出现。将平板上赋予对G418抗性的转化体,也称为菌株CSN001,接种在每ml含有200μgG418(Sigma Aldrich,Zwijndrecht,the Netherlands)的YPD-G418培养基(10克/升酵母提取物、20克/升蛋白胨、20克/升右旋糖)上,用于后续转化实验中。
双链DNA(ds-DNA)YFP供体DNA盒
经由单独启动子(P)、orf(O)和终止子(T)序列在合适的大肠杆菌(E.coli)载体中的金门(Golden-Gate)装配反应制备编码黄色荧光蛋白(YFP)变体Venus(Nagai等人,2002)的双链供体DNA盒。使用SEQ ID NO:4和SEQ ID NO:5中所示的引物(primer)经由PCR反应扩增经装配的POT盒。在第二PCR中,使用SEQ ID NO:6和SEQ ID NO:7所示的引物组添加50bp的连接物序列。这产生了YFP表达盒,所述YFP表达盒包含在所述表达盒的5'端和3'端处的50bp连接物序列(SEQ ID NO:8)。连接物序列之间的YFP表达盒在随后的使用引物组(SEQID NO:9和SEQ ID NO:10)的PCR反应中用作模板。在该PCR反应中,添加50bp的基因组侧翼以用于整合到酿酒酵母菌株CSN001的基因组基因座INT1中。在SEQ ID NO:11中呈现了所得的侧接有50bp基因组序列的YFP盒的序列。
将Q5 DNA聚合酶(
Figure BDA0002764477840000641
高保真2X预混液(High-Fidelity 2X Master Mix),NewEngland Biolabs,由Bioké,Leiden,the Netherlands.供应,产品目录号M0492S的一部分)用于上述PCR反应中。根据制造商的说明执行PCR反应。
PCR纯化
根据制造商的说明,使用NucleoSpin Gel和PCR Clean-up试剂盒(Machery-Nagel,由Bioké,Leiden,the Netherlands分销)来执行PCR反应的纯化。
引导RNA(sgRNA)表达盒INT1
引导RNA表达盒是作为合成DNA(gBlocks)在Integrated DNA Technologies(IDT,Leuven,Belgium)订购的。引导RNA表达盒由SNC52p RNA聚合酶III启动子、引导序列(也称为基因组靶序列;SEQ ID NO:12)、gRNA结构部件和SUP4 3'侧翼区组成,如DiCarlo等人中所述。为了体内同源重组到线性化pRN1120(XhoI、EcoRI)载体骨架中,将与pRN1120同源的50bp添加到引导RNA表达盒的任一侧上,从而产生了总共488bp的片段(SEQ ID NO:13)。
pRN1120载体构建(多拷贝表达载体,NatMX标记)
酵母载体pRN1120是多拷贝载体(2微米),其含有赋予对诺尔丝菌素的抗性的功能性NatMX标记盒。该载体的骨架基于pRS305(Sikorski和Hieter,1989),并且包括功能性2微米ORI序列和功能性NatMX标记盒(参见www.euroscarf.de)。载体pRN1120如图2所示,并且序列在SEQ ID NO:3中示出。
用基因组中的INT1基因座处整合的YFP表达盒构建表达Cas9的酿酒酵母菌株
使用LiAc/鲑鱼精(SS)载体DNA/PEG方法(Gietz和Woods,2002)转化酿酒酵母菌株CSN001。在转化之前,将菌株CSN001在每ml补充有200微克(μg)G418(Sigma Aldrich,Zwijndrecht,the Netherlands)的YPD液体培养基(10克/升酵母提取物、20克/升蛋白胨、20克/升右旋糖)中培养。用经XhoI/EcoRI限制消化的pRN1120和靶向INT1的sgRNA表达盒(SEQ ID NO:13)转化菌株CSN001。线性化pRN1120是sgRNA表达盒的受体,所述sgRNA表达盒在两端处均含有与pRN1120的同源性,以允许体内重组成环状质粒。预先在细胞中表达的Cas9被导向基因组靶标INT1,以产生双链断裂。在转化混合物中,还包含用于在INT1基因座处整合的YFP供体DNA盒(100ng)。
将转化混合物在每ml含有200微克(μg)G418(Sigma Aldrich,Zwijndrecht,theNetherlands)和200微克(μg)诺尔丝菌素(NTC,Jena Bioscience,Germany)的YPD-琼脂(10克/升酵母提取物、20克/升蛋白胨、20克/升右旋糖、20克/升琼脂)上铺板。在30℃下生长两天至四天后,转化体在转化平板上出现。选择在平板上赋予对G418和诺尔丝菌素的抗性并表达YFP的转化体。使用Qpix450(Molecular Devices;Filter:Ex/Em:457/536nm-FITC/GFP)评定YFP表达。该菌株将用于另外的Cas9实验中,因此其可以从其引导RNA质粒(诺尔丝菌素标记)中回收(cured),同时保持其Cas9表达质粒(KanMX标记)。使菌株在每ml补充有200微克(μg)G418(Sigma Aldrich,Zwijndrecht,the Netherlands)的YPD液体培养基(10克/升酵母提取物、20克/升蛋白胨、20克/升右旋糖)中在30℃、250rpm的振荡速度下生长24小时。在milliQ中制备培养物的稀释液,然后将其铺板到含有200微克(μg)G418(SigmaAldrich,Zwijndrecht,the Netherlands)的YPD-琼脂培养基(10克/升酵母提取物、20克/升蛋白胨、20克/升右旋糖、20克/升琼脂)上。在30℃下生长两天至四天后,琼脂平板上出现菌落。随后通过将单个菌落在每ml含有200微克(μg)诺尔丝菌素(NTC,Jena Bioscience,Germany)的YPD-琼脂(10克/升酵母提取物、20克/升蛋白胨、20克/升右旋糖、20克/升琼脂)上划线,来检查所述单个菌落对诺尔丝菌素的敏感性。选择对诺尔丝菌素敏感的菌株,并将其命名为CSN009。将该菌株用于进一步的转化实验中。
CRISPR瞬时编辑构建体(CTEC)DNA片段
含有引导RNA表达盒以及供体DNA的CTEC DNA片段是作为合成DNA(gBlocks)在Integrated DNA Technologies(IDT,Leuven,Belgium)订购的。每个靶向基因组区域INT1或YFP ORF进行六种设计,图3中提供了所述设计的概述。序列如SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18和SEQ ID NO:19(靶向INT1)所示和如SEQID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24和SEQ ID NO:25(靶向YFP)所示的CTEC DNA的设计,由SNR52p RNA聚合酶III启动子、引导序列(也称为基因组靶序列;SEQ ID NO:26(INT1)和SEQ ID NO:27(YFP))、gRNA结构部件和如在DiCarlo等人,2013中所述的SUP4 3'侧翼区域,以及编码DNA碱基取代(INT1)或导致移码的DNA碱基缺失(YFP)的供体DNA组成。还评估了50bp连接物、连接物A、序列(SEQ ID NO:28)以及用于分离供体DNA和引导RNA表达盒(sgRNA)的引导靶标和PAM序列的存在的影响。连接物A是与基因组没有任何同源性的50bp随机DNA序列。当在CTEC片段中包含引导靶标和PAM序列时,用于产生ds断裂的引导序列由同一CTEC片段的sgRNA盒编码。
表1中提供了对序列的概述。
表1.对用于转化的CTEC DNA的序列的概述。将CTEC片段用作使用此表中所示的引物的PCR反应的模板。建立PCR反应以获得更高量的CTEC DNA片段,随后将所述CTEC DNA片段用于转化实验中。
Figure BDA0002764477840000671
Figure BDA0002764477840000681
将CTEC片段(gBlock)用作使用此表中所示的引物的PCR反应的模板。建立PCR反应以获得更高量的CTEC DNA片段,随后将所述CTEC DNA片段用于转化实验中。根据制造商的说明,在PCR反应中使用PrimeSTAR GXL DNA聚合酶(Takara/产品目录号R050A)。根据制造商的说明,使用NucleoSpin Gel和PCR Clean-up试剂盒(Machery-Nagel,由Bioké,Leiden,the Netherlands分销)来纯化PCR产生的CTEC DNA。随后,使用NanoDrop(ND-1000分光光度计,Thermo Scientific,Bleiswijk,the Netherlands)来测量DNA浓度。
DNA浓度
使用NanoDrop装置(ThermoFisher,Life Technologies,Bleiswijk,theNetherlands)测定包括CTEC DNA片段(PCR产物)和pRN1120在内的所有DNA浓度,从而提供以纳克/微升计的浓度。基于这些测量,在转化实验中使用1μg CTEC DNA和100ng环形质粒pRN1120的量。
靶位点
INT1整合位点是定位在位于染色体XV上的NTR1(YOR071c)与GYP1(YOR070c)之间的非编码区。
菌株酿酒酵母CSN009的YFP表达盒定位于INT1整合基因座上,这意味着其在位于染色体XV上的NTR1(YOR071c)与GYP1(YOR070c)之间的非编码区中。
酵母转化
将预先表达Cas9的菌株CSN001和预先表达Cas9和YFP的菌株CSN009接种于每ml含有200μg G418(Sigma Aldrich,Zwijndrecht,the Netherlands)的YPD-G418培养基(10克/升酵母提取物、20克/升蛋白胨、20克/升右旋糖)中。随后,使用LiAc/SS载体DNA/PEG方法(Gietz和Woods,2002),用表2所示的1μg CTEC DNA和100ng的载体pRN1120转化菌株CSN001和CSN009。
将转化混合物在每ml含有200μg诺尔丝菌素(NTC,Jena Bioscience,Germany)和200μg G418(Sigma Aldrich,Zwijndrecht,the Netherlands)的YPD-琼脂(10克/升酵母提取物、20克/升蛋白胨、20克/升右旋糖、20克/升琼脂)上铺板。将平板在30摄氏度温育直至菌落出现在平板上。
表2.对用于不同的转化实验的CTEC DNA的概述。
Figure BDA0002764477840000691
Figure BDA0002764477840000701
结果
在瞬时表达在CTEC DNA片段上编码的引导RNA之后,检查由以上在表2中概述的转化实验产生的菌落中供体DNA的掺入情况。靶向YFP盒的供体DNA的掺入导致YFP ORF中的移码,从而导致荧光丢失。通过QPix450(Molecular Devices,Filter:Ex/Em:457/536nm-FITC/GFP)可视化转化后菌落的YFP荧光。下表3中汇总了由CTEC DNA片段基于表型进行YFP编辑的成功率。
表3.对通过不同的CTEC片段设计基于表型(荧光丢失)进行YFP编辑频率的概述。计数的转化体来自稀释10倍然后铺板在每ml含有200μg诺尔丝菌素(NTC,JenaBioscience,Germany)和200μg G418(Sigma Aldrich,Zwijndrecht,the Netherlands)的YPD-琼脂(10克/升酵母提取物、20克/升蛋白胨、20克/升右旋糖、20克/升琼脂)上的转化混合物。
Figure BDA0002764477840000711
在每次转化中,通过桑格测序(Sanger sequencing)分析12个非荧光菌落中在没有掺入来自CTEC DNA片段的另外碱基的情况下供体DNA的正确整合。将转化体的基因组DNA如由
Figure BDA0002764477840000712
等人,2011所述地分离,并用作PCR反应中的模板。用于确认供体DNA的整合的引物组(SEQ ID NO:39和SEQ ID NO:40)被设计为在供体DNA外部,上游138bp和下游465bp处杂交。根据制造商的说明和本领域技术人员已知的标准PCR程序,使用
Figure BDA0002764477840000713
高保真聚合酶(High Fidelity Polymerase,产品目录号M0530L,New England Biolabs-USA)执行PCR反应。使用NucleoSpin Gel和PCR Clean-up试剂盒(Machery-Nagel,由Bioké,Leiden,the Netherlands分销)纯化所得的PCR产物,随后将所述PCR片段用作测序反应中的模板。根据供应商的说明,使用
Figure BDA0002764477840000714
终止子v3.1循环测序试剂盒(产品目录号4337456,ThermoFisher Scientific,Bleiswijk,the Netherlands)建立测序反应。将测序反应根据供应商的说明通过NucleoSEQ柱(产品目录号740523.250,Machery-Nagel,由Bioké,Leiden,the Netherlands分销)纯化,随后通过3500XL遗传分析仪(3500XL GeneticAnalyzer,ThermoFisher Scientific-Bleiswijk,the Netherlands)进行分析。在CloneManager软件v9.4(Sci-Ed software-USA)中分析测序读段。表4中呈现了测序结果的概述。测序结果表明,除供体DNA的碱基外没有其他碱基被掺入(完美无瑕),并且荧光的丢失确实是由供体DNA所编码的移码引起的。
表4.对测序结果的概述,确认了荧光丢失是由于在CFP DNA片段的供体DNA部分中编码的YFP基因中预期的移码而导致的。
Figure BDA0002764477840000721
为了确认作为CTEC DNA片段的靶向INT1的部分的供体DNA的正确整合,通过桑格测序检查每次转化的8个菌落。用于确认整合的引物(SEQ ID NO:41和SEQ ID NO:42)被设计为在CTEC DNA片段中存在的供体DNA外部(上游372bp和下游400bp)的基因组中杂交。根据制造商的说明和本领域技术人员已知的标准PCR程序,使用
Figure BDA0002764477840000722
高保真聚合酶(产品目录号M0530L,New England Biolabs-USA)执行PCR反应。使用NucleoSpin Gel和PCRClean-up试剂盒(Machery-Nagel,由Bioké,Leiden,the Netherlands分销)纯化所得的PCR产物,随后将所述PCR片段用作测序反应中的模板。根据供应商的说明,使用
Figure BDA0002764477840000723
终止子v3.1循环测序试剂盒(产品目录号4337456,ThermoFisher Scientific,Bleiswijk,theNetherlands)建立测序反应。将测序反应根据供应商的说明通过NucleoSEQ柱(产品目录号740523.250,Machery-Nagel,由Bioké,Leiden,the Netherlands分销)纯化,随后通过3500XL遗传分析仪(ThermoFisher Scientific-Bleiswijk,the Netherlands)进行分析。在Clone Manager软件v9.4(Sci-Ed software-USA)中分析测序读段。表5中呈现了测序结果的概述。
表5.对测序结果的概述,确认了INT1基因座中PAM序列的变化(从AGG至ATG)如再CTEC DNA片段的供体DNA部分中所编码的那样。
Figure BDA0002764477840000731
确认了由作为CTEC片段的一部分的供体DNA编码的PAM变化,成功率为13-88%。通过测序还确认,除了由供体DNA编码的碱基变化外没有另外的碱基变化,与所使用的CTECDNA片段的类型无关。基于测序结果,与YFP相比INT1的编辑效率较低,这是由于没有如在YFP靶标的情况中那样预先选择表型(荧光丢失)的结果。
实施例2.通过CRISPR瞬时编辑构建体(CTEC)在酿酒酵母中进行LbCpf1基因组编辑
该实施例描述了通过使用CRISPR/LbCpf1(来自毛螺菌科细菌ND2006的Cpf1直系同源物)系统和引导RNA的瞬时表达进行编码所需突变的供体DNA片段的整合而进行的酿酒酵母的基因组编辑。所使用的一个或多个CTEC DNA片段包含具有如先前由Zetsche等人,2015所描述的控制元件(LbCpf1)的引导RNA表达盒以用于在酿酒酵母中表达引导RNA;以及用于编辑靶向基因组序列的供体DNA序列。LbCpf1引导RNA表达盒包含SNR52启动子、由直接重复序列组成的引导RNA序列和基因组靶序列之后是SUP4终止子。也是CTEC片段的一部分的供体DNA当靶向YFP基因时为109bp长,并且编码2bp缺失,由此修饰了原始PAM序列(TTTG=>TG)。在掺入供体DNA时,移码被引入YFP基因中,从而导致菌株的荧光丢失。用于INT1基因座的供体DNA的大小为100bp,并且编码将TTTG序列转换至CCGG的3bp PAM变化。实验设置如图15所示。
LbCpf1表达载体的构建
用于表达LbCpf1的单拷贝酵母载体构建如下:酵母载体pCSN061是单拷贝载体(CEN/ARS),所述单拷贝载体(CEN/ARS)含有CAS9表达盒,所述CAS9表达盒由从Kl11启动子(KLLA0F20031g的乳酸克鲁维酵母启动子)表达的经密码子优化的CAS9变体和酿酒酵母GND2终止子以及赋予对G418的抗性的功能性KanMX标记盒组成。CAS9表达盒被KpnI/NotI连接到pRS414中(Sikorski和Hieter,1989),从而得到中间载体pCSN004。随后,赋予G418抗性的功能性表达盒(http://www.euroscarf.de)是从载体pUG7-KanMX限制性切下NotI并将NotI连接到pCSN004中,从而产生图1中描绘的载体pCSN061,并且序列在SEQ ID NO:2中示出。
通过使用载体pCSN061作为模板的PCR,通过在所述反应中包含正向引物(SEQ IDNO:45)和反向引物(SEQ ID NO:46)以及作为DNA聚合酶的Phusion(New England Biolabs,USA),获得了pCSN061载体的线性PCR片段,其省略了CAS9表达盒,由此包含KL11p、pCSN061单拷贝载体骨架和KanMX标记盒。根据制造商的说明执行PCR反应。
在本实施例中使用的来自毛螺菌科细菌ND2006的LbCpf1(Zetsche等人,2015)是如下获得的:将接头蛋白序列(SRAD)和SV40核定位信号(PKKKRKV)添加到LbCpf1基因的羧基末端,从而产生LbCpf1蛋白序列(SEQ ID NO:47)。如WO2008/000632中所述将该蛋白序列进行密码子对优化以在酿酒酵母中表达,从而产生如SEQ ID NO:48所示的LbCpf1的核苷酸序列。核苷酸序列是作为合成DNA在Thermo Fisher Scientific(GeneArt Gene Synthesisand Services)订购的。
合成LbCpf1(SEQ ID NO:48)序列在具有引物组(SEQ ID NO:49和SEQ ID NO:50)、在反应中使用Phusion作为DNA聚合酶(New England Biolabs,USA)的PCR反应中用作模板。根据制造商的说明执行PCR反应。所获得的LbCpf1 PCR片段在其5'端(K11p序列的一部分)和3'端(GND2t序列的一部分)与pCSN061载体的线性PCR片段具有同源性。
根据制造商的说明,使用NucleoSpin Gel和PCR Clean-up试剂盒(Machery-Nagel,由Bioké,Leiden,the Netherlands分销)来纯化所有PCR片段。随后,使用Gibson装配件(Gibson等人,2009)将纯化的LbCpf1 PCR片段装配到pCSN061载体的纯化的线性PCR片段中。所得的单拷贝酵母表达载体是pCSN067(LbCpf1,图5,SEQ ID NO:51)。
表达Cpf1的酿酒酵母菌株的构建
酵母载体pCSN067是单拷贝载体(CEN/ARS),所述单拷贝载体(CEN/ARS)含有LbCpf1表达盒,所述LbCpf1表达盒由从Kl11启动子(KLLA0F20031g的乳酸克鲁维酵母启动子)表达的经密码子优化的LbCpf1变体(WO2008/000632)、酿酒酵母GND2终止子以及赋予对G418的抗性的功能性KanMX标记盒组成。
首先使用LiAc/鲑鱼精(SS)载体DNA/PEG方法(Gietz和Woods,2002)将含有LbCpf1表达盒的载体pCSN067转化至酿酒酵母菌株CEN.PK113-7D(MATa URA3 HIS3 LEU2 TRP1MAL2-8 SUC2)中。菌株CEN.PK113-7D可从EUROSCARF保藏中心(http://www.euroscarf.de,Frankfurt,Germany)获得。van Dijken等人,2000描述了CEN.PK菌株家族的起源。在转化混合物中,使用1微克的载体pCNS067。将转化混合物在每ml含有200微克(μg)G418(SigmaAldrich,Zwijndrecht,the Netherlands)的YPD-琼脂(10克/升酵母提取物、20克/升蛋白胨、20克/升右旋糖、20克/升琼脂)上铺板。在30℃下生长两天至四天后,转化体在转化平板上出现。选择在平板上赋予G418抗性的转化体。该转化体具有通过获得pCSN067而实现的LbCpf1的表达,并且被命名为菌株CSN004,所述菌株被用于随后的转化实验中。
双链DNA(ds-DNA)YFP供体DNA盒
经由单独启动子(P)、orf(O)和终止子(T)序列在合适的大肠杆菌(E.coli)载体中的金门(Golden-Gate)装配反应制备编码黄色荧光蛋白(YFP)变体Venus(Nagai等人,2002)的双链供体DNA盒。使用SEQ ID NO:4和SEQ ID NO:5中所示的引物经由PCR反应扩增经装配的POT盒。在第二PCR中,使用SEQ ID NO:6和SEQ ID NO:7所示的引物组添加50bp的连接物序列。这产生了YFP表达盒,所述YFP表达盒包含在所述表达盒的5'端和3'端处的50bp连接物序列(SEQ ID NO:8)。连接物序列之间的YFP表达盒在后续使用引物组(SEQ ID NO:9和SEQ ID NO:10)的PCR反应中用作模板。在该PCR反应中,添加50bp的基因组侧翼以用于整合到酿酒酵母菌株CSN004的基因组基因座INT1中。所得的侧翼为50bp基因组序列的YFP盒的序列示于SEQ ID NO:11。
将Q5 DNA聚合酶(
Figure BDA0002764477840000761
高保真2X预混液,New England Biolabs,由Bioké,Leiden,the Netherlands.供应,产品目录号M0492S的一部分)用于上述PCR反应中。根据制造商的说明执行PCR反应。
PCR纯化
根据制造商的说明,使用NucleoSpin Gel和PCR Clean-up试剂盒(Machery-Nagel,由Bioké,Leiden,the Netherlands分销)来执行PCR反应的纯化。
引导RNA(crRNA)表达盒INT1
引导RNA表达盒是作为合成DNA(gBlocks)在Integrated DNA Technologies(IDT,Leuven,Belgium)订购的。引导RNA表达盒由SNR52p RNA聚合酶III启动子、由直接重复序列组成的引导RNA序列(SEQ ID NO:52)和基因组靶序列(SEQ ID NO:53)、以及之后的如Zetsche等人,2015中所述的SUP4终止子组成。为了体内同源重组到线性化pRN1120(XhoI、EcoRI)载体骨架中,将与pRN1120同源的50bp添加到引导RNA表达盒的任一侧上,从而产生了总共430bp的片段(SEQ ID NO:54)。
pRN1120载体构建(多拷贝表达载体,NatMX标记)
酵母载体pRN1120是多拷贝载体(2微米),其含有赋予对诺尔丝菌素的抗性的功能性NatMX标记盒。该载体的骨架基于pRS305(Sikorski和Hieter,1989),并且包括功能性2微米ORI序列和功能性NatMX标记盒(参见www.euroscarf.de)。载体pRN1120如图2所示,并且序列在SEQ ID NO:3中示出。
用基因组中的INT1基因座处整合的YFP表达盒构建表达LbCpf1的酿酒酵母菌株
使用LiAc/鲑鱼精(SS)载体DNA/PEG方法(Gietz和Woods,2002)转化酿酒酵母菌株CSN004。在转化之前,将菌株CSN004在每ml补充有200微克(μg)G418(Sigma Aldrich,Zwijndrecht,the Netherlands)的YPD液体培养基(10克/升酵母提取物、20克/升蛋白胨、20克/升右旋糖)中培养。用经XhoI/EcoRI限制消化的pRN1120和靶向INT1的crRNA表达盒(SEQ ID NO:13)转化菌株CSN004。线性化pRN1120是crRNA表达盒的受体,所述sgRNA表达盒在两端处均含有与pRN1120的同源性,以允许体内重组成环状质粒。预先在细胞中表达的LbCpf1被导向基因组靶标INT1,以产生双链断裂。在转化混合物中,包含用于在INT1基因座处整合的YFP供体DNA盒。
将转化混合物在每ml含有200微克(μg)G418(Sigma Aldrich,Zwijndrecht,theNetherlands)和200微克(μg)诺尔丝菌素(NTC,Jena Bioscience,Germany)的YPD-琼脂(10克/升酵母提取物、20克/升蛋白胨、20克/升右旋糖、20克/升琼脂)上铺板。在30℃下生长两天至四天后,转化体在转化平板上出现。选择在平板上赋予对G418和诺尔丝菌素的抗性并表达YFP的转化体。使用Qpix450(Molecular Devices;Filter:Ex/Em:457/536nm-FITC/GFP)评定YFP表达。该菌株将用于另外的LbCpf1实验中,因此其可以从其引导RNA质粒(诺尔丝菌素标记)中回收(cured),同时保持其LbCpf1表达质粒(KanMX标记)。使菌株在每ml补充有200微克(μg)G418(Sigma Aldrich,Zwijndrecht,the Netherlands)的YPD液体培养基(10克/升酵母提取物、20克/升蛋白胨、20克/升右旋糖)中在30℃、250rpm的振荡速度下生长24小时。在milliQ中制备培养物的稀释液,然后将其铺板到含有200微克(μg)G418(SigmaAldrich,Zwijndrecht,the Netherlands)的YPD-琼脂培养基(10克/升酵母提取物、20克/升蛋白胨、20克/升右旋糖、20克/升琼脂)上。在30℃下生长两天至四天后,琼脂平板上出现菌落。随后通过将单个菌落在每ml含有200微克(μg)诺尔丝菌素(NTC,Jena Bioscience,Germany)的YPD-琼脂(10克/升酵母提取物、20克/升蛋白胨、20克/升右旋糖、20克/升琼脂)上划线,来检查所述单个菌落对诺尔丝菌素的敏感性。选择对诺尔丝菌素敏感的菌株,并将其命名为CSN010。将该菌株用于进一步的转化实验中。
CRISPR瞬时编辑构建体(CTEC)DNA片段
含有引导RNA表达盒的合成DNA是在Integrated DNA Technologies(IDT,Leuven,Belgium)作为合成DNA(gBlocks)订购的。每个靶向基因组区域(INT1)或YFP ORF进行四种至八种设计,图4中提供了所述设计的概述。序列如SEQ ID NO:55、SEQ ID NO:56、SEQ IDNO:57、SEQ ID NO:58、SEQ ID NO:59、SEQ ID NO:60、SEQ ID NO:61和SEQ ID NO:62(YFP)所示和如SEQ ID NO:63、SEQ ID NO:64、SEQ ID NO:67和SEQ ID NO:68(INT1)所示的CTECDNA的设计,由SNR52p RNA聚合酶III启动子、由直接重复序列组成的引导RNA序列和基因组靶序列以及之后的如Zetsche等人,2015中所述的SUP4终止子,以及编码3bp取代(INT1)或导致移码的DNA 2碱基对缺失(YFP)的供体DNA组成。还评估了50bp连接物、连接物A、序列(SEQ ID NO:28)以及用于分离供体DNA和引导RNA表达盒(crRNA)的PAM序列和引导靶标的存在的影响。连接物A是与基因组没有任何同源性的50bp随机DNA序列。当在CTEC片段中包含PAM序列和引导靶标时,用于产生ds断裂的引导序列由同一CTEC片段的crRNA盒编码。当在CTEC片段中包含PAM序列和引导靶标时,决定测试18bp(SEQ ID NO:75(INT1)SEQ ID NO:76(YFP))以及20bp(SEQ ID NO:77(INT1)SEQ ID NO:78(YFP))的不同长度的引导靶序列。这些包括PAM序列的18bp和20bp的引导序列在SEQ ID NO:79(18bp,INT1)、SEQ ID NO:80(20bp,INT1)、SEQ ID NO:81(18bp,YFP)和SEQ ID NO:82(20bp,YFP)中呈现。
表6中提供了对序列的概述。
表6.对用于转化的CTEC DNA的序列的概述。将CTEC片段用作使用此表中所示的引物的PCR反应的模板。建立PCR反应以获得更高量的CTEC DNA片段,随后将所述CTEC DNA片段用于转化实验中。
Figure BDA0002764477840000791
Figure BDA0002764477840000801
酵母转化
将预先表达Cpf1的菌株CSN004和由于YFP表达盒的存在而发荧光并且预先表达Cpf1的菌株CSN010接种于每ml含有200μg G418(Sigma Aldrich,Zwijndrecht,theNetherlands)的YPD-G418培养基(10克/升酵母提取物、20克/升蛋白胨、20克/升右旋糖)中。随后,使用LiAc/SS载体DNA/PEG方法(Gietz和Woods,2002),用表7所示的1μg CTEC DNA和100ng的载体pRN1120转化菌株CSN004和CSN010。
将转化混合物在每ml含有200μg诺尔丝菌素(NTC,Jena Bioscience,Germany)和200μg G418(Sigma Aldrich,Zwijndrecht,the Netherlands)的YPD-琼脂(10克/升酵母提取物、20克/升蛋白胨、20克/升右旋糖、20克/升琼脂)上铺板。将平板在30摄氏度温育直至菌落出现在平板上。
表7.对用于酿酒酵母转化实验中的CTEC DNA的概述。
Figure BDA0002764477840000811
结果
在瞬时表达在CTEC DNA片段上编码的引导RNA之后,检查由以上在表7中概述的转化实验产生的菌落中供体DNA的掺入情况。靶向YFP盒的供体DNA的掺入导致YFP ORF中的移码,从而导致荧光丢失。通过QPIX450(Filter:Ex/Em:457/536nm-FITC/GFP)可视化转化后菌落的YFP荧光。下表8中汇总了由CTEC DNA片段基于表型进行YFP编辑的成功率。
基于荧光表型的丢失,对通过掺入作为CTEC构建体一部分的供体DNA在YFP ORF中引入经编码的移码的效率进行评分。转化后YFP荧光丢失的效率在下表8中进行了描绘。
表8.对在转化编码用于LbCpf1的crRNA和供体DNA的CTEC DNA片段后的YFP基因编辑的概述。
Figure BDA0002764477840000821
为了确认作为CTEC DNA片段的靶向INT1的部分的供体DNA的正确整合,通过桑格测序检查每次转化的8个菌落。用于确认整合的引物(SEQ ID NO:42和SEQ ID NO:43)被设计为在CTEC DNA中存在的供体DNA外部(上游400bp和下游372bp)的基因组中杂交。根据制造商的说明和本领域技术人员已知的标准PCR程序,使用
Figure BDA0002764477840000822
高保真聚合酶(产品目录号M0530L,New England Biolabs-USA)执行PCR反应。使用NucleoSpin Gel和PCR Clean-up试剂盒(Machery-Nagel,由Bioké,Leiden,the Netherlands分销)纯化所得的PCR产物,随后将所述PCR片段用作测序反应中的模板。根据供应商的说明,使用
Figure BDA0002764477840000831
终止子v3.1循环测序试剂盒(产品目录号4337456,ThermoFisher Scientific,Bleiswijk,theNetherlands)建立测序反应。将测序反应根据供应商的说明通过NucleoSEQ柱(产品目录号740523.250,Machery-Nagel,由Bioké,Leiden,the Netherlands分销)纯化,随后通过3500XL遗传分析仪(ThermoFisher Scientific-Bleiswijk,the Netherlands)进行分析。在Clone Manager软件v9.4(Sci-Ed software-USA)中分析测序读段。下表9中呈现了测序结果的概述。
表9.对在crRNA瞬时表达后,作为LbCpf1介导的供体DNA掺入的结果的INT1编辑的概述。供体DNA和crRNA表达盒均编码在CTEC DNA片段上。
Figure BDA0002764477840000832
确认了由作为CTEC片段的一部分的供体DNA编码的通过LbCpf1进行PAM变化,成功率为13-68%。YFP基因的编辑频率是基于表型的;非荧光转化体与荧光转化体的得分是作为供体DNA掺入的结果。通过测序确认通过LbCpf1进行INT1编辑的效率。通过测序证明,供体DNA被掺入基因组中,导致了对PAM序列的3bp修饰,并且不存在除由供体DNA编码的碱基变化以外的其他碱基变化。
实施例3.CTEC DNA片段两侧或一侧上的连接物序列对酿酒酵母中YFP基因编辑频 率的影响
该实施例评估了CTEC DNA片段任一侧或一侧上的连接物序列对酿酒酵母中CRISPR/LbCpf1介导的YFP基因编辑频率的影响。CTEC DNA片段包含具有如先前由Zetsche等人,2015所描述的控制元件(LbCpf1)的引导RNA表达盒以用于在酿酒酵母中表达引导RNA;以及用于编辑靶向序列的供体DNA序列。LbCpf1引导RNA表达盒包含SNR52启动子、由直接重复序列组成的引导RNA序列和基因组靶序列以及之后的SUP4终止子。也是CTEC片段的一部分的供体DNA的大小为109bp,并且靶向整合在酿酒酵母菌株CSN010的INT1基因座上的YFP基因。供体DNA编码2bp缺失,由此原始PAM序列被修饰(TTTG=>TG)。在掺入供体DNA时,移码被引入YFP基因中,从而导致菌株的荧光丢失。为了能够使用相同的引物组对不同的CTEC盒进行PCR扩增,使CTEC DNA片段在5'端和3'端侧接所谓的连接物序列;即与基因组没有同源性的随机DNA序列。
实验细节
本实施例中使用的部件如下:
-酵母菌株CSN010,其预先表达LbCpf1并且由于INT1基因座上存在YFP表达盒而具有荧光表型。酿酒酵母菌株CSN010的构建描述于实施例2中。
-pRN1120,含有NatMX标记的多拷贝表达载体。该质粒的构建和细节描述于实施例1中。
侧接有连接物序列的CRISPR瞬时编辑构建体(CTEC)DNA片段。
含有引导RNA表达盒的合成DNA是在Integrated DNA Technologies(IDT,Leuven,Belgium)作为合成DNA(gBlocks)订购的。为编辑YFP ORF进行了八项设计,图6中提供了所述设计的概述。序列如SEQ ID NO:87、SEQ ID NO:88、SEQ ID NO:89、SEQ ID NO:90、SEQ IDNO:91、SEQ ID NO:92、SEQ ID NO:93和SEQ ID NO:94所示的CTEC DNA的设计,由SNR52pRNA聚合酶III启动子、由直接重复序列组成的引导RNA序列和基因组靶序列以及之后的如Zetsche等人,2015中所述的SUP4终止子,以及编码导致移码的2碱基对缺失(YFP)的供体DNA组成。为了能够使用相同的引物组(SEQ ID NO:95和SEQ ID NO:96)进行对不同CTECDNA片段的PCR扩增,使CTEC DNA片段在5'端和3'端侧接所谓的连接物序列;即与基因组没有同源性的随机DNA序列。CTEC DNA片段在5'侧上侧接有连接物5(CON5,SEQ ID NO:97)并且在3'侧上侧接有连接器3(CON3,SEQ ID NO:98)。
表10中提供了序列的概述。
表10.对用于转化的CTEC DNA的序列的概述。使用该表中所示的引物将模板引导RNA表达盒用作PCR的模板,以获得转化实验中使用的CTEC DNA(CTEC DNA片段)。
Figure BDA0002764477840000851
Figure BDA0002764477840000861
Figure BDA0002764477840000871
将CTEC片段(gBlock)用作使用此表中所示的引物的PCR反应的模板。建立PCR反应以获得更高量的CTEC DNA片段,随后将所述CTEC DNA片段用于转化实验中。根据制造商的说明,在PCR反应中使用PrimeSTAR GXL DNA聚合酶(Takara/产品目录号R050A)。根据制造商的说明,使用NucleoSpin Gel和PCR Clean-up试剂盒(Machery-Nagel,由Bioké,Leiden,the Netherlands分销)来纯化PCR产生的CTEC DNA。随后,使用NanoDrop(ND-1000分光光度计,Thermo Scientific,Bleiswijk,the Netherlands)来测量DNA浓度。
酵母转化
将预先表达LbCpf1并且由于YFP表达盒的存在而发荧光的菌株CSN010接种于每ml含有200μg G418(Sigma Aldrich,Zwijndrecht,the Netherlands)的YPD-G418培养基(10克/升酵母提取物、20克/升蛋白胨、20克/升右旋糖)中。随后,使用LiAc/SS载体DNA/PEG方法(Gietz和Woods,2002),用表11所示的1μg CTEC DNA和100ng载体pRN1120来转化菌株CSN010。
将转化混合物在每ml含有200μg诺尔丝菌素(NTC,Jena Bioscience,Germany)和200μg G418(Sigma Aldrich,Zwijndrecht,the Netherlands)的YPD-琼脂(10克/升酵母提取物、20克/升蛋白胨、20克/升右旋糖、20克/升琼脂)上铺板。将平板在30摄氏度温育直至菌落出现在平板上。
表11.对用于不同的转化实验的CTEC DNA的概述。
Figure BDA0002764477840000881
Figure BDA0002764477840000891
Figure BDA0002764477840000901
结果
在瞬时表达在CTEC DNA片段上编码的引导RNA之后,检查由以上在表11中概述的转化实验产生的菌落中供体DNA的掺入情况。靶向YFP盒的供体DNA的掺入导致YFP ORF中的移码,从而导致荧光丢失。通过QPIX450(Filter:Ex/Em:457/536nm-FITC/GFP)可视化转化后菌落的YFP荧光。下表12中汇总了由具有连接物的CTEC DNA片段基于表型进行YFP编辑的成功率。
表12.对通过侧接有一个或两个连接物序列的CTEC DNA片段在酿酒酵母CSN010中进行的YFP基因编辑的频率的概述。编辑频率是基于表型建立的,在不对YFP基因进行编辑的情况下,YFP荧光是可见的。在通过供体DNA编辑YFP基因的情况下,荧光丢失。
Figure BDA0002764477840000902
Figure BDA0002764477840000911
CTEC DNA片段的任一侧或两侧上存在连接物序列均不会负面地影响编辑效率。
实施例4.通过CTEC构建体进行的Crispr/Cas9介导的敲除
该实施例描述了在酿酒酵母菌株CSN009中以100%效率进行的Cas9介导的YFP基因的敲除。菌株CSN009预表达Cas9,并且含有作为荧光标记整合的YFP表达盒。通过转化由引导RNA表达盒以及供体DNA组成的CTEC DNA片段,在瞬时表达引导RNA序列后,菌株中的YFP ORF被编辑。在供体DNA由恰好在YFP表达盒外的2个侧翼区域组成的情况下,YFP表达盒被完全缺失。在供体DNA编码DNA碱基缺失,由此基因组靶标被从TTAGTCACTACTTTAGGTTA(SEQ ID NO:132)修饰成TTAGTCACTACTTTAGTTA(SEQ ID NO:133)的情况下,在掺入供体DNA时引入了移码。在这两种情况下,在掺入供体DNA时,菌株的YFP荧光均丢失。通过将与质粒骨架pRN1120同源的序列添加至CTEC片段的任一侧并将这些CTEC片段与作为线性载体骨架的经EcoRI和Xho I消化的pRN1120在转化中组合,消除了未经编辑的背景转化体。体内环化导致了具有连续表达的引导RNA的质粒,所述引导RNA靶向位于基因组中的YFP基因。其中的YFP基因被编辑,导致基因组靶位点改变(移码)或YFP表达盒完全丢失(缺失)的转化体是可行的。
CRISPR瞬时编辑构建体(CTEC)DNA片段
含有引导RNA表达盒的合成DNA是在Integrated DNA Technologies(IDT,Leuven,Belgium)作为合成DNA(gBlocks)订购的。为编辑YFP ORF进行了六项设计,图17中提供了所述设计的概述。序列如SEQ ID NO:115、SEQ ID NO:116、SEQ ID NO:117、SEQ ID NO:118、SEQ ID NO:119和SEQ ID NO:120所示的CTEC DNA的设计,由SNR52p RNA聚合酶III启动子、引导序列(也称为基因组靶序列(SEQ ID NO:122))、gRNA结构部件和如在DiCarlo等人,2013中所述的SUP4 3'侧翼区域,以及供体DNA组成。在该实施例中,使用两种不同类型的供体片段,两者的长度都在60bp至100bp范围内变化。一种供体DNA通过将基因组靶序列从SEQID NO:132:TTAGTCACTACTTTAGGTTA修饰成SEQ ID NO:133:TTAGTCACTACTTTAGTTA来编码YFP基因中的移码(SEQ ID NO:115、SEQ ID NO:116和SEQ ID NO:117),另一种供体DNA编码恰好在YFP表达盒外的2个彼此相邻的侧翼区域,从而导致YFP表达盒被完全敲除(SEQ IDNO:118、SEQ ID NO:119和SEQ ID NO:120)。供体DNA的长度大小在60bp至100bp之间变化,用于完全敲除YFP基因以及引入移码,在这两种情况下,当掺入供体DNA时,YFP荧光都会失去。在该实施例中使用的CTEC片段在任一侧上均具有与线性化pRN1120载体骨架(由EcoRI和XhoI消化的)同源的50bp序列,以用于含CTEC片段的pRN1120质粒的体内环化。在3'侧上,连接物F(CONF,SEQ ID NO:131)被包含在供体DNA和与线性化pRN1120片段同源的50bp序列之间。图17中提供了CTEC DNA设计的概述。
表13中提供了序列的概述。
表13.对用于转化的CTEC DNA的序列的概述。使用该表中所示的引物将模板引导RNA表达盒用作PCR的模板,以获得转化实验中使用的CTEC DNA(CTEC DNA片段)。
Figure BDA0002764477840000931
将CTEC片段(gBlock)用作使用此表中所示的引物的PCR反应的模板。建立PCR反应以获得更高量的CTEC DNA片段,随后将所述CTEC DNA片段用于转化实验中。根据制造商的说明,在PCR反应中使用PrimeSTAR GXL DNA聚合酶(Takara/产品目录号R050A)。根据制造商的说明,使用NucleoSpin Gel和PCR Clean-up试剂盒(Machery-Nagel,由Bioké,Leiden,the Netherlands分销)来纯化PCR产生的CTEC DNA。随后,使用NanoDrop(ND-1000分光光度计,Thermo Scientific,Bleiswijk,the Netherlands)来测量DNA浓度。
实验细节:
本实施例中应用的部件如下:
-酵母菌株CSN009,其预先表达Cas9并且由于INT1基因座上存在YFP表达盒而具有荧光表型。酿酒酵母菌株CSN009的构建描述于实施例1中。
-pRN1120,含有NatMX标记的多拷贝表达载体。该质粒的构建和细节描述于实施例1中。
酵母转化
将预先表达Cas9并且由于YFP表达盒的存在而发荧光的菌株CSN009接种于每ml含有200μg G418(Sigma Aldrich,Zwijndrecht,the Netherlands)的YPD-G418培养基(10克/升酵母提取物、20克/升蛋白胨、20克/升右旋糖)中。随后,使用LiAc/SS载体DNA/PEG方法(Gietz和Woods,2002),用如表14所示的1μg CTEC DNA和100ng环形pRN1120载体或100ng线性化pRN1120载体骨架(通过EcoRI和XhoI消化获得)来转化菌株CSN009。
将转化混合物在每ml含有200μg诺尔丝菌素(NTC,Jena Bioscience,Germany)和200μg G418(Sigma Aldrich,Zwijndrecht,the Netherlands)的YPD-琼脂(10克/升酵母提取物、20克/升蛋白胨、20克/升右旋糖、20克/升琼脂)上铺板。将平板在30摄氏度温育直至菌落出现在平板上。
表14.对用于转化的CTEC DNA的序列的概述。
Figure BDA0002764477840000951
Figure BDA0002764477840000961
结果
在瞬时表达在CTEC DNA片段上编码的引导RNA之后,检查由以上在表14中概述的转化实验产生的菌落中供体DNA的掺入情况。靶向YFP盒的供体DNA的掺入导致了YFP ORF中的移码或YFP表达盒的完全缺失,在这两种情况下均导致了荧光丢失。通过QPIX450(Filter:Ex/Em:457/536nm-FITC/GFP)可视化转化后菌落的YFP荧光。下表15中汇总了通过CTEC DNA片段基于表型进行YFP编辑的成功率。
表15.在菌株酿酒酵母CSN009中通过CTEC DNA片段基于表型进行YFP编辑的频率。计数的转化体来自不进行稀释、稀释10倍或稀释25倍然后铺板在每ml含有200μg诺尔丝菌素(NTC,Jena Bioscience,Germany)和200μg G418(Sigma Aldrich,Zwijndrecht,theNetherlands)的YPD-琼脂(10克/升酵母提取物、20克/升蛋白胨、20克/升右旋糖、20克/升琼脂)上的转化混合物。
Figure BDA0002764477840000962
Figure BDA0002764477840000971
Figure BDA0002764477840000981
证实了CSN009菌株的荧光由于作为CTEC DNA片段的结果的YFP编辑而丢失。CTEC片段含有60bp、80bp或100bp供体DNA,所述供体DNA编码YFP基因中的移码或者用于YFP表达盒的完全敲除的侧翼,所述侧翼对于两种类型的供体DNA均起作用。此外,所测试的在60bp至100bp范围内的长度均起作用。当CTEC片段在细胞内装配到pRN1120载体骨架中,产生组成型表达的引导RNA,从而消除了其中没有对靶向YFP基因进行编辑的背景菌株时,创建完全敲除的效率大大提高。引人注目的是,当将其供体DNA编码移码的CTEC DNA片段装配在pRN1120载体骨架中时,转化体的数量大大增加。如由荧光丢失所证明的,所获得的这些大量的转化体都具有经编辑的YFP基因。
实施例5.在解脂耶氏酵母中通过CTEC构建体进行的Crispr/Cas9介导的基因组编
本实施例描述了在耶氏酵母属菌株ML3244中进行的Cas9介导的GFP基因编辑。菌株ML3244预表达Cas9,并且含有作为荧光标记而整合的GFP表达盒。通过转化由引导RNA表达盒以及供体DNA组成的CTEC DNA片段,在瞬时表达引导RNA序列后,菌株中的GFP ORF被编辑。在该实例中,测试了四种不同的供体DNA,每种供体DNA编码GFP基因中的不同修饰。为了使GFP基因完全缺失,第一供体DNA由恰好在GFP ORF外的两个侧翼区域组成。第二种供体DNA编码DNA碱基缺失,由此PAM序列被从CGG修饰成CG,这意味着在掺入供体DNA时引入了移码。第三种供体DNA编码PAM中的2碱基对变化,将其从CGG改变至TAG,由此引入了终止密码子。用于编辑GFP基因的第四种供体DNA通过将PAM序列从CGG改变至CGA来编码GFP基因中的沉默突变,并且通过从T至A的碱基变化来编码恰好在PAM和基因组靶序列外的终止密码子。所述四种供体DNA片段导致了对GFP基因的修饰,所述修饰导致了菌株的荧光丢失。CTECDNA片段是不含用于选择转化体的标记的线性DNA片段。为了选择转化体,在转化中添加含有潮霉素B标记的质粒pSTV077。分析出现在含潮霉素B的选择性平板上的菌落的GFP荧光及其丢失情况,从而确认由于CTEC DNA片段的结果而导致的对GFP基因的编辑。
CRISPR瞬时编辑构建体(CTEC)DNA片段
含有引导RNA表达盒的合成DNA是在Integrated DNA Technologies(IDT,Leuven,Belgium)作为合成DNA(gBlocks)订购的。为编辑GFP ORF进行了四项设计,表16中提供了所述设计的概述。序列如SEQ ID NO:170、SEQ ID NO:171、SEQ ID NO:134和SEQ ID NO:135所示的CTEC DNA的设计,由引导RNA表达盒和大小为100bp的供体DNA组成。引导RNA表达盒靶向菌株ML3244的耶氏酵母属基因组中的GFP基因,并且由Y1_HYPO启动子(SEQ ID NO:136)以及之后的GFP基因组靶标的6bp反向重复序列(SEQ ID NO:137)、位于GFP的20bp基因组靶序列(SEQ ID NO:140)的5'侧和3'侧上的锤头状(HH)核酶(SEQ ID NO:138)和丁型肝炎病毒(HDV)核酶(SEQ ID NO:139),以及Yl_PGM终止子(SEQ ID NO:141)组成,如由Gao和Zhao所述。在该实施例中,使用了四种不同类型的供体DNA片段,每种供体DNA片段的大小为100-bp,并且当被掺入时,菌株ML3244的GFP荧光丢失。CTEC DNA片段1(SEQ ID NO:170)的供体DNA由恰好在GFP ORF外部的5'侧上50bp和3'侧上50bp的两个侧翼区域组成,用于使GFP基因完全缺失。CTEC DNA片段2(SEQ ID NO:171)的供体DNA编码DNA碱基缺失,由此PAM序列被从CGG修饰成CG,这意味着在掺入供体DNA时引入了移码。CTEC DNA片段3(SEQ ID NO:134)的供体DNA编码PAM中的两个碱基修饰,将其从CGG改变至TAG,由此引入了终止密码子。CTECDNA片段4(SEQ ID NO:135)的供体DNA通过将PAM序列从CGG改变至CGA来编码GFP基因中的沉默突变,并且通过从T至A的碱基变化来编码恰好在PAM和基因组靶序列外部的终止密码子。
表16中提供了序列的概述。
表16.在耶氏酵母属菌株ML3244的转化中使用的靶向GFP基因的CTEC DNA片段的序列的概述。
Figure BDA0002764477840001001
构建耶氏酵母属菌株ML3244
将用于表达Cas9的耶氏酵母属质粒MB7452(图18,SEQ ID NO:147)转移至耶氏酵母属菌株ML324(MATa;以保藏号ATCC18943保藏)。耶氏酵母属载体MB7452含有Cas9表达盒(SEQ ID NO:148),所述Cas9表达盒由从Y1_007启动子(YALI0B14377g的解脂耶氏酵母启动子,SEQ ID NO:149)、Yl_GPD终止子(YALI0C06369g的解脂耶氏酵母终止子,SEQ ID NO:150)表达的经密码子优化的Cas9基因组成;以及赋予诺尔丝菌素抗性的功能性NatMX标记盒。
使用LiAc/鲑鱼精(SS)载体DNA/PEG方法(Gietz和Woods,2002),在39摄氏度的热激温度下将含有Cas9表达盒的载体MB7452转化到解脂耶氏酵母菌株ML324(MATa)中。在转化混合物中,使用1微克的载体MB7452。将转化混合物在每ml含有150微克(μg)诺尔丝菌素(NTC,Jena Bioscience,Germany)的YPD-琼脂(10克/升酵母提取物、20克/升蛋白胨、20克/升右旋糖、20克/升琼脂)上铺板。在30摄氏度下培养两天至四天后,转化体在转化平板上出现。将在平板上赋予诺尔丝菌素抗性、被命名为菌株ML3242(MATa,Cas9)的转化体接种到YPD-诺尔丝菌素培养基(10克/升酵母提取物、20克/升蛋白胨、20克/升右旋糖、150μg/ml诺尔丝菌素(NTC,Jena Bioscience,Germany))中,并用于随后的转化中以敲除KU70基因。
耶氏酵母属菌株ML3242中CRISPR/Cas介导的KU70基因敲除是通过将质粒pSTV089和100bp KU70敲除供体DNA片段转化到所述菌株中而进行行的。耶氏酵母属质粒pSTV089(SEQ ID NO:151,图19)配备有引导RNA表达盒和赋予对潮霉素B的抗性的功能性HygB标记盒。引导RNA表达盒靶向耶氏酵母属基因组中的KU70基因,并且由Y1_HYPO启动子(SEQ IDNO:136)以及之后的KU70基因组靶标的6bp反向重复序列(SEQ ID NO:167)、位于KU70基因的20bp基因组靶序列(SEQ ID NO:152)的5'侧和3'侧上的锤头状(HH)核酶(SEQ ID NO:138)和丁型肝炎病毒(HDV)核酶(SEQ ID NO:139),以及Yl_PGM终止子(SEQ ID NO:141)组成,如由Gao和Zhao所述。除引导RNA表达盒和HygB标记盒外,质粒pSTV089还含有Cas9表达盒。Cas9经密码子优化以在解脂耶氏酵母中表达,并且从解脂耶氏酵母007启动子(SEQ IDNO:149)和解脂耶氏酵母GPD终止子(SEQ ID NO:150)表达。100bp的KU70敲除供体DNA片段(SEQ ID NO:153)是双链DNA片段,并且包含KU70基因上游的50bp和下游的50bp。在掺入KU70敲除的供体DNA片段时,从基因组中缺失了介于50bp序列之间的KU70基因。
使用LiAc/鲑鱼精(SS)载体DNA/PEG方法(Gietz和Woods,2002),在39摄氏度的热激温度下将质粒pSTV089和供体DNA片段转化到解脂耶氏酵母菌株ML3242(MATa Cas9)中。在转化混合物中,使用500纳克的质粒pSTV089和500ng的100bp KU70敲除供体DNA片段。将转化混合物在每ml含有150微克(μg)潮霉素B(Thermo Fisher Scientific,TheNetherlands,产品目录号:10687010)并且每ml含有150微克(μg)诺尔丝菌素(NTC,JenaBioscience,Germany)的YPD-琼脂(10克/升酵母提取物、20克/升蛋白胨、20克/升右旋糖、20克/升琼脂)上铺板。在30摄氏度下培养两天至四天后,转化体在转化平板上出现。通过诺尔丝菌素抗性选择转化体中Cas9表达质粒(MB7452)的存在,并且通过潮霉素B抗性选择转化体中质粒pSTV089的存在。
通过PCR确认了KU70基因的敲除。根据供应商的手册使用YeaStar基因组DNA试剂盒(D2002,ZymoResearch,BaseClear,The Netherlands)分离的基因组DNA被用作为模板。根据供应商的手册用PrimeStar聚合酶,来使用在基因组上恰好定位在用于敲除的KU70基因的上游和下游50bp序列外部的引物组(SEQ ID NO:154和SEQ ID NO:155)。通过扩增964bp的片段确认敲除,所述片段确认了KU70基因的缺失和KU70敲除供体DNA的整合。
由于通过PCR证实了KU70敲除的ML3242转化体要在另外的Cas9实验中使用,因此将所述转化体从质粒pSTV089(潮霉素B标记)中回收,同时保持其Cas9表达质粒MB7452(诺尔丝菌素标记)。使菌株在每ml补充有150微克(μg)诺尔丝菌素(NTC,Jena Bioscience,Germany)的YPD液体培养基(10克/升酵母提取物、20克/升蛋白胨、20克/升右旋糖)中在30℃、250rpm的振荡速度下培养24小时。在milliQ中制备培养物的稀释液,然后将其铺板到每ml含有150微克(μg)诺尔丝菌素(NTC,Jena Bioscience,Germany)的YPD-琼脂培养基(10克/升酵母提取物、20克/升蛋白胨、20克/升右旋糖、20克/升琼脂)上。在30摄氏度下培养两天至四天后,菌落在琼脂平板上出现。随后通过将单个菌落在每ml含有150微克(μg)潮霉素B(Thermo Fisher Scientific,The Netherlands,产品目录号:10687010)的YPD-琼脂(10克/升酵母提取物、20克/升蛋白胨、20克/升右旋糖、20克/升琼脂)上划线,来检查所述单个菌落对潮霉素B的敏感性。选择潮霉素B敏感菌株,并将其命名为ML3243(MATa KU70 Cas9)。在随后的转化中使用菌株ML3243以在该菌株的INT05基因座上添加GFP表达盒(SEQ ID NO:156)。
通过转化质粒pSTV086和侧接有INT05基因座的50bp基因组DNA序列的GFP表达盒,来执行CRISPR/Cas介导的GFP表达盒在耶氏酵母属菌株ML3242的INT05基因座中的整合。耶氏酵母属质粒pSTV086(SEQ ID NO:157,图20)配备有引导RNA表达盒和赋予对潮霉素B的抗性的功能性HygB标记盒。引导RNA表达盒靶向耶氏酵母属基因组中的INT05基因座,并且由Y1_HYPO启动子(SEQ ID NO:136)以及之后的INT05基因组靶标的6bp反向重复序列(SEQ IDNO:168)、位于INT05基因座的20bp基因组靶序列(SEQ ID NO:169)的5'侧和3'侧上的锤头状(HH)核酶(SEQ ID NO:138)和丁型肝炎病毒(HDV)核酶(SEQ ID NO:139),以及Yl_PGM终止子(SEQ ID NO:141)组成,如由Gao和Zhao所述。除引导RNA表达盒和HygB标记盒外,质粒pSTV086还含有Cas9表达盒。Cas9经密码子优化以在解脂耶氏酵母中表达,并且从解脂耶氏酵母007启动子(SEQ ID NO:149)和解脂耶氏酵母GPD终止子(SEQ ID NO:150)表达。整合在耶氏酵母属菌株ML3243的INT05基因座上的GFP表达盒包含耶氏酵母属Yl_HSP启动子(SEQID NO:162)、维多利亚多管发光水母eGFP(A.vic_eGFP)ORF(SEQ ID NO:163)和耶氏酵母属Yl_GPD终止子(SEQ ID NO:164)。GFP表达盒侧接有50bp的基因组DNA侧翼以用于靶向整合在耶氏酵母属菌株ML3243的INT05基因座处。
使用LiAc/鲑鱼精(SS)载体DNA/PEG方法(Gietz和Woods,2002),在39摄氏度的热激温度下将质粒pSTV086(SEQ ID NO:157,图20)和侧接有INT05基因座的50bp基因组DNA序列的GFP表达盒(SEQ ID NO:158)转化到解脂耶氏酵母菌株ML3243(MATa KU70Cas9)中。在转化混合物中,使用500纳克的质粒pSTV086和500ng的GFP表达盒,所述GFP表达盒侧接有INT05基因座的50bp基因组DNA序列以用于靶向整合。将转化混合物在每ml含有150微克(μg)潮霉素B(Thermo Fisher Scientific,The Netherlands,产品目录号:10687010)并且每ml含有150微克(μg)诺尔丝菌素(NTC,Jena Bioscience,Germany)的YPD-琼脂(10克/升酵母提取物、20克/升蛋白胨、20克/升右旋糖、20克/升琼脂)上铺板。在30摄氏度下培养两天至四天后,转化体在转化平板上出现。通过诺尔丝菌素抗性选择转化体中Cas9表达质粒(MB7452)的存在,并且通过潮霉素B抗性选择转化体中质粒pSTV086的存在。
通过由QPIX450(Filter:Ex/Em:457/536nm-FITC/GFP)可视化的荧光证实了GFP表达盒的整合。为了确认GFP表达盒在INT05基因座中的整合,根据供应商手册使用荧光转化体的基因组DNA作为模板并且使用PrimeStar聚合酶建立PCR。在PCR反应中使用引物组(SEQID NO:159和SEQ ID NO:160),所述引物组位于基因组中的INT05基因座上,恰好在用于整合GFP表达盒的50bp基因组序列外部。根据供应商手册使用YeaStar基因组DNA试剂盒(D2002,ZymoResearch,BaseClear,The Netherlands)来分离基因组DNA。通过扩增3412bp片段来确认GFP盒在INT05基因座中的靶向整合。
因为通过PCR和菌株的荧光确认了INT05基因座处的GFP表达盒整合ML3243转化体要在另外的Cas9实验中使用,因此将所述转化体从质粒pSTV086(潮霉素B标记)中回收,同时保持其Cas9表达质粒MB7452(诺尔丝菌素标记)。使菌株在每ml补充有150微克(μg)诺尔丝菌素(NTC,Jena Bioscience,Germany)的YPD液体培养基(10克/升酵母提取物、20克/升蛋白胨、20克/升右旋糖)中在30℃、250rpm的振荡速度下培养24小时。在milliQ中制备培养物的稀释液,然后将其铺板到每ml含有150微克(μg)诺尔丝菌素(NTC,Jena Bioscience,Germany)的YPD-琼脂培养基(10克/升酵母提取物、20克/升蛋白胨、20克/升右旋糖、20克/升琼脂)上。在30℃下培养两天至四天后,菌落在琼脂平板上出现。随后通过将单个菌落在每ml含有150微克(μg)潮霉素B(Thermo Fisher Scientific,The Netherlands,产品目录号:10687010)的YPD-琼脂(10克/升酵母提取物、20克/升蛋白胨、20克/升右旋糖、20克/升琼脂)上划线,来检查所述单个菌落对潮霉素B的敏感性。选择潮霉素B敏感菌株,并将其命名为ML3244(MATa KU70 Cas9,GFP)。将该菌株用于进一步的转化实验中。
整合位点INT05
INT05整合位点是基因YALI0F11275g与YALI0F11297g之间的非编码区域,位于染色体NC_006072上。
pSTV077载体(耶氏酵母属表达载体,HygB标记)
耶氏酵母属载体pSTV077(图21,SEQ ID NO:161)配备有功能性HygB标记盒,所述功能性HygB标记盒赋予对潮霉素B的抗性,以允许在琼脂平板上或液体培养物中选择解脂耶氏酵母转化体。β内酰胺酶标记允许在大肠杆菌(E.coli.)中选择质粒。
GFP表达盒
整合在耶氏酵母属菌株ML3244的INT05基因座上的GFP表达盒包含耶氏酵母属Yl_HSP启动子、维多利亚多管发光水母eGFP(A.vic_eGFP)ORF和耶氏酵母属Yl_GPD终止子。GFP表达盒侧接有50bp的基因组DNA侧翼以用于靶向整合在耶氏酵母属菌株ML3243的INT05基因座处。包含50bp基因组DNA侧翼的eGFP表达盒的序列如SEQ ID NO:158所示,Y1-HSP启动子的序列如SEQ ID NO:162所示,A.vic_eGFP ORF的序列如SEQ ID NO:163所示,并且Yl_GPD终止子的序列如SEQ ID NO:164所示。
DNA浓度
使用NanoDrop装置(ThermoFisher,Life Technologies,Bleiswijk,theNetherlands)测定包括供体DNA片段和质粒pSTV086在内的所有DNA浓度,从而提供以纳克/微升计的浓度。基于这些测量,在转化实验中使用250ng pSTV077质粒和1000ng CTEC DNA片段的量。
PCR反应
在上述PCR反应中使用PrimeSTAR GXL DNA聚合酶(TaKaRa,由VWR,AmsterdamLeiden,the Netherlands供应,产品目录号R050A)。根据制造商的说明执行PCR反应。
PCR纯化
根据制造商的说明,使用NucleoSpin Gel和PCR Clean-up试剂盒(Machery-Nagel,由Bioké,Leiden,the Netherlands分销)来执行PCR反应的纯化。
耶氏酵母属转化
将表达Cas9并且由于GFP表达盒的存在而发荧光的菌株ML3244接种于每ml含有150μg诺尔丝菌素(Sigma Aldrich,Zwijndrecht,the Netherlands)的YPD-G418培养基(10克/升酵母提取物、20克/升蛋白胨、20克/升右旋糖)中。随后,使用LiAc/SS载体DNA/PEG方法(Gietz和Woods,2002),用表17所示的1μg CTEC DNA片段和250ng载体pSTV077来转化菌株ML3244。
将转化混合物在每ml含有150μg诺尔丝菌素(NTC,Jena Bioscience,Germany)和150μg潮霉素B(Thermo Fisher Scientific,the Netherlands)的YPD-琼脂(10克/升酵母提取物、20克/升蛋白胨、20克/升右旋糖、20克/升琼脂)上铺板。将平板在30摄氏度温育直至菌落出现在平板上。
表17.对用于转化的CTEC DNA片段和质粒的序列的概述。
Figure BDA0002764477840001061
结果
在瞬时表达在CTEC DNA片段上编码的引导RNA之后,检查由以上在表17中概述的转化实验产生的菌落中供体DNA的掺入情况。靶向GFP盒的供体DNA的掺入导致了菌株的荧光丢失。通过QPIX450(Filter:Ex/Em:457/536nm-FITC/GFP)可视化转化后菌落的GFP荧光。下表18中汇总了通过CTEC DNA片段基于表型进行GFP编辑的成功率。
表18.在菌株耶氏酵母属菌株ML3244中通过CTEC DNA片段基于表型进行GFP编辑的频率。计数的转化体来自未稀释然后铺板在每ml补充有150μg潮霉素B(Hygromycin B,ThermoFisher,The Netherlands)的YPD-琼脂(10克/升酵母提取物、20克/升蛋白胨、20克/升右旋糖、20克/升琼脂)上的转化混合物。
Figure BDA0002764477840001071
证明了耶氏酵母属菌株ML3244的荧光由于作为CTEC DNA片段的结果的GFP编辑而丢失。通过PCR确认了作为CTEC DNA片段1的结果的GFP ORF完全敲除。根据供应商手册使用YeaStar基因组DNA试剂盒(D2002,ZymoResearch,BaseClear,The Netherlands)来分离非荧光菌株的基因组DNA。在使用根据供应商手册的PrimeStar GXL聚合酶和引物组(SEQ IDNO:159和SEQ ID NO:160)的PCR反应中,将分离的基因组DNA用作模板。通过PCR从非荧光菌株的基因组DNA中扩增出了2670bp片段,而不是在荧光ML3244菌株中存在的3412bp片段。
通过测序确认了通过CTEC DNA片段2、CTEC DNA片段3和CTEC DNA片段4对GFP基因的编辑。根据供应商手册使用YeaStar基因组DNA试剂盒(D2002,ZymoResearch,BaseClear,The Netherlands)来分离非荧光菌株的基因组DNA。随后在使用根据供应商手册的PrimeStar GXL聚合酶和引物组(SEQ ID NO:165和SEQ ID NO:166)的PCR反应中,将基因组DNA用作模板。所得PCR片段代表经编辑的GFP ORF,并且根据供应商的说明使用NucleoSpinGel和PCR Clean-up试剂盒(Machery-Nagel,由Bioké,Leiden,The Netherlands分销)进行纯化。随后,将PCR片段用作测序反应中的模板。根据供应商的说明,使用
Figure BDA0002764477840001081
终止子v3.1循环测序试剂盒(产品目录号4337456,ThermoFisher Scientific,Bleiswijk,theNetherlands)和引物SEQ ID NO:165来建立测序反应。将测序反应根据供应商的说明通过NucleoSEQ柱(产品目录号740523.250,Machery-Nagel,由Bioké,Leiden,the Netherlands分销)纯化,随后通过3500XL遗传分析仪(ThermoFisher Scientific-Bleiswijk,theNetherlands)进行分析。在Clone Manager软件v9.4(Sci-Ed software-USA)中分析测序读段,并且确认荧光丢失是由对GFP ORF的编辑引起的,GFP ORF的编辑是由在转化中使用的CTEC DNA片段的供体DNA部分编码的。
通过改变耶氏酵母属ML3244转化体的表型——GFP荧光丢失;并且通过对经编辑的GFP ORF进行测序或通过以PCR确认GFP ORF的完全缺失,证明了CTEC DNA片段用于基因组编辑的功能。
参考文献
·Altschul SF et al.,J.Mol.Biol.215:403-410(1990)
·Carillo H and Lipman D.SIAM J.Applied Math.,48:1073(1988)
·Carrel F.L.Y.and Canevascini G.Canadian Journal of Microbiology(1991)37(6):459-464;Reese E.T.,Parrish F.W.and Ettlinger M.CarbohydrateResearch(1971)381-388.
·Chaveroche,MK.,Ghico,J-M.and d’Enfert C.A rapid method forefficient gene replacement in the filamentous fungus Aspergillus nidulans(2000);Nucleic acids Research,vol 28,no 22.
·Cong L,Ran FA,Cox D,Lin S,Barretto R,Habib N,Hsu PD,Wu X,Jiang W,Marraffini LA,Zhang F.Science.Multiplex genome engineering using CRISPR/Cassystems.2013 Feb 15;339(6121):819-23.doi:10.1126/science.1231143.Epub 2013Jan 3.
·Crook NC,Schmitz AC,Alper HS.Optimization of a yeast RNAinterference system for controlling gene expression and enabling rapidmetabolic engineering.ACS Synth Biol.2014 May 16;3(5):307-13.
·Devereux,J.,et al.,Nucleic Acids Research 12(1):387(1984).
·Derkx,PM and Madrid SM.The foldase CYPB is a component of thesecretory pathway of Aspergillus niger and contains the endoplasmic reticulumretention signal HEEL.Mol.Genet.Genomics.2001 Dec;266(4):537-545
·DiCarlo JE,Norville JE,Mali P,Rios X,Aach J,Church GM.Nucleic AcidsRes.2013 Apr;41(7):4336-43.Genome engineering in Saccharomyces cerevisiaeusing CRISPR-Cas systems.
·DiCarlo JE,Chavez A,Dietz SL,Esvelt KM,Church GM.SafeguardingCRISPR-Cas9 gene drives in yeast.Nat Biotechnol.2015 Dec;33(12):1250-1255.doi:10.1038/nbt.3412.
·Egholm M,Buchardt O,Christensen L,Behrens C,Freier SM,Driver DA,Berg RH,Kim SK,Norden B,Nielsen PE.,1993.Nature 365,566-568.
·Flagfeldt DB,Siewers V,Huang L,Nielsen J.Characterization ofchromosomal integration sites for heterologous gene expression inSaccharomyces cerevisiae.Yeast.2009 Oct;26(10):545-51.doi:10.1002/yea.1705.
·Gao F,Shen XZ,Jiang F,Wu Y,Han C.DNA-guided genome editing usingthe Natronobacterium gregoryi Argonaute.Nat Biotechnol.2016 Jul;34(7):768-73.doi:10.1038/nbt.3547.
·Gietz RD,Woods RA.Transformation of yeast by lithium acetate/single-stranded carrier DNA/polyethylene glycol method.Methods Enzymol.2002;350:87-96.
·Govindaraju and Kumar,2005.Chem.Commun,495–497.
·Gribskov M and Devereux J,eds.,Sequence Analysis Primer,M StocktonPress,New York,1991.
·Griffin HM and Griffin HG,eds.,Computer Analysis of Sequence Data,Part I,Humana Press,New Jersey,1994.
·Griffin HM and Griffin HG,eds.,Molecular Biology:CurrentInnovations and Future Trends.ISBN 1-898486-01-8;1995 Horizon ScientificPress,PO Box 1,Wymondham,Norfolk,U.K
·Gupta et al.(1968),Proc.Natl.Acad.Sci USA,60:1338-1344.
·Hawksworth DL et al.,In,Ainsworth and Bisby's Dictionary of TheFungi,8th edition,1995,CAB International,University Press,Cambridge,UK
·Herbert RB.The Biosynthesis of Secondary Metabolites,Chapman andHall,New York,1981.
·Ho SN,Hunt HD,Horton RM,Pullen JK,Pease LR“Site-directedmutagenesis by overlap extension using the polymerase chainreaction.Gene.1989 Apr 15;77(1):51-9.
·
Figure BDA0002764477840001101
TR,Park J,Arentshorst M,van Welzen AM,Lamers G,VankuykPA,Damveld RA,van den Hondel CA,Nielsen KF,Frisvad JC,Ram AF.Fungal GenetBiol.2011 May;48(5):544-53.The molecular and genetic basis of conidialpigmentation in Aspergillus niger.
·Kamath RS et al,(2003)Systematic functional analysis of theCaenorhabditis elegans genome using RNAi.Nature.Vol.421,231-237.
·Lesk A.M.ed.Computational Molecular Biology,Oxford UniversityPress,New York,1988.
·
Figure BDA0002764477840001102
M,Kristjuhan K,Kristjuhan A.Biotechniques.2011 May;50(5):325-8.Extraction of genomic DNA from yeasts for PCR-based applications.
·Mali P,Yang L,Esvelt KM,Aach J,Guell M,DiCarlo JE,Norville JE,Church GM.RNA-guided human genome engineering via Cas9.Science.2013 Feb 15;339(6121):823-6.doi:10.1126/science.1232033.Epub 2013 Jan 3.
·Maruyana et al.Nat Biotechnol.2015 May;33(5):538–542.
·Song et al.Nature communications|doi:10.1038/ncomms10548
·Yu et al.Cell Stem Cell.2015 February 5;16(2):142–147.
·Mattern,I.E.,van Noort J.M.,van den Berg,P.,Archer,D.B.,Roberts,I.N.and van den Hondel,C.A.,Isolation and characterization of mutants ofAspergillus niger deficient in extracellular proteases.Mol Gen Genet.1992Aug;234(2):332-6.
·Morita et al.2001.Nucleic Acid Res Supplement No.1:241-242.
·Mouyna I,Henry C,Doering TL,LatgéJP.Gene silencing with RNAinterference in the human pathogenic fungus Aspergillus fumigatus.FEMSMicrobiol Lett.2004 Aug 15;237(2):317-24.
·Nakamura Y,Gojobori T,Ikemura T.Codon usage tabulated frominternational DNA sequence databases:status for the year 2000.Nucleic AcidsRes.2000Jan 1;28(1):292.
·Needleman and Wunsch,J.Mol.Biol.48:443-453(1970).
·Ngiam C,Jeenes DJ,Punt PJ,Van Den Hondel CA,ArcherDB.Appl.Environ.Microbiol.2000 Feb;66(2):775-82.Characterization of afoldase,protein disulfide isomerase A,in the protein secretory pathway ofAspergillus niger.
·Nielsen et al.,1991.Science 254,1497-1500.
·Pel et al.Genome sequencing and analysis of the versatile cellfactory Aspergillus niger CBS 513.88.Nat Biotechnol.2007 Feb;25(2):221-231.
·Ramon de Lucas,J.,Martinez O,Perez P.,Isabel Lopez,M.,Valenciano,S.and Laborda,F.The Aspergillus nidulans carnitine carrier encoded by theacuH gene is exclusively located in the mitochondria.FEMS Microbiol Lett.2001Jul 24;201(2):193-8.
·Scarpulla et al.(1982),Anal.Biochem.121:356-365.
·Sikorski RS,Hieter P.Genetics.A system of shuttle vectors and yeasthost strains designed for efficient manipulation of DNA in Saccharomycescerevisiae.1989 May;122(1):19-27.
·Smith DW,ed.,Biocomputing:Informatics and Genome Projects,Smith,Academic Press,New York,1993.
·Stemmer et al.(1995),Gene 164:49-53.
·Tour O.et al,(2003)Nat.Biotech:Genetically targeted chromophore-assisted light inactivation.Vol.21.no.12:1505-1508.
·van Dijck et al,2003,Regulatory Toxicology and Pharmacology 28;27-35:On the safety of a new generation of DSM Aspergillus niger enzymeproduction strains.
·van Dijken JP,Bauer J,Brambilla L,Duboc P,Francois JM,Gancedo C,Giuseppin ML,Heijnen JJ,Hoare M,Lange HC,Madden EA,Niederberger P,Nielsen J,Parrou JL,Petit T,Porro D,Reuss M,van Riel N,Rizzi M,Steensma HY,Verrips CT,
Figure BDA0002764477840001121
J,Pronk JT.An interlaboratory comparison of physiological andgenetic properties of four Saccharomyces cerevisiae strains.Enzyme MicrobTechnol.2000 Jun 1;26(9-10):706-714.
·Vartak SV and Raghavan SC.Inhibition of nonhomologous end joiningto increase the specificity of CRISPR/Cas9 genome editing.FEBS J.2015Nov;282(22):4289-94.doi:10.1111/febs.13416.Epub 2015 Sep 9.
·von Heine G.Sequence Analysis in Molecular Biology,Academic Press,1987.
·Young and Dong,(2004),Nucleic Acids Research 32(7).
·Zrenner R,Willmitzer L,Sonnewald U.Analysis of the expression ofpotato uridinediphosphate-glucose pyrophosphorylase and its inhibition byantisense RNA.Planta.(1993);190(2):247-52.
·Zetsche et al.,Cpf1 is a single RNA-guided endonuclease of a class2 CRISPR-Cas system.Cell.2015 Oct 22;163(3):759-71.
序列表
<110> 帝斯曼知识产权资产管理有限公司
<120> CRISPR瞬时表达构建体(CTEC)
<130> 32805-WO-PCT
<150> 18171496.5
<151> 2018-05-09
<150> 18184210.5
<151> 2018-07-18
<160> 171
<170> PatentIn第3.5版
<210> 1
<211> 5441
<212> DNA
<213> 人工序列
<220>
<223> Cas9的核苷酸序列,所述核苷酸序列包含经密码子对优化以在酿酒酵母(Saccharomyces cerevisiae)中表达的C末端SV40核定位信号
<400> 1
ttttcttttt ttgcggtcac ccccatgtgg cggggaggca gaggagtagg tagagcaacg 60
aatcctacta tttatccaaa ttagtctagg aactcttttt ctagattttt tagatttgag 120
ggcaagcgct gttaacgact cagaaatgta agcactacgg agtagaacga gaaatccgcc 180
ataggtggaa atcctagcaa aatcttgctt accctagcta gcctcaggta agctagcctt 240
agcctgtcaa atttttttca aaatttggta agtttctact agcaaagcaa acacggttca 300
acaaaccgaa aactccactc attatacgtg gaaaccgaaa caaaaaaaca aaaaccaaaa 360
tactcgccaa tgagaaagtt gctgcgtttc tactttcgag gaagaggaac tgagaggatt 420
gactacgaaa ggggcaaaaa cgagtcgtat tctcccatta ttgtctgcta ccacgcggtc 480
tagtagaata agcaaccagt caacgctaag acaggtaatc aaaataccag tctgctggct 540
acgggctagt ttttacctct tttagaaccc actgtaaaag tccgttgtaa agcccgttct 600
cactgttggc gttttttttt ttttggttta gtttcttatt tttcattttt ttctttcatg 660
accaaaaaca aacaaatctc gcgatttgta ctgcggccac tggggcgtgg ccaaaaaaat 720
gacaaattta gaaaccttag tttctgattt ttcctgttat gaggagatat gataaaaaat 780
attactgctt tattgttttt tttttatcta ctgaaataga gaaacttacc caaggaggag 840
gcaaaaaaaa gagtatatat acagcagcta ccattcagat tttaatatat tcttttctct 900
tcttctacac tattattata ataattttac tatattcatt tttagcttaa aacctcatag 960
aatattattc ttcagtcact cgcttaaata cttatcaaaa atggacaaga aatactctat 1020
tggtttggat atcgggacca actccgtcgg ttgggctgtc atcaccgacg aatacaaggt 1080
tccatccaag aaattcaagg tcttgggtaa cactgacaga cactctatca agaagaattt 1140
gatcggtgct ttgttgttcg actccggtga aaccgctgaa gctaccagat tgaagcgtac 1200
cgctcgtcgt agatacacta gacgtaaaaa ccgtatttgt tacttgcaag aaatcttttc 1260
taacgaaatg gccaaggttg acgactcttt cttccacaga ttggaagaat ctttcttggt 1320
tgaagaagac aagaagcacg aaagacatcc aatcttcggt aacatcgttg acgaagttgc 1380
ttaccacgaa aaatacccta ccatctacca tttgagaaag aagttggtcg attccaccga 1440
caaggctgat ttgagattga tctatttggc cttggctcac atgatcaagt tcagaggtca 1500
cttcttgatt gaaggtgact tgaacccaga caactctgac gtcgacaaat tgttcatcca 1560
attggtccaa acctacaacc aattattcga ggaaaaccca attaacgctt ctggtgttga 1620
tgctaaggcc atcttatctg cccgtttgtc caagtctaga cgtttggaaa acttgattgc 1680
tcaattgcct ggtgaaaaga aaaacggttt gttcggtaac ttgatcgctt tgtccttggg 1740
tttgacccca aacttcaagt ccaacttcga cttggctgaa gatgccaagt tgcaattgtc 1800
caaggacacc tacgacgacg acttagacaa cttgttggct caaatcggtg accaatacgc 1860
cgacttgttc ttggctgcca aaaacttatc tgacgctatc ttgttgtctg acatcttgag 1920
agttaacact gaaattacca aggctccatt gtctgcttct atgatcaaaa gatacgacga 1980
acaccaccaa gatctgactt tgttgaaggc tttggttaga caacaattgc cagaaaagta 2040
caaggaaatc ttcttcgacc aatccaaaaa tggttacgcc ggttacattg acggtggtgc 2100
ttctcaggaa gaattctaca agttcatcaa gccaattttg gaaaagatgg atggtactga 2160
agaattattg gttaagttga acagagaaga cttattgaga aagcaacgta ccttcgataa 2220
cggttctatc ccacaccaaa tccacttggg tgaattgcac gccattttga gaagacagga 2280
agatttctat ccattcctaa aggacaacag agaaaagatc gaaaagatct taactttcag 2340
aatcccatac tacgtcggtc cattggccag aggtaattct agattcgctt ggatgaccag 2400
aaagtctgaa gaaaccatca ccccatggaa cttcgaagaa gtcgtcgaca agggtgcttc 2460
tgcccaatct ttcatcgaaa gaatgaccaa ctttgataag aacttgccaa acgagaaggt 2520
cttgccaaag cactctttgt tgtacgaata cttcaccgtc tacaacgaat taaccaaggt 2580
taaatacgtt actgaaggta tgagaaagcc agctttccta tccggtgaac aaaagaaggc 2640
tattgttgac ttgttgttta agaccaacag aaaggtcact gttaagcaat tgaaggaaga 2700
ctacttcaag aagattgaat gtttcgattc cgtcgaaatc tccggtgttg aagaccgttt 2760
caatgcttct ttgggcacct accacgattt gttaaagatc atcaaggaca aggacttttt 2820
agataacgaa gaaaacgaag acatcttgga agatatcgtt ttgaccttga ctcttttcga 2880
ggacagagaa atgattgaag agagattgaa gacctacgct cacttgttcg acgataaagt 2940
tatgaagcaa ctaaagagaa gaagatacac tggttggggt agattgtcca gaaagttgat 3000
taacggtatc agagacaagc aatccggtaa gactatttta gactttttga aatccgatgg 3060
tttcgctaac agaaacttta tgcaattgat tcacgacgat tctttgactt tcaaggaaga 3120
cattcaaaaa gcccaagtct ctggtcaagg tgattctttg cacgaacaca tcgctaactt 3180
ggctggttct ccagctatta agaagggtat cttacaaacc gtcaaggtcg ttgatgaatt 3240
ggtcaaagtc atgggtagac acaagccaga aaatattgtc atcgaaatgg ctagagaaaa 3300
ccaaactact caaaagggtc aaaagaactc tagagaacgt atgaagagaa ttgaagaagg 3360
tatcaaggag ttgggttctc aaattttgaa agaacaccca gtcgaaaaca ctcaattaca 3420
aaacgaaaag ctatacttgt actacttgca aaacggtcgt gacatgtacg tcgaccaaga 3480
attggatatc aacagattgt ctgactacga tgtcgatcat atcgtcccac aatcgttctt 3540
gaaggacgat tccattgaca acaaagtttt gactagatct gacaagaaca gaggtaagtc 3600
tgataacgtt ccatctgaag aagttgttaa gaagatgaag aactactgga gacaattgtt 3660
gaatgctaag ttgatcactc aaagaaagtt cgacaacttg accaaggctg aaagaggtgg 3720
tttgtccgaa ttggacaaag ccggtttcat caagagacaa ttagtcgaaa ctagacaaat 3780
caccaagcat gttgctcaaa tcttggattc cagaatgaac actaagtacg atgaaaacga 3840
caaactaatt agagaagtta aggtcatcac tttgaagtct aagttggttt ctgacttcag 3900
aaaggacttc caattttaca aggtcagaga aatcaacaac taccatcacg ctcacgatgc 3960
ctacttgaac gctgttgtcg gtactgcctt aatcaaaaag tacccaaagt tggaatctga 4020
attcgtttac ggtgactaca aggtttacga tgttagaaag atgatcgcca agtctgaaca 4080
agaaattggt aaggccactg ctaagtactt cttctactct aacatcatga actttttcaa 4140
gactgaaatc actttagcta acggtgaaat tagaaagcgt ccattgattg aaaccaatgg 4200
tgaaactggt gaaattgtct gggacaaggg tagagatttc gctaccgtca gaaaggtttt 4260
gtctatgcca caagttaaca tcgtcaagaa gactgaagtt caaactggtg gtttctctaa 4320
ggaatccatt ttgccaaaga gaaactctga caagttgatt gctagaaaga aggactggga 4380
tcctaagaag tacggtggtt tcgactctcc aactgttgct tactccgttt tggtcgttgc 4440
taaggttgaa aagggtaagt ctaagaagtt gaagtctgtt aaggaattgt tgggtatcac 4500
catcatggaa agatcctcct tcgaaaagaa cccaatcgac tttttggaag ctaagggtta 4560
caaggaagtc aagaaggatt tgatcattaa gttaccaaaa tactccttgt tcgaattgga 4620
aaacggtaga aagagaatgt tggcctccgc tggtgaacta caaaaaggta acgaattggc 4680
tttaccatct aagtacgtta acttcttgta cttggcttcc cactacgaaa agttgaaagg 4740
ttccccagaa gacaacgaac aaaagcaatt gtttgttgaa caacacaagc actacttgga 4800
tgaaattatt gaacaaatct ccgaattctc caagagagtc attttggctg atgctaactt 4860
agataaggtt ttatccgctt acaacaagca cagagacaaa ccaatcagag aacaagctga 4920
aaacatcatt catttgttca ctttaaccaa cttgggtgct ccagctgctt tcaaatactt 4980
cgacactacc attgacagaa agagatacac ttccaccaaa gaagttttag atgctacttt 5040
gattcaccaa tctattaccg gtttgtacga aaccagaatt gacttgtctc aattgggtgg 5100
tgattccaga gctgatccaa agaagaagag aaaggtgtaa aggagttaaa ggcaaagttt 5160
tcttttctag agccgttccc acaaataatt atacgtatat gcttcttttc gtttactata 5220
tatctatatt tacaagcctt tattcactga tgcaatttgt ttccaaatac ttttttggag 5280
atctcataac tagatatcat gatggcgcaa cttggcgcta tcttaattac tctggctgcc 5340
aggcccgtgt agagggccgc aagaccttct gtacgccata tagtctctaa gaacttgaac 5400
aagtttctag acctattgcc gcctttcgga tcgctattgt t 5441
<210> 2
<211> 11742
<212> DNA
<213> 人工序列
<220>
<223> 载体pCSN061的核苷酸序列
<400> 2
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accataaacg acattactat atatataata taggaagcat ttaatagaca gcatcgtaat 240
atatgtgtac tttgcagtta tgacgccaga tggcagtagt ggaagatatt ctttattgaa 300
aaatagcttg tcaccttacg tacaatcttg atccggagct tttctttttt tgccgattaa 360
gaattaattc ggtcgaaaaa agaaaaggag agggccaaga gggagggcat tggtgactat 420
tgagcacgtg agtatacgtg attaagcaca caaaggcagc ttggagtatg tctgttatta 480
atttcacagg tagttctggt ccattggtga aagtttgcgg cttgcagagc acagaggccg 540
cagaatgtgc tctagattcc gatgctgact tgctgggtat tatatgtgtg cccaatagaa 600
agagaacaat tgacccggtt attgcaagga aaatttcaag tcttgtaaaa gcatataaaa 660
atagttcagg cactccgaaa tacttggttg gcgtgtttcg taatcaacct aaggaggatg 720
ttttggctct ggtcaatgat tacggcattg atatcgtcca actgcatgga gatgagtcgt 780
ggcaagaata ccaagagttc ctcggtttgc cagttattaa aagactcgta tttccaaaag 840
actgcaacat actactcagt gcagcttcac agaaacctca ttcgtttatt cccttgtttg 900
attcagaagc aggtgggaca ggtgaacttt tggattggaa ctcgatttct gactgggttg 960
gaaggcaaga gagccccgaa agcttacatt ttatgttagc tggtggactg acgccagaaa 1020
atgttggtga tgcgcttaga ttaaatggcg ttattggtgt tgatgtaagc ggaggtgtgg 1080
agacaaatgg tgtaaaagac tctaacaaaa tagcaaattt cgtcaaaaat gctaagaaat 1140
aggttattac tgagtagtat ttatttaagt attgtttgtg cacttgccta tgcggtgtga 1200
aataccgcac agatgcgtaa ggagaaaata ccgcatcagg aaattgtaaa cgttaatatt 1260
ttgttaaaat tcgcgttaaa tttttgttaa atcagctcat tttttaacca ataggccgaa 1320
atcggcaaaa tcccttataa atcaaaagaa tagaccgaga tagggttgag tgttgttcca 1380
gtttggaaca agagtccact attaaagaac gtggactcca acgtcaaagg gcgaaaaacc 1440
gtctatcagg gcgatggccc actacgtgaa ccatcaccct aatcaagttt tttggggtcg 1500
aggtgccgta aagcactaaa tcggaaccct aaagggagcc cccgatttag agcttgacgg 1560
ggaaagccgg cgaacgtggc gagaaaggaa gggaagaaag cgaaaggagc gggcgctagg 1620
gcgctggcaa gtgtagcggt cacgctgcgc gtaaccacca cacccgccgc gcttaatgcg 1680
ccgctacagg gcgcgtcgcg ccattcgcca ttcaggctgc gcaactgttg ggaagggcga 1740
tcggtgcggg cctcttcgct attacgccag ctggcgaaag ggggatgtgc tgcaaggcga 1800
ttaagttggg taacgccagg gttttcccag tcacgacgtt gtaaaacgac ggccagtgag 1860
cgcgcgtaat acgactcact atagggcgaa ttgggtacct tttctttttt tgcggtcacc 1920
cccatgtggc ggggaggcag aggagtaggt agagcaacga atcctactat ttatccaaat 1980
tagtctagga actctttttc tagatttttt agatttgagg gcaagcgctg ttaacgactc 2040
agaaatgtaa gcactacgga gtagaacgag aaatccgcca taggtggaaa tcctagcaaa 2100
atcttgctta ccctagctag cctcaggtaa gctagcctta gcctgtcaaa tttttttcaa 2160
aatttggtaa gtttctacta gcaaagcaaa cacggttcaa caaaccgaaa actccactca 2220
ttatacgtgg aaaccgaaac aaaaaaacaa aaaccaaaat actcgccaat gagaaagttg 2280
ctgcgtttct actttcgagg aagaggaact gagaggattg actacgaaag gggcaaaaac 2340
gagtcgtatt ctcccattat tgtctgctac cacgcggtct agtagaataa gcaaccagtc 2400
aacgctaaga caggtaatca aaataccagt ctgctggcta cgggctagtt tttacctctt 2460
ttagaaccca ctgtaaaagt ccgttgtaaa gcccgttctc actgttggcg tttttttttt 2520
tttggtttag tttcttattt ttcatttttt tctttcatga ccaaaaacaa acaaatctcg 2580
cgatttgtac tgcggccact ggggcgtggc caaaaaaatg acaaatttag aaaccttagt 2640
ttctgatttt tcctgttatg aggagatatg ataaaaaata ttactgcttt attgtttttt 2700
ttttatctac tgaaatagag aaacttaccc aaggaggagg caaaaaaaag agtatatata 2760
cagcagctac cattcagatt ttaatatatt cttttctctt cttctacact attattataa 2820
taattttact atattcattt ttagcttaaa acctcataga atattattct tcagtcactc 2880
gcttaaatac ttatcaaaaa tggacaagaa atactctatt ggtttggata tcgggaccaa 2940
ctccgtcggt tgggctgtca tcaccgacga atacaaggtt ccatccaaga aattcaaggt 3000
cttgggtaac actgacagac actctatcaa gaagaatttg atcggtgctt tgttgttcga 3060
ctccggtgaa accgctgaag ctaccagatt gaagcgtacc gctcgtcgta gatacactag 3120
acgtaaaaac cgtatttgtt acttgcaaga aatcttttct aacgaaatgg ccaaggttga 3180
cgactctttc ttccacagat tggaagaatc tttcttggtt gaagaagaca agaagcacga 3240
aagacatcca atcttcggta acatcgttga cgaagttgct taccacgaaa aataccctac 3300
catctaccat ttgagaaaga agttggtcga ttccaccgac aaggctgatt tgagattgat 3360
ctatttggcc ttggctcaca tgatcaagtt cagaggtcac ttcttgattg aaggtgactt 3420
gaacccagac aactctgacg tcgacaaatt gttcatccaa ttggtccaaa cctacaacca 3480
attattcgag gaaaacccaa ttaacgcttc tggtgttgat gctaaggcca tcttatctgc 3540
ccgtttgtcc aagtctagac gtttggaaaa cttgattgct caattgcctg gtgaaaagaa 3600
aaacggtttg ttcggtaact tgatcgcttt gtccttgggt ttgaccccaa acttcaagtc 3660
caacttcgac ttggctgaag atgccaagtt gcaattgtcc aaggacacct acgacgacga 3720
cttagacaac ttgttggctc aaatcggtga ccaatacgcc gacttgttct tggctgccaa 3780
aaacttatct gacgctatct tgttgtctga catcttgaga gttaacactg aaattaccaa 3840
ggctccattg tctgcttcta tgatcaaaag atacgacgaa caccaccaag atctgacttt 3900
gttgaaggct ttggttagac aacaattgcc agaaaagtac aaggaaatct tcttcgacca 3960
atccaaaaat ggttacgccg gttacattga cggtggtgct tctcaggaag aattctacaa 4020
gttcatcaag ccaattttgg aaaagatgga tggtactgaa gaattattgg ttaagttgaa 4080
cagagaagac ttattgagaa agcaacgtac cttcgataac ggttctatcc cacaccaaat 4140
ccacttgggt gaattgcacg ccattttgag aagacaggaa gatttctatc cattcctaaa 4200
ggacaacaga gaaaagatcg aaaagatctt aactttcaga atcccatact acgtcggtcc 4260
attggccaga ggtaattcta gattcgcttg gatgaccaga aagtctgaag aaaccatcac 4320
cccatggaac ttcgaagaag tcgtcgacaa gggtgcttct gcccaatctt tcatcgaaag 4380
aatgaccaac tttgataaga acttgccaaa cgagaaggtc ttgccaaagc actctttgtt 4440
gtacgaatac ttcaccgtct acaacgaatt aaccaaggtt aaatacgtta ctgaaggtat 4500
gagaaagcca gctttcctat ccggtgaaca aaagaaggct attgttgact tgttgtttaa 4560
gaccaacaga aaggtcactg ttaagcaatt gaaggaagac tacttcaaga agattgaatg 4620
tttcgattcc gtcgaaatct ccggtgttga agaccgtttc aatgcttctt tgggcaccta 4680
ccacgatttg ttaaagatca tcaaggacaa ggacttttta gataacgaag aaaacgaaga 4740
catcttggaa gatatcgttt tgaccttgac tcttttcgag gacagagaaa tgattgaaga 4800
gagattgaag acctacgctc acttgttcga cgataaagtt atgaagcaac taaagagaag 4860
aagatacact ggttggggta gattgtccag aaagttgatt aacggtatca gagacaagca 4920
atccggtaag actattttag actttttgaa atccgatggt ttcgctaaca gaaactttat 4980
gcaattgatt cacgacgatt ctttgacttt caaggaagac attcaaaaag cccaagtctc 5040
tggtcaaggt gattctttgc acgaacacat cgctaacttg gctggttctc cagctattaa 5100
gaagggtatc ttacaaaccg tcaaggtcgt tgatgaattg gtcaaagtca tgggtagaca 5160
caagccagaa aatattgtca tcgaaatggc tagagaaaac caaactactc aaaagggtca 5220
aaagaactct agagaacgta tgaagagaat tgaagaaggt atcaaggagt tgggttctca 5280
aattttgaaa gaacacccag tcgaaaacac tcaattacaa aacgaaaagc tatacttgta 5340
ctacttgcaa aacggtcgtg acatgtacgt cgaccaagaa ttggatatca acagattgtc 5400
tgactacgat gtcgatcata tcgtcccaca atcgttcttg aaggacgatt ccattgacaa 5460
caaagttttg actagatctg acaagaacag aggtaagtct gataacgttc catctgaaga 5520
agttgttaag aagatgaaga actactggag acaattgttg aatgctaagt tgatcactca 5580
aagaaagttc gacaacttga ccaaggctga aagaggtggt ttgtccgaat tggacaaagc 5640
cggtttcatc aagagacaat tagtcgaaac tagacaaatc accaagcatg ttgctcaaat 5700
cttggattcc agaatgaaca ctaagtacga tgaaaacgac aaactaatta gagaagttaa 5760
ggtcatcact ttgaagtcta agttggtttc tgacttcaga aaggacttcc aattttacaa 5820
ggtcagagaa atcaacaact accatcacgc tcacgatgcc tacttgaacg ctgttgtcgg 5880
tactgcctta atcaaaaagt acccaaagtt ggaatctgaa ttcgtttacg gtgactacaa 5940
ggtttacgat gttagaaaga tgatcgccaa gtctgaacaa gaaattggta aggccactgc 6000
taagtacttc ttctactcta acatcatgaa ctttttcaag actgaaatca ctttagctaa 6060
cggtgaaatt agaaagcgtc cattgattga aaccaatggt gaaactggtg aaattgtctg 6120
ggacaagggt agagatttcg ctaccgtcag aaaggttttg tctatgccac aagttaacat 6180
cgtcaagaag actgaagttc aaactggtgg tttctctaag gaatccattt tgccaaagag 6240
aaactctgac aagttgattg ctagaaagaa ggactgggat cctaagaagt acggtggttt 6300
cgactctcca actgttgctt actccgtttt ggtcgttgct aaggttgaaa agggtaagtc 6360
taagaagttg aagtctgtta aggaattgtt gggtatcacc atcatggaaa gatcctcctt 6420
cgaaaagaac ccaatcgact ttttggaagc taagggttac aaggaagtca agaaggattt 6480
gatcattaag ttaccaaaat actccttgtt cgaattggaa aacggtagaa agagaatgtt 6540
ggcctccgct ggtgaactac aaaaaggtaa cgaattggct ttaccatcta agtacgttaa 6600
cttcttgtac ttggcttccc actacgaaaa gttgaaaggt tccccagaag acaacgaaca 6660
aaagcaattg tttgttgaac aacacaagca ctacttggat gaaattattg aacaaatctc 6720
cgaattctcc aagagagtca ttttggctga tgctaactta gataaggttt tatccgctta 6780
caacaagcac agagacaaac caatcagaga acaagctgaa aacatcattc atttgttcac 6840
tttaaccaac ttgggtgctc cagctgcttt caaatacttc gacactacca ttgacagaaa 6900
gagatacact tccaccaaag aagttttaga tgctactttg attcaccaat ctattaccgg 6960
tttgtacgaa accagaattg acttgtctca attgggtggt gattccagag ctgatccaaa 7020
gaagaagaga aaggtgtaaa ggagttaaag gcaaagtttt cttttctaga gccgttccca 7080
caaataatta tacgtatatg cttcttttcg tttactatat atctatattt acaagccttt 7140
attcactgat gcaatttgtt tccaaatact tttttggaga tctcataact agatatcatg 7200
atggcgcaac ttggcgctat cttaattact ctggctgcca ggcccgtgta gagggccgca 7260
agaccttctg tacgccatat agtctctaag aacttgaaca agtttctaga cctattgccg 7320
cctttcggat cgctattgtt gcggccgcca gctgaagctt cgtacgctgc aggtcgacga 7380
attctaccgt tcgtataatg tatgctatac gaagttatag atctgtttag cttgcctcgt 7440
ccccgccggg tcacccggcc agcgacatgg aggcccagaa taccctcctt gacagtcttg 7500
acgtgcgcag ctcaggggca tgatgtgact gtcgcccgta catttagccc atacatcccc 7560
atgtataatc atttgcatcc atacattttg atggccgcac ggcgcgaagc aaaaattacg 7620
gctcctcgct gcagacctgc gagcagggaa acgctcccct cacagacgcg ttgaattgtc 7680
cccacgccgc gcccctgtag agaaatataa aaggttagga tttgccactg aggttcttct 7740
ttcatatact tccttttaaa atcttgctag gatacagttc tcacatcaca tccgaacata 7800
aacaaccatg ggtaaggaaa agactcacgt ttcgaggccg cgattaaatt ccaacatgga 7860
tgctgattta tatgggtata aatgggctcg cgataatgtc gggcaatcag gtgcgacaat 7920
ctatcgattg tatgggaagc ccgatgcgcc agagttgttt ctgaaacatg gcaaaggtag 7980
cgttgccaat gatgttacag atgagatggt cagactaaac tggctgacgg aatttatgcc 8040
tcttccgacc atcaagcatt ttatccgtac tcctgatgat gcatggttac tcaccactgc 8100
gatccccggc aaaacagcat tccaggtatt agaagaatat cctgattcag gtgaaaatat 8160
tgttgatgcg ctggcagtgt tcctgcgccg gttgcattcg attcctgttt gtaattgtcc 8220
ttttaacagc gatcgcgtat ttcgtctcgc tcaggcgcaa tcacgaatga ataacggttt 8280
ggttgatgcg agtgattttg atgacgagcg taatggctgg cctgttgaac aagtctggaa 8340
agaaatgcat aagcttttgc cattctcacc ggattcagtc gtcactcatg gtgatttctc 8400
acttgataac cttatttttg acgaggggaa attaataggt tgtattgatg ttggacgagt 8460
cggaatcgca gaccgatacc aggatcttgc catcctatgg aactgcctcg gtgagttttc 8520
tccttcatta cagaaacggc tttttcaaaa atatggtatt gataatcctg atatgaataa 8580
attgcagttt catttgatgc tcgatgagtt tttctaatca gtactgacaa taaaaagatt 8640
cttgttttca agaacttgtc atttgtatag tttttttata ttgtagttgt tctattttaa 8700
tcaaatgtta gcgtgattta tatttttttt cgcctcgaca tcatctgccc agatgcgaag 8760
ttaagtgcgc agaaagtaat atcatgcgtc aatcgtatgt gaatgctggt cgctatactg 8820
ctgtcgattc gatactaacg ccgccatcca gtgtcgaaaa cgagctcata acttcgtata 8880
atgtatgcta tacgaacggt agaattcgaa tcagatccac tagtggccta tgcggccgcc 8940
accgcggtgg agctccagct tttgttccct ttagtgaggg ttaattgcgc gcttggcgta 9000
atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc cacacaacat 9060
aggagccgga agcataaagt gtaaagcctg gggtgcctaa tgagtgaggt aactcacatt 9120
aattgcgttg cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc agctgcatta 9180
atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt ccgcttcctc 9240
gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa 9300
ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa 9360
aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct 9420
ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac 9480
aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc 9540
gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg tggcgctttc 9600
tcatagctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg 9660
tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga 9720
gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta acaggattag 9780
cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta actacggcta 9840
cactagaagg acagtatttg gtatctgcgc tctgctgaag ccagttacct tcggaaaaag 9900
agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt tttttgtttg 9960
caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga tcttttctac 10020
ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca tgagattatc 10080
aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat caatctaaag 10140
tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg cacctatctc 10200
agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt agataactac 10260
gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag acccacgctc 10320
accggctcca gatttatcag caataaacca gccagccgga agggccgagc gcagaagtgg 10380
tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag ctagagtaag 10440
tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctacaggca tcgtggtgtc 10500
acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa ggcgagttac 10560
atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga tcgttgtcag 10620
aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata attctcttac 10680
tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca agtcattctg 10740
agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaatacggg ataataccgc 10800
gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg ggcgaaaact 10860
ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg cacccaactg 10920
atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag gaaggcaaaa 10980
tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac tcttcctttt 11040
tcaatattat tgaagcattt atcagggtta ttgtctcatg agcggataca tatttgaatg 11100
tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag tgccacctgg 11160
gtccttttca tcacgtgcta taaaaataat tataatttaa attttttaat ataaatatat 11220
aaattaaaaa tagaaagtaa aaaaagaaat taaagaaaaa atagtttttg ttttccgaag 11280
atgtaaaaga ctctaggggg atcgccaaca aatactacct tttatcttgc tcttcctgct 11340
ctcaggtatt aatgccgaat tgtttcatct tgtctgtgta gaagaccaca cacgaaaatc 11400
ctgtgatttt acattttact tatcgttaat cgaatgtata tctatttaat ctgcttttct 11460
tgtctaataa atatatatgt aaagtacgct ttttgttgaa attttttaaa cctttgttta 11520
tttttttttc ttcattccgt aactcttcta ccttctttat ttactttcta aaatccaaat 11580
acaaaacata aaaataaata aacacagagt aaattcccaa attattccat cattaaaaga 11640
tacgaggcgc gtgtaagtta caggcaagcg atccgtccta agaaaccatt attatcatga 11700
cattaaccta taaaaatagg cgtatcacga ggccctttcg tc 11742
<210> 3
<211> 5712
<212> DNA
<213> 人工序列
<220>
<223> 载体pRN1120的核苷酸序列
<400> 3
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accatatcga ctacgtcgta aggccgtttc tgacagagta aaattcttga gggaactttc 240
accattatgg gaaatggttc aagaaggtat tgacttaaac tccatcaaat ggtcaggtca 300
ttgagtgttt tttatttgtt gtattttttt ttttttagag aaaatcctcc aatatcaaat 360
taggaatcgt agtttcatga ttttctgtta cacctaactt tttgtgtggt gccctcctcc 420
ttgtcaatat taatgttaaa gtgcaattct ttttccttat cacgttgagc cattagtatc 480
aatttgctta cctgtattcc tttactatcc tcctttttct ccttcttgat aaatgtatgt 540
agattgcgta tatagtttcg tctaccctat gaacatattc cattttgtaa tttcgtgtcg 600
tttctattat gaatttcatt tataaagttt atgtacacct aggatccgtc gacactggat 660
ggcggcgtta gtatcgaatc gacagcagta tagcgaccag cattcacata cgattgacgc 720
atgatattac tttctgcgca cttaacttcg catctgggca gatgatgtcg aggcgaaaaa 780
aaatataaat cacgctaaca tttgattaaa atagaacaac tacaatataa aaaaactata 840
caaatgacaa gttcttgaaa acaagaatct ttttattgtc agtactaggg gcagggcatg 900
ctcatgtaga gcgcctgctc gccgtccgag gcggtgccgt cgtacagggc ggtgtccagg 960
ccgcagaggg tgaaccccat ccgccggtac gcgtggatcg ccggtgcgtt gacgttggtg 1020
acctccagcc agaggtgccc ggcgccccgc tcgcgggcga actccgtcgc gagccccatc 1080
aacgcgcgcc cgaccccgtg cccccggtgc tccggggcga cctcgatgtc ctcgacggtc 1140
agccggcggt tccagccgga gtacgagacg accacgaagc ccgccaggtc gccgtcgtcc 1200
ccgtacgcga cgaacgtccg ggagtccggg tcgccgtcct ccccggcgtc cgattcgtcg 1260
tccgattcgt cgtcggggaa caccttggtc aggggcgggt ccaccggcac ctcccgcagg 1320
gtgaagccgt ccccggtggc ggtgacgcgg aagacggtgt cggtggtgaa ggacccatcc 1380
agtgcctcga tggcctcggc gtcccccggg acactggtgc ggtaccggta agccgtgtcg 1440
tcaagagtgg tcattttaca tggttgttta tgttcggatg tgatgtgaga actgtatcct 1500
agcaagattt taaaaggaag tatatgaaag aagaacctca gtggcaaatc ctaacctttt 1560
atatttctct acaggggcgc ggcgtgggga caattcaacg cgtctgtgag gggagcgttt 1620
ccctgctcgc aggtctgcag cgaggagccg taatttttgc ttcgcgccgt gcggccatca 1680
aaatgtatgg atgcaaatga ttatacatgg ggatgtatgg gctaaatgta cgggcgacag 1740
tcacatcatg cccctgagct gcgcacgtca agactgtcaa ggagggtatt ctgggcctcc 1800
atgtcgctgg ccgggtgacc cggcggggac gaggccttaa gttcgaacgt acgagctccg 1860
gcattgcgaa taccgctttc cacaaacatt gctcaaaagt atctctttgc tatatatctc 1920
tgtgctatat ccctatataa cctacccatc cacctttcgc tccttgaact tgcatctaaa 1980
ctcgacctct acatttttta tgtttatctc tagtattact ctttagacaa aaaaattgta 2040
gtaagaacta ttcatagagt gaatcgaaaa caatacgaaa atgtaaacat ttcctatacg 2100
tagtatatag agacaaaata gaagaaaccg ttcataattt tctgaccaat gaagaatcat 2160
caacgctatc actttctgtt cacaaagtat gcgcaatcca catcggtata gaatataatc 2220
ggggatgcct ttatcttgaa aaaatgcacc cgcagcttcg ctagtaatca gtaaacgcgg 2280
gaagtggagt caggcttttt ttatggaaga gaaaatagac accaaagtag ccttcttcta 2340
accttaacgg acctacagtg caaaaagtta tcaagagact gcattataga gcgcacaaag 2400
gagaaaaaaa gtaatctaag atgctttgtt agaaaaatag cgctctcggg atgcattttt 2460
gtagaacaaa aaagaagtat agattctttg ttggtaaaat agcgctctcg cgttgcattt 2520
ctgttctgta aaaatgcagc tcagattctt tgtttgaaaa attagcgctc tcgcgttgca 2580
tttttgtttt acaaaaatga agcacagatt cttcgttggt aaaatagcgc tttcgcgttg 2640
catttctgtt ctgtaaaaat gcagctcaga ttctttgttt gaaaaattag cgctctcgcg 2700
ttgcattttt gttctacaaa atgaagcaca gatgcttcgt taacaaagat atgctattga 2760
agtgcaagat ggaaacgcag aaaatgaacc ggggatgcga cgtgcaagat tacctatgca 2820
atagatgcaa tagtttctcc aggaaccgaa atacatacat tgtcttccgt aaagcgctag 2880
actatatatt attatacagg ttcaaatata ctatctgttt cagggaaaac tcccaggttc 2940
ggatgttcaa aattcaatga tgggtaacaa gtacgatcgt aaatctgtaa aacagtttgt 3000
cggatattag gctgtatctc ctcaaagcgt attcgaatat cattgagaag ctgcagcgtc 3060
acatcggata ataatgatgg cagccattgt agaagtgcct tttgcatttc tagtctcttt 3120
ctcggtctag ctagttttac tacatcgcga agatagaatc ttagatcaca ctgcctttgc 3180
tgagctggat caatagagta acaaaagagt ggtaaggcct cgttaaagga caaggacctg 3240
agcggaagtg tatcgtacag tagacggagt atactaggta tagtctatag tccgtggaat 3300
taattctcat gtttgacagc ttatcatcga taatccggag ctagcatgcg gccgctctag 3360
aactagtgga tcccccgggc tgcaggaatt cgatatcaag cttatcgata ccgtcgacct 3420
cgaggggggg cccggtaccc agcttttgtt ccctttagtg agggttaatt ccgagcttgg 3480
cgtaatcatg gtcatagctg tttcctgtgt gaaattgtta tccgctcaca attccacaca 3540
acataggagc cggaagcata aagtgtaaag cctggggtgc ctaatgagtg aggtaactca 3600
cattaattgc gttgcgctca ctgcccgctt tccagtcggg aaacctgtcg tgccagctgc 3660
attaatgaat cggccaacgc gcggggagag gcggtttgcg tattgggcgc tcttccgctt 3720
cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta tcagctcact 3780
caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag aacatgtgag 3840
caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg tttttccata 3900
ggctcggccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg tggcgaaacc 3960
cgacaggact ataaagatac caggcgttcc cccctggaag ctccctcgtg cgctctcctg 4020
ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga agcgtggcgc 4080
tttctcaatg ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc tccaagctgg 4140
gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt aactatcgtc 4200
ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact ggtaacagga 4260
ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg cctaactacg 4320
gctacactag aaggacagta tttggtatct gcgctctgct gaagccagtt accttcggaa 4380
aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt ggtttttttg 4440
tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct ttgatctttt 4500
ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg gtcatgagat 4560
tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt aaatcaatct 4620
aaagtatata tgagtaaact tggtctgaca gttaccaatg cttaatcagt gaggcaccta 4680
tctcagcgat ctgtctattt cgttcatcca tagttgcctg actgcccgtc gtgtagataa 4740
ctacgatacg ggagggctta ccatctggcc ccagtgctgc aatgataccg cgagacccac 4800
gctcaccggc tccagattta tcagcaataa accagccagc cggaagggcc gagcgcagaa 4860
gtggtcctgc aactttatcc gcctccatcc agtctattaa ttgttgccgg gaagctagag 4920
taagtagttc gccagttaat agtttgcgca acgttgttgc cattgctaca ggcatcgtgg 4980
tgtcacgctc gtcgtttggt atggcttcat tcagctccgg ttcccaacga tcaaggcgag 5040
ttacatgatc ccccatgttg tgaaaaaaag cggttagctc cttcggtcct ccgatcgttg 5100
tcagaagtaa gttggccgca gtgttatcac tcatggttat ggcagcactg cataattctc 5160
ttactgtcat gccatccgta agatgctttt ctgtgactgg tgagtactca accaagtcat 5220
tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata cgggataata 5280
ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa 5340
aactctcaag gatcttaccg ctgttgagat ccagttcgat gtaacccact cgtgcaccca 5400
actgatcttc agcatctttt actttcacca gcgtttctgg gtgagcaaaa acaggaaggc 5460
aaaatgccgc aaaaaaggga ataagggcga cacggaaatg ttgaatactc atactcttcc 5520
tttttcaata ttattgaagc atttatcagg gttattgtct catgagcgga tacatatttg 5580
aatgtattta gaaaaataaa caaatagggg ttccgcgcac atttccccga aaagtgccac 5640
ctgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg cgtatcacga 5700
ggccctttcg tc 5712
<210> 4
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> 用于获得Pthd3-YFP-TenoI表达盒的正向引物的核苷酸序列
<400> 4
gtgcttagtc aaaaaattag ccttttaatt c 31
<210> 5
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 用于获得Pthd3-YFP-TenoI表达盒的反向引物的核苷酸序列
<400> 5
gaggggagga aatgagaaat gag 23
<210> 6
<211> 72
<212> DNA
<213> 人工序列
<220>
<223> 用于将连接物5附接至Pthd3-YFP-TenoI表达盒的正向引物的核苷酸序列
<400> 6
aagcgacttc caatcgcttt gcatatccag taccacaccc acaggcgttt gtgcttagtc 60
aaaaaattag cc 72
<210> 7
<211> 73
<212> DNA
<213> 人工序列
<220>
<223> 用于将连接物3附接至Pthd3-YFP-TenoI表达盒的反向引物的核苷酸序列
<400> 7
acttagtatg gtctgttgga aaggattgtg gcttcgcata caggctttct gaggggagga 60
aatgagaaat gag 73
<210> 8
<211> 1730
<212> DNA
<213> 人工序列
<220>
<223> 侧接有连接物5(CON5)和连接物3(CON3)的Pthd3-YFP-TenoI表达盒的核苷酸序列;
CON5-Pthd3-YFP-TenoI-CON3
<400> 8
aagcgacttc caatcgcttt gcatatccag taccacaccc acaggcgttt gtgcttagtc 60
aaaaaattag ccttttaatt ctgctgtaac ccgtacatgc ccaaaatagg gggcgggtta 120
cacagaatat ataacatcgt aggtgtctgg gtgaacagtt tattcctggc atccactaaa 180
tataatggag cccgcttttt aagctggcat ccagaaaaaa aaagaatccc agcaccaaaa 240
tattgttttc ttcaccaacc atcagttcat aggtccattc tcttagcgca actacagaga 300
acaggggcac aaacaggcaa aaaacgggca caacctcaat ggagtgatgc aacctgcctg 360
gagtaaatga tgacacaagg caattgaccc acgcatgtat ctatctcatt ttcttacacc 420
ttctattacc ttctgctctc tctgatttgg aaaaagctga aaaaaaaggt tgaaaccagt 480
tccctgaaat tattccccta cttgactaat aagtatataa agacggtagg tattgattgt 540
aattctgtaa atctatttct taaacttctt aaattctact tttatagtta gtcttttttt 600
tagttttaaa acaccaagaa cttagtttcg aataaacaca cataaacaaa caaaatgtct 660
aaaggtgaag aattattcac tggtgttgtc ccaattttgg ttgaattaga tggtgatgtt 720
aatggtcaca aattttctgt ctccggtgaa ggtgaaggtg atgctactta cggtaaattg 780
accttaaaat tgatttgtac tactggtaaa ttgccagttc catggccaac cttagtcact 840
actttaggtt atggtttgca atgttttgct agatacccag atcatatgaa acaacatgac 900
tttttcaagt ctgccatgcc agaaggttat gttcaagaaa gaactatttt tttcaaagat 960
gacggtaact acaagaccag agctgaagtc aagtttgaag gtgatacctt agttaataga 1020
atcgaattaa aaggtattga ttttaaagaa gatggtaaca ttttaggtca caaattggaa 1080
tacaactata actctcacaa tgtttacatc actgctgaca aacaaaagaa tggtatcaaa 1140
gctaacttca aaattagaca caacattgaa gatggtggtg ttcaattagc tgaccattat 1200
caacaaaata ctccaattgg tgatggtcca gtcttgttac cagacaacca ttacttatcc 1260
tatcaatctg ccttatccaa agatccaaac gaaaagagag atcacatggt cttgttagaa 1320
tttgttactg ctgctggtat tacccatggt atggatgaat tgtacaaata aaagcttttg 1380
attaagcctt ctagtccaaa aaacacgttt ttttgtcatt tatttcattt tcttagaata 1440
gtttagttta ttcattttat agtcacgaat gttttatgat tctatatagg gttgcaaaca 1500
agcatttttc attttatgtt aaaacaattt caggtttacc ttttattctg cttgtggtga 1560
cgcgtgtatc cgcccgctct tttggtcacc catgtattta attgcataaa taattcttaa 1620
aagtggagct agtctatttc tatttacata cctctcattt ctcatttcct cccctccctc 1680
agaaagcctg tatgcgaagc cacaatcctt tccaacagac catactaagt 1730
<210> 9
<211> 72
<212> DNA
<213> 人工序列
<220>
<223> 用于将50 bp基因组DNA侧翼附接至YFP表达盒的连接物5的正向引物的核苷酸序列;
CON5-Pthd3-YFP-TenoI-CON3
<400> 9
cttcatgcca gcaatagttg cgtgctgagc tcaacagtgc ccaacccttg aagcgacttc 60
caatcgcttt gc 72
<210> 10
<211> 74
<212> DNA
<213> 人工序列
<220>
<223> 用于将50 bp基因组DNA侧翼附接至YFP表达盒的连接物3的反向引物的核苷酸序列;
CON5-Pthd3-YFP-TenoI-CON3
<400> 10
gaaaagcact cctttagtac cactcaacaa gttgtctgat gacaaagaat acttagtatg 60
gtctgttgga aagg 74
<210> 11
<211> 1830
<212> DNA
<213> 人工序列
<220>
<223> 在5'侧和3'侧含有50 bp基因组DNA侧翼以用于整合到基因组中的CON5-Pthd3-YFP-TenoI-CON3表达盒的核苷酸序列
<400> 11
cttcatgcca gcaatagttg cgtgctgagc tcaacagtgc ccaacccttg aagcgacttc 60
caatcgcttt gcatatccag taccacaccc acaggcgttt gtgcttagtc aaaaaattag 120
ccttttaatt ctgctgtaac ccgtacatgc ccaaaatagg gggcgggtta cacagaatat 180
ataacatcgt aggtgtctgg gtgaacagtt tattcctggc atccactaaa tataatggag 240
cccgcttttt aagctggcat ccagaaaaaa aaagaatccc agcaccaaaa tattgttttc 300
ttcaccaacc atcagttcat aggtccattc tcttagcgca actacagaga acaggggcac 360
aaacaggcaa aaaacgggca caacctcaat ggagtgatgc aacctgcctg gagtaaatga 420
tgacacaagg caattgaccc acgcatgtat ctatctcatt ttcttacacc ttctattacc 480
ttctgctctc tctgatttgg aaaaagctga aaaaaaaggt tgaaaccagt tccctgaaat 540
tattccccta cttgactaat aagtatataa agacggtagg tattgattgt aattctgtaa 600
atctatttct taaacttctt aaattctact tttatagtta gtcttttttt tagttttaaa 660
acaccaagaa cttagtttcg aataaacaca cataaacaaa caaaatgtct aaaggtgaag 720
aattattcac tggtgttgtc ccaattttgg ttgaattaga tggtgatgtt aatggtcaca 780
aattttctgt ctccggtgaa ggtgaaggtg atgctactta cggtaaattg accttaaaat 840
tgatttgtac tactggtaaa ttgccagttc catggccaac cttagtcact actttaggtt 900
atggtttgca atgttttgct agatacccag atcatatgaa acaacatgac tttttcaagt 960
ctgccatgcc agaaggttat gttcaagaaa gaactatttt tttcaaagat gacggtaact 1020
acaagaccag agctgaagtc aagtttgaag gtgatacctt agttaataga atcgaattaa 1080
aaggtattga ttttaaagaa gatggtaaca ttttaggtca caaattggaa tacaactata 1140
actctcacaa tgtttacatc actgctgaca aacaaaagaa tggtatcaaa gctaacttca 1200
aaattagaca caacattgaa gatggtggtg ttcaattagc tgaccattat caacaaaata 1260
ctccaattgg tgatggtcca gtcttgttac cagacaacca ttacttatcc tatcaatctg 1320
ccttatccaa agatccaaac gaaaagagag atcacatggt cttgttagaa tttgttactg 1380
ctgctggtat tacccatggt atggatgaat tgtacaaata aaagcttttg attaagcctt 1440
ctagtccaaa aaacacgttt ttttgtcatt tatttcattt tcttagaata gtttagttta 1500
ttcattttat agtcacgaat gttttatgat tctatatagg gttgcaaaca agcatttttc 1560
attttatgtt aaaacaattt caggtttacc ttttattctg cttgtggtga cgcgtgtatc 1620
cgcccgctct tttggtcacc catgtattta attgcataaa taattcttaa aagtggagct 1680
agtctatttc tatttacata cctctcattt ctcatttcct cccctccctc agaaagcctg 1740
tatgcgaagc cacaatcctt tccaacagac catactaagt attctttgtc atcagacaac 1800
ttgttgagtg gtactaaagg agtgcttttc 1830
<210> 12
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 用于Cas9的INT1的引导序列(基因组靶序列)的核苷酸序列
<400> 12
tattagaacc agggaggtcc 20
<210> 13
<211> 488
<212> DNA
<213> 人工序列
<220>
<223> 用于将CAS9靶向基因组中的INT1基因座的完整引导RNA盒的核苷酸序列,所述核苷酸序列含有与载体骨架pRN1120的同源性以用于进行同源重组
<400> 13
cggagctagc atgcggccgc tctagaacta gtggatcccc cgggctgcag tctttgaaaa 60
gataatgtat gattatgctt tcactcatat ttatacagaa acttgatgtt ttctttcgag 120
tatatacaag gtgattacat gtacgtttga agtacaactc tagattttgt agtgccctct 180
tgggctagcg gtaaaggtgc gcattttttc acaccctaca atgttctgtt caaaagattt 240
tggtcaaacg ctgtagaagt gaaagttggt gcgcatgttt cggcgttcga aacttctccg 300
cagtgaaaga taaatgatct attagaacca gggaggtccg ttttagagct agaaatagca 360
agttaaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtggtgctt 420
tttttgtttt ttatgtctgg ggggcccggt acccagcttt tgttcccttt agtgagggtt 480
aattccga 488
<210> 14
<211> 488
<212> DNA
<213> 人工序列
<220>
<223> CTEC-1的核苷酸序列,所述核苷酸序列包含用于将Cas9靶向到INT1的引导RNA盒(sgRNA)和在3'侧上的供体DNA
<400> 14
tctttgaaaa gataatgtat gattatgctt tcactcatat ttatacagaa acttgatgtt 60
ttctttcgag tatatacaag gtgattacat gtacgtttga agtacaactc tagattttgt 120
agtgccctct tgggctagcg gtaaaggtgc gcattttttc acaccctaca atgttctgtt 180
caaaagattt tggtcaaacg ctgtagaagt gaaagttggt gcgcatgttt cggcgttcga 240
aacttctccg cagtgaaaga taaatgatct attagaacca gggaggtccg ttttagagct 300
agaaatagca agttaaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc 360
ggtggtgctt tttttgtttt ttatgtctac aaatctgcaa ccccagcttc ataagctttc 420
tctcccacca gcaaagcatg gacctccctg gttctaataa tgagcgactg aagttttcca 480
aaagaaac 488
<210> 15
<211> 538
<212> DNA
<213> 人工序列
<220>
<223> CTEC-2的核苷酸序列,所述核苷酸序列包含用于将Cas9靶向到INT1的引导RNA盒(sgRNA)、连接物A和在3'侧上的供体DNA
<400> 15
tctttgaaaa gataatgtat gattatgctt tcactcatat ttatacagaa acttgatgtt 60
ttctttcgag tatatacaag gtgattacat gtacgtttga agtacaactc tagattttgt 120
agtgccctct tgggctagcg gtaaaggtgc gcattttttc acaccctaca atgttctgtt 180
caaaagattt tggtcaaacg ctgtagaagt gaaagttggt gcgcatgttt cggcgttcga 240
aacttctccg cagtgaaaga taaatgatct attagaacca gggaggtccg ttttagagct 300
agaaatagca agttaaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc 360
ggtggtgctt tttttgtttt ttatgtcttt gcccatcgaa cgtacaagta ctcctctgtt 420
ctctccttcc tttgctttac aaatctgcaa ccccagcttc ataagctttc tctcccacca 480
gcaaagcatg gacctccctg gttctaataa tgagcgactg aagttttcca aaagaaac 538
<210> 16
<211> 488
<212> DNA
<213> 人工序列
<220>
<223> CTEC-3的核苷酸序列,所述核苷酸序列包含用于将Cas9靶向到INT1的引导RNA盒(sgRNA)和在5'侧上的供体DNA
<400> 16
acaaatctgc aaccccagct tcataagctt tctctcccac cagcaaagca tggacctccc 60
tggttctaat aatgagcgac tgaagttttc caaaagaaac tctttgaaaa gataatgtat 120
gattatgctt tcactcatat ttatacagaa acttgatgtt ttctttcgag tatatacaag 180
gtgattacat gtacgtttga agtacaactc tagattttgt agtgccctct tgggctagcg 240
gtaaaggtgc gcattttttc acaccctaca atgttctgtt caaaagattt tggtcaaacg 300
ctgtagaagt gaaagttggt gcgcatgttt cggcgttcga aacttctccg cagtgaaaga 360
taaatgatct attagaacca gggaggtccg ttttagagct agaaatagca agttaaaata 420
aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtggtgctt tttttgtttt 480
ttatgtct 488
<210> 17
<211> 538
<212> DNA
<213> 人工序列
<220>
<223> CTEC-4的核苷酸序列,所述核苷酸序列包含用于将Cas9靶向到INT1的引导RNA盒(sgRNA)、连接物A和在5'侧上的供体DNA
<400> 17
acaaatctgc aaccccagct tcataagctt tctctcccac cagcaaagca tggacctccc 60
tggttctaat aatgagcgac tgaagttttc caaaagaaac ttgcccatcg aacgtacaag 120
tactcctctg ttctctcctt cctttgcttt tctttgaaaa gataatgtat gattatgctt 180
tcactcatat ttatacagaa acttgatgtt ttctttcgag tatatacaag gtgattacat 240
gtacgtttga agtacaactc tagattttgt agtgccctct tgggctagcg gtaaaggtgc 300
gcattttttc acaccctaca atgttctgtt caaaagattt tggtcaaacg ctgtagaagt 360
gaaagttggt gcgcatgttt cggcgttcga aacttctccg cagtgaaaga taaatgatct 420
attagaacca gggaggtccg ttttagagct agaaatagca agttaaaata aggctagtcc 480
gttatcaact tgaaaaagtg gcaccgagtc ggtggtgctt tttttgtttt ttatgtct 538
<210> 18
<211> 511
<212> DNA
<213> 人工序列
<220>
<223> CTEC-5的核苷酸序列,所述核苷酸序列包含用于将Cas9靶向到INT1的引导RNA盒(sgRNA)、PAM和引导靶序列以及在5'侧上的供体DNA
<400> 18
acaaatctgc aaccccagct tcataagctt tctctcccac cagcaaagca tggacctccc 60
tggttctaat aatgagcgac tgaagttttc caaaagaaac cctggacctc cctggttcta 120
atatctttga aaagataatg tatgattatg ctttcactca tatttataca gaaacttgat 180
gttttctttc gagtatatac aaggtgatta catgtacgtt tgaagtacaa ctctagattt 240
tgtagtgccc tcttgggcta gcggtaaagg tgcgcatttt ttcacaccct acaatgttct 300
gttcaaaaga ttttggtcaa acgctgtaga agtgaaagtt ggtgcgcatg tttcggcgtt 360
cgaaacttct ccgcagtgaa agataaatga tctattagaa ccagggaggt ccgttttaga 420
gctagaaata gcaagttaaa ataaggctag tccgttatca acttgaaaaa gtggcaccga 480
gtcggtggtg ctttttttgt tttttatgtc t 511
<210> 19
<211> 511
<212> DNA
<213> 人工序列
<220>
<223> CTEC-6B的核苷酸序列,所述核苷酸序列包含用于将Cas9靶向到INT1的引导RNA盒(sgRNA)、PAM和引导靶序列以及在3'侧上的供体DNA
<400> 19
tctttgaaaa gataatgtat gattatgctt tcactcatat ttatacagaa acttgatgtt 60
ttctttcgag tatatacaag gtgattacat gtacgtttga agtacaactc tagattttgt 120
agtgccctct tgggctagcg gtaaaggtgc gcattttttc acaccctaca atgttctgtt 180
caaaagattt tggtcaaacg ctgtagaagt gaaagttggt gcgcatgttt cggcgttcga 240
aacttctccg cagtgaaaga taaatgatct attagaacca gggaggtccg ttttagagct 300
agaaatagca agttaaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc 360
ggtggtgctt tttttgtttt ttatgtctcc tggacctccc tggttctaat aacaaatctg 420
caaccccagc ttcataagct ttctctccca ccagcaaagc atggacctcc ctggttctaa 480
taatgagcga ctgaagtttt ccaaaagaaa c 511
<210> 20
<211> 499
<212> DNA
<213> 人工序列
<220>
<223> CTEC-1的核苷酸序列,所述核苷酸序列包含用于将Cas9靶向到YFP基因的引导RNA盒(sgRNA)和在3'侧上的供体DNA
<400> 20
tctttgaaaa gataatgtat gattatgctt tcactcatat ttatacagaa acttgatgtt 60
ttctttcgag tatatacaag gtgattacat gtacgtttga agtacaactc tagattttgt 120
agtgccctct tgggctagcg gtaaaggtgc gcattttttc acaccctaca atgttctgtt 180
caaaagattt tggtcaaacg ctgtagaagt gaaagttggt gcgcatgttt cggcgttcga 240
aacttctccg cagtgaaaga taaatgatct tagtcactac tttaggttag ttttagagct 300
agaaatagca agttaaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc 360
ggtggtgctt tttttgtttt ttatgtctat ttgtactact ggtaaattgc cagttccatg 420
gccaacctta gtcactactt tagttatggt ttgcaatgtt ttgctagata cccagatcat 480
atgaaacaac atgactttt 499
<210> 21
<211> 549
<212> DNA
<213> 人工序列
<220>
<223> CTEC-2的核苷酸序列,所述核苷酸序列包含用于将Cas9靶向到YFP基因的引导RNA盒(sgRNA)、连接物A和在3'侧上的供体DNA
<400> 21
tctttgaaaa gataatgtat gattatgctt tcactcatat ttatacagaa acttgatgtt 60
ttctttcgag tatatacaag gtgattacat gtacgtttga agtacaactc tagattttgt 120
agtgccctct tgggctagcg gtaaaggtgc gcattttttc acaccctaca atgttctgtt 180
caaaagattt tggtcaaacg ctgtagaagt gaaagttggt gcgcatgttt cggcgttcga 240
aacttctccg cagtgaaaga taaatgatct tagtcactac tttaggttag ttttagagct 300
agaaatagca agttaaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc 360
ggtggtgctt tttttgtttt ttatgtcttt gcccatcgaa cgtacaagta ctcctctgtt 420
ctctccttcc tttgctttat ttgtactact ggtaaattgc cagttccatg gccaacctta 480
gtcactactt tagttatggt ttgcaatgtt ttgctagata cccagatcat atgaaacaac 540
atgactttt 549
<210> 22
<211> 499
<212> DNA
<213> 人工序列
<220>
<223> CTEC-3的核苷酸序列,所述核苷酸序列包含用于将Cas9靶向到YFP基因的引导RNA盒(sgRNA)和在5'侧上的供体DNA
<400> 22
atttgtacta ctggtaaatt gccagttcca tggccaacct tagtcactac tttagttatg 60
gtttgcaatg ttttgctaga tacccagatc atatgaaaca acatgacttt ttctttgaaa 120
agataatgta tgattatgct ttcactcata tttatacaga aacttgatgt tttctttcga 180
gtatatacaa ggtgattaca tgtacgtttg aagtacaact ctagattttg tagtgccctc 240
ttgggctagc ggtaaaggtg cgcatttttt cacaccctac aatgttctgt tcaaaagatt 300
ttggtcaaac gctgtagaag tgaaagttgg tgcgcatgtt tcggcgttcg aaacttctcc 360
gcagtgaaag ataaatgatc ttagtcacta ctttaggtta gttttagagc tagaaatagc 420
aagttaaaat aaggctagtc cgttatcaac ttgaaaaagt ggcaccgagt cggtggtgct 480
ttttttgttt tttatgtct 499
<210> 23
<211> 549
<212> DNA
<213> 人工序列
<220>
<223> CTEC-4的核苷酸序列,所述核苷酸序列包含用于将Cas9靶向到YFP基因的引导RNA盒(sgRNA)、连接物A和在5'侧上的供体DNA
<400> 23
atttgtacta ctggtaaatt gccagttcca tggccaacct tagtcactac tttagttatg 60
gtttgcaatg ttttgctaga tacccagatc atatgaaaca acatgacttt tttgcccatc 120
gaacgtacaa gtactcctct gttctctcct tcctttgctt ttctttgaaa agataatgta 180
tgattatgct ttcactcata tttatacaga aacttgatgt tttctttcga gtatatacaa 240
ggtgattaca tgtacgtttg aagtacaact ctagattttg tagtgccctc ttgggctagc 300
ggtaaaggtg cgcatttttt cacaccctac aatgttctgt tcaaaagatt ttggtcaaac 360
gctgtagaag tgaaagttgg tgcgcatgtt tcggcgttcg aaacttctcc gcagtgaaag 420
ataaatgatc ttagtcacta ctttaggtta gttttagagc tagaaatagc aagttaaaat 480
aaggctagtc cgttatcaac ttgaaaaagt ggcaccgagt cggtggtgct ttttttgttt 540
tttatgtct 549
<210> 24
<211> 522
<212> DNA
<213> 人工序列
<220>
<223> CTEC-5的核苷酸序列,所述核苷酸序列包含用于将Cas9靶向到YFP基因的引导RNA盒(sgRNA)、PAM和引导靶序列以及在5'侧上的供体DNA
<400> 24
atttgtacta ctggtaaatt gccagttcca tggccaacct tagtcactac tttagttatg 60
gtttgcaatg ttttgctaga tacccagatc atatgaaaca acatgacttt tccataacct 120
aaagtagtga ctaatctttg aaaagataat gtatgattat gctttcactc atatttatac 180
agaaacttga tgttttcttt cgagtatata caaggtgatt acatgtacgt ttgaagtaca 240
actctagatt ttgtagtgcc ctcttgggct agcggtaaag gtgcgcattt tttcacaccc 300
tacaatgttc tgttcaaaag attttggtca aacgctgtag aagtgaaagt tggtgcgcat 360
gtttcggcgt tcgaaacttc tccgcagtga aagataaatg atcttagtca ctactttagg 420
ttagttttag agctagaaat agcaagttaa aataaggcta gtccgttatc aacttgaaaa 480
agtggcaccg agtcggtggt gctttttttg ttttttatgt ct 522
<210> 25
<211> 522
<212> DNA
<213> 人工序列
<220>
<223> CTEC-6A的核苷酸序列,所述核苷酸序列包含用于将Cas9靶向到YFP基因的引导RNA盒(sgRNA)、引导靶标和PAM序列以及在3'侧上的供体DNA
<400> 25
tctttgaaaa gataatgtat gattatgctt tcactcatat ttatacagaa acttgatgtt 60
ttctttcgag tatatacaag gtgattacat gtacgtttga agtacaactc tagattttgt 120
agtgccctct tgggctagcg gtaaaggtgc gcattttttc acaccctaca atgttctgtt 180
caaaagattt tggtcaaacg ctgtagaagt gaaagttggt gcgcatgttt cggcgttcga 240
aacttctccg cagtgaaaga taaatgatct tagtcactac tttaggttag ttttagagct 300
agaaatagca agttaaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc 360
ggtggtgctt tttttgtttt ttatgtcttt agtcactact ttaggttatg gatttgtact 420
actggtaaat tgccagttcc atggccaacc ttagtcacta ctttagttat ggtttgcaat 480
gttttgctag atacccagat catatgaaac aacatgactt tt 522
<210> 26
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 用于Cas9的INT1的引导序列(基因组靶序列)的核苷酸序列
<400> 26
tattagaacc agggaggtcc 20
<210> 27
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 用于Cas9的YFP的引导序列(基因组靶序列)的核苷酸序列
<400> 27
ttagtcacta ctttaggtta 20
<210> 28
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> 连接物A的核苷酸序列
<400> 28
ttgcccatcg aacgtacaag tactcctctg ttctctcctt cctttgcttt 50
<210> 29
<211> 388
<212> DNA
<213> 人工序列
<220>
<223> 用于将Cas9靶向到CSN009基因组中的YFP表达盒的完整引导RNA表达盒的核苷酸序列
<400> 29
tctttgaaaa gataatgtat gattatgctt tcactcatat ttatacagaa acttgatgtt 60
ttctttcgag tatatacaag gtgattacat gtacgtttga agtacaactc tagattttgt 120
agtgccctct tgggctagcg gtaaaggtgc gcattttttc acaccctaca atgttctgtt 180
caaaagattt tggtcaaacg ctgtagaagt gaaagttggt gcgcatgttt cggcgttcga 240
aacttctccg cagtgaaaga taaatgatct tagtcactac tttaggttag ttttagagct 300
agaaatagca agttaaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc 360
ggtggtgctt tttttgtttt ttatgtct 388
<210> 30
<211> 388
<212> DNA
<213> 人工序列
<220>
<223> 用于将Cas9靶向到CSN001基因组中的INT1基因座的完整引导RNA表达盒的核苷酸序列
<400> 30
tctttgaaaa gataatgtat gattatgctt tcactcatat ttatacagaa acttgatgtt 60
ttctttcgag tatatacaag gtgattacat gtacgtttga agtacaactc tagattttgt 120
agtgccctct tgggctagcg gtaaaggtgc gcattttttc acaccctaca atgttctgtt 180
caaaagattt tggtcaaacg ctgtagaagt gaaagttggt gcgcatgttt cggcgttcga 240
aacttctccg cagtgaaaga taaatgatct attagaacca gggaggtccg ttttagagct 300
agaaatagca agttaaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc 360
ggtggtgctt tttttgtttt ttatgtct 388
<210> 31
<211> 111
<212> DNA
<213> 人工序列
<220>
<223> 作为用于Cas9编辑的CTEC片段的一部分的YFP供体DNA的核苷酸序列
<400> 31
atttgtacta ctggtaaatt gccagttcca tggccaacct tagtcactac tttagttatg 60
gtttgcaatg ttttgctaga tacccagatc atatgaaaca acatgacttt t 111
<210> 32
<211> 100
<212> DNA
<213> 人工序列
<220>
<223> 作为用于Cas9编辑的CTEC片段的一部分的INT1供体DNA的核苷酸序列
<400> 32
acaaatctgc aaccccagct tcataagctt tctctcccac cagcaaagca tggacctccc 60
tggttctaat aatgagcgac tgaagttttc caaaagaaac 100
<210> 33
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 用于扩增在3'侧上含有供体DNA的CTEC片段的正向引物的核苷酸序列
<400> 33
tctttgaaaa gataatgtat gattatgc 28
<210> 34
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 用于扩增在5'侧上含有YFP供体DNA的CTEC片段的正向引物的核苷酸序列
<400> 34
atttgtacta ctggtaaatt gccag 25
<210> 35
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 用于扩增在3'侧上含有YFP供体DNA的CTEC片段的反向引物的核苷酸序列
<400> 35
aaaagtcatg ttgtttcata tgatctg 27
<210> 36
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 用于扩增在5'侧上含有供体DNA的CTEC片段的反向引物的核苷酸序列
<400> 36
agacataaaa aacaaaaaaa gcaccacc 28
<210> 37
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 用于扩增在5'侧上含有INT1供体DNA的CTEC片段的正向引物的核苷酸序列
<400> 37
acaaatctgc aaccccagct tc 22
<210> 38
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 用于扩增在3'侧上含有INT1供体DNA的CTEC片段的反向引物的核苷酸序列
<400> 38
gtttcttttg gaaaacttca gtcgctc 27
<210> 39
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 用于扩增YFP ORF的正向引物的核苷酸序列
<400> 39
atgtctaaag gtgaagaatt attcac 26
<210> 40
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 用于扩增YFP ORF的反向引物的核苷酸序列
<400> 40
ttttatttgt acaattcatc catacc 26
<210> 41
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 用于对YFP ORF进行测序的正向引物的核苷酸序列
<400> 41
ttttatttgt acaattcatc catacc 26
<210> 42
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 用于扩增INT1基因座的一部分的正向引物的核苷酸序列
<400> 42
attaagtaat agatacgcac aacc 24
<210> 43
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 用于扩增INT1基因座的一部分的反向引物的核苷酸序列
<400> 43
ggaatactac cagatcgatc c 21
<210> 44
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 用于对INT1基因座的一部分进行测序的正向引物的核苷酸序列
<400> 44
attaagtaat agatacgcac aacc 24
<210> 45
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 用于扩增Kl11p-pCSN061骨架-GND2t PCR片段的正向引物的核苷酸序列
<400> 45
ttttgataag tatttaagcg agtg 24
<210> 46
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 用于扩增Kl11p-pCSN061骨架-GND2t PCR片段的反向引物的核苷酸序列
<400> 46
aggagttaaa ggcaaagttt tc 22
<210> 47
<211> 1239
<212> PRT
<213> 人工序列
<220>
<223> 包含C末端NLS的LbCpf1(来自毛螺菌科(Lachnospiraceae)细菌ND2006)的蛋白质序列
<400> 47
Met Ser Lys Leu Glu Lys Phe Thr Asn Cys Tyr Ser Leu Ser Lys Thr
1 5 10 15
Leu Arg Phe Lys Ala Ile Pro Val Gly Lys Thr Gln Glu Asn Ile Asp
20 25 30
Asn Lys Arg Leu Leu Val Glu Asp Glu Lys Arg Ala Glu Asp Tyr Lys
35 40 45
Gly Val Lys Lys Leu Leu Asp Arg Tyr Tyr Leu Ser Phe Ile Asn Asp
50 55 60
Val Leu His Ser Ile Lys Leu Lys Asn Leu Asn Asn Tyr Ile Ser Leu
65 70 75 80
Phe Arg Lys Lys Thr Arg Thr Glu Lys Glu Asn Lys Glu Leu Glu Asn
85 90 95
Leu Glu Ile Asn Leu Arg Lys Glu Ile Ala Lys Ala Phe Lys Gly Asn
100 105 110
Glu Gly Tyr Lys Ser Leu Phe Lys Lys Asp Ile Ile Glu Thr Ile Leu
115 120 125
Pro Glu Phe Leu Asp Asp Lys Asp Glu Ile Ala Leu Val Asn Ser Phe
130 135 140
Asn Gly Phe Thr Thr Ala Phe Thr Gly Phe Phe Asp Asn Arg Glu Asn
145 150 155 160
Met Phe Ser Glu Glu Ala Lys Ser Thr Ser Ile Ala Phe Arg Cys Ile
165 170 175
Asn Glu Asn Leu Thr Arg Tyr Ile Ser Asn Met Asp Ile Phe Glu Lys
180 185 190
Val Asp Ala Ile Phe Asp Lys His Glu Val Gln Glu Ile Lys Glu Lys
195 200 205
Ile Leu Asn Ser Asp Tyr Asp Val Glu Asp Phe Phe Glu Gly Glu Phe
210 215 220
Phe Asn Phe Val Leu Thr Gln Glu Gly Ile Asp Val Tyr Asn Ala Ile
225 230 235 240
Ile Gly Gly Phe Val Thr Glu Ser Gly Glu Lys Ile Lys Gly Leu Asn
245 250 255
Glu Tyr Ile Asn Leu Tyr Asn Gln Lys Thr Lys Gln Lys Leu Pro Lys
260 265 270
Phe Lys Pro Leu Tyr Lys Gln Val Leu Ser Asp Arg Glu Ser Leu Ser
275 280 285
Phe Tyr Gly Glu Gly Tyr Thr Ser Asp Glu Glu Val Leu Glu Val Phe
290 295 300
Arg Asn Thr Leu Asn Lys Asn Ser Glu Ile Phe Ser Ser Ile Lys Lys
305 310 315 320
Leu Glu Lys Leu Phe Lys Asn Phe Asp Glu Tyr Ser Ser Ala Gly Ile
325 330 335
Phe Val Lys Asn Gly Pro Ala Ile Ser Thr Ile Ser Lys Asp Ile Phe
340 345 350
Gly Glu Trp Asn Val Ile Arg Asp Lys Trp Asn Ala Glu Tyr Asp Asp
355 360 365
Ile His Leu Lys Lys Lys Ala Val Val Thr Glu Lys Tyr Glu Asp Asp
370 375 380
Arg Arg Lys Ser Phe Lys Lys Ile Gly Ser Phe Ser Leu Glu Gln Leu
385 390 395 400
Gln Glu Tyr Ala Asp Ala Asp Leu Ser Val Val Glu Lys Leu Lys Glu
405 410 415
Ile Ile Ile Gln Lys Val Asp Glu Ile Tyr Lys Val Tyr Gly Ser Ser
420 425 430
Glu Lys Leu Phe Asp Ala Asp Phe Val Leu Glu Lys Ser Leu Lys Lys
435 440 445
Asn Asp Ala Val Val Ala Ile Met Lys Asp Leu Leu Asp Ser Val Lys
450 455 460
Ser Phe Glu Asn Tyr Ile Lys Ala Phe Phe Gly Glu Gly Lys Glu Thr
465 470 475 480
Asn Arg Asp Glu Ser Phe Tyr Gly Asp Phe Val Leu Ala Tyr Asp Ile
485 490 495
Leu Leu Lys Val Asp His Ile Tyr Asp Ala Ile Arg Asn Tyr Val Thr
500 505 510
Gln Lys Pro Tyr Ser Lys Asp Lys Phe Lys Leu Tyr Phe Gln Asn Pro
515 520 525
Gln Phe Met Gly Gly Trp Asp Lys Asp Lys Glu Thr Asp Tyr Arg Ala
530 535 540
Thr Ile Leu Arg Tyr Gly Ser Lys Tyr Tyr Leu Ala Ile Met Asp Lys
545 550 555 560
Lys Tyr Ala Lys Cys Leu Gln Lys Ile Asp Lys Asp Asp Val Asn Gly
565 570 575
Asn Tyr Glu Lys Ile Asn Tyr Lys Leu Leu Pro Gly Pro Asn Lys Met
580 585 590
Leu Pro Lys Val Phe Phe Ser Lys Lys Trp Met Ala Tyr Tyr Asn Pro
595 600 605
Ser Glu Asp Ile Gln Lys Ile Tyr Lys Asn Gly Thr Phe Lys Lys Gly
610 615 620
Asp Met Phe Asn Leu Asn Asp Cys His Lys Leu Ile Asp Phe Phe Lys
625 630 635 640
Asp Ser Ile Ser Arg Tyr Pro Lys Trp Ser Asn Ala Tyr Asp Phe Asn
645 650 655
Phe Ser Glu Thr Glu Lys Tyr Lys Asp Ile Ala Gly Phe Tyr Arg Glu
660 665 670
Val Glu Glu Gln Gly Tyr Lys Val Ser Phe Glu Ser Ala Ser Lys Lys
675 680 685
Glu Val Asp Lys Leu Val Glu Glu Gly Lys Leu Tyr Met Phe Gln Ile
690 695 700
Tyr Asn Lys Asp Phe Ser Asp Lys Ser His Gly Thr Pro Asn Leu His
705 710 715 720
Thr Met Tyr Phe Lys Leu Leu Phe Asp Glu Asn Asn His Gly Gln Ile
725 730 735
Arg Leu Ser Gly Gly Ala Glu Leu Phe Met Arg Arg Ala Ser Leu Lys
740 745 750
Lys Glu Glu Leu Val Val His Pro Ala Asn Ser Pro Ile Ala Asn Lys
755 760 765
Asn Pro Asp Asn Pro Lys Lys Thr Thr Thr Leu Ser Tyr Asp Val Tyr
770 775 780
Lys Asp Lys Arg Phe Ser Glu Asp Gln Tyr Glu Leu His Ile Pro Ile
785 790 795 800
Ala Ile Asn Lys Cys Pro Lys Asn Ile Phe Lys Ile Asn Thr Glu Val
805 810 815
Arg Val Leu Leu Lys His Asp Asp Asn Pro Tyr Val Ile Gly Ile Asp
820 825 830
Arg Gly Glu Arg Asn Leu Leu Tyr Ile Val Val Val Asp Gly Lys Gly
835 840 845
Asn Ile Val Glu Gln Tyr Ser Leu Asn Glu Ile Ile Asn Asn Phe Asn
850 855 860
Gly Ile Arg Ile Lys Thr Asp Tyr His Ser Leu Leu Asp Lys Lys Glu
865 870 875 880
Lys Glu Arg Phe Glu Ala Arg Gln Asn Trp Thr Ser Ile Glu Asn Ile
885 890 895
Lys Glu Leu Lys Ala Gly Tyr Ile Ser Gln Val Val His Lys Ile Cys
900 905 910
Glu Leu Val Glu Lys Tyr Asp Ala Val Ile Ala Leu Glu Asp Leu Asn
915 920 925
Ser Gly Phe Lys Asn Ser Arg Val Lys Val Glu Lys Gln Val Tyr Gln
930 935 940
Lys Phe Glu Lys Met Leu Ile Asp Lys Leu Asn Tyr Met Val Asp Lys
945 950 955 960
Lys Ser Asn Pro Cys Ala Thr Gly Gly Ala Leu Lys Gly Tyr Gln Ile
965 970 975
Thr Asn Lys Phe Glu Ser Phe Lys Ser Met Ser Thr Gln Asn Gly Phe
980 985 990
Ile Phe Tyr Ile Pro Ala Trp Leu Thr Ser Lys Ile Asp Pro Ser Thr
995 1000 1005
Gly Phe Val Asn Leu Leu Lys Thr Lys Tyr Thr Ser Ile Ala Asp
1010 1015 1020
Ser Lys Lys Phe Ile Ser Ser Phe Asp Arg Ile Met Tyr Val Pro
1025 1030 1035
Glu Glu Asp Leu Phe Glu Phe Ala Leu Asp Tyr Lys Asn Phe Ser
1040 1045 1050
Arg Thr Asp Ala Asp Tyr Ile Lys Lys Trp Lys Leu Tyr Ser Tyr
1055 1060 1065
Gly Asn Arg Ile Arg Ile Phe Arg Asn Pro Lys Lys Asn Asn Val
1070 1075 1080
Phe Asp Trp Glu Glu Val Cys Leu Thr Ser Ala Tyr Lys Glu Leu
1085 1090 1095
Phe Asn Lys Tyr Gly Ile Asn Tyr Gln Gln Gly Asp Ile Arg Ala
1100 1105 1110
Leu Leu Cys Glu Gln Ser Asp Lys Ala Phe Tyr Ser Ser Phe Met
1115 1120 1125
Ala Leu Met Ser Leu Met Leu Gln Met Arg Asn Ser Ile Thr Gly
1130 1135 1140
Arg Thr Asp Val Asp Phe Leu Ile Ser Pro Val Lys Asn Ser Asp
1145 1150 1155
Gly Ile Phe Tyr Asp Ser Arg Asn Tyr Glu Ala Gln Glu Asn Ala
1160 1165 1170
Ile Leu Pro Lys Asn Ala Asp Ala Asn Gly Ala Tyr Asn Ile Ala
1175 1180 1185
Arg Lys Val Leu Trp Ala Ile Gly Gln Phe Lys Lys Ala Glu Asp
1190 1195 1200
Glu Lys Leu Asp Lys Val Lys Ile Ala Ile Ser Asn Lys Glu Trp
1205 1210 1215
Leu Glu Tyr Ala Gln Thr Ser Val Lys His Ser Arg Ala Asp Pro
1220 1225 1230
Lys Lys Lys Arg Lys Val
1235
<210> 48
<211> 3720
<212> DNA
<213> 人工序列
<220>
<223> 包含C末端NLS的CPO LbCpf1的核苷酸序列
<400> 48
atgtctaagt tggaaaaatt caccaactgt tactctttgt ctaagacttt gagattcaag 60
gccatcccag ttggtaagac ccaagaaaac atcgacaaca agagactatt agttgaagat 120
gaaaagagag ctgaagacta caagggtgtc aagaaattgt tggacagata ctacttgtct 180
tttatcaacg acgttttgca ttccatcaag ctaaagaact tgaataacta catctctttg 240
ttcagaaaga agactagaac tgaaaaggaa aataaggaat tggaaaactt ggaaatcaac 300
ttgagaaagg aaattgctaa ggctttcaag ggtaatgaag gttacaagtc tttattcaag 360
aaagacatca ttgaaaccat tttgccagaa tttttggatg ataaggatga aattgctttg 420
gttaactctt tcaacggttt caccactgct ttcactggtt tcttcgacaa cagagaaaac 480
atgttctccg aggaagctaa atccacttct attgctttca gatgtatcaa cgaaaacttg 540
acccgttaca tctctaacat ggacattttt gaaaaggtcg acgccatctt tgacaagcac 600
gaagtccaag aaatcaagga aaagatctta aactccgact acgatgtcga agatttcttc 660
gaaggtgaat tcttcaactt tgttttaacc caagaaggta tcgatgtcta caacgccatt 720
atcggtggtt ttgtcactga atctggtgaa aagatcaagg gtttgaacga atacattaac 780
ttgtacaacc aaaagaccaa acaaaaattg ccaaagttca agccattgta caagcaagtt 840
ttgtctgaca gagaatcttt gtctttttac ggtgaagggt acacctctga cgaagaagtc 900
ttggaagtct tcagaaacac tttgaacaag aactctgaaa tcttctcctc catcaagaag 960
ttagaaaagt tgttcaagaa cttcgatgaa tactcttctg ctggtatctt cgttaagaac 1020
ggtccagcca tctctaccat ttctaaggat atctttggtg aatggaacgt cattagagac 1080
aaatggaacg ctgaatacga tgacatccat ttgaagaaaa aggctgttgt caccgaaaag 1140
tacgaagacg acagaagaaa atccttcaag aagatcggtt ccttctcctt ggaacaatta 1200
caagaatacg ccgatgccga tttgtccgtt gtcgaaaaat tgaaggaaat tattattcaa 1260
aaggttgatg aaatttacaa agtttacggt tcctctgaaa agttattcga tgctgatttc 1320
gtcttggaaa agtctttgaa gaagaacgac gctgttgtcg ctatcatgaa ggacttgttg 1380
gactctgtca aatctttcga aaactatatc aaggccttct tcggtgaagg taaggaaact 1440
aacagagatg aatccttcta cggtgacttt gtcttggctt acgatatttt gttgaaggtt 1500
gaccacatct acgatgccat cagaaactac gttactcaaa agccatactc taaggacaaa 1560
ttcaagttgt acttccaaaa cccacaattc atgggtggtt gggataagga caaggaaact 1620
gactacagag ctaccatttt gagatacggt tccaagtact acttggccat catggacaag 1680
aagtacgcca agtgtttgca aaagattgac aaggacgatg tcaacggtaa ctacgaaaag 1740
attaactaca agttgttgcc aggtccaaac aagatgttgc caaaggtttt cttctccaaa 1800
aagtggatgg cttactacaa cccatctgaa gacatccaaa agatctacaa gaacggtact 1860
ttcaaaaagg gtgacatgtt caacttaaac gactgtcaca agttgatcga cttcttcaag 1920
gactccatct ctagataccc aaaatggtcc aacgcttacg atttcaactt ctctgaaact 1980
gaaaaataca aggatattgc tggtttctac cgtgaagtcg aggaacaagg ttataaggtt 2040
tctttcgaat ccgcttctaa gaaagaagtt gacaaattag tcgaagaagg taagttgtac 2100
atgttccaaa tctacaacaa agatttctcc gacaagtctc acggtactcc aaacttgcac 2160
accatgtact tcaagttgct attcgatgaa aacaaccacg gtcaaatcag attgtctggt 2220
ggtgctgaat tgttcatgag acgtgcttct ctaaagaagg aagaattagt cgtccaccca 2280
gctaactctc caattgccaa caagaaccca gacaacccta agaagaccac cactttgtcc 2340
tacgacgttt acaaggacaa gagattctcc gaagaccaat acgaattgca cattccaatt 2400
gctatcaaca agtgtccaaa gaacatcttc aagatcaaca ctgaagtcag agttttgtta 2460
aagcacgatg acaaccctta cgttattggt atcgaccgtg gtgaaagaaa tttgttgtac 2520
attgttgttg ttgacggtaa gggtaacatc gttgaacaat actccttgaa cgaaatcatc 2580
aacaacttca acggtattag aatcaagact gattaccact ctttgttgga taagaaggaa 2640
aaggaacgtt ttgaagctcg tcaaaactgg acctctattg aaaacatcaa agaattgaag 2700
gctggttaca tcagtcaagt tgtccacaag atctgtgaat tggtcgagaa gtacgatgcc 2760
gttattgcct tggaagattt gaactctggt tttaagaact ctcgtgtcaa ggttgaaaag 2820
caagtctacc aaaagttcga aaagatgtta atcgacaaat tgaactacat ggttgacaag 2880
aaatccaacc catgtgctac cggtggtgct ttgaaaggtt accaaatcac caacaaattc 2940
gaatctttca aatctatgtc cactcaaaac gggttcatct tctacattcc agcttggttg 3000
acctccaaga tcgacccatc taccggtttc gttaacttgt tgaagaccaa gtacacttcc 3060
attgctgatt ccaagaagtt catctcttct ttcgacagaa tcatgtacgt tccagaagaa 3120
gacttgttcg aattcgcctt ggactataag aacttctcca gaaccgatgc tgactacatt 3180
aagaaatgga aattgtactc ctacggtaac agaatcagaa ttttcagaaa cccaaagaaa 3240
aacaacgttt tcgattggga agaagtttgt ttgacttctg cctacaagga attattcaac 3300
aaatacggta tcaactacca acaaggtgat atcagagctt tgttgtgtga acaatctgac 3360
aaggctttct actcttcctt catggctttg atgtccttga tgttgcaaat gagaaactcc 3420
atcactggta gaactgatgt cgacttcctc atttctccag ttaagaattc tgacggtatt 3480
ttctacgact ctagaaatta cgaagctcaa gaaaacgcta ttttgccaaa gaacgctgat 3540
gctaacggtg cttacaatat tgctagaaag gttttgtggg ctatcggtca attcaagaag 3600
gctgaagacg aaaagctaga caaggtcaag attgctattt ctaacaagga atggttggaa 3660
tacgctcaaa cctccgtcaa gcactccaga gctgatccaa agaagaagag aaaggtataa 3720
<210> 49
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 用于扩增LbCpf1表达盒的正向引物的核苷酸序列
<400> 49
cctcatagaa tattattctt cagtcactcg cttaaatact tatcaaaaat gtctaagttg 60
<210> 50
<211> 74
<212> DNA
<213> 人工序列
<220>
<223> 用于扩增LbCpf1表达盒的反向引物的核苷酸序列
<400> 50
cgtataatta tttgtgggaa cggctctaga aaagaaaact ttgcctttaa ctcctttata 60
cctttctctt cttc 74
<210> 51
<211> 11322
<212> DNA
<213> 人工序列
<220>
<223> 编码LbCpf1的载体pCSN067的核苷酸序列
<400> 51
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accataaacg acattactat atatataata taggaagcat ttaatagaca gcatcgtaat 240
atatgtgtac tttgcagtta tgacgccaga tggcagtagt ggaagatatt ctttattgaa 300
aaatagcttg tcaccttacg tacaatcttg atccggagct tttctttttt tgccgattaa 360
gaattaattc ggtcgaaaaa agaaaaggag agggccaaga gggagggcat tggtgactat 420
tgagcacgtg agtatacgtg attaagcaca caaaggcagc ttggagtatg tctgttatta 480
atttcacagg tagttctggt ccattggtga aagtttgcgg cttgcagagc acagaggccg 540
cagaatgtgc tctagattcc gatgctgact tgctgggtat tatatgtgtg cccaatagaa 600
agagaacaat tgacccggtt attgcaagga aaatttcaag tcttgtaaaa gcatataaaa 660
atagttcagg cactccgaaa tacttggttg gcgtgtttcg taatcaacct aaggaggatg 720
ttttggctct ggtcaatgat tacggcattg atatcgtcca actgcatgga gatgagtcgt 780
ggcaagaata ccaagagttc ctcggtttgc cagttattaa aagactcgta tttccaaaag 840
actgcaacat actactcagt gcagcttcac agaaacctca ttcgtttatt cccttgtttg 900
attcagaagc aggtgggaca ggtgaacttt tggattggaa ctcgatttct gactgggttg 960
gaaggcaaga gagccccgaa agcttacatt ttatgttagc tggtggactg acgccagaaa 1020
atgttggtga tgcgcttaga ttaaatggcg ttattggtgt tgatgtaagc ggaggtgtgg 1080
agacaaatgg tgtaaaagac tctaacaaaa tagcaaattt cgtcaaaaat gctaagaaat 1140
aggttattac tgagtagtat ttatttaagt attgtttgtg cacttgccta tgcggtgtga 1200
aataccgcac agatgcgtaa ggagaaaata ccgcatcagg aaattgtaaa cgttaatatt 1260
ttgttaaaat tcgcgttaaa tttttgttaa atcagctcat tttttaacca ataggccgaa 1320
atcggcaaaa tcccttataa atcaaaagaa tagaccgaga tagggttgag tgttgttcca 1380
gtttggaaca agagtccact attaaagaac gtggactcca acgtcaaagg gcgaaaaacc 1440
gtctatcagg gcgatggccc actacgtgaa ccatcaccct aatcaagttt tttggggtcg 1500
aggtgccgta aagcactaaa tcggaaccct aaagggagcc cccgatttag agcttgacgg 1560
ggaaagccgg cgaacgtggc gagaaaggaa gggaagaaag cgaaaggagc gggcgctagg 1620
gcgctggcaa gtgtagcggt cacgctgcgc gtaaccacca cacccgccgc gcttaatgcg 1680
ccgctacagg gcgcgtcgcg ccattcgcca ttcaggctgc gcaactgttg ggaagggcga 1740
tcggtgcggg cctcttcgct attacgccag ctggcgaaag ggggatgtgc tgcaaggcga 1800
ttaagttggg taacgccagg gttttcccag tcacgacgtt gtaaaacgac ggccagtgag 1860
cgcgcgtaat acgactcact atagggcgaa ttgggtacct tttctttttt tgcggtcacc 1920
cccatgtggc ggggaggcag aggagtaggt agagcaacga atcctactat ttatccaaat 1980
tagtctagga actctttttc tagatttttt agatttgagg gcaagcgctg ttaacgactc 2040
agaaatgtaa gcactacgga gtagaacgag aaatccgcca taggtggaaa tcctagcaaa 2100
atcttgctta ccctagctag cctcaggtaa gctagcctta gcctgtcaaa tttttttcaa 2160
aatttggtaa gtttctacta gcaaagcaaa cacggttcaa caaaccgaaa actccactca 2220
ttatacgtgg aaaccgaaac aaaaaaacaa aaaccaaaat actcgccaat gagaaagttg 2280
ctgcgtttct actttcgagg aagaggaact gagaggattg actacgaaag gggcaaaaac 2340
gagtcgtatt ctcccattat tgtctgctac cacgcggtct agtagaataa gcaaccagtc 2400
aacgctaaga caggtaatca aaataccagt ctgctggcta cgggctagtt tttacctctt 2460
ttagaaccca ctgtaaaagt ccgttgtaaa gcccgttctc actgttggcg tttttttttt 2520
tttggtttag tttcttattt ttcatttttt tctttcatga ccaaaaacaa acaaatctcg 2580
cgatttgtac tgcggccact ggggcgtggc caaaaaaatg acaaatttag aaaccttagt 2640
ttctgatttt tcctgttatg aggagatatg ataaaaaata ttactgcttt attgtttttt 2700
ttttatctac tgaaatagag aaacttaccc aaggaggagg caaaaaaaag agtatatata 2760
cagcagctac cattcagatt ttaatatatt cttttctctt cttctacact attattataa 2820
taattttact atattcattt ttagcttaaa acctcataga atattattct tcagtcactc 2880
gcttaaatac ttatcaaaaa tgtctaagtt ggaaaaattc accaactgtt actctttgtc 2940
taagactttg agattcaagg ccatcccagt tggtaagacc caagaaaaca tcgacaacaa 3000
gagactatta gttgaagatg aaaagagagc tgaagactac aagggtgtca agaaattgtt 3060
ggacagatac tacttgtctt ttatcaacga cgttttgcat tccatcaagc taaagaactt 3120
gaataactac atctctttgt tcagaaagaa gactagaact gaaaaggaaa ataaggaatt 3180
ggaaaacttg gaaatcaact tgagaaagga aattgctaag gctttcaagg gtaatgaagg 3240
ttacaagtct ttattcaaga aagacatcat tgaaaccatt ttgccagaat ttttggatga 3300
taaggatgaa attgctttgg ttaactcttt caacggtttc accactgctt tcactggttt 3360
cttcgacaac agagaaaaca tgttctccga ggaagctaaa tccacttcta ttgctttcag 3420
atgtatcaac gaaaacttga cccgttacat ctctaacatg gacatttttg aaaaggtcga 3480
cgccatcttt gacaagcacg aagtccaaga aatcaaggaa aagatcttaa actccgacta 3540
cgatgtcgaa gatttcttcg aaggtgaatt cttcaacttt gttttaaccc aagaaggtat 3600
cgatgtctac aacgccatta tcggtggttt tgtcactgaa tctggtgaaa agatcaaggg 3660
tttgaacgaa tacattaact tgtacaacca aaagaccaaa caaaaattgc caaagttcaa 3720
gccattgtac aagcaagttt tgtctgacag agaatctttg tctttttacg gtgaagggta 3780
cacctctgac gaagaagtct tggaagtctt cagaaacact ttgaacaaga actctgaaat 3840
cttctcctcc atcaagaagt tagaaaagtt gttcaagaac ttcgatgaat actcttctgc 3900
tggtatcttc gttaagaacg gtccagccat ctctaccatt tctaaggata tctttggtga 3960
atggaacgtc attagagaca aatggaacgc tgaatacgat gacatccatt tgaagaaaaa 4020
ggctgttgtc accgaaaagt acgaagacga cagaagaaaa tccttcaaga agatcggttc 4080
cttctccttg gaacaattac aagaatacgc cgatgccgat ttgtccgttg tcgaaaaatt 4140
gaaggaaatt attattcaaa aggttgatga aatttacaaa gtttacggtt cctctgaaaa 4200
gttattcgat gctgatttcg tcttggaaaa gtctttgaag aagaacgacg ctgttgtcgc 4260
tatcatgaag gacttgttgg actctgtcaa atctttcgaa aactatatca aggccttctt 4320
cggtgaaggt aaggaaacta acagagatga atccttctac ggtgactttg tcttggctta 4380
cgatattttg ttgaaggttg accacatcta cgatgccatc agaaactacg ttactcaaaa 4440
gccatactct aaggacaaat tcaagttgta cttccaaaac ccacaattca tgggtggttg 4500
ggataaggac aaggaaactg actacagagc taccattttg agatacggtt ccaagtacta 4560
cttggccatc atggacaaga agtacgccaa gtgtttgcaa aagattgaca aggacgatgt 4620
caacggtaac tacgaaaaga ttaactacaa gttgttgcca ggtccaaaca agatgttgcc 4680
aaaggttttc ttctccaaaa agtggatggc ttactacaac ccatctgaag acatccaaaa 4740
gatctacaag aacggtactt tcaaaaaggg tgacatgttc aacttaaacg actgtcacaa 4800
gttgatcgac ttcttcaagg actccatctc tagataccca aaatggtcca acgcttacga 4860
tttcaacttc tctgaaactg aaaaatacaa ggatattgct ggtttctacc gtgaagtcga 4920
ggaacaaggt tataaggttt ctttcgaatc cgcttctaag aaagaagttg acaaattagt 4980
cgaagaaggt aagttgtaca tgttccaaat ctacaacaaa gatttctccg acaagtctca 5040
cggtactcca aacttgcaca ccatgtactt caagttgcta ttcgatgaaa acaaccacgg 5100
tcaaatcaga ttgtctggtg gtgctgaatt gttcatgaga cgtgcttctc taaagaagga 5160
agaattagtc gtccacccag ctaactctcc aattgccaac aagaacccag acaaccctaa 5220
gaagaccacc actttgtcct acgacgttta caaggacaag agattctccg aagaccaata 5280
cgaattgcac attccaattg ctatcaacaa gtgtccaaag aacatcttca agatcaacac 5340
tgaagtcaga gttttgttaa agcacgatga caacccttac gttattggta tcgaccgtgg 5400
tgaaagaaat ttgttgtaca ttgttgttgt tgacggtaag ggtaacatcg ttgaacaata 5460
ctccttgaac gaaatcatca acaacttcaa cggtattaga atcaagactg attaccactc 5520
tttgttggat aagaaggaaa aggaacgttt tgaagctcgt caaaactgga cctctattga 5580
aaacatcaaa gaattgaagg ctggttacat cagtcaagtt gtccacaaga tctgtgaatt 5640
ggtcgagaag tacgatgccg ttattgcctt ggaagatttg aactctggtt ttaagaactc 5700
tcgtgtcaag gttgaaaagc aagtctacca aaagttcgaa aagatgttaa tcgacaaatt 5760
gaactacatg gttgacaaga aatccaaccc atgtgctacc ggtggtgctt tgaaaggtta 5820
ccaaatcacc aacaaattcg aatctttcaa atctatgtcc actcaaaacg ggttcatctt 5880
ctacattcca gcttggttga cctccaagat cgacccatct accggtttcg ttaacttgtt 5940
gaagaccaag tacacttcca ttgctgattc caagaagttc atctcttctt tcgacagaat 6000
catgtacgtt ccagaagaag acttgttcga attcgccttg gactataaga acttctccag 6060
aaccgatgct gactacatta agaaatggaa attgtactcc tacggtaaca gaatcagaat 6120
tttcagaaac ccaaagaaaa acaacgtttt cgattgggaa gaagtttgtt tgacttctgc 6180
ctacaaggaa ttattcaaca aatacggtat caactaccaa caaggtgata tcagagcttt 6240
gttgtgtgaa caatctgaca aggctttcta ctcttccttc atggctttga tgtccttgat 6300
gttgcaaatg agaaactcca tcactggtag aactgatgtc gacttcctca tttctccagt 6360
taagaattct gacggtattt tctacgactc tagaaattac gaagctcaag aaaacgctat 6420
tttgccaaag aacgctgatg ctaacggtgc ttacaatatt gctagaaagg ttttgtgggc 6480
tatcggtcaa ttcaagaagg ctgaagacga aaagctagac aaggtcaaga ttgctatttc 6540
taacaaggaa tggttggaat acgctcaaac ctccgtcaag cactccagag ctgatccaaa 6600
gaagaagaga aaggtataaa ggagttaaag gcaaagtttt cttttctaga gccgttccca 6660
caaataatta tacgtatatg cttcttttcg tttactatat atctatattt acaagccttt 6720
attcactgat gcaatttgtt tccaaatact tttttggaga tctcataact agatatcatg 6780
atggcgcaac ttggcgctat cttaattact ctggctgcca ggcccgtgta gagggccgca 6840
agaccttctg tacgccatat agtctctaag aacttgaaca agtttctaga cctattgccg 6900
cctttcggat cgctattgtt gcggccgcca gctgaagctt cgtacgctgc aggtcgacga 6960
attctaccgt tcgtataatg tatgctatac gaagttatag atctgtttag cttgcctcgt 7020
ccccgccggg tcacccggcc agcgacatgg aggcccagaa taccctcctt gacagtcttg 7080
acgtgcgcag ctcaggggca tgatgtgact gtcgcccgta catttagccc atacatcccc 7140
atgtataatc atttgcatcc atacattttg atggccgcac ggcgcgaagc aaaaattacg 7200
gctcctcgct gcagacctgc gagcagggaa acgctcccct cacagacgcg ttgaattgtc 7260
cccacgccgc gcccctgtag agaaatataa aaggttagga tttgccactg aggttcttct 7320
ttcatatact tccttttaaa atcttgctag gatacagttc tcacatcaca tccgaacata 7380
aacaaccatg ggtaaggaaa agactcacgt ttcgaggccg cgattaaatt ccaacatgga 7440
tgctgattta tatgggtata aatgggctcg cgataatgtc gggcaatcag gtgcgacaat 7500
ctatcgattg tatgggaagc ccgatgcgcc agagttgttt ctgaaacatg gcaaaggtag 7560
cgttgccaat gatgttacag atgagatggt cagactaaac tggctgacgg aatttatgcc 7620
tcttccgacc atcaagcatt ttatccgtac tcctgatgat gcatggttac tcaccactgc 7680
gatccccggc aaaacagcat tccaggtatt agaagaatat cctgattcag gtgaaaatat 7740
tgttgatgcg ctggcagtgt tcctgcgccg gttgcattcg attcctgttt gtaattgtcc 7800
ttttaacagc gatcgcgtat ttcgtctcgc tcaggcgcaa tcacgaatga ataacggttt 7860
ggttgatgcg agtgattttg atgacgagcg taatggctgg cctgttgaac aagtctggaa 7920
agaaatgcat aagcttttgc cattctcacc ggattcagtc gtcactcatg gtgatttctc 7980
acttgataac cttatttttg acgaggggaa attaataggt tgtattgatg ttggacgagt 8040
cggaatcgca gaccgatacc aggatcttgc catcctatgg aactgcctcg gtgagttttc 8100
tccttcatta cagaaacggc tttttcaaaa atatggtatt gataatcctg atatgaataa 8160
attgcagttt catttgatgc tcgatgagtt tttctaatca gtactgacaa taaaaagatt 8220
cttgttttca agaacttgtc atttgtatag tttttttata ttgtagttgt tctattttaa 8280
tcaaatgtta gcgtgattta tatttttttt cgcctcgaca tcatctgccc agatgcgaag 8340
ttaagtgcgc agaaagtaat atcatgcgtc aatcgtatgt gaatgctggt cgctatactg 8400
ctgtcgattc gatactaacg ccgccatcca gtgtcgaaaa cgagctcata acttcgtata 8460
atgtatgcta tacgaacggt agaattcgaa tcagatccac tagtggccta tgcggccgcc 8520
accgcggtgg agctccagct tttgttccct ttagtgaggg ttaattgcgc gcttggcgta 8580
atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc cacacaacat 8640
aggagccgga agcataaagt gtaaagcctg gggtgcctaa tgagtgaggt aactcacatt 8700
aattgcgttg cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc agctgcatta 8760
atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt ccgcttcctc 8820
gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa 8880
ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa 8940
aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct 9000
ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac 9060
aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc 9120
gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg tggcgctttc 9180
tcatagctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg 9240
tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga 9300
gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta acaggattag 9360
cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta actacggcta 9420
cactagaagg acagtatttg gtatctgcgc tctgctgaag ccagttacct tcggaaaaag 9480
agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt tttttgtttg 9540
caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga tcttttctac 9600
ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca tgagattatc 9660
aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat caatctaaag 9720
tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg cacctatctc 9780
agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt agataactac 9840
gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag acccacgctc 9900
accggctcca gatttatcag caataaacca gccagccgga agggccgagc gcagaagtgg 9960
tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag ctagagtaag 10020
tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctacaggca tcgtggtgtc 10080
acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa ggcgagttac 10140
atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga tcgttgtcag 10200
aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata attctcttac 10260
tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca agtcattctg 10320
agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaatacggg ataataccgc 10380
gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg ggcgaaaact 10440
ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg cacccaactg 10500
atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag gaaggcaaaa 10560
tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac tcttcctttt 10620
tcaatattat tgaagcattt atcagggtta ttgtctcatg agcggataca tatttgaatg 10680
tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag tgccacctgg 10740
gtccttttca tcacgtgcta taaaaataat tataatttaa attttttaat ataaatatat 10800
aaattaaaaa tagaaagtaa aaaaagaaat taaagaaaaa atagtttttg ttttccgaag 10860
atgtaaaaga ctctaggggg atcgccaaca aatactacct tttatcttgc tcttcctgct 10920
ctcaggtatt aatgccgaat tgtttcatct tgtctgtgta gaagaccaca cacgaaaatc 10980
ctgtgatttt acattttact tatcgttaat cgaatgtata tctatttaat ctgcttttct 11040
tgtctaataa atatatatgt aaagtacgct ttttgttgaa attttttaaa cctttgttta 11100
tttttttttc ttcattccgt aactcttcta ccttctttat ttactttcta aaatccaaat 11160
acaaaacata aaaataaata aacacagagt aaattcccaa attattccat cattaaaaga 11220
tacgaggcgc gtgtaagtta caggcaagcg atccgtccta agaaaccatt attatcatga 11280
cattaaccta taaaaatagg cgtatcacga ggccctttcg tc 11322
<210> 52
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> LbCpf1的crRNA盒的正向重复部分的核苷酸序列
<400> 52
taatttctac taagtgtaga t 21
<210> 53
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 用于LbCpf1的INT1的引导序列(基因组靶序列)的核苷酸序列
<400> 53
ctggtgggag agaaagctta 20
<210> 54
<211> 430
<212> DNA
<213> 人工序列
<220>
<223> 用于将LbCpf1靶向到基因组中的INT1基因座的完整引导RNA盒的核苷酸序列,所述核苷酸序列含有与载体骨架pRN1120的同源性以用于进行同源重组
<400> 54
cggagctagc atgcggccgc tctagaacta gtggatcccc cgggctgcag tctttgaaaa 60
gataatgtat gattatgctt tcactcatat ttatacagaa acttgatgtt ttctttcgag 120
tatatacaag gtgattacat gtacgtttga agtacaactc tagattttgt agtgccctct 180
tgggctagcg gtaaaggtgc gcattttttc acaccctaca atgttctgtt caaaagattt 240
tggtcaaacg ctgtagaagt gaaagttggt gcgcatgttt cggcgttcga aacttctccg 300
cagtgaaaga taaatgatct aatttctact aagtgtagat ctggtgggag agaaagctta 360
tttttttgtt ttttatgtct ggggggcccg gtacccagct tttgttccct ttagtgaggg 420
ttaattccga 430
<210> 55
<211> 439
<212> DNA
<213> 人工序列
<220>
<223> CTEC-7的核苷酸序列,所述核苷酸序列包含用于将LbCpf1靶向到YFP基因的引导RNA盒(crRNA)和在3'侧上的供体DNA
<400> 55
tctttgaaaa gataatgtat gattatgctt tcactcatat ttatacagaa acttgatgtt 60
ttctttcgag tatatacaag gtgattacat gtacgtttga agtacaactc tagattttgt 120
agtgccctct tgggctagcg gtaaaggtgc gcattttttc acaccctaca atgttctgtt 180
caaaagattt tggtcaaacg ctgtagaagt gaaagttggt gcgcatgttt cggcgttcga 240
aacttctccg cagtgaaaga taaatgatct aatttctact aagtgtagat caatgttttg 300
ctagataccc tttttttgtt ttttatgtct atttgtacta ctggtaaatt gccagttcca 360
tggccaacct tagtcactac tttaggttat ggtgcaatgt tttgctagat acccagatca 420
tatgaaacaa catgacttt 439
<210> 56
<211> 489
<212> DNA
<213> 人工序列
<220>
<223> CTEC-8的核苷酸序列,所述核苷酸序列包含用于将LbCpf1靶向到YFP基因的引导RNA盒(crRNA)、连接物A和在3'侧上的供体DNA
<400> 56
tctttgaaaa gataatgtat gattatgctt tcactcatat ttatacagaa acttgatgtt 60
ttctttcgag tatatacaag gtgattacat gtacgtttga agtacaactc tagattttgt 120
agtgccctct tgggctagcg gtaaaggtgc gcattttttc acaccctaca atgttctgtt 180
caaaagattt tggtcaaacg ctgtagaagt gaaagttggt gcgcatgttt cggcgttcga 240
aacttctccg cagtgaaaga taaatgatct aatttctact aagtgtagat caatgttttg 300
ctagataccc tttttttgtt ttttatgtct ttgcccatcg aacgtacaag tactcctctg 360
ttctctcctt cctttgcttt atttgtacta ctggtaaatt gccagttcca tggccaacct 420
tagtcactac tttaggttat ggtgcaatgt tttgctagat acccagatca tatgaaacaa 480
catgacttt 489
<210> 57
<211> 439
<212> DNA
<213> 人工序列
<220>
<223> CTEC-9的核苷酸序列,所述核苷酸序列包含用于将LbCpf1靶向到YFP基因的引导RNA盒(crRNA)和在5'侧上的供体DNA
<400> 57
atttgtacta ctggtaaatt gccagttcca tggccaacct tagtcactac tttaggttat 60
ggtgcaatgt tttgctagat acccagatca tatgaaacaa catgactttt ctttgaaaag 120
ataatgtatg attatgcttt cactcatatt tatacagaaa cttgatgttt tctttcgagt 180
atatacaagg tgattacatg tacgtttgaa gtacaactct agattttgta gtgccctctt 240
gggctagcgg taaaggtgcg cattttttca caccctacaa tgttctgttc aaaagatttt 300
ggtcaaacgc tgtagaagtg aaagttggtg cgcatgtttc ggcgttcgaa acttctccgc 360
agtgaaagat aaatgatcta atttctacta agtgtagatc aatgttttgc tagataccct 420
ttttttgttt tttatgtct 439
<210> 58
<211> 489
<212> DNA
<213> 人工序列
<220>
<223> CTEC-10的核苷酸序列,所述核苷酸序列包含用于将LbCpf1靶向到YFP基因的引导RNA盒(crRNA)、连接物A和在5'侧上的供体DNA
<400> 58
atttgtacta ctggtaaatt gccagttcca tggccaacct tagtcactac tttaggttat 60
ggtgcaatgt tttgctagat acccagatca tatgaaacaa catgactttt tgcccatcga 120
acgtacaagt actcctctgt tctctccttc ctttgctttt ctttgaaaag ataatgtatg 180
attatgcttt cactcatatt tatacagaaa cttgatgttt tctttcgagt atatacaagg 240
tgattacatg tacgtttgaa gtacaactct agattttgta gtgccctctt gggctagcgg 300
taaaggtgcg cattttttca caccctacaa tgttctgttc aaaagatttt ggtcaaacgc 360
tgtagaagtg aaagttggtg cgcatgtttc ggcgttcgaa acttctccgc agtgaaagat 420
aaatgatcta atttctacta agtgtagatc aatgttttgc tagataccct ttttttgttt 480
tttatgtct 489
<210> 59
<211> 459
<212> DNA
<213> 人工序列
<220>
<223> CTEC-11的核苷酸序列,所述核苷酸序包含用于将LbCpf1靶向到YFP基因的引导RNA盒(crRNA)、PAM和引导靶序列以及在3'侧上的供体DNA(2×18 bp引导物)
<400> 59
tctttgaaaa gataatgtat gattatgctt tcactcatat ttatacagaa acttgatgtt 60
ttctttcgag tatatacaag gtgattacat gtacgtttga agtacaactc tagattttgt 120
agtgccctct tgggctagcg gtaaaggtgc gcattttttc acaccctaca atgttctgtt 180
caaaagattt tggtcaaacg ctgtagaagt gaaagttggt gcgcatgttt cggcgttcga 240
aacttctccg cagtgaaaga taaatgatct aatttctact aagtgtagat caatgttttg 300
ctagatactt tttttgtttt ttatgtcttt tgcaatgttt tgctagatac atttgtacta 360
ctggtaaatt gccagttcca tggccaacct tagtcactac tttaggttat ggtgcaatgt 420
tttgctagat acccagatca tatgaaacaa catgacttt 459
<210> 60
<211> 463
<212> DNA
<213> 人工序列
<220>
<223> CTEC-11的核苷酸序列,所述核苷酸序包含用于将LbCpf1靶向到YFP基因的引导RNA盒(crRNA)、PAM和引导靶序列以及在3'侧上的供体DNA(2×20 bp引导物)
<400> 60
tctttgaaaa gataatgtat gattatgctt tcactcatat ttatacagaa acttgatgtt 60
ttctttcgag tatatacaag gtgattacat gtacgtttga agtacaactc tagattttgt 120
agtgccctct tgggctagcg gtaaaggtgc gcattttttc acaccctaca atgttctgtt 180
caaaagattt tggtcaaacg ctgtagaagt gaaagttggt gcgcatgttt cggcgttcga 240
aacttctccg cagtgaaaga taaatgatct aatttctact aagtgtagat caatgttttg 300
ctagataccc tttttttgtt ttttatgtct tttgcaatgt tttgctagat acccatttgt 360
actactggta aattgccagt tccatggcca accttagtca ctactttagg ttatggtgca 420
atgttttgct agatacccag atcatatgaa acaacatgac ttt 463
<210> 61
<211> 459
<212> DNA
<213> 人工序列
<220>
<223> CTEC-12的核苷酸序列,所述核苷酸序包含用于将LbCpf1靶向到YFP基因的引导RNA盒(crRNA)、PAM和引导靶序列以及在5'侧上的供体DNA(2×18 bp引导物)
<400> 61
atttgtacta ctggtaaatt gccagttcca tggccaacct tagtcactac tttaggttat 60
ggtgcaatgt tttgctagat acccagatca tatgaaacaa catgactttt ttgcaatgtt 120
ttgctagata ctctttgaaa agataatgta tgattatgct ttcactcata tttatacaga 180
aacttgatgt tttctttcga gtatatacaa ggtgattaca tgtacgtttg aagtacaact 240
ctagattttg tagtgccctc ttgggctagc ggtaaaggtg cgcatttttt cacaccctac 300
aatgttctgt tcaaaagatt ttggtcaaac gctgtagaag tgaaagttgg tgcgcatgtt 360
tcggcgttcg aaacttctcc gcagtgaaag ataaatgatc taatttctac taagtgtaga 420
tcaatgtttt gctagatact ttttttgttt tttatgtct 459
<210> 62
<211> 463
<212> DNA
<213> 人工序列
<220>
<223> CTEC-12的核苷酸序列,所述核苷酸序包含用于将LbCpf1靶向到YFP基因的引导RNA盒(crRNA)、PAM和引导靶序列以及在5'侧上的供体DNA(2×20 bp引导物)
<400> 62
atttgtacta ctggtaaatt gccagttcca tggccaacct tagtcactac tttaggttat 60
ggtgcaatgt tttgctagat acccagatca tatgaaacaa catgactttt ttgcaatgtt 120
ttgctagata ccctctttga aaagataatg tatgattatg ctttcactca tatttataca 180
gaaacttgat gttttctttc gagtatatac aaggtgatta catgtacgtt tgaagtacaa 240
ctctagattt tgtagtgccc tcttgggcta gcggtaaagg tgcgcatttt ttcacaccct 300
acaatgttct gttcaaaaga ttttggtcaa acgctgtaga agtgaaagtt ggtgcgcatg 360
tttcggcgtt cgaaacttct ccgcagtgaa agataaatga tctaatttct actaagtgta 420
gatcaatgtt ttgctagata cccttttttt gttttttatg tct 463
<210> 63
<211> 430
<212> DNA
<213> 人工序列
<220>
<223> CTEC-7的核苷酸序列,所述核苷酸序列包含用于将LbCpf1靶向到INT1的引导RNA盒(crRNA)和在3'侧上的供体DNA
<400> 63
tctttgaaaa gataatgtat gattatgctt tcactcatat ttatacagaa acttgatgtt 60
ttctttcgag tatatacaag gtgattacat gtacgtttga agtacaactc tagattttgt 120
agtgccctct tgggctagcg gtaaaggtgc gcattttttc acaccctaca atgttctgtt 180
caaaagattt tggtcaaacg ctgtagaagt gaaagttggt gcgcatgttt cggcgttcga 240
aacttctccg cagtgaaaga taaatgatct aatttctact aagtgtagat ctggtgggag 300
agaaagctta tttttttgtt ttttatgtct gtttcttttg gaaaacttca gtcgctcatt 360
attagaacca gggaggtcca ggcccggctg gtgggagaga aagcttatga agctggggtt 420
gcagatttgt 430
<210> 64
<211> 480
<212> DNA
<213> 人工序列
<220>
<223> CTEC-8的核苷酸序列,所述核苷酸序列包含用于将LbCpf1靶向到INT1的引导RNA盒(crRNA)、连接物A和在3'侧上的供体DNA
<400> 64
tctttgaaaa gataatgtat gattatgctt tcactcatat ttatacagaa acttgatgtt 60
ttctttcgag tatatacaag gtgattacat gtacgtttga agtacaactc tagattttgt 120
agtgccctct tgggctagcg gtaaaggtgc gcattttttc acaccctaca atgttctgtt 180
caaaagattt tggtcaaacg ctgtagaagt gaaagttggt gcgcatgttt cggcgttcga 240
aacttctccg cagtgaaaga taaatgatct aatttctact aagtgtagat ctggtgggag 300
agaaagctta tttttttgtt ttttatgtct ttgcccatcg aacgtacaag tactcctctg 360
ttctctcctt cctttgcttt gtttcttttg gaaaacttca gtcgctcatt attagaacca 420
gggaggtcca ggcccggctg gtgggagaga aagcttatga agctggggtt gcagatttgt 480
<210> 65
<400> 65
000
<210> 66
<400> 66
000
<210> 67
<211> 452
<212> DNA
<213> 人工序列
<220>
<223> CTEC-11的核苷酸序列,所述核苷酸序列包含用于将LbCpf1靶向到INT1的引导RNA盒(crRNA)、PAM和引导靶序列以及在3'侧上的供体DNA(1×20 bp、1×18 bp引导物)
<400> 67
tctttgaaaa gataatgtat gattatgctt tcactcatat ttatacagaa acttgatgtt 60
ttctttcgag tatatacaag gtgattacat gtacgtttga agtacaactc tagattttgt 120
agtgccctct tgggctagcg gtaaaggtgc gcattttttc acaccctaca atgttctgtt 180
caaaagattt tggtcaaacg ctgtagaagt gaaagttggt gcgcatgttt cggcgttcga 240
aacttctccg cagtgaaaga taaatgatct aatttctact aagtgtagat ctggtgggag 300
agaaagctta tttttttgtt ttttatgtct tttgctggtg ggagagaaag ctgtttcttt 360
tggaaaactt cagtcgctca ttattagaac cagggaggtc caggcccggc tggtgggaga 420
gaaagcttat gaagctgggg ttgcagattt gt 452
<210> 68
<211> 454
<212> DNA
<213> 人工序列
<220>
<223> CTEC-11的核苷酸序列,所述核苷酸序列包含用于将LbCpf1靶向到INT1的引导RNA盒(crRNA)、PAM和引导靶序列以及在3'侧上的供体DNA(2×20 bp引导物)
<400> 68
tctttgaaaa gataatgtat gattatgctt tcactcatat ttatacagaa acttgatgtt 60
ttctttcgag tatatacaag gtgattacat gtacgtttga agtacaactc tagattttgt 120
agtgccctct tgggctagcg gtaaaggtgc gcattttttc acaccctaca atgttctgtt 180
caaaagattt tggtcaaacg ctgtagaagt gaaagttggt gcgcatgttt cggcgttcga 240
aacttctccg cagtgaaaga taaatgatct aatttctact aagtgtagat ctggtgggag 300
agaaagctta tttttttgtt ttttatgtct tttgctggtg ggagagaaag cttagtttct 360
tttggaaaac ttcagtcgct cattattaga accagggagg tccaggcccg gctggtggga 420
gagaaagctt atgaagctgg ggttgcagat ttgt 454
<210> 69
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 菌株CSN010中通过LbCpf1靶向YFP的CTEC片段的引导序列(基因组靶标)的核苷酸序列
<400> 69
caatgttttg ctagataccc 20
<210> 70
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 菌株CSN004中通过LbCpf1靶向INT1的CTEC片段的引导序列(基因组靶标)的核苷酸序列
<400> 70
ctggtgggag agaaagctta 20
<210> 71
<211> 109
<212> DNA
<213> 人工序列
<220>
<223> YFP供体DNA的核苷酸序列,所述YFP供体DNA是用于在菌株CSN010中进行LbCpf1介导的编辑的CTEC片段的一部分
<400> 71
atttgtacta ctggtaaatt gccagttcca tggccaacct tagtcactac tttaggttat 60
ggtgcaatgt tttgctagat acccagatca tatgaaacaa catgacttt 109
<210> 72
<211> 100
<212> DNA
<213> 人工序列
<220>
<223> INT供体DNA的核苷酸序列,所述INT供体DNA是用于在菌株CSN004中进行LbCpf1介导的编辑的CTEC片段的一部分
<400> 72
gtttcttttg gaaaacttca gtcgctcatt attagaacca gggaggtcca ggcccggctg 60
gtgggagaga aagcttatga agctggggtt gcagatttgt 100
<210> 73
<211> 330
<212> DNA
<213> 人工序列
<220>
<223> 用于将LbCpf1靶向到CSN004的基因组中的INT1基因座的完整引导RNA表达盒的核苷酸序列
<400> 73
tctttgaaaa gataatgtat gattatgctt tcactcatat ttatacagaa acttgatgtt 60
ttctttcgag tatatacaag gtgattacat gtacgtttga agtacaactc tagattttgt 120
agtgccctct tgggctagcg gtaaaggtgc gcattttttc acaccctaca atgttctgtt 180
caaaagattt tggtcaaacg ctgtagaagt gaaagttggt gcgcatgttt cggcgttcga 240
aacttctccg cagtgaaaga taaatgatct aatttctact aagtgtagat ctggtgggag 300
agaaagctta tttttttgtt ttttatgtct 330
<210> 74
<211> 330
<212> DNA
<213> 人工序列
<220>
<223> 用于将LbCpf1靶向到CSN010的基因组中的YFP表达盒的完整引导RNA表达盒的核苷酸序列
<400> 74
tctttgaaaa gataatgtat gattatgctt tcactcatat ttatacagaa acttgatgtt 60
ttctttcgag tatatacaag gtgattacat gtacgtttga agtacaactc tagattttgt 120
agtgccctct tgggctagcg gtaaaggtgc gcattttttc acaccctaca atgttctgtt 180
caaaagattt tggtcaaacg ctgtagaagt gaaagttggt gcgcatgttt cggcgttcga 240
aacttctccg cagtgaaaga taaatgatct aatttctact aagtgtagat caatgttttg 300
ctagataccc tttttttgtt ttttatgtct 330
<210> 75
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 用于通过LbCpf1消化CTEC片段,从而将INT1供体DNA与引导RNA表达盒分离的18 bp引导序列(基因组靶序列)的核苷酸序列
<400> 75
ctggtgggag agaaagct 18
<210> 76
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 用于通过LbCpf1消化CTEC片段,从而将YFP供体DNA与引导RNA表达盒分离的18bp引导序列(基因组靶序列)的核苷酸序列
<400> 76
caatgttttg ctagatac 18
<210> 77
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 用于通过LbCpf1消化CTEC片段,从而将INT1供体DNA与引导RNA表达盒分离的20 bp引导序列(基因组靶序列)的核苷酸序列
<400> 77
ctggtgggag agaaagctta 20
<210> 78
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 用于通过LbCpf1消化CTEC片段,从而将YFP供体DNA与引导RNA表达盒分离的20bp引导序列(基因组靶序列)的核苷酸序列
<400> 78
caatgttttg ctagataccc 20
<210> 79
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 包含用于通过LbCpf1消化CTEC片段,从而将INT1供体DNA与引导RNA表达盒分离的PAM序列的18 bp引导序列(基因组靶序列)的核苷酸序列
<400> 79
tttgctggtg ggagagaaag ct 22
<210> 80
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 包含用于通过LbCpf1消化CTEC片段,从而将INT1供体DNA与引导RNA表达盒分离的PAM序列的20 bp引导序列(基因组靶序列)的核苷酸序列
<400> 80
tttgctggtg ggagagaaag ctta 24
<210> 81
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 包含用于通过LbCpf1消化CTEC片段,从而将YFP供体DNA与引导RNA表达盒分离的PAM的18 bp引导序列(基因组靶序列)的核苷酸序列
<400> 81
tttgcaatgt tttgctagat ac 22
<210> 82
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 包含用于通过LbCpf1消化CTEC片段,从而将YFP供体DNA与引导RNA表达盒分离的PAM序列的20 bp引导序列(基因组靶序列)的核苷酸序列
<400> 82
tttgcaatgt tttgctagat accc 24
<210> 83
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 用于扩增具有在5'侧上的YFP供体和用于LbCpf1的20 bp引导序列的CTEC片段的反向引物的核苷酸序列
<400> 83
agacataaaa aacaaaaaaa gggtatctag 30
<210> 84
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 用于扩增具有在5'侧上的YFP供体和用于LbCpf1的18 bp引导序列的CTEC片段的反向引物的核苷酸序列
<400> 84
agacataaaa aacaaaaaaa gtatctag 28
<210> 85
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 用于扩增具有在5'侧上的INT1供体以供进行LbCpf1编辑的CTEC片段的正向引物的核苷酸序列
<400> 85
gtttcttttg gaaaacttca gtcgc 25
<210> 86
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 用于扩增具有在3'侧上的INT1供体以供进行LbCpf1编辑的CTEC片段的反向引物的核苷酸序列
<400> 86
acaaatctgc aaccccagct tc 22
<210> 87
<211> 539
<212> DNA
<213> 人工序列
<220>
<223> CTEC-7的核苷酸序列,所述核苷酸序列包含用于将LbCpf1靶向到YFP基因的引导RNA盒(crRNA)和在3'侧上的供体DNA,在5'侧上侧接有连接物5序列并且在3'侧上侧接有连接物3
<400> 87
aagcgacttc caatcgcttt gcatatccag taccacaccc acaggcgttt tctttgaaaa 60
gataatgtat gattatgctt tcactcatat ttatacagaa acttgatgtt ttctttcgag 120
tatatacaag gtgattacat gtacgtttga agtacaactc tagattttgt agtgccctct 180
tgggctagcg gtaaaggtgc gcattttttc acaccctaca atgttctgtt caaaagattt 240
tggtcaaacg ctgtagaagt gaaagttggt gcgcatgttt cggcgttcga aacttctccg 300
cagtgaaaga taaatgatct aatttctact aagtgtagat caatgttttg ctagataccc 360
tttttttgtt ttttatgtct atttgtacta ctggtaaatt gccagttcca tggccaacct 420
tagtcactac tttaggttat ggtgcaatgt tttgctagat acccagatca tatgaaacaa 480
catgacttta gaaagcctgt atgcgaagcc acaatccttt ccaacagacc atactaagt 539
<210> 88
<211> 589
<212> DNA
<213> 人工序列
<220>
<223> CTEC-8的核苷酸序列,所述核苷酸序列包含用于将LbCpf1靶向到YFP基因的引导RNA盒(crRNA)、连接物A和在3'侧上的供体DNA,在5'侧上侧接有连接物5序列并且在3'侧上侧接有连接物3
<400> 88
aagcgacttc caatcgcttt gcatatccag taccacaccc acaggcgttt tctttgaaaa 60
gataatgtat gattatgctt tcactcatat ttatacagaa acttgatgtt ttctttcgag 120
tatatacaag gtgattacat gtacgtttga agtacaactc tagattttgt agtgccctct 180
tgggctagcg gtaaaggtgc gcattttttc acaccctaca atgttctgtt caaaagattt 240
tggtcaaacg ctgtagaagt gaaagttggt gcgcatgttt cggcgttcga aacttctccg 300
cagtgaaaga taaatgatct aatttctact aagtgtagat caatgttttg ctagataccc 360
tttttttgtt ttttatgtct ttgcccatcg aacgtacaag tactcctctg ttctctcctt 420
cctttgcttt atttgtacta ctggtaaatt gccagttcca tggccaacct tagtcactac 480
tttaggttat ggtgcaatgt tttgctagat acccagatca tatgaaacaa catgacttta 540
gaaagcctgt atgcgaagcc acaatccttt ccaacagacc atactaagt 589
<210> 89
<211> 539
<212> DNA
<213> 人工序列
<220>
<223> CTEC-9的核苷酸序列,所述核苷酸序列包含用于将LbCpf1靶向到YFP基因的引导RNA盒(crRNA)和在5'侧上的供体DNA,在5'侧上侧接有连接物5序列并且在3'侧上侧接有连接物3
<400> 89
aagcgacttc caatcgcttt gcatatccag taccacaccc acaggcgttt atttgtacta 60
ctggtaaatt gccagttcca tggccaacct tagtcactac tttaggttat ggtgcaatgt 120
tttgctagat acccagatca tatgaaacaa catgactttt ctttgaaaag ataatgtatg 180
attatgcttt cactcatatt tatacagaaa cttgatgttt tctttcgagt atatacaagg 240
tgattacatg tacgtttgaa gtacaactct agattttgta gtgccctctt gggctagcgg 300
taaaggtgcg cattttttca caccctacaa tgttctgttc aaaagatttt ggtcaaacgc 360
tgtagaagtg aaagttggtg cgcatgtttc ggcgttcgaa acttctccgc agtgaaagat 420
aaatgatcta atttctacta agtgtagatc aatgttttgc tagataccct ttttttgttt 480
tttatgtcta gaaagcctgt atgcgaagcc acaatccttt ccaacagacc atactaagt 539
<210> 90
<211> 589
<212> DNA
<213> 人工序列
<220>
<223> CTEC-10的核苷酸序列,所述核苷酸序列包含用于将LbCpf1靶向到YFP基因的引导RNA盒(crRNA)、连接物A和在5'侧上的供体DNA,在5'侧上侧接有连接物5序列并且在3'侧上侧接有连接物3
<400> 90
aagcgacttc caatcgcttt gcatatccag taccacaccc acaggcgttt atttgtacta 60
ctggtaaatt gccagttcca tggccaacct tagtcactac tttaggttat ggtgcaatgt 120
tttgctagat acccagatca tatgaaacaa catgactttt tgcccatcga acgtacaagt 180
actcctctgt tctctccttc ctttgctttt ctttgaaaag ataatgtatg attatgcttt 240
cactcatatt tatacagaaa cttgatgttt tctttcgagt atatacaagg tgattacatg 300
tacgtttgaa gtacaactct agattttgta gtgccctctt gggctagcgg taaaggtgcg 360
cattttttca caccctacaa tgttctgttc aaaagatttt ggtcaaacgc tgtagaagtg 420
aaagttggtg cgcatgtttc ggcgttcgaa acttctccgc agtgaaagat aaatgatcta 480
atttctacta agtgtagatc aatgttttgc tagataccct ttttttgttt tttatgtcta 540
gaaagcctgt atgcgaagcc acaatccttt ccaacagacc atactaagt 589
<210> 91
<211> 559
<212> DNA
<213> 人工序列
<220>
<223> CTEC-11的核苷酸序列,所述核苷酸序列包含用于将LbCpf1靶向到YFP基因的引导RNA盒(crRNA)、PAM和引导靶序列以及在3'侧上的供体DNA(2×18 bp引导物),在5'侧上侧接有连接物5序列并且在3'侧上侧接有连接物3
<400> 91
aagcgacttc caatcgcttt gcatatccag taccacaccc acaggcgttt tctttgaaaa 60
gataatgtat gattatgctt tcactcatat ttatacagaa acttgatgtt ttctttcgag 120
tatatacaag gtgattacat gtacgtttga agtacaactc tagattttgt agtgccctct 180
tgggctagcg gtaaaggtgc gcattttttc acaccctaca atgttctgtt caaaagattt 240
tggtcaaacg ctgtagaagt gaaagttggt gcgcatgttt cggcgttcga aacttctccg 300
cagtgaaaga taaatgatct aatttctact aagtgtagat caatgttttg ctagatactt 360
tttttgtttt ttatgtcttt tgcaatgttt tgctagatac atttgtacta ctggtaaatt 420
gccagttcca tggccaacct tagtcactac tttaggttat ggtgcaatgt tttgctagat 480
acccagatca tatgaaacaa catgacttta gaaagcctgt atgcgaagcc acaatccttt 540
ccaacagacc atactaagt 559
<210> 92
<211> 563
<212> DNA
<213> 人工序列
<220>
<223> CTEC-11的核苷酸序列,所述核苷酸序列包含用于将LbCpf1靶向到YFP基因的引导RNA盒(crRNA)、PAM和引导靶序列以及在3'侧上的供体DNA(2×20 bp引导物),在5'侧上侧接有连接物5序列并且在3'侧上侧接有连接物3
<400> 92
aagcgacttc caatcgcttt gcatatccag taccacaccc acaggcgttt tctttgaaaa 60
gataatgtat gattatgctt tcactcatat ttatacagaa acttgatgtt ttctttcgag 120
tatatacaag gtgattacat gtacgtttga agtacaactc tagattttgt agtgccctct 180
tgggctagcg gtaaaggtgc gcattttttc acaccctaca atgttctgtt caaaagattt 240
tggtcaaacg ctgtagaagt gaaagttggt gcgcatgttt cggcgttcga aacttctccg 300
cagtgaaaga taaatgatct aatttctact aagtgtagat caatgttttg ctagataccc 360
tttttttgtt ttttatgtct tttgcaatgt tttgctagat acccatttgt actactggta 420
aattgccagt tccatggcca accttagtca ctactttagg ttatggtgca atgttttgct 480
agatacccag atcatatgaa acaacatgac tttagaaagc ctgtatgcga agccacaatc 540
ctttccaaca gaccatacta agt 563
<210> 93
<211> 559
<212> DNA
<213> 人工序列
<220>
<223> CTEC-12的核苷酸序列,所述核苷酸序列包含用于将LbCpf1靶向到YFP基因的引导RNA盒(crRNA)、PAM和引导靶序列以及在5'侧上的供体DNA(2×18 bp引导物),在5'侧上侧接有连接物5并且在3'侧上侧接有连接物3
<400> 93
aagcgacttc caatcgcttt gcatatccag taccacaccc acaggcgttt atttgtacta 60
ctggtaaatt gccagttcca tggccaacct tagtcactac tttaggttat ggtgcaatgt 120
tttgctagat acccagatca tatgaaacaa catgactttt ttgcaatgtt ttgctagata 180
ctctttgaaa agataatgta tgattatgct ttcactcata tttatacaga aacttgatgt 240
tttctttcga gtatatacaa ggtgattaca tgtacgtttg aagtacaact ctagattttg 300
tagtgccctc ttgggctagc ggtaaaggtg cgcatttttt cacaccctac aatgttctgt 360
tcaaaagatt ttggtcaaac gctgtagaag tgaaagttgg tgcgcatgtt tcggcgttcg 420
aaacttctcc gcagtgaaag ataaatgatc taatttctac taagtgtaga tcaatgtttt 480
gctagatact ttttttgttt tttatgtcta gaaagcctgt atgcgaagcc acaatccttt 540
ccaacagacc atactaagt 559
<210> 94
<211> 563
<212> DNA
<213> 人工序列
<220>
<223> CTEC-12的核苷酸序列,所述核苷酸序列包含用于将LbCpf1靶向到YFP基因的引导RNA盒(crRNA)、PAM和引导靶序列以及在5'侧上的供体DNA(2×20 bp引导物),在5'侧上侧接有连接物5并且在3'侧上侧接有连接物3
<400> 94
aagcgacttc caatcgcttt gcatatccag taccacaccc acaggcgttt atttgtacta 60
ctggtaaatt gccagttcca tggccaacct tagtcactac tttaggttat ggtgcaatgt 120
tttgctagat acccagatca tatgaaacaa catgactttt ttgcaatgtt ttgctagata 180
ccctctttga aaagataatg tatgattatg ctttcactca tatttataca gaaacttgat 240
gttttctttc gagtatatac aaggtgatta catgtacgtt tgaagtacaa ctctagattt 300
tgtagtgccc tcttgggcta gcggtaaagg tgcgcatttt ttcacaccct acaatgttct 360
gttcaaaaga ttttggtcaa acgctgtaga agtgaaagtt ggtgcgcatg tttcggcgtt 420
cgaaacttct ccgcagtgaa agataaatga tctaatttct actaagtgta gatcaatgtt 480
ttgctagata cccttttttt gttttttatg tctagaaagc ctgtatgcga agccacaatc 540
ctttccaaca gaccatacta agt 563
<210> 95
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 用于扩增具有在5'侧上的连接物5的CTEC片段的正向引物的核苷酸序列
<400> 95
aagcgacttc caatcgcttt gcatatc 27
<210> 96
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 用于扩增具有在3'侧上的连接器3的CTEC片段的反向引物的核苷酸序列
<400> 96
cttagtatgg tctgttggaa aggattg 27
<210> 97
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> 连接物5的核苷酸序列
<400> 97
aagcgacttc caatcgcttt gcatatccag taccacaccc acaggcgttt 50
<210> 98
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> 连接物3的核苷酸序列
<400> 98
agaaagcctg tatgcgaagc cacaatcctt tccaacagac catactaagt 50
<210> 99
<211> 489
<212> DNA
<213> 人工序列
<220>
<223> CTEC-7的核苷酸序列,所述核苷酸序列包含用于将LbCpf1靶向到YFP基因的引导RNA盒(crRNA)和在3'侧上的供体DNA,在5'侧上侧接有连接物5序列
<400> 99
aagcgacttc caatcgcttt gcatatccag taccacaccc acaggcgttt tctttgaaaa 60
gataatgtat gattatgctt tcactcatat ttatacagaa acttgatgtt ttctttcgag 120
tatatacaag gtgattacat gtacgtttga agtacaactc tagattttgt agtgccctct 180
tgggctagcg gtaaaggtgc gcattttttc acaccctaca atgttctgtt caaaagattt 240
tggtcaaacg ctgtagaagt gaaagttggt gcgcatgttt cggcgttcga aacttctccg 300
cagtgaaaga taaatgatct aatttctact aagtgtagat caatgttttg ctagataccc 360
tttttttgtt ttttatgtct atttgtacta ctggtaaatt gccagttcca tggccaacct 420
tagtcactac tttaggttat ggtgcaatgt tttgctagat acccagatca tatgaaacaa 480
catgacttt 489
<210> 100
<211> 539
<212> DNA
<213> 人工序列
<220>
<223> CTEC-8的核苷酸序列,所述核苷酸序列包含用于将LbCpf1靶向到YFP基因的引导RNA盒(crRNA)、连接物A和在3'侧上的供体DNA,在5'侧上侧接有连接物5序列
<400> 100
aagcgacttc caatcgcttt gcatatccag taccacaccc acaggcgttt tctttgaaaa 60
gataatgtat gattatgctt tcactcatat ttatacagaa acttgatgtt ttctttcgag 120
tatatacaag gtgattacat gtacgtttga agtacaactc tagattttgt agtgccctct 180
tgggctagcg gtaaaggtgc gcattttttc acaccctaca atgttctgtt caaaagattt 240
tggtcaaacg ctgtagaagt gaaagttggt gcgcatgttt cggcgttcga aacttctccg 300
cagtgaaaga taaatgatct aatttctact aagtgtagat caatgttttg ctagataccc 360
tttttttgtt ttttatgtct ttgcccatcg aacgtacaag tactcctctg ttctctcctt 420
cctttgcttt atttgtacta ctggtaaatt gccagttcca tggccaacct tagtcactac 480
tttaggttat ggtgcaatgt tttgctagat acccagatca tatgaaacaa catgacttt 539
<210> 101
<211> 489
<212> DNA
<213> 人工序列
<220>
<223> CTEC-9的核苷酸序列,所述核苷酸序列包含用于将LbCpf1靶向到YFP基因的引导RNA盒(crRNA)和在5'侧上的供体DNA,在5'侧上侧接有连接物5序列
<400> 101
aagcgacttc caatcgcttt gcatatccag taccacaccc acaggcgttt atttgtacta 60
ctggtaaatt gccagttcca tggccaacct tagtcactac tttaggttat ggtgcaatgt 120
tttgctagat acccagatca tatgaaacaa catgactttt ctttgaaaag ataatgtatg 180
attatgcttt cactcatatt tatacagaaa cttgatgttt tctttcgagt atatacaagg 240
tgattacatg tacgtttgaa gtacaactct agattttgta gtgccctctt gggctagcgg 300
taaaggtgcg cattttttca caccctacaa tgttctgttc aaaagatttt ggtcaaacgc 360
tgtagaagtg aaagttggtg cgcatgtttc ggcgttcgaa acttctccgc agtgaaagat 420
aaatgatcta atttctacta agtgtagatc aatgttttgc tagataccct ttttttgttt 480
tttatgtct 489
<210> 102
<211> 539
<212> DNA
<213> 人工序列
<220>
<223> CTEC-10的核苷酸序列,所述核苷酸序列包含用于将LbCpf1靶向到YFP基因的引导RNA盒(crRNA)、连接物A和在5'侧上的供体DNA,在5'侧上侧接有连接物5序列
<400> 102
aagcgacttc caatcgcttt gcatatccag taccacaccc acaggcgttt atttgtacta 60
ctggtaaatt gccagttcca tggccaacct tagtcactac tttaggttat ggtgcaatgt 120
tttgctagat acccagatca tatgaaacaa catgactttt tgcccatcga acgtacaagt 180
actcctctgt tctctccttc ctttgctttt ctttgaaaag ataatgtatg attatgcttt 240
cactcatatt tatacagaaa cttgatgttt tctttcgagt atatacaagg tgattacatg 300
tacgtttgaa gtacaactct agattttgta gtgccctctt gggctagcgg taaaggtgcg 360
cattttttca caccctacaa tgttctgttc aaaagatttt ggtcaaacgc tgtagaagtg 420
aaagttggtg cgcatgtttc ggcgttcgaa acttctccgc agtgaaagat aaatgatcta 480
atttctacta agtgtagatc aatgttttgc tagataccct ttttttgttt tttatgtct 539
<210> 103
<211> 509
<212> DNA
<213> 人工序列
<220>
<223> CTEC-11的核苷酸序列,所述核苷酸序列包含用于将LbCpf1靶向到YFP基因的引导RNA盒(crRNA)、PAM和引导靶序列以及在3'侧上的供体DNA(2×18 bp引导物),在5'侧上侧接有连接物5序列
<400> 103
aagcgacttc caatcgcttt gcatatccag taccacaccc acaggcgttt tctttgaaaa 60
gataatgtat gattatgctt tcactcatat ttatacagaa acttgatgtt ttctttcgag 120
tatatacaag gtgattacat gtacgtttga agtacaactc tagattttgt agtgccctct 180
tgggctagcg gtaaaggtgc gcattttttc acaccctaca atgttctgtt caaaagattt 240
tggtcaaacg ctgtagaagt gaaagttggt gcgcatgttt cggcgttcga aacttctccg 300
cagtgaaaga taaatgatct aatttctact aagtgtagat caatgttttg ctagatactt 360
tttttgtttt ttatgtcttt tgcaatgttt tgctagatac atttgtacta ctggtaaatt 420
gccagttcca tggccaacct tagtcactac tttaggttat ggtgcaatgt tttgctagat 480
acccagatca tatgaaacaa catgacttt 509
<210> 104
<211> 513
<212> DNA
<213> 人工序列
<220>
<223> CTEC-11的核苷酸序列,所述核苷酸序列包含用于将LbCpf1靶向到YFP基因的引导RNA盒(crRNA)、PAM和引导靶序列以及在3'侧上的供体DNA(2×20 bp引导物),在5'侧上侧接有连接物5序列
<400> 104
aagcgacttc caatcgcttt gcatatccag taccacaccc acaggcgttt tctttgaaaa 60
gataatgtat gattatgctt tcactcatat ttatacagaa acttgatgtt ttctttcgag 120
tatatacaag gtgattacat gtacgtttga agtacaactc tagattttgt agtgccctct 180
tgggctagcg gtaaaggtgc gcattttttc acaccctaca atgttctgtt caaaagattt 240
tggtcaaacg ctgtagaagt gaaagttggt gcgcatgttt cggcgttcga aacttctccg 300
cagtgaaaga taaatgatct aatttctact aagtgtagat caatgttttg ctagataccc 360
tttttttgtt ttttatgtct tttgcaatgt tttgctagat acccatttgt actactggta 420
aattgccagt tccatggcca accttagtca ctactttagg ttatggtgca atgttttgct 480
agatacccag atcatatgaa acaacatgac ttt 513
<210> 105
<211> 509
<212> DNA
<213> 人工序列
<220>
<223> CTEC-12的核苷酸序列,所述核苷酸序列包含用于将LbCpf1靶向到YFP基因的引导RNA盒(crRNA)、PAM和引导靶序列以及在5'侧上的供体DNA(2×18 bp引导物),在5'侧上侧接有连接物5序列
<400> 105
aagcgacttc caatcgcttt gcatatccag taccacaccc acaggcgttt atttgtacta 60
ctggtaaatt gccagttcca tggccaacct tagtcactac tttaggttat ggtgcaatgt 120
tttgctagat acccagatca tatgaaacaa catgactttt ttgcaatgtt ttgctagata 180
ctctttgaaa agataatgta tgattatgct ttcactcata tttatacaga aacttgatgt 240
tttctttcga gtatatacaa ggtgattaca tgtacgtttg aagtacaact ctagattttg 300
tagtgccctc ttgggctagc ggtaaaggtg cgcatttttt cacaccctac aatgttctgt 360
tcaaaagatt ttggtcaaac gctgtagaag tgaaagttgg tgcgcatgtt tcggcgttcg 420
aaacttctcc gcagtgaaag ataaatgatc taatttctac taagtgtaga tcaatgtttt 480
gctagatact ttttttgttt tttatgtct 509
<210> 106
<211> 513
<212> DNA
<213> 人工序列
<220>
<223> CTEC-12的核苷酸序列,所述核苷酸序列包含用于将LbCpf1靶向到YFP基因的引导RNA盒(crRNA)、PAM和引导靶序列以及在5'侧上的供体DNA(2×20 bp引导物),在5'侧上侧接有连接物5序列
<400> 106
aagcgacttc caatcgcttt gcatatccag taccacaccc acaggcgttt atttgtacta 60
ctggtaaatt gccagttcca tggccaacct tagtcactac tttaggttat ggtgcaatgt 120
tttgctagat acccagatca tatgaaacaa catgactttt ttgcaatgtt ttgctagata 180
ccctctttga aaagataatg tatgattatg ctttcactca tatttataca gaaacttgat 240
gttttctttc gagtatatac aaggtgatta catgtacgtt tgaagtacaa ctctagattt 300
tgtagtgccc tcttgggcta gcggtaaagg tgcgcatttt ttcacaccct acaatgttct 360
gttcaaaaga ttttggtcaa acgctgtaga agtgaaagtt ggtgcgcatg tttcggcgtt 420
cgaaacttct ccgcagtgaa agataaatga tctaatttct actaagtgta gatcaatgtt 480
ttgctagata cccttttttt gttttttatg tct 513
<210> 107
<211> 489
<212> DNA
<213> 人工序列
<220>
<223> CTEC-7的核苷酸序列,所述核苷酸序列包含用于将LbCpf1靶向到YFP基因的引导RNA盒(crRNA)和在3'侧上的供体DNA,在3'侧上侧接有连接物3序列
<400> 107
tctttgaaaa gataatgtat gattatgctt tcactcatat ttatacagaa acttgatgtt 60
ttctttcgag tatatacaag gtgattacat gtacgtttga agtacaactc tagattttgt 120
agtgccctct tgggctagcg gtaaaggtgc gcattttttc acaccctaca atgttctgtt 180
caaaagattt tggtcaaacg ctgtagaagt gaaagttggt gcgcatgttt cggcgttcga 240
aacttctccg cagtgaaaga taaatgatct aatttctact aagtgtagat caatgttttg 300
ctagataccc tttttttgtt ttttatgtct atttgtacta ctggtaaatt gccagttcca 360
tggccaacct tagtcactac tttaggttat ggtgcaatgt tttgctagat acccagatca 420
tatgaaacaa catgacttta gaaagcctgt atgcgaagcc acaatccttt ccaacagacc 480
atactaagt 489
<210> 108
<211> 539
<212> DNA
<213> 人工序列
<220>
<223> CTEC-8的核苷酸序列,所述核苷酸序列包含用于将LbCpf1靶向到YFP基因的引导RNA盒(crRNA)、连接物A和在3'侧上的供体DNA,在3'侧上侧接有连接物3序列
<400> 108
tctttgaaaa gataatgtat gattatgctt tcactcatat ttatacagaa acttgatgtt 60
ttctttcgag tatatacaag gtgattacat gtacgtttga agtacaactc tagattttgt 120
agtgccctct tgggctagcg gtaaaggtgc gcattttttc acaccctaca atgttctgtt 180
caaaagattt tggtcaaacg ctgtagaagt gaaagttggt gcgcatgttt cggcgttcga 240
aacttctccg cagtgaaaga taaatgatct aatttctact aagtgtagat caatgttttg 300
ctagataccc tttttttgtt ttttatgtct ttgcccatcg aacgtacaag tactcctctg 360
ttctctcctt cctttgcttt atttgtacta ctggtaaatt gccagttcca tggccaacct 420
tagtcactac tttaggttat ggtgcaatgt tttgctagat acccagatca tatgaaacaa 480
catgacttta gaaagcctgt atgcgaagcc acaatccttt ccaacagacc atactaagt 539
<210> 109
<211> 489
<212> DNA
<213> 人工序列
<220>
<223> CTEC-9的核苷酸序列,所述核苷酸序列包含用于将LbCpf1靶向到YFP基因的引导RNA盒(crRNA)和在5'侧上的供体DNA,在3'侧上侧接有连接物3序列
<400> 109
atttgtacta ctggtaaatt gccagttcca tggccaacct tagtcactac tttaggttat 60
ggtgcaatgt tttgctagat acccagatca tatgaaacaa catgactttt ctttgaaaag 120
ataatgtatg attatgcttt cactcatatt tatacagaaa cttgatgttt tctttcgagt 180
atatacaagg tgattacatg tacgtttgaa gtacaactct agattttgta gtgccctctt 240
gggctagcgg taaaggtgcg cattttttca caccctacaa tgttctgttc aaaagatttt 300
ggtcaaacgc tgtagaagtg aaagttggtg cgcatgtttc ggcgttcgaa acttctccgc 360
agtgaaagat aaatgatcta atttctacta agtgtagatc aatgttttgc tagataccct 420
ttttttgttt tttatgtcta gaaagcctgt atgcgaagcc acaatccttt ccaacagacc 480
atactaagt 489
<210> 110
<211> 539
<212> DNA
<213> 人工序列
<220>
<223> CTEC-10的核苷酸序列,所述核苷酸序列包含用于将LbCpf1靶向到YFP基因的引导RNA盒(crRNA)、连接物A和在5'侧上的供体DNA,在3'侧上侧接有连接物3序列
<400> 110
atttgtacta ctggtaaatt gccagttcca tggccaacct tagtcactac tttaggttat 60
ggtgcaatgt tttgctagat acccagatca tatgaaacaa catgactttt tgcccatcga 120
acgtacaagt actcctctgt tctctccttc ctttgctttt ctttgaaaag ataatgtatg 180
attatgcttt cactcatatt tatacagaaa cttgatgttt tctttcgagt atatacaagg 240
tgattacatg tacgtttgaa gtacaactct agattttgta gtgccctctt gggctagcgg 300
taaaggtgcg cattttttca caccctacaa tgttctgttc aaaagatttt ggtcaaacgc 360
tgtagaagtg aaagttggtg cgcatgtttc ggcgttcgaa acttctccgc agtgaaagat 420
aaatgatcta atttctacta agtgtagatc aatgttttgc tagataccct ttttttgttt 480
tttatgtcta gaaagcctgt atgcgaagcc acaatccttt ccaacagacc atactaagt 539
<210> 111
<211> 509
<212> DNA
<213> 人工序列
<220>
<223> CTEC-11的核苷酸序列,所述核苷酸序列包含用于将LbCpf1靶向到YFP基因的引导RNA盒(crRNA)、PAM和引导靶序列以及在3'侧上的供体DNA(2×18 bp引导物),在3'侧上侧接有连接物3序列
<400> 111
tctttgaaaa gataatgtat gattatgctt tcactcatat ttatacagaa acttgatgtt 60
ttctttcgag tatatacaag gtgattacat gtacgtttga agtacaactc tagattttgt 120
agtgccctct tgggctagcg gtaaaggtgc gcattttttc acaccctaca atgttctgtt 180
caaaagattt tggtcaaacg ctgtagaagt gaaagttggt gcgcatgttt cggcgttcga 240
aacttctccg cagtgaaaga taaatgatct aatttctact aagtgtagat caatgttttg 300
ctagatactt tttttgtttt ttatgtcttt tgcaatgttt tgctagatac atttgtacta 360
ctggtaaatt gccagttcca tggccaacct tagtcactac tttaggttat ggtgcaatgt 420
tttgctagat acccagatca tatgaaacaa catgacttta gaaagcctgt atgcgaagcc 480
acaatccttt ccaacagacc atactaagt 509
<210> 112
<211> 509
<212> DNA
<213> 人工序列
<220>
<223> CTEC-11的核苷酸序列,所述核苷酸序列包含用于将LbCpf1靶向到YFP基因的引导RNA盒(crRNA)、PAM和引导靶序列以及在3'侧上的供体DNA(2×20 bp引导物),在3'侧上侧接有连接物3序列
<400> 112
tctttgaaaa gataatgtat gattatgctt tcactcatat ttatacagaa acttgatgtt 60
ttctttcgag tatatacaag gtgattacat gtacgtttga agtacaactc tagattttgt 120
agtgccctct tgggctagcg gtaaaggtgc gcattttttc acaccctaca atgttctgtt 180
caaaagattt tggtcaaacg ctgtagaagt gaaagttggt gcgcatgttt cggcgttcga 240
aacttctccg cagtgaaaga taaatgatct aatttctact aagtgtagat caatgttttg 300
ctagatactt tttttgtttt ttatgtcttt tgcaatgttt tgctagatac atttgtacta 360
ctggtaaatt gccagttcca tggccaacct tagtcactac tttaggttat ggtgcaatgt 420
tttgctagat acccagatca tatgaaacaa catgacttta gaaagcctgt atgcgaagcc 480
acaatccttt ccaacagacc atactaagt 509
<210> 113
<211> 513
<212> DNA
<213> 人工序列
<220>
<223> CTEC-12的核苷酸序列,所述核苷酸序列包含用于将LbCpf1靶向到YFP基因的引导RNA盒(crRNA)、PAM和引导靶序列以及在5'侧上的供体DNA(2×18 bp引导物),在3'侧上侧接有连接物3序列
<400> 113
tctttgaaaa gataatgtat gattatgctt tcactcatat ttatacagaa acttgatgtt 60
ttctttcgag tatatacaag gtgattacat gtacgtttga agtacaactc tagattttgt 120
agtgccctct tgggctagcg gtaaaggtgc gcattttttc acaccctaca atgttctgtt 180
caaaagattt tggtcaaacg ctgtagaagt gaaagttggt gcgcatgttt cggcgttcga 240
aacttctccg cagtgaaaga taaatgatct aatttctact aagtgtagat caatgttttg 300
ctagataccc tttttttgtt ttttatgtct tttgcaatgt tttgctagat acccatttgt 360
actactggta aattgccagt tccatggcca accttagtca ctactttagg ttatggtgca 420
atgttttgct agatacccag atcatatgaa acaacatgac tttagaaagc ctgtatgcga 480
agccacaatc ctttccaaca gaccatacta agt 513
<210> 114
<211> 513
<212> DNA
<213> 人工序列
<220>
<223> CTEC-12的核苷酸序列,所述核苷酸序列包含用于将LbCpf1靶向到YFP基因的引导RNA盒(crRNA)、PAM和引导靶序列以及在5'侧上的供体DNA(2×20 bp引导物),在3'侧上侧接有连接物3序列
<400> 114
atttgtacta ctggtaaatt gccagttcca tggccaacct tagtcactac tttaggttat 60
ggtgcaatgt tttgctagat acccagatca tatgaaacaa catgactttt ttgcaatgtt 120
ttgctagata ccctctttga aaagataatg tatgattatg ctttcactca tatttataca 180
gaaacttgat gttttctttc gagtatatac aaggtgatta catgtacgtt tgaagtacaa 240
ctctagattt tgtagtgccc tcttgggcta gcggtaaagg tgcgcatttt ttcacaccct 300
acaatgttct gttcaaaaga ttttggtcaa acgctgtaga agtgaaagtt ggtgcgcatg 360
tttcggcgtt cgaaacttct ccgcagtgaa agataaatga tctaatttct actaagtgta 420
gatcaatgtt ttgctagata cccttttttt gttttttatg tctagaaagc ctgtatgcga 480
agccacaatc ctttccaaca gaccatacta agt 513
<210> 115
<211> 598
<212> DNA
<213> 人工序列
<220>
<223> CTEC-1的核苷酸序列,所述核苷酸序列包含用于将Cas9靶向到YFP基因的引导RNA盒(sgRNA)和在3'侧上的编码移码的60 bp供体DNA
<400> 115
cggagctagc atgcggccgc tctagaacta gtggatcccc cgggctgcag tctttgaaaa 60
gataatgtat gattatgctt tcactcatat ttatacagaa acttgatgtt ttctttcgag 120
tatatacaag gtgattacat gtacgtttga agtacaactc tagattttgt agtgccctct 180
tgggctagcg gtaaaggtgc gcattttttc acaccctaca atgttctgtt caaaagattt 240
tggtcaaacg ctgtagaagt gaaagttggt gcgcatgttt cggcgttcga aacttctccg 300
cagtgaaaga taaatgatct tagtcactac tttaggttag ttttagagct agaaatagca 360
agttaaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtggtgctt 420
tttttgtttt ttatgtcttt ccatggccaa ccttagtcac tactttagtt atggtttgca 480
atgttttgct agatacccga aaccttcgaa tccagccagc atgtcgacac ccacaagatg 540
tagtgcacgg ggggcccggt acccagcttt tgttcccttt agtgagggtt aattccga 598
<210> 116
<211> 618
<212> DNA
<213> 人工序列
<220>
<223> CTEC-1的核苷酸序列,所述核苷酸序列包含用于将Cas9靶向到YFP基因的引导RNA盒(sgRNA)和在3'侧上的编码移码的80 bp供体DNA
<400> 116
cggagctagc atgcggccgc tctagaacta gtggatcccc cgggctgcag tctttgaaaa 60
gataatgtat gattatgctt tcactcatat ttatacagaa acttgatgtt ttctttcgag 120
tatatacaag gtgattacat gtacgtttga agtacaactc tagattttgt agtgccctct 180
tgggctagcg gtaaaggtgc gcattttttc acaccctaca atgttctgtt caaaagattt 240
tggtcaaacg ctgtagaagt gaaagttggt gcgcatgttt cggcgttcga aacttctccg 300
cagtgaaaga taaatgatct tagtcactac tttaggttag ttttagagct agaaatagca 360
agttaaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtggtgctt 420
tttttgtttt ttatgtctaa attgccagtt ccatggccaa ccttagtcac tactttagtt 480
atggtttgca atgttttgct agatacccag atcatatgga aaccttcgaa tccagccagc 540
atgtcgacac ccacaagatg tagtgcacgg ggggcccggt acccagcttt tgttcccttt 600
agtgagggtt aattccga 618
<210> 117
<211> 638
<212> DNA
<213> 人工序列
<220>
<223> CTEC-1的核苷酸序列,所述核苷酸序列包含用于将Cas9靶向到YFP基因的引导RNA盒(sgRNA)和在3'侧上的编码移码的100 bp供体DNA
<400> 117
cggagctagc atgcggccgc tctagaacta gtggatcccc cgggctgcag tctttgaaaa 60
gataatgtat gattatgctt tcactcatat ttatacagaa acttgatgtt ttctttcgag 120
tatatacaag gtgattacat gtacgtttga agtacaactc tagattttgt agtgccctct 180
tgggctagcg gtaaaggtgc gcattttttc acaccctaca atgttctgtt caaaagattt 240
tggtcaaacg ctgtagaagt gaaagttggt gcgcatgttt cggcgttcga aacttctccg 300
cagtgaaaga taaatgatct tagtcactac tttaggttag ttttagagct agaaatagca 360
agttaaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtggtgctt 420
tttttgtttt ttatgtctta ctactggtaa attgccagtt ccatggccaa ccttagtcac 480
tactttagtt atggtttgca atgttttgct agatacccag atcatatgaa acaacatgga 540
aaccttcgaa tccagccagc atgtcgacac ccacaagatg tagtgcacgg ggggcccggt 600
acccagcttt tgttcccttt agtgagggtt aattccga 638
<210> 118
<211> 598
<212> DNA
<213> 人工序列
<220>
<223> CTEC-1的核苷酸序列,所述核苷酸序列包含用于将Cas9靶向到YFP基因的引导RNA盒(sgRNA)和在3'侧上的编码YFP表达盒的完全敲除的60 bp供体DNA
<400> 118
cggagctagc atgcggccgc tctagaacta gtggatcccc cgggctgcag tctttgaaaa 60
gataatgtat gattatgctt tcactcatat ttatacagaa acttgatgtt ttctttcgag 120
tatatacaag gtgattacat gtacgtttga agtacaactc tagattttgt agtgccctct 180
tgggctagcg gtaaaggtgc gcattttttc acaccctaca atgttctgtt caaaagattt 240
tggtcaaacg ctgtagaagt gaaagttggt gcgcatgttt cggcgttcga aacttctccg 300
cagtgaaaga taaatgatct tagtcactac tttaggttag ttttagagct agaaatagca 360
agttaaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtggtgctt 420
tttttgtttt ttatgtctcg tgctgagctc aacagtgccc aacccttgat tctttgtcat 480
cagacaactt gttgagtgga aaccttcgaa tccagccagc atgtcgacac ccacaagatg 540
tagtgcacgg ggggcccggt acccagcttt tgttcccttt agtgagggtt aattccga 598
<210> 119
<211> 618
<212> DNA
<213> 人工序列
<220>
<223> CTEC-1的核苷酸序列,所述核苷酸序列包含用于将Cas9靶向到YFP基因的引导RNA盒(sgRNA)和在3'侧上的编码YFP表达盒的完全敲除的80 bp供体DNA
<400> 119
cggagctagc atgcggccgc tctagaacta gtggatcccc cgggctgcag tctttgaaaa 60
gataatgtat gattatgctt tcactcatat ttatacagaa acttgatgtt ttctttcgag 120
tatatacaag gtgattacat gtacgtttga agtacaactc tagattttgt agtgccctct 180
tgggctagcg gtaaaggtgc gcattttttc acaccctaca atgttctgtt caaaagattt 240
tggtcaaacg ctgtagaagt gaaagttggt gcgcatgttt cggcgttcga aacttctccg 300
cagtgaaaga taaatgatct tagtcactac tttaggttag ttttagagct agaaatagca 360
agttaaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtggtgctt 420
tttttgtttt ttatgtctgc aatagttgcg tgctgagctc aacagtgccc aacccttgat 480
tctttgtcat cagacaactt gttgagtggt actaaaggga aaccttcgaa tccagccagc 540
atgtcgacac ccacaagatg tagtgcacgg ggggcccggt acccagcttt tgttcccttt 600
agtgagggtt aattccga 618
<210> 120
<211> 638
<212> DNA
<213> 人工序列
<220>
<223> CTEC-1的核苷酸序列,所述核苷酸序列包含用于将Cas9靶向到YFP基因的引导RNA盒(sgRNA)和在3'侧上的编码YFP表达盒的完全敲除的100 bp供体DNA
<400> 120
cggagctagc atgcggccgc tctagaacta gtggatcccc cgggctgcag tctttgaaaa 60
gataatgtat gattatgctt tcactcatat ttatacagaa acttgatgtt ttctttcgag 120
tatatacaag gtgattacat gtacgtttga agtacaactc tagattttgt agtgccctct 180
tgggctagcg gtaaaggtgc gcattttttc acaccctaca atgttctgtt caaaagattt 240
tggtcaaacg ctgtagaagt gaaagttggt gcgcatgttt cggcgttcga aacttctccg 300
cagtgaaaga taaatgatct tagtcactac tttaggttag ttttagagct agaaatagca 360
agttaaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtggtgctt 420
tttttgtttt ttatgtctct tcatgccagc aatagttgcg tgctgagctc aacagtgccc 480
aacccttgat tctttgtcat cagacaactt gttgagtggt actaaaggag tgcttttcga 540
aaccttcgaa tccagccagc atgtcgacac ccacaagatg tagtgcacgg ggggcccggt 600
acccagcttt tgttcccttt agtgagggtt aattccga 638
<210> 121
<211> 438
<212> DNA
<213> 人工序列
<220>
<223> 用于将Cas9靶向到CSN009基因组中的YFP表达盒的完整引导RNA表达盒(sgRNA)的核苷酸序列
<400> 121
cggagctagc atgcggccgc tctagaacta gtggatcccc cgggctgcag tctttgaaaa 60
gataatgtat gattatgctt tcactcatat ttatacagaa acttgatgtt ttctttcgag 120
tatatacaag gtgattacat gtacgtttga agtacaactc tagattttgt agtgccctct 180
tgggctagcg gtaaaggtgc gcattttttc acaccctaca atgttctgtt caaaagattt 240
tggtcaaacg ctgtagaagt gaaagttggt gcgcatgttt cggcgttcga aacttctccg 300
cagtgaaaga taaatgatct tagtcactac tttaggttag ttttagagct agaaatagca 360
agttaaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtggtgctt 420
tttttgtttt ttatgtct 438
<210> 122
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 菌株CSN009中通过Cas9靶向YFP的CTEC片段的引导序列(基因组靶标)的核苷酸序列
<400> 122
ttagtcacta ctttaggtta 20
<210> 123
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 编码YFP基因中的移码的60 bp供体DNA的核苷酸序列
<400> 123
ttccatggcc aaccttagtc actactttag ttatggtttg caatgttttg ctagataccc 60
<210> 124
<211> 80
<212> DNA
<213> 人工序列
<220>
<223> 编码YFP基因中的移码的80 bp供体DNA的核苷酸序列
<400> 124
aaattgccag ttccatggcc aaccttagtc actactttag ttatggtttg caatgttttg 60
ctagataccc agatcatatg 80
<210> 125
<211> 100
<212> DNA
<213> 人工序列
<220>
<223> 编码YFP基因中的移码的100 bp供体DNA的核苷酸序列
<400> 125
tactactggt aaattgccag ttccatggcc aaccttagtc actactttag ttatggtttg 60
caatgttttg ctagataccc agatcatatg aaacaacatg 100
<210> 126
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 编码YFP表达盒的敲除的60 bp供体DNA的核苷酸序列
<400> 126
cgtgctgagc tcaacagtgc ccaacccttg attctttgtc atcagacaac ttgttgagtg 60
<210> 127
<211> 80
<212> DNA
<213> 人工序列
<220>
<223> 编码YFP表达盒的敲除的80 bp供体DNA的核苷酸序列
<400> 127
gcaatagttg cgtgctgagc tcaacagtgc ccaacccttg attctttgtc atcagacaac 60
ttgttgagtg gtactaaagg 80
<210> 128
<211> 100
<212> DNA
<213> 人工序列
<220>
<223> 编码YFP表达盒的敲除的100 bp供体DNA的核苷酸序列
<400> 128
cttcatgcca gcaatagttg cgtgctgagc tcaacagtgc ccaacccttg attctttgtc 60
atcagacaac ttgttgagtg gtactaaagg agtgcttttc 100
<210> 129
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 用于扩增侧接有与线性化pRN1120载体骨架片段(经EcoRI和XhoI消化的)同源的50 bp序列的CTEC片段(SEQ ID NO: 115、SEQ ID NO: 116、SEQ ID NO: 117、SEQ ID NO:118、SEQ ID NO: 119和SEQ ID NO: 120)的正向引物的核苷酸序列
<400> 129
cggagctagc atgcggccg 19
<210> 130
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 用于扩增侧接有与线性化pRN1120载体骨架片段(经EcoRI和XhoI消化的)同源的50 bp序列的CTEC片段(SEQ ID NO: 115、SEQ ID NO: 116、SEQ ID NO: 117、SEQ ID NO:118、SEQ ID NO: 119和SEQ ID NO: 120)的反向引物的核苷酸序列
<400> 130
tcggaattaa ccctcactaa agg 23
<210> 131
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> 连接物F(CONF)的核苷酸序列
<400> 131
gaaaccttcg aatccagcca gcatgtcgac acccacaaga tgtagtgcac 50
<210> 132
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 野生型基因组靶标的核苷酸序列(实施例4)
<400> 132
ttagtcacta ctttaggtta 20
<210> 133
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 经修饰的基因组靶标的核苷酸序列(实施例4)
<400> 133
ttagtcacta ctttagtta 19
<210> 134
<211> 1587
<212> DNA
<213> 人工序列
<220>
<223> CTEC DNA片段3的核苷酸序列,所述核苷酸序列包含用于将Cas9靶向到GFP基因的引导RNA表达盒(sgRNA)和在3'侧上的100 bp供体DNA,所述供体DNA编码PAM序列中的2个碱基修饰,将其从CGG改变至TAG
<400> 134
acgaagaact gcggtcaggt gacacaactt tttccatctc agggtgtgtc gcgtgtgctt 60
catccaaact ttagttgggg ttcgggttcg cgcgagatga tcacgtgccc tgatttggtg 120
tcgtcccccg tcgcgctgcg cacgtgattt atttatttcc ggtggctgct gtctacgcgg 180
ggccttctct gcccttctgt ttcaaccttc gggcggttct cgtaaccagc agtagcaatc 240
catttcgaaa ctcaaagagc taaaaacgtt aaacctcagc agtcgctcga cgaatgggct 300
gcggttggga agcccacgag gcctatagcc agagcctcga gttgacagga gcccagacgc 360
cttttccaac ggcaactttt atataaaatg gcaatgtatt catgcaattg cggccgtgtc 420
aggttggaga cactggacca cactctccat tgcttcctga ggagatggat cattgctagt 480
gcatctacgc gcagcaatcc cgcaagctcg acaaccgtag atgggctttg gtgggccaat 540
caattacgca acccgcacgt taaattgtat gaggaaggaa ggccacggta caaagtgggt 600
ggtcttcacc cagtggttgt tggtggcgtc atgcagacca tgcattgggg atagcacagg 660
gttggggtgt cttgtggact caatgggtga aaggagatgg aaaagggcgg tgaaaagtgg 720
tagaatcgaa atccctgacg tcaatttata aagtaaaatg cgtttctgcc attttgctcc 780
cctccttctt tcgcaatcgc ctccccaaaa gttgtcgtgg cagtacacat gcttgcatac 840
aatgaagcta atccggcttg ctcagtagtt gctatatcca ggcatggtgt gaaacccctc 900
aaagtatata taggagcggt gagccccagt ctggggtctt ttctctccat ctcaaaacta 960
ctttctcaca atggtattgc tgatgagtcc gtgaggacga aacgagtaag ctcgtccaat 1020
acccttaagc tcgattgttt tagagctaga aatagcaagt taaaataagg ctagtccgtt 1080
atcaacttga aaaagtggca ccgagtcggt gcttttggcc ggcatggtcc cagcctcctc 1140
gctggcgccg gctgggcaac atgcttcggc atggcgaatg ggactaaact tcgagctaat 1200
ccagtagctt acgttaccca ggggcaggtc aactggctag ccacgagtct gtcccaggtc 1260
gcaatttagt gtaataaaca atatatatat tgagtctaaa gggaattgta gctattgtga 1320
ttgtgtgatt ttcgtcttgc tggttcttat tgtgtcccat tcgtttcatc ctgatgagga 1380
cccctggaac cggtgttttc ttagtctctg caatcgctag tcttgttgct atgacagttg 1440
cgtcgacact attcaggtca tctatcggtt attctgatat tataatatcc agcttgtgac 1500
cgagaatgtt accatcctcc ttgaaatcaa tacccttaag ctcgatttag ttaacgaggg 1560
tatcaccctc aaacttaacc tcagctc 1587
<210> 135
<211> 1587
<212> DNA
<213> 人工序列
<220>
<223> CTEC DNA片段4的核苷酸序列,所述核苷酸序列包含用于将Cas9靶向到GFP基因的引导RNA表达盒(sgRNA)和100 bp的供体DNA,所述供体DNA通过将PAM序列从CGG改变至CGA来编码GFP基因中的沉默突变。
<400> 135
acgaagaact gcggtcaggt gacacaactt tttccatctc agggtgtgtc gcgtgtgctt 60
catccaaact ttagttgggg ttcgggttcg cgcgagatga tcacgtgccc tgatttggtg 120
tcgtcccccg tcgcgctgcg cacgtgattt atttatttcc ggtggctgct gtctacgcgg 180
ggccttctct gcccttctgt ttcaaccttc gggcggttct cgtaaccagc agtagcaatc 240
catttcgaaa ctcaaagagc taaaaacgtt aaacctcagc agtcgctcga cgaatgggct 300
gcggttggga agcccacgag gcctatagcc agagcctcga gttgacagga gcccagacgc 360
cttttccaac ggcaactttt atataaaatg gcaatgtatt catgcaattg cggccgtgtc 420
aggttggaga cactggacca cactctccat tgcttcctga ggagatggat cattgctagt 480
gcatctacgc gcagcaatcc cgcaagctcg acaaccgtag atgggctttg gtgggccaat 540
caattacgca acccgcacgt taaattgtat gaggaaggaa ggccacggta caaagtgggt 600
ggtcttcacc cagtggttgt tggtggcgtc atgcagacca tgcattgggg atagcacagg 660
gttggggtgt cttgtggact caatgggtga aaggagatgg aaaagggcgg tgaaaagtgg 720
tagaatcgaa atccctgacg tcaatttata aagtaaaatg cgtttctgcc attttgctcc 780
cctccttctt tcgcaatcgc ctccccaaaa gttgtcgtgg cagtacacat gcttgcatac 840
aatgaagcta atccggcttg ctcagtagtt gctatatcca ggcatggtgt gaaacccctc 900
aaagtatata taggagcggt gagccccagt ctggggtctt ttctctccat ctcaaaacta 960
ctttctcaca atggtattgc tgatgagtcc gtgaggacga aacgagtaag ctcgtccaat 1020
acccttaagc tcgattgttt tagagctaga aatagcaagt taaaataagg ctagtccgtt 1080
atcaacttga aaaagtggca ccgagtcggt gcttttggcc ggcatggtcc cagcctcctc 1140
gctggcgccg gctgggcaac atgcttcggc atggcgaatg ggactaaact tcgagctaat 1200
ccagtagctt acgttaccca ggggcaggtc aactggctag ccacgagtct gtcccaggtc 1260
gcaatttagt gtaataaaca atatatatat tgagtctaaa gggaattgta gctattgtga 1320
ttgtgtgatt ttcgtcttgc tggttcttat tgtgtcccat tcgtttcatc ctgatgagga 1380
cccctggaac cggtgttttc ttagtctctg caatcgctag tcttgttgct atgacagttg 1440
cgtcgacact attcaggtca tctatcggtt attctgatat tataatactc cagcttgtga 1500
ccgagaatgt taccatcctc ctagaaatca atacccttaa gctcgattcg attaacgagg 1560
gtatcaccct caaacttaac ctcagct 1587
<210> 136
<211> 973
<212> DNA
<213> 人工序列
<220>
<223> 耶氏酵母属Yl_HYPO启动子的核苷酸序列
<400> 136
acgaagaact gcggtcaggt gacacaactt tttccatctc agggtgtgtc gcgtgtgctt 60
catccaaact ttagttgggg ttcgggttcg cgcgagatga tcacgtgccc tgatttggtg 120
tcgtcccccg tcgcgctgcg cacgtgattt atttatttcc ggtggctgct gtctacgcgg 180
ggccttctct gcccttctgt ttcaaccttc gggcggttct cgtaaccagc agtagcaatc 240
catttcgaaa ctcaaagagc taaaaacgtt aaacctcagc agtcgctcga cgaatgggct 300
gcggttggga agcccacgag gcctatagcc agagcctcga gttgacagga gcccagacgc 360
cttttccaac ggcaactttt atataaaatg gcaatgtatt catgcaattg cggccgtgtc 420
aggttggaga cactggacca cactctccat tgcttcctga ggagatggat cattgctagt 480
gcatctacgc gcagcaatcc cgcaagctcg acaaccgtag atgggctttg gtgggccaat 540
caattacgca acccgcacgt taaattgtat gaggaaggaa ggccacggta caaagtgggt 600
ggtcttcacc cagtggttgt tggtggcgtc atgcagacca tgcattgggg atagcacagg 660
gttggggtgt cttgtggact caatgggtga aaggagatgg aaaagggcgg tgaaaagtgg 720
tagaatcgaa atccctgacg tcaatttata aagtaaaatg cgtttctgcc attttgctcc 780
cctccttctt tcgcaatcgc ctccccaaaa gttgtcgtgg cagtacacat gcttgcatac 840
aatgaagcta atccggcttg ctcagtagtt gctatatcca ggcatggtgt gaaacccctc 900
aaagtatata taggagcggt gagccccagt ctggggtctt ttctctccat ctcaaaacta 960
ctttctcaca atg 973
<210> 137
<211> 6
<212> DNA
<213> 人工序列
<220>
<223> GFP基因的引导序列的6 bp反向重复序列的核苷酸序列
<400> 137
gtattg 6
<210> 138
<211> 37
<212> DNA
<213> 人工序列
<220>
<223> HH核酶的核苷酸序列
<400> 138
ctgatgagtc cgtgaggacg aaacgagtaa gctcgtc 37
<210> 139
<211> 148
<212> DNA
<213> 人工序列
<220>
<223> HDV核酶的核苷酸序列
<400> 139
gttttagagc tagaaatagc aagttaaaat aaggctagtc cgttatcaac ttgaaaaagt 60
ggcaccgagt cggtgctttt ggccggcatg gtcccagcct cctcgctggc gccggctggg 120
caacatgctt cggcatggcg aatgggac 148
<210> 140
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> GFP基因的20 bp基因组靶序列的核苷酸序列
<400> 140
caataccctt aagctcgatt 20
<210> 141
<211> 303
<212> DNA
<213> 人工序列
<220>
<223> 耶氏酵母属Yl_PGM终止子的核苷酸序列
<400> 141
taaacttcga gctaatccag tagcttacgt tacccagggg caggtcaact ggctagccac 60
gagtctgtcc caggtcgcaa tttagtgtaa taaacaatat atatattgag tctaaaggga 120
attgtagcta ttgtgattgt gtgattttcg tcttgctggt tcttattgtg tcccattcgt 180
ttcatcctga tgaggacccc tggaaccggt gttttcttag tctctgcaat cgctagtctt 240
gttgctatga cagttgcgtc gacactattc aggtcatcta tcggttattc tgatattata 300
ata 303
<210> 142
<211> 1487
<212> DNA
<213> 人工序列
<220>
<223> 靶向GFP基因的引导RNA表达盒(sgRNA)的核苷酸序列
<400> 142
acgaagaact gcggtcaggt gacacaactt tttccatctc agggtgtgtc gcgtgtgctt 60
catccaaact ttagttgggg ttcgggttcg cgcgagatga tcacgtgccc tgatttggtg 120
tcgtcccccg tcgcgctgcg cacgtgattt atttatttcc ggtggctgct gtctacgcgg 180
ggccttctct gcccttctgt ttcaaccttc gggcggttct cgtaaccagc agtagcaatc 240
catttcgaaa ctcaaagagc taaaaacgtt aaacctcagc agtcgctcga cgaatgggct 300
gcggttggga agcccacgag gcctatagcc agagcctcga gttgacagga gcccagacgc 360
cttttccaac ggcaactttt atataaaatg gcaatgtatt catgcaattg cggccgtgtc 420
aggttggaga cactggacca cactctccat tgcttcctga ggagatggat cattgctagt 480
gcatctacgc gcagcaatcc cgcaagctcg acaaccgtag atgggctttg gtgggccaat 540
caattacgca acccgcacgt taaattgtat gaggaaggaa ggccacggta caaagtgggt 600
ggtcttcacc cagtggttgt tggtggcgtc atgcagacca tgcattgggg atagcacagg 660
gttggggtgt cttgtggact caatgggtga aaggagatgg aaaagggcgg tgaaaagtgg 720
tagaatcgaa atccctgacg tcaatttata aagtaaaatg cgtttctgcc attttgctcc 780
cctccttctt tcgcaatcgc ctccccaaaa gttgtcgtgg cagtacacat gcttgcatac 840
aatgaagcta atccggcttg ctcagtagtt gctatatcca ggcatggtgt gaaacccctc 900
aaagtatata taggagcggt gagccccagt ctggggtctt ttctctccat ctcaaaacta 960
ctttctcaca atggtattgc tgatgagtcc gtgaggacga aacgagtaag ctcgtccaat 1020
acccttaagc tcgattgttt tagagctaga aatagcaagt taaaataagg ctagtccgtt 1080
atcaacttga aaaagtggca ccgagtcggt gcttttggcc ggcatggtcc cagcctcctc 1140
gctggcgccg gctgggcaac atgcttcggc atggcgaatg ggactaaact tcgagctaat 1200
ccagtagctt acgttaccca ggggcaggtc aactggctag ccacgagtct gtcccaggtc 1260
gcaatttagt gtaataaaca atatatatat tgagtctaaa gggaattgta gctattgtga 1320
ttgtgtgatt ttcgtcttgc tggttcttat tgtgtcccat tcgtttcatc ctgatgagga 1380
cccctggaac cggtgttttc ttagtctctg caatcgctag tcttgttgct atgacagttg 1440
cgtcgacact attcaggtca tctatcggtt attctgatat tataata 1487
<210> 143
<211> 100
<212> DNA
<213> 人工序列
<220>
<223> CTEC DNA片段1的100 bp供体DNA的核苷酸序列
<400> 143
gggaaacatg tcctggactt acaacttgct tcgctcttga tcttcggata gtagtataag 60
tgtgtgtgtt ggtgctaata atccgtcctc tccacccctt 100
<210> 144
<211> 100
<212> DNA
<213> 人工序列
<220>
<223> CTEC DNA片段2的100 bp供体DNA的核苷酸序列
<400> 144
tccagcttgt gaccgagaat gttaccatcc tccttgaaat caataccctt aagctcgatt 60
cgttaacgag ggtatcaccc tcaaacttaa cctcagctcg 100
<210> 145
<211> 100
<212> DNA
<213> 人工序列
<220>
<223> CTEC DNA片段3的100 bp供体DNA的核苷酸序列
<400> 145
tccagcttgt gaccgagaat gttaccatcc tccttgaaat caataccctt aagctcgatt 60
tagttaacga gggtatcacc ctcaaactta acctcagctc 100
<210> 146
<211> 100
<212> DNA
<213> 人工序列
<220>
<223> CTEC DNA片段4的100 bp供体DNA的核苷酸序列
<400> 146
ctccagcttg tgaccgagaa tgttaccatc ctcctagaaa tcaataccct taagctcgat 60
tcgattaacg agggtatcac cctcaaactt aacctcagct 100
<210> 147
<211> 11606
<212> DNA
<213> 人工序列
<220>
<223> 质粒MB7452的核苷酸序列
<400> 147
cgcgtggatc gccggtgcgt tgacgttggt gacctccagc cagaggtgcc cggcgccccg 60
ctcgccggcg aactccgtcg cgagccccat caacgcgcgc ccgaccccgt gcccccggtg 120
ctccggggcg acctcgatgt cctcgacggt cagccggcgg ttccacgccg agtacgagat 180
gaccacgaag cccgccaggt cgccgtcgtc cccgtacgcg acgaacgtcc gggagtccgg 240
gtcgccgtcc tccccgtcgt ccgattcgtc gtccgattcg tcgtcgggga acaccttggt 300
caggggcggg tccaccggca cctcccgcag ggtgaagccg tccccggtgg cggtgacgcg 360
gaagacggtg tcggtggtga aggacccatc cagtgcctcg atggcctcgg cgtcccccgg 420
gacactggtg cggtaccggt aagccgtgtc gtcaagagtg gtcatttttg tgtctaggtg 480
tttgtgtttg gactgcgatc agtgaagaaa agaagaggaa aaattgtgca agaaattttg 540
ctttcaagac ttggctgatg cagcagggta actctgggac acagacctat gtttgtggtt 600
aaactcaatg cacgtggtac gtgcgtggag cgcttaccca tccaagggtg tggacatgga 660
accgacggtc cgtggagttg tgtaatgtca ttttggcgac tcttgaagca aggctataaa 720
aaaattgtgt ggcttgagtc ttatcgagct cggtcactac aagagttaat cttcctgtct 780
caggcagaca ggtcaggcag ggttactttt gggtgtgctg taactcactg tatggccgtt 840
agtgcgcata gacgttgtac atactggacc gaattgtagc gtgctcaata gggccaataa 900
agctattgta gggatccgaa ttttcagaac ctaatttatc tgttacccgg cctgtggctc 960
gcacagctta aaaatggtca aactttcccc ttcttgtctt tttttcctca cattcatcag 1020
gttcttgtct tgatctttca agtgagtatt aattaccgac cttggttctt cattgggaga 1080
gcattggaag ccgtggtgca gcaaccacaa aacggttctt ccccttcgat accttcttgc 1140
ctgcctttca atacaagtcg gctcgattag cggtggtcgc ccccgccagc ggagaacatg 1200
gaactaaccc agaatgagag ctaagtggag aaagaagaga gtcagacgac tcaagcgaaa 1260
gcgccgcaag gtccgagctc gatccaaata agcggttttt aacggagatt taacactaaa 1320
tcgaagaact tttcccgttt catttgcgaa tgagctcgtt aacaaaatcc cccagttttt 1380
ttatccagct gtaaggattg acattagtaa tgaattattg tttggtatat ttaaatctgt 1440
agttcctttc tgtccgtgtc ggcaactgtc gtactcgtga tttacttgta ttgacgaata 1500
cttactgtag cgcactctgc tgctactggt cgtaaggatg tgctatttcg gtgtatggtg 1560
ggttttttgg gggtcggaac cgaagactgt tacacgggca cggctcgttg tgtacacgca 1620
cagagctctt gcgagtcatg ttgtagctag ctcgtcgtgt tcaggaactg ttcgatggtt 1680
cggagagagt cgccgcccag aacatacgcg caccgatgtc agcagacagc cttattacaa 1740
gtatattcaa gcaagtatat ccgtagggtg cgggtgattt ggatctaagg ttcgtactca 1800
acactcacga gcagcttgcc tatgttacat ccttttatca gacataacat aattggagtt 1860
tacttacaca cggggtgtac ctgtatgagc accacctaca attgtagcac tggtacttgt 1920
acaaagaatt tattcgtacg aatcacaggg acggccgccc tcaccgaacc agcgaatacc 1980
tcagcggtcc cctgcagtga ctcaacaaag cgatatgaac atcttgcgat ggtatcctgc 2040
tgatagtttt tactgtacaa acacctgtgt agctccttct agcattttta agttattcac 2100
acctcaaggg gagggataaa ttaaataaat tccaaaagcg aagatcgaga aactaaatta 2160
aaattccaaa aacgaagttg gaacacaacc ccccgaaaaa aaacaacaaa caaaaaaccc 2220
aacaaaataa acaaaaacaa aataaatata taactaccag tatctgacta aaagttcaaa 2280
tactcgtact tacaacaaat agaaatgagc cggccaaaat tctgcagaaa aaaatttcaa 2340
acaagtactg gtataattaa attaaaaaac acatcaaagt atcataacgt tagttatttt 2400
attttattta ataaaagaaa acaacaagat gggctcaaaa ctttcaactt atacgataca 2460
taccaaataa caatttagta tttatctaag tgcttttcgt agataatgga atacaaatgg 2520
atatccagag tatacacatg gatagtatac actgacacga caattctgta tctctttatg 2580
ttaactactg tgaggcatta aatagagctt gatatataaa atgttacatt tcacagtctg 2640
aacttttgca gattacctaa tttggtaaga tattaattat gaactgaaag ttgatggcat 2700
ccctaaattt gatgaaagat gaaattgtaa atgaggtggt aaaagagcta cagtcgtttt 2760
gttttgagat accatcatct ctaacgaaat atctattaaa aatctcagtg tgatcatgag 2820
tcattgccat cctggaaaat gtcatcatgg ctgatatttc taactgttta cttgagataa 2880
atatatattt acaagaactt cccttgaaat taatttagat ataaaatgtt tgcgggcaag 2940
ttactacgag gaataaatta tatctagagg ttccgcttcc tcgctcactg actcgctgcg 3000
ctcggtcgtt cggctgcggc gagcggtatc agctcactca aaggcggtaa tacggttatc 3060
cacagaatca ggggataacg caggaaagaa catgtgagca aaaggccagc aaaaggccag 3120
gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg ctccgccccc ctgacgagca 3180
tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg acaggactat aaagatacca 3240
ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg 3300
atacctgtcc gcctttctcc cttcgggaag cgtggcgctt tctcatagct cacgctgtag 3360
gtatctcagt tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt 3420
tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc cggtaagaca 3480
cgacttatcg ccactggcag cagccactgg taacaggatt agcagagcga ggtatgtagg 3540
cggtgctaca gagttcttga agtggtggcc taactacggc tacactagaa ggacagtatt 3600
tggtatctgc gctctgctga agccagttac cttcggaaaa agagttggta gctcttgatc 3660
cggcaaacaa accaccgctg gtagcggtgg tttttttgtt tgcaagcagc agattacgcg 3720
cagaaaaaaa ggatctcaag aagatccttt gatcttttct acggggtctg acgctcagtg 3780
gaacgaaaac tcacgttaag ggattttggt catgagatta tcaaaaagga tcttcaccta 3840
gatcctttta aattaaaaat gaagttttaa atcaatctaa agtatatatg agtaaacttg 3900
gtctgacagt taccaatgct taatcagtga ggcacctatc tcagcgatct gtctatttcg 3960
ttcatccata gttgcctgac tccccgtcgt gtagataact acgatacggg agggcttacc 4020
atctggcccc agtgctgcaa tgataccgcg agacccacgc tcaccggctc cagatttatc 4080
agcaataaac cagccagccg gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc 4140
ctccatccag tctattaatt gttgccggga agctagagta agtagttcgc cagttaatag 4200
tttgcgcaac gttgttgcca ttgctgcagg catcgtggtg tcacgctcgt cgtttggtat 4260
ggcttcattc agctccggtt cccaacgatc aaggcgagtt acatgatccc ccatgttgtg 4320
caaaaaagcg gttagctcct tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt 4380
gttatcactc atggttatgg cagcactgca taattctctt actgtcatgc catccgtaag 4440
atgcttttct gtgactggtg agtactcaac caagtcattc tgagaatagt gtatgcggcg 4500
accgagttgc tcttgcccgg cgtcaacacg ggataatacc gcgccacata gcagaacttt 4560
aaaagtgctc atcattggaa aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct 4620
gttgagatcc agttcgatgt aacccactcg tgcacccaac tgatcttcag catcttttac 4680
tttcaccagc gtttctgggt gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat 4740
aagggcgaca cggaaatgtt gaatactcat actcttcctt tttcaatatt attgaagcat 4800
ttatcagggt tattgtctca tgagcggata catatttgaa tgtatttaga aaaataaaca 4860
aataggggtt ccgcgcacat ttccccgaaa agtgccacct gacgtctaag aaaccattat 4920
tatcatgaca ttaacctata aaaataggcg tatcacgagg ccctttcgtc tggcctagga 4980
agcgacttcc aatcgctttg catatccagt accacaccca caggcgtttg tgctactcta 5040
ctgatagcaa tagatgcgtc ataattggtt ggcccgctga gcctccacag gatactattg 5100
cacataccct ggtcatgtgc agatcagctc atttgtggag actctggagt aacttagacg 5160
acgcctggtt caattgccgc aatgtgcgcc cacgcagata atgtattgag gggtggagcg 5220
cctcttgggg acttgctgta cttgtacggg atattaaacg cactcagcaa gaccatgacg 5280
taaaacacac ctactgtacg atacgtactg taggtattgt actcgtaccc ggtactacaa 5340
atagtacgat actatacgga gtgtatttgt accttgatat acgactggcg gagtgaagag 5400
aaggagttga acaagaccag atggggatat cagccccagt gctttgtatt acaagtacga 5460
gtacttaata gatactgtaa ggctattgat acggatggca gtaagtcatt gagtaagcaa 5520
ttgtggccca gcatctcccc tacgtacttg taccataccc catggagaca ccaatggtct 5580
ttcacgcaca ctgtcgtgtg ctgtatcgca gaatcgggtg tccaaccaaa tgccgttacc 5640
cccacgtcac agccgataga cagatacacc atcaatacca gcaggttgta tcatgcggtt 5700
ggctgaaggt aagctgattg gtctaaaaac tgtagctgtc ctaattcaac gagcgctatt 5760
tggggccaac cacctcggcc aagcggcctt taatctgcgt gccccagagg cgtctaatga 5820
ggctctggcc gccactgtag gagtgtttct ctgtgcgcac acgcagtttt gagtttgggc 5880
gactttccct ttttcccaat tgcgtacaca cacagctccg agctaagcgc tgtccttgaa 5940
ccttctccct cttttccctc tttttctctt ccccttcccc tcctccacat taaggccaaa 6000
tcctgaattg caccaactag tacaacgaca acaatggaca agaagtactc catcggtttg 6060
gacattggta ctaactctgt cggctgggcc gtcatcaccg acgagtacaa ggttccctcc 6120
aagaagttca aggtccttgg caacaccgac cgacactcta tcaagaagaa cctgatcggt 6180
gctctgctgt tcgactctgg cgagactgcc gaggccaccc gactgaagcg aaccgctcga 6240
cgccgataca cccgacgaaa gaaccgaatc tgttacctcc aggagatctt cagcaacgag 6300
atggctaagg tcgacgactc cttcttccac cgactcgagg agtctttcct ggtcgaagag 6360
gataagaagc acgagcgaca ccccatcttc ggcaacattg ttgatgaggt tgcctaccat 6420
gagaagtacc ccaccatcta ccacctccga aagaagctcg tcgactccac tgacaaggct 6480
gacctccgac tcatctacct tgctctcgcc cacatgatca agttccgagg tcacttcctc 6540
attgagggtg atctcaaccc cgacaactcc gacgttgaca agctgttcat ccagctcgtc 6600
cagacctaca accagctctt tgaggagaac cctatcaacg cttctggtgt tgacgccaag 6660
gccattctct ccgcccgact ctctaagtcc cgacgactcg agaacctcat tgcccagctg 6720
cccggcgaga agaagaacgg cctcttcggt aacctgattg ctctctctct tggtctgacc 6780
cccaacttca agtccaactt tgacctcgcc gaggacgcca agctccagct gtccaaggac 6840
acctacgatg acgatctgga caacctcctg gcccagatcg gtgaccagta cgccgatctc 6900
ttccttgccg ccaagaacct ctccgacgcc atcctgctct ccgacatcct ccgagtcaac 6960
accgagatta ccaaggctcc tctgtctgcc tctatgatca agcgatacga cgagcaccac 7020
caggatctca ctcttctcaa ggctctcgtc cgacagcagc tccccgagaa gtacaaggag 7080
attttctttg accagtccaa gaacggttac gctggctaca ttgacggtgg tgcttcccag 7140
gaagagtttt acaagttcat caagcctatt ctggagaaga tggacggtac cgaggagctg 7200
ctcgtcaagc tcaaccgaga ggacctcctt cgaaagcagc gaaccttcga taacggctcc 7260
atcccccacc agatccacct gggtgagctc cacgccattc tccgaagaca agaggacttc 7320
taccccttcc taaaggataa ccgagagaag atcgagaaga ttctcacctt ccgaatcccc 7380
tactacgtcg gtcccctcgc tcgaggtaac tcccgatttg cttggatgac ccgaaagtcc 7440
gaggagacta tcaccccctg gaactttgaa gaggtagtcg acaagggtgc ctccgcccag 7500
tctttcattg agcggatgac caacttcgat aagaacctcc ccaacgagaa ggtccttccc 7560
aagcactctc tcctctacga gtacttcacc gtctacaacg agctgaccaa ggtcaagtac 7620
gttaccgagg gcatgcgaaa gcccgctttc ctctctggtg agcagaagaa ggccattgtc 7680
gacctcctgt tcaagactaa ccgaaaagtc accgtcaagc agctcaagga agactacttc 7740
aagaagattg agtgcttcga ctccgtcgag atttccggtg tcgaggaccg attcaacgcc 7800
tccctcggca cctaccacga tcttctgaag atcatcaagg acaaggactt tcttgataac 7860
gaggagaacg aggacattct cgaggacatc gtcctcaccc tcaccctttt cgaggatcga 7920
gagatgatcg aggagcgact caagacctac gcccatctct tcgacgacaa ggtcatgaag 7980
caactcaagc gacgacgata cactggctgg ggccgacttt cccgaaagct catcaacggc 8040
atccgagaca agcagtctgg caagaccatc ctggacttcc tgaagtccga cggtttcgcc 8100
aaccgaaact tcatgcagct catccacgac gactctctta ccttcaaaga ggatatccag 8160
aaggcccagg tttctggcca gggcgactcc ctccacgagc acattgccaa cctcgccgga 8220
tcccccgcca tcaaaaaggg tatcctccag accgtcaagg ttgtcgacga actcgtgaag 8280
gtcatgggcc gacacaagcc cgagaacatc gttatcgaga tggcccgaga gaaccagacc 8340
acccagaagg gtcagaagaa ctcccgagag cgaatgaagc gaatcgaaga gggtatcaag 8400
gagctcggtt cccagattct caaggagcac cccgtcgaga acacccagct ccagaacgag 8460
aaactctacc tgtactacct ccagaatggc cgagacatgt acgttgacca ggagctcgac 8520
atcaaccgac tctccgacta cgacgtcgac cacattgttc ctcagtcctt cctcaaggac 8580
gactccatcg acaacaaggt tctgacccga tctgacaaga accgaggtaa gtccgacaac 8640
gttccctccg aagaggtcgt taagaagatg aagaactact ggcgacagct tctcaacgcc 8700
aaactgatca cccagcgaaa gtttgacaac ctcaccaagg ccgagcgagg tggtctgtcc 8760
gagctggaca aggccggctt cattaagcga cagctggtcg agactcgaca gatcaccaag 8820
cacgtcgccc agatcctcga ctcccgaatg aacaccaagt acgacgagaa cgacaagctc 8880
atccgggagg tcaaggtcat caccctgaag tctaagcttg tctccgactt ccgaaaggac 8940
ttccagttct acaaggtccg agagatcaac aactaccacc acgcccacga cgcctacctc 9000
aacgccgttg ttggtaccgc cctcatcaag aagtatccca agctcgagtc cgagttcgtt 9060
tacggcgact acaaggttta cgatgtccga aagatgattg ccaagtccga gcaggagatc 9120
ggtaaggcca ccgccaagta ctttttctac tccaacatca tgaatttctt caagaccgag 9180
atcactctcg ccaacggtga gattcgaaag cgacccctga ttgagactaa tggtgagact 9240
ggtgagatcg tctgggataa gggccgagac ttcgccaccg tccgaaaggt cctgtccatg 9300
ccccaggtca acattgtcaa gaagaccgag gtccagaccg gtggcttctc caaggagtcc 9360
attctcccca agcgaaactc cgacaaactc atcgcccgta agaaggactg ggatccgaag 9420
aagtacggtg gtttcgattc tcccaccgtt gcctactccg tcctcgttgt tgctaaagtc 9480
gagaagggta agtctaagaa actcaagtcc gtgaaggagc tactcggtat caccatcatg 9540
gagcgatctt cttttgagaa gaaccccatt gacttcctcg aggccaaggg ttacaaagag 9600
gtcaagaagg acctgattat caagctgccc aagtactccc tctttgagct cgagaacggc 9660
cgaaagcgaa tgctggcttc cgctggtgag ctgcagaagg gcaacgagct cgctctgccc 9720
tccaagtacg tcaacttcct ctacctggcc tcccactacg agaagctcaa gggctccccc 9780
gaggacaacg agcagaagca gctgttcgtt gagcagcaca agcactacct cgacgagatc 9840
atcgagcaga tctccgagtt ctccaagcga gtcatcctcg ctgacgccaa ccttgataag 9900
gttctctctg cttacaacaa gcaccgggac aagcccatcc gagagcaggc cgagaatatc 9960
atccacctct tcactctcac caacctcggc gctcctgctg ccttcaagta cttcgacacc 10020
accattgacc gaaagaggta cacctccacc aaggaagtcc tcgacgccac cctgatccac 10080
cagtccatca ccggcctcta cgaaacccga atcgacctct cccagctcgg cggtgactct 10140
cgagccgacc ccaagaagaa gcgaaaagtc taaatatccg aagatcaaga gcgaagcaag 10200
ttgtaagtcc aggacatgtt tcccgcccac gcgagtgatt tataacacct ctcttttttg 10260
acacccgctc gccttgaaat tcatgtcaca taaattatag tcaacgacgt ttgaataact 10320
tgtcttgtag ttcgatgatg atcatatgat tacattaata gtaattactg tatttgatat 10380
atatactaat tacaatagta catattagaa catacaatag ttagtgccgt gaagtggctt 10440
aaaataccgc gagtcgatta cgtaatatta ttacctcttg cccatcgaac gtacaagtac 10500
tcctctgttc tctccttcct ttgctttgtg cacgaagaac tgcggtcagg tgacacaact 10560
ttttccatct cagggtgtgt cgcgtgtgct tcatccaaac tttagttggg gttcgggttc 10620
gcgcgagatg atcacgtgcc ctgatttggt gtcgtccccc gtcgcgctgc gcacgtgatt 10680
tatttatttc cggtggctgc tgtctacgcg gggccttctc tgcccttctg tttcaacctt 10740
cgggcggttc tcgtaaccag cagtagcaat ccatttcgaa actcaaagag ctaaaaacgt 10800
taaacctcag cagtcgctcg acgaatgggc tgcggttggg aagcccacga ggcctatagc 10860
cagagcctcg agttgacagg agcccagacg ccttttccaa cggcaacttt tatataaaat 10920
ggcaatgtat tcatgcaatt gcggccgtgt caggttggag acactggacc acactctcca 10980
ttgcttcctg aggagatgga tcattgctag tgcatctacg cgcagcaatc ccgcaagctc 11040
gacaaccgta gatgggcttt ggtgggccaa tcaattacgc aacccgcacg ttaaattgta 11100
tgaggaagga aggccacggt acaaagtggg tggtcttcac ccagtggttg ttggtggcgt 11160
catgcagacc atggccgcca gtgtgctgga attgaatatt taccgttcgt ataatgtatg 11220
ctatacgaag ttataccggt ctcgtagtgt tcacgttcag ttcacggtga gcttaaaact 11280
atcttcaaga agagatttga gacctgattt atacttgcag caatgtttac ttcttatcgc 11340
gatacacgaa tgtgatacgg atcaaagtaa gcaggactac gataagataa cgaatgcggt 11400
gcagtccatg tcgattaggt atagatacat ttattttgtg ttatgttaca ttttgggggg 11460
atactgtcct acttgtagta cctacttgta gtggcgcgtt aggggcaggg catgctcatg 11520
tagagcgcct gccgctcgcc gtccgaggcg gtgccgtcgt acagggcggt gtccaggccg 11580
cagagggtga accccatccg ccggta 11606
<210> 148
<211> 5444
<212> DNA
<213> 人工序列
<220>
<223> Cas9的核苷酸序列,所述核苷酸序列包含经密码子对优化以用于在解脂耶氏酵母中表达的C末端SV40核定位信号
<400> 148
gtgctactct actgatagca atagatgcgt cataattggt tggcccgctg agcctccaca 60
ggatactatt gcacataccc tggtcatgtg cagatcagct catttgtgga gactctggag 120
taacttagac gacgcctggt tcaattgccg caatgtgcgc ccacgcagat aatgtattga 180
ggggtggagc gcctcttggg gacttgctgt acttgtacgg gatattaaac gcactcagca 240
agaccatgac gtaaaacaca cctactgtac gatacgtact gtaggtattg tactcgtacc 300
cggtactaca aatagtacga tactatacgg agtgtatttg taccttgata tacgactggc 360
ggagtgaaga gaaggagttg aacaagacca gatggggata tcagccccag tgctttgtat 420
tacaagtacg agtacttaat agatactgta aggctattga tacggatggc agtaagtcat 480
tgagtaagca attgtggccc agcatctccc ctacgtactt gtaccatacc ccatggagac 540
accaatggtc tttcacgcac actgtcgtgt gctgtatcgc agaatcgggt gtccaaccaa 600
atgccgttac ccccacgtca cagccgatag acagatacac catcaatacc agcaggttgt 660
atcatgcggt tggctgaagg taagctgatt ggtctaaaaa ctgtagctgt cctaattcaa 720
cgagcgctat ttggggccaa ccacctcggc caagcggcct ttaatctgcg tgccccagag 780
gcgtctaatg aggctctggc cgccactgta ggagtgtttc tctgtgcgca cacgcagttt 840
tgagtttggg cgactttccc tttttcccaa ttgcgtacac acacagctcc gagctaagcg 900
ctgtccttga accttctccc tcttttccct ctttttctct tccccttccc ctcctccaca 960
ttaaggccaa atcctgaatt gcaccaacta gtacaacgac aacaatggac aagaagtact 1020
ccatcggttt ggacattggt actaactctg tcggctgggc cgtcatcacc gacgagtaca 1080
aggttccctc caagaagttc aaggtccttg gcaacaccga ccgacactct atcaagaaga 1140
acctgatcgg tgctctgctg ttcgactctg gcgagactgc cgaggccacc cgactgaagc 1200
gaaccgctcg acgccgatac acccgacgaa agaaccgaat ctgttacctc caggagatct 1260
tcagcaacga gatggctaag gtcgacgact ccttcttcca ccgactcgag gagtctttcc 1320
tggtcgaaga ggataagaag cacgagcgac accccatctt cggcaacatt gttgatgagg 1380
ttgcctacca tgagaagtac cccaccatct accacctccg aaagaagctc gtcgactcca 1440
ctgacaaggc tgacctccga ctcatctacc ttgctctcgc ccacatgatc aagttccgag 1500
gtcacttcct cattgagggt gatctcaacc ccgacaactc cgacgttgac aagctgttca 1560
tccagctcgt ccagacctac aaccagctct ttgaggagaa ccctatcaac gcttctggtg 1620
ttgacgccaa ggccattctc tccgcccgac tctctaagtc ccgacgactc gagaacctca 1680
ttgcccagct gcccggcgag aagaagaacg gcctcttcgg taacctgatt gctctctctc 1740
ttggtctgac ccccaacttc aagtccaact ttgacctcgc cgaggacgcc aagctccagc 1800
tgtccaagga cacctacgat gacgatctgg acaacctcct ggcccagatc ggtgaccagt 1860
acgccgatct cttccttgcc gccaagaacc tctccgacgc catcctgctc tccgacatcc 1920
tccgagtcaa caccgagatt accaaggctc ctctgtctgc ctctatgatc aagcgatacg 1980
acgagcacca ccaggatctc actcttctca aggctctcgt ccgacagcag ctccccgaga 2040
agtacaagga gattttcttt gaccagtcca agaacggtta cgctggctac attgacggtg 2100
gtgcttccca ggaagagttt tacaagttca tcaagcctat tctggagaag atggacggta 2160
ccgaggagct gctcgtcaag ctcaaccgag aggacctcct tcgaaagcag cgaaccttcg 2220
ataacggctc catcccccac cagatccacc tgggtgagct ccacgccatt ctccgaagac 2280
aagaggactt ctaccccttc ctaaaggata accgagagaa gatcgagaag attctcacct 2340
tccgaatccc ctactacgtc ggtcccctcg ctcgaggtaa ctcccgattt gcttggatga 2400
cccgaaagtc cgaggagact atcaccccct ggaactttga agaggtagtc gacaagggtg 2460
cctccgccca gtctttcatt gagcggatga ccaacttcga taagaacctc cccaacgaga 2520
aggtccttcc caagcactct ctcctctacg agtacttcac cgtctacaac gagctgacca 2580
aggtcaagta cgttaccgag ggcatgcgaa agcccgcttt cctctctggt gagcagaaga 2640
aggccattgt cgacctcctg ttcaagacta accgaaaagt caccgtcaag cagctcaagg 2700
aagactactt caagaagatt gagtgcttcg actccgtcga gatttccggt gtcgaggacc 2760
gattcaacgc ctccctcggc acctaccacg atcttctgaa gatcatcaag gacaaggact 2820
ttcttgataa cgaggagaac gaggacattc tcgaggacat cgtcctcacc ctcacccttt 2880
tcgaggatcg agagatgatc gaggagcgac tcaagaccta cgcccatctc ttcgacgaca 2940
aggtcatgaa gcaactcaag cgacgacgat acactggctg gggccgactt tcccgaaagc 3000
tcatcaacgg catccgagac aagcagtctg gcaagaccat cctggacttc ctgaagtccg 3060
acggtttcgc caaccgaaac ttcatgcagc tcatccacga cgactctctt accttcaaag 3120
aggatatcca gaaggcccag gtttctggcc agggcgactc cctccacgag cacattgcca 3180
acctcgccgg atcccccgcc atcaaaaagg gtatcctcca gaccgtcaag gttgtcgacg 3240
aactcgtgaa ggtcatgggc cgacacaagc ccgagaacat cgttatcgag atggcccgag 3300
agaaccagac cacccagaag ggtcagaaga actcccgaga gcgaatgaag cgaatcgaag 3360
agggtatcaa ggagctcggt tcccagattc tcaaggagca ccccgtcgag aacacccagc 3420
tccagaacga gaaactctac ctgtactacc tccagaatgg ccgagacatg tacgttgacc 3480
aggagctcga catcaaccga ctctccgact acgacgtcga ccacattgtt cctcagtcct 3540
tcctcaagga cgactccatc gacaacaagg ttctgacccg atctgacaag aaccgaggta 3600
agtccgacaa cgttccctcc gaagaggtcg ttaagaagat gaagaactac tggcgacagc 3660
ttctcaacgc caaactgatc acccagcgaa agtttgacaa cctcaccaag gccgagcgag 3720
gtggtctgtc cgagctggac aaggccggct tcattaagcg acagctggtc gagactcgac 3780
agatcaccaa gcacgtcgcc cagatcctcg actcccgaat gaacaccaag tacgacgaga 3840
acgacaagct catccgggag gtcaaggtca tcaccctgaa gtctaagctt gtctccgact 3900
tccgaaagga cttccagttc tacaaggtcc gagagatcaa caactaccac cacgcccacg 3960
acgcctacct caacgccgtt gttggtaccg ccctcatcaa gaagtatccc aagctcgagt 4020
ccgagttcgt ttacggcgac tacaaggttt acgatgtccg aaagatgatt gccaagtccg 4080
agcaggagat cggtaaggcc accgccaagt actttttcta ctccaacatc atgaatttct 4140
tcaagaccga gatcactctc gccaacggtg agattcgaaa gcgacccctg attgagacta 4200
atggtgagac tggtgagatc gtctgggata agggccgaga cttcgccacc gtccgaaagg 4260
tcctgtccat gccccaggtc aacattgtca agaagaccga ggtccagacc ggtggcttct 4320
ccaaggagtc cattctcccc aagcgaaact ccgacaaact catcgcccgt aagaaggact 4380
gggatccgaa gaagtacggt ggtttcgatt ctcccaccgt tgcctactcc gtcctcgttg 4440
ttgctaaagt cgagaagggt aagtctaaga aactcaagtc cgtgaaggag ctactcggta 4500
tcaccatcat ggagcgatct tcttttgaga agaaccccat tgacttcctc gaggccaagg 4560
gttacaaaga ggtcaagaag gacctgatta tcaagctgcc caagtactcc ctctttgagc 4620
tcgagaacgg ccgaaagcga atgctggctt ccgctggtga gctgcagaag ggcaacgagc 4680
tcgctctgcc ctccaagtac gtcaacttcc tctacctggc ctcccactac gagaagctca 4740
agggctcccc cgaggacaac gagcagaagc agctgttcgt tgagcagcac aagcactacc 4800
tcgacgagat catcgagcag atctccgagt tctccaagcg agtcatcctc gctgacgcca 4860
accttgataa ggttctctct gcttacaaca agcaccggga caagcccatc cgagagcagg 4920
ccgagaatat catccacctc ttcactctca ccaacctcgg cgctcctgct gccttcaagt 4980
acttcgacac caccattgac cgaaagaggt acacctccac caaggaagtc ctcgacgcca 5040
ccctgatcca ccagtccatc accggcctct acgaaacccg aatcgacctc tcccagctcg 5100
gcggtgactc tcgagccgac cccaagaaga agcgaaaagt ctaaatatcc gaagatcaag 5160
agcgaagcaa gttgtaagtc caggacatgt ttcccgccca cgcgagtgat ttataacacc 5220
tctctttttt gacacccgct cgccttgaaa ttcatgtcac ataaattata gtcaacgacg 5280
tttgaataac ttgtcttgta gttcgatgat gatcatatga ttacattaat agtaattact 5340
gtatttgata tatatactaa ttacaatagt acatattaga acatacaata gttagtgccg 5400
tgaagtggct taaaataccg cgagtcgatt acgtaatatt atta 5444
<210> 149
<211> 1004
<212> DNA
<213> 人工序列
<220>
<223> 耶氏酵母属Yl_007启动子的核苷酸序列
<400> 149
gtgctactct actgatagca atagatgcgt cataattggt tggcccgctg agcctccaca 60
ggatactatt gcacataccc tggtcatgtg cagatcagct catttgtgga gactctggag 120
taacttagac gacgcctggt tcaattgccg caatgtgcgc ccacgcagat aatgtattga 180
ggggtggagc gcctcttggg gacttgctgt acttgtacgg gatattaaac gcactcagca 240
agaccatgac gtaaaacaca cctactgtac gatacgtact gtaggtattg tactcgtacc 300
cggtactaca aatagtacga tactatacgg agtgtatttg taccttgata tacgactggc 360
ggagtgaaga gaaggagttg aacaagacca gatggggata tcagccccag tgctttgtat 420
tacaagtacg agtacttaat agatactgta aggctattga tacggatggc agtaagtcat 480
tgagtaagca attgtggccc agcatctccc ctacgtactt gtaccatacc ccatggagac 540
accaatggtc tttcacgcac actgtcgtgt gctgtatcgc agaatcgggt gtccaaccaa 600
atgccgttac ccccacgtca cagccgatag acagatacac catcaatacc agcaggttgt 660
atcatgcggt tggctgaagg taagctgatt ggtctaaaaa ctgtagctgt cctaattcaa 720
cgagcgctat ttggggccaa ccacctcggc caagcggcct ttaatctgcg tgccccagag 780
gcgtctaatg aggctctggc cgccactgta ggagtgtttc tctgtgcgca cacgcagttt 840
tgagtttggg cgactttccc tttttcccaa ttgcgtacac acacagctcc gagctaagcg 900
ctgtccttga accttctccc tcttttccct ctttttctct tccccttccc ctcctccaca 960
ttaaggccaa atcctgaatt gcaccaacta gtacaacgac aaca 1004
<210> 150
<211> 300
<212> DNA
<213> 人工序列
<220>
<223> 耶氏酵母属Yl_GPD启动子的核苷酸序列
<400> 150
atatccgaag atcaagagcg aagcaagttg taagtccagg acatgtttcc cgcccacgcg 60
agtgatttat aacacctctc ttttttgaca cccgctcgcc ttgaaattca tgtcacataa 120
attatagtca acgacgtttg aataacttgt cttgtagttc gatgatgatc atatgattac 180
attaatagta attactgtat ttgatatata tactaattac aatagtacat attagaacat 240
acaatagtta gtgccgtgaa gtggcttaaa ataccgcgag tcgattacgt aatattatta 300
<210> 151
<211> 12810
<212> DNA
<213> 人工序列
<220>
<223> pSTV089的核苷酸序列
<400> 151
ggttccgctt cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta 60
tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag 120
aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg 180
tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg 240
tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg 300
cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga 360
agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc 420
tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt 480
aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact 540
ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg 600
cctaactacg gctacactag aaggacagta tttggtatct gcgctctgct gaagccagtt 660
accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt 720
ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct 780
ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg 840
gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt 900
aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg cttaatcagt 960
gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg actccccgtc 1020
gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc aatgataccg 1080
cgagacccac gctcaccggc tccagattta tcagcaataa accagccagc cggaagggcc 1140
gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa ttgttgccgg 1200
gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc cattgctgca 1260
ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg ttcccaacga 1320
tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc cttcggtcct 1380
ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat ggcagcactg 1440
cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg tgagtactca 1500
accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaaca 1560
cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg aaaacgttct 1620
tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat gtaacccact 1680
cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg gtgagcaaaa 1740
acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg ttgaatactc 1800
atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct catgagcgga 1860
tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac atttccccga 1920
aaagtgccac ctgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg 1980
cgtatcacga ggccctttcg tctggcctag gaagcgactt ccaatcgctt tgcatatcca 2040
gtaccacacc cacaggcgtt tgtgctactc tactgatagc aatagatgcg tcataattgg 2100
ttggcccgct gagcctccac aggatactat tgcacatacc ctggtcatgt gcagatcagc 2160
tcatttgtgg agactctgga gtaacttaga cgacgcctgg ttcaattgcc gcaatgtgcg 2220
cccacgcaga taatgtattg aggggtggag cgcctcttgg ggacttgctg tacttgtacg 2280
ggatattaaa cgcactcagc aagaccatga cgtaaaacac acctactgta cgatacgtac 2340
tgtaggtatt gtactcgtac ccggtactac aaatagtacg atactatacg gagtgtattt 2400
gtaccttgat atacgactgg cggagtgaag agaaggagtt gaacaagacc agatggggat 2460
atcagcccca gtgctttgta ttacaagtac gagtacttaa tagatactgt aaggctattg 2520
atacggatgg cagtaagtca ttgagtaagc aattgtggcc cagcatctcc cctacgtact 2580
tgtaccatac cccatggaga caccaatggt ctttcacgca cactgtcgtg tgctgtatcg 2640
cagaatcggg tgtccaacca aatgccgtta cccccacgtc acagccgata gacagataca 2700
ccatcaatac cagcaggttg tatcatgcgg ttggctgaag gtaagctgat tggtctaaaa 2760
actgtagctg tcctaattca acgagcgcta tttggggcca accacctcgg ccaagcggcc 2820
tttaatctgc gtgccccaga ggcgtctaat gaggctctgg ccgccactgt aggagtgttt 2880
ctctgtgcgc acacgcagtt ttgagtttgg gcgactttcc ctttttccca attgcgtaca 2940
cacacagctc cgagctaagc gctgtccttg aaccttctcc ctcttttccc tctttttctc 3000
ttccccttcc cctcctccac attaaggcca aatcctgaat tgcaccaact agtacaacga 3060
caacaatgga caagaagtac tccatcggtt tggacattgg tactaactct gtcggctggg 3120
ccgtcatcac cgacgagtac aaggttccct ccaagaagtt caaggtcctt ggcaacaccg 3180
accgacactc tatcaagaag aacctgatcg gtgctctgct gttcgactct ggcgagactg 3240
ccgaggccac ccgactgaag cgaaccgctc gacgccgata cacccgacga aagaaccgaa 3300
tctgttacct ccaggagatc ttcagcaacg agatggctaa ggtcgacgac tccttcttcc 3360
accgactcga ggagtctttc ctggtcgaag aggataagaa gcacgagcga caccccatct 3420
tcggcaacat tgttgatgag gttgcctacc atgagaagta ccccaccatc taccacctcc 3480
gaaagaagct cgtcgactcc actgacaagg ctgacctccg actcatctac cttgctctcg 3540
cccacatgat caagttccga ggtcacttcc tcattgaggg tgatctcaac cccgacaact 3600
ccgacgttga caagctgttc atccagctcg tccagaccta caaccagctc tttgaggaga 3660
accctatcaa cgcttctggt gttgacgcca aggccattct ctccgcccga ctctctaagt 3720
cccgacgact cgagaacctc attgcccagc tgcccggcga gaagaagaac ggcctcttcg 3780
gtaacctgat tgctctctct cttggtctga cccccaactt caagtccaac tttgacctcg 3840
ccgaggacgc caagctccag ctgtccaagg acacctacga tgacgatctg gacaacctcc 3900
tggcccagat cggtgaccag tacgccgatc tcttccttgc cgccaagaac ctctccgacg 3960
ccatcctgct ctccgacatc ctccgagtca acaccgagat taccaaggct cctctgtctg 4020
cctctatgat caagcgatac gacgagcacc accaggatct cactcttctc aaggctctcg 4080
tccgacagca gctccccgag aagtacaagg agattttctt tgaccagtcc aagaacggtt 4140
acgctggcta cattgacggt ggtgcttccc aggaagagtt ttacaagttc atcaagccta 4200
ttctggagaa gatggacggt accgaggagc tgctcgtcaa gctcaaccga gaggacctcc 4260
ttcgaaagca gcgaaccttc gataacggct ccatccccca ccagatccac ctgggtgagc 4320
tccacgccat tctccgaaga caagaggact tctacccctt cctaaaggat aaccgagaga 4380
agatcgagaa gattctcacc ttccgaatcc cctactacgt cggtcccctc gctcgaggta 4440
actcccgatt tgcttggatg acccgaaagt ccgaggagac tatcaccccc tggaactttg 4500
aagaggtagt cgacaagggt gcctccgccc agtctttcat tgagcggatg accaacttcg 4560
ataagaacct ccccaacgag aaggtccttc ccaagcactc tctcctctac gagtacttca 4620
ccgtctacaa cgagctgacc aaggtcaagt acgttaccga gggcatgcga aagcccgctt 4680
tcctctctgg tgagcagaag aaggccattg tcgacctcct gttcaagact aaccgaaaag 4740
tcaccgtcaa gcagctcaag gaagactact tcaagaagat tgagtgcttc gactccgtcg 4800
agatttccgg tgtcgaggac cgattcaacg cctccctcgg cacctaccac gatcttctga 4860
agatcatcaa ggacaaggac tttcttgata acgaggagaa cgaggacatt ctcgaggaca 4920
tcgtcctcac cctcaccctt ttcgaggatc gagagatgat cgaggagcga ctcaagacct 4980
acgcccatct cttcgacgac aaggtcatga agcaactcaa gcgacgacga tacactggct 5040
ggggccgact ttcccgaaag ctcatcaacg gcatccgaga caagcagtct ggcaagacca 5100
tcctggactt cctgaagtcc gacggtttcg ccaaccgaaa cttcatgcag ctcatccacg 5160
acgactctct taccttcaaa gaggatatcc agaaggccca ggtttctggc cagggcgact 5220
ccctccacga gcacattgcc aacctcgccg gatcccccgc catcaaaaag ggtatcctcc 5280
agaccgtcaa ggttgtcgac gaactcgtga aggtcatggg ccgacacaag cccgagaaca 5340
tcgttatcga gatggcccga gagaaccaga ccacccagaa gggtcagaag aactcccgag 5400
agcgaatgaa gcgaatcgaa gagggtatca aggagctcgg ttcccagatt ctcaaggagc 5460
accccgtcga gaacacccag ctccagaacg agaaactcta cctgtactac ctccagaatg 5520
gccgagacat gtacgttgac caggagctcg acatcaaccg actctccgac tacgacgtcg 5580
accacattgt tcctcagtcc ttcctcaagg acgactccat cgacaacaag gttctgaccc 5640
gatctgacaa gaaccgaggt aagtccgaca acgttccctc cgaagaggtc gttaagaaga 5700
tgaagaacta ctggcgacag cttctcaacg ccaaactgat cacccagcga aagtttgaca 5760
acctcaccaa ggccgagcga ggtggtctgt ccgagctgga caaggccggc ttcattaagc 5820
gacagctggt cgagactcga cagatcacca agcacgtcgc ccagatcctc gactcccgaa 5880
tgaacaccaa gtacgacgag aacgacaagc tcatccggga ggtcaaggtc atcaccctga 5940
agtctaagct tgtctccgac ttccgaaagg acttccagtt ctacaaggtc cgagagatca 6000
acaactacca ccacgcccac gacgcctacc tcaacgccgt tgttggtacc gccctcatca 6060
agaagtatcc caagctcgag tccgagttcg tttacggcga ctacaaggtt tacgatgtcc 6120
gaaagatgat tgccaagtcc gagcaggaga tcggtaaggc caccgccaag tactttttct 6180
actccaacat catgaatttc ttcaagaccg agatcactct cgccaacggt gagattcgaa 6240
agcgacccct gattgagact aatggtgaga ctggtgagat cgtctgggat aagggccgag 6300
acttcgccac cgtccgaaag gtcctgtcca tgccccaggt caacattgtc aagaagaccg 6360
aggtccagac cggtggcttc tccaaggagt ccattctccc caagcgaaac tccgacaaac 6420
tcatcgcccg taagaaggac tgggatccga agaagtacgg tggtttcgat tctcccaccg 6480
ttgcctactc cgtcctcgtt gttgctaaag tcgagaaggg taagtctaag aaactcaagt 6540
ccgtgaagga gctactcggt atcaccatca tggagcgatc ttcttttgag aagaacccca 6600
ttgacttcct cgaggccaag ggttacaaag aggtcaagaa ggacctgatt atcaagctgc 6660
ccaagtactc cctctttgag ctcgagaacg gccgaaagcg aatgctggct tccgctggtg 6720
agctgcagaa gggcaacgag ctcgctctgc cctccaagta cgtcaacttc ctctacctgg 6780
cctcccacta cgagaagctc aagggctccc ccgaggacaa cgagcagaag cagctgttcg 6840
ttgagcagca caagcactac ctcgacgaga tcatcgagca gatctccgag ttctccaagc 6900
gagtcatcct cgctgacgcc aaccttgata aggttctctc tgcttacaac aagcaccggg 6960
acaagcccat ccgagagcag gccgagaata tcatccacct cttcactctc accaacctcg 7020
gcgctcctgc tgccttcaag tacttcgaca ccaccattga ccgaaagagg tacacctcca 7080
ccaaggaagt cctcgacgcc accctgatcc accagtccat caccggcctc tacgaaaccc 7140
gaatcgacct ctcccagctc ggcggtgact ctcgagccga ccccaagaag aagcgaaaag 7200
tctaaatatc cgaagatcaa gagcgaagca agttgtaagt ccaggacatg tttcccgccc 7260
acgcgagtga tttataacac ctctcttttt tgacacccgc tcgccttgaa attcatgtca 7320
cataaattat agtcaacgac gtttgaataa cttgtcttgt agttcgatga tgatcatatg 7380
attacattaa tagtaattac tgtatttgat atatatacta attacaatag tacatattag 7440
aacatacaat agttagtgcc gtgaagtggc ttaaaatacc gcgagtcgat tacgtaatat 7500
tattacctct tgcccatcga acgtacaagt actcctctgt tctctccttc ctttgctttg 7560
tgcacgaaga actgcggtca ggtgacacaa ctttttccat ctcagggtgt gtcgcgtgtg 7620
cttcatccaa actttagttg gggttcgggt tcgcgcgaga tgatcacgtg ccctgatttg 7680
gtgtcgtccc ccgtcgcgct gcgcacgtga tttatttatt tccggtggct gctgtctacg 7740
cggggccttc tctgcccttc tgtttcaacc ttcgggcggt tctcgtaacc agcagtagca 7800
atccatttcg aaactcaaag agctaaaaac gttaaacctc agcagtcgct cgacgaatgg 7860
gctgcggttg ggaagcccac gaggcctata gccagagcct cgagttgaca ggagcccaga 7920
cgccttttcc aacggcaact tttatataaa atggcaatgt attcatgcaa ttgcggccgt 7980
gtcaggttgg agacactgga ccacactctc cattgcttcc tgaggagatg gatcattgct 8040
agtgcatcta cgcgcagcaa tcccgcaagc tcgacaaccg tagatgggct ttggtgggcc 8100
aatcaattac gcaacccgca cgttaaattg tatgaggaag gaaggccacg gtacaaagtg 8160
ggtggtcttc acccagtggt tgttggtggc gtcatgcaga ccatgcattg gggatagcac 8220
agggttgggg tgtcttgtgg actcaatggg tgaaaggaga tggaaaaggg cggtgaaaag 8280
tggtagaatc gaaatccctg acgtcaattt ataaagtaaa atgcgtttct gccattttgc 8340
tcccctcctt ctttcgcaat cgcctcccca aaagttgtcg tggcagtaca catgcttgca 8400
tacaatgaag ctaatccggc ttgctcagta gttgctatat ccaggcatgg tgtgaaaccc 8460
ctcaaagtat atataggagc ggtgagcccc agtctggggt cttttctctc catctcaaaa 8520
ctactttctc acaatgcgat atctgatgag tccgtgagga cgaaacgagt aagctcgtca 8580
tatcgccgca agattacacg ttttagagct agaaatagca agttaaaata aggctagtcc 8640
gttatcaact tgaaaaagtg gcaccgagtc ggtgcttttg gccggcatgg tcccagcctc 8700
ctcgctggcg ccggctgggc aacatgcttc ggcatggcga atgggactaa acttcgagct 8760
aatccagtag cttacgttac ccaggggcag gtcaactggc tagccacgag tctgtcccag 8820
gtcgcaattt agtgtaataa acaatatata tattgagtct aaagggaatt gtagctattg 8880
tgattgtgtg attttcgtct tgctggttct tattgtgtcc cattcgtttc atcctgatga 8940
ggacccctgg aaccggtgtt ttcttagtct ctgcaatcgc tagtcttgtt gctatgacag 9000
ttgcgtcgac actattcagg tcatctatcg gttattctga tattataata cctccggatc 9060
gatgtacctg atttatactt gcagcaatgt ttacttctta tcgcgataca cgaatgtgat 9120
acggatcaaa gtaagcagga ctacgataag ataacgaatg cggtgcagtc catgtcgatt 9180
aggtatagat acatttattt tgtgttatgt tacattttgg ggggatactg tcctacttgt 9240
agtacctact tgtagtggcg cgtctattcc tttgccctcg gacgagtgct ggggcgtcgg 9300
tttccactat cggcgagtac ttctacacag ccatcggtcc agacggccgc gcttctgcgg 9360
gcgatttgtg tacgcccgac agtcccggct ccggatcgga cgattgcgtc gcatcgaccc 9420
tgcgcccaag ctgcatcatc gaaattgccg tcaaccaagc tctgatagag ttggtcaaga 9480
ccaatgcgga gcatatacgc ccggagccgc ggcgatcctg caagctccgg atgcctccgc 9540
tcgaagtagc gcgtctgctg ctccatacaa gccaaccacg gcctccagaa gaagatgttg 9600
gcgacctcgt attgggaatc cccgaacatc gcctcgctcc agtcaatgac cgctgttatg 9660
cggccattgt ccgtcaggac attgttggag ccgaaatccg cgtgcacgag gtgccggact 9720
tcggggcagt cctcggccca aagcatcagc tcatcgagag cctgcgcgac ggacgcactg 9780
acggtgtcgt ccatcacagt ttgccagtga tacacatggg gatcagcaat cgcgcatatg 9840
aaatcacgcc atgtagtgta ttgaccgatt ccttgcggtc cgaatgggcc gaacccgctc 9900
gtctggctaa gatcggccgc agcgatcgca tccatggcct ccgcgaccgg ctgcagaaca 9960
gcgggcagtt cggtttcagg caggtcttgc aacgtgacac cctgtgcacg gcgggagatg 10020
caataggtca ggctctcgct gaattcccca atgtcaagca cttccggaat cgggagcgcg 10080
gccgatgcaa agtgccgata aacataacga tctttgtaga aaccatcggc gcagctattt 10140
acccgcagga catatccacg ccctcctaca tcgaagctga aagcacgaga ttcttcgccc 10200
tccgagagct gcatcaggtc ggagacgctg tcgaactttt cgatcagaaa cttctcgaca 10260
gacgtcgcgg tgagttcagg ctttttcata tgggtacctg agaacatttt tgtgtctagg 10320
tgtttgtgtt tggactgcga tcagtgaaga aaagaagagg aaaaattgtg caagaaattt 10380
tgctttcaag acttggctga tgcagcaggg taactctggg acacagacct atgtttgtgg 10440
ttaaactcaa tgcacgtggt acgtgcgtgg agcgcttacc catccaaggg tgtggacatg 10500
gaaccgacgg tccgtggagt tgtgtaatgt cattttggcg actcttgaag caaggctata 10560
aaaaaattgt gtggcttgag tcttatcgag ctcggtcact acaagagtta atcttcctgt 10620
ctcaggcaga caggtcaggc agggttactt ttgggtgtgc tgtaactcac tgtatggccg 10680
ttagtgcgca tagacgttgt acatactgga ccgaattgta gcgtgctcaa tagggccaat 10740
aaagctattg tagggatccg aattttcaga acctaattta tctgttaccc ggcctgtggc 10800
tcgcacagct taaaaatggt caaactttcc ccttcttgtc tttttttcct cacattcatc 10860
aggttcttgt cttgatcttt caagtgagta ttaattaccg accttggttc ttcattggga 10920
gagcattgga agccgtggtg cagcaaccac aaaacggttc ttccccttcg ataccttctt 10980
gcctgccttt caatacaagt cggctcgatt agcggtggtc gcccccgcca gcggagaaca 11040
tggaactaac ccagaatgag agctaagtgg agaaagaaga gagtcagacg actcaagcga 11100
aagcgccgca aggtccgagc tcgatccaaa taagcggttt ttaacggaga tttaacacta 11160
aatcgaagaa cttttcccgt ttcatttgcg aatgagctcg ttaacaaaat cccccagttt 11220
ttttatccag ctgtaaggat tgacattagt aatgaattat tgtttggtat atttaaatct 11280
gtagttcctt tctgtccgtg tcggcaactg tcgtactcgt gatttacttg tattgacgaa 11340
tacttactgt agcgcactct gctgctactg gtcgtaagga tgtgctattt cggtgtatgg 11400
tgggtttttt gggggtcgga accgaagact gttacacggg cacggctcgt tgtgtacacg 11460
cacagagctc ttgcgagtca tgttgtagct agctcgtcgt gttcaggaac tgttcgatgg 11520
ttcggagaga gtcgccgccc agaacatacg cgcaccgatg tcagcagaca gccttattac 11580
aagtatattc aagcaagtat atccgtaggg tgcgggtgat ttggatctaa ggttcgtact 11640
caacactcac gagcagcttg cctatgttac atccttttat cagacataac ataattggag 11700
tttacttaca cacggggtgt acctgtatga gcaccaccta caattgtagc actggtactt 11760
gtacaaagaa tttattcgta cgaatcacag ggacggccgc cctcaccgaa ccagcgaata 11820
cctcagcggt cccctgcagt gactcaacaa agcgatatga acatcttgcg atggtatcct 11880
gctgatagtt tttactgtac aaacacctgt gtagctcctt ctagcatttt taagttattc 11940
acacctcaag gggagggata aattaaataa attccaaaag cgaagatcga gaaactaaat 12000
taaaattcca aaaacgaagt tggaacacaa ccccccgaaa aaaaacaaca aacaaaaaac 12060
ccaacaaaat aaacaaaaac aaaataaata tataactacc agtatctgac taaaagttca 12120
aatactcgta cttacaacaa atagaaatga gccggccaaa attctgcaga aaaaaatttc 12180
aaacaagtac tggtataatt aaattaaaaa acacatcaaa gtatcataac gttagttatt 12240
ttattttatt taataaaaga aaacaacaag atgggctcaa aactttcaac ttatacgata 12300
cataccaaat aacaatttag tatttatcta agtgcttttc gtagataatg gaatacaaat 12360
ggatatccag agtatacaca tggatagtat acactgacac gacaattctg tatctcttta 12420
tgttaactac tgtgaggcat taaatagagc ttgatatata aaatgttaca tttcacagtc 12480
tgaacttttg cagattacct aatttggtaa gatattaatt atgaactgaa agttgatggc 12540
atccctaaat ttgatgaaag atgaaattgt aaatgaggtg gtaaaagagc tacagtcgtt 12600
ttgttttgag ataccatcat ctctaacgaa atatctatta aaaatctcag tgtgatcatg 12660
agtcattgcc atcctggaaa atgtcatcat ggctgatatt tctaactgtt tacttgagat 12720
aaatatatat ttacaagaac ttcccttgaa attaatttag atataaaatg tttgcgggca 12780
agttactacg aggaataaat tatatctaga 12810
<210> 152
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> KU70基因的20 bp基因组靶标的核苷酸序列
<400> 152
atatcgccgc aagattacac 20
<210> 153
<211> 100
<212> DNA
<213> 人工序列
<220>
<223> 用于敲除耶氏酵母属基因组中的KU70基因的100 bp供体DNA片段的核苷酸序列
<400> 153
catcgcgaca cgaacacgaa acacgaacca cgaaccgccg ctttttgaaa ctagggaggc 60
acatctaaac gaataacgaa tattaatgat accatcatat 100
<210> 154
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 用于确认耶氏酵母属基因组中的KU70基因的敲除的正向引物的核苷酸序列
<400> 154
gagcacgtca cgtgttctcc 20
<210> 155
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 用于确认耶氏酵母属基因组中的KU70基因的敲除的反向引物的核苷酸序列
<400> 155
agtggtaccg ctactttgtg 20
<210> 156
<211> 2042
<212> DNA
<213> 人工序列
<220>
<223> GFP表达盒(Yl_HSP.pro-A.vic_eGFP ORF-Yl_GPD.ter)的核苷酸序列
<400> 156
gtgcaatcac atgttgctac tgtacctgct gtggaccacg cacggcggaa cgtaccgtac 60
aaatattttc ttgctcacat gactctctct cggccgcgca cgccggtggc aaattgctct 120
tgcattggct ctgtctctag acgtccaaac cgtccaaagt ggcagggtga cgtgatgcga 180
cgcacgaagg agatggcccg gtggcgagga accggacacg gcgagccggc gggaaaaaag 240
gcggaaaacg aaaagcgaag ggcacaatct gacggtgcgg ctgccaccaa cccaaggagg 300
ctattttggg tcgctttcca tttcacattc gccctcaatg gccactttgc ggtggtgaac 360
atggtttctg aaacaacccc ccagaattag agtatattga tgtgtttaag attgggttgc 420
tatttggcca ttgtggggga gggtagcgac gtggaggaca ttccagggcg aattgagcct 480
agaaagtggt agcattccaa ccgtctaagt cgtccgaatt gatcgctata actatcacct 540
ctctcacatg tctacttccc caaccaacat ccccaacctc ccccacacta aagttcacgc 600
caataatgta ggcactcttt ctgggtgtgg gacagcagag caatacggag gggagattac 660
acaacgagcc acaattgggg agatggtagc catctcactc gacccgtcga cttttggcaa 720
cgctcaatta cccaccaaat ttgggctgga gttgagggga ccgtgttcca gcgctgtagg 780
accagcaaca cacacggtat caacagcaac caacgccccc gctaatgcac ccagtactgc 840
gcaggtgtgg gccaggtgcg ttccagatgc gagttggcga accctaagcc gacagtgtac 900
tttttgggac gggcagtagc aatcgtgggc ggaaaccccg gtgtatataa aggggtggag 960
aggacggatt attagcacca acacacacac ttatactaca atggagggtg atattcacgg 1020
tgcttctaag ggtgaggagc ttttcaccgg cgttgtccct attctcgttg agcttgatgg 1080
tgatgtcaac ggtcacaagt tttctgtctc tggtgagggt gagggtgatg ctacttacgg 1140
taagctcacc ctcaagttta tttgtaccac cggcaagctc cccgttccct ggcctaccct 1200
cgttaccact ctcacctacg gtgttcagtg tttttcccga taccccgatc acatgaagcg 1260
acacgacttt ttcaagtctg ccatgcccga gggttacgtt caggagcgaa ctatttcttt 1320
caaggatgac ggtaactaca agacccgagc tgaggttaag tttgagggtg ataccctcgt 1380
taaccgaatc gagcttaagg gtattgattt caaggaggat ggtaacattc tcggtcacaa 1440
gctggagtac aactacaact ctcacaacgt ttacatcacc gctgacaagc agaagaacgg 1500
tatcaaggct aacttcaaga ttcgacacaa cattgaggat ggttccgttc agcttgctga 1560
ccactaccag cagaacactc ccattggcga tggccctgtc ctcctccccg acaaccacta 1620
cctctctacc cagtctgccc tttctaagga ccccaacgag aagcgagatc acatggtcct 1680
ccttgagttc gttaccgctg ctggtattac tcacggtatg gatgagctct acaagtaaat 1740
aaatatccga agatcaagag cgaagcaagt tgtaagtcca ggacatgttt cccgcccacg 1800
cgagtgattt ataacacctc tcttttttga cacccgctcg ccttgaaatt catgtcacat 1860
aaattatagt caacgacgtt tgaataactt gtcttgtagt tcgatgatga tcatatgatt 1920
acattaatag taattactgt atttgatata tatactaatt acaatagtac atattagaac 1980
atacaatagt tagtgccgtg aagtggctta aaataccgcg agtcgattac gtaatattat 2040
ta 2042
<210> 157
<211> 12810
<212> DNA
<213> 人工序列
<220>
<223> 质粒pSTV086的核苷酸序列
<400> 157
ggttccgctt cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta 60
tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag 120
aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg 180
tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg 240
tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg 300
cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga 360
agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc 420
tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt 480
aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact 540
ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg 600
cctaactacg gctacactag aaggacagta tttggtatct gcgctctgct gaagccagtt 660
accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt 720
ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct 780
ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg 840
gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt 900
aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg cttaatcagt 960
gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg actccccgtc 1020
gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc aatgataccg 1080
cgagacccac gctcaccggc tccagattta tcagcaataa accagccagc cggaagggcc 1140
gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa ttgttgccgg 1200
gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc cattgctgca 1260
ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg ttcccaacga 1320
tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc cttcggtcct 1380
ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat ggcagcactg 1440
cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg tgagtactca 1500
accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaaca 1560
cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg aaaacgttct 1620
tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat gtaacccact 1680
cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg gtgagcaaaa 1740
acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg ttgaatactc 1800
atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct catgagcgga 1860
tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac atttccccga 1920
aaagtgccac ctgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg 1980
cgtatcacga ggccctttcg tctggcctag gaagcgactt ccaatcgctt tgcatatcca 2040
gtaccacacc cacaggcgtt tgtgctactc tactgatagc aatagatgcg tcataattgg 2100
ttggcccgct gagcctccac aggatactat tgcacatacc ctggtcatgt gcagatcagc 2160
tcatttgtgg agactctgga gtaacttaga cgacgcctgg ttcaattgcc gcaatgtgcg 2220
cccacgcaga taatgtattg aggggtggag cgcctcttgg ggacttgctg tacttgtacg 2280
ggatattaaa cgcactcagc aagaccatga cgtaaaacac acctactgta cgatacgtac 2340
tgtaggtatt gtactcgtac ccggtactac aaatagtacg atactatacg gagtgtattt 2400
gtaccttgat atacgactgg cggagtgaag agaaggagtt gaacaagacc agatggggat 2460
atcagcccca gtgctttgta ttacaagtac gagtacttaa tagatactgt aaggctattg 2520
atacggatgg cagtaagtca ttgagtaagc aattgtggcc cagcatctcc cctacgtact 2580
tgtaccatac cccatggaga caccaatggt ctttcacgca cactgtcgtg tgctgtatcg 2640
cagaatcggg tgtccaacca aatgccgtta cccccacgtc acagccgata gacagataca 2700
ccatcaatac cagcaggttg tatcatgcgg ttggctgaag gtaagctgat tggtctaaaa 2760
actgtagctg tcctaattca acgagcgcta tttggggcca accacctcgg ccaagcggcc 2820
tttaatctgc gtgccccaga ggcgtctaat gaggctctgg ccgccactgt aggagtgttt 2880
ctctgtgcgc acacgcagtt ttgagtttgg gcgactttcc ctttttccca attgcgtaca 2940
cacacagctc cgagctaagc gctgtccttg aaccttctcc ctcttttccc tctttttctc 3000
ttccccttcc cctcctccac attaaggcca aatcctgaat tgcaccaact agtacaacga 3060
caacaatgga caagaagtac tccatcggtt tggacattgg tactaactct gtcggctggg 3120
ccgtcatcac cgacgagtac aaggttccct ccaagaagtt caaggtcctt ggcaacaccg 3180
accgacactc tatcaagaag aacctgatcg gtgctctgct gttcgactct ggcgagactg 3240
ccgaggccac ccgactgaag cgaaccgctc gacgccgata cacccgacga aagaaccgaa 3300
tctgttacct ccaggagatc ttcagcaacg agatggctaa ggtcgacgac tccttcttcc 3360
accgactcga ggagtctttc ctggtcgaag aggataagaa gcacgagcga caccccatct 3420
tcggcaacat tgttgatgag gttgcctacc atgagaagta ccccaccatc taccacctcc 3480
gaaagaagct cgtcgactcc actgacaagg ctgacctccg actcatctac cttgctctcg 3540
cccacatgat caagttccga ggtcacttcc tcattgaggg tgatctcaac cccgacaact 3600
ccgacgttga caagctgttc atccagctcg tccagaccta caaccagctc tttgaggaga 3660
accctatcaa cgcttctggt gttgacgcca aggccattct ctccgcccga ctctctaagt 3720
cccgacgact cgagaacctc attgcccagc tgcccggcga gaagaagaac ggcctcttcg 3780
gtaacctgat tgctctctct cttggtctga cccccaactt caagtccaac tttgacctcg 3840
ccgaggacgc caagctccag ctgtccaagg acacctacga tgacgatctg gacaacctcc 3900
tggcccagat cggtgaccag tacgccgatc tcttccttgc cgccaagaac ctctccgacg 3960
ccatcctgct ctccgacatc ctccgagtca acaccgagat taccaaggct cctctgtctg 4020
cctctatgat caagcgatac gacgagcacc accaggatct cactcttctc aaggctctcg 4080
tccgacagca gctccccgag aagtacaagg agattttctt tgaccagtcc aagaacggtt 4140
acgctggcta cattgacggt ggtgcttccc aggaagagtt ttacaagttc atcaagccta 4200
ttctggagaa gatggacggt accgaggagc tgctcgtcaa gctcaaccga gaggacctcc 4260
ttcgaaagca gcgaaccttc gataacggct ccatccccca ccagatccac ctgggtgagc 4320
tccacgccat tctccgaaga caagaggact tctacccctt cctaaaggat aaccgagaga 4380
agatcgagaa gattctcacc ttccgaatcc cctactacgt cggtcccctc gctcgaggta 4440
actcccgatt tgcttggatg acccgaaagt ccgaggagac tatcaccccc tggaactttg 4500
aagaggtagt cgacaagggt gcctccgccc agtctttcat tgagcggatg accaacttcg 4560
ataagaacct ccccaacgag aaggtccttc ccaagcactc tctcctctac gagtacttca 4620
ccgtctacaa cgagctgacc aaggtcaagt acgttaccga gggcatgcga aagcccgctt 4680
tcctctctgg tgagcagaag aaggccattg tcgacctcct gttcaagact aaccgaaaag 4740
tcaccgtcaa gcagctcaag gaagactact tcaagaagat tgagtgcttc gactccgtcg 4800
agatttccgg tgtcgaggac cgattcaacg cctccctcgg cacctaccac gatcttctga 4860
agatcatcaa ggacaaggac tttcttgata acgaggagaa cgaggacatt ctcgaggaca 4920
tcgtcctcac cctcaccctt ttcgaggatc gagagatgat cgaggagcga ctcaagacct 4980
acgcccatct cttcgacgac aaggtcatga agcaactcaa gcgacgacga tacactggct 5040
ggggccgact ttcccgaaag ctcatcaacg gcatccgaga caagcagtct ggcaagacca 5100
tcctggactt cctgaagtcc gacggtttcg ccaaccgaaa cttcatgcag ctcatccacg 5160
acgactctct taccttcaaa gaggatatcc agaaggccca ggtttctggc cagggcgact 5220
ccctccacga gcacattgcc aacctcgccg gatcccccgc catcaaaaag ggtatcctcc 5280
agaccgtcaa ggttgtcgac gaactcgtga aggtcatggg ccgacacaag cccgagaaca 5340
tcgttatcga gatggcccga gagaaccaga ccacccagaa gggtcagaag aactcccgag 5400
agcgaatgaa gcgaatcgaa gagggtatca aggagctcgg ttcccagatt ctcaaggagc 5460
accccgtcga gaacacccag ctccagaacg agaaactcta cctgtactac ctccagaatg 5520
gccgagacat gtacgttgac caggagctcg acatcaaccg actctccgac tacgacgtcg 5580
accacattgt tcctcagtcc ttcctcaagg acgactccat cgacaacaag gttctgaccc 5640
gatctgacaa gaaccgaggt aagtccgaca acgttccctc cgaagaggtc gttaagaaga 5700
tgaagaacta ctggcgacag cttctcaacg ccaaactgat cacccagcga aagtttgaca 5760
acctcaccaa ggccgagcga ggtggtctgt ccgagctgga caaggccggc ttcattaagc 5820
gacagctggt cgagactcga cagatcacca agcacgtcgc ccagatcctc gactcccgaa 5880
tgaacaccaa gtacgacgag aacgacaagc tcatccggga ggtcaaggtc atcaccctga 5940
agtctaagct tgtctccgac ttccgaaagg acttccagtt ctacaaggtc cgagagatca 6000
acaactacca ccacgcccac gacgcctacc tcaacgccgt tgttggtacc gccctcatca 6060
agaagtatcc caagctcgag tccgagttcg tttacggcga ctacaaggtt tacgatgtcc 6120
gaaagatgat tgccaagtcc gagcaggaga tcggtaaggc caccgccaag tactttttct 6180
actccaacat catgaatttc ttcaagaccg agatcactct cgccaacggt gagattcgaa 6240
agcgacccct gattgagact aatggtgaga ctggtgagat cgtctgggat aagggccgag 6300
acttcgccac cgtccgaaag gtcctgtcca tgccccaggt caacattgtc aagaagaccg 6360
aggtccagac cggtggcttc tccaaggagt ccattctccc caagcgaaac tccgacaaac 6420
tcatcgcccg taagaaggac tgggatccga agaagtacgg tggtttcgat tctcccaccg 6480
ttgcctactc cgtcctcgtt gttgctaaag tcgagaaggg taagtctaag aaactcaagt 6540
ccgtgaagga gctactcggt atcaccatca tggagcgatc ttcttttgag aagaacccca 6600
ttgacttcct cgaggccaag ggttacaaag aggtcaagaa ggacctgatt atcaagctgc 6660
ccaagtactc cctctttgag ctcgagaacg gccgaaagcg aatgctggct tccgctggtg 6720
agctgcagaa gggcaacgag ctcgctctgc cctccaagta cgtcaacttc ctctacctgg 6780
cctcccacta cgagaagctc aagggctccc ccgaggacaa cgagcagaag cagctgttcg 6840
ttgagcagca caagcactac ctcgacgaga tcatcgagca gatctccgag ttctccaagc 6900
gagtcatcct cgctgacgcc aaccttgata aggttctctc tgcttacaac aagcaccggg 6960
acaagcccat ccgagagcag gccgagaata tcatccacct cttcactctc accaacctcg 7020
gcgctcctgc tgccttcaag tacttcgaca ccaccattga ccgaaagagg tacacctcca 7080
ccaaggaagt cctcgacgcc accctgatcc accagtccat caccggcctc tacgaaaccc 7140
gaatcgacct ctcccagctc ggcggtgact ctcgagccga ccccaagaag aagcgaaaag 7200
tctaaatatc cgaagatcaa gagcgaagca agttgtaagt ccaggacatg tttcccgccc 7260
acgcgagtga tttataacac ctctcttttt tgacacccgc tcgccttgaa attcatgtca 7320
cataaattat agtcaacgac gtttgaataa cttgtcttgt agttcgatga tgatcatatg 7380
attacattaa tagtaattac tgtatttgat atatatacta attacaatag tacatattag 7440
aacatacaat agttagtgcc gtgaagtggc ttaaaatacc gcgagtcgat tacgtaatat 7500
tattacctct tgcccatcga acgtacaagt actcctctgt tctctccttc ctttgctttg 7560
tgcacgaaga actgcggtca ggtgacacaa ctttttccat ctcagggtgt gtcgcgtgtg 7620
cttcatccaa actttagttg gggttcgggt tcgcgcgaga tgatcacgtg ccctgatttg 7680
gtgtcgtccc ccgtcgcgct gcgcacgtga tttatttatt tccggtggct gctgtctacg 7740
cggggccttc tctgcccttc tgtttcaacc ttcgggcggt tctcgtaacc agcagtagca 7800
atccatttcg aaactcaaag agctaaaaac gttaaacctc agcagtcgct cgacgaatgg 7860
gctgcggttg ggaagcccac gaggcctata gccagagcct cgagttgaca ggagcccaga 7920
cgccttttcc aacggcaact tttatataaa atggcaatgt attcatgcaa ttgcggccgt 7980
gtcaggttgg agacactgga ccacactctc cattgcttcc tgaggagatg gatcattgct 8040
agtgcatcta cgcgcagcaa tcccgcaagc tcgacaaccg tagatgggct ttggtgggcc 8100
aatcaattac gcaacccgca cgttaaattg tatgaggaag gaaggccacg gtacaaagtg 8160
ggtggtcttc acccagtggt tgttggtggc gtcatgcaga ccatgcattg gggatagcac 8220
agggttgggg tgtcttgtgg actcaatggg tgaaaggaga tggaaaaggg cggtgaaaag 8280
tggtagaatc gaaatccctg acgtcaattt ataaagtaaa atgcgtttct gccattttgc 8340
tcccctcctt ctttcgcaat cgcctcccca aaagttgtcg tggcagtaca catgcttgca 8400
tacaatgaag ctaatccggc ttgctcagta gttgctatat ccaggcatgg tgtgaaaccc 8460
ctcaaagtat atataggagc ggtgagcccc agtctggggt cttttctctc catctcaaaa 8520
ctactttctc acaatgaggc cactgatgag tccgtgagga cgaaacgagt aagctcgtct 8580
ggcctgttga gtcaacccgg ttttagagct agaaatagca agttaaaata aggctagtcc 8640
gttatcaact tgaaaaagtg gcaccgagtc ggtgcttttg gccggcatgg tcccagcctc 8700
ctcgctggcg ccggctgggc aacatgcttc ggcatggcga atgggactaa acttcgagct 8760
aatccagtag cttacgttac ccaggggcag gtcaactggc tagccacgag tctgtcccag 8820
gtcgcaattt agtgtaataa acaatatata tattgagtct aaagggaatt gtagctattg 8880
tgattgtgtg attttcgtct tgctggttct tattgtgtcc cattcgtttc atcctgatga 8940
ggacccctgg aaccggtgtt ttcttagtct ctgcaatcgc tagtcttgtt gctatgacag 9000
ttgcgtcgac actattcagg tcatctatcg gttattctga tattataata cctccggatc 9060
gatgtacctg atttatactt gcagcaatgt ttacttctta tcgcgataca cgaatgtgat 9120
acggatcaaa gtaagcagga ctacgataag ataacgaatg cggtgcagtc catgtcgatt 9180
aggtatagat acatttattt tgtgttatgt tacattttgg ggggatactg tcctacttgt 9240
agtacctact tgtagtggcg cgtctattcc tttgccctcg gacgagtgct ggggcgtcgg 9300
tttccactat cggcgagtac ttctacacag ccatcggtcc agacggccgc gcttctgcgg 9360
gcgatttgtg tacgcccgac agtcccggct ccggatcgga cgattgcgtc gcatcgaccc 9420
tgcgcccaag ctgcatcatc gaaattgccg tcaaccaagc tctgatagag ttggtcaaga 9480
ccaatgcgga gcatatacgc ccggagccgc ggcgatcctg caagctccgg atgcctccgc 9540
tcgaagtagc gcgtctgctg ctccatacaa gccaaccacg gcctccagaa gaagatgttg 9600
gcgacctcgt attgggaatc cccgaacatc gcctcgctcc agtcaatgac cgctgttatg 9660
cggccattgt ccgtcaggac attgttggag ccgaaatccg cgtgcacgag gtgccggact 9720
tcggggcagt cctcggccca aagcatcagc tcatcgagag cctgcgcgac ggacgcactg 9780
acggtgtcgt ccatcacagt ttgccagtga tacacatggg gatcagcaat cgcgcatatg 9840
aaatcacgcc atgtagtgta ttgaccgatt ccttgcggtc cgaatgggcc gaacccgctc 9900
gtctggctaa gatcggccgc agcgatcgca tccatggcct ccgcgaccgg ctgcagaaca 9960
gcgggcagtt cggtttcagg caggtcttgc aacgtgacac cctgtgcacg gcgggagatg 10020
caataggtca ggctctcgct gaattcccca atgtcaagca cttccggaat cgggagcgcg 10080
gccgatgcaa agtgccgata aacataacga tctttgtaga aaccatcggc gcagctattt 10140
acccgcagga catatccacg ccctcctaca tcgaagctga aagcacgaga ttcttcgccc 10200
tccgagagct gcatcaggtc ggagacgctg tcgaactttt cgatcagaaa cttctcgaca 10260
gacgtcgcgg tgagttcagg ctttttcata tgggtacctg agaacatttt tgtgtctagg 10320
tgtttgtgtt tggactgcga tcagtgaaga aaagaagagg aaaaattgtg caagaaattt 10380
tgctttcaag acttggctga tgcagcaggg taactctggg acacagacct atgtttgtgg 10440
ttaaactcaa tgcacgtggt acgtgcgtgg agcgcttacc catccaaggg tgtggacatg 10500
gaaccgacgg tccgtggagt tgtgtaatgt cattttggcg actcttgaag caaggctata 10560
aaaaaattgt gtggcttgag tcttatcgag ctcggtcact acaagagtta atcttcctgt 10620
ctcaggcaga caggtcaggc agggttactt ttgggtgtgc tgtaactcac tgtatggccg 10680
ttagtgcgca tagacgttgt acatactgga ccgaattgta gcgtgctcaa tagggccaat 10740
aaagctattg tagggatccg aattttcaga acctaattta tctgttaccc ggcctgtggc 10800
tcgcacagct taaaaatggt caaactttcc ccttcttgtc tttttttcct cacattcatc 10860
aggttcttgt cttgatcttt caagtgagta ttaattaccg accttggttc ttcattggga 10920
gagcattgga agccgtggtg cagcaaccac aaaacggttc ttccccttcg ataccttctt 10980
gcctgccttt caatacaagt cggctcgatt agcggtggtc gcccccgcca gcggagaaca 11040
tggaactaac ccagaatgag agctaagtgg agaaagaaga gagtcagacg actcaagcga 11100
aagcgccgca aggtccgagc tcgatccaaa taagcggttt ttaacggaga tttaacacta 11160
aatcgaagaa cttttcccgt ttcatttgcg aatgagctcg ttaacaaaat cccccagttt 11220
ttttatccag ctgtaaggat tgacattagt aatgaattat tgtttggtat atttaaatct 11280
gtagttcctt tctgtccgtg tcggcaactg tcgtactcgt gatttacttg tattgacgaa 11340
tacttactgt agcgcactct gctgctactg gtcgtaagga tgtgctattt cggtgtatgg 11400
tgggtttttt gggggtcgga accgaagact gttacacggg cacggctcgt tgtgtacacg 11460
cacagagctc ttgcgagtca tgttgtagct agctcgtcgt gttcaggaac tgttcgatgg 11520
ttcggagaga gtcgccgccc agaacatacg cgcaccgatg tcagcagaca gccttattac 11580
aagtatattc aagcaagtat atccgtaggg tgcgggtgat ttggatctaa ggttcgtact 11640
caacactcac gagcagcttg cctatgttac atccttttat cagacataac ataattggag 11700
tttacttaca cacggggtgt acctgtatga gcaccaccta caattgtagc actggtactt 11760
gtacaaagaa tttattcgta cgaatcacag ggacggccgc cctcaccgaa ccagcgaata 11820
cctcagcggt cccctgcagt gactcaacaa agcgatatga acatcttgcg atggtatcct 11880
gctgatagtt tttactgtac aaacacctgt gtagctcctt ctagcatttt taagttattc 11940
acacctcaag gggagggata aattaaataa attccaaaag cgaagatcga gaaactaaat 12000
taaaattcca aaaacgaagt tggaacacaa ccccccgaaa aaaaacaaca aacaaaaaac 12060
ccaacaaaat aaacaaaaac aaaataaata tataactacc agtatctgac taaaagttca 12120
aatactcgta cttacaacaa atagaaatga gccggccaaa attctgcaga aaaaaatttc 12180
aaacaagtac tggtataatt aaattaaaaa acacatcaaa gtatcataac gttagttatt 12240
ttattttatt taataaaaga aaacaacaag atgggctcaa aactttcaac ttatacgata 12300
cataccaaat aacaatttag tatttatcta agtgcttttc gtagataatg gaatacaaat 12360
ggatatccag agtatacaca tggatagtat acactgacac gacaattctg tatctcttta 12420
tgttaactac tgtgaggcat taaatagagc ttgatatata aaatgttaca tttcacagtc 12480
tgaacttttg cagattacct aatttggtaa gatattaatt atgaactgaa agttgatggc 12540
atccctaaat ttgatgaaag atgaaattgt aaatgaggtg gtaaaagagc tacagtcgtt 12600
ttgttttgag ataccatcat ctctaacgaa atatctatta aaaatctcag tgtgatcatg 12660
agtcattgcc atcctggaaa atgtcatcat ggctgatatt tctaactgtt tacttgagat 12720
aaatatatat ttacaagaac ttcccttgaa attaatttag atataaaatg tttgcgggca 12780
agttactacg aggaataaat tatatctaga 12810
<210> 158
<211> 2142
<212> DNA
<213> 人工序列
<220>
<223> GFP表达盒(Yl_HSP.pro-A.vic_eGFP ORF-Yl_GPD.ter)的核苷酸序列,所述GFP表达盒在任一侧上侧接有50 bp的基因组DNA序列以用于靶向整合到INT05基因座中
<400> 158
tgtgaccttg taaacaacaa cccgacttta cagtaacgct tggacacact gtgcaatcac 60
atgttgctac tgtacctgct gtggaccacg cacggcggaa cgtaccgtac aaatattttc 120
ttgctcacat gactctctct cggccgcgca cgccggtggc aaattgctct tgcattggct 180
ctgtctctag acgtccaaac cgtccaaagt ggcagggtga cgtgatgcga cgcacgaagg 240
agatggcccg gtggcgagga accggacacg gcgagccggc gggaaaaaag gcggaaaacg 300
aaaagcgaag ggcacaatct gacggtgcgg ctgccaccaa cccaaggagg ctattttggg 360
tcgctttcca tttcacattc gccctcaatg gccactttgc ggtggtgaac atggtttctg 420
aaacaacccc ccagaattag agtatattga tgtgtttaag attgggttgc tatttggcca 480
ttgtggggga gggtagcgac gtggaggaca ttccagggcg aattgagcct agaaagtggt 540
agcattccaa ccgtctaagt cgtccgaatt gatcgctata actatcacct ctctcacatg 600
tctacttccc caaccaacat ccccaacctc ccccacacta aagttcacgc caataatgta 660
ggcactcttt ctgggtgtgg gacagcagag caatacggag gggagattac acaacgagcc 720
acaattgggg agatggtagc catctcactc gacccgtcga cttttggcaa cgctcaatta 780
cccaccaaat ttgggctgga gttgagggga ccgtgttcca gcgctgtagg accagcaaca 840
cacacggtat caacagcaac caacgccccc gctaatgcac ccagtactgc gcaggtgtgg 900
gccaggtgcg ttccagatgc gagttggcga accctaagcc gacagtgtac tttttgggac 960
gggcagtagc aatcgtgggc ggaaaccccg gtgtatataa aggggtggag aggacggatt 1020
attagcacca acacacacac ttatactaca atggagggtg atattcacgg tgcttctaag 1080
ggtgaggagc ttttcaccgg cgttgtccct attctcgttg agcttgatgg tgatgtcaac 1140
ggtcacaagt tttctgtctc tggtgagggt gagggtgatg ctacttacgg taagctcacc 1200
ctcaagttta tttgtaccac cggcaagctc cccgttccct ggcctaccct cgttaccact 1260
ctcacctacg gtgttcagtg tttttcccga taccccgatc acatgaagcg acacgacttt 1320
ttcaagtctg ccatgcccga gggttacgtt caggagcgaa ctatttcttt caaggatgac 1380
ggtaactaca agacccgagc tgaggttaag tttgagggtg ataccctcgt taaccgaatc 1440
gagcttaagg gtattgattt caaggaggat ggtaacattc tcggtcacaa gctggagtac 1500
aactacaact ctcacaacgt ttacatcacc gctgacaagc agaagaacgg tatcaaggct 1560
aacttcaaga ttcgacacaa cattgaggat ggttccgttc agcttgctga ccactaccag 1620
cagaacactc ccattggcga tggccctgtc ctcctccccg acaaccacta cctctctacc 1680
cagtctgccc tttctaagga ccccaacgag aagcgagatc acatggtcct ccttgagttc 1740
gttaccgctg ctggtattac tcacggtatg gatgagctct acaagtaaat aaatatccga 1800
agatcaagag cgaagcaagt tgtaagtcca ggacatgttt cccgcccacg cgagtgattt 1860
ataacacctc tcttttttga cacccgctcg ccttgaaatt catgtcacat aaattatagt 1920
caacgacgtt tgaataactt gtcttgtagt tcgatgatga tcatatgatt acattaatag 1980
taattactgt atttgatata tatactaatt acaatagtac atattagaac atacaatagt 2040
tagtgccgtg aagtggctta aaataccgcg agtcgattac gtaatattat tacatcaata 2100
tatcggacca atatatcgga ccacggtcgc cgccgaatcg cc 2142
<210> 159
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 用于确认GFP表达盒在耶氏酵母属基因组中的INT05基因座中的整合的正向引物的核苷酸序列
<400> 159
cattgatctt actgtcgaat gtac 24
<210> 160
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 用于确认GFP表达盒在耶氏酵母属基因组中的INT05基因座中的整合的反向引物的核苷酸序列
<400> 160
ttggcgtagg tgccgatgta g 21
<210> 161
<211> 5844
<212> DNA
<213> 人工序列
<220>
<223> 质粒pSTV077的核苷酸序列
<400> 161
agatcttaat taagcttggc gcgcctccgg atcgatgtac ctgatttata cttgcagcaa 60
tgtttacttc ttatcgcgat acacgaatgt gatacggatc aaagtaagca ggactacgat 120
aagataacga atgcggtgca gtccatgtcg attaggtata gatacattta ttttgtgtta 180
tgttacattt tggggggata ctgtcctact tgtagtacct acttgtagtg gcgcgtctat 240
tcctttgccc tcggacgagt gctggggcgt cggtttccac tatcggcgag tacttctaca 300
cagccatcgg tccagacggc cgcgcttctg cgggcgattt gtgtacgccc gacagtcccg 360
gctccggatc ggacgattgc gtcgcatcga ccctgcgccc aagctgcatc atcgaaattg 420
ccgtcaacca agctctgata gagttggtca agaccaatgc ggagcatata cgcccggagc 480
cgcggcgatc ctgcaagctc cggatgcctc cgctcgaagt agcgcgtctg ctgctccata 540
caagccaacc acggcctcca gaagaagatg ttggcgacct cgtattggga atccccgaac 600
atcgcctcgc tccagtcaat gaccgctgtt atgcggccat tgtccgtcag gacattgttg 660
gagccgaaat ccgcgtgcac gaggtgccgg acttcggggc agtcctcggc ccaaagcatc 720
agctcatcga gagcctgcgc gacggacgca ctgacggtgt cgtccatcac agtttgccag 780
tgatacacat ggggatcagc aatcgcgcat atgaaatcac gccatgtagt gtattgaccg 840
attccttgcg gtccgaatgg gccgaacccg ctcgtctggc taagatcggc cgcagcgatc 900
gcatccatgg cctccgcgac cggctgcaga acagcgggca gttcggtttc aggcaggtct 960
tgcaacgtga caccctgtgc acggcgggag atgcaatagg tcaggctctc gctgaattcc 1020
ccaatgtcaa gcacttccgg aatcgggagc gcggccgatg caaagtgccg ataaacataa 1080
cgatctttgt agaaaccatc ggcgcagcta tttacccgca ggacatatcc acgccctcct 1140
acatcgaagc tgaaagcacg agattcttcg ccctccgaga gctgcatcag gtcggagacg 1200
ctgtcgaact tttcgatcag aaacttctcg acagacgtcg cggtgagttc aggctttttc 1260
atatgggtac ctgagaacat ttttgtgtct aggtgtttgt gtttggactg cgatcagtga 1320
agaaaagaag aggaaaaatt gtgcaagaaa ttttgctttc aagacttggc tgatgcagca 1380
gggtaactct gggacacaga cctatgtttg tggttaaact caatgcacgt ggtacgtgcg 1440
tggagcgctt acccatccaa gggtgtggac atggaaccga cggtccgtgg agttgtgtaa 1500
tgtcattttg gcgactcttg aagcaaggct ataaaaaaat tgtgtggctt gagtcttatc 1560
gagctcggtc actacaagag ttaatcttcc tgtctcaggc agacaggtca ggcagggtta 1620
cttttgggtg tgctgtaact cactgtatgg ccgttagtgc gcatagacgt tgtacatact 1680
ggaccgaatt gtagcgtgct caatagggcc aataaagcta ttgtagggat ccgaattttc 1740
agaacctaat ttatctgtta cccggcctgt ggctcgcaca gcttaaaaat ggtcaaactt 1800
tccccttctt gtcttttttt cctcacattc atcaggttct tgtcttgatc tttcaagtga 1860
gtattaatta ccgaccttgg ttcttcattg ggagagcatt ggaagccgtg gtgcagcaac 1920
cacaaaacgg ttcttcccct tcgatacctt cttgcctgcc tttcaataca agtcggctcg 1980
attagcggtg gtcgcccccg ccagcggaga acatggaact aacccagaat gagagctaag 2040
tggagaaaga agagagtcag acgactcaag cgaaagcgcc gcaaggtccg agctcgatcc 2100
aaataagcgg tttttaacgg agatttaaca ctaaatcgaa gaacttttcc cgtttcattt 2160
gcgaatgagc tcgttaacaa aatcccccag tttttttatc cagctgtaag gattgacatt 2220
agtaatgaat tattgtttgg tatatttaaa tctgtagttc ctttctgtcc gtgtcggcaa 2280
ctgtcgtact cgtgatttac ttgtattgac gaatacttac tgtagcgcac tctgctgcta 2340
ctggtcgtaa ggatgtgcta tttcggtgta tggtgggttt tttgggggtc ggaaccgaag 2400
actgttacac gggcacggct cgttgtgtac acgcacagag ctcttgcgag tcatgttgta 2460
gctagctcgt cgtgttcagg aactgttcga tggttcggag agagtcgccg cccagaacat 2520
acgcgcaccg atgtcagcag acagccttat tacaagtata ttcaagcaag tatatccgta 2580
gggtgcgggt gatttggatc taaggttcgt actcaacact cacgagcagc ttgcctatgt 2640
tacatccttt tatcagacat aacataattg gagtttactt acacacgggg tgtacctgta 2700
tgagcaccac ctacaattgt agcactggta cttgtacaaa gaatttattc gtacgaatca 2760
cagggacggc cgccctcacc gaaccagcga atacctcagc ggtcccctgc agtgactcaa 2820
caaagcgata tgaacatctt gcgatggtat cctgctgata gtttttactg tacaaacacc 2880
tgtgtagctc cttctagcat ttttaagtta ttcacacctc aaggggaggg ataaattaaa 2940
taaattccaa aagcgaagat cgagaaacta aattaaaatt ccaaaaacga agttggaaca 3000
caaccccccg aaaaaaaaca acaaacaaaa aacccaacaa aataaacaaa aacaaaataa 3060
atatataact accagtatct gactaaaagt tcaaatactc gtacttacaa caaatagaaa 3120
tgagccggcc aaaattctgc agaaaaaaat ttcaaacaag tactggtata attaaattaa 3180
aaaacacatc aaagtatcat aacgttagtt attttatttt atttaataaa agaaaacaac 3240
aagatgggct caaaactttc aacttatacg atacatacca aataacaatt tagtatttat 3300
ctaagtgctt ttcgtagata atggaataca aatggatatc cagagtatac acatggatag 3360
tatacactga cacgacaatt ctgtatctct ttatgttaac tactgtgagg cattaaatag 3420
agcttgatat ataaaatgtt acatttcaca gtctgaactt ttgcagatta cctaatttgg 3480
taagatatta attatgaact gaaagttgat ggcatcccta aatttgatga aagatgaaat 3540
tgtaaatgag gtggtaaaag agctacagtc gttttgtttt gagataccat catctctaac 3600
gaaatatcta ttaaaaatct cagtgtgatc atgagtcatt gccatcctgg aaaatgtcat 3660
catggctgat atttctaact gtttacttga gataaatata tatttacaag aacttccctt 3720
gaaattaatt tagatataaa atgtttgcgg gcaagttact acgaggaata aattatatct 3780
agaggttccg cttcctcgct cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg 3840
gtatcagctc actcaaaggc ggtaatacgg ttatccacag aatcagggga taacgcagga 3900
aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg 3960
gcgtttttcc ataggctccg cccccctgac gagcatcaca aaaatcgacg ctcaagtcag 4020
aggtggcgaa acccgacagg actataaaga taccaggcgt ttccccctgg aagctccctc 4080
gtgcgctctc ctgttccgac cctgccgctt accggatacc tgtccgcctt tctcccttcg 4140
ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt 4200
cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc 4260
ggtaactatc gtcttgagtc caacccggta agacacgact tatcgccact ggcagcagcc 4320
actggtaaca ggattagcag agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg 4380
tggcctaact acggctacac tagaaggaca gtatttggta tctgcgctct gctgaagcca 4440
gttaccttcg gaaaaagagt tggtagctct tgatccggca aacaaaccac cgctggtagc 4500
ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat 4560
cctttgatct tttctacggg gtctgacgct cagtggaacg aaaactcacg ttaagggatt 4620
ttggtcatga gattatcaaa aaggatcttc acctagatcc ttttaaatta aaaatgaagt 4680
tttaaatcaa tctaaagtat atatgagtaa acttggtctg acagttacca atgcttaatc 4740
agtgaggcac ctatctcagc gatctgtcta tttcgttcat ccatagttgc ctgactcccc 4800
gtcgtgtaga taactacgat acgggagggc ttaccatctg gccccagtgc tgcaatgata 4860
ccgcgagacc cacgctcacc ggctccagat ttatcagcaa taaaccagcc agccggaagg 4920
gccgagcgca gaagtggtcc tgcaacttta tccgcctcca tccagtctat taattgttgc 4980
cgggaagcta gagtaagtag ttcgccagtt aatagtttgc gcaacgttgt tgccattgct 5040
gcaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt cattcagctc cggttcccaa 5100
cgatcaaggc gagttacatg atcccccatg ttgtgcaaaa aagcggttag ctccttcggt 5160
cctccgatcg ttgtcagaag taagttggcc gcagtgttat cactcatggt tatggcagca 5220
ctgcataatt ctcttactgt catgccatcc gtaagatgct tttctgtgac tggtgagtac 5280
tcaaccaagt cattctgaga atagtgtatg cggcgaccga gttgctcttg cccggcgtca 5340
acacgggata ataccgcgcc acatagcaga actttaaaag tgctcatcat tggaaaacgt 5400
tcttcggggc gaaaactctc aaggatctta ccgctgttga gatccagttc gatgtaaccc 5460
actcgtgcac ccaactgatc ttcagcatct tttactttca ccagcgtttc tgggtgagca 5520
aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg cgacacggaa atgttgaata 5580
ctcatactct tcctttttca atattattga agcatttatc agggttattg tctcatgagc 5640
ggatacatat ttgaatgtat ttagaaaaat aaacaaatag gggttccgcg cacatttccc 5700
cgaaaagtgc cacctgacgt ctaagaaacc attattatca tgacattaac ctataaaaat 5760
aggcgtatca cgaggccctt tcgtctggcc taggaagcga cttccaatcg ctttgcatat 5820
ccagtaccac acccacaggc gttt 5844
<210> 162
<211> 1000
<212> DNA
<213> 人工序列
<220>
<223> 耶氏酵母属Yl_HSP启动子的核苷酸序列
<400> 162
gtgcaatcac atgttgctac tgtacctgct gtggaccacg cacggcggaa cgtaccgtac 60
aaatattttc ttgctcacat gactctctct cggccgcgca cgccggtggc aaattgctct 120
tgcattggct ctgtctctag acgtccaaac cgtccaaagt ggcagggtga cgtgatgcga 180
cgcacgaagg agatggcccg gtggcgagga accggacacg gcgagccggc gggaaaaaag 240
gcggaaaacg aaaagcgaag ggcacaatct gacggtgcgg ctgccaccaa cccaaggagg 300
ctattttggg tcgctttcca tttcacattc gccctcaatg gccactttgc ggtggtgaac 360
atggtttctg aaacaacccc ccagaattag agtatattga tgtgtttaag attgggttgc 420
tatttggcca ttgtggggga gggtagcgac gtggaggaca ttccagggcg aattgagcct 480
agaaagtggt agcattccaa ccgtctaagt cgtccgaatt gatcgctata actatcacct 540
ctctcacatg tctacttccc caaccaacat ccccaacctc ccccacacta aagttcacgc 600
caataatgta ggcactcttt ctgggtgtgg gacagcagag caatacggag gggagattac 660
acaacgagcc acaattgggg agatggtagc catctcactc gacccgtcga cttttggcaa 720
cgctcaatta cccaccaaat ttgggctgga gttgagggga ccgtgttcca gcgctgtagg 780
accagcaaca cacacggtat caacagcaac caacgccccc gctaatgcac ccagtactgc 840
gcaggtgtgg gccaggtgcg ttccagatgc gagttggcga accctaagcc gacagtgtac 900
tttttgggac gggcagtagc aatcgtgggc ggaaaccccg gtgtatataa aggggtggag 960
aggacggatt attagcacca acacacacac ttatactaca 1000
<210> 163
<211> 742
<212> DNA
<213> 人工序列
<220>
<223> 维多利亚多管发光水母(Aequorea victoria)eGFP基因(A.vic_eGFP ORF)的核苷酸序列
<400> 163
atggagggtg atattcacgg tgcttctaag ggtgaggagc ttttcaccgg cgttgtccct 60
attctcgttg agcttgatgg tgatgtcaac ggtcacaagt tttctgtctc tggtgagggt 120
gagggtgatg ctacttacgg taagctcacc ctcaagttta tttgtaccac cggcaagctc 180
cccgttccct ggcctaccct cgttaccact ctcacctacg gtgttcagtg tttttcccga 240
taccccgatc acatgaagcg acacgacttt ttcaagtctg ccatgcccga gggttacgtt 300
caggagcgaa ctatttcttt caaggatgac ggtaactaca agacccgagc tgaggttaag 360
tttgagggtg ataccctcgt taaccgaatc gagcttaagg gtattgattt caaggaggat 420
ggtaacattc tcggtcacaa gctggagtac aactacaact ctcacaacgt ttacatcacc 480
gctgacaagc agaagaacgg tatcaaggct aacttcaaga ttcgacacaa cattgaggat 540
ggttccgttc agcttgctga ccactaccag cagaacactc ccattggcga tggccctgtc 600
ctcctccccg acaaccacta cctctctacc cagtctgccc tttctaagga ccccaacgag 660
aagcgagatc acatggtcct ccttgagttc gttaccgctg ctggtattac tcacggtatg 720
gatgagctct acaagtaaat aa 742
<210> 164
<211> 300
<212> DNA
<213> 人工序列
<220>
<223> 耶氏酵母属Yl_GPD启动子的核苷酸序列
<400> 164
atatccgaag atcaagagcg aagcaagttg taagtccagg acatgtttcc cgcccacgcg 60
agtgatttat aacacctctc ttttttgaca cccgctcgcc ttgaaattca tgtcacataa 120
attatagtca acgacgtttg aataacttgt cttgtagttc gatgatgatc atatgattac 180
attaatagta attactgtat ttgatatata tactaattac aatagtacat attagaacat 240
acaatagtta gtgccgtgaa gtggcttaaa ataccgcgag tcgattacgt aatattatta 300
<210> 165
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 用于扩增来自耶氏酵母属基因组的经编辑的GFP ORF的正向引物的核苷酸序列
<400> 165
atggagggtg atattcacgg tg 22
<210> 166
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 用于扩增来自耶氏酵母属基因组的经编辑的GFP ORF的反向引物的核苷酸序列
<400> 166
ttacttgtag agctcatcca tac 23
<210> 167
<211> 6
<212> DNA
<213> 人工序列
<220>
<223> KU70基因组靶标的6 bp反向重复序列的核苷酸序列
<400> 167
cgatat 6
<210> 168
<211> 6
<212> DNA
<213> 人工序列
<220>
<223> INT05基因组靶标的6 bp反向重复序列的核苷酸序列
<400> 168
aggcca 6
<210> 169
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> INT05基因座的20 bp基因组靶序列的核苷酸序列
<400> 169
tggcctgttg agtcaacccg 20
<210> 170
<211> 1587
<212> DNA
<213> 人工序列
<220>
<223> CTEC DNA片段1的核苷酸序列,所述核苷酸序列包含用于将Cas9靶向到GFP基因的引导RNA表达盒(sgRNA)和在3'侧上的编码GFP ORF的完全敲除的100 bp供体DNA
<400> 170
acgaagaact gcggtcaggt gacacaactt tttccatctc agggtgtgtc gcgtgtgctt 60
catccaaact ttagttgggg ttcgggttcg cgcgagatga tcacgtgccc tgatttggtg 120
tcgtcccccg tcgcgctgcg cacgtgattt atttatttcc ggtggctgct gtctacgcgg 180
ggccttctct gcccttctgt ttcaaccttc gggcggttct cgtaaccagc agtagcaatc 240
catttcgaaa ctcaaagagc taaaaacgtt aaacctcagc agtcgctcga cgaatgggct 300
gcggttggga agcccacgag gcctatagcc agagcctcga gttgacagga gcccagacgc 360
cttttccaac ggcaactttt atataaaatg gcaatgtatt catgcaattg cggccgtgtc 420
aggttggaga cactggacca cactctccat tgcttcctga ggagatggat cattgctagt 480
gcatctacgc gcagcaatcc cgcaagctcg acaaccgtag atgggctttg gtgggccaat 540
caattacgca acccgcacgt taaattgtat gaggaaggaa ggccacggta caaagtgggt 600
ggtcttcacc cagtggttgt tggtggcgtc atgcagacca tgcattgggg atagcacagg 660
gttggggtgt cttgtggact caatgggtga aaggagatgg aaaagggcgg tgaaaagtgg 720
tagaatcgaa atccctgacg tcaatttata aagtaaaatg cgtttctgcc attttgctcc 780
cctccttctt tcgcaatcgc ctccccaaaa gttgtcgtgg cagtacacat gcttgcatac 840
aatgaagcta atccggcttg ctcagtagtt gctatatcca ggcatggtgt gaaacccctc 900
aaagtatata taggagcggt gagccccagt ctggggtctt ttctctccat ctcaaaacta 960
ctttctcaca atggtattgc tgatgagtcc gtgaggacga aacgagtaag ctcgtccaat 1020
acccttaagc tcgattgttt tagagctaga aatagcaagt taaaataagg ctagtccgtt 1080
atcaacttga aaaagtggca ccgagtcggt gcttttggcc ggcatggtcc cagcctcctc 1140
gctggcgccg gctgggcaac atgcttcggc atggcgaatg ggactaaact tcgagctaat 1200
ccagtagctt acgttaccca ggggcaggtc aactggctag ccacgagtct gtcccaggtc 1260
gcaatttagt gtaataaaca atatatatat tgagtctaaa gggaattgta gctattgtga 1320
ttgtgtgatt ttcgtcttgc tggttcttat tgtgtcccat tcgtttcatc ctgatgagga 1380
cccctggaac cggtgttttc ttagtctctg caatcgctag tcttgttgct atgacagttg 1440
cgtcgacact attcaggtca tctatcggtt attctgatat tataataggg aaacatgtcc 1500
tggacttaca acttgcttcg ctcttgatct tcggatagta gtataagtgt gtgtgttggt 1560
gctaataatc cgtcctctcc acccctt 1587
<210> 171
<211> 1587
<212> DNA
<213> 人工序列
<220>
<223> CTEC DNA片段2的核苷酸序列,所述核苷酸序列包含将Cas9靶向到GFP基因的引导RNA表达盒(sgRNA)和在3'侧上的100 bp供体DNA,所述供体DNA编码PAM序列中的碱基缺失,将其从CGG改变至CG
<400> 171
acgaagaact gcggtcaggt gacacaactt tttccatctc agggtgtgtc gcgtgtgctt 60
catccaaact ttagttgggg ttcgggttcg cgcgagatga tcacgtgccc tgatttggtg 120
tcgtcccccg tcgcgctgcg cacgtgattt atttatttcc ggtggctgct gtctacgcgg 180
ggccttctct gcccttctgt ttcaaccttc gggcggttct cgtaaccagc agtagcaatc 240
catttcgaaa ctcaaagagc taaaaacgtt aaacctcagc agtcgctcga cgaatgggct 300
gcggttggga agcccacgag gcctatagcc agagcctcga gttgacagga gcccagacgc 360
cttttccaac ggcaactttt atataaaatg gcaatgtatt catgcaattg cggccgtgtc 420
aggttggaga cactggacca cactctccat tgcttcctga ggagatggat cattgctagt 480
gcatctacgc gcagcaatcc cgcaagctcg acaaccgtag atgggctttg gtgggccaat 540
caattacgca acccgcacgt taaattgtat gaggaaggaa ggccacggta caaagtgggt 600
ggtcttcacc cagtggttgt tggtggcgtc atgcagacca tgcattgggg atagcacagg 660
gttggggtgt cttgtggact caatgggtga aaggagatgg aaaagggcgg tgaaaagtgg 720
tagaatcgaa atccctgacg tcaatttata aagtaaaatg cgtttctgcc attttgctcc 780
cctccttctt tcgcaatcgc ctccccaaaa gttgtcgtgg cagtacacat gcttgcatac 840
aatgaagcta atccggcttg ctcagtagtt gctatatcca ggcatggtgt gaaacccctc 900
aaagtatata taggagcggt gagccccagt ctggggtctt ttctctccat ctcaaaacta 960
ctttctcaca atggtattgc tgatgagtcc gtgaggacga aacgagtaag ctcgtccaat 1020
acccttaagc tcgattgttt tagagctaga aatagcaagt taaaataagg ctagtccgtt 1080
atcaacttga aaaagtggca ccgagtcggt gcttttggcc ggcatggtcc cagcctcctc 1140
gctggcgccg gctgggcaac atgcttcggc atggcgaatg ggactaaact tcgagctaat 1200
ccagtagctt acgttaccca ggggcaggtc aactggctag ccacgagtct gtcccaggtc 1260
gcaatttagt gtaataaaca atatatatat tgagtctaaa gggaattgta gctattgtga 1320
ttgtgtgatt ttcgtcttgc tggttcttat tgtgtcccat tcgtttcatc ctgatgagga 1380
cccctggaac cggtgttttc ttagtctctg caatcgctag tcttgttgct atgacagttg 1440
cgtcgacact attcaggtca tctatcggtt attctgatat tataatatcc agcttgtgac 1500
cgagaatgtt accatcctcc ttgaaatcaa tacccttaag ctcgattcgt taacgagggt 1560
atcaccctca aacttaacct cagctcg 1587

Claims (19)

1.CRISPR瞬时表达构建体(CTEC)用于在宿主细胞中表达特异于靶基因组中的靶序列的功能性引导RNA或其部分的离体用途,其中所述CRISPR瞬时表达构建体是线性的并且包含:
-引导RNA表达盒,和
-另外的多核苷酸元件,并且
其中所述引导RNA表达盒能够表达特异于靶基因组中的靶序列的功能性引导RNA或其部分,并且其中所述另外的多核苷酸元件与所述靶基因组中的所述靶序列具有序列同一性。
2.根据权利要求1所述的CRISPR瞬时表达构建体(CTEC)的离体用途,其中特异于靶基因组中的靶序列的所述功能性引导RNA或其部分是从所述CTEC专有表达的。
3.根据权利要求1或2所述的CRISPR瞬时表达构建体(CTEC)的离体用途,其中所述CTEC由能够彼此重组以产生以下物质的两个或更多个多核苷酸组成:
-引导RNA表达盒,和
-另外的多核苷酸元件,
其中所述引导RNA表达盒能够表达特异于靶基因组中的靶序列的功能性引导RNA或其部分,其中所述另外的多核苷酸元件与所述靶基因组中的所述靶序列具有序列同一性。
4.根据权利要求1至3中任一项所述的CRISPR瞬时表达构建体(CTEC)的离体用途,其中在所述CTEC中,所述引导RNA表达盒和所述另外的多核苷酸元件通过包含与所述引导RNA的所述引导序列对应的靶序列的多核苷酸连接,从而允许从所述另外的多核苷酸元件体内切割所述引导RNA表达盒。
5.根据权利要求1至4中任一项所述的CRISPR瞬时表达构建体(CTEC)的离体用途,其中所述引导RNA表达盒能够表达功能性引导RNA。
6.根据权利要求1至5中任一项所述的CRISPR瞬时表达构建体(CTEC)的离体用途,其中所述引导RNA表达盒包含真核启动子。
7.根据权利要求1至5中任一项所述的CRISPR瞬时表达构建体(CTEC)的离体用途,其中所述功能性引导RNA或其部分由所述引导RNA表达盒上的多核苷酸编码,并且所述多核苷酸可操作地连接至RNA聚合酶II启动子、RNA聚合酶III启动子以及自加工核酶或单亚基DNA依赖性RNA聚合酶启动子,所述单亚基DNA依赖性RNA聚合酶启动子优选地为病毒单亚基DNA依赖性RNA聚合酶启动子,更优选地T3 RNA聚合酶启动子、SP6 RNA聚合酶启动子、K11 RNA聚合酶启动子或T7 RNA聚合酶启动子。
8.根据权利要求1至7中任一项所述的CRISPR瞬时表达构建体(CTEC)的离体用途,其中所述引导RNA表达盒位于所述另外的多核苷酸元件的3'末端。
9.根据权利要求1至7中任一项所述的CRISPR瞬时表达构建体(CTEC)的离体用途,其中所述引导RNA表达盒位于所述另外的多核苷酸元件的5'末端。
10.根据权利要求1至9中任一项所述的CRISPR瞬时表达构建体(CTEC)的离体用途,其中所述CTEC包含能够与载体重组,优选地与质粒重组,以体内产生整合到所述载体中的所述CTEC的两个或更多个多核苷酸序列。
11.包含如在权利要求1至10中任一项中所定义的CRISPR瞬时表达构建体(CTEC)或包含如在权利要求1至10中任一项中所定义的CRISPR瞬时表达构建体(CTEC)的文库的组合物用于在宿主细胞中表达特异于靶基因组中的一个或多个靶序列的功能性引导RNA或其部分的离体用途。
12.根据权利要求1至10中任一项所述的CRISPR瞬时表达构建体(CTEC)的离体用途或根据权利要求11所述的组合物的离体用途,所述离体用途还包括使用功能性多核苷酸引导的基因组编辑酶或能够表达功能性多核苷酸引导的基因组编辑酶的表达构建体,并且其中所述功能性多核苷酸引导的基因组编辑酶优选地为Cas9或Cpf1。
13.根据权利要求1至12中任一项所述的离体用途,其中所述宿主细胞缺乏非同源末端连接(NHEJ)。
14.一种宿主细胞,所述宿主细胞包含如在权利要求1-10中任一项中所定义的CRISPR瞬时表达构建体(CTEC)或包括如在权利要求11中所定义的组合物。
15.根据权利要求14所述的宿主细胞,所述宿主细胞还包含:
功能性多核苷酸引导的基因组编辑酶,优选地功能性多核苷酸引导的异源基因组编辑酶,或者
还包含能够表达功能性多核苷酸引导的基因组编辑酶,优选地功能性多核苷酸引导的异源基因组编辑酶的表达构建体,
其中所述功能性多核苷酸引导的基因组编辑酶优选地为Cas9或Cpf1。
16.根据权利要求15所述的宿主细胞,其中所述另外的多核苷酸元件的序列被引入到所述基因组中所述另外的多核苷酸元件与在所述靶基因组中的所述靶序列侧翼的序列具有序列同一性的位点处。
17.根据权利要求14至16中任一项所述的宿主细胞,其中所述宿主细胞缺乏非同源末端连接(NHEJ)。
18.根据权利要求14至17中任一项所述的宿主细胞,所述宿主细胞包含编码感兴趣的化合物的多核苷酸。
19.一种用于生产感兴趣的化合物的方法,所述方法包括在有助于所述感兴趣的化合物的生产的条件下培养根据权利要求18所述的宿主细胞,以及任选地纯化或分离所述感兴趣的化合物。
CN201980030758.0A 2018-05-09 2019-05-06 Crispr瞬时表达构建体(ctec) Pending CN112088215A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP18171496.5 2018-05-09
EP18171496 2018-05-09
EP18184210 2018-07-18
EP18184210.5 2018-07-18
PCT/EP2019/061587 WO2019215102A1 (en) 2018-05-09 2019-05-06 Crispr transient expression construct (ctec)

Publications (1)

Publication Number Publication Date
CN112088215A true CN112088215A (zh) 2020-12-15

Family

ID=66597527

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980030758.0A Pending CN112088215A (zh) 2018-05-09 2019-05-06 Crispr瞬时表达构建体(ctec)

Country Status (4)

Country Link
US (2) US20210071174A1 (zh)
EP (1) EP3790969A1 (zh)
CN (1) CN112088215A (zh)
WO (1) WO2019215102A1 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR112022009584A2 (pt) * 2019-11-18 2022-10-04 Shanghai Bluecross Medical Science Inst Sistema de edição de genes derivado de flavobacterium
CA3205601A1 (en) * 2020-12-17 2022-06-23 Monsanto Technology Llc Engineered ssdnase-free crispr endonucleases
CN112592926A (zh) * 2020-12-28 2021-04-02 江南大学 一种crispr系统及其在高山被孢霉中的应用
WO2024025908A2 (en) * 2022-07-25 2024-02-01 Artisan Development Labs, Inc. Compositions and methods for genome editing

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103388006A (zh) * 2013-07-26 2013-11-13 华东师范大学 一种基因定点突变的构建方法
WO2016195598A1 (en) * 2015-06-03 2016-12-08 National University Of Singapore Vectors
US20170049909A1 (en) * 2014-02-18 2017-02-23 Duke University Compositions for the inactivation of virus replication and methods of making and using the same
CN107027313A (zh) * 2014-10-17 2017-08-08 宾州研究基金会 用于多元rna引导的基因组编辑和其它rna技术的方法和组合物
WO2017216392A1 (en) * 2016-09-23 2017-12-21 Dsm Ip Assets B.V. A guide-rna expression system for a host cell
US20180010151A1 (en) * 2015-01-06 2018-01-11 Dsm Ip Assets B.V. A crispr-cas system for a yeast host cell

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2004256295B2 (en) 2003-07-15 2011-09-01 Mintek Oxidative leach process
EP1664298A4 (en) 2003-09-12 2010-03-17 Commw Scient Ind Res Org MODIFIED GEN-SILENCING NUCLEIC ACID MOLECULES AND USES THEREOF
ATE541936T1 (de) 2004-10-15 2012-02-15 Dsm Ip Assets Bv Verfahren zur herstellung einer verbindung in einer eukaryotischen zelle
CN101107354B (zh) 2005-01-24 2012-05-30 帝斯曼知识产权资产管理有限公司 用于在有丝真菌细胞中生产感兴趣化合物的方法
WO2008000632A1 (en) 2006-06-29 2008-01-03 Dsm Ip Assets B.V. A method for achieving improved polypeptide expression
WO2008053019A2 (en) 2006-11-02 2008-05-08 Dsm Ip Assets B.V. Method for reducing the expression of a gene in a filamentous fungal cell
BRPI1009189A2 (pt) 2009-03-10 2015-09-15 Dsm Ip Assets Bv método para melhorar o rendimento de um polipetídeo
CN102414323B (zh) 2009-04-22 2015-07-08 帝斯曼知识产权资产管理有限公司 用于生产感兴趣的重组多肽的方法
WO2014130955A1 (en) 2013-02-25 2014-08-28 Sangamo Biosciences, Inc. Methods and compositions for enhancing nuclease-mediated gene disruption
CN105530423B (zh) 2014-09-30 2018-09-04 北京智谷技术服务有限公司 超分辨率图像的获取方法和获取装置
CN104320596B (zh) 2014-09-30 2017-11-21 北京智谷技术服务有限公司 超分辨率图像的获取方法和获取装置
US11396665B2 (en) 2015-01-06 2022-07-26 Dsm Ip Assets B.V. CRISPR-CAS system for a filamentous fungal host cell
US11149268B2 (en) * 2016-07-28 2021-10-19 Dsm Ip Assets B.V. Assembly system for a eukaryotic cell
WO2018127611A1 (en) * 2017-04-06 2018-07-12 Dsm Ip Assets B.V. Self-guiding integration construct (sgic)

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103388006A (zh) * 2013-07-26 2013-11-13 华东师范大学 一种基因定点突变的构建方法
US20170049909A1 (en) * 2014-02-18 2017-02-23 Duke University Compositions for the inactivation of virus replication and methods of making and using the same
CN107027313A (zh) * 2014-10-17 2017-08-08 宾州研究基金会 用于多元rna引导的基因组编辑和其它rna技术的方法和组合物
US20180010151A1 (en) * 2015-01-06 2018-01-11 Dsm Ip Assets B.V. A crispr-cas system for a yeast host cell
WO2016195598A1 (en) * 2015-06-03 2016-12-08 National University Of Singapore Vectors
WO2017216392A1 (en) * 2016-09-23 2017-12-21 Dsm Ip Assets B.V. A guide-rna expression system for a host cell

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
MINJUNG SONG: "The CRISPR/Cas9 system: Their delivery, in vivo and ex vivo applications and clinical development by startups", BIOTECHNOL PROG, vol. 33, no. 4, pages 1035 - 1045, XP072297989, DOI: 10.1002/btpr.2484 *

Also Published As

Publication number Publication date
EP3790969A1 (en) 2021-03-17
WO2019215102A1 (en) 2019-11-14
US20240263172A1 (en) 2024-08-08
US20210071174A1 (en) 2021-03-11

Similar Documents

Publication Publication Date Title
KR102628801B1 (ko) 세포내 유전자 변형 및 증가된 상동 재조합을 위한 보호 dna 주형 및 이용 방법
KR102381610B1 (ko) Rna-유도 엔도뉴클레아제를 사용한 통상적이지 않은 효모에서의 유전자 표적화
KR102370675B1 (ko) 표적 핵산의 변형을 위한 개선된 방법
CN109715804A (zh) 用于宿主细胞的指导rna表达系统
CN112088215A (zh) Crispr瞬时表达构建体(ctec)
CN102695796B (zh) 细胞、核酸、酶和它们用于生产槐糖脂的用途以及方法
JP2023071855A (ja) CRISPR-Casエフェクターポリペプチド及びその使用方法
DK2576605T3 (en) PREPARATION OF METABOLITES
KR20180081618A (ko) 유전자 편집에 의한 인간 디스트로핀 유전자의 교정을 위한 치료용 표적 및 사용 방법
CN109563505A (zh) 用于真核细胞的组装系统
KR20140099224A (ko) 케토-아이소발레레이트 데카르복실라제 효소 및 이의 이용 방법
CN106687578B (zh) 螺旋藻中的靶向诱变
KR20110015045A (ko) 2-상 추출 발효를 이용한 부탄올의 생산방법
KR20130087013A (ko) 추출 발효에서의 알코올 제거를 위한 오일로부터 유래되는 추출 용매
CN108779480A (zh) 生产鞘氨醇碱和鞘脂类的方法
KR20120117990A (ko) 삼투조절물질 첨가를 동반한 추출성 발효를 사용해 부탄올을 제조하는 방법
KR20120099509A (ko) 재조합 숙주 세포에서 육탄당 키나아제의 발현
KR20130116858A (ko) 추출 발효에서 알코올 수거를 위한 오일 유래의 추출 용매
KR20130138760A (ko) 고농도의 에이코사펜타엔산 생성을 위한 재조합 미생물 숙주 세포
CN106661573B (zh) 多核苷酸文库的重组酶介导的整合
KR20120046788A (ko) 식물 내에서 종자-특이적 및/또는 종자-우선적 유전자 발현을 향상시키기 위한 조절 핵산 분자
CN116134133A (zh) 用于基因组编辑的新颖的非天然存在的crispr-cas核酸酶
CN109996874A (zh) 10-甲基硬脂酸的异源性产生
CN113699053B (zh) 一株生产虾青素的重组酿酒酵母及其应用
KR20220007155A (ko) 코로나바이러스 스파이크 단백질의 변형된 s1 서브유닛

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20201215

WD01 Invention patent application deemed withdrawn after publication