CN110462044A - 自引导整合构建体(sgic) - Google Patents

自引导整合构建体(sgic) Download PDF

Info

Publication number
CN110462044A
CN110462044A CN201880022160.2A CN201880022160A CN110462044A CN 110462044 A CN110462044 A CN 110462044A CN 201880022160 A CN201880022160 A CN 201880022160A CN 110462044 A CN110462044 A CN 110462044A
Authority
CN
China
Prior art keywords
sequence
polynucleotides
sgic
guidance
rna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201880022160.2A
Other languages
English (en)
Inventor
约翰尼斯·安德列什·劳博斯
瑞内·维尔瓦尔
比安卡·伊丽莎白·玛丽亚·吉勒森
布伦达·沃恩克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
DSM IP Assets BV
Original Assignee
DSM IP Assets BV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by DSM IP Assets BV filed Critical DSM IP Assets BV
Publication of CN110462044A publication Critical patent/CN110462044A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/111General methods applicable to biologically active non-coding nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/905Stable introduction of foreign DNA into chromosome using homologous recombination in yeast
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2330/00Production
    • C12N2330/50Biochemical production, i.e. in a transformed host cell
    • C12N2330/51Specially adapted vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/10Plasmid DNA
    • C12N2800/102Plasmid DNA for yeast
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2810/00Vectors comprising a targeting moiety
    • C12N2810/10Vectors comprising a non-peptidic targeting moiety
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/52Vector systems having a special element relevant for transcription encoding ribozyme for self-inactivation

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Mycology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明涉及分子生物学和细胞生物学领域。更特别地,本发明涉及用于基因组编辑系统的自引导整合构建体。

Description

自引导整合构建体(SGIC)
技术领域
本发明涉及分子生物学和细胞生物学领域。更特别地,本发明涉及用于基因组编辑系统的自引导整合构建体。
背景技术
多核苷酸引导的核酸酶系统也称为多核苷酸引导的基因组编辑系统,其是已用于基因组编辑和基因调控的强大工具,其中最着名的是CRISPR/Cas9系统。该工具至少需要多核苷酸引导的核酸酶(诸如Cas9)和引导多核苷酸(诸如引导RNA),所述引导多核苷酸使得基因组编辑酶能够靶向DNA的特定序列。此外,为了以精确方式编辑基因组,主要需要供体多核苷酸,诸如供体DNA,尤其是当依赖于用于在基因组中的期望位点进行精确编辑的同源重组而不是依赖于通过随机修复过程(诸如非同源末端连接)进行的修复时。对于每个靶位点,需要设计和合成供体多核苷酸。另外,对基因组中的靶位点特异的引导多核苷酸需要进行设计,并且需要在细胞内表达或需要在体外表达并引入细胞中。对于使用CRISPR/Cas9系统的靶向修饰,需要使用对靶标特异的供体多核苷酸和引导多核苷酸的组合。尤其是对于多重方法,诸如当筛选例如敲除文库、敲低文库或启动子替换文库时,因为包含引导多核苷酸或引导多核苷酸表达构建体的匹配组合物和匹配供体多核苷酸将必须一起转化,所以实验工作非常艰巨。为了在一个实验中筛选多种靶标和/或多种修饰,现有技术设置需要加入和使用多样的多核苷酸,以及甚至更大量的对包含期望性质的细胞的筛选。因此,持续迫切需要开发改进且简化的引导多核苷酸和供体多核苷酸工具。
附图说明
图1描绘了单拷贝(CEN/ARS)载体pCSN061的载体图谱,其表达经密码子对优化的Cas9以用于在S.cerevisiae中表达。CPO Cas9由Kluyveromyces lactis KLLA0F20031g启动子和S.cerevisiae GND2终止子表达。
KanMX标记盒存在于载体上,其赋予对G418的抗性以允许在平板上或在液体培养物中选择转化体。TRP1标记允许用trp1营养缺陷型来在酵母菌株中选择质粒。
图2描绘了多拷贝(2微米)载体pRN1120的载体图谱。NatMX标记盒存在于载体上,其赋予对诺尔丝菌素的抗性以允许在平板上或在液体培养物中选择转化体。该载体用于用于在使用EcoRI和XhoI进行线性化后使sgRNA表达盒体内重组。
图3描绘了如实施例1中所述使用CRISPR/Cas9系统在Saccharomyces cerevisiae中整合自引导整合构建体(SGIC)型引导RNA表达盒。SGIC在5'末端和3'末端处包含50bp侧翼,所述50bp侧翼与基因组DNA序列具有序列同一性以允许经由同源重组在期望基因组基因座(INT1、INT59或YPRCtau3)处进行整合。取决于所述侧翼的序列,整合SGIC后多至1kbp的一段DNA从基因组中缺失。3A:没有侧翼对照;3B:0kB缺失;3C:1kB缺失;3D:没有SGIC片段。
图4描绘了两种SGIC分裂引导RNA片段(SGIC split guide-RNA fragment),所述两种SGIC分裂引导RNA片段基本上是实施例1中提出的SGIC的两个半部,彼此具有80bp的重叠同源性以允许体内(在酵母细胞内)装配功能性SGIC。经装配的功能性SGIC引导RNA包含引导RNA表达盒和在5'末端和3'末端处的50bp侧翼,所述50bp侧翼与基因组DNA序列具有序列同一性以允许经由同源重组在期望的基因组基因座处进行整合。随后将包含引导RNA表达盒的功能性SGIC整合到S.cerevisiae基因组的INT1基因座中。作为sgRNA构建体或分裂SGIC的一部分的灰色框表示与INT1基因座的基因组DNA同源的序列。作为sgRNA构建体或分裂SGIC的一部分的黑色框代表接头序列(与S.cerevisiae基因组DNA没有同源性的50bpDNA序列)。4A:分裂SGIC;4B:具有分开的ssODN侧翼的SGIC;4C:具有附接的侧翼的SGICDNA。
图5描绘了载体BG-AMA5的图谱,所述载体BG-AMA5表达经密码子对优化的Cas9以用于在A.niger中表达并用于实施例3中。载体及其构建的细节描述于WO2016110453A1中。
图6描绘了载体BG-AMA9的图谱,所述载体BG-AMA9用于在A.niger中表达并用于实施例3中。载体及其构建的细节描述于WO2016110453A1中。
图7描绘了在实施例3中使用的载体SGIC DNA hygB的图谱。
图8描绘了在实施例3中使用的载体SGIC DNA phleo的图谱。
图9描绘了实验3,所述实验3例示了使用SGIC来破坏A.niger中的fwnA6基因,如实施例3的描述中和表10至表15中进一步详述的。
在图9A中,SGIC含有sgRNA盒,所述sgRNA盒靶向fwnA6基因座,并且通过瞬时表达并与Cas9一起作用而引入双链断裂,所述双链断裂由黑色三角形表示。5'和3'同源侧翼通过灰色方框1和2直观表示。SGIC称为‘SGIC片段I’,并通过同源重组整合到基因组中的fwnA6基因座处。
在图9B中,SGIC含有:(1)sgRNA盒,所述sgRNA盒靶向fwnA6基因座,并且通过瞬时表达并与Cas9一起作用而引入双链断裂,所述双链断裂由黑色三角形表示,(2)标记盒,以及(3)5'和3'同源侧翼,所述5'和3'同源侧翼通过灰色方框1和2直观表示。SGIC称为‘SGIC片段II A’或‘SGIC片段II B’,并通过同源重组整合到基因组中的fwnA6基因座处。
在图9C中,SGIC是包含两个2DNA片段的分裂SGIC,所述两个2DNA片段在Aspergillus niger中体内装配而形成功能性SGIC,所述功能性SGIC含有(1)sgRNA盒,所述sgRNA盒靶向fwnA6基因座,并且通过瞬时表达并与Cas9一起作用而引入双链断裂,所述双链断裂由黑色三角形表示,(2)标记盒,以及(3)5'和3'同源侧翼,所述5'和3'同源侧翼通过灰色方框1和2直观表示。所使用的分裂SGIC片段对于左侧DNA片段而言称为‘SGIC片段III’并且对于右侧DNA片段而言称为‘SGIC片段IV A’或‘SGIC片段IV B’;这些片段通过同源侧翼‘H’而在体内重组并形成功能性SGIC,所述功能性SGIC通过同源重组整合到基因组中的fwnA6基因座处。
图10描绘了在实施例3中使用的载体BG-AMA14的图谱。
图11描绘了在WO2016110453A1中描述并在实施例3中使用的载体BG-AMA8的图谱。
图12例示了在实施例3中应用的多种实验方案,以显示SGIC在Aspergillus niger中的使用。图12A对应于表10和表11中的行A,图12B对应于表10和表11中的行B,并且对于图12C至图12G依此类推。
图13描绘了在实施例3中使用的载体BG-AMA17的图谱。
图14描绘了在实施例3中使用的载体BG-AMA1的图谱。
图15A-L描绘了根据本发明的自引导整合构建体(SGIC)的可行和典型使用的多种方案,所述SGIC包含引导RNA构建体,所述引导RNA构建体能够表达特异于靶多核苷酸(诸如基因组)中的靶序列的功能性引导RNA。子图15A至图15L例示了SGIC与CRISPR/Cas9系统的组合在Saccharomyces cerevisiae中的使用。在实践中,Cas9可以被Cpf1或另一种RNA引导的内切核酸酶替代,指定的标记可以被其他合适的标记替代,并且复制起点可以被另一复制起点替代,例如来自本文其他地方描述的质粒和/或盒。在SGIC内,指定的标记也可以用其他合适的标记替代,甚至可以用功能性或非功能性多核苷酸片段替代或补充。在另一种RNA引导的内切核酸酶的情况下,可以使用适当的引导RNA、sgRNA或crRNA或与RNA引导的内切核酸酶相互作用并且靶向基因组靶位点的其他合适的RNA序列来代替直观表示的引导RNA盒。直观表示的引导RNA盒还可以包含和编码部分引导RNA,所述部分引导RNA与另一外部提供的或单独表达的引导RNA部分一起形成功能性引导RNA,所述功能性引导RNA与RNA引导的内切核酸酶相互作用并将所得复合物靶向至基因组DNA靶标。基因组DNA靶位点(靶多核苷酸)在此通过单个框直观表示,而在实践中它可以是多者(例如多个染色体)的集合。所表示的DNA载体被描绘用于在S.cerevisiae中应用;这些DNA载体可以被用于其他宿主系统的合适载体替代,所述用于其他宿主系统的合适载体为诸如用于丝状真菌(例如Aspergillus niger)的AMA质粒,如本申请中的实施例2和实施例3所示。基因组DNA靶位点处的Cas9在所有情况下被直观表示为卵形斑点,引导RNA在所述卵形斑点上以浅灰色直观表示。
图15A描绘了一种方案,其中Cas9从具有选择性标记(在此为KanMX)的第一载体1表达,并且SGIC在相同的转化中引入。sgRNA将从SGIC内的sgRNA盒瞬时表达。线性SGIC将整合在基因组处,所述整合由SGIC的5'和3'处以浅灰色指示的同源侧翼促进,并且由从线性SGIC表达的sgRNA引导的Cas9产生的双链断裂促进。在再生期间,对载体1的标记(在此为KanMX)进行选择。可以在之后例如通过合适的PCR反应来执行对整合的SGIC的检测,并且更特别地可以通过对引导序列进行测序来表征整合的sgRNA盒。
图15B描绘了一种方案,其中Cas9从在第一转化中引入细胞中的具有选择性标记(在此为KanMX)的第一载体1表达,并且在第二转化中将SGIC与具有选择性标记(在此为NatMX)的载体2一起引入细胞中。sgRNA将从SGIC处的sgRNA盒瞬时表达。线性SGIC将整合在基因组处,所述整合由SGIC的5'和3'处以浅灰色指示的同源侧翼促进,并且由从SGIC表达的sgRNA引导的Cas9产生的双链断裂促进。在第一轮转化的再生期间,为了能够(预)表达Cas9,对载体1的标记(在此为KanMX)进行选择。在使用预表达Cas9的细胞进行的第二轮转化的再生期间,对载体2的标记(在此为NatMX)进行选择,或者在单一转化程序或两个相继转化程序中对两种选择性标记(在此为KanMX和NatMX)应用双重选择。可以在之后例如通过合适的PCR反应来执行对整合的SGIC的检测,并且更特别地可以通过对引导序列进行测序来表征整合的sgRNA盒。在一种替代性情况下,第一转化也可以是使用合适的转化构建体在细胞基因组处引入Cas9表达盒。
图15C描绘了一种方案,其中在相同转化中将Cas9作为蛋白质与SGIC和具有选择性标记(在此为NatMX)的载体1一起引入。sgRNA将从SGIC处的sgRNA盒瞬时表达。线性SGIC将整合在基因组处,所述整合由SGIC的5'和3'处以浅灰色指示的同源侧翼促进,并且由从SGIC表达的sgRNA引导的Cas9产生的双链断裂促进。在再生期间,对载体1的标记(在此为NatMX)进行选择。可以在之后例如通过合适的PCR反应来执行对整合的SGIC的检测,并且更特别地可以通过对引导序列进行测序来表征整合的sgRNA盒。
图15D描绘了一种方案,其中Cas9从在第一转化中引入细胞中的具有选择性标记(在此为KanMX)的第一载体1表达,并且在第二转化中将含有选择性标记的SGIC引入细胞中。sgRNA将从SGIC处的sgRNA盒瞬时表达。线性SGIC将整合在基因组处,所述整合由SGIC的5'和3'处以浅灰色指示的同源侧翼促进,并且由从SGIC表达的sgRNA引导的Cas9产生的双链断裂促进。在第一轮转化的再生期间,对载体1的标记(在此为KanMX)进行选择。在第二轮转化的再生期间,对SGIC的标记进行选择,或对载体和SGIC构建体上的两种选择性标记应用双重选择。可以在之后例如通过合适的PCR反应来执行对整合的SGIC的检测,并且更特别地可以通过对引导序列进行测序来表征整合的sgRNA盒。应注意,可以在单轮转化中应用相同的方案,从而将Cas9载体(具有或不具有选择性标记并且具有或不具有复制起点,是线性或环状的构建体)与含有选择性标记的SGIC一起提供。在再生期间,可以对SGIC上的选择性标记进行选择,或者对Cas9载体上的标记和SGIC上的选择性标记进行双重选择。在一种替代性情况下,第一转化也可以是使用合适的转化构建体在细胞基因组处引入Cas9表达盒。
图15E描绘了一种方案,其中在相同转化中将Cas9作为蛋白质与含有sgRNA盒和选择性标记的SGIC一起引入细胞中。sgRNA将从SGIC处的sgRNA盒瞬时表达。包含选择性标记的线性SGIC将整合在基因组处,所述整合由SGIC的5'和3'处以浅灰色指示的同源侧翼促进,并且由从SGIC表达的sgRNA引导的Cas9产生的双链断裂促进。在再生期间,对基因组DNA处整合的SGIC上的标记进行选择。可以在之后例如通过合适的PCR反应来执行对整合的SGIC的检测,并且更特别地可以通过对引导序列进行测序来表征整合的sgRNA盒。
图15F描绘了一种方案,其中Cas9从在第一转化中引入细胞中的具有选择性标记(在此为KanMX)的第一载体1表达。在第二转化中,将SGIC作为两个DNA片段引入细胞中,所述两个DNA片段将在体内重组,并且在重组后含有sgRNA盒和选择性标记盒。在该图中,sgRNA盒直观表示为左片段和右片段,所述左片段与基因组具有5'同源侧翼,并且所述右片段含有与基因组具有3'同源侧翼的标记盒,而所述两个片段含有一段用于体内重组的合适同源DNA。在实践中,DNA片段的顺序和数量可以是不同的,只要这些DNA片段可以装配成与基因组具有5'和3'同源侧翼的SGIC即可。sgRNA将从SGIC处的sgRNA盒瞬时表达。线性SGIC将整合在基因组处,所述整合由sgRNA构建体的5'和3'处以浅灰色指示的同源侧翼促进,并且由从SGIC表达的sgRNA引导的Cas9产生的双链断裂促进。在第一轮转化的再生期间,对载体1的标记(在此为KanMX)进行选择。在第二轮转化的再生期间,对SGIC的标记进行选择,或对载体和SGIC上的两种选择性标记应用双重选择。可以在之后例如通过合适的PCR反应来执行对整合的SGIC的检测,并且更特别地可以通过对引导序列进行测序来表征整合的sgRNA盒。应注意,可以在单轮转化中应用相同的方案,从而将Cas9载体(具有或不具有选择性标记并且具有或不具有复制起点,是线性或环状的构建体)与含有选择性标记的SGIC一起提供。在再生期间,可以对SGIC上的选择性标记进行选择,或者对Cas9载体上的标记和SGIC上的选择性标记进行双重选择。在一种替代性情况下,第一转化也可以是使用合适的转化构建体在细胞基因组处引入Cas9表达盒。
图15G描绘了一种方案,其中Cas9作为蛋白质与作为两个DNA片段的SGIC一起引入细胞中,所述两个DNA片段将在体内重组,并且在重组后含有sgRNA盒和选择性标记盒。在该图中,sgRNA盒直观表示为左片段和右片段,所述左片段与基因组具有5'同源侧翼,并且所述右片段含有与基因组具有3'同源侧翼的标记盒,而所述两个片段含有一段用于体内重组的合适同源DNA。在实践中,DNA片段的顺序和数量可以是不同的,只要这些DNA片段可以装配成与基因组具有5'和3'同源侧翼的SGIC即可。包含选择性标记的线性SGIC将整合在基因组处,所述整合由SGIC的5'和3'处以浅灰色指示的同源侧翼促进,并且由从SGIC表达的sgRNA引导的Cas9产生的双链断裂促进。在再生期间,对基因组DNA处整合的SGIC上的标记进行选择。可以在之后例如通过合适的PCR反应来执行对整合的SGIC的检测,并且更特别地可以通过对引导序列进行测序来表征整合的sgRNA盒。
图15H描绘了一种方案,其中Cas9从具有选择标记(在此为KanMX)的第一载体1表达,并且两个(或更多个)SGIC在相同的转化中引入。两个(或更多个)sgRNA将从SGIC处的sgRNA盒瞬时表达。一个(或多个)线性SGIC将整合在基因组处,所述整合由两个(或更多个)SGIC的5'和3'处以浅灰色指示的同源侧翼促进,并且由从两个(或更多个)线性SGIC表达的两个(或更多个)sgRNA引导的Cas9产生的两个(或更多个)双链断裂促进。在再生期间,对载体1的标记(在此为KanMX)进行选择。可以在之后例如通过合适的PCR反应来执行对整合的一个(或多个)SGIC的检测,并且更特别地可以通过对一个(或多个)引导序列进行测序来表征整合的sgRNA盒。
图15I描绘了一种方案,其中Cas9从在第一转化中引入细胞中的具有选择性标记(在此为KanMX)的第一载体1表达,并且在第二转化中将两个(或更多个)SGIC与具有选择性标记(在此为NatMX)的载体2一起引入细胞中。两个(或更多个)sgRNA将从两个(或更多个)SGIC处的sgRNA盒瞬时表达。一个(或多个)线性SGIC将整合在基因组处,所述整合由SGIC的5'和3'处以浅灰色指示的同源侧翼促进,并且由从SGIC表达的sgRNA引导的Cas9产生的双链断裂促进。在第一轮转化的再生期间,对载体1的标记(在此为KanMX)进行选择。在第二轮转化的再生期间,对载体2的标记(在此为NatMX)进行选择,或者对两种选择性标记(在此为KanMX和NatMX)应用双重选择。可以在之后例如通过合适的PCR反应来执行对一个(或多个)整合的SGIC的检测,并且更特别地可以通过对引导序列进行测序来表征一个(或多个)整合的sgRNA盒。在一种替代性情况下,第一转化也可以是使用合适的转化构建体在细胞基因组处引入Cas9表达盒。或者,可以在单一转化中将载体1和载体2以及两个(或更多个)SGIC引入细胞中,并在再生期间对诸如KanMX和NatMX的两种标记物进行选择。
图15J描绘了一种方案,其中在相同转化中将Cas9作为蛋白质与两个(或更多个)SGIC和具有选择性标记的载体1一起引入。sgRNA将从两个(或更多个)SGIC处的sgRNA盒瞬时表达。一个或多个SGIC将整合在基因组处,所述整合由SGIC的5'和3'处以浅灰色指示的同源侧翼促进,并且由从SGIC表达的sgRNA引导的Cas9产生的双链断裂促进。在再生期间,对载体1的标记(在此为NatMX)进行选择。可以在之后例如通过合适的PCR反应来执行对整合的一个(或多个)SGIC的检测,并且更特别地可以通过对引导序列进行测序来表征一个(或多个)整合的sgRNA盒。
图15K描绘了一种方案,其中Cas9从在第一转化中引入细胞中的具有选择性标记(在此为KanMX)的第一载体1表达,并且在第二转化中将含有选择性标记的两个(或更多个)SGIC引入细胞中。两个(或更多个)sgRNA将从SGIC处的两个(或更多个)sgRNA盒瞬时表达。两个(或更多个)线性SGIC将整合在基因组处,所述整合由两个(或更多个)SGIC的5'和3'处以浅灰色指示的同源侧翼促进,并且由从两个(或更多个)SGIC表达的sgRNA引导的Cas9产生的双链断裂促进。在第一轮转化的再生期间,对载体1的标记(在此为KanMX)进行选择。在第二轮转换的再生期间,对一个(或多个)SGIC的标记进行选择,或者对载体上的选择性标记和SGIC构建体处的一个或多个不同选择性标记应用双重(或更多重)选择。可以在之后例如通过合适的PCR反应来执行对整合的两个(或更多个)SGIC的检测,并且更特别地可以通过对引导序列进行测序来表征一个(或多个)整合的sgRNA盒。应注意,可以在单轮转化中应用相同的方案,从而将Cas9载体(具有或不具有选择性标记并且具有或不具有复制起点,是线性或环状的构建体)与含有选择性标记的SGIC一起提供。在再生期间,可以对SGIC上的选择性标记进行选择,或者对Cas9载体上的标记和SGIC上的选择性标记进行双重选择。在一种替代性情况下,第一转化也可以是使用合适的转化构建体在细胞基因组处引入Cas9表达盒。
图15L描绘了一种方案,其中在相同转化中将Cas9作为蛋白质与两个(或更多个)SGIC一起引入细胞中,所述SGIC含有sgRNA盒和选择性标记(其中两个SGIC可以含有相同的选择性标记或不同的选择性标记)。sgRNA将从两个(或更多个)SGIC处的sgRNA盒瞬时表达。包含选择性标记的一个(或多个)线性SGIC将整合在基因组处,所述整合由两个(或更多个)SGIC的5'和3'处以浅灰色指示的同源侧翼促进,并且由从两个(或更多个)SGIC表达的sgRNA引导的Cas9产生的双链断裂促进。在再生期间,对基因组DNA处一个(或多个)整合的SGIC上的标记进行选择。可以在之后例如通过合适的PCR反应来执行对一个(或多个)整合的SGIC的检测,并且更特别地可以通过对引导序列进行测序来表征一个(或多个)整合的sgRNA盒。
图16描绘了可用于将控制序列替代或插入基因组DNA中的SGIC构建体的示例。SGIC与RNA引导的内切核酸酶组合应用,在基因组DNA盒直观表示处表示为卵形斑点。
图16A描绘了使用SGIC构建体来用新的启动子DNA序列(Pro2)替代(或插入)启动子(Pro1)或其部分。SGIC处的5'和3'同源侧翼确定基因组DNA的哪一部分将被SGIC插入物替代。在此的ORF表示基因的开放阅读框。在一种优选的情况下,选择同源侧翼以使得与基因组DNA的体内重组(通过单链断裂或双链断裂促进)导致ORF在基因组处的功能性表达,其中Pro1(或其部分)被Pro2替代,所述Pro2例如更弱或更强,可诱导或具有与Pro1不同的另一特征。在另一种情况下,可以在相同转化中提供多个SGIC(具有相同或不同的sgRNA盒,具有相同或不同的同源侧翼)以产生Pro1的替换文库。在另一种情况下,可以在单一转化实验中提供多个SGIC(具有相同或不同的sgRNA盒,具有相同或不同的同源侧翼)以产生靶向基因组处的不同ORF的文库,从而产生在细胞的基因组处的一个或多个启动子替代。该示例性直观表示不限于Cas9,并且应当被视为显示启动子替代原理的说明,其也可以与其他RNA引导的内切核酸酶一起应用,例如在应用的SGIC处的相应RNA表达盒的Cpf1。
图16B描绘了用另一种Pro2和信号序列SS2替代启动子(Pro1)和信号序列(SS1),例如,分泌信号、前原序列等。在16A和16B的两种情况中,附加元件如合适的标记盒可以是SGIC的一部分。在图中,mORF是编码成熟蛋白质的ORF的缩写,表示没有信号序列。
图17描绘了根据本发明的SGIC的使用的多种示例。应当注意的是,如图17所示的使用可以方便地与图15和图16所示的使用组合。SGIC与RNA引导的内切核酸酶组合应用,在基因组DNA框直观表示处表示为卵形斑点。
图17A描绘了使用具有5'和3'同源侧翼的SGIC来整合在基因组DNA处,如灰色方框所直观表示的。
图17B描绘了具有5'和3'同源侧翼和单独的双链DNA侧翼(通过SGIC上的黑框和单独的侧翼直观表示)的SGIC的使用,所述单独的双链DNA侧翼本身具有用于整合在基因组DNA处的5'或3'同源性,如由灰色方框所直观表示的。通过体内同源重组,SGIC将整合在基因组处。
图17C描绘了具有5'和3'同源侧翼和单独的单链ODN侧翼(通过SGIC上的黑框和单独的ssODN直观表示)的SGIC的使用,所述单独的单链ODN侧翼本身具有用于整合在基因组DNA处的5'或3'同源性,如由灰色方框所直观表示的。通过体内同源重组,SGIC将整合在基因组处。
图17D描绘了具有5'和3'同源侧翼和2组单独的互补单链ODN侧翼(通过SGIC上的黑框和单独的ssODN直观表示)的SGIC的使用,所述2组单独的互补单链ODN侧翼本身具有用于整合在基因组DNA处的5'或3'同源性,如由灰色方框所直观表示的。通过体内同源重组,SGIC将整合在基因组处。
图17E描绘了以与图17A类似的方式的SGIC的使用。在此,两个或更多个SGIC具有用于整合在基因组DNA处的5'和3'同源侧翼,如灰色方框所直观表示的。通过在一次转化中提供具有与基因组DNA不同的同源侧翼的SGIC,将产生具有整合在基因组DNA上的不同位置(由所应用的SGIC的同源侧翼确定)处的SGIC的细胞文库。
图17F描绘了以与图17B类似的方式的SGIC的使用。在此,三个或更多个单独的双链DNA侧翼(通过SGIC上的黑框和单独的侧翼直观表示)本身具有用于整合在基因组DNA处的5'或3'同源性,如由灰色方框所直观表示的。通过在一次转化中提供具有与基因组DNA不同的同源侧翼的SGIC,将产生具有整合在基因组DNA上的不同位置(由所应用的双链DNA侧翼的同源侧翼确定)处的SGIC的细胞文库。
图17G描绘了与图17C类似的方式的SGIC的使用。在此,三个或更多个单独的单链ODN侧翼(通过SGIC上的黑框和单独的ssODN直观表示)本身具有用于整合在基因组DNA处的5'或3'同源性,如由灰色方框所直观表示的。通过在一次转化中提供具有与基因组DNA不同的同源侧翼的SGIC,将产生具有整合在基因组DNA上的不同位置(由所应用的ssODN侧翼的同源侧翼确定)处的SGIC的细胞文库。
图17H描绘了与图17D类似的方式的SGIC的使用。在此,三组或更多组互补的单链ODN侧翼(通过SGIC上的黑框和单独的ssODN直观表示)本身具有用于整合在基因组DNA处的5'或3'同源性,如由灰色方框所直观表示的。通过在一次转化中提供具有与基因组DNA不同的同源侧翼的SGIC,将产生具有整合在基因组DNA上的不同位置(由所应用的互补的ssODN侧翼的组的同源侧翼确定)处的SGIC的细胞文库。
图17I描绘了与图17A类似的方式的SGIC的使用。在此,两个或更多个SGIC具有用于整合在基因组DNA处的5'和3'同源侧翼,如灰色方框所直观表示的。通过提供具有不同的DNA元件的SGIC1、SGIC2(或更多直到SGICn),将产生具有整合在基因组DNA上的相同位置的SGIC的细胞文库。使用的示例(但不限于这些)可以是SGIC1、SGIC2直至SGICn在sgRNA引导物方面不同,靶向不同的切割基因座,或例如含有将在基因组处引入以替代现有启动子的不同DNA启动子元件)。通过提供具有不同的DNA元件的SGIC,将产生具有整合在基因组DNA上的不同位置的SGIC1、SGIC2(或更多)的细胞文库。
图17J描绘了与图17B类似的方式的SGIC的使用。在此,两个或更多个SGIC具有与单独的双链DNA侧翼的5'和3'同源侧翼(通过SGIC上的黑框和单独的侧翼直观表示),所述单独的双链DNA侧翼本身具有用于整合在基因组DNA处的5'或3'同源性,如由灰色方框所直观表示的。通过提供具有不同的DNA元件的SGIC1、SGIC2(或更多直到SGICn),将产生具有整合在基因组DNA上的相同位置的SGIC的细胞文库。使用的示例(但不限于这些)可以是SGIC1、SGIC2直至SGICn在sgRNA引导物方面不同,靶向不同的切割基因座,或例如含有将在基因组处引入以替代现有启动子的不同DNA启动子元件)。通过提供具有不同的DNA元件的SGIC,将产生具有整合在基因组DNA上的不同位置的SGIC1、SGIC2(或更多)的细胞文库。
序列说明
SEQ ID NO:1列出了Cas9的核苷酸序列,所述核苷酸序列包括经密码子对优化以用于在Saccharomyces cerevisiae中表达的C末端SV40核定位信号。该序列包括来自Kluyveromyces lactis的Kl11启动子(KLLA0F20031g的启动子)和来自Saccharomycescerevisiae的GND2终止子序列。
SEQ ID NO:2列出了载体pCSN061的核苷酸序列。
SEQ ID NO:3列出了载体pRN1120的核苷酸序列。
SEQ ID NO:4列出了用于将Cas9靶向INT1基因座的引导RNA表达盒的gBlock的核苷酸序列。
SEQ ID NO:5列出了用于将Cas9靶向INT59基因座的引导RNA表达盒的gBlock的核苷酸序列。
SEQ ID NO:6列出了用于将Cas9靶向YPRCtau3基因座的引导RNA表达盒的gBlock的核苷酸序列。
SEQ ID NO:7列出了INT1整合位点的引导序列(基因组靶序列)的核苷酸序列。
SEQ ID NO:8列出了INT59整合位点的引导序列(基因组靶序列)的核苷酸序列。
SEQ ID NO:9列出了YPRCtau3整合位点的引导序列(基因组靶序列)的核苷酸序列。
SEQ ID NO:10列出了FW引物的核苷酸序列,所述FW引物用于获得用于整合0kbp缺失的INT1SGIC DNA序列。
SEQ ID NO:11列出了REV引物的核苷酸序列,所述REV引物用于获得用于整合0kbp缺失的INT1SGIC DNA序列。
SEQ ID NO:12列出了FW引物的核苷酸序列,所述FW引物用于获得用于整合1kbp缺失的INT1SGIC DNA序列。
SEQ ID NO:13列出了REV引物的核苷酸序列,所述REV引物用于获得用于整合1kbp缺失的INT1SGIC DNA序列。
SEQ ID NO:14列出了FW引物的核苷酸序列,所述FW引物用于获得用于整合0kbp缺失的INT59SGIC DNA序列。
SEQ ID NO:15列出了REV引物的核苷酸序列,所述REV引物用于获得用于整合0kbp缺失的INT59SGIC DNA序列。
SEQ ID NO:16列出了FW引物的核苷酸序列,所述FW引物用于获得用于整合1kbp缺失的INT59SGIC DNA序列。
SEQ ID NO:17列出了REV引物的核苷酸序列,所述REV引物用于获得用于整合1kbp缺失的INT59SGIC DNA序列。
SEQ ID NO:18列出了FW引物的核苷酸序列,所述FW引物用于获得用于整合0kbp缺失的YPRCtau3SGIC DNA序列。
SEQ ID NO:19列出了REV引物的核苷酸序列,所述REV引物用于获得用于整合0kbp缺失的YPRCtau3SGIC DNA序列。
SEQ ID NO:20列出了FW引物的核苷酸序列,所述FW引物用于获得用于整合1kbp缺失的YPRCtau3SGIC DNA序列。
SEQ ID NO:21列出了REV引物的核苷酸序列,所述REV引物用于获得用于整合1kbp缺失的YPRCtau3SGIC DNA序列。
SEQ ID NO:22列出了用于整合0kbp缺失的INT1SGIC DNA序列的核苷酸序列。
SEQ ID NO:23列出了用于整合1kbp缺失的INT1SGIC DNA序列的核苷酸序列。
SEQ ID NO:24列出了用于整合0kbp缺失的INT59SGIC DNA序列的核苷酸序列。
SEQ ID NO:25列出了用于整合1kbp缺失的INT59SGIC DNA序列的核苷酸序列。
SEQ ID NO:26列出了用于整合0kbp缺失的YPRCtau3SGIC DNA序列的核苷酸序列。
SEQ ID NO:27列出了用于整合1kbp缺失的YPRCtau3SGIC DNA序列的核苷酸序列。
SEQ ID NO:28列出了FW引物的核苷酸序列,所述FW引物退火至SNR52p以获得用于整合的没有附接基因组侧翼区的SGIC DNA序列。
SEQ ID NO:29列出了REV引物的核苷酸序列,所述REV引物退火至SUP4 3'侧翼区以获得用于整合的没有附接基因组侧翼区的SGIC DNA序列。
SEQ ID NO:30列出了两侧上没有附接基因组侧翼区的INT1SGIC DNA的核苷酸序列。
SEQ ID NO:31列出了两侧上没有附接基因组侧翼区的INT59SGIC DNA的核苷酸序列。
SEQ ID NO:32列出了两侧上没有附接基因组侧翼区的YPRCtau3SGIC DNA的核苷酸序列。
SEQ ID NO:33列出了FW引物的核苷酸序列,所述FW引物用于确认SGIC DNA在INT1基因座中0kbp缺失的整合。
SEQ ID NO:34列出了REV引物的核苷酸序列,所述REV引物用于确认SGIC DNA在INT1基因座中0kbp缺失的整合。
SEQ ID NO:35列出了FW引物的核苷酸序列,所述FW引物用于确认SGIC DNA在INT1基因座中1kbp缺失的整合。
SEQ ID NO:36列出了REV引物的核苷酸序列,所述REV引物用于确认SGIC DNA在INT1基因座中1kbp缺失的整合。
SEQ ID NO:37列出了FW引物的核苷酸序列,所述FW引物用于确认SGIC DNA在INT59基因座中0kbp缺失的整合。
SEQ ID NO:38列出了REV引物的核苷酸序列,所述REV引物用于确认SGIC DNA在INT59基因座中0kbp缺失的整合。
SEQ ID NO:39列出了FW引物的核苷酸序列,所述FW引物用于确认SGIC DNA在INT59基因座中1kbp缺失的整合。
SEQ ID NO:40列出了REV引物的核苷酸序列,所述REV引物用于确认SGIC DNA在INT59基因座中1kbp缺失的整合。
SEQ ID NO:41列出了FW引物的核苷酸序列,所述FW引物用于确认SGIC DNA在YPRCtau3基因座中0kbp缺失的整合。
SEQ ID NO:42列出了REV引物的核苷酸序列,所述REV引物用于确认SGIC DNA在YPRCtau3基因座中0kbp缺失的整合。
SEQ ID NO:43列出了FW引物的核苷酸序列,所述FW引物用于确认SGIC DNA在YPRCtau3基因座中1kbp缺失的整合。
SEQ ID NO:44列出了REV引物的核苷酸序列,所述REV引物用于确认SGIC DNA在YPRCtau3基因座中1kbp缺失的整合。
SEQ ID NO:45列出了FW引物的核苷酸序列,所述FW引物退火至SNR52p以获得在5'末端具有50bp接头序列的INT1SGIC DNA序列。
SEQ ID NO:46列出了REV引物的核苷酸序列,所述REV引物退火至SUP4以获得在3'末端具有50bp接头序列的INT1SGIC DNA序列。
SEQ ID NO:47列出了SGIC DNA的核苷酸序列,所述SGIC DNA具有附接到5'和3'末端的接头序列。
SEQ ID NO:48列出了REV引物的核苷酸序列,所述REV引物退火至SNR52p以获得靶向INT1的5'分裂SGIC DNA序列。
SEQ ID NO:49列出了FW引物的核苷酸序列,所述FW引物退火至引导RNA以获得靶向INT1的3'分裂SGIC DNA序列。
SEQ ID NO:50列出了FW引物的核苷酸序列,所述FW引物退火至SGIC DNA片段的5'接头以附接基因组DNA序列用于整合到INT1上。
SEQ ID NO:51列出了RV引物的核苷酸序列,所述RV引物退火至SGIC DNA片段的3'接头以附接基因组DNA序列用于整合到INT1上。
SEQ ID NO:52列出了SGIC DNA的核苷酸序列,所述SGIC DNA具有附接在5'和3'末端两者上的50bp基因组DNA序列以用于整合在INT1上。
SEQ ID NO:53列出了分裂SGIC DNA的5'片段的核苷酸序列,所述分裂SGIC DNA的5'片段与3'分裂SGIC DNA具有50bp的同源性以用于进行装配。
SEQ ID NO:54列出了分裂SGIC DNA的3'片段的核苷酸序列,所述分裂SGIC DNA的3'片段与5'分裂SGIC DNA具有50bp的同源性以用于进行装配。
SEQ ID NO:55列出了ssODN 5'侧翼1kbp上游链序列的核苷酸序列。
SEQ ID NO:56列出了ssODN 5'侧翼1kbp下游链序列的核苷酸序列。
SEQ ID NO:57列出了ssODN 3'侧翼1kbp上游链序列的核苷酸序列。
SEQ ID NO:58列出了ssODN 3'侧翼1kbp下游链序列的核苷酸序列。
SEQ ID NO:59列出了SGIC DNA的5'末端上的接头序列的核苷酸序列。
SEQ ID NO:60列出了SGIC DNA的3'末端上的接头序列的核苷酸序列。
SEQ ID NO:61列出了正向PCR引物SGIC DNA部分5'fwnA侧翼-sgRNA-3'conH的核苷酸序列。
SEQ ID NO:62列出了反向PCR引物SGIC DNA部分5'fwnA侧翼-sgRNA-3'conH的核苷酸序列。
SEQ ID NO:63列出了正向PCR引物SGIC DNA hygB或phleo标记-3'fnwA侧翼的核苷酸序列。
SEQ ID NO:64列出了反向PCR引物SGIC DNA hygB或phleo标记-3'fnwA侧翼的核苷酸序列。
SEQ ID NO:65列出了BG-AMA5AMA phleo/Cas9st的核苷酸序列。
SEQ ID NO:66列出了BG-AMA9AMA hygB/Cas9st./sgRNA盒的核苷酸序列。
SEQ ID NO:67列出了TOPO Zero Blunt克隆载体的核苷酸序列。
SEQ ID NO:68列出了骨架载体AB的核苷酸序列。
SEQ ID NO:69列出了载体SGIC DNA hygB的核苷酸序列。
SEQ ID NO:70列出了载体SGIC DNA phleo的核苷酸序列。
SEQ ID NO:71列出了反向PCR引物SGIC片段I的核苷酸序列。
SEQ ID NO:72列出了正向PCR引物SGIC片段II和III的核苷酸序列。
SEQ ID NO:73列出了反向PCR引物SGIC片段II和IV的核苷酸序列。
SEQ ID NO:74列出了反向PCR引物SGIC片段III的核苷酸序列。
SEQ ID NO:75列出了正向PCR引物SGIC片段IV的核苷酸序列。
SEQ ID NO:76列出了TOPO SGIC DNA sgRNA fwnA的核苷酸序列。
SEQ ID NO:77列出了TOPO SGIC hygB的核苷酸序列。
SEQ ID NO:78列出了TOPO SGIC phleo的核苷酸序列。
SEQ ID NO:79列出了具有KpnI侧翼的正向PCR引物Cas9的核苷酸序列。
SEQ ID NO:80列出了具有KpnI侧翼的反向PCR引物Cas9的核苷酸序列。
SEQ ID NO:81列出了BG-AMA8AMA hygB/没有Cas9表达盒的核苷酸序列。
SEQ ID NO:82列出了BG-AMA14AMA phleo/Cas9++的核苷酸序列。
SEQ ID NO:83列出了BG-AMA17AMA hygB/Cas9st的核苷酸序列。
SEQ ID NO:84列出了BG-AMA1AMA phleo/没有Cas9表达盒的核苷酸序列。
SEQ ID NO:85列出了SGIC DNA片段I的核苷酸序列(参见表9)。
SEQ ID NO:86列出了SGIC DNA片段IIA的核苷酸序列(参见表9)。
SEQ ID NO:87列出了SGIC DNA片段II B的核苷酸序列(参见表9)。
SEQ ID NO:88列出了SGIC DNA片段III的核苷酸序列(参见表9)。
SEQ ID NO:89列出了SGIC DNA片段IV A的核苷酸序列(参见表9)。
SEQ ID NO:90列出了SGIC DNA片段IV B的核苷酸序列(参见表9)。
SEQ ID NO:91列出了含有靶向ORF1的sgRNA表达盒的gBlock的核苷酸序列;即,将基因组侧翼区加到5'和3'末端之前的ORF1_SGIC DNA。
SEQ ID NO:92列出了含有靶向ORF2的sgRNA表达盒的gBlock的核苷酸序列;即,将基因组侧翼区加到5'和3'末端之前的ORF2_SGIC DNA。
SEQ ID NO:93列出了含有靶向ORF3的sgRNA表达盒的gBlock的核苷酸序列;即,将基因组侧翼区加到5'和3'末端之前的ORF3_SGIC DNA。
SEQ ID NO:94列出了ORF1的引导序列(基因组靶序列)的核苷酸序列。
SEQ ID NO:95列出了ORF2的引导序列(基因组靶序列)的核苷酸序列。
SEQ ID NO:96列出了ORF3的引导序列(基因组靶序列)的核苷酸序列。
SEQ ID NO:97列出了正向引物的核苷酸序列以用于获得ORF1_SGIC DNA序列用于整合。
SEQ ID NO:98列出了反向引物的核苷酸序列以用于获得ORF1_SGIC DNA序列用于整合。
SEQ ID NO:99列出了正向引物的核苷酸序列以用于获得ORF2_SGIC DNA序列用于整合。
SEQ ID NO:100列出了反向引物的核苷酸序列以用于获得ORF2_SGIC DNA序列用于整合。
SEQ ID NO:101列出了正向引物的核苷酸序列以用于获得ORF3SGIC_DNA序列用于整合。
SEQ ID NO:102列出了反向引物的核苷酸序列以用于获得ORF3_SGIC DNA序列用于整合。
SEQ ID NO:103列出了ORF1_SGIC DNA的核苷酸序列,所述ORF1_SGIC DNA在5'和3'末端均附接有基因组侧翼区用于整合。
SEQ ID NO:104列出了ORF2_SGIC DNA的核苷酸序列,所述ORF2_SGIC DNA在5'和3'末端均附接有基因组侧翼区用于整合。
SEQ ID NO:105列出了ORF3_SGIC DNA的核苷酸序列,所述ORF3_SGIC DNA在5'和3'末端均附接有基因组侧翼区用于整合。
SEQ ID NO:106列出了正向引物的核苷酸序列,以确认通过整合ORF1_SGIC DNA对ORF1的敲除。
SEQ ID NO:107列出了反向引物的核苷酸序列,以确认通过整合ORF1_SGIC DNA对ORF1的敲除。
SEQ ID NO:108列出了正向引物的核苷酸序列,以确认通过整合ORF2_SGIC DNA对ORF2的敲除。
SEQ ID NO:109列出了反向引物的核苷酸序列,以确认通过整合ORF2_SGIC DNA对ORF2的敲除。
SEQ ID NO:110列出了正向引物的核苷酸序列,以确认通过整合ORF3_SGIC DNA对ORF3的敲除。
SEQ ID NO:111列出了反向引物的核苷酸序列,以确认通过整合ORF3_SGIC DNA对ORF3的敲除。
发明详述
发明人已发现了一种自引导整合构建体提供了很大的改进,所述自引导整合构建体包含引导RNA构建体,所述引导RNA构建体能够表达对靶多核苷酸中的靶序列特异的功能性引导RNA,其中所述引导RNA构建体的侧翼是与靶多核苷酸中的靶序列侧翼的序列具有序列同一性的5'多核苷酸和3'多核苷酸,所述构建体任选地还包含另外的功能性或非功能性多核苷酸元件。在该系统中,引导RNA最初从自引导整合构建体表达。所表达的引导RNA促进将断裂诱导到靶基因组中的靶序列处,随后自引导整合构建体整合到靶基因组中。该系统可以例如使用自引导整合构建体文库来方便地使用,其中在与引导RNA连接的构建体上存在不同的另外功能性或非功能性多核苷酸元件。本文提供的SGIC可以被视为在例如CRISPR/Cas基因编辑领域中已知意义上的供体多核苷酸,其含有引导RNA表达盒。
通过使用多核苷酸引导的核酸酶/编辑系统(诸如CRISPR/Cas9系统),可开发这样的基因驱动,所述基因驱动能够经由有性复制而由生物体自发地扩散基因组改变,例如由DiCarlo等人,2015所解释的。发明人和申请人在过去、现在和未来都并非旨在创建此类基因驱动或类似的自主基因编辑工具(也称为诱变链式反应或活性遗传学)。
在第一方面,提供了一种自引导整合构建体(SGIC),其包含:
-引导RNA表达盒,和
-另外的多核苷酸元件,
其中所述引导RNA表达盒能够表达功能性引导RNA或其部分,所述功能性引导RNA或其部分是对靶基因组中的靶序列特异的,其中包含所述引导RNA表达盒和所述供体多核苷酸部分的自引导整合构建体的部分在其5'末端侧接第一多核苷酸并在其3'末端侧接第二多核苷酸,并且其中所述第一和第二多核苷酸与靶基因组中靶序列侧翼的序列具有序列同一性。
此外,提供了一种自引导整合构建体,其包含:
-引导RNA表达盒,和任选地,
-另外的多核苷酸元件,
其中所述引导RNA表达盒能够表达功能性引导RNA或其部分,所述功能性引导RNA或其部分是对靶基因组中的靶序列特异的,其中包含所述引导RNA表达盒和所述任选的另外的多核苷酸元件的所述自引导整合构建体的部分在其5'末端侧接第一多核苷酸并在其3'末端侧接第二多核苷酸,其中所述第一和第二多核苷酸与靶基因组中靶序列侧翼的序列具有序列同一性,以及其中所述功能性引导RNA或其部分由所述引导RNA表达盒上的多核苷酸编码,并且所述多核苷酸可操作地连接至RNA聚合酶II启动子、至RNA聚合酶III启动子以及自加工核酶,或至单亚基DNA依赖性RNA聚合酶启动子,所述单亚基DNA依赖性RNA聚合酶启动子优选为病毒单亚基DNA依赖性RNA聚合酶启动子,更优选T3、SP6、K11或T7RNA聚合酶启动子。
此外,提供了一种自引导整合构建体,其包含:
两个或更多个多核苷酸,所述两个或更多个多核苷酸能够彼此重组以产生引导RNA表达盒,以及任选地包含另外的多核苷酸元件,
其中所述引导RNA表达盒能够表达功能性引导RNA或其部分,其中所述功能性引导RNA或其部分对靶基因组中的靶序列是特异的,其中包含所述引导RNA表达盒和任选地所述另外的多核苷酸元件的所述自引导整合构建体的部分在其5'末端侧接第一多核苷酸并在其3'末端侧接第二多核苷酸,并且其中所述第一和第二多核苷酸与靶基因组中靶序列侧翼的序列具有序列同一性。图15中描绘了此类自引导整合构建体的非限制性示例。
此外,提供了一种组合物,所述组合物包含两种或更多种多核苷酸构件(member),其中这些构件彼此具有序列同一性以允许它们在体内重组,诸如在宿主细胞中重组,以产生单个自引导整合构建体,所述自引导整合构建体包含:
-引导RNA表达盒,和
-另外的多核苷酸元件,
其中所述引导RNA表达盒能够表达功能性引导RNA或其部分,所述功能性引导RNA或其部分是对靶基因组中的靶序列特异的,其中包含所述引导RNA表达盒和所述另外的多核苷酸元件的所述自引导整合构建体的部分在其5'末端侧接第一多核苷酸并在其3'末端侧接第二多核苷酸,并且其中所述第一和第二多核苷酸与靶基因组中靶序列侧翼的序列具有序列同一性。图15中描绘了如本文所公开的此类组合物的非限制性示例,从而产生如本文所公开的自引导整合构建体。
此外,提供了一种根据本发明的组合物,所述组合物包含两种或更多种多核苷酸构件,其中这些构件彼此具有序列同一性以允许它们在体内重组,诸如在宿主细胞中重组,以产生单个自引导整合构建体,所述自引导整合构建体包含:
-引导RNA表达盒,和任选地,
-另外的多核苷酸元件,
其中所述引导RNA表达盒能够表达功能性引导RNA或其部分,所述功能性引导RNA或其部分是对靶基因组中的靶序列特异的,其中包含所述引导RNA表达盒和所述任选的另外的多核苷酸元件的所述自引导整合构建体的部分在其5'末端侧接第一多核苷酸并在其3'末端侧接第二多核苷酸,其中所述第一和第二多核苷酸与靶基因组中靶序列侧翼的序列具有序列同一性,以及其中所述功能性引导RNA或其部分由所述引导RNA表达盒上的多核苷酸编码,并且所述多核苷酸可操作地连接至RNA聚合酶II启动子、至RNA聚合酶III启动子以及自加工核酶,或至单亚基DNA依赖性RNA聚合酶启动子,所述单亚基DNA依赖性RNA聚合酶启动子优选为病毒单亚基DNA依赖性RNA聚合酶启动子,更优选T3、SP6、K11或T7RNA聚合酶启动子。图15中描绘了如本文所公开的此类组合物的非限制性示例,从而产生根据如本文所公开的自引导整合构建体。优选地,所述两种或更多种多核苷酸构件中的第一种在其5'末端上具有与所述两种或更多种多核苷酸构件中的第二种的3'末端上的部分具有序列同一性的部分,以此类推,使得如本文所公开的自引导整合构建体可以在体内(在细胞内)装配。在一个具体实施方式中,多核苷酸构件彼此不具有序列同一性,但提供了单独的单链或双链寡核苷酸,所述单独的单链或双链寡核苷酸与两种多核苷酸构件具有序列同一性并允许在体内(在细胞内)装配如本文所公开的自引导整合构建体。
在本发明所有实施方式的上下文中,自引导整合构建体是多核苷酸构建体,其不是自主复制实体;其不包含自主复制序列。自引导整合构建体可以是线性或环状的构建体,并且在一个实施方式中,可以通过两个或更多个分开的,优选线性的构件的重组而在体内(细胞内)形成。术语多核苷酸在本文的“一般定义”中定义。
在本发明的所有实施方式中,自引导整合构建体优选是线性自引导整合构建体。线性具有本领域已知的用于多核苷酸的含义;应理解为多核苷酸不是环状的,具有两个明确限定的末端5'末端和3'末端,所述末端优选均为平末端。如本文所公开的线性自引导整合构建体可以是从头合成的,其可以通过例如PCR或通过用限制酶消化而从载体(诸如质粒)、从文库或其他系统产生。如本文所公开的引导RNA表达盒是多核苷酸表达构建体,所述多核苷酸表达构建体包含在体内(诸如细胞内)表达功能性引导RNA或其部分所需的除RNA聚合酶之外的部件。所述部件包括但不限于启动子、编码引导RNA或其部分的编码序列,以及终止子。这些部件是本领域技术人员已知的,并且优选是如本文所定义的那些部件。所述引导RNA的“其部分”优选是包含引导序列或由引导序列组成的部分。引导序列是识别序列,即这样的序列,所述序列对靶基因组中的靶序列是特异的(即基本上互补的)并且允许将功能性多核苷酸引导的基因组编辑酶和功能性引导RNA的复合物靶向到靶基因组中的靶序列。在引导RNA或其部分中的引导序列的上下文中的术语“特异”应解释为引导序列与靶基因组中的靶序列基本上互补,其中“基本上互补”意指在靶序列与引导序列之间存在足够的互补性(序列同一性),以允许在细胞中在生理条件下进行杂交;通常允许一个或两个错配而仍能够充分杂交。当使用合适的比对算法进行最佳比对时,互补性(序列同一性)程度优选高于50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%或高于99%。不同的序列可以引导核酸酶,如用于Cas9的引导RNA(Mali等人,2013;Cong等人,2013)、用于Cpf1的crRNA(Zetsche等人,2015)或用于NgAgo的5'磷酸化单链引导DNA(Gao等人,2016),如本领域技术人员已知的。当自引导整合构建体中的编码序列不编码完整且功能性的引导RNA,而是编码包含引导序列或由引导序列组成的引导RNA的部分时,与引导序列一起形成功能性引导RNA的引导RNA的其他部分在不同构建体上编码或在细胞内原样存在。编码引导RNA的其余部件的构建体可以存在于基因组中或可以存在于载体上或可以原样存在于细胞中。
功能性多核苷酸引导的基因组编辑酶可以是本领域技术人员已知的任何系统。用于本发明所有实施方式中的合适功能性基因组编辑系统包括:RNA引导的内切核酸酶,如CRISPR/Cas(Mali等人,2013;Cong等人,2013)或CRISPR/Cpf1(Zetsche等人,2015);以及DNA引导的内切核酸酶;和/或阿尔戈(argonaute)系统(Gao等人,2016)。功能性基因组编辑酶优选是异源酶,并且优选是以下酶:诸如Cas酶,优选Cas9或Cas9切口酶;Cpf1。
包含引导RNA表达盒和(任选地)另外的多核苷酸元件的自引导整合构建体的部分在其5'末端侧接第一多核苷酸并在其3'末端侧接第二多核苷酸,其中所述第一和第二多核苷酸与靶基因组中靶序列侧翼的序列具有序列同一性。图15中描绘了此类构建体的非限制性示例。在其5'末端侧接第一多核苷酸被解释为第一多核苷酸定位为紧邻包含引导RNA表达盒和任选的另外的多核苷酸元件的部分的5'末端侧。第一多核苷酸也可称为5'侧翼。同样地,在其3'末端侧接第二多核苷酸应解释为第二多核苷酸定位为紧邻包含引导RNA表达盒和任选的另外的多核苷酸元件的部分的3'末端侧。第二多核苷酸也可称为3'侧翼。为避免疑义,所述构建体是单个多核苷酸,其中所述部分:5'侧翼—包含引导RNA表达盒和任选的另外的多核苷酸元件的部分—3'侧翼,是可识别的,但包含单串连续核苷酸。第一多核苷酸(5'侧翼)和第二多核苷酸(3'侧翼)与靶基因组中靶序列侧翼的序列具有序列同一性。如本文所公开的自引导整合构建体中5'侧翼和3'侧翼的序列同一性优选使得所述侧翼和靶基因组中靶序列侧翼的序列可在体内(诸如在细胞内)重组,使得根据本发明的自引导整合构建体整合到靶基因组中。本领域技术人员知道允许一些错配同时仍能够重组。优选地,如本文所公开的自引导整合构建体中的5'侧翼和3'侧翼与靶基因组中靶序列侧翼的相应序列的序列同一性是至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、97%、98%或99%,最优选100%。根据本发明的5'侧翼和3'侧翼可以具有任何长度,只要允许体内(诸如在细胞内)重组,使得如本文所公开的自引导整合构建体整合到靶基因组中即可。优选地,5'侧翼的长度为至少10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、35个、40个、45个、50个、55个、60个、65个、70个、75个、80个、85个、90个、95个、100个、110个、120个、130个、140个、150个、160个、170个、180个、190个、200个、250个、300个、350个、400个、450个、500个、600个、700个、800个、900个或1000个核苷酸。优选地,5'侧翼的长度为至多1000个、900个、800个、700个、600个、500个、450个、400个、350个、300个、250个、200个、190个、180个、170个、160个、150个、140个、130个、120个、110个、100个、95个、90个、85个、80个、75个、70个、65个、60个、55个、50个、45个、40个、35个、30个或25个核苷酸。优选地,3'侧翼的长度为至少10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、35个、40个、45个、50个、55个、60个、65个、70个、75个、80个、85个、90个、95个、100个、110个、120个、130个、140个、150个、160个、170个、180个、190个、200个、250个、300个、350个、400个、450个、500个、600个、700个、800个、900个或1000个核苷酸。优选地,3'侧翼的长度为至多1000个、900个、800个、700个、600个、500个、450个、400个、350个、300个、250个、200个、190个、180个、170个、160个、150个、140个、130个、120个、110个、100个、95个、90个、85个、80个、75个、70个、65个、60个、55个、50个、45个、40个、35个、30个或25个核苷酸。
优选地,5'侧翼的长度为约25至约80个核苷酸,更优选约30至约80个核苷酸,更优选约50至约80个核苷酸。优选地,3'侧翼的长度为约25至约80个核苷酸,更优选约30至约80个核苷酸,更优选约50至约80个核苷酸。
优选地,5'侧翼的长度为25至80个核苷酸,更优选30至80个核苷酸,更优选50至80个核苷酸。优选地,3'侧翼的长度为25至80个核苷酸,更优选30至80个核苷酸,更优选50至80个核苷酸。
优选地,5'侧翼的长度为25至80个核苷酸,诸如25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、50个、51个、52个、53个、54个、55个、56个、57个、58个、59个、60个、61个、62个、63个、64个、65个、66个、67个、68个、69个、70个、71个、72个、73个、74个、75个、76个、77个、78个、79个和80个核苷酸。优选地,3'侧翼的长度为15至80个核苷酸,诸如25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、50个、51个、52个、53个、54个、55个、56个、57个、58个、59个、60个、61个、62个、63个、64个、65个、66个、67个、68个、69个、70个、71个、72个、73个、74个、75个、76个、77个、78个、79个和80个核苷酸。
对于本发明的所有方面和实施方式,一个具体实施方式适用于以下情况:包含引导RNA表达盒和任选地另外的多核苷酸元件的自引导整合构建体的部分在其5'末端侧接第一多核苷酸并在其3'末端侧接第二多核苷酸,并且其中所述第一和第二多核苷酸与靶基因组中靶序列侧翼的序列具有序列同一性(参见图17A)。
本发明包括一种前提,其中提供两种或更多种自引导整合构建体(SGIC),所述两种或更多种SGIC包含相同的引导RNA表达盒和任选地另外的多核苷酸元件,在其5'末端侧接第一多核苷酸并在其3'末端侧接第二多核苷酸,并且其中所述第一和第二多核苷酸与靶基因组中靶序列侧翼的序列具有序列同一性,所述靶基因组中靶序列侧翼的序列对于所述两种或更多种SGIC中的每一种是不同的(参见图17E)。
本发明包括一种前提,其中提供两种或更多种自引导整合构建体(SGIC),所述两种或更多种SGIC各自包含不同的引导RNA表达盒和任选地另外的多核苷酸元件,在其5'末端侧接第一多核苷酸并在其3'末端侧接第二多核苷酸,并且其中所述第一和第二多核苷酸与靶基因组中靶序列侧翼的序列具有序列同一性,所述靶基因组中靶序列侧翼的序列对于所述两种或更多种SGIC中的每一种是相同的(参见图17I)。在该实施方式中,NHEJ修复的频率降低,因为如果通过NHEJ修复由第一SGIC和多核苷酸引导的编辑酶介导的断裂,则另一SGIC的靶位点将保持存在。在此类迭代中,NHEJ的机会将是用于单一SGIC介导的编辑事件的NHEJ机会的平方。
本发明包括一种前提,其中5'侧翼和/或3'侧翼以及靶基因组中靶序列侧翼的相应序列位于单独的单链或双链寡核苷酸上(也分别称为ssODN和dsODN;参见EP16181781.2,该专利以引用方式并入本文)(参见图17B、图17C、图17D、图17F、图17G、图17H和图17J)。在此类情况下,单链或双链寡核苷酸具有这样的部分(即多核苷酸序列的一部分),所述部分与包含引导RNA表达盒和任选另外的多核苷酸元件的自引导整合构建体的部分具有序列同一性,并且具有这样的部分,所述部分与靶基因组中靶序列侧翼的序列具有序列同一性。在一个典型示例(本发明不限于该示例)中,第一单链或双链寡核苷酸具有这样的部分,所述部分与包含引导RNA表达盒和任选另外的多核苷酸元件的自引导整合构建体的5'末端上的序列具有序列同一性,并且具有这样的部分,所述部分与基因组中位于靶序列5'端的序列具有序列同一性;并且第二单链或双链寡核苷酸具有这样的部分,所述部分与包含引导RNA表达盒和任选另外的多核苷酸元件的自引导整合构建体的3'末端上的序列具有序列同一性,并且具有这样的部分,所述部分与基因组中位于靶序列3'端的序列具有序列同一性(参见图17)。在应用于本发明的所有实施方式的该具体实施方式中,所述单链寡核苷酸和/或双链寡核苷酸介导自引导整合构建体到靶基因组中的体内(在细胞内)整合。在应用于本发明的所有实施方式的该具体实施方式中,可以方便地使用WO2017037304关于多核苷酸构建体的体外装配的教导。
细胞中靶基因组中的靶序列是功能性多核苷酸引导的基因组编辑酶和引导RNA的复合物结合并且(如果适用的话)创建(诱导)双链断裂或单链断裂(切口)的位置。
与SGIC的5'侧翼和3'侧翼具有序列同一性的靶基因组中靶序列侧翼的序列可以定位为紧邻诱导双链断裂或单链断裂的位置。在这种情况下,靶序列的序列与靶基因组中靶序列侧翼序列的序列之间存在重叠。由于靶基因组中靶序列侧翼的序列的位置紧邻所诱导的双链断裂或单链断裂,所以所述自引导整合构建体将整合在所述双链或单链断裂的位点处。与5'侧翼和3'侧翼具有序列同一性的靶基因组中靶序列侧翼的序列也可以定位为离开要诱导双链或单链断裂的位置。与根据本发明的自引导整合构建体的5'侧翼具有序列同一性的基因组中靶序列侧翼的序列可以离要诱导双链断裂或单链断裂的位置约1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、15个、20个、30个、40个、50个、100个、200个、300个、400个、500个、1000个、5000个、10000个、50000个、100000个或200000个核苷酸。与根据本发明的自引导整合构建体的3'侧翼具有序列同一性的基因组中靶序列侧翼的序列可以离要诱导双链断裂或单链断裂的位置约1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、15个、20个、30个、40个、50个、100个、200个、300个、400个、500个、1000个、5000个、10000个、50000个、100000个或200000个核苷酸。
如上所述,如本文所公开的引导RNA表达盒是多核苷酸表达构建体,所述多核苷酸表达构建体包含在体内(诸如细胞内)表达功能性引导RNA或其部分所需的除RNA聚合酶之外的所有部件。所述部件包括但不限于启动子、编码引导RNA或其部分的编码序列,以及终止子。存在用于在体内(诸如在细胞内)表达引导RNA的几种方式。引导RNA可以从RNA聚合酶II启动子表达。此类启动子是本领域技术人员已知的。优选的RNA聚合酶II启动子列出于WO2016/50136、WO2016/50135和WO2016/110453中。引导RNA可以从RNA聚合酶III启动子表达。此类启动子是本领域技术人员已知的。优选的RNA聚合酶III启动子列出于WO2016/50136、WO2016/50135和WO2016/110453中。当使用RNA聚合酶III启动子时,优选使用自加工核酶将原始转录产物转化为成熟的引导RNA。引导RNA可以从单亚基DNA依赖性RNA聚合酶启动子表达。此类启动子是本领域技术人员已知的。优选的单亚基DNA依赖性RNA聚合酶启动子是病毒单亚基DNA依赖性RNA聚合酶启动子,诸如T3、SP6、K11或T7RNA聚合酶启动子。此类优选的单亚基DNA依赖性RNA聚合酶启动子列出于US62/399127中。
另外的多核苷酸元件可以是任何合适的另外的功能性或非功能性多核苷酸元件。优选地,在根据本发明的自引导整合构建体或根据本发明的组合物中,所述另外的多核苷酸元件是供体多核苷酸,优选控制序列、标记、编码如本文其他地方所定义的目的化合物的目的基因,或破坏构建体。控制序列可以是任何控制序列或控制序列的组合,诸如启动子、KOZAK序列、信号序列、终止子、前序列、前原序列、前导序列、激活物序列、阻遏物序列、HIS标签、分裂GFP标签,或任何其他N端标签。一种优选的控制序列是启动子序列。这例如使得能够插入启动子或用另一种启动子替换内源启动子或其部分。引入的启动子可以比内源启动子更强或更弱和/或可以是诱导型启动子。此类启动子是本领域技术人员已知的。标记可以是任何类型的标记,只要其可以被鉴定并因此用作标记即可。标记可以是例如选择性标记,或可以是例如具有要用作条形码的已知序列的可鉴定多核苷酸,或可以是标签,诸如HIS标签、GFP标签、分裂GFP标签、溶解度标签。应当注意的是,自引导整合构建体由于其独特的引导序列而已经本身提供条形码标记,其表示自引导整合构建体的整合位点处的条形码。目的基因可以是任何目的基因,并且优选是如小节“一般定义”中所定义的目的基因。目的基因可以是包含启动子、编码序列和终止子的完整表达构建体,或者可以至少包含编码序列。自引导整合构建本身是在整合位点处破坏基因组的构建体;此类破坏可对宿主没有影响或可对宿主具有巨大影响。在一些情况下,可期望引入本身将具有破坏效应的序列,诸如强或弱启动子序列、强或弱终止子序列、剪接供体或剪接受体序列;此类构建体可以作为另外的多核苷酸元件整合入自引导整合构建体中。
由于并非旨在创建基因驱动或类似的自主基因编辑工具,因此根据本发明的自引导整合构建体不包含编码多核苷酸引导的基因组编辑酶的表达构建体。此类酶是从单独的表达构建体表达,或者以其本身加入的。
在本发明一些实施方式的范围内,可期望在某个时间点从宿主细胞中再去除根据本发明的自引导整合构建体。有几种工具可用并且它们是本领域技术人员已知的;这些都在本发明的范围内。为此目的,根据本发明的自引导整合构建体可以例如包含允许逆选择的标记或可以包含cre-lox位点或引导重复序列以促进构建体的缺失。
本发明还提供了包含根据本发明的自引导整合构建体的组合物;包含根据本发明的自引导整合构建体的文库的组合物;产生根据本发明的自引导整合构建体的根据本发明的组合物或产生根据本发明的自引导整合构建体的文库的根据本发明的组合物,所述组合物还包含功能性多核苷酸引导的基因组编辑酶或能够表达功能性多核苷酸引导的基因组编辑酶的表达构建体。根据本发明的此类组合物可以例如用作部件的储备溶液,或者可以例如用于将部件引入宿主细胞中。
本发明还提供了宿主细胞,所述宿主细胞包含根据本发明的自引导整合构建体或包含产生根据本发明的自引导整合构建体的根据本发明的组合物。宿主细胞可以是任何宿主细胞。优选的宿主细胞是真菌、藻类、微藻或海洋真核生物,更优选是酵母细胞、丝状真菌细胞和Labyrinthulomycetes细胞;所有这些都如在小节“一般定义”中所定义。优选地,宿主细胞缺乏非同源末端连接(NHEJ)部件。宿主细胞应被解释为至少一种宿主细胞,并且根据本发明的自引导整合构建体应被解释为至少一种根据本发明的自引导整合构建体。因此,这样的宿主细胞群在本发明的范围内,所述宿主细胞群包含根据本发明的自引导整合构建体的文库,并且优选包含2、3、4、5、6、7、8、9、10种或更多种SGIC。宿主细胞和宿主细胞群在本文中称为根据本发明的宿主细胞。优选地,根据本发明的宿主细胞另外包含功能性多核苷酸引导的基因组编辑酶或能够表达功能性多核苷酸引导的基因组编辑酶的表达构建体。所述功能性多核苷酸引导的基因组编辑酶优选是功能性多核苷酸引导的异源基因组编辑酶。
优选地,在根据本发明的宿主细胞中,将自引导整合构建体整合到基因组中所述第一和第二多核苷酸与靶基因组中靶序列侧翼的序列具有序列同一性的位点处。如上所述,与5'侧翼和3'侧翼具有序列同一性的靶基因组中靶序列侧翼的序列可以定位为紧邻诱导双链断裂或单链断裂的位置。在这种情况下,靶序列与靶基因组中靶序列侧翼的序列之间存在重叠。由于所述位置紧邻诱导的双链断裂或单链断裂,根据本发明的自引导整合构建体将整合在双链或单链断裂的位点处。与5'侧翼和3'侧翼具有序列同一性的靶基因组中靶序列侧翼的序列也可以定位为离开要诱导双链或单链断裂的位置。与根据本发明的自引导整合构建体的5'侧翼具有序列同一性的基因组中靶序列侧翼的序列可以离要诱导双链断裂或单链断裂的位置约1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、15个、20个、30个、40个、50个、100个、200个、300个、400个、500个、1000个、5000个、10000个、50000个、100000个或200000个核苷酸。与根据本发明的自引导整合构建体的3'侧翼具有序列同一性的基因组中靶序列侧翼的序列可以离要诱导双链断裂或单链断裂的位置约1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、15个、20个、30个、40个、50个、100个、200个、300个、400个、500个、1000个、5000个、10000个、50000个、100000个或200000个核苷酸。
在第二方面,本发明提供了包含引导RNA表达盒的自引导整合构建体的用途,其中所述引导RNA表达盒能够表达功能性引导RNA或其部分,所述功能性引导RNA或其部分是对靶基因组中的靶序列特异的,其中包含所述引导RNA表达盒的所述自引导整合构建体的部分在其5'末端侧接第一多核苷酸(5'侧翼)并在其3'末端侧接第二多核苷酸(3'侧翼),其中所述第一和第二多核苷酸与所述靶基因组中所述靶序列侧翼的序列具有序列同一性,以便在宿主细胞中表达对靶基因组中的靶序列特异的功能性引导RNA或其部分,其中对靶基因组中的靶序列特异的所述功能性引导RNA或其部分仅从所述自引导整合构建体表达。
此外,在该方面,本发明提供了包含两种或更多种多核苷酸构件的组合物的用途,其中这些构件彼此具有序列同一性以允许它们在体内重组,诸如在宿主细胞中重组,以产生包含引导RNA表达盒的自引导整合构建体,其中所述引导RNA表达盒能够表达功能性引导RNA或其部分,所述功能性引导RNA或其部分是对靶基因组中的靶序列特异的,其中包含所述引导RNA表达盒的所述自引导整合构建体的部分在其5'末端侧接第一多核苷酸(5'侧翼)并在其3'末端侧接第二多核苷酸(3'侧翼),其中所述第一和第二多核苷酸与所述靶基因组中所述靶序列侧翼的序列具有序列同一性,以便在宿主细胞中表达对靶基因组中的靶序列特异的功能性引导RNA或其部分,其中对靶基因组中的靶序列特异的所述功能性引导RNA或其部分仅从所述自引导整合构建体表达。
在该方面中,所有特征优选是如在本发明的第一方面中所定义的那些特征。在根据本发明的用途中,根据本发明的功能性引导RNA或其部分仅从自引导整合构建体表达,这意味着宿主细胞中不存在其他引导RNA表达构建体(不在基因组中并且不在载体上)。最初从自引导整合构建体表达对靶基因组中的靶序列特异的引导RNA或其部分。所表达的引导RNA促进将断裂诱导到靶基因组中的靶序列处,随后自引导整合构建体整合到靶基因组中。
优选地,在根据本发明的用途中,自引导整合构建体还包含如本文第一方面中所定义的另外的多核苷酸元件,其中所述另外的多核苷酸元件优选是控制序列、标记、目的基因,或破坏构建体,如本文第一方面中所定义的。当存在时,所述另外的多核苷酸元件位于引导RNA表达盒与5'侧翼之间和/或引导RNA表达盒与3'侧翼之间。
优选地,在根据本发明的用途中,所述功能性引导RNA或其部分由所述引导RNA表达盒上的多核苷酸编码,并且所述多核苷酸可操作地连接至RNA聚合酶II启动子、至RNA聚合酶III启动子或至单亚基DNA依赖性RNA聚合酶启动子以及任选地至自加工核酶,所述单亚基DNA依赖性RNA聚合酶启动子优选为病毒单亚基DNA依赖性RNA聚合酶启动子,更优选T3、SP6、K11或T7RNA聚合酶启动子;所有这些都如在本发明的第一方面中所定义的。
在第三方面中,本发明提供了一种用于生产根据本发明的宿主细胞的方法,其包括将自引导整合构建体引入所述宿主细胞中,所述自引导整合构建体包含引导RNA表达盒,所述引导RNA表达盒能够表达功能性引导RNA或其部分,所述功能性引导RNA或其部分是对靶基因组中的靶序列特异的,其中包含所述引导RNA表达盒的所述自引导整合构建体的部分在其5'末端侧接第一多核苷酸(5'侧翼)并在其3'末端侧接第二多核苷酸(3'侧翼),其中所述第一和第二多核苷酸与所述靶基因组中所述靶序列侧翼的序列具有序列同一性,其中在所述宿主中优选地存在或引入功能性多核苷酸引导的基因组编辑酶,其中所述自引导整合构建体整合到所述基因组中的所述靶位点处,并且其中对靶基因组中的靶序列特异的所述功能性引导RNA或其部分仅从所述引入的自引导整合构建体表达。
此外,在该方面中,本发明提供了一种用于生产根据本发明的宿主细胞的方法,其包括将两种或更多种多核苷酸构件引入所述宿主细胞中,其中这些构件彼此具有序列同一性以允许它们在所述宿主细胞中重组以产生包含引导RNA表达盒的自引导整合构建体,所述引导RNA表达盒能够表达功能性引导RNA或其部分,所述功能性引导RNA或其部分是对靶基因组中的靶序列特异的,其中包含所述引导RNA表达盒的所述自引导整合构建体的部分在其5'末端侧接第一多核苷酸并在其3'末端侧接第二多核苷酸,其中所述第一和第二多核苷酸与所述靶基因组中所述靶序列侧翼的序列具有序列同一性,其中在所述宿主中优选地存在或引入功能性多核苷酸引导的基因组编辑酶,其中所述自引导整合构建体整合到所述基因组中的所述靶位点处,并且其中对靶基因组中的靶序列特异的所述功能性引导RNA或其部分仅从所述引入的自引导整合构建体表达。
在该方面中,所有特征优选是如在本文第一方面中所定义的那些特征。在根据本发明的方法中,根据本发明的功能性引导RNA或其部分仅从自自引导整合构建体表达,这意味着宿主细胞中不存在其他引导RNA表达构建体(不在基因组中并且不在载体上)。最初从自引导整合构建体表达对靶基因组中的靶序列特异的引导RNA或其部分。所表达的引导RNA促进将断裂诱导到靶基因组中的靶序列处,随后自引导整合构建体整合到靶基因组中。
优选地,在根据本发明的方法中,自引导整合构建体还包含如本文第一方面中所定义的另外的多核苷酸元件,其中所述另外的多核苷酸元件优选是控制序列、标记、目的基因,或破坏构建体,如本文第一方面中所定义的。当存在时,所述另外的多核苷酸元件位于引导RNA表达盒与5'侧翼之间和/或引导RNA表达盒与3'侧翼之间。
优选地,在根据本发明的方法中,所述功能性引导RNA或其部分由所述引导RNA表达盒上的多核苷酸编码,并且所述多核苷酸可操作地连接至RNA聚合酶II启动子、至RNA聚合酶III启动子或至单亚基DNA依赖性RNA聚合酶启动子以及任选地至自加工核酶,所述单亚基DNA依赖性RNA聚合酶启动子优选为病毒单亚基DNA依赖性RNA聚合酶启动子,更优选T3、SP6、K11或T7RNA聚合酶启动子;所有这些都如在本发明的第一方面中所定义的。
宿主细胞应被解释为至少一种宿主细胞,并且根据本发明的自引导整合构建体应被解释为至少一种根据本发明的自引导整合构建体。因此,在根据本发明的方法的一个实施方式中,将自引导整合构建体的文库引入宿主细胞群中。此类方法可以方便地用于筛选目的。
在一个实施方式中,根据本发明的方法还包括确定自引导整合构建体是否已经整合和/或整合在何处的步骤。可以使用本领域技术人员已知的任何技术来执行此类步骤,所述技术为诸如但不限于PCR分析和测序,诸如允许在使用自引导整合构建体的文库时进行容易筛选的下一代测序。优选地,所述确定是通过分析由所产生的宿主细胞生产的基因产物而进行的,优选通过使用选择性生长条件。此类选择性生长条件可以例如允许对具有目的性质的宿主进行阳性选择、允许筛选其中已引入自引导整合构建体的文库的宿主细胞群。基因产物可以是例如代谢物、酶(诸如葡糖淀粉酶或解决营养缺陷型的酶)或标记)。优选地,在本发明的该方面中,分离所产生的具有目的性质的宿主细胞。
此外,在该方面中,本发明提供了通过根据本发明的方法能够获得或通过根据本发明的方法获得的宿主细胞。优选地,根据本发明的此类宿主细胞包含编码目的化合物的多核苷酸。所述目的化合物优选为如在小节“一般定义”中所定义的目的化合物。优选地,根据本发明的所述宿主细胞表达目的化合物。还提供了通过根据本发明的方法能够获得或通过根据本发明的方法获得的宿主细胞的后代。可以通过培养和/或通过进一步操纵根据本发明的宿主细胞来产生此类后代。
还提供了一种生产目的化合物的方法,所述方法包括在有助于所述目的化合物的生产的条件下培养根据本发明该方面的宿主细胞,以及任选地纯化或分离所述目的化合物。目的化合物可以是任何目的化合物,优选是如小节“一般定义”中所定义的目的化合物。可以使用本领域技术人员已知的任何技术来执行对目的化合物的纯化和分离。
一些实施方式
提供一些以下本发明的实施方式;这些实施方式中的特征优选为本文前面定义的那些。
1.一种自引导整合构建体,其包含:
-引导RNA表达盒,和
-另外的多核苷酸元件,
其中所述引导RNA表达盒能够表达功能性引导RNA或其部分,所述功能性引导RNA或其部分是对靶基因组中的靶序列特异的,其中包含所述引导RNA表达盒和所述另外的多核苷酸元件的所述自引导整合构建体的部分在其5'末端侧接第一多核苷酸并在其3'末端侧接第二多核苷酸,并且其中所述第一和第二多核苷酸与所述靶基因组中所述靶序列侧翼的序列具有序列同一性。
2.一种自引导整合构建体,其包含:
-引导RNA表达盒,和任选地,
-另外的多核苷酸元件,其中所述引导RNA表达盒能够表达功能性引导RNA或其部分,所述功能性引导RNA或其部分是对靶基因组中的靶序列特异的,其中包含所述引导RNA表达盒和任选地所述另外的多核苷酸元件的所述自引导整合构建体的部分在其5'末端侧接第一多核苷酸并在其3'末端侧接第二多核苷酸,其中所述第一和第二多核苷酸与所述靶基因组中所述靶序列侧翼的序列具有序列同一性,以及其中所述功能性引导RNA或其部分由所述引导RNA表达盒上的多核苷酸编码,并且所述多核苷酸可操作地连接至RNA聚合酶II启动子、至RNA聚合酶III启动子以及自加工核酶或至单亚基DNA依赖性RNA聚合酶启动子,优选病毒单亚基DNA依赖性RNA聚合酶启动子,更优选T3、SP6、K11或T7RNA聚合酶启动子。
3.一种自引导整合构建体,其包含:
两种或更多种多核苷酸,所述两种或更多种多核苷酸能够彼此重组以产生引导RNA表达盒,以及任选地另外的多核苷酸元件,
其中所述引导RNA表达盒能够表达功能性引导RNA或其部分,其中所述功能性引导RNA或其部分是对靶基因组中的靶序列特异的,其中包含所述引导RNA表达盒和任选地所述另外的多核苷酸元件的所述自引导整合构建体的部分在其5'末端侧接第一多核苷酸并在其3'末端侧接第二多核苷酸,并且其中所述第一和第二多核苷酸与所述靶基因组中所述靶序列侧翼的序列具有序列同一性。
4.根据实施方式1-3中任一项所述的自引导整合构建体,其中所述自引导整合构建体是线性的自引导整合构建体。
5.一种组合物,所述组合物包含两种或更多种多核苷酸构件,其中这些构件彼此具有序列同一性以允许它们在体内重组,诸如在宿主细胞中重组,以产生根据实施方式1或2所述的单个自引导整合构建体或以产生根据实施方式4所述的线性自引导整合构建体。
6.根据实施方式1-4所述的自引导整合构建体或根据实施方式5所述的组合物,其中所述另外的多核苷酸元件是控制序列、标记、目的基因、或破坏构建体。
7.一种包含实施方式1-4中任一项所定义的自引导整合构建体的组合物,或根据实施方式5所述的组合物,其优选包含自引导整合构建体文库,所述组合物优选地还包含功能性多核苷酸引导的基因组编辑酶或能够表达功能性多核苷酸引导的基因组编辑酶的表达构建体。
8.一种宿主细胞,其包含实施方式1-4或6中任一项所定义的自引导整合构建体或根据实施方式5所述的组合物。
9.根据实施方式8所述的宿主细胞,其还包含功能性多核苷酸引导的基因组编辑酶,优选地功能性多核苷酸引导的异源基因组编辑酶,或者还包含表达构建体,所述表达构建体能够表达功能性多核苷酸引导的基因组编辑酶,优选功能性多核苷酸引导的异源基因组编辑酶。
10.根据实施方式8或9所述的宿主细胞,其中所述自引导整合构建体整合到所述基因组中所述第一和第二多核苷酸与所述靶基因组中所述靶序列侧翼的序列具有序列同一性的位点处。
11.包含引导RNA表达盒的自引导整合构建体的用途,其中所述引导RNA表达盒能够表达功能性引导RNA或其部分,所述功能性引导RNA或其部分是对靶基因组中的靶序列特异的,其中包含所述引导RNA表达盒的所述自引导整合构建体的部分在其5'末端侧接第一多核苷酸并在其3'末端侧接第二多核苷酸,其中所述第一和第二多核苷酸与所述靶基因组中所述靶序列侧翼的序列具有序列同一性,以在宿主细胞中表达对靶基因组中的靶序列特异的功能性引导RNA或其部分,其中对靶基因组中的靶序列特异的所述功能性引导RNA或其部分仅从所述自引导整合构建体表达。
12.包含两种或更多种多核苷酸构件的组合物的用途,其中这些构件彼此具有序列同一性以允许它们在体内重组,诸如在宿主细胞中重组,以产生包含引导RNA表达盒的自引导整合构建体,其中所述引导RNA表达盒能够表达功能性引导RNA或其部分,所述功能性引导RNA或其部分是对靶基因组中的靶序列特异的,其中包含所述引导RNA表达盒的所述自引导整合构建体的部分在其5'末端侧接第一多核苷酸并在其3'末端侧接第二多核苷酸,其中所述第一和第二多核苷酸与所述靶基因组中所述靶序列侧翼的序列具有序列同一性,以在宿主细胞中表达对靶基因组中的靶序列特异的功能性引导RNA或其部分,其中对靶基因组中的靶序列特异的所述功能性引导RNA或其部分仅从所述自引导整合构建体表达。
13.根据实施方式11或12所述的用途,其中所述自引导整合构建体是线性自引导整合构建体。
14.根据实施方式11-13中任一项所述的用途,其中所述自引导整合构建体还包含另外的多核苷酸元件,其中所述供体多核苷酸优选是控制序列、标记、目的基因,或破坏构建体。
15.根据实施方式11-14中任一项所述的用途,其中所述功能性引导RNA或其部分由所述引导RNA表达盒上的多核苷酸编码,并且所述多核苷酸可操作地连接至RNA聚合酶II启动子、至RNA聚合酶III启动子或至单亚基DNA依赖性RNA聚合酶启动子以及任选地至自加工核酶,所述单亚基DNA依赖性RNA聚合酶启动子优选为病毒单亚基DNA依赖性RNA聚合酶启动子,更优选T3、SP6、K11或T7RNA聚合酶启动子。
16.一种用于生产宿主细胞的方法,其包括将自引导整合构建体引入所述宿主细胞中,所述自引导整合构建体包含引导RNA表达盒,所述引导RNA表达盒能够表达功能性引导RNA或其部分,所述功能性引导RNA或其部分是对靶基因组中的靶序列特异的,其中包含所述引导RNA表达盒的所述自引导整合构建体的部分在其5'末端侧接第一多核苷酸并在其3'末端侧接第二多核苷酸,其中所述第一和第二多核苷酸与所述靶基因组中所述靶序列侧翼的序列具有序列同一性,其中在所述宿主中优选地存在或引入功能性多核苷酸引导的基因组编辑酶,其中所述自引导整合构建体整合到所述基因组中的靶位点处,并且其中对靶基因组中的靶序列特异的所述功能性引导RNA或其部分仅从所述引入的自引导整合构建体表达。
17.一种用于生产宿主细胞的方法,其包括将两种或更多种多核苷酸构件引入所述宿主细胞中,其中这些构件彼此具有序列同一性以允许它们在所述宿主细胞中重组以产生包含引导RNA表达盒的自引导整合构建体,所述引导RNA表达盒能够表达功能性引导RNA或其部分,所述功能性引导RNA或其部分是对靶基因组中的靶序列特异的,其中包含所述引导RNA表达盒的所述自引导整合构建体的部分在其5'末端侧接第一多核苷酸并在其3'末端侧接第二多核苷酸,其中所述第一和第二多核苷酸与所述靶基因组中所述靶序列侧翼的序列具有序列同一性,其中在所述宿主中优选地存在或引入功能性多核苷酸引导的基因组编辑酶,其中所述自引导整合构建体整合到所述基因组中的靶位点处,并且其中对靶基因组中的靶序列特异的所述功能性引导RNA或其部分仅从所述引入的自引导整合构建体表达。
18.根据实施方式16或17所述的方法,其中所述自引导整合构建体是线性自引导整合构建体。
19.根据实施方式16-18中任一项所述的方法,其中所述自引导整合构建还包含另外的多核苷酸元件,其中所述另外的多核苷酸元件优选是控制序列、标记、目的基因,或破坏构建体。
20.根据实施方式16-19中任一项所述的方法,其中所述功能性引导RNA或其部分由所述引导RNA表达盒上的多核苷酸编码,并且所述多核苷酸可操作地连接至RNA聚合酶II启动子、至RNA聚合酶III启动子或至单亚基DNA依赖性RNA聚合酶启动子以及任选地至自加工核酶,所述单亚基DNA依赖性RNA聚合酶启动子优选为病毒单亚基DNA依赖性RNA聚合酶启动子,更优选T3、SP6、K11或T7RNA聚合酶启动子。
21.根据实施方式16-20中任一项所述的方法,其中将自引导整合构建体的文库引入宿主细胞群中。
22.根据实施方式16-21中任一项所述的方法,其还包括确定所述自引导整合构建体是否整合和/或整合在何处。
23.根据实施方式22所述的方法,其中所述确定是通过分析由所产生的宿主细胞生产的基因产物而进行的,优选通过使用选择性生长条件。
24.根据实施方式8-10中任一项所述的宿主细胞,或通过根据实施方式16-23中任一项所述的方法能够获得或通过根据实施方式16-23中任一项所述的方法获得的细胞,所述细胞包含编码目的化合物的多核苷酸。
25.根据实施方式24所述的宿主细胞,其表达目的化合物。
26.一种生产目的化合物的方法,其包括在有助于所述目的化合物的生产的条件下培养根据实施方式24或25所述的细胞,以及任选地纯化或分离所述目的化合物。
一般定义
在整个说明书和所附权利要求书中,词语“包括”、“包含”和“具有”以及变型将被包含性地解释。也就是说,在上下文允许的情况下,这些词语旨在传达可包括未具体叙述的其他要素或整体。
不使用数量词修饰时在本文中用于指代一个或多于一个(即,一个或至少一个)的语法对象。举例来说,“要素”可以表示一个要素或多于一个要素。
当与数值(例如,约10)结合使用时,词语“约”或“近似”优选地意为值可以是给定值(10)加或减该值的1%。
CRISPR干扰(CRISPRi)是一种遗传扰动技术,其允许对原核和真核细胞中的基因表达进行序列特异性抑制或激活。
在本文中,术语“体内”用于意谓在个体细胞内,所述个体细胞不是多细胞高等真核生物(诸如动物,包括人)的一部分。在本文中,术语“离体”用于意谓在人体或动物体外。
当本文中提及术语“0kbp”缺失时,这不一定是精确的0kbp缺失;取决于SGIC的具体情况,将在整合SGIC后从基因组中缺失若干个碱基对,诸如约0个、10个、20个、30个、40个、50个、60个、70个、80个、90个、100个、110个、120个、130个、140个、150个或200个碱基对。
多核苷酸在本文中是指任何长度或确定的特定长度范围或长度的脱氧核糖核苷酸或核糖核苷酸或它们的混合物或类似物的核苷酸聚合形式。多核苷酸可以具有任何三维结构,并且可以执行任何已知或未知的功能。以下是多核苷酸的非限制性示例:基因或基因片段的编码或非编码区、根据连锁分析定义的基因座、外显子、内含子、信使RNA(mRNA)、转移RNA(tRNA)、核糖体RNA(rRNA)、短干扰RNA(siRNA)、短发夹RNA(shRNA)、微RNA(miRNA)、核酶、cDNA、重组多核苷酸、支链多核苷酸、质粒、载体、具有任何序列的分离DNA、具有任何序列的分离RNA、核酸探针、寡核苷酸和引物。多核苷酸可包含天然和非天然核苷酸,并且可包含一个或多个修饰的核苷酸,诸如甲基化核苷酸和核苷酸类似物或核苷酸等同物,其中核苷酸类似物或等同物被定义为具有经修饰的碱基、和/或经修饰的骨架、和/或非天然的核苷间键、或这些修饰的组合的残基。根据期望,可以在装配多核苷酸之前或之后引入对核苷酸结构的修饰。多核苷酸可以在聚合后进一步修饰,诸如通过与标记化合物缀合。
通常,密码子优化是指通过以下方式来修饰核酸序列以增强在目的宿主细胞中的表达的过程:用在所述宿主细胞的基因中更频繁或最频繁使用的密码子替换天然序列的至少一个密码子(例如,多于1个、2个、3个、4个、5个、10个、15个、20个、25个、50个或更多个密码子),同时保持天然氨基酸序列。多种物种对特定氨基酸的某些密码子表现出特定偏好。密码子偏好(生物体之间密码子使用的差异)通常与信使RNA(mRNA)的翻译效率相关,而信使RNA(mRNA)的翻译效率据信又尤其取决于被翻译的密码子的性质和特定转移RNA(tRNA)分子的可用性。所选择的tRNA在细胞中的主导性通常反映了肽合成中最常使用的密码子。因此,可以基于密码子优化来定制基因以实现给定生物中的最佳基因表达。密码子使用表是容易例如在“密码子使用数据库(Codon Usage Database)”中获得的,并且这些表可以以多种方式进行调整。参见例如Nakamura,Y.等人,2000。用于对特定序列进行密码子优化以在特定宿主细胞中表达的计算机算法,诸如Gene Forge(Aptagen;Jacobus,PA),也是可得的。优选地,编码Cas蛋白的序列中的一个或多个密码子(例如,1个、2个、3个、4个、5个、10个、15个、20个、25个、50个或更多个,或所有密码子)对应于特定氨基酸的最频繁使用的密码子。用于密码子优化的优选方法描述于WO2006/077258和WO2008/000632中)。WO2008/000632涉及密码子对优化。密码子对优化是这样的一种方法,在所述方法中,编码多肽的核苷酸序列已经关于其密码子使用(特别是所使用的密码子对)进行修饰,以获得编码所述多肽的核苷酸序列的改善表达和/或所编码多肽的改进产生。密码子对被定义为编码序列中的一组两个紧接三联体(密码子)。根据本发明的组合物中的来源中Cas蛋白的量可以变化,并且可以进行优化以实现最佳性能。
在具有5'-帽的RNA分子中,7-甲基鸟苷酸残基位于RNA的5'末端上(诸如通常在真核细胞中的mRNA中)。RNA聚合酶II(Pol II)在真核细胞中转录mRNA。信使RNA加帽通常发生如下:由RNA末端磷酸酶去除mRNA转录物的最末端5'磷酸基团,留下两个末端磷酸酯。由鸟苷酰转移酶将单磷酸鸟苷(GMP)加入到转录物的末端磷酸酯中,从而在转录物末端处留下5'-5'三磷酸酯连接的鸟嘌呤。最后,用甲基转移酶甲基化该末端鸟嘌呤的7-氮。本文中术语“不具有5'-帽”用于指具有例如5'-羟基而不是5'-帽的RNA。例如,此类RNA可称为“未加帽的RNA”。未加帽的RNA可以在转录后在细胞核中更好地积累,因为5'-加帽的RNA经受核输出。
核酶是指这样的一种或多种RNA序列,所述一种或多种RNA序列形成能够在特定位点处切割RNA的二级、三级和/或四级结构。核酶包括“自切割核酶或自加工核酶”,其能够在相对于核酶序列的c/s位点处切割RNA(即,自动催化或自切割的)。核酶溶核活性的一般性质是本领域的技术人员已知的。用于RNA引导的核酸酶系统(诸如CRISPR/Cas)的引导RNA的生产中的自加工核酶的使用尤其由Gao等人,2014描述。
核苷酸类似物或等同物通常包含经修饰的骨架。此类骨架的示例由吗啉代骨架、氨基甲酸酯骨架、硅氧烷骨架、硫化物骨架、亚砜骨架和砜骨架、甲酰乙酰基(formacetyl)和硫代甲酰乙酰基骨架、亚甲基甲酰乙酰基骨架、核乙酰基(riboacetyl)骨架、含烯烃的骨架、氨基磺酸酯骨架、磺酸酯骨架和磺酰胺骨架、亚甲基亚氨基骨架和亚甲基肼基骨架,以及酰胺骨架提供。进一步优选的是,骨架中残基之间的键不包含磷原子,诸如由短链烷基或环烷基核苷间键、混合的杂原子和烷基或环烷基核苷间键、或一个或多个短链杂原子或杂环核苷间键形成的键。
优选的核苷酸类似物或等同物包含具有经修饰的聚酰胺骨架的肽核酸(PNA)(Nielsen等人,1991.Science 254,1497-1500)。基于PNA的分子是DNA分子在碱基对识别方面的真实模拟物。PNA的骨架由通过肽键连接的N-(2-氨基乙基)-甘氨酸单元组成,其中核碱基通过亚甲基羰基键与骨架连接。替代的骨架包括一个碳延伸的吡咯烷PNA单体(Govindaraju和Kumar,2005.Chem.Commun,495-497)。因为PNA分子的骨架不含带电荷的磷酸基团,所以PNA-RNA杂合体通常分别比RNA-RNA或RNA-DNA杂合体更稳定(Egholm等人,1993.Nature 365,566-568)。
进一步优选的骨架包含吗啉代核苷酸类似物或等同物,其中核糖或脱氧核糖被6元吗啉代环替换。最优选的核苷酸类似物或等同物包括磷酰二胺吗啉代寡聚物(PMO),其中核糖或脱氧核糖被6元吗啉代环替换,并且相邻吗啉代环之间的阴离子磷酸二酯键被非离子磷酰二胺键替换。
进一步优选的核苷酸类似物或等同物包括对磷酸二酯键中的至少一个非桥连氧的取代。这种修饰稍微破坏了碱基配对稳定性,但增加了对核酸酶降解的显著抗性。优选的核苷酸类似物或等同物包括硫代磷酸酯、手性硫代磷酸酯、二硫代磷酸酯、磷酸三酯、氨基烷基磷酸三酯、H-膦酸酯、甲基膦酸酯和其他烷基膦酸酯(包括3'-亚烷基膦酸酯、5'-亚烷基膦酸酯和手性膦酸酯)、次膦酸酯、氨基磷酸酯(包括3'-氨基氨基磷酸酯和氨基烷基氨基磷酸酯)、硫代氨基磷酸酯、硫代烷基膦酸酯、硫代烷基磷酸三酯、硒代磷酸酯或硼代磷酸酯。
进一步优选的核苷酸类似物或等同物包含一个或多个在2'、3'和/或5'位置处被单取代或二取代的糖部分,诸如-OH;-F;取代或未取代的、直链或支链的低级(C1-C10)烷基、烯基、炔基、烷芳基、烯丙基、芳基或芳烷基,所述基团可被一个或多个杂原子中断;O-烷基、S-烷基或N-烷基;O-烯基、S-烯基或N-烯基;O-炔基、S-炔基或N-炔基;O-烯丙基、S-烯丙基或N-烯丙基;O-烷基-O-烷基,O-烷基-O-甲氧基,O-烷基-O-氨基丙氧基;氨氧基、甲氧基乙氧基;-二甲基氨基氧基乙氧基;以及-二甲氨基乙氧基乙氧基。糖部分可以是吡喃糖或其衍生物,或脱氧吡喃糖或其衍生物,优选核糖或其衍生物,或脱氧核糖或其衍生物。这种优选的衍生糖部分包括锁定核酸(Locked Nucleic Acid,LNA),其中2'-碳原子与糖环的3'或4'碳原子连接,从而形成双环糖部分。优选的LNA包含2'-O,4'-C-亚乙基桥连核酸(Morita等人,2001.Nucleic Acid Res增刊No.1:241-242)。这些取代使得核苷酸类似物或等同物具有对RNA酶H和核酸酶的抗性并增加了对靶标的亲和力。
本发明上下文中氨基酸序列或核酸序列的“序列同一性”或“同一性”在本文中被定义为两个或更多个氨基酸(肽、多肽或蛋白质)序列或两个或更多个核酸(核苷酸、寡核苷酸、多核苷酸)序列之间的关系,如通过比较所述序列确定的。在本领域中,“同一性”还意指氨基酸或核苷酸序列(视情况而定)之间的序列相关性程度,如通过具有此类序列的链之间的匹配所确定的。在本发明中,与特定序列的序列同一性优选是指在所述特定多肽或多核苷酸序列的整个长度上的序列同一性。
两个氨基酸序列之间的“相似性”是通过比较一种肽或多肽的氨基酸序列及其保守氨基酸取代物与第二种肽或多肽的序列来确定的。在一个优选的实施方式中,计算整个序列(SEQ ID NO:)的同一性或相似性,如在本文中所鉴定的。“同一性”和“相似性”可以通过已知方法容易地计算,所述已知方法包括但不限于在Computational MolecularBiology,Lesk,A.M.编辑,Oxford University Press,New York,1988;Biocomputing:Informatics and Genome Projects,Smith,D.W.编辑,Academic Press,New York,1993;Computer Analysis of Sequence Data,第I部分,Griffin,A.M.和Griffin,H.G.编辑,Humana Press,New Jersey,1994;Sequence Analysis in Molecular Biology,vonHeine,G.,Academic Press,1987;和Sequence Analysis Primer,Gribskov,M.和Devereux,J.编辑,M Stockton Press,New York,1991;以及Carillo,H.和Lipman,D.,SIAMJ.Applied Math.,48:1073(1988)中描述的那些方法。
用于确定同一性的优选方法被设计成给出所测试的序列之间的最大匹配。用于确定同一性和相似性的方法被编入了公开可用的计算机程序中。用于确定两个序列之间的同一性和相似性的优选计算机程序方法包括例如GCG程序包(Devereux,J.等人,NucleicAcids Research 12(1):387(1984)),BestFit,BLASTP,BLASTN和FASTA(Altschul,S.F.等人,J.Mol.Biol.215:403-410(1990))。BLAST X程序可从NCBI和其他来源(BLAST Manual,Altschul,S.等人,NCBI NLM NIH Bethesda,MD 20894;Altschul,S.等人,J.Mol.Biol.215:403-410(1990))公开获得。还可以使用众所周知的史密斯-沃特曼算法(Smith Waterman algorithm)来确定同一性。
多肽序列比较的优选参数包括以下:算法:Needleman和Wunsch,J.Mol.Biol.48:443-453(1970);比较矩阵:BLOSSUM62,来自Hentikoff和Hentikoff,Proc.Natl.Acad.Sci.USA.89:10915-10919(1992);空位罚分:12;以及空位长度罚分:4。使用这些参数的可用程序可作为来自位于Madison,WI的Genetics Computer Group的“Ogap”程序公开获得。上述参数是用于氨基酸比较的默认参数(并且没有针对末端空位的罚分)。
用于核酸比较的优选参数包括以下:算法:Needleman和Wunsch,J.Mol.Biol.48:443-453(1970);比较矩阵:匹配=+10,不匹配=0;空位罚分:50;空位长度罚分:3。可从位于Madison,Wis的Genetics Computer Group获得Gap程序。以上给出了用于核酸比较的默认参数。
任选地,在确定氨基酸相似性程度时,技术人员还可以考虑所谓的“保守性”氨基酸取代,如本领域技术人员所清楚的。保守氨基酸取代是指具有相似侧链的残基的可互换性。例如,一组具有脂肪族侧链的氨基酸是甘氨酸、丙氨酸、缬氨酸、亮氨酸和异亮氨酸;一组具有脂肪族-羟基侧链的氨基酸是丝氨酸和苏氨酸;一组具有含酰胺侧链的氨基酸是天冬酰胺和谷氨酰胺;一组具有芳族侧链的氨基酸是苯丙氨酸、酪氨酸和色氨酸;一组具有碱性侧链的氨基酸是赖氨酸、精氨酸和组氨酸;并且一组具有含硫侧链的氨基酸是半胱氨酸和甲硫氨酸。优选的保守氨基酸取代组是:缬氨酸-亮氨酸-异亮氨酸、苯丙氨酸-酪氨酸、赖氨酸-精氨酸、丙氨酸-缬氨酸,以及天冬酰胺-谷氨酰胺。本文公开的氨基酸序列的取代变体是这样的变体,在该等变体中已去除了所公开序列中的至少一个残基并在该至少一个残基的位置插入不同残基。优选地,氨基酸变化是保守性的。每种天然存在的氨基酸的优选保守取代如下:Ala至ser;Arg至lys;Asn至gln或his;Asp至glu;Cys至ser或ala;Gln至asn;Glu至asp;Gly至pro;His至asn或gln;Ile至leu或val;Leu至ile或val;Lys至arg;gln或glu;Met至leu或ile;Phe至met、leu或tyr;Ser至thr;Thr至ser;Trp至tyr;Tyr至trp或phe;以及Val至ile或leu。
根据本发明的多核苷酸由核苷酸序列表示。根据本发明的多肽由氨基酸序列表示。根据本发明的核酸构建体被定义为从天然存在的基因中分离的多核苷酸,或者经过修饰以含有多个多核苷酸区段(segment)的多核苷酸,所述多核苷酸区段以天然不存在的方式组合或并置。
本文提供的序列信息不应如此狭窄地解释为需要包含错误鉴定的碱基。技术人员能够辨别出此类错误鉴定的碱基并且知道如何校正此类错误。
在本发明所有实施方式的上下文中,目的化合物可以是任何生物化合物。生物化合物可以是生物质或生物聚合物或代谢物。生物化合物可以由构成生物合成或代谢途径的单个多核苷酸或一系列多核苷酸编码,或者可以是单个多核苷酸的产物或一系列多核苷酸的产物的直接结果,所述多核苷酸可以是基因,所述一系列多核苷酸可以是基因簇。在本发明的所有实施方式中,编码感兴趣的生物化合物或与所述感兴趣的生物化合物相关的生物合成或代谢途径的单个多核苷酸或一系列多核苷酸是根据本发明的组合物和方法的优选靶标。生物化合物可以是对于宿主细胞天然的或对于宿主细胞异源的。
术语“异源生物化合物”在本文中定义为对细胞不是天然的生物化合物;或这样的天然生物化合物,在所述天然生物化合物中已经进行结构修饰以改变所述天然生物化合物。
术语“生物聚合物”在本文中被定义为具有相同、相似或不相似的亚单元(单体)的链(或聚合物)。生物聚合物可以是任何生物聚合物。生物聚合物可以是例如但不限于核酸、多胺、多元醇、多肽(或聚酰胺),或多糖。
生物聚合物可以是多肽。多肽可以是具有感兴趣的生物活性的任何多肽。术语“多肽”在本文中并不是指特定长度的编码产物,因此涵盖肽、寡肽和蛋白质。术语多肽是指任何长度的氨基酸聚合物。聚合物可以是直链或支链的,其可以包含经修饰的氨基酸,并且其可以被非氨基酸中断。该术语还包括已经修饰的氨基酸聚合物;所述修饰为例如,二硫键形成、糖基化、脂化、乙酰化、磷酸化,或任何其他操纵,诸如与标记组分缀合。如本文所用,术语“氨基酸”包括天然和/或非天然或合成的氨基酸,包括甘氨酸和D或L旋光异构体,以及氨基酸类似物和肽模拟物。多肽还包括上述多肽和杂合多肽的天然存在的等位基因变体和工程化变体。多肽可以是对于宿主细胞天然的或可以是对于宿主细胞异源的。多肽可以是胶原蛋白或明胶,或它们的变体或杂合体。多肽可以是抗体或其部分、抗原、凝血因子、酶、激素或激素变体、受体或其部分、调节蛋白、结构蛋白、报道分子、或转运蛋白、参与分泌过程的蛋白质、参与折叠过程的蛋白质、分子伴侣、肽氨基酸转运蛋白、糖基化因子、转录因子、合成肽或寡肽、细胞内蛋白质。细胞内蛋白质可以是酶,诸如蛋白酶、神经酰胺酶、环氧化物水解酶、氨肽酶、酰基转移酶、醛缩酶、羟化酶、氨肽酶、脂肪酶。多肽也可以是细胞外分泌的酶。此类酶可以属于以下项的组:氧化还原酶、转移酶、水解酶、裂解酶、异构酶、连接酶、过氧化氢酶、纤维素酶、几丁质酶、角质酶、脱氧核糖核酸酶、葡聚糖酶、酯酶。所述酶可以是糖酶,例如纤维素酶(诸如内切葡聚糖酶、β-葡聚糖酶、纤维二糖水解酶或β-葡糖苷酶)、半纤维素酶或果胶酶(诸如木聚糖酶、木糖苷酶、甘露聚糖酶、半乳聚糖酶、半乳糖苷酶、果胶甲基酯酶、果胶裂解酶、果胶酸裂解酶、内多聚半乳糖醛酸酶、外多聚半乳糖醛酸酶、鼠李半乳糖醛酸酶、阿拉伯聚糖酶、阿拉伯糖呋喃糖苷酶、阿拉伯糖基木聚糖水解酶、半乳糖醛酸酶、裂解酶或淀粉分解酶);水解酶、异构酶或连接酶、磷酸酶(诸如植酸酶)、酯酶(诸如脂肪酶)、蛋白水解酶、氧化还原酶(诸如氧化酶)、转移酶,或异构酶。酶可以是植酸酶。所述酶可以是氨肽酶、天冬酰胺酶、淀粉酶、麦芽糖淀粉酶、糖酶、羧肽酶、内切蛋白酶、金属蛋白酶、丝氨酸蛋白酶过氧化氢酶、几丁质酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、卤过氧化物酶、蛋白质脱氨酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变构酶、氧化酶、果胶酶、过氧化物酶、磷脂酶、半乳糖脂酶、叶绿素酶、多酚氧化酶、核糖核酸酶、转谷氨酰胺酶、或葡糖氧化酶、己糖氧化酶、单加氧酶。
根据本发明,目的化合物可以是具有改进的分泌特征的多肽或酶,如WO2010/102982中所述。根据本发明,目的化合物可以是融合或杂合多肽,另一种多肽在所述多肽或其片段的N末端或C末端处融合。通过将编码一种多肽的核酸序列(或其部分)与编码另一种多肽的核酸序列(或其部分)融合来产生融合多肽。
用于产生融合多肽的技术是本领域已知的,并且包括连接编码多肽的编码序列,以使得它们符合读框并且融合多肽的表达在相同的启动子和终止子的控制下。杂合多肽可包含从至少两种不同多肽获得的部分或完整多肽序列的组合,其中一种或多种所述多肽可与宿主细胞异源的。融合多肽和信号序列融合体的示例例如如WO2010/121933中所述。
生物聚合物可以是多糖。多糖可以是任何多糖,包括但不限于粘多糖(例如,肝素和透明质酸)和含氮多糖(例如,几丁质)。在优选的选项中,多糖是透明质酸。根据本发明的编码目的化合物或编码参与目的化合物产生的化合物的多核苷酸可以编码参与初级或次级代谢产物(诸如有机酸、类胡萝卜素、(β-内酰胺)、抗生素和维生素)的合成的酶。此类代谢物可以被认为是根据本发明的生物化合物。
术语“代谢物”包括初级和次级代谢物两者;代谢物可以是任何代谢物。优选的代谢物是柠檬酸、葡糖酸、己二酸、富马酸、衣康酸和琥珀酸。
代谢物可以由一种或多种基因编码,诸如在生物合成或代谢途径中。初级代谢产物是细胞的初级代谢或全身代谢的产物,所述产物涉及能量代谢、生长和结构。次级代谢产物是次级代谢的产物(参见例如,R.B.Herbert,The Biosynthesis of SecondaryMetabolites,Chapman and Hall,New York,1981)。
初级代谢产物可以是但不限于氨基酸、脂肪酸、核苷、核苷酸、糖、甘油三酯,或维生素。
次级代谢产物可以是但不限于生物碱、香豆素、类黄酮、聚酮化合物、奎宁、类固醇、肽,或萜烯。次级代谢产物可以是抗生素、拒食素、引诱剂、杀细菌剂、杀真菌剂、激素、杀虫剂,或杀鼠剂。优选的抗生素是头孢菌素类和β-内酰胺。其他优选的代谢物是外代谢产物。外代谢产物的示例是Aurasperone B、Funalenone、Kotanin、Nigragillin、Orlandin、其他萘酚-γ-吡喃酮、吡喃黑杆菌素A(Pyranonigrin A)、Tensidol B、伏马菌素B2和赭曲霉素A。
生物化合物也可以是选择性标记的产物。选择性标记是感兴趣的多核苷酸的产物,该产物提供杀生物剂或病毒抗性、重金属抗性、营养缺陷体的原营养等。选择性标记包括但不限于amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰转移酶)、bar(草胺膦乙酰转移酶)、hygB(潮霉素磷酸转移酶)、niaD(硝酸盐还原酶)、pyrG(乳清酸核苷-5'-磷酸脱羧酶),sC(硫酸腺苷酰转移酶)、trpC(邻氨基苯甲酸合成酶)、ble(腐草霉素抗性蛋白)、hyg(潮霉素)、NAT或NTC(诺尔丝菌素),以及它们的等同物。
根据本发明,目的化合物优选是目的化合物列表中描述的多肽。
根据本发明的另一个实施方式,目的化合物优选是代谢物。
根据本发明的细胞可能已经能够产生目的化合物。根据本发明的细胞还可以具有编码多肽的同源或异源核酸构建体,其中所述多肽可以是目的化合物或参与目的化合物生产的多肽。本领域技术人员知道如何修饰微生物宿主细胞,以使所述微生物宿主细胞能够产生目的化合物。
本发明的所有实施方式是指细胞,而不是指无细胞的体外系统;换句话说,根据本发明的系统优选是细胞系统,而不是无细胞的体外系统。
在本发明的所有实施方式中,例如,根据本发明的细胞可以是单倍体细胞、二倍体细胞或多倍体细胞。
根据本发明的细胞在本文中可互换地称为“细胞”、“根据本发明的细胞”、“宿主细胞”和“根据本发明的宿主细胞”;所述细胞可以是任何细胞,原核或真核细胞。优选地,所述细胞不是哺乳动物细胞。优选地,所述细胞是真菌,即酵母细胞或丝状真菌细胞。优选地,细胞缺乏NHEJ(非同源末端连接)部件。所述与NHEJ相关的部件优选是酵母Ku70、Ku80、MRE11、RAD50、RAD51、RAD52、XRS2、SIR4和/或LIG4的同源物或直系同源物。或者,在根据本发明的细胞中,可以通过使用抑制RNA连接酶IV的化合物(诸如SCR7)来使NHEJ缺乏(Vartak SV和Raghavan,2015)。本领域技术人员知道如何调节NHEJ及其对RNA引导的核酸酶系统的影响,参见例如WO2014130955A1;Chu等人,2015;等人,2015;Song等人,2015和Yu等人,2015;所有这些文献都以引用方式并入本文。术语“缺陷”在本文其他地方定义。
当根据本发明的细胞是酵母细胞时,优选的酵母细胞来自选自由以下项组成的组的属:Candida、Hansenula、Issatchenkia、Kluyveromyces、Pichia、Saccharomyces、Schizosaccharomyces、Yarrowia或Zygosaccharomyces;更优选地,酵母宿主细胞选自由以下项组成的组:Kluyveromyces lactis、Kluyveromyces lactis NRRL Y-1140、Kluyveromyces marxianus、Kluyveromyces.thermotolerans、Candida krusei、Candidasonorensis、Candida glabrata、Saccharomyces cerevisiae、Saccharomyces cerevisiaeCEN.PK113-7D、Schizosaccharomyces pombe、Hansenula polymorpha、Issatchenkiaorientalis、Yarrowia lipolytica、Yarrowia lipolytica CLIB122、Pichia stipidis和Pichia pastoris。
根据本发明的宿主细胞是丝状真菌宿主细胞。如本文所定义的丝状真菌包括亚门Eumycota和Oomycota的所有丝状形式(如由Hawksworth等人在Ainsworth and Bisby'sDictionary of The Fungi,第8版,1995,CAB International,University Press,Cambridge,UK中所定义)。
丝状真菌宿主细胞可以是分类单位Trichocomaceae的任何丝状形式的细胞(如由Houbraken和Samson在Studies in Mycology 70:1-51.2011中所定义的)。在另一个优选实施方式中,丝状真菌宿主细胞可以是三个科Aspergillaceae、Thermoascaceae和Trichocomaceae中的任一科的任何丝状形式的细胞,所述三个科容纳在分类单位Trichocomaceae中。
丝状真菌的特征在于由几丁质、纤维素、葡聚糖、壳聚糖、甘露聚糖和其他复合多糖构成的菌丝体壁。营养生长是通过菌丝伸长进行的,并且碳分解代谢是专性需氧的。丝状真菌菌株包括但不限于以下菌株:cremonium、Agaricus、Aspergillus、Aureobasidium、Chrysosporium、Coprinus、Cryptococcus、Filibasidium、Fusarium、Humicola、Magnaporthe、Mortierella、Mucor、Myceliophthora、Neocallimastix、Neurospora、Paecilomyces、Penicillium、Piromyces、Panerochaete、Pleurotus、Schizophyllum、Talaromyces、Rasamsonia、Thermoascus、Thielavia、Tolypocladium,以及Trichoderma。根据本发明的优选丝状真菌宿主细胞来自选自由以下项组成的组的属:Acremonium、Aspergillus、Chrysosporium、Myceliophthora、Penicillium、Talaromyces、Rasamsonia、Thielavia、Fusarium和Trichoderma;更优选地来自选自由以下项组成的组的物种:Aspergillus niger、Acremonium alabamense、Aspergillus awamori、Aspergillusfoetidus、Aspergillus sojae、Aspergillus fumigatus、Talaromyces emersonii、Rasamsonia emersonii、Rasamsonia emersonii CBS393.64、Aspergillus oryzae、Chrysosporium lucknowense、Fusarium oxysporum、Mortierella alpina、Mortierellaalpina ATCC 32222、Myceliophthora thermophila、Trichoderma reesei、Thielaviaterrestris、Penicillium chrysogenum和P.chrysogenum Wisconsin 54-1255(ATCC28089);甚至更优选地,根据本发明的丝状真菌宿主细胞是Aspergillus niger。当根据本发明的宿主细胞是Aspergillus niger宿主细胞时,所述宿主细胞优选是CBS 513.88、CBS124.903或它们的衍生物。
在许多菌种保藏单位中几种丝状真菌菌株是公众可容易获得的,所述菌种保藏单位为例如美国典型培养物保藏中心(American Type Culture Collection,ATCC)、德意志微生物保藏中心(Deutsche Sammlung von Mikroorganismen and Zellkulturen GmbH,DSM)、Centraalbureau Voor Schimmelcultures(CBS)、农业研究服务专利菌种保藏所(Agricultural Research Service Patent Culture Collection)、北方地区研究中心(Northern Regional Research Center,NRRL),以及俄罗斯科学院全俄微生物保藏中心(All-Russian Collection of Microorganisms of Russian Academy of Sciences,俄文缩写-VKM,英文缩写-RCM),Moscow,Russia。作为根据本发明的宿主细胞的优选菌株是Aspergillus niger CBS 513.88、CBS124.903,Aspergillus oryzae ATCC 20423、IFO4177、ATCC 1011、CBS205.89、ATCC 9576、ATCC14488-14491、ATCC 11601、ATCC12892、P.chrysogenum CBS 455.95、P.chrysogenum Wisconsin54-1255(ATCC28089)、Penicillium citrinum ATCC 38065、Penicillium chrysogenum P2、Thielaviaterrestris NRRL8126、Rasamsonia emersonii CBS393.64、Talaromyces emersonii CBS124.902、Acremonium chrysogenum ATCC 36225或ATCC 48272、Trichoderma reesei ATCC26921或ATCC 56765或ATCC 26921、Aspergillus sojae ATCC11906、Myceliophthorathermophila C1、Garg 27K、VKM-F 3500D、Chrysosporium lucknowense C1、Garg 27K、VKM-F 3500D、ATCC44006,以及它们的衍生物。
优选地,根据本发明的宿主细胞具有这样的修饰,优选在其基因组中具有这样的修饰,所述修饰导致如果当在相同条件下分析时与未经修饰的亲本宿主细胞相比,产生减少的或者不产生如本文所定义的不期望的化合物。
可以通过本领域技术人员已知的任何手段来引入修饰,之后进行选择,所述手段为诸如但不限于传统菌株改良、随机诱变。也可以通过定点诱变来引入修饰。
可以通过引入(插入)、取代(置换)或去除(缺失)多核苷酸序列中的一个或多个核苷酸来完成修饰。可以实现编码不期望的化合物(诸如多肽)的多核苷酸的完全或部分缺失。不期望的化合物可以是本文其他地方列出的任何不期望的化合物;其也可以是合成不期望的化合物(诸如代谢物)的生物学途径中的蛋白质和/或酶。或者,编码所述不期望的化合物的多核苷酸可以部分或完全地被这样的多核苷酸序列替换,所述多核苷酸序列不编码所述不期望的化合物或编码所述不期望的化合物的部分或完全失活形式。在另一个替代方案中,可以将一个或多个核苷酸插入编码所述不期望的化合物的多核苷酸中,从而导致对所述多核苷酸的破坏以及因此使由被破坏的多核苷酸编码的所述不期望的化合物的部分或完全失活。
在一个实施方式中,根据本发明的宿主细胞在其基因组中包含选自以下的修饰
a)编码不期望的化合物的多核苷酸的完全或部分缺失,
b)将编码不期望的化合物的多核苷酸用这样的多核苷酸序列完全或部分地替换,所述多核苷酸序列不编码所述不期望的化合物或编码所述不期望的化合物的部分或完全失活形式,
c)通过在多核苷酸序列中插入一个或多个核苷酸来破坏编码不期望的化合物的多核苷酸,并因此通过被破坏的多核苷酸使所述不期望的化合物部分或完全失活。
该修饰可以例如在所述不期望的化合物的转录或翻译所需的编码序列或调节元件中。例如,可以插入或去除核苷酸以导致终止密码子的引入、起始密码子的去除,或编码序列的开放阅读框的改变或移码。对编码序列或其调节元件的修饰可以通过定点或随机诱变、DNA改组方法、DNA重装配方法、基因合成(参见例如Young和Dong,(2004),NucleicAcids Research 32(7)或Gupta等人,(1968),Proc.Natl.Acad.Sci USA,60:1338-1344;Scarpulla等人,(1982),Anal.Biochem.121:356-365;Stemmer等人,(1995),Gene 164:49-53)或根据本领域已知的方法进行PCR产生的诱变来完成。随机诱变程序的示例是本领域熟知的,诸如化学(例如NTG)诱变或物理(例如UV)诱变。定点诱变程序的示例是QuickChangeTM定点诱变试剂盒(Stratagene Cloning Systems,La Jolla,CA)、AlteredII体外诱变系统(Promega Corporation),或通过使用如在Gene.1989年4月15日;77(1):51-9.(HoSN、Hunt HD、Horton RM、Pullen JK、Pease LR“Site-directed mutagenesis by overlapextension using the polymerase chain reaction(使用聚合酶链式反应通过重叠延伸进行定点诱变)”)中所述的PCR或使用如在Molecular Biology:Current Innovations andFuture Trends.(A.M.Griffin和H.G.Griffin编辑,ISBN 1-898486-01-8;1995HorizonScientific Press,PO Box 1,Wymondham,Norfolk,U.K.)中所述的PCR进行重叠延伸。
优选的修饰方法为基于重组遗传操纵技术,诸如部分或完全基因替换或部分或完全基因缺失。
例如,在替换多核苷酸、核酸构建体或表达盒的情况下,可以在待替换的靶基因座处引入合适的DNA序列。合适的DNA序列优选存在于克隆载体上。优选的整合克隆载体包含这样的DNA片段,所述DNA片段与多核苷酸同源和/或与待替换基因座侧翼的多核苷酸具有同源性,以将克隆载体的整合靶向至该预定基因座。为了促进靶向整合,优选在转化细胞之前将克隆载体线性化。优选地,执行线性化,使得克隆载体的至少一个但优选任一端侧接与待替换的DNA序列(或侧翼序列)同源的序列。该过程称为同源重组,并且该技术也可用于实现(部分)基因缺失。
例如,与内源多核苷酸对应的多核苷酸可以被缺陷型多核苷酸替换;所述缺陷型多核苷酸是不能生产(全功能性)多肽的多核苷酸。通过同源重组,缺陷型多核苷酸替换内源多核苷酸。可能期望的是,缺陷型多核苷酸还编码标记,所述标记可用于选择核酸序列已被修饰的转化体。
替代地或与其他提到的技术组合,可以使用基于E.coli细胞中粘粒的重组的技术,如在以下中所述:A rapid method for efficient gene replacement in thefilamentous fungus Aspergillus nidulans(2000)Chaveroche,M-K.,Ghico,J-M.和d’Enfert C;Nucleic acids Research,第28卷,编号22。
或者,可以通过使用与多核苷酸的核酸序列互补的核苷酸序列进行已建立的反义技术来执行修饰,在所述修饰中所述宿主细胞产生较少或不产生蛋白质,诸如如本文所描述且由本文所述的多核苷酸编码的具有淀粉酶活性,优选α-淀粉酶活性的多肽。更特别地,可以通过引入与多核苷酸的核酸序列互补的核苷酸序列来减少或消除宿主细胞对所述多核苷酸的表达,所述与所述多核苷酸的核酸序列互补的核苷酸序列可以在细胞中转录并且能够与所述细胞中产生的mRNA杂交。因此在允许互补反义核苷酸序列与mRNA杂交的条件下,翻译的蛋白质的量减少或被消除。表达反义RNA的示例显示于Appl.Environ.Microbiol.2000年2月;66(2):775-82中。(Characterization of afoldase,protein disulfide isomerase A,在the protein secretory pathway ofAspergillus niger.Ngiam C,Jeenes DJ,Punt PJ,Van Den Hondel CA,Archer DB中)或(Zrenner R、Willmitzer L、Sonnewald U.Analysis of the expression of potatouridinediphosphate-glucose pyrophosphorylase and its inhibition by antisenseRNA.Planta.(1993);190(2):247-52.)。
导致不期望的化合物的产生减少或不产生的修饰优选是由于如果与未经修饰的亲本微生物宿主细胞相比并且在相同条件下测量时,编码所述不期望的化合物的mRNA的产生减少。
可以经由RNA干扰(RNAi)技术(Mouyna等人,2004)来获得导致从编码不期望的化合物的多核苷酸转录的mRNA量减少的修饰。在该方法中,将表达要受影响的核苷酸序列的相同有义和反义部分彼此克隆为在其间具有核苷酸间隔区,并插入到表达载体中。在转录此类分子后,小核苷酸片段的形成将导致要影响的mRNA的靶向降解。特定mRNA的消除可以是不同程度的。RNA干扰技术描述于例如WO2008/053019、WO2005/05672A1和WO2005/026356A1中。
可以通过不同方法来获得导致不期望的化合物的产生减少或不产生的修饰,例如通过针对此类不期望的化合物的抗体或化学抑制剂或蛋白质抑制剂或物理抑制剂(TourO.等人,(2003)Nat.Biotech:Genetically targeted chromophore-assisted lightinactivation.,第21卷,编号12:1505-1508)或肽抑制剂或反义分子或RNAi分子(R.S.Kamath等人,(2003)Nature:Systematic functional analysis of theCaenorhabditis elegans genome using RNAi.,第421卷,231-237)。
除了上述技术之外或作为替代方案,还可以抑制不期望的化合物的活性,或借助于替代信号序列(Ramon de Lucas、J.,Martinez O,Perez P.,Isabel Lopez,M.,Valenciano,S.和Laborda,F.The Aspergillus nidulans carnitine carrier encodedby the acuH gene is exclusively located in the mitochondria.FEMS MicrobiolLett.2001年7月24日;201(2):193-8.)或保留信号(Derkx,P.M.和Madrid,S.M.Thefoldase CYPB is a component of the secretory pathway of Aspergillus niger andcontains the endoplasmic reticulum retention signalHEEL.Mol.Genet.Genomics.2001年12月;266(4):537-545)或通过将诸如多肽等不期望的化合物靶向到能够与参与细胞分泌途径的细胞膜结构融合而导致细胞外分泌所述多肽的过氧化物酶体(例如,如在WO2006/040340中所述)来重新定位诸如蛋白质等不期望的化合物。
替代地或与上述技术组合,还可以获得不期望的化合物的产生减少或不产生,例如通过UV或化学诱变(Mattern,I.E.、van Noort J.M.、van den Berg,P.、Archer,D.B.、Roberts,I.N.和van den Hondel,C.A.,Isolation and characterization of mutantsof Aspergillus niger deficient in extracellular proteases.Mol Gen Genet.1992年8月;234(2):332-6.)或通过使用抑制如本文所述的不期望的多肽的酶促活性的抑制剂(例如,野尻霉素,其用作β-葡糖苷酶的抑制剂(Carrel F.L.Y.和Canevascini G.CanadianJournal of Microbiology(1991)37(6):459-464;Reese E.T.、Parrish F.W.和EttlingerM.Carbohydrate Research(1971)381-388))。
在本发明的一个实施方式中,根据本发明的宿主细胞的基因组中的修饰是对编码不期望的化合物的多核苷酸的至少一个位置的修饰。
在化合物(例如不期望的化合物,诸如不期望的多肽和/或酶)产生方面有缺陷的细胞在本文中定义为这样的突变微生物宿主细胞,所述突变微生物宿主细胞已经修饰,优选在其基因组中经修饰,以产生表型特征,其中所述细胞与未修饰的亲本宿主细胞相比,当在相同条件下分析时:a)产生更少的不期望的化合物或基本上不产生任何不期望的化合物,和/或b)产生具有降低的活性或降低的比活性的不期望的化合物或不具有活性或不具有比活性的不期望的化合物,以及这些可能性中的一种或多种的组合。
优选地,根据本发明的经修饰的宿主细胞如果与未经修饰且在相同条件下测量的亲本宿主细胞相比,则产生少1%的不期望的化合物、至少少5%的不期望的化合物、至少少10%的不期望的化合物、至少少20%的不期望的化合物、至少少30%的不期望的化合物、至少少40%的不期望的化合物、至少少50%的不期望的化合物、至少少60%的不期望的化合物、至少少70%的不期望的化合物、至少少80%的不期望的化合物、至少少90%的不期望的化合物、至少少91%的不期望的化合物、至少少92%的不期望的化合物、至少少93%的不期望的化合物、至少少94%的不期望的化合物、至少少95%的不期望的化合物、至少少96%的不期望的化合物、至少少97%的不期望的化合物、至少少98%的不期望的化合物、至少少99%的不期望的化合物、至少少99.9%的不期望的化合物,或最优选少100%的不期望的化合物。
本文中提及的专利文献或作为现有技术给出的其他事项不应被视为承认该文献或事项是已知的,或者该文献或事项所包含的信息是在任何请求项的优先权日期时的公知常识的一部分。
本文所述的每篇参考文献的公开内容均以引用方式整体并入本文。
通过以下实施例进一步说明本发明:
实施例
在以下实施例中,说明了本发明的多种实施方式。根据以上描述和这些实施例中,本领域技术人员可以对本发明进行多种改变和修改以使其适应多种用途和条件。
实施例1:S.cerevisiae中的SGIC
该实施例描述了使用CRISPR/Cas9系统在Saccharomyces cerevisiae中整合自引导整合构建体(SGIC)型引导RNA表达盒。SGIC在5'末端和3'末端两处包含50bp侧翼,所述50bp侧翼与基因组DNA序列具有序列同一性以允许经由同源重组在期望基因组基因座(INT1、INT59或YPRCtau3)处进行整合。取决于所述侧翼的序列,在整合SGIC后多至1kbp的一段DNA从基因组中缺失。该设置如图3所直观表示的。
在SGIC中,为了在S.cerevisiae中表达引导RNA,使用如先前由DiCarlo等人,2013所述的具有控制元件的引导RNA表达盒。本实施例中使用的引导RNA表达盒包含SNR52启动子、由引导序列(也称为基因组靶序列)和引导RNA结构部件组成的引导RNA序列,之后是SUP4终止子。
构建表达Cas9的Saccharomyces cerevisiae菌株
酵母载体pCSN061是单拷贝载体(CEN/ARS),所述单拷贝载体(CEN/ARS)含有Cas9表达盒,所述Cas9表达盒由从KI11启动子(KLLA0F20031g的Kluyveromyces lactis启动子)表达的经密码子优化的Cas9变体(WO2016/110512)、S.cerevisiae GND2终止子以及赋予对G418的抗性的功能性KanMX标记盒组成。Cas9表达盒是KpnI/NotI连接到pRS414中(Sikorski和Hieter,1989),从而得到中间载体pCSN004。随后,赋予G418抗性的功能性表达盒(参见:www.euroscarf.de)是从载体pUG7-KanMX NotI限制性切下并NotI连接到pCSN004中,从而产生图1中描绘的载体pCSN061;序列在SEQ ID NO:2中示出。
首先使用LiAc/鲑鱼精(SS)运载体DNA/PEG方法(Gietz和Woods,2002)将含有Cas9表达盒的载体pCSN061转化至S.cerevisiae菌株CEN.PK113-7D(MATaURA3HIS3LEU2TRP1MAL2-8SUC2)中。菌株CEN.PK113-7D可从EUROSCARF保藏中心(http://www.euroscarf.de,Frankfurt,德国)获得。van Dijken等人,2000描述了CEN.PK菌株家族的起源。在转化混合物中,使用1微克的载体pCNS061。将转化混合物在含有200微克(μg)/mlG418(Sigma Aldrich,Zwijndrecht,荷兰)的YPD-琼脂(10克/升酵母提取物、20克/升蛋白胨、20克/升葡萄糖、20克/升琼脂)上铺板。在30℃下生长2到4天后,转化体在转化平板上出现。将赋予对平板上G418抗性的转化体,也称为菌株CSN001,接种在YPD-G418培养基(10克/升酵母提取物、20克/升蛋白胨、20克/升葡萄糖、200μg/ml G418(Sigma Aldrich,Zwijndrecht,荷兰)上,用于后续转化实验中。
自引导整合构建体(SGIC)型引导RNA表达盒
含有引导RNA表达盒的合成DNA是在Integrated DNA Technologies(IDT,Leuven,比利时)作为合成DNA(gBlocks)订购的。表1中提供了对序列的总述。根据制造商的说明,使用表1中所示的引物,并使用PrimeSTAR GXL DNA聚合酶(Takara/目录号R050A),将gBlockDNA用作PCR反应中的模板。得到的SGIC DNA的序列在SEQ ID NO:22、SEQ ID NO:23、SEQ IDNO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:30、SEQ ID NO:31和SEQID NO:32所示,如在DiCarlo等人,2013中所述由SNR52p RNA聚合酶III启动子、引导序列(也称为基因组靶序列;SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9)、gRNA结构部件和SUP43'侧翼区组成,并且在5'和3'两末端处均包含50bp基因组DNA序列以用于整合在基因组基因座处,所述基因组基因座为INT1、INT59或YPRC tau3。SGIC DNA大致直接地靶向引入的双链(ds)断裂(0kbp缺失),或DNA ds断裂上游约500bp和下游约500bp处(1kbp缺失)。应该注意,“0kbp”缺失不是精确的“0kbp”;将取决于SGIC的具体情况,在整合SGIC后缺失几个碱基对。通常,在该实施例中,如通过测序确定的,在INT1和YPRCtau3的情况下,130bp被缺失,并且在INT59的情况下,90bp被缺失(数据未显示)。
对照SGIC DNA也包含在转化中。对照SGIC DNA含有功能性引导RNA表达盒,所述功能性引导RNA表达盒与基因组S.cerevisiae DNA没有同源性,即它们不会通过同源重组整合。对照SGIC DNA序列在SEQ ID NO:30(INT1)、SEQ ID NO:31(INT59)和SEQ ID NO:32(YPRCtau3)中提供。用于通过PCR获得对照SGIC DNA序列的DNA模板和引物列于表1中。根据制造商的说明,使用PrimeSTAR GXL DNA聚合酶(Takara/目录号R050A)来执行PCR反应。
根据制造商的说明,使用NucleoSpin Gel和PCR Clean-up试剂盒(Machery-Nagel,由Bioké,Leiden,荷兰来分销)来纯化产生的SGIC。随后,使用NanoDrop(ND-1000分光光度计,Thermo Scientific,Bleiswijk,荷兰)来测量纯化的SGIC DNA的DNA浓度。
表1.对用于转化的SGIC DNA的序列的总述。使用该表中所示的引物将模板引导RNA表达盒用作PCR的模板,以获得在转化实验中使用的SGIC DNA(SGIC DNA片段)。
pRN1120载体构建(多拷贝表达载体,NatMX标记)
酵母载体pRN1120是多拷贝载体(2微米),其含有赋予对诺尔丝菌素的抗性的功能性NatMX标记盒。该载体的骨架基于pRS305(Sikorski和Hieter,1989),并且包括功能性2微米ORI序列和功能性NatMX标记盒(参见www.euroscarf.de)。载体pRN1120如图2所示,并且序列在SEQ ID NO:3中示出。
DNA浓度
使用NanoDrop装置(ThermoFisher,Life Technologies,Bleiswijk,荷兰)测定包括引导RNA表达盒PCR产物和pRN1120在内的所有DNA浓度,从而提供以纳克/微升计的浓度。基于这些测量,在转化实验中使用1μg SGIC DNA和10ng环形质粒pRN1120的量。
整合位点
INT1整合位点是定位在位于染色体XV上的NTR1(YOR071c)与GYP1(YOR070c)之间的非编码区。INT59整合位点是位于染色体XI上的SRP40(YKR092C)与PTR2(YKR093W)之间的非编码区。YPRCtau3整合位点是位于染色体XVI上的Ty4长末端重复序列,并且先前已由Flagfeldt等人(2009)描述。
酵母转化
将预表达Cas9的菌株CSN001接种于YPD-G418培养基(10克/升酵母提取物、20克/升蛋白胨、20克/升葡萄糖、200μg/ml G418(Sigma Aldrich,Zwijndrecht,荷兰)中。随后,使用LiAc/SS运载体DNA/PEG方法(Gietz和Woods,2002)和10ng载体pRN1120,用表2中所示的1μg SGIC DNA来转化菌株CSN001。在转化#4、#8和#12中,没有将SGIC DNA加入到转化混合物中。将转化混合物在含有200μg诺尔丝菌素(NTC,Jena Bioscience,德国)和200μg/mlG418(Sigma Aldrich,Zwijndrecht,荷兰)的YPD-琼脂(10克/升酵母提取物、20克/升蛋白胨、20克/升葡萄糖、20克/升琼脂)上铺板。将平板在30摄氏度温育直至菌落出现在平板上。
表2.对用于不同的转化实验的SGIC DNA的总述。
转化 说明 SGIC DNA序列
#1 INT1无侧翼对照 SEQ ID NO:30 3A
#2 INT1位点,0kB缺失 SEQ ID NO:22 3B
#3 INT1位点,1kB缺失 SEQ ID NO:23 3C
#4 没有INT1SGIC 3D
#5 INT59无侧翼对照 SEQ ID NO:31 3A
#6 INT59位点,0kB缺失 SEQ ID NO:24 3B
#7 INT59位点,1kB缺失 SEQ ID NO:25 3C
#8 没有INT59SGIC 3D
#9 YPRCtau3无侧翼对照 SEQ ID NO:32 3A
#10 YPRCtau3位点,0kB缺失 SEQ ID NO:26 3B
#11 YPRCtau3位点,1kB缺失 SEQ ID NO:27 3C
#12 没有YPRCtau3SGIC 3D
结果
执行上表2中总述的转化实验,并在转化后将细胞铺板在YPD选择性平板上。为了证实包含引导RNA表达盒的SGIC的正确整合并证明在INT1、INT59或YPRCtau3基因座处使基因组DNA缺失0kbp和1kbp,通过PCR分析每次转化的24个转化体。将转化体的基因组DNA如由等人,2011所述地分离,并用作PCR反应中的模板。用于确认整合的引物经设计为在基因组中紧邻在SGIC DNA中存在的基因组侧翼区的外侧杂交。根据制造商的说明书和本领域技术人员已知的标准PCR程序,使用MyTaqTM Red Mix(目录号BIO-25044,Bioline-德国)来执行PCR反应。当在PCR反应中使用表3中列出的引物组时,通过表3的最右栏中提到的大小的PCR产物来证明正确的整合。将所得PCR产物在0.8%琼脂糖凝胶上使用1x TAE缓冲液(50x TAE(Tris/乙酸/EDTA),1升,目录号1610743,BioRad,荷兰)分析,并用520-Nancy(目录号01494,Sigma Aldrich,德国)将PCT产物染色。
表3.对通过PCR进行的转化体分析的总述
下面在表4中显示了对经执行以分析正确整合SGIC DNA的转化体的PCR反应的结果的总述。在SGIC的5'末端和3'末端没有基因组DNA侧翼的情况下,没有观察到整合(转化#1、#5、#9)。在该实验中,与0kb缺失(最佳50%)相比,与基因组DNA的整合位点周围的1kb缺失组合的SGIC DNA整合的成功率略高(最佳63%),其中SGIC与基因组DNA的缺失整合在Cas9诱导的双链断裂处。总体而言,PCR结果证实了成功率高达63%的SGIC DNA整合。
表4.对菌落PCR结果的总述,菌落PCR经执行以证实包含引导RNA表达盒的SGIC整合在基因组中的正确位置处。
实施例2:在S.cerevisiae中分裂SGIC
该实施例描述了两种SGIC分裂引导RNA片段,所述两种SGIC分裂引导RNA片段是实施例1中提出的SGIC的基本上两个半部,彼此具有80bp的重叠同源性以允许体内(在酵母细胞内)装配功能性SGIC。经装配的功能性SGIC包含引导RNA表达盒和在5'末端和3'末端处的50bp侧翼,所述50bp侧翼与基因组DNA序列具有序列同一性以允许经由同源重组在期望的基因组基因座处进行整合。随后将包含引导RNA表达盒的功能性SGIC整合到S.cerevisiae基因组的INT1基因座中。实验设置如图4所示。
实验细节
此实施例中所需的部件如下:
-酵母菌株CSN001,其预表达Cas9。在实施例1中描述了菌株CSN001的构建。
-pRN1120,含有NatMX标记的多拷贝表达载体。质粒的构建和细节描述于实施例1中。
100bp ssODN侧翼序列
在子实验中,为了靶向本身与基因组整合位点没有序列同一性的SGIC型引导RNA表达盒(SEQ ID NO:47)的整合,在转化4B中包括各100bp的单链寡核苷酸(表6)。这些左侧翼(LF)和右侧翼(RF)序列与SGIC的5'末端和3'末端具有50bp的同源性,并且与基因组具有50bp的同源性。通过整合SGIC,从INT1基因座中缺失一段1kbp的基因组DNA。
INT1整合位点是定位在位于染色体XV上的NTR1(YOR071c)与GYP1(YOR070c)之间的非编码区。
分裂SGIC
将Cas9导入INT1整合位点的引导RNA表达盒是在Integrated DNA Technologies(IDT,Leuven,比利时)作为合成DNA(gBlock)订购的,SEQ ID NO:4。使用引物SEQ ID NO:45和SEQ ID NO:46,将该gBlock用作PCR反应中的模板,从而产生在5'端和3'端上侧接接头序列的SGIC。这些接头序列是50bp的随机DNA序列,5'接头序列(SEQ ID NO:59)和3'接头序列(SEQ ID NO:60)。将得到的PCR产物SEQ ID NO:47在后续PCR反应中用作模板,以获得分裂SGIC DNA片段(SGIC部分1和SGIC部分2,参见图4A)。使用引物组SEQ ID NO:48和SEQ IDNO:50、SEQ ID NO:49和SEQ ID NO:51以获得SGIC的5'部分和3'部分,分别为SEQ ID NO:53和SEQ ID NO:54。还使用引物组SEQ ID NO:50和SEQ ID NO:51,将PCR产物SEQ ID NO:47也用作PCR反应中的模板,以产生在5'末端和3'末端处均包含与基因组DNA序列具有序列同一性的侧翼的SGIC(SEQ ID NO:52),以便允许经由同源重组整合在基因组中的INT1基因座处。在表5中呈现了对PCR反应的总述,所述PCR反应经执行以获得用于转化中的SGIC和分裂SGIC DNA片段。根据供应商的说明和本领域技术人员已知的PCR程序,使用PrimeStar GXLDNA聚合酶(Takara/目录号R050A)来执行PCR反应。
表5.对PCR反应的总述,所述PCR反应经执行以获得分裂SGIC DNA片段和SGIC序列。显示了PCR反应中使用的引物组和模板的组合以及得到的SGIC片段。
所得到的侧接接头序列和/或基因组DNA序列(50bp)以正确整合在INT1基因座处的分裂SGIC片段和(非分裂)SGIC的序列在SEQ ID NO:47、SEQ ID NO:52、SEQ ID NO:53和SEQ ID NO:54中示出。SGIC由SNR52p RNA聚合酶III启动子、引导序列(也称为基因组靶序列;SEQ ID NO:7)、gRNA结构部件和SUP4 3'侧翼区组成,如DiCarlo等人,2013中所述。5'分裂SGIC片段由SNR52p RNA聚合酶III启动子、引导序列和30bp的引导RNA结构元件组成,用于与3'SGIC片段装配。3'SGIC片段由30bp的SNR52p RNA聚合酶III启动子、引导序列、引导RNA结构元件和SUP4 3'侧翼区组成。所有分裂SGIC和非分裂SGIC都如图4所示。
当SGIC中不包含基因组侧翼时,使用100bp ssODN以靶向整合到INT1基因座上,SEQ ID NO:55、SEQ ID NO:56、SEQ ID NO:57和SEQ ID NO:58。图4中提供了对所执行的转化和使用的DNA元件的总述。
酵母转化实验
使用LiAc/鲑鱼精(SS)运载体DNA/PEG方法(Gietz和Woods,2002)来转化预表达Cas9的菌株CSN001。表5和表6中提供了对实施例2的所有转化实验的总述。实验设置如图4A、图4B和图4C所描绘。
在每个转化实验中,将SGIC和分裂SGIC DNA片段与50ng pRN1120,SEQ ID NO:3和1μg的SGIC DNA片段(转化4B和4C)或各500ng的分裂SGIC DNA片段(总计2×500ng,转换4A)共转化。在转化4B中,在转化中包括各50ng(总计:4×50ng)的ssODN侧翼序列。在每次转化中,取pRN1120质粒(50ng)以一起用于选择转化体(诺尔丝菌素抗性)
将转化混合物在含有200μg诺尔丝菌素(NTC,Jena BioScience,德国)和200μg/mlG418(Sigma Aldrich,Zwijndrecht,荷兰)的YPD-琼脂(10克/升酵母提取物、20克/升蛋白胨、20克/升葡萄糖、20克/升琼脂)上铺板。
表6.对用于不同转化的SGIC DNA的总述。
结果
执行上表6中给出的转化实验,并在转化后将细胞铺板在YPD选择性平板上。为了确认将SGIC型引导RNA表达盒正确装配(转化5A)和/或整合(转化5A、5B和5C)在INT1基因座上,通过PCR进一步分析每次转化的15个转化体。将转化体的基因组DNA如由等人,2011所述地分离,并用作PCR反应中的模板。用于确认整合的引物经设计为在基因组中紧邻在SGIC DNA(SEQ ID NO:35和SEQ ID NO:36)中存在的基因组侧翼区的外侧杂交。根据制造商的说明书和本领域技术人员已知的标准PCR程序,使用MyTaqTM Red Mix(目录号BIO-25044,Bioline-德国)来执行PCR反应。
当使用该引物组时,通过大小为663bp的PCR产物来证明SGIC的正确整合。如果SGIC盒未整合在INT基因座上,则扩增1342bp的PCR产物。将所得PCR产物在0.8%琼脂糖凝胶上使用1x TAE缓冲液(50x TAE(Tris/乙酸/EDTA),1升,目录号1610743,BioRad,荷兰)分析,并用520-Nancy(目录号01494,Sigma Aldrich,德国)将PCR产物染色。转化体的PCR分析结果显示在表7中。在所有情况下,PCR分析产生PCR产物:当在INT1基因座上没有整合SGIC时,扩增了1342bp的产物。在INT1基因座上整合SGIC导致扩增663bp的产物。在计算转化成功率时,未考虑阴性PCT的结果。
表7.对获得的SGIC和分裂SGIC转化体的PCR分析结果的总述。
PCR结果证实在实施例2的每次转化中SGIC型引导RNA表达盒成功整合。在5'和3'末端附接有基因组DNA侧翼的SGIC(SEQ ID NO:52)的转化是3个转化中最成功的(57%)。
实施例3:Aspergillus niger中的SGIC
在Aspergillus niger中的SGIC使用具有或不具有选择性标记盒的SGIC型引导RNA表达盒和一个或两个单独的片段作为SGIC DNA。
该实施例描述了使用Cas9和SGIC的组合来破坏A.niger的基因组DNA中的fnwA基因座,所述SGIC是作为在不存在或存在另外的选择性标记盒的情况下含有用作供体DNA的引导RNA表达盒的PCR产物制备的。通过引导RNA的表达(因此在整合之前),Cas9被引导至靶位点并且能够在靶位点处诱导双链断裂。图9给出了对该技术的总述。
第一种方法使用作为包含引导RNA表达盒和5'末端和3'末端与基因组DNA具有同源性的50bp侧翼的PCR产物制备的功能性SGIC,以将SGIC导入基因组DNA的预定靶位点处(SGIC片段I,图9A)。第二种方法使用作为包含引导RNA表达盒和标记盒(其含有在5'末端和3'末端与基因组DNA具有同源性的50bp侧翼)的PCR产物制备的功能性SGIC,以将SGIC导入基因组DNA的预定靶位点处(SGIC片段II A或SGIC片段II B,图9B)。第三种方法使用包含两种PCR产物的分裂SGIC:SGIC片段III,所述SGIC片段III包含sgRNA表达盒,所述sgRNA表达盒含有5'末端与基因组DNA具有同源性的50bp侧翼和3'末端与SGIC片段IV A或SGIC片段IVB具有同源性的50bp侧翼。通过PCR制备SGIC片段IV A和SGIC片段IV B,其包含标记盒并且含有5'末端与片段III具有同源性的50bp侧翼和3'末端与基因组DNA具有同源性的50bp侧翼(图9C)。转化后,SGIC片段形成功能性SGIC,从而导致对fwnA基因的破坏。具有整合在fwnA基因中的SGIC(具有或不具有标记盒)的菌株具有孢子从黑色到浅黄褐色的颜色变化(等人,2011)。
构建SGIC DNA部分
为了获得图9中所示和表9中总述的SGIC DNA片段,获得含有fnwA引导RNA表达盒和潮霉素或腐草霉素标记盒的前三个DNA部分,在下文称为SGIC DNA部分。将SGIC DNA部分在后续PCR中用作模板以获得SGIC DNA PCR产物。为了构建所述三个SGIC DNA部分,使用标准PCR方案,使用Phusion DNA聚合酶(New England Biolabs),利用表8所示的引物和模板DNA来执行PCR扩增。所有PCR产物都具有Golden-Gate克隆相容位点。根据制造商的说明,用来自Macherey Nagel(由Bioké,Leiden,荷兰来分销)的PCR纯化试剂盒来纯化PCR产物。使用NanoDrop(ND-1000分光光度仪,Thermo Fisher Scientific)来测量DNA浓度。
表8.对为了获得SGIC DNA部分而使用的引物和模板的总述。
在WO2016110453A1中描述了BG-AMA5(SEQ ID NO:65;图5)和BG-AMA9(SEQ ID NO:66;图6)的构建。
使用Invitrogen的Zero Blunt TOPO PCR克隆试剂盒将扩增的SGIC DNA部分克隆到TOPO Zero Blunt载体中(SEQ ID NO:67)。得到的载体称为“TOPO SGIC DNA sgRNAfwnA”、“TOPO SGIC hygB”和“TOPO SGIC phleo”。
根据上文描述的TOPO载体,使用Golden Gate反应(根据专利申请WO2013/144257中的实施例1)将SGIC DNA部分转移到接收骨架载体AB(SEQ ID:68)中。这产生了名为“SGICDNA HygB”(SEQ ID NO:69;图7)和“SGIC DNA Phleo”(SEQ ID NO:70;图8)的载体。
用于转化到A.niger中的SGIC DNA片段
使用标准PCR方案,使用Phusion DNA聚合酶(New England Biolabs)以及表9所示的引物和模板DNA来执行SGIC DNA片段的PCR制备。根据制造商的说明,通过凝胶提取(SGIC片段I)和PCR纯化(SGIC片段IIA、IIB、III、IVA和IVB,使用来自Macherey Nagel(由Bioké,Leiden,荷兰来分销)的Gel和PCR纯化试剂盒)来纯化PCR产物。使用NanoDrop(ND-1000分光光度仪,Thermo Fisher Scientific)来测量DNA浓度。
表9.对为了获得用于转化到A.niger中的SGIC DNA片段而使用的引物和模板的总述。
图9提供了用于将具有/不具有单独标记盒的fwnA SGIC整合到A.niger基因组中的fnwA基因座处的方法的图形表示。
构建BG-AMA17质粒
使用Phusion DNA聚合酶(New England Biolabs)以及SEQ ID NO:79所示的正向引物和SEQ ID NO:80所示的反向引物来执行Cas9表达盒的PCR扩增(在WO2016110453A1中描述了BG-C20Cas9表达盒的构建)。两种引物均含有具有KpnI限制性位点的侧翼。根据制造商的说明,用来自Macherey Nagel(由Bioké,Leiden,荷兰来分销)的PCR纯化试剂盒来纯化PCR产物。使用NanoDrop(ND-1000分光光度仪,Thermo Fisher Scientific)来测量DNA浓度。
将骨架载体BG-AMA8(描述于WO2016110453A1中)和获得的Cas9表达盒的KpnI侧接PCR片段用KpnI(NEB酶)消化,并用来自Macherey Nagel的PCR纯化试剂盒(由Bioké,Leiden,荷兰来分销)纯化。根据制造商的说明书,使用T4连接(Invitrogen)将消化的BG-AMA8骨架载体与Cas9盒PCR产物连接。根据制造商的说明将连接混合物转化到ccdB抗性E.coli细胞(Invitrogen)中。用限制酶分析检查几个克隆,并将具有正确限制性模式的克隆命名为BG-AMA17(SEQ ID NO:83)。图13中提供了BG-AMA17的质粒图谱。质粒BG-AMA17含有从启动子和终止子表达的Cas9表达盒、dsRED盒以及用于在A.niger中选择的HygB标记。
菌株
在该实施例中,在转化实验中使用Aspergillus niger菌株GBA 302(ΔglaA、ΔpepA、ΔhdfA)。GBA 302的构造在专利申请WO2011/009700中描述。
转化
如专利申请WO1999/32617和WO1998/46772中所述地执行原生质体转化,不同之处为在转化混合物中加入ATA(金精三羧酸=核酸酶抑制剂)。在这些转化中,使用含有核定位信号(NLS)的Cas9蛋白(IDT,Integrated DNA Technologies,Inc)。在该实施例中使用的Cas9是从上文描述的AMA-载体表达的,或者是作为Cas9蛋白质加入到转化中的。将50μg的Cas9蛋白质溶于50μl无核酸酶的水(Ambion,Thermo Fisher,Bleiswijk,荷兰)中至终浓度为1μg/μl。在相应的转化中使用1.5μg的Cas9蛋白。
实验设计SGIC实验和所得数据
表10至表15描述了SGIC实验的六个子集。这些表都具有相同的列标题。“AMA”列表示在转化中是否加入AMA载体,“x”表示没有AMA质粒;“phleo”表示加入了具有phleo标记盒的AMA质粒(BG-AMA1,图14,SEQ ID NO:84),并且“hygB”表示具有hygB标记盒的AMA质粒(BG-AMA8,图11,SEQ ID NO:81)。“Cas9”列表示Cas9蛋白是如何提供到细胞中的:“x”表示“无Cas9”,“蛋白质”表示在转化混合物中作为蛋白质加入,“Cas9st”表示将Cas9蛋白质编码在AMA质粒处并从强启动子Pc_FP017.pro与Pc_FT029.终止子表达(具有phleo标记=BG-AMA5,SEQ ID:65,图5;具有hygB标记=BG-AMA17,SEQ ID:83,图13),“Cas9++”表示将Cas9编码在AMA质粒处并从非常强的启动子A.nidulans TEF.pro与Pc_FT029.ter表达(BG-AMA14,SEQ ID:82,图10)。“选择”列表示在转化平板上选择哪种标记:“phleo”表示对腐草霉素的选择,hygB表示对潮霉素B的选择。
第一,将两个系列SGIC实验根据图9A中所示的概念执行(SGIC片段I的转化),并在表10和表11中进一步解释。
表10和表11在图12A至图12G中详细示意性地示出,其中行A、B、C、D、E、F、G由图12的相应图12A至图12G表示。在表10的情况下,提供没有SGIC用作对照,并且对于表11中的实验,将SGIC片段(SEQ ID NO:85[SGIC片段I])如表中直观表示的提供。
第二,将两个系列SGIC实验根据图9B所示的概念执行(SGIC片段IIA和SGIC片段IIB的转化),并分别在表12和表13中进一步描述。
第三,将两个系列SGIC实验根据图9C中所示的概念执行(两个分裂SGIC片段III+IVA和SGIC片段III+IVB的转化),并分别在表14和表15中进一步描述。
表10.没有使用SGIC片段
AMA CAS9 选择 菌落数量 浅黄褐色的数量 %浅黄褐色
A phleo x phleo 40 0 0
B phleo 蛋白质 phleo 15 0 0
C phleo Cas9st phleo 31 0 0
D phleo Cas9++ phleo 0 0 0
E hygB x hygB 120 0 0
F hygB 蛋白质 hygB 31 0 0
G hygB Cas9st hygB 62 0 0
表10提供了没有加入SGIC DNA的对照实验的结果。在实验A-G中获得的所有孢子显示黑色表型。这意味着没有发生对fwnA基因座的编辑。应注意,在AMA质粒处使用针对Cas9的非常强的启动子的情况下获得了0个菌落(第10D行),表明Cas9的高可用性在转化后阻碍了细胞生长或恢复。
表11.所使用的SGIC:SEQ ID NO:85[SGIC片段I]
通过重复加入靶向浅黄褐色基因座的SGIC DNA(SEQ ID NO:85[SGIC片段I])的实验,除了转化11B外,我们在Cas9可用于细胞的所有情况下清楚地观察到了浅黄褐色菌落。取决于AMA载体上存在的标记和取决于用于Cas9表达的启动子的表达强度或Cas9蛋白的直接使用,SGIC靶向插入的频率在0.4%与62%之间。在所有阳性编辑情况中,选择性标记盒存在于AMA质粒中,而不存在于SGIC上。
接下来,我们用含有选择性标记的SGIC执行实验(图5B),这与对所应用的AMA载体和/或SGIC构建体的选择有所不同,表12。
表12.所使用的SGIC:SEQ ID:86[SGIC片段II A,SGIC DNA的HygB标记部分]
AMA CAS9 选择 菌落数量 浅黄褐色的数量 %浅黄褐色
A x X hygB 0 0 0
B x 蛋白质 hygB 88 79 90
C hygB 蛋白质 hygB >400 7 2
D hygB Cas9st hygB 305 224 73
E phleo 蛋白质 phleo 75 0 0
F phleo Cas9st phleo 68 36 53
G phleo Cas9++ phleo 0 0 0
H phleo Cas9st hygB 370 351 95
I phleo Cas9++ hygB 287 280 98
来自表12的结果显示在fnwA基因座处引入SGIC片段的效率非常高,达到高达98%。应注意,没有AMA载体的系统,行12B,产生了大量具有90%编辑效率的转化体,而对照12A没有产生菌落,证明在没有Cas9的情况下SGIC片段未整合到基因组DNA中。该组实验清楚地表明,具有来自线性双链SGIC DNA的sgRNA的瞬时表达的SGIC概念允许有效引入—在这种情况下SGIC片段本身含有sgRNA表达盒和hygB表达盒—到基因组中,这由Cas9双链基因组DNA切割促进。当在SGIC DNA上选择hygB时获得了最高的编辑效率,其中AMA含有不同的标记(在此是phleo)(SGIC在基因组DNA中的整合,12B、12H、12I);当在AMA质粒处也可获得hygB标记时,编辑效率较低(12C、12D)。
表13.所使用的SGIC:SEQ ID NO:87[SGIC片段II B,SGIC DNA的phleo标记部分]
AMA CAS9 选择 菌落数量 浅黄褐色的数量 %浅黄褐色
A x x phleo 0 0 0
B x 蛋白质 phleo 9 9 100
C phleo 蛋白质 phleo >400 8 2
D phleo Cas9st phleo 192 122 64
E phleo Cas9++ phleo 246 208 85
F hygB 蛋白质 hygB >400 29 7
G hygB Cas9st hygB 136 55 40
表13提供了与表12中相似的实验的结果,但现在在SGIC构建体上存在了腐草霉素标记。与12B类似,在此在SGIC处具有标记选择的Cas9蛋白质转化也提供了最高的编辑效率,编辑效率为100%(表13,行B)。
接下来,进行两个实验组(表14和表15),其中经由两个SGIC片段(分裂SGIC)的同源重组在细胞中形成SGIC DNA,所述两个SGIC片段即含有sgRNA表达盒的第一片段和含有标记盒的第二片段(图5C)。
表14.所使用的SGIC片段:SEQ ID:88(SGIC片段III)+SEQ ID:89[SGIC片段IV A,SGIC DNA的HygB标记部分]
表14的结果A至G可以直接与表12的结果A至G进行比较,其中两者之间的唯一差异是使用1个片段对照2个片段来构成功能性SGIC。总的来说,当仅选择SGIC DNA处存在的标记(hygB)时,两个表都提供了具有最高编辑频率的相当一致的观点。可以得出结论,SGIC片段可以经由同源重组有效地形成,因此可以作为两个片段(分裂SGIC)提供。
表15.所使用的SGIC片段:SEQ ID:88(SGIC片段III)+SEQ ID:90[SGIC片段IV B,SGIC DNA的phleo标记部分]
AMA Cas9 选择 菌落数量 浅黄褐色的数量 %浅黄褐色
A x X phleo 22 0 0
B x 蛋白质 phleo 34 26 76
C phleo 蛋白质 phleo >300 0 0
D phleo Cas9st phleo 186 89 48
E phleo Cas9++ phleo 75 67 89
F hygB 蛋白质 hygB >500 0 0
G hygB Cas9st hygB 104 28 27
表15的结果A至G的可以直接与表13的结果A至G进行比较,其中两者之间的唯一差异是使用1个片段对照2个片段来构成功能性SGIC。总的来说,当仅选择SGIC DNA处的标记(phleo)时,两个表都提供了具有最高编辑频率的相当一致的观点。可以得出结论,SGIC片段可以经由同源重组有效地形成,因此可以作为两个片段(分裂SGIC)提供。
实施例4:通过SGIC在S.cerevisiae中进行多重基因组编辑
该实施例描述了使用CRISPR/Cas9系统在Saccharomyces cerevisiae中整合多个自引导整合构建体(SGIC)型引导RNA表达盒。SGIC在5'末端和3'末端处包含50bp侧翼,所述50bp侧翼与基因组DNA序列具有序列同一性以允许经由同源重组在期望基因组基因座处进行整合。取决于所述侧翼的序列,在整合SGIC后使多至1kbp的一段DNA从基因组中缺失。当侧翼序列与在ATG起始密码子的上游和终止密码子的下游的ORF周围的序列同源时,完整的ORF缺失。该设置在图15L中直观表示。
在SGIC中,为了在S.cerevisiae中表达引导RNA,使用如先前由DiCarlo等人,2013所述的具有控制元件的引导RNA表达盒。本实施例中使用的引导RNA表达盒包含SNR52启动子、由引导序列(也称为基因组靶序列)和引导RNA结构部件组成的引导RNA序列,之后是SUP4终止子。
实验细节
本实施例中应用的部件如下:
-酵母菌株CSN001,其预表达Cas9。在实施例1中描述了菌株CSN001的构建。
-pRN1120,含有NatMX标记的多拷贝表达载体。质粒的构建和细节描述于实施例1中。
自引导整合构建体(SGIC)型引导RNA表达盒
含有引导RNA表达盒的合成DNA(SEQ ID NO.91、SEQ ID NO.92和SEQ ID NO.93)是在Integrated DNA Technologies(IDT,Leuven,比利时)作为合成DNA(gBlocks)订购的。根据制造商的说明,使用表16中所示的引物,并使用PrimeSTAR GXL DNA聚合酶(Takara/目录号R050A),将gBlock DNA用作PCR反应中的模板。得到的SGIC DNA的序列如SEQ ID NO:103、SEQ ID NO:104和SEQ ID NO:105所示,如在DiCarlo等人,2013中所述由SNR52p RNA聚合酶III启动子、引导序列(也称为基因组靶序列;SEQ ID NO:94、SEQ ID NO:95、SEQ ID NO:96)、gRNA结构部件和SUP4 3'侧翼区域组成,并且在5'和3'末端处均包含50bp基因组DNA序列以用于整合在基因组基因座处。表16中提供了序列的总述。SGIC的5'末端和3'末端处的50bp基因组序列与紧邻在ORF外部、ATG起始密码子上游和终止密码子下游的基因组序列相同。这意味着由SGIC DNA的引导RNA表达盒靶向的ORF在SGIC DNA整合后缺失。对于ORF1、ORF2和ORF3,通过整合SGIC DNA(SEQ ID NO:103、SEQ ID NO:104和SEQ ID NO:105)而缺失的完整ORF的大小分别为2376bp、1308bp和651bp。根据制造商的说明,使用NucleoSpin Gel和PCR Clean-up试剂盒(Machery-Nagel,由Bioké,Leiden,荷兰来分销)来纯化产生的SGICDNA。随后,使用NanoDrop(ND-1000分光光度计,Thermo Scientific,Bleiswijk,荷兰)来测量纯化的SGIC DNA的DNA浓度。
表16.对用于转化的SGIC DNA的序列的总述。使用该表中所示的引物将模板引导RNA表达盒用作PCR的模板,以获得在转化实验中使用的SGIC DNA(SGIC DNA片段)。
酵母转化
将预表达Cas9的菌株CSN001接种于YPD-G418培养基(10克/升酵母提取物、20克/升蛋白胨、20克/升葡萄糖、200μg/ml G418(Sigma Aldrich,Zwijndrecht,荷兰)中。随后,使用LiAc/SS运载体DNA/PEG方法(Gietz和Woods,2002)和100ng载体pRN1120,用表17中所示的1μg SGIC DNA来转化菌株CSN001。在转化#4中,没有将SGIC DNA加入到转化混合物中。将转化混合物在含有200μg诺尔丝菌素(NTC,Jena Bioscience,德国)和200μg/ml G418(Sigma Aldrich,Zwijndrecht,荷兰)的YPD-琼脂(10克/升酵母提取物、20克/升蛋白胨、20克/升葡萄糖、20克/升琼脂)上铺板。将平板在30摄氏度温育直至菌落出现在平板上。
表17.对用于多重转化实验的SGIC DNA的总述。
结果
执行上表17中示出的转化实验,并在转化后将细胞铺板在YPD选择性平板上。为了确认包含引导RNA表达盒的SGIC的正确整合以及使基因组中所靶向的ORF缺失,通过PCR分析8个转化体。将转化体的基因组DNA如由等人,2011所述地分离,并用作PCR反应中的模板。
用于确认整合的引物组的第一引物经设计为在基因组中紧邻在SGIC DNA中存在的基因组侧翼区的外侧杂交。引物组的第二引物经设计以杂交SGIC DNA构建体的引导RNA表达盒。根据制造商的说明书和本领域技术人员已知的标准PCR程序,使用MyTaqTM Red Mix(目录号BIO-25044,Bioline-德国)来执行PCR反应。当在PCR反应中使用表18中列出的引物组时,通过表18的最右列中提到的大小的PCR产物来证明正确的整合。将所得PCR产物在0.8%琼脂糖凝胶上使用1x TAE缓冲液(50x TAE(Tris/乙酸/EDTA),1升,目录号1610743,BioRad,荷兰)分析,并用520-Nancy(目录号01494,Sigma Aldrich,德国)将所述PCR产物染色。
表18.对通过PCR进行的转化体分析的总述
执行不加入SGIC DNA的情况下质粒pRN1120的转化,转化#4,以检查菌株CSN001的转化效率,不进一步分析该转化的转化体。
下面在表19中显示了对经执行以分析转化体的SGIC DNA正确整合的PCR反应的结果的总述。
表19.对菌落PCR结果的总述,菌落PCR经执行以证实包含引导RNA表达盒的SGIC整合在基因组中的正确位置处。当使用多个SGIC DNA构建体执行转化时,结果被称为1xSGIC:2,这意味着在筛选的8个转化体中,有2个转化体含有用于转化的任一SGIC DNA构建体的整合。
在该实验中,通过对每次转化仅8个转化体的有限筛选证实,通过在Saccharomyces cerevisiae中加入多个SGIC DNA构建体,可以在一次转化中产生多个敲除突变体。
该成功的实验表明,本发明的方法允许对SGIC构建体进行快速的模块多重化。在该实施例中,经由PCR来表征具有整合的SGIC构建体的转化体。在实践中,这也可以经由全基因组NGS测序或对SGIC插入物的独特序列(例如SGIC构建体内的引导序列或加入的DNA条形码)的靶向测序来完成。
参考文献
Altschul SF等,J.Mol.Biol.215:403-410(1990)
Carillo H和Lipman D.SIAM J.Applied Math.,48:1073(1988)
Carrel F.L.Y.和Canevascini G.Canadian Journal of Microbiology(1991)37(6):459-464;Reese E.T.,Parrish F.W.and Ettlinger M.Carbohydrate Research(1971)381-388.
Chaveroche,MK.,Ghico,J-M.和d’Enfert C.A rapid method for efficientgene replacement in the filamentous fungus Aspergillus nidulans(2000);Nucleicacids Research,vol 28,no 22.
Cong L,Ran FA,Cox D,Lin S,Barretto R,Habib N,Hsu PD,Wu X,Jiang W,Marraffini LA,Zhang F.Science.Multiplex genome engineering using CRISPR/Cassystems.2013Feb 15;339(6121):819-23.doi:10.1126/science.1231143.Epub 2013Jan3.
Crook NC,Schmitz AC,Alper HS.Optimization of a yeast RNA interferencesystem for controlling gene expression and enabling rapid metabolicengineering.ACS Synth Biol.2014May 16;3(5):307-13.
Devereux,J.,等,Nucleic Acids Research 12(1):387(1984).
Derkx,PM和Madrid SM.The foldase CYPB is a component of the secretorypathway of Aspergillus niger and contains the endoplasmic reticulum retentionsignal HEEL.Mol.Genet.Genomics.2001Dec;266(4):537-545
DiCarlo JE,Norville JE,Mali P,Rios X,Aach J,Church GM.Nucleic AcidsRes.2013Apr;41(7):4336-43.Genome engineering in Saccharomyces cerevisiaeusing CRISPR-Cas systems.
DiCarlo JE,Chavez A,Dietz SL,Esvelt KM,Church GM.Safeguarding CRISPR-Cas9gene drives in yeast.Nat Biotechnol.2015Dec;33(12):1250-1255.doi:10.1038/nbt.3412.
Egholm M,Buchardt O,Christensen L,Behrens C,Freier SM,Driver DA,BergRH,Kim SK,Norden B,Nielsen PE.,1993.Nature 365,566-568.
Flagfeldt DB,Siewers V,Huang L,Nielsen J.Characterization ofchromosomal integration sites for heterologous gene expression inSaccharomyces cerevisiae.Yeast.2009Oct;26(10):545-51.doi:10.1002/yea.1705.
Gao F,Shen XZ,Jiang F,Wu Y,Han C.DNA-guided genome editing using theNatronobacterium gregoryi Argonaute.Nat Biotechnol.2016Jul;34(7):768-73.doi:10.1038/nbt.3547.
Gietz RD,Woods RA.Transformation of yeast by lithium acetate/single-stranded carrier DNA/polyethylene glycol method.Methods Enzymol.2002;350:87-96.
Govindaraju和Kumar,2005.Chem.Commun,495–497.
Gribskov M和Devereux J,编,Sequence Analysis Primer,M Stockton Press,New York,1991.
Griffin HM和Griffin HG,编,Computer Analysis of Sequence Data,第I部分,Humana Press,New Jersey,1994.
Griffin HM和Griffin HG,编,Molecular Biology:Current Innovations andFuture Trends.ISBN 1-898486-01-8;1995Horizon Scientific Press,PO Box 1,Wymondham,Norfolk,U.K
Gupta等(1968),Proc.Natl.Acad.Sci USA,60:1338-1344.
Hawksworth DL等,In,Ainsworth and Bisby's Dictionary of The Fungi,第8版,1995,CAB International,University Press,Cambridge,UK
Herbert RB.The Biosynthesis of Secondary Metabolites,Chapman andHall,New York,1981.
Ho SN,Hunt HD,Horton RM,Pullen JK,Pease LR“Site-directed mutagenesisby overlap extension using the polymerase chain reaction.Gene.1989Apr 15;77(1):51-9.
TR,Park J,Arentshorst M,van Welzen AM,Lamers G,Vankuyk PA,Damveld RA,van den Hondel CA,Nielsen KF,Frisvad JC,Ram AF.Fungal GenetBiol.2011May;48(5):544-53.The molecular and genetic basis of conidialpigmentation in Aspergillus niger.
Kamath RS等,(2003)Systematic functional analysis of theCaenorhabditis elegans genome using RNAi.Nature.Vol.421,231-237.
Lesk A.M.编Computational Molecular Biology,Oxford University Press,New York,1988.
M,Kristjuhan K,Kristjuhan A.Biotechniques.2011May;50(5):325-8.Extraction of genomic DNA from yeasts for PCR-based applications.
Mali P,Yang L,Esvelt KM,Aach J,Guell M,DiCarlo JE,Norville JE,ChurchGM.RNA-guided human genome engineering via Cas9.Science.2013Feb 15;339(6121):823-6.doi:10.1126/science.1232033.Epub 2013Jan 3.
Maruyana等.Nat Biotechnol.2015May;33(5):538–542.
Song等.Nature communications|doi:10.1038/ncomms10548
Yu等.Cell Stem Cell.2015February 5;16(2):142–147.
Mattern,I.E.,van Noort J.M.,van den Berg,P.,Archer,D.B.,Roberts,I.N.和van den Hondel,C.A.,Isolation and characterization of mutants ofAspergillus niger deficient in extracellular proteases.Mol Gen Genet.1992Aug;234(2):332-6.
Morita等2001.Nucleic Acid Res Supplement No.1:241-242.
Mouyna I,Henry C,Doering TL,LatgéJP.Gene silencing with RNAinterference in the human pathogenic fungus Aspergillus fumigatus.FEMSMicrobiol Lett.2004Aug 15;237(2):317-24.
Nakamura Y,Gojobori T,Ikemura T.Codon usage tabulated frominternational DNA sequence databases:status for the year 2000.Nucleic AcidsRes.2000Jan1;28(1):292.
Needleman和Wunsch,J.Mol.Biol.48:443-453(1970).
Ngiam C,Jeenes DJ,Punt PJ,Van Den Hondel CA,Archer DB.Appl.Environ.Microbiol.2000Feb;66(2):775-82.Characterization of a foldase,protein disulfideisomerase A,in the protein secretory pathway of Aspergillus niger.
Nielsen等,1991.Science 254,1497-1500.
Pel等.Genome sequencing and analysis of the versatile cell factoryAspergillus niger CBS 513.88.Nat Biotechnol.2007Feb;25(2):221-231.
Ramon de Lucas,J.,Martinez O,Perez P.,Isabel Lopez,M.,Valenciano,S.和Laborda,F.The Aspergillus nidulans carnitine carrier encoded by the acuH geneis exclusively located in the mitochondria.FEMS Microbiol Lett.2001Jul 24;201(2):193-8.
Scarpulla等.(1982),Anal.Biochem.121:356-365.
Sikorski RS,Hieter P.Genetics.A system of shuttle vectors and yeasthost strains designed for efficient manipulation of DNA in Saccharomycescerevisiae.1989May;122(1):19-27.
Smith DW,编,Biocomputing:Informatics and Genome Projects,Smith,Academic Press,New York,1993.
Stemmer等(1995),Gene 164:49-53.
Tour O.等,(2003)Nat.Biotech:Genetically targeted chromophore-assistedlight inactivation.Vol.21.no.12:1505-1508.
van Dijck等,2003,Regulatory Toxicology and Pharmacology 28;27-35:Onthe safety of a new generation of DSM Aspergillus niger enzyme productionstrains.
van Dijken JP,Bauer J,Brambilla L,Duboc P,Francois JM,Gancedo C,Giuseppin ML,Heijnen JJ,Hoare M,Lange HC,Madden EA,Niederberger P,Nielsen J,Parrou JL,Petit T,Porro D,Reuss M,van Riel N,Rizzi M,Steensma HY,Verrips CT, J,Pronk JT.An interlaboratory comparison of physiological andgenetic properties of four Saccharomyces cerevisiae strains.Enzyme MicrobTechnol.2000Jun 1;26(9-10):706-714.
Vartak SV和Raghavan SC.Inhibition of nonhomologous end joining toincrease the specificity of CRISPR/Cas9genome editing.FEBS J.2015Nov;282(22):4289-94.doi:10.1111/febs.13416.Epub 2015Sep 9.
von Heine G.Sequence Analysis in Molecular Biology,Academic Press,1987.
Young和Dong,(2004),Nucleic Acids Research 32(7).
Zrenner R,Willmitzer L,Sonnewald U.Analysis of the expression ofpotato uridinediphosphate-glucose pyrophosphorylase and its inhibition byantisense RNA.Planta.(1993);190(2):247-52.
序列表
<110> 帝斯曼知识产权资产管理有限公司
<120> 自引导整合构建体(SGIC)
<130> 32466-WO-PCT
<150> EP17165201.9
<151> 2017-04-06
<160> 111
<170> PatentIn version 3.5
<210> 1
<211> 5441
<212> DNA
<213> Artificial Sequence
<220>
<223> CAS9, including a C-terminal SV40 nuclear localization signal,
codon pair optimized for expression in S. cerevisiae; the
sequence includes the Kl11 promoter from K. lactis and GND2
terminator sequence from S. cerevisiae
<400> 1
ttttcttttt ttgcggtcac ccccatgtgg cggggaggca gaggagtagg tagagcaacg 60
aatcctacta tttatccaaa ttagtctagg aactcttttt ctagattttt tagatttgag 120
ggcaagcgct gttaacgact cagaaatgta agcactacgg agtagaacga gaaatccgcc 180
ataggtggaa atcctagcaa aatcttgctt accctagcta gcctcaggta agctagcctt 240
agcctgtcaa atttttttca aaatttggta agtttctact agcaaagcaa acacggttca 300
acaaaccgaa aactccactc attatacgtg gaaaccgaaa caaaaaaaca aaaaccaaaa 360
tactcgccaa tgagaaagtt gctgcgtttc tactttcgag gaagaggaac tgagaggatt 420
gactacgaaa ggggcaaaaa cgagtcgtat tctcccatta ttgtctgcta ccacgcggtc 480
tagtagaata agcaaccagt caacgctaag acaggtaatc aaaataccag tctgctggct 540
acgggctagt ttttacctct tttagaaccc actgtaaaag tccgttgtaa agcccgttct 600
cactgttggc gttttttttt ttttggttta gtttcttatt tttcattttt ttctttcatg 660
accaaaaaca aacaaatctc gcgatttgta ctgcggccac tggggcgtgg ccaaaaaaat 720
gacaaattta gaaaccttag tttctgattt ttcctgttat gaggagatat gataaaaaat 780
attactgctt tattgttttt tttttatcta ctgaaataga gaaacttacc caaggaggag 840
gcaaaaaaaa gagtatatat acagcagcta ccattcagat tttaatatat tcttttctct 900
tcttctacac tattattata ataattttac tatattcatt tttagcttaa aacctcatag 960
aatattattc ttcagtcact cgcttaaata cttatcaaaa atggacaaga aatactctat 1020
tggtttggat atcgggacca actccgtcgg ttgggctgtc atcaccgacg aatacaaggt 1080
tccatccaag aaattcaagg tcttgggtaa cactgacaga cactctatca agaagaattt 1140
gatcggtgct ttgttgttcg actccggtga aaccgctgaa gctaccagat tgaagcgtac 1200
cgctcgtcgt agatacacta gacgtaaaaa ccgtatttgt tacttgcaag aaatcttttc 1260
taacgaaatg gccaaggttg acgactcttt cttccacaga ttggaagaat ctttcttggt 1320
tgaagaagac aagaagcacg aaagacatcc aatcttcggt aacatcgttg acgaagttgc 1380
ttaccacgaa aaatacccta ccatctacca tttgagaaag aagttggtcg attccaccga 1440
caaggctgat ttgagattga tctatttggc cttggctcac atgatcaagt tcagaggtca 1500
cttcttgatt gaaggtgact tgaacccaga caactctgac gtcgacaaat tgttcatcca 1560
attggtccaa acctacaacc aattattcga ggaaaaccca attaacgctt ctggtgttga 1620
tgctaaggcc atcttatctg cccgtttgtc caagtctaga cgtttggaaa acttgattgc 1680
tcaattgcct ggtgaaaaga aaaacggttt gttcggtaac ttgatcgctt tgtccttggg 1740
tttgacccca aacttcaagt ccaacttcga cttggctgaa gatgccaagt tgcaattgtc 1800
caaggacacc tacgacgacg acttagacaa cttgttggct caaatcggtg accaatacgc 1860
cgacttgttc ttggctgcca aaaacttatc tgacgctatc ttgttgtctg acatcttgag 1920
agttaacact gaaattacca aggctccatt gtctgcttct atgatcaaaa gatacgacga 1980
acaccaccaa gatctgactt tgttgaaggc tttggttaga caacaattgc cagaaaagta 2040
caaggaaatc ttcttcgacc aatccaaaaa tggttacgcc ggttacattg acggtggtgc 2100
ttctcaggaa gaattctaca agttcatcaa gccaattttg gaaaagatgg atggtactga 2160
agaattattg gttaagttga acagagaaga cttattgaga aagcaacgta ccttcgataa 2220
cggttctatc ccacaccaaa tccacttggg tgaattgcac gccattttga gaagacagga 2280
agatttctat ccattcctaa aggacaacag agaaaagatc gaaaagatct taactttcag 2340
aatcccatac tacgtcggtc cattggccag aggtaattct agattcgctt ggatgaccag 2400
aaagtctgaa gaaaccatca ccccatggaa cttcgaagaa gtcgtcgaca agggtgcttc 2460
tgcccaatct ttcatcgaaa gaatgaccaa ctttgataag aacttgccaa acgagaaggt 2520
cttgccaaag cactctttgt tgtacgaata cttcaccgtc tacaacgaat taaccaaggt 2580
taaatacgtt actgaaggta tgagaaagcc agctttccta tccggtgaac aaaagaaggc 2640
tattgttgac ttgttgttta agaccaacag aaaggtcact gttaagcaat tgaaggaaga 2700
ctacttcaag aagattgaat gtttcgattc cgtcgaaatc tccggtgttg aagaccgttt 2760
caatgcttct ttgggcacct accacgattt gttaaagatc atcaaggaca aggacttttt 2820
agataacgaa gaaaacgaag acatcttgga agatatcgtt ttgaccttga ctcttttcga 2880
ggacagagaa atgattgaag agagattgaa gacctacgct cacttgttcg acgataaagt 2940
tatgaagcaa ctaaagagaa gaagatacac tggttggggt agattgtcca gaaagttgat 3000
taacggtatc agagacaagc aatccggtaa gactatttta gactttttga aatccgatgg 3060
tttcgctaac agaaacttta tgcaattgat tcacgacgat tctttgactt tcaaggaaga 3120
cattcaaaaa gcccaagtct ctggtcaagg tgattctttg cacgaacaca tcgctaactt 3180
ggctggttct ccagctatta agaagggtat cttacaaacc gtcaaggtcg ttgatgaatt 3240
ggtcaaagtc atgggtagac acaagccaga aaatattgtc atcgaaatgg ctagagaaaa 3300
ccaaactact caaaagggtc aaaagaactc tagagaacgt atgaagagaa ttgaagaagg 3360
tatcaaggag ttgggttctc aaattttgaa agaacaccca gtcgaaaaca ctcaattaca 3420
aaacgaaaag ctatacttgt actacttgca aaacggtcgt gacatgtacg tcgaccaaga 3480
attggatatc aacagattgt ctgactacga tgtcgatcat atcgtcccac aatcgttctt 3540
gaaggacgat tccattgaca acaaagtttt gactagatct gacaagaaca gaggtaagtc 3600
tgataacgtt ccatctgaag aagttgttaa gaagatgaag aactactgga gacaattgtt 3660
gaatgctaag ttgatcactc aaagaaagtt cgacaacttg accaaggctg aaagaggtgg 3720
tttgtccgaa ttggacaaag ccggtttcat caagagacaa ttagtcgaaa ctagacaaat 3780
caccaagcat gttgctcaaa tcttggattc cagaatgaac actaagtacg atgaaaacga 3840
caaactaatt agagaagtta aggtcatcac tttgaagtct aagttggttt ctgacttcag 3900
aaaggacttc caattttaca aggtcagaga aatcaacaac taccatcacg ctcacgatgc 3960
ctacttgaac gctgttgtcg gtactgcctt aatcaaaaag tacccaaagt tggaatctga 4020
attcgtttac ggtgactaca aggtttacga tgttagaaag atgatcgcca agtctgaaca 4080
agaaattggt aaggccactg ctaagtactt cttctactct aacatcatga actttttcaa 4140
gactgaaatc actttagcta acggtgaaat tagaaagcgt ccattgattg aaaccaatgg 4200
tgaaactggt gaaattgtct gggacaaggg tagagatttc gctaccgtca gaaaggtttt 4260
gtctatgcca caagttaaca tcgtcaagaa gactgaagtt caaactggtg gtttctctaa 4320
ggaatccatt ttgccaaaga gaaactctga caagttgatt gctagaaaga aggactggga 4380
tcctaagaag tacggtggtt tcgactctcc aactgttgct tactccgttt tggtcgttgc 4440
taaggttgaa aagggtaagt ctaagaagtt gaagtctgtt aaggaattgt tgggtatcac 4500
catcatggaa agatcctcct tcgaaaagaa cccaatcgac tttttggaag ctaagggtta 4560
caaggaagtc aagaaggatt tgatcattaa gttaccaaaa tactccttgt tcgaattgga 4620
aaacggtaga aagagaatgt tggcctccgc tggtgaacta caaaaaggta acgaattggc 4680
tttaccatct aagtacgtta acttcttgta cttggcttcc cactacgaaa agttgaaagg 4740
ttccccagaa gacaacgaac aaaagcaatt gtttgttgaa caacacaagc actacttgga 4800
tgaaattatt gaacaaatct ccgaattctc caagagagtc attttggctg atgctaactt 4860
agataaggtt ttatccgctt acaacaagca cagagacaaa ccaatcagag aacaagctga 4920
aaacatcatt catttgttca ctttaaccaa cttgggtgct ccagctgctt tcaaatactt 4980
cgacactacc attgacagaa agagatacac ttccaccaaa gaagttttag atgctacttt 5040
gattcaccaa tctattaccg gtttgtacga aaccagaatt gacttgtctc aattgggtgg 5100
tgattccaga gctgatccaa agaagaagag aaaggtgtaa aggagttaaa ggcaaagttt 5160
tcttttctag agccgttccc acaaataatt atacgtatat gcttcttttc gtttactata 5220
tatctatatt tacaagcctt tattcactga tgcaatttgt ttccaaatac ttttttggag 5280
atctcataac tagatatcat gatggcgcaa cttggcgcta tcttaattac tctggctgcc 5340
aggcccgtgt agagggccgc aagaccttct gtacgccata tagtctctaa gaacttgaac 5400
aagtttctag acctattgcc gcctttcgga tcgctattgt t 5441
<210> 2
<211> 11742
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid vector pCSN061
<400> 2
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accataaacg acattactat atatataata taggaagcat ttaatagaca gcatcgtaat 240
atatgtgtac tttgcagtta tgacgccaga tggcagtagt ggaagatatt ctttattgaa 300
aaatagcttg tcaccttacg tacaatcttg atccggagct tttctttttt tgccgattaa 360
gaattaattc ggtcgaaaaa agaaaaggag agggccaaga gggagggcat tggtgactat 420
tgagcacgtg agtatacgtg attaagcaca caaaggcagc ttggagtatg tctgttatta 480
atttcacagg tagttctggt ccattggtga aagtttgcgg cttgcagagc acagaggccg 540
cagaatgtgc tctagattcc gatgctgact tgctgggtat tatatgtgtg cccaatagaa 600
agagaacaat tgacccggtt attgcaagga aaatttcaag tcttgtaaaa gcatataaaa 660
atagttcagg cactccgaaa tacttggttg gcgtgtttcg taatcaacct aaggaggatg 720
ttttggctct ggtcaatgat tacggcattg atatcgtcca actgcatgga gatgagtcgt 780
ggcaagaata ccaagagttc ctcggtttgc cagttattaa aagactcgta tttccaaaag 840
actgcaacat actactcagt gcagcttcac agaaacctca ttcgtttatt cccttgtttg 900
attcagaagc aggtgggaca ggtgaacttt tggattggaa ctcgatttct gactgggttg 960
gaaggcaaga gagccccgaa agcttacatt ttatgttagc tggtggactg acgccagaaa 1020
atgttggtga tgcgcttaga ttaaatggcg ttattggtgt tgatgtaagc ggaggtgtgg 1080
agacaaatgg tgtaaaagac tctaacaaaa tagcaaattt cgtcaaaaat gctaagaaat 1140
aggttattac tgagtagtat ttatttaagt attgtttgtg cacttgccta tgcggtgtga 1200
aataccgcac agatgcgtaa ggagaaaata ccgcatcagg aaattgtaaa cgttaatatt 1260
ttgttaaaat tcgcgttaaa tttttgttaa atcagctcat tttttaacca ataggccgaa 1320
atcggcaaaa tcccttataa atcaaaagaa tagaccgaga tagggttgag tgttgttcca 1380
gtttggaaca agagtccact attaaagaac gtggactcca acgtcaaagg gcgaaaaacc 1440
gtctatcagg gcgatggccc actacgtgaa ccatcaccct aatcaagttt tttggggtcg 1500
aggtgccgta aagcactaaa tcggaaccct aaagggagcc cccgatttag agcttgacgg 1560
ggaaagccgg cgaacgtggc gagaaaggaa gggaagaaag cgaaaggagc gggcgctagg 1620
gcgctggcaa gtgtagcggt cacgctgcgc gtaaccacca cacccgccgc gcttaatgcg 1680
ccgctacagg gcgcgtcgcg ccattcgcca ttcaggctgc gcaactgttg ggaagggcga 1740
tcggtgcggg cctcttcgct attacgccag ctggcgaaag ggggatgtgc tgcaaggcga 1800
ttaagttggg taacgccagg gttttcccag tcacgacgtt gtaaaacgac ggccagtgag 1860
cgcgcgtaat acgactcact atagggcgaa ttgggtacct tttctttttt tgcggtcacc 1920
cccatgtggc ggggaggcag aggagtaggt agagcaacga atcctactat ttatccaaat 1980
tagtctagga actctttttc tagatttttt agatttgagg gcaagcgctg ttaacgactc 2040
agaaatgtaa gcactacgga gtagaacgag aaatccgcca taggtggaaa tcctagcaaa 2100
atcttgctta ccctagctag cctcaggtaa gctagcctta gcctgtcaaa tttttttcaa 2160
aatttggtaa gtttctacta gcaaagcaaa cacggttcaa caaaccgaaa actccactca 2220
ttatacgtgg aaaccgaaac aaaaaaacaa aaaccaaaat actcgccaat gagaaagttg 2280
ctgcgtttct actttcgagg aagaggaact gagaggattg actacgaaag gggcaaaaac 2340
gagtcgtatt ctcccattat tgtctgctac cacgcggtct agtagaataa gcaaccagtc 2400
aacgctaaga caggtaatca aaataccagt ctgctggcta cgggctagtt tttacctctt 2460
ttagaaccca ctgtaaaagt ccgttgtaaa gcccgttctc actgttggcg tttttttttt 2520
tttggtttag tttcttattt ttcatttttt tctttcatga ccaaaaacaa acaaatctcg 2580
cgatttgtac tgcggccact ggggcgtggc caaaaaaatg acaaatttag aaaccttagt 2640
ttctgatttt tcctgttatg aggagatatg ataaaaaata ttactgcttt attgtttttt 2700
ttttatctac tgaaatagag aaacttaccc aaggaggagg caaaaaaaag agtatatata 2760
cagcagctac cattcagatt ttaatatatt cttttctctt cttctacact attattataa 2820
taattttact atattcattt ttagcttaaa acctcataga atattattct tcagtcactc 2880
gcttaaatac ttatcaaaaa tggacaagaa atactctatt ggtttggata tcgggaccaa 2940
ctccgtcggt tgggctgtca tcaccgacga atacaaggtt ccatccaaga aattcaaggt 3000
cttgggtaac actgacagac actctatcaa gaagaatttg atcggtgctt tgttgttcga 3060
ctccggtgaa accgctgaag ctaccagatt gaagcgtacc gctcgtcgta gatacactag 3120
acgtaaaaac cgtatttgtt acttgcaaga aatcttttct aacgaaatgg ccaaggttga 3180
cgactctttc ttccacagat tggaagaatc tttcttggtt gaagaagaca agaagcacga 3240
aagacatcca atcttcggta acatcgttga cgaagttgct taccacgaaa aataccctac 3300
catctaccat ttgagaaaga agttggtcga ttccaccgac aaggctgatt tgagattgat 3360
ctatttggcc ttggctcaca tgatcaagtt cagaggtcac ttcttgattg aaggtgactt 3420
gaacccagac aactctgacg tcgacaaatt gttcatccaa ttggtccaaa cctacaacca 3480
attattcgag gaaaacccaa ttaacgcttc tggtgttgat gctaaggcca tcttatctgc 3540
ccgtttgtcc aagtctagac gtttggaaaa cttgattgct caattgcctg gtgaaaagaa 3600
aaacggtttg ttcggtaact tgatcgcttt gtccttgggt ttgaccccaa acttcaagtc 3660
caacttcgac ttggctgaag atgccaagtt gcaattgtcc aaggacacct acgacgacga 3720
cttagacaac ttgttggctc aaatcggtga ccaatacgcc gacttgttct tggctgccaa 3780
aaacttatct gacgctatct tgttgtctga catcttgaga gttaacactg aaattaccaa 3840
ggctccattg tctgcttcta tgatcaaaag atacgacgaa caccaccaag atctgacttt 3900
gttgaaggct ttggttagac aacaattgcc agaaaagtac aaggaaatct tcttcgacca 3960
atccaaaaat ggttacgccg gttacattga cggtggtgct tctcaggaag aattctacaa 4020
gttcatcaag ccaattttgg aaaagatgga tggtactgaa gaattattgg ttaagttgaa 4080
cagagaagac ttattgagaa agcaacgtac cttcgataac ggttctatcc cacaccaaat 4140
ccacttgggt gaattgcacg ccattttgag aagacaggaa gatttctatc cattcctaaa 4200
ggacaacaga gaaaagatcg aaaagatctt aactttcaga atcccatact acgtcggtcc 4260
attggccaga ggtaattcta gattcgcttg gatgaccaga aagtctgaag aaaccatcac 4320
cccatggaac ttcgaagaag tcgtcgacaa gggtgcttct gcccaatctt tcatcgaaag 4380
aatgaccaac tttgataaga acttgccaaa cgagaaggtc ttgccaaagc actctttgtt 4440
gtacgaatac ttcaccgtct acaacgaatt aaccaaggtt aaatacgtta ctgaaggtat 4500
gagaaagcca gctttcctat ccggtgaaca aaagaaggct attgttgact tgttgtttaa 4560
gaccaacaga aaggtcactg ttaagcaatt gaaggaagac tacttcaaga agattgaatg 4620
tttcgattcc gtcgaaatct ccggtgttga agaccgtttc aatgcttctt tgggcaccta 4680
ccacgatttg ttaaagatca tcaaggacaa ggacttttta gataacgaag aaaacgaaga 4740
catcttggaa gatatcgttt tgaccttgac tcttttcgag gacagagaaa tgattgaaga 4800
gagattgaag acctacgctc acttgttcga cgataaagtt atgaagcaac taaagagaag 4860
aagatacact ggttggggta gattgtccag aaagttgatt aacggtatca gagacaagca 4920
atccggtaag actattttag actttttgaa atccgatggt ttcgctaaca gaaactttat 4980
gcaattgatt cacgacgatt ctttgacttt caaggaagac attcaaaaag cccaagtctc 5040
tggtcaaggt gattctttgc acgaacacat cgctaacttg gctggttctc cagctattaa 5100
gaagggtatc ttacaaaccg tcaaggtcgt tgatgaattg gtcaaagtca tgggtagaca 5160
caagccagaa aatattgtca tcgaaatggc tagagaaaac caaactactc aaaagggtca 5220
aaagaactct agagaacgta tgaagagaat tgaagaaggt atcaaggagt tgggttctca 5280
aattttgaaa gaacacccag tcgaaaacac tcaattacaa aacgaaaagc tatacttgta 5340
ctacttgcaa aacggtcgtg acatgtacgt cgaccaagaa ttggatatca acagattgtc 5400
tgactacgat gtcgatcata tcgtcccaca atcgttcttg aaggacgatt ccattgacaa 5460
caaagttttg actagatctg acaagaacag aggtaagtct gataacgttc catctgaaga 5520
agttgttaag aagatgaaga actactggag acaattgttg aatgctaagt tgatcactca 5580
aagaaagttc gacaacttga ccaaggctga aagaggtggt ttgtccgaat tggacaaagc 5640
cggtttcatc aagagacaat tagtcgaaac tagacaaatc accaagcatg ttgctcaaat 5700
cttggattcc agaatgaaca ctaagtacga tgaaaacgac aaactaatta gagaagttaa 5760
ggtcatcact ttgaagtcta agttggtttc tgacttcaga aaggacttcc aattttacaa 5820
ggtcagagaa atcaacaact accatcacgc tcacgatgcc tacttgaacg ctgttgtcgg 5880
tactgcctta atcaaaaagt acccaaagtt ggaatctgaa ttcgtttacg gtgactacaa 5940
ggtttacgat gttagaaaga tgatcgccaa gtctgaacaa gaaattggta aggccactgc 6000
taagtacttc ttctactcta acatcatgaa ctttttcaag actgaaatca ctttagctaa 6060
cggtgaaatt agaaagcgtc cattgattga aaccaatggt gaaactggtg aaattgtctg 6120
ggacaagggt agagatttcg ctaccgtcag aaaggttttg tctatgccac aagttaacat 6180
cgtcaagaag actgaagttc aaactggtgg tttctctaag gaatccattt tgccaaagag 6240
aaactctgac aagttgattg ctagaaagaa ggactgggat cctaagaagt acggtggttt 6300
cgactctcca actgttgctt actccgtttt ggtcgttgct aaggttgaaa agggtaagtc 6360
taagaagttg aagtctgtta aggaattgtt gggtatcacc atcatggaaa gatcctcctt 6420
cgaaaagaac ccaatcgact ttttggaagc taagggttac aaggaagtca agaaggattt 6480
gatcattaag ttaccaaaat actccttgtt cgaattggaa aacggtagaa agagaatgtt 6540
ggcctccgct ggtgaactac aaaaaggtaa cgaattggct ttaccatcta agtacgttaa 6600
cttcttgtac ttggcttccc actacgaaaa gttgaaaggt tccccagaag acaacgaaca 6660
aaagcaattg tttgttgaac aacacaagca ctacttggat gaaattattg aacaaatctc 6720
cgaattctcc aagagagtca ttttggctga tgctaactta gataaggttt tatccgctta 6780
caacaagcac agagacaaac caatcagaga acaagctgaa aacatcattc atttgttcac 6840
tttaaccaac ttgggtgctc cagctgcttt caaatacttc gacactacca ttgacagaaa 6900
gagatacact tccaccaaag aagttttaga tgctactttg attcaccaat ctattaccgg 6960
tttgtacgaa accagaattg acttgtctca attgggtggt gattccagag ctgatccaaa 7020
gaagaagaga aaggtgtaaa ggagttaaag gcaaagtttt cttttctaga gccgttccca 7080
caaataatta tacgtatatg cttcttttcg tttactatat atctatattt acaagccttt 7140
attcactgat gcaatttgtt tccaaatact tttttggaga tctcataact agatatcatg 7200
atggcgcaac ttggcgctat cttaattact ctggctgcca ggcccgtgta gagggccgca 7260
agaccttctg tacgccatat agtctctaag aacttgaaca agtttctaga cctattgccg 7320
cctttcggat cgctattgtt gcggccgcca gctgaagctt cgtacgctgc aggtcgacga 7380
attctaccgt tcgtataatg tatgctatac gaagttatag atctgtttag cttgcctcgt 7440
ccccgccggg tcacccggcc agcgacatgg aggcccagaa taccctcctt gacagtcttg 7500
acgtgcgcag ctcaggggca tgatgtgact gtcgcccgta catttagccc atacatcccc 7560
atgtataatc atttgcatcc atacattttg atggccgcac ggcgcgaagc aaaaattacg 7620
gctcctcgct gcagacctgc gagcagggaa acgctcccct cacagacgcg ttgaattgtc 7680
cccacgccgc gcccctgtag agaaatataa aaggttagga tttgccactg aggttcttct 7740
ttcatatact tccttttaaa atcttgctag gatacagttc tcacatcaca tccgaacata 7800
aacaaccatg ggtaaggaaa agactcacgt ttcgaggccg cgattaaatt ccaacatgga 7860
tgctgattta tatgggtata aatgggctcg cgataatgtc gggcaatcag gtgcgacaat 7920
ctatcgattg tatgggaagc ccgatgcgcc agagttgttt ctgaaacatg gcaaaggtag 7980
cgttgccaat gatgttacag atgagatggt cagactaaac tggctgacgg aatttatgcc 8040
tcttccgacc atcaagcatt ttatccgtac tcctgatgat gcatggttac tcaccactgc 8100
gatccccggc aaaacagcat tccaggtatt agaagaatat cctgattcag gtgaaaatat 8160
tgttgatgcg ctggcagtgt tcctgcgccg gttgcattcg attcctgttt gtaattgtcc 8220
ttttaacagc gatcgcgtat ttcgtctcgc tcaggcgcaa tcacgaatga ataacggttt 8280
ggttgatgcg agtgattttg atgacgagcg taatggctgg cctgttgaac aagtctggaa 8340
agaaatgcat aagcttttgc cattctcacc ggattcagtc gtcactcatg gtgatttctc 8400
acttgataac cttatttttg acgaggggaa attaataggt tgtattgatg ttggacgagt 8460
cggaatcgca gaccgatacc aggatcttgc catcctatgg aactgcctcg gtgagttttc 8520
tccttcatta cagaaacggc tttttcaaaa atatggtatt gataatcctg atatgaataa 8580
attgcagttt catttgatgc tcgatgagtt tttctaatca gtactgacaa taaaaagatt 8640
cttgttttca agaacttgtc atttgtatag tttttttata ttgtagttgt tctattttaa 8700
tcaaatgtta gcgtgattta tatttttttt cgcctcgaca tcatctgccc agatgcgaag 8760
ttaagtgcgc agaaagtaat atcatgcgtc aatcgtatgt gaatgctggt cgctatactg 8820
ctgtcgattc gatactaacg ccgccatcca gtgtcgaaaa cgagctcata acttcgtata 8880
atgtatgcta tacgaacggt agaattcgaa tcagatccac tagtggccta tgcggccgcc 8940
accgcggtgg agctccagct tttgttccct ttagtgaggg ttaattgcgc gcttggcgta 9000
atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc cacacaacat 9060
aggagccgga agcataaagt gtaaagcctg gggtgcctaa tgagtgaggt aactcacatt 9120
aattgcgttg cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc agctgcatta 9180
atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt ccgcttcctc 9240
gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa 9300
ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa 9360
aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct 9420
ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac 9480
aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc 9540
gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg tggcgctttc 9600
tcatagctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg 9660
tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga 9720
gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta acaggattag 9780
cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta actacggcta 9840
cactagaagg acagtatttg gtatctgcgc tctgctgaag ccagttacct tcggaaaaag 9900
agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt tttttgtttg 9960
caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga tcttttctac 10020
ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca tgagattatc 10080
aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat caatctaaag 10140
tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg cacctatctc 10200
agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt agataactac 10260
gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag acccacgctc 10320
accggctcca gatttatcag caataaacca gccagccgga agggccgagc gcagaagtgg 10380
tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag ctagagtaag 10440
tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctacaggca tcgtggtgtc 10500
acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa ggcgagttac 10560
atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga tcgttgtcag 10620
aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata attctcttac 10680
tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca agtcattctg 10740
agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaatacggg ataataccgc 10800
gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg ggcgaaaact 10860
ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg cacccaactg 10920
atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag gaaggcaaaa 10980
tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac tcttcctttt 11040
tcaatattat tgaagcattt atcagggtta ttgtctcatg agcggataca tatttgaatg 11100
tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag tgccacctgg 11160
gtccttttca tcacgtgcta taaaaataat tataatttaa attttttaat ataaatatat 11220
aaattaaaaa tagaaagtaa aaaaagaaat taaagaaaaa atagtttttg ttttccgaag 11280
atgtaaaaga ctctaggggg atcgccaaca aatactacct tttatcttgc tcttcctgct 11340
ctcaggtatt aatgccgaat tgtttcatct tgtctgtgta gaagaccaca cacgaaaatc 11400
ctgtgatttt acattttact tatcgttaat cgaatgtata tctatttaat ctgcttttct 11460
tgtctaataa atatatatgt aaagtacgct ttttgttgaa attttttaaa cctttgttta 11520
tttttttttc ttcattccgt aactcttcta ccttctttat ttactttcta aaatccaaat 11580
acaaaacata aaaataaata aacacagagt aaattcccaa attattccat cattaaaaga 11640
tacgaggcgc gtgtaagtta caggcaagcg atccgtccta agaaaccatt attatcatga 11700
cattaaccta taaaaatagg cgtatcacga ggccctttcg tc 11742
<210> 3
<211> 5712
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid vector pRN1120
<400> 3
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accatatcga ctacgtcgta aggccgtttc tgacagagta aaattcttga gggaactttc 240
accattatgg gaaatggttc aagaaggtat tgacttaaac tccatcaaat ggtcaggtca 300
ttgagtgttt tttatttgtt gtattttttt ttttttagag aaaatcctcc aatatcaaat 360
taggaatcgt agtttcatga ttttctgtta cacctaactt tttgtgtggt gccctcctcc 420
ttgtcaatat taatgttaaa gtgcaattct ttttccttat cacgttgagc cattagtatc 480
aatttgctta cctgtattcc tttactatcc tcctttttct ccttcttgat aaatgtatgt 540
agattgcgta tatagtttcg tctaccctat gaacatattc cattttgtaa tttcgtgtcg 600
tttctattat gaatttcatt tataaagttt atgtacacct aggatccgtc gacactggat 660
ggcggcgtta gtatcgaatc gacagcagta tagcgaccag cattcacata cgattgacgc 720
atgatattac tttctgcgca cttaacttcg catctgggca gatgatgtcg aggcgaaaaa 780
aaatataaat cacgctaaca tttgattaaa atagaacaac tacaatataa aaaaactata 840
caaatgacaa gttcttgaaa acaagaatct ttttattgtc agtactaggg gcagggcatg 900
ctcatgtaga gcgcctgctc gccgtccgag gcggtgccgt cgtacagggc ggtgtccagg 960
ccgcagaggg tgaaccccat ccgccggtac gcgtggatcg ccggtgcgtt gacgttggtg 1020
acctccagcc agaggtgccc ggcgccccgc tcgcgggcga actccgtcgc gagccccatc 1080
aacgcgcgcc cgaccccgtg cccccggtgc tccggggcga cctcgatgtc ctcgacggtc 1140
agccggcggt tccagccgga gtacgagacg accacgaagc ccgccaggtc gccgtcgtcc 1200
ccgtacgcga cgaacgtccg ggagtccggg tcgccgtcct ccccggcgtc cgattcgtcg 1260
tccgattcgt cgtcggggaa caccttggtc aggggcgggt ccaccggcac ctcccgcagg 1320
gtgaagccgt ccccggtggc ggtgacgcgg aagacggtgt cggtggtgaa ggacccatcc 1380
agtgcctcga tggcctcggc gtcccccggg acactggtgc ggtaccggta agccgtgtcg 1440
tcaagagtgg tcattttaca tggttgttta tgttcggatg tgatgtgaga actgtatcct 1500
agcaagattt taaaaggaag tatatgaaag aagaacctca gtggcaaatc ctaacctttt 1560
atatttctct acaggggcgc ggcgtgggga caattcaacg cgtctgtgag gggagcgttt 1620
ccctgctcgc aggtctgcag cgaggagccg taatttttgc ttcgcgccgt gcggccatca 1680
aaatgtatgg atgcaaatga ttatacatgg ggatgtatgg gctaaatgta cgggcgacag 1740
tcacatcatg cccctgagct gcgcacgtca agactgtcaa ggagggtatt ctgggcctcc 1800
atgtcgctgg ccgggtgacc cggcggggac gaggccttaa gttcgaacgt acgagctccg 1860
gcattgcgaa taccgctttc cacaaacatt gctcaaaagt atctctttgc tatatatctc 1920
tgtgctatat ccctatataa cctacccatc cacctttcgc tccttgaact tgcatctaaa 1980
ctcgacctct acatttttta tgtttatctc tagtattact ctttagacaa aaaaattgta 2040
gtaagaacta ttcatagagt gaatcgaaaa caatacgaaa atgtaaacat ttcctatacg 2100
tagtatatag agacaaaata gaagaaaccg ttcataattt tctgaccaat gaagaatcat 2160
caacgctatc actttctgtt cacaaagtat gcgcaatcca catcggtata gaatataatc 2220
ggggatgcct ttatcttgaa aaaatgcacc cgcagcttcg ctagtaatca gtaaacgcgg 2280
gaagtggagt caggcttttt ttatggaaga gaaaatagac accaaagtag ccttcttcta 2340
accttaacgg acctacagtg caaaaagtta tcaagagact gcattataga gcgcacaaag 2400
gagaaaaaaa gtaatctaag atgctttgtt agaaaaatag cgctctcggg atgcattttt 2460
gtagaacaaa aaagaagtat agattctttg ttggtaaaat agcgctctcg cgttgcattt 2520
ctgttctgta aaaatgcagc tcagattctt tgtttgaaaa attagcgctc tcgcgttgca 2580
tttttgtttt acaaaaatga agcacagatt cttcgttggt aaaatagcgc tttcgcgttg 2640
catttctgtt ctgtaaaaat gcagctcaga ttctttgttt gaaaaattag cgctctcgcg 2700
ttgcattttt gttctacaaa atgaagcaca gatgcttcgt taacaaagat atgctattga 2760
agtgcaagat ggaaacgcag aaaatgaacc ggggatgcga cgtgcaagat tacctatgca 2820
atagatgcaa tagtttctcc aggaaccgaa atacatacat tgtcttccgt aaagcgctag 2880
actatatatt attatacagg ttcaaatata ctatctgttt cagggaaaac tcccaggttc 2940
ggatgttcaa aattcaatga tgggtaacaa gtacgatcgt aaatctgtaa aacagtttgt 3000
cggatattag gctgtatctc ctcaaagcgt attcgaatat cattgagaag ctgcagcgtc 3060
acatcggata ataatgatgg cagccattgt agaagtgcct tttgcatttc tagtctcttt 3120
ctcggtctag ctagttttac tacatcgcga agatagaatc ttagatcaca ctgcctttgc 3180
tgagctggat caatagagta acaaaagagt ggtaaggcct cgttaaagga caaggacctg 3240
agcggaagtg tatcgtacag tagacggagt atactaggta tagtctatag tccgtggaat 3300
taattctcat gtttgacagc ttatcatcga taatccggag ctagcatgcg gccgctctag 3360
aactagtgga tcccccgggc tgcaggaatt cgatatcaag cttatcgata ccgtcgacct 3420
cgaggggggg cccggtaccc agcttttgtt ccctttagtg agggttaatt ccgagcttgg 3480
cgtaatcatg gtcatagctg tttcctgtgt gaaattgtta tccgctcaca attccacaca 3540
acataggagc cggaagcata aagtgtaaag cctggggtgc ctaatgagtg aggtaactca 3600
cattaattgc gttgcgctca ctgcccgctt tccagtcggg aaacctgtcg tgccagctgc 3660
attaatgaat cggccaacgc gcggggagag gcggtttgcg tattgggcgc tcttccgctt 3720
cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta tcagctcact 3780
caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag aacatgtgag 3840
caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg tttttccata 3900
ggctcggccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg tggcgaaacc 3960
cgacaggact ataaagatac caggcgttcc cccctggaag ctccctcgtg cgctctcctg 4020
ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga agcgtggcgc 4080
tttctcaatg ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc tccaagctgg 4140
gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt aactatcgtc 4200
ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact ggtaacagga 4260
ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg cctaactacg 4320
gctacactag aaggacagta tttggtatct gcgctctgct gaagccagtt accttcggaa 4380
aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt ggtttttttg 4440
tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct ttgatctttt 4500
ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg gtcatgagat 4560
tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt aaatcaatct 4620
aaagtatata tgagtaaact tggtctgaca gttaccaatg cttaatcagt gaggcaccta 4680
tctcagcgat ctgtctattt cgttcatcca tagttgcctg actgcccgtc gtgtagataa 4740
ctacgatacg ggagggctta ccatctggcc ccagtgctgc aatgataccg cgagacccac 4800
gctcaccggc tccagattta tcagcaataa accagccagc cggaagggcc gagcgcagaa 4860
gtggtcctgc aactttatcc gcctccatcc agtctattaa ttgttgccgg gaagctagag 4920
taagtagttc gccagttaat agtttgcgca acgttgttgc cattgctaca ggcatcgtgg 4980
tgtcacgctc gtcgtttggt atggcttcat tcagctccgg ttcccaacga tcaaggcgag 5040
ttacatgatc ccccatgttg tgaaaaaaag cggttagctc cttcggtcct ccgatcgttg 5100
tcagaagtaa gttggccgca gtgttatcac tcatggttat ggcagcactg cataattctc 5160
ttactgtcat gccatccgta agatgctttt ctgtgactgg tgagtactca accaagtcat 5220
tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata cgggataata 5280
ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa 5340
aactctcaag gatcttaccg ctgttgagat ccagttcgat gtaacccact cgtgcaccca 5400
actgatcttc agcatctttt actttcacca gcgtttctgg gtgagcaaaa acaggaaggc 5460
aaaatgccgc aaaaaaggga ataagggcga cacggaaatg ttgaatactc atactcttcc 5520
tttttcaata ttattgaagc atttatcagg gttattgtct catgagcgga tacatatttg 5580
aatgtattta gaaaaataaa caaatagggg ttccgcgcac atttccccga aaagtgccac 5640
ctgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg cgtatcacga 5700
ggccctttcg tc 5712
<210> 4
<211> 588
<212> DNA
<213> Artificial Sequence
<220>
<223> gBlock of the guide RNA expression cassette to target CAS9 to the
INT1 locus
<400> 4
tatagtccgt ggaattaatt ctcatgtttg acagcttatc atcgataatc cggagctagc 60
atgcggccgc tctagaacta gtggatcccc cgggctgcag tctttgaaaa gataatgtat 120
gattatgctt tcactcatat ttatacagaa acttgatgtt ttctttcgag tatatacaag 180
gtgattacat gtacgtttga agtacaactc tagattttgt agtgccctct tgggctagcg 240
gtaaaggtgc gcattttttc acaccctaca atgttctgtt caaaagattt tggtcaaacg 300
ctgtagaagt gaaagttggt gcgcatgttt cggcgttcga aacttctccg cagtgaaaga 360
taaatgatct attagaacca gggaggtccg ttttagagct agaaatagca agttaaaata 420
aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtggtgctt tttttgtttt 480
ttatgtctgg ggggcccggt acccagcttt tgttcccttt agtgagggtt aattccgagc 540
ttggcgtaat catggtcata gctgtttcct gtgtgaaatt gttatccg 588
<210> 5
<211> 588
<212> DNA
<213> Artificial Sequence
<220>
<223> gBlock of the guide RNA expression cassette to target CAS9 to the
INT59 locus
<400> 5
tatagtccgt ggaattaatt ctcatgtttg acagcttatc atcgataatc cggagctagc 60
atgcggccgc tctagaacta gtggatcccc cgggctgcag tctttgaaaa gataatgtat 120
gattatgctt tcactcatat ttatacagaa acttgatgtt ttctttcgag tatatacaag 180
gtgattacat gtacgtttga agtacaactc tagattttgt agtgccctct tgggctagcg 240
gtaaaggtgc gcattttttc acaccctaca atgttctgtt caaaagattt tggtcaaacg 300
ctgtagaagt gaaagttggt gcgcatgttt cggcgttcga aacttctccg cagtgaaaga 360
taaatgatca gaaaactctt agcttttccg ttttagagct agaaatagca agttaaaata 420
aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtggtgctt tttttgtttt 480
ttatgtctgg ggggcccggt acccagcttt tgttcccttt agtgagggtt aattccgagc 540
ttggcgtaat catggtcata gctgtttcct gtgtgaaatt gttatccg 588
<210> 6
<211> 588
<212> DNA
<213> Artificial Sequence
<220>
<223> gBlock of the guide RNA expression cassette to target CAS9 to the
YPRCtau3 locus
<400> 6
tatagtccgt ggaattaatt ctcatgtttg acagcttatc atcgataatc cggagctagc 60
atgcggccgc tctagaacta gtggatcccc cgggctgcag tctttgaaaa gataatgtat 120
gattatgctt tcactcatat ttatacagaa acttgatgtt ttctttcgag tatatacaag 180
gtgattacat gtacgtttga agtacaactc tagattttgt agtgccctct tgggctagcg 240
gtaaaggtgc gcattttttc acaccctaca atgttctgtt caaaagattt tggtcaaacg 300
ctgtagaagt gaaagttggt gcgcatgttt cggcgttcga aacttctccg cagtgaaaga 360
taaatgatca gaaaactctt agcttttccg ttttagagct agaaatagca agttaaaata 420
aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtggtgctt tttttgtttt 480
ttatgtctgg ggggcccggt acccagcttt tgttcccttt agtgagggtt aattccgagc 540
ttggcgtaat catggtcata gctgtttcct gtgtgaaatt gttatccg 588
<210> 7
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> guide sequence of the INT1 integration site
<400> 7
tattagaacc agggaggtcc 20
<210> 8
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> guide sequence of the INT59 integration site
<400> 8
agaaaactct tagcttttcc 20
<210> 9
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> guide sequence of the YPRCtau3 integration site
<400> 9
caatatggta tgccgagtct 20
<210> 10
<211> 77
<212> DNA
<213> Artificial Sequence
<220>
<223> FW PCR primer to obtain INT1 SGIC donor DNA sequence for
integration, 0 bp deletion
<400> 10
acttctctac attctctgac tttttaaaac tgtgtactgg cgaccaatcg tctttgaaaa 60
gataatgtat gattatg 77
<210> 11
<211> 75
<212> DNA
<213> Artificial Sequence
<220>
<223> REV PCR primer to obtain INT1 SGIC donor DNA sequence for
integration, 0 bp deletion
<400> 11
ggaaattttc aaaggcgttg gatcaaaaaa taggccttta tttcatcgcg agacataaaa 60
aacaaaaaaa gcacc 75
<210> 12
<211> 77
<212> DNA
<213> Artificial Sequence
<220>
<223> FW PCR primer to obtain INT1 SGIC donor DNA sequence for
integration, 1 kbp deletion
<400> 12
cttcatgcca gcaatagttg cgtgctgagc tcaacagtgc ccaacccttg tctttgaaaa 60
gataatgtat gattatg 77
<210> 13
<211> 75
<212> DNA
<213> Artificial Sequence
<220>
<223> REV PCR primer to obtain INT1 SGIC donor DNA sequence for
integration, 1 kbp deletion
<400> 13
gaaaagcact cctttagtac cactcaacaa gttgtctgat gacaaagaat agacataaaa 60
aacaaaaaaa gcacc 75
<210> 14
<211> 77
<212> DNA
<213> Artificial Sequence
<220>
<223> FW PCRprimer to obtain INT59 SGIC donor DNA sequence for
integration, 0 bp deletion
<400> 14
cgccaagagc ccaagaaaga gacacaaaac tacgtgggat aagcttgggg tctttgaaaa 60
gataatgtat gattatg 77
<210> 15
<211> 75
<212> DNA
<213> Artificial Sequence
<220>
<223> REV PCR primer to obtain INT59 SGIC donor DNA sequence for
integration, 0 bp deletion
<400> 15
tattgcggga ttttttggtg ccgtacgccg gagccgacgg aggtaagtca agacataaaa 60
aacaaaaaaa gcacc 75
<210> 16
<211> 77
<212> DNA
<213> Artificial Sequence
<220>
<223> FW PCR primer to obtain INT59 SGIC donor DNA sequence for
integration, 1 kbp deletion
<400> 16
acgaggtgaa gggcaaaggt gaattaacca aagtgaagag gacgacgtag tctttgaaaa 60
gataatgtat gattatg 77
<210> 17
<211> 75
<212> DNA
<213> Artificial Sequence
<220>
<223> REV PCR primer to obtain INT59 SGIC donor DNA sequence for
integration, 1 kbp deletion
<400> 17
tgatatgagt tgtggtgatt ggagagagta aaagaaagaa tgatagatgc agacataaaa 60
aacaaaaaaa gcacc 75
<210> 18
<211> 77
<212> DNA
<213> Artificial Sequence
<220>
<223> FW PCR primer to obtain YPRCtau3 SGIC donor DNA sequence for
integration, 0 bp deletion
<400> 18
catcttttaa tgcctactct tttgatgttc acttacatgt tacaatgaag tctttgaaaa 60
gataatgtat gattatg 77
<210> 19
<211> 75
<212> DNA
<213> Artificial Sequence
<220>
<223> REV PCR primer to obtain YPRCtau3 SGIC donor DNA sequence for
integration, 0 bp deletion
<400> 19
gcccctctta tacgattata ttaagatcca tattcaacct tcattaatac agacataaaa 60
aacaaaaaaa gcacc 75
<210> 20
<211> 77
<212> DNA
<213> Artificial Sequence
<220>
<223> FW PCR primer to obtain YPRCtau3 SGIC donor DNA sequence for
integration, 1 kbp deletion
<400> 20
tcatacgatt tccacatgtg tctcatatat attttatgtt taggttaata tctttgaaaa 60
gataatgtat gattatg 77
<210> 21
<211> 75
<212> DNA
<213> Artificial Sequence
<220>
<223> REV PCR primer to obtain YPRCtau3 SGIC donor DNA sequence for
integration, 1 kbp deletion
<400> 21
cttatgtatt tttaatcgtc cttgtatgga agtatcaaag gggacgttct agacataaaa 60
aacaaaaaaa gcacc 75
<210> 22
<211> 488
<212> DNA
<213> Artificial Sequence
<220>
<223> INT1 SGIC sequence for integration, 0 bp deletion
<400> 22
acttctctac attctctgac tttttaaaac tgtgtactgg cgaccaatcg tctttgaaaa 60
gataatgtat gattatgctt tcactcatat ttatacagaa acttgatgtt ttctttcgag 120
tatatacaag gtgattacat gtacgtttga agtacaactc tagattttgt agtgccctct 180
tgggctagcg gtaaaggtgc gcattttttc acaccctaca atgttctgtt caaaagattt 240
tggtcaaacg ctgtagaagt gaaagttggt gcgcatgttt cggcgttcga aacttctccg 300
cagtgaaaga taaatgatct attagaacca gggaggtccg ttttagagct agaaatagca 360
agttaaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtggtgctt 420
tttttgtttt ttatgtctcg cgatgaaata aaggcctatt ttttgatcca acgcctttga 480
aaatttcc 488
<210> 23
<211> 488
<212> DNA
<213> Artificial Sequence
<220>
<223> INT1 SGIC sequence for integration, 1 kb deletion
<400> 23
cttcatgcca gcaatagttg cgtgctgagc tcaacagtgc ccaacccttg tctttgaaaa 60
gataatgtat gattatgctt tcactcatat ttatacagaa acttgatgtt ttctttcgag 120
tatatacaag gtgattacat gtacgtttga agtacaactc tagattttgt agtgccctct 180
tgggctagcg gtaaaggtgc gcattttttc acaccctaca atgttctgtt caaaagattt 240
tggtcaaacg ctgtagaagt gaaagttggt gcgcatgttt cggcgttcga aacttctccg 300
cagtgaaaga taaatgatct attagaacca gggaggtccg ttttagagct agaaatagca 360
agttaaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtggtgctt 420
tttttgtttt ttatgtctat tctttgtcat cagacaactt gttgagtggt actaaaggag 480
tgcttttc 488
<210> 24
<211> 488
<212> DNA
<213> Artificial Sequence
<220>
<223> INT59 SGIC sequence for integration, 0 bp deletion
<400> 24
cgccaagagc ccaagaaaga gacacaaaac tacgtgggat aagcttgggg tctttgaaaa 60
gataatgtat gattatgctt tcactcatat ttatacagaa acttgatgtt ttctttcgag 120
tatatacaag gtgattacat gtacgtttga agtacaactc tagattttgt agtgccctct 180
tgggctagcg gtaaaggtgc gcattttttc acaccctaca atgttctgtt caaaagattt 240
tggtcaaacg ctgtagaagt gaaagttggt gcgcatgttt cggcgttcga aacttctccg 300
cagtgaaaga taaatgatca gaaaactctt agcttttccg ttttagagct agaaatagca 360
agttaaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtggtgctt 420
tttttgtttt ttatgtcttg acttacctcc gtcggctccg gcgtacggca ccaaaaaatc 480
ccgcaata 488
<210> 25
<211> 488
<212> DNA
<213> Artificial Sequence
<220>
<223> INT59 SGIC sequence for integration, 1 kb deletion
<400> 25
acgaggtgaa gggcaaaggt gaattaacca aagtgaagag gacgacgtag tctttgaaaa 60
gataatgtat gattatgctt tcactcatat ttatacagaa acttgatgtt ttctttcgag 120
tatatacaag gtgattacat gtacgtttga agtacaactc tagattttgt agtgccctct 180
tgggctagcg gtaaaggtgc gcattttttc acaccctaca atgttctgtt caaaagattt 240
tggtcaaacg ctgtagaagt gaaagttggt gcgcatgttt cggcgttcga aacttctccg 300
cagtgaaaga taaatgatca gaaaactctt agcttttccg ttttagagct agaaatagca 360
agttaaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtggtgctt 420
tttttgtttt ttatgtctgc atctatcatt ctttctttta ctctctccaa tcaccacaac 480
tcatatca 488
<210> 26
<211> 488
<212> DNA
<213> Artificial Sequence
<220>
<223> YPRCtau3 SGIC sequence for integration, 0 bp deletion
<400> 26
catcttttaa tgcctactct tttgatgttc acttacatgt tacaatgaag tctttgaaaa 60
gataatgtat gattatgctt tcactcatat ttatacagaa acttgatgtt ttctttcgag 120
tatatacaag gtgattacat gtacgtttga agtacaactc tagattttgt agtgccctct 180
tgggctagcg gtaaaggtgc gcattttttc acaccctaca atgttctgtt caaaagattt 240
tggtcaaacg ctgtagaagt gaaagttggt gcgcatgttt cggcgttcga aacttctccg 300
cagtgaaaga taaatgatcc aatatggtat gccgagtctg ttttagagct agaaatagca 360
agttaaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtggtgctt 420
tttttgtttt ttatgtctgt attaatgaag gttgaatatg gatcttaata taatcgtata 480
agaggggc 488
<210> 27
<211> 488
<212> DNA
<213> Artificial Sequence
<220>
<223> YPRCtau3 SGIC sequence for integration, 1 kb deletion
<400> 27
tcatacgatt tccacatgtg tctcatatat attttatgtt taggttaata tctttgaaaa 60
gataatgtat gattatgctt tcactcatat ttatacagaa acttgatgtt ttctttcgag 120
tatatacaag gtgattacat gtacgtttga agtacaactc tagattttgt agtgccctct 180
tgggctagcg gtaaaggtgc gcattttttc acaccctaca atgttctgtt caaaagattt 240
tggtcaaacg ctgtagaagt gaaagttggt gcgcatgttt cggcgttcga aacttctccg 300
cagtgaaaga taaatgatcc aatatggtat gccgagtctg ttttagagct agaaatagca 360
agttaaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtggtgctt 420
tttttgtttt ttatgtctag aacgtcccct ttgatacttc catacaagga cgattaaaaa 480
tacataag 488
<210> 28
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> FW PCR primer annealing to SNR52p to obtain SGIC sequence for
integration without genomic flanking regions attached
<400> 28
tctttgaaaa gataatgtat gattatg 27
<210> 29
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> REV PCR primer annealing to SUP4 3' flanking region to obtain
SGIC sequence for integration without genomic flanking regions
attached
<400> 29
agacataaaa aacaaaaaaa gcacc 25
<210> 30
<211> 388
<212> DNA
<213> Artificial Sequence
<220>
<223> INT1 SGIC without genomic flanking regions attached on either
side
<400> 30
tctttgaaaa gataatgtat gattatgctt tcactcatat ttatacagaa acttgatgtt 60
ttctttcgag tatatacaag gtgattacat gtacgtttga agtacaactc tagattttgt 120
agtgccctct tgggctagcg gtaaaggtgc gcattttttc acaccctaca atgttctgtt 180
caaaagattt tggtcaaacg ctgtagaagt gaaagttggt gcgcatgttt cggcgttcga 240
aacttctccg cagtgaaaga taaatgatct attagaacca gggaggtccg ttttagagct 300
agaaatagca agttaaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc 360
ggtggtgctt tttttgtttt ttatgtct 388
<210> 31
<211> 388
<212> DNA
<213> Artificial Sequence
<220>
<223> INT59 SGIC without genomic flanking regions attached on either
side
<400> 31
tctttgaaaa gataatgtat gattatgctt tcactcatat ttatacagaa acttgatgtt 60
ttctttcgag tatatacaag gtgattacat gtacgtttga agtacaactc tagattttgt 120
agtgccctct tgggctagcg gtaaaggtgc gcattttttc acaccctaca atgttctgtt 180
caaaagattt tggtcaaacg ctgtagaagt gaaagttggt gcgcatgttt cggcgttcga 240
aacttctccg cagtgaaaga taaatgatca gaaaactctt agcttttccg ttttagagct 300
agaaatagca agttaaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc 360
ggtggtgctt tttttgtttt ttatgtct 388
<210> 32
<211> 388
<212> DNA
<213> Artificial Sequence
<220>
<223> YPRCtau3 SGIC without genomic flanking regions attached on either
side
<400> 32
tctttgaaaa gataatgtat gattatgctt tcactcatat ttatacagaa acttgatgtt 60
ttctttcgag tatatacaag gtgattacat gtacgtttga agtacaactc tagattttgt 120
agtgccctct tgggctagcg gtaaaggtgc gcattttttc acaccctaca atgttctgtt 180
caaaagattt tggtcaaacg ctgtagaagt gaaagttggt gcgcatgttt cggcgttcga 240
aacttctccg cagtgaaaga taaatgatcc aatatggtat gccgagtctg ttttagagct 300
agaaatagca agttaaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc 360
ggtggtgctt tttttgtttt ttatgtct 388
<210> 33
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> FW PCR primer to confirm integration of the SGIC in the INT1
locus, 0 bp deletion.
<400> 33
ttacatttca ggtttccata atatg 25
<210> 34
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> REV PCR primer to confirm integration of the SGIC in the INT1
locus, 0 bp deletion
<400> 34
ctttcataag ctaattatgc catc 24
<210> 35
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> FW PCR primer to confirm integration of the SGIC in the INT1
locus, 1 kbp deletion
<400> 35
tgggttcata ctgctgtgtt atag 24
<210> 36
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> REV PCR primer to confirm integration of the SGIC in the INT1
locus, 1 kbp deletion
<400> 36
aactagctca gaaaacacta acg 23
<210> 37
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> FW PCR primer to confirm integration of the SGIC in the INT59
locus, 0 bp deletion
<400> 37
cagacgtagg aggtagccg 19
<210> 38
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> REV PCR primer to confirm integration of the SGIC in the INT59
locus, 0 bp deletion
<400> 38
tcacggttct gcggacgcc 19
<210> 39
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> FW PCR primer to confirm integration of the SGIC in the INT59
locus, 1 kbp deletion
<400> 39
gaacattaat gactgcaaca cc 22
<210> 40
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> REV PCR primer to confirm integration of the SGIC in the INT59
locus, 1 kbp deletion
<400> 40
cacaaacgga aaggatatag aag 23
<210> 41
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> FW PCR primer to confirm integration of the SGIC in the YPRCtau3
locus, 0 bp deletion
<400> 41
caagtacagt gctgacgtcc 20
<210> 42
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> REV primer to confirm integration of the SGIC in the YPRCtau3
locus, 0 bp deletion
<400> 42
attaatgttg aaccaatcgg cg 22
<210> 43
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> FW PCR primer to confirm integration of the SGIC in the YPRCtau3
locus, 1 kbp deletion
<400> 43
cctctttaca agcggagctt ac 22
<210> 44
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> REV PCR primer to confirm integration of the SGIC in the YPRCtau3
locus, 1 kbp deletion
<400> 44
gcgcttattt atcggcattg ag 22
<210> 45
<211> 77
<212> DNA
<213> Artificial Sequence
<220>
<223> FW primer annealing to SNR52p to obtain INT1 SGIC DNA sequence
with 50 bp connector sequence at the 5' end
<400> 45
aagcgacttc caatcgcttt gcatatccag taccacaccc acaggcgttt tctttgaaaa 60
gataatgtat gattatg 77
<210> 46
<211> 75
<212> DNA
<213> Artificial Sequence
<220>
<223> REV primer annealing to SUP4 to obtain INT1 SGIC DNA sequence
with 50 bp connector sequence at the 3' end
<400> 46
acttagtatg gtctgttgga aaggattgtg gcttcgcata caggctttct agacataaaa 60
aacaaaaaaa gcacc 75
<210> 47
<211> 488
<212> DNA
<213> Artificial Sequence
<220>
<223> SGIC DNA with connector sequences attached to the 5' and 3' ends
<400> 47
aagcgacttc caatcgcttt gcatatccag taccacaccc acaggcgttt tctttgaaaa 60
gataatgtat gattatgctt tcactcatat ttatacagaa acttgatgtt ttctttcgag 120
tatatacaag gtgattacat gtacgtttga agtacaactc tagattttgt agtgccctct 180
tgggctagcg gtaaaggtgc gcattttttc acaccctaca atgttctgtt caaaagattt 240
tggtcaaacg ctgtagaagt gaaagttggt gcgcatgttt cggcgttcga aacttctccg 300
cagtgaaaga taaatgatct attagaacca gggaggtccg ttttagagct agaaatagca 360
agttaaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtggtgctt 420
tttttgtttt ttatgtctag aaagcctgta tgcgaagcca caatcctttc caacagacca 480
tactaagt 488
<210> 48
<211> 74
<212> DNA
<213> Artificial Sequence
<220>
<223> REV primer annealing to SNR52p to obtain the 5' split SGIC DNA
sequence targeting INT1
<400> 48
attttaactt gctatttcta gctctaaaac ggacctccct ggttctaata gatcatttat 60
ctttcactgc ggag 74
<210> 49
<211> 73
<212> DNA
<213> Artificial Sequence
<220>
<223> FW primer annealing to the guide-RNA to obtain the 3' split SGIC
DNA sequence targeting INT1
<400> 49
aaacttctcc gcagtgaaag ataaatgatc tattagaacc agggaggtcc gttttagagc 60
tagaaatagc aag 73
<210> 50
<211> 72
<212> DNA
<213> Artificial Sequence
<220>
<223> FW primer annealing to the 5' connector of SGIC DNA fragment to
attach genomic DNA sequence for integration on INT1
<400> 50
cttcatgcca gcaatagttg cgtgctgagc tcaacagtgc ccaacccttg aagcgacttc 60
caatcgcttt gc 72
<210> 51
<211> 74
<212> DNA
<213> Artificial Sequence
<220>
<223> RV primer annealing to the 3' connector of SGIC DNA fragment to
attach genomic DNA sequence for integration on INT1
<400> 51
gaaaagcact cctttagtac cactcaacaa gttgtctgat gacaaagaat acttagtatg 60
gtctgttgga aagg 74
<210> 52
<211> 588
<212> DNA
<213> Artificial Sequence
<220>
<223> SGIC DNA with 50 bp genomic DNA sequences attached on both the 5'
and 3' end for integration on INT1
<400> 52
cttcatgcca gcaatagttg cgtgctgagc tcaacagtgc ccaacccttg aagcgacttc 60
caatcgcttt gcatatccag taccacaccc acaggcgttt tctttgaaaa gataatgtat 120
gattatgctt tcactcatat ttatacagaa acttgatgtt ttctttcgag tatatacaag 180
gtgattacat gtacgtttga agtacaactc tagattttgt agtgccctct tgggctagcg 240
gtaaaggtgc gcattttttc acaccctaca atgttctgtt caaaagattt tggtcaaacg 300
ctgtagaagt gaaagttggt gcgcatgttt cggcgttcga aacttctccg cagtgaaaga 360
taaatgatct attagaacca gggaggtccg ttttagagct agaaatagca agttaaaata 420
aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtggtgctt tttttgtttt 480
ttatgtctag aaagcctgta tgcgaagcca caatcctttc caacagacca tactaagtat 540
tctttgtcat cagacaactt gttgagtggt actaaaggag tgcttttc 588
<210> 53
<211> 419
<212> DNA
<213> Artificial Sequence
<220>
<223> 5' fragment of the split SGIC DNA with 50 bp homology to the 3'
split SGIC DNA cassette for assembly
<400> 53
cttcatgcca gcaatagttg cgtgctgagc tcaacagtgc ccaacccttg aagcgacttc 60
caatcgcttt gcatatccag taccacaccc acaggcgttt tctttgaaaa gataatgtat 120
gattatgctt tcactcatat ttatacagaa acttgatgtt ttctttcgag tatatacaag 180
gtgattacat gtacgtttga agtacaactc tagattttgt agtgccctct tgggctagcg 240
gtaaaggtgc gcattttttc acaccctaca atgttctgtt caaaagattt tggtcaaacg 300
ctgtagaagt gaaagttggt gcgcatgttt cggcgttcga aacttctccg cagtgaaaga 360
taaatgatct attagaacca gggaggtccg ttttagagct agaaatagca agttaaaat 419
<210> 54
<211> 249
<212> DNA
<213> Artificial Sequence
<220>
<223> 3' fragment of the split SGIC DNA with 50 bp homology to the 5'
split SGIC DNA cassette for assembly.
<400> 54
aaacttctcc gcagtgaaag ataaatgatc tattagaacc agggaggtcc gttttagagc 60
tagaaatagc aagttaaaat aaggctagtc cgttatcaac ttgaaaaagt ggcaccgagt 120
cggtggtgct ttttttgttt tttatgtcta gaaagcctgt atgcgaagcc acaatccttt 180
ccaacagacc atactaagta ttctttgtca tcagacaact tgttgagtgg tactaaagga 240
gtgcttttc 249
<210> 55
<211> 100
<212> DNA
<213> Artificial Sequence
<220>
<223> ssODN 5' flank 1 kb upper strand sequence
<400> 55
cttcatgcca gcaatagttg cgtgctgagc tcaacagtgc ccaacccttg aagcgacttc 60
caatcgcttt gcatatccag taccacaccc acaggcgttt 100
<210> 56
<211> 100
<212> DNA
<213> Artificial Sequence
<220>
<223> ssODN 5' flank 1 kb lower strand sequence
<400> 56
aaacgcctgt gggtgtggta ctggatatgc aaagcgattg gaagtcgctt caagggttgg 60
gcactgttga gctcagcacg caactattgc tggcatgaag 100
<210> 57
<211> 100
<212> DNA
<213> Artificial Sequence
<220>
<223> ssODN 3' flank 1 kb upper strand sequence
<400> 57
agaaagcctg tatgcgaagc cacaatcctt tccaacagac catactaagt attctttgtc 60
atcagacaac ttgttgagtg gtactaaagg agtgcttttc 100
<210> 58
<211> 100
<212> DNA
<213> Artificial Sequence
<220>
<223> ssODN 3' flank 1 kb lower strand sequence
<400> 58
gaaaagcact cctttagtac cactcaacaa gttgtctgat gacaaagaat acttagtatg 60
gtctgttgga aaggattgtg gcttcgcata caggctttct 100
<210> 59
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> connector sequence on the 5' end of SGIC DNA
<400> 59
aagcgacttc caatcgcttt gcatatccag taccacaccc acaggcgttt 50
<210> 60
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> connector sequence on the 3' end of SGIC DNA
<400> 60
agaaagcctg tatgcgaagc cacaatcctt tccaacagac catactaagt 50
<210> 61
<211> 88
<212> DNA
<213> Artificial Sequence
<220>
<223> Forward PCR primer SGIC DNA part 5' fwnA flank-sgRNA-3' conH
<400> 61
gggggtctcg gtgcctgcga cagcggattg ggcggagaag aagacaaccc ttcagatata 60
ttcaggtgct tttccctcac atgttttg 88
<210> 62
<211> 87
<212> DNA
<213> Artificial Sequence
<220>
<223> Reverse PCR primer SGIC DNA part 5' fwnA flank-sgRNA-3' conH
<400> 62
cccggtctcc cattaatcgc aactcggatt tgggaggcaa ggtcggaacg cgaactttgg 60
ctttgagggt gcggaacatg gggactg 87
<210> 63
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Forward PCR primer SGIC DNA hygB or phleo marker-3' fnwA flank
<400> 63
gggggtctcg aatggctctg tacagtgacc ggtgac 36
<210> 64
<211> 86
<212> DNA
<213> Artificial Sequence
<220>
<223> Reverse PCR primer SGIC DNA hygB or phleo marker-3' fnwA flank
<400> 64
cccggtctcc gaggcagtca aagaatcgga cagtgcaagt tgcgtggtca gccgtcttct 60
tcccatcctg tcttcagtct taagac 86
<210> 65
<211> 18922
<212> DNA
<213> Artificial Sequence
<220>
<223> BG-AMA5 AMA phleo/Cas9 st
<400> 65
cttgcccatc gaacgtacaa gtactcctct gttctctcct tcctttgctt tgtgcggaga 60
ccggcttact aaaagccaga taacagtatg catatttgcg cgctgatttt tgcggtataa 120
gaatatatac tgatatgtat acccgaagta tgtcaaaaag aggtatgcta tgaagcagcg 180
tattacagtg acagttgaca gcgacagcta tcagttgctc aaggcatata tgatgtcaat 240
atctccggtc tggtaagcac aaccatgcag aatgaagccc gtcgtctgcg tgccgaacgc 300
tggaaagcgg aaaatcagga agggatggct gaggtcgccc ggtttattga aatgaacggc 360
tcttttgctg acgagaacag gggctggtga aatgcagttt aaggtttaca cctataaaag 420
agagagccgt tatcgtctgt ttgtggatgt acagagtgat attattgaca cgcccgggcg 480
acggatggtg atccccctgg ccagtgcacg tctgctgtca gataaagtct cccgtgaact 540
ttacccggtg gtgcatatcg gggatgaaag ctggcgcatg atgaccaccg atatggccag 600
tgtgccggtt tccgttatcg gggaagaagt ggctgatctc agccaccgcg aaaatgacat 660
caaaaacgcc attaacctga tgttctgggg aatataaggt ctcgcctccg gatcgatgta 720
cacaaccgac tgcacccaaa cgaacacaaa tcttagcagt gccctcgccg gatagcttgg 780
actgtccttt accgtcgcca gcacaagaag ggtatctctg aggtccgtac cgccttttct 840
ttaccactgg attcgatttt cgcagttgga atgatacatc tggggactgc gaatggttta 900
cccctcggcc gatactatgg gtcgtgaaga gatggaacat tccgaaagtg ttttgcggat 960
aacattggtg gcatcgaaaa cagaatgctg accattgatt tcaacacgaa caggaggttg 1020
ccaagaagcg tacccgccgt gtcgtcaagt cccagcgtgc catcgtcggt gcttccctcg 1080
acgtgatcaa ggagcgccgc tcccagcgcc ccgaggcccg tgccgccgcc cgccagcagg 1140
ccatcaagga cgccaaggag aagaaggctg ccgctgagtc caagaagaag gctgagaagg 1200
ctaagaacgc cgctgctggt gccaagggtg ctgctcagcg catccagagc aagcagggtg 1260
ctaagggttc tgctcccaag gtcgctgcca agtctcgtta aggaatgaat aacggttcgg 1320
cttgggattg ggtgcggaag gcaagagttt catggacgaa ttttgggagg ttactggagc 1380
tggaatatgt gttttcccta ccaccaaaaa tgaaatgttc caaaactatc ggcgtgcaag 1440
acggcctctt acgggtttaa cggctctcag ataagctcta tcaatcgcgc cacggatgca 1500
tgaatgaaga tccagatggc cgcgggatat atcgtgctag tgtaattcct acatgatctt 1560
gctgttcact ccatgcgcat ccagatattc caggggtcga ctgttaattg atatgcctgg 1620
gcttgagact ccgtagacgc ccagtcaatg tgcaattaat acgagggtgc tgttatcggc 1680
agcaaccttg tacttctcca taagatgggg gaatgccatg gacctgagtg atcaattgac 1740
gcaagtctcc cataacgcgg cggcttgacc taaaatccat ataccgcccc gttgagcctc 1800
cgcgctccag agtcctgtcc cggaataggg cacaaaccta ggctaaccta attcgtcgtc 1860
cgcgtctgag ttcagacaaa agaacttcca agtatcagca gagtacgctg atattgataa 1920
gtaggcaaac ataagaccaa taagcaagta gaataaaaaa ttataaggac actgcctcca 1980
taaagcgccc tcccaagacc tcagggacaa aacttctcaa gtggcaattc actgcctcag 2040
gccgtgtcca gtgaagtgac gaagcgacac tgttgcctgc tgactcagcc gctttccgcc 2100
ctgccgaatt tgccatctcg cttacaggtc agcactagcg cgattcgccc acagatgctc 2160
agcgcaaagt ggtgactcag tcaaaccccc cctacaagat tccacctcga tttttcaact 2220
tcccatctcg atccgacaag ttctacatcc accgtcaaaa tggcctccag cgaagatgtc 2280
atcaaggagt tcatgcgctt caaggtccgc atggaaggat ccgtcaacgg ccacgagttc 2340
gagattgagg gtgagggtga gggccgcccc tacgaaggca cccagactgc caagctcaag 2400
gtcaccaagg gtggtcctct ccccttcgct tgggatatcc tgtctcctca gttccagtac 2460
ggctccaagg tctacgtcaa gcaccccgcc gacatccccg actacaagaa gctttctttc 2520
cccgagggtt tcaagtggga gcgtgtcatg aacttcgagg atggtggtgt tgtgaccgtt 2580
actcaggaca gcagcttgca ggatggctct ttcatctaca aggtcaagtt cattggtgtc 2640
aacttcccct ccgacggccc tgtcatgcag aagaagacca tgggctggga agcgtcgact 2700
gagcgtctgt acccccgtga cggtgttctc aagggtgaga tccacaaggc tctcaagctc 2760
aaggacggtg gtcactacct tgttgagttc aagtccatct acatggccaa gaagcctgtg 2820
cagctgcccg gatactacta cgtggactcc aagcttgaca tcacctccca caacgaagac 2880
tacaccattg ttgagcagta cgagcgtgct gagggccgcc accacctctt cctgacccac 2940
ggaatggatg agctgtacaa gtcgaaacta taaataaatg gtttgcgttg cgattgactg 3000
aaacgaaaaa aagcgaaaat gattctggga atgaattgat aaagcgcggg ctctgcggta 3060
cggttacggt tgcggtcgcg gacgaatgga ctgggctgag ctgggctgga ggaagtccat 3120
cgaacaagga caaggggtgg aatatggcac gggtcgattt tgttatacat accctaccat 3180
ccatctatcc atttaaatac caaatgagtt gttgaatgga ttcgcggtct tctcggttta 3240
tttttgcttg cttgcgtgct taagggatag tgtgcctcac gctttccggc atcttccaga 3300
ccacagtata tccatccgcc tcctgttgaa gcttattttt tgtatactgt tttgtgatag 3360
cacgaagttt ttccacggta tcttgttaaa aatatatatt tgtggcgggc ttacctacat 3420
caaattaata agagactaat tataaactaa acacacaagc aagctacttt agggtaaaag 3480
tttataaatg cttttgacgt ataaacgttg cttgtattta ttattacaat taaaggtgga 3540
tagaaaacct agagactagt tagaaactaa tctcaggttt gcgttaaact aaatcagagc 3600
ccgagaggtt aacagaacct agaaggggac tagatatccg ggtagggaaa caaaaaaaaa 3660
aaacaagaca gccacatatt agggagacta gttagaagct agttccagga ctaggaaaat 3720
aaaagacaat gataccacag tctagttgac aactagatag attctagatt gaggccaaag 3780
tctctgagat ccaggttagt tgcaactaat actagttagt atctagtctc ctataactct 3840
gaagctagaa taacttacta ctattatcct caccactgtt cagctgcgca aacggagtga 3900
ttgcaaggtg ttcagagact agttattgac tagtcagtga ctagcaataa ctaacaaggt 3960
attaacctac catgtctgcc atcaccctgc acttcctcgg gctcagcagc cttttcctcc 4020
tcattttcat gctcattttc cttgtttaag actgtgacta gtcaaagact agtccagaac 4080
cacaaaggag aaatgtctta ccactttctt cattgcttgt ctcttttgca ttatccatgt 4140
ctgcaactag ttagagtcta gttagtgact agtccgacga ggacttgctt gtctccggat 4200
tgttggagga actctccagg gcctcaagat ccacaacaga gccttctaga agactggtca 4260
ataactagtt ggtctttgtc tgagtctgac ttacgaggtt gcatactcgc tccctttgcc 4320
tcgtcaatcg atgagaaaaa gcgccaaaac tcgcaatatg gctttgaacc acacggtgct 4380
gagactagtt agaatctagt cccaaactag cttggatagc ttacctttgc cctttgcgtt 4440
gcgacaggtc ttgcagggta tggttccttt ctcaccagct gatttagctg ccttgctacc 4500
ctcacggcgg atctgcataa agagtggcta gaggttataa attagcactg atcctaggta 4560
cggggctgaa tgtaacttgc ctttcctttc tcatcgcgcg gcaagacagg cttgctcaaa 4620
ttcctaccag tcacaggggt atgcacggcg tacggaccac ttgaactagt cacagattag 4680
ttagcaacta gtctgcattg aatggctgta cttacgggcc ctcgccattg tcctgatcat 4740
ttccagcttc accctcgttg ctgcaaagta gttagtgact agtcaaggac tagttgaaat 4800
gggagaagaa actcacgaat tctcgacacc cttagtattg tggtccttgg acttggtgct 4860
gctatatatt agctaataca ctagttagac tcacagaaac ttacgcagct cgcttgcgct 4920
tcttggtagg agtcggggtt gggagaacag tgccttcaaa caagccttca taccatgcta 4980
cttgactagt cagggactag tcaccaagta atctagatag gacttgcctt tggcctccat 5040
cagttccttc atagtgggag gtccattgtg caatgtaaac tccatgccgt gggagttctt 5100
gtccttcaag tgcttgacca atatgtttct gttggcagag ggaacctgtc aactagttaa 5160
taactagtca gaaactagta tagcagtaga ctcactgtac gcttgaggca tcccttcact 5220
cggcagtaga cttcatatgg atggatatca ggcacgccat tgtcgtcctg tggactagtc 5280
agtaactagg cttaaagcta gtcgggtcgg cttactatct tgaaatccgg cagcgtaagc 5340
tccccgtcct taactgcctc gagatagtga cagtactctg gggactttcg gagatcgtta 5400
tcgcgaatgc tcggcatact aatcgttgac tagtcttgga ctagtcccga gcaaaaagga 5460
ttggaggagg aggaggaagg tgagagtgag acaaagagcg aaataagagc ttcaaaggct 5520
atctctaagc agtatgaagg ttaagtatct agttcttgac tagatttaaa agagatttcg 5580
actagttatg tacctggagt ttggatatag gaatgtgttg tggtaacgaa atgtaagggg 5640
gaggaaagaa aaagtcggtc aagaggtaac tctaagtcgg ccattccttt ttgggaggcg 5700
ctaaccataa acggcatggt cgacttagag ttagctcagg gaatttaggg agttatctgc 5760
gaccaccgag gaacggcgga atgccaaaga atcccgatgg agctctagct ggcggttgac 5820
aaccccacct tttggcgttt ctgcggcgtt gcaggcggga ctggatactt cgtagaacca 5880
gaaaggcaag gcagaacgcg ctcagcaaga gtgttggaag tgatagcatg atgtgccttg 5940
ttaactaggt caaaatctgc agtatgcttg atgttatcca aagtgtgaga gaggaaggtc 6000
caaacataca cgattgggag agggcctagg tataagagtt tttgagtaga acgcatgtga 6060
gcccagccat ctcgaggaga ttaaacacgg gccggcattt gatggctatg ttagtacccc 6120
aatggaaagc ctgagagtcc agtggtcgca gataactccc taaattccct gagctaactc 6180
taagtcgacc atgccgttta tggttagcgc ctcccaaaaa ggaatggccg acttagagtt 6240
acctcttgac cgactttttc tttcctcccc cttacatttc gttaccacaa cacattccta 6300
tatccaaact ccaggtacat aactagtcga aatctctttt aaatctagtc aagaactaga 6360
tacttaacct tcatactgct tagagatagc ctttgaagct cttatttcgc tctttgtctc 6420
actctcacct tcctcctcct cctccaatcc tttttgctcg ggactagtcc aagactagtc 6480
aacgattagt atgccgagca ttcgcgataa cgatctccga aagtccccag agtactgtca 6540
ctatctcgag gcagttaagg acggggagct tacgctgccg gatttcaaga tagtaagccg 6600
acccgactag ctttaagcct agttactgac tagtccacag gacgacaatg gcgtgcctga 6660
tatccatcca tatgaagtct actgccgagt gaagggatgc ctcaagcgta cagtgagtct 6720
actgctatac tagtttctga ctagttatta actagttgac aggttccctc tgccaacaga 6780
aacatattgg tcaagcactt gaaggacaag aactcccacg gcatggagtt tacattgcac 6840
aatggacctc ccactatgaa ggaactgatg gaggccaaag gcaagtccta tctagattac 6900
ttggtgacta gtccctgact agtcaagtag catggtatga aggcttgttt gaaggcactg 6960
ttctcccaac cccgactcct accaagaagc gcaagcgagc tgcgtaagtt tctgtgagtc 7020
taactagtgt attagctaat atatagcagc accaagtcca aggaccacaa tactaagggt 7080
gtcgagaatt cgtgagtttc ttctcccatt tcaactagtc cttgactagt cactaactac 7140
tttgcagcaa cgagggtgaa gctggaaatg atcaggacaa tggcgagggc ccgtaagtac 7200
agccattcaa tgcagactag ttgctaacta atctgtgact agttcaagtg gtccgtacgc 7260
cgtgcatacc cctgtgactg gtaggaattt gagcaagcct gtcttgccgc gcgatgagaa 7320
aggaaaggca agttacattc agccccgtac ctaggatcag tgctaattta taacctctag 7380
ccactcttta tgcagatccg ccgtgagggt agcaaggcag ctaaatcagc tggtgagaaa 7440
ggaaccatac cctgcaagac ctgtcgcaac gcaaagggca aaggtaagct atccaagcta 7500
gtttgggact agattctaac tagtctcagc accgtgtggt tcaaagccat attgcgagtt 7560
ttggcgcttt ttctcatcga ttgacgaggc aaagggagcg agtatgcaac ctcgtaagtc 7620
agactcagac aaagaccaac tagttattga ccagtcttct agaaggctct gttgtggatc 7680
ttgaggccct ggagagttcc tccaacaatc cggagacaag caagtcctcg tcggactagt 7740
cactaactag actctaacta gttgcagaca tggataatgc aaaagagaca agcaatgaag 7800
aaagtggtaa gacatttctc ctttgtggtt ctggactagt ctttgactag tcacagtctt 7860
aaacaaggaa aatgagcatg aaaatgagga ggaaaaggct gctgagcccg aggaagtgca 7920
gggtgatggc agacatggta ggttaatacc ttgttagtta ttgctagtca ctgactagtc 7980
aataactagt ctctgaacac cttgcaatca ctccgtttgc gcagctgaac agtggtgagg 8040
ataatagtag taagttattc tagcttcaga gttataggag actagatact aactagtatt 8100
agttgcaact aacctggatc tcagagactt tggcctcaat ctagaatcta tctagttgtc 8160
aactagactg tggtatcatt gtcttttatt ttcctagtcc tggaactagc ttctaactag 8220
tctccctaat atgtggctgt cttgtttttt ttttttgttt ccctacccgg atatctagtc 8280
cccttctagg ttctgttaac ctctcgggct ctgatttagt ttaacgcaaa cctgagatta 8340
gtttctaact agtctctagg ttttctatcc acctttaatt gtaataataa atacaagcaa 8400
cgtttatacg tcaaaagcat ttataaactt ttaccctaaa gtagcttgct tgtgtgttta 8460
gtttataatt agtctcttat taatttgatg taggtaagcc cgccacaaat atatattttt 8520
aacaagatac cgtggaaaaa cttcgtgcta tcacaaaaca gtatacaaaa aataagctat 8580
cgaattcctg cagagatcat cctgtcttca gtcttaagac ttctctccta tatcacccgc 8640
acttacccta gagtgccgct taggtgctaa gggcacattg agtattggcc gtgtagaata 8700
tatagcttaa gtacggccaa gcagacggga agccctgttc tccacaccct atggtcgtat 8760
atatcaggct tctaccggga aacgattaag agtgtataat ggactgaaaa tcaatatgaa 8820
cgggacaatg ctcaagttaa attagttagg catcctaatc tctactaaat gttctatcta 8880
gagatcgggg tactataggc ccgtacgtta atcactctac gcttctctcc cttaggtata 8940
gtgtaggtag gggctagaca tttatatgag tcagatggta caaacggtag gcagtgcggg 9000
cgaagaagtg aagacggagt cggttgaagc tacatacaaa agatgcattg gctcgtcatg 9060
aagagcctcc cgggtttagt cctgctcctc ggccacgaag tgcacgcagt tgccggccgg 9120
gtcgcgcagg gcgaactccc gcccccacgg ctgctcgccg atctcggtca tggccggccc 9180
ggaggcgtcc cggaagttcg tggacacgac ctccgaccac tcggcgtaca gctcgtccag 9240
gccgcgcacc cacacccagg ccagggtgtt gtccggcacc acctggtcct ggaccgcgct 9300
gatgaacagg gtcacgtcgt cccggaccac accggcgaag tcgtcctcca cgaagtcccg 9360
ggagaacccg agccggtcgg tccagaactc gaccgctccg gcgacgtcgc gcgcggtgag 9420
caccggaacg gcactggtca acttggccat tttgacggtg ggatcctgtg atgtctgctc 9480
aagcggggta gctgttagtc aagctgcgat gaagtgggaa agctcgaact gaaaggttca 9540
aaggaataag ggatgggaag gatggagtat ggatgtagca aagtacttac ttaggggaaa 9600
taaaggttct tggatgggaa gatgaatata ctgaagatgg gaaaagaaag agaaaagaaa 9660
agagcagctg gtggggagag caggaaaata tggcaacaaa tgttggactg acgcaacgac 9720
cttgtcaacc ccgccgacac accgggcgga cagacggggc aaagctgcct accagggact 9780
gagggacctc agcaggtcga gtgcagagca ccggatgggt cgactgccag cttgtgttcc 9840
cggtctgcgc cgctggccag ctcctgagcg gcctttccgg tttcatacac cgggcaaagc 9900
aggagaggca cgatatttgg acgccctaca gatgccggat gggccaatta gggagcttac 9960
gcgccgggta ctcgctctac ctacttcgga gaaggtacta tctcgtgaat cttttaccag 10020
atcggaagca attggacttc tgtacctagg ttaatggcat gctatttcgc cgacggctat 10080
acacccctgg cttcacattc tccttcgctt actgccggtg attcgatgaa gctccatatt 10140
ctccgatgat gcaatagatt cttggtcaac gaggggcaca ccagcctttc cacttcgggg 10200
cggaggggcg gccggtcccg gattaataat catccactgc acctcagagc cgccagagct 10260
gtctggcgca gtggcgctta ttactcagcc cttctctctg cgtccgtccg tctctccgca 10320
tgccagaaag agtcaccggt cactgtacag agcggccgcc accgcggtgg agctccaatt 10380
cgccctatag tgagtcgtat tacgcgcgct cactggccgt cgttttacaa cgtcgtgact 10440
gggaaaaccc tggcgttacc caacttaatc gccttgcagc acatccccct ttcgccagct 10500
ggcgtaatag cgaagaggcc cgcaccgatc gcccttccca acagttgcgc agcctgaatg 10560
gcgaatggga cgcgccctgt agcggcgcat taagcgcggc gggtgtggtg gttacgcgca 10620
gcgtgaccgc tacacttgcc agcgccctag cgcccgctcc tttcgctttc ttcccttcct 10680
ttctcgccac gttcgccggc tttccccgtc aagctctaaa tcgggggctc cctttagggt 10740
tccgatttag tgctttacgg cacctcgacc ccaaaaaact tgattagggt gatggttcac 10800
gtagtgggcc atcgccctga tagacggttt ttcgcccttt gacgttggag tccacgttct 10860
ttaatagtgg actcttgttc caaactggaa caacactcaa ccctatctcg gtctattctt 10920
ttgatttata agggattttg ccgatttcgg cctattggtt aaaaaatgag ctgatttaac 10980
aaaaatttaa cgcgaatttt aacaaaatat taacgcttac aatttaggtg gcacttttcg 11040
gggaaatgtg cgcggaaccc ctatttgttt atttttctaa atacattcaa atatgtatcc 11100
gctcatgaga caataaccct gataaatgct tcaataatat tgaaaaagga agagtatgag 11160
tattcaacat ttccgtgtcg cccttattcc cttttttgcg gcattttgcc ttcctgtttt 11220
tgctcaccca gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt 11280
gggttacatc gaactggatc tcaacagcgg taagatcctt gagagttttc gccccgaaga 11340
acgttttcca atgatgagca cttttcgacc gaataaatac ctgtgacgga agatcacttc 11400
gcagaataaa taaatcctgg tgtccctgtt gataccggga agccctgggc caacttttgg 11460
cgaaaatgag acgttgatcg gcacgtaaga ggttccaact ttcaccataa tgaaataaga 11520
tcactaccgg gcgtattttt tgagttgtcg agattttcag gagctaagga agctaaaatg 11580
gagaaaaaaa tcactggata taccaccgtt gatatatccc aatggcatcg taaagaacat 11640
tttgaggcat ttcagtcagt tgctcaatgt acctataacc agaccgttca gctggatatt 11700
acggcctttt taaagaccgt aaagaaaaat aagcacaagt tttatccggc ctttattcac 11760
attcttgccc gcctgatgaa tgctcatccg gaattacgta tggcaatgaa agacggtgag 11820
ctggtgatat gggatagtgt tcacccttgt tacaccgttt tccatgagca aactgaaacg 11880
ttttcatcgc tctggagtga ataccacgac gatttccggc agtttctaca catatattcg 11940
caagatgtgg cgtgttacgg tgaaaacctg gcctatttcc ctaaagggtt tattgagaat 12000
atgtttttcg tctcagccaa tccctgggtg agtttcacca gttttgattt aaacgtggcc 12060
aatatggaca acttcttcgc ccccgttttc accatgggca aatattatac gcaaggcgac 12120
aaggtgctga tgccgctggc gattcaggtt catcatgccg tttgtgatgg cttccatgtc 12180
ggcagaatgc ttaatgaatt acaacagtac tgcgatgagt ggcagggcgg ggcgtaattt 12240
ttttaaggca gttattggtg cccttaaacg cctggttgct acgcctgaat aagtgataat 12300
aagcggatga atggcagaaa ttcgaaagca aattcgaccc ggtcgtcggt tcagggcagg 12360
gtcgttaaat agccgcttat gtctattgct ggtttaccgg tttattgact accggaagca 12420
gtgtgaccgt gtgcttctca aatgcctgag gccagtttgc tcaggctctc cccgtggagg 12480
taataattga cgatatgatc ctttttttct gatcaaaaag gatctaggtg aagatccttt 12540
ttgataatct catgaccaaa atcccttaac gtgagttttc gttccactga gcgtcagacc 12600
ccgtagaaaa gatcaaagga tcttcttgag atcctttttt tctgcgcgta atctgctgct 12660
tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa gagctaccaa 12720
ctctttttcc gaaggtaact ggcttcagca gagcgcagat accaaatact gttcttctag 12780
tgtagccgta gttaggccac cacttcaaga actctgtagc accgcctaca tacctcgctc 12840
tgctaatcct gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt accgggttgg 12900
actcaagacg atagttaccg gataaggcgc agcggtcggg ctgaacgggg ggttcgtgca 12960
cacagcccag cttggagcga acgacctaca ccgaactgag atacctacag cgtgagctat 13020
gagaaagcgc cacgcttccc gaagggagaa aggcggacag gtatccggta agcggcaggg 13080
tcggaacagg agagcgcacg agggagcttc cagggggaaa cgcctggtat ctttatagtc 13140
ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt gtgatgctcg tcaggggggc 13200
ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc ttttgctggc 13260
cttttgctca catgttcttt cctgcgttat cccctgattc tgtggataac cgtattaccg 13320
cctttgagtg agctgatacc gctcgccgca gccgaacgac cgagcgcagc gagtcagtga 13380
gcgaggaagc ggaagagcgc ccaatacgca aaccgcctct ccccgcgcgt tggccgattc 13440
attaatgcag ctggcacgac aggtttcccg actggaaagc gggcagtgag cgcaacgcaa 13500
ttaatgtgag ttagctcact cattaggcac cccaggcttt acactttatg ctcccggctc 13560
gtatgttgtg tggaattgtg agcggataac aatttcacac aggaaacagc tatgaccatg 13620
attacgccaa gcgcgcaatt aaccctcact aaagggaaca aaagctgggt acgcaactct 13680
ctggaaatga aggcagcccc gaagttttgg gatactagcg atcctaggca ctgcaccagt 13740
cttgaagagg gtcatctctc cggagattag tccatctgtg gcattgttta tactttcaca 13800
cctccagaac aacatggaag tcaaggaatg tggtatcaga ctcacaacca agagatttct 13860
caccaaagcg ctagttccaa ggcaggtcta gcgtgctgac gatggggata atttagccgg 13920
ctaattggtg gacatccgcc accaccccag attaaacggt ggagatgaca gggggcggag 13980
attcaacggg attaaatatc ggagatgaag actcggcatc tgcttgaggc agttagtgct 14040
tgatgcaact tgtggtcggt cgaagcgatt ggcatggtga tcaacgatcg gataataaga 14100
cctcccatgt gcctcggggg atattcgatc cgcctgctga agagagtaat gatggacctg 14160
atacttgcag aatctgaact gaagcccttg actagcgctg gaactaaatt tcaagctaac 14220
ggtgatgcag cagaaggatg acgatctttt cctaacggat ttctccgcag acccccgagc 14280
gcattctgca ataccatgca cctttcatgc acctttcatg caagttccat gcaactccca 14340
cacatgtgca ttaatatgcc ttagctctct cgaatgaact ttcacgtggc ttaagtcccc 14400
tcacctgcac ccatataaaa gccaagttct tcccccacga tgacaccaac cccaactcac 14460
cttccaccgt caaaatggac aagaagtata gcatcggtct ggacattggc accaactccg 14520
ttggctgggc tgtcatcacc gacgagtaca aggttcctag caagaaattc aaggtcctgg 14580
gaaacaccga tcgtcactcc atcaagaaga acctcattgg tgcgcttctc ttcgactccg 14640
gtgagactgc tgaggccacc cgtctgaagc gtaccgctcg ccgtcgttac actcgccgca 14700
agaaccgtat ctgctacctc caggagattt tctccaacga gatggccaag gttgatgact 14760
ctttcttcca ccgtctggag gagtcgttcc ttgttgaaga agacaagaag cacgagcgtc 14820
accctatctt cggtaacatt gtcgatgagg tcgcttacca cgagaagtac cccaccatct 14880
accacctacg caaaaagctc gtcgacagca ccgacaaggc tgacctccgc ctcatttacc 14940
tggctctggc gcacatgatc aagttccgtg gtcacttcct gatcgagggt gacctcaacc 15000
ccgacaactc cgatgttgat aaactcttca tccagctcgt tcagacctac aaccagcttt 15060
tcgaggaaaa ccccatcaac gcgtctggcg tggatgccaa ggccatcctc tccgctcgcc 15120
tgagcaagtc ccgccgtctt gagaacttga ttgcccagct ccctggtgag aagaagaacg 15180
gtcttttcgg caaccttatt gccctgtccc tcggactgac tcccaacttc aagagcaact 15240
tcgatcttgc tgaggatgct aagttacaac tttccaagga tacctacgac gacgaccttg 15300
ataaccttct cgcccagata ggagatcagt acgccgacct cttcctagct gccaagaacc 15360
tctccgatgc cattctcctg tcagatatcc tccgtgtcaa cactgagatc accaaggccc 15420
ctctctccgc ctctatgatc aagagatacg atgagcacca ccaggacctc accctactca 15480
aggctctggt ccgccagcag ctccccgaaa agtacaagga gatcttcttc gaccagtcca 15540
agaacggcta cgccggttac atcgacggtg gtgcttccca ggaagaattc tacaagttca 15600
ttaagcctat cctcgagaag atggatggca ctgaggagct tcttgttaag ctgaaccgtg 15660
aggaccttct gcgcaagcag cgtactttcg acaacggcag catcccccac cagatccacc 15720
tgggtgaatt gcacgccatc cttcgtcgcc aggaagactt ctaccctttc ttgaaggaca 15780
accgtgagaa gattgagaag atcctgacct tccgtatccc ctactacgtc ggtcctctgg 15840
ctcgcggtaa ctcccgcttc gcctggatga cccgcaagtc cgaggaaacc atcaccccct 15900
ggaacttcga ggaagtcgtc gacaagggtg cctccgctca gagcttcatt gagcgtatga 15960
ccaacttcga caagaacctg cccaacgaga aagtcctgcc caagcactcc ctcttgtacg 16020
agtacttcac tgtctacaac gagctgacca aggtcaagta cgtgaccgag ggcatgcgca 16080
agcctgcttt cctctccggc gaacagaaga aggccattgt cgacctgctg ttcaagacta 16140
accgcaaggt gaccgtcaag cagctcaagg aagactactt caagaagatc gagtgctttg 16200
actccgttga gatctccggt gttgaggacc gcttcaacgc ttctctcggc acctaccacg 16260
atctgctcaa gatcatcaag gacaaggact tccttgacaa cgaggagaac gaagacattc 16320
ttgaggacat tgttcttacc ctcaccctct tcgaggaccg tgagatgatc gaagaacgtc 16380
tgaagaccta cgctcacctc ttcgacgaca aggtcatgaa gcagttgaag cgccgccgtt 16440
acactggctg gggtcgcctc tctcgcaagt tgattaacgg tatccgtgat aagcagtctg 16500
gcaagaccat ccttgacttc ctgaagtccg acggcttcgc caaccgcaac ttcatgcagc 16560
tcatccacga cgactctctg accttcaaag aggacatcca gaaggcccaa gtctccggcc 16620
agggtgactc gctacacgaa cacattgcca acctggctgg ttcccccgct atcaagaagg 16680
gtatcctgca gactgtgaag gttgttgacg agcttgtgaa ggtcatgggt cgtcacaagc 16740
ccgagaacat cgtcatcgaa atggctcgtg agaaccagac cactcagaag ggtcagaaga 16800
acagccgtga gcgcatgaag cgtatcgagg aaggcatcaa ggagctcggt tcccagattc 16860
tcaaggaaca ccccgtcgag aacacccagc tgcagaatga gaagctctac ctctactact 16920
tgcagaacgg acgtgacatg tacgtcgacc aggagctgga tatcaaccgc ctctccgact 16980
acgatgttga ccacatcgtc ccccagtcct tcctcaagga tgacagcatt gacaacaagg 17040
tgctcacccg ttccgacaag aatcgtggca agagcgataa cgtcccctcg gaagaggttg 17100
ttaagaagat gaagaactac tggagacaat tgctcaacgc taagctcatc actcagcgca 17160
agttcgacaa ccttaccaag gccgagcgtg gcggactctc cgagctcgac aaggccggtt 17220
tcatcaagcg tcaattggtt gaaacccgtc agatcactaa gcacgttgcc cagatcctgg 17280
actctcgcat gaacaccaag tacgacgaga acgacaagct catccgtgag gtcaaggtca 17340
tcaccttaaa gagcaagctg gtcagtgact ttaggaaaga cttccagttc tacaaggtcc 17400
gcgagatcaa caactaccac cacgctcacg atgcctacct caacgccgtc gtcggtactg 17460
ctttgattaa gaagtatccc aagctcgagt ccgagttcgt ctacggtgac tacaaggtgt 17520
acgacgtgcg caagatgatc gctaagtccg agcaggagat cggaaaggcc actgccaagt 17580
acttcttcta cagcaacatc atgaacttct tcaagaccga aataacattg gccaacggcg 17640
agattcgcaa gcgtcccttg attgagacta acggcgaaac cggtgagatc gtctgggaca 17700
agggccgtga cttcgctacc gtccgcaagg tcctttctat gccccaggtc aacattgtca 17760
agaagaccga ggtgcagact ggtggtttct ccaaggagtc gattcttccc aagcgcaact 17820
ccgacaagct gatcgctcgc aagaaggatt gggaccccaa gaagtacggt ggattcgatt 17880
cgcctaccgt tgcctactcc gtcttggttg tcgccaaggt cgagaagggc aagagcaaga 17940
agctgaagag tgtgaaggaa ctcctcggta tcaccatcat ggaacgcagc agcttcgaga 18000
agaaccctat cgacttcctg gaggccaagg gttacaaaga ggtcaagaag gacctcatca 18060
tcaagctccc caagtactct ctgttcgagc tggagaacgg ccgtaagcgc atgcttgctt 18120
ccgccggtga gctccagaag ggtaacgagc ttgccctccc ctccaagtac gtcaacttcc 18180
tctacctggc ctcccactac gagaagctca agggctctcc cgaggacaac gagcagaagc 18240
agctctttgt cgagcagcac aagcactacc tggatgagat catcgagcag atctccgagt 18300
tcagcaagcg tgtcatcctg gccgatgcca accttgacaa ggtcctctct gcctacaaca 18360
agcaccgtga caagcccatc cgcgagcagg cggagaacat catccacctg ttcaccctca 18420
ccaacctggg tgctcctgct gctttcaagt actttgacac caccatcgac cgcaagcgtt 18480
acacctccac caaggaagtg cttgatgcga ctctgatcca ccagtcgatt accggtctgt 18540
acgagactcg tatcgacctg tctcagctcg gtggtgactc tcgtgccgat cccaagaaga 18600
agcgcaaggt ttaaacaagc gcttagctcg aacaaaagaa aaagtaaaaa cggttaatag 18660
cattggattc cgaactacaa agtataaact agtttcactc cttgtagaag ccagatacgg 18720
gccggggtag ataccgcgca ctccctcagc agcctcgcag tcatggtcag catcgaagaa 18780
ctcccacaca aaatgcgctg ggagaagagt tcgaaatgca gctgggctca attagccgtc 18840
gtacacggag atagatactg aatacatacc cgtttgagcc tgaaaatttt tgacattcgt 18900
gcccatacca tgaacctcgt ac 18922
<210> 66
<211> 15186
<212> DNA
<213> Artificial Sequence
<220>
<223> BG-AMA9 AMA hygB/Cas9 st./sgRNA cassette
<400> 66
ggtaccttgc ccatcgaacg tacaagtact cctctgttct ctccttcctt tgctttgtgc 60
ttttccctca catgttttgc cgcaccagcc atcccactat caaaaagcga tgatgtttga 120
gattgtcggg tgtccacatc ttttagtgtg aatcgctagt agaatttggg atattattga 180
gcatcatccc atgatagcga gtacaagccc cgagtaaata ccaacattgc tatgctgctg 240
tgctgctatc tagtttgcta cgttggtcgt tgacctcaca gggatttcca ccaaaaagtg 300
gaccgggcgg gcgccactcg gccgtgccac agcagcctga gagcggacaa ataacaacag 360
ccgcctgccg cggggttcgg ttgcaaacat gaccaacagg ccaggccatc atcaacccac 420
cgctgcgttg atgcccagga tttcagtcca ataatccaca atttaccaac ggatagagct 480
aggtgaatta gatagacagg agggccagag ggaggggacc gagatgaaaa attttcgatg 540
aaagagtggt caaggtgggg tcgtagttcg gcgctccgag ggcgaggaac caaggaaagg 600
cgaggaaagg acaggctgat cgcgctgcgt tgctgggctg caagcgtgtc cagttgagtc 660
tggaaaaggc tccgccgtga agattctgcg ttggtcccgc acctgcgcgg tgggggcatt 720
acccctccat gtccaatgat ttcaagtcaa agccaagggt tgaagcccgc ccgcttagtc 780
gccttctcgc ttgacccctc catataagta tttcccctcc tccccctccc acaaattttt 840
cctttccctt tcctccctcg tccgcttcag tacgtatatc ttccccccct ctctcttcct 900
tctcactctt ctctccttct ttcttgattc atcctctctc taactgactt ctttgctcag 960
cacctctacg cgttctggcc gtagtatctg agcaattttt ctacagactt tttctatcta 1020
attccaaaaa agaacttcga gttcattcac caccgtcaaa atgatctgac tgatgagtcc 1080
gtgaggacga aacgagtaag ctcgtctcag atatattcag tcactggttt tagagctaga 1140
aatagcaagt taaaataagg ctagtccgtt atcaacttga aaaagtggca ccgagtcggt 1200
gcttttggcc ggcatggtcc cagcctcctc gctggcgccg gctgggcaac atgcttcggc 1260
atggcgaatg ggactaaaat gcgctaaact gggcttgact cagggaggga tcatggacta 1320
gccaattggg cgtgcacagc gcgactttgg agctggttct ggctcgcatg acttgtttcg 1380
tgctgcgggg gattccgttc ggacctgaca ttttaaaaat aaaaaatgga aacatcttga 1440
aagacaaaaa tgagtttcag tagtggtcta cagaccgtag ttttgttcct attcacagtg 1500
aaaataaggc gctgcaattg ctacgttcat aaatcgagta ttgttgtgct ccgaagcgcc 1560
agtccccatg ttccgcaccc tccggatcga tgtacacaac cgactgcacc caaacgaaca 1620
caaatcttag cagtgccctc gccggatagc ttggactgtc ctttaccgtc gccagcacaa 1680
gaagggtatc tctgaggtcc gtaccgcctt ttctttacca ctggattcga ttttcgcagt 1740
tggaatgata catctgggga ctgcgaatgg tttacccctc ggccgatact atgggtcgtg 1800
aagagatgga acattccgaa agtgttttgc ggataacatt ggtggcatcg aaaacagaat 1860
gctgaccatt gatttcaaca cgaacaggag gttgccaaga agcgtacccg ccgtgtcgtc 1920
aagtcccagc gtgccatcgt cggtgcttcc ctcgacgtga tcaaggagcg ccgctcccag 1980
cgccccgagg cccgtgccgc cgcccgccag caggccatca aggacgccaa ggagaagaag 2040
gctgccgctg agtccaagaa gaaggctgag aaggctaaga acgccgctgc tggtgccaag 2100
ggtgctgctc agcgcatcca gagcaagcag ggtgctaagg gttctgctcc caaggtcgct 2160
gccaagtctc gttaaggaat gaataacggt tcggcttggg attgggtgcg gaaggcaaga 2220
gtttcatgga cgaattttgg gaggttactg gagctggaat atgtgttttc cctaccacca 2280
aaaatgaaat gttccaaaac tatcggcgtg caagacggcc tcttacgggt ttaacggctc 2340
tcagataagc tctatcaatc gcgccacgga tgcatgaatg aagatccaga tggccgcggg 2400
atatatcgtg ctagtgtaat tcctacatga tcttgctgtt cactccatgc gcatccagat 2460
attccagggg tcgactgtta attgatatgc ctgggcttga gactccgtag acgcccagtc 2520
aatgtgcaat taatacgagg gtgctgttat cggcagcaac cttgtacttc tccataagat 2580
gggggaatgc catggacctg agtgatcaat tgacgcaagt ctcccataac gcggcggctt 2640
gacctaaaat ccatataccg ccccgttgag cctccgcgct ccagagtcct gtcccggaat 2700
agggcacaaa cctaggctaa cctaattcgt cgtccgcgtc tgagttcaga caaaagaact 2760
tccaagtatc agcagagtac gctgatattg ataagtaggc aaacataaga ccaataagca 2820
agtagaataa aaaattataa ggacactgcc tccataaagc gccctcccaa gacctcaggg 2880
acaaaacttc tcaagtggca attcactgcc tcaggccgtg tccagtgaag tgacgaagcg 2940
acactgttgc ctgctgactc agccgctttc cgccctgccg aatttgccat ctcgcttaca 3000
ggtcagcact agcgcgattc gcccacagat gctcagcgca aagtggtgac tcagtcaaac 3060
cccccctaca agattccacc tcgatttttc aacttcccat ctcgatccga caagttctac 3120
atccaccgtc aaaatggcct ccagcgaaga tgtcatcaag gagttcatgc gcttcaaggt 3180
ccgcatggaa ggatccgtca acggccacga gttcgagatt gagggtgagg gtgagggccg 3240
cccctacgaa ggcacccaga ctgccaagct caaggtcacc aagggtggtc ctctcccctt 3300
cgcttgggat atcctgtctc ctcagttcca gtacggctcc aaggtctacg tcaagcaccc 3360
cgccgacatc cccgactaca agaagctttc tttccccgag ggtttcaagt gggagcgtgt 3420
catgaacttc gaggatggtg gtgttgtgac cgttactcag gacagcagct tgcaggatgg 3480
ctctttcatc tacaaggtca agttcattgg tgtcaacttc ccctccgacg gccctgtcat 3540
gcagaagaag accatgggct gggaagcgtc gactgagcgt ctgtaccccc gtgacggtgt 3600
tctcaagggt gagatccaca aggctctcaa gctcaaggac ggtggtcact accttgttga 3660
gttcaagtcc atctacatgg ccaagaagcc tgtgcagctg cccggatact actacgtgga 3720
ctccaagctt gacatcacct cccacaacga agactacacc attgttgagc agtacgagcg 3780
tgctgagggc cgccaccacc tcttcctgac ccacggaatg gatgagctgt acaagtcgaa 3840
actataaata aatggtttgc gttgcgattg actgaaacga aaaaaagcga aaatgattct 3900
gggaatgaat tgataaagcg cgggctctgc ggtacggtta cggttgcggt cgcggacgaa 3960
tggactgggc tgagctgggc tggaggaagt ccatcgaaca aggacaaggg gtggaatatg 4020
gcacgggtcg attttgttat acatacccta ccatccatct atccatttaa ataccaaatg 4080
agttgttgaa tggattcgcg gtcttctcgg tttatttttg cttgcttgcg tgcttaaggg 4140
atagtgtgcc tcacgctttc cggcatcttc cagaccacag tatatccatc cgcctcctgt 4200
tgaagcttat tttttgtata ctgttttgtg atagcacgaa gtttttccac ggtatcttgt 4260
taaaaatata tatttgtggc gggcttacct acatcaaatt aataagagac taattataaa 4320
ctaaacacac aagcaagcta ctttagggta aaagtttata aatgcttttg acgtataaac 4380
gttgcttgta tttattatta caattaaagg tggatagaaa acctagagac tagttagaaa 4440
ctaatctcag gtttgcgtta aactaaatca gagcccgaga ggttaacaga acctagaagg 4500
ggactagata tccgggtagg gaaacaaaaa aaaaaaacaa gacagccaca tattagggag 4560
actagttaga agctagttcc aggactagga aaataaaaga caatgatacc acagtctagt 4620
tgacaactag atagattcta gattgaggcc aaagtctctg agatccaggt tagttgcaac 4680
taatactagt tagtatctag tctcctataa ctctgaagct agaataactt actactatta 4740
tcctcaccac tgttcagctg cgcaaacgga gtgattgcaa ggtgttcaga gactagttat 4800
tgactagtca gtgactagca ataactaaca aggtattaac ctaccatgtc tgccatcacc 4860
ctgcacttcc tcgggctcag cagccttttc ctcctcattt tcatgctcat tttccttgtt 4920
taagactgtg actagtcaaa gactagtcca gaaccacaaa ggagaaatgt cttaccactt 4980
tcttcattgc ttgtctcttt tgcattatcc atgtctgcaa ctagttagag tctagttagt 5040
gactagtccg acgaggactt gcttgtctcc ggattgttgg aggaactctc cagggcctca 5100
agatccacaa cagagccttc tagaagactg gtcaataact agttggtctt tgtctgagtc 5160
tgacttacga ggttgcatac tcgctccctt tgcctcgtca atcgatgaga aaaagcgcca 5220
aaactcgcaa tatggctttg aaccacacgg tgctgagact agttagaatc tagtcccaaa 5280
ctagcttgga tagcttacct ttgccctttg cgttgcgaca ggtcttgcag ggtatggttc 5340
ctttctcacc agctgattta gctgccttgc taccctcacg gcggatctgc ataaagagtg 5400
gctagaggtt ataaattagc actgatccta ggtacggggc tgaatgtaac ttgcctttcc 5460
tttctcatcg cgcggcaaga caggcttgct caaattccta ccagtcacag gggtatgcac 5520
ggcgtacgga ccacttgaac tagtcacaga ttagttagca actagtctgc attgaatggc 5580
tgtacttacg ggccctcgcc attgtcctga tcatttccag cttcaccctc gttgctgcaa 5640
agtagttagt gactagtcaa ggactagttg aaatgggaga agaaactcac gaattctcga 5700
cacccttagt attgtggtcc ttggacttgg tgctgctata tattagctaa tacactagtt 5760
agactcacag aaacttacgc agctcgcttg cgcttcttgg taggagtcgg ggttgggaga 5820
acagtgcctt caaacaagcc ttcataccat gctacttgac tagtcaggga ctagtcacca 5880
agtaatctag ataggacttg cctttggcct ccatcagttc cttcatagtg ggaggtccat 5940
tgtgcaatgt aaactccatg ccgtgggagt tcttgtcctt caagtgcttg accaatatgt 6000
ttctgttggc agagggaacc tgtcaactag ttaataacta gtcagaaact agtatagcag 6060
tagactcact gtacgcttga ggcatccctt cactcggcag tagacttcat atggatggat 6120
atcaggcacg ccattgtcgt cctgtggact agtcagtaac taggcttaaa gctagtcggg 6180
tcggcttact atcttgaaat ccggcagcgt aagctccccg tccttaactg cctcgagata 6240
gtgacagtac tctggggact ttcggagatc gttatcgcga atgctcggca tactaatcgt 6300
tgactagtct tggactagtc ccgagcaaaa aggattggag gaggaggagg aaggtgagag 6360
tgagacaaag agcgaaataa gagcttcaaa ggctatctct aagcagtatg aaggttaagt 6420
atctagttct tgactagatt taaaagagat ttcgactagt tatgtacctg gagtttggat 6480
ataggaatgt gttgtggtaa cgaaatgtaa gggggaggaa agaaaaagtc ggtcaagagg 6540
taactctaag tcggccattc ctttttggga ggcgctaacc ataaacggca tggtcgactt 6600
agagttagct cagggaattt agggagttat ctgcgaccac cgaggaacgg cggaatgcca 6660
aagaatcccg atggagctct agctggcggt tgacaacccc accttttggc gtttctgcgg 6720
cgttgcaggc gggactggat acttcgtaga accagaaagg caaggcagaa cgcgctcagc 6780
aagagtgttg gaagtgatag catgatgtgc cttgttaact aggtcaaaat ctgcagtatg 6840
cttgatgtta tccaaagtgt gagagaggaa ggtccaaaca tacacgattg ggagagggcc 6900
taggtataag agtttttgag tagaacgcat gtgagcccag ccatctcgag gagattaaac 6960
acgggccggc atttgatggc tatgttagta ccccaatgga aagcctgaga gtccagtggt 7020
cgcagataac tccctaaatt ccctgagcta actctaagtc gaccatgccg tttatggtta 7080
gcgcctccca aaaaggaatg gccgacttag agttacctct tgaccgactt tttctttcct 7140
cccccttaca tttcgttacc acaacacatt cctatatcca aactccaggt acataactag 7200
tcgaaatctc ttttaaatct agtcaagaac tagatactta accttcatac tgcttagaga 7260
tagcctttga agctcttatt tcgctctttg tctcactctc accttcctcc tcctcctcca 7320
atcctttttg ctcgggacta gtccaagact agtcaacgat tagtatgccg agcattcgcg 7380
ataacgatct ccgaaagtcc ccagagtact gtcactatct cgaggcagtt aaggacgggg 7440
agcttacgct gccggatttc aagatagtaa gccgacccga ctagctttaa gcctagttac 7500
tgactagtcc acaggacgac aatggcgtgc ctgatatcca tccatatgaa gtctactgcc 7560
gagtgaaggg atgcctcaag cgtacagtga gtctactgct atactagttt ctgactagtt 7620
attaactagt tgacaggttc cctctgccaa cagaaacata ttggtcaagc acttgaagga 7680
caagaactcc cacggcatgg agtttacatt gcacaatgga cctcccacta tgaaggaact 7740
gatggaggcc aaaggcaagt cctatctaga ttacttggtg actagtccct gactagtcaa 7800
gtagcatggt atgaaggctt gtttgaaggc actgttctcc caaccccgac tcctaccaag 7860
aagcgcaagc gagctgcgta agtttctgtg agtctaacta gtgtattagc taatatatag 7920
cagcaccaag tccaaggacc acaatactaa gggtgtcgag aattcgtgag tttcttctcc 7980
catttcaact agtccttgac tagtcactaa ctactttgca gcaacgaggg tgaagctgga 8040
aatgatcagg acaatggcga gggcccgtaa gtacagccat tcaatgcaga ctagttgcta 8100
actaatctgt gactagttca agtggtccgt acgccgtgca tacccctgtg actggtagga 8160
atttgagcaa gcctgtcttg ccgcgcgatg agaaaggaaa ggcaagttac attcagcccc 8220
gtacctagga tcagtgctaa tttataacct ctagccactc tttatgcaga tccgccgtga 8280
gggtagcaag gcagctaaat cagctggtga gaaaggaacc ataccctgca agacctgtcg 8340
caacgcaaag ggcaaaggta agctatccaa gctagtttgg gactagattc taactagtct 8400
cagcaccgtg tggttcaaag ccatattgcg agttttggcg ctttttctca tcgattgacg 8460
aggcaaaggg agcgagtatg caacctcgta agtcagactc agacaaagac caactagtta 8520
ttgaccagtc ttctagaagg ctctgttgtg gatcttgagg ccctggagag ttcctccaac 8580
aatccggaga caagcaagtc ctcgtcggac tagtcactaa ctagactcta actagttgca 8640
gacatggata atgcaaaaga gacaagcaat gaagaaagtg gtaagacatt tctcctttgt 8700
ggttctggac tagtctttga ctagtcacag tcttaaacaa ggaaaatgag catgaaaatg 8760
aggaggaaaa ggctgctgag cccgaggaag tgcagggtga tggcagacat ggtaggttaa 8820
taccttgtta gttattgcta gtcactgact agtcaataac tagtctctga acaccttgca 8880
atcactccgt ttgcgcagct gaacagtggt gaggataata gtagtaagtt attctagctt 8940
cagagttata ggagactaga tactaactag tattagttgc aactaacctg gatctcagag 9000
actttggcct caatctagaa tctatctagt tgtcaactag actgtggtat cattgtcttt 9060
tattttccta gtcctggaac tagcttctaa ctagtctccc taatatgtgg ctgtcttgtt 9120
tttttttttt gtttccctac ccggatatct agtccccttc taggttctgt taacctctcg 9180
ggctctgatt tagtttaacg caaacctgag attagtttct aactagtctc taggttttct 9240
atccaccttt aattgtaata ataaatacaa gcaacgttta tacgtcaaaa gcatttataa 9300
acttttaccc taaagtagct tgcttgtgtg tttagtttat aattagtctc ttattaattt 9360
gatgtaggta agcccgccac aaatatatat ttttaacaag ataccgtgga aaaacttcgt 9420
gctatcacaa aacagtatac aaaaaataag ctatcgaatt cctgcagaga tcatcctgtc 9480
ttcagtctta agacttctct cctatatcac ccgcacttac cctagagtgc cgcttaggtg 9540
ctaagggcac attgagtatt ggccgtgtag aatatatagc ttaagtacgg ccaagcagac 9600
gggaagccct gttctccaca ccctatggtc gtatatatca ggcttctacc gggaaacgat 9660
taagagtgta taatggactg aaaatcaata tgaacgggac aatgctcaag ttaaattagt 9720
taggcatcct aatctctact aaatgttcta tctagagatc ggggtactat aggcccgtac 9780
gttaatcact ctacgcttct ctcccttagg tatagtgtag gtaggggcta gacatttata 9840
tgagtcagat ggtacaaacg gtaggcagtg cgggcgaaga agtgaagacg gagtcggttg 9900
aagctacata caaaagatgc attggctcgt catgaagagc ctcccgggtt tattcctttg 9960
ccctcggacg agtgctgggg cgtcggtttc cactatcggc gagtacttct acacagccat 10020
cggtccagac ggccgcgctt ctgcgggcga tttgtgtacg cccgacagtc ccggctccgg 10080
atcggacgat tgcgtcgcat cgaccctgcg cccaagctgc atcatcgaaa ttgccgtcaa 10140
ccaagctctg atagagttgg tcaagaccaa tgcggagcat atacgcccgg agccgcggcg 10200
atcctgcaag ctccggatgc ctccgctcga agtagcgcgt ctgctgctcc atacaagcca 10260
accacggcct ccagaagaag atgttggcga cctcgtattg ggaatccccg aacatcgcct 10320
cgctccagtc aatgaccgct gttatgcggc cattgtccgt caggacattg ttggagccga 10380
aatccgcgtg cacgaggtgc cggacttcgg ggcagtcctc ggcccaaagc atcagctcat 10440
cgagagcctg cgcgacggac gcactgacgg tgtcgtccat cacagtttgc cagtgataca 10500
catggggatc agcaatcgcg catatgaaat cacgccatgt agtgtattga ccgattcctt 10560
gcggtccgaa tgggccgaac ccgctcgtct ggctaagatc ggccgcagcg atcgcatcca 10620
tggcctccgc gaccggctgc agaacagcgg gcagttcggt ttcaggcagg tcttgcaacg 10680
tgacaccctg tgcacggcgg gagatgcaat aggtcaggct ctcgctgaat tccccaatgt 10740
caagcacttc cggaatcggg agcgcggccg atgcaaagtg ccgataaaca taacgatctt 10800
tgtagaaacc atcggcgcag ctatttaccc gcaggacata tccacgccct cctacatcga 10860
agctgaaagc acgagattct tcgccctccg agagctgcat caggtcggag acgctgtcga 10920
acttttcgat cagaaacttc tcgacagacg tcgcggtgag ttcaggcatt ttgacggtgg 10980
gatcctgtga tgtctgctca agcggggtag ctgttagtca agctgcgatg aagtgggaaa 11040
gctcgaactg aaaggttcaa aggaataagg gatgggaagg atggagtatg gatgtagcaa 11100
agtacttact taggggaaat aaaggttctt ggatgggaag atgaatatac tgaagatggg 11160
aaaagaaaga gaaaagaaaa gagcagctgg tggggagagc aggaaaatat ggcaacaaat 11220
gttggactga cgcaacgacc ttgtcaaccc cgccgacaca ccgggcggac agacggggca 11280
aagctgccta ccagggactg agggacctca gcaggtcgag tgcagagcac cggatgggtc 11340
gactgccagc ttgtgttccc ggtctgcgcc gctggccagc tcctgagcgg cctttccggt 11400
ttcatacacc gggcaaagca ggagaggcac gatatttgga cgccctacag atgccggatg 11460
ggccaattag ggagcttacg cgccgggtac tcgctctacc tacttcggag aaggtactat 11520
ctcgtgaatc ttttaccaga tcggaagcaa ttggacttct gtacctaggt taatggcatg 11580
ctatttcgcc gacggctata cacccctggc ttcacattct ccttcgctta ctgccggtga 11640
ttcgatgaag ctccatattc tccgatgatg caatagattc ttggtcaacg aggggcacac 11700
cagcctttcc acttcggggc ggaggggcgg ccggtcccgg attaataatc atccactgca 11760
cctcagagcc gccagagctg tctggcgcag tggcgcttat tactcagccc ttctctctgc 11820
gtccgtccgt ctctccgcat gccagaaaga gtcaccggtc actgtacaga gcggccgcca 11880
ccgcggtgga gctccaattc gccctatagt gagtcgtatt acgcgcgctc actggccgtc 11940
gttttacaac gtcgtgactg ggaaaaccct ggcgttaccc aacttaatcg ccttgcagca 12000
catccccctt tcgccagctg gcgtaatagc gaagaggccc gcaccgatcg cccttcccaa 12060
cagttgcgca gcctgaatgg cgaatgggac gcgccctgta gcggcgcatt aagcgcggcg 12120
ggtgtggtgg ttacgcgcag cgtgaccgct acacttgcca gcgccctagc gcccgctcct 12180
ttcgctttct tcccttcctt tctcgccacg ttcgccggct ttccccgtca agctctaaat 12240
cgggggctcc ctttagggtt ccgatttagt gctttacggc acctcgaccc caaaaaactt 12300
gattagggtg atggttcacg tagtgggcca tcgccctgat agacggtttt tcgccctttg 12360
acgttggagt ccacgttctt taatagtgga ctcttgttcc aaactggaac aacactcaac 12420
cctatctcgg tctattcttt tgatttataa gggattttgc cgatttcggc ctattggtta 12480
aaaaatgagc tgatttaaca aaaatttaac gcgaatttta acaaaatatt aacgcttaca 12540
atttaggtgg cacttttcgg ggaaatgtgc gcggaacccc tatttgttta tttttctaaa 12600
tacattcaaa tatgtatccg ctcatgagac aataaccctg ataaatgctt caataatatt 12660
gaaaaaggaa gagtatgagt attcaacatt tccgtgtcgc ccttattccc ttttttgcgg 12720
cattttgcct tcctgttttt gctcacccag aaacgctggt gaaagtaaaa gatgctgaag 12780
atcagttggg tgcacgagtg ggttacatcg aactggatct caacagcggt aagatccttg 12840
agagttttcg ccccgaagaa cgttttccaa tgatgagcac ttttcgaccg aataaatacc 12900
tgtgacggaa gatcacttcg cagaataaat aaatcctggt gtccctgttg ataccgggaa 12960
gccctgggcc aacttttggc gaaaatgaga cgttgatcgg cacgtaagag gttccaactt 13020
tcaccataat gaaataagat cactaccggg cgtatttttt gagttgtcga gattttcagg 13080
agctaaggaa gctaaaatgg agaaaaaaat cactggatat accaccgttg atatatccca 13140
atggcatcgt aaagaacatt ttgaggcatt tcagtcagtt gctcaatgta cctataacca 13200
gaccgttcag ctggatatta cggccttttt aaagaccgta aagaaaaata agcacaagtt 13260
ttatccggcc tttattcaca ttcttgcccg cctgatgaat gctcatccgg aattacgtat 13320
ggcaatgaaa gacggtgagc tggtgatatg ggatagtgtt cacccttgtt acaccgtttt 13380
ccatgagcaa actgaaacgt tttcatcgct ctggagtgaa taccacgacg atttccggca 13440
gtttctacac atatattcgc aagatgtggc gtgttacggt gaaaacctgg cctatttccc 13500
taaagggttt attgagaata tgtttttcgt ctcagccaat ccctgggtga gtttcaccag 13560
ttttgattta aacgtggcca atatggacaa cttcttcgcc cccgttttca ccatgggcaa 13620
atattatacg caaggcgaca aggtgctgat gccgctggcg attcaggttc atcatgccgt 13680
ttgtgatggc ttccatgtcg gcagaatgct taatgaatta caacagtact gcgatgagtg 13740
gcagggcggg gcgtaatttt tttaaggcag ttattggtgc ccttaaacgc ctggttgcta 13800
cgcctgaata agtgataata agcggatgaa tggcagaaat tcgaaagcaa attcgacccg 13860
gtcgtcggtt cagggcaggg tcgttaaata gccgcttatg tctattgctg gtttaccggt 13920
ttattgacta ccggaagcag tgtgaccgtg tgcttctcaa atgcctgagg ccagtttgct 13980
caggctctcc ccgtggaggt aataattgac gatatgatcc tttttttctg atcaaaaagg 14040
atctaggtga agatcctttt tgataatctc atgaccaaaa tcccttaacg tgagttttcg 14100
ttccactgag cgtcagaccc cgtagaaaag atcaaaggat cttcttgaga tccttttttt 14160
ctgcgcgtaa tctgctgctt gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg 14220
ccggatcaag agctaccaac tctttttccg aaggtaactg gcttcagcag agcgcagata 14280
ccaaatactg ttcttctagt gtagccgtag ttaggccacc acttcaagaa ctctgtagca 14340
ccgcctacat acctcgctct gctaatcctg ttaccagtgg ctgctgccag tggcgataag 14400
tcgtgtctta ccgggttgga ctcaagacga tagttaccgg ataaggcgca gcggtcgggc 14460
tgaacggggg gttcgtgcac acagcccagc ttggagcgaa cgacctacac cgaactgaga 14520
tacctacagc gtgagctatg agaaagcgcc acgcttcccg aagggagaaa ggcggacagg 14580
tatccggtaa gcggcagggt cggaacagga gagcgcacga gggagcttcc agggggaaac 14640
gcctggtatc tttatagtcc tgtcgggttt cgccacctct gacttgagcg tcgatttttg 14700
tgatgctcgt caggggggcg gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg 14760
ttcctggcct tttgctggcc ttttgctcac atgttctttc ctgcgttatc ccctgattct 14820
gtggataacc gtattaccgc ctttgagtga gctgataccg ctcgccgcag ccgaacgacc 14880
gagcgcagcg agtcagtgag cgaggaagcg gaagagcgcc caatacgcaa accgcctctc 14940
cccgcgcgtt ggccgattca ttaatgcagc tggcacgaca ggtttcccga ctggaaagcg 15000
ggcagtgagc gcaacgcaat taatgtgagt tagctcactc attaggcacc ccaggcttta 15060
cactttatgc tcccggctcg tatgttgtgt ggaattgtga gcggataaca atttcacaca 15120
ggaaacagct atgaccatga ttacgccaag cgcgcaatta accctcacta aagggaacaa 15180
aagctg 15186
<210> 67
<211> 3519
<212> DNA
<213> Artificial Sequence
<220>
<223> TOPO Zero Blunt cloning vector
<400> 67
agcgcccaat acgcaaaccg cctctccccg cgcgttggcc gattcattaa tgcagctggc 60
acgacaggtt tcccgactgg aaagcgggca gtgagcgcaa cgcaattaat gtgagttagc 120
tcactcatta ggcaccccag gctttacact ttatgcttcc ggctcgtatg ttgtgtggaa 180
ttgtgagcgg ataacaattt cacacaggaa acagctatga ccatgattac gccaagctat 240
ttaggtgaca ctatagaata ctcaagctat gcatcaagct tggtaccgag ctcggatcca 300
ctagtaacgg ccgccagtgt gctggaattc gcccttaagg gcgaattctg cagatatcca 360
tcacactggc ggccgctcga gcatgcatct agagggccca attcgcccta tagtgagtcg 420
tattacaatt cactggccgt cgttttacaa cgtcgtgact gggaaaaccc tggcgttacc 480
caacttaatc gccttgcagc acatccccct ttcgccagct ggcgtaatag cgaagaggcc 540
cgcaccgatc gcccttccca acagttgcgc agcctatacg tacggcagtt taaggtttac 600
acctataaaa gagagagccg ttatcgtctg tttgtggatg tacagagtga tattattgac 660
acgccggggc gacggatggt gatccccctg gccagtgcac gtctgctgtc agataaagtc 720
tcccgtgaac tttacccggt ggtgcatatc ggggatgaaa gctggcgcat gatgaccacc 780
gatatggcca gtgtgccggt ctccgttatc ggggaagaag tggctgatct cagccaccgc 840
gaaaatgaca tcaaaaacgc cattaacctg atgttctggg gaatataaat gtcaggcatg 900
agattatcaa aaaggatctt cacctagatc cttttcacgt agaaagccag tccgcagaaa 960
cggtgctgac cccggatgaa tgtcagctac tgggctatct ggacaaggga aaacgcaagc 1020
gcaaagagaa agcaggtagc ttgcagtggg cttacatggc gatagctaga ctgggcggtt 1080
ttatggacag caagcgaacc ggaattgcca gctggggcgc cctctggtaa ggttgggaag 1140
ccctgcaaag taaactggat ggctttctcg ccgccaagga tctgatggcg caggggatca 1200
agctctgatc aagagacagg atgaggatcg tttcgcatga ttgaacaaga tggattgcac 1260
gcaggttctc cggccgcttg ggtggagagg ctattcggct atgactgggc acaacagaca 1320
atcggctgct ctgatgccgc cgtgttccgg ctgtcagcgc aggggcgccc ggttcttttt 1380
gtcaagaccg acctgtccgg tgccctgaat gaactgcaag acgaggcagc gcggctatcg 1440
tggctggcca cgacgggcgt tccttgcgca gctgtgctcg acgttgtcac tgaagcggga 1500
agggactggc tgctattggg cgaagtgccg gggcaggatc tcctgtcatc tcaccttgct 1560
cctgccgaga aagtatccat catggctgat gcaatgcggc ggctgcatac gcttgatccg 1620
gctacctgcc cattcgacca ccaagcgaaa catcgcatcg agcgagcacg tactcggatg 1680
gaagccggtc ttgtcgatca ggatgatctg gacgaagagc atcaggggct cgcgccagcc 1740
gaactgttcg ccaggctcaa ggcgagcatg cccgacggcg aggatctcgt cgtgacccat 1800
ggcgatgcct gcttgccgaa tatcatggtg gaaaatggcc gcttttctgg attcatcgac 1860
tgtggccggc tgggtgtggc ggaccgctat caggacatag cgttggctac ccgtgatatt 1920
gctgaagagc ttggcggcga atgggctgac cgcttcctcg tgctttacgg tatcgccgct 1980
cccgattcgc agcgcatcgc cttctatcgc cttcttgacg agttcttctg aattattaac 2040
gcttacaatt tcctgatgcg gtattttctc cttacgcatc tgtgcggtat ttcacaccgc 2100
atacaggtgg cacttttcgg ggaaatgtgc gcggaacccc tatttgttta tttttctaaa 2160
tacattcaaa tatgtatccg ctcatgagac aataaccctg ataaatgctt caataatagc 2220
acgtgaggag ggccaccatg gccaagttga ccagtgccgt tccggtgctc accgcgcgcg 2280
acgtcgccgg agcggtcgag ttctggaccg accggctcgg gttctcccgg gacttcgtgg 2340
aggacgactt cgccggtgtg gtccgggacg acgtgaccct gttcatcagc gcggtccagg 2400
accaggtggt gccggacaac accctggcct gggtgtgggt gcgcggcctg gacgagctgt 2460
acgccgagtg gtcggaggtc gtgtccacga acttccggga cgcctccggg ccggccatga 2520
ccgagatcgg cgagcagccg tgggggcggg agttcgccct gcgcgacccg gccggcaact 2580
gcgtgcactt cgtggccgag gagcaggact gacacgtgct aaaacttcat ttttaattta 2640
aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct taacgtgagt 2700
tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct tgagatcctt 2760
tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca gcggtggttt 2820
gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc agcagagcgc 2880
agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc aagaactctg 2940
tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct gccagtggcg 3000
ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag gcgcagcggt 3060
cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc tacaccgaac 3120
tgagatacct acagcgtgag ctatgagaaa gcgccacgct tcccgaaggg agaaaggcgg 3180
acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag cttccagggg 3240
gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt gagcgtcgat 3300
ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac gcggcctttt 3360
tacggttcct gggcttttgc tggccttttg ctcacatgtt ctttcctgcg ttatcccctg 3420
attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc cgcagccgaa 3480
cgaccgagcg cagcgagtca gtgagcgagg aagcggaag 3519
<210> 68
<211> 3506
<212> DNA
<213> Artificial Sequence
<220>
<223> Backbone vector AB
<400> 68
tagaaaaact catcgagcat caaatgaaac tgcaatttat tcatatcagg attatcaata 60
ccatattttt gaaaaagccg tttctgtaat gaaggagaaa actcaccgag gcagttccat 120
aggatggcaa gatcctggta tcggtctgcg attccgactc gtccaacatc aatacaacct 180
attaatttcc cctcgtcaaa aataaggtta tcaagtgaga aatcaccatg agtgacgact 240
gaatccggtg agaatggcaa aagtttatgc atttctttcc agacttgttc aacaggccag 300
ccattacgct cgtcatcaaa atcactcgca tcaaccaaac cgttattcat tcgtgattgc 360
gcctgagcga ggcgaaatac gcgatcgctg ttaaaaggac aattacaaac aggaatcgag 420
tgcaaccggc gcaggaacac tgccagcgca tcaacaatat tttcacctga atcaggatat 480
tcttctaata cctggaacgc tgtttttccg gggatcgcag tggtgagtaa ccatgcatca 540
tcaggagtac ggataaaatg cttgatggtc ggaagtggca taaattccgt cagccagttt 600
agtctgacca tctcatctgt aacatcattg gcaacgctac ctttgccatg tttcagaaac 660
aactctggcg catcgggctt cccatacaag cgatagattg tcgcacctga ttgcccgaca 720
ttatcgcgag cccatttata cccatataaa tcagcatcca tgttggaatt taatcgcggc 780
ctcgacgttt cccgttgaat atggctcata ttcttccttt ttcaatatta ttgaagcatt 840
tatcagggtt attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa 900
ataggggtca gtgttacaac caattaacca attctgaaca ttatcgcgag cccatttata 960
cctgaatatg gctcataaca ccccttgttt gcctggcggc agtagcgcgg tggtcccacc 1020
tgaccccatg ccgaactcag aagtgaaacg ccgtagcgcc gatggtagtg tggggactcc 1080
ccatgcgaga gtagggaact gccaggcatc aaataaaacg aaaggctcag tcgaaagact 1140
gggcctttcg cccgggctaa ttagggggtg tcgcccttat tcgactctat agtgaagttc 1200
ctattctcta gaaagtatag gaacttctga agtggggttg cccatcgaac gtacaagtac 1260
tcctctgttc tctccttcct ttgctttgtg cggagaccgg cttactaaaa gccagataac 1320
agtatgcata tttgcgcgct gatttttgcg gtataagaat atatactgat atgtataccc 1380
gaagtatgtc aaaaagaggt atgctatgaa gcagcgtatt acagtgacag ttgacagcga 1440
cagctatcag ttgctcaagg catatatgat gtcaatatct ccggtctggt aagcacaacc 1500
atgcagaatg aagcccgtcg tctgcgtgcc gaacgctgga aagcggaaaa tcaggaaggg 1560
atggctgagg tcgcccggtt tattgaaatg aacggctctt ttgctgacga gaacaggggc 1620
tggtgaaatg cagtttaagg tttacaccta taaaagagag agccgttatc gtctgtttgt 1680
ggatgtacag agtgatatta ttgacacgcc cgggcgacgg atggtgatcc ccctggccag 1740
tgcacgtctg ctgtcagata aagtctcccg tgaactttac ccggtggtgc atatcgggga 1800
tgaaagctgg cgcatgatga ccaccgatat ggccagtgtg ccggtttccg ttatcgggga 1860
agaagtggct gatctcagcc accgcgaaaa tgacatcaaa aacgccatta acctgatgtt 1920
ctggggaata taaggtctcg cctccggatc gatgtacaca accgactgca cccaaacgaa 1980
cacaaatctt agcaaaaatg aagtgaagtt cctatacttt ctagagaata ggaacttcta 2040
tagtgagtcg aataagggcg acacaaaatt tattctaaat gcataataaa tactgataac 2100
atcttatagt ttgtattata ttttgtatta tcgttgacat gtataatttt gatatcaaaa 2160
actgattttc cctttattat tttcgagatt tattttctta attctcttta acaaactaga 2220
aatattgtat atacaaaaaa tcataaataa tagatgaata gtttaattat aggtgttcat 2280
caatcgaaaa agcaacgtat cttatttaaa gtgcgttgct tttttctcat ttataaggtt 2340
aaataattct catatatcaa gcaaagtgac aggcgccctt aaatattctg acaaatgctc 2400
tttccctaaa ctccccccat aaaaaaaccc gccgaagcgg gtttttacgt tatttgcgga 2460
ttaacgatta ctcgttatca gaaccgccca gggggcccga gcttaagact ggccgtcgtt 2520
ttacaacaca gaaagagttt gtagaaacgc aaaaaggcca tccgtcaggg gccttctgct 2580
tagtttgatg cctggcagtt ccctactctc gccttccgct tcctcgctca ctgactcgct 2640
gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt 2700
atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc 2760
caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga 2820
gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata 2880
ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac 2940
cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcata gctcacgctg 3000
taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc 3060
cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag 3120
acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt 3180
aggcggtgct acagagttct tgaagtggtg ggctaactac ggctacacta gaagaacagt 3240
atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg 3300
atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac 3360
gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca 3420
gtggaacgac gcgcgcgtaa ctcacgttaa gggattttgg tcatgagctt gcgccgtccc 3480
gtcaagtcag cgtaatgctc tgcttt 3506
<210> 69
<211> 6938
<212> DNA
<213> Artificial Sequence
<220>
<223> Vector SGIC DNA hygB
<400> 69
tagaaaaact catcgagcat caaatgaaac tgcaatttat tcatatcagg attatcaata 60
ccatattttt gaaaaagccg tttctgtaat gaaggagaaa actcaccgag gcagttccat 120
aggatggcaa gatcctggta tcggtctgcg attccgactc gtccaacatc aatacaacct 180
attaatttcc cctcgtcaaa aataaggtta tcaagtgaga aatcaccatg agtgacgact 240
gaatccggtg agaatggcaa aagtttatgc atttctttcc agacttgttc aacaggccag 300
ccattacgct cgtcatcaaa atcactcgca tcaaccaaac cgttattcat tcgtgattgc 360
gcctgagcga ggcgaaatac gcgatcgctg ttaaaaggac aattacaaac aggaatcgag 420
tgcaaccggc gcaggaacac tgccagcgca tcaacaatat tttcacctga atcaggatat 480
tcttctaata cctggaacgc tgtttttccg gggatcgcag tggtgagtaa ccatgcatca 540
tcaggagtac ggataaaatg cttgatggtc ggaagtggca taaattccgt cagccagttt 600
agtctgacca tctcatctgt aacatcattg gcaacgctac ctttgccatg tttcagaaac 660
aactctggcg catcgggctt cccatacaag cgatagattg tcgcacctga ttgcccgaca 720
ttatcgcgag cccatttata cccatataaa tcagcatcca tgttggaatt taatcgcggc 780
ctcgacgttt cccgttgaat atggctcata ttcttccttt ttcaatatta ttgaagcatt 840
tatcagggtt attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa 900
ataggggtca gtgttacaac caattaacca attctgaaca ttatcgcgag cccatttata 960
cctgaatatg gctcataaca ccccttgttt gcctggcggc agtagcgcgg tggtcccacc 1020
tgaccccatg ccgaactcag aagtgaaacg ccgtagcgcc gatggtagtg tggggactcc 1080
ccatgcgaga gtagggaact gccaggcatc aaataaaacg aaaggctcag tcgaaagact 1140
gggcctttcg cccgggctaa ttagggggtg tcgcccttat tcgactctat agtgaagttc 1200
ctattctcta gaaagtatag gaacttctga agtggggttg cccatcgaac gtacaagtac 1260
tcctctgttc tctccttcct ttgctttgtg cctgcgacag cggattgggc ggagaagaag 1320
acaacccttc agatatattc aggtgctttt ccctcacatg ttttgccgca ccagccatcc 1380
cactatcaaa aagcgatgat gtttgagatt gtcgggtgtc cacatctttt agtgtgaatc 1440
gctagtagaa tttgggatat tattgagcat catcccatga tagcgagtac aagccccgag 1500
taaataccaa cattgctatg ctgctgtgct gctatctagt ttgctacgtt ggtcgttgac 1560
ctcacaggga tttccaccaa aaagtggacc gggcgggcgc cactcggccg tgccacagca 1620
gcctgagagc ggacaaataa caacagccgc ctgccgcggg gttcggttgc aaacatgacc 1680
aacaggccag gccatcatca acccaccgct gcgttgatgc ccaggatttc agtccaataa 1740
tccacaattt accaacggat agagctaggt gaattagata gacaggaggg ccagagggag 1800
gggaccgaga tgaaaaattt tcgatgaaag agtggtcaag gtggggtcgt agttcggcgc 1860
tccgagggcg aggaaccaag gaaaggcgag gaaaggacag gctgatcgcg ctgcgttgct 1920
gggctgcaag cgtgtccagt tgagtctgga aaaggctccg ccgtgaagat tctgcgttgg 1980
tcccgcacct gcgcggtggg ggcattaccc ctccatgtcc aatgatttca agtcaaagcc 2040
aagggttgaa gcccgcccgc ttagtcgcct tctcgcttga cccctccata taagtatttc 2100
ccctcctccc cctcccacaa atttttcctt tccctttcct ccctcgtccg cttcagtacg 2160
tatatcttcc ccccctctct cttccttctc actcttctct ccttctttct tgattcatcc 2220
tctctctaac tgacttcttt gctcagcacc tctacgcgtt ctggccgtag tatctgagca 2280
atttttctac agactttttc tatctaattc caaaaaagaa cttcgagttc attcaccacc 2340
gtcaaaatga tctgactgat gagtccgtga ggacgaaacg agtaagctcg tctcagatat 2400
attcagtcac tggttttaga gctagaaata gcaagttaaa ataaggctag tccgttatca 2460
acttgaaaaa gtggcaccga gtcggtgctt ttggccggca tggtcccagc ctcctcgctg 2520
gcgccggctg ggcaacatgc ttcggcatgg cgaatgggac taaaatgcgc taaactgggc 2580
ttgactcagg gagggatcat ggactagcca attgggcgtg cacagcgcga ctttggagct 2640
ggttctggct cgcatgactt gtttcgtgct gcgggggatt ccgttcggac ctgacatttt 2700
aaaaataaaa aatggaaaca tcttgaaaga caaaaatgag tttcagtagt ggtctacaga 2760
ccgtagtttt gttcctattc acagtgaaaa taaggcgctg caattgctac gttcataaat 2820
cgagtattgt tgtgctccga agcgccagtc cccatgttcc gcaccctcaa agccaaagtt 2880
cgcgttccga ccttgcctcc caaatccgag ttgcgattaa tggctctgta cagtgaccgg 2940
tgactctttc tggcatgcgg agagacggac ggacgcagag agaagggctg agtaataagc 3000
gccactgcgc cagacagctc tggcggctct gaggtgcagt ggatgattat taatccggga 3060
ccggccgccc ctccgccccg aagtggaaag gctggtgtgc ccctcgttga ccaagaatct 3120
attgcatcat cggagaatat ggagcttcat cgaatcaccg gcagtaagcg aaggagaatg 3180
tgaagccagg ggtgtatagc cgtcggcgaa atagcatgcc attaacctag gtacagaagt 3240
ccaattgctt ccgatctggt aaaagattca cgagatagta ccttctccga agtaggtaga 3300
gcgagtaccc ggcgcgtaag ctccctaatt ggcccatccg gcatctgtag ggcgtccaaa 3360
tatcgtgcct ctcctgcttt gcccggtgta tgaaaccgga aaggccgctc aggagctggc 3420
cagcggcgca gaccgggaac acaagctggc agtcgaccca tccggtgctc tgcactcgac 3480
ctgctgaggt ccctcagtcc ctggtaggca gctttgcccc gtctgtccgc ccggtgtgtc 3540
ggcggggttg acaaggtcgt tgcgtcagtc caacatttgt tgccatattt tcctgctctc 3600
cccaccagct gctcttttct tttctctttc ttttcccatc ttcagtatat tcatcttccc 3660
atccaagaac ctttatttcc cctaagtaag tactttgcta catccatact ccatccttcc 3720
catcccttat tcctttgaac ctttcagttc gagctttccc acttcatcgc agcttgacta 3780
acagctaccc cgcttgagca gacatcacag gatcccaccg tcaaaatgcc tgaactcacc 3840
gcgacgtctg tcgagaagtt tctgatcgaa aagttcgaca gcgtctccga cctgatgcag 3900
ctctcggagg gcgaagaatc tcgtgctttc agcttcgatg taggagggcg tggatatgtc 3960
ctgcgggtaa atagctgcgc cgatggtttc tacaaagatc gttatgttta tcggcacttt 4020
gcatcggccg cgctcccgat tccggaagtg cttgacattg gggaattcag cgagagcctg 4080
acctattgca tctcccgccg tgcacagggt gtcacgttgc aagacctgcc tgaaaccgaa 4140
ctgcccgctg ttctgcagcc ggtcgcggag gccatggatg cgatcgctgc ggccgatctt 4200
agccagacga gcgggttcgg cccattcgga ccgcaaggaa tcggtcaata cactacatgg 4260
cgtgatttca tatgcgcgat tgctgatccc catgtgtatc actggcaaac tgtgatggac 4320
gacaccgtca gtgcgtccgt cgcgcaggct ctcgatgagc tgatgctttg ggccgaggac 4380
tgccccgaag tccggcacct cgtgcacgcg gatttcggct ccaacaatgt cctgacggac 4440
aatggccgca taacagcggt cattgactgg agcgaggcga tgttcgggga ttcccaatac 4500
gaggtcgcca acatcttctt ctggaggccg tggttggctt gtatggagca gcagacgcgc 4560
tacttcgagc ggaggcatcc ggagcttgca ggatcgccgc ggctccgggc gtatatgctc 4620
cgcattggtc ttgaccaact ctatcagagc ttggttgacg gcaatttcga tgatgcagct 4680
tgggcgcagg gtcgatgcga cgcaatcgtc cgatccggag ccgggactgt cgggcgtaca 4740
caaatcgccc gcagaagcgc ggccgtctgg accgatggct gtgtagaagt actcgccgat 4800
agtggaaacc gacgccccag cactcgtccg agggcaaagg aataaacccg ggaggctctt 4860
catgacgagc caatgcatct tttgtatgta gcttcaaccg actccgtctt cacttcttcg 4920
cccgcactgc ctaccgtttg taccatctga ctcatataaa tgtctagccc ctacctacac 4980
tatacctaag ggagagaagc gtagagtgat taacgtacgg gcctatagta ccccgatctc 5040
tagatagaac atttagtaga gattaggatg cctaactaat ttaacttgag cattgtcccg 5100
ttcatattga ttttcagtcc attatacact cttaatcgtt tcccggtaga agcctgatat 5160
atacgaccat agggtgtgga gaacagggct tcccgtctgc ttggccgtac ttaagctata 5220
tattctacac ggccaatact caatgtgccc ttagcaccta agcggcactc tagggtaagt 5280
gcgggtgata taggagagaa gtcttaagac tgaagacagg atgggaagaa gacggctgac 5340
cacgcaactt gcactgtccg attctttgac tgcctccgga tcgatgtaca caaccgactg 5400
cacccaaacg aacacaaatc ttagcaaaaa tgaagtgaag ttcctatact ttctagagaa 5460
taggaacttc tatagtgagt cgaataaggg cgacacaaaa tttattctaa atgcataata 5520
aatactgata acatcttata gtttgtatta tattttgtat tatcgttgac atgtataatt 5580
ttgatatcaa aaactgattt tccctttatt attttcgaga tttattttct taattctctt 5640
taacaaacta gaaatattgt atatacaaaa aatcataaat aatagatgaa tagtttaatt 5700
ataggtgttc atcaatcgaa aaagcaacgt atcttattta aagtgcgttg cttttttctc 5760
atttataagg ttaaataatt ctcatatatc aagcaaagtg acaggcgccc ttaaatattc 5820
tgacaaatgc tctttcccta aactcccccc ataaaaaaac ccgccgaagc gggtttttac 5880
gttatttgcg gattaacgat tactcgttat cagaaccgcc cagggggccc gagcttaaga 5940
ctggccgtcg ttttacaaca cagaaagagt ttgtagaaac gcaaaaaggc catccgtcag 6000
gggccttctg cttagtttga tgcctggcag ttccctactc tcgccttccg cttcctcgct 6060
cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc 6120
ggtaatacgg ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg 6180
ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg 6240
cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg 6300
actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac 6360
cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca 6420
tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt 6480
gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc 6540
caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag 6600
agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tgggctaact acggctacac 6660
tagaagaaca gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt 6720
tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa 6780
gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg 6840
gtctgacgct cagtggaacg acgcgcgcgt aactcacgtt aagggatttt ggtcatgagc 6900
ttgcgccgtc ccgtcaagtc agcgtaatgc tctgcttt 6938
<210> 70
<211> 6293
<212> DNA
<213> Artificial Sequence
<220>
<223> Vector SGIC DNA phleo
<400> 70
tagaaaaact catcgagcat caaatgaaac tgcaatttat tcatatcagg attatcaata 60
ccatattttt gaaaaagccg tttctgtaat gaaggagaaa actcaccgag gcagttccat 120
aggatggcaa gatcctggta tcggtctgcg attccgactc gtccaacatc aatacaacct 180
attaatttcc cctcgtcaaa aataaggtta tcaagtgaga aatcaccatg agtgacgact 240
gaatccggtg agaatggcaa aagtttatgc atttctttcc agacttgttc aacaggccag 300
ccattacgct cgtcatcaaa atcactcgca tcaaccaaac cgttattcat tcgtgattgc 360
gcctgagcga ggcgaaatac gcgatcgctg ttaaaaggac aattacaaac aggaatcgag 420
tgcaaccggc gcaggaacac tgccagcgca tcaacaatat tttcacctga atcaggatat 480
tcttctaata cctggaacgc tgtttttccg gggatcgcag tggtgagtaa ccatgcatca 540
tcaggagtac ggataaaatg cttgatggtc ggaagtggca taaattccgt cagccagttt 600
agtctgacca tctcatctgt aacatcattg gcaacgctac ctttgccatg tttcagaaac 660
aactctggcg catcgggctt cccatacaag cgatagattg tcgcacctga ttgcccgaca 720
ttatcgcgag cccatttata cccatataaa tcagcatcca tgttggaatt taatcgcggc 780
ctcgacgttt cccgttgaat atggctcata ttcttccttt ttcaatatta ttgaagcatt 840
tatcagggtt attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa 900
ataggggtca gtgttacaac caattaacca attctgaaca ttatcgcgag cccatttata 960
cctgaatatg gctcataaca ccccttgttt gcctggcggc agtagcgcgg tggtcccacc 1020
tgaccccatg ccgaactcag aagtgaaacg ccgtagcgcc gatggtagtg tggggactcc 1080
ccatgcgaga gtagggaact gccaggcatc aaataaaacg aaaggctcag tcgaaagact 1140
gggcctttcg cccgggctaa ttagggggtg tcgcccttat tcgactctat agtgaagttc 1200
ctattctcta gaaagtatag gaacttctga agtggggttg cccatcgaac gtacaagtac 1260
tcctctgttc tctccttcct ttgctttgtg cctgcgacag cggattgggc ggagaagaag 1320
acaacccttc agatatattc aggtgctttt ccctcacatg ttttgccgca ccagccatcc 1380
cactatcaaa aagcgatgat gtttgagatt gtcgggtgtc cacatctttt agtgtgaatc 1440
gctagtagaa tttgggatat tattgagcat catcccatga tagcgagtac aagccccgag 1500
taaataccaa cattgctatg ctgctgtgct gctatctagt ttgctacgtt ggtcgttgac 1560
ctcacaggga tttccaccaa aaagtggacc gggcgggcgc cactcggccg tgccacagca 1620
gcctgagagc ggacaaataa caacagccgc ctgccgcggg gttcggttgc aaacatgacc 1680
aacaggccag gccatcatca acccaccgct gcgttgatgc ccaggatttc agtccaataa 1740
tccacaattt accaacggat agagctaggt gaattagata gacaggaggg ccagagggag 1800
gggaccgaga tgaaaaattt tcgatgaaag agtggtcaag gtggggtcgt agttcggcgc 1860
tccgagggcg aggaaccaag gaaaggcgag gaaaggacag gctgatcgcg ctgcgttgct 1920
gggctgcaag cgtgtccagt tgagtctgga aaaggctccg ccgtgaagat tctgcgttgg 1980
tcccgcacct gcgcggtggg ggcattaccc ctccatgtcc aatgatttca agtcaaagcc 2040
aagggttgaa gcccgcccgc ttagtcgcct tctcgcttga cccctccata taagtatttc 2100
ccctcctccc cctcccacaa atttttcctt tccctttcct ccctcgtccg cttcagtacg 2160
tatatcttcc ccccctctct cttccttctc actcttctct ccttctttct tgattcatcc 2220
tctctctaac tgacttcttt gctcagcacc tctacgcgtt ctggccgtag tatctgagca 2280
atttttctac agactttttc tatctaattc caaaaaagaa cttcgagttc attcaccacc 2340
gtcaaaatga tctgactgat gagtccgtga ggacgaaacg agtaagctcg tctcagatat 2400
attcagtcac tggttttaga gctagaaata gcaagttaaa ataaggctag tccgttatca 2460
acttgaaaaa gtggcaccga gtcggtgctt ttggccggca tggtcccagc ctcctcgctg 2520
gcgccggctg ggcaacatgc ttcggcatgg cgaatgggac taaaatgcgc taaactgggc 2580
ttgactcagg gagggatcat ggactagcca attgggcgtg cacagcgcga ctttggagct 2640
ggttctggct cgcatgactt gtttcgtgct gcgggggatt ccgttcggac ctgacatttt 2700
aaaaataaaa aatggaaaca tcttgaaaga caaaaatgag tttcagtagt ggtctacaga 2760
ccgtagtttt gttcctattc acagtgaaaa taaggcgctg caattgctac gttcataaat 2820
cgagtattgt tgtgctccga agcgccagtc cccatgttcc gcaccctcaa agccaaagtt 2880
cgcgttccga ccttgcctcc caaatccgag ttgcgattaa tggctctgta cagtgaccgg 2940
tgactctttc tggcatgcgg agagacggac ggacgcagag agaagggctg agtaataagc 3000
gccactgcgc cagacagctc tggcggctct gaggtgcagt ggatgattat taatccggga 3060
ccggccgccc ctccgccccg aagtggaaag gctggtgtgc ccctcgttga ccaagaatct 3120
attgcatcat cggagaatat ggagcttcat cgaatcaccg gcagtaagcg aaggagaatg 3180
tgaagccagg ggtgtatagc cgtcggcgaa atagcatgcc attaacctag gtacagaagt 3240
ccaattgctt ccgatctggt aaaagattca cgagatagta ccttctccga agtaggtaga 3300
gcgagtaccc ggcgcgtaag ctccctaatt ggcccatccg gcatctgtag ggcgtccaaa 3360
tatcgtgcct ctcctgcttt gcccggtgta tgaaaccgga aaggccgctc aggagctggc 3420
cagcggcgca gaccgggaac acaagctggc agtcgaccca tccggtgctc tgcactcgac 3480
ctgctgaggt ccctcagtcc ctggtaggca gctttgcccc gtctgtccgc ccggtgtgtc 3540
ggcggggttg acaaggtcgt tgcgtcagtc caacatttgt tgccatattt tcctgctctc 3600
cccaccagct gctcttttct tttctctttc ttttcccatc ttcagtatat tcatcttccc 3660
atccaagaac ctttatttcc cctaagtaag tactttgcta catccatact ccatccttcc 3720
catcccttat tcctttgaac ctttcagttc gagctttccc acttcatcgc agcttgacta 3780
acagctaccc cgcttgagca gacatcacag gatcccaccg tcaaaatggc caagttgacc 3840
agtgccgttc cggtgctcac cgcgcgcgac gtcgccggag cggtcgagtt ctggaccgac 3900
cggctcgggt tctcccggga cttcgtggag gacgacttcg ccggtgtggt ccgggacgac 3960
gtgaccctgt tcatcagcgc ggtccaggac caggtggtgc cggacaacac cctggcctgg 4020
gtgtgggtgc gcggcctgga cgagctgtac gccgagtggt cggaggtcgt gtccacgaac 4080
ttccgggacg cctccgggcc ggccatgacc gagatcggcg agcagccgtg ggggcgggag 4140
ttcgccctgc gcgacccggc cggcaactgc gtgcacttcg tggccgagga gcaggactaa 4200
acccgggagg ctcttcatga cgagccaatg catcttttgt atgtagcttc aaccgactcc 4260
gtcttcactt cttcgcccgc actgcctacc gtttgtacca tctgactcat ataaatgtct 4320
agcccctacc tacactatac ctaagggaga gaagcgtaga gtgattaacg tacgggccta 4380
tagtaccccg atctctagat agaacattta gtagagatta ggatgcctaa ctaatttaac 4440
ttgagcattg tcccgttcat attgattttc agtccattat acactcttaa tcgtttcccg 4500
gtagaagcct gatatatacg accatagggt gtggagaaca gggcttcccg tctgcttggc 4560
cgtacttaag ctatatattc tacacggcca atactcaatg tgcccttagc acctaagcgg 4620
cactctaggg taagtgcggg tgatatagga gagaagtctt aagactgaag acaggatggg 4680
aagaagacgg ctgaccacgc aacttgcact gtccgattct ttgactgcct ccggatcgat 4740
gtacacaacc gactgcaccc aaacgaacac aaatcttagc aaaaatgaag tgaagttcct 4800
atactttcta gagaatagga acttctatag tgagtcgaat aagggcgaca caaaatttat 4860
tctaaatgca taataaatac tgataacatc ttatagtttg tattatattt tgtattatcg 4920
ttgacatgta taattttgat atcaaaaact gattttccct ttattatttt cgagatttat 4980
tttcttaatt ctctttaaca aactagaaat attgtatata caaaaaatca taaataatag 5040
atgaatagtt taattatagg tgttcatcaa tcgaaaaagc aacgtatctt atttaaagtg 5100
cgttgctttt ttctcattta taaggttaaa taattctcat atatcaagca aagtgacagg 5160
cgcccttaaa tattctgaca aatgctcttt ccctaaactc cccccataaa aaaacccgcc 5220
gaagcgggtt tttacgttat ttgcggatta acgattactc gttatcagaa ccgcccaggg 5280
ggcccgagct taagactggc cgtcgtttta caacacagaa agagtttgta gaaacgcaaa 5340
aaggccatcc gtcaggggcc ttctgcttag tttgatgcct ggcagttccc tactctcgcc 5400
ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc 5460
agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg caggaaagaa 5520
catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt 5580
tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg 5640
gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct ccctcgtgcg 5700
ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc cttcgggaag 5760
cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc 5820
caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct tatccggtaa 5880
ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag cagccactgg 5940
taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga agtggtgggc 6000
taactacggc tacactagaa gaacagtatt tggtatctgc gctctgctga agccagttac 6060
cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg gtagcggtgg 6120
tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag aagatccttt 6180
gatcttttct acggggtctg acgctcagtg gaacgacgcg cgcgtaactc acgttaaggg 6240
attttggtca tgagcttgcg ccgtcccgtc aagtcagcgt aatgctctgc ttt 6293
<210> 71
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Reverse PCR primer SGIC fragment I
<400> 71
cagtcaaaga atcggacagt gcaagttgcg tggtcagccg tcttcttccc gagggtgcgg 60
<210> 72
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Forward PCR primer SGIC fragment II and III
<400> 72
ctgcgacagc ggattgggcg gag 23
<210> 73
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Reverse PCR primer SGIC fragment II and IV
<400> 73
cagtcaaaga atcggacagt gc 22
<210> 74
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Reverse PCR primer SGIC fragment III
<400> 74
aatcgcaact cggatttggg 20
<210> 75
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Forward PCR primer SGIC fragment IV
<400> 75
aaagccaaag ttcgcgttcc 20
<210> 76
<211> 5174
<212> DNA
<213> Artificial Sequence
<220>
<223> TOPO SGIC DNA sgRNA fwnA
<400> 76
aagggcgaat tctgcagata tccatcacac tggcggccgc tcgagcatgc atctagaggg 60
cccaattcgc cctatagtga gtcgtattac aattcactgg ccgtcgtttt acaacgtcgt 120
gactgggaaa accctggcgt tacccaactt aatcgccttg cagcacatcc ccctttcgcc 180
agctggcgta atagcgaaga ggcccgcacc gatcgccctt cccaacagtt gcgcagccta 240
tacgtacggc agtttaaggt ttacacctat aaaagagaga gccgttatcg tctgtttgtg 300
gatgtacaga gtgatattat tgacacgccg gggcgacgga tggtgatccc cctggccagt 360
gcacgtctgc tgtcagataa agtctcccgt gaactttacc cggtggtgca tatcggggat 420
gaaagctggc gcatgatgac caccgatatg gccagtgtgc cggtctccgt tatcggggaa 480
gaagtggctg atctcagcca ccgcgaaaat gacatcaaaa acgccattaa cctgatgttc 540
tggggaatat aaatgtcagg catgagatta tcaaaaagga tcttcaccta gatccttttc 600
acgtagaaag ccagtccgca gaaacggtgc tgaccccgga tgaatgtcag ctactgggct 660
atctggacaa gggaaaacgc aagcgcaaag agaaagcagg tagcttgcag tgggcttaca 720
tggcgatagc tagactgggc ggttttatgg acagcaagcg aaccggaatt gccagctggg 780
gcgccctctg gtaaggttgg gaagccctgc aaagtaaact ggatggcttt ctcgccgcca 840
aggatctgat ggcgcagggg atcaagctct gatcaagaga caggatgagg atcgtttcgc 900
atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc 960
ggctatgact gggcacaaca gacaatcggc tgctctgatg ccgccgtgtt ccggctgtca 1020
gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg 1080
caagacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg 1140
ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag 1200
gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg 1260
cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc 1320
atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg atcaggatga tctggacgaa 1380
gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgag catgcccgac 1440
ggcgaggatc tcgtcgtgac ccatggcgat gcctgcttgc cgaatatcat ggtggaaaat 1500
ggccgctttt ctggattcat cgactgtggc cggctgggtg tggcggaccg ctatcaggac 1560
atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc 1620
ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt 1680
gacgagttct tctgaattat taacgcttac aatttcctga tgcggtattt tctccttacg 1740
catctgtgcg gtatttcaca ccgcatacag gtggcacttt tcggggaaat gtgcgcggaa 1800
cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg agacaataac 1860
cctgataaat gcttcaataa tagcacgtga ggagggccac catggccaag ttgaccagtg 1920
ccgttccggt gctcaccgcg cgcgacgtcg ccggagcggt cgagttctgg accgaccggc 1980
tcgggttctc ccgggacttc gtggaggacg acttcgccgg tgtggtccgg gacgacgtga 2040
ccctgttcat cagcgcggtc caggaccagg tggtgccgga caacaccctg gcctgggtgt 2100
gggtgcgcgg cctggacgag ctgtacgccg agtggtcgga ggtcgtgtcc acgaacttcc 2160
gggacgcctc cgggccggcc atgaccgaga tcggcgagca gccgtggggg cgggagttcg 2220
ccctgcgcga cccggccggc aactgcgtgc acttcgtggc cgaggagcag gactgacacg 2280
tgctaaaact tcatttttaa tttaaaagga tctaggtgaa gatccttttt gataatctca 2340
tgaccaaaat cccttaacgt gagttttcgt tccactgagc gtcagacccc gtagaaaaga 2400
tcaaaggatc ttcttgagat cctttttttc tgcgcgtaat ctgctgcttg caaacaaaaa 2460
aaccaccgct accagcggtg gtttgtttgc cggatcaaga gctaccaact ctttttccga 2520
aggtaactgg cttcagcaga gcgcagatac caaatactgt ccttctagtg tagccgtagt 2580
taggccacca cttcaagaac tctgtagcac cgcctacata cctcgctctg ctaatcctgt 2640
taccagtggc tgctgccagt ggcgataagt cgtgtcttac cgggttggac tcaagacgat 2700
agttaccgga taaggcgcag cggtcgggct gaacgggggg ttcgtgcaca cagcccagct 2760
tggagcgaac gacctacacc gaactgagat acctacagcg tgagctatga gaaagcgcca 2820
cgcttcccga agggagaaag gcggacaggt atccggtaag cggcagggtc ggaacaggag 2880
agcgcacgag ggagcttcca gggggaaacg cctggtatct ttatagtcct gtcgggtttc 2940
gccacctctg acttgagcgt cgatttttgt gatgctcgtc aggggggcgg agcctatgga 3000
aaaacgccag caacgcggcc tttttacggt tcctgggctt ttgctggcct tttgctcaca 3060
tgttctttcc tgcgttatcc cctgattctg tggataaccg tattaccgcc tttgagtgag 3120
ctgataccgc tcgccgcagc cgaacgaccg agcgcagcga gtcagtgagc gaggaagcgg 3180
aagagcgccc aatacgcaaa ccgcctctcc ccgcgcgttg gccgattcat taatgcagct 3240
ggcacgacag gtttcccgac tggaaagcgg gcagtgagcg caacgcaatt aatgtgagtt 3300
agctcactca ttaggcaccc caggctttac actttatgct tccggctcgt atgttgtgtg 3360
gaattgtgag cggataacaa tttcacacag gaaacagcta tgaccatgat tacgccaagc 3420
tatttaggtg acactataga atactcaagc tatgcatcaa gcttggtacc gagctcggat 3480
ccactagtaa cggccgccag tgtgctggaa ttcgcccttg ggggtctcgg tgcctgcgac 3540
agcggattgg gcggagaaga agacaaccct tcagatatat tcaggtgctt ttccctcaca 3600
tgttttgccg caccagccat cccactatca aaaagcgatg atgtttgaga ttgtcgggtg 3660
tccacatctt ttagtgtgaa tcgctagtag aatttgggat attattgagc atcatcccat 3720
gatagcgagt acaagccccg agtaaatacc aacattgcta tgctgctgtg ctgctatcta 3780
gtttgctacg ttggtcgttg acctcacagg gatttccacc aaaaagtgga ccgggcgggc 3840
gccactcggc cgtgccacag cagcctgaga gcggacaaat aacaacagcc gcctgccgcg 3900
gggttcggtt gcaaacatga ccaacaggcc aggccatcat caacccaccg ctgcgttgat 3960
gcccaggatt tcagtccaat aatccacaat ttaccaacgg atagagctag gtgaattaga 4020
tagacaggag ggccagaggg aggggaccga gatgaaaaat tttcgatgaa agagtggtca 4080
aggtggggtc gtagttcggc gctccgaggg cgaggaacca aggaaaggcg aggaaaggac 4140
aggctgatcg cgctgcgttg ctgggctgca agcgtgtcca gttgagtctg gaaaaggctc 4200
cgccgtgaag attctgcgtt ggtcccgcac ctgcgcggtg ggggcattac ccctccatgt 4260
ccaatgattt caagtcaaag ccaagggttg aagcccgccc gcttagtcgc cttctcgctt 4320
gacccctcca tataagtatt tcccctcctc cccctcccac aaatttttcc tttccctttc 4380
ctccctcgtc cgcttcagta cgtatatctt ccccccctct ctcttccttc tcactcttct 4440
ctccttcttt cttgattcat cctctctcta actgacttct ttgctcagca cctctacgcg 4500
ttctggccgt agtatctgag caatttttct acagactttt tctatctaat tccaaaaaag 4560
aacttcgagt tcattcacca ccgtcaaaat gatctgactg atgagtccgt gaggacgaaa 4620
cgagtaagct cgtctcagat atattcagtc actggtttta gagctagaaa tagcaagtta 4680
aaataaggct agtccgttat caacttgaaa aagtggcacc gagtcggtgc ttttggccgg 4740
catggtccca gcctcctcgc tggcgccggc tgggcaacat gcttcggcat ggcgaatggg 4800
actaaaatgc gctaaactgg gcttgactca gggagggatc atggactagc caattgggcg 4860
tgcacagcgc gactttggag ctggttctgg ctcgcatgac ttgtttcgtg ctgcggggga 4920
ttccgttcgg acctgacatt ttaaaaataa aaaatggaaa catcttgaaa gacaaaaatg 4980
agtttcagta gtggtctaca gaccgtagtt ttgttcctat tcacagtgaa aataaggcgc 5040
tgcaattgct acgttcataa atcgagtatt gttgtgctcc gaagcgccag tccccatgtt 5100
ccgcaccctc aaagccaaag ttcgcgttcc gaccttgcct cccaaatccg agttgcgatt 5160
aatgggagac cggg 5174
<210> 77
<211> 5997
<212> DNA
<213> Artificial Sequence
<220>
<223> TOPO SGIC hygB
<400> 77
aagggcgaat tctgcagata tccatcacac tggcggccgc tcgagcatgc atctagaggg 60
cccaattcgc cctatagtga gtcgtattac aattcactgg ccgtcgtttt acaacgtcgt 120
gactgggaaa accctggcgt tacccaactt aatcgccttg cagcacatcc ccctttcgcc 180
agctggcgta atagcgaaga ggcccgcacc gatcgccctt cccaacagtt gcgcagccta 240
tacgtacggc agtttaaggt ttacacctat aaaagagaga gccgttatcg tctgtttgtg 300
gatgtacaga gtgatattat tgacacgccg gggcgacgga tggtgatccc cctggccagt 360
gcacgtctgc tgtcagataa agtctcccgt gaactttacc cggtggtgca tatcggggat 420
gaaagctggc gcatgatgac caccgatatg gccagtgtgc cggtctccgt tatcggggaa 480
gaagtggctg atctcagcca ccgcgaaaat gacatcaaaa acgccattaa cctgatgttc 540
tggggaatat aaatgtcagg catgagatta tcaaaaagga tcttcaccta gatccttttc 600
acgtagaaag ccagtccgca gaaacggtgc tgaccccgga tgaatgtcag ctactgggct 660
atctggacaa gggaaaacgc aagcgcaaag agaaagcagg tagcttgcag tgggcttaca 720
tggcgatagc tagactgggc ggttttatgg acagcaagcg aaccggaatt gccagctggg 780
gcgccctctg gtaaggttgg gaagccctgc aaagtaaact ggatggcttt ctcgccgcca 840
aggatctgat ggcgcagggg atcaagctct gatcaagaga caggatgagg atcgtttcgc 900
atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc 960
ggctatgact gggcacaaca gacaatcggc tgctctgatg ccgccgtgtt ccggctgtca 1020
gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg 1080
caagacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg 1140
ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag 1200
gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg 1260
cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc 1320
atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg atcaggatga tctggacgaa 1380
gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgag catgcccgac 1440
ggcgaggatc tcgtcgtgac ccatggcgat gcctgcttgc cgaatatcat ggtggaaaat 1500
ggccgctttt ctggattcat cgactgtggc cggctgggtg tggcggaccg ctatcaggac 1560
atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc 1620
ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt 1680
gacgagttct tctgaattat taacgcttac aatttcctga tgcggtattt tctccttacg 1740
catctgtgcg gtatttcaca ccgcatacag gtggcacttt tcggggaaat gtgcgcggaa 1800
cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg agacaataac 1860
cctgataaat gcttcaataa tagcacgtga ggagggccac catggccaag ttgaccagtg 1920
ccgttccggt gctcaccgcg cgcgacgtcg ccggagcggt cgagttctgg accgaccggc 1980
tcgggttctc ccgggacttc gtggaggacg acttcgccgg tgtggtccgg gacgacgtga 2040
ccctgttcat cagcgcggtc caggaccagg tggtgccgga caacaccctg gcctgggtgt 2100
gggtgcgcgg cctggacgag ctgtacgccg agtggtcgga ggtcgtgtcc acgaacttcc 2160
gggacgcctc cgggccggcc atgaccgaga tcggcgagca gccgtggggg cgggagttcg 2220
ccctgcgcga cccggccggc aactgcgtgc acttcgtggc cgaggagcag gactgacacg 2280
tgctaaaact tcatttttaa tttaaaagga tctaggtgaa gatccttttt gataatctca 2340
tgaccaaaat cccttaacgt gagttttcgt tccactgagc gtcagacccc gtagaaaaga 2400
tcaaaggatc ttcttgagat cctttttttc tgcgcgtaat ctgctgcttg caaacaaaaa 2460
aaccaccgct accagcggtg gtttgtttgc cggatcaaga gctaccaact ctttttccga 2520
aggtaactgg cttcagcaga gcgcagatac caaatactgt ccttctagtg tagccgtagt 2580
taggccacca cttcaagaac tctgtagcac cgcctacata cctcgctctg ctaatcctgt 2640
taccagtggc tgctgccagt ggcgataagt cgtgtcttac cgggttggac tcaagacgat 2700
agttaccgga taaggcgcag cggtcgggct gaacgggggg ttcgtgcaca cagcccagct 2760
tggagcgaac gacctacacc gaactgagat acctacagcg tgagctatga gaaagcgcca 2820
cgcttcccga agggagaaag gcggacaggt atccggtaag cggcagggtc ggaacaggag 2880
agcgcacgag ggagcttcca gggggaaacg cctggtatct ttatagtcct gtcgggtttc 2940
gccacctctg acttgagcgt cgatttttgt gatgctcgtc aggggggcgg agcctatgga 3000
aaaacgccag caacgcggcc tttttacggt tcctgggctt ttgctggcct tttgctcaca 3060
tgttctttcc tgcgttatcc cctgattctg tggataaccg tattaccgcc tttgagtgag 3120
ctgataccgc tcgccgcagc cgaacgaccg agcgcagcga gtcagtgagc gaggaagcgg 3180
aagagcgccc aatacgcaaa ccgcctctcc ccgcgcgttg gccgattcat taatgcagct 3240
ggcacgacag gtttcccgac tggaaagcgg gcagtgagcg caacgcaatt aatgtgagtt 3300
agctcactca ttaggcaccc caggctttac actttatgct tccggctcgt atgttgtgtg 3360
gaattgtgag cggataacaa tttcacacag gaaacagcta tgaccatgat tacgccaagc 3420
tatttaggtg acactataga atactcaagc tatgcatcaa gcttggtacc gagctcggat 3480
ccactagtaa cggccgccag tgtgctggaa ttcgcccttg ggggtctcga atggctctgt 3540
acagtgaccg gtgactcttt ctggcatgcg gagagacgga cggacgcaga gagaagggct 3600
gagtaataag cgccactgcg ccagacagct ctggcggctc tgaggtgcag tggatgatta 3660
ttaatccggg accggccgcc cctccgcccc gaagtggaaa ggctggtgtg cccctcgttg 3720
accaagaatc tattgcatca tcggagaata tggagcttca tcgaatcacc ggcagtaagc 3780
gaaggagaat gtgaagccag gggtgtatag ccgtcggcga aatagcatgc cattaaccta 3840
ggtacagaag tccaattgct tccgatctgg taaaagattc acgagatagt accttctccg 3900
aagtaggtag agcgagtacc cggcgcgtaa gctccctaat tggcccatcc ggcatctgta 3960
gggcgtccaa atatcgtgcc tctcctgctt tgcccggtgt atgaaaccgg aaaggccgct 4020
caggagctgg ccagcggcgc agaccgggaa cacaagctgg cagtcgaccc atccggtgct 4080
ctgcactcga cctgctgagg tccctcagtc cctggtaggc agctttgccc cgtctgtccg 4140
cccggtgtgt cggcggggtt gacaaggtcg ttgcgtcagt ccaacatttg ttgccatatt 4200
ttcctgctct ccccaccagc tgctcttttc ttttctcttt cttttcccat cttcagtata 4260
ttcatcttcc catccaagaa cctttatttc ccctaagtaa gtactttgct acatccatac 4320
tccatccttc ccatccctta ttcctttgaa cctttcagtt cgagctttcc cacttcatcg 4380
cagcttgact aacagctacc ccgcttgagc agacatcaca ggatcccacc gtcaaaatgc 4440
ctgaactcac cgcgacgtct gtcgagaagt ttctgatcga aaagttcgac agcgtctccg 4500
acctgatgca gctctcggag ggcgaagaat ctcgtgcttt cagcttcgat gtaggagggc 4560
gtggatatgt cctgcgggta aatagctgcg ccgatggttt ctacaaagat cgttatgttt 4620
atcggcactt tgcatcggcc gcgctcccga ttccggaagt gcttgacatt ggggaattca 4680
gcgagagcct gacctattgc atctcccgcc gtgcacaggg tgtcacgttg caagacctgc 4740
ctgaaaccga actgcccgct gttctgcagc cggtcgcgga ggccatggat gcgatcgctg 4800
cggccgatct tagccagacg agcgggttcg gcccattcgg accgcaagga atcggtcaat 4860
acactacatg gcgtgatttc atatgcgcga ttgctgatcc ccatgtgtat cactggcaaa 4920
ctgtgatgga cgacaccgtc agtgcgtccg tcgcgcaggc tctcgatgag ctgatgcttt 4980
gggccgagga ctgccccgaa gtccggcacc tcgtgcacgc ggatttcggc tccaacaatg 5040
tcctgacgga caatggccgc ataacagcgg tcattgactg gagcgaggcg atgttcgggg 5100
attcccaata cgaggtcgcc aacatcttct tctggaggcc gtggttggct tgtatggagc 5160
agcagacgcg ctacttcgag cggaggcatc cggagcttgc aggatcgccg cggctccggg 5220
cgtatatgct ccgcattggt cttgaccaac tctatcagag cttggttgac ggcaatttcg 5280
atgatgcagc ttgggcgcag ggtcgatgcg acgcaatcgt ccgatccgga gccgggactg 5340
tcgggcgtac acaaatcgcc cgcagaagcg cggccgtctg gaccgatggc tgtgtagaag 5400
tactcgccga tagtggaaac cgacgcccca gcactcgtcc gagggcaaag gaataaaccc 5460
gggaggctct tcatgacgag ccaatgcatc ttttgtatgt agcttcaacc gactccgtct 5520
tcacttcttc gcccgcactg cctaccgttt gtaccatctg actcatataa atgtctagcc 5580
cctacctaca ctatacctaa gggagagaag cgtagagtga ttaacgtacg ggcctatagt 5640
accccgatct ctagatagaa catttagtag agattaggat gcctaactaa tttaacttga 5700
gcattgtccc gttcatattg attttcagtc cattatacac tcttaatcgt ttcccggtag 5760
aagcctgata tatacgacca tagggtgtgg agaacagggc ttcccgtctg cttggccgta 5820
cttaagctat atattctaca cggccaatac tcaatgtgcc cttagcacct aagcggcact 5880
ctagggtaag tgcgggtgat ataggagaga agtcttaaga ctgaagacag gatgggaaga 5940
agacggctga ccacgcaact tgcactgtcc gattctttga ctgcctcgga gaccggg 5997
<210> 78
<211> 5352
<212> DNA
<213> Artificial Sequence
<220>
<223> TOPO SGIC phleo
<400> 78
aagggcgaat tctgcagata tccatcacac tggcggccgc tcgagcatgc atctagaggg 60
cccaattcgc cctatagtga gtcgtattac aattcactgg ccgtcgtttt acaacgtcgt 120
gactgggaaa accctggcgt tacccaactt aatcgccttg cagcacatcc ccctttcgcc 180
agctggcgta atagcgaaga ggcccgcacc gatcgccctt cccaacagtt gcgcagccta 240
tacgtacggc agtttaaggt ttacacctat aaaagagaga gccgttatcg tctgtttgtg 300
gatgtacaga gtgatattat tgacacgccg gggcgacgga tggtgatccc cctggccagt 360
gcacgtctgc tgtcagataa agtctcccgt gaactttacc cggtggtgca tatcggggat 420
gaaagctggc gcatgatgac caccgatatg gccagtgtgc cggtctccgt tatcggggaa 480
gaagtggctg atctcagcca ccgcgaaaat gacatcaaaa acgccattaa cctgatgttc 540
tggggaatat aaatgtcagg catgagatta tcaaaaagga tcttcaccta gatccttttc 600
acgtagaaag ccagtccgca gaaacggtgc tgaccccgga tgaatgtcag ctactgggct 660
atctggacaa gggaaaacgc aagcgcaaag agaaagcagg tagcttgcag tgggcttaca 720
tggcgatagc tagactgggc ggttttatgg acagcaagcg aaccggaatt gccagctggg 780
gcgccctctg gtaaggttgg gaagccctgc aaagtaaact ggatggcttt ctcgccgcca 840
aggatctgat ggcgcagggg atcaagctct gatcaagaga caggatgagg atcgtttcgc 900
atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc 960
ggctatgact gggcacaaca gacaatcggc tgctctgatg ccgccgtgtt ccggctgtca 1020
gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg 1080
caagacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg 1140
ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag 1200
gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg 1260
cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc 1320
atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg atcaggatga tctggacgaa 1380
gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgag catgcccgac 1440
ggcgaggatc tcgtcgtgac ccatggcgat gcctgcttgc cgaatatcat ggtggaaaat 1500
ggccgctttt ctggattcat cgactgtggc cggctgggtg tggcggaccg ctatcaggac 1560
atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc 1620
ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt 1680
gacgagttct tctgaattat taacgcttac aatttcctga tgcggtattt tctccttacg 1740
catctgtgcg gtatttcaca ccgcatacag gtggcacttt tcggggaaat gtgcgcggaa 1800
cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg agacaataac 1860
cctgataaat gcttcaataa tagcacgtga ggagggccac catggccaag ttgaccagtg 1920
ccgttccggt gctcaccgcg cgcgacgtcg ccggagcggt cgagttctgg accgaccggc 1980
tcgggttctc ccgggacttc gtggaggacg acttcgccgg tgtggtccgg gacgacgtga 2040
ccctgttcat cagcgcggtc caggaccagg tggtgccgga caacaccctg gcctgggtgt 2100
gggtgcgcgg cctggacgag ctgtacgccg agtggtcgga ggtcgtgtcc acgaacttcc 2160
gggacgcctc cgggccggcc atgaccgaga tcggcgagca gccgtggggg cgggagttcg 2220
ccctgcgcga cccggccggc aactgcgtgc acttcgtggc cgaggagcag gactgacacg 2280
tgctaaaact tcatttttaa tttaaaagga tctaggtgaa gatccttttt gataatctca 2340
tgaccaaaat cccttaacgt gagttttcgt tccactgagc gtcagacccc gtagaaaaga 2400
tcaaaggatc ttcttgagat cctttttttc tgcgcgtaat ctgctgcttg caaacaaaaa 2460
aaccaccgct accagcggtg gtttgtttgc cggatcaaga gctaccaact ctttttccga 2520
aggtaactgg cttcagcaga gcgcagatac caaatactgt ccttctagtg tagccgtagt 2580
taggccacca cttcaagaac tctgtagcac cgcctacata cctcgctctg ctaatcctgt 2640
taccagtggc tgctgccagt ggcgataagt cgtgtcttac cgggttggac tcaagacgat 2700
agttaccgga taaggcgcag cggtcgggct gaacgggggg ttcgtgcaca cagcccagct 2760
tggagcgaac gacctacacc gaactgagat acctacagcg tgagctatga gaaagcgcca 2820
cgcttcccga agggagaaag gcggacaggt atccggtaag cggcagggtc ggaacaggag 2880
agcgcacgag ggagcttcca gggggaaacg cctggtatct ttatagtcct gtcgggtttc 2940
gccacctctg acttgagcgt cgatttttgt gatgctcgtc aggggggcgg agcctatgga 3000
aaaacgccag caacgcggcc tttttacggt tcctgggctt ttgctggcct tttgctcaca 3060
tgttctttcc tgcgttatcc cctgattctg tggataaccg tattaccgcc tttgagtgag 3120
ctgataccgc tcgccgcagc cgaacgaccg agcgcagcga gtcagtgagc gaggaagcgg 3180
aagagcgccc aatacgcaaa ccgcctctcc ccgcgcgttg gccgattcat taatgcagct 3240
ggcacgacag gtttcccgac tggaaagcgg gcagtgagcg caacgcaatt aatgtgagtt 3300
agctcactca ttaggcaccc caggctttac actttatgct tccggctcgt atgttgtgtg 3360
gaattgtgag cggataacaa tttcacacag gaaacagcta tgaccatgat tacgccaagc 3420
tatttaggtg acactataga atactcaagc tatgcatcaa gcttggtacc gagctcggat 3480
ccactagtaa cggccgccag tgtgctggaa ttcgcccttg ggggtctcga atggctctgt 3540
acagtgaccg gtgactcttt ctggcatgcg gagagacgga cggacgcaga gagaagggct 3600
gagtaataag cgccactgcg ccagacagct ctggcggctc tgaggtgcag tggatgatta 3660
ttaatccggg accggccgcc cctccgcccc gaagtggaaa ggctggtgtg cccctcgttg 3720
accaagaatc tattgcatca tcggagaata tggagcttca tcgaatcacc ggcagtaagc 3780
gaaggagaat gtgaagccag gggtgtatag ccgtcggcga aatagcatgc cattaaccta 3840
ggtacagaag tccaattgct tccgatctgg taaaagattc acgagatagt accttctccg 3900
aagtaggtag agcgagtacc cggcgcgtaa gctccctaat tggcccatcc ggcatctgta 3960
gggcgtccaa atatcgtgcc tctcctgctt tgcccggtgt atgaaaccgg aaaggccgct 4020
caggagctgg ccagcggcgc agaccgggaa cacaagctgg cagtcgaccc atccggtgct 4080
ctgcactcga cctgctgagg tccctcagtc cctggtaggc agctttgccc cgtctgtccg 4140
cccggtgtgt cggcggggtt gacaaggtcg ttgcgtcagt ccaacatttg ttgccatatt 4200
ttcctgctct ccccaccagc tgctcttttc ttttctcttt cttttcccat cttcagtata 4260
ttcatcttcc catccaagaa cctttatttc ccctaagtaa gtactttgct acatccatac 4320
tccatccttc ccatccctta ttcctttgaa cctttcagtt cgagctttcc cacttcatcg 4380
cagcttgact aacagctacc ccgcttgagc agacatcaca ggatcccacc gtcaaaatgg 4440
ccaagttgac cagtgccgtt ccggtgctca ccgcgcgcga cgtcgccgga gcggtcgagt 4500
tctggaccga ccggctcggg ttctcccggg acttcgtgga ggacgacttc gccggtgtgg 4560
tccgggacga cgtgaccctg ttcatcagcg cggtccagga ccaggtggtg ccggacaaca 4620
ccctggcctg ggtgtgggtg cgcggcctgg acgagctgta cgccgagtgg tcggaggtcg 4680
tgtccacgaa cttccgggac gcctccgggc cggccatgac cgagatcggc gagcagccgt 4740
gggggcggga gttcgccctg cgcgacccgg ccggcaactg cgtgcacttc gtggccgagg 4800
agcaggacta aacccgggag gctcttcatg acgagccaat gcatcttttg tatgtagctt 4860
caaccgactc cgtcttcact tcttcgcccg cactgcctac cgtttgtacc atctgactca 4920
tataaatgtc tagcccctac ctacactata cctaagggag agaagcgtag agtgattaac 4980
gtacgggcct atagtacccc gatctctaga tagaacattt agtagagatt aggatgccta 5040
actaatttaa cttgagcatt gtcccgttca tattgatttt cagtccatta tacactctta 5100
atcgtttccc ggtagaagcc tgatatatac gaccataggg tgtggagaac agggcttccc 5160
gtctgcttgg ccgtacttaa gctatatatt ctacacggcc aatactcaat gtgcccttag 5220
cacctaagcg gcactctagg gtaagtgcgg gtgatatagg agagaagtct taagactgaa 5280
gacaggatgg gaagaagacg gctgaccacg caacttgcac tgtccgattc tttgactgcc 5340
tcggagaccg gg 5352
<210> 79
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> Forward PCR primer Cas9 with KpnI-flank
<400> 79
cccggtaccg caactctctg gaaatgaagg c 31
<210> 80
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Reverse PCR primer Cas9 with KpnI-flank
<400> 80
cccggtaccg aggttcatgg tatgggcacg 30
<210> 81
<211> 14317
<212> DNA
<213> Artificial Sequence
<220>
<223> BG-AMA8 AMA hygB / no Cas9 expression cassette
<400> 81
ggtaccttgc ccatcgaacg tacaagtact cctctgttct ctccttcctt tgctttgtgc 60
ggagaccggc ttactaaaag ccagataaca gtatgcatat ttgcgcgctg atttttgcgg 120
tataagaata tatactgata tgtatacccg aagtatgtca aaaagaggta tgctatgaag 180
cagcgtatta cagtgacagt tgacagcgac agctatcagt tgctcaaggc atatatgatg 240
tcaatatctc cggtctggta agcacaacca tgcagaatga agcccgtcgt ctgcgtgccg 300
aacgctggaa agcggaaaat caggaaggga tggctgaggt cgcccggttt attgaaatga 360
acggctcttt tgctgacgag aacaggggct ggtgaaatgc agtttaaggt ttacacctat 420
aaaagagaga gccgttatcg tctgtttgtg gatgtacaga gtgatattat tgacacgccc 480
gggcgacgga tggtgatccc cctggccagt gcacgtctgc tgtcagataa agtctcccgt 540
gaactttacc cggtggtgca tatcggggat gaaagctggc gcatgatgac caccgatatg 600
gccagtgtgc cggtttccgt tatcggggaa gaagtggctg atctcagcca ccgcgaaaat 660
gacatcaaaa acgccattaa cctgatgttc tggggaatat aaggtctcgc ctccggatcg 720
atgtacacaa ccgactgcac ccaaacgaac acaaatctta gcagtgccct cgccggatag 780
cttggactgt cctttaccgt cgccagcaca agaagggtat ctctgaggtc cgtaccgcct 840
tttctttacc actggattcg attttcgcag ttggaatgat acatctgggg actgcgaatg 900
gtttacccct cggccgatac tatgggtcgt gaagagatgg aacattccga aagtgttttg 960
cggataacat tggtggcatc gaaaacagaa tgctgaccat tgatttcaac acgaacagga 1020
ggttgccaag aagcgtaccc gccgtgtcgt caagtcccag cgtgccatcg tcggtgcttc 1080
cctcgacgtg atcaaggagc gccgctccca gcgccccgag gcccgtgccg ccgcccgcca 1140
gcaggccatc aaggacgcca aggagaagaa ggctgccgct gagtccaaga agaaggctga 1200
gaaggctaag aacgccgctg ctggtgccaa gggtgctgct cagcgcatcc agagcaagca 1260
gggtgctaag ggttctgctc ccaaggtcgc tgccaagtct cgttaaggaa tgaataacgg 1320
ttcggcttgg gattgggtgc ggaaggcaag agtttcatgg acgaattttg ggaggttact 1380
ggagctggaa tatgtgtttt ccctaccacc aaaaatgaaa tgttccaaaa ctatcggcgt 1440
gcaagacggc ctcttacggg tttaacggct ctcagataag ctctatcaat cgcgccacgg 1500
atgcatgaat gaagatccag atggccgcgg gatatatcgt gctagtgtaa ttcctacatg 1560
atcttgctgt tcactccatg cgcatccaga tattccaggg gtcgactgtt aattgatatg 1620
cctgggcttg agactccgta gacgcccagt caatgtgcaa ttaatacgag ggtgctgtta 1680
tcggcagcaa ccttgtactt ctccataaga tgggggaatg ccatggacct gagtgatcaa 1740
ttgacgcaag tctcccataa cgcggcggct tgacctaaaa tccatatacc gccccgttga 1800
gcctccgcgc tccagagtcc tgtcccggaa tagggcacaa acctaggcta acctaattcg 1860
tcgtccgcgt ctgagttcag acaaaagaac ttccaagtat cagcagagta cgctgatatt 1920
gataagtagg caaacataag accaataagc aagtagaata aaaaattata aggacactgc 1980
ctccataaag cgccctccca agacctcagg gacaaaactt ctcaagtggc aattcactgc 2040
ctcaggccgt gtccagtgaa gtgacgaagc gacactgttg cctgctgact cagccgcttt 2100
ccgccctgcc gaatttgcca tctcgcttac aggtcagcac tagcgcgatt cgcccacaga 2160
tgctcagcgc aaagtggtga ctcagtcaaa ccccccctac aagattccac ctcgattttt 2220
caacttccca tctcgatccg acaagttcta catccaccgt caaaatggcc tccagcgaag 2280
atgtcatcaa ggagttcatg cgcttcaagg tccgcatgga aggatccgtc aacggccacg 2340
agttcgagat tgagggtgag ggtgagggcc gcccctacga aggcacccag actgccaagc 2400
tcaaggtcac caagggtggt cctctcccct tcgcttggga tatcctgtct cctcagttcc 2460
agtacggctc caaggtctac gtcaagcacc ccgccgacat ccccgactac aagaagcttt 2520
ctttccccga gggtttcaag tgggagcgtg tcatgaactt cgaggatggt ggtgttgtga 2580
ccgttactca ggacagcagc ttgcaggatg gctctttcat ctacaaggtc aagttcattg 2640
gtgtcaactt cccctccgac ggccctgtca tgcagaagaa gaccatgggc tgggaagcgt 2700
cgactgagcg tctgtacccc cgtgacggtg ttctcaaggg tgagatccac aaggctctca 2760
agctcaagga cggtggtcac taccttgttg agttcaagtc catctacatg gccaagaagc 2820
ctgtgcagct gcccggatac tactacgtgg actccaagct tgacatcacc tcccacaacg 2880
aagactacac cattgttgag cagtacgagc gtgctgaggg ccgccaccac ctcttcctga 2940
cccacggaat ggatgagctg tacaagtcga aactataaat aaatggtttg cgttgcgatt 3000
gactgaaacg aaaaaaagcg aaaatgattc tgggaatgaa ttgataaagc gcgggctctg 3060
cggtacggtt acggttgcgg tcgcggacga atggactggg ctgagctggg ctggaggaag 3120
tccatcgaac aaggacaagg ggtggaatat ggcacgggtc gattttgtta tacataccct 3180
accatccatc tatccattta aataccaaat gagttgttga atggattcgc ggtcttctcg 3240
gtttattttt gcttgcttgc gtgcttaagg gatagtgtgc ctcacgcttt ccggcatctt 3300
ccagaccaca gtatatccat ccgcctcctg ttgaagctta ttttttgtat actgttttgt 3360
gatagcacga agtttttcca cggtatcttg ttaaaaatat atatttgtgg cgggcttacc 3420
tacatcaaat taataagaga ctaattataa actaaacaca caagcaagct actttagggt 3480
aaaagtttat aaatgctttt gacgtataaa cgttgcttgt atttattatt acaattaaag 3540
gtggatagaa aacctagaga ctagttagaa actaatctca ggtttgcgtt aaactaaatc 3600
agagcccgag aggttaacag aacctagaag gggactagat atccgggtag ggaaacaaaa 3660
aaaaaaaaca agacagccac atattaggga gactagttag aagctagttc caggactagg 3720
aaaataaaag acaatgatac cacagtctag ttgacaacta gatagattct agattgaggc 3780
caaagtctct gagatccagg ttagttgcaa ctaatactag ttagtatcta gtctcctata 3840
actctgaagc tagaataact tactactatt atcctcacca ctgttcagct gcgcaaacgg 3900
agtgattgca aggtgttcag agactagtta ttgactagtc agtgactagc aataactaac 3960
aaggtattaa cctaccatgt ctgccatcac cctgcacttc ctcgggctca gcagcctttt 4020
cctcctcatt ttcatgctca ttttccttgt ttaagactgt gactagtcaa agactagtcc 4080
agaaccacaa aggagaaatg tcttaccact ttcttcattg cttgtctctt ttgcattatc 4140
catgtctgca actagttaga gtctagttag tgactagtcc gacgaggact tgcttgtctc 4200
cggattgttg gaggaactct ccagggcctc aagatccaca acagagcctt ctagaagact 4260
ggtcaataac tagttggtct ttgtctgagt ctgacttacg aggttgcata ctcgctccct 4320
ttgcctcgtc aatcgatgag aaaaagcgcc aaaactcgca atatggcttt gaaccacacg 4380
gtgctgagac tagttagaat ctagtcccaa actagcttgg atagcttacc tttgcccttt 4440
gcgttgcgac aggtcttgca gggtatggtt cctttctcac cagctgattt agctgccttg 4500
ctaccctcac ggcggatctg cataaagagt ggctagaggt tataaattag cactgatcct 4560
aggtacgggg ctgaatgtaa cttgcctttc ctttctcatc gcgcggcaag acaggcttgc 4620
tcaaattcct accagtcaca ggggtatgca cggcgtacgg accacttgaa ctagtcacag 4680
attagttagc aactagtctg cattgaatgg ctgtacttac gggccctcgc cattgtcctg 4740
atcatttcca gcttcaccct cgttgctgca aagtagttag tgactagtca aggactagtt 4800
gaaatgggag aagaaactca cgaattctcg acacccttag tattgtggtc cttggacttg 4860
gtgctgctat atattagcta atacactagt tagactcaca gaaacttacg cagctcgctt 4920
gcgcttcttg gtaggagtcg gggttgggag aacagtgcct tcaaacaagc cttcatacca 4980
tgctacttga ctagtcaggg actagtcacc aagtaatcta gataggactt gcctttggcc 5040
tccatcagtt ccttcatagt gggaggtcca ttgtgcaatg taaactccat gccgtgggag 5100
ttcttgtcct tcaagtgctt gaccaatatg tttctgttgg cagagggaac ctgtcaacta 5160
gttaataact agtcagaaac tagtatagca gtagactcac tgtacgcttg aggcatccct 5220
tcactcggca gtagacttca tatggatgga tatcaggcac gccattgtcg tcctgtggac 5280
tagtcagtaa ctaggcttaa agctagtcgg gtcggcttac tatcttgaaa tccggcagcg 5340
taagctcccc gtccttaact gcctcgagat agtgacagta ctctggggac tttcggagat 5400
cgttatcgcg aatgctcggc atactaatcg ttgactagtc ttggactagt cccgagcaaa 5460
aaggattgga ggaggaggag gaaggtgaga gtgagacaaa gagcgaaata agagcttcaa 5520
aggctatctc taagcagtat gaaggttaag tatctagttc ttgactagat ttaaaagaga 5580
tttcgactag ttatgtacct ggagtttgga tataggaatg tgttgtggta acgaaatgta 5640
agggggagga aagaaaaagt cggtcaagag gtaactctaa gtcggccatt cctttttggg 5700
aggcgctaac cataaacggc atggtcgact tagagttagc tcagggaatt tagggagtta 5760
tctgcgacca ccgaggaacg gcggaatgcc aaagaatccc gatggagctc tagctggcgg 5820
ttgacaaccc caccttttgg cgtttctgcg gcgttgcagg cgggactgga tacttcgtag 5880
aaccagaaag gcaaggcaga acgcgctcag caagagtgtt ggaagtgata gcatgatgtg 5940
ccttgttaac taggtcaaaa tctgcagtat gcttgatgtt atccaaagtg tgagagagga 6000
aggtccaaac atacacgatt gggagagggc ctaggtataa gagtttttga gtagaacgca 6060
tgtgagccca gccatctcga ggagattaaa cacgggccgg catttgatgg ctatgttagt 6120
accccaatgg aaagcctgag agtccagtgg tcgcagataa ctccctaaat tccctgagct 6180
aactctaagt cgaccatgcc gtttatggtt agcgcctccc aaaaaggaat ggccgactta 6240
gagttacctc ttgaccgact ttttctttcc tcccccttac atttcgttac cacaacacat 6300
tcctatatcc aaactccagg tacataacta gtcgaaatct cttttaaatc tagtcaagaa 6360
ctagatactt aaccttcata ctgcttagag atagcctttg aagctcttat ttcgctcttt 6420
gtctcactct caccttcctc ctcctcctcc aatccttttt gctcgggact agtccaagac 6480
tagtcaacga ttagtatgcc gagcattcgc gataacgatc tccgaaagtc cccagagtac 6540
tgtcactatc tcgaggcagt taaggacggg gagcttacgc tgccggattt caagatagta 6600
agccgacccg actagcttta agcctagtta ctgactagtc cacaggacga caatggcgtg 6660
cctgatatcc atccatatga agtctactgc cgagtgaagg gatgcctcaa gcgtacagtg 6720
agtctactgc tatactagtt tctgactagt tattaactag ttgacaggtt ccctctgcca 6780
acagaaacat attggtcaag cacttgaagg acaagaactc ccacggcatg gagtttacat 6840
tgcacaatgg acctcccact atgaaggaac tgatggaggc caaaggcaag tcctatctag 6900
attacttggt gactagtccc tgactagtca agtagcatgg tatgaaggct tgtttgaagg 6960
cactgttctc ccaaccccga ctcctaccaa gaagcgcaag cgagctgcgt aagtttctgt 7020
gagtctaact agtgtattag ctaatatata gcagcaccaa gtccaaggac cacaatacta 7080
agggtgtcga gaattcgtga gtttcttctc ccatttcaac tagtccttga ctagtcacta 7140
actactttgc agcaacgagg gtgaagctgg aaatgatcag gacaatggcg agggcccgta 7200
agtacagcca ttcaatgcag actagttgct aactaatctg tgactagttc aagtggtccg 7260
tacgccgtgc atacccctgt gactggtagg aatttgagca agcctgtctt gccgcgcgat 7320
gagaaaggaa aggcaagtta cattcagccc cgtacctagg atcagtgcta atttataacc 7380
tctagccact ctttatgcag atccgccgtg agggtagcaa ggcagctaaa tcagctggtg 7440
agaaaggaac cataccctgc aagacctgtc gcaacgcaaa gggcaaaggt aagctatcca 7500
agctagtttg ggactagatt ctaactagtc tcagcaccgt gtggttcaaa gccatattgc 7560
gagttttggc gctttttctc atcgattgac gaggcaaagg gagcgagtat gcaacctcgt 7620
aagtcagact cagacaaaga ccaactagtt attgaccagt cttctagaag gctctgttgt 7680
ggatcttgag gccctggaga gttcctccaa caatccggag acaagcaagt cctcgtcgga 7740
ctagtcacta actagactct aactagttgc agacatggat aatgcaaaag agacaagcaa 7800
tgaagaaagt ggtaagacat ttctcctttg tggttctgga ctagtctttg actagtcaca 7860
gtcttaaaca aggaaaatga gcatgaaaat gaggaggaaa aggctgctga gcccgaggaa 7920
gtgcagggtg atggcagaca tggtaggtta ataccttgtt agttattgct agtcactgac 7980
tagtcaataa ctagtctctg aacaccttgc aatcactccg tttgcgcagc tgaacagtgg 8040
tgaggataat agtagtaagt tattctagct tcagagttat aggagactag atactaacta 8100
gtattagttg caactaacct ggatctcaga gactttggcc tcaatctaga atctatctag 8160
ttgtcaacta gactgtggta tcattgtctt ttattttcct agtcctggaa ctagcttcta 8220
actagtctcc ctaatatgtg gctgtcttgt tttttttttt tgtttcccta cccggatatc 8280
tagtcccctt ctaggttctg ttaacctctc gggctctgat ttagtttaac gcaaacctga 8340
gattagtttc taactagtct ctaggttttc tatccacctt taattgtaat aataaataca 8400
agcaacgttt atacgtcaaa agcatttata aacttttacc ctaaagtagc ttgcttgtgt 8460
gtttagttta taattagtct cttattaatt tgatgtaggt aagcccgcca caaatatata 8520
tttttaacaa gataccgtgg aaaaacttcg tgctatcaca aaacagtata caaaaaataa 8580
gctatcgaat tcctgcagag atcatcctgt cttcagtctt aagacttctc tcctatatca 8640
cccgcactta ccctagagtg ccgcttaggt gctaagggca cattgagtat tggccgtgta 8700
gaatatatag cttaagtacg gccaagcaga cgggaagccc tgttctccac accctatggt 8760
cgtatatatc aggcttctac cgggaaacga ttaagagtgt ataatggact gaaaatcaat 8820
atgaacggga caatgctcaa gttaaattag ttaggcatcc taatctctac taaatgttct 8880
atctagagat cggggtacta taggcccgta cgttaatcac tctacgcttc tctcccttag 8940
gtatagtgta ggtaggggct agacatttat atgagtcaga tggtacaaac ggtaggcagt 9000
gcgggcgaag aagtgaagac ggagtcggtt gaagctacat acaaaagatg cattggctcg 9060
tcatgaagag cctcccgggt ttattccttt gccctcggac gagtgctggg gcgtcggttt 9120
ccactatcgg cgagtacttc tacacagcca tcggtccaga cggccgcgct tctgcgggcg 9180
atttgtgtac gcccgacagt cccggctccg gatcggacga ttgcgtcgca tcgaccctgc 9240
gcccaagctg catcatcgaa attgccgtca accaagctct gatagagttg gtcaagacca 9300
atgcggagca tatacgcccg gagccgcggc gatcctgcaa gctccggatg cctccgctcg 9360
aagtagcgcg tctgctgctc catacaagcc aaccacggcc tccagaagaa gatgttggcg 9420
acctcgtatt gggaatcccc gaacatcgcc tcgctccagt caatgaccgc tgttatgcgg 9480
ccattgtccg tcaggacatt gttggagccg aaatccgcgt gcacgaggtg ccggacttcg 9540
gggcagtcct cggcccaaag catcagctca tcgagagcct gcgcgacgga cgcactgacg 9600
gtgtcgtcca tcacagtttg ccagtgatac acatggggat cagcaatcgc gcatatgaaa 9660
tcacgccatg tagtgtattg accgattcct tgcggtccga atgggccgaa cccgctcgtc 9720
tggctaagat cggccgcagc gatcgcatcc atggcctccg cgaccggctg cagaacagcg 9780
ggcagttcgg tttcaggcag gtcttgcaac gtgacaccct gtgcacggcg ggagatgcaa 9840
taggtcaggc tctcgctgaa ttccccaatg tcaagcactt ccggaatcgg gagcgcggcc 9900
gatgcaaagt gccgataaac ataacgatct ttgtagaaac catcggcgca gctatttacc 9960
cgcaggacat atccacgccc tcctacatcg aagctgaaag cacgagattc ttcgccctcc 10020
gagagctgca tcaggtcgga gacgctgtcg aacttttcga tcagaaactt ctcgacagac 10080
gtcgcggtga gttcaggcat tttgacggtg ggatcctgtg atgtctgctc aagcggggta 10140
gctgttagtc aagctgcgat gaagtgggaa agctcgaact gaaaggttca aaggaataag 10200
ggatgggaag gatggagtat ggatgtagca aagtacttac ttaggggaaa taaaggttct 10260
tggatgggaa gatgaatata ctgaagatgg gaaaagaaag agaaaagaaa agagcagctg 10320
gtggggagag caggaaaata tggcaacaaa tgttggactg acgcaacgac cttgtcaacc 10380
ccgccgacac accgggcgga cagacggggc aaagctgcct accagggact gagggacctc 10440
agcaggtcga gtgcagagca ccggatgggt cgactgccag cttgtgttcc cggtctgcgc 10500
cgctggccag ctcctgagcg gcctttccgg tttcatacac cgggcaaagc aggagaggca 10560
cgatatttgg acgccctaca gatgccggat gggccaatta gggagcttac gcgccgggta 10620
ctcgctctac ctacttcgga gaaggtacta tctcgtgaat cttttaccag atcggaagca 10680
attggacttc tgtacctagg ttaatggcat gctatttcgc cgacggctat acacccctgg 10740
cttcacattc tccttcgctt actgccggtg attcgatgaa gctccatatt ctccgatgat 10800
gcaatagatt cttggtcaac gaggggcaca ccagcctttc cacttcgggg cggaggggcg 10860
gccggtcccg gattaataat catccactgc acctcagagc cgccagagct gtctggcgca 10920
gtggcgctta ttactcagcc cttctctctg cgtccgtccg tctctccgca tgccagaaag 10980
agtcaccggt cactgtacag agcggccgcc accgcggtgg agctccaatt cgccctatag 11040
tgagtcgtat tacgcgcgct cactggccgt cgttttacaa cgtcgtgact gggaaaaccc 11100
tggcgttacc caacttaatc gccttgcagc acatccccct ttcgccagct ggcgtaatag 11160
cgaagaggcc cgcaccgatc gcccttccca acagttgcgc agcctgaatg gcgaatggga 11220
cgcgccctgt agcggcgcat taagcgcggc gggtgtggtg gttacgcgca gcgtgaccgc 11280
tacacttgcc agcgccctag cgcccgctcc tttcgctttc ttcccttcct ttctcgccac 11340
gttcgccggc tttccccgtc aagctctaaa tcgggggctc cctttagggt tccgatttag 11400
tgctttacgg cacctcgacc ccaaaaaact tgattagggt gatggttcac gtagtgggcc 11460
atcgccctga tagacggttt ttcgcccttt gacgttggag tccacgttct ttaatagtgg 11520
actcttgttc caaactggaa caacactcaa ccctatctcg gtctattctt ttgatttata 11580
agggattttg ccgatttcgg cctattggtt aaaaaatgag ctgatttaac aaaaatttaa 11640
cgcgaatttt aacaaaatat taacgcttac aatttaggtg gcacttttcg gggaaatgtg 11700
cgcggaaccc ctatttgttt atttttctaa atacattcaa atatgtatcc gctcatgaga 11760
caataaccct gataaatgct tcaataatat tgaaaaagga agagtatgag tattcaacat 11820
ttccgtgtcg cccttattcc cttttttgcg gcattttgcc ttcctgtttt tgctcaccca 11880
gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt gggttacatc 11940
gaactggatc tcaacagcgg taagatcctt gagagttttc gccccgaaga acgttttcca 12000
atgatgagca cttttcgacc gaataaatac ctgtgacgga agatcacttc gcagaataaa 12060
taaatcctgg tgtccctgtt gataccggga agccctgggc caacttttgg cgaaaatgag 12120
acgttgatcg gcacgtaaga ggttccaact ttcaccataa tgaaataaga tcactaccgg 12180
gcgtattttt tgagttgtcg agattttcag gagctaagga agctaaaatg gagaaaaaaa 12240
tcactggata taccaccgtt gatatatccc aatggcatcg taaagaacat tttgaggcat 12300
ttcagtcagt tgctcaatgt acctataacc agaccgttca gctggatatt acggcctttt 12360
taaagaccgt aaagaaaaat aagcacaagt tttatccggc ctttattcac attcttgccc 12420
gcctgatgaa tgctcatccg gaattacgta tggcaatgaa agacggtgag ctggtgatat 12480
gggatagtgt tcacccttgt tacaccgttt tccatgagca aactgaaacg ttttcatcgc 12540
tctggagtga ataccacgac gatttccggc agtttctaca catatattcg caagatgtgg 12600
cgtgttacgg tgaaaacctg gcctatttcc ctaaagggtt tattgagaat atgtttttcg 12660
tctcagccaa tccctgggtg agtttcacca gttttgattt aaacgtggcc aatatggaca 12720
acttcttcgc ccccgttttc accatgggca aatattatac gcaaggcgac aaggtgctga 12780
tgccgctggc gattcaggtt catcatgccg tttgtgatgg cttccatgtc ggcagaatgc 12840
ttaatgaatt acaacagtac tgcgatgagt ggcagggcgg ggcgtaattt ttttaaggca 12900
gttattggtg cccttaaacg cctggttgct acgcctgaat aagtgataat aagcggatga 12960
atggcagaaa ttcgaaagca aattcgaccc ggtcgtcggt tcagggcagg gtcgttaaat 13020
agccgcttat gtctattgct ggtttaccgg tttattgact accggaagca gtgtgaccgt 13080
gtgcttctca aatgcctgag gccagtttgc tcaggctctc cccgtggagg taataattga 13140
cgatatgatc ctttttttct gatcaaaaag gatctaggtg aagatccttt ttgataatct 13200
catgaccaaa atcccttaac gtgagttttc gttccactga gcgtcagacc ccgtagaaaa 13260
gatcaaagga tcttcttgag atcctttttt tctgcgcgta atctgctgct tgcaaacaaa 13320
aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa gagctaccaa ctctttttcc 13380
gaaggtaact ggcttcagca gagcgcagat accaaatact gttcttctag tgtagccgta 13440
gttaggccac cacttcaaga actctgtagc accgcctaca tacctcgctc tgctaatcct 13500
gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt accgggttgg actcaagacg 13560
atagttaccg gataaggcgc agcggtcggg ctgaacgggg ggttcgtgca cacagcccag 13620
cttggagcga acgacctaca ccgaactgag atacctacag cgtgagctat gagaaagcgc 13680
cacgcttccc gaagggagaa aggcggacag gtatccggta agcggcaggg tcggaacagg 13740
agagcgcacg agggagcttc cagggggaaa cgcctggtat ctttatagtc ctgtcgggtt 13800
tcgccacctc tgacttgagc gtcgattttt gtgatgctcg tcaggggggc ggagcctatg 13860
gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc ttttgctggc cttttgctca 13920
catgttcttt cctgcgttat cccctgattc tgtggataac cgtattaccg cctttgagtg 13980
agctgatacc gctcgccgca gccgaacgac cgagcgcagc gagtcagtga gcgaggaagc 14040
ggaagagcgc ccaatacgca aaccgcctct ccccgcgcgt tggccgattc attaatgcag 14100
ctggcacgac aggtttcccg actggaaagc gggcagtgag cgcaacgcaa ttaatgtgag 14160
ttagctcact cattaggcac cccaggcttt acactttatg ctcccggctc gtatgttgtg 14220
tggaattgtg agcggataac aatttcacac aggaaacagc tatgaccatg attacgccaa 14280
gcgcgcaatt aaccctcact aaagggaaca aaagctg 14317
<210> 82
<211> 19242
<212> DNA
<213> Artificial Sequence
<220>
<223> BG-AMA14 AMA phleo/Cas9 ++.
<400> 82
cttgcccatc gaacgtacaa gtactcctct gttctctcct tcctttgctt tgtgcggaga 60
ccggcttact aaaagccaga taacagtatg catatttgcg cgctgatttt tgcggtataa 120
gaatatatac tgatatgtat acccgaagta tgtcaaaaag aggtatgcta tgaagcagcg 180
tattacagtg acagttgaca gcgacagcta tcagttgctc aaggcatata tgatgtcaat 240
atctccggtc tggtaagcac aaccatgcag aatgaagccc gtcgtctgcg tgccgaacgc 300
tggaaagcgg aaaatcagga agggatggct gaggtcgccc ggtttattga aatgaacggc 360
tcttttgctg acgagaacag gggctggtga aatgcagttt aaggtttaca cctataaaag 420
agagagccgt tatcgtctgt ttgtggatgt acagagtgat attattgaca cgcccgggcg 480
acggatggtg atccccctgg ccagtgcacg tctgctgtca gataaagtct cccgtgaact 540
ttacccggtg gtgcatatcg gggatgaaag ctggcgcatg atgaccaccg atatggccag 600
tgtgccggtt tccgttatcg gggaagaagt ggctgatctc agccaccgcg aaaatgacat 660
caaaaacgcc attaacctga tgttctgggg aatataaggt ctcgcctccg gatcgatgta 720
cacaaccgac tgcacccaaa cgaacacaaa tcttagcagt gccctcgccg gatagcttgg 780
actgtccttt accgtcgcca gcacaagaag ggtatctctg aggtccgtac cgccttttct 840
ttaccactgg attcgatttt cgcagttgga atgatacatc tggggactgc gaatggttta 900
cccctcggcc gatactatgg gtcgtgaaga gatggaacat tccgaaagtg ttttgcggat 960
aacattggtg gcatcgaaaa cagaatgctg accattgatt tcaacacgaa caggaggttg 1020
ccaagaagcg tacccgccgt gtcgtcaagt cccagcgtgc catcgtcggt gcttccctcg 1080
acgtgatcaa ggagcgccgc tcccagcgcc ccgaggcccg tgccgccgcc cgccagcagg 1140
ccatcaagga cgccaaggag aagaaggctg ccgctgagtc caagaagaag gctgagaagg 1200
ctaagaacgc cgctgctggt gccaagggtg ctgctcagcg catccagagc aagcagggtg 1260
ctaagggttc tgctcccaag gtcgctgcca agtctcgtta aggaatgaat aacggttcgg 1320
cttgggattg ggtgcggaag gcaagagttt catggacgaa ttttgggagg ttactggagc 1380
tggaatatgt gttttcccta ccaccaaaaa tgaaatgttc caaaactatc ggcgtgcaag 1440
acggcctctt acgggtttaa cggctctcag ataagctcta tcaatcgcgc cacggatgca 1500
tgaatgaaga tccagatggc cgcgggatat atcgtgctag tgtaattcct acatgatctt 1560
gctgttcact ccatgcgcat ccagatattc caggggtcga ctgttaattg atatgcctgg 1620
gcttgagact ccgtagacgc ccagtcaatg tgcaattaat acgagggtgc tgttatcggc 1680
agcaaccttg tacttctcca taagatgggg gaatgccatg gacctgagtg atcaattgac 1740
gcaagtctcc cataacgcgg cggcttgacc taaaatccat ataccgcccc gttgagcctc 1800
cgcgctccag agtcctgtcc cggaataggg cacaaaccta ggctaaccta attcgtcgtc 1860
cgcgtctgag ttcagacaaa agaacttcca agtatcagca gagtacgctg atattgataa 1920
gtaggcaaac ataagaccaa taagcaagta gaataaaaaa ttataaggac actgcctcca 1980
taaagcgccc tcccaagacc tcagggacaa aacttctcaa gtggcaattc actgcctcag 2040
gccgtgtcca gtgaagtgac gaagcgacac tgttgcctgc tgactcagcc gctttccgcc 2100
ctgccgaatt tgccatctcg cttacaggtc agcactagcg cgattcgccc acagatgctc 2160
agcgcaaagt ggtgactcag tcaaaccccc cctacaagat tccacctcga tttttcaact 2220
tcccatctcg atccgacaag ttctacatcc accgtcaaaa tggcctccag cgaagatgtc 2280
atcaaggagt tcatgcgctt caaggtccgc atggaaggat ccgtcaacgg ccacgagttc 2340
gagattgagg gtgagggtga gggccgcccc tacgaaggca cccagactgc caagctcaag 2400
gtcaccaagg gtggtcctct ccccttcgct tgggatatcc tgtctcctca gttccagtac 2460
ggctccaagg tctacgtcaa gcaccccgcc gacatccccg actacaagaa gctttctttc 2520
cccgagggtt tcaagtggga gcgtgtcatg aacttcgagg atggtggtgt tgtgaccgtt 2580
actcaggaca gcagcttgca ggatggctct ttcatctaca aggtcaagtt cattggtgtc 2640
aacttcccct ccgacggccc tgtcatgcag aagaagacca tgggctggga agcgtcgact 2700
gagcgtctgt acccccgtga cggtgttctc aagggtgaga tccacaaggc tctcaagctc 2760
aaggacggtg gtcactacct tgttgagttc aagtccatct acatggccaa gaagcctgtg 2820
cagctgcccg gatactacta cgtggactcc aagcttgaca tcacctccca caacgaagac 2880
tacaccattg ttgagcagta cgagcgtgct gagggccgcc accacctctt cctgacccac 2940
ggaatggatg agctgtacaa gtcgaaacta taaataaatg gtttgcgttg cgattgactg 3000
aaacgaaaaa aagcgaaaat gattctggga atgaattgat aaagcgcggg ctctgcggta 3060
cggttacggt tgcggtcgcg gacgaatgga ctgggctgag ctgggctgga ggaagtccat 3120
cgaacaagga caaggggtgg aatatggcac gggtcgattt tgttatacat accctaccat 3180
ccatctatcc atttaaatac caaatgagtt gttgaatgga ttcgcggtct tctcggttta 3240
tttttgcttg cttgcgtgct taagggatag tgtgcctcac gctttccggc atcttccaga 3300
ccacagtata tccatccgcc tcctgttgaa gcttattttt tgtatactgt tttgtgatag 3360
cacgaagttt ttccacggta tcttgttaaa aatatatatt tgtggcgggc ttacctacat 3420
caaattaata agagactaat tataaactaa acacacaagc aagctacttt agggtaaaag 3480
tttataaatg cttttgacgt ataaacgttg cttgtattta ttattacaat taaaggtgga 3540
tagaaaacct agagactagt tagaaactaa tctcaggttt gcgttaaact aaatcagagc 3600
ccgagaggtt aacagaacct agaaggggac tagatatccg ggtagggaaa caaaaaaaaa 3660
aaacaagaca gccacatatt agggagacta gttagaagct agttccagga ctaggaaaat 3720
aaaagacaat gataccacag tctagttgac aactagatag attctagatt gaggccaaag 3780
tctctgagat ccaggttagt tgcaactaat actagttagt atctagtctc ctataactct 3840
gaagctagaa taacttacta ctattatcct caccactgtt cagctgcgca aacggagtga 3900
ttgcaaggtg ttcagagact agttattgac tagtcagtga ctagcaataa ctaacaaggt 3960
attaacctac catgtctgcc atcaccctgc acttcctcgg gctcagcagc cttttcctcc 4020
tcattttcat gctcattttc cttgtttaag actgtgacta gtcaaagact agtccagaac 4080
cacaaaggag aaatgtctta ccactttctt cattgcttgt ctcttttgca ttatccatgt 4140
ctgcaactag ttagagtcta gttagtgact agtccgacga ggacttgctt gtctccggat 4200
tgttggagga actctccagg gcctcaagat ccacaacaga gccttctaga agactggtca 4260
ataactagtt ggtctttgtc tgagtctgac ttacgaggtt gcatactcgc tccctttgcc 4320
tcgtcaatcg atgagaaaaa gcgccaaaac tcgcaatatg gctttgaacc acacggtgct 4380
gagactagtt agaatctagt cccaaactag cttggatagc ttacctttgc cctttgcgtt 4440
gcgacaggtc ttgcagggta tggttccttt ctcaccagct gatttagctg ccttgctacc 4500
ctcacggcgg atctgcataa agagtggcta gaggttataa attagcactg atcctaggta 4560
cggggctgaa tgtaacttgc ctttcctttc tcatcgcgcg gcaagacagg cttgctcaaa 4620
ttcctaccag tcacaggggt atgcacggcg tacggaccac ttgaactagt cacagattag 4680
ttagcaacta gtctgcattg aatggctgta cttacgggcc ctcgccattg tcctgatcat 4740
ttccagcttc accctcgttg ctgcaaagta gttagtgact agtcaaggac tagttgaaat 4800
gggagaagaa actcacgaat tctcgacacc cttagtattg tggtccttgg acttggtgct 4860
gctatatatt agctaataca ctagttagac tcacagaaac ttacgcagct cgcttgcgct 4920
tcttggtagg agtcggggtt gggagaacag tgccttcaaa caagccttca taccatgcta 4980
cttgactagt cagggactag tcaccaagta atctagatag gacttgcctt tggcctccat 5040
cagttccttc atagtgggag gtccattgtg caatgtaaac tccatgccgt gggagttctt 5100
gtccttcaag tgcttgacca atatgtttct gttggcagag ggaacctgtc aactagttaa 5160
taactagtca gaaactagta tagcagtaga ctcactgtac gcttgaggca tcccttcact 5220
cggcagtaga cttcatatgg atggatatca ggcacgccat tgtcgtcctg tggactagtc 5280
agtaactagg cttaaagcta gtcgggtcgg cttactatct tgaaatccgg cagcgtaagc 5340
tccccgtcct taactgcctc gagatagtga cagtactctg gggactttcg gagatcgtta 5400
tcgcgaatgc tcggcatact aatcgttgac tagtcttgga ctagtcccga gcaaaaagga 5460
ttggaggagg aggaggaagg tgagagtgag acaaagagcg aaataagagc ttcaaaggct 5520
atctctaagc agtatgaagg ttaagtatct agttcttgac tagatttaaa agagatttcg 5580
actagttatg tacctggagt ttggatatag gaatgtgttg tggtaacgaa atgtaagggg 5640
gaggaaagaa aaagtcggtc aagaggtaac tctaagtcgg ccattccttt ttgggaggcg 5700
ctaaccataa acggcatggt cgacttagag ttagctcagg gaatttaggg agttatctgc 5760
gaccaccgag gaacggcgga atgccaaaga atcccgatgg agctctagct ggcggttgac 5820
aaccccacct tttggcgttt ctgcggcgtt gcaggcggga ctggatactt cgtagaacca 5880
gaaaggcaag gcagaacgcg ctcagcaaga gtgttggaag tgatagcatg atgtgccttg 5940
ttaactaggt caaaatctgc agtatgcttg atgttatcca aagtgtgaga gaggaaggtc 6000
caaacataca cgattgggag agggcctagg tataagagtt tttgagtaga acgcatgtga 6060
gcccagccat ctcgaggaga ttaaacacgg gccggcattt gatggctatg ttagtacccc 6120
aatggaaagc ctgagagtcc agtggtcgca gataactccc taaattccct gagctaactc 6180
taagtcgacc atgccgttta tggttagcgc ctcccaaaaa ggaatggccg acttagagtt 6240
acctcttgac cgactttttc tttcctcccc cttacatttc gttaccacaa cacattccta 6300
tatccaaact ccaggtacat aactagtcga aatctctttt aaatctagtc aagaactaga 6360
tacttaacct tcatactgct tagagatagc ctttgaagct cttatttcgc tctttgtctc 6420
actctcacct tcctcctcct cctccaatcc tttttgctcg ggactagtcc aagactagtc 6480
aacgattagt atgccgagca ttcgcgataa cgatctccga aagtccccag agtactgtca 6540
ctatctcgag gcagttaagg acggggagct tacgctgccg gatttcaaga tagtaagccg 6600
acccgactag ctttaagcct agttactgac tagtccacag gacgacaatg gcgtgcctga 6660
tatccatcca tatgaagtct actgccgagt gaagggatgc ctcaagcgta cagtgagtct 6720
actgctatac tagtttctga ctagttatta actagttgac aggttccctc tgccaacaga 6780
aacatattgg tcaagcactt gaaggacaag aactcccacg gcatggagtt tacattgcac 6840
aatggacctc ccactatgaa ggaactgatg gaggccaaag gcaagtccta tctagattac 6900
ttggtgacta gtccctgact agtcaagtag catggtatga aggcttgttt gaaggcactg 6960
ttctcccaac cccgactcct accaagaagc gcaagcgagc tgcgtaagtt tctgtgagtc 7020
taactagtgt attagctaat atatagcagc accaagtcca aggaccacaa tactaagggt 7080
gtcgagaatt cgtgagtttc ttctcccatt tcaactagtc cttgactagt cactaactac 7140
tttgcagcaa cgagggtgaa gctggaaatg atcaggacaa tggcgagggc ccgtaagtac 7200
agccattcaa tgcagactag ttgctaacta atctgtgact agttcaagtg gtccgtacgc 7260
cgtgcatacc cctgtgactg gtaggaattt gagcaagcct gtcttgccgc gcgatgagaa 7320
aggaaaggca agttacattc agccccgtac ctaggatcag tgctaattta taacctctag 7380
ccactcttta tgcagatccg ccgtgagggt agcaaggcag ctaaatcagc tggtgagaaa 7440
ggaaccatac cctgcaagac ctgtcgcaac gcaaagggca aaggtaagct atccaagcta 7500
gtttgggact agattctaac tagtctcagc accgtgtggt tcaaagccat attgcgagtt 7560
ttggcgcttt ttctcatcga ttgacgaggc aaagggagcg agtatgcaac ctcgtaagtc 7620
agactcagac aaagaccaac tagttattga ccagtcttct agaaggctct gttgtggatc 7680
ttgaggccct ggagagttcc tccaacaatc cggagacaag caagtcctcg tcggactagt 7740
cactaactag actctaacta gttgcagaca tggataatgc aaaagagaca agcaatgaag 7800
aaagtggtaa gacatttctc ctttgtggtt ctggactagt ctttgactag tcacagtctt 7860
aaacaaggaa aatgagcatg aaaatgagga ggaaaaggct gctgagcccg aggaagtgca 7920
gggtgatggc agacatggta ggttaatacc ttgttagtta ttgctagtca ctgactagtc 7980
aataactagt ctctgaacac cttgcaatca ctccgtttgc gcagctgaac agtggtgagg 8040
ataatagtag taagttattc tagcttcaga gttataggag actagatact aactagtatt 8100
agttgcaact aacctggatc tcagagactt tggcctcaat ctagaatcta tctagttgtc 8160
aactagactg tggtatcatt gtcttttatt ttcctagtcc tggaactagc ttctaactag 8220
tctccctaat atgtggctgt cttgtttttt ttttttgttt ccctacccgg atatctagtc 8280
cccttctagg ttctgttaac ctctcgggct ctgatttagt ttaacgcaaa cctgagatta 8340
gtttctaact agtctctagg ttttctatcc acctttaatt gtaataataa atacaagcaa 8400
cgtttatacg tcaaaagcat ttataaactt ttaccctaaa gtagcttgct tgtgtgttta 8460
gtttataatt agtctcttat taatttgatg taggtaagcc cgccacaaat atatattttt 8520
aacaagatac cgtggaaaaa cttcgtgcta tcacaaaaca gtatacaaaa aataagctat 8580
cgaattcctg cagagatcat cctgtcttca gtcttaagac ttctctccta tatcacccgc 8640
acttacccta gagtgccgct taggtgctaa gggcacattg agtattggcc gtgtagaata 8700
tatagcttaa gtacggccaa gcagacggga agccctgttc tccacaccct atggtcgtat 8760
atatcaggct tctaccggga aacgattaag agtgtataat ggactgaaaa tcaatatgaa 8820
cgggacaatg ctcaagttaa attagttagg catcctaatc tctactaaat gttctatcta 8880
gagatcgggg tactataggc ccgtacgtta atcactctac gcttctctcc cttaggtata 8940
gtgtaggtag gggctagaca tttatatgag tcagatggta caaacggtag gcagtgcggg 9000
cgaagaagtg aagacggagt cggttgaagc tacatacaaa agatgcattg gctcgtcatg 9060
aagagcctcc cgggtttagt cctgctcctc ggccacgaag tgcacgcagt tgccggccgg 9120
gtcgcgcagg gcgaactccc gcccccacgg ctgctcgccg atctcggtca tggccggccc 9180
ggaggcgtcc cggaagttcg tggacacgac ctccgaccac tcggcgtaca gctcgtccag 9240
gccgcgcacc cacacccagg ccagggtgtt gtccggcacc acctggtcct ggaccgcgct 9300
gatgaacagg gtcacgtcgt cccggaccac accggcgaag tcgtcctcca cgaagtcccg 9360
ggagaacccg agccggtcgg tccagaactc gaccgctccg gcgacgtcgc gcgcggtgag 9420
caccggaacg gcactggtca acttggccat tttgacggtg ggatcctgtg atgtctgctc 9480
aagcggggta gctgttagtc aagctgcgat gaagtgggaa agctcgaact gaaaggttca 9540
aaggaataag ggatgggaag gatggagtat ggatgtagca aagtacttac ttaggggaaa 9600
taaaggttct tggatgggaa gatgaatata ctgaagatgg gaaaagaaag agaaaagaaa 9660
agagcagctg gtggggagag caggaaaata tggcaacaaa tgttggactg acgcaacgac 9720
cttgtcaacc ccgccgacac accgggcgga cagacggggc aaagctgcct accagggact 9780
gagggacctc agcaggtcga gtgcagagca ccggatgggt cgactgccag cttgtgttcc 9840
cggtctgcgc cgctggccag ctcctgagcg gcctttccgg tttcatacac cgggcaaagc 9900
aggagaggca cgatatttgg acgccctaca gatgccggat gggccaatta gggagcttac 9960
gcgccgggta ctcgctctac ctacttcgga gaaggtacta tctcgtgaat cttttaccag 10020
atcggaagca attggacttc tgtacctagg ttaatggcat gctatttcgc cgacggctat 10080
acacccctgg cttcacattc tccttcgctt actgccggtg attcgatgaa gctccatatt 10140
ctccgatgat gcaatagatt cttggtcaac gaggggcaca ccagcctttc cacttcgggg 10200
cggaggggcg gccggtcccg gattaataat catccactgc acctcagagc cgccagagct 10260
gtctggcgca gtggcgctta ttactcagcc cttctctctg cgtccgtccg tctctccgca 10320
tgccagaaag agtcaccggt cactgtacag agcggccgcc accgcggtgg agctccaatt 10380
cgccctatag tgagtcgtat tacgcgcgct cactggccgt cgttttacaa cgtcgtgact 10440
gggaaaaccc tggcgttacc caacttaatc gccttgcagc acatccccct ttcgccagct 10500
ggcgtaatag cgaagaggcc cgcaccgatc gcccttccca acagttgcgc agcctgaatg 10560
gcgaatggga cgcgccctgt agcggcgcat taagcgcggc gggtgtggtg gttacgcgca 10620
gcgtgaccgc tacacttgcc agcgccctag cgcccgctcc tttcgctttc ttcccttcct 10680
ttctcgccac gttcgccggc tttccccgtc aagctctaaa tcgggggctc cctttagggt 10740
tccgatttag tgctttacgg cacctcgacc ccaaaaaact tgattagggt gatggttcac 10800
gtagtgggcc atcgccctga tagacggttt ttcgcccttt gacgttggag tccacgttct 10860
ttaatagtgg actcttgttc caaactggaa caacactcaa ccctatctcg gtctattctt 10920
ttgatttata agggattttg ccgatttcgg cctattggtt aaaaaatgag ctgatttaac 10980
aaaaatttaa cgcgaatttt aacaaaatat taacgcttac aatttaggtg gcacttttcg 11040
gggaaatgtg cgcggaaccc ctatttgttt atttttctaa atacattcaa atatgtatcc 11100
gctcatgaga caataaccct gataaatgct tcaataatat tgaaaaagga agagtatgag 11160
tattcaacat ttccgtgtcg cccttattcc cttttttgcg gcattttgcc ttcctgtttt 11220
tgctcaccca gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt 11280
gggttacatc gaactggatc tcaacagcgg taagatcctt gagagttttc gccccgaaga 11340
acgttttcca atgatgagca cttttcgacc gaataaatac ctgtgacgga agatcacttc 11400
gcagaataaa taaatcctgg tgtccctgtt gataccggga agccctgggc caacttttgg 11460
cgaaaatgag acgttgatcg gcacgtaaga ggttccaact ttcaccataa tgaaataaga 11520
tcactaccgg gcgtattttt tgagttgtcg agattttcag gagctaagga agctaaaatg 11580
gagaaaaaaa tcactggata taccaccgtt gatatatccc aatggcatcg taaagaacat 11640
tttgaggcat ttcagtcagt tgctcaatgt acctataacc agaccgttca gctggatatt 11700
acggcctttt taaagaccgt aaagaaaaat aagcacaagt tttatccggc ctttattcac 11760
attcttgccc gcctgatgaa tgctcatccg gaattacgta tggcaatgaa agacggtgag 11820
ctggtgatat gggatagtgt tcacccttgt tacaccgttt tccatgagca aactgaaacg 11880
ttttcatcgc tctggagtga ataccacgac gatttccggc agtttctaca catatattcg 11940
caagatgtgg cgtgttacgg tgaaaacctg gcctatttcc ctaaagggtt tattgagaat 12000
atgtttttcg tctcagccaa tccctgggtg agtttcacca gttttgattt aaacgtggcc 12060
aatatggaca acttcttcgc ccccgttttc accatgggca aatattatac gcaaggcgac 12120
aaggtgctga tgccgctggc gattcaggtt catcatgccg tttgtgatgg cttccatgtc 12180
ggcagaatgc ttaatgaatt acaacagtac tgcgatgagt ggcagggcgg ggcgtaattt 12240
ttttaaggca gttattggtg cccttaaacg cctggttgct acgcctgaat aagtgataat 12300
aagcggatga atggcagaaa ttcgaaagca aattcgaccc ggtcgtcggt tcagggcagg 12360
gtcgttaaat agccgcttat gtctattgct ggtttaccgg tttattgact accggaagca 12420
gtgtgaccgt gtgcttctca aatgcctgag gccagtttgc tcaggctctc cccgtggagg 12480
taataattga cgatatgatc ctttttttct gatcaaaaag gatctaggtg aagatccttt 12540
ttgataatct catgaccaaa atcccttaac gtgagttttc gttccactga gcgtcagacc 12600
ccgtagaaaa gatcaaagga tcttcttgag atcctttttt tctgcgcgta atctgctgct 12660
tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa gagctaccaa 12720
ctctttttcc gaaggtaact ggcttcagca gagcgcagat accaaatact gttcttctag 12780
tgtagccgta gttaggccac cacttcaaga actctgtagc accgcctaca tacctcgctc 12840
tgctaatcct gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt accgggttgg 12900
actcaagacg atagttaccg gataaggcgc agcggtcggg ctgaacgggg ggttcgtgca 12960
cacagcccag cttggagcga acgacctaca ccgaactgag atacctacag cgtgagctat 13020
gagaaagcgc cacgcttccc gaagggagaa aggcggacag gtatccggta agcggcaggg 13080
tcggaacagg agagcgcacg agggagcttc cagggggaaa cgcctggtat ctttatagtc 13140
ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt gtgatgctcg tcaggggggc 13200
ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc ttttgctggc 13260
cttttgctca catgttcttt cctgcgttat cccctgattc tgtggataac cgtattaccg 13320
cctttgagtg agctgatacc gctcgccgca gccgaacgac cgagcgcagc gagtcagtga 13380
gcgaggaagc ggaagagcgc ccaatacgca aaccgcctct ccccgcgcgt tggccgattc 13440
attaatgcag ctggcacgac aggtttcccg actggaaagc gggcagtgag cgcaacgcaa 13500
ttaatgtgag ttagctcact cattaggcac cccaggcttt acactttatg ctcccggctc 13560
gtatgttgtg tggaattgtg agcggataac aatttcacac aggaaacagc tatgaccatg 13620
attacgccaa gcgcgcaatt aaccctcact aaagggaaca aaagctgggt acgcttgcac 13680
caatcgccgt ttaggtgttc attaggttgt attttggcta tttattgcga tatttaagcg 13740
aggcgaacat gggataaaac gtttgctgtt agtgtttgtg tatatgctag cgacttagag 13800
tgcacgctca aaagataccc ctaacttctg atttgatagc atttgtatat ggcatatagt 13860
acgcctgaag cataaaaaaa aaaacagaat tattatagtt tattaatacg agacagcaga 13920
atcaccgccc aagttaagcc tttgtgctga tcatgctctc gaacgggcca agttcgggaa 13980
aagcaaagga gcgtttagtg aggggcaatt tgactcacct cccaggcaac agatgagggg 14040
ggcaaaaaga aagaaatttt cgtgagtcaa tatggattcc gagcatcatt ttcttgcggt 14100
ctatcttgct acgtatgttg atcttgacgc tgtggatcaa gcaacgccac tcgctcgctc 14160
catcgcaggc tggtcgcaga caaattaaaa ggcggcaaac tcgtacagcc gcggggttgt 14220
ccgctgcaaa gtacagagtg ataaaagccg ccatgcgacc atcaacgcgt tgatgcccag 14280
ctttttcgat ccgagaatcc accgtagagg cgatagcaag taaagaaaag ctaaacaaaa 14340
aaaaatttct gcccctaagc catgaaaacg agatggggtg gagcagaacc aaggaaagag 14400
tcgcgctggg ctgccgttcc ggaaggtgtt gtaaaggctc gacgcccaag gtgggagtct 14460
aggagaagaa tttgcatcgg gagtggggcg ggttacccct ccatatccaa tgacagatat 14520
ctaccagcca agggtttgag cccgcccgct tagtcgtcgt cctcgcttgc ccctccataa 14580
aaggatttcc cctccccctc ccacaaaatt ttctttccct tcctctcctt gtccgcttca 14640
gtacgtatat cttcccttcc ctcgcttctc tcctccatcc ttctttcatc catctcctgc 14700
taacttctct gctcagcacc tctacgcatt actagccgta gtatctgagc acttctccct 14760
tttatattcc acaaaacata acaccaccgt caaaatggac aagaagtata gcatcggtct 14820
ggacattggc accaactccg ttggctgggc tgtcatcacc gacgagtaca aggttcctag 14880
caagaaattc aaggtcctgg gaaacaccga tcgtcactcc atcaagaaga acctcattgg 14940
tgcgcttctc ttcgactccg gtgagactgc tgaggccacc cgtctgaagc gtaccgctcg 15000
ccgtcgttac actcgccgca agaaccgtat ctgctacctc caggagattt tctccaacga 15060
gatggccaag gttgatgact ctttcttcca ccgtctggag gagtcgttcc ttgttgaaga 15120
agacaagaag cacgagcgtc accctatctt cggtaacatt gtcgatgagg tcgcttacca 15180
cgagaagtac cccaccatct accacctacg caaaaagctc gtcgacagca ccgacaaggc 15240
tgacctccgc ctcatttacc tggctctggc gcacatgatc aagttccgtg gtcacttcct 15300
gatcgagggt gacctcaacc ccgacaactc cgatgttgat aaactcttca tccagctcgt 15360
tcagacctac aaccagcttt tcgaggaaaa ccccatcaac gcgtctggcg tggatgccaa 15420
ggccatcctc tccgctcgcc tgagcaagtc ccgccgtctt gagaacttga ttgcccagct 15480
ccctggtgag aagaagaacg gtcttttcgg caaccttatt gccctgtccc tcggactgac 15540
tcccaacttc aagagcaact tcgatcttgc tgaggatgct aagttacaac tttccaagga 15600
tacctacgac gacgaccttg ataaccttct cgcccagata ggagatcagt acgccgacct 15660
cttcctagct gccaagaacc tctccgatgc cattctcctg tcagatatcc tccgtgtcaa 15720
cactgagatc accaaggccc ctctctccgc ctctatgatc aagagatacg atgagcacca 15780
ccaggacctc accctactca aggctctggt ccgccagcag ctccccgaaa agtacaagga 15840
gatcttcttc gaccagtcca agaacggcta cgccggttac atcgacggtg gtgcttccca 15900
ggaagaattc tacaagttca ttaagcctat cctcgagaag atggatggca ctgaggagct 15960
tcttgttaag ctgaaccgtg aggaccttct gcgcaagcag cgtactttcg acaacggcag 16020
catcccccac cagatccacc tgggtgaatt gcacgccatc cttcgtcgcc aggaagactt 16080
ctaccctttc ttgaaggaca accgtgagaa gattgagaag atcctgacct tccgtatccc 16140
ctactacgtc ggtcctctgg ctcgcggtaa ctcccgcttc gcctggatga cccgcaagtc 16200
cgaggaaacc atcaccccct ggaacttcga ggaagtcgtc gacaagggtg cctccgctca 16260
gagcttcatt gagcgtatga ccaacttcga caagaacctg cccaacgaga aagtcctgcc 16320
caagcactcc ctcttgtacg agtacttcac tgtctacaac gagctgacca aggtcaagta 16380
cgtgaccgag ggcatgcgca agcctgcttt cctctccggc gaacagaaga aggccattgt 16440
cgacctgctg ttcaagacta accgcaaggt gaccgtcaag cagctcaagg aagactactt 16500
caagaagatc gagtgctttg actccgttga gatctccggt gttgaggacc gcttcaacgc 16560
ttctctcggc acctaccacg atctgctcaa gatcatcaag gacaaggact tccttgacaa 16620
cgaggagaac gaagacattc ttgaggacat tgttcttacc ctcaccctct tcgaggaccg 16680
tgagatgatc gaagaacgtc tgaagaccta cgctcacctc ttcgacgaca aggtcatgaa 16740
gcagttgaag cgccgccgtt acactggctg gggtcgcctc tctcgcaagt tgattaacgg 16800
tatccgtgat aagcagtctg gcaagaccat ccttgacttc ctgaagtccg acggcttcgc 16860
caaccgcaac ttcatgcagc tcatccacga cgactctctg accttcaaag aggacatcca 16920
gaaggcccaa gtctccggcc agggtgactc gctacacgaa cacattgcca acctggctgg 16980
ttcccccgct atcaagaagg gtatcctgca gactgtgaag gttgttgacg agcttgtgaa 17040
ggtcatgggt cgtcacaagc ccgagaacat cgtcatcgaa atggctcgtg agaaccagac 17100
cactcagaag ggtcagaaga acagccgtga gcgcatgaag cgtatcgagg aaggcatcaa 17160
ggagctcggt tcccagattc tcaaggaaca ccccgtcgag aacacccagc tgcagaatga 17220
gaagctctac ctctactact tgcagaacgg acgtgacatg tacgtcgacc aggagctgga 17280
tatcaaccgc ctctccgact acgatgttga ccacatcgtc ccccagtcct tcctcaagga 17340
tgacagcatt gacaacaagg tgctcacccg ttccgacaag aatcgtggca agagcgataa 17400
cgtcccctcg gaagaggttg ttaagaagat gaagaactac tggagacaat tgctcaacgc 17460
taagctcatc actcagcgca agttcgacaa ccttaccaag gccgagcgtg gcggactctc 17520
cgagctcgac aaggccggtt tcatcaagcg tcaattggtt gaaacccgtc agatcactaa 17580
gcacgttgcc cagatcctgg actctcgcat gaacaccaag tacgacgaga acgacaagct 17640
catccgtgag gtcaaggtca tcaccttaaa gagcaagctg gtcagtgact ttaggaaaga 17700
cttccagttc tacaaggtcc gcgagatcaa caactaccac cacgctcacg atgcctacct 17760
caacgccgtc gtcggtactg ctttgattaa gaagtatccc aagctcgagt ccgagttcgt 17820
ctacggtgac tacaaggtgt acgacgtgcg caagatgatc gctaagtccg agcaggagat 17880
cggaaaggcc actgccaagt acttcttcta cagcaacatc atgaacttct tcaagaccga 17940
aataacattg gccaacggcg agattcgcaa gcgtcccttg attgagacta acggcgaaac 18000
cggtgagatc gtctgggaca agggccgtga cttcgctacc gtccgcaagg tcctttctat 18060
gccccaggtc aacattgtca agaagaccga ggtgcagact ggtggtttct ccaaggagtc 18120
gattcttccc aagcgcaact ccgacaagct gatcgctcgc aagaaggatt gggaccccaa 18180
gaagtacggt ggattcgatt cgcctaccgt tgcctactcc gtcttggttg tcgccaaggt 18240
cgagaagggc aagagcaaga agctgaagag tgtgaaggaa ctcctcggta tcaccatcat 18300
ggaacgcagc agcttcgaga agaaccctat cgacttcctg gaggccaagg gttacaaaga 18360
ggtcaagaag gacctcatca tcaagctccc caagtactct ctgttcgagc tggagaacgg 18420
ccgtaagcgc atgcttgctt ccgccggtga gctccagaag ggtaacgagc ttgccctccc 18480
ctccaagtac gtcaacttcc tctacctggc ctcccactac gagaagctca agggctctcc 18540
cgaggacaac gagcagaagc agctctttgt cgagcagcac aagcactacc tggatgagat 18600
catcgagcag atctccgagt tcagcaagcg tgtcatcctg gccgatgcca accttgacaa 18660
ggtcctctct gcctacaaca agcaccgtga caagcccatc cgcgagcagg cggagaacat 18720
catccacctg ttcaccctca ccaacctggg tgctcctgct gctttcaagt actttgacac 18780
caccatcgac cgcaagcgtt acacctccac caaggaagtg cttgatgcga ctctgatcca 18840
ccagtcgatt accggtctgt acgagactcg tatcgacctg tctcagctcg gtggtgactc 18900
tcgtgccgat cccaagaaga agcgcaaggt ttaaacaagc gcttagctcg aacaaaagaa 18960
aaagtaaaaa cggttaatag cattggattc cgaactacaa agtataaact agtttcactc 19020
cttgtagaag ccagatacgg gccggggtag ataccgcgca ctccctcagc agcctcgcag 19080
tcatggtcag catcgaagaa ctcccacaca aaatgcgctg ggagaagagt tcgaaatgca 19140
gctgggctca attagccgtc gtacacggag atagatactg aatacatacc cgtttgagcc 19200
tgaaaatttt tgacattcgt gcccatacca tgaacctcgt ac 19242
<210> 83
<211> 19569
<212> DNA
<213> Artificial Sequence
<220>
<223> BG-AMA17 AMA hygB/Cas9 st
<400> 83
ggtaccgagg ttcatggtat gggcacgaat gtcaaaaatt ttcaggctca aacgggtatg 60
tattcagtat ctatctccgt gtacgacggc taattgagcc cagctgcatt tcgaactctt 120
ctcccagcgc attttgtgtg ggagttcttc gatgctgacc atgactgcga ggctgctgag 180
ggagtgcgcg gtatctaccc cggcccgtat ctggcttcta caaggagtga aactagttta 240
tactttgtag ttcggaatcc aatgctatta accgttttta ctttttcttt tgttcgagct 300
aagcgcttgt ttaaaccttg cgcttcttct tgggatcggc acgagagtca ccaccgagct 360
gagacaggtc gatacgagtc tcgtacagac cggtaatcga ctggtggatc agagtcgcat 420
caagcacttc cttggtggag gtgtaacgct tgcggtcgat ggtggtgtca aagtacttga 480
aagcagcagg agcacccagg ttggtgaggg tgaacaggtg gatgatgttc tccgcctgct 540
cgcggatggg cttgtcacgg tgcttgttgt aggcagagag gaccttgtca aggttggcat 600
cggccaggat gacacgcttg ctgaactcgg agatctgctc gatgatctca tccaggtagt 660
gcttgtgctg ctcgacaaag agctgcttct gctcgttgtc ctcgggagag cccttgagct 720
tctcgtagtg ggaggccagg tagaggaagt tgacgtactt ggaggggagg gcaagctcgt 780
tacccttctg gagctcaccg gcggaagcaa gcatgcgctt acggccgttc tccagctcga 840
acagagagta cttggggagc ttgatgatga ggtccttctt gacctctttg taacccttgg 900
cctccaggaa gtcgataggg ttcttctcga agctgctgcg ttccatgatg gtgataccga 960
ggagttcctt cacactcttc agcttcttgc tcttgccctt ctcgaccttg gcgacaacca 1020
agacggagta ggcaacggta ggcgaatcga atccaccgta cttcttgggg tcccaatcct 1080
tcttgcgagc gatcagcttg tcggagttgc gcttgggaag aatcgactcc ttggagaaac 1140
caccagtctg cacctcggtc ttcttgacaa tgttgacctg gggcatagaa aggaccttgc 1200
ggacggtagc gaagtcacgg cccttgtccc agacgatctc accggtttcg ccgttagtct 1260
caatcaaggg acgcttgcga atctcgccgt tggccaatgt tatttcggtc ttgaagaagt 1320
tcatgatgtt gctgtagaag aagtacttgg cagtggcctt tccgatctcc tgctcggact 1380
tagcgatcat cttgcgcacg tcgtacacct tgtagtcacc gtagacgaac tcggactcga 1440
gcttgggata cttcttaatc aaagcagtac cgacgacggc gttgaggtag gcatcgtgag 1500
cgtggtggta gttgttgatc tcgcggacct tgtagaactg gaagtctttc ctaaagtcac 1560
tgaccagctt gctctttaag gtgatgacct tgacctcacg gatgagcttg tcgttctcgt 1620
cgtacttggt gttcatgcga gagtccagga tctgggcaac gtgcttagtg atctgacggg 1680
tttcaaccaa ttgacgcttg atgaaaccgg ccttgtcgag ctcggagagt ccgccacgct 1740
cggccttggt aaggttgtcg aacttgcgct gagtgatgag cttagcgttg agcaattgtc 1800
tccagtagtt cttcatcttc ttaacaacct cttccgaggg gacgttatcg ctcttgccac 1860
gattcttgtc ggaacgggtg agcaccttgt tgtcaatgct gtcatccttg aggaaggact 1920
gggggacgat gtggtcaaca tcgtagtcgg agaggcggtt gatatccagc tcctggtcga 1980
cgtacatgtc acgtccgttc tgcaagtagt agaggtagag cttctcattc tgcagctggg 2040
tgttctcgac ggggtgttcc ttgagaatct gggaaccgag ctccttgatg ccttcctcga 2100
tacgcttcat gcgctcacgg ctgttcttct gacccttctg agtggtctgg ttctcacgag 2160
ccatttcgat gacgatgttc tcgggcttgt gacgacccat gaccttcaca agctcgtcaa 2220
caaccttcac agtctgcagg atacccttct tgatagcggg ggaaccagcc aggttggcaa 2280
tgtgttcgtg tagcgagtca ccctggccgg agacttgggc cttctggatg tcctctttga 2340
aggtcagaga gtcgtcgtgg atgagctgca tgaagttgcg gttggcgaag ccgtcggact 2400
tcaggaagtc aaggatggtc ttgccagact gcttatcacg gataccgtta atcaacttgc 2460
gagagaggcg accccagcca gtgtaacggc ggcgcttcaa ctgcttcatg accttgtcgt 2520
cgaagaggtg agcgtaggtc ttcagacgtt cttcgatcat ctcacggtcc tcgaagaggg 2580
tgagggtaag aacaatgtcc tcaagaatgt cttcgttctc ctcgttgtca aggaagtcct 2640
tgtccttgat gatcttgagc agatcgtggt aggtgccgag agaagcgttg aagcggtcct 2700
caacaccgga gatctcaacg gagtcaaagc actcgatctt cttgaagtag tcttccttga 2760
gctgcttgac ggtcaccttg cggttagtct tgaacagcag gtcgacaatg gccttcttct 2820
gttcgccgga gaggaaagca ggcttgcgca tgccctcggt cacgtacttg accttggtca 2880
gctcgttgta gacagtgaag tactcgtaca agagggagtg cttgggcagg actttctcgt 2940
tgggcaggtt cttgtcgaag ttggtcatac gctcaatgaa gctctgagcg gaggcaccct 3000
tgtcgacgac ttcctcgaag ttccaggggg tgatggtttc ctcggacttg cgggtcatcc 3060
aggcgaagcg ggagttaccg cgagccagag gaccgacgta gtaggggata cggaaggtca 3120
ggatcttctc aatcttctca cggttgtcct tcaagaaagg gtagaagtct tcctggcgac 3180
gaaggatggc gtgcaattca cccaggtgga tctggtgggg gatgctgccg ttgtcgaaag 3240
tacgctgctt gcgcagaagg tcctcacggt tcagcttaac aagaagctcc tcagtgccat 3300
ccatcttctc gaggataggc ttaatgaact tgtagaattc ttcctgggaa gcaccaccgt 3360
cgatgtaacc ggcgtagccg ttcttggact ggtcgaagaa gatctccttg tacttttcgg 3420
ggagctgctg gcggaccaga gccttgagta gggtgaggtc ctggtggtgc tcatcgtatc 3480
tcttgatcat agaggcggag agaggggcct tggtgatctc agtgttgaca cggaggatat 3540
ctgacaggag aatggcatcg gagaggttct tggcagctag gaagaggtcg gcgtactgat 3600
ctcctatctg ggcgagaagg ttatcaaggt cgtcgtcgta ggtatccttg gaaagttgta 3660
acttagcatc ctcagcaaga tcgaagttgc tcttgaagtt gggagtcagt ccgagggaca 3720
gggcaataag gttgccgaaa agaccgttct tcttctcacc agggagctgg gcaatcaagt 3780
tctcaagacg gcgggacttg ctcaggcgag cggagaggat ggccttggca tccacgccag 3840
acgcgttgat ggggttttcc tcgaaaagct ggttgtaggt ctgaacgagc tggatgaaga 3900
gtttatcaac atcggagttg tcggggttga ggtcaccctc gatcaggaag tgaccacgga 3960
acttgatcat gtgcgccaga gccaggtaaa tgaggcggag gtcagccttg tcggtgctgt 4020
cgacgagctt tttgcgtagg tggtagatgg tggggtactt ctcgtggtaa gcgacctcat 4080
cgacaatgtt accgaagata gggtgacgct cgtgcttctt gtcttcttca acaaggaacg 4140
actcctccag acggtggaag aaagagtcat caaccttggc catctcgttg gagaaaatct 4200
cctggaggta gcagatacgg ttcttgcggc gagtgtaacg acggcgagcg gtacgcttca 4260
gacgggtggc ctcagcagtc tcaccggagt cgaagagaag cgcaccaatg aggttcttct 4320
tgatggagtg acgatcggtg tttcccagga ccttgaattt cttgctagga accttgtact 4380
cgtcggtgat gacagcccag ccaacggagt tggtgccaat gtccagaccg atgctatact 4440
tcttgtccat tttgacggtg gaaggtgagt tggggttggt gtcatcgtgg gggaagaact 4500
tggcttttat atgggtgcag gtgaggggac ttaagccacg tgaaagttca ttcgagagag 4560
ctaaggcata ttaatgcaca tgtgtgggag ttgcatggaa cttgcatgaa aggtgcatga 4620
aaggtgcatg gtattgcaga atgcgctcgg gggtctgcgg agaaatccgt taggaaaaga 4680
tcgtcatcct tctgctgcat caccgttagc ttgaaattta gttccagcgc tagtcaaggg 4740
cttcagttca gattctgcaa gtatcaggtc catcattact ctcttcagca ggcggatcga 4800
atatcccccg aggcacatgg gaggtcttat tatccgatcg ttgatcacca tgccaatcgc 4860
ttcgaccgac cacaagttgc atcaagcact aactgcctca agcagatgcc gagtcttcat 4920
ctccgatatt taatcccgtt gaatctccgc cccctgtcat ctccaccgtt taatctgggg 4980
tggtggcgga tgtccaccaa ttagccggct aaattatccc catcgtcagc acgctagacc 5040
tgccttggaa ctagcgcttt ggtgagaaat ctcttggttg tgagtctgat accacattcc 5100
ttgacttcca tgttgttctg gaggtgtgaa agtataaaca atgccacaga tggactaatc 5160
tccggagaga tgaccctctt caagactggt gcagtgccta ggatcgctag tatcccaaaa 5220
cttcggggct gccttcattt ccagagagtt gcggtacctt gcccatcgaa cgtacaagta 5280
ctcctctgtt ctctccttcc tttgctttgt gcggagaccg gcttactaaa agccagataa 5340
cagtatgcat atttgcgcgc tgatttttgc ggtataagaa tatatactga tatgtatacc 5400
cgaagtatgt caaaaagagg tatgctatga agcagcgtat tacagtgaca gttgacagcg 5460
acagctatca gttgctcaag gcatatatga tgtcaatatc tccggtctgg taagcacaac 5520
catgcagaat gaagcccgtc gtctgcgtgc cgaacgctgg aaagcggaaa atcaggaagg 5580
gatggctgag gtcgcccggt ttattgaaat gaacggctct tttgctgacg agaacagggg 5640
ctggtgaaat gcagtttaag gtttacacct ataaaagaga gagccgttat cgtctgtttg 5700
tggatgtaca gagtgatatt attgacacgc ccgggcgacg gatggtgatc cccctggcca 5760
gtgcacgtct gctgtcagat aaagtctccc gtgaacttta cccggtggtg catatcgggg 5820
atgaaagctg gcgcatgatg accaccgata tggccagtgt gccggtttcc gttatcgggg 5880
aagaagtggc tgatctcagc caccgcgaaa atgacatcaa aaacgccatt aacctgatgt 5940
tctggggaat ataaggtctc gcctccggat cgatgtacac aaccgactgc acccaaacga 6000
acacaaatct tagcagtgcc ctcgccggat agcttggact gtcctttacc gtcgccagca 6060
caagaagggt atctctgagg tccgtaccgc cttttcttta ccactggatt cgattttcgc 6120
agttggaatg atacatctgg ggactgcgaa tggtttaccc ctcggccgat actatgggtc 6180
gtgaagagat ggaacattcc gaaagtgttt tgcggataac attggtggca tcgaaaacag 6240
aatgctgacc attgatttca acacgaacag gaggttgcca agaagcgtac ccgccgtgtc 6300
gtcaagtccc agcgtgccat cgtcggtgct tccctcgacg tgatcaagga gcgccgctcc 6360
cagcgccccg aggcccgtgc cgccgcccgc cagcaggcca tcaaggacgc caaggagaag 6420
aaggctgccg ctgagtccaa gaagaaggct gagaaggcta agaacgccgc tgctggtgcc 6480
aagggtgctg ctcagcgcat ccagagcaag cagggtgcta agggttctgc tcccaaggtc 6540
gctgccaagt ctcgttaagg aatgaataac ggttcggctt gggattgggt gcggaaggca 6600
agagtttcat ggacgaattt tgggaggtta ctggagctgg aatatgtgtt ttccctacca 6660
ccaaaaatga aatgttccaa aactatcggc gtgcaagacg gcctcttacg ggtttaacgg 6720
ctctcagata agctctatca atcgcgccac ggatgcatga atgaagatcc agatggccgc 6780
gggatatatc gtgctagtgt aattcctaca tgatcttgct gttcactcca tgcgcatcca 6840
gatattccag gggtcgactg ttaattgata tgcctgggct tgagactccg tagacgccca 6900
gtcaatgtgc aattaatacg agggtgctgt tatcggcagc aaccttgtac ttctccataa 6960
gatgggggaa tgccatggac ctgagtgatc aattgacgca agtctcccat aacgcggcgg 7020
cttgacctaa aatccatata ccgccccgtt gagcctccgc gctccagagt cctgtcccgg 7080
aatagggcac aaacctaggc taacctaatt cgtcgtccgc gtctgagttc agacaaaaga 7140
acttccaagt atcagcagag tacgctgata ttgataagta ggcaaacata agaccaataa 7200
gcaagtagaa taaaaaatta taaggacact gcctccataa agcgccctcc caagacctca 7260
gggacaaaac ttctcaagtg gcaattcact gcctcaggcc gtgtccagtg aagtgacgaa 7320
gcgacactgt tgcctgctga ctcagccgct ttccgccctg ccgaatttgc catctcgctt 7380
acaggtcagc actagcgcga ttcgcccaca gatgctcagc gcaaagtggt gactcagtca 7440
aaccccccct acaagattcc acctcgattt ttcaacttcc catctcgatc cgacaagttc 7500
tacatccacc gtcaaaatgg cctccagcga agatgtcatc aaggagttca tgcgcttcaa 7560
ggtccgcatg gaaggatccg tcaacggcca cgagttcgag attgagggtg agggtgaggg 7620
ccgcccctac gaaggcaccc agactgccaa gctcaaggtc accaagggtg gtcctctccc 7680
cttcgcttgg gatatcctgt ctcctcagtt ccagtacggc tccaaggtct acgtcaagca 7740
ccccgccgac atccccgact acaagaagct ttctttcccc gagggtttca agtgggagcg 7800
tgtcatgaac ttcgaggatg gtggtgttgt gaccgttact caggacagca gcttgcagga 7860
tggctctttc atctacaagg tcaagttcat tggtgtcaac ttcccctccg acggccctgt 7920
catgcagaag aagaccatgg gctgggaagc gtcgactgag cgtctgtacc cccgtgacgg 7980
tgttctcaag ggtgagatcc acaaggctct caagctcaag gacggtggtc actaccttgt 8040
tgagttcaag tccatctaca tggccaagaa gcctgtgcag ctgcccggat actactacgt 8100
ggactccaag cttgacatca cctcccacaa cgaagactac accattgttg agcagtacga 8160
gcgtgctgag ggccgccacc acctcttcct gacccacgga atggatgagc tgtacaagtc 8220
gaaactataa ataaatggtt tgcgttgcga ttgactgaaa cgaaaaaaag cgaaaatgat 8280
tctgggaatg aattgataaa gcgcgggctc tgcggtacgg ttacggttgc ggtcgcggac 8340
gaatggactg ggctgagctg ggctggagga agtccatcga acaaggacaa ggggtggaat 8400
atggcacggg tcgattttgt tatacatacc ctaccatcca tctatccatt taaataccaa 8460
atgagttgtt gaatggattc gcggtcttct cggtttattt ttgcttgctt gcgtgcttaa 8520
gggatagtgt gcctcacgct ttccggcatc ttccagacca cagtatatcc atccgcctcc 8580
tgttgaagct tattttttgt atactgtttt gtgatagcac gaagtttttc cacggtatct 8640
tgttaaaaat atatatttgt ggcgggctta cctacatcaa attaataaga gactaattat 8700
aaactaaaca cacaagcaag ctactttagg gtaaaagttt ataaatgctt ttgacgtata 8760
aacgttgctt gtatttatta ttacaattaa aggtggatag aaaacctaga gactagttag 8820
aaactaatct caggtttgcg ttaaactaaa tcagagcccg agaggttaac agaacctaga 8880
aggggactag atatccgggt agggaaacaa aaaaaaaaaa caagacagcc acatattagg 8940
gagactagtt agaagctagt tccaggacta ggaaaataaa agacaatgat accacagtct 9000
agttgacaac tagatagatt ctagattgag gccaaagtct ctgagatcca ggttagttgc 9060
aactaatact agttagtatc tagtctccta taactctgaa gctagaataa cttactacta 9120
ttatcctcac cactgttcag ctgcgcaaac ggagtgattg caaggtgttc agagactagt 9180
tattgactag tcagtgacta gcaataacta acaaggtatt aacctaccat gtctgccatc 9240
accctgcact tcctcgggct cagcagcctt ttcctcctca ttttcatgct cattttcctt 9300
gtttaagact gtgactagtc aaagactagt ccagaaccac aaaggagaaa tgtcttacca 9360
ctttcttcat tgcttgtctc ttttgcatta tccatgtctg caactagtta gagtctagtt 9420
agtgactagt ccgacgagga cttgcttgtc tccggattgt tggaggaact ctccagggcc 9480
tcaagatcca caacagagcc ttctagaaga ctggtcaata actagttggt ctttgtctga 9540
gtctgactta cgaggttgca tactcgctcc ctttgcctcg tcaatcgatg agaaaaagcg 9600
ccaaaactcg caatatggct ttgaaccaca cggtgctgag actagttaga atctagtccc 9660
aaactagctt ggatagctta cctttgccct ttgcgttgcg acaggtcttg cagggtatgg 9720
ttcctttctc accagctgat ttagctgcct tgctaccctc acggcggatc tgcataaaga 9780
gtggctagag gttataaatt agcactgatc ctaggtacgg ggctgaatgt aacttgcctt 9840
tcctttctca tcgcgcggca agacaggctt gctcaaattc ctaccagtca caggggtatg 9900
cacggcgtac ggaccacttg aactagtcac agattagtta gcaactagtc tgcattgaat 9960
ggctgtactt acgggccctc gccattgtcc tgatcatttc cagcttcacc ctcgttgctg 10020
caaagtagtt agtgactagt caaggactag ttgaaatggg agaagaaact cacgaattct 10080
cgacaccctt agtattgtgg tccttggact tggtgctgct atatattagc taatacacta 10140
gttagactca cagaaactta cgcagctcgc ttgcgcttct tggtaggagt cggggttggg 10200
agaacagtgc cttcaaacaa gccttcatac catgctactt gactagtcag ggactagtca 10260
ccaagtaatc tagataggac ttgcctttgg cctccatcag ttccttcata gtgggaggtc 10320
cattgtgcaa tgtaaactcc atgccgtggg agttcttgtc cttcaagtgc ttgaccaata 10380
tgtttctgtt ggcagaggga acctgtcaac tagttaataa ctagtcagaa actagtatag 10440
cagtagactc actgtacgct tgaggcatcc cttcactcgg cagtagactt catatggatg 10500
gatatcaggc acgccattgt cgtcctgtgg actagtcagt aactaggctt aaagctagtc 10560
gggtcggctt actatcttga aatccggcag cgtaagctcc ccgtccttaa ctgcctcgag 10620
atagtgacag tactctgggg actttcggag atcgttatcg cgaatgctcg gcatactaat 10680
cgttgactag tcttggacta gtcccgagca aaaaggattg gaggaggagg aggaaggtga 10740
gagtgagaca aagagcgaaa taagagcttc aaaggctatc tctaagcagt atgaaggtta 10800
agtatctagt tcttgactag atttaaaaga gatttcgact agttatgtac ctggagtttg 10860
gatataggaa tgtgttgtgg taacgaaatg taagggggag gaaagaaaaa gtcggtcaag 10920
aggtaactct aagtcggcca ttcctttttg ggaggcgcta accataaacg gcatggtcga 10980
cttagagtta gctcagggaa tttagggagt tatctgcgac caccgaggaa cggcggaatg 11040
ccaaagaatc ccgatggagc tctagctggc ggttgacaac cccacctttt ggcgtttctg 11100
cggcgttgca ggcgggactg gatacttcgt agaaccagaa aggcaaggca gaacgcgctc 11160
agcaagagtg ttggaagtga tagcatgatg tgccttgtta actaggtcaa aatctgcagt 11220
atgcttgatg ttatccaaag tgtgagagag gaaggtccaa acatacacga ttgggagagg 11280
gcctaggtat aagagttttt gagtagaacg catgtgagcc cagccatctc gaggagatta 11340
aacacgggcc ggcatttgat ggctatgtta gtaccccaat ggaaagcctg agagtccagt 11400
ggtcgcagat aactccctaa attccctgag ctaactctaa gtcgaccatg ccgtttatgg 11460
ttagcgcctc ccaaaaagga atggccgact tagagttacc tcttgaccga ctttttcttt 11520
cctccccctt acatttcgtt accacaacac attcctatat ccaaactcca ggtacataac 11580
tagtcgaaat ctcttttaaa tctagtcaag aactagatac ttaaccttca tactgcttag 11640
agatagcctt tgaagctctt atttcgctct ttgtctcact ctcaccttcc tcctcctcct 11700
ccaatccttt ttgctcggga ctagtccaag actagtcaac gattagtatg ccgagcattc 11760
gcgataacga tctccgaaag tccccagagt actgtcacta tctcgaggca gttaaggacg 11820
gggagcttac gctgccggat ttcaagatag taagccgacc cgactagctt taagcctagt 11880
tactgactag tccacaggac gacaatggcg tgcctgatat ccatccatat gaagtctact 11940
gccgagtgaa gggatgcctc aagcgtacag tgagtctact gctatactag tttctgacta 12000
gttattaact agttgacagg ttccctctgc caacagaaac atattggtca agcacttgaa 12060
ggacaagaac tcccacggca tggagtttac attgcacaat ggacctccca ctatgaagga 12120
actgatggag gccaaaggca agtcctatct agattacttg gtgactagtc cctgactagt 12180
caagtagcat ggtatgaagg cttgtttgaa ggcactgttc tcccaacccc gactcctacc 12240
aagaagcgca agcgagctgc gtaagtttct gtgagtctaa ctagtgtatt agctaatata 12300
tagcagcacc aagtccaagg accacaatac taagggtgtc gagaattcgt gagtttcttc 12360
tcccatttca actagtcctt gactagtcac taactacttt gcagcaacga gggtgaagct 12420
ggaaatgatc aggacaatgg cgagggcccg taagtacagc cattcaatgc agactagttg 12480
ctaactaatc tgtgactagt tcaagtggtc cgtacgccgt gcatacccct gtgactggta 12540
ggaatttgag caagcctgtc ttgccgcgcg atgagaaagg aaaggcaagt tacattcagc 12600
cccgtaccta ggatcagtgc taatttataa cctctagcca ctctttatgc agatccgccg 12660
tgagggtagc aaggcagcta aatcagctgg tgagaaagga accataccct gcaagacctg 12720
tcgcaacgca aagggcaaag gtaagctatc caagctagtt tgggactaga ttctaactag 12780
tctcagcacc gtgtggttca aagccatatt gcgagttttg gcgctttttc tcatcgattg 12840
acgaggcaaa gggagcgagt atgcaacctc gtaagtcaga ctcagacaaa gaccaactag 12900
ttattgacca gtcttctaga aggctctgtt gtggatcttg aggccctgga gagttcctcc 12960
aacaatccgg agacaagcaa gtcctcgtcg gactagtcac taactagact ctaactagtt 13020
gcagacatgg ataatgcaaa agagacaagc aatgaagaaa gtggtaagac atttctcctt 13080
tgtggttctg gactagtctt tgactagtca cagtcttaaa caaggaaaat gagcatgaaa 13140
atgaggagga aaaggctgct gagcccgagg aagtgcaggg tgatggcaga catggtaggt 13200
taataccttg ttagttattg ctagtcactg actagtcaat aactagtctc tgaacacctt 13260
gcaatcactc cgtttgcgca gctgaacagt ggtgaggata atagtagtaa gttattctag 13320
cttcagagtt ataggagact agatactaac tagtattagt tgcaactaac ctggatctca 13380
gagactttgg cctcaatcta gaatctatct agttgtcaac tagactgtgg tatcattgtc 13440
ttttattttc ctagtcctgg aactagcttc taactagtct ccctaatatg tggctgtctt 13500
gttttttttt tttgtttccc tacccggata tctagtcccc ttctaggttc tgttaacctc 13560
tcgggctctg atttagttta acgcaaacct gagattagtt tctaactagt ctctaggttt 13620
tctatccacc tttaattgta ataataaata caagcaacgt ttatacgtca aaagcattta 13680
taaactttta ccctaaagta gcttgcttgt gtgtttagtt tataattagt ctcttattaa 13740
tttgatgtag gtaagcccgc cacaaatata tatttttaac aagataccgt ggaaaaactt 13800
cgtgctatca caaaacagta tacaaaaaat aagctatcga attcctgcag agatcatcct 13860
gtcttcagtc ttaagacttc tctcctatat cacccgcact taccctagag tgccgcttag 13920
gtgctaaggg cacattgagt attggccgtg tagaatatat agcttaagta cggccaagca 13980
gacgggaagc cctgttctcc acaccctatg gtcgtatata tcaggcttct accgggaaac 14040
gattaagagt gtataatgga ctgaaaatca atatgaacgg gacaatgctc aagttaaatt 14100
agttaggcat cctaatctct actaaatgtt ctatctagag atcggggtac tataggcccg 14160
tacgttaatc actctacgct tctctccctt aggtatagtg taggtagggg ctagacattt 14220
atatgagtca gatggtacaa acggtaggca gtgcgggcga agaagtgaag acggagtcgg 14280
ttgaagctac atacaaaaga tgcattggct cgtcatgaag agcctcccgg gtttattcct 14340
ttgccctcgg acgagtgctg gggcgtcggt ttccactatc ggcgagtact tctacacagc 14400
catcggtcca gacggccgcg cttctgcggg cgatttgtgt acgcccgaca gtcccggctc 14460
cggatcggac gattgcgtcg catcgaccct gcgcccaagc tgcatcatcg aaattgccgt 14520
caaccaagct ctgatagagt tggtcaagac caatgcggag catatacgcc cggagccgcg 14580
gcgatcctgc aagctccgga tgcctccgct cgaagtagcg cgtctgctgc tccatacaag 14640
ccaaccacgg cctccagaag aagatgttgg cgacctcgta ttgggaatcc ccgaacatcg 14700
cctcgctcca gtcaatgacc gctgttatgc ggccattgtc cgtcaggaca ttgttggagc 14760
cgaaatccgc gtgcacgagg tgccggactt cggggcagtc ctcggcccaa agcatcagct 14820
catcgagagc ctgcgcgacg gacgcactga cggtgtcgtc catcacagtt tgccagtgat 14880
acacatgggg atcagcaatc gcgcatatga aatcacgcca tgtagtgtat tgaccgattc 14940
cttgcggtcc gaatgggccg aacccgctcg tctggctaag atcggccgca gcgatcgcat 15000
ccatggcctc cgcgaccggc tgcagaacag cgggcagttc ggtttcaggc aggtcttgca 15060
acgtgacacc ctgtgcacgg cgggagatgc aataggtcag gctctcgctg aattccccaa 15120
tgtcaagcac ttccggaatc gggagcgcgg ccgatgcaaa gtgccgataa acataacgat 15180
ctttgtagaa accatcggcg cagctattta cccgcaggac atatccacgc cctcctacat 15240
cgaagctgaa agcacgagat tcttcgccct ccgagagctg catcaggtcg gagacgctgt 15300
cgaacttttc gatcagaaac ttctcgacag acgtcgcggt gagttcaggc attttgacgg 15360
tgggatcctg tgatgtctgc tcaagcgggg tagctgttag tcaagctgcg atgaagtggg 15420
aaagctcgaa ctgaaaggtt caaaggaata agggatggga aggatggagt atggatgtag 15480
caaagtactt acttagggga aataaaggtt cttggatggg aagatgaata tactgaagat 15540
gggaaaagaa agagaaaaga aaagagcagc tggtggggag agcaggaaaa tatggcaaca 15600
aatgttggac tgacgcaacg accttgtcaa ccccgccgac acaccgggcg gacagacggg 15660
gcaaagctgc ctaccaggga ctgagggacc tcagcaggtc gagtgcagag caccggatgg 15720
gtcgactgcc agcttgtgtt cccggtctgc gccgctggcc agctcctgag cggcctttcc 15780
ggtttcatac accgggcaaa gcaggagagg cacgatattt ggacgcccta cagatgccgg 15840
atgggccaat tagggagctt acgcgccggg tactcgctct acctacttcg gagaaggtac 15900
tatctcgtga atcttttacc agatcggaag caattggact tctgtaccta ggttaatggc 15960
atgctatttc gccgacggct atacacccct ggcttcacat tctccttcgc ttactgccgg 16020
tgattcgatg aagctccata ttctccgatg atgcaataga ttcttggtca acgaggggca 16080
caccagcctt tccacttcgg ggcggagggg cggccggtcc cggattaata atcatccact 16140
gcacctcaga gccgccagag ctgtctggcg cagtggcgct tattactcag cccttctctc 16200
tgcgtccgtc cgtctctccg catgccagaa agagtcaccg gtcactgtac agagcggccg 16260
ccaccgcggt ggagctccaa ttcgccctat agtgagtcgt attacgcgcg ctcactggcc 16320
gtcgttttac aacgtcgtga ctgggaaaac cctggcgtta cccaacttaa tcgccttgca 16380
gcacatcccc ctttcgccag ctggcgtaat agcgaagagg cccgcaccga tcgcccttcc 16440
caacagttgc gcagcctgaa tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg 16500
gcgggtgtgg tggttacgcg cagcgtgacc gctacacttg ccagcgccct agcgcccgct 16560
cctttcgctt tcttcccttc ctttctcgcc acgttcgccg gctttccccg tcaagctcta 16620
aatcgggggc tccctttagg gttccgattt agtgctttac ggcacctcga ccccaaaaaa 16680
cttgattagg gtgatggttc acgtagtggg ccatcgccct gatagacggt ttttcgccct 16740
ttgacgttgg agtccacgtt ctttaatagt ggactcttgt tccaaactgg aacaacactc 16800
aaccctatct cggtctattc ttttgattta taagggattt tgccgatttc ggcctattgg 16860
ttaaaaaatg agctgattta acaaaaattt aacgcgaatt ttaacaaaat attaacgctt 16920
acaatttagg tggcactttt cggggaaatg tgcgcggaac ccctatttgt ttatttttct 16980
aaatacattc aaatatgtat ccgctcatga gacaataacc ctgataaatg cttcaataat 17040
attgaaaaag gaagagtatg agtattcaac atttccgtgt cgcccttatt cccttttttg 17100
cggcattttg ccttcctgtt tttgctcacc cagaaacgct ggtgaaagta aaagatgctg 17160
aagatcagtt gggtgcacga gtgggttaca tcgaactgga tctcaacagc ggtaagatcc 17220
ttgagagttt tcgccccgaa gaacgttttc caatgatgag cacttttcga ccgaataaat 17280
acctgtgacg gaagatcact tcgcagaata aataaatcct ggtgtccctg ttgataccgg 17340
gaagccctgg gccaactttt ggcgaaaatg agacgttgat cggcacgtaa gaggttccaa 17400
ctttcaccat aatgaaataa gatcactacc gggcgtattt tttgagttgt cgagattttc 17460
aggagctaag gaagctaaaa tggagaaaaa aatcactgga tataccaccg ttgatatatc 17520
ccaatggcat cgtaaagaac attttgaggc atttcagtca gttgctcaat gtacctataa 17580
ccagaccgtt cagctggata ttacggcctt tttaaagacc gtaaagaaaa ataagcacaa 17640
gttttatccg gcctttattc acattcttgc ccgcctgatg aatgctcatc cggaattacg 17700
tatggcaatg aaagacggtg agctggtgat atgggatagt gttcaccctt gttacaccgt 17760
tttccatgag caaactgaaa cgttttcatc gctctggagt gaataccacg acgatttccg 17820
gcagtttcta cacatatatt cgcaagatgt ggcgtgttac ggtgaaaacc tggcctattt 17880
ccctaaaggg tttattgaga atatgttttt cgtctcagcc aatccctggg tgagtttcac 17940
cagttttgat ttaaacgtgg ccaatatgga caacttcttc gcccccgttt tcaccatggg 18000
caaatattat acgcaaggcg acaaggtgct gatgccgctg gcgattcagg ttcatcatgc 18060
cgtttgtgat ggcttccatg tcggcagaat gcttaatgaa ttacaacagt actgcgatga 18120
gtggcagggc ggggcgtaat ttttttaagg cagttattgg tgcccttaaa cgcctggttg 18180
ctacgcctga ataagtgata ataagcggat gaatggcaga aattcgaaag caaattcgac 18240
ccggtcgtcg gttcagggca gggtcgttaa atagccgctt atgtctattg ctggtttacc 18300
ggtttattga ctaccggaag cagtgtgacc gtgtgcttct caaatgcctg aggccagttt 18360
gctcaggctc tccccgtgga ggtaataatt gacgatatga tccttttttt ctgatcaaaa 18420
aggatctagg tgaagatcct ttttgataat ctcatgacca aaatccctta acgtgagttt 18480
tcgttccact gagcgtcaga ccccgtagaa aagatcaaag gatcttcttg agatcctttt 18540
tttctgcgcg taatctgctg cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt 18600
ttgccggatc aagagctacc aactcttttt ccgaaggtaa ctggcttcag cagagcgcag 18660
ataccaaata ctgttcttct agtgtagccg tagttaggcc accacttcaa gaactctgta 18720
gcaccgccta catacctcgc tctgctaatc ctgttaccag tggctgctgc cagtggcgat 18780
aagtcgtgtc ttaccgggtt ggactcaaga cgatagttac cggataaggc gcagcggtcg 18840
ggctgaacgg ggggttcgtg cacacagccc agcttggagc gaacgaccta caccgaactg 18900
agatacctac agcgtgagct atgagaaagc gccacgcttc ccgaagggag aaaggcggac 18960
aggtatccgg taagcggcag ggtcggaaca ggagagcgca cgagggagct tccaggggga 19020
aacgcctggt atctttatag tcctgtcggg tttcgccacc tctgacttga gcgtcgattt 19080
ttgtgatgct cgtcaggggg gcggagccta tggaaaaacg ccagcaacgc ggccttttta 19140
cggttcctgg ccttttgctg gccttttgct cacatgttct ttcctgcgtt atcccctgat 19200
tctgtggata accgtattac cgcctttgag tgagctgata ccgctcgccg cagccgaacg 19260
accgagcgca gcgagtcagt gagcgaggaa gcggaagagc gcccaatacg caaaccgcct 19320
ctccccgcgc gttggccgat tcattaatgc agctggcacg acaggtttcc cgactggaaa 19380
gcgggcagtg agcgcaacgc aattaatgtg agttagctca ctcattaggc accccaggct 19440
ttacacttta tgctcccggc tcgtatgttg tgtggaattg tgagcggata acaatttcac 19500
acaggaaaca gctatgacca tgattacgcc aagcgcgcaa ttaaccctca ctaaagggaa 19560
caaaagctg 19569
<210> 84
<211> 13672
<212> DNA
<213> Artificial Sequence
<220>
<223> BG-AMA1 AMA phleo / no Cas9 expression cassette
<400> 84
ggtaccttgc ccatcgaacg tacaagtact cctctgttct ctccttcctt tgctttgtgc 60
ggagaccggc ttactaaaag ccagataaca gtatgcatat ttgcgcgctg atttttgcgg 120
tataagaata tatactgata tgtatacccg aagtatgtca aaaagaggta tgctatgaag 180
cagcgtatta cagtgacagt tgacagcgac agctatcagt tgctcaaggc atatatgatg 240
tcaatatctc cggtctggta agcacaacca tgcagaatga agcccgtcgt ctgcgtgccg 300
aacgctggaa agcggaaaat caggaaggga tggctgaggt cgcccggttt attgaaatga 360
acggctcttt tgctgacgag aacaggggct ggtgaaatgc agtttaaggt ttacacctat 420
aaaagagaga gccgttatcg tctgtttgtg gatgtacaga gtgatattat tgacacgccc 480
gggcgacgga tggtgatccc cctggccagt gcacgtctgc tgtcagataa agtctcccgt 540
gaactttacc cggtggtgca tatcggggat gaaagctggc gcatgatgac caccgatatg 600
gccagtgtgc cggtttccgt tatcggggaa gaagtggctg atctcagcca ccgcgaaaat 660
gacatcaaaa acgccattaa cctgatgttc tggggaatat aaggtctcgc ctccggatcg 720
atgtacacaa ccgactgcac ccaaacgaac acaaatctta gcagtgccct cgccggatag 780
cttggactgt cctttaccgt cgccagcaca agaagggtat ctctgaggtc cgtaccgcct 840
tttctttacc actggattcg attttcgcag ttggaatgat acatctgggg actgcgaatg 900
gtttacccct cggccgatac tatgggtcgt gaagagatgg aacattccga aagtgttttg 960
cggataacat tggtggcatc gaaaacagaa tgctgaccat tgatttcaac acgaacagga 1020
ggttgccaag aagcgtaccc gccgtgtcgt caagtcccag cgtgccatcg tcggtgcttc 1080
cctcgacgtg atcaaggagc gccgctccca gcgccccgag gcccgtgccg ccgcccgcca 1140
gcaggccatc aaggacgcca aggagaagaa ggctgccgct gagtccaaga agaaggctga 1200
gaaggctaag aacgccgctg ctggtgccaa gggtgctgct cagcgcatcc agagcaagca 1260
gggtgctaag ggttctgctc ccaaggtcgc tgccaagtct cgttaaggaa tgaataacgg 1320
ttcggcttgg gattgggtgc ggaaggcaag agtttcatgg acgaattttg ggaggttact 1380
ggagctggaa tatgtgtttt ccctaccacc aaaaatgaaa tgttccaaaa ctatcggcgt 1440
gcaagacggc ctcttacggg tttaacggct ctcagataag ctctatcaat cgcgccacgg 1500
atgcatgaat gaagatccag atggccgcgg gatatatcgt gctagtgtaa ttcctacatg 1560
atcttgctgt tcactccatg cgcatccaga tattccaggg gtcgactgtt aattgatatg 1620
cctgggcttg agactccgta gacgcccagt caatgtgcaa ttaatacgag ggtgctgtta 1680
tcggcagcaa ccttgtactt ctccataaga tgggggaatg ccatggacct gagtgatcaa 1740
ttgacgcaag tctcccataa cgcggcggct tgacctaaaa tccatatacc gccccgttga 1800
gcctccgcgc tccagagtcc tgtcccggaa tagggcacaa acctaggcta acctaattcg 1860
tcgtccgcgt ctgagttcag acaaaagaac ttccaagtat cagcagagta cgctgatatt 1920
gataagtagg caaacataag accaataagc aagtagaata aaaaattata aggacactgc 1980
ctccataaag cgccctccca agacctcagg gacaaaactt ctcaagtggc aattcactgc 2040
ctcaggccgt gtccagtgaa gtgacgaagc gacactgttg cctgctgact cagccgcttt 2100
ccgccctgcc gaatttgcca tctcgcttac aggtcagcac tagcgcgatt cgcccacaga 2160
tgctcagcgc aaagtggtga ctcagtcaaa ccccccctac aagattccac ctcgattttt 2220
caacttccca tctcgatccg acaagttcta catccaccgt caaaatggcc tccagcgaag 2280
atgtcatcaa ggagttcatg cgcttcaagg tccgcatgga aggatccgtc aacggccacg 2340
agttcgagat tgagggtgag ggtgagggcc gcccctacga aggcacccag actgccaagc 2400
tcaaggtcac caagggtggt cctctcccct tcgcttggga tatcctgtct cctcagttcc 2460
agtacggctc caaggtctac gtcaagcacc ccgccgacat ccccgactac aagaagcttt 2520
ctttccccga gggtttcaag tgggagcgtg tcatgaactt cgaggatggt ggtgttgtga 2580
ccgttactca ggacagcagc ttgcaggatg gctctttcat ctacaaggtc aagttcattg 2640
gtgtcaactt cccctccgac ggccctgtca tgcagaagaa gaccatgggc tgggaagcgt 2700
cgactgagcg tctgtacccc cgtgacggtg ttctcaaggg tgagatccac aaggctctca 2760
agctcaagga cggtggtcac taccttgttg agttcaagtc catctacatg gccaagaagc 2820
ctgtgcagct gcccggatac tactacgtgg actccaagct tgacatcacc tcccacaacg 2880
aagactacac cattgttgag cagtacgagc gtgctgaggg ccgccaccac ctcttcctga 2940
cccacggaat ggatgagctg tacaagtcga aactataaat aaatggtttg cgttgcgatt 3000
gactgaaacg aaaaaaagcg aaaatgattc tgggaatgaa ttgataaagc gcgggctctg 3060
cggtacggtt acggttgcgg tcgcggacga atggactggg ctgagctggg ctggaggaag 3120
tccatcgaac aaggacaagg ggtggaatat ggcacgggtc gattttgtta tacataccct 3180
accatccatc tatccattta aataccaaat gagttgttga atggattcgc ggtcttctcg 3240
gtttattttt gcttgcttgc gtgcttaagg gatagtgtgc ctcacgcttt ccggcatctt 3300
ccagaccaca gtatatccat ccgcctcctg ttgaagctta ttttttgtat actgttttgt 3360
gatagcacga agtttttcca cggtatcttg ttaaaaatat atatttgtgg cgggcttacc 3420
tacatcaaat taataagaga ctaattataa actaaacaca caagcaagct actttagggt 3480
aaaagtttat aaatgctttt gacgtataaa cgttgcttgt atttattatt acaattaaag 3540
gtggatagaa aacctagaga ctagttagaa actaatctca ggtttgcgtt aaactaaatc 3600
agagcccgag aggttaacag aacctagaag gggactagat atccgggtag ggaaacaaaa 3660
aaaaaaaaca agacagccac atattaggga gactagttag aagctagttc caggactagg 3720
aaaataaaag acaatgatac cacagtctag ttgacaacta gatagattct agattgaggc 3780
caaagtctct gagatccagg ttagttgcaa ctaatactag ttagtatcta gtctcctata 3840
actctgaagc tagaataact tactactatt atcctcacca ctgttcagct gcgcaaacgg 3900
agtgattgca aggtgttcag agactagtta ttgactagtc agtgactagc aataactaac 3960
aaggtattaa cctaccatgt ctgccatcac cctgcacttc ctcgggctca gcagcctttt 4020
cctcctcatt ttcatgctca ttttccttgt ttaagactgt gactagtcaa agactagtcc 4080
agaaccacaa aggagaaatg tcttaccact ttcttcattg cttgtctctt ttgcattatc 4140
catgtctgca actagttaga gtctagttag tgactagtcc gacgaggact tgcttgtctc 4200
cggattgttg gaggaactct ccagggcctc aagatccaca acagagcctt ctagaagact 4260
ggtcaataac tagttggtct ttgtctgagt ctgacttacg aggttgcata ctcgctccct 4320
ttgcctcgtc aatcgatgag aaaaagcgcc aaaactcgca atatggcttt gaaccacacg 4380
gtgctgagac tagttagaat ctagtcccaa actagcttgg atagcttacc tttgcccttt 4440
gcgttgcgac aggtcttgca gggtatggtt cctttctcac cagctgattt agctgccttg 4500
ctaccctcac ggcggatctg cataaagagt ggctagaggt tataaattag cactgatcct 4560
aggtacgggg ctgaatgtaa cttgcctttc ctttctcatc gcgcggcaag acaggcttgc 4620
tcaaattcct accagtcaca ggggtatgca cggcgtacgg accacttgaa ctagtcacag 4680
attagttagc aactagtctg cattgaatgg ctgtacttac gggccctcgc cattgtcctg 4740
atcatttcca gcttcaccct cgttgctgca aagtagttag tgactagtca aggactagtt 4800
gaaatgggag aagaaactca cgaattctcg acacccttag tattgtggtc cttggacttg 4860
gtgctgctat atattagcta atacactagt tagactcaca gaaacttacg cagctcgctt 4920
gcgcttcttg gtaggagtcg gggttgggag aacagtgcct tcaaacaagc cttcatacca 4980
tgctacttga ctagtcaggg actagtcacc aagtaatcta gataggactt gcctttggcc 5040
tccatcagtt ccttcatagt gggaggtcca ttgtgcaatg taaactccat gccgtgggag 5100
ttcttgtcct tcaagtgctt gaccaatatg tttctgttgg cagagggaac ctgtcaacta 5160
gttaataact agtcagaaac tagtatagca gtagactcac tgtacgcttg aggcatccct 5220
tcactcggca gtagacttca tatggatgga tatcaggcac gccattgtcg tcctgtggac 5280
tagtcagtaa ctaggcttaa agctagtcgg gtcggcttac tatcttgaaa tccggcagcg 5340
taagctcccc gtccttaact gcctcgagat agtgacagta ctctggggac tttcggagat 5400
cgttatcgcg aatgctcggc atactaatcg ttgactagtc ttggactagt cccgagcaaa 5460
aaggattgga ggaggaggag gaaggtgaga gtgagacaaa gagcgaaata agagcttcaa 5520
aggctatctc taagcagtat gaaggttaag tatctagttc ttgactagat ttaaaagaga 5580
tttcgactag ttatgtacct ggagtttgga tataggaatg tgttgtggta acgaaatgta 5640
agggggagga aagaaaaagt cggtcaagag gtaactctaa gtcggccatt cctttttggg 5700
aggcgctaac cataaacggc atggtcgact tagagttagc tcagggaatt tagggagtta 5760
tctgcgacca ccgaggaacg gcggaatgcc aaagaatccc gatggagctc tagctggcgg 5820
ttgacaaccc caccttttgg cgtttctgcg gcgttgcagg cgggactgga tacttcgtag 5880
aaccagaaag gcaaggcaga acgcgctcag caagagtgtt ggaagtgata gcatgatgtg 5940
ccttgttaac taggtcaaaa tctgcagtat gcttgatgtt atccaaagtg tgagagagga 6000
aggtccaaac atacacgatt gggagagggc ctaggtataa gagtttttga gtagaacgca 6060
tgtgagccca gccatctcga ggagattaaa cacgggccgg catttgatgg ctatgttagt 6120
accccaatgg aaagcctgag agtccagtgg tcgcagataa ctccctaaat tccctgagct 6180
aactctaagt cgaccatgcc gtttatggtt agcgcctccc aaaaaggaat ggccgactta 6240
gagttacctc ttgaccgact ttttctttcc tcccccttac atttcgttac cacaacacat 6300
tcctatatcc aaactccagg tacataacta gtcgaaatct cttttaaatc tagtcaagaa 6360
ctagatactt aaccttcata ctgcttagag atagcctttg aagctcttat ttcgctcttt 6420
gtctcactct caccttcctc ctcctcctcc aatccttttt gctcgggact agtccaagac 6480
tagtcaacga ttagtatgcc gagcattcgc gataacgatc tccgaaagtc cccagagtac 6540
tgtcactatc tcgaggcagt taaggacggg gagcttacgc tgccggattt caagatagta 6600
agccgacccg actagcttta agcctagtta ctgactagtc cacaggacga caatggcgtg 6660
cctgatatcc atccatatga agtctactgc cgagtgaagg gatgcctcaa gcgtacagtg 6720
agtctactgc tatactagtt tctgactagt tattaactag ttgacaggtt ccctctgcca 6780
acagaaacat attggtcaag cacttgaagg acaagaactc ccacggcatg gagtttacat 6840
tgcacaatgg acctcccact atgaaggaac tgatggaggc caaaggcaag tcctatctag 6900
attacttggt gactagtccc tgactagtca agtagcatgg tatgaaggct tgtttgaagg 6960
cactgttctc ccaaccccga ctcctaccaa gaagcgcaag cgagctgcgt aagtttctgt 7020
gagtctaact agtgtattag ctaatatata gcagcaccaa gtccaaggac cacaatacta 7080
agggtgtcga gaattcgtga gtttcttctc ccatttcaac tagtccttga ctagtcacta 7140
actactttgc agcaacgagg gtgaagctgg aaatgatcag gacaatggcg agggcccgta 7200
agtacagcca ttcaatgcag actagttgct aactaatctg tgactagttc aagtggtccg 7260
tacgccgtgc atacccctgt gactggtagg aatttgagca agcctgtctt gccgcgcgat 7320
gagaaaggaa aggcaagtta cattcagccc cgtacctagg atcagtgcta atttataacc 7380
tctagccact ctttatgcag atccgccgtg agggtagcaa ggcagctaaa tcagctggtg 7440
agaaaggaac cataccctgc aagacctgtc gcaacgcaaa gggcaaaggt aagctatcca 7500
agctagtttg ggactagatt ctaactagtc tcagcaccgt gtggttcaaa gccatattgc 7560
gagttttggc gctttttctc atcgattgac gaggcaaagg gagcgagtat gcaacctcgt 7620
aagtcagact cagacaaaga ccaactagtt attgaccagt cttctagaag gctctgttgt 7680
ggatcttgag gccctggaga gttcctccaa caatccggag acaagcaagt cctcgtcgga 7740
ctagtcacta actagactct aactagttgc agacatggat aatgcaaaag agacaagcaa 7800
tgaagaaagt ggtaagacat ttctcctttg tggttctgga ctagtctttg actagtcaca 7860
gtcttaaaca aggaaaatga gcatgaaaat gaggaggaaa aggctgctga gcccgaggaa 7920
gtgcagggtg atggcagaca tggtaggtta ataccttgtt agttattgct agtcactgac 7980
tagtcaataa ctagtctctg aacaccttgc aatcactccg tttgcgcagc tgaacagtgg 8040
tgaggataat agtagtaagt tattctagct tcagagttat aggagactag atactaacta 8100
gtattagttg caactaacct ggatctcaga gactttggcc tcaatctaga atctatctag 8160
ttgtcaacta gactgtggta tcattgtctt ttattttcct agtcctggaa ctagcttcta 8220
actagtctcc ctaatatgtg gctgtcttgt tttttttttt tgtttcccta cccggatatc 8280
tagtcccctt ctaggttctg ttaacctctc gggctctgat ttagtttaac gcaaacctga 8340
gattagtttc taactagtct ctaggttttc tatccacctt taattgtaat aataaataca 8400
agcaacgttt atacgtcaaa agcatttata aacttttacc ctaaagtagc ttgcttgtgt 8460
gtttagttta taattagtct cttattaatt tgatgtaggt aagcccgcca caaatatata 8520
tttttaacaa gataccgtgg aaaaacttcg tgctatcaca aaacagtata caaaaaataa 8580
gctatcgaat tcctgcagag atcatcctgt cttcagtctt aagacttctc tcctatatca 8640
cccgcactta ccctagagtg ccgcttaggt gctaagggca cattgagtat tggccgtgta 8700
gaatatatag cttaagtacg gccaagcaga cgggaagccc tgttctccac accctatggt 8760
cgtatatatc aggcttctac cgggaaacga ttaagagtgt ataatggact gaaaatcaat 8820
atgaacggga caatgctcaa gttaaattag ttaggcatcc taatctctac taaatgttct 8880
atctagagat cggggtacta taggcccgta cgttaatcac tctacgcttc tctcccttag 8940
gtatagtgta ggtaggggct agacatttat atgagtcaga tggtacaaac ggtaggcagt 9000
gcgggcgaag aagtgaagac ggagtcggtt gaagctacat acaaaagatg cattggctcg 9060
tcatgaagag cctcccgggt ttagtcctgc tcctcggcca cgaagtgcac gcagttgccg 9120
gccgggtcgc gcagggcgaa ctcccgcccc cacggctgct cgccgatctc ggtcatggcc 9180
ggcccggagg cgtcccggaa gttcgtggac acgacctccg accactcggc gtacagctcg 9240
tccaggccgc gcacccacac ccaggccagg gtgttgtccg gcaccacctg gtcctggacc 9300
gcgctgatga acagggtcac gtcgtcccgg accacaccgg cgaagtcgtc ctccacgaag 9360
tcccgggaga acccgagccg gtcggtccag aactcgaccg ctccggcgac gtcgcgcgcg 9420
gtgagcaccg gaacggcact ggtcaacttg gccattttga cggtgggatc ctgtgatgtc 9480
tgctcaagcg gggtagctgt tagtcaagct gcgatgaagt gggaaagctc gaactgaaag 9540
gttcaaagga ataagggatg ggaaggatgg agtatggatg tagcaaagta cttacttagg 9600
ggaaataaag gttcttggat gggaagatga atatactgaa gatgggaaaa gaaagagaaa 9660
agaaaagagc agctggtggg gagagcagga aaatatggca acaaatgttg gactgacgca 9720
acgaccttgt caaccccgcc gacacaccgg gcggacagac ggggcaaagc tgcctaccag 9780
ggactgaggg acctcagcag gtcgagtgca gagcaccgga tgggtcgact gccagcttgt 9840
gttcccggtc tgcgccgctg gccagctcct gagcggcctt tccggtttca tacaccgggc 9900
aaagcaggag aggcacgata tttggacgcc ctacagatgc cggatgggcc aattagggag 9960
cttacgcgcc gggtactcgc tctacctact tcggagaagg tactatctcg tgaatctttt 10020
accagatcgg aagcaattgg acttctgtac ctaggttaat ggcatgctat ttcgccgacg 10080
gctatacacc cctggcttca cattctcctt cgcttactgc cggtgattcg atgaagctcc 10140
atattctccg atgatgcaat agattcttgg tcaacgaggg gcacaccagc ctttccactt 10200
cggggcggag gggcggccgg tcccggatta ataatcatcc actgcacctc agagccgcca 10260
gagctgtctg gcgcagtggc gcttattact cagcccttct ctctgcgtcc gtccgtctct 10320
ccgcatgcca gaaagagtca ccggtcactg tacagagcgg ccgccaccgc ggtggagctc 10380
caattcgccc tatagtgagt cgtattacgc gcgctcactg gccgtcgttt tacaacgtcg 10440
tgactgggaa aaccctggcg ttacccaact taatcgcctt gcagcacatc cccctttcgc 10500
cagctggcgt aatagcgaag aggcccgcac cgatcgccct tcccaacagt tgcgcagcct 10560
gaatggcgaa tgggacgcgc cctgtagcgg cgcattaagc gcggcgggtg tggtggttac 10620
gcgcagcgtg accgctacac ttgccagcgc cctagcgccc gctcctttcg ctttcttccc 10680
ttcctttctc gccacgttcg ccggctttcc ccgtcaagct ctaaatcggg ggctcccttt 10740
agggttccga tttagtgctt tacggcacct cgaccccaaa aaacttgatt agggtgatgg 10800
ttcacgtagt gggccatcgc cctgatagac ggtttttcgc cctttgacgt tggagtccac 10860
gttctttaat agtggactct tgttccaaac tggaacaaca ctcaacccta tctcggtcta 10920
ttcttttgat ttataaggga ttttgccgat ttcggcctat tggttaaaaa atgagctgat 10980
ttaacaaaaa tttaacgcga attttaacaa aatattaacg cttacaattt aggtggcact 11040
tttcggggaa atgtgcgcgg aacccctatt tgtttatttt tctaaataca ttcaaatatg 11100
tatccgctca tgagacaata accctgataa atgcttcaat aatattgaaa aaggaagagt 11160
atgagtattc aacatttccg tgtcgccctt attccctttt ttgcggcatt ttgccttcct 11220
gtttttgctc acccagaaac gctggtgaaa gtaaaagatg ctgaagatca gttgggtgca 11280
cgagtgggtt acatcgaact ggatctcaac agcggtaaga tccttgagag ttttcgcccc 11340
gaagaacgtt ttccaatgat gagcactttt cgaccgaata aatacctgtg acggaagatc 11400
acttcgcaga ataaataaat cctggtgtcc ctgttgatac cgggaagccc tgggccaact 11460
tttggcgaaa atgagacgtt gatcggcacg taagaggttc caactttcac cataatgaaa 11520
taagatcact accgggcgta ttttttgagt tgtcgagatt ttcaggagct aaggaagcta 11580
aaatggagaa aaaaatcact ggatatacca ccgttgatat atcccaatgg catcgtaaag 11640
aacattttga ggcatttcag tcagttgctc aatgtaccta taaccagacc gttcagctgg 11700
atattacggc ctttttaaag accgtaaaga aaaataagca caagttttat ccggccttta 11760
ttcacattct tgcccgcctg atgaatgctc atccggaatt acgtatggca atgaaagacg 11820
gtgagctggt gatatgggat agtgttcacc cttgttacac cgttttccat gagcaaactg 11880
aaacgttttc atcgctctgg agtgaatacc acgacgattt ccggcagttt ctacacatat 11940
attcgcaaga tgtggcgtgt tacggtgaaa acctggccta tttccctaaa gggtttattg 12000
agaatatgtt tttcgtctca gccaatccct gggtgagttt caccagtttt gatttaaacg 12060
tggccaatat ggacaacttc ttcgcccccg ttttcaccat gggcaaatat tatacgcaag 12120
gcgacaaggt gctgatgccg ctggcgattc aggttcatca tgccgtttgt gatggcttcc 12180
atgtcggcag aatgcttaat gaattacaac agtactgcga tgagtggcag ggcggggcgt 12240
aattttttta aggcagttat tggtgccctt aaacgcctgg ttgctacgcc tgaataagtg 12300
ataataagcg gatgaatggc agaaattcga aagcaaattc gacccggtcg tcggttcagg 12360
gcagggtcgt taaatagccg cttatgtcta ttgctggttt accggtttat tgactaccgg 12420
aagcagtgtg accgtgtgct tctcaaatgc ctgaggccag tttgctcagg ctctccccgt 12480
ggaggtaata attgacgata tgatcctttt tttctgatca aaaaggatct aggtgaagat 12540
cctttttgat aatctcatga ccaaaatccc ttaacgtgag ttttcgttcc actgagcgtc 12600
agaccccgta gaaaagatca aaggatcttc ttgagatcct ttttttctgc gcgtaatctg 12660
ctgcttgcaa acaaaaaaac caccgctacc agcggtggtt tgtttgccgg atcaagagct 12720
accaactctt tttccgaagg taactggctt cagcagagcg cagataccaa atactgttct 12780
tctagtgtag ccgtagttag gccaccactt caagaactct gtagcaccgc ctacatacct 12840
cgctctgcta atcctgttac cagtggctgc tgccagtggc gataagtcgt gtcttaccgg 12900
gttggactca agacgatagt taccggataa ggcgcagcgg tcgggctgaa cggggggttc 12960
gtgcacacag cccagcttgg agcgaacgac ctacaccgaa ctgagatacc tacagcgtga 13020
gctatgagaa agcgccacgc ttcccgaagg gagaaaggcg gacaggtatc cggtaagcgg 13080
cagggtcgga acaggagagc gcacgaggga gcttccaggg ggaaacgcct ggtatcttta 13140
tagtcctgtc gggtttcgcc acctctgact tgagcgtcga tttttgtgat gctcgtcagg 13200
ggggcggagc ctatggaaaa acgccagcaa cgcggccttt ttacggttcc tggccttttg 13260
ctggcctttt gctcacatgt tctttcctgc gttatcccct gattctgtgg ataaccgtat 13320
taccgccttt gagtgagctg ataccgctcg ccgcagccga acgaccgagc gcagcgagtc 13380
agtgagcgag gaagcggaag agcgcccaat acgcaaaccg cctctccccg cgcgttggcc 13440
gattcattaa tgcagctggc acgacaggtt tcccgactgg aaagcgggca gtgagcgcaa 13500
cgcaattaat gtgagttagc tcactcatta ggcaccccag gctttacact ttatgctccc 13560
ggctcgtatg ttgtgtggaa ttgtgagcgg ataacaattt cacacaggaa acagctatga 13620
ccatgattac gccaagcgcg caattaaccc tcactaaagg gaacaaaagc tg 13672
<210> 85
<211> 1627
<212> DNA
<213> Artificial Sequence
<220>
<223> SGIC DNA fragment I
<400> 85
ctgcgacagc ggattgggcg gagaagaaga caacccttca gatatattca ggtgcttttc 60
cctcacatgt tttgccgcac cagccatccc actatcaaaa agcgatgatg tttgagattg 120
tcgggtgtcc acatctttta gtgtgaatcg ctagtagaat ttgggatatt attgagcatc 180
atcccatgat agcgagtaca agccccgagt aaataccaac attgctatgc tgctgtgctg 240
ctatctagtt tgctacgttg gtcgttgacc tcacagggat ttccaccaaa aagtggaccg 300
ggcgggcgcc actcggccgt gccacagcag cctgagagcg gacaaataac aacagccgcc 360
tgccgcgggg ttcggttgca aacatgacca acaggccagg ccatcatcaa cccaccgctg 420
cgttgatgcc caggatttca gtccaataat ccacaattta ccaacggata gagctaggtg 480
aattagatag acaggagggc cagagggagg ggaccgagat gaaaaatttt cgatgaaaga 540
gtggtcaagg tggggtcgta gttcggcgct ccgagggcga ggaaccaagg aaaggcgagg 600
aaaggacagg ctgatcgcgc tgcgttgctg ggctgcaagc gtgtccagtt gagtctggaa 660
aaggctccgc cgtgaagatt ctgcgttggt cccgcacctg cgcggtgggg gcattacccc 720
tccatgtcca atgatttcaa gtcaaagcca agggttgaag cccgcccgct tagtcgcctt 780
ctcgcttgac ccctccatat aagtatttcc cctcctcccc ctcccacaaa tttttccttt 840
ccctttcctc cctcgtccgc ttcagtacgt atatcttccc cccctctctc ttccttctca 900
ctcttctctc cttctttctt gattcatcct ctctctaact gacttctttg ctcagcacct 960
ctacgcgttc tggccgtagt atctgagcaa tttttctaca gactttttct atctaattcc 1020
aaaaaagaac ttcgagttca ttcaccaccg tcaaaatgat ctgactgatg agtccgtgag 1080
gacgaaacga gtaagctcgt ctcagatata ttcagtcact ggttttagag ctagaaatag 1140
caagttaaaa taaggctagt ccgttatcaa cttgaaaaag tggcaccgag tcggtgcttt 1200
tggccggcat ggtcccagcc tcctcgctgg cgccggctgg gcaacatgct tcggcatggc 1260
gaatgggact aaaatgcgct aaactgggct tgactcaggg agggatcatg gactagccaa 1320
ttgggcgtgc acagcgcgac tttggagctg gttctggctc gcatgacttg tttcgtgctg 1380
cgggggattc cgttcggacc tgacatttta aaaataaaaa atggaaacat cttgaaagac 1440
aaaaatgagt ttcagtagtg gtctacagac cgtagttttg ttcctattca cagtgaaaat 1500
aaggcgctgc aattgctacg ttcataaatc gagtattgtt gtgctccgaa gcgccagtcc 1560
ccatgttccg caccctcggg aagaagacgg ctgaccacgc aacttgcact gtccgattct 1620
ttgactg 1627
<210> 86
<211> 4081
<212> DNA
<213> Artificial Sequence
<220>
<223> SGIC DNA fragment II A
<400> 86
ctgcgacagc ggattgggcg gagaagaaga caacccttca gatatattca ggtgcttttc 60
cctcacatgt tttgccgcac cagccatccc actatcaaaa agcgatgatg tttgagattg 120
tcgggtgtcc acatctttta gtgtgaatcg ctagtagaat ttgggatatt attgagcatc 180
atcccatgat agcgagtaca agccccgagt aaataccaac attgctatgc tgctgtgctg 240
ctatctagtt tgctacgttg gtcgttgacc tcacagggat ttccaccaaa aagtggaccg 300
ggcgggcgcc actcggccgt gccacagcag cctgagagcg gacaaataac aacagccgcc 360
tgccgcgggg ttcggttgca aacatgacca acaggccagg ccatcatcaa cccaccgctg 420
cgttgatgcc caggatttca gtccaataat ccacaattta ccaacggata gagctaggtg 480
aattagatag acaggagggc cagagggagg ggaccgagat gaaaaatttt cgatgaaaga 540
gtggtcaagg tggggtcgta gttcggcgct ccgagggcga ggaaccaagg aaaggcgagg 600
aaaggacagg ctgatcgcgc tgcgttgctg ggctgcaagc gtgtccagtt gagtctggaa 660
aaggctccgc cgtgaagatt ctgcgttggt cccgcacctg cgcggtgggg gcattacccc 720
tccatgtcca atgatttcaa gtcaaagcca agggttgaag cccgcccgct tagtcgcctt 780
ctcgcttgac ccctccatat aagtatttcc cctcctcccc ctcccacaaa tttttccttt 840
ccctttcctc cctcgtccgc ttcagtacgt atatcttccc cccctctctc ttccttctca 900
ctcttctctc cttctttctt gattcatcct ctctctaact gacttctttg ctcagcacct 960
ctacgcgttc tggccgtagt atctgagcaa tttttctaca gactttttct atctaattcc 1020
aaaaaagaac ttcgagttca ttcaccaccg tcaaaatgat ctgactgatg agtccgtgag 1080
gacgaaacga gtaagctcgt ctcagatata ttcagtcact ggttttagag ctagaaatag 1140
caagttaaaa taaggctagt ccgttatcaa cttgaaaaag tggcaccgag tcggtgcttt 1200
tggccggcat ggtcccagcc tcctcgctgg cgccggctgg gcaacatgct tcggcatggc 1260
gaatgggact aaaatgcgct aaactgggct tgactcaggg agggatcatg gactagccaa 1320
ttgggcgtgc acagcgcgac tttggagctg gttctggctc gcatgacttg tttcgtgctg 1380
cgggggattc cgttcggacc tgacatttta aaaataaaaa atggaaacat cttgaaagac 1440
aaaaatgagt ttcagtagtg gtctacagac cgtagttttg ttcctattca cagtgaaaat 1500
aaggcgctgc aattgctacg ttcataaatc gagtattgtt gtgctccgaa gcgccagtcc 1560
ccatgttccg caccctcaaa gccaaagttc gcgttccgac cttgcctccc aaatccgagt 1620
tgcgattaat ggctctgtac agtgaccggt gactctttct ggcatgcgga gagacggacg 1680
gacgcagaga gaagggctga gtaataagcg ccactgcgcc agacagctct ggcggctctg 1740
aggtgcagtg gatgattatt aatccgggac cggccgcccc tccgccccga agtggaaagg 1800
ctggtgtgcc cctcgttgac caagaatcta ttgcatcatc ggagaatatg gagcttcatc 1860
gaatcaccgg cagtaagcga aggagaatgt gaagccaggg gtgtatagcc gtcggcgaaa 1920
tagcatgcca ttaacctagg tacagaagtc caattgcttc cgatctggta aaagattcac 1980
gagatagtac cttctccgaa gtaggtagag cgagtacccg gcgcgtaagc tccctaattg 2040
gcccatccgg catctgtagg gcgtccaaat atcgtgcctc tcctgctttg cccggtgtat 2100
gaaaccggaa aggccgctca ggagctggcc agcggcgcag accgggaaca caagctggca 2160
gtcgacccat ccggtgctct gcactcgacc tgctgaggtc cctcagtccc tggtaggcag 2220
ctttgccccg tctgtccgcc cggtgtgtcg gcggggttga caaggtcgtt gcgtcagtcc 2280
aacatttgtt gccatatttt cctgctctcc ccaccagctg ctcttttctt ttctctttct 2340
tttcccatct tcagtatatt catcttccca tccaagaacc tttatttccc ctaagtaagt 2400
actttgctac atccatactc catccttccc atcccttatt cctttgaacc tttcagttcg 2460
agctttccca cttcatcgca gcttgactaa cagctacccc gcttgagcag acatcacagg 2520
atcccaccgt caaaatgcct gaactcaccg cgacgtctgt cgagaagttt ctgatcgaaa 2580
agttcgacag cgtctccgac ctgatgcagc tctcggaggg cgaagaatct cgtgctttca 2640
gcttcgatgt aggagggcgt ggatatgtcc tgcgggtaaa tagctgcgcc gatggtttct 2700
acaaagatcg ttatgtttat cggcactttg catcggccgc gctcccgatt ccggaagtgc 2760
ttgacattgg ggaattcagc gagagcctga cctattgcat ctcccgccgt gcacagggtg 2820
tcacgttgca agacctgcct gaaaccgaac tgcccgctgt tctgcagccg gtcgcggagg 2880
ccatggatgc gatcgctgcg gccgatctta gccagacgag cgggttcggc ccattcggac 2940
cgcaaggaat cggtcaatac actacatggc gtgatttcat atgcgcgatt gctgatcccc 3000
atgtgtatca ctggcaaact gtgatggacg acaccgtcag tgcgtccgtc gcgcaggctc 3060
tcgatgagct gatgctttgg gccgaggact gccccgaagt ccggcacctc gtgcacgcgg 3120
atttcggctc caacaatgtc ctgacggaca atggccgcat aacagcggtc attgactgga 3180
gcgaggcgat gttcggggat tcccaatacg aggtcgccaa catcttcttc tggaggccgt 3240
ggttggcttg tatggagcag cagacgcgct acttcgagcg gaggcatccg gagcttgcag 3300
gatcgccgcg gctccgggcg tatatgctcc gcattggtct tgaccaactc tatcagagct 3360
tggttgacgg caatttcgat gatgcagctt gggcgcaggg tcgatgcgac gcaatcgtcc 3420
gatccggagc cgggactgtc gggcgtacac aaatcgcccg cagaagcgcg gccgtctgga 3480
ccgatggctg tgtagaagta ctcgccgata gtggaaaccg acgccccagc actcgtccga 3540
gggcaaagga ataaacccgg gaggctcttc atgacgagcc aatgcatctt ttgtatgtag 3600
cttcaaccga ctccgtcttc acttcttcgc ccgcactgcc taccgtttgt accatctgac 3660
tcatataaat gtctagcccc tacctacact atacctaagg gagagaagcg tagagtgatt 3720
aacgtacggg cctatagtac cccgatctct agatagaaca tttagtagag attaggatgc 3780
ctaactaatt taacttgagc attgtcccgt tcatattgat tttcagtcca ttatacactc 3840
ttaatcgttt cccggtagaa gcctgatata tacgaccata gggtgtggag aacagggctt 3900
cccgtctgct tggccgtact taagctatat attctacacg gccaatactc aatgtgccct 3960
tagcacctaa gcggcactct agggtaagtg cgggtgatat aggagagaag tcttaagact 4020
gaagacagga tgggaagaag acggctgacc acgcaacttg cactgtccga ttctttgact 4080
g 4081
<210> 87
<211> 3436
<212> DNA
<213> Artificial Sequence
<220>
<223> SGIC DNA fragment II B
<400> 87
ctgcgacagc ggattgggcg gagaagaaga caacccttca gatatattca ggtgcttttc 60
cctcacatgt tttgccgcac cagccatccc actatcaaaa agcgatgatg tttgagattg 120
tcgggtgtcc acatctttta gtgtgaatcg ctagtagaat ttgggatatt attgagcatc 180
atcccatgat agcgagtaca agccccgagt aaataccaac attgctatgc tgctgtgctg 240
ctatctagtt tgctacgttg gtcgttgacc tcacagggat ttccaccaaa aagtggaccg 300
ggcgggcgcc actcggccgt gccacagcag cctgagagcg gacaaataac aacagccgcc 360
tgccgcgggg ttcggttgca aacatgacca acaggccagg ccatcatcaa cccaccgctg 420
cgttgatgcc caggatttca gtccaataat ccacaattta ccaacggata gagctaggtg 480
aattagatag acaggagggc cagagggagg ggaccgagat gaaaaatttt cgatgaaaga 540
gtggtcaagg tggggtcgta gttcggcgct ccgagggcga ggaaccaagg aaaggcgagg 600
aaaggacagg ctgatcgcgc tgcgttgctg ggctgcaagc gtgtccagtt gagtctggaa 660
aaggctccgc cgtgaagatt ctgcgttggt cccgcacctg cgcggtgggg gcattacccc 720
tccatgtcca atgatttcaa gtcaaagcca agggttgaag cccgcccgct tagtcgcctt 780
ctcgcttgac ccctccatat aagtatttcc cctcctcccc ctcccacaaa tttttccttt 840
ccctttcctc cctcgtccgc ttcagtacgt atatcttccc cccctctctc ttccttctca 900
ctcttctctc cttctttctt gattcatcct ctctctaact gacttctttg ctcagcacct 960
ctacgcgttc tggccgtagt atctgagcaa tttttctaca gactttttct atctaattcc 1020
aaaaaagaac ttcgagttca ttcaccaccg tcaaaatgat ctgactgatg agtccgtgag 1080
gacgaaacga gtaagctcgt ctcagatata ttcagtcact ggttttagag ctagaaatag 1140
caagttaaaa taaggctagt ccgttatcaa cttgaaaaag tggcaccgag tcggtgcttt 1200
tggccggcat ggtcccagcc tcctcgctgg cgccggctgg gcaacatgct tcggcatggc 1260
gaatgggact aaaatgcgct aaactgggct tgactcaggg agggatcatg gactagccaa 1320
ttgggcgtgc acagcgcgac tttggagctg gttctggctc gcatgacttg tttcgtgctg 1380
cgggggattc cgttcggacc tgacatttta aaaataaaaa atggaaacat cttgaaagac 1440
aaaaatgagt ttcagtagtg gtctacagac cgtagttttg ttcctattca cagtgaaaat 1500
aaggcgctgc aattgctacg ttcataaatc gagtattgtt gtgctccgaa gcgccagtcc 1560
ccatgttccg caccctcaaa gccaaagttc gcgttccgac cttgcctccc aaatccgagt 1620
tgcgattaat ggctctgtac agtgaccggt gactctttct ggcatgcgga gagacggacg 1680
gacgcagaga gaagggctga gtaataagcg ccactgcgcc agacagctct ggcggctctg 1740
aggtgcagtg gatgattatt aatccgggac cggccgcccc tccgccccga agtggaaagg 1800
ctggtgtgcc cctcgttgac caagaatcta ttgcatcatc ggagaatatg gagcttcatc 1860
gaatcaccgg cagtaagcga aggagaatgt gaagccaggg gtgtatagcc gtcggcgaaa 1920
tagcatgcca ttaacctagg tacagaagtc caattgcttc cgatctggta aaagattcac 1980
gagatagtac cttctccgaa gtaggtagag cgagtacccg gcgcgtaagc tccctaattg 2040
gcccatccgg catctgtagg gcgtccaaat atcgtgcctc tcctgctttg cccggtgtat 2100
gaaaccggaa aggccgctca ggagctggcc agcggcgcag accgggaaca caagctggca 2160
gtcgacccat ccggtgctct gcactcgacc tgctgaggtc cctcagtccc tggtaggcag 2220
ctttgccccg tctgtccgcc cggtgtgtcg gcggggttga caaggtcgtt gcgtcagtcc 2280
aacatttgtt gccatatttt cctgctctcc ccaccagctg ctcttttctt ttctctttct 2340
tttcccatct tcagtatatt catcttccca tccaagaacc tttatttccc ctaagtaagt 2400
actttgctac atccatactc catccttccc atcccttatt cctttgaacc tttcagttcg 2460
agctttccca cttcatcgca gcttgactaa cagctacccc gcttgagcag acatcacagg 2520
atcccaccgt caaaatggcc aagttgacca gtgccgttcc ggtgctcacc gcgcgcgacg 2580
tcgccggagc ggtcgagttc tggaccgacc ggctcgggtt ctcccgggac ttcgtggagg 2640
acgacttcgc cggtgtggtc cgggacgacg tgaccctgtt catcagcgcg gtccaggacc 2700
aggtggtgcc ggacaacacc ctggcctggg tgtgggtgcg cggcctggac gagctgtacg 2760
ccgagtggtc ggaggtcgtg tccacgaact tccgggacgc ctccgggccg gccatgaccg 2820
agatcggcga gcagccgtgg gggcgggagt tcgccctgcg cgacccggcc ggcaactgcg 2880
tgcacttcgt ggccgaggag caggactaaa cccgggaggc tcttcatgac gagccaatgc 2940
atcttttgta tgtagcttca accgactccg tcttcacttc ttcgcccgca ctgcctaccg 3000
tttgtaccat ctgactcata taaatgtcta gcccctacct acactatacc taagggagag 3060
aagcgtagag tgattaacgt acgggcctat agtaccccga tctctagata gaacatttag 3120
tagagattag gatgcctaac taatttaact tgagcattgt cccgttcata ttgattttca 3180
gtccattata cactcttaat cgtttcccgg tagaagcctg atatatacga ccatagggtg 3240
tggagaacag ggcttcccgt ctgcttggcc gtacttaagc tatatattct acacggccaa 3300
tactcaatgt gcccttagca cctaagcggc actctagggt aagtgcgggt gatataggag 3360
agaagtctta agactgaaga caggatggga agaagacggc tgaccacgca acttgcactg 3420
tccgattctt tgactg 3436
<210> 88
<211> 1627
<212> DNA
<213> Artificial Sequence
<220>
<223> SGIC DNA fragment III
<400> 88
ctgcgacagc ggattgggcg gagaagaaga caacccttca gatatattca ggtgcttttc 60
cctcacatgt tttgccgcac cagccatccc actatcaaaa agcgatgatg tttgagattg 120
tcgggtgtcc acatctttta gtgtgaatcg ctagtagaat ttgggatatt attgagcatc 180
atcccatgat agcgagtaca agccccgagt aaataccaac attgctatgc tgctgtgctg 240
ctatctagtt tgctacgttg gtcgttgacc tcacagggat ttccaccaaa aagtggaccg 300
ggcgggcgcc actcggccgt gccacagcag cctgagagcg gacaaataac aacagccgcc 360
tgccgcgggg ttcggttgca aacatgacca acaggccagg ccatcatcaa cccaccgctg 420
cgttgatgcc caggatttca gtccaataat ccacaattta ccaacggata gagctaggtg 480
aattagatag acaggagggc cagagggagg ggaccgagat gaaaaatttt cgatgaaaga 540
gtggtcaagg tggggtcgta gttcggcgct ccgagggcga ggaaccaagg aaaggcgagg 600
aaaggacagg ctgatcgcgc tgcgttgctg ggctgcaagc gtgtccagtt gagtctggaa 660
aaggctccgc cgtgaagatt ctgcgttggt cccgcacctg cgcggtgggg gcattacccc 720
tccatgtcca atgatttcaa gtcaaagcca agggttgaag cccgcccgct tagtcgcctt 780
ctcgcttgac ccctccatat aagtatttcc cctcctcccc ctcccacaaa tttttccttt 840
ccctttcctc cctcgtccgc ttcagtacgt atatcttccc cccctctctc ttccttctca 900
ctcttctctc cttctttctt gattcatcct ctctctaact gacttctttg ctcagcacct 960
ctacgcgttc tggccgtagt atctgagcaa tttttctaca gactttttct atctaattcc 1020
aaaaaagaac ttcgagttca ttcaccaccg tcaaaatgat ctgactgatg agtccgtgag 1080
gacgaaacga gtaagctcgt ctcagatata ttcagtcact ggttttagag ctagaaatag 1140
caagttaaaa taaggctagt ccgttatcaa cttgaaaaag tggcaccgag tcggtgcttt 1200
tggccggcat ggtcccagcc tcctcgctgg cgccggctgg gcaacatgct tcggcatggc 1260
gaatgggact aaaatgcgct aaactgggct tgactcaggg agggatcatg gactagccaa 1320
ttgggcgtgc acagcgcgac tttggagctg gttctggctc gcatgacttg tttcgtgctg 1380
cgggggattc cgttcggacc tgacatttta aaaataaaaa atggaaacat cttgaaagac 1440
aaaaatgagt ttcagtagtg gtctacagac cgtagttttg ttcctattca cagtgaaaat 1500
aaggcgctgc aattgctacg ttcataaatc gagtattgtt gtgctccgaa gcgccagtcc 1560
ccatgttccg caccctcaaa gccaaagttc gcgttccgac cttgcctccc aaatccgagt 1620
tgcgatt 1627
<210> 89
<211> 2504
<212> DNA
<213> Artificial Sequence
<220>
<223> SGIC DNA fragment IV A
<400> 89
aaagccaaag ttcgcgttcc gaccttgcct cccaaatccg agttgcgatt aatggctctg 60
tacagtgacc ggtgactctt tctggcatgc ggagagacgg acggacgcag agagaagggc 120
tgagtaataa gcgccactgc gccagacagc tctggcggct ctgaggtgca gtggatgatt 180
attaatccgg gaccggccgc ccctccgccc cgaagtggaa aggctggtgt gcccctcgtt 240
gaccaagaat ctattgcatc atcggagaat atggagcttc atcgaatcac cggcagtaag 300
cgaaggagaa tgtgaagcca ggggtgtata gccgtcggcg aaatagcatg ccattaacct 360
aggtacagaa gtccaattgc ttccgatctg gtaaaagatt cacgagatag taccttctcc 420
gaagtaggta gagcgagtac ccggcgcgta agctccctaa ttggcccatc cggcatctgt 480
agggcgtcca aatatcgtgc ctctcctgct ttgcccggtg tatgaaaccg gaaaggccgc 540
tcaggagctg gccagcggcg cagaccggga acacaagctg gcagtcgacc catccggtgc 600
tctgcactcg acctgctgag gtccctcagt ccctggtagg cagctttgcc ccgtctgtcc 660
gcccggtgtg tcggcggggt tgacaaggtc gttgcgtcag tccaacattt gttgccatat 720
tttcctgctc tccccaccag ctgctctttt cttttctctt tcttttccca tcttcagtat 780
attcatcttc ccatccaaga acctttattt cccctaagta agtactttgc tacatccata 840
ctccatcctt cccatccctt attcctttga acctttcagt tcgagctttc ccacttcatc 900
gcagcttgac taacagctac cccgcttgag cagacatcac aggatcccac cgtcaaaatg 960
cctgaactca ccgcgacgtc tgtcgagaag tttctgatcg aaaagttcga cagcgtctcc 1020
gacctgatgc agctctcgga gggcgaagaa tctcgtgctt tcagcttcga tgtaggaggg 1080
cgtggatatg tcctgcgggt aaatagctgc gccgatggtt tctacaaaga tcgttatgtt 1140
tatcggcact ttgcatcggc cgcgctcccg attccggaag tgcttgacat tggggaattc 1200
agcgagagcc tgacctattg catctcccgc cgtgcacagg gtgtcacgtt gcaagacctg 1260
cctgaaaccg aactgcccgc tgttctgcag ccggtcgcgg aggccatgga tgcgatcgct 1320
gcggccgatc ttagccagac gagcgggttc ggcccattcg gaccgcaagg aatcggtcaa 1380
tacactacat ggcgtgattt catatgcgcg attgctgatc cccatgtgta tcactggcaa 1440
actgtgatgg acgacaccgt cagtgcgtcc gtcgcgcagg ctctcgatga gctgatgctt 1500
tgggccgagg actgccccga agtccggcac ctcgtgcacg cggatttcgg ctccaacaat 1560
gtcctgacgg acaatggccg cataacagcg gtcattgact ggagcgaggc gatgttcggg 1620
gattcccaat acgaggtcgc caacatcttc ttctggaggc cgtggttggc ttgtatggag 1680
cagcagacgc gctacttcga gcggaggcat ccggagcttg caggatcgcc gcggctccgg 1740
gcgtatatgc tccgcattgg tcttgaccaa ctctatcaga gcttggttga cggcaatttc 1800
gatgatgcag cttgggcgca gggtcgatgc gacgcaatcg tccgatccgg agccgggact 1860
gtcgggcgta cacaaatcgc ccgcagaagc gcggccgtct ggaccgatgg ctgtgtagaa 1920
gtactcgccg atagtggaaa ccgacgcccc agcactcgtc cgagggcaaa ggaataaacc 1980
cgggaggctc ttcatgacga gccaatgcat cttttgtatg tagcttcaac cgactccgtc 2040
ttcacttctt cgcccgcact gcctaccgtt tgtaccatct gactcatata aatgtctagc 2100
ccctacctac actataccta agggagagaa gcgtagagtg attaacgtac gggcctatag 2160
taccccgatc tctagataga acatttagta gagattagga tgcctaacta atttaacttg 2220
agcattgtcc cgttcatatt gattttcagt ccattataca ctcttaatcg tttcccggta 2280
gaagcctgat atatacgacc atagggtgtg gagaacaggg cttcccgtct gcttggccgt 2340
acttaagcta tatattctac acggccaata ctcaatgtgc ccttagcacc taagcggcac 2400
tctagggtaa gtgcgggtga tataggagag aagtcttaag actgaagaca ggatgggaag 2460
aagacggctg accacgcaac ttgcactgtc cgattctttg actg 2504
<210> 90
<211> 1859
<212> DNA
<213> Artificial Sequence
<220>
<223> SGIC DNA fragment IV B
<400> 90
aaagccaaag ttcgcgttcc gaccttgcct cccaaatccg agttgcgatt aatggctctg 60
tacagtgacc ggtgactctt tctggcatgc ggagagacgg acggacgcag agagaagggc 120
tgagtaataa gcgccactgc gccagacagc tctggcggct ctgaggtgca gtggatgatt 180
attaatccgg gaccggccgc ccctccgccc cgaagtggaa aggctggtgt gcccctcgtt 240
gaccaagaat ctattgcatc atcggagaat atggagcttc atcgaatcac cggcagtaag 300
cgaaggagaa tgtgaagcca ggggtgtata gccgtcggcg aaatagcatg ccattaacct 360
aggtacagaa gtccaattgc ttccgatctg gtaaaagatt cacgagatag taccttctcc 420
gaagtaggta gagcgagtac ccggcgcgta agctccctaa ttggcccatc cggcatctgt 480
agggcgtcca aatatcgtgc ctctcctgct ttgcccggtg tatgaaaccg gaaaggccgc 540
tcaggagctg gccagcggcg cagaccggga acacaagctg gcagtcgacc catccggtgc 600
tctgcactcg acctgctgag gtccctcagt ccctggtagg cagctttgcc ccgtctgtcc 660
gcccggtgtg tcggcggggt tgacaaggtc gttgcgtcag tccaacattt gttgccatat 720
tttcctgctc tccccaccag ctgctctttt cttttctctt tcttttccca tcttcagtat 780
attcatcttc ccatccaaga acctttattt cccctaagta agtactttgc tacatccata 840
ctccatcctt cccatccctt attcctttga acctttcagt tcgagctttc ccacttcatc 900
gcagcttgac taacagctac cccgcttgag cagacatcac aggatcccac cgtcaaaatg 960
gccaagttga ccagtgccgt tccggtgctc accgcgcgcg acgtcgccgg agcggtcgag 1020
ttctggaccg accggctcgg gttctcccgg gacttcgtgg aggacgactt cgccggtgtg 1080
gtccgggacg acgtgaccct gttcatcagc gcggtccagg accaggtggt gccggacaac 1140
accctggcct gggtgtgggt gcgcggcctg gacgagctgt acgccgagtg gtcggaggtc 1200
gtgtccacga acttccggga cgcctccggg ccggccatga ccgagatcgg cgagcagccg 1260
tgggggcggg agttcgccct gcgcgacccg gccggcaact gcgtgcactt cgtggccgag 1320
gagcaggact aaacccggga ggctcttcat gacgagccaa tgcatctttt gtatgtagct 1380
tcaaccgact ccgtcttcac ttcttcgccc gcactgccta ccgtttgtac catctgactc 1440
atataaatgt ctagccccta cctacactat acctaaggga gagaagcgta gagtgattaa 1500
cgtacgggcc tatagtaccc cgatctctag atagaacatt tagtagagat taggatgcct 1560
aactaattta acttgagcat tgtcccgttc atattgattt tcagtccatt atacactctt 1620
aatcgtttcc cggtagaagc ctgatatata cgaccatagg gtgtggagaa cagggcttcc 1680
cgtctgcttg gccgtactta agctatatat tctacacggc caatactcaa tgtgccctta 1740
gcacctaagc ggcactctag ggtaagtgcg ggtgatatag gagagaagtc ttaagactga 1800
agacaggatg ggaagaagac ggctgaccac gcaacttgca ctgtccgatt ctttgactg 1859
<210> 91
<211> 388
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleotide sequence of the gBlock that contains the sgRNA
expression cassette to target ORF1; i.e. ORF1_SGIC DNA before the
genomic flanking regions are added to either 5' and 3' end
<400> 91
tctttgaaaa gataatgtat gattatgctt tcactcatat ttatacagaa acttgatgtt 60
ttctttcgag tatatacaag gtgattacat gtacgtttga agtacaactc tagattttgt 120
agtgccctct tgggctagcg gtaaaggtgc gcattttttc acaccctaca atgttctgtt 180
caaaagattt tggtcaaacg ctgtagaagt gaaagttggt gcgcatgttt cggcgttcga 240
aacttctccg cagtgaaaga taaatgatcc ctataccaat tcctatggtg ttttagagct 300
agaaatagca agttaaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc 360
ggtggtgctt tttttgtttt ttatgtct 388
<210> 92
<211> 388
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleotide sequence of the gBlock that contains the sgRNA
expression cassette to target ORF2; i.e. ORF2_SGIC DNA before the
genomic flanking regions are added to either 5' and 3' end
<400> 92
tctttgaaaa gataatgtat gattatgctt tcactcatat ttatacagaa acttgatgtt 60
ttctttcgag tatatacaag gtgattacat gtacgtttga agtacaactc tagattttgt 120
agtgccctct tgggctagcg gtaaaggtgc gcattttttc acaccctaca atgttctgtt 180
caaaagattt tggtcaaacg ctgtagaagt gaaagttggt gcgcatgttt cggcgttcga 240
aacttctccg cagtgaaaga taaatgatcg atgagcgtgg taaccgattg ttttagagct 300
agaaatagca agttaaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc 360
ggtggtgctt tttttgtttt ttatgtct 388
<210> 93
<211> 388
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleotide sequence of the gBlock that contains the sgRNA
expression cassette to target ORF3; i.e. ORF3_SGIC DNA before the
genomic flanking regions are added to either 5' and 3' end
<400> 93
tctttgaaaa gataatgtat gattatgctt tcactcatat ttatacagaa acttgatgtt 60
ttctttcgag tatatacaag gtgattacat gtacgtttga agtacaactc tagattttgt 120
agtgccctct tgggctagcg gtaaaggtgc gcattttttc acaccctaca atgttctgtt 180
caaaagattt tggtcaaacg ctgtagaagt gaaagttggt gcgcatgttt cggcgttcga 240
aacttctccg cagtgaaaga taaatgatcg acccaatgct ggccaccggg ttttagagct 300
agaaatagca agttaaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc 360
ggtggtgctt tttttgtttt ttatgtct 388
<210> 94
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleotide sequence of the guide sequence (genomic target
sequence) of ORF1
<400> 94
cctataccaa ttcctatggt 20
<210> 95
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleotide sequence of the guide sequence (genomic target
sequence) of ORF2
<400> 95
gatgagcgtg gtaaccgatt 20
<210> 96
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleotide sequence of the guide sequence (genomic target
sequence) of ORF3
<400> 96
gacccaatgc tggccaccgg 20
<210> 97
<211> 77
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleotide sequence of the forward primer to obtain ORF1 SGIC DNA
sequence for integration
<400> 97
acgaagacgt ttatagacat aaataaagag gaaacgcatt ccgtggtaga tctttgaaaa 60
gataatgtat gattatg 77
<210> 98
<211> 75
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleotide sequence of the reverse primer to obtain ORF1 SGIC DNA
sequence for integration
<400> 98
tcctgtcatt aagagttttt attttttatt ataatactca acacgtgact agacataaaa 60
aacaaaaaaa gcacc 75
<210> 99
<211> 77
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleotide sequence of the forward primer to obtain ORF2 SGIC DNA
sequence for integration
<400> 99
ccagcgtata caatctcgat agttggtttc ccgttctttc cactcccgtc tctttgaaaa 60
gataatgtat gattatg 77
<210> 100
<211> 75
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleotide sequence of the reverse primer to obtain ORF2 SGIC DNA
sequence for integration
<400> 100
gtttttataa cgttcgctgc actgggggcc aagcacaggg caagatgctt agacataaaa 60
aacaaaaaaa gcacc 75
<210> 101
<211> 77
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleotide sequence of the forward primer to obtain ORF3 SGIC DNA
sequence for integration
<400> 101
gcggcttcag ccgttctgaa ccttcaagat ggtgttcggg tgtgatttat tctttgaaaa 60
gataatgtat gattatg 77
<210> 102
<211> 75
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleotide sequence of the reverse primer to obtain ORF3 SGIC DNA
sequence for integration
<400> 102
attatccaaa caaagggtct ttcgttagca aacctagaaa tctgcaaaaa agacataaaa 60
aacaaaaaaa gcacc 75
<210> 103
<211> 488
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleotide sequence of ORF1 SGIC DNA with genomic flanking
regions attached at both the 5' and 3' end to either side for
integration
<400> 103
acgaagacgt ttatagacat aaataaagag gaaacgcatt ccgtggtaga tctttgaaaa 60
gataatgtat gattatgctt tcactcatat ttatacagaa acttgatgtt ttctttcgag 120
tatatacaag gtgattacat gtacgtttga agtacaactc tagattttgt agtgccctct 180
tgggctagcg gtaaaggtgc gcattttttc acaccctaca atgttctgtt caaaagattt 240
tggtcaaacg ctgtagaagt gaaagttggt gcgcatgttt cggcgttcga aacttctccg 300
cagtgaaaga taaatgatcc ctataccaat tcctatggtg ttttagagct agaaatagca 360
agttaaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtggtgctt 420
tttttgtttt ttatgtctag tcacgtgttg agtattataa taaaaaataa aaactcttaa 480
tgacagga 488
<210> 104
<211> 488
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleotide sequence of ORF2 SGIC DNA with genomic flanking
regions attached at both the 5' and 3' end to either side for
integration
<400> 104
ccagcgtata caatctcgat agttggtttc ccgttctttc cactcccgtc tctttgaaaa 60
gataatgtat gattatgctt tcactcatat ttatacagaa acttgatgtt ttctttcgag 120
tatatacaag gtgattacat gtacgtttga agtacaactc tagattttgt agtgccctct 180
tgggctagcg gtaaaggtgc gcattttttc acaccctaca atgttctgtt caaaagattt 240
tggtcaaacg ctgtagaagt gaaagttggt gcgcatgttt cggcgttcga aacttctccg 300
cagtgaaaga taaatgatcg atgagcgtgg taaccgattg ttttagagct agaaatagca 360
agttaaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtggtgctt 420
tttttgtttt ttatgtctaa gcatcttgcc ctgtgcttgg cccccagtgc agcgaacgtt 480
ataaaaac 488
<210> 105
<211> 488
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleotide sequence of ORF3 SGIC DNA with genomic flanking
regions attached at both the 5' and 3' end to either side for
integration
<400> 105
gcggcttcag ccgttctgaa ccttcaagat ggtgttcggg tgtgatttat tctttgaaaa 60
gataatgtat gattatgctt tcactcatat ttatacagaa acttgatgtt ttctttcgag 120
tatatacaag gtgattacat gtacgtttga agtacaactc tagattttgt agtgccctct 180
tgggctagcg gtaaaggtgc gcattttttc acaccctaca atgttctgtt caaaagattt 240
tggtcaaacg ctgtagaagt gaaagttggt gcgcatgttt cggcgttcga aacttctccg 300
cagtgaaaga taaatgatcg acccaatgct ggccaccggg ttttagagct agaaatagca 360
agttaaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtggtgctt 420
tttttgtttt ttatgtcttt tttgcagatt tctaggtttg ctaacgaaag accctttgtt 480
tggataat 488
<210> 106
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleotide sequence of forward primer to confirm knock out of
ORF1 by integration of ORF1 SGIC DNA
<400> 106
tccctatacc aattcctatg gtgt 24
<210> 107
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleotide sequence of reverse primer to confirm knock out of
ORF1 by integration of ORF1 SGIC DNA
<400> 107
tggttcagtt cacagggctt 20
<210> 108
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleotide sequence of forward primer to confirm knock out of
ORF2 by integration of ORF2 SGIC DNA
<400> 108
atcgatgagc gtggtaaccg 20
<210> 109
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleotide sequence of reverse primer to confirm knock out of
ORF2 by integration of ORF2 SGIC DNA
<400> 109
cgcatgcacg aaaaagggaa 20
<210> 110
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleotide sequence of forward primer to confirm knock out of
ORF3 by integration of ORF3 SGIC DNA
<400> 110
tgatcgaccc aatgctggc 19
<210> 111
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleotide sequence of reverse primer to confirm knock out of
ORF3 by integration of ORF3 SGIC DNA
<400> 111
tcttcttgaa ccatgaaccc gt 22

Claims (26)

1.一种自引导整合构建体,其包含:
-引导RNA表达盒,和
-另外的多核苷酸元件,
其中所述引导RNA表达盒能够表达功能性引导RNA或其部分,所述功能性引导RNA或其部分是对靶基因组中的靶序列特异的,其中包含所述引导RNA表达盒和所述另外的多核苷酸元件的所述自引导整合构建体的部分在其5'末端侧接第一多核苷酸并在其3'末端侧接第二多核苷酸,并且其中所述第一和第二多核苷酸与所述靶基因组中所述靶序列侧翼的序列具有序列同一性;前提条件是所述自引导整合构建体不包含编码多核苷酸引导的基因组编辑酶的表达构建体。
2.一种自引导整合构建体,其包含:
-引导RNA表达盒,和任选地,
-另外的多核苷酸元件,其中所述引导RNA表达盒能够表达功能性引导RNA或其部分,所述功能性引导RNA或其部分是对靶基因组中的靶序列特异的,其中包含所述引导RNA表达盒和任选地所述另外的多核苷酸元件的所述自引导整合构建体的部分在其5'末端侧接第一多核苷酸并在其3'末端侧接第二多核苷酸,其中所述第一和第二多核苷酸与所述靶基因组中所述靶序列侧翼的序列具有序列同一性,以及其中所述功能性引导RNA或其部分由所述引导RNA表达盒上的多核苷酸编码,并且所述多核苷酸可操作地连接至RNA聚合酶II启动子、至RNA聚合酶III启动子以及自加工核酶或至单亚基DNA依赖性RNA聚合酶启动子,优选病毒单亚基DNA依赖性RNA聚合酶启动子,更优选T3、SP6、K11或T7 RNA聚合酶启动子;前提条件是所述自引导整合构建体不包含编码多核苷酸引导的基因组编辑酶的表达构建体。
3.一种自引导整合构建体,其包含:
两种或更多种多核苷酸,所述两种或更多种多核苷酸能够彼此重组以产生引导RNA表达盒,以及任选地另外的多核苷酸元件,
其中所述引导RNA表达盒能够表达功能性引导RNA或其部分,其中所述功能性引导RNA或其部分是对靶基因组中的靶序列特异的,其中包含所述引导RNA表达盒和任选地所述另外的多核苷酸元件的所述自引导整合构建体的部分在其5'末端侧接第一多核苷酸并在其3'末端侧接第二多核苷酸,并且其中所述第一和第二多核苷酸与所述靶基因组中所述靶序列侧翼的序列具有序列同一性;前提条件是所述自引导整合构建体不包含编码多核苷酸引导的基因组编辑酶的表达构建体。
4.根据实施方式1-3中任一项所述的自引导整合构建体,其中所述自引导整合构建体是线性的自引导整合构建体。
5.一种组合物,所述组合物包含两种或更多种多核苷酸构件,其中这些构件彼此具有序列同一性以允许它们在体内重组,诸如在宿主细胞中重组,以产生根据实施方式1或2所述的单个自引导整合构建体或以产生根据实施方式4所述的线性自引导整合构建体。
6.根据实施方式1-4所述的自引导整合构建体或根据实施方式5所述的组合物,其中所述另外的多核苷酸元件是控制序列、标记、目的基因、或破坏构建体。
7.一种包含实施方式1-4中任一项所定义的自引导整合构建体的组合物,或根据实施方式5所述的组合物,其优选包含自引导整合构建体文库,所述组合物优选地还包含功能性多核苷酸引导的基因组编辑酶或能够表达功能性多核苷酸引导的基因组编辑酶的表达构建体。
8.一种宿主细胞,其包含实施方式1-4或6中任一项所定义的自引导整合构建体或根据实施方式5所述的组合物。
9.根据实施方式8所述的宿主细胞,其还包含功能性多核苷酸引导的基因组编辑酶,优选地功能性多核苷酸引导的异源基因组编辑酶,或者还包含表达构建体,所述表达构建体能够表达功能性多核苷酸引导的基因组编辑酶,优选功能性多核苷酸引导的异源基因组编辑酶。
10.根据实施方式8或9所述的宿主细胞,其中所述自引导整合构建体整合到所述基因组中所述第一和第二多核苷酸与所述靶基因组中所述靶序列侧翼的序列具有序列同一性的位点处。
11.包含引导RNA表达盒的自引导整合构建体的离体用途,其中所述引导RNA表达盒能够表达功能性引导RNA或其部分,所述功能性引导RNA或其部分是对靶基因组中的靶序列特异的,其中包含所述引导RNA表达盒的所述自引导整合构建体的部分在其5'末端侧接第一多核苷酸并在其3'末端侧接第二多核苷酸,其中所述第一和第二多核苷酸与所述靶基因组中所述靶序列侧翼的序列具有序列同一性,以在宿主细胞中表达对靶基因组中的靶序列特异的功能性引导RNA或其部分,其中对靶基因组中的靶序列特异的所述功能性引导RNA或其部分仅从所述自引导整合构建体表达;前提条件是所述自引导整合构建体不包含编码多核苷酸引导的基因组编辑酶的表达构建体。
12.包含两种或更多种多核苷酸构件的组合物的离体用途,其中这些构件彼此具有序列同一性以允许它们在体内重组,诸如在宿主细胞中重组,以产生包含引导RNA表达盒的自引导整合构建体,其中所述引导RNA表达盒能够表达功能性引导RNA或其部分,所述功能性引导RNA或其部分是对靶基因组中的靶序列特异的,其中包含所述引导RNA表达盒的所述自引导整合构建体的部分在其5'末端侧接第一多核苷酸并在其3'末端侧接第二多核苷酸,其中所述第一和第二多核苷酸与所述靶基因组中所述靶序列侧翼的序列具有序列同一性,以在宿主细胞中表达对靶基因组中的靶序列特异的功能性引导RNA或其部分,其中对靶基因组中的靶序列特异的所述功能性引导RNA或其部分仅从所述自引导整合构建体表达;前提条件是所述自引导整合构建体不包含编码多核苷酸引导的基因组编辑酶的表达构建体。
13.根据实施方式11或12所述的离体用途,其中所述自引导整合构建体是线性自引导整合构建体。
14.根据实施方式11-13中任一项所述的离体用途,其中所述自引导整合构建体还包含另外的多核苷酸元件,其中所述供体多核苷酸优选是控制序列、标记、目的基因,或破坏构建体。
15.根据实施方式11-14中任一项所述的离体用途,其中所述功能性引导RNA或其部分由所述引导RNA表达盒上的多核苷酸编码,并且所述多核苷酸可操作地连接至RNA聚合酶II启动子、至RNA聚合酶III启动子或至单亚基DNA依赖性RNA聚合酶启动子以及任选地至自加工核酶,所述单亚基DNA依赖性RNA聚合酶启动子优选为病毒单亚基DNA依赖性RNA聚合酶启动子,更优选T3、SP6、K11或T7 RNA聚合酶启动子。
16.一种用于生产宿主细胞的离体方法,其包括将自引导整合构建体引入所述宿主细胞中,所述自引导整合构建体包含引导RNA表达盒,所述引导RNA表达盒能够表达功能性引导RNA或其部分,所述功能性引导RNA或其部分是对靶基因组中的靶序列特异的,其中包含所述引导RNA表达盒的所述自引导整合构建体的部分在其5'末端侧接第一多核苷酸并在其3'末端侧接第二多核苷酸,其中所述第一和第二多核苷酸与所述靶基因组中所述靶序列侧翼的序列具有序列同一性,其中在所述宿主中优选地存在或引入功能性多核苷酸引导的基因组编辑酶,其中所述自引导整合构建体整合到所述基因组中的靶位点处,并且其中对靶基因组中的靶序列特异的所述功能性引导RNA或其部分仅从所述引入的自引导整合构建体表达;前提条件是所述自引导整合构建体不包含编码多核苷酸引导的基因组编辑酶的表达构建体。
17.一种用于生产宿主细胞的离体方法,其包括将两种或更多种多核苷酸构件引入所述宿主细胞中,其中这些构件彼此具有序列同一性以允许它们在所述宿主细胞中重组以产生包含引导RNA表达盒的自引导整合构建体,所述引导RNA表达盒能够表达功能性引导RNA或其部分,所述功能性引导RNA或其部分是对靶基因组中的靶序列特异的,其中包含所述引导RNA表达盒的所述自引导整合构建体的部分在其5'末端侧接第一多核苷酸并在其3'末端侧接第二多核苷酸,其中所述第一和第二多核苷酸与所述靶基因组中所述靶序列侧翼的序列具有序列同一性,其中在所述宿主中优选地存在或引入功能性多核苷酸引导的基因组编辑酶,其中所述自引导整合构建体整合到所述基因组中的靶位点处,并且其中对靶基因组中的靶序列特异的所述功能性引导RNA或其部分仅从所述引入的自引导整合构建体表达;前提条件是所述自引导整合构建体不包含编码多核苷酸引导的基因组编辑酶的表达构建体。
18.根据实施方式16或17所述的离体方法,其中所述自引导整合构建体是线性自引导整合构建体。
19.根据实施方式16-18中任一项所述的离体方法,其中所述自引导整合构建还包含另外的多核苷酸元件,其中所述另外的多核苷酸元件优选是控制序列、标记、目的基因,或破坏构建体。
20.根据实施方式16-19中任一项所述的离体方法,其中所述功能性引导RNA或其部分由所述引导RNA表达盒上的多核苷酸编码,并且所述多核苷酸可操作地连接至RNA聚合酶II启动子、至RNA聚合酶III启动子或至单亚基DNA依赖性RNA聚合酶启动子以及任选地至自加工核酶,所述单亚基DNA依赖性RNA聚合酶启动子优选为病毒单亚基DNA依赖性RNA聚合酶启动子,更优选T3、SP6、K11或T7 RNA聚合酶启动子。
21.根据实施方式16-20中任一项所述的离体方法,其中将自引导整合构建体的文库引入宿主细胞群中。
22.根据实施方式16-21中任一项所述的离体方法,其还包括确定所述自引导整合构建体是否整合和/或整合在何处。
23.根据实施方式22所述的离体方法,其中所述确定是通过分析由所产生的宿主细胞生产的基因产物而进行的,优选通过使用选择性生长条件。
24.根据实施方式8-10中任一项所述的宿主细胞,或通过根据实施方式16-23中任一项所述的方法能够获得或通过根据实施方式16-23中任一项所述的方法获得的细胞,所述细胞包含编码目的化合物的多核苷酸。
25.根据实施方式24所述的宿主细胞,其表达目的化合物。
26.一种生产目的化合物的方法,其包括在有助于所述目的化合物的生产的条件下培养根据实施方式24或25所述的细胞,以及任选地纯化或分离所述目的化合物。
CN201880022160.2A 2017-04-06 2018-04-04 自引导整合构建体(sgic) Pending CN110462044A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP17165201.9 2017-04-06
EP17165201 2017-04-06
PCT/EP2018/058612 WO2018127611A1 (en) 2017-04-06 2018-04-04 Self-guiding integration construct (sgic)

Publications (1)

Publication Number Publication Date
CN110462044A true CN110462044A (zh) 2019-11-15

Family

ID=58640668

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880022160.2A Pending CN110462044A (zh) 2017-04-06 2018-04-04 自引导整合构建体(sgic)

Country Status (4)

Country Link
US (1) US20200032252A1 (zh)
EP (1) EP3607071A1 (zh)
CN (1) CN110462044A (zh)
WO (1) WO2018127611A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019215102A1 (en) * 2018-05-09 2019-11-14 Dsm Ip Assets B.V. Crispr transient expression construct (ctec)
CN112410234B (zh) * 2019-08-21 2022-08-23 江南大学 一种多靶点编辑重组曲霉菌株的可视化筛选方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016110453A1 (en) * 2015-01-06 2016-07-14 Dsm Ip Assets B.V. A crispr-cas system for a filamentous fungal host cell
CN106029886A (zh) * 2013-12-19 2016-10-12 阿迈瑞斯公司 基因组整合的方法
CN106133141A (zh) * 2014-01-08 2016-11-16 哈佛学院董事及会员团体 Rna引导的基因驱动
WO2017037304A2 (en) * 2016-07-28 2017-03-09 Dsm Ip Assets B.V. An assembly system for a eukaryotic cell

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1169961C (zh) 1997-04-11 2004-10-06 Dsm公司 基因转变作为工具用于构建重组的工业化丝状真菌
AU736111C (en) 1997-12-22 2004-02-19 Dsm Ip Assets B.V. Expression cloning in filamentous fungi
EP1644542B1 (en) 2003-07-15 2011-11-02 Mintek Oxidative leach process
WO2005026356A1 (en) 2003-09-12 2005-03-24 Commonwealth Scientific And Industrial Research Organisation Modified gene-silencing nucleic acid molecules and uses thereof
US8129143B2 (en) 2004-10-15 2012-03-06 Dsm Ip Assets B.V. Method for production of a compound in a eukaryotic cell
US7888489B2 (en) 2005-01-24 2011-02-15 Dsm Ip Assets B.V. Method for producing a compound of interest in a filamentous fungal cell
WO2008000632A1 (en) 2006-06-29 2008-01-03 Dsm Ip Assets B.V. A method for achieving improved polypeptide expression
WO2008053019A2 (en) 2006-11-02 2008-05-08 Dsm Ip Assets B.V. Method for reducing the expression of a gene in a filamentous fungal cell
EP2406386B1 (en) 2009-03-10 2019-01-23 DSM IP Assets B.V. Method for improving the yield of a polypeptide
AU2010241099A1 (en) 2009-04-22 2011-10-27 Dsm Ip Assets B.V. Process for the production of a recombinant polypeptide of interest
EP2456872B1 (en) 2009-07-22 2017-08-30 DSM IP Assets B.V. Improved host cell for the production of a compound of interest
EP2831238B1 (en) 2012-03-27 2018-01-03 DSM IP Assets B.V. Cloning method
US8697359B1 (en) * 2012-12-12 2014-04-15 The Broad Institute, Inc. CRISPR-Cas systems and methods for altering expression of gene products
US10227610B2 (en) 2013-02-25 2019-03-12 Sangamo Therapeutics, Inc. Methods and compositions for enhancing nuclease-mediated gene disruption
CN104320596B (zh) 2014-09-30 2017-11-21 北京智谷技术服务有限公司 超分辨率图像的获取方法和获取装置
CN105530423B (zh) 2014-09-30 2018-09-04 北京智谷技术服务有限公司 超分辨率图像的获取方法和获取装置
WO2016110512A1 (en) 2015-01-06 2016-07-14 Dsm Ip Assets B.V. A crispr-cas system for a yeast host cell
US20190175762A1 (en) * 2015-10-02 2019-06-13 President And Fellows Of Harvard College Dependent Component Genome Editing Gene Drives

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106029886A (zh) * 2013-12-19 2016-10-12 阿迈瑞斯公司 基因组整合的方法
CN106133141A (zh) * 2014-01-08 2016-11-16 哈佛学院董事及会员团体 Rna引导的基因驱动
WO2016110453A1 (en) * 2015-01-06 2016-07-14 Dsm Ip Assets B.V. A crispr-cas system for a filamentous fungal host cell
WO2017037304A2 (en) * 2016-07-28 2017-03-09 Dsm Ip Assets B.V. An assembly system for a eukaryotic cell

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JAMES E. DICARLO ET AL.: "Safeguarding CRISPR-Cas9 gene drives in yeast", 《NAT BIOTECHNOL. 》 *

Also Published As

Publication number Publication date
EP3607071A1 (en) 2020-02-12
US20200032252A1 (en) 2020-01-30
WO2018127611A1 (en) 2018-07-12

Similar Documents

Publication Publication Date Title
AU2016203445B2 (en) Integration of a polynucleotide encoding a polypeptide that catalyzes pyruvate to acetolactate conversion
CN109715804A (zh) 用于宿主细胞的指导rna表达系统
DK2087106T3 (en) MUTATING DELTA8 DESATURATION GENES CONSTRUCTED BY TARGETED MUTAGENES AND USE THEREOF IN THE MANUFACTURE OF MULTI-Saturated FAT ACIDS
CN101939434B (zh) 用于在大豆中提高种子贮藏油脂的生成和改变脂肪酸谱的来自解脂耶氏酵母的dgat基因
CN102695796B (zh) 细胞、核酸、酶和它们用于生产槐糖脂的用途以及方法
DK2927316T3 (en) Total fermentation of oligosaccharides
CN110551713B (zh) 用于修饰梭状芽孢杆菌属细菌的优化的遗传工具
KR20210149060A (ko) Tn7-유사 트랜스포존을 사용한 rna-유도된 dna 통합
KR20140099224A (ko) 케토-아이소발레레이트 데카르복실라제 효소 및 이의 이용 방법
DK2443248T3 (en) IMPROVEMENT OF LONG-CHAIN POLYUM Saturated OMEGA-3 AND OMEGA-6 FATTY ACID BIOS SYNTHESIS BY EXPRESSION OF ACYL-CoA LYSOPHOSPHOLIPID ACYL TRANSFERASES
DK2324120T3 (en) Manipulating SNF1 protein kinase OF REVISION OF OIL CONTENT IN OLEAGINOUS ORGANISMS
DK2324119T3 (en) Mutant DELTA5 Desaturases AND USE THEREOF FOR THE PRODUCTION OF polyunsaturated fatty acids
KR20130087014A (ko) 알코올 생산성 향상을 위한 지방산의 보충
KR20130087013A (ko) 추출 발효에서의 알코올 제거를 위한 오일로부터 유래되는 추출 용매
KR20140092759A (ko) 숙주 세포 및 아이소부탄올의 제조 방법
KR20070085665A (ko) 도코사헥사엔산을 생성하는 야로위아 리폴리티카 균주
CN101001951B (zh) 分离转录终止序列的方法
KR20120099509A (ko) 재조합 숙주 세포에서 육탄당 키나아제의 발현
KR20140113997A (ko) 부탄올 생성을 위한 유전자 스위치
KR20100118973A (ko) 이소프렌을 생성하기 위한 조성물 및 방법
KR20110015045A (ko) 2-상 추출 발효를 이용한 부탄올의 생산방법
KR20080071190A (ko) 델타-9 일롱가제, 및 다중불포화 지방산 생성에 있어서의이들의 용도
KR20120117990A (ko) 삼투조절물질 첨가를 동반한 추출성 발효를 사용해 부탄올을 제조하는 방법
BRPI0806354A2 (pt) plantas oleaginosas transgências, sementes, óleos, produtos alimentìcios ou análogos a alimento, produtos alimentìcios medicinais ou análogos alimentìcios medicinais, produtos farmacêuticos, bebidas fórmulas para bebês, suplementos nutricionais, rações para animais domésticos, alimentos para aquacultura, rações animais, produtos de sementes inteiras, produtos de óleos misturados, produtos, subprodutos e subprodutos parcialmente processados
KR20120115500A (ko) 전해질 첨가를 동반한 추출성 발효를 사용해 부탄올을 제조하는 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20191115

WD01 Invention patent application deemed withdrawn after publication