CN111433369A

CN111433369A - 用于毕赤酵母和其他宿主细胞基因组整合的方法

Info

Publication number: CN111433369A
Application number: CN201880074318.0A
Authority: CN
Inventors: 江汉笑
Original assignee: Amyris Inc
Current assignee: Amyris Inc
Priority date: 2017-09-18
Filing date: 2018-09-12
Publication date: 2020-07-17
Also published as: EP3684939A1; US20220315937A1; BR112020005154A2; US20200208163A1; WO2019055481A1; US11390874B2

Abstract

本发明提供了通过在宿主细胞(包括毕赤酵母(Pichia))中使用CRISPR高效靶向且无标志物的单、双、三、四和五重整合。

Description

用于毕赤酵母和其他宿主细胞基因组整合的方法

背景技术

通常，使用具有药物或营养缺陷型标志物的载体或线性构建体转化巴斯德毕赤酵母(P.pastoris)。为了改善来自整合的构建体的蛋白质生产，克隆以增加药物浓度和随机选择构建体扩增的方式传代。靶向整合是可能的，并且当YKU70在酵母细胞中缺失以减少NHEJ(非同源末端连接)修复机制时，靶向整合大大改善。然而，可用的标志物是有限的，并且对于规模更大的工程改造尝试而言，标志物再循环(即，重复使用相同的标志物)是必要的。对于快速菌株工程改造，例如在巴斯德毕赤酵母中，需要一种高效、无标志物且靶向的同源整合转化方法。最近，Weninger等(Journal of Biotechnology 235:139-149 2016)报告了巴斯德毕赤酵母中的CRISPR方案，其使用强组成型启动子用于Cas9表达，以及驱动gRNA表达的RNA聚合酶II启动子，并且所有组件都包含在大质粒上。该研究报告了通过NHEJ将插入和缺失(插入缺失)高效率引入单个基因或多个基因，这通常会导致功能丧失，相当于敲除。然而，当提供无标志物供体DNA进行靶向整合时，观测到的比率仅为2.4％。

因此，当前已知的方法需要改进。本发明解决了这些和其他需求。

发明概述

本发明提供了破坏或将所需供体DNA分子插入宿主细胞基因组中一个或多个靶位点的方法。

在一些实施方式中，该方法包括(a)使包含编码RNA引导的DNA内切核酸酶的核酸的宿主细胞接触：(i)第一线性核酸，其能够与其自身或与宿主细胞所接触的一种或多种其他线性核酸同源重组，从而宿主细胞中的同源重组导致环状染色体外核酸的形成，所述环状染色体外核酸包含选择性标志物的编码序列，和(ii)第二线性核酸，其从5'到3'包含RNA聚合酶II启动子，编码第一核酶的第一核酸，编码向导RNA的核酸，编码第二核酶的第二核酸和终止子，其中向导RNA引导DNA核酸酶至靶位点。然后选择表达选择性标志物的转化的宿主细胞。在一些实施方式中，NHEJ在宿主细胞中降低。在一些实施方式中，将编码RNA引导的DNA内切核酸酶的核酸整合到宿主细胞基因组中。

在一些实施方式中，该方法还包括使宿主细胞与供体DNA分子接触，所述供体DNA分子能够与靶位点同源重组，从而宿主细胞中的同源重组导致供体DNA分子在靶位点处整合。在一些实施方式中，供体DNA分子包含编码抗体的核酸序列。在一些情况中，接触步骤包括使细胞与能够与不同靶位点同源重组的两种或更多种供体DNA分子接触，从而宿主细胞中的同源重组导致供体DNA分子在不同的靶位点处整合。

例如，在本文所提供的任何方法中使用的宿主细胞可以是非常规酵母细胞。在一些实施方式中，宿主细胞是毕赤酵母(Pichia)，特别是巴斯德毕赤酵母(Pichiapastoris)。

在一些实施方式中，接触步骤包括使细胞与两种或更多种第二线性核酸分子接触，其中第二线性核酸分子各自包含编码不同向导RNA的核酸，其引导DNA核酸酶至不同的靶位点。根据本发明的方法对于靶向整合供体核酸至宿主细胞基因组中的单，双或多重效率导致高效率。如本文所用，靶向效率指在筛选的细胞中，包含成功整合的供体核酸的转化细胞的百分比。

在一些实施方式中，可以将编码RNA引导的DNA内切核酸酶的核酸操作性地连接毕赤酵母pPGK1启动子。此外，可以将编码RNA引导的DNA内切核酸酶的核酸整合到YKU70基因中，从而降低宿主细胞中的NHEJ活性。在某些实施方式中，可以将编码RNA引导的DNA内切核酸酶的核酸整合到另一基因组基因座(诸如YKU80基因中)以降低NHEJ。在其他实施方式中，可以将编码RNA引导的DNA内切核酸酶的核酸整合到不同的基因组基因座，并且可以单独地功能性破坏NHEJ过程中涉及的一个或多个基因。RNA引导的DNA内切核酸酶可以是Cas9。在一些实施方式中，编码Cas9的核酸序列经密码子优化用于在酵母(Saccharomyces)中表达。

本发明还提供了通过本发明的方法制备的宿主细胞。宿主细胞可以包含供体DNA分子，所述供体DNA分子包含编码抗体的核酸序列。因此，本发明还提供了产生抗体的方法。该方法包括在适合生产抗体的条件下培养宿主细胞并回收通过宿主细胞产生的抗体。宿主细胞可以是毕赤酵母。

附图说明

图1A和1B显示了工程改造的巴斯德毕赤酵母菌株分泌全长赫塞汀(Herceptin)和美罗华(Rituxan)。通过Western印迹在非还原(A)和还原(B)条件下测试蛋白A纯化的样品。泳道1-4，蛋白A纯化的样品；泳道5-8，蛋白A纯化和内切(Endo)H_f处理的样品。泳道1和5，具有前α分泌前导序列(pre-alpha secretion leader sequence)的赫塞汀；泳道2和6，具有前α分泌前导序列和LC中KR突变为TR的赫塞汀；泳道3和7，具有Kar2前导序列的美罗华；泳道4和8，具有Kar2序列和LC中KR突变为TR的美罗华。MW，分子量标，并且数量位于各凝胶的左侧。+，BIIB抗体标准品。

图2显示了质谱分析来自产生赫塞汀的巴斯德毕赤酵母的样品的结果。分析样品以确定由巴斯德毕赤酵母产生的赫塞汀的N-聚糖概况。质谱分析结果如所预期，巴斯德毕赤酵母所产生的赫塞汀具有高甘露糖含量的糖基化模式。

定义

本说明书和所附权利要求书中，单数形式“一”和“所述”包括复数含意，除非另有明确说明。

术语“核酸”或“核苷酸”是指单链或双链形式的脱氧核糖核酸(DNA)或核糖核酸(RNA)及其聚合物。除非另有说明，否则具体核酸序列还隐含地包括其保守修饰的变体(例如，简并密码子取代)，等位基因，直系同源物，SNP和互补序列以及明确指出的序列。具体而言，可通过产生一个或多个选定(或所有)密码子的第三个位置被混合碱基和/或脱氧肌苷残基取代的序列来获得简并密码子取代形式(Batzer等，Nucleic Acid Res.19:5081(1991)；Ohtsuka等，J.Biol.Chem.260:2605-2608(1985)；和Rossolini等，Mol.Cell.Probes 8:91-98(1994))。

术语“基因”可以表示参与产生或编码多肽链的DNA区段。它可以包括编码区之前和之后的区域(前导区和尾区)以及各个编码区段(外显子)之间的间插序列(内含子)。或者，术语“基因”可以表示涉及产生或编码非翻译的RNA，如rRNA、tRNA、向导RNA或微小RNA。

“启动子”定义为指导核酸转录的一种或多种核酸控制序列。如本文所用，启动子包括靠近转录起始位点的必需的核酸序列。启动子还任选地包括远端增强子或阻抑物元件，其可位于距转录起始位点多达几千个碱基对处。

如本文所用，术语“无标志物(marker-less)”指在没有同时整合选择性标志物的情况下将供体DNA整合到宿主细胞基因组内的靶位点中。该术语还指这样的情况，其中没有将选择性标志物基因整合到宿主细胞基因组中用于回收其中供体DNA被整合到宿主细胞基因组中的宿主细胞。在一些实施方式中，该术语还指在不利用依赖于将选择性标志物整合到宿主细胞基因组中的选择方案的情况下回收这类宿主细胞。例如，在某些实施方式中，附加型或染色体外选择标志物可以用于选择包含质粒的细胞，所述质粒包含gRNA。只要选择性标志物没有被整合到宿主细胞基因组中，这类应用就被认为是无标志物。

如本文所用，术语“操作性连接”指核酸序列之间的功能性连接，从而使序列编码所需的功能。例如，当连接的启动子和/或调节区功能性地控制编码序列的表达时，感兴趣基因(例如选择性标志物)的编码序列与其启动子和/或调节序列操作性连接。它还指编码序列之间的连接，从而使它们可以被相同的连接的启动子和/或调节区所控制；编码序列之间的这种连接也可以称为在框内或相同编码框中连接。“操作性连接”还指功能性但非编码序列，如自主繁殖序列或复制起点的连接。当这类序列能够进行其正常功能时，例如，在宿主细胞中能够使携带该序列的载体复制、繁殖和/或分离，这类序列处于操作性连接。

如本文所用，术语“转化”指因为将外源性遗传物质引入宿主细胞而导致的宿主细胞的遗传改变。

如本文所用，术语“选择表达选择性标志物的宿主细胞”还包括由转化细胞群富集表达选择性标志物的宿主细胞。

如本文所用，术语“选择性标志物”指用作指导选择包含如本文所述的标志物(例如，由宿主细胞中环状染色体外核酸所表达的标志物)的宿主细胞的基因。选择性标志物包括但不限于：荧光标志物，发光标志物和药物选择性标志物等。荧光标志物可以包括但不限于，编码荧光蛋白诸如绿色荧光蛋白(GFP)、青色荧光蛋白(CFP)、黄色荧光蛋白(YFP)、红色荧光蛋白(dsRFP)等的基因。发光标志物可以包括但不限于，编码发光蛋白诸如荧光素酶的基因。适用于本文所提供的方法和组合物的药物选择性标志物包括但不限于，对抗生素诸如氨苄青霉素、链霉素、庆大霉素、卡那霉素、潮霉素、四环素、氯霉素和新霉素具有抗性的基因，例如。在一些实施方式中，选择可以是阳性选择；也就是，由群体分离表达标志物的细胞，例如，以产生包含该选择性标志物的富集的细胞群。在其他情况中，选择可以是阴性选择；也就是，将群体与细胞分离，例如，以产生不包含选择性标志物的富集的细胞群。可以通过适用于所用选择性标志物的任何常规分离技术进行分离。例如，如果使用荧光标志物，那么可以通过荧光激活细胞分来分离细胞，然而如果已经插入了细胞表面标志物，那么可以通过亲和分离技术，例如，磁性分离，亲和色谱，使用与固体基质连接的亲和试剂“淘选(panning)”，或其他常规技术将细胞从异质性群体分离。

“多肽”、“肽”和“蛋白质”在本文中可互换使用，指氨基酸残基的聚合物。本文中，这些术语涵盖任意长度的氨基酸链，包括全长蛋白质，其中氨基酸残基通过共价肽键相连。

本文中，“互补”或“互补性”指核苷酸之间或核酸之间特定的碱基配对。一些实施方式中，举例来说而非限定，描述了宿主细胞基因组中靶位点或区和向导RNA之间的碱基配对。互补核苷酸通常是A和T(或A和U)以及G和C。本文所述的向导RNA可以包含序列，例如，与宿主细胞中基因组序列完美互补或基本互补(例如，具有1-4个错配)的DNA靶向序列。

“CRISPR/Cas”系统是指用于防御外来核酸的一类广泛的细菌系统。CRISPR/Cas系统存在于广泛的真细菌和古细菌中。CRISPR/Cas系统包括如下类型：I、II和III亚型。野生型II型CRISPR/Cas系统利用RNA引导的内切核酸酶，Cas9，与向导RNA一起，识别和切割外来核酸。

如本文所用，关于RNA引导的内切核酸酶(例如，Cas9)，术语“切割”，“切割的”和/或“裂解”指在特定核酸中产生断裂的行为。如本领域技术人员所理解的，该断裂可以留下钝性末端或粘性的末端(即5'或3'突出端)。该术语还包括单链DNA断裂(“切口(nick)”)和双链DNA断裂。

如本文所用，术语“Cas9”指RNA引导的核酸酶(例如，来自细菌或古细菌来源，或由其衍生)。RNA引导的核酸酶包括前述Cas9蛋白质和其同源物，并且包括但不限于Cpf1(参见例如，Zetsche等,Cell,第163卷,第3期,第759–771页,2015年10月22日)。

Cas9同源物存在于多种真细菌，包括但不限于，下述分类学组的细菌：放线菌(Actinobacteria)、产水菌(Aquificae)、拟杆菌-绿菌(Bacteroidetes-Chlorobi)、衣原体-疣微菌(Chlamydiae-Verrucomicrobia)、绿屈挠菌(Chlroflexi)、蓝藻细菌(Cyanobacteria)、厚壁菌(Firmicutes)、变形菌(Proteobacteria)、螺旋体(Spirochaetes)、和热孢菌(Thermotogae)。示例性的Cas9蛋白是酿脓链球菌(Streptococcus pyogenes)Cas9蛋白。其他Cas9蛋白和其同源物述于，例如，Chylinksi,等,RNA Biol.2013年5月1日；10(5):726–737；Nat.Rev.Microbiol.2011年6月；9(6):467-477；Hou,等,Proc Natl Acad Sci U S A.2013年9月24日；110(39):15644-9；Sampson等,Nature.2013年5月9日；497(7448):254-7；和Jinek,等,Science.2012年8月17日；337(6096):816-21。本文所提供的任何Cas9核酸酶的变体可以经优化以在宿主细胞中提供高效活性或增强稳定性。因此，还考虑了用于在毕赤酵母或酵母中表达的工程改造的Cas9核酸酶，例如，密码子优化的Cas9核酸酶。

如本文所用，在破坏宿主细胞基因组中靶位点的上下文中，短语“破坏”指在靶位点中诱导核酸断裂。破坏可用于编辑基因组。如本文所用，术语“编辑”指靶位点处基因组序列的结构变化。例如，可以通过使细胞的基因组中核苷酸序列缺失或将核苷酸序列插入细胞的基因组中来编辑宿主细胞基因组。核苷酸序列可以编码多肽或其片段。这类编辑可以这样进行，例如，通过诱导宿主细胞基因组中靶位点内的双链断裂，或相对链上的一对单链切口，并侧接宿主细胞基因组中的靶位点。用于在靶位点处或在靶位点内诱导单链或双链断裂的方法包括使用RNA引导的DNA内切核酸酶或其衍生物和针对宿主细胞基因组中靶位点的向导RNA。

本文所用短语“异源性”指通常不天然存在的物质。术语”异源性核苷酸序列“指通常不天然存在于给定细胞的核苷酸序列。因此，异源性核苷酸序列可以是：(a)对其宿主细胞而言是外来的(即，对所述细胞而言为外源性的)；(b)天然存在于宿主细胞中(即，内源性)，但以不自然量存在于细胞中(即，比宿主细胞中天然存在的量大或少)；或(c)天然存在于宿主细胞中但位于其天然基因座外。

如本文所用，术语“同源重组”指核苷酸序列在相似或相同的两个DNA分子之间交换的分子过程。

本文所用术语“非同源性末端连接”或NHEJ指这样的细胞过程，其中DNA链的切割或切口端在不需要同源性核酸模板的情况下直接连接。NHEJ可以导致修复位点处一个或多个核苷酸的添加、缺失、取代或其组合。

本文所用术语同源定向修复(HDR)指这样的细胞过程，其中DNA链的切割或切口端通过从同源模板核酸的聚合而修复，例如，供体DNA分子。因此，原始序列被模板的序列替代。同源性模板核酸可以通过基因组中其他位置的同源性序列(姐妹染色单体，同源性染色体或相同或不同染色体上的重复区域)提供。或者，可以引入外源性模板核酸，例如，供体DNA分子，以在靶位点获得特定的HDR诱导的序列改变。以此方式，可以将特定序列引入切割位点。

如本文所用，在将核酸或蛋白质引入宿主细胞的上下文中，短语“引入”或“接触”指导致宿主细胞内存在异源性核酸或多肽的任何过程。例如，该术语包括引入核酸分子(例如，质粒或线性核酸)，其编码感兴趣的核酸(例如，RNA分子)或感兴趣的多肽并导致RNA分子的转录和多肽的翻译。该术语还包括将编码RNA分子或多肽的核酸整合到祖细胞的基因组中。然后核酸通过后续世代传递至宿主细胞，从而(例如)将编码RNA引导的内切核酸酶的核酸“预整合(pre-integrate)”到宿主细胞基因组中。在一些情况中，引入指核酸或多肽从宿主细胞外部至宿主细胞内部的易位。考虑了将核酸、多肽和其他生物分子引入宿主细胞的多种方法，包括但不限于，电穿孔，与纳米线或纳米管接触，原生质球化，PEG 1000介导的转化，基因枪，乙酸锂转化，氯化锂转化等。

如本文所用，术语“全长抗体”指具有与天然抗体结构基本相似的结构的抗体。全长抗体包括四个多肽——两个轻链和两个重链通过二硫键连接形成一个“Y”形分子。各重链包括通过铰链区连接的恒定区和可变区。两个重链的两个恒定区形成一个Fc结构域。全长抗体可以是由抗体重链所定义的任何同种型(例如，IgA，IgD，IgE，IgG和IgM)。

具体实施方式

破坏宿主细胞基因组中靶位点的方法

本文提供了破坏宿主细胞基因组中一个或多个靶位点的方法。这些方法允许将一个或多个供体DNA分子高效、同时整合到宿主细胞基因组中。在某些方法中，在没有选择性标志物伴随整合到宿主细胞基因组中的情况下，一个或多个供体DNA分子被整合到宿主细胞基因组中。

在一些实施方式中，破坏一个或多个靶位点包括(a)使表达RNA引导的DNA核酸内切酶的宿主细胞接触：(i)第一线性核酸，其能够与其自身或与宿主细胞所接触的一种或多种其他线性核酸同源重组，从而使宿主细胞中的同源重组导致环状染色体外核酸的形成，所述环状染色体外核酸包含选择性标志物的编码序列，和(ii)第二线性核酸，其从5'到3'包含RNA聚合酶II启动子，编码第一核酶的第一核酸，编码向导RNA的核酸，编码第二核酶的第二核酸和终止子，其中向导RNA引导DNA核酸酶至靶位点。然后选择表达选择性标志物的转化的宿主细胞。

在一些实施方式中，破坏一个或多个靶位点包括(a)使表达RNA引导的DNA核酸内切酶的宿主细胞接触：(i)第一线性核酸，其能够与其自身或与宿主细胞所接触的一种或多种其他线性核酸同源重组，从而使宿主细胞中的同源重组导致环状染色体外核酸的形成，所述环状染色体外核酸包含选择性标志物的编码序列，和(ii)第二线性核酸，其从5'到3'包含RNA聚合酶II启动子，编码第一核酶的第一核酸，编码向导RNA的核酸，编码第二核酶的第二核酸和终止子，其中向导RNA引导DNA核酸酶至靶位点，其中宿主细胞的NHEJ活性降低。然后选择表达选择性标志物的转化的宿主细胞。

在一些实施方式中，该方法还包括使宿主细胞与供体DNA分子接触，所述供体DNA分子能够与靶位点同源重组，从而使宿主细胞中的同源重组导致供体DNA分子在靶位点处整合。在一些实施方式中，供体DNA分子是异源性供体DNA分子。在一些实施方式中，供体DNA分子侧接有核苷酸序列，所述核苷酸序列与侧接靶位点的基因组序列具有同源性。在一些实施方式中，供体DNA分子在5'末端包含同源序列，其与选定基因组靶位点的5'区具有约70％、75％、80％、85％、90％、95％或100％同源性。在一些实施方式中，供体DNA分子在3'末端包含同源序列，其与选定基因组靶位点的3'区具有约70％、75％、80％、85％、90％、95％或100％同源性。在一些情况中，侧接供体DNA分子的同源序列各自包含约50至约5,000个核苷酸，约100至2500个核苷酸，约200至1500个核苷酸，约500至约1000个核苷酸，或这些范围内任何数量的核苷酸。参见例如，美国专利号9,476,065。

在一些实施方式中，在使宿主细胞与第一线性核酸，第二线性核酸和/或供体DNA分子接触之前，宿主细胞中的NHEJ降低。在一些实施方式中，在使宿主细胞与第一线性核酸，第二线性核酸和/或供体DNA分子接触的同时，宿主细胞中的NHEJ降低。在一些实施方式中，在使宿主细胞与第一线性核酸，第二线性核酸和/或供体DNA分子接触之后，宿主细胞中的NHEJ降低。

在一些实施方式中，供体DNA分子包含感兴趣的核酸。例如，供体DNA分子包含可以被敲入宿主基因组的感兴趣的基因。在其他实施方式中，供体DNA分子作为敲除构建体，其能够在将构建体整合至宿主细胞基因组靶位点时特异性地破坏靶基因，从而使得破坏的基因不具有功能性。感兴趣的核酸的示例包括但不限于，蛋白质编码序列，启动子，增强子，终止子，转录激活子，转录阻遏子，转录激活子结合位点，转录阻遏子结合位点，内含子，外显子，多聚-A尾，多个克隆位点，核定位信号，mRNA稳定信号，整合基因座，表位标签编码序列，降解信号或任何其他天然存在的或合成的DNA分子。在特定的实施方式中，感兴趣的核酸不包含编码选择性标志物的核酸。

在一些实施方式中，感兴趣的核酸编码抗体，例如但不限于，单克隆抗体，Fab片段，单链可变片段(scFv)，二聚体单链可变片段(di-ScFv)或单域抗体(sdAb)。在一些实施方式中，感兴趣的核酸编码全长抗体赫塞汀(曲妥珠单抗)。在一些实施方式中，感兴趣的核酸编码全长抗体美罗华(利妥昔单抗)。在一些实施方式中，感兴趣的核酸不包括编码全长抗体赫塞汀(曲妥珠单抗)，全长抗体美罗华(利妥昔单抗)或全长抗体BIIB的核酸。在其他实施方式中，感兴趣的核酸编码酶，激素，生长因子，抗凝血剂，血液因子，工程改造的蛋白质，干扰素，白介素，溶解血栓剂，病毒蛋白或细菌蛋白。

在本文所提供的方法和组合物中，宿主细胞可以是原核细胞或真核细胞。在一些实施方式中，宿主细胞选自：真菌细胞，细菌细胞，植物细胞，昆虫细胞，禽类细胞，鱼细胞和哺乳动物细胞。在一些实施方式中，哺乳动物细胞选自：啮齿动物细胞，灵长类动物细胞和人细胞。在一些实施方式中，真菌细胞是酵母细胞。在一些实施方式中，酵母细胞是非常规酵母细胞。非常规酵母细胞是指利用非同源末端连接作为DNA修复系统的主要机制的酵母物种，相比之下，常规酵母细胞(例如，酵母(Saccharomyces)或裂殖酵母(Schizomyces))利用同源重组作为DNA修复系统的主要机制。非常规酵母细胞的示例包括毕赤酵母(Pichia)(例如，巴斯德毕赤酵母(P.pastoria))，克鲁维酵母菌(Kluyveromyces)(马克斯克鲁维酵母菌(K.marxianus)或乳酸克鲁维酵母菌(K.lactis))，汉逊酵母(Hansenula)(例如，多形汉逊酵母(H.polymorpha))或阿氏酵母(Arxula)(解腺嘌呤阿氏酵母(A.adninivorans))。在一些实施方式中，酵母细胞是毕赤酵母细胞。在具体实施方式中，酵母细胞是巴斯德毕赤酵母细胞。可以用于本文所述方法中宿主细胞的示例述于国际申请公开号WO2015/095804中。在一些实施方式中，宿主细胞不包含编码全长抗体赫塞汀(曲妥珠单抗)，全长抗体美罗华(利妥昔单抗)或全长抗体BIIB的核酸。在一些实施方式中，宿主细胞不表达全长抗体赫塞汀(曲妥珠单抗)，全长抗体美罗华(利妥昔单抗)或全长抗体BIIB。

在一些实施方式中，NHEJ活性降低的宿主细胞是在涉及细胞NHEJ活性的基因座中具有破坏的细胞(即，编码驱动NHEJ途径或导致NHEJ的蛋白质的一个或多个基因中的破坏，针对毕赤酵母的NHEJ途径基因的示例包括但不限于，YKU70、YKU 80、DNL4、Rad50、Rad 27、MRE11和POL4。对于不同的宿主细胞，基因的名称可能不同。供于破坏的合适的NHEJ途径基因可以例如存在于KEGG非同源末端连接途径(KEGG Non-homologous end-joiningpathway)，参见http://www.genome.jp/kegg-bin/show_pathway？map＝ko03450&show_description＝show。在一些实施方式中，NHEJ活性降低的宿主细胞是YKU70基因座受到破坏的酵母细胞，例如，毕赤酵母细胞，因此细胞中的NHEJ活性降低。在某些情况中，通过在YKU70基因座插入或整合编码RNA引导的内切核酸酶的核酸来破坏YKU70基因座。相较于在控制细胞中NHEJ的基因中不具有破坏的宿主细胞，例如，在毕赤酵母细胞YKU70基因座中具有破坏的酵母细胞，NHEJ活性降低可以是宿主细胞中NHEJ事件减少，例如，减少至少20％，30％，40％，50％，60％，70％，80％，90％，100％或减少这些百分比之间的任何百分比。

在一些实施方式中，RNA引导的DNA内切核酸酶通过将编码该内切核酸酶的核酸引入宿主细胞来提供。例如，可以将包含编码RNA引导的DNA内切核酸酶的核酸的质粒或载体引入细胞。在一些实施方式中，质粒可以还包含编码选择性标志物的核酸序列用于该质粒在宿主细胞中的维持。在一些实施方式中，编码内切核酸酶的核酸还包含启动子序列。在一些实施方式中，将编码RNA引导的DNA内切核酸酶的核酸整合到宿主细胞的基因组中。在某些实施方式中，将RNA引导的DNA内切核酸酶，例如，Cas9，整合到酵母细胞的YKU70基因中，从而降低酵母细胞中的NHEJ活性。在一些实施方式中，编码RNA引导的DNA内切核酸酶的核酸在组成型启动子的控制之下。在具体实施方式中，编码RNA引导的DNA内切核酸酶的核酸在中等强度毕赤酵母pPGK1启动子的控制之下。合适的启动子的示例包括但不限于：pYPT1，pTEF1，pSSA3，pGPM1，pENO1。在一些实施方式中，可以在引入第一和第二线性核酸之前，同时或之后将RNA引导的DNA内切核酸酶引入宿主细胞。在其他实施方式中，可以在引入第一线性核酸，第二线性核酸和供体DNA分子之前，同时或之后将RNA引导的DNA内切核酸酶引入宿主细胞。在一些实施方式中，可以将编码RNA引导的DNA内切核酸酶的RNA引入宿主细胞中。在其他实施方式中，可以将RNA引导的DNA内切核酸酶蛋白或其功能片段引入宿主细胞。

在一些实施方式中，第一线性核酸包含能够彼此同源重组的两个内部同源序列，从而内部同源序列的同源重组导致环状染色体外核酸的形成，所述环状染色体外核酸表达选择性标志物。在一些实施方式中，第一线性核酸能够与第二线性核酸重组。在一些实施方式中，第一线性核酸包含选择性标志物，从而在引入第一和第二线性核酸后，使第一和第二线性核酸经历同源重组以(例如)经由缺口修复形成环状、附加型或染色体外核酸，其包含选择性标志物和向导RNA的编码序列。一旦经环化，染色体外核酸包括选择性标志物的编码序列，以及使能够在宿主细胞中表达标志物的合适的调节序列，诸如启动子和/或终止子。在环状染色体外核酸上提供选择性标志物允许一个或多个供体DNA分子在宿主细胞基因组中的无标志物整合，同时避免无关序列(即，选择性标志物)在基因组中的整合以及与延长的标志物表达相关的任何有害影响。参见例如，美国专利号9,476,065关于可以用于本文所述方法中的缺口修复机制。

形成包含选择性标志物和向导RNA编码序列的染色体外核酸后，由染色体外核酸转录出向导RNA并将宿主细胞中表达的RNA引导的DNA内切核酸酶引导至宿主细胞基因组中的靶位点，其中内切核酸酶在靶位点处产生断裂。在一些实施方式中，一旦内切核酸酶在靶位点处产生断裂，供体DNA分子经由同源重组整合到宿主细胞基因组中。

在一些实施方式中，该方法包括将多个(即，两个或更多个)供体DNA分子整合到宿主细胞基因组的多个靶位点。在一些实施方式中，使宿主细胞与第一线性核酸与两种或更多种第二线性核酸分子接触，其中第二线性核酸分子各自包含编码不同向导RNA的核酸，所述向导RNA靶向宿主细胞基因组中的不同位点。不同的第二线性核酸可以各自与第一线性核酸重组以在宿主细胞中形成两种或更多种不同的环状染色体外核酸。应当理解的是，术语“第一线性核酸”和“第二线性核酸”包括相同核酸分子的多个拷贝。例如，宿主细胞可以与两种或更多种第二线性核酸分子接触，其中第二线性核酸分子各自包含编码不同向导RNA的核酸以靶向宿主细胞基因组中2、3、4、5、6、7或更多个不同位点。在一些实施方式中，一旦向导RNA将RNA引导的内切核酸酶引导至两个或更多个靶位点，那么内切核酸酶在两个或多个靶位点处产生断裂并且两种或更多种供体DNA分子经由同源重组整合到宿主细胞基因组中。

在一些实施方式中，环状染色体外核酸包含选择性标志物的编码序列和向导RNA盒，其从5'至3'包含RNA聚合酶II启动子，编码第一核酶的第一核酸，编码向导RNA的核酸，编码第二核酶的第二核酸和终止子。

可以用于本文所提供的任何方法以控制向导RNA表达的启动子的示例包括但不限于，毕赤酵母Pol II启动子(pHTA1)，酵母启动子pPGK1，酵母启动子pTDH3和酵母启动子pACT1。在一些实施方式中，启动子，例如，RNA聚合酶II启动子，与宿主细胞来自相同的物种。在一些实施方式中，启动子，例如，RNA聚合酶II启动子，与宿主细胞来自不同的物种。

通过使用第一和第二核酶侧接向导RNA，在gRNA盒转录后，在RNA聚合酶II启动子的控制下，核酶自我切割转录本以产生需要的向导RNA序列。参见例如，Gao和Zhao(J.Integr.Plant Biol.56(4):343-349(2014))。在一些实施方式中，向导RNA侧接锤头状(HH)和丁型肝炎病毒(HDV)核酶序列。在具体实施方式中，一个或两个核酶侧接接头序列以促进切割后向导RNA的释放。在一些实施方式中，接头序列的长度为至少5、6、7或8个核苷酸。实施例中提供了示例性的接头序列。

在一些实施方式中，包含选择性标志物的第一线性核酸是包含同源侧接序列对的带缺口载体(gapped vector)，该同源侧接序列对与侧接第二线性核酸中gRNA盒的同源序列对重组以形成较大的环状载体，其中缺口已经通过将第二线性核酸插入带缺口载体中修复。在一些实施方式中，第一核酸中同源侧接序列对的同源侧接序列各自包含重组区域，该重组区域包含具有足够长度和序列相同性的核苷酸序列，其允许与第二线性核酸中同源侧接序列对进行同源重组，但是不与参与体内组装的第一或第二线性核酸的其他区域以及宿主细胞的任何基因组区域进行同源重组。对于经由缺口修复进行的标志物/gRNA载体的体内组装以及对于能够进行同源重组和缺口修复的细胞的选择，参见，例如Horwitz等(CellSystems 1:88-96(2015))和国际申请公开号WO2015/095804，其各自通过引用其全部内容纳入本文。

在一些实施方式中，“足够的序列相同性”指序列在例如至少15个碱基对，至少20个碱基对，至少50个碱基对，至少100个碱基对，至少250个碱基对，至少500个碱基对，或超过500个碱基对的长度上的重组区域之间具有至少70％、至少75％>、至少80％>、至少85％>、至少90％>、至少95％>、至少99％>或100％相同性。本领域技术人员容易理解如何确定两个核酸的相同性。例如，可以在比对两个序列之后计算相同性从而使相同性处于其最高水平。计算相同性的另一种方法可以通过公开的算法进行。例如，可以使用Needleman和Wunsch,J.Mol.Biol.48:443(1970)的算法进行序列的最佳比对，以用于比较。对于重组区域之间有效长度的同源性的讨论，参见Hasty等(Mol Cell Biol 11:5586-91(1991))。

相较于常规CRISPR/Cas系统，使用本文所提供的方法可以惊人的高效率修饰宿主细胞基因组中的一个或多个靶位点。细胞群中改变的效率可以是至少约5％、10％、15％、20％、25％、30％、35％、40％、45％、50％、55％、60％、65％、70％、75％80％、85％、90％、95％或更高或这些百分比之间的任何百分比。

在一些实施方式中，本发明的方法提供了包含成功整合的供体核酸的转化的宿主细胞的无标志物回收(markerless recovery)。这类细胞以每1000、900、800、700、600、500、400、300、200或100个经筛选的接触的宿主细胞或其克隆群体中约一个的频率出现。在具体实施方式中，包含成功整合的供体核酸的转化的宿主细胞的无标志物回收以约每90、80、70、60、50、40、30、20或10个接触的宿主细胞或其克隆群体(经筛选)中约一个的频率出现。在更具体实施方式中，包含成功整合的供体核酸的转化的细胞的无标志物回收以约每9、8、7、6、5、4、3或2个接触的宿主细胞或其克隆群体(经筛选)中约一个的频率出现。

在某些实施方式中，在单个基因座处包含成功整合的供体核酸的转化的细胞的无标志物回收以至少10％、20％、30％、50％、60％、70％、80％、90％或100％的接触的宿主细胞或其克隆群体(经筛选)的频率出现。在某些实施方式中，在2、3、4或5个基因座处包含成功整合的供体核酸的转化的细胞的无标志物回收出现在至少10％、20％、30％、50％、60％、70％、80％、90％或100％的接触的宿主细胞或其克隆群体(经筛选)。在某些实施方式中，可以在宿主细胞基因组中的n个基因座处成功整合任何合适数量的供体核酸(例如，n＝1至20)。

有多种方法能够用于在不使用选择性标志物的情况下鉴定在靶位点处或附近具有基因组改变的细胞。在一些实施方式中，这类方法试图检测靶位点中的任何改变，并且包括但不限于，PCR方法，测序方法，核酸酶消化，例如，限制性作图，Southern印迹及其任何组合。表型读数，例如，预测的功能获得或丧失，也可以用作实现预期基因组修饰的替代。

细胞培养

在本文所述方法的一些实施方式中，将宿主细胞培养足以由环化染色体外载体表达选择性标志物的一段时间。在选择性标志物是抗药性标志物的一些实施方式中，进行足以产生一定量的标志物蛋白质的一段时间培养，所述一定量标志物蛋白质可以支持表达标志物的细胞在选择性养基中的存活。在某些实施方式中，这些条件还针对不表达选择性标志物的细胞的存活进行选择。可以使用本领域技术人员已知的多种化合物或处理将选择压力施加于细胞。例如，可以通过将宿主细胞暴露于对于生长，细胞周期的进展或活力而言次优或有害的条件下来施加选择压力，从而相较于对这些条件不耐受或不具有抗性的细胞，选择对这些条件耐受或具有抗性的细胞。可用于运用或施加选择压力的条件包括但不限于，抗生素，药物，诱变剂，减缓或停止细胞生长或生物构件(building block)合成的化合物，破坏RNA、DNA或蛋白质合成的化合物，剥夺或限制细胞生长或培养基对于细胞生长和活力所需的营养物、氨基酸、碳水化合物或化合物，处理，例如在对细胞生长次优的条件下，例如在次优温度，大气条件(例如，二氧化碳、氧气或氮气％或湿度)或缺乏型培养基条件下的细胞生长或维持。所用选择压力的水平可以通过本领域技术人员确定。例如，这可以通过进行致死曲线(kill curve)实验来完成，其中对照细胞和包含抗性标志物或基因的细胞用增加水平、剂量、浓度或处理的选择压力测试，而针对阴性细胞选择的范围仅或优先在所需的时间范围内(例如，1至24小时，1至3天，3至5天，4至7天，5至14天，1至3周，2至6周)。可以使用的选择压力的确切水平、浓度、剂量或处理取决于所用细胞，所需特性本身，赋予对选择压力的抗性或耐受性的标志物、因子或基因，以及所选细胞中所需要的所需特性的水平，并且本领域技术人员将容易理解如何基于这些考虑因素来确定合适的范围。

培养可以在合适容器，包括但不限于细胞培养板、培养瓶或发酵罐中合适的培养基中进行。在一些实施方式中，培养基是包含可同化的碳、氮和磷酸盐/酯源的水性培养基。这类培养基还可以包括适当的盐，矿物质，金属和其他营养物。在一些实施方式中，除了选择试剂，合适的培养基还补充有一种或多种其他试剂，例如，诱导剂(例如，当编码基因产物的一种或多种核苷酸序列处于诱导型启动子的控制下)，阻遏剂(例如，当编码基因产物的一种或多种核苷酸序列处于阻抑型启动子的控制之下)。用于细胞培养物维持或生长的材料和方法为微生物学或发酵学领域的技术人员所熟知(参见，例如，Bailey等,《生物化学工程基础》(Biochemical Engineering Fundamentals),第二版,McGraw Hill出版社,纽约,1986)。取决于宿主细胞、发酵和工艺的具体要求，必须要考虑合适的培养基，pH，温度以及对有氧、微氧或厌氧条件的需求。在一些实施方式中，培养进行足以使转化的群体经历多次加倍的一段时间，直到达到所需的细胞密度。在一些实施方式中，培养进行一段时间，所述一段时间足以使宿主细胞群在进行培养的发酵罐或容器中达到0.01至400之间的细胞密度(OD₆₀₀)。在其他实施方式中，培养进行至少12、24、36、48、60、72、84、96或大于96小时的一段时间。在一些实施方式中，培养进行3至20天之间的一段时间。在一些实施方式中，培养进行1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或超过20天的一段时间。

在本文所述方法的一些实施方式中，例如，一旦已经将选定的宿主细胞鉴定为包含所需基因组整合，则所述方法还包括由宿主细胞消除环化的染色体外载体的步骤。基于质粒的系统通常需要对质粒施加选择压力以将外来DNA维持在细胞中。在一些实施方式中，通过使选定的细胞经历足够的有丝分裂，从而使质粒有效地由群体稀释，可以实现由选定的细胞中消除编码选择性标志物的质粒。或者，可以通过选择质粒的不存在来选择无质粒的细胞，例如，通过针对反向选择性(counter-selectable)标志物(例如，URA3)进行选择或通过将相同的菌落在选择性培养基和非选择性培养基上来进行铺板，然后选择在选择性培养基上不生长但在非选择性培养基上生长的菌落。

在本文所述任何方法中，当RNA引导的DNA内切核酸酶切割宿主细胞基因组中的靶位点时，出现宿主细胞基因组中靶位点的破坏。一旦RNA引导的DNA内切核酸酶切割了靶位点，整合供体DNA分子所需的时间将有所不同。例如，所涵盖的时间段可以是至少6、12、24、36、48、60、72、96或超过96个小时的细胞培养，其开始于宿主细胞与第一线性核酸、第二线性核酸和供体DNA分子接触的时间点，无论编码RNA引导的DNA内切核酸酶的核酸是否被整合到宿主细胞基因组中或者与第一线性核酸、第二线性核酸和供体DNA分子同时引入宿主细胞。

向导RNA

如通篇所用，向导RNA(gRNA)序列是与RNA引导的DNA内切核酸酶相互作用并与细胞基因组内靶核酸特异性结合或杂交的序列，从而使gRNA和靶向的核酸酶共同定位于细胞基因组中的靶核酸。gRNA各自包括长度约为10至50个核苷酸的DNA靶向序列，其与基因组中靶DNA序列特异性结合或杂交。例如，DNA靶向序列的长度为约10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个核苷酸。gRNA各自包含与RNA引导的DNA内切核酸酶结合的gRNA支架序列，所述RNA引导的DNA内切核酸酶不包含DNA靶向序列。在一些实施方式中，gRNA包含crRNA序列和反式激活crRNA(tracrRNA)序列。在一些实施方式中，gRNA不包含tracrRNA序列。

通常，将DNA靶向序列设计为与靶DNA序列互补(例如，完美互补)或基本上互补。在某些情况中，DNA靶向序列可以纳入摆动或简并碱基以结合多个遗传元件。在某些情况中，结合区3'或5'端的19个核苷酸与一个或多个靶遗传元件完美互补。在某些情况中，可以改变结合区以增加稳定性。例如，可以纳入非天然核苷酸以增加RNA对降解的抗性。在某些情况中，可以改变或设计结合区，以避免或减少结合区中的二级结构形成。在某些情况中，可以设计结合区以优化G-C含量。一些情形中，G-C含量以约40％至约60％(例如40％、45％、50％、55％、60％)为佳。

RNA引导的DNA内切核酸酶

本文提供的方法可以使用任何RNA引导的DNA内切核酸酶。在一些实施方式中，RNA引导的DNA内切核酸酶是激活的Cas9内切核酸酶，从而在作为与gRNA的复合物的部分与靶核酸结合时将双链断裂引入靶核酸中。在一些实施方式中，双链断裂通过HDR修复以将供体DNA分子插入宿主细胞的基因组中。本文所述方法可以使用各种不同的Cas9内切核酸酶。例如，可以利用这样的Cas9核酸酶，所述Cas9核酸酶需要紧邻向导RNA靶向的区域3'的NGG原型间隔子邻近基序(PAM)。又例如，具有正交PAM基序要求的Cas9蛋白可以用于靶向不具有邻近的NGG PAM序列的序列。具有正交PAM序列特异性的示例性Cas9蛋白包括但不限于在Esvelt等(Nature Methods 10:1116–1121(2013))中所述的那些。

在一些情况中，Cas9蛋白是切口酶，因此在与靶核酸结合作为与向导RNA的复合物的部分时将单链断裂或切口引入靶核酸。各自结合不同向导RNA的一对Cas9切口酶可以靶向靶基因组区域的2个邻近(proximal)位点，并且因此将一对邻近单链断裂引入靶基因组区域。切口酶对可以提供增强的特异性，因为脱靶作用有可能导致单一切口，这通常通过碱基切除修复机制在无损伤的情况下修复。示例性Cas9切口酶包含具有D10A或H840A突变的Cas9核酸酶(参见例如，Ran等“用于增强基因组编辑特异性的通过RNA引导的CRISPR Cas9形成的双切口(Double nicking by RNA-guided CRISPR Cas9 for enhanced genomeediting specificity),”Cell 154(6):1380-1389(2013))。

宿主细胞

在另一实施方式中，本文提供了通过破坏宿主细胞基因组中靶位点或基因组整合本文所述的一种或多种外源性核酸的任何方法所产生的修饰的宿主细胞。还提供了通过本文提供的任何方法产生的修饰的宿主细胞群。在具体实施方式中，还提供了这样的宿主细胞群，其中至少5％、10％、15％、20％、25％、30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％或更高或之间的任何百分比使用本文所提供的任何方法改变。

合适的宿主细胞包括需要将感兴趣的供体DNA分子整合到宿主细胞基因组中靶位点的任何细胞。在一些实施方式中，宿主细胞是能够进行同源重组的细胞。在其它实施方式中，宿主细胞是能够进行缺口修复的细胞。在一些实施方式中，宿主细胞是酵母细胞。在一些实施方式中，酵母细胞是毕赤酵母细胞。在具体实施方式中，毕赤酵母细胞是巴斯德毕赤酵母细胞。在一些实施方式中，酵母宿主细胞是适用于工业发酵例如生物乙醇发酵的细胞。在特定实施方式中，使细胞适应在高溶剂浓度，高温，增加的底物利用率，营养限制，渗透压，酸度，亚硫酸盐/酯和细菌污染或其组合下生存，上述条件被认为是工业发酵环境的胁迫条件。关于适合使用本文所述方法整合一种或多种供体DNA分子的细胞类型的清单，参见国际申请公开号WO2015095804。

产生感兴趣的蛋白质的方法

在另一个实施方式中，本文提供了产生感兴趣的蛋白质的方法。该方法包括在适合生产蛋白质的条件下培养包含一种或多种感兴趣的整合供体DNA分子的宿主细胞，所述整合供体DNA分子编码一种或多种感兴趣的蛋白质，和回收通过宿主细胞产生的蛋白质。在一些实施方式中，感兴趣的蛋白质是选自下组的蛋白质：抗体，酶，激素，生长因子，抗凝血剂，血液因子，工程改造的蛋白质，干扰素，白介素，溶解血栓剂，病毒蛋白或细菌蛋白。

在此公开的材料、组合物以及组分可用于在此公开的方法和组合物、可与在此公开的方法和组合物联用、可用于制备在此公开的方法和组合物，或者是在此公开的方法和组合物的产物。本文公开了以上及其他材料，应理解的是，在公开这些材料的组合、子集、相互作用、组等时，既便没有明确具体指向这些化合物的多种个体或各别组合和集合性组合以及排列组合中的每一种，这每一种都是本文所具体涵盖和具体描述的。例如，如果公开和论述了一种方法，并且论述了可对该方法中一个或多个分子实施的多种改变，则于是具体涵盖了所述改变的和所述方法的每一种和所有可能的组合与排列，除非特别说明并非如此。同样地，还特别考虑和公开了这些的任何子集或组合。这一概念适用于本申请所有方面的内容，包括但不限于采用本文所述组合物的方法的步骤。这样，如果有多种可执行的其他步骤，则应认为，这些其他步骤中的每一个都可与本文所述方法的任何特定方法步骤或方法步骤的组合联合执行，并且就此具体涵盖并视为公开了此类组合或组合子集中的每一个。

本文引用的出版物及其中援引相关的材料都具体通过引用整体纳入本文。

实施例

本实施例提供这样的结果，其证明了CRISPR用于使毕赤酵母中选自下组的一个或多个基因座同时缺失和/或整合的应用：BMT1，BMT2，BMT4，BMT4，PNO1，MNN4-1，MNN4-2，MNN4-3，PRB1，PEP4，AOX1和DNL4。简言之，生成了靶向BMT1，BMT2，BMT4，BMT4，PNO1，MNN4-1，MNN4-2，MNN4-3，PRB1，PEP4，AOX1和DNL4的开放阅读框(ORF)中所包含的独特序列的嵌合gRNA。将gRNA以多种构型转化到宿主细胞中，所述宿主细胞表达来自酿脓链球菌(Streptococcus pyogenes)的II型细菌CRISPR系统的Cas9蛋白。通过菌落PCR(cPCR)筛选转化的菌落，用于用短接头序列或赫塞汀抗体序列替换一个或多个ORF。

材料和方法

宿主菌株

该研究中使用野生型NRRL Y-48124巴斯德驹形氏酵母(Komagataella pastoris)(巴斯德毕赤酵母)菌株。Cas9在毕赤酵母pPGK1启动子下组成型表达并被整合到YKU70基因座中以使NHEJ失能。产生的菌株为Y486。使AOX1从Y486缺失，产生Y651，其为甲醇突变型(Mut^s)。将抗-Her2抗体赫塞汀序列整合到Y651中的PEP4基因座，于pAOX1启动子的控制下。菌株为Y324。缺失AOX1以及整合赫塞汀序列于PEP4基因座通过使用CRISPR的靶向整合实现。五重(quintuplex)工程改造在赫塞汀菌株背景下完成。

基因座缺失和向导RNA序列

基于PAM序列N₍₁₉₎NGG的存在，鉴定靶向的ORF内部的候选CRISPR靶标。NGG序列称为PAM序列，并且PAM序列之间的DNA的8个碱基对对于增强特异性特别重要(参见，例如，国际申请公开号WO2015/095804)。向导RNA序列示于表1中。

表1：向导RNA序列

基因座	gRNA序列(NGG略去)	SEQ ID NO:
			BMT1/BMT2	AAAGCTAGAGTTACCGTAA	1
BMT3	TCAACTGCAGTCTTGATAA	2
			BMT4	GTGTGAACAGAGCCATGTA	3
MNN4-1/PNO1	ATTTGGAGATTTTGCGCTA	4
			MNN4-2	TTCTGGAGAGCACTATGAC	5
MNN4-3	AACCCTAAGAATCTGGCTC	6
			PRB1	TCAACAAGTACTTATATGA	7
PEP4	ATTTTATGTCTCAGCAAGA	8
			AOX1	GACATGGCTCCTATGGTTT	9
DNL4	TGGCTGAAATTAGGTAAAG	10
			VTH1的上游	AGAAAATAAAGAGTTTCTA	11
CNE1的上游	TAGATGCAGTAGGATAGGG	12
			ECM10的上游	GTCCACTAACTACCTTTCG	13
ERO1的上游	AAAGATAGGGAAAAGGAAA	14

向导RNA递送模式

gRNA盒

用于这些研究的向导RNA盒包含来自毕赤酵母RNA聚合酶II启动子pHTA1(Weninger等,2016)，19聚体向导RNA序列，结构向导RNA序列，和来自酵母的ADH1终止子。向导RNA侧接锤头状(HH)和丁型肝炎病毒(HDV)核酶序列。HH核酶还侧接有短的6bp接头“TCAGAT”(SEQ ID NO:15)以促进HH核酶的去除(Weninger等,2016)。序列的各元件列于下文。

产生用于毕赤酵母的gRNA载体

将标准pRS4XX-系列2μ载体(Sikorski和Hieter,Genetics 12291):19-27(1989))用作起始材料。用毕赤酵母ARS1区域替换2μ区域(参见测序列表)。将靶向酵母ADH4的gRNA表达盒克隆到Sall和BamHI之间的所得载体中。所得质粒名为pAM1114_PPARS1_pHTA1_ScADH4。用于该研究中的引物列于表2。使用EcoRV将新载体线性化，用于在转化中用gRNA盒进行缺口修复。

表2：用于产生gRNA递送组件的引物

FOR＝正向引物；REV＝反向引物

产生用于靶向整合的线性gRNA

靶向的PEP4缺失

缝合的(Stitched)线性gRNA盒

模板pAM1114_PPARS1_pHTA1_ScADH4质粒用于下述PCR反应。HJ2353和HJ2463引物(表3)用于生成PEP4 gRNA表达盒的第一部分。HJ2455和HJ2354引物(表3)用于生成PEP4gRNA表达盒的第二部分。凝胶提取两种PCR产物并使用PCR缝合在一起。凝胶提取缝合的产物，并用作转化中的线性gRNA盒。

从克隆的gRNA载体扩增

使用与上述相同的引物扩增gRNA盒的两个部分。根据美国专利号8,110,360、8,221,982和8,332,160中所述的方法，清洁PCR片段并克隆到酵母中的pAM1114_PPARS1_pHTA1_ScADH4(使用上述方法生成)。由酵母提取质粒并转化到大肠杆菌中。对克隆进行序列验证。使用HJ2353和HJ2354引物由克隆扩增线性gRNA片段(表3)。使用Zymo Clean&Concentrator^TM试剂盒(Zymo研发公司(Zymo Research)(加利福尼亚州尔湾市))凝胶提取或清洁PCR产物。

表3：PEP4 gRNA的引物

生成线性供体DNA

线性供体DNA包含约1kb上游和下游同源区并通过美国专利号8,221,982中所述多核苷酸组装的方法生成，所述上游和下游同源区靶向各ORF，侧接中央接头(CGCTCGTCCAACGCCGGCGGACCT)(SEQ ID NO:29)。用于整合进入上述列出的基因座的供体DNA序列列于序列表中。

使用CRISPR的同时OFR缺失和短接头序列整合。

对于各个感兴趣的基因座或ORF，使用电穿孔方法将线性供体DNA、线性gRNA和线性gRNA载体骨架(各自约200ng)共转化到各Cas9表达菌株中(参见，第三章：毕赤酵母方案,由D.R.Higgins和J.Cregg,编著.载于《分子生物学方法》(Methods in MolecularBiology),第103卷,胡马那出版公司(The Humana Press),新泽西州托托华,1998)。细胞过夜回收，然后铺板到包含选择性抗生素(诺尔丝菌素(nourseothricin)，50mg/L)的培养基，以维持gRNA或标志物质粒。如果使用结合5'整合侧上游以及整合的接头序列(表4)的引物的菌落PCR(cPCR)产生了正确的扩增子，那么将无标志物整合评为阳性，其是表明靶向整合事件的结果。还使用cPCR检测了开放阅读框(ORF)序列的消失和3'整合。

表4：用于确认ORF中整合的引物序列

“US”＝上游；“FOR”＝正向引物

结果

由单、双和三重整合获得高达100％的靶向效率。四重(47％)和五重(31％)整合实现了非常高的效率(参见下表5)。这是对当前已知的毕赤酵母CRISPR技术的巨大改进。

如表5所示，使用本文所提供的方法，通过在宿主细胞(包括毕赤酵母)中使用CRISPR实现了宿主细胞基因组中高效靶向且无标志物的单、双、三、四和五重整合。总而言之，在该实施例中，通过使用线性Nat标记的载体骨架、组成型启动子下的向导RNA和供体DNA，转化包含处于来自毕赤酵母的中等强度启动子pPGK1的控制下的编码Cas9的核酸的宿主细胞(例如，毕赤酵母细胞)，实现了一个或多个靶向整合。向导RNA盒包含来自毕赤酵母的RNA聚合酶II启动子pHTA1，对感兴趣的基因或基因座具有特异性的19聚体向导RNA序列，结合Cas9的结构向导RNA序列，和来自酵母的ADH1终止子。向导RNA侧接锤头状(HH)和丁型肝炎病毒(HDV)核酶序列。HH核酶还侧接有短的6bp接头(TCAGAT)以促进gRNA的释放。

表5：CRISPR靶向效率的总结

使用本文所提供的方法，通过在宿主细胞(包括毕赤酵母)中使用CRISPR实现了宿主细胞基因组中高效靶向且无标志物的单、双、三、四和五重整合。这是通过使用线性Nat标记的载体骨架、组成型启动子下的向导RNA和供体DNA，转化含有处于来自毕赤酵母的中等强度启动子pPGK1的控制下的编码Cas9的核酸的宿主细胞(例如，毕赤酵母细胞)来实现。该向导RNA盒包含来自毕赤酵母RNA聚合酶II启动子pHTA1(Weninger等,2016)，19聚体向导RNA序列，结构向导RNA序列，和来自酵母的ADH1终止子。向导RNA侧接锤头状(HH)和丁型肝炎病毒(HDV)核酶序列。HH核酶还侧接有短的6bp接头“TCAGAT”以促进gRNA的释放(Weninger等,2016)。

抗体的生产

抗体表达盒的构建

BIIB抗体序列包含重链(HC)和轻链(LC)多肽。为了驱动酵母分泌构建体，将来自酿酒酵母的全长89个氨基酸的前初-α(pre-pro-α)因子分泌前导物(Waters等,1988,J.Biol.Chem.1988 263(13):6209-14)添加到HC和LC的氨基末端。使用密码子优化算法根据宿主物种偏好对BIIB、赫塞汀和美罗华的氨基酸序列进行密码子优化，并由Gen9公司(现为银杏生物工作室公司(Ginkgo Bioworks)，美国马萨诸塞州波士顿)、Twist公司(美国加利福尼亚州旧金山，)或集成DNA技术公司(IDT，美国加利福尼亚州圣地亚哥)化学合成。将DNA表达构建体以各种构型在强组成型天然和/或诱导型启动子下克隆到各宿主中：以单个2A肽连接的“启动子”形式(Chng等,2015,MAbs.7(2):403-12)，相同基因座处的趋集型分开(convergent split)盒形式，或成为位于不同基因座处的盒形式。测试各种其他分泌标签，诸如来自酿酒酵母前初-α因子或转化酶，毕赤酵母Kar2，或马克斯克鲁维酵母菌菊粉的那些在引导酵母中抗体分泌的能力。

DNA组装和转化

使用先前描述的DNA组装方法生成多组件DNA构建体(De Kok等(2014)ACSSynth.Biol.21；3(2):97-106.doi:10.1021/sb4001992；Serber等,美国专利号8,221,982)，并使用下述方法转化到各宿主中。

对于巴斯德毕赤酵母宿主细胞，向表达Cas9的毕赤酵母宿主菌株转化供体DNA盒的线性片段，所述供体DNA盒包含对于毕赤酵母基因组的约1.0kb的上游和下游靶基因座同源性，向导RNA(gRNA)以及含有毕赤酵母ARS1序列和gRNA同源区的载体(Weninger等,J.Biotech.235:139-149(2016)；Horwitz等Cell Syst.Jul 29；1(1):88-96(2015))。转化方案改进自Higgins和Cregg的电穿孔方法(Higgins和Cregg,Methods Mol Biol.103:1-15(1998))。

培养基和菌株培养

在下文所述的培养基中，以1,000rpm摇动，80％相对湿度，在96孔微量滴定板(1.1或2.2mL)中的培养物中进行来自四种酵母宿主的抗体的生产。细胞通常生长1-2天(预培养阶段)，然后经稀释或离心并重悬于新鲜培养基中，然后再生长2-3天(生产阶段)。通过离心分离细胞，并收集上清液样品用于进一步分析。为了产生大体积培养物，细胞在250mL培养瓶中的50mL培养基中生长，并以200rpm摇动。下文列出了各物种的培养条件。

蛋白A纯化

使用蛋白A尖端柱(PhyNexus公司，美国加利福尼亚州圣何塞)纯化并浓缩来自抗体生产培养物的上清液样品。

通过斑点印迹进行的半定量抗体效价测量

根据生产商方案使用Minifold I 96孔系统(GE医疗公司(GE Healthcare)，英国小查尔方特(Little Chalfont))进行斑点印迹分析。从在生产条件下生长的培养物中收集上清液。使用

800CW山羊抗-人IgG(H+L)抗体(LI-COR，美国内布拉斯加州林肯)作为一抗和二抗，并在Odyssey红外成像系统(LI-COR，美国内布拉斯加州林肯)上成像。

内切H(EndoH)处理

根据生产商的说明使用内切H_f(新英格兰生物实验室公司(New EnglandBiolabs)，目录号P0703S)进行内切糖苷酶处理。对于非还原样品，用5％SDS溶液替换1X糖蛋白变性缓冲液。

Western印迹

将所有单克隆抗体样品与NuPAGE LDS样品缓冲液(赛默飞世尔公司，目录号NP008)混合并在70℃下变性10分钟，然后在3-8％的Tris-乙酸盐预制蛋白凝胶(赛默飞世尔公司，目录号EA0375)上跑胶非还原样品。对于还原的样品，使用NuPAGE样品还原缓冲液(赛默飞世尔公司，目录号NP009)作为还原剂。还原的样品在70℃进行10分钟变性，然后在4-12％的Bis-Tris预制蛋白凝胶(赛默飞世尔公司，目录号NP0321)上跑胶。为了研究通过胞内细胞裂解物的BIIB降解，使用iBlot系统(赛默飞世尔公司)在48孔E-PAGE凝胶上进行样品跑胶。对于Western印迹分析，以1：10,000的稀释度使用山羊抗-人IgG(H+L)(LiCor公司，目录号925-32232)以检测重链、轻链或全长抗体。

将巴斯德毕赤酵母毕赤酵母菌落接种于360μL的BMGY 1％甘油(2％细菌蛋白胨，1％细菌酵母提取物，100mM磷酸钾pH 6.0，1.34％不含氨基酸的酵母氮碱，0.4μg/mL生物素和1％甘油中)并在1.1mL 96孔板中于30℃生长24小时。然后将细胞离心并重悬于360μLBMMY(2％细菌蛋白胨，1％细菌酵母提取物，100mM磷酸钾，pH 6.0，1.34％不含氨基酸的酵母氮碱，0.4μg/mL生物素，0.5％v/v甲醇)，并在30℃下生长72小时。在BMMY中24和48小时后，将1％v/v甲醇添加到生产板中。

我们克隆了用于毕赤酵母的赫塞汀和美罗华单抗的表达构建体。使用较短的前α前导物代替先前使用的前初-α前导物将构建体设计为趋集型分开表达盒。我们选择了该较短的前导物来匹配成功发表的著作中使用的构建体(Zha，2013)，虽然较长的前导物也同样被成功地使用(Kozlov和Yagudin，2008)。对于美罗华，我们还使用了相同的分泌标签Kar2，如Glycofi(Li等,2006)在毕赤酵母中所公开。使用密码子优化算法针对各宿主对所有序列进行密码子优化。使用这些新的构建体，我们能够检测到毕赤酵母中的全长IgG表达。

我们还克隆了用于毕赤酵母的BIIB抗体(CD23结合抗体)的表达构建体。BIIB抗体的重链(HC)和轻链(LC)序列可以是PCT公开WO2009043051中的SEQ ID NO:18，分别是SEQID NO:18和SEQ ID NO:4。然而，对于该构建体，虽然未检测到全长IgG表达，但检测到抗体片段。

下表6提供了在摇床中产生BIIB、赫塞汀和美罗华抗体的毕赤酵母(PP)。将HC/LC，HC和LC序列拆分为两个DNA构建体，并通过同源重组整合在同一基因座上。除非另有说明，否则所有BIIB和赫塞汀/美罗华序列与酿酒酵母前初-α和前α分泌标签融合。NA，不可得。BDL，低于Octet的检测极限。

在某些菌株中，尝试了各种菌株工程改造策略来增加全长抗体分泌，例如，过度表达负责蛋白质折叠和分泌的基因(CNE1，HAC1，ERO1，KAR2等)或使蛋白酶(pep4和/或prb1)缺失。在一些情况中，本文所述方法用于在多个基因座同时缺失和/或整合抗体构建体，一种或多种过表达构建体和/或一种或多种缺失构建体。

表6：

蛋白酶缺失的(pep4Δ)巴斯德毕赤酵母菌株表达全长的赫塞汀和美罗华(图1A和1B)。在非还原条件下，对于使用前α前导物或Kar2前导物克隆的两个构建体，均观察到了与标准品匹配的150kDa+条带(图1A)。此外，LC构建体中潜在的kexin蛋白酶位点发生了突变(“KR至TR”)，但没有任何作用(泳道2、4、6和8)，并且我们得出这样的结论，LC kexin降解不是巴斯德毕赤酵母中的主要因素。使用内切H_f预处理样品以去除糖基化链(泳道5-8)使全长条带清晰(sharpen)。显然，赫塞汀效价比美罗华效价高得多。这可能是由于分泌标签和抗体序列中的不同所致。当样品在还原条件下运行时，观察到适当的HC和LC条带(图1B)。不进行处理，对于HC条带显示出双峰，这可能代表糖苷配基和糖基化形式。内切H_f处理使较高分子量条带位移至单个较低分子量条带，这证实了糖基化(图1B，泳道1和2相对图5和6)。

图1A和1B显示了工程改造的巴斯德毕赤酵母菌株分泌全长赫塞汀和美罗华。通过Western印迹在非还原(A)和还原(B)条件下测试蛋白A纯化的样品。泳道1-4，蛋白A纯化的样品；5-8道，蛋白A纯化和内切H_f处理的样品。1和5，具有前α分泌前导序列的赫塞汀；2和6，具有前α分泌前导序列和LC中KR突变为TR的赫塞汀；3和7，具有Kar2前导序列的美罗华；4和8，具有Kar2序列和LC中KR突变为TR的美罗华。MW，分子量标，并且数量位于各凝胶的左侧。+，BIIB抗体标准品。

将VTH1，CNE1，ECM13和ERO1的过表达构建体合并到表达赫塞汀的菌株中以确定它们是否像其对表达BIIB的菌株一样改善抗体表达(表6)。所得菌株Y676显示出比Y324高大约40％的效价(表6)，这表明改善BIIB表达的遗传技巧也可以改善赫塞汀表达。

通过质谱仪分析来自产生赫塞汀的巴斯德毕赤酵母的样品的N-聚糖概况。预期在巴斯德毕赤酵母中糖基化模式的质谱结果为高甘露糖。产生赫塞汀的巴斯德毕赤酵母的N-聚糖分析如图2所示。

实施例部分中显示的结果说明毕赤酵母是高度可工程化的，允许同时多重化基因组整合异源性核酸。相较于CHO细胞约为19-24小时的倍增时间和约为3个月的总基因工程改造周期时间(从一次转化到下一次转化)，使用在本发明中所提供的组合物和方法的毕赤酵母的细胞群倍增时间约为2小时且周期时间约为两周。本文所提供的组合物和方法使我们改造毕赤酵母以生产新的生物分子的能力向前迈出了一大步。

在不脱离本发明范围的情况下，可以将本文或附图中所述任何实施方式的一个或多个特征与本文或附图中所述任何其他实施方式的一个或多个特征组合。

本说明书引用的所有发表物、专利和专利申请通过引用纳入本文，就好像各发表物或专利申请特定和单独地通过引用纳入本文那样。虽然出于阐明目的已经通过说明和举例的方式详细描述了本发明，但本领域普通技术人员根据本发明的教导不难了解，可以在不背离所附权利要求书的构思或范围的情况下作出某些改变和修改。

非正式序列表

ARS1(SEQ ID NO:44)

TCGAGATAAGCTGGGGGAACATTCGCGAAAATGAAACAAGTCGGCTGTTATAGTATATTTATTATAATATTGAAAGATCTCAAAAGACTACTTATTTTTGAATGAACCAAGTATGAAATCAACCTATTTGGGGTTGACCAAAATAAGTAAATATTAATTGTCGA

pHTA1(SEQ ID NO:45)

TGTTGTAGTTTTAATATAGTTTGAGTATGAGATGGAACTCAGAACGAAGGAATTATCACCAGTTTATATATTCTGAGGAAAGGGTGTGTCCTAAATTGGACAGTCACGATGGCAATAAACGCTCAGCCAATCAGAATGCAGGAGCCATAAATTGTTGTATTATTGCTGCAAGATTTATGTGGGTTCACATTCCACTGAATGGTTTTCACTGTAGAATTGGTGTCCTAGTTGTTATGTTTCGAGATGTTTTCAAGAAAAACTAAAATGCACAAACTGACCAATAATGTGCCGTCGCGCTTGGTACAAACGTCAGGATTGCCACCACTTTTTTCGCACTCTGGTACAAAAGTTCGCACTTCCCACTCGTATGTAACGAAAAACAGAGCAGTCTATCCAGAACGAGACAAATTAGCGCGTACTGTCCCATTCCATAAGGTATCATAGGAAACGAGAGTCCTCCCCCCATCACGTATATATAAACACACTGATATCCCACATCCGCTTGTCACCAAACTAATACATCCAGTTCAAGTTACCTAAACAAATCAAA

HH(SEQ ID NO:46)

HDV(SEQ ID NO:47)

GGCCGGCATGGTCCCAGCCTCCTCGCTGGCGCCGGCTGGGCAACATGCTTCGGCATGGCGAATGGGAC

6bp接头，侧接HH的5’和3’(反向互补序列)(SEQ ID NO:48)

ATCTGA和TCAGAT

结构gRNA(SEQ ID NO:49)

TTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGGTGC

tADH1(SEQ ID NO:50)

GCGAATTTCTTATGATTTATGATTTTTATTATTAAATAAGTTATAAAAAAAATAAGTGTA

TACAAATTTTAAAGTGACTCTTAGGTTTTAAAACGAAAATTCTTATTCTTGAGTAACTCTTTCCTGTAGGTCAGGTTGCTTTCTCAGGTATAGCATGAGGTCGCTCTTATTGACCACACCTCTACCGGCATGCCGAGCAAATGCCTGCAAATCGCTCCCCATTTCACCCAATTGTAGATATGCTAACTCCAGC

gRNA表达盒，其靶向酵母ADH4，用于构建毕赤酵母的gRNA载体骨架SEQ ID NO:51)

TGTTGTAGTTTTAATATAGTTTGAGTATGAGATGGAACTCAGAACGAAGGAATTATCACCAGTTTATATATTCTGAGGAAAGGGTGTGTCCTAAATTGGACAGTCACGATGGCAATAAACGCTCAGCCAATCAGAATGCAGGAGCCATAAATTGTTGTATTATTGCTGCAAGATTTATGTGGGTTCACATTCCACTGAATGGTTTTCACTGTAGAATTGGTGTCCTAGTTGTTATGTTTCGAGATGTTTTCAAGAAAAACTAAAATGCACAAACTGACCAATAATGTGCCGTCGCGCTTGGTACAAACGTCAGGATTGCCACCACTTTTTTCGCACTCTGGTACAAAAGTTCGCACTTCCCACTCGTATGTAACGAAAAACAGAGCAGTCTATCCAGAACGAGACAAATTAGCGCGTACTGTCCCATTCCATAAGGTATCATAGGAAACGAGAGTCCTCCCCCCATCACGTATATATAAACACACTGATATCCCACATCCGCTTGTCACCAAACTAATACATCCAGTTCAAGTTACCTAAACAAATCAAAATCTGACTGATGAGTCCGTGAGGACGAAACGAGTAAGCTCGTCTCAGATGGATTTGATCAATGAAAGCTGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGGTGCGGCCGGCATGGTCCCAGCCTCCTCGCTGGCGCCGGCTGGGCAACATGCTTCGGCATGGCGAATGGGACGCGAATTTCTTATGATTTATGATTTTTATTATTAAATAAGTTATAAAAAAAATAAGTGTATACAAATTTTAAAGTGACTCTTAGGTTTTAAAACGAAAATTCTTATTCTTGAGTAACTCTTTCCTGTAGGTCAGGTTGCTTTCTCAGGTATAGCATGAGGTCGCTCTTATTGACCACACCTCTACCGGCATGCCGAGCAAATGCCTGCAAATCGCTCCCCATTTCACCCAATTGTAGATATGCTAACTCCAGC

gRNA表达盒，其靶向酵母ADH4，排除tADH1，购自IDT(SEQ ID NO:52)

CCCCTCGAGGTCGACGGTATCGATTGTTGTAGTTTTAATATAGTTTGAGTATGAGATGGAACTCAGAACGAAGGAATTATCACCAGTTTATATATTCTGAGGAAAGGGTGTGTCCTAAATTGGACAGTCACGATGGCAATAAACGCTCAGCCAATCAGAATGCAGGAGCCATAAATTGTTGTATTATTGCTGCAAGATTTATGTGGGTTCACATTCCACTGAATGGTTTTCACTGTAGAATTGGTGTCCTAGTTGTTATGTTTCGAGATGTTTTCAAGAAAAACTAAAATGCACAAACTGACCAATAATGTGCCGTCGCGCTTGGTACAAACGTCAGGATTGCCACCACTTTTTTCGCACTCTGGTACAAAAGTTCGCACTTCCCACTCGTATGTAACGAAAAACAGAGCAGTCTATCCAGAACGAGACAAATTAGCGCGTACTGTCCCATTCCATAAGGTATCATAGGAAACGAGAGTCCTCCCCCCATCACGTATATATAAACACACTGATATCCCACATCCGCTTGTCACCAAACTAATACATCCAGTTCAAGTTACCTAAACAAATCAAAATCTGACTGATGAGTCCGTGAGGACGAAACGAGTAAGCTCGTCTCAGATGGATTTGATCAATGAAAGCTGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGGTGCGGCCGGCATGGTCCCAGCCTCCTCGCTGGCGCCGGCTGGGCAACATGCTTCGGCATGGCGAATGGGACTTTTTTTGTTTTTTATGTCTGCCCGGGGGATCCACTAGTTCTAG

BMT1/BMT2缺失MS061(SEQ ID NO:53)

GACGGCACGGCCACGCGTTTAAACCGCCAAGATGGTGATTTCCAGCGTTCGAAAAGCCTGTAGTACCCAGAATTTTGATCAAAGTGTCCTCTTAGCCGTGGCATCCGCGGCTGTCATCTTGATCCTTCTTCGCATGAGCACTTACGTGATGCTGATAAGATGGGCACGCCACAACACTAGGGCCAAGACCTCGCCTAGTGGTGGCGACTATCTAAAGGGCTCACCTAACACCTCTTTAGCGGGGATTGAAGACATTCATACACGAAGTCTGCTGTATGGGTCAGACGAGAAAATGCCGCAATCTAAAGAAGAACAAAGGTCCCACAATGCGAATCGTGATGGTGATAAATCATTGGCTCAGGTCAGTAGATTTGAAATGCATGATAAACGCATATGGTGAGAGCCGTTCTGCACAACTAGATGTTTTCGAGCTTCGCATTGTTTCCTGCAGCTCGACTATTGAATTAAGATTTCCGGATATCTCCAATCTCACAAAAACTTATGTTGACCACGTGCTTTCCTGAGGCGAGGTGTTTTATATGCAAGCTGCCAAAAATGGAAAACGAATGGCCATTTTTCGCCCAGGCAAATTATTCGATTACTGCTGTCATAAAGACAGTGTTGCAAGGCTCACATTTTTTTTTAGGATCCGAGATAAAGTGAATACAGGACAGCTTATCTCTATATCTTGTACCATTCGTGAATCTTAAGAGTTCGGTTAGGGGGACTCTAGTTGAGGGTTGGCACTCACGTATGGCTGGGCGCAGAAATAAAATTCAGGCGCAGCAGCACTTATCGATGCATGCAAGGCGAGAAAAATAAAGAACAAAAACACACCTTGCTAAGACCACAACCTTTCAAATTTTGAGATTGTTATTCTTTCATCCTAAAACACCACCGTCCTATCTCTTGGGAACGTACATATCATTGAGCTTGGTTCATTGATACATCACTGTATCTAACTCTCCTTTTTCGCTCGTCCAACGCCGGCGGACCTCAAAAAGGATCTAAAAATAAGACAGTAGTGGACTTATATTCATACCATATGATGGGTGTTTGCTCACTCGTATGGATCAAAATTCCATGGTTTCTTCTGTACAACTTGTACACTTATTTGGACTTTTCTAACGGTTTTTCTGGTGATTTGAGAAGTCCTTATTTTGGTGTTCGCAGCTTATCCGTGATTGAACCATCAGAAATACTGCAGCTCGTTATCTAGTTTCAGAATGTGTTGTAGAATACAATCAATTCTGAGTCTAGTTTGGGTGGGTCTTGGCGACGGGACCGTTATATGCATCTATGCAGTGTTAAGGTACATAGAATGAAAATGTAGGGGTTAATCGAAAGCATCGTTAATTTCAGTAGAACGTAGTTCTATTCCCTACCCAAATAATTTGCCAAGAATGCTTCGTATCCACATACGCAGTGGACGTAGCAAATTTCACTTTGGACTGTGACCTCAAGTCGTTATCTTCTACTTGGACATTGATGGTCATTACGTAATCCACAAAGAATTGGATAGCCTCTCGTTTTATCTAGTGCACAGCCTAATAGCACTTAAGTAAGAGCAATGGACAAATTTGCATAGACATTGAGCTAGATACGTAACTCAGATCTTGTTCACTCATGGTGTACTCGAAGTACTGCTGGAACCGTTACCTCTTATCATTTCGCTACTGGCTCGTGAAACTACTGGATGAAAAAAAAAAAGAGCTGAAAGCGAGATCATCCCATTTTGTCATCATACAAATTCACGCTTGCAGTTTTGCTTCGTTAACAAGACAAGATGTCTTTATCCGGTGTTTAAACCCCAGCGCCTGGCGGG

BMT3缺失MS648(SEQ ID NO:54)

GACGGCACGGCCACGCGTTTAAACCGCCGCAGGGTCCCACACAGACCAAATCCAAGTTATTCCCTAAGGGATGGTTTTCAGAGAGAGAAGAAACTATAATGGTAAACCGGTTGTTGCGGGATGACCCCTCTAAGAGTGATATGCACAATAGACAGTCTGTTACGCCAAAAGAACTGTGGAAAGTGTTGGGAGACTACGATCTATGGCCTATATACGCATTGGCCATGGTATTTTCCATTCCCCAGATACCGATAAAGAGATACCTTACTCTTACTTTGAGGGCATTAGAGTTCACTACCACTGAGATCAATCTCTTAACAATCCCTGCTTCGTTTCTGGCGGGAATCATGTCAATTGCTATTTCATTAGTCAGTGAGTTCTTCAATGAAGGTTTGATTATCGGTATATTGTGTCAATTCTGGTTGCTTATTATGGTTATCATTGAATACACCTCTGTGGAAAAGATATCTCCCTGGGGACAATATGTGTTGCAACTGTTCGTTGTTGGTGCCCCAGTCCCCCAACCGGTACTAATCGGTCTATGTTCCCGTAACTCATATTCGGTTAGAACTAGAACAATAAGTGCATCATTGTTCAACATTGTGGTTCAATTGTCGAACATTGCTGGTGCTTATATCTACAGGGAAGACGATAAGCCTTTGTACAAGAGAGGTAACAGACAGTTAATTGGTATTTCTTTGGGAGTCGTTGCCCTCTACGTTGTCTCCAAGACATACTACATTCTGAGAAACAGATGGAAGACTCAAAAATGGGAGAAGCTTAGTGAAGAAGAGAAAGTTGCCTACTTGGACAGAGCTGAGAAGGAGAACCTGGGTTCTAAGAGGCTGGACTTTTTGTTCGAGAGTTAAACTGCATAATTTTTTCTAAGTAAATTTCATAGTTATGAAATTTCTGCAGCTTAGTGTTTACTGCATCGTTTACTGCATCACCCTGTAAATAATGTGAGCTTTTTTCCTTCCATTGCTTGGTATCTTCCTTGCTGCTGTTTCGCTCGTCCAACGCCGGCGGACCTGAGACGGAAAACGGAGAAAGGAGAACGGAGAACGAAGAACGAAGGGAGAGAGAAGCAAAGGGAAGAGCAAGGTATTCTGGAGAGATTAAGAAAATAGTAGAATAGATTTAACGAAACTGAAACTGAAAGACCGAAAAAAGAATGCAGAAATTAAACACCATAGGGCAGATTGATTCCGTAATCGGTTTCTTGCTACTATATCTTTCTAGGCTGTCTATAATCCTTTTATAATTTAATCTGCTAATATCGCTGTCACGATTATTGACATCGACTGTATTTCAACACACAGGTCTTACAGATAGCATGGGGTTTCCAGTATTTGATTGACATTTCCGTTTTTGCATAGTCCATAATATAAGGATCAAAAACATGAGATGTCGCAAGGCCTCTTAAACATGAAATCTCCGTTTACCTTCCGCCATACAACCTTACGCATACAGCAGCTCGGTTTCTACATAGAGTCTTTTCAAGAACCGGGGTAAAAACCGTTTTACATAGAAAGAGGTAAAACGTTGTGATCATGTGACCGCTGAACATCTCCGGAACCAACACTTCGCGATCTTTTTTCGTCTGTCACATACTCAAGGTAAACTAAGTTTCACAACACGAAGGCTCCGTATCATAAATCCTCAGAGTTGAAGCACTGGCCCCCATCTAATAAATACTCCGAAATGAGTCAAATCCAGTCAAGCCAAGTGGGGGCGAAAAATATGCAAACCGCACAGCCTCAGGCTCAACAAAGACCAATCAATGGGTCTGTGACCCTGAGCAATGGCCAGAGGATAAACCCTCAGAACTTGACTCCGGTGTTTAAACCCCAGCGCCTGGCGGG

BMT4缺失MS649(SEQ ID NO:55)

GACGGCACGGCCACGCGTTTAAACCGCCCGTTCTGATGGCTTGATGACCGTTGTATTGCCTGTCACTATAGCCAGGGGTAGGGTCCATAAAGGAATCATAGCAGGGAAATTAAAAGGGCATATTGATGCAATCACTCCCAATGGCTCTCTTGCCATTGAAGTCTCCATATCAGCACTAACTTCCAAGAAGGACCCCTTCAAGTCTGACGTGATAGAGCACGCTTGCTCTGCCACCTGTAGTCCTCTCAAAACGTCACCTTGTGCATCAGCAAAGACTTTACCTTGCTCCAATACTATGACGGAGGCAATTCTGTCAAAATTCTCTCTCAGCAATTCAACCAACTTGAAAGCAAATTGCTGTCTCTTGATGATGGAGACTTTTTTCCAAGATTGAAATGCAATGTGGGACGACTCAATTGCTTCTTCCAGCTCCTCTTCGGTTGATTGAGGAACTTTTGAAACCACAAAATTGGTCGTTGGGTCATGTACATCAAACCATTCTGTAGATTTAGATTCGACGAAAGCGTTGTTGATGAAGGAAAAGGTTGGATACGGTTTGTCGGTCTCTTTGGTATGGCCGGTGGGGTATGCAATTGCAGTAGAAGATAATTGGACAGCCATTGTTGAAGGTAGAGAAAAGGTCAGGGAACTTGGGGGTTATTTATACCATTTTACCCCACAAATAACAACTGAAAAGTACCCATTCCATAGTGAGAGGTAACCGACGGAAAAAGACGGGCCCATGTTCTGGGACCAATAGAACTGTGTAATCCATTGGGACTAATCAACAGACGATTGGCAATATAATGAAATAGTTCGTTGAAAAGCCACGTCAGCTGTCTTTTCATTAACTTTGGTCGGACACAACATTTTCTACTGTTGTATCTGTCCTACTTTGCTTATCATCTGCCACAGGGCAAGTGGATTTCCTTCTCGCGCGGCTGGGTGAAAACGGTTAACGTGAACGCTCGTCCAACGCCGGCGGACCTGCCTTGGGGGACTTCAAGTCTTTGCTAGAAACTAGATGAGGTCAGGCCCTCTTATGGTTGTGTCCCAATTGGGCAATTTCACTCACCTAAAAAGCATGACAATTATTTAGCGAAATAGGTAGTATATTTTCCCTCATCTCCCAAGCAGTTTCGTTTTTGCATCCATATCTCTCAAATGAGCAGCTACGACTCATTAGAACCAGAGTCAAGTAGGGGTGAGCTCAGTCATCAGCCTTCGTTTCTAAAACGATTGAGTTCTTTTGTTGCTACAGGAAGCGCCCTAGGGAACTTTCGCACTTTGGAAATAGATTTTGATGACCAAGAGCGGGAGTTGATATTAGAGAGGCTGTCCAAAGTACATGGGATCAGGCCGGCCAAATTGATTGGTGTGACTAAACCATTGTGTACTTGGACACTCTATTACAAAAGCGAAGATGATTTGAAGTATTACAAGTCCCGAAGTGTTAGAGGATTCTATCGAGCCCAGAATGAAATCATCAACCGTTATCAGCAGATTGATAAACTCTTGGAAAGCGGTATCCCATTTTCATTATTGAAGAACTACGATAATGAAGATGTGAGAGACGGCGACCCTCTGAACGTAGACGAAGAAACAAATCTACTTTTGGGGTACAATAGAGAAAGTGAATCAAGGGAGGTATTTGTGGCCATAATACTCAACTCTATCATTAATGTGGTTCTTTTGGTAGCAAAAATCTTTGTTGTTTTGTTCAGTTCCTCACTCTCATTGATGGCTTCGTTAGTTGACTCCGTGATGGATTTCTTATCTACTTTGATCATATATGTTTCTAACTCTTTTGCTGGGAAAAGAGACAAGAATGAGTATCCAGTTGGAAGGTCAAGGTTGGAGCCCTTAGGAGTTCTTGTCTTTTCCGTAATCATAATTGTCTCGGTGTTTAAACCCCAGCGCCTGGCGGG

MNN4-1/PNO1缺失MS056(SEQ ID NO:56)

GACGGCACGGCCACGCGTTTAAACCGCCAAGGCATATAGGCGAGGGAGAGTTAGCTAGCATACAAGATAATGAAGGATCAATAGCGGTAGTTAAAGTGCACAAGAAAAGAGCACCTGTTGAGGCTGATGATAAAGCTCCAATTACATTGCCACAGAGAAACACAGTAACAGAAATAGGAGGGGATGCACCACGAGAAGAGCATTCAGTGAACAACTTTGCCAAATTCATAACCCCAAGCGCTAATAAGCCAATGTCAAAGTCGGCTACTAACATTAATAGTACAACAACTATCGATTTTCAACCAGATGTTTGCAAGGACTACAAACAGACAGGTTACTGCGGATATGGTGACACTTGTAAGTTTTTGCACCTGAGGGATGATTTCAAACAGGGATGGAAATTAGATAGGGAGTGGGAAAATGTCCAAAAGAAGAAGCATAATACTCTCAAAGGGGTTAAGGAGATCCAAATGTTTAATGAAGATGAGCTCAAAGATATCCCGTTTAAATGCATTATATGCAAAGGAGATTACAAATCACCCGTGAAAACTTCTTGCAATCATTATTTTTGCGAACAATGTTTCCTGCAACGGTCAAGAAGAAAACCAAATTGTATTATATGTGGCAGAGACACTTTAGGAGTTGCTTTACCAGCAAAGAAGTTGTCCCAATTTCTGGCTAAGATACATAATAATGAAAGTAATAAAGTTTAGTAATTGCATTGCGTTGACTATTGATTGCATTGATGTCGTGTGATACTTTCACCGAAAAAAAACACGAAGCGCAATAGGAGCGGTTGCATATTAGTCCCCAAAGCTATTTAATTGTGCCTGAAACTGTTTTTTAAGCTCATCAAGCATAATTGTATGCATTGCGACGTAACCAACGTTTAGGCGCAGTTTAATCATAGCCCACTGCTAAGCCAGAATTCTAATATGTAACTACGTACCTTTCCTTTTAATAAATGATCTGTATTTTCCACCTAGTAGCAGATCAAATTGTTCAACTTTAAGTCTTTGGTCCCTCAAGCGAGAGAACTTGCGCGCTCGTCCAACGCCGGCGGACCTCGGAGGAATGCAAATAATAATCTCCTTAATTACCCACTGATAAGCTCAAGAGACGCGGTTTGAAAACGATATAATGAATCATTTGGATTTTATAATAAACCCTGACAGTTTTTCCACTGTATTGTTTTAACACTCATTGGAAGCTGTATTGATTCTAAGAAGCTAGAAATCAATACGGCCATACAAAAGATGACATTGAATAAGCACCGGCTTTTTTGATTAGCATATACCTTAAAGCATGCATTCATGGCTACATAGTTGTTAAAGGGCTTCTTCCATTATCAGTATAATGAATTACATAATCATGCACTTATATTTGCCCATCTCTGTTCTCTCACTCTTGCCTGGGTATATTCTATGAAATTGCGTATAGCGTGTCTCCAGTTGAACCCCAAGCTTGGCGAGTTTGAAGAGAATGCTAACCTTGCGTATTCCTTGCTTCAGGAAACATTCAAGGAGAAACAGGTCAAGAAGCCAAACATTTTGATCCTTCCCGAGTTAGCATTGACTGGCTACAATTTTCAAAGCCAGCAGCGGATAGAGCCTTTTTTGGAGGAAACAACCAAGGGAGCTAGTACCCAATGGGCTCAAAAAGTATCCAAGACGTGGGATTGCTTTACTTTAATAGGATACCCAGAAAAAAGTTTAGAGAGCCCTCCCCGTATTTACAACAGTGCGGTACTTGTATCGCCTCAGGGAAAAGTAATGAACAACTACAGAAAGTCCTTCTTGTATGAAGCTGATGAACATTGGGGATGTTCGGAATCTTCTGATGGGTTTCAAACAGTAGATTTATTAATTGAAGGAAAGACTGTAAAGACATCATTTGGAATTTGCATGGATTTGAATCCTTATAAATTTGAAGCTCCGGTGTTTAAACCCCAGCGCCTGGCGGG

MNN4-2缺失MS652(SEQ ID NO:57)

GACGGCACGGCCACGCGTTTAAACCGCCCTGTGGACTCAGGACCAGCTCAGCTTGACAAACCAAGACTTGCACTCCAATGTGCACAACCCAGTGATTGAGCAGATCGAAACCTCATCAGGAGTCAGATTGTAGTATGGAAAACTTTGTATTCTCTATGTACTTAAACACTGGTTTATTTTTTTATTGATCGTTATATTGAACAGTTTACACTGGAACATCTTCAGGGTCGATGTCCTTAATCCAGTGTTGACCAAAGATTGGGATCTTCTCGAAGAAAGTCTTTTGGAACAAAGGCCAGTTTTCAGTGAAAGTGAAGACGGCAAACAGACCGGCACCTCCCCAGAAAGCCAAAATTGGAAAAGTAGTTTTAATTTGGGTTGGAGTCAATCCAGCAATTTTCTTGACGGTGGTATACTTGGGACCTTTAACGTACTGAAATGTTAGAACATGTTTGTAAAAATCAAATCATCACTGCAGAAACGGTTTGTGTGCCTGCACCGGAGGGTTATCATAATGCCACTTACGTTGACCATTTTGGAGGTGTTTGACTAAGTTCAAATATGAATCTCTAAGAAAACTAATAATCAATATGGTGCGAGCATTGATTGGTTGGACAGCTAGTTTGGAGAAGTACACGACTTAGATGAATCTGCAATAAGGAATAGTCCAATCTGATTATGTAAGCTCTCCTTTTTGGTTTTCATTTCCATCAGCTCAAGCTTATCATAGCTCAGGTCCCCTCCAGCTTATGATGGAATAGGCCATTATTTTTTGCCCTAAAAAGTGGAAGTCCACAAGAAGAAATACAAATACTCAAAATTCAAAAGTCTTCCTTTGAGTGGATGCAATTTTACGTAGTTTACTGTATGACGTAACTAATGAACCCTTCCGACACAAAGATTGAGGTGCCTCACTTAACGTCATTCTTCTATACCCACGAGTGCAACTGACTAGGTCTTATTTTGTTAATTGCCTCAGTTTCTCCGAACGCTCGTCCAACGCCGGCGGACCTTTATGCATATACTGAAACAACAGAAGGAACTACAGTAAATTCATAAAAAGCTTAATTCTTACTTTCATCTCGGCACTGTAAATTAACTCAAGTTGGGGCAACATTGTGTGTATACTCTTACTGGCATCTTTTCATCTGAAGTCATCTTCTACTACTCTTCTCTTCTGTATGACGTAATCAGCTCGGCAGCTGTGGCATCGAACAAAAAAATGAACAGCCATCCGTCATATCTCATGACTGACTGAGCAAGAACTAAGTCAACAGGAAACCTAAAATAAGCTTTCCATTTCTTTTGCGCTGAAGCCAACCACTCCCCACACAGTTGATGAGTGGACGCAAAACCAGCTCCTATACCTTGACAGAAGAGTCGCCGGAATCAACCTCAACAATTCAGGATATACGAGAGGAAGACCAAGTTGCTCCAGGGCCCCAGCAAGAAGCACCTAAACAGTCACATATCCAAAAATGGTTAAGCGATCATCCTAAAGTATACGCAGTTTTATCTTGGATATGGAAATTTTGGTTGAAACAGTGGTTTCTCATATGTTTGGGCCCTGCGGTTGCTCTAGCTCATGCATACCCAAATTTTGCCAGACATGATGGAACCATTAGGTCAGAGTATACTATCAACTACGGAGCCGTAGCTATCATATTCTTCATCTCTGGTCTTACTATGAAAACCAAAGACTTTTTGAAGAACTTTGGACACTGGAGAGCCCATTTCACAGTGTTAAGCTGCTCGTTTCTACTTACTTCTTCTATCATTTACGGTATAGCGTGCGGTATAAGAGCTGCTCATGATTCCAATATCGATGACTGGATGTTAGCAGGACTTATTGTTACCGCATGTTGTCCAACCACTGTGAGCGGTGTTTAAACCCCAGCGCCTGGCGGG

MNN4-3缺失MS653(SEQ ID NO:58)

GACGGCACGGCCACGCGTTTAAACCGCCGGAGGAGGTGGAACCACCTGTGCAGGCGGTCTGAAAGTGTTCAAGTACGGATCTACTACCAAATATACATCTGGTAACCTGAACGGCGTCAGGTTAGTATACTGGAACGAAGGAAAGTTGCAAAGCTCCAAATTTGTGGTTCGATCCTCTAATTACTCTCAAAAGCTTGGAGGAAACAGCAACGCCGAATCAATTGACAACAATGGTGTGGGTTTTGCCTCAGCTGGAGACTCAGGCGCATGGATTCTTTCCAAGCTACAAGATGTTAGGGAGTACCAGTCATTCACTGAAAAGCTAGGTGAAGCTACGATGAGCATTTTCGATTTCCACGGTCTTAAACAGGAGACTTCTACTACAGGGCTTGGGGTAGTTGGTATGATTCATTCTTACGACGGTGAGTTCAAACAGTTTGGTTTGTTCACTCCAATGACATCTATTCTACAAAGACTTCAACGAGTGACCAATGTAGAATGGTGTGTAGCGGGTTGCGAAGATGGGGATGTGGACACTGAAGGAGAACACGAATTGAGTGATTTGGAACAACTGCATATGCATAGTGATTCCGACTAGTCAGGCAAGAGAGAGCCCTCAAATTTACCTCTCTGCCCCTCCTCACTCCTTTTGGTACGCATAATTGCAGTATAAAGAACTTGCTGCCAGCCAGTAATCTTATTTCATACGCAGTTCTATATAGCACATAATCTTGCTTGTATGTATGAAATTTACCGCGTTTTAGTTGAAATTGTTTATGTTGTGTGCCTTGCATGAAATCTCTCGTTAGCCCTATCCTTACATTTAACTGGTCTCAAAACCTCTACCAATTCCATTGCTGTACAACAATATGAGGCGGCATTACTGTAGGGTTGGAAAAAAATTGTCATTCCAGCTAGAGATCACACGACTTCATCACGCTTATTGCTCCTCATTGCTAAATCATTTACTCTTGACTTCGACCCAGAAAAGTTCGCCCGCTCGTCCAACGCCGGCGGACCTATAGTTGTTTTTTCTATATAAAACGAAACGTTATCATCTTTAATAATCATTGAGGTTTACCCTTATAGTTCCGTATTTTCGTTTCCAAACTTAGTAATCTTTTGGAAATATCATCAAAGCTGGTGCCAATCTTCTTGTTTGAAGTTTCAAACTGCTCCACCAAGCTACTTAGAGACTGTTCTAGGTCTGAAGCAACTTCGAACACAGAGACAGCTGCCGCCGATTGTTCTTTTTTGTGTTTTTCTTCTGGAAGAGGGGCATCATCTTGTATGTCCAATGCCCGTATCCTTTCTGAGTTGTCCGACACATTGTCCTTCGAAGAGTTTCCTGACATTGGGCTTCTTCTATCCGTGTATTAATTTTGGGTTAAGTTCCTCGTTTGCATAGCAGTGGATACCTCGATTTTTTTGGCTCCTATTTACCTGACATAATATTCTACTATAATCCAACTTGGACGCGTCATCTATGATAACTAGGCTCTCCTTTGTTCAAAGGGGACGTCTTCATAATCCACTGGCACGAAGTAAGTCTGCAACGAGGCGGCTTTTGCAACAGAACGATAGTGTCGTTTCGTACTTGGACTATGCTAAACAAAAGGATCTGTCAAACATTTCAACCGTGTTTCAAGGCACTCTTTACGAATTATCGACCAAGACCTTCCTAGACGAACATTTCAACATATCCAGGCTACTGCTTCAAGGTGGTGCAAATGATAAAGGTATAGATATTAGATGTGTTTGGGACCTAAAACAGTTCTTGCCTGAAGATTCCCTTGAGCAACAGGCTTCAATAGCCAAGTTAGAGAAGCAGTACCAAATCGGTAACAAAAGGGGGAAGCATATAAAACCTTTACTATTGCGACAAAATCCATCCTTGAAAGTAAAGCTGTTTGCGGTGTTTAAACCCCAGCGCCTGGCGGG

PRB1缺失MS655(SEQ ID NO:59)

GACGGCACGGCCACGCGTTTAAACCGCCTGTTCAATTGAACTGGTGTTTGAACAACGCCTACATCAATAATACCAATCATCGGACGAAAAATATGGAATTAATACTAAAATATCTTATCCCCTCCAGTCTTATAGTTGGTAAGATACCAAATTTGAACATCCTGAACCAGCTGCTGTCATCTCAAGAGGCACACCCTCTGATTGAGCTTTATCGACCACTGATTTCAACCCTCAAAAAGGGTAATGTTTTCGAATTCCACAAATACCTGTTTGATAATGAGTCATACTTTTTAAAGATGAACGTTCTCCTGCCGCTACTTCAACGGTTGCGTATTTTGCTGTTCAGAAATCTGGTCCGAAAGCTGGCCCTTATAGAGCCACCAGTCAACAACTCTCTGAGATTTTCATCCATCAAAACAGCCCTTTTCGTTTCCATTTCACCCAATCAAAACGCATACTTTCAGAACAATTATTCATACCTGATTGTTACCAACGAGTCCCAGATAGACGACTCCTTTGTGGAGAACCTCATGATCAGTCTAATCGATCAAAACCTAATTAAGGGTAAACTCGTCAACGATAACCACCGAATAATTGTCTCCAAGGCCGATACATTCCCGGAGATCCCTACGATTTATTCGACTAAGTTTGCCGTAGACTCGTCATTCGATTGGCTGGACCAATAGACGTCCTTTTTTTTTTTTTTATCGTGTCTGCCGTTTAATGTCACGCCTCATGTTTCAAGTTACGATAACTTATCATGCAGATACTAAATAGTCACATGACGAATGACGATTTTTTGCGGGTTGCTCAGAGGAATATGCCTCTGATAAGCGAGGTAAATGTCGAGCATAAGCCACTTACTGTATAAATACCCCTTTATCGCCACTTTATCTTTTCTCCTTGTCCGTTATCTACAACACCCCAGTAAAACATTACAAACACTCTAGTGTTGTTTTACTGTCCCTTTTAACTCTCTTCAAACAAATCTCCATATTATTTAAACTCGCTCGTCCAACGCCGGCGGACCTATTGGAGAAAAGGAATACACAAGGAGTTAAAAAAAGTGTGGTAGAAAGTGCATTTGTCATAATTTTCCATATGTTGCTGTCACTGTAATCTTTTATATTTTGTTTTGTTTTATGTAGTATTTCAAAAGGTTCTTATCATCTTACTGGCATAAACTTGATGTACGCAGAGATAGCAACCGTTGCTTAGGTAAGCATAGTAAAAATGGCTGGTTTTCTGTCTTATTTTAAGGCCACTGTTGGGACAAAACACAATAACTAGATTTTATCGGATTGAACAGTGTAAAGGCTTCACTGGCTTATATCTTGTATGAGTACGATACATTATCCAGTTCCATCAAGGCCTGTGGAAATATTACAGCCAGGACATGAACCTGAAAGGGAGTTTAGTGGGATCACTGTAGATAATAGGAACAGACTTAATGAAGAAAAGTATTATCAGACGAAAATAGACGAAGCGTTGAAAAGGGGCACAGAAAGACGTTACGTTGATGATCATAGCAGAGGTCATGAGTCTCCAAGTTCAGATTTGGAGGACACTCCGGATCAATTCTTGGAATTTCACATTCATGATAACGGAGATAGGAAGATTTCAAGGCCAGACACTGCTTCGTCATTGATTAGTGAAAACGACATGGACTACGATGATTTGTTTGTTGACAGAAAGCAACCAAAACATGCTACTTCTCATGTAAAGCAGTTTATTAGGAAGAATGTGTTCCAAAAGAAGACTCATCTACCAAACATTGGGGCTAGAGAACTGGAATTACAGAAACGGCTTGCTTTATTAGAGGGCCCAATAGATGACGATGAGATTATTAGTGCTATGCCCATGGTAGCGTGTCCCTCTGACTATAACGATCAACCTGCTGATTCAAATTCAACGGTGTTTAAACCCCAGCGCCTGGCGGG

AOX1缺失MS530(SEQ ID NO:60)

GACGGCACGGCCACGCGTTTAAACCGCCAGATCTAACATCCAAAGACGAAAGGTTGAATGAAACCTTTTTGCCATCCGACATCCACAGGTCCATTCTCACACATAAGTGCCAAACGCAACAGGAGGGGATACACTAGCAGCAGACCGTTGCAAACGCAGGACCTCCACTCCTCTTCTCCTCAACACCCACTTTTGCCATCGAAAAACCAGCCCAGTTATTGGGCTTGATTGGAGCTCGCTCATTCCAATTCCTTCTATTAGGCTACTAACACCATGACTTTATTAGCCTGTCTATCCTGGCCCCCCTGGCGAGGTTCATGTTTGTTTATTTCCGAATGCAACAAGCTCCGCATTACACCCGAACATCACTCCAGATGAGGGCTTTCTGAGTGTGGGGTCAAATAGTTTCATGTTCCCCAAATGGCCCAAAACTGACAGTCTCAACGCTGTCTTGGAACCTAATATGACAAAAGCGTGATCTCATCCAAGATGAACTAAGTTTGGTTCGTTGAAATGCTAACGGCCAGTTGGTCAAAAAGAAACTTCCAAAAGTCGGCATACCGTTTGTCTTGTTTGGTATTGATTGACGAATGCTCAAAAATAATCTCATTAATGCTTAGCGCAGTCTCTCTATCGCTTCTGAACCCCGGTGCACCTGTGCCGAAACGCAAATGGGGAAACACCCGCTTTTTGGATGATTATGCATTGTCTCCACATTGTATGCTTCCAAGATTCTGGTGGGAATACTGCTGATAGCCTAACGTTCATGATCAAAATTTAACTGTTCTAACCCCTACTTGACAGCAATATATAAACAGAAGGAAGCTGCCCTGTCTTAAACCTTTTTTTTATCATCATTATTAGCTTACTTTCATAATTGCGACTGGTTCCAATTGACAAGCTTTTGATTTTAACGACTTTTAACGACAACTTGAGAAGATCAAAAAACAACTAATTATTCGAAACGCGCTCGTCCAACGCCGGCGGACCTTCAAGAGGATGTCAGAATGCCATTTGCCTGAGAGATGCAGGCTTCATTTTTGATACTTTTTTATTTGTAACCTATATAGTATAGGATTTTTTTTGTCATTTTGTTTCTTCTCGTACGAGCTTGCTCCTGATCAGCCTATCTCGCAGCTGATGAATATCTTGTGGTAGGGGTTTGGGAAAATCATTCGAGTTTGATGTTTTTCTTGGTATTTCCCACTCCTCTTCAGAGTACAGAAGATTAAGTGAGACGTTCGTTTGTGCAAGCTTCAACGATGCCAAAAGGGTATAATAAGCGTCATTTGCAGCATTGTGAAGAAAACTATGTGGCAAGCCAAGCCTGCGAAGAATGTATTTTAAGTTTGACTTTGATGTATTCACTTGATTAAGCCATAATTCTCGAGTATCTATGATTGGAAGTATGGGAATGGTGATACCCGCATTCTTCAGTGTCTTGAGGTCTCCTATCAGATTATGCCCAACTAAAGCAACCGGAGGAGGAGATTTCATGGTAAATTTCTCTGACTTTTGGTCATCAGTAGACTCGAACTGTGAGACTATCTCGGTTATGACAGCAGAAATGTCCTTCTTGGAGACAGTAAATGAAGTCCCACCAATAAAGAAATCCTTGTTATCAGGAACAAACTTCTTGTTTCGAACTTTTTCGGTGCCTTGAACTATAAAATGTAGAGTGGATATGTCGGGTAGGAATGGAGCGGGCAAATGCTTACCTTCTGGACCTTCAAGAGGTATGTAGGGTTTGTAGATACTGATGCCAACTTCAGTGACAACGTTGCTATTTCGTTCAAACCATTCCGAATCCAGAGAAATCAAAGTTGTTTGTCTACTATTGATCCAAGCCAGTGCGGTCTTGAAACTGACAATAGTGTGCTCGTGTTTTGAGGTCATCTTTGTATGAATAAATCTAGTCTTTGATCTAAATAATCTTGACGAGCCAGACGATAATACCAATCTAAACTCTTTAAACGCGGTGTTTAAACCCCAGCGCCTGGCGGG

DNL4缺失MS743(SEQ ID NO:61)

GACGGCACGGCCACGCGTTTAAACCGCCCTCCACCGTCTTGATACTTTCTGAGGTGCACAGACCAGAGGATTGTGCGAACCCTAAATAGTTGTATGAACTCAAATTCAAGCGCTCTGTGACGGTGCCGGAATAATTATAGGTATTGTTGTAATCGTCACTGGTTCTGTCGTAACATTTGATGTACCTACCGGGAACTCCACATATGGGCCTTGCAAAACAGTCATCTAATCTTGTTTTCAAACGACGCGTGTAGAAACTTTCAAAATTGGCATACCATGGAGCAATACCATCTTTCACCATCACATCTCTGAATAGTTCAGGGTGAAACAACTTCCCAAAGAAGTCTCTAATATGGCCTATTATGATCAAAATAAGGTAATTAAGGTATGTTGCAATCAGGATGAAATATGGAGGTTCGTCCTCGATGGGAACTGGAAGCGGCTCGCCAGGGTTATGCTTAGAGACAAAGAGCCATTCTTTACTGGTCAAGGACCCAAATTCTTTCTCGGCCTTCTCTTGTGGTGAATCATTGTCTATGAGAGCATCTGGGATAGTTTTTGACATGATCTTTTTCAGCACGGCTATATAGCAAAAAGCAAAAAAAAAGACCGAATGGAATTATATGGTCTAAAAAAACAAACTGGTGGTAAAATAAAAAAAAAACGACTGGTGGGCGGTTTCAAAGGAGACTAATGATCTTCTATGCCCGCGGAAATAAATAGTACTCCAACGACTGAACTCAGCGGTATTAAAGTTTGTGAATAAAATTACAAGGCTTAGAAAGCTTGGTTGGTCTTTCGGTATCTGTAGATGGTAGAGTTTTGAGAACATTTCATTTCCACAGTAACCAACGAACACGACCCGTGACTTCCGGGGGTTGGCAGATGTTAACGCGCGCGTGGTAGAAGTTTATCTTGGGAGGTGCTAGAGGGTGCTCTTGGCCTTGTTCGCTGGGGGGAAGTGTTTGTAGTTAACGTACAACTCCTCATGACTGGGGATCAGAATTTCAACTTGATTTGCCGCTAATCGCTCGTCCAACGCCGGCGGACCTTAAAAATAATGATTTACATTTAAGAAGTAACAGCACATATATACTGTAAGATTAACTTTGCGTACCCTAAATTTTACTAATAAACTTAACGGGTTGCCATAGCCTTGGTAACCACACGTTTCAATGCCAATTCAGCTTTTCTGAAGTCATCACCGGAAGCATCTTCTAGCTCCAAAGCAGCCAAAGCGTCAGACAAAGCAGACTCGATCTTGTCCTTAGCACTTCTCTTTAGCTTGGAAGACAAAATTGGGTCAGTGATGGTAGACTCAATGGAGGAAACGTAAGCCTCCAACTTCTGTTTGGATTCGTGACGGTTAGCGAAGTCCTCGTCAGCCTTCTTGAACTTGTCAGCATCGTTGATCATCTTTTCGATCTCGGAAGAAGACAATCTACCAATAGAGTTAGAAATAGTGATGTTGGCAGATCTTCCGGTAGACTTCTCGACAGCGGTAACCTTCAAGATACCGTTGGCATCAATCTCAAAGATAGCCTCCAACACTGGCTCACCAGCAGACATAGGAGGAATGTTCTTCAAGTCGAACTCACCCAACAAGGTGTTCTCAGAACAGTTGACACGCTCACCCTGGTAAACTGGGAATTGAACAGTGGTTTGGTGGTCGTCAACAGTGGTGAAAGTTCTTCTCTTGATAGTTGGGACAGTGGTGTTTCTTGGAACAACTGGGGCAAAGACGTTACCTTGCATGGCAACACCCAAAGAAAGAGGGATAACATCCAACAACAACAAGTCCTTGGTCTCTTCAGAGGTAGATTGACCGGTCAAAATAGCACCTTGAACGGCGGCACCGTAAGCGACAGCCTCATCAGGGTTGATGGATTTCTCCAATTGCTTACCATCGAAGAAGTCAGACAACAGCTTTTGGACCTTTGGAATTCTGGTGGAACCACCAACCAAGACGACGTCATCGACCTTGGATTTCTCGATCTTTGAGTCCTTCAAAACTTGTTCAACAGGCTCCAAAGTAGACTTGAACAAATCAGCGTTGCGGTGTTTAAACCCCAGCGCCTGGCGGG

PEP4缺失MS654(SEQ ID NO:62)

GACGGCACGGCCACGCGTTTAAACCGCCCGTATCTAATCTTTCTCGCTCCCCGTACGTTAAGAATGAAATTTCTACTTCCATTATAGAAAATAGTGTATCACTGCCAGCATCTTTTACTCACAAGCAATTAAACAAAGTAACAATGGTCTCTAAGCAATTGGAATCACCACAGGGGACCTTTATCACGTTGAATCTAGTTGAAAATTCAGTGTCCAAGTTCGGTGCAGTACACATACCACAAGGAAAAACCCCATTTGTTGTTGGTAGAGATTCATCTTGTGACTGGTTGATCAAAGAAGAAAGAATTTCCAAAATACACTGCATGATTGCCAAAAAAAGGCATCCTACTGCTAATCCTTCCATATTTGAGTCACCTGCTTTAGGGCTGGAAGATATTTGGTTACTAGATTTTAGTACAAACTCTTGCTTTGTCAATGACATTAAAATAGGCAAGAATCGCAAAACTCAAATATTTCATGGAGATGAGATATGCTTGTTCAAAGATGCCCAGAAAAAAGAGCAACTCGTTTATAGGGTTCATATTGATGATGGAACAGGCCTTTTCCAGGGAGGTGAAAGAACCCAAGCCAATTCTGATGACATTCTGGATATTGATGAGGTTGATGAAAAGTTAAGAGAACTATTGACAAGAGCCTCAAGGAAACGGCATATCACCCCTGCATTGGAAACTCCTGATAAACGTGTAAAAAGAGCTTATTTGAACAGTATTACTGATAACTCTTGATGGACCTTAAAGATGTATAATAGTAGACAGAATTCATAATGGTGAGATTAGGTAATCGTCCGGAATAGGAATAGTGGTTTGGGGCGATTAATCGCACCTGCCTTATATGGTAAGTACCTTGACCGATAAGGTGGCAACTATTTAGAACAAAGCAAGCCACCTTTCTTTATCTGTAACTCTGTCGAAGCAAGCATCTTTACTAGAGAACATCTAAACCATTTTACATTCTAGAGTTCCATTTCTCAATTACTGATAATCAATTTAAAGCGCTCGTCCAACGCCGGCGGACCTGCAAGAATAAAAGTTGCTCAGCTGAACTTATTTGGTTACTTATCAGGTAGTGAAGATGTAGAGAATATATGTTTAGGTATTTTTTTTTAGTTTTTCTCCTATAACTCATCTTCAGTACGTGATTGCTTGTCAGCTACCTTGACAGGGGCGCATAAGTGATATCGTGTACTGCTCAATCAAGATTTGCCTGCTCCATTGATAAGGGTATAAGAGACCCACCTGCTCCTCTTTAAAATTCTCTCTTAACTGTTGTGAAAATCATCTTCGAAGCAAATTCGAGTTTAAATCTATGCGGTTGGTAACTAAAGGTATGTCATGGTGGTATATAGTTTTTCATTTTACCTTTTACTAATCAGTTTTACAGAAGAGGAACGTCTTTCTCAAGATCGAAATAGGACTAAATACTGGAGACGATGGGGTCCTTATTTGGGTGAAAGGCAGTGGGCTACAGTAAGGGAAGACTATTCCGATGATGGAGATGCTTGGTCTGCTTTTCCTTTTGAGCAATCTCATTTGAGAACTTATCGCTGGGGAGAGGATGGACTAGCTGGAGTCTCAGACAATCATCAACTAATTTGTTTCTCAATGGCACTGTGGAATGAGAATGATGATATTTTGAAGGAGCGATTATTTGGGGTCACTGGAGAGGCTGCAAATCATGGAGAGGATGTTAAGGAGCTTTATTATTATCTTGATAATACACCTTCTCACTCTTATATGAAATACCTTTACAAATATCCACAATCGAAATTTCCTTACGAAGAATTGATTTCAGAGAACCGTAAACGTTCCAGATTAGAAAGAGAGTACGAGATTACTGACTCTGAAGTACTGAAGGATAACAGATATTTTGATGTGATCTTTGAAATGGCCGGTGTTTAAACCCCAGCGCCTGGCGGG

PEP4缺失，具有赫塞汀整合MS841(SEQ ID NO:63)

GACGGCACGGCCACGCGTTTAAACCGCCCGTATCTAATCTTTCTCGCTCCCCGTACGTTAAGAATGAAATTTCTACTTCCATTATAGAAAATAGTGTATCACTGCCAGCATCTTTTACTCACAAGCAATTAAACAAAGTAACAATGGTCTCTAAGCAATTGGAATCACCACAGGGGACCTTTATCACGTTGAATCTAGTTGAAAATTCAGTGTCCAAGTTCGGTGCAGTACACATACCACAAGGAAAAACCCCATTTGTTGTTGGTAGAGATTCATCTTGTGACTGGTTGATCAAAGAAGAAAGAATTTCCAAAATACACTGCATGATTGCCAAAAAAAGGCATCCTACTGCTAATCCTTCCATATTTGAGTCACCTGCTTTAGGGCTGGAAGATATTTGGTTACTAGATTTTAGTACAAACTCTTGCTTTGTCAATGACATTAAAATAGGCAAGAATCGCAAAACTCAAATATTTCATGGAGATGAGATATGCTTGTTCAAAGATGCCCAGAAAAAAGAGCAACTCGTTTATAGGGTTCATATTGATGATGGAACAGGCCTTTTCCAGGGAGGTGAAAGAACCCAAGCCAATTCTGATGACATTCTGGATATTGATGAGGTTGATGAAAAGTTAAGAGAACTATTGACAAGAGCCTCAAGGAAACGGCATATCACCCCTGCATTGGAAACTCCTGATAAACGTGTAAAAAGAGCTTATTTGAACAGTATTACTGATAACTCTTGATGGACCTTAAAGATGTATAATAGTAGACAGAATTCATAATGGTGAGATTAGGTAATCGTCCGGAATAGGAATAGTGGTTTGGGGCGATTAATCGCACCTGCCTTATATGGTAAGTACCTTGACCGATAAGGTGGCAACTATTTAGAACAAAGCAAGCCACCTTTCTTTATCTGTAACTCTGTCGAAGCAAGCATCTTTACTAGAGAACATCTAAACCATTTTACATTCTAGAGTTCCATTTCTCAATTACTGATAATCAATTTAAAGCGCTCGTCCAACGCCGGCGGACCTAACAGGAGGGGATACACTAGCAGCAGACCGTTGCAAACGCAGGACCTCCACTCCTCTTCTCCTCAACACCCACTTTTGCCATCGAAAAACCAGCCCAGTTATTGGGCTTGATTGGAGCTCGCTCATTCCAATTCCTTCTATTAGGCTACTAACACCATGACTTTATTAGCCTGTCTATCCTGGCCCCCCTGGCGAGGTTCATGTTTGTTTATTTCCGAATGCAACAAGCTCCGCATTACACCCGAACATCACTCCAGATGAGGGCTTTCTGAGTGTGGGGTCAAATAGTTTCATGTTCCCCAAATGGCCCAAAACTGACAGTTTAAACGCTGTCTTGGAACCTAATATGACAAAAGCGTGATCTCATCCAAGATGAACTAAGTTTGGTTCGTTGAAATGCTAACGGCCAGTTGGTCAAAAAGAAACTTCCAAAAGTCGGCATACCGTTTGTCTTGTTTGGTATTGATTGACGAATGCTCAAAAATAATCTCATTAATGCTTAGCGCAGTCTCTCTATCGCTTCTGAACCCCGGTGCACCTGTGCCGAAACGCAAATGGGGAAACACCCGCTTTTTGGATGATTATGCATTGTCTCCACATTGTATGCTTCCAAGATTCTGGTGGGAATACTGCTGATAGCCTAACGTTCATGATCAAAATTTAACTGTTCTAACCCCTACTTGACAGCAATATATAAACAGAAGGAAGCTGCCCTGTCTTAAACCTTTTTTTTATCATCATTATTAGCTTACTTTCATAATTGCGACTGGTTCCAATTGACAAGCTTTTGATTTTAACGACTTTTAACGACAACTTGAGAAGATCAAAAAACAACTAATTATTCGAAACGATGAGATTCCCATCCATCTTCACTGCTGTTTTGTTCGCTGCTTCTTCTGCTTTGGCTGAGGTTCAGTTGGTTGAATCTGGAGGAGGATTGGTTCAACCTGGTGGTTCTTTGAGATTGTCCTGTGCTGCTTCCGGTTTCAACATCAAGGACACTTACATCCACTGGGTTAGACAAGCTCCAGGAAAGGGATTGGAGTGGGTTGCTAGAATCTACCCAACTAACGGTTACACAAGATACGCTGACTCCGTTAAGGGAAGATTCACTATCTCTGCTGACACTTCCAAGAACACTGCTTACTTGCAGATGAACTCCTTGAGAGCTGAGGATACTGCTGTTTACTACTGTTCCAGATGGGGTGGTGATGGTTTCTACGCTATGGACTACTGGGGTCAAGGAACTTTGGTTACTGTTTCCTCCGCTTCTACTAAGGGACCATCTGTTTTCCCATTGGCTCCATCTTCTAAGTCTACTTCCGGTGGTACTGCTGCTTTGGGATGTTTGGTTAAAGACTACTTCCCAGAGCCAGTTACTGTTTCTTGGAACTCCGGTGCTTTGACTTCTGGTGTTCACACTTTCCCAGCTGTTTTGCAATCTTCCGGTTTGTACTCTTTGTCCTCCGTTGTTACTGTTCCATCCTCTTCCTTGGGTACTCAGACTTACATCTGTAACGTTAACCACAAGCCATCCAACACTAAGGTTGACAAGAAGGTTGAGCCAAAGTCCTGTGACAAGACTCATACTTGTCCACCATGTCCAGCTCCAGAATTGTTGGGTGGTCCTTCCGTTTTTTTGTTCCCACCAAAGCCAAAGGACACTTTGATGATCTCCAGAACTCCAGAGGTTACATGTGTTGTTGTTGACGTTTCTCACGAGGACCCAGAGGTTAAGTTCAACTGGTACGTTGACGGTGTTGAAGTTCACAACGCTAAGACTAAGCCAAGAGAGGAGCAGTACAACTCCACTTACAGAGTTGTTTCCGTTTTGACTGTTTTGCACCAGGATTGGTTGAACGGAAAGGAGTACAAGTGTAAGGTTTCCAACAAGGCTTTGCCAGCTCCAATCGAAAAGACTATCTCCAAGGCTAAGGGTCAACCAAGAGAGCCACAGGTTTACACTTTGCCACCATCCAGAGATGAGTTGACTAAGAACCAGGTTTCCTTGACTTGTTTGGTTAAGGGATTCTACCCATCCGACATTGCTGTTGAATGGGAGTCTAACGGTCAACCAGAGAACAACTACAAGACTACTCCACCTGTTTTGGACTCTGACGGTTCCTTTTTCTTGTACTCCAAGTTGACTGTTGACAAGTCCAGATGGCAACAGGGTAACGTTTTCTCCTGTTCCGTTATGCATGAGGCTTTGCACAACCACTACACTCAAAAGTCCTTGTCTTTGTCCCCTGGTAAGTAGACGCACGCACACTCCCGACAGACAACTAGCTTGATAACAGGCCCCTTTTCCTTTGTCGATATCATGTAATTAGTTATGTCACGCTTACATTCACGCCCTCCCCCCACATCCGCTCTAACCGAAAAGGAAGGAGTTAGACAACCTGAAGTCTAGGTCCCTATTTATTTTTTTATAGTTATGTTAGTATTAAGAACGTTATTTATATTTCAAATTTTTCTTTTTTTTCTGTACAAACGCGTGTACGCAATCCCCGCGTGCTTGGCCGGCCGTAAGATTATTACTTGCTATAAGTGCGTGCCTGATGAACAGGATATTGCGGTCAATAATGCTGATGGTTCATTAGACTTCAGCAAAGCCGATGCCAAAATAAGCCAATACGATCTCAACGCTATTGAAGCGGCTTGCCAGCTAAAGCAACAGGCAGCAGAGGCGCAGGTGACAGCCTTAAGTGTGGGCGGTAAAGCCCTGACCAACGCCAAAGGGCGTAAAGATGTGCTATCGCGCGGCCCGGATGAACTGATTGTGGTGATTGATGACCAGTTCGAGCAGGCACTGCCGCAACAAACGGCGAGCGCACTGGCTGCAGCCGCCCAGAAAGCAGGCTTTGATCTGATCCTCTGTGGCGATGGTTCTTCCGACCTTTATGCCCAGCAGGTTGGTCTGCTGGTGGGCGAAATCCTCAATATTCCGGCAGTTAACGGCGTCAGCAAAATTATCTCCCTGACGGCAGATACCCTCACCGTTGAGCGCGAACTGGAAGATGAAACCGAAACCTTAAGCATTCCGCTGCCTGCGGTTGTTGCTGTTTCCACTGATATCAACTCCCCACAAATTCCTTCGATGAAAGCCATTCTCGGCGCGGCGAAAAAGCCCGTCCAGGTATGGTCGGCGGCGGATATTGGTTTTAACGCAGAGGCAGCCTGGTCAGAACAACAGGTTGCCGCGCCGAAACAGCGCGAACGTCAGCGCAACGGCCGGCCAAGCACGCGGGGATTGCGTACACGCGTTTGTACAGAAAAAAAAGAAAAATTTGAAATATAAATAACGTTCTTAATACTAACATAACTATAAAAAAATAAATAGGGACCTAGACTTCAGGTTGTCTAACTCCTTCCTTTTCGGTTAGAGCGGATGTGGGGGGAGGGCGTGAATGTAAGCGTGACATAACTAATTACATGATATCGACAAAGGAAAAGGGGCCTGTTATCAAGCTAGTTGTCTGTCGGGAGTGTGCGTGCGTCTAACACTCTCCTCTGTTGAAGGACTTAGTAACTGGGGAGGACAAACCCTGATGTGTAACCTCACAAGCGTAAACCTTGTGCTTCTCGTAATCAGCCTTGGACAAAGTCAAAGTGGAGGACAAGGAGTAAGTGGAGTCCTTAGAGTCTTGCTCAGTAACGGATTCTTGGGAGTTACCGGATTGCAAAGCGTTGTCAACCTTCCACTGAACCTTAGCCTCTCTTGGGTAGAAGTTGTTCAACAAACAAACAACGGAAGCTGTACCAGACTTCAACTGTTCGTCGGATGGTGGGAAAATGAAAACGGATGGAGCAGCAACAGTTCTCTTGATCTCAACCTTAGTACCCTGTCCGAAAGTTGGTGGAGTAGTGTAGTGCTGCTGACAGTAGTAAGTAGCGAAATCTTCTGGTTGCAAGGAGGAGATAGTCAAAGTGAAGTCAGTACCGGATCTGGAACCAGAGAATCTGGATGGAACACCAGAGTACAAGAAGGAAGCGGAGTAGATCAACAACTTTGGAGCCTTTCCTGGCTTCTGTTGATACCAAGCAACAGCAGTATTAACGTCCTGGGAAGCTCTACAAGTGATAGTAACTCTGTCACCAACGGAAGCAGACAAAGAAGATGGGGATTGAGTCATTTGGATGTCAGCCAAAGCAGAAGAAGCAGCGAACAAAACAGCAGTGAAGATGGATGGGAATCTCATCGTTTCGAATAATTAGTTGTTTTTTGATCTTCTCAAGTTGTCGTTAAAAGTCGTTAAAATCAAAAGCTTGTCAATTGGAACCAGTCGCAATTATGAAAGTAAGCTAATAATGATGATAAAAAAAAGGTTTAAGACAGGGCAGCTTCCTTCTGTTTATATATTGCTGTCAAGTAGGGGTTAGAACAGTTAAATTTTGATCATGAACGTTAGGCTATCAGCAGTATTCCCACCAGAATCTTGGAAGCATACAATGTGGAGACAATGCATAATCATCCAAAAAGCGGGTGTTTCCCCATTTGCGTTTCGGCACAGGTGCACCGGGGTTCAGAAGCGATAGAGAGACTGCGCTAAGCATTAATGAGATTATTTTTGAGCATTCGTCAATCAATACCAAACAAGACAAACGGTATGCCGACTTTTGGAAGTTTCTTTTTGACCAACTGGCCGTTAGCATTTCAACGAACCAAACTTAGTTCATCTTGGATGAGATCACGCTTTTGTCATATTAGGTTCCAAGACAGCGTTTAAACTGTCAGTTTTGGGCCATTTGGGGAACATGAAACTATTTGACCCCACACTCAGAAAGCCCTCATCTGGAGTGATGTTCGGGTGTAATGCGGAGCTTGTTGCATTCGGAAATAAACAAACATGAACCTCGCCAGGGGGGCCAGGATAGACAGGCTAATAAAGTCATGGTGTTAGTAGCCTAATAGAAGGAATTGGAATGAGCGAGCTCCAATCAAGCCCAATAACTGGGCTGGTTTTTCGATGGCAAAAGTGGGTGTTGAGGAGAAGAGGAGTGGAGGTCCTGCGTTTGCAACGGTCTGCTGCTAGTGTATCCCCTCCTGTTAGGTCCGCCGGCGTTGGACGAGCGGCAAGAATAAAAGTTGCTCAGCTGAACTTATTTGGTTACTTATCAGGTAGTGAAGATGTAGAGAATATATGTTTAGGTATTTTTTTTTAGTTTTTCTCCTATAACTCATCTTCAGTACGTGATTGCTTGTCAGCTACCTTGACAGGGGCGCATAAGTGATATCGTGTACTGCTCAATCAAGATTTGCCTGCTCCATTGATAAGGGTATAAGAGACCCACCTGCTCCTCTTTAAAATTCTCTCTTAACTGTTGTGAAAATCATCTTCGAAGCAAATTCGAGTTTAAATCTATGCGGTTGGTAACTAAAGGTATGTCATGGTGGTATATAGTTTTTCATTTTACCTTTTACTAATCAGTTTTACAGAAGAGGAACGTCTTTCTCAAGATCGAAATAGGACTAAATACTGGAGACGATGGGGTCCTTATTTGGGTGAAAGGCAGTGGGCTACAGTAAGGGAAGACTATTCCGATGATGGAGATGCTTGGTCTGCTTTTCCTTTTGAGCAATCTCATTTGAGAACTTATCGCTGGGGAGAGGATGGACTAGCTGGAGTCTCAGACAATCATCAACTAATTTGTTTCTCAATGGCACTGTGGAATGAGAATGATGATATTTTGAAGGAGCGATTATTTGGGGTCACTGGAGAGGCTGCAAATCATGGAGAGGATGTTAAGGAGCTTTATTATTATCTTGATAATACACCTTCTCACTCTTATATGAAATACCTTTACAAATATCCACAATCGAAATTTCCTTACGAAGAATTGATTTCAGAGAACCGTAAACGTTCCAGATTAGAAAGAGAGTACGAGATTACTGACTCTGAAGTACTGAAGGATAACAGATATTTTGATGTGATCTTTGAAATGGCGGCGGTTTAAACGCGTGGCCGTGCCGTC

pTDH3>VTH1MS637(SEQ ID NO:64)

GACGGCACGGCCACGCGTTTAAACCGCCACCGTCAATATGAAGAATAACACTAACCAGTATTTTGAAAAGAAGAAAGCCATTAATGAAATCGTCAAATCAATTCATTCCAATTTGGAAGCTTCTTTATTTAGTTCACTAAAACGCTCAGATATGGCATCTCAAACTCTCCCCTATGTTTATCATATCATACTGCCTAACTTCAAAAACATGGCCAGATTAATCAGCCTGAAACCTGAAGAAAAGATCAAACTTACGGAAGCTGCAAAAGTTCTTAAAGAGTTTGGCTTCACGATTGAGCAAGCAAAAGATGAAACTTTCACTTACATTCAAAAACTAGTTCCGCCAATTGATACCGTAGTCAATTGTCAGAACGAATTATCGCATCAAAAGTCACTTTGCGCACGAGCTAATCAGATTCTCCCATACATTGAGATTGAGTTGAAAAGGTTGAACATCACCAAGAGACACCTAACCGATTCTGAGCAAGACTTCAAGAAACTACAAGGTACTTCAAAGAGAAGAATCACAGGGTTGACCTCCCCTAGTAATCGACAGTCGCGTGCCGCATCTCTTCAGGAGGGGGGGCAGACTCAAAATCAGCTGGGTACCTCTATAGATTTTTTCGCCAAATCGCTTTCCCGAGATGGAAGCTCAGGCAGAACGACACCTGCACCTCAGACGAACTCTCAGAGAGGCACCACCGGACGTATTTGGGTCCGTTATAACGAAGGGTTCTCAAATGCAGTTCGTAGAAACATCACATGGGAAGAGCTGTGGAATTTTTAAATGTCCTCCATAATTTCATGCGGACCTTGCATAGTTTATATAATCATACTGTACCAACCAACATCCACACAAGGAGTTTTCGGCCTCAACATATTATCGAAACCATCTCCCTGTCCCTTACTCAGATCCTATTTTTTCTTACTCAATTGAACGCTCGTCCAACGCCGGCGGACCTCCTTAACTACGTTAGGTCAGTGATGACAATGGACCAAATTGTTGCAAGGTTTTTCTTTTTCTTTCATCGGCACATTTCAGCCTCACATGCGACTATTATCGATCAATGAAATCCATCAAGATTGAAATCTTAAAATTGCCCCTTTCACTTGACAGGATCCTTTTTTGTAGAAATGTCTTGGTGTCCTCGTCCAATCAGGTAGCCATCTCTGAAATATCTGGCTCCGTTGCAACTCCGAACGACCTGCTGGCAACGTAAAATTCTCCGGGGTAAAACTTAAATGTGGAGTAATGGAACCAGAAACGTCTCTTCCCTTCTCTCTCCTTCCACCGCCCGTTACCGTCCCTAGGAAATTTTACTCTGCTGGAGAGCTTCTTCTACGGCCCCCTTGCAGCAATGCTCTTCCCAGCATTACGTTGCGGGTAAAACGGAGGTCGTGTACCCGACCTAGCAGCCCAGGGATGGAAAAGTCCCGGCCGTCGCTGGCAATAATAGCGGGCGGACGCATGTCATGAGATTATTGGAAACCACCAGAATCGAATATAAAAGGCGAACACCTTTCCCAATTTTGGTTTCTCCTGACCCAAAGACTTTAAATTTAATTTATTTGTCCCTATTTCAATACCTCCCGCGACCTCCAAAATCGAACTACCTTCACAATGAGGACATTGACATTGTTGGTCTACTTCGTAGTGGCTGCCTTAGCTTTCACCCCGCAGACCAACTCCAGAATTTTTAAAGGTTACCCAAAGAAAGTGGTTTATTTTGACGACACTGCCAGCGTTGTCTACCATGATGGCTCTGACAATGAGATCTATTATTCCAAAGATGATGGTGTCACTTGGACTCAACTAGATCTTGGTGGGGCGTCCGCTCATCAAGTAATTGTTCACCCTTTTGACCCTTCTACTGCCTATATTTTGACCACTAGTGAAACTCACTTCGTCACCACAGATAGCGGATTTACTTGGAATAAGGTTTCCTCTCCAGAGCCTCCAGTAACCAACGAGTTTCCAACGTTGAGCCAAGAGTCCTCCTCATTGACCCTGAATTCCAAGAACTTTGAGTATGTTCTGTTTGCAGGCCAATGTACAGACGGATCAGAAATTTGCAACAGAAAGTACTACTATTCCTTGGATAACATGAGAACTTTCAACGAGCTCATTGAAGCTCACAGCTGTTTGTTTGTCGATACTGCCGATGCCATTGCGGGTGATCATTCCCCAAACGCTGTTATCTGTGCCATCACCAACCCTGACGGAAAACTGTCTTTGGTGAAAACCGCCAACTTCTTCAAAGACGGCATAGACTATGTCTCTAGTGGTGGTGGTCTTATTGAGAATCCTGAACTGCTGGGCGCCTCACACAACTACATCTTGGCTGTTGGTTCTCATCTTTTGCACAACAAAGACAAGTTTGTATACATCTCATTTGATGGTTCGAACTTCAACAAAGTGACGGTGTTTAAACCCCAGCGCCTGGCGGG

pTDH3>CNE1,MS628(SEQ ID NO:65)

GACGGCACGGCCACGCGTTTAAACCGCCTCTCTGCTCTTCAAGAAGTAAAACGCTGGGCGGCAAAGAAGGAAAAGTCCAATAAAAGTATCTGTAAGAGGTGGAAGTGCTCAGATAGTGCGAAGAGAGGAATAAATGAATGCAAGAGCGCGATGGAGTGTAGCGTGATTACATCATCAGATGCTACATTGATTCTCTGATATGAATGGTGATGGAACTTTCTAGAGGTTCCTTGAAGAAATAAATACATTTACAAGCAGAACTCCACTTTTTCACGGAGAATCATCTAAGTTAGGCATACGAAGGATCTCGCCTTCGTTGTTTGCACTCATCTCCTGTAGTTTAGCGAGAATCTTGGAGTCCTTCCACTTTTCAGGCAATGGGGTAACCTCGTAGTTTTTCACGGCCCAGTAATAAATATCCCAATCCAACTCGTTTAATAAGTCATCATACTCTTCCATCTCTTCCACACTCATTGTCGGTAGATAGCGTTTTGCGAAACGAGACAGAAGAAGGTCTGTTTCCAAGATTCCTCTCTTTCTTGACTGATAAACCAGACGGCGTCTCTTGACATCTTCCGACTCGTTATCACGTTTCAGAGGTTCAACTTTCAGTATCAGCTCCTGCCTCAAGAAGGGGAGAGAATGAAAAGATTTCGAAAACACCCTTGGACAAGTCTTGCTACCTTGAAACTGAGTTCTTTGGAAAAGCCGGAGCATAATGGGTGAATTAAGCAGAAAGAAGGTAACTGATTTGCTGAGACCCAAATCATCTACAGTTTCGCGAAGCATAAAGTTCACACTGATTTTCTGGGGAAGAACTGGTAAACCACATGTTGTCTCCATTCCACGATAAACCGTTCAAGCAAGGCCGTCTTAGAATGCACAAGACAATTTAGGTAAACTACCTTTCCTGGAAGCGAAAGCAGACGTTACAATCTGTTTCATCCCCCAACTGCACTCCTCTCTCCTCTGCTAGCCAAGACGATCTTTCATAGAATTTGATGGAATTTACGCGAAATCGCCACGTAATCATATTTCGAACAGCGCTCGTCCAACGCCGGCGGACCTCCTTAACTACGTTAGGTCAGTGATGACAATGGACCAAATTGTTGCAAGGTTTTTCTTTTTCTTTCATCGGCACATTTCAGCCTCACATGCGACTATTATCGATCAATGAAATCCATCAAGATTGAAATCTTAAAATTGCCCCTTTCACTTGACAGGATCCTTTTTTGTAGAAATGTCTTGGTGTCCTCGTCCAATCAGGTAGCCATCTCTGAAATATCTGGCTCCGTTGCAACTCCGAACGACCTGCTGGCAACGTAAAATTCTCCGGGGTAAAACTTAAATGTGGAGTAATGGAACCAGAAACGTCTCTTCCCTTCTCTCTCCTTCCACCGCCCGTTACCGTCCCTAGGAAATTTTACTCTGCTGGAGAGCTTCTTCTACGGCCCCCTTGCAGCAATGCTCTTCCCAGCATTACGTTGCGGGTAAAACGGAGGTCGTGTACCCGACCTAGCAGCCCAGGGATGGAAAAGTCCCGGCCGTCGCTGGCAATAATAGCGGGCGGACGCATGTCATGAGATTATTGGAAACCACCAGAATCGAATATAAAAGGCGAACACCTTTCCCAATTTTGGTTTCTCCTGACCCAAAGACTTTAAATTTAATTTATTTGTCCCTATTTCAATACCTCCCGCGACCTCCAAAATCGAACTACCTTCACAATGAAGATCTCTACCATTGCAAGTTCTACGTTGTTCGCTGTTGGTGCTTTAGCCGAATCCGAACCCGCTGAGTTCAGACCCTTGGAAGCTCAGTTGGACAAGTCATCTTTCTTTGAACAATTCGACAAGGAACCGAAACTCGGCGACACCTGGAAGATCTCCCATGCCGTTAAGAATGAAGAATTCACTTATGTTGGAGAATGGGCCATTGAGGAACCTGTTGTCTATCCTGGATTCAAGAAGGACAGGGGTCTGGTTGTGAAATCTGAGGCAGCTCACCACGCAATATCTGCCCAATTACCACAGGTATTTGACAACACTGACAATACGTTGGTCTTGCAATACGAAGTCAAGCTTCAACAAGGATTGAACTGTGGAGGTGCTTATGTTAAATTATTGAGTGCTGAGGGTCTGAACAAGAATGAGTTCTCTAACGAGACCCCTTATCAAGTCATGTTTGGTCCTGATAAATGTGGAACCACGAATAAAGTGCACTTGATTATTAAGAGGAAGAACCCAGCCACCGGCGAATATGAGGAACATCAATTGGCTACTCCTCCAATGGGTAGAATCGTCAAGACTACTTCTCTATACACCCTGATTATCAAGCCCAATAATGACTTTGAAATCAGAATCAACGGTGAGGTTGCTAAAGCTGGTAACTTGTTGAACGAGAAGTTGATAAAGCCACCATTTGGCGCTCCGAAGGAGATTGACGATCCGGAAGACCAAAAACCCGAAGATTGGGTTGATGAAGACATGATCCCAGATCCAGATGCTGTCAAGCCTGAAGATTGGGACGAGTCCGAGCCATTGCGAATCGTCGATCCGGAAGCTGTGAAACCAGAAAACTGGAACGAAGATGCTGAATTGTACATCCCTGATCCAGAGGCCACCAAGCCCGAAGACTGGGACGATGAAGAGGATGGCGAATGGGTTGCTCCTGTTATTCCAAATCCAGAATGCGCAGATATTGGATGTGGCCCTTGCGGTGTTTAAACCCCAGCGCCTGGCGGG

pTDH3>ECM10,MS766(SEQ ID NO:66)

GACGGCACGGCCACGCGTTTAAACCGCCGATTGTCTTCAAACATTTACACTGAGTGTTGGAACCATTAAGTTGCCATATTTGAGCCGTCGAATCTTTGGCGACGGTGACAAATATCAGTTCATCAACTGTATCCCAAGCAATGCAATAGACTGGCTTGTTAGAGGTTGTATTGATCTGCAATAAAGAGTCCCATACATTTTCCTTGAACCTTTTCCATATGCAGAGGGTTTTATCAGATCTTGAATACGCCAATCTATTTCCCTTGTTGAATTCTAAAGTGATGATATCAGTGCTAGTTCGGTGATTTTCTAAAGAGCCATCATTCAACTCCGTTGATTTCAGATCAGTAAAAAGCTGCTTGTCCCTAGCTAGTGAAGGGTTGGTCATTATAGAGGCCTTCAAACAATACTTTTCAAAATAGACACGCCGCGCGAATCCTCACGATAGCGAAATACCAACTCCACAGATGTTACCACGTAACATTTCTCCTCTGATCAAATGGCTCCTCAAACACCAAGGCAACGTATCGCAAACGAAAAATTCGTAAAGAGAGCTGAAGCTCAGCAGGGTAAGGTGAAGAAGGCTAGATCCAAGCGTGAATTTCCAGTTTCGACTAAGTGGGTTATCATATTGCTCTTCTTGCTGATTGGGGGAGGGGTCCTGGAGATTTTGAGATTGTTTTTTTGAATGATCTTTTCAAAGGTCTAGGTCTTTTTGGAAGGAAATGGTTATACTTTGGCCTTTCATTATTTGAGAGGATAGTCGTATTTTTCTACCGGGAGAAGGTAGGCATAACGTTAATTGCGAATTTTCACTTACTTTAGATGGGTACTGATCTTCAACTCACGATAATTTCATTGCACCATGTATCTCTAAACTGGCGTGTCGGAACTCACACACCATTGGAACTTATTGATTAACCAATACATAGATTAATTGACTCGCCTGATAATACTAATCACCGTTCACTACTTCTCTTAGTATCTTCTCCTACTGGAGTCGTTCTACGCTCGTCCAACGCCGGCGGACCTCCTTAACTACGTTAGGTCAGTGATGACAATGGACCAAATTGTTGCAAGGTTTTTCTTTTTCTTTCATCGGCACATTTCAGCCTCACATGCGACTATTATCGATCAATGAAATCCATCAAGATTGAAATCTTAAAATTGCCCCTTTCACTTGACAGGATCCTTTTTTGTAGAAATGTCTTGGTGTCCTCGTCCAATCAGGTAGCCATCTCTGAAATATCTGGCTCCGTTGCAACTCCGAACGACCTGCTGGCAACGTAAAATTCTCCGGGGTAAAACTTAAATGTGGAGTAATGGAACCAGAAACGTCTCTTCCCTTCTCTCTCCTTCCACCGCCCGTTACCGTCCCTAGGAAATTTTACTCTGCTGGAGAGCTTCTTCTACGGCCCCCTTGCAGCAATGCTCTTCCCAGCATTACGTTGCGGGTAAAACGGAGGTCGTGTACCCGACCTAGCAGCCCAGGGATGGAAAAGTCCCGGCCGTCGCTGGCAATAATAGCGGGCGGACGCATGTCATGAGATTATTGGAAACCACCAGAATCGAATATAAAAGGCGAACACCTTTCCCAATTTTGGTTTCTCCTGACCCAAAGACTTTAAATTTAATTTATTTGTCCCTATTTCAATACCTCCCGCGACCTCCAAAATCGAACTACCTTCACAATGTTGTCATCAAGATGGTGTTCATGTAAAAAGCAGAGTCCAAGTCGACAAGTAGGTCAGTTACTGCGCTACATGTCTAGCAAGGTAATTGGAATTGATTTAGGAACTACGAACTCTGCTGTTGCCGTTTTTGAAGGAAAAGAACCAAAAATCCTGGAGAACGAAGAGGGAAAGAGAACGACACCTTCTATTGTTGCATTTACCCCAGAAACTGTGCTAGTAGGAGAACCAGCAAAGAGACAATCTATTCTGAACTATCAGAACACTTTTTATGCTACAAAAAGGCTCATTGGTCGCAAGTATTCGGATCCTGAAGTTCAACGGGATATTTCCAACGTTCCTTACAGTATAATTGAACATGAAAATGGGGATGCGTGGCTTCAAAACATGCACTCAGGTCAAAAATACTCCCCCTCTCAAATTGGTAGTTTGATATTGGGAAAGATGAAAGAGATTGCAGAGCTAAATCTTTCCCAGTCTATTAGCCAGGCTGTGGTCACTGTGCCTGCCTACTTCAACGATTCGCAAAGACAAGCAACTAAGATTGCTGGTGATTTAGTGGGTCTTAAAGTTTTAAGAGTTATCAATGAGCCCACCGCTGCTTCTTTGGCTTACGGATTGAATAGAAAAAATGACGGGATAATTGCCGTTTACGACCTTGGTGGTGGAACTTTTGATATCTCCATATTGGATATCGAAGCCGGCGTCTTTGAAGTTATTGCGACGAATGGTGACACACATCTTGGAGGGGAAGATTTTGACCATTTGCTGGTGGACTACATATTGCAACAGTTTCAATCGCAGACAGGACAAGATCTATCTACTGACCGTTTGGCCCTGCAAAGAATTCGTCAGGCTGCTGAAAACGGTGTTTAAACCCCAGCGCCTGGCGGG

pTDH3>ERO1,MS632(SEQ ID NO:67)

GACGGCACGGCCACGCGTTTAAACCGCCAGAATCACAAAATTCTTTTCATCTTCAGACATGTATATCTGGCTCAGAGATTTGAAGGGAATCTGAAACCTGGTTTTAGACGGAAGGTCAACTATGAGGTACAGGCTGTTAGGCCATATGCTTAAAAAAGGAACAGGTAAGGATATGTTTTTATTGATGATGGAGATGTGGTGCAAGTGAATCCTGAGAACCTCTTTTTTCTTTTCAAACGCATTTTTGTCTTCAATTCCATTCTTCGATCTTTTAACGATGGGAGCGCTTATTTTGTCTATGATGTGGCTTTGAAGATCAGCTGTTGTATTCAAACTATCACTTTGAGTCAACGAGTTCTTAGGTAGTCTTTGAAACCGTGAAAGGGAACCCATTTTCTTCGAACCCAGGGATTTCACTGATCCTCTGGCCATTGACGCCGATCGTGAGTTCTGTAGAGTTCCCTTCGTCTTAAGAGAGAGGGGGAATAATTAAAGATCAAGTAATGTTCTACCTACAAAAGATAAAGATGACCTTAATGTTTTTAGCGAGGTATAGCTGGGAGTCCCAAAGAAGTAGCTAGGGCGGTGAGAGGATTTTTTTCTCGTGCGCATATAATCGCTAGCCTAGTTAAAGCATCTTGACGACGTACTAATATCTGGAAGACTTCAGAGCACAGAAACTATGCCTGGTGAGTTCATGGTGACCGTATTGAGCACATCCAAAAAGATCTTATTCTCTCCAGTACAATCAGCAGAAGGCCTTATCCATCTTGCTGTTCCACTACCTCATTCCAGTATACTTCTAATCATCGCCTCTAGATAAGCCAGACGATCTCAAGAACCACCCTCATCTTGAAACGTGGACTCGAGTCGCAATGTCCTGTATCATTCCTACGTCACAAGCCATCACTGGGTTCTCTCGCCCCCCTACGAAACGCTAGCTATTGCTATATGGAACAATCTAGACCGTAAGTTAGGGCCACTCTGTTCATTTCTCGTCTTAGTCAGCTGATCCTCGAAACGATCTACGCTCGTCCAACGCCGGCGGACCTCCTTAACTACGTTAGGTCAGTGATGACAATGGACCAAATTGTTGCAAGGTTTTTCTTTTTCTTTCATCGGCACATTTCAGCCTCACATGCGACTATTATCGATCAATGAAATCCATCAAGATTGAAATCTTAAAATTGCCCCTTTCACTTGACAGGATCCTTTTTTGTAGAAATGTCTTGGTGTCCTCGTCCAATCAGGTAGCCATCTCTGAAATATCTGGCTCCGTTGCAACTCCGAACGACCTGCTGGCAACGTAAAATTCTCCGGGGTAAAACTTAAATGTGGAGTAATGGAACCAGAAACGTCTCTTCCCTTCTCTCTCCTTCCACCGCCCGTTACCGTCCCTAGGAAATTTTACTCTGCTGGAGAGCTTCTTCTACGGCCCCCTTGCAGCAATGCTCTTCCCAGCATTACGTTGCGGGTAAAACGGAGGTCGTGTACCCGACCTAGCAGCCCAGGGATGGAAAAGTCCCGGCCGTCGCTGGCAATAATAGCGGGCGGACGCATGTCATGAGATTATTGGAAACCACCAGAATCGAATATAAAAGGCGAACACCTTTCCCAATTTTGGTTTCTCCTGACCCAAAGACTTTAAATTTAATTTATTTGTCCCTATTTCAATACCTCCCGCGACCTCCAAAATCGAACTACCTTCACAATGAGGATAGTAAGGAGCGTAGCTATCGCAATAGCCTGTCATTGTATAACAGCGTTAGCAAACCCTCAAATCCCTTTTGACGGCAACTACACCGAGATCATCGTGCCAGATACCGAAGTTAACATCGGACAGATTGTAGATATTAACCACGAAATAAAACCCAAACTGGTGGAACTGGTCAACACAGACTTCTTCAAATATTACAAATTAAACCTATGGAAACCATGTCCGTTTTGGAATGGTGATGAGGGATTCTGCAAGTATAAGGATTGCTCTGTCGACTTTATCACTGATTGGTCTCAGGTGCCTGATATCTGGCAACCAGACCAATTGGGTAAGCTTGGAGATAACACGGTACATAAGGATAAGGGCCAAGATGAAAATGAGCTGTCCTCAAATGATTATTGCGCTTTGGATAAAGACGACGATGAAGATTTAGTATATGTCAATTTGATTGATAACCCTGAAAGATTCACCGGTTATGGTGGTCAGCAATCTGAATCTATTTGGACTGCGGTCTATGATGAGAACTGTTTCCAGCCGAATGAAGGATCACAATTGGGTCAAGTTGAAGACCTCTGTTTGGAGAAACAGATCTTTTACCGATTGGTTTCTGGTTTGCATTCTAGTATCTCCACCCACCTCACAAACGAATATCTGAATTTGAAAAATGGAGCATACGAACCAAATTTGAAACAGTTCATGATCAAAGTTGGGTATTTTACTGAAAGAATTCAAAACTTACATCTCAATTATGTCCTTGTATTGAAGTCACTAATAAAGCTACAAGAATACAATGTTATCGACAATCTACCTCTCGATGACTCTTTGAAAGCTGGTCTTAGCGGTTTAATATCTCAAGGAGCACAGGGTATTAACCAGAGCTCTGATGATTATCTATTTAACGAGAAGGTTCTTTTCCAAAATGACCAAAATGATGATTTGAAAAATGAATTCCGTGACAAATTCCGCAACGTGACTAGATTAATGGATTGTGTCCACGGTGTTTAAACCCCAGCGCCTGGCGGG

Claims

1.一种破坏宿主细胞基因组中靶位点的方法，所述方法包括：

(a)使包含编码RNA引导的DNA内切核酸酶的核酸的宿主细胞接触：

(i)第一线性核酸，其能够与其自身或与所述宿主细胞所接触的一种或多种其他线性核酸同源重组，从而所述宿主细胞中的同源重组导致环状染色体外核酸的形成，所述环状染色体外核酸包含选择性标志物的编码序列

(ii)第二线性核酸，其从5'到3'包含RNA聚合酶II启动子，编码第一核酶的第一核酸，编码向导RNA的核酸，编码第二核酶的第二核酸，和终止子，其中所述向导RNA引导DNA核酸酶至所述靶位点；和

(b)选择表达所述选择性标志物的转化宿主细胞，其中所述宿主细胞的NHEJ活性降低。

2.如权利要求1所述的方法，其中，在使所述细胞与所述第一线性核酸和/或所述第二线性核酸接触之前或在使所述宿主细胞与所述第一线性核酸和/所述第二线性核酸接触的同时，所述宿主细胞中的NHEJ活性降低。

3.如权利要求1或2所述的方法，其中，将编码所述RNA引导的DNA内切核酸酶的核酸预整合到所述宿主细胞基因组中。

4.如前述权利要求中任一项所述的方法，其中，所述方法还包括使所述宿主细胞与供体DNA分子接触，所述供体DNA分子能够与所述靶位点同源重组，从而宿主细胞中的同源重组导致所述供体DNA分子在靶位点处整合。

5.如权利要求4所述的方法，其中，所述接触步骤包括使所述细胞与能够与不同靶位点同源重组的两种或更多种供体DNA分子接触，从而所述宿主细胞中的同源重组导致所述供体DNA分子在不同的靶位点处整合。

6.如权利要求4或5所述的方法，其中，所述供体DNA分子包含编码抗体的核酸序列。

7.如前述权利要求中任一项所述的方法，其中，所述宿主细胞是非常规酵母细胞。

8.如前述权利要求中任一项所述的方法，其中，所述宿主细胞是毕赤酵母(Pichia)。

9.如权利要求8所述的方法，其中，所述宿主细胞是巴斯德毕赤酵母(Pichiapastoris)。

10.如前述权利要求中任一项所述的方法，其中，所述接触步骤包括使所述细胞与两种或更多种第二线性核酸分子接触，其中第二线性核酸分子各自包含编码不同向导RNA的核酸，其引导DNA核酸酶至不同的靶位点。

11.如前述权利要求中任一项所述的方法，其中，编码所述RNA引导的DNA内切核酸酶的核酸操作性地连接毕赤酵母pPGK1启动子。

12.如前述权利要求中任一项所述的方法，其中，将编码所述RNA引导的DNA内切核酸酶的核酸整合到YKU70基因中，从而降低所述宿主细胞中的NHEJ活性。

13.如前述权利要求中任一项所述的方法，其中所述RNA引导的DNA内切核酸酶是Cas9。

14.如权利要求13所述的方法，其中，编码所述Cas9的核酸序列经密码子优化用于在酵母(Saccharomyces)中表达。

15.一种宿主，其通过上述权利要求中任一项所述的方法制得。

16.如权利要求15所述的宿主细胞，其包含供体DNA分子，所述供体DNA分子包含编码抗体的核酸序列。

17.一种产生抗体的方法，所述方法包括在适合生产所述抗体的条件下培养权利要求16所述的宿主细胞并回收通过所述宿主细胞产生的抗体。

18.如权利要求17所述的方法，其中，所述宿主细胞是毕赤酵母。