CN101646774A

CN101646774A - 用于生产蛋白，特别是治疗用蛋白的高转录活性细胞株

Info

Publication number: CN101646774A
Application number: CN200780047300A
Authority: CN
Inventors: 克里斯蒂娜·戈谢; 克里斯托夫·西拉克
Original assignee: LFB Biotechnologies SAS
Current assignee: LFB Biotechnologies SAS
Priority date: 2006-12-20
Filing date: 2007-12-20
Publication date: 2010-02-10
Also published as: FR2910490B1; WO2008096070A3; EP2121917B1; CA2671825A1; AU2007346339A1; WO2008096070A2; FR2910490A1; JP2010512776A; KR20090125035A; EP2121917A2; WO2008096070A8

Abstract

本发明涉及一种获得细胞株的方法，其包含将用于重组酶识别的唯一位点整合到所述细胞基因组的高转录活性区域，以及将在唯一的重组酶识别位点下游编码转录终止信号的核酸序列整合到所述细胞的基因组的步骤。本发明还涉及根据所述方法获得的细胞株。

Description

用于生产蛋白，特别是治疗用蛋白的高转录活性细胞株

技术领域

本发明涉及一种产生细胞株的方法，特别地包括编码感兴趣蛋白的序列整合到高转录活性位点，以蛋白生产为目的，特别是用于治疗应用的蛋白。以及涉及使用这种方法产生的细胞株。

作为生物技术发展的结果，重组蛋白的生产目前是生物医学领域的重要业务，拥有很多诊断的和治疗的应用。越来越多的分子和细胞工程方面的专家正在使在各种宿主细胞表达系统中大量生产重组蛋白成为可能。

各种生物系统能被用来产生重组蛋白：细菌(1，2)，酵母和其他真菌(35)，植物(6)，昆虫细胞(7，8)以及哺乳动物细胞(9-12)。由于其翻译后对(vis-à-vis)组装，糖基化以及对合成的重组蛋白的修饰(10，11)的能力，哺乳动物细胞是在生产用于治疗的复杂重组蛋白(10，11)(例如单克隆抗体)产品最常见的系统。

不幸的是，哺乳动物细胞的天然生率与在细菌或酵母中获得的表达水平相比是有限的。这是因为将表达载体整合进宿主细胞的基因组是罕见的事件(1/10000，根据Gorman &Bullock 2000，Ref.13)其中没有插入位点或拷贝数被整合，而这样最终的表达水平可以控制。为了改进这种类型的生产系统，已在一系列不同的方式中做了大量努力：表达载体以及其整合的方法，细胞以及其培养的方法和基因扩增(14-26)。

所有这些努力已集中到用于工业化程度生产的细胞株，特别地有CHO(14，25，27-29)和NSO(22，30，31)细胞株，以及HEK293(32，33)和BHK(34-36)细胞。然而选择高生产率的克隆仍然常常是关键步骤，由于表达载体整合进宿主细胞基因组的随机性，其包含对大量转染子的筛选。一旦表达载体已经整合进基因组，重组蛋白的表达水平强烈地取决于“位置效应”，例如整合位点的基因环境(37，38)。这样一来，表达载体在一转录不活跃的位点插入基因组将得到低水平的表达，或者根本没有表达，而载体在转录活跃的位点的整合则可获得高水平表达。

由于大部分基因组是转录不活跃状态，经常需要筛选大量的转染子来确定一株高生产率的克隆。(22)

背景技术

各种策略已经被应用以控制这种“位置效果”。一种方法是基于使用位点控制区(LCR)序列或隔离子来废除位置效应(39-42)。这种情况下，转基因的表达只取决于整合的载体拷贝数以及调节重组蛋白表达的外源序列的效果。

另一方法是基于通过本地修饰染色质以增加转录活性(UCOE)来废除位置效果(43)。

已经尝试可选的策略，通过引导载体插入到转基因将会被高度表达的位点来废除整合的随机性。为了这么做，转基因可以瞄准特征良好的基因(Hollis GF，US 6,750,041)或者已知的转录活跃位点(44，45，Reff MR，美国专利6,841,383)。在这个方法中，整合事件被控制并瞄准转基因能以恒定水平表达的位点，如果可能则保证在高水平。转染过程因此不再是随机事件，而变成可重现的，这意味着筛选和特性化步骤被简化了并且从一个转染步骤到另一个中获得了相当水平的生率。

表达载体的目标整合可以通过同源重组的方式实现(Reff MR，美国专利6,841,383；Hollis GF，美国专利6,750,041；46，47)。然而，虽然这类重组在酵母和其他真菌中是常见的，在更高等的真核细胞中相对稀少，这代表了在这种有机物中其开发中的主要障碍(47)。举个例子，在哺乳动物细胞中，同源重组与随机整合的频率比处于1/100和1/5000之间(48)。一种被设计用来促进同源重组的互补方法包含在DNA上用大范围核酸酶(例如I-Sce I)创造降解位点(49)。

另一种方法开发了重组酶(47，50)，特别是Cre(51，52)和Flp(53，54)重组酶。P1噬菌体的Cre-loxP重组系统已调整，并用于在真核细胞中瞄准某些基因(51，52，SauerBL，欧专局0 220 009)。使用Cre重组酶在中国地鼠卵巢(CHO)细胞(44)的基因组中进行目标整合已作为示例进行了描述(44)。该重组系统在基因组中的特定位点上确保可重现的表达这方面是有前途的。但是，它只能保证所报道基因的可重现的表达，而没有确保所述基因的高水平表达。

为了消除这个问题，能够用于稳定表达系统的细胞株已经被创造出来并在基因组的转录活性区域具有FRT重组位点(例如Flp-In^TM和Invitrogen细胞株)。表达载体与在转录活性区域内的位点的整合是通过Flp-FRT重组促成的，从而保证了感兴趣的基因的高水平表达。然而，可获得的Flp-in细胞株(293，CHO，BHK，3T3)对于某些重组蛋白的生产并不总是优选地，例如单克隆抗体，由于细胞的内源性翻译后修饰机制。另外，这些细胞株的基因组包含设计好的序列以使其可能选择其中重组位点已经整合进高转录区域的个体。

优选地是“宿主”细胞株中没有任何活性序列(启动子，增强子或抗生素抗性赋予基因)以避免对使用能力的限制，在随后的阶段中，抗性基因或调节序列(启动子，增强子，多A)能调节感兴趣蛋白的生产。最后，报道基因可能与感兴趣蛋白共表达的可能性会使复杂的检查程序成为必须，尤其是当其用作治疗用蛋白的生产，这受到严密的控制，特别是对生产用于治疗应用蛋白的细胞株的分子工程的监管。

最近，Kito等(45)采用Cre-loxP方法用GFP作为报道基因来选择CHO细胞的高生产率的克隆；在基因扩增后，结果是表达水平接近160mg/l。然而，作为上述的Flp-In细胞株，该策略取决于用作表达用宿主的细胞株中出现的许多活性序列。

由于治疗用重组蛋白的生产受到监管生产用于治疗应用蛋白的细胞株的分子工程的严格控制，在这些细胞基因组中出现活性序列会使注册程序复杂，并延长了由此方法生产的医药产品的开发过程。

这样，用简便的方法创造出，新的，高生产率的，长时间稳定的，能用于生产任何具有工业意义感兴趣的蛋白，尤其是用于治疗应用的蛋白的细胞株将构成改进真核细胞，尤其是哺乳动物细胞中重组蛋白的生产的主要步骤。

发明内容

根据本发明的各种事实，为能在细胞中表达的感兴趣的蛋白做了参考，这些蛋白要么用于检查在FRT位点上的整合的目的，要么在发明的全球远景中用于这种蛋白的工业化规模生产。作为出现在说明书和权利要求书中的，该表达意味着该细胞株生产的蛋白可能出现或不出现在细胞中，并以高于其内源性表达水平的水平过量表达。

定义

作为说明书，摘要和权利要求书中的通用规则，下列词语具有下列意义(除非有其他说明)：

在本发明中，“核酸序列”表示单链或双链的核苷酸寡聚体或共聚体，从5’端读至3’端。词语“核酸序列”可指代DNA或RNA分子，或DNA/RNA杂合物，既可是天然的也可是合成的。在本申请中使用的基本标记系统中，除非另有说明，单链核苷酸序列的左侧端对应于其5’端。

在本发明中，“DNA分子”意为任何单链或双链的由核苷酸链组成的寡聚体或共聚体，可以是天然的也可以是合成的。并且具有，但不仅限于，基因，基因组，基因片段，编码与非编码序列的混合，调节序列或与RNA分子互补的序列。

在本发明中，“启动子”或“启动子序列”意为位于翻译起始密码子上游的天然的或合成的核酸序列，其包含于RNA聚合酶的识别和结合中。这样启动子序列帮助下游密码子序列的初始转录。这样的启动子对于那些本领域技术人员而言是熟悉的，并且包括细菌的，病毒的，真核的，酵母的和哺乳动物的启动子，对启动子的选择取决于用于实现表达的宿主细胞的类型。

在本发明中，“载体”意为以核酸为基础的传播媒介，能够传递核酸的核酸分子，或能够在宿主细胞中自主复制到DNA分子，如质粒，粘粒，噬菌粒，病毒基因组(染色体)或噬菌体基因组，以及能被用作克隆DNA分子的。根据考虑的细胞宿主以及载体组成核酸序列的本质，该载体作为独立的主体或整个进宿主的基因组，能在细胞内，在宿主细胞核或其细胞质内被稳定地复制。

在本发明中，“质粒”意为环形或可能的细胞线性化的独立DNA分子，其能在细胞内复制。词语质粒指代所谓的“表达质粒”以及被称为“非表达质粒”的质粒。当质粒被宿主细胞保持时，其既可以在细胞中以独立个体被稳定复制，也可以整合进宿主的基因组而被稳定复制。

在本发明中，“肽”，“多肽”，或“蛋白”指通过共价肽键连接的氨基酸的初级序列。总体而言，肽比蛋白短，含有少数的氨基酸，通常在2到50个之间。词语多肽能涵盖肽和蛋白。肽，多肽或蛋白可以是天然的，重组的或合成的。

在本发明中，“转录终止信号”意为位于转录区域末端的核酸序列，并引发所述区域RNA聚合酶转录的终止。与本发明有关的转录终止信号的示例包括，但不局限于，多腺苷酸序列，如多腺苷酸序列“SV40前多腺苷酸信号”，和牛生长激素(bGH)多腺苷酸序列。

在本发明中，“多腺苷酸序列”或“多A”意为引发转录的终止和形成的转录RNA分子的多腺苷酸化的DNA序列。有效的转录物多腺苷酸是经常所期望的，因为没有多A尾巴的转录物经常是不稳定的且快速地被降解。

有效的裂解和哺乳动物信使RNA的多腺苷酸要求至少两个信号元素：一条位于处理位点上游第7到第30对碱基位置的AAUAAA序列，以及富含GU或U的位于裂解位点3’端的序列。

在本发明中，“弱活性”或“低效”多腺苷酸的表达应理解为意为不允许有效执行转录终止以及转录物多腺苷酸化的多腺苷酸序列。结果是小量的转录物和/或显著不稳定的转录物，对于绝大部分，被降解地太迅速而来不及允许其翻译。更特别地，“低效(或弱活性)的多腺苷酸序列”应被理解为意为允许以低于或等于由“SV40前多腺苷酸信号”多腺苷酸序列引发的水平执行转录终止以及转录物多腺苷酸的任意序列。有可能实现该目标的任何多腺苷酸序列都能被纳入本发明的范围。更特别的，这些序列可以是具有弱活性多腺苷酸信号来终止转录以及转录物的多腺苷酸化的完整的多腺苷酸序列，例如SV40前多A或腺病毒L1多A(71)，或为了减少当与未变异或未删节序列相比时转录终止以及转录物的多腺苷酸化的水平而再次被变异或删节的多腺苷酸序列。我们可以给出多腺苷酸序列的变异和/或删节的示例，这可能使其当与未变异序列相比时多腺苷酸信号的有效性降低：增加分开AATAAA元素与富含GT的区域之间的距离(66)，从出现在AATAAA六核苷酸上游的一个或几个核苷酸删除后SV40多A(67)，删除某些位于AATAAA序列上游第13到第48核苷酸中的元素(68)，删除AATAAA序列下游富含GT的序列并修饰AATAAA序列之间的空间以及富含GT的区域(69)，或位于AATAAA序列上游的USE(上游序列元素)区域的变异或删节(70)，该列表并不是限制性的。

在本发明中，“分离的”或“纯化的”意为人类干涉后得到的任何对天然状态的修饰。因此，任何之前存在于自然环境中的目标被修饰或从其自然环境中提取即被称为“分离”或“纯化”。“分离”的材料可以是从在其自然环境中的其他分子中分离出来的，或者通过克隆，扩增和/或化学合成产生的，任何的多核苷酸或任何肽/多肽/蛋白。另外，通过转化、基因操作或任何其他方法被引导入生物体的多核苷酸，肽或蛋白被称为被“分离”了，即使其已经在所述生物体中出现。

在本发明中，“表达”意为特定核苷酸序列的转录和/或翻译，其由像启动子这样的调节序列控制。

在本发明中，“过度表达”意为对于给定的密码子序列每个细胞的表达显著高于(例如高出两倍，但理想的是高出10倍甚至100倍)在相应的未经本发明的构造转染的细胞中内源性编码序列观察到的水平。

在本发明中，“抗体”意为免疫球蛋白分子，其免疫学地与特定抗原结合，其根据类型可包含多克隆和/或单克隆抗体。该词语还涵盖遗传学修饰过的形态，如嵌合抗体(如人工繁育的鼠或兔抗体)和复共轭对配合抗体(如双特异性抗体)。词语“抗体”还可涵盖能结合到抗原的任何抗体形态，包括抗原结合的抗体片段。

在本发明中，“转染”或“使转染”指细胞结合外源性DNA并将其整合进自身的基因组的过程。

在本发明中，“细胞株”意为从相同的母体细胞传下来的细胞组，所有的细胞均具有与母细胞相同的遗传特征。细胞株还以其在体外稳定地复制几代的能力为特征。

在本发明中，“高转录活性区域”意为有机体中的染色体组或染色体DNA的一块区域，在其中染色体结构或调节序列表现出显著地增强在该区域中或邻近该区域的基因的转录。在这种高度活性区域中转录速率常常高于在该有机体的基因组中观测到的平均转录速率，优选地高出2倍，或有利地高出10倍，甚至高出50倍，或者有时甚至高出100倍。作为示例，对于YB2/0细胞株(ATTC CRL 1662)而言，考虑到的高转录活性区域使获得的pcd(皮克蛋白每24小时每个细胞)值至少为5，优选地至少为10。

在本发明中，“弱转录活性区域”意为有机体中的染色体组或染色体DNA的一块区域，其表现出染色体结构或包含调节序列，其能够显著地抑制或完全阻止在该区域中或邻近该区域的基因的转录频率。在这种区域中转录速率常常低于在该有机体的基因组中观测到的平均转录速率，优选地低一半或有利地低10倍，甚至低50倍，或者有时甚至低100倍。这种弱活性区域中的转录速率可能低到无法测定，低到零。

在本发明中，“重组酶”或“位点特异性重组酶”指作用于两个核酸分子的以一种方式使它们相互重组的酶。重组是一种已很好地表达的生理过程，其包括两个带有完全一致的或基本一致(同源的)序列的核酸分子的裂解，接着两个分子以每个初始分子的一个区域与另一分子的相应区域结合这样一种方式重组。已经观察到重组有两种类型。第一种类型，对应于“经典的”或“同源性的”重组适用于任何带有同源性核苷酸序列的分子对，这能作为“全体”重组酶的底物。与此相对的，在第二种类型中，称为“位点特异性重组”，为了能够作为重组酶的底物，同源性分子必须携带特殊的核酸序列，这称为“位点特异性重组”。一些位点特异性重组系统在背景技术中进行描述，包括E.coliP1噬菌体中的重组系统。特别地，特定的序列以及使用的重组酶可以属于不同结构类别，特别是Tn3转换子解离酶族或λ噬菌体整合酶族。在属于Tn3转换子族中有Tn3转换子解离酶或Tn21和Tn55转换子(Stark and al.，1992)；mu噬菌体的Gin转化酶或另外的例如RP4片段的质粒游离酶(Abert and al.，Mol.Microbiol.12(1994)131)。在属于λ噬菌体整合酶族的重组酶中有λ噬菌体整合酶自身(Landy and al.，Science 197(1977)1147)，P22(Leong and al.，J.Biol.Chem.260(1985)4468)，流感嗜血杆菌(Haemophilus influenza)HP1(Hauser and al.J.Biol.Chem.267(1992)6859)，P1噬菌体Cre整合酶，pSAM2质粒整合酶(350341EPA欧专局350 341)或还有2μ质粒FLP重组酶以及E.coli XerC和XerD重组酶。

在本发明中，“重组识别位点”意为能用于重组酶底物的一段核酸序列。

在本发明中，“报道基因”意为带有编码基因产品序列的多核苷酸，通常是酶，当包含报道基因序列的结构被引入含有所有表达所述基因所需因素的细胞中时，其能被简便地检测并且/或者被定量。能在本发明的内容中使用的报道基因的例子包括，但不限于，像maxFP-green蛋白及其衍生物的荧光蛋白，荧光素酶，绿色荧光蛋白(GFP)及其衍生物，或者珊瑚礁荧光蛋白(RCFP)以及由lacZ基因编码的β-牛乳糖酶。

在本发明中，“感兴趣的蛋白”意为可能具有工业上，治疗上或预防上价值的肽，多肽或蛋白。能在根据本发明的细胞株中表达的感兴趣的蛋白可以选自下列这些：

-具有治疗活性的蛋白，例如对人或动物中任何形式的认识到的疾病或对所述人或动物的病理学的损害作用具有已认识到的有益的生理效应的蛋白，包括预防性治疗形态；这样的蛋白可以是肽，多肽，激素，酶以及相关种类，而优选地是具有选自下列组的活性的多肽，其为对消化的，胰腺的，胆汁的，抗病毒的，抗炎的，肺部的，抗菌的，血液的，神经的，心血管的，眼科的，抗原的，大脑的，抗肿瘤的，免疫激活和免疫调变功能的蛋白；在特别优选的实施例中，具有治疗活性的蛋白或多肽选自包括胰岛素；包含人生长激素或牛生长激素的生长激素；生长激素释放因子；甲状旁腺素；甲状腺刺激素；卵泡刺激素；黄体生成素；像干扰素-α，-β以及-γ或者例如干扰素13这样的干扰素；血管内皮细胞生长因子(VEGF)；用于激素受体或生长因子的受体；整合蛋白；A或D蛋白；类风湿因子；像骨源性神经营养因子(BDNF)这样的神经营养因子；神经营养因子(NT-3，NT-4，NT-5或NT-6)；像NGF-β这样的神经生长因子；血小板源生长因子(PDGF)；像FGF或bFGF这样的成纤维细胞生长因子；表皮生长因子(EGF)；像转化生长因子-α以及包含TGF-β.1，TGF-β.2，TGF-β.3，TGF-β.4或TGF-β.5的TGF-β这样的转化生长因子(TGF)；类似于I型或II型胰岛素(IGF-I和IGF-II)或例如(1-3)-IGF-I中的一个(大脑IGF-I)这样的生长因子；角化细胞生长因子；类似胰岛素的生长因子结合蛋白；像CD-3，CD-4，CD-8或CD-19这样的CD蛋白；红细胞生成素；骨诱导因子；免疫毒素；骨形态发生蛋白(BMP)；克隆刺激因子(CSFs)，例如M-CSF，GM-CSF或G-CSF；加速老化因子；胃的，胰腺的，或胆汁的脂肪酶弹性蛋白酶，类α-1抗胰蛋白酶的抗蛋白酶；蛋白酶；氧化酶；肌醇六磷酸酶；几丁质酶；转化酵素；纤维素酶；xynalases；像胶原蛋白这样的结构蛋白；像乳铁传递蛋白这样的铁传递蛋白；像血红蛋白或人血清蛋白这样的血液蛋白；类血液辅助因子，凝结因子的因子VII，因子VIII，因子IX，因子X，组织因子，假血友病因子；像蛋白C这样的抗凝结因子；心房利钠因子；肾素；降血钙素；胰高血糖素；肺泡表面活性物质；像尿激酶或组织特异性血纤维蛋白催化剂这样的血纤维蛋白催化剂(t-PA)；凝血酶；促血小板生成素；造血生长因子；α-或β-肿瘤坏疽因子；encephalinase(内脑磷脂酶)；人巨噬细胞炎症蛋白(MIP-1α)；例如人血清白蛋白这样的血清白蛋白；松弛素；脱氧核糖核酸酶；细胞因子；像RANTES(调节对普通T细胞表达和分泌的激活)的趋化因子；白细胞介素(ILs)，如IL-1到IL-10；例如过氧化物歧化酶这样的抗氧化剂；抗体，抗体片段和抗原的组。当多肽或蛋白是抗体或抗体片段时，它可以是免疫球蛋白分子，免疫球蛋白重链，基本上完整的免疫球蛋白分子以及携带抗体决定簇，尤其是Fab片段，Fab’片段，F(ab′)₂片段以及Fv片段的免疫球蛋白的所有部分，免疫球蛋白的轻链和Fv片段；

-美容活性的蛋白和多肽，其根据很多国家的立法是那些只作用于表皮的，例如不穿透到较下层的化合物，或者换言之，对真皮或基细胞没有影响。这样的蛋白或多肽对于那些本领域技术人员本身而言是熟悉的，其中的一些例子是神经酰胺，keratides，湿润剂，抗菌剂以及相关的化合物；

-营养品活性的蛋白或多肽，例如与那些普遍发现于人或动物的饮食中的完全一致或相似的化合物，可以在其全部或部分的食物中发现，且对健康具有有益的效果；作为涵盖于本发明这部分的这类化合物的示例，可以提到修饰或源于苯基丙氨酸氨裂解酶(PAL)，过源原，例如桦树，杨树，草，过氧化物，歧化酶(SOD)和相关化合物。

在本发明中，“高抗菌素剂量”意为至少为1/gl或有利地至少为4/gl，优选地的是8/gl。

本发明的一方面提供了用于产生包含至少一个细胞的细胞株的方法，包括下列步骤：

-在所述细胞的基因组的高转录活性区域，将唯一的重组酶识别位点整合到所述细胞的基因组中；以及

-编码转录终止信号的核酸序列在唯一的重组酶识别位点的下游结合到所述细胞的基因组。优选地，编码转录终止信号的核酸序列是编码多腺苷酸信号的序列。仍然更优选地，编码转录终止信号的核酸序列是编码至少部分弱活性多腺苷酸信号的序列，例如SV40前多腺苷酸信号或腺病毒L1多腺苷酸信号或任何其他的如前面所定义的弱活性多腺苷酸信号。

根据另一特别有利的本发明的实施例，用于本发明方法的细胞株的细胞是哺乳动物或鸟的细胞。原细胞(例如在修饰之前)选自包含鼠骨髓瘤细胞株，特别的是YB2/0(ATCCCRL-1662)和IR983F，人骨髓瘤细胞如Namalwa或像PERC6，CHO细胞株(特别地CHO-K，CHOLec，CHO-Lec1，CHO Pro-5，CHO dhfr-，CHO Lec13)这样的任何其他的人体细胞或其他选自Wil-2，Jurkat，Vero，Molt-4，COS-7，293-HEK，BHK，K6H6，NSO，SP2/0-Ag14，P3X63Ag8.653和EBx的细胞株。

根据本发明方法的优选形式，唯一的重组酶识别位点是经过一系列步骤结合的，步骤至少包括：

-整合两条都编码重组酶识别位点的核酸序列；

-整合位于两条都编码重组酶识别位点的序列之间的编码报道基因的核酸序列；

-整合位于两条都编码重组酶识别位点的序列之间的编码感兴趣蛋白的核酸序列；

-整合位于两条都编码重组酶识别位点的序列之间的编码选择标记的核酸序列，优选地是赋予抗生素抗性的基因。

在这里，重组酶识别序列可以是loxP和/或FRT序列。感兴趣的蛋白可以是例如抗体或抗体的片段。

还优选地仅选择高产率细胞，其结合所有前述序列的单个拷贝。还更优选地是，只选择pcd(皮克蛋白每个细胞每24小时)至少为5的，或优选地至少为10，或者更进一步为20，30，30，50，80或100的细胞。

优选地，以及随后地，所有的前述序列能通过重组酶对细胞的作用而被切除。在这种情况下，重组酶活性可由所述重组酶通过携带编码所述重组酶的核酸序列的载体在细胞中的共表达而诱导。

根据本发明的另一优选地实施例，前述系列的步骤还可包括对携带着唯一地完整的重组酶识别位点的细胞的选择，在其中所有前述核酸序列已经被切除。

另外，更优选地，一系列的步骤可以包括结合编码I型单纯疱疹(HSV1-TK)的胸苷激素的核酸序列。在这里，细胞可以通过在培养基中加入更昔洛韦(ganciclovir)进行选择。事实上，如果更昔洛韦出现在培养基中，该选择方法能确保只有那些细胞中的HSV1-TK核酸序列已被删除的才能够存活。

在特别优选的情况下，前述的系列方法还包括转染所选择的细胞株，转染用携带编码感兴趣的蛋白或多肽的核酸序列以及直接在编码选择标记的核酸序列下游的编码重组酶识别位点的核酸序列，优选地赋予对抗生素的抗性，而没有多腺苷酸序列的表达载体来实现的。在这种情况下，所述表达载体是在所述在转染时被诱导或引导的重组酶作用的力量下，在唯一的重组酶识别位点结合的。对携带整合到目标位点的表达载体的细胞的选择还可以通过对所感兴趣蛋白或多肽的表达的试验有利地进行。有利地，细胞还可通过其对高浓度抗菌素的抗性，尤其对于抗生素剂量至少为1g/l，或者2g/l或优选地是4g/l或8g/l进行选择。

在尤其优选的方法中，所述感兴趣的蛋白或多肽是治疗性的蛋白或多肽，特别地选自在消化的，胰腺的，胆汁的，抗病毒的，抗炎的，肺的，抗菌的，血液的，神经的，心血管的，眼科的，抗原的，脑的，抗肿瘤的，免疫刺激的，免疫调节功能方面有活性的组。

前述方法的步骤中在不同阶段产出一个或多个具有特别有利的性质的细胞株。结果本发明的另一目标是具有在所述细胞基因组的高转录活性区域稳定地整合了唯一重组酶识别位点，而直接在所述唯一的重组酶识别位点的下游整合了编码转录终止信号的核酸序列。优选地，被稳定地整合了的编码转录终止信号的核酸序列是编码多腺苷酸信号的序列。该编码转录终止或多腺苷酸信号的核酸序列是编码了全部或部分类似SV40前多腺苷酸信号或任何其他的修饰过的改变了其效率的多腺苷酸信号这样的弱活性多腺苷酸信号。如上所述，该细胞株优选地是源于哺乳动物。

如前所述的细胞株因此仍有利地包括：

-两条都编码重组酶识别位点的核酸序列；

-至少一条位于两条都编码重组酶识别位点的序列之间的编码感兴趣蛋白的核酸序列；

-至少一条编码选择标记的核酸序列，优选地是赋予抗菌素抗性的基因，缺少多腺苷酸序列，位于两条都编码重组酶识别位点的序列之间，该序列为直接位于重组酶识别位点上游的选择标记编码，重组酶识别位点直接位于前述的低多腺苷酸序列的上游。

优选地，如前所述，所有前述的序列的单独拷贝被一起整合到细胞株细胞的基因组内。更优选地的方法是每个细胞株的pcd至少是5或者有利地至少是10。

在高度优选的方法中，该细胞株还能过度表达所感兴趣的蛋白或多肽，其选自具有消化的，胰腺的，胆汁的，抗病毒的，抗炎的，肺的，抗菌的，血液的，神经的，心血管的，眼科的，抗原的，脑的，抗肿瘤的，免疫刺激的，免疫调节活性感兴趣的蛋白或多肽的组。

根据本发明的另一目标，该细胞株是根据以申请号CNCM 1-3704注册的YGM-1/10G10(于2006年12月18日提交至Collection Nationale de Culture de Microorganismes(CNCM)，Institut Pasteur，25 rue du Docteur Roux，F-75724 Paris Cedex 15的细胞株)作为参考确定的。

根据本发明的另一目标，该细胞株是根据以申请号CNCM 1-3885注册的YGM-2/3G5(于2007年12月19日提交至Collection Nationale de Culture de Microorganismes(CNCM)，Institut Pasteur，25 rue du Docteur Roux，F-75724 Paris Cedex 15的细胞株)作为参考确定的。

本发明的另一目标是提供包含由编号SEQ ID NO：1的确定的核酸片段的分离的核酸分子。该分子代表或象征高转录活性位点，因此能被用于整合其他前述的序列。显然，SEQ.ID NO 1序列还能被直接或者以互补的方式或通过杂交用于在适当的细胞的基因组中创造高转录活性位点。这可以通过携带有在编号SEQ ID NO：1列表中的序列确定的核酸序列的载体而实现。

另一特别优选的本发明的目标提供至少一种感兴趣蛋白或多肽的生产方法，其特征在于为了表达所述感兴趣的蛋白和多肽而培养前述的细胞株，接着至少一个收获所述感兴趣蛋白的步骤。像已经描述的以及之前给出其注册参考号而确定的细胞株优选地适于进行这类步骤。这里，感兴趣的蛋白或多肽优选地选自对消化的，胰腺的，胆汁的，抗病毒的，抗炎的，肺的，抗菌的，血液的，神经的，心血管的，眼科的，抗原的，脑的，抗肿瘤的，免疫刺激的，免疫调节功能有活性的感兴趣的蛋白或多肽的组。更优选地，感兴趣的蛋白或多肽是抗体或抗体片段。

附图说明

图1：图1是pTV1目标载体的示意图。

图2：图2是pFlpe重组酶表达载体的示意图。

图3：图3是pT125FRT表达载体的示意图。

图4：图4是T125-IG24载体的示意图。

图5：图5在细胞外列出了通过Flp重组酶删除或切除目标载体的途径。

图6：图6在细胞外列出了通过Flp重组酶重新整合表达载体的途径。

发明详述

本发明的第一目标涉及一种基于感兴趣的DNA分子插入哺乳动物细胞基因组的目标位点的方法。该方法包括产生细胞株的第一步，其具备整合进其基因组的高转录活性区域的唯一的重组酶识别位点。该第一步包括以下步骤：

1)哺乳动物细胞第一核酸中的整合，指“目标质粒”，包含(i)两条序列一前一后地对应于重组酶识别位点，在这两者之间存在报道基因，是编码与感兴趣蛋白相似蛋白的基因，允许扩增的选择子基因以及赋予抗生素抗性的基因，但是没有多腺苷酸序列；以及(ii)位于第二重组酶识别位点下游的多腺苷酸位点，如抗生素抗性基因的5’端；

2)选择携带目标载体单独拷贝的“高产率”细胞；

3)通过重组酶的方式切除目标载体；以及

4)选择细胞来制造已经失去目标载体，只保存完整的、唯一的整合的重组酶识别位点的细胞株。

通过本发明的方法，在第4步被选择的组成细胞株的细胞都携带唯一的整合进其基因组的高转录活性区域的重组酶识别位点。

在该方法的步骤1)中使用的哺乳动物细胞的特征之一是，在未经本发明的方法修饰过之前其并不携带任何与在本发明的方法的互补过程中整合的重组酶识别位点相似的序列。结果是，由于在所述细胞株细胞的基因组中找不到其他相同的序列，因此整合进本发明的细胞株细胞的基因组中的重组酶识别位点是唯一的。

执行本发明的步骤1)，在哺乳动物细胞中第一核酸的整合可以使用任何本领域技术人员已知的方法实现。作为示例，可以提一下：磷酸钙(CaPO₄)沉淀法，其中沉淀的DNA由于噬菌作用与细胞结合；可选的，脂质转染法，其包括用脂质囊包裹要整合的DNA从而使其能与宿主细胞的膜接合；另一可能的方法是电穿孔，其中给予细胞电击导致感兴趣DNA的整合；另一可能的方法是核内显微注射。

用于本发明方法的第一步的目标载体由含有两个重组酶识别位点的核酸分子组成。这些位点相互完全一致，并且与通过本发明方式方法产生的细胞株中的唯一位点完全一致。这两个位点在含有报道基因，编码与感兴趣蛋白相似蛋白的基因，赋予抗生素抗性的基因，以及允许基因扩增的选择子基因的DNA片段的两侧。目标载体还包含所有表达插入两个重组酶识别位点之间基因所必需的序列。在这些必需的序列中，可以提到，但不限于，启动子，增强子和多腺苷酸序列。

目标载体整合进转染细胞的基因组以随机形式发生。因此目标载体可能插入转录无活性，相对无活性，中等活性或高活性的区域。目标载体插入其高转录活性区域的细胞株是基于报道基因的表达或过度表达进行选择的。

该报道基因——该产品易于被检测及分析——的表达构成一种评估所述报道基因被整合到的环境的转录活性水平的方法：如果插入位点的转录活性低，报道基因的活性也会低；相反地，如果插入位点的转录活性高，报道基因的活性也会高。

编码与感兴趣蛋白类似蛋白的基因，位于报道基因的下游，使确定包含该转基因的细胞分泌蛋白的能力成为可能，是不能用荧光蛋白在细胞内部表达确定的参数。任何易于被检测的蛋白可以被用于此目的。在能够被用于本发明这部分内容的蛋白中，可以提到，但不限于，免疫球蛋白、生长因子，白细胞介素，刺激因子，激酶，凝结因子，α-抗胰蛋白酶以及白蛋白基因的产物。

抗生素抗性基因使选择携带目标载体的改变了的细胞成为可能。选择是这样进行的，通过将改变了的细胞与相关抗生素接触从而只有那些已经结合了目标载体的细胞存活下来。抗生素抗性基因后面跟着多腺苷酸序列(“多A”)其在稳定相应的mRNA分子中起重要作用(56-63)。任何对本领域技术人员而言已知的允许抗生素抗性基因表达的多腺苷酸序列都能使用，虽然优选地使用弱活性多A序列。

有利地，多腺苷酸序列是弱活性的多腺苷酸序列，例如相对无效的多腺苷酸序列。结果是，如果目标载体被插入到无转录活性区域，抗生素抗性基因将不会以高到足以使细胞在暴露于抗生素下时存活下来的水平表达。相反的，如果插入位点在高转录活性区域，多腺苷酸序列的“软弱”将不阻止抗性基因产物的表达，而相应的细胞将能抵抗抗生素。使用这种弱多腺苷酸序列，尤其在选择压力大时(在高浓度的抗生素下)，将充分减少需要进行筛选的克隆数量并将有助于确定可能对感兴趣蛋白是“高产率”的克隆。

作为弱多腺苷酸序列的示例，可以提到“SV40前多腺苷酸信号”，其是在某些可购得的表达载体中使用的信号(64-66)。

有利地，细胞还可以根据其在高浓度抗生素下的抗性进行选择。结合这两种选择工具，换言之使用弱活性多腺苷酸序列和在培养基中使用高浓度抗生素使这个选择的方法成为特别有利的选择转基因被整合到所期望位置的细胞的手段，换言之，在重组酶识别位点，没有选择那些识别位点的重组酶已经整合进诱导低转录活性的区域的细胞。事实上，多腺苷酸序列仅是弱活性的事实具有这样的效果，即直接位于该位点上游的对抗生素有抗性的基因仅以小的程度表达。这样，如果加入培养基的抗生素浓度是高的(例如大于或等于1g/l。或者还大于或等于2g/l，或到4g/l或大于或等于8g/l)，只有那些已经将转基因整合进虽然有多腺苷酸序列的低效率或弱活性仍允许充分强地表达对抗生素有抗性的基因的细胞能存活下来。这种同时采用多腺苷酸序列的弱活性以及在细胞培养基中加入高浓度抗生素的选择方法具有几点优势：由于将转基因整合到基因组其他地方而不是在重组酶识别位点的克隆在培养基中出现的高浓度抗生素的作用下将死亡，从而减少对克隆的筛选成为可能。另外，当与现有技术的选择方法相比时被选择的克隆具有更高的生产能力。

有利地，目标载体是在转染进所选细胞前使用限制酶进行细胞线性化过的。为了防止目标载体的多个拷贝在整个进细胞基因组DNA之前结合，所使用的限制酶应当制造出钝的末端。另外，只有少量的目标载体被用于转染过程。这些特定的条件可以充分地降低将被整合进细胞基因组的载体的拷贝数。在实际操作中，为了符合要求的切除，只有目标载体的单个拷贝被整合进转染的细胞是重要的，这样切除随后出现在出现的两个重组酶识别位点之间。相似地，本发明的方法只有在单个高转录活性区域已经被确定时才能成功地实施。

目标载体还包括在第二重组酶识别位点下游的多腺苷酸序列。该多腺苷酸序列是被设计用来随后整合携带有感兴趣蛋白基因的不同载体的。这样，正如在下面将描述的，该多腺苷酸序列将使对已经在重组酶识别位点整合了第二个载体的细胞的选择成为可能。有利地，该多腺苷酸序列是相对无效的，并且可以被认为“弱多腺苷酸序列”；一个例子就是称为“SV40前多腺苷酸信号”的SV40前多腺苷酸序列。

有利地，目标载体携带允许执行基因扩增机制的基因。该基因可以例如是二氢叶酸还原酶(DHFR)或谷氨酸合成酶(GS)的基因或是细胞生存必要的代谢酶。当已整合目标载体的转染细胞用逐渐增加浓度的对相关酶的特定抑制剂培养时，(例如对于DHFR的甲氨喋呤和对于GS的甲硫氨酸硫堇亚胺)，只有那些其中载体已经被增加的细胞会表达出足够的DHFR或GS而存活下来(23，30)。获得的基因扩增的程度是变化的，从根本上取决于载体整合到的基因组的区域。因此目标载体的整合区域由于其“扩增能力”而被选择，以使其能保证其将在随后有可能扩增所感兴趣的转基因的表达。

另外，在另一本发明的特别的实施例中，目标载体在两个重组酶识别位点之间携带I型单纯疱疹病毒的胸苷激酶(HSV1-TK)的基因。在步骤4)中的细胞选择是基于将更昔洛韦添加到培养基中：还未从中切除目标载体的细胞将被更昔洛韦杀死，而那些其中的目标载体已经被切除的细胞将存活下来。在这一步中使用基于使用任何潜在毒性的“前体”而不是HSV1-TK的自杀基因是没有任何价值的。作为示例可以提到，CodA和Fcy基因以及前体5氟胞嘧啶(5-FC)；这个列表不是限制性的。

在本发明的内容中所使用的重组酶识别位点可以相当于任何对那些本领域技术人员已知的位点。作为示例，可以提到loxP和FRT位点。在本发明的一实施例中，loxP和FRT位点同时被使用。作为示例，该实施例可以使用FRT将表达载体插入，然后在整合进基因组后使用loxP去除载体的选择子基因。

编码与感兴趣蛋白相似蛋白的报道基因可能相当于任何编码与具有治疗的或工业上的价值的蛋白完全一致或相似的分泌蛋白的基因。作为示例，可以提到编码抗体，生长因子，白细胞介素，刺激因子，激酶，凝结因子，α-1抗胰蛋白酶或白蛋白的基因，该列表是非限制性的。

与感兴趣蛋白相似蛋白的额外表达以及由报道基因编码的蛋白使在步骤2)中，不仅仅基于报道基因的表达水平还基于细胞的分泌能力来选择细胞成为可能。

有利地，感兴趣的蛋白是抗体。这种情况下，在载体中包含有编码所述抗体重链和轻链的基因是特别有利地。另外，如果感兴趣的蛋白是抗体，在步骤2)时，基于预见的糖基化的比例或形式来选择抗体生产细胞将是有用的。

有利地，用于本发明的这个方法的原始哺乳动物细胞选自：鼠骨髓瘤细胞株，特别的是YB2/0(ATCC CRL-1662)和IR983F，像Namalwa或像PERC6，CHO细胞株(特别地CHO-K，CHOLec，CHO-Lec1，CHO Pro-5，CHO dhfr-，CHO Lec13)这样的任何其他的人体细胞或其他选自Wil-2，Jurkat，Vero，Molt-4，COS-7，293-HEK，BHK，K6H6，NSO，SP2/0-Ag14，P3X63Ag8.653。

在特别有利地方式中，使用YB2/0细胞株。

在步骤2)中被选择的生产感兴趣蛋白的高产率细胞的产率超过5pcd(皮克蛋白每个细胞每24小时)。有利地，所感兴趣的细胞的生产速率超过10pcd。在特别有利的方式中，所感兴趣的细胞的生产速率超过15pcd，而更特定地超过20pcd。有利地，产率在5到50pcd之间，或更特定地在10到30pcd之间。

整合进原始哺乳动物细胞中的拷贝数可以通过任何对本领域技术人员已知的方法进行估算。作为示例，可以提到定量的聚合酶链式反应(PCR)分析。

在目标载体切除步骤(步骤3)中，重组酶在两个重组酶识别位点促成一重组事件，并诱导目标载体从细胞基因组的切除，而重组酶识别位点仍然保留在基因组内。在本发明的方法中实施的切除机制导致所有位于整合到目标载体的两个重组酶识别位点之间的核酸序列的移除。保留于基因组的高转录活性区域的识别位点仍处于与在整合到目标载体中的原始识别位点相同的方位。另外，在切除目标载体后，多腺苷酸序列被留在哺乳动物细胞中被保留的重组酶识别位点的下游。保留下来的重组酶识别位点的完整性可以使用任何本领域技术人员已知的方法进行检验，例如在PCR(聚合酶链式反应)后对扩增的DNA序列测序。

作为示例，该重组酶在细胞中可以通过短暂的编码所述重组酶的载体的转染被表达，而细胞已经在步骤2中被转染了。

如果重组酶识别位点是loxP位点，那么使用Cre重组酶将没有意义。相反，如果识别位点是FRT，使用的重组酶是Flp。有利地，在本发明的范围内，使用的重组酶是Flpe，一种源于Flp的重组酶，其在用于培育哺乳动物细胞的培养条件下更具活性(55)。

因此切除步骤去除所有可能影响到使用留于基因组或被转染细胞中的FRT重组序列而被插入到高转录活性区域的感兴趣蛋白的进一步表达的活性序列。因此在目标载体被切除后再没有活性转基因的元素留于细胞株中。

在本发明的方法的第一步产生的携带了插入其基因组的高转录活性区域的唯一的重组酶识别位点的细胞株(高产率细胞株)，能被用于生产任何感兴趣的蛋白。这样的蛋白可以通过用携带转录感兴趣蛋白所需的序列输入所述载体的载体定位到唯一的重组位点而随之产生。这种本发明的高产量细胞株的应用将在下面进行详述。

本发明的另一目标关系到前面所定义的方法，包含为了将感兴趣的DNA分子插入本发明的方法的第一步产生的细胞株中而设计的第二步。该第二步包含以下步骤：

5)用携带有编码感兴趣蛋白的基因，允许基因扩增的基因以及赋予抗生素抗性的基因，但没有任何多腺苷酸序列的表达载体转染在步骤4)中产生的细胞株，该载体被直接定位于重组酶识别位点的上游

6)在唯一的重组酶识别位点插入所述表达载体，由所述重组酶促成；

7)通过对感兴趣蛋白的表达的分析对携带有整合到目标位点的表达载体的细胞进行选择。有利地，为了阻止随机整合，选择是在高浓度的抗生素的存在下进行的。

用于方法中重新整合步骤的表达载体包括编码感兴趣蛋白的基因，允许基因扩增的基因，以及出现在载体中的编码序列表达所必需的序列，例如启动子，增强子和多腺苷酸序列。该表达载体还包含赋予抗生素抗性的基因及其启动子，而没有任何多腺苷酸序列，该载体被直接定位于重组酶识别位点的上游。

所述表达载体携带的抗生素抗性基因不具有多腺苷酸序列。因此抗生素抗性基因必须被置于载体的末端，从而它直接被插入在目标载体被切除后留在细胞基因组中的多腺苷酸序列的上游。可选地，该抗生素抗性基因与目标载体上的一样，从而可以使用与在步骤2)中选择高产量细胞时相同浓度的抗生素进行细胞选择。这样通过将细胞暴露于与基因赋予的抗性相对应的抗生素下进行选择。

重组酶促成了表达载体在经过步骤4)留下的唯一的识别位点处插入细胞基因组。为此，在表达载体中的重组酶识别位点与在本方法的第一部分中整合到细胞基因组的完全一致。

如上所述，如果重组酶识别位点是loxP位点，使用Cre重组酶；如果识别位点是FRT，所使用的重组酶是Flp。另外，任何能使重组酶在细胞中工作的方法能在本发明的方法的步骤6)中实施。作为示例，重组酶可以在用携带编码所述重组酶基因的载体转染的细胞中生产。

没有在重组酶识别位点整合表达载体的细胞将在随后由于所使用的高浓度的抗生素而死亡。事实上抗生素抗性基因在其编码序列下游没有多腺苷酸序列，因此只有当基因被插入到邻近经过步骤3)和4)留在细胞基因组中的多腺苷酸序列时才能有效地表达。

有利地，由表达载体中的感兴趣的DNA表达得到的蛋白可以是任何具有治疗的或工业上价值的蛋白，例如，抗体，凝结因子，细胞因子生长因子，酶或激素，该列表是非限制性的。另外，编码感兴趣蛋白的基因可以与目标载体上携带的一样，或者其可以是编码不同蛋白的基因。

本发明的另一目标关系到携带着整合到基因组高转录活性区域的唯一的重组酶识别位点的细胞株，所述细胞株已经在所述重组酶识别位点整合了转基因的单独拷贝，所述细胞株长时间稳定并能在本发明的方法的步骤4)中获得。

有利地，该细胞株是YGM-1/10G10细胞株(于2006年12月18日提交至CollectionNationale de Culture de Microorganismes(CNCM)，申请号为CNCM I-3704)。YGM-1/10G10细胞株是通过在本方法步骤1)由YB2/0细胞(ATCC CRL-166)开始，实施本发明的方法产生的细胞株。该YGM-1/10G10细胞株具有以下特征：无活性序列(启动子，选择子基因，抗生素抗性基因)，一重组酶识别位点，稳定的培养参数以及稳定的整合位点。另外，该细胞株还有利地具有生产感兴趣蛋白的速率超过5pcd(皮克蛋白每个细胞每24小时)。有利地，感兴趣细胞的产率超过10pcd。在特别有利的方式中，感兴趣细胞的产率超过15pcd，更特别地20pcd。有利地，产率在5到50pcd之间，更特别地在10到30pcd之间。

这样，本发明的一个目标是新的表达细胞株，YGM-1/10G10，没有任何活性转基因序列，源自YB2/0细胞株，在其中表达载体的整合能被控制，并通过使用重组酶指向有利于转录的区域。

根据另发明的另一目标，该细胞株是YGM-2/3G5细胞株(于2007年12月19日提交至Collection Nationale de Culturede Microorganismes(CNCM)，申请号为CNCM I-3885)。YGM-2/3G5细胞株是通过在本方法步骤1)由YB2/0细胞(ATCC CRL-1662)开始，实施本发明的方法产生的细胞株。该YGM-2/3G5细胞株具有以下特征：无活性序列(启动子，选择子基因，抗生素抗性基因)，一重组酶识别位点，稳定的培养参数以及稳定的整合位点。另外，该细胞株还有利地具有生产感兴趣蛋白的速率超过5pcd(皮克蛋白每个细胞每24小时)。有利地，感兴趣细胞的产率超过10pcd。在特别有利的方式中，感兴趣细胞的产率超过15pcd，更特别地20pcd。有利地，产率在5到50pcd之间，更特别地在10到30pcd之间。

这样，本发明的一个目标是新的表达细胞株，YGM-2/3G5，没有任何活性转基因序列，源自YB2/0细胞株，在其中表达载体的整合能被控制，并通过使用重组酶指向有利于转录的区域。

新的YGM-1/10G10和YGM-2/3G5细胞株具有下列性质和优势：

-始终可繁殖，作为在相同位点有保障地整合的结果，每个转染过程均高水平表达；

-不存在活性转基因序列(启动子，抗性基因，转录增强子)会影响到原始YB2/0细胞株的性质，从而方便了随后接着的携带感兴趣蛋白基因的表达载体的整合的开发；

-由于需要被筛选的转染子的数量的减少，节省时间和资源；

-通过对“扩增了的”整合位点的选择能实现基因扩增(例如使用DHFR甲氨喋呤系统)的可能性。

有利地，本发明的方法产生的细胞株是长时间稳定的，至少为3个月，例如大约80代。

本发明的另一目标是关于从包含SEQ ID NO：4序列核酸片段的SEQ ID NO：1序列中分离出来的核酸分子，所述片段当结合到表达载体或包括SEQ ID NO：1序列的高转录活性区域或至少与SEQ ID NO：1序列有80％以上同源性的核酸片段上时，能够增加感兴趣的重组蛋白的表达，当结合到表达载体上时，所述片段能够增强感兴趣重组蛋白的表达。

从包含能够当与表达载体结合时增加感兴趣的重组蛋白的表达的核酸片段的SEQ IDNO：1序列中分离出来的核酸分子相应地核酸序列如下：

1	TGGAAACAGA	ACTAAATAG	AGACATAGAG	AAAATGAACA	GAAGTTATGA
1	TGGAAACAGA	ACTAAATAG	AGACATAGAG	AAAATGAACA	GAAGTTATGA	51	ACCAAATGGA	TTTAACCGGT	ATTTATACAA	CATTTCATCT	TAAAACAAAA
101	GAATATACCT	TCTTCTCAGC	ACCTCATAGC	CTCTTCTACN	AAACCATATA	51	ACCAAATGGA	TTTAACCGGT	ATTTATACAA	CATTTCATCT	TAAAACAAAA
101	GAATATACCT	TCTTCTCAGC	ACCTCATAGC	CTCTTCTACN	AAACCATATA	151	GTCGGTCACN	AAACAAGCCT	CAACAGATAC	AAGAAGATAA	AAATAATCCC
201	ATGCATACTA	TCAGATCACC	ATGGACTAAC	TCTGGTCTTC	AATAACAACA	151	GTCGGTCACN	AAACAAGCCT	CAACAGATAC	AAGAAGATAA	AAATAATCCC
201	ATGCATACTA	TCAGATCACC	ATGGACTAAC	TCTGGTCTTC	AATAACAACA	251	AAAACAATGG	AAGTCGAAGA	ACACTCTATT	CAATGATAAC	TTGGTCAAGG
301	AAGAGATGAA	AAAGGAAATT	AAAGCCTTTT	TAGAATTTCA	TGAAAATGAA	251	AAAACAATGG	AAGTCGAAGA	ACACTCTATT	CAATGATAAC	TTGGTCAAGG
301	AAGAGATGAA	AAAGGAAATT	AAAGCCTTTT	TAGAATTTCA	TGAAAATGAA	351	GGCACAACAT	ACCCAAACTT	ATGAGACACA	AGGAAAGCAG	TGCTAAGAGG
401	AAAACTCATA	GCTCTGAGTG	CCTCCAAAAA	GAAACAAGAG	AGAGTGTATA	351	GGCACAACAT	ACCCAAACTT	ATGAGACACA	AGGAAAGCAG	TGCTAAGAGG
401	AAAACTCATA	GCTCTGAGTG	CCTCCAAAAA	GAAACAAGAG	AGAGTGTATA	451	CTAGCAGCTT	GAGAGCACAC	CTGAAAGCTC	TAGAACAAAA	AGAAGCAAAT
501	ACACCCAAGA	GGAGAAGATC	AAATGCAGGG	CTGAAATCAA	CCAAGTAGAA	451	CTAGCAGCTT	GAGAGCACAC	CTGAAAGCTC	TAGAACAAAA	AGAAGCAAAT
501	ACACCCAAGA	GGAGAAGATC	AAATGCAGGG	CTGAAATCAA	CCAAGTAGAA	551	ACAAAAGAAC	TGTAAAAAGA	ACCAACAAAA	CCAGGAGTTG	GTTGGTTGAG
601	AAAATCAAAA	AGATAAATAA	ACCCTTAATC	AGAATAACCA	GAGGGCACAG	551	ACAAAAGAAC	TGTAAAAAGA	ACCAACAAAA	CCAGGAGTTG	GTTGGTTGAG
601	AAAATCAAAA	AGATAAATAA	ACCCTTAATC	AGAATAACCA	GAGGGCACAG	651	AAACAGTATC	CAAATTAACA	AAATAAGAAA	TGGAAAGGGA	GACGTAAAAC
701	AGAATCCGAG	GAAATAAAAA	AAAATTGATC	CTATTACAAA	AGTCTATATT	651	AAACAGTATC	CAAATTAACA	AAATAAGAAA	TGGAAAGGGA	GACGTAAAAC
701	AGAATCCGAG	GAAATAAAAA	AAAATTGATC	CTATTACAAA	AGTCTATATT	751	CAACAAAGCT	GGAAAATCTG	GATGAAATAG	ACAATTTTCT	AGATAGATAC
801	CAGATACCAA	AGTTAAATCA	GGACCAGATA	AATCATCTAA	ACAGTCCCAT	751	CAACAAAGCT	GGAAAATCTG	GATGAAATAG	ACAATTTTCT	AGATAGATAC
801	CAGATACCAA	AGTTAAATCA	GGACCAGATA	AATCATCTAA	ACAGTCCCAT	851	AACTCCTAAA	GAAATAGAAG	CAGTTATTAA	AATTCTCCCG	ACCAAAAAAA
901	AAAAAAAAAA	AAAGCCCAGG	ATTGGATGGG	TTTAGTGGAG	AATTCTATCA	851	AACTCCTAAA	GAAATAGAAG	CAGTTATTAA	AATTCTCCCG	ACCAAAAAAA
901	AAAAAAAAAA	AAAGCCCAGG	ATTGGATGGG	TTTAGTGGAG	AATTCTATCA	951	GACCTTCATC	AAAGACCTAA	TACCAATACT	GTCCAAACTA	TTCCTTGCAA
1001	CACTGAATAT	TCCGCATACA	CTATTCACAG	AAAAGCATCT	TACGGATGGC	951	GACCTTCATC	AAAGACCTAA	TACCAATACT	GTCCAAACTA	TTCCTTGCAA
1001	CACTGAATAT	TCCGCATACA	CTATTCACAG	AAAAGCATCT	TACGGATGGC	1051	ATGACAGTAA	GAGAATTATG	CAGTGCTGCC	ATAACCATGA	GTGATAACAC
1101	TGCGGCCAAC	TTACTTCTGA	CAACGATCGG	AGGACCGAAG	GAGCTAACCG	1051	ATGACAGTAA	GAGAATTATG	CAGTGCTGCC	ATAACCATGA	GTGATAACAC
1101	TGCGGCCAAC	TTACTTCTGA	CAACGATCGG	AGGACCGAAG	GAGCTAACCG	1151	CTTTTTTGCA	CAACATGGGG	GATCATGTAA	CTCGCCTTGA	TCGTTGGGAA
1201	CCGGAGCTGA	ATGAAGCCAT	ACCAAACGAC	GAGCGTGACA	CCACGATGCC	1151	CTTTTTTGCA	CAACATGGGG	GATCATGTAA	CTCGCCTTGA	TCGTTGGGAA

1251	TGTAGCAATG	GCAACAACGT	TGCGCAAACT	ATTAACTGGC	GAACTATTA
1251	TGTAGCAATG	GCAACAACGT	TGCGCAAACT	ATTAACTGGC	GAACTATTA	1301	CTCTAGCTTC	CCGGCAACAA	TTAATAGACT	GGATGGAGGC	GGATAAAGTT
1351	GCAGGACCAC	TTCTGCGCTC	GGCCCTTCCG	GCTGGCTGGT	TTATTGCTGA	1301	CTCTAGCTTC	CCGGCAACAA	TTAATAGACT	GGATGGAGGC	GGATAAAGTT
1351	GCAGGACCAC	TTCTGCGCTC	GGCCCTTCCG	GCTGGCTGGT	TTATTGCTGA	1401	TAAATCTGGA	GCCGGTGAGC	GTGGGTCTCG	CGGTATCATT	GCAGCACTGG
1451	GGCCAGATGG	TAAGCCCTCC	CGTATCGTAG	TTATCTACAC	GACGGGGAGT	1401	TAAATCTGGA	GCCGGTGAGC	GTGGGTCTCG	CGGTATCATT	GCAGCACTGG
1451	GGCCAGATGG	TAAGCCCTCC	CGTATCGTAG	TTATCTACAC	GACGGGGAGT	1501	CAGGCAACTA	TGGATGAACG	AAATAGACAG	ATCGCTGAGA	TAGGTGCCTC
1551	ACTGATTAAG	CATTGGTAAC	TGTCAGACCA	AGTTTACTCA	TATATACTTT	1501	CAGGCAACTA	TGGATGAACG	AAATAGACAG	ATCGCTGAGA	TAGGTGCCTC
1551	ACTGATTAAG	CATTGGTAAC	TGTCAGACCA	AGTTTACTCA	TATATACTTT	1601	AGATTGATTT	AAAACTTCAT	TTTTAATTTA	AAAGGATCTA	GGTGAAGATC
1651	CTTTTTGATA	ATCTCATGAC	CAAAATCCCT	TAACGTGAGT	TTTCGTTCCA	1601	AGATTGATTT	AAAACTTCAT	TTTTAATTTA	AAAGGATCTA	GGTGAAGATC
1651	CTTTTTGATA	ATCTCATGAC	CAAAATCCCT	TAACGTGAGT	TTTCGTTCCA	1701	CTGAGCGTCA	GACCCCGTAG	AAAAGATCAA	AGGATCTTCT	TGAGATCCTT
1751	TTTTTCTGCG	CGTAATCTGC	TGCTTGCAAA	CAAAAAAACC	ACCGCTACCA	1701	CTGAGCGTCA	GACCCCGTAG	AAAAGATCAA	AGGATCTTCT	TGAGATCCTT
1751	TTTTTCTGCG	CGTAATCTGC	TGCTTGCAAA	CAAAAAAACC	ACCGCTACCA	1801	GCGGTGGTTT	GTTTGCCGGA	TCAAGAGCTA	CCAACTCTTT	TTCCGAAGGT
1851	AACTGGCTTC	AGCAGAGCGC	AGATACCAAA	TACTGTCCTT	CTAGTGTAGC	1801	GCGGTGGTTT	GTTTGCCGGA	TCAAGAGCTA	CCAACTCTTT	TTCCGAAGGT
1851	AACTGGCTTC	AGCAGAGCGC	AGATACCAAA	TACTGTCCTT	CTAGTGTAGC	1901	CGTAGTTAGG	CCACCACTTC	AAGAACTCTG	TAGCACCGCC	TACATACCTC
1951	GCTCTGCTAA	TCCTGTTACC	AGTGGCTGCT	GCCAGTGGCG	ATAAGTCGTG	1901	CGTAGTTAGG	CCACCACTTC	AAGAACTCTG	TAGCACCGCC	TACATACCTC
1951	GCTCTGCTAA	TCCTGTTACC	AGTGGCTGCT	GCCAGTGGCG	ATAAGTCGTG	2001	TCTTACCGGG	TTGGACTCAA	GACGATAGTT	ACCGGATAAG	GCGCAGCGGT
2051	CGGGCTGAAC	GGGGGGTTCG	TGCACACAGC	CCAGCTTGGA	GCGAACGACC	2001	TCTTACCGGG	TTGGACTCAA	GACGATAGTT	ACCGGATAAG	GCGCAGCGGT
2051	CGGGCTGAAC	GGGGGGTTCG	TGCACACAGC	CCAGCTTGGA	GCGAACGACC	2101	TACACCGAAC	TGAGATACCT	ACAGCGTGAG	CTATGAGAAA	GCGCCACGCT
2151	TCCCGAAGGG	AGAAAGGCGG	ACAGGTATCC	GGTAAGCGGC	AGGGTCGGAA	2101	TACACCGAAC	TGAGATACCT	ACAGCGTGAG	CTATGAGAAA	GCGCCACGCT
2151	TCCCGAAGGG	AGAAAGGCGG	ACAGGTATCC	GGTAAGCGGC	AGGGTCGGAA	2201	CAGGAGAGCG	CACGAGGGAG	CTTCCAGGGG	GAAACGCCTG	GTATCTTTAT
2251	AGTCCTGTCG	GGTTTCGCCA	CCTCTGACTT	GAGCGTCGAT	TTTTGTGATG	2201	CAGGAGAGCG	CACGAGGGAG	CTTCCAGGGG	GAAACGCCTG	GTATCTTTAT
2251	AGTCCTGTCG	GGTTTCGCCA	CCTCTGACTT	GAGCGTCGAT	TTTTGTGATG	2301	CTCGTCAGGG	GGGCGGAGCC	TATGGAAAAA	CGCCAGCAAC	GCGGCCTTTT
2351	TACGGTTCCT	GGCCTTTTGC	TGGCCTTTTG	CTCACATGGC	TCGACAGATC	2301	CTCGTCAGGG	GGGCGGAGCC	TATGGAAAAA	CGCCAGCAAC	GCGGCCTTTT
2351	TACGGTTCCT	GGCCTTTTGC	TGGCCTTTTG	CTCACATGGC	TCGACAGATC	2401	CATGTTCTTT	CCTGCGTTAT	CCCCTGATTC	TGTGGATAAC	CGTATTACCG
2451	CCTTTGAGTG	AGCTGATACC	GCTCGCCGCA	GCCGAACGAC	CGAGCGCAGC	2401	CATGTTCTTT	CCTGCGTTAT	CCCCTGATTC	TGTGGATAAC	CGTATTACCG
2451	CCTTTGAGTG	AGCTGATACC	GCTCGCCGCA	GCCGAACGAC	CGAGCGCAGC	2501	GAGTCAGTGA	GCGAGGAAGC	GGAAGAGCGC	CTGATGCGGT	ATTTTCTCCT
2551	TACGCATCTG	TGCGGTATTT	CACACCGCAT	ATGGTGCACT	CTCAGTACAA	2501	GAGTCAGTGA	GCGAGGAAGC	GGAAGAGCGC	CTGATGCGGT	ATTTTCTCCT
2551	TACGCATCTG	TGCGGTATTT	CACACCGCAT	ATGGTGCACT	CTCAGTACAA	2601	TCTGCTCTGA	TGCCGCATAG	TTAAGCCAGA	GAAGTACCTA	TTCCGAAGTT
2651	CCTATTCTCT	AGAAAGTATA	GGAACTTCTC	ATGTTCTTTC	CTGCGTTATC	2601	TCTGCTCTGA	TGCCGCATAG	TTAAGCCAGA	GAAGTACCTA	TTCCGAAGTT
2651	CCTATTCTCT	AGAAAGTATA	GGAACTTCTC	ATGTTCTTTC	CTGCGTTATC	2701	CCCTGATTCT	GTGGATAACC	GTATTACCGC	CTTTGAGTGA	GCTGATACCG
2751	CTCGCCGCAG	CCGAACGACC	GAGCGCAGCG	AGTCAGTGAG	CGAGGAAGCG	2701	CCCTGATTCT	GTGGATAACC	GTATTACCGC	CTTTGAGTGA	GCTGATACCG
2751	CTCGCCGCAG	CCGAACGACC	GAGCGCAGCG	AGTCAGTGAG	CGAGGAAGCG	2801	GAAGAGCGCC	TGATGCGGTA	TTTTCTCCTT	ACGCATCTGT	GCGGTATTTC
2851	ACACCGCATA	TGGTGCACTC	TCAGTACAAT	CTGCTCTGAT	GCCGCATAGT	2801	GAAGAGCGCC	TGATGCGGTA	TTTTCTCCTT	ACGCATCTGT	GCGGTATTTC
2851	ACACCGCATA	TGGTGCACTC	TCAGTACAAT	CTGCTCTGAT	GCCGCATAGT	2901	TAAGCCAGCT	AGAGGATCAT	AATCAGCCAT	ACCACATTTG	TAGAGGTTTT
2951	ACTTGCTTTA	AAAAACCTCC	CACACCTCCC	CCTGAACCTG	AAACATAAAA	2901	TAAGCCAGCT	AGAGGATCAT	AATCAGCCAT	ACCACATTTG	TAGAGGTTTT
2951	ACTTGCTTTA	AAAAACCTCC	CACACCTCCC	CCTGAACCTG	AAACATAAAA	3001	TGAATGCAAT	TGTTGTTGTT	AACTTGTTTA	TTGCAGCTTA	TAATGGTTAC
3051	AAATAAAGCA	ATAGCATCAC	AAATTTCACA	AATAAAGCAT	TTTTTTCACT	3001	TGAATGCAAT	TGTTGTTGTT	AACTTGTTTA	TTGCAGCTTA	TAATGGTTAC
3051	AAATAAAGCA	ATAGCATCAC	AAATTTCACA	AATAAAGCAT	TTTTTTCACT	3101	GCATTCTAGT	TGTGGTTTGT	CCAAACTCAT	CAATGTATCT	TATCATGTCT
3151	GGATCCCCAG	GAAGCTCCTC	TGTGTCCTCA	TAAACCCTAA	CCTCCTCTAC	3101	GCATTCTAGT	TGTGGTTTGT	CCAAACTCAT	CAATGTATCT	TATCATGTCT
3151	GGATCCCCAG	GAAGCTCCTC	TGTGTCCTCA	TAAACCCTAA	CCTCCTCTAC	3201	TTGAGAGGAC	ATTCCAATCA	TAGGCTGCCC	ATCCACCCTC	TGTGTCCTCC
3251	TGTTAATTAG	GTCACTTAAC	AAAAAGGAAA	TTGGGTAGGG	GTTTTTCACA	3201	TTGAGAGGAC	ATTCCAATCA	TAGGCTGCCC	ATCCACCCTC	TGTGTCCTCC
3251	TGTTAATTAG	GTCACTTAAC	AAAAAGGAAA	TTGGGTAGGG	GTTTTTCACA	3301	GACCGCTTTC	TAAGGGTAAT	TTTAAAATAT	CTGGGAAGTC	CCTTCCACTG
3351	CTGTGTTCCA	GAAGTGTTGG	TAAACAGCCC	ACAAATGTCA	ACAGCAGAAA	3301	GACCGCTTTC	TAAGGGTAAT	TTTAAAATAT	CTGGGAAGTC	CCTTCCACTG

3401	CATACAAGCT	GTCAGCTTTG	CACAAGGGCC	CAACACCCTG	CTCATCAAGA
3401	CATACAAGCT	GTCAGCTTTG	CACAAGGGCC	CAACACCCTG	CTCATCAAGA	3451	AGCACTGTGG	TTGCTGTGTT	AGTAATGTGC	AAAACAGGAG	GCACATTTTC
3501	CCCACCTGTG	TAGGTTCCAA	AATATCTAGT	GTTTTCATTT	TTACTTGGAT	3451	AGCACTGTGG	TTGCTGTGTT	AGTAATGTGC	AAAACAGGAG	GCACATTTTC
3501	CCCACCTGTG	TAGGTTCCAA	AATATCTAGT	GTTTTCATTT	TTACTTGGAT	3551	CAGGAACCCA	GCACTCCACT	GGATAAGCAT	TATCCTTATC	CAAAACAGCC
3601	TTGTGGTCAG	TGTTCATCTG	CTGACTGTCA	ACTGTAGCAT	TTTTTGGGGT	3551	CAGGAACCCA	GCACTCCACT	GGATAAGCAT	TATCCTTATC	CAAAACAGCC
3601	TTGTGGTCAG	TGTTCATCTG	CTGACTGTCA	ACTGTAGCAT	TTTTTGGGGT	3651	TACAGTTTGA	GCAGGATATT	TGGTCCTGTA	GTTTGCTAAC	ACACCCTGCA
3701	GCTCCAAAGG	TTCCCCACCA	ACAGCAAAAA	AATGAAAATT	TGACCCTTGA	3651	TACAGTTTGA	GCAGGATATT	TGGTCCTGTA	GTTTGCTAAC	ACACCCTGCA
3701	GCTCCAAAGG	TTCCCCACCA	ACAGCAAAAA	AATGAAAATT	TGACCCTTGA	3751	ATGGGTTTTC	CAGCACCATT	TTCATGAGTT	TTTTGTGTCC	CTGAATGCAA
3801	GTTTAACATA	GCAGTTACCC	CAATAACCTC	AGTTTTAACA	GTAACAGCTT	3751	ATGGGTTTTC	CAGCACCATT	TTCATGAGTT	TTTTGTGTCC	CTGAATGCAA
3801	GTTTAACATA	GCAGTTACCC	CAATAACCTC	AGTTTTAACA	GTAACAGCTT	3851	CCCACATCAA	AATATTTCCA	CAGGTTAAGT	CCTCATTTAA	ATTAGGCAAA
3901	GGAATTCTTG	AAGACGAAAG	GGCCTCG TGA	TACGCCTATT	TTTATAGGTT	3851	CCCACATCAA	AATATTTCCA	CAGGTTAAGT	CCTCATTTAA	ATTAGGCAAA
3901	GGAATTCTTG	AAGACGAAAG	GGCCTCG TGA	TACGCCTATT	TTTATAGGTT	3951	AATGTCATGA	TAATAATGGT	TTCTTAGACG	TCAGGTGGCA	CTTTTCGGGG
4001	AAATGTGCGC	GGAACCCCTA	TTTGTTTATT	TTTCTAAA.TA	CATTCAAATA	3951	AATGTCATGA	TAATAATGGT	TTCTTAGACG	TCAGGTGGCA	CTTTTCGGGG
4001	AAATGTGCGC	GGAACCCCTA	TTTGTTTATT	TTTCTAAA.TA	CATTCAAATA	4051	TGTATCCGCT	CATGAGACAA	TAACCCTGAT	AAATGCTTCA	ATAATATTGA
4101	AAAAGGAAGA	GTATGAGTAT	TCAACATTTC	CGTGTCGCCC	TTATTCCCTT	4051	TGTATCCGCT	CATGAGACAA	TAACCCTGAT	AAATGCTTCA	ATAATATTGA
4101	AAAAGGAAGA	GTATGAGTAT	TCAACATTTC	CGTGTCGCCC	TTATTCCCTT	4151	TTTTGCGGCA	TTTTGCCTTC	CTGTTTTTGC	TCACCCAGAA	ACGCTGGTGA
4201	AAGTAAAAGA	TGCTGAAGAT	CAGTTGGGTG	CACGAGTGGG	TTACATCGAA	4151	TTTTGCGGCA	TTTTGCCTTC	CTGTTTTTGC	TCACCCAGAA	ACGCTGGTGA
4201	AAGTAAAAGA	TGCTGAAGAT	CAGTTGGGTG	CACGAGTGGG	TTACATCGAA	4251	CTGGATCTCA	ACAGCGGTAA	GATCCTTGAG	AGTTTTCGCC	CCGAAGAACG
4301	TTTTCCAATG	ATGAGCACTT	TTAAAGTTCT	GCTATGTGGC	GCGGTATTAT	4251	CTGGATCTCA	ACAGCGGTAA	GATCCTTGAG	AGTTTTCGCC	CCGAAGAACG
4301	TTTTCCAATG	ATGAGCACTT	TTAAAGTTCT	GCTATGTGGC	GCGGTATTAT	4351	CCCGTGTTGA	CGCCGGGCAA	GAGCAACTCG	GTCGCCGCAT	ACACTATTCT
4401	CAGAATGACT	TGGTTGAGT				4351	CCCGTGTTGA	CGCCGGGCAA	GAGCAACTCG	GTCGCCGCAT	ACACTATTCT

具有上面出现的序列的，从包含当与表达载体结合时能增加感兴趣的重组蛋白的表达的核酸片段的SEQ ID NO：1序列中分离出来的核酸分子具有下列特征(位置是根据序列上的核酸的编码给出的，所述编码系统已经在前面详述过)：

-从位置1到位置1024：基因组序列；

-从位置2631到位置2678：Frt位点；

-从位置1025到位置4419：在删除后目标载体留在原处的序列。

对应于当与表达载体结合时能够增强感兴趣的重组蛋白表达的核酸片段的核酸序列如下(SEQ ID NO：4)：

1	TGGAAACAGA	AACTAAATAG	AGACATAGAG	AAAATGAACA	GAAGTTATGA
1	TGGAAACAGA	AACTAAATAG	AGACATAGAG	AAAATGAACA	GAAGTTATGA	51	ACCAAATGGA	TTTAACCGGT	ATTTATACAA	CATTTCATCT	TAAAACAAAA
101	GAATATACCT	TCTTCTCAGC	ACCTCATAGC	CTCTTCTACN	AAACCATATA	51	ACCAAATGGA	TTTAACCGGT	ATTTATACAA	CATTTCATCT	TAAAACAAAA
101	GAATATACCT	TCTTCTCAGC	ACCTCATAGC	CTCTTCTACN	AAACCATATA	151	GTCGGTCACN	AAACAAGCCT	CAACAGATAC	AAGAAGATAA	AAATAATCCC
201	ATGCATACTA	TCAGATCACC	ATGGACTAAC	TCTGGTCTTC	AATAACAACA	151	GTCGGTCACN	AAACAAGCCT	CAACAGATAC	AAGAAGATAA	AAATAATCCC
201	ATGCATACTA	TCAGATCACC	ATGGACTAAC	TCTGGTCTTC	AATAACAACA	251	AAAACAATGG	AAGTCGAAGA	ACACTCTATT	CAATGATAAC	TTGGTCAAGG
301	AAGAGATGAA	AAAGGAAATT	AAAGCCTTTT	TAGAATTTCA	TGAAAATGAA	251	AAAACAATGG	AAGTCGAAGA	ACACTCTATT	CAATGATAAC	TTGGTCAAGG
301	AAGAGATGAA	AAAGGAAATT	AAAGCCTTTT	TAGAATTTCA	TGAAAATGAA	351	GGCACAACAT	ACCCAAACTT	ATGAGACACA	AGGAAAGCAG	TGCTAAGAGG
401	AAAACTCATA	GCTCTGAGTG	CCTCCAAAAA	GAAACAAGAG	AGAGTGTATA	351	GGCACAACAT	ACCCAAACTT	ATGAGACACA	AGGAAAGCAG	TGCTAAGAGG
401	AAAACTCATA	GCTCTGAGTG	CCTCCAAAAA	GAAACAAGAG	AGAGTGTATA	451	CTAGCAGCTT	GAGAGCACAC	CTGAAAGCTC	TAGAACAAAA	AGAAGCAAAT
501	ACACCCAAGA	GGAGAAGATC	AAATGCAGGG	CTGAAATCAA	CCAAGTAGAA	451	CTAGCAGCTT	GAGAGCACAC	CTGAAAGCTC	TAGAACAAAA	AGAAGCAAAT

551	ACAAAAGAAC	TGTAAAAAGA	ACCAACAAAA	CCAGGAGTTG	GTTGGTTGAG
551	ACAAAAGAAC	TGTAAAAAGA	ACCAACAAAA	CCAGGAGTTG	GTTGGTTGAG	601	AAAATCAAAA	AGATAAATAA	ACCCTTAATC	AGAATAACCA	GAGGGCACAG
651	AAACAGTATC	CAAATTAACA	AAATAAGAAA	TGGAAAGGGA	GACGTAAAAC	601	AAAATCAAAA	AGATAAATAA	ACCCTTAATC	AGAATAACCA	GAGGGCACAG
651	AAACAGTATC	CAAATTAACA	AAATAAGAAA	TGGAAAGGGA	GACGTAAAAC	701	AGAATCCGAG	GAAATAAAAA	AAAATTGATC	CTATTACAAA	AGTCTATATT
751	CAACAAAGCT	GGAAAATCTG	GATGAAATAG	ACAATTTTCT	AGATAGATAC	701	AGAATCCGAG	GAAATAAAAA	AAAATTGATC	CTATTACAAA	AGTCTATATT
751	CAACAAAGCT	GGAAAATCTG	GATGAAATAG	ACAATTTTCT	AGATAGATAC	801	CAGATACCAA	AGTTAAATCA	GGACCAGATA	AATCATCTAA	ACAGTCCCAT
851	AACTCCTAAA	GAAATAGAAG	CAGTTATTAA	AATTCTCCCG	ACCAAAAAAA	801	CAGATACCAA	AGTTAAATCA	GGACCAGATA	AATCATCTAA	ACAGTCCCAT
851	AACTCCTAAA	GAAATAGAAG	CAGTTATTAA	AATTCTCCCG	ACCAAAAAAA	901	AAAAAAAAAA	AAAGCCCAGG	ATTGGATGGG	TTTAGTGGAG	AATTCTATCA
951	GACCTTCATC	AAAGACCTAA	TACCAATACT	GTCCAAACTA	TTCCTTGCAA	901	AAAAAAAAAA	AAAGCCCAGG	ATTGGATGGG	TTTAGTGGAG	AATTCTATCA
951	GACCTTCATC	AAAGACCTAA	TACCAATACT	GTCCAAACTA	TTCCTTGCAA	1001	CACTGAATAT	TCCGCATACA	CTAT

本发明的另一目标是关于含有SEQ ID NO：1核酸序列的载体。

本发明的另一目标是在其基因组内携带整合到其高转录活性区域的唯一的重组酶识别位点的细胞株，所述细胞株已经在重组酶识别位点整合了转基因的单独拷贝，所述细胞长时间内稳定并且有可能用本发明的方法生产。

这样的细胞株携带有两条在重组酶识别位点一前一后的序列，一条编码感兴趣的蛋白，一条赋予抗生素抗性的基因，定位于紧邻重组酶识别位点的上游和下游，抗生素抗性基因的多腺苷酸序列紧邻抗生素识别位点的下游。

有利地，该细胞株在基因扩增之前具有所述转基因的产率在5到50pcd之间(皮克蛋白每个细胞每24小时)。

有利地，该细胞株以稳定的方式表达所述转基因至少持续三个月。

本发明的另一目标是关于感兴趣蛋白的生产过程，其中本发明的表达感兴趣蛋白的细胞株以所述感兴趣蛋白被表达并能被收获的方式培养。

本发明的另一目标是用于将感兴趣的DNA分子插入哺乳动物细胞的基因组中的载体(“目标载体”)，其携带两个位于报道基因任意一边的重组酶识别位点，编码感兴趣蛋白的基因，允许基因扩增的选择子基因以及赋予抗生素抗性的基因，以及在第二重组酶识别位点下游的多腺苷酸序列。有利地，抗生素抗性基因的多腺苷酸序列是弱多A，其导致在筛选后更高的产率。

有利地，该载体在两个重组酶识别位点之间携带编码I型单纯疱疹病毒胸苷激酶(HSV1-TK)的基因。

本发明的另一目标涉及一用于将感兴趣的DNA分子插入哺乳动物细胞的基因组的目标位点的载体系统，至少包括下列要素：

-如前所述的目标载体，

-表达载体，其在编码所感兴趣蛋白的基因的下游携带重组酶识别位点，以及赋予抗生素抗性的基因，重组酶识别位点直接位于赋予抗生素抗性的基因的上游。

本发明的另一目标是关于以一种方法使用上述载体系统来将感兴趣的DNA分子插入哺乳动物细胞基因组的目标位点，包括以下步骤：

-用所述目标载体转染哺乳动物细胞；

-选择“高产率”细胞，其中已整合了目标载体的单个拷贝；

-使用重组酶切除目标载体；

-选择目标载体已被切除且具有完整识别位点的细胞；

-用所述表达载体转染步骤4)中选择的细胞；

-使用重组酶将表达载体整合到完整的识别位点；

-通过对所感兴趣蛋白表达的测试选择携带整合到目标位点的表达载体的细胞。有利地，为了阻止随机整合，选择将在高浓度抗生素存在的情况下进行。

本发明的其他方面和优势将在下面的示例中进行描述，展示这些示例是出于解释的目的，而不应被认为限制本发明的范围。

具体实施方式

示例1：用于产生在其高转录活性区域整合了唯一的重组酶识别位点的细胞株的载体的构建

a.目标载体pTV1(见图1)：

-转录单元：目标载体pTV1通过下列转录单元构建(SEQ ID NO：2)(图1)：

1-maxFP-Green转录单元(荧光报道基因)，包含(按顺序)最小CMV启动子(前人巨噬细胞基因的启动子而不带有活性部分或增强子)，编码maxFP^TM-Green蛋白(Evrogen)的基因和后SV40(猿猴病毒40)多腺苷酸序列(多A)

2-抗-D抗体的重链的转录单元，按这样的次序：RSV启动子(劳氏肉瘤病毒的长终端重复)，源于pCi-néo载体的人工内含子，抗-D免疫球蛋白的重链序列以及bGH(牛生长激素)多A序列，

3-含有除免疫球蛋白轻链序列外与抗体重链转录单元相同成分的抗-D抗体的轻链转录单元以及bGH多A序列。

4-包含SV40启动子的新转录单元，新霉素抗性基因和具有“弱”多A活性的SV40前多腺苷酸信号的序列，

5-含有SV40启动子的DHFR(二氢叶酸还原酶)转录单元，为了废除ScaI限制性位点(其变异在基因产物中是沉默的)和其多A位点，用定向变异修饰DHFR选择子基因，

6-含有SV40启动子的HSV1-TK转录单元，编码1型单纯疱疹病毒胸苷激酶(HSV1-TK)的自杀基因和“SV40前多A”序列。

-Frt重组位点的合成：

Frt重组位点通过PCR使用下列引物合成：

上游引物(SEQ ID NO：5)：

5′-ACAGCTGTCGACTGAAGTACCTATTCCGAAGTTCCTATTCTCTAGAAAGT-3′

下游引物(SEQ ID NO：6)：

5′-CGTCCGGATATCTAAGATCTGAAGTTCCTATACTTTCTAGAGAATAGGAA-3′

产生的PCR产物包含Frt位点(用粗体斜体表示)以及限制性位点(下划线表示)，允许随后在目标载体pTV1中克隆pTV1(SEQ ID NO：7)：

AGACGTCTCGACT

SalI Frt site

AGATCTTAGATATCCGGACG

BglII EcoRV

第一Frt位点(Frt1)在pTV1载体的maxFP-Green转录单元上游被克隆。第二Frt位点(Frt2)与Frt1同样道理在HSV1-TK基因和其多腺苷酸位点“SV40前多A”之间被克隆。目标载体pTV1相应的核酸序列如下(SEQ ID NO：2)：

1	GAAGTACCTA	TTCCGAAGTT	CCTATTCTCT	AGAAAGTATA	GGAACTTCTA
1	GAAGTACCTA	TTCCGAAGTT	CCTATTCTCT	AGAAAGTATA	GGAACTTCTA	51	CAGAGATCCG	CCCGCCCCGT	TGACGCAAAT	GGGCGGTAGG	CGTGTACGGT
101	GGGAGGTCTA	TATAAGCAGA	GCTCGTTTAG	TGAACCGTCA	GATCACTAGA	51	CAGAGATCCG	CCCGCCCCGT	TGACGCAAAT	GGGCGGTAGG	CGTGTACGGT
101	GGGAGGTCTA	TATAAGCAGA	GCTCGTTTAG	TGAACCGTCA	GATCACTAGA	151	AGCTTTATTG	CGGTAGTTTA	TCACAGTTAA	ATTGCTAACG	CAGTCAGTGC
201	TTCTGACACA	ACAGTCTCGA	ACTTAAGCTG	CAGTGACTCT	CTTAAGGTAG	151	AGCTTTATTG	CGGTAGTTTA	TCACAGTTAA	ATTGCTAACG	CAGTCAGTGC
201	TTCTGACACA	ACAGTCTCGA	ACTTAAGCTG	CAGTGACTCT	CTTAAGGTAG	251	CCTTGCAGAA	GTTGGTCGTG	AGGCACTGGG	CAGGTAAGTA	TCAAGGTTAC
301	AAGACAGGTT	TAAGGAGACC	AATAGAAACT	GGGCTTGTCG	AGACAGAGAA	251	CCTTGCAGAA	GTTGGTCGTG	AGGCACTGGG	CAGGTAAGTA	TCAAGGTTAC
301	AAGACAGGTT	TAAGGAGACC	AATAGAAACT	GGGCTTGTCG	AGACAGAGAA	351	GACTCTTGCG	TTTCTGATAG	GCACCTATTG	GTCTTACTG A	CATCCACTTT
401	GCCTTTCTCT	CCACAGGTGT	CCACTCCCAG	TTCAATTACA	GCTCTTAAGG	351	GACTCTTGCG	TTTCTGATAG	GCACCTATTG	GTCTTACTG A	CATCCACTTT
401	GCCTTTCTCT	CCACAGGTGT	CCACTCCCAG	TTCAATTACA	GCTCTTAAGG	451	CTAGAGTGGG	ATCCACCGGT	CGCCACCATG	GAGAGCGACG	AGAGCGGCCT
501	GCCCGCCATG	GAGATCGAGT	GCCGCATCAC	CGGCACCCTG	AACGGCGTGG	451	CTAGAGTGGG	ATCCACCGGT	CGCCACCATG	GAGAGCGACG	AGAGCGGCCT
501	GCCCGCCATG	GAGATCGAGT	GCCGCATCAC	CGGCACCCTG	AACGGCGTGG	551	AGTTCGAGCT	GGTGGGCGGC	GGAGAGGGCA	CCCCCGAGCA	GGGCCGCATG
601	ACCAACAAGA	TGAAGAGCAC	CAAAGGCGCC	CTGACCTTCA	GCCCCTACCT	551	AGTTCGAGCT	GGTGGGCGGC	GGAGAGGGCA	CCCCCGAGCA	GGGCCGCATG
601	ACCAACAAGA	TGAAGAGCAC	CAAAGGCGCC	CTGACCTTCA	GCCCCTACCT	651	GCTGAGCCAC	GTGATGGGCT	ACGGCTTCTA	CCACTTCGGC	ACCTACCCCA
701	GCGGCTACGA	GAACCCCTTC	CTGCACGCCA	TCAACAACGG	CGGCTACACC	651	GCTGAGCCAC	GTGATGGGCT	ACGGCTTCTA	CCACTTCGGC	ACCTACCCCA
701	GCGGCTACGA	GAACCCCTTC	CTGCACGCCA	TCAACAACGG	CGGCTACACC	751	AACACCCGCA	TCGAGAAGTA	CGAGGACGGC	GGCGTGCTGC	ACGTGAGCTT
801	CAGCTACCGC	TACGAGGCCG	GCCGCGTGAT	CGGCGACTTC	AAGGTGATGG	751	AACACCCGCA	TCGAGAAGTA	CGAGGACGGC	GGCGTGCTGC	ACGTGAGCTT
801	CAGCTACCGC	TACGAGGCCG	GCCGCGTGAT	CGGCGACTTC	AAGGTGATGG	851	GCACCGGCTT	CCCCGAGGAC	AGCGTGATCT	TCACCGACAA	GATCATCCGC
901	AGCAACGCCA	CCGTGGAGCA	CCTGCACCCC	ATGGGCGATA	ACGATCTGGA	851	GCACCGGCTT	CCCCGAGGAC	AGCGTGATCT	TCACCGACAA	GATCATCCGC
901	AGCAACGCCA	CCGTGGAGCA	CCTGCACCCC	ATGGGCGATA	ACGATCTGGA	951	TGGCAGCTTC	ACCCGCACCT	TCAGCCTGCG	CGACGGCGGC	TACTACAGCT
1001	CCGTGGTGGA	CAGCCACATG	CACTTCAAGA	GCGCCATCCA	CCCCAGCATC	951	TGGCAGCTTC	ACCCGCACCT	TCAGCCTGCG	CGACGGCGGC	TACTACAGCT
1001	CCGTGGTGGA	CAGCCACATG	CACTTCAAGA	GCGCCATCCA	CCCCAGCATC	1051	CTGCAGAACG	GGGGCCCCAT	GTTCGCCTTC	CGCCGCGTGG	AGGAGGATCA
1101	CAGCAACACC	GAGCTGGGCA	TCGTGGAGTA	CCAGCACGCC	TTCAAGACCC	1051	CTGCAGAACG	GGGGCCCCAT	GTTCGCCTTC	CGCCGCGTGG	AGGAGGATCA
1101	CAGCAACACC	GAGCTGGGCA	TCGTGGAGTA	CCAGCACGCC	TTCAAGACCC	1151	CGGATGCAGA	TGCCGGTGAA	GAATAAAGCG	GCCTAGGGAT	AACAGGGTAA
1201	TGGCCGCGAC	TCTAGATCAT	AATCAGCCAT	ACCACATTTG	TAGAGGTTTT	1151	CGGATGCAGA	TGCCGGTGAA	GAATAAAGCG	GCCTAGGGAT	AACAGGGTAA
1201	TGGCCGCGAC	TCTAGATCAT	AATCAGCCAT	ACCACATTTG	TAGAGGTTTT	1251	ACTTGCTTTA	AAAAACCTCC	CACACCTCCC	CCTGAACCTG	AAACATAAAA
1301	TGAATGCAAT	TGTTGTTGTT	AACTTGTTTA	TTGCAGCTTA	TAATGGTTAC	1251	ACTTGCTTTA	AAAAACCTCC	CACACCTCCC	CCTGAACCTG	AAACATAAAA
1301	TGAATGCAAT	TGTTGTTGTT	AACTTGTTTA	TTGCAGCTTA	TAATGGTTAC	1351	AAATAAAGCA	ATAGCATCAC	AAATTTCACA	AATAAAGCAT	TTTTTTCACT
1401	GCATTCTAGT	TGTGGTTTGT	CCAAACTCAT	CAATGTATCT	TAAGGCGTAA	1351	AAATAAAGCA	ATAGCATCAC	AAATTTCACA	AATAAAGCAT	TTTTTTCACT
1401	GCATTCTAGT	TGTGGTTTGT	CCAAACTCAT	CAATGTATCT	TAAGGCGTAA	1451	ATTGTAAGCG	TTAATATTTT	GTTAAAATTC	GCGTTAAATT	TTTGTTAAAT
1501	CAGCTCATTT	TTTAACCAAT	AGGCCGAAAT	CGGCAAAATC	CCTTATAAAT	1451	ATTGTAAGCG	TTAATATTTT	GTTAAAATTC	GCGTTAAATT	TTTGTTAAAT
1501	CAGCTCATTT	TTTAACCAAT	AGGCCGAAAT	CGGCAAAATC	CCTTATAAAT	1551	CAAAAGAATA	GACCGAGATA	GGGTTGAGTG	TTGTTCCAGT	TTGGAACAAG
1601	AGTCCACTAT	TAAAGAACGT	GGACTCCAAC	GTCAAAGGGC	GAAAAACCGT	1551	CAAAAGAATA	GACCGAGATA	GGGTTGAGTG	TTGTTCCAGT	TTGGAACAAG
1601	AGTCCACTAT	TAAAGAACGT	GGACTCCAAC	GTCAAAGGGC	GAAAAACCGT	1651	CTATCAGGGC	GATGGCCCAC	GATCTTAGAT	ATCCGGACGT	GGATCTCCCG
1701	ATCCCCTATG	GTGCACTCTC	AGTACAATCT	GCTCTGATGC	CGCATAGTTA	1651	CTATCAGGGC	GATGGCCCAC	GATCTTAGAT	ATCCGGACGT	GGATCTCCCG
1701	ATCCCCTATG	GTGCACTCTC	AGTACAATCT	GCTCTGATGC	CGCATAGTTA	1751	AGCCAGTATC	TGCTCCCTGC	TTGTGTGTTG	GAGGTCGCTG	AGTAGTGCGC
1801	GAGCAAAATT	TAAGCTACAA	CAAGGCAAGG	CTTGACCGAC	AATTGCATGA	1751	AGCCAGTATC	TGCTCCCTGC	TTGTGTGTTG	GAGGTCGCTG	AGTAGTGCGC
1801	GAGCAAAATT	TAAGCTACAA	CAAGGCAAGG	CTTGACCGAC	AATTGCATGA	1851	AGAATCTGCT	TAGGGTTAGG	CGTTTTGCGC	TGCTTCGCGA	TGTACGGGCC
1901	AGATATACGC	GTATCTGAGG	GGACTAGGGT	GTGTTTAGGC	GAAAAGCGGG	1851	AGAATCTGCT	TAGGGTTAGG	CGTTTTGCGC	TGCTTCGCGA	TGTACGGGCC

1951	GCTTCGGTTG	TACGCGGTTA	GGAGTCCCCT	CAGGATATAG	TAGTTTCGCT
1951	GCTTCGGTTG	TACGCGGTTA	GGAGTCCCCT	CAGGATATAG	TAGTTTCGCT	2001	TTTGCATAGG	GAGGGGGAAA	TGTAGTCTTA	TGCAATACTC	TTGTAGTCTT
2051	GCAACATGGT	AACGATGAGT	TAGCAACATG	CCTTACAAGG	AGAGAAAAAG	2001	TTTGCATAGG	GAGGGGGAAA	TGTAGTCTTA	TGCAATACTC	TTGTAGTCTT
2051	GCAACATGGT	AACGATGAGT	TAGCAACATG	CCTTACAAGG	AGAGAAAAAG	2101	CACCGTGCAT	GCCGATTGGT	GGAAGTAAGG	TGGTACGATC	GTGCCTTATT
2151	AGGAAGGCAA	CAGACGGGTC	TGACATGGAT	TGGACGAACC	ACTGAATTCC	2101	CACCGTGCAT	GCCGATTGGT	GGAAGTAAGG	TGGTACGATC	GTGCCTTATT
2151	AGGAAGGCAA	CAGACGGGTC	TGACATGGAT	TGGACGAACC	ACTGAATTCC	2201	GCATTGCAGA	GATATTGTAT	TTAAGTGCCT	AGCTCGATAC	AATAAACGCC
2251	ATTTGACCAT	TCACCACATT	GGTGTGCACC	TCCAAGCTTG	GTACCGAGCT	2201	GCATTGCAGA	GATATTGTAT	TTAAGTGCCT	AGCTCGATAC	AATAAACGCC
2251	ATTTGACCAT	TCACCACATT	GGTGTGCACC	TCCAAGCTTG	GTACCGAGCT	2301	CGGATCCACT	AGTGCAGAAG	TTGGTCGTGA	GGCACTGGGC	AGGTAAGTAT
2351	CAAGGTTACA	AGACAGGTTT	AAGGAGACCA	ATAGAAACTG	GGCTTGTCGA	2301	CGGATCCACT	AGTGCAGAAG	TTGGTCGTGA	GGCACTGGGC	AGGTAAGTAT
2351	CAAGGTTACA	AGACAGGTTT	AAGGAGACCA	ATAGAAACTG	GGCTTGTCGA	2401	GACAGAGAAG	ACTCTTGCGT	TTCTGATAGG	CACCTATTGG	TCTTACTGAC
2451	ATCCACTTTG	CCTTTCTCTC	CACAGGTGTC	CACTCCCAGT	TCAATTACAG	2401	GACAGAGAAG	ACTCTTGCGT	TTCTGATAGG	CACCTATTGG	TCTTACTGAC
2451	ATCCACTTTG	CCTTTCTCTC	CACAGGTGTC	CACTCCCAGT	TCAATTACAG	2501	CTCTTGCTAG	TGCCGCCACC	ATGGAGTTTG	GGCTGAGCTG	GGTTTTCCTC
2551	GTTGCTCTTT	TAAGAGGTGT	CCAGTGTCAG	GTGCAGCTGG	TGGAGTCTGG	2501	CTCTTGCTAG	TGCCGCCACC	ATGGAGTTTG	GGCTGAGCTG	GGTTTTCCTC
2551	GTTGCTCTTT	TAAGAGGTGT	CCAGTGTCAG	GTGCAGCTGG	TGGAGTCTGG	2601	GGGAGGCGTG	GTCCAGCCTG	GGAGGTCCCT	GAGACTCTCC	TGTACAGCCT
2651	CTGGATTCAC	CTTCAAAAAC	TATGCTATGC	ATTGGGTCCG	CCAGGCTCCA	2601	GGGAGGCGTG	GTCCAGCCTG	GGAGGTCCCT	GAGACTCTCC	TGTACAGCCT
2651	CTGGATTCAC	CTTCAAAAAC	TATGCTATGC	ATTGGGTCCG	CCAGGCTCCA	2701	GCCAAGGGGC	TGGAGTGGGT	GGCAACTATA	TCATATGATG	GAACGAATAT
2751	ACAATATGCA	GACTCCGTGA	AGGGCCGATT	CACCTTCTCC	AGAGACAATT	2701	GCCAAGGGGC	TGGAGTGGGT	GGCAACTATA	TCATATGATG	GAACGAATAT
2751	ACAATATGCA	GACTCCGTGA	AGGGCCGATT	CACCTTCTCC	AGAGACAATT	2801	CTCAGGACAC	CCTGTATCTG	CAACTGAACA	GCCTCAGACC	GGAGGACACG
2851	GCTGTGTATT	ACTGTGCGAG	ACCCGTAAGA	AGCCGATGGC	TGCAATTAGG	2801	CTCAGGACAC	CCTGTATCTG	CAACTGAACA	GCCTCAGACC	GGAGGACACG
2851	GCTGTGTATT	ACTGTGCGAG	ACCCGTAAGA	AGCCGATGGC	TGCAATTAGG	2901	TCTTGAAGAT	GCTTTTCATA	TCTGGGGCCA	GGGGACAATG	GTCACCGTCT
2951	CTTCAGCCTC	CACCAAGGGC	CCATCGGTCT	TCCCCCTGGC	ACCCTCCTCC	2901	TCTTGAAGAT	GCTTTTCATA	TCTGGGGCCA	GGGGACAATG	GTCACCGTCT
2951	CTTCAGCCTC	CACCAAGGGC	CCATCGGTCT	TCCCCCTGGC	ACCCTCCTCC	3001	AAGAGCACCT	CTGGGGGCAC	AGCGGCCCTG	GGCTGCCTGG	TCAAGGACTA
3051	CTTCCCCGAA	CCGGTGACGG	TGTCGTGGAA	CTCAGGCGCC	CTGACCAGCG	3001	AAGAGCACCT	CTGGGGGCAC	AGCGGCCCTG	GGCTGCCTGG	TCAAGGACTA
3051	CTTCCCCGAA	CCGGTGACGG	TGTCGTGGAA	CTCAGGCGCC	CTGACCAGCG	3101	GCGTGCACAC	CTTCCCGGCT	GTCCTACAGT	CCTCAGGACT	CTACTCCCTC
3151	AGCAGCGTGG	TGACCGTGCC	CTCCAGCAGC	TTGGGCACCC	AGACCTACAT	3101	GCGTGCACAC	CTTCCCGGCT	GTCCTACAGT	CCTCAGGACT	CTACTCCCTC
3151	AGCAGCGTGG	TGACCGTGCC	CTCCAGCAGC	TTGGGCACCC	AGACCTACAT	3201	CTGCAACGTG	AATCACAAGC	CCAGCAACAC	CAAGGTGGAC	AAGAAAGTTG
3251	AGCCCAAATC	TTGTGACAAA	ACTCACACAT	GCCCACCGTG	CCCAGCACCT	3201	CTGCAACGTG	AATCACAAGC	CCAGCAACAC	CAAGGTGGAC	AAGAAAGTTG
3251	AGCCCAAATC	TTGTGACAAA	ACTCACACAT	GCCCACCGTG	CCCAGCACCT	3301	GAACTCCTGG	GGGG ACCGTC	AGTCTTCCTC	TTCCCCCCAA	AACCCAAGGA
3351	CACCCTCATG	ATCTCCCGGA	CCCCTGAGGT	CACATGCGTG	GTGGTGGACG	3301	GAACTCCTGG	GGGG ACCGTC	AGTCTTCCTC	TTCCCCCCAA	AACCCAAGGA
3351	CACCCTCATG	ATCTCCCGGA	CCCCTGAGGT	CACATGCGTG	GTGGTGGACG	3401	TGAGCCACGA	AGACCCTGAG	GTCAAGTTCA	ACTGGTACGT	GGACGGCGTG
3451	GAGGTGCATA	ATGCCAAGAC	AAAGCCGCGG	GAGGAGCAGT	ACAACAGCAC	3401	TGAGCCACGA	AGACCCTGAG	GTCAAGTTCA	ACTGGTACGT	GGACGGCGTG
3451	GAGGTGCATA	ATGCCAAGAC	AAAGCCGCGG	GAGGAGCAGT	ACAACAGCAC	3501	GTACCGTGTG	GTCAGCGTCC	TCACCGTCCT	GCACCAGGAC	TGGCTGAATG
3551	GCAAGGAGTA	CAAGTGCAAG	GTCTCCAACA	AAGCCCTCCC	AGCCCCCATC	3501	GTACCGTGTG	GTCAGCGTCC	TCACCGTCCT	GCACCAGGAC	TGGCTGAATG
3551	GCAAGGAGTA	CAAGTGCAAG	GTCTCCAACA	AAGCCCTCCC	AGCCCCCATC	3601	GAGAAAACCA	TCTCCAAAGC	CAAAGGGCAG	CCCCGAGAAC	CACAGGTGTA
3651	CACCCTGCCC	CCATCCCGGG	ATGAGCTGAC	CAAGAACCAG	GTCAGCCTGA	3601	GAGAAAACCA	TCTCCAAAGC	CAAAGGGCAG	CCCCGAGAAC	CACAGGTGTA
3651	CACCCTGCCC	CCATCCCGGG	ATGAGCTGAC	CAAGAACCAG	GTCAGCCTGA	3701	CCTGCCTGGT	CAAAGGCTTC	TATCCCAGCG	ACATCGCCGT	GGAGTGGGAG
3751	AGCAATGGGC	AGCCGGAGAA	CAACTACAAG	ACCACGCCTC	CCGTGCTGGA	3701	CCTGCCTGGT	CAAAGGCTTC	TATCCCAGCG	ACATCGCCGT	GGAGTGGGAG
3751	AGCAATGGGC	AGCCGGAGAA	CAACTACAAG	ACCACGCCTC	CCGTGCTGGA	3801	CTCCGACGGC	TCCTTCTTCC	TCTACAGCAA	GCTCACCGTG	GACAAGAGCA
3851	GGTGGCAGCA	GGGGAACGTC	TTCTCATGCT	CCGTGATGCA	TGAGGCTCTG	3801	CTCCGACGGC	TCCTTCTTCC	TCTACAGCAA	GCTCACCGTG	GACAAGAGCA
3851	GGTGGCAGCA	GGGGAACGTC	TTCTCATGCT	CCGTGATGCA	TGAGGCTCTG	3901	CACAACCACT	ACACGCAGAA	GAGCCTCTCC	CTGTCTCCGG	GTAAATGATA
3951	GTCTAGAGCT	CGCTGATCAG	CCTCGACTGT	GCCTTCTAGT	TGCCAGCCAT	3901	CACAACCACT	ACACGCAGAA	GAGCCTCTCC	CTGTCTCCGG	GTAAATGATA

4001	CTGTTGTTTG	CCCCTCCCCC	GTGCCTTCCT	TGACCCTGGA	AGGTGCCACT
4001	CTGTTGTTTG	CCCCTCCCCC	GTGCCTTCCT	TGACCCTGGA	AGGTGCCACT	4051	CCCACTGTCC	TTTCCTAATA	AAATGAGGAA	ATTGCATCGC	ATTGTCTGAG
4101	TAGGTGTCAT	TCTATTCTGG	GGGGTGGGGT	GGGGCAGGAC	AGCAAGGGGG	4051	CCCACTGTCC	TTTCCTAATA	AAATGAGGAA	ATTGCATCGC	ATTGTCTGAG
4101	TAGGTGTCAT	TCTATTCTGG	GGGGTGGGGT	GGGGCAGGAC	AGCAAGGGGG	4151	AGGATTGGGA	AGACAATAGC	AGGCATGCTG	GGGATGCGGT	GGGCTCTATG
4201	GCTTCTGAGG	CGGAAAGAAC	CAGCTGGGGC	TCGAGATCTC	CCGATCCCCT	4151	AGGATTGGGA	AGACAATAGC	AGGCATGCTG	GGGATGCGGT	GGGCTCTATG
4201	GCTTCTGAGG	CGGAAAGAAC	CAGCTGGGGC	TCGAGATCTC	CCGATCCCCT	4251	ATGGTGCACT	CTCAGTACAA	TCTGCTCTGA	TGCCGCATAG	TTAAGCCAGT
4301	ATCTGCTCCC	TGCTTGTGTG	TTGGAGGTCG	CTGAGTAGTG	CGCGAGCAAA	4251	ATGGTGCACT	CTCAGTACAA	TCTGCTCTGA	TGCCGCATAG	TTAAGCCAGT
4301	ATCTGCTCCC	TGCTTGTGTG	TTGGAGGTCG	CTGAGTAGTG	CGCGAGCAAA	4351	ATTTAAGCTA	CAACAAGGCA	AGGCTTGACC	GACAATTGCA	TGAAGAATCT
4401	GCTTAGGGTT	AGGCGTTTTG	CGCTGCTTCG	CGATGTACGG	GCCAGATATA	4351	ATTTAAGCTA	CAACAAGGCA	AGGCTTGACC	GACAATTGCA	TGAAGAATCT
4401	GCTTAGGGTT	AGGCGTTTTG	CGCTGCTTCG	CGATGTACGG	GCCAGATATA	4451	CGCGTATCTG	AGGGGACTAG	GGTGTGTTTA	GGCGAAAAGC	GGGGCTTCGG
4501	TTGTACGCGG	TTAGGAGTCC	CCTCAGGATA	TAGTAGTTTC	GCTTTTGCAT	4451	CGCGTATCTG	AGGGGACTAG	GGTGTGTTTA	GGCGAAAAGC	GGGGCTTCGG
4501	TTGTACGCGG	TTAGGAGTCC	CCTCAGGATA	TAGTAGTTTC	GCTTTTGCAT	4551	AGGGAGGGGG	AAATGTAGTC	TTATGCAATA	CTCTTGTAGT	CTTGCAACAT
4601	GGTAACGATG	AGTTAGCAAC	ATGCCTTACA	AGGAGAGAAA	AAGCACCGTG	4551	AGGGAGGGGG	AAATGTAGTC	TTATGCAATA	CTCTTGTAGT	CTTGCAACAT
4601	GGTAACGATG	AGTTAGCAAC	ATGCCTTACA	AGGAGAGAAA	AAGCACCGTG	4651	CATGCCGATT	GGTGGAAGTA	AGGTGGTACG	ATCGTGCCTT	ATTAGGAAGG
4701	CAACAGACGG	GTCTGACATG	GATTGGACGA	ACCACTGAAT	TCCGCATTGC	4651	CATGCCGATT	GGTGGAAGTA	AGGTGGTACG	ATCGTGCCTT	ATTAGGAAGG
4701	CAACAGACGG	GTCTGACATG	GATTGGACGA	ACCACTGAAT	TCCGCATTGC	4751	AGAGATATTG	TATTTAAGTG	CCTAGCTCGA	TACAATAAAC	GCCATTTGAC
4801	CATTCACCAC	ATTGGTGTGC	ACCTCCAAGC	TTGGTACCGA	GCTCGGATCC	4751	AGAGATATTG	TATTTAAGTG	CCTAGCTCGA	TACAATAAAC	GCCATTTGAC
4801	CATTCACCAC	ATTGGTGTGC	ACCTCCAAGC	TTGGTACCGA	GCTCGGATCC	4851	ACTAGTGCAG	AAGTTGGTCG	TGAGGCACTG	GGCAGGTAAG	TATCAAGGTT
4901	ACAAGACAGG	TTTAAGGAGA	CCAATAGAAA	CTGGGCTTGT	CGAGACAGAG	4851	ACTAGTGCAG	AAGTTGGTCG	TGAGGCACTG	GGCAGGTAAG	TATCAAGGTT
4901	ACAAGACAGG	TTTAAGGAGA	CCAATAGAAA	CTGGGCTTGT	CGAGACAGAG	4951	AAGACTCTTG	CGTTTCTGAT	AGGCACCTAT	TGGTCTTACT	GACATCCACT
5001	TTGCCTTTCT	CTCCACAGGT	GTCCACTCCC	AGTTCAATTA	CAGCTCTTGC	4951	AAGACTCTTG	CGTTTCTGAT	AGGCACCTAT	TGGTCTTACT	GACATCCACT
5001	TTGCCTTTCT	CTCCACAGGT	GTCCACTCCC	AGTTCAATTA	CAGCTCTTGC	5051	TAGTGCCGCC	ACCATGAGGG	TCCCCGCTCA	GCTCCTGGGG	CTCCTGCTGC
5101	TCTGGCTCCC	AGGTGCCAGA	TGTGCCATCC	GGATGACCCA	GTCTCCATCC	5051	TAGTGCCGCC	ACCATGAGGG	TCCCCGCTCA	GCTCCTGGGG	CTCCTGCTGC
5101	TCTGGCTCCC	AGGTGCCAGA	TGTGCCATCC	GGATGACCCA	GTCTCCATCC	5151	TCATTCTCTG	CATCTACAGG	AGACAGAGTC	ACCATCACTT	GTCGGGCGAG
5201	CCAGGATATT	CGGAACTATG	TAGCCTGGTA	TCAGCAAAAA	TCAGGGAAAG	5151	TCATTCTCTG	CATCTACAGG	AGACAGAGTC	ACCATCACTT	GTCGGGCGAG
5201	CCAGGATATT	CGGAACTATG	TAGCCTGGTA	TCAGCAAAAA	TCAGGGAAAG	5251	CCCCTAAATT	CCTGATCTAT	GCTGCTTCCA	CTTTGCAAAG	TGGGGTCCCA
5301	TCAAGGTTCA	GCGGCAGTGG	ATCTGGGACA	GATTTCACTC	TCACCATCAA	5251	CCCCTAAATT	CCTGATCTAT	GCTGCTTCCA	CTTTGCAAAG	TGGGGTCCCA
5301	TCAAGGTTCA	GCGGCAGTGG	ATCTGGGACA	GATTTCACTC	TCACCATCAA	5351	CTCCCTGCAG	TCTGAAGATT	TTGCAACTTA	TTACTGTCAA	CAATATTACA
5401	ATTCTCCTCC	GACCTTCGGC	CAAGGGACCA	GGGTGGAAAT	CACGCGAACT	5351	CTCCCTGCAG	TCTGAAGATT	TTGCAACTTA	TTACTGTCAA	CAATATTACA
5401	ATTCTCCTCC	GACCTTCGGC	CAAGGGACCA	GGGTGGAAAT	CACGCGAACT	5451	GTGGCTGCAC	CATCTGTCTT	CATCTTCCCG	CCATCTGATG	AGCAGTTGAA
5501	ATCTGGAACT	GCCTCTGTTG	TGTGCCTGCT	GAATAACTTC	TATCCCAGAG	5451	GTGGCTGCAC	CATCTGTCTT	CATCTTCCCG	CCATCTGATG	AGCAGTTGAA
5501	ATCTGGAACT	GCCTCTGTTG	TGTGCCTGCT	GAATAACTTC	TATCCCAGAG	5551	AGGCCAAAGT	ACAGTGGAAG	GTGGATAACG	CCCTCCAATC	GGGTAACTCC
5601	CAGGAGAGTG	TCACAGAGCA	GGACAGCAAG	GACAGCACCT	ACAGCCTCAG	5551	AGGCCAAAGT	ACAGTGGAAG	GTGGATAACG	CCCTCCAATC	GGGTAACTCC
5601	CAGGAGAGTG	TCACAGAGCA	GGACAGCAAG	GACAGCACCT	ACAGCCTCAG	5651	CAGCACCCTG	ACGCTGAGCA	AAGCAGACTA	CGAGAAACAC	AAAGTCTACG
5701	CCTGCGAAGT	CACCCATCAG	GGCCTGAGCT	CGCCCGTCAC	AAAGAGCTTC	5651	CAGCACCCTG	ACGCTGAGCA	AAGCAGACTA	CGAGAAACAC	AAAGTCTACG
5701	CCTGCGAAGT	CACCCATCAG	GGCCTGAGCT	CGCCCGTCAC	AAAGAGCTTC	5751	AACAGGGGAG	AGTGTTGATA	GTCTAGAGCT	CGCTGATCAG	CCTCGACTGT
5801	GCCTTCTAGT	TGCCAGCCAT	CTGTTGTTTG	CCCCTCCCCC	GTGCCTTCCT	5751	AACAGGGGAG	AGTGTTGATA	GTCTAGAGCT	CGCTGATCAG	CCTCGACTGT
5801	GCCTTCTAGT	TGCCAGCCAT	CTGTTGTTTG	CCCCTCCCCC	GTGCCTTCCT	5851	TGACCCTGGA	AGGTGCCACT	CCCACTGTCC	TTTCCTAATA	AAATGAGGAA
5901	ATTGCATCGC	ATTGTCTGAG	TAGGTGTCAT	TCTATTCTGG	GGGGTGGGGT	5851	TGACCCTGGA	AGGTGCCACT	CCCACTGTCC	TTTCCTAATA	AAATGAGGAA
5901	ATTGCATCGC	ATTGTCTGAG	TAGGTGTCAT	TCTATTCTGG	GGGGTGGGGT	5951	GGGGCAGGAC	AGCAAGGGGG	AGGATTGGGA	AGACAATAGC	AGGCATGCTG
6001	GGGATGCGGT	GGGCTCTATG	GCTTCTGAGG	CGGAAAGAAC	CAGTCGAGGG	5951	GGGGCAGGAC	AGCAAGGGGG	AGGATTGGGA	AGACAATAGC	AGGCATGCTG

6051	GGGATCCCCA	CGCGCCCTGT	AGCGGCGCAT	TAAGCGCGGC	GGGTGTGGTG
6051	GGGATCCCCA	CGCGCCCTGT	AGCGGCGCAT	TAAGCGCGGC	GGGTGTGGTG	6101	GTTACGCGCA	GCGTGACCGC	TACACTTGCC	AGCGCCCTAG	CGCCCGCTCC
6151	TTTCGCTTTC	TTCCCTTCCT	TTCTCGCCAC	GTTCGCCGGC	TTTCCCCGTC	6101	GTTACGCGCA	GCGTGACCGC	TACACTTGCC	AGCGCCCTAG	CGCCCGCTCC
6151	TTTCGCTTTC	TTCCCTTCCT	TTCTCGCCAC	GTTCGCCGGC	TTTCCCCGTC	6201	AAGCTCTAAA	TCGGGGCATC	CCTTTAGGGT	TCCGATTTAG	TGCTTTACGG
6251	CACCTCGACC	CCAAAAAACT	TGATTAGGGT	GATGGTTCAC	GTATAGGGAT	6201	AAGCTCTAAA	TCGGGGCATC	CCTTTAGGGT	TCCGATTTAG	TGCTTTACGG
6251	CACCTCGACC	CCAAAAAACT	TGATTAGGGT	GATGGTTCAC	GTATAGGGAT	6301	AACAGGGTAA	TGTAGTGGGC	CATCGCCCTG	ATAGACGGTT	TTTCGCCCTT
6351	TGACGTTGGA	GTCCACGTTC	TTTAATAGTG	GACTCTTGTT	CCAAACTGGA	6301	AACAGGGTAA	TGTAGTGGGC	CATCGCCCTG	ATAGACGGTT	TTTCGCCCTT
6351	TGACGTTGGA	GTCCACGTTC	TTTAATAGTG	GACTCTTGTT	CCAAACTGGA	6401	ACAACACTCA	ACCCTATCTC	GGTCTATTCT	TTTGATTTAT	AAGGGATTTT
6451	GGGGATTTCG	GCCTATTGGT	TAAAAAATGA	GCTGATTTAA	CAAAAATTTA	6401	ACAACACTCA	ACCCTATCTC	GGTCTATTCT	TTTGATTTAT	AAGGGATTTT
6451	GGGGATTTCG	GCCTATTGGT	TAAAAAATGA	GCTGATTTAA	CAAAAATTTA	6501	ACGCGAATTT	TAACAAAATA	TTAACGTTTA	CAATTTAAAT	ATTTGCTTAT
6551	ACAATCTTCC	TGTTTTTGGG	GCTTTTCTGA	TTATCAACCG	GGGTGGGTAC	6501	ACGCGAATTT	TAACAAAATA	TTAACGTTTA	CAATTTAAAT	ATTTGCTTAT
6551	ACAATCTTCC	TGTTTTTGGG	GCTTTTCTGA	TTATCAACCG	GGGTGGGTAC	6601	CGAGCTCGAA	TTCTGTGGAA	TGTGTGTCAG	TTAGGGTGTG	GAAAGTCCCC
6651	AGGCTCCCCA	GGCAGGCAGA	AGTATGCAAA	GCATGCATCT	CAATTAGTCA	6601	CGAGCTCGAA	TTCTGTGGAA	TGTGTGTCAG	TTAGGGTGTG	GAAAGTCCCC
6651	AGGCTCCCCA	GGCAGGCAGA	AGTATGCAAA	GCATGCATCT	CAATTAGTCA	6701	GCAACCAGGT	GTGGAAAGTC	CCCAGGCTCC	CCAGCAGGCA	GAAGTATGCA
6751	AAGCATGCAT	CTCAATTAGT	CAGCAACCAT	AGTCCCGCCC	CTAACTCCGC	6701	GCAACCAGGT	GTGGAAAGTC	CCCAGGCTCC	CCAGCAGGCA	GAAGTATGCA
6751	AAGCATGCAT	CTCAATTAGT	CAGCAACCAT	AGTCCCGCCC	CTAACTCCGC	6801	CCATCCCGCC	CCTAACTCCG	CCCAGTTCCG	CCCATTCTCC	GCCCCATGGC
6851	TGACTAATTT	TTTTTATTTA	TGCAGAGGCC	GAGGCCGCCT	CGGCCTCTGA	6801	CCATCCCGCC	CCTAACTCCG	CCCAGTTCCG	CCCATTCTCC	GCCCCATGGC
6851	TGACTAATTT	TTTTTATTTA	TGCAGAGGCC	GAGGCCGCCT	CGGCCTCTGA	6901	GCTATTCCAG	AAGTAGTGAG	GAGGCTTTTT	TGGAGGCCTA	GGCTTTTGCA
6951	AAAAGCTCCC	GGGAGCTTGG	ATATCCATTT	TCGGATCTGA	TCAAGAGACA	6901	GCTATTCCAG	AAGTAGTGAG	GAGGCTTTTT	TGGAGGCCTA	GGCTTTTGCA
6951	AAAAGCTCCC	GGGAGCTTGG	ATATCCATTT	TCGGATCTGA	TCAAGAGACA	7001	GGATGAGGAT	CGTTTCGCAT	GATTGAACAA	GATGGATTGC	ACGCAGGTTC
7051	TCCGGCCGCT	TGGGTGGAGA	GGCTATTCGG	CTATGACTGG	GCACAACAGA	7001	GGATGAGGAT	CGTTTCGCAT	GATTGAACAA	GATGGATTGC	ACGCAGGTTC
7051	TCCGGCCGCT	TGGGTGGAGA	GGCTATTCGG	CTATGACTGG	GCACAACAGA	7101	CAATCGGCTG	CTCTGATGCC	GCCGTGTTCC	GGCTGTCAGC	GCAGGGGCGC
7151	CCGGTTCTTT	TTGTCAAGAC	CGACCTGTCC	GGTGCCCTGA	ATGAACTGCA	7101	CAATCGGCTG	CTCTGATGCC	GCCGTGTTCC	GGCTGTCAGC	GCAGGGGCGC
7151	CCGGTTCTTT	TTGTCAAGAC	CGACCTGTCC	GGTGCCCTGA	ATGAACTGCA	7201	GGACGAGGCA	GCGCGGCTAT	CGTGGCTGGC	CACGACGGGC	GTTCCTTGCG
7251	CAGCTGTGCT	CGACGTTGTC	ACTGAAGCGG	GAAGGGACTG	GCTGCTATTG	7201	GGACGAGGCA	GCGCGGCTAT	CGTGGCTGGC	CACGACGGGC	GTTCCTTGCG
7251	CAGCTGTGCT	CGACGTTGTC	ACTGAAGCGG	GAAGGGACTG	GCTGCTATTG	7301	GGCGAAGTGC	CGGGGCAGGA	TCTCCTGTCA	TCTCACCTTG	CTCCTGCCGA
7351	GAAAGTATCC	ATCATGGCTG	ATGCAATGCG	GCGGCTGCAT	ACGCTTGATC	7301	GGCGAAGTGC	CGGGGCAGGA	TCTCCTGTCA	TCTCACCTTG	CTCCTGCCGA
7351	GAAAGTATCC	ATCATGGCTG	ATGCAATGCG	GCGGCTGCAT	ACGCTTGATC	7401	CGGCTACCTG	CCCATTCGAC	CACCAAGCGA	AACATCGCAT	CGAGCGAGCA
7451	CGTACTCGGA	TGGAAGCCGG	TCTTGTCGAT	CAGGATGATC	TGGACGAAGA	7401	CGGCTACCTG	CCCATTCGAC	CACCAAGCGA	AACATCGCAT	CGAGCGAGCA
7451	CGTACTCGGA	TGGAAGCCGG	TCTTGTCGAT	CAGGATGATC	TGGACGAAGA	7501	GCATCAGGGG	CTCGCGCCAG	CCGAACTGTT	CGCCAGGCTC	AAGGCGCGCA
7551	TGCCCGACGG	CGAGGATCTC	GTCGTGACCC	ATGGCGATGC	CTGCTTGCCG	7501	GCATCAGGGG	CTCGCGCCAG	CCGAACTGTT	CGCCAGGCTC	AAGGCGCGCA
7551	TGCCCGACGG	CGAGGATCTC	GTCGTGACCC	ATGGCGATGC	CTGCTTGCCG	7601	AATATCATGG	TGGAAAATGG	CCGCTTTTCT	GGATTCATCG	ACTGTGGCCG
7651	GCTGGGTGTG	GCGGACCGCT	ATCAGGACAT	AGCG TTGGCT	ACCCGTGATA	7601	AATATCATGG	TGGAAAATGG	CCGCTTTTCT	GGATTCATCG	ACTGTGGCCG
7651	GCTGGGTGTG	GCGGACCGCT	ATCAGGACAT	AGCG TTGGCT	ACCCGTGATA	7701	TTGCTGAAGA	GCTTGGCGGC	GAATGGGCTG	ACCGCTTCCT	CGTGCTTTAC
7751	GGTATCGCCG	CTCCCGATTC	GCAGCGCATC	GCCTTCTATC	GCCTTCTTGA	7701	TTGCTGAAGA	GCTTGGCGGC	GAATGGGCTG	ACCGCTTCCT	CGTGCTTTAC
7751	GGTATCGCCG	CTCCCGATTC	GCAGCGCATC	GCCTTCTATC	GCCTTCTTGA	7801	CGAGTTCTTC	TGAGCGGGAC	TCTGGGGTTC	GAAATGACCG	ACCAAGCGAC
7851	GCCCAACCTG	CCATCACGAG	ATTTCGATTC	CACCGCCGCC	TTCTATGAAA	7801	CGAGTTCTTC	TGAGCGGGAC	TCTGGGGTTC	GAAATGACCG	ACCAAGCGAC
7851	GCCCAACCTG	CCATCACGAG	ATTTCGATTC	CACCGCCGCC	TTCTATGAAA	7901	GGTTGGGCTT	CGGAATCGTT	TTCCGGGACG	CCGGCTGGAT	GATCCTCCAG
7951	CGCGGGGATC	TCATGCTGGA	GTTCTTCGCC	CACCCCAACT	TGTTTATTGC	7901	GGTTGGGCTT	CGGAATCGTT	TTCCGGGACG	CCGGCTGGAT	GATCCTCCAG
7951	CGCGGGGATC	TCATGCTGGA	GTTCTTCGCC	CACCCCAACT	TGTTTATTGC	8001	AGCTTATAAT	GGTTACAAAT	AAAGCAATAG	CATCACAAAT	TTCACAAATA
8051	AAGCATTTTT	TTCACTGCAT	TCTAGTTGTG	GTTTGTCCAA	ACTCATCAAT	8001	AGCTTATAAT	GGTTACAAAT	AAAGCAATAG	CATCACAAAT	TTCACAAATA

8101	GTATCTTATC	ATGTCTGGAT	CCCGTCGAGT	TTAAACGATT	TAAATACTGG
8101	GTATCTTATC	ATGTCTGGAT	CCCGTCGAGT	TTAAACGATT	TAAATACTGG	8151	GGCTCGACTG	TGGAATGTGT	GTCAGTTAGG	GTGTGGAAAG	TCCCCAGGCT
8201	CCCCAGCAGG	CAGAAGTATG	CAAAGCATGC	ATCTCAATTA	GTCAGCAACC	8151	GGCTCGACTG	TGGAATGTGT	GTCAGTTAGG	GTGTGGAAAG	TCCCCAGGCT
8201	CCCCAGCAGG	CAGAAGTATG	CAAAGCATGC	ATCTCAATTA	GTCAGCAACC	8251	AGGTGTGGAA	AGTCCCCAGG	CTCCCCAGCA	GGCAGAAGTA	TGCAAAGCAT
8301	GCATCTCAAT	TAGTCAGCAA	CCATAGTCCC	GCCCCTAACT	CCGCCCATCC	8251	AGGTGTGGAA	AGTCCCCAGG	CTCCCCAGCA	GGCAGAAGTA	TGCAAAGCAT
8301	GCATCTCAAT	TAGTCAGCAA	CCATAGTCCC	GCCCCTAACT	CCGCCCATCC	8351	CGCCCCTAAC	TCCGCCCAGT	TCCGCCCATT	CTCCGCCCCA	TGGCTGACTA
8401	ATTTTTTTTA	TTTATGCAGA	GGCCGAGGCC	GCCTCGGCCT	CTGAGCTATT	8351	CGCCCCTAAC	TCCGCCCAGT	TCCGCCCATT	CTCCGCCCCA	TGGCTGACTA
8401	ATTTTTTTTA	TTTATGCAGA	GGCCGAGGCC	GCCTCGGCCT	CTGAGCTATT	8451	CCAGAAGTAG	TGAGGAGGCT	TTTTTGGAGG	CCTAGGCTTT	TGCAAAAAGC
8501	TTGGGGGGGG	GGACAGCTCA	GGGCTGCGAT	TTCGCGCCAA	ACTTGACGGC	8451	CCAGAAGTAG	TGAGGAGGCT	TTTTTGGAGG	CCTAGGCTTT	TGCAAAAAGC
8501	TTGGGGGGGG	GGACAGCTCA	GGGCTGCGAT	TTCGCGCCAA	ACTTGACGGC	8551	AATCCTAGCG	TGAAGGCTGG	TAGGATTTTA	TCCCCGCTGC	CATCATGGTT
8601	CGACCATTGA	ACTGCATCGT	CGCCGTGTCC	CAAAATATGG	GGATTGGCAA	8551	AATCCTAGCG	TGAAGGCTGG	TAGGATTTTA	TCCCCGCTGC	CATCATGGTT
8601	CGACCATTGA	ACTGCATCGT	CGCCGTGTCC	CAAAATATGG	GGATTGGCAA	8651	GAACGGAGAC	CTACCCTGGC	CTCCGCTCAG	GAACGAGTTC	AAGTATTTCC
8701	AAAGAATGAC	CACAACCTCT	TCAGTGGAAG	GTAAACAGAA	TCTGGTGATT	8651	GAACGGAGAC	CTACCCTGGC	CTCCGCTCAG	GAACGAGTTC	AAGTATTTCC
8701	AAAGAATGAC	CACAACCTCT	TCAGTGGAAG	GTAAACAGAA	TCTGGTGATT	8751	ATGGGTAGGA	AAACCTGGTT	CTCCATTCCT	GAGAAGAATC	GACCTTTAAA
8801	GGACAGAATT	AATATAGTTC	TCAGTAGAGA	ACTCAAAGAA	CCACCACGAG	8751	ATGGGTAGGA	AAACCTGGTT	CTCCATTCCT	GAGAAGAATC	GACCTTTAAA
8801	GGACAGAATT	AATATAGTTC	TCAGTAGAGA	ACTCAAAGAA	CCACCACGAG	8851	GAGCTCATTT	TCTTGCCAAA	AGTTTGGATG	ATGCCTTAAG	ACTTATTGAA
8901	CAACCGGAAT	TGGCAAGTAA	AGTAGACATG	GTTTGGATAG	TCGGAGGCAG	8851	GAGCTCATTT	TCTTGCCAAA	AGTTTGGATG	ATGCCTTAAG	ACTTATTGAA
8901	CAACCGGAAT	TGGCAAGTAA	AGTAGACATG	GTTTGGATAG	TCGGAGGCAG	8951	TTCTGTTTAC	CAGGAAGCCA	TGAATCAACC	AGGCCACCTC	AGACTCTTTG
9001	TGACAAGGAT	CATGCAGGAA	TTTGAAAGTG	ACACGTTTTT	CCCAGAAATT	8951	TTCTGTTTAC	CAGGAAGCCA	TGAATCAACC	AGGCCACCTC	AGACTCTTTG
9001	TGACAAGGAT	CATGCAGGAA	TTTGAAAGTG	ACACGTTTTT	CCCAGAAATT	9051	GATTTGGGGA	AATATAAACT	TCTCCCAGAA	TACCCAGGCG	TCCTCTCTGA
9101	GGTCCAGGAG	GAAAAAGGCA	TCAAGTATAA	GTTTGAAGTC	TACGAGAAGA	9051	GATTTGGGGA	AATATAAACT	TCTCCCAGAA	TACCCAGGCG	TCCTCTCTGA
9101	GGTCCAGGAG	GAAAAAGGCA	TCAAGTATAA	GTTTGAAGTC	TACGAGAAGA	9151	AAGACTAACA	GGAAGATGCT	TTCAAGTTCT	CTGCTCCCCT	CCTAAAGCTA
9201	TGCATTTTTA	TAAGACCATG	GGACTTTTGC	TGGCTTTAGA	TCGATCTTTG	9151	AAGACTAACA	GGAAGATGCT	TTCAAGTTCT	CTGCTCCCCT	CCTAAAGCTA
9201	TGCATTTTTA	TAAGACCATG	GGACTTTTGC	TGGCTTTAGA	TCGATCTTTG	9251	TG AAGGAACC	TTACTTCTGT	GGTGTGACAT	AATTGGACAA	ACTACCTACA
9301	GAGATTTAAA	GCTCTAAGGT	AAATATAAAA	TTTTTAAGTG	TATAATGTGT	9251	TG AAGGAACC	TTACTTCTGT	GGTGTGACAT	AATTGGACAA	ACTACCTACA
9301	GAGATTTAAA	GCTCTAAGGT	AAATATAAAA	TTTTTAAGTG	TATAATGTGT	9351	TAAACTACTG	ATTCTAATTG	TTTGTGTATT	TTAGATTCCA	ACCTATGGAA
9401	CTGATGAATG	GGAGCAGTGG	TGGAATGCCT	TTAATGAGGA	AAACCTGTTT	9351	TAAACTACTG	ATTCTAATTG	TTTGTGTATT	TTAGATTCCA	ACCTATGGAA
9401	CTGATGAATG	GGAGCAGTGG	TGGAATGCCT	TTAATGAGGA	AAACCTGTTT	9451	TGCTCAGAAG	AAATGCCATC	TAGTGATGAT	GAGGCTACTG	CTGACTCTCA
9501	ACATTCTACT	CCTCCAAAAA	AGAAGAGAAA	GGTAGAAGAC	CCCAAGGACT	9451	TGCTCAGAAG	AAATGCCATC	TAGTGATGAT	GAGGCTACTG	CTGACTCTCA
9501	ACATTCTACT	CCTCCAAAAA	AGAAGAGAAA	GGTAGAAGAC	CCCAAGGACT	9551	TTCCTTCAGA	ATTGCTAAGT	TTTTTGAGTC	ATGCTGTGTT	TAGTAATAGA
9601	ACTCTTGCTT	GCTTTGCTAT	TTACACCACA	AAGGAAAAAG	CTGCACTGCT	9551	TTCCTTCAGA	ATTGCTAAGT	TTTTTGAGTC	ATGCTGTGTT	TAGTAATAGA
9601	ACTCTTGCTT	GCTTTGCTAT	TTACACCACA	AAGGAAAAAG	CTGCACTGCT	9651	ATACAAGAAA	ATTATGGAAA	AATATTCTGT	AACCTTTATA	AGTAGGCATA
9701	ACAGTTATAA	TCATAACATA	CTGTTTTTTC	TTACTCCACA	CAGGCATAGA	9651	ATACAAGAAA	ATTATGGAAA	AATATTCTGT	AACCTTTATA	AGTAGGCATA
9701	ACAGTTATAA	TCATAACATA	CTGTTTTTTC	TTACTCCACA	CAGGCATAGA	9751	GTGTCTGCTA	TTAATAACTA	TGCTCAAAAA	TTGTGTACCT	TTAGCTTTTT
9801	AATTTGTAAA	GGGGTTAATA	AGGAATATTT	GATGTATAGT	GCCTTGACTA	9751	GTGTCTGCTA	TTAATAACTA	TGCTCAAAAA	TTGTGTACCT	TTAGCTTTTT
9801	AATTTGTAAA	GGGGTTAATA	AGGAATATTT	GATGTATAGT	GCCTTGACTA	9851	GAGATCATAA	TCAGCCATAC	CACATTTGTA	GAGGTTTTAC	TTGCTTTAAA
9901	AAACCTCCCA	CACCTCCCCC	TGAACCTGAA	ACATAAAATG	AATGCAATTG	9851	GAGATCATAA	TCAGCCATAC	CACATTTGTA	GAGGTTTTAC	TTGCTTTAAA
9901	AAACCTCCCA	CACCTCCCCC	TGAACCTGAA	ACATAAAATG	AATGCAATTG	9951	TTGTTGTTAA	CTTGTTTATT	GCAGCTTATA	ATGGTTACAA	ATAAAGCAAT
10001	AGCATCACAA	ATTTCACAAA	TAAAGCATTT	TTTTCACTGC	ATTCTAGTTG	9951	TTGTTGTTAA	CTTGTTTATT	GCAGCTTATA	ATGGTTACAA	ATAAAGCAAT
10001	AGCATCACAA	ATTTCACAAA	TAAAGCATTT	TTTTCACTGC	ATTCTAGTTG	10051	TGGTTTGTCG	ACGCGGCCGC	TGTGGAATGT	GTGTCAGTTA	GGGTGTGGAA
10101	AGTCCCCAGG	CTCCCCAGCA	GGCAGAAGTA	TGCAAAGCAT	GCATCTCAAT	10051	TGGTTTGTCG	ACGCGGCCGC	TGTGGAATGT	GTGTCAGTTA	GGGTGTGGAA

10151	TAGTCAGCAA	CCAGGTGTGG	AAAGTCCCCA	GGCTCCCCAG	CAGGCAGAAG
10151	TAGTCAGCAA	CCAGGTGTGG	AAAGTCCCCA	GGCTCCCCAG	CAGGCAGAAG	10201	TATGCAAAGC	ATGCATCTCA	ATTAGTCAGC	AACCATAGTC	CCGCCCCTAA
10251	CTCCGCCCAT	CCCGCCCCTA	GTTCCGCCCA	ACTCCGCCCA	TTCTCCGCCC	10201	TATGCAAAGC	ATGCATCTCA	ATTAGTCAGC	AACCATAGTC	CCGCCCCTAA
10251	CTCCGCCCAT	CCCGCCCCTA	GTTCCGCCCA	ACTCCGCCCA	TTCTCCGCCC	10301	CATGGCTGAC	TAATTTTTTT	TATTTATGCA	GAGGCCGAGG	CCGCCTCGGC
10351	CTCTGAGCTA	TTCCAGAAGT	AGTGAGGAGG	CTTTTTTGGA	GGCCTAGGCT	10301	CATGGCTGAC	TAATTTTTTT	TATTTATGCA	GAGGCCGAGG	CCGCCTCGGC
10351	CTCTGAGCTA	TTCCAGAAGT	AGTGAGGAGG	CTTTTTTGGA	GGCCTAGGCT	10401	TTTGCAAAAA	GCTCTGAGAT	CACCGGCGAA	GGAGGGCCAC	CATGGCCTCG
10451	TACCCCGGCC	ATCAACACGC	GTCTGCGTTC	GACCAGGCTG	CGCGTTCTCG	10401	TTTGCAAAAA	GCTCTGAGAT	CACCGGCGAA	GGAGGGCCAC	CATGGCCTCG
10451	TACCCCGGCC	ATCAACACGC	GTCTGCGTTC	GACCAGGCTG	CGCGTTCTCG	10501	CGGCCATAGC	AACCGACGTA	CGGCGTTGCG	CCCTCGCCGG	CAGCAAGAAG
10551	CCACGGAAGT	CCGCCCGGAG	CAGAAAATGC	CCACGCTACT	GCGGGTTTAT	10501	CGGCCATAGC	AACCGACGTA	CGGCGTTGCG	CCCTCGCCGG	CAGCAAGAAG
10551	CCACGGAAGT	CCGCCCGGAG	CAGAAAATGC	CCACGCTACT	GCGGGTTTAT	10601	ATAGACGGTC	CCCACGGGAT	GGGGAAAACC	ACCACCACGC	AACTGCTGGT
10651	GGCCCTGGGT	TCGCGCGACG	ATATCGTCTA	CGTACCCGAG	CCGATGACTT	10601	ATAGACGGTC	CCCACGGGAT	GGGGAAAACC	ACCACCACGC	AACTGCTGGT
10651	GGCCCTGGGT	TCGCGCGACG	ATATCGTCTA	CGTACCCGAG	CCGATGACTT	10701	ACTGGCGGGT	GCTGGGGGCT	TCCGAGACAA	TCGCG AACAT	CTACACCACA
10753	CAACACCGCC	TCGACCAGGG	TGAGATATCG	GCCGGGGACG	CGGCGGTGGT	10701	ACTGGCGGGT	GCTGGGGGCT	TCCGAGACAA	TCGCG AACAT	CTACACCACA
10753	CAACACCGCC	TCGACCAGGG	TGAGATATCG	GCCGGGGACG	CGGCGGTGGT	10801	AATGACAAGC	GCCCAGATAA	CAATGGGCAT	GCCTTATGCC	GTGACCGACG
10851	CCGTTCTGGC	TCCTCATATC	GGGGGGGAGG	CTGGGAGCTC	ACATGCCCCG	10801	AATGACAAGC	GCCCAGATAA	CAATGGGCAT	GCCTTATGCC	GTGACCGACG
10851	CCGTTCTGGC	TCCTCATATC	GGGGGGGAGG	CTGGGAGCTC	ACATGCCCCG	10901	CCCCCGGCCC	TCACCCTCAT	CTTCGACCGC	CATCCCATCG	CCGCCCTCCT
10951	GTGCTACCCG	GCCGCGCGGT	ACCTTATGGG	CAGCATGACC	CCCCAGGCCG	10901	CCCCCGGCCC	TCACCCTCAT	CTTCGACCGC	CATCCCATCG	CCGCCCTCCT
10951	GTGCTACCCG	GCCGCGCGGT	ACCTTATGGG	CAGCATGACC	CCCCAGGCCG	11001	TGCTGGCGTT	CGTGGCCCTC	ATCCCGCCGA	CCTTGCCCGG	CACCAACATC
11051	GTGCTTGGGG	CCCTTCCGGA	GGACAGACAC	ATCGACCGCC	TGGCCAAACG	11001	TGCTGGCGTT	CGTGGCCCTC	ATCCCGCCGA	CCTTGCCCGG	CACCAACATC
11051	GTGCTTGGGG	CCCTTCCGGA	GGACAGACAC	ATCGACCGCC	TGGCCAAACG	11101	CCAGCGCCCC	GGCGAGCGGC	TGGACCTGGC	TATGCTGGCT	GCGATTCGCC
11151	GCGTTTACGG	GCTACTTGCC	AATACGGTGC	GGTATCTGCA	GTGCGGCGGG	11101	CCAGCGCCCC	GGCGAGCGGC	TGGACCTGGC	TATGCTGGCT	GCGATTCGCC
11151	GCGTTTACGG	GCTACTTGCC	AATACGGTGC	GGTATCTGCA	GTGCGGCGGG	11201	TCGTGGCGGG	AGGACTGGGG	ACAGCTTTCG	GGGACGGCCG	TGCCGCCCCA
11251	GGGTGCCGAG	CCCCAGAGCA	ACGCGGGCCC	ACGACCCCAT	ATCGGGGACA	11201	TCGTGGCGGG	AGGACTGGGG	ACAGCTTTCG	GGGACGGCCG	TGCCGCCCCA
11251	GGGTGCCGAG	CCCCAGAGCA	ACGCGGGCCC	ACGACCCCAT	ATCGGGGACA	11301	CGTTATTTAC	CCTGTTTCGG	GCCCCCGAGT	TGCTGGCCCC	CAACGGCGAC
11351	CTGTATAACG	TGTTTGCCTG	GGCCTTGGAC	GTCTTGGCCA	AACGCCTCCG	11301	CGTTATTTAC	CCTGTTTCGG	GCCCCCGAGT	TGCTGGCCCC	CAACGGCGAC
11351	CTGTATAACG	TGTTTGCCTG	GGCCTTGGAC	GTCTTGGCCA	AACGCCTCCG	11401	TTCCATGCAC	GTCTTTATCC	TGGATTACGA	CCAATCGCCC	GCCGGCTGCC
11451	GGGACGCCCT	GCTGCAACTT	ACCTCCGGGA	TGGTCCAGAC	CCACGTCACC	11401	TTCCATGCAC	GTCTTTATCC	TGGATTACGA	CCAATCGCCC	GCCGGCTGCC
11451	GGGACGCCCT	GCTGCAACTT	ACCTCCGGGA	TGGTCCAGAC	CCACGTCACC	11501	ACCCCCGGCT	CCATACCGAC	GATATGCGAC	CTGGCGCGCA	CGTTTGCCCG
11551	GG AGATGGGG	GAGGCTAACT	GAGAATTTCG	ACTGAAGTAC	CTATTCCGAA	11501	ACCCCCGGCT	CCATACCGAC	GATATGCGAC	CTGGCGCGCA	CGTTTGCCCG
11551	GG AGATGGGG	GAGGCTAACT	GAGAATTTCG	ACTGAAGTAC	CTATTCCGAA	11601	GTTCCTATTC	TCTAGAAAGT	ATAGGAACTT	CTCATGTTCT	TTCCTGCGTT
11651	ATCCCCTGAT	TCTGTGGATA	ACCGTATTAC	CGCCTTTGAG	TGAGCTGATA	11601	GTTCCTATTC	TCTAGAAAGT	ATAGGAACTT	CTCATGTTCT	TTCCTGCGTT
11651	ATCCCCTGAT	TCTGTGGATA	ACCGTATTAC	CGCCTTTGAG	TGAGCTGATA	11701	CCGCTCGCCG	CAGCCGAACG	ACCGAGCGCA	GCGAGTCAGT	GAGCGAGGAA
11751	GCGGAAGAGC	GCCTGATGCG	GTATTTTCTC	CTTACGCATC	TGTGCGGTAT	11701	CCGCTCGCCG	CAGCCGAACG	ACCGAGCGCA	GCGAGTCAGT	GAGCGAGGAA
11751	GCGGAAGAGC	GCCTGATGCG	GTATTTTCTC	CTTACGCATC	TGTGCGGTAT	11751	GCGGAAGAGC	GCCTGATGCG	GTATTTTCTC	CTTACGCATC	TGTGCGGTAT
11801	TTCACACCGC	ATATGGTGCA	CTCTCAGTAC	AATCTGCTCT	GATGCCGCAT	11751	GCGGAAGAGC	GCCTGATGCG	GTATTTTCTC	CTTACGCATC	TGTGCGGTAT
11801	TTCACACCGC	ATATGGTGCA	CTCTCAGTAC	AATCTGCTCT	GATGCCGCAT	11851	AGTTAAGCCA	GCTAGAGGAT	CATAATCAGC	CATACCACAT	TTGTAGAGGT
11901	TTTACTTGCT	TTAAAAAACC	TCCCACACCT	CCCCCTGAAC	CTGAAACATA	11851	AGTTAAGCCA	GCTAGAGGAT	CATAATCAGC	CATACCACAT	TTGTAGAGGT
11901	TTTACTTGCT	TTAAAAAACC	TCCCACACCT	CCCCCTGAAC	CTGAAACATA	11951	AAATGAATGC	AATTGTTGTT	GTTAACTTGT	TTATTGCAGC	TTATAATGGT
12001	TACAAATAAA	GCAATAGCAT	CACAAATTTC	ACAAATAAAG	CATTTTTTTC	11951	AAATGAATGC	AATTGTTGTT	GTTAACTTGT	TTATTGCAGC	TTATAATGGT
12001	TACAAATAAA	GCAATAGCAT	CACAAATTTC	ACAAATAAAG	CATTTTTTTC	12051	ACTGCATTCT	AGTTGTGGTT	TGTCCAAACT	CATCAATGTA	TCTTATCATG
12101	TCTGGATCCC	CAGGAAGCTC	CTCTGTGTCC	TCATAAACCC	TAACCTCCTC	12051	ACTGCATTCT	AGTTGTGGTT	TGTCCAAACT	CATCAATGTA	TCTTATCATG

12151	TACTTGAGAG	GACATTCCAA	TCATAGGCTG	CCCATCCACC	CTCTGTGTCC
12151	TACTTGAGAG	GACATTCCAA	TCATAGGCTG	CCCATCCACC	CTCTGTGTCC	12201	TCCTGTTAAT	TAGGTCACTT	AACAAAAAGG	AAATTGGGTA	GGGGTTTTTC
12251	ACAGACCGCT	TTCTAAGGGT	AATTTTAAAA	TATCTGGGAA	GTCCCTTCCA	12201	TCCTGTTAAT	TAGGTCACTT	AACAAAAAGG	AAATTGGGTA	GGGGTTTTTC
12251	ACAGACCGCT	TTCTAAGGGT	AATTTTAAAA	TATCTGGGAA	GTCCCTTCCA	12301	CTGCTGTGTT	CCAGAAGTGT	TGGTAAACAG	CCCACAAATG	TCAACAGCAG
12351	AAACATACAA	GCTGTCAGCT	TTGCACAAGG	GCCCAACACC	CTGCTCATCA	12301	CTGCTGTGTT	CCAGAAGTGT	TGGTAAACAG	CCCACAAATG	TCAACAGCAG
12351	AAACATACAA	GCTGTCAGCT	TTGCACAAGG	GCCCAACACC	CTGCTCATCA	12401	AGAAGCACTG	TGGTTGCTGT	GTTAGTAATG	TGCAAAACAG	GAGGCACATT
12451	TTCCCCACCT	GTGTAGGTTC	CAAAATATCT	AGTGTTTTCA	TTTTTACTTG	12401	AGAAGCACTG	TGGTTGCTGT	GTTAGTAATG	TGCAAAACAG	GAGGCACATT
12451	TTCCCCACCT	GTGTAGGTTC	CAAAATATCT	AGTGTTTTCA	TTTTTACTTG	12501	GATCAGGAAC	CCAGCACTCC	ACTGGATAAG	CATTATCCTT	ATCCAAAACA
12551	GCCTTGTGGT	CAGTGTTCAT	CTGCTGACTG	TCAACTGTAG	CATTTTTTGG	12501	GATCAGGAAC	CCAGCACTCC	ACTGGATAAG	CATTATCCTT	ATCCAAAACA
12551	GCCTTGTGGT	CAGTGTTCAT	CTGCTGACTG	TCAACTGTAG	CATTTTTTGG	12601	GGTTACAGTT	TGAGCAGGAT	ATTTGGTCCT	GTAGTTTGCT	AACACACCCT
12651	GCAGCTCCAA	AGGTTCCCCA	CCAACAGCAA	AAAAATGAAA	ATTTGACCCT	12601	GGTTACAGTT	TGAGCAGGAT	ATTTGGTCCT	GTAGTTTGCT	AACACACCCT
12651	GCAGCTCCAA	AGGTTCCCCA	CCAACAGCAA	AAAAATGAAA	ATTTGACCCT	12701	TGAATGGGTT	TTCCAGCACC	ATTTTCATGA	GTTTTTTGTG	TCCCTGAATG
12751	CAAGTTTAAC	ATAGCAGTTA	CCCCAATAAC	CTCAGTTTTA	ACAGTAACAG	12701	TGAATGGGTT	TTCCAGCACC	ATTTTCATGA	GTTTTTTGTG	TCCCTGAATG
12751	CAAGTTTAAC	ATAGCAGTTA	CCCCAATAAC	CTCAGTTTTA	ACAGTAACAG	12801	CTTCCCACAT	CAAAATATTT	CCACAGGTTA	AGTCCTCATT	TAAATTAGGC
12851	AAAGGAATTC	TTGAAGACGA	AAGGGCCTCG	TGATACGCCT	ATTTTTATAG	12801	CTTCCCACAT	CAAAATATTT	CCACAGGTTA	AGTCCTCATT	TAAATTAGGC
12851	AAAGGAATTC	TTGAAGACGA	AAGGGCCTCG	TGATACGCCT	ATTTTTATAG	12901	GTTAATGTCA	TGATAATAAT	GGTTTCTTAG	ACGTCAGGTG	GCACTTTTCG
12951	GGGAAATGTG	CGCGGAACCC	CTATTTGTTT	ATTTTTCTAA	ATACATTCAA	12901	GTTAATGTCA	TGATAATAAT	GGTTTCTTAG	ACGTCAGGTG	GCACTTTTCG
12951	GGGAAATGTG	CGCGGAACCC	CTATTTGTTT	ATTTTTCTAA	ATACATTCAA	13001	ATATGTATCC	GCTCATGAGA	CAATAACCCT	GATAAATGCT	TCAATAATAT
13051	TGAAAAAGGA	AGAGTATGAG	TATTCAACAT	TTCCGTGTCG	CCCTTATTCC	13001	ATATGTATCC	GCTCATGAGA	CAATAACCCT	GATAAATGCT	TCAATAATAT
13051	TGAAAAAGGA	AGAGTATGAG	TATTCAACAT	TTCCGTGTCG	CCCTTATTCC	13101	CTTTTTTGCG	GCATTTTGCC	TTCCTGTTTT	TGCTCACCCA	GAAACGCTGG
13151	TGAAAGTAAA	AGATGCTGAA	GATCAGTTGG	GTGCACGAGT	GGGTTACATC	13101	CTTTTTTGCG	GCATTTTGCC	TTCCTGTTTT	TGCTCACCCA	GAAACGCTGG
13151	TGAAAGTAAA	AGATGCTGAA	GATCAGTTGG	GTGCACGAGT	GGGTTACATC	13201	GAACTGGATC	TCAACAGCGG	TAAGATCCTT	GAGAGTTTTC	GCCCCGAAGA
13251	ACGTTTTCCA	ATGATGAGCA	CTTTTAAAGT	TCTGCTATGT	GGCGCGGTAT	13201	GAACTGGATC	TCAACAGCGG	TAAGATCCTT	GAGAGTTTTC	GCCCCGAAGA
13251	ACGTTTTCCA	ATGATGAGCA	CTTTTAAAGT	TCTGCTATGT	GGCGCGGTAT	13301	TATCCCGTGT	TGACGCCGGG	CAAGAGCAAC	TCGGTCGCCG	CATACACTAT
13351	TCTCAGAATG	ACTTGGTTGA	GTACTCACCA	GTCACAGAAA	AGCATCTTAC	13301	TATCCCGTGT	TGACGCCGGG	CAAGAGCAAC	TCGGTCGCCG	CATACACTAT
13351	TCTCAGAATG	ACTTGGTTGA	GTACTCACCA	GTCACAGAAA	AGCATCTTAC	13401	GGATGGCATG	ACAGTAAGAG	AATTATGCAG	TGCTGCCATA	ACCATGAGTG
13451	ATAACACTGC	GGCCAACTTA	CTTCTGACAA	CGATCGGAGG	ACCGAAGGAG	13401	GGATGGCATG	ACAGTAAGAG	AATTATGCAG	TGCTGCCATA	ACCATGAGTG
13451	ATAACACTGC	GGCCAACTTA	CTTCTGACAA	CGATCGGAGG	ACCGAAGGAG	13501	CTAACCGCTT	TTTTGCACAA	CATGGGGGAT	CATGTAACTC	GCCTTGATCG
13551	TTGGGAACCG	GAGCTGAATG	AAGCCATACC	AAACGACGAG	CGTGACACCA	13501	CTAACCGCTT	TTTTGCACAA	CATGGGGGAT	CATGTAACTC	GCCTTGATCG
13551	TTGGGAACCG	GAGCTGAATG	AAGCCATACC	AAACGACGAG	CGTGACACCA	13601	CGATGCCTGT	AGCAATGGCA	ACAACGTTGC	GCAAACTATT	AACTGGCGAA
13651	CTACTTACTC	TAGCTTCCCG	GCAACAATTA	ATAGACTGGA	TGGAGGCGGA	13601	CGATGCCTGT	AGCAATGGCA	ACAACGTTGC	GCAAACTATT	AACTGGCGAA
13651	CTACTTACTC	TAGCTTCCCG	GCAACAATTA	ATAGACTGGA	TGGAGGCGGA	13701	TAAAGTTGCA	GGACCACTTC	TGCGCTCGGC	CCTTCCGGCT	GGCTGGTTTA
13751	TTGCTGATAA	ATCTGGAGCC	GGTGAGCGTG	GGTCTCGCGG	TATCATTGCA	13701	TAAAGTTGCA	GGACCACTTC	TGCGCTCGGC	CCTTCCGGCT	GGCTGGTTTA
13751	TTGCTGATAA	ATCTGGAGCC	GGTGAGCGTG	GGTCTCGCGG	TATCATTGCA	13801	GCACTGGGGC	CAGATGGTAA	GCCCTCCCGT	ATCGTAGTTA	TCTACACGAC
13851	GGGGAGTCAG	GCAACTATGG	ATGAACGAAA	TAGACAGATC	GCTGAGATAG	13801	GCACTGGGGC	CAGATGGTAA	GCCCTCCCGT	ATCGTAGTTA	TCTACACGAC
13851	GGGGAGTCAG	GCAACTATGG	ATGAACGAAA	TAGACAGATC	GCTGAGATAG	13901	GTGCCTCACT	GATTAAGCAT	TGGTAACTGT	CAGACCAAGT	TTACTCATAT
13951	ATACTTTAGA	TTGATTTAAA	ACTTCATTTT	TAATTTAAAA	GGATCTAGGT	13901	GTGCCTCACT	GATTAAGCAT	TGGTAACTGT	CAGACCAAGT	TTACTCATAT
13951	ATACTTTAGA	TTGATTTAAA	ACTTCATTTT	TAATTTAAAA	GGATCTAGGT	14001	GAAGATCCTT	TTTGATAATC	TCATGACCAA	AATCCCTTAA	CGTGAGTTTT
14051	CGTTCCACTG	AGCGTCAGAC	CCCGTAGAAA	AGATCAAAGG	ATCTTCTTGA	14001	GAAGATCCTT	TTTGATAATC	TCATGACCAA	AATCCCTTAA	CGTGAGTTTT
14051	CGTTCCACTG	AGCGTCAGAC	CCCGTAGAAA	AGATCAAAGG	ATCTTCTTGA	14101	GATCCTTTTT	TTCTGCGCGT	AATCTGCTGC	TTGCAAACAA	AAAAACCACC
14151	GCTACCAGCG	GTGGTTTGTT	TGCCGGATCA	AGAGCTACCA	ACTCTTTTTC	14101	GATCCTTTTT	TTCTGCGCGT	AATCTGCTGC	TTGCAAACAA	AAAAACCACC

14201	CGAAGGTAAC	TGGCTTCAGC	AGAGCGCAGA	TACCAAATAC	TGTCCTTCTA
14201	CGAAGGTAAC	TGGCTTCAGC	AGAGCGCAGA	TACCAAATAC	TGTCCTTCTA	14251	GTGTAGCCGT	AGTTAGGCCA	CCACTTCAAG	AACTCTGTAG	CACCGCCTAC
14301	ATACCTCGCT	CTGCTAATCC	TGTTACCAGT	GGCTGCTGCC	AGTGGCGATA	14251	GTGTAGCCGT	AGTTAGGCCA	CCACTTCAAG	AACTCTGTAG	CACCGCCTAC
14301	ATACCTCGCT	CTGCTAATCC	TGTTACCAGT	GGCTGCTGCC	AGTGGCGATA	14351	AGTCGTGTCT	TACCGGGTTG	GACTCAAGAC	GATAGTTACC	GGATAAGGCG
14401	CAGCGGTCGG	GCTGAACGGG	GGGTTCGTGC	ACACAGCCCA	GCTTGGAGCG	14351	AGTCGTGTCT	TACCGGGTTG	GACTCAAGAC	GATAGTTACC	GGATAAGGCG
14401	CAGCGGTCGG	GCTGAACGGG	GGGTTCGTGC	ACACAGCCCA	GCTTGGAGCG	14451	AACGACCTAC	ACCGAACTGA	GATACCTACA	GCGTGAGCTA	TGAGAAAGCG
14501	CCACGCTTCC	CGAAGGGAGA	AAGGCGGACA	GGTATCCGGT	AAGCGGCAGG	14451	AACGACCTAC	ACCGAACTGA	GATACCTACA	GCGTGAGCTA	TGAGAAAGCG
14501	CCACGCTTCC	CGAAGGGAGA	AAGGCGGACA	GGTATCCGGT	AAGCGGCAGG	14551	GTCGGAACAG	GAGAGCGCAC	GAGGGAGCTT	CCAGGGGGAA	ACGCCTGGTA
14601	TCTTTATAGT	CCTGTCGGGT	TTCGCCACCT	CTGACTTGAG	CGTCGATTTT	14551	GTCGGAACAG	GAGAGCGCAC	GAGGGAGCTT	CCAGGGGGAA	ACGCCTGGTA
14601	TCTTTATAGT	CCTGTCGGGT	TTCGCCACCT	CTGACTTGAG	CGTCGATTTT	14651	TGTGATGCTC	GTCAGGGGGG	CGGAGCCTAT	GGAAAAACGC	CAGCAACGCG
14701	GCCTTTTTAC	GGTTCCTGGC	CTTTTGCTGG	CCTTTTGCTC	ACATGGCTCG	14651	TGTGATGCTC	GTCAGGGGGG	CGGAGCCTAT	GGAAAAACGC	CAGCAACGCG
14701	GCCTTTTTAC	GGTTCCTGGC	CTTTTGCTGG	CCTTTTGCTC	ACATGGCTCG	14751	ACAGATCCAT	GTTCTTTCCT	GCGTTATCCC	CTGATTCTGT	GGATAACCGT
14801	ATTACCGCCT	TTGAGTGAGC	TGATACCGCT	CGCCGCAGCC	GAACGACCGA	14751	ACAGATCCAT	GTTCTTTCCT	GCGTTATCCC	CTGATTCTGT	GGATAACCGT
14801	ATTACCGCCT	TTGAGTGAGC	TGATACCGCT	CGCCGCAGCC	GAACGACCGA	14851	GCGCAGCGAG	TCAGTGAGCG	AGGAAGCGGA	AGAGCGCCTG	ATGCGGTATT
14901	TTCTCCTTAC	GCATCTGTGC	GGTATTTCAC	ACCGCATATG	GTGCACTCTC	14851	GCGCAGCGAG	TCAGTGAGCG	AGGAAGCGGA	AGAGCGCCTG	ATGCGGTATT
14901	TTCTCCTTAC	GCATCTGTGC	GGTATTTCAC	ACCGCATATG	GTGCACTCTC	14951	AGTACAATCT	GCTCTGATGC	CGCATAGTTA	AGCCAGA

其序列如上所示(SEQ ID NO：2)的pTV1目标载体，具有下列特征(位置根据序列中核酸的编号给定，所述编号系统已在之前详述)：

-从位置1到位置48：FRT重组酶位点；

-从位置63到位置144：最小CMV启动子；

-从位置478到位置1176：maxFP-green蛋白；

-从位置1352到位置1402：后SV40多腺苷酸信号；

-从位置1888到位置2283：RSV LTR；

-从位置2521到位置3951：Ig抗-D的重链

-从位置3958到位置4184：bGH多腺苷酸信号；

-从位置4431到位置4826：RSV LTR；

-从位置5064到位置5771：bGH K链(K)Ig抗-D；

-从位置5778到位置6004：bGH多腺苷酸信号；

-从位置6658到位置6983：SV40启动子；

-从位置7019到位置7813：编码新转磷酸酶的序列；

-从位置7987到位置8117：SV40前多腺苷酸信号；

-从位置8301到位置8496：SV40启动子；

-从位置8595到位置9158：编码DHFR的序列；

-从位置9965到位置10019：后SV40多腺苷酸信号；

-从位置10092到位置10394：SV40启动子；

-从位置10442到位置11572：编码HSV-TK的序列；

-从位置11584到位置11631：FRT重组酶位点；

-从位置11974到位置12104：前SV40多腺苷酸信号(SV40前多A)；

-从位置12996到位置13926：安必西林抗性基因。

B.pEFrat-FLPe载体(SEQ ID NO：3，图2)：

编码Flp重组酶的基因从pOG4-FLPe载体(55)用下列引物进行PCR扩增：

上游引物(SEQ ID NO：8)：

5′-ATCTGGCTAGCCGCCACC

-3′

下划线的序列是NheI限制性位点，而FLPe基因的起始是黑体的，最初的ATG是斜体的。

下游引物(SEQ ID NO：9)：

5′-TGTCATCTAGATTA

-3′

下划线的序列是XbaI限制性位点。编码序列的末端是黑体的，终止密码子是斜体的。

产出的PCRFLPe产物在鼠EF1-α启动子和在NheI和XbaI位点上的bGH多腺苷酸序列之间被克隆，以获得最终的pEFrat-FLPe表达载体。

pEFrat-FLPe载体的核酸序列如下(SEQ ID No 3)：

1	GATCTCCAGG	GACCGTCCCT	AAATTCTCAC	AGACCCAAAT	CCCTGTAGCC
1	GATCTCCAGG	GACCGTCCCT	AAATTCTCAC	AGACCCAAAT	CCCTGTAGCC	51	GCCCCACGAC	AGCGCGAGGA	GCATGCGCCC	AGGGCTGAGC	GCGGGTAGAT
101	CAGAGCACAC	AAGCTCACAG	TCCCCGGCGG	TGGGGGGAGG	GGCGCGCTGA	51	GCCCCACGAC	AGCGCGAGGA	GCATGCGCCC	AGGGCTGAGC	GCGGGTAGAT
101	CAGAGCACAC	AAGCTCACAG	TCCCCGGCGG	TGGGGGGAGG	GGCGCGCTGA	151	GCGGGGGCCA	GGGAGCTGGC	GCGGGGCAAA	CTGGGAAAGT	GGTGTCGTGT
201	GCTGGCTCCG	CCCTCTTCCC	GAGGGTGGGG	GAGAACGGTA	TATAAGTGCG	151	GCGGGGGCCA	GGGAGCTGGC	GCGGGGCAAA	CTGGGAAAGT	GGTGTCGTGT
201	GCTGGCTCCG	CCCTCTTCCC	GAGGGTGGGG	GAGAACGGTA	TATAAGTGCG	251	GTAGTCGCCT	TGGACGTTCT	TTTTCGCAAC	GGGTTTGCCG	TCAGAACGCA
301	GGTGAGTGGC	GGGTGTGGCT	TCCGCGGGCC	CCGGAGCTGG	AGCCCTGCTC	251	GTAGTCGCCT	TGGACGTTCT	TTTTCGCAAC	GGGTTTGCCG	TCAGAACGCA
301	GGTGAGTGGC	GGGTGTGGCT	TCCGCGGGCC	CCGGAGCTGG	AGCCCTGCTC	351	TGAGCGGGCC	GGGCTGATAT	GCGAGTGTCG	TCCGCAGGGT	TTAGCTGTGA
401	GCATTCCCAC	TTCGAGTGGC	GGGCGGTGCG	GGGGTGAGAG	TGCGAGGCCT	351	TGAGCGGGCC	GGGCTGATAT	GCGAGTGTCG	TCCGCAGGGT	TTAGCTGTGA
401	GCATTCCCAC	TTCGAGTGGC	GGGCGGTGCG	GGGGTGAGAG	TGCGAGGCCT	451	AGCGGCAACC	CCGTAGCCTC	GCCTCGTGTC	CGGCTTGAGG	CCTAGCGTGG
501	TGTCCGCCGC	CGCGTGCCAC	TCCGGCCGCA	CTATGCGTTT	TTTGTCCTTG	451	AGCGGCAACC	CCGTAGCCTC	GCCTCGTGTC	CGGCTTGAGG	CCTAGCGTGG
501	TGTCCGCCGC	CGCGTGCCAC	TCCGGCCGCA	CTATGCGTTT	TTTGTCCTTG	551	CTGCCCTCGA	TTGCCTTCCA	GCAGCATGGG	CTAACAAAGG	GAGGGTGTGG
601	GGCTCACTCT	TAAGGAGCCC	ATGAAGCTTA	CGTTGGATAG	GAATGGAAGG	551	CTGCCCTCGA	TTGCCTTCCA	GCAGCATGGG	CTAACAAAGG	GAGGGTGTGG
601	GGCTCACTCT	TAAGGAGCCC	ATGAAGCTTA	CGTTGGATAG	GAATGGAAGG	651	GCAGGAGGGG	CGACTGGGGC	CCGCCCGCCT	TCGGAGCACA	TGTCCGACGC
701	CACCTGGATG	GGGCGAGGCC	TGTGGCTTTC	CGAAGCAATC	GGGCGTGAGT	651	GCAGGAGGGG	CGACTGGGGC	CCGCCCGCCT	TCGGAGCACA	TGTCCGACGC
701	CACCTGGATG	GGGCGAGGCC	TGTGGCTTTC	CGAAGCAATC	GGGCGTGAGT	751	TTAGCCTACC	TGGGCCATGT	GGCCCTAGCA	CTGGGCACGG	TCTGGCCTGG
801	CGGTGCCGCG	TTCCCTTGCC	TCCCAACAAG	GGTGAGGCCG	TCCCGCCCGG	751	TTAGCCTACC	TGGGCCATGT	GGCCCTAGCA	CTGGGCACGG	TCTGGCCTGG
801	CGGTGCCGCG	TTCCCTTGCC	TCCCAACAAG	GGTGAGGCCG	TCCCGCCCGG	851	CACCAGTTGC	TTGCGCGGAA	AGATGGCCGC	TCCCGGGGCC	CTGTTGCAAG
901	GAGC1′CAAAA	TGGAGGACGC	GGCAGCCCGG	TGGAGCGGGC	GGGTGAGTCA	851	CACCAGTTGC	TTGCGCGGAA	AGATGGCCGC	TCCCGGGGCC	CTGTTGCAAG
901	GAGC1′CAAAA	TGGAGGACGC	GGCAGCCCGG	TGGAGCGGGC	GGGTGAGTCA	951	CCCACACAAA	GGAAGAGGGC	CTTGCCCCTC	GCCGGCCGCT	GCTTCCTGTG
1001	ACCCCGTGGT	CTATCGGCCG	CATAGTCACC	TCGGGCTTCT	CTTGAGCACC	951	CCCACACAAA	GGAAGAGGGC	CTTGCCCCTC	GCCGGCCGCT	GCTTCCTGTG
1001	ACCCCGTGGT	CTATCGGCCG	CATAGTCACC	TCGGGCTTCT	CTTGAGCACC	1051	GCTCGTCGCG	GCGGGGGGAG	GGGATCTAAT	GGCGTTGGAG	TTTGTTCACA
1101	TTTGGTGGGT	GGAGACTAGT	CAGGCCAGCC	TGGCGCTGGA	AGTCATTCTT	1051	GCTCGTCGCG	GCGGGGGGAG	GGGATCTAAT	GGCGTTGGAG	TTTGTTCACA
1101	TTTGGTGGGT	GGAGACTAGT	CAGGCCAGCC	TGGCGCTGGA	AGTCATTCTT	1151	GGAATTTGCC	CCTTTGAGTT	TGGAGCGAGG	CTAATTCTCA	AGCCTCTTAG
1201	CGGTTCAAAG	GTATTTTCTA	AACCCGTTTC	CAGGTGTTGT	GAGCTAGCCG	1151	GGAATTTGCC	CCTTTGAGTT	TGGAGCGAGG	CTAATTCTCA	AGCCTCTTAG

1251	CCACCATGCC	ACAATTTGAT	)″-TATTATGTA	AAACACCACC	TAAGGTCCTG
1251	CCACCATGCC	ACAATTTGAT	)″-TATTATGTA	AAACACCACC	TAAGGTCCTG	1301	GTTCGTCAGT	TTGTGGAAAG	GTTTGAAAGA	CCTTCAGGGG	AAAAAATAGC
1351	ATCATGTGCT	GCTGAACTAA	CCTATTTATG	TTGGATGATT	ACTCATAACG	1301	GTTCGTCAGT	TTGTGGAAAG	GTTTGAAAGA	CCTTCAGGGG	AAAAAATAGC
1351	ATCATGTGCT	GCTGAACTAA	CCTATTTATG	TTGGATGATT	ACTCATAACG	1401	GAACAGCAAT	CAAGAGAGCC	ACATTCATGA	GCTATAATAC	TATCATAAGC
1451	AATTCGCTGA	GTTTCGATAT	TGTCAACAAA	TCACTCCAGT	TTAAATACAA	1401	GAACAGCAAT	CAAGAGAGCC	ACATTCATGA	GCTATAATAC	TATCATAAGC
1451	AATTCGCTGA	GTTTCGATAT	TGTCAACAAA	TCACTCCAGT	TTAAATACAA	1501	GACGCAAAAA	GCAACAATTC	TGGAAGCCTC	ATTAAAGAAA	TTAATTCCTG
1551	CTTGGGAATT	TACAATTATT	CCTTACAATG	GACAAAAACA	TCAATCTGAT	1501	GACGCAAAAA	GCAACAATTC	TGGAAGCCTC	ATTAAAGAAA	TTAATTCCTG
1551	CTTGGGAATT	TACAATTATT	CCTTACAATG	GACAAAAACA	TCAATCTGAT	1601	ATCACTGATA	TTGTAAGTAG	TTTGCAATTA	CAGTTCGAAT	CATCGGAAGA
1651	AGCAGATAAG	GGAAATAGCC	ACAGTAAAAA	AATGCTTAAA	GCACTTCTAA	1601	ATCACTGATA	TTGTAAGTAG	TTTGCAATTA	CAGTTCGAAT	CATCGGAAGA
1651	AGCAGATAAG	GGAAATAGCC	ACAGTAAAAA	AATGCTTAAA	GCACTTCTAA	1701	GTGAGGGTGA	AAGCATCTGG	GAGATCACTG	AGAAAATACT	AAATTCGTTT
1751	GAGTATACCT	CGAGATTTAC	AAAAACAAAA	ACTTTATACC	AATTCCTCTT	1701	GTGAGGGTGA	AAGCATCTGG	GAGATCACTG	AGAAAATACT	AAATTCGTTT
1751	GAGTATACCT	CGAGATTTAC	AAAAACAAAA	ACTTTATACC	AATTCCTCTT	1801	CCJAGCTACT	JTCATCAATT	GTGGAAGATT	CAGCGATATT	AAGAACGTTG
1851	ATCCGAAAJC	ATJTAAAJTA	GTCCAAAATA	AGTATCJGGG	AGTAATAATC	1801	CCJAGCTACT	JTCATCAATT	GTGGAAGATT	CAGCGATATT	AAGAACGTTG
1851	ATCCGAAAJC	ATJTAAAJTA	GTCCAAAATA	AGTATCJGGG	AGTAATAATC	1901	CAGTGTTTAG	JGACAGAGAC	AAAGACAAGC	GTTAGTAGGC	ACATAJACTT
1951	CTTTAGCGCA	AGGGGTAGGA	TCGATCCACT	TGJATATJTG	GATGAATTTT	1901	CAGTGTTTAG	JGACAGAGAC	AAAGACAAGC	GTTAGTAGGC	ACATAJACTT
1951	CTTTAGCGCA	AGGGGTAGGA	TCGATCCACT	TGJATATJTG	GATGAATTTT	2001	JGAGGAATTC	TGAACCAGTC	CJAAAACGAG	TAAATAGGAC	CGGCAATJCJ
2051	TCAAGCAACA	AACAGGAATA	CCAATTATTA	AAAGATAACT	TAGTCAGATC	2001	JGAGGAATTC	TGAACCAGTC	CJAAAACGAG	TAAATAGGAC	CGGCAATJCJ
2051	TCAAGCAACA	AACAGGAATA	CCAATTATTA	AAAGATAACT	TAGTCAGATC	2101	GTACAACAAG	GCTTTGAAGA	AAAATGCGCC	TJATCCAATC	TTTGCTATAA
2151	AGAATGGCCC	AAAATCTCAC	ATTGGAAGAC	ATTTGATGAC	CTCATJJCTG	2101	GTACAACAAG	GCTTTGAAGA	AAAATGCGCC	TJATCCAATC	TTTGCTATAA
2151	AGAATGGCCC	AAAATCTCAC	ATTGGAAGAC	ATTTGATGAC	CTCATJJCTG	2201	TCAATGAAGG	GCCTAACGGA	GTTGACTAAT	GTTGTGGGAA	ATTGGAGCGA
2251	TAAGCGTGCT	TCTGCCGTGG	CCAGGACAAC	GTATACTCAT	CAGATAACAG	2201	TCAATGAAGG	GCCTAACGGA	GTTGACTAAT	GTTGTGGGAA	ATTGGAGCGA
2251	TAAGCGTGCT	TCTGCCGTGG	CCAGGACAAC	GTATACTCAT	CAGATAACAG	2301	CAATACCTGA	TCACTACTTC	GCACTAGTTT	CTCGGTACTA	TGCATATGAT
2351	CCAATATCAA	AGGAAATGAT	AGCATTGAAG	GATGAGACTA	ATCCAATTGA	2301	CAATACCTGA	TCACTACTTC	GCACTAGTTT	CTCGGTACTA	TGCATATGAT
2351	CCAATATCAA	AGGAAATGAT	AGCATTGAAG	GATGAGACTA	ATCCAATTGA	2401	GGAGTGGCAG	CATATAGAAC	AGCTAAAGGG	TAGTGCTGAA	GGAAGCATAC
2451	GATACCCCGC	ATGGAATGGG	ATAATATCAC	AGGAGGTACT	AGACTACCTT	2401	GGAGTGGCAG	CATATAGAAC	AGCTAAAGGG	TAGTGCTGAA	GGAAGCATAC
2451	GATACCCCGC	ATGGAATGGG	ATAATATCAC	AGGAGGTACT	AGACTACCTT	2501	TCATCCTACA	TAAATAGACG	CATATAATAA	TCTAGAGCTC	GCTGATCAGC
2551	CTCGACTGTG	CCTTCTAGTT	GCCAGCCATC	TGTTGTTTGC	CCCTCCCCCG	2501	TCATCCTACA	TAAATAGACG	CATATAATAA	TCTAGAGCTC	GCTGATCAGC
2551	CTCGACTGTG	CCTTCTAGTT	GCCAGCCATC	TGTTGTTTGC	CCCTCCCCCG	2601	TGCCTTCCTT	GACCCTGGAA	GGTGCCACTC	CCACTGTCCT	TTCCTAATAA
2651	AATGAGGAAA	TTGCATCGCA	TTGTCTGAGT	AGGTGTCATT	CTATTCTGGG	2601	TGCCTTCCTT	GACCCTGGAA	GGTGCCACTC	CCACTGTCCT	TTCCTAATAA
2651	AATGAGGAAA	TTGCATCGCA	TTGTCTGAGT	AGGTGTCATT	CTATTCTGGG	2701	GGGTGGGGTG	GGGCAGGACA	GCAAGGGGGA	GGATTGGGAA	GACAATAGCA
2751	GGCATGCTGG	GGATGCGGTG	GGCTCTATGG	CTTCTGAGGC	GGAAAGAACC	2701	GGGTGGGGTG	GGGCAGGACA	GCAAGGGGGA	GGATTGGGAA	GACAATAGCA
2751	GGCATGCTGG	GGATGCGGTG	GGCTCTATGG	CTTCTGAGGC	GGAAAGAACC	2801	AGCTGGGGCT	CGAGGGGGGA	TCCCGTCGAC	CTCGAGAGCT	TGGCGTAATC
2851	ATGGTCATAG	CTGTTTCCTG	TGTGAAATTG	TTATCCGCTC	ACAATTCCAC	2801	AGCTGGGGCT	CGAGGGGGGA	TCCCGTCGAC	CTCGAGAGCT	TGGCGTAATC
2851	ATGGTCATAG	CTGTTTCCTG	TGTGAAATTG	TTATCCGCTC	ACAATTCCAC	2901	ACAACATACG	AGCCGGAAGC	ATAAAGTGTA	AAGCCTGGGG	TGCCTAATGA
2951	GTGAGCTAAC	TCACATTAAT	TGCGTTGCGC	TCACTGCCCG	CTTTCCAGC	2901	ACAACATACG	AGCCGGAAGC	ATAAAGTGTA	AAGCCTGGGG	TGCCTAATGA
2951	GTGAGCTAAC	TCACATTAAT	TGCGTTGCGC	TCACTGCCCG	CTTTCCAGC	3001	GGGAAACCTG	TCGTGCCAGC	TGCATTAATG	AATCGGCCAA	CGCGCGGGGA
3051	GAGGCGGTTT	GCGTATTGGG	CGCTCTTCCG	CTTCCTCGCT	CACTGACTCG	3001	GGGAAACCTG	TCGTGCCAGC	TGCATTAATG	AATCGGCCAA	CGCGCGGGGA
3051	GAGGCGGTTT	GCGTATTGGG	CGCTCTTCCG	CTTCCTCGCT	CACTGACTCG	3101	CTGCGCTCGG	TCGTTCGGCT	GCGGCGAGCG	GTATCAGCTC	ACTCAAAGGC
3151	GGTAATACGG	TTATCCACAG	AATCAGGGGA	TAACGCAGGA	AAGAACATGT	3101	CTGCGCTCGG	TCGTTCGGCT	GCGGCGAGCG	GTATCAGCTC	ACTCAAAGGC
3151	GGTAATACGG	TTATCCACAG	AATCAGGGGA	TAACGCAGGA	AAGAACATGT	3201	GAGCAAAAGG	CCAGCAAAAG	GCCAGGAACC	GTAAAAAGGC	CGCGTTGCTG
3251	GCGTTTTTCC	ATAGGCTCCG	CCAGCAAAA	GAGCATCACA	AAAATCGACG	3201	GAGCAAAAGG	CCAGCAAAAG	GCCAGGAACC	GTAAAAAGGC	CGCGTTGCTG
3251	GCGTTTTTCC	ATAGGCTCCG	CCAGCAAAA	GAGCATCACA	AAAATCGACG	3301	CTCAAGTCAG	AGGTGGCGAA	ACCCGACAGG	ACTATAAAGA	TACCAGGCGT
3351	TTCCCCCTGG	AAGCTCCCTC	GTGCGCTCTC	CTGTTCCGAC	CCTGCCGCTT	3301	CTCAAGTCAG	AGGTGGCGAA	ACCCGACAGG	ACTATAAAGA	TACCAGGCGT
3351	TTCCCCCTGG	AAGCTCCCTC	GTGCGCTCTC	CTGTTCCGAC	CCTGCCGCTT	3401	ACCGGATACC	TGTCCGCCTT	TCTCCCTTCG	GGAAGCGTGG	CGCTTTCTCA
3451	ATGCTCACGC	TGTAGGTATC	TCAGTTCGGT	GTAGGTCGTT	CGCTCCAAGC	3401	ACCGGATACC	TGTCCGCCTT	TCTCCCTTCG	GGAAGCGTGG	CGCTTTCTCA
3451	ATGCTCACGC	TGTAGGTATC	TCAGTTCGGT	GTAGGTCGTT	CGCTCCAAGC	3501	TGGGCTGTGT	GCACGAACCC	CCCGTTCAGC	CCGACCGCTG	CGCCTTATCC
3551	GGTAACTATC	GTCTTGAGTC	CAACCCGGTA	AGACACGACT	TATCGCCACT	3501	TGGGCTGTGT	GCACGAACCC	CCCGTTCAGC	CCGACCGCTG	CGCCTTATCC
3551	GGTAACTATC	GTCTTGAGTC	CAACCCGGTA	AGACACGACT	TATCGCCACT	3601	GGCAGCAGCC	ACTGGTAACA	GGATTAGCAG	AGCGAGGTAT	GTAGGCGGTG
3651	CTACAGAGTT	CTTGAAGTGG	TGGCCTAACT	ACGGCTACAC	TAGAAGGACA	3601	GGCAGCAGCC	ACTGGTAACA	GGATTAGCAG	AGCGAGGTAT	GTAGGCGGTG

3701	GTATTTGGTA	TCTGCGCTCT	GCTGAAGCCA	GTTACCTTCG	GAAAAAGAGT
3701	GTATTTGGTA	TCTGCGCTCT	GCTGAAGCCA	GTTACCTTCG	GAAAAAGAGT	3751	TGGTAGCTCT	TG ATCCGGCA	AACAAACCAC	CGCTGGTAGC	GGTGGTTTTT
3801	TTGTTTGCAA	GCAGCAGATT	ACGCGCAGAA	AAAAAGGATC	TCAAGAAGAT	3751	TGGTAGCTCT	TG ATCCGGCA	AACAAACCAC	CGCTGGTAGC	GGTGGTTTTT
3801	TTGTTTGCAA	GCAGCAGATT	ACGCGCAGAA	AAAAAGGATC	TCAAGAAGAT	3851	CCTTTGATCT	TTTCTACGGG	GTCTGACGCT	CAGTGGAACG	AAAACTCACG
3901	TTAAGGGATT	TTGGTCATGA	GATTATCAAA	AAGGATCTTC	ACCTAGATCC	3851	CCTTTGATCT	TTTCTACGGG	GTCTGACGCT	CAGTGGAACG	AAAACTCACG
3901	TTAAGGGATT	TTGGTCATGA	GATTATCAAA	AAGGATCTTC	ACCTAGATCC	3951	TTTTAAATTA	AAAATGAAGT	TTTAAATCAA	TCTAAAGTAT	ATATGAGTAA
4001	ACTTGGTCTG	ACAGTTACCA	ATGCTTAATC	AGTGAGGCAC	CTATCTCAGC	3951	TTTTAAATTA	AAAATGAAGT	TTTAAATCAA	TCTAAAGTAT	ATATGAGTAA
4001	ACTTGGTCTG	ACAGTTACCA	ATGCTTAATC	AGTGAGGCAC	CTATCTCAGC	4051	GATCTGTCTA	TTTCGTTCAT	CCATAGTTGC	CTGACTCCCC	GTCGTGTAGA
4101	TAACTACGAT	ACGGGAGGGC	TTACCATCTG	GCCCCAGTGC	TGCAATGATA	4051	GATCTGTCTA	TTTCGTTCAT	CCATAGTTGC	CTGACTCCCC	GTCGTGTAGA
4101	TAACTACGAT	ACGGGAGGGC	TTACCATCTG	GCCCCAGTGC	TGCAATGATA	4151	CCGCGAGACC	CACGCTCACC	GGCTCCAGAT	TTATCAGCAA	TAAACCAGCC
4201	AGCCGGAAGG	GCCGAGCGCA	GAAGTGGTCC	TGCAACTTTA	TCCGCCTCCA	4151	CCGCGAGACC	CACGCTCACC	GGCTCCAGAT	TTATCAGCAA	TAAACCAGCC
4201	AGCCGGAAGG	GCCGAGCGCA	GAAGTGGTCC	TGCAACTTTA	TCCGCCTCCA	4251	TCCAGTCTAT	TAATTGTTGC	CGGGAAGCTA	GAGTAAGTAG	TTCGCCAGTT
4301	AATAGTTTGC	GCAACGTTGT	TGCCATTGCT	ACAGGCATCG	TGGTGTCACG	4251	TCCAGTCTAT	TAATTGTTGC	CGGGAAGCTA	GAGTAAGTAG	TTCGCCAGTT
4301	AATAGTTTGC	GCAACGTTGT	TGCCATTGCT	ACAGGCATCG	TGGTGTCACG	4351	CTCGTCGTTT	GGTATGGCTT	CATTCAGCTC	CGGTTCCCAA	CGATCAAGGC
4401	GAGTTACATG	ATCCCCCATG	TTGTGCAAAA	AAGCGGTTAG	CTCCTTCGGT	4351	CTCGTCGTTT	GGTATGGCTT	CATTCAGCTC	CGGTTCCCAA	CGATCAAGGC
4401	GAGTTACATG	ATCCCCCATG	TTGTGCAAAA	AAGCGGTTAG	CTCCTTCGGT	4451	CCTCCGATCG	TTGTCAGAAG	TAAGTTGGCC	GCAGTGTTAT	CACTCATGGT
4501	TATGGCAGCA	CTGCATAATT	CTCTTACTGT	CATGCCATCC	GTAAGATGCT	4451	CCTCCGATCG	TTGTCAGAAG	TAAGTTGGCC	GCAGTGTTAT	CACTCATGGT
4501	TATGGCAGCA	CTGCATAATT	CTCTTACTGT	CATGCCATCC	GTAAGATGCT	4551	TTTCTGTGAC	TGGTGAGTAC	TCAACCAAGT	CATTCTGAGA	ATAGTGTATG
4601	CGGCGACCGA	GTTGCTCTTG	CCCGGCGTCA	ATACGGGATA	ATACCGCGCC	4551	TTTCTGTGAC	TGGTGAGTAC	TCAACCAAGT	CATTCTGAGA	ATAGTGTATG
4601	CGGCGACCGA	GTTGCTCTTG	CCCGGCGTCA	ATACGGGATA	ATACCGCGCC	4651	ACATAGCAGA	ACTTTAAAAG	TGCTCATCAT	TGGAAAACGT	TCTTCGGGGC
4701	GAAAACTCTC	AAGGATCTTA	CCGCTGTTGA	GATCCAGTTC	GATGTAACCC	4651	ACATAGCAGA	ACTTTAAAAG	TGCTCATCAT	TGGAAAACGT	TCTTCGGGGC
4701	GAAAACTCTC	AAGGATCTTA	CCGCTGTTGA	GATCCAGTTC	GATGTAACCC	4751	ACTCGTGCAC	CCAACTGATC	TTCAGCA TCT	TTTACTTTCA	CCAGCGTTTC
4801	TGGGTGAGCA	AAAACAGGAA	GGCAAAATGC	CGCAAAAAAG	GGAATAAGGG	4751	ACTCGTGCAC	CCAACTGATC	TTCAGCA TCT	TTTACTTTCA	CCAGCGTTTC
4801	TGGGTGAGCA	AAAACAGGAA	GGCAAAATGC	CGCAAAAAAG	GGAATAAGGG	4851	CGACACGGAA	ATGTTGAATA	CTCATACTCT	TCCTTTTTCA	ATATTATTGA
4901	AGCATTTATC	AGGGTTATTG	TCTCATGAGC	GGATACATAT	TTGAATGTAT	4851	CGACACGGAA	ATGTTGAATA	CTCATACTCT	TCCTTTTTCA	ATATTATTGA
4901	AGCATTTATC	AGGGTTATTG	TCTCATGAGC	GGATACATAT	TTGAATGTAT	4951	TTAGAAAAAT	AAACAAATAG	GGGTTCCGCG	CACATTTCCC	CGAAAAGTGC
5001	CACCTGACGT	CGACGGATCG	GGA			4951	TTAGAAAAAT	AAACAAATAG	GGGTTCCGCG	CACATTTCCC	CGAAAAGTGC

其序列如上所示(SEQ ID NO：3)的pEFrat-FLPe载体，具有下列特征(位置根据序列中核酸的编号给定，所述编号系统已在之前详述)：

-从位置1到位置1243：鼠EF-1α启动子；

-从位置1256到位置2527：Flpe编码序列；

-从位置2537到位置2763：bGH多腺苷酸信号；

-从位置3020到位置3543：Col E1复制起点；

-从位置4887到位置4027：安必西林抗性基因。

C.pT125-FRT重新整合载体(图3)：

pT125-FRT重新整合载体源于T125-IG24载体(图4)，其中CMV启动子已被RSV启动子取代，而且新霉素抗性基因的多腺苷酸序列已经被删除并且被像pTV1载体中Frt位点的方向一样插入的Frt位点替换。

示例2：瞄准YB2/0细胞株中的高转录活性区域

a.用pTV1载体转染YB2/0细胞株

鼠细胞株YB2/0(ATCC # CRL-1662)在添加了5％的肽牛血清(FBS)的EMS培养基(Invitrogen，ref.041-95181M)中生长。用Optibuffer转染试剂盒(Thermo Electron)对5百万个细胞进行电穿孔(BioRad electroporator，model 1652077)。对于每个转染，使用5μg用ScaI限制酶线性化的pTV1载体细胞。电穿孔在0.5ml试管中在230伏和950微法拉下进行。每个电穿孔试管的内容物以每孔5000个细胞的浓度分散到10个96孔板中。在转染三天之后，细胞被转移到添加了5％FBS和2mg/ml的G418(Invitrogen，ref.10131-027)的EMS选择培养基中。

b.荧光筛查G418-抗性克隆

在转染10到15天后，有抗性的克隆基于maxFP^TM-Green蛋白的maxFP^TM-Green荧光而被确定(482nm处激发，502nm处发射)。所有的有抗性的克隆被首先在荧光板读取器(VICTOR3，Perkin Elmer)上进行筛选。所有的荧光克隆接着流入流式细胞仪中以测量每个细胞的荧光强度以及克隆的同质性。结果用免费的WinMDI2.8(http://facs.scripps.edu)软件进行分析。所有的具有同质的荧光峰值并且平均荧光强度(MFI)超过500的克隆被分拣并被转移到24孔板上进行扩增。

c.酶联免疫吸附试验(ELISA)筛选以及拷贝数的确定

细胞被维持于24孔板中，上清液被检测(ELISA)以估算抗-D抗体的产量。所有产率超过10pcd(皮克每个细胞每24小时)的克隆被执行半定量化的PCR来估算pTV1载体的拷贝数量。拷贝数量的估算使用了ABI

7000机器，使用CELL LINE序列(其数量在从YB2/0细胞株中产生的克隆中是稳定的)作为标准控制。发现含有单个拷贝的克隆接着进行DNA印迹法来确定拷贝数量。

d.甲氨喋呤(MTX)基因扩增

基因扩增试验使用MTX(Sigma，ref.M8407)，在携带单个拷贝的高产率克隆中进行，以估算由pTV1载体定位的位点的扩增能力。浓度为25nM或更高的MTX被加入EMS培养基(+5％FBS)。在该选择性培养基中培养15天后，有抗性的克隆进行ELISA以检查增加的产率以及进行定量PCR以检查增加的拷贝数量。3G11克隆(9.7pcd)的产率在一个扩增周期后增加到22pcd。同样地，35H4克隆(11.4pcd)的产率在一个扩增周期后增加了大约3倍。

示例3：使用Flp重组酶切除PV1目标载体；产生YGM-1/10G10和YGM-2/3G5细胞株(图5)

YGM-1/10G10 cell line

携带着pTV1载体的单个拷贝的高产率克隆8A10和3G11(在扩增之前分别为6.6pcd和9.7pcd)被选择通过删除目标载体以产生YGM细胞株。

克隆8A10首先在T75瓶中在含有2mg/ml G418的EMS培养基(5％FBS)中进行扩增。在转染前一天，从培养基中去除G418。

能被5μg整除的非线性化的pEFrat-FLPe载体重悬浮于175μl无血清的EMS中，与25μlSuperfect一起在与1ml EMS(5％FBS)混合前在室温下培养10分钟。该混合物中加入2×10⁶PBS清洗过的细胞，并在EMS培养液(5％FBS)中稀释至2.5×10⁵ cells/ml。在37℃培养4小时后，细胞被转移到EMS培养液(5％ FBS)中。

培养24小时后，细胞被分散到96孔板上，浓度为每孔5000个细胞。

在转染两天后细胞被转移到选择性培养基，添加了4μM更昔洛韦(Invivogen，ref.sud-gcv)的EMS培养基(5％FBS)中。

培养15天后，存活下来的克隆在流式细胞仪中进行检测以检查荧光的消失，通过ELISA检查抗-D免疫球蛋白的消失，以及通过PCR检查pTV1载体的完全切除，使用下列引物：

5′PTV1(SEQ ID NO：10)：5′-CCTATGGAAAAACGCCAGCAAC-3′

3′PTV1(SEQ ID NO：11)：5′-CCTTAGAAAGCGGTCTGTGAAA-3′

经切除过的克隆，克隆10G10被选择成为YGM-1/10G10表达细胞株，并在三个月的时间内检测其整合位点的稳定性。

YGM-2/3G5细胞株

携带pTV1载体单个拷贝的克隆35H4(1)2G2(13.3pcd)是克隆35H4(扩增前11.4pcd)的高产率衍生物，被选择通过删除目标载体的方式产生YGM细胞株。

克隆35H4(1)2G2首先在T75瓶中在含有1mg/ml G418的RPMI培养基(5％FBS)中进行扩增。在转染前的两个世代从培养基中去除G418。

能被25μg整除的非线性化的pEFrat-FLPe载体重悬浮于500μl无血清的RPMI中，与75μl Fugene HD(Roche)一起在室温下培养15分钟。120μl该混合物被加入到每个孔中含有6×10⁵细胞/ml的RPMI培养液(5％FBS)的六孔板中。培养24小时后，细胞被分散到96孔板上，浓度为每孔1000个细胞。

在转染三天后细胞被转移到选择性培养基，添加了4μM更昔洛韦(Invivogen，ref.sud-gcv)的RPMI培养基(5％FBS)中。

DEL REV(SEQ ID NO：14)：5′-TGGTATGGCTGATTATGATCCTC-3’

DEL FOR 3(SEQ ID NO：15)：5′-CCTTTTGCTCACATGGCTCGAC-3’

经切除过的克隆，克隆35H4(1)2G2被选择成为YGM-2/3G5表达细胞株，并在三个月的时间内检测其整合位点的稳定性。

示例4：在YGM-1/10G10和YGM-2/3G5细胞株中重新整合表达载体(图6)

YGM-1/10G10细胞株

编码如在筛选步骤(抗-D抗体)中使用的抗体相同抗体的载体被重新整合，以检测在YGM-1(克隆10G10)的Frt位点重新整合后表达水平的再现性。

通过切除携带有单独Frt重组位点以及与“SV40前多A”相应的多腺苷酸序列的目标载体TV1而产生的克隆10G10，在T75瓶中的EMS培养液(5％FBS)中被扩增。

10μg非线性化的pEFrat-FLPe载体和5μg的非线性化pT125-FRT重新整合载体被用来进行共转染。5百万细胞在0.5ml试管中使用Optibuffer转染试剂盒(Thermo Electron)进行电穿孔(BioRad electroporator，型号1652077)，参数如下：230伏和950微法拉。

细胞被分散到96孔板，浓度为5000个细胞每孔。

转染后两天，细胞被转移到添加了2mg/ml G418的EMS培养基(5％FBS)选择性培养基中。

在培养15天后，存活下来的克隆在24孔板中进行扩增，并且通过PCR进行筛选以检查在YGM-1细胞株Frt位点的重新整合。

为了筛选，使用了m5NEO-2和SV40多A-1rev引物：

m5NEO-2引物 SEQ ID NO：12)：

5′-GATGCCTGCTTGCCGAATA-3′

SV40polyA-1rev引物 SEQ ID NO：13)：

5′CCTTAGAAAGCGGTCTGTGAAA-3′

随机整合到YGM-1细胞株基因组的克隆被排除。pT125-FRT载体整合到YGM-1细胞株的Frt位点的克隆进行ELISA以测定抗-D T125抗体的产率。

选择克隆21B10(5.5pcd)在三个月时间内检测稳定的重新整合。

YGM-2/3G5细胞株

编码如在筛选步骤(抗-D抗体)中使用的抗体相同抗体的载体被重新整合，以检测在YGM-2(克隆35H4(2)3G5)的Frt位点重新整合后表达水平的再现性。

通过切除携带有单独Frt重组位点以及与SV40前多腺苷酸信号相应的多腺苷酸序列的目标载体TV1而产生的克隆35H4(2)3G5，在T75瓶中的RPMI培养液(5％FBS)中被扩增。

4μg非线性化的pEFrat-FLPe载体和2μg的非线性化pT125-FRT重新整合载体被用来进行共转染。

两种非线性化的载体在300μl无血清的EMS中稀释并与18μl Fugene HD(Roche)一起在室温下培养15分钟。75μl的混合物被加入到每孔含有6×10⁵细胞/mlEMS培养液(5％FBS)的6孔板中。培养24小时后，细胞被分散到96孔板中，浓度为每孔1000个细胞。

细胞被分散到10块96孔板中，浓度为每孔1000个细胞。

转染后两天，细胞被转移到添加了3mg/ml G418的EMS培养基(5％FBS)选择性培养基中。

在培养12天后，存活下来的克隆在24孔板中进行扩增，并且通过PCR进行筛选以检查在YGM-2细胞株Frt位点的重新整合。

为了筛选，使用了如下引物：

-为检测5’端的整合

DEL FOR 3(SEQ ID NO：15)：5′-CCTTTTGCTCACATGGCTCGAC-3′

3FRT3(SEQ ID NO：16)：5′-TTGTCTCATGAGCGGATACA-3′

-为了检测3’端的整合

DEL REV(SEQ ID NO：14)：5′-TGGTATGGCTGATTATGATCCTC-3′

m-5-NEO-2(SEQ ID NO：12)：5′-GATGCCTGCTTGCCGAATA-3′

由于该筛选，转染子对G418有抗性但表现为随机整合到YGM-2细胞株基因组的已经被消除。

在已经将pT125-FRT载体整合到YGM-2细胞株Frt位点的转染子中，19D1，25E5，30A5和20F11克隆进行ELISA，以评估其抗-D抗体的产率。获得的这4个克隆的产率(分别为7.1pcd；7.0pcd；7.1pcd；和7.7pcd)是同质的，并且如观测到的35H4克隆或35H4(1)2G2母体克隆(11.4pcd和13.3pcd)一样具有相同的数量级，这对为获得具有可重复性质的强大的生产者证明了该定位策略的价值。克隆后，在超过三个月的时间内对这些克隆的遗传稳定性进行研究。

示例5：用反向PCR分析对YGM-1细胞株(克隆10G10)的整合位点进行鉴定

在反向PCR扩增后对整合位点进行测序，使用各种限制酶对来自8A10(含有目标载体)和10G10(删除后的YGM-1细胞株)克隆的DNA进行降解，得到的限制性片段使用T4连接酶重新连接。为了在目标载体内的序列使用下游引物进行反向PCR。获得的PCR产物在其5’和3’端具有目标载体序列，而且在其中间部分，一段对应于整合区域的未知的长度不定的(根据所使用的限制酶)序列紧挨着目标载体。对各种PCR产物测序获得高转录活性整合位点的序列(SEQ ID NO：1)。

REFERENCES

1.Baneyx F.and M.Mujacic.Recombinant protein folding and misfolding inEscherichia coli.Nat Biotech 22(11)：1399-1408，2004.

2.Makrides，S.C.1996.Strategies for achieving high-level expression of genesin Escherichia coli.Microbiol.Rev 60：512.

3.Gasser，B.，and D.Mattanovich.2006.Antibody production with yeasts andfilamentous fungi：on the road to large scale，Biotechnol Lett.

4.T.U.Gerngross.Advances therapeutic pro teins in yeasts Biotech 22(11)：1409-1414，2004.in the production of human and filamentous fungi.Nat

5.Smerdon，G.R.，E.F.Walton，and S.J.Aves.1998.Stable production of humangastric lipase by chromosomal integration in the fission yeast Schizosaccharomycespombe.Appl.Microbiol.Biotechnol 49：45.

6.Hellwig，S.，J.Drossard，R.M.Twyman，and R.Fischer.2004.Plant cellcultures for the production of recombinant proteins.Nat Biotechnol 22：1415.

Miller.L.K.1993.Baculoviruses：high-level expression in insect cells.CurrQpin Genet.Dev 3：97.

McCall，E.J.，A.Danielsson，1.M.Hardern，C.Dartsch，R.Hicks，J.M.Wahlberg，and W.M.Abbott.2005.Improvements to the throughput of recombinant proteinexpression in the baculovirus/insect cell system.protein Expr.Purif，42：29.

Schmidt，F.R.2004.Recombinant expression systems in the pharmaceuticalindustry.Appl Microbiol.Biotechnol 65：363

Simonsen，C.C.，and M.McGrogan.1994.The molecular biology of cell lines.Biologicals 22：85

Geisse，S.，H.Gram，B.Kleuser，and H.P.Kocher.1996.Eukaryotic expressionsystems：a comparison.Protein Expr.Purif.8：271.

Bending，M.M.1988.The production of foreign proteins in mammalian cells.Genet.Eng91.

C.Gorman and C.Bullock.Site specific gene targeting for gene expression ineukaryotes.Curr Opin Biotechnol 11(5)：455-460，2000.

M.E.Reff.High-level production of recombinants in immunoglobulins in mammaliancells.Curr Opin Biotechnol 4(5)：573-576，1993.

D.C.Anderson and L.Krummen Recombinant protein expression for therapeuticapplications.Curr Opin Biotechnol 13(2)：117-123，2002.

R.J.Kaufman.Use of recombinant DNA technology for engineering mammalian cellsto produce proteins.Bioprocess Technol.10：15-69，1990.

R.J.Kaufman.Overview of vector design for mammalia gene expression.Mol.Biotechnol.16(2)：151-160，2000.

Lucas，B.K.，L.M.Giere，R.A.DeMarco，A.Shen，V.Chisholm，and.C.W.Crowley.1996.High level production of recombinant proteins in CHO cells suing adicistronic DHFR intron expression vector.Nucl.Acids Res.24：1774.

F.Hesseand R.Wagner.Developments and improvements in the manufacturing of humantherapeutics with mammalians cell cultures.Trends Biotehnol 18(4)：173-180，2000.

Mr.Butler.Animal cell cultures：recent achievements and perpectives in theproduction of biopharmaceuticals.Appl.Microbiol.Biotechnol 68(3)：283-291，2005.

Fussenegger，M.and J.E.Bailey.1998.Molecular regulation of cell-cycleprogression and apoptosis in mammalian cells：implications for biotechnology.Biotechnol Prog.14：807.

Peakman，T.C.，J.Worden，R.H.Harris，H.Cooper，J.Tite，M.J.Page，D.R.Gewert，M.Bartolomew，J.S.Crowe，and S.Brett.1994.Comparison of expression of ahumanized monoclonal antibody in mouse NSO myeloma cells in Chinese hamster ovarycells.Hum Antibodies Hybridomas 5：65.

S.J.Kim，N.S.Kim，C.J.Ryu，H.J Hong，and G.M.Lee.Characterization of chimericantibody producing CHO cells in the course of dihydrofolate reductase-mediatedgene amplification and their stability in the absence of selective pressure.Biotechnol Bioeng.58(1)：73-84，1998.

Seth，G.，P.Hossler，J.C.Yee，and W.S.Hu.2006.Engineering cells for cellculture bioprocessing physiological fundamentals.Adv.Biochem.EngBiotechnol 101：119.

F.M.Wurm，A；Johnson，T.Ryll，C.Kohne，H.Scherthan，F.Glaab，Y.S.Lie，C.J.Petropoulos，and W.R.Arathoon.Gene transfer and amplification in CHO cells.Efficient methods for maximizing specific productivity and assessment of geneticconsequences.Ann.N.Y.Acad.Sci 782：70-78，1996.

F.M.Wurm.Production of recombinant proteins therapeutics in cultivatedmammalian cells.Nat Biotechnol 22(11)：1393-1398，2004.

Trill，J.J.，A.R.Schatzman，and S.Ganguly.1995.Production of monoclonalantibodies in COS and CHO cells.Curr Opin Biotechnol 6：553

F.M.Wurm.Integration，amplification and stability of plasmid sequences in CHOcell cultures.Biologicals 18(3)：159-164，1990.

M.Schroder，K.Matischak，and P.Friedl.Serum-and protein-free mediaformulations for the Chinese hamster ovary cell line DUKXB11.J Biotechnol 108(3)：279-292，2004.

C.R.Bebbington，G.Renner，S.Thomson，D.King，D.Abrams，and G.T.Yarranton.High-level expression of a recombinant antibody from myeloma cells using aglutamine synthetase gene as an amplifiable selectable marker.Biotechnology(N.Y.)10(2)：169-175，1992.

Barnes LM and al 2000 Cytotechnology 32：109-123.Advances in animal cellrecombinant protein production

Thomas，P.，and T.G.Smart.2005.HEK293 cell line：a vehicle for the expressionor recombinant proteins.J Pharmacol.Toxicol.Methods 51：187.

Grunberg，J.，K.Knogler，R.Waibel，and I.Novak-Hofer.2003.High-yieldproduction of recombinant antibody fragments in HEK-293 cells using sodiumbutyrate.Biotechniques 34：968.

Racher，A.J.，J.L.Moreira，P.M.Alves，M.Wirth，U.H.Weidle，H.Hauser，M.J.Carrondo，and J.B.Griffiths.1994.Expression of recombinant antibody andsecreted alkacell line phosphatase in mammalian cells.Influence of cell line andculture system upon production kinetics.Appl.Microbiol.Biotechnol 40：851.

Griffiths，J.B.，and A.J.Racher.1994.Cultural and physiological factorsaffecting expression of recombinant proteins.Cytotechnology 15：3.

Y.ariya，K.Ishida，Y.Tsubota，Y.Nakashima，.Hirosaki，T.Ogawa，and K.Miyazaki.Efficient expression system or human recombinant laminin-5.J Biochem.(Tokyo)132(4)：607-612，2002.

al-Shawi，R.，J.Kinnaird，J.Burke，and J.O.Bishop.1990.Expression or a foreigngene in a cell line of transgenic mice is modulated by a chromosomal position effect.Mol Cell Biol 10：1192.

Yoshimura，F.K..and K.Chaffin.1987.Different activities of viral enhancerelements before and after stable integration of transfected DNAs.Mol Cell Biol7：1296.

Felsenfeld，G.，J.Boyes，J.Chung，D.Clark，and V.Studitsky.1996.Chromatinstructure and gene expression.PNAS 93：9384.

Gugliemi，L.，V.Truffinet，M.Cogne，and Y.Denizot.2003.The beta-globin HS4insulator confers copy-number dependent expression of IgH regulatory elements instable B cell transfectants.Immunel Lett.89：1l9.

Chung，J.H.，M.Whiteley，and G.Felsenfeld.1993.A 5’element of the chickenbeta-globulin domain serves as an insulator in human erythroid cells and protectsagainst position effect in Drosophila.Cell 74：505.

Tajima，S.，K.Shinohara，M.Fukumoto，R.Zaitsu，J.Miyagawa，S.Hino，J.Fan，K.Akasaka，and M.Matsuoka.2006.Ars Insulator Identified in Sea Urchin Possessesan Activity to Ensure the Transgene xpression in Mouse Cells.J.Biochem(Tokyo)139：705.

T.Benton，T.Chen，M.McEntee，B.Fox，D.King，R.Crombie，T.C.Thomas，andC.Bebbington.The use of UCOE vectors in combination with a preadapted serumfree，suspension cell line allows for rapid production of large quantities ofprotein.Cytotechnology 38(1-3)：43-46，2006；

Fukushige，S.，and B.Sauer.1992.Genomic targeting with a positive-selectionlox integration vector allows highly reproducible gene expression in mammaliancells.Proc Natl.Acad.Sci U.S.A.89：7905.

Kito，M.，S.Itami，Y.Fukano，K.Yamana，and T.Shibui.2002.Construction ofengineered CHO strains for high-level production of recombinant proteins ApplMicrobiol Biotechnol 60：442

H.P.Fell，S.Yarnold，I.Hellstrom，K.E.Hellstrom，and K.R.Folger.Homologousrecombination in Hybridoma cells：heavy chain chimeric antibody produced by genetargeting.Proc Natl.Acad.Sci.U.S.A.86(21)：8507-8511，1999.

D.A.Sorrell and A.F.Kolb.Targeted modification of mammalian genomes.Biotechnol Adv 23(7-8)：431-469，2005.

Morrow，B.，and Kucherlapati.1993.Gene targeting in mammalian cells in homologousrecombination.Curr Opin Biotechnol 4：577.

Choul ika，A.，A.Perr in，B.Dujon，and J.F.Nicolas.1995.Induct ion of homo logousrecombination in mammalian chromosomes by using the I-SceI system of Saccharomycescerevisiae.Mol.Cel.Biol.15：1968.

Kolb，A.2002.Genome engineering using site-specific recombinases.Cloning StemCells 4：65.

Sauer，B.1987.Functional expression of the Cre-lox site-specific recombinationsystem in the yeast saccharomyces cerevisiae.Mol.Cell.Biol.7：2087.

Sauer，B.，and N.Henderson.1990.Targeted insertion of exogenous into theeukaryotic genome by the Cre recombinase.New.Biol 2：441.

Golic，K.G.，and S.Lindquist.1989.The FLP recombinase yeast catalyzessite-specific recombination in the Drosophila genome.Cell 59：499.

O’Gorman，S.，D.T.Fox，and G.M.Wahl.1991.Recombinase-mediated geneactivation and site-specific integration in mammalian cells.Science 251：1351.

Buchholz，F.，P.O.Angrand，and A.F.Stewart.1998.Improved properties for FLPrecombinase evolve by cycling mutagenesis.Nat Biotechnol 16：657.

Xu，Z.L.，H.Mizuguchi，A.Ishii-Watabe，E.Uchida，T.Mayumi，and T.Hayakawa.2001.Optimization of transcriptional regulatory elements for constructingplasmid vectors.Gene 272：149.

Xu，Z.L.，H.Mizuguchi，A.Ishii-Watabe，E.Uchida，T.Mayumi，and T.Hayakawa.2002.Strength evaluation of transcriptional regulatory elements for transgeneexpression y adenovirus vector.J.Control Release.81：155.

Pfarr，D.S.；L.A.Rieser，R.P.Woychic，F.M.Rottman，M.Rosenberg，and M.E.Reff.1996.Differential effects of polyadenylation regions on gene expressionin mammalian cells.DNA 5：115.

Petitclerc，D.，J.Attal，M.C.Theron，M.Bearzotti，P.Bolifraud，G.Kann，M.G.Stinnakre，H.Pointu，C.Puissant，and L.M.Houdebine.1995.The effect ofvarious introns and transcription terminators on the efficiency of expressionvectors in various culture cell lines and in the mammary gland of transgenic mice.J.Biotechnol 40：169.

Kim，D.，G.D.Kim，K.Baek，Y.Yoon，and J.Yoon.2003.Improved mammalianexpression systems by manipulating transcriptional termination regions.Biotechnol Prog 19：1620.

Edmonds，M.2002.A history of Poly A sequences：from formamtion to factors tofunctions.Prog.Nucleic acid.Res Mol Biol 71：285.

Lewis，J.D.，S.I.Gunderson，and I.W.Mattaj.1995 The influence of 5’andstructures on pre-mRNA metabolism.J.Cell Sci Suppl 19：13.

Cramer，P.，A.Srebrow，S.Kadener，S.Werbajh，M.M.de la，G.Melen，G.Nogues，and A.R.Kornblihtt 2001.Coordination between transcription and pre-mRNAprocessing.FEBS.Lett.498：179.

Carlswell and al.(1989)，Molecular and cellular Biology，October 1989，p.4248-4258.

Denome and al.(1988)，Molecular and cellular Biology，Nov.1988，p.4829-4839.

GiI A，Proudfoot NJ.(1987)，CeIl.1987 May 8；49(3)：399-406.Position-dependent sequence éléments downstream of AAUAAA are required forefficient rabbit beta-globin mRNA 3′end formation.

Gimmi ER，Soprano KJ，Rosenberg M，Reff ME(1998)，Nucleic Acids Res.1988 Sep26；16(18)：8977-97.Deletions in the SV40 late polyadenylation region downstreamof the AATAAA mediate similar effects on expression in various mammalian celllines.

Schek N，Cooke C，Alwine JC(1992)，Mol Cell Biol.12(12)：5386-93.Definitionof the upstream efficiency element of the simian virus 40 late polyadenylationsignal by using in vitro analyses.

Levitt N，Briggs D，GiI A，Proudfoot NJ(1989)，Genes Dev.3(7)：1019-25.Definition of an efficient synthetic poly(A)site.

Moreira A，Wollerton M，Monks J，Proudfoot NJ(1995)14(15)：3809-19 Upstreamsequence elements enhance poly(A)site efficiency of the C2 complement gene andare phylogenetically conserved.

Edwalds-Gilbert G，Prescott J，Falck-Pedersen E.(1993)，Mol CeIl Biol.Jun；13(6)：3472-80.3′RNA processing efficiency plays a primary role in generatingtermination-competent KNA polymerase II elongation complexes.

序列表

<110>LFB生物技术简易股份公司

<120>用于生产蛋白，特别是治疗用蛋白的高转录活性细胞株

<130>PFD1090246F-CF

<140>PCT/FR2007/002144

<141>2007-12-20

<160>16

<170>PatentIn version 3.3

<210>1

<211>4419

<212>DNA

<213>人工序列

<220>

<223>分离的核酸分子(Isolated nucleic acid molecule)

<220>

<221>misc_feature

<222>(140)..(140)

<223>n是a，c，g或t

<220>

<221>misc_feature

<222>(160)..(160)

<223>n是a，c，g或t

<400>1

tggaaacaga aactaaatag agacatagag aaaatgaaca gaagttatga accaaatgga 60

tttaaccggt atttatacaa catttcatct taaaacaaaa gaatatacct tcttctcagc 120

acctcatagc ctcttctacn aaaccatata gtcggtcacn aaacaagcct caacagatac 180

aagaagataa aaataatccc atgcatacta tcagatcacc atggactaac tctggtcttc 240

aataacaaca aaaacaatgg aagtcgaaga acactctatt caatgataac ttggtcaagg 300

aagagatgaa aaaggaaatt aaagcctttt tagaatttca tgaaaatgaa ggcacaacat 360

acccaaactt atgagacaca aggaaagcag tgctaagagg aaaactcata gctctgagtg 420

cctccaaaaa gaaacaagag agagtgtata ctagcagctt gagagcacac ctgaaagctc 480

tagaacaaaa agaagcaaat acacccaaga ggagaagatc aaatgcaggg ctgaaatcaa 540

ccaagtagaa acaaaagaac tgtaaaaaga accaacaaaa ccaggagttg gttggttgag 600

aaaatcaaaa agataaataa acccttaatc agaataacca gagggcacag aaacagtatc 660

caaattaaca aaataagaaa tggaaaggga gacgtaaaac agaatccgag gaaataaaaa 720

aaaattgatc ctattacaaa agtctatatt caacaaagct ggaaaatctg gatgaaatag 780

acaattttct agatagatac cagataccaa agttaaatca ggaccagata aatcatctaa 840

acagtcccat aactcctaaa gaaatagaag cagttattaa aattctcccg accaaaaaaa 900

aaaaaaaaaa aaagcccagg attggatggg tttagtggag aattctatca gaccttcatc 960

aaagacctaa taccaatact gtccaaacta ttccttgcaa cactgaatat tccgcataca 1020

ctattcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc 1080

ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag 1140

gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa 1200

ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg 1260

gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa 1320

ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg 1380

gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt 1440

gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt 1500

caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag 1560

cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat 1620

ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct 1680

taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct 1740

tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca 1800

gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc 1860

agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc 1920

aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct 1980

gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag 2040

gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc 2100

tacaccgaac tgagatacct acagcgtgag ctatgagaaa gcgccacgct tcccgaaggg 2160

agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag 2220

cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt 2280

gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac 2340

gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatggc tcgacagatc 2400

catgttcttt cctgcgttat cccctgattc tgtggataac cgtattaccg cctttgagtg 2460

agctgatacc gctcgccgca gccgaacgac cgagcgcagc gagtcagtga gcgaggaagc 2520

ggaagagcgc ctgatgcggt attttctcct tacgcatctg tgcggtattt cacaccgcat 2580

atggtgcact ctcagtacaa tctgctctga tgccgcatag ttaagccaga gaagtaccta 2640

ttccgaagtt cctattctct agaaagtata ggaacttctc atgttctttc ctgcgttatc 2700

ccctgattct gtggataacc gtattaccgc ctttgagtga gctgataccg ctcgccgcag 2760

ccgaacgacc gagcgcagcg agtcagtgag cgaggaagcg gaagagcgcc tgatgcggta 2820

ttttctcctt acgcatctgt gcggtatttc acaccgcata tggtgcactc tcagtacaat 2880

ctgctctgat gccgcatagt taagccagct agaggatcat aatcagccat accacatttg 2940

tagaggtttt acttgcttta aaaaacctcc cacacctccc cctgaacctg aaacataaaa 3000

tgaatgcaat tgttgttgtt aacttgttta ttgcagctta taatggttac aaataaagca 3060

atagcatcac aaatttcaca aataaagcat ttttttcact gcattctagt tgtggtttgt 3120

ccaaactcat caatgtatct tatcatgtct ggatccccag gaagctcctc tgtgtcctca 3180

taaaccctaa cctcctctac ttgagaggac attccaatca taggctgccc atccaccctc 3240

tgtgtcctcc tgttaattag gtcacttaac aaaaaggaaa ttgggtaggg gtttttcaca 3300

gaccgctttc taagggtaat tttaaaatat ctgggaagtc ccttccactg ctgtgttcca 3360

gaagtgttgg taaacagccc acaaatgtca acagcagaaa catacaagct gtcagctttg 3420

cacaagggcc caacaccctg ctcatcaaga agcactgtgg ttgctgtgtt agtaatgtgc 3480

aaaacaggag gcacattttc cccacctgtg taggttccaa aatatctagt gttttcattt 3540

ttacttggat caggaaccca gcactccact ggataagcat tatccttatc caaaacagcc 3600

ttgtggtcag tgttcatctg ctgactgtca actgtagcat tttttggggt tacagtttga 3660

gcaggatatt tggtcctgta gtttgctaac acaccctgca gctccaaagg ttccccacca 3720

acagcaaaaa aatgaaaatt tgacccttga atgggttttc cagcaccatt ttcatgagtt 3780

ttttgtgtcc ctgaatgcaa gtttaacata gcagttaccc caataacctc agttttaaca 3840

gtaacagctt cccacatcaa aatatttcca caggttaagt cctcatttaa attaggcaaa 3900

ggaattcttg aagacgaaag ggcctcgtga tacgcctatt tttataggtt aatgtcatga 3960

taataatggt ttcttagacg tcaggtggca cttttcgggg aaatgtgcgc ggaaccccta 4020

tttgtttatt tttctaaata cattcaaata tgtatccgct catgagacaa taaccctgat 4080

aaatgcttca ataatattga aaaaggaaga gtatgagtat tcaacatttc cgtgtcgccc 4140

ttattccctt ttttgcggca ttttgccttc ctgtttttgc tcacccagaa acgctggtga 4200

aagtaaaaga tgctgaagat cagttgggtg cacgagtggg ttacatcgaa ctggatctca 4260

acagcggtaa gatccttgag agttttcgcc ccgaagaacg ttttccaatg atgagcactt 4320

ttaaagttct gctatgtggc gcggtattat cccgtgttga cgccgggcaa gagcaactcg 4380

gtcgccgcat acactattct cagaatgact tggttgagt 4419

<210>2

<211>14987

<212>DNA

<213>人工序列

<220>

<223>载体

<400>2

gaagtaccta ttccgaagtt cctattctct agaaagtata ggaacttcta cagagatccg 60

cccgccccgt tgacgcaaat gggcggtagg cgtgtacggt gggaggtcta tataagcaga 120

gctcgtttag tgaaccgtca gatcactaga agctttattg cggtagttta tcacagttaa 180

attgctaacg cagtcagtgc ttctgacaca acagtctcga acttaagctg cagtgactct 240

cttaaggtag ccttgcagaa gttggtcgtg aggcactggg caggtaagta tcaaggttac 300

aagacaggtt taaggagacc aatagaaact gggcttgtcg agacagagaa gactcttgcg 360

tttctgatag gcacctattg gtcttactga catccacttt gcctttctct ccacaggtgt 420

ccactcccag ttcaattaca gctcttaagg ctagagtggg atccaccggt cgccaccatg 480

gagagcgacg agagcggcct gcccgccatg gagatcgagt gccgcatcac cggcaccctg 540

aacggcgtgg agttcgagct ggtgggcggc ggagagggca cccccgagca gggccgcatg 600

accaacaaga tgaagagcac caaaggcgcc ctgaccttca gcccctacct gctgagccac 660

gtgatgggct acggcttcta ccacttcggc acctacccca gcggctacga gaaccccttc 720

ctgcacgcca tcaacaacgg cggctacacc aacacccgca tcgagaagta cgaggacggc 780

ggcgtgctgc acgtgagctt cagctaccgc tacgaggccg gccgcgtgat cggcgacttc 840

aaggtgatgg gcaccggctt ccccgaggac agcgtgatct tcaccgacaa gatcatccgc 900

agcaacgcca ccgtggagca cctgcacccc atgggcgata acgatctgga tggcagcttc 960

acccgcacct tcagcctgcg cgacggcggc tactacagct ccgtggtgga cagccacatg 1020

cacttcaaga gcgccatcca ccccagcatc ctgcagaacg ggggccccat gttcgccttc 1080

cgccgcgtgg aggaggatca cagcaacacc gagctgggca tcgtggagta ccagcacgcc 1140

ttcaagaccc cggatgcaga tgccggtgaa gaataaagcg gcctagggat aacagggtaa 1200

tggccgcgac tctagatcat aatcagccat accacatttg tagaggtttt acttgcttta 1260

aaaaacctcc cacacctccc cctgaacctg aaacataaaa tgaatgcaat tgttgttgtt 1320

aacttgttta ttgcagctta taatggttac aaataaagca atagcatcac aaatttcaca 1380

aataaagcat ttttttcact gcattctagt tgtggtttgt ccaaactcat caatgtatct 1440

taaggcgtaa attgtaagcg ttaatatttt gttaaaattc gcgttaaatt tttgttaaat 1500

cagctcattt tttaaccaat aggccgaaat cggcaaaatc ccttataaat caaaagaata 1560

gaccgagata gggttgagtg ttgttccagt ttggaacaag agtccactat taaagaacgt 1620

ggactccaac gtcaaagggc gaaaaaccgt ctatcagggc gatggcccac gatcttagat 1680

atccggacgt ggatctcccg atcccctatg gtgcactctc agtacaatct gctctgatgc 1740

cgcatagtta agccagtatc tgctccctgc ttgtgtgttg gaggtcgctg agtagtgcgc 1800

gagcaaaatt taagctacaa caaggcaagg cttgaccgac aattgcatga agaatctgct 1860

tagggttagg cgttttgcgc tgcttcgcga tgtacgggcc agatatacgc gtatctgagg 1920

ggactagggt gtgtttaggc gaaaagcggg gcttcggttg tacgcggtta ggagtcccct 1980

caggatatag tagtttcgct tttgcatagg gagggggaaa tgtagtctta tgcaatactc 2040

ttgtagtctt gcaacatggt aacgatgagt tagcaacatg ccttacaagg agagaaaaag 2100

caccgtgcat gccgattggt ggaagtaagg tggtacgatc gtgccttatt aggaaggcaa 2160

cagacgggtc tgacatggat tggacgaacc actgaattcc gcattgcaga gatattgtat 2220

ttaagtgcct agctcgatac aataaacgcc atttgaccat tcaccacatt ggtgtgcacc 2280

tccaagcttg gtaccgagct cggatccact agtgcagaag ttggtcgtga ggcactgggc 2340

aggtaagtat caaggttaca agacaggttt aaggagacca atagaaactg ggcttgtcga 2400

gacagagaag actcttgcgt ttctgatagg cacctattgg tcttactgac atccactttg 2460

cctttctctc cacaggtgtc cactcccagt tcaattacag ctcttgctag tgccgccacc 2520

atggagtttg ggctgagctg ggttttcctc gttgctcttt taagaggtgt ccagtgtcag 2580

gtgcagctgg tggagtctgg gggaggcgtg gtccagcctg ggaggtccct gagactctcc 2640

tgtacagcct ctggattcac cttcaaaaac tatgctatgc attgggtccg ccaggctcca 2700

gccaaggggc tggagtgggt ggcaactata tcatatgatg gaaggaatat acaatatgca 2760

gactccgtga agggccgatt caccttctcc agagacaatt ctcaggacac cctgtatctg 2820

caactgaaca gcctcagacc ggaggacacg gctgtgtatt actgtgcgag acccgtaaga 2880

agccgatggc tgcaattagg tcttgaagat gcttttcata tctggggcca ggggacaatg 2940

gtcaccgtct cttcagcctc caccaagggc ccatcggtct tccccctggc accctcctcc 3000

aagagcacct ctgggggcac agcggccctg ggctgcctgg tcaaggacta cttccccgaa 3060

ccggtgacgg tgtcgtggaa ctcaggcgcc ctgaccagcg gcgtgcacac cttcccggct 3120

gtcctacagt cctcaggact ctactccctc agcagcgtgg tgaccgtgcc ctccagcagc 3180

ttgggcaccc agacctacat ctgcaacgtg aatcacaagc ccagcaacac caaggtggac 3240

aagaaagttg agcccaaatc ttgtgacaaa actcacacat gcccaccgtg cccagcacct 3300

gaactcctgg ggggaccgtc agtcttcctc ttccccccaa aacccaagga caccctcatg 3360

atctcccgga cccctgaggt cacatgcgtg gtggtggacg tgagccacga agaccctgag 3420

gtcaagttca actggtacgt ggacggcgtg gaggtgcata atgccaagac aaagccgcgg 3480

gaggagcagt acaacagcac gtaccgtgtg gtcagcgtcc tcaccgtcct gcaccaggac 3540

tggctgaatg gcaaggagta caagtgcaag gtctccaaca aagccctccc agcccccatc 3600

gagaaaacca tctccaaagc caaagggcag ccccgagaac cacaggtgta caccctgccc 3660

ccatcccggg atgagctgac caagaaccag gtcagcctga cctgcctggt caaaggcttc 3720

tatcccagcg acatcgccgt ggagtgggag agcaatgggc agccggagaa caactacaag 3780

accacgcctc ccgtgctgga ctccgacggc tccttcttcc tctacagcaa gctcaccgtg 3840

gacaagagca ggtggcagca ggggaacgtc ttctcatgct ccgtgatgca tgaggctctg 3900

cacaaccact acacgcagaa gagcctctcc ctgtctccgg gtaaatgata gtctagagct 3960

cgctgatcag cctcgactgt gccttctagt tgccagccat ctgttgtttg cccctccccc 4020

gtgccttcct tgaccctgga aggtgccact cccactgtcc tttcctaata aaatgaggaa 4080

attgcatcgc attgtctgag taggtgtcat tctattctgg ggggtggggt ggggcaggac 4140

agcaaggggg aggattggga agacaatagc aggcatgctg gggatgcggt gggctctatg 4200

gcttctgagg cggaaagaac cagctggggc tcgagatctc ccgatcccct atggtgcact 4260

ctcagtacaa tctgctctga tgccgcatag ttaagccagt atctgctccc tgcttgtgtg 4320

ttggaggtcg ctgagtagtg cgcgagcaaa atttaagcta caacaaggca aggcttgacc 4380

gacaattgca tgaagaatct gcttagggtt aggcgttttg cgctgcttcg cgatgtacgg 4440

gccagatata cgcgtatctg aggggactag ggtgtgttta ggcgaaaagc ggggcttcgg 4500

ttgtacgcgg ttaggagtcc cctcaggata tagtagtttc gcttttgcat agggaggggg 4560

aaatgtagtc ttatgcaata ctcttgtagt cttgcaacat ggtaacgatg agttagcaac 4620

atgccttaca aggagagaaa aagcaccgtg catgccgatt ggtggaagta aggtggtacg 4680

atcgtgcctt attaggaagg caacagacgg gtctgacatg gattggacga accactgaat 4740

tccgcattgc agagatattg tatttaagtg cctagctcga tacaataaac gccatttgac 4800

cattcaccac attggtgtgc acctccaagc ttggtaccga gctcggatcc actagtgcag 4860

aagttggtcg tgaggcactg ggcaggtaag tatcaaggtt acaagacagg tttaaggaga 4920

ccaatagaaa ctgggcttgt cgagacagag aagactcttg cgtttctgat aggcacctat 4980

tggtcttact gacatccact ttgcctttct ctccacaggt gtccactccc agttcaatta 5040

cagctcttgc tagtgccgcc accatgaggg tccccgctca gctcctgggg ctcctgctgc 5100

tctggctccc aggtgccaga tgtgccatcc ggatgaccca gtctccatcc tcattctctg 5160

catctacagg agacagagtc accatcactt gtcgggcgag ccaggatatt cggaactatg 5220

tagcctggta tcagcaaaaa tcagggaaag cccctaaatt cctgatctat gctgcttcca 5280

ctttgcaaag tggggtccca tcaaggttca gcggcagtgg atctgggaca gatttcactc 5340

tcaccatcaa ctccctgcag tctgaagatt ttgcaactta ttactgtcaa caatattaca 5400

attctcctcc gaccttcggc caagggacca gggtggaaat cacgcgaact gtggctgcac 5460

catctgtctt catcttcccg ccatctgatg agcagttgaa atctggaact gcctctgttg 5520

tgtgcctgct gaataacttc tatcccagag aggccaaagt acagtggaag gtggataacg 5580

ccctccaatc gggtaactcc caggagagtg tcacagagca ggacagcaag gacagcacct 5640

acagcctcag cagcaccctg acgctgagca aagcagacta cgagaaacac aaagtctacg 5700

cctgcgaagt cacccatcag ggcctgagct cgcccgtcac aaagagcttc aacaggggag 5760

agtgttgata gtctagagct cgctgatcag cctcgactgt gccttctagt tgccagccat 5820

ctgttgtttg cccctccccc gtgccttcct tgaccctgga aggtgccact cccactgtcc 5880

tttcctaata aaatgaggaa attgcatcgc attgtctgag taggtgtcat tctattctgg 5940

ggggtggggt ggggcaggac agcaaggggg aggattggga agacaatagc aggcatgctg 6000

gggatgcggt gggctctatg gcttctgagg cggaaagaac cagtcgaggg gggatcccca 6060

cgcgccctgt agcggcgcat taagcgcggc gggtgtggtg gttacgcgca gcgtgaccgc 6120

tacacttgcc agcgccctag cgcccgctcc tttcgctttc ttcccttcct ttctcgccac 6180

gttcgccggc tttccccgtc aagctctaaa tcggggcatc cctttagggt tccgatttag 6240

tgctttacgg cacctcgacc ccaaaaaact tgattagggt gatggttcac gtatagggat 6300

aacagggtaa tgtagtgggc catcgccctg atagacggtt tttcgccctt tgacgttgga 6360

gtccacgttc tttaatagtg gactcttgtt ccaaactgga acaacactca accctatctc 6420

ggtctattct tttgatttat aagggatttt ggggatttcg gcctattggt taaaaaatga 6480

gctgatttaa caaaaattta acgcgaattt taacaaaata ttaacgttta caatttaaat 6540

atttgcttat acaatcttcc tgtttttggg gcttttctga ttatcaaccg gggtgggtac 6600

cgagctcgaa ttctgtggaa tgtgtgtcag ttagggtgtg gaaagtcccc aggctcccca 6660

ggcaggcaga agtatgcaaa gcatgcatct caattagtca gcaaccaggt gtggaaagtc 6720

cccaggctcc ccagcaggca gaagtatgca aagcatgcat ctcaattagt cagcaaccat 6780

agtcccgccc ctaactccgc ccatcccgcc cctaactccg cccagttccg cccattctcc 6840

gccccatggc tgactaattt tttttattta tgcagaggcc gaggccgcct cggcctctga 6900

gctattccag aagtagtgag gaggcttttt tggaggccta ggcttttgca aaaagctccc 6960

gggagcttgg atatccattt tcggatctga tcaagagaca ggatgaggat cgtttcgcat 7020

gattgaacaa gatggattgc acgcaggttc tccggccgct tgggtggaga ggctattcgg 7080

ctatgactgg gcacaacaga caatcggctg ctctgatgcc gccgtgttcc ggctgtcagc 7140

gcaggggcgc ccggttcttt ttgtcaagac cgacctgtcc ggtgccctga atgaactgca 7200

ggacgaggca gcgcggctat cgtggctggc cacgacgggc gttccttgcg cagctgtgct 7260

cgacgttgtc actgaagcgg gaagggactg gctgctattg ggcgaagtgc cggggcagga 7320

tctcctgtca tctcaccttg ctcctgccga gaaagtatcc atcatggctg atgcaatgcg 7380

gcggctgcat acgcttgatc cggctacctg cccattcgac caccaagcga aacatcgcat 7440

cgagcgagca cgtactcgga tggaagccgg tcttgtcgat caggatgatc tggacgaaga 7500

gcatcagggg ctcgcgccag ccgaactgtt cgccaggctc aaggcgcgca tgcccgacgg 7560

cgaggatctc gtcgtgaccc atggcgatgc ctgcttgccg aatatcatgg tggaaaatgg 7620

ccgcttttct ggattcatcg actgtggccg gctgggtgtg gcggaccgct atcaggacat 7680

agcgttggct acccgtgata ttgctgaaga gcttggcggc gaatgggctg accgcttcct 7740

cgtgctttac ggtatcgccg ctcccgattc gcagcgcatc gccttctatc gccttcttga 7800

cgagttcttc tgagcgggac tctggggttc gaaatgaccg accaagcgac gcccaacctg 7860

ccatcacgag atttcgattc caccgccgcc ttctatgaaa ggttgggctt cggaatcgtt 7920

ttccgggacg ccggctggat gatcctccag cgcggggatc tcatgctgga gttcttcgcc 7980

caccccaact tgtttattgc agcttataat ggttacaaat aaagcaatag catcacaaat 8040

ttcacaaata aagcattttt ttcactgcat tctagttgtg gtttgtccaa actcatcaat 8100

gtatcttatc atgtctggat cccgtcgagt ttaaacgatt taaatactgg ggctcgactg 8160

tggaatgtgt gtcagttagg gtgtggaaag tccccaggct ccccagcagg cagaagtatg 8220

caaagcatgc atctcaatta gtcagcaacc aggtgtggaa agtccccagg ctccccagca 8280

ggcagaagta tgcaaagcat gcatctcaat tagtcagcaa ccatagtccc gcccctaact 8340

ccgcccatcc cgcccctaac tccgcccagt tccgcccatt ctccgcccca tggctgacta 8400

atttttttta tttatgcaga ggccgaggcc gcctcggcct ctgagctatt ccagaagtag 8460

tgaggaggct tttttggagg cctaggcttt tgcaaaaagc ttgggggggg ggacagctca 8520

gggctgcgat ttcgcgccaa acttgacggc aatcctagcg tgaaggctgg taggatttta 8580

tccccgctgc catcatggtt cgaccattga actgcatcgt cgccgtgtcc caaaatatgg 8640

ggattggcaa gaacggagac ctaccctggc ctccgctcag gaacgagttc aagtatttcc 8700

aaagaatgac cacaacctct tcagtggaag gtaaacagaa tctggtgatt atgggtagga 8760

aaacctggtt ctccattcct gagaagaatc gacctttaaa ggacagaatt aatatagttc 8820

tcagtagaga actcaaagaa ccaccacgag gagctcattt tcttgccaaa agtttggatg 8880

atgccttaag acttattgaa caaccggaat tggcaagtaa agtagacatg gtttggatag 8940

tcggaggcag ttctgtttac caggaagcca tgaatcaacc aggccacctc agactctttg 9000

tgacaaggat catgcaggaa tttgaaagtg acacgttttt cccagaaatt gatttgggga 9060

aatataaact tctcccagaa tacccaggcg tcctctctga ggtccaggag gaaaaaggca 9120

tcaagtataa gtttgaagtc tacgagaaga aagactaaca ggaagatgct ttcaagttct 9180

ctgctcccct cctaaagcta tgcattttta taagaccatg ggacttttgc tggctttaga 9240

tcgatctttg tgaaggaacc ttacttctgt ggtgtgacat aattggacaa actacctaca 9300

gagatttaaa gctctaaggt aaatataaaa tttttaagtg tataatgtgt taaactactg 9360

attctaattg tttgtgtatt ttagattcca acctatggaa ctgatgaatg ggagcagtgg 9420

tggaatgcct ttaatgagga aaacctgttt tgctcagaag aaatgccatc tagtgatgat 9480

gaggctactg ctgactctca acattctact cctccaaaaa agaagagaaa ggtagaagac 9540

cccaaggact ttccttcaga attgctaagt tttttgagtc atgctgtgtt tagtaataga 9600

actcttgctt gctttgctat ttacaccaca aaggaaaaag ctgcactgct atacaagaaa 9660

attatggaaa aatattctgt aacctttata agtaggcata acagttataa tcataacata 9720

ctgttttttc ttactccaca caggcataga gtgtctgcta ttaataacta tgctcaaaaa 9780

ttgtgtacct ttagcttttt aatttgtaaa ggggttaata aggaatattt gatgtatagt 9840

gccttgacta gagatcataa tcagccatac cacatttgta gaggttttac ttgctttaaa 9900

aaacctccca cacctccccc tgaacctgaa acataaaatg aatgcaattg ttgttgttaa 9960

cttgtttatt gcagcttata atggttacaa ataaagcaat agcatcacaa atttcacaaa 10020

taaagcattt ttttcactgc attctagttg tggtttgtcg acgcggccgc tgtggaatgt 10080

gtgtcagtta gggtgtggaa agtccccagg ctccccagca ggcagaagta tgcaaagcat 10140

gcatctcaat tagtcagcaa ccaggtgtgg aaagtcccca ggctccccag caggcagaag 10200

tatgcaaagc atgcatctca attagtcagc aaccatagtc ccgcccctaa ctccgcccat 10260

cccgccccta actccgccca gttccgccca ttctccgccc catggctgac taattttttt 10320

tatttatgca gaggccgagg ccgcctcggc ctctgagcta ttccagaagt agtgaggagg 10380

cttttttgga ggcctaggct tttgcaaaaa gctctgagat caccggcgaa ggagggccac 10440

catggcctcg taccccggcc atcaacacgc gtctgcgttc gaccaggctg cgcgttctcg 10500

cggccatagc aaccgacgta cggcgttgcg ccctcgccgg cagcaagaag ccacggaagt 10560

ccgcccggag cagaaaatgc ccacgctact gcgggtttat atagacggtc cccacgggat 10620

ggggaaaacc accaccacgc aactgctggt ggccctgggt tcgcgcgacg atatcgtcta 10680

cgtacccgag ccgatgactt actggcgggt gctgggggct tccgagacaa tcgcgaacat 10740

ctacaccaca caacaccgcc tcgaccaggg tgagatatcg gccggggacg cggcggtggt 10800

aatgacaagc gcccagataa caatgggcat gccttatgcc gtgaccgacg ccgttctggc 10860

tcctcatatc gggggggagg ctgggagctc acatgccccg cccccggccc tcaccctcat 10920

cttcgaccgc catcccatcg ccgccctcct gtgctacccg gccgcgcggt accttatggg 10980

cagcatgacc ccccaggccg tgctggcgtt cgtggccctc atcccgccga ccttgcccgg 11040

caccaacatc gtgcttgggg cccttccgga ggacagacac atcgaccgcc tggccaaacg 11100

ccagcgcccc ggcgagcggc tggacctggc tatgctggct gcgattcgcc gcgtttacgg 11160

gctacttgcc aatacggtgc ggtatctgca gtgcggcggg tcgtggcggg aggactgggg 11220

acagctttcg gggacggccg tgccgcccca gggtgccgag ccccagagca acgcgggccc 11280

acgaccccat atcggggaca cgttatttac cctgtttcgg gcccccgagt tgctggcccc 11340

caacggcgac ctgtataacg tgtttgcctg ggccttggac gtcttggcca aacgcctccg 11400

ttccatgcac gtctttatcc tggattacga ccaatcgccc gccggctgcc gggacgccct 11460

gctgcaactt acctccggga tggtccagac ccacgtcacc acccccggct ccataccgac 11520

gatatgcgac ctggcgcgca cgtttgcccg ggagatgggg gaggctaact gagaatttcg 11580

actgaagtac ctattccgaa gttcctattc tctagaaagt ataggaactt ctcatgttct 11640

ttcctgcgtt atcccctgat tctgtggata accgtattac cgcctttgag tgagctgata 11700

ccgctcgccg cagccgaacg accgagcgca gcgagtcagt gagcgaggaa gcggaagagc 11760

gcctgatgcg gtattttctc cttacgcatc tgtgcggtat ttcacaccgc atatggtgca 11820

ctctcagtac aatctgctct gatgccgcat agttaagcca gctagaggat cataatcagc 11880

cataccacat ttgtagaggt tttacttgct ttaaaaaacc tcccacacct ccccctgaac 11940

ctgaaacata aaatgaatgc aattgttgtt gttaacttgt ttattgcagc ttataatggt 12000

tacaaataaa gcaatagcat cacaaatttc acaaataaag catttttttc actgcattct 12060

agttgtggtt tgtccaaact catcaatgta tcttatcatg tctggatccc caggaagctc 12120

ctctgtgtcc tcataaaccc taacctcctc tacttgagag gacattccaa tcataggctg 12180

cccatccacc ctctgtgtcc tcctgttaat taggtcactt aacaaaaagg aaattgggta 12240

ggggtttttc acagaccgct ttctaagggt aattttaaaa tatctgggaa gtcccttcca 12300

ctgctgtgtt ccagaagtgt tggtaaacag cccacaaatg tcaacagcag aaacatacaa 12360

gctgtcagct ttgcacaagg gcccaacacc ctgctcatca agaagcactg tggttgctgt 12420

gttagtaatg tgcaaaacag gaggcacatt ttccccacct gtgtaggttc caaaatatct 12480

agtgttttca tttttacttg gatcaggaac ccagcactcc actggataag cattatcctt 12540

atccaaaaca gccttgtggt cagtgttcat ctgctgactg tcaactgtag cattttttgg 12600

ggttacagtt tgagcaggat atttggtcct gtagtttgct aacacaccct gcagctccaa 12660

aggttcccca ccaacagcaa aaaaatgaaa atttgaccct tgaatgggtt ttccagcacc 12720

attttcatga gttttttgtg tccctgaatg caagtttaac atagcagtta ccccaataac 12780

ctcagtttta acagtaacag cttcccacat caaaatattt ccacaggtta agtcctcatt 12840

taaattaggc aaaggaattc ttgaagacga aagggcctcg tgatacgcct atttttatag 12900

gttaatgtca tgataataat ggtttcttag acgtcaggtg gcacttttcg gggaaatgtg 12960

cgcggaaccc ctatttgttt atttttctaa atacattcaa atatgtatcc gctcatgaga 13020

caataaccct gataaatgct tcaataatat tgaaaaagga agagtatgag tattcaacat 13080

ttccgtgtcg cccttattcc cttttttgcg gcattttgcc ttcctgtttt tgctcaccca 13140

gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt gggttacatc 13200

gaactggatc tcaacagcgg taagatcctt gagagttttc gccccgaaga acgttttcca 13260

atgatgagca cttttaaagt tctgctatgt ggcgcggtat tatcccgtgt tgacgccggg 13320

caagagcaac tcggtcgccg catacactat tctcagaatg acttggttga gtactcacca 13380

gtcacagaaa agcatcttac ggatggcatg acagtaagag aattatgcag tgctgccata 13440

accatgagtg ataacactgc ggccaactta cttctgacaa cgatcggagg accgaaggag 13500

ctaaccgctt ttttgcacaa catgggggat catgtaactc gccttgatcg ttgggaaccg 13560

gagctgaatg aagccatacc aaacgacgag cgtgacacca cgatgcctgt agcaatggca 13620

acaacgttgc gcaaactatt aactggcgaa ctacttactc tagcttcccg gcaacaatta 13680

atagactgga tggaggcgga taaagttgca ggaccacttc tgcgctcggc ccttccggct 13740

ggctggttta ttgctgataa atctggagcc ggtgagcgtg ggtctcgcgg tatcattgca 13800

gcactggggc cagatggtaa gccctcccgt atcgtagtta tctacacgac ggggagtcag 13860

gcaactatgg atgaacgaaa tagacagatc gctgagatag gtgcctcact gattaagcat 13920

tggtaactgt cagaccaagt ttactcatat atactttaga ttgatttaaa acttcatttt 13980

taatttaaaa ggatctaggt gaagatcctt tttgataatc tcatgaccaa aatcccttaa 14040

cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga 14100

gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg 14160

gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc 14220

agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag 14280

aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc 14340

agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg 14400

cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac 14460

accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga 14520

aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt 14580

ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag 14640

cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg 14700

gcctttttac ggttcctggc cttttgctgg ccttttgctc acatggctcg acagatccat 14760

gttctttcct gcgttatccc ctgattctgt ggataaccgt attaccgcct ttgagtgagc 14820

tgataccgct cgccgcagcc gaacgaccga gcgcagcgag tcagtgagcg aggaagcgga 14880

agagcgcctg atgcggtatt ttctccttac gcatctgtgc ggtatttcac accgcatatg 14940

gtgcactctc agtacaatct gctctgatgc cgcatagtta agccaga 14987

<210>3

<211>5023

<212>DNA

<213>人工序列

<220>

<223>载体

<400>3

gatctccagg gaccgtccct aaattctcac agacccaaat ccctgtagcc gccccacgac 60

agcgcgagga gcatgcgccc agggctgagc gcgggtagat cagagcacac aagctcacag 120

tccccggcgg tggggggagg ggcgcgctga gcgggggcca gggagctggc gcggggcaaa 180

ctgggaaagt ggtgtcgtgt gctggctccg ccctcttccc gagggtgggg gagaacggta 240

tataagtgcg gtagtcgcct tggacgttct ttttcgcaac gggtttgccg tcagaacgca 300

ggtgagtggc gggtgtggct tccgcgggcc ccggagctgg agccctgctc tgagcgggcc 360

gggctgatat gcgagtgtcg tccgcagggt ttagctgtga gcattcccac ttcgagtggc 420

gggcggtgcg ggggtgagag tgcgaggcct agcggcaacc ccgtagcctc gcctcgtgtc 480

cggcttgagg cctagcgtgg tgtccgccgc cgcgtgccac tccggccgca ctatgcgttt 540

tttgtccttg ctgccctcga ttgccttcca gcagcatggg ctaacaaagg gagggtgtgg 600

ggctcactct taaggagccc atgaagctta cgttggatag gaatggaagg gcaggagggg 660

cgactggggc ccgcccgcct tcggagcaca tgtccgacgc cacctggatg gggcgaggcc 720

tgtggctttc cgaagcaatc gggcgtgagt ttagcctacc tgggccatgt ggccctagca 780

ctgggcacgg tctggcctgg cggtgccgcg ttcccttgcc tcccaacaag ggtgaggccg 840

tcccgcccgg caccagttgc ttgcgcggaa agatggccgc tcccggggcc ctgttgcaag 900

gagctcaaaa tggaggacgc ggcagcccgg tggagcgggc gggtgagtca cccacacaaa 960

ggaagagggc cttgcccctc gccggccgct gcttcctgtg accccgtggt ctatcggccg 1020

catagtcacc tcgggcttct cttgagcacc gctcgtcgcg gcggggggag gggatctaat 1080

ggcgttggag tttgttcaca tttggtgggt ggagactagt caggccagcc tggcgctgga 1140

agtcattctt ggaatttgcc cctttgagtt tggagcgagg ctaattctca agcctcttag 1200

cggttcaaag gtattttcta aacccgtttc caggtgttgt gagctagccg ccaccatgcc 1260

acaatttgat atattatgta aaacaccacc taaggtcctg gttcgtcagt ttgtggaaag 1320

gtttgaaaga ccttcagggg aaaaaatagc atcatgtgct gctgaactaa cctatttatg 1380

ttggatgatt actcataacg gaacagcaat caagagagcc acattcatga gctataatac 1440

tatcataagc aattcgctga gtttcgatat tgtcaacaaa tcactccagt ttaaatacaa 1500

gacgcaaaaa gcaacaattc tggaagcctc attaaagaaa ttaattcctg cttgggaatt 1560

tacaattatt ccttacaatg gacaaaaaca tcaatctgat atcactgata ttgtaagtag 1620

tttgcaatta cagttcgaat catcggaaga agcagataag ggaaatagcc acagtaaaaa 1680

aatgcttaaa gcacttctaa gtgagggtga aagcatctgg gagatcactg agaaaatact 1740

aaattcgttt gagtatacct cgagatttac aaaaacaaaa actttatacc aattcctcct 1800

cctagctact ttcatcaatt gtggaagatt cagcgatatt aagaacgttg atccgaaatc 1860

atttaaatta gtccaaaata agtatctggg agtaataatc cagtgtttag tgacagagac 1920

aaagacaagc gttagtaggc acatatactt ctttagcgca aggggtagga tcgatccact 1980

tgtatatttg gatgaatttt tgaggaattc tgaaccagtc ctaaaacgag taaataggac 2040

cggcaattct tcaagcaaca aacaggaata ccaattatta aaagataact tagtcagatc 2100

gtacaacaag gctttgaaga aaaatgcgcc ttatccaatc tttgctataa agaatggccc 2160

aaaatctcac attggaagac atttgatgac ctcatttctg tcaatgaagg gcctaacgga 2220

gttgactaat gttgtgggaa attggagcga taagcgtgct tctgccgtgg ccaggacaac 2280

gtatactcat cagataacag caatacctga tcactacttc gcactagttt ctcggtacta 2340

tgcatatgat ccaatatcaa aggaaatgat agcattgaag gatgagacta atccaattga 2400

ggagtggcag catatagaac agctaaaggg tagtgctgaa ggaagcatac gataccccgc 2460

atggaatggg ataatatcac aggaggtact agactacctt tcatcctaca taaatagacg 2520

catataataa tctagagctc gctgatcagc ctcgactgtg ccttctagtt gccagccatc 2580

tgttgtttgc ccctcccccg tgccttcctt gaccctggaa ggtgccactc ccactgtcct 2640

ttcctaataa aatgaggaaa ttgcatcgca ttgtctgagt aggtgtcatt ctattctggg 2700

gggtggggtg gggcaggaca gcaaggggga ggattgggaa gacaatagca ggcatgctgg 2760

ggatgcggtg ggctctatgg cttctgaggc ggaaagaacc agctggggct cgagggggga 2820

tcccgtcgac ctcgagagct tggcgtaatc atggtcatag ctgtttcctg tgtgaaattg 2880

ttatccgctc acaattccac acaacatacg agccggaagc ataaagtgta aagcctgggg 2940

tgcctaatga gtgagctaac tcacattaat tgcgttgcgc tcactgcccg ctttccagtc 3000

gggaaacctg tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga gaggcggttt 3060

gcgtattggg cgctcttccg cttcctcgct cactgactcg ctgcgctcgg tcgttcggct 3120

gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg ttatccacag aatcagggga 3180

taacgcagga aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc 3240

cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca aaaatcgacg 3300

ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt ttccccctgg 3360

aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc tgtccgcctt 3420

tctcccttcg ggaagcgtgg cgctttctca atgctcacgc tgtaggtatc tcagttcggt 3480

gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg 3540

cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact tatcgccact 3600

ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg ctacagagtt 3660

cttgaagtgg tggcctaact acggctacac tagaaggaca gtatttggta tctgcgctct 3720

gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca aacaaaccac 3780

cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc 3840

tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg aaaactcacg 3900

ttaagggatt ttggtcatga gattatcaaa aaggatcttc acctagatcc ttttaaatta 3960

aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa acttggtctg acagttacca 4020

atgcttaatc agtgaggcac ctatctcagc gatctgtcta tttcgttcat ccatagttgc 4080

ctgactcccc gtcgtgtaga taactacgat acgggagggc ttaccatctg gccccagtgc 4140

tgcaatgata ccgcgagacc cacgctcacc ggctccagat ttatcagcaa taaaccagcc 4200

agccggaagg gccgagcgca gaagtggtcc tgcaacttta tccgcctcca tccagtctat 4260

taattgttgc cgggaagcta gagtaagtag ttcgccagtt aatagtttgc gcaacgttgt 4320

tgccattgct acaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt cattcagctc 4380

cggttcccaa cgatcaaggc gagttacatg atcccccatg ttgtgcaaaa aagcggttag 4440

ctccttcggt cctccgatcg ttgtcagaag taagttggcc gcagtgttat cactcatggt 4500

tatggcagca ctgcataatt ctcttactgt catgccatcc gtaagatgct tttctgtgac 4560

tggtgagtac tcaaccaagt cattctgaga atagtgtatg cggcgaccga gttgctcttg 4620

cccggcgtca atacgggata ataccgcgcc acatagcaga actttaaaag tgctcatcat 4680

tggaaaacgt tcttcggggc gaaaactctc aaggatctta ccgctgttga gatccagttc 4740

gatgtaaccc actcgtgcac ccaactgatc ttcagcatct tttactttca ccagcgtttc 4800

tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg cgacacggaa 4860

atgttgaata ctcatactct tcctttttca atattattga agcatttatc agggttattg 4920

tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag gggttccgcg 4980

cacatttccc cgaaaagtgc cacctgacgt cgacggatcg gga 5023

<210>4

<211>1024

<212>DNA

<213>人工序列

<220>

<223>核酸片段(Nucleic acid fragment)

<220>

<221>misc_feature

<222>(140)..(140)

<223>n是a，c，g或t

<220>

<221>misc_feature

<222>(160)..(160)

<223>n是a，c，g或t

<400>4

tggaaacaga aactaaatag agacatagag aaaatgaaca gaagttatga accaaatgga 60

tttaaccggt atttatacaa catttcatct taaaacaaaa gaatatacct tcttctcagc 120

acctcatagc ctcttctacn aaaccatata gtcggtcacn aaacaagcct caacagatac 180

aagaagataa aaataatccc atgcatacta tcagatcacc atggactaac tctggtcttc 240

aataacaaca aaaacaatgg aagtcgaaga acactctatt caatgataac ttggtcaagg 300

aagagatgaa aaaggaaatt aaagcctttt tagaatttca tgaaaatgaa ggcacaacat 360

acccaaactt atgagacaca aggaaagcag tgctaagagg aaaactcata gctctgagtg 420

cctccaaaaa gaaacaagag agagtgtata ctagcagctt gagagcacac ctgaaagctc 480

tagaacaaaa agaagcaaat acacccaaga ggagaagatc aaatgcaggg ctgaaatcaa 540

ccaagtagaa acaaaagaac tgtaaaaaga accaacaaaa ccaggagttg gttggttgag 600

aaaatcaaaa agataaataa acccttaatc agaataacca gagggcacag aaacagtatc 660

caaattaaca aaataagaaa tggaaaggga gacgtaaaac agaatccgag gaaataaaaa 720

aaaattgatc ctattacaaa agtctatatt caacaaagct ggaaaatctg gatgaaatag 780

acaattttct agatagatac cagataccaa agttaaatca ggaccagata aatcatctaa 840

acagtcccat aactcctaaa gaaatagaag cagttattaa aattctcccg accaaaaaaa 900

aaaaaaaaaa aaagcccagg attggatggg tttagtggag aattctatca gaccttcatc 960

aaagacctaa taccaatact gtccaaacta ttccttgcaa cactgaatat tccgcataca 1020

ctat 1024

<210>5

<211>50

<212>DNA

<213>人工序列

<220>

<223>引物

<400>5

acagctgtcg actgaagtac ctattccgaa gttcctattc tctagaaagt 50

<210>6

<211>50

<212>DNA

<213>人工序列

<220>

<223>引物

<400>6

cgtccggata tctaagatct gaagttccta tactttctag agaataggaa 50

<210>7

<211>81

<212>DNA

<213>人工序列

<220>

<223>PCR产品

<400>7

agacgtctcg actgaagtac ctattccgaa gttcctattc tctagaaagt ataggaactt 60

cagatcttag atatccggac g 81

<210>8

<211>40

<212>DNA

<213>人工序列

<220>

<223>引物

<400>8

atctggctag ccgccaccat gccacaattt gatatattat 40

<210>9

<211>34

<212>DNA

<213>人工序列

<220>

<223>引物

<400>9

tgtcatctag attattatat gcgtctattt atgt 34

<210>10

<211>22

<212>DNA

<213>人工序列

<220>

<223>引物

<400>10

cctatggaaa aacgccagca ac 22

<210>11

<211>22

<212>DNA

<213>人工序列

<220>

<223>引物

<400>11

ccttagaaag cggtctgtga aa 22

<210>12

<211>19

<212>DNA

<213>人工序列

<220>

<223>引物

<400>12

gatgcctgct tgccgaata 19

<210>13

<211>22

<212>DNA

<213>人工序列

<220>

<223>引物

<400>13

ccttagaaag cggtctgtga aa 22

<210>14

<211>23

<212>DNA

<213>人工序列

<220>

<223>引物

<400>14

tggtatggct gattatgatc ctc 23

<210>15

<211>22

<212>DNA

<213>人工序列

<220>

<223>引物

<400>15

ccttttgctc acatggctcg ac 22

<210>16

<211>20

<212>DNA

<213>人工序列

<220>

<223>引物

<400>16

ttgtctcatg agcggataca 20

PCT/RO/134表

申请人或代理人档案号12054/4

国际申请号PCT/FR2007/002144

关于微生物保藏的说明

(细则13之二)

PCT/RO/134表(1998年7月，2004年1月再版)

申请人或代理人档案号12054/4

国际申请号PCT/FR2007/002144

关于微生物保藏的说明

(细则13之二)

PCT/RO/134表(1998年7月，2004年1月再版)

Claims

1.产生至少包含一个细胞的细胞株的方法，包括以下步骤：

-在所述细胞的基因组的高转录活性区域整合进唯一的重组酶识别位点；以及

-在所述细胞的基因组唯一的重组酶识别位点的下游整合编码转录终止信号的核酸序列。

2.根据权利要求1的方法，其中编码转录终止信号的核酸序列是编码多腺苷酸信号的序列。

3.根据权利要求1的方法，其中编码选择标记的核酸序列还包括弱活性多腺苷酸序列。

4.根据权利要求1到3的方法，其中编码转录终止信号的核酸序列是编码全部或部分SV40前多腺苷酸信号或者腺病毒L1多腺苷酸信号的序列。

5.根据权利要求1到3中任意一项的方法，其中编码转录终止信号的核酸序列是多腺苷酸信号的变异或删除的序列，这些变异和删除选自由增加分开AATAAA元素和富含GT区域的距离，从出现于AATAAA六核酸上游一个或几个核苷酸起删除SV40后多A，删除位于在AATAAA序列上游第13到48核苷酸中的的某些元素，删除AATAAA序列下游的富含GT的序列并伴随对位于AATAAA序列和富含GT区域之间的空间的修饰，或者改变或删除位于AATAAA序列上游的USE(上游序列元素)区域组成的组，所述变异以及/或者删除使其可以与未变异的序列相比降低多腺苷酸信号的效率。

6.根据权利要求1的方法，其中细胞是哺乳动物细胞。

7.根据权利要求1的方法，其中整合唯一的重组酶识别位点通过一系列步骤实现，步骤至少包括：

-整合两条都编码重组酶识别位点的核酸序列；

-整合位于两条都编码重组酶识别位点的序列之间的编码选择标记的核酸序列，优选地是赋予对抗生素抗性的基因。

8.根据权利要求1的方法，其中所选择的细胞仅是已经整合了权利要求7中详述的序列集的单个拷贝的高产量细胞。

9.根据权利要求8的方法，其中只选择那些pcd(皮克蛋白质/细胞/天)为5或以上，或者优选地为10或以上的细胞。

10.根据权利要求7的方法，其中一系列的步骤还包括通过重组酶对细胞的作用切除在权利要求5中详述的序列集。

11.根据权利要求7的方法，其中重组酶的作用是通过利用携带编码所述重组酶的核酸序列的载体将所述重组酶在细胞中共表达而产生的。

12.根据权利要求7的方法，其中一系列的步骤还包括对细胞的选择，从中权利要求7所详述的核酸序列集已经被切除并且具有完整的重组酶识别位点。

13.根据权利要求7的方法，其中一系列的步骤还包括结合编码1型单纯疱疹病毒的胸苷激酶(HSV1-TK)的核酸序列。

14.根据权利要求13的方法，其中在切除之前对细胞的选择通过在培养基中加入更昔洛韦来进行。

15.根据权利要求7到14中任意一项的方法，其中对细胞的选择是通过在培养基中加入剂量大于或等于1g/l，优选地大于或等于2g/l，4g/l或甚至8g/l的抗生素而实现的。

16.根据权利要求1的方法，其中重组酶识别序列是loxP和/或FRT序列。

17.根据权利要求7的方法，其中感兴趣的蛋白是抗体或抗体片段。

18.根据权利要求1的方法，其中细胞是哺乳动物细胞，选自由鼠骨髓瘤细胞株，特别的是YB2/0(ATCC CRL-1662)和IR983F，人骨髓瘤如Namalwa或其它人体细胞如PERC6，CHO细胞株(特别地CHO-K，CHOLec10，CHO-Lec1，CHO Pro-5，CHO dhfr-，CHO Lec13)或其他选自Wil-2，Jurkat，Vero，Molt-4，COS-7，293-HEK，BHK，K6H6，NSO，SP2/0-Ag 14以及P3X63Ag8.653的株组成的组。

19.根据权利要求7的方法，其中一系列的步骤还包括转染所选择的细胞株，转染是用携带编码所感兴趣蛋白或多肽的核酸序列以及直接在编码选择标记的核酸序列下游的编码重组酶识别位点的核酸序列，优选地赋予对抗生素的抗性且没有任何多腺苷酸序列的表达载体来实现的。

20.根据权利要求19的方法，其中所述表达载体通过所述重组酶的作用插入于唯一的重组酶识别位点。

21.根据权利要求19的方法，其中携带整合于目标位点的表达载体的细胞是通过对感兴趣蛋白的表达的分析以及通过在培养基中加入大剂量抗生素的方法进行选择的。

22.根据权利要求7的方法，其中所述感兴趣的蛋白和多肽是治疗性的蛋白或多肽，特别是选自对消化的，胰腺的，胆汁的，抗病毒的，抗炎的，肺的，抗菌的，血液的，神经的，心血管的，眼科的，抗原的，脑的，抗肿瘤的，免疫刺激的，免疫调节功能有活性的组。

23.根据权利要求1到22中任意一种方法产生的细胞株。

24.一种细胞株，携带稳定地整合进其基因组的在所述细胞基因组的高转录活性区域的唯一的重组酶识别位点，直接在所述唯一的重组酶识别位点下游的编码转录终止信号的核酸序列。

25.根据权利要求24的细胞株，其中编码转录终止信号的核酸序列是编码多腺苷酸信号，特别是弱活性多腺苷酸信号的序列。

26.根据权利要求24的细胞株，其中编码转录终止信号的核酸序列是编码至少部分SV40前多腺苷酸信号的序列。

27.根据权利要求24的细胞株，其中该细胞是哺乳动物细胞。

28.根据权利要求24的细胞株，其中该细胞还携带：

-两条都编码重组酶识别位点的核酸序列；

-至少一条位于两条都编码重组酶识别位点的序列之间的编码感兴趣蛋白的核酸序列；以及

-至少一条编码选择标记的核酸序列，优选地是赋予抗菌素抗性的基因，位于两条都编码重组酶识别位点的序列之间，所述编码选择标记的所述序列直接位于编码所述转录终止信号的核酸序列的上游。

29.一种细胞株，其中权利要求28所述的序列被一起整合于一个单独的拷贝中。

30.根据权利要求29的细胞株，其中该细胞的pcd(皮克蛋白/细胞/天)值为10或超过10。

31.一种细胞株，其中细胞仅携带一个完整的识别重组酶位点。

32.根据权利要求24的细胞株，其中重组酶识别序列是loxP和/或FRT序列。

33.根据权利要求28的细胞株，其中感兴趣的蛋白是抗体或抗体片段。

34.根据权利要求24修饰的细胞株，其中在修饰前的源细胞是哺乳动物细胞，选自包含鼠骨髓瘤细胞株，特别的是YB2/0(ATCC CRL-1662)和IR983F，像Namalwa或像PERC6，CHO细胞株(特别地CHO-K，CHOLec，CHO-Lec1，CHO Pro-5，CHO dhfr-，CHO Lec13)这样的任何其他的人体细胞或其他选自Wil-2，Jurkat，Vero，Molt-4，COS-7，293-HEK，BHK，K6H6，NSO，SP2/0-Ag 14，P3X63Ag8.653的组。

35.根据权利要求28的细胞株，其携带在编码感兴趣蛋白的核酸序列下游的编码重组酶识别位点的核酸序列以及编码选择标记的核酸序列，优选地赋予对抗生素的抗性，而没有多腺苷酸序列。

36.根据权利要求24或权利要求28的细胞株，过度表达感兴趣的蛋白或多肽，其选自对消化的，胰腺的，胆汁的，抗病毒的，抗炎的，肺的，抗菌的，血液的，神经的，心血管的，眼科的，抗原的，脑的，抗肿瘤的，免疫刺激的，免疫调节功能有活性的感兴趣的蛋白或多肽的组。

37.一种细胞株，由注册申请号为CNCM I-3704的编号YGM-1/10G10做参考确定。

38.一种细胞株，由注册申请号为CNCM I-3885的编号YGM-2/3G5做参考确定。

39.一种分离的核酸分子，包含由编号SEQ ID NO：1确定的核酸片段。

40.一种载体，携带由编号SEQ ID NO：1的列表中序列确定的核酸序列。

41.一种用于生产至少一种感兴趣的蛋白或多肽的方法，其特征在于根据权利要求24到38中任意一权利要求的细胞株以使所述感兴趣的蛋白能够得以表达的方式培养，接着包括至少一个收获所述感兴趣蛋白的步骤。

42.根据权利要求41的用于生产至少一种感兴趣的蛋白或多肽的方法，其特征在于基于根据权利要求37或38的细胞。

43.根据权利要求41或42的方法，其中感兴趣的蛋白或多肽选自对消化的，胰腺的，胆汁的，抗病毒的，抗炎的，肺的，抗菌的，血液的，神经的，心血管的，眼科的，抗原的，脑的，抗肿瘤的，免疫刺激的，免疫调节功能有活性的感兴趣的蛋白或多肽。

44.根据权利要求43的方法，其中感兴趣的蛋白或多肽是抗体或抗体片段。

45.一种载体，含有序列SEQ ID NO：2。