CN101646774A - 用于生产蛋白,特别是治疗用蛋白的高转录活性细胞株 - Google Patents

用于生产蛋白,特别是治疗用蛋白的高转录活性细胞株 Download PDF

Info

Publication number
CN101646774A
CN101646774A CN200780047300A CN200780047300A CN101646774A CN 101646774 A CN101646774 A CN 101646774A CN 200780047300 A CN200780047300 A CN 200780047300A CN 200780047300 A CN200780047300 A CN 200780047300A CN 101646774 A CN101646774 A CN 101646774A
Authority
CN
China
Prior art keywords
cell
sequence
nucleotide sequence
interest
coding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN200780047300A
Other languages
English (en)
Inventor
克里斯蒂娜·戈谢
克里斯托夫·西拉克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LFB Biotechnologies SAS
Original Assignee
LFB Biotechnologies SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LFB Biotechnologies SAS filed Critical LFB Biotechnologies SAS
Publication of CN101646774A publication Critical patent/CN101646774A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P1/00Drugs for disorders of the alimentary tract or the digestive system
    • A61P1/14Prodigestives, e.g. acids, enzymes, appetite stimulants, antidyspeptics, tonics, antiflatulents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P1/00Drugs for disorders of the alimentary tract or the digestive system
    • A61P1/16Drugs for disorders of the alimentary tract or the digestive system for liver or gallbladder disorders, e.g. hepatoprotective agents, cholagogues, litholytics
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P1/00Drugs for disorders of the alimentary tract or the digestive system
    • A61P1/18Drugs for disorders of the alimentary tract or the digestive system for pancreatic disorders, e.g. pancreatic enzymes
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P11/00Drugs for disorders of the respiratory system
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P25/00Drugs for disorders of the nervous system
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P29/00Non-central analgesic, antipyretic or antiinflammatory agents, e.g. antirheumatic agents; Non-steroidal antiinflammatory drugs [NSAID]
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/04Antibacterial agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P37/00Drugs for immunological or allergic disorders
    • A61P37/02Immunomodulators
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P37/00Drugs for immunological or allergic disorders
    • A61P37/02Immunomodulators
    • A61P37/04Immunostimulants
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P7/00Drugs for disorders of the blood or the extracellular fluid
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P9/00Drugs for disorders of the cardiovascular system
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/30Vector systems comprising sequences for excision in presence of a recombinase, e.g. loxP or FRT

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medicinal Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • General Chemical & Material Sciences (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Genetics & Genomics (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Immunology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Oncology (AREA)
  • Communicable Diseases (AREA)
  • Virology (AREA)
  • Nutrition Science (AREA)
  • Rheumatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Pulmonology (AREA)
  • Neurology (AREA)
  • Hematology (AREA)
  • Diabetes (AREA)
  • Pain & Pain Management (AREA)

Abstract

本发明涉及一种获得细胞株的方法,其包含将用于重组酶识别的唯一位点整合到所述细胞基因组的高转录活性区域,以及将在唯一的重组酶识别位点下游编码转录终止信号的核酸序列整合到所述细胞的基因组的步骤。本发明还涉及根据所述方法获得的细胞株。

Description

用于生产蛋白,特别是治疗用蛋白的高转录活性细胞株
技术领域
本发明涉及一种产生细胞株的方法,特别地包括编码感兴趣蛋白的序列整合到高转录活性位点,以蛋白生产为目的,特别是用于治疗应用的蛋白。以及涉及使用这种方法产生的细胞株。
作为生物技术发展的结果,重组蛋白的生产目前是生物医学领域的重要业务,拥有很多诊断的和治疗的应用。越来越多的分子和细胞工程方面的专家正在使在各种宿主细胞表达系统中大量生产重组蛋白成为可能。
各种生物系统能被用来产生重组蛋白:细菌(1,2),酵母和其他真菌(35),植物(6),昆虫细胞(7,8)以及哺乳动物细胞(9-12)。由于其翻译后对(vis-à-vis)组装,糖基化以及对合成的重组蛋白的修饰(10,11)的能力,哺乳动物细胞是在生产用于治疗的复杂重组蛋白(10,11)(例如单克隆抗体)产品最常见的系统。
不幸的是,哺乳动物细胞的天然生率与在细菌或酵母中获得的表达水平相比是有限的。这是因为将表达载体整合进宿主细胞的基因组是罕见的事件(1/10000,根据Gorman &Bullock 2000,Ref.13)其中没有插入位点或拷贝数被整合,而这样最终的表达水平可以控制。为了改进这种类型的生产系统,已在一系列不同的方式中做了大量努力:表达载体以及其整合的方法,细胞以及其培养的方法和基因扩增(14-26)。
所有这些努力已集中到用于工业化程度生产的细胞株,特别地有CHO(14,25,27-29)和NSO(22,30,31)细胞株,以及HEK293(32,33)和BHK(34-36)细胞。然而选择高生产率的克隆仍然常常是关键步骤,由于表达载体整合进宿主细胞基因组的随机性,其包含对大量转染子的筛选。一旦表达载体已经整合进基因组,重组蛋白的表达水平强烈地取决于“位置效应”,例如整合位点的基因环境(37,38)。这样一来,表达载体在一转录不活跃的位点插入基因组将得到低水平的表达,或者根本没有表达,而载体在转录活跃的位点的整合则可获得高水平表达。
由于大部分基因组是转录不活跃状态,经常需要筛选大量的转染子来确定一株高生产率的克隆。(22)
背景技术
各种策略已经被应用以控制这种“位置效果”。一种方法是基于使用位点控制区(LCR)序列或隔离子来废除位置效应(39-42)。这种情况下,转基因的表达只取决于整合的载体拷贝数以及调节重组蛋白表达的外源序列的效果。
另一方法是基于通过本地修饰染色质以增加转录活性(UCOE)来废除位置效果(43)。
已经尝试可选的策略,通过引导载体插入到转基因将会被高度表达的位点来废除整合的随机性。为了这么做,转基因可以瞄准特征良好的基因(Hollis GF,US 6,750,041)或者已知的转录活跃位点(44,45,Reff MR,美国专利6,841,383)。在这个方法中,整合事件被控制并瞄准转基因能以恒定水平表达的位点,如果可能则保证在高水平。转染过程因此不再是随机事件,而变成可重现的,这意味着筛选和特性化步骤被简化了并且从一个转染步骤到另一个中获得了相当水平的生率。
表达载体的目标整合可以通过同源重组的方式实现(Reff MR,美国专利6,841,383;Hollis GF,美国专利6,750,041;46,47)。然而,虽然这类重组在酵母和其他真菌中是常见的,在更高等的真核细胞中相对稀少,这代表了在这种有机物中其开发中的主要障碍(47)。举个例子,在哺乳动物细胞中,同源重组与随机整合的频率比处于1/100和1/5000之间(48)。一种被设计用来促进同源重组的互补方法包含在DNA上用大范围核酸酶(例如I-Sce I)创造降解位点(49)。
另一种方法开发了重组酶(47,50),特别是Cre(51,52)和Flp(53,54)重组酶。P1噬菌体的Cre-loxP重组系统已调整,并用于在真核细胞中瞄准某些基因(51,52,SauerBL,欧专局0 220 009)。使用Cre重组酶在中国地鼠卵巢(CHO)细胞(44)的基因组中进行目标整合已作为示例进行了描述(44)。该重组系统在基因组中的特定位点上确保可重现的表达这方面是有前途的。但是,它只能保证所报道基因的可重现的表达,而没有确保所述基因的高水平表达。
为了消除这个问题,能够用于稳定表达系统的细胞株已经被创造出来并在基因组的转录活性区域具有FRT重组位点(例如Flp-InTM和Invitrogen细胞株)。表达载体与在转录活性区域内的位点的整合是通过Flp-FRT重组促成的,从而保证了感兴趣的基因的高水平表达。然而,可获得的Flp-in细胞株(293,CHO,BHK,3T3)对于某些重组蛋白的生产并不总是优选地,例如单克隆抗体,由于细胞的内源性翻译后修饰机制。另外,这些细胞株的基因组包含设计好的序列以使其可能选择其中重组位点已经整合进高转录区域的个体。
优选地是“宿主”细胞株中没有任何活性序列(启动子,增强子或抗生素抗性赋予基因)以避免对使用能力的限制,在随后的阶段中,抗性基因或调节序列(启动子,增强子,多A)能调节感兴趣蛋白的生产。最后,报道基因可能与感兴趣蛋白共表达的可能性会使复杂的检查程序成为必须,尤其是当其用作治疗用蛋白的生产,这受到严密的控制,特别是对生产用于治疗应用蛋白的细胞株的分子工程的监管。
最近,Kito等(45)采用Cre-loxP方法用GFP作为报道基因来选择CHO细胞的高生产率的克隆;在基因扩增后,结果是表达水平接近160mg/l。然而,作为上述的Flp-In细胞株,该策略取决于用作表达用宿主的细胞株中出现的许多活性序列。
由于治疗用重组蛋白的生产受到监管生产用于治疗应用蛋白的细胞株的分子工程的严格控制,在这些细胞基因组中出现活性序列会使注册程序复杂,并延长了由此方法生产的医药产品的开发过程。
这样,用简便的方法创造出,新的,高生产率的,长时间稳定的,能用于生产任何具有工业意义感兴趣的蛋白,尤其是用于治疗应用的蛋白的细胞株将构成改进真核细胞,尤其是哺乳动物细胞中重组蛋白的生产的主要步骤。
发明内容
根据本发明的各种事实,为能在细胞中表达的感兴趣的蛋白做了参考,这些蛋白要么用于检查在FRT位点上的整合的目的,要么在发明的全球远景中用于这种蛋白的工业化规模生产。作为出现在说明书和权利要求书中的,该表达意味着该细胞株生产的蛋白可能出现或不出现在细胞中,并以高于其内源性表达水平的水平过量表达。
定义
作为说明书,摘要和权利要求书中的通用规则,下列词语具有下列意义(除非有其他说明):
在本发明中,“核酸序列”表示单链或双链的核苷酸寡聚体或共聚体,从5’端读至3’端。词语“核酸序列”可指代DNA或RNA分子,或DNA/RNA杂合物,既可是天然的也可是合成的。在本申请中使用的基本标记系统中,除非另有说明,单链核苷酸序列的左侧端对应于其5’端。
在本发明中,“DNA分子”意为任何单链或双链的由核苷酸链组成的寡聚体或共聚体,可以是天然的也可以是合成的。并且具有,但不仅限于,基因,基因组,基因片段,编码与非编码序列的混合,调节序列或与RNA分子互补的序列。
在本发明中,“启动子”或“启动子序列”意为位于翻译起始密码子上游的天然的或合成的核酸序列,其包含于RNA聚合酶的识别和结合中。这样启动子序列帮助下游密码子序列的初始转录。这样的启动子对于那些本领域技术人员而言是熟悉的,并且包括细菌的,病毒的,真核的,酵母的和哺乳动物的启动子,对启动子的选择取决于用于实现表达的宿主细胞的类型。
在本发明中,“载体”意为以核酸为基础的传播媒介,能够传递核酸的核酸分子,或能够在宿主细胞中自主复制到DNA分子,如质粒,粘粒,噬菌粒,病毒基因组(染色体)或噬菌体基因组,以及能被用作克隆DNA分子的。根据考虑的细胞宿主以及载体组成核酸序列的本质,该载体作为独立的主体或整个进宿主的基因组,能在细胞内,在宿主细胞核或其细胞质内被稳定地复制。
在本发明中,“质粒”意为环形或可能的细胞线性化的独立DNA分子,其能在细胞内复制。词语质粒指代所谓的“表达质粒”以及被称为“非表达质粒”的质粒。当质粒被宿主细胞保持时,其既可以在细胞中以独立个体被稳定复制,也可以整合进宿主的基因组而被稳定复制。
在本发明中,“肽”,“多肽”,或“蛋白”指通过共价肽键连接的氨基酸的初级序列。总体而言,肽比蛋白短,含有少数的氨基酸,通常在2到50个之间。词语多肽能涵盖肽和蛋白。肽,多肽或蛋白可以是天然的,重组的或合成的。
在本发明中,“转录终止信号”意为位于转录区域末端的核酸序列,并引发所述区域RNA聚合酶转录的终止。与本发明有关的转录终止信号的示例包括,但不局限于,多腺苷酸序列,如多腺苷酸序列“SV40前多腺苷酸信号”,和牛生长激素(bGH)多腺苷酸序列。
在本发明中,“多腺苷酸序列”或“多A”意为引发转录的终止和形成的转录RNA分子的多腺苷酸化的DNA序列。有效的转录物多腺苷酸是经常所期望的,因为没有多A尾巴的转录物经常是不稳定的且快速地被降解。
有效的裂解和哺乳动物信使RNA的多腺苷酸要求至少两个信号元素:一条位于处理位点上游第7到第30对碱基位置的AAUAAA序列,以及富含GU或U的位于裂解位点3’端的序列。
在本发明中,“弱活性”或“低效”多腺苷酸的表达应理解为意为不允许有效执行转录终止以及转录物多腺苷酸化的多腺苷酸序列。结果是小量的转录物和/或显著不稳定的转录物,对于绝大部分,被降解地太迅速而来不及允许其翻译。更特别地,“低效(或弱活性)的多腺苷酸序列”应被理解为意为允许以低于或等于由“SV40前多腺苷酸信号”多腺苷酸序列引发的水平执行转录终止以及转录物多腺苷酸的任意序列。有可能实现该目标的任何多腺苷酸序列都能被纳入本发明的范围。更特别的,这些序列可以是具有弱活性多腺苷酸信号来终止转录以及转录物的多腺苷酸化的完整的多腺苷酸序列,例如SV40前多A或腺病毒L1多A(71),或为了减少当与未变异或未删节序列相比时转录终止以及转录物的多腺苷酸化的水平而再次被变异或删节的多腺苷酸序列。我们可以给出多腺苷酸序列的变异和/或删节的示例,这可能使其当与未变异序列相比时多腺苷酸信号的有效性降低:增加分开AATAAA元素与富含GT的区域之间的距离(66),从出现在AATAAA六核苷酸上游的一个或几个核苷酸删除后SV40多A(67),删除某些位于AATAAA序列上游第13到第48核苷酸中的元素(68),删除AATAAA序列下游富含GT的序列并修饰AATAAA序列之间的空间以及富含GT的区域(69),或位于AATAAA序列上游的USE(上游序列元素)区域的变异或删节(70),该列表并不是限制性的。
在本发明中,“分离的”或“纯化的”意为人类干涉后得到的任何对天然状态的修饰。因此,任何之前存在于自然环境中的目标被修饰或从其自然环境中提取即被称为“分离”或“纯化”。“分离”的材料可以是从在其自然环境中的其他分子中分离出来的,或者通过克隆,扩增和/或化学合成产生的,任何的多核苷酸或任何肽/多肽/蛋白。另外,通过转化、基因操作或任何其他方法被引导入生物体的多核苷酸,肽或蛋白被称为被“分离”了,即使其已经在所述生物体中出现。
在本发明中,“表达”意为特定核苷酸序列的转录和/或翻译,其由像启动子这样的调节序列控制。
在本发明中,“过度表达”意为对于给定的密码子序列每个细胞的表达显著高于(例如高出两倍,但理想的是高出10倍甚至100倍)在相应的未经本发明的构造转染的细胞中内源性编码序列观察到的水平。
在本发明中,“抗体”意为免疫球蛋白分子,其免疫学地与特定抗原结合,其根据类型可包含多克隆和/或单克隆抗体。该词语还涵盖遗传学修饰过的形态,如嵌合抗体(如人工繁育的鼠或兔抗体)和复共轭对配合抗体(如双特异性抗体)。词语“抗体”还可涵盖能结合到抗原的任何抗体形态,包括抗原结合的抗体片段。
在本发明中,“转染”或“使转染”指细胞结合外源性DNA并将其整合进自身的基因组的过程。
在本发明中,“细胞株”意为从相同的母体细胞传下来的细胞组,所有的细胞均具有与母细胞相同的遗传特征。细胞株还以其在体外稳定地复制几代的能力为特征。
在本发明中,“高转录活性区域”意为有机体中的染色体组或染色体DNA的一块区域,在其中染色体结构或调节序列表现出显著地增强在该区域中或邻近该区域的基因的转录。在这种高度活性区域中转录速率常常高于在该有机体的基因组中观测到的平均转录速率,优选地高出2倍,或有利地高出10倍,甚至高出50倍,或者有时甚至高出100倍。作为示例,对于YB2/0细胞株(ATTC CRL 1662)而言,考虑到的高转录活性区域使获得的pcd(皮克蛋白每24小时每个细胞)值至少为5,优选地至少为10。
在本发明中,“弱转录活性区域”意为有机体中的染色体组或染色体DNA的一块区域,其表现出染色体结构或包含调节序列,其能够显著地抑制或完全阻止在该区域中或邻近该区域的基因的转录频率。在这种区域中转录速率常常低于在该有机体的基因组中观测到的平均转录速率,优选地低一半或有利地低10倍,甚至低50倍,或者有时甚至低100倍。这种弱活性区域中的转录速率可能低到无法测定,低到零。
在本发明中,“重组酶”或“位点特异性重组酶”指作用于两个核酸分子的以一种方式使它们相互重组的酶。重组是一种已很好地表达的生理过程,其包括两个带有完全一致的或基本一致(同源的)序列的核酸分子的裂解,接着两个分子以每个初始分子的一个区域与另一分子的相应区域结合这样一种方式重组。已经观察到重组有两种类型。第一种类型,对应于“经典的”或“同源性的”重组适用于任何带有同源性核苷酸序列的分子对,这能作为“全体”重组酶的底物。与此相对的,在第二种类型中,称为“位点特异性重组”,为了能够作为重组酶的底物,同源性分子必须携带特殊的核酸序列,这称为“位点特异性重组”。一些位点特异性重组系统在背景技术中进行描述,包括E.coliP1噬菌体中的重组系统。特别地,特定的序列以及使用的重组酶可以属于不同结构类别,特别是Tn3转换子解离酶族或λ噬菌体整合酶族。在属于Tn3转换子族中有Tn3转换子解离酶或Tn21和Tn55转换子(Stark and al.,1992);mu噬菌体的Gin转化酶或另外的例如RP4片段的质粒游离酶(Abert and al.,Mol.Microbiol.12(1994)131)。在属于λ噬菌体整合酶族的重组酶中有λ噬菌体整合酶自身(Landy and al.,Science 197(1977)1147),P22(Leong and al.,J.Biol.Chem.260(1985)4468),流感嗜血杆菌(Haemophilus influenza)HP1(Hauser and al.J.Biol.Chem.267(1992)6859),P1噬菌体Cre整合酶,pSAM2质粒整合酶(350341EPA欧专局350 341)或还有2μ质粒FLP重组酶以及E.coli XerC和XerD重组酶。
在本发明中,“重组识别位点”意为能用于重组酶底物的一段核酸序列。
在本发明中,“报道基因”意为带有编码基因产品序列的多核苷酸,通常是酶,当包含报道基因序列的结构被引入含有所有表达所述基因所需因素的细胞中时,其能被简便地检测并且/或者被定量。能在本发明的内容中使用的报道基因的例子包括,但不限于,像maxFP-green蛋白及其衍生物的荧光蛋白,荧光素酶,绿色荧光蛋白(GFP)及其衍生物,或者珊瑚礁荧光蛋白(RCFP)以及由lacZ基因编码的β-牛乳糖酶。
在本发明中,“感兴趣的蛋白”意为可能具有工业上,治疗上或预防上价值的肽,多肽或蛋白。能在根据本发明的细胞株中表达的感兴趣的蛋白可以选自下列这些:
-具有治疗活性的蛋白,例如对人或动物中任何形式的认识到的疾病或对所述人或动物的病理学的损害作用具有已认识到的有益的生理效应的蛋白,包括预防性治疗形态;这样的蛋白可以是肽,多肽,激素,酶以及相关种类,而优选地是具有选自下列组的活性的多肽,其为对消化的,胰腺的,胆汁的,抗病毒的,抗炎的,肺部的,抗菌的,血液的,神经的,心血管的,眼科的,抗原的,大脑的,抗肿瘤的,免疫激活和免疫调变功能的蛋白;在特别优选的实施例中,具有治疗活性的蛋白或多肽选自包括胰岛素;包含人生长激素或牛生长激素的生长激素;生长激素释放因子;甲状旁腺素;甲状腺刺激素;卵泡刺激素;黄体生成素;像干扰素-α,-β以及-γ或者例如干扰素13这样的干扰素;血管内皮细胞生长因子(VEGF);用于激素受体或生长因子的受体;整合蛋白;A或D蛋白;类风湿因子;像骨源性神经营养因子(BDNF)这样的神经营养因子;神经营养因子(NT-3,NT-4,NT-5或NT-6);像NGF-β这样的神经生长因子;血小板源生长因子(PDGF);像FGF或bFGF这样的成纤维细胞生长因子;表皮生长因子(EGF);像转化生长因子-α以及包含TGF-β.1,TGF-β.2,TGF-β.3,TGF-β.4或TGF-β.5的TGF-β这样的转化生长因子(TGF);类似于I型或II型胰岛素(IGF-I和IGF-II)或例如(1-3)-IGF-I中的一个(大脑IGF-I)这样的生长因子;角化细胞生长因子;类似胰岛素的生长因子结合蛋白;像CD-3,CD-4,CD-8或CD-19这样的CD蛋白;红细胞生成素;骨诱导因子;免疫毒素;骨形态发生蛋白(BMP);克隆刺激因子(CSFs),例如M-CSF,GM-CSF或G-CSF;加速老化因子;胃的,胰腺的,或胆汁的脂肪酶弹性蛋白酶,类α-1抗胰蛋白酶的抗蛋白酶;蛋白酶;氧化酶;肌醇六磷酸酶;几丁质酶;转化酵素;纤维素酶;xynalases;像胶原蛋白这样的结构蛋白;像乳铁传递蛋白这样的铁传递蛋白;像血红蛋白或人血清蛋白这样的血液蛋白;类血液辅助因子,凝结因子的因子VII,因子VIII,因子IX,因子X,组织因子,假血友病因子;像蛋白C这样的抗凝结因子;心房利钠因子;肾素;降血钙素;胰高血糖素;肺泡表面活性物质;像尿激酶或组织特异性血纤维蛋白催化剂这样的血纤维蛋白催化剂(t-PA);凝血酶;促血小板生成素;造血生长因子;α-或β-肿瘤坏疽因子;encephalinase(内脑磷脂酶);人巨噬细胞炎症蛋白(MIP-1α);例如人血清白蛋白这样的血清白蛋白;松弛素;脱氧核糖核酸酶;细胞因子;像RANTES(调节对普通T细胞表达和分泌的激活)的趋化因子;白细胞介素(ILs),如IL-1到IL-10;例如过氧化物歧化酶这样的抗氧化剂;抗体,抗体片段和抗原的组。当多肽或蛋白是抗体或抗体片段时,它可以是免疫球蛋白分子,免疫球蛋白重链,基本上完整的免疫球蛋白分子以及携带抗体决定簇,尤其是Fab片段,Fab’片段,F(ab′)2片段以及Fv片段的免疫球蛋白的所有部分,免疫球蛋白的轻链和Fv片段;
-美容活性的蛋白和多肽,其根据很多国家的立法是那些只作用于表皮的,例如不穿透到较下层的化合物,或者换言之,对真皮或基细胞没有影响。这样的蛋白或多肽对于那些本领域技术人员本身而言是熟悉的,其中的一些例子是神经酰胺,keratides,湿润剂,抗菌剂以及相关的化合物;
-营养品活性的蛋白或多肽,例如与那些普遍发现于人或动物的饮食中的完全一致或相似的化合物,可以在其全部或部分的食物中发现,且对健康具有有益的效果;作为涵盖于本发明这部分的这类化合物的示例,可以提到修饰或源于苯基丙氨酸氨裂解酶(PAL),过源原,例如桦树,杨树,草,过氧化物,歧化酶(SOD)和相关化合物。
在本发明中,“高抗菌素剂量”意为至少为1/gl或有利地至少为4/gl,优选地的是8/gl。
本发明的一方面提供了用于产生包含至少一个细胞的细胞株的方法,包括下列步骤:
-在所述细胞的基因组的高转录活性区域,将唯一的重组酶识别位点整合到所述细胞的基因组中;以及
-编码转录终止信号的核酸序列在唯一的重组酶识别位点的下游结合到所述细胞的基因组。优选地,编码转录终止信号的核酸序列是编码多腺苷酸信号的序列。仍然更优选地,编码转录终止信号的核酸序列是编码至少部分弱活性多腺苷酸信号的序列,例如SV40前多腺苷酸信号或腺病毒L1多腺苷酸信号或任何其他的如前面所定义的弱活性多腺苷酸信号。
根据另一特别有利的本发明的实施例,用于本发明方法的细胞株的细胞是哺乳动物或鸟的细胞。原细胞(例如在修饰之前)选自包含鼠骨髓瘤细胞株,特别的是YB2/0(ATCCCRL-1662)和IR983F,人骨髓瘤细胞如Namalwa或像PERC6,CHO细胞株(特别地CHO-K,CHOLec,CHO-Lec1,CHO Pro-5,CHO dhfr-,CHO Lec13)这样的任何其他的人体细胞或其他选自Wil-2,Jurkat,Vero,Molt-4,COS-7,293-HEK,BHK,K6H6,NSO,SP2/0-Ag14,P3X63Ag8.653和EBx的细胞株。
根据本发明方法的优选形式,唯一的重组酶识别位点是经过一系列步骤结合的,步骤至少包括:
-整合两条都编码重组酶识别位点的核酸序列;
-整合位于两条都编码重组酶识别位点的序列之间的编码报道基因的核酸序列;
-整合位于两条都编码重组酶识别位点的序列之间的编码感兴趣蛋白的核酸序列;
-整合位于两条都编码重组酶识别位点的序列之间的编码选择标记的核酸序列,优选地是赋予抗生素抗性的基因。
在这里,重组酶识别序列可以是loxP和/或FRT序列。感兴趣的蛋白可以是例如抗体或抗体的片段。
还优选地仅选择高产率细胞,其结合所有前述序列的单个拷贝。还更优选地是,只选择pcd(皮克蛋白每个细胞每24小时)至少为5的,或优选地至少为10,或者更进一步为20,30,30,50,80或100的细胞。
优选地,以及随后地,所有的前述序列能通过重组酶对细胞的作用而被切除。在这种情况下,重组酶活性可由所述重组酶通过携带编码所述重组酶的核酸序列的载体在细胞中的共表达而诱导。
根据本发明的另一优选地实施例,前述系列的步骤还可包括对携带着唯一地完整的重组酶识别位点的细胞的选择,在其中所有前述核酸序列已经被切除。
另外,更优选地,一系列的步骤可以包括结合编码I型单纯疱疹(HSV1-TK)的胸苷激素的核酸序列。在这里,细胞可以通过在培养基中加入更昔洛韦(ganciclovir)进行选择。事实上,如果更昔洛韦出现在培养基中,该选择方法能确保只有那些细胞中的HSV1-TK核酸序列已被删除的才能够存活。
在特别优选的情况下,前述的系列方法还包括转染所选择的细胞株,转染用携带编码感兴趣的蛋白或多肽的核酸序列以及直接在编码选择标记的核酸序列下游的编码重组酶识别位点的核酸序列,优选地赋予对抗生素的抗性,而没有多腺苷酸序列的表达载体来实现的。在这种情况下,所述表达载体是在所述在转染时被诱导或引导的重组酶作用的力量下,在唯一的重组酶识别位点结合的。对携带整合到目标位点的表达载体的细胞的选择还可以通过对所感兴趣蛋白或多肽的表达的试验有利地进行。有利地,细胞还可通过其对高浓度抗菌素的抗性,尤其对于抗生素剂量至少为1g/l,或者2g/l或优选地是4g/l或8g/l进行选择。
在尤其优选的方法中,所述感兴趣的蛋白或多肽是治疗性的蛋白或多肽,特别地选自在消化的,胰腺的,胆汁的,抗病毒的,抗炎的,肺的,抗菌的,血液的,神经的,心血管的,眼科的,抗原的,脑的,抗肿瘤的,免疫刺激的,免疫调节功能方面有活性的组。
前述方法的步骤中在不同阶段产出一个或多个具有特别有利的性质的细胞株。结果本发明的另一目标是具有在所述细胞基因组的高转录活性区域稳定地整合了唯一重组酶识别位点,而直接在所述唯一的重组酶识别位点的下游整合了编码转录终止信号的核酸序列。优选地,被稳定地整合了的编码转录终止信号的核酸序列是编码多腺苷酸信号的序列。该编码转录终止或多腺苷酸信号的核酸序列是编码了全部或部分类似SV40前多腺苷酸信号或任何其他的修饰过的改变了其效率的多腺苷酸信号这样的弱活性多腺苷酸信号。如上所述,该细胞株优选地是源于哺乳动物。
如前所述的细胞株因此仍有利地包括:
-两条都编码重组酶识别位点的核酸序列;
-至少一条位于两条都编码重组酶识别位点的序列之间的编码感兴趣蛋白的核酸序列;
-至少一条编码选择标记的核酸序列,优选地是赋予抗菌素抗性的基因,缺少多腺苷酸序列,位于两条都编码重组酶识别位点的序列之间,该序列为直接位于重组酶识别位点上游的选择标记编码,重组酶识别位点直接位于前述的低多腺苷酸序列的上游。
优选地,如前所述,所有前述的序列的单独拷贝被一起整合到细胞株细胞的基因组内。更优选地的方法是每个细胞株的pcd至少是5或者有利地至少是10。
在高度优选的方法中,该细胞株还能过度表达所感兴趣的蛋白或多肽,其选自具有消化的,胰腺的,胆汁的,抗病毒的,抗炎的,肺的,抗菌的,血液的,神经的,心血管的,眼科的,抗原的,脑的,抗肿瘤的,免疫刺激的,免疫调节活性感兴趣的蛋白或多肽的组。
根据本发明的另一目标,该细胞株是根据以申请号CNCM 1-3704注册的YGM-1/10G10(于2006年12月18日提交至Collection Nationale de Culture de Microorganismes(CNCM),Institut Pasteur,25 rue du Docteur Roux,F-75724 Paris Cedex 15的细胞株)作为参考确定的。
根据本发明的另一目标,该细胞株是根据以申请号CNCM 1-3885注册的YGM-2/3G5(于2007年12月19日提交至Collection Nationale de Culture de Microorganismes(CNCM),Institut Pasteur,25 rue du Docteur Roux,F-75724 Paris Cedex 15的细胞株)作为参考确定的。
本发明的另一目标是提供包含由编号SEQ ID NO:1的确定的核酸片段的分离的核酸分子。该分子代表或象征高转录活性位点,因此能被用于整合其他前述的序列。显然,SEQ.ID NO 1序列还能被直接或者以互补的方式或通过杂交用于在适当的细胞的基因组中创造高转录活性位点。这可以通过携带有在编号SEQ ID NO:1列表中的序列确定的核酸序列的载体而实现。
另一特别优选的本发明的目标提供至少一种感兴趣蛋白或多肽的生产方法,其特征在于为了表达所述感兴趣的蛋白和多肽而培养前述的细胞株,接着至少一个收获所述感兴趣蛋白的步骤。像已经描述的以及之前给出其注册参考号而确定的细胞株优选地适于进行这类步骤。这里,感兴趣的蛋白或多肽优选地选自对消化的,胰腺的,胆汁的,抗病毒的,抗炎的,肺的,抗菌的,血液的,神经的,心血管的,眼科的,抗原的,脑的,抗肿瘤的,免疫刺激的,免疫调节功能有活性的感兴趣的蛋白或多肽的组。更优选地,感兴趣的蛋白或多肽是抗体或抗体片段。
附图说明
图1:图1是pTV1目标载体的示意图。
图2:图2是pFlpe重组酶表达载体的示意图。
图3:图3是pT125FRT表达载体的示意图。
图4:图4是T125-IG24载体的示意图。
图5:图5在细胞外列出了通过Flp重组酶删除或切除目标载体的途径。
图6:图6在细胞外列出了通过Flp重组酶重新整合表达载体的途径。
发明详述
本发明的第一目标涉及一种基于感兴趣的DNA分子插入哺乳动物细胞基因组的目标位点的方法。该方法包括产生细胞株的第一步,其具备整合进其基因组的高转录活性区域的唯一的重组酶识别位点。该第一步包括以下步骤:
1)哺乳动物细胞第一核酸中的整合,指“目标质粒”,包含(i)两条序列一前一后地对应于重组酶识别位点,在这两者之间存在报道基因,是编码与感兴趣蛋白相似蛋白的基因,允许扩增的选择子基因以及赋予抗生素抗性的基因,但是没有多腺苷酸序列;以及(ii)位于第二重组酶识别位点下游的多腺苷酸位点,如抗生素抗性基因的5’端;
2)选择携带目标载体单独拷贝的“高产率”细胞;
3)通过重组酶的方式切除目标载体;以及
4)选择细胞来制造已经失去目标载体,只保存完整的、唯一的整合的重组酶识别位点的细胞株。
通过本发明的方法,在第4步被选择的组成细胞株的细胞都携带唯一的整合进其基因组的高转录活性区域的重组酶识别位点。
在该方法的步骤1)中使用的哺乳动物细胞的特征之一是,在未经本发明的方法修饰过之前其并不携带任何与在本发明的方法的互补过程中整合的重组酶识别位点相似的序列。结果是,由于在所述细胞株细胞的基因组中找不到其他相同的序列,因此整合进本发明的细胞株细胞的基因组中的重组酶识别位点是唯一的。
执行本发明的步骤1),在哺乳动物细胞中第一核酸的整合可以使用任何本领域技术人员已知的方法实现。作为示例,可以提一下:磷酸钙(CaPO4)沉淀法,其中沉淀的DNA由于噬菌作用与细胞结合;可选的,脂质转染法,其包括用脂质囊包裹要整合的DNA从而使其能与宿主细胞的膜接合;另一可能的方法是电穿孔,其中给予细胞电击导致感兴趣DNA的整合;另一可能的方法是核内显微注射。
用于本发明方法的第一步的目标载体由含有两个重组酶识别位点的核酸分子组成。这些位点相互完全一致,并且与通过本发明方式方法产生的细胞株中的唯一位点完全一致。这两个位点在含有报道基因,编码与感兴趣蛋白相似蛋白的基因,赋予抗生素抗性的基因,以及允许基因扩增的选择子基因的DNA片段的两侧。目标载体还包含所有表达插入两个重组酶识别位点之间基因所必需的序列。在这些必需的序列中,可以提到,但不限于,启动子,增强子和多腺苷酸序列。
目标载体整合进转染细胞的基因组以随机形式发生。因此目标载体可能插入转录无活性,相对无活性,中等活性或高活性的区域。目标载体插入其高转录活性区域的细胞株是基于报道基因的表达或过度表达进行选择的。
该报道基因——该产品易于被检测及分析——的表达构成一种评估所述报道基因被整合到的环境的转录活性水平的方法:如果插入位点的转录活性低,报道基因的活性也会低;相反地,如果插入位点的转录活性高,报道基因的活性也会高。
编码与感兴趣蛋白类似蛋白的基因,位于报道基因的下游,使确定包含该转基因的细胞分泌蛋白的能力成为可能,是不能用荧光蛋白在细胞内部表达确定的参数。任何易于被检测的蛋白可以被用于此目的。在能够被用于本发明这部分内容的蛋白中,可以提到,但不限于,免疫球蛋白、生长因子,白细胞介素,刺激因子,激酶,凝结因子,α-抗胰蛋白酶以及白蛋白基因的产物。
抗生素抗性基因使选择携带目标载体的改变了的细胞成为可能。选择是这样进行的,通过将改变了的细胞与相关抗生素接触从而只有那些已经结合了目标载体的细胞存活下来。抗生素抗性基因后面跟着多腺苷酸序列(“多A”)其在稳定相应的mRNA分子中起重要作用(56-63)。任何对本领域技术人员而言已知的允许抗生素抗性基因表达的多腺苷酸序列都能使用,虽然优选地使用弱活性多A序列。
有利地,多腺苷酸序列是弱活性的多腺苷酸序列,例如相对无效的多腺苷酸序列。结果是,如果目标载体被插入到无转录活性区域,抗生素抗性基因将不会以高到足以使细胞在暴露于抗生素下时存活下来的水平表达。相反的,如果插入位点在高转录活性区域,多腺苷酸序列的“软弱”将不阻止抗性基因产物的表达,而相应的细胞将能抵抗抗生素。使用这种弱多腺苷酸序列,尤其在选择压力大时(在高浓度的抗生素下),将充分减少需要进行筛选的克隆数量并将有助于确定可能对感兴趣蛋白是“高产率”的克隆。
作为弱多腺苷酸序列的示例,可以提到“SV40前多腺苷酸信号”,其是在某些可购得的表达载体中使用的信号(64-66)。
有利地,细胞还可以根据其在高浓度抗生素下的抗性进行选择。结合这两种选择工具,换言之使用弱活性多腺苷酸序列和在培养基中使用高浓度抗生素使这个选择的方法成为特别有利的选择转基因被整合到所期望位置的细胞的手段,换言之,在重组酶识别位点,没有选择那些识别位点的重组酶已经整合进诱导低转录活性的区域的细胞。事实上,多腺苷酸序列仅是弱活性的事实具有这样的效果,即直接位于该位点上游的对抗生素有抗性的基因仅以小的程度表达。这样,如果加入培养基的抗生素浓度是高的(例如大于或等于1g/l。或者还大于或等于2g/l,或到4g/l或大于或等于8g/l),只有那些已经将转基因整合进虽然有多腺苷酸序列的低效率或弱活性仍允许充分强地表达对抗生素有抗性的基因的细胞能存活下来。这种同时采用多腺苷酸序列的弱活性以及在细胞培养基中加入高浓度抗生素的选择方法具有几点优势:由于将转基因整合到基因组其他地方而不是在重组酶识别位点的克隆在培养基中出现的高浓度抗生素的作用下将死亡,从而减少对克隆的筛选成为可能。另外,当与现有技术的选择方法相比时被选择的克隆具有更高的生产能力。
有利地,目标载体是在转染进所选细胞前使用限制酶进行细胞线性化过的。为了防止目标载体的多个拷贝在整个进细胞基因组DNA之前结合,所使用的限制酶应当制造出钝的末端。另外,只有少量的目标载体被用于转染过程。这些特定的条件可以充分地降低将被整合进细胞基因组的载体的拷贝数。在实际操作中,为了符合要求的切除,只有目标载体的单个拷贝被整合进转染的细胞是重要的,这样切除随后出现在出现的两个重组酶识别位点之间。相似地,本发明的方法只有在单个高转录活性区域已经被确定时才能成功地实施。
目标载体还包括在第二重组酶识别位点下游的多腺苷酸序列。该多腺苷酸序列是被设计用来随后整合携带有感兴趣蛋白基因的不同载体的。这样,正如在下面将描述的,该多腺苷酸序列将使对已经在重组酶识别位点整合了第二个载体的细胞的选择成为可能。有利地,该多腺苷酸序列是相对无效的,并且可以被认为“弱多腺苷酸序列”;一个例子就是称为“SV40前多腺苷酸信号”的SV40前多腺苷酸序列。
有利地,目标载体携带允许执行基因扩增机制的基因。该基因可以例如是二氢叶酸还原酶(DHFR)或谷氨酸合成酶(GS)的基因或是细胞生存必要的代谢酶。当已整合目标载体的转染细胞用逐渐增加浓度的对相关酶的特定抑制剂培养时,(例如对于DHFR的甲氨喋呤和对于GS的甲硫氨酸硫堇亚胺),只有那些其中载体已经被增加的细胞会表达出足够的DHFR或GS而存活下来(23,30)。获得的基因扩增的程度是变化的,从根本上取决于载体整合到的基因组的区域。因此目标载体的整合区域由于其“扩增能力”而被选择,以使其能保证其将在随后有可能扩增所感兴趣的转基因的表达。
另外,在另一本发明的特别的实施例中,目标载体在两个重组酶识别位点之间携带I型单纯疱疹病毒的胸苷激酶(HSV1-TK)的基因。在步骤4)中的细胞选择是基于将更昔洛韦添加到培养基中:还未从中切除目标载体的细胞将被更昔洛韦杀死,而那些其中的目标载体已经被切除的细胞将存活下来。在这一步中使用基于使用任何潜在毒性的“前体”而不是HSV1-TK的自杀基因是没有任何价值的。作为示例可以提到,CodA和Fcy基因以及前体5氟胞嘧啶(5-FC);这个列表不是限制性的。
在本发明的内容中所使用的重组酶识别位点可以相当于任何对那些本领域技术人员已知的位点。作为示例,可以提到loxP和FRT位点。在本发明的一实施例中,loxP和FRT位点同时被使用。作为示例,该实施例可以使用FRT将表达载体插入,然后在整合进基因组后使用loxP去除载体的选择子基因。
编码与感兴趣蛋白相似蛋白的报道基因可能相当于任何编码与具有治疗的或工业上的价值的蛋白完全一致或相似的分泌蛋白的基因。作为示例,可以提到编码抗体,生长因子,白细胞介素,刺激因子,激酶,凝结因子,α-1抗胰蛋白酶或白蛋白的基因,该列表是非限制性的。
与感兴趣蛋白相似蛋白的额外表达以及由报道基因编码的蛋白使在步骤2)中,不仅仅基于报道基因的表达水平还基于细胞的分泌能力来选择细胞成为可能。
有利地,感兴趣的蛋白是抗体。这种情况下,在载体中包含有编码所述抗体重链和轻链的基因是特别有利地。另外,如果感兴趣的蛋白是抗体,在步骤2)时,基于预见的糖基化的比例或形式来选择抗体生产细胞将是有用的。
有利地,用于本发明的这个方法的原始哺乳动物细胞选自:鼠骨髓瘤细胞株,特别的是YB2/0(ATCC CRL-1662)和IR983F,像Namalwa或像PERC6,CHO细胞株(特别地CHO-K,CHOLec,CHO-Lec1,CHO Pro-5,CHO dhfr-,CHO Lec13)这样的任何其他的人体细胞或其他选自Wil-2,Jurkat,Vero,Molt-4,COS-7,293-HEK,BHK,K6H6,NSO,SP2/0-Ag14,P3X63Ag8.653。
在特别有利地方式中,使用YB2/0细胞株。
在步骤2)中被选择的生产感兴趣蛋白的高产率细胞的产率超过5pcd(皮克蛋白每个细胞每24小时)。有利地,所感兴趣的细胞的生产速率超过10pcd。在特别有利的方式中,所感兴趣的细胞的生产速率超过15pcd,而更特定地超过20pcd。有利地,产率在5到50pcd之间,或更特定地在10到30pcd之间。
整合进原始哺乳动物细胞中的拷贝数可以通过任何对本领域技术人员已知的方法进行估算。作为示例,可以提到定量的聚合酶链式反应(PCR)分析。
在目标载体切除步骤(步骤3)中,重组酶在两个重组酶识别位点促成一重组事件,并诱导目标载体从细胞基因组的切除,而重组酶识别位点仍然保留在基因组内。在本发明的方法中实施的切除机制导致所有位于整合到目标载体的两个重组酶识别位点之间的核酸序列的移除。保留于基因组的高转录活性区域的识别位点仍处于与在整合到目标载体中的原始识别位点相同的方位。另外,在切除目标载体后,多腺苷酸序列被留在哺乳动物细胞中被保留的重组酶识别位点的下游。保留下来的重组酶识别位点的完整性可以使用任何本领域技术人员已知的方法进行检验,例如在PCR(聚合酶链式反应)后对扩增的DNA序列测序。
作为示例,该重组酶在细胞中可以通过短暂的编码所述重组酶的载体的转染被表达,而细胞已经在步骤2中被转染了。
如果重组酶识别位点是loxP位点,那么使用Cre重组酶将没有意义。相反,如果识别位点是FRT,使用的重组酶是Flp。有利地,在本发明的范围内,使用的重组酶是Flpe,一种源于Flp的重组酶,其在用于培育哺乳动物细胞的培养条件下更具活性(55)。
因此切除步骤去除所有可能影响到使用留于基因组或被转染细胞中的FRT重组序列而被插入到高转录活性区域的感兴趣蛋白的进一步表达的活性序列。因此在目标载体被切除后再没有活性转基因的元素留于细胞株中。
在本发明的方法的第一步产生的携带了插入其基因组的高转录活性区域的唯一的重组酶识别位点的细胞株(高产率细胞株),能被用于生产任何感兴趣的蛋白。这样的蛋白可以通过用携带转录感兴趣蛋白所需的序列输入所述载体的载体定位到唯一的重组位点而随之产生。这种本发明的高产量细胞株的应用将在下面进行详述。
本发明的另一目标关系到前面所定义的方法,包含为了将感兴趣的DNA分子插入本发明的方法的第一步产生的细胞株中而设计的第二步。该第二步包含以下步骤:
5)用携带有编码感兴趣蛋白的基因,允许基因扩增的基因以及赋予抗生素抗性的基因,但没有任何多腺苷酸序列的表达载体转染在步骤4)中产生的细胞株,该载体被直接定位于重组酶识别位点的上游
6)在唯一的重组酶识别位点插入所述表达载体,由所述重组酶促成;
7)通过对感兴趣蛋白的表达的分析对携带有整合到目标位点的表达载体的细胞进行选择。有利地,为了阻止随机整合,选择是在高浓度的抗生素的存在下进行的。
用于方法中重新整合步骤的表达载体包括编码感兴趣蛋白的基因,允许基因扩增的基因,以及出现在载体中的编码序列表达所必需的序列,例如启动子,增强子和多腺苷酸序列。该表达载体还包含赋予抗生素抗性的基因及其启动子,而没有任何多腺苷酸序列,该载体被直接定位于重组酶识别位点的上游。
所述表达载体携带的抗生素抗性基因不具有多腺苷酸序列。因此抗生素抗性基因必须被置于载体的末端,从而它直接被插入在目标载体被切除后留在细胞基因组中的多腺苷酸序列的上游。可选地,该抗生素抗性基因与目标载体上的一样,从而可以使用与在步骤2)中选择高产量细胞时相同浓度的抗生素进行细胞选择。这样通过将细胞暴露于与基因赋予的抗性相对应的抗生素下进行选择。
重组酶促成了表达载体在经过步骤4)留下的唯一的识别位点处插入细胞基因组。为此,在表达载体中的重组酶识别位点与在本方法的第一部分中整合到细胞基因组的完全一致。
如上所述,如果重组酶识别位点是loxP位点,使用Cre重组酶;如果识别位点是FRT,所使用的重组酶是Flp。另外,任何能使重组酶在细胞中工作的方法能在本发明的方法的步骤6)中实施。作为示例,重组酶可以在用携带编码所述重组酶基因的载体转染的细胞中生产。
没有在重组酶识别位点整合表达载体的细胞将在随后由于所使用的高浓度的抗生素而死亡。事实上抗生素抗性基因在其编码序列下游没有多腺苷酸序列,因此只有当基因被插入到邻近经过步骤3)和4)留在细胞基因组中的多腺苷酸序列时才能有效地表达。
有利地,由表达载体中的感兴趣的DNA表达得到的蛋白可以是任何具有治疗的或工业上价值的蛋白,例如,抗体,凝结因子,细胞因子生长因子,酶或激素,该列表是非限制性的。另外,编码感兴趣蛋白的基因可以与目标载体上携带的一样,或者其可以是编码不同蛋白的基因。
本发明的另一目标关系到携带着整合到基因组高转录活性区域的唯一的重组酶识别位点的细胞株,所述细胞株已经在所述重组酶识别位点整合了转基因的单独拷贝,所述细胞株长时间稳定并能在本发明的方法的步骤4)中获得。
有利地,该细胞株是YGM-1/10G10细胞株(于2006年12月18日提交至CollectionNationale de Culture de Microorganismes(CNCM),申请号为CNCM I-3704)。YGM-1/10G10细胞株是通过在本方法步骤1)由YB2/0细胞(ATCC CRL-166)开始,实施本发明的方法产生的细胞株。该YGM-1/10G10细胞株具有以下特征:无活性序列(启动子,选择子基因,抗生素抗性基因),一重组酶识别位点,稳定的培养参数以及稳定的整合位点。另外,该细胞株还有利地具有生产感兴趣蛋白的速率超过5pcd(皮克蛋白每个细胞每24小时)。有利地,感兴趣细胞的产率超过10pcd。在特别有利的方式中,感兴趣细胞的产率超过15pcd,更特别地20pcd。有利地,产率在5到50pcd之间,更特别地在10到30pcd之间。
这样,本发明的一个目标是新的表达细胞株,YGM-1/10G10,没有任何活性转基因序列,源自YB2/0细胞株,在其中表达载体的整合能被控制,并通过使用重组酶指向有利于转录的区域。
根据另发明的另一目标,该细胞株是YGM-2/3G5细胞株(于2007年12月19日提交至Collection Nationale de Culturede Microorganismes(CNCM),申请号为CNCM I-3885)。YGM-2/3G5细胞株是通过在本方法步骤1)由YB2/0细胞(ATCC CRL-1662)开始,实施本发明的方法产生的细胞株。该YGM-2/3G5细胞株具有以下特征:无活性序列(启动子,选择子基因,抗生素抗性基因),一重组酶识别位点,稳定的培养参数以及稳定的整合位点。另外,该细胞株还有利地具有生产感兴趣蛋白的速率超过5pcd(皮克蛋白每个细胞每24小时)。有利地,感兴趣细胞的产率超过10pcd。在特别有利的方式中,感兴趣细胞的产率超过15pcd,更特别地20pcd。有利地,产率在5到50pcd之间,更特别地在10到30pcd之间。
这样,本发明的一个目标是新的表达细胞株,YGM-2/3G5,没有任何活性转基因序列,源自YB2/0细胞株,在其中表达载体的整合能被控制,并通过使用重组酶指向有利于转录的区域。
新的YGM-1/10G10和YGM-2/3G5细胞株具有下列性质和优势:
-始终可繁殖,作为在相同位点有保障地整合的结果,每个转染过程均高水平表达;
-不存在活性转基因序列(启动子,抗性基因,转录增强子)会影响到原始YB2/0细胞株的性质,从而方便了随后接着的携带感兴趣蛋白基因的表达载体的整合的开发;
-由于需要被筛选的转染子的数量的减少,节省时间和资源;
-通过对“扩增了的”整合位点的选择能实现基因扩增(例如使用DHFR甲氨喋呤系统)的可能性。
有利地,本发明的方法产生的细胞株是长时间稳定的,至少为3个月,例如大约80代。
本发明的另一目标是关于从包含SEQ ID NO:4序列核酸片段的SEQ ID NO:1序列中分离出来的核酸分子,所述片段当结合到表达载体或包括SEQ ID NO:1序列的高转录活性区域或至少与SEQ ID NO:1序列有80%以上同源性的核酸片段上时,能够增加感兴趣的重组蛋白的表达,当结合到表达载体上时,所述片段能够增强感兴趣重组蛋白的表达。
从包含能够当与表达载体结合时增加感兴趣的重组蛋白的表达的核酸片段的SEQ IDNO:1序列中分离出来的核酸分子相应地核酸序列如下:
  1   TGGAAACAGA   ACTAAATAG   AGACATAGAG   AAAATGAACA   GAAGTTATGA
  51   ACCAAATGGA   TTTAACCGGT   ATTTATACAA   CATTTCATCT   TAAAACAAAA
  101   GAATATACCT   TCTTCTCAGC   ACCTCATAGC   CTCTTCTACN   AAACCATATA
  151   GTCGGTCACN   AAACAAGCCT   CAACAGATAC   AAGAAGATAA   AAATAATCCC
  201   ATGCATACTA   TCAGATCACC   ATGGACTAAC   TCTGGTCTTC   AATAACAACA
  251   AAAACAATGG   AAGTCGAAGA   ACACTCTATT   CAATGATAAC   TTGGTCAAGG
  301   AAGAGATGAA   AAAGGAAATT   AAAGCCTTTT   TAGAATTTCA   TGAAAATGAA
  351   GGCACAACAT   ACCCAAACTT   ATGAGACACA   AGGAAAGCAG   TGCTAAGAGG
  401   AAAACTCATA   GCTCTGAGTG   CCTCCAAAAA   GAAACAAGAG   AGAGTGTATA
  451   CTAGCAGCTT   GAGAGCACAC   CTGAAAGCTC   TAGAACAAAA   AGAAGCAAAT
  501   ACACCCAAGA   GGAGAAGATC   AAATGCAGGG   CTGAAATCAA   CCAAGTAGAA
  551   ACAAAAGAAC   TGTAAAAAGA   ACCAACAAAA   CCAGGAGTTG   GTTGGTTGAG
  601   AAAATCAAAA   AGATAAATAA   ACCCTTAATC   AGAATAACCA   GAGGGCACAG
  651   AAACAGTATC   CAAATTAACA   AAATAAGAAA   TGGAAAGGGA   GACGTAAAAC
  701   AGAATCCGAG   GAAATAAAAA   AAAATTGATC   CTATTACAAA   AGTCTATATT
  751   CAACAAAGCT   GGAAAATCTG   GATGAAATAG   ACAATTTTCT   AGATAGATAC
  801   CAGATACCAA   AGTTAAATCA   GGACCAGATA   AATCATCTAA   ACAGTCCCAT
  851   AACTCCTAAA   GAAATAGAAG   CAGTTATTAA   AATTCTCCCG   ACCAAAAAAA
  901   AAAAAAAAAA   AAAGCCCAGG   ATTGGATGGG   TTTAGTGGAG   AATTCTATCA
  951   GACCTTCATC   AAAGACCTAA   TACCAATACT   GTCCAAACTA   TTCCTTGCAA
  1001   CACTGAATAT   TCCGCATACA   CTATTCACAG   AAAAGCATCT   TACGGATGGC
  1051   ATGACAGTAA   GAGAATTATG   CAGTGCTGCC   ATAACCATGA   GTGATAACAC
  1101   TGCGGCCAAC   TTACTTCTGA   CAACGATCGG   AGGACCGAAG   GAGCTAACCG
  1151   CTTTTTTGCA   CAACATGGGG   GATCATGTAA   CTCGCCTTGA   TCGTTGGGAA
  1201   CCGGAGCTGA   ATGAAGCCAT   ACCAAACGAC   GAGCGTGACA   CCACGATGCC
  1251   TGTAGCAATG   GCAACAACGT   TGCGCAAACT   ATTAACTGGC   GAACTATTA
  1301   CTCTAGCTTC   CCGGCAACAA   TTAATAGACT   GGATGGAGGC   GGATAAAGTT
  1351   GCAGGACCAC   TTCTGCGCTC   GGCCCTTCCG   GCTGGCTGGT   TTATTGCTGA
  1401   TAAATCTGGA   GCCGGTGAGC   GTGGGTCTCG   CGGTATCATT   GCAGCACTGG
  1451   GGCCAGATGG   TAAGCCCTCC   CGTATCGTAG   TTATCTACAC   GACGGGGAGT
  1501   CAGGCAACTA   TGGATGAACG   AAATAGACAG   ATCGCTGAGA   TAGGTGCCTC
  1551   ACTGATTAAG   CATTGGTAAC   TGTCAGACCA   AGTTTACTCA   TATATACTTT
  1601   AGATTGATTT   AAAACTTCAT   TTTTAATTTA   AAAGGATCTA   GGTGAAGATC
  1651   CTTTTTGATA   ATCTCATGAC   CAAAATCCCT   TAACGTGAGT   TTTCGTTCCA
  1701   CTGAGCGTCA   GACCCCGTAG   AAAAGATCAA   AGGATCTTCT   TGAGATCCTT
  1751   TTTTTCTGCG   CGTAATCTGC   TGCTTGCAAA   CAAAAAAACC   ACCGCTACCA
  1801   GCGGTGGTTT   GTTTGCCGGA   TCAAGAGCTA   CCAACTCTTT   TTCCGAAGGT
  1851   AACTGGCTTC   AGCAGAGCGC   AGATACCAAA   TACTGTCCTT   CTAGTGTAGC
  1901   CGTAGTTAGG   CCACCACTTC   AAGAACTCTG   TAGCACCGCC   TACATACCTC
  1951   GCTCTGCTAA   TCCTGTTACC   AGTGGCTGCT   GCCAGTGGCG   ATAAGTCGTG
  2001   TCTTACCGGG   TTGGACTCAA   GACGATAGTT   ACCGGATAAG   GCGCAGCGGT
  2051   CGGGCTGAAC   GGGGGGTTCG   TGCACACAGC   CCAGCTTGGA   GCGAACGACC
  2101   TACACCGAAC   TGAGATACCT   ACAGCGTGAG   CTATGAGAAA   GCGCCACGCT
  2151   TCCCGAAGGG   AGAAAGGCGG   ACAGGTATCC   GGTAAGCGGC   AGGGTCGGAA
  2201   CAGGAGAGCG   CACGAGGGAG   CTTCCAGGGG   GAAACGCCTG   GTATCTTTAT
  2251   AGTCCTGTCG   GGTTTCGCCA   CCTCTGACTT   GAGCGTCGAT   TTTTGTGATG
  2301   CTCGTCAGGG   GGGCGGAGCC   TATGGAAAAA   CGCCAGCAAC   GCGGCCTTTT
  2351   TACGGTTCCT   GGCCTTTTGC   TGGCCTTTTG   CTCACATGGC   TCGACAGATC
  2401   CATGTTCTTT   CCTGCGTTAT   CCCCTGATTC   TGTGGATAAC   CGTATTACCG
  2451   CCTTTGAGTG   AGCTGATACC   GCTCGCCGCA   GCCGAACGAC   CGAGCGCAGC
  2501   GAGTCAGTGA   GCGAGGAAGC   GGAAGAGCGC   CTGATGCGGT   ATTTTCTCCT
  2551   TACGCATCTG   TGCGGTATTT   CACACCGCAT   ATGGTGCACT   CTCAGTACAA
  2601   TCTGCTCTGA   TGCCGCATAG   TTAAGCCAGA   GAAGTACCTA   TTCCGAAGTT
  2651   CCTATTCTCT   AGAAAGTATA   GGAACTTCTC   ATGTTCTTTC   CTGCGTTATC
  2701   CCCTGATTCT   GTGGATAACC   GTATTACCGC   CTTTGAGTGA   GCTGATACCG
  2751   CTCGCCGCAG   CCGAACGACC   GAGCGCAGCG   AGTCAGTGAG   CGAGGAAGCG
  2801   GAAGAGCGCC   TGATGCGGTA   TTTTCTCCTT   ACGCATCTGT   GCGGTATTTC
  2851   ACACCGCATA   TGGTGCACTC   TCAGTACAAT   CTGCTCTGAT   GCCGCATAGT
  2901   TAAGCCAGCT   AGAGGATCAT   AATCAGCCAT   ACCACATTTG   TAGAGGTTTT
  2951   ACTTGCTTTA   AAAAACCTCC   CACACCTCCC   CCTGAACCTG   AAACATAAAA
  3001   TGAATGCAAT   TGTTGTTGTT   AACTTGTTTA   TTGCAGCTTA   TAATGGTTAC
  3051   AAATAAAGCA   ATAGCATCAC   AAATTTCACA   AATAAAGCAT   TTTTTTCACT
  3101   GCATTCTAGT   TGTGGTTTGT   CCAAACTCAT   CAATGTATCT   TATCATGTCT
  3151   GGATCCCCAG   GAAGCTCCTC   TGTGTCCTCA   TAAACCCTAA   CCTCCTCTAC
  3201   TTGAGAGGAC   ATTCCAATCA   TAGGCTGCCC   ATCCACCCTC   TGTGTCCTCC
  3251   TGTTAATTAG   GTCACTTAAC   AAAAAGGAAA   TTGGGTAGGG   GTTTTTCACA
  3301   GACCGCTTTC   TAAGGGTAAT   TTTAAAATAT   CTGGGAAGTC   CCTTCCACTG
  3351   CTGTGTTCCA   GAAGTGTTGG   TAAACAGCCC   ACAAATGTCA   ACAGCAGAAA
  3401   CATACAAGCT   GTCAGCTTTG   CACAAGGGCC   CAACACCCTG   CTCATCAAGA
  3451   AGCACTGTGG   TTGCTGTGTT   AGTAATGTGC   AAAACAGGAG   GCACATTTTC
  3501   CCCACCTGTG   TAGGTTCCAA   AATATCTAGT   GTTTTCATTT   TTACTTGGAT
  3551   CAGGAACCCA   GCACTCCACT   GGATAAGCAT   TATCCTTATC   CAAAACAGCC
  3601   TTGTGGTCAG   TGTTCATCTG   CTGACTGTCA   ACTGTAGCAT   TTTTTGGGGT
  3651   TACAGTTTGA   GCAGGATATT   TGGTCCTGTA   GTTTGCTAAC   ACACCCTGCA
  3701   GCTCCAAAGG   TTCCCCACCA   ACAGCAAAAA   AATGAAAATT   TGACCCTTGA
  3751   ATGGGTTTTC   CAGCACCATT   TTCATGAGTT   TTTTGTGTCC   CTGAATGCAA
  3801   GTTTAACATA   GCAGTTACCC   CAATAACCTC   AGTTTTAACA   GTAACAGCTT
  3851   CCCACATCAA   AATATTTCCA   CAGGTTAAGT   CCTCATTTAA   ATTAGGCAAA
  3901   GGAATTCTTG   AAGACGAAAG   GGCCTCG TGA   TACGCCTATT   TTTATAGGTT
  3951   AATGTCATGA   TAATAATGGT   TTCTTAGACG   TCAGGTGGCA   CTTTTCGGGG
  4001   AAATGTGCGC   GGAACCCCTA   TTTGTTTATT   TTTCTAAA.TA   CATTCAAATA
  4051   TGTATCCGCT   CATGAGACAA   TAACCCTGAT   AAATGCTTCA   ATAATATTGA
  4101   AAAAGGAAGA   GTATGAGTAT   TCAACATTTC   CGTGTCGCCC   TTATTCCCTT
  4151   TTTTGCGGCA   TTTTGCCTTC   CTGTTTTTGC   TCACCCAGAA   ACGCTGGTGA
  4201   AAGTAAAAGA   TGCTGAAGAT   CAGTTGGGTG   CACGAGTGGG   TTACATCGAA
  4251   CTGGATCTCA   ACAGCGGTAA   GATCCTTGAG   AGTTTTCGCC   CCGAAGAACG
  4301   TTTTCCAATG   ATGAGCACTT   TTAAAGTTCT   GCTATGTGGC   GCGGTATTAT
  4351   CCCGTGTTGA   CGCCGGGCAA   GAGCAACTCG   GTCGCCGCAT   ACACTATTCT
  4401   CAGAATGACT   TGGTTGAGT
具有上面出现的序列的,从包含当与表达载体结合时能增加感兴趣的重组蛋白的表达的核酸片段的SEQ ID NO:1序列中分离出来的核酸分子具有下列特征(位置是根据序列上的核酸的编码给出的,所述编码系统已经在前面详述过):
-从位置1到位置1024:基因组序列;
-从位置2631到位置2678:Frt位点;
-从位置1025到位置4419:在删除后目标载体留在原处的序列。
对应于当与表达载体结合时能够增强感兴趣的重组蛋白表达的核酸片段的核酸序列如下(SEQ ID NO:4):
  1   TGGAAACAGA   AACTAAATAG   AGACATAGAG   AAAATGAACA   GAAGTTATGA
  51   ACCAAATGGA   TTTAACCGGT   ATTTATACAA   CATTTCATCT   TAAAACAAAA
  101   GAATATACCT   TCTTCTCAGC   ACCTCATAGC   CTCTTCTACN   AAACCATATA
  151   GTCGGTCACN   AAACAAGCCT   CAACAGATAC   AAGAAGATAA   AAATAATCCC
  201   ATGCATACTA   TCAGATCACC   ATGGACTAAC   TCTGGTCTTC   AATAACAACA
  251   AAAACAATGG   AAGTCGAAGA   ACACTCTATT   CAATGATAAC   TTGGTCAAGG
  301   AAGAGATGAA   AAAGGAAATT   AAAGCCTTTT   TAGAATTTCA   TGAAAATGAA
  351   GGCACAACAT   ACCCAAACTT   ATGAGACACA   AGGAAAGCAG   TGCTAAGAGG
  401   AAAACTCATA   GCTCTGAGTG   CCTCCAAAAA   GAAACAAGAG   AGAGTGTATA
  451   CTAGCAGCTT   GAGAGCACAC   CTGAAAGCTC   TAGAACAAAA   AGAAGCAAAT
  501   ACACCCAAGA   GGAGAAGATC   AAATGCAGGG   CTGAAATCAA   CCAAGTAGAA
  551   ACAAAAGAAC   TGTAAAAAGA   ACCAACAAAA   CCAGGAGTTG   GTTGGTTGAG
  601   AAAATCAAAA   AGATAAATAA   ACCCTTAATC   AGAATAACCA   GAGGGCACAG
  651   AAACAGTATC   CAAATTAACA   AAATAAGAAA   TGGAAAGGGA   GACGTAAAAC
  701   AGAATCCGAG   GAAATAAAAA   AAAATTGATC   CTATTACAAA   AGTCTATATT
  751   CAACAAAGCT   GGAAAATCTG   GATGAAATAG   ACAATTTTCT   AGATAGATAC
  801   CAGATACCAA   AGTTAAATCA   GGACCAGATA   AATCATCTAA   ACAGTCCCAT
  851   AACTCCTAAA   GAAATAGAAG   CAGTTATTAA   AATTCTCCCG   ACCAAAAAAA
  901   AAAAAAAAAA   AAAGCCCAGG   ATTGGATGGG   TTTAGTGGAG   AATTCTATCA
  951   GACCTTCATC   AAAGACCTAA   TACCAATACT   GTCCAAACTA   TTCCTTGCAA
  1001   CACTGAATAT   TCCGCATACA   CTAT
本发明的另一目标是关于含有SEQ ID NO:1核酸序列的载体。
本发明的另一目标是在其基因组内携带整合到其高转录活性区域的唯一的重组酶识别位点的细胞株,所述细胞株已经在重组酶识别位点整合了转基因的单独拷贝,所述细胞长时间内稳定并且有可能用本发明的方法生产。
这样的细胞株携带有两条在重组酶识别位点一前一后的序列,一条编码感兴趣的蛋白,一条赋予抗生素抗性的基因,定位于紧邻重组酶识别位点的上游和下游,抗生素抗性基因的多腺苷酸序列紧邻抗生素识别位点的下游。
有利地,该细胞株在基因扩增之前具有所述转基因的产率在5到50pcd之间(皮克蛋白每个细胞每24小时)。
有利地,该细胞株以稳定的方式表达所述转基因至少持续三个月。
本发明的另一目标是关于感兴趣蛋白的生产过程,其中本发明的表达感兴趣蛋白的细胞株以所述感兴趣蛋白被表达并能被收获的方式培养。
本发明的另一目标是用于将感兴趣的DNA分子插入哺乳动物细胞的基因组中的载体(“目标载体”),其携带两个位于报道基因任意一边的重组酶识别位点,编码感兴趣蛋白的基因,允许基因扩增的选择子基因以及赋予抗生素抗性的基因,以及在第二重组酶识别位点下游的多腺苷酸序列。有利地,抗生素抗性基因的多腺苷酸序列是弱多A,其导致在筛选后更高的产率。
有利地,该载体在两个重组酶识别位点之间携带编码I型单纯疱疹病毒胸苷激酶(HSV1-TK)的基因。
本发明的另一目标涉及一用于将感兴趣的DNA分子插入哺乳动物细胞的基因组的目标位点的载体系统,至少包括下列要素:
-如前所述的目标载体,
-表达载体,其在编码所感兴趣蛋白的基因的下游携带重组酶识别位点,以及赋予抗生素抗性的基因,重组酶识别位点直接位于赋予抗生素抗性的基因的上游。
本发明的另一目标是关于以一种方法使用上述载体系统来将感兴趣的DNA分子插入哺乳动物细胞基因组的目标位点,包括以下步骤:
-用所述目标载体转染哺乳动物细胞;
-选择“高产率”细胞,其中已整合了目标载体的单个拷贝;
-使用重组酶切除目标载体;
-选择目标载体已被切除且具有完整识别位点的细胞;
-用所述表达载体转染步骤4)中选择的细胞;
-使用重组酶将表达载体整合到完整的识别位点;
-通过对所感兴趣蛋白表达的测试选择携带整合到目标位点的表达载体的细胞。有利地,为了阻止随机整合,选择将在高浓度抗生素存在的情况下进行。
本发明的其他方面和优势将在下面的示例中进行描述,展示这些示例是出于解释的目的,而不应被认为限制本发明的范围。
具体实施方式
示例1:用于产生在其高转录活性区域整合了唯一的重组酶识别位点的细胞株的载体的构建
a.目标载体pTV1(见图1):
-转录单元:目标载体pTV1通过下列转录单元构建(SEQ ID NO:2)(图1):
1-maxFP-Green转录单元(荧光报道基因),包含(按顺序)最小CMV启动子(前人巨噬细胞基因的启动子而不带有活性部分或增强子),编码maxFPTM-Green蛋白(Evrogen)的基因和后SV40(猿猴病毒40)多腺苷酸序列(多A)
2-抗-D抗体的重链的转录单元,按这样的次序:RSV启动子(劳氏肉瘤病毒的长终端重复),源于pCi-néo载体的人工内含子,抗-D免疫球蛋白的重链序列以及bGH(牛生长激素)多A序列,
3-含有除免疫球蛋白轻链序列外与抗体重链转录单元相同成分的抗-D抗体的轻链转录单元以及bGH多A序列。
4-包含SV40启动子的新转录单元,新霉素抗性基因和具有“弱”多A活性的SV40前多腺苷酸信号的序列,
5-含有SV40启动子的DHFR(二氢叶酸还原酶)转录单元,为了废除ScaI限制性位点(其变异在基因产物中是沉默的)和其多A位点,用定向变异修饰DHFR选择子基因,
6-含有SV40启动子的HSV1-TK转录单元,编码1型单纯疱疹病毒胸苷激酶(HSV1-TK)的自杀基因和“SV40前多A”序列。
-Frt重组位点的合成:
Frt重组位点通过PCR使用下列引物合成:
上游引物(SEQ ID NO:5):
5′-ACAGCTGTCGACTGAAGTACCTATTCCGAAGTTCCTATTCTCTAGAAAGT-3′
下游引物(SEQ ID NO:6):
5′-CGTCCGGATATCTAAGATCTGAAGTTCCTATACTTTCTAGAGAATAGGAA-3′
产生的PCR产物包含Frt位点(用粗体斜体表示)以及限制性位点(下划线表示),允许随后在目标载体pTV1中克隆pTV1(SEQ ID NO:7):
AGACGTCTCGACT
Figure A20078004730000241
SalI                      Frt site
AGATCTTAGATATCCGGACG
BglII EcoRV
第一Frt位点(Frt1)在pTV1载体的maxFP-Green转录单元上游被克隆。第二Frt位点(Frt2)与Frt1同样道理在HSV1-TK基因和其多腺苷酸位点“SV40前多A”之间被克隆。目标载体pTV1相应的核酸序列如下(SEQ ID NO:2):
  1   GAAGTACCTA   TTCCGAAGTT   CCTATTCTCT   AGAAAGTATA   GGAACTTCTA
  51   CAGAGATCCG   CCCGCCCCGT   TGACGCAAAT   GGGCGGTAGG   CGTGTACGGT
  101   GGGAGGTCTA   TATAAGCAGA   GCTCGTTTAG   TGAACCGTCA   GATCACTAGA
  151   AGCTTTATTG   CGGTAGTTTA   TCACAGTTAA   ATTGCTAACG   CAGTCAGTGC
  201   TTCTGACACA   ACAGTCTCGA   ACTTAAGCTG   CAGTGACTCT   CTTAAGGTAG
  251   CCTTGCAGAA   GTTGGTCGTG   AGGCACTGGG   CAGGTAAGTA   TCAAGGTTAC
  301   AAGACAGGTT   TAAGGAGACC   AATAGAAACT   GGGCTTGTCG   AGACAGAGAA
  351   GACTCTTGCG   TTTCTGATAG   GCACCTATTG   GTCTTACTG A   CATCCACTTT
  401   GCCTTTCTCT   CCACAGGTGT   CCACTCCCAG   TTCAATTACA   GCTCTTAAGG
  451   CTAGAGTGGG   ATCCACCGGT   CGCCACCATG   GAGAGCGACG   AGAGCGGCCT
  501   GCCCGCCATG   GAGATCGAGT   GCCGCATCAC   CGGCACCCTG   AACGGCGTGG
  551   AGTTCGAGCT   GGTGGGCGGC   GGAGAGGGCA   CCCCCGAGCA   GGGCCGCATG
  601   ACCAACAAGA   TGAAGAGCAC   CAAAGGCGCC   CTGACCTTCA   GCCCCTACCT
  651   GCTGAGCCAC   GTGATGGGCT   ACGGCTTCTA   CCACTTCGGC   ACCTACCCCA
  701   GCGGCTACGA   GAACCCCTTC   CTGCACGCCA   TCAACAACGG   CGGCTACACC
  751   AACACCCGCA   TCGAGAAGTA   CGAGGACGGC   GGCGTGCTGC   ACGTGAGCTT
  801   CAGCTACCGC   TACGAGGCCG   GCCGCGTGAT   CGGCGACTTC   AAGGTGATGG
  851   GCACCGGCTT   CCCCGAGGAC   AGCGTGATCT   TCACCGACAA   GATCATCCGC
  901   AGCAACGCCA   CCGTGGAGCA   CCTGCACCCC   ATGGGCGATA   ACGATCTGGA
  951   TGGCAGCTTC   ACCCGCACCT   TCAGCCTGCG   CGACGGCGGC   TACTACAGCT
  1001   CCGTGGTGGA   CAGCCACATG   CACTTCAAGA   GCGCCATCCA   CCCCAGCATC
  1051   CTGCAGAACG   GGGGCCCCAT   GTTCGCCTTC   CGCCGCGTGG   AGGAGGATCA
  1101   CAGCAACACC   GAGCTGGGCA   TCGTGGAGTA   CCAGCACGCC   TTCAAGACCC
  1151   CGGATGCAGA   TGCCGGTGAA   GAATAAAGCG   GCCTAGGGAT   AACAGGGTAA
  1201   TGGCCGCGAC   TCTAGATCAT   AATCAGCCAT   ACCACATTTG   TAGAGGTTTT
  1251   ACTTGCTTTA   AAAAACCTCC   CACACCTCCC   CCTGAACCTG   AAACATAAAA
  1301   TGAATGCAAT   TGTTGTTGTT   AACTTGTTTA   TTGCAGCTTA   TAATGGTTAC
  1351   AAATAAAGCA   ATAGCATCAC   AAATTTCACA   AATAAAGCAT   TTTTTTCACT
  1401   GCATTCTAGT   TGTGGTTTGT   CCAAACTCAT   CAATGTATCT   TAAGGCGTAA
  1451   ATTGTAAGCG   TTAATATTTT   GTTAAAATTC   GCGTTAAATT   TTTGTTAAAT
  1501   CAGCTCATTT   TTTAACCAAT   AGGCCGAAAT   CGGCAAAATC   CCTTATAAAT
  1551   CAAAAGAATA   GACCGAGATA   GGGTTGAGTG   TTGTTCCAGT   TTGGAACAAG
  1601   AGTCCACTAT   TAAAGAACGT   GGACTCCAAC   GTCAAAGGGC   GAAAAACCGT
  1651   CTATCAGGGC   GATGGCCCAC   GATCTTAGAT   ATCCGGACGT   GGATCTCCCG
  1701   ATCCCCTATG   GTGCACTCTC   AGTACAATCT   GCTCTGATGC   CGCATAGTTA
  1751   AGCCAGTATC   TGCTCCCTGC   TTGTGTGTTG   GAGGTCGCTG   AGTAGTGCGC
  1801   GAGCAAAATT   TAAGCTACAA   CAAGGCAAGG   CTTGACCGAC   AATTGCATGA
  1851   AGAATCTGCT   TAGGGTTAGG   CGTTTTGCGC   TGCTTCGCGA   TGTACGGGCC
  1901   AGATATACGC   GTATCTGAGG   GGACTAGGGT   GTGTTTAGGC   GAAAAGCGGG
  1951   GCTTCGGTTG   TACGCGGTTA   GGAGTCCCCT   CAGGATATAG   TAGTTTCGCT
  2001   TTTGCATAGG   GAGGGGGAAA   TGTAGTCTTA   TGCAATACTC   TTGTAGTCTT
  2051   GCAACATGGT   AACGATGAGT   TAGCAACATG   CCTTACAAGG   AGAGAAAAAG
  2101   CACCGTGCAT   GCCGATTGGT   GGAAGTAAGG   TGGTACGATC   GTGCCTTATT
  2151   AGGAAGGCAA   CAGACGGGTC   TGACATGGAT   TGGACGAACC   ACTGAATTCC
  2201   GCATTGCAGA   GATATTGTAT   TTAAGTGCCT   AGCTCGATAC   AATAAACGCC
  2251   ATTTGACCAT   TCACCACATT   GGTGTGCACC   TCCAAGCTTG   GTACCGAGCT
  2301   CGGATCCACT   AGTGCAGAAG   TTGGTCGTGA   GGCACTGGGC   AGGTAAGTAT
  2351   CAAGGTTACA   AGACAGGTTT   AAGGAGACCA   ATAGAAACTG   GGCTTGTCGA
  2401   GACAGAGAAG   ACTCTTGCGT   TTCTGATAGG   CACCTATTGG   TCTTACTGAC
  2451   ATCCACTTTG   CCTTTCTCTC   CACAGGTGTC   CACTCCCAGT   TCAATTACAG
  2501   CTCTTGCTAG   TGCCGCCACC   ATGGAGTTTG   GGCTGAGCTG   GGTTTTCCTC
  2551   GTTGCTCTTT   TAAGAGGTGT   CCAGTGTCAG   GTGCAGCTGG   TGGAGTCTGG
  2601   GGGAGGCGTG   GTCCAGCCTG   GGAGGTCCCT   GAGACTCTCC   TGTACAGCCT
  2651   CTGGATTCAC   CTTCAAAAAC   TATGCTATGC   ATTGGGTCCG   CCAGGCTCCA
  2701   GCCAAGGGGC   TGGAGTGGGT   GGCAACTATA   TCATATGATG   GAACGAATAT
  2751   ACAATATGCA   GACTCCGTGA   AGGGCCGATT   CACCTTCTCC   AGAGACAATT
  2801   CTCAGGACAC   CCTGTATCTG   CAACTGAACA   GCCTCAGACC   GGAGGACACG
  2851   GCTGTGTATT   ACTGTGCGAG   ACCCGTAAGA   AGCCGATGGC   TGCAATTAGG
  2901   TCTTGAAGAT   GCTTTTCATA   TCTGGGGCCA   GGGGACAATG   GTCACCGTCT
  2951   CTTCAGCCTC   CACCAAGGGC   CCATCGGTCT   TCCCCCTGGC   ACCCTCCTCC
  3001   AAGAGCACCT   CTGGGGGCAC   AGCGGCCCTG   GGCTGCCTGG   TCAAGGACTA
  3051   CTTCCCCGAA   CCGGTGACGG   TGTCGTGGAA   CTCAGGCGCC   CTGACCAGCG
  3101   GCGTGCACAC   CTTCCCGGCT   GTCCTACAGT   CCTCAGGACT   CTACTCCCTC
  3151   AGCAGCGTGG   TGACCGTGCC   CTCCAGCAGC   TTGGGCACCC   AGACCTACAT
  3201   CTGCAACGTG   AATCACAAGC   CCAGCAACAC   CAAGGTGGAC   AAGAAAGTTG
  3251   AGCCCAAATC   TTGTGACAAA   ACTCACACAT   GCCCACCGTG   CCCAGCACCT
  3301   GAACTCCTGG   GGGG ACCGTC   AGTCTTCCTC   TTCCCCCCAA   AACCCAAGGA
  3351   CACCCTCATG   ATCTCCCGGA   CCCCTGAGGT   CACATGCGTG   GTGGTGGACG
  3401   TGAGCCACGA   AGACCCTGAG   GTCAAGTTCA   ACTGGTACGT   GGACGGCGTG
  3451   GAGGTGCATA   ATGCCAAGAC   AAAGCCGCGG   GAGGAGCAGT   ACAACAGCAC
  3501   GTACCGTGTG   GTCAGCGTCC   TCACCGTCCT   GCACCAGGAC   TGGCTGAATG
  3551   GCAAGGAGTA   CAAGTGCAAG   GTCTCCAACA   AAGCCCTCCC   AGCCCCCATC
  3601   GAGAAAACCA   TCTCCAAAGC   CAAAGGGCAG   CCCCGAGAAC   CACAGGTGTA
  3651   CACCCTGCCC   CCATCCCGGG   ATGAGCTGAC   CAAGAACCAG   GTCAGCCTGA
  3701   CCTGCCTGGT   CAAAGGCTTC   TATCCCAGCG   ACATCGCCGT   GGAGTGGGAG
  3751   AGCAATGGGC   AGCCGGAGAA   CAACTACAAG   ACCACGCCTC   CCGTGCTGGA
  3801   CTCCGACGGC   TCCTTCTTCC   TCTACAGCAA   GCTCACCGTG   GACAAGAGCA
  3851   GGTGGCAGCA   GGGGAACGTC   TTCTCATGCT   CCGTGATGCA   TGAGGCTCTG
  3901   CACAACCACT   ACACGCAGAA   GAGCCTCTCC   CTGTCTCCGG   GTAAATGATA
  3951   GTCTAGAGCT   CGCTGATCAG   CCTCGACTGT   GCCTTCTAGT   TGCCAGCCAT
  4001   CTGTTGTTTG   CCCCTCCCCC   GTGCCTTCCT   TGACCCTGGA   AGGTGCCACT
  4051   CCCACTGTCC   TTTCCTAATA   AAATGAGGAA   ATTGCATCGC   ATTGTCTGAG
  4101   TAGGTGTCAT   TCTATTCTGG   GGGGTGGGGT   GGGGCAGGAC   AGCAAGGGGG
  4151   AGGATTGGGA   AGACAATAGC   AGGCATGCTG   GGGATGCGGT   GGGCTCTATG
  4201   GCTTCTGAGG   CGGAAAGAAC   CAGCTGGGGC   TCGAGATCTC   CCGATCCCCT
  4251   ATGGTGCACT   CTCAGTACAA   TCTGCTCTGA   TGCCGCATAG   TTAAGCCAGT
  4301   ATCTGCTCCC   TGCTTGTGTG   TTGGAGGTCG   CTGAGTAGTG   CGCGAGCAAA
  4351   ATTTAAGCTA   CAACAAGGCA   AGGCTTGACC   GACAATTGCA   TGAAGAATCT
  4401   GCTTAGGGTT   AGGCGTTTTG   CGCTGCTTCG   CGATGTACGG   GCCAGATATA
  4451   CGCGTATCTG   AGGGGACTAG   GGTGTGTTTA   GGCGAAAAGC   GGGGCTTCGG
  4501   TTGTACGCGG   TTAGGAGTCC   CCTCAGGATA   TAGTAGTTTC   GCTTTTGCAT
  4551   AGGGAGGGGG   AAATGTAGTC   TTATGCAATA   CTCTTGTAGT   CTTGCAACAT
  4601   GGTAACGATG   AGTTAGCAAC   ATGCCTTACA   AGGAGAGAAA   AAGCACCGTG
  4651   CATGCCGATT   GGTGGAAGTA   AGGTGGTACG   ATCGTGCCTT   ATTAGGAAGG
  4701   CAACAGACGG   GTCTGACATG   GATTGGACGA   ACCACTGAAT   TCCGCATTGC
  4751   AGAGATATTG   TATTTAAGTG   CCTAGCTCGA   TACAATAAAC   GCCATTTGAC
  4801   CATTCACCAC   ATTGGTGTGC   ACCTCCAAGC   TTGGTACCGA   GCTCGGATCC
  4851   ACTAGTGCAG   AAGTTGGTCG   TGAGGCACTG   GGCAGGTAAG   TATCAAGGTT
  4901   ACAAGACAGG   TTTAAGGAGA   CCAATAGAAA   CTGGGCTTGT   CGAGACAGAG
  4951   AAGACTCTTG   CGTTTCTGAT   AGGCACCTAT   TGGTCTTACT   GACATCCACT
  5001   TTGCCTTTCT   CTCCACAGGT   GTCCACTCCC   AGTTCAATTA   CAGCTCTTGC
  5051   TAGTGCCGCC   ACCATGAGGG   TCCCCGCTCA   GCTCCTGGGG   CTCCTGCTGC
  5101   TCTGGCTCCC   AGGTGCCAGA   TGTGCCATCC   GGATGACCCA   GTCTCCATCC
  5151   TCATTCTCTG   CATCTACAGG   AGACAGAGTC   ACCATCACTT   GTCGGGCGAG
  5201   CCAGGATATT   CGGAACTATG   TAGCCTGGTA   TCAGCAAAAA   TCAGGGAAAG
  5251   CCCCTAAATT   CCTGATCTAT   GCTGCTTCCA   CTTTGCAAAG   TGGGGTCCCA
  5301   TCAAGGTTCA   GCGGCAGTGG   ATCTGGGACA   GATTTCACTC   TCACCATCAA
  5351   CTCCCTGCAG   TCTGAAGATT   TTGCAACTTA   TTACTGTCAA   CAATATTACA
  5401   ATTCTCCTCC   GACCTTCGGC   CAAGGGACCA   GGGTGGAAAT   CACGCGAACT
  5451   GTGGCTGCAC   CATCTGTCTT   CATCTTCCCG   CCATCTGATG   AGCAGTTGAA
  5501   ATCTGGAACT   GCCTCTGTTG   TGTGCCTGCT   GAATAACTTC   TATCCCAGAG
  5551   AGGCCAAAGT   ACAGTGGAAG   GTGGATAACG   CCCTCCAATC   GGGTAACTCC
  5601   CAGGAGAGTG   TCACAGAGCA   GGACAGCAAG   GACAGCACCT   ACAGCCTCAG
  5651   CAGCACCCTG   ACGCTGAGCA   AAGCAGACTA   CGAGAAACAC   AAAGTCTACG
  5701   CCTGCGAAGT   CACCCATCAG   GGCCTGAGCT   CGCCCGTCAC   AAAGAGCTTC
  5751   AACAGGGGAG   AGTGTTGATA   GTCTAGAGCT   CGCTGATCAG   CCTCGACTGT
  5801   GCCTTCTAGT   TGCCAGCCAT   CTGTTGTTTG   CCCCTCCCCC   GTGCCTTCCT
  5851   TGACCCTGGA   AGGTGCCACT   CCCACTGTCC   TTTCCTAATA   AAATGAGGAA
  5901   ATTGCATCGC   ATTGTCTGAG   TAGGTGTCAT   TCTATTCTGG   GGGGTGGGGT
  5951   GGGGCAGGAC   AGCAAGGGGG   AGGATTGGGA   AGACAATAGC   AGGCATGCTG
  6001   GGGATGCGGT   GGGCTCTATG   GCTTCTGAGG   CGGAAAGAAC   CAGTCGAGGG
  6051   GGGATCCCCA   CGCGCCCTGT   AGCGGCGCAT   TAAGCGCGGC   GGGTGTGGTG
  6101   GTTACGCGCA   GCGTGACCGC   TACACTTGCC   AGCGCCCTAG   CGCCCGCTCC
  6151   TTTCGCTTTC   TTCCCTTCCT   TTCTCGCCAC   GTTCGCCGGC   TTTCCCCGTC
  6201   AAGCTCTAAA   TCGGGGCATC   CCTTTAGGGT   TCCGATTTAG   TGCTTTACGG
  6251   CACCTCGACC   CCAAAAAACT   TGATTAGGGT   GATGGTTCAC   GTATAGGGAT
  6301   AACAGGGTAA   TGTAGTGGGC   CATCGCCCTG   ATAGACGGTT   TTTCGCCCTT
  6351   TGACGTTGGA   GTCCACGTTC   TTTAATAGTG   GACTCTTGTT   CCAAACTGGA
  6401   ACAACACTCA   ACCCTATCTC   GGTCTATTCT   TTTGATTTAT   AAGGGATTTT
  6451   GGGGATTTCG   GCCTATTGGT   TAAAAAATGA   GCTGATTTAA   CAAAAATTTA
  6501   ACGCGAATTT   TAACAAAATA   TTAACGTTTA   CAATTTAAAT   ATTTGCTTAT
  6551   ACAATCTTCC   TGTTTTTGGG   GCTTTTCTGA   TTATCAACCG   GGGTGGGTAC
  6601   CGAGCTCGAA   TTCTGTGGAA   TGTGTGTCAG   TTAGGGTGTG   GAAAGTCCCC
  6651   AGGCTCCCCA   GGCAGGCAGA   AGTATGCAAA   GCATGCATCT   CAATTAGTCA
  6701   GCAACCAGGT   GTGGAAAGTC   CCCAGGCTCC   CCAGCAGGCA   GAAGTATGCA
  6751   AAGCATGCAT   CTCAATTAGT   CAGCAACCAT   AGTCCCGCCC   CTAACTCCGC
  6801   CCATCCCGCC   CCTAACTCCG   CCCAGTTCCG   CCCATTCTCC   GCCCCATGGC
  6851   TGACTAATTT   TTTTTATTTA   TGCAGAGGCC   GAGGCCGCCT   CGGCCTCTGA
  6901   GCTATTCCAG   AAGTAGTGAG   GAGGCTTTTT   TGGAGGCCTA   GGCTTTTGCA
  6951   AAAAGCTCCC   GGGAGCTTGG   ATATCCATTT   TCGGATCTGA   TCAAGAGACA
  7001   GGATGAGGAT   CGTTTCGCAT   GATTGAACAA   GATGGATTGC   ACGCAGGTTC
  7051   TCCGGCCGCT   TGGGTGGAGA   GGCTATTCGG   CTATGACTGG   GCACAACAGA
  7101   CAATCGGCTG   CTCTGATGCC   GCCGTGTTCC   GGCTGTCAGC   GCAGGGGCGC
  7151   CCGGTTCTTT   TTGTCAAGAC   CGACCTGTCC   GGTGCCCTGA   ATGAACTGCA
  7201   GGACGAGGCA   GCGCGGCTAT   CGTGGCTGGC   CACGACGGGC   GTTCCTTGCG
  7251   CAGCTGTGCT   CGACGTTGTC   ACTGAAGCGG   GAAGGGACTG   GCTGCTATTG
  7301   GGCGAAGTGC   CGGGGCAGGA   TCTCCTGTCA   TCTCACCTTG   CTCCTGCCGA
  7351   GAAAGTATCC   ATCATGGCTG   ATGCAATGCG   GCGGCTGCAT   ACGCTTGATC
  7401   CGGCTACCTG   CCCATTCGAC   CACCAAGCGA   AACATCGCAT   CGAGCGAGCA
  7451   CGTACTCGGA   TGGAAGCCGG   TCTTGTCGAT   CAGGATGATC   TGGACGAAGA
  7501   GCATCAGGGG   CTCGCGCCAG   CCGAACTGTT   CGCCAGGCTC   AAGGCGCGCA
  7551   TGCCCGACGG   CGAGGATCTC   GTCGTGACCC   ATGGCGATGC   CTGCTTGCCG
  7601   AATATCATGG   TGGAAAATGG   CCGCTTTTCT   GGATTCATCG   ACTGTGGCCG
  7651   GCTGGGTGTG   GCGGACCGCT   ATCAGGACAT   AGCG TTGGCT   ACCCGTGATA
  7701   TTGCTGAAGA   GCTTGGCGGC   GAATGGGCTG   ACCGCTTCCT   CGTGCTTTAC
  7751   GGTATCGCCG   CTCCCGATTC   GCAGCGCATC   GCCTTCTATC   GCCTTCTTGA
  7801   CGAGTTCTTC   TGAGCGGGAC   TCTGGGGTTC   GAAATGACCG   ACCAAGCGAC
  7851   GCCCAACCTG   CCATCACGAG   ATTTCGATTC   CACCGCCGCC   TTCTATGAAA
  7901   GGTTGGGCTT   CGGAATCGTT   TTCCGGGACG   CCGGCTGGAT   GATCCTCCAG
  7951   CGCGGGGATC   TCATGCTGGA   GTTCTTCGCC   CACCCCAACT   TGTTTATTGC
  8001   AGCTTATAAT   GGTTACAAAT   AAAGCAATAG   CATCACAAAT   TTCACAAATA
  8051   AAGCATTTTT   TTCACTGCAT   TCTAGTTGTG   GTTTGTCCAA   ACTCATCAAT
  8101   GTATCTTATC   ATGTCTGGAT   CCCGTCGAGT   TTAAACGATT   TAAATACTGG
  8151   GGCTCGACTG   TGGAATGTGT   GTCAGTTAGG   GTGTGGAAAG   TCCCCAGGCT
  8201   CCCCAGCAGG   CAGAAGTATG   CAAAGCATGC   ATCTCAATTA   GTCAGCAACC
  8251   AGGTGTGGAA   AGTCCCCAGG   CTCCCCAGCA   GGCAGAAGTA   TGCAAAGCAT
  8301   GCATCTCAAT   TAGTCAGCAA   CCATAGTCCC   GCCCCTAACT   CCGCCCATCC
  8351   CGCCCCTAAC   TCCGCCCAGT   TCCGCCCATT   CTCCGCCCCA   TGGCTGACTA
  8401   ATTTTTTTTA   TTTATGCAGA   GGCCGAGGCC   GCCTCGGCCT   CTGAGCTATT
  8451   CCAGAAGTAG   TGAGGAGGCT   TTTTTGGAGG   CCTAGGCTTT   TGCAAAAAGC
  8501   TTGGGGGGGG   GGACAGCTCA   GGGCTGCGAT   TTCGCGCCAA   ACTTGACGGC
  8551   AATCCTAGCG   TGAAGGCTGG   TAGGATTTTA   TCCCCGCTGC   CATCATGGTT
  8601   CGACCATTGA   ACTGCATCGT   CGCCGTGTCC   CAAAATATGG   GGATTGGCAA
  8651   GAACGGAGAC   CTACCCTGGC   CTCCGCTCAG   GAACGAGTTC   AAGTATTTCC
  8701   AAAGAATGAC   CACAACCTCT   TCAGTGGAAG   GTAAACAGAA   TCTGGTGATT
  8751   ATGGGTAGGA   AAACCTGGTT   CTCCATTCCT   GAGAAGAATC   GACCTTTAAA
  8801   GGACAGAATT   AATATAGTTC   TCAGTAGAGA   ACTCAAAGAA   CCACCACGAG
  8851   GAGCTCATTT   TCTTGCCAAA   AGTTTGGATG   ATGCCTTAAG   ACTTATTGAA
  8901   CAACCGGAAT   TGGCAAGTAA   AGTAGACATG   GTTTGGATAG   TCGGAGGCAG
  8951   TTCTGTTTAC   CAGGAAGCCA   TGAATCAACC   AGGCCACCTC   AGACTCTTTG
  9001   TGACAAGGAT   CATGCAGGAA   TTTGAAAGTG   ACACGTTTTT   CCCAGAAATT
  9051   GATTTGGGGA   AATATAAACT   TCTCCCAGAA   TACCCAGGCG   TCCTCTCTGA
  9101   GGTCCAGGAG   GAAAAAGGCA   TCAAGTATAA   GTTTGAAGTC   TACGAGAAGA
  9151   AAGACTAACA   GGAAGATGCT   TTCAAGTTCT   CTGCTCCCCT   CCTAAAGCTA
  9201   TGCATTTTTA   TAAGACCATG   GGACTTTTGC   TGGCTTTAGA   TCGATCTTTG
  9251   TG AAGGAACC   TTACTTCTGT   GGTGTGACAT   AATTGGACAA   ACTACCTACA
  9301   GAGATTTAAA   GCTCTAAGGT   AAATATAAAA   TTTTTAAGTG   TATAATGTGT
  9351   TAAACTACTG   ATTCTAATTG   TTTGTGTATT   TTAGATTCCA   ACCTATGGAA
  9401   CTGATGAATG   GGAGCAGTGG   TGGAATGCCT   TTAATGAGGA   AAACCTGTTT
  9451   TGCTCAGAAG   AAATGCCATC   TAGTGATGAT   GAGGCTACTG   CTGACTCTCA
  9501   ACATTCTACT   CCTCCAAAAA   AGAAGAGAAA   GGTAGAAGAC   CCCAAGGACT
  9551   TTCCTTCAGA   ATTGCTAAGT   TTTTTGAGTC   ATGCTGTGTT   TAGTAATAGA
  9601   ACTCTTGCTT   GCTTTGCTAT   TTACACCACA   AAGGAAAAAG   CTGCACTGCT
  9651   ATACAAGAAA   ATTATGGAAA   AATATTCTGT   AACCTTTATA   AGTAGGCATA
  9701   ACAGTTATAA   TCATAACATA   CTGTTTTTTC   TTACTCCACA   CAGGCATAGA
  9751   GTGTCTGCTA   TTAATAACTA   TGCTCAAAAA   TTGTGTACCT   TTAGCTTTTT
  9801   AATTTGTAAA   GGGGTTAATA   AGGAATATTT   GATGTATAGT   GCCTTGACTA
  9851   GAGATCATAA   TCAGCCATAC   CACATTTGTA   GAGGTTTTAC   TTGCTTTAAA
  9901   AAACCTCCCA   CACCTCCCCC   TGAACCTGAA   ACATAAAATG   AATGCAATTG
  9951   TTGTTGTTAA   CTTGTTTATT   GCAGCTTATA   ATGGTTACAA   ATAAAGCAAT
  10001   AGCATCACAA   ATTTCACAAA   TAAAGCATTT   TTTTCACTGC   ATTCTAGTTG
  10051   TGGTTTGTCG   ACGCGGCCGC   TGTGGAATGT   GTGTCAGTTA   GGGTGTGGAA
  10101   AGTCCCCAGG   CTCCCCAGCA   GGCAGAAGTA   TGCAAAGCAT   GCATCTCAAT
  10151   TAGTCAGCAA   CCAGGTGTGG   AAAGTCCCCA   GGCTCCCCAG   CAGGCAGAAG
  10201   TATGCAAAGC   ATGCATCTCA   ATTAGTCAGC   AACCATAGTC   CCGCCCCTAA
  10251   CTCCGCCCAT   CCCGCCCCTA   GTTCCGCCCA   ACTCCGCCCA   TTCTCCGCCC
  10301   CATGGCTGAC   TAATTTTTTT   TATTTATGCA   GAGGCCGAGG   CCGCCTCGGC
  10351   CTCTGAGCTA   TTCCAGAAGT   AGTGAGGAGG   CTTTTTTGGA   GGCCTAGGCT
  10401   TTTGCAAAAA   GCTCTGAGAT   CACCGGCGAA   GGAGGGCCAC   CATGGCCTCG
  10451   TACCCCGGCC   ATCAACACGC   GTCTGCGTTC   GACCAGGCTG   CGCGTTCTCG
  10501   CGGCCATAGC   AACCGACGTA   CGGCGTTGCG   CCCTCGCCGG   CAGCAAGAAG
  10551   CCACGGAAGT   CCGCCCGGAG   CAGAAAATGC   CCACGCTACT   GCGGGTTTAT
  10601   ATAGACGGTC   CCCACGGGAT   GGGGAAAACC   ACCACCACGC   AACTGCTGGT
  10651   GGCCCTGGGT   TCGCGCGACG   ATATCGTCTA   CGTACCCGAG   CCGATGACTT
  10701   ACTGGCGGGT   GCTGGGGGCT   TCCGAGACAA   TCGCG AACAT   CTACACCACA
  10753   CAACACCGCC   TCGACCAGGG   TGAGATATCG   GCCGGGGACG   CGGCGGTGGT
  10801   AATGACAAGC   GCCCAGATAA   CAATGGGCAT   GCCTTATGCC   GTGACCGACG
  10851   CCGTTCTGGC   TCCTCATATC   GGGGGGGAGG   CTGGGAGCTC   ACATGCCCCG
  10901   CCCCCGGCCC   TCACCCTCAT   CTTCGACCGC   CATCCCATCG   CCGCCCTCCT
  10951   GTGCTACCCG   GCCGCGCGGT   ACCTTATGGG   CAGCATGACC   CCCCAGGCCG
  11001   TGCTGGCGTT   CGTGGCCCTC   ATCCCGCCGA   CCTTGCCCGG   CACCAACATC
  11051   GTGCTTGGGG   CCCTTCCGGA   GGACAGACAC   ATCGACCGCC   TGGCCAAACG
  11101   CCAGCGCCCC   GGCGAGCGGC   TGGACCTGGC   TATGCTGGCT   GCGATTCGCC
  11151   GCGTTTACGG   GCTACTTGCC   AATACGGTGC   GGTATCTGCA   GTGCGGCGGG
  11201   TCGTGGCGGG   AGGACTGGGG   ACAGCTTTCG   GGGACGGCCG   TGCCGCCCCA
  11251   GGGTGCCGAG   CCCCAGAGCA   ACGCGGGCCC   ACGACCCCAT   ATCGGGGACA
  11301   CGTTATTTAC   CCTGTTTCGG   GCCCCCGAGT   TGCTGGCCCC   CAACGGCGAC
  11351   CTGTATAACG   TGTTTGCCTG   GGCCTTGGAC   GTCTTGGCCA   AACGCCTCCG
  11401   TTCCATGCAC   GTCTTTATCC   TGGATTACGA   CCAATCGCCC   GCCGGCTGCC
  11451   GGGACGCCCT   GCTGCAACTT   ACCTCCGGGA   TGGTCCAGAC   CCACGTCACC
  11501   ACCCCCGGCT   CCATACCGAC   GATATGCGAC   CTGGCGCGCA   CGTTTGCCCG
  11551   GG AGATGGGG   GAGGCTAACT   GAGAATTTCG   ACTGAAGTAC   CTATTCCGAA
  11601   GTTCCTATTC   TCTAGAAAGT   ATAGGAACTT   CTCATGTTCT   TTCCTGCGTT
  11651   ATCCCCTGAT   TCTGTGGATA   ACCGTATTAC   CGCCTTTGAG   TGAGCTGATA
  11701   CCGCTCGCCG   CAGCCGAACG   ACCGAGCGCA   GCGAGTCAGT   GAGCGAGGAA
  11751   GCGGAAGAGC   GCCTGATGCG   GTATTTTCTC   CTTACGCATC   TGTGCGGTAT
  11751   GCGGAAGAGC   GCCTGATGCG   GTATTTTCTC   CTTACGCATC   TGTGCGGTAT
  11801   TTCACACCGC   ATATGGTGCA   CTCTCAGTAC   AATCTGCTCT   GATGCCGCAT
  11851   AGTTAAGCCA   GCTAGAGGAT   CATAATCAGC   CATACCACAT   TTGTAGAGGT
  11901   TTTACTTGCT   TTAAAAAACC   TCCCACACCT   CCCCCTGAAC   CTGAAACATA
  11951   AAATGAATGC   AATTGTTGTT   GTTAACTTGT   TTATTGCAGC   TTATAATGGT
  12001   TACAAATAAA   GCAATAGCAT   CACAAATTTC   ACAAATAAAG   CATTTTTTTC
  12051   ACTGCATTCT   AGTTGTGGTT   TGTCCAAACT   CATCAATGTA   TCTTATCATG
  12101   TCTGGATCCC   CAGGAAGCTC   CTCTGTGTCC   TCATAAACCC   TAACCTCCTC
  12151   TACTTGAGAG   GACATTCCAA   TCATAGGCTG   CCCATCCACC   CTCTGTGTCC
  12201   TCCTGTTAAT   TAGGTCACTT   AACAAAAAGG   AAATTGGGTA   GGGGTTTTTC
  12251   ACAGACCGCT   TTCTAAGGGT   AATTTTAAAA   TATCTGGGAA   GTCCCTTCCA
  12301   CTGCTGTGTT   CCAGAAGTGT   TGGTAAACAG   CCCACAAATG   TCAACAGCAG
  12351   AAACATACAA   GCTGTCAGCT   TTGCACAAGG   GCCCAACACC   CTGCTCATCA
  12401   AGAAGCACTG   TGGTTGCTGT   GTTAGTAATG   TGCAAAACAG   GAGGCACATT
  12451   TTCCCCACCT   GTGTAGGTTC   CAAAATATCT   AGTGTTTTCA   TTTTTACTTG
  12501   GATCAGGAAC   CCAGCACTCC   ACTGGATAAG   CATTATCCTT   ATCCAAAACA
  12551   GCCTTGTGGT   CAGTGTTCAT   CTGCTGACTG   TCAACTGTAG   CATTTTTTGG
  12601   GGTTACAGTT   TGAGCAGGAT   ATTTGGTCCT   GTAGTTTGCT   AACACACCCT
  12651   GCAGCTCCAA   AGGTTCCCCA   CCAACAGCAA   AAAAATGAAA   ATTTGACCCT
  12701   TGAATGGGTT   TTCCAGCACC   ATTTTCATGA   GTTTTTTGTG   TCCCTGAATG
  12751   CAAGTTTAAC   ATAGCAGTTA   CCCCAATAAC   CTCAGTTTTA   ACAGTAACAG
  12801   CTTCCCACAT   CAAAATATTT   CCACAGGTTA   AGTCCTCATT   TAAATTAGGC
  12851   AAAGGAATTC   TTGAAGACGA   AAGGGCCTCG   TGATACGCCT   ATTTTTATAG
  12901   GTTAATGTCA   TGATAATAAT   GGTTTCTTAG   ACGTCAGGTG   GCACTTTTCG
  12951   GGGAAATGTG   CGCGGAACCC   CTATTTGTTT   ATTTTTCTAA   ATACATTCAA
  13001   ATATGTATCC   GCTCATGAGA   CAATAACCCT   GATAAATGCT   TCAATAATAT
  13051   TGAAAAAGGA   AGAGTATGAG   TATTCAACAT   TTCCGTGTCG   CCCTTATTCC
  13101   CTTTTTTGCG   GCATTTTGCC   TTCCTGTTTT   TGCTCACCCA   GAAACGCTGG
  13151   TGAAAGTAAA   AGATGCTGAA   GATCAGTTGG   GTGCACGAGT   GGGTTACATC
  13201   GAACTGGATC   TCAACAGCGG   TAAGATCCTT   GAGAGTTTTC   GCCCCGAAGA
  13251   ACGTTTTCCA   ATGATGAGCA   CTTTTAAAGT   TCTGCTATGT   GGCGCGGTAT
  13301   TATCCCGTGT   TGACGCCGGG   CAAGAGCAAC   TCGGTCGCCG   CATACACTAT
  13351   TCTCAGAATG   ACTTGGTTGA   GTACTCACCA   GTCACAGAAA   AGCATCTTAC
  13401   GGATGGCATG   ACAGTAAGAG   AATTATGCAG   TGCTGCCATA   ACCATGAGTG
  13451   ATAACACTGC   GGCCAACTTA   CTTCTGACAA   CGATCGGAGG   ACCGAAGGAG
  13501   CTAACCGCTT   TTTTGCACAA   CATGGGGGAT   CATGTAACTC   GCCTTGATCG
  13551   TTGGGAACCG   GAGCTGAATG   AAGCCATACC   AAACGACGAG   CGTGACACCA
  13601   CGATGCCTGT   AGCAATGGCA   ACAACGTTGC   GCAAACTATT   AACTGGCGAA
  13651   CTACTTACTC   TAGCTTCCCG   GCAACAATTA   ATAGACTGGA   TGGAGGCGGA
  13701   TAAAGTTGCA   GGACCACTTC   TGCGCTCGGC   CCTTCCGGCT   GGCTGGTTTA
  13751   TTGCTGATAA   ATCTGGAGCC   GGTGAGCGTG   GGTCTCGCGG   TATCATTGCA
  13801   GCACTGGGGC   CAGATGGTAA   GCCCTCCCGT   ATCGTAGTTA   TCTACACGAC
  13851   GGGGAGTCAG   GCAACTATGG   ATGAACGAAA   TAGACAGATC   GCTGAGATAG
  13901   GTGCCTCACT   GATTAAGCAT   TGGTAACTGT   CAGACCAAGT   TTACTCATAT
  13951   ATACTTTAGA   TTGATTTAAA   ACTTCATTTT   TAATTTAAAA   GGATCTAGGT
  14001   GAAGATCCTT   TTTGATAATC   TCATGACCAA   AATCCCTTAA   CGTGAGTTTT
  14051   CGTTCCACTG   AGCGTCAGAC   CCCGTAGAAA   AGATCAAAGG   ATCTTCTTGA
  14101   GATCCTTTTT   TTCTGCGCGT   AATCTGCTGC   TTGCAAACAA   AAAAACCACC
  14151   GCTACCAGCG   GTGGTTTGTT   TGCCGGATCA   AGAGCTACCA   ACTCTTTTTC
  14201   CGAAGGTAAC   TGGCTTCAGC   AGAGCGCAGA   TACCAAATAC   TGTCCTTCTA
  14251   GTGTAGCCGT   AGTTAGGCCA   CCACTTCAAG   AACTCTGTAG   CACCGCCTAC
  14301   ATACCTCGCT   CTGCTAATCC   TGTTACCAGT   GGCTGCTGCC   AGTGGCGATA
  14351   AGTCGTGTCT   TACCGGGTTG   GACTCAAGAC   GATAGTTACC   GGATAAGGCG
  14401   CAGCGGTCGG   GCTGAACGGG   GGGTTCGTGC   ACACAGCCCA   GCTTGGAGCG
  14451   AACGACCTAC   ACCGAACTGA   GATACCTACA   GCGTGAGCTA   TGAGAAAGCG
  14501   CCACGCTTCC   CGAAGGGAGA   AAGGCGGACA   GGTATCCGGT   AAGCGGCAGG
  14551   GTCGGAACAG   GAGAGCGCAC   GAGGGAGCTT   CCAGGGGGAA   ACGCCTGGTA
  14601   TCTTTATAGT   CCTGTCGGGT   TTCGCCACCT   CTGACTTGAG   CGTCGATTTT
  14651   TGTGATGCTC   GTCAGGGGGG   CGGAGCCTAT   GGAAAAACGC   CAGCAACGCG
  14701   GCCTTTTTAC   GGTTCCTGGC   CTTTTGCTGG   CCTTTTGCTC   ACATGGCTCG
  14751   ACAGATCCAT   GTTCTTTCCT   GCGTTATCCC   CTGATTCTGT   GGATAACCGT
  14801   ATTACCGCCT   TTGAGTGAGC   TGATACCGCT   CGCCGCAGCC   GAACGACCGA
  14851   GCGCAGCGAG   TCAGTGAGCG   AGGAAGCGGA   AGAGCGCCTG   ATGCGGTATT
  14901   TTCTCCTTAC   GCATCTGTGC   GGTATTTCAC   ACCGCATATG   GTGCACTCTC
  14951   AGTACAATCT   GCTCTGATGC   CGCATAGTTA   AGCCAGA
其序列如上所示(SEQ ID NO:2)的pTV1目标载体,具有下列特征(位置根据序列中核酸的编号给定,所述编号系统已在之前详述):
-从位置1到位置48:FRT重组酶位点;
-从位置63到位置144:最小CMV启动子;
-从位置478到位置1176:maxFP-green蛋白;
-从位置1352到位置1402:后SV40多腺苷酸信号;
-从位置1888到位置2283:RSV LTR;
-从位置2521到位置3951:Ig抗-D的重链
-从位置3958到位置4184:bGH多腺苷酸信号;
-从位置4431到位置4826:RSV LTR;
-从位置5064到位置5771:bGH K链(K)Ig抗-D;
-从位置5778到位置6004:bGH多腺苷酸信号;
-从位置6658到位置6983:SV40启动子;
-从位置7019到位置7813:编码新转磷酸酶的序列;
-从位置7987到位置8117:SV40前多腺苷酸信号;
-从位置8301到位置8496:SV40启动子;
-从位置8595到位置9158:编码DHFR的序列;
-从位置9965到位置10019:后SV40多腺苷酸信号;
-从位置10092到位置10394:SV40启动子;
-从位置10442到位置11572:编码HSV-TK的序列;
-从位置11584到位置11631:FRT重组酶位点;
-从位置11974到位置12104:前SV40多腺苷酸信号(SV40前多A);
-从位置12996到位置13926:安必西林抗性基因。
B.pEFrat-FLPe载体(SEQ ID NO:3,图2):
编码Flp重组酶的基因从pOG4-FLPe载体(55)用下列引物进行PCR扩增:
上游引物(SEQ ID NO:8):
5′-ATCTGGCTAGCCGCCACC
Figure A20078004730000321
-3′
下划线的序列是NheI限制性位点,而FLPe基因的起始是黑体的,最初的ATG是斜体的。
下游引物(SEQ ID NO:9):
5′-TGTCATCTAGATTA
Figure A20078004730000322
-3′
下划线的序列是XbaI限制性位点。编码序列的末端是黑体的,终止密码子是斜体的。
产出的PCRFLPe产物在鼠EF1-α启动子和在NheI和XbaI位点上的bGH多腺苷酸序列之间被克隆,以获得最终的pEFrat-FLPe表达载体。
pEFrat-FLPe载体的核酸序列如下(SEQ ID No 3):
  1   GATCTCCAGG   GACCGTCCCT   AAATTCTCAC   AGACCCAAAT   CCCTGTAGCC
  51   GCCCCACGAC   AGCGCGAGGA   GCATGCGCCC   AGGGCTGAGC   GCGGGTAGAT
  101   CAGAGCACAC   AAGCTCACAG   TCCCCGGCGG   TGGGGGGAGG   GGCGCGCTGA
  151   GCGGGGGCCA   GGGAGCTGGC   GCGGGGCAAA   CTGGGAAAGT   GGTGTCGTGT
  201   GCTGGCTCCG   CCCTCTTCCC   GAGGGTGGGG   GAGAACGGTA   TATAAGTGCG
  251   GTAGTCGCCT   TGGACGTTCT   TTTTCGCAAC   GGGTTTGCCG   TCAGAACGCA
  301   GGTGAGTGGC   GGGTGTGGCT   TCCGCGGGCC   CCGGAGCTGG   AGCCCTGCTC
  351   TGAGCGGGCC   GGGCTGATAT   GCGAGTGTCG   TCCGCAGGGT   TTAGCTGTGA
  401   GCATTCCCAC   TTCGAGTGGC   GGGCGGTGCG   GGGGTGAGAG   TGCGAGGCCT
  451   AGCGGCAACC   CCGTAGCCTC   GCCTCGTGTC   CGGCTTGAGG   CCTAGCGTGG
  501   TGTCCGCCGC   CGCGTGCCAC   TCCGGCCGCA   CTATGCGTTT   TTTGTCCTTG
  551   CTGCCCTCGA   TTGCCTTCCA   GCAGCATGGG   CTAACAAAGG   GAGGGTGTGG
  601   GGCTCACTCT   TAAGGAGCCC   ATGAAGCTTA   CGTTGGATAG   GAATGGAAGG
  651   GCAGGAGGGG   CGACTGGGGC   CCGCCCGCCT   TCGGAGCACA   TGTCCGACGC
  701   CACCTGGATG   GGGCGAGGCC   TGTGGCTTTC   CGAAGCAATC   GGGCGTGAGT
  751   TTAGCCTACC   TGGGCCATGT   GGCCCTAGCA   CTGGGCACGG   TCTGGCCTGG
  801   CGGTGCCGCG   TTCCCTTGCC   TCCCAACAAG   GGTGAGGCCG   TCCCGCCCGG
  851   CACCAGTTGC   TTGCGCGGAA   AGATGGCCGC   TCCCGGGGCC   CTGTTGCAAG
  901   GAGC1′CAAAA   TGGAGGACGC   GGCAGCCCGG   TGGAGCGGGC   GGGTGAGTCA
  951   CCCACACAAA   GGAAGAGGGC   CTTGCCCCTC   GCCGGCCGCT   GCTTCCTGTG
  1001   ACCCCGTGGT   CTATCGGCCG   CATAGTCACC   TCGGGCTTCT   CTTGAGCACC
  1051   GCTCGTCGCG   GCGGGGGGAG   GGGATCTAAT   GGCGTTGGAG   TTTGTTCACA
  1101   TTTGGTGGGT   GGAGACTAGT   CAGGCCAGCC   TGGCGCTGGA   AGTCATTCTT
  1151   GGAATTTGCC   CCTTTGAGTT   TGGAGCGAGG   CTAATTCTCA   AGCCTCTTAG
  1201   CGGTTCAAAG   GTATTTTCTA   AACCCGTTTC   CAGGTGTTGT   GAGCTAGCCG
  1251   CCACCATGCC   ACAATTTGAT   )″-TATTATGTA   AAACACCACC   TAAGGTCCTG
  1301   GTTCGTCAGT   TTGTGGAAAG   GTTTGAAAGA   CCTTCAGGGG   AAAAAATAGC
  1351   ATCATGTGCT   GCTGAACTAA   CCTATTTATG   TTGGATGATT   ACTCATAACG
  1401   GAACAGCAAT   CAAGAGAGCC   ACATTCATGA   GCTATAATAC   TATCATAAGC
  1451   AATTCGCTGA   GTTTCGATAT   TGTCAACAAA   TCACTCCAGT   TTAAATACAA
  1501   GACGCAAAAA   GCAACAATTC   TGGAAGCCTC   ATTAAAGAAA   TTAATTCCTG
  1551   CTTGGGAATT   TACAATTATT   CCTTACAATG   GACAAAAACA   TCAATCTGAT
  1601   ATCACTGATA   TTGTAAGTAG   TTTGCAATTA   CAGTTCGAAT   CATCGGAAGA
  1651   AGCAGATAAG   GGAAATAGCC   ACAGTAAAAA   AATGCTTAAA   GCACTTCTAA
  1701   GTGAGGGTGA   AAGCATCTGG   GAGATCACTG   AGAAAATACT   AAATTCGTTT
  1751   GAGTATACCT   CGAGATTTAC   AAAAACAAAA   ACTTTATACC   AATTCCTCTT
  1801   CCJAGCTACT   JTCATCAATT   GTGGAAGATT   CAGCGATATT   AAGAACGTTG
  1851   ATCCGAAAJC   ATJTAAAJTA   GTCCAAAATA   AGTATCJGGG   AGTAATAATC
  1901   CAGTGTTTAG   JGACAGAGAC   AAAGACAAGC   GTTAGTAGGC   ACATAJACTT
  1951   CTTTAGCGCA   AGGGGTAGGA   TCGATCCACT   TGJATATJTG   GATGAATTTT
  2001   JGAGGAATTC   TGAACCAGTC   CJAAAACGAG   TAAATAGGAC   CGGCAATJCJ
  2051   TCAAGCAACA   AACAGGAATA   CCAATTATTA   AAAGATAACT   TAGTCAGATC
  2101   GTACAACAAG   GCTTTGAAGA   AAAATGCGCC   TJATCCAATC   TTTGCTATAA
  2151   AGAATGGCCC   AAAATCTCAC   ATTGGAAGAC   ATTTGATGAC   CTCATJJCTG
  2201   TCAATGAAGG   GCCTAACGGA   GTTGACTAAT   GTTGTGGGAA   ATTGGAGCGA
  2251   TAAGCGTGCT   TCTGCCGTGG   CCAGGACAAC   GTATACTCAT   CAGATAACAG
  2301   CAATACCTGA   TCACTACTTC   GCACTAGTTT   CTCGGTACTA   TGCATATGAT
  2351   CCAATATCAA   AGGAAATGAT   AGCATTGAAG   GATGAGACTA   ATCCAATTGA
  2401   GGAGTGGCAG   CATATAGAAC   AGCTAAAGGG   TAGTGCTGAA   GGAAGCATAC
  2451   GATACCCCGC   ATGGAATGGG   ATAATATCAC   AGGAGGTACT   AGACTACCTT
  2501   TCATCCTACA   TAAATAGACG   CATATAATAA   TCTAGAGCTC   GCTGATCAGC
  2551   CTCGACTGTG   CCTTCTAGTT   GCCAGCCATC   TGTTGTTTGC   CCCTCCCCCG
  2601   TGCCTTCCTT   GACCCTGGAA   GGTGCCACTC   CCACTGTCCT   TTCCTAATAA
  2651   AATGAGGAAA   TTGCATCGCA   TTGTCTGAGT   AGGTGTCATT   CTATTCTGGG
  2701   GGGTGGGGTG   GGGCAGGACA   GCAAGGGGGA   GGATTGGGAA   GACAATAGCA
  2751   GGCATGCTGG   GGATGCGGTG   GGCTCTATGG   CTTCTGAGGC   GGAAAGAACC
  2801   AGCTGGGGCT   CGAGGGGGGA   TCCCGTCGAC   CTCGAGAGCT   TGGCGTAATC
  2851   ATGGTCATAG   CTGTTTCCTG   TGTGAAATTG   TTATCCGCTC   ACAATTCCAC
  2901   ACAACATACG   AGCCGGAAGC   ATAAAGTGTA   AAGCCTGGGG   TGCCTAATGA
  2951   GTGAGCTAAC   TCACATTAAT   TGCGTTGCGC   TCACTGCCCG   CTTTCCAGC
  3001   GGGAAACCTG   TCGTGCCAGC   TGCATTAATG   AATCGGCCAA   CGCGCGGGGA
  3051   GAGGCGGTTT   GCGTATTGGG   CGCTCTTCCG   CTTCCTCGCT   CACTGACTCG
  3101   CTGCGCTCGG   TCGTTCGGCT   GCGGCGAGCG   GTATCAGCTC   ACTCAAAGGC
  3151   GGTAATACGG   TTATCCACAG   AATCAGGGGA   TAACGCAGGA   AAGAACATGT
  3201   GAGCAAAAGG   CCAGCAAAAG   GCCAGGAACC   GTAAAAAGGC   CGCGTTGCTG
  3251   GCGTTTTTCC   ATAGGCTCCG   CCAGCAAAA   GAGCATCACA   AAAATCGACG
  3301   CTCAAGTCAG   AGGTGGCGAA   ACCCGACAGG   ACTATAAAGA   TACCAGGCGT
  3351   TTCCCCCTGG   AAGCTCCCTC   GTGCGCTCTC   CTGTTCCGAC   CCTGCCGCTT
  3401   ACCGGATACC   TGTCCGCCTT   TCTCCCTTCG   GGAAGCGTGG   CGCTTTCTCA
  3451   ATGCTCACGC   TGTAGGTATC   TCAGTTCGGT   GTAGGTCGTT   CGCTCCAAGC
  3501   TGGGCTGTGT   GCACGAACCC   CCCGTTCAGC   CCGACCGCTG   CGCCTTATCC
  3551   GGTAACTATC   GTCTTGAGTC   CAACCCGGTA   AGACACGACT   TATCGCCACT
  3601   GGCAGCAGCC   ACTGGTAACA   GGATTAGCAG   AGCGAGGTAT   GTAGGCGGTG
  3651   CTACAGAGTT   CTTGAAGTGG   TGGCCTAACT   ACGGCTACAC   TAGAAGGACA
  3701   GTATTTGGTA   TCTGCGCTCT   GCTGAAGCCA   GTTACCTTCG   GAAAAAGAGT
  3751   TGGTAGCTCT   TG ATCCGGCA   AACAAACCAC   CGCTGGTAGC   GGTGGTTTTT
  3801   TTGTTTGCAA   GCAGCAGATT   ACGCGCAGAA   AAAAAGGATC   TCAAGAAGAT
  3851   CCTTTGATCT   TTTCTACGGG   GTCTGACGCT   CAGTGGAACG   AAAACTCACG
  3901   TTAAGGGATT   TTGGTCATGA   GATTATCAAA   AAGGATCTTC   ACCTAGATCC
  3951   TTTTAAATTA   AAAATGAAGT   TTTAAATCAA   TCTAAAGTAT   ATATGAGTAA
  4001   ACTTGGTCTG   ACAGTTACCA   ATGCTTAATC   AGTGAGGCAC   CTATCTCAGC
  4051   GATCTGTCTA   TTTCGTTCAT   CCATAGTTGC   CTGACTCCCC   GTCGTGTAGA
  4101   TAACTACGAT   ACGGGAGGGC   TTACCATCTG   GCCCCAGTGC   TGCAATGATA
  4151   CCGCGAGACC   CACGCTCACC   GGCTCCAGAT   TTATCAGCAA   TAAACCAGCC
  4201   AGCCGGAAGG   GCCGAGCGCA   GAAGTGGTCC   TGCAACTTTA   TCCGCCTCCA
  4251   TCCAGTCTAT   TAATTGTTGC   CGGGAAGCTA   GAGTAAGTAG   TTCGCCAGTT
  4301   AATAGTTTGC   GCAACGTTGT   TGCCATTGCT   ACAGGCATCG   TGGTGTCACG
  4351   CTCGTCGTTT   GGTATGGCTT   CATTCAGCTC   CGGTTCCCAA   CGATCAAGGC
  4401   GAGTTACATG   ATCCCCCATG   TTGTGCAAAA   AAGCGGTTAG   CTCCTTCGGT
  4451   CCTCCGATCG   TTGTCAGAAG   TAAGTTGGCC   GCAGTGTTAT   CACTCATGGT
  4501   TATGGCAGCA   CTGCATAATT   CTCTTACTGT   CATGCCATCC   GTAAGATGCT
  4551   TTTCTGTGAC   TGGTGAGTAC   TCAACCAAGT   CATTCTGAGA   ATAGTGTATG
  4601   CGGCGACCGA   GTTGCTCTTG   CCCGGCGTCA   ATACGGGATA   ATACCGCGCC
  4651   ACATAGCAGA   ACTTTAAAAG   TGCTCATCAT   TGGAAAACGT   TCTTCGGGGC
  4701   GAAAACTCTC   AAGGATCTTA   CCGCTGTTGA   GATCCAGTTC   GATGTAACCC
  4751   ACTCGTGCAC   CCAACTGATC   TTCAGCA TCT   TTTACTTTCA   CCAGCGTTTC
  4801   TGGGTGAGCA   AAAACAGGAA   GGCAAAATGC   CGCAAAAAAG   GGAATAAGGG
  4851   CGACACGGAA   ATGTTGAATA   CTCATACTCT   TCCTTTTTCA   ATATTATTGA
  4901   AGCATTTATC   AGGGTTATTG   TCTCATGAGC   GGATACATAT   TTGAATGTAT
  4951   TTAGAAAAAT   AAACAAATAG   GGGTTCCGCG   CACATTTCCC   CGAAAAGTGC
  5001   CACCTGACGT   CGACGGATCG   GGA
其序列如上所示(SEQ ID NO:3)的pEFrat-FLPe载体,具有下列特征(位置根据序列中核酸的编号给定,所述编号系统已在之前详述):
-从位置1到位置1243:鼠EF-1α启动子;
-从位置1256到位置2527:Flpe编码序列;
-从位置2537到位置2763:bGH多腺苷酸信号;
-从位置3020到位置3543:Col E1复制起点;
-从位置4887到位置4027:安必西林抗性基因。
C.pT125-FRT重新整合载体(图3):
pT125-FRT重新整合载体源于T125-IG24载体(图4),其中CMV启动子已被RSV启动子取代,而且新霉素抗性基因的多腺苷酸序列已经被删除并且被像pTV1载体中Frt位点的方向一样插入的Frt位点替换。
示例2:瞄准YB2/0细胞株中的高转录活性区域
a.用pTV1载体转染YB2/0细胞株
鼠细胞株YB2/0(ATCC # CRL-1662)在添加了5%的肽牛血清(FBS)的EMS培养基(Invitrogen,ref.041-95181M)中生长。用Optibuffer转染试剂盒(Thermo Electron)对5百万个细胞进行电穿孔(BioRad electroporator,model 1652077)。对于每个转染,使用5μg用ScaI限制酶线性化的pTV1载体细胞。电穿孔在0.5ml试管中在230伏和950微法拉下进行。每个电穿孔试管的内容物以每孔5000个细胞的浓度分散到10个96孔板中。在转染三天之后,细胞被转移到添加了5%FBS和2mg/ml的G418(Invitrogen,ref.10131-027)的EMS选择培养基中。
b.荧光筛查G418-抗性克隆
在转染10到15天后,有抗性的克隆基于maxFPTM-Green蛋白的maxFPTM-Green荧光而被确定(482nm处激发,502nm处发射)。所有的有抗性的克隆被首先在荧光板读取器(VICTOR3,Perkin Elmer)上进行筛选。所有的荧光克隆接着流入流式细胞仪中以测量每个细胞的荧光强度以及克隆的同质性。结果用免费的WinMDI2.8(http://facs.scripps.edu)软件进行分析。所有的具有同质的荧光峰值并且平均荧光强度(MFI)超过500的克隆被分拣并被转移到24孔板上进行扩增。
c.酶联免疫吸附试验(ELISA)筛选以及拷贝数的确定
细胞被维持于24孔板中,上清液被检测(ELISA)以估算抗-D抗体的产量。所有产率超过10pcd(皮克每个细胞每24小时)的克隆被执行半定量化的PCR来估算pTV1载体的拷贝数量。拷贝数量的估算使用了ABI
Figure A20078004730000351
7000机器,使用CELL LINE序列(其数量在从YB2/0细胞株中产生的克隆中是稳定的)作为标准控制。发现含有单个拷贝的克隆接着进行DNA印迹法来确定拷贝数量。
d.甲氨喋呤(MTX)基因扩增
基因扩增试验使用MTX(Sigma,ref.M8407),在携带单个拷贝的高产率克隆中进行,以估算由pTV1载体定位的位点的扩增能力。浓度为25nM或更高的MTX被加入EMS培养基(+5%FBS)。在该选择性培养基中培养15天后,有抗性的克隆进行ELISA以检查增加的产率以及进行定量PCR以检查增加的拷贝数量。3G11克隆(9.7pcd)的产率在一个扩增周期后增加到22pcd。同样地,35H4克隆(11.4pcd)的产率在一个扩增周期后增加了大约3倍。
示例3:使用Flp重组酶切除PV1目标载体;产生YGM-1/10G10和YGM-2/3G5细胞株(图5)
YGM-1/10G10 cell line
携带着pTV1载体的单个拷贝的高产率克隆8A10和3G11(在扩增之前分别为6.6pcd和9.7pcd)被选择通过删除目标载体以产生YGM细胞株。
克隆8A10首先在T75瓶中在含有2mg/ml G418的EMS培养基(5%FBS)中进行扩增。在转染前一天,从培养基中去除G418。
能被5μg整除的非线性化的pEFrat-FLPe载体重悬浮于175μl无血清的EMS中,与25μlSuperfect一起在与1ml EMS(5%FBS)混合前在室温下培养10分钟。该混合物中加入2×106PBS清洗过的细胞,并在EMS培养液(5%FBS)中稀释至2.5×105 cells/ml。在37℃培养4小时后,细胞被转移到EMS培养液(5% FBS)中。
培养24小时后,细胞被分散到96孔板上,浓度为每孔5000个细胞。
在转染两天后细胞被转移到选择性培养基,添加了4μM更昔洛韦(Invivogen,ref.sud-gcv)的EMS培养基(5%FBS)中。
培养15天后,存活下来的克隆在流式细胞仪中进行检测以检查荧光的消失,通过ELISA检查抗-D免疫球蛋白的消失,以及通过PCR检查pTV1载体的完全切除,使用下列引物:
5′PTV1(SEQ ID NO:10):5′-CCTATGGAAAAACGCCAGCAAC-3′
3′PTV1(SEQ ID NO:11):5′-CCTTAGAAAGCGGTCTGTGAAA-3′
经切除过的克隆,克隆10G10被选择成为YGM-1/10G10表达细胞株,并在三个月的时间内检测其整合位点的稳定性。
YGM-2/3G5细胞株
携带pTV1载体单个拷贝的克隆35H4(1)2G2(13.3pcd)是克隆35H4(扩增前11.4pcd)的高产率衍生物,被选择通过删除目标载体的方式产生YGM细胞株。
克隆35H4(1)2G2首先在T75瓶中在含有1mg/ml G418的RPMI培养基(5%FBS)中进行扩增。在转染前的两个世代从培养基中去除G418。
能被25μg整除的非线性化的pEFrat-FLPe载体重悬浮于500μl无血清的RPMI中,与75μl Fugene HD(Roche)一起在室温下培养15分钟。120μl该混合物被加入到每个孔中含有6×105细胞/ml的RPMI培养液(5%FBS)的六孔板中。培养24小时后,细胞被分散到96孔板上,浓度为每孔1000个细胞。
在转染三天后细胞被转移到选择性培养基,添加了4μM更昔洛韦(Invivogen,ref.sud-gcv)的RPMI培养基(5%FBS)中。
培养15天后,存活下来的克隆在流式细胞仪中进行检测以检查荧光的消失,通过ELISA检查抗-D免疫球蛋白的消失,以及通过PCR检查pTV1载体的完全切除,使用下列引物:
DEL REV(SEQ ID NO:14):5′-TGGTATGGCTGATTATGATCCTC-3’
DEL FOR 3(SEQ ID NO:15):5′-CCTTTTGCTCACATGGCTCGAC-3’
经切除过的克隆,克隆35H4(1)2G2被选择成为YGM-2/3G5表达细胞株,并在三个月的时间内检测其整合位点的稳定性。
示例4:在YGM-1/10G10和YGM-2/3G5细胞株中重新整合表达载体(图6)
YGM-1/10G10细胞株
编码如在筛选步骤(抗-D抗体)中使用的抗体相同抗体的载体被重新整合,以检测在YGM-1(克隆10G10)的Frt位点重新整合后表达水平的再现性。
通过切除携带有单独Frt重组位点以及与“SV40前多A”相应的多腺苷酸序列的目标载体TV1而产生的克隆10G10,在T75瓶中的EMS培养液(5%FBS)中被扩增。
10μg非线性化的pEFrat-FLPe载体和5μg的非线性化pT125-FRT重新整合载体被用来进行共转染。5百万细胞在0.5ml试管中使用Optibuffer转染试剂盒(Thermo Electron)进行电穿孔(BioRad electroporator,型号1652077),参数如下:230伏和950微法拉。
细胞被分散到96孔板,浓度为5000个细胞每孔。
转染后两天,细胞被转移到添加了2mg/ml G418的EMS培养基(5%FBS)选择性培养基中。
在培养15天后,存活下来的克隆在24孔板中进行扩增,并且通过PCR进行筛选以检查在YGM-1细胞株Frt位点的重新整合。
为了筛选,使用了m5NEO-2和SV40多A-1rev引物:
m5NEO-2引物    SEQ ID NO:12):
5′-GATGCCTGCTTGCCGAATA-3′
SV40polyA-1rev引物    SEQ ID NO:13):
5′CCTTAGAAAGCGGTCTGTGAAA-3′
随机整合到YGM-1细胞株基因组的克隆被排除。pT125-FRT载体整合到YGM-1细胞株的Frt位点的克隆进行ELISA以测定抗-D T125抗体的产率。
选择克隆21B10(5.5pcd)在三个月时间内检测稳定的重新整合。
YGM-2/3G5细胞株
编码如在筛选步骤(抗-D抗体)中使用的抗体相同抗体的载体被重新整合,以检测在YGM-2(克隆35H4(2)3G5)的Frt位点重新整合后表达水平的再现性。
通过切除携带有单独Frt重组位点以及与SV40前多腺苷酸信号相应的多腺苷酸序列的目标载体TV1而产生的克隆35H4(2)3G5,在T75瓶中的RPMI培养液(5%FBS)中被扩增。
4μg非线性化的pEFrat-FLPe载体和2μg的非线性化pT125-FRT重新整合载体被用来进行共转染。
两种非线性化的载体在300μl无血清的EMS中稀释并与18μl Fugene HD(Roche)一起在室温下培养15分钟。75μl的混合物被加入到每孔含有6×105细胞/mlEMS培养液(5%FBS)的6孔板中。培养24小时后,细胞被分散到96孔板中,浓度为每孔1000个细胞。
细胞被分散到10块96孔板中,浓度为每孔1000个细胞。
转染后两天,细胞被转移到添加了3mg/ml G418的EMS培养基(5%FBS)选择性培养基中。
在培养12天后,存活下来的克隆在24孔板中进行扩增,并且通过PCR进行筛选以检查在YGM-2细胞株Frt位点的重新整合。
为了筛选,使用了如下引物:
-为检测5’端的整合
DEL FOR 3(SEQ ID NO:15):5′-CCTTTTGCTCACATGGCTCGAC-3′
3FRT3(SEQ ID NO:16):5′-TTGTCTCATGAGCGGATACA-3′
-为了检测3’端的整合
DEL REV(SEQ ID NO:14):5′-TGGTATGGCTGATTATGATCCTC-3′
m-5-NEO-2(SEQ ID NO:12):5′-GATGCCTGCTTGCCGAATA-3′
由于该筛选,转染子对G418有抗性但表现为随机整合到YGM-2细胞株基因组的已经被消除。
在已经将pT125-FRT载体整合到YGM-2细胞株Frt位点的转染子中,19D1,25E5,30A5和20F11克隆进行ELISA,以评估其抗-D抗体的产率。获得的这4个克隆的产率(分别为7.1pcd;7.0pcd;7.1pcd;和7.7pcd)是同质的,并且如观测到的35H4克隆或35H4(1)2G2母体克隆(11.4pcd和13.3pcd)一样具有相同的数量级,这对为获得具有可重复性质的强大的生产者证明了该定位策略的价值。克隆后,在超过三个月的时间内对这些克隆的遗传稳定性进行研究。
示例5:用反向PCR分析对YGM-1细胞株(克隆10G10)的整合位点进行鉴定
在反向PCR扩增后对整合位点进行测序,使用各种限制酶对来自8A10(含有目标载体)和10G10(删除后的YGM-1细胞株)克隆的DNA进行降解,得到的限制性片段使用T4连接酶重新连接。为了在目标载体内的序列使用下游引物进行反向PCR。获得的PCR产物在其5’和3’端具有目标载体序列,而且在其中间部分,一段对应于整合区域的未知的长度不定的(根据所使用的限制酶)序列紧挨着目标载体。对各种PCR产物测序获得高转录活性整合位点的序列(SEQ ID NO:1)。
REFERENCES
1.Baneyx F.and M.Mujacic.Recombinant protein folding and misfolding inEscherichia coli.Nat Biotech 22(11):1399-1408,2004.
2.Makrides,S.C.1996.Strategies for achieving high-level expression of genesin Escherichia coli.Microbiol.Rev 60:512.
3.Gasser,B.,and D.Mattanovich.2006.Antibody production with yeasts andfilamentous fungi:on the road to large scale,Biotechnol Lett.
4.T.U.Gerngross.Advances therapeutic pro teins in yeasts Biotech 22(11):1409-1414,2004.in the production of human and filamentous fungi.Nat
5.Smerdon,G.R.,E.F.Walton,and S.J.Aves.1998.Stable production of humangastric lipase by chromosomal integration in the fission yeast Schizosaccharomycespombe.Appl.Microbiol.Biotechnol 49:45.
6.Hellwig,S.,J.Drossard,R.M.Twyman,and R.Fischer.2004.Plant cellcultures for the production of recombinant proteins.Nat Biotechnol 22:1415.
Miller.L.K.1993.Baculoviruses:high-level expression in insect cells.CurrQpin Genet.Dev 3:97.
McCall,E.J.,A.Danielsson,1.M.Hardern,C.Dartsch,R.Hicks,J.M.Wahlberg,and W.M.Abbott.2005.Improvements to the throughput of recombinant proteinexpression in the baculovirus/insect cell system.protein Expr.Purif,42:29.
Schmidt,F.R.2004.Recombinant expression systems in the pharmaceuticalindustry.Appl Microbiol.Biotechnol 65:363
Simonsen,C.C.,and M.McGrogan.1994.The molecular biology of cell lines.Biologicals 22:85
Geisse,S.,H.Gram,B.Kleuser,and H.P.Kocher.1996.Eukaryotic expressionsystems:a comparison.Protein Expr.Purif.8:271.
Bending,M.M.1988.The production of foreign proteins in mammalian cells.Genet.Eng91.
C.Gorman and C.Bullock.Site specific gene targeting for gene expression ineukaryotes.Curr Opin Biotechnol 11(5):455-460,2000.
M.E.Reff.High-level production of recombinants in immunoglobulins in mammaliancells.Curr Opin Biotechnol 4(5):573-576,1993.
D.C.Anderson and L.Krummen Recombinant protein expression for therapeuticapplications.Curr Opin Biotechnol 13(2):117-123,2002.
R.J.Kaufman.Use of recombinant DNA technology for engineering mammalian cellsto produce proteins.Bioprocess Technol.10:15-69,1990.
R.J.Kaufman.Overview of vector design for mammalia gene expression.Mol.Biotechnol.16(2):151-160,2000.
Lucas,B.K.,L.M.Giere,R.A.DeMarco,A.Shen,V.Chisholm,and.C.W.Crowley.1996.High level production of recombinant proteins in CHO cells suing adicistronic DHFR intron expression vector.Nucl.Acids Res.24:1774.
F.Hesseand R.Wagner.Developments and improvements in the manufacturing of humantherapeutics with mammalians cell cultures.Trends Biotehnol 18(4):173-180,2000.
Mr.Butler.Animal cell cultures:recent achievements and perpectives in theproduction of biopharmaceuticals.Appl.Microbiol.Biotechnol 68(3):283-291,2005.
Fussenegger,M.and J.E.Bailey.1998.Molecular regulation of cell-cycleprogression and apoptosis in mammalian cells:implications for biotechnology.Biotechnol Prog.14:807.
Peakman,T.C.,J.Worden,R.H.Harris,H.Cooper,J.Tite,M.J.Page,D.R.Gewert,M.Bartolomew,J.S.Crowe,and S.Brett.1994.Comparison of expression of ahumanized monoclonal antibody in mouse NSO myeloma cells in Chinese hamster ovarycells.Hum Antibodies Hybridomas 5:65.
S.J.Kim,N.S.Kim,C.J.Ryu,H.J Hong,and G.M.Lee.Characterization of chimericantibody producing CHO cells in the course of dihydrofolate reductase-mediatedgene amplification and their stability in the absence of selective pressure.Biotechnol Bioeng.58(1):73-84,1998.
Seth,G.,P.Hossler,J.C.Yee,and W.S.Hu.2006.Engineering cells for cellculture bioprocessing physiological fundamentals.Adv.Biochem.EngBiotechnol 101:119.
F.M.Wurm,A;Johnson,T.Ryll,C.Kohne,H.Scherthan,F.Glaab,Y.S.Lie,C.J.Petropoulos,and W.R.Arathoon.Gene transfer and amplification in CHO cells.Efficient methods for maximizing specific productivity and assessment of geneticconsequences.Ann.N.Y.Acad.Sci 782:70-78,1996.
F.M.Wurm.Production of recombinant proteins therapeutics in cultivatedmammalian cells.Nat Biotechnol 22(11):1393-1398,2004.
Trill,J.J.,A.R.Schatzman,and S.Ganguly.1995.Production of monoclonalantibodies in COS and CHO cells.Curr Opin Biotechnol 6:553
F.M.Wurm.Integration,amplification and stability of plasmid sequences in CHOcell cultures.Biologicals 18(3):159-164,1990.
M.Schroder,K.Matischak,and P.Friedl.Serum-and protein-free mediaformulations for the Chinese hamster ovary cell line DUKXB11.J Biotechnol 108(3):279-292,2004.
C.R.Bebbington,G.Renner,S.Thomson,D.King,D.Abrams,and G.T.Yarranton.High-level expression of a recombinant antibody from myeloma cells using aglutamine synthetase gene as an amplifiable selectable marker.Biotechnology(N.Y.)10(2):169-175,1992.
Barnes LM and al 2000 Cytotechnology 32:109-123.Advances in animal cellrecombinant protein production
Thomas,P.,and T.G.Smart.2005.HEK293 cell line:a vehicle for the expressionor recombinant proteins.J Pharmacol.Toxicol.Methods 51:187.
Grunberg,J.,K.Knogler,R.Waibel,and I.Novak-Hofer.2003.High-yieldproduction of recombinant antibody fragments in HEK-293 cells using sodiumbutyrate.Biotechniques 34:968.
Racher,A.J.,J.L.Moreira,P.M.Alves,M.Wirth,U.H.Weidle,H.Hauser,M.J.Carrondo,and J.B.Griffiths.1994.Expression of recombinant antibody andsecreted alkacell line phosphatase in mammalian cells.Influence of cell line andculture system upon production kinetics.Appl.Microbiol.Biotechnol 40:851.
Griffiths,J.B.,and A.J.Racher.1994.Cultural and physiological factorsaffecting expression of recombinant proteins.Cytotechnology 15:3.
Y.ariya,K.Ishida,Y.Tsubota,Y.Nakashima,.Hirosaki,T.Ogawa,and K.Miyazaki.Efficient expression system or human recombinant laminin-5.J Biochem.(Tokyo)132(4):607-612,2002.
al-Shawi,R.,J.Kinnaird,J.Burke,and J.O.Bishop.1990.Expression or a foreigngene in a cell line of transgenic mice is modulated by a chromosomal position effect.Mol Cell Biol 10:1192.
Yoshimura,F.K..and K.Chaffin.1987.Different activities of viral enhancerelements before and after stable integration of transfected DNAs.Mol Cell Biol7:1296.
Felsenfeld,G.,J.Boyes,J.Chung,D.Clark,and V.Studitsky.1996.Chromatinstructure and gene expression.PNAS 93:9384.
Gugliemi,L.,V.Truffinet,M.Cogne,and Y.Denizot.2003.The beta-globin HS4insulator confers copy-number dependent expression of IgH regulatory elements instable B cell transfectants.Immunel Lett.89:1l9.
Chung,J.H.,M.Whiteley,and G.Felsenfeld.1993.A 5’element of the chickenbeta-globulin domain serves as an insulator in human erythroid cells and protectsagainst position effect in Drosophila.Cell 74:505.
Tajima,S.,K.Shinohara,M.Fukumoto,R.Zaitsu,J.Miyagawa,S.Hino,J.Fan,K.Akasaka,and M.Matsuoka.2006.Ars Insulator Identified in Sea Urchin Possessesan Activity to Ensure the Transgene xpression in Mouse Cells.J.Biochem(Tokyo)139:705.
T.Benton,T.Chen,M.McEntee,B.Fox,D.King,R.Crombie,T.C.Thomas,andC.Bebbington.The use of UCOE vectors in combination with a preadapted serumfree,suspension cell line allows for rapid production of large quantities ofprotein.Cytotechnology 38(1-3):43-46,2006;
Fukushige,S.,and B.Sauer.1992.Genomic targeting with a positive-selectionlox integration vector allows highly reproducible gene expression in mammaliancells.Proc Natl.Acad.Sci U.S.A.89:7905.
Kito,M.,S.Itami,Y.Fukano,K.Yamana,and T.Shibui.2002.Construction ofengineered CHO strains for high-level production of recombinant proteins ApplMicrobiol Biotechnol 60:442
H.P.Fell,S.Yarnold,I.Hellstrom,K.E.Hellstrom,and K.R.Folger.Homologousrecombination in Hybridoma cells:heavy chain chimeric antibody produced by genetargeting.Proc Natl.Acad.Sci.U.S.A.86(21):8507-8511,1999.
D.A.Sorrell and A.F.Kolb.Targeted modification of mammalian genomes.Biotechnol Adv 23(7-8):431-469,2005.
Morrow,B.,and Kucherlapati.1993.Gene targeting in mammalian cells in homologousrecombination.Curr Opin Biotechnol 4:577.
Choul ika,A.,A.Perr in,B.Dujon,and J.F.Nicolas.1995.Induct ion of homo logousrecombination in mammalian chromosomes by using the I-SceI system of Saccharomycescerevisiae.Mol.Cel.Biol.15:1968.
Kolb,A.2002.Genome engineering using site-specific recombinases.Cloning StemCells 4:65.
Sauer,B.1987.Functional expression of the Cre-lox site-specific recombinationsystem in the yeast saccharomyces cerevisiae.Mol.Cell.Biol.7:2087.
Sauer,B.,and N.Henderson.1990.Targeted insertion of exogenous into theeukaryotic genome by the Cre recombinase.New.Biol 2:441.
Golic,K.G.,and S.Lindquist.1989.The FLP recombinase yeast catalyzessite-specific recombination in the Drosophila genome.Cell 59:499.
O’Gorman,S.,D.T.Fox,and G.M.Wahl.1991.Recombinase-mediated geneactivation and site-specific integration in mammalian cells.Science 251:1351.
Buchholz,F.,P.O.Angrand,and A.F.Stewart.1998.Improved properties for FLPrecombinase evolve by cycling mutagenesis.Nat Biotechnol 16:657.
Xu,Z.L.,H.Mizuguchi,A.Ishii-Watabe,E.Uchida,T.Mayumi,and T.Hayakawa.2001.Optimization of transcriptional regulatory elements for constructingplasmid vectors.Gene 272:149.
Xu,Z.L.,H.Mizuguchi,A.Ishii-Watabe,E.Uchida,T.Mayumi,and T.Hayakawa.2002.Strength evaluation of transcriptional regulatory elements for transgeneexpression y adenovirus vector.J.Control Release.81:155.
Pfarr,D.S.;L.A.Rieser,R.P.Woychic,F.M.Rottman,M.Rosenberg,and M.E.Reff.1996.Differential effects of polyadenylation regions on gene expressionin mammalian cells.DNA 5:115.
Petitclerc,D.,J.Attal,M.C.Theron,M.Bearzotti,P.Bolifraud,G.Kann,M.G.Stinnakre,H.Pointu,C.Puissant,and L.M.Houdebine.1995.The effect ofvarious introns and transcription terminators on the efficiency of expressionvectors in various culture cell lines and in the mammary gland of transgenic mice.J.Biotechnol 40:169.
Kim,D.,G.D.Kim,K.Baek,Y.Yoon,and J.Yoon.2003.Improved mammalianexpression systems by manipulating transcriptional termination regions.Biotechnol Prog 19:1620.
Edmonds,M.2002.A history of Poly A sequences:from formamtion to factors tofunctions.Prog.Nucleic acid.Res Mol Biol 71:285.
Lewis,J.D.,S.I.Gunderson,and I.W.Mattaj.1995 The influence of 5’andstructures on pre-mRNA metabolism.J.Cell Sci Suppl 19:13.
Cramer,P.,A.Srebrow,S.Kadener,S.Werbajh,M.M.de la,G.Melen,G.Nogues,and A.R.Kornblihtt 2001.Coordination between transcription and pre-mRNAprocessing.FEBS.Lett.498:179.
Carlswell and al.(1989),Molecular and cellular Biology,October 1989,p.4248-4258.
Denome and al.(1988),Molecular and cellular Biology,Nov.1988,p.4829-4839.
GiI A,Proudfoot NJ.(1987),CeIl.1987 May 8;49(3):399-406.Position-dependent sequence éléments downstream of AAUAAA are required forefficient rabbit beta-globin mRNA 3′end formation.
Gimmi ER,Soprano KJ,Rosenberg M,Reff ME(1998),Nucleic Acids Res.1988 Sep26;16(18):8977-97.Deletions in the SV40 late polyadenylation region downstreamof the AATAAA mediate similar effects on expression in various mammalian celllines.
Schek N,Cooke C,Alwine JC(1992),Mol Cell Biol.12(12):5386-93.Definitionof the upstream efficiency element of the simian virus 40 late polyadenylationsignal by using in vitro analyses.
Levitt N,Briggs D,GiI A,Proudfoot NJ(1989),Genes Dev.3(7):1019-25.Definition of an efficient synthetic poly(A)site.
Moreira A,Wollerton M,Monks J,Proudfoot NJ(1995)14(15):3809-19 Upstreamsequence elements enhance poly(A)site efficiency of the C2 complement gene andare phylogenetically conserved.
Edwalds-Gilbert G,Prescott J,Falck-Pedersen E.(1993),Mol CeIl Biol.Jun;13(6):3472-80.3′RNA processing efficiency plays a primary role in generatingtermination-competent KNA polymerase II elongation complexes.
序列表
<110>LFB生物技术简易股份公司
<120>用于生产蛋白,特别是治疗用蛋白的高转录活性细胞株
<130>PFD1090246F-CF
<140>PCT/FR2007/002144
<141>2007-12-20
<160>16
<170>PatentIn version 3.3
<210>1
<211>4419
<212>DNA
<213>人工序列
<220>
<223>分离的核酸分子(Isolated nucleic acid molecule)
<220>
<221>misc_feature
<222>(140)..(140)
<223>n是a,c,g或t
<220>
<221>misc_feature
<222>(160)..(160)
<223>n是a,c,g或t
<400>1
tggaaacaga aactaaatag agacatagag aaaatgaaca gaagttatga accaaatgga    60
tttaaccggt atttatacaa catttcatct taaaacaaaa gaatatacct tcttctcagc   120
acctcatagc ctcttctacn aaaccatata gtcggtcacn aaacaagcct caacagatac   180
aagaagataa aaataatccc atgcatacta tcagatcacc atggactaac tctggtcttc   240
aataacaaca aaaacaatgg aagtcgaaga acactctatt caatgataac ttggtcaagg   300
aagagatgaa aaaggaaatt aaagcctttt tagaatttca tgaaaatgaa ggcacaacat   360
acccaaactt atgagacaca aggaaagcag tgctaagagg aaaactcata gctctgagtg   420
cctccaaaaa gaaacaagag agagtgtata ctagcagctt gagagcacac ctgaaagctc   480
tagaacaaaa agaagcaaat acacccaaga ggagaagatc aaatgcaggg ctgaaatcaa   540
ccaagtagaa acaaaagaac tgtaaaaaga accaacaaaa ccaggagttg gttggttgag   600
aaaatcaaaa agataaataa acccttaatc agaataacca gagggcacag aaacagtatc   660
caaattaaca aaataagaaa tggaaaggga gacgtaaaac agaatccgag gaaataaaaa   720
aaaattgatc ctattacaaa agtctatatt caacaaagct ggaaaatctg gatgaaatag   780
acaattttct agatagatac cagataccaa agttaaatca ggaccagata aatcatctaa   840
acagtcccat aactcctaaa gaaatagaag cagttattaa aattctcccg accaaaaaaa   900
aaaaaaaaaa aaagcccagg attggatggg tttagtggag aattctatca gaccttcatc   960
aaagacctaa taccaatact gtccaaacta ttccttgcaa cactgaatat tccgcataca  1020
ctattcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc  1080
ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag  1140
gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa  1200
ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg  1260
gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa    1320
ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg    1380
gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt    1440
gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt    1500
caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag    1560
cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat    1620
ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct    1680
taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct    1740
tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca    1800
gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc    1860
agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc    1920
aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct    1980
gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag    2040
gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc    2100
tacaccgaac tgagatacct acagcgtgag ctatgagaaa gcgccacgct tcccgaaggg    2160
agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag    2220
cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt    2280
gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac    2340
gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatggc tcgacagatc    2400
catgttcttt cctgcgttat cccctgattc tgtggataac cgtattaccg cctttgagtg    2460
agctgatacc gctcgccgca gccgaacgac cgagcgcagc gagtcagtga gcgaggaagc    2520
ggaagagcgc ctgatgcggt attttctcct tacgcatctg tgcggtattt cacaccgcat    2580
atggtgcact ctcagtacaa tctgctctga tgccgcatag ttaagccaga gaagtaccta    2640
ttccgaagtt cctattctct agaaagtata ggaacttctc atgttctttc ctgcgttatc    2700
ccctgattct gtggataacc gtattaccgc ctttgagtga gctgataccg ctcgccgcag    2760
ccgaacgacc gagcgcagcg agtcagtgag cgaggaagcg gaagagcgcc tgatgcggta    2820
ttttctcctt acgcatctgt gcggtatttc acaccgcata tggtgcactc tcagtacaat    2880
ctgctctgat gccgcatagt taagccagct agaggatcat aatcagccat accacatttg    2940
tagaggtttt acttgcttta aaaaacctcc cacacctccc cctgaacctg aaacataaaa    3000
tgaatgcaat tgttgttgtt aacttgttta ttgcagctta taatggttac aaataaagca    3060
atagcatcac aaatttcaca aataaagcat ttttttcact gcattctagt tgtggtttgt    3120
ccaaactcat caatgtatct tatcatgtct ggatccccag gaagctcctc tgtgtcctca    3180
taaaccctaa cctcctctac ttgagaggac attccaatca taggctgccc atccaccctc    3240
tgtgtcctcc tgttaattag gtcacttaac aaaaaggaaa ttgggtaggg gtttttcaca    3300
gaccgctttc taagggtaat tttaaaatat ctgggaagtc ccttccactg ctgtgttcca    3360
gaagtgttgg taaacagccc acaaatgtca acagcagaaa catacaagct gtcagctttg    3420
cacaagggcc caacaccctg ctcatcaaga agcactgtgg ttgctgtgtt agtaatgtgc    3480
aaaacaggag gcacattttc cccacctgtg taggttccaa aatatctagt gttttcattt    3540
ttacttggat caggaaccca gcactccact ggataagcat tatccttatc caaaacagcc  3600
ttgtggtcag tgttcatctg ctgactgtca actgtagcat tttttggggt tacagtttga  3660
gcaggatatt tggtcctgta gtttgctaac acaccctgca gctccaaagg ttccccacca  3720
acagcaaaaa aatgaaaatt tgacccttga atgggttttc cagcaccatt ttcatgagtt  3780
ttttgtgtcc ctgaatgcaa gtttaacata gcagttaccc caataacctc agttttaaca  3840
gtaacagctt cccacatcaa aatatttcca caggttaagt cctcatttaa attaggcaaa  3900
ggaattcttg aagacgaaag ggcctcgtga tacgcctatt tttataggtt aatgtcatga  3960
taataatggt ttcttagacg tcaggtggca cttttcgggg aaatgtgcgc ggaaccccta  4020
tttgtttatt tttctaaata cattcaaata tgtatccgct catgagacaa taaccctgat  4080
aaatgcttca ataatattga aaaaggaaga gtatgagtat tcaacatttc cgtgtcgccc  4140
ttattccctt ttttgcggca ttttgccttc ctgtttttgc tcacccagaa acgctggtga  4200
aagtaaaaga tgctgaagat cagttgggtg cacgagtggg ttacatcgaa ctggatctca  4260
acagcggtaa gatccttgag agttttcgcc ccgaagaacg ttttccaatg atgagcactt  4320
ttaaagttct gctatgtggc gcggtattat cccgtgttga cgccgggcaa gagcaactcg  4380
gtcgccgcat acactattct cagaatgact tggttgagt                         4419
<210>2
<211>14987
<212>DNA
<213>人工序列
<220>
<223>载体
<400>2
gaagtaccta ttccgaagtt cctattctct agaaagtata ggaacttcta cagagatccg     60
cccgccccgt tgacgcaaat gggcggtagg cgtgtacggt gggaggtcta tataagcaga    120
gctcgtttag tgaaccgtca gatcactaga agctttattg cggtagttta tcacagttaa    180
attgctaacg cagtcagtgc ttctgacaca acagtctcga acttaagctg cagtgactct    240
cttaaggtag ccttgcagaa gttggtcgtg aggcactggg caggtaagta tcaaggttac    300
aagacaggtt taaggagacc aatagaaact gggcttgtcg agacagagaa gactcttgcg    360
tttctgatag gcacctattg gtcttactga catccacttt gcctttctct ccacaggtgt    420
ccactcccag ttcaattaca gctcttaagg ctagagtggg atccaccggt cgccaccatg    480
gagagcgacg agagcggcct gcccgccatg gagatcgagt gccgcatcac cggcaccctg    540
aacggcgtgg agttcgagct ggtgggcggc ggagagggca cccccgagca gggccgcatg    600
accaacaaga tgaagagcac caaaggcgcc ctgaccttca gcccctacct gctgagccac    660
gtgatgggct acggcttcta ccacttcggc acctacccca gcggctacga gaaccccttc    720
ctgcacgcca tcaacaacgg cggctacacc aacacccgca tcgagaagta cgaggacggc    780
ggcgtgctgc acgtgagctt cagctaccgc tacgaggccg gccgcgtgat cggcgacttc    840
aaggtgatgg gcaccggctt ccccgaggac agcgtgatct tcaccgacaa gatcatccgc    900
agcaacgcca ccgtggagca cctgcacccc atgggcgata acgatctgga tggcagcttc    960
acccgcacct tcagcctgcg cgacggcggc tactacagct ccgtggtgga cagccacatg   1020
cacttcaaga gcgccatcca ccccagcatc ctgcagaacg ggggccccat gttcgccttc   1080
cgccgcgtgg aggaggatca cagcaacacc gagctgggca tcgtggagta ccagcacgcc    1140
ttcaagaccc cggatgcaga tgccggtgaa gaataaagcg gcctagggat aacagggtaa    1200
tggccgcgac tctagatcat aatcagccat accacatttg tagaggtttt acttgcttta    1260
aaaaacctcc cacacctccc cctgaacctg aaacataaaa tgaatgcaat tgttgttgtt    1320
aacttgttta ttgcagctta taatggttac aaataaagca atagcatcac aaatttcaca    1380
aataaagcat ttttttcact gcattctagt tgtggtttgt ccaaactcat caatgtatct    1440
taaggcgtaa attgtaagcg ttaatatttt gttaaaattc gcgttaaatt tttgttaaat    1500
cagctcattt tttaaccaat aggccgaaat cggcaaaatc ccttataaat caaaagaata    1560
gaccgagata gggttgagtg ttgttccagt ttggaacaag agtccactat taaagaacgt    1620
ggactccaac gtcaaagggc gaaaaaccgt ctatcagggc gatggcccac gatcttagat    1680
atccggacgt ggatctcccg atcccctatg gtgcactctc agtacaatct gctctgatgc    1740
cgcatagtta agccagtatc tgctccctgc ttgtgtgttg gaggtcgctg agtagtgcgc    1800
gagcaaaatt taagctacaa caaggcaagg cttgaccgac aattgcatga agaatctgct    1860
tagggttagg cgttttgcgc tgcttcgcga tgtacgggcc agatatacgc gtatctgagg    1920
ggactagggt gtgtttaggc gaaaagcggg gcttcggttg tacgcggtta ggagtcccct    1980
caggatatag tagtttcgct tttgcatagg gagggggaaa tgtagtctta tgcaatactc    2040
ttgtagtctt gcaacatggt aacgatgagt tagcaacatg ccttacaagg agagaaaaag    2100
caccgtgcat gccgattggt ggaagtaagg tggtacgatc gtgccttatt aggaaggcaa    2160
cagacgggtc tgacatggat tggacgaacc actgaattcc gcattgcaga gatattgtat    2220
ttaagtgcct agctcgatac aataaacgcc atttgaccat tcaccacatt ggtgtgcacc    2280
tccaagcttg gtaccgagct cggatccact agtgcagaag ttggtcgtga ggcactgggc    2340
aggtaagtat caaggttaca agacaggttt aaggagacca atagaaactg ggcttgtcga    2400
gacagagaag actcttgcgt ttctgatagg cacctattgg tcttactgac atccactttg    2460
cctttctctc cacaggtgtc cactcccagt tcaattacag ctcttgctag tgccgccacc    2520
atggagtttg ggctgagctg ggttttcctc gttgctcttt taagaggtgt ccagtgtcag    2580
gtgcagctgg tggagtctgg gggaggcgtg gtccagcctg ggaggtccct gagactctcc    2640
tgtacagcct ctggattcac cttcaaaaac tatgctatgc attgggtccg ccaggctcca    2700
gccaaggggc tggagtgggt ggcaactata tcatatgatg gaaggaatat acaatatgca    2760
gactccgtga agggccgatt caccttctcc agagacaatt ctcaggacac cctgtatctg    2820
caactgaaca gcctcagacc ggaggacacg gctgtgtatt actgtgcgag acccgtaaga    2880
agccgatggc tgcaattagg tcttgaagat gcttttcata tctggggcca ggggacaatg    2940
gtcaccgtct cttcagcctc caccaagggc ccatcggtct tccccctggc accctcctcc    3000
aagagcacct ctgggggcac agcggccctg ggctgcctgg tcaaggacta cttccccgaa    3060
ccggtgacgg tgtcgtggaa ctcaggcgcc ctgaccagcg gcgtgcacac cttcccggct    3120
gtcctacagt cctcaggact ctactccctc agcagcgtgg tgaccgtgcc ctccagcagc    3180
ttgggcaccc agacctacat ctgcaacgtg aatcacaagc ccagcaacac caaggtggac    3240
aagaaagttg agcccaaatc ttgtgacaaa actcacacat gcccaccgtg cccagcacct    3300
gaactcctgg ggggaccgtc agtcttcctc ttccccccaa aacccaagga caccctcatg    3360
atctcccgga cccctgaggt cacatgcgtg gtggtggacg tgagccacga agaccctgag    3420
gtcaagttca actggtacgt ggacggcgtg gaggtgcata atgccaagac aaagccgcgg    3480
gaggagcagt acaacagcac gtaccgtgtg gtcagcgtcc tcaccgtcct gcaccaggac    3540
tggctgaatg gcaaggagta caagtgcaag gtctccaaca aagccctccc agcccccatc    3600
gagaaaacca tctccaaagc caaagggcag ccccgagaac cacaggtgta caccctgccc    3660
ccatcccggg atgagctgac caagaaccag gtcagcctga cctgcctggt caaaggcttc    3720
tatcccagcg acatcgccgt ggagtgggag agcaatgggc agccggagaa caactacaag    3780
accacgcctc ccgtgctgga ctccgacggc tccttcttcc tctacagcaa gctcaccgtg    3840
gacaagagca ggtggcagca ggggaacgtc ttctcatgct ccgtgatgca tgaggctctg    3900
cacaaccact acacgcagaa gagcctctcc ctgtctccgg gtaaatgata gtctagagct    3960
cgctgatcag cctcgactgt gccttctagt tgccagccat ctgttgtttg cccctccccc    4020
gtgccttcct tgaccctgga aggtgccact cccactgtcc tttcctaata aaatgaggaa    4080
attgcatcgc attgtctgag taggtgtcat tctattctgg ggggtggggt ggggcaggac    4140
agcaaggggg aggattggga agacaatagc aggcatgctg gggatgcggt gggctctatg    4200
gcttctgagg cggaaagaac cagctggggc tcgagatctc ccgatcccct atggtgcact    4260
ctcagtacaa tctgctctga tgccgcatag ttaagccagt atctgctccc tgcttgtgtg    4320
ttggaggtcg ctgagtagtg cgcgagcaaa atttaagcta caacaaggca aggcttgacc    4380
gacaattgca tgaagaatct gcttagggtt aggcgttttg cgctgcttcg cgatgtacgg    4440
gccagatata cgcgtatctg aggggactag ggtgtgttta ggcgaaaagc ggggcttcgg    4500
ttgtacgcgg ttaggagtcc cctcaggata tagtagtttc gcttttgcat agggaggggg    4560
aaatgtagtc ttatgcaata ctcttgtagt cttgcaacat ggtaacgatg agttagcaac    4620
atgccttaca aggagagaaa aagcaccgtg catgccgatt ggtggaagta aggtggtacg    4680
atcgtgcctt attaggaagg caacagacgg gtctgacatg gattggacga accactgaat    4740
tccgcattgc agagatattg tatttaagtg cctagctcga tacaataaac gccatttgac    4800
cattcaccac attggtgtgc acctccaagc ttggtaccga gctcggatcc actagtgcag    4860
aagttggtcg tgaggcactg ggcaggtaag tatcaaggtt acaagacagg tttaaggaga    4920
ccaatagaaa ctgggcttgt cgagacagag aagactcttg cgtttctgat aggcacctat    4980
tggtcttact gacatccact ttgcctttct ctccacaggt gtccactccc agttcaatta    5040
cagctcttgc tagtgccgcc accatgaggg tccccgctca gctcctgggg ctcctgctgc    5100
tctggctccc aggtgccaga tgtgccatcc ggatgaccca gtctccatcc tcattctctg    5160
catctacagg agacagagtc accatcactt gtcgggcgag ccaggatatt cggaactatg    5220
tagcctggta tcagcaaaaa tcagggaaag cccctaaatt cctgatctat gctgcttcca    5280
ctttgcaaag tggggtccca tcaaggttca gcggcagtgg atctgggaca gatttcactc    5340
tcaccatcaa ctccctgcag tctgaagatt ttgcaactta ttactgtcaa caatattaca    5400
attctcctcc gaccttcggc caagggacca gggtggaaat cacgcgaact gtggctgcac    5460
catctgtctt catcttcccg ccatctgatg agcagttgaa atctggaact gcctctgttg    5520
tgtgcctgct gaataacttc tatcccagag aggccaaagt acagtggaag gtggataacg    5580
ccctccaatc gggtaactcc caggagagtg tcacagagca ggacagcaag gacagcacct    5640
acagcctcag cagcaccctg acgctgagca aagcagacta cgagaaacac aaagtctacg    5700
cctgcgaagt cacccatcag ggcctgagct cgcccgtcac aaagagcttc aacaggggag    5760
agtgttgata gtctagagct cgctgatcag cctcgactgt gccttctagt tgccagccat    5820
ctgttgtttg cccctccccc gtgccttcct tgaccctgga aggtgccact cccactgtcc    5880
tttcctaata aaatgaggaa attgcatcgc attgtctgag taggtgtcat tctattctgg    5940
ggggtggggt ggggcaggac agcaaggggg aggattggga agacaatagc aggcatgctg    6000
gggatgcggt gggctctatg gcttctgagg cggaaagaac cagtcgaggg gggatcccca    6060
cgcgccctgt agcggcgcat taagcgcggc gggtgtggtg gttacgcgca gcgtgaccgc    6120
tacacttgcc agcgccctag cgcccgctcc tttcgctttc ttcccttcct ttctcgccac    6180
gttcgccggc tttccccgtc aagctctaaa tcggggcatc cctttagggt tccgatttag    6240
tgctttacgg cacctcgacc ccaaaaaact tgattagggt gatggttcac gtatagggat    6300
aacagggtaa tgtagtgggc catcgccctg atagacggtt tttcgccctt tgacgttgga    6360
gtccacgttc tttaatagtg gactcttgtt ccaaactgga acaacactca accctatctc    6420
ggtctattct tttgatttat aagggatttt ggggatttcg gcctattggt taaaaaatga    6480
gctgatttaa caaaaattta acgcgaattt taacaaaata ttaacgttta caatttaaat    6540
atttgcttat acaatcttcc tgtttttggg gcttttctga ttatcaaccg gggtgggtac    6600
cgagctcgaa ttctgtggaa tgtgtgtcag ttagggtgtg gaaagtcccc aggctcccca    6660
ggcaggcaga agtatgcaaa gcatgcatct caattagtca gcaaccaggt gtggaaagtc    6720
cccaggctcc ccagcaggca gaagtatgca aagcatgcat ctcaattagt cagcaaccat    6780
agtcccgccc ctaactccgc ccatcccgcc cctaactccg cccagttccg cccattctcc    6840
gccccatggc tgactaattt tttttattta tgcagaggcc gaggccgcct cggcctctga    6900
gctattccag aagtagtgag gaggcttttt tggaggccta ggcttttgca aaaagctccc    6960
gggagcttgg atatccattt tcggatctga tcaagagaca ggatgaggat cgtttcgcat    7020
gattgaacaa gatggattgc acgcaggttc tccggccgct tgggtggaga ggctattcgg    7080
ctatgactgg gcacaacaga caatcggctg ctctgatgcc gccgtgttcc ggctgtcagc    7140
gcaggggcgc ccggttcttt ttgtcaagac cgacctgtcc ggtgccctga atgaactgca    7200
ggacgaggca gcgcggctat cgtggctggc cacgacgggc gttccttgcg cagctgtgct    7260
cgacgttgtc actgaagcgg gaagggactg gctgctattg ggcgaagtgc cggggcagga    7320
tctcctgtca tctcaccttg ctcctgccga gaaagtatcc atcatggctg atgcaatgcg    7380
gcggctgcat acgcttgatc cggctacctg cccattcgac caccaagcga aacatcgcat    7440
cgagcgagca cgtactcgga tggaagccgg tcttgtcgat caggatgatc tggacgaaga    7500
gcatcagggg ctcgcgccag ccgaactgtt cgccaggctc aaggcgcgca tgcccgacgg    7560
cgaggatctc gtcgtgaccc atggcgatgc ctgcttgccg aatatcatgg tggaaaatgg    7620
ccgcttttct ggattcatcg actgtggccg gctgggtgtg gcggaccgct atcaggacat    7680
agcgttggct acccgtgata ttgctgaaga gcttggcggc gaatgggctg accgcttcct    7740
cgtgctttac ggtatcgccg ctcccgattc gcagcgcatc gccttctatc gccttcttga    7800
cgagttcttc tgagcgggac tctggggttc gaaatgaccg accaagcgac gcccaacctg    7860
ccatcacgag atttcgattc caccgccgcc ttctatgaaa ggttgggctt cggaatcgtt    7920
ttccgggacg ccggctggat gatcctccag cgcggggatc tcatgctgga gttcttcgcc    7980
caccccaact tgtttattgc agcttataat ggttacaaat aaagcaatag catcacaaat    8040
ttcacaaata aagcattttt ttcactgcat tctagttgtg gtttgtccaa actcatcaat    8100
gtatcttatc atgtctggat cccgtcgagt ttaaacgatt taaatactgg ggctcgactg    8160
tggaatgtgt gtcagttagg gtgtggaaag tccccaggct ccccagcagg cagaagtatg    8220
caaagcatgc atctcaatta gtcagcaacc aggtgtggaa agtccccagg ctccccagca    8280
ggcagaagta tgcaaagcat gcatctcaat tagtcagcaa ccatagtccc gcccctaact    8340
ccgcccatcc cgcccctaac tccgcccagt tccgcccatt ctccgcccca tggctgacta    8400
atttttttta tttatgcaga ggccgaggcc gcctcggcct ctgagctatt ccagaagtag    8460
tgaggaggct tttttggagg cctaggcttt tgcaaaaagc ttgggggggg ggacagctca    8520
gggctgcgat ttcgcgccaa acttgacggc aatcctagcg tgaaggctgg taggatttta    8580
tccccgctgc catcatggtt cgaccattga actgcatcgt cgccgtgtcc caaaatatgg    8640
ggattggcaa gaacggagac ctaccctggc ctccgctcag gaacgagttc aagtatttcc    8700
aaagaatgac cacaacctct tcagtggaag gtaaacagaa tctggtgatt atgggtagga    8760
aaacctggtt ctccattcct gagaagaatc gacctttaaa ggacagaatt aatatagttc    8820
tcagtagaga actcaaagaa ccaccacgag gagctcattt tcttgccaaa agtttggatg    8880
atgccttaag acttattgaa caaccggaat tggcaagtaa agtagacatg gtttggatag    8940
tcggaggcag ttctgtttac caggaagcca tgaatcaacc aggccacctc agactctttg    9000
tgacaaggat catgcaggaa tttgaaagtg acacgttttt cccagaaatt gatttgggga    9060
aatataaact tctcccagaa tacccaggcg tcctctctga ggtccaggag gaaaaaggca    9120
tcaagtataa gtttgaagtc tacgagaaga aagactaaca ggaagatgct ttcaagttct    9180
ctgctcccct cctaaagcta tgcattttta taagaccatg ggacttttgc tggctttaga    9240
tcgatctttg tgaaggaacc ttacttctgt ggtgtgacat aattggacaa actacctaca    9300
gagatttaaa gctctaaggt aaatataaaa tttttaagtg tataatgtgt taaactactg    9360
attctaattg tttgtgtatt ttagattcca acctatggaa ctgatgaatg ggagcagtgg    9420
tggaatgcct ttaatgagga aaacctgttt tgctcagaag aaatgccatc tagtgatgat    9480
gaggctactg ctgactctca acattctact cctccaaaaa agaagagaaa ggtagaagac    9540
cccaaggact ttccttcaga attgctaagt tttttgagtc atgctgtgtt tagtaataga    9600
actcttgctt gctttgctat ttacaccaca aaggaaaaag ctgcactgct atacaagaaa    9660
attatggaaa aatattctgt aacctttata agtaggcata acagttataa tcataacata    9720
ctgttttttc ttactccaca caggcataga gtgtctgcta ttaataacta tgctcaaaaa    9780
ttgtgtacct ttagcttttt aatttgtaaa ggggttaata aggaatattt gatgtatagt    9840
gccttgacta gagatcataa tcagccatac cacatttgta gaggttttac ttgctttaaa    9900
aaacctccca cacctccccc tgaacctgaa acataaaatg aatgcaattg ttgttgttaa    9960
cttgtttatt gcagcttata atggttacaa ataaagcaat agcatcacaa atttcacaaa   10020
taaagcattt ttttcactgc attctagttg tggtttgtcg acgcggccgc tgtggaatgt   10080
gtgtcagtta gggtgtggaa agtccccagg ctccccagca ggcagaagta tgcaaagcat   10140
gcatctcaat tagtcagcaa ccaggtgtgg aaagtcccca ggctccccag caggcagaag   10200
tatgcaaagc atgcatctca attagtcagc aaccatagtc ccgcccctaa ctccgcccat   10260
cccgccccta actccgccca gttccgccca ttctccgccc catggctgac taattttttt   10320
tatttatgca gaggccgagg ccgcctcggc ctctgagcta ttccagaagt agtgaggagg   10380
cttttttgga ggcctaggct tttgcaaaaa gctctgagat caccggcgaa ggagggccac   10440
catggcctcg taccccggcc atcaacacgc gtctgcgttc gaccaggctg cgcgttctcg   10500
cggccatagc aaccgacgta cggcgttgcg ccctcgccgg cagcaagaag ccacggaagt   10560
ccgcccggag cagaaaatgc ccacgctact gcgggtttat atagacggtc cccacgggat   10620
ggggaaaacc accaccacgc aactgctggt ggccctgggt tcgcgcgacg atatcgtcta   10680
cgtacccgag ccgatgactt actggcgggt gctgggggct tccgagacaa tcgcgaacat   10740
ctacaccaca caacaccgcc tcgaccaggg tgagatatcg gccggggacg cggcggtggt   10800
aatgacaagc gcccagataa caatgggcat gccttatgcc gtgaccgacg ccgttctggc   10860
tcctcatatc gggggggagg ctgggagctc acatgccccg cccccggccc tcaccctcat   10920
cttcgaccgc catcccatcg ccgccctcct gtgctacccg gccgcgcggt accttatggg   10980
cagcatgacc ccccaggccg tgctggcgtt cgtggccctc atcccgccga ccttgcccgg   11040
caccaacatc gtgcttgggg cccttccgga ggacagacac atcgaccgcc tggccaaacg   11100
ccagcgcccc ggcgagcggc tggacctggc tatgctggct gcgattcgcc gcgtttacgg   11160
gctacttgcc aatacggtgc ggtatctgca gtgcggcggg tcgtggcggg aggactgggg   11220
acagctttcg gggacggccg tgccgcccca gggtgccgag ccccagagca acgcgggccc   11280
acgaccccat atcggggaca cgttatttac cctgtttcgg gcccccgagt tgctggcccc   11340
caacggcgac ctgtataacg tgtttgcctg ggccttggac gtcttggcca aacgcctccg   11400
ttccatgcac gtctttatcc tggattacga ccaatcgccc gccggctgcc gggacgccct   11460
gctgcaactt acctccggga tggtccagac ccacgtcacc acccccggct ccataccgac   11520
gatatgcgac ctggcgcgca cgtttgcccg ggagatgggg gaggctaact gagaatttcg   11580
actgaagtac ctattccgaa gttcctattc tctagaaagt ataggaactt ctcatgttct   11640
ttcctgcgtt atcccctgat tctgtggata accgtattac cgcctttgag tgagctgata   11700
ccgctcgccg cagccgaacg accgagcgca gcgagtcagt gagcgaggaa gcggaagagc   11760
gcctgatgcg gtattttctc cttacgcatc tgtgcggtat ttcacaccgc atatggtgca   11820
ctctcagtac aatctgctct gatgccgcat agttaagcca gctagaggat cataatcagc   11880
cataccacat ttgtagaggt tttacttgct ttaaaaaacc tcccacacct ccccctgaac   11940
ctgaaacata aaatgaatgc aattgttgtt gttaacttgt ttattgcagc ttataatggt   12000
tacaaataaa gcaatagcat cacaaatttc acaaataaag catttttttc actgcattct   12060
agttgtggtt tgtccaaact catcaatgta tcttatcatg tctggatccc caggaagctc   12120
ctctgtgtcc tcataaaccc taacctcctc tacttgagag gacattccaa tcataggctg   12180
cccatccacc ctctgtgtcc tcctgttaat taggtcactt aacaaaaagg aaattgggta   12240
ggggtttttc acagaccgct ttctaagggt aattttaaaa tatctgggaa gtcccttcca   12300
ctgctgtgtt ccagaagtgt tggtaaacag cccacaaatg tcaacagcag aaacatacaa   12360
gctgtcagct ttgcacaagg gcccaacacc ctgctcatca agaagcactg tggttgctgt   12420
gttagtaatg tgcaaaacag gaggcacatt ttccccacct gtgtaggttc caaaatatct   12480
agtgttttca tttttacttg gatcaggaac ccagcactcc actggataag cattatcctt  12540
atccaaaaca gccttgtggt cagtgttcat ctgctgactg tcaactgtag cattttttgg  12600
ggttacagtt tgagcaggat atttggtcct gtagtttgct aacacaccct gcagctccaa  12660
aggttcccca ccaacagcaa aaaaatgaaa atttgaccct tgaatgggtt ttccagcacc  12720
attttcatga gttttttgtg tccctgaatg caagtttaac atagcagtta ccccaataac  12780
ctcagtttta acagtaacag cttcccacat caaaatattt ccacaggtta agtcctcatt  12840
taaattaggc aaaggaattc ttgaagacga aagggcctcg tgatacgcct atttttatag  12900
gttaatgtca tgataataat ggtttcttag acgtcaggtg gcacttttcg gggaaatgtg  12960
cgcggaaccc ctatttgttt atttttctaa atacattcaa atatgtatcc gctcatgaga  13020
caataaccct gataaatgct tcaataatat tgaaaaagga agagtatgag tattcaacat  13080
ttccgtgtcg cccttattcc cttttttgcg gcattttgcc ttcctgtttt tgctcaccca  13140
gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt gggttacatc  13200
gaactggatc tcaacagcgg taagatcctt gagagttttc gccccgaaga acgttttcca  13260
atgatgagca cttttaaagt tctgctatgt ggcgcggtat tatcccgtgt tgacgccggg  13320
caagagcaac tcggtcgccg catacactat tctcagaatg acttggttga gtactcacca  13380
gtcacagaaa agcatcttac ggatggcatg acagtaagag aattatgcag tgctgccata  13440
accatgagtg ataacactgc ggccaactta cttctgacaa cgatcggagg accgaaggag  13500
ctaaccgctt ttttgcacaa catgggggat catgtaactc gccttgatcg ttgggaaccg  13560
gagctgaatg aagccatacc aaacgacgag cgtgacacca cgatgcctgt agcaatggca  13620
acaacgttgc gcaaactatt aactggcgaa ctacttactc tagcttcccg gcaacaatta  13680
atagactgga tggaggcgga taaagttgca ggaccacttc tgcgctcggc ccttccggct  13740
ggctggttta ttgctgataa atctggagcc ggtgagcgtg ggtctcgcgg tatcattgca  13800
gcactggggc cagatggtaa gccctcccgt atcgtagtta tctacacgac ggggagtcag  13860
gcaactatgg atgaacgaaa tagacagatc gctgagatag gtgcctcact gattaagcat  13920
tggtaactgt cagaccaagt ttactcatat atactttaga ttgatttaaa acttcatttt  13980
taatttaaaa ggatctaggt gaagatcctt tttgataatc tcatgaccaa aatcccttaa  14040
cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga  14100
gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg  14160
gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc  14220
agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag  14280
aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc  14340
agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg  14400
cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac  14460
accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga  14520
aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt  14580
ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag  14640
cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg  14700
gcctttttac ggttcctggc cttttgctgg ccttttgctc acatggctcg acagatccat  14760
gttctttcct gcgttatccc ctgattctgt ggataaccgt attaccgcct ttgagtgagc 14820
tgataccgct cgccgcagcc gaacgaccga gcgcagcgag tcagtgagcg aggaagcgga 14880
agagcgcctg atgcggtatt ttctccttac gcatctgtgc ggtatttcac accgcatatg 14940
gtgcactctc agtacaatct gctctgatgc cgcatagtta agccaga               14987
<210>3
<211>5023
<212>DNA
<213>人工序列
<220>
<223>载体
<400>3
gatctccagg gaccgtccct aaattctcac agacccaaat ccctgtagcc gccccacgac    60
agcgcgagga gcatgcgccc agggctgagc gcgggtagat cagagcacac aagctcacag   120
tccccggcgg tggggggagg ggcgcgctga gcgggggcca gggagctggc gcggggcaaa   180
ctgggaaagt ggtgtcgtgt gctggctccg ccctcttccc gagggtgggg gagaacggta   240
tataagtgcg gtagtcgcct tggacgttct ttttcgcaac gggtttgccg tcagaacgca   300
ggtgagtggc gggtgtggct tccgcgggcc ccggagctgg agccctgctc tgagcgggcc   360
gggctgatat gcgagtgtcg tccgcagggt ttagctgtga gcattcccac ttcgagtggc   420
gggcggtgcg ggggtgagag tgcgaggcct agcggcaacc ccgtagcctc gcctcgtgtc   480
cggcttgagg cctagcgtgg tgtccgccgc cgcgtgccac tccggccgca ctatgcgttt   540
tttgtccttg ctgccctcga ttgccttcca gcagcatggg ctaacaaagg gagggtgtgg   600
ggctcactct taaggagccc atgaagctta cgttggatag gaatggaagg gcaggagggg   660
cgactggggc ccgcccgcct tcggagcaca tgtccgacgc cacctggatg gggcgaggcc   720
tgtggctttc cgaagcaatc gggcgtgagt ttagcctacc tgggccatgt ggccctagca   780
ctgggcacgg tctggcctgg cggtgccgcg ttcccttgcc tcccaacaag ggtgaggccg   840
tcccgcccgg caccagttgc ttgcgcggaa agatggccgc tcccggggcc ctgttgcaag   900
gagctcaaaa tggaggacgc ggcagcccgg tggagcgggc gggtgagtca cccacacaaa   960
ggaagagggc cttgcccctc gccggccgct gcttcctgtg accccgtggt ctatcggccg  1020
catagtcacc tcgggcttct cttgagcacc gctcgtcgcg gcggggggag gggatctaat  1080
ggcgttggag tttgttcaca tttggtgggt ggagactagt caggccagcc tggcgctgga  1140
agtcattctt ggaatttgcc cctttgagtt tggagcgagg ctaattctca agcctcttag  1200
cggttcaaag gtattttcta aacccgtttc caggtgttgt gagctagccg ccaccatgcc  1260
acaatttgat atattatgta aaacaccacc taaggtcctg gttcgtcagt ttgtggaaag  1320
gtttgaaaga ccttcagggg aaaaaatagc atcatgtgct gctgaactaa cctatttatg  1380
ttggatgatt actcataacg gaacagcaat caagagagcc acattcatga gctataatac  1440
tatcataagc aattcgctga gtttcgatat tgtcaacaaa tcactccagt ttaaatacaa  1500
gacgcaaaaa gcaacaattc tggaagcctc attaaagaaa ttaattcctg cttgggaatt  1560
tacaattatt ccttacaatg gacaaaaaca tcaatctgat atcactgata ttgtaagtag  1620
tttgcaatta cagttcgaat catcggaaga agcagataag ggaaatagcc acagtaaaaa  1680
aatgcttaaa gcacttctaa gtgagggtga aagcatctgg gagatcactg agaaaatact  1740
aaattcgttt gagtatacct cgagatttac aaaaacaaaa actttatacc aattcctcct    1800
cctagctact ttcatcaatt gtggaagatt cagcgatatt aagaacgttg atccgaaatc    1860
atttaaatta gtccaaaata agtatctggg agtaataatc cagtgtttag tgacagagac    1920
aaagacaagc gttagtaggc acatatactt ctttagcgca aggggtagga tcgatccact    1980
tgtatatttg gatgaatttt tgaggaattc tgaaccagtc ctaaaacgag taaataggac    2040
cggcaattct tcaagcaaca aacaggaata ccaattatta aaagataact tagtcagatc    2100
gtacaacaag gctttgaaga aaaatgcgcc ttatccaatc tttgctataa agaatggccc    2160
aaaatctcac attggaagac atttgatgac ctcatttctg tcaatgaagg gcctaacgga    2220
gttgactaat gttgtgggaa attggagcga taagcgtgct tctgccgtgg ccaggacaac    2280
gtatactcat cagataacag caatacctga tcactacttc gcactagttt ctcggtacta    2340
tgcatatgat ccaatatcaa aggaaatgat agcattgaag gatgagacta atccaattga    2400
ggagtggcag catatagaac agctaaaggg tagtgctgaa ggaagcatac gataccccgc    2460
atggaatggg ataatatcac aggaggtact agactacctt tcatcctaca taaatagacg    2520
catataataa tctagagctc gctgatcagc ctcgactgtg ccttctagtt gccagccatc    2580
tgttgtttgc ccctcccccg tgccttcctt gaccctggaa ggtgccactc ccactgtcct    2640
ttcctaataa aatgaggaaa ttgcatcgca ttgtctgagt aggtgtcatt ctattctggg    2700
gggtggggtg gggcaggaca gcaaggggga ggattgggaa gacaatagca ggcatgctgg    2760
ggatgcggtg ggctctatgg cttctgaggc ggaaagaacc agctggggct cgagggggga    2820
tcccgtcgac ctcgagagct tggcgtaatc atggtcatag ctgtttcctg tgtgaaattg    2880
ttatccgctc acaattccac acaacatacg agccggaagc ataaagtgta aagcctgggg    2940
tgcctaatga gtgagctaac tcacattaat tgcgttgcgc tcactgcccg ctttccagtc    3000
gggaaacctg tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga gaggcggttt    3060
gcgtattggg cgctcttccg cttcctcgct cactgactcg ctgcgctcgg tcgttcggct    3120
gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg ttatccacag aatcagggga    3180
taacgcagga aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc    3240
cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca aaaatcgacg    3300
ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt ttccccctgg    3360
aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc tgtccgcctt    3420
tctcccttcg ggaagcgtgg cgctttctca atgctcacgc tgtaggtatc tcagttcggt    3480
gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg    3540
cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact tatcgccact    3600
ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg ctacagagtt    3660
cttgaagtgg tggcctaact acggctacac tagaaggaca gtatttggta tctgcgctct    3720
gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca aacaaaccac    3780
cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc    3840
tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg aaaactcacg    3900
ttaagggatt ttggtcatga gattatcaaa aaggatcttc acctagatcc ttttaaatta    3960
aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa acttggtctg acagttacca    4020
atgcttaatc agtgaggcac ctatctcagc gatctgtcta tttcgttcat ccatagttgc 4080
ctgactcccc gtcgtgtaga taactacgat acgggagggc ttaccatctg gccccagtgc 4140
tgcaatgata ccgcgagacc cacgctcacc ggctccagat ttatcagcaa taaaccagcc 4200
agccggaagg gccgagcgca gaagtggtcc tgcaacttta tccgcctcca tccagtctat 4260
taattgttgc cgggaagcta gagtaagtag ttcgccagtt aatagtttgc gcaacgttgt 4320
tgccattgct acaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt cattcagctc 4380
cggttcccaa cgatcaaggc gagttacatg atcccccatg ttgtgcaaaa aagcggttag 4440
ctccttcggt cctccgatcg ttgtcagaag taagttggcc gcagtgttat cactcatggt 4500
tatggcagca ctgcataatt ctcttactgt catgccatcc gtaagatgct tttctgtgac 4560
tggtgagtac tcaaccaagt cattctgaga atagtgtatg cggcgaccga gttgctcttg 4620
cccggcgtca atacgggata ataccgcgcc acatagcaga actttaaaag tgctcatcat 4680
tggaaaacgt tcttcggggc gaaaactctc aaggatctta ccgctgttga gatccagttc 4740
gatgtaaccc actcgtgcac ccaactgatc ttcagcatct tttactttca ccagcgtttc 4800
tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg cgacacggaa 4860
atgttgaata ctcatactct tcctttttca atattattga agcatttatc agggttattg 4920
tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag gggttccgcg 4980
cacatttccc cgaaaagtgc cacctgacgt cgacggatcg gga                   5023
<210>4
<211>1024
<212>DNA
<213>人工序列
<220>
<223>核酸片段(Nucleic acid fragment)
<220>
<221>misc_feature
<222>(140)..(140)
<223>n是a,c,g或t
<220>
<221>misc_feature
<222>(160)..(160)
<223>n是a,c,g或t
<400>4
tggaaacaga aactaaatag agacatagag aaaatgaaca gaagttatga accaaatgga   60
tttaaccggt atttatacaa catttcatct taaaacaaaa gaatatacct tcttctcagc  120
acctcatagc ctcttctacn aaaccatata gtcggtcacn aaacaagcct caacagatac  180
aagaagataa aaataatccc atgcatacta tcagatcacc atggactaac tctggtcttc  240
aataacaaca aaaacaatgg aagtcgaaga acactctatt caatgataac ttggtcaagg  300
aagagatgaa aaaggaaatt aaagcctttt tagaatttca tgaaaatgaa ggcacaacat  360
acccaaactt atgagacaca aggaaagcag tgctaagagg aaaactcata gctctgagtg  420
cctccaaaaa gaaacaagag agagtgtata ctagcagctt gagagcacac ctgaaagctc  480
tagaacaaaa agaagcaaat acacccaaga ggagaagatc aaatgcaggg ctgaaatcaa  540
ccaagtagaa acaaaagaac tgtaaaaaga accaacaaaa ccaggagttg gttggttgag  600
aaaatcaaaa agataaataa acccttaatc agaataacca gagggcacag aaacagtatc   660
caaattaaca aaataagaaa tggaaaggga gacgtaaaac agaatccgag gaaataaaaa   720
aaaattgatc ctattacaaa agtctatatt caacaaagct ggaaaatctg gatgaaatag   780
acaattttct agatagatac cagataccaa agttaaatca ggaccagata aatcatctaa   840
acagtcccat aactcctaaa gaaatagaag cagttattaa aattctcccg accaaaaaaa   900
aaaaaaaaaa aaagcccagg attggatggg tttagtggag aattctatca gaccttcatc   960
aaagacctaa taccaatact gtccaaacta ttccttgcaa cactgaatat tccgcataca  1020
ctat                                                               1024
<210>5
<211>50
<212>DNA
<213>人工序列
<220>
<223>引物
<400>5
acagctgtcg actgaagtac ctattccgaa gttcctattc tctagaaagt          50
<210>6
<211>50
<212>DNA
<213>人工序列
<220>
<223>引物
<400>6
cgtccggata tctaagatct gaagttccta tactttctag agaataggaa          50
<210>7
<211>81
<212>DNA
<213>人工序列
<220>
<223>PCR产品
<400>7
agacgtctcg actgaagtac ctattccgaa gttcctattc tctagaaagt ataggaactt   60
cagatcttag atatccggac g                                             81
<210>8
<211>40
<212>DNA
<213>人工序列
<220>
<223>引物
<400>8
atctggctag ccgccaccat gccacaattt gatatattat                     40
<210>9
<211>34
<212>DNA
<213>人工序列
<220>
<223>引物
<400>9
tgtcatctag attattatat gcgtctattt atgt    34
<210>10
<211>22
<212>DNA
<213>人工序列
<220>
<223>引物
<400>10
cctatggaaa aacgccagca ac                 22
<210>11
<211>22
<212>DNA
<213>人工序列
<220>
<223>引物
<400>11
ccttagaaag cggtctgtga aa                 22
<210>12
<211>19
<212>DNA
<213>人工序列
<220>
<223>引物
<400>12
gatgcctgct tgccgaata                     19
<210>13
<211>22
<212>DNA
<213>人工序列
<220>
<223>引物
<400>13
ccttagaaag cggtctgtga aa                 22
<210>14
<211>23
<212>DNA
<213>人工序列
<220>
<223>引物
<400>14
tggtatggct gattatgatc ctc                23
<210>15
<211>22
<212>DNA
<213>人工序列
<220>
<223>引物
<400>15
ccttttgctc acatggctcg ac                 22
<210>16
<211>20
<212>DNA
<213>人工序列
<220>
<223>引物
<400>16
ttgtctcatg agcggataca                20
PCT/RO/134表
申请人或代理人档案号12054/4 国际申请号PCT/FR2007/002144
关于微生物保藏的说明
(细则13之二)
Figure A20078004730000591
PCT/RO/134表(1998年7月,2004年1月再版)
  申请人或代理人档案号12054/4   国际申请号PCT/FR2007/002144
关于微生物保藏的说明
(细则13之二)
PCT/RO/134表(1998年7月,2004年1月再版)

Claims (45)

1.产生至少包含一个细胞的细胞株的方法,包括以下步骤:
-在所述细胞的基因组的高转录活性区域整合进唯一的重组酶识别位点;以及
-在所述细胞的基因组唯一的重组酶识别位点的下游整合编码转录终止信号的核酸序列。
2.根据权利要求1的方法,其中编码转录终止信号的核酸序列是编码多腺苷酸信号的序列。
3.根据权利要求1的方法,其中编码选择标记的核酸序列还包括弱活性多腺苷酸序列。
4.根据权利要求1到3的方法,其中编码转录终止信号的核酸序列是编码全部或部分SV40前多腺苷酸信号或者腺病毒L1多腺苷酸信号的序列。
5.根据权利要求1到3中任意一项的方法,其中编码转录终止信号的核酸序列是多腺苷酸信号的变异或删除的序列,这些变异和删除选自由增加分开AATAAA元素和富含GT区域的距离,从出现于AATAAA六核酸上游一个或几个核苷酸起删除SV40后多A,删除位于在AATAAA序列上游第13到48核苷酸中的的某些元素,删除AATAAA序列下游的富含GT的序列并伴随对位于AATAAA序列和富含GT区域之间的空间的修饰,或者改变或删除位于AATAAA序列上游的USE(上游序列元素)区域组成的组,所述变异以及/或者删除使其可以与未变异的序列相比降低多腺苷酸信号的效率。
6.根据权利要求1的方法,其中细胞是哺乳动物细胞。
7.根据权利要求1的方法,其中整合唯一的重组酶识别位点通过一系列步骤实现,步骤至少包括:
-整合两条都编码重组酶识别位点的核酸序列;
-整合位于两条都编码重组酶识别位点的序列之间的编码报道基因的核酸序列;
-整合位于两条都编码重组酶识别位点的序列之间的编码感兴趣蛋白的核酸序列;
-整合位于两条都编码重组酶识别位点的序列之间的编码选择标记的核酸序列,优选地是赋予对抗生素抗性的基因。
8.根据权利要求1的方法,其中所选择的细胞仅是已经整合了权利要求7中详述的序列集的单个拷贝的高产量细胞。
9.根据权利要求8的方法,其中只选择那些pcd(皮克蛋白质/细胞/天)为5或以上,或者优选地为10或以上的细胞。
10.根据权利要求7的方法,其中一系列的步骤还包括通过重组酶对细胞的作用切除在权利要求5中详述的序列集。
11.根据权利要求7的方法,其中重组酶的作用是通过利用携带编码所述重组酶的核酸序列的载体将所述重组酶在细胞中共表达而产生的。
12.根据权利要求7的方法,其中一系列的步骤还包括对细胞的选择,从中权利要求7所详述的核酸序列集已经被切除并且具有完整的重组酶识别位点。
13.根据权利要求7的方法,其中一系列的步骤还包括结合编码1型单纯疱疹病毒的胸苷激酶(HSV1-TK)的核酸序列。
14.根据权利要求13的方法,其中在切除之前对细胞的选择通过在培养基中加入更昔洛韦来进行。
15.根据权利要求7到14中任意一项的方法,其中对细胞的选择是通过在培养基中加入剂量大于或等于1g/l,优选地大于或等于2g/l,4g/l或甚至8g/l的抗生素而实现的。
16.根据权利要求1的方法,其中重组酶识别序列是loxP和/或FRT序列。
17.根据权利要求7的方法,其中感兴趣的蛋白是抗体或抗体片段。
18.根据权利要求1的方法,其中细胞是哺乳动物细胞,选自由鼠骨髓瘤细胞株,特别的是YB2/0(ATCC CRL-1662)和IR983F,人骨髓瘤如Namalwa或其它人体细胞如PERC6,CHO细胞株(特别地CHO-K,CHOLec10,CHO-Lec1,CHO Pro-5,CHO dhfr-,CHO Lec13)或其他选自Wil-2,Jurkat,Vero,Molt-4,COS-7,293-HEK,BHK,K6H6,NSO,SP2/0-Ag 14以及P3X63Ag8.653的株组成的组。
19.根据权利要求7的方法,其中一系列的步骤还包括转染所选择的细胞株,转染是用携带编码所感兴趣蛋白或多肽的核酸序列以及直接在编码选择标记的核酸序列下游的编码重组酶识别位点的核酸序列,优选地赋予对抗生素的抗性且没有任何多腺苷酸序列的表达载体来实现的。
20.根据权利要求19的方法,其中所述表达载体通过所述重组酶的作用插入于唯一的重组酶识别位点。
21.根据权利要求19的方法,其中携带整合于目标位点的表达载体的细胞是通过对感兴趣蛋白的表达的分析以及通过在培养基中加入大剂量抗生素的方法进行选择的。
22.根据权利要求7的方法,其中所述感兴趣的蛋白和多肽是治疗性的蛋白或多肽,特别是选自对消化的,胰腺的,胆汁的,抗病毒的,抗炎的,肺的,抗菌的,血液的,神经的,心血管的,眼科的,抗原的,脑的,抗肿瘤的,免疫刺激的,免疫调节功能有活性的组。
23.根据权利要求1到22中任意一种方法产生的细胞株。
24.一种细胞株,携带稳定地整合进其基因组的在所述细胞基因组的高转录活性区域的唯一的重组酶识别位点,直接在所述唯一的重组酶识别位点下游的编码转录终止信号的核酸序列。
25.根据权利要求24的细胞株,其中编码转录终止信号的核酸序列是编码多腺苷酸信号,特别是弱活性多腺苷酸信号的序列。
26.根据权利要求24的细胞株,其中编码转录终止信号的核酸序列是编码至少部分SV40前多腺苷酸信号的序列。
27.根据权利要求24的细胞株,其中该细胞是哺乳动物细胞。
28.根据权利要求24的细胞株,其中该细胞还携带:
-两条都编码重组酶识别位点的核酸序列;
-至少一条位于两条都编码重组酶识别位点的序列之间的编码感兴趣蛋白的核酸序列;以及
-至少一条编码选择标记的核酸序列,优选地是赋予抗菌素抗性的基因,位于两条都编码重组酶识别位点的序列之间,所述编码选择标记的所述序列直接位于编码所述转录终止信号的核酸序列的上游。
29.一种细胞株,其中权利要求28所述的序列被一起整合于一个单独的拷贝中。
30.根据权利要求29的细胞株,其中该细胞的pcd(皮克蛋白/细胞/天)值为10或超过10。
31.一种细胞株,其中细胞仅携带一个完整的识别重组酶位点。
32.根据权利要求24的细胞株,其中重组酶识别序列是loxP和/或FRT序列。
33.根据权利要求28的细胞株,其中感兴趣的蛋白是抗体或抗体片段。
34.根据权利要求24修饰的细胞株,其中在修饰前的源细胞是哺乳动物细胞,选自包含鼠骨髓瘤细胞株,特别的是YB2/0(ATCC CRL-1662)和IR983F,像Namalwa或像PERC6,CHO细胞株(特别地CHO-K,CHOLec,CHO-Lec1,CHO Pro-5,CHO dhfr-,CHO Lec13)这样的任何其他的人体细胞或其他选自Wil-2,Jurkat,Vero,Molt-4,COS-7,293-HEK,BHK,K6H6,NSO,SP2/0-Ag 14,P3X63Ag8.653的组。
35.根据权利要求28的细胞株,其携带在编码感兴趣蛋白的核酸序列下游的编码重组酶识别位点的核酸序列以及编码选择标记的核酸序列,优选地赋予对抗生素的抗性,而没有多腺苷酸序列。
36.根据权利要求24或权利要求28的细胞株,过度表达感兴趣的蛋白或多肽,其选自对消化的,胰腺的,胆汁的,抗病毒的,抗炎的,肺的,抗菌的,血液的,神经的,心血管的,眼科的,抗原的,脑的,抗肿瘤的,免疫刺激的,免疫调节功能有活性的感兴趣的蛋白或多肽的组。
37.一种细胞株,由注册申请号为CNCM I-3704的编号YGM-1/10G10做参考确定。
38.一种细胞株,由注册申请号为CNCM I-3885的编号YGM-2/3G5做参考确定。
39.一种分离的核酸分子,包含由编号SEQ ID NO:1确定的核酸片段。
40.一种载体,携带由编号SEQ ID NO:1的列表中序列确定的核酸序列。
41.一种用于生产至少一种感兴趣的蛋白或多肽的方法,其特征在于根据权利要求24到38中任意一权利要求的细胞株以使所述感兴趣的蛋白能够得以表达的方式培养,接着包括至少一个收获所述感兴趣蛋白的步骤。
42.根据权利要求41的用于生产至少一种感兴趣的蛋白或多肽的方法,其特征在于基于根据权利要求37或38的细胞。
43.根据权利要求41或42的方法,其中感兴趣的蛋白或多肽选自对消化的,胰腺的,胆汁的,抗病毒的,抗炎的,肺的,抗菌的,血液的,神经的,心血管的,眼科的,抗原的,脑的,抗肿瘤的,免疫刺激的,免疫调节功能有活性的感兴趣的蛋白或多肽。
44.根据权利要求43的方法,其中感兴趣的蛋白或多肽是抗体或抗体片段。
45.一种载体,含有序列SEQ ID NO:2。
CN200780047300A 2006-12-20 2007-12-20 用于生产蛋白,特别是治疗用蛋白的高转录活性细胞株 Pending CN101646774A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR0611157 2006-12-20
FR0611157A FR2910490B1 (fr) 2006-12-20 2006-12-20 Lignee cellulaire a forte activite transcriptionnelle pour la production de proteines, notamment therapeutiques

Publications (1)

Publication Number Publication Date
CN101646774A true CN101646774A (zh) 2010-02-10

Family

ID=38255098

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200780047300A Pending CN101646774A (zh) 2006-12-20 2007-12-20 用于生产蛋白,特别是治疗用蛋白的高转录活性细胞株

Country Status (8)

Country Link
EP (1) EP2121917B1 (zh)
JP (1) JP2010512776A (zh)
KR (1) KR20090125035A (zh)
CN (1) CN101646774A (zh)
AU (1) AU2007346339A1 (zh)
CA (1) CA2671825A1 (zh)
FR (1) FR2910490B1 (zh)
WO (1) WO2008096070A2 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108884456A (zh) * 2015-10-01 2018-11-23 麻省理工学院 生物状态机

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DK2150617T3 (en) 2007-06-04 2015-01-12 Regeneron Pharma Regions with increased expression and stability
DK2714936T3 (en) * 2011-06-01 2019-03-25 Prec Biosciences Inc METHODS AND PRODUCTS FOR PRODUCING MANIPULATED MAMMAL CELL LINES WITH AMPLIFIED TRANSGENES
US11261462B2 (en) 2016-01-27 2022-03-01 Just-Evotec Biologics, Inc. Inducible expression from transposon-based vectors and uses
US11098310B2 (en) 2016-01-27 2021-08-24 Just-Evotec Biologics, Inc. Expression from transposon-based vectors and uses
JP6937309B2 (ja) 2016-01-27 2021-09-22 ジャスト−エヴォテック バイオロジックス、インコーポレイテッド ハイブリッドプロモーターおよびその使用
WO2023044430A2 (en) * 2021-09-17 2023-03-23 Homology Medicines, Inc. Non-naturally occurring polyadenylation elements and methods of use thereof

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004061104A2 (en) * 2003-01-07 2004-07-22 Symphogen A/S Method for manufacturing recombinant polyclonal proteins

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108884456A (zh) * 2015-10-01 2018-11-23 麻省理工学院 生物状态机

Also Published As

Publication number Publication date
FR2910490B1 (fr) 2012-10-26
WO2008096070A3 (fr) 2008-10-23
EP2121917B1 (fr) 2014-02-26
CA2671825A1 (en) 2008-08-14
AU2007346339A1 (en) 2008-08-14
WO2008096070A2 (fr) 2008-08-14
FR2910490A1 (fr) 2008-06-27
JP2010512776A (ja) 2010-04-30
KR20090125035A (ko) 2009-12-03
EP2121917A2 (fr) 2009-11-25
WO2008096070A8 (fr) 2009-07-16

Similar Documents

Publication Publication Date Title
KR102191739B1 (ko) 변형된 구제역 바이러스 3c 프로테아제, 조성물 및 이의 방법
KR20210149060A (ko) Tn7-유사 트랜스포존을 사용한 rna-유도된 dna 통합
KR101982360B1 (ko) 콤팩트 tale-뉴클레아제의 발생 방법 및 이의 용도
AU2021204620A1 (en) Central nervous system targeting polynucleotides
CN101646774A (zh) 用于生产蛋白,特别是治疗用蛋白的高转录活性细胞株
KR20100113112A (ko) 개선된 포유동물 발현 벡터 및 이의 용도
CA2834053C (en) Yeast strains engineered to produce ethanol from glycerol
AU2016343979A1 (en) Delivery of central nervous system targeting polynucleotides
KR102628872B1 (ko) 세포의 증식을 제어하기 위해 세포 분열 좌위를 사용하기 위한 도구 및 방법
US20040244071A1 (en) Method for stable inversion of dna sequence by site-specific recombination and dna vectors and transgenic cells thereof
US20200188531A1 (en) Single-vector gene construct comprising insulin and glucokinase genes
AU2024202827A1 (en) Engraftable cell-based immunotherapy for long-term delivery of therapeutic proteins
CN106661573B (zh) 多核苷酸文库的重组酶介导的整合
PT1984512T (pt) Sistema de expressão génica utilizando excisão-união em insetos
CN113817775B (zh) 修饰的阿柏西普、组合物、方法及其在基因治疗中的应用
CN112041334A (zh) 人foxp3在经基因编辑的t细胞中的表达
CN112154211A (zh) 用于束缚供体dna的修饰的核酸编辑系统
CN113692225B (zh) 经基因组编辑的鸟类
CN111315212B (zh) 经过基因组编辑的鸟
KR20210122801A (ko) 간 특이적 유도성 프로모터 및 이의 사용 방법
CN116848237A (zh) 病毒样颗粒及其生产方法
CN116323942A (zh) 用于基因组编辑的组合物及其使用方法
KR102664852B1 (ko) 광 유도 유전자 발현 조절용 벡터 시스템 및 이의 용도
CN114958758B (zh) 一种乳腺癌模型猪的构建方法及应用

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20100210