CN102119215A - 改良的蛋白表达系统 - Google Patents

改良的蛋白表达系统 Download PDF

Info

Publication number
CN102119215A
CN102119215A CN2009801311221A CN200980131122A CN102119215A CN 102119215 A CN102119215 A CN 102119215A CN 2009801311221 A CN2009801311221 A CN 2009801311221A CN 200980131122 A CN200980131122 A CN 200980131122A CN 102119215 A CN102119215 A CN 102119215A
Authority
CN
China
Prior art keywords
seq
sequence
dna polynucleotide
cell
promoter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2009801311221A
Other languages
English (en)
Other versions
CN102119215B (zh
Inventor
夏洛特·迪林
威廉·阿德里安·德容
彼得·比尔克·拉斯穆森
海琳·里克加德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Affitech AS
Affitech Research AS
Original Assignee
Affitech AS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Affitech AS filed Critical Affitech AS
Publication of CN102119215A publication Critical patent/CN102119215A/zh
Application granted granted Critical
Publication of CN102119215B publication Critical patent/CN102119215B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/43504Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates
    • C07K14/43563Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from insects
    • C07K14/43577Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from insects from flies
    • C07K14/43581Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from insects from flies from Drosophila
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/65Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression using markers

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Insects & Arthropods (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Toxicology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)

Abstract

公开了含有在果蝇S2细胞中具有启动子活性的核酸序列的DNA多核苷酸,其中所述的核酸序列选自(i)在每个末端具有或没有侧翼限制位点序列的SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:33、SEQ ID NO:36、SEQ ID NO:37或SEQ ID NO:68的核苷酸序列;(ii)与(i)的任何一种序列具有至少80%序列同一性的功能核苷酸序列;(iii)为(i)或(ii)的任何一种序列的至少6个连续核苷酸的功能片段的核苷酸;(iv)与(iii)的所述功能片段具有至少80%序列同一性的功能核苷酸序列;(v)包含(i)、(ii)、(iii)和(iv)的任何一种序列的两种或更多种序列的第一嵌合核苷酸序列,和(vi)第二嵌合核苷酸序列,包含至少6个核苷酸且包含来自(iii)和/或(iv)的至少两种核苷酸序列的连续核苷酸序列段,其中每个单独的所述连续核苷酸序列段在果蝇S2细胞中不具有启动子活性。还公开了包含所述多核苷酸的载体和细胞以及利用所述多核苷酸生产感兴趣的多肽的方法。

Description

改良的蛋白表达系统
发明领域
本发明涉及基因工程和分子生物学领域。具体地,本发明涉及新型启动子DNA多核苷酸和其在宿主细胞尤其在黑腹果蝇(Drosophila melanogaster)中作为改良蛋白表达的工具的应用。此外,本发明涉及包含多核苷酸的载体和这些载体在多肽的重组表达中的应用,尤其是在诸如包括真核蛋白(例如,哺乳动物的,比如人的,但还包括原生动物的或蠕虫的)和病毒蛋白的制药用的工业酶或蛋白的蛋白异源表达中的应用。本发明与蛋白表达领域特别相关,其中表达产物由重组宿主细胞分泌,尤其当这些宿主细胞是昆虫细胞时。
发明背景
蛋白生产系统,其中感兴趣的多肽或蛋白在重组有机体或细胞中生产,是商业生物技术的支柱。最早的系统基于诸如大肠杆菌(E.coli)等宿主中的细菌表达,已经与基于真核宿主的系统联合,所述真核宿主特别是基于培养中的哺乳动物细胞、培养中的和完整昆虫形式的昆虫细胞以及诸如绵羊和山羊等转基因哺乳动物。
原核细胞培养系统易于维持并操作便宜。但是,原核细胞不能进行真核蛋白的翻译后修饰。而且,许多蛋白错误折叠,需要特定程序对其重折叠,这增加了生产成本。
真核细胞培养系统已被记载有许多应用。例如,哺乳动物细胞能够进行翻译后修饰,并且通常生产正确折叠和可溶的蛋白。哺乳动物细胞系统的主要缺点包括对专门的且昂贵的培养设备的需求、能够导致全部培养物丧失的感染的风险、以及终产物被潜在的危害性哺乳动物蛋白污染的风险。
昆虫细胞还用于多肽表达。在昆虫细胞中最广泛使用的表达系统基于杆状病毒载体。杆状病毒表达载体是通过用在强的天然多角体蛋白启动子的控制下的异源基因替换杆状病毒的多角体蛋白基因而构建的,杆状病毒的多角体蛋白基因编码杆状病毒的主要结构蛋白。用重组病毒感染培养的昆虫宿主细胞,从而产生的蛋白可从细胞本身回收,或如果使用了适宜的分泌信号的话,可从培养基中回收。但是,这些系统仍受到与表达水平和质量的重复性、培养物的感染相关的问题的困扰,并可能需要专门的培养设备。此外,用于某些蛋白的生产的杆状病毒原液可能必须在GMP条件下制备,随着时间并不一直稳定。
在黑腹果蝇S2细胞中用于蛋白表达的适宜启动子还包括pMT启动子和P2ZOp2F(OPIE2启动子)。
Chung等人,Molecular and Cellular Biology,第10卷,第12期,1992涉及Actin5C远端启动子中正调节元件和负调节元件的表征。
Angelichio等人,Nucleic Acids Research,第19卷,第18期,5037-5043,1991涉及用于培养的果蝇细胞中异源基因表达的若干启动子和多聚腺苷酸化信号的比较。
本发明的一个目的是在宿主细胞中,特别在黑腹果蝇中,提供更有效的表达和/或分泌。另一个目的是提供促进这种有效表达和分泌的多核苷酸和载体。
发明概述
在宽泛的方面中,本发明涉及适宜用于感兴趣的多肽的异源表达的启动子DNA多核苷酸。在另一个宽泛的方面中,本发明涉及分离的DNA多核苷酸,即所谓的表达载体,其包含适宜于诸如在治疗上有效的蛋白或工业酶等感兴趣的蛋白以相对高的量表达和生产的这种启动子DNA多核苷酸。
因此,在第一个方面中,本发明涉及启动子DNA多核苷酸,其包含至少一种选自由以下组成的组的序列:
(i)在每个末端具有或没有侧翼限制位点序列的SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:33、SEQ ID NO:36、SEQ ID NO:37或SEQ ID NO:68的核苷酸序列;
(ii)与(i)的任何一种序列具有至少80%序列同一性且在果蝇S2细胞中具有启动子活性的功能核苷酸序列;
(iii)为(i)或(ii)的任何一种序列的至少6个连续核苷酸的功能片段的核苷酸,所述功能片段在果蝇S2细胞中具有启动子活性;
(iv)与(iii)的所述功能片段具有至少80%序列同一性且在果蝇S2细胞中具有启动子活性的功能核苷酸序列;
(v)包含(i)、(ii)、(iii)和(iv)的任何一种序列的两种或更多种序列的第一嵌合核苷酸序列,和
(vi)在果蝇S2细胞中具有启动子活性的第二嵌合核苷酸序列,包含至少6个核苷酸且包含来自(iii)和/或(iv)的至少两种核苷酸序列的连续核苷酸序列段,其中每个单独的所述连续核苷酸序列段在果蝇S2细胞中不具有启动子活性。
在第二个方面中,本发明涉及适宜于感兴趣的多肽在昆虫细胞中的异源表达的分离的DNA多核苷酸,所述DNA多核苷酸包含:
启动子DNA多核苷酸,其包含至少一种选自由以下组成的组的序列:
(i)在每个末端具有或没有侧翼限制位点序列的SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:33、SEQ ID NO:36、SEQ ID NO:37或SEQ ID NO:68的核苷酸序列;
(ii)与(i)的任何一种序列具有至少80%序列同一性且在果蝇S2细胞中具有启动子活性的功能核苷酸序列;
(iii)为(i)或(ii)的任何一种序列的至少6个连续核苷酸的功能片段的核苷酸,所述功能片段在果蝇S2细胞中具有启动子活性;
(iv)与(iii)的所述功能片段具有至少80%序列同一性且在果蝇S2细胞中具有启动子活性的功能核苷酸序列;
(v)包含(i)、(ii)、(iii)和(iv)的任何一种序列的两种或更多种序列的第一嵌合核苷酸序列,和
(vi)在果蝇S2细胞中具有启动子活性的第二嵌合核苷酸序列,包含至少6个核苷酸且包含来自(iii)和/或(iv)的至少两种核苷酸序列的连续核苷酸序列段,其中每个单独的所述连续核苷酸序列段在果蝇S2细胞中不具有启动子活性。
在第三个方面中,本发明涉及包含适宜于感兴趣的多肽在昆虫细胞中的异源表达的DNA多核苷酸的细胞,所述DNA多核苷酸包含启动子DNA多核苷酸,所述启动子DNA多核苷酸包含至少一种选自由以下组成的组的序列:
(i)在每个末端具有或没有侧翼限制位点序列的SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:33、SEQ ID NO:36、SEQ ID NO:37或SEQ ID NO:68的核苷酸序列;
(ii)与(i)的任何一种序列具有至少80%序列同一性且在果蝇S2细胞中具有启动子活性的功能核苷酸序列;
(iii)为(i)或(ii)的任何一种序列的至少6个连续核苷酸的功能片段的核苷酸,所述功能片段在果蝇S2细胞中具有启动子活性;
(iv)与(iii)的所述功能片段具有至少80%序列同一性且在果蝇S2细胞中具有启动子活性的功能核苷酸序列;
(v)包含(i)、(ii)、(iii)和(iv)的任何一种序列的两种或更多种序列的第一嵌合核苷酸序列,和
(vi)在果蝇S2细胞中具有启动子活性的第二嵌合核苷酸序列,包含至少6个核苷酸且包含来自(iii)和/或(iv)的至少两种核苷酸序列的连续核苷酸序列段,其中每个单独的所述连续核苷酸序列段在果蝇S2细胞中不具有启动子活性。
在另一个方面中,本发明涉及一种生产由多核苷酸编码的感兴趣的多肽的方法,所述方法包括以下步骤:
(a)获得编码感兴趣的多肽的多核苷酸序列;
(b)将编码感兴趣的多肽的多核苷酸序列插入适宜于感兴趣的多肽在昆虫细胞中的异源表达的DNA多核苷酸,所述多核苷酸包含启动子DNA多核苷酸,所述启动子DNA多核苷酸包含至少一种选自由以下组成的组的序列:
(i)在每个末端具有或没有侧翼限制位点序列的SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:33、SEQ ID NO:36、SEQ ID NO:37或SEQ ID NO:68的核苷酸序列;
(ii)与(i)的任何一种序列具有至少80%序列同一性且在果蝇S2细胞中具有启动子活性的功能核苷酸序列;
(iii)为(i)或(ii)的任何一种序列的至少6个连续核苷酸的功能片段的核苷酸,所述功能片段在果蝇S2细胞中具有启动子活性;
(iv)与(iii)的所述功能片段具有至少80%序列同一性且在果蝇S2细胞中具有启动子活性的功能核苷酸序列;
(v)包含(i)、(ii)、(iii)和(iv)的任何一种序列的两种或更多种序列的第一嵌合核苷酸序列,和
(vi)在果蝇S2细胞中具有启动子活性的第二嵌合核苷酸序列,包含至少6个核苷酸且包含来自(iii)和/或(iv)的至少两种核苷酸序列的连续核苷酸序列段,其中每个单独的所述连续核苷酸序列段在果蝇S2细胞中不具有启动子活性;
(c)用步骤(b)中所获得的多核苷酸转化宿主细胞;
(d)允许步骤(b)中所获得的多核苷酸表达以生产多肽;和
(e)由此获得多肽。
在另一个方面中,本发明涉及由一种方法生产的多肽,所述方法包括以下步骤:
(a)获得编码感兴趣的多肽的多核苷酸序列;
(b)将编码感兴趣的多肽的多核苷酸序列插入适宜于感兴趣的多肽在昆虫细胞中的异源表达的DNA多核苷酸,所述多核苷酸包含启动子DNA多核苷酸,所述启动子DNA多核苷酸包含至少一种选自由以下组成的组的序列:
(i)在每个末端具有或没有侧翼限制位点序列的SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:33、SEQ ID NO:36、SEQ ID NO:37或SEQ ID NO:68的核苷酸序列;
(ii)与(i)中的任何一种序列具有至少80%序列同一性且在果蝇S2细胞中具有启动子活性的功能核苷酸序列;
(iii)为(i)或(ii)的任何一种序列的至少6个连续核苷酸的功能片段的核苷酸,所述功能片段在果蝇S2细胞中具有启动子活性;
(iv)与(iii)的所述功能片段具有至少80%序列同一性且在果蝇S2细胞中具有启动子活性的功能核苷酸序列;
(v)包含(i)、(ii)、(iii)和(iv)的任何一种序列的两种或更多种序列的第一嵌合核苷酸序列,和
(vi)在果蝇S2细胞中具有启动子活性的第二嵌合核苷酸序列,包含至少6个核苷酸且包含来自(iii)和/或(iv)的至少两种核苷酸序列的连续核苷酸序列段,其中每个单独的所述连续核苷酸序列段在果蝇S2细胞中不具有启动子活性;
(c)用步骤(b)中所获得的多核苷酸转化宿主细胞;
(d)允许步骤(b)中所获得的多核苷酸表达以生产多肽;和
(e)由此获得多肽。
附图简述
图1:不同转染的突变体Actin5C启动子在稳定转化和瞬时转化中与p2ZOP2F载体中的pOPIE2启动子相比的标准化蛋白表达水平。(b)..(d)指利用含有突变体Actin5C启动子的质粒pHP11的分别转染。
图2:瞬时表达过程中全长的和截短的HSP70启动子的表达水平。在实验中pOPIE2用作对照。
图3:利用六种不同启动子驱动蛋白表达的稳定细胞系的RANKL生产水平。这些启动子包括突变的Actin5C启动子的三种形式(全长启动子,(2)截短的形式(载体pHP17)和(3)612bp的最短的截短形式),HSP70启动子的两种形式(截短的HSP70启动子和HSP70核心启动子)和作为对照的pOPIE2启动子。
图4:瞬时转染过程中获得的标准化表达水平。这些启动子包括突变的Actin5C启动子的三种形式(全长启动子,(2)截短形式(载体pHP17)和(3)612bp的最短的截短形式),截短的HSP70启动子和作为对照的pOPIE2启动子。
图5:pOPIE2启动子和Actin5C核心启动子和HSP70核心启动子在瞬时转染中的表达水平。
图6示出根据本发明的一种适宜载体,pHP15c_su(hw)载体。
图7示出根据本发明的一种适宜载体,pHP15c载体。
图8:肌动蛋白-HSP70核心杂合启动子和截短的肌动蛋白5c启动子(在图中称为启动子p1_var 2)的表达水平的对比。重复两次瞬时表达实验。(参见表A3的原始数据)。
图9:将内含子或两个侧翼基质附着区加入到pHP34s-杂合体载体中的效应。该实验利用由独立的三次重复转染制备的稳定的多克隆细胞系重复进行三次摇瓶实验。(参见表A2的原始数据)
图10:载体图谱。
(A)含RANKL编码区的pHP34s-杂合体载体的载体图谱。
(B)含截短的肌动蛋白5c启动子的原始pHP34s载体。杂合启动子由截短肌动蛋白5c启动子的上游部分(减去肌动蛋白5c核心启动子)和HSP70核心启动子组成。
图11:含RANKL的pHP34s-杂合体-hSAR-FR的载体图谱。hSAR或HSP70基质附着区以正向和反向插入,在表达盒的侧翼。hSAR元件在同样位置还以三种其它可能的方向(反向-反向;反向-正向;正向-正向)插入。
图12:含RANKL蛋白的编码序列的pHP34s-杂合体.i的载体图谱。“i”指示内含子在ATG起始密码子上游的插入。内含子在载体图谱中被表示为“intrn”。
图13:pHP34s-杂合体(称为:杂合体)和pHP34s-杂合体.i(含有内含子,称为:杂合体RNA+)的RANKL表达水平,与两种商业上可获得的载体相对比。(参见表A1的原始数据)。
图14:利用BIP信号序列,LIC使pHP34s-杂合体能够进行C-末端组氨酸标签的细胞外表达。SacB基因使大肠杆菌细胞具有蔗糖敏感性。在LIC克隆过程中应通过限制酶切消化去除SacB基因,并替换为感兴趣的基因。如果SacB基因没有被替换,则其用过反向选择标记来去除背景(不正确的)集落。LIC位点被表示为5′LIC和LIC3-CTHF。这个特定载体具有SEQ ID NO:69所列出的序列。SEQ ID NO:69-73显示了相似的载体,其中使得N-或C-末端组氨酸标签具有或没有TEV蛋白酶位点,以允许进行细胞内或细胞外表达。
发明详述
如上所述,本发明的发明人发现了适宜于异源蛋白在昆虫细胞中高水平表达的特定的高效启动子和调控元件以及它们的组合。
本文所使用的“异源表达”指某特定多肽被通常不表达和分泌该多肽的宿主细胞的表达。本文所使用的术语“启动子DNA多核苷酸”表示向细胞提供用于与其可操作地连接的编码序列表达的调控序列的核苷酸序列。通常,编码序列位于启动子序列的3′端。启动子DNA多核苷酸可以由近端和较远端上游元件和其它功能片段或元件组成,其它功能元件常被称为增强子。
本文所使用的术语“功能片段”、“元件”和“增强子”指启动子的DNA序列和部分,能够激发启动子活性并可以作为启动子的固有元件或被插入的异源元件以增强启动子的水平或组织特异性。为本领域技术人员所理解的是,不同启动子可以在不同组织或细胞类型中、或发育的不同阶段中或在对不同环境条件的响应中指导基因的表达。允许其所连接的基因持续转录的未被调控的启动子常被称为“组成型启动子”。
除非另有所指,否则本文所使用的术语核酸的“序列同一性”指按(nref-ndif)·100/nref计算的序列同一性,其中ndif是当比对时两个序列中不相同的残基的总数目,其中nref是一个序列中的残基的数目。因此,DNA序列agtcagtc将与序列aatcaatc具有75%的序列同一性(ndif=2且nref=8)。
在某些实施方案中,序列同一性通过常规方法来确定,例如,Smith和Waterman,1981,Adv.Appl.Math.2:482;通过探究相似性的方法来确定,例如,Pearson & Lipman,1988,Proc.Natl.Acad.Sci.USA 85:2444;利用Thompson等,1994,Nucleic Acids Res 22:4673-80的CLUSTAL W算法来确定,通过这些算法的计算机实现(威斯康星遗传学软件包(Wisconsin Genetics Software Package),遗传学计算机组(Genetics Computer Group)中的GAP、BESTFIT、FASTA和TFASTA)来确定。还可使用BLAST算法(Altschul等,1990,Mol.Biol.215:403-10,其中所用软件可通过美国国立生物技术信息中心(National Center for Biotechnology Information)www.ncbi.nlm.nih.gov/获得)。当使用任何上述算法时,使用“窗口”长度、空位罚值等的默认参数。
本文所使用的术语“嵌合核苷酸序列”指由来自第一个原始核苷酸序列的第一个核苷酸序列与来自第二个原始核苷酸序列的第二个核苷酸序列融合所组成的核苷酸序列,其中第一个原始序列和第二个原始序列通常在同一序列中并不互相融合。
当本文中指出第一种多核苷酸与第二种多核苷酸相比表现出改良的/更高的“蛋白表达水平”时,表示当利用多核苷酸转化并培养参照细胞(通常为昆虫细胞,比如果蝇S2细胞)来获得相同条件下的多核苷酸的表达时,第一种多核苷酸与第二种多核苷酸相比提供了更大量的可回收的蛋白表达产物。
“S2细胞”指来自施耐德-2(Schneider-2)胚胎黑腹果蝇细胞系的细胞,是缩写形式,可获自Inhoffenstraβe 7B,38124Braunschweig,Germany的德国微生物菌种保藏中心(DSMZ-Deutsche Sammlung von Mikroorganismen und Zellkulturen GmbH),保藏号为DSMZ ACC 130,和P.O.Box 1549,Manassas,VA 20108,USA的美国典型菌种保藏中心(ATCC),保藏号为CRL-1963。
在某些实施方案中,根据本发明的启动子DNA多核苷酸包含选自由以下组成的组的序列:
在每个末端具有或没有侧翼限制位点序列的SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:33、SEQ ID NO:36、SEQ ID NO:37或SEQ ID NO:68的核苷酸序列。
在某些实施方案中,启动子DNA多核苷酸包含SEQ ID NO:1的核苷酸序列。在某些实施方案中,启动子DNA多核苷酸包含SEQ ID NO:2的核苷酸序列。在某些实施方案中,启动子DNA多核苷酸包含SEQ ID NO:3的核苷酸序列。在某些实施方案中,启动子DNA多核苷酸包含SEQ ID NO:4的核苷酸序列。在某些实施方案中,启动子DNA多核苷酸包含SEQ ID NO:5的核苷酸序列。在某些实施方案中,启动子DNA多核苷酸包含SEQ ID NO:6的核苷酸序列。在某些实施方案中,启动子DNA多核苷酸包含SEQ ID NO:33的核苷酸序列。在某些实施方案中,启动子DNA多核苷酸包含SEQ ID NO:36的核苷酸序列。在某些实施方案中,启动子DNA多核苷酸包含SEQ ID NO:37的核苷酸序列。在某些实施方案中,启动子DNA多核苷酸包含SEQ ID NO:68的核苷酸序列,任选地没有残基1或1-2或1-3或1-4或1-5或1-6和/或任选地没有残基587-592或588-592或589-592或590-592或591-592或592。
在某些实施方案中,根据本发明的启动子DNA多核苷酸包含与SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:33、SEQ ID NO:36、SEQ ID NO:37或SEQ ID NO:68的任何一种序列具有至少80%序列同一性的序列。
在某些实施方案中,根据本发明的启动子DNA多核苷酸包含与SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:33、SEQ ID NO:36、SEQ ID NO:37或SEQ ID NO:68的任何一种序列具有至少80%序列同一性的功能核苷酸序列,所述功能核苷酸序列在果蝇S2细胞中具有启动子活性。
在某些实施方案中,根据本发明的启动子DNA多核苷酸包含与SEQ ID NO:1的序列具有至少80%序列同一性的序列。在某些实施方案中,根据本发明的启动子DNA多核苷酸包含与SEQ ID NO:2的序列具有至少80%序列同一性的序列。在某些实施方案中,根据本发明的启动子DNA多核苷酸包含与SEQ ID NO:3的序列具有至少80%序列同一性的序列。在某些实施方案中,根据本发明的启动子DNA多核苷酸包含与SEQ ID NO:4的序列具有至少80%序列同一性的序列。在某些实施方案中,根据本发明的启动子DNA多核苷酸包含与SEQ ID NO:5的序列具有至少80%序列同一性的序列。在某些实施方案中,根据本发明的启动子DNA多核苷酸包含与SEQ ID NO:6的序列具有至少80%序列同一性的序列。在某些实施方案中,根据本发明的启动子DNA多核苷酸包含与SEQ ID NO:33的序列具有至少80%序列同一性的序列。在某些实施方案中,根据本发明的启动子DNA多核苷酸包含与SEQ ID NO:36的序列具有至少80%序列同一性的序列。在某些实施方案中,根据本发明的启动子DNA多核苷酸包含与SEQ ID NO:37的序列具有至少80%序列同一性的序列。在某些实施方案中,根据本发明的启动子DNA多核苷酸包含与SEQ ID NO:68的序列具有至少80%序列同一性的序列。在特定的实施方案中,这些情况中的每一种中的序列同一性为至少85%、比如至少90%、比如至少95%,比如至少98%。
在某些实施方案中,根据本发明的启动子DNA多核苷酸包含SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:33、SEQ ID NO:36、SEQ ID NO:37或SEQ ID NO:68的任何一种序列的至少6个连续核苷酸的功能片段。
在某些实施方案中,根据本发明的启动子DNA多核苷酸包含SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:33、SEQ ID NO:36、SEQ ID NO:37或SEQ ID NO:68的任何一种序列的至少6个连续核苷酸的功能片段,所述功能片段在果蝇S2细胞中具有启动子活性。
在某些实施方案中,根据本发明的启动子DNA多核苷酸包含SEQ ID NO:1的序列的至少6个连续核苷酸的功能片段。在某些实施方案中,根据本发明的启动子DNA多核苷酸包含SEQ ID NO:2的序列的至少6个连续核苷酸的功能片段。在某些实施方案中,根据本发明的启动子DNA多核苷酸包含SEQ ID NO:3的序列的至少6个连续核苷酸的功能片段。在某些实施方案中,根据本发明的启动子DNA多核苷酸包含SEQ ID NO:4的序列的至少6个连续核苷酸的功能片段。在某些实施方案中,根据本发明的启动子DNA多核苷酸包含SEQ ID NO:5的序列的至少6个连续核苷酸的功能片段。在某些实施方案中,根据本发明的启动子DNA多核苷酸包含SEQ ID NO:6的序列的至少6个连续核苷酸的功能片段。在某些实施方案中,根据本发明的启动子DNA多核苷酸包含SEQ ID NO:33的序列的至少6个连续核苷酸的功能片段。在某些实施方案中,根据本发明的启动子DNA多核苷酸包含SEQ ID NO:36的序列的至少6个连续核苷酸的功能片段。在某些实施方案中,根据本发明的启动子DNA多核苷酸包含SEQ ID NO:39的序列的至少6个连续核苷酸的功能片段。在某些实施方案中,根据本发明的启动子DNA多核苷酸包含SEQ ID NO:68的序列的至少6个连续核苷酸的功能片段。
在某些实施方案中,根据本发明的启动子DNA多核苷酸包含与SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:33、SEQ ID NO:36、SEQ ID NO:37或SEQ ID NO:68的任何一种序列的至少6个连续核苷酸的功能片段具有至少80%序列同一性的序列。
在某些实施方案中,根据本发明的启动子DNA多核苷酸包含与SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:33、SEQ ID NO:36、SEQ ID NO:37或SEQ ID NO:68的任何一种序列的至少6个连续核苷酸的所述功能片段具有至少80%序列同一性的功能核苷酸序列,所述功能核苷酸序列在果蝇S2细胞中具有启动子活性。
在某些实施方案中,根据本发明的启动子DNA多核苷酸包含与SEQ ID NO:1的序列的至少6个连续核苷酸的功能片段具有至少80%序列同一性的序列。在某些实施方案中,根据本发明的启动子DNA多核苷酸包含与SEQ ID NO:2的序列的至少6个连续核苷酸的功能片段具有至少80%序列同一性的序列。在某些实施方案中,根据本发明的启动子DNA多核苷酸包含与SEQ ID NO:3的序列的至少6个连续核苷酸的功能片段具有至少80%序列同一性的序列。在某些实施方案中,根据本发明的启动子DNA多核苷酸包含与SEQ ID NO:4的序列的至少6个连续核苷酸的功能片段具有至少80%序列同一性的序列。在某些实施方案中,根据本发明的启动子DNA多核苷酸包含与SEQ ID NO:5的序列的至少6个连续核苷酸的功能片段具有至少80%序列同一性的序列。在某些实施方案中,根据本发明的启动子DNA多核苷酸包含与SEQ ID NO:6的序列的至少6个连续核苷酸的功能片段具有至少80%序列同一性的序列。在某些实施方案中,根据本发明的启动子DNA多核苷酸包含与SEQ ID NO:33的序列的至少6个连续核苷酸的功能片段具有至少80%序列同一性的序列。在某些实施方案中,根据本发明的启动子DNA多核苷酸包含与SEQ ID NO:36的序列的至少6个连续核苷酸的功能片段具有至少80%序列同一性的序列。在某些实施方案中,根据本发明的启动子DNA多核苷酸包含与SEQ ID NO:37的序列的至少6个连续核苷酸的功能片段具有至少80%序列同一性的序列。在某些实施方案中,根据本发明的启动子DNA多核苷酸包含与SEQ ID NO:68的序列的至少6个连续核苷酸的功能片段具有至少80%序列同一性的序列。
在某些实施方案中,根据本发明的启动子DNA多核苷酸包含嵌合序列,所述嵌合序列包含两种或更多种选自以下的组的序列:
SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:33、SEQ ID NO:36或SEQ ID NO:37的核苷酸序列;
与SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:33、SEQ ID NO:36或SEQ ID NO:37的任何一种序列具有至少80%序列同一性的序列;
SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:33、SEQ ID NO:36或SEQ ID NO:37的任何一种序列的至少6个连续核苷酸的功能片段;
与SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:33、SEQ ID NO:36或SEQ ID NO:37的任何一种序列的至少6个连续核苷酸的功能片段具有至少80%序列同一性的序列。
这种嵌合序列的一个实例是SEQ ID NO:68所列出的杂合启动子序列。
在某些实施方案中,根据本发明的启动子DNA多核苷酸包含嵌合核苷酸序列,所述嵌合核苷酸序列包含两种或更多种选自以下的序列:
(i)SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:33、SEQ ID NO:36或SEQ ID NO:37的核苷酸序列;
(ii)与(i)的任何一种序列具有至少80%序列同一性且在果蝇S2细胞中具有启动子活性的功能核苷酸序列;
(iii)为(i)或(ii)的任何一种序列的至少6个连续核苷酸的功能片段的核苷酸,所述功能片段在果蝇S2细胞中具有启动子活性;和
(iv)与(iii)的所述功能片段具有至少80%序列同一性且在果蝇S2细胞中具有启动子活性的功能核苷酸序列。
在某些实施方案中,根据本发明的启动子DNA多核苷酸包含如以上(vi)所定义的嵌合核苷酸序列。
在某些实施方案中,根据本发明的至少6个连续核苷酸的功能片段为至少7个,比如至少8个、比如至少9个、比如至少10个、比如至少11个、比如至少12个、比如至少13个、比如至少14个、比如至少15个、比如至少16个、比如至少17个、比如至少18个、比如至少19个、比如至少20个、比如至少21个、比如至少22个、比如至少23个、比如至少24个、比如至少25个、比如至少26个、比如至少27个、比如至少28个、比如至少29个、比如至少30个、比如至少31个、比如至少32个、比如至少33个、比如至少34个、比如至少35个、比如至少36个、比如至少37个、比如至少38个、比如至少39个、比如至少40个、比如至少41个、比如至少42个、比如至少43个、比如至少44个、比如至少45个、比如至少46个、比如至少47个、比如至少48个、比如至少49个、比如至少50个、比如至少51个、比如至少52个、比如至少53个、比如至少54个、比如至少55个、比如至少56个、比如至少57个、比如至少58个、比如至少59个、比如至少60个、比如至少61个、比如至少62个、比如至少63个、比如至少64个、比如至少65个、比如至少66个、比如至少67个、比如至少68个、比如至少69个、比如至少70个、比如至少71个、比如至少72个、比如至少73个、比如至少74个、比如至少75个、比如至少76个、比如至少77个、比如至少78个、比如至少79个、比如至少80个、比如至少81个、比如至少82个、比如至少83个、比如至少84个、比如至少85个、比如至少86个、比如至少87个、比如至少88个、比如至少89个、比如至少90个、比如至少91个、比如至少92个、比如至少93个、比如至少94个、比如至少95个、比如至少96个、比如至少97个、比如至少98个、比如至少99个、比如至少100个、比如至少101个、比如至少102个、比如至少103个、比如至少104个、比如至少105个、比如至少106个、比如至少107个、比如至少108个、比如至少109个、比如至少110个、比如至少111个、比如至少112个、比如至少113个、比如至少114个、比如至少115个、比如至少116个、比如至少117个、比如至少118个、比如至少119个、比如至少120个、比如至少121个、比如至少122个、比如至少123个、比如至少124个、比如至少125个、比如至少126个、比如至少127个、比如至少128个、比如至少129个、比如至少130个、比如至少131个、比如至少132个、比如至少133个、比如至少134个、比如至少135个、比如至少136个、比如至少137个、比如至少138个、比如至少139个、比如至少140个、比如至少141个、比如至少142个、比如至少143个、比如至少144个、比如至少145个、比如至少146个、比如至少147个、比如至少148个、比如至少149个、比如至少150个、比如至少151个、比如至少152个、比如至少153个、比如至少154个、比如至少155个、比如至少156个、比如至少157个、比如至少158个、比如至少159个、比如至少160个、比如至少161个、比如至少162个、比如至少163个、比如至少164个、比如至少165个、比如至少166个、比如至少167个、比如至少168个、比如至少169个、比如至少170个、比如至少171个、比如至少172个、比如至少173个、比如至少174个、比如至少175个、比如至少176个、比如至少177个、比如至少178个、比如至少179个、比如至少180个、比如至少181个、比如至少182个、比如至少183个、比如至少184个、比如至少185个、比如至少186个、比如至少187个、比如至少188个、比如至少189个、比如至少190个、比如至少191个、比如至少192个、比如至少193个、比如至少194个、比如至少195个、比如至少196个、比如至少197个、比如至少198个、比如至少199个、比如至少200个、比如至少201个、比如至少202个、比如至少203个、比如至少204个、比如至少205个、比如至少206个、比如至少207个、比如至少208个、比如至少209个、比如至少210个、比如至少211个、比如至少212个、比如至少213个、比如至少214个、比如至少215个、比如至少216个、比如至少217个、比如至少218个、比如至少219个、比如至少220个、比如至少221个、比如至少222个、比如至少223个、比如至少224个、比如至少225个、比如至少226个、比如至少227个、比如至少228个、比如至少229个、比如至少230个、比如至少231个、比如至少232个、比如至少233个、比如至少234个、比如至少235个、比如至少236个、比如至少237个、比如至少238个、比如至少239个、比如至少240个、比如至少241个、比如至少242个、比如至少243个、比如至少244个、比如至少245个、比如至少246个、比如至少247个、比如至少248个、比如至少249个、比如至少250个、比如至少251个、比如至少252个、比如至少253个、比如至少254个、比如至少255个、比如至少256个、比如至少257个、比如至少258个、比如至少259个、比如至少260个、比如至少261个、比如至少262个、比如至少263个、比如至少264个、比如至少265个、比如至少266个、比如至少267个、比如至少268个、比如至少269个、比如至少270个、比如至少271个、比如至少272个、比如至少273个、比如至少274个、比如至少275个、比如至少276个、比如至少277个、比如至少278个、比如至少279个、比如至少280个、比如至少281个、比如至少282个、比如至少283个、比如至少284个、比如至少285个、比如至少286个、比如至少287个、比如至少288个、比如至少289个、比如至少290个、比如至少291个、比如至少292个、比如至少293个、比如至少294个、比如至少295个、比如至少296个、比如至少297个、比如至少298个、比如至少299个、比如至少300个、比如至少301个、比如至少302个、比如至少303个、比如至少304个、比如至少305个、比如至少306个、比如至少307个、比如至少308个、比如至少309个、比如至少310个、比如至少311个、比如至少312个、比如至少313个、比如至少314个、比如至少315个、比如至少316个、比如至少317个、比如至少318个、比如至少319个、比如至少320个、比如至少321个、比如至少322个、比如至少323个、比如至少324个、比如至少325个、比如至少326个、比如至少327个、比如至少328个、比如至少329个、比如至少330个、比如至少331个、比如至少332个、比如至少333个、比如至少334个、比如至少335个、比如至少336个、比如至少337个、比如至少338个、比如至少339个、比如至少340个、比如至少341个、比如至少342个、比如至少343个、比如至少344个、比如至少345个、比如至少346个、比如至少347个、比如至少348个、比如至少349个、比如至少350个、比如至少351个、比如至少352个、比如至少353个、比如至少354个、比如至少355个、比如至少356个、比如至少357个、比如至少358个、比如至少359个、比如至少360个、比如至少361个、比如至少362个、比如至少363个、比如至少364个、比如至少365个、比如至少366个、比如至少367个、比如至少368个、比如至少369个、比如至少370个、比如至少371个、比如至少372个、比如至少373个、比如至少374个、比如至少375个、比如至少376个、比如至少377个、比如至少378个、比如至少379个、比如至少380个、比如至少381个、比如至少382个、比如至少383个、比如至少384个、比如至少385个、比如至少386个、比如至少387个、比如至少388个、比如至少389个、比如至少390个、比如至少391个、比如至少392个、比如至少393个、比如至少394个、比如至少395个、比如至少396个、比如至少397个、比如至少398个、比如至少399个、比如至少400个、比如至少401个、比如至少402个、比如至少403个、比如至少404个、比如至少405个、比如至少406个、比如至少407个、比如至少408个、比如至少409个、比如至少410个、比如至少411个、比如至少412个、比如至少413个、比如至少414个、比如至少415个、比如至少416个、比如至少417个、比如至少418个、比如至少419个、比如至少420个、比如至少421个、比如至少422个、比如至少423个、比如至少424个、比如至少425个、比如至少426个、比如至少427个、比如至少428个、比如至少429个、比如至少430个、比如至少431个、比如至少432个、比如至少433个、比如至少434个、比如至少435个、比如至少436个、比如至少437个、比如至少438个、比如至少439个、比如至少440个、比如至少441个、比如至少442个、比如至少443个、比如至少444个、比如至少445个、比如至少446个、比如至少447个、比如至少448个、比如至少449个、比如至少450个、比如至少451个、比如至少452个、比如至少453个、比如至少454个、比如至少455个、比如至少456个、比如至少457个、比如至少458个、比如至少459个、比如至少460个、比如至少461个、比如至少462个、比如至少463个、比如至少464个、比如至少465个、比如至少466个、比如至少467个、比如至少468个、比如至少469个、比如至少470个、比如至少471个、比如至少472个、比如至少473个、比如至少474个、比如至少475个、比如至少476个、比如至少477个、比如至少478个、比如至少479个、比如至少480个、比如至少481个、比如至少482个、比如至少483个、比如至少484个、比如至少485个、比如至少486个、比如至少487个、比如至少488个、比如至少489个、比如至少490个、比如至少491个、比如至少492个、比如至少493个、比如至少494个、比如至少495个、比如至少496个、比如至少497个、比如至少498个、比如至少499个、比如至少500个、比如至少501个、比如至少502个、比如至少503个、比如至少504个、比如至少505个、比如至少506个、比如至少507个、比如至少508个、比如至少509个、比如至少510个、比如至少511个、比如至少512个、比如至少513个、比如至少514个、比如至少515个、比如至少516个、比如至少517个、比如至少518个、比如至少519个、比如至少520个、比如至少521个、比如至少522个、比如至少523个、比如至少524个、比如至少525个、比如至少526个、比如至少527个、比如至少528个、比如至少529个、比如至少530个、比如至少531个、比如至少532个、比如至少533个、比如至少534个、比如至少535个、比如至少536个、比如至少537个、比如至少538个、比如至少539个、比如至少540个、比如至少541个、比如至少542个、比如至少543个、比如至少544个、比如至少545个、比如至少546个、比如至少547个、比如至少548个、比如至少549个、比如至少550个、比如至少551个、比如至少552个、比如至少553个、比如至少554个、比如至少555个、比如至少556个、比如至少557个、比如至少558个、比如至少559个、比如至少560个、比如至少561个、比如至少562个、比如至少563个、比如至少564个、比如至少565个、比如至少566个、比如至少567个、比如至少568个、比如至少569个、比如至少570个、比如至少571个、比如至少572个、比如至少573个、比如至少574个、比如至少575个、比如至少576个、比如至少577个、比如至少578个、比如至少579个、比如至少580个、比如至少581个、比如至少582个、比如至少583个、比如至少584个、比如至少585个、比如至少586个、比如至少587个、比如至少588个、比如至少589个、比如至少590个、比如至少591个连续核苷酸。
在某些实施方案中,根据本发明的至少20个连续核苷酸的功能片段不超过999个连续核苷酸,比如不超过998个、比如不超过998个、比如不超过997个、比如不超过996个、比如不超过995个、比如不超过994个、比如不超过993个、比如不超过992个、比如不超过991个、比如不超过990个、比如不超过989个、比如不超过988个、比如不超过987个、比如不超过986个、比如不超过985个、比如不超过984个、比如不超过983个、比如不超过982个、比如不超过981个、比如不超过980个、比如不超过979个、比如不超过978个、比如不超过977个、比如不超过976个、比如不超过975个、比如不超过974个、比如不超过973个、比如不超过972个、比如不超过971个、比如不超过970个、比如不超过969个、比如不超过968个、比如不超过967个、比如不超过966个、比如不超过965个、比如不超过964个、比如不超过963个、比如不超过962个、比如不超过961个、比如不超过960个、比如不超过959个、比如不超过958个、比如不超过957个、比如不超过956个、比如不超过955个、比如不超过954个、比如不超过953个、比如不超过952个、比如不超过951个、比如不超过950个、比如不超过949个、比如不超过948个、比如不超过947个、比如不超过946个、比如不超过945个、比如不超过944个、比如不超过943个、比如不超过942个、比如不超过941个、比如不超过940个、比如不超过939个、比如不超过938个、比如不超过937个、比如不超过936个、比如不超过935个、比如不超过934个、比如不超过933个、比如不超过932个、比如不超过931个、比如不超过930个、比如不超过929个、比如不超过928个、比如不超过927个、比如不超过926个、比如不超过925个、比如不超过924个、比如不超过923个、比如不超过922个、比如不超过921个、比如不超过920个、比如不超过919个、比如不超过918个、比如不超过917个、比如不超过916个、比如不超过915个、比如不超过914个、比如不超过913个、比如不超过912个、比如不超过911个、比如不超过910个、比如不超过909个、比如不超过908个、比如不超过907个、比如不超过906个、比如不超过905个、比如不超过904个、比如不超过903个、比如不超过902个、比如不超过901个、比如不超过900个、比如不超过899个、比如不超过898个、比如不超过897个、比如不超过896个、比如不超过895个、比如不超过894个、比如不超过893个、比如不超过892个、比如不超过891个、比如不超过890个、比如不超过889个、比如不超过888个、比如不超过887个、比如不超过886个、比如不超过885个、比如不超过884个、比如不超过883个、比如不超过882个、比如不超过881个、比如不超过880个、比如不超过879个、比如不超过878个、比如不超过877个、比如不超过876个、比如不超过875个、比如不超过874个、比如不超过873个、比如不超过872个、比如不超过871个、比如不超过870个、比如不超过869个、比如不超过868个、比如不超过867个、比如不超过866个、比如不超过865个、比如不超过864个、比如不超过863个、比如不超过862个、比如不超过861个、比如不超过860个、比如不超过859个、比如不超过858个、比如不超过857个、比如不超过856个、比如不超过855个、比如不超过854个、比如不超过853个、比如不超过852个、比如不超过851个、比如不超过850个、比如不超过849个、比如不超过848个、比如不超过847个、比如不超过846个、比如不超过845个、比如不超过844个、比如不超过843个、比如不超过842个、比如不超过841个、比如不超过840个、比如不超过839个、比如不超过838个、比如不超过837个、比如不超过836个、比如不超过835个、比如不超过834个、比如不超过833个、比如不超过832个、比如不超过831个、比如不超过830个、比如不超过829个、比如不超过828个、比如不超过827个、比如不超过826个、比如不超过825个、比如不超过824个、比如不超过823个、比如不超过822个、比如不超过821个、比如不超过820个、比如不超过819个、比如不超过818个、比如不超过817个、比如不超过816个、比如不超过815个、比如不超过814个、比如不超过813个、比如不超过812个、比如不超过811个、比如不超过810个、比如不超过809个、比如不超过808个、比如不超过807个、比如不超过806个、比如不超过805个、比如不超过804个、比如不超过803个、比如不超过802个、比如不超过801个、比如不超过800个、比如不超过799个、比如不超过798个、比如不超过797个、比如不超过796个、比如不超过795个、比如不超过794个、比如不超过793个、比如不超过792个、比如不超过791个、比如不超过790个、比如不超过789个、比如不超过788个、比如不超过787个、比如不超过786个、比如不超过785个、比如不超过784个、比如不超过783个、比如不超过782个、比如不超过781个、比如不超过780个、比如不超过779个、比如不超过778个、比如不超过777个、比如不超过776个、比如不超过775个、比如不超过774个、比如不超过773个、比如不超过772个、比如不超过771个、比如不超过770个、比如不超过769个、比如不超过768个、比如不超过767个、比如不超过766个、比如不超过765个、比如不超过764个、比如不超过763个、比如不超过762个、比如不超过761个、比如不超过760个、比如不超过759个、比如不超过758个、比如不超过757个、比如不超过756个、比如不超过755个、比如不超过754个、比如不超过753个、比如不超过752个、比如不超过751个、比如不超过750个、比如不超过749个、比如不超过748个、比如不超过747个、比如不超过746个、比如不超过745个、比如不超过744个、比如不超过743个、比如不超过742个、比如不超过741个、比如不超过740个、比如不超过739个、比如不超过738个、比如不超过737个、比如不超过736个、比如不超过735个、比如不超过734个、比如不超过733个、比如不超过732个、比如不超过731个、比如不超过730个、比如不超过729个、比如不超过728个、比如不超过727个、比如不超过726个、比如不超过725个、比如不超过724个、比如不超过723个、比如不超过722个、比如不超过721个、比如不超过720个、比如不超过719个、比如不超过718个、比如不超过717个、比如不超过716个、比如不超过715个、比如不超过714个、比如不超过713个、比如不超过712个、比如不超过711个、比如不超过710个、比如不超过709个、比如不超过708个、比如不超过707个、比如不超过706个、比如不超过705个、比如不超过704个、比如不超过703个、比如不超过702个、比如不超过701个、比如不超过700个、比如不超过699个、比如不超过698个、比如不超过697个、比如不超过696个、比如不超过695个、比如不超过694个、比如不超过693个、比如不超过692个、比如不超过691个、比如不超过690个、比如不超过689个、比如不超过688个、比如不超过687个、比如不超过686个、比如不超过685个、比如不超过684个、比如不超过683个、比如不超过682个、比如不超过681个、比如不超过680个、比如不超过679个、比如不超过678个、比如不超过677个、比如不超过676个、比如不超过675个、比如不超过674个、比如不超过673个、比如不超过672个、比如不超过671个、比如不超过670个、比如不超过669个、比如不超过668个、比如不超过667个、比如不超过666个、比如不超过665个、比如不超过664个、比如不超过663个、比如不超过662个、比如不超过661个、比如不超过660个、比如不超过659个、比如不超过658个、比如不超过657个、比如不超过656个、比如不超过655个、比如不超过654个、比如不超过653个、比如不超过652个、比如不超过651个、比如不超过650个、比如不超过649个、比如不超过648个、比如不超过647个、比如不超过646个、比如不超过645个、比如不超过644个、比如不超过643个、比如不超过642个、比如不超过641个、比如不超过640个、比如不超过639个、比如不超过638个、比如不超过637个、比如不超过636个、比如不超过635个、比如不超过634个、比如不超过633个、比如不超过632个、比如不超过631个、比如不超过630个、比如不超过629个、比如不超过628个、比如不超过627个、比如不超过626个、比如不超过625个、比如不超过624个、比如不超过623个、比如不超过622个、比如不超过621个、比如不超过620个、比如不超过619个、比如不超过618个、比如不超过617个、比如不超过616个、比如不超过615个、比如不超过614个、比如不超过613个、比如不超过612个、比如不超过611个、比如不超过610个、比如不超过609个、比如不超过608个、比如不超过607个、比如不超过606个、比如不超过605个、比如不超过604个、比如不超过603个、比如不超过602个、比如不超过601个、比如不超过600个、比如不超过599个、比如不超过598个、比如不超过597个、比如不超过596个、比如不超过595个、比如不超过594个、比如不超过593个、比如不超过592个、比如不超过591个、比如不超过590个、比如不超过589个、比如不超过588个、比如不超过587个、比如不超过586个、比如不超过585个、比如不超过584个、比如不超过583个、比如不超过582个、比如不超过581个、比如不超过580个、比如不超过579个、比如不超过578个、比如不超过577个、比如不超过576个、比如不超过575个、比如不超过574个、比如不超过573个、比如不超过572个、比如不超过571个、比如不超过570个、比如不超过569个、比如不超过568个、比如不超过567个、比如不超过566个、比如不超过565个、比如不超过564个、比如不超过563个、比如不超过562个、比如不超过561个、比如不超过560个、比如不超过559个、比如不超过558个、比如不超过557个、比如不超过556个、比如不超过555个、比如不超过554个、比如不超过553个、比如不超过552个、比如不超过551个、比如不超过550个、比如不超过549个、比如不超过548个、比如不超过547个、比如不超过546个、比如不超过545个、比如不超过544个、比如不超过543个、比如不超过542个、比如不超过541个、比如不超过540个、比如不超过539个、比如不超过538个、比如不超过537个、比如不超过536个、比如不超过535个、比如不超过534个、比如不超过533个、比如不超过532个、比如不超过531个、比如不超过530个、比如不超过529个、比如不超过528个、比如不超过527个、比如不超过526个、比如不超过525个、比如不超过524个、比如不超过523个、比如不超过522个、比如不超过521个、比如不超过520个、比如不超过519个、比如不超过518个、比如不超过517个、比如不超过516个、比如不超过515个、比如不超过514个、比如不超过513个、比如不超过512个、比如不超过511个、比如不超过510个、比如不超过509个、比如不超过508个、比如不超过507个、比如不超过506个、比如不超过505个、比如不超过504个、比如不超过503个、比如不超过502个、比如不超过501个、比如不超过500个、比如不超过499个、比如不超过498个、比如不超过497个、比如不超过496个、比如不超过495个、比如不超过494个、比如不超过493个、比如不超过492个、比如不超过491个、比如不超过490个、比如不超过489个、比如不超过488个、比如不超过487个、比如不超过486个、比如不超过485个、比如不超过484个、比如不超过483个、比如不超过482个、比如不超过481个、比如不超过480个、比如不超过479个、比如不超过478个、比如不超过477个、比如不超过476个、比如不超过475个、比如不超过474个、比如不超过473个、比如不超过472个、比如不超过471个、比如不超过470个、比如不超过469个、比如不超过468个、比如不超过467个、比如不超过466个、比如不超过465个、比如不超过464个、比如不超过463个、比如不超过462个、比如不超过461个、比如不超过460个、比如不超过459个、比如不超过458个、比如不超过457个、比如不超过456个、比如不超过455个、比如不超过454个、比如不超过453个、比如不超过452个、比如不超过451个、比如不超过450个、比如不超过449个、比如不超过448个、比如不超过447个、比如不超过446个、比如不超过445个、比如不超过444个、比如不超过443个、比如不超过442个、比如不超过441个、比如不超过440个、比如不超过439个、比如不超过438个、比如不超过437个、比如不超过436个、比如不超过435个、比如不超过434个、比如不超过433个、比如不超过432个、比如不超过431个、比如不超过430个、比如不超过429个、比如不超过428个、比如不超过427个、比如不超过426个、比如不超过425个、比如不超过424个、比如不超过423个、比如不超过422个、比如不超过421个、比如不超过420个、比如不超过419个、比如不超过418个、比如不超过417个、比如不超过416个、比如不超过415个、比如不超过414个、比如不超过413个、比如不超过412个、比如不超过411个、比如不超过410个、比如不超过409个、比如不超过408个、比如不超过407个、比如不超过406个、比如不超过405个、比如不超过404个、比如不超过403个、比如不超过402个、比如不超过401个、比如不超过400个、比如不超过399个、比如不超过398个、比如不超过397个、比如不超过396个、比如不超过395个、比如不超过394个、比如不超过393个、比如不超过392个、比如不超过391个、比如不超过390个、比如不超过389个、比如不超过388个、比如不超过387个、比如不超过386个、比如不超过385个、比如不超过384个、比如不超过383个、比如不超过382个、比如不超过381个、比如不超过380个、比如不超过379个、比如不超过378个、比如不超过377个、比如不超过376个、比如不超过375个、比如不超过374个、比如不超过373个、比如不超过372个、比如不超过371个、比如不超过370个、比如不超过369个、比如不超过368个、比如不超过367个、比如不超过366个、比如不超过365个、比如不超过364个、比如不超过363个、比如不超过362个、比如不超过361个、比如不超过360个、比如不超过359个、比如不超过358个、比如不超过357个、比如不超过356个、比如不超过355个、比如不超过354个、比如不超过353个、比如不超过352个、比如不超过351个、比如不超过350个、比如不超过349个、比如不超过348个、比如不超过347个、比如不超过346个、比如不超过345个、比如不超过344个、比如不超过343个、比如不超过342个、比如不超过341个、比如不超过340个、比如不超过339个、比如不超过338个、比如不超过337个、比如不超过336个、比如不超过335个、比如不超过334个、比如不超过333个、比如不超过332个、比如不超过331个、比如不超过330个、比如不超过329个、比如不超过328个、比如不超过327个、比如不超过326个、比如不超过325个、比如不超过324个、比如不超过323个、比如不超过322个、比如不超过321个、比如不超过320个、比如不超过319个、比如不超过318个、比如不超过317个、比如不超过316个、比如不超过315个、比如不超过314个、比如不超过313个、比如不超过312个、比如不超过311个、比如不超过310个、比如不超过309个、比如不超过308个、比如不超过307个、比如不超过306个、比如不超过305个、比如不超过304个、比如不超过303个、比如不超过302个、比如不超过301个、比如不超过300个、比如不超过299个、比如不超过298个、比如不超过297个、比如不超过296个、比如不超过295个、比如不超过294个、比如不超过293个、比如不超过292个、比如不超过291个、比如不超过290个、比如不超过289个、比如不超过288个、比如不超过287个、比如不超过286个、比如不超过285个、比如不超过284个、比如不超过283个、比如不超过282个、比如不超过281个、比如不超过280个、比如不超过279个、比如不超过278个、比如不超过277个、比如不超过276个、比如不超过275个、比如不超过274个、比如不超过273个、比如不超过272个、比如不超过271个、比如不超过270个、比如不超过269个、比如不超过268个、比如不超过267个、比如不超过266个、比如不超过265个、比如不超过264个、比如不超过263个、比如不超过262个、比如不超过261个、比如不超过260个、比如不超过259个、比如不超过258个、比如不超过257个、比如不超过256个、比如不超过255个、比如不超过254个、比如不超过253个、比如不超过252个、比如不超过251个、比如不超过250个、比如不超过249个、比如不超过248个、比如不超过247个、比如不超过246个、比如不超过245个、比如不超过244个、比如不超过243个、比如不超过242个、比如不超过241个、比如不超过240个、比如不超过239个、比如不超过238个、比如不超过237个、比如不超过236个、比如不超过235个、比如不超过234个、比如不超过233个、比如不超过232个、比如不超过231个、比如不超过230个、比如不超过229个、比如不超过228个、比如不超过227个、比如不超过226个、比如不超过225个、比如不超过224个、比如不超过223个、比如不超过222个、比如不超过221个、比如不超过220个、比如不超过219个、比如不超过218个、比如不超过217个、比如不超过215个、比如不超过214个、比如不超过213个、比如不超过212个、比如不超过211个、比如不超过210个、比如不超过209个、比如不超过208个、比如不超过207个、比如不超过206个、比如不超过205个、比如不超过204个、比如不超过203个、比如不超过202个、比如不超过201个、比如不超过200个、比如不超过199个、比如不超过198个、比如不超过197个、比如不超过196个、比如不超过195个、比如不超过194个、比如不超过193个、比如不超过192个、比如不超过191个、比如不超过190个、比如不超过189个、比如不超过188个、比如不超过187个、比如不超过186个、比如不超过185个、比如不超过184个、比如不超过182个、比如不超过181个、比如不超过180个、比如不超过179个、比如不超过178个、比如不超过177个、比如不超过176个、比如不超过175个、比如不超过174个、比如不超过173个、比如不超过172个、比如不超过171个、比如不超过170个、比如不超过169个、比如不超过168个、比如不超过167个、比如不超过166个、比如不超过165个、比如不超过164个、比如不超过163个、比如不超过162个、比如不超过161个、比如不超过160个、比如不超过159个、比如不超过158个、比如不超过157个、比如不超过156个、比如不超过155个、比如不超过154个、比如不超过153个、比如不超过152个、比如不超过151个、比如不超过150个、比如不超过149个、比如不超过148个、比如不超过147个、比如不超过146个、比如不超过145个、比如不超过144个、比如不超过143个、比如不超过142个、比如不超过141个、比如不超过140个、比如不超过139个、比如不超过138个、比如不超过137个、比如不超过136个、比如不超过135个、比如不超过134个、比如不超过133个、比如不超过132个、比如不超过131个、比如不超过130个、比如不超过129个、比如不超过128个、比如不超过127个、比如不超过126个、比如不超过125个、比如不超过124个、比如不超过123个、比如不超过122个、比如不超过121个、比如不超过120个、比如不超过119个、比如不超过118个、比如不超过117个、比如不超过116个、比如不超过115个、比如不超过114个、比如不超过113个、比如不超过112个、比如不超过111个、比如不超过110个、比如不超过109个、比如不超过108个、比如不超过107个、比如不超过106个、比如不超过105个、比如不超过104个、比如不超过103个、比如不超过102个、比如不超过101个、比如不超过100个、比如不超过99个、比如不超过98个、比如不超过97个、比如不超过96个、比如不超过95个、比如不超过94个、比如不超过93个、比如不超过92个、比如不超过91个、比如不超过90个、比如不超过89个、比如不超过88个、比如不超过87个、比如不超过86个、比如不超过85个、比如不超过84个、比如不超过83个、比如不超过82个、比如不超过81个、比如不超过80个、比如不超过79个、比如不超过78个、比如不超过77个、比如不超过76个、比如不超过75个、比如不超过74个、比如不超过73个、比如不超过72个、比如不超过71个、比如不超过70个、比如不超过69个、比如不超过68个、比如不超过67个、比如不超过66个、比如不超过65个、比如不超过64个、比如不超过63个、比如不超过62个、比如不超过61个、比如不超过60个、比如不超过59个、比如不超过58个、比如不超过57个、比如不超过56个、比如不超过55个、比如不超过54个、比如不超过53个、比如不超过52个、比如不超过51个、比如不超过50个、比如不超过49个、比如不超过48个、比如不超过47个、比如不超过46个、比如不超过45个、比如不超过44个、比如不超过43个、比如不超过42个、比如不超过41个、比如不超过40个、比如不超过39个、比如不超过38个、比如不超过37个、比如不超过36个、比如不超过35个、比如不超过34个、比如不超过33个、比如不超过32个、比如不超过31个、比如不超过30个、比如不超过29个、比如不超过28个、比如不超过27个、比如不超过26个、比如不超过25个连续核苷酸。
在某些实施方案中,与具有SEQ ID NO:1或SEQ ID NO:4的序列的任何一种启动子DNA多核苷酸的蛋白表达水平相比,根据本发明的启动子DNA多核苷酸表现出增高的蛋白表达水平。
在某些实施方案中,相对于具有SEQ ID NO:1或SEQ ID NO:4的序列的任何一种启动子DNA多核苷酸的蛋白表达水平或相对于pOPIE2启动子,蛋白表达水平的增高为从约50%至约300%。在某些实施方案中,相对于具有SEQ ID NO:1或SEQ ID NO:4的序列的任何一种启动子DNA多核苷酸的蛋白表达水平或相对于pOPIE2启动子,蛋白表达水平的增高为300%以上。
在某些实施方案中,相对于具有SEQ ID NO:1或SEQ ID NO:4的序列的任何一种启动子DNA多核苷酸的蛋白表达水平或相对于pOPIE2启动子,蛋白表达水平的增高为2倍至10倍。
在某些实施方案中,相对于具有SEQ ID NO:1或SEQ ID NO:4的序列的任何一种启动子DNA多核苷酸的蛋白表达水平或相对于pOPIE2启动子,蛋白表达水平的增高为10倍至100倍,比如20倍至80倍,比如20倍至40倍。
要理解的是活性的增高的测量和与参照的对比在相同的且标准的条件下进行。
在某些实施方案中,根据本发明的分离的DNA多核苷酸还包含选择性标记,比如选自由博来霉素(Zeocin)选择性标记、新霉素选择性标记、潮霉素选择性标记、嘌呤霉素选择性标记和杀稻瘟素选择性标记组成的组的选择性标记。
在某些实施方案中,根据本发明的分离的DNA多核苷酸还包含细菌启动子,比如pKANR细菌启动子、比如卡那霉素启动子的功能片段。
在某些实施方案中,根据本发明的分离的DNA多核苷酸还包含适宜于在昆虫细胞中驱动选择性标记表达的第二启动子DNA多核苷酸。在某些实施方案中这种第二启动子选自由以下组成的组:
(i)SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:33、SEQ ID NO:36或SEQ ID NO:37的核苷酸序列;
(ii)与(i)中的任何一种序列具有至少80%序列同一性且在果蝇S2细胞中具有启动子活性的核苷酸序列;
(iii)为(i)或(ii)的任何一种序列的至少6个连续核苷酸的功能片段的核苷酸,所述功能片段在果蝇S2细胞中具有启动子活性;
(iv)与(iii)的所述功能片段具有至少80%序列同一性且在果蝇S2细胞中具有启动子活性的核苷酸序列;
(v)包含(i)、(ii)、(iii)和(iv)的任何一种序列的两种或更多种序列的第一嵌合核苷酸序列,和
(vi)在果蝇S2细胞中具有启动子活性的第二嵌合核苷酸序列,包含至少6个核苷酸且包含来自(iii)和/或(iv)的至少两种核苷酸序列的连续核苷酸序列段,其中每个单独的所述连续核苷酸序列段在果蝇S2细胞中不具有启动子活性。
在某些实施方案中,根据本发明的分离的DNA多核苷酸还包含一种或多种在多克隆位点上游和/或下游的遍在染色质开放元件(ubiquitous chromatin opening element)。
在某些实施方案中,根据本发明的分离的DNA多核苷酸还包含至少一种转录绝缘子元件,比如Su(Hw)或Gypsy(GSu(Hw))绝缘子序列。(Mol Cell Biol.1997 April;17(4):2202-2206)
在某些实施方案中,根据本发明的分离的DNA多核苷酸还包含适宜于在昆虫细胞中筛选的二氢叶酸还原酶(dhfr)编码序列。
在某些实施方案中,根据本发明的分离的DNA多核苷酸还包含至少一种聚腺苷酸化信号序列,比如SV40聚腺苷酸信号和/或OPIE2聚腺苷酸信号。
在某些实施方案中,根据本发明的分离的DNA多核苷酸还包含大肠杆菌复制起点。
在某些实施方案中,根据本发明的分离的DNA多核苷酸还包含至少一种蛋白输出信号多核苷酸序列,比如选自由BIP和CPY组成的列表中的一种。
在某些实施方案中,根据本发明的分离的DNA多核苷酸基本不含病毒DNA。
在某些实施方案中,根据本发明的分离的DNA多核苷酸还包含至少一种HIS-标签序列。在某些实施方案中,HIS-标签是N-末端HIS-标签。在某些实施方案中,HIS-标签序列根据以下的序列:atgaaacaccaacaccaacatcaacatcaacatcaacatcaa(SEQ ID NO:38)
在某些实施方案中,根据本发明的分离的DNA多核苷酸还包含启动子DNA多核苷酸下游的多克隆位点,用于将编码感兴趣的多肽的基因插入所述分离的DNA多核苷酸。
在某些实施方案中,根据本发明的分离的DNA多核苷酸还包含至少一个来自SV40的72bp的元件。在某些实施方案中,根据本发明的分离的DNA多核苷酸还包含来自SV40的两个72bp的元件。在某些实施方案中,根据本发明的分离的DNA多核苷酸还包含启动子上游的至少一个来自SV40的72bp的元件和启动子下游的至少一个来自SV40的72bp的元件。
在某些实施方案中,根据本发明的分离的DNA多核苷酸还包含至少一种来自乙型肝炎病毒的PRE元件。在某些实施方案中,来自乙型肝炎病毒的PRE元件根据SEQ ID NO:40,比如SEQ ID NO:40的第10位到第574位核苷酸。
在某些实施方案中,根据本发明的分离的DNA多核苷酸还包含至少一种扩增调控元件。
在某些实施方案中,根据本发明的分离的DNA多核苷酸还包含至少一种Ori-β元件。
在某些实施方案中,根据本发明的分离的DNA多核苷酸还包含至少一种基质附着区(MAR)元件。
在某些实施方案中,根据本发明的启动子DNA多核苷酸序列调控与其连接的基因或其它DNA序列的表达。
在某些实施方案中,根据本发明的分离的DNA多核苷酸还包含至少一种与启动子DNA多核苷酸序列异源的编码多肽的多核苷酸序列。
在某些实施方案中,根据本发明的分离的DNA多核苷酸还包含至少一种核苷酸序列,所述核苷酸序列是SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:33、SEQ ID NO:36、SEQ ID NO:37或SEQ ID NO:68的核苷酸序列的任何一种序列的至少三个连续核苷酸的功能片段;和与之具有至少80%序列同一性的功能核苷酸序列,所述功能片段在果蝇S2细胞中具有启动子增强子活性。
在某些实施方案中,根据本发明的分离的DNA多核苷酸是克隆载体。
在某些实施方案中,根据本发明的分离的DNA多核苷酸是表达载体。
一个方面涉及包含根据本发明的分离的DNA多核苷酸的细胞。在某些实施方案中,细胞是昆虫细胞。在某些实施方案中,细胞是黑腹果蝇细胞。在某些实施方案中,细胞是黑腹果蝇S2细胞。
在某些实施方案中,包含根据本发明的分离的DNA多核苷酸的细胞被所述分离的DNA多核苷酸稳定转染。
本文所使用的“稳定转染”指细胞已被根据本发明的DNA多核苷酸转染以产生基因组中插入有新基因的培养细胞的永久系。通常这是通过将所需基因与“选择性”基因相连接实现的,“选择性”基因即赋予对抗生素(如博来霉素)抗性的基因。将抗生素加入到培养基中后,只有那些整合了抗性基因的细胞将存活,并且基本上所有那些细胞也都将整合根据本发明的DNA多核苷酸。
“克隆载体”表示能够被用来将感兴趣的DNA片段插入宿主细胞的质粒DNA,通常为了生产片段和因此载体的多拷贝。
“表达载体”表示含有来源于基因序列的、可被插入载体的mRNA合成必需调控信号的质粒或病毒DNA。所述基因序列为,例如,如上定义的嵌合的多核苷酸。
本文所使用的“聚腺苷酸化序列”指当转录时被表达宿主所识别而将聚腺苷残基加到转录的mRNA上的DNA序列。其与编码待表达多肽的DNA的3′端可操作地连接。适宜的聚腺苷酸化序列包括OPIE2聚腺苷酸尾和后期SV40聚腺苷酸尾,如Angelichio等人,1991, Comparison of several promoters and polyadenylation signals for use in heterologous gene expression
本文所使用的“选择性标记”指存在于表达载体中的遗传元件,当其被表达时提供宿主细胞成功转化的指示。例如,选择性标记可以向转化的宿主细胞提供对抗生素的抗性(显性类型标记)或提供代谢特定营养物质的能力(营养缺陷型类型的选择性标记,即,“治愈”宿主中缺陷的标记)。典型地,选择性标记在与调控将被载体表达的基因的表达的启动子相分隔的启动子的调控之下。
术语“可操作地连接”指核酸序列在单一核酸片段上联合,以便一个序列的功能被另一序列影响。例如,将启动子可操作地连接于编码序列,此时它能够影响该编码序列的表达(即,编码序列在启动子的转录调控之下)。
本文所使用的术语“表达”指宿主细胞中的完整的生物过程,即从转录开始,稳定累积来源于本发明的分离的DNA多核苷酸(其中还包含编码多肽的多核苷酸序列)的mRNA,经过随后的mRNA的翻译成为多肽产物,最后由宿主细胞实现为多肽产物的翻译后修饰。“过表达”指转化细胞中基因产物的生产超过了正常、非转化细胞中的生产水平。
本文所使用的“蛋白输出信号多核苷酸序列”指,指导或协助所表达的蛋白跨宿主表达细胞的细胞膜转运的序列。“蛋白输出信号多核苷酸序列”可以存在于前体多肽(前肽或前原肽)的N-末端以指导其跨细胞膜的转运。通常,前体多肽通过信号序列的切割而被加工生成成熟的肽或原肽。如果信号肽的切割后产物是原肽,则成熟肽是随后的包括进一步氨基酸去除的翻译后修饰的产物。
在此定义内的其它适宜“蛋白输出信号多核苷酸序列”包括用于分泌的果蝇BiP信号序列和CPY。
果蝇BiP蛋白编码结合免疫球蛋白的伴侣蛋白。这种分泌信号有效地指引高水平的BiP进入S2细胞的分泌途径。(参见Kirkpatrick,R.B.等人,(1995)J.Biol.Chem.270:19800-19805)
本文所使用的术语“遍在染色质开放元件”或“UCOE”指打开染色质或维持染色质开放状态并协助细胞中可操作地连接的基因的可重复性表达的DNA序列。
本文所使用的术语“基质附着区”或“MAR”或“支架/基质附着区”指核基质所附着的真核染色体DNA中的核苷酸序列。MAR介导细胞核内染色质的结构组织。这些元件构成用于染色质支架的DNA的锚定点并用来组织染色质形成结构域。对单个的基因研究得到结论:由S/MAR元件介导的动态和复杂的染色质组织在基因表达的调节中具有重要作用。
本文所使用的术语“扩增调控元件”或“Ace”指牵涉在自复制起点的DNA的起始扩增中的元件。来源于第三方染色体簇的转基因构建体的缺失分析已鉴定出扩增所需的320bp的扩增调控元件(ACE3)。因此在此定义中包括黑腹果蝇ACE3元件。在此定义中还包括扩增增强区(AER)。
本文所使用的术语“Ori-β元件”或“oriB”指复制的起点。复制的起点(也叫做复制起点)是基因组或质粒中复制起始的特定序列。这可以是诸如原核生物和真核生物等活生物体中的DNA复制,或诸如双链RNA病毒等RNA病毒中的RNA复制。DNA复制可以自这个点双向或单向进行。复制的起点结合预复制复合物,即识别、解旋和开始拷贝DNA的蛋白质复合物。在此定义中的一种特定“Ori-β元件”是黑腹果蝇Ori-β元件。
对于功能ACE3和ori-B元件的序列要求参见Hongjun Zhang和John Tower,2004,Sequence requirements for function of the Drosophila chorion gene locus ACE3 replicator and ori-b origin elements(果蝇绒毛膜基因座ACE3复制基因和ori-b起点元件的功能所需的序列要求),Development,131,2089-2099,2004和Carminati等人,1992,The Drosophila ACE3 Chorion Element AutonomouslyInduces Amplification(果蝇ACE3绒毛膜元件自主诱导扩增),MOLECULAR AND CELLULAR BIOLOGY,1992年5月,p.2444-2453。
SV40 72 bp元件对DNA疫苗的作用
诸如肌细胞等非分裂细胞中的核输入是非病毒基因递送系统的问题之一。这能够导致抗原的降低的合成,将随后导致不良的抗原呈递。在非分裂细胞中已经鉴定增强非病毒DNA的核转运的SV40增强子区的72bp重复序列。该增强子区含有一些转录因子结合位点。一旦质粒进入细胞质,将被一些转录因子结合,从而通过提供核定位信号允许非病毒DNA快速转移至核(Exp Cell Res.1999,253,713)。通过电穿孔将含有SV40增强子元件的载体注射入鼠的肌肉中观察到了基因表达的增强(Gene Ther.,2001,8,494)。
本文所使用的术语“来自SV40的72bp元件”指在非分裂细胞中增强非病毒DNA的核转运的SV40增强子区的72bp重复序列。在特定的实施方案中,“来自SV40的72bp元件”指具有以下序列的元件:ATGCTTTGCATACTTCTGCCTGCTGGGGAGCCTGGGGACTTTCCACACCCTAACTGACACACATTCCACAGCTGGTT(SEQ ID NO:74),对应SEQ ID NO:39的第10位核苷酸至第86位核苷酸。在特定的实施方案中,“来自SV40的72bp元件”指具有SEQ ID NO:39的序列的元件。
来自乙型肝炎病毒的PRE元件(SEQ ID NO:40)
一些真核的或病毒的mRNA含有抑制性序列以阻止它们被转运出细胞核至细胞质,在细胞质中它们能够被翻译。乙型肝炎病毒S转录体含有被称为转录后调控元件(PRE)的区域,该元件顺式作用以激活乙型肝炎病毒S转录体的转运。这种元件可以部分替代人免疫缺陷病毒Rev-应答元件(RRE)。已证实在编码抗原(比如HIV-1 Gag)的基因的3′非翻译区加入这种元件或具有相似功能的元件能够提高抗原的表达水平并改善免疫应答。
本文所使用的术语“绝缘子序列”指影响启动子和增强子/沉默子之间相互作用的并作为阻遏染色质扩散的屏障的DNA序列。在此定义内所包括的有Lu L,Tower J,1997,A transcriptional insulator element,the su(Hw)binding site,protects a chromosomal DNA replication origin from position effects(一种转录绝缘子元件,su(Hw)结合位点,保护染色体DNA复制起点不受位置影响),Mol Cell Biol.April;17(4):2202-2206中所描述的(su(Hw))绝缘子序列。存在于黑腹果蝇基因组中的具有绝缘子功能的大量序列之中,可以使用已被充分研究的并由Su(Hw)蛋白的重复结合位点组成的可能最强的绝缘子,该绝缘子首次发现于吉普赛(gypsy)反转座子中。Su(Hw)绝缘子是调控相互作用的通用调节子,阻断二十个以上不同的增强子。最近,在yellow基因和achaete基因之间发现了内源性Su(Hw)依赖的但结构不同的绝缘子。
本文所使用的术语“不依赖于连接的克隆”或“LIC”根据Robert E.Novy、Keith W.Yaeger和Kristin M.Kolb在文章“Efficient Directional Cloning of PCR Products(PCR产物的有效定向克隆)”(http://www.emdbiosciences.com/docs/NDIS/inno05-002.pdf)中所定义,不依赖于连接的克隆(LIC)可被描述如下:“不依赖于连接的克隆(LIC)是为无限制酶消化和连接反应的PCR产物定向克隆开发的。通过在仅有一种dNTP存在下用T4DNA聚合酶处理线性化骨架而构建LIC载体。T4DNA聚合酶的3′到5′核酸外切酶活性移除核苷酸直到其遇到与反应混合物中存在的单个dNTP对应的残基为止。此时,T4 DNA聚合酶的5′到3′聚合酶活性与核酸外切酶活性相抵以便有效地阻止进一步切除。在LIC载体中将与线性化位点毗邻的质粒序列设计为产生特异的非互补的13-或14-碱基的单链突出端。通过将适当的5′延伸引入到引物中而构建具有互补突出端的PCR产物。将PCR产物纯化以去除dNTP(以及原始质粒,如果其用作模板的话),然后在适当的dNTP存在下用T4 DNA聚合酶处理而生成特异性载体相容突出端。将退火的LIC载体和插入片段转化到感受态的大肠杆菌细胞中。在细胞内载体插入连接点处形成共价键而产生环形质粒。”
LIC方法的详细描述可在Nick S.Berrow等人,2007.″versatile ligation-independent cloning method suitable for high-throughput expression screening applications″(适宜于高通量表达筛选应用的通用的不依赖于连接的克隆方法),Nucleic Acids Research中找到。
在SEQ ID NO.69-73中提供了本发明的LIC得到的载体的大量的特定实施方案。
在一个特定的实施方案中,根据本发明的分离的DNA多核苷酸由以下元件组成:
1.昆虫选择性标记,具有驱动表达的昆虫启动子,比如具有根据SEQ ID NO:5、SEQ ID NO:6或SEQ ID NO:2的核苷酸序列的截短的黑腹果蝇肌动蛋白5C启动子或HSP70启动子;
2.细菌启动子,比如pKANR细菌启动子;
3.具有SV40聚腺苷酸尾的博来霉素选择性标记;
4.大肠杆菌复制起点;
5.具有根据SEQ ID NO:6的核苷酸序列的杂合黑腹果蝇612bp肌动蛋白5C启动子,其中肌动蛋白核心序列的部分或整体(诸如SEQ ID NO:6的第478至572位核苷酸)已被具有根据SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:37或其片段的核苷酸序列的HSP70核心启动子所替换,以驱动蛋白表达;
6.BIP蛋白输出信号序列;
7.多克隆位点;和
8.OPIE2聚腺苷酸尾。
在一个特定实施方案中,根据本发明的分离DNA多核苷酸由以下元件组成:
1.昆虫选择性标记,具有驱动表达的昆虫启动子,比如具有根据SEQ ID NO:5、SEQ ID NO:6或SEQ ID NO:2的核苷酸序列的截短的黑腹果蝇肌动蛋白5C启动子或HSP70启动子;
2.细菌启动子,比如pKANR细菌启动子;
3.具有SV40聚腺苷酸尾的博来霉素选择性标记;
4.大肠杆菌复制起点;
5.具有根据SEQ ID NO:3的第2076-2532位核苷酸的核苷酸序列的黑腹果蝇457bp肌动蛋白5C启动子;
6.BIP蛋白输出信号序列;
7.多克隆位点;和
8.OPIE2聚腺苷酸尾。
在一个特定实施方案中,根据本发明的分离DNA多核苷酸由以下元件组成:
1.昆虫选择性标记,具有驱动表达的昆虫启动子,比如具有根据SEQ ID NO:5、SEQ ID NO:6或SEQ ID NO:2的核苷酸序列的截短的黑腹果蝇肌动蛋白5C启动子或HSP70启动子;
2.细菌启动子,比如pKANR细菌启动子;
3.具有SV40聚腺苷酸尾的博来霉素选择性标记;
4.大肠杆菌复制起点;
5.具有根据SEQ ID NO:3的第2076-2532位核苷酸的核苷酸序列的杂合黑腹果蝇457bp肌动蛋白5C启动子;其中肌动蛋白核心序列的部分或整体(比如SEQ ID NO:3的第2392-2487位核苷酸)已被具有根据SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:37或其片段的核苷酸序列的HSP70核心启动子所替换,以驱动蛋白表达;
6.BIP蛋白输出信号序列;
7.多克隆位点;和
8.OPIE2聚腺苷酸尾。
在一个特定实施方案中,根据本发明的分离DNA多核苷酸由以下元件组成:
1.昆虫选择性标记,具有驱动表达的昆虫启动子,比如具有根据SEQ ID NO:5、SEQ ID NO:6或SEQ ID NO:2的核苷酸序列的截短的黑腹果蝇肌动蛋白5C启动子或HSP70启动子;
2.细菌启动子,比如pKANR细菌启动子;
3.具有SV40聚腺苷酸尾的博来霉素选择性标记;
4.大肠杆菌复制起点;
5.具有根据SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:37或其片段的核苷酸序列的HSP70核心启动子以驱动蛋白表达,以及与HSP70核心启动子顺式相关的肌动蛋白5C启动子(肌动蛋白5c调控元件)的一个或多个功能片段;
6.BIP蛋白输出信号序列;
7.多克隆位点;和
8.OPIE2聚腺苷酸尾。
在某些特定实施方案中,根据本发明的分离的DNA多核苷酸中的以下元件将被互换:
1.Su(Hw)元件可置于表达盒(表达启动子、感兴趣的基因和聚腺苷酸尾)的前面和后面;和/或
2.表达载体中的博来霉素选择性标记可被以下所替换:
a.新霉素选择性标记,或
b.杀稻瘟素选择性标记,或
c.潮霉素选择性标记,或
d.或嘌呤霉素选择性标记;和
3.表达构建体可制备成具有和没有HIS-标签。
根据本发明,一种适宜载体可由以下组成:
1.细菌选择性标记,具有细菌启动子
a.pKANR细菌启动子
b.博来霉素选择性标记(ZeoR和/或KanR)
2.昆虫选择性标记,具有驱动表达的昆虫启动子
a.截短的黑腹果蝇肌动蛋白5C启动子或HSP70启动子
b.具有SV40聚腺苷酸尾的博来霉素选择性标记
3.大肠杆菌复制起点
4.驱动蛋白表达的截短的黑腹果蝇肌动蛋白5C或HSP70启动子
5.BIP蛋白输出信号序列
6.HIS-标签
7.多克隆位点
8.OPIE2聚腺苷酸尾
从以上应理解,单独的元件可以按任意给定的次序放置。因此昆虫启动子和细菌启动子可以直接置于彼此的后面。同时细菌启动子和昆虫细胞启动子可以使用同样的选择性标记序列。
一般载体改良
可将以下的元件加入到表达载体中以提高表达水平。
1.感兴趣的基因表达盒的上游和下游的遍在染色质开放元件;和/或
2.前元件,和SV40的72bp元件;和/或
3.MAR(基质附着区);和/或
4.来自黑腹果蝇的ACE3和ori-β;和/或
5.转录绝缘子元件,su(Hw)结合位点(Mol Cell Biol.1997年4月;17(4):2202-2206.);和/或
6.替换BIP的CPY元件(如果CPY在S2中是功能性的);和/或
7.可插入dhfr以在昆虫细胞中用于筛选;和/或
8.可插入独立的卡那霉素或氨苄青霉素抗性盒以用于细菌筛选;和/或
9.用后期SV40聚腺苷酸尾替换OPIE2聚腺苷酸尾;和/或
10.将内含子引入启动子的下游以驱动蛋白表达;和/或
11.可包括不依赖于连接的克隆盒。
在某些实施方案中,根据本发明的多核苷酸序列在中度严格的条件下与选自由以下组成的组的序列杂交:
(i)SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:33、SEQ ID NO:36、或SEQ ID NO:37、或SEQ ID NO:58的核苷酸序列;
(ii)与(i)的任何一种序列具有至少80%序列同一性的核苷酸序列;
(iii)(i)或(ii)的任何一种序列的至少6个连续核苷酸的功能片段;
(iv)与(iii)的至少6个核苷酸的功能片段具有至少80%序列同一性的核苷酸序列;
(v)包含(i)、(ii)、(iii)和(iv)的任何一种序列的两种或更多种序列的嵌合核苷酸序列。
本文所使用的术语“中度严格”指在约42℃下、在约50%甲酰胺、6×SSC中的多核苷酸杂交的条件,以及约60℃、0.5×SSC、0.1%SDS的洗涤条件。
本发明用于蛋白表达的方法
本发明的另一个方面涉及从宿主细胞表达和回收多肽。
如以上所详述,本发明的此方面通常利用包含至少一种选自由以下组成的组的序列的启动子DNA多核苷酸的发现:
(i)SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:33、SEQ ID NO:36、或SEQ ID NO:37、或SEQ ID NO:58的核苷酸序列;
(ii)与(i)的任何一种序列具有至少80%序列同一性,并在果蝇S2细胞中具有启动子活性的核苷酸序列;
(iii)为(i)或(ii)的任何一种序列的至少6个连续核苷酸的功能片段的核苷酸,所述功能片段在果蝇S2细胞中具有启动子活性;
(iv)与(iii)的所述功能片段具有至少80%序列同一性,并在果蝇S2细胞中具有启动子活性的核苷酸序列;
(v)包含(i)、(ii)、(iii)和(iv)的任何一种序列的两种或更多种序列的第一嵌合核苷酸序列,和
(vi)在果蝇S2细胞中具有启动子活性的第二嵌合核苷酸序列,包含至少6个核苷酸并包含来自(iii)和/或(iv)的至少2个核苷酸序列的连续核苷酸序列段,其中每个单独的所述连续核苷酸序列段在果蝇S2细胞中不具有启动子活性;当表达分泌性多肽时提供增高的产量。
本发明人最近已经证明该增高的产量(超过例如利用pOPIE2启动子的构建体)是增高的表达水平和分泌水平的结果。如上所述,根据本发明的方法包括以下步骤:
(a)获得编码感兴趣的多肽的多核苷酸序列;
(b)将编码感兴趣的多肽的所述多核苷酸序列插入根据权利要求1-27的任何一项所述的分离的DNA多核苷酸中;
(c)利用在步骤(b)获得的多核苷酸转化宿主细胞;
(d)允许利用步骤(b)获得的所述多核苷酸表达以生产多肽;和
(e)由此获得多肽。
转化的方法将根据所选择的宿主细胞而不同,但通常在酵母中使用通过醋酸锂(Okazaki等人,Nucleic acid Res.18:6485-6489,1990,通过引用并入本文)或电穿孔方式的转染,而转染和转导(即,通过病毒载体方式转移遗传物质)可在多细胞生物来源的细胞中使用。在Park J.H.;Kim H.Y.;Han K.H.;Chung I.S,Optimization of transfection conditions for expression of green fluorescent protein in Drosophila melanogaster S2 cells-a highly efficient,lipid-mediated DNA-transfection procedure(用于黑腹果蝇S2细胞中绿色荧光蛋白表达的转染条件的优化-一种高效、脂质介导的DNA转染方案).Enzyme and Microbial Technology,第25卷,第7号,1999年10月,第558-563页(6)中描述了用于在黑腹果蝇S2细胞中转染的适宜方法。
更多的转化和转化细胞(酵母或更高级的)的培养的常规教导可见于Sambrook J等人的″Molecular Cloning:A laboratory Manual(分子克隆:实验室手册)″,第三版。
以上提供的关于启动子的选择、功能性分泌信号肽、载体形式的选择、宿主细胞的选择、选择性标记的使用和稳定元件的使用的教导做适当变动后应用于本发明的方法。这些教导与本发明的方法的教导之间仅有的差别是载体中编码序列的精确组成,因为本发明的方法不依赖于本文所定义的嵌合多核苷酸的存在。但是,优选地,本发明的方法中所使用的表达载体是本发明的表达载体。
在某些实施方案中,本发明的方法包括将步骤(c)中得到的多肽进行翻译后修饰的进一步的步骤,这不仅需要由宿主细胞实现的(并随之在多肽回收以前进行的)翻译后修饰,而且需要多肽回收以后在体外进行的修饰。
本发明的方法的步骤(a)通常包括将载体导入到宿主细胞中并随后筛选表达存在于载体中的选择性标记基因的转化体的步骤。以上已经详细叙述了可用的选择性标记基因。
本发明将通过以下非限制性实施例而阐明。
实施例1
缩略语
表1:
ATCC       美国典型培养物保藏中心
CEP        细胞,实验方案
DMSO       二甲基亚砜
ELISA      酶联免疫吸附测定
FBS        胎牛血清
LAF        空气层流
PCR        聚合酶链式反应
T25        组织培养瓶,25cm2
T75        组织培养瓶,75cm2
V          体积
Wt         野生型
Bp         碱基对
SOE-PCR    重叠延伸拼接法
ON         过夜
LB         LB培养基
DNA        脱氧核糖核酸
E.coli     大肠杆菌
材料和方法
细胞系
果蝇S2细胞获自ATCC(CRL-1963,批号3225543)
在组织培养瓶中对来自ATCC的一小管果蝇S2细胞进行复苏和扩增。当细胞数超过108个细胞时,建立细胞库并储存于-80℃下,细胞库由1mL冻存液(Excell420+50%FBS+10%DMSO)中含有2×107个果蝇S2细胞的20个小管组成。
质粒构建
原始数据(表2)
  名称   用途   商业来源
  NcoI   限制酶   New England Biolab
  HindⅢ   限制酶   New England Biolab
  XbaI   限制酶   New England Biolab
  NotI   限制酶   New England Biolab
  EcoRI   限制酶   New England Biolab
Figure BPA00001309938400451
商业上获得的载体(表3):
 载体   启动子   抗生素抗性   商业来源
 p2Zop2F   pOPIE2   博来霉素   RCT
Figure BPA00001309938400461
本研究中构建的载体(表4)(所有载体赋予博来霉素抗性)
本研究所用的模型蛋白为RANK配体(RANK-L或RANKL)。此蛋白在每个试验的载体中被插入到BIP信号序列的后面的多克隆位点中。
根据本实例使用的pKanR序列:
Figure BPA00001309938400472
Figure BPA00001309938400473
CATAGTATAATACGACTCACTATAGGAGGGCC(SEQ ID NO:63,粗体为KnanR启动子序列,其余为EM7启动子序列)
S2载体的构建
pZOp2F-NheI(p2260,菌株MR#3070)。通过使用来自Stratagene的QuikChange定点诱变试剂盒(QuikChange Site-Direct Mutagenesis Kit)构建了具有SV40下游NheI位点的载体,该试剂盒用于克隆具有不同启动子的载体。
使用p1205作为模板,利用引物975和976进行QuickChange。在37℃下用DpnI处理PCR产物一小时,然后将PCR产物转化入DH10B细胞中,并铺在含有0.75ug/ml博来霉素的LB琼脂板上,培养过夜。
利用引物590对质粒进行完全测序。
pHP11(p2263,菌株MR#3073)通过一步PCR扩增而构建。使用p805(pAc5.1/V5-HisA)作为模板利用引物980和979进行PCR。所得的片段为2540bp,含有肌动蛋白5C启动子。用限制性核酸内切酶NheI和HindⅢ消化PCR片段,并将其克隆到用NheI和HindⅢ消化过且用SAP处理过的p2260中。在热循环仪中连接过夜。将连接产物转化到DH10B细胞中,并铺在含有0.75μg/ml博来霉素的LB琼脂板上,培养过夜。
利用引物590、981、986和917对所得质粒中的插入片段进行完全测序。
pHP12-载体(p2263,菌株MR#3073)通过一步PCR扩增而构建。使用p2546作为模板利用引物981和982进行PCR。所得的片段为299bp,含有取自S2细胞基因组DNA的Hsp70-pFast-Bac来源的Hsp70启动子。
用限制性核酸内切酶NheI和HindⅢ消化PCR片段,并将其克隆到用NheI和HindⅢ消化过且用SAP处理过的p2260中。在热循环仪中连接过夜。将连接产物转化到DH10B细胞中,并铺在含有0.75μg/ml博来霉素的LB琼脂板上,培养过夜。
利用引物590、981、986和917对所得质粒中的插入片段进行完全测序。
pHP13(p2264,菌株MR#3074)通过一步PCR扩增而构建。使用p2546作为模板利用引物983和984进行PCR。所得的片段为473bp,含有取自S2细胞基因组DNA的Hsp70-pFast-Bac来源的全长Hsp70启动子。
用限制性核酸内切酶NheI和HindⅢ消化PCR片段,并将其克隆到用NheI和HindⅢ消化过且用SAP处理过的p2260中。在热循环仪中连接过夜。将连接产物转化到DH10B细胞中,并铺在含有0.75μg/ml博来霉素的LB琼脂板上,培养过夜。
利用引物590、984和917对所得质粒中的插入片段进行完全测序。
在载体中改变ZeoR基因上游的OpIE2和EM7启动子
pHP15a(p2270,菌株MR#3080)
载体含有替换EM7启动子的ptrc启动子和替换OpIE2的肌动蛋白5C启动子,均位于ZeoR基因上游。
构建体通过SOE-PCR构建。使用p2263作为模板利用引物4007和4009制备第一PCR1片段。所得的PCR产物长度为234bp。使用p2263作为模板利用引物4008和4000制备第二PCR2片段。该片段长度为1134bp。
通过混合PCR1产物和PCR2产物来进行SOE-PCR。最后利用引物4000和4009扩增片段。
所得片段为1433bp,利用限制性核酸内切酶EcoRI和NcoI进行消化,并将其克隆到用EcoRI和NcoI消化过且用SAP处理过的p2263中。在热循环仪中连接过夜。将连接产物转化到DH10B细胞中,并铺在含有0.75μg/ml博来霉素的LB琼脂板上,培养过夜。
利用引物1892、2232、2233、2234、2235、2236、2007、4000、4002、4007和4009对所得质粒中的插入片段进行完全测序。
pHP15b(p2271,菌株MR#3081)
该载体与pHP15a非常相像,但是在ZeoR基因上游含有Hsp70启动子而不是肌动蛋白5C启动子。通过一步PCR扩增而构建。使用p2270作为模板利用引物4001和4002进行PCR。所得的片段为290bp,含有肌动蛋白5c启动子。
用限制性核酸内切酶XmnI和SphI消化PCR片段,并将其克隆到用XmnI和SphI消化过且用SAP处理过的p2270中。在热循环仪中连接过夜。将连接产物转化入DH10B细胞中,并铺在含有0.75μg/ml博来霉素的LB琼脂板上,培养过夜。
利用引物2007、4000和4001对所得质粒中的插入片段进行完全测序。
pHP15c(p2272,菌株MR#3082)在ZeoR基因上游含有替换EM7启动子的KanaR启动子序列。
构建体通过SOE-PCR构建。使用p2270作为模板利用引物4003和4009制备第一PCR1片段。所得的PCR产物长度为296bp。
使用p2270作为模板利用引物4004和2007制备第二PCR2片段。该片段长度为189bp。
通过混合PCR1产物和PCR2产物来进行SOE-PCR。最后利用引物4009和2007扩增片段。
利用限制性核酸内切酶SphI和NcoI消化所得的450bp的片段,并将其克隆到用SphI和NcoI消化过且用SAP处理过的p2270中。在热循环仪中连接过夜。将连接产物转化入DH10B细胞中,并铺在含有0.75μg/ml博来霉素的LB琼脂板上,培养过夜。
利用引物2007和4003对所得质粒中的插入片段进行完全测序。
由pHP11构建截短的肌动蛋白5c启动子
pHP17(p2276,菌株MR#3086)包含来自肌动蛋白5c启动子的1486bp的截短序列。
用限制性核酸内切酶SphI和NheI消化载体p2262,利用Klenow再次连接载体。将连接产物转化到DH10B细胞中,并铺在含有0.75μg/ml博来霉素的LB琼脂板上,培养过夜。
通过利用引物590和980进行菌落PCR而筛选克隆。正确的插入片段显示出长为1510bp的DNA片段。
利用引物590、917、990、992、993、994、995和2509对所得质粒中的插入片段进行完全测序。
pHP18(p2277,菌株MR#3087)包含来自肌动蛋白5c启动子的612bp的截短序列。
用限制性核酸内切酶SpeI和NheI消化载体p2262,利用Klenow再次连接载体。将连接产物转化到DH10B细胞中,并铺在含有0.75μg/ml博来霉素的LB琼脂板上,培养过夜。
通过利用引物590和980进行菌落PCR而筛选克隆。正确的插入片段显示出长为660bp的DNA片段。
利用引物590、917、993、995和2509对所得质粒中的插入片段进行完全测序。
pHP12-Afl Ⅱ(p2287,菌株MR#3097)该载体通过SOE-PCR构建。使用p2263作为模板利用引物987和4036制备第一PCR1片段。所得的PCR产物长度为217bp。
使用p2263作为模板利用引物4035和986制备第二PCR2片段。片段的长度为190bp。
通过混合PCR1产物和PCR2产物来进行SOE-PCR。最后利用引物986和987扩增片段。
利用限制性核酸内切酶NheI和HindⅢ消化所得的362bp的片段,并将其克隆到用NheI和HindⅢ消化过且用SAP处理过的p2263中。在热循环仪中连接过夜。将连接产物转化入DH10B细胞中,并铺在含有0.75μg/ml博来霉素的LB琼脂板上,培养过夜。
利用引物982对所得质粒中的插入片段进行完全测序。
具有肌动蛋白5c核心启动子和Hsp70核心启动子的杂合体载体的克隆
pHP18-Afl Ⅱ(p2288,菌株MR#3098)该载体通过SOE-PCR构建。使用p2277作为模板利用引物987和4038制备第一PCR1片段。使用p2277作为模板利用引物4037和986制备第二PCR2片段。片段的大小为224bp。
通过混合PCR1产物和PCR2产物来进行SOE-PCR。最后利用引物986和987扩增片段。
利用限制性核酸内切酶NheI和HindⅢ消化所得的689bp的片段,并将其克隆到用NheI和HindⅢ消化过且用SAP处理过的p2277中。在热循环仪中连接过夜。将连接产物转化到DH10B细胞中,并铺在含有0.75μg/ml博来霉素的LB琼脂板上,培养过夜。
利用引物980对所得质粒中的插入片段进行完全测序。
pHP19杂合体肌动蛋白5c核心启动子,包含肌动蛋白5C核心启动子序列和Hsp70核心启动子上游的Hsp70启动子序列。
利用限制性核酸内切酶AflⅡ和HindⅢ消化载体p2288,所得的产物长度为178bp,并将该片段克隆到用AflⅡ和HindⅢ消化过的p2287中。在热循环仪中连接过夜。将连接产物转化到DH10B细胞中,并铺在含有0.75μg/ml博来霉素的LB琼脂板上,培养过夜。
通过利用引物4000和917进行菌落PCR而筛选克隆。正确的插入片段显示出所预期大小的DNA片段。利用引物980和917对所得质粒中的插入片段进行完全测序。
pHP20杂合体-Hsp70核心,包含Hsp70核心启动子序列和肌动蛋白5c核心启动子上游的肌动蛋白5C启动子序列。
利用限制性核酸内切酶Afl Ⅱ和HindⅢ对载体p2287进行消化,所得的产物长度为144bp,并将其克隆到用Afl Ⅱ和HindⅢ消化过的p2288中。在热循环仪中连接过夜。将连接产物转化入DH10B细胞中,并铺在含有0.75μg/ml博来霉素的LB琼脂板上,培养过夜。
通过利用引物993和901进行菌落PCR而筛选克隆。正确的插入片段显示出长度为478bp的DNA片段。利用引物986和917对所得质粒中的插入片段进行完全测序。
细胞系生长和维持
材料
冻存管,1.8ml:Nunc目录号377267
Excell420:SAFC目录号14420
胎牛血清,FBS,500ml:Life Technologies目录号10099-141
摇瓶,250ml,带有0.2μm通风盖:Corning目录号431144(工作体积:25-70ml)
摇瓶,1000ml,带有0.2μm通风盖:Corning目录号431147(工作体积:100-225ml)
组织培养瓶,25cm2:Greiner目录号690160(工作体积:4-8ml)
组织培养瓶,75cm2:Greiner目录号658170
从冻存原种起始细胞培养
1.从液氮中取出一个(或多个)冻存管,置于23℃水浴中。轻微震动下快速解冻,直至细胞几乎完全解冻。从水浴中取出冻存管。每管在1ml冻存液(40%Excell420+50%FBS+10%DMSO)中含有4E7个细胞
2.用70%的乙醇处理而迅速净化冻存管的外部,并将细胞悬浮液轻轻转移到含有7ml 23℃的培养基(Excell420+10%FBS)的离心管中,在330×g下离心2分钟
3.弃掉培养基以去除DMSO,将细胞在5ml 23℃的培养基(Excell420+10%FBS)中重悬,并将悬浮液转移至T25中
4.在23℃下进行培养直至细胞达到6E6-9E6个细胞/ml的密度。这可能需要2-4天。每天检查细胞并用细胞计数器计数细胞,记录细胞浓度和存活率。存活率通常将在3-4天内增长到80-90%。
细胞在组织培养瓶中的扩增
1.将细胞培养物从T25转移到T75中,并加入10ml 23℃的培养基(Excell420+10%FBS)。在23℃下进行培养直至细胞达到6E6-9E6个细胞/ml的密度。这可能需要2-4天。每天检查细胞并用细胞计数器计数细胞,记录细胞浓度和存活率。存活率通常将>90%。
2.将细胞培养物从T75转移到两个T75中,并在每个T75中加入10ml 23℃的培养基(Excell420+10%FBS)。在23℃下进行培养直至细胞达到6E6-9E6个细胞/ml的细胞密度。这可能需要2-4天。每天检查细胞并用细胞计数器计数细胞,记录细胞浓度和存活率。存活率通常将>90%。
3.将细胞培养物从两个T25转移到250ml的一次性摇瓶中,并加入25ml 23℃的培养基(Excell420)。在110rpm和23℃条件下培养细胞直至细胞达到1.5E7-2E7个细胞/ml的密度。这可能需要3-4天。从转移后第二天开始检查细胞并用细胞计数器计数细胞,记录细胞浓度和存活率。存活率通常将>90%。
细胞在摇瓶中的扩增
1.将细胞从R250转移到离心管中,并在330×g下离心5分钟。在适当的摇瓶中用新鲜培养基(Excell420)重悬细胞,达到8E6个细胞/ml的细胞密度。在110rpm和23℃条件下培养细胞直至细胞达到2.5E7-3.5E7个细胞/ml的密度。这可能需要3-4天。从转移后第二天开始检查细胞并用细胞计数器计数细胞,记录细胞浓度和存活率。存活率通常将>90%。
2.在1000ml摇瓶中扩大细胞培养,直到获得8.5E9个细胞的总细胞数:每3-4天,通过离心、在新摇瓶中用新鲜培养基(Excell420)重悬细胞达到8E6个细胞/ml的细胞密度,从而分离细胞。在最后一次传代培养后两天应该用细胞制备原始细胞库(Master Cell Bank)。
细胞库的制备
1.检查细胞并用细胞计数器计数细胞,记录细胞浓度和存活率。存活率通常将>90%。将对应8E9个细胞的细胞悬浮液转移到离心管中,在330×g下离心5分钟。用200ml 4℃的冷冻培养基(40%Excell420、50%FBS和10%DMSO)重悬细胞,然后快速在每个冻存管中分入1ml细胞悬浮液。
2.将冻存管转移到4℃Mr.Frosty冻存盒中,并将这些冻存盒放置到-80℃冰箱中。
3.6-48小时后将冻存管转移到液氮中储存。(工作体积12-25ml)。
细胞转染
利用来自按上述规定所维持的生长培养物中的细胞,其在转染前1-2天离心细胞后稀释或重悬。存活率应该>90%。
1.将每次转染的对应约3.2E7个细胞的细胞悬浮液转移到离心管中,在约125×g下离心约3分钟。
2.每次转染用约4ml约23℃的培养基重悬,并将4ml细胞悬浮液转移到每个T25中。
3.将约6.3ug的每种DNA转移到单独的eppendorf管中。
4.在每个含有DNA的eppendorf管中加入缓冲液EC(Buffer EC)以达到150μl的终体积。
5.通过吹吸几次以混合DNA和缓冲液EC。
6.向含有DNA和缓冲液EC的eppendorf管中加入50μl的Enhancer。
7.旋涡DNA混合物1秒钟。
8.在20-25℃孵育2-5分钟。
9.向含有DNA混合物的eppendorf管中加入140μl的Effectene。
10.吹吸5次以混合。
11.在20-25℃下孵育5-10分钟。
12.向管中加入1.5ml的培养基,吹吸几次以混合。
13.将DNA混合物小心滴加到T25中的细胞悬浮液中,并小心来回倾斜培养瓶。
14.在约23℃下培养。
其它适宜于在黑腹果蝇S2细胞中转染的方法在Park J.H.;Kim H.Y.;Han K.H.;Chung I.S,Optimization of transfection conditions for expression of green fluorescent protein in Drosophila melanogaster S2 cells-a highly efficient,lipid-mediated DNA-transfection procedure(黑腹果蝇S2细胞中用于绿色荧光蛋白表达的转染条件的优化-一种高效、脂质介导的DNA转染方案).Enzyme and Microbial Technology,第25卷,第7号,1999年10月,第558-563页(6)中描述。
Effectene转染试剂是一种非脂质体型脂质制剂,在血清存在下转染时具有最小的细胞毒性,并具有高转染效率。Effectene试剂与Enhancer和DNA浓缩缓冲液(缓冲液EC)联合使用以便实现高转染效率。
瞬时转染
转染后使细胞在23℃下生长和繁殖2-4天,然后取样用于细胞计数、感兴趣的蛋白和总蛋白测定。在瞬时转染期间不应该加入任何选择性试剂。
制备稳定细胞系
转染后使细胞生长1-2天,然后加入1.5mg/ml的博来霉素(或适合浓度的其它适合的选择性试剂)。然后如上所述(组织培养瓶中细胞的扩增;摇瓶中细胞的扩增)在组织培养瓶和摇瓶中扩增细胞。2-4周后,由于抗性标记整合入基因组中,仅存在有对选择性标记具有抗性的细胞,并且此细胞系可被认为是稳定的。此时进一步的培养或增殖的步骤中可将选择性试剂省去,细胞可按照如上所述冻存。
分析
利用ELISA分析本研究所用的模型蛋白(RANK-配体)。利用Bradford总蛋白分析法测定总蛋白浓度。
结果
已构建了一系列具有增强的蛋白表达水平的载体。NN2表达载体具有3个主要类型:第一种类型包含具有驱动蛋白表达的肌动蛋白5C启动子的不同变体的载体;第二种类型指使用HSP70启动子的载体,而第三种类型包含杂合的肌动蛋白5C/HSP70启动子。
研究了突变的肌动蛋白5c启动子(参见序列比对章节的突变)以确定其蛋白表达水平(载体pHP11)。发现突变的肌动蛋白5c启动子与pOPIE2相比产生了一贯较高的表达水平(参见图1)。
还检测了两种形式的黑腹果蝇S2 HSP70启动子。第一种启动子是全长的HSP70启动子(457bp,载体pHP13),而第二种是HSP70的截短形式(59bp至342bp,参见序列章节,载体pHP12)。发现截短形式与全长启动子相比具有达5倍的更高的蛋白表达水平(参见图2)。还观察到截短的HSP70启动子在稳定细胞系和瞬时细胞系中具有高水平表达(参见图3和图4)。
通过截短进一步研究了肌动蛋白5C启动子突变体和截短的HSP70启动子。瞬时细胞系和稳定细胞系中的蛋白表达结果可参见图3和图4。
在稳定细胞系中肌动蛋白5C和HSP70启动子变体在蛋白表达水平上实现超过了pOPIE2启动子3-9倍(图3)。并且,通过使用最短的截短的肌动蛋白5C启动子(肌动蛋白5C_3,载体pHP18),在平均表达水平上达到了超过全长肌动蛋白5C启动子的增高,虽然需要更多的实验来证实其是否具有显著更高的表达。但是,这种趋势也可以从瞬时转染中看到(参见图4)。已看到HSP70启动子的最高的表达水平,而HSP70核心启动子序列与pOPIE2和截短的HSP70启动子相比导致了显著降低的表达水平。HSP70截短的启动子的表达水平虽然一直高于pOPIE2,但在不同转染间具有很大差异。预期对该构建体的转染进行优化将会减少不同的稳定的多克隆细胞系之间的差异。但是,稳定的多克隆细胞系一旦建立,在表达上不会随着时间表现出显著差异。因此应该在使用前对转染后所获得的稳定的多克隆细胞系进行筛选以找到最佳表达的多克隆群体。
在瞬时转化中与pOPIE2启动子相比蛋白表达水平增高了4-12倍。在瞬时转染中最短的截短的肌动蛋白5C启动子(载体pHP18)具有最高的一致表达水平。
将肌动蛋白5C的核心启动子(载体pHP10)和HSP70的核心启动子(载体pHP16)与pOPIE2相比以更加深入了解它们的相关性质。HSP70核心启动子的表达水平显著高于肌动蛋白5C核心启动子,虽然这两种启动子都显著弱于用作内部对照的pOPIE2启动子。(图5)
将肌动蛋白5C核心启动子与KanR细菌启动子联合使用(载体pHP15c)以表达ZeoR博来霉素抗性基因。这使博来霉素在大肠杆菌和S2昆虫细胞二者中用作选择性标记。此外,肌动蛋白5C核心启动子显著弱于在p2ZOp2F中用于表达博来霉素抗性标记的pOPIE2启动子。这导致与转染p2ZOp2F质粒的细胞相比,转染后对抗生素抗性降低了2倍,导致在筛选稳定细胞时使用2倍减少量的博来霉素(0.75mg/ml相对1.5mg/ml)。
此外,包括了不同的选择性标记,以允许在载体的应用中具有更高的灵活性。包括以下的标记:博来霉素、新霉素和杀稻瘟素。
通过突变或截短的肌动蛋白5C启动子获得高表达水平
对比突变的肌动蛋白5C启动子与商业上可获得的pOPIE2启动子的表达水平,发现肌动蛋白5C启动子有显著的增高(参见图1)。通过将肌动蛋白5C启动子由全长的2532bp截短为612bp(SEQ ID NO:3)获得了进一步增高的蛋白生产水平。对于稳定细胞系,截短的启动子与商业上可获得的含有pOPIE2启动子的p2ZOp2F载体相比具有5倍增高的蛋白生产。同时,与p2ZOp2F载体所获得的表达水平相比,瞬时表达水平增高达12倍。(参见图3和4)
截短基因组HSP70启动子的效应
在黑腹果蝇S2细胞中,调控机制不仅在热休克时导致HSP70的诱导,还在常温时阻止其表达(Feder等人,1992,Gene Dev.Aug;6(8):1402-13)。令人惊奇的是,在稳定转染的细胞系中,截短的HSP70启动子,与肌动蛋白5C和pOPIE2启动子相比表现出了最高的表达水平(参见图3)。但是,在克隆时去除了基因组全长启动子上游端的58bp和启动子下游端的114bp而构建了截短的启动子。似乎这种截短直接导致了所观察到的失控的(组成型的)高表达水平。在图2中,瞬时转染中的截短的HSP70启动子的这种组成型的高表达水平与全长启动子的低表达水平相反。这表明启动子阻遏的削弱。
在稳定细胞系筛选中减少所需的博来霉素浓度
使用具有显著弱化的表达水平(与全长启动子和pOPIE2启动子相比)的肌动蛋白5C核心启动子连同KanR细菌启动子,导致了转染细胞系的增高的博来霉素敏感性(2倍)。较低的抗性可以帮助筛选较多多拷贝的整合事件,从而弥补ZeoR抗性标记的低表达水平,进而导致较高的感兴趣的基因的蛋白表达水平。建立稳定细胞系时使用较少博来霉素筛选高拷贝数基因整合事件的能力本身是一种优势,因为博来霉素是一种诱变剂,可能对细胞产生有害的和非预期的影响。
通过杂合体肌动蛋白5C/HSP70启动子增高的表达
在以上讨论的实验中发现截短的HSP70启动子在稳定细胞系中导致了最高的表达水平(图3)。但是,在瞬时转染过程中利用最短的截短的肌动蛋白5C启动子(肌动蛋白5C_3)达到了最高的表达水平(图4)。并且,发现在瞬时转染过程中HSP70核心启动子与肌动蛋白5C核心启动子相比具有4倍高的表达水平(图5)。
因此决定制备杂合启动子,其中来自肌动蛋白5C和HSP70的核心启动子分别被交换为截短的肌动蛋白5C启动子和截短的HSP70启动子。与原始肌动蛋白5C启动子相比,认为肌动蛋白5C-HSP70核心杂合启动子导致了表达水平的显著增高。
载体构建
pHP34s载体的DNA从GeneART,Germany订购合成(SEQ ID NO:58)。由pHP34s构建的所有载体的制备使用了从GeneART,Germany订购的合 成DNA和从DNA-technology,Denmark订购的引物。
杂合启动子编码序列在质粒pHP34s-杂合体中构建,通过对来自从GeneART订购的合成的HSP70启动子DNA(SEQ ID NO:37)的HSP70核心启动子编码序列进行PCR(PCR引物:GCGAACTTAAGAGCGCCGGAGTATAAATAG(SEQ ID NO:64)和CCAAGCTTCTGCAGATTGTTTAGCTTG(SEQ ID NO:65))。然后进行第二次PCR以从pHP34s获得启动子上游部分的肌动蛋白5c启动子(引物:GGTTTGTCCAAACTCATCAATGTAT(SEQ ID NO:66)和TATACTCCGGCGCTCTTAAGTTCGCTCGCGTTCAAAACTTTTACC(SEQ ID NO:67)),然后利用PCR将两种PCR片段融合。
然后利用SpeI和HindⅢ消化所得的融合的PCR产物,然后按照标准分子生物学方案将其连接到用SpeI和HindⅢ消化后的pHP34s载体中。用于杂合启动子的DNA也可以订购合成,然后利用SpeI和HindⅢ将该DNA克隆到pHP34s杂合体中。
内含子(合成的,(SEQ ID NO:60))从GeneART订购,并由GeneART在SacI和EcoRI限制位点之间插入到pHP34s杂合体载体中而构建pHP34s杂合体.i载体。
将HSP70基质附着区或hSAR元件(SEQ ID NO:59)插入到pHP34s杂合体的表达盒侧翼的两个位置。hSAR元件按合成的序列从GeneART订购,在每侧的侧翼具有SpeI和NarI位点。利用NarI消化pHP34s杂合体载体和含有hSAR的GeneART载体,纯化所需片段的凝胶并将其连接以产生两种以两个方向插入hSAR元件的载体,pHP34s-杂合体-hSAR-F或-R(-F或-R代表正向或反向)。然后利用SpeI对这两种载体中的每一种和含hSAR的GeneART载体进行消化,纯化所需片段的凝胶并将其连接以构建四种载体。这四种载体含有按全部四种可能方向的两个hSAR元件。
利用EcoRI和NotI消化上述载体和订购合成的RANKL(变体hRP1.12-RA)和HA模型蛋白DNA编码序列,纯化所需片段的凝胶并将其连接(例如RANKL与载体之一连接或HA与载体之一连接)以产生插入有RANKL或HA编码DNA的上述载体。所得的载体命名为hRP1.12-RA-载体名称或HA-载体名称,例如:hRP1.12-RA,pHP34s-杂合体。
含有RANKL和HA(来自H5N1禽流感病毒)的pMT/V5.HIS.A和pAC5.1载体的构建。载体获自Invitrogen,利用EcoRI和NotI消化,纯化所需片段的凝胶并将其与用EcoRI和NotI消化且凝胶纯化后的上述合成的RANKL或HA相连接,以产生插入有RANKL编码DNA的pMT/V5和pAC5.1载体。
构建了卡那霉素/遗传霉素(G418)抗性标记载体,并命名为pHP34s杂合体-KanR。通过插入geneART订购的合成的编码KanR/NeoR基因的DNA(已为大肠杆菌和S2细胞表达而优化)和大肠杆菌启动子到pHP34s杂合体载体中而构建载体。利用XmnI和SalI消化载体和插入的片段,按照标准方案对线性载体和含有kanR的片段进行凝胶纯化和连接。
hRP1.12-RA-pHP34s-杂合体、pHP34s、pHP34s-杂合体-hSAR-FR和pHP34s-杂合体.i的载体图谱如图10-12所示。
转染
利用两种Invitrogen载体(pMT/V5.HIS.A和pAC5.1)进行对比实验。这两种载体并不含有选择性标记,因此利用获自Invitrogen的赋予潮霉素抗性的载体(pCoHygro)进行共转染。按照同样的方案对pHP34s来源的载体进行转染,但将潮霉素抗性载体以10∶1的比例加入到pMT/V5.HIS.A和pAC5.1载体中(表达载体为潮霉素抗性载体的10倍)。
其余载体按照如上所述的标准方案进行转染。
稳定细胞系的制备
按照如上对博来霉素抗性细胞描述的相同方法制备稳定的潮霉素抗性细胞,除了将600μg/mL的潮霉素而非1500μg/mL的博来霉素加入到培养基中。
按照如上方法对赋予卡那霉素/遗传霉素(G418)抗性的载体进行转染,但在S2细胞中利用1200和1500μg/mL之间的G418进行筛选或在大肠杆菌细胞中利用标准卡那霉素浓度进行筛选。
表达检测
CdCl2诱导.
pMT/V5.HIS.A载体具有镉诱导性的启动子,所以表达对比试验中利用CdCL2诱导细胞。细胞在摇瓶中生长2-3天,然后每1ml培养基利用1μl的储存液进行诱导(储存液:1mM CdCl2 Sigma C-2544批号13H0424:1000ml水中含183mg)。再使细胞生产蛋白3-4天,然后取样用于分析。
其余的载体具有组成型启动子,因此不需要被诱导。在3-4天的生长和生产之后进行取样。
在摇瓶中平行进行两次或三次(参见如下的原始数据)实验。
结果
将肌动蛋白5c启动子的弱核心启动子与较强的HSP70核心启动子交换,导致表达增高超过截短的肌动蛋白5c启动子50%(参见图8)。
我们还检测了新型元件的效应,其为内含子,特别是在Zieler H.,Huynh CQ的文章“Intron-dependent stimulation of marker gene expression in cultured insect cells(内含子依赖性激活的标记性基因在培养的昆虫细胞中的表达)”,Insect Mol Biol.2002 1,87-95中描述的内含子。该内含子的DNA序列在SEQ ID NO:60中列出,其中两个限制位点位于其侧翼。因此,根据本发明,在启动子核苷酸序列和感兴趣的蛋白编码序列之间包含诸如SEQ ID NO:60的启动子可显著增益由本发明所获得的增高的表达水平。
图9显示了将内含子或者两个侧翼基质附着区加入到杂合启动子载体中的效应。
图9显示了与原始杂合启动子载体相比,内含子的加入使模型蛋白表达提高了22%,两个侧翼基质附着区的加入使模型蛋白表达提高了46%。预期在一种载体中将内含子与基质附着区组合将进一步增强表达。
最后,图13显示了本发明的载体与两种商业上可获得的载体相比提供了显著更高的表达产量。
总结,与商业上可获得的载体相比,利用本研究中开发的载体获得显著增高的表达水平。
通过加入第二种选择性标记,卡那霉素/遗传霉素(G418),也将改良载体的功能性。这可使表达不同蛋白的两种载体共转染入一个细胞中。还允许利用博来霉素抗性标记物和然后卡那霉素抗性标记物(以任意顺序)进行连续的转化。
Figure BPA00001309938400631
Figure BPA00001309938400641
序列表:
SEQ ID NO:1:pHP16全长HSP70启动子(黑体序列对应SEQ ID NO:2)
CTAGAATCCCAAAACAAACTGGTTATTGTGGTAGGTCATTTGTTTGGCAGAAAGAAAA
Figure BPA00001309938400651
Figure BPA00001309938400652
Figure BPA00001309938400653
AAAGTGCAAGTTAAAGTG
AATCAATTAAAAGTAACCAGCAACCAAGTAAATCAACTGCAACTACTGAAATCTGCCAAGAA
GTAATTATTGAATACAAGAAGAGAACTCTGAATA
SEQ ID NO:2:pHP12截短的HSP70启动子(黑体序列对应HSP70核心启动子(SEQ ID NO:37))
CTCGAGAAATTTCTCTGGCCGTTATTCGTTATTCTCTCTTTTCTTTTTGGGTCTCTCCCTCTCTGCACTAAT
GCTCTCTCACTCTGTCACACAGTAAACGGCATACTGCTCTCGTTGGTTCGAGAGAGCGCGCCTCGAAT
GTTCGCGAAAA
Figure BPA00001309938400654
Figure BPA00001309938400655
AGCAAATAAACAAGCGCAGCTGAACA
AGCTAAACAATCTGCAG
SEQ ID NO:3:pHP11b肌动蛋白5C突变启动子,来自NheI-HindⅢ
GCTAGCTAAAAAAAATCATGAATGGCATCAACTCTGAATCAAATCTTTGCAGATGCACCTACTTCTCATTT
CCACTGTCACATCATTTTTCCAGATCTCGCTGCCTGTTATGTGGCCCACAAACCAAGACACGTTTTATGG
CCATTAAAGCTGGCTGATCGTCGCCAAACACCAAATACATAATGAATATGTACACATTCGAGAAAGAAG
CGATCAAAGAAGCGTCTTCGGGCGGAGTAGGAGAATGCGGAGGAGAAGGAGAACGAGCTGATCTAG
TATCTCTCCACAATCCAATGCCAACTGACCAACTGGCCATATTCGGAGCAATTTGAAGCCAATTTCCATC
GCCTGGCGATCGCTCCATTCTTGGCTATATGTTTTTCACCGTTACCCGGGGCCATTTTCAAAGACTCGTC
GGCAAGATAAGATTGTGTCACTCGCTGTCTCTCTTCATTTGTCGAAGAATGCTGAGGAATTTCGCGATG
ACGTCGGCGAGTATTTTGAAGAATGAGAATAATTTGTATTTATACGAAAATCAGTTAGTGGAATTTTCTAC
AAAAACATGTTATCTATAGATAATTTTGTTGCAAAATATGTTGACTATGACAAAGATTGTATGTATATACCT
TTAATGTATTCTCATTTTCTTATGTATTTATAATGGCAATGATGATACTGATGATTTTTTAAGATGATGCCAG
ACCAAAAGGCTTGAATTTCTGCGTCTTTTGCCGAACGCAGTGCATGTGCAATTGTTGTTTTTTGGAATAT
TCAATTTTCGGACTGTCCGCTTTGATTTCAGTTTCTTGGCTTATTCAAAAAGCAAAGTAAAGCCAAAAAA
GCGAGATGGCAATACCAAATGCGGCAAAACGGTAGTGGAAGGAAAGGGGTGCGGGGCAGCGGAAG
GAAGGGTGGGGCGGGGCGTGGCGGGGTCTGTGGCTGGGCGCGACGTCACCGACGTTGGAGCCACT
CCTTTGACCATGTGTGCGTGTGTGTATTATTCGTGTCTCGCCACTCGCCGGTTGTTTTTTTCTTTTTATGC
TGCGCTCTCTCTAGCGCCATCTCGCTTACGCATGCTCAACGCACCGCATGTTGCCGTTTCCTTTTATGCG
TCATTTTGGCTCGAAATAGGCAATTATTTAAACAAAGATTAGTCAACGAAAACGCTAAAATAAATAAGTCT
ACAATATGGTTACTTATTGCCATGTGTGTGCAGCCAACGATAGCAACAAAAGCAACAACACAGGTGGCT
TTCCCTCTTTCACTTTTTGTTTGCAAGCCGCGTGCGAGCAAGACGGCACGACCGGCAAACGCAATTAC
GCTGACAAAGAGCAGACGAAGTTTTGGCGAAAAACATCAAGGCGCCTGATACGAATGCATTTGCAATA
ACAATTGCGATATTTAATATTGTTTATGAAGCTGTTTGACTTCAAAACACACAAAAAAAAAAATAAAACAA
ATTATTTGAAAGAGAATTAGGAATCGGACGCTTATCGTTAGGGTAACAACAAGAAATGCTTACTGAGTCA
CAGCCTCTGGAAAACTGCCGCAAGCCAGAGAGAGAGAGAAAAAGAGGGAGAGCAGCTTAGACCGCA
TGTGCTTGTGTGTGAGGCGTCTCTCTCTTCGTCTCTGTTGCGCAAACGCATAGACTGCACTGAAAAAAT
CGATTACCTATTTTTTATGAATGAATATTTGCACTATTACTATTCAAAACTATTAAGATAGCAATCACATTCA
ATAGCCAAATACTATACCACCTGAGCGATGCAACGAAATGATCAATTTGAGCAAAAATGCTGCATATTTA
GGACGGCATCATTATAGAAATGCTTCTTGCTGTGTACTTTTCTCTCGTCTGGCAGCTGTTTCGCCGTTAT
TGTTAAAACCGGCTTAAGTTAGGTGTGTTTTCTACGACTAGTGAATGCCCTACTAGAAGATGTGTGTTGC
ACAAAATGTCCCTGGAATAACCAATTTGAAGTGCAGATAGCAGTAAACGTAAGCTAATATGAATATTATTT
AACTGTAATGTTTTAATATCGCTGGACATTACTAATAAACCCACTATAAACACATGTACATATGTATGTTTT
GGCATACAATGAGTAGTTGGGGAAAAAATGTGTAAAAGCACCGTGACCATCACAGCATAAAGATAACC
AGCTGAAGTATCGAATATGAGTAACCCCCAAATTGAATCACATGCCGCAACTGATAGGACCCATGGAAG
TACACTCTTCATGGCGATATACAAGACACACACAAGCACGAACACCCAGTTGCGGAGGAAATTCTCCGT
AAATGAAAACCCAATCGGCGAACAATTCATACCCATATATGGTAAAAGTTTTGAACGCGACTTGAGAGC
GGAGAGCATTGCGGCTGATAAGGTTTTAGCGCTAAGCGGGCTTTATAAAACGGGCTGCGGGACCAGTT
TTCATATCACTACCGTTTGAGTTCTTGTGCTGTGTGGATACTCCTCCCGACACAAAGCCGCTCCATCAGC
CAGCAGTCGTCTAATCCAGAGACAAGCTT
SEQ ID NO:4:p805肌动蛋白5C启动子(来自pAc5.1 invitrogen的序列)
GATACTTCTAAAAAAAATCATGAATGGCATCAACTCTGAATCAAATCTTTGCAGATGCACCTACTTCTCAT
TTCCACTGTCACATCATTTTTCCAGATCTCGCTGCCTGTTATGTGGCCCACAAACCAAGACACGTTTTAT
GGCCATTAAAGCTGGCTGATCGTCGCCAAACACCAAATACATATCAATATGTACATTCGAGAAAGAAGC
GATCAAAGAAGCGTCTTCGGGCGAGTAGGAGAATGCGGAGGAGAAGGAGAACGAGCTGATCTAGTAT
CTCTCCACAATCCAATGCCAACTGACCAACTGGCCATATTCGGAGCAATTTGAAGCCAATTTCCATCGC
CTGGCGATCGCTCCATTCTTGGCTATATGTTTTTCACCGTTCCCGGGGCCATTTTCAAAGACTCGTCGGT
AAGATAAGATTGTGTCACTCGCTGTCTCTCTTCATTTGTCGAAGAATGCTGAGGAATTTCGCGATGACGT
CGGCGAGTATTTTGAAGAATGAGAATAATTTGTATTTATACGAAAATCAGTTAGTGGAATTTTCTACAAAA
ACATGTTATCTATAGATAATTTTGTTGCAAAATATGTTGACTATGACAAAGATTGTATGTATATACCTTTAAT
GTATTCTCATTTTCTTATGTATTTATAATGGCAATGATGATACTGATGATATTTTAAGATGATGCCAGACCA
CAGGCTGATTTCTGCGTCTTTTGCCGAACGCAGTGCATGTGCGGTTGTTGTTTTTTGGAATAGTTTCAAT
TTTCGGACTGTCCGCTTTGATTTCAGTTTCTTGGCTTATTCAAAAAGCAAAGTAAAGCCAAAAAAGCGA
GATGGCAATACCAAATGCGGCAAAACGGTAGTGGAAGGAAAGGGGTGCGGGGCAGCGGAAGGAAGG
GTGGGGCGGGGCGTGGCGGGGTCTGTGGCTGGGCGCGACGTCACCGACGTTGGAGCCACTCCTTTG
ACCATGTGTGCGTGTGTGTATTATTCGTGTCTCGCCACTCGCCGGTTGTTTTTTTCTTTTTATCTCGCTCT
CTCTAGCGCCATCTCGTACGCATGCTCAACGCACCGCATGTTGCCGTGTCCTTTATGCGTCATTTTGGC
TCGAAATAGGCAATTATTTAAACAAAGATTAGTCAACGAAAACGCTAAAATAAATAAGTCTACAATATGGT
TACTTATTGCCATGTGTGTGCAGCCAACGATAGCAACAAAAGCAACAACACAGTGGCTTTCCCTCTTTC
ACTTTTTGTTTGCAAGCGCGTGCGAGCAAGACGGCACGACCGGCAAACGCAATTACGCTGACAAAGA
GCAGACGAAGTTTTGGCCGAAAAACATCAAGGCGCCTGATACGAATGCATTTGCAATAACAATTGCGAT
ATTTAATATTGTTTATGAAGCTGTTTGACTTCAAAACACACAAAAAAAAAAATAAAACAAATTATTTGAAA
GAGAATTAGGAATCGGACAGCTTATCGTTACGGGCTAACAGCACACCGAGACGAAATAGCTTACCTGA
CGTCACAGCCTCTGGAAGAACTGCCGCCAAGCAGAGAGAGAGAGAAAAAGAGGGAGAGCAGCTTAG
ACCGCATGTGCTTGTGTGTGAGGCGTCTCTCTCTTCGTCTCCTGTTTGCGCAAACGCATAGACTGCACT
GAGAAAATCGATTACCTATTTTTTATGAATGAATATTTGCACTATTACTATTCAAAACTATTAAGATAGCAA
TCACATTCAATAGCCAAATACTATACCACCTGAGCGATGCAACGAAATGATCAATTTGAGCAAAAATGCT
GCATATTTAGGACGGCATCATTATAGAAATGCTTCTTGCTGTGTACTTTTCTCTCGTCTGGCAGCTGTTTC
GCCGTTATTGTTAAAACCGGCTTAAGTTAGGTGTGTTTTCTACGACTAGTGATGCCCCTACTAGAAGATG
TGTGTTGCACAAATGTCCCTGAATAACCAATTTGAAGTGCAGATAGCAGTAAACGTAAGCTAATATGAAT
ATTATTTAACTGTAATGTTTTAATATCGCTGGACATTACTAATAAACCCACTATAAACACATGTACATATGT
ATGTTTTGGCATACAATGAGTAGTTGGGGAAAAAATGTGTAAAAGCACCGTGACCATCACAGCATAAAG
ATAACCAGCTGAAGTATCGAATATGAGTAACCCCCAAATTGAATCACATGCCGCAACTGATAGGACCCA
TGGAAGTACACTCTTCATGGCGATATACAAGACACACACAAGCACGAACACCCAGTTGCGGAGGAAAT
TCTCCGTAAATGAAAACCCAATCGGCGAACAATTCATACCCATATATGGTAAAAGTTTTGAACGCGACTT
GAGAGCGGAGAGCATTGCGGCTGATAAGGTTTTAGCGCTAAGCGGGCTTTATAAAACGGGCTGCGGG
ACCAGTTTTCATATCACTACCGTTTGAGTTCTTGTGCTGTGTGGATACTCCTCCCGACACAAAGCCGCTC
CATCAGCCAGCAGTCGTCTAATCCAGAGACCCCGGAT
SEQ ID NO:5:pHP17截短的肌动蛋白5C_2,1469nt
GCATGCTCAACGCACCGCATGTTGCCGTGTCCTTTATGCGTCATTTTGGCTCGAAATAGGCAATTATTTA
AACAAAGATTAGTCAACGAAAACGCTAAAATAAATAAGTCTACAATATGGTTACTTATTGCCATGTGTGT
GCAGCCAACGATAGCAACAAAAGCAACAACACAGTGGCTTTCCCTCTTTCACTTTTTGTTTGCAAGCGC
GTGCGAGCAAGACGGCACGACCGGCAAACGCAATTACGCTGACAAAGAGCAGACGAAGTTTTGGCCG
AAAAACATCAAGGCGCCTGATACGAATGCATTTGCAATAACAATTGCGATATTTAATATTGTTTATGAAGC
TGTTTGACTTCAAAACACACAAAAAAAAAAATAAAACAAATTATTTGAAAGAGAATTAGGAATCGGACAG
CTTATCGTTACGGGCTAACAGCACACCGAGACGAAATAGCTTACCTGACGTCACAGCCTCTGGAAGAA
CTGCCGCCAAGCAGAGAGAGAGAGAAAAAGAGGGAGAGCAGCTTAGACCGCATGTGCTTGTGTGTG
AGGCGTCTCTCTCTTCGTCTCCTGTTTGCGCAAACGCATAGACTGCACTGAGAAAATCGATTACCTATTT
TTTATGAATGAATATTTGCACTATTACTATTCAAAACTATTAAGATAGCAATCACATTCAATAGCCAAATAC
TATACCACCTGAGCGATGCAACGAAATGATCAATTTGAGCAAAAATGCTGCATATTTAGGACGGCATCAT
TATAGAAATGCTTCTTGCTGTGTACTTTTTCTCTCGTCTGGCAGCTGTTTCGCCGTTATTGTTAAAACCGG
CTTAAGTTAGGTGTGTTTTCTACGACTAGTGATGCCCCTACTAGAAGATGTGTGTTGCACAAATGTCCCT
GAATAACCAATTTGAAGTGCAGATAGCAGTAAACGTAAGCTAATATGAATATTATTTAACTGTAATGTTTT
AATATCGCTGGACATTACTAATAAACCCACTATAAACACATGTACATATGTATGTTTTGGCATACAATGAG
TAGTTGGGGAAAAAATGTGTAAAAGCACCGTGACCATCACAGCATAAAGATAACCAGCTGAAGTATCG
AATATGAGTAACCCCCAAATTGAATCACATGCCGCAACTGATAGGACCCATGGAAGTACACTCTTCATG
GCGATATACAAGACACACACAAGCACGAACACCCAGTTGCGGAGGAAATTCTCCGTAAATGAAAACCC
AATCGGCGAACAATTCATACCCATATATGGTAAAAGTTTTGAACGCGACTTGAGAGCGGAGAGCATTGC
GGCTGATAAGGTTTTAGCGCTAAGCGGGCTTTATAAAACGGGCTGCGGGACCAGTTTTCATATCACTAC
CGTTTGAGTTCTTGTGCTGTGTGGATACTCCTCCCGACACAAAGCCGCTCCATCAGCCAGCAGTCGTCT
AATCCAGAGAC
SEQ ID NO:6:pHP18截短的肌动蛋白5C_3,612nt
CTAGTGAATGCCCTACTAGAAGATGTGTGTTGCACAAAATGTCCCTGGAATAACCAATTTGAAGTGCAG
ATAGCAGTAAACGTAAGCTAATATGAATATTATTTAACTGTAATGTTTTAATATCGCTGGACATTACTAATA
AACCCACTATAAACACATGTACATATGTATGTTTTGGCATACAATGAGTAGTTGGGGAAAAAATGTGTAA
AAGCACCGTGACCATCACAGCATAAAGATAACCAGCTGAAGTATCGAATATGAGTAACCCCCAAATTGA
ATCACATGCCGCAACTGATAGGACCCATGGAAGTACACTCTTCATGGCGATATACAAGACACACACAAG
CACGAACACCCAGTTGCGGAGGAAATTCTCCGTAAATGAAAACCCAATCGGCGAACAATTCATACCCAT
ATATGGTAAAAGTTTTGAACGCGACTTGAGAGCGGAGAGCATTGCGGCTGATAAGGTTTTAGCGCTAA
GCGGGCTTTATAAAACGGGCTGCGGGACCAGTTTTCATATCACTACCGTTTGAGTTCTTGTGCTGTGTG
GATACTCCTCCCGACACAAAGCCGCTCCATCAGCCAGCAGTCGTCTAATCCAGAGAC
SEQ ID NO:7:pOPIE2
GTCATGATGATAAACAATGTATGGTGCTAATGTTGCTTCAACAACAATTCTGTTGAACTGTGTTTTCATGT
TTGCCAACAAGCACCTTTATACTCGGTGGCCTCCCCACCACCAACTTTTTTGCACTGCAAAAAAACACG
CTTTTGCACGCGGGCCCATACATAGTACAAACTCTACGTTTCGTAGACTATTTTACATAAATAGTCTACAC
CGTTGTATACGCTCCAAATACACTACCACACATTGAACCTTTTTGCAGTGCAAAAAAGTACGTGTCGGC
AGTCACGTAGGCCGGCCTTATCGGGTCGCGTCCTGTCACGTACGAATCACATTATCGGACCGGACGAG
TGTTGTCTTATCGTGACAGGACGCCAGCTTCCTGTGTTGCTAACCGCAGCCGGACGCAACTCCTTATCG
GAACAGGACGCGCCTCCATATCAGCCGCGCGTTATCTCATGCGCGTGACCGGACACGAGGCGCCCGT
CCCGCTTATCGCGCCTATAAATACAGCCCGCAACGATCTGGTAAACACAGTTGAACAGCATCTGTT
SEQ ID NO:8:Gypsy绝缘子,来自(Pubmed:gi|12237306:1188-1574Stinger GFP转化载体)
TCACGTAATAAGTGTGCGTTGAATTTATTCGCAAAAACATTGCATATTTTCGGCAAAGTAAAATTTTGT
TGCATACCTTATCAAAAAATAAGTGCTGCATACTTTTTAGAGAAACCAAATAATTTTTTATTGCATACCC
GTTTTTAATAAAATACATTGCATACCCTCTTTTAATAAAAAATATTGCATACTTTGACGAAACAAATTTT
CGTTGCATACCCAATAAAAGATTATTATATTGCATACCCGTTTTTAATAAAATACATTGCATACCCTCTT
TTAATAAAAAATATTGCATACGTTGACGAAACAAATTTTCGTTGCATACCCAATAAAAGATTATTATATT
GCATACCTTTTCTTGCCATACCATTTAGCCGATCAATT
引物列表
Figure BPA00001309938400681
SEQ ID NO:33:pAC5.1肌动蛋白启动子(2516bp)序列:
TAAAAAAAATCATGAATGGCATCAACTCTGAATCAAATCTTTGCAGATGCACCTACTTCTCATT
TCCACTGTCACATCATTTTTCCAGATCTCGCTGCCTGTTATGTGGCCCACAAACCAAGACACGT
TTTATGGCCATTAAAGCTGGCTGATCGTCGCCAAACACCAAATACATATCAATATGTACATTCGA
GAAAGAAGCGATCAAAGAAGCGTCTTCGGGCGAGTAGGAGAATGCGGAGGAGAAGGAGAAC
GAGCTGATCTAGTATCTCTCCACAATCCAATGCCAACTGACCAACTGGCCATATTCGGAGCAAT
TTGAAGCCAATTTCCATCGCCTGGCGATCGCTCCATTCTTGGCTATATGTTTTTCACCGTTACCC
GGGGCCATTTTCAAAGACTCGTCGGCAAGATAAGATTGTGTCACTCGCTGTCTCTCTTCATTTG
TCGAAGAATGCTGAGGAATTTCGCGATGACGTCGGCGAGTATTTTGAAGAATGAGAATAATTT
GTATTTATACGAAAATCAGTTAGTGGAATTTTCTACAAAAACATGTTATCTATAGATAATTTTGTT
GCAAAATATGTTGACTATGACAAAGATTGTATGTATATACCTTTAATGTATTCTCATTTTCTTATG
TATTTATAATGGCAATGATGATACTGATGATATTTTAAGATGATGCCAGACCAAAAGGCTTGAAT
TTCTGCGTCTTTTGCCGAACGCAGTGCATGTGCAATTGTTGTTTTTTGGAATATTCAATTTTCGG
ACTGTCCGCTTTGATTTCAGTTTCTTGGCTTATTCAAAAAGCAAAGTAAAGCCAAAAAAGCGA
GATGGCAATACCAAATGCGGCAAAACGGTAGTGGAAGGAAAGGGGTGCGGGGCAGCGGAAG
GAAGGGTGGGGCGGGGCGTGGCGGGGTCTGTGGCTGGGCGCGACGTCACCGACGTTGGAGC
CACTCCTTTGACCATGTGTGCGTGTGTGTATTATTCGTGTCTCGCCACTCGCCGGTTGTTTTTTT
CTTTTTATGCTGCGCTCTCTCTAGCGCCATCTCGCTTACGCATGCTCAACGCACCGCATGTTGC
CGTTTCCTTTTATGCGTCATTTTGGCTCGAAATAGGCAATTATTTAAACAAAGATTAGTCAACG
AAAACGCTAAAATAAATAAGTCTACAATATGGTTACTTATTGCCATGTGTGTGCAGCCAACGAT
AGCAACAAAAGCAACAACACAGGTGGCTTTCCCTCTTTCACTTTTTGTTTGCAAGCCGCGTGC
GAGCAAGACGGCACGACCGGCAAACGCAATTACGCTGACAAAGAGCAGACGAAGTTTTGGC
GAAAAACATCAAGGCGCCTGATACGAATGCATTTGCAATAACAATTGCGATATTTAATATTGTTT
ATGAAGCTGTTTGACTTCAAAACACACAAAAAAAAAAATAAAACAAATTATTTGAAAGAGAA
TTAGGAATCGGACGCTTATCGTTAGGGTAACAACAAGAAATGCTTACTGAGTCACAGCCTCTG
GAAAACTGCCGCAAGCCAGAGAGAGAGAGAAAAAGAGGGAGAGCAGCTTAGACCGCATGT
GCTTGTGTGTGAGGCGTCTCTCTCTTCGTCTCTGTTGCGCAAACGCATAGACTGCACTGAAAA
AATCGATTACCTATTTTTTATGAATGAATATTTGCACTATTACTATTCAAAACTATTAAGATAGCA
ATCACATTCAATAGCCAAATACTATACCACCTGAGCGATGCAACGAAATGATCAATTTGAGCAA
AAATGCTGCATATTTAGGACGGCATCATTATAGAAATGCTTCTTGCTGTGTACTTTTCTCTCGTC
TGGCAGCTGTTTCGCCGTTATTGTTAAAACCGGCTTAAGTTAGGTGTGTTTTCTACGACTAGTG
AATGCCCTACTAGAAGATGTGTGTTGCACAAAATGTCCCTGGAATAACCAATTTGAAGTGCAG
ATAGCAGTAAACGTAAGCTAATATGAATATTATTTAACTGTAATGTTTTAATATCGCTGGACATTA
CTAATAAACCCACTATAAACACATGTACATATGTATGTTTTGGCATACAATGAGTAGTTGGGGA
AAAAATGTGTAAAAGCACCGTGACCATCACAGCATAAAGATAACCAGCTGAAGTATCGAATAT
GAGTAACCCCCAAATTGAATCACATGCCGCAACTGATAGGACCCATGGAAGTACACTCTTCAT
GGCGATATACAAGACACACACAAGCACGAACACCCAGTTGCGGAGGAAATTCTCCGTAAATG
AAAACCCAATCGGCGAACAATTCATACCCATATATGGTAAAAGTTTTGAACGCGACTTGAGAG
CGGAGAGCATTGCGGCTGATAAGGTTTTAGCGCTAAGCGGGCTTTATAAAACGGGCTGCGGGA
CCAGTTTTCATATCACTACCGTTTGAGTTCTTGTGCTGTGTGGATACTCCTCCCGACACAAAGC
CGCTCCATCAGCCAGCAGTCGTCTAATCCAGAGAC
SEQ ID NO:34:pHP15c_su(hw)载体:
CATAGTATAATACGACTCACTATAGGAGGGCCACCATGGCCAAGTTGACCAGTGCCGTTCCGG
TGCTCACCGCGCGCGACGTCGCCGGAGCGGTCGAGTTCTGGACCGACCGGCTCGGGTTCTCC
CGGGACTTCGTGGAGGACGACTTCGCCGGTGTGGTCCGGGACGACGTGACCCTGTTCATCAG
CGCGGTCCAGGACCAGGTGGTGCCGGACAACACCCTGGCCTGGGTGTGGGTGCGCGGCCTG
GACGAGCTGTACGCCGAGTGGTCGGAGGTCGTGTCCACGAACTTCCGGGACGCCTCCGGGCC
GGCCATGACCGAGATCGGCGAGCAGCCGTGGGGGCGGGAGTTCGCCCTGCGCGACCCGGCC
GGCAACTGCGTGCACTTCGTGGCCGAGGAGCAGGACTGACCGACGCCGACCAACACCGCCG
GTCCGACGGCGGCCCACGGGTCCCAGGGGGGTCGACCTCGAAACTTGTTTATTGCAGCTTATA
ATGGTTACAAATAAAGCAATAGCATCACAAATTTCACAAATAAAGCATTTTTTTCACTGCATTC
TAGTTGTGGTTTGTCCAAACTCATCAATGTATCTTATCATGTCTGCTAGCTCACGTAATAAGTGT
GCGTTGAATTTATTCGCAAAAACATTGCATATTTTCGGCAAAGTAAAATTTTGTTGCATACCTTA
TCAAAAAATAAGTGCTGCATACTTTTTAGAGAAACCAAATAATTTTTTATTGCATACCCGTTTTT
AATAAAATACATTGCATACCCTCTTTTAATAAAAAATATTGCATACTTTGACGAAACAAATTTTC
GTTGCATACCCAATAAAAGATTATTATATTGCATACCCGTTTTTAATAAAATACATTGCATACCCT
CTTTTAATAAAAAATATTGCATACGTTGACGAAACAAATTTTCGTTGCATACCCAATAAAAGATT
ATTATATTGCATACCTTTTCTTGCCATACCATTTAGCCGATCAATTCTCGAGAAATTTCTCTGGCC
GTTATTCGTTATTCTCTCTTTTCTTTTTGGGTCTCTCCCTCTCTGCACTAATGCTCTCTCACTCTG
TCACACAGTAAACGGCATACTGCTCTCGTTGGTTCGAGAGAGCGCGCCTCGAATGTTCGCGAA
AAGAGCGCCGGAGTATAAATAGAGGCGCTTCGTCTACGGAGCGACAATTCAATTCAAACAAG
CAAAGTGAACACGTCGCTAAGCGAAAGCTAAGCAAATAAACAAGCGCAGCTGAACAAGCTA
AACAATCTGCAGAAGCTTGGTACCCTCGAGCTCAGCTGAATTCTGGATCCTCTAGACCGGTCA
TATGCGGCCGCGGATCGATCGATATCTGACTAAATCTTAGTTTGTATTGTCATGTTTTAATACAAT
ATGTTATGTTTAAATATGTTTTTAATAAATTTTATAAAATAATTTCAACTTTTATTGTAACAACATT
GTCCATTTACACACTCCTTTCAAGCGCGTGGGACTCGATGCTCTCACGTAATAAGTGTGCGTTG
AATTTATTCGCAAAAACATTGCATATTTTCGGCAAAGTAAAATTTTGTTGCATACCTTATCAAAA
AATAAGTGCTGCATACTTTTTAGAGAAACCAAATAATTTTTTATTGCATACCCGTTTTTAATAAA
ATACATTGCATACCCTCTTTTAATAAAAAATATTGCATACTTTGACGAAACAAATTTTCGTTGCA
TACCCAATAAAAGATTATTATATTGCATACCCGTTTTTAATAAAATACATTGCATACCCTCTTTTA
ATAAAAAATATTGCATACGTTGACGAAACAAATTTTCGTTGCATACCCAATAAAAGATTATTATA
TTGCATACCTTTTCTTGCCATACCATTTAGCCGATCAATTACTCAAAGGCGGTAATACGGTTATC
CACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGG
AACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCAC
AAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTT
TCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCC
GCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCAATGCTCACGCTGTAGGTATCTCAGTTCGG
TGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGC
GCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCA
GCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAA
GTGGTGGCCTAACTACGGCTACACTAGAAGGACAGTATTTGGTATCTGCGCTCTGCTGAAGCC
AGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACCGCTGGTAGCG
GTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTT
TGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTTGCATG
CGCTAAGCGGGCTTTATAAAACGGGCTGCGGGACCAGTTTTCATATCACTACCGTTTGAGTTCT
TGTGCTGTGTGGATACTCCTCCCGACACCGAATTAATTCGGATCTCTGCAAGGGATTTTGGTCA
TGAACAATAAAACTGTCTGCTTACATAAACAGTAATACAAGGGGTGTT
SEQ ID NO:35:pHP15c载体:
CATAGTATAATACGACTCACTATAGGAGGGCCACCATGGCCAAGTTGACCAGTGCCGTTCCGG
TGCTCACCGCGCGCGACGTCGCCGGAGCGGTCGAGTTCTGGACCGACCGGCTCGGGTTCTCC
CGGGACTTCGTGGAGGACGACTTCGCCGGTGTGGTCCGGGACGACGTGACCCTGTTCATCAG
CGCGGTCCAGGACCAGGTGGTGCCGGACAACACCCTGGCCTGGGTGTGGGTGCGCGGCCTG
GACGAGCTGTACGCCGAGTGGTCGGAGGTCGTGTCCACGAACTTCCGGGACGCCTCCGGGCC
GGCCATGACCGAGATCGGCGAGCAGCCGTGGGGGCGGGAGTTCGCCCTGCGCGACCCGGCC
GGCAACTGCGTGCACTTCGTGGCCGAGGAGCAGGACTGACCGACGCCGACCAACACCGCCG
GTCCGACGGCGGCCCACGGGTCCCAGGGGGGTCGACCTCGAAACTTGTTTATTGCAGCTTATA
ATGGTTACAAATAAAGCAATAGCATCACAAATTTCACAAATAAAGCATTTTTTTCACTGCATTC
TAGTTGTGGTTTGTCCAAACTCATCAATGTATCTTATCATGTCTGCTAGCCTCGAGAAATTTCTC
TGGCCGTTATTCGTTATTCTCTCTTTTCTTTTTGGGTCTCTCCCTCTCTGCACTAATGCTCTCTCA
CTCTGTCACACAGTAAACGGCATACTGCTCTCGTTGGTTCGAGAGAGCGCGCCTCGAATGTTC
GCGAAAAGAGCGCCGGAGTATAAATAGAGGCGCTTCGTCTACGGAGCGACAATTCAATTCAA
ACAAGCAAAGTGAACACGTCGCTAAGCGAAAGCTAAGCAAATAAACAAGCGCAGCTGAACA
AGCTAAACAATCTGCAGAAGCTTGGTACCCTCGAGCTCAGCTGAATTCTGGATCCTCTAGACC
GGTCATATGCGGCCGCGGATCGATCGATATCTGACTAAATCTTAGTTTGTATTGTCATGTTTTAAT
ACAATATGTTATGTTTAAATATGTTTTTAATAAATTTTATAAAATAATTTCAACTTTTATTGTAACA
ACATTGTCCATTTACACACTCCTTTCAAGCGCGTGGGACTCGATGCTCACTCAAAGGCGGTAAT
ACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAA
AAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGA
CGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGAT
ACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCG
GATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCAATGCTCACGCTGTAGGTA
TCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCC
CGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATC
GCCACTGGCAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAG
AGTTCTTGAAGTGGTGGCCTAACTACGGCTACACTAGAAGGACAGTATTTGGTATCTGCGCTC
TGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACC
GCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCTCA
AGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGG
GATTTTGCATGCGCTAAGCGGGCTTTATAAAACGGGCTGCGGGACCAGTTTTCATATCACTACC
GTTTGAGTTCTTGTGCTGTGTGGATACTCCTCCCGACACCGAATTAATTCGGATCTCTGCAAGG
GATTTTGGTCATGAACAATAAAACTGTCTGCTTACATAAACAGTAATACAAGGGGTGTT
SEQ ID NO:36:来自PHP10的肌动蛋白5C核心启动子,对应SEQ ID NO:6的第478位核苷酸至第572位核苷酸:
TAGCGCTAAGCGGGCTTTATAAAACGGGCTGCGGGACCAGTTTTCATATCACTACCGTTTGAGTTCTT
GTGCTGTGTGGATACTCCTCCCGACAC
SEQ ID NO:37:HSP70核心启动子
GAGCGCCGGAGTATAAATAGAGGCGCTTCGTCTACGGAGCGACAATTCAATTCAAACAAGCAAAGTG
AACACGTCGCTAAGCGAAAGCTA
SEQ ID NO:38:根据本发明的HIS-标签序列:
ATGAAACACCAACACCAACATCAACATCAACATCAACATCAA
SEQ ID NO:39:具有XbaI和NotI限制位点(框内)的72bp元件序列
TGC
Figure BPA00001309938400711
ATGCTTTGCATACTTCTGCCTGCTGGGGAGCCTGGGGACTTTCCACACCCTAAC
TGACACACATTCCACAGCTGGTT
Figure BPA00001309938400712
TTTA
SEQ ID NO:40:具有XbaI和NotI限制位点(框内)的HBV的PRE序列(SEQ ID NO:40):
TGC
Figure BPA00001309938400713
CGTGGAACCTTTGTGGCTCCTCTGCCGATCCATACTGCGGAACTCCTAGCCGCT
TGTTTTGCTCGCAGCCGGTCTGGAGCAAAGCTCATCGGAACTGACAATTCTGTCGTCCTCTCG
CGGAAATATACATCGTTTCCATGGCTGCTAGGCTGTACTGCCAACTGGATCCTTCGCGGGACGT
CCTTTGTTTACGTCCCGTCGGCGCTGAATCCCGCGGACGACCCCTCGCGGGGCCGCTTGGGAC
TCTCTCGTCCCCTTCTCCGTCTGCCGTTCCAGCCGACCACGGGGCGCACCTCTCTTTACGCGG
TCTCCCCGTCTGTGCCTTCTCATCTGCCGGTCCGTGTGCACTTCGCTTCACCTCTGCACGTTGC
ATGGAGACCACCGTGAACGCCCATCAGATCCTGCCCAAGGTCTTACATAAGAGGACTCTTGGA
CTCCCAGCAATGTCAACGACCGACCTTGAGGCCTACTTCAAAGACTGTGTGTTTAAGGACTGG
GAGGAGCTGGGGGAGGAGATTAGGTTAAAGGTCTTTGTATTAGGAGGCTGTATGCATAAATTG
GTCTGTTTA
Figure BPA00001309938400715
Figure BPA00001309938400721
SEQ ID NO:58:载体PHP34S(由合成的DNA构建):
AAAGATAACCAGCTGAAGTATCGAATATGAGTAACCCCCAAATTGAATCACATGCCGCAACTG
ATAGGACCCATGGAAGTACACTCTTCATGGCGATATACAAGACACACACAAGCACGAACACCC
AGTTGCGGAGGAAATTCTCCGTAAATGAAAACCCAATCGGCGAACAATTCATACCCATATATG
GTAAAAGTTTTGAACGCGACTTAAGGAGAGCGGAGAGCATTGCGGCTGATAAGGTTTTAGCG
CTAAGCGGGCTTTATAAAACGGGCTGCGGGACCAGTTTTCATATCACTACCGTTTGAGTTCTTG
TGCTGTGTGGATACTCCTCCCGACACAAAGCCGCTCCATCAGCCAGCAGTCGTCTAATCCAGA
GACAAGCTTGGTACCCTCGAGCTCAGCTGAATTCTGGATCCTCTAGACCGGTCATATGCGGCC
GCGGATCGATCGATATCTGACTAAATCTTAGTTTGTATTGTCATGTTTTAATACAATATGTTATGT
TTAAATATGTTTTTAATAAATTTTATAAAATAATTTCAACTTTTATTGTAACAACATTGTCCATTTA
CACACTCCTTTCAAGCGCGTGGGACTCGATGCTCGGCGCCACTCAAAGGCGGTAATACGGTTA
TCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCA
GGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATC
ACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCG
TTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGT
CCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCAATGCTCACGCTGTAGGTATCTCAGTTC
GGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCT
GCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGG
CAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTG
AAGTGGTGGCCTAACTACGGCTACACTAGAAGGACAGTATTTGGTATCTGCGCTCTGCTGAAG
CCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACCGCTGGTAG
CGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCTCAAGAAGATC
CTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTTGC
ATGCGCTAAGCGGGCTTTATAAAACGGGCTGCGGGACCAGTTTTCATATCACTACCGTTTGAGT
TCTTGTGCTGTGTGGATACTCCTCCCGACACCGAATTAATTCGGATCTCTGCAAGGGATTTTGG
TCATGAACAATAAAACTGTCTGCTTACATAAACAGTAATACAAGGGGTGTTCATAGTATAATAC
GACTCACTATAGGAGGGCCACCATGGCCAAGTTGACCAGTGCCGTTCCGGTGCTCACCGCGC
GCGACGTCGCCGGAGCGGTCGAGTTCTGGACCGACCGGCTCGGGTTCAGCCGGGACTTCGTG
GAGGACGACTTCGCCGGTGTGGTCCGGGACGACGTGACCCTGTTCATCAGCGCGGTCCAGGA
CCAGGTGGTGCCGGACAACACCCTGGCCTGGGTGTGGGTGCGCGGCCTGGACGAGCTGTACG
CCGAGTGGTCGGAGGTCGTGTCCACGAACTTCCGGGACGCCTCCGGGCCGGCCATGACCGAG
ATCGGCGAGCAGCCGTGGGGGCGGGAGTTCGCCCTGCGCGACCCGGCCGGCAACTGCGTGC
ACTTCGTGGCCGAGGAGCAGGACTGACCGACGCCGACCAACACCGCCGGTCCGACGGCGGC
CCACGGGTCCCAGGGGGGTCGACCTCGAAACTTGTTTATTGCAGCTTATAATGGTTACAAATA
AAGCAATAGCATCACAAATTTCACAAATAAAGCATTTTTTTCACTGCATTCTAGTTGTGGTTTG
TCCAAACTCATCAATGTATCTTATCATGTCTTCACGTAATAAGTGTGCGGCTAGCAGTCAACTA
CTAGTGAATGCCCTACTAGAAGATGTGTGTTGCACAAAATGTCCCTGGAATAACCAATTTGAA
GTGCAGATAGCAGTAAACGTAAGCTAATATGAATATTATTTAACTGTAATGTTTTAATATCGCTG
GACATTACTAATAAACCCACTATAAACACATGTACATATGTATGTTTTGGCATACAATGAGTAGT
TGGGGAAAAAATGTGTAAAAGCACCGTGACCATCACAGCAT
SEQ ID NO:59:基质附着区序列(在载体图谱中称作HSAR):
CTAGAATATTCGCTTTATTTTGGAAATTTCTTTATAAATACGGCTGCTTAAGTTAATTATGTTAGA
GATAATCGAAGGGTTTGTTACGCGGATGTTGTCCGCCAGAAAGGCCTATGGAACTTTGACAAG
ATATTCTTAAAAATGTATTTACATACTAACTTAAAAAAGCTATTTATTTATTAGATTAATACAGAC
AATTGCATGCAGATGATTGTTAGTGTTTTTTATTTAAAATTACGTAAAGGTTGTCAAGACTGTTG
TTGTCAACTGTTTACACTGTGAAATAAGTTGAATTTTTCGCTTTAAAGGTAAATATGAAGGTTT
CTTTGCTTAATTAAACGCAATTTTTTTATTCAATATAAACAATATTTATTTTACTTATAAATCAAA
AACAAATTAAAAATATTAAATATACAAGAAAATAAACAACAAATTCCAAGTTTGCACACTTTTG
AGTCTATATATAAACGTTAGAAGATCACACAGATTTACATATGTATGTACATATGTACTTATGCAT
GCAAAAGCATATGCAAAAACCGTGTCTTTTATGAAAACTAAAGTTAAATAAAGTTAAATACTA
AGATATATGTATTTTTGAATCTTTTTATTGCAGGAAGGGATATTGAACTACATACATATACATACA
TACATATGTATGTACTTGTACATTTGTAAGCGCGGTATTTACATTTAAACCAATTAAAATTTTGTA
TAATCTGGGAGCTTTACAGATTTTTGGGATGGTTACAACTCAAAGGGGCGTGGCAATGTAAAT
AAAATCTGTTCTGGTTATAATGTGTACATATTCTGTCTCAACTTTCTAAGGCATATGTATAAATAC
ATACATAATATATGTATATGTATATATGTACATACATATGTACATATGTAAATATTTAATTCAATGAA
TCTACGGCTATAAAAATAATAGGCTTGCCTCATTGACTGGAGCTATCCGCATAAGCAACATATGT
ACATACATACATACATATGTAAAAAAAAGTAGCAACTAAATTCTAATACATTTTCCG
SEQ ID NO:60:在两端具有SACI和ECORI消化位点(下划线)的内含 子(在载体图谱中称为INTRN):
GAGCTCGTAAGTATCAAGGTTACAAGACAGGTTTAAGGAGACCAATAGAAACTGGGCTTGTC
GAGACAGAGAAGACTCTTGCGTTTCTGATAGGCACCTATTGGTCTTACTGACATCCACTTTGCC
TTTCTCTCCACAGGAATTC
SEQ ID NO:61:载体中的HA(修饰过的H5N1越南)序列(在带下划线 的ECORI和NOTI位点之间插入):
GAATTCGCCACCATGAAGCTGTGCATCCTGCTGGCCGTGGTGGCCTTCGTGGGCCTGAGCCTG
GGCATGAAGCACCAACATCAGCACCAGCACCAACATCAACACCAGGGTCCAGGTGCCAAGTT
CGTGGCCGCTTGGACCCTGAAGGCCGCCGCCGATCAGATCTGCATTGGATACCACGCCAACAA
CAGCACCGAGCAGGTGGACACCATCATGGAGAAGAACGTGACCGTGACCCACGCCCAGGAC
ATTCTGGAGAAGAAGCACAACGGCAAGCTGTGCGATCTGGATGGCGTGAAGCCCCTGATCCT
GCGCGATTGCAGCGTGGCCGGCTGGCTGCTGGGCAACCCCATGTGCGATGAGTTCATCAACGT
GCCCGAGTGGAGCTACATCGTGGAGAAGGCCAACCCCGTGAACGATCTGTGCTACCCCGGCG
ATTTCAACGATTACGAGGAGCTGAAGCACCTGCTGTCCCGCATCAACCACTTCGAGAAGATCC
AGATCATCCCCAAGAGCAGCTGGTCCAGCCACGAGGCTAGCCTGGGCGTGAGCAGCGCCTGC
CCGTACCAGGGCAAGTCCAGCTTCTTCCGCAACGTGGTGTGGCTGATCAAGAAGAACAGCAC
CTACCCCACCATCAAGCGCAGCTACAACAACACCAACCAGGAGGATCTGCTGGTGCTGTGGG
GCATCCACCACCCCAACGATGCCGCCGAGCAGACCAAGCTGTACCAGAACCCCACCACCTAC
ATCAGCGTGGGCACCTCCACCCTGAACCAGCGCCTGGTGCCCCGCATTGCCACCCGCAGCAA
GGTGAACGGCCAGTCGGGCCGCATGGAGTTCTTTTGGACCATCCTGAAGCCCAACGACGCCA
TCAACTTCGAGAGCAACGGCAACTTCATCGCCCCCGAGTACGCCTACAAGATCGTGAAGAAG
GGCGATAGCACCATCATGAAGAGCGAGCTGGAGTACGGCAACTGCAACACCAAGTGCCAGAC
CCCCATGGGCGCCATCAACAGCAGCATGCCCTTCCACAACATCCACCCCCTGACCATCGGCGA
GTGCCCCAAGTACGTGAAGAGCAACCGCCTGGTGCTGGCCACCGGCCTGCGCAACAGCCCAC
AGCGCGAGCGCCGCCGCAAGAAGCGCGGCCTGTTCGGCGCCATCGCCGGCTTCATCGAGGGC
GGCTGGCAGGGCATGGTGGATGGCTGGTACGGCTACCACCACTCGAACGAGCAGGGCAGCGG
CTACGCCGCCGATAAGGAGTCGACCCAGAAGGCCATCGATGGCGTGACCAACAAGGTGAACA
GCATCATCGACAAGATGAACACCCAGTTCGAGGCCGTGGGCCGCGAGTTCAACAACCTGGAG
CGCCGCATCGAGAACCTGAACAAGAAGATGGAGGACGGCTTCCTGGATGTGTGGACCTACAA
CGCCGAGCTGCTGGTGCTGATGGAGAACGAGCGCACCCTGGATTTCCACGATAGCAACGTGA
AGAACCTGTACGATAAGGTGCGCCTGCAGCTGCGCGATAACGCCAAGGAGCTGGGCAACGGC
TGCTTCGAGTTCTACCACAAGTGCGACAACGAGTGCATGGAGAGCGTGCGCAACGGCACCTA
CGATTACCCCCAGTACAGCGAGGAGGCCCGCCTGAAGCGCGAGGAGATCAGCTCCGGCCGCC
TGGTGCCACGCGGCAGCCCAGGCTCCGGCTACATCCCCGAGGCCCCACGCGATGGCCAGGCC
TACGTGCGCAAGGATGGCGAGTGGGTGCTGCTGTCCACCTTCCTGTAATAAGCGGCCGC
SEQ ID NO:62:在带下划线的XMNI和SALI位点之间插入的卡那霉素/ 遗传霉素(G418)表达盒:
GAATTAATTCGGATCTCTGCAAGGGATTTTGGTCATGAACAATAAAACTGTCTGCTTACATAAA
CAGTAATACAAGGGGTGTTCATAGTATAATACGACTCACTATAGGAGGGCCACCATGAGCCACA
TCCAGCGCGAAACCAGCTGCAGCCGTCCGCGCCTGAACAGCAACATGGATGCCGATCTGTAC
GGCTACAAATGGGCCCGCGATAACGTGGGCCAGAGCGGCGCTACCATCTACCGCCTGTACGGC
AAACCGGATGCCCCGGAACTGTTCCTGAAACACGGCAAAGGCAGCGTGGCCAACGATGTGA
CCGATGAAATGGTGCGCCTGAACTGGCTGACCGAGTTCATGCCGCTGCCGACCATCAAACACT
TCATCCGCACCCCGGATGATGCCTGGCTGCTGACCACCGCCATTCCGGGCAAAACCGCCTTCC
AGGTGCTGGAAGAATACCCGGATAGCGGCGAAAACATCGTGGATGCCCTGGCCGTGTTCCTG
CGCCGCCTGCACAGCATCCCGGTGTGCAACTGCCCGTTCAACAGCGATCGCGTGTTCCGCCTG
GCTCAGGCCCAGAGCCGCATGAACAACGGCCTGGTGGATGCCAGCGATTTCGATGATGAACG
CAACGGCTGGCCGGTGGAACAGGTGTGGAAAGAGATGCACAAACTGCTGCCGTTCAGCCCG
GATTCCGTGGTGACCCACGGCGATTTCAGCCTGGATAACCTGATCTTCGATGAGGGCAAACTG
ATCGGCTGCATCGATGTGGGCCGCGTGGGCATTGCCGATCGCTACCAGGATCTGGCCATCCTGT
GGAACTGCCTGGGCGAGTTCAGCCCGAGCCTGCAGAAACGCCTGTTCCAGAAGTACGGCATC
GATAACCCGGATATGAACAAACTGCAGTTCCACCTGATGCTGGATGAGTTCTTCTAATAAGTCG
AC
SEQ ID NO:63:根据本发明实施例所用的pKanR序列:
AAGGGATTTTGGTCATGAACAATAAAACTGTCTGCTTACATAAACAGTAATACAAGGGGTGTT
CATAGTATAATACGACTCACTATAGGAGGGCC
用于pHP34s构建体的PCR引物:
GCGAACTTAAGAGCGCCGGAGTATAAATAG(SEQ ID NO:64)
CCAAGCTTCTGCAGATTGTTTAGCTTG(SEQ ID NO:65)
GGTTTGTCCAAACTCATCAATGTAT(SEQ ID NO:66)
TATACTCCGGCGCTCTTAAGTTCGCTCGCGTTCAAAACTTTTACC(SEQ ID NO:67)
SEQ ID NO:68:杂合启动子序列(具有SpeI(上游)和HindⅢ(下游) 限制位点,均带下划线)
ACTAGTGAATGCCCTACTAGAAGATGTGTGTTGCACAAAATGTCCCTGGAATAACCAATTTGA
AGTGCAGATAGCAGTAAACGTAAGCTAATATGAATAATTATTTAACTGTAATGTTTTAATATCGCT
GGACATTACTAATAAACCCACTATAAACACATGTACATATGTATGTTTTGGCATACAATGAGTAG
TTGGGGAAAAAATGTGTAAAAGCACCGTGACCATCACAGCATAAAGATAACCAGCTGAAGTA
TCGAATATGAGTAACCCCCAAATTGAATCACATGCCGCAACTGATAGGACCCATGGAAGTACA
CTCTTCATGGCGATATACAAGACACACACAAGCACGAACACCCAGTTGCGGAGGAAATTCTCC
GTAAATGAAAACCCAATCGGCGAACAATTCATACCCATATATGGTAAAAGTTTTGAACGCGAG
CGAACTTAAGAGCGCCGGAGTATAAATAGAGGCGCTTCGTCTACGGAGCGACAATTCAATTCA
AACAAGCAAAGTGAACACGTCGCTAAGCGAAAGCTAAGCAAATAAACAAGCGCAGCTGAAC
AAGCTAAACAATCTGCAGAAGCTT
SEQ ID NO:69:序列pLIC-Ex-His1(利用BIP信号序列用于细胞外表达的LIC获得的pHP34s-杂合体)
CCTGTTCACTGACTCCCGCGGATCAAAAATGACGATTGACGGCATTACGTCTAACGATATTTAC
ATGCTTGGTTATGTTTCTAATTCTTTAACTGGCCCATACAAGCCGCTGAACAAAACTGGCCTTG
TGTTAAAAATGGATCTTGATCCTAACGATGTAACCTTTACTTACTCACACTTCGCTGTACCTCA
AGCGAAAGGAAACAATGTCGTGATTACAAGCTATATGACAAACAGAGGATTCTACGCAGACA
AACAATCAACGTTTGCGCCTAGCTTCCTGCTGAACATCAAAGGCAAGAAAACATCTGTTGTCA
AAGACAGCATCCTTGAACAAGGACAATTAACAGTTAACAAATAAAAACGCAAAAGAAAATGC
CGATATCCTATTGGCATTGACGTCAGGTGGCACACCTGCAGAGAACCTCTACTTCCAATCGCAC
CATCATCACCACCATGATTACAAGGATGACGACGATAAGTGAGGATCCGAATTCGAGCTCCGT
CGACAAGCTTGCGGCCGCGGATCGATCGATATCTGACTAAATCTTAGTTTGTATTGTCATGTTTT
AATACAATATGTTATGTTTAAATATGTTTTTAATAAATTTTATAAAATAATTTCAACTTTTATTGTA
ACAACATTGTCCATTTACACACTCCTTTCAAGCGCGTGGGACTCGATGCTCGGCGCCACTCAA
AGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAA
GGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCG
CCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGA
CTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGC
CGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCAATGCTCACG
CTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCC
CGTTCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACA
CGACTTATCGCCACTGGCAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCG
GTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTACACTAGAAGGACAGTATTTGGTA
TCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATCCGGCAAAC
AAACCACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAA
GGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCA
CGTTAAGGGATTTTGCATGCGCTAAGCGGGCTTTATAAAACGGGCTGCGGGACCAGTTTTCATA
TCACTACCGTTTGAGTTCTTGTGCTGTGTGGATACTCCTCCCGACACCGAATTAATTCGGATCT
CTGCAAGGGATTTTGGTCATGAACAATAAAACTGTCTGCTTACATAAACAGTAATACAAGGGG
TGTTCATAGTATAATACGACTCACTATAGGAGGGCCACCATGGCCAAGTTGACCAGTGCCGTTC
CGGTGCTCACCGCGCGCGACGTCGCCGGAGCGGTCGAGTTCTGGACCGACCGGCTCGGGTTC
AGCCGGGACTTCGTGGAGGACGACTTCGCCGGTGTGGTCCGGGACGACGTGACCCTGTTCAT
CAGCGCGGTCCAGGACCAGGTGGTGCCGGACAACACCCTGGCCTGGGTGTGGGTGCGCGGC
CTGGACGAGCTGTACGCCGAGTGGTCGGAGGTCGTGTCCACGAACTTCCGGGACGCCTCCGG
GCCGGCCATGACCGAGATCGGCGAGCAGCCGTGGGGGCGGGAGTTCGCCCTGCGCGACCCG
GCCGGCAACTGCGTGCACTTCGTGGCCGAGGAGCAGGACTGACCGACGCCGACCAACACCG
CCGGTCCGACGGCGGCCCACGGGTCCCAGGGGGGTCGACCTCGAAACTTGTTTATTGCAGCT
TATAATGGTTACAAATAAAGCAATAGCATCACAAATTTCACAAATAAAGCATTTTTTTCACTGCA
TTCTAGTTGTGGTTTGTCCAAACTCATCAATGTATCTTATCATGTCTTCACGTAATAAGTGTGCG
GCTAGCAGTCAACTACTAGCAGTCAACACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAG
GCACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGAT
AACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGAACCACG
CTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTG
GTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAG
TTCGCCAGTTAATAGTTTGCGCAACGTTGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCG
TCGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGATCAAGGCGAGTTACATGATCCCCCA
TGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCCG
CAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGA
TGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGCGGCGACCG
AGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGCAGAACTTTAAAAGTG
CTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCC
AGTTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTT
CTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGA
AATGTTGAATACTCATACTCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCA
TGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCC
CCGAAAAGTGCCACCTACTAGTGAATGCCCTACTAGAAGATGTGTGTTGCACAAAATGTCCCT
GGAATAACCAATTTGAAGTGCAGATAGCAGTAAACGTAAGCTAATATGAATATTATTTAACTGT
AATGTTTTAATATCGCTGGACATTACTAATAAACCCACTATAAACACATGTACATATGTATGTTTT
GGCATACAATGAGTAGTTGGGGAAAAAATGTGTAAAAGCACCGTGACCATCACAGCATAAAG
ATAACCAGCTGAAGTATCGAATATGAGTAACCCCCAAATTGAATCACATGCCGCAACTGATAG
GACCCATGGAAGTACACTCTTCATGGCGATATACAAGACACACACAAGCACGAACACCCAGTT
GCGGAGGAAATTCTCCGTAAATGAAAACCCAATCGGCGAACAATTCATACCCATATATGGTAA
AAGTTTTGAACGCGAGCGAACTTAAGAGCGCCGGAGTATAAATAGAGGCGCTTCGTCTACGG
AGCGACAATTCAATTCAAACAAGCAAAGTGAACACGTCGCTAAGCGAAAGCTAAGCAAATAA
ACAAGCGCAGCTGAACAAGCTAAACAATCTGCAGAAGCTTGGTACCCTCGAGCTCAGCTGAA
TTCTGGATCCTCTAGAAATAATTTTGTTTAACCTTAAGAAGGAGATATACTCAAAATGAAGCTG
TGCATACTGCTGGCCGTCGTGGCCTTTGTTGGCCTCTCGCTCGGGGAAGAGAAAAAGCTAAG
CAGGTCGTTCACTATTATTTAGTGAAATGAGATATTATGATATTTTCTGAATTGTGATTAAAAAG
GCAACTTTATGCCCATGCAACAGAAACTATAAAAAATACAGAGAATGAAAAGAAACAGATAG
ATTTTTTAGTTCTTTAGGCCCGTAGTCTGCAAATCCTTTTATGATTTTCTATCAAACAAAAGAGG
AAAATAGACCAGTTGCAATCCAAACGAGAGTCTAATAGAATGAGGTCGAAAAGTAAATCGCG
CGGGTTTGTTACTGATAAAGCAGGCAAGACCTAAAATGTGTAAAGGGCAAAGTGTATACTTTG
GCGTCACCCCTTACATATTTTAGGTCTTTTTTTATTGTGCGTAACTAACTTGCCATCTTCAAACA
GGAGGGCTGGAAGAAGCAGACCGCTAACACAGTACATAAAAAAGGAGACATGAACGATGAA
CATCAAAAAGTTTGCAAAACAAGCAACAGTATTAACCTTTACTACCGCACTGCTGGCAGGAG
GCGCAACTCAAGCGTTTGCGAAAGAAACGAACCAAAAGCCATATAAGGAAACATACGGCATT
TCCCATATTACACGCCATGATATGCTGCAAATCCCTGAACAGCAAAAAAATGAAAAATATAAAG
TTCCTGAGTTCGATTCGTCCACAATTAAAAATATCTCTTCTGCAAAAGGCCTGGACGTTTGGGA
CAGCTGGCCATTACAAAACACTGACGGCACTGTCGCAAACTATCACGGCTACCACATCGTCTT
TGCATTAGCCGGAGATCCTAAAAATGCGGATGACACATCGATTTACATGTTCTATCAAAAAGTC
GGCGAAACTTCTATTGACAGCTGGAAAAACGCTGGCCGCGTCTTTAAAGACAGCGACAAATT
CGATGCAAATGATTCTATCCTAAAAGACCAAACACAAGAATGGTCAGGTTCAGCCACATTTAC
ATCTGACGGAAAAATCCGTTTATTCTACACTGATTTCTCCGGTAAACATTACGGCAAACAAACA
CTGACAACTGCACAAGTTAACGTATCAGCATCAGACAGCTCTTTGAACATCAACGGTGTAGAG
GATTATAAATCAATCTTTGACGGTGACGGAAAAACGTATCAAAATGTACAGCAGTTCATCGATG
AAGGCAACTACAGCTCAGGCGACAACCATACGCTGAGAGATCCTCACTACGTAGAAGATAAA
GGCCACAAATACTTAGTATTTGAAGCAAACACTGGAACTGAAGATGGCTACCAAGGCGAAGA
ATCTTTATTTAACAAAGCATACTATGGCAAAAGCACATCATTCTTCCGTCAAGAAAGTCAAAAA
CTTCTGCAAAGCGATAAAAAACGCACGGCTGAGTTAGCAAACGGCGCTCTCGGTATGATTGA
GCTAAACGATGATTACACACTGAAAAAAGTGATGAAACCGCTGATTGCATCTAACACAGTAAC
AGATGAAATTGAACGCGCGAACGTCTTTAAAATGAACGGCAAATGGTA
SEQ ID NO:70:pLIC-His-Int序列(LIC获得的用于细胞内表达的pHP34s-杂合体):
CTAGCAGTCAACACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCG
ATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGATACGGGA
GGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGAACCACGCTCACCGGCTCCAGA
TTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATC
CGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGT
TTGCGCAACGTTGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTT
CATTCAGCTCCGGTTCCCAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAG
CGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCAT
GGTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTG
GTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCTCTTGCCCGG
CGTCAATACGGGATAATACCGCGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAAC
GTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCA
CTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAA
CAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATA
CTCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGAGCGGATACATATTT
GAATGTATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTGCCACCT
ACTAGTGAATGCCCTACTAGAAGATGTGTGTTGCACAAAATGTCCCTGGAATAACCAATTTGA
AGTGCAGATAGCAGTAAACGTAAGCTAATATGAATATTATTTAACTGTAATGTTTTAATATCGCT
GGACATTACTAATAAACCCACTATAAACACATGTACATATGTATGTTTTGGCATACAATGAGTAG
TTGGGGAAAAAATGTGTAAAAGCACCGTGACCATCACAGCATAAAGATAACCAGCTGAAGTA
TCGAATATGAGTAACCCCCAAATTGAATCACATGCCGCAACTGATAGGACCCATGGAAGTACA
CTCTTCATGGCGATATACAAGACACACACAAGCACGAACACCCAGTTGCGGAGGAAATTCTCC
GTAAATGAAAACCCAATCGGCGAACAATTCATACCCATATATGGTAAAAGTTTTGAACGCGAG
CGAACTTAAGAGCGCCGGAGTATAAATAGAGGCGCTTCGTCTACGGAGCGACAATTCAATTCA
AACAAGCAAAGTGAACACGTCGCTAAGCGAAAGCTAAGCAAATAAACAAGCGCAGCTGAAC
AAGCTAAACAATCTGCAGAAGCTTGGTACCCTCGAGCTCAGCTGAATTCTGGATCCTCTAGAA
ATAATTTTGTTTAACTTTAAGAAGGAGATATCAAAATGCACCATCATCATCATCATTCTTCTGGT
GTAGATCTGGGTACCGAGAACCTGTACTTCCAATCCATGGAGACCGACGTCCACATATACCTG
CCGTTCACTATTATTTAGTGAAATGAGATATTATGATATTTTCTGAATTGTGATTAAAAAGGCAA
CTTTATGCCCATGCAACAGAAACTATAAAAAATACAGAGAATGAAAAGAAACAGATAGATTTT
TTAGTTCTTTAGGCCCGTAGTCTGCAAATCCTTTTATGATTTTCTATCAAACAAAAGAGGAAAA
TAGACCAGTTGCAATCCAAACGAGAGTCTAATAGAATGAGGTCGAAAAGTAAATCGCGCGGG
TTTGTTACTGATAAAGCAGGCAAGACCTAAAATGTGTAAAGGGCAAAGTGTATACTTTGGCGT
CACCCCTTACATATTTTAGGTCTTTTTTTATTGTGCGTAACTAACTTGCCATCTTCAAACAGGAG
GGCTGGAAGAAGCAGACCGCTAACACAGTACATAAAAAAGGAGACATGAACGATGAACATCA
AAAAGTTTGCAAAACAAGCAACAGTATTAACCTTTACTACCGCACTGCTGGCAGGAGGCGCA
ACTCAAGCGTTTGCGAAAGAAACGAACCAAAAGCCATATAAGGAAACATACGGCATTTCCCAT
ATTACACGCCATGATATGCTGCAAATCCCTGAACAGCAAAAAAATGAAAAATATAAAGTTCCT
GAGTTCGATTCGTCCACAATTAAAAATATCTCTTCTGCAAAAGGCCTGGACGTTTGGGACAGC
TGGCCATTACAAAACACTGACGGCACTGTCGCAAACTATCACGGCTACCACATCGTCTTTGCA
TTAGCCGGAGATCCTAAAAATGCGGATGACACATCGATTTACATGTTCTATCAAAAAGTCGGCG
AAACTTCTATTGACAGCTGGAAAAACGCTGGCCGCGTCTTTAAAGACAGCGACAAATTCGAT
GCAAATGATTCTATCCTAAAAGACCAAACACAAGAATGGTCAGGTTCAGCCACATTTACATCT
GACGGAAAAATCCGTTTATTCTACACTGATTTCTCCGGTAAACATTACGGCAAACAAACACTG
ACAACTGCACAAGTTAACGTATCAGCATCAGACAGCTCTTTGAACATCAACGGTGTAGAGGAT
TATAAATCAATCTTTGACGGTGACGGAAAAACGTATCAAAATGTACAGCAGTTCATCGATGAA
GGCAACTACAGCTCAGGCGACAACCATACGCTGAGAGATCCTCACTACGTAGAAGATAAAGG
CCACAAATACTTAGTATTTGAAGCAAACACTGGAACTGAAGATGGCTACCAAGGCGAAGAAT
CTTTATTTAACAAAGCATACTATGGCAAAAGCACATCATTCTTCCGTCAAGAAAGTCAAAAAC
TTCTGCAAAGCGATAAAAAACGCACGGCTGAGTTAGCAAACGGCGCTCTCGGTATGATTGAG
CTAAACGATGATTACACACTGAAAAAAGTGATGAAACCGCTGATTGCATCTAACACAGTAACA
GATGAAATTGAACGCGCGAACGTCTTTAAAATGAACGGCAAATGGTACCTGTTCACTGACTCC
CGCGGATCAAAAATGACGATTGACGGCATTACGTCTAACGATATTTACATGCTTGGTTATGTTT
CTAATTCTTTAACTGGCCCATACAAGCCGCTGAACAAAACTGGCCTTGTGTTAAAAATGGATCT
TGATCCTAACGATGTAACCTTTACTTACTCACACTTCGCTGTACCTCAAGCGAAAGGAAACAA
TGTCGTGATTACAAGCTATATGACAAACAGAGGATTCTACGCAGACAAACAATCAACGTTTGC
GCCTAGCTTCCTGCTGAACATCAAAGGCAAGAAAACATCTGTTGTCAAAGACAGCATCCTTGA
ACAAGGACAATTAACAGTTAACAAATAAAAACGCAAAAGAAAATGCCGATATCCTATTGGCAT
TGACGGTCTCCAGTAAAGGTGGATACGGATCCGAATTCGAGCTCCGTCGACAAGCTTGCGGCC
GCGGATCGATCGATATCTGACTAAATCTTAGTTTGTATTGTCATGTTTTAATACAATATGTTATGT
TTAAATATGTTTTTAATAAATTTTATAAAATAATTTCAACTTTTATTGTAACAACATTGTCCATTTA
CACACTCCTTTCAAGCGCGTGGGACTCGATGCTCGGCGCCACTCAAAGGCGGTAATACGGTTA
TCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCA
GGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATC
ACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCG
TTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGT
CCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCAATGCTCACGCTGTAGGTATCTCAGTTC
GGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCT
GCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGG
CAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTG
AAGTGGTGGCCTAACTACGGCTACACTAGAAGGACAGTATTTGGTATCTGCGCTCTGCTGAAG
CCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACCGCTGGTAG
CGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCTCAAGAAGATC
CTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTTGC
ATGCGCTAAGCGGGCTTTATAAAACGGGCTGCGGGACCAGTTTTCATATCACTACCGTTTGAGT
TCTTGTGCTGTGTGGATACTCCTCCCGACACCGAATTAATTCGGATCTCTGCAAGGGATTTTGG
TCATGAACAATAAAACTGTCTGCTTACATAAACAGTAATACAAGGGGTGTTCATAGTATAATAC
GACTCACTATAGGAGGGCCACCATGGCCAAGTTGACCAGTGCCGTTCCGGTGCTCACCGCGC
GCGACGTCGCCGGAGCGGTCGAGTTCTGGACCGACCGGCTCGGGTTCAGCCGGGACTTCGTG
GAGGACGACTTCGCCGGTGTGGTCCGGGACGACGTGACCCTGTTCATCAGCGCGGTCCAGGA
CCAGGTGGTGCCGGACAACACCCTGGCCTGGGTGTGGGTGCGCGGCCTGGACGAGCTGTACG
CCGAGTGGTCGGAGGTCGTGTCCACGAACTTCCGGGACGCCTCCGGGCCGGCCATGACCGAG
ATCGGCGAGCAGCCGTGGGGGCGGGAGTTCGCCCTGCGCGACCCGGCCGGCAACTGCGTGC
ACTTCGTGGCCGAGGAGCAGGACTGACCGACGCCGACCAACACCGCCGGTCCGACGGCGGC
CCACGGGTCCCAGGGGGGTCGACCTCGAAACTTGTTTATTGCAGCTTATAATGGTTACAAATA
AAGCAATAGCATCACAAATTTCACAAATAAAGCATTTTTTTCACTGCATTCTAGTTGTGGTTTG
TCCAAACTCATCAATGTATCTTATCATGTCTTCACGTAATAAGTGTGCGGCTAGCAGTCAA
SEQ ID NO:71:pLIC-His-Ex序列(LIC获得的用于细胞外表达的pHP34s-杂合体)
CTAGCAGTCAACACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCG
ATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGATACGGGA
GGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGAACCACGCTCACCGGCTCCAGA
TTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATC
CGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGT
TTGCGCAACGTTGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTT
CATTCAGCTCCGGTTCCCAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAG
CGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCAT
GGTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTG
GTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCTCTTGCCCGG
CGTCAATACGGGATAATACCGCGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAAC
GTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCA
CTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAA
CAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATA
CTCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGAGCGGATACATATTT
GAATGTATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTGCCACCT
ACTAGTGAATGCCCTACTAGAAGATGTGTGTTGCACAAAATGTCCCTGGAATAACCAATTTGA
AGTGCAGATAGCAGTAAACGTAAGCTAATATGAATATTATTTAACTGTAATGTTTTAATATCGCT
GGACATTACTAATAAACCCACTATAAACACATGTACATATGTATGTTTTGGCATACAATGAGTAG
TTGGGGAAAAAATGTGTAAAAGCACCGTGACCATCACAGCATAAAGATAACCAGCTGAAGTA
TCGAATATGAGTAACCCCCAAATTGAATCACATGCCGCAACTGATAGGACCCATGGAAGTACA
CTCTTCATGGCGATATACAAGACACACACAAGCACGAACACCCAGTTGCGGAGGAAATTCTCC
GTAAATGAAAACCCAATCGGCGAACAATTCATACCCATATATGGTAAAAGTTTTGAACGCGAG
CGAACTTAAGAGCGCCGGAGTATAAATAGAGGCGCTTCGTCTACGGAGCGACAATTCAATTCA
AACAAGCAAAGTGAACACGTCGCTAAGCGAAAGCTAAGCAAATAAACAAGCGCAGCTGAAC
AAGCTAAACAATCTGCAGAAGCTTGGTACCCTCGAGCTCAGCTGAATTCTGGATCCTCTAGAA
ATAATTTTGTTTAACTTTAAGAAGGAGATATCAAAATGAAGCTGTGCATACTGCTGGCCGTCGT
GGCCTTTGTTGGCCTCTCGCTCGGGCACCATCATCATCATCATTCTTCTGGTGTAGATCTGGGT
ACCGAGAACCTGTACTTCCAATCCATGGAGACCGACGTCCACATATACCTGCCGTTCACTATTA
TTTAGTGAAATGAGATATTATGATATTTTCTGAATTGTGATTAAAAAGGCAACTTTATGCCCATG
CAACAGAAACTATAAAAAATACAGAGAATGAAAAGAAACAGATAGATTTTTTAGTTCTTTAGG
CCCGTAGTCTGCAAATCCTTTTATGATTTTCTATCAAACAAAAGAGGAAAATAGACCAGTTGCA
ATCCAAACGAGAGTCTAATAGAATGAGGTCGAAAAGTAAATCGCGCGGGTTTGTTACTGATAA
AGCAGGCAAGACCTAAAATGTGTAAAGGGCAAAGTGTATACTTTGGCGTCACCCCTTACATAT
TTTAGGTCTTTTTTTATTGTGCGTAACTAACTTGCCATCTTCAAACAGGAGGGCTGGAAGAAGC
AGACCGCTAACACAGTACATAAAAAAGGAGACATGAACGATGAACATCAAAAAGTTTGCAAA
ACAAGCAACAGTATTAACCTTTACTACCGCACTGCTGGCAGGAGGCGCAACTCAAGCGTTTGC
GAAAGAAACGAACCAAAAGCCATATAAGGAAACATACGGCATTTCCCATATTACACGCCATGA
TATGCTGCAAATCCCTGAACAGCAAAAAAATGAAAAATATAAAGTTCCTGAGTTCGATTCGTC
CACAATTAAAAATATCTCTTCTGCAAAAGGCCTGGACGTTTGGGACAGCTGGCCATTACAAAA
CACTGACGGCACTGTCGCAAACTATCACGGCTACCACATCGTCTTTGCATTAGCCGGAGATCCT
AAAAATGCGGATGACACATCGATTTACATGTTCTATCAAAAAGTCGGCGAAACTTCTATTGACA
GCTGGAAAAACGCTGGCCGCGTCTTTAAAGACAGCGACAAATTCGATGCAAATGATTCTATCC
TAAAAGACCAAACACAAGAATGGTCAGGTTCAGCCACATTTACATCTGACGGAAAAATCCGT
TTATTCTACACTGATTTCTCCGGTAAACATTACGGCAAACAAACACTGACAACTGCACAAGTT
AACGTATCAGCATCAGACAGCTCTTTGAACATCAACGGTGTAGAGGATTATAAATCAATCTTTG
ACGGTGACGGAAAAACGTATCAAAATGTACAGCAGTTCATCGATGAAGGCAACTACAGCTCA
GGCGACAACCATACGCTGAGAGATCCTCACTACGTAGAAGATAAAGGCCACAAATACTTAGTA
TTTGAAGCAAACACTGGAACTGAAGATGGCTACCAAGGCGAAGAATCTTTATTTAACAAAGCA
TACTATGGCAAAAGCACATCATTCTTCCGTCAAGAAAGTCAAAAACTTCTGCAAAGCGATAAA
AAACGCACGGCTGAGTTAGCAAACGGCGCTCTCGGTATGATTGAGCTAAACGATGATTACACA
CTGAAAAAAGTGATGAAACCGCTGATTGCATCTAACACAGTAACAGATGAAATTGAACGCGC
GAACGTCTTTAAAATGAACGGCAAATGGTACCTGTTCACTGACTCCCGCGGATCAAAAATGAC
GATTGACGGCATTACGTCTAACGATATTTACATGCTTGGTTATGTTTCTAATTCTTTAACTGGCC
CATACAAGCCGCTGAACAAAACTGGCCTTGTGTTAAAAATGGATCTTGATCCTAACGATGTAA
CCTTTACTTACTCACACTTCGCTGTACCTCAAGCGAAAGGAAACAATGTCGTGATTACAAGCT
ATATGACAAACAGAGGATTCTACGCAGACAAACAATCAACGTTTGCGCCTAGCTTCCTGCTGA
ACATCAAAGGCAAGAAAACATCTGTTGTCAAAGACAGCATCCTTGAACAAGGACAATTAACA
GTTAACAAATAAAAACGCAAAAGAAAATGCCGATATCCTATTGGCATTGACGGTCTCCAGTAA
AGGTGGATACGGATCCGAATTCGAGCTCCGTCGACAAGCTTGCGGCCGCGGATCGATCGATAT
CTGACTAAATCTTAGTTTGTATTGTCATGTTTTAATACAATATGTTATGTTTAAATATGTTTTTAAT
AAATTTTATAAAATAATTTCAACTTTTATTGTAACAACATTGTCCATTTACACACTCCTTTCAAG
CGCGTGGGACTCGATGCTCGGCGCCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGG
GATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGG
CCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGCT
CAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGC
TCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTT
CGGGAAGCGTGGCGCTTTCTCAATGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTC
GCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTATCCGGTA
ACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTA
ACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACT
ACGGCTACACTAGAAGGACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAA
AAAGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTGGTTTTTTTGTTT
GCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGG
GGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTTGCATGCGCTAAGCGGGCTTT
ATAAAACGGGCTGCGGGACCAGTTTTCATATCACTACCGTTTGAGTTCTTGTGCTGTGTGGATA
CTCCTCCCGACACCGAATTAATTCGGATCTCTGCAAGGGATTTTGGTCATGAACAATAAAACTG
TCTGCTTACATAAACAGTAATACAAGGGGTGTTCATAGTATAATACGACTCACTATAGGAGGGC
CACCATGGCCAAGTTGACCAGTGCCGTTCCGGTGCTCACCGCGCGCGACGTCGCCGGAGCGG
TCGAGTTCTGGACCGACCGGCTCGGGTTCAGCCGGGACTTCGTGGAGGACGACTTCGCCGGT
GTGGTCCGGGACGACGTGACCCTGTTCATCAGCGCGGTCCAGGACCAGGTGGTGCCGGACAA
CACCCTGGCCTGGGTGTGGGTGCGCGGCCTGGACGAGCTGTACGCCGAGTGGTCGGAGGTCG
TGTCCACGAACTTCCGGGACGCCTCCGGGCCGGCCATGACCGAGATCGGCGAGCAGCCGTGG
GGGCGGGAGTTCGCCCTGCGCGACCCGGCCGGCAACTGCGTGCACTTCGTGGCCGAGGAGC
AGGACTGACCGACGCCGACCAACACCGCCGGTCCGACGGCGGCCCACGGGTCCCAGGGGGG
TCGACCTCGAAACTTGTTTATTGCAGCTTATAATGGTTACAAATAAAGCAATAGCATCACAAAT
TTCACAAATAAAGCATTTTTTTCACTGCATTCTAGTTGTGGTTTGTCCAAACTCATCAATGTATC
TTATCATGTCTTCACGTAATAAGTGTGCGGCTAGCAGTCAA
SEQ ID NO:72:pLIC-Int-His1序列(LIC获得的用于细胞内表达的pHP34s-杂合体):
CCTGTTCACTGACTCCCGCGGATCAAAAATGACGATTGACGGCATTACGTCTAACGATATTTAC
ATGCTTGGTTATGTTTCTAATTCTTTAACTGGCCCATACAAGCCGCTGAACAAAACTGGCCTTG
TGTTAAAAATGGATCTTGATCCTAACGATGTAACCTTTACTTACTCACACTTCGCTGTACCTCA
AGCGAAAGGAAACAATGTCGTGATTACAAGCTATATGACAAACAGAGGATTCTACGCAGACA
AACAATCAACGTTTGCGCCTAGCTTCCTGCTGAACATCAAAGGCAAGAAAACATCTGTTGTCA
AAGACAGCATCCTTGAACAAGGACAATTAACAGTTAACAAATAAAAACGCAAAAGAAAATGC
CGATATCCTATTGGCATTGACGTCAGGTGGCACACCTGCAGAGAACCTCTACTTCCAATCGCAC
CATCATCACCACCATGATTACAAGGATGACGACGATAAGTGAGGATCCGAATTCGAGCTCCGT
CGACAAGCTTGCGGCCGCGGATCGATCGATATCTGACTAAATCTTAGTTTGTATTGTCATGTTTT
AATACAATATGTTATGTTTAAATATGTTTTTAATAAATTTTATAAAATAATTTCAACTTTTATTGTA
ACAACATTGTCCATTTACACACTCCTTTCAAGCGCGTGGGACTCGATGCTCGGCGCCACTCAA
AGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAA
GGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCG
CCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGA
CTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGC
CGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCAATGCTCACG
CTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCC
CGTTCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACA
CGACTTATCGCCACTGGCAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCG
GTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTACACTAGAAGGACAGTATTTGGTA
TCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATCCGGCAAAC
AAACCACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAA
GGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCA
CGTTAAGGGATTTTGCATGCGCTAAGCGGGCTTTATAAAACGGGCTGCGGGACCAGTTTTCATA
TCACTACCGTTTGAGTTCTTGTGCTGTGTGGATACTCCTCCCGACACCGAATTAATTCGGATCT
CTGCAAGGGATTTTGGTCATGAACAATAAAACTGTCTGCTTACATAAACAGTAATACAAGGGG
TGTTCATAGTATAATACGACTCACTATAGGAGGGCCACCATGGCCAAGTTGACCAGTGCCGTTC
CGGTGCTCACCGCGCGCGACGTCGCCGGAGCGGTCGAGTTCTGGACCGACCGGCTCGGGTTC
AGCCGGGACTTCGTGGAGGACGACTTCGCCGGTGTGGTCCGGGACGACGTGACCCTGTTCAT
CAGCGCGGTCCAGGACCAGGTGGTGCCGGACAACACCCTGGCCTGGGTGTGGGTGCGCGGC
CTGGACGAGCTGTACGCCGAGTGGTCGGAGGTCGTGTCCACGAACTTCCGGGACGCCTCCGG
GCCGGCCATGACCGAGATCGGCGAGCAGCCGTGGGGGCGGGAGTTCGCCCTGCGCGACCCG
GCCGGCAACTGCGTGCACTTCGTGGCCGAGGAGCAGGACTGACCGACGCCGACCAACACCG
CCGGTCCGACGGCGGCCCACGGGTCCCAGGGGGGTCGACCTCGAAACTTGTTTATTGCAGCT
TATAATGGTTACAAATAAAGCAATAGCATCACAAATTTCACAAATAAAGCATTTTTTTCACTGCA
TTCTAGTTGTGGTTTGTCCAAACTCATCAATGTATCTTATCATGTCTTCACGTAATAAGTGTGCG
GCTAGCAGTCAACTACTAGCAGTCAACACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAG
GCACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGAT
AACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGAACCACG
CTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTG
GTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAG
TTCGCCAGTTAATAGTTTGCGCAACGTTGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCG
TCGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGATCAAGGCGAGTTACATGATCCCCCA
TGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCCG
CAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGA
TGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGCGGCGACCG
AGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGCAGAACTTTAAAAGTG
CTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCC
AGTTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTT
CTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGA
AATGTTGAATACTCATACTCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCA
TGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCC
CCGAAAAGTGCCACCTACTAGTGAATGCCCTACTAGAAGATGTGTGTTGCACAAAATGTCCCT
GGAATAACCAATTTGAAGTGCAGATAGCAGTAAACGTAAGCTAATATGAATATTATTTAACTGT
AATGTTTTAATATCGCTGGACATTACTAATAAACCCACTATAAACACATGTACATATGTATGTTTT
GGCATACAATGAGTAGTTGGGGAAAAAATGTGTAAAAGCACCGTGACCATCACAGCATAAAG
ATAACCAGCTGAAGTATCGAATATGAGTAACCCCCAAATTGAATCACATGCCGCAACTGATAG
GACCCATGGAAGTACACTCTTCATGGCGATATACAAGACACACACAAGCACGAACACCCAGTT
GCGGAGGAAATTCTCCGTAAATGAAAACCCAATCGGCGAACAATTCATACCCATATATGGTAA
AAGTTTTGAACGCGAGCGAACTTAAGAGCGCCGGAGTATAAATAGAGGCGCTTCGTCTACGG
AGCGACAATTCAATTCAAACAAGCAAAGTGAACACGTCGCTAAGCGAAAGCTAAGCAAATAA
ACAAGCGCAGCTGAACAAGCTAAACAATCTGCAGAAGCTTGGTACCCTCGAGCTCAGCTGAA
TTCTGGATCCTCTAGAAATAATTTTGTTTAACCTTAAGAAGGAGATACAAAGCAGGTCGTTCAC
TATTATTTAGTGAAATGAGATATTATGATATTTTCTGAATTGTGATTAAAAAGGCAACTTTATGCC
CATGCAACAGAAACTATAAAAAATACAGAGAATGAAAAGAAACAGATAGATTTTTTAGTTCTT
TAGGCCCGTAGTCTGCAAATCCTTTTATGATTTTCTATCAAACAAAAGAGGAAAATAGACCAGT
TGCAATCCAAACGAGAGTCTAATAGAATGAGGTCGAAAAGTAAATCGCGCGGGTTTGTTACTG
ATAAAGCAGGCAAGACCTAAAATGTGTAAAGGGCAAAGTGTATACTTTGGCGTCACCCCTTAC
ATATTTTAGGTCTTTTTTTATTGTGCGTAACTAACTTGCCATCTTCAAACAGGAGGGCTGGAAG
AAGCAGACCGCTAACACAGTACATAAAAAAGGAGACATGAACGATGAACATCAAAAAGTTTG
CAAAACAAGCAACAGTATTAACCTTTACTACCGCACTGCTGGCAGGAGGCGCAACTCAAGCG
TTTGCGAAAGAAACGAACCAAAAGCCATATAAGGAAACATACGGCATTTCCCATATTACACGC
CATGATATGCTGCAAATCCCTGAACAGCAAAAAAATGAAAAATATAAAGTTCCTGAGTTCGAT
TCGTCCACAATTAAAAATATCTCTTCTGCAAAAGGCCTGGACGTTTGGGACAGCTGGCCATTA
CAAAACACTGACGGCACTGTCGCAAACTATCACGGCTACCACATCGTCTTTGCATTAGCCGGA
GATCCTAAAAATGCGGATGACACATCGATTTACATGTTCTATCAAAAAGTCGGCGAAACTTCTA
TTGACAGCTGGAAAAACGCTGGCCGCGTCTTTAAAGACAGCGACAAATTCGATGCAAATGAT
TCTATCCTAAAAGACCAAACACAAGAATGGTCAGGTTCAGCCACATTTACATCTGACGGAAAA
ATCCGTTTATTCTACACTGATTTCTCCGGTAAACATTACGGCAAACAAACACTGACAACTGCAC
AAGTTAACGTATCAGCATCAGACAGCTCTTTGAACATCAACGGTGTAGAGGATTATAAATCAAT
CTTTGACGGTGACGGAAAAACGTATCAAAATGTACAGCAGTTCATCGATGAAGGCAACTACA
GCTCAGGCGACAACCATACGCTGAGAGATCCTCACTACGTAGAAGATAAAGGCCACAAATACT
TAGTATTTGAAGCAAACACTGGAACTGAAGATGGCTACCAAGGCGAAGAATCTTTATTTAACA
AAGCATACTATGGCAAAAGCACATCATTCTTCCGTCAAGAAAGTCAAAAACTTCTGCAAAGCG
ATAAAAAACGCACGGCTGAGTTAGCAAACGGCGCTCTCGGTATGATTGAGCTAAACGATGATT
ACACACTGAAAAAAGTGATGAAACCGCTGATTGCATCTAACACAGTAACAGATGAAATTGAA
CGCGCGAACGTCTTTAAAATGAACGGCAAATGGTA
SEQ ID NO:73:pLIC-TEV-Ex-His1序列(LIC获得的用于细胞外表达的pHP34s-杂合体)
TTCTCAATGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGT
GTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCC
AACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTAACAGGATTAGCAGAGC
GAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTACACTAGAAG
GACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTC
TTGATCCGGCAAACAAACCACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGATTAC
GCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTG
GAACGAAAACTCACGTTAAGGGATTTTGCATGCGCTAAGCGGGCTTTATAAAACGGGCTGCGG
GACCAGTTTTCATATCACTACCGTTTGAGTTCTTGTGCTGTGTGGATACTCCTCCCGACACCGA
ATTAATTCGGATCTCTGCAAGGGATTTTGGTCATGAACAATAAAACTGTCTGCTTACATAAACA
GTAATACAAGGGGTGTTCATAGTATAATACGACTCACTATAGGAGGGCCACCATGGCCAAGTTG
ACCAGTGCCGTTCCGGTGCTCACCGCGCGCGACGTCGCCGGAGCGGTCGAGTTCTGGACCGA
CCGGCTCGGGTTCAGCCGGGACTTCGTGGAGGACGACTTCGCCGGTGTGGTCCGGGACGACG
TGACCCTGTTCATCAGCGCGGTCCAGGACCAGGTGGTGCCGGACAACACCCTGGCCTGGGTG
TGGGTGCGCGGCCTGGACGAGCTGTACGCCGAGTGGTCGGAGGTCGTGTCCACGAACTTCCG
GGACGCCTCCGGGCCGGCCATGACCGAGATCGGCGAGCAGCCGTGGGGGCGGGAGTTCGCC
CTGCGCGACCCGGCCGGCAACTGCGTGCACTTCGTGGCCGAGGAGCAGGACTGACCGACGC
CGACCAACACCGCCGGTCCGACGGCGGCCCACGGGTCCCAGGGGGGTCGACCTCGAAACTT
GTTTATTGCAGCTTATAATGGTTACAAATAAAGCAATAGCATCACAAATTTCACAAATAAAGCA
TTTTTTTCACTGCATTCTAGTTGTGGTTTGTCCAAACTCATCAATGTATCTTATCATGTCTTCACG
TAATAAGTGTGCGGCTAGCAGTCAACTAGCAGTCAACACTTGGTCTGACAGTTACCAATGCTT
AATCAGTGAGGCACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCC
GTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCG
CGAGAACCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGA
GCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCT
AGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGTTGTTGCCATTGCTACAGGCATCGTG
GTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGATCAAGGCGAGTT
ACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGA
AGTAAGTTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCA
TGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTG
TATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGCAG
AACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACC
GCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACT
TTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAA
GGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCAATATTATTGAAGCATTTATCAG
GGTTATTGTCTCATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAATAGGGGTTC
CGCGCACATTTCCCCGAAAAGTGCCACCTACTAGTGAATGCCCTACTAGAAGATGTGTGTTGC
ACAAAATGTCCCTGGAATAACCAATTTGAAGTGCAGATAGCAGTAAACGTAAGCTAATATGAA
TATTATTTAACTGTAATGTTTTAATATCGCTGGACATTACTAATAAACCCACTATAAACACATGTA
CATATGTATGTTTTGGCATACAATGAGTAGTTGGGGAAAAAATGTGTAAAAGCACCGTGACCAT
CACAGCATAAAGATAACCAGCTGAAGTATCGAATATGAGTAACCCCCAAATTGAATCACATGC
CGCAACTGATAGGACCCATGGAAGTACACTCTTCATGGCGATATACAAGACACACACAAGCAC
GAACACCCAGTTGCGGAGGAAATTCTCCGTAAATGAAAACCCAATCGGCGAACAATTCATACC
CATATATGGTAAAAGTTTTGAACGCGAGCGAACTTAAGAGCGCCGGAGTATAAATAGAGGCGC
TTCGTCTACGGAGCGACAATTCAATTCAAACAAGCAAAGTGAACACGTCGCTAAGCGAAAGC
TAAGCAAATAAACAAGCGCAGCTGAACAAGCTAAACAATCTGCAGAAGCTTGGTACCCTCGA
GCTCAGCTGAATTCTGGATCCTCTAGAAATAATTTTGTTTAACCTTAAGAAGGAGATATACTCA
AAATGAAGCTGTGCATACTGCTGGCCGTCGTGGCCTTTGTTGGCCTCTCGCTCGGGGAAAATT
TGTATTTTCAATGCAGGTCGTTCACTATTATTTAGTGAAATGAGATATTATGATATTTTCTGAATT
GTGATTAAAAAGGCAACTTTATGCCCATGCAACAGAAACTATAAAAAATACAGAGAATGAAAA
GAAACAGATAGATTTTTTAGTTCTTTAGGCCCGTAGTCTGCAAATCCTTTTATGATTTTCTATCA
AACAAAAGAGGAAAATAGACCAGTTGCAATCCAAACGAGAGTCTAATAGAATGAGGTCGAAA
AGTAAATCGCGCGGGTTTGTTACTGATAAAGCAGGCAAGACCTAAAATGTGTAAAGGGCAAA
GTGTATACTTTGGCGTCACCCCTTACATATTTTAGGTCTTTTTTTATTGTGCGTAACTAACTTGCC
ATCTTCAAACAGGAGGGCTGGAAGAAGCAGACCGCTAACACAGTACATAAAAAAGGAGACAT
GAACGATGAACATCAAAAAGTTTGCAAAACAAGCAACAGTATTAACCTTTACTACCGCACTGC
TGGCAGGAGGCGCAACTCAAGCGTTTGCGAAAGAAACGAACCAAAAGCCATATAAGGAAAC
ATACGGCATTTCCCATATTACACGCCATGATATGCTGCAAATCCCTGAACAGCAAAAAAATGAA
AAATATAAAGTTCCTGAGTTCGATTCGTCCACAATTAAAAATATCTCTTCTGCAAAAGGCCTGG
ACGTTTGGGACAGCTGGCCATTACAAAACACTGACGGCACTGTCGCAAACTATCACGGCTACC
ACATCGTCTTTGCATTAGCCGGAGATCCTAAAAATGCGGATGACACATCGATTTACATGTTCTAT
CAAAAAGTCGGCGAAACTTCTATTGACAGCTGGAAAAACGCTGGCCGCGTCTTTAAAGACAG
CGACAAATTCGATGCAAATGATTCTATCCTAAAAGACCAAACACAAGAATGGTCAGGTTCAGC
CACATTTACATCTGACGGAAAAATCCGTTTATTCTACACTGATTTCTCCGGTAAACATTACGGC
AAACAAACACTGACAACTGCACAAGTTAACGTATCAGCATCAGACAGCTCTTTGAACATCAA
CGGTGTAGAGGATTATAAATCAATCTTTGACGGTGACGGAAAAACGTATCAAAATGTACAGCA
GTTCATCGATGAAGGCAACTACAGCTCAGGCGACAACCATACGCTGAGAGATCCTCACTACGT
AGAAGATAAAGGCCACAAATACTTAGTATTTGAAGCAAACACTGGAACTGAAGATGGCTACC
AAGGCGAAGAATCTTTATTTAACAAAGCATACTATGGCAAAAGCACATCATTCTTCCGTCAAG
AAAGTCAAAAACTTCTGCAAAGCGATAAAAAACGCACGGCTGAGTTAGCAAACGGCGCTCTC
GGTATGATTGAGCTAAACGATGATTACACACTGAAAAAAGTGATGAAACCGCTGATTGCATCT
AACACAGTAACAGATGAAATTGAACGCGCGAACGTCTTTAAAATGAACGGCAAATGGTACCT
GTTCACTGACTCCCGCGGATCAAAAATGACGATTGACGGCATTACGTCTAACGATATTTACATG
CTTGGTTATGTTTCTAATTCTTTAACTGGCCCATACAAGCCGCTGAACAAAACTGGCCTTGTGT
TAAAAATGGATCTTGATCCTAACGATGTAACCTTTACTTACTCACACTTCGCTGTACCTCAAGC
GAAAGGAAACAATGTCGTGATTACAAGCTATATGACAAACAGAGGATTCTACGCAGACAAAC
AATCAACGTTTGCGCCTAGCTTCCTGCTGAACATCAAAGGCAAGAAAACATCTGTTGTCAAAG
ACAGCATCCTTGAACAAGGACAATTAACAGTTAACAAATAAAAACGCAAAAGAAAATGCCGA
TATCCTATTGGCATTGACGTCAGGTGGCACACCTGCAGAGAACCTCTACTTCCAATCGCACCAT
CATCACCACCATGATTACAAGGATGACGACGATAAGTGAGGATCCGAATTCGAGCTCCGTCGA
CAAGCTTGCGGCCGCGGATCGATCGATATCTGACTAAATCTTAGTTTGTATTGTCATGTTTTAAT
ACAATATGTTATGTTTAAATATGTTTTTAATAAATTTTATAAAATAATTTCAACTTTTATTGTAACA
ACATTGTCCATTTACACACTCCTTTCAAGCGCGTGGGACTCGATGCTCGGCGCCACTCAAAGG
CGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGC
CAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCC
CCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTAT
AAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGC
TTACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCT

Claims (38)

1.一种分离的DNA多核苷酸,所述DNA多核苷酸适宜用于感兴趣的多肽在昆虫细胞中的异源表达,所述DNA多核苷酸包含:
(a)含有至少一种选自由以下组成的组的序列的启动子DNA多核苷酸:
(i)在每个末端具有或没有侧翼限制位点序列的SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:33、SEQ ID NO:36、SEQ ID NO:37或SEQ ID NO:68的核苷酸序列;
(ii)与(i)的任何一种序列具有至少80%序列同一性且在果蝇S2细胞中具有启动子活性的功能核苷酸序列;
(iii)为(i)或(ii)的任何一种序列的至少6个连续核苷酸的功能片段的核苷酸,所述功能片段在果蝇S2细胞中具有启动子活性;
(iv)与(iii)的所述功能片段具有至少80%序列同一性且在果蝇S2细胞中具有启动子活性的功能核苷酸序列;
(v)包含(i)、(ii)、(iii)和(iv)的任何一种序列的两种或更多种序列的第一嵌合核苷酸序列,和
(vi)在果蝇S2细胞中具有启动子活性的第二嵌合核苷酸序列,所述第二嵌合核苷酸序列包含至少6个核苷酸且包含来自(iii)和/或(iv)的至少两种核苷酸序列的连续核苷酸序列段,其中每个单独的所述连续核苷酸序列段在果蝇S2细胞中不具有启动子活性。
2.根据权利要求1所述的分离的DNA多核苷酸,其中所述启动子DNA多核苷酸包含选自由以下组成的组的序列:
在每个末端具有或没有侧翼限制位点序列的SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:33、SEQ ID NO:36、SEQ ID NO:37或SEQ ID NO:68的核苷酸序列。
3.根据权利要求1所述的分离的DNA多核苷酸,其中所述启动子DNA多核苷酸包含与SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:33、SEQ ID NO:36、SEQ ID NO:37或SEQ ID NO:68中的任何一种序列具有至少80%序列同一性的功能核苷酸序列,所述功能核苷酸序列在果蝇S2细胞中具有启动子活性。
4.根据权利要求1-3的任何一项所述的分离的DNA多核苷酸,其中所述启动子DNA多核苷酸包含是SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:33、SEQ ID NO:36、SEQ ID NO:37或SEQ ID NO:68的任何一种序列的至少6个连续核苷酸的功能片段的核苷酸,所述功能片段在果蝇S2细胞中具有启动子活性。
5.根据权利要求1-4的任何一项所述的分离的DNA多核苷酸,其中所述启动子DNA多核苷酸包含与SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:33、SEQ ID NO:36、SEQ ID NO:37或SEQ ID NO:68的任何一种序列的至少6个连续核苷酸的所述功能片段具有至少80%序列同一性的功能核苷酸序列,所述功能核苷酸序列在果蝇S2细胞中具有启动子活性。
6.根据权利要求1-5的任何一项所述的分离的DNA多核苷酸,其中所述启动子DNA多核苷酸包含嵌合核苷酸序列,所述嵌合核苷酸序列包含两种或更多种选自以下的序列:
(i)SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:33、SEQ ID NO:36或SEQ ID NO:37的核苷酸序列;
(ii)与(i)的任何一种序列具有至少80%序列同一性并且在果蝇S2细胞中具有启动子活性的功能核苷酸序列;
(iii)为(i)或(ii)的任何一种序列的至少6个连续核苷酸的功能片段的核苷酸,所述功能片段在果蝇S2细胞中具有启动子活性;和
(iv)与(iii)的所述功能片段具有至少80%序列同一性且在果蝇S2细胞中具有启动子活性的功能核苷酸序列。
7.根据权利要求1-6的任何一项所述的分离的DNA多核苷酸,其中所述启动子DNA多核苷酸包含权利要求1的(vi)所定义的嵌合核苷酸序列。
8.根据权利要求1-7的任何一项所述的分离的DNA多核苷酸,其中所述启动子DNA多核苷酸表现出与具有SEQ ID NO:1或SEQ ID NO:4的序列的任何一种启动子DNA多核苷酸的蛋白表达水平相比增高的蛋白表达水平。
9.根据权利要求8所述的分离的DNA多核苷酸,其中相对于具有SEQ ID NO:1或SEQ ID NO:4的序列的任何一种启动子DNA多核苷酸的蛋白表达水平,蛋白表达水平增高约50%到约300%。
10.根据权利要求8所述的分离的DNA多核苷酸,其中相对于具有SEQ ID NO:1或SEQ ID NO:4的序列的任何一种启动子DNA多核苷酸的蛋白表达水平或相对于pOPIE2启动子,蛋白表达水平增高2倍至10倍。
11.根据权利要求1-10的任何一项所述的分离的DNA多核苷酸,还包含选择性标记,比如选自由博来霉素选择性标记、新霉素选择性标记、潮霉素选择性标记、嘌呤霉素选择性标记和杀稻瘟素选择性标记组成的组的选择性标记。
12.根据权利要求11所述的分离的DNA多核苷酸,还包含细菌启动子,比如pKANR细菌启动子。
13.根据权利要求11或12任一项所述的分离的DNA多核苷酸,还包含适宜在昆虫细胞中驱动所述选择性标记表达的第二启动子DNA多核苷酸。
14.根据权利要求13所述的分离的DNA多核苷酸,其中所述第二启动子选自由以下组成的组:
(i)SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:33、SEQ ID NO:36、SEQ ID NO:37的核苷酸序列或包含SEQ ID NO:68的第7-586位残基的核苷酸序列;
(ii)与(i)中的任何一种序列具有至少80%序列同一性且在果蝇S2细胞中具有启动子活性的功能核苷酸序列;
(iii)为(i)或(ii)的任何一种序列的至少6个连续核苷酸的功能片段的核苷酸,所述功能片段在果蝇S2细胞中具有启动子活性;
(iv)与(iii)的所述功能片段具有至少80%序列同一性且在果蝇S2细胞中具有启动子活性的功能核苷酸序列;
(v)包含(i)、(ii)、(iii)和(iv)的任何一种序列的两种或更多种序列的第一嵌合核苷酸序列,和
(vi)在果蝇S2细胞中具有启动子活性的第二嵌合核苷酸序列,包含至少6个核苷酸且包含来自(iii)和/或(iv)的至少两种核苷酸序列的连续核苷酸序列段,其中每个单独的所述连续核苷酸序列段在果蝇S2细胞中不具有启动子活性。
15.根据权利要求1-14的任何一项所述的分离的DNA多核苷酸,还包含至少一种在多克隆位点上游和/或下游的遍在染色质开放元件。
16.根据权利要求1-15的任何一项所述的分离的DNA多核苷酸,还包含至少一种转录绝缘子元件,比如Gypsy(gsu(Hw))绝缘子序列。
17.根据权利要求1-16的任何一项所述的分离的DNA多核苷酸,还包含适宜在昆虫细胞中进行筛选的二氢叶酸还原酶(dhfr)编码序列。
18.根据权利要求1-17的任何一项所述的分离的DNA多核苷酸,还包含至少一种聚腺苷酸化信号序列,比如SV40聚腺苷酸信号和/或OPIE2聚腺苷酸信号。
19.根据权利要求1-18的任何一项所述的分离的DNA多核苷酸,还包含大肠杆菌的复制起点。
20.根据权利要求1-19的任何一项所述的分离的DNA多核苷酸,还包含至少一种蛋白输出信号多核苷酸序列,比如选自由BIP和CPY组成的列表中的一种。
21.根据权利要求1-20的任何一项所述的分离的DNA多核苷酸,所述DNA多核苷酸基本不含病毒DNA。
22.根据权利要求1-21的任何一项所述的分离的DNA多核苷酸,还包含至少一种HIS-标签序列。
23.根据权利要求1-22的任何一项所述的分离的DNA多核苷酸,还包含所述启动子DNA多核苷酸下游的用于编码感兴趣的多肽的基因插入所述分离的DNA多核苷酸的多克隆位点。
24.根据权利要求1-23的任何一项所述的分离的DNA多核苷酸,还包含至少一个来自SV40的72bp的元件。
25.根据权利要求1-24的任何一项所述的分离的DNA多核苷酸,还包含至少一种扩增调控元件。
26.根据权利要求1-25的任何一项所述的分离的DNA多核苷酸,还包含至少一种Ori-β元件。
27.根据权利要求1-26的任何一项所述的分离的DNA多核苷酸,还包含至少一种基质附着区(MAR)元件。
28.根据权利要求1-27的任何一项所述的分离的DNA多核苷酸,还包含至少一种来自乙型肝炎病毒的PRE元件,比如按照SEQ ID NO:40的来自乙型肝炎病毒的PRE元件,比如SEQ ID NO:40的第10位到第574位核苷酸。
29.根据权利要求1-28的任何一项所述的分离的DNA多核苷酸,其中所述启动子DNA多核苷酸序列调控与其连接的基因或其它DNA序列的表达。
30.根据权利要求1-29的任何一项所述的分离的DNA多核苷酸,还包含:至少一种核苷酸序列,所述核苷酸序列是SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:33、SEQ ID NO:36、SEQ ID NO:37或SEQ ID NO:68的核苷酸序列的任何一种序列的至少三个连续核苷酸的功能片段;和与其具有至少80%序列同一性的功能核苷酸序列,所述功能片段在果蝇S2细胞中具有启动子增强子活性。
31.根据权利要求1-30的任何一项所述的分离的DNA多核苷酸,还包含至少一种含有或不含侧翼限制位点的内含子,比如SEQ ID NO:60所示的内含子,所述内含子位于所述启动子DNA多核苷酸序列的下游和多克隆位点的上游。
32.根据前述权利要求的任何一项所述的分离的DNA多核苷酸,所述分离的DNA多核苷酸适于不依赖于连接的克隆(LIC)。
33.根据权利要求1-31的任何一项所述的分离的DNA多核苷酸,还包含至少一种与所述启动子DNA多核苷酸序列异源的编码多肽的多核苷酸序列。
34.含有根据权利要求1-33的任何一项所述的分离的DNA多核苷酸的细胞。
35.根据权利要求34所述的细胞,所述细胞是昆虫细胞,比如黑腹果蝇。
36.根据权利要求34或35所述的细胞,所述细胞被所述分离的DNA多核苷酸稳定转染。
37.一种用于生产由多核苷酸编码的感兴趣的多肽的方法,所述方法包括以下步骤:
(a)获得编码所述感兴趣的多肽的多核苷酸序列;
(b)将编码所述感兴趣的多肽的所述多核苷酸序列插入根据权利要求1-32的任何一项所述的分离的DNA多核苷酸中;
(c)用步骤(b)中获得的多核苷酸转化宿主细胞;
(d)允许步骤(b)中获得的所述多核苷酸表达以生产所述多肽;和
(e)从其获得所述多肽。
38.根据权利要求37所述的方法生产的多肽。
CN200980131122.1A 2008-06-12 2009-06-12 改良的蛋白表达系统 Active CN102119215B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP08158168 2008-06-12
EP08158168.8 2008-06-12
US6195908P 2008-06-16 2008-06-16
US61/061,959 2008-06-16
PCT/EP2009/057278 WO2009150222A2 (en) 2008-06-12 2009-06-12 Improved protein expression system

Publications (2)

Publication Number Publication Date
CN102119215A true CN102119215A (zh) 2011-07-06
CN102119215B CN102119215B (zh) 2015-04-08

Family

ID=41119927

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200980131122.1A Active CN102119215B (zh) 2008-06-12 2009-06-12 改良的蛋白表达系统

Country Status (10)

Country Link
US (1) US9371533B2 (zh)
EP (1) EP2307543B1 (zh)
JP (2) JP5374584B2 (zh)
KR (1) KR101633477B1 (zh)
CN (1) CN102119215B (zh)
AU (1) AU2009256566B2 (zh)
CA (1) CA2727628C (zh)
DK (1) DK2307543T3 (zh)
ES (1) ES2543730T3 (zh)
WO (1) WO2009150222A2 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105543275A (zh) * 2016-01-21 2016-05-04 湖南大学 双基因表达载体及其应用
CN113430227A (zh) * 2020-03-23 2021-09-24 佛山汉腾生物科技有限公司 制备稳定细胞池的方法、蛋白表达方法及试剂盒
CN113699264A (zh) * 2021-08-12 2021-11-26 贵州大学 一种识别普通小麦b组染色体的荧光原位杂交探针及其设计方法和应用

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013174889A1 (en) 2012-05-23 2013-11-28 Expres2Ion Biotechnologies Aps Novel drosophila s2 cell line
DE102019004812B4 (de) 2019-07-10 2021-03-18 Institut Virion-Serion GmbH Würzburg Rubella Virus Spike Konstrukt
KR20220144416A (ko) 2020-02-04 2022-10-26 큐어백 아게 코로나바이러스 백신
KR20230053008A (ko) 2020-05-29 2023-04-20 큐어백 에스이 핵산 기반 조합 백신
CA3170743A1 (en) 2020-08-31 2022-03-03 Susanne RAUCH Multivalent nucleic acid based coronavirus vaccines
WO2023196634A2 (en) 2022-04-08 2023-10-12 Flagship Pioneering Innovations Vii, Llc Vaccines and related methods
US20240042021A1 (en) 2022-08-01 2024-02-08 Flagship Pioneering Innovations Vii, Llc Immunomodulatory proteins and related methods
WO2024077118A2 (en) 2022-10-06 2024-04-11 Bicara Therapeutics Inc. Multispecific proteins and related methods

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW502065B (en) * 1993-05-28 2002-09-11 American Cyanamid Co Gene insertion by direct ligation in vitro
CN1186856A (zh) * 1996-12-31 1998-07-08 中国科学院武汉病毒研究所 含三个启动子的杆状病毒转移载体
JP2002523024A (ja) * 1998-07-31 2002-07-30 ケンブリッジ ユニバーシティ テクニカル サービシズ リミティド ヘルペスウイルスの潜伏活性調節配列及び遺伝子運搬のための潜伏不活性ヘルペスウイルス
US7135558B1 (en) * 1999-12-23 2006-11-14 Applera Corporation Isolated Drosophila proteins essential for survival nucleic acid molecules encoding essential Drosophila proteins, and uses thereof as insecticidal targets
CN1109105C (zh) * 2000-11-16 2003-05-21 中国科学院武汉病毒研究所 中国棉铃虫基因工程病毒
GB2404382B (en) 2003-07-28 2008-01-30 Oxitec Ltd Pest control
CN101586119B (zh) * 2009-05-15 2011-04-06 中国科学院水生生物研究所 含hsp70启动子和gfp的四膜虫转基因载体及制备方法和应用

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105543275A (zh) * 2016-01-21 2016-05-04 湖南大学 双基因表达载体及其应用
CN113430227A (zh) * 2020-03-23 2021-09-24 佛山汉腾生物科技有限公司 制备稳定细胞池的方法、蛋白表达方法及试剂盒
CN113699264A (zh) * 2021-08-12 2021-11-26 贵州大学 一种识别普通小麦b组染色体的荧光原位杂交探针及其设计方法和应用
CN113699264B (zh) * 2021-08-12 2023-06-16 贵州大学 一种识别普通小麦b组染色体的荧光原位杂交探针及其设计方法和应用

Also Published As

Publication number Publication date
EP2307543B1 (en) 2015-05-27
CA2727628C (en) 2018-11-27
KR20110039258A (ko) 2011-04-15
JP5374584B2 (ja) 2013-12-25
EP2307543A2 (en) 2011-04-13
JP2013188218A (ja) 2013-09-26
KR101633477B1 (ko) 2016-06-24
JP2011522554A (ja) 2011-08-04
WO2009150222A2 (en) 2009-12-17
WO2009150222A3 (en) 2010-05-27
CN102119215B (zh) 2015-04-08
DK2307543T3 (da) 2015-08-31
AU2009256566B2 (en) 2013-11-28
AU2009256566A1 (en) 2009-12-17
CA2727628A1 (en) 2009-12-17
ES2543730T3 (es) 2015-08-21
US20110136171A1 (en) 2011-06-09
WO2009150222A9 (en) 2010-07-29
US9371533B2 (en) 2016-06-21

Similar Documents

Publication Publication Date Title
CN102119215B (zh) 改良的蛋白表达系统
US11674128B2 (en) Engineering of a minimal SaCas9 CRISPR/Cas system for gene editing and transcriptional regulation optimized by enhanced guide RNA
Blomqvist et al. Natural genetic transformation: a novel tool for efficient genetic engineering of the dairy bacterium Streptococcus thermophilus
EP3625338A1 (en) Engineering of a minimal sacas9 crispr/cas system for gene editing and transcriptional regulation optimized by enhanced guide rna
WO2017045281A1 (zh) 一种弧菌通用的基因敲除自杀载体及其应用
CN108130342A (zh) 基于Cpf1的植物基因组定点编辑方法
CN109735567A (zh) 一种非洲猪瘟ep153r与p54基因共表达的重组腺病毒载体构建及腺病毒包装方法
KR20200106171A (ko) 스타필로코쿠스 박테리아의 영양 요구성 균주
KR20210110826A (ko) 하나 이상의 비-고유 꼬리 섬유를 가지는 비-복제성 형질도입 입자 및 형질도입 입자-기반 리포터 시스템
CN106755046B (zh) 一种改造芽孢杆菌基因组的方法
KR101641578B1 (ko) 프로모터 변이체 및 이를 이용한 단백질 생산방법
CN113667687B (zh) 基于ai-2分子响应的启动元件及其构建的大肠杆菌动态调控系统和方法
Freitas et al. Secretion of Streptomyces tendae antifungal protein 1 by Lactococcus lactis
Borovsky et al. Cloning, genetic engineering and characterization of TMOF expressed in Saccharomyces cerevisiae to control larval mosquitoes
KR101280503B1 (ko) 프로모터 변이체 및 이를 이용한 단백질 생산방법
US20140142164A1 (en) Densovirus-derived vector for gene transfer in insects
CN104805117A (zh) 一种提高拟南芥抗虫能力的方法
JP4159620B2 (ja) 組換えアデノウイルスの製造方法
CN117568377A (zh) 一种组成型表达dsRNA的重组无丙二醇柠檬酸杆菌及其应用
JP3713038B2 (ja) 組換えアデノウイルス
CN102952185B (zh) 一种新型防御素pdBD及其基因、和应用
KR101619316B1 (ko) 바실러스 프로모터 변이체 및 이를 이용한 단백질의 제조방법
WO2018148537A1 (en) Recombinant expression systems and products
Martinez et al. of Streptomyces noursei
JPH04169185A (ja) 高性能遺伝子コントロール配列

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant