CN113015801A - 基于内含子的通用克隆方法和组合物 - Google Patents

基于内含子的通用克隆方法和组合物 Download PDF

Info

Publication number
CN113015801A
CN113015801A CN201980075031.4A CN201980075031A CN113015801A CN 113015801 A CN113015801 A CN 113015801A CN 201980075031 A CN201980075031 A CN 201980075031A CN 113015801 A CN113015801 A CN 113015801A
Authority
CN
China
Prior art keywords
polynucleotide
intron
cleavage
sequence
nucleic acid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980075031.4A
Other languages
English (en)
Inventor
W·鲁施纳
W·迪特里奇
J·比肯菲尔德
M·施耐德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanofi SA
Original Assignee
Sanofi SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanofi SA filed Critical Sanofi SA
Publication of CN113015801A publication Critical patent/CN113015801A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/26Preparation of nitrogen-containing carbohydrates
    • C12P19/28N-glycosides
    • C12P19/30Nucleotides
    • C12P19/34Polynucleotides, e.g. nucleic acids, oligoribonucleotides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/66General methods for inserting a gene into a vector to form a recombinant vector using cleavage and ligation; Use of non-functional linkers or adaptors, e.g. linkers containing the sequence for a restriction endonuclease
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • C12N15/1031Mutagenizing nucleic acids mutagenesis by gene assembly, e.g. assembly by oligonucleotide extension PCR
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/50Fusion polypeptide containing protease site
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/42Vector systems having a special element relevant for transcription being an intron or intervening sequence for splicing and/or stability of RNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/30Phosphoric diester hydrolysing, i.e. nuclease
    • C12Q2521/313Type II endonucleases, i.e. cutting outside recognition site
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/50Other enzymatic activities
    • C12Q2521/501Ligase

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本发明涉及一种产生编码目标多肽的融合多核苷酸的方法。所述方法包括以下步骤:提供第一多核苷酸和第二多核苷酸,并且使所述第一多核苷酸和第二多核苷酸与IIs型限制性内切核酸酶和连接酶在允许所述IIs型限制性内切核酸酶切割所述第一多核苷酸和第二多核苷酸并连接所得切割产物的条件下接触,从而产生编码所述目标多肽的融合多核苷酸。所述第一多核苷酸包含内含子的5'部分,并且所述第二多核苷酸包含内含子的3'部分。本发明还设想编码目标多肽的多核苷酸,其在真核宿主细胞中转录时被转录为包含至少五个内含子的转录物,所述至少五个内含子对于所述多核苷酸是异源的。

Description

基于内含子的通用克隆方法和组合物
背景技术
重组DNA分子和允许将多个DNA片段组装成DNA的单一连续延伸段的分子克隆方法是分子生物学、生物技术和医学研究必不可少的工具。第一个重组DNA分子是在二十世纪六十年代末,在发现限制性酶和DNA连接酶之后不久制备的。从那以后,已经开发出多种方法来加快和促进重组DNA分子的产生。
通常通过操纵潜在编码DNA序列来进行蛋白质工程化。编码不同蛋白质结构域的DNA模块的定向组装对新型生物治疗形式的开发和优化至关重要。
分子克隆已经从克隆单一DNA片段进步到将多个DNA组分组装成DNA的单一连续延伸段。然而,仍然需要允许产生复杂构建体的有效技术(参见Endy,Nature 2005 Nov 24;438(7067):449-53)。特定地,需要一组标准且可靠的工程化机制来去除将遗传组分组装成更大系统期间的大量单调与意外(参见Knight,T.F.(2003).Idempotent Vector Designfor Standard Assembly of Biobricks.DOI:1721.1/21168)。
DNA模块(例如编码蛋白质结构域)通常通过酶切-粘贴(cut-and-paste)机制使用确定的侧翼前缀和后缀DNA序列来组装。经典地,前缀和后缀序列编码回文II型限制性位点。II型酶识别并切割同一位点的DNA并产生单链突出端,所述单链突出端可以与由相同限制性酶酶切的其他DNA模块融合。然而,目标DNA模块必须借助DNA操纵技术在5'和3'末端配备有合适的II型限制性位点,从而得到改变的/突变的一级核苷酸序列。此外,线性定向DNA模块组装需要几个独特的II型位点。组装通常需要几个克隆步骤,因为不同的II型限制性酶在反应条件方面通常不相容。
金门(Golden Gate)克隆是常用的分子克隆方法,其允许使用IIs型限制性酶和T4DNA连接酶将多个DNA片段同时且定向地组装成单一片段。Engler 2008,A one pot,onestep,precision cloning method with high throughput capability.PloS ONE 3.11:e3647;以及Engler等人2009,Golden gate shuffling:a one-pot DNA shuffling methodbased on type IIs restriction enzymes.PLoS ONE 4:e5553。与标准II型限制性酶如EcoRI和BamHI不同,IIs型限制性酶(如BsaI、BsmBI和BbsI)酶切在其识别序列外的DNA,并且因此可以产生非回文突出端。通过切割位点的适当设计,可以将IIs型限制性酶酶切的两个片段连接成缺少初始限制性位点的产物。
基于IIs型的限制-连接允许在单一克隆步骤中组装多个DNA片段。对于组装,DNA片段需要1至6bp长(例如3-4bp长)互补序列的延伸段,在所述延伸段的5'(前缀)和3'(后缀)末端以确定的距离和取向侧接有IIs型酶识别位点。在结合至识别位点后,IIs型酶在前缀和后缀核苷酸序列处切割DNA片段,从而去除实际识别位点,同时产生由连接序列组成的游离的5'和3'末端。然后使用这些连接序列在连接反应中将DNA片段与匹配/相容的连接序列融合在一起。因此,如果在两个不同的DNA片段之间5'前缀和3'后缀序列相同,那么这些片段可以在基于IIs型的限制-连接反应中无缝连接。
通常,在新项目的情况下,已经用于产生特定变体文库的DNA片段/模块不能重复利用(即重复组装),因为它们通常不展示相容的前缀和后缀序列。相反,模块需要进行重新设计以匹配不同的克隆策略(即前缀和后缀序列需要调整以允许连接)。这个方面非常耗时且成本高昂,特别是因为通常DNA片段/模块的4bp前缀和后缀序列需要进行修改,而前缀和后缀侧接的核心序列保持不变。
因此,本领域中所述的克隆策略的主要限制在于,它们仍然需要DNA模块内独特且相容的前缀和后缀序列以允许定向组装。在不同的蛋白质结构域和/或形式之间,这些前缀和后缀序列可能是不相容的,从而限制了这些方法的普遍适用性。
迄今为止,不存在产生如下通用DNA片段模块的有效方法:所述通用DNA片段模块可以被重复利用并且在基于IIs型的限制-连接反应中进行组装,不依赖其5'和3'前缀和后缀序列。
前体mRNA剪接是真核基因表达中必不可少的过程。在高等脊椎动物中,需要识别的靶内含子的长度范围为<50nt至>500.000nt。在人类中,长度为约90nt至约2000nt的内含子在前体mRNA内最常被发现。然而,也已经描述了短或甚至超短内含子序列。例如,已经在秀丽隐杆线虫(C.elegans)(<40nt)、拟南芥(Arabidopsis thaliana)(约20-59nt)和人组织(<65nt)中发现了短内含子(Hong等人2006,Intron size,abundance,and distributionwithin untranslated regions of genes.Molecular biology and evolution,23(12),2392-2404;Shimada等人,2015,Identification and validation of evolutionarilyconserved unusually short pre-mRNA introns in the humangenome.Int.J.Mol.Sci.2015,16,10376-10388)。
前体mRNA中位于内含子与外显子之间的边界处的内含子也被称为剪接体内含子。RNA剪接去除非编码RNA内含子,保留外显子,然后将其剪接并接合在一起以形成最终mRNA(“成熟mRNA”)。
仍然非常需要快速且简单地产生允许表达多个目标基因的重组DNA分子。尤其非常需要用于产生如下通用DNA片段模块的手段和方法:所述通用DNA片段模块可以被重复利用并且在基于IIs型的限制-连接反应中进行组装,不依赖其5'末端和3'末端(即前缀和后缀序列)。
发明内容
可以将本发明的根本技术问题视为提供用于满足前述需求的手段和方法。所述技术问题是通过在权利要求书和下文中表征的实施方案来解决的。
因此,在某些方面,本发明涉及一种产生编码目标多肽的融合多核苷酸的方法。在某些实施方案中,所述方法包括使第一和第二多核苷酸与IIs型限制性内切核酸酶和连接酶在允许所述IIs型限制性内切核酸酶切割第一多核苷酸和第二多核苷酸并连接所得切割产物的条件下接触,从而产生编码所述目标多肽的融合多核苷酸。在某些实施方案中,所述第一和所述第二多核苷酸各自包含内含子序列,所述内含子序列包含对于IIs型限制性内切核酸酶的识别和切割位点,所述位点在切割后产生互补末端,所述互补末端可以相互连接使得产生编码所述目标多肽的融合多核苷酸。在某些实施方案中,所述第一多核苷酸包含内含子的5'部分,并且所述第二多核苷酸包含内含子的3'部分。
在另一方面,本发明进一步涉及包含第一、第二和第三多核苷酸的组合物。本发明还设想编码目标多肽的多核苷酸,其在真核宿主细胞中转录时被转录为包含至少五个内含子的转录物,所述至少五个内含子对于所述多核苷酸是异源的。
在前述方法的实施方案中,所述第一多核苷酸在5'至3'方向上包含以下元件:
(i)编码所述目标多肽的第一部分的核酸序列,
(ii)编码第一内含子的5'部分的核酸序列,
(iii)对于IIs型限制性内切核酸酶的第一切割序列,以及
(iv)对于所述IIs型限制性内切核酸酶的识别序列,其中(iii)中的所述切割序列与(iv)中的所述识别序列可操作地连接。
在前述方法的实施方案中,所述第二多核苷酸在5'至3'方向上包含以下元件:
(i)对于所述IIs型限制性内切核酸酶的识别序列,
(ii)对于所述IIs型限制性内切核酸酶的第二切割序列,其中所述第二切割序列与所述第一切割序列互补,其中(ii)中的所述第二切割序列与(i)中的所述识别序列,即与所述第二多核苷酸的识别序列可操作地连接,
(iii)编码所述第一内含子的3'部分的核酸序列,以及
(iv)编码所述目标多肽的第二部分的核酸序列。
因此,本发明涉及一种产生编码目标多肽的融合多核苷酸的方法,所述方法包括以下步骤:
(a1)提供第一多核苷酸,所述第一多核苷酸在5'至3'方向上包含:
(i)编码所述目标多肽的第一部分的核酸序列,
(ii)编码第一内含子的5'部分的核酸序列,
(iii)对于IIs型限制性内切核酸酶的第一切割序列,以及
(iv)对于所述IIs型限制性内切核酸酶的识别序列,其中(iii)中的所述切割序列与(iv)中的所述识别序列,即与所述第一多核苷酸的识别序列可操作地连接;
(a2)提供第二多核苷酸,所述第二多核苷酸在5'至3'方向上包含:
(i)对于所述IIs型限制性内切核酸酶的识别序列,
(ii)对于所述IIs型限制性内切核酸酶的第二切割序列,其中所述第二切割序列与所述第一切割序列互补,其中(ii)中的所述第二切割序列与(i)中的所述识别序列,即与所述第二多核苷酸的识别序列可操作地连接,
(iii)编码所述第一内含子的3'部分的核酸序列,以及
(iv)编码所述目标多肽的第二部分的核酸序列,以及
(b)使所述第一多核苷酸和第二多核苷酸与IIs型限制性内切核酸酶和连接酶在允许所述IIs型限制性内切核酸酶切割所述第一多核苷酸和所述第二多核苷酸并连接所得切割产物的条件下接触,从而产生编码所述目标多肽的融合多核苷酸。
所产生的多核苷酸包含第一内含子,即应编码所述第一内含子。所述第一内含子应是功能性的并且应包含编码所述第一内含子的5'部分的核酸序列和编码所述第一内含子的3'部分的核酸序列。
因此,所产生的融合多核苷酸应在5'至3'方向上包含:
(aa)编码所述目标多肽的第一部分的核酸序列,
(bb)编码第一内含子的核酸序列,其中所述第一内含子是功能性的,并且其中所述第一内含子包含编码所述第一内含子的5'部分的核酸序列和编码所述第一内含子的3'部分的核酸序列,以及
(cc)编码所述目标多肽的第二部分的核酸序列。
本发明的方法允许产生编码目标多肽的融合多核苷酸。因此,所述方法是克隆方法。此类方法通常在体外进行。本发明的方法并不限于上文明确提到的步骤,并且因此可以包含除了这些步骤以外的步骤。例如,其他步骤可以涉及将另外的多核苷酸序列连接至本发明的融合多核苷酸。例如,如下文所述,本发明的方法不仅允许产生包含如上所述的元件(aa)、(bb)和(cc)的融合多核苷酸,而且允许产生包含另外的元件的融合多核苷酸,所述另外的元件如编码所述目标多肽的第三、第四、第五、第六、第七、第八、第九、第十等部分的核酸序列。此外,另外的多核苷酸可以用于所述连接。此类多核苷酸可以编码所述多核苷酸的5'非翻译区(5'UTR)和3'非翻译区(3'UTR),所述多核苷酸编码所述目标多肽。因为这些序列进行转录但不进行翻译,可以应用如本文所述的基于内含子的克隆方法。
此外,其他步骤可以涉及将所述融合多核苷酸克隆至载体如表达载体中,将所述融合多核苷酸或包含所述融合多核苷酸的载体引入合适的宿主细胞如哺乳动物细胞中,和/或从所述宿主细胞或培养基/上清液分离(即纯化)所述多肽。所述纯化过程可以通过所述目标多肽中合适的标签(例如His标签)的存在来支持。
如本文所用术语“多核苷酸”应是指核糖核酸(RNA),或者具体是指脱氧核糖核酸(DNA)。除非另外陈述,否则本文中的术语“多核苷酸”是指DNA多核苷酸的单链,或者具体是指双链DNA多核苷酸。所述双链DNA应在本发明的方法的步骤(b)期间暂时包含在一个或多个末端处的一个或两个单链突出端。这取决于所述多核苷酸中存在的切割序列(即切割位点)的数量:如果存在一个切割位点,那么所述多核苷酸在一个末端包含一个单链突出端,如果存在两个切割序列,那么所述多核苷酸包含两个单链突出端(每个末端包含一个)。所述突出端是通过用IIs型内切核酸酶切割得到的,并且允许将片段按预定顺序连接(如本文其他地方所述)。
多核苷酸的长度表示为碱基对或核苷酸的数量。除非另有陈述,否则两个术语可互换使用,不管相应核酸是单链还是双链核酸。同样,因为多核苷酸是通过其相应的核苷酸序列定义的,术语核苷酸/多核苷酸和核苷酸序列/多核苷酸序列可互换使用。
应通过本发明产生的多核苷酸应为融合多核苷酸,并且因此应通过融合多个多核苷酸来产生。特定地,所述融合多核苷酸应通过以下方式来产生:使本文的第一多核苷酸和第二多核苷酸以及任选地至少一种其他多核苷酸(如第三、第四、第五、第六、第七、第八、第九、第十等多核苷酸)与IIs型限制性内切核酸酶和连接酶在允许所述IIs型限制性内切核酸酶切割所述第一多核苷酸和第二多核苷酸(以及(如果存在的话)所述至少一种其他多核苷酸,如第三、第四、第五、第六、第七、第八、第九、第十等多核苷酸)并连接所得切割产物的条件下接触,从而产生编码所述目标多肽的融合多核苷酸。
根据本发明的方法的步骤(a1)和(a2),应提供第一和第二多核苷酸。如何提供多核苷酸是本领域中熟知的。在实施方案中,所提供的多核苷酸源自聚合酶链式反应(PCR)(即通过其产生)。在另一实施方案中,所述多核苷酸源自人工基因合成(即通过其产生)。这也适用于如本文其他地方所提及的第三、第四、第五、第六、第七、第八、第九和第十等多核苷酸。在实施方案中,所提供的多核苷酸存在于载体中,即由载体所包含。在可替代实施方案中,所述多核苷酸是作为线性DNA片段来提供。
如在本发明的方法的步骤(a1)中所提及的第一多核苷酸应在5'至3'方向上包含以下元件:
(i)编码所述目标多肽的第一部分的核酸序列,
(ii)编码第一内含子的5'部分的核酸序列,
(iii)对于IIs型限制性内切核酸酶的第一切割序列,以及
(iv)对于所述IIs型限制性内切核酸酶的识别序列,其中(iii)中的所述第一切割序列与(iv)中的所述识别序列可操作地连接。
如在本发明的方法的步骤(a1)中所提及的第二多核苷酸应在5'至3'方向上包含以下元件:
(i)对于所述IIs型限制性内切核酸酶的识别序列,
(ii)对于所述IIs型限制性内切核酸酶的第二切割序列,其中所述第二切割序列与第一切割序列互补,其中(ii)中的所述第二切割序列与(i)中的所述识别序列,即与所述第二多核苷酸的识别序列可操作地连接,
(iii)编码所述第一内含子的3'部分的核酸序列,以及
(iv)编码所述目标多肽的第二部分的核酸序列。
如在步骤(a1)的项目(i)下所述的核酸序列应编码所述目标多肽的第一部分,并且在步骤(a2)的项目(iv)下的核酸序列应编码所述多肽的第二部分。通常,根据本发明编码应编码如本文所提及的目标多肽的一部分的核酸序列具有至少10、至少50或至少200bp的长度。所述核酸序列应包含所述编码序列的一部分。因此,所述多肽的所述部分可以具有至少1个氨基酸、至少约3个氨基酸、至少约15个氨基酸或至少约50个氨基酸的长度。因此,所述部分可以具有从最少1个氨基酸至任何可行长度(例如100个氨基酸、500个氨基酸、1000个氨基酸或更多)的长度。在本发明的方法的实施方案中,所述部分包含蛋白质结构域。因此,所述部分可以具有例如100至150个氨基酸的长度。
编码多肽的第一部分的核酸序列还可以包含5'非翻译区(5'UTR)。编码多肽的最后部分(即C末端)的多核苷酸还可以包含3'非翻译区(3'UTR)。
编码所述目标多肽的第一部分的核酸序列优选地是所述融合多核苷酸的第一外显子。因此,所述核酸序列应编码所得转录物的第一外显子。编码所述目标多肽的第二部分的核酸序列优选地是所述融合多核苷酸的第二外显子。编码所述目标多肽的第三部分的核酸序列优选地是所述融合多核苷酸的第三外显子,等等。
所产生的融合多核苷酸包含的外显子由功能性内含子隔开。例如,所述第一外显子与所述第二外显子由第一内含子隔开。所述融合多核苷酸中的其他外显子(如果存在的话)优选地也由功能性内含子隔开。因此,如果存在第三外显子,那么所述第二外显子与所述第三外显子由第二内含子隔开,并且如果存在第四外显子,那么所述第三外显子与所述第四外显子由第三内含子隔开,等等。在实施方案中,所述融合多核苷酸包含的内含子是相同的,即具有相同序列。在另一实施方案中,所述融合多核苷酸包含的内含子具有不同序列。在此实施方案中,例如,可以使用不同基因和/或不同生物体的内含子。所述内含子也可以是人工内含子,即在自然界中不存在的内含子。例如,人工内含子可以通过将来自两个不同内含子的5'和3'部分组合,或者通过使天然存在的内含子突变来设计。天然存在的内含子可以通过添加、替代或缺失一个或多个核苷酸来突变。图7显示,含有另外的核苷酸的内含子可以从包含所述内含子的转录物有效剪接出来。
根据本发明,通过本发明的方法产生的融合多核苷酸应在真核宿主细胞中表达(即转录),以产生所述目标多肽。由所述融合多核苷酸的表达产生的未加工的转录物(即前体信使RNA(前体mRNA))应包含由所述融合多核苷酸编码的所有外显子和内含子序列。所述转录物在所述真核细胞中进行加工,使得将内含子(或多个内含子)从所述转录物剪接出来,从而产生编码所述目标多肽的信使RNA(mRNA),即被翻译为所述目标多肽的mRNA。由于通过剪接从前体mRNA去除内含子,所述mRNA仅包含外显子序列。
在本发明所涵盖的研究中已经显示,并非所有测试的内含子都从产生的转录物剪接出来。因此,本发明的方法可以包括评估当在真核宿主细胞中表达时,通过本发明的方法产生的融合多核苷酸是否允许产生所述目标多肽的其他步骤。该评估可以通过评估所产生的多肽(例如其活性)来进行。
具体实施方式
术语“内含子”是本领域所熟知的。如本文所用,所述术语是指存在于未加工的转录物内的核苷酸序列,所述核苷酸序列能够被真核宿主细胞从转录物剪接(即切除)。所述未加工的转录物通常也被称为前体信使RNA(前体mRNA)。从未加工的转录物剪接内含子发生于已加工转录物(即成熟信使RNA)的翻译之前。原则上,可以使用功能性的(特别是在其中应表达如本文所提及的融合多核苷酸的宿主细胞中是功能性的)任何内含子。这种内含子可以是天然存在的内含子或人工内含子,即在自然界中不存在但是功能性的内含子。包含功能性剪接位点的人工内含子描述于例如Gatermann等人,Mol.Cell Biol.,9:1526(1989)中。
如上所述,融合多核苷酸包含的一个或多个内含子应是功能性的。结合内含子的术语“功能性”是技术人员充分理解的。功能性的内含子通常是能够从在真核宿主细胞中表达的转录物(特别是从前体mRNA)剪接出来的内含子。可以通过熟知的方法来评估内含子是否是功能性的。例如,可以分析所表达蛋白质的活性以评估内含子是否已被剪接出来。融合多核苷酸当在真核宿主细胞中转录时被转录为在所述细胞中进行加工的转录物,使得功能性内含子被从所述转录物剪接出来,从而产生编码所述目标多肽的mRNA。如果融合多核苷酸包含一个或多个其他内含子(如第二内含子),那么所述其他内含子也被从转录物剪接出来(以产生编码目标多肽的mRNA)。
在本发明的优选实施方案中,术语“内含子”是指剪接体内含子(有时称为核前体mRNA内含子)。如本领域中已知,剪接体内含子包含位于内含子与外显子之间的边界处的特定内含子序列。这些序列被剪接体RNA分子识别(参见例如,Sperling(2016):WIREsRNA2016.doi:10.1002/wrna.1377;Shefer等人(2014):Comp.Struct.Biotechnol.J.11,113)。
在本发明的实施方案中,功能性的内含子包含剪接供体位点、分支点、聚嘧啶束和剪接受体位点。所述元件是本领域中熟知的。剪接供体位点由内含子5'末端的GU(GT)序列组成。剪接受体位点位于内含子的3'末端并且因此终止内含子。所述受体位点由AG序列组成。分支点包括参与套索结构形成的腺嘌呤核苷酸。聚嘧啶束富含嘧啶核苷酸并且通常具有15-20nt的长度。通常,其位于要剪接的内含子的3'末端之前约5-40nt处。所述束促进剪接体的组装。
如本文所用,术语“内含子”是指编码内含子的核酸序列以及所述序列的转录物中的相应序列二者。
融合多核苷酸包含的内含子可以具有任何长度(只要它是功能性的)。在本发明的方法的实施方案中,编码内含子的核酸(即包含内含子的连接的5'和3'部分的功能性内含子)具有40至2000bp的长度,具体而言50至1000bp的长度。因此,由融合多核苷酸编码的一个或多个内含子(即转录物包含的一个或多个内含子(如第一、第二和/或第三内含子))应具有40至2000nt,具体而言50至1000nt的长度。
在实施方案中,根据本发明使用的内含子(即由融合多核苷酸编码的转录物包含的内含子)是短内含子。此类内含子的使用是有利的,因为这会减小通过本发明的方法产生的融合多核苷酸的大小并使其更易于操作。此外,如与大内含子相比,通过基因合成来合成小内含子与较低成本相关。如本文所提及的短内含子通常具有小于500nt的长度。在实施方案中,短内含子具有50至200nt的长度。在另一实施方案中,短内含子具有50至150nt的长度。在另一个实施方案中,短内含子具有50至100nt的长度。例如,转录物中存在的每个内含子可以具有50至200nt的长度,如50至150nt的长度或50至100nt的长度。因此,设想编码内含子的多核苷酸(即功能性内含子)具有50至200bp,具体而言50至150bp或50至100bp的长度。
功能性的超短内含子已经描述于本领域中。例如,超短内含子已经描述于以下文献中:Shimada等人,2015(Identification and validation of evoluti onarilyconserved unusually short pre-mRNA introns in the humangenome.Int.J.Mol.Sci.2015,16,10376-10388)。
根据本发明进行的研究已经显示,长于80个核苷酸的内含子的组合通常产生比含有超短内含子的那些组合更高的表达水平(参见例如,实施例章节中内含子I8和I9的结果)。在优选实施方案中,所产生的多核苷酸的一个或多个内含子因此具有至少80个核苷酸,具体而言至少90个核苷酸的长度。在优选实施方案中,一个或多个内含子具有80至200nt的长度。在另一实施方案中,一个或多个内含子具有80至150nt的长度。在另一个实施方案中,内含子(例如转录物中存在的每个内含子)具有80至120nt的长度。此外,设想所述一个或多个内含子具有90至150nt或90至120nt的长度。
优选地,由所产生的多核苷酸编码的一个或多个内含子具有n个核苷酸的长度,其中n是不能被三整除的整数。因此,由所产生的多核苷酸编码的一个或多个内含子(具体而言每个所述内含子)可以具有n个核苷酸的长度,其中n是在除以三时得不到整数的整数。例如,所述一个或多个内含子可以具有91、92、94、95、97、98、100、101、103、104、106、107、109、110、112、113、115、116、118或119nt的长度。
在本发明的方法的实施方案中,要使用的一个或多个内含子选自用于本发明所涵盖的研究中的内含子。特定地,所述内含子可以是如实施例章节的表1中所示的内含子I2、I3、I4、I5或I7(如I2、I4、I5或I7)以及特定地I8或I9,或者如表2中所示的其功能性变体。这些内含子的序列显示于实施例章节的表3中。
在本发明的方法的实施方案中,本发明的多核苷酸包含的至少一个内含子(如第一内含子)包含与编码目标多肽的核酸序列的开放阅读框同框的内部终止密码子。因此,至少一个内含子可以包含一个或多个框内终止密码子。此外,设想,如果融合多核苷酸包含超过一个内含子(如第一和第二内含子),那么所有内含子都包含与编码目标多肽的核酸序列的开放阅读框同框的内部终止密码子。因此,多核苷酸的每个内含子可以包含与编码目标多肽的核酸序列的开放阅读框同框的一个或多个内部终止密码子。在不完全剪接的情况下,一个或多个内部终止密码子的存在将导致产生截短的多肽。此类截短的多肽可以由于其较短的长度而与目标多肽分离。
RNA中的终止密码子是例如UAG(琥珀型)、UAA(赭石型)、UGA(蛋白石型)。相应DNA序列是TAG、TAA和TGA。
在一些实施方案中,所述一个或多个内含子在编码如本文所述的融合多肽的多核苷酸的每个开放阅读框中包含至少一个终止密码子。因此,所述一个或多个内含子可以在所有三个开放阅读框中包含至少一个终止密码子。
如在本文其他地方已解释,通过本发明的方法产生的融合多核苷酸包含的功能性内含子包含编码内含子(例如第一内含子)的5'部分的核酸序列和编码内含子(例如第一内含子)的3'部分的核酸序列。通过本发明的方法产生的融合多核苷酸包含的一个或多个功能性内含子应通过组合功能性内含子的5'末端与功能性内含子的3'末端来产生。所述组合是在本发明的方法的步骤(b)中经由相容的(即互补的)突出端来实现,所述突出端是通过用IIs型限制性内切核酸酶切割第一、第二(以及(如果存在)第三、第四、第五等)多核苷酸得到的。所述切割和所述连接优选地同时进行。因此,所述多核苷酸是通过所谓的金门克隆来组合,即在反应中以所需顺序融合片段,所述反应包含在IIs型限制性内切核酸酶(即活性IIs型限制性内切核酸酶)和连接酶二者的存在下用IIs型限制性内切核酸酶切割多核苷酸并连接切割产物。
根据本发明,设想如本文所提及的内含子的5'部分和3'部分不是功能性的,即不是功能性内含子。优选地,内含子的所述部分不包含从转录物剪接出来所需的所有元件。根据本发明,设想编码内含子的5'部分的核酸序列不包含剪接受体位点。所述位点应由编码内含子的3'部分的核酸序列包含。此外,设想编码内含子的3'部分的核酸序列不包含剪接供体位点。所述位点应由编码内含子的5'部分的核酸序列包含。
由于并非剪接所需的所有元件都存在,所述部分在单独存在于转录物中(即不含相应的5'或3'部分)时,不能从所述转录物剪接出来。内含子的功能性是通过连接分别包含内含子的5'部分和3'部分的两个多核苷酸来实现的,如本文中其他地方所述。
编码内含子5'和3'部分的序列可以具有认为合适的任何长度。所述部分的最小长度是通过用在本发明的方法中应用的限制性内切核酸酶切割产生的突出端的长度。在实施方案中,内含子的5'部分至少包含剪接供体位点,并且内含子的3'部分至少包含剪接受体位点。通常,5'部分和3'部分各自具有至少10nt或至少20nt的长度。在实施例章节中测试的部分的长度为12nt至98nt(参见表4)。
在本发明的方法的实施方案中,内含子上的5'和3'部分源自单一内含子。在本发明的方法的另一实施方案中,内含子的5'和3'部分源自两个不同的内含子。因此,通过组装如本文所提及的多核苷酸,产生人工内含子。
在本发明的实施方案中,如本文所提及的至少一个功能性内含子(如第一内含子)对于天然存在的编码目标多肽的多核苷酸是异源的。在本发明的实施方案中,功能性内含子(如第一内含子)、多个功能性内含子和/或如本文所提及的内含子的5'和/或3'部分对于编码目标多肽的融合多核苷酸是异源的。因此,融合多核苷酸可能不具有天然存在的多核苷酸的序列。在本发明的实施方案中,功能性内含子(如第一内含子)、多个功能性内含子和/或如本文所提及的内含子的5'和/或3'部分对于天然存在的编码目标多肽的多核苷酸是异源的。对于融合多核苷酸是异源的多核苷酸(如一个或多个内含子或其部分)优选地是融合多核苷酸中并非天然存在的多核苷酸(例如内含子或其部分)的多核苷酸。在实施方案中,融合多核苷酸包含的所有内含子(如第一、第二、第三等内含子)对于所述融合多核苷酸是异源的。
这也适用于如本文所提及的内含子的5'部分和3'部分,即设想所述部分对于包含它们的多核苷酸是异源的。特定地,编码内含子的5'部分或3'部分的核酸序列对于编码目标多肽的所述部分的核酸序列应是异源的。例如,编码第一内含子的5'部分的核酸序列对于编码目标多肽的第一部分的核酸序列应是异源的,或者编码第一内含子的3'部分的核酸序列对于编码目标多肽的第二部分的核酸序列应是异源的。
此外,设想功能性内含子(多个功能性内含子)位于融合多核苷酸的位置(融合多核苷酸的多个位置),所述位置并非天然地(即当它在其生物基因组环境中时)包含内含子。
编码目标多肽的一部分的第一、第二、第三、第四、第五等多核苷酸应包含对于IIs型限制性内切核酸酶的至少一个切割序列,以及对于所述IIs型限制性内切核酸酶的至少一个识别序列。所述IIs型限制性内切核酸酶在本发明的方法的步骤(b)中与连接酶组合用于产生融合多核苷酸。所述产生是通过按预定顺序组装多个多核苷酸来实现。
术语“IIs型限制性内切核酸酶”是技术人员充分理解的。如本文所用,所述术语是指内切核酸酶(通常也称为“限制性酶”),其切割在其识别序列外的DNA。已知IIs型酶切割距离其识别序列0至20bp的DNA。要根据本发明的方法使用的IIs型限制性内切核酸酶优选地识别不对称双链DNA序列,并且切割在所述双链DNA上的识别序列外的双链DNA。单链突出端(“粘性末端”)是通过用内切核酸酶切割产生的。通过要根据本发明的方法使用的内切核酸酶产生的突出端通常具有3、4、5或6个核苷酸的长度。如技术人员已知,这取决于所用IIs型限制性内切核酸酶的特异性。然而,通过某些IIs型限制性内切核酸酶产生更长的突出端也是可能的。在实施方案中,IIs型限制性内切核酸酶应在切割后产生3个核苷酸的突出端。在另一实施方案中,其应产生4个核苷酸的突出端。对于产生4bp的突出端的内切核酸酶,256个(即,44个)潜在突出端序列是可能的。因此,多达256个多核苷酸可以按正确顺序组装。
因为IIs型限制性内切核酸酶切割在其识别序列(本文中也称为“识别位点”)外(即不被识别序列所包含)的切割序列(本文中也称为“切割位点”)中的DNA,本发明的前述方法的步骤(a)中提供的第一、第二、第三等多核苷酸同时包含识别序列和切割序列。切割序列应与识别序列可操作地连接。这意味着,在内切核酸酶识别多核苷酸中的识别序列之后,所述多核苷酸在切割位点被所述内切核酸酶切割。
本领域中已知,切割只会发生在切割位点与识别位点之间的限定距离处。例如,大多数(但并非所有)IIs型限制性内切核酸酶需要在识别序列与切割序列之间存在间隔子。因此,间隔子必须存在于识别序列与切割序列之间(如果内切核酸酶需要间隔子)。间隔子由一个或多个核苷酸组成。间隔子的长度取决于所应用的限制性内切核酸酶。例如,BsaI在一个核苷酸后(在5'至3'方向上)切割一条链。因此,在识别序列与切割序列之间必须存在一个核苷酸的间隔子,以允许该酶在切割位点切割。其他内切核酸酶可能需要更长的间隔子。例如,如果所应用的内切核酸酶将是FokI,那么将需要具有九个核苷酸的长度的间隔子。
此外,本领域中已知,一些IIs型限制性内切核酸酶可能是甲基化敏感的,并且因此不能在甲基化的胞嘧啶残基处切割,从而使甲基化的DNA保持完整。为了避免IIs型酶的活性被其相应识别序列中或附近的甲基化序列阻断,使要切割的多核苷酸延长一个或两个核苷酸,使得避开潜在的已知甲基化位点。如果识别位点位于多核苷酸的5'末端,那么将一个或多个另外的核苷酸添加至多核苷酸的5'末端。如果识别位点位于多核苷酸的3'末端,那么将一个或多个另外的核苷酸添加至多核苷酸的3'末端。因此,本文所述的多核苷酸还可以在5'末端或3'末端(取决于识别位点的位置)包含一个或两个核苷酸。
识别序列是被IIs型内切核酸酶识别的序列。切割序列优选地是在所述内切核酸酶的存在下被切割的序列,即能够被所述内切核酸酶切割的序列。应理解,识别位点必须具有正确取向,以允许在切割位点切割并随后进行连接。如技术人员将理解,识别位点的取向取决于切割应发生在多核苷酸的5'末端还是3'末端。在5'末端,切割应在5'至3'方向上发生。在3'末端,切割应在3'至5'方向上发生。
因此根据本发明,如在用于产生融合多核苷酸的方法的步骤(a)中所提及的多核苷酸包含的一个或多个切割序列和识别序列的排列应使得,在用内切核酸酶切割后,从所述多核苷酸(例如第一、第二、第三等多核苷酸)去除一个或多个识别序列。这是通过将一个或多个识别序列置于相对于切割序列呈正确取向(即上游或下游)来实现的。例如,可以将一个或多个识别序列以正确取向置于所述多核苷酸的一个或多个末端。因此,如果如本文所提及的多核苷酸应在5'末端处被切割,那么对于IIs型限制性内切核酸酶的识别序列应位于所述多核苷酸的5'末端,之后是切割序列。因此,切割序列位于所述识别序列的下游。如果如本文所提及的多核苷酸应在3'末端处被切割,那么对于IIs型限制性内切核酸酶的识别序列应位于所述多核苷酸的3'末端。在这种情况下,切割序列位于所述识别序列的上游。应理解,不需要将一个或多个识别序列置于所述多核苷酸的一个或多个末端处。相反,可能存在另外的核苷酸。例如,可以将另外的核苷酸添加至多核苷酸的3'末端。
在包含编码内含子的5'部分的核酸序列的多核苷酸中,对于IIs型限制性内切核酸酶的切割序列应位于对于所述IIs型限制性内切核酸酶的识别序列之前。在包含编码内含子的3'部分的核酸序列的多核苷酸中,对于IIs型限制性内切核酸酶的识别序列应位于对于所述IIs型限制性内切核酸酶的切割序列之前。
在实施方案中,如本文所提及的多核苷酸(即第一、第二、第三等多核苷酸)包含的切割序列是(要连接的)内含子的5'或3'部分的一部分。例如,第一多核苷酸中编码第一内含子的5'部分的核酸序列包含对于IIs型限制性内切核酸酶的第一切割序列。例如,第二多核苷酸中编码第一内含子的3'部分的核酸序列包含对于IIs型限制性内切核酸酶的第二切割序列。在连接后,所得内含子包含所述内含子的5'部分、切割位点和所述内含子的3'部分(本文中也称为功能性内含子)。识别序列不复存在。
切割序列可以是天然存在于如本文所述的内含子中的序列。可替代地,切割序列可能并非天然存在于内含子中。在这种情况下,可以将切割序列添加至内含子(例如通过插入),或者可以通过将点突变引入天然存在的内含子的序列中来产生切割序列。
大量IIs型限制性内切核酸酶可商业购得。在实施方案中,IIs型限制性内切核酸酶选自AcuI、AlwI、BaeI、BbsI、BbvI、BccI、BceAI、BcgI、BciVI、BcoDI、BfuAI、BmrI、BpmI、BpuEI、BsaI、BsaXI、BseRI、BsgI、BsmAI、BsmBI、BsmFI、BsmI、BspCNI、BspMI、BspQI、BsrDI、BsrI、BtgZI、BtsCI、BtsI、BtsIMutI、CspCI、EarI、EciI、FauI、FokI、HgaI、HphI、HpyAV、MboII、MlyI、MmeI、MnlI、NmeAIII、PleI、SapI和SfaNI。优选地,IIs型限制性内切核酸酶选自:BsaI、BbsI、FokI、BsmBI、BtgZI和SapI。
第二多核苷酸应包含与第一切割序列互补的第二切割序列。根据本发明,短语“与另一切割序列互补的切割序列”(如与第一切割序列互补的第二切割序列)优选地意味着,通过用内切核酸酶切割产生的突出端是相互互补的,即相容的。
在本发明的实施方案中,仅使用一种IIs型限制性内切核酸酶。所述内切核酸酶识别要组装的多核苷酸(第一、第二等多核苷酸)包含的所有识别序列。在本发明的可替代实施方案中,使用具有不同识别位点的不同IIs型限制性内切核酸酶,例如两种、三种或更多种不同IIs型限制性内切核酸酶。所述不同内切核酸酶应产生理想地具有相同长度(例如4nt)和互补序列的突出端,以允许连接所切割的多核苷酸。
此外,设想要组装的多核苷酸不含用于要使用的IIs型限制性内切核酸酶的其他识别序列,即它们应不含除了如本文所提及的识别序列以外的识别序列,以防止在不期望的位置切割。技术人员应考虑到这一点。
在本发明的前述方法的步骤(b)中,使步骤(a)中提供的多核苷酸与IIs型限制性内切核酸酶和连接酶在允许所述IIs型限制性内切核酸酶切割第一多核苷酸和第二多核苷酸并连接所得切割产物的条件下接触,从而产生编码所述目标多肽的融合多核苷酸。
如本文所用术语“连接酶”应是指用于将多核苷酸接合在一起的酶。要根据本发明的方法应用的连接酶应为DNA连接酶。DNA连接酶是本领域中熟知的并且包括噬菌体连接酶(如T4 DNA连接酶、T7 DNA连接酶)、细菌古细菌连接酶。在优选实施方案中,连接酶是T4DNA连接酶。该连接酶需要ATP作为辅因子。通过使用连接酶,在用内切核酸酶切割后,通过产生的互补突出端连接在本发明的方法的步骤(a)中提供的多核苷酸。由此,将多核苷酸以定向方式组装。
步骤(b)中的切割和连接,即多核苷酸的组装,是同时或基本上同时进行的。因此,所述组装是在连接酶和IIs型限制性内切核酸酶二者的存在下进行的。两种酶都应有活性。这种组装被称为“金门”组装。
因为用于步骤(b)中的组装的酶具有不同的最适温度,所述组装通常在热循环仪中进行。典型的热循环仪方案在约37℃(对于IIs型限制性内切核酸酶是最适的)与约16℃(对于连接酶是最适的)之间摆动。可以进行几个循环。在最后一步中,通过加热(例如在65℃下)使酶失活。可编程热循环仪可从多个商业供应商容易地获得。
在切割和连接后,将组装的产物转化至感受态细菌细胞(如大肠杆菌(E.coli)细胞)中。
融合多核苷酸编码目标多肽。应理解,融合多核苷酸必须在真核细胞中表达,因为原核细胞不具有剪接机构。为了表达多核苷酸,将其与一个或多个表达控制序列可操作地连接。优选地,表达控制序列关于所述多核苷酸是异源的。
如本文所用术语“表达控制序列”是指能够管理(即启动和控制)目标核酸序列(在当前情况下是指上文列举的核酸序列)的转录的核酸序列。这种序列通常包含启动子或启动子与增强子序列的组合,或由其组成。因此,表达控制序列优选地是启动子。多核苷酸的表达包括优选地将核酸分子转录为可翻译mRNA。另外的调节元件可以包括转录以及翻译增强子。
优选地,启动子应在真核宿主细胞中,更优选地在哺乳动物细胞和/或昆虫细胞中有活性。在实施方案中,将融合多核苷酸与选自以下的启动子可操作地连接:CMV-5-启动子、SV40-启动子、RSV-启动子、EF1a-启动子、MPSV-启动子和SRα-启动子。对于昆虫细胞,可以使用多面体启动子、p10启动子或ie1启动子。
为了允许表达,融合多核苷酸可以存在于载体中。优选地,载体是适合于通过本发明的方法产生的融合多核苷酸的表达的重组DNA构建体。此外,所述术语还是指靶向构建体,其允许将靶向构建体随机或定点整合至基因组DNA中。此类靶构建体优选地包含长度足够用于同源或异源重组的DNA。所述载体可以包含用于在宿主中繁殖和/或选择的可选标记。
其中应表达融合多核苷酸的宿主细胞可以是任何真核细胞,如哺乳动物(例如人或小鼠)细胞、植物细胞或昆虫细胞。优选地,宿主细胞是真核细胞,更优选地,哺乳动物或昆虫细胞。例如,宿主细胞可以是HEK-293细胞(人胚肾细胞293),如HEK-293E细胞、HEK-293T细胞或FreestyleTMHEK-293细胞。可替代地,宿主细胞可以是CHO细胞(中国仓鼠卵巢),如CHO-K1细胞。
本发明的方法可以应用于产生编码预定义的目标多肽的融合多核苷酸。
然而,所述方法还可以应用于产生编码目标多肽的多种不同融合多核苷酸,其差异在于由用于产生融合多核苷酸的第一、第二和其他多核苷酸编码的多肽部分的顺序。在这种情况下,融合多核苷酸通常包含如根据本发明的方法指定的第一、第二和至少另一种多核苷酸。然而,对于所述应用设想,在这种情况下在其他多核苷酸和/或第一和第二多核苷酸之间对于IIs型限制性内切核酸酶的切割序列都是相互互补的,使得第一、第二和其他多核苷酸的连接以基本上随机的方式进行。
术语“多肽”是技术人员充分理解的。多肽是由通过酰胺键(也称为肽键)线性连接的氨基酸残基构成的分子。目标多肽可以具有任何长度。例如,目标多肽可以是包含至少50、100、300或500个氨基酸的多肽。根据构建体,多肽可以甚至更长,例如如果要产生的目标多肽是人工抗体的话。例如,目标多肽可以包含至少2000个氨基酸。
在本发明所涵盖的研究中,分析不同融合多肽(萤光素酶和抗体,参见图1至图16)。然而,本发明并不限于这些多肽。原则上,目标多肽可以是任何多肽。例如,在某些实施方案中,目标多肽是天然存在的多肽。通常,所述多肽是酶、转录因子、核酸酶、配体蛋白、治疗性蛋白质、转录因子、生长因子、生长因子受体。此外,目标多肽可以是抗体或其衍生物,例如双特异性或多特异性蛋白质构建体/抗体。在某些实施方案中,目标多肽是包含至少两种天然存在的多肽的部分或全部的融合蛋白。在某些实施方案中,目标多肽是包含至少一种天然存在的多肽和至少一种非天然存在的多肽的部分或全部的融合蛋白。例如,目标多肽可以是治疗性肽或蛋白质和治疗性抗体或其抗原结合片段的融合物。
如上所述,所述目标多肽也可以是抗体或其抗原结合片段。抗体也可以是双特异性抗体或多特异性抗体。如本文所用术语“双特异性抗体”是指与两种不同表位特异性结合的抗体。多特异性抗体是与两种或更多种不同表位结合的抗体。所述双特异性和多特异性抗体的不同表位通常是不重叠表位。此外,抗体可以是二价或多价抗体。在实施方案中,抗体是多特异性、多价抗体。在实施方案中,抗体是双特异性、二价抗体。
在实施方案中,目标多肽是非天然存在的多肽。
本发明的方法不仅允许组装两个多核苷酸,还允许组装三个或更多个多核苷酸。例如,可以按预定顺序组装(即连接)三个、四个、五个、六个、七个、八个、九个或十个多核苷酸以产生编码目标多肽的融合多核苷酸。如果组装超过两个多核苷酸以产生融合多核苷酸,那么将位于融合多核苷酸的中心位置的要组装的多核苷酸(本文中也称为中心多核苷酸)在两个末端(即在5'末端和3'末端)包含对于IIs型限制性内切核酸酶的切割和识别位点。将位于融合多核苷酸的末端的要组装的多核苷酸(本文中也称为末端多核苷酸)可以仅在一个末端包含对于IIs型限制性内切核酸酶的切割和识别位点。然而,还设想,所述末端多核苷酸在两个末端包含对于IIs型限制性内切核酸酶的切割和识别位点。这会例如允许将编码目标多肽的多核苷酸克隆至载体(如表达载体)中。如本文其他地方所述,切割位点和识别位点应相互可操作地连接。
在本发明的方法的实施方案中,所述方法包括组装(即连接)以下三个多核苷酸:如上所述的第一多核苷酸、如上所述的第二多核苷酸和第三多核苷酸。分别在步骤(a1)、(a2)和(a3)中提供的多核苷酸应按以下顺序(从5'至3')来连接:
第一多核苷酸(末端多核苷酸)-第二多核苷酸(中心多核苷酸)-第三多核苷酸(末端多核苷酸)。
由于第二多核苷酸成为中心多核苷酸,除了如本发明的方法的步骤(a2)中所述的第二多核苷酸的元件(i)至(iv)以外,第二多核苷酸还包含以下序列(同样在5'至3'方向上):
(v)编码第二内含子的5'部分的核酸序列,
(vi)对于IIs型限制性内切核酸酶的第三切割序列,其与第一多核苷酸的第一切割序列不同,以及
(vii)对于所述IIs型限制性内切核酸酶的识别序列,其中(vi)中的所述第三切割序列与所述识别序列可操作地连接。
所述方法还包括步骤(a3)。所述步骤是在步骤(b)之前进行。在本发明的方法的步骤(a3)中,提供第三多核苷酸,其在5'至3'方向上包含:
(i)对于所述IIs型限制性内切核酸酶的识别序列,
(ii)对于所述IIs型限制性内切核酸酶的第四切割序列,其中所述第四切割序列与第三切割序列互补,其中(ii)中的第四切割序列与所述识别序列(即与(i)下第三多核苷酸的识别序列)可操作地连接,
(iii)编码所述第二内含子的3'部分的核酸序列,以及
(iv)编码所述目标多肽的第三部分的核酸序列。
在本发明的方法的实施方案中,所述方法包括组装(即连接)以下四个多核苷酸:如上所述的第一多核苷酸、如结合三个多核苷酸的组装所述的第二多核苷酸、和如上所述的第三多核苷酸、和第四多核苷酸。分别在步骤(a1)、(a2)、(a3)和(a4)中提供的多核苷酸应按以下顺序(从5'至3')连接:
第一多核苷酸(末端多核苷酸)-第二多核苷酸(中心多核苷酸)-第三多核苷酸(中心多核苷酸)-第四多核苷酸(末端多核苷酸)
由于第三多核苷酸成为中心多核苷酸,除了如上文步骤(a3)中所述的第三多核苷酸的元件(i)至(iv)以外,第三多核苷酸还包含以下序列(同样在在5'至3'方向上):
(v)编码第三内含子的5'部分的核酸序列,
(vi)对于所述IIs型限制性内切核酸酶的第五切割序列,其与所述第一多核苷酸的第一切割序列和所述第二多核苷酸的第三切割序列不同,以及
(vii)对于所述IIs型限制性内切核酸酶的识别序列,其中(vi)中的所述第五切割序列与所述识别序列(即(vii)中的所述识别序列)可操作地连接。
所述方法还包括步骤(a4)。所述步骤是在步骤(b)之前进行。在本发明的方法的步骤(a4)中,提供第四多核苷酸,其在5'至3'方向上包含:
(i)对于所述IIs型限制性内切核酸酶的识别序列,
(ii)对于所述IIs型限制性内切核酸酶的第六切割序列,其中所述第六切割序列与第五切割序列互补,其中(ii)中的第六切割序列与(i)中的所述识别序列可操作地连接,
(iii)编码第三内含子的3'部分的核酸序列,以及
(iv)编码所述目标多肽的第四部分的核酸序列。
在本发明的方法的实施方案中,所述方法包括组装(即连接)以下五个多核苷酸:如上所述的第一多核苷酸、如结合三个多核苷酸的组装所述的第二多核苷酸、如结合四个多核苷酸的组装所述的第三多核苷酸、如上所述的第四多核苷酸和第五多核苷酸。分别在步骤(a1)、(a2)、(a3)、(a4)和(a5)中提供的多核苷酸应按以下顺序(从5'至3')连接:
第一多核苷酸(末端多核苷酸)-第二多核苷酸(中心多核苷酸)-第三多核苷酸(中心多核苷酸)-第四多核苷酸(中心多核苷酸)-第五多核苷酸(末端多核苷酸)
由于第四多核苷酸成为中心多核苷酸,除了如上文步骤(a4)中所述的第四多核苷酸的元件(i)至(iv)以外,第四多核苷酸还包含以下序列(同样在5'至3'方向上):
(v)编码第四内含子的5'部分的核酸序列,
(vi)对于所述IIs型限制性内切核酸酶的第七切割序列,其与所述第一多核苷酸的第一切割序列、所述第二多核苷酸的第三切割序列和所述第三多核苷酸的第五切割序列不同,以及
(vii)对于所述IIs型限制性内切核酸酶的识别序列,其中(vi)中的所述第七切割序列与(vii)中的所述识别序列可操作地连接。
所述方法还包括步骤(a5)。所述步骤是在步骤(b)之前进行。在所述方法的步骤(a5)中,提供第五多核苷酸,其在5'至3'方向上包含:
(i)对于所述IIs型限制性内切核酸酶的识别序列,
(ii)对于所述IIs型限制性内切核酸酶的第八切割序列,其中所述第八切割序列与所述第七切割序列互补,其中(ii)中的所述切割序列与(i)中的所述识别序列可操作地连接,
(iii)编码所述第四内含子的3'部分的核酸序列,以及
(iv)编码所述目标多肽的第五部分的核酸序列。
在本发明的方法的实施方案中,所述方法包括组装(即连接)以下六个多核苷酸:如上所述的第一多核苷酸、如结合三个多核苷酸的组装所述的第二多核苷酸、如结合四个多核苷酸的组装所述的第三多核苷酸、如结合五个多核苷酸的组装所述的第四多核苷酸、如上所述的第五多核苷酸和第六多核苷酸。分别在步骤(a1)、(a2)、(a3)、(a4)、(a5)和(a6)中提供的多核苷酸应按以下顺序(从5'至3')连接:
第一多核苷酸(末端多核苷酸)-第二多核苷酸(中心多核苷酸)-第三多核苷酸(中心多核苷酸)-第四多核苷酸(中心多核苷酸)-第五多核苷酸(中心多核苷酸)-第六多核苷酸(末端多核苷酸)
由于第五多核苷酸成为中心多核苷酸,除了如上文步骤(a5)中所述的第五多核苷酸的元件(i)至(iv)以外,第五多核苷酸还包含以下序列(同样在5'至3'方向上):
(v)编码第五内含子的5'部分的核酸序列,
(vi)对于所述IIs型限制性内切核酸酶的第九切割序列,其与所述第一多核苷酸的第一切割序列、所述第二多核苷酸的第三切割序列、所述第三多核苷酸的第五切割序列和所述第四多核苷酸的第七切割序列不同,以及
(vii)对于所述IIs型限制性内切核酸酶的识别序列,其中(vi)中的所述第九切割序列与(vii)中的所述识别序列可操作地连接。
所述方法还包括步骤(a6)。所述步骤是在步骤(b)之前进行。在所述方法的步骤(a6)中,提供第六多核苷酸,其在5'至3'方向上包含:
(i)对于所述IIs型限制性内切核酸酶的识别序列,
(ii)对于所述IIs型限制性内切核酸酶的第十切割序列,其中所述第十切割序列与所述第九切割序列互补,其中(ii)中的所述第十切割序列与(i)中的所述识别序列可操作地连接,
(iii)编码所述第五内含子的3'部分的核酸序列,以及
(iv)编码所述目标多肽的第六部分的核酸序列。
在本发明的方法的实施方案中,所述方法包括组装(即连接)以下七个多核苷酸:如上所述的第一多核苷酸、如结合三个多核苷酸的组装所述的第二多核苷酸、如结合三个多核苷酸的组装所述的第三多核苷酸、如结合五个多核苷酸的组装所述的第四多核苷酸、如结合六个多核苷酸的组装所述的第五多核苷酸、如上所述的第六多核苷酸和第七多核苷酸。分别在步骤(a1)、(a2)、(a3)、(a4)、(a5)、(a6)和(a7)中提供的多核苷酸应按以下顺序(从5'至3')连接:
第一多核苷酸(末端多核苷酸)-第二多核苷酸(中心多核苷酸)-第三多核苷酸(中心多核苷酸)-第四多核苷酸(中心多核苷酸)-第五多核苷酸(中心多核苷酸)-第六多核苷酸(中心多核苷酸)-第七多核苷酸(末端多核苷酸)
由于第六多核苷酸成为中心多核苷酸,除了如上文步骤(a6)中所述的第六多核苷酸的元件(i)至(iv)以外,第六多核苷酸还包含以下序列(同样在5'至3'方向上):
(v)编码第六内含子的5'部分的核酸序列,
(vi)对于所述IIs型限制性内切核酸酶的第十一切割序列,其与所述第一多核苷酸的第一切割序列、所述第二多核苷酸的第三切割序列、所述第三多核苷酸的第五切割序列、所述第四多核苷酸的第七切割序列和所述第五多核苷酸的第九切割序列不同,以及
(vii)对于所述IIs型限制性内切核酸酶的识别序列,其中(vi)中的所述第十一切割序列与(vii)中的所述识别序列可操作地连接。
所述方法还包括步骤(a7)。所述步骤是在步骤(b)之前进行。在所述方法的步骤(a7)中,提供第七多核苷酸,其在5'至3'方向上包含:
(i)对于所述IIs型限制性内切核酸酶的识别序列,
(ii)对于所述IIs型限制性内切核酸酶的第十二切割序列,其中所述切割序列与所述第十一切割序列互补,其中(ii)中的所述第十二切割序列与(i)中的所述识别序列可操作地连接,
(iii)编码所述第六内含子的3'部分的核酸序列,以及
(iv)编码所述目标多肽的第七部分的核酸序列。
如上文所定义的三个、四个、五个、六个、七个等多核苷酸的组装和由此的连接在本发明的方法的步骤(b)中进行。
在此步骤(b)中,使如上文所定义的三个、四个、五个、六个或七个等多核苷酸与IIs型限制性内切核酸酶和连接酶在允许所述IIs型限制性内切核酸酶切割所述多核苷酸并连接所得切割产物的条件下接触,从而产生编码所述目标多肽的融合多核苷酸。
如果提供并连接三个多核苷酸,那么融合多核苷酸在5'至3'方向上包含:
(aa)编码所述目标多肽的第一部分的核酸序列,
(bb)编码第一内含子的核酸序列,其中所述第一内含子是功能性的,并且其中所述第一内含子包含编码所述第一内含子的5'部分的核酸序列和编码所述第一内含子的3'部分的核酸序列,
(cc)编码所述目标多肽的第二部分的核酸序列,
(dd)编码第二内含子的核酸序列,其中所述第二内含子是功能性的,并且其中所述第二内含子包含编码所述第二内含子的5'部分的核酸序列和编码所述第二内含子的3'部分的核酸序列,以及
(ee)编码所述目标多肽的第三部分的核酸序列。
如果提供并连接四个多核苷酸,那么所述融合多核苷酸在5'至3'方向上还包含:
(ff)编码第三内含子的核酸序列,其中所述第三内含子是功能性的,并且其中所述第三内含子包含编码所述第三内含子的5'部分的核酸序列和编码所述第三内含子的3'部分的核酸序列,以及
(gg)编码所述目标多肽的第四部分的核酸序列。
如果提供五个多核苷酸,那么所述融合多核苷酸在5'至3'方向上还包含:
(hh)编码第四内含子的核酸序列,其中所述第四内含子是功能性的,并且其中所述第四内含子包含编码所述第四内含子的5'部分的核酸序列和编码所述第四内含子的3'部分的核酸序列,
(ii)编码所述目标多肽的第五部分的核酸序列。
如果提供六个多核苷酸,那么所述融合多核苷酸在5'至3'方向上还包含:
(jj)编码第五内含子的核酸序列,其中所述第五内含子是功能性的,并且其中所述第四内含子包含编码所述第五内含子的5'部分的核酸序列和编码所述第五内含子的3'部分的核酸序列,
(kk)编码所述目标多肽的第六部分的核酸序列。
如果提供七个多核苷酸,那么所述融合多核苷酸在5'至3'方向上还包含:
(ll)编码第六内含子的核酸序列,其中所述第六内含子是功能性的,并且其中所述第六内含子包含编码所述第六内含子的5'部分的核酸序列和编码所述第六内含子的3'部分的核酸序列,
(mm)编码所述目标多肽的第七部分的核酸序列。
如上所述的所产生的融合多核苷酸当在真核宿主细胞中转录时被转录为在所述细胞中进行加工的转录物,使得将功能性的内含子从所述转录物剪接出来,从而产生编码所述目标多肽的mRNA。
在第一实施方案中,通过所述转录物转录的所有内含子是相同的或基本上相同的。因此,第一内含子、第二内含子和第三内含子等是相同的或基本上相同的。令人惊讶地,在本发明所涵盖的研究中显示,在多种情况下,相同内含子可以用于构建体内的多个位置,而不妨碍目标蛋白质的表达(参见实施例)。具有相同或基本上相同的内含子的多核苷酸可以通过使内含子内的切割位点移位,即通过使用相同内含子的长度不同的5'和3'部分来产生。因此,第一内含子的5'和3'部分的长度与第二内含子的5'和3'部分不同。不同部分的连接将得到两个相同或基本上相同的内含子。
在第二实施方案中,所有内含子彼此不同。因此,使用不同内含子。在这种情况下,对于每个内含子的组装,使用独特的切割位点。此外,可以通过使用具有不同切割位点的单一内含子来产生具有不同内含子的构建体。可能已经将此类切割位点引入内含子中。
在第三实施方案中,转录物可以包含与所述转录物中的其他内含子相同的内含子,以及与其余内含子不同的至少一个其他内含子。因此,转录物可以包含出现超过一次的内含子和与这些内含子不同的一个或多个其他内含子。所述一个或多个其他内含子可以彼此相同或不同。
本发明还允许超过七个多核苷酸的组装。通常,本发明的方法的步骤(a)和(b)如下:
(a)提供n个多核苷酸,n是至少3的整数,
其中编号1的多核苷酸在5'至3'方向上包含:
(i)编号1的编码所述目标多肽的部分的核酸序列,
(ii)编号1的编码内含子的5'部分的核酸序列,
(iii)编号1的对于所述IIs型限制性内切核酸酶的切割序列,以及
(iv)对于所述IIs型限制性内切核酸酶的识别序列,其中(iii)中的所述切割序列与(iv)中的所述识别序列可操作地连接,
其中编号2至(n-1)的一个或多个多核苷酸在5'至3'方向上包含:
(i)对于所述IIs型限制性内切核酸酶的识别序列,
(ii)对于所述IIs型限制性内切核酸酶的切割序列,其中所述切割序列与编号1至(n-2)的切割序列互补,其中(ii)中的所述切割序列与(i)中的所述识别序列可操作地连接,
(iii)编号1至(n-2)的编码内含子的3'部分的核酸序列,以及
(iv)编号2至(n-1)的编码所述目标多肽的部分的核酸序列,
(v)编号2至(n-1)的编码内含子的5'部分的核酸序列,
(vi)编号2至(n-1)的对于所述IIs型限制性内切核酸酶的切割序列,其与具有不同编号的一个或多个切割序列不同,以及
(vii)对于所述IIs型限制性内切核酸酶的识别序列,其中(vi)中的所述切割序列与(vii)中的所述识别序列可操作地连接。
其中编号n的多核苷酸在5'至3'方向上包含:
(i)对于所述IIs型限制性内切核酸酶的识别序列,
(ii)对于所述IIs型限制性内切核酸酶的切割序列,其中所述切割序列与编号n-1的切割序列互补,其中(ii)中的所述切割序列与(i)中的所述识别序列可操作地连接,
(iii)编号(n-1)的编码内含子的3'部分的核酸序列,以及
(iv)编号n的编码所述目标多肽的部分的核酸序列,
以及
(b)使所述n个多核苷酸与IIs型限制性内切核酸酶和连接酶在允许所述IIs型限制性内切核酸酶切割n个多核苷酸并连接所得切割产物的条件下接触,从而产生编码所述目标多肽的融合多核苷酸。
有利地,在本发明所涵盖的研究中显示,使用位于分裂为两个非功能性部分(功能性内含子的5'末端和功能性内含子的3'末端)的功能性内含子的3'或5'末端的合适IIs型切割序列,允许通过IIs型限制-连接组装原本不相容的DNA片段。不相容的DNA片段在其5'和3'末端配备有表示此类IIs型-分割内含子衔接子模块的核酸序列。金门克隆(即在包括用IIs型内切核酸酶切割和连接的反应中按所需顺序融合片段)导致通过含有相同/相容的IIs型前缀和后缀序列的分割内含子衔接子的无缝连接来重构功能性内含子。
本发明的方法(如果应用)允许多核苷酸的通用组装,而无需相容序列是要组装的多核苷酸序列的一部分的前提。因此,不需要改变一级多核苷酸序列。由于本发明,各自编码目标多肽的一部分的两个或更多个多核苷酸的重组融合现在是可能的,因为切割序列由内含子序列(而不是由编码序列)提供。同时,原本不相容的DNA片段将以线性但仍散布内含子的方式进行组装。重构的内含子“间隔子”在转染至真核表达宿主中之后在转录后通过剪接被去除,以得到预期的组装的核酸构建体。本发明的方法(即基于IIs型的克隆与分割内含子方法的组合)从而提供不依赖编码DNA片段的序列边界组装编码DNA片段的通用方法。特定地,本发明允许容易地组装编码不同蛋白质结构域的多核苷酸。如果应用,其将允许更容易地产生蛋白质。此类蛋白质可以例如经受筛选方法并且可以允许鉴定具有改进的治疗特性的蛋白质。如果应用,本发明的方法将成为生物制品药物发现中有价值的工具。本文所述的模块式克隆将允许多特异性蛋白质工程化。例如,可以产生具有多特异性且因此具有多个靶标的抗体。如与仅具有单一靶标的单特异性抗体相比,此类抗体将具有更宽的活性谱。
除非另外陈述,否则上文给出的定义和解释经过必要的修正后适用于下文。
此外,本发明设计产生目标多肽,其包括以下步骤
(i)通过本发明的方法产生融合多核苷酸,以及
(ii)在真核宿主细胞中表达所述融合多核苷酸,从而产生所述目标多肽。
在实施方案中,所述方法还包括从所述真核宿主细胞分离所产生的目标多肽的步骤(iii)。术语“从所述真核宿主细胞分离所产生的目标多肽”还涵盖从培养基的上清液分离所产生的多肽。
在步骤(i)中,应通过本发明的方法,即通过产生编码所述目标多肽的融合多核苷酸的方法产生融合多核苷酸。因此,进行所述方法的步骤。
在步骤(ii)中,融合多核苷酸应在真核宿主细胞中表达,从而产生所述目标多肽。如何表达多核苷酸是本领域所熟知的并且已经描述于上文中。为了表达所述多核苷酸,优选地将其与启动子可操作地连接。所述启动子应在宿主细胞中有活性。优选宿主细胞描述于上文中。
本发明还涉及包含如上文所定义的第一多核苷酸和第二多核苷酸的组合物。所述组合物还可以包含如上文所定义的第三多核苷酸。除了第一、第二和第三多核苷酸以外,所述组合物可以包含如上文所定义的第四、或第四和第五、或第四、第五和第六、或第四、第五、第六和第七多核苷酸。此外,所述组合物可以包含不包含内含子的一部分但包含合适的切割和识别位点的一个或多个多核苷酸。因此,所述多核苷酸应包含与切割位点可操作地连接的对于IIs型限制性内切核酸酶的识别位点,所述切割位点在用所述IIs型限制性内切核酸酶切割后允许将所述多核苷酸连接至所述组合物中存在的另一多核苷酸。所述另一多核苷酸应具有与所述多核苷酸的切割位点相容的切割位点。术语“可操作地连接”定义于本文其他地方。所述定义相应地适用。
所述多核苷酸应为单独多核苷酸。然而,在通过切割和连接组装后,将产生单一多核苷酸(即如本文所提及的融合多核苷酸)。
在优选实施方案中,本发明的组合物包含第一、第二和第三多核苷酸,
其中所述第一多核苷酸在5'至3'方向上包含:
(i)编码所述目标多肽的第一部分的核酸序列,
(ii)编码第一内含子的5'部分的核酸序列,
(iii)对于IIs型限制性内切核酸酶的第一切割序列,以及
(iv)对于所述IIs型限制性内切核酸酶的识别序列,其中(iii)中的所述第一切割序列与(iv)中的所述识别序列可操作地连接,
其中所述第二多核苷酸在5'至3'方向上包含:
(i)对于所述IIs型限制性内切核酸酶的识别序列,
(ii)对于所述IIs型限制性内切核酸酶的第二切割序列,其中所述第二切割序列与第一切割序列互补,其中(ii)中的所述第二切割序列与(i)中的所述识别序列可操作地连接,
(iii)编码所述第一内含子的3'部分的核酸序列,
(iv)编码所述目标多肽的第二部分的核酸序列,
(v)编码第二内含子的5'部分的核酸序列,
(vi)对于所述IIs型限制性内切核酸酶的第三切割序列,其与所述第一多核苷酸的第一切割序列不同,以及
(vii)对于所述IIs型限制性内切核酸酶的识别序列,其中(vi)中的所述第三切割序列与(vii)中的所述识别序列可操作地连接,并且
其中所述第三多核苷酸在5'至3'方向上包含:
(i)对于所述IIs型限制性内切核酸酶的识别序列,
(ii)对于所述IIs型限制性内切核酸酶的第四切割序列,其中所述第四切割序列与所述第三切割序列互补,其中(ii)中的所述第四切割序列与(i)中的所述识别序列可操作地连接,
(iii)编码第二内含子的3'部分的核酸序列,以及
(iv)编码所述目标多肽的第三部分的核酸序列。
除了如上文所提及的多核苷酸以外,所述组合物还可以包含连接酶,特定地DNA连接酶,如T4 DNA连接酶,以及IIs型限制性内切核酸酶。所述IIs型限制性内切核酸酶应能够在(即在所有)切割序列处切割多核苷酸。因此,所述IIs型限制性内切核酸酶应识别识别序列。
在本发明的组合物的优选实施方案中,所述组合物包含的IIs型限制性内切核酸酶和连接酶应允许切割所述组合物包含的多核苷酸(例如第一多核苷酸、第二多核苷酸和第三多核苷酸)并连接所得切割产物,从而产生编码所述目标多肽的融合多核苷酸。
本发明还涉及一种试剂盒,其包含如上文所定义的第一和第二多核苷酸、允许切割(即其能够切割)多核苷酸的IIs型限制性内切核酸酶和允许连接通过用所述IIs型限制性内切核酸酶切割得到的切割产物的连接酶。
所述试剂盒还可以包含如上文所定义的第三多核苷酸。除了所述第一、第二和第三多核苷酸以外,所述试剂盒还可以包含如上文所定义的第四、或第四和第五、或第四、第五和第六、或第四、第五、第六和第七多核苷酸。
本发明还包括编码目标多肽的多核苷酸,其当在真核宿主细胞中转录时被转录为包含至少三个内含子的转录物,所述内含子对于所述多核苷酸是异源的。
术语“至少三个内含子”意指三个或超过三个,具体而言至少四个、至少五个、至少六个、至少七个、至少八个、至少九个、至少十个或至少15个内含子。优选地,所述转录物包含的所有内含子对于所述多核苷酸是异源的。术语“异源的”已经描述于上文中。
术语“内含子”已经定义于上文中。所述定义相应地适用。
在实施方案中,通过所述转录物转录的所有内含子是相同的或基本上相同的。在另一实施方案中,至少一个内含子与所有其他内含子是不同的。在又另一个实施方案中,所有内含子彼此是不同的。
所述转录物包含的内含子的长度可以是如上文结合本发明的方法指定的长度。在本发明的多核苷酸(或方法)的实施方案中,所述转录物包含的所述内含子各自具有50至200nt,具体而言50至150nt的长度。例如,所述内含子各自具有50至100nt的长度。此外,所述内含子可以各自具有80至110nt的长度。
如本文其他地方所述,所产生的多核苷酸的一个或多个内含子还可以具有至少80个核苷酸,具体而言至少90个核苷酸的长度。在优选实施方案中,一个或多个内含子具有80至200nt的长度。在另一实施方案中,一个或多个内含子具有80至150nt的长度,如80至120nt的长度。此外,设想一个或多个内含子具有90至150nt的长度,如90至120nt的长度。
此外,本发明设想,转录物包含的每个内含子包含与编码所述目标多肽的核酸序列的开放阅读框同框的内部终止密码子。
最后,本发明涉及包含连接酶和IIs型限制性内切核酸酶的组合物用于通过以下方式产生编码目标多肽的融合多核苷酸的用途:用所述内切核酸酶切割
(a1)如上文所定义的第一多核苷酸,和
(a2)如上文所定义的第二多核苷酸,以及任选地
(a3)如上文所定义的第三多核苷酸,
并连接所得切割产物。
根据前述用途,可以切割至少一种其他多核苷酸,其中所述其他多核苷酸选自:
(a4)如上文所定义的第四多核苷酸,
(a5)如上文所定义的第五多核苷酸,
(a6)如上文所定义的第六多核苷酸,以及
(a7)如上文所定义的第七多核苷酸。
本发明的优选实施方案总结于下文中。上文提供的解释和定义经过必要的修正后适用于以下优选实施方案:
1.一种产生编码目标多肽的融合多核苷酸的方法,所述方法包括以下步骤:
(a1)提供第一多核苷酸,所述第一多核苷酸在5'至3'方向上包含:
(i)编码所述目标多肽的第一部分的核酸序列,
(ii)编码第一内含子的5'部分的核酸序列,
(iii)对于IIs型限制性内切核酸酶的第一切割序列,以及
(iv)对于所述IIs型限制性内切核酸酶的识别序列,其中(iii)中的所述第一切割序列与(iv)中的所述识别序列可操作地连接,
(a2)提供第二多核苷酸,所述第二多核苷酸在5'至3'方向上包含:
(i)对于所述IIs型限制性内切核酸酶的识别序列,
(ii)对于所述IIs型限制性内切核酸酶的第二切割序列,其中所述第二切割序列与第一切割序列互补,并且其中(ii)中的所述第二切割序列与(i)中的所述识别序列可操作地连接,
(iii)编码所述第一内含子的3'部分的核酸序列,以及
(iv)编码所述目标多肽的第二部分的核酸序列,以及
(b)使所述第一多核苷酸和第二多核苷酸与所述IIs型限制性内切核酸酶和连接酶在允许所述IIs型限制性内切核酸酶切割所述第一多核苷酸和第二多核苷酸并连接所得切割产物的条件下接触,从而产生编码所述目标多肽的融合多核苷酸。
2.根据实施方案1所述的方法,其中所述融合多核苷酸在5'至3'方向上包含:
(aa)编码所述目标多肽的第一部分的核酸序列,
(bb)编码第一内含子的核酸序列,其中所述第一内含子是功能性的,并且其中所述第一内含子包含编码所述第一内含子的5'部分的核酸序列和编码所述第一内含子的3'部分的核酸序列,以及
(cc)编码所述目标多肽的第二部分的核酸序列。
3.根据实施方案1和2所述的方法,其中所述融合多核苷酸当在真核宿主细胞中转录时被转录为在所述细胞中进行加工的转录物,使得所述内含子被从所述转录物剪接出来,从而产生编码所述目标多肽的mRNA。
4.根据实施方案1至3中任一项所述的方法,其中所述第一内含子对于所述融合多核苷酸是异源的。
5.根据实施方案1至4中任一项所述的方法,其中编码所述第一内含子的多核苷酸具有40至2000bp的长度。
6.根据实施方案1至5中任一项所述的方法,其中编码所述内含子的多核苷酸具有50至200bp,特别地50至150bp的长度。
7.根据实施方案1至6中任一项所述的方法,其中所述第一内含子包含与编码所述目标多肽的核酸序列的开放阅读框同框的内部终止密码子。
8.根据实施方案1至7中任一项所述的方法,其中所述第二多核苷酸还包含
(v)编码第二内含子的5'部分的核酸序列,
(vi)对于所述IIs型限制性内切核酸酶的第三切割序列,其与所述第一多核苷酸的第三切割序列不同,以及
(viii)对于所述IIs型限制性内切核酸酶的识别序列,其中(vi)中的所述第三切割序列与(vii)中的所述识别序列可操作地连接。
9.根据实施方案8所述的方法,其中所述方法还包括
(a3)提供第三多核苷酸,所述第三多核苷酸在5'至3'方向上包含:
(i)对于所述IIs型限制性内切核酸酶的识别序列,
(ii)对于所述IIs型限制性内切核酸酶的第四切割序列,其中所述第四切割序列与所述第三切割序列互补,其中(ii)中的所述第四切割序列与(i)中的识别序列可操作地连接,
(iii)编码第二内含子的3'部分的核酸序列,以及
(iv)编码所述目标多肽的第三部分的核酸序列,
其中在步骤(b)中,使所述第一多核苷酸、第二多核苷酸和第三多核苷酸与所述IIs型限制性内切核酸酶和连接酶在允许所述IIs型限制性内切核酸酶切割所述第一多核苷酸、第二多核苷酸和第三多核苷酸并连接所得切割产物的条件下接触,从而产生编码所述目标多肽的融合多核苷酸,并且
其中所述融合多核苷酸在5'至3'方向上包含:
(aa)编码所述目标多肽的第一部分的核酸序列,
(bb)编码第一内含子的核酸序列,其中所述第一内含子是功能性的,并且其中所述第一内含子包含编码所述第一内含子的5'部分的核酸序列和编码所述第一内含子的3'部分的核酸序列,
(cc)编码所述目标多肽的第二部分的核酸序列,
(dd)编码第二内含子的核酸序列,其中所述第二内含子是功能性的,并且其中所述第二内含子包含编码所述第二内含子的5'部分的核酸序列和编码所述第二内含子的3'部分的核酸序列,以及
(ee)编码所述目标多肽的第三部分的核酸序列。
10.一种产生目标多肽的方法,所述方法包括以下步骤:
(i)通过根据实施方案1至9中任一项所述的方法产生编码所述目标多肽的融合多核苷酸,以及
(ii)在真核宿主细胞中表达所述融合多核苷酸,从而产生所述目标多肽。
11.根据实施方案10所述的方法,其中所述方法还包括从所述真核宿主细胞分离所产生的目标多肽的步骤(iii)。
12.一种组合物,所述组合物包含第一、第二和第三多核苷酸,
其中所述第一多核苷酸在5'至3'方向上包含:
(i)编码所述目标多肽的第一部分的核酸序列,
(ii)编码第一内含子的5'部分的核酸序列,
(iii)对于IIs型限制性内切核酸酶的第一切割序列,以及
(iv)对于所述IIs型限制性内切核酸酶的识别序列,其中(iii)中的所述第一切割序列与(iv)中的所述识别序列可操作地连接,
其中所述第二多核苷酸在5'至3'方向上包含:
(i)对于所述IIs型限制性内切核酸酶的识别序列,
(ii)对于所述IIs型限制性内切核酸酶的第二切割序列,其中所述第二切割序列与第一切割序列互补,其中(ii)中的所述第二切割序列与(i)中的所述识别序列可操作地连接,
(iii)编码所述第一内含子的3'部分的核酸序列,
(iv)编码所述目标多肽的第二部分的核酸序列,
(v)编码第二内含子的5'部分的核酸序列,
(vi)对于所述IIs型限制性内切核酸酶的第三切割序列,其与所述第一多核苷酸的第一切割序列不同,以及
(vii)对于所述IIs型限制性内切核酸酶的识别序列,其中(vi)中的所述第三切割序列与(vii)中的所述识别序列可操作地连接,
以及
其中所述第三多核苷酸在5'至3'方向上包含:
(i)对于所述IIs型限制性内切核酸酶的识别序列,
(ii)对于所述IIs型限制性内切核酸酶的第四切割序列,其中所述切割序列与所述第三切割序列互补,其中(ii)中的所述第四切割序列与(i)中的所述识别序列可操作地连接,
(iii)编码第二内含子的3'部分的核酸序列,以及
(iv)编码所述目标多肽的第三部分的核酸序列。
13.根据实施方案12所述的组合物,其中所述组合物还包含所述IIs型限制性内切核酸酶和连接酶。
14.根据实施方案13所述的组合物,其中所述IIs型限制性内切核酸酶和所述连接酶允许切割所述第一多核苷酸、第二多核苷酸和第三多核苷酸并连接所得切割产物,从而产生编码所述目标多肽的融合多核苷酸。
15.一种试剂盒,所述试剂盒包含如实施方案12中所定义的第一、第二和第三多核苷酸、允许切割所述第一多核苷酸、第二多核苷酸和第三多核苷酸的IIs型限制性内切核酸酶以及允许连接通过用所述IIs型限制性内切核酸酶切割得到的切割产物的连接酶。
16.根据实施方案1至10中任一项所述的方法、根据实施方案11至14中任一项所述的组合物或根据实施方案15所述的试剂盒,其中所述IIs型限制性内切核酸酶选自AcuI、AlwI、BaeI、BbsI、BbvI、BccI、BceAI、BcgI、BciVI、BcoDI、BfuAI、BmrI、BpmI、BpuEI、BsaI、BsaXI、BseRI、BsgI、BsmAI、BsmBI、BsmFI、BsmI、BspCNI、BspMI、BspQI、BsrDI、BsrI、BtgZI、BtsCI、BtsI、BtsIMutI、CspCI、EarI、EciI、FauI、FokI、HgaI、HphI、HpyAV、MboII、MlyI、MmeI、MnlI、NmeAIII、PleI、SapI和SfaNI。
17.一种编码目标多肽的多核苷酸,所述多核苷酸在真核宿主细胞中转录时被转录为包含至少五个内含子的转录物,所述至少五个内含子对于所述多核苷酸是异源的。
18.根据实施方案17所述的多核苷酸,其中所述多核苷酸被转录为包含至少七个内含子的转录物,所述至少七个内含子对于所述多核苷酸是异源的。
19.根据实施方案17和18所述的多核苷酸,其中所述内含子中的每一个具有50至200nt,特别地50至150nt的长度。
20.根据实施方案17至19中任一项所述的多核苷酸,其中所述内含子中的每一个具有80至200nt的长度,如90至150nt或90至120nt的长度。
21.根据实施方案19所述的多核苷酸,其中所述内含子中的每一个具有50至100nt的长度。
22.根据实施方案17至21中任一项所述的多核苷酸,其中所有内含子包含与编码所述目标多肽的核酸序列的开放阅读框同框的内部终止密码子。
23.包含连接酶和IIs型限制性内切核酸酶的组合物用于通过以下方式产生编码目标多肽的融合多核苷酸的用途:用所述内切核酸酶切割
(a1)如实施方案1中所定义的第一多核苷酸,和
(a2)如实施方案1或3中所定义的第二多核苷酸,以及任选地
(a3)如实施方案3中所定义的第三多核苷酸,
并连接所得切割产物。
本说明书中引用的所有参考文献都是关于其全部公开内容和本说明书中明确提及的公开内容通过引用并入本文。
附图说明
附图显示:
图1:用于表达构建体的双顺反子载体(pcDNA5dual-FRT-TO_DES T,基于pcDNA5-FRT-TO_DEST[Invitrogen/ThermoFisher Scientific])。
图2:使用一个或两个内含子的萤光素酶实验:海肾萤光素酶基因中的内含子位置。方框描绘“外显子”,黑色水平条形表示人工插入的内含子。
图3:hRluc表达–内含子#2和#3中的经典剪接位点的突变破坏海肾萤光素酶的表达,其C末端序列中部分的缺失也会如此。x轴描绘在hRluc基因中含有或不含内含子的构建体。y轴显示每种构建体相对于不含内含子的参考构建体(阴影线条形)的表达水平。所显示的构建体包含在内含子位置#1(参见图2)具有(非)功能性内含子的那些和hRluc的C末端缺失构建体。误差条:标准差。
图4:hRluc表达–在hRluc的内含子位置#1具有单一内含子的构建体保持无内含子对照构建体的表达水平。仅内含子#1不会导致蛋白质的功能性表达。参考构建体:阴影线条形。误差条:标准差。对于x轴和y轴的使用,参见图3。
图5:hRluc表达–在hRluc的内含子位置#1和#2具有两个相同内含子的构建体保持无内含子对照构建体的表达水平的至少80%。参考构建体:阴影线条形。误差条:标准差。对于x轴和y轴的使用,参见图3。
图6:hRluc表达–在hRluc的内含子位置#1和#2具有两个不同内含子的构建体保持无内含子对照构建体的表达水平的至少70%–无论使用何种组合。参考构建体:阴影线条形。误差条:标准差。对于x轴和y轴的使用,参见图3。
图7:hRluc表达–在hRluc的内含子位置#1具有内含子I3的各种修饰的构建体显示无内含子对照构建体的60%至90%之间–与所插入序列的长度相比,更取决于所插入序列的类型。参考构建体:阴影线条形。误差条:标准差。对于x轴和y轴的使用,参见图3。图中的序列:caagtgggctgag是SEQ ID NO:41,cagctgggctgctt是SEQ ID NO:42。
图8:使用三个至七个内含子的萤光素酶实验:海肾萤光素酶基因中的内含子位置。方框描绘“外显子”,黑色水平条形表示内含子。具有超过三个内含子的构建体都在位置#3、#4和#5含有内含子。
图9:hRluc表达–在hRluc的内含子位置#3-#7(参见图8)具有3至7个相同内含子的构建体显示如与不含内含子的对照构建体相比降低的表达水平。每个构建体所用内含子的数量似乎并非在所有构建体中具有相同作用。如果在同一构建体中使用超过两个拷贝,内含子#2似乎不起作用。参考构建体:阴影线条形。误差条:标准差。对于x轴和y轴的使用,参见图3。
图10:hRluc表达–在hRluc的内含子位置#3-#7具有3至7个不同内含子的构建体在与不含内含子的对照构建体相比时显示降低的表达水平。此处,看起来似乎存在更多内含子会提高表达水平的趋势。表达似乎依赖于所用内含子的组合和其使用顺序。参考构建体:阴影线条形。误差条:标准差。对于x轴和y轴的使用,参见图3。
图11A和图11B:在可变结构域与恒定结构域之间(一个内含子,参见图11A)或同时在前导序列与可变结构域之间以及可变结构域与恒定结构域之间(两个内含子,参见图11B)具有一个或两个内含子的抗体构建体(轻链和重链)。
图12:抗体表达–从含有或不含内含子的序列产生的抗体的表达水平是相当的。x轴描绘在抗体的轻链和重链基因中含有或不含内含子的构建体。y轴显示每种构建体相对于不含内含子的参考构建体(阴影线条形)的表达水平。所显示构建体在略有不同的表达载体(EV1和EV2)中或在表达载体EV2(I8/I8、I9/I9)中包含每条链不含内含子或含有一个内含子的抗体–内含子位置参见图11A和图11B。误差条:来自12次独立实验的标准差。
图13:抗体表达–对在重链(黑色条形)或轻链(格子花条形)中含有一个内含子的构建体的比较经常显示,含有内含子#3或内含子#3的修饰形式(mI3)的那些构建体的表达较低。轻链似乎受影响更大。相比之下,内含子#8或#9以与对照相同的水平表达或者显示甚至升高的表达水平。参考构建体:阴影线条形。构建体名称按轻链/重链的顺序含有内含子参考符号:“---”描绘不含内含子的轻链或重链,所有其他含有初始内含子(I3、I8、I9)或杂合内含子(I3_I8、I8_I3)。x轴描绘在抗体的轻链或重链基因中含有或不含内含子的构建体。y轴显示每种构建体相对于不含内含子的参考构建体(阴影线条形)的表达水平。误差条:来自三次独立实验、模拟和无内含子对照的12次实验的标准差。
图14:抗体表达–在前导序列的3'末端使用不同终止密码子:AGC(黑色条形)或TCG(格子花条形)的使用不影响在重链序列中含有两个内含子的各种构建体的表达水平。因此,在与表示外显子中最常用的最后一个核苷酸的“G”相比时,在相对于内含子起点的位置-1的最不常用的核苷酸“C”不减少表达。在与对照构建体相比时,既不含野生型内含子#3也不含其修饰形式(mI3)的内含子组合的使用显示更稳定的表达水平。参考构建体:阴影线条形。构建体名称按轻链(“---”=无内含子)/重链的顺序含有内含子参考符号。x轴描绘在抗体的轻链或重链基因中含有或不含内含子的构建体。y轴显示每种构建体相对于不含内含子的参考构建体(阴影线条形)的表达水平。误差条:来自三次独立实验、模拟和无内含子对照的12次实验的标准差。
图15:抗体表达–在前导序列的3'末端使用不同终止密码子:AGC(黑色条形)或TCG(格子花条形)的使用不影响在轻链序列中含有两个内含子的各种构建体的表达水平。因此,在与表示外显子中最常用的最后一个核苷酸的“G”相比时,在相对于内含子起点的位置-1的最不常用的核苷酸“C”不减少表达。在与对照构建体相比时,既不含野生型内含子#3也不含其修饰形式(mI3)的内含子组合的使用显示更稳定的表达水平。参考构建体:阴影线条形。构建体名称按轻链/重链的顺序含有内含子参考符号(“---”=无内含子)。x轴描绘在抗体的轻链或重链基因中含有或不含内含子的构建体。y轴显示每种构建体相对于不含内含子的参考构建体(阴影线条形)的表达水平。误差条:来自三次独立实验、模拟和无内含子对照的12次实验的标准差。
图16:抗体表达–当在同一链上不存在其他内含子时,轻链和重链二者中的各种内含子组合几乎始终显示内含子#3对表达水平的负面影响。当内含子#3在同一链上与内含子#8或#9组合时,表达水平可以再次提高。黑色条形:每条链中一个内含子;条纹条形:轻链中一个内含子,重链中两个内含子;灰色条形:轻链中两个内含子,重链中一个内含子;格子花条形:每条链中两个内含子。参考构建体:阴影线条形。构建体名称按轻链/重链的顺序含有内含子参考符号。x轴描绘在抗体的轻链或重链基因中具有各种内含子或内含子组合的构建体(“mI3”=内含子#3的修饰形式)。y轴显示每种构建体相对于不含内含子的参考构建体(阴影线条形)的表达水平。误差条:来自三次独立实验、模拟和无内含子对照的12次实验的标准差。
实施例
以下实施例将仅说明本发明。无论如何,所述实施例不应被视为限制本发明的范围。
实施例1:材料和方法
质粒
(a)含有一种或多种萤光素酶的构建体的克隆
调整质粒pcDNA5-FRT-TO_DEST(基于来自Invitrogen/ThermoFisher Scientific的pcDNA5/FRT/TO,并通过在CMV启动子与BGHpA位点之间插入att R1/2位点进行修饰以允许Gateway克隆)以允许同时表达海肾和萤火虫萤光素酶(分别是hRluc和luc2–参见图1),如下:(i)将真核延长因子1α(EF1α)的启动子通过平端连接引入pcDNA5-FRT-TO_DEST的PmlI位点中,从而破坏5'PmeI位点但保持3'位点,从而产生pcDNA5dual-FRT-TO_DEST。(ii)萤火虫萤光素酶核苷酸序列(氨基酸序列得自pGL4.10[Promega],由雷根斯堡的GeneArt/Thermo Fisher Scientific进行基因合成,且进行密码子优化以供在人细胞系中表达)。将在其5'末端的5'共有Kozak序列(CACGTGAGCGCCACC,SEQ ID NO 43)和在其3'末端的双终止密码子(TAATGA)插入pcDNA5dual-FRT-TO_DEST的PmlI位点中,从而得到luc2-pcDNA5dual-FRT-TO_DEST。(iii)具有内含子序列的全部海肾萤光素酶核苷酸序列(海肾萤光素酶的氨基酸序列得自pGL4.75[Promega])由雷根斯堡的GeneArt/Thermo FisherScientific合成(如上文优化密码子),其具有侧翼attB1和attB2序列,所述侧翼序列包括5'Kozak共有序列和3'双终止密码子(分别是ACTTTGTACAAAAAAGCAGGCTAGCGCCACC(SEQ IDNO:44)和TGATAAGCTTACCCAGCTTTCTTGTACAAAG(SEQ ID NO:45)),以允许Gateway克隆至luc2-pcDNA5dual-FRT-TO_DEST中(确切的内含子位置参见图2和图8)。(iv)类似地,将无内含子海肾萤光素酶克隆至pcDNA5dual-FRT-TO_DEST中(不含萤火虫萤光素酶基因),将其在所有海肾萤光素酶测定中用作主要阳性对照。
(b)抗体构建体的克隆(基于标准限制和金门的克隆)
使用限制克隆(插入物含有Kozak共有序列)或金门克隆,使用用于在真核细胞中瞬时表达的常规的基于CMV的载体来产生抗体表达构建体(轻链和重链构建体)。对于后者,从载体骨架去除BsaI限制性位点并引入填充序列,所述填充序列侧接用于将抗体序列整合至表达载体中的BsaI位点(5':cgccagGAGACC(SEQ ID NO:46),3:GGTCTCtataat(SEQ IDNO:47);BsaI识别序列为粗体)。使用含有不同内含子的变化模块组合来组装抗体构建体(所有抗huIL4),然后将其克隆至表达载体中,如Weber等人(PLoS ONE.2011年2月18日;6(2):e16765)和Engler等人(ACS Synth Biol.2014年11月21日;3(11):839-43)所述。在无内含子抗体和含内含子抗体二者中,抗体构建体的编码序列的核苷酸序列是相同的,以下除外:(i)重链恒定区中的一个核苷酸,其中(对于使用基于金门的克隆产生的那些构建体)需要破坏BsaI位点,以及(ii)前导序列的最后一个密码子。
金门模块
用于产生含有内含子的抗体轻链和重链的金门模块被设计为含有三个部分:将内含子的3'部分置于模块的5'末端,之后是结构域的编码序列,即抗体链的可变或恒定部分。然后,编码序列之后是下一个内含子的5'部分。在两个末端,BsaI位点的置放方式使得这些位点在用BsaI消化后被去除,留下对每个内含子位置具有特异性的4个核苷酸的突出端,从而允许最终构建体的特异性连接和组装。
内含子
在本发明所涵盖的研究中使用一组内含子:初始内含子、修饰内含子和部分内含子:
关于内含子的概述可以参见表1至表4。
修饰内含子或部分内含子包含:
(a)在内含子的5'或3'末端缺失经典剪接位点的内含子,要用作阴性对照(内含子#10-#13)
(b)具有4个核苷酸的插入的内含子(作为金门克隆反应的插入的重叠序列的例子;内含子#14-#16和#19-#20)
(c)具有更大核苷酸插入物的内含子,其在所述插入物的任一侧含有两个潜在的重叠序列(其可以用于跳过外显子;内含子#17-#18)
(d)杂合内含子由不同内含子的两个半部分组成(内含子#21–24)
(e)部分内含子由其初始内含子的5'部分或3'部分组成,用于金门克隆反应(部分内含子#1-#16)
Figure BDA0003065188800000401
Figure BDA0003065188800000411
Figure BDA0003065188800000421
Figure BDA0003065188800000431
Figure BDA0003065188800000441
Figure BDA0003065188800000451
Figure BDA0003065188800000461
Figure BDA0003065188800000471
Figure BDA0003065188800000481
Figure BDA0003065188800000491
细胞培养和转染
在含有6mM谷氨酰胺的Freestyle F17表达培养基(Gibco目录号A1383502)中培育悬浮适应的HEK293-F细胞(Invitrogen目录号51-002)。在转染前一天,将1升细胞以1.2e6个细胞/ml的密度接种于具有通气帽的3LFernbach Erlenmeyer烧瓶(Corning 431252)中,并在37℃下在以110rpm搅动和8%CO2下孵育过夜。
在转染当天,将细胞用F17表达培养基调整至1.9e6个细胞/ml。对于每次转染,将50ng pXL4617_EBNA(EBNA1表达质粒)与1μg目标表达构建体的DNA和2.8μg PEI(Polysciences,目录号23966-2)混合,并用F17表达培养基调整至230μl体积。在15min孵育后,将870μl细胞(1.65e6)添加至DNA/PEI复合物。所有转染实验都是在96深孔板(Nunc目录号10447181)上以1100μl的最终工作体积来进行。将板用DUETZ系统盖(KuehnerTechnology)覆盖,并且在37℃、8%CO2和以3mm轨道(Infors HT Multitron Pro)1,000rpm振荡下孵育两天。所有转染都是至少一式两份进行并重复2-5次。
使用萤光素酶报告物测定(萤光素酶构建体)的表达分析
(a)实验程序
在用
Figure BDA0003065188800000501
萤光素酶测定系统(Promega,目录号E2940)转染后两天测量转染的细胞的萤光素酶活性。将50μl细胞悬浮液转移到96孔isoplate(Perkin Elmer目录号6005040)中并在室温下平衡10min。添加50μl
Figure BDA0003065188800000502
试剂并孵育10min以裂解细胞。用酶标仪(Molecular Devices,Gemini XP;设定:30次读取,高PMT)测量萤火虫萤光素酶发光。添加50μl
Figure BDA0003065188800000503
Stop&
Figure BDA0003065188800000504
试剂以猝灭来自萤火虫反应的发光。在10min孵育后,在与针对萤火虫萤光素酶所述相同的条件下测量海肾萤光素酶发光。
(b)数据分析
使用来自一次转染(双份或三份)的多个数据点来产生平均值。然后将这些值关于含有海肾萤光素酶[hRLuc,无内含子]以及萤火虫萤光素酶[luc2]的双顺反子构建体的平均信号进行归一化,得到相对表达水平。然后计算所测试的每种构建体二至九次实验的相对表达水平的平均值(以及标准差)。
使用来自萤火虫萤光素酶的测量的信号作为对照来指示成功转染(数据未显示)。
使用
Figure BDA0003065188800000511
QKe(抗体构建体)的表达分析
(a)定量
在转染后七天,通过离心(3220rcf,2min)收获含有所表达抗体构建体的细胞上清液。通过生物膜层干涉测量法(BLI)使用
Figure BDA0003065188800000512
QKe系统(Pall FortéBio,#30-5046)使用蛋白A生物传感器(Pall FortéBio,#18-5013)对这些上清液进行定量。定量和生物传感器的再生是如下进行:将细胞上清液在D-PBS(Gibco,#14190-094)中1:10稀释,并转移至测定板(Greiner微孔板96孔,PP,黑色,#655209)中。将定量时间设为120sec,生物传感器的再生/中和是用10mM甘氨酸/HCl(pH 1.5)和D-PBS进行至5sec,在第一次测量之前以及在所有后续测量之间使用三次循环。所述测定是在30℃和以1000rpm振荡下进行。将传感器偏移设为3mm。实验在延迟600sec以将板平衡10min(30℃和振荡)后开始。
(b)数据分析
使用FortéBio Data Analysis 9.0以及预先验证的人IgG标准曲线(结合速率与浓度)进行数据分析。使用来自几次转染(每次以一式两份进行)的多个数据点产生来自三次独立实验的平均值和标准差。
使用
Figure BDA0003065188800000513
QKe的结合测定
(a)对人IL4的抗体结合
也使用
Figure BDA0003065188800000514
QKe系统来测试所表达抗IL4抗体与人IL4的解离速率(kd)。为此,在预涂布有抗五His抗体(Qiagen)的生物传感器(HIS1K,Pall FortéBio,#18-5122)上捕获2.5μg/mL具有His6标签的重组人IL4(novoprotein,#CD88),持续120sec。在使用来自模拟转染的上清液的基线记录后(“基线孔”,在D-PBS中1:10稀释,上样时间30sec),将生物传感器在含有样品上清液(也在D-PBS中1:10稀释)的样品孔中浸蘸。在孵育120sec后,将生物传感器移回基线孔的上清液中,以允许结合的抗IL4抗体从固定的IL4解离,持续600sec。用10mM甘氨酸/HCl(pH 1.7)和D-PBS使生物传感器再生和中和,各自持续5sec,在第一次测量之前和所有后续测量之间使用三次循环。每次测定在30℃和1000rpm振荡下进行,且将传感器偏移设为3mm,并在延迟600sec以将板平衡10min(30℃和振荡)后开始。所有样品以双重参考方式(如
Figure BDA0003065188800000515
QKe手册中所述)来测量–两种参考是:(i)无结合配体的模拟转染的上清液(1:10于D-PBS中),以及(ii)含有结合的IL4配体的模拟转染的上清液(1:10于D-PBS中)。
(b)抗体结合实验的数据分析
所有样品数据点使用以下来计算:(i)双重参考(参见上文),从而针对非特异性结合和配体解离加以校正,以及(ii)步骤间校正以避免两个测量步骤之间的未对准(如
Figure BDA0003065188800000521
QKe手册中所述)。将所得结合曲线用局部完整1:1模型来拟合,并计算解离常数kdis。使用来自几次转染(每次以一式两份进行)的多个数据点产生来自三次独立实验的平均值和标准差。
实施例2:结果/结论
萤光素酶实验的结果显示于图3至图10中,抗体实验的结果显示于图12至图16中。
使用细胞内表达的单链萤光素酶构建体和分泌的双链抗体构建体二者,显示:
(a)当在(真核)HEK293FS细胞中表达时,将各种短和超短内含子引入各种蛋白质的编码序列中产生功能性蛋白(细胞溶质的或分泌的),其表达水平与不含内含子的对照蛋白类似。
(b)如所预期,使经典剪接位点突变导致目标蛋白的表达水平下降至模拟转染的水平,从而显示,功能性内含子(以及因此将其从前体mRNA去除)对于目标蛋白的适当表达是至关重要的。
(c)引入两个相同或不同内含子导致表达水平与仅含一个内含子的那些序列相当。
(d)即使一些蛋白质的表达水平在与对照水平相比时略有下降,将“外来”序列插入内含子中导致良好表达。
(e)插入三至七个(相同或不同)内含子显示一些内含子无表达。所有其他内含子都显示降低的表达水平。
(f)内含子可以含有至少一个内部框内终止密码子以确保未经剪接的构建体不产生延长的蛋白质,但所述蛋白质仍然可以(但不一定必然)具有预期蛋白质的特性(在剪接后)–例如在内含子的长度是三的倍数的情况下。
(g)如所预期产生含有各种内含子组合的通过基于金门的分子克隆产生的抗体构建体并将其分泌至培养基中,但是表达水平根据构建体中使用的内含子组合而变化。更长内含子如内含子I8和I9的组合通常产生比含有超短内含子的那些更高的表达水平。抗体构建体的功能测试显示与其靶标的结合在预期范围内,但是在一些而非所有情况下,内含子I3或其修饰形式mI3展示结合略有下降。
显示通过使用细胞剪接设备产生功能性mRNA,内含子可以与金门克隆方法一起用于产生正确折叠的目标蛋白。本发明的克隆方法的有利之处在于,它消除了DNA模块特异性前缀和后缀序列的必要性并且由此允许将原本不相容的DNA模块组合,得到完全一般且通用的蛋白质工程化方法。相比之下,在本领域中所述的克隆技术中,如果目标DNA模块含有独特且相容的前缀-后缀对,那么它们只能进行线性融合,并且因此,具有不相容的前缀-后缀对的一级模块序列必须通过一级DNA序列操纵(例如通过引入相容序列)来修饰,以允许定向组装。相容的前缀和后缀序列由通过IIs型限制性酶(例如BsaI)产生的互补的4个碱基对的突出端(前缀-后缀对)构成。因此,蛋白质模块可以通过金门克隆在共有的末端4bp靶位点(通常是共有的氨基酸密码子+1个另外的核苷酸)接合。
然而,本发明的方法允许通过酶切-粘贴机制使用编码非回文IIs型限制性位点的确定的侧翼前缀和后缀序列来组装DNA模块(例如编码蛋白质结构域)。此处,将用于DNA模块组装的前缀和后缀序列从DNA模块的末端部分置换,并且代替地置于与目标DNA模块融合的分割内含子序列(例如分裂为两个非功能性部分的功能性内含子)的3'或5'末端处。因此,前缀和后缀序列由内含子序列提供。无需相容末端前缀和后缀序列是一级DNA序列的一部分的前提的DNA模块的通用组装。不需要改变一级DNA序列。因此,无需相容末端前缀和后缀序列是一级DNA序列的一部分的前提的DNA模块的通用组装是可能的。不需要改变一级DNA序列。因为前缀和后缀序列不再是一级DNA模块的一部分,通过以下方式来实现多结构域组装的灵活性/可变性:i)使内含子序列内的IIs型靶位点的位置移位,或者ii)使用可替代的内含子序列,或者iii)其组合。
本发明的方法是有利的,因为它允许连接在重叠位置(即在切割后产生的突出端内)共有至少一个三个核苷酸的相同延伸段的序列(例如编码蛋白质结构域)。这允许DNA序列的灵活的且不依赖编码序列的连接。因此,本发明允许连接且由此拼接具有侧翼核酸序列的编码序列,所述侧翼核酸序列用于/允许不依赖编码序列的连接。
通过所述方法组装的构建体可以包含人工内含子。已显示,内含子可以在真核表达宿主中通过剪接来去除,以得到预期的目标多肽,但是显而易见,此处测试的内含子无法任意组合。然而,这是在意料之中的。如本领域中已知,剪接是通过外显子和内含子二者内的激活和抑制核苷酸序列来调节的(参见例如,Lee和Rio,Annu.Rev.Biochem.2015.84:291–323;或Yeo GW,Van Nostrand EL,Liang TY(2007)Discovery and analysis ofevolutionarily conserved intronic splicing regulatory elements.PLoS Genet 3(5):e85.doi:10.1371/journal.pgen.0030085)。虽然有大量实验数据显示各种短核苷酸序列对剪接效率的影响,但并非所有调节序列都是已知的。它们在给定序列背景中的影响也并非都是已知的。此外,超短内含子对剪接的调节可能以与更长内含子不同的方式起作用。在上述实验中,看起来似乎超短内含子的剪接对潜在调节元件比此处使用的更长内含子更敏感。
令人惊讶地,在许多情况下,相同内含子可以用于构建体内的多个位置,而不妨碍目标蛋白的表达。
序列表
<110> 赛诺菲
<120> 基于内含子的通用克隆方法和组合物
<130> SAN14152PC
<160> 47
<170> BiSSAP 1.3.6
<210> 1
<211> 56
<212> DNA
<213> 人工序列
<220>
<223> 内含子I1
<400> 1
gtaaggtaag aattgaattt ctcagttgaa ggatgcttac actcttgtcc atctag 56
<210> 2
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 内含子I2
<400> 2
gtgagtgggc caggggagag gtgccgtggg gctgggccga gctgaccctc atgtctccat 60
ag 62
<210> 3
<211> 65
<212> DNA
<213> 人工序列
<220>
<223> 内含子I3
<400> 3
gtgagtgggc gccccggcgg ggtgggcagt gggcgggccc gagctgaccg cacccctccc 60
cacag 65
<210> 4
<211> 65
<212> DNA
<213> 人工序列
<220>
<223> 内含子I4
<400> 4
gtaagggagg gaaggggggg tggggagggg ccggctgtgc ccccctcacc tgcccctccc 60
cacag 65
<210> 5
<211> 82
<212> DNA
<213> 人工序列
<220>
<223> 内含子I5
<400> 5
gtaaggggtt aacagtagca ggcttgaggt ctggacatat atatgggtga caatgacatc 60
cactttgcct ttctctccac ag 82
<210> 6
<211> 375
<212> DNA
<213> 人工序列
<220>
<223> 内含子I6
<400> 6
gtaagtcagg tgtcagccgc agatgcgttc aggtgagggc ggaggctagc ggggcgctgt 60
gcagcactga gctcgcggaa gaccaggacc aggagatcac cgagggcgac cgccaggccc 120
cgggccctcc gctcccgagg ggcggcctct cagcaccagc ccgggggccg gcctgatcgc 180
cacgcaggca cctgccgccg ccaccgccac cgccatctca accgtacggg tgggagaggc 240
tgtgcgccgc tccaggggag atccggctcc catccggccc cacccgccct gccttgccct 300
gcccgcagct tctgggctgc caggctccat tctgaagctt ctactaactc tcgagtcttc 360
tttttttttt cacag 375
<210> 7
<211> 72
<212> RNA
<213> 人工序列
<220>
<223> 内含子I7
<400> 7
gtaagtcaac gcaattaatc tatgaaatcc ctaatgccta cggcagccgc tggattgtta 60
cttcttcttc ag 72
<210> 8
<211> 110
<212> DNA
<213> 人工序列
<220>
<223> 内含子I8
<400> 8
gtaagaacca aaccctccca gcaggggtgc ccaggcccag gcatggccca gagggagcag 60
cgggtggggc ttaggccaag ctgagctcac accttgacct ttcattccag 110
<210> 9
<211> 82
<212> DNA
<213> 人工序列
<220>
<223> 内含子I9
<400> 9
gtgagtacag gaggtggaga gtggccagcc cttctcatgt tcagagaaca tggttaactg 60
gttaagtcat gtcgtcccac ag 82
<210> 10
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 内含子I2(del5ss)
<400> 10
tggagtgggc caggggagag gtgccgtggg gctgggccga gctgaccctc atgtctccat 60
ag 62
<210> 11
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 内含子I2(del3ss)
<400> 11
gtgagtgggc caggggagag gtgccgtggg gctgggccga gctgaccctc atgtctccat 60
ga 62
<210> 12
<211> 65
<212> DNA
<213> 人工序列
<220>
<223> 内含子I3(del5ss)
<400> 12
tggagtgggc gccccggcgg ggtgggcagt gggcgggccc gagctgaccg cacccctccc 60
cacag 65
<210> 13
<211> 65
<212> DNA
<213> 人工序列
<220>
<223> 内含子I3(del3ss)
<400> 13
gtgagtgggc gccccggcgg ggtgggcagt gggcgggccc gagctgaccg cacccctccc 60
cacga 65
<210> 14
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 内含子I3(ins38)-1
<400> 14
gtgagtgggc gccccggcgg ggtgggcagt gggcgggcaa gcccgagctg accgcacccc 60
tccccacag 69
<210> 15
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 内含子I3(ins38)-2
<400> 15
gtgagtgggc gccccggcgg ggtgggcagt gggcgggcag ccccgagctg accgcacccc 60
tccccacag 69
<210> 16
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 内含子I3(ins38)-3
<400> 16
gtgagtgggc gccccggcgg ggtgggcagt gggcgggttc ccccgagctg accgcacccc 60
tccccacag 69
<210> 17
<211> 79
<212> DNA
<213> 人工序列
<220>
<223> 内含子I3(ins38)-4
<400> 17
gtgagtgggc gccccggcgg ggtgggcagt gggcgggcaa gtgggctgag gcccgagctg 60
accgcacccc tccccacag 79
<210> 18
<211> 79
<212> DNA
<213> 人工序列
<220>
<223> 内含子I3(ins38)-5
<400> 18
gtgagtgggc gccccggcgg ggtgggcagt gggcgggcag ctgggctgct tcccgagctg 60
accgcacccc tccccacag 79
<210> 19
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 内含子I3(ins37)-1
<400> 19
gtgagtgggc gccccggcgg ggtgggcagt gggcggcaag gcccgagctg accgcacccc 60
tccccacag 69
<210> 20
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 内含子I3(ins37)-2
<400> 20
gtgagtgggc gccccggcgg ggtgggcagt gggcggcagc gcccgagctg accgcacccc 60
tccccacag 69
<210> 21
<211> 115
<212> DNA
<213> 人工序列
<220>
<223> 内含子I3(1-29)_I8(25-110)
<400> 21
gtgagtgggc gccccggcgg ggtgggcagg ggtgcccagg cccaggcatg gcccagaggg 60
agcagcgggt ggggcttagg ccaagctgag ctcacacctt gacctttcat tccag 115
<210> 22
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 内含子I3(1-48)_I8(99-110)
<400> 22
gtgagtgggc gccccggcgg ggtgggcagt gggcgggccc gagctgacct ttcattccag 60
<210> 23
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 内含子I8(1-24)_I3(30-65)
<400> 23
gtaagaacca aaccctccca gcagtgggcg ggcccgagct gaccgcaccc ctccccacag 60
<210> 24
<211> 115
<212> DNA
<213> 人工序列
<220>
<223> 内含子I8(1-98)_I3(49-65)
<400> 24
gtaagaacca aaccctccca gcaggggtgc ccaggcccag gcatggccca gagggagcag 60
cgggtggggc ttaggccaag ctgagctcac accttgaccg cacccctccc cacag 115
<210> 25
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> I3N1(1-29)
<400> 25
gtgagtgggc gccccggcgg ggtgggcag 29
<210> 26
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> I3C1(30-65)
<400> 26
tgggcgggcc cgagctgacc gcacccctcc ccacag 36
<210> 27
<211> 48
<212> DNA
<213> 人工序列
<220>
<223> I3N2(1-48)
<400> 27
gtgagtgggc gccccggcgg ggtgggcagt gggcgggccc gagctgac 48
<210> 28
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> I3C2(49-65)
<400> 28
cgcacccctc cccacag 17
<210> 29
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> mI3N1(1-36_insCAAG)
<400> 29
gtgagtgggc gccccggcgg ggtgggcagt gggcggcaag 40
<210> 30
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> mI3C1(insCAAG_37-65)
<400> 30
gcccgagctg accgcacccc tccccacag 29
<210> 31
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> mI3N2(1-36_insCAGC)
<400> 31
gtgagtgggc gccccggcgg ggtgggcagt gggcggcagc 40
<210> 32
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> mI3C2(insCAGC_37-65)
<400> 32
gcccgagctg accgcacccc tccccacag 29
<210> 33
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> I8N1(1-24)
<400> 33
gtaagaacca aaccctccca gcag 24
<210> 34
<211> 86
<212> DNA
<213> 人工序列
<220>
<223> I8C1(25-110)
<400> 34
gggtgcccag gcccaggcat ggcccagagg gagcagcggg tggggcttag gccaagctga 60
gctcacacct tgacctttca ttccag 86
<210> 35
<211> 98
<212> DNA
<213> 人工序列
<220>
<223> I8N2(1-98)
<400> 35
gtaagaacca aaccctccca gcaggggtgc ccaggcccag gcatggccca gagggagcag 60
cgggtggggc ttaggccaag ctgagctcac accttgac 98
<210> 36
<211> 12
<212> DNA
<213> 人工序列
<220>
<223> I8C2(99-110)
<400> 36
ctttcattcc ag 12
<210> 37
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> I9N1(1-22)
<400> 37
gtgagtacag gaggtggaga gt 22
<210> 38
<211> 59
<212> DNA
<213> 人工序列
<220>
<223> I9C1(23-82)
<400> 38
ggccagccct tctcatgttc agagaacatg gttaactggt taagtcatgt cgtcccaca 59
<210> 39
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> I9N2(1-60)
<400> 39
gtgagtacag gaggtggaga gtggccagcc cttctcatgt tcagagaaca tggttaactg 60
<210> 40
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> I9C2(61-82)
<400> 40
gttaagtcat gtcgtcccac ag 22
<210> 41
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> hRluc - I3修饰的1
<400> 41
caagtgggct gagg 14
<210> 42
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> hRluc - I3修饰的2
<400> 42
cagctgggct gctt 14
<210> 43
<211> 15
<212> DNA
<213> 人工序列
<220>
<223> 共有Kozak序列,载体
<400> 43
cacgtgagcg ccacc 15
<210> 44
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> DNA序列,载体
<400> 44
actttgtaca aaaaagcagg ctagcgccac c 31
<210> 45
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> DNA序列,载体
<400> 45
tgataagctt acccagcttt cttgtacaaa g 31
<210> 46
<211> 12
<212> DNA
<213> 人工序列
<220>
<223> 侧接BsaI位点的序列,载体
<400> 46
cgccaggaga cc 12
<210> 47
<211> 12
<212> DNA
<213> 人工序列
<220>
<223> 侧接BsaI位点的序列,载体
<400> 47
ggtctctata at 12

Claims (17)

1.一种产生编码目标多肽的融合多核苷酸的方法,所述方法包括以下步骤:
(a1)提供第一多核苷酸,所述第一多核苷酸在5'至3'方向上包含:
(i)编码所述目标多肽的第一部分的核酸序列,
(ii)编码第一内含子的5'部分的核酸序列,
(iii)对于IIs型限制性内切核酸酶的第一切割序列,以及
(iv)对于所述IIs型限制性内切核酸酶的识别序列,其中(iii)中的所述第一切割序列与所述识别序列可操作地连接,
(a2)提供第二多核苷酸,所述第二多核苷酸在5'至3'方向上包含:
(i)对于所述IIs型限制性内切核酸酶的识别序列,
(ii)对于所述IIs型限制性内切核酸酶的第二切割序列,其中所述第二切割序列与所述第一切割序列互补,并且其中所述第二切割序列与(a2)(i)中的所述识别序列可操作地连接,
(iii)编码所述第一内含子的3'部分的核酸序列,
(iv)编码所述目标多肽的第二部分的核酸序列,
(v)编码第二内含子的5'部分的核酸序列,
(vi)对于所述IIs型限制性内切核酸酶的第三切割序列,其与所述第一多核苷酸的第一切割序列不同,以及
(vii)对于所述IIs型限制性内切核酸酶的识别序列,其中所述第三切割序列与(a2)(vii)中的所述识别序列可操作地连接,以及
(a3)提供第三多核苷酸,所述第三多核苷酸在5'至3'方向上包含:
(i)对于所述IIs型限制性内切核酸酶的识别序列,
(ii)对于所述IIs型限制性内切核酸酶的第四切割序列,其中所述第四切割序列与所述第三切割序列互补,其中所述第四切割序列与(a3)(i)中的所述识别序列可操作地连接,
(iii)编码所述第二内含子的3'部分的核酸序列,以及
(iv)编码所述目标多肽的第三部分的核酸序列,以及
(b)使所述第一、第二和第三多核苷酸与所述IIs型限制性内切核酸酶和连接酶在允许所述IIs型限制性内切核酸酶切割所述第一、第二和第三多核苷酸并连接所得切割产物的条件下接触,从而产生编码所述目标多肽的融合多核苷酸。
2.根据权利要求1所述的方法,其中所述融合多核苷酸在5'至3'方向上包含:
(aa)编码所述目标多肽的第一部分的核酸序列,
(bb)编码所述第一内含子的核酸序列,其中所述第一内含子是功能性的,并且其中所述第一内含子包含编码所述第一内含子的5'部分的核酸序列和编码所述第一内含子的3'部分的核酸序列,
(cc)编码所述目标多肽的第二部分的核酸序列,
(dd)编码所述第二内含子的核酸序列,其中所述第二内含子是功能性的,并且其中所述第二内含子包含编码所述第二内含子的5'部分的核酸序列和编码所述第二内含子的3'部分的核酸序列,以及
(ee)编码所述目标多肽的第三部分的核酸序列。
3.根据权利要求1和2所述的方法,其中所述融合多核苷酸当在真核宿主细胞中转录时被转录为在所述细胞中进行加工的转录物,使得每个内含子被从所述转录物剪接出来,从而产生编码所述目标多肽的mRNA。
4.根据权利要求1至3中任一项所述的方法,其中所述第一内含子和/或所述第二内含子对于所述融合多核苷酸是异源的。
5.根据权利要求1至4中任一项所述的方法,其中编码所述第一内含子的多核苷酸和/或编码所述第二内含子的多核苷酸具有40至2000bp的长度。
6.根据权利要求1至5中任一项所述的方法,其中编码所述第一和/或第二内含子的多核苷酸具有50至200bp,特别地50至150bp的长度。
7.根据权利要求1至6中任一项所述的方法,其中所述第一和/或第二内含子包含与编码所述目标多肽的融合多核苷酸的开放阅读框同框的内部终止密码子。
8.一种产生目标多肽的方法,所述方法包括以下步骤:
(i)通过根据权利要求1至7中任一项所述的方法产生编码所述目标多肽的融合多核苷酸,和
(ii)在真核宿主细胞中表达所述融合多核苷酸,从而产生所述目标多肽,以及任选地
(iii)从所述真核宿主细胞分离所产生的目标多肽。
9.一种组合物,所述组合物包含第一、第二和第三多核苷酸,
其中所述第一多核苷酸在5'至3'方向上包含:
(i)编码所述目标多肽的第一部分的核酸序列,
(ii)编码第一内含子的5'部分的核酸序列,
(iii)对于IIs型限制性内切核酸酶的第一切割序列,以及
(iv)对于所述IIs型限制性内切核酸酶的识别序列,其中所述第一切割序列与所述识别序列可操作地连接,
其中所述第二多核苷酸在5'至3'方向上包含:
(i)对于所述IIs型限制性内切核酸酶的识别序列,
(ii)对于所述IIs型限制性内切核酸酶的第二切割序列,其中所述第二切割序列与所述第一切割序列互补,其中所述第二切割序列与所述第二多核苷酸的所述识别序列(i)可操作地连接,
(iii)编码所述第一内含子的3'部分的核酸序列,
(iv)编码所述目标多肽的第二部分的核酸序列,
(v)编码第二内含子的5'部分的核酸序列,
(vi)对于所述IIs型限制性内切核酸酶的第三切割序列,其与所述第一多核苷酸的第一切割序列不同,以及
(vii)对于所述IIs型限制性内切核酸酶的识别序列,其中所述第三切割序列与所述识别序列可操作地连接,
以及
其中所述第三多核苷酸在5'至3'方向上包含:
(i)对于所述IIs型限制性内切核酸酶的识别序列,
(ii)对于所述IIs型限制性内切核酸酶的第四切割序列,其中所述切割序列与所述第三切割序列互补,其中(ii)中的所述第四切割序列与所述第三多核苷酸的所述识别序列(i)可操作地连接,
(iii)编码所述第二内含子的3'部分的核酸序列,以及
(iv)编码所述目标多肽的第三部分的核酸序列。
10.根据权利要求9所述的组合物,其中所述组合物还包含所述IIs型限制性内切核酸酶和连接酶,特别地其中所述IIs型限制性内切核酸酶和所述连接酶允许切割所述第一多核苷酸、所述第二多核苷酸和所述第三多核苷酸并连接所得切割产物,从而产生编码所述目标多肽的融合多核苷酸。
11.一种试剂盒,所述试剂盒包含如权利要求9中所定义的第一、第二和第三多核苷酸、允许切割所述第一多核苷酸、所述第二多核苷酸和所述第三多核苷酸的IIs型限制性内切核酸酶以及允许连接通过用所述IIs型限制性内切核酸酶切割得到的切割产物的连接酶。
12.根据权利要求1至8中任一项所述的方法、根据权利要求9或10中任一项所述的组合物或根据权利要求11所述的试剂盒,其中所述IIs型限制性内切核酸酶选自AcuI、AlwI、BaeI、BbsI、BbvI、BccI、BceAI、BcgI、BciVI、BcoDI、BfuAI、BmrI、BpmI、BpuEI、BsaI、BsaXI、BseRI、BsgI、BsmAI、BsmBI、BsmFI、BsmI、BspCNI、BspMI、BspQI、BsrDI、BsrI、BtgZI、BtsCI、BtsI、BtsIMutI、CspCI、EarI、EciI、FauI、FokI、HgaI、HphI、HpyAV、MboII、MlyI、MmeI、MnlI、NmeAIII、PleI、SapI和SfaNI。
13.一种编码目标多肽的多核苷酸,所述多核苷酸在真核宿主细胞中转录时被转录为包含至少五个内含子的转录物,所述至少五个内含子对于所述多核苷酸是异源的。
14.根据权利要求13所述的多核苷酸,其中所述内含子各自优选地具有50至200nt的长度,更优选地50至150nt的长度,并且最优选地50至100nt的长度。
15.根据权利要求13所述的多核苷酸,其中所述内含子各自优选地具有80至200nt的长度,如90至150nt或90至120nt的长度。
16.根据权利要求13至17中任一项所述的多核苷酸,其中所有内含子包含与编码所述目标多肽的核酸序列的开放阅读框同框的内部终止密码子。
17.包含连接酶和IIs型限制性内切核酸酶的组合物用于通过以下方式产生编码目标多肽的融合多核苷酸的用途:用所述内切核酸酶切割
(a1)如权利要求1中所定义的第一多核苷酸,
(a2)如权利要求1中所定义的第二多核苷酸,以及
(a3)如权利要求1中所定义的第三多核苷酸,
并连接所得切割产物。
CN201980075031.4A 2018-09-20 2019-09-19 基于内含子的通用克隆方法和组合物 Pending CN113015801A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP18306220 2018-09-20
EP18306220.7 2018-09-20
PCT/EP2019/075232 WO2020058438A1 (en) 2018-09-20 2019-09-19 Intron-based universal cloning methods and compositions

Publications (1)

Publication Number Publication Date
CN113015801A true CN113015801A (zh) 2021-06-22

Family

ID=63832350

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980075031.4A Pending CN113015801A (zh) 2018-09-20 2019-09-19 基于内含子的通用克隆方法和组合物

Country Status (13)

Country Link
US (1) US11834693B2 (zh)
EP (1) EP3853361A1 (zh)
JP (1) JP2022501036A (zh)
KR (1) KR20210060561A (zh)
CN (1) CN113015801A (zh)
AU (1) AU2019342866A1 (zh)
BR (1) BR112021005115A2 (zh)
CA (1) CA3113130A1 (zh)
IL (1) IL281536A (zh)
MX (1) MX2021003273A (zh)
SG (1) SG11202102817WA (zh)
TW (1) TW202026422A (zh)
WO (1) WO2020058438A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023172903A1 (en) * 2022-03-08 2023-09-14 Amgen Inc. Modular vector (modvec) system: a platform for construction of next generation expression vectors

Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004015085A2 (en) * 2002-08-09 2004-02-19 California Institute Of Technology Method and compositions relating to 5’-chimeric ribonucleic acids
US20050100921A1 (en) * 2001-03-27 2005-05-12 Kmiec Eric B. Genomics applications for modified OLIGO nucleotides
CN102257162A (zh) * 2008-10-29 2011-11-23 波士顿大学理事会 保持序列的dna转化
EP2395087A1 (en) * 2010-06-11 2011-12-14 Icon Genetics GmbH System and method of modular cloning
CN102939377A (zh) * 2010-04-26 2013-02-20 桑格摩生物科学股份有限公司 使用锌指核酸酶对Rosa位点进行基因组编辑
CN102943074A (zh) * 2012-10-25 2013-02-27 盛司潼 一种接头和构建测序文库的方法
CN103492578A (zh) * 2011-04-27 2014-01-01 阿迈瑞斯公司 用于基因组修饰的方法
US20140242637A1 (en) * 2012-12-31 2014-08-28 Boehringer Ingelheim International Gmbh Artificial introns
CN106133138A (zh) * 2013-08-22 2016-11-16 先锋国际良种公司 使用引导多核苷酸/cas内切核酸酶系统的基因组修饰及其使用方法
CN106148322A (zh) * 2015-04-22 2016-11-23 王金 一种合成dna的方法
US20170152520A1 (en) * 2015-11-30 2017-06-01 Synthetic Genomics, Inc. Compositions and methods for expressing genes in algae
CN106834320A (zh) * 2009-12-10 2017-06-13 明尼苏达大学董事会 Tal效应子介导的dna修饰
CN110612113A (zh) * 2017-02-07 2019-12-24 加利福尼亚大学董事会 单倍体机能不全的基因疗法
CN111330021A (zh) * 2013-12-09 2020-06-26 桑格摩生物科学股份有限公司 基因组工程化的方法和组合物
CA3213502A1 (en) * 2021-04-21 2022-10-27 Nathaniel Stephen Wang Alphavirus vectors containing universal cloning adaptors
CN116848244A (zh) * 2020-12-15 2023-10-03 新英格兰生物实验室公司 用于改进多核苷酸体外组装的组合物和方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10145553B4 (de) 2001-09-16 2006-06-08 Gene Architects Ag Nukleinsäure für einen Klonierungsvektor
EP2115144A1 (en) 2007-02-05 2009-11-11 Philipps-Universität Marburg Method of cloning at least one nucleic acid molecule of interest using type iis restriction endonucleases, and corresponding cloning vectors, kits and system using type iis restriction endonucleases
GB0909660D0 (en) 2009-06-04 2009-07-22 Gene Bridges Gmbh Method of altering nucleic acids
EP2794651B1 (en) * 2011-12-22 2022-09-21 F. Hoffmann-La Roche AG Expression vector element combinations, novel production cell generation methods and their use for the recombinant production of polypeptides
US10253321B2 (en) 2013-05-01 2019-04-09 Dna2.0, Inc. Methods, compositions and kits for a one-step DNA cloning system
EP3401328A1 (en) 2017-05-10 2018-11-14 Bayer Pharma Aktiengesellschaft One step antibody humanization by golden gate based germline framework region shuffling

Patent Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050100921A1 (en) * 2001-03-27 2005-05-12 Kmiec Eric B. Genomics applications for modified OLIGO nucleotides
WO2004015085A2 (en) * 2002-08-09 2004-02-19 California Institute Of Technology Method and compositions relating to 5’-chimeric ribonucleic acids
CN102257162A (zh) * 2008-10-29 2011-11-23 波士顿大学理事会 保持序列的dna转化
CN106834320A (zh) * 2009-12-10 2017-06-13 明尼苏达大学董事会 Tal效应子介导的dna修饰
CN102939377A (zh) * 2010-04-26 2013-02-20 桑格摩生物科学股份有限公司 使用锌指核酸酶对Rosa位点进行基因组编辑
EP2395087A1 (en) * 2010-06-11 2011-12-14 Icon Genetics GmbH System and method of modular cloning
CN103492578A (zh) * 2011-04-27 2014-01-01 阿迈瑞斯公司 用于基因组修饰的方法
CN102943074A (zh) * 2012-10-25 2013-02-27 盛司潼 一种接头和构建测序文库的方法
US20140242637A1 (en) * 2012-12-31 2014-08-28 Boehringer Ingelheim International Gmbh Artificial introns
CN106133138A (zh) * 2013-08-22 2016-11-16 先锋国际良种公司 使用引导多核苷酸/cas内切核酸酶系统的基因组修饰及其使用方法
CN111330021A (zh) * 2013-12-09 2020-06-26 桑格摩生物科学股份有限公司 基因组工程化的方法和组合物
CN106148322A (zh) * 2015-04-22 2016-11-23 王金 一种合成dna的方法
US20170152520A1 (en) * 2015-11-30 2017-06-01 Synthetic Genomics, Inc. Compositions and methods for expressing genes in algae
CN110612113A (zh) * 2017-02-07 2019-12-24 加利福尼亚大学董事会 单倍体机能不全的基因疗法
CN116848244A (zh) * 2020-12-15 2023-10-03 新英格兰生物实验室公司 用于改进多核苷酸体外组装的组合物和方法
CA3213502A1 (en) * 2021-04-21 2022-10-27 Nathaniel Stephen Wang Alphavirus vectors containing universal cloning adaptors

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
ALFRED PINGOUD 等: "Structure and function of type II restriction endonucleases", 《OXFORD UNIVERSITIY PRESS》, 15 September 2001 (2001-09-15) *
CAROLA ENGLER 等: "Golden Gate Shuffling: A One-Pot DNA Shuffling Method Based on Type IIs Restriction Enzymes", 《PLOS ONE》, 14 May 2009 (2009-05-14) *
KLAUS B. GATERMANN 等: "Introduction of Functional Artificial Introns into the Naturally Intronless ura4 Gene of Schizosaccharomyces pombe", 《MOLECULAR AND CELLULAR BIOLOGY》, 30 April 1989 (1989-04-30) *

Also Published As

Publication number Publication date
WO2020058438A1 (en) 2020-03-26
CA3113130A1 (en) 2020-03-26
BR112021005115A2 (pt) 2021-06-15
US11834693B2 (en) 2023-12-05
EP3853361A1 (en) 2021-07-28
AU2019342866A1 (en) 2021-05-20
IL281536A (en) 2021-05-31
MX2021003273A (es) 2021-07-16
SG11202102817WA (en) 2021-04-29
JP2022501036A (ja) 2022-01-06
KR20210060561A (ko) 2021-05-26
TW202026422A (zh) 2020-07-16
US20200115728A1 (en) 2020-04-16

Similar Documents

Publication Publication Date Title
EP1969146B1 (en) Methods for nucleic acid mapping and identification of fine-structural-variations in nucleic acids and utilities
US8092991B2 (en) De novo enzymatic production of nucleic acid molecules
US20060127920A1 (en) Polynucleotide synthesis
WO2008083554A1 (en) Methods for nucleic acid mapping and identification of fine-structural-variations in nucleic acids
WO2007106047A1 (en) Nucleic acid interaction analysis
JP2002537762A (ja) 改良型核酸クローニング
CA2590245A1 (en) Ladder assembly and system for generating diversity
US20070184451A1 (en) Compounds and methods for molecular biology
Struhl Subcloning of DNA fragments
Bennett et al. CRISPR-mediated knock-in in the mouse embryo using long single stranded DNA donors synthesised by biotinylated PCR
CN111094573A (zh) 有效靶向敲入或基因置换的材料和方法
CN113015801A (zh) 基于内含子的通用克隆方法和组合物
US11634835B2 (en) Method for screening of an in vitro display library within a cell
Finney et al. Molecular cloning of PCR products
Strawn et al. A method for generating user‐defined circular single‐stranded DNA from plasmid DNA using Golden Gate intramolecular ligation
JP2007159512A (ja) Iis型制限酵素を用いる翻訳終止コドンの除去方法
US9944966B2 (en) Method for production of single-stranded macronucleotides
AU2022296859A1 (en) Composition and method for genome editing
US8512945B2 (en) Method of RNA cleavage and recombination
JP2004041083A (ja) 二本鎖dna分子の効率的合成方法
Souii et al. ’Hadheb‐Gharbi, Jawhar Gharbi
Madhira Building a cassette-based system for combined eukaryotic gene expression

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination