CN112080493B - 制备串联重复dna的方法及相关生物材料与应用 - Google Patents

制备串联重复dna的方法及相关生物材料与应用 Download PDF

Info

Publication number
CN112080493B
CN112080493B CN202010927574.9A CN202010927574A CN112080493B CN 112080493 B CN112080493 B CN 112080493B CN 202010927574 A CN202010927574 A CN 202010927574A CN 112080493 B CN112080493 B CN 112080493B
Authority
CN
China
Prior art keywords
sequence
gene
intron
nucleotide sequence
dna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010927574.9A
Other languages
English (en)
Other versions
CN112080493A (zh
Inventor
毕昌昊
张学礼
刘丽
赵东东
李斯微
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin Institute of Industrial Biotechnology of CAS
Original Assignee
Tianjin Institute of Industrial Biotechnology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin Institute of Industrial Biotechnology of CAS filed Critical Tianjin Institute of Industrial Biotechnology of CAS
Priority to CN202010927574.9A priority Critical patent/CN112080493B/zh
Publication of CN112080493A publication Critical patent/CN112080493A/zh
Application granted granted Critical
Publication of CN112080493B publication Critical patent/CN112080493B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1096Processes for the isolation, preparation or purification of DNA or RNA cDNA Synthesis; Subtracted cDNA library construction, e.g. RT, RT-PCR
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/43504Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates
    • C07K14/43513Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from arachnidae
    • C07K14/43518Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from arachnidae from spiders
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/575Hormones
    • C07K14/605Glucagons
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Toxicology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Insects & Arthropods (AREA)
  • Medicinal Chemistry (AREA)
  • Microbiology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Endocrinology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明提供一种制备串联重复DNA分子的方法及其相关产品与应用。本发明制备串联重复DNA分子的方法包括将含有名称为单拷贝DNA表达盒的双链DNA分子的表达载体导入受体细胞得到重组细胞,提取所述重组细胞的总RNA,将所述总RNA逆转录成cDNA,得到串联重复DNA分子,极大缩减制备长串联重复序列的时间。实验证明仅需4天便可获得重复10次的串联重复MaSp1,大大缩短了传统方法从MaSp1到MaSp8的时间。通过本发明的实施还能快速得到将拷贝数为7的lir串联重复片段,进而降解为lir小肽。本发明的方法具有实验周期短、节省时间和成本、效率高等特点。

Description

制备串联重复DNA的方法及相关生物材料与应用
技术领域
本发明涉及生物技术领域中一种制备串联重复DNA的方法及相关生物材料与应用。
背景技术
串联重复DNA是将某一段DNA首尾串联成多个拷贝。串联重复DNA可以用于串联重复蛋白的表达。目前串联重复DNA构建采用的方法有非对称粘性末端互补法和同尾酶法2种。采用非对称粘性末端互补法生成的拷贝数较随机,且需要多种酶进行酶切连接。同尾酶法也比较繁琐,需要反复进行酶切连接。蛛丝具有很高的强度和良好的可塑性,广泛应用的多种领域。在工业领域,例如制备降落伞,防护服,飞行器的复合材料。在生物医药领域,包括伤口缝合线,生物药的运输载体,细胞培养和器官移植的支架。然而,蛛丝很难通过饲养蜘蛛大量获取,因其具有强的领域意识和攻击性。因此,很多研究尝试在其他宿主中表达重组蛛丝蛋白。增加重组牵引丝蛋白的长度被猜测是提高蛛丝纺丝机械性能的关键因素之一。自然界中牵引丝蛋白大小为250-320kDa。2002年,有学者利用哺乳动物细胞表达出60kDa的重组蛛丝蛋白,其纺丝强度比自然界蛛丝韧性低4.2倍。而另一位学者在2010年则利用表达大肠杆菌表达出284.9kDa的重组蛛丝蛋白,且纺丝机械性能与天然蛛丝相似。要表达184.9kDa的重组蛛丝蛋白需要先合成一个重复单元MaSp1,再利用同尾酶无缝拼接技术MaSp2串联体,进而重复相同的方法依次合成MaSp4,MaSp8,MaSp16,MaSp32,MaSp48,最终拼成MaSp96。步骤繁琐,费时费力,且如果想要优化蛛丝序列则需要重新合成基因,再花费大量时间重新构建一系列串联体。
在生物医药领域,小肽具有广阔的应用前景。然而,小肽分子量较低,在表达宿主内易被降解为寡肽,失去生物活性。解决这一问题可通过构建小肽的多拷贝基因表达载体实现。利拉鲁肽(liraglutide,简写lir)属于活性小肽的一种,是治疗糖尿病的高效药物,价格昂贵。Lir只有31个氨基酸,是酰胺化长效GLP-1的类似物,由诺和诺德公司研制而成。
发明内容
本发明所要解决的技术问题是如何快速制备高强度蛛丝蛋白或利拉鲁肽。
为了解决以上技术问题,本发明提供了一种制备串联重复DNA分子的方法,包括将含有名称为单拷贝DNA表达盒的双链DNA分子的表达载体导入受体细胞得到重组细胞,提取所述重组细胞的总RNA,将所述总RNA逆转录(反转录)成cDNA,得到串联重复DNA分子;所述单拷贝DNA表达盒含有启动子,与所述启动子相连的名称为3’内含子的内含子,与所述3’内含子相连的名称为单拷贝DNA的目的DNA,与所述单拷贝DNA相连的名称为5’内含子的内含子;所述3’内含子和所述5’内含子满足条件A,所述条件A为在所述重组细胞中所述单拷贝DNA表达盒转录出的前体RNA通过碱基互补配对形成剪接泡,并通过剪接反应产生成熟的环状单链RNA分子,所述单拷贝DNA不含终止子。
上述方法中,所述cDNA为单链的串联重复DNA分子。
上述方法还可包括将所述cDNA进行扩增得到双链的串联重复DNA分子的步骤。
上述方法中,所述串联重复DNA分子可含有2个以上的所述单拷贝DNA,如7个拷贝以上的所述单拷贝DNA,10个拷贝以上的所述单拷贝DNA。
上述方法中,所述单拷贝DNA表达盒由启动子,所述3’内含子、所述单拷贝DNA和所述5’内含子连接而成。
作为目的目的基因的环形mRNA的表达盒,所述单拷贝DNA表达盒不但可包括启动目的基因转录的启动子,还可包括终止目的基因转录的终止子。进一步,所述单拷贝DNA表达盒还可包括增强子序列。可用于本发明的启动子包括但不限于:组成型启动子,组织、器官和发育特异的启动子,和诱导型启动子。启动子的例子包括但不限于:T7噬菌体的T7启动子,花椰菜花叶病毒的组成型启动子35S。它们可单独使用或与其它的启动子结合使用。合适的转录终止子包括但不限于:农杆菌胭脂碱合成酶终止子(NOS终止子)、花椰菜花叶病毒CaMV 35S终止子、tml终止子。
上述方法中,所述单拷贝DNA为目的基因。所述目的基因不含终止密码子。
上述方法中,所述目的基因还可含有筛选标记基因。所述筛选标记基因为能够起特异性标记作用的已知功能和序列的基因。例如编码可产生颜色变化的酶或发光化合物的基因(GUS基因、萤光素酶基因等)、抗生素的标记基因(如赋予对卡那霉素和相关抗生素抗性的nptII基因,赋予对除草剂膦丝菌素抗性的bar基因,赋予对抗生素潮霉素抗性的hph基因,和赋予对methatrexate抗性的dhfr基因,赋予对草甘磷抗性的EPSPS基因)或是抗化学试剂标记基因等(如抗除莠剂基因)、提供代谢甘露糖能力的甘露糖-6-磷酸异构酶基因。
上述方法中,所述目的基因可为MaSp1;所述MaSp1是氨基酸序列为序列表中序列2的蛋白质。
上述方法中,所述目的基因编码利拉鲁肽,所述利拉鲁肽是氨基酸序列为序列表中序列4的蛋白质。
上述方法中,所述受体细胞为C1)-C4)中的任一种:
C1)原核微生物细胞;
C2)革兰氏阴性细菌细胞;
C3)埃希氏菌属细菌细胞;
C4)大肠杆菌BL21(DE3)细胞。
上述方法中,所述满足条件A的所述3’内含子和所述5’内含子为如下一对内含子:
3’内含子含有3’ss序列和3’端剪接位点;所述3’ss包含6个名称分别为3’sp1基因、3’sp2基因、3’sp3基因、3’sp4基因、3’sp5基因和3’sp6基因的剪接泡编码DNA,所述3’sp1基因的核苷酸序列为序列1的第2560-2581位,所述3’sp2基因的核苷酸序列为序列1的第2645-2656位,所述3’sp3基因的核苷酸序列为序列1的第2660-2673位,所述3’sp4基因的核苷酸序列为序列1的第2685-2704位,所述3’sp5基因的核苷酸序列为序列1的第2719-2737位,所述3’sp6基因的核苷酸序列为序列1的第2738-2753位;所述3’端剪接位点的核苷酸序列为序列1的第2786-2790位;
5’内含子含有5’端剪接位点和5’ss序列;所述5’端剪接位点的核苷酸序列为序列1的第2896-2905位;所述5’ss序列包含4个名称分别为5’sp1基因、5’sp2基因、5’sp3基因、和5’sp4基因的剪接泡编码DNA,所述5’sp1基因的核苷酸序列为序列1的第2918-2939位,所述5’sp2基因的核苷酸序列为序列1的第2983-2992位,所述5’sp3基因的核苷酸序列为序列1的第2997-3047位,所述5’sp4基因的核苷酸序列为序列1的第3020-3036位。
上述方法中,所述3’内含子是一条链(编码链)的核苷酸序列为序列1的第2557-2790位核苷酸的双链DNA,所述5’内含子是一条链(编码链)的核苷酸序列为序列1的第2896-3073位核苷酸的双链DNA或序列3的第2905-3079位核苷酸的双链DNA。
上述方法中,所述单拷贝DNA表达盒是一条链(编码链)的核苷酸序列为序列表中序列1(SEQ ID No.1)的第2537位-第3073位的双链DNA分子,或所述单拷贝DNA表达盒是一条链(编码链)的核苷酸序列为序列表中序列3(SEQ ID No.3)的第2537位-第3079位的双链DNA分子;
或所述表达载体为一条链的核苷酸序列为序列表中序列1(SEQ ID No.1)的双链DNA分子(表达串联重复MaSp),或所述表达载体为一条链的核苷酸序列为序列表中序列3(SEQ ID No.3)的双链DNA分子(表达串联重复Lir与酶切位点)。
本发明还所提供与所述方法相关的下述任一种产品:
A1)所述方法中的所述名称为单拷贝DNA表达盒的双链DNA分子;
A2)含有A1)所述双链DNA分子的载体;
A3)含有A1)所述双链DNA分子的重组微生物。
可用现有的表达载体构建A2)所述载体。所述现有的表达载体包括pMD 18-Tvector、pET21b等。所述现有的表达载体还可包含外源基因的3’端非翻译区域,即包含聚腺苷酸信号和任何其它参与mRNA加工或基因表达的DNA片段。所述聚腺苷酸信号可引导聚腺苷酸加入到mRNA前体的3’端。构建A2)所述载体时,还可使用增强子,例如转录增强子,这些增强子区域可以是ATG起始密码子或邻接区域起始密码子等,但必需与编码序列的阅读框相同,以保证整个序列的正确翻译。为了便于对转基因结果进行鉴定及筛选,可对所用现有的表达载体进行加工,如加入可编码可产生颜色变化的酶或发光化合物的基因(GUS基因、萤光素酶基因等)、抗生素的标记基因(如赋予对卡那霉素和相关抗生素抗性的nptII基因,赋予对除草剂膦丝菌素抗性的bar基因,赋予对抗生素潮霉素抗性的hph基因,和赋予对methatrexate抗性的dhfr基因,赋予对草甘磷抗性的EPSPS基因)或是抗化学试剂标记基因等(如抗除莠剂基因)、提供代谢甘露糖能力的甘露糖-6-磷酸异构酶基因。
本发明还所提供上述方法或上述的产品在制备串联重复蛋白质中的应用。
本发明提供一种制备串联重复DNA分子的方法,包括将含有名称为单拷贝DNA表达盒的双链DNA分子的表达载体导入受体细胞得到重组细胞,提取所述重组细胞的总RNA,将所述总RNA逆转录成cDNA,得到串联重复DNA分子,极大缩减制备长串联重复序列的时间。实验证明仅需4天便可获得重复10次的串联重复MaSp1,大大缩短了传统方法从MaSp1到MaSp8的时间。通过本发明的实施还能快速得到将拷贝数为7的lir串联重复片段,进而降解为lir小肽。
附图说明
图1为本发明实施例1中MaSp1 RNA表达盒结构示意图。
图2为本发明实施例1中td基因内含子剪接生成环形MaSp1 RNA机制示意图。图中BSJ为后拼接接头(back’splicejunction)位点,即剪接点。
图3为本发明实施例1中逆转录生成MaSp1串联重复序列机制示意图。
图4为本发明实施例1中MaSp1 RNA成环情况的验证电泳图。
图5为本发明实施例1中MaSp1 RNA剪接点的sanger测序结果图。
图6为本发明实施例1中MaSp1 cDNA PCR之后的电泳图,图中画线标出的条带为分子量最大的条带。
图7为本发明实施例2中lir RNA表达盒结构示意图,图中TEV为TEV蛋白酶酶切位点。
图8为本发明实施例2中td基因内含子剪接生成环形lir RNA机制示意图,图中TEV为TEV蛋白酶酶切位点,BSJ为后拼接接头(back’splicejunction)位点,即剪接点。
图9为本发明实施例2中逆转录生成lir串联重复序列机制示意图。
图10为本发明实施例2中lir RNA成环情况的验证电泳图。
图11为本发明实施例2中lir RNA剪接点的sanger测序结果图。
图12为本发明实施例2中lir cDNA PCR之后的电泳图,图中画线标出的条带为分子量最大的条带。
具体实施方式
下面结合具体实施方式对本发明进行进一步的详细描述,给出的实施例仅为了阐明本发明,而不是为了限制本发明的范围。下述实施例中的实验方法,如无特殊说明,均为常规方法。下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
下述实施例中,大肠杆菌DH5α(BC102-02)是Biomed公司产品;大肠杆菌BL21(CW0809S)是北京康为世纪公司产品。
下述实施例中,T载体pMD 18-T vector(6011)是TaKaRa公司产品;载体pET21b(P0016)是武汉淼灵公司产品。
下述实施例中,RNAprep Pure培养细胞/细菌总RNA提取试剂盒(DP430)是TIANGEN公司产品;Rever Tra Ace qPCR RT kit cDNA合成试剂盒(FSQ-101)是TOYOBO公司产品。
下述实施例中,10xBSA蛋白溶液(B9000S)是NEB公司产品;2xEs Taq MasterMix(含染料)(CW0690H)是北京康为世纪公司产品。
下述实施例中,所用培养基具体如下:
液体LB培养基是由胰蛋白胨、酵母提取物、NaCl和去离子水制成的无菌培养基,胰蛋白胨、酵母提取物、酵母提取物的含量如下:10g/L胰蛋白胨、5g/L酵母提取物、10g/LNaCl。
硫酸安普霉素浓度为50μg/mL的液体LB培养基是由硫酸安普霉素、胰蛋白胨、酵母提取物、NaCl和去离子水制成的无菌培养基,硫酸安普霉素、胰蛋白胨、酵母提取物、酵母提取物的含量如下:50μg/mL硫酸安普霉素、10g/L胰蛋白胨、5g/L酵母提取物、10g/L NaCl。
氨苄青霉素浓度为100μg/mL的液体LB培养基是由氨苄青霉素、胰蛋白胨、酵母提取物、NaCl和去离子水制成的无菌培养基,氨苄青霉素、胰蛋白胨、酵母提取物、酵母提取物的含量如下:100μg/mL氨苄青霉素、10g/L胰蛋白胨、5g/L酵母提取物、10g/L NaCl。
固体LB培养基是由琼脂、胰蛋白胨、酵母提取物、NaCl和去离子水制成的无菌培养基,琼脂、胰蛋白胨、酵母提取物、酵母提取物的含量如下:15g/L琼脂、10g/L胰蛋白胨、5g/L酵母提取物、10g/L NaCl。
硫酸安普霉素浓度为50μg/mL的固体LB培养基是由硫酸安普霉素、琼脂、胰蛋白胨、酵母提取物、NaCl和去离子水制成的无菌培养基,硫酸安普霉素、琼脂、胰蛋白胨、酵母提取物、酵母提取物的含量如下:50μg/mL硫酸安普霉素、15g/L琼脂、10g/L胰蛋白胨、5g/L酵母提取物、10g/L NaCl。
实施例1、制备串联重复MaSp1
本实施例制备了名称为pMaSp1的含有单拷贝DNA表达盒的表达载体,pMaSp1是一条链的核苷酸序列是序列表中序列1(SEQ ID No.1)的双链DNA。序列1中,第1500-2312位为安普霉素抗性基因;第2537位-第3073位为名称为单拷贝DNA表达盒的DNA分子,以下简称MaSp1 RNA表达盒。MaSp1 RNA表达盒结构如图1所示,由T7启动子(核苷酸序列是序列1的第2537-2556位核苷酸)、与T7启动子相连的名称为3’内含子的内含子(核苷酸序列是序列1的第2557-2790位核苷酸,其中第2557-2785位为3’ss序列,第2786-2790位为3’端剪接位点)、与3’内含子相连的名称为单拷贝DNA的目的DNA(以下简称MaSp1基因,核苷酸序列是序列1的第2791-2895位核苷酸)和与MaSp1基因相连的名称为5’内含子的内含子(核苷酸序列是序列1的第2896-3073位核苷酸,其中第2896-2905位为5’端剪接位点,第2906-3073位为5’ss序列组成。序列表中序列1第2-282位为终止内含子及MaSp1基因转录的终止子,第484-1103位为复制起始位点。
MaSp1基因不含转录终止子。MaSp1基因不含终止密码子。MaSp1基因编码MaSp1,MaSp1是氨基酸序列为序列表中序列2(SEQ ID No.2)的蛋白质。3’内含子和5’内含子满足条件A,所述条件A为在所述重组细胞中所述单拷贝DNA表达盒转录出的前体RNA通过碱基互补配对形成剪接泡,并通过剪接反应(G-OH催化发生剪接反应)产生成熟的环状单链RNA分子(机理见图2)。
3’内含子含有3’ss序列和3’端剪接位点;所述3’ss序列的核苷酸序列为序列1的第2557-2785位,包含6个名称分别为3’sp1基因、3’sp2基因、3’sp3基因、3’sp4基因、3’sp5基因和3’sp6基因的剪接泡编码DNA,所述3’sp1基因的核苷酸序列为序列1的第2560-2581位,所述3’sp2基因的核苷酸序列为序列1的第2645-2656位,所述3’sp3基因的核苷酸序列为序列1的第2660-2673位,所述3’sp4基因的核苷酸序列为序列1的第2685-2704位,所述3’sp5基因的核苷酸序列为序列1的第2719-2737位,所述3’sp6基因的核苷酸序列为序列1的第2738-2753位;所述3’端剪接位点的核苷酸序列为序列1的第2786-2790位。
5’内含子含有5’端剪接位点和5’ss序列;所述5’端剪接位点的核苷酸序列为序列1的第2896-2905位;所述5’ss序列的核苷酸序列为序列1的2906-3073位,包含4个名称分别为5’sp1基因、5’sp2基因、5’sp3基因、和5’sp4基因的剪接泡编码DNA,所述5’sp1基因的核苷酸序列为序列1的第2918-2939位,所述5’sp2基因的核苷酸序列为序列1的第2983-2992位,所述5’sp3基因的核苷酸序列为序列1的第2997-3047位,所述5’sp4基因的核苷酸序列为序列1的第3020-3036位。
利用上述含有单拷贝DNA表达盒的表达载体pMaSp1制备串联重复DNA分子的机理是将pMaSp1导入受体细胞得到重组细胞,在重组细胞中,pMaSp1转录出图2中左图所示前体RNA,又称核mRNA前体(pre-mRNA)。在前体RNA中,3’内含子和5’内含子通过碱基互补配对形成剪接泡,通过G-OH催化发生剪接反应,进而成环,产生图2中右图所示的成熟的环状单链RNA分子,将其称为环形MaSp1 RNA。在体外,逆转录酶与环形MaSp1 RNA结合,在环形MaSp1RNA(为mRNA)上持续合成cDNA序列,进而生成MaSp1串联重复序列,得到串联重复DNA分子(图3)。具体过程如下:
1、制备含有单拷贝DNA表达盒的表达载体pMaSp1
pMaSp1采用模块化的方式构建,各个模块采用Goldengate的方法进行连接:在各个模块的两端加上限制性核酸内切酶BsaI的保护碱基和酶识别位点以及互补粘性末端,保护碱基和酶切位点以及互补粘性末端通过引物包埋的方式添加,具体如下:
1.1模块
pMaSp1的构建需要模块A和模块B:
模块A的脱氧核糖核苷酸序列如序列表的序列1的第2896-2790位所示,其中,第2896-3073位为5’内含子(其中第2896-2905位为5’端剪接位点,第2906-3073位为5’ss序列),第2-282位为终止内含子及MaSp1基因转录的终止子,第484-1103位为复制起始位点(pMB1)基因、第1500-2312位为作为筛选标记基因的安普霉素抗性基因,第2537-2556位为T7启动子,第2557-2790位为3’内含子(第2557-2785位为3’ss序列,第2786-2790位为3’端剪接位点)。
模块B含有MaSp1基因,模块B的脱氧核糖核苷酸序列如序列表的序列1的第2791-2895位所示。
1.2、模块的加工
在模块A的两端通过PCR反应添加限制性核酸内切酶BsaI的保护碱基和酶识别位点以及互补粘性末端,得到两端带有限制性核酸内切酶BsaI位点的模块A,命名为模块A-BsaI;该PCR反应所用的引物对为PartA-F和PartA-R。
PartA-F:5’-CCAGGTCTCAGATCTCAGGTCAATTGAGGCC-3’(带下划线的核苷酸为BsaI识别位点)
PartA-R:5’-CCAGGTCTCAGGTAGCATTATGTTCAGATAAGGTC-3’。(带下划线的核苷酸为BsaI识别位点)
模块B的两端通过PCR反应添加限制性核酸内切酶BsaI的保护碱基和酶识别位点以及互补粘性末端,得到两端带有限制性核酸内切酶BsaI位点的模块B,命名为模块B-BsaI;该PCR反应所用的引物对为PartB-F和PartB-R。
PartB-F:5’-CCAGGTCTCATACCAGCGGACGTGG-3’;(带下划线的核苷酸为BsaI识别位点)
PartB-R:5’-CCAGGTCTCAGATCCATTGTTCCCTGGC-3’(带下划线的核苷酸为BsaI识别位点)。
1.3、pMaSp1的构建
模块A-BsaI和模块B-BsaI通过如下体系连接成环形MaSp1 RNA制备质粒:20μL反应体系中模块A-BsaI 5.05E-8mol(约100ng),模块B-BsaI 2.7E-8mol;BsaI酶1μL,T4 DNA连接酶(T4 DNA Ligase)1μL,10x T4缓冲液(10x T4 buffer)2μL,10xBSA蛋白溶液2μL,用去离子水补齐至20μL。通过如下反应条件进行连接:37℃反应3min;25℃反应4min,共进行25个循环;50℃反应5min切除未连接的片段,然后80℃反应5min灭活酶。反应结束后,获得pMaSp1的Goldengate反应液。
取5μL的pMaSp1的Goldengate反应液转入大肠杆菌DH5α感受态细胞中,并在硫酸安普霉素浓度为50μg/mL的固体LB培养基上筛选,挑菌测序,筛选构建正确的质粒,对质粒进行扩增和提取,得到pMaSp1。
2、环形MaSp1 RNA的构建与验证
取0.5μL的pMaSp1转入大肠杆菌BL21(DE3)感受态细胞中,在硫酸安普霉素浓度为50μg/mL的固体LB培养基上筛选,获得大肠杆菌BL21(DE3)阳性转化子(转入pMaSp1的重组细胞),将大肠杆菌BL21(DE3)阳性转化子转入硫酸安普霉素浓度为50μg/mL的液体LB培养基中,37℃培养至OD600nm≈0.4,用1mM的异丙基-β-D-硫代半乳糖苷(IPTG)诱导12h,取1mL菌液,12000rmp离心2min,弃上清,使用RNAprep Pure培养细胞/细菌总RNA提取试剂盒,按照说明书记载的方法提取大肠杆菌BL21(DE3)阳性转化子的总RNA。
利用Rever Tra Ace qPCRRT kit cDNA合成试剂盒,按照说明书记载的方法将总RNA逆转录为cDNA。
利用引物对Testify cirMaSp1-F和Testify cirMaSp1-R对cDNA进行PCR反应验证MaSp1 RNA是否成环。
Testify cirMaSp1-F:5’-CAGGACAGGGAGGATATGGA-3’
Testify cirMaSp1-R:5’-CTCCTCCCATGGCTGC-3’。
验证使用的DNA聚合酶为2xEs Taq MasterMix(含染料)。将PCR反应完成后的样品跑胶,电泳图见图4。将分子量大小为100bp的条带送去测序,MaSp1 RNA剪接点(Splicejunction)的sanger测序结果见图5。通过测序我们发现5’端剪接位点与3’端剪接位点连接在一起,从而表明MaSp1 RNA已成环,总RNA即为环形MaSp1 RNA。
3、串联重复MaSp1的制备
利用Rever Tra Ace qPCRRT kit cDNA试剂盒,按照说明书方法将总RNA逆转录为cDNA,即得到MaSp1 cDNA。
再用引物对repeatedMaSp1-F和repeatedMaSp1-R对cDNA进行PCR反应。
repeated MaSp1-F:5’-AGCGGACGTGGTGG-3’
repeated MaSp1-R:5’-TGTTCCCTGGCTTCCCA-3’。
使用的DNA聚合酶为2xEs Taq MasterMix(含染料)。PCR反应体系:2xEs TaqMasterMix(含染料)25μL,repeatedMaSp1-F 2.5μL,repeated MaSp1-R 2.5μL,MaSp1cDNA4μL,用ddH2O补齐至20μL。PCR反应程序:95℃预热10min;95℃变性15s,55℃复性15s,72℃延伸1min,重复25个循环;最后72℃延伸5min。
PCR样品跑胶的电泳图见图6,切取分子量最大的条带(图中画线标出的条带)进行胶回收。
将回收的条带插入T载体pMD 18-T vector进行蓝白斑筛选。挑取白色菌落,用M13-F和M-13-R进行菌落PCR验证。通过该方法获得最大的条带分子量大概在1.5kb左右,重复单元长度是123bp,1.5kb的条带大约包含10个蛛丝蛋白基因(MaSp1)重复单元,即为MaSp10。测序结果表明该1.5kb的DNA分子是一条链(编码链)的核苷酸序列是序列表序列1第2791-2895位的DNA分子,是10个MaSp1基因串联得到的串联重复DNA分子。
将插入条带分子量最大的菌落接种在氨苄青霉素浓度为100μg/mL的液体LB培养基中,37℃培养过夜,收集菌液提质粒。
通过引物包埋在条带两端添加同尾酶酶切位点,则通过同尾酶无缝拼接可以依次获得MaSp20,MaSp40,MaSp80等重复次数更多的重组蛛丝蛋白基因。
利用此方法仅需4天便可获得重复10次的串联重复MaSp1,大大缩短了传统方法从MaSp1到MaSp8的时间。
实施例2、制备lir
本实施例制备了名称为plir的含有单拷贝DNA表达盒的表达载体,plir是一条链的核苷酸序列是序列表中序列3(SEQ ID No.3)的双链DNA。序列3中,第1500-2312位为安普霉素抗性基因;第2537位-第3079位为名称为单拷贝DNA表达盒的DNA分子,以下简称lirRNA表达盒。lirRNA表达盒结构如图7所示,由T7启动子(核苷酸序列是序列3的第2537-2556位核苷酸)、与T7启动子相连的名称为3’内含子的内含子(核苷酸序列是序列3的第2557-2790位核苷酸,其中第2557-2785位为3’ss序列,2786-2790位为3’端剪接位点)、与3’内含子相连的名称为单拷贝DNA的目的DNA(其中,序列3的第2791-2883位为lir基因,第2884-2904位为TEV酶识别位点)和与单拷贝DNA相连的名称为5’内含子的内含子(核苷酸序列是序列3的第2905-3079位核苷酸,其中第2905-2914位为5’端剪接位点,第2915-3079为5’ss基因)组成。序列表中序列3第2-282位为终止内含子及lir基因转录的终止子,第484-1103位为复制起始位点。
lir基因不含转录终止子。lir基因不含终止密码子。lir基因编码lir,lir是氨基酸序列为序列表中序列4(SEQ ID No.4)的蛋白质。3’内含子和5’内含子满足条件A,所述条件A为在所述重组细胞中所述单拷贝DNA表达盒转录出的前体RNA通过碱基互补配对形成剪接泡,并通过剪接反应(G-OH催化发生剪接反应)产生成熟的环状单链RNA分子(机理见图8)。
3’内含子含有3’ss序列和3’端剪接位点;所述3’ss序列的核苷酸序列为序列3的第2557-2785位,包含6个名称分别为3’sp1基因、3’sp2基因、3’sp3基因、3’sp4基因、3’sp5基因和3’sp6基因的剪接泡编码DNA,所述3’sp1基因的核苷酸序列为序列3的第2560-2581位,所述3’sp2基因的核苷酸序列为序列3的第2645-2656位,所述3’sp3基因的核苷酸序列为序列3的第2660-2673位,所述3’sp4基因的核苷酸序列为序列3的第2685-2704位,所述3’sp5基因的核苷酸序列为序列3的第2719-2737位,所述3’sp6基因的核苷酸序列为序列3的第2738-2753位;所述3’端剪接位点的核苷酸序列为序列3的第2786-2790位。
5’内含子含有5’端剪接位点和5’ss序列;所述5’端剪接位点的核苷酸序列为序列3的第2905-2914位;所述5’ss序列的核苷酸序列为序列3的2915-3079位,包含4个名称分别为5’sp1基因、5’sp2基因、5’sp3基因、和5’sp4基因的剪接泡编码DNA,所述5’sp1基因的核苷酸序列为序列3的第2927-2948位,所述5’sp2基因的核苷酸序列为序列3的第2992-3001位;所述5’sp3基因的核苷酸序列为序列3的第3006-3056位,所述5’sp4基因的核苷酸序列为序列3的第3029-3045位。
利用上述含有单拷贝DNA表达盒的表达载体plir制备串联重复DNA分子的机理是将plir导入受体细胞得到重组细胞,在重组细胞中,plir转录出图8中左图所示前体RNA,又称核mRNA前体(pre-mRNA)。在前体RNA中,3’内含子和5’内含子通过碱基互补配对形成剪接泡,通过G-OH催化发生剪接反应,进而成环,产生图8中右图所示的成熟的环状单链RNA分子,将其称为环形lir RNA。在体外,逆转录酶与环形lirRNA结合,在环形lir RNA(为mRNA)上持续合成cDNA序列,进而生成lir串联重复序列,得到串联重复DNA分子(图9)。具体过程如下:
1、制备含有单拷贝DNA表达盒的表达载体plir
plir采用模块化的方式构建,各个模块采用Goldengate的方法进行连接:在各个模块的两端加上限制性核酸内切酶BsaI的保护碱基和酶识别位点以及互补粘性末端,保护碱基和酶切位点、互补粘性末端通过引物包埋的方式添加,具体如下:
1.1模块
plir的构建需要模块C和模块D:
模块C的脱氧核糖核苷酸序列如序列表的序列3的第2905-2790位,第2905-3079位为5’内含子(其中第2905-2914位为5’端剪接位点,第2915-3079为5’ss基因),第2-282位为终止内含子及MaSp1基因转录的终止子,第484-1103位为复制起始位点(pMB1)基因、第1500-2312位为作为筛选标记基因的安普霉素抗性基因,第2537-2556位为T7启动子,第2557-2790位为3’内含子(其中第2557-2785位为3’ss基因,2786-2790位为3’端剪接位点)。
模块D含有lir基因和TEV酶识别位点,模块D的脱氧核糖核苷酸序列如序列表序列3的第2791-2904位为lir基因和TEV酶识别位点(其中第2791-2883位为lir基因,第2884-2904位为TEV酶识别位点)。
1.2、模块的加工
在模块C的两端通过PCR反应添加限制性核酸内切酶BsaI的保护碱基和酶切位点以及互补粘性末端,得到两端带有限制性核酸内切酶BsaI位点的模块C,命名为模块C-BsaI;该PCR反应所用的引物对为PartC-F和PartC-R。
PartC-F:5’-CCAGGTCTCAGATCTCAGGTCAATTGAGGCC-3’(带下划线的核苷酸为BsaI识别位点)
PartC-R:5’-CCAGGTCTCAGGTAGCATTATGTTCAGATAAGGTC-3’(带下划线的核苷酸为BsaI识别位点)
在模块D的两端通过PCR反应添加限制性核酸内切酶BsaI的保护碱基和酶切位点以及互补粘性末端,得到两端带有限制性核酸内切酶BsaI位点的模块D,命名为模块D-BsaI;该PCR反应所用的引物对为PartD-F和PartD-R。
PartD-F:5’-CCAGGTCTCATACCCACGCGGAGGGTACC-3’(带下划线的核苷酸为BsaI识别位点)
PartD-R:5’-CCAGGTCTCAGATCGCCCTGAAAATACAGGTTTTCGCCACGAC CACGAAC-3’。(带下划线的核苷酸为BsaI识别位点)。
1.3、plir的构建
模块C-BsaI和模块D-BsaI通过如下体系连接成环形lir RNA制备质粒:20μL反应体系中模块C-BsaI 5.05E-8mol(约100ng),模块D-BsaI 5.05E-8mol;BsaI酶1μL,T4 DNA连接酶(T4 DNA Ligase)1μL,10x T4缓冲液(10x T4 buffer)2μL,10xBSA蛋白溶液2μL,用去离子水补齐至20μL。通过如下反应条件进行连接:37℃反应3min;25℃反应4min,共进行25个循环;50℃反应5min切除未连接的片段,然后80反应5min灭活酶。反应结束后,获得plir的Goldgate反应液。
取5μL的plir的Goldengate反应液化转入大肠杆菌DH5α感受态细胞中,并在硫酸安普霉素浓度为50μg/mL的固体LB培养基上筛选,挑菌测序,筛选构建正确的质粒,对质粒进行扩增和提取,得到plir。
2、环形lir RNA的构建与验证
取0.5μL的plir转入大肠杆菌BL21(DE3)感受态细胞中,在硫酸安普霉素浓度为50μg/mL的固体LB培养基上筛选,获得大肠杆菌BL21(DE3)阳性转化子(转入plir的重组重组细胞),将大肠杆菌BL21(DE3)阳性转化子转入硫酸安普霉素浓度为50μg/mL的液体LB培养基中,37℃培养至OD600nm≈0.4,用1mM的异丙基-β-D-硫代半乳糖苷(IPTG)诱导12h,取1mL菌液,12000rmp离心2min,弃上清,使用RNA prep Pure培养细胞/细菌总RNA提取试剂盒,按照说明书记载的方法提取大肠杆菌BL21(DE3)阳性转化子的总RNA。
利用Rever Tra Ace qPCRRT kit cDNA合成试剂盒,按照说明书记载的方法将总RNA逆转录为cDNA。
利用引物对Testify cirlir-F和Testify cirlir-R对cDNA进行PCR反应验证lirRNA是否成环。
Testify cirlir-F:5’-CCTCCAGGTAGCTGCT-3’
Testify cirlir-R:5’-GTCAGGCGGCGAAGG-3’。
验证使用的DNA聚合酶为2xEs Taq MasterMix(含染料)。将PCR反应完成后的样品跑胶,电泳图见图10。将分子量大小为100bp的条带送去测序,lir RNA剪接点(Splicejunction)的sanger测序结果见图11。通过测序我们发现5’端剪接位点与3’端剪接位点连接在一起,验证结果表明lir RNA已成环,总RNA即为环形lir RNA。
3、串联重复lir的制备
利用Rever Tra Ace qPCRRT kit cDNA试剂盒,按照说明书方法将总RNA逆转录为cDNA,即得到lir cDNA。
再利用引物对repeated lir-F(5’-CACGCGGAGGGTAC-3’)和repeated lir-R(5’-GCCACGACCACGAAC-3’)对cDNA进行PCR反应。
repeated lir-F:5’-CACGCGGAGGGTAC-3’
repeated lir-R:5’-GCCACGACCACGAAC-3’。
使用的DNA聚合酶为2xEs Taq MasterMix(含染料)。PCR反应体系:2xEs TaqMasterMix(含染料)25μL,repeated lir-F 2.5μL,repeated lir-R 2.5μL,lir cDNA4μL,用ddH2O补齐至20μL。PCR反应程序:95℃预热10min;95℃变性15s,55℃复性15s,72℃延伸1min,重复25个循环;最后72℃延伸5min。
PCR样品跑胶的电泳图见图12,切取分子量最大的条带(图中画线标出的条带)进行胶回收。
将回收的条带插入T载体pMD 18-T vector进行蓝白斑筛选。挑取白色菌落,用M13-F和M-13-R进行菌落PCR验证。通过该方法获得最大的条带分子量大概在1k左右,重复单元长度是129bp,1k的条带大约含有7个lir的拷贝,即为lir+蛋白酶TEV识别位点的串联重复片段。
将拷贝数为7的串联重复片段插入pET21b载体中得到pET21b-lir载体。再将pET21b-lir载体转入大肠杆菌BL21感受态细胞,在硫酸安普霉素浓度为50μg/mL的固体LB培养基上涂板,37℃培养过夜。挑取菌株诱导lir串联重复蛋白的表达,并纯化该蛋白,最后用TEV蛋白酶处理lir串联重复蛋白,将其降解为lir小肽。
以上对本发明进行了详述。对于本领域技术人员来说,在不脱离本发明的宗旨和范围,以及无需进行不必要的实验情况下,可在等同参数、浓度和条件下,在较宽范围内实施本发明。虽然本发明给出了特殊的实施例,应该理解为,可以对本发明作进一步的改进。总之,按本发明的原理,本申请欲包括任何变更、用途或对本发明的改进,包括脱离了本申请中已公开范围,而用本领域已知的常规技术进行的改变。按以下附带的权利要求的范围,可以进行一些基本特征的应用。
序列表
<110> 中国科学院天津工业生物技术研究所
<120> 制备串联重复DNA的方法及相关生物材料与应用
<130> GNCSY200931
<160> 4
<170> SIPOSequenceListing 1.0
<210> 1
<211> 3073
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
tagcatccaa actcgagtaa ggatctccag gcatcaaata aaacgaaagg ctcagtcgaa 60
agactgggcc tttcgtttta tctgttgttt gtcggtgaac gctctctact agagtcacac 120
tggctcacct tcgggtgggc ctttctgcgt ttatacctag ggcgttcggc tgcggctcta 180
cttttgtttg ttagtcttga tgcttcactg atagatacaa gagccataag aacctcagat 240
ccttccgtat ttagccagta tgttctctag tgtggttcgt tgagcgacag atcgctgaga 300
taggtgcctc actgattaag cattggtaac tgtcagacca agtttactca tatatacttt 360
agattgattt aaaacttcat ttttaattta aaaggatcta ggtgaagatc ctttttgata 420
atctcatgac caaaatccct taacgtgagt tttcgttcca ctgagcgtca gaccccgtag 480
aaaagatcaa aggatcttct tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa 540
caaaaaaacc accgctacca gcggtggttt gtttgccgga tcaagagcta ccaactcttt 600
ttccgaaggt aactggcttc agcagagcgc agataccaaa tactgtcctt ctagtgtagc 660
cgtagttagg ccaccacttc aagaactctg tagcaccgcc tacatacctc gctctgctaa 720
tcctgttacc agtggctgct gccagtggcg ataagtcgtg tcttaccggg ttggactcaa 780
gacgatagtt accggataag gcgcagcggt cgggctgaac ggggggttcg tgcacacagc 840
ccagcttgga gcgaacgacc tacaccgaac tgagatacct acagcgtgag ctatgagaaa 900
gcgccacgct tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa 960
caggagagcg cacgagggag cttccagggg gaaacgcctg gtatctttat agtcctgtcg 1020
ggtttcgcca cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc 1080
tatggaaaaa cgccagcaac gcggcctttt tacggttcct ggccttttgc tggccttttg 1140
ctcacatgtt ctttcctgcg atttaaattt aattaagtgt aggctggagc tgcttcgaag 1200
ttcctatact ttctagagaa taggaacttc ggaataggaa cttcaagatc ccctcacgct 1260
gccgcaagca cgtgatcgaa atccagatcc ttgacccgca gttgcaaacc ctcactgatc 1320
cggctcacgg taactgatgc cgtatttgca gtaccagcgt acggcccaca gaatgatgtc 1380
acgctgaaaa tgccggcctt tgaatgggtt catgtgcagc tccatcagca aaaggggatg 1440
ataagtttat caccaccgac tatttgcaac agtgccgttg atcgtgctat gatcgactga 1500
tgtcatcagc ggtggagtgc aatgtcgtgc aatacgaatg gcgaaaagcc gagctcatcg 1560
gtcagcttct caaccttggg gttacccccg gcggtgtgct gctggtccac agctccttcc 1620
gtagcgtccg gcccctcgaa gatgggccac ttggactgat cgaggccctg cgtgctgcgc 1680
tgggtccggg agggacgctc gtcatgccct cgtggtcagg tctggacgac gagccgttcg 1740
atcctgccac gtcgcccgtt acaccggacc ttggagttgt ctctgacaca ttctggcgcc 1800
tgccaaatgt aaagcgcagc gcccatccat ttgcctttgc ggcagcgggg ccacaggcag 1860
agcagatcat ctctgatcca ttgcccctgc cacctcactc gcctgcaagc ccggtcgccc 1920
gtgtccatga actcgatggg caggtacttc tcctcggcgt gggacacgat gccaacacga 1980
cgctgcatct tgccgagttg atggcaaagg ttccctatgg ggtgccgaga cactgcacca 2040
ttcttcagga tggcaagttg gtacgcgtcg attatctcga gaatgaccac tgctgtgagc 2100
gctttgcctt ggcggacagg tggctcaagg agaagagcct tcagaaggaa ggtccagtcg 2160
gtcatgcctt tgctcggttg atccgctccc gcgacattgt ggcgacagcc ctgggtcaac 2220
tgggccgaga tccgttgatc ttcctgcatc cgccagaggg cgggatgcga agaatgcgat 2280
gccgctcgcc agtcgattgg ctgagctcat gagcggagaa cgagatgacg ttggaggggc 2340
aaggtcgcgc tgattgctgg ggcaacacgt gaaaggcgag atcaccaagg tagtcggcaa 2400
ataatgtcta acaattcgtt caagccgacg ccgcttcgcg gcgcggctta actcaagcgt 2460
tagatgcact aagcacataa ttgctcacag ccaaactatc aggtcaagtc tgctctagca 2520
cctgaagtca gcctgttaat acgactcact atagggaatt ctagagaaaa tttcgtctgg 2580
attagttact tatcgtgtaa aatctgataa atggaattgg ttctacataa atgcctaacg 2640
actatccctt tggggagtag ggtcaagtga ctcgaaacga tagacaactt gctttaacaa 2700
gttggagata tagtctgctc tgcatggtga catgcagctg gatataattc cggggtaaga 2760
ttaacgacct tatctgaaca taatgctacc agcggacgtg gtggactggg aggacaggga 2820
gcaggaatgg cagcagcagc agccatggga ggagcaggac agggaggata tggaggactg 2880
ggaagccagg gaacaatgga tctcaggtca attgaggcct gagtataagg tgacttatac 2940
ttgtaatcta tctaaacggg gaacctctct agtagacaat cccgtgctaa attgtaggac 3000
tgccctttaa taaatacttc tatatttaaa gaggtattta tgaaaagcgg aatttatcag 3060
attaaaaata ctt 3073
<210> 2
<211> 35
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 2
Ser Gly Arg Gly Gly Leu Gly Gly Gln Gly Ala Gly Met Ala Ala Ala
1 5 10 15
Ala Ala Met Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser
20 25 30
Gln Gly Thr
35
<210> 3
<211> 3079
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
tagcatccaa actcgagtaa ggatctccag gcatcaaata aaacgaaagg ctcagtcgaa 60
agactgggcc tttcgtttta tctgttgttt gtcggtgaac gctctctact agagtcacac 120
tggctcacct tcgggtgggc ctttctgcgt ttatacctag ggcgttcggc tgcggctcta 180
cttttgtttg ttagtcttga tgcttcactg atagatacaa gagccataag aacctcagat 240
ccttccgtat ttagccagta tgttctctag tgtggttcgt tgagcgacag atcgctgaga 300
taggtgcctc actgattaag cattggtaac tgtcagacca agtttactca tatatacttt 360
agattgattt aaaacttcat ttttaattta aaaggatcta ggtgaagatc ctttttgata 420
atctcatgac caaaatccct taacgtgagt tttcgttcca ctgagcgtca gaccccgtag 480
aaaagatcaa aggatcttct tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa 540
caaaaaaacc accgctacca gcggtggttt gtttgccgga tcaagagcta ccaactcttt 600
ttccgaaggt aactggcttc agcagagcgc agataccaaa tactgtcctt ctagtgtagc 660
cgtagttagg ccaccacttc aagaactctg tagcaccgcc tacatacctc gctctgctaa 720
tcctgttacc agtggctgct gccagtggcg ataagtcgtg tcttaccggg ttggactcaa 780
gacgatagtt accggataag gcgcagcggt cgggctgaac ggggggttcg tgcacacagc 840
ccagcttgga gcgaacgacc tacaccgaac tgagatacct acagcgtgag ctatgagaaa 900
gcgccacgct tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa 960
caggagagcg cacgagggag cttccagggg gaaacgcctg gtatctttat agtcctgtcg 1020
ggtttcgcca cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc 1080
tatggaaaaa cgccagcaac gcggcctttt tacggttcct ggccttttgc tggccttttg 1140
ctcacatgtt ctttcctgcg atttaaattt aattaagtgt aggctggagc tgcttcgaag 1200
ttcctatact ttctagagaa taggaacttc ggaataggaa cttcaagatc ccctcacgct 1260
gccgcaagca cgtgatcgaa atccagatcc ttgacccgca gttgcaaacc ctcactgatc 1320
cggctcacgg taactgatgc cgtatttgca gtaccagcgt acggcccaca gaatgatgtc 1380
acgctgaaaa tgccggcctt tgaatgggtt catgtgcagc tccatcagca aaaggggatg 1440
ataagtttat caccaccgac tatttgcaac agtgccgttg atcgtgctat gatcgactga 1500
tgtcatcagc ggtggagtgc aatgtcgtgc aatacgaatg gcgaaaagcc gagctcatcg 1560
gtcagcttct caaccttggg gttacccccg gcggtgtgct gctggtccac agctccttcc 1620
gtagcgtccg gcccctcgaa gatgggccac ttggactgat cgaggccctg cgtgctgcgc 1680
tgggtccggg agggacgctc gtcatgccct cgtggtcagg tctggacgac gagccgttcg 1740
atcctgccac gtcgcccgtt acaccggacc ttggagttgt ctctgacaca ttctggcgcc 1800
tgccaaatgt aaagcgcagc gcccatccat ttgcctttgc ggcagcgggg ccacaggcag 1860
agcagatcat ctctgatcca ttgcccctgc cacctcactc gcctgcaagc ccggtcgccc 1920
gtgtccatga actcgatggg caggtacttc tcctcggcgt gggacacgat gccaacacga 1980
cgctgcatct tgccgagttg atggcaaagg ttccctatgg ggtgccgaga cactgcacca 2040
ttcttcagga tggcaagttg gtacgcgtcg attatctcga gaatgaccac tgctgtgagc 2100
gctttgcctt ggcggacagg tggctcaagg agaagagcct tcagaaggaa ggtccagtcg 2160
gtcatgcctt tgctcggttg atccgctccc gcgacattgt ggcgacagcc ctgggtcaac 2220
tgggccgaga tccgttgatc ttcctgcatc cgccagaggg cgggatgcga agaatgcgat 2280
gccgctcgcc agtcgattgg ctgagctcat gagcggagaa cgagatgacg ttggaggggc 2340
aaggtcgcgc tgattgctgg ggcaacacgt gaaaggcgag atcaccaagg tagtcggcaa 2400
ataatgtcta acaattcgtt caagccgacg ccgcttcgcg gcgcggctta actcaagcgt 2460
tagatgcact aagcacataa ttgctcacag ccaaactatc aggtcaagtc tgctctagca 2520
cctgaagtca gcctgttaat acgactcact atagggaatt ctagagaaaa tttcgtctgg 2580
attagttact tatcgtgtaa aatctgataa atggaattgg ttctacataa atgcctaacg 2640
actatccctt tggggagtag ggtcaagtga ctcgaaacga tagacaactt gctttaacaa 2700
gttggagata tagtctgctc tgcatggtga catgcagctg gatataattc cggggtaaga 2760
ttaacgacct tatctgaaca taatgctacc cacgcggagg gtaccttcac cagcgacgtg 2820
agcagctacc tggagggtca ggcggcgaag gaatttattg cgtggctggt tcgtggtcgt 2880
ggcgaaaacc tgtattttca gggcgatctc aggtcaattg aggcctgagt ataaggtgac 2940
ttatacttgt aatctatcta aacggggaac ctctctagta gacaatcccg tgctaaattg 3000
taggactgcc ctttaataaa tacttctata tttaaagagg tatttatgaa aagcggaatt 3060
tatcagatta aaaatactt 3079
<210> 4
<211> 31
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 4
His Ala Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly
1 5 10 15
Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Arg Gly Arg Gly
20 25 30

Claims (14)

1.一种制备串联重复DNA分子的方法,其特征在于:所述方法包括将含有名称为单拷贝DNA表达盒的双链DNA分子的表达载体导入受体细胞得到重组细胞,提取所述重组细胞的总RNA,将所述总RNA逆转录成cDNA,得到串联重复DNA分子;所述单拷贝DNA表达盒含有启动子,与所述启动子相连的名称为3’内含子的内含子,与所述3’内含子相连的名称为单拷贝DNA的目的DNA,与所述单拷贝DNA相连的名称为5’内含子的内含子;所述3’内含子和所述5’内含子满足条件A,所述条件A为在所述重组细胞中所述单拷贝DNA表达盒转录出的前体RNA通过碱基互补配对形成剪接泡,并通过剪接反应产生成熟的环状单链RNA分子,所述单拷贝DNA不含终止子;
所述满足条件A的所述3’内含子和所述5’内含子为如下一对内含子:
3’内含子含有3’ss序列和3’端剪接位点;所述3’ss包含6个名称分别为3’sp1基因、3’sp2基因、3’sp3基因、3’sp4基因、3’sp5基因和3’sp6基因的剪接泡编码DNA,所述3’sp1基因的核苷酸序列为序列1的第2560-2581位,所述3’sp2基因的核苷酸序列为序列1的第2645-2656位,所述3’sp3基因的核苷酸序列为序列1的第2660-2673位,所述3’sp4基因的核苷酸序列为序列1的第2685-2704位,所述3’sp5基因的核苷酸序列为序列1的第2719-2737位,所述3’sp6基因的核苷酸序列为序列1的第2738-2753位;所述3’端剪接位点的核苷酸序列为序列1的第2786-2790位;
5’内含子含有5’端剪接位点和5’ss序列;所述5’端剪接位点的核苷酸序列为序列1的第2896-2905位;所述5’ss序列包含4个名称分别为5’sp1基因、5’sp2基因、5’sp3基因、和5’sp4基因的剪接泡编码DNA,所述5’sp1基因的核苷酸序列为序列1的第2918-2939位,所述5’sp2基因的核苷酸序列为序列1的第2983-2992位,所述5’sp3基因的核苷酸序列为序列1的第2997-3047位,所述5’sp4基因的核苷酸序列为序列1的第3020-3036位。
2.根据权利要求1所述的方法,其特征在于:所述单拷贝DNA表达盒由启动子,所述3’内含子、所述单拷贝DNA和所述5’内含子连接而成。
3.根据权利要求1所述的方法,其特征在于:所述单拷贝DNA为目的基因,所述目的基因不含终止密码子。
4.根据权利要求2所述的方法,其特征在于:所述单拷贝DNA为目的基因,所述目的基因不含终止密码子。
5.根据权利要求3所述的方法,其特征在于:所述目的基因编码MaSp1或所述目的基因编码利拉鲁肽,所述MaSp1是氨基酸序列为序列表中序列2的蛋白质,所述利拉鲁肽氨基酸序列为序列表中序列4的多肽。
6.根据权利要求4所述的方法,其特征在于:所述目的基因编码MaSp1或所述目的基因编码利拉鲁肽,所述MaSp1是氨基酸序列为序列表中序列2的蛋白质,所述利拉鲁肽氨基酸序列为序列表中序列4的多肽。
7.根据权利要求1-6中任一所述的方法,其特征在于:所述受体细胞为原核微生物细胞。
8.根据权利要求7所述的方法,其特征在于:所述受体细胞为革兰氏阴性细菌细胞。
9.根据权利要求8所述的方法,其特征在于:所述受体细胞为埃希氏菌属细菌细胞。
10.根据权利要求9所述的方法,其特征在于:所述受体细胞为大肠杆菌BL21(DE3)细胞。
11.根据权利要求1-6中任一所述的方法,其特征在于:所述3’内含子是一条链的核苷酸序列为序列1的第2557-2790位核苷酸的双链DNA,所述5’内含子是一条链的核苷酸序列为序列1的第2896-3073位核苷酸的双链DNA或序列3的第2905-3079位核苷酸的双链DNA。
12.根据权利要求1-6中任一所述的方法,其特征在于:所述单拷贝DNA表达盒是一条链的核苷酸序列为序列表中序列1的第2537位-第3073的双链DNA分子,或所述单拷贝DNA表达盒是一条链的核苷酸序列为序列表中序列3的第2537位-第3079位的双链DNA分子;
或所述表达载体为一条链的核苷酸序列为序列表中序列1的双链DNA分子,或所述表达载体为一条链的核苷酸序列为序列表中序列3的双链DNA分子。
13.下述任一种产品:
A1)权利要求1-12中任一所述方法中的所述名称为单拷贝DNA表达盒的双链DNA分子;
A2)含有A1)所述双链DNA分子的载体;
A3)含有A1)所述双链DNA分子的重组微生物。
14.权利要求1-12中任一所述方法或权利要求13所述的产品在制备串联重复蛋白质中的应用。
CN202010927574.9A 2020-09-07 2020-09-07 制备串联重复dna的方法及相关生物材料与应用 Active CN112080493B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010927574.9A CN112080493B (zh) 2020-09-07 2020-09-07 制备串联重复dna的方法及相关生物材料与应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010927574.9A CN112080493B (zh) 2020-09-07 2020-09-07 制备串联重复dna的方法及相关生物材料与应用

Publications (2)

Publication Number Publication Date
CN112080493A CN112080493A (zh) 2020-12-15
CN112080493B true CN112080493B (zh) 2021-12-28

Family

ID=73731492

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010927574.9A Active CN112080493B (zh) 2020-09-07 2020-09-07 制备串联重复dna的方法及相关生物材料与应用

Country Status (1)

Country Link
CN (1) CN112080493B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116162638A (zh) * 2023-02-22 2023-05-26 中国科学院天津工业生物技术研究所 细菌中水平转移基因激活介导的基因串联重复的诱导方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5192391B2 (ja) * 2005-12-30 2013-05-08 スパイバー・テクノロジーズ・アーベー クモ糸タンパク質およびクモ糸タンパク質の生産方法
CN101412749A (zh) * 2008-10-29 2009-04-22 台桂香 Muc1串联重复序列多肽及其制备工艺以及作为抗肿瘤药物的应用
CN102167733A (zh) * 2010-11-17 2011-08-31 江苏大学 一种可酸切高拷贝降血压肽串联基因的构建、表达及应用
CN102747085A (zh) * 2011-04-22 2012-10-24 天津科技大学 多拷贝增味肽表达基因的构建及表达
CN103555749B (zh) * 2012-12-29 2015-06-24 湖北大学 一种离体构建多拷贝毕赤酵母表达载体的方法
AU2016305360B2 (en) * 2015-08-10 2021-11-04 Seevix Material Sciences Ltd. Compositions and methods for fabricating synthetic dragline spider silk
CN107312094B (zh) * 2017-07-06 2019-12-24 上海海洋大学 一种杂合抗菌肽及其制备方法和应用

Also Published As

Publication number Publication date
CN112080493A (zh) 2020-12-15

Similar Documents

Publication Publication Date Title
KR102622910B1 (ko) Pd-1 호밍 엔도뉴클레아제 변이체, 조성물 및 사용 방법
CN109486737B (zh) 一种高产l-色氨酸的重组大肠杆菌及其构建方法
JP7482544B2 (ja) 所定の標的に対して親和性を有するヒトリポカリン2(Lcn2、hNGAL)の突然変異タンパク質
DK2640740T3 (en) MUTEINS OF HUMAN LIPOCALIN 2 WITH AFFINITY FOR GLYPICAN-3 (GPC3)
CA2473187C (en) Mismatch endonucleases and methods of use
CN107641631A (zh) 一种由化学转化介导的基于CRISPR/Cas9系统敲除大肠杆菌基因的方法
AU2016278242A1 (en) Vectors for use in an inducible coexpression system
CN114457100B (zh) 一种基于CRISPR/Cpf1的大肠杆菌基因编辑系统及其应用
CN112080493B (zh) 制备串联重复dna的方法及相关生物材料与应用
CN114423780A (zh) 用于控制肠道沙门氏菌的细菌素
CN116083398B (zh) 分离的Cas13蛋白及其应用
KR20210038626A (ko) 아데노바이러스 펜톤 염기의 젤리롤 폴드 도메인에서 유래된 다량체화 폴리펩타이드
CN106591344A (zh) 一种融合分子伴侣标签的大肠杆菌热诱导可溶性蛋白表达载体及其应用
CN111621522A (zh) 一种培育肠道特异性表达红色荧光转基因斑马鱼的方法
CN103330947B (zh) 一种用于弓形虫感染预防的疫苗及其应用
KR101808192B1 (ko) 7-아미노세팔로스포란산의 고농도 생산 재조합 아크레모니움 크리소제눔 균주의 제조방법 및 이 방법으로 제조된 균주
AU2016289877A1 (en) Method for gene optimization
CN112430617A (zh) 用于谷氨酸棒杆菌基因改造的带有阴性筛选标记的质粒
KR102194740B1 (ko) 7-adca 제조를 위한 데아세트옥시세팔로스포린 c의 고농도 생산 재조합 아크레모니움 크리소제눔 균주의 제조방법 및 이 방법으로 제조된 균주
CN107502619B (zh) 一组干酪乳杆菌基因敲除载体及其应用
CN108714210B (zh) 重组减毒李斯特菌在制备间皮素高表达癌症治疗性疫苗中的应用
CN109554322B (zh) 一种高产l-苏氨酸的重组大肠杆菌及其构建方法
CN110734926A (zh) 一种内切葡聚糖酶表达载体及其构建方法与应用
KR20230142572A (ko) 그램 음성 세균의 감염 치료에 효과적인 항균성 조성물 및 이의 제조 방법
CN101993885A (zh) 一种新型高效重组质粒载体及其应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant