CN100347298C - 鱼类肌肉生长抑素mstn基因克隆及其基因打靶载体构建 - Google Patents

鱼类肌肉生长抑素mstn基因克隆及其基因打靶载体构建 Download PDF

Info

Publication number
CN100347298C
CN100347298C CNB2005101047684A CN200510104768A CN100347298C CN 100347298 C CN100347298 C CN 100347298C CN B2005101047684 A CNB2005101047684 A CN B2005101047684A CN 200510104768 A CN200510104768 A CN 200510104768A CN 100347298 C CN100347298 C CN 100347298C
Authority
CN
China
Prior art keywords
gene
mstn
sequence
fish
neo
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB2005101047684A
Other languages
English (en)
Other versions
CN1831136A (zh
Inventor
陈松林
叶寒青
沙珍霞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yellow Sea Fisheries Research Institute Chinese Academy of Fishery Sciences
Original Assignee
Yellow Sea Fisheries Research Institute Chinese Academy of Fishery Sciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yellow Sea Fisheries Research Institute Chinese Academy of Fishery Sciences filed Critical Yellow Sea Fisheries Research Institute Chinese Academy of Fishery Sciences
Priority to CNB2005101047684A priority Critical patent/CN100347298C/zh
Publication of CN1831136A publication Critical patent/CN1831136A/zh
Application granted granted Critical
Publication of CN100347298C publication Critical patent/CN100347298C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

一种鱼类肌肉生长抑素MSTN基因及其基因打靶载体,它的方法是分离克隆了花鲈MSTN基因,其全长为4873bp,包括3个外显子,2个内含子,5’调控序列和非翻译区以及3’非翻译区。根据测定出的花鲈MSTN基因序列,设计引物,扩增得到该基因的一个3.2KB的长片段和一个1.5KB的短片段,将这两个片段依次连接到pBSII+KS载体上,获得重组载体p+MSTN3.2+MSTN1.5,然后将正选择标记基因neo片段连接到上述MSTN基因长片段和短片段的中间,形成p+MSTN3.2+MSTN1.5+neo的重组载体;最后将负选择标记基因SVTK-tk片段连接到上述长片段的侧翼,最后获得p+MSTN3.2+MSTN1.5+neo+tk的基因打靶载体。本发明克隆了鱼类MSTN全长基因,并首次构建了鱼类MSTN基因打靶载体,可用于各种鱼类MSTN基因克隆及基因打靶载体的构建,在鱼类基因工程育种上具有重要应用价值。

Description

鱼类肌肉生长抑素MSTN基因克隆及其基因打靶载体构建
所属技术领域:
本发明属于生物技术领域中的鱼类基因工程技术,是一种能在鱼类遗传改良中应用的鱼类肌肉生长抑制基因及其基因打靶载体。
背景技术:
肌肉生长抑素基因(myostatin,MSTN)是1997年发现的转录生长因子(TGF-β)家族的一个成员(McPherron,等,1997,美国Johns Hopkins大学),对骨骼肌的发育和生长具有负调控作用,该基因缺失会导致骨骼肌增生(McPherron,等,1997;Grobet等,2003,比利时Liège大学)。在小鼠上研究发现,通过基因敲除使MSTN基因C端生物活性区缺失的小鼠骨骼肌比普通野生小鼠增加了2-3倍。随后,McPherron等(1997)发现双肌牛中该基因发生突变,导致双肌牛肌肉产量比普通牛增加了30%。由于MSTN基因对肌肉生长具有负调控作用,因此受到广泛关注,大量的哺乳动物特别是家畜的MSTN基因已被克隆出来,MSTN基因的功能及应用研究也在大量进行,目前,MSTN基因相关研究已成为分子生物学领域的研究热点。
在鱼类,到目前为止,仅有少数几种鱼类的MSTN基因被克隆,包括沟鲶(Kocabas等,2002,美国奥本大学);金鲷(Maccatrozzo等,2001,意大利Padova大学);罗非鱼(Rodgers等,2001,美国JohnsHopkins大学)和虹鳟(Rescan等,2001法国鱼类生理实验室)。研究表明,鱼类MSTN基因的结构和哺乳动物MSTN结构相似,都是由3个外显子和2个内含子所组成,外显子和内含子的边界处通过严格的AT-GC连接,C末端是该基因的功能区,具有高度的保守性,在此蛋白生物活性区域有一个4个氨基酸组成的RXXR的蛋白水解酶加工位点,MSTN基因成熟区通过其中9个保守的半胱氨基酸形成二硫键,C末端的“半胱氨酸”结构在所有TGF-β超家族中是保守的,对于MSTN基因的功能活性具有重要作用。体外表达分析显示鱼类的MSTN基因表达不同于哺乳类MSTN基因。目前在斑马鱼上通过反义核酸技术MSTN1转录本表明,敲除的胚胎发育明显加快,通过表型观察发现MSTN1敲除的斑马鱼身体尺寸增加,受精后20小时的敲除MSTN1胚胎在尺寸上和对照组受精后30小时的胚胎大小相似。通过双链RNA干涉技术沉默MSTN转录本,表型观察发现,沉默MSTN基因的斑马鱼成体肌肉含量增加了39%-45%,导致了过度生长。尽管反义核酸技术和双链RNA干涉技术都证实了MSTN基因的功能,但反义核酸技术和双链RNA干涉技术都无法产生稳定突变的鱼类品系,如果通过基因打靶技术将某种鱼类的MSTN基因定点突变,产生稳定遗传的敲除MSTN的转基因鱼,将会提高鱼的肌肉产量和品质。但有关鱼类MSTN基因同源重组载体构建及其定点突变方面,目前国内外未见报道。
发明内容:
本发明的目的是为了克隆鱼类MSTN基因组基因、弄清鱼类MSTN基因的结构以及构建鱼类MSTN基因打靶载体,为鱼类MSTN基因的功能分析及通过基因打靶途径提高鱼的肌肉含量和品质提供基因材料和技术方法。本发明其技术内容如下:
一、花鲈生长抑素(MSTN)基因的克隆:包括:1、基因组DNA序列的获得,2、蛋白氨基酸序列推测和分析,3、基因组结构的分析;二、MSTN基因打靶载体的构建:包括:1、同源长片段和短片段的扩增和连接,2、正选择标记基因neo片段的连接,3、负选择标记基因SVTK-tk基因的连接。
一、鱼类生长抑素(MSTN)全长基因的克隆
鱼类生长抑素(MSTN)基因的克隆:包括:基因组DNA序列的获得、蛋白氨基酸序列的推测和分析、基因组结构的分析。
1.基因组DNA序列的获得:用DNAStar软件对GenBank中其它几种鱼类的cDNA序列和DNA序列比对,根据其保守性很高的区域设计了三对简并引物,扩增并获得了整个MSTN基因组编码区序列,再通过已获得的花鲈MSTN序列,设计特异引物,通过基因组步移技术扩增出花鲈MSTN基因的5’和3’非编码序列,得到了全长的基因组序列。
2.蛋白氨基酸序列的推测和分析:根据外显子和内含子交界处的特征GT...AG,分析基因各外显子和内含子位置,用EditSeq软件分析ORF阅读框和推测蛋白质序列,用BioEdit软件对蛋白质序列进行比对分析。将推测的蛋白质序列与美国GENBANK序列数据库中其他物种的MSTN蛋白序列进行比对,用BLASTX程序算出同源性。
3、基因组结构的分析:将基因组DNA序列和蛋白序列与美国GENBANK序列数据库中已存的DNA序列进行比对,结构分析表明该基因组DNA全长4873bp,包括三个外显子(分别为378bp、366bp、381bp),二个内含子(454bp、758bp)及1170bp的5’非翻译区,1366bp的3’非翻译区。在5’非翻译区上发现了一个TATA框和7个肌肉特异性的E框。
二、MSTN基因打靶载体的构建
MSTN基因打靶载体的构建采用正-负选择策略设计同源重组打靶载体。包括长片段和短片段的扩增、长片段和短片段的连接;正选择基因neo的连接;负选择基因tk基因的连接。最终成功的构建了花鲈MSTN同源重组基因打靶载体。
1.同源长片段和短片段的扩增和连接:
根据测定出的花鲈MSTN全长基因组的序列,设计一对含有适当酶切位点(XbaI和BamHI)的特异引物,扩增得到一个3.2KB的长片段;再设计一对含有酶切位点(BamHI和SalI)的特异引物,扩增得到一个1.5KB的短片段。这两个片段用相应的酶切,纯化后,依次连接到相应酶切的pBSII+KS载体上,经筛选、酶切鉴定获得重组载体p+MSTN3.2+MSTN1.5,进一步经测序证实为正确连接。
2.正选择标记基因neo片段的连接
应用SVTK-neo基因表达盒作为正选择基因引入打靶载体,即将neo基因通过BamHI酶切,连接插入到长片段和短片段之间,经筛选、酶切鉴定获得p+MSTN3.2+MSTN1.5+neo的重组载体。
3.负选择标记基因SVTK-tk基因的连接:
应用SVTK-tk基因表达盒作为负选择基因引入打靶载体,即将tk基因通过XbaI酶切,连接插入到长片段的侧翼,经筛选、酶切鉴定获得p+MSTN3.2+MSTN1.5+neo+tk的重组载体,如图2所示。
本发明与已有技术对比其特点是:本发明克隆了鱼类MSTN全长基因,包括5‘端调控序列和3’端序列;弄清了该基因的全部序列及结构特征,并首次构建了鱼类MSTN基因打靶载体。可以用于鱼类基因打靶实验。本发明的技术方法可在其它鱼类上进行应用。
附图说明:
图1:花鲈MSTN基因和推导的氨基酸序列
其中5’和3’非翻译区以及内含子序列用小写字母表示;外显子和推定的氨基酸用大写字母表示,氨基酸位于相应的密码子下面,下划线部分为微卫星重复序列,TATA框和肌肉特异性E-框用黑体加下划线表示。
图2:花鲈MSTN基因打靶载体
具体实施方式:
下面以花鲈MSTN基因的克隆和基因打靶载体构建为例,结合附图,对本发明的技术内容进行详细说明。
本发明其技术内容如下:一、花鲈生长抑素(MSTN)基因的克隆:基因组DNA序列的扩增、蛋白氨基酸序列的推测及比对、基因组结构的分析。二、MSTN基因打靶载体的构建:包括MSTN基因的结构分析、同源长片段和短片段的克隆和连接;正选择标记基因neo片段的连接;负选择标记基因tk基因的连接。
一、花鲈生长抑素(MSTN)基因的克隆:
1.DNA序列的扩增和克隆:用设计的三对引物(SP-MSTN1:5’-AATCCAAACCCAGTCCAGTCGC-3’,5’-ATCAGGCGGGAGATTTGCAGGA-3’;SP-MSTN2:5’-CTGCAAATCTCCCGCCTGATGCC-3’,5’-TCTTGCCGTAGATGATCTGCTC-3;SP-MSTN3:5’-TGAAGACTTTGGCTGGGACTGGAT-3’,5’-CTTGAGGATTCCTGGTTTCACT-3’)特异扩增出了花鲈MSTN基因的3个扩增片段,回收纯化后,连接测序,通过3个片段的重叠部分,将3个片段拼接起来,获得了整个编码区的序列,再根据已测序的序列,设计了一对特异性的引物AP1:5’-CGCCTCTTGGTCGCTCAAAACTACTG-3’和AP2:5’-CCACATCCTTGTTGTCATCTCCCAGCACG-3’,通过基因组步移技术扩出5’非翻译区,另一对特异性的引物S1:5’-TGGACCGTTGTGGATGCTCTTGAGTTG-3’和S2:5’-CAGAACACGGTGCAATAGAACCAGAGTAG-3’扩出了3’非翻译区,获得了一个全长为4873bp的花鲈基因组序列(图1),具有完整的编码阅读框,起始密码子和终止密码子。
2.蛋白氨基酸序列的推测及比对:根据已经扩增的基因组序列,设计一对引物SPMSTN-5’:5’-GCATCTGTCTCAGATTGTGCTGTATC-3’和SPMSTN-3’:5’-TCAAGAGCATCCACAACGGTCCAC-3’,扩增并测序了花鲈整个编码的cDNA序列,推测出MSTN编码的蛋白氨基酸序列,同时也证实了以上克隆的基因组序列的正确性。将cDNA和基因组DNA的序列与美国GENBANK序列数据库中已存的DNA序列进行比对,用BLASTN和BLASTX程序计算我们获得的cDNA克隆片段与GENBANK序列数据库中已存的DNA序列的同源性。通过分析蛋白氨基酸序列,在C末端发现了9个保守的半胱氨基酸残基和一个RVRR(与RXXR相匹配)的蛋白酶解加工位点。这9个保守的半胱氨基酸残基提供二硫键形成位点,对于MSTN蛋白活性功能的形成具有重要的作用。
3.DNA序列分析:通过外显子和内含子交界处的特征GT...AG,以及GenBank中其他物种MSTN基因序列的特征,分析花鲈MSTN基因,结构分析表明该基因组DNA全长4873bp,包括三个外显子(分别为378bp、366bp、381bp),二个内含子(454bp、758bp)及1170bp的5’非翻译区,1366bp的3’非翻译区。在5’非翻译区上发现了一个TATA框和7个肌肉特异性的E框。
二、MSTN基因打靶载体的构建:
1、同源长片段和短片段的克隆和连接:设计了二对引物,MSTN-N1:5`-ATC GGATCCATCATTGGCGGTTCATCAGTCCCT和MSTN-C1:5`-ATC
Figure C20051010476800091
GGTGGGTGTGCGGGTACTTCTG扩增了一个3.2KB的长片段,并在5’端引入BamHI酶切位点,在3’末端引入XbaI酶切位点和一段终止序列。基因打靶载体引物设计:另一对引物MSTN-N2:5`-ATC GTCGACGTCTCCCATCAACATGCTCTAC和MSTN-C2:5`-ATC
Figure C20051010476800092
CTCCTAATGGAAACAATGGCAT-3’扩增了一个1.5KB的长片段,在其5’端引入SalI酶切位点,在3’末端引入BamHI酶切位点和一段终止序列(引入的酶切位点用单横线表示,终止序列用双横线表示)。克隆获得了预期大小的长片段和短片段,通过相应的酶切长片段和短片段以及pBSII+KS,将长片段和短片段依次连接到载体上,形成了p+MSTN3.2+MSTN1.5质粒载体,并测序证实了MSTN长片段和短片段为正确的连接。
2、正选择标记基因neo片段的连接:
应用SVTK-neo基因表达盒作为正选择基因引入打靶载体,即用BamHI酶切正选择基因NEO基因以及已构建p+MSTN3.2+MSTN1.5质粒载体,将neo基因连接到p+MSTN3.2+MSTN1.5质粒载体上,形成了p+MSTN3.2+MSTN1.5+neo的质粒载体,经酶切鉴定为正确插入的载体,体外扩增,提取质粒。
3、负选择标记基因SVTK-TK基因的连接:
应用SVTK-tk基因表达盒作为负选择基因引入打靶载体,即用XbaI酶切负选择基因tk基因以及已构建p+MSTN3.2+MSTN1.5+neo质粒载体,将tk基因连接到p+MSTN3.2+MSTN1.5+neo的质粒载体上,最终形成了完整的MSTN正-负选择同源重组基因打靶载体p+MSTN3.2+MSTN1.5+neo+tk的质粒,经酶切鉴定为正确插入的载体,体外扩增,提取质粒。经纯化并用适合的酶将质粒线性化后即可用于基因打靶实验。
                            序列表
<110>中国水产科学院黄海水产研究所
<120>鱼类肌肉生长抑素(MSTN)基因
<130>PatentIn version 3.1
<160>1
<170>PatentIn version 3.1
<210>1
<211>4873
<212>DNA
<213>sea perch
<221>5′UTR
<222>(1)..(1170)
<221>exon 1
<222>(1171)..(1548)
<221>Intron 1
<222>(1549)..(2002)
<221>exon 2
<222>(2003)..(2368)
<221>Intron 2
<222>(2369)..(3126)
<221>exon 3
<222>(3127)..(3507)
<221>3′UTR
<222>(3508)..(4873)
<400>1
gattactata gggcacgcgt ggtcgacggc ccgggctggt ctgtttgtcc agatgtctgt    60
ctgtctggcc tttgatcatt ggcggttcat cagtccctgt gtgggctgct gtcaccggtg    120
ttttcagact gccacgcgtg gacgtcacac gtgggggagg taaaataaaa aaaaataaaa    180
ataaacgggc tctgtaaaat gatccaactt gtcaggttca gggtcactaa catgactctt    240
ggctgactgg aaagtgtttg atttttccca gtcttcagat cgtcaggtcg ccatgtcgcc    300
gctgtgctgc aggtgatggc ctccctgacg agagtgatgt cagcttacca cacgatggca    360
ctgtcttctc atgtgctaca accagatttg accagcaagg atttggacaa gtcctggaat    420
aaggactttt ctttattttt gctgtttttt gaataataat tatttccagt tttgactgat    480
cagcttctca gaggggaacc tggtctgacg ggacgacacc tccagaagga cttgacttca    540
ctgaataaaa ctgtaactct tagggttttt ttccctcaag gattaaatgt atttccacaa    600
ccatgcagac acagttgcat ccatgtacct gtcaccacag acagttcatg tttggtgggc    660
tgcctgcagt ctcattttaa agtgtattct ttattcacag cacaaagtat acatgacacc    720
gcctatctat agcttttatt tcctaatacg caggataaat gctacattgt ttggttttaa    780
taagttgcta taaattgaag cccatcagac tgttccatag gacagacagt ctggtctgcg    840
cctctgcgct cattgcgcga tcactgtaag aaaagtgaat ttctccatct gtggacacgc    900
tcagcacatg ctcacagcct ctaccccttt atggtttgac aacgagaaaa agttttcatg    960
tcagtcggtt aaaattcatt gttccctgtc cagccaatca tagtttttga cgacacaaaa    1020
gaggctaaag ttggagtata aaaaggtgtg cgctaataaa gtatgatgcc tatcagtgtg    1080
ggacattaat ccaaacccag ttcagccgcg cacaggtcca gcacacacca agggatcttt    1140
tttcaaacca aacttcacac cttagagaca atg cgt ctg tct cag att gtg ctg     1194
                                 Met Arg Leu Ser Gln Ile Val Leu
                                 1               5
tat ctg agc ttg ctg att gct ttg ggt cca gta gtt ttg agc gac caa      1242
Tyr Leu Ser Leu Leu Ile Ala Leu Gly Pro Val Val Leu Ser Asp Gln
    10                  15                  20
gag gcg cac cag cag ccg tcc gcc tcc agc ccc gtg gac acg gag cag      1290
Glu Ala His Gln Gln Pro Ser Ala Ser Ser Pro Val Asp Thr Glu Gln
25                  30                  35                  40
tgc gcc acc tgc gag gtc cgg cag cag atc aaa acc atg cga tta aac      1338
Cys Ala Thr Cys Glu Val Arg Gln Gln Ile Lys Thr Met Arg Leu Asn
                45                  50                  55
gcg atc aaa tct cag att ctg agc aaa ctg cgg atg aaa gaa gct ccc      1386
Ala Ile Lys Ser Gln Ile Leu Ser Lys Leu Arg Met Lys Glu Ala Pro
            60                  65                  70
aat atc agc cga gat atc gtg aag cag ctc ctg ccc aag gcg ccg ccg      1434
Asn Ile Ser Arg Asp Ile Val Lys Gln Leu Leu Pro Lys Ala Pro Pro
        75                  80                  85
ctg cag cag ctt ctc gac cag tac gac gtg ctg gga gat gac aac aag      1482
Leu Gln Gln Leu Leu Asp Gln Tyr Asp Val Leu Gly Asp Asp Asn Lys
    90                  95                  100
gat gtg gtc atg gag gag gac gac gag cac gcc atc acg gag aca ata      1530
Asp Val Val Met Glu Glu Asp Asp Glu His Ala Ile Thr Glu Thr Ile
105                 110                 115                 120
atg atg atg gcc act gaa gtaagttttt atttcgcttt gttttctgga             1578
Met Met Met Ala Thr Glu
                125
cgacgaaaag gaagcgctca gacgtctcca aactaggctt ttacgcacgg ggcagagcgc    1638
acgagagggg agggaggtgg gggggggcgc tttattttga caacatgtag ctttaccagc    1698
tcttgatatt ggaaatgtag atataccaac atcaccaaca tgtatacggt gtatgtgtgg    1758
gtcggtgcat ttcggcagat cagcgcgcct ggtgattacg cgcacggttt gtaaggtttt    1818
ctaaacgtta ttagcccact tccagagatc aaatgtcgtg tcagggatgt ttaatgacac    1878
cagtttattt cggtctgtaa atttcaatcg cacatggtca gtatacggag aacatagaga    1938
accttctctc tctctctctc tctctccctc tctctctctc cctctctctc tctctccagc    1998
cgag tcc gtc gtc cag gtg gat ggg gaa cca agc tgc tgc ttc ttc tcg     2047
     Ser Val Val Gln Val Asp Gly Glu Pro Ser Cys Cys Phe Phe Ser
                 130                 135                 140
ttc act caa aag ttc cag gcc agt cgc ata gtc cgg gct cag ctc tgg    2095
Phe Thr Gln Lys Phe Gln Ala Ser Arg Ile Val Arg Aia Gln Leu Trp
            145                 150                 155
gtg cat ctg cgc ccg tcg gag gag gcg acc acg gtg ttc ctg caa atc    2143
Val His Leu Arg Pro Ser Glu Glu Ala Thr Thr Val Phe Leu Gln Ile
        160                 165                 170
tcc cgc ctg atg ccg gtc aca gac ggg agc ggg cac ata cgc atc cgc    2191
Ser Arg Leu Met Pro Val Thr Asp Gly Ser Gly His Ile Arg Ile Arg
    175                 180                 185
tcc ctg aag atc gac gtg aat gcc ggg gtc agc tct tgg caa agt ata    2239
Ser Leu Lys Ile Asp Val Asn Ala Gly Val Ser Ser Trp Gln Ser Ile
190                 195                 200                 205
gac gtc aag caa gtg ttg act gtg tgg ctg cgg cag ccg gag acc aac    2287
Asp Val Lys Gln Val Leu Thr Val Trp Leu Arg Gln Pro Glu Thr Asn
                210                 215                 220
tgg ggc atc gag att aac gcc ttc gat tcg agg gga aat gac ttg gcc    2335
Trp Gly Ile Glu Ile Asn Ala Phe Asp Ser Arg Gly Asn Asp Leu Ala
            225                 230                 235
gtg acc tcc gcg gag cca gga gag gaa gga ctg gtgagctgaa cctttatttt    2388
Val Thr Ser Ala Glu Pro Gly Glu Glu Gly Leu
        240                 245
acattaaacc gaaaccttgt ggtcttaggg ttagttcatt atccgggact cctgtcctaa    2448
tcaatatgac tgtaagtata agatgattat aagaactgga ccatcctgta agaaacaaaa    2508
aatattttca cacccccagt gtctaattag gtttaaaaca gtattttgga ttatctgctg    2568
tactgtactg gagccttcca gaggttttag tgtgcagaga ggctttgcag agtcagcagg    2628
tggttaaaca ttcctgcaat caagatttaa gacttttgaa agcgattaat caacacagac    2688
tccatgtagg cgcacacctg catttggagc aatgcccagt ctacaataac cccaaatcaa    2748
actgcttgat tacataaaag ttcacctgcc ccacattcct taaagtattc tgtgtgactg    2808
tgcaaatcag agtaattgcc tgcacacaca cacatacaca cacactgcta ctatcaatga    2868
caagcactta tcatgcggct caaatactgg cactgggctc tgaggcaatt agaataccta    2928
gatggctgtg gttaaccaac cgtcagatga ttcaatttct gtaaaactca aagtttcata    2988
atattatcgt gccatgtttg aaaaccagct gccacaaggt cgagggcacc ggagatgtaa    3048
accgaatgct gtcatccgcc tcctttttgc aaaaccagct atttctccaa agtgttcaca    3108
cgctgtttgt cattgcag caa gcg ttc atg gag gtg aag gtc tcg gag ggc      3159
                    Gln Ala Phe Met Glu Val Lys Val Ser Glu Gly
                        250                 255
ccc aag cgt gcc agg aga gac tcg ggc ctg gac tgt gac gag aac tct      3207
Pro Lys Arg Ala Arg Arg Asp Ser Gly Leu Asp Cys Asp Glu Asn Ser
260                 265                 270                 275
cca gag tcc cgg tgc tgc cgc tat ccg ctc act gtg gac ttt gaa act      3255
Pro Glu Ser Arg Cys Cys Arg Tyr Pro Leu Thr Val Asp Phe Glu Thr
                280                 285                 290
ttg gct ggg act gga tta ttg ccc caa agc ggc tac aag gcc aac tat      3303
Leu Ala Gly Thr Gly Leu Leu Pro Gln Ser Gly Tyr Lys Ala Asn Tyr
            295                 300                 305
tgc tcc ggg gag tgt gag tac atg cac ttg cag aag tac ccg cac acc      3351
Cys Ser Gly Glu Cys Glu Tyr Met His Leu Gln Lys Tyr Pro His Thr
        310                 315                 320
cac ctg gtg aac aag gcc aac ccc aga ggg acc gcg ggc ccc tgc tgt      3399
His Leu Val Asn Lys Ala Asn Pro Arg Gly Thr Ala Gly pro Cys Cys
    325                 330                 335
acc cct acc aag atg tct ccc atc aac atg ctc tac ttt aac cga aaa      3447
Thr Pro Thr Lys Met Ser pro Ile Asn Met Leu Tyr Phe Asn Arg Lys
340                 345                 350                 355
gag cag atc atc tac ggc aag atc ccc tcc atg gtg gtg gac cgt tgt      3495
Glu Gln Ile Ile Tyr Gly Lys Ile Pro Ser Met Val Val Asp Arg Cys
                360                 365                 370
gga tgc tct tga gttgggtcgg agaccctggc  gagggagagg ggaggacgga         3547
Gly Cys Ser
ggggctgcgg cccagtccgg cctccaactt cagacttttt gacacaacca atccaccagt    3607
tccagtgctt tcctgcagaa cacggtgcaa tagaaccaga gtagaggcca caaacagccc    3667
gaccttcccg cagggcagcg ctttcacaac cggcatagca cttttttttt tctctcctcc    3727
agtgaaatct tagccaaaga ggcttgaagt cagatggatg caggaacaca catacacaca    3787
catgctggac cttggagtga atgtagacag aaattatcaa agttatccaa aaactttctt    3847
tctccttttg tctcggtgtt ctgtgctctg tccatttata caaacatgcc gacagattat    3907
actcgtacgc catctactcc actccactcc attcgtagcc aacatacaag ctattacact    3967
ttctgctaag ctatatgttt gtgataatca tttttcaaga tatgttttca gagtgaaacc    4027
aggaatcctc atggactttt tgaaagggct tggaaaaaca cagctggaga ctctttggag    4087
tgatacatca cactggtgga acatgcgtta gtacacataa atttcatagg aggcgatgag    4147
gagatgaaat ctggctgcac ggggaacccc ttagtcaccg ccacttcact actgcaattt    4207
ataaaaccca gctgaaattt gcaacattaa ttcatttgga aaatctgaca cacgtcgtta    4267
tctttcctgt atcagatcaa actttaagtg ctaatttgtg gggttttttt attaacaatt    4327
ctgagagcgt gggagtaaaa tcctacatgc aggtggtgac gtggtagtcg atcactccgg    4387
agatcccatg gaggcacaaa tgttccgcca gggcgaagta ccactttagg tcttgacagg    4447
tctccatgta ctacatgcca tacattcacg caacaacata cccaaactga ggagcacttc    4507
gtgcttggtc ataatctcca ctatccaaca aaaacagcct gacctgcccg atacacttga    4567
attattctga ttgtaaattc acattactgg acagaaggac ttgaactgaa ggcacaatga    4627
atgcagccta caaatgaaaa atgtgtttaa gacagaggaa actggattgt cgaggtgaat    4687
gaatgttgag atcatgctta aactctgtct tacaaacaac acagtttgca ctatggcaca    4747
ccaatagaaa gaattggttg ctacaaaagt tgtaaaaact gattttgata tgtttgctaa    4807
tttgtattgt atacatatgc cattgtttcc attaggagtt gcctttctaa accactgttg    4867
gtaata                                                               4873

Claims (2)

1、一种鱼类花鲈肌肉生长抑素MSTN基因的克隆方法,其特征在于它的克隆方法,包括:1)、基因组DNA序列的获得,2)、蛋白氨基酸序列推测和分析,3)、基因组结构的分析;
1)、基因组DNA序列的获得:用DNAStar软件对GenBank中其它几种鱼类的cDNA序列和DNA序列比对,根据其保守性很高的区域设计了三对简并引物,从花鲈基因组DNA中扩增并获得了肌肉生长抑素MSTN编码区序列,再通过已获得的MSTN编码区序列,设计特异引物,通过基因组步移技术扩增出MSTN基因的5’和3’非编码序列,得到了MSTN基因的全长基因组序列,所述的鱼类花鲈肌肉生长抑素MSTN基因序列是:
gattactatagggcacgcgtggtcgacggcccgggctggtctgtttgtc cagatgtctgtctgtctggcctttgatcattggcggttcatcagtccctgt    100
                                                  E-box
gtgggctgctgtcaccggtgttttcagactgccacgcgtggacgtca cacgtgggggaggtaaaataaaaaaaaataaaaataaacgggctctgtaaaat    200
                                                E-box
gatccaacttgtcaggttcagggtcactaacatgactcttggctgactggaaagtgtttgatttttcccagtcttcagatcgtcaggtcgccatgtcgcc      300
gctgtgctg caggtgatggcctccctgacgagagtgatgtcagcttaccacacgatggcactgtcttct catgtgctacaaccagatttgaccagcaagg  400
          E-box                                                       E-box
atttggacaagtcctggaataaggacttttctttatttttgctgttttttgaataataattatttccagttttgactgatcagcttctcagaggggaacc      500
tggtctgacgggacgacacctccagaaggacttgacttcactgaataaaactgtaactcttagggtttttttccctcaaggattaaatgtatttccacaa      600
ccatgcagaca cagttgcatccatgtacctgtcaccacagacagttcatgtttggtgggctgcctgcagtctcattttaaagtgtattctttattcacag    700
            E-box
cacaaagtatacatgacaccgcctatctatagcttttatttcctaatacgcaggataaatgctacattgtttggttttaataagttgctataaattgaag      800
cccatcagactgttccataggacagacagtctggtctgcgcctctgcgctcattgcgcgatcactgtaagaaaagtgaatttctc catctgtggacacgc    900
                                                                                      E-box
tcag cacatgctcacagcctctacccctttatggtttgacaacgagaaaaagttttcatgtcagtcggttaaaattcattgttccctgtccagccaatca    1000
     E-box
tagtttttgacgacacaaaagaggctaaagttggag tataaaaaggtgtgcgctaataaagtatgatgcctatcagtgtgggacattaatccaaacccag    1100
                                    TATA box
ttcagccgcgcacaggtccagcacacaccaagggatcttttttcaaaccaaacttcacaccttagagacaATGCATCTGTCTCAGATTGTGCTGTATCTG      1200
                                                                     M  H  L  S  Q  I  V  L  Y  L  10
AGCTTGCTGATTGCTTTGGGTCCAGTAGTTTTGAGCGACCAAGAGGCGCACCAGCAGCCGTCCGCCTCCAGCCCCGTGGACACGGAGCAGTGCGCCACCT      1300
 S  L  L  I  A  L  G  P  V  V  L  S  D  Q  E  A  H  Q  Q  P  S  A  S  S  P  V  D  T  E  Q  C  A  T   43
GCGAGGTCCGGCAGCAGATCAAAACCATGCGATTAAACGCGATCAAATCTCAGATTCTGAGCAAACTGCGGATGAAAGAAGCTCCCAATATCAGCCGAGA      1400
C  E  V  R  Q  Q  I  K  T  M  R  L  N  A  I  K  S  Q  I  L  S  K  L  R  M  K  E  A  P  N  I  S  R  D 77
TATCGTGAAGCAGCTCCTGCCCAAGGCGCCGCCGCTGCAGCAGCTTCTCGACCAGTACGACGTGCTGGGAGATGACAACAAGGATGTGGTCATGGAGGAG      1500
  I  V  K  Q  L  L  P  K  A  P  P  L  Q  Q  L  L  D  Q  Y  D  V  L  G  D  D  N  K  D  V  V  M  E  E  110
GACGACGAGCACGCCATCACGGAGACAATAATGATGATGGCCACTGAAgtaagtttttatttcgctttgttttctggacgacgaaaaggaagcgctcaga      1600
 D  D  E  H  A  I  T  E  T  I  M  M  M  A  T  E                                                      126
cgtctccaaactaggcttttacgcacggggcagagcgcacgagaggggagggaggtgggggggggcgctttattttgacaacatgtagctttaccagctc      1700
ttgatattggaaatgtagatataccaacatcaccaacatgtatacggtgtatgtgtgggtcggtgcatttcggcagatcagcgcgcctggtgattacgcg      1800
cacggtttgtaaggttttctaaacgttattagcccacttccagagatcaaatgtcgtgtcagggatgtttaatgacaccagtttatttcggtctgtaaat      1900
ttcaatcgcacatggtcagtatacggagaacatagagaacct tctctctctctctctctctctccctctctctctctccctctctctctctctccagccg    2000
agTCCGTCGTCCAGGTGGATGGGGAACCAAGCTGCTGCTTCTTCTCGTTCACTCAAAAGTTCCAGGCCAGTCGCATAGTCCGGGCTCAGCTCTGGGTGCA      2100
   S  V  V  Q  V  D  G  E  P  S  C  C  F  F  S  F  T  Q  K  F  Q  A  S  R  I  V  R  A  Q  L  W  V  H 159
TCTGCGCCCGTCGGAGGAGGCGACCACGGTGTTCCTGCAAATCTCCCGCCTGATGCCGGTCACAGACGGGAGCGGGCACATACGCATCCGCTCCCTGAAG      2200
  L  R  P  S  E  E  A  T  T  V  F  L  Q  I  S  R  L  M  P  V  T  D  G  S  G  H  I  R  I  R  S  L  K  192
ATCGACGTGAATGCCGGGGTCAGCTCTTGGCAAAGTATAGACGTCAAGCAAGTGTTGACTGTGTGGCTGCGGCAGCCGGAGACCAACTGGGGCATCGAGA      2300
 I  D  V  N  A  G  V  S  S  W  Q  S  I  D  V  K  Q  V  L  T  V  W  L  R  Q  P  E  T  N  W  G  I  E   225
TTAACGCCTTCGATTCGAGGGGAAATGACTTGGCCGTGACCTCCGCGGAGCCAGGAGAGGAAGGACTGgtgagcgaacctttattttacattaaaccga       2400
I  N  A  F  D  S  R  G  N  D  L  A  V  T  S  A  E  P  G  E  E  G  L                                  248
aaccttgtggtcttagggatagttcattatccgggactcctgtcctaatcaatatgactgtaagtataagatgattataagaactggaccatcctgtaag    2500
aaacaaaaaatattttcacacccccagtgtctaattaggtttaaaacagtattttggattatctgctgtactgtactggagccttccagaggttttagtg    2600
tgcagagaggctttgcagagtcagcaggtggttaaacattcctgcaatcaagatttaagacttttgaaagcgattaatcaacacagactccatgtaggcg    2700
tacacctgcatttggagcaatgcccagtctacaataaccccaaatcaaactgcttgattacataaaagttcacctgccccacattccttaaagtattctg    2800
tgtgactgtgcaaatcagagtaattgcctg cacacacacacatacacacacactgctactatcaatgacaagcacttatcatgcggctcaaatatggtta  2900
ctggcactgggctctgaggcaattagaatacctagatggctgaccaaccgtcagatgattcaatttctgtaaaactcaaagtttcataatattatcgtgc    3000
catgtttgaaaaccagctgccacaaggtcgagggcaccggagatgtaaaccgaatgctgtcatccgcctcctttttgcaaaaccagctatttctccaaag    3100
tgttcacacgctgtttgtcattgcagCAAGCGTTCATGGAGGTGAAGGTCTCGGAGGGCCCCAAGCGTGCCAGGAGAGACTCGGGCCTGGACTGTGACGA    3200
                          Q  A  F  M  E  V  K  V  S  E  G  P  K  R  A  R  R  D  S  G  L  D  C  D  E  273
GAACTCTCCAGAGTCCCGGTGCTGCCGCTATCCGCTCACTGTGGACTTTGAAACTTTGGCTGGGACTGGATTATTGCCCCAAAGCGGCTACAAGGCCAAC    3300
  N  S  P  E  S  R  C  C  R  Y  P  L  T  V  D  F  E  T  L  A  G  T  G  L  L  P  Q  S  G  Y  K  A  N  306
TATTGCTCCGGGGAGTGTGAGTACATGCACTTGCAGAAGTACCCGCACACCCACCTGGTGAACAAGGCCAACCCCAGAGGGACCGCGGGCCCCTGCTGTA    3400
 Y  C  S  G  E  C  E  Y  M  H  L  Q  K  Y  P  H  T  H  L  V  N  K  A  N  P  R  G  T  A  G  P  C  C   339
CCCCTACCAAGATGTCTCCCATCAACATGCTCTACTTTAACCGAAAAGAGCAGATCATCTACGGCAAGATCCCCTCCATGGTGGTGGACCGTTGTGGATG    3500
T  P  T  K  M  S  P  I  N  M  L  Y  F  N  R  K  E  Q  I  I  Y  G  K  I  P  S  M  V  V  D  R  C  G  C 373
CTCTTGAgttgggtcggagaccctggcgagggagaggggaggacggaggggctgcggcccagtccggcctccaacttcagactttttgacacaaccaatc    3600
  S  ★                                                                                              374
caccagttccagtgctttcctgcagaacacggtgcaatagaaccagagtagaggccacaaacagcccgaccttcccgcagggcagcgctttcacaaccgg    3700
catagcacttttttttttctctcctccagtgaaatcttagccaaagaggcttgaagtcagatggatgcagga acacacatacacacacatgctggacctt  3800
ggagtgaatgtagacagaaattatcaaagttatccaaaaactttctttctccttttgtctcggtgttctgtgctctgtccatttatacaaacatgccgac    3900
agattatactcgtacgccatctactccactccactccattcgtagccaacatacaagctattacactttctgctaagctatatgtttgtgataatcattt    4000
ttcaagatatgttttcagagtgaaaccaggaatcctcatggactttttgaaagggcttggaaaaacacagctggagactctttggagtgatacatcacac    4100
tggtggaacatgcgttagtacacataaatttcataggaggcgatgaggagatgaaatctggctgcacggggaaccccttagtcaccgccacttcactact    4200
gcaatttataaaacccagctgaaatttgcaacattaattcatttggaaaatctgacacacgtcgttatctttcctgtatcagatcaaactttaagtgcta    4300
atttgtggggtttttttattaacaattctgagagcgtgggagtaaaatcctacatgcaggtggtgacgtggtagtcgatcactccggagatcccatggag    4400
gcacaaatgttccgccagggcgaagtaccactttaggtcttgacaggtctccatgtactacatgccatacattcacgcaacaacatacccaaactgagga    4500
gcacttcgtgcttggtcataatctccactatccaacaaaaacagcctgacctgcccgatacacttgaattattctgattgtaaattcacattactggaca    4600
gaaggacttgaactgaaggcacaatgaatgcagcctacaaatgaaaaatgtgtttaagacagaggaaactggattgtcgaggtgaatgaatgttgagatc    4700
ttgcttaaactctgtcttacaaacaacacagtttgcactatggcacaccaatagaaagaattggttgctacaaaagttgtaaaaactgattttgatatgt    4800
ttgctaatttgtattgtatacatatgccattgtttccattaggagttgcctttctaaaccactgttggtaata                               4873
2)、蛋白氨基酸序列的推测和分析:根据外显子和内含子交界处的特征GT...AG,分析基因各外显子和内含子位置,用EditSeq软件分析ORF阅读框和推测蛋白质序列,用BioEdit软件对蛋白质序列进行比对分析;将推测的蛋白质序列与美国GENBANK序列数据库中其他物种的MSTN蛋白序列进行比对,用BLASTX程序算出同源性;
3)、基因组结构的分析:将基因组DNA序列和蛋白序列与美国GENBANK序列数据库中已存的DNA序列进行比对,结构分析表明该基因组DNA全长4873bp,包括长度分别为378bp、366bp、381bp的三个外显子,长度分别为454bp和758bp的二个内含子及1170bp的5’非翻译区和1366bp的3’非翻译区;在5’非翻译区上发现了一个TATA框和7个肌肉特异性的E框。
2.一种构建权利要求1中所述的鱼类花鲈肌肉生长抑素MSTN基因打靶载体的方法,其特征在于它的打靶载体的构建方法,包括:1)、同源长片段和短片段的扩增和连接,2)、正选择标记基因neo片段的连接,3)、负选择标记基因SVTK-tk基因的连接;
1)、同源长片段和短片段的扩增和连接:
根据鱼类花鲈肌肉生长抑素MSTN基因的序列,设计一对含有适当酶切位点XbaI和BamHI的特异引物,扩增得到一个3.2KB的长片段,再设计一对含有酶切位点BamHI和SalI的特异引物,扩增得到一个1.5KB的短片段;这两个片段用相应的酶切,纯化后,依次连接到相应酶切的pBSII+KS载体上,经筛选、酶切鉴定获得重组载体p+MSTN3.2+MSTN1.5,进一步经测序证实为正确连接;
2)、正选择标记基因neo片段的连接:
应用SVTK-neo基因表达盒作为正选择基因引入打靶载体,即将neo基因通过BamHI酶切,连接插入到长片段和短片段之间,经筛选、酶切鉴定获得p+MSTN3.2+MSTN1.5+neo的重组载体;
3)、负选择标记基因SVTK-tk基因的连接:
应用SVTK-tk基因表达盒作为负选择基因引入打靶载体,即将tk基因通过XbaI酶切,连接插入到长片段的侧翼,经筛选、酶切鉴定获得p+MSTN3.2+MSTN1.5+neo+tk的重组载体。
CNB2005101047684A 2005-12-30 2005-12-30 鱼类肌肉生长抑素mstn基因克隆及其基因打靶载体构建 Expired - Fee Related CN100347298C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB2005101047684A CN100347298C (zh) 2005-12-30 2005-12-30 鱼类肌肉生长抑素mstn基因克隆及其基因打靶载体构建

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB2005101047684A CN100347298C (zh) 2005-12-30 2005-12-30 鱼类肌肉生长抑素mstn基因克隆及其基因打靶载体构建

Publications (2)

Publication Number Publication Date
CN1831136A CN1831136A (zh) 2006-09-13
CN100347298C true CN100347298C (zh) 2007-11-07

Family

ID=36993634

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2005101047684A Expired - Fee Related CN100347298C (zh) 2005-12-30 2005-12-30 鱼类肌肉生长抑素mstn基因克隆及其基因打靶载体构建

Country Status (1)

Country Link
CN (1) CN100347298C (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103805694B (zh) * 2013-12-05 2015-09-09 上海市水产研究所 用于检测菊黄东方鲀生长速度的引物对及方法
CN112342215B (zh) * 2020-11-11 2024-03-26 江苏省淡水水产研究所 一种靶向敲除斑点叉尾鮰mstna基因的sgRNA序列及其筛选方法
CN112899283A (zh) * 2021-03-03 2021-06-04 中国水产科学研究院南海水产研究所 一种与黄鳍棘鲷快速生长相关的snp位点、其筛选方法及应用

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002085306A2 (en) * 2001-04-24 2002-10-31 The Johns Hopkins University Use of follistatin to increase muscle mass
WO2004044145A2 (en) * 2002-11-06 2004-05-27 Auburn University Compositions and methods for enhancing disease resistance in fish
CN1597955A (zh) * 2004-09-24 2005-03-23 中山大学 三种石斑鱼生长抑素基因及其应用

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002085306A2 (en) * 2001-04-24 2002-10-31 The Johns Hopkins University Use of follistatin to increase muscle mass
WO2004044145A2 (en) * 2002-11-06 2004-05-27 Auburn University Compositions and methods for enhancing disease resistance in fish
CN1597955A (zh) * 2004-09-24 2005-03-23 中山大学 三种石斑鱼生长抑素基因及其应用

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
肌生成抑制素基因研究进展 李树伟,欧阳红生,王小霞.动物医学进展,第25卷第4期 2005 *
肌肉生成抑制素基因的研究进展 王彦波,周绪霞,许梓荣.免疫学杂志,第20卷第3期 2004 *

Also Published As

Publication number Publication date
CN1831136A (zh) 2006-09-13

Similar Documents

Publication Publication Date Title
CN1185256C (zh) 水稻分蘖控制基因moc1及其应用
CN1923850A (zh) 水稻叶形控制基因sll1及其应用
CN100347298C (zh) 鱼类肌肉生长抑素mstn基因克隆及其基因打靶载体构建
CN1844377A (zh) 柱花草9-顺式环氧类胡萝卜素双加氧酶及其编码基因与应用
CN1769457A (zh) 蝴蝶兰pPI15编码序列及其应用
CN1844143A (zh) 一种植物耐盐相关蛋白及其编码基因与应用
CN1295340C (zh) 一种建立多形性腺瘤小鼠模型的方法
CN1247612C (zh) 水稻OsGLR1基因及其应用
CN1276080C (zh) 鱼类基因原位修饰育种的方法
CN1239704C (zh) 与植物耐盐性及抗旱性相关的基因及其编码蛋白与应用
CN1218959C (zh) 一种水稻乙烯受体类蛋白及其编码基因与应用
CN1850856A (zh) 一种植物抗逆性相关蛋白及其编码基因与应用
CN1239706C (zh) 一种植物耐低磷基因及其编码蛋白与应用
CN1257271C (zh) 丝氨酸蛋白酶及其编码序列
CN1291020C (zh) 小麦TaGI1基因及其克隆与应用
CN1208462C (zh) 一个人类锌指蛋白家族新基因znf325
CN1621523A (zh) 棉花腺苷酸核糖基化作用因子1基因及其启动子
CN1712527A (zh) 大豆二酰甘油酰基转移酶及其编码基因与应用
CN101063131A (zh) 花鲈凝集素基因序列
CN1327479A (zh) 提高基因表达水平的新的dna片段
CN101054583A (zh) 斑节对虾细胞周期蛋白b的基因序列
CN1238382C (zh) 中华绒螯蟹蜕皮抑制激素1蛋白
CN1814755A (zh) 一种高温中性蛋白酶及其制备方法
CN1216908C (zh) 拟南芥bud1基因及其应用
CN1266273C (zh) 一种调控小鼠孤儿核受体的启动子及其用途

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20071107

Termination date: 20100201