CN1699567A - 猪核受体辅激活因子1基因的蛋白编码序列 - Google Patents

猪核受体辅激活因子1基因的蛋白编码序列 Download PDF

Info

Publication number
CN1699567A
CN1699567A CN 200510026382 CN200510026382A CN1699567A CN 1699567 A CN1699567 A CN 1699567A CN 200510026382 CN200510026382 CN 200510026382 CN 200510026382 A CN200510026382 A CN 200510026382A CN 1699567 A CN1699567 A CN 1699567A
Authority
CN
China
Prior art keywords
ser
gln
leu
pro
asn
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 200510026382
Other languages
English (en)
Inventor
潘玉春
于丹丹
白春艳
王起山
张令刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Jiaotong University
Original Assignee
Shanghai Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Jiaotong University filed Critical Shanghai Jiaotong University
Priority to CN 200510026382 priority Critical patent/CN1699567A/zh
Publication of CN1699567A publication Critical patent/CN1699567A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Peptides Or Proteins (AREA)

Abstract

一种用于生物基因工程领域的猪核受体辅激活因子1基因的蛋白编码序列。具有SEQ ID NO.1中从第1-4323位的核苷酸序列,其同人、小鼠物种NCOA-1/SRC-1基因CDS序列同源性为93.73%。具有SEQ ID NO.1所示的氨基酸序列的多肽、或其保守性变异多肽、或其活性片段,或其活性衍生物,其同人、小鼠、大鼠的氨基酸序列同源性为94.99%。本发明能够为人类乳腺癌、糖尿病、肥胖症等相关疾病的研究提供动物模型。参考其它哺乳动物NCOA-1/SRC-1基因序列,并利用同源克隆和电子克隆相结合的方法,克隆测序获得猪NCOA-1基因的cDNA序列,并对不同物种NCOA-1基因的CDS序列进行同源性比较,将大大有益于今后研究NCOA-1基因与猪繁殖性能的关系以及人类相关疾病的研究。

Description

猪核受体辅激活因子1基因的蛋白编码序列
技术领域
本发明涉及的是一种用于生物基因工程领域的蛋白质编码序列,特别是一种猪核受体辅激活因子1基因(NCOA-1/SRC-1)的蛋白编码序列。
背景技术
核受体辅激活因子1(NCOA-A/SRC-1)是类固醇受体辅激活蛋白(SRC)家族的一个主要成员。SRC家族的蛋白质可以通过与核受体的互作来提高这些核受体基因的转录激活功能。由于它们易于由基础转录因子装配为稳定的前起始复合体从而可以激活基因的表达,在核受体激素基因表达过程中起主要调节作用。
核激素受体是一种配体依赖的转录因子,它们主要调控那些与发育、繁殖和体内稳态等生物学过程有关的基因的转录活性。这些受体作为一个“分子开关”分别随着与之相关的激素的有无,在转录激活和抑制状态间变化。大部分受体的活化过程都需要核受体辅调控蛋白的参与。这些辅调控蛋白在受体和基础转录因子之间起着信号传导介质的作用,包括辅激活因子和辅阻遏因子两类。在没有激素存在的情况下,一些核受体通过辅阻遏因子与辅激活因子的相互作用来抑制靶基因的转录;当与激素结合以后,这些辅阻遏因子便从DNA结合受体上解离出来然后募集成为核受体辅激活因子复合物。这些辅激活因子与核受体相互作用可以提高靶基因的转录活性。由于它们在转录调控过程中起着极其重要的作用,因此这类辅调控蛋白已经成为核受体研究的热点。
类固醇受体辅激活蛋白(SRC)家族是核受体辅激活因子中非常重要的一类,目前在人类已被克隆的SRC家族成员有SRC-1/NCOA-1,TIF2/GRIP1/NCOA-2和RAC3/ACTR/AIB-1/pCIP。其中SRC-1是用生物化学和遗传学方法分离到的第一个辅激活因子,它也是类固醇受体辅激活蛋白P160家族的成员之一。大量的实验表明,SRC-1可增强GR,ER,RXR和TR介导的体内转录,可增强转录水平的10倍。
经对现有技术文献的检索发现,在Onate SA,Tsai SY,Tsai MJ et al,“Sequence and characterization of a coactivator for the steroid hormonereceptor superfamily”.Science,1995,270:1354-1357.即由Onate等在《Science》(1995,270卷)上的“类固醇激素受体超家族辅激活因子的序列及其特点”一文中报道,他们是用酵母双杂合系统以人PR的HBD作为钓饵从人的cDNA文库中将人的SRC-1基因筛选出来的,其分子量是125ku。在Zhu Y,Qi C,Calandra C,et al.“Cloning and identification of mouse steroid receptorcoactivator-1(mSRC-1),as a coactivator of peroxisome proliferator-activated receptor gamma”.[J].Gene Expression,1996,6(3):185.即由Zhu Y等在《基因表达》(1996,6卷)上的“过氧化物酶增殖体活化受体γ激活因子——鼠的类固醇受体辅激活因子1的克隆和鉴定”一文中报道,他们是用酵母双杂合系统以GAL4-PPAR gamma作为钓饵将鼠的SRC-1基因从鼠的肝细胞cDNA文库中筛选出来的。在Carapeti M.,Aguiar R.C.,Chase A.,Goldman J.M.,Cross N.C.P..“Assignment of the steroid receptor coactivator-1(SRC-1)gene to human chromosome band 2p23”.Genomics.1998,52(2):242-244.即Melina Carapeti等在《基因组》上的“定位SRC-1基因于人的染色体2p23上”一文中报道了,他们用荧光原位杂交的方法将人的SRC-1基因定位于2号染色体上。但至今尚未发现克隆获得猪NCOA-1/SRC-1基因编码蛋白序列。
目前对NCOA-1/SRC-1基因的研究更多的集中在对人类的乳腺癌、肥胖症、糖尿病等疾病的发病机理上以及鼠的肥胖症及相关激素抗性的研究上。
发明内容
本发明的目的在于针对现有技术的不足,提供一种猪核受体辅激活因子1基因的蛋白编码序列。使其一方面能够为人类乳腺癌、肥胖症及糖尿病等相关疾病的研究提供动物模型;另一方面可以为提高猪繁殖性能的分子标记辅助育种起指导作用,具有很大的应用价值。
本发明是通过以下技术方案实现的,本发明所获得的猪NCOA-1基因蛋白编码序列具有SEQ ID NO.1中从第1-4323位的核苷酸序列,其与人、小鼠等物种NCOA-1/SRC-1基因CDS序列同源性为93.73%。
所述的获得的猪NCOA-1基因蛋白编码序列具有SEQ ID NO.1所示的氨基酸序列的多肽、或其保守性变异多肽、或其活性片段,或其活性衍生物,其同人、小鼠、大鼠的氨基酸序列同源性为94.99%。
所述的猪NCOA-1基因蛋白编码序列,指与SEQ ID NO.1的氨基酸序列相比,有5-10个氨基酸被性质相似或相近的氨基酸所替换而形成多肽。
本发明中,猪核受体辅激活因子1(NCOA-1)基因的cDNA序列是通过以猪的小肠组织总RNA为模板,参考人、鼠的核受体辅激活因子1基因的同源序列设计了四对引物,进行反转录PCR,克隆获得四条新基因的部分序列,对四条部分序列的重叠区进行拼接,从而获得了NCOA-1基因的大部分序列;同时以人的SRC-1基因mRNA序列为探针进行电子克隆得到部分编码蛋白的核苷酸序列,将两种方法克隆得到的部分序列进行拼接,得到完整的编码蛋白序列。并在电子克隆得到的序列上设计两对引物,克隆测序,验证了电子克隆的结果,最终获得了完整的新基因序列。获得的猪NCOA-1基因蛋白编码序列见SEQ ID NO.1。将猪NCOA-1基因cDNA序列中的编码序列(CDS)按通用密码子翻译成的蛋白质编码序列见SEQ IDNO.1。
所述的SEQ ID NO.1,该基因全长4323bp,开放阅读框1bp-4323bp区段,编码1440个氨基酸的蛋白质,分子量为156731道尔顿。本发明获得的NCOA-1基因蛋白编码序列上的1-3位为起始密码子ATG,4321-4323位为终止密码子TAA,1-4323位为编码蛋白质区域(CDS);全长核苷酸序列是由四个RT-PCR产物克隆测序得到的序列和两个电子克隆获得的序列拼接而成的,长度分别为599bp、724bp、1059bp、1454bp和827bp、824bp。6个RT-PCR扩增产物克隆测序并验证了电子克隆得到的部分序列,从而获得基因全长。
本发明中的猪核受体辅激活蛋白1基因在GeneBank核苷酸数据库中搜索同源序列,发现该基因编码蛋白的核苷酸序列(CDS)同其它哺乳动物的同源基因具有高度的同源性。同人的类固醇受体辅激活因子1a(AJ000881)同源性为94.11%;同小鼠的同源性为85.79%(NM-010881);同大鼠的同源性为76.82%(XM233944)。
本发明中的猪核受体辅激活蛋白1基因编码的氨基酸序列,在GeneBank蛋白质数据库中搜索同源序列,发现其同其它哺乳动物的同源基因的氨基酸序列同样具有高度的同源性。同人的类固醇受体辅激活因子1氨基酸序列(AAC50631)同源性为96.39%;同小鼠的同源性为88.11%(AAB06177);同大鼠的同源性为88.84%(XP233944)。
在本发明中,“猪核受体辅激活蛋白1基因蛋白编码序列”指与SEQ ID NO.1的氨基酸序列相比,有5-10个氨基酸被性质相似或相近的氨基酸所替换而形成多肽。这些保守性变异多肽最好根据表1进行替换而产生。
                           表1
最初的残基 代表性的取代 优选的取代
Ala(A) Val;Leu;Ile Val
Arg(R) Lys;Gln;Asn Lys
Asn(N) Gln;His;Lys;Arg Gln
Asp(D) Glu Glu
Cys(C) Ser Ser
Gln(Q) Asn Asn
Glu(E) Asp Asp
Gly(G) Pro;Ala Ala
His(H) Asn;Gln;Lys;Arg Arg
Ile(I) Leu;Val;Met;Ala;Phe Leu
Leu(L) Ile;Val;Met;Ala;Phe Ile
Lys(K) Arg;Gln;Asn Arg
Met(M) Leu;Phe;Ile Leu
Phe(F) Leu;Val;Ile;Ala;Tyr Leu
Pro(P) Ala Ala
Ser(S) Thr Thr
Thr(T) Ser Ser
Trp(W) Tyr;Phe Tyr
Tyr(Y) Trp;Phe;Thr;Ser Phe
Val(V) Ile;Leu;Met;Phe;Ala Leu
本发明首次从猪的小肠组织中克隆得到了猪的NCOA-1的蛋白编码序列,为研究NCOA-1在为人类相关疾病的研究提供动物模型以及养猪生产中提高猪的繁殖性能奠定了基础。
附图说明
图1猪核受体辅激活蛋白1基因cDNA序列克隆过程简图。
具体实施方式
下面结合具体实施例,进一步阐述本发明。这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件,例如Sambrook等分子克隆:实验室手册(New York:Cold Spring HarborLaboratory Press,1989)中所述的条件,或按照制造厂商所建议的条件。
实施例1
猪NCOA-1基因cDNA序列的克隆,其过程见附图1。
在基因克隆过程中所用到的实验方法具体操作方法如下:
1.组织分离(Isolation)
在猪场屠宰30日龄杜长大商品仔猪,取结肠组织样,迅速放入液氮中,冷冻后保存于实验室-80℃冰箱中,准备提取组织总RNA。
2.总RNA的分离(Total RNA isolation)
(1)提取RNA的准备工作
玻璃制品用0.1M的NaOH浸泡过夜,用自来水反复冲洗,再用蒸馏水冲洗2遍,180℃烘烤4小时。
匀浆器、电泳槽用3%的双氧水浸泡20-30分钟,再用0.1%的DEPC水冲洗.由于未灭活的DEPC对PCR反应有影响,可用0.5%的SDS处理。
Tip头、EP管用0.1%的DEPC水浸泡过夜,高压灭菌使DEPC失活。
双蒸水和溶液用DEPC处理,即每100ml水或溶液加0.1mlDEPC液,室温放置过夜,高压灭菌30分钟DEPC失活。
(2)组织总RNA提取
取100mg在液氮中冻存的组织样放入1ml Trizol(trizalreagent,invitrogenBRL,USA)的匀浆器管中匀浆。4℃ 12000g离心10分钟。吸取上清液,15-30℃温育5分钟。加0.2ml氯仿,盖上盖子,用手剧烈震荡15秒。15-30℃温育2-3分钟。4℃ 12000g离心15分钟。吸取上清液,加0.8ml异丙醇,混合均匀。15-30℃温育10分钟,4℃ 12000g离心10分钟,离心管底部白色沉淀即为RNA。倒掉上清,加1ml 75%乙醇洗涤RNA,4℃ 7500g离心10分钟。自然干燥或真空干燥RNA.溶于水(RNase free)中分装,-70℃保存。
(3)组织总RNA的鉴定
通过分光光度计上测定RNA含量并且用琼脂糖电泳分析RNA的质量,具体方法如下:电泳槽用RNA清洗液(100mM NaOH,1mM EDTA)浸泡4-5小时,再用DEPC处理过的水反复冲洗数次后倒入1×TBE待用。琼脂糖凝胶用1×TBE配制。在10ul上样缓冲液(2×TBE,13%菲可,0.1%溴酚兰,7M尿素)中加入1ul以上组织总RNA,65℃变性10分钟后立即放入冰水中2-3分钟。点样于琼脂糖凝胶中电泳。
3.引物设计及合成
首先用GeneBank中提供的人的SRC-1基因的mRNA序列(AJ000881)在NCBI的EST Other库中进行Blast分析,寻找出所有与该序列高度相似的EST。Blast的结果共有10条左右的猪的EST序列。除去重复序列,其中本实验应用到的EST有:CK449131、NM003743、DN113177、DN344959、AW436788。
引物对N2:
根据GenBank发表的人(AJ000881)、小鼠(NM-010881)等物种的NCOA-1基因的mRNA序列,在物种间高度保守的区域,设计上游引物NF2;在猪的EST序列CK449131上设计下游引物NR2。用于以猪cDNA为模版的PCR扩增,以获得猪NCOA-1基因部分cDNA序列,长度为1454bp。引物用Primer Premier 5.0自行设计,由上海华诺生物技术有限公司合成。引物对N2如下:
NF2:5’-TAGTCAAGGGGTGATAGAA-3’   NR2:5’-CTTTGTTATCTTTGGACTC-3’
②引物对N3:
根据GenBank发表的人(AJ000881)、小鼠(NM-010881)等物种的NCOA-1基因的mRNA序列,在物种间高度保守的区域,设计上游引物NF3;在由引物对N2克隆得到的序列上设计下游引物NR3,用于以猪cDNA为模版的PCR扩增,以获得猪NCOA-1基因部分cDNA序列,长度为599bp。该引物对克隆的序列包含起始密码子。引物用Primer Premier 5.0自行设计,由上海华诺生物技术有限公司合成。引物对A2如下:
NF3:5’-AAGTCTCCCCAGGTGTGA-3’    NR3:5’-CTATTTCGTCGTGTTGC-3’
③引物对N4
在由引物对N2克隆测序得到的序列上设计上游引物NF4;在猪的EST序列DN113177上设计下游引物NR4。用于以猪cDNA为模版的PCR扩增,以获得猪NCOA-1基因部分cDNA序列,长度为724bp。引物用Primer Premier 5.0自行设计,由上海华诺生物技术有限公司合成。引物对N4如下:
NF4:5’-CTGTTGGCTTTTCTGCTGGTT-3’ NR4:5’-GTCATTGGGGTTGGATTTGT-3’
④引物对N5
在猪的EST序列DN113177上设计上游引物NF5;在猪的EST序列BI344959上设计下游引物。用于以猪cDNA为模版的PCR扩增,以获得猪NCOA-1基因部分cDNA序列,长度为1059bp。引物用Primer Premier 5.0自行设计,由上海华诺生物技术有限公司合成。引物对N5如下:
NF5:5’-CCAGCGTAACCATCAAAT-3’    NR5:5’-GTTTCTCTCCAGTTGTGA-3’
⑤引物对N6
在由N4引物对克隆测序得到的序列上设计上游引物NF6;在由N3引物对克隆测序得到的序列上设计下游引物NR6。用于以猪cDNA为模版的PCR扩增,以验证电子克隆猪NCOA-1基因部分cDNA序列的结果,长度为435bp。引物用PrimerPremier 5.0自行设计,由上海华诺生物技术有限公司合成。引物对N6如下:
NF6:5’-CAACTTTGTCTGTGGAGCCT-3’  NR6:5’-CCGATTTGATGGTTACGC-3’
⑥引物对N7
在由N5引物对克隆测序得到的序列上设计上游引物NF7;在猪的EST序列AW436788上设计下游引物NR7。用于以猪cDNA为模版的PCR扩增,以验证电子克隆猪NCOA-1基因部分cDNA序列的结果,长度为949bp。引物用Primer Premier 5.0自行设计,由上海华诺生物技术有限公司合成。引物对N7如下:
NF7:5’-CCCTACCCACCAAACTAT-3’    NR7:5’-TCCAAATGCTACGACCTG-3’
4.RT-PCR扩增
按大连宝生物反转录试剂盒(BcaBEST RNA PCR Kit Ver.1.1)要求进行反转录。反转录反应液组成:10ul 2×Bca 1st Buffer,4ul 25Mm MgSO4,1ul dNTPMixture,0.5ul Rnase Inhibitor(40U/ul),1ul BcaBEST Polymerase(22U/ul),1ul Oligo dT Primer,1ul RNA Sample,1.5ul Rnase Free dH2O,总体系为20ul。反转录反应条件:65℃1分钟,30℃5分钟(15分钟-30分钟内匀速升温),65℃25分钟,98℃5分钟,5℃5分钟。PCR扩增条件:97℃变性5分钟;95℃30秒→55℃30秒→72℃1分钟,如此进行30次循环;72℃延伸10分钟,4℃保存。
5.克隆和测序
PCR扩增片段的回收。片段回收按上海华舜小量胶回收试剂盒说明进行,操作过程如下:尽可能小的割下含DNA的琼脂糖块,放入1.5mlEP管中。按每100mg琼脂糖加入300ulS1液的比例加S1液,50℃水浴10分钟。将溶化的琼脂糖液移入吸附柱,10000g离心1分钟,倒掉管中液体。在吸附柱中加入500ul W1液,10000g离心15秒,倒掉管中液体。在吸附柱中加入500ul W1液,静置1分钟后,10000g离心15秒,倒掉管中液体。离心1分钟。将吸附柱放入一个干净的1.5mlEP管中,在吸附膜中央加入30ulT1液,静置1分钟后,10000g离心1分钟,EP管中液体即为回收的DNA。
回收片段同T载体的连接。连接用TaKaRa pMD18-T Vector试剂盒,操作过程如下:在EP管中制备下列连接反应液:pMD18-T Vector(50ng/ul)0.5ul,DNA20-40ng,Solution 15ul,加dH2O至10ul。将上述反应液在16℃反应30分钟(过夜也可以),产物用于转化感受态细胞。
质粒的转化。从-70℃冰箱中取出保存的感受态细胞,冰浴助溶。100ul感受态细胞加入10ul连接产物,冰浴30分钟。42℃水浴热应激90秒钟,立即置入冰浴中2分钟。加400ul液体LB培养基,37℃复活50分钟。取100ul铺于LB平板上,平板含0.1%(V/V)的氨苄青霉Amp(100mg/ml)。37℃恒温培养10-15小时。
转化菌落的PCR鉴定与培养。用记号笔标记转化培养的单菌落,用灭菌的牙签蘸取单菌落。将牙签头放入在加有PCR反应液(不含模板)的EP管中晃动,使单菌落充当模板。用获得该片段的PCR条件进行扩增。PCR产物同Marker一起进行琼脂糖凝胶电泳,鉴别T载体上是否含有目的片段。若得到目的片段,可用灭菌枪头挑取在平板上的与之对应的单菌落,放入40ml LB液体培养基中,先在液体中加入0.1%(V/V)的青霉素钠(100mg/ml),37℃过夜摇菌培养,用于质粒回收。
质粒的回收。质粒回收用上海华舜小量质粒抽提纯化试剂盒,操作步骤如下:将转化培养的菌液加入1.5mlEP管中,4000转/分钟离心,倒掉液体获细菌沉淀。细菌沉淀不够时可再加一次菌液离心。在细菌沉淀中加入250ulP1液,振荡悬浮。加入250ulP2液,温和摇匀,室温静置4分钟。加入350ulP3液,温和摇匀。离心10分钟,将上清液小心移入吸附柱,离心15秒,倒掉液体。在吸附柱中加入500ulW1,离心15秒,倒掉液体。在吸附柱中加入500ulW1,静置1分钟,离心15秒,倒掉液体。离心1分钟。将吸附柱放入一个干净的1.5mlEP管中,在吸附膜中央加入25-30ulT1液,静置1分钟后,离心1分钟.EP管中液体即为回收的质粒。
质粒的酶切鉴定。为了证明回收质粒确为插入目的片段的重组质粒,采用双酶切法鉴定.本研究具体操作如下:根据TaKaRa pMD18-T Vector图,选择内切酶Bam HI和Hind III.保证目的片段中无这两种酶的切点。组成如下酶切反应体系:Bam HI 1ul,Hind III 1ul,10×K Buffer 2ul,DNA≤1ul,加dH2O至20ul。30℃反应3小时。琼脂糖凝胶电泳检测.
重组质粒的测序。取20ul重组质粒于EP管中,封口膜密封,交生物技术公司测序。
6.电子克隆
以人SRC-1基因mRNA核苷酸序列(GeneBank登录号AJ000881)为信息探针运行NCBI中的BLASTn程序在EST Other数据库中搜索,得到与探针高度吻合的一系列长短不一的猪EST序列,然后将这些序列进行拼装连接得到一个长的序列,然后再分别以得到的这段长序列为探针再次在猪EST数据库中进行BLASTn,得到更多的EST序列,从而使序列向两端延伸,最终将所获得的序列进行拼接得到部分的CDS序列。
实施例2
猪NCOC-1/SRC-1基因编码序列同源性比较
在GenBank上搜索并获得人、小鼠、大鼠NCOA-1基因编码蛋白序列,将其同本发明克隆测序获得的SEQ ID NO.1序列一起,在分子生物学软件DNAman上进行序列同源性比较。比较结果显示:SEQ ID NO.1序列与人、小鼠等物种NCOA-1基因CDS序列同源性为93.73%,与人、小鼠、大鼠的氨基酸序列同源性为94.99%。
本发明涉及的序列及记号分列如下:
SEQ ID NO.1的信息
<110>上海交通大学
<120>猪核受体辅激活因子1基因的蛋白编码序列
<140>
<141>2005-05-18
<160>2
<170>PatentIn version 3.1
<210>1
<211>4323
<212>DNA
<213>猪(sus scrofa)
<400>1
atg agt ggc ctt ggg gac agt tca tct gac cct gct aac cca gac tca 48
Met Ser Gly Leu Gly Asp Ser Ser Ser Asp Pro Ala Asn Pro Asp Ser
15 10 15
cat aag aga aaa gga tca cca tgt gac aca ttg gca tca agc act gaa 96
His Lys Arg Lys Gly Ser Pro Cys Asp Thr Leu Ala Ser Ser Thr Glu
20 25 30
aaa agg cgc agg gaa caa gaa aat aaa tat tta gaa gag cta gct gag 144
Lys Arg Arg Arg Glu Gln Glu Asn Lys Tyr Leu Glu Glu Leu Ala Glu
35 40 45
tta ctg tct gcc aac atc agt gac att gac agc ttg agt gta aaa cca 192
Leu Leu Ser Ala Asn Ile Ser Asp Ile Asp Ser Leu Ser Val Lys Pro
50 55 60
gac aaa tgc aag ata tta aag aag aca gtc gat cag ata cag cta atg 240
Asp Lys Cys Lys Ile Leu Lys Lys Thr Val Asp Gln Ile Gln Leu Met
65 70 75 80
aag aga atg gaa caa gag aaa tca aca act gat gat gaa gta cag aaa 288
Lys Arg Met Glu Gln Glu Lys Ser Thr Thr Asp Asp Glu Val Gln Lys
85 90 95
tca gat atc tcg tcg agt agt caa ggg gtg ata gaa aaa gaa tcc ttg 336
Ser Asp Ile Ser Ser Ser Ser Gln Gly Val Ile Glu Lys Glu Ser Leu
100 105 110
gga cct ctt ctt ttg gag gct ttg gat gga ttt ttc ttt gtt gtg aac 384
Gly Pro Leu Leu Leu Glu Ala Leu Asp Gly Phe Phe Phe Val Val Asn
115 120 125
tgt gaa ggg agg att gta ttt gtg tca gag aat gtg acc agc tac ttg 432
Cys Glu Gly Arg Ile Val Phe Val Ser Glu Asn Val Thr Ser Tyr Leu
130 135 140
ggt tac aat cag gag gag tta atg aac acc agt gtc tat agc ata ctg 480
Gly Tyr Asn Gln Glu Glu Leu Met Asn Thr Ser Val Tyr Ser Ile Leu
145 150 155 160
cac gtg ggg gat cat gca gaa ttt gtg aag aat ctg ctg cca aaa tca 528
His Val Gly Asp His Ala Glu Phe Val Lys Asn Leu Leu Pro Lys Ser
165 170 175
cta gta aat gga gtt cct tgg cct caa gag gca aca cga cga aat agc 576
Leu Val Asn Gly Val Pro Trp Pro Gln Glu Ala Thr Arg Arg Asn Ser
180 185 190
cat acc ttt aac tgc agg atg cta att cac cct cca gat gag cca ggc 624
His Thr Phe Asn Cys Arg Met Leu Ile His Pro Pro Asp Glu Pro Gly
195 200 205
acc gag aac caa gaa gct tgc cag cgg tat gaa gta atg cag tgt ttc 672
Thr Glu Asn Gln Glu Ala Cys Gln Arg Tyr Glu Val Met Gln Cys Phe
210 215 220
act gtg tca cag cca aaa tca att caa gag gat gga gaa gat ttc cag 720
Thr Val Ser Gln Pro Lys Ser Ile Gln Glu Asp Gly Glu Asp Phe Gln
225 230 235 240
tca tgt ttg att tgt att gcc cgg cga tta cct cgg cct cca gct att 768
Ser Cys Leu Ile Cys Ile Ala Arg Arg Leu Pro Arg Pro Pro Ala Ile
245 250 255
atg ggt gta gaa tcc ttt atg acc aag caa gat act aca ggt aaa atc 816
Met Gly Val Glu Ser Phe Met Thr Lys Gln Asp Thr Thr Gly Lys Ile
260 265 270
atc tct att gat acc agt tcc ctg aga gct gcg ggc aga act ggc tgg 864
Ile Ser Ile Asp Thr Ser Ser Leu Arg Ala Ala Gly Arg Thr Gly Trp
275 280 285
gaa gaa ttt atg aga aag tgc ata tat gct ttc ttc caa cct caa ggc 912
Glu Glu Phe Met Arg Lys Cys Ile Tyr Ala Phe Phe Gln Pro Gln Gly
290 295 300
aga gag cca tcg tat gcc aga caa cta ttt caa gaa gtg atg act cgt 960
Arg Glu Pro Ser Tyr Ala Arg Gln Leu Phe Gln Glu Val Met Thr Arg
305 310 315 320
ggc act gcc tcc agc cca tcc tat agg ttc ata ttg aat gat ggg aca 1008
Gly Thr Ala Ser Ser Pro Ser Tyr Arg Phe Ile Leu Asn Asp Gly Thr
325 330 335
atg ctt agc gcc cac acc aag tgt aaa ctt tgc tac cct caa agt cca 1056
Met Leu Ser Ala His Thr Lys Cys Lys Leu Cys Tyr Pro Gln Ser Pro
340 345 350
gac atg cag cct ttc atc atg gga att cat atc atc gac agg gaa cac 1104
Asp Met Gln Pro Phe Ile Met Gly Ile His Ile Ile Asp Arg Glu His
355 360 365
agt ggt ctt tct cct caa gat gac act aat tct gga atg tca att ccc 1152
Ser Gly Leu Ser Pro Gln Asp Asp Thr Asn Ser Gly Met Ser Ile Pro
370 375 380
cgg gta aat cct ccc gtc aat cct agt atc tct cca gct cac ggt gtg 1200
Arg Val Asn Pro Pro Val Asn Pro Ser Ile Ser Pro Ala His Gly Val
385 390 395 400
gcc cgt tca tct tca ttg cca cca tcc aac agc aac atg gta tcc acc 1249
Ala Arg Ser Ser Ser Leu Pro Pro Ser Asn Ser Asn Met Val Ser Thr
405 410 415
aga gta aac cgc caa cag agc tca gac ctt cac agc agc agt cac agt 1296
Arg Val Asn Arg Gln Gln Ser Ser Asp Leu His Ser Ser Ser His Ser
420 425 430
aat tct agc aac agc caa ggg agt ttt gga tgc tca cct gga aat cag 1344
Asn Ser Ser Asn Ser Gln Gly Ser Phe Gly Cys Ser Pro Gly Asn Gln
435 440 445
att gta gcc ggt gtt gcc tta aac cag gga cag gct agt tcc cag agc 1392
Ile Val Ala Gly Val Ala Leu Asn Gln Gly Gln Ala Ser Ser Gln Ser
450 455 460
act aat ccc cct tta aac ctc aat aat tct cct atg gaa ggt aca gga 1440
Thr Asn Pro Pro Leu Asn Leu Asn Asn Ser Pro Met Glu Gly Thr Gly
465 470 475 480
ata tcc ctt gca cag ttc atg tct cca agg agg caa gtt agt tct gga 1488
Ile Ser Leu Ala Gln Phe Met Ser Pro Arg Arg Gln Val Ser Ser Gly
485 490 495
ttg gca aca aga ccc aga atg ccg aac aat tca ttt cct cct aat att 1536
Leu Ala Thr Arg Pro Arg Met Pro Asn Asn Ser Phe Pro Pro Asn Ile
500 505 510
ccg aca tta aac tcc cct gtt agc atg aca agt act gcc tgt aat aat 1584
Pro Thr Leu Asn Ser Pro Val Ser Met Thr Ser Thr Ala Cys Asn Asn
515 520 525
agt aac cga tct tat tca aac atc cca gta aca tct ttg cag agt atg 1632
Ser Asn Arg Ser Tyr Ser Asn Ile Pro Val Thr Ser Leu Gln Ser Met
530 535 540
aat gaa gga ccc aat aac tct gtt ggc ttt tct gct ggt tct cca gtc 1680
Asn Glu Gly Pro Asn Asn Ser Val Gly Phe Ser Ala Gly Ser Pro Val
545 550 555 560
ctc agg cag atg agc tca cag aat tca cct agc aga tta aat ata cag 1728
Leu Arg Gln Met Ser Ser Gln Asn Ser Pro Ser Arg Leu Asn Ile Gln
565 570 575
cca gca aaa gct gag tcc aaa gat aac aaa gag act gca tcc att tta 1776
Pro Ala Lys Ala Glu Ser Lys Asp Asn Lys Glu Thr Ala Ser Ile Leu
580 585 590
aat gaa atg att cag tct gac aac agc tct aat gat ggc aaa cct ctg 1824
Asn Glu Met Ile Gln Ser Asp Asn Ser Ser Asn Asp Gly Lys Pro Leu
595 600 605
gat tct ggg ctt ctg cat aac aat gac aga ctc tca gat ggg gac aat 1872
Asp Ser Gly Leu Leu His Asn Asn Asp Arg Leu Ser Asp Gly Asp Asn
610 615 620
aaa tac tct caa acc agt cac aaa ctg gtg cag ctt ttg aca aca act 1920
Lys Tyr Ser Gln Thr Ser His Lys Leu Val Gln Leu Leu Thr Thr Thr
625 630 635 640
gca gag cag cag tta cgg cat gct gat ata gac aca agc tgc aaa gag 1968
Ala Glu Gln Gln Leu Arg His Ala Asp Ile Asp Thr Ser Cys Lys Glu
645 650 655
gta ttg tct tgc aca ggc act tcc agc tct gcc tct gct aac tct tca 2016
Val Leu Ser Cys Thr Gly Thr Ser Ser Ser Ala Ser Ala Asn Ser Ser
660 665 670
agt ggc tct tgc ccc tcc tct cat agc tca ctg acg gag cgg cac aaa 2064
Ser Gly Ser Cys Pro Ser Ser His Ser Ser Leu Thr Glu Arg His Lys
675 680 685
att ctc cac cga ctc tta cag gag ggt agc ccc tcg gat atc aca act 2112
Ile Leu His Arg Leu Leu Gln Glu Gly Ser Pro Ser Asp Ile Thr Thr
690 695 700
ttg tct gtg gag cct gat aaa aag gac agt gcc tct act tct gtg tca 2160
Leu Ser Val Glu Pro Asp Lys Lys Asp Ser Ala Ser Thr Ser Val Ser
705 710 715 720
gtg act ggg cag gta cca ggg aac tcc ggt ata aaa ctg gaa ctg gat 2208
Val Thr Gly Gln Val Pro Gly Asn Ser Gly Ile Lys Leu Glu Leu Asp
725 730 735
gct tca aag aaa aaa gaa tca aaa gac cat cag ctt cta cgc tac ctt 2256
Ala Ser Lys Lys Lys Glu Ser Lys Asp His Gln Leu Leu Arg Tyr Leu
740 745 750
tta gat aaa gat gag aaa gat tta aga tca act cct aac ctg agc ctg 2304
Leu Asp Lys Asp Glu Lys Asp Leu Arg Ser Thr Pro Asn Leu Ser Leu
755 760 765
gat gac gta aag gta aaa gtg gaa aag aag gaa cag atg gat cct tgt 2352
Asp Asp Val Lys Val Lys Val Glu Lys Lys Glu Gln Met Asp Pro Cys
770 775 780
aac aca aac cca acc cca atg aca aaa cct cct cct gag gaa att aaa 2400
Asn Thr Asn Pro Thr Pro Met Thr Lys Pro Pro Pro Glu Glu Ile Lys
785 790 795 800
ctg gag tca cag agc cag ttt aca gct gac ctt gac cag ttt gat cag 2448
Leu Glu Ser Gln Ser Gln Phe Thr Ala Asp Leu Asp Gln Phe Asp Gln
805 810 815
tta cta ccc aca ctg gag aag gca gca cag tta cca ggc tta tgt gag 2496
Leu Leu Pro Thr Leu Glu Lys Ala Ala Gln Leu Pro Gly Leu Cys Glu
820 825 830
aca gag agg atg gat ggt gcg gtc acc agc gta acc atc aaa tcg gag 2544
Thr Glu Arg Met Asp Gly Ala Val Thr Ser Val Thr Ile Lys Ser Glu
835 840 845
atc ctg cca gct aca ctt cag tcc acc act gcc aga cct act tcc agg 2592
Ile Leu Pro Ala Thr Leu Gln Ser Thr Thr Ala Arg Pro Thr Ser Arg
850 855 860
ctg aat aga tta cct gag cta gaa ttg gaa gca att gat aac cag ttt 2640
Leu Asn Arg Leu Pro Glu Leu Glu Leu Glu Ala Ile Asp Asn Gln Phe
865 870 875 880
gga caa ccg gga aca ggt gat cag att cca tgg gca aat aat aca gtg 2688
Gly Gln Pro Gly Thr Gly Asp Gln Ile Pro Trp Ala Asn Asn Thr Val
885 890 895
aca gct gta aat cag aat aaa cca gaa gac cag tgt att agt tca caa 2736
Thr Ala Val Asn Gln Asn Lys Pro Glu Asp Gln Cys Ile Ser Ser Gln
900 905 910
tta gat gag ctt ctc tgt cca cca aca aca gtt gaa gga aga aat gat 2784
Leu Asp Glu Leu Leu Cys Pro Pro Thr Thr Val Glu Gly Arg Asn Asp
915 920 925
gag aag gct ctt ctt gaa cag ctg gta tcc ttc ctc agc ggc aaa gat 2832
Glu Lys Ala Leu Leu Glu Gln Leu Val Ser Phe Leu Ser Gly Lys Asp
930 935 940
gaa act gag tta gcg gaa cta gac aga gct ctg gga atc gac aaa ctt 2880
Glu Thr Glu Leu Ala Glu Leu Asp Arg Ala Leu Gly Ile Asp Lys Leu
945 950 955 960
gtt cag gga gga gga ttg gat gta tta tca gag aga ttt cca cca caa 2928
Val Gln Gly Gly Gly Leu Asp Val Leu Ser Glu Arg Phe Pro Pro Gln
965 970 975
caa gca aca ccg cca ttg atg atg gaa gaa aga ccc aac ctt tat tca 2976
Gln Ala Thr Pro Pro Leu Met Met Glu Glu Arg Pro Asn Leu Tyr Ser
980 985 990
cag cct tat tct tct cca tca cct act gcc aat ctc tct ggc ccc ttc 3024
Gln Pro Tyr Ser Ser Pro Ser Pro Thr Ala Asn Leu Ser Gly Pro Phe
995 1000 1005
caa ggc atg gtc agg caa aaa cct tca ttg ggg act atg cct gtt caa 3072
Gln Gly Met Val Arg Gln Lys Pro Ser Leu Gly Thr Met Pro Val Gln
1010 1015  1020
gta aca cct ccc cga ggt gct ttt tca cct ggc atg ggc atg cag ccc 3120
Val Thr Pro Pro Arg Gly Ala Phe Ser Pro Gly Met Gly Met Gln Pro
1025 1030 1035 1040
agg cag act cta aac aga cct cca gct gca ccc aac caa cta aga ctt 3168
Arg Gln Thr Leu Asn Arg Pro Pro Ala Ala Pro Asn Gln Leu Arg Leu
1045 1050 1055
cag ctt cag caa cga tta cag gga caa cag cag ttg ata cac caa aat 3216
Gln Leu Gln Gln Arg Leu Gln Gly Gln Gln Gln Leu Ile His Gln Asn
1060 1065 1070
cgg cag gct atc ttg aac cag ttt gca gca aac gct cct gtt ggc atc 3264
Arg Gln Ala Ile Leu Asn Gln Phe Ala Ala Asn Ala Pro Val Gly Ile
1075 1080 1085
aat atg aga tca ggc atg caa cag caa att aca cct cag cca ccc ctg 3312
Asn Met Arg Ser Gly Met Gln Gln Gln Ile Thr Pro Gln Pro Pro Leu
1090 1095 1100
aat gcc caa atg ttg gcc cag cgc cag cgg gag tta tac agt caa cag 3360
Asn Ala Gln Met Leu Ala Gln Arg Gln Arg Glu Leu Tyr Ser Gln Gln
1105 1110 1115 1120
cac cga cgg agg cag cta ata cag cag cag aga gcc atg ctc atg agg 3408
His Arg Arg Arg Gln Leu Ile Gln Gln Gln Arg Ala Met Leu Met Arg
1125 1130 1135
cag caa agc ttt ggg aac aac ctc cct ccc tcg tct gga ctg cca gtt 3456
Gln Gln Ser Phe Gly Asn Asn Leu Pro Pro Ser Ser Gly Leu Pro Val
1140 1145 1150
cca atg ggg aac ccc cgt ctt cct cag ggt gct ccg cag caa ttc ccc 3504
Pro Met Gly Asn Pro Arg Leu Pro Gln Gly Ala Pro Gln Gln Phe Pro
1155 1160 1165
tac cca cca aac tat ggt aca aat ccc gga act cca ccc gct tct acc 3552
Tyr Pro Pro Asn Tyr Gly Thr Asn Pro Gly Thr Pro Pro Ala Ser Thr
1170 1175 1180
agc ccc ttt tca caa ctg gca gaa aac cct gag gca acc ttg ggc aac 3600
Ser Pro Phe Ser Gln Leu Ala Glu Asn Pro Glu Ala Thr Leu Gly Asn
1185 1190 1195 1200
cgc aac agc atg gtg aac aga ggc atg aca gga aac atg gga gga cag 3648
Arg Asn Ser Met Val Asn Arg Gly Met Thr Gly Asn Met Gly Gly Gln
1205 1210 1215
ttt ggc act gga atc aat cct cag atg cag cag aat gtc ttc cag tat 3696
Phe Gly Thr Gly Ile Asn Pro Gln Met Gln Gln Asn Val Phe Gln Tyr
1220 1225 1230
cca gga tca gga atg gtt ccc caa ggt gag gcc aac ttt gct cca tct 3744
Pro Gly Ser Gly Met Val Pro Gln Gly Glu Ala Asn Phe Ala Pro Ser
1235 1240 1245
ctt agc cct ggg agc tcc atg gtg ccg atg cca atc cct ccg cct cag 3792
Leu Ser Pro Gly Ser Ser Met Val Pro Met Pro Ile Pro Pro Pro Gln
1250 1255  1260
agc tct ctg ctc cag cag act ccg cct gct tct ggc tac cag tca cca 3840
Ser Ser Leu Leu Gln Gln Thr Pro Pro Ala Ser Gly Tyr Gln Ser Pro
1265 1270 1275 1280
gac atg aag gcc tgg cag caa gga gca atg gga aac aac aat gtg ttc 3888
Asp Met Lys Ala Trp Gln Gln Gly Ala Met Gly Asn Asn Asn Val Phe
1285 1290 1295
agt caa gct gtc cag aac cag ccc acg cct gca cag cca gga gtg tac 3936
Ser Gln Ala Val Gln Asn Gln Pro Thr Pro Ala Gln Pro Gly Val Tyr
1300 1305 1310
aac aat atg agc atc acc gtg tcc atg gca ggt gga aat aca aat gtt 3984
Asn Asn Met Ser Ile Thr Val Ser Met Ala Gly Gly Asn Thr Asn Val
1315 1320 1325
cag aac atg aac cca atg atg ggc cag atg cag atg agc tct ttg cag 4032
Gln Asn Met Asn Pro Met Met Gly Gln Met Gln Met Ser Ser Leu Gln
1330 1335 1340
atg cca gga atg aac act gtg tgc cct gag cag ata aat gat cca gcc 4080
Met Pro Gly Met Asn Thr Val Cys Pro Glu Gln Ile Asn Asp Pro Ala
1345 1350 1355 1360
ctg aga cac aca ggc ctc tac tgc aac cag ctc tca tct act gac ctt 4128
Leu Arg His Thr Gly Leu Tyr Cys Asn Gln Leu Ser Ser Thr Asp Leu
1365 1370 1375
ctc aaa aca gaa gca gat gga acc cag gtg caa cag gtt cag gtg ttt 4176
Leu Lys Thr Glu Ala Asp Gly Thr Gln Val Gln Gln Val Gln Val Phe
1380 1385 1390
gct gac gtc cag tgt aca gtg aat ctg gta ggc ggg gac cct tac ctg 4224
Ala Asp Val Gln Cys Thr Val Asn Leu Val Gly Gly Asp Pro Tyr Leu
1395 1400 1405
aac cag cct ggt cca ctg gga act caa aaa ccc acg gca gga cca cag 4272
Asn Gln Pro Gly Pro Leu Gly Thr Gln Lys Pro Thr Ala Gly Pro Gln
1410 1415 1420
acc ccc cag gcc cag cag aag agc ctc ctt cag cag cta ctg act gaa 4320
Thr Pro Gln Ala Gln Gln Lys Ser Leu Leu Gln Gln Leu Leu Thr Glu
1425 1430 1435 1440
taa 4323
<210>2
<211>1440
<212>PRT
<213>猪(sus scrofa)
<400>2
Met Ser Gly Leu Gly Asp Ser Ser Ser Asp Pro Ala Asn Pro Asp Ser
15 10 15
His Lys Arg Lys Gly Ser Pro Cys Asp Thr Leu Ala Ser Ser Thr Glu
20 25 30
Lys Arg Arg Arg Glu Gln Glu Asn Lys Tyr Leu Glu Glu Leu Ala Glu
35 40 45
Leu Leu Ser Ala Asn Ile Ser Asp Ile Asp Ser Leu Ser Val Lys Pro
50 55 60
Asp Lys Cys Lys Ile Leu Lys Lys Thr Val Asp Gln Ile Gln Leu Met
65 70 75 80
Lys Arg Met Glu Gln Glu Lys Ser Thr Thr Asp Asp Glu Val Gln Lys
85 90 95
Ser Asp Ile Ser Ser Ser Ser Gln Gly Val Ile Glu Lys Glu Ser Leu
100 105 110
Gly Pro Leu Leu Leu Glu Ala Leu Asp Gly Phe Phe Phe Val Val Asn
115 120 125
Cys Glu Gly Arg Ile Val Phe Val Ser Glu Asn Val Thr Ser Tyr Leu
130 135 140
Gly Tyr Asn Gln Glu Glu Leu Met Asn Thr Ser Val Tyr Ser Ile Leu
145 150 155 160
His Val Gly Asp His Ala Glu Phe Val Lys Asn Leu Leu Pro Lys Ser
165 170 175
Leu Val Asn Gly Val Pro Trp Pro Gln Glu Ala Thr Arg Arg Asn Ser
180 185 190
His Thr Phe Asn Cys Arg Met Leu Ile His Pro Pro Asp Glu Pro Gly
195 200 205
Thr Glu Asn Gln Glu Ala Cys Gln Arg Tyr Glu Val Met Gln Cys Phe
210 215 220
Thr Val Ser Gln Pro Lys Ser Ile Gln Glu Asp Gly Glu Asp Phe Gln
225 230 235 240
Ser Cys Leu Ile Cys Ile Ala Arg Arg Leu Pro Arg Pro Pro Ala Ile
245 250 255
Met Gly Val Glu Ser Phe Met Thr Lys Gln Asp Thr Thr Gly Lys Ile
260 265 270
Ile Ser Ile Asp Thr Ser Ser Leu Arg Ala Ala Gly Arg Thr Gly Trp
275 280 285
Glu Glu Phe Met Arg Lys Cys Ile Tyr Ala Phe Phe Gln Pro Gln Gly
290 295 300
Arg Glu Pro Ser Tyr Ala Arg Gln Leu Phe Gln Glu Val Met Thr Arg
305 310 315 320
Gly Thr Ala Ser Ser Pro Ser Tyr Arg Phe Ile Leu Asn Asp Gly Thr
325 330 335
Met Leu Ser Ala His Thr Lys Cys Lys Leu Cys Tyr Pro Gln Ser Pro
340 345 350
Asp Met Gln Pro Phe Ile Met Gly Ile His Ile Ile Asp Arg Glu His
355 360 365
Ser Gly Leu Ser Pro Gln Asp Asp Thr Asn Ser Gly Met Ser Ile Pro
370 375 380
Arg Val Asn Pro Pro Val Asn Pro Ser Ile Ser Pro Ala His Gly Val
385 390 395 400
Ala Arg Ser Ser Ser Leu Pro Pro Ser Asn Ser Asn Met Val Ser Thr
405 410 415
Arg Val Asn Arg Gln Gln Ser Ser Asp Leu His Ser Ser Ser His Ser
420 425 430
Asn Ser Ser Asn Ser Gln Gly Ser Phe Gly Cys Ser Pro Gly Asn Gln
435 440 445
Ile Val Ala Gly Val Ala Leu Asn Gln Gly Gln Ala Ser Ser Gln Ser
450 455 460
Thr Asn Pro Pro Leu Asn Leu Asn Asn Ser Pro Met Glu Gly Thr Gly
465 470 475 480
Ile Ser Leu Ala Gln Phe Met Ser Pro Arg Arg Gln Val Ser Ser Gly
485 490 495
Leu Ala Thr Arg Pro Arg Met Pro Asn Asn Ser Phe Pro Pro Asn Ile
500 505 510
Pro Thr Leu Asn Ser Pro Val Ser Met Thr Ser Thr Ala Cys Asn Asn
515 520 525
Ser Asn Arg Ser Tyr Ser Asn Ile Pro Val Thr Ser Leu Gln Ser Met
530 535 540
Asn Glu Gly Pro Asn Asn Ser Val Gly Phe Ser Ala Gly Ser Pro Val
545 550 555 560
Leu Arg Gln Met Ser Ser Gln Asn Ser Pro Ser Arg Leu Asn Ile Gln
565 570 575
Pro Ala Lys Ala Glu Ser Lys Asp Asn Lys Glu Thr Ala Ser Ile Leu
580 585 590
Asn Glu Met Ile Gln Ser Asp Asn Ser Ser Asn Asp Gly Lys Pro Leu
595 600 605
Asp Ser Gly Leu Leu His Asn Asn Asp Arg Leu Ser Asp Gly Asp Asn
601 615 620
Lys Tyr Ser Gln Thr Ser His Lys Leu Val Gln Leu Leu Thr Thr Thr
625 630 635 640
Ala Glu Gln Gln Leu Arg His Ala Asp Ile Asp Thr Ser Cys Lys Glu
645 650 655
Val Leu Ser Cys Thr Gly Thr Ser Ser Ser Ala Ser Ala Asn Ser Ser
660 665 670
Ser Gly Ser Cys Pro Ser Ser His Ser Ser Leu Thr Glu Arg His Lys
675 680 685
Ile Leu His Arg Leu Leu Gln Glu Gly Ser Pro Ser Asp Ile Thr Thr
690 695 700
Leu Ser Val Glu Pro Asp Lys Lys Asp Ser Ala Ser Thr Ser Val Ser
705 710 715 720
Val Thr Gly Gln Val Pro Gly Asn Ser Gly Ile Lys Leu Glu Leu Asp
725 730 735
Ala Ser Lys Lys Lys Glu Ser Lys Asp His Gln Leu Leu Arg Tyr Leu
740 745 750
Leu Asp Lys Asp Glu Lys Asp Leu Arg Ser Thr Pro Asn Leu Ser Leu
755 760 765
Asp Asp Val Lys Val Lys Val Glu Lys Lys Glu Gln Met Asp Pro Cys
770 775 780
Asn Thr Asn Pro Thr Pro Met Thr Lys Pro Pro Pro Glu Glu Ile Lys
785 790 795 800
Leu Glu Ser Gln Ser Gln Phe Thr Ala Asp Leu Asp Gln Phe Asp Gln
805 810 815
Leu Leu Pro Thr Leu Glu Lys Ala Ala Gln Leu Pro Gly Leu Cys Glu
820 825 830
Thr Glu Arg Met Asp Gly Ala Val Thr Ser Val Thr Ile Lys Ser Glu
835 840 845
Ile Leu Pro Ala Thr Leu Gln Ser Thr Thr Ala Arg Pro Thr Ser Arg
850 855 860
Leu Asn Arg Leu Pro Glu Leu Glu Leu Glu Ala Ile Asp Asn Gln Phe
865 870 875 880
Gly Gln Pro Gly Thr Gly Asp Gln Ile Pro Trp Ala Asn Asn Thr Val
885 890 895
Thr Ala Val Asn Gln Asn Lys Pro Glu Asp Gln Cys Ile Ser Ser Gln
900 905 910
Leu Asp Glu Leu Leu Cys Pro Pro Thr Thr Val Glu Gly Arg Asn Asp
915 920 925
Glu Lys Ala Leu Leu Glu Gln Leu Val Ser Phe Leu Ser Gly Lys Asp
930 935 940
Glu Thr Glu Leu Ala Glu Leu Asp Arg Ala Leu Gly Ile Asp Lys Leu
945 950 955 960
Val Gln Gly Gly Gly Leu Asp Val Leu Ser Glu Arg Phe Pro Pro Gln
965 970 975
Gln Ala Thr Pro Pro Leu Met Met Glu Glu Arg Pro Asn Leu Tyr Ser
980 985 990
Gln Pro Tyr Ser Ser Pro Ser Pro Thr Ala Asn Leu Ser Gly Pro Phe
995 1000 1005
Gln Gly Met Val Arg Gln Lys Pro Ser Leu Gly Thr Met Pro Val Gln
1010 1015 1020
Val Thr Pro Pro Arg Gly Ala Phe Ser Pro Gly Met Gly Met Gln Pro
1025 1030 1035 1040
Arg Gln Thr Leu Asn Arg Pro Pro Ala Ala Pro Asn Gln Leu Arg Leu
1045 1050 1055
Gln Leu Gln Gln Arg Leu Gln Gly Gln Gln Gln Leu Ile His Gln Asn
1060 1065 1070
Arg Gln Ala Ile Leu Asn Gln Phe Ala Ala Asn Ala Pro Val Gly Ile
1075 1080 1085
Asn Met Arg Ser Gly Met Gln Gln Gln Ile Thr Pro Gln Pro Pro Leu
1090 1095 1100
Asn Ala Gln Met Leu Ala Gln Arg Gln Arg Glu Leu Tyr Ser Gln Gln
1105 1110 1115 1120
His Arg Arg Arg Gln Leu Ile Gln Gln Gln Arg Ala Met Leu Met Arg
1125 1130 1135
Gln Gln Ser Phe Gly Asn Asn Leu Pro Pro Ser Ser Gly Leu Pro Val
1140 1145 1150
Pro Met Gly Asn Pro Arg Leu Pro Gln Gly Ala Pro Gln Gln Phe Pro
1155 1160 1165
Tyr Pro Pro Asn Tyr Gly Thr Asn Pro Gly Thr Pro Pro Ala Ser Thr
1170 1175 1180
Ser Pro Phe Ser Gln Leu Ala Glu Asn Pro Glu Ala Thr Leu Gly Asn
1185 1190 1195 1200
Arg Asn Ser Met Val Asn Arg Gly Met Thr Gly Asn Met Gly Gly Gln
1205 1210 1215
Phe Gly Thr Gly Ile Asn Pro Gln Met Gln Gln Asn Val Phe Gln Tyr
1220 1225 1230
Pro Gly Ser Gly Met Val Pro Gln Gly Glu Ala Asn Phe Ala Pro Ser
1235 1240 1245
Leu Ser Pro Gly Ser Ser Met Val Pro Met Pro Ile Pro Pro Pro Gln
1250 1255 1260
Ser Ser Leu Leu Gln Gln Thr Pro Pro Ala Ser Gly Tyr Gln Ser Pro
1265 1270 1275 1280
Asp Met Lys Ala Trp Gln Gln Gly Ala Met Gly Asn Asn Asn Val Phe
1285 1290 1295
Ser Gln Ala Val Gln Asn Gln Pro Thr Pro Ala Gln Pro Gly Val Tyr
1300 1305 1310
Asn Asn Met Ser Ile Thr Val Ser Met Ala Gly Gly Asn Thr Asn Val
1315 1320 1325
Gln Asn Met Asn Pro Met Met Gly Gln Met Gln Met Ser Ser Leu Gln
1330 1335 1340
Met Pro Gly Met Asn Thr Val Cys Pro Glu Gln Ile Asn Asp Pro Ala
1345 1350 1355 1360
Leu Arg His Thr Gly Leu Tyr Cys Asn Gln Leu Ser Ser Thr Asp Leu
1365 1370 1375
Leu Lys Thr Glu Ala Asp Gly Thr Gln Val Gln Gln Val Gln Val Phe
1380 1385 1390
Ala Asp Val Gln Cys Thr Val Asn Leu Val Gly Gly Asp Pro Tyr Leu
1395 1400 1405
Asn Gln Pro Gly Pro Leu Gly Thr Gln Lys Pro Thr Ala Gly Pro Gln
1410 1415 1420
Thr Pro Gln Ala Gln Gln Lys Ser Leu Leu Gln Gln Leu Leu Thr Glu
1425 1430 1435 1440

Claims (5)

1、一种猪核受体辅激活因子1基因的蛋白编码序列,其特征在于,所获得的猪NCOA-1基因蛋白编码序列,具有SEQ ID NO.1中从第1-4323位的核苷酸序列,其与人、小鼠物种NCOA-1/SRC-1基因CDS序列同源性为93.73%。
2、根据权利要求1所述的猪核受体辅激活因子1基因的蛋白编码序列,其特征是,所述的获得的猪NCOA-1基因蛋白编码序列,具有SEQ ID NO.1所示的氨基酸序列的多肽、或其保守性变异多肽、或其活性片段,或其活性衍生物,其同人、小鼠、大鼠的氨基酸序列同源性为94.99%。
3、根据权利要求1所述的猪核受体辅激活因子1基因的蛋白编码序列,其特征是,所述的猪NCOA-1基因蛋白编码序列,指与SEQ ID NO.1的氨基酸序列相比,有5-10个氨基酸被性质相似或相近的氨基酸所替换而形成多肽。
4、根据权利要求1或者2或者3所述的猪核受体辅激活因子1基因的蛋白编码序列,其特征是,所述的SEQ ID NO.1,在其中,电子克隆产物长度分别为144bp和747bp,其中1-3位为起始密码子ATG,4321-4323位为终止密码子TAA,1-4323位为编码蛋白质区域(CDS),6个RT-PCR扩增产物克隆测序并验证了电子克隆得到的部分序列,从而获得基因全长。
5、根据权利要求1或者2或者3所述的猪核受体辅激活因子1基因的蛋白编码序列,其特征是,所述的SEQ ID NO.1,在其中,猪NCOA-1基因编码1440个氨基酸。
CN 200510026382 2005-06-02 2005-06-02 猪核受体辅激活因子1基因的蛋白编码序列 Pending CN1699567A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 200510026382 CN1699567A (zh) 2005-06-02 2005-06-02 猪核受体辅激活因子1基因的蛋白编码序列

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 200510026382 CN1699567A (zh) 2005-06-02 2005-06-02 猪核受体辅激活因子1基因的蛋白编码序列

Publications (1)

Publication Number Publication Date
CN1699567A true CN1699567A (zh) 2005-11-23

Family

ID=35475814

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 200510026382 Pending CN1699567A (zh) 2005-06-02 2005-06-02 猪核受体辅激活因子1基因的蛋白编码序列

Country Status (1)

Country Link
CN (1) CN1699567A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101824417A (zh) * 2010-05-12 2010-09-08 湖南农业大学 猪繁殖性状相关基因ncoa1及其在猪标记辅助选择中的应用

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101824417A (zh) * 2010-05-12 2010-09-08 湖南农业大学 猪繁殖性状相关基因ncoa1及其在猪标记辅助选择中的应用

Similar Documents

Publication Publication Date Title
CN1624135A (zh) 编码植物脱氧海普赖氨酸合成酶的dna,植物真核起始因子5a,转基因植物和控制植物衰老和程序性细胞死亡的方法
CN1258593C (zh) 腐胺-n-甲基转移酶启动子
CN1289523C (zh) 水稻钾、钠离子转运基因及其应用
CN1778930A (zh) 激发机体抗鸡球虫感染的融合基因及其编码蛋白与应用
CN1699567A (zh) 猪核受体辅激活因子1基因的蛋白编码序列
CN101033472A (zh) 产生聚谷氨酸的转基因植物
CN100344759C (zh) 小麦脱水应答转录因子DREB基因cDNA序列
CN1566146A (zh) 水稻茎杆伸长基因及其编码蛋白和用途
CN1303102C (zh) 利用人和鼠Rhor基因及其编码产物诊断和治疗秃发的方法
CN1769436A (zh) 南京椴3-羟基-3-甲基戊二酰辅酶a还原酶蛋白编码序列
CN1216989C (zh) 一种新的青霉素g酰化酶及其应用
CN1757735A (zh) 编码甘薯八氢番茄红素脱氢酶的cDNA序列
CN1891718A (zh) 融合免疫毒素ml-l-sec2和基因及其制备
CN1760363A (zh) 杜仲3-羟基-3-甲基戊二酰辅酶a还原酶蛋白编码序列
CN1252270C (zh) 红豆杉3-羟基-3-甲基戊二酰辅酶a合成酶蛋白编码序列
CN1546666A (zh) 一种水稻抗白叶枯抗性相关基因、蛋白及其用途
CN1227262C (zh) 一种与植物细胞周期相关的蛋白质和其编码基因
CN1160472C (zh) 人类17号染色体1区3带3亚带区域内人肿瘤相关基因及检测试剂盒
CN1495195A (zh) 表达雄激素受体复合物相关蛋白的转基因动物
CN1594569A (zh) 甘蓝型油菜细胞分裂原激活的蛋白激酶9蛋白编码序列
CN1888067A (zh) 乐昌含笑3-羟基-3-甲基戊二酰辅酶a还原酶蛋白编码序列
CN1824677A (zh) 人白细胞介素23特异性受体的剪接异构体及其编码基因与应用
CN1584032A (zh) 甘蓝型油菜细胞分裂原激活的蛋白激酶3蛋白编码序列
CN1537942A (zh) 猪骨形成蛋白15基因多态性的pcr-rflp检测方法
CN1563385A (zh) 大白菜抗厌氧烯醇酶蛋白编码序列

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication