CN101184772A - 人类原癌基因及其编码的蛋白质 - Google Patents

人类原癌基因及其编码的蛋白质 Download PDF

Info

Publication number
CN101184772A
CN101184772A CNA2006800185529A CN200680018552A CN101184772A CN 101184772 A CN101184772 A CN 101184772A CN A2006800185529 A CNA2006800185529 A CN A2006800185529A CN 200680018552 A CN200680018552 A CN 200680018552A CN 101184772 A CN101184772 A CN 101184772A
Authority
CN
China
Prior art keywords
leu
glu
ser
ala
seq
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2006800185529A
Other languages
English (en)
Inventor
金弦起
金振宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Publication of CN101184772A publication Critical patent/CN101184772A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/82Translation products from oncogenes
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Zoology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Medicinal Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Toxicology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Oncology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Peptides Or Proteins (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Abstract

本发明披露了一种新的原癌基因和该原癌基因编码的蛋白质。本发明的原癌基因可有效地用于诊断包括乳腺癌、白血病、子宫癌、恶性淋巴瘤等的多种癌症。

Description

人类原癌基因及其编码的蛋白质
技术领域
本发明涉及一种表现出诱导癌发生和癌转移能力的新的原癌基因及其编码的蛋白质。
背景技术
通常,已知高等动物,包括人,具有大约30,000个基因,但每个个体中只能表达大约15%的基因。因此,发现根据被选择和表达的基因决定所有生命现象,即发育、分化、稳态、对刺激的反应、细胞周期控制、老化和细胞凋亡(程序性细胞死亡)等(Liang,P.和A.B.Pardee,Science 257:967-971,1992)。
病理现象如肿瘤发生由遗传变异引起,其导致基因表达的改变。因此,不同细胞间基因表达的比较被认为是理解多种生物学机制的基础和根本方法。
例如,由Liang和Pardee提出的mRNA差异显示方法(Liang,P和A.B.Pardee,参见上述参考文献)已经有效用于寻找肿瘤抑制基因、与细胞周期调控有关的基因和与细胞凋亡有关的转录调节基因等,并还广泛用于确定在单个细胞出现的多种基因之间的关系。
将肿瘤发生的多种起因综合起来,有报道称例如特定染色体杂合性的丢失、原癌基因的激活和包括p53基因的其它肿瘤抑制基因的失活的多种遗传改变在肿瘤组织内积累,导致人类肿瘤的形成(Bishop,J.M.,Cell 64:235-248,1991;Hunter,T.,Cell 64:249-270,1991)。同样,有报道称10~30%的癌症是由原癌基因通过原癌基因的扩增而激活从而诱导的。
原癌基因的激活在多种癌症的病因学研究中起着重要的作用,因此,人们已经进行了尝试以确定该作用。
因此,本发明人发现在原癌基因水平研究产生乳腺癌的机制,因此称为人类增殖诱导基因(PIG)(proliferation inducing gene)的原癌基因,只在癌细胞中表现出特定升高的表达水平。该原癌基因可以有效地用于诊断、预防和治疗如乳腺癌、白血病、子宫癌、恶性淋巴瘤等的多种癌症。
发明内容
因此,设计本发明以解决现有技术的问题,因此本发明的目的是提供一种原癌基因或其片段。
本发明的另一目的是提供一种包含上述原癌基因或其片段的重组载体;和用该重组载体转化的微生物。
本发明的又一目的是提供由上述原癌基因编码的蛋白质;或其片段。
本发明的又一目的是提供一种用于诊断癌症,包括所述原癌基因或其片段的试剂盒。
本发明的再一目的是提供一种用于诊断癌症,包括所述蛋白质或其片段的试剂盒。
为了完成上述目的之一,本发明提供了具有DNA序列的原癌基因及其片段,该DNA序列选自由SEQ ID NO:1;SEQ ID NO:5;SEQ ID NO:9;SEQID NO:13;SEQ ID NO:17;SEQ ID NO:21;SEQ ID NO:25;SEQ ID NO:29;SEQ ID NO:33;SEQ ID NO:37;SEQ ID NO:41;SEQ ID NO:45;SEQ ID NO:49;SEQ ID NO:53;SEQ ID NO:57;SEQ ID NO:61;SEQ ID NO:65;SEQID NO:69;SEQ ID NO:73;SEQ ID NO:77和SEQ ID NO:81组成的组。
根据上述另一目的,本发明提供一种包含上述原癌基因或其片段的重组载体;和用该重组载体转化的微生物。
根据上述又一目的,本发明提供含有氨基酸序列的蛋白质及其片段,该氨基酸序列选自由SEQ ID NO:2;SEQ ID NO:6;SEQ ID NO:10;SEQ ID NO:14;SEQ ID NO:18;SEQ ID NO:22;SEQ ID NO:26;SEQ ID NO:30;SEQID NO:34;SEQ ID NO:38;SEQ ID NO:42;SEQ ID NO:46;SEQ ID NO:50;SEQ ID NO:54;SEQ ID NO:58;SEQ ID NO:62;SEQ ID NO:66;SEQ ID NO:70;SEQ ID NO:74;SEQ ID NO:78和SEQ ID NO:82组成的组,该蛋白质及其片段分别由上述原癌基因编码。
根据上述又一目的,本发明提供一种包括上述原癌基因或其片段的用于诊断癌症的试剂盒。
根据上述再一目的,本发明提供一种包括上述原癌蛋白或其片段的用于诊断癌症的试剂盒。
下文,参照附图将详细描述本发明的优选实施方式。
1.PIG12
本发明的原癌基因,人类增殖诱导基因12(PIG 12)(下文,称为PIG 12原癌基因)具有SEQ ID NO:1示出的1,258-bp的全长DNA序列。
在SEQ ID NO:1的DNA序列中,对应于68-1,252核苷酸序列位置的可读框(1,250-1,252:终止密码子)是全长蛋白质编码区,来自该蛋白质编码区的氨基酸序列示于SEQ ID NO:2且包含394个氨基酸(“PIG12蛋白质”)。
由本发明的原癌基因表达的蛋白质含有394个氨基酸,且具有示于SEQID NO:2的氨基酸序列,且分子量大约为46KDa。
2.PIG18
本发明的原癌基因,人类增殖诱导基因18(PIG 18)(下文,称为PIG 18原癌基因)具有SEQ ID NO:5示出的1,024-bp的全长DNA序列。
在SEQ ID NO:5的DNA序列中,对应于875-1,063核苷酸序列位置的可读框(1,061-1,063:终止密码子)是全长蛋白质编码区,且来自该蛋白质编码区的氨基酸序列示于SEQ ID NO:6且包含62个氨基酸(下文称为“PIG18A蛋白质”)。
SEQ ID NO:5的DNA序列已经由美国国立卫生研究院(NIH)的基因库数据库保存,收录号为AY771596(预定发布日期:2005年12月31日),且该DNA碱基序列结果显示其DNA序列和保存在数据库内的收录号为NM_001992的人类凝血因子II(凝血酶)受体(F2R)基因的相似。但是,由此研究结果发现PIG18原癌基因在包括子宫癌的多种人类肿瘤中高表达,而在多种正常组织中其表达明显降低。
由本发明的原癌基因表达的蛋白质含有62个氨基酸,且具有示于SEQ IDNO:6的氨基酸序列,且分子量大约为7KDa。
3.PIG23
本发明的原癌基因,人类增殖诱导基因23(PIG23)(下文,称为PIG 23原癌基因)具有SEQ ID NO:9示出的2,150-bp的全长DNA序列。
在SEQ ID NO:9的DNA序列中,对应于25-1,953核苷酸序列位置的可读框(1,951-1,953:终止密码子)是全长蛋白质编码区,且来自该蛋白质编码区的氨基酸序列示于SEQ ID NO:10且包含642个氨基酸(下文称为“PIG23蛋白质”)。
SEQ ID NO:9的DNA序列已经由美国国立卫生研究院(NIH)的基因库数据库保存,收录号为AY826819(预定发布日期:2005年12月31日),且该DNA碱基序列结果显示其DNA序列和保存在数据库内的收录号为NM_016166的人类活化的STAT的抑制蛋白(PIAS1)基因的相似。但是,由此研究结果发现PIG23原癌基因在包括子宫癌的多种人类肿瘤中高表达,而在多种正常组织中其表达明显降低。
由本发明的原癌基因表达的蛋白质含有642个氨基酸,且具有示于SEQID NO:10的氨基酸序列,且分子量大约为70KDa。
4.PIG27
本发明的原癌基因,人类增殖诱导基因27(PIG27)(下文,称为PIG 27原癌基因)具有SEQ ID NO:13示出的446-bp的全长DNA序列。
在SEQ ID NO:13的DNA序列中,对应于20-337核苷酸序列位置的可读框(335-337:终止密码子)是全长蛋白质编码区,且来自该蛋白质编码区的氨基酸序列示于SEQ ID NO:14且包含105个氨基酸(下文称为“PIG27蛋白质”)。
SEQ ID NO:13的DNA序列已经由美国国立卫生研究院(NIH)的基因库数据库保存,收录号为AY453399(预定发布日期:2005年12月31日),且该DNA碱基序列结果显示其DNA序列和保存在数据库内的收录号为CR456487的人类DNAL4全长可读框(ORF)cDNA克隆基因等的相似。这些基因的功能还是未知的。但是,由此研究结果发现PIG27原癌基因在包括子宫癌的多种人类肿瘤中高表达,而在多种正常组织中其表达明显降低。
由本发明的原癌基因表达的蛋白质含有105个氨基酸,且具有示于SEQID NO:14的氨基酸序列,且分子量大约为12KDa。
5.PIG28
本发明的原癌基因,人类增殖诱导基因28(PIG28)(下文,称为PIG 28原癌基因)具有SEQ ID NO:17示出的1,024-bp的全长DNA序列。
在SEQ ID NO:17的DNA序列中,对应于33-998核苷酸序列位置的可读框(996-998:终止密码子)是全长蛋白质编码区,且来自该蛋白质编码区的氨基酸序列示于SEQ ID NO:18且包含321个氨基酸(下文称为“PIG28蛋白质”)。
SEQ ID NO:17的DNA序列已经由美国国立卫生研究院(NIH)的基因库数据库保存,收录号为AY453398(预定发布日期:2005年3月31日),且该DNA碱基序列结果显示其DNA序列和保存在数据库内的收录号分别为NM_001153和BC000182的人类膜联蛋白A4(ANXA4)基因和人类膜联蛋白A4基因的相似。但是,由此研究结果发现PIG28原癌基因在包括子宫癌的多种人类肿瘤中高表达,而在多种正常组织中其表达明显降低。
由本发明的原癌基因表达的蛋白质含有321个氨基酸,且具有示于SEQID NO:18的氨基酸序列,且分子量大约为36KDa。
6.PIG30
本发明的原癌基因,人类增殖诱导基因30(PIG30)(下文,称为PIG 30原癌基因)具有SEQ ID NO:21示出的2,152-bp的全长DNA序列。
在SEQ ID NO:21的DNA序列中,对应于6-2,150核苷酸序列位置的可读框(2,148-2,150:终止密码子)是全长蛋白质编码区,且来自该蛋白质编码区的氨基酸序列示于SEQ ID NO:22且包含714个氨基酸(PIG30蛋白质)。
由本发明的原癌基因表达的蛋白质含有714个氨基酸,且具有示于SEQID NO:22的氨基酸序列,且分子量大约为82KDa。
7.PIG31
本发明的原癌基因,人类增殖诱导基因31(PIG31)(下文,称为PIG 31原癌基因)具有SEQ ID NO:25示出的2,246-bp的全长DNA序列。
在SEQ ID NO:25的DNA序列中,对应于37-2,232核苷酸序列位置的可读框(2,230-2,232:终止密码子)是全长蛋白质编码区,且来自该蛋白质编码区的氨基酸序列示于SEQ ID NO:26且包含731个氨基酸(PIG31蛋白质)。
由本发明的原癌基因表达的蛋白质含有731个氨基酸,且具有示于SEQID NO:26的氨基酸序列,且分子量大约为83KDa。
8.PIG38
本发明的原癌基因,人类增殖诱导基因38(PIG38)(下文,称为PIG 38原癌基因)具有SEQ ID NO:29示出的1,973-bp的全长DNA序列。
在SEQ ID NO:29的DNA序列中,对应于25-1,956核苷酸序列位置的可读框(1,954-1,956:终止密码子)是全长蛋白质编码区,且来自该蛋白质编码区的氨基酸序列示于SEQ ID NO:30且包含643个氨基酸(PIG38蛋白质)。
由本发明的原癌基因表达的蛋白质含有643个氨基酸,且具有示于SEQID NO:30的氨基酸序列,且分子量大约为73KDa。
9.PIG40
本发明的原癌基因,人类增殖诱导基因40(PIG40)(下文,称为PIG 40原癌基因)具有SEQ ID NO:33示出的1,586-bp的全长DNA序列。
在SEQ ID NO:33的DNA序列中,对应于36-1,541核苷酸序列位置的可读框(1,539-1,541:终止密码子)是全长蛋白质编码区,且来自该蛋白质编码区的氨基酸序列示于SEQ ID NO:34且包含501个氨基酸(下文称为“PIG40蛋白质”)。
SEQ ID NO:33的DNA序列已经由美国国立卫生研究院(NIH)的基因库数据库保存,收录号为AY762100(预定发布日期:2005年12月31日),且该DNA碱基序列结果显示其DNA序列和保存在数据库内的收录号为NM_001349的天冬氨酰-tRNA合成酶(DARS)基因等的相似。但是,由此研究结果发现PIG40原癌基因在包括白血病的多种人类肿瘤中高表达,而在多种正常组织中其表达明显降低。
由本发明的原癌基因表达的蛋白质含有501个氨基酸,且具有示于SEQID NO:34的氨基酸序列,且分子量大约为57KDa。
10.PIG43
本发明的原癌基因,人类增殖诱导基因43(PIG43)(下文,称为PIG 43原癌基因)具有SEQ ID NO:37示出的1,245-bp的全长DNA序列。
在SEQ ID NO:37的DNA序列中,对应于57-758核苷酸序列位置的可读框(756-758:终止密码子)是全长蛋白质编码区,且来自该蛋白质编码区的氨基酸序列示于SEQ ID NO:38且包含233个氨基酸(下文称为“PIG43蛋白质”)。
由本发明的原癌基因表达的蛋白质含有233个氨基酸,且具有示于SEQID NO:38的氨基酸序列,且分子量大约为26KDa。但是,在不影响蛋白质功能的范围内,可以取代、添加或去除所述蛋白质的氨基酸序列中的一个或多个氨基酸,并且根据其用途可以只使用一些蛋白质。这样修饰的氨基酸序列同样包括在本发明的范围内。因此,本发明也包括具有与致癌蛋白基本相同的氨基酸序列的多肽;及其片段。术语“基本相同的多肽”是指具有至少80%,优选至少90%,且最优选至少95%的序列同源性的多肽。
11.PIG44
本发明的原癌基因,人类增殖诱导基因44(PIG44)(下文,称为PIG 44原癌基因)具有SEQ ID NO:41示出的1,721-bp的全长DNA序列。
在SEQ ID NO:41的DNA序列中,对应于55-1,512核苷酸序列位置的可读框(1,510-1,512:终止密码子)是全长蛋白质编码区,且来自该蛋白质编码区的氨基酸序列示于SEQ ID NO:42且包含485个氨基酸(PIG44蛋白质)。
由本发明的原癌基因表达的蛋白质含有485个氨基酸,且具有示于SEQID NO:42的氨基酸序列,且分子量大约为55KDa。
12.PIG46
本发明的原癌基因,人类增殖诱导基因46(PIG46)(下文,称为PIG 46原癌基因)具有SEQ ID NO:45示出的1,312-bp的全长DNA序列。
在SEQ ID NO:45的DNA序列中,对应于5-1,297核苷酸序列位置的可读框(1,295-1,297:终止密码子)是全长蛋白质编码区,且来自该蛋白质编码区的氨基酸序列示于SEQ ID NO:46且包含430个氨基酸(PIG46蛋白质)。
由本发明的原癌基因表达的蛋白质含有430个氨基酸,且具有示于SEQID NO:46的氨基酸序列,且分子量大约为48KDa。
13.PIG47
本发明的原癌基因,人类增殖诱导基因47(PIG47)(下文,称为PIG 47原癌基因)具有SEQ ID NO:49示出的827-bp的全长DNA序列。
在SEQ ID NO:49的DNA序列中,对应于56-826核苷酸序列位置的可读框(824-826:终止密码子)是全长蛋白质编码区,且来自该蛋白质编码区的氨基酸序列示于SEQ ID NO:50且包含256个氨基酸(PIG47蛋白质)。
由本发明的原癌基因表达的蛋白质含有256个氨基酸,且具有示于SEQID NO:50的氨基酸序列,且分子量大约为29KDa。
14.PIG48
本发明的原癌基因,人类增殖诱导基因48(PIG48)(下文,称为PIG 48原癌基因)具有SEQ ID NO:53示出的1,707-bp的全长DNA序列。
在SEQ ID NO:53的DNA序列中,对应于57-1,694核苷酸序列位置的可读框(1,692-1,694:终止密码子)是全长蛋白质编码区,且来自该蛋白质编码区的氨基酸序列示于SEQ ID NO:54且包含545个氨基酸(PIG48蛋白质)。
由本发明的原癌基因表达的蛋白质含有545个氨基酸,且具有示于SEQID NO:54的氨基酸序列,且分子量大约为60KDa。
15.PIG50
本发明的原癌基因,人类增殖诱导基因50(PIG50)(下文,称为PIG 50原癌基因)具有SEQ ID NO:57示出的643-bp的全长DNA序列。
在SEQ ID NO:57的DNA序列中,对应于2-595核苷酸序列位置的可读框(593-595:终止密码子)是全长蛋白质编码区,且来自该蛋白质编码区的氨基酸序列示于SEQ ID NO:58且包含197个氨基酸(PIG50蛋白质)。
由本发明的原癌基因表达的蛋白质含有197个氨基酸,且具有示于SEQID NO:58的氨基酸序列,且分子量大约为22KDa。
16.PIG54
本发明的原癌基因,人类增殖诱导基因54(PIG54)(下文,称为PIG 54原癌基因)具有SEQ ID NO:61示出的1,936-bp的全长DNA序列。
在SEQ ID NO:61的DNA序列中,对应于38-1,840核苷酸序列位置的可读框(1,838-1,840:终止密码子)是全长蛋白质编码区,且来自该蛋白质编码区的氨基酸序列示于SEQ ID NO:62且包含600个氨基酸(PIG54蛋白质)。
由本发明的原癌基因表达的蛋白质含有600个氨基酸,且具有示于SEQID NO:62的氨基酸序列,且分子量大约为69KDa。
17.PIG55
本发明的原癌基因,人类增殖诱导基因55(PIG55)(下文,称为PIG 55原癌基因)具有SEQ ID NO:65示出的526-bp的全长DNA序列。
在SEQ ID NO:65的DNA序列中,对应于15-485核苷酸序列位置的可读框(483-485:终止密码子)是全长蛋白质编码区,且来自该蛋白质编码区的氨基酸序列示于SEQ ID NO:66且包含156个氨基酸(PIG55蛋白质)。
由本发明的原癌基因表达的蛋白质含有156个氨基酸,且具有示于SEQID NO:66的氨基酸序列,且分子量大约为18KDa。
18.GIG9
本发明的原癌基因,人类原癌基因GIG9具有SEQ ID NO:69示出的1,008-bp的全长DNA序列。
在SEQ ID NO:69的DNA序列中,对应于1-1,008核苷酸序列位置的可读框(1006-1008:终止密码子)是全长蛋白质编码区,且来自该蛋白质编码区的氨基酸序列示于SEQ ID NO:70且包含335个氨基酸(下文称为“GIG9蛋白质”)。
SEQ ID NO:69的DNA序列已经由美国国立卫生研究院(NIH)的基因库数据库保存,收录号为AY453396(预定发布日期:2005年3月31日),且该DNA碱基序列结果显示其DNA序列和保存在数据库内的收录号为NM_016930的人类突触融合蛋白(STX18)基因的相似。但是,由此研究结果发现GIG9原癌基因在包括子宫癌的多种人类肿瘤中高表达,而在多种正常组织中其表达明显降低。
由本发明的原癌基因表达的蛋白质含有335个氨基酸,且具有示于SEQID NO:70的氨基酸序列,且分子量大约为38KDa。
19.HLC-9
本发明的原癌基因,人肺癌相关基因9(下文,称为HLC9原癌基因)具有SEQ ID NO:73示出的1,382-bp的全长DNA序列。
在SEQ ID NO:73的DNA序列中,对应于27-1,370核苷酸序列位置的可读框(1,368-1,370:终止密码子)是全长蛋白质编码区,且来自该蛋白质编码区的氨基酸序列示于SEQ ID NO:74且包含447个氨基酸(下文称为“HLC9蛋白质”)。
SEQ ID NO:73的DNA序列已经由美国国立卫生研究院(NIH)的基因库数据库保存,收录号为AY189686(预定发布日期:2004年5月1日),且该DNA碱基序列结果显示其DNA序列和保存在数据库内的收录号为NM_002717的人类蛋白质磷酸酶2(以前为2A)调节亚基B(PR 52)α亚型(PPP2R2A)(proteinphosphotase 2(formerly 2A),regulatory subunit B(PR52),α-isoform(PPP2R2A))基因的相似。但是,由此研究结果发现HLC9原癌基因在包括肺癌的多种人类肿瘤中高表达,而在多种正常组织中其表达明显降低。
由本发明的原癌基因HLC9表达的蛋白质含有447个氨基酸,且具有示于SEQ ID NO:74的氨基酸序列,且分子量大约为51KDa。
20.GIG18
本发明的原癌基因,GIG18基因(下文,称为GIG18原癌基因)具有SEQ IDNO:77示出的1,301-bp的全长DNA序列。
在SEQ ID NO:77的DNA序列中,对应于3-1,244核苷酸序列位置的可读框(1,242-1,244:终止密码子)是全长蛋白质编码区,且来自该蛋白质编码区的氨基酸序列示于SEQ ID NO:78且包含413个氨基酸(GIG18蛋白质)。
由本发明的原癌基因表达的蛋白质含有413个氨基酸,且具有示于SEQID NO:78的氨基酸序列,且分子量大约为46KDa。
21.MIG22
本发明的原癌基因,人类转移诱导基因(migration-inducinggene)14(MIG22)(下文,称为MIG22原癌基因)具有SEQ ID NO:81示出的749-bp的全长DNA序列。
在SEQ ID NO:81的DNA序列中,对应于15-734核苷酸序列位置的可读框(732-734:终止密码子)是全长蛋白质编码区,且来自该蛋白质编码区的氨基酸序列示于SEQ ID NO:82且包含239个氨基酸(下文称为“MIG22蛋白质”)。
SEQ ID NO:81的DNA序列已经由美国国立卫生研究院(NIH)的基因库数据库保存,收录号为AY771595(预定发布日期:2005年12月31日),且该DNA碱基序列结果显示其DNA序列和保存在数据库内的收录号分别为D45248和BC072025的基因的相似。与以前报道的RAE1基因的功能相反,但是,由此研究结果发现MIG22原癌基因在包括肺癌的多种人类肿瘤中高表达,而在多种正常组织中其表达明显降低。
由本发明的原癌基因表达的蛋白质含有239个氨基酸,且具有示于SEQID NO:82的氨基酸序列,且分子量大约为27KDa。
同时,由于密码子的简并性,或考虑到生物表达原癌基因的密码子偏爱性,可以对本发明的原癌基因在编码区进行多种修饰而不改变由该编码区表达的致癌蛋白的氨基酸序列,也可以对除编码区外的区域在不影响基因表达的范围内进行多种修饰或变化。这样修饰的基因同样包括在本发明的范围内。因此,本发明也包括具有与上述原癌基因基本相同的DNA序列的多核苷酸;及其片段。术语“基本相同的多核苷酸”是指具有至少80%、优选至少90%且最优选至少95%的序列同源性的DNA序列。
同样,在不影响蛋白质功能的范围内,甚至可以在本发明的蛋白质的氨基酸序列内取代、添加或缺失一个或多个氨基酸,并且根据其用途可以只使用一些蛋白质。这样修饰的氨基酸序列同样包括在本发明的范围内。因此,本发明也包括具有与致癌蛋白基本相同的氨基酸序列的多肽;及其片段。术语“基本相同的多肽”是指具有至少80%、优选至少90%且最优选至少95%的序列同源性的多肽。
本发明的原癌基因和蛋白质可以从人类癌症组织中分离,或者通过已知的合成DNA或肽的方法合成。同样,可以将如此制备的基因插入到本领域中已知的用于在微生物内表达的载体中,以获得表达载体,接着将表达载体导入合适的宿主细胞,例如大肠杆菌(Escherichia coli)、酵母细胞等。本发明基因的DNA可以大量复制或者其蛋白可以在这样的转化宿主内以商品化数量产生。例如,通过将PIG全长cDNA插入到表达载体pBAD/Thio-Topo(Invitrogen,美国),接着用得到的表达载体转化大肠杆菌DH5α而在本发明中可以得到转化体。
在构建表达载体时,根据产生原癌基因或蛋白质的宿主细胞的种类可以适当选择和组合表达调控序列,如启动子和终止子、自主复制序列、分泌信号等。
由于在如RNA印迹法等的分析方法中显示本发明的基因在正常乳腺组织中几乎不表达,但其在乳腺癌组织和乳腺癌细胞系中过表达,因此本发明的基因被证明是能诱发乳腺癌的强癌基因。除了如乳腺癌的上皮组织,本发明的原癌基因在其他癌性肿瘤如乳腺癌、白血病、子宫癌、恶性淋巴瘤等中高表达。因此,本发明的原癌基因被认为是在多种肿瘤发生中的共同的癌基因,其可以有效地用于多种癌症的诊断,产生转化动物及用于反义基因治疗等。
例如,使用原癌基因诊断癌症的方法包括步骤:在使用全部或部分原癌基因作为探针与由个体体液中提取的核酸杂交后,通过使用多种本领域已知的方法检测原癌基因,以此来检测个体中是否具有本发明的原癌基因。使用放射性同位素、酶等标记的探针可以容易地确定组织样本中所述基因的存在。因此,本发明提供包括全部或一些所述原癌基因的用于诊断癌症的试剂盒。
可以通过将本发明的原癌基因导入例如如鼠的啮齿类动物的哺乳动物来获得转化的动物,优选在至少8-细胞阶段之前的受精卵阶段导入该原癌基因。这样培育的转化动物可以有效地用于寻找致癌物质或如抗氧化剂的抗癌物质。
来自本发明的原癌基因的蛋白质可以有效地作为诊断工具以产生抗体。使用本发明的原癌基因表达的蛋白质或其片段,根据本领域已知的常规方法可以制备为单克隆或多克隆抗体的本发明的抗体,其中所述的蛋白质具有选自由SEQ ID NO:2;SEQ ID NO:6;SEQ ID NO:10;SEQ ID NO:14;SEQ IDNO:18;SEQ ID NO:22;SEQ ID NO:26;SEQ ID NO:30;SEQ ID NO:34;SEQID NO:38;SEQ ID NO:42;SEQ ID NO:46;SEQ ID NO:50;SEQ ID NO:54;SEQ ID NO:58;SEQ ID NO:62;SEQ ID NO:66;SEQ ID NO:70;SEQ ID NO:74;SEQ ID NO:78和SEQ ID NO:82组成的组的氨基酸序列。因此,通过使用本领域中已知的方法,例如酶联免疫吸附测定(ELISA)、放射免疫测定(RIA)、夹心法测定、聚丙烯酰胺凝胶上的蛋白质印迹法或免疫印迹法等,来确定受试者体液样品中是否表达该蛋白质,由此那些抗体可以用于诊断癌症。
同样,本发明的原癌基因可以用于建立不受控制生长的癌细胞系,例如该细胞系可以使用用原癌基因转染的成纤维细胞而由在裸鼠背上生长产生的肿瘤组织来产生。该癌细胞系可以有效用于寻找抗癌剂等。
以下,将参考优选实施例对本发明进行详细描述,但这里提出的描述仅是为了对优选实施例进行举例说明,无意对发明的范围进行限制。
附图说明
参照附图,在下面的详细描述中,将更全面地描述本发明的优选实施方式的这些和其它特征、技术方案和优点。在图中:
图1~21为示出差异显示反转录聚合酶链式反应(DDRT-PCR)结果的图,用以确定FC21(图1)、FC23(图6)、FC34(图7)、FC24(图12)、FC54(图13)、FC71(图14)、BBCC5-5(图15)和FC4(图17)是否分别在正常乳腺组织、乳腺癌瘤组织和MCF-7癌细胞中表达;MC113DNA片段(图2)、CA338d DNA片段(图3)、H124DNA片段(图4)、H122DNA片段(图5)和H148DNA片段(图18)是否分别在正常外宫颈(exocervical)组织、子宫颈癌组织、淋巴结转移性癌组织(metastatic lymph node tumor tissue)和CUMC-6癌细胞中表达;HP103(图8)、HP11(图10)、HP23(图11)、HP15(图16)和HP47(图20)是否分别在正常肝组织、肝癌组织和HepG2肝癌细胞中表达;GV11DNA片段(图9)是否在正常外周血白细胞组织、白血病组织和K562白血病细胞系中表达;以及L738(图19)和L690(图21)是否分别在正常肺组织、左肺癌组织、从左肺转移到右肺的转移性肺癌组织和A549肺癌细胞中表达。
图22~42为示出用以确定PIG12(图22)、PIG30(图27)、PIG31(图28)、PIG46(图33)、PIG47(图34)、PIG48(图35)、PIG50(图36)和PIG55(图38)原癌基因是否分别在乳腺癌组织表达;PIG18(图23)、PIG23(图24)、PIG27(图25)、PIG28(图26)和GIG9(图39)原癌基因是否分别在正常外宫颈组织、子宫癌组织、宫颈部淋巴结转移性癌组织(metastatic cervical lymph nodetumor tissue)和子宫颈癌细胞系表达;PIG38(图29)、PIG43(图31)、PIG44(图32)、PIG54(图37)、GIG18(图41)原癌基因是否在正常人肝、肝癌和肝癌细胞系表达;PIG40(图30)原癌基因是否在正常外周血白细胞组织、白血病组织和K562白血病细胞系表达;以及HLC9(图40)和MIG22(图42)原癌基因是否分别在正常肺组织、左肺癌组织、从左肺转移到右肺的转移性肺癌组织和A549、NCI-H2009和NCI-H441肺癌细胞系表达的RNA印迹结果的图;并且图22~42下部为分别示出使与图22~42上部相同的样品和β-肌动蛋白探针杂交得到的RNA印迹结果的图。
图43~63为示出用以确定PIG12(图43)、PIG18(图44)、PIG23(图45)、PIG27(图46)、PIG28(图47)、PIG30(图48)、PIG31(图49)、PIG38(图50)、PIG40(图51)、PIG43(图52)、PIG44(图53)、PIG46(图54)、PIG47(图55)、PIG48(图56)、PIG50(图57)、PIG54(图58)、PIG55(图59)、GIG9(图60)、HLC-9(图61)、GIG18(图62)和MIG22(图63)原癌基因是否分别在12泳道的正常人多种组织中表达的RNA印迹结果的图;并且图43~63的下部为分别示出使与图43~63上部相同的样品和β-肌动蛋白探针杂交得到的RNA印迹结果的图。
图64~84为示出用以确定PIG12(图64)、PIG18(图65)、PIG23(图66)、PIG27(图67)、PIG28(图68)、PIG30(图69)、PIG31(图70)、PIG38(图71)、PIG40(图72)、PIG43(图73)、PIG44(图74)、PIG46(图75)、PIG47(图76)、PIG48(图77)、PIG50(图78)、PIG54(图79)、PIG55(图80)、GIG9(图81)、HLC-9(图82)、GIG18(图83)和MIG22(图84)原癌基因是否分别在人癌细胞系表达的RNA印迹结果的图;并且图64~84的下部为分别示出使与图64~84上部相同的样品和β-肌动蛋白探针杂交得到的RNA印迹结果的图。
图85~105为示出用以确定在本发明的原癌基因PIG12(图85)、PIG18(图86)、PIG23(图87)、PIG27(图88)、PIG28(图89)、PIG30(图90)、PIG31(图91)、PIG38(图92)、PIG40(图93)、PIG43(图94)、PIG44(图95)、PIG46(图96)、PIG47(图97)、PIG48(图98)、PIG50(图99)、PIG54(图100)、PIG55(图101)、GIG9(图102)、HLC-9(图103)、GIG18(图104)和MIG22(图105)分别转化到大肠杆菌后L-阿拉伯糖诱导前和诱导后表达的蛋白质大小的十二烷基硫酸钠-聚丙烯酰胺凝胶电泳(SDS-PAGE)结果的图。
具体实施方式
下文,参照附图将详细地描述本发明的优选实施方式。
实施例1:肿瘤细胞的培养和总RNA的分离
1-1.PIG12、PIG30、PIG31、PIG46、PIG47、PIG48、PIG50和PIG55
(步骤1)肿瘤细胞的培养
为了进行mRNA差异显示方法,从已经进行乳房切除术的乳腺癌患者得到正常乳腺组织样品,并且从外科手术时没有进行抗癌化学治疗和/或放射治疗的乳腺癌患者在乳房切除术期间得到原发性乳腺癌组织。MCF-7(美国典型培养物保藏中心(American Type Culture Collection);ATCC号HTB-22)用作差异显示方法中的人乳腺癌细胞系。在这个实验中使用的培养细胞处于指数生长期,且在此使用当台盼蓝染料染色(参见Freshney,″Culture of Animal Cells:AManual of Basic Technique″第2版,A.R.Liss,纽约,(1987))时显示至少95%存活率的细胞。
(步骤2)RNA的分离和mRNA差异显示法
使用可商购的系统RNeasy总RNA试剂盒(Qiagen公司,德国),从步骤1得到的各正常乳腺组织、原发性乳腺癌组织和MCF-7细胞分离总RNA样品。使用message clean试剂盒(GenHunter公司,Brookline,MA,美国)从RNA样品中除去DNA污染物。
1-2.PIG18、PIG23、PIG27、PIG28和GIG9
(步骤1)肿瘤细胞的培养
为了进行mRNA差异显示法,从已经进行子宫切除术的子宫肌瘤患者得到正常外宫颈组织,并且从外科手术以前未进行抗癌化学治疗和/或放射治疗的子宫癌患者得到原发性子宫颈癌组织和淋巴结转移性癌组织。CUMC-6(Kim,J.W.等人,Gynecol.Oncol.62:230-240,1996)用作差异显示法中的人子宫颈癌细胞系。
将从得到的组织中获得的细胞和CUMC-6细胞系在含有2mM谷氨酰胺、100IU/ml青霉素、100μg/ml链霉素和10%胎牛血清(Gibco,美国)的Waymouth′s MB 752/1培养基(Gibco)中生长。在这个实验中使用的培养细胞处于指数生长期,并且在此使用台盼蓝染色中显示至少95%存活率的细胞(Freshney,″Culture of Animal Cells:A Manual of Basic Technique″第2版,A.R.Liss,纽约,1987)。
(步骤2)RNA的分离和mRNA差异显示法
使用可商购的系统RNeasy总RNA试剂盒(Qiagen公司,德国),从步骤1得到的各正常外宫颈组织、原发性子宫颈癌组织、淋巴结转移性癌组织和CUMC-6细胞分离总RNA样品。使用message clean试剂盒(GenHunter公司,Brookline,MA,美国)从RNA样品中除去DNA污染物。
1-3.PIG38、PIG43、PIG44、PIG54和GIG18
(步骤1)肿瘤细胞的培养
为了进行mRNA差异显示法,从已经进行肝组织活检的患者得到正常肝组织,并且在肝组织活检期间从以前没有进行抗癌化学治疗和/或放射治疗的肝癌患者得到原发性肝癌组织。HepG2(美国典型培养物保藏中心)用作差异显示法中的人肝癌细胞系。在这个实验中使用的培养细胞处于指数生长期,且在此使用当台盼蓝染料染色时显示至少95%存活率的细胞(参见Freshney,″Culture of Animal Cells:A Manual of Basic Technique″第2版,A.R.Liss,纽约,(1987))。
(步骤2)RNA的分离和mRNA差异显示法
使用可商购的系统RNeasy总RNA试剂盒(Qiagen公司,德国),从步骤1得到的各正常肝组织、原发性肝癌组织和HepG2细胞分离总RNA样品。使用message clean试剂盒(GenHunter公司,Brookline,MA,美国)从RNA样品中除去DNA污染物。
1-4.PIG40
(步骤1)肿瘤细胞的培养
为了进行mRNA差异显示法,从正常人得到外周血白细胞组织,并且在骨髓组织活检期间从以前没有进行抗癌化学治疗和/或放射治疗的白血病患者得到原发性白血病骨髓组织(primary leukemic bone marrow tissue)。K-562(美国典型培养物保藏中心;ATCC号CCL-243)用作差异显示法中的人慢性髓性白血病细胞系。
将从得到的组织中获得的细胞和K-562细胞系在含有2mM谷氨酰胺、100IU/ml青霉素、100μg/ml链霉素和10%胎牛血清(Gibco,美国)的Waymouth′s MB 752/1培养基(Gibco)中生长。在这个实验中使用的培养细胞处于指数生长期,并且在此使用台盼蓝染色中显示至少95%存活率的细胞(Freshney,″Culture of Animal Cells:A Manual of Basic Technique″第2版,A.R.Liss,纽约,1987)。
(步骤2)RNA的分离和mRNA差异显示法
使用可商购的系统RNeasy总RNA试剂盒(Qiagen公司,德国),从步骤1得到的各正常人的外周血白细胞组织、原发性白血病骨髓组织和人慢性髓性白血病细胞系分离总RNA样品。使用message clean试剂盒(GenHunter公司,Brookline,MA,美国)从RNA样品中除去DNA污染物。
1-5.HLC-9和MIG22
(步骤1)肿瘤细胞的培养
为了进行mRNA差异显示法,从正常人得到正常肺组织,并且在外科手术期间从以前没有进行抗癌化学治疗和/或放射治疗的肺癌患者得到原发性白血病肺癌组织和转移到右肺的癌组织。A549(美国典型培养物保藏中心;ATCC号CCL-185)用作差异显示法中的人肺癌细胞系。
将从得到的组织中获得的细胞和A549肺癌细胞系在含有2mM谷氨酰胺、100IU/ml青霉素、100μg/ml链霉素和10%胎牛血清(Gibco,美国)的Waymouth′s MB 752/1培养基(Gibco)中生长。在这个实验中使用的培养细胞处于指数生长期,并且在此使用台盼蓝染料染色时显示至少95%存活率的细胞(参见Freshney,″Culture of Animal Cells:A Manual of Basic Technique″第2版,A.R.Liss,纽约,1987)。
(步骤2)RNA的分离和mRNA差异显示法
使用可商购的系统RNeasy总RNA试剂盒(Qiagen公司,德国),从步骤1得到的各正常肺组织、原发性肺癌组织、转移性肺癌组织和A549细胞分离总RNA样品。使用message clean试剂盒(GenHunter公司,Brookline,MA,美国)从RNA样品中除去DNA污染物。
实施例2:差异显示反转录聚合酶链式反应(DDRT-PCR)
使用由Liang,P.和A.B.Pardee提出的稍微修改的反转录聚合酶链式反应(RT-PCR)进行差异显示反转录。
2-1.PIG12
首先,使用SEQ ID NO:3的锚定引物H-T11A(5′-AAGCTTTTTTTTTTTC-3′,RNAimage试剂盒,Genhunter,Cor.,MA,美国)作为oligo-dT锚定引物将0.2μg实施例1的步骤1获得的总RNA进行反转录。
然后,使用相同的锚定引物和5′-13-mer随机引物(RNAimage引物1-5)H-AP 1~40中的引物H-AP21(SEQ ID NO:4)(5′-AAGCTTTCTCTGG-3′),在0.5mM[α-35S]dATP(1200Ci/mmole)存在下进行PCR反应。PCR反应在下述条件下进行:总40个扩增循环,每个循环由95℃下40秒的变性步骤、40℃下2分钟的退火步骤和72℃下40秒的延伸步骤组成,以及接着为72℃下5分钟的最后延伸步骤。
将PCR-扩增片段在6%聚丙烯酰胺测序凝胶中分离,且然后使用放射自显影法确定差异表达条带的位置。
从干凝胶中切下FC21 cDNA的262-碱基对(bp)条带(SEQ ID NO:1的913~1,174碱基位置)。将提取的凝胶加热15分钟以洗脱FC21 cDNA,然后除了在此不使用[α-35S]-标记的dATP(1200Ci/mmole)和20μM dNTP外,用如上所述相同的引物在相同的条件下重复PCR反应以重新扩增FC21 cDNA。
2-2.PIG18
除了在此使用具有SEQ ID NO:7示出的DNA序列的锚定引物H-T11C(5′-AAGCTTTTTTTTTTTC-3′,RNAimage试剂盒,Genhunter,Cor.,MA,美国)作为oligo-dT锚定引物,以及使用具有SEQ ID NO:8示出的DNA序列的引物H-AP11(5′-AAGCTTCGGGTAA-3′)外,以与实施例2-1相同的方式重复PCR反应。
从干凝胶中切下MC113 cDNA的277-碱基对(bp)条带(SEQ ID NO:5的2,023~2,299碱基位置)。将提取的凝胶加热15分钟以洗脱MC113 cDNA,然后除了在此不使用[α-35S]-标记的dATP(1200Ci/mmole)和20μM dNTP外,用如上所述相同的引物在相同的条件下重复PCR反应以重新扩增MC113cDNA。
2-3.PIG23
除了在此使用具有SEQ ID NO:11示出的DNA序列的锚定引物H-T11C(5′-AAGCTTTTTTTTTTTC-3′,RNAimage试剂盒,Genhunter,Cor.,MA,美国)作为oligo-dT锚定引物,以及使用具有SEQ ID NO:12示出的DNA序列的引物H-AP33(5′-AAGCTTGCTGCTC-3′)外,以与实施例2-1相同的方式重复PCR反应。
从干凝胶中切下CA338d cDNA的278-碱基对(bp)条带(SEQ ID NO:9的1,822~2,099碱基位置)。将提取的凝胶加热15分钟以洗脱CA338d cDNA,然后除了在此不使用[α-35S]-标记的dATP(1200Ci/mmole)和20μM dNTP外,用如上所述相同的引物在相同的条件下重复PCR反应以重新扩增CA338dcDNA。
2-4.PIG27
除了在此使用具有SEQ ID NO:15示出的DNA序列的锚定引物H-T11A(5′-AAGCTTTTTTTTTTTA-3′,RNAimage试剂盒,Genhunter,Cor.,MA,美国)作为oligo-dT锚定引物,以及使用具有SEQ ID NO:16示出的DNA序列的引物H-AP12(5′-AAGCTTGAGTGCT-3′)外,以与实施例2-1相同的方式重复PCR反应。
从干凝胶中切下H124 cDNA的177-碱基对(bp)条带(SEQ ID NO:13的243~419碱基位置)。将提取的凝胶加热15分钟以洗脱H124 cDNA,然后除了在此不使用[α-35S]-标记的dATP(1200Ci/mmole)和20μM dNTP外,用如上所述相同的引物在相同的条件下重复PCR反应以重新扩增H124 cDNA。
2-5.PIG28
除了在此使用具有SEQ ID NO:19示出的DNA序列的锚定引物H-T11C(5′-AAGCTTTTTTTTTTTC-3′,RNAimage试剂盒,Genhunter,Cor.,MA,美国)作为oligo-dT锚定引物,以及使用具有SEQ ID NO:20示出的DNA序列的引物H-AP12(5′-AAGCTTGAGTGCT-3′)外,以与实施例2-1相同的方式重复PCR反应。
从干凝胶中切下H122 cDNA的232-碱基对(bp)条带(SEQ ID NO:17的748~979碱基位置)。将提取的凝胶加热15分钟以洗脱H122 cDNA,然后除了在此不使用[α-35S]-标记的dATP(1200Ci/mmole)和20μM dNTP外,用如上所述相同的引物在相同的条件下重复PCR反应以重新扩增H122 cDNA。
2-6.PIG30
除了在此使用具有SEQ ID NO:23示出的DNA序列的锚定引物H-T11C(5′-AAGCTTTTTTTTTTTC-3′,RNAimage试剂盒,Genhunter,Cor.,MA,美国)作为oligo-dT锚定引物,以及使用具有SEQ ID NO:24示出的DNA序列的引物H-AP33(5′-AAGCTTGCTGCTC-3′)外,以与实施例2-1相同的方式重复PCR反应。
从干凝胶中切下FC23 cDNA的271-碱基对(bp)条带(SEQ ID NO:21的1,823~2,093碱基位置)。将提取的凝胶加热15分钟以洗脱FC23 cDNA,然后除了在此不使用[α-35S]-标记的dATP(1200Ci/mmole)和20μM dNTP外,用如上所述相同的引物在相同的条件下重复PCR反应以重新扩增FC23 cDNA。
2-7.PIG31
除了在此使用具有SEQ ID NO:27示出的DNA序列的锚定引物H-T11G(5′-AAGCTTTTTTTTTTTG-3′)作为oligo-dT锚定引物,以及使用具有SEQ IDNO:28示出的DNA序列的引物H-AP34(5′-AAGCTTCAGCAGC-3′)外,以与实施例2-1相同的方式重复PCR反应。
从干凝胶中切下FC34 cDNA的312-碱基对(bp)条带(SEQ ID NO:25的1,884~2,195碱基位置)。将提取的凝胶加热15分钟以洗脱FC34 cDNA,然后除了在此不使用[α-35S]-标记的dATP(1200Ci/mmole)和20μM dNTP外,用如上所述相同的引物在相同的条件下重复PCR反应以重新扩增FC34 cDNA。
2-8.PIG38
除了在此使用具有SEQ ID NO:31示出的DNA序列的锚定引物H-T11C(5′-AAGCTTTTTTTTTTTC-3′)作为oligo-dT锚定引物,以及使用具有SEQ IDNO:32示出的DNA序列的引物H-AP10(5′-AAGCTTCCACGTA-3′)外,以与实施例2-1相同的方式重复PCR反应。
从干凝胶中切下HP103 cDNA的267-碱基对(bp)条带(SEQ ID NO:29的1,633~1,899碱基位置)。将提取的凝胶加热15分钟以洗脱HP103 cDNA,然后除了在此不使用[α-35S]-标记的dATP(1200Ci/mmole)和20μM dNTP外,用如上所述相同的引物在相同的条件下重复PCR反应以重新扩增HP103 cDNA。
2-9.PIG40
除了在此使用具有SEQ ID NO:35示出的DNA序列的锚定引物H-T11C(5′-AAGCTTTTTTTTTTTC-3′,RNAimage试剂盒,Genhunter,Cor.,MA,美国)作为oligo-dT锚定引物,以及使用具有SEQ ID NO:36示出的DNA序列的引物H-AP11(5′-AAGCTTCGGGTAA-3′)外,以与实施例2-1相同的方式重复PCR反应。
从干凝胶中切下GV11 cDNA的215-碱基对(bp)条带(SEQ ID NO:33的1,313~1,527碱基位置)。将提取的凝胶加热15分钟以洗脱GV11 cDNA,然后除了在此不使用[α-35S]-标记的dATP(1200Ci/mmole)和20μM dNTP外,用如上所述相同的引物在相同的条件下重复PCR反应以重新扩增GV11 cDNA。
2-10.PIG43
除了在此使用具有SEQ ID NO:39示出的DNA序列的锚定引物H-T11G(5′-AAGCTTTTTTTTTTTG-3′)作为oligo-dT锚定引物,以及使用具有SEQ IDNO:40示出的DNA序列的引物H-AP11(5′-AAGCTTCGGGTAA-3′)外,以与实施例2-1相同的方式重复PCR反应。
从干凝胶中切下HP11 cDNA的321-碱基对(bp)条带(SEQ ID NO:37的879~1,199碱基位置)。将提取的凝胶加热15分钟以洗脱HP11 cDNA,然后除了在此不使用[α-35S]-标记的dATP(1200Ci/mmole)和20μM dNTP外,用如上所述相同的引物在相同的条件下重复PCR反应以重新扩增HP11 cDNA。
2-11.PIG44
除了在此使用具有SEQ ID NO:43示出的DNA序列的锚定引物H-T11C(5′-AAGCTTTTTTTTTTTC-3′)作为oligo-dT锚定引物,以及使用具有SEQ IDNO:44示出的DNA序列的引物H-AP23(5′-AAGCTTGGCTATG-3′)外,以与实施例2-1相同的方式重复PCR反应。
从干凝胶中切下HP23 cDNA的311-碱基对(bp)条带(SEQ ID NO:41的1,633~1,899碱基位置)。将提取的凝胶加热15分钟以洗脱HP23 cDNA,然后除了在此不使用[α-35S]-标记的dATP(1200Ci/mmole)和20μM dNTP外,用如上所述相同的引物在相同的条件下重复PCR反应以重新扩增HP23 cDNA。
2-12.PIG46
除了在此使用具有SEQ ID NO:47示出的DNA序列的锚定引物H-T11A(5′-AAGCTTTTTTTTTTTA-3′)作为oligo-dT锚定引物,以及使用具有SEQ IDNO:48示出的DNA序列的引物H-AP24(5′-AAGCTTCACTAGC-3′)外,以与实施例2-1相同的方式重复PCR反应。
从干凝胶中切下FC24 cDNA的256-碱基对(bp)条带(SEQ ID NO:45的992~1,247碱基位置)。将提取的凝胶加热15分钟以洗脱FC24 cDNA,然后除了在此不使用[α-35S]-标记的dATP(1200Ci/mmole)和20μM dNTP外,用如上所述相同的引物在相同的条件下重复PCR反应以重新扩增FC24 cDNA。
2-13.PIG47
除了在此使用具有SEQ ID NO:51示出的DNA序列的锚定引物H-T11C(5′-AAGCTTTTTTTTTTTC-3′)作为oligo-dT锚定引物,以及使用具有SEQ IDNO:52示出的DNA序列的引物H-AP5(5′-AAGCTTAGTAGGC-3′)外,以与实施例2-1相同的方式重复PCR反应。
从干凝胶中切下FC54 cDNA的192-碱基对(bp)条带(SEQ ID NO:49的587~778碱基位置)。将提取的凝胶加热15分钟以洗脱FC54 cDNA,然后除了在此不使用[α-35S]-标记的dATP(1200Ci/mmole)和20μM dNTP外,用如上所述相同的引物在相同的条件下重复PCR反应以重新扩增FC54 cDNA。
2-14.PIG48
除了在此使用具有SEQ ID NO:55示出的DNA序列的锚定引物H-T11A(5′-AAGCTTTTTTTTTTTA-3′)作为oligo-dT锚定引物,以及使用具有SEQ IDNO:56示出的DNA序列的引物H-AP7(5′-AAGCTTAACGAGG-3′)外,以与实施例2-1相同的方式重复PCR反应。
从干凝胶中切下FC71 cDNA的272-碱基对(bp)条带(SEQ ID NO:53的1,348~1,619碱基位置)。将提取的凝胶加热15分钟以洗脱FC71 cDNA,然后除了在此不使用[α-35S]-标记的dATP(1200Ci/mmole)和20μM dNTP外,用如上所述相同的引物在相同的条件下重复PCR反应以重新扩增FC71 cDNA。
2-15.PIG50
除了在此使用具有SEQ ID NO:59示出的DNA序列的锚定引物H-T11C(5′-AAGCTTTTTTTTTTTC-3′)作为oligo-dT锚定引物,以及使用具有SEQ IDNO:60示出的DNA序列的引物H-AP5(5′-AAGCTTAGTAGGC-3′)外,以与实施例2-1相同的方式重复PCR反应。
从干凝胶中切下BBCC5-5 cDNA的182-碱基对(bp)条带(SEQ ID NO:57的418~599碱基位置)。将提取的凝胶加热15分钟以洗脱BBCC5-5 cDNA,然后除了在此不使用[α-35S]-标记的dATP(1200Ci/mmole)和20μM dNTP外,用如上所述相同的引物在相同的条件下重复PCR反应以重新扩增BBCC5-5cDNA。
2-16.PIG54
除了在此使用具有SEQ ID NO:63示出的DNA序列的锚定引物H-T11A(5′-AAGCTTTTTTTTTTTA-3′)作为oligo-dT锚定引物,以及使用具有SEQ IDNO:64示出的DNA序列的引物H-AP15(5′-AAGCTTACGCAAC-3′)外,以与实施例2-1相同的方式重复PCR反应。
从干凝胶中切下HP15 cDNA的345-碱基对(bp)条带(SEQ ID NO:61的1,533~1,877碱基位置)。将提取的凝胶加热15分钟以洗脱HP15 cDNA,然后除了在此不使用[α-35S]-标记的dATP(1200Ci/mmole)和20μM dNTP外,用如上所述相同的引物在相同的条件下重复PCR反应以重新扩增HP15 cDNA。
2-17.PIG55
除了在此使用具有SEQ ID NO:67示出的DNA序列的锚定引物H-T11G(5′-AAGCTTTTTTTTTTTG-3′)作为oligo-dT锚定引物,以及使用具有SEQ IDNO:68示出的DNA序列的引物H-AP4(5′-AAGCTTCTCAACG-3′)外,以与实施例2-1相同的方式重复PCR反应。
从干凝胶中切下FC4 cDNA的186-碱基对(bp)条带(SEQ ID NO:65的292~477碱基位置)。将提取的凝胶加热15分钟以洗脱FC4cDNA,然后除了在此不使用[α-35S]-标记的dATP(1200Ci/mmole)和20μM dNTP外,用如上所述相同的引物在相同的条件下重复PCR反应以重新扩增FC4 cDNA。
2-18.GIG9
除了在此使用具有SEQ ID NO:71示出的DNA序列的锚定引物H-T11A(5′-AAGCTTTTTTTTTTTA-3′,RNAimage试剂盒,Genhunter,Cor.,MA,美国)作为oligo-dT锚定引物,以及使用具有SEQ ID NO:72示出的DNA序列的引物H-AP14(5′-AAGCTTGGAGCTT-3′)外,以与实施例2-1相同的方式重复PCR反应。
从干凝胶中切下H148 cDNA的221-碱基对(bp)条带(SEQ ID NO:69的769~989碱基位置)。将提取的凝胶加热15分钟以洗脱H148 cDNA,然后除了在此不使用[α-35S]-标记的dATP(1200Ci/mmole)和20μM dNTP外,用如上所述相同的引物在相同的条件下重复PCR反应以重新扩增H148 cDNA。
2-19.HLC-9
除了在此使用具有SEQ ID NO:75示出的DNA序列的锚定引物H-T11G(5′-AAGCTTTTTTTTTTTG-3′)作为oligo-dT锚定引物,以及使用具有SEQ IDNO:76示出的DNA序列的引物H-AP7(5′-AAGCTTAACGAGG-3′)外,以与实施例2-1相同的方式重复PCR反应。
从干凝胶中切下L738 cDNA的322-碱基对(bp)条带(SEQ ID NO:73的1,007~1,328碱基位置)。将提取的凝胶加热15分钟以洗脱L738 cDNA,然后除了在此不使用[α-35S]-标记的dATP(1200Ci/mmole)和20μM dNTP外,用如上所述相同的引物在相同的条件下重复PCR反应以重新扩增L738 cDNA。
2-20.GIG18
除了在此使用具有SEQ ID NO:79示出的DNA序列的锚定引物H-T11C(5′-AAGCTTTTTTTTTTTC-3′)作为oligo-dT锚定引物,以及使用具有SEQ IDNO:80示出的DNA序列的引物H-AP4(5′-AAGCTTCTCAACG-3′)外,以与实施例2-1相同的方式重复PCR反应。
从干凝胶中切下HP47 cDNA的321-碱基对(bp)条带(SEQ ID NO:77的879~1,199碱基位置)。将提取的凝胶加热15分钟以洗脱HP47 cDNA,然后除了在此不使用[α-35S]-标记的dATP(1200Ci/mmole)和20μM dNTP外,用如上所述相同的引物在相同的条件下重复PCR反应以重新扩增HP47 cDNA。
2-21.MIG22
除了在此使用具有SEQ ID NO:83示出的DNA序列的锚定引物H-T11A(5′-AAGCTTTTTTTTTTTA-3′,RNAimage试剂盒,Genhunter,Cor.,MA,美国)作为oligo-dT锚定引物,以及使用具有SEQ ID NO:84示出的DNA序列的引物H-AP6(5′-AAGCTTGCACCAT-3′)外,以与实施例2-1相同的方式重复PCR反应。
从干凝胶中切下L690 cDNA的327-碱基对(bp)条带(SEQ ID NO:81的273~599碱基位置)。将提取的凝胶加热15分钟以洗脱L690 cDNA,然后除了在此不使用[α-35S]-标记的dATP(1200Ci/mmole)和20μM dNTP外,用如上所述相同的引物在相同的条件下重复PCR反应以重新扩增L690 cDNA。
实施例3:克隆
使用TA克隆系统(Promega,美国),根据制造商手册,将如上所述所有重新扩增的FC21产物;MC113产物;CA338d产物;H124产物;H122产物;FC23产物;FC34产物;HP103产物;GV11产物;HP11产物;HP23产物;FC24产物;FC54产物;FC71产物;BBCC5-5产物;HP15产物;FC4产物;H148产物;L738产物;HP47产物以及L690 PCR产物分别插入到pGEM-TEASY载体中。
(步骤1)连接反应
将实施例2中所有重新扩增的FC21产物、MC113产物、CA338d产物、H124产物、H122产物、FC23产物、FC34产物、HP103产物、GV11产物、HP11产物、HP23产物、FC24产物、FC54产物、FC71产物、BBCC5-5产物、HP15产物、FC4产物、H148产物、L738产物、HP47产物以及L690 PCR产物各2μl;1μl pGEM-T EASY载体(50ng);1μl T4 DNA连接酶缓冲液(10X)和1μl T4 DNA连接酶(3weiss单位/μl;Promega)置于0.5ml试管中,并向其中加入蒸馏水至终体积10μl。将该连接反应混合物在14℃下孵育过夜。
(步骤2)TA克隆的转化
将大肠杆菌JM109(Promega,WI,美国)在10ml LB培养基(10g细菌用胰蛋白胨、5g细菌用酵母抽提物、5g NaCl)中培养直到在600nm的光密度达到大约0.3~0.6。将培养的混合物在冰中保持约10分钟并于4℃下4,000rpm离心10分钟,然后弃去上清液并收集细胞。将收集的细胞沉淀物暴露于10ml 0.1M冰冷却的CaCl2中大约30分钟至1小时以制备感受态细胞。将该产物再于4℃下4,000rpm离心10分钟,然后弃去上清液并收集细胞并将细胞在2ml 0.1M冰冷却的的CaCl2中悬浮。
将200μl感受态细胞悬液转移到新的微量离心管中,并向其中加入2μl步骤1中制备的各连接反应产物。将得到的混合物于42℃水浴中孵育90秒,然后0℃骤冻。向其中加入800μl SOC培养基(2.0g细菌用胰蛋白胨、0.5g细菌用酵母抽提物、1ml 1M NaCl、0.25ml 1M KCl、97ml TDW、1ml 2MMg2+、1ml 2M葡萄糖)并将得到的混合物在220rpm的旋转振荡培养箱中于37℃下孵育45分钟。
用玻璃棒将25μl X-gal(二甲基甲酰胺中40mg/ml储存)涂布到添加氨苄青霉素并预先在37℃的培养箱中保持的LB平板上,然后向其中加入25μl各转化的细胞并用玻璃板再涂布,然后于37℃下孵育过夜。孵育后,选择3~4个形成的白色菌落,然后将各选择的细胞接种在添加氨苄青霉素的LB平板上。为了构建质粒,选择在上述菌落中分别被证明为导入连接反应产物的菌落的菌株,即转化的大肠杆菌菌株JM109/FC21;JM109/MC113;JM109/CA338d;JM109/H124;JM109/H122;JM109/FC23;JM109/FC34;JM109/HP103;JM109/GV11;JM109/HP11;JM109/HP23;JM109/FC24;JM109/FC54;JM109/FC71;JM109/BBCC5-5;JM109/HP15;JM109/FC4;JM109/H148;JM109/L738;JM109/HP47以及JM109/L690,并在10ml TB培养基(terrific broth)(900ml TDW、12g细菌用胰蛋白胨、24g细菌用酵母抽提物、4ml甘油、0.17M KH2PO4、100ml 0.72N K2HPO4)中培养。
实施例4:重组质粒DNA的分离
使用WizardTMPlus小量制备DNA纯化试剂盒(Promega,美国),根据制造商手册,从转化的大肠杆菌菌株中分离FC21质粒DNA。
证实少量的各分离的质粒DNA用限制性内切酶ECoRI处理,然后在2%的凝胶中电泳以证实FC21;MC113;CA338d;H124;H122;FC23;FC34;HP103;GV11;HP11;HP23;FC24;FC54;FC71;BBCC5-5;HP15;FC4;H148;L738;HP47以及L690的部分序列分别插入到质粒中。
实施例5:DNA碱基序列分析
根据常规方法,将所有在实施例2中获得的FC21产物;MC113产物;CA338d产物;H124产物;H122产物;FC23产物;FC34产物;HP103产物;GV11产物;HP11产物;HP23产物;FC24产物;FC54产物;FC71产物;BBCC5-5产物;HP15产物;FC4产物;H148产物;L738产物;HP47产物以及L690 PCR产物扩增、克隆并然后重新扩增。使用Sequenase version2.0DNA测序试剂盒(United States Biochemical,Cleveland,OH,美国)根据双脱氧链终止法对得到的FC21;MC113;CA338d;H124;H122;FC23;FC34;HP103;GV11;HP11;HP23;FC24;FC54;FC71;BBCC5-5;HP15;FC4;H148;L738;HP47以及L690片段进行测序。
所述基因的DNA序列对应于SEQ ID NO:1的913~1,174核苷酸序列位置,其在本发明中称为“FC21”。
使用5′-随机引物H-AP21和3′-锚定引物H-T11A,将上述得到的262-bpcDNA片段,即FC21进行差异显示反转录聚合酶链式反应(DDRT-PCR),且然后使用电泳确认。如图1所示,从差异显示(DD)显示出基因在正常乳腺组织、乳腺癌组织和MCF-7细胞中差异表达。在图1中可见,262-bp cDNA片段FC21在乳腺癌和MCF-7癌细胞中高表达,而在正常组织中很少表达。
所述基因的DNA序列对应于SEQ ID NO:5的2,023~2,299核苷酸序列位置,其在本发明中称为“MC113”。
使用5′-随机引物H-AP11和3′-锚定引物H-T11C,将上述得到的277-bpcDNA片段,即MC113进行差异显示反转录聚合酶链式反应(DDRT-PCR),且然后使用电泳确认。
如图2所示,从差异显示(DD)显示出基因在正常外宫颈组织、转移淋巴结组织和CUMC-6细胞中差异表达。在图2中可见,277-bp cDNA片段MC113在子宫颈癌、转移淋巴结组织和CUMC-6癌细胞中表达,而在正常组织中很少表达。
所述基因的DNA序列对应于SEQ ID NO:9的1,822~2,099核苷酸序列位置,其在本发明中称为“CA338d”。
使用5′-随机引物H-AP33和3′-锚定引物H-T11C,将上述得到的278-bpcDNA片段,即CA338d进行差异显示反转录聚合酶链式反应(DDRT-PCR),且然后使用电泳确认。
如图3所示,从差异显示(DD)显示出基因在正常外宫颈组织、转移淋巴结组织和CUMC-6细胞中差异表达。在图3中可见,278-bp cDNA片段CA338d在子宫颈癌、转移淋巴结组织和CUMC-6癌细胞中表达,而在正常组织中很少表达。
所述基因的DNA序列对应于SEQ ID NO:13的243~419核苷酸序列位置,其在本发明中称为“H124”。
使用5′-随机引物H-AP12和3′-锚定引物H-T11A,将上述得到的177-bpcDNA片段,即H124进行差异显示反转录聚合酶链式反应(DDRT-PCR),且然后使用电泳确认。
如图4所示,从差异显示(DD)显示出基因在正常外宫颈组织、转移淋巴结组织和CUMC-6细胞中差异表达。在图4中可见,177-bp cDNA片段H124在子宫颈癌、转移淋巴结组织和CUMC-6癌细胞中表达,而在正常组织中很少表达。
所述基因的DNA序列对应于SEQ ID NO:17的748~979核苷酸序列位置,其在本发明中称为“H122”。
使用5′-随机引物H-AP12和3′-锚定引物H-T11C,将上述得到的232-bpcDNA片段,即H122进行差异显示反转录聚合酶链式反应(DDRT-PCR),且然后使用电泳确认。
如图5所示,从差异显示(DD)显示出基因在正常外宫颈组织、转移淋巴结组织和CUMC-6细胞中差异表达。在图5中可见,232-bp cDNA片段H122在子宫颈癌、转移淋巴结组织和CUMC-6癌细胞中表达,而在正常组织中很少表达。
所述基因的DNA序列对应于SEQ ID NO:21的1,823~2,093核苷酸序列位置,其在本发明中称为“FC23”。
使用5′-随机引物H-AP23和3′-锚定引物H-T11C,将上述得到的271-bpcDNA片段,即FC23进行差异显示反转录聚合酶链反应(DDRT-PCR),且然后使用电泳确认。如图6所示,从差异显示(DD)显示出基因在正常乳腺组织、乳腺癌组织和MCF-7细胞中差异表达。在图6中可见,271-bp cDNA片段FC23在乳腺癌和MCF-7癌细胞中高表达,而在正常组织中很少表达。
所述基因的DNA序列对应于SEQ ID NO:25的1,884~2,195核苷酸序列位置,其在本发明中称为“FC34”。
使用5′-随机引物H-AP34和3′-锚定引物H-T11G,将上述得到的312-bpcDNA片段,即FC34进行差异显示反转录聚合酶链式反应(DDRT-PCR),且然后使用电泳确认。如图7所示,从差异显示(DD)显示出基因在正常乳腺组织、乳腺癌组织和MCF-7细胞中差异表达。在图7中可见,312-bp cDNA片段FC34在乳腺癌和MCF-7癌细胞中高表达,而在正常组织中很少表达。
所述基因的DNA序列对应于SEQ ID NO:29的1,633~1,899核苷酸序列位置,其在本发明中称为“HP103”。
使用5′-随机引物H-AP10和3′-锚定引物H-T11C,将上述得到的267-bpcDNA片段,即HP103进行差异显示反转录聚合酶链式反应(DDRT-PCR),且然后使用电泳确认。如图8所示,从差异显示(DD)显示出基因在正常肝组织、肝癌组织和HepG2细胞中差异表达。在图8中可见,267-bp cDNA片段HP103在肝癌和HepG2癌细胞中表达,而在正常组织中不表达或检测不到。
所述基因的DNA序列对应于SEQ ID NO:33的1,313~1,527核苷酸序列位置,其在本发明中称为“GV1”。
使用5′-随机引物H-AP11和3′-锚定引物H-T11C,将上述得到的215-bpcDNA片段,即GV11进行差异显示反转录聚合酶链式反应(DDRT-PCR),且然后使用电泳确认。
如图9所示,从差异显示(DD)显示出基因在正常外周血组织、白血病组织和K-562细胞中差异表达。在图9中可见,215-bp cDNA片段GV11在白血病组织和K-562癌细胞中表达,而在正常组织中很少表达。
所述基因的DNA序列对应于SEQ ID NO:37的879~1,199核苷酸序列位置,其在本发明中称为“HP11”。
使用5′-随机引物H-AP11和3′-锚定引物H-T11G,将上述得到的321-bpcDNA片段,即HP11进行差异显示反转录聚合酶链式反应(DDRT-PCR),且然后使用电泳确认。如图10所示,从差异显示(DD)显示出基因在正常肝组织、肝癌组织和HepG2细胞中差异表达。在图10中可见,321-bp cDNA片段HP11在肝癌组织和HepG2癌细胞中表达,而在正常组织中不表达或检测不到。
所述基因的DNA序列对应于SEQ ID NO:41的1,369~1,679核苷酸序列位置,其在本发明中称为“HP23”。
使用5′-随机引物H-AP23和3′-锚定引物H-T11C,将上述得到的311-bpcDNA片段,即HP23进行差异显示反转录聚合酶链式反应(DDRT-PCR),且然后使用电泳确认。如图11所示,从差异显示(DD)显示出基因在正常肝组织、肝癌组织和HepG2细胞中差异表达。在图11中可见,311-bp cDNA片段HP23在肝癌和HepG2癌细胞中表达,而在正常组织中不表达或很少表达。
所述基因的DNA序列对应于SEQ ID NO:45的992~1,247核苷酸序列位置,其在本发明中称为“FC24”。
使用5′-随机引物H-AP24和3′-锚定引物H-T11A,将上述得到的256-bpcDNA片段,即FC24进行差异显示反转录聚合酶链式反应(DDRT-PCR),且然后使用电泳确认。如图12所示,从差异显示(DD)显示出基因在正常乳腺组织、乳腺癌组织和MCF-7细胞中差异表达。在图12中可见,256-bp cDNA片段FC24在乳腺癌组织和MCF-7癌细胞中高表达,而在正常组织中很少表达。
所述基因的DNA序列对应于SEQ ID NO:49的587~778核苷酸序列位置,其在本发明中称为“FC54”。
使用5′-随机引物H-AP5和3′-锚定引物H-T11C,将上述得到的192-bpcDNA片段,即FC54进行差异显示反转录聚合酶链式反应(DDRT-PCR),且然后使用电泳确认。如图13所示,从差异显示(DD)显示出基因在正常乳腺组织、乳腺癌组织和MCF-7细胞中差异表达。在图13中可见,192-bp cDNA片段FC54在乳腺癌组织和MCF-7癌细胞中高表达,而在正常组织中很少表达。
所述基因的DNA序列对应于SEQ ID NO:53的1,348~1,619核苷酸序列位置,其在本发明中称为“FC71”。
使用5′-随机引物H-AP7和3′-锚定引物H-T11A,将上述得到的272-bpcDNA片段,即FC71进行差异显示反转录聚合酶链式反应(DDRT-PCR),且然后使用电泳确认。如图14所示,从差异显示(DD)显示出基因在正常乳腺组织、乳腺癌组织和MCF-7细胞中差异表达。在图14中可见,272-bp cDNA片段FC71在乳腺癌组织和MCF-7癌细胞中高表达,而在正常组织中很少表达。
所述基因的DNA序列对应于SEQ ID NO:57的418~599核苷酸序列位置,其在本发明中称为“BBCC5-5”。
使用5′-随机引物H-AP5和3′-锚定引物H-T11C,将上述得到的182-bpcDNA片段,即BBCC5-5进行差异显示反转录聚合酶链式反应(DDRT-PCR),且然后使用电泳确认。如图15所示,从差异显示(DD)显示出基因在正常乳腺组织、乳腺癌组织和MCF-7细胞中差异表达。在图15中可见,182-bp cDNA片段BBCC5-5在乳腺癌组织和MCF-7癌细胞中高表达,而在正常组织中很少表达。
所述基因的DNA序列对应于SEQ ID NO:61的1,533~1,877核苷酸序列位置,其在本发明中称为“HP15”。
使用5′-随机引物H-AP15和3′-锚定引物H-T11A,将上述得到的345-bpcDNA片段,即HP15进行差异显示反转录聚合酶链反应(DDRT-PCR),且然后使用电泳确认。如图16所示,从差异显示(DD)显示出基因在正常肝组织、肝癌组织和HepG2细胞中差异表达。在图16中可见,345-bp cDNA片段HP15在肝癌组织和HepG2癌细胞中表达,而在正常组织中不表达或很少表达。
所述基因的DNA序列对应于SEQ ID NO:65的292~477核苷酸序列位置,其在本发明中称为“FC4”。
使用5′-随机引物H-AP4和3′-锚定引物H-T11G,将上述得到的186-bpcDNA片段,即FC4进行差异显示反转录聚合酶链式反应(DDRT-PCR),且然后使用电泳确认。如图17所示,从差异显示(DD)显示出基因在正常乳腺组织、乳腺癌组织和MCF-7细胞中差异表达。在图17中可见,186-bp cDNA片段FC4在乳腺癌组织和MCF-7癌细胞中高表达,而在正常组织中很少表达。
所述基因的DNA序列对应于SEQ ID NO:69的769~989核苷酸序列位置,其在本发明中称为“H148”。
使用5′-随机引物H-AP14和3′-锚定引物H-T11A,将上述得到的221-bpcDNA片段,即H148进行差异显示反转录聚合酶链式反应(DDRT-PCR),且然后使用电泳确认。
如图18所示,从差异显示(DD)显示出基因在正常外宫颈组织、转移淋巴结组织和CUMC-6细胞中差异表达。在图18中可见,221-bp cDNA片段H148在子宫颈癌组织、转移淋巴结组织和CUMC-6癌细胞中表达,而在正常组织中很少表达。
所述基因的DNA序列对应于SEQ ID NO:73的1,007~1,328核苷酸序列位置,其在本发明中称为“L738”。
使用5′-随机引物H-AP7和3′-锚定引物H-T11G,将上述得到的322-bpcDNA片段,即L738进行差异显示反转录聚合酶链式反应(DDRT-PCR),且然后使用电泳确认。如图19所示,从差异显示(DD)显示出基因在正常肺组织、左肺癌组织、从左肺转移到右肺的转移性肺癌组织和A549肺癌细胞中差异表达。在图19中可见,322-bp cDNA片段L738在肺癌组织、转移性肺癌组织和A549肺癌细胞中表达,而在正常肺组织中不表达或很少表达。
所述基因的DNA序列对应于SEQ ID NO:77的879~1,199核苷酸序列位置,其在本发明中称为“HP47”。
使用5′-随机引物H-AP4和3′-锚定引物H-T11C,将上述得到的321-bpcDNA片段,即HP47进行差异显示反转录聚合酶链式反应(DDRT-PCR),且然后使用电泳确认。如图20所示,从差异显示(DD)显示出基因在正常肝组织、肝癌组织和HepG2细胞中差异表达。在图20中可见,321-bp cDNA片段HP47在肝癌组织和HepG2癌细胞中表达,而在正常组织中很少表达。
所述基因的DNA序列对应于SEQ ID NO:81的273~599核苷酸序列位置,其在本发明中称为“L690”。
使用5′-随机引物H-AP6和3′-锚定引物H-T11A,将上述得到的327-bpcDNA片段,即L690进行差异显示反转录聚合酶链式反应(DDRT-PCR),且然后使用电泳确认。
如图21所示,从差异显示(DD)显示出基因在正常肺组织、左肺癌组织、从左肺转移到右肺的转移性肺癌组织和A549肺癌细胞中差异表达。在图21中可见,327-bp cDNA片段L690在肺癌组织、转移性肺癌组织和A549肺癌细胞中表达,而在正常肺组织中很少表达或不表达。尤其是,327-bp cDNA片段L690在癌组织,例如转移性癌组织中表达最高。
实施例6:全长原癌基因的cDNA序列分析
6-1.PIG12
使用32P-标记的FC21作为探针以筛选噬菌体λgt11人胚肺成纤维细胞cDNA库(bacteriophageλgt11 human lung embryonic fibroblast cDNAlibrary)(Miki,T.等人,Gene 83:137-146,1989)。从人胚肺成纤维细胞cDNA文库获得其中将1,258-bp片段插入到pCEV-LAC载体的全长PIG12 cDNA克隆,然后于2004年2月16日以收录号AY550973保存在美国GenBank数据库(预定发布日期:2005年12月31日)。
AY550973基因的DNA序列与以收录号NM_006299保存在数据库中的人类基因锌指蛋白193(ZNF193)基因的相似。与以前报道的其功能相反,然而从本研究结果发现AY550973基因与尤其包括乳腺癌的多种肿瘤发生密切相关。作为研究结果,发现PIG12原癌基因在包括乳腺组织的多种正常人组织中很少表达,而在包括乳腺癌的多种癌组织中其表达明显升高。
由1,258bp组成的PIG12的全长DNA序列在SEQ ID NO:1中示出。
在SEQ ID NO:1的DNA序列中,估计本发明的原癌基因的全长可读框对应于68~1,252的核苷酸序列位置,并且编码SEQ ID NO:2的由394个氨基酸组成的蛋白质。
6-2.PIG18
使用32P-标记的MC113作为探针以筛选噬菌体λgt11人胚肺成纤维细胞cDNA文库(Miki,T.等人,Gene 83:137-146,1989)。从人胚肺成纤维细胞cDNA文库获得其中将2,403-bp片段插入到pCEV-LAC载体的全长PIG18 cDNA克隆,然后于2004年10月5日以收录号AY771596保存在美国GenBank数据库(预定发布日期:2005年12月31日)。
将插入到λpCEV载体的PIG18克隆用限制性内切酶NotI酶切并以氨苄青霉素抗性pCEV-LAC噬菌粒载体的形式从噬菌体分离(Miki,T.等人,Gene 83:137-146,1989)。
通过T4 DNA连接酶连接含有PIG18基因的pCEV-LAC载体以制备PIG18质粒DNA,且然后用连接的克隆转化大肠杆菌DH5α。
由2,403bp组成的PIG18的全长DNA序列在SEQ ID NO:5中示出。
在SEQ ID NO:5的DNA序列中,估计本发明的原癌基因的全长可读框对应于875~1,063的核苷酸序列位置,并且编码SEQ ID NO:6的由62个氨基酸组成的蛋白质。
6-3.PIG23
使用32P-标记的CA338d作为探针以筛选噬菌体λgt11人胚肺成纤维细胞cDNA文库(Miki,T.等人,Gene 83:137-146,1989)。从人胚肺成纤维细胞cDNA库获得其中将2,150-bp片段插入到pCEV-LAC载体的全长PIG23 cDNA克隆,然后于2004年10月23日以收录号AY826819保存在美国GenBank数据库(预定发布日期:2005年12月31日)。
将插入到λpCEV载体的PIG23克隆用限制性内切酶NotI酶切并以氨苄青霉素抗性pCEV-LAC噬菌粒载体的形式从噬菌体分离(Miki,T.等人,Gene 83:137-146,1989)。
通过T4DNA连接酶连接含有PIG23基因的pCEV-LAC载体以制备PIG23质粒DNA,且然后用连接的克隆转化大肠杆菌DH5α。
由2,150bp组成的PIG23的全长DNA序列在SEQ ID NO:9中示出。
在SEQ ID NO:9的DNA序列中,估计本发明的原癌基因的全长可读框对应于25~1,953的核苷酸序列位置,并且编码SEQ ID NO:10的由642个氨基酸组成的蛋白质。
6-4.PIG27
使用32P-标记的H124作为探针以筛选噬菌体λgt11人胚肺成纤维细胞cDNA文库(Miki,T.等人,Gene 83:137-146,1989)。从人胚肺成纤维细胞cDNA文库获得其中将446-bp片段插入到pCEV-LAC载体的全长PIG27 cDNA克隆,然后于2003年10月30日以收录号AY453399保存在美国GenBank数据库(预定发布日期:2005年3月31日)。
将插入到λpCEV载体的PIG27克隆用限制性内切酶NotI酶切并以氨苄青霉素抗性pCEV-LAC噬菌粒载体的形式从噬菌体分离(Miki,T.等人,Gene 83:137-146,1989)。
通过T4 DNA连接酶连接含有PIG27基因的pCEV-LAC载体以制备PIG27质粒DNA,且然后用连接的克隆转化大肠杆菌DH5α。
由446bp组成的PIG27的全长DNA序列在SEQ ID NO:13中示出。
在SEQ ID NO:13的DNA序列中,估计本发明的原癌基因的全长可读框对应于20~337的核苷酸序列位置,并且编码SEQ ID NO:14的由105个氨基酸组成的蛋白质。
6-5.PIG28
使用32P-标记的H122作为探针以筛选噬菌体λgt11人胚肺成纤维细胞cDNA文库(Miki,T.等人,Gene 83:137-146,1989)。从人胚肺成纤维细胞cDNA文库获得其中将1,024-bp片段插入到pCEV-LAC载体的全长PIG28 cDNA克隆,然后于2003年10月30日以收录号AY453398保存在美国GenBank数据库(预定发布日期:2005年3月31日)。
将插入到λpCEV载体的PIG28克隆用限制性内切酶NotI酶切并以氨苄青霉素抗性pCEV-LAC噬菌粒载体的形式从噬菌体分离(Miki,T.等人,Gene 83:137-146,1989)。
通过T4 DNA连接酶连接含有PIG28基因的pCEV-LAC载体以制备PIG28质粒DNA,且然后用连接的克隆转化大肠杆菌DH5α。
由1,024bp组成的PIG28的全长DNA序列在SEQ ID NO:17中示出。
在SEQ ID NO:17的DNA序列中,估计本发明的原癌基因的全长可读框对应于33~998的核苷酸序列位置,并且编码SEQ ID NO:18的由321个氨基酸组成的蛋白质。
6-6.PIG30
使用32P-标记的FC23作为探针以筛选噬菌体λgt11人胚肺成纤维细胞cDNA文库(Miki,T.等人,Gene 83:137-146,1989)。从人胚肺成纤维细胞cDNA文库获得其中将2,152-bp片段插入到pCEV-LAC载体的全长PIG30 cDNA克隆,然后于2004年2月16日以收录号AY550975保存在美国GenBank数据库(预定发布日期:2005年12月31日)。
AY550975基因的DNA序列与以收录号NM_005186保存在数据库中的人类钙蛋白酶1,(mu/I)大亚基(CAPN1)基因的相似。与以前报道的其功能相反,然而从本研究结果发现AY550975基因与尤其包括乳腺癌的多种肿瘤发生密切相关。作为研究结果,发现PIG30原癌基因在包括乳腺组织的多种正常人组织中很少表达,而在包括乳腺癌的多种癌组织中其表达明显升高。
由2,152bp组成的PIG30的全长DNA序列在SEQ ID NO:21中示出。
在SEQ ID NO:21的DNA序列中,估计本发明的原癌基因的全长可读框对应于6~2,150的核苷酸序列位置,并且编码SEQ ID NO:22的由714个氨基酸组成的蛋白质。
6-7.PIG31
使用32P-标记的FC34作为探针以筛选噬菌体λgt11人胚肺成纤维细胞cDNA文库(Miki,T.等人,Gene 83:137-146,1989)。从人胚肺成纤维细胞cDNA文库获得其中将2,246-bp片段插入到pCEV-LAC载体的全长PIG31 cDNA克隆,然后于2004年6月3日以收录号AY644768保存在美国GenBank数据库(预定发布日期:2005年12月31日)。AY644768基因的DNA序列与以收录号AF085199保存在数据库中的人类golgin-84mRNA基因的相似。与以前报道的其功能相反,然而从本研究结果发现AY644768基因与尤其包括乳腺癌的多种肿瘤发生密切相关。作为研究结果,发现PIG31原癌基因在包括乳腺组织的多种正常人组织中很少表达,而在包括乳腺癌的多种癌组织中其表达明显升高。
由2,246bp组成的PIG31的全长DNA序列在SEQ ID NO:25中示出。
在SEQ ID NO:25的DNA序列中,估计本发明的原癌基因的全长可读框对应于37~2,232的核苷酸序列位置,并且编码SEQ ID NO:26的由731个氨基酸组成的蛋白质。
6-8.PIG38
使用32P-标记的HP103作为探针以筛选噬菌体λgt11人胚肺成纤维细胞cDNA文库(Miki,T.等人,Gene 83:137-146,1989)。从人胚肺成纤维细胞cDNA库获得其中将1,973-bp片段插入到pCEV-LAC载体的全长PIG38 cDNA克隆,然后于2003年12月24日以收录号AY513282保存在美国GenBank数据库(预定发布日期:2005年12月31日)。AY513282基因的DNA序列与以收录号BC024178保存在数据库中的人类假定蛋白FLJ10094基因的相似。然而,该基因的功能是未知的。与以前报道的其功能相反,然而从本研究结果发现AY513282基因与尤其包括肝癌的多种肿瘤发生密切相关。作为研究结果,发现PIG38原癌基因在包括肝组织的多种正常人组织中很少表达,而在包括肝癌的多种癌组织中其表达明显升高。
由1,973bp组成的PIG38的全长DNA序列在SEQ ID NO:29中示出。
在SEQ ID NO:29的DNA序列中,估计本发明的原癌基因的全长可读框对应于25~1,956的核苷酸序列位置,并且编码SEQ ID NO:30的由643个氨基酸组成的蛋白质。
6-9.PIG40
使用32P-标记的GV11作为探针以筛选噬菌体λgt11人胚肺成纤维细胞cDNA文库(Miki,T.等人,Gene 83:137-146,1989)。从人胚肺成纤维细胞cDNA文库获得其中将1,586-bp片段插入到pCEV-LAC载体的全长PIG40 cDNA克隆,然后于2004年9月23日以收录号AY762100保存在美国GenBank数据库(预定发布日期:2005年3月31日)。
将插入到λpCEV载体的PIG40克隆用限制性内切酶NotI酶切并以氨苄青霉素抗性pCEV-LAC噬菌粒载体的形式从噬菌体分离(Miki,T.等人,Gene 83:137-146,1989)。
通过T4 DNA连接酶连接含有PIG40基因的pCEV-LAC载体以制备PIG40质粒DNA,且然后用连接的克隆转化大肠杆菌DH5α。
由1,586bp组成的PIG40的全长DNA序列在SEQ ID NO:33中示出。
在SEQ ID NO:33的DNA序列中,估计本发明的原癌基因的全长可读框对应于36~1,541的核苷酸序列位置,并且编码SEQ ID NO:34的由501个氨基酸组成的蛋白质。
6-10.PIG43
使用32P-标记的HP11作为探针以筛选噬菌体λgt11人胚肺成纤维细胞cDNA文库(Miki,T.等人,Gene 83:137-146,1989)。从人胚肺成纤维细胞cDNA文库获得其中将1,245-bp片段插入到pCEV-LAC载体的全长PIG43 cDNA克隆,然后于2003年12月25日以收录号AY513283保存在美国GenBank数据库(预定发布日期:2005年12月31日)。AY513283基因的DNA序列与以收录号NM_002065保存在数据库中的人类谷氨酸-氨连接酶(谷氨酰胺合成酶)(GLUL)基因的相似,但它们表达的蛋白质彼此不同。与以前报道的其功能相反,然而从本研究结果发现AY513283基因与尤其包括肝癌的多种肿瘤发生密切相关。作为研究结果,发现PIG43原癌基因在包括肝组织的多种正常人组织中很少表达,而在包括肝癌的多种癌组织中其表达明显升高。
由1,245bp组成的PIG43的全长DNA序列在SEQ ID NO:37中示出。
在SEQ ID NO:37的DNA序列中,估计本发明的原癌基因的全长可读框对应于57~758的核苷酸序列位置,并且编码SEQ ID NO:38的由233个氨基酸组成的蛋白质。
6-11.PIG44
使用32P-标记的HP23作为探针以筛选噬菌体λgt11人胚肺成纤维细胞cDNA文库(Miki,T.等人,Gene 83:137-146,1989)。从人胚肺成纤维细胞cDNA文库获得其中将1,721-bp片段插入到pCEV-LAC载体的全长PIG44 cDNA克隆,然后于2003年12月25日以收录号AY513284保存在美国GenBank数据库(预定发布日期:2005年12月31日)。AY513282基因的DNA序列与以收录号AB037773保存在数据库中的人类假定蛋白FLJ10094基因的相似,但它们表达的蛋白质彼此不同。与以前报道的其功能相反,然而从本研究结果发现AY513284基因与尤其包括肝癌的多种肿瘤发生密切相关。作为研究结果,发现PIG44原癌基因在包括肝组织的多种正常人组织中很少表达,而在包括肝癌的多种癌组织中其表达明显升高。
由1,721bp组成的PIG44的全长DNA序列在SEQ ID NO:41中示出。
在SEQ ID NO:41的DNA序列中,估计本发明的原癌基因的全长可读框对应于55~1,512的核苷酸序列位置,并且编码SEQ ID NO:42的由485个氨基酸组成的蛋白质。
6-12.PIG46
使用32P-标记的FC24作为探针以筛选噬菌体λgt11人胚肺成纤维细胞cDNA文库(Miki,T.等人,Gene 83:137-146,1989)。从人胚肺成纤维细胞cDNA文库获得其中将1,312-bp片段插入到pCEV-LAC载体的全长PIG46 cDNA克隆,然后于2004年9月23日以收录号AY762101保存在美国GenBank数据库(预定发布日期:2005年12月31日)。AY762101基因的DNA序列与以收录号NM_000224保存在数据库中的人类角蛋白18(KRT18),转录变体1(keratin 18(KRT18),transcriptional variant 1)基因的相似。与以前报道的其功能相反,然而从本研究结果发现AY762101基因与尤其包括乳腺癌的多种肿瘤发生密切相关。作为研究结果,发现PIG46原癌基因在包括乳腺组织的多种正常人组织中很少表达,而在包括乳腺癌的多种癌组织中其表达明显升高。
由1,312bp组成的PIG46的全长DNA序列在SEQ ID NO:45中示出。
在SEQ ID NO:45的DNA序列中,估计本发明的原癌基因的全长可读框对应于5~1,297的核苷酸序列位置,并且编码SEQ ID NO:46的由430个氨基酸组成的蛋白质。
6-13.PIG47
使用32P-标记的FC54作为探针以筛选噬菌体λgt11人胚肺成纤维细胞cDNA文库(Miki,T.等人,Gene 83:137-146,1989)。从人胚肺成纤维细胞cDNA文库获得其中将827-bp片段插入到pCEV-LAC载体的全长PIG47 cDNA克隆,然后于2005年1月1日以收录号AY871272保存在美国GenBank数据库(预定发布日期:2006年10月1日)。AY871272基因的DNA序列与以收录号NM_001688保存在数据库中的ATP合酶,H+转运,线粒体F0复合物,亚基b,亚型1(ATP5F1)(ATP sythetase,H+transporting,mitochondria F0 complex,subunit b,isoform 1(ATP5F1))基因的相似。与以前报道的其功能相反,然而从本研究结果发现AY871272基因与尤其包括乳腺癌的多种肿瘤发生密切相关。作为研究结果,发现PIG47原癌基因在包括乳腺组织的多种正常人组织中很少表达,而在包括乳腺癌的多种癌组织中其表达明显升高。由827bp组成的PIG47的全长DNA序列在SEQ ID NO:49中示出。
在SEQ ID NO:49的DNA序列中,估计本发明的原癌基因的全长可读框对应于56~826的核苷酸序列位置,并且编码SEQ ID NO:50的由256个氨基酸组成的蛋白质。
6-14.PIG48
使用32P-标记的FC71作为探针以筛选噬菌体λgt11人胚肺成纤维细胞cDNA文库(Miki,T.等人,Gene 83:137-146,1989)。从人胚肺成纤维细胞cDNA文库获得其中将1,707-bp片段插入到pCEV-LAC载体的全长PIG48 cDNA克隆,然后于2004年1月12日以收录号AY524046保存在美国GenBank数据库(预定发布日期:2005年12月31日)。AY524046基因的DNA序列与以收录号NM_005998保存在数据库中的人类包含TCP1的陪伴蛋白,亚基3(γ)(CCT3)基因的相似。与以前报道的其功能相反,然而从本研究结果发现AY524046基因与尤其包括乳腺癌的多种肿瘤发生密切相关。作为研究结果,发现PIG48原癌基因在包括乳腺组织的多种正常人组织中很少表达,而在包括乳腺癌的多种癌组织中其表达明显升高。
由1,707bp组成的PIG48的全长DNA序列在SEQ ID NO:53中示出。
在SEQ ID NO:53的DNA序列中,估计本发明的原癌基因的全长可读框对应于57~1,694的核苷酸序列位置,并且编码SEQ ID NO:54的由545个氨基酸组成的蛋白质。
6-15.PIG50
使用32P-标记的BBCC5-5作为探针以筛选噬菌体λgt11人胚肺成纤维细胞cDNA文库(Miki,T.等人,Gene 83:137-146,1989)。从人胚肺成纤维细胞cDNA文库获得其中将643-bp片段插入到pCEV-LAC载体的全长PIG50cDNA克隆,然后于2004年2月5日以收录号AY542309保存在美国GenBank数据库(预定发布日期:2005年12月31日)。AY542309基因的DNA序列与以收录号AK000504保存在数据库中的人类cDNA FLJ20497 fis基因的相似。与以前报道的其功能相反,然而从本研究结果发现AY542309基因与尤其包括乳腺癌的多种肿瘤发生密切相关。作为研究结果,发现PIG50原癌基因在包括乳腺组织的多种正常人组织中很少表达,而在包括乳腺癌的多种癌组织中其表达明显升高。
由643bp组成的PIG50的全长DNA序列在SEQ ID NO:57中示出。
在SEQ ID NO:57的DNA序列中,估计本发明的原癌基因的全长可读框对应于2~595的核苷酸序列位置,并且编码SEQ ID NO:58的由197个氨基酸组成的蛋白质。
6-16.PIG54
使用32P-标记的HP15作为探针以筛选噬菌体λgt11人胚肺成纤维细胞cDNA文库(Miki,T.等人,Gene 83:137-146,1989)。从人胚肺成纤维细胞cDNA文库获得其中将1,936-bp片段插入到pCEV-LAC载体的全长PIG44 cDNA克隆,然后于2004年2月16日以收录号AY550968保存在美国GenBank数据库(预定发布日期:2005年12月31日)。AY550968基因的DNA序列与以收录号BC041361保存在数据库中的人类SCC-112蛋白质基因的相似。与以前报道的其功能相反,然而从本研究结果发现AY550968基因与尤其包括肝癌的多种肿瘤发生密切相关。作为研究结果,发现PIG54原癌基因在包括肝组织的多种正常人组织中很少表达,而在包括肝癌的多种癌组织中其表达明显升高。
由1,936bp组成的PIG54的全长DNA序列在SEQ ID NO:61中示出。
在SEQ ID NO:61的DNA序列中,估计本发明的原癌基因的全长可读框对应于38~1,840的核苷酸序列位置,并且编码SEQ ID NO:62的由600个氨基酸组成的蛋白质。
6-17.PIG55
使用32P-标记的FC4作为探针以筛选噬菌体λgt11人胚肺成纤维细胞cDNA文库(Miki,T.等人,Gene 83:137-146,1989)。从人胚肺成纤维细胞cDNA文库获得其中将526-bp片段插入到pCEV-LAC载体的全长PIG55 cDNA克隆,然后于2004年6月2日以收录号AY644767保存在美国GenBank数据库(预定发布日期:2005年12月31日)。AY644767基因的DNA序列与以收录号NM_007362保存在数据库中的20kDa人类核帽结合蛋白亚基2(NCBP2)基因的相似。与以前报道的其功能相反,然而从本研究结果发现AY644767基因与尤其包括乳腺癌的多种肿瘤发生密切相关。作为研究结果,发现PIG55原癌基因在包括乳腺组织的多种正常人组织中很少表达,而在包括乳腺癌的多种癌组织中其表达明显升高。
由526bp组成的PIG55的全长DNA序列在SEQ ID NO:65中示出。
在SEQ ID NO:65的DNA序列中,估计本发明的原癌基因的全长可读框对应于15~485的核苷酸序列位置,并且编码SEQ ID NO:66的由156个氨基酸组成的蛋白质。
6-18.GIG9
使用32P-标记的H148作为探针以筛选噬菌体λgt11人胚肺成纤维细胞cDNA文库(Miki,T.等人,Gene 83:137-146,1989)。从人胚肺成纤维细胞cDNA库获得其中将1,008-bp片段插入到pCEV-LAC载体的全长GIG9 cDNA克隆,然后于2003年10月29日以收录号AY453396保存在美国GenBank数据库(预定发布日期:2005年12月31日)。
将插入到λpCEV载体的GIG9克隆用限制性内切酶NotI酶切并以氨苄青霉素抗性pCEV-LAC噬菌粒载体的形式从噬菌体分离(Miki,T.等人,Gene 83:137-146,1989)。
通过T4 DNA连接酶连接含有GIG9基因的pCEV-LAC载体以制备GIG9质粒DNA,且然后用连接的克隆转化大肠杆菌DH5α。
由1,008bp组成的GIG9的全长DNA序列在SEQ ID NO:69中示出。
在SEQ ID NO:69的DNA序列中,估计本发明的原癌基因的全长可读框对应于1~1,008的核苷酸序列位置,并且编码SEQ ID NO:70的由335个氨基酸组成的蛋白质。
6-19.HLC-9
使用32P-标记的L738作为探针筛选噬菌体λgt11人胚肺成纤维细胞cDNA文库(Miki,T.等人,Gene 83:137-146,1989),从而得到含有L738 cDNA序列的全长基因。从人胚肺成纤维细胞cDNA文库获得两个全长基因;一个得到的基因为其中将1,382-bp片段插入到pCEV-LAC载体的全长HLC9 cDNA克隆,然后于2002年11月30日以收录号AY189686保存在美国GenBank数据库(预定发布日期:2004年5月1日)。
将插入到λpCEV载体的HLC9克隆用限制性内切酶NotI酶切并以氨苄青霉素抗性pCEV-LAC噬菌粒载体的形式从噬菌体分离(参加上述参考文献)。
通过T4 DNA连接酶连接含有HLC9基因的pCEV-LAC载体以制备HLC9质粒DNA,且然后用连接的克隆转化大肠杆菌DH5α。
由1,382bp组成的HLC9的全长DNA序列在SEQ ID NO:73中示出。
在SEQ ID NO:73的DNA序列中,估计本发明的原癌基因的全长可读框对应于27~1,370的核苷酸序列位置,并且编码SEQ ID NO:74的由447个氨基酸组成的蛋白质。
6-20.GIG18
使用32P-标记的HP47作为探针筛选噬菌体λgt11人胚肺成纤维细胞cDNA文库(Miki,T.等人,Gene 83:137-146,1989)。从人胚肺成纤维细胞cDNA文库获得其中将1,301-bp片段插入到pCEV-LAC载体的全长GIG18 cDNA克隆,然后于2003年12月24日以收录号AY513279保存在美国GenBank数据库(预定发布日期:2005年12月31日)。证实AY513279基因的DNA序列与以收录号NM_002079保存在数据库中的人类谷草转氨酶1,可溶(天冬氨酸转氨酶1)(GOT1)mRNA基因的相似。与以前报道的其功能相反,然而从本研究结果发现AY513279基因与尤其包括肝癌的多种肿瘤发生密切相关。作为研究结果,发现GIG18原癌基因在包括肝组织的多种正常人组织中很少表达,而在包括肝癌的多种癌组织中其表达明显升高。由1,301bp组成的GIG18的全长DNA序列在SEQ ID NO:77中示出。
在SEQ ID NO:77的DNA序列中,估计本发明的原癌基因的全长可读框对应于3~1,244的核苷酸序列位置,并且编码SEQ ID NO:78的由413个氨基酸组成的蛋白质。
6-21.MIG22
使用32P-标记的L690作为探针以筛选噬菌体λgt11人胚肺成纤维细胞cDNA文库(Miki,T.等人,Gene 83:137-146,1989)。从人胚肺成纤维细胞cDNA库获得其中将749-bp片段插入到pCEV-LAC载体的全长MIG22 cDNA克隆,然后于2004年10月5日以收录号AY771595保存在美国GenBank数据库(预定发布日期:2005年12月31日)。
将插入到λpCEV载体的MIG22克隆用限制性内切酶NotI酶切并以氨苄青霉素抗性pCEV-LAC噬菌粒载体的形式从噬菌体分离(Miki,T.等人,Gene83:137-146,1989)。
通过T4 DNA连接酶连接含有MIG22基因的pCEV-LAC载体以制备MIG22质粒DNA,且然后用连接的克隆转化大肠杆菌DH5α。
在SEQ ID NO:81的DNA序列中,估计本发明的原癌基因的全长可读框对应于15~734的核苷酸序列位置,并且编码SEQ ID NO:82的由239个氨基酸组成的蛋白质。
实施例7:多种细胞中原癌基因的RNA印迹分析
7-1.PIG12、PIG30、PIG31、PIG46、PIG47、PIG48、PIG50和PIG55
以与实施例1-1相同的方式从正常乳腺组织、乳腺癌组织和乳腺细胞系MCF-7中提取总RNA样品。
为了确定各PIG基因的表达水平,将20μg从各组织和细胞系中提取的变性的各总RNA样品在1%甲醛琼脂糖凝胶中电泳,且然后将得到的琼脂糖凝胶转移到尼龙膜(Boehringer-Mannheim,德国)上。然后将印迹与使用Rediprime II随机引物标记系统(Amersham,英国)制备的32P-标记的随机引物FC21 cDNA探针杂交。将RNA印迹分析重复两次,并因此将得到的印迹用光密度计定量并用β-肌动蛋白标准化。
图22显示确定PIG12原癌基因在正常乳腺组织、乳腺癌组织和乳腺癌细胞系(MCF-7)是否表达的RNA印迹结果。如图22所示,显示出在乳腺癌组织和乳腺癌细胞系MCF-7中MIG3原癌基因的表达水平明显升高,而在正常组织中表达水平非常低或检测不到。在图22中,“正常”泳道表示正常乳腺组织,“癌”泳道表示乳腺癌组织,以及“MCF-7”泳道表示乳腺癌细胞系。图22的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。
图43示出确定PIG12原癌基因在12-泳道正常人多种组织(Clontech),例如脑、心脏、横纹肌、大肠、胸腺、脾、肾、肝、小肠、胎盘、肺和外周血白细胞组织中是否表达的RNA印迹结果。图43的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图43所示,显示PIG12 mRNA转录物(大约2.0kb)在多种正常组织中不表达。
图64示出确定PIG12原癌基因在人癌细胞系,例如HL-60、HeLa、K-562、MOLT-4、Raji、SW480、A549和G361(Clontech)中是否表达的RNA印迹结果。图64的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图64所示,显示PIG12 mRNA转录物在HeLa子宫癌细胞系、慢性髓性白血病细胞系K-562、淋巴母细胞性白血病细胞系MOLT-4和伯基特淋巴瘤细胞系Raji中有非常高的表达,而在早幼粒细胞白血病细胞系HL-60、结肠癌细胞系SW480、皮肤癌细胞系G361和肺癌细胞系A549中不表达。
图27示出确定PIG30原癌基因在正常乳腺组织、乳腺癌组织和乳腺癌细胞系(MCF-7)中是否表达的RNA印迹结果。如图27所示,显示PIG30原癌基因在乳腺癌组织和乳腺癌细胞系MCF-7中的表达水平明显升高,而在正常组织中表达水平非常低或未检测到。在图27中,“正常”泳道表示正常乳腺组织,“癌”泳道表示乳腺癌组织,以及“MCF-7”泳道表示乳腺癌细胞系。图27的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。
图48示出确定PIG30原癌基因在12泳道正常人多种组织(Clontech),例如脑、心脏、横纹肌、大肠、胸腺、脾、肾、肝、小肠、胎盘、肺和外周血白细胞组织中是否表达的RNA印迹结果。图48的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图48所示,显示PIG30 mRNA转录物(大约3.5kb)在多种正常组织中很少表达。
图69示出确定PIG30原癌基因在人癌细胞系,例如HL-60、HeLa、K-562、MOLT-4、Raji、SW480、A549和G361(Clontech)中是否表达的RNA印迹结果。图69的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图69所示,显示PIG30 mRNA转录物在早幼粒细胞白血病细胞系HL-60、HeLa子宫癌细胞系、慢性髓性白血病细胞系K-562、淋巴母细胞性白血病细胞系MOLT-4、伯基特淋巴瘤细胞系Raji、结肠癌细胞系SW480、肺癌细胞系A549和皮肤癌细胞系G361中高表达。
图28示出确定PIG31原癌基因在正常乳腺组织、乳腺癌组织和乳腺癌细胞系(MCF-7)中是否表达的RNA印迹结果。如图28所示,显示PIG31原癌基因在乳腺癌组织和乳腺癌细胞系MCF-7中的表达水平明显升高,而在正常组织中表达水平非常低或未检测到。在图28中,“正常”泳道表示正常乳腺组织,“癌”泳道表示乳腺癌组织,以及“MCF-7”泳道表示乳腺癌细胞系。图28的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。
图49示出确定PIG31原癌基因在12泳道正常人多种组织(Clontech),例如脑、心脏、横纹肌、大肠、胸腺、脾、肾、肝、小肠、胎盘、肺和外周血白细胞组织中是否表达的RNA印迹结果。图49的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图49所示,显示PIG31 mRNA转录物(大约2.5kb)在多种正常组织中很少表达。
图70示出确定PIG31原癌基因在人癌细胞系,例如HL-60、HeLa、K-562、MOLT-4、Raji、SW480、A549和G361(Clontech)中是否表达的RNA印迹结果。图70的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图70所示,显示PIG31mRNA转录物在早幼粒细胞白血病细胞系HL-60、HeLa子宫癌细胞系、慢性髓性白血病细胞系K-562、淋巴母细胞性白血病细胞系MOLT-4、伯基特淋巴瘤细胞系Raji、结肠癌细胞系SW480、肺癌细胞系A549和皮肤癌细胞系G361中高表达。
图33示出确定PIG46原癌基因在正常乳腺组织、乳腺癌组织和乳腺癌细胞系(MCF-7)中是否表达的RNA印迹结果。如图33所示,显示PIG46原癌基因在乳腺癌组织和乳腺癌细胞系MCF-7中的表达水平明显升高,而在正常组织中表达水平非常低或未检测到。在图33中,“正常”泳道表示正常乳腺组织,“癌”泳道表示乳腺癌组织,以及“MCF-7”泳道表示乳腺癌细胞系。图33的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。
图54示出确定PIG46原癌基因在12泳道正常人多种组织(Clontech),例如脑、心脏、横纹肌、大肠、胸腺、脾、肾、肝、小肠、胎盘、肺和外周血白细胞组织中是否表达的RNA印迹结果。图54的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图54所示,显示PIG46 mRNA转录物(大约1.4kb)在多种正常组织中很少表达或不表达。
图75示出确定PIG46原癌基因在人癌细胞系,例如HL-60、HeLa、K-562、MOLT-4、Raji、SW480、A549和G361(Clontech)中是否表达的RNA印迹结果。图75的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图75所示,显示PIG46 mRNA转录物(大约1.4kb)在HeLa子宫癌细胞系、慢性髓性白血病细胞系K-562、结肠癌细胞系SW480和肺癌细胞系A549高表达,而在早幼粒细胞白血病细胞系HL-60、淋巴母细胞性白血病细胞系MOLT-4、伯基特淋巴瘤细胞系Raji和皮肤癌细胞系G361中不表达。
图34示出确定PIG47原癌基因在正常乳腺组织、乳腺癌组织和乳腺癌细胞系(MCF-7)中是否表达的RNA印迹结果。如图34所示,显示PIG47原癌基因在乳腺癌组织和乳腺癌细胞系MCF-7中的表达水平明显升高,而在正常组织中表达水平非常低或未检测到。在图34中,“正常”泳道表示正常乳腺组织,“癌”泳道表示乳腺癌组织,以及“MCF-7”泳道表示乳腺癌细胞系。图34的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。
图55示出确定PIG47原癌基因在12泳道正常人多种组织(Clontech),例如脑、心脏、横纹肌、大肠、胸腺、脾、肾、肝、小肠、胎盘、肺和外周血白细胞组织中是否表达的RNA印迹结果。图55的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图55所示,显示PIG47 mRNA转录物(大约1.3kb)在正常心脏和肌肉组织中表达,而在多种正常组织中很少表达。
图76示出确定PIG47原癌基因在人癌细胞系,例如HL-60、HeLa、K-562、MOLT-4、Raji、SW480、A549和G361(Clontech)中是否表达的RNA印迹结果。图76的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图76所示,显示PIG47 mRNA转录物在早幼粒细胞白血病细胞系HL-60、HeLa子宫癌细胞系、慢性髓性白血病细胞系K-562、淋巴母细胞性白血病细胞系MOLT-4和伯基特淋巴瘤细胞系Raji高表达,而在结肠癌细胞系SW480、肺癌细胞系A549和皮肤癌细胞系G361中不表达。
图35示出确定PIG48原癌基因在正常乳腺组织、乳腺癌组织和乳腺癌细胞系(MCF-7)中是否表达的RNA印迹结果。如图35所示,显示PIG48原癌基因在乳腺癌组织和乳腺癌细胞系MCF-7中的表达水平明显升高,而在正常组织中表达水平非常低或未检测到。在图35中,“正常”泳道表示正常乳腺组织,“癌”泳道表示乳腺癌组织,以及“MCF-7”泳道表示乳腺癌细胞系。图35的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。
图56示出确定PIG48原癌基因在12泳道正常人多种组织(Clontech),例如脑、心脏、横纹肌、大肠、胸腺、脾、肾、肝、小肠、胎盘、肺和外周血白细胞组织中是否表达的RNA印迹结果。图56的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图56所示,显示PIG48 mRNA转录物(大约2.0kb)在多种正常组织中很少表达或不表达。
图77示出确定PIG48原癌基因在人癌细胞系,例如HL-60、HeLa、K-562、MOLT-4、Raji、SW480、A549和G361(Clontech)中是否表达的RNA印迹结果。图77的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图77所示,显示PIG48 mRNA转录物在早幼粒细胞白血病细胞系HL-60、HeLa子宫癌细胞系、慢性髓性白血病细胞系K-562、淋巴母细胞性白血病细胞系MOLT-4、伯基特淋巴瘤细胞系Raji结肠癌细胞系SW480、肺癌细胞系A549和皮肤癌细胞系G361中表达非常高。
图36示出确定PIG50原癌基因在正常乳腺组织、乳腺癌组织和乳腺癌细胞系(MCF-7)中是否表达的RNA印迹结果。如图36所示,显示PIG50原癌基因在乳腺癌组织和乳腺癌细胞系MCF-7中的表达水平明显升高,而在正常组织中表达水平未检测到。在图36中,“正常”泳道表示正常乳腺组织,“癌”泳道表示乳腺癌组织,以及“MCF-7”泳道表示乳腺癌细胞系。图36的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。
图57示出确定PIG50原癌基因在12泳道正常人多种组织(Clontech),例如脑、心脏、横纹肌、大肠、胸腺、脾、肾、肝、小肠、胎盘、肺和外周血白细胞组织中是否表达的RNA印迹结果。图57的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图57所示,显示PIG50 mRNA转录物(大约1.0kb)在多种正常组织中很少表达或不表达。而且,同时也显示具有大约5.0kb大小的PIG50 mRNA转录物很少表达。
图78示出确定PIG50原癌基因在人癌细胞系,例如HL-60、HeLa、K-562、MOLT-4、Raji、SW480、A549和G361(Clontech)中是否表达的RNA印迹结果。图78的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图78所示,显示PIG50mRNA转录物在早幼粒细胞白血病细胞系HL-60、HeLa子宫癌细胞系、慢性髓性白血病细胞系K-562、淋巴母细胞性白血病细胞系MOLT-4、伯基特淋巴瘤细胞系Raji、结肠癌细胞系SW480、肺癌细胞系A549和皮肤癌细胞系G361高表达。而且,同时也显示具有大约5.0kb大小的PIG50 mRNA转录物高表达。
图38示出确定PIG55原癌基因在正常乳腺组织、乳腺癌组织和乳腺癌细胞系(MCF-7)中是否表达的RNA印迹结果。如图38所示,显示PIG55原癌基因在乳腺癌组织和乳腺癌细胞系MCF-7中的表达水平明显升高,而在正常组织中表达水平非常低或未检测到。在图38中,“正常”泳道表示正常乳腺组织,“癌”泳道表示乳腺癌组织,以及“MCF-7”泳道表示乳腺癌细胞系。图38的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。
图59示出确定PIG55原癌基因在12泳道正常人多种组织(Clontech),例如脑、心脏、横纹肌、大肠、胸腺、脾、肾、肝、小肠、胎盘、肺和外周血白细胞组织中是否表达的RNA印迹结果。图59的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图59所示,显示PIG55 mRNA转录物(大约3.0kb)在多种正常组织中很少表达或不表达。
图80示出确定PIG55原癌基因在人癌细胞系,例如HL-60、HeLa、K-562、MOLT-4、Raji、SW480、A549和G361(Clontech)中是否表达的RNA印迹结果。图80的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图80所示,显示PIG55mRNA转录物在早幼粒细胞白血病细胞系HL-60、HeLa子宫癌细胞系、慢性髓性白血病细胞系K-562、淋巴母细胞性白血病细胞系MOLT-4、伯基特淋巴瘤细胞系Raji、结肠癌细胞系SW480、肺癌细胞系A549和皮肤癌细胞系G361高表达。
7-2.PIG18、PIG23、PIG27、PIG28和GIG9
以与实施例1-2相同的方式从正常外宫颈组织、子宫颈癌组织、宫颈部淋巴结转移性组织和子宫颈癌细胞系CaSki(ATCC CRL 1550)和CUMC-6中提取总RNA样品。
为了确定各PIG或GIG基因的表达水平,将20μg从组织和细胞系中提取的变性的各总RNA样品在1%甲醛琼脂糖凝胶中电泳,且然后将得到的琼脂糖凝胶转移到尼龙膜(Boehringer-Mannheim,德国)。然后将印迹与使用Rediprime II随机引物标记系统(Amersham,英国)制备的32P-标记的随机引物全长PIG23 cDNA探针杂交。将RNA印迹分析重复两次,且然后将得到的印迹用光密度计定量并用β-肌动蛋白标准化。
图23显示确定PIG18原癌基因在正常外宫颈组织、子宫颈癌组织、宫颈部淋巴结转移性组织和子宫颈癌细胞系(CaSki和CUMC-6)是否表达的RNA印迹结果。如图23所示,显示PIG18原癌基因的表达水平升高,即,具有大约5.0kb大小的优势PIG18 mRNA转录物在子宫颈癌组织和子宫颈癌细胞系CaSki和CUMC-6中过表达。在图23中,“正常”泳道表示正常外宫颈组织,“癌”泳道表示子宫颈癌组织,“转移”泳道表示宫颈部淋巴结转移性组织,以及“CaSki”和“CUMC-6”泳道各表示子宫癌细胞系。图23的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。
图44示出确定PIG18原癌基因在12-泳道正常人多种组织(Clontech),例如脑、心脏、横纹肌、大肠、胸腺、脾、肾、肝、小肠、胎盘、肺和外周血白细胞组织中是否表达的RNA印迹结果。图44的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图44所示,显示PIG18 mRNA转录物(具有大约5.0kb大小的优势PIG18mRNA转录物)在正常组织,如脑、心脏、肌肉、大肠、胸腺、脾、肾、肝、小肠、胎盘、肺和外周血白细胞中很少表达或不表达。而且,同时显示具有大约3.0kb大小的PIG18 mRNA转录物在正常心脏中很少表达。
图65示出确定PIG18原癌基因在人癌细胞系,例如HL-60、HeLa、K-562、MOLT-4、Raji、SW480、A549和G361(Clontech)中是否表达的RNA印迹结果。图65的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图65所示,显示PIG18 mRNA转录物(具有大约5.0kb大小的优势PIG18 mRNA转录物)在早幼粒细胞白血病细胞系HL-60、HeLa子宫癌细胞系、慢性髓性白血病细胞系K-562、淋巴母细胞性白血病细胞系MOLT-4、伯基特淋巴瘤细胞系Raji、结肠癌细胞系SW480、肺癌细胞系A549和皮肤癌细胞系G361中有非常高的表达。而且,显示具有3.0kb大小的PIG18 mRNA转录物同时在HeLa子宫癌细胞系、慢性髓性白血病细胞系K-562、淋巴母细胞性白血病细胞系MOLT-4中以升高的水平表达。
图24显示确定PIG23原癌基因在正常外宫颈组织、子宫颈癌组织、宫颈部淋巴结转移性组织和子宫颈癌细胞系(CaSki和CUMC-6)是否表达的RNA印迹结果。如图24所示,显示PIG23原癌基因的表达水平升高,即,具有大约4.5kb大小的优势PIG23 mRNA转录物在子宫颈癌组织、宫颈部淋巴结转移性组织和子宫颈癌细胞系CaSki和CUMC-6中过表达。在图24中,“正常”泳道表示正常外宫颈组织,“癌”泳道表示子宫颈癌组织,“转移”泳道表示宫颈部淋巴结转移性组织,以及“CaSki”和“CUMC-6”泳道各表示子宫癌细胞系。图24的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。
图45示出确定PIG23原癌基因在12-泳道正常人多种组织(Clontech),例如脑、心脏、横纹肌、大肠、胸腺、脾、肾、肝、小肠、胎盘、肺和外周血白细胞组织中是否表达的RNA印迹结果。图45的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图45所示,显示PIG18 mRNA转录物(具有大约4.5kb大小的优势PIG18mRNA转录物)在正常组织,如脑、心脏、肌肉、大肠、胸腺、脾、肾、肝、小肠、胎盘、肺和外周血白细胞中很少表达或不表达。
图66示出确定PIG23原癌基因在人癌细胞系,例如HL-60、HeLa、K-562、MOLT-4、Raji、SW480、A549和G361(Clontech)中是否表达的RNA印迹结果。图66的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图66所示,显示PIG23mRNA转录物(具有大约4.5kb大小的优势PIG23 mRNA转录物)在HeLa子宫癌细胞系、慢性髓性白血病细胞系K-562、淋巴母细胞性白血病细胞系MOLT-4、伯基特淋巴瘤细胞系Raji、结肠癌细胞系SW480、肺癌细胞系A549和皮肤癌细胞系G361中有非常高的表达。而且,显示具有大约7.0kb和2.0kb大小的PIG23mRNA转录物同时在HeLa子宫癌细胞系、慢性髓性白血病细胞系K-562、淋巴母细胞性白血病细胞系MOLT-4、伯基特淋巴瘤细胞系Raji、结肠癌细胞系SW480、肺癌细胞系A549和皮肤癌细胞系G361中以升高的水平表达。
图25显示确定PIG27原癌基因在正常外宫颈组织、子宫颈癌组织、宫颈部淋巴结转移性组织和子宫颈癌细胞系(CaSki和CUMC-6)是否表达的RNA印迹结果。如图25所示,显示PIG27原癌基因的表达水平升高,即,具有大约1.5kb大小的优势PIG27 mRNA转录物在子宫颈癌组织和子宫颈癌细胞系CaSki和CUMC-6中过表达。在图25中,“正常”泳道表示正常外宫颈组织,“癌”泳道表示子宫颈癌组织,“转移”泳道表示宫颈部淋巴结转移性组织,以及“CaSki”和“CUMC-6”泳道各表示子宫癌细胞系。图25的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。
图46示出确定PIG27原癌基因在12-泳道正常人多种组织(Clontech),例如脑、心脏、横纹肌、大肠、胸腺、脾、肾、肝、小肠、胎盘、肺和外周血白细胞组织中是否表达的RNA印迹结果。图46的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图46所示,显示PIG27 mRNA转录物(具有大约1.5kb大小的优势PIG27mRNA转录物)在正常组织,如脑、心脏、肌肉、大肠、胸腺、脾、肾、肝、小肠、胎盘、肺和外周血白细胞中很少表达。
图67示出确定PIG27原癌基因在人癌细胞系,例如HL-60、HeLa、K-562、MOLT-4、Raji、SW480、A549和G361(Clontech)中是否表达的RNA印迹结果。图67的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图67所示,显示PIG27 mRNA转录物(具有大约1.5kb大小的优势PIG27 mRNA转录物)在早幼粒细胞白血病细胞系HL-60、HeLa子宫癌细胞系、慢性髓性白血病细胞系K-562、淋巴母细胞性白血病细胞系MOLT-4、伯基特淋巴瘤细胞系Raji、结肠癌细胞系SW480、肺癌细胞系A549和皮肤癌细胞系G361中有非常高的表达。
图26显示确定PIG28原癌基因在正常外宫颈组织、子宫颈癌组织、宫颈部淋巴结转移性组织和子宫颈癌细胞系(CaSki和CUMC-6)是否表达的RNA印迹结果。如图26所示,显示PIG28原癌基因的表达水平升高,即,具有大约1.5kb大小的优势PIG28 mRNA转录物在子宫颈癌组织和子宫颈癌细胞系CaSki和CUMC-6中过表达。在图26中,“正常”泳道表示正常外宫颈组织,“癌”泳道表示子宫颈癌组织,“转移”泳道表示宫颈部淋巴结转移性组织,以及“CaSki”和“CUMC-6”泳道各表示子宫癌细胞系。图26的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。
图47示出确定PIG28原癌基因在12-泳道正常人多种组织(Clontech),例如脑、心脏、横纹肌、大肠、胸腺、脾、肾、肝、小肠、胎盘、肺和外周血白细胞组织中是否表达的RNA印迹结果。图47的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图47所示,显示PIG28 mRNA转录物(具有大约1.5kb大小的优势PIG28mRNA转录物)在正常组织,如脑、心脏、肌肉、大肠、胸腺、脾、肾、肝、小肠、胎盘、肺和外周血白细胞中很少表达或不表达。而且,显示具有大约2.2kb大小的PIG28 mRNA转录物同时在正常组织,如脑、心脏、肌肉、大肠、胸腺、脾、肾、肝、小肠、胎盘、肺和外周血白细胞中很少表达或不表达。
图68示出确定PIG28原癌基因在人癌细胞系,例如HL-60、HeLa、K-562、MOLT-4、Raji、SW480、A549和G361(Clontech)中是否表达的RNA印迹结果。图68的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图68所示,显示PIG28 mRNA转录物(具有大约1.5kb大小的优势PIG28 mRNA转录物)在早幼粒细胞白血病细胞系HL-60、HeLa子宫癌细胞系、慢性髓性白血病细胞系K-562、淋巴母细胞性白血病细胞系MOLT-4、伯基特淋巴瘤细胞系Raji、结肠癌细胞系SW480、肺癌细胞系A549和皮肤癌细胞系G361中有非常高的表达。而且,显示2.2kb大小的PIG28 mRNA转录物同时在早幼粒细胞白血病细胞系HL-60、HeLa子宫癌细胞系、慢性髓性白血病细胞系K-562、淋巴母细胞性白血病细胞系MOLT-4、伯基特淋巴瘤细胞系Raji、结肠癌细胞系SW480、肺癌细胞系A549和皮肤癌细胞系G361中以升高的水平的表达。
图39显示确定GIG9原癌基因在正常外宫颈组织、子宫颈癌组织、宫颈部淋巴结转移性组织和子宫颈癌细胞系(CaSki和CUMC-6)是否表达的RNA印迹结果。如图39所示,显示GIG9原癌基因的表达水平升高,即,具有大约1.5kb大小的优势GIG9 mRNA转录物在子宫颈癌组织和子宫颈癌细胞系CaSki和CUMC-6中过表达。在图39中,“正常”泳道表示正常外宫颈组织,“癌”泳道表示子宫颈癌组织,“转移”泳道表示宫颈部淋巴结转移性组织,以及“CaSki”和“CUMC-6”泳道各表示子宫癌细胞系。图39的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。
图60示出确定GIG9原癌基因在12-泳道正常人多种组织(Clontech),例如脑、心脏、横纹肌、大肠、胸腺、脾、肾、肝、小肠、胎盘、肺和外周血白细胞组织中是否表达的RNA印迹结果。图60的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图60所示,显示GIG9 mRNA转录物(具有大约1.5kb大小的优势GIG9mRNA转录物)在正常组织,如脑、心脏、肌肉、大肠、胸腺、脾、肾、肝、小肠、胎盘、肺和外周血白细胞中很少表达。
图81示出确定GIG9原癌基因在人癌细胞系,例如HL-60、HeLa、K-562、MOLT-4、Raji、SW480、A549和G361(Clontech)中是否表达的RNA印迹结果。图81的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图81所示,显示GIG9 mRNA转录物(具有大约1.5kb大小的优势GIG9 mRNA转录物)在早幼粒细胞白血病细胞系HL-60、HeLa子宫癌细胞系、慢性髓性白血病细胞系K-562、淋巴母细胞性白血病细胞系MOLT-4、伯基特淋巴瘤细胞系Raji、结肠癌细胞系SW480、肺癌细胞系A549和皮肤癌细胞系G361中有非常高的表达。
7-3.PIG38、PIG43、PIG44、PIG54和GIG18
以与实施例1-3相同的方式从正常肝组织、肝癌组织和肝癌细胞系HepG2中提取总RNA样品。
为了确定各PIG基因的表达水平,将20μg从组织和细胞系中提取的变性的各总RNA样品在1%甲醛琼脂糖凝胶中电泳,且然后将得到的琼脂糖凝胶转移到尼龙膜(Boehringer-Mannheim,德国)。然后将印迹与使用Rediprime II随机引物标记系统(Amersham,英国)制备的32P-标记的随机引物HP103 cDNA探针杂交。将RNA印迹分析重复两次,并然后将得到的印迹用光密度计定量并用β-肌动蛋白标准化。
图29显示确定PIG38原癌基因在正常肝组织、肝癌组织和肝癌细胞系(HepG2)是否表达的RNA印迹结果。如图29所示,显示出在肝癌组织和肝癌细胞系HepG2中PIG38原癌基因高表达,而在正常组织中不表达或很少表达。图29的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。
图50示出确定PIG38原癌基因在12-泳道正常人多种组织(Clontech),例如脑、心脏、横纹肌、大肠、胸腺、脾、肾、肝、小肠、胎盘、肺和外周血白细胞组织中是否表达的RNA印迹结果。图50的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图50所示,显示PIG38 mRNA转录物(大约1.5kb)在如肝组织的多种正常组织中不表达或很少表达。图71示出确定PIG38原癌基因在人癌细胞系,例如HL-60、HeLa、K-562、MOLT-4、Raji、SW480、A549和G361(Clontech)中是否表达的RNA印迹结果。图71的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图71所示,显示PIG38 mRNA转录物(大约1.5kb)在早幼粒细胞白血病细胞系HL-60、HeLa子宫癌细胞系、慢性髓性白血病细胞系K-562、淋巴母细胞性白血病细胞系MOLT-4、伯基特淋巴瘤细胞系Raji、结肠癌细胞系SW480、肺癌细胞系A549和皮肤癌细胞系G361中高表达。而且,显示另外的具有大约2.5kb、3kb和4.5kb大小的PIG38 mRNA转录物同时在癌细胞系中表达。
图31显示确定PIG43原癌基因在正常肝组织、肝癌组织和肝癌细胞系(HepG2)是否表达的RNA印迹结果。如图31所示,显示出在肝癌组织和肝癌细胞系HepG2中PIG43原癌基因高表达,而在正常组织中不表达或很少表达。图31的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。
图52示出确定PIG43原癌基因在12-泳道正常人多种组织(Clontech),例如脑、心脏、横纹肌、大肠、胸腺、脾、肾、肝、小肠、胎盘、肺和外周血白细胞组织中是否表达的RNA印迹结果。图52的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图52所示,显示PIG43 mRNA转录物(大约3.0kb)在如肝组织的多种正常组织中不表达或很少表达。图73示出确定PIG43原癌基因在人癌细胞系,例如HL-60、HeLa、K-562、MOLT-4、Raji、SW480、A549和G361(Clontech)中是否表达的RNA印迹结果。图73的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图73所示,显示PIG43 mRNA转录物在早幼粒细胞白血病细胞系HL-60、HeLa子宫癌细胞系、慢性髓性白血病细胞系K-562、淋巴母细胞性白血病细胞系MOLT-4、结肠癌细胞系SW480和皮肤癌细胞系G361中高表达,而在伯基特淋巴瘤细胞系Raji和肺癌细胞系A549中不表达。
图32显示确定PIG44原癌基因在正常肝组织、肝癌组织和肝癌细胞系(HepG2)是否表达的RNA印迹结果。如图32所示,显示出在肝癌组织和肝癌细胞系HepG2中PIG44原癌基因高表达,而在正常组织中不表达或很少表达。图32的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。
图53示出确定PIG44原癌基因在12-泳道正常人多种组织(Clontech),例如脑、心脏、横纹肌、大肠、胸腺、脾、肾、肝、小肠、胎盘、肺和外周血白细胞组织中是否表达的RNA印迹结果。图53的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图53所示,显示PIG44 mRNA转录物(大约4.5kb)在如肝组织的多种正常组织中不表达或很少表达,但只在正常心脏和肌肉中很少表达。而且,显示具有大约5.0kb大小的PIG38 mRNA转录物在正常心脏和肌肉中很少表达。图74示出确定PIG38原癌基因在人癌细胞系,例如HL-60、HeLa、K-562、MOLT-4、Raji、SW480、A549和G361(Clontech)中是否表达的RNA印迹结果。图74的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图74所示,显示PIG44 mRNA转录物在早幼粒细胞白血病细胞系HL-60、HeLa子宫癌细胞系、慢性髓性白血病细胞系K-562、淋巴母细胞性白血病细胞系MOLT-4、伯基特淋巴瘤细胞系Raji、结肠癌细胞系SW480、肺癌细胞系A549和皮肤癌细胞系G361中高表达。而且,显示具有大约5.0kb大小的PIG44 mRNA转录物同时表达。
图37显示确定PIG54原癌基因在正常肝组织、肝癌组织和肝癌细胞系(HepG2)是否表达的RNA印迹结果。如图37所示,显示出在肝癌组织和肝癌细胞系HepG2中PIG38原癌基因高表达,而在正常组织中不表达或很少表达。图37的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。
图58示出确定PIG54原癌基因在12-泳道正常人多种组织(Clontech),例如脑、心脏、横纹肌、大肠、胸腺、脾、肾、肝、小肠、胎盘、肺和外周血白细胞组织中是否表达的RNA印迹结果。图58的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图58所示,显示PIG54 mRNA转录物(大约7.0kb)在如肝组织的多种正常组织中不表达或很少表达。而且,显示具有大约9.0kb大小的PIG54 mRNA转录物同时很少表达。图79示出确定PIG38原癌基因在人癌细胞系,例如HL-60、HeLa、K-562、MOLT-4、Raji、SW480、A549和G361(Clontech)中是否表达的RNA印迹结果。图79的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图79所示,显示PIG54 mRNA转录物在早幼粒细胞白血病细胞系HL-60、HeLa子宫癌细胞系、慢性髓性白血病细胞系K-562、淋巴母细胞性白血病细胞系MOLT-4、伯基特淋巴瘤细胞系Raji、结肠癌细胞系SW480、肺癌细胞系A549和皮肤癌细胞系G361中高表达。而且,显示具有大约9.0kb和3.0kb大小的PIG54mRNA转录物同时表达。
图41显示确定GIG18原癌基因在正常肝组织、肝癌组织和肝癌细胞系(HepG2)是否表达的RNA印迹结果。如图41所示,显示出在肝癌组织和肝癌细胞系HepG2中GIG18原癌基因高表达,而在正常组织中很少表达。图41的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。
图62示出确定GIG18原癌基因在12-泳道正常人多种组织(Clontech),例如脑、心脏、横纹肌、大肠、胸腺、脾、肾、肝、小肠、胎盘、肺和外周血白细胞组织中是否表达的RNA印迹结果。图62的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图62所示,显示GIG18 mRNA转录物(大约2.2kb)在如肝组织的多种正常组织中不表达或很少表达。而且,显示具有大约2.0kb大小的GIG18mRNA转录物同时很少表达。图83示出确定GIG18原癌基因在人癌细胞系,例如HL-60、HeLa、K-562、MOLT-4、Raji、SW480、A549和G361(Clontech)中是否表达的RNA印迹结果。图83的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图83所示,显示GIG18 mRNA转录物(大约2.2kb)在早幼粒细胞白血病细胞系HL-60、HeLa子宫癌细胞系、慢性髓性白血病细胞系K-562、淋巴母细胞性白血病细胞系MOLT-4、伯基特淋巴瘤细胞系Raji、结肠癌细胞系SW480、肺癌细胞系A549和皮肤癌细胞系G361中高表达。而且,显示具有大约2.0kb大小的GIG18 mRNA转录物同时在癌细胞系高表达。
7-4.PIG40
以与实施例1-4相同的方式从正常外周血组织、白血病组织和K-562细胞中提取总RNA样品。
为了确定PIG40基因的表达水平,将20μg从组织和细胞系中提取的变性的各总RNA样品在1%甲醛琼脂糖凝胶中电泳,且然后将得到的琼脂糖凝胶转移到尼龙膜(Boehringer-Mannheim,德国)。然后将印迹与使用Rediprime II随机引物标记系统(Amersham,英国)制备的32P-标记的随机引物全长PIG40cDNA探针杂交。将RNA印迹分析重复两次,并然后将得到的印迹用光密度计定量并用β-肌动蛋白标准化。
图30显示确定PIG40原癌基因在正常外周血组织、白血病组织和K-562细胞是否表达的RNA印迹结果。如图30所示,显示出PIG40原癌基因的表达水平升高,即,具有2.5kb大小的优势PIG40 mRNA转录物在白血病组织和K-562细胞系中过表达。在图30中,“正常”泳道表示正常外周血组织,“癌”泳道表示白血病组织,以及“K562”泳道表示白血病细胞系。图30的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。
图51示出确定PIG40原癌基因在12-泳道正常人多种组织(Clontech),例如脑、心脏、横纹肌、大肠、胸腺、脾、肾、肝、小肠、胎盘、肺和外周血白细胞组织中是否表达的RNA印迹结果。图51的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图51所示,显示PIG40 mRNA转录物(具有大约2.5kb大小的优势PIG40mRNA转录物)在多种正常组织,如脑、心脏、肌肉、大肠、胸腺、脾、肾、肝、小肠、胎盘、肺和外周血白细胞组织中很少表达或不表达。
图72示出确定PIG40原癌基因在人癌细胞系,例如HL-60、HeLa、K-562、MOLT-4、Raji、SW480、A549和G361(Clontech)中是否表达的RNA印迹结果。图72的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图72所示,显示PIG40 mRNA转录物(具有大约2.5kb大小的优势PIG40 mRNA转录物)在HeLa子宫癌细胞系、慢性髓性白血病细胞系K-562、淋巴母细胞性白血病细胞系MOLT-4、伯基特淋巴瘤细胞系Raji、结肠癌细胞系SW480、肺癌细胞系A549和皮肤癌细胞系G361中高表达。而且,显示具有大约2.0kb大小的PIG40 mRNA转录物同时在早幼粒细胞白血病细胞系HL-60、HeLa子宫癌细胞系、慢性髓性白血病细胞系K-562、淋巴母细胞性白血病细胞系MOLT-4、伯基特淋巴瘤细胞系Raji、结肠癌细胞系SW480、肺癌细胞系A549和皮肤癌细胞系G361中以升高的水平表达。
7-5.HLC-9和MIG22
以与实施例1相同的方式从正常肺组织、左肺癌组织、从左肺转移道右肺的转移性肺癌组织以及肺癌细胞系A549、NCI-H2009(美国典型培养物保藏中心;ATCC号CRL-5911)和NCI-H441(美国典型培养物保藏中心;ATCC号HTB-174)中提取总RNA样品。
为了确定各HLC9或MIG22基因的表达水平,将20μg从组织和细胞系中提取的变性的各总RNA样品在1%甲醛琼脂糖凝胶中电泳,且然后将得到的琼脂糖凝胶转移到尼龙膜(Boehringer-Mannheim,德国)。然后将印迹与使用Rediprime II随机引物标记系统(Amersham,英国)制备的32P-标记的随机引物部分L738或L690 cDNA探针杂交。将RNA印迹分析重复两次,并然后将得到的印迹用光密度计定量并用β-肌动蛋白标准化。
图40显示确定HLC9原癌基因在正常肺组织、肺癌组织、转移性肺癌组织和肺癌细胞系(A549、NCI-H2009和NCI-H441)是否表达的RNA印迹结果。如图40所示,显示HLC9原癌基因在肺癌组织、转移性肺癌组织和肺癌细胞系A549、NCI-H2009和NCI-H441中高表达,而在正常肺组织中很少表达或不表达。在图40中,“正常”泳道表示正常肺组织,“癌”泳道表示肺癌组织,“转移”泳道表示转移性肺癌组织,以及“A549”、“NCI-H2009”和“NCI-H441”泳道表示肺癌细胞系。图40的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。
图61示出确定HLC9原癌基因在12-泳道正常人多种组织(Clontech),例如脑、心脏、横纹肌、大肠、胸腺、脾、肾、肝、小肠、胎盘、肺和外周血白细胞组织中是否表达的RNA印迹结果。图61的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图61所示,显示HLC9 mRNA转录物(大约2.5kb)在如肌肉、心脏和胎盘的正常组织中表达,且在其它正常组织中非常表达或不表达。而且,显示具有大约4.4kb大小的另一个HLC9 mRNA转录物同时在正常组织中很少表达或不表达。
图82示出确定HLC9原癌基因在人癌细胞系,例如HL-60、HeLa、K-562、MOLT-4、Raji、SW480、A549和G361(Clontech)中是否表达的RNA印迹结果。图82的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图82所示,显示HLC9 mRNA转录物(大约1.5kb)在早幼粒细胞白血病细胞系HL-60、HeLa子宫癌细胞系、慢性髓性白血病细胞系K-562、淋巴母细胞性白血病细胞系MOLT-4、伯基特淋巴瘤细胞系Raji、结肠癌细胞系SW480、肺癌细胞系A549和皮肤癌细胞系G361中高表达。而且,显示另外的具有4.4kb的另一个HLC9 mRNA转录物同时在癌细胞系中高表达。
图42显示确定MIG22原癌基因在正常肺组织、肺癌组织、转移性肺癌组织和肺癌细胞系(A549和NCI-H358)是否表达的RNA印迹结果。如图42所示,显示MIG22原癌基因在肺癌组织、转移性肺癌组织和肺癌细胞系A549和NCI-H358中高表达,而在正常肺组织中很少表达或不表达。在图42中,“正常”泳道表示正常肺组织,“癌”泳道表示肺癌组织,“转移”泳道表示转移性肺癌组织,以及“A549”和“NCI-H358”泳道表示肺癌细胞系。图42的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。
图63示出确定MIG22原癌基因在12-泳道正常人多种组织(Clontech),例如脑、心脏、横纹肌、大肠、胸腺、脾、肾、肝、小肠、胎盘、肺和外周血白细胞组织中是否表达的RNA印迹结果。图63的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图63所示,显示MIG22 mRNA转录物(具有大约1.0kb大小的转录物)在正常组织中很少表达或不表达。
图84示出确定MIG22原癌基因在人癌细胞系,例如HL-60、HeLa、K-562、MOLT-4、Raji、SW480、A549和G361(Clontech)中是否表达的RNA印迹结果。图84的底部示出通过使相同样品和β-肌动蛋白探针杂交而表明β-肌动蛋白mRNA是否转录的RNA印迹结果。如图84所示,显示MIG22 mRNA转录物(具有大约1.0kb大小的优势转录物和具有大约5.0kb和8.0kb大小的另外的转录物)在早幼粒细胞白血病细胞系HL-60、HeLa子宫癌细胞系、慢性髓性白血病细胞系K-562、淋巴母细胞性白血病细胞系MOLT-4、伯基特淋巴瘤细胞系Raji、结肠癌细胞系SW480、肺癌细胞系A549和皮肤癌细胞系G361中有非常高的表达。
实施例8:用原癌基因转化大肠杆菌后表达的蛋白质大小的确定
将各SEQ ID NO:1的PIG12原癌基因;SEQ ID NO:5的PIG18原癌基因;SEQ ID NO:9的PIG23原癌基因;SEQ ID NO:13的PIG27原癌基因;SEQ IDNO:17的PIG28原癌基因;SEQ ID NO:21的PIG30原癌基因;SEQ ID NO:25的PIG31原癌基因;SEQ ID NO:29的PIG38原癌基因;SEQ ID NO:33的PIG40原癌基因;SEQ ID NO:37的PIG43原癌基因;SEQ ID NO:41的PIG44原癌基因;SEQ ID NO:45的PIG46原癌基因;SEQ ID NO:49的PIG47原癌基因;SEQ ID NO:53的PIG48原癌基因;SEQ ID NO:57的PIG50原癌基因;SEQ ID NO:61的PIG54原癌基因;SEQ ID NO:65的PIG55原癌基因;SEQID NO:69的GIG9原癌基因;SEQ ID NO:73的HLC-9原癌基因;SEQ ID NO:77的GIG18原癌基因以及SEQ ID NO:81的MIG22原癌基因插入到pBAD/thio-TOPO载体(Invitrogen)的多克隆位点,且然后用各得到的表达载体转化大肠杆菌。将各转化的大肠杆菌菌株在LB培养基中振荡培养,然后将得到的各培养物以1/100的比率稀释并再培养3小时。向其中加入1mM异丙基β-D-硫代半乳糖吡喃糖苷(IPTG,Sigma)以促进其蛋白质的产生。在IPTG诱导前/后将大肠杆菌细胞在培养基中超声处理,然后将超声处理的匀浆进行12%十二烷基硫酸钠-聚丙烯酰胺凝胶电泳(SDS-PAGE)。根据引用的参考文献(Sambrook,J.等人,Molecular Cloning:A Laboratory manual,纽约:冷泉港实验室(1989))中描述的方法,在从培养基得到蛋白质样品后进行SDS-PAGE。
图85为示出PIG12蛋白质的SDS-PAGE分析结果的图。在图85中,泳道1表示IPTG诱导前的蛋白质样品,且泳道2表示由IPTG诱导的PIG12基因表达后的蛋白质样品。如图85所示,表达的PIG12蛋白质具有大约46kDa的分子量,其对应于来自其DNA序列的分子量。
图86示出确定在用pBAD/thio-Topo/PIG18载体转化的大肠杆菌Top10菌株中的蛋白质表达模式的SDS-PAGE结果,其中在L-阿拉伯糖诱导后清楚地观察到具有大约22kDa分子量的融合蛋白条带。15-kDa融合蛋白包括具有大约15kDa分子量的HT-硫氧还蛋白和具有大约7kDa分子量的PIG18蛋白质,各被插入到pBAD/thio-Topo/PIG18载体中的蛋白质。
图87示出确定在用pBAD/thio-Topo/PIG28载体转化的大肠杆菌Top10菌株中的蛋白质表达模式的SDS-PAGE结果,其中在L-阿拉伯糖诱导后清楚地观察到具有大约85kDa分子量的融合蛋白条带。85-kDa融合蛋白包括具有大约15kDa分子量的HT-硫氧还蛋白和具有大约70kDa分子量的PIG23蛋白质,各被插入到pBAD/thio-Topo/PIG23载体中的蛋白质。
图88示出确定在用pBAD/thio-Topo/PIG27载体转化的大肠杆菌Top10菌株中的蛋白质表达模式的SDS-PAGE结果,其中在L-阿拉伯糖诱导后清楚地观察到具有大约27kDa分子量的融合蛋白条带。27-kDa融合蛋白包括具有大约15kDa分子量的HT-硫氧还蛋白和具有大约12kDa分子量的PIG27蛋白质,各被插入到pBAD/thio-Topo/PIG27载体中的蛋白质。
图89示出确定在用pBAD/thio-Topo/PIG28载体转化的大肠杆菌Top10菌株中的蛋白质表达模式的SDS-PAGE结果,其中在L-阿拉伯糖诱导后清楚地观察到具有大约51kDa分子量的融合蛋白条带。51-kDa融合蛋白包括具有大约15kDa分子量的HT-硫氧还蛋白和具有大约36kDa分子量的PIG28蛋白质,各被插入到pBAD/thio-Topo/PIG28载体中的蛋白质。
图90为示出PIG30蛋白质的SDS-PAGE分析结果的图。在图90中,泳道1表示IPTG诱导前的蛋白质样品,且泳道2表示由IPTG诱导的PIG30基因表达后的蛋白质样品。如图90所示,表达的PIG30蛋白质具有大约82kDa的分子量,其对应于来自其DNA序列的分子量。
图91为示出PIG31蛋白质的SDS-PAGE分析结果的图。在图91中,泳道1表示IPTG诱导前的蛋白质样品,且泳道2表示由IPTG诱导的PIG31基因表达后的蛋白质样品。如图91所示,表达的PIG31蛋白质具有大约83kDa的分子量,其对应于来自其DNA序列的分子量。
图92示出确定在用pBAD/thio-Topo/PIG38载体转化的大肠杆菌Top10菌株中的蛋白质表达模式的SDS-PAGE结果,其中在L-阿拉伯糖诱导后清楚地观察到具有大约88kDa分子量的融合蛋白条带。88-kDa融合蛋白包括具有大约15kDa分子量的HT-硫氧还蛋白和具有大约73kDa分子量的PIG38蛋白质,各被插入到pBAD/thio-Topo/PIG38载体中的蛋白质。
图93示出确定在用pBAD/thio-Topo/PIG40载体转化的大肠杆菌Top10菌株中的蛋白质表达模式的SDS-PAGE结果,其中在L-阿拉伯糖诱导后清楚地观察到具有大约72kDa分子量的融合蛋白条带。72-kDa融合蛋白包括具有大约15kDa分子量的HT-硫氧还蛋白和具有大约57kDa分子量的PIG38蛋白质,各被插入到pBAD/thio-Topo/PIG40载体中的蛋白质。
图94示出确定在用pBAD/thio-Topo/PIG43载体转化的大肠杆菌Top10菌株中的蛋白质表达模式的SDS-PAGE结果,其中在L-阿拉伯糖诱导后清楚地观察到具有大约41kDa分子量的融合蛋白条带。41-kDa融合蛋白包括具有大约15kDa分子量的HT-硫氧还蛋白和具有大约26kDa分子量的PIG43蛋白质,各被插入到pBAD/thio-Topo/PIG43载体中的蛋白质。
图95示出确定在用pBAD/thio-Topo/PIG44载体转化的大肠杆菌Top10菌株中的蛋白质表达模式的SDS-PAGE结果,其中在L-阿拉伯糖诱导后清楚地观察到具有大约70kDa分子量的融合蛋白条带。70-kDa融合蛋白包括具有大约15kDa分子量的HT-硫氧还蛋白和具有大约55kDa分子量的PIG38蛋白质,各被插入到pBAD/thio-Topo/PIG44载体中的蛋白质。
图96为示出PIG46蛋白质的SDS-PAGE分析结果的图。在图96中,泳道1表示IPTG诱导前的蛋白质样品,且泳道2表示由IPTG诱导的PIG46基因表达后的蛋白质样品。如图96所示,表达的PIG46蛋白质具有大约48kDa的分子量,其对应于来自其DNA序列的分子量。
图97为示出PIG47蛋白质的SDS-PAGE分析结果的图。在图97中,泳道1表示IPTG诱导前的蛋白质样品,且泳道2表示由IPTG诱导的PIG47基因表达后的蛋白质样品。如图97所示,表达的PIG47蛋白质具有大约29kDa的分子量,其对应于来自其DNA序列的分子量。
图98为示出PIG48蛋白质的SDS-PAGE分析结果的图。在图98中,泳道1表示IPTG诱导前的蛋白质样品,且泳道2表示由IPTG诱导的PIG48基因表达后的蛋白质样品。如图98所示,表达的PIG48蛋白质具有大约60kDa的分子量,其对应于来自其DNA序列的分子量。
图99为示出PIG50蛋白质的SDS-PAGE分析结果的图。在图99中,泳道1表示IPTG诱导前的蛋白质样品,且泳道2表示由IPTG诱导的PIG50基因表达后的蛋白质样品。如图99所示,表达的PIG50蛋白质具有大约22kDa的分子量,其对应于来自其DNA序列的分子量。
图100示出确定在用pBAD/thio-Topo/PIG54载体转化的大肠杆菌Top10菌株中的蛋白质表达模式的SDS-PAGE结果,其中在L-阿拉伯糖诱导后清楚地观察到具有大约84kDa分子量的融合蛋白条带。84-kDa融合蛋白包括具有大约15kDa分子量的HT-硫氧还蛋白和具有大约69kDa分子量的PIG54蛋白质,各被插入到pBAD/thio-Topo/PIG54载体中的蛋白质。
图101为示出PIG55蛋白质的SDS-PAGE分析结果的图。在图101中,泳道1表示IPTG诱导前的蛋白质样品,且泳道2表示由IPTG诱导的PIG55基因表达后的蛋白质样品。如图101所示,表达的PIG55蛋白质具有大约18kDa的分子量,其对应于来自其DNA序列的分子量。
图102示出确定在用pBAD/thio-Topo/GIG9载体转化的大肠杆菌Top10菌株中的蛋白质表达模式的SDS-PAGE结果,其中在L-阿拉伯糖诱导后清楚地观察到具有大约53kDa分子量的融合蛋白条带。53-kDa融合蛋白包括具有大约15kDa分子量的HT-硫氧还蛋白和具有大约38kDa分子量的GIG9蛋白质,各被插入到pBAD/thio-Topo/GIG9载体中的蛋白质。
图103示出确定在用pBAD/thio-Topo/HLC9载体转化的大肠杆菌Top10菌株中的蛋白质表达模式的SDS-PAGE结果,其中在L-阿拉伯糖诱导后清楚地观察到具有大约66kDa分子量的融合蛋白条带。66-kDa融合蛋白包括具有大约15kDa分子量的HT-硫氧还蛋白和具有大约51kDa分子量的HLC9蛋白质,各被插入到pBAD/thio-Topo/HLC9载体中的蛋白质。
图104示出确定在用pBAD/thio-Topo/GIG18载体转化的大肠杆菌Top10菌株中的蛋白质表达模式的SDS-PAGE结果,其中在L-阿拉伯糖诱导后清楚地观察到具有大约61kDa分子量的融合蛋白条带。61-kDa融合蛋白包括具有大约15kDa分子量的HT-硫氧还蛋白和具有大约46kDa分子量的GIG18蛋白质,各被插入到pBAD/thio-Topo/GIG18载体中的蛋白质。
图105示出确定在用pBAD/thio-Topo/MIG22载体转化的大肠杆菌Top10菌株中的蛋白质表达模式的SDS-PAGE结果,其中在L-阿拉伯糖诱导后清楚地观察到具有大约42kDa分子量的融合蛋白条带。42-kDa融合蛋白包括具有大约15kDa分子量的HT-硫氧还蛋白和具有大约27kDa分子量的MIG22蛋白质,各被插入到pBAD/thio-Topo/MIG22载体中的蛋白质。
工业实用性
本发明的原癌基因可有效地用于诊断包括乳腺癌、白血病、子宫癌、肺癌、恶性淋巴瘤等的多种癌症。
序列表
<110>金弦起(KIM,HYUN-KEE)
<120>人类原癌基因及其编码的蛋白质
<130>PCT06-023
<150>KR10-2005-0026244
<151>2005-03-30
<160>84
<170>KopatentIn 1.71
<210>1
<211>1258
<212>DNA
<213>人类
<400>1
gcctccaagg tttgtcttga agcatagctc cagctggagg gtacctttta agctgttcaa    60
ggtcaagatg aatacaaact caaaggaggt tttatccctg ggtgttcaag ttcccgaggc    120
atgggaagaa cttctgacaa tgaaagtgga agcaaaaagt caccttcaat ggcaggaatc    180
cagactgaaa cgcagtaatc cactggcaag ggaaatcttc cgaaggcact ttcgacagct    240
gtgctaccaa gagacccctg gaccaaggga ggctcttact cgactccagg aactttgcta    300
ccagtggttg aggccacatg tgagcacaaa ggagcagatt ttggatctgc tggtgctgga    360
gcagtttcta tccattctgc ccaaggagct ccagggctgg gtgagggaac actgtccaga    420
gagtggagaa gaggctgtga ttttgctgga ggatctggag agagagctcg atgaaccaca    480
acatgagatg gtggcccaca gacacagaca agaagtcctc tgtaaagaga tggtgcctct    540
agcagagcag acaccactga cccttcagtc ccagcctaag gagccacagc tcacatgtga    600
ctctgctcag aagtgccatt ctattggaga gacagatgaa gtaaccaaga ctgaggacag    660
agagttggtg ctaaggaaag actgtcctaa gatagtggaa ccacatggga aaatgtttaa    720
tgagcagacc tgggaggtat cacagcagga tccctcacat ggagaagttg gtgaacataa    780
ggataggata gagaggcagt ggggaaacct cttaggagag gggcaacaca aatgtgatga    840
atgtgggaag agctttactc agagctcagg tctcattcga catcaaagaa ttcatactgg    900
agaaagacct tatgaatgta atgaatgtgg gaaagccttc agtcgaagtt ctggtctttt    960
taatcaccga ggaatccaca atatacagaa acggtaccac tgcaaggagt gtgggaaggt    1020
cttcagtcag agtgcgggtc ttatccagca tcagagaatc cacaaaggag aaaagccgta    1080
tcagtgcagc cagtgcagta agagctacag tcggcgttca tttctcattg aacatcagag    1140
aagccacaca ggggagcgac ctcaccagtg cattgaatgt gggaaaagct ttaatcgaca    1200
ctgcaacctc attcgccatc agaagatcca cacagtggct gagctggtct agggcttg      1258
<210>2
<211>394
<212>PRT
<213>人类
<400>2
Met Asn Thr Asn Ser Lys Glu Val Leu Ser Leu Gly Val Gln Val Pro
  1               5                  10                  15
Glu Ala Trp Glu Glu Leu Leu Thr Met Lys Val Glu Ala Lys Ser His
             20                  25                  30
Leu Gln Trp Gln Glu Ser Arg Leu Lys Arg Ser Asn Pro Leu Ala Arg
         35                  40                  45
Glu Ile Phe Arg Arg His Phe Arg Gln Leu Cys Tyr Gln Glu Thr Pro
     50                  55                  60
Gly Pro Arg Glu Ala Leu Thr Arg Leu Gln Glu Leu Cys Tyr Gln Trp
 65                  70                  75                  80
Leu Arg Pro His Val Ser Thr Lys Glu Gln Ile Leu Asp Leu Leu Val
                 85                  90                  95
Leu Glu Gln Phe Leu Ser Ile Leu Pro Lys Glu Leu Gln Gly Trp Val
            100                 105                 110
Arg Glu His Cys Pro Glu Ser Gly Glu Glu Ala Val Ile Leu Leu Glu
        115                 120                 125
Asp Leu Glu Arg Glu Leu Asp Glu Pro Gln His Glu Met Val Ala His
    130                 135                 140
Arg His Arg Gln Glu Val Leu Cys Lys Glu Met Val Pro Leu Ala Glu
145                 150                 155                 160
Gln Thr Pro Leu Thr Leu Gln Ser Gln Pro Lys Glu Pro Gln Leu Thr
                165                 170                 175
Cys Asp Ser Ala Gln Lys Cys His Ser Ile Gly Glu Thr Asp Glu Val
            180                 185                 190
Thr Lys Thr Glu Asp Arg Glu Leu Val Leu Arg Lys Asp Cys Pro Lys
        195                 200                 205
Ile Val Glu Pro His Gly Lys Met Phe Asn Glu Gln Thr Trp Glu Val
    210                 215                 220
Ser Gln Gln Asp Pro Ser His Gly Glu Val Gly Glu His Lys Asp Arg
225                 230                 235                 240
Ile Glu Arg Gln Trp Gly Asn Leu Leu Gly Glu Gly Gln His Lys Cys
                245                 250                 255
Asp Glu Cys Gly Lys Ser Phe Thr Gln Ser Ser Gly Leu Ile Arg His
            260                 265                 270
Gln Arg Ile His Thr Gly Glu Arg Pro Tyr Glu Cys Asn Glu Cys Gly
        275                 280                 285
Lys Ala Phe Ser Arg Ser Ser Gly Leu Phe Asn His Arg Gly Ile His
    290                 295                 300
Asn Ile Gln Lys Arg Tyr His Cys Lys Glu Cys Gly Lys Val Phe Ser
305                 310                 315                 320
Gln Ser Ala Gly Leu Ile Gln His Gln Arg Ile His Lys Gly Glu Lys
                325                 330                 335
Pro Tyr Gln Cys Ser Gln Cys Ser Lys Ser Tyr Ser Arg Arg Ser Phe
            340                 345                 350
Leu Ile Glu His Gln Arg Ser His Thr Gly Glu Arg Pro His Gln Cys
        355                 360                 365
Ile Glu Cys Gly Lys Ser Phe Asn Arg His Cys Asn Leu Ile Arg His
    370                 375                 380
Gln Lys Ile His Thr Val Ala Glu Leu Val
385                 390
<210>3
<211>16
<212>DNA
<213>人工序列
<220>
<223>用于PIG12的锚定引物
<400>3
aagctttttt ttttta                                      16
<210>4
<211>13
<212>DNA
<213>人工序列
<220>
<223>用于PIG12的H-AP21引物
<400>4
aagctttctc tgg                                         13
<210>5
<211>2403
<212>DNA
<213>人类
<400>5
cccagcagtt ataacagcag tgggcagttg atggcaagta aaatggatac ctgctctagt    60
aacctgaata acagcatata caaaaagctg ttaacttagg aaaagggact gctgggaggt    120
taaaaagaaa agtttataaa agtgaataac ctgaggattc tattagtccc cacccaaact    180
ttattgattc acctcctaaa acaacagatg tacgacttgc atacctgctt tttatgggag    240
ctgtcaagca tgtatttttg tcaattacca gaaagataac aggacgagat gacggtgtta    300
ttccaaggga atattgccaa tgctacagta ataaatgaat gtcacttctg gatatagcta    360
ggtgacatat acatacttac atgtgtgtat atgtagatgt atgcacacac atatattatt    420
tgcagtgcag tatagaatag gcactttaaa acactctttc cccgcacccc agcaattatg    480
aaaataatct ctgattccct gatttaatat gcaaagtcta ggttggtaga gtttagccct    540
gaacatttca tggtgttcat caacagtgag agactccata gtttgggctt gtaccacttt    600
tgcaaataag tgtattttga aattgtttga cggcaaggtt taagttatta agaggtaaga    660
cttagtacta tctgtgcgta gaagttctag tgttttcaat tttaaacata tccaagtttg    720
aattcctaaa attatggaaa cagatgaaaa gcctctgttt tgatatgggt agtatttttt    780
acattttaca cactgtacac ataagccaaa actgagcata agtcctctag tgaatgtagg    840
ctggctttca gagtaggcta ttcctgagag ctgcatgtgt ccgcccccga tggaggactc    900
caggcagcag acacatgcca gggccatgtc agacacagat tggccagaaa ccttcctgct    960
gagcctcaca gcagtgagac tggggccact acatttgctc catcctcctg ggattggctg    1020
tgaactgatc atgtttatga gaaactggca aagcagaatg tgatatccta ggaggtaatg    1080
accatgaaag acttctctac ccatcttaaa aacaacgaaa gaaggcatgg acttctggat    1140
gcccatccac tgggtgtaaa cacatctagt agttgttctg aaatgtcagt tctgatatgg    1200
aagcacccat tatgcgctgt ggccactcca ataggtgctg agtgtacaga gtggaataag    1260
acagagacct gccctcaaga gcaaagtaga tcatgcatag agtgtgatgt atgtgtaata    1320
aatatgtttc acacaaacaa ggcctgtcag ctaaagaagt ttgaacattt gggttactat    1380
ttcttgtggt tataacttaa tgaaaacaat gcagtacagg acatatattt tttaaaataa    1440
gtctgattta attgggcact atttatttac aaatgttttg ctcaatagat tgctcaaatc    1500
aggttttctt ttaagaatca atcatgtcag tctgcttaga aataacagaa gaaaatagaa    1560
ttgacattga aatctaggaa aattattcta taatttccat ttacttaaga cttaatgaga    1620
ctttaaaagc attttttaac ctcctaagta tcaagtatag aaaatcttca tggaattcac    1680
aaagtaattt ggaaattagg ttgaaacata tctcttatct tacgaaaaaa tggtagcatt    1740
ttaaacaaaa tagaaagttg caaggcaaat gtttatttaa aagagcaggc caggcgcggt    1800
ggctcacgcc tgtaatccca gcactttggg aggctgaggc gggtggatca cgaggtcagg    1860
agatcgagac catcctggct aacacggtga aacccgtctc tactaaaaat gcaaaaaaaa    1920
ttagccgggc gtggtggcag gcacctgtag tcccagctac tcgggaggct gaggcaggag    1980
actggcgtga acccaggagg cggaccttgt agtgagccga gatcgcgcca ctgtgctcca    2040
gcctgggcaa cagagcaaga ctccatctca aaaaataaaa ataaataaaa aataaaaaaa    2100
taaaagagca aactatttcc aaataccata gaataactta cataaaagta atataactgt    2160
attgtaagta gaagctagca ctggttttat taatttagtg actattcatt ttatctaaat    2220
cagtgaagat ttactgtcat tgtttattag tctgtatata ttaaaatatg atatcattaa    2280
tgtacttaca aaatagtatg tcactgtttt tatgttcatt cttaaaaaca taacctgtat    2340
taataaatgt gaacatttgc ttggtaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa    2400
aaa                                                                  2403
<210>6
<211>167
<212>PRT
<213>人类
<400>6
Met Cys Pro Pro Pro Met Glu Asp Ser Arg Gln Gln Thr His Ala Arg
  1               5                  10                  15
Ala Met Ser Asp Thr Asp Trp Pro Glu Thr Phe Leu Leu Ser Leu Thr
             20                  25                  30
Ala Val Arg Leu Gly Pro Leu His Leu Leu His Pro Pro Gly Ile Gly
         35                  40                  45
Cys Glu Leu Ile Met Phe Met Arg Asn Trp Gln Ser Arg Met Met Thr
     50                  55                  60
Met Lys Asp Phe Ser Thr His Leu Lys Asn Asn Glu Arg Arg His Gly
 65                  70                  75                  80
Leu Leu Asp Ala His Pro Leu Gly Val Asn Thr Ser Ser Ser Cys Ser
                 85                  90                  95
Glu Met Ser Val Leu Ile Trp Lys His Pro Leu Cys Ala Val Ala Thr
            100                 105                 110
Pro Ile Gly Ala Glu Cys Thr Glu Trp Asn Lys Thr Glu Thr Cys Pro
        115                 120                 125
Gln Glu Gln Ser Arg Ser Cys Ile Glu Cys Asp Val Cys Val Ile Asn
    130                 135                 140
Met Phe His Thr Asn Lys Ala Cys Gln Leu Lys Lys Phe Glu His Leu
145                 150                 155                 160
Gly Tyr Tyr Phe Leu Trp Leu
                165
<210>7
<211>16
<212>DNA
<213>人工序列
<220>
<223>用于PIG18的锚定引物
<400>7
aagctttttt tttttc                     16
<210>8
<211>13
<212>DNA
<213>人工序列
<220>
<223>用于PIG18的H-AP11引物
<400>8
aagcttcggg taa                        13
<210>9
<211>2150
<212>DNA
<213>人类
<400>9
gcggacagtg cggaactaaa gcaaatggtt atgagcctta gagtttctga actccaagta    60
ctgttgggct acgccgggag aaacaagcac ggacgcaaac acgaacttct cacaaaagcc    120
ctgcatttgc taaaggctgg ctgtagtcct gctgtgcaaa tgaaaattaa ggaactctat    180
aggcggcggt tcccacagaa aatcatgacg cctgcagact tgtccatccc caacgtacat    240
tcaagtccta tgccagcaac tttgtctcca tctaccattc cacaactcac ttacgatggt    300
caccctgcat catcgccatt actccctgtt tctcttctgg gacctaaaca tgaactggaa    360
ctcccacatc ttacatcagc tcttcaccca gtccatccgg atataaaact tcaaaaatta    420
ccattttatg atttactgga tgaactgata aaacccacca gtctagcatc agacaacagt    480
cagcgctttc gagaaacctg ttttgcattt gccttgacac cacaacaagt gcagcaaatc    540
agtagttcca tggatatttc tgggaccaaa tgtgacttca cagtacaggt ccagttaagg    600
ttttgtttat cagaaaccag ttgtccacaa gaagatcact tcccacccaa tctttgtgtg    660
aaagtgaata caaaaccttg cagccttcca ggttaccttc cacctacaaa aaatggcgtg    720
gaaccaaagc gacccagccg accaattaat atcacctcac ttgtccgact gtccacaaca    780
gtaccaaaca cgattgttgt ttcttggact gcagaaattg gaagaaacta ttccatggca    840
gtatatcttg taaaacagtt gtcctcaaca gttcttcttc agaggttacg agcaaaggga    900
ataaggaatc cggatcattc tagagcttta attaaagaga agttgactgc ggatccagac    960
agtgaaatag ctacaaccag cctaagggtt tctctactat gtccacttgg taaaatgcgg    1020
ctgacaattc cgtgtcgggc ccttacatgt tctcatctac aatgttttga cgcaactctt    1080
tacattcaga tgaatgagaa aaaaccaacc tgggtttgtc ctgtctgtga taagaaggct    1140
ccatatgaac accttattat tgatggcttg tttatggaaa tcctaaagta ctgtacagac    1200
tgtgatgaaa tacaatttaa ggaggatggc acttgggcac cgatgagatc aaaaaaggaa    1260
gtacaggaag tttctgcctc ttacaatgga gtcgatggat gcttgagctc cacattggag    1320
catcaggtag cgtctcacca ccagtcctca aataaaaaca agaaagtaga agtgattgac    1380
ctaaccatag acagttcatc tgatgaagag gaagaagagc catctgccaa gaggacctgt    1440
ccttccctat ctcccacatc accactaaat aataaaggca ttttaagtct tccacatcaa    1500
gcatctccag tatcccgcac cccaagcctt cctgctgtag acacaagcta cattaatacc    1560
tccctcatcc aagactatag gcatcctttc cacatgacac ccatgcctta cgacttacaa    1620
ggattagatt tctttccttt cttatcagga gacaatcagc attacaacac ctccttgctt    1680
gccgctgcag cagcagcagt ttcagatgat caagacctcc tacactcgtc tcggtttttc    1740
ccgtatacct cctcacagat gtttcttgat cagttaagtg caggaggcag tacttctctg    1800
ccaaccacca atggaagcag tagtggcagt aacagcagcc tggtttcttc caacagccta    1860
agggaaagcc atagccacac cgtcacaaac aggagcagca cggacacggc atccatcttt    1920
ggcatcatac cagacattat ttcattggac tgattcccag gccctgctgc tcccatcccc    1980
accccagatc gaatgaactt ggcagaaaga agagaacttt gtgctctgtt ttaccttact    2040
ctgtttagaa aagtatacaa gcgtgttttt tttccttttt ttagggaaaa aattaaaaga    2100
aatgtacaga gaaaaaaata aaaaaaaaat aaaaaaaaaa aaaaaaaaaa    2150
<210>10
<211>642
<212>PRT
<213>人类
<400>10
Met Val Met Ser Leu Arg Val Ser Glu Leu Gln Val Leu Leu Gly Tyr
  1               5                  10                  15
Ala Gly Arg Asn Lys His Gly Arg Lys His Glu Leu Leu Thr Lys Ala
             20                  25                  30
Leu His Leu Leu Lys Ala Gly Cys Ser Pro Ala Val Gln Met Lys Ile
         35                  40                  45
Lys Glu Leu Tyr Arg Arg Arg Phe Pro Gln Lys Ile Met Thr Pro Ala
     50                  55                  60
Asp Leu Ser Ile Pro Asn Val His Ser Ser Pro Met Pro Ala Thr Leu
 65                  70                  75                  80
Ser Pro Ser Thr Ile Pro Gln Leu Thr Tyr Asp Gly His Pro Ala Ser
                 85                  90                  95
Ser Pro Leu Leu Pro Val Ser Leu Leu Gly Pro Lys His Glu Leu Glu
            100                 105                 110
Leu Pro His Leu Thr Ser Ala Leu His Pro Val His Pro Asp Ile Lys
        115                 120                 125
Leu Gln Lys Leu Pro Phe Tyr Asp Leu Leu Asp Glu Leu Ile Lys Pro
    130                 135                 140
Thr Ser Leu Ala Ser Asp Asn Ser Gln Arg Phe Arg Glu Thr Cys Phe
145                 150                 155                 160
Ala Phe Ala Leu Thr Pro Gln Gln Val Gln Gln Ile Ser Ser Ser Met
                165                 170                 175
Asp Ile Ser Gly Thr Lys Cys Asp Phe Thr Val Gln Val Gln Leu Arg
            180                 185                 190
Phe Cys Leu Ser Glu Thr Ser Cys Pro Gln Glu Asp His Phe Pro Pro
        195                 200                 205
Asn Leu Cys Val Lys Val Asn Thr Lys Pro Cys Ser Leu Pro Gly Tyr
    210                 215                 220
Leu Pro Pro Thr Lys Asn Gly Val Glu Pro Lys Arg Pro Ser Arg Pro
225                 230                 235                 240
Ile Asn Ile Thr Ser Leu Val Arg Leu Ser Thr Thr Val Pro Asn Thr
                245                 250                 255
Ile Val Val Ser Trp Thr Ala Glu Ile Gly Arg Asn Tyr Ser Met Ala
            260                 265                 270
Val Tyr Leu Val Lys Gln Leu Ser Ser Thr Val Leu Leu Gln Arg Leu
        275                 280                 285
Arg Ala Lys Gly Ile Arg Asn Pro Asp His Ser Arg Ala Leu Ile Lys
    290                 295                 300
Glu Lys Leu Thr Ala Asp Pro Asp Ser Glu Ile Ala Thr Thr Ser Leu
305                 310                 315                 320
Arg Val Ser Leu Leu Cys Pro Leu Gly Lys Met Arg Leu Thr Ile Pro
                325                 330                 335
Cys Arg Ala Leu Thr Cys Ser His Leu Gln Cys Phe Asp Ala Thr Leu
            340                 345                 350
Tyr Ile Gln Met Asn Glu Lys Lys Pro Thr Trp Val Cys Pro Val Cys
        355                 360                 365
Asp Lys Lys Ala Pro Tyr Glu His Leu Ile Ile Asp Gly Leu Phe Met
    370                 375                 380
Glu Ile Leu Lys Tyr Cys Thr Asp Cys Asp Glu Ile Gln Phe Lys Glu
385                 390                 395                 400
Asp Gly Thr Trp Ala Pro Met Arg Ser Lys Lys Glu Val Gln Glu Val
                405                 410                 415
Ser Ala Ser Tyr Asn Gly Val Asp Gly Cys Leu Ser Ser Thr Leu Glu
            420                 425                 430
His Gln Val Ala Ser His His Gln Ser Ser Asn Lys Asn Lys Lys Val
        435                 440                 445
Glu Val Ile Asp Leu Thr Ile Asp Ser Ser Ser Asp Glu Glu Glu Glu
    450                 455                 460
Glu Pro Ser Ala Lys Arg Thr Cys Pro Ser Leu Ser Pro Thr Ser Pro
465                 470                 475                 480
Leu Asn Asn Lys Gly Ile Leu Ser Leu Pro His Gln Ala Ser Pro Val
                485                 490                 495
Ser Arg Thr Pro Ser Leu Pro Ala Val Asp Thr Ser Tyr Ile Asn Thr
            500                 505                 510
Ser Leu Ile Gln Asp Tyr Arg His Pro Phe His Met Thr Pro Met Pro
        515                 520                 525
Tyr Asp Leu Gln Gly Leu Asp Phe Phe Pro Phe Leu Ser Gly Asp Asn
    530                 535                 540
Gln His Tyr Asn Thr Ser Leu Leu Ala Ala Ala Ala Ala Ala Val Ser
545                 550                 555                 560
Asp Asp Gln Asp Leu Leu His Ser Ser Arg Phe Phe Pro Tyr Thr Ser
                565                 570                 575
Ser Gln Met Phe Leu Asp Gln Leu Ser Ala Gly Gly Ser Thr Ser Leu
            580                 585                 590
Pro Thr Thr Asn Gly Ser Ser Ser Gly Ser Asn Ser Ser Leu Val Ser
        595                 600                 605
Ser Asn Ser Leu Arg Glu Ser His Ser His Thr Val Thr Asn Arg Ser
    610                 615                 620
Ser Thr Asp Thr Ala Ser Ile Phe Gly Ile Ile Pro Asp Ile Ile Ser
625                 630                 635                 640
Leu Asp
<210>11
<211>16
<212>DNA
<213>人工序列
<220>
<223>用于PIG23的锚定引物
<400>11
aagctttttt tttttc                     16
<210>12
<211>13
<212>DNA
<213>人工序列
<220>
<223>用于PIG23的H-AP33引物
<400>12
aagcttgctg ctc                        13
<210>13
<211>446
<212>DNA
<213>人类
<400>13
tggtcacagt ggaaggatca tgggagaaac agaagggaag aaagatgagg ctgattataa    60
gcgactgcag accttccctc tggtcaggca ctcggacatg ccagaggaga tgcgcgtgga    120
gaccatggag ctatgtgtca cagcctgtga gaaattctcc aacaacaacg agagcgccgc    180
caagatgatc aaagagacaa tggacaagaa gttcggctcc tcctggcacg tggtgatcgg    240
cgagggcttt gggtttgaga tcacccacga ggtgaagaac ctcctctacc tgtacttcgg    300
gggcaccctg gctgtgtgcg tctggaagtg ctcctgacac tctgccccta tttaaaagcc    360
tgttgattca agaactttct aaagtatttc cggaagacat ggctaagtat cgaagcatcc    420
ggggggagga tcacccgcct tcttaa                                         446
<210>14
<211>105
<212>PRT
<213>人类
<400>14
Met Gly Glu Thr Glu Gly Lys Lys Asp Glu Ala Asp Tyr Lys Arg Leu
  1               5                  10                  15
Gln Thr Phe Pro Leu Val Arg His Ser Asp Met Pro Glu Glu Met Arg
             20                  25                  30
Val Glu Thr Met Glu Leu Cys Val Thr Ala Cys Glu Lys Phe Ser Asn
         35                  40                  45
Asn Asn Glu Ser Ala Ala Lys Met Ile Lys Glu Thr Met Asp Lys Lys
     50                  55                  60
Phe Gly Ser Ser Trp His Val Val Ile Gly Glu Gly Phe Gly Phe Glu
 65                  70                  75                  80
Ile Thr His Glu Val Lys Asn Leu Leu Tyr Leu Tyr Phe Gly Gly Thr
                 85                  90                  95
Leu Ala Val Cys Val Trp Lys Cys Ser
            100                 105
<210>15
<211>16
<212>DNA
<213>人工序列
<220>
<223>用于PIG27的锚定引物
<400>15
aagctttttt ttttta                     16
<210>16
<211>13
<212>DNA
<213>人工序列
<220>
<223>用于PIG27的H-AP12引物
<400>16
aagcttgagt gct                       13
<210>17
<211>1024
<212>DNA
<213>人类
<400>17
gggtggctga actctgatct tgacctagag tcatggccat ggcaaccaaa ggaggtactg    60
tcaaagctgc ttcaggattc aatgccatgg aagatgccca gaccctgagg aaggccatga    120
aagggctcgg caccgatgaa gacgccatta ttagcgtcct tgcctaccgc aacaccgccc    180
agcgccagga gatcaggaca gcctacaaga gcaccatcgg cagggacttg atagacgacc    240
tgaagtcaga actgagtggc aacttcgagc aggtgattgt ggggatgatg acgcccacgg    300
tgctgtatga cgtgcaagag ctgcgaaggg ccatgaaggg agccggcact gatgagggct    360
gcctaattga gatcctggcc tcccggaccc ctgaggagat ccggcgcata agccaaacct    420
accagcagca atatggacgg agccttgaag atgacattcg ctctgacaca tcgttcatgt    480
tccagcgagt gctggtgtct ctgtcagctg gtgggaggga tgaaggaaat tatctggacg    540
atgctctcgt gagacaggat gcccaggacc tgtatgaggc tggagagaag aaatggggga    600
cagatgaggt gaaatttcta actgttctct gttcccggaa ccgaaatcac ctgttgcatg    660
tgtttgatga atacaaaagg atatcacaga aggatattga acagagtatt aaatctgaaa    720
catctggtag ctttgaagat gctctgctgg ctatagtaaa gtgcatgagg aacaaatctg    780
catattttgc tgaaaagctc tataaatcga tgaagggctt gggcaccgat gataacaccc    840
tcatcagagt gatggtttct cgagcagaaa ttgacatgtt ggatatccgg gcacacttca    900
agagactcta tggaaagtct ctgtactcgt tcatcaaggg tgacacatct ggagactaca    960
ggaaagtact gcttgttctc tgtggaggag atgattaaaa taaaaatccc agaaggacag    1020
gagg                                                                 1024
<210>18
<211>321
<212>PRT
<213>人类
<400>18
Met Ala Met Ala Thr Lys Gly Gly Thr Val Lys Ala Ala Ser Gly Phe
  1               5                  10                  15
Asn Ala Met Glu Asp Ala Gln Thr Leu Arg Lys Ala Met Lys Gly Leu
             20                  25                  30
Gly Thr Asp Glu Asp Ala Ile Ile Ser Val Leu Ala Tyr Arg Asn Thr
         35                  40                  45
Ala Gln Arg Gln Glu Ile Arg Thr Ala Tyr Lys Ser Thr Ile Gly Arg
     50                  55                  60
Asp Leu Ile Asp Asp Leu Lys Ser Glu Leu Ser Gly Asn Phe Glu Gln
 65                  70                  75                  80
Val Ile Val Gly Met Met Thr Pro Thr Val Leu Tyr Asp Val Gln Glu
                 85                  90                  95
Leu Arg Arg Ala Met Lys Gly Ala Gly Thr Asp Glu Gly Cys Leu Ile
            100                 105                 110
Glu Ile Leu Ala Ser Arg Thr Pro Glu Glu Ile Arg Arg Ile Ser Gln
        115                 120                 125
Thr Tyr Gln Gln Gln Tyr Gly Arg Ser Leu Glu Asp Asp Ile Arg Ser
    130                 135                 140
Asp Thr Ser Phe Met Phe Gln Arg Val Leu Val Ser Leu Ser Ala Gly
145                 150                 155                 160
Gly Arg Asp Glu Gly Asn Tyr Leu Asp Asp Ala Leu Val Arg Gln Asp
                165                 170                 175
Ala Gln Asp Leu Tyr Glu Ala Gly Glu Lys Lys Trp Gly Thr Asp Glu
            180                 185                 190
Val Lys Phe Leu Thr Val Leu Cys Ser Arg Asn Arg Asn His Leu Leu
        195                 200                 205
His Val Phe Asp Glu Tyr Lys Arg Ile Ser Gln Lys Asp Ile Glu Gln
    210                 215                 220
Ser Ile Lys Ser Glu Thr Ser Gly Ser Phe Glu Asp Ala Leu Leu Ala
225                 230                 235                 240
Ile Val Lys Cys Met Arg Asn Lys Ser Ala Tyr Phe Ala Glu Lys Leu
                245                 250                 255
Tyr Lys Ser Met Lys Gly Leu Gly Thr Asp Asp Asn Thr Leu Ile Arg
            260                 265                 270
Val Met Val Ser Arg Ala Glu Ile Asp Met Leu Asp Ile Arg Ala His
        275                 280                 285
Phe Lys Arg Leu Tyr Gly Lys Ser Leu Tyr Ser Phe Ile Lys Gly Asp
    290                 295                 300
Thr Ser Gly Asp Tyr Arg Lys Val Leu Leu Val Leu Cys Gly Gly Asp
305                 310                 315                 320
Asp
<210>19
<211>16
<212>DNA
<213>人工序列
<220>
<223>用于PIG28的锚定引物
<400>19
aagctttttt tttttc                                                    16
<210>20
<211>13
<212>DNA
<213>人工序列
<220>
<223>用于PIG28的H-AP12引物
<400>20
aagcttgagt gct                                                       13
<210>21
<211>2152
<212>DNA
<213>人类
<400>21
ccaggatgtc ggaggagatc atcacgccgg tgtactgcac tggggtgtca gcccaagtgc    60
agaagcagcg ggccagggag ctgggcctgg gccgccatga gaatgccatc aagtacctgg    120
gccaggatta tgagcagctg cgggtgcgat gcctgcagag tgggaccctc ttccgtgatg    180
aggccttccc cccggtaccc cagagcctgg gttacaagga cctgggtccc aattcctcca    240
agacctatgg catcaagtgg aagcgtccca cggaactgct gtcaaacccc cagttcattg    300
tggatggagc tacccgcaca gacatctgcc agggagcact gggggactgc tggctcttgg    360
cggccattgc ctccctcact ctcaacgaca ccctcctgca ccgagtggtt ccgcacggcc    420
agagcttcca gaatggctat gccggcatct tccatttcca gctgtggcaa tttggggagt    480
gggtggacgt ggtcgtggat gacctgctgc ccatcaagga cgggaagcta gtgttcgtgc    540
actctgccga aggcaacgag ttctggagcg ccctgcttga gaaggcctat gccaaggtaa    600
atggcagcta cgaggccctg tcagggggca gcacctcaga gggctttgag gacttcacag    660
gcggggttac cgagtggtac gagttgcgca aggctcccag tgacctctac cagatcatcc    720
tcaaggcgct ggagcggggc tccctgctgg gctgctccat agacatctcc agcgttctag    780
acatggaggc catcactttc aagaagttgg tgaagggcca tgcctactct gtgaccgggg    840
ccaagcaggt gaactaccga ggccaggtgg tgagcctgat ccggatgcgg aacccctggg    900
gcgaggtgga gtggacggga gcctggagcg acagctcctc agagtggaac aacgtggacc    960
catatgaacg ggaccagctc cgggtcaaga tggaggacgg ggagttctgg atgtcattcc    1020
gagacttcat gcgggagttc acccgcctgg agatctgcaa cctcacaccc gacgccctca    1080
agagccggac catccgcaaa tggaacacca cactctacga aggcacctgg cggcggggga    1140
gcaccgcggg gggctgccga aactacccag ccaccttctg ggtgaaccct cagttcaaga    1200
tccggctgga tgagacggat gacccggacg actacgggga ccgcgagtca ggctgcagct    1260
tcgtgctcgc ccttatgcag aagcaccgtc gccgcgagcg ccgcttcggc cgcgacatgg    1320
agactattgg cttcgcggtc tacgaggtcc ctccggagct ggtgggccag ccggccgtac    1380
acttgaagcg tgacttcttc ctggccaatg cgtctcgggc gcgctcagag cagttcatca    1440
acctgcgaga ggtcagcacc cgcttccgcc tgccacccgg ggagtatgtg gtggtgccct    1500
ccaccttcga gcccaacaag gagggcgact tcgtgctgcg cttcttctca gagaagagtg    1560
ctgggactgt ggagctggat gaccagatcc aggccaatct ccccgatgag caagtgctct    1620
cagaagagga gattgacgag aacttcaagg ccctcttcag gcagctggca ggggaggaca    1680
tggagatcag cgtgaaggag ttgcggacaa tcctcaatag gatcatcagc aaacacaaag    1740
acctgcggac caagggcttc agcctagagt cgtgccgcag catggtgaac ctcatggatc    1800
gtgatggcaa tgggaagctg ggcctggtgg agttcaacat cctgtggaac cgcatccgga    1860
attacctgtc catcttccgg aagtttgacc tggacaagtc gggcagcatg agtgcctacg    1920
agatgcggat ggccattgag tcggcaggct tcaagctcaa caagaagctg tacgagctca    1980
tcatcacccg ctactcggag cccgacctgg cggtcgactt tgacaatttc gtttgctgcc    2040
tggtgcggct agagaccatg ttccgatttt tcaaaactct ggacacagat ctggatggag    2100
ttgtgacctt tgacttgttt aagtggttgc agctgaccat gtttgcatga gg            2152
<210>22
<211>714
<212>PRT
<213>人类
<400>22
Met Ser Glu Glu Ile Ile Thr Pro Val Tyr Cys Thr Gly Val Ser Ala
  1               5                  10                  15
Gln Val Gln Lys Gln Arg Ala Arg Glu Leu Gly Leu Gly Arg His Glu
             20                  25                  30
Asn Ala Ile Lys Tyr Leu Gly Gln Asp Tyr Glu Gln Leu Arg Val Arg
         35                  40                  45
Cys Leu Gln Ser Gly Thr Leu Phe Arg Asp Glu Ala Phe Pro Pro Val
     50                  55                  60
Pro Gln Ser Leu Gly Tyr Lys Asp Leu Gly Pro Asn Ser Ser Lys Thr
 65                  70                  75                  80
Tyr Gly Ile Lys Trp Lys Arg Pro Thr Glu Leu Leu Ser Asn Pro Gln
                 85                  90                  95
Phe Ile Val Asp Gly Ala Thr Arg Thr Asp Ile Cys Gln Gly Ala Leu
            100                 105                 110
Gly Asp Cys Trp Leu Leu Ala Ala Ile Ala Ser Leu Thr Leu Asn Asp
        115                 120                 125
Thr Leu Leu His Arg Val Val Pro His Gly Gln Ser Phe Gln Asn Gly
    130                 135                 140
Tyr Ala Gly Ile Phe His Phe Gln Leu Trp Gln Phe Gly Glu Trp Val
145                 150                 155                 160
Asp Val Val Val Asp Asp Leu Leu Pro Ile Lys Asp Gly Lys Leu Val
                165                 170                 175
Phe Val His Ser Ala Glu Gly Asn Glu Phe Trp Ser Ala Leu Leu Glu
            180                 185                 190
Lys Ala Tyr Ala Lys Val Asn Gly Ser Tyr Glu Ala Leu Ser Gly Gly
        195                 200                 205
Ser Thr Ser Glu Gly Phe Glu Asp Phe Thr Gly Gly Val Thr Glu Trp
    210                 215                 220
Tyr Glu Leu Arg Lys Ala Pro Ser Asp Leu Tyr Gln Ile Ile Leu Lys
225                 230                 235                 240
Ala Leu Glu Arg Gly Ser Leu Leu Gly Cys Ser Ile Asp Ile Ser Ser
                245                 250                 255
Val Leu Asp Met Glu Ala Ile Thr Phe Lys Lys Leu Val Lys Gly His
            260                 265                 270
Ala Tyr Ser Val Thr Gly Ala Lys Gln Val Asn Tyr Arg Gly Gln Val
        275                 280                 285
Val Ser Leu Ile Arg Met Arg Asn Pro Trp Gly Glu Val Glu Trp Thr
    290                 295                 300
Gly Ala Trp Ser Asp Ser Ser Ser Glu Trp Asn Asn Val Asp Pro Tyr
305                 310                 315                 320
Glu Arg Asp Gln Leu Arg Val Lys Met Glu Asp Gly Glu Phe Trp Met
                325                 330                 335
Ser Phe Arg Asp Phe Met Arg Glu Phe Thr Arg Leu Glu Ile Cys Asn
            340                 345                 350
Leu Thr Pro Asp Ala Leu Lys Ser Arg Thr Ile Arg Lys Trp Asn Thr
        355                 360                 365
Thr Leu Tyr Glu Gly Thr Trp Arg Arg Gly Ser Thr Ala Gly Gly Cys
    370                 375                 380
Arg Asn Tyr Pro Ala Thr Phe Trp Val Asn Pro Gln Phe Lys Ile Arg
385                 390                 395                 400
Leu Asp Glu Thr Asp Asp Pro Asp Asp Tyr Gly Asp Arg Glu Ser Gly
                405                 410                 415
Cys Ser Phe Val Leu Ala Leu Met Gln Lys His Arg Arg Arg Glu Arg
            420                 425                 430
Arg Phe Gly Arg Asp Met Glu Thr Ile Gly Phe Ala Val Tyr Glu Val
        435                 440                 445
Pro Pro Glu Leu Val Gly Gln Pro Ala Val His Leu Lys Arg Asp Phe
    450                 455                 460
Phe Leu Ala Asn Ala Ser Arg Ala Arg Ser Glu Gln Phe Ile Asn Leu
465                 470                 475                 480
Arg Glu Val Ser Thr Arg Phe Arg Leu Pro Pro Gly Glu Tyr Val Val
                485                 490                 495
Val Pro Ser Thr Phe Glu Pro Asn Lys Glu Gly Asp Phe Val Leu Arg
            500                 505                 510
Phe Phe Ser Glu Lys Ser Ala Gly Thr Val Glu Leu Asp Asp Gln Ile
        515                 520                 525
Gln Ala Asn Leu Pro Asp Glu Gln Val Leu Ser Glu Glu Glu Ile Asp
    530                 535                 540
Glu Asn Phe Lys Ala Leu Phe Arg Gln Leu Ala Gly Glu Asp Met Glu
545                 550                 555                 560
Ile Ser Val Lys Glu Leu Arg Thr Ile Leu Asn Arg Ile Ile Ser Lys
                565                 570                 575
His Lys Asp Leu Arg Thr Lys Gly Phe Ser Leu Glu Ser Cys Arg Ser
            580                 585                 590
Met Val Asn Leu Met Asp Arg Asp Gly Asn Gly Lys Leu Gly Leu Val
        595                 600                 605
Glu Phe Asn Ile Leu Trp Asn Arg Ile Arg Asn Tyr Leu Ser Ile Phe
    610                 615                 620
Arg Lys Phe Asp Leu Asp Lys Ser Gly Ser Met Ser Ala Tyr Glu Met
625                 630                 635                 640
Arg Met Ala Ile Glu Ser Ala Gly Phe Lys Leu Asn Lys Lys Leu Tyr
                645                 650                 655
Glu Leu Ile Ile Thr Arg Tyr Ser Glu Pro Asp Leu Ala Val Asp Phe
            660                 665                 670
Asp Asn Phe Val Cys Cys Leu Val Arg Leu Glu Thr Met Phe Arg Phe
        675                 680                 685
Phe Lys Thr Leu Asp Thr Asp Leu Asp Gly Val Val Thr Phe Asp Leu
    690                 695                 700
Phe Lys Trp Leu Gln Leu Thr Met Phe Ala
705                 710
<210>23
<211>16
<212>DNA
<213>人工序列
<220>
<223>用于PIG30的锚定引物
<400>23
aagctttttt tttttc                     16
<210>24
<211>13
<212>DNA
<213>人工序列
<220>
<223>用于PIG30的H-AP33引物
<400>24
aagcttgctg ctc                        13
<210>25
<211>2246
<212>DNA
<213>人类
<400>25
cctcaggttt gccaatagga ttatcctgct gccatcatgt cttggtttgt tgatcttgct    60
ggaaaggcag aagatctttt aaaccgagtt gatcaagggg ctgcaacagc tctcagtagg    120
aaagacaatg ccagcaacat atatagcaaa aatactgact atactgaact tcaccagcaa    180
aatacagatt tgatatatca gactggacct aaatctacgt atatttcatc agcagctgat    240
aacattcgaa atcaaaaagc caccatctta gctggcactg caaatgtgaa agtaggatct    300
cggacaccag tagaggcctc tcatcctgtt gaaaatgcat ctgttcctag gccttcatcc    360
cattttgtgc gaagaaaaaa gtcagaacct gatgatgagc tgctgtttga ttttcttaat    420
agttcacaga aggagcctac cgggagggtg gaaatcagaa aggaaaaagg caagacacct    480
gtctttcaga gctctcagac atcaagtgtc agttctgtga accccagtgt aaccaccatc    540
aaaaccattg aagaaaattc ttttgggagc caaacccacg aagctgccag taactcagat    600
tctagccatg aaggtcaaga ggaatcttca aaggaaaatg tgtcatcaaa tgctgcctgc    660
cctgaccaca ccccaacacc taatgatgat ggcaaatcac atgaactgtc taaccttcga    720
ctggagaatc agctgctgag gaatgaagtt cagtctttaa atcaagaaat ggcctcgtta    780
ctccaaagat ccaaagagac tcaagaagaa ttaaacaaag caagagcaag agttgaaaag    840
tggaatgctg accattcaaa gagtgatcga atgactcgag gactccgagc ccaagtagat    900
gacctgactg aagctgtggc tgcaaaggat tcccagctgg ctgtactgaa agtgagactc    960
caggaagctg accagctact gagtactcgc acagaagcat tagaagcctt acagagtgaa    1020
aaatcacgaa taatgcagga tcaaagtgaa ggtaacagcc tgcagaatca agctctgcag    1080
actcttcagg agagactgca tgaagcggat gccactctga agagagagca ggagagctat    1140
aaacagatgc agagcgagtt tgctgcacgc cttaataaag tggaaatgga acgtcagaat    1200
ttagcagaag caattacact ggccgaaaga aaatactcag atgagaagaa gagggttgat    1260
gaactgcagc agcaagtcaa gctgtataag ttgaacttgg agtcctctaa gcaggaatta    1320
attgactaca agcaaaaagc tactagaata ctgcaatcta aggaaaaatt gattaacagc    1380
ttgaaagaag gctctggttt tgaaggccta gatagcagca ctgccagtag catggagctg    1440
gaagaacttc ggcatgagaa agagatgcag agggaggaaa tacagaagct gatgggccag    1500
atacatcagc tcagatccga attacaggat atggaggcac agcaagttaa tgaagcagaa    1560
tcagcaagag aacagttaca ggatctgcat gaccaaatag ctgggcagaa agcatccaaa    1620
caagaactag agacagaact ggagcgactg aagcaggagt tccactatat agaagaagat    1680
ctttatcgaa caaagaacac attgcaaagc agaattaaag atcgagacga agaaattcaa    1740
aaactcagga atcagcttac caataaaact ttaagcaata gcagtcagtc tgagttagaa    1800
aatcgactcc atcagctaac agagactctc atccagaaac agaccatgct ggagagtctc    1860
agcacagaaa agaactccct ggtctttcaa ctggagcgcc tcgaacagca gatgaactcc    1920
gcctctggaa gtagtagtaa tgggtcttcg attaatatgt ctggaattga caatggtgaa    1980
ggcactcgtc tgcgaaatgt tcctgttctt tttaatgaca cagaaactaa tctggcagga    2040
atgtacggaa aagttcgcaa agctgctagt tcaattgatc agtttagtat tcgcctggga    2100
atttttctcc gaagataccc catagcgcga gtttttgtaa ttatatatat ggctttgctt    2160
cacctctggg tcatgattgt tctgttgact tacacaccag aaatgcacca cgaccaacca    2220
tatggcaaat gaaccaagcc cagttg                                         2246
<210>26
<211>731
<212>PRT
<213>人类
<400>26
Met Ser Trp Phe Val Asp Leu Ala Gly Lys Ala Glu Asp Leu Leu Asn
  1               5                  10                  15
Arg Val Asp Gln Gly Ala Ala Thr Ala Leu Ser Arg Lys Asp Asn Ala
             20                  25                  30
Ser Asn Ile Tyr Ser Lys Asn Thr Asp Tyr Thr Glu Leu His Gln Gln
         35                  40                  45
Asn Thr Asp Leu Ile Tyr Gln Thr Gly Pro Lys Ser Thr Tyr Ile Ser
     50                  55                  60
Ser Ala Ala Asp Asn Ile Arg Asn Gln Lys Ala Thr Ile Leu Ala Gly
 65                  70                  75                  80
Thr Ala Asn Val Lys Val Gly Ser Arg Thr Pro Val Glu Ala Ser His
                 85                  90                  95
Pro Val Glu Asn Ala Ser Val Pro Arg Pro Ser Ser His Phe Val Arg
            100                 105                 110
Arg Lys Lys Ser Glu Pro Asp Asp Glu Leu Leu Phe Asp Phe Leu Asn
        115                 120                 125
Ser Ser Gln Lys Glu Pro Thr Gly Arg Val Glu Ile Arg Lys Glu Lys
    130                 135                 140
Gly Lys Thr Pro Val Phe Gln Ser Ser Gln Thr Ser Ser Val Ser Ser
145                 150                 155                 160
Val Asn Pro Ser Val Thr Thr Ile Lys Thr Ile Glu Glu Asn Ser Phe
                165                 170                 175
Gly Ser Gln Thr His Glu Ala Ala Ser Asn Ser Asp Ser Ser His Glu
            180                 185                 190
Gly Gln Glu Glu Ser Ser Lys Glu Asn Val Ser Ser Asn Ala Ala Cys
        195                 200                 205
Pro Asp His Thr Pro Thr Pro Asn Asp Asp Gly Lys Ser His Glu Leu
    210                 215                 220
Ser Asn Leu Arg Leu Glu Asn Gln Leu Leu Arg Asn Glu Val Gln Ser
225                 230                 235                 240
Leu Asn Gln Glu Met Ala Ser Leu Leu Gln Arg Ser Lys Glu Thr Gln
                245                 250                 255
Glu Glu Leu Asn Lys Ala Arg Ala Arg Val Glu Lys Trp Asn Ala Asp
            260                 265                 270
His Ser Lys Ser Asp Arg Met Thr Arg Gly Leu Arg Ala Gln Val Asp
        275                 280                 285
Asp Leu Thr Glu Ala Val Ala Ala Lys Asp Ser Gln Leu Ala Val Leu
    290                 295                 300
Lys Val Arg Leu Gln Glu Ala Asp Gln Leu Leu Ser Thr Arg Thr Glu
305                 310                 315                 320
Ala Leu Glu Ala Leu Gln Ser Glu Lys Ser Arg Ile Met Gln Asp Gln
                325                 330                 335
Ser Glu Gly Asn Ser Leu Gln Asn Gln Ala Leu Gln Thr Leu Gln Glu
            340                 345                 350
Arg Leu His Glu Ala Asp Ala Thr Leu Lys Arg Glu Gln Glu Ser Tyr
        355                 360                 365
Lys Gln Met Gln Ser Glu Phe Ala Ala Arg Leu Asn Lys Val Glu Met
    370                 375                 380
Glu Arg Gln Asn Leu Ala Glu Ala Ile Thr Leu Ala Glu Arg Lys Tyr
385                 390                 395                 400
Ser Asp Glu Lys Lys Arg Val Asp Glu Leu Gln Gln Gln Val Lys Leu
                405                 410                 415
Tyr Lys Leu Asn Leu Glu Ser Ser Lys Gln Glu Leu Ile Asp Tyr Lys
            420                 425                 430
Gln Lys Ala Thr Arg Ile Leu Gln Ser Lys Glu Lys Leu Ile Asn Ser
        435                 440                 445
Leu Lys Glu Gly Ser Gly Phe Glu Gly Leu Asp Ser Ser Thr Ala Ser
    450                 455                 460
Ser Met Glu Leu Glu Glu Leu Arg His Glu Lys Glu Met Gln Arg Glu
465                 470                 475                 480
Glu Ile Gln Lys Leu Met Gly Gln Ile His Gln Leu Arg Ser Glu Leu
                485                 490                 495
Gln Asp Met Glu Ala Gln Gln Val Asn Glu Ala Glu Ser Ala Arg Glu
            500                 505                 510
Gln Leu Gln Asp Leu His Asp Gln Ile Ala Gly Gln Lys Ala Ser Lys
        515                 520                 525
Gln Glu Leu Glu Thr Glu Leu Glu Arg Leu Lys Gln Glu Phe His Tyr
    530                 535                 540
Ile Glu Glu Asp Leu Tyr Arg Thr Lys Asn Thr Leu Gln Ser Arg Ile
545                 550                 555                 560
Lys Asp Arg Asp Glu Glu Ile Gln Lys Leu Arg Asn Gln Leu Thr Asn
                565                 570                 575
Lys Thr Leu Ser Asn Ser Ser Gln Ser Glu Leu Glu Asn Arg Leu His
            580                 585                 590
Gln Leu Thr Glu Thr Leu Ile Gln Lys Gln Thr Met Leu Glu Ser Leu
        595                 600                 605
Ser Thr Glu Lys Asn Ser Leu Val Phe Gln Leu Glu Arg Leu Glu Gln
    610                 615                 620
Gln Met Asn Ser Ala Ser Gly Ser Ser Ser Asn Gly Ser Ser Ile Asn
625                 630                 635                 640
Met Ser Gly Ile Asp Asn Gly Glu Gly Thr Arg Leu Arg Asn Val Pro
                645                 650                 655
Val Leu Phe Asn Asp Thr Glu Thr Asn Leu Ala Gly Met Tyr Gly Lys
            660                 665                 670
Val Arg Lys Ala Ala Ser Ser Ile Asp Gln Phe Ser Ile Arg Leu Gly
        675                 680                 685
Ile Phe Leu Arg Arg Tyr Pro Ile Ala Arg Val Phe Val Ile Ile Tyr
    690                 695                 700
Met Ala Leu Leu His Leu Trp Val Met Ile Val Leu Leu Thr Tyr Thr
705                 710                 715                 720
Pro Glu Met His His Asp Gln Pro Tyr Gly Lys
                725                 730
<210>27
<211>16
<212>DNA
<213>人工序列
<220>
<223>用于PIG31的锚定引物
<400>27
aagctttttt tttttg                                                    16
<210>28
<211>13
<212>DNA
<213>人工序列
<220>
<223>用于PIG31的H-AP34引物
<400>28
aagcttcagc agc                                                       13
<210>29
<211>1973
<212>DNA
<213>人类
<400>29
gcccctctgg acactcataa ttcaatggta gatgcaggtg gagttgagaa catcacccag    60
cttccccagg agcttcctca gatgatggct gcagcagccg atggtttggg gagtatagcg    120
atagacacga cccagctcaa catgtccgtg acagatccca cagcctgggc tacagccatg    180
aataacctgg gcatggttcc cgtagggtcg cctggacagc agctcgtgtc tgactcaatc    240
tgtgtcccag gctttgatcc aagcctcaac atgatgactg gaatcacccc cattaaccca    300
atgataccag gccttggact ggtacctccc ccaccaccaa cagaagtggc tgttgtcaaa    360
gaaataatcc actgcaaaag ctgtactctt tttcctcaaa atccaaatct tccacctcct    420
tccacaagag aacgacctcc tgggtgtaag accgtgtttg tcggaggatt accagaaaat    480
gctactgagg aaattattca agaagtcttt gaacagtgcg gtgatattac agcaattcgg    540
aaaagcaaga agaatttttg tcacattcgc tttgcagagg aattcatggt tgataaagcc    600
atttaccttt ctggttatag gatgcgatta gggtctagca ccgacaaaaa ggattcaggc    660
cgccttcatg tggactttgc ccaggccagg gatgacttct atgagtggga atgcaagcag    720
aggatgcgtg cccgggagga gcggcaccgg cgcaagctgg aggaggaccg gctcaggccc    780
ccatccccgc ctgccataat gcactactcg gagcacgaag ccgctctgct ggctgaaaag    840
ctgaaagatg atagcaagtc ttcagaggct atcacagtgc tgctttcctg gattgaacga    900
ggggaagtga atcggcgctc tgcaaaccag ttctattcca tggtgcagtc ggccaacagc    960
cacgtccgcc ggctaatgaa tgaaaaagcc acccatgagc aagagatgga ggaagccaag    1020
gagaatttta aaaatgcctt aactgggatt ctcactcaat ttgagcagat tgtggccgtt    1080
ttcaacgctt ctaccagaca aaaagcttgg gaccatttct cgaaagccca gcgcaagaac    1140
atagacattt ggcgaaagca ttctgaggag ctccggaatg ctcaaagtga gcagctcatg    1200
ggcatccgcc gcgaagaaga aatggaaatg tctgatgatg agaactgtga cagccctaca    1260
aagaaaatga gagtcgatga atcagccctg gctgcccagg cctacgctct gaaagaggag    1320
aatgacagtc tccgctggca gctggatgcc tacaggaatg aggtggagct gctgaaacaa    1380
gaaaaagaac agcttttccg aacagaagaa aacctcacca aggaccagca actgcagttt    1440
ctgcagcaaa ccatgcaagg catgcagcag caattgctaa ccatccagga ggagttaaac    1500
aacaaaaagt cagaattgga acaagcaaag gaagagcagt cccatacaca agcgttacta    1560
aaagtcctgc aggaacaatt aaaaggtacc aaggaattgg tcgagaccaa tggccacagc    1620
catgaggatt caaatgaaat caatgtgttg acagttgcat tagtcaacca agaccgagag    1680
aacaatattg agaaaagaag ccaaggctta aaatcagaga aagaagctct actaataggt    1740
atcatatcaa cgtttcttca cgtccatcct tttggagcca acatagaata tctttggtca    1800
tacatgcagc agctggactc caagatatct gcaaatgaaa tagaaatgct tttgatgagg    1860
ctgccacgca tgttcaaaca ggaattcacg ggtgtgggag ccacgctgga aaaaagatgg    1920
aagctgtgtg cctttgaagg aattaaaact acctaactgc gaagagcaaa gca           1973
<210>30
<211>643
<212>PRT
<213>人类
<400>30
Met Val Asp Ala Gly Gly Val Glu Asn Ile Thr Gln Leu Pro Gln Glu
  1               5                  10                  15
Leu Pro Gln Met Met Ala Ala Ala Ala Asp Gly Leu Gly Ser Ile Ala
             20                  25                  30
Ile Asp Thr Thr Gln Leu Asn Met Ser Val Thr Asp Pro Thr Ala Trp
         35                  40                  45
Ala Thr Ala Met Asn Asn Leu Gly Met Val Pro Val Gly Ser Pro Gly
     50                  55                  60
Gln Gln Leu Val Ser Asp Ser Ile Cys Val Pro Gly Phe Asp Pro Ser
 65                  70                  75                  80
Leu Asn Met Met Thr Gly Ile Thr Pro Ile Asn Pro Met Ile Pro Gly
                 85                  90                  95
Leu Gly Leu Val Pro Pro Pro Pro Pro Thr Glu Val Ala Val Val Lys
            100                 105                 110
Glu Ile Ile His Cys Lys Ser Cys Thr Leu Phe Pro Gln Asn Pro Asn
        115                 120                 125
Leu Pro Pro Pro Ser Thr Arg Glu Arg Pro Pro Gly Cys Lys Thr Val
    130                 135                 140
Phe Val Gly Gly Leu Pro Glu Asn Ala Thr Glu Glu Ile Ile Gln Glu
145                 150                 155                 160
Val Phe Glu Gln Cys Gly Asp Ile Thr Ala Ile Arg Lys Ser Lys Lys
                165                 170                 175
Asn Phe Cys His Ile Arg Phe Ala Glu Glu Phe Met Val Asp Lys Ala
            180                 185                 190
Ile Tyr Leu Ser Gly Tyr Arg Met Arg Leu Gly Ser Ser Thr Asp Lys
        195                 200                 205
Lys Asp Ser Gly Arg Leu His Val Asp Phe Ala Gln Ala Arg Asp Asp
    210                 215                 220
Phe Tyr Glu Trp Glu Cys Lys Gln Arg Met Arg Ala Arg Glu Glu Arg
225                 230                 235                 240
His Arg Arg Lys Leu Glu Glu Asp Arg Leu Arg Pro Pro Ser Pro Pro
                245                 250                 255
Ala Ile Met His Tyr Ser Glu His Glu Ala Ala Leu Leu Ala Glu Lys
            260                 265                 270
Leu Lys Asp Asp Ser Lys Ser Ser Glu Ala Ile Thr Val Leu Leu Ser
        275                 280                 285
Trp Ile Glu Arg Gly Glu Val Asn Arg Arg Ser Ala Asn Gln Phe Tyr
    290                 295                 300
Ser Met Val Gln Ser Ala Asn Ser His Val Arg Arg Leu Met Asn Glu
305                 310                 315                 320
Lys Ala Thr His Glu Gln Glu Met Glu Glu Ala Lys Glu Asn Phe Lys
                325                 330                 335
Asn Ala Leu Thr Gly Ile Leu Thr Gln Phe Glu Gln Ile Val Ala Val
            340                 345                 350
Phe Asn Ala Ser Thr Arg Gln Lys Ala Trp Asp His Phe Ser Lys Ala
        355                 360                 365
Gln Arg Lys Asn Ile Asp Ile Trp Arg Lys His Ser Glu Glu Leu Arg
    370                 375                 380
Asn Ala Gln Ser Glu Gln Leu Met Gly Ile Arg Arg Glu Glu Glu Met
385                 390                 395                 400
Glu Met Ser Asp Asp Glu Asn Cys Asp Ser Pro Thr Lys Lys Met Arg
                405                 410                 415
Val Asp Glu Ser Ala Leu Ala Ala Gln Ala Tyr Ala Leu Lys Glu Glu
            420                 425                 430
Asn Asp Ser Leu Arg Trp Gln Leu Asp Ala Tyr Arg Asn Glu Val Glu
        435                 440                 445
Leu Leu Lys Gln Glu Lys Glu Gln Leu Phe Arg Thr Glu Glu Asn Leu
    450                 455                 460
Thr Lys Asp Gln Gln Leu Gln Phe Leu Gln Gln Thr Met Gln Gly Met
465                 470                 475                 480
Gln Gln Gln Leu Leu Thr Ile Gln Glu Glu Leu Asn Asn Lys Lys Ser
                485                 490                 495
Glu Leu Glu Gln Ala Lys Glu Glu Gln Ser His Thr Gln Ala Leu Leu
            500                 505                 510
Lys Val Leu Gln Glu Gln Leu Lys Gly Thr Lys Glu Leu Val Glu Thr
        515                 520                 525
Asn Gly His Ser His Glu Asp Ser Asn Glu Ile Asn Val Leu Thr Val
    530                 535                 540
Ala Leu Val Asn Gln Asp Arg Glu Asn Asn Ile Glu Lys Arg Ser Gln
545                 550                 555                 560
Gly Leu Lys Ser Glu Lys Glu Ala Leu Leu Ile Gly Ile Ile Ser Thr
                565                 570                 575
Phe Leu His Val His Pro Phe Gly Ala Asn Ile Glu Tyr Leu Trp Ser
            580                 585                 590
Tyr Met Gln Gln Leu Asp Ser Lys Ile Ser Ala Asn Glu Ile Glu Met
        595                 600                 605
Leu Leu Met Arg Leu Pro Arg Met Phe Lys Gln Glu Phe Thr Gly Val
    610                 615                 620
Gly Ala Thr Leu Glu Lys Arg Trp Lys Leu Cys Ala Phe Glu Gly Ile
625                 630                 635                 640
Lys Thr Thr
<210>31
<211>16
<212>DNA
<213>人工序列
<220>
<223>用于PIG38的锚定引物
<400>31
aagctttttt tttttc                                                    16
<210>32
<211>13
<212>DNA
<213>人工序列
<220>
<223>用于PIG38的H-AP10引物
<400>32
aagcttccac gta                                                       13
<210>33
<211>1586
<212>DNA
<213>人类
<400>33
ggagggtggt gtccactgcc cagttccgtg tcccgatgcc cagcgccagc gccagccgca    60
agagtcagga gaagccgcgg gagatcatgg acgcggcgga agattatgct aaagagagat    120
atggaatatc ttcaatgata caatcacaag aaaaaccaga tcgagttttg gttcgggtta    180
gagacttgac aatacaaaaa gctgatgaag ttgtttgggt acgtgcaaga gttcatacaa    240
gcagagctaa agggaaacag tgcttcttag tcctacgtca gcagcagttt aatgtccagg    300
ctcttgtggc ggtgggagac catgcaagca agcagatggt taaatttgct gccaacatca    360
acaaagagag cattgtggat gtagaaggtg ttgtgagaaa agtgaatcag aaaattggaa    420
gctgtacaca gcaagacgtt gagttacatg ttcagaagat ttatgtgatc agtttggctg    480
aaccccgtct gcccctgcag ctggatgatg ctgttcggcc tgaggcagaa ggagaagagg    540
aaggaagagc tactgttaac caggatacaa gattagacaa cagagtcatt gatcttagga    600
catcaactag tcaggcagtc ttccgtctcc agtctggcat ctgccatctc ttccgagaaa    660
ctttaattaa caaaggtttt gtggaaatcc aaactcctaa aattatttca gctgccagtg    720
aaggaggagc caatgttttt actgtgtcat attttaaaaa taatgcatac ctggctcagt    780
ccccacagct atataagcaa atgtgcattt gtgctgattt tgagaaggtt ttctctattg    840
gaccagtatt cagagcggaa gactctaata cccatagaca tctaactgag tttgttggtt    900
tggacattga aatggctttt aattaccatt accacgaagt tatggaagaa attgctgaca    960
ccatggtaca catattcaaa ggacttcaag aaaggtttca gactgaaatt caaacagtga    1020
ataaacagtt cccatgtgag ccattcaaat ttttggagcc aactctaaga ctagaatatt    1080
gtgaagcatt ggctatgctt agggaagctg gagtcgaaat gggagatgaa gacgatctga    1140
gcacaccaaa tgaaaagctg ttgggtcatt tggtaaagga aaagtatgat acagattttt    1200
atattcttga taaatatcca ttggctgtaa gacctttcta taccatgcct gacccaagaa    1260
atcccaaaca gtccaactct tacgatatgt tcatgagagg agaagaaata ttgtcaggag    1320
ctcaaagaat acatgatcct caactgctaa cagagagagc tttacatcat ggaattgatt    1380
tggagaaaat taaggcttac attgattcct tccgctttgg agcccctcct catgctggtg    1440
gaggcattgg attggaacga gttactatgc tgtttctggg attgcataat gttcgtcaga    1500
cctccatgtt ccctcgtgat cccaaacgac tcactcctta aattcacact ttgccactta    1560
actccagtgt ggatgacaga gcgaga                                         1586
<210>34
<211>501
<212>PRT
<213>人类
<400>34
Met Pro Ser Ala Ser Ala Ser Arg Lys Ser Gln Glu Lys Pro Arg Glu
  1               5                  10                  15
Ile Met Asp Ala Ala Glu Asp Tyr Ala Lys Glu Arg Tyr Gly Ile Ser
             20                  25                  30
Ser Met Ile Gln Ser Gln Glu Lys Pro Asp Arg Val Leu Val Arg Val
         35                  40                  45
Arg Asp Leu Thr Ile Gln Lys Ala Asp Glu Val Val Trp Val Arg Ala
     50                  55                  60
Arg Val His Thr Ser Arg Ala Lys Gly Lys Gln Cys Phe Leu Val Leu
 65                  70                  75                  80
Arg Gln Gln Gln Phe Asn Val Gln Ala Leu Val Ala Val Gly Asp His
                 85                  90                  95
Ala Ser Lys Gln Met Val Lys Phe Ala Ala Asn Ile Asn Lys Glu Ser
            100                 105                 110
Ile Val Asp Val Glu Gly Val Val Arg Lys Val Asn Gln Lys Ile Gly
        120                 120                 125
Ser Cys Thr Gln Gln Asp Val Glu Leu His Val Gln Lys Ile Tyr Val
    130                 135                 140
Ile Ser Leu Ala Glu Pro Arg Leu Pro Leu Gln Leu Asp Asp Ala Val
145                 150                 155                 160
Arg Pro Glu Ala Glu Gly Glu Glu Glu Gly Arg Ala Thr Val Asn Gln
                165                 170                 175
Asp Thr Arg Leu Asp Asn Arg Val Ile Asp Leu Arg Thr Ser Thr Ser
            180                 185                 190
Gln Ala Val Phe Arg Leu Gln Ser Gly Ile Cys His Leu Phe Arg Glu
        195                 200                 205
Thr Leu Ile Asn Lys Gly Phe Val Glu Ile Gln Thr Pro Lys Ile Ile
    210                 215                 220
Ser Ala Ala Ser Glu Gly Gly Ala Asn Val Phe Thr Val Ser Tyr Phe
225                 230                 235                 240
Lys Asn Asn Ala Tyr Leu Ala Gln Ser Pro Gln Leu Tyr Lys Gln Met
                245                 250                 255
Cys Ile Cys Ala Asp Phe Glu Lys Val Phe Ser Ile Gly Pro Val Phe
            260                 265                 270
Arg Ala Glu Asp Ser Asn Thr His Arg His Leu Thr Glu Phe Val Gly
        275                 280                 285
Leu Asp Ile Glu Met Ala Phe Asn Tyr His Tyr His Glu Val Met Glu
    290                 295                 300
Glu Ile Ala Asp Thr Met Val His Ile Phe Lys Gly Leu Gln Glu Arg
305                 310                 315                 320
Phe Gln Thr Glu Ile Gln Thr Val Asn Lys Gln Phe Pro Cys Glu Pro
                325                 330                 335
Phe Lys Phe Leu Glu Pro Thr Leu Arg Leu Glu Tyr Cys Glu Ala Leu
            340                 345                 350
Ala Met Leu Arg Glu Ala Gly Val Glu Met Gly Asp Glu Asp Asp Leu
        355                 360                 365
Ser Thr Pro Asn Glu Lys Leu Leu Gly His Leu Val Lys Glu Lys Tyr
    370                 375                 380
Asp Thr Asp Phe Tyr Ile Leu Asp Lys Tyr Pro Leu Ala Val Arg Pro
385                 390                 395                 400
Phe Tyr Thr Met Pro Asp Pro Arg Asn Pro Lys Gln Ser Asn Ser Tyr
                405                 410                 415
Asp Met Phe Met Arg Gly Glu Glu Ile Leu Ser Gly Ala Gln Arg Ile
            420                 425                 430
His Asp Pro Gln Leu Leu Thr Glu Arg Ala Leu His His Gly Ile Asp
        435                 440                 445
Leu Glu Lys Ile Lys Ala Tyr Ile Asp Ser Phe Arg Phe Gly Ala Pro
    450                 455                 460
Pro His Ala Gly Gly Gly Ile Gly Leu Glu Arg Val Thr Met Leu Phe
465                 470                 475                 480
Leu Gly Leu His Asn Val Arg Gln Thr Ser Met Phe Pro Arg Asp Pro
                485                 490                 495
Lys Arg Leu Thr Pro
            500
<210>35
<211>16
<212>DNA
<213>人工序列
<220>
<223>用于PIG40的锚定引物
<400>35
aagctttttt tttttc                     16
<210>36
<211>13
<212>DNA
<213>人工序列
<220>
<223>用于PIG40的H-AP11引物
<400>36
aagcttcggg taa                        13
<210>37
<211>1245
<212>DNA
<213>人类
<400>37
aagagggcaa ccctaacgat acgcttgact ttctgtggct gggaacacct tccaccatga    60
ccacctcagc aagttcccac ttaaataaag gcatcaagca ggtgtacatg tccctgcctc    120
agggtgagaa agtccaggcc atgtatatct ggatcgatgg tactggagaa ggactgcgct    180
gcaagacccg gaccctggac agtgagccca agtgtgtgga agagttgcct gagtggaatt    240
tcgatggctc cagtacttta cagtctgagg gttccaacag tgacatgtat ctcgtgcctg    300
ctgccatgtt tcgggacccc ttccgtaagg accctaacaa gctggtgtta tgtgaagttt    360
tcaagtacaa tcgaaggcct gcagagacca atttgaggca cacctgtaaa cggataatag    420
acatggtgag caaccagcac ccctggtttg gcatggagca ggagtatacc ctcatgggga    480
cagatgggca cccctttggt tggccttcca acggcttcca gggccccagg gtccatatta    540
ctgtggtgtg ggagcagaca gagcctatgg cagggacatc gtggaggccc attaccgggc    600
ctgcttgtat gctggagtca agattgcggg gactaatgcc gaggtcatgc ctgcccagtg    660
ggaatttcag attggacctt gtgaaggaat cagcatggga gatcatctct gggtggcccg    720
tttcatcttg catcgtgtgt gtgaagactt tggagtgata gcaacctttg atcctaagcc    780
cattcctggg aactggaatg gtgcaggctg ccataccaac ttcagcacca aggccatgcg    840
ggaggagaat ggtctgaagt acatcgagga ggccattgag aaactaagca agcggcacca    900
gtaccacatc cgtgcctatg atcccaaggg aggcctggac aatgcccgac gtctaactgg    960
attccatgaa acctccaaca tcaacgactt ttctgctggt gtagccaatc gtagcgccag    1020
catacgcatt ccccggactg ttggccagga gaagaagggt tactttgaag atcgtcgccc    1080
ctctgccaac tgcgacccct tttcggtgac agaagccctc atccgcacgt gtcttctcaa    1140
tgaaaccggc gatgagccct tccagtacaa aaattaagtg gactagacct ccagctgttg    1200
agcccctcct agttcttcat cccactccaa ctcttccccc tctca                    1245
<210>38
<211>233
<212>PRT
<213>人类
<400>38
Met Thr Thr Ser Ala Ser Ser His Leu Asn Lys Gly Ile Lys Gln Val
  1               5                  10                  15
Tyr Met Ser Leu Pro Gln Gly Glu Lys Val Gln Ala Met Tyr Ile Trp
             20                  25                  30
Ile Asp Gly Thr Gly Glu Gly Leu Arg Cys Lys Thr Arg Thr Leu Asp
         35                  40                  45
Ser Glu Pro Lys Cys Val Glu Glu Leu Pro Glu Trp Asn Phe Asp Gly
     50                  55                  60
Ser Ser Thr Leu Gln Ser Glu Gly Ser Asn Ser Asp Met Tyr Leu Val
 65                  70                  75                  80
Pro Ala Ala Met Phe Arg Asp Pro Phe Arg Lys Asp Pro Asn Lys Leu
                 85                  90                  95
Val Leu Cys Glu Val Phe Lys Tyr Asn Arg Arg Pro Ala Glu Thr Asn
            100                 105                 110
Leu Arg His Thr Cys Lys Arg Ile Ile Asp Met Val Ser Asn Gln His
        115                 120                 125
Pro Trp Phe Gly Met Glu Gln Glu Tyr Thr Leu Met Gly Thr Asp Gly
    130                 135                 140
His Pro Phe Gly Trp Pro Ser Asn Gly Phe Gln Gly Pro Arg Val His
145                 150                 155                 160
Ile Thr Val Val Trp Glu Gln Thr Glu Pro Met Ala Gly Thr Ser Trp
                165                 170                 175
Arg Pro Ile Thr Gly Pro Ala Cys Met Leu Glu Ser Arg Leu Arg Gly
            180                 185                 190
Leu Met Pro Arg Ser Cys Leu Pro Ser Gly Asn Phe Arg Leu Asp Leu
        195                 200                 205
Val Lys Glu Ser Ala Trp Glu Ile Ile Ser Gly Trp Pro Val Ser Ser
    210                 215                 220
Cys Ile Val Cys Val Lys Thr Leu Glu
225                 230
<210>39
<211>16
<212>DNA
<213>人工序列
<220>
<223>用于PIG43的锚定引物
<400>39
aagctttttt tttttg                     16
<210>40
<211>13
<212>DNA
<213>人工序列
<220>
<223>用于PIG43的H-AP11引物
<400>40
aagcttcggg taa                        13
<210>41
<211>1721
<212>DNA
<213>人类
<400>41
ggcaaggatc ttgttccaaa tcatctttca tattaccttt ataatcatgt ggctatgtgg    60
ccggaacaaa gtgacaaatg gcctacagct gtgagagcaa atggacatct cctcctgaac    120
tctgagaaga tgtcaaaatc cacaggcaac ttcctcactt tgacccaagc tattgacaaa    180
ttttcagcag atggaatgcg tttggctctg gctgatgctg gtgacactgt agaagatgcc    240
aactttgtgg aagccatggc agatgcaggt attctccgtc tgtacacctg ggtagagtgg    300
gtgaaagaaa tggttgccaa ctgggacagc ctaagaagtg gtcctgccag cactttcaat    360
gatagagttt ttgccagtga attgaatgca ggaattataa aaacagatca aaactatgaa    420
aagatgatgt ttaaagaagc tttgaaaaca gggttttttg agtttcaggc cgcaaaagat    480
aagtaccgtg aattggctgt ggaagggatg cacagagaac ttgtgttccg gtttattgaa    540
gttcagacac ttctcctcgc tccattctgt ccacatttgt gtgagcacat ctggacactc    600
ctgggaaagc ctgactcaat tatgaatgct tcatggcctg tggcaggtcc tgttaatgaa    660
gttttaatac actcctcaca gtatcttatg gaagtaacac atgaccttag actacgactc    720
aagaactata tgatgccagc taaagggaag aagactgaca aacaacccct gcagaagccc    780
tcacattgca ccatctatgt ggcaaagaac tatccacctt ggcaacatac caccctgtct    840
gttctacgta aacactttga ggccaataac ggaaaactgc ctgacaacaa agtcattgct    900
agtgaactag gcagtatgcc agaactgaag aaatacatga agaaagtcat gccatttgtt    960
gccatgatta aggaaaatct ggagaagatg gggcctcgta ttctggattt gcaattagaa    1020
tttgatgaaa aggctgtgct tatggagaat atagtctatc tgactaattc gcttgagcta    1080
gaacacatag aagtcaagtt tgcctccgaa gcagaagata aaatcaggga agactgctgt    1140
cctgggaaac cacttaatgt ttttagaata gaacctggtg tgtccgtttc tctggtgaat    1200
ccccagccat ccaatggcca cttctcaacc aaaattgaaa tcaggcaagg agataactgt    1260
gattccataa tcaggcgttt aatgaaaatg aatcgaggaa ttaaagacct ttccaaagtg    1320
aaactgatga gatttgatga tccactgttg gggcctcgac gagttcctgt cctgggaaag    1380
gagtacaccg agaagacccc catttctgag catgctgttt tcaatgtgga cctcatgagc    1440
aagaaaattc atctgactga gaatgggata agggtggata ttggcgatac aataatctat    1500
ctggttcatt aaactcatgc acattggaga tttatcctgg tttcttagga atactactac    1560
tctgattgtg tctactgatt ggctatcaga accttaggct ggacctaaat agattgattt    1620
catttctaac catccaattc tgcatgtatt cataattcta tcaagtcatc tttgattcct    1680
ggacctaata aatttttttt ccctttcttt gggtgtccaa g                        1721
<210>42
<211>485
<212>PRT
<213>人类
<400>42
Met Trp Pro Glu Gln Ser Asp Lys Trp Pro Thr Ala Val Arg Ala Asn
  1               5                  10                  15
Gly His Leu Leu Leu Asn Ser Glu Lys Met Ser Lys Ser Thr Gly Asn
             20                  25                  30
Phe Leu Thr Leu Thr Gln Ala Ile Asp Lys Phe Ser Ala Asp Gly Met
         35                  40                  45
Arg Leu Ala Leu Ala Asp Ala Gly Asp Thr Val Glu Asp Ala Asn Phe
     50                  55                  60
Val Glu Ala Met Ala Asp Ala Gly Ile Leu Arg Leu Tyr Thr Trp Val
 65                  70                  75                  80
Glu Trp Val Lys Glu Met Val Ala Asn Trp Asp Ser Leu Arg Ser Gly
                 85                  90                  95
Pro Ala Ser Thr Phe Asn Asp Arg Val Phe Ala Ser Glu Leu Asn Ala
            100                 105                 110
Gly Ile Ile Lys Thr Asp Gln Asn Tyr Glu Lys Met Met Phe Lys Glu
        115                 120                 125
Ala Leu Lys Thr Gly Phe Phe Glu Phe Gln Ala Ala Lys Asp Lys Tyr
    130                 135                 140
Arg Glu Leu Ala Val Glu Gly Met His Arg Glu Leu Val Phe Arg Phe
145                 150                 155                 160
Ile Glu Val Gln Thr Leu Leu Leu Ala Pro Phe Cys Pro His Leu Cys
                165                 170                 175
Glu His Ile Trp Thr Leu Leu Gly Lys Pro Asp Ser Ile Met Asn Ala
            180                 185                 190
Ser Trp Pro Val Ala Gly Pro Val Asn Glu Val Leu Ile His Ser Ser
        195                 200                 205
Gln Tyr Leu Met Glu Val Thr His Asp Leu Arg Leu Arg Leu Lys Asn
    210                 215                 220
Tyr Met Met Pro Ala Lys Gly Lys Lys Thr Asp Lys Gln Pro Leu Gln
225                 230                 235                 240
Lys Pro Ser His Cys Thr Ile Tyr Val Ala Lys Asn Tyr Pro Pro Trp
                245                 250                 255
Gln His Thr Thr Leu Ser Val Leu Arg Lys His Phe Glu Ala Asn Asn
            260                 265                 270
Gly Lys Leu Pro Asp Asn Lys Val Ile Ala Ser Glu Leu Gly Ser Met
        275                 280                 285
Pro Glu Leu Lys Lys Tyr Met Lys Lys Val Met Pro Phe Val Ala Met
    290                 295                 300
Ile Lys Glu Asn Leu Glu Lys Met Gly Pro Arg Ile Leu Asp Leu Gln
305                 310                 315                 320
Leu Glu Phe Asp Glu Lys Ala Val Leu Met Glu Asn Ile Val Tyr Leu
                325                 330                 335
Thr Asn Ser Leu Glu Leu Glu His Ile Glu Val Lys Phe Ala Ser Glu
            340                 345                 350
Ala Glu Asp Lys Ile Arg Glu Asp Cys Cys Pro Gly Lys Pro Leu Asn
        355                 360                 365
Val Phe Arg Ile Glu Pro Gly Val Ser Val Ser Leu Val Asn Pro Gln
    370                 375                 380
Pro Ser Asn Gly His Phe Ser Thr Lys Ile Glu Ile Arg Gln Gly Asp
385                 390                 395                 400
Asn Cys Asp Ser Ile Ile Arg Arg Leu Met Lys Met Asn Arg Gly Ile
                405                 410                 415
Lys Asp Leu Ser Lys Val Lys Leu Met Arg Phe Asp Asp Pro Leu Leu
            420                 425                 430
Gly Pro Arg Arg Val Pro Val Leu Gly Lys Glu Tyr Thr Glu Lys Thr
        435                 440                 445
Pro Ile Ser Glu His Ala Val Phe Asn Val Asp Leu Met Ser Lys Lys
    450                 455                 460
Ile His Leu Thr Glu Asn Gly Ile Arg Val Asp Ile Gly Asp Thr Ile
465                 470                 475                 480
Ile Tyr Leu Val His
                485
<210>43
<211>16
<212>DNA
<213>人工序列
<220>
<223>用于PIG44的锚定引物
<400>43
aagctttttt tttttc                                                    16
<210>44
<211>13
<212>DNA
<213>人工序列
<220>
<223>用于PIG44的H-AP23引物
<400>44
aagcttggct atg                                                       13
<210>45
<211>1312
<212>DNA
<213>人类
<400>45
cagcatgagc ttcaccactc gctccacctt ctccaccaac taccggtccc tgggctctgt    60
ccaggcgccc agctacggcg cccggccggt cagcagcgcg gccagcgtct atgcaggcgc    120
tgggggctct ggttcccgga tctccgtgtc ccgctccacc agcttcaggg gcggcatggg    180
gtccgggggc ctggccaccg ggatagccgg gggtctggca ggaatgggag gcatccagaa    240
cgagaaggag accatgcaaa gcctgaacga ccgcctggcc tcttacctgg acagagtgag    300
gagcctggag accgagaacc ggaggctgga gagcaaaatc cgggagcact tggagaagaa    360
gggaccccag gtcagagact ggagccatta cttcaagatc atcgaggacc tgagggctca    420
gatcttcgca aatactgtgg acaatgcccg catcgttctg cagattgaca atgcccgtct    480
tgctgctgat gactttagag tcaagtatga gacagagctg gccatgcgcc agtctgtgga    540
gaacgacatc catgggctcc gcaaggtcat tgatgacacc aatatcacac gactgcagct    600
ggagacagag atcgaggctc tcaaggagga gctgctcttc atgaagaaga accacgaaga    660
ggaagtaaaa ggcctacaag cccagattgc cagctctggg ttgaccgtgg aggtagatgc    720
ccccaaatct caggacctcg ccaagatcat ggcagacatc cgggcccaat atgacgagct    780
ggctcggaag aaccgagagg agctagacaa gtactggtct cagcagattg aggagagcac    840
cacagtggtc accacacagt ctgctgaggt tggagctgct gagacgacgc tcacagagct    900
gagacgtaca gtccagtcct tggagatcga cctggactcc atgagaaatc tgaaggccag    960
cttggagaac agcctgaggg aggtggaggc ccgctacgcc ctacagatgg agcagctcaa    1020
cgggatcctg ctgcaccttg agtcagagct ggcacagacc cgggcagagg gacagcgcca    1080
ggcccaggag tatgaggccc tgctgaacat caaggtcaag ctggaggctg agatcgccac    1140
ctaccgccgc ctgctggaag atggcgagga ctttaatctt ggtgatgcct tggacagcag    1200
caactccatg caaaccatcc aaaagaccac cacccgccgg atagtggatg gcaaagtggt    1260
gtctgagacc aatgacacca aagttctgag gcattaagcc agcagaagca gg            1312
<210>46
<211>430
<212>PRT
<213>人类
<400>46
Met Ser Phe Thr Thr Arg Ser Thr Phe Ser Thr Asn Tyr Arg Ser Leu
  1               5                  10                  15
Gly Ser Val Gln Ala Pro Ser Tyr Gly Ala Arg Pro Val Ser Ser Ala
             20                  25                  30
Ala Ser Val Tyr Ala Gly Ala Gly Gly Ser Gly Ser Arg Ile Ser Val
         35                  40                  45
Ser Arg Ser Thr Ser Phe Arg Gly Gly Met Gly Ser Gly Gly Leu Ala
     50                  55                  60
Thr Gly Ile Ala Gly Gly Leu Ala Gly Met Gly Gly Ile Gln Asn Glu
 65                  70                  75                  80
Lys Glu Thr Met Gln Ser Leu Asn Asp Arg Leu Ala Ser Tyr Leu Asp
                 85                  90                  95
Arg Val Arg Ser Leu Glu Thr Glu Asn Arg Arg Leu Glu Ser Lys Ile
            100                 105                 110
Arg Glu His Leu Glu Lys Lys Gly Pro Gln Val Arg Asp Trp Ser His
        115                 120                 125
Tyr Phe Lys Ile Ile Glu Asp Leu Arg Ala Gln Ile Phe Ala Asn Thr
    130                 135                 140
Val Asp Asn Ala Arg Ile Val Leu Gln Ile Asp Asn Ala Arg Leu Ala
145                 150                 155                 160
Ala Asp Asp Phe Arg Val Lys Tyr Glu Thr Glu Leu Ala Met Arg Gln
                165                 170                 175
Ser Val Glu Asn Asp Ile His Gly Leu Arg Lys Val Ile Asp Asp Thr
            180                 185                 190
Asn Ile Thr Arg Leu Gln Leu Glu Thr Glu Ile Glu Ala Leu Lys Glu
        195                 200                 205
Glu Leu Leu Phe Met Lys Lys Asn His Glu Glu Glu Val Lys Gly Leu
    210                 215                 220
Gln Ala Gln Ile Ala Ser Ser Gly Leu Thr Val Glu Val Asp Ala Pro
225                 230                 235                 240
Lys Ser Gln Asp Leu Ala Lys Ile Met Ala Asp Ile Arg Ala Gln Tyr
                245                 250                 255
Asp Glu Leu Ala Arg Lys Asn Arg Glu Glu Leu Asp Lys Tyr Trp Ser
            260                 265                 270
Gln Gln Ile Glu Glu Ser Thr Thr Val Val Thr Thr Gln Ser Ala Glu
        275                 280                 285
Val Gly Ala Ala Glu Thr Thr Leu Thr Glu Leu Arg Arg Thr Val Gln
    290                 295                 300
Ser Leu Glu Ile Asp Leu Asp Ser Met Arg Asn Leu Lys Ala Ser Leu
305                 310                 315                 320
Glu Asn Ser Leu Arg Glu Val Glu Ala Arg Tyr Ala Leu Gln Met Glu
                325                 330                 335
Gln Leu Asn Gly Ile Leu Leu His Leu Glu Ser Glu Leu Ala Gln Thr
            340                 345                 350
Arg Ala Glu Gly Gln Arg Gln Ala Gln Glu Tyr Glu Ala Leu Leu Asn
        355                 360                 365
Ile Lys Val Lys Leu Glu Ala Glu Ile Ala Thr Tyr Arg Arg Leu Leu
    370                 375                 380
Glu Asp Gly Glu Asp Phe Asn Leu Gly Asp Ala Leu Asp Ser Ser Asn
385                 390                 395                 400
Ser Met Gln Thr Ile Gln Lys Thr Thr Thr Arg Arg Ile Val Asp Gly
                405                 410                 415
Lys Val Val Ser Glu Thr Asn Asp Thr Lys Val Leu Arg His
            420                 425                 430
<210>47
<211>16
<212>DNA
<213>人工序列
<220>
<223>用于PIG46的锚定引物
<400>47
aagctttttt ttttta                     16
<210>48
<211>13
<212>DNA
<213>人工序列
<220>
<223>用于PIG46的H-AP24引物
<400>48
aagcttcact agc                                                       13
<210>49
<211>827
<212>DNA
<213>人类
<400>49
ttctcctatc ggggtcacag ggacgctaag attgctacct ggactttcgt tgaccatgct    60
gtcccgggtg gtactttccg ccgccgccac agcggccccc tctctgaaga atgcagcctt    120
cctaggtcca ggggtattgc aggcaacaag gacctttcat acagggcagc cacaccttgt    180
ccctgtacca cctcttcctg aatacggagg aaaagttcgt tatggactga tccctgagga    240
attcttccag tttctttatc ctaaaactgg tgtaacagga ccctatgtac tcggaactgg    300
gcttatcttg tacgctttat ccaaagaaat atatgtgatt agcgcagaga ccttcactgc    360
cctatcagta ctaggtgtaa tggtctatgg aattaaaaaa tatggtccct ttgttgcaga    420
ctttgctgat aaactcaatg agcaaaaact tgcccaacta gaagaggcga agcaggcttc    480
catccaacac atccagaatg caattgatac ggagaagtca caacaggcac tggttcagaa    540
gcgccattac ctttttgatg tgcaaaggaa taacattgct atggctttgg aagttactta    600
ccgggaacga ctgtatagag tatataagga agtaaagaat cgcctggact atcatatatc    660
tgtgcagaac atgatgcgtc gaaaggaaca agaacacatg ataaattggg tggagaagca    720
cgtggtgcaa agcatctcca cacagcagga aaaggagaca attgccaagt gcattgcgga    780
cctaaagctg ctggcaaaga aggctcaagc acagccagtt atgtaaa                  827
<210>50
<211>256
<212>PRT
<213>人类
<400>50
Met Leu Ser Arg Val Val Leu Ser Ala Ala Ala Thr Ala Ala Pro Ser
  1               5                  10                  15
Leu Lys Asn Ala Ala Phe Leu Gly Pro Gly Val Leu Gln Ala Thr Arg
             20                  25                  30
Thr Phe His Thr Gly Gln Pro His Leu Val Pro Val Pro Pro Leu Pro
         35                  40                  45
Glu Tyr Gly Gly Lys Val Arg Tyr Gly Leu Ile Pro Glu Glu Phe Phe
     50                  55                  60
Gln Phe Leu Tyr Pro Lys Thr Gly Val Thr Gly Pro Tyr Val Leu Gly
 65                  70                  75                  80
Thr Gly Leu Ile Leu Tyr Ala Leu Ser Lys Glu Ile Tyr Val Ile Ser
                 85                  90                  95
Ala Glu Thr Phe Thr Ala Leu Ser Val Leu Gly Val Met Val Tyr Gly
            100                 105                 110
Ile Lys Lys Tyr Gly Pro Phe Val Ala Asp Phe Ala Asp Lys Leu Asn
        115                 120                 125
Glu Gln Lys Leu Ala Gln Leu Glu Glu Ala Lys Gln Ala Ser Ile Gln
    130                 135                 140
His Ile Gln Asn Ala Ile Asp Thr Glu Lys Ser Gln Gln Ala Leu Val
145                 150                 155                 160
Gln Lys Arg His Tyr Leu Phe Asp Val Gln Arg Asn Asn Ile Ala Met
                165                 170                 175
Ala Leu Glu Val Thr Tyr Arg Glu Arg Leu Tyr Arg Val Tyr Lys Glu
            180                 185                 190
Val Lys Asn Arg Leu Asp Tyr His Ile Ser Val Gln Asn Met Met Arg
        195                 200                 205
Arg Lys Glu Gln Glu His Met Ile Asn Trp Val Glu Lys His Val Val
    210                 215                 220
Gln Ser Ile Ser Thr Gln Gln Glu Lys Glu Thr Ile Ala Lys Cys Ile
225                 230                 235                 240
Ala Asp Leu Lys Leu Leu Ala Lys Lys Ala Gln Ala Gln Pro Val Met
                245                 250                 255
<210>51
<211>16
<212>DNA
<213>人工序列
<220>
<223>用于PIG47的锚定引物
<400>51
aagctttttt tttttc                     16
<210>52
<211>13
<212>DNA
<213>人工序列
<220>
<223>用于PIG47的H-AP5引物
<400>52
aagcttagta ggc                        13
<210>53
<211>1707
<212>DNA
<213>人类
<400>53
cagaaggttc tgccggttcc cccagctctg ggtacccggc tctgcatcgc gtcgccatga    60
tgggccatcg tccagtgctc gtgctcagcc agaacacaaa gcgtgaatcc ggaagaaaag    120
ttcaatctgg aaacatcaat gctgccaaga ctattgcaga tatcatccga acatgtttgg    180
gacccaagtc catgatgaag atgcttttgg acccaatggg aggcaatgtg atgaccaatg    240
atggcaatgc cattcttcga gagattcaag tccagcatcc agcggccaag tccatgatcg    300
aaattagccg gacccaggat gaagaggttg gagatgggac cacatcagta attattcttg    360
caggggaaat gctgtctgta gctgagcact tcctggagca gcagatgcac ccaacagtgg    420
tgatcagtgc ttaccgcaag gcattggatg atatgatcag caccctaaag aaaataagta    480
tcccagtcga catcagtgac agtgatatga tgctgaacat catcaacagc tctattacta    540
ccaaagccat cagtcggtgg tcatctttgg cttgcaacat tgccctggat gctgtcaaga    600
tggtacagtt tgaggagaat ggtcggaaag agattgacat aaaaaaatat gcaagagtgg    660
aaaagatacc tggaggcatc attgaagact cctgtgtctt gcgtggagtc atgattaaca    720
aggacgtgac ccatccacgt atgtggcgct atatcaagaa ccctcgcatt gtgctgctgg    780
attcttctct ggagtacaag aaaggagaaa gccagactga cattgagatt acacgagagg    840
aggacttcac ccgaattctc cagatggagg aagagtacat ccagcagctc tgtgaggaca    900
ttatccaact gaagcccgat gtggtcatca ctgaaaaggg catctcagat ttagctcagc    960
actaccttat gcgggccaat atcacagcca tccgcagagt ccggaagaca gacaataatc    1020
gcattgctag agcctgtggg gcccggatag tcagccgacc agaggaactg agagaagatg    1080
atattggaac aggagcaggc ctgttggaaa tcaagaaaat tggagatgaa tactttactt    1140
tcatcactga ctgcaaagac cccaaggcct gcaccattct cctccggggg gctagcaaag    1200
agattctctc ggaagtagaa cgcaacctcc aggatgccat gcaagtgtgt cgcaatgttc    1260
tcctggaccc tcagctggtg ccagggggtg gggcctccga gatggctgtg gcccatgcct    1320
tgacagaaaa atccaaggcc atgactggtg tggaacaatg gccatacagg gctgttgccc    1380
aggccctaga ggtcattcct cgtaccctga tccagaactg tggggccagc accatccgtc    1440
tacttacctc ccttcgggcc aagcacaccc aggagaactg tgagacctgg ggtgtaaatg    1500
gtgagacggg tactttggtg gacatgaagg aactgggcat atgggagcca ttggctgtga    1560
agctgcagac ttataagaca gcagtggaga cggcagttct gctactgcga attgatgaca    1620
tcgtttcagg ccacaaaaag aaaggcgatg accagagccg gcaaggcggg gctcctgatg    1680
ctggccagga gtgagtgcta ggcaagg                                        1707
<210>54
<211>545
<212>PRT
<213>人类
<400>54
Met Met Gly His Arg Pro Val Leu Val Leu Ser Gln Asn Thr Lys Arg
  1               5                  10                  15
Glu Ser Gly Arg Lys Val Gln Ser Gly Asn Ile Asn Ala Ala Lys Thr
             20                  25                  30
Ile Ala Asp Ile Ile Arg Thr Cys Leu Gly Pro Lys Ser Met Met Lys
         35                  40                  45
Met Leu Leu Asp Pro Met Gly Gly Asn Val Met Thr Asn Asp Gly Asn
     50                  55                  60
Ala Ile Leu Arg Glu Ile Gln Val Gln His Pro Ala Ala Lys Ser Met
 65                  70                  75                  80
Ile Glu Ile Ser Arg Thr Gln Asp Glu Glu Val Gly Asp Gly Thr Thr
                 85                  90                  95
Ser Val Ile Ile Leu Ala Gly Glu Met Leu Ser Val Ala Glu His Phe
            100                 105                 110
Leu Glu Gln Gln Met His Pro Thr Val Val Ile Ser Ala Tyr Arg Lys
        115                 120                 125
Ala Leu Asp Asp Met Ile Ser Thr Leu Lys Lys Ile Ser Ile Pro Val
    130                 135                 140
Asp Ile Ser Asp Ser Asp Met Met Leu Asn Ile Ile Asn Ser Ser Ile
145                 150                 155                 160
Thr Thr Lys Ala Ile Ser Arg Trp Ser Ser Leu Ala Cys Asn Ile Ala
                165                 170                 175
Leu Asp Ala Val Lys Met Val Gln Phe Glu Glu Asn Gly Arg Lys Glu
            180                 185                 190
Ile Asp Ile Lys Lys Tyr Ala Arg Val Glu Lys Ile Pro Gly Gly Ile
        195                 200                 205
Ile Glu Asp Ser Cys Val Leu Arg Gly Val Met Ile Asn Lys Asp Val
    210                 215                 220
Thr His Pro Arg Met Trp Arg Tyr Ile Lys Asn Pro Arg Ile Val Leu
225                 230                 235                 240
Leu Asp Ser Ser Leu Glu Tyr Lys Lys Gly Glu Ser Gln Thr Asp Ile
                245                 250                 255
Glu Ile Thr Arg Glu Glu Asp Phe Thr Arg Ile Leu Gln Met Glu Glu
            260                 265                 270
Glu Tyr Ile Gln Gln Leu Cys Glu Asp Ile Ile Gln Leu Lys Pro Asp
        275                 280                 285
Val Val Ile Thr Glu Lys Gly Ile Ser Asp Leu Ala Gln His Tyr Leu
    290                 295                 300
Met Arg Ala Asn Ile Thr Ala Ile Arg Arg Val Arg Lys Thr Asp Asn
305                 310                 315                 320
Asn Arg Ile Ala Arg Ala Cys Gly Ala Arg Ile Val Ser Arg Pro Glu
                325                 330                 335
Glu Leu Arg Glu Asp Asp Ile Gly Thr Gly Ala Gly Leu Leu Glu Ile
            340                 345                 350
Lys Lys Ile Gly Asp Glu Tyr Phe Thr Phe Ile Thr Asp Cys Lys Asp
        355                 360                 365
Pro Lys Ala Cys Thr Ile Leu Leu Arg Gly Ala Ser Lys Glu Ile Leu
    370                 375                 380
Ser Glu Val Glu Arg Asn Leu Gln Asp Ala Met Gln Val Cys Arg Asn
385                 390                 395                 400
Val Leu Leu Asp Pro Gln Leu Val Pro Gly Gly Gly Ala Ser Glu Met
                405                 410                 415
Ala Val Ala His Ala Leu Thr Glu Lys Ser Lys Ala Met Thr Gly Val
            420                 425                 430
Glu Gln Trp Pro Tyr Arg Ala Val Ala Gln Ala Leu Glu Val Ile Pro
        435                 440                 445
Arg Thr Leu Ile Gln Asn Cys Gly Ala Ser Thr Ile Arg Leu Leu Thr
    450                 455                 460
Ser Leu Arg Ala Lys His Thr Gln Glu Asn Cys Glu Thr Trp Gly Val
465                 470                 475                 480
Asn Gly Glu Thr Gly Thr Leu Val Asp Met Lys Glu Leu Gly Ile Trp
                485                 490                 495
Glu Pro Leu Ala Val Lys Leu Gln Thr Tyr Lys Thr Ala Val Glu Thr
            500                 505                 510
Ala Val Leu Leu Leu Arg Ile Asp Asp Ile Val Ser Gly His Lys Lys
        515                 520                 525
Lys Gly Asp Asp Gln Ser Arg Gln Gly Gly Ala Pro Asp Ala Gly Gln
    530                 535                 540
Glu
545
<210>55
<211>16
<212>DNA
<213>人工序列
<220>
<223>用于PIG48的锚定引物
<400>55
aagctttttt ttttta                     16
<210>56
<211>13
<212>DNA
<213>人工序列
<220>
<223>用于PIG48的H-AP7引物
<400>56
aagcttaacg agg                        13
<210>57
<211>643
<212>DNA
<213>人类
<400>57
catgcagaga gcttcacgtc tgaagagaga gctgcacatg ttagccacag agccaccccc    60
aggcatcaca tgttggcaag ataaagacca aatggatgac ctgcgagctc aaatattagg    120
tggagccaac acaccttatg agaaaggtgt ttttaagcta gaagttatca ttcctgagag    180
gtacccattt gaacctcctc agatccgatt tctcactcca atttatcatc caaacattga    240
ttctgctgga aggatttgtc tggatgttct caaattgcca ccaaaaggtg cttggagacc    300
atccctcaac atcgcaactg tgttgacctc tattcagctg ctcatgtcag aacccaaccc    360
tgatgacccg ctcatggctg acatatcctc agaatttaaa tataataagc cagccttcct    420
caagaatgcc agacagtgga cagagaagca tgcaagacag aaacaaaagg ctgatgagga    480
agagatgctt gataatctac cagaggctgg tgactccaga gtacacaact caacacagaa    540
aaggaaggcc agtcagctag taggcataga aaagaaattt catcctgatg tttaggggac    600
ttgtcctggt tcatcttagt taatgtgttc tttgccaagg tga                      643
<210>58
<211>197
<212>PRT
<213>人类
<400>58
Met Gln Arg Ala Ser Arg Leu Lys Arg Glu Leu His Met Leu Ala Thr
  1               5                  10                  15
Glu Pro Pro Pro Gly Ile Thr Cys Trp Gln Asp Lys Asp Gln Met Asp
             20                  25                  30
Asp Leu Arg Ala Gln Ile Leu Gly Gly Ala Asn Thr Pro Tyr Glu Lys
         35                  40                  45
Gly Val Phe Lys Leu Glu Val Ile Ile Pro Glu Arg Tyr Pro Phe Glu
     50                  55                  60
Pro Pro Gln Ile Arg Phe Leu Thr Pro Ile Tyr His Pro Asn Ile Asp
 65                  70                  75                  80
Ser Ala Gly Arg Ile Cys Leu Asp Val Leu Lys Leu Pro Pro Lys Gly
                 85                  90                  95
Ala Trp Arg Pro Ser Leu Asn Ile Ala Thr Val Leu Thr Ser Ile Gln
            100                 105                 110
Leu Leu Met Ser Glu Pro Asn Pro Asp Asp Pro Leu Met Ala Asp Ile
        115                 120                 125
Ser Ser Glu Phe Lys Tyr Asn Lys Pro Ala Phe Leu Lys Asn Ala Arg
    130                 135                 140
Gln Trp Thr Glu Lys His Ala Arg Gln Lys Gln Lys Ala Asp Glu Glu
145                 150                 155                 160
Glu Met Leu Asp Asn Leu Pro Glu Ala Gly Asp Ser Arg Val His Asn
                165                 170                 175
Ser Thr Gln Lys Arg Lys Ala Ser Gln Leu Val Gly Ile Glu Lys Lys
            180                 185                 190
Phe His Pro Asp Val
        195
<210>59
<211>16
<212>DNA
<213>人工序列
<220>
<223>用于PIG50的锚定引物
<400>59
aagctttttt tttttc                     16
<210>60
<211>13
<212>DNA
<213>人工序列
<220>
<223>用于PIG50的H-AP5引物
<400>60
aagcttagta ggc                        13
<210>61
<211>1936
<212>DNA
<213>人类
<400>61
ccggtagagg actgtgaacc aaaagttgtc ccccaggatg gacttcaccg cgcagcccaa    60
gcctgccact gccctctgtg gcgtcgtgag tgccgacggg aagatcgctt accctccggg    120
ggtaaaagag atcaccgaca agatcaccac ggacgagatg atcaaacgcc tgaagatggt    180
agtgaaaacc tttatggata tggatcagga ctcagaagat gaaaaacagc agtatctccc    240
actagccttg catcttgcat ctgaattctt cctcaggaac cccaataaag atgtgcgtct    300
ccttgtagca tgttgtttgg ctgatatctt tcgtatctat gccccagaag ctccatatac    360
ttcccatgat aaacttaagg acatattttt gtttattacc agacaattaa aaggtttgga    420
ggatacaaag agtccacagt ttaatagata cttttattta ttagagaatt tagcttgggt    480
taaatcatat aacatctgct ttgaattgga agattgcaat gaaattttta ttcagctttt    540
tagaactctc ttctcagtga tcaacaatag ccacaataag aaggtacaaa tgcacatgct    600
agatttgatg agttctatca tcatggaagg tgatggagtt actcaagaat tattggactc    660
cattcttatt aacctcattc ctgcacataa gaacttaaat aaacagtcct ttgaccttgc    720
aaaagtgcta ttgaaaagaa cagtccagac tattgaggca tgcattgcta attttttcaa    780
tcaagtcctg gtgctgggaa gatcatcagt aagtgatttg tcagaacatg tatttgatct    840
gattcaggaa ctttttgcta tagatcctca tttattatta tccgtcatgc cacagcttga    900
attcaaacta aagagcaatg atggagaaga gcgattagct gttgttcgac ttctagctaa    960
attgtttggc tccaaagatt ctgatttggc aacacagaat cgtcctcttt ggcaatgttt    1020
tcttggacga tttaatgata ttcatgttcc tgtgagatta gaaagtgtga aatttgccag    1080
tcattgttta atgaatcacc cagatttagc gaaggatctc acagaatatt taaaggttag    1140
atcacatgat ccagaagaag ctattcgtca tgatgtcatt gttactataa taacagctgc    1200
caagagggac ctggccttag taaatgatca gctgcttggc tttgtaaggg aaagaacact    1260
ggataaacgg tggcgagtaa gaaaagaagc tatgatgggt ctggctcagc tttataagaa    1320
atactgtctt catggtgaag caggaaagga agctgcagag aaagtcagct ggataaagga    1380
caaacttctg catatttatt atcagaacag cattgacgac aaactgttgg tagagaaaat    1440
ctttgctcgg tatcttgtcc cccacaacct ggaaacagaa gagagaatga aatgcttata    1500
ttacttatat gctagtttgg atccaaatgc tgtaaaagct ctcaacgaaa tgtggaagtg    1560
tcagaacatg cttcggagcc atgtacgcga actattggat ttgcacaagc agcctacatc    1620
agaggctaac tgttctgcca tgtttggaaa actgatgacc atagcaaaga atttgcctga    1680
ccccgggaag gcacaagatt ttgtgaagaa atttaaccag gttctcggcg atgatgagaa    1740
acttcggtct cagttggagt tattaattag cccaacctgt tcttgcaaac aagcagatat    1800
ttgtgtggtt agtaaatcat acttcacact ttttctctag ctttacttac agaaatatgt    1860
attttattaa agcctgtttt acatacagtg atttgtgtaa atgtaacaat attgtgagct    1920
ctgaattact ttggag                                                    1936
<210>62
<211>600
<212>PRT
<213>人类
<400>62
Met Asp Phe Thr Ala Gln Pro Lys Pro Ala Thr Ala Leu Cys Gly Val
  1               5                  10                  15
Val Ser Ala Asp Gly Lys Ile Ala Tyr Pro Pro Gly Val Lys Glu Ile
             20                  25                  30
Thr Asp Lys Ile Thr Thr Asp Glu Met Ile Lys Arg Leu Lys Met Val
         35                  40                  45
Val Lys Thr Phe Met Asp Met Asp Gln Asp Ser Glu Asp Glu Lys Gln
     50                  55                  60
Gln Tyr Leu Pro Leu Ala Leu His Leu Ala Ser Glu Phe Phe Leu Arg
 65                  70                  75                  80
Asn Pro Asn Lys Asp Val Arg Leu Leu Val Ala Cys Cys Leu Ala Asp
                 85                  90                  95
Ile Phe Arg Ile Tyr Ala Pro Glu Ala Pro Tyr Thr Ser His Asp Lys
            100                 105                 110
Leu Lys Asp Ile Phe Leu Phe Ile Thr Arg Gln Leu Lys Gly Leu Glu
        115                 120                 125
Asp Thr Lys Ser Pro Gln Phe Asn Arg Tyr Phe Tyr Leu Leu Glu Asn
    130                 135                 140
Leu Ala Trp Val Lys Ser Tyr Asn Ile Cys Phe Glu Leu Glu Asp Cys
145                 150                 155                 160
Asn Glu Ile Phe Ile Gln Leu Phe Arg Thr Leu Phe Ser Val Ile Asn
                165                 170                 175
Asn Ser His Asn Lys Lys Val Gln Met His Met Leu Asp Leu Met Ser
            180                 185                 190
Ser Ile Ile Met Glu Gly Asp Gly Val Thr Gln Glu Leu Leu Asp Ser
        195                 200                 205
Ile Leu Ile Asn Leu Ile Pro Ala His Lys Asn Leu Asn Lys Gln Ser
    210                 215                 220
Phe Asp Leu Ala Lys Val Leu Leu Lys Arg Thr Val Gln Thr Ile Glu
225                 230                 235                 240
Ala Cys Ile Ala Asn Phe Phe Asn Gln Val Leu Val Leu Gly Arg Ser
                245                 250                 255
Ser Val Ser Asp Leu Ser Glu His Val Phe Asp Leu Ile Gln Glu Leu
            260                 265                 270
Phe Ala Ile Asp Pro His Leu Leu Leu Ser Val Met Pro Gln Leu Glu
        275                 280                 285
Phe Lys Leu Lys Ser Asn Asp Gly Glu Glu Arg Leu Ala Val Val Arg
    290                 295                 300
Leu Leu Ala Lys Leu Phe Gly Ser Lys Asp Ser Asp Leu Ala Thr Gln
305                 310                 315                 320
Asn Arg Pro Leu Trp Gln Cys Phe Leu Gly Arg Phe Asn Asp Ile His
                325                 330                 335
Val Pro Val Arg Leu Glu Ser Val Lys Phe Ala Ser His Cys Leu Met
            340                 345                 350
Asn His Pro Asp Leu Ala Lys Asp Leu Thr Glu Tyr Leu Lys Val Arg
        355                 360                 365
Ser His Asp Pro Glu Glu Ala Ile Arg His Asp Val Ile Val Thr Ile
    370                 375                 380
Ile Thr Ala Ala Lys Arg Asp Leu Ala Leu Val Asn Asp Gln Leu Leu
385                 390                 395                 400
Gly Phe Val Arg Glu Arg Thr Leu Asp Lys Arg Trp Arg Val Arg Lys
                405                 410                 415
Glu Ala Met Met Gly Leu Ala Gln Leu Tyr Lys Lys Tyr Cys Leu His
            420                 425                 430
Gly Glu Ala Gly Lys Glu Ala Ala Glu Lys Val Ser Trp Ile Lys Asp
        435                 440                 445
Lys Leu Leu His Ile Tyr Tyr Gln Asn Ser Ile Asp Asp Lys Leu Leu
    450                 455                 460
Val Glu Lys Ile Phe Ala Arg Tyr Leu Val Pro His Asn Leu Glu Thr
465                 470                 475                 480
Glu Glu Arg Met Lys Cys Leu Tyr Tyr Leu Tyr Ala Ser Leu Asp Pro
                485                 490                 495
Asn Ala Val Lys Ala Leu Asn Glu Met Trp Lys Cys Gln Asn Met Leu
            500                 505                 510
Arg Ser His Val Arg Glu Leu Leu Asp Leu His Lys Gln Pro Thr Ser
        515                 520                 525
Glu Ala Asn Cys Ser Ala Met Phe Gly Lys Leu Met Thr Ile Ala Lys
    530                 535                 540
Asn Leu Pro Asp Pro Gly Lys Ala Gln Asp Phe Val Lys Lys Phe Asn
545                 550                 555                 560
Gln Val Leu Gly Asp Asp Glu Lys Leu Arg Ser Gln Leu Glu Leu Leu
                565                 570                 575
Ile Ser Pro Thr Cys Ser Cys Lys Gln Ala Asp Ile Cys Val Val Ser
            580                 585                 590
Lys Ser Tyr Phe Thr Leu Phe Leu
        595                 600
<210>63
<211>16
<212>DNA
<213>人工序列
<220>
<223>用于PIG54的锚定引物
<400>63
aagctttttt ttttta                     16
<210>64
<211>13
<212>DNA
<213>人工序列
<220>
<223>用于PIG54的H-AP15引物
<400>64
aagcttacgc aac                        13
<210>65
<211>526
<212>DNA
<213>人类
<400>65
cgcttctctg cactatgtcg ggtggcctcc tgaaggcgct gcgcagcgac tcctacgtgg    60
agctgagcca gtaccgggac cagcacttcc ggggtgacaa tgaagaacaa gaaaaattac    120
tgaagaaaag ctgtacgtta tatgttggaa atctttcttt ttacacaact gaagaacaaa    180
tctatgaact cttcagcaaa agtggtgaca taaagaaaat cattatgggt ctggataaaa    240
tgaagaaaac agcatgtgga ttctgttttg tggaatatta ctcacgcgca gatgcggaaa    300
acgccatgcg gtacataaat gggacgcgtc tggatgaccg aatcattcgc acagactggg    360
acgcaggctt taaggagggc aggcaatacg gccgtgggcg atctgggggc caggttcggg    420
atgagtatcg gcaggactac gatgctggga gaggaggcta tggaaaactg gcacagaacc    480
agtgagtggt gagagctctg tcagtgacaa acactccttt ggcctg                   526
<210>66
<211>156
<212>PRT
<213>人类
<400>66
Met Ser Gly Gly Leu Leu Lys Ala Leu Arg Ser Asp Ser Tyr Val Glu
  1               5                  10                  15
Leu Ser Gln Tyr Arg Asp Gln His Phe Arg Gly Asp Asn Glu Glu Gln
             20                  25                  30
Glu Lys Leu Leu Lys Lys Ser Cys Thr Leu Tyr Val Gly Asn Leu Ser
         35                  40                  45
Phe Tyr Thr Thr Glu Glu Gln Ile Tyr Glu Leu Phe Ser Lys Ser Gly
     50                  55                  60
Asp Ile Lys Lys Ile Ile Met Gly Leu Asp Lys Met Lys Lys Thr Ala
 65                  70                  75                  80
Cys Gly Phe Cys Phe Val Glu Tyr Tyr Ser Arg Ala Asp Ala Glu Asn
                 85                  90                  95
Ala Met Arg Tyr Ile Asn Gly Thr Arg Leu Asp Asp Arg Ile Ile Arg
            100                 105                 110
Thr Asp Trp Asp Ala Gly Phe Lys Glu Gly Arg Gln Tyr Gly Arg Gly
        115                 120                 125
Arg Ser Gly Gly Gln Val Arg Asp Glu Tyr Arg Gln Asp Tyr Asp Ala
    130                 135                 140
Gly Arg Gly Gly Tyr Gly Lys Leu Ala Gln Asn Gln
145                 150                 155
<210>67
<211>16
<212>DNA
<213>人工序列
<220>
<223>用于PIG55的锚定引物
<400>67
aagctttttt tttttg                     16
<210>68
<211>13
<212>DNA
<213>人工序列
<220>
<223>用于PIG55的H-AP4引物
<400>68
aagcttctca acg                        13
<210>69
<211>1008
<212>DNA
<213>人类
<400>69
atggcggtgg acatcacgct gctattccgg gccagcgtca agaccgtgaa gacgcggaac    60
aaggcgctgg gagtggcggt gggcggcggg gtcgatggca gccgggacga gctgttccgc    120
cggagccccc ggcccaaggg cgacttctcc agccgggccc gcgaagtgat ttctcacatt    180
ggcaaactga gagattttct tctggaacac aggaaagatt atattaatgc ttatagccat    240
accatgtctg aatatgggag gatgacagac acagaacgag accagataga ccaggatgcc    300
cagatattca tgaggacctg ttcagaagca attcagcaac tacgaacaga agctcacaag    360
gagatacatt cccagcaagt gaaggagcac aggaccgctg ttttggattt cattgaagat    420
tacttgaaaa gagtatgtaa actttactca gaacagagag ccatccgagt taaaagagtg    480
gtggataaga aaagattatc taagctggaa ccagaaccaa atacaaagac aagagaatcc    540
acatcttctg agaaagtttc acagagtcct tcaaaagact ctgaagaaaa ccctgccact    600
gaagaacgtc cagaaaaaat tttggctgaa acacaacctg aattgggaac gtggggagat    660
ggcaaaggcg aagatgagtt atccccagaa gaaatacaaa tgtttgaaca ggaaaatcag    720
cgactaattg gtgaaatgaa cagcttgttt gatgaagtga ggcaaatcga agggagagtg    780
gttgagattt ccagactcca agagatattc acggaaaagg ttttgcaaca ggaagctgag    840
attgacagca ttcaccagtt agttgtgggg gcaactgaaa atatcaagga aggcaacgaa    900
gacataagag aggccattaa agacaacgct ggcttccgcg tgtggatcct cttcttcctc    960
gtgatgtgct ccttctcctt gctcttcctc gactggtacg acagctag                 1008
<210>70
<211>335
<212>PRT
<213>人类
<400>70
Met Ala Val Asp Ile Thr Leu Leu Phe Arg Ala Ser Val Lys Thr Val
  1               5                  10                  15
Lys Thr Arg Asn Lys Ala Leu Gly Val Ala Val Gly Gly Gly Val Asp
             20                  25                  30
Gly Ser Arg Asp Glu Leu Phe Arg Arg Ser Pro Arg Pro Lys Gly Asp
         35                  40                  45
Phe Ser Ser Arg Ala Arg Glu Val Ile Ser His Ile Gly Lys Leu Arg
     50                  55                  60
Asp Phe Leu Leu Glu His Arg Lys Asp Tyr Ile Asn Ala Tyr Ser His
 65                  70                  75                  80
Thr Met Ser Glu Tyr Gly Arg Met Thr Asp Thr Glu Arg Asp Gln Ile
                 85                  90                  95
Asp Gln Asp Ala Gln Ile Phe Met Arg Thr Cys Ser Glu Ala Ile Gln
            100                 105                 110
Gln Leu Arg Thr Glu Ala His Lys Glu Ile His Ser Gln Gln Val Lys
        115                 120                 125
Glu His Arg Thr Ala Val Leu Asp Phe Ile Glu Asp Tyr Leu Lys Arg
    130                 135                 140
Val Cys Lys Leu Tyr Ser Glu Gln Arg Ala Ile Arg Val Lys Arg Val
145                 150                 155                 160
Val Asp Lys Lys Arg Leu Ser Lys Leu Glu Pro Glu Pro Asn Thr Lys
                165                 170                 175
Thr Arg Glu Ser Thr Ser Ser Glu Lys Val Ser Gln Ser Pro Ser Lys
            180                 185                 190
Asp Ser Glu Glu Asn Pro Ala Thr Glu Glu Arg Pro Glu Lys Ile Leu
        195                 200                 205
Ala Glu Thr Gln Pro Glu Leu Gly Thr Trp Gly Asp Gly Lys Gly Glu
    210                 215                 220
Asp Glu Leu Ser Pro Glu Glu Ile Gln Met Phe Glu Gln Glu Asn Gln
225                 230                 235                 240
Arg Leu Ile Gly Glu Met Asn Ser Leu Phe Asp Glu Val Arg Gln Ile
                245                 250                 255
Glu Gly Arg Val Val Glu Ile Ser Arg Leu Gln Glu Ile Phe Thr Glu
            260                 265                 270
Lys Val Leu Gln Gln Glu Ala Glu Ile Asp Ser Ile His Gln Leu Val
        275                 280                 285
Val Gly Ala Thr Glu Asn Ile Lys Glu Gly Asn Glu Asp Ile Arg Glu
    290                 295                 300
Ala Ile Lys Asp Asn Ala Gly Phe Arg Val Trp Ile Leu Phe Phe Leu
305                 310                 315                 320
Val Met Cys Ser Phe Ser Leu Leu Phe Leu Asp Trp Tyr Asp Ser
                325                 330                 335
<210>71
<211>16
<212>DNA
<213>人工序列
<220>
<223>用于GIG9的锚定引物
<400>71
aagctttttt ttttta                     16
<210>72
<211>13
<212>DNA
<213>人工序列
<220>
<223>用于GIG9的H-AP14引物
<400>72
aagcttggag ctt                        13
<210>73
<211>1382
<212>DNA
<213>人类
<400>73
agcagggtca ccatttgcag cgcaacatgg caggagctgg aggagggaat gatattcagt    60
ggtgtttttc tcaggtgaaa ggagcagtag atgatgatgt agcagaagca gatataattt    120
ctacagtaga atttaatcat tctggagaat tactagcaac aggagataaa ggtggtagag    180
ttgtcatctt tcaacaggag caggagaaca aaatccagtc tcatagcaga ggagaatata    240
atgtttacag caccttccag agccatgaac cagagtttga ctacttgaaa agtttagaaa    300
tagaagaaaa gatcaacaaa attaggtggt taccccagaa aaatgctgct cagtttttat    360
tgtctaccaa tgataaaaca ataaaattat ggaaaatcag tgaaagggac aaaagaccag    420
aagggtataa cttgaaagag gaggatggaa ggtatagaga tcctactaca gttactacac    480
tacgagtgcc agtctgtagg cctatggatc taatggttga ggccagtcca cgaagaatat    540
ttgccaatgc tcatacatat cacatcaact caatttctat taatagtgat tatgaaacat    600
atttatctgc agatgatttg cggattaatc tttggcatct ggaaattaca gacaggagtt    660
ttaacattgt ggatatcaag cctgccaata tggaagagct aacagaggtg attacagcag    720
cagaatttca tccaaacagc tgtaacacat ttgtatacag cagcagtaaa ggaactattc    780
ggctatgtga catgagggca tctgccctct gtgatagaca ttctaaattg tttgaagaac    840
ctgaagatcc cagtaacagg tcattttttt ccgaaatcat ctcctctatt tcggatgtaa    900
aattcagcca tagtggtcga tacatgatga ctagagacta tttgtcagtc aaaatttggg    960
acttaaatat ggaaaacagg cctgtggaaa cataccaggt gcatgaatac ctcagaagta    1020
aactctgttc actgtacgaa aatgactgca tatttgacaa atttgaatgt tgttggaatg    1080
gatctgacag tgttgtcatg actggatctt acaataattt cttcagaatg tttgacagaa    1140
acacaaagcg agacataacc ctagaagcat cgcgggaaaa caataagcct cgcacagttc    1200
tgaagcctcg caaagtctgt gcaagtggca agcgaaagaa agatgaaata agtgttgaca    1260
gcctagactt caataagaaa atccttcaca cagcctggca ccccaaggaa aatatcattg    1320
ccgtagctac tacaaacaat ctgtatatat ttcaagacaa agtgaattag ggttggcatt    1380
cc                                                                   1382
<210>74
<211>447
<212>PRT
<213>人类
<400>74
Met Ala Gly Ala Gly Gly Gly Asn Asp Ile Gln Trp Cys Phe Ser Gln
  1               5                  10                  15
Val Lys Gly Ala Val Asp Asp Asp Val Ala Glu Ala Asp Ile Ile Ser
             20                  25                  30
Thr Val Glu Phe Asn His Ser Gly Glu Leu Leu Ala Thr Gly Asp Lys
         35                  40                  45
Gly Gly Arg Val Val Ile Phe Gln Gln Glu Gln Glu Asn Lys Ile Gln
     50                  55                  60
Ser His Ser Arg Gly Glu Tyr Asn Val Tyr Ser Thr Phe Gln Ser His
 65                  70                  75                  80
Glu Pro Glu Phe Asp Tyr Leu Lys Ser Leu Glu Ile Glu Glu Lys Ile
                 85                  90                  95
Asn Lys Ile Arg Trp Leu Pro Gln Lys Asn Ala Ala Gln Phe Leu Leu
            100                 105                 110
Ser Thr Asn Asp Lys Thr Ile Lys Leu Trp Lys Ile Ser Glu Arg Asp
        115                 120                 125
Lys Arg Pro Glu Gly Tyr Asn Leu Lys Glu Glu Asp Gly Arg Tyr Arg
    130                 135                 140
Asp Pro Thr Thr Val Thr Thr Leu Arg Val Pro Val Cys Arg Pro Met
145                 150                 155                 160
Asp Leu Met Val Glu Ala Ser Pro Arg Arg Ile Phe Ala Asn Ala His
                165                 170                 175
Thr Tyr His Ile Asn Ser Ile Ser Ile Asn Ser Asp Tyr Glu Thr Tyr
            180                 185                 190
Leu Ser Ala Asp Asp Leu Arg Ile Asn Leu Trp His Leu Glu Ile Thr
        195                 200                 205
Asp Arg Ser Phe Asn Ile Val Asp Ile Lys Pro Ala Asn Met Glu Glu
    210                 215                 220
Leu Thr Glu Val Ile Thr Ala Ala Glu Phe His Pro Asn Ser Cys Asn
225                 230                 235                 240
Thr Phe Val Tyr Ser Ser Ser Lys Gly Thr Ile Arg Leu Cys Asp Met
                245                 250                 255
Arg Ala Ser Ala Leu Cys Asp Arg His Ser Lys Leu Phe Glu Glu Pro
            260                 265                 270
Glu Asp Pro Ser Asn Arg Ser Phe Phe Ser Glu Ile Ile Ser Ser Ile
        275                 280                 285
Ser Asp Val Lys Phe Ser His Ser Gly Arg Tyr Met Met Thr Arg Asp
    290                 295                 300
Tyr Leu Ser Val Lys Ile Trp Asp Leu Asn Met Glu Asn Arg Pro Val
305                 310                 315                 320
Glu Thr Tyr Gln Val His Glu Tyr Leu Arg Ser Lys Leu Cys Ser Leu
                325                 330                 335
Tyr Glu Asn Asp Cys Ile Phe Asp Lys Phe Glu Cys Cys Trp Asn Gly
            340                 345                 350
Ser Asp Ser Val Val Met Thr Gly Ser Tyr Asn Asn Phe Phe Arg Met
        355                 360                 365
Phe Asp Arg Asn Thr Lys Arg Asp Ile Thr Leu Glu Ala Ser Arg Glu
    370                 375                 380
Asn Asn Lys Pro Arg Thr Val Leu Lys Pro Arg Lys Val Cys Ala Ser
385                 390                 395                 400
Gly Lys Arg Lys Lys Asp Glu Ile Ser Val Asp Ser Leu Asp Phe Asn
                405                 410                 415
Lys Lys Ile Leu His Thr Ala Trp His Pro Lys Glu Asn Ile Ile Ala
            420                 425                 430
Val Ala Thr Thr Asn Asn Leu Tyr Ile Phe Gln Asp Lys Val Asn
        435                 440                 445
<210>75
<211>16
<212>DNA
<213>人工序列
<220>
<223>用于HLC-9的锚定引物
<400>75
aagctttttt tttttg                     16
<210>76
<211>13
<212>DNA
<213>人工序列
<220>
<223>用于HLC-9的H-AP7引物
<400>76
aagcttaacg agg                        13
<210>77
<211>1301
<212>DNA
<213>人类
<400>77
atatggcacc tccgtcagtc tttgccgagg ttccgcaggc ccagcctgtc ctggtcttca    60
agctcactgc cgacttcagg gaggatccgg acccccgcaa ggtcaacctg ggagtgggag    120
catatcgcac ggatgactgc catccctggg ttttgccagt agtgaagaaa gtggagcaga    180
agattgctaa tgacaatagc ctaaatcacg agtatctgcc aatcctgggc ctggctgagt    240
tccggagctg tgcttctcgt cttgcccttg aggatgacag cccagcactc aaggagaagc    300
gggtaggagg tgtgcaatct ttggggggaa caggtgcact tcgaattgga gctgatttct    360
tagcgcgttg gtacaatgga acaaacaaca agaacacacc tgtctatgtg tcctcaccaa    420
cctgggagaa tcacaatgct gtgttttccg ctgctggttt taaagacatt cggtcctatc    480
gctactggga tgcagagaag agaggattgg acctccaggg cttcctgaat gatctggaga    540
atgctcctga gttctccatt gttgtcctcc acgcctgtgc acacaaccca actgggattg    600
acccaactcc ggagcagtgg aagcagattg cttctgtcat gaagcaccgg tttctgttcc    660
ccttctttga ctcagcctat cagggcttcg catctggaaa cctggagaga gatgcctggg    720
ccattcgcta ttttgtgtct gaaggcttcg agttcttctg tgcccagtcc ttctccaaga    780
acttcgggct ctacaatgag agagtcggga atctgactgt ggttggaaaa gaacctgaga    840
gcatcctgca agtcctttcc cagatggaga agatcgtgcg gattacttgg tccaatcccc    900
ccgcccaggg agcacgaatt gtggccagca ccctctctaa ccctgagctc tttgaggaat    960
ggacaggtaa tgtgaagaca atggctgacc ggattctgac catgagatct gaactcaggg    1020
cacgactaga agccctcaaa acccctggga cctggaacca catcactgat caaattggca    1080
tgttcagctt cactgggttg aaccccaagc aggttgagta tctggtcaat gaaaagcaca    1140
tctacctgct gccaagtggt cgaatcaacg tgagtggctt aaccaccaaa aatctagatt    1200
acgtggccac ctccatccat gaagcagtca ccaaaatcca gtgaagaaac accacccgtc    1260
cagtaccacc aaagtagttc tctgtcatgt gtgttccctg c                        1301
<210>78
<211>413
<212>PRT
<213>人类
<400>78
Met Ala Pro Pro Ser Val Phe Ala Glu Val Pro Gln Ala Gln Pro Val
  1               5                  10                  15
Leu Val Phe Lys Leu Thr Ala Asp Phe Arg Glu Asp Pro Asp Pro Arg
             20                  25                  30
Lys Val Asn Leu Gly Val Gly Ala Tyr Arg Thr Asp Asp Cys His Pro
         35                  40                  45
Trp Val Leu Pro Val Val Lys Lys Val Glu Gln Lys Ile Ala Asn Asp
     50                  55                  60
Asn Ser Leu Asn His Glu Tyr Leu Pro Ile Leu Gly Leu Ala Glu Phe
 65                  70                  75                  80
Arg Ser Cys Ala Ser Arg Leu Ala Leu Glu Asp Asp Ser Pro Ala Leu
                 85                  90                  95
Lys Glu Lys Arg Val Gly Gly Val Gln Ser Leu Gly Gly Thr Gly Ala
            100                 105                 110
Leu Arg Ile Gly Ala Asp Phe Leu Ala Arg Trp Tyr Asn Gly Thr Asn
        115                 120                 125
Asn Lys Asn Thr Pro Val Tyr Val Ser Ser Pro Thr Trp Glu Asn His
    130                 135                 140
Asn Ala Val Phe Ser Ala Ala Gly Phe Lys Asp Ile Arg Ser Tyr Arg
145                 150                 155                 160
Tyr Trp Asp Ala Glu Lys Arg Gly Leu Asp Leu Gln Gly Phe Leu Asn
                165                 170                 175
Asp Leu Glu Asn Ala Pro Glu Phe Ser Ile Val Val Leu His Ala Cys
            180                 185                 190
Ala His Asn Pro Thr Gly Ile Asp Pro Thr Pro Glu Gln Trp Lys Gln
        195                 200                 205
Ile Ala Ser Val Met Lys His Arg Phe Leu Phe Pro Phe Phe Asp Ser
    210                 215                 220
Ala Tyr Gln Gly Phe Ala Ser Gly Asn Leu Glu Arg Asp Ala Trp Ala
225                 230                 235                 240
Ile Arg Tyr Phe Val Ser Glu Gly Phe Glu Phe Phe Cys Ala Gln Ser
                245                 250                 255
Phe Ser Lys Asn Phe Gly Leu Tyr Asn Glu Arg Val Gly Asn Leu Thr
            260                 265                 270
Val Val Gly Lys Glu Pro Glu Ser Ile Leu Gln Val Leu Ser Gln Met
        275                 280                 285
Glu Lys Ile Val Arg Ile Thr Trp Ser Asn Pro Pro Ala Gln Gly Ala
    290                 295                 300
Arg Ile Val Ala Ser Thr Leu Ser Asn Pro Glu Leu Phe Glu Glu Trp
305                 310                 315                 320
Thr Gly Asn Val Lys Thr Met Ala Asp Arg Ile Leu Thr Met Arg Ser
                325                 330                 335
Glu Leu Arg Ala Arg Leu Glu Ala Leu Lys Thr Pro Gly Thr Trp Asn
            340                 345                 350
His Ile Thr Asp Gln Ile Gly Met Phe Ser Phe Thr Gly Leu Asn Pro
        355                 360                 365
Lys Gln Val Glu Tyr Leu Val Asn Glu Lys His Ile Tyr Leu Leu Pro
    370                 375                 380
Ser Gly Arg Ile Asn Val Ser Gly Leu Thr Thr Lys Asn Leu Asp Tyr
385                 390                 395                 400
Val Ala Thr Ser Ile His Glu Ala Val Thr Lys Ile Gln
                405                 410
<210>79
<211>16
<212>DNA
<213>人工序列
<220>
<223>用于GIG18的锚定引物
<400>79
aagctttttt tttttc                     16
<210>80
<211>13
<212>DNA
<213>人工序列
<220>
<223>用于GIG18的H-AP4引物
<400>80
aagcttctca acg                        13
<210>81
<211>749
<212>DNA
<213>人类
<400>81
gcgactgaag cagcatggcc aagccgtgtg gggtgcgcct gagcggggaa gcccgcaaac    60
aggtggaggt cttcaggcag aatcttttcc aggaggctga ggaattcctc tacagattct    120
tgccacagaa aatcatatac ctgaatcagc tcttgcaaga ggactccctc aatgtggctg    180
acttgacttc cctccgggcc ccactggaca tccccatccc agaccctcca cccaaggatg    240
atgagatgga aacagataag caggagaaga aagaagtccc taagtgtgga tttctccctg    300
ggaatgagaa agtcctgtcc ctgcttgccc tggttaagcc agaagtctgg actctcaaag    360
agaaatgcat tctggtgatt acatggatcc aacacctgat ccccaagatt gaagatggaa    420
atgattttgg ggtagcaatc caggagaagg tgctggagag ggtgaatgcc gtcaagacca    480
aagtggaagc tttccagaca accatttcca agtacttctc agaacgtggg gatgctgtgg    540
ccaaggcctc caaggagacc catgtaatgg attaccgggc cttggtgcat gagcgagatg    600
aggcagccta tggggagctc agggccatgg tgctggacct gagggccttc tatgctgagc    660
tttatcatat catcagcagc aacctggaga aaattgtcac cccaaagggt gaagaaaagc    720
catctatgta ctgaacccgg gactagaag                                      749
<210>82
<211>239
<212>PRT
<213>人类
<400>82
Met Ala Lys Pro Cys Gly Val Arg Leu Ser Gly Glu Ala Arg Lys Gln
  1               5                  10                  15
Val Glu Val Phe Arg Gln Asn Leu Phe Gln Glu Ala Glu Glu Phe Leu
             20                  25                  30
Tyr Arg Phe Leu Pro Gln Lys Ile Ile Tyr Leu Asn Gln Leu Leu Gln
         35                  40                  45
Glu Asp Ser Leu Asn Val Ala Asp Leu Thr Ser Leu Arg Ala Pro Leu
     50                  55                  60
Asp Ile Pro Ile Pro Asp Pro Pro Pro Lys Asp Asp Glu Met Glu Thr
 65                  70                  75                  80
Asp Lys Gln Glu Lys Lys Glu Val Pro Lys Cys Gly Phe Leu Pro Gly
                 85                  90                  95
Asn Glu Lys Val Leu Ser Leu Leu Ala Leu Val Lys Pro Glu Val Trp
            100                 105                 110
Thr Leu Lys Glu Lys Cys Ile Leu Val Ile Thr Trp Ile Gln His Leu
        115                 120                 125
Ile Pro Lys Ile Glu Asp Gly Asn Asp Phe Gly Val Ala Ile Gln Glu
    130                 135                 140
Lys Val Leu Glu Arg Val Asn Ala Val Lys Thr Lys Val Glu Ala Phe
145                 150                 155                 160
Gln Thr Thr Ile Ser Lys Tyr Phe Ser Glu Arg Gly Asp Ala Val Ala
                165                 170                 175
Lys Ala Ser Lys Glu Thr His Val Met Asp Tyr Arg Ala Leu Val His
            180                 185                 190
Glu Arg Asp Glu Ala Ala Tyr Gly Glu Leu Arg Ala Met Val Leu Asp
        195                 200                 205
Leu Arg Ala Phe Tyr Ala Glu Leu Tyr His Ile Ile Ser Ser Asn Leu
    210                 215                 220
Glu Lys Ile Val Thr Pro Lys Gly Glu Glu Lys Pro Ser Met Tyr
225                 230                 235
<210>83
<211>16
<212>DNA
<213>人工序列
<220>
<223>用于MIG22的锚定引物
<400>83
aagctttttt ttttta                     16
<210>84
<211>13
<212>DNA
<213>人工序列
<220>
<223>用于MIG22的H-AP6引物
<400>84
aagcttgcac cat                         13

Claims (4)

1.一种人类原癌蛋白,其具有选自由SEQ ID NO:2;SEQ ID NO:6;SEQID NO:10;SEQ ID NO:14;SEQ ID NO:18;SEQ ID NO:22;SEQ ID NO:26;SEQ ID NO:30;SEQ ID NO:34;SEQ ID NO:38;SEQ ID NO:42;SEQ ID NO:46;SEQ ID NO:50;SEQ ID NO:54;SEQ ID NO:58;SEQ ID NO:62;SEQID NO:66;SEQ ID NO:70;SEQ ID NO:74;SEQ ID NO:78;和SEQ ID NO:82组成的组的氨基酸序列。
2.一种人类原癌基因,其具有选自由对应于SEQ ID NO:1的68~1,252核苷酸序列位置的DNA序列;对应于SEQ ID NO:5的875~1,063核苷酸序列位置的DNA序列;对应于SEQ ID NO:9的25~1,953核苷酸序列位置的DNA序列;对应于SEQ ID NO:13的20~337核苷酸序列位置的DNA序列;对应于SEQ ID NO:17的33~998核苷酸序列位置的DNA序列;对应于SEQID NO:21的6~2,150核苷酸序列位置的DNA序列;对应于SEQ ID NO:25的37~2,232核苷酸序列位置的DNA序列;对应于SEQ ID NO:29的25~1,956核苷酸序列位置的DNA序列;对应于SEQ ID NO:33的36~1,541核苷酸序列位置的DNA序列;对应于SEQ ID NO:37的57~758核苷酸序列位置的DNA序列;对应于SEQ ID NO:41的55~1,512核苷酸序列位置的DNA序列;对应于SEQ ID NO:45的5~1,297核苷酸序列位置的DNA序列;对应于SEQ ID NO:49的56~826核苷酸序列位置的DNA序列;对应于SEQ ID NO:53的57~1,694核苷酸序列位置的DNA序列;对应于SEQ ID NO:57的2~595核苷酸序列位置的DNA序列;对应于SEQ ID NO:61的38~1,840核苷酸序列位置的DNA序列;对应于SEQ ID NO:65的15~485核苷酸序列位置的DNA序列;对应于SEQ ID NO:69的1~1,008核苷酸序列位置的DNA序列;对应于SEQ ID NO:73的27~1,370核苷酸序列位置的DNA序列;对应于SEQ ID NO:77的3~1,244核苷酸序列位置的DNA序列;以及对应于SEQID NO:81的15~734核苷酸序列位置的DNA序列组成的组的DNA序列,其中该DNA序列分别编码如权利要求1所述的原癌蛋白。
3.一种用于诊断癌症的试剂盒,其包括如权利要求1所述的原癌蛋白。
4.一种用于诊断癌症的试剂盒,其包括如权利要求2所述的原癌基因。
CNA2006800185529A 2005-03-30 2006-03-30 人类原癌基因及其编码的蛋白质 Pending CN101184772A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020050026244 2005-03-30
KR1020050026244A KR100689274B1 (ko) 2005-03-30 2005-03-30 인간 원암 유전자, 이에 의해 코드되는 단백질

Publications (1)

Publication Number Publication Date
CN101184772A true CN101184772A (zh) 2008-05-21

Family

ID=37087196

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2006800185529A Pending CN101184772A (zh) 2005-03-30 2006-03-30 人类原癌基因及其编码的蛋白质

Country Status (7)

Country Link
US (1) US20090221794A1 (zh)
EP (1) EP1871793A4 (zh)
JP (1) JP2008534008A (zh)
KR (1) KR100689274B1 (zh)
CN (1) CN101184772A (zh)
CA (1) CA2603083A1 (zh)
WO (1) WO2006109943A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111655868A (zh) * 2018-03-14 2020-09-11 深圳华大生命科学研究院 恶性淋巴瘤标志物及其应用

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DK3255146T3 (da) 2009-03-16 2019-08-19 Pangu Biopharma Ltd Præparater og fremgangsmåder omfattende histidyl-tRNA-synthetasesplejsningsvarianter med ikke-kanoniske biologiske aktiviteter
AU2010236913B2 (en) * 2009-03-31 2016-03-24 Atyr Pharma, Inc. Compositions and methods comprising aspartyl-tRNA synthetases having non-canonical biological activities
CA2773083C (en) 2009-09-03 2019-02-12 Toray Industries, Inc. Immunity-inducing agent for prophylaxis or treatment of a pds5a-expressing cancer
EP2509625B1 (en) 2009-12-11 2015-01-28 Atyr Pharma, Inc. Histidyl trna synthetases for reducing inflammation
JP6177129B2 (ja) 2010-07-12 2017-08-09 エータイアー ファーマ, インコーポレイテッド ヒスチジルtRNA合成酵素のタンパク質フラグメントに関連した治療用、診断用および抗体組成物の革新的発見
CA2804278C (en) 2010-07-12 2021-07-13 Atyr Pharma, Inc. Innovative discovery of therapeutic, diagnostic, and antibody compositions related to protein fragments of aspartyl-trna synthetases
EP2711015B1 (en) 2011-05-19 2016-06-29 Toray Industries, Inc. Immunity induction agent
US9714419B2 (en) 2011-08-09 2017-07-25 Atyr Pharma, Inc. PEGylated tyrosyl-tRNA synthetase polypeptides
WO2013086228A1 (en) 2011-12-06 2013-06-13 Atyr Pharma, Inc. Pegylated aspartyl-trna synthetase polypeptides
WO2013086216A1 (en) 2011-12-06 2013-06-13 Atyr Pharma, Inc. Improved aspartyl-trna synthetases
AU2012368189B2 (en) 2011-12-29 2017-08-31 Atyr Pharma, Inc. Aspartyl-tRNA synthetase-Fc conjugates
US8835387B2 (en) 2012-02-16 2014-09-16 Atyr Pharma, Inc. Histidyl-tRNA synthetases for treating autoimmune and inflammatory diseases
TR201905395T4 (tr) 2012-03-15 2019-05-21 Hyun Kee Kim Anti-gremlin-1 antikoru.
ES2708565T3 (es) 2013-03-15 2019-04-10 Atyr Pharma Inc Conjugados de Fc-histidil-ARNt sintetasa
WO2015064620A1 (ja) * 2013-10-29 2015-05-07 公益財団法人がん研究会 新規融合体及びその検出法
WO2018195338A1 (en) 2017-04-20 2018-10-25 Atyr Pharma, Inc. Compositions and methods for treating lung inflammation

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU728777B2 (en) * 1996-01-11 2001-01-18 Corixa Corporation Compositions and methods for the treatment and diagnosis of breast cancer
JP2004509612A (ja) * 2000-06-05 2004-04-02 アバロン ファーマシューティカルズ ガン遺伝子決定および特徴的な遺伝子群を用いた治療用スクリーニング
US6974667B2 (en) * 2000-06-14 2005-12-13 Gene Logic, Inc. Gene expression profiles in liver cancer
US6812339B1 (en) * 2000-09-08 2004-11-02 Applera Corporation Polymorphisms in known genes associated with human disease, methods of detection and uses thereof
US20040101874A1 (en) * 2002-04-12 2004-05-27 Mitokor Inc. Targets for therapeutic intervention identified in the mitochondrial proteome
KR100520800B1 (ko) * 2003-05-19 2005-10-12 김진우 인간 원암유전자 pig2 및 이에 의해 코드되는 단백질

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111655868A (zh) * 2018-03-14 2020-09-11 深圳华大生命科学研究院 恶性淋巴瘤标志物及其应用

Also Published As

Publication number Publication date
JP2008534008A (ja) 2008-08-28
EP1871793A4 (en) 2009-04-22
WO2006109943A1 (en) 2006-10-19
US20090221794A1 (en) 2009-09-03
CA2603083A1 (en) 2006-10-19
KR100689274B1 (ko) 2007-03-08
EP1871793A1 (en) 2008-01-02
KR20060104262A (ko) 2006-10-09

Similar Documents

Publication Publication Date Title
CN101184772A (zh) 人类原癌基因及其编码的蛋白质
AU744875B2 (en) Prostate tumor polynucleotide and antigen compositions
JP3802560B2 (ja) マトリックス金属プロテアーゼのdna配列、その調製および使用
CN101184773A (zh) 人类原癌基因trg及其编码的蛋白
EP0839045A1 (en) Interleukin-1 receptor-associated protein kinase and assays
AU784540B2 (en) Novel human kinase protein and polynucleotides encoding the same
US20080213764A1 (en) Human Protooncogene and Protein Encoded Therein
WO2000063382A9 (en) Genes and expression products from hematopoietic cells
WO2001038371A1 (fr) Nouveau polypeptide glutamate arnt synthetase 58 d&#39;origine humaine et polycnucleotide codant pour ce polypeptide
KR20060111878A (ko) 인간 원암 유전자, 이에 의해 코드되는 단백질
KR20060105734A (ko) 인간 원암 유전자, 이에 의해 코드되는 단백질
KR20060105733A (ko) 인간 원암 유전자, 이에 의해 코드되는 단백질
KR20060111877A (ko) 인간 원암 유전자, 이에 의해 코드되는 단백질
AU783485B2 (en) Human atpase proteins and polynucleotides encoding the same
US20080213763A1 (en) Human Protooncogene and Protein Encoded by Same, and Expression Vector Containing Same
EP1268538A2 (en) Human secreted proteins and polynucleotides encoding the same
AU2001245871A1 (en) Novel human secreted proteins and polynucleotides encoding the same
JP3803978B2 (ja) グルカゴン分解酵素及びそれをコードする遺伝子並びに該グルカゴン分解酵素に対する抗体
WO2001032699A1 (fr) Nouveau polypeptide, nouvelle udp glucose-glycoproteine glucosyltransferase (« biohugtr »), et polynucleotide codant pour ce polypeptide
KR20060090782A (ko) 인간 원암 유전자, 이에 의해 코드되는 단백질, 이를포함하는 발현벡터 및 이 벡터로 형질전환된 세포
WO1995015386A1 (fr) Nouvelle tyrosine-kinase receptrice
EP1148125A1 (en) Human nucleoprotein having www domain and polynucleotide encoding the same
JP2004523206A (ja) 新規ヒトイオンチャンネルタンパク質およびそれをコードするポリヌクレオチド
WO2001040487A1 (fr) NOUVEAU POLYPEPTIDE, SYNTHASE HUMAINE 9 DE TYPE II A BASE AMINEE D&#39;ARNt, ET POLYNUCLEOTIDE CODANT POUR CE POLYPEPTIDE
WO2001055417A1 (fr) Nouveau polypeptide, proteine a f-box 65, et polynucleotide codant pour ce polypeptide

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20080521