CN105087568A - 一组用于肿瘤分子分型的基因及其应用 - Google Patents

一组用于肿瘤分子分型的基因及其应用 Download PDF

Info

Publication number
CN105087568A
CN105087568A CN201510550924.3A CN201510550924A CN105087568A CN 105087568 A CN105087568 A CN 105087568A CN 201510550924 A CN201510550924 A CN 201510550924A CN 105087568 A CN105087568 A CN 105087568A
Authority
CN
China
Prior art keywords
gene
seqidno
reverse primer
forward primer
primer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510550924.3A
Other languages
English (en)
Other versions
CN105087568B (zh
Inventor
徐清华
杜祥
王奇峰
陈金影
杨扬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Yuanqing Biotechnology Co Ltd
Original Assignee
Hangzhou Yuanqing Biotechnology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Yuanqing Biotechnology Co Ltd filed Critical Hangzhou Yuanqing Biotechnology Co Ltd
Priority to CN201510550924.3A priority Critical patent/CN105087568B/zh
Publication of CN105087568A publication Critical patent/CN105087568A/zh
Application granted granted Critical
Publication of CN105087568B publication Critical patent/CN105087568B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了一组用于肿瘤分子分型的基因,包括ACPP基因、AGR2基因等38个基因。此外,本发明还公开了一种用于肿瘤分子分型的试剂盒及应用。本发明有助于识别肿瘤的组织来源,在获得肿瘤样本后,可通过对上述基因组的检测和联合分析,客观准确地判别该肿瘤样本的组织起源和癌症类型,从而对患者进行有针对性的治疗。

Description

一组用于肿瘤分子分型的基因及其应用
技术领域
本发明涉及癌症诊断和分子生物学领域,以及诊断技术在临床上的应用。具体地,本发明涉及一组用于肿瘤分子分型的基因及其应用。本发明还涉及一种用于肿瘤分子分型的试剂盒。
背景技术
肿瘤是威胁人类健康的重要疾病之一。根据《2012中国肿瘤登记年报》,全国每6分钟就有一人被确诊为癌症,每天有8550人确诊为癌症,每七到八人中就有一人死于癌症。我国恶性肿瘤的发病及死亡呈上升趋势,每年新发癌症病例约350万,癌症特异性死亡约250万。预计到2020年,中国每年的癌症死亡总数将达到300万左右,患病总数达600万。
目前,癌症的诊断主要包括详细的病史询问,全面的体格检查,影像学检查(包括X线常规透视、拍片、各种造影、各种体层检查;CT、ECT、核磁共振检查;B型超声检查,核医学检查等),病理学检查,内窥镜检查,放射免疫学检查等。肿瘤的影像诊断虽有了很大的发展,但是目前最先进的医学技术也只能“捕捉”到直径0.5厘米以上的肿块,体积较小时传统影像方法则束手无策。病理学诊断是肿瘤诊断的“金标准”和临床治疗的基础,但病理诊断也有局限性。病理学检查的结果大大依赖于病理医生的专业技术水平。因此,需要一种比较客观的判断肿瘤类型和组织来源的方法。
肿瘤是一类分子水平上高度异质性的疾病。组织学形态相同的肿瘤,其分子遗传学改变不尽一致,从而导致了肿瘤治疗反应和预后的差别。近年来,随着科学技术的发展,手术治疗、化学治疗、放射治疗等传统治疗手段不断发展,生物靶向治疗药物不断研发,为了达到最大疗效和最小毒性,肿瘤类型的诊断和精确分型是关键。因此对肿瘤进行分子分型是肿瘤个体化治疗的必然要求。
在世界范围内,大约3%-5%的癌症是原发灶不明转移性癌(Carcinomasofunknownprimary,CUP),是一类病理学确诊为转移性恶性,但是经过详细评估仍不能确定原发位点的异质性肿瘤。目前临床上,尽管经过详细的影像学检查和免疫组化分析,但是还是只有大概20%-30%的原发灶不明转移癌能够找到原发灶。因此,如何准确识别原发灶不明转移癌的组织起源是目前肿瘤临床诊断中存在的痛点和难点。
基因分子诊断具有灵敏度高、特异性强、背景机理明确的优点,近年来被越来越多地运用于肿瘤检测。例如乳腺癌HER-2基因的扩增检测,肺癌、结直肠癌EGFR和K-RAS基因突变检测,腹腔胃肠道间质瘤C-kit基因检测等。但基本都是采用少数几个肿瘤标志物,只能用于单一肿瘤的亚型分类。而且,这些肿瘤标志物的研究往往是基于一定量的实验数据,所涉及的癌症种类和样本量都相对有限。近年来,随着基因组学不断发展,肿瘤基因大数据不断增加。因此,利用大数据分析方法,找到一种适用范围广、准确率高的识别肿瘤类型和组织来源的基因诊断方法,有助于实现个性化用药,对患者进行精准治疗具有重要的临床意义。
发明内容
本发明要解决的技术问题之一是提供一组用于肿瘤分子分型的基因,建立肿瘤分类模型,能够识别多种肿瘤的组织来源和肿瘤类型,有助于实现个体化治疗。
本发明要解决的技术问题之二是提供一组用于肿瘤分子分型的基因的用途。
本发明要解决的技术问题之三是提供一种用于肿瘤分子分型的试剂盒及其用途。
本发明要解决的技术问题之四是提供一组用于肿瘤分子分型的基因在制备用于肿瘤分子分型的基因芯片中的应用。
为解决上述技术问题,本发明采用如下技术方案:
在本发明的一方面,提供一组用于肿瘤分子分型的基因,包括如下38个基因:ACPP基因、AGR2基因、ASPN基因、AZGP1基因、CDH1基因、CEACAM5基因、CEACAM6基因、CYP17A1基因、EPCAM基因、FABP1基因、GATA3基因、GCG基因、GFAP基因、IGJ基因、KLK2基因、KLK3基因、KRT13基因、KRT14基因、KRT15基因、KRT19基因、LUM基因、MGP基因、MMP1基因、MMP12基因、MS4A1基因、NPTX2基因、PCP4基因、PEG3基因、POSTN基因、RPS11基因、S100A8基因、SERPINA3基因、SFN基因、SLC3A1基因、TACSTD2基因、TG基因、VEGFA基因、XIST基因。
作为本发明优选的技术方案,该组用于肿瘤分子分型的基因,还包括如下58个基因(即包括96个基因):ACTG2基因、APOBEC3B基因、APOD基因、ATP1B1基因、C7基因、CA12基因、CCL18基因、CDH17基因、CHGA基因、CHI3L1基因、CLDN18基因、CLU基因、COL11A1基因、CXCL14基因、DLK1基因、EGFR基因、ESR1基因、FABP4基因、GJA1基因、GPM6B基因、GPX3基因、GREM1基因、HBB基因、HLA-DQA1基因、ID4基因、IGFBP2基因、IGFBP7基因、ISL1基因、KRT20基因、LGALS4基因、MMP3基因、MSMB基因、NKX2-1基因、NKX3-1基因、NPY1R基因、PCDH7基因、PI15基因、PIGR基因、PLA2G2A基因、PRRX1基因、PTGDS基因、PTN基因、RGS4基因、RPS4Y1基因、S100A2基因、S100P基因、SCGB2A2基因、SERPINB3基因、SFRP1基因、SFTPB基因、SPINK1基因、SPP1基因、SST基因、SULT2A1基因、TH基因、TM4SF4基因、TSPAN8基因、TYRP1基因。
所述肿瘤包括(但不限于):肾上腺癌,脑癌,乳腺癌,宫颈癌,结直肠癌,子宫内膜癌,胃食管癌,头颈部肿瘤,肾癌,肝癌,肺癌,淋巴瘤,黑色素瘤,间皮瘤,神经内分泌肿瘤,子宫癌,胰腺癌,前列腺癌,肉瘤,睾丸癌,甲状腺肿瘤,泌尿系统肿瘤和原发灶不明转移癌。
本发明通过基因检测、标志物组合及数据挖掘算法的联合应用来建立基因标志物组合模型,利用多基因预测模型判断原发灶不明转移癌的原发位点,主要包括以下步骤:
(1)收集肿瘤样本的临床诊断数据和基因表达谱数据,构建包含人类已知2万多个基因、22种癌症类型,5800例肿瘤样品的癌症基因表达谱数据库;
(2)对基因表达模式进行统计分析,筛选出96个与肿瘤组织起源密切相关的基因,分别为:ACPP基因、AGR2基因、ASPN基因、AZGP1基因、CDH1基因、CEACAM5基因、CEACAM6基因、CYP17A1基因、EPCAM基因、FABP1基因、GATA3基因、GCG基因、GFAP基因、IGJ基因、KLK2基因、KLK3基因、KRT13基因、KRT14基因、KRT15基因、KRT19基因、LUM基因、MGP基因、MMP1基因、MMP12基因、MS4A1基因、NPTX2基因、PCP4基因、PEG3基因、POSTN基因、RPS11基因、S100A8基因、SERPINA3基因、SFN基因、SLC3A1基因、TACSTD2基因、TG基因、VEGFA基因、XIST基因、ACTG2基因、APOBEC3B基因、APOD基因、ATP1B1基因、C7基因、CA12基因、CCL18基因、CDH17基因、CHGA基因、CHI3L1基因、CLDN18基因、CLU基因、COL11A1基因、CXCL14基因、DLK1基因、EGFR基因、ESR1基因、FABP4基因、GJA1基因、GPM6B基因、GPX3基因、GREM1基因、HBB基因、HLA-DQA1基因、ID4基因、IGFBP2基因、IGFBP7基因、ISL1基因、KRT20基因、LGALS4基因、MMP3基因、MSMB基因、NKX2-1基因、NKX3-1基因、NPY1R基因、PCDH7基因、PI15基因、PIGR基因、PLA2G2A基因、PRRX1基因、PTGDS基因、PTN基因、RGS4基因、RPS4Y1基因、S100A2基因、S100P基因、SCGB2A2基因、SERPINB3基因、SFRP1基因、SFTPB基因、SPINK1基因、SPP1基因、SST基因、SULT2A1基因、TH基因、TM4SF4基因、TSPAN8基因、TYRP1基因;
(3)计算上述96个基因表达模式,通过肿瘤分类模型对组织来源进行评价,计算该样本与每种癌症类型的相似度分数(SimilarityScore)。根据相似度分数最高的判定规则,判定组织来源和肿瘤类型。
本发明提供了一种用于肿瘤分子分型的检测方法,包括以下步骤:
(1)将取自肿瘤患者的生物学样本与生物标志物接触,所述生物标志物包括上述96个基因;所述生物学样本是取自所述对象的离体肿瘤组织,可以是新鲜样本或者福尔马林固定的石蜡包埋(FFPE)样本;
在此基础上,进一步进行肿瘤分类:
(2)检测该生物学样本中96个基因的表达模式和表达水平,基于96个基因的表达水平来判断该生物学样本的肿瘤类型。采用数据分析方法,计算该生物学样本与各种肿瘤类别的相似度分数(SimilarityScore)。根据相似度分数最高的判定规则,判定组织来源和肿瘤类型,进行肿瘤分子分型。所述检测包括从所述样本制备RNA,所述RNA用于聚合酶链式反应(PCR),所述PCR是逆转录PCR(RT-PCR),可选实时RT-PCR或者基因芯片或者高通量测序技术。
在本发明的另一方面,提供一组用于肿瘤分子分型的基因在制备用于肿瘤分子分型的试剂盒中的应用。
在本发明的另一方面,提供一种用于肿瘤分子分型的试剂盒,该试剂盒包含如下生物标志物,所述生物标志物选自上述一组用于肿瘤分子分型的基因中的任意一种或多种。
作为本发明优选的技术方案,所述生物标志物是核酸、寡核酸链、或PCR引物组。
作为本发明优选的技术方案,所述PCR引物组包括:
ACPP基因:正向引物如SEQIDNO.1所示,反向引物如SEQIDNO.2所示;
AGR2基因:正向引物如SEQIDNO.3所示,反向引物如SEQIDNO.4所示;
ASPN基因:正向引物如SEQIDNO.5所示,反向引物如SEQIDNO.6所示;
AZGP1基因:正向引物如SEQIDNO.7所示,反向引物如SEQIDNO.8所示;
CDH1基因:正向引物如SEQIDNO.9所示,反向引物如SEQIDNO.10所示;
CEACAM5基因:正向引物如SEQIDNO.11所示,反向引物如SEQIDNO.12所示;
CEACAM6基因:正向引物如SEQIDNO.13所示,反向引物如SEQIDNO.14所示;
CYP17A1基因:正向引物如SEQIDNO.15所示,反向引物如SEQIDNO.16所示;
EPCAM基因:正向引物如SEQIDNO.17所示,反向引物如SEQIDNO.18所示;
FABP1基因:正向引物如SEQIDNO.19所示,反向引物如SEQIDNO.20所示;
GATA3基因:正向引物如SEQIDNO.21所示,反向引物如SEQIDNO.22所示;
GCG基因:正向引物如SEQIDNO.23所示,反向引物如SEQIDNO.24所示;
GFAP基因:正向引物如SEQIDNO.25所示,反向引物如SEQIDNO.26所示;
IGJ基因:正向引物如SEQIDNO.27所示,反向引物如SEQIDNO.28所示;
KLK2基因:正向引物如SEQIDNO.29所示,反向引物如SEQIDNO.30所示;
KLK3基因:正向引物如SEQIDNO.31所示,反向引物如SEQIDNO.32所示;
KRT13基因:正向引物如SEQIDNO.33所示,反向引物如SEQIDNO.34所示;
KRT14基因:正向引物如SEQIDNO.35所示,反向引物如SEQIDNO.36所示;
KRT15基因:正向引物如SEQIDNO.37所示,反向引物如SEQIDNO.38所示;
KRT19基因:正向引物如SEQIDNO.39所示,反向引物如SEQIDNO.40所示;
LUM基因:正向引物如SEQIDNO.41所示,反向引物如SEQIDNO.42所示;
MGP基因:正向引物如SEQIDNO.43所示,反向引物如SEQIDNO.44所示;
MMP1基因:正向引物如SEQIDNO.45所示,反向引物如SEQIDNO.46所示;
MMP12基因:正向引物如SEQIDNO.47所示,反向引物如SEQIDNO.48所示;
MS4A1基因:正向引物如SEQIDNO.49所示,反向引物如SEQIDNO.50所示;
NPTX2基因:正向引物如SEQIDNO.51所示,反向引物如SEQIDNO.52所示;
PCP4基因:正向引物如SEQIDNO.53所示,反向引物如SEQIDNO.54所示;
PEG3基因:正向引物如SEQIDNO.55所示,反向引物如SEQIDNO.56所示;
POSTN基因:正向引物如SEQIDNO.57所示,反向引物如SEQIDNO.58所示;
RPS11基因:正向引物如SEQIDNO.59所示,反向引物如SEQIDNO.60所示;
S100A8基因:正向引物如SEQIDNO.61所示,反向引物如SEQIDNO.62所示;
SERPINA3基因:正向引物如SEQIDNO.63所示,反向引物如SEQIDNO.64所示;
SFN基因:正向引物如SEQIDNO.65所示,反向引物如SEQIDNO.66所示;
SLC3A1基因:正向引物如SEQIDNO.67所示,反向引物如SEQIDNO.68所示;
TACSTD2基因:正向引物如SEQIDNO.69所示,反向引物如SEQIDNO.70所示;
TG基因:正向引物如SEQIDNO.71所示,反向引物如SEQIDNO.72所示;
VEGFA基因:正向引物如SEQIDNO.73所示,反向引物如SEQIDNO.74所示;
XIST基因:正向引物如SEQIDNO.75所示,反向引物如SEQIDNO.76所示。
作为本发明优选的技术方案,所述PCR引物组还包括:
ACTG2基因:正向引物如SEQIDNO.77所示,反向引物如SEQIDNO.78所示;
APOBEC3B基因:正向引物如SEQIDNO.79所示,反向引物如SEQIDNO.80所示;
APOD基因:正向引物如SEQIDNO.81所示,反向引物如SEQIDNO.82所示;
ATP1B1基因:正向引物如SEQIDNO.83所示,反向引物如SEQIDNO.84所示;
C7基因:正向引物如SEQIDNO.85所示,反向引物如SEQIDNO.86所示;
CA12基因:正向引物如SEQIDNO.87所示,反向引物如SEQIDNO.88所示;
CCL18基因:正向引物如SEQIDNO.89所示,反向引物如SEQIDNO.90所示;
CDH17基因:正向引物如SEQIDNO.91所示,反向引物如SEQIDNO.92所示;
CHGA基因:正向引物如SEQIDNO.93所示,反向引物如SEQIDNO.94所示;
CHI3L1基因:正向引物如SEQIDNO.95所示,反向引物如SEQIDNO.96所示;
CLDN18基因:正向引物如SEQIDNO.97所示,反向引物如SEQIDNO.98所示;
CLU基因:正向引物如SEQIDNO.99所示,反向引物如SEQIDNO.100所示;
COL11A1基因:正向引物如SEQIDNO.101所示,反向引物如SEQIDNO.102所示;
CXCL14基因:正向引物如SEQIDNO.103所示,反向引物如SEQIDNO.104所示;
DLK1基因:正向引物如SEQIDNO.105所示,反向引物如SEQIDNO.106所示;
EGFR基因:正向引物如SEQIDNO.107所示,反向引物如SEQIDNO.108所示;
ESR1基因:正向引物如SEQIDNO.109所示,反向引物如SEQIDNO.110所示;
FABP4基因:正向引物如SEQIDNO.111所示,反向引物如SEQIDNO.112所示;
GJA1基因:正向引物如SEQIDNO.113所示,反向引物如SEQIDNO.114所示;
GPM6B基因:正向引物如SEQIDNO.115所示,反向引物如SEQIDNO.116所示;
GPX3基因:正向引物如SEQIDNO.117所示,反向引物如SEQIDNO.118所示;
GREM1基因:正向引物如SEQIDNO.119所示,反向引物如SEQIDNO.120所示;
HBB基因:正向引物如SEQIDNO.121所示,反向引物如SEQIDNO.122所示;
HLA-DQA1基因:正向引物如SEQIDNO.123所示,反向引物如SEQIDNO.124所示;
ID4基因:正向引物如SEQIDNO.125所示,反向引物如SEQIDNO.126所示;
IGFBP2基因:正向引物如SEQIDNO.127所示,反向引物如SEQIDNO.128所示;
IGFBP7基因:正向引物如SEQIDNO.129所示,反向引物如SEQIDNO.130所示;
ISL1基因:正向引物如SEQIDNO.131所示,反向引物如SEQIDNO.132所示;
KRT20基因:正向引物如SEQIDNO.133所示,反向引物如SEQIDNO.134所示;
LGALS4基因:正向引物如SEQIDNO.135所示,反向引物如SEQIDNO.136所示;
MMP3基因:正向引物如SEQIDNO.137所示,反向引物如SEQIDNO.138所示;
MSMB基因:正向引物如SEQIDNO.139所示,反向引物如SEQIDNO.140所示;
NKX2-1基因:正向引物如SEQIDNO.141所示,反向引物如SEQIDNO.142所示;
NKX3-1基因:正向引物如SEQIDNO.143所示,反向引物如SEQIDNO.144所示;
NPY1R基因:正向引物如SEQIDNO.145所示,反向引物如SEQIDNO.146所示;
PCDH7基因:正向引物如SEQIDNO.147所示,反向引物如SEQIDNO.148所示;
PI15基因:正向引物如SEQIDNO.149所示,反向引物如SEQIDNO.150所示;
PIGR基因:正向引物如SEQIDNO.151所示,反向引物如SEQIDNO.152所示;
PLA2G2A基因:正向引物如SEQIDNO.153所示,反向引物如SEQIDNO.154所示;
PRRX1基因:正向引物如SEQIDNO.155所示,反向引物如SEQIDNO.156所示;
PTGDS基因:正向引物如SEQIDNO.157所示,反向引物如SEQIDNO.158所示;
PTN基因:正向引物如SEQIDNO.159所示,反向引物如SEQIDNO.160所示;
RGS4基因:正向引物如SEQIDNO.161所示,反向引物如SEQIDNO.162所示;
RPS4Y1基因:正向引物如SEQIDNO.163所示,反向引物如SEQIDNO.164所示;
S100A2基因:正向引物如SEQIDNO.165所示,反向引物如SEQIDNO.166所示;
S100P基因:正向引物如SEQIDNO.167所示,反向引物如SEQIDNO.168所示;
SCGB2A2基因:正向引物如SEQIDNO.169所示,反向引物如SEQIDNO.170所示;
SERPINB3基因:正向引物如SEQIDNO.171所示,反向引物如SEQIDNO.172所示;
SFRP1基因:正向引物如SEQIDNO.173所示,反向引物如SEQIDNO.174所示;
SFTPB基因:正向引物如SEQIDNO.175所示,反向引物如SEQIDNO.176所示;
SPINK1基因:正向引物如SEQIDNO.177所示,反向引物如SEQIDNO.178所示;
SPP1基因:正向引物如SEQIDNO.179所示,反向引物如SEQIDNO.180所示;
SST基因:正向引物如SEQIDNO.181所示,反向引物如SEQIDNO.182所示;
SULT2A1基因:正向引物如SEQIDNO.183所示,反向引物如SEQIDNO.184所示;
TH基因:正向引物如SEQIDNO.185所示,反向引物如SEQIDNO.186所示;
TM4SF4基因:正向引物如SEQIDNO.187所示,反向引物如SEQIDNO.188所示;
TSPAN8基因:正向引物如SEQIDNO.189所示,反向引物如SEQIDNO.190所示;
TYRP1基因:正向引物如SEQIDNO.191所示,反向引物如SEQIDNO.192所示。
上述试剂盒的使用方法包括以下步骤:
(1)将包含肿瘤组织的生物学样本与生物标志物接触;
(2)测定所述标志物在该生物学样本中的表达水平;
(3)检测生物学样本中基因的表达模式,并将其与癌症基因表达谱数据库进行比对。
所述试剂盒检测的表达可以通过实时定量逆转录聚合酶链式反应(RT-PCR)或者基因芯片或者高通量测序技术。
所述试剂盒检测的表达水平是mRNA表达水平。
仅作为本发明上述补助的例子,针对石蜡包埋肿瘤组织,利用实时定量逆转录聚合酶链式反应(RT-PCR),识别肿瘤原发位点的方法,包含以下步骤:
(1)获取肿瘤组织的石蜡包埋组织;
(2)以实时定量逆转录聚合酶链式反应检测该样本中96个基因的表达;
(3)检测该样本中基因96个基因的表达模式,并将其与癌症基因表达谱数据库进行比对,计算该样本与各种肿瘤类别的相似度分数。根据相似度分数最高的判定规则,判定组织来源和肿瘤类型。
在本发明的另一方面,提供所述的试剂盒在制备识别肿瘤组织来源的制剂中的用途。
在本发明的另一方面,提供一组用于肿瘤分子分型的基因在制备用于肿瘤分子分型的基因芯片中的应用,所述基因芯片包括固相载体和探针,所述探针与待测38个基因序列和/或其互补序列进行杂交,所述探针分别是SEQIDNo.193~SEQIDNo.230所示序列。
在本发明的另一方面,提供一组用于肿瘤分子分型的基因在制备用于肿瘤分子分型的基因芯片中的应用,所述基因芯片包括固相载体和探针,所述探针与待测96个基因序列和/或其互补序列进行杂交,所述探针分别是SEQIDNo.193~SEQIDNo.288所示序列。
本发明通过检测96个与肿瘤组织起源密切相关的基因,构建分类预测模型用于判别肿瘤样品的组织起源和癌症类型,从而帮助医生进行用药指导,实现精准医疗,以提高原发灶不明转移癌患者的生存率,改善患者生存状况。经试验验证,本发明试剂盒能准确识别原发灶不明转移癌的组织起源,其适用范围广、准确率高,有助于实现个性化用药,对患者进行精准治疗具有重要的临床意义。
附图说明
图1是本发明实施例5中96基因肿瘤分子分型标志物的判别结果示意图。
具体实施方式
以下实施例仅用于说明本发明,而不用于限制本发明的范围。实施例中未注明具体条件的实验方法,按照制造试剂盒生产公司所建议的条件或按照常规实验条件,例如Sambrook等人,分子克隆:实验室手册(NewYork:ColdSpringHarborLaboratoryPress,1989)中所述的条件。
除非另行定义,文中所使用的所有专业与科学用语与本领域熟练人员所熟悉的意义相同。此外,任何与所记载内容相似或均等的方法及材料皆可应用于本发明中。文中所述的较佳实施方法与材料仅作示范之用。
实施例1.
训练集样本收集及处理:
本发明分析了大样本量的癌症患者临床数据及其生物学样本数据,包含了来自世界各地共计5800例,22类肿瘤的癌症患者的相应的临床资料和表达谱数据。其中有肾上腺癌55例,脑癌446例,乳腺癌542例,宫颈癌113例,结直肠癌439例,子宫内膜癌262例,胃食管癌530例,头颈部肿瘤254例,肾癌256例,肝癌222例,肺癌285例,淋巴瘤366例,黑色素瘤163例,间皮瘤100例,神经内分泌肿瘤209例,子宫癌225例,胰腺癌134例,前列腺癌458例,肉瘤169例,睾丸癌136例,甲状腺肿瘤238例,泌尿系统肿瘤198例。构建了包含人类已知2万多个基因、22种癌症类型,总计5800例肿瘤样品的癌症基因表达谱数据库。
38个特异性基因的筛选:
根据基因表达丰度的测量值,发明人采用统计分析方法F检验从2万多个基因中筛选出38个与肿瘤原发部位密切相关的基因。这些基因22种原发肿瘤中存在差异性表达,具有统计学意义(P值<0.0001)。
表1:38基因集合
38基因分类模型的构建:
基于38个特异基因在5800例肿瘤样本中的表达模式,发明人采用支持向量机(SupportVectorMachines)算法,建立分类模型用于判别肿瘤样品的组织起源和癌症类型。对于每一例待测样本,模型计算该样本的基因表达模式与数据库中22种癌症类型的相似度分数,并根据相似度分数最大原则判别该样本最有可能的组织来源。自1992年发明以来,支持向量机算法已被广泛地应用于解决各类模式识别问题,包括金融数据分析、语音识别和生物数据分析。本领域的技术人员可通过开源免费的分析软件,例如:R、Rapidminer和WEKA使用支持向量机算法。不仅仅局限于支持向量机算法,其他公知的数据挖掘方法都可采用,例如加权投票(WeightedVoting)、K-最邻近值(K-nearestNeighbors)、随机森林(RandomForest)、相关性系数(CorrelationCoefficients)等。
实施例2.
验证集测试:
本实施例中,发明人分析了包含9626例肿瘤的高通量测序数据,其中有肾上腺癌79例,脑癌708例,乳腺癌1218例,宫颈癌310例,结直肠癌434例,子宫内膜癌201例,胃食管癌196例,头颈部肿瘤566例,肾癌1020例,肝癌469例,肺癌1130例,淋巴瘤48例,黑色素瘤554例,间皮瘤87例,神经内分泌肿瘤187例,子宫癌266例,胰腺癌183例,前列腺癌187例,肉瘤265例,睾丸癌156例,甲状腺肿瘤572例,泌尿系统肿瘤427例。通过分类模型对其进行组织来源的判别,并与临床及病理资料中所记载的肿瘤组织来源相比较,平均符合率为81.6%。其中,在13种癌症中的敏感度高于80%,平均敏感度为79.4%;在19种癌症中的特异度高于99%,平均特异度为99.1%。
表2:38基因模型在9626例验证集中的敏感性和特异性
实施例3.
96个特异性基因的筛选:
发明人将F检验的筛选标准放宽至P值小于0.001,进一步得到额外的58个基因。这些基因在22种原发肿瘤中存在差异性表达,差异具有统计学意义。将58个基因与实施例1中的38个基因合并,组成96基因集合。
表3:58基因集合
96基因分类模型的构建:
基于96个特异基因在5800例肿瘤样本中的表达模式,发明人采用支持向量机算法,建立分类模型用于判别肿瘤样品的组织起源和癌症类型。对于每一例待测样本,模型计算该样本的基因表达模式与数据库中22种癌症类型的相似度分数,并根据相似度分数最大原则判别该样本最有可能的组织来源。
实施例4.
验证集测试:
本实施例中,发明人分析了包含9626例肿瘤的高通量测序数据,其中有肾上腺癌79例,脑癌708例,乳腺癌1218例,宫颈癌310例,结直肠癌434例,子宫内膜癌201例,胃食管癌196例,头颈部肿瘤566例,肾癌1020例,肝癌469例,肺癌1130例,淋巴瘤48例,黑色素瘤554例,间皮瘤87例,神经内分泌肿瘤187例,子宫癌266例,胰腺癌183例,前列腺癌187例,肉瘤265例,睾丸癌156例,甲状腺肿瘤572例,泌尿系统肿瘤427例。通过分类模型对其进行组织来源的判别,并与临床及病理资料中所记载的肿瘤组织来源相比较,平均符合率为92.5%。其中,在12种癌症中的敏感度高于96%,19种癌症中的敏感度高于80%,平均敏感度为91.1%;在20种癌症中的特异度高于99%,平均特异度为99.6%。相比于38基因模型,96基因模型的敏感度和特异度均有显著的提升。
表4:96基因模型在9626例验证集中的敏感性和特异性
实施例5.
本实施例中,收集手术切除后的肿瘤组织的石蜡包埋样品,该生物学样本经病理确认为癌组织,已知原发位点,肿瘤类型属于上述22种之一。实验人员用手工刮片的方式从福尔马林固定石蜡包埋的组织块上肿瘤细胞富集区收集并提取总RNA;用DNase处理以确保完全去除基因组DNA的污染;经逆转录后获得cDNA,进行96个基因的实时定量PCR。PCR反应结束后,根据该样本96个基因的表达模式,分类模型计算该样本与22个肿瘤类型的相似度分数。
设计96个基因的PCR引物组分别如下:
ACPP基因:正向引物如SEQIDNO.1所示,反向引物如SEQIDNO.2所示;
AGR2基因:正向引物如SEQIDNO.3所示,反向引物如SEQIDNO.4所示;
ASPN基因:正向引物如SEQIDNO.5所示,反向引物如SEQIDNO.6所示;
AZGP1基因:正向引物如SEQIDNO.7所示,反向引物如SEQIDNO.8所示;
CDH1基因:正向引物如SEQIDNO.9所示,反向引物如SEQIDNO.10所示;
CEACAM5基因:正向引物如SEQIDNO.11所示,反向引物如SEQIDNO.12所示;
CEACAM6基因:正向引物如SEQIDNO.13所示,反向引物如SEQIDNO.14所示;
CYP17A1基因:正向引物如SEQIDNO.15所示,反向引物如SEQIDNO.16所示;
EPCAM基因:正向引物如SEQIDNO.17所示,反向引物如SEQIDNO.18所示;
FABP1基因:正向引物如SEQIDNO.19所示,反向引物如SEQIDNO.20所示;
GATA3基因:正向引物如SEQIDNO.21所示,反向引物如SEQIDNO.22所示;
GCG基因:正向引物如SEQIDNO.23所示,反向引物如SEQIDNO.24所示;
GFAP基因:正向引物如SEQIDNO.25所示,反向引物如SEQIDNO.26所示;
IGJ基因:正向引物如SEQIDNO.27所示,反向引物如SEQIDNO.28所示;
KLK2基因:正向引物如SEQIDNO.29所示,反向引物如SEQIDNO.30所示;
KLK3基因:正向引物如SEQIDNO.31所示,反向引物如SEQIDNO.32所示;
KRT13基因:正向引物如SEQIDNO.33所示,反向引物如SEQIDNO.34所示;
KRT14基因:正向引物如SEQIDNO.35所示,反向引物如SEQIDNO.36所示;
KRT15基因:正向引物如SEQIDNO.37所示,反向引物如SEQIDNO.38所示;
KRT19基因:正向引物如SEQIDNO.39所示,反向引物如SEQIDNO.40所示;
LUM基因:正向引物如SEQIDNO.41所示,反向引物如SEQIDNO.42所示;
MGP基因:正向引物如SEQIDNO.43所示,反向引物如SEQIDNO.44所示;
MMP1基因:正向引物如SEQIDNO.45所示,反向引物如SEQIDNO.46所示;
MMP12基因:正向引物如SEQIDNO.47所示,反向引物如SEQIDNO.48所示;
MS4A1基因:正向引物如SEQIDNO.49所示,反向引物如SEQIDNO.50所示;
NPTX2基因:正向引物如SEQIDNO.51所示,反向引物如SEQIDNO.52所示;
PCP4基因:正向引物如SEQIDNO.53所示,反向引物如SEQIDNO.54所示;
PEG3基因:正向引物如SEQIDNO.55所示,反向引物如SEQIDNO.56所示;
POSTN基因:正向引物如SEQIDNO.57所示,反向引物如SEQIDNO.58所示;
RPS11基因:正向引物如SEQIDNO.59所示,反向引物如SEQIDNO.60所示;
S100A8基因:正向引物如SEQIDNO.61所示,反向引物如SEQIDNO.62所示;
SERPINA3基因:正向引物如SEQIDNO.63所示,反向引物如SEQIDNO.64所示;
SFN基因:正向引物如SEQIDNO.65所示,反向引物如SEQIDNO.66所示;
SLC3A1基因:正向引物如SEQIDNO.67所示,反向引物如SEQIDNO.68所示;
TACSTD2基因:正向引物如SEQIDNO.69所示,反向引物如SEQIDNO.70所示;
TG基因:正向引物如SEQIDNO.71所示,反向引物如SEQIDNO.72所示;
VEGFA基因:正向引物如SEQIDNO.73所示,反向引物如SEQIDNO.74所示;
XIST基因:正向引物如SEQIDNO.75所示,反向引物如SEQIDNO.76所示;
ACTG2基因:正向引物如SEQIDNO.77所示,反向引物如SEQIDNO.78所示;
APOBEC3B基因:正向引物如SEQIDNO.79所示,反向引物如SEQIDNO.80所示;
APOD基因:正向引物如SEQIDNO.81所示,反向引物如SEQIDNO.82所示;
ATP1B1基因:正向引物如SEQIDNO.83所示,反向引物如SEQIDNO.84所示;
C7基因:正向引物如SEQIDNO.85所示,反向引物如SEQIDNO.86所示;
CA12基因:正向引物如SEQIDNO.87所示,反向引物如SEQIDNO.88所示;
CCL18基因:正向引物如SEQIDNO.89所示,反向引物如SEQIDNO.90所示;
CDH17基因:正向引物如SEQIDNO.91所示,反向引物如SEQIDNO.92所示;
CHGA基因:正向引物如SEQIDNO.93所示,反向引物如SEQIDNO.94所示;
CHI3L1基因:正向引物如SEQIDNO.95所示,反向引物如SEQIDNO.96所示;
CLDN18基因:正向引物如SEQIDNO.97所示,反向引物如SEQIDNO.98所示;
CLU基因:正向引物如SEQIDNO.99所示,反向引物如SEQIDNO.100所示;
COL11A1基因:正向引物如SEQIDNO.101所示,反向引物如SEQIDNO.102所示;
CXCL14基因:正向引物如SEQIDNO.103所示,反向引物如SEQIDNO.104所示;
DLK1基因:正向引物如SEQIDNO.105所示,反向引物如SEQIDNO.106所示;
EGFR基因:正向引物如SEQIDNO.107所示,反向引物如SEQIDNO.108所示;
ESR1基因:正向引物如SEQIDNO.109所示,反向引物如SEQIDNO.110所示;
FABP4基因:正向引物如SEQIDNO.111所示,反向引物如SEQIDNO.112所示;
GJA1基因:正向引物如SEQIDNO.113所示,反向引物如SEQIDNO.114所示;
GPM6B基因:正向引物如SEQIDNO.115所示,反向引物如SEQIDNO.116所示;
GPX3基因:正向引物如SEQIDNO.117所示,反向引物如SEQIDNO.118所示;
GREM1基因:正向引物如SEQIDNO.119所示,反向引物如SEQIDNO.120所示;
HBB基因:正向引物如SEQIDNO.121所示,反向引物如SEQIDNO.122所示;
HLA-DQA1基因:正向引物如SEQIDNO.123所示,反向引物如SEQIDNO.124所示;
ID4基因:正向引物如SEQIDNO.125所示,反向引物如SEQIDNO.126所示;
IGFBP2基因:正向引物如SEQIDNO.127所示,反向引物如SEQIDNO.128所示;
IGFBP7基因:正向引物如SEQIDNO.129所示,反向引物如SEQIDNO.130所示;
ISL1基因:正向引物如SEQIDNO.131所示,反向引物如SEQIDNO.132所示;
KRT20基因:正向引物如SEQIDNO.133所示,反向引物如SEQIDNO.134所示;
LGALS4基因:正向引物如SEQIDNO.135所示,反向引物如SEQIDNO.136所示;
MMP3基因:正向引物如SEQIDNO.137所示,反向引物如SEQIDNO.138所示;
MSMB基因:正向引物如SEQIDNO.139所示,反向引物如SEQIDNO.140所示;
NKX2-1基因:正向引物如SEQIDNO.141所示,反向引物如SEQIDNO.142所示;
NKX3-1基因:正向引物如SEQIDNO.143所示,反向引物如SEQIDNO.144所示;
NPY1R基因:正向引物如SEQIDNO.145所示,反向引物如SEQIDNO.146所示;
PCDH7基因:正向引物如SEQIDNO.147所示,反向引物如SEQIDNO.148所示;
PI15基因:正向引物如SEQIDNO.149所示,反向引物如SEQIDNO.150所示;
PIGR基因:正向引物如SEQIDNO.151所示,反向引物如SEQIDNO.152所示;
PLA2G2A基因:正向引物如SEQIDNO.153所示,反向引物如SEQIDNO.154所示;
PRRX1基因:正向引物如SEQIDNO.155所示,反向引物如SEQIDNO.156所示;
PTGDS基因:正向引物如SEQIDNO.157所示,反向引物如SEQIDNO.158所示;
PTN基因:正向引物如SEQIDNO.159所示,反向引物如SEQIDNO.160所示;
RGS4基因:正向引物如SEQIDNO.161所示,反向引物如SEQIDNO.162所示;
RPS4Y1基因:正向引物如SEQIDNO.163所示,反向引物如SEQIDNO.164所示;
S100A2基因:正向引物如SEQIDNO.165所示,反向引物如SEQIDNO.166所示;
S100P基因:正向引物如SEQIDNO.167所示,反向引物如SEQIDNO.168所示;
SCGB2A2基因:正向引物如SEQIDNO.169所示,反向引物如SEQIDNO.170所示;
SERPINB3基因:正向引物如SEQIDNO.171所示,反向引物如SEQIDNO.172所示;
SFRP1基因:正向引物如SEQIDNO.173所示,反向引物如SEQIDNO.174所示;
SFTPB基因:正向引物如SEQIDNO.175所示,反向引物如SEQIDNO.176所示;
SPINK1基因:正向引物如SEQIDNO.177所示,反向引物如SEQIDNO.178所示;
SPP1基因:正向引物如SEQIDNO.179所示,反向引物如SEQIDNO.180所示;
SST基因:正向引物如SEQIDNO.181所示,反向引物如SEQIDNO.182所示;
SULT2A1基因:正向引物如SEQIDNO.183所示,反向引物如SEQIDNO.184所示;
TH基因:正向引物如SEQIDNO.185所示,反向引物如SEQIDNO.186所示;
TM4SF4基因:正向引物如SEQIDNO.187所示,反向引物如SEQIDNO.188所示;
TSPAN8基因:正向引物如SEQIDNO.189所示,反向引物如SEQIDNO.190所示;
TYRP1基因:正向引物如SEQIDNO.191所示,反向引物如SEQIDNO.192所示。
结果如图1所示,该肿瘤样品最有可能的5种组织来源分别为:乳腺、结直肠、胃食管、子宫内膜及头颈部,相似度分数分别为79.4、9.9、3.8、3.0和1.0。根据相似度分数最高的判定规则,该肿瘤样品最有可能起源于乳腺癌组织。该肿瘤样品最不可能的5种组织来源分别为:间皮瘤、神经内分泌瘤、淋巴瘤、前列腺癌及肾上腺肿瘤,对应的相似度分数均小于0.1。
实施例6
本实施例中,发明人对1248例低分化或已发生转移的肿瘤样本进行基因芯片实验。1248例肿瘤样本包括:肾上腺癌44例,脑癌26例,乳腺癌142例,宫颈癌19例,结直肠癌96例,子宫内膜癌15例,胃食管癌19例,头颈部肿瘤34例,肾癌55例,肝癌34例,肺癌190例,淋巴瘤30例,黑色素瘤72例,间皮瘤40例,神经内分泌肿瘤22例,子宫癌87例,胰腺癌24例,前列腺癌41例,肉瘤216例,睾丸癌17例,甲状腺肿瘤12例,泌尿系统肿瘤13例。
基因芯片是通过微电子技术和微加工技术将大量特定序列的DNA片段或寡核昔酸片段按矩阵高密度固定于玻璃、硅片等载体上,待测样品用荧光分子标记后,与芯片上大DNA或寡核昔酸片段杂交,通过荧光扫描及计算机分析后获得大量基因信息的一种检测方法。其突出特点在于能够对微量样本中的核酸序列信息进行快速、准确、高通量的检测和分析,可以同时获得成千上万个基因的表达丰度和表达模式关联图谱。
实验人员用手工刮片的方式从福尔马林固定石蜡包埋的组织块上肿瘤细胞富集区收集并提取总RNA;用DNase处理以确保完全去除基因组DNA的污染;经逆转录后获得cDNA;将cDNA与基因芯片混合、杂交反应;通过扫描荧光信号检测基因的表达丰度。基因芯片反应结束后,提取该样本96个基因的表达模式,分类模型计算该样本与22个肿瘤类型的相似度分数。
通过分类模型对其进行组织来源的判别,并与临床及病理资料中所记载的肿瘤组织来源相比较,平均符合率为86.5%。其中,在15种癌症中的敏感度高于80%,平均敏感度为81.6%;在16种癌症中的特异度高于99%,平均特异度为99.3%。
表5:96基因模型在1248例验证集中的敏感性和特异性
基因芯片中96个基因的探针序列分别如下:
表6
序号 基因 探针
1 ACPP SEQ ID NO.193
2 AGR2 SEQ ID NO.194
3 ASPN SEQ ID NO.195
4 AZGP1 SEQ ID NO.196
5 CDH1 SEQ ID NO.197
6 CEACAM5 SEQ ID NO.198
7 CEACAM6 SEQ ID NO.199
8 CYP17A1 SEQ ID NO.200
9 EPCAM SEQ ID NO.201
10 FABP1 SEQ ID NO.202
11 GATA3 SEQ ID NO.203
12 GCG SEQ ID NO.204
13 GFAP SEQ ID NO.205
14 IGJ SEQ ID NO.206
15 KLK2 SEQ ID NO.207
16 KLK3 SEQ ID NO.208
17 KRT13 SEQ ID NO.209
18 KRT14 SEQ ID NO.210
19 KRT15 SEQ ID NO.211
20 KRT19 SEQ ID NO.212
21 LUM SEQ ID NO.213
22 MGP SEQ ID NO.214
23 MMP1 SEQ ID NO.215
24 MMP12 SEQ ID NO.216
25 MS4A1 SEQ ID NO.217
26 NPTX2 SEQ ID NO.218
27 PCP4 SEQ ID NO.219
28 PEG3 SEQ ID NO.220
29 POSTN SEQ ID NO.221
30 RPS11 SEQ ID NO.222
31 S100A8 SEQ ID NO.223
32 SERPINA3 SEQ ID NO.224
33 SFN SEQ ID NO.225
34 SLC3A1 SEQ ID NO.226
35 TACSTD2 SEQ ID NO.227
36 TG SEQ ID NO.228
37 VEGFA SEQ ID NO.229
38 XIST SEQ ID NO.230
39 ACTG2 SEQ ID NO.231
40 APOBEC3B SEQ ID NO.232
41 APOD SEQ ID NO.233
42 ATP1B1 SEQ ID NO.234
43 C7 SEQ ID NO.235
44 CA12 SEQ ID NO.236
45 CCL18 SEQ ID NO.237
46 CDH17 SEQ ID NO.238
47 CHGA SEQ ID NO.239
48 CHI3L1 SEQ ID NO.240
49 CLDN18 SEQ ID NO.241
50 CLU SEQ ID NO.242
51 COL11A1 SEQ ID NO.243
52 CXCL14 SEQ ID NO.244
53 DLK1 SEQ ID NO.245
54 EGFR SEQ ID NO.246
55 ESR1 SEQ ID NO.247
56 FABP4 SEQ ID NO.248
57 GJA1 SEQ ID NO.249
58 GPM6B SEQ ID NO.250
59 GPX3 SEQ ID NO.251
60 GREM1 SEQ ID NO.252
61 HBB SEQ ID NO.253
62 HLA-DQA1 SEQ ID NO.254
63 ID4 SEQ ID NO.255
64 IGFBP2 SEQ ID NO.256
65 IGFBP7 SEQ ID NO.257
66 ISL1 SEQ ID NO.258
67 KRT20 SEQ ID NO.259
68 LGALS4 SEQ ID NO.260
69 MMP3 SEQ ID NO.261
70 MSMB SEQ ID NO.262
71 NKX2-1 SEQ ID NO.263
72 NKX3-1 SEQ ID NO.264
73 NPY1R SEQ ID NO.265
74 PCDH7 SEQ ID NO.266
75 PI15 SEQ ID NO.267
76 PIGR SEQ ID NO.268
77 PLA2G2A SEQ ID NO.269
78 PRRX1 SEQ ID NO.270
79 PTGDS SEQ ID NO.271
80 PTN SEQ ID NO.272
81 RGS4 SEQ ID NO.273
82 RPS4Y1 SEQ ID NO.274
83 S100A2 SEQ ID NO.275
84 S100P SEQ ID NO.276
85 SCGB2A2 SEQ ID NO.277
86 SERPINB3 SEQ ID NO.278
87 SFRP1 SEQ ID NO.279
88 SFTPB SEQ ID NO.280
89 SPINK1 SEQ ID NO.281
90 SPP1 SEQ ID NO.282
91 SST SEQ ID NO.283
92 SULT2A1 SEQ ID NO.284
93 TH SEQ ID NO.285
94 TM4SF4 SEQ ID NO.286
95 TSPAN8 SEQ ID NO.287
96 TYRP1 SEQ ID NO.288
以上所述实施例仅表达了本发明的实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (11)

1.一组用于肿瘤分子分型的基因,其特征在于,包括如下38个基因:ACPP基因、AGR2基因、ASPN基因、AZGP1基因、CDH1基因、CEACAM5基因、CEACAM6基因、CYP17A1基因、EPCAM基因、FABP1基因、GATA3基因、GCG基因、GFAP基因、IGJ基因、KLK2基因、KLK3基因、KRT13基因、KRT14基因、KRT15基因、KRT19基因、LUM基因、MGP基因、MMP1基因、MMP12基因、MS4A1基因、NPTX2基因、PCP4基因、PEG3基因、POSTN基因、RPS11基因、S100A8基因、SERPINA3基因、SFN基因、SLC3A1基因、TACSTD2基因、TG基因、VEGFA基因、XIST基因。
2.如权利要求1所述的一组用于肿瘤分子分型的基因,其特征在于,还包括如下58个基因:ACTG2基因、APOBEC3B基因、APOD基因、ATP1B1基因、C7基因、CA12基因、CCL18基因、CDH17基因、CHGA基因、CHI3L1基因、CLDN18基因、CLU基因、COL11A1基因、CXCL14基因、DLK1基因、EGFR基因、ESR1基因、FABP4基因、GJA1基因、GPM6B基因、GPX3基因、GREM1基因、HBB基因、HLA-DQA1基因、ID4基因、IGFBP2基因、IGFBP7基因、ISL1基因、KRT20基因、LGALS4基因、MMP3基因、MSMB基因、NKX2-1基因、NKX3-1基因、NPY1R基因、PCDH7基因、PI15基因、PIGR基因、PLA2G2A基因、PRRX1基因、PTGDS基因、PTN基因、RGS4基因、RPS4Y1基因、S100A2基因、S100P基因、SCGB2A2基因、SERPINB3基因、SFRP1基因、SFTPB基因、SPINK1基因、SPP1基因、SST基因、SULT2A1基因、TH基因、TM4SF4基因、TSPAN8基因、TYRP1基因。
3.如权利要求1或2所述的基因,其特征在于,所述肿瘤包括:肾上腺癌,脑癌,乳腺癌,宫颈癌,结直肠癌,子宫内膜癌,胃食管癌,头颈部肿瘤,肾癌,肝癌,肺癌,淋巴瘤,黑色素瘤,间皮瘤,神经内分泌肿瘤,子宫癌,胰腺癌,前列腺癌,肉瘤,睾丸癌,甲状腺肿瘤,泌尿系统肿瘤和原发灶不明转移癌。
4.如权利要求1-3任一项所述的一组用于肿瘤分子分型的基因在制备用于肿瘤分子分型的试剂盒中的应用。
5.一种用于肿瘤分子分型的试剂盒,其特征在于,该试剂盒包含如下生物标志物,所述生物标志物选自权利要求1-3任一项所述的一组用于肿瘤分子分型的基因中的任意一种或多种。
6.如权利要求5所述的试剂盒,其特征在于,所述生物标志物是核酸、寡核酸链、或PCR引物组。
7.如权利要求6所述的试剂盒,其特征在于,所述PCR引物组包括:
ACPP基因:正向引物如SEQIDNO.1所示,反向引物如SEQIDNO.2所示;
AGR2基因:正向引物如SEQIDNO.3所示,反向引物如SEQIDNO.4所示;
ASPN基因:正向引物如SEQIDNO.5所示,反向引物如SEQIDNO.6所示;
AZGP1基因:正向引物如SEQIDNO.7所示,反向引物如SEQIDNO.8所示;
CDH1基因:正向引物如SEQIDNO.9所示,反向引物如SEQIDNO.10所示;
CEACAM5基因:正向引物如SEQIDNO.11所示,反向引物如SEQIDNO.12所示;
CEACAM6基因:正向引物如SEQIDNO.13所示,反向引物如SEQIDNO.14所示;
CYP17A1基因:正向引物如SEQIDNO.15所示,反向引物如SEQIDNO.16所示;
EPCAM基因:正向引物如SEQIDNO.17所示,反向引物如SEQIDNO.18所示;
FABP1基因:正向引物如SEQIDNO.19所示,反向引物如SEQIDNO.20所示;
GATA3基因:正向引物如SEQIDNO.21所示,反向引物如SEQIDNO.22所示;
GCG基因:正向引物如SEQIDNO.23所示,反向引物如SEQIDNO.24所示;
GFAP基因:正向引物如SEQIDNO.25所示,反向引物如SEQIDNO.26所示;
IGJ基因:正向引物如SEQIDNO.27所示,反向引物如SEQIDNO.28所示;
KLK2基因:正向引物如SEQIDNO.29所示,反向引物如SEQIDNO.30所示;
KLK3基因:正向引物如SEQIDNO.31所示,反向引物如SEQIDNO.32所示;
KRT13基因:正向引物如SEQIDNO.33所示,反向引物如SEQIDNO.34所示;
KRT14基因:正向引物如SEQIDNO.35所示,反向引物如SEQIDNO.36所示;
KRT15基因:正向引物如SEQIDNO.37所示,反向引物如SEQIDNO.38所示;
KRT19基因:正向引物如SEQIDNO.39所示,反向引物如SEQIDNO.40所示;
LUM基因:正向引物如SEQIDNO.41所示,反向引物如SEQIDNO.42所示;
MGP基因:正向引物如SEQIDNO.43所示,反向引物如SEQIDNO.44所示;
MMP1基因:正向引物如SEQIDNO.45所示,反向引物如SEQIDNO.46所示;
MMP12基因:正向引物如SEQIDNO.47所示,反向引物如SEQIDNO.48所示;
MS4A1基因:正向引物如SEQIDNO.49所示,反向引物如SEQIDNO.50所示;
NPTX2基因:正向引物如SEQIDNO.51所示,反向引物如SEQIDNO.52所示;
PCP4基因:正向引物如SEQIDNO.53所示,反向引物如SEQIDNO.54所示;
PEG3基因:正向引物如SEQIDNO.55所示,反向引物如SEQIDNO.56所示;
POSTN基因:正向引物如SEQIDNO.57所示,反向引物如SEQIDNO.58所示;
RPS11基因:正向引物如SEQIDNO.59所示,反向引物如SEQIDNO.60所示;
S100A8基因:正向引物如SEQIDNO.61所示,反向引物如SEQIDNO.62所示;
SERPINA3基因:正向引物如SEQIDNO.63所示,反向引物如SEQIDNO.64所示;
SFN基因:正向引物如SEQIDNO.65所示,反向引物如SEQIDNO.66所示;
SLC3A1基因:正向引物如SEQIDNO.67所示,反向引物如SEQIDNO.68所示;
TACSTD2基因:正向引物如SEQIDNO.69所示,反向引物如SEQIDNO.70所示;
TG基因:正向引物如SEQIDNO.71所示,反向引物如SEQIDNO.72所示;
VEGFA基因:正向引物如SEQIDNO.73所示,反向引物如SEQIDNO.74所示;
XIST基因:正向引物如SEQIDNO.75所示,反向引物如SEQIDNO.76所示。
8.如权利要求7所述的试剂盒,其特征在于,所述PCR引物组还包括:
ACTG2基因:正向引物如SEQIDNO.77所示,反向引物如SEQIDNO.78所示;
APOBEC3B基因:正向引物如SEQIDNO.79所示,反向引物如SEQIDNO.80所示;
APOD基因:正向引物如SEQIDNO.81所示,反向引物如SEQIDNO.82所示;
ATP1B1基因:正向引物如SEQIDNO.83所示,反向引物如SEQIDNO.84所示;
C7基因:正向引物如SEQIDNO.85所示,反向引物如SEQIDNO.86所示;
CA12基因:正向引物如SEQIDNO.87所示,反向引物如SEQIDNO.88所示;
CCL18基因:正向引物如SEQIDNO.89所示,反向引物如SEQIDNO.90所示;
CDH17基因:正向引物如SEQIDNO.91所示,反向引物如SEQIDNO.92所示;
CHGA基因:正向引物如SEQIDNO.93所示,反向引物如SEQIDNO.94所示;
CHI3L1基因:正向引物如SEQIDNO.95所示,反向引物如SEQIDNO.96所示;
CLDN18基因:正向引物如SEQIDNO.97所示,反向引物如SEQIDNO.98所示;
CLU基因:正向引物如SEQIDNO.99所示,反向引物如SEQIDNO.100所示;
COL11A1基因:正向引物如SEQIDNO.101所示,反向引物如SEQIDNO.102所示;
CXCL14基因:正向引物如SEQIDNO.103所示,反向引物如SEQIDNO.104所示;
DLK1基因:正向引物如SEQIDNO.105所示,反向引物如SEQIDNO.106所示;
EGFR基因:正向引物如SEQIDNO.107所示,反向引物如SEQIDNO.108所示;
ESR1基因:正向引物如SEQIDNO.109所示,反向引物如SEQIDNO.110所示;
FABP4基因:正向引物如SEQIDNO.111所示,反向引物如SEQIDNO.112所示;
GJA1基因:正向引物如SEQIDNO.113所示,反向引物如SEQIDNO.114所示;
GPM6B基因:正向引物如SEQIDNO.115所示,反向引物如SEQIDNO.116所示;
GPX3基因:正向引物如SEQIDNO.117所示,反向引物如SEQIDNO.118所示;
GREM1基因:正向引物如SEQIDNO.119所示,反向引物如SEQIDNO.120所示;
HBB基因:正向引物如SEQIDNO.121所示,反向引物如SEQIDNO.122所示;
HLA-DQA1基因:正向引物如SEQIDNO.123所示,反向引物如SEQIDNO.124所示;
ID4基因:正向引物如SEQIDNO.125所示,反向引物如SEQIDNO.126所示;
IGFBP2基因:正向引物如SEQIDNO.127所示,反向引物如SEQIDNO.128所示;
IGFBP7基因:正向引物如SEQIDNO.129所示,反向引物如SEQIDNO.130所示;
ISL1基因:正向引物如SEQIDNO.131所示,反向引物如SEQIDNO.132所示;
KRT20基因:正向引物如SEQIDNO.133所示,反向引物如SEQIDNO.134所示;
LGALS4基因:正向引物如SEQIDNO.135所示,反向引物如SEQIDNO.136所示;
MMP3基因:正向引物如SEQIDNO.137所示,反向引物如SEQIDNO.138所示;
MSMB基因:正向引物如SEQIDNO.139所示,反向引物如SEQIDNO.140所示;
NKX2-1基因:正向引物如SEQIDNO.141所示,反向引物如SEQIDNO.142所示;
NKX3-1基因:正向引物如SEQIDNO.143所示,反向引物如SEQIDNO.144所示;
NPY1R基因:正向引物如SEQIDNO.145所示,反向引物如SEQIDNO.146所示;
PCDH7基因:正向引物如SEQIDNO.147所示,反向引物如SEQIDNO.148所示;
PI15基因:正向引物如SEQIDNO.149所示,反向引物如SEQIDNO.150所示;
PIGR基因:正向引物如SEQIDNO.151所示,反向引物如SEQIDNO.152所示;
PLA2G2A基因:正向引物如SEQIDNO.153所示,反向引物如SEQIDNO.154所示;
PRRX1基因:正向引物如SEQIDNO.155所示,反向引物如SEQIDNO.156所示;
PTGDS基因:正向引物如SEQIDNO.157所示,反向引物如SEQIDNO.158所示;
PTN基因:正向引物如SEQIDNO.159所示,反向引物如SEQIDNO.160所示;
RGS4基因:正向引物如SEQIDNO.161所示,反向引物如SEQIDNO.162所示;
RPS4Y1基因:正向引物如SEQIDNO.163所示,反向引物如SEQIDNO.164所示;
S100A2基因:正向引物如SEQIDNO.165所示,反向引物如SEQIDNO.166所示;
S100P基因:正向引物如SEQIDNO.167所示,反向引物如SEQIDNO.168所示;
SCGB2A2基因:正向引物如SEQIDNO.169所示,反向引物如SEQIDNO.170所示;
SERPINB3基因:正向引物如SEQIDNO.171所示,反向引物如SEQIDNO.172所示;
SFRP1基因:正向引物如SEQIDNO.173所示,反向引物如SEQIDNO.174所示;
SFTPB基因:正向引物如SEQIDNO.175所示,反向引物如SEQIDNO.176所示;
SPINK1基因:正向引物如SEQIDNO.177所示,反向引物如SEQIDNO.178所示;
SPP1基因:正向引物如SEQIDNO.179所示,反向引物如SEQIDNO.180所示;
SST基因:正向引物如SEQIDNO.181所示,反向引物如SEQIDNO.182所示;
SULT2A1基因:正向引物如SEQIDNO.183所示,反向引物如SEQIDNO.184所示;
TH基因:正向引物如SEQIDNO.185所示,反向引物如SEQIDNO.186所示;
TM4SF4基因:正向引物如SEQIDNO.187所示,反向引物如SEQIDNO.188所示;
TSPAN8基因:正向引物如SEQIDNO.189所示,反向引物如SEQIDNO.190所示;
TYRP1基因:正向引物如SEQIDNO.191所示,反向引物如SEQIDNO.192所示。
9.如权利要求5-8任一项所述的试剂盒在制备识别肿瘤组织来源的制剂中的用途。
10.如权利要求1所述的一组用于肿瘤分子分型的基因在制备用于肿瘤分子分型的基因芯片中的应用,所述基因芯片包括固相载体和探针,其特征在于,所述探针与待测38个基因序列和/或其互补序列进行杂交,所述探针分别是SEQIDNo.193~SEQIDNo.230所示序列。
11.如权利要求2所述的一组用于肿瘤分子分型的基因在制备用于肿瘤分子分型的基因芯片中的应用,所述基因芯片包括固相载体和探针,其特征在于,所述探针与待测96个基因序列和/或其互补序列进行杂交,所述探针分别是SEQIDNo.193~SEQIDNo.288所示序列。
CN201510550924.3A 2015-09-01 2015-09-01 一组用于肿瘤分子分型的基因及其应用 Active CN105087568B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510550924.3A CN105087568B (zh) 2015-09-01 2015-09-01 一组用于肿瘤分子分型的基因及其应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510550924.3A CN105087568B (zh) 2015-09-01 2015-09-01 一组用于肿瘤分子分型的基因及其应用

Publications (2)

Publication Number Publication Date
CN105087568A true CN105087568A (zh) 2015-11-25
CN105087568B CN105087568B (zh) 2018-09-07

Family

ID=54568902

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510550924.3A Active CN105087568B (zh) 2015-09-01 2015-09-01 一组用于肿瘤分子分型的基因及其应用

Country Status (1)

Country Link
CN (1) CN105087568B (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106811531A (zh) * 2017-02-28 2017-06-09 北京泱深生物信息技术有限公司 舌鳞癌诊治标志物
CN107300613A (zh) * 2017-06-27 2017-10-27 深圳市优圣康生物科技有限公司 一种生物标记物、采样方法、建模方法及其用途
CN108101977A (zh) * 2018-01-17 2018-06-01 天津市湖滨盘古基因科学发展有限公司 一种人的acp蛋白突变蛋白及其应用
CN109182517A (zh) * 2018-09-07 2019-01-11 杭州可帮基因科技有限公司 一组用于髓母细胞瘤分子分型的基因及其应用
CN109295208A (zh) * 2018-10-26 2019-02-01 德阳市人民医院 Pi15作为骨关节炎标志物的应用
CN110379465A (zh) * 2019-07-19 2019-10-25 元码基因科技(北京)股份有限公司 基于rna靶向测序和机器学习的癌症组织溯源方法
CN110400601A (zh) * 2019-08-23 2019-11-01 元码基因科技(无锡)有限公司 基于rna靶向测序和机器学习的癌症亚型分型方法及装置
WO2020082642A1 (zh) * 2018-10-26 2020-04-30 立森印迹诊断技术有限公司 一种用于检测胰腺肿瘤良恶性程度的分级模型及其应用
CN111139300A (zh) * 2020-02-19 2020-05-12 伯克利南京医学研究有限责任公司 一组结肠癌预后相关基因的应用
CN111308074A (zh) * 2019-12-12 2020-06-19 中山大学附属第三医院 检测肝细胞癌诊断标志物及筛查或辅助诊断产品中的应用
US11401560B2 (en) 2018-08-16 2022-08-02 Hangzhou Canhelp Genomics Technology Co. Ltd. Set of genes for bladder cancer detection and use thereof
CN115144599A (zh) * 2022-09-05 2022-10-04 西湖大学 蛋白组合在制备对儿童甲状腺癌进行预后分层的试剂盒中的用途及其试剂盒、系统
CN116312814A (zh) * 2021-12-02 2023-06-23 复旦大学 一种肺腺癌分子分型模型的构建方法、设备、装置以及试剂盒

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
DIMITRI TALANTOV等: "A Quantitative Reverse Transcriptase-Polymerase Chain Reaction Assay to Identify Metastatic Carcinoma Tissue of Origin", 《JOURNAL OF MOLECULAR DIAGNOSTICS》 *
RICHARD W. TOTHILL等: "An Expression-Based Site of Origin Diagnostic Method Designed for Clinical Application to Cancer of Unknown Origin", 《CANCER RESEARCH》 *
XIAO-JUN MA等: "Molecular Classification of Human Cancers Using a 92-Gene Real-Time Quantitative Polymerase Chain Reaction Assay", 《ARCHIVES OF PATHOLOGY&LABORATORY》 *
燕翔等: "表达谱基因芯片在肿瘤分子分型中的应用", 《国外医学肿瘤学分册》 *

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106811531B (zh) * 2017-02-28 2020-03-31 青岛泱深生物医药有限公司 舌鳞癌诊治标志物
CN106811531A (zh) * 2017-02-28 2017-06-09 北京泱深生物信息技术有限公司 舌鳞癌诊治标志物
CN107300613A (zh) * 2017-06-27 2017-10-27 深圳市优圣康生物科技有限公司 一种生物标记物、采样方法、建模方法及其用途
CN108101977A (zh) * 2018-01-17 2018-06-01 天津市湖滨盘古基因科学发展有限公司 一种人的acp蛋白突变蛋白及其应用
US11401560B2 (en) 2018-08-16 2022-08-02 Hangzhou Canhelp Genomics Technology Co. Ltd. Set of genes for bladder cancer detection and use thereof
CN109182517A (zh) * 2018-09-07 2019-01-11 杭州可帮基因科技有限公司 一组用于髓母细胞瘤分子分型的基因及其应用
CN109295208A (zh) * 2018-10-26 2019-02-01 德阳市人民医院 Pi15作为骨关节炎标志物的应用
WO2020082642A1 (zh) * 2018-10-26 2020-04-30 立森印迹诊断技术有限公司 一种用于检测胰腺肿瘤良恶性程度的分级模型及其应用
CN110379465A (zh) * 2019-07-19 2019-10-25 元码基因科技(北京)股份有限公司 基于rna靶向测序和机器学习的癌症组织溯源方法
CN110400601A (zh) * 2019-08-23 2019-11-01 元码基因科技(无锡)有限公司 基于rna靶向测序和机器学习的癌症亚型分型方法及装置
CN111308074A (zh) * 2019-12-12 2020-06-19 中山大学附属第三医院 检测肝细胞癌诊断标志物及筛查或辅助诊断产品中的应用
CN111139300A (zh) * 2020-02-19 2020-05-12 伯克利南京医学研究有限责任公司 一组结肠癌预后相关基因的应用
CN111139300B (zh) * 2020-02-19 2021-08-17 伯克利南京医学研究有限责任公司 一组结肠癌预后相关基因的应用
CN116312814A (zh) * 2021-12-02 2023-06-23 复旦大学 一种肺腺癌分子分型模型的构建方法、设备、装置以及试剂盒
CN115144599A (zh) * 2022-09-05 2022-10-04 西湖大学 蛋白组合在制备对儿童甲状腺癌进行预后分层的试剂盒中的用途及其试剂盒、系统
CN115144599B (zh) * 2022-09-05 2023-01-06 西湖大学 蛋白组合在制备对儿童甲状腺癌进行预后分层的试剂盒中的用途及其试剂盒、系统

Also Published As

Publication number Publication date
CN105087568B (zh) 2018-09-07

Similar Documents

Publication Publication Date Title
CN105087568B (zh) 一组用于肿瘤分子分型的基因及其应用
CN103299188B (zh) 用于癌症的分子诊断试验
Wang et al. Serum carcinoembryonic antigen and carbohydrate antigen 19‑9 for prediction of malignancy and invasiveness in intraductal papillary mucinous neoplasms of the pancreas: A meta‑analysis
Amaro et al. Validation of proposed prostate cancer biomarkers with gene expression data: a long road to travel
JP5725274B2 (ja) 乳癌の予後の検査方法
CN105154542B (zh) 一组用于肺癌分子分型的基因及其应用
CN105874079A (zh) 用于肺癌的分子诊断测试
WO2008070301A9 (en) Predicting lung cancer survival using gene expression
WO2013052480A1 (en) Marker-based prognostic risk score in colon cancer
CN111863250B (zh) 一种早期乳腺癌的联合诊断模型及系统
CN105874080A (zh) 用于食道癌的分子诊断测试
CN109897899A (zh) 一种用于局部晚期食管鳞癌预后判断的标志物及其应用
CN106755547A (zh) 一种膀胱癌的无创检测及其复发监测方法
CN107435062B (zh) 甄别肺部微小结节良恶性的外周血基因标志物及其用途
Ke et al. Diagnostic value and lymph node metastasis prediction of a custom‑made panel (thyroline) in thyroid cancer
CN115851951A (zh) 含多组学标志物组合物的早期肝癌检测模型构建及试剂盒
Bueno et al. A diagnostic test for prostate cancer from gene expression profiling data
US7759060B2 (en) Molecular method for diagnosis of prostate cancer
CN109735619A (zh) 与非小细胞肺癌预后相关的分子标志物及其应用
US20130260384A1 (en) Method for determining cancer prognosis and prediction with cancer stem cell associated genes
CN114182021A (zh) 肾癌诊断用尿液miRNA标志物、诊断试剂及试剂盒
Alvarado et al. The potential role of gene expression in the management of primary and metastatic colorectal cancer
CN114854853A (zh) 一组神经胶质瘤分子分型及预后标志物
WO2018219342A1 (zh) 一种印记基因分级模型和诊断方法及其应用
CN108929851A (zh) 一种用于检测肿瘤良恶性程度的模型及其应用

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20151125

Assignee: Hangzhou able Gene Technology Co., Ltd.

Assignor: HANGZHOU YUANQING BIOTECHNOLOGY CO., LTD.

Contract record no.: 2016330000122

Denomination of invention: Group of genes for tumor molecular subtyping and application thereof

License type: Common License

Record date: 20160811

LICC Enforcement, change and cancellation of record of contracts on the licence for exploitation of a patent or utility model
GR01 Patent grant
GR01 Patent grant