前列腺癌生物标志物及其应用
技术领域
本发明涉及前列腺癌技术领域,尤其是涉及一种前列腺癌生物标志物及其应用。
背景技术
前列腺癌诊断过程中的癌组织病理分析为癌症分期或分型的标准治疗程序。格里森(Gleason)评分系统为国际上使用最广泛的分级标准。在Gleason评分标准下,前列腺癌的组织局部按照结构分成5种类型,其分化程度依次递减:Gleason1分(很少见):一致性规则的大腺体,背靠背密集,形成小结节;Gleason2分:较不规则的大腺体,背靠背密集,形成小结节,结节内腺体不融合;Gleason3分:浸润性生长的小腺体或腺泡,或小型筛状结构腺体;Gleason4分:融合腺体,大型筛状腺体,或呈肾透明细胞癌样;Gleason5分:实性癌巢(无腺样结构),单个癌细胞浸润,或呈粉刺样癌(癌细胞坏死)。
同一肿瘤不同区域腺癌结构的变异,按其主要和次要分化程度分别评分,以该两项评分相加的总分作为最终的Gleason分数。比如一个肿瘤的主要区域为3分,次要区域为4分,则此病人的Gleason评分为3+4=7;若肿瘤没有不同的分化区域,都是4分,则表明主次分化相同,病人的Gleason评分为4+4=8;若肿瘤有三种或三种以上的类型,则取最高级别作为次要结构。根据Gleason评分结果,前列腺癌分为:Gleason评分为6或以下为低风险;Gleason评分=7分为中风险,Gleason评分为8或以上为高风险。多项研究证明Gleason评分是很有用的预后指标,包括可预测前列腺癌的自然病程及在前列腺全切或放疗后评价复发风险。
当前大部分的Gleason评分主要依靠专业的病理学家在显微镜下观察或者是通过分析苏木素-伊红(Hematoxylinandeosin,H&E)染色图像后得出,耗时成本高,且容易受到病理学家的经验阅历影响而带来一定的主观性。因此,有必要提供一种能够准确预测前列腺癌Gleason评分风险的生物标志物。
发明内容
本发明旨在至少解决现有技术中存在的技术问题之一。为此,本发明提出一种对预测前列腺癌Gleason评分具有较高准确度的生物标志物及其应用。
本发明所采取的技术方案是:
本发明的第一方面,提供一种前列腺癌生物标志物,包括以下基因:ANO4、CDH1、CYP17A1、FAM72B、KCND3、KY、LINC01146、NPM1P25、SLC5A8、TLE3、TMPRSS2、ZNF250。
本发明实施例的有益效果是:
本方案所提供的作为生物标志物的基因的组合可以更好地预测受试者的前列腺癌Gleason评分,具有较高的准确度,可高效地应用于临床检测。
本发明的第二方面,提供上述前列腺癌生物标志物在制备前列腺癌诊断和/或预后试剂盒、前列腺癌诊断和/或预后芯片中的应用。
本发明的第三方面,提供定量上述前列腺癌生物标志物的试剂在制备前列腺癌诊断和/或预后试剂盒、前列腺癌诊断和/或预后芯片中的应用。
本发明的第四方面,提供一种试剂盒或生物芯片,包括用于定量基因的表达水平的试剂,基因包括ANO4、CDH1、CYP17A1、FAM72B、KCND3、KY、LINC01146、NPM1P25、SLC5A8、TLE3、TMPRSS2、ZNF250。
本发明的第五方面,提供一种计算机可读介质,包括计算机执行时使计算机进行包括以下操作的计算机可读代码:
a)接收来自受试者样本中的ANO4、CDH1、CYP17A1、FAM72B、KCND3、KY、LINC01146、NPM1P25、SLC5A8、TLE3、TMPRSS2、ZNF250基因的表达水平;
b)对基因的表达水平进行数学关联以获得评分;评分用于指示受试者的前列腺癌风险。
其中,前列腺癌风险包括前列腺癌的自然病程及在前列腺癌术后复发的风险。
根据本发明的一些实施例,基因的表达水平为基因的转录水平。
根据本发明的一些实施例,基因的转录水平是指诸如基因的mRNA的表达水平。
根据本发明的一些实施例,步骤a)还包括对基因的表达水平进行标准化。
根据本发明的一些实施例,还包括根据所述评分对前列腺癌的风险进行评估。
根据本发明的一些实施例,数学关联为将基因的表达水平应用到以下公式:
N=w0+w1×ANO4+w2×CDH1+w3×CYP17A1+w4×FAM72B+w5×KCND3+w6×KY+w7×LINC01146+w8×NPM1P25+w9×SLC5A8+w10×TLE3+w11×TMPRSS2+w12×ZNF250;
其中,w0至w12分别为13.666、0.1287、-0.162、0.0906、0.1441、-0.1445、-0.1819、-0.1209、-0.2558、-0.0929、-0.3203、0.1024、0.2699。
本发明的第六方面,提供一种系统,该系统包括上述的计算机可读介质。该系统还包括用于执行计算机可读介质的计算机可读代码对应操作的处理器。
根据本发明的实施例,该系统为能够对前列腺癌诊断和/或预后的系统,通过获得的评分与门槛值比较判断Gleason评分的高低风险,并提供相应的评估报告。
根据本发明的实施例,该系统为能够对前列腺癌诊断和/或预后的系统,还包括能够定量检测受试者样本中的ANO4、CDH1、CYP17A1、FAM72B、KCND3、KY、LINC01146、NPM1P25、SLC5A8、TLE3、TMPRSS2、ZNF250基因的表达水平的试剂。
附图说明
图1是本发明的一个实施例中基因转录和Gleason评分的Pearson关联系数的分布直方图。
图2是本发明的一个实施例中预测模型得到的对应AUC最大值的受试者工作特征曲线图。
图3是本发明的一个实施例中预测模型得到的对应AUC中值的受试者工作特征曲线图。
图4是本发明的一个实施例中预测模型得到的对应AUC最小值的受试者工作特征曲线图。
具体实施方式
以下将结合实施例对本发明的构思及产生的技术效果进行清楚、完整地描述,以充分地理解本发明的目的、特征和效果。显然,所描述的实施例只是本发明的一部分实施例,而不是全部实施例,基于本发明的实施例,本领域的技术人员在不付出创造性劳动的前提下所获得的其他实施例,均属于本发明保护的范围。
实施例1
模型的建立
从mRNA基因组中筛选构建预测临床病例指标模型的算法:
一、数据集准备:
1.肿瘤基因组图谱(TCGA)前列腺癌公开数据集TCGA-PRAD是全基因转录组(WTS)表达数据集,其中癌症组织为499例,正常组织为53例。全基因转录组共有60483个基因转录(transcript)。预测Gleason评分的基因发现过程中只使用499例癌症组织的相关数据;
2.剔除表达极低的基因转录(其表达非零的样本个数不超过10个)为51303;
3.数据标准化(Normalization):对每个样本,计算所有51303个基因表达量的75%分位数q75,再取q75的中值qm,每个样本的标准化表达为:原表达量-q75+qm。
二、基因筛选算法:
1.确定和Gleason评分风险相关的基因转录:利用t-检验(t-test)确定对临床病理目标变量Gleason评分风险,寻找区分此临床病理指标下的病人子群有统计意义的基因转录组。为寻找区分能力较强的基因转录,排除中风险(Gleason评分=7)的样本,只取低风险(Gleason评分<=6)和高风险(Gleason评分>=8)样本子集做单变量分析,共得到6305个有统计显著性的基因转录。加上文献中与AR、PSA相关的基因,共得到6415个基因转录。
2.利用与Gleason评分的关联系数和线性回归确定12个基因。设想能够预测Gleason评分风险的基因要么和其正相关,要么和其负相关。计算基因转录和Gleason评分的Pearson关联系数,其分布直方图如图1所示。把关联系数排序后,取关联系数最小的100个基因,构建用它们预测Gleason评分的线性回归模型,选取模型中有统计显著性的基因;同理,选关联系数最大的100个基因做同样的模型,选取模型中有统计显著性的基因。合并两组基因后重新构建预测Gleason评分的线性回归模型,得到基因共9个:ANO4、FAM72B、KCND3、KY、LINC01146、NPM1P25、RHEBL1、SLC5A8、ZNF250。最后用文献中与AR相关或与前列腺癌相关的共46个基因来构建预测Gleason评分的线性回归模型,得到10个基因:CDH1、CTNNA1、SLC2A4、KRT15、TLE3、TMPRSS2、EXTL2、UGT2B17、UBE2C、CYP17A1。合并两组基因来最后构建预测Gleason评分的线性回归模型,得到有统计显著性的基因共12个:ANO4、CDH1、CYP17A1、FAM72B、KCND3、KY、LINC01146、NPM1P25、SLC5A8、TLE3、TMPRSS2、ZNF250。
3.根据线性回归模型对其中的参数向量wn(n=0~12)进行训练:N=w0+w1×ANO4+w2×CDH1+w3×CYP17A1+w4×FAM72B+w5×KCND3+w6×KY+w7×LINC01146+w8×NPM1P25+w9×SLC5A8+w10×TLE3+w11×TMPRSS2+w12×ZNF250。随机把数据平分,一半训练模型,另一半检验模型,重复N(N=50)次。得到相应的参数向量w0至w12分别为13.666、0.1287、-0.162、0.0906、0.1441、-0.1445、-0.1819、-0.1209、-0.2558、-0.0929、-0.3203、0.1024、0.2699。
各个基因的参数如下表所示:
根据该模型得到相应的工作特征曲线图,曲线下面积(AUC)最大值、中值和最小值分别如图2至图4所示为0.96、0.92和0.84,其(5%,95%)置信区间(CI)为(0.90,0.95)。其中,对应AUC中值的受试者特征(ROC)曲线(图3)显示,在特异性为80%时,敏感度约为90%。
实施例2
一种对前列腺癌预后评估的系统,包括检测装置、计算机可读介质和用于执行计算机可读介质存储的计算机可读代码对应操作的处理器。运用该系统对受试者进行前列腺癌风险的评估的方法具体如下:
1.根据受试者选择特定样本提取mRNA;样本可以是无创样本或穿刺样本,例如,可以是前列腺癌手术切除后或穿刺的新鲜癌组织、FFPE(福尔马林固定石蜡包埋组织)、前列腺癌手术前血浆、前列腺癌手术前尿液样本提取mRNA(需要注意的是,注意血浆或尿液为外泌体mRNA)。
2.将提取到的mRNA送入检测装置(例如标准qPCR平台)进行12个基因表达的定量:ANO4、CDH1、CYP17A1、FAM72B、KCND3、KY、LINC01146、NPM1P25、SLC5A8、TLE3、TMPRSS2、ZNF250。
3.依照公式N=w0+w1×ANO4+w2×CDH1+w3×CYP17A1+w4×FAM72B+w5×KCND3+w6×KY+w7×LINC01146+w8×NPM1P25+w9×SLC5A8+w10×TLE3+w11×TMPRSS2+w12×ZNF250由计算机可读介质和相应的处理器计算预测的Gleason分数并根据门槛值T判断Gleason评分的风险类型(分数大于门槛值T的为Gleason评分高风险,反之为Gleason评分低中风险);根据样本的不同可以重新训练线性回归模型确定参数向量wn,并用检验人群数据集的ROC确定门槛值T。另外,也可以根据受试者的样本进行独立的临床验证实验。
4.发布关于受试者前列腺癌风险的评估报告。
实施例3
一种试剂盒,包括能够定量ANO4、CDH1、CYP17A1、FAM72B、KCND3、KY、LINC01146、NPM1P25、SLC5A8、TLE3、TMPRSS2、ZNF250的mRNA水平的试剂,该试剂包括逆转录酶、逆转录酶引物、特异性扩增上述基因的引物、Taq酶、荧光染料等。
实施例4
一种微流控芯片,包括储液模块,储液模块中分别装设有能够定量ANO4、CDH1、CYP17A1、FAM72B、KCND3、KY、LINC01146、NPM1P25、SLC5A8、TLE3、TMPRSS2、ZNF250的mRNA水平的试剂。
上面结合附图对本发明实施例作了详细说明,但是本发明不限于上述实施例,在所述技术领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下作出各种变化。