生物标志物在制备肺癌检测试剂中的用途和方法
优先权
本申请主张中国在先申请,申请号:2020110770183,申请日为2020年10月10日的优先权,该申请的所有内容作为本申请的一部分。
技术领域
本发明涉及医学诊断领域,具体的说是利用血清代谢组学筛选生物标志物对肺癌进行诊断,尤其是良性肺结节和肺癌的鉴别诊断。
背景技术
肺癌是全球最常见的恶性肿瘤之一,并且为死亡率最高的癌症之一。2018年我国发布的最新数据显示,我国新发肺癌病例210万,居恶性肿瘤首位,占所有肿瘤死亡病例的18.4%(排名第一),死亡人数为180万(排名第一),占恶性肿瘤死因四分之一以上。早期诊断对于提高肿瘤病人的治疗预后生存率有重要意义。目前,肺癌的确诊主要依赖于有创性的穿刺术以及支气管镜检查取得组织或细胞进行病理检查。而CT影像学检查则是主要的辅助诊断手段,而对于肺内小结节良性或者恶性病变的鉴别诊断,仍存在一定挑战。肺癌血清学检查,如癌胚抗原、角蛋白片段、鳞状上皮细胞癌抗原等可作为肺癌的辅助诊断或随访监测,但目前灵敏度和特异度仍待提高。
近年来,随着质谱技术的高速发展,代谢组学(Metabolomics)在疾病诊断中的应用研究也逐渐被广泛关注。代谢组学是对机体中相对分子量小于1,000的小分子代谢产物进行定性和定量分析的一门新学科。代谢组(Metabolome)是指某一生物或细胞在特定生理时期内所有的低分子量代谢产物,而细胞内许多生命活动是发生在代谢物层面的。因此,代谢组的检测与鉴定,可以判断机体的病理生理状态,并有可能找出与之发病机制相关的标志物。由此可见,代谢组学在临床医学领域具有广泛的应用前景。血清中的代谢物是稳定的并且可以量化的,这为临床应用提供了一种无创诊断的可能性。
目前,临床上还没有可用于诊断肺癌或者用于鉴别诊断肺部肿瘤与良性结节的代谢标志物,而对于显示肺部结节的病人是否就是肺癌患者的鉴别诊断在临床上具有重要意义。
同时,值得关注的是,男女性患者在部分肿瘤(包括肺癌)中的发病、病因、诊断、病理、分子生物学、治疗、预后方面均有其各自特点,而现有技术未按性别对肿瘤(包括肺癌)血清代谢标志物进行区分。
这就需要对传统的技术进行改进,希望能够拥有诊断或者预测肺癌的方法和试剂。
发明内容
本发明通过采集健康人、良性肺结节病人、肺癌(肺部恶性肿瘤)病人血清样本,利用液相色谱-高分辨质谱联用(LC-HRMS),对以上三类样本进行了代谢组学分析与代谢谱图(profiling)的分型,筛选出健康人、良性肺结节病人、肺癌病人之间的生物标志物,并进一步按性别区分,找到同一性别的健康人、肺癌病人及良性肺结节病人之间的生物标志物。
本发明的目的:寻找健康人与肺癌病人之间、良性肺结节病人与肺癌病人之间的代谢生物标志物,以用于肺癌的诊断,特别是用于早期鉴别诊断有结节病人是否患有肺癌。此外,考虑到性别差异的影响,本发明按性别进行了区分,寻找针对男性或女性的用于肺癌诊断的生物标志物。
本发明一方面是提供一种方法,该方法基于血清代谢组学对肺癌生物标志物进行筛选,具体步骤如下:
(1)收集肺癌、良性肺结节和健康人血清样本;
(2)提取血清代谢物;
(3)采用液相-质谱联用对提取的血清代谢物进行检测及数据预处理;
(4)利用偏最小二乘判别分析对样本分群,结合显著性分析,筛选不同分组的差异代谢物或者差异的生物标志物;
(5)根据筛选得到的差异代谢物,挖掘肺癌的生物标志物以及这些标志物的应用,例如:如何利用这些标记物来诊断或者预测肺癌患者,或者从健康人群或者结节人群中鉴别诊断出肺癌患者。
在一些方式中,所述步骤(1)的具体实现为:血清样本来自不同性别和年龄段的肺癌、良性肺结节和健康人。在这里所谓的肺癌、良性肺结节和健康人群是已经过诊断确认的,比如经过组织学或者后期症状确认肺癌患者、肺结节人群(良性)或者健康人群(无结节人群)。
在一些方式中,所述步骤(2)的具体实现为:血清代谢物的提取采用甲基叔丁基醚:甲醇:水(10:3:2.5,v/v/v)三相萃取方法,向50μL血清中依次加入甲醇、甲基叔丁基醚,冰上震荡孵化1小时后,再加入水,涡旋震荡后离心,取下层清液到低温真空干燥仪中旋干,得到的血清代谢物干提物放置-80℃冰箱中保存。
考虑到样本前处理的批次效应,本研究在每批实验样本处理的同时都随批处理一个参比血清样本(Reference serum),以用于后续数据校正。
所述步骤(3)的具体实现为:对血清代谢物干提物进行复溶,离心后取上清液制成待测样本,所有样本采用液相色谱-高分辨质谱联用(LC-HRMS)进行检测。对原始数据提取m/z离子、保留时间和峰面积,并进行数据归一化,最后搜索数据库鉴定,得到的数据矩阵进行后续分析。
进一步地,所述步骤(4)的具体实现为:对液相色谱-高分辨质谱数据矩阵进行数据过滤,剩余数据利用偏最小二乘判别分析对样本分群,肺癌、良性肺结节和健康组三组可得到明显的聚类分群。
在一些方式中,所述步骤(5)的具体实现为:筛选FDR值小于0.05同时VIP大于1的化合物作为差异代谢物,并计算倍数变化。另外,结合生物学意义,挖掘肺癌、良性肺结节和健康人的差异代谢标志物,并进行代谢通路分析。
在一些方式中,按性别根据步骤(4)和步骤(5)筛选同一性别的肺癌、良性肺结节和健康人的差异代谢标志物。
本发明的第二方面,提供生物标志物在用于诊断肺癌检测试剂中的用途,所述生物标志物选择如下的一种或者几种:1-Methylnicotinamide、2-Ketobutyric acid、2-Octenoylcarnitine、2-Pyrrolidone、2-trans,4-cis-Decadienoylcarnitine、3b,16a-Dihydroxyandrostenone sulfate、3-Chlorotyrosine、3-hydroxybutyryl carnitine、3-hydroxydecanoyl carnitine、3-hydroxydodecanoyl carnitine、3-hydroxyoctanoylcarnitine、4-oxo-Retinoic acid、7-Methylguanine、Acetophenone、Acetylcarnitine、Alanine、alpha-Eleostearic acid、Aminoadipic acid、Arabinosylhypoxanthine、Asparagine、Bilirubin、Carnitine、Choline Sulfate、cis-5-Tetradecenoylcarnitine、Citrulline、Creatinine、Cyclohexaneacetic acid、Diethylamine、Dihydrothymine、Dihydroxybenzoic acid、Docosahexaenoic acid、Ecgonine、Ergothioneine、Ethyl 3-oxohexanoate、Glutamine、Hexanoylcarnitine、Hippuric acid、Homo-L-arginine、Hydroxybutyric acid、Hypoxanthine、Inosine、Isoleucine、Kynurenine、Lactic acid、Leucine、Linoleyl carnitine、Lysine、Methylacetoacetic acid、N6,N6,N6-Trimethylysine、N-Acetyl-L-alanine、Nicotine、Octanoylcarnitine、5-Oxoproline、Phenylalanine、Pilocarpine、Propionylcarnitine、Pyruvic acid、Serotonin、Succinicacid semialdehyde、Trimethylamine N-oxide、Tyrosine、Uridine、Urocanic acid、Xanthine、4-Hydroxyphenylacetic acid、Dehydroepiandrosterone sulfate、Androsterone sulfate、Dihydrotestosterone sulfate、Epiandrosterone sulfate、Citric acid、Uric acid、Pantothenic acid、Indole-3-acetic acid、gamma-Butyrobetaine、Calcitriol、all-trans-retinal、3,4-dihydroxyphenylacetic acid、Caprylic acid、Arachidic acid、Hydrocortisone Valerate、Dopamine、Tryptophan、3-Hydroxybutyric acid、Arachidonic acid。
在一些方式中,用于诊断肺癌的生物标志物为如下的一种或几种的组合:alpha-Eleostearic acid、2-Ketobutyric acid、2-Octenoylcarnitine、2-trans,4-cis-Decadienoylcarnitine、3-Chlorotyrosine、3-hydroxydecanoyl carnitine、3-hydroxydodecanoyl carnitine、3-hydroxyoctanoyl carnitine、Acetophenone、Arabinosylhypoxanthine、Cyclohexaneacetic acid、Dihydroxybenzoic acid、Docosahexaenoic acid、Ecgonine、Ethyl 3-oxohexanoate、Hexanoylcarnitine、Hippuricacid、Homo-L-arginine、Hypoxanthine、Lactic acid、N-Acetyl-L-alanine、Octanoylcarnitine、5-Oxoproline、Pyruvic acid、Serotonin、Succinic acidsemialdehyde、Xanthine。上述生物标志物在肺癌病人与健康人群以及肺癌病人与良性肺结节人群中均存在显著性差异,说明其与肺癌的关系密切,不受是否有良性肺结节的影响,能用于鉴别诊断肺癌与良性肺结节,也能用于鉴别诊断肺癌与健康(无结节)。在一些方式中,当个体(包括有肺结节和无肺结节的)血清中上述标志物中的2-Ketobutyric acid、Hypoxanthine、Lactic acid、N-Acetyl-L-alanine、5-Oxoproline、Pyruvic acid、Xanthine、Succinic acid semialdehyde升高,说明个体患肺癌的可能性高。在一些方式中,同样,如果同时其它的生物标志物降低,则进一步表示患有肺癌的可能性大。
在一些方式中,在进行肺癌病人与健康人群,肺癌病人与良性肺结节病人,男性或女性中的肺癌病人与健康人群、肺癌病人与良性肺结节病人的差异代谢物对比过程中发现:3-hydroxydecanoyl carnitine、3-hydroxyoctanoyl carnitine、Arabinosylhypoxanthine、Cyclohexaneacetic acid、Ecgonine、Ethyl 3-oxohexanoate、Hippuric acid、Homo-L-arginine、Hypoxanthine、Octanoylcarnitine、5-Oxoproline在肺癌病人与健康人群或良性肺结节病人间均存在显著性差异(包括按性别区分时),说明这几个差异代谢物与肺癌的关系更为密切,不受是否有良性肺结节以及性别的影响,可用于鉴别诊断肺癌病人与健康人、肺癌病人与良性肺结节病人,也可用于男性或女性肺癌病人与健康人、肺癌病人与良性肺结节病人的鉴别诊断。
当个体(包括男性和女性,有结节和无结节的)血清中Hypoxanthine、5-Oxoproline升高,3-hydroxydecanoyl carnitine、3-hydroxyoctanoyl carnitine、Arabinosylhypoxanthine、Cyclohexaneacetic acid、Ecgonine、Ethyl 3-oxohexanoate、Hippuric acid、Homo-L-arginine、Octanoylcarnitine降低,说明个体患肺癌的可能性高。在一些方式中,同样,如果同时其它的生物标志物降低,则进一步表示患有肺癌的可能性大。
在一些方式中,在进行诊断无肺结节个体是否患有肺癌时,所述生物标志物选自下述表2中的一种或几种。其中,Hypoxanthine、Lactic acid、Xanthine、N-Acetyl-L-alanine、Succinic acid semialdehyde、Pyruvic acid、2-Ketobutyric acid、Methylacetoacetic acid、5-Oxoproline中的一种或者几种升高,或者其它标志物降低,表示患有肺癌的可能性大。在一些方式中,同样,如果同时其它的生物标志物降低,则进一步表示患有肺癌的可能性大。
在一些方式中,当临床已知病人肺部有肿块或者结节的时候,用于鉴别诊断是肺癌还是良性肺结节时,所述生物标志物选自表3的一种或几种。在一些方式中,如下标志物中的一种或者几种升高:Hypoxanthine、Lactic acid、Xanthine、Dihydrothymine、N-Acetyl-L-alanine、5-Oxoproline、2-Pyrrolidone、Hydroxybutyric acid、Succinic acidsemialdehyde、Pyruvic acid、2-Ketobutyric acid,或者其它标志物降低,表示为肺癌的可能性高。
在一些方式中,用于鉴别诊断肺癌与良性肺结节的生物标志物为如下的一种或几种的组合:1-Methylnicotinamide、2-Pyrrolidone、4-oxo-Retinoic acid、7-Methylguanine、Acetylcarnitine、Bilirubin、Choline Sulfate、cis-5-Tetradecenoylcarnitine、Citrulline、Creatinine、Diethylamine、Dihydrothymine、Glutamine、Hydroxybutyric acid、Inosine、Kynurenine、Linoleyl carnitine、Lysine、Trimethylamine N-oxide。这些生物标志物在肺癌病人和良性肺结节病人间存在显著性差异,在肺癌病人与健康人群间无显著性差异,说明这些生物标志物是区分肺癌病人与良性肺结节病人的优选的、特有生物标志物,不能区分肺癌和健康(无结节)的人群。这些生物标志物更有实际意义,当在进行体检或者诊断过程中,一般发现具有结节的时候,才有进一步检测是否具有癌变的可能性,这个时候,除了常规的穿刺活检之外,一个有效的初步筛选的方式就是检测血液样本中以上标志物的一种或者多种是否出现变化或者异常,例如显著变化来进行初步的筛查。
在一些方式中,用于鉴别诊断肺癌与良性肺结节的生物标志物选自如下的一种或几种的组合:1-Methylnicotinamide、2-Octenoylcarnitine、3-hydroxydecanoylcarnitine、3-hydroxyoctanoyl carnitine、4-oxo-Retinoic acid、7-Methylguanine、Arabinosylhypoxanthine、Cyclohexaneacetic acid、Ecgonine、Ethyl 3-oxohexanoate、Hippuric acid、Homo-L-arginine、Hypoxanthine、Inosine、Lactic acid、Octanoylcarnitine、5-Oxoproline、Trimethylamine N-oxide。这些生物标志物在肺癌病人和良性肺结节病人间(包括男性和女性)存在显著性差异,且在男性或女性中的肺癌病人和良性肺结节病人间均存在显著性差异,说明这些生物标志物不受性别影响,能有效区分肺癌与良性肺结节。
在一些方式中,当用于判定无肺结节男性是否患有肺癌时,所述生物标志物选自表4中的一种或几种。其中,Hypoxanthine、N-Acetyl-L-alanine、Pyruvic acid、5-Oxoproline中的一种或者几种升高,或者其他生物标志物中的一种或者几种降低,表示该男性患肺癌的可能性高。
在一些方式中,当临床已知男性病人肺部有肿块或者结节的时候,用于判定是肺癌还是肺良性结节时,所述生物标志物选自表5中一种或几种。其中,Hypoxanthine、N-Acetyl-L-alanine、Pyruvic acid、5-Oxoproline、Lactic acid、Dihydrothymine、Aminoadipic acid、N6,N6,N6-Trimethylysine中的一种或者几种升高,或者其它标志物中的一种或者几种降低,表示该男性患肺癌的可能性大。
在一些方式中,用于判定男性肺癌与良性肺结节的生物标志物为如下一种或几种的组合:1-Methylnicotinamide、2-trans,4-cis-Decadienoylcarnitine、3-hydroxydecanoyl carnitine、3-hydroxydodecanoyl carnitine、3-hydroxyoctanoylcarnitine、4-oxo-Retinoic acid、7-Methylguanine、Acetylcarnitine、alpha-Eleostearic acid、Arabinosylhypoxanthine、Cyclohexaneacetic acid、Diethylamine、Docosahexaenoic acid、Ecgonine、Ethyl 3-oxohexanoate、Glutamine、Hippuric acid、Homo-L-arginine、Hypoxanthine、Inosine、Linoleyl carnitine、N-Acetyl-L-alanine、Octanoylcarnitine、5-Oxoproline、Pyruvic acid、Trimethylamine N-oxide。这些生物标志物在男性肺癌病人与良性肺结节病人间、男性肺癌病人与健康人群间均存在显著性差异,说明这些生物标志物与男性肺癌的关系密切,不受是否有良性肺结节的影响,即可用于区分男性中的肺癌与良性肺结节病人,也可用于区分男性中的肺癌与健康(无结节)。
在一些方式中,用于判定男性肺癌与良性肺结节的生物标志物为如下一种或几种的组合:2-Octenoylcarnitine、3-hydroxybutyryl carnitine、Aminoadipic acid、Bilirubin、Dihydrothymine、Ergothioneine、Lactic acid、N6,N6,N6-Trimethylysine、Nicotine。这些生物标志物在男性肺癌病人和良性肺结节病人间存在显著性差异,在男性肺癌病人与健康人群间无显著性差异,说明这些生物标志物是能用于区分男性中区肺癌与良性肺结节病人,不能用于区分男性中肺癌与健康(无结节)。
在一些方式中,用于判定男性肺癌与良性肺结节的生物标志物为如下一种或几种的组合:alpha-Eleostearic acid、2-trans,4-cis-Decadienoylcarnitine、3-hydroxydodecanoyl carnitine、Acetylcarnitine、Bilirubin、Diethylamine、Dihydrothymine、Docosahexaenoic acid、Glutamine、Linoleyl carnitine、N-Acetyl-L-alanine、Pyruvic acid、3-hydroxybutyryl carnitine、Aminoadipic acid、Ergothioneine、N6,N6,N6-Trimethylysine、Nicotine。这些生物标志物在男性肺癌与良性肺结节病人间存在显著性差异,而在女性肺癌与良性肺结节病人间无显著性差异,说明这些生物标志物与性别有关,能用于男性中的肺癌与良性肺结节的区分,不能用于女性。
在一些方式中,用于判定男性肺癌与良性肺结节的生物标志物为如下一种或几种的组合:3-hydroxybutyryl carnitine、Aminoadipic acid、Ergothioneine、Nicotine。这些生物标志物仅在男性肺癌与良性肺结节病人间存在显著性差异,在肺癌与健康人(包括男性和女性)、肺癌与肺结节(包括男性和女性)、男性肺癌与健康人、女性肺癌与健康人、女性肺癌与肺结节间均无显著性差异,说明这些化合物是男性肺癌与良性肺结节的特有生物标志物,只能用于男性中肺癌与肺结节的区分,不能用于女性中肺癌与肺结节的区分或肺癌与健康(无结节)的区分。
在一些方式中,当用于判定有肺结节女性是否患有肺癌时,所述生物标志物选自表6中一种或几种。其中,Alanine、Linoleyl carnitine、Pyruvic acid、Methylacetoacetic acid、Hypoxanthine、Lactic acid、Xanthine、2-Pyrrolidone、Succinic acid semialdehyde、2-Ketobutyric acid、5-Oxoproline中的一种或者几种升高,或者其他标志物中的一种或者几种降低,表示该女性患有肺癌的可能性高。
在一些方式中,用于判定女性肺癌与良性肺结节的生物标志物为如下一种或几种的组合:1-Methylnicotinamide、2-Ketobutyric acid、2-Pyrrolidone、3-Chlorotyrosine、3-hydroxydecanoyl carnitine、3-hydroxyoctanoyl carnitine、4-oxo-Retinoic acid、7-Methylguanine、Acetophenone、Arabinosylhypoxanthine、CholineSulfate、Citrulline、Creatinine、Cyclohexaneacetic acid、Ecgonine、Ethyl 3-oxohexanoate、Hexanoylcarnitine、Hippuric acid、Homo-L-arginine、Hypoxanthine、Inosine、Lactic acid、Lysine、Octanoylcarnitine、5-Oxoproline、Serotonin、Succinicacid semialdehyde、Trimethylamine N-oxide、Xanthine。这些生物标志物在女性肺癌病人与良性肺结节病人间、女性肺癌病人与健康人群间均存在显著性差异,说明这些生物标记物与女性肺癌的关系密切,不受是否有良性肺结节的影响,即可用于区分女性中的肺癌与良性肺结节病人,也可用于区分女性中的肺癌与健康(无结节)。
在一些方式中,用于判定女性肺癌与良性肺结节的生物标志物为如下一种或几种的组合:2-Octenoylcarnitine、cis-5-Tetradecenoylcarnitine、Kynurenine、Phenylalanine。这些生物标志物在女性肺癌病人和良性肺结节病人间存在显著性差异,在女性肺癌病人与健康人群间无显著性差异,说明这些生物标记物能区分女性肺癌与良性肺结节,不能区分女性肺癌与健康(无结节)。
在一些方式中,用于判定女性肺癌与良性肺结节的生物标志物为如下一种或几种的组合:2-Ketobutyric acid、2-Pyrrolidone、3-Chlorotyrosine、Acetophenone、CholineSulfate、cis-5-Tetradecenoylcarnitine、Citrulline、Creatinine、Hexanoylcarnitine、Kynurenine、Lysine、Serotonin、Succinic acid semialdehyde、Xanthine、Phenylalanine。这些生物标志物在女性肺癌与良性肺结节病人间存在显著性差异,而在男性肺癌与良性肺结节病人间无显著性差异,说明这些生物标志与性别有关,能用于女性中的肺癌与良性肺结节的区分,不能用于男性。
在一些方式中,用于判定女性肺癌与良性肺结节的生物标志物为Phenylalanine。该生物标志物仅在女性肺癌与良性肺结节病人间存在显著性差异,在肺癌与健康人(包括男性和女性)、肺癌与肺结节(包括男性和女性)、女性肺癌与健康人、男性肺癌与健康人、男性肺癌与肺结节间均无显著性差异,说明该化合物是女性肺癌与良性肺结节的特有生物标志物,只能用于女性中肺癌与肺结节的区分,不能用于男性中肺癌与良性肺结节的区分或肺癌与健康(无结节)的区分。
本发明的第三方面,建立了多种差异代谢物联合鉴别肺癌与良性肺结节(包括男性和女性)的模型。该模型参数为最优模型参数,ROC分析得到模型的AUC为0.955,敏感性和特异性为0.913和0.876,说明该模型诊断准确性高。
在一些方式中,这些模型可以被提前输入电脑系统,当获得生物标志物的时候,通过电脑系统自动计算,从而获得诊断结果,所以,本发明可以提供肺癌的诊断系统,该系统包括运算模块,其中运算或者计算模块包括以下模型方程。在一些方式中,还包括输出模块,用于输出计算结果的输出。在一些方式中,还包括输入模块,输入模块用来输入前述生物标志物的一种或者多种检测结果,这种检测结果可以是定量检测结果或者定性结果。这里的模型建立并不是本发明列举的有限模型,只要应用本发明的范围内的生物标志物来建立模型进行肺癌诊断的,都是本发明所保护的范围。在一些方式中,还包括阴性对照或者参考数据模块。
在一些方式中,所述的模型方程可以为:Logit(P)=ln[P/((1-P)]=5.553×V04+2.92×V05+2.713×V06–0.332×V07–1.798×V10–7.922×V13–0.593×V14+0.643×V17–2.187×V19–0.992×V20–2.352×V33–1.441×V38+7.214×V39–1.22×V40–1.235×V42+1.61,其中,V04、V05、V06、V07、V10、V13、V14、V17、V19、V20、V33、V38、V39、V40、V42分别为所述5-Oxoproline、N-Acetyl-L-alanine、Hypoxanthine、Cyclohexaneacetic acid、Ethyl3-oxohexanoate、Arabinosylhypoxanthine、Docosahexaenoic acid、Hydroxybutyricacid、Serotonin、Ecgonine、Lysine、Kynurenine、Inosine、4-oxo-Retinoic acid、Linoleylcarnitine。在一些方式中,P的临界值为0.424,当P>0.424时,诊断为肺癌或者患有肺癌的可能性很高。
在一些方式中,建立了多种差异代谢物联合鉴别男性良性肺结节与肺癌模型,ROC分析得到模型的AUC为0.968,敏感性和特异性为0.870和0.988,说明该模型诊断准确性高,其模型方程为:Logit(P)=ln[P/((1-P)]=6.283×MV02–0.646×MV10-2.758×MV13+1.864×MV15–1.126×MV19–1.145×MV27–3.918×MV30+1.494,其中,MV02、MV10、MV13、MV15、MV19、MV27、MV30分别为所述5-Oxoproline、Nicotine、Ecgonine、N6,N6,N6-Trimethylysine、Arabinosylhypoxanthine、Docosahexaenoic acid、Linoleylcarnitine。在一些方式中,P的临界值为0.701,当P>0.701时,诊断为肺癌或者患有肺癌的可能性很高。
此外,建立了多种差异代谢物联合鉴别女性良性肺结节与肺癌模型,该模型参数为最优模型参数,ROC分析得到模型的AUC为0.969,敏感性和特异性为0.870和0.953,说明该模型诊断准确性高,其模型方程为:Logit(P)=ln[P/((1-P)]=10.742×FV05-1.031×FV08-7.442×FV09+11.839×FV13-2.617×FV15-3.030×FV20-1.413×FV23-2.278×FV29-6.905,其中,FV05、FV08、FV09、FV13、FV15、FV20、FV23、FV29分别为所述5-Oxoproline、Cyclohexaneacetic acid、Lysine、Phenylalanine、Serotonin、Kynurenine、Arabinosylhypoxanthine、3-hydroxydecanoyl carnitine。在一些方式中,P的临界值为0.629,当P>0.629时,诊断为肺癌或者患有肺癌的可能性很高。
在一些方式中,对每个代谢化合物建立ROC曲线,可以发现那些曲线下面积大的化化合物,从而挑选出来一批化合物来建立诊断模型,或者更为可靠的诊断结果。一般可以理解,选择的生物标志物越多,建立的模型的可靠性可能越高,例如准确性越高和特异性越强,灵敏度越高。但是也可以选择单一的或者几种重要的化合物来进行诊断,或者进行初步的筛查检测。这种检测方法可以是多种的,例如利用本发明的液相质谱联合检测,可以采用高通量的方式,一次性的检测本发明的一种或者多种生物标志物,当然并不排除检测少量的几种生物标志物。当然,也可以采用免疫的方法来检测重要的少量的几种化合物,例如1种、2种、3种、4种或者5种生物标志物的联合检测,也能说明一定的问题。
所以,在一些方案中,用于判定有肺结节病人(包括男性和女性)是否患有肺癌的生物标志物为5-Oxoproline、Arabinosylhypoxanthine、Inosine中的一种或两种组合或三种组合。通过单一差异代谢物鉴别良性肺结节与肺癌的模型建立,建立每个差异代谢物的ROC曲线发现,5-Oxoproline、Arabinosylhypoxanthine、Inosine的AUC(曲线下面积)分别为0.736、0.784、0.747,大于其他差异代谢物,说明这三个差异代谢物鉴别诊断价值更高。
此外,通过多种差异代谢物联合鉴别良性肺结节与肺癌模型的建立时,发现5-Oxoproline、Arabinosylhypoxanthine、Inosine在模型中的模型系数的绝对值最大,且5-Oxoproline和Inosine的OR(比值比)远大于其他差异代谢物,Arabinosylhypoxanthine的OR远小于其他差异代谢物,说明5-Oxoproline、Arabinosylhypoxanthine、Inosine在模型中的占比更高,其鉴别诊断肺癌与良性肺结节的价值也更高,且该发现与单一差异代谢物鉴别肺部良性结节以及恶性肿瘤的模型建立的结果一致。
在一些方案中,用于判定男性有肺结节病人是否患有肺癌的生物标志物为Linoleyl carnitine。同理,在单一差异代谢物鉴别男性肺部良性结节以及恶性肿瘤的模型建立时发现Linoleyl carnitine的AUC值为0.867,远大于其他差异代谢物,且在多种差异代谢物联合鉴别男性良性肺结节及肺癌模型的建立时发现Linoleyl carnitine模型系数的绝对值较大,OR远小于其他差异代谢物,说明Linoleyl carnitine诊断价值更高。
在一些方案中,用于判定女性有肺结节病人是否患有肺癌的生物标志物为5-Oxoproline和Phenylalanine中的一种或二者的组合。同理,在单一差异代谢物鉴别女性肺部良性结节以及恶性肿瘤的模型建立时,发现5-Oxoprolin和Phenylalanine的AUC值为0.823和0.702,数值较大,且在多种差异代谢物联合鉴别男性良性肺结节及肺癌模型的建立时发现5-Oxoproline和Phenylalanine模型系数和OR值远大于其他差异代谢物,说明5-Oxoproline和Phenylalanine诊断价值更高。
本发明的优势在于:本发明利用血清代谢组学的方法筛选出小分子差异代谢物,作为生物标志物,用于肺癌的鉴别诊断,可用于区分肺癌和健康人群、肺癌和良性肺结节病人,并进一步根据性别选用适用于不同性别的用于肺癌诊断的生物标志物。此外,本发明还提供了用于准确地鉴别诊断肺癌与良性肺结节的模型。
诊断方法
本发明的第四方面,提供一种诊断肺癌的方法,该方法包括检测血液样本中前述生物标志物是否存在或者存在的数量,从而判断是否患有肺癌或者患有肺癌的可能性。
在一些方法中,存在的数量与阴性血液样本比较而获得的结果。在一些方式中,所述的血液样本为血清样本。
在一些方式中,诊断肺癌的方法包括从健康人群中筛选出肺癌的患者;或者,从肺部结节的人群中筛选肺癌患者;或者从男性健康无肺部结节中筛选肺癌患者,或者从男性肺部结节中筛查肺癌患者;或者从女性健康无肺部结节中筛选肺癌患者,或者从女性肺部结节中筛查肺癌患者的方法。这些不同的方法所针对的生物标志物都可以从本发明的前述标记物种进行筛选出一种或者多种。
这种具体的诊断或者检测方法都可以采用现有常规的方法,例如液相检测方法、质谱方法、气相或者液相与质谱联合的方法、或者免疫方法。其中免疫方法包括酶联免疫、干化学方法、干式的测试条方法、或者电化学方法。
诊断设备或者试剂盒
在本发明的另一方面,提供一种检测肺癌的试剂盒,该试剂盒中包括可以检测前述生物标志物质中的一种或者多种试剂,这种试剂可以是血液处理试剂,例如过滤、提取前述生物标志物质的试剂,也包括直接用来检测生物标志物是否存在或者存在数量的试剂,例如抗体、抗原或者标记物质。
代谢通路
以上的代谢物涉及的代谢通路途径有糖酵解、脂肪酸、肉碱、氨基酸、嘌呤、尼古丁、血红素、性激素、维生素与三羧酸循环。
所以,另一方面,本发明提供生物标志物在制备肺癌诊断试剂上用途,所述的这些生物标志物来源于以下代谢通路中的一种或者几种,所述的代谢通路包括:糖酵解、脂肪酸、肉碱、氨基酸、嘌呤、尼古丁、血红素、性激素、维生素与三羧酸循环。通过本发明显示,参与以上代谢通路的物质的变化与肺癌的发生具有密切相关的联系,而且这种关联程度呈现显著性差异。代谢通路物质的变化可能是相对正常升高,也可能是相对正常降低。这里的正常是指健康无结节人群或者结节良性的人员来讲。虽然本发明的发现的一些具体化合物的变化与肺癌的发生呈现关联性,但是并不表示这些代谢通路的异常而产生的其它具体化合物质不与肺癌发生具有关联性。换句话说,当需要进行肺癌诊断的时候或者预防的时候,首先是可以从代谢通路上入手,然后寻找具体化合物或者参与代理通路的物质上入手来寻找新的化合物,从而可以用来诊断肺癌是否发生或者防止治疗。
在一些方式中,上述的一种或几种生物标志物的组合进行肺癌的诊断,使用两种或者两种以上的组合时,诊断效果会优于单一血清标志物。
附图说明
图1是分析流程图
图2是总离子流图和质谱图
图3是肺癌、良性肺结节和健康人群三组的PLS-DA统计结果图(-ESI:负谱;+ESI:正谱)
图4是肺癌与健康人群PLS-DA统计结果图(-ESI:负谱;+ESI:正谱)
图5是肺癌与良性肺结节PLS-DA统计结果图(-ESI:负谱;+ESI:正谱)
图6是男女性在肺癌与良性肺结节中共有的差异代谢物以及各自特有的差异代谢物
图7是模型A的ROC曲线
图8是模型B的ROC曲线
图9是模型C的ROC曲线
图10是模型D的ROC曲线
图11是模型A对肺癌以及良性肺结节的预测结果
详细说明
(1)诊断或者检测
这里的诊断或者检测是指对于样本中的生物标志物进行检测或者化验,或者检测目标生物标志物的含量,例如绝对含量或者相对含量,然后通过目标标志物质是否存在或者数量的多少来说明提供样本的个体是否可能具有患某种疾病,或者具有某种疾病的可能性。
这里的诊断与检测的含义可以互换。这种检测的结果或者诊断的结果是不能直接作为患病的直接结果,而是一种中间结果,如果获得直接的结果,还需通过病理学或者解剖学等其它辅助手段才能确认患有某种疾病。例如,本发明提供了多种与肺癌具有关联性的新的生物标志物,这些标志物的含量变化与是否患有肺癌具有直接的关联性。
(2)标志物与肺癌的联系
这里的联系是指某种生物标志物在样本中出现或者含量的变化与特定疾病具有直接的关联性,例如含量的相对升高或者降低,表示这种患有这种疾病的可能性相对健康人员更高。
如果样本中多个不同的标志物同时出现或者含量的发生相对变化,表示这种患有这种疾病的可能性相对健康人员也更高。也就是说标志物种类中,某一些标志物与患病的关联性强,有些标志物与患病的关联性弱,或者有些甚至与某种特定的疾病无关联。对于那些关联性强的标志物中的一种或者多种,可以作为诊断疾病的生物标志物,与那些关联性弱的标志物可以与强的标志物组合来诊断某种疾病,增加检测结果的准确性。
针对本发明发现的血清中的众多生物标志物,这些标志物都可以用来进行区分健康人员或者肺结节人群中的肺癌患者人群。这里的标志物可以单独作为单个的标志物来进行直接的检测或者诊断,选择这样的标志物表示该标志物含量的相对变化与肺癌具有强的关联性。当然,可以理解的是,可以选择与肺癌关联性强的一种或者多种标志物的同时检测。正常的理解是,在一些方式中,选择关联性强的生物标志物来进行检测或者诊断可以达到一定标准的准确定,例如60%,65%,70%,80%,85%,90%或者95%的准确性,则可以说明,这些标志物可以获得诊断某种疾病的中间值,但并不表示就能直接确认患有某种疾病。例如,本发明中,表2-9中的生物标志物,可以选择VIP值越大的标志物作为诊断是否是肺癌的标志物,或者作为从健康或者肺结节人群中筛选肺癌人群的标志物,这里的人群包括无性别差异的人员,也包括具有性别差异的人群。
当然,也可以选择ROC值越大的来作为诊断的标志物。所谓的强、弱一般通过一些算法来计算确认,例如标志物与肺癌的贡献率或者权重分析。这样的计算方法可以是显著性分析(p值或FDR值)和倍数变化(Fold change),多元统计分析主要包括主成分分析(PCA)、偏最小二乘判别分析(PLS-DA)和正交偏最小二乘判别分析(OPLS-DA),当然还包括其他的方法,例如ROC分析等等。当然,其它的模型预测方法也是可以的,在具体选择生物标志物的时候,可以选择本发明所公开的标志物质,也可以选择或者结合其它现有公知的标志物质。
具体实施方式
为了更为具体地描述本发明,下面结合附图及具体实施方式对本发明的技术方案进行详细说明。这些说明仅仅是表明本发明是如何实现的,并不能限定本发明的具体范围。本发明的范围在权利要求中限定。
实施例1:收集血清样本
收集了不同性别和年龄段的病人及健康人血清样本。本研究收集了年龄在38-78岁之间的男性和女性样本,包括肺癌(138例)、良性肺结节(170例)和健康人(174例)三组血清样本,按照性别与年龄段匹配。
实施例2:提取血清代谢物
血清代谢物的提取采用甲基叔丁基醚:甲醇:水(10:3:2.5,v/v/v)三相萃取方法,具体操作如下:(1)将血清样本置于冰上完全融解后,取50uL到1.5mL EP管中,加入225μL冷冻甲醇,涡旋30秒;(2)再加入750μL冷冻MTBE,涡旋30秒后,400rpm冰上震荡1小时;(3)再加入188μL纯水,涡旋1分钟;(4)4℃下以15000rcf离心10分钟;(5)离心后,取125μL下层清液到EP管中,用真空冷冻干燥仪旋干,所有血清代谢物干样在测试前放置-80℃冰箱存储。
考虑到样本前处理可能存在批次误差,本研究在每批实验样本处理的同时都随批处理一个参比血清样本(Reference serum),以用于后续数据校正。参比血清样本是选取了100例健康人(健康人指血压血糖血常规均正常且无乙肝病毒,体检结果无提示明显疾病,目前无需就诊治疗的人群)血清混合而成,这100例健康人血清的男性与女性数量相等,年龄40-55岁,受检者需禁食一夜并在采血前72小时禁止服用药物,排除有过往疾病史及体重指数(BMI)在第95百分位之外的个体。混合后的血清以每份50μL分装,置于-80℃冰箱保存。
实施例3:对提取的血清代谢物进行检测及数据预处理
(1)血清代谢物的复溶:向血清干提物中加入120μL复溶溶剂(乙腈:水=4:1),涡旋震荡5分钟后,4℃下以15000×g离心10分钟,取100μL上清液于内衬管制成待测样本。(2)QC样本:所有肺癌、良性肺结节和健康人血清待测样本各取10μL,涡旋震荡混合均匀后,制成QC样本。
(3)样本检测方法:用液相色谱-高分辨质谱联用(LC-HRMS)进行检测。
①液相色谱条件
色谱柱:BEH Amide(100×2.1mm,1.7μm)。
流动相:正模式下,A相为乙腈:水=95:5(10mM醋酸铵,0.1%甲酸),B相为乙腈:水=50:50(10mM醋酸铵,0.1%甲酸);负模式下,A相为乙腈:水=95:5(10mM醋酸铵,pH=9.0,氨水调节),B相为乙腈:水=50:50(10mM醋酸铵,pH=9.0,氨水调节)。
洗脱梯度如下表1所示:
表1:LC-HRMS流动相洗脱梯度
时间(min) |
流速(mL/min) |
A相 |
B相 |
0.0 |
0.30 |
98 |
2 |
0.50 |
0.30 |
98 |
2 |
12.0 |
0.30 |
50 |
50 |
14.0 |
0.30 |
2 |
98 |
16.0 |
0.30 |
2 |
98 |
16.1 |
0.30 |
98 |
2 |
20.0 |
0.30 |
98 |
2 |
②质谱条件
质谱仪器型号为Q Exactive(美国Thermo Fisher Scientific公司),采用电喷雾离子源(ESI)、正负全扫描模式(Fullscan)和数据依赖性扫描模式(ddMS2)进行定性分析。喷雾电压+3800/-3200V;雾化温度350℃;高纯氮气作为鞘气和辅气,参数分别设置为40arb和10arb;离子传输管温度320℃;质量扫描范围70-1050m/z;一级扫描分辨率为70000FWHM,二级扫描分辨率为35000FWHM。
③进样方法
每次检测前先进6针QC样本以稳定检测系统,血清样本检测采取随机进样的方式,每进样10针血清样本插入1针QC样本测试,检测序列的第一针和最后一针均为QC样本。最后对QC样本进行ddMS2全扫描和分段扫描以用于化合物鉴定。
(4)数据预处理
①原始数据矩阵
每个样本的原始数据都包括总离子流数据和质谱数据(如图2所示),将所有样本原始数据导入Compound Discovery软件得到m/z离子和保留时间信息,并搜索数据库(mzCloud和Chemspider)得到化合物鉴定结果;进一步地根据m/z离子和保留时间信息,使用Tracefinder软件对各个样本进行色谱积分,得到更准确的峰面积信息。最终每个样本都得到一个包含特征离子(m/z离子和保留时间的组合)及其含量(峰面积)的二维数据矩阵。
②数据缺失值的剔除和插补
代谢组学原始数据矩阵中经常有数据缺失值,这主要与检测背景噪音、质谱峰提取和峰对齐方法等有关,太多的零或缺失值会给下游分析带来困难,因此一般将所有样本中缺失值大于50%的特征离子剔除,其余化合物的缺失值进行插补,本研究使用MetaboAnalyst5.0分析软件进行缺失值处理,选择K-Nearest Neighbours(KNN)的方式插补。
③数据校正和过滤
大量样本前处理难免受到实验处理通量的限制,需分批进行样品前处理,而代谢物的种类繁杂、理化性质差异大,其同位素内标价格昂贵,很难选择合适且能满足全覆盖的同位素内标,本研究针对此问题,选择了利用随批处理的一个参比血清作为一个天然的“类内标”,以校正前处理带来的批次误差,即将各前处理批次的实验样本原始数据基于对应批次的参比血清的数据进行归一化,得到各特征离子的相对丰度,并删除在QC样本中RSD>30%的特征离子,得到的最终的分析数据矩阵。
实施例4:利用偏最小二乘判别分析对样本分群,结合显著性分析,筛选不同分组的差异代谢物
代谢组学一般采用单变量分析和多元统计分析结合的方式进行差异代谢物的筛选,其中单变量分析主要包括特征离子在不同分组中的显著性分析(p值或FDR值)和倍数变化(Fold change),多元统计分析主要包括主成分分析(PCA)、偏最小二乘判别分析(PLS-DA)和正交偏最小二乘判别分析(OPLS-DA)等。
在进行统计分析之前,需对数据进行适当的数据归一化、转换和缩放。本研究使用MetaboAnalyst 5.0分析软件进行统计分析,并进行数据归一化(Normalization by thesum)、转换(Log transformation)和缩放(Auto scaling)。肺癌、良性肺结节和健康人群三组进行偏最小二乘判别分析(PLS-DA)(如图3所示),得到明显的分群结果。
进一步地对肺癌和健康、肺癌和良性肺结节进行两两组间PLS-DA分析(如图4、图5所示),计算变量投影重要度(Variable Importance for the Projection,VIP)以衡量各代谢物的表达模式对各组样本分类判别的影响强度和解释能力,进一步进行Wilcoxon秩和检验得到校正后的p值(FDR),并根据组内平均值计算两组间的倍数变化(Fold change,FC)。
根据差异代谢物的筛选标准:(1)VIP>1;(2)FDR<0.05,即VIP>1且FDR<0.05时,判定代谢物在两组间存在显著差异,该代谢物为两组间的差异代谢物。另外,在筛选差异代谢物的过程中发现:不同性别的差异代谢物不同,故进一步按性别进行了区分。
本发明发现主要显著的差异代谢物有:
1.肺癌与健康人的组间差异代谢物如下表2所示。
表2肺癌与健康样本(无结节)的差异代谢物
备注:表中FC为肺癌与健康样本的倍数比;N/A表示未找到相关代谢通路。
2.肺癌与良性肺结节的组间差异代谢物如下表3所示。
表3肺癌(肺恶性肿物)与良性肺结节样本的差异代谢物
备注:表中FC为肺癌与良性肺结节的倍数比;N/A表示未找到相关代谢通路
3.男性中肺癌与健康人的组间差异代谢物如下表4所示。
表4男性中肺癌与健康样本(无结节)的差异代谢物
备注:表中FC为男性中肺癌与健康样本的倍数比;N/A表示未找到相关代谢通路
4.男性中肺癌与良性肺结节的组间差异代谢物如下表5所示。
表5男性中肺癌与良性肺结节样本的差异代谢物
备注:表中FC为男性中肺癌与良性肺结节的倍数比;N/A表示未找到相关代谢通路。
5.女性中肺癌与健康人间差异代谢物如下表6所示。
表6女性肺癌与健康样本(没有结节)的差异代谢物
备注:表中FC为女性中肺癌与健康样本的倍数比;N/A表示未找到相关代谢通路
6.女性中肺癌与良性肺结节的组间差异代谢物如下表7所示。
表7女性中肺癌与良性肺结节样本的差异代谢物
备注:表中FC为男性中肺癌与良性肺结节的倍数比;N/A表示未找到相关代谢通路。
对比表2和表3可知:
(1)如下代谢物在肺癌与良性肺结节患者间和在肺癌与健康人间均存在显著差异:alpha-Eleostearic acid、2-Ketobutyric acid、2-Octenoylcarnitine、2-trans,4-cis-Decadienoylcarnitine、3-Chlorotyrosine、3-hydroxydecanoyl carnitine、3-hydroxydodecanoyl carnitine、3-hydroxyoctanoyl carnitine、Acetophenone、Arabinosylhypoxanthine、Cyclohexaneacetic acid、Dihydroxybenzoic acid、Docosahexaenoic acid、Ecgonine、Ethyl 3-oxohexanoate、Hexanoylcarnitine、Hippuricacid、Homo-L-arginine、Hypoxanthine、Lactic acid、N-Acetyl-L-alanine、Octanoylcarnitine、5-Oxoproline、Pyruvic acid、Serotonin、Succinic acidsemialdehyde、Xanthine;
(2)如下代谢物在肺癌与良性肺结节患者间存在显著差异,在肺癌与健康人间无显著差异:1-Methylnicotinamide、2-Pyrrolidone、4-oxo-Retinoic acid、7-Methylguanine、Acetylcarnitine、Bilirubin、Choline Sulfate、cis-5-Tetradecenoylcarnitine、Citrulline、Creatinine、Diethylamine、Dihydrothymine、Glutamine、Hydroxybutyric acid、Inosine、Kynurenine、Linoleyl carnitine、Lysine、Trimethylamine N-oxide。
对比表4和表5可知:
(1)如下代谢物在男性肺癌与良性肺结节患者间和在男性肺癌与健康人间均存在显著差异:1-Methylnicotinamide、2-trans,4-cis-Decadienoylcarnitine、3-hydroxydecanoyl carnitine、3-hydroxydodecanoyl carnitine、3-hydroxyoctanoylcarnitine、4-oxo-Retinoic acid、7-Methylguanine、Acetylcarnitine、alpha-Eleostearic acid、Arabinosylhypoxanthine、Cyclohexaneacetic acid、Diethylamine、Docosahexaenoic acid、Ecgonine、Ethyl 3-oxohexanoate、Glutamine、Hippuric acid、Homo-L-arginine、Hypoxanthine、Inosine、Linoleyl carnitine、N-Acetyl-L-alanine、Octanoylcarnitine、5-Oxoproline、Pyruvic acid、Trimethylamine N-oxide;(2)如下代谢物在男性肺癌与良性肺结节患者间存在显著差异,在男性肺癌与健康人间无显著差异:2-Octenoylcarnitine、3-hydroxybutyryl carnitine、Aminoadipic acid、Bilirubin、Dihydrothymine、Ergothioneine、Lactic acid、N6,N6,N6-Trimethylysine、Nicotine。
对比表6和表7可知:
(1)如下代谢物在女性肺癌与良性肺结节患者间和在女性肺癌与健康人间均存在显著差异:1-Methylnicotinamide、2-Ketobutyric acid、2-Pyrrolidone、3-Chlorotyrosine、3-hydroxydecanoyl carnitine、3-hydroxyoctanoyl carnitine、4-oxo-Retinoic acid、7-Methylguanine、Acetophenone、Arabinosylhypoxanthine、CholineSulfate、Citrulline、Creatinine、Cyclohexaneacetic acid、Ecgonine、Ethyl 3-oxohexanoate、Hexanoylcarnitine、Hippuric acid、Homo-L-arginine、Hypoxanthine、Inosine、Lactic acid、Lysine、Octanoylcarnitine、5-Oxoproline、Serotonin、Succinicacid semialdehyde、Trimethylamine N-oxide、Xanthine;(2)如下代谢物在女性肺癌与良性肺结节患者间存在显著性差异,在女性肺癌与健康人间无显著差异:2-Octenoylcarnitine、cis-5-Tetradecenoylcarnitine、Kynurenine、Phenylalanine。
对比表3、表5和表7可知:
男性和女性在肺癌和良性肺结节病人中的差异代谢物有相同部分,也有不同部分,男女性在肺癌与良性肺结节中共有的差异代谢物以及各自特有的差异代谢物如图6所示,其中:
(1)男性和女性在肺癌与良性肺结节病人中共有的差异代谢物包括:1-Methylnicotinamide、2-Octenoylcarnitine、3-hydroxydecanoyl carnitine、3-hydroxyoctanoyl carnitine、4-oxo-Retinoic acid、7-Methylguanine、Arabinosylhypoxanthine、Cyclohexaneacetic acid、Ecgonine、Ethyl3-oxohexanoate、Hippuric acid、Homo-L-arginine、Hypoxanthine、Inosine、Lactic acid、Octanoylcarnitine、5-Oxoproline、Trimethylamine N-oxide;
(2)在男性中的肺癌与良性肺结节病人间存在显著差异,而在女性中的无显著差异的代谢物包括:alpha-Eleostearic acid、2-trans,4-cis-Decadienoylcarnitine、3-hydroxydodecanoyl carnitine、Acetylcarnitine、Bilirubin、Diethylamine、Dihydrothymine、Docosahexaenoic acid、Glutamine、Linoleyl carnitine、N-Acetyl-L-alanine、Pyruvic acid、3-hydroxybutyryl carnitine、Aminoadipic acid、Ergothioneine、N6,N6,N6-Trimethylysine、Nicotine;
(3)在女性中的肺癌与良性肺结节病人间存在显著性差异,而在男性中的无显著性差异的代谢物包括:2-Ketobutyric acid、2-Pyrrolidone、3-Chlorotyrosine、Acetophenone、Choline Sulfate、cis-5-Tetradecenoylcarnitine、Citrulline、Creatinine、Hexanoylcarnitine、Kynurenine、Lysine、Serotonin、Succinic acidsemialdehyde、Xanthine、Phenylalanine。
对比表2至表7可知:
(1)男性中肺癌与健康人间特有差异代谢物包括:3b,16a-Dihydroxyandrostenone sulfate、Isoleucine、Leucine、Tyrosine;
(2)男性中肺癌与良性肺结节间特有差异代谢物包括:3-hydroxybutyrylcarnitine、Aminoadipic acid、Ergothioneine、Nicotine;
(3)女性中肺癌与健康人间特有差异代谢物包括:Alanine、Asparagine、Propionylcarnitine、Urocanic acid;
(4)女性中肺癌与良性肺结节间特有差异代谢物有:Phenylalanine。此处,特有差异代谢物是指:这些差异代谢物仅在特定的两组间存在显著差异,而在其他组间均无显著差异。
实施例5:鉴别诊断肺癌与良性肺结节的模型及其建立
1.单一差异代谢物鉴别诊断肺癌与良性肺结节的模型及其建立
建立每个代谢物的ROC曲线,通过曲线下面积(AUC)的大小来判断实验结果优劣。AUC为0.5表示单个代谢物无诊断价值;AUC大于0.5,说明单个代谢物具有诊断价值;AUC越大,说明单个代谢物的诊断价值越高。
将各表3、表5和表7中各个代谢物分别进行ROC曲线分析,各代谢物的ROC值及相关信息分别见表8、表9和表10:
表8 ROC分析肺癌与良性肺结节样本差异代谢物的ROC值及相关信息
表9 ROC分析男性肺癌与良性肺结节样本差异代谢物的ROC值及相关信息
表10 ROC分析女性肺癌与良性肺结节样本差异代谢物的ROC值及相关信息
2.多种差异代谢物联合鉴别诊断肺癌与良性肺结节的模型及其建立
基于表3中差异代谢物在肺癌和肺结节中的相对丰度,利用二元逻辑回归(SPSS软件)建立鉴别诊断肺癌与良性肺结节的模型,采取向前最大似然法(LR),筛选用于鉴别诊断肺癌和肺结节的最优模型参数(SPSS软件),结果得到预测模型A(适用于男性和女性)。
比值比(OR)是指肺癌发生与不发生的比值,它是肺癌与预测变量之间关联强度的指标,OR>1说明随该变量的增加,肺癌发生的概率增加,为“正”关联;OR<1说明随该变量的增加,肺癌发生的概率降低,为“负”关联;OR=1说明疾病与暴露无关联。在逻辑回归中,我们得到的系数,即为OR值的对数。表中p<0.05说明该变量在模型中具有显著作用。
模型A的变量及参数列表如下表11:
表11模型A的变量及参数列表
最后得到模型A方程为:Logit(P)=ln[P/((1-P)]=5.553×V04+2.92×V05+2.713×V06–0.332×V07–1.798×V10–7.922×V13–0.593×V14+0.643×V17–2.187×V19–0.992×V20–2.352×V33–1.441×V38+7.214×V39–1.22×V40–1.235×V42+1.61,P的临界值为0.424(即P>0.424时,诊断为肺癌)。如图7,进行ROC分析,AUC为0.955,敏感性与特异性分别为0.913与0.876,说明模型A可以很好地对肺部良性结节和恶性肿瘤进行鉴别诊断。
进一步地,考虑性别因素,根据表5和表7分别建立用于鉴别诊断男性中肺癌和肺结节的模型B和女性中肺癌和良性肺结节的模型C。
模型B的变量及参数列表如下表12:
表12模型B的变量及参数列表(男性)
模型B方程为:Logit(P)=ln[P/((1-P)]=6.283×MV02–0.646×MV10-2.758×MV13+1.864×MV15–1.126×MV19–1.145×MV27–3.918×MV30+1.494,P的临界值为0.701,P>0.701时,表示有结节的男性为肺癌病人。如图8,进行ROC分析,AUC为0.968,敏感性与特异性分别为0.870与0.988,说明模型B可以很好地对男性中肺部良性结节和恶性肿瘤进行鉴别诊断。
模型C的变量及参数列表如下表13:
表13模型C的变量及参数列表(女性)
模型C方程为:Logit(P)=ln[P/((1-P)]=10.742×FV05-1.031×FV08-7.442×FV09+11.839×FV13-2.617×FV15-3.030×FV20-1.413×FV23-2.278×FV29-6.905,P的临界值为0.629,P>0.629时,表示有结节的女性为肺癌病人。如图9,进行ROC分析,AUC为0.969,敏感性与特异性分别为0.870与0.953,说明模型C可以很好地对女性中肺部良性结节和恶性肿瘤进行鉴别诊断。
3.全部差异代谢物联合鉴别诊断肺癌与良性肺结节的模型及其建立
基于表3中差异代谢物在肺癌和肺结节中的相对丰度,利用二元逻辑回归(MetaboAnalyst软件)建立全部差异代谢物鉴别诊断肺癌与良性肺结模型D,采取10折交叉检验(10-fold Cross-Validation)。模型D的变量及参数列表如下表14:
表14模型D的变量及参数列表
模型D方程为:Logit(P)=ln[P/((1-P)]=-17.026×V01+17.418×V02+0.2×V03+6.45×V04+1.479×V05+3.762×V06-0.337×V07-0.096×V08-0.681×V09-2.144×V10+0.654×V11-0.833×V12-10.388×V13-1.051×V14-1.526×V15+1.505×V16+1.806×V17+0.519×V18-2.051×V19-0.86×V20-0.552×V21-3.683×V22+0.091×V23-0.721×V24+1.43×V25+0.572×V26+1.466×V27-1.097×V28+0.272×V29-0.315×V30-1.12×V31-2.83×V32-2.85×V33+0.993×V34+2.321×V35-0.71×V36-0.616×V37-1.711×V38+9.051×V39-1.52×V40+0.302×V41-1.688×V42-0.739×V43-0.152×V44-0.282×V45-0.085×V46+7.81,P的临界值为0.21,并进行ROC分析,如图10所示,AUC为0.973,敏感性与特异性分别为0.920与0.941,说明模型可以对肺部良性结节和恶性肿瘤进行鉴别诊断。根据上述筛选的差异代谢物(表2至表7),可选择不同的差异代谢物建立多种预测模型,这些预测模型都可能具有诊断价值,相应其筛选的差异代谢物组合也具有诊断价值。
实施例6:鉴别诊断肺癌与良性肺结节模型的应用
我们利用实施例5中的模型A对医院内外随机挑选并且不参与模型建立的肺癌以及良性肺结节共30个病例进行了预测。如图11,结果显示:模型A对肺癌预测准确率达到86.7%,对良性结节预测准确率为70%。该结果说明,我们建立的鉴别诊断肺癌与良性肺结节的模型具有较高的敏感性与特异性,能有效进行肺癌与良性肺结节的的鉴别诊断。
这里的结果仅仅是初步的预测结果,如果随着样本量的增大,可能预测结果更加准确,但是这不否认,本发明发现的这些标志物可以用于诊断是否为肺癌的生物标志物。