CN113539393A - 基于多个尿液蛋白诊断肝细胞癌的系统及试剂盒 - Google Patents

基于多个尿液蛋白诊断肝细胞癌的系统及试剂盒 Download PDF

Info

Publication number
CN113539393A
CN113539393A CN202010306740.3A CN202010306740A CN113539393A CN 113539393 A CN113539393 A CN 113539393A CN 202010306740 A CN202010306740 A CN 202010306740A CN 113539393 A CN113539393 A CN 113539393A
Authority
CN
China
Prior art keywords
expression
hepatocellular carcinoma
urine protein
urine
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010306740.3A
Other languages
English (en)
Inventor
孙薇
贺福初
赵颖华
牟劲松
邢宝才
刘万里
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Academy of Military Medical Sciences AMMS of PLA
Original Assignee
BEIJING PROTEOME RESEARCH CENTER
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING PROTEOME RESEARCH CENTER filed Critical BEIJING PROTEOME RESEARCH CENTER
Priority to CN202010306740.3A priority Critical patent/CN113539393A/zh
Publication of CN113539393A publication Critical patent/CN113539393A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/20ICT specially adapted for the handling or processing of patient-related medical or healthcare data for electronic clinical trials or questionnaires
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H40/00ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
    • G16H40/60ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the operation of medical equipment or devices
    • G16H40/63ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the operation of medical equipment or devices for local operation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本公开涉及基于多个尿液蛋白诊断肝细胞癌的系统,该系统包括输入装置、计算装置和输出装置;其中,所述多个尿液蛋白包括HPX、APOH、GLRX和PLG,所述相对表达分值是指所述多个尿液蛋白的表达值相对于其各自在肝细胞癌中异常表达时的表达阈值的打分值。通过上述技术方案,本公开为肝细胞癌诊断提供了高特异性、高灵敏度的分子标记物、试剂盒及诊断系统,能够对肝细胞癌进行快速、灵敏、准确的诊断。

Description

基于多个尿液蛋白诊断肝细胞癌的系统及试剂盒
技术领域
本公开涉及生物医学技术领域,具体地,涉及基于多个尿液蛋白诊断肝细胞癌的系统及试剂盒。
背景技术
肝细胞癌(hepatocellularcarcinoma,HCC)是常见的恶性肿瘤之一,在全世界范围内,肝细胞癌的发病率排名第六,死亡率排名第四,并且其发病率有逐渐增高的趋势。乙型肝炎病毒(hepatitisBvirus,HBV)慢性感染是诱发肝细胞癌的高危因素,具有HBV感染背景的慢性乙肝肝炎(chronichepatitisB)和肝硬化(livercirrhosis,LC)患者是发生肝细胞癌的高危人群。目前肝细胞癌患者的5年生存率较差,肝细胞癌的早期诊断能够使肝细胞癌患者得到及时治疗,对于提高肝细胞癌患者的生存率具有重要意义。
在相关技术中,主要通过B超等影像学检查联合血清标志物甲胎蛋白(alpha-fetoprotein,AFP)水平检测来进行肝细胞癌的临床诊断。
然而,利用甲胎蛋白作为标志物进行肝细胞癌诊断的灵敏度较低,而且甲胎蛋白来源于血清,血清中含有大量高丰度蛋白,影响甲胎蛋白检测结果的准确性。
发明内容
本公开的目的是提供与肝细胞癌密切相关的新的生物标记物,能够灵敏、准确地对受试者是否患有肝细胞癌进行诊断。
为了实现上述目的,第一方面,本公开提供一种基于多个尿液蛋白诊断肝细胞癌的系统,该系统包括输入装置、计算装置和输出装置;其中,
所述输入装置用于输入受试者的多个尿液蛋白的相对表达分值,其中所述多个尿液蛋白包括HPX、APOH、GLRX和PLG,所述相对表达分值是指所述多个尿液蛋白的表达值相对于其各自在肝细胞癌中异常表达时的表达阈值的打分值;
所述计算装置包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被配置为执行所述存储器中存储的计算机程序,以实现建模算法和如式(1)所示的判别函数的算法;
F(C)=sgn[F1(C1)+F2(C2)+F3(C3)+F4(C4)+b1]
式(1),
式(1)中,F(C)表示受试者是否患有肝细胞癌的诊断结果,F(C)返回值为1表示受试者患有肝细胞癌,F(C)返回值为-1表示受试者未患有肝细胞癌;C1、C2、C3和C4依次分别表示HPX、APOH、GLRX和PLG的相对表达分值;F1(C1)、F2(C2)、F3(C3)和F4(C4)分别为依据建模算法训练得到的核函数,b1为依据建模算法训练得到的临界打分值;
所述输出装置用于输出肝细胞癌的诊断结果。
可选地,所述多个尿液蛋白包括HPX、APOH、GLRX、PLG、NCR3LG1、GOT1和APCS,则所述判别函数如式(2)所示:
f(c)=sgn[f1(c1)+f2(c2)+f3(c3)+f4(c4)+f5(c5)+f6(c6)+f7(c7)+b2]
式(2),
式(2)中,f(c)表示受试者是否患有肝细胞癌的诊断结果,f(c)返回值为1表示受试者患有肝细胞癌,f(c)返回值为-1表示受试者未患有肝细胞癌;c1、c2、c3、c4、c5、c6和c7依次分别表示HPX、APOH、GLRX、PLG、NCR3LG1、GOT1和APCS的相对表达分值;f1(c1)、f2(c2)、f3(c3)、f4(c4)、f5(c5)、f6(c6)和f7(c7)分别为依据建模算法训练得到的核函数,b2为依据建模算法训练得到的临界打分值。
可选地,尿液蛋白在肝细胞癌中的异常表达包括高表达和低表达,则所述相对表达分值是指所述多个尿液蛋白的表达值相对于其各自在肝细胞癌中异常表达时的表达阈值的打分值,包括:
若尿液蛋白在肝细胞癌中的异常表达为高表达,则所述相对表达分值是指尿液蛋白的表达值相对于其在肝细胞癌中的高表达阈值的打分值;
若尿液蛋白在肝细胞癌中的异常表达为低表达,则所述相对表达分值是指尿液蛋白的表达值相对于其在肝细胞癌中的低表达阈值的打分值。
可选地,当尿液蛋白在肝细胞癌中的异常表达为高表达时,若所述尿液蛋白的表达值大于其在肝细胞癌中的高表达阈值,则所述尿液蛋白的相对表达分值为第一正相关分值,优选地,所述第一正相关分值的取值为1;若所述尿液蛋白的表达值小于等于其在肝细胞癌中的高表达阈值,则所述尿液蛋白的相对表达分值为第一负相关分值,优选地,所述第一负相关分值的取值为0;
当尿液蛋白在肝细胞癌中的异常表达为低表达时,若所述尿液蛋白的表达值小于其在肝细胞癌中的低表达阈值,则所述尿液蛋白的相对表达分值为第二正相关分值,优选地,所述第二正相关分值的取值为1;若所述尿液蛋白的表达值大于等于其在肝细胞癌中的低表达阈值,则所述尿液蛋白的相对表达分值为第二负相关分值,优选地,所述第二负相关分值的取值为0。
可选地,式(1)中,F1(C1)=C1,F2(C2)=C2,F3(C3)=C3,F4(C4)=C4,b1为大于-3小于-2的任意数值;
式(2)中,f1(c1)=c1,f2(c2)=c2,f3(c3)=c3,f4(c4)=c4,f5(c5)=c5,f6(c6)=c6,f7(c7)=c7,b2为大于-5小于-4的任意数值。
可选地,所述受试者包括具有乙型肝炎病毒感染背景的受试者,优选地,所述受试者包括慢性乙型肝炎患者和/或肝硬化患者。
第二方面,本公开提供用于检测分子标记物的表达值的试剂在制备诊断肝细胞癌的试剂盒和/或系统中的用途,所述分子标记物包括第一尿液蛋白和/或第二尿液蛋白,其中,所述第一尿液蛋白包括NCR3LG1,所述第二尿液蛋白包括HPX、APOH、GLRX和PLG。
可选地,所述第一尿液蛋白还包括HPX、APOH、GLRX、PLG、GOT1和APCS中的至少一种;
所述第二尿液蛋白还包括NCR3LG1、GOT1和APCS中的至少一种。
第三方面,本公开提供一种用于诊断肝细胞癌的试剂盒,所述试剂盒含有分子标记物和/或用于检测分子标记物的表达值的试剂,所述分子标记物包括第一尿液蛋白和/或第二尿液蛋白,其中,所述第一尿液蛋白包括NCR3LG1,所述第二尿液蛋白包括HPX、APOH、GLRX和PLG。
可选地,所述第一尿液蛋白还包括HPX、APOH、GLRX、PLG、GOT1和APCS中的至少一种;
所述第二尿液蛋白还包括NCR3LG1、GOT1和APCS中的至少一种。
通过上述技术方案,本公开为肝细胞癌诊断提供了高特异性、高灵敏度的分子标记物、试剂盒及诊断系统,能够对肝细胞癌进行快速、灵敏、准确的诊断。
本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
附图是用来提供对本公开的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本公开,但并不构成对本公开的限制。在附图中:
图1是本公开实施例发现集中排名前10的尿液蛋白。
图2是本公开实施例发现集中排名前10的尿液蛋白的ROC分析结果图。
图3是本公开实施例发现集中肝细胞癌判别模型的ROC曲线图。
图4是本公开实施例验证集中肝细胞癌判别模型的ROC曲线图。
图5是本公开实施例发现集中又一肝细胞癌判别模型的ROC曲线图。
图6是本公开实施例发现集中又一肝细胞癌判别模型的ROC曲线图。
图7是本公开实施例验证集中又一肝细胞癌判别模型的ROC曲线图。
具体实施方式
以下结合附图对本公开的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本公开,并不用于限制本公开。
本公开的第一方面提供一种基于多个尿液蛋白诊断肝细胞癌的系统,该系统包括输入装置、计算装置和输出装置;其中,所述输入装置用于输入受试者的多个尿液蛋白的相对表达分值,其中所述多个尿液蛋白包括HPX、APOH、GLRX和PLG,所述相对表达分值是指所述多个尿液蛋白的表达值相对于其各自在肝细胞癌中异常表达时的表达阈值的打分值;所述计算装置包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被配置为执行所述存储器中存储的计算机程序,以实现建模算法和如式(1)所示的判别函数的算法;
F(C)=sgn[F1(C1)+F2(C2)+F3(C3)+F4(C4)+b1]
式(1),
式(1)中,F(C)表示受试者是否患有肝细胞癌的诊断结果,F(C)返回值为1表示受试者患有肝细胞癌,F(C)返回值为-1表示受试者未患有肝细胞癌;C1、C2、C3和C4依次分别表示HPX、APOH、GLRX和PLG的相对表达分值;F1(C1)、F2(C2)、F3(C3)和F4(C4)分别为依据建模算法训练得到的核函数,b1为依据建模算法训练得到的临界打分值;所述输出装置用于输出肝细胞癌的诊断结果。
可选地,所述多个尿液蛋白包括HPX、APOH、GLRX、PLG、NCR3LG1、GOT1和APCS,则所述判别函数如式(2)所示:
f(c)=sgn[f1(c1)+f2(c2)+f3(c3)+f4(c4)+f5(c5)+f6(c6)+f7(c7)+b2]
式(2),
式(2)中,f(c)表示受试者是否患有肝细胞癌的诊断结果,f(c)返回值为1表示受试者患有肝细胞癌,f(c)返回值为-1表示受试者未患有肝细胞癌;c1、c2、c3、c4、c5、c6和c7依次分别表示HPX、APOH、GLRX、PLG、NCR3LG1、GOT1和APCS的相对表达分值;f1(c1)、f2(c2)、f3(c3)、f4(c4)、f5(c5)、f6(c6)和f7(c7)分别为依据建模算法训练得到的核函数,b2为依据建模算法训练得到的临界打分值。
其中,HPX为血红素结合蛋白,UniProt数据库编号为P02790,NCBI数据库编号为3263;GOT1为谷氨酸草酰乙酸转氨酶1,UniProt数据库编号为P17174,NCBI数据库编号为2805;APOH为载脂蛋白H,UniProt数据库编号为P02749,NCBI数据库编号为350;APCS为血清淀粉样蛋白P组分,UniProt数据库编号为P02743,NCBI数据库编号为325;GLRX为谷氧还蛋白,UniProt数据库编号为P35754,NCBI数据库编号为2745;PLG为血纤维蛋白溶酶原,UniProt数据库编号为P00747,NCBI数据库编号为5340;NCR3LG1为自然杀伤细胞毒性受体3配体1,UniProt数据库编号为Q68D85,NCBI数据库编号为374383。
目前常用的肝细胞癌诊断分子标记物主要来源于血清,然而血清中含有大量高峰度蛋白,对肝细胞癌诊断分子标记物的检测非常不利,导致血清中肝细胞癌诊断分子标记物的检测灵敏度低,肝细胞癌诊断结果不够准确;而且,对于需要进行肝细胞癌诊断的患者来说,特别是容易发生肝细胞癌的高危人群,需要定期进行肝细胞癌的临床诊断,然而血清的采集是有创的,长期的血清采集容易影响患者身体健康。
尿液中蛋白质组分的复杂程度较低,高峰度蛋白含量较少,因此尿液中的低丰度蛋白容易被检出,检测灵敏度较高;而且,尿液的采集完全无创,可以连续、大量地采集,不会对患者身体健康造成影响。
通过上述技术方案,本公开提供的肝细胞癌的诊断系统,能够根据受试者尿液中多种尿液蛋白的相对表达分值来判断受试者是否患有肝细胞癌,该多种尿液蛋白来自尿液,尿液中蛋白质组分的复杂程度较低,高峰度蛋白含量较少,因此,该多种尿液蛋白容易被检出,检测结果准确,检测灵敏度高。
可选地,尿液蛋白在肝细胞癌中的异常表达包括高表达和低表达,则所述相对表达分值是指所述多个尿液蛋白的表达值相对于其各自在肝细胞癌中异常表达时的表达阈值的打分值,包括:若尿液蛋白在肝细胞癌中的异常表达为高表达,则所述相对表达分值是指尿液蛋白的表达值相对于其在肝细胞癌中的高表达阈值的打分值;若尿液蛋白在肝细胞癌中的异常表达为低表达,则所述相对表达分值是指尿液蛋白的表达值相对于其在肝细胞癌中的低表达阈值的打分值。
示例性地,HPX在肝细胞癌中的异常表达为高表达,表达阈值可以为9.5;APOH在肝细胞癌中的异常表达为高表达,表达阈值可以为9.4;GLRX在肝细胞癌中的异常表达为低表达,表达阈值可以为8.3;PLG在肝细胞癌中的异常表达为高表达,表达阈值可以为8.1;NCR3LG1在肝细胞癌中的异常表达为低表达,表达阈值可以为4.4;GOT1在肝细胞癌中的异常表达为低表达,表达阈值可以为6.6;APCS在肝细胞癌中的异常表达为高表达,表达阈值可以为5.0。上述表达阈值仅用于对本公开的解释说明,并不用于限制本公开,在实际运用中,表达阈值的具体取值可能会随着检测方法的改变而改变,也可能会随着训练数据集的数据规模大小等因素发生改变。
可选地,当尿液蛋白在肝细胞癌中的异常表达为高表达时,若所述尿液蛋白的表达值大于其在肝细胞癌中的高表达阈值,则所述尿液蛋白的相对表达分值为第一正相关分值;若所述尿液蛋白的表达值小于等于其在肝细胞癌中的高表达阈值,则所述尿液蛋白的相对表达分值为第一负相关分值;当尿液蛋白在肝细胞癌中的异常表达为低表达时,若所述尿液蛋白的表达值小于其在肝细胞癌中的低表达阈值,则所述尿液蛋白的相对表达分值为第二正相关分值;若所述尿液蛋白的表达值大于等于其在肝细胞癌中的低表达阈值,则所述尿液蛋白的相对表达分值为第二负相关分值。
根据本公开,当某一尿液蛋白的相对表达分值为第一正相关分值或者第二正相关分值时,说明该尿液蛋白此时的表达值对肝细胞癌的发生具有促进作用;当某一尿液蛋白的相对表达分值为第一负相关分值或者第二负相关分值时,说明该尿液蛋白此时的表达值对肝细胞癌的发生不具有促进作用。其中,上述第一正相关分值、第一负相关分值、第二正相关分值和第二负相关分值的取值可以在较大的范围内变化,只要其取值能够准确表征其是否会促进肝细胞癌的发生即可,例如,第一正相关分值和第二正相关分值可以为大于0的任意数值,第一负相关分值和第二负相关分值可以为小于等于0的任意数值。优选地,所述第一正相关分值的取值为1,所述第一负相关分值的取值为0,所述第二正相关分值的取值为1,所述第二负相关分值的取值为0。
根据本公开,作为本公开的一个具体实施例,式(1)中,F1(C1)=C1,F2(C2)=C2,F3(C3)=C3,F4(C4)=C4,b1为大于-3小于-2的任意数值;式(2)中,f1(c1)=c1,f2(c2)=c2,f3(c3)=c3,f4(c4)=c4,f5(c5)=c5,f6(c6)=c6,f7(c7)=c7,b2为大于-5小于-4的任意数值。需要说明的是,F1(c1)、F2(c2)、F3(c3)、F4(c4)、f1(c1)、f2(c2)、f3(c3)、f4(c4)、f5(c5)、f6(c6)、f7(c7)、b1和b2均可能会随着尿液蛋白的表达值检测手段的偏性而发生改变,也可能会随着训练数据集的数据规模大小等因素发生改变。
优选地,所述受试者包括具有乙型肝炎病毒感染背景的受试者,优选地,所述受试者包括慢性乙型肝炎患者和/或肝硬化患者。
可选地,该系统还可以包括多个尿液蛋白的表达值的检测装置。多个尿液蛋白的表达值的检测装置能够直接或间接地检测尿液样本中的多个尿液蛋白的表达值,并将检测结果通过输入装置输入值计算装置。
优选地,所述多个尿液蛋白的表达值的检测装置可以包括尿液蛋白表达值检测芯片和芯片信号读取器,所述尿液蛋白表达值检测芯片包括分别检测HPX、GOT1、APOH、APCS、GLRX、PLG和NCR3LG1的表达值的探针。
可选地,所述输入装置与所述计算装置之间通过有线方式和/或无线方式连接,所述计算装置和所述输出装置之间通过有线和/或无线方式连接;所述计算装置为电脑主机、中央处理器或网络服务器,所述输出装置为显示器、打印机或音频输出装置。
本公开的第二方面提供用于检测分子标记物的表达值的试剂在制备诊断肝细胞癌的试剂盒和/或系统中的用途,所述分子标记物包括第一尿液蛋白和/或第二尿液蛋白,其中,所述第一尿液蛋白包括NCR3LG1,所述第二尿液蛋白包括HPX、APOH、GLRX和PLG。
可选地,所述第一尿液蛋白还包括HPX、APOH、GLRX、PLG、GOT1和APCS中的至少一种;所述第二尿液蛋白还包括NCR3LG1、GOT1和APCS中的至少一种。
本公开的第三方面提供一种用于诊断肝细胞癌的试剂盒,所述试剂盒含有分子标记物和/或用于检测分子标记物的表达值的试剂,所述分子标记物包括第一尿液蛋白和/或第二尿液蛋白,其中,所述第一尿液蛋白包括NCR3LG1,所述第二尿液蛋白包括HPX、APOH、GLRX和PLG。
可选地,所述第一尿液蛋白还包括HPX、APOH、GLRX、PLG、GOT1和APCS中的至少一种;所述第二尿液蛋白还包括NCR3LG1、GOT1和APCS中的至少一种。
以下通过实施例进一步详细说明本发明。
本公开实施例所涉及的名词解释:
受试者工作特征(receiver(relative)operatingcharacteristic,ROC)曲线反映了灵敏度与特异度间的平衡,ROC曲线下面积是重要的试验准确度指标。分别计算各个试验的ROC曲线下的面积(AUC)进行比较,面积大者,试验的诊断价值大。
灵敏度(真阳性率):实际有病而按试验标准被正确判断为有病的百分率,灵敏度越大越好,理想灵敏度为100%。
特异度(真阴性率):实际无病而按试验标准被正确判断为无病的百分率,特异度越大越好,理想特异度100%。
约登指数:灵敏度+特异度-1,约登指数越大说明筛查实验的效果越好,真实性越大。
下述实施例中所使用的实验方法如无特殊说明,均为常规方法。
下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
实施例1
本实施例用于说明本公开的生物标志物的发现
一、实验材料
尿液样本来自:有HBV慢性感染背景的肝炎患者和/或肝硬化患者(HR)43例;有HBV慢性感染背景的肝细胞癌患者(HCC)36例。
其中,肝炎,肝硬化以及肝细胞癌患者均为临床确诊病人。
二、实验方法
通过蛋白质组学方法对尿液样本进行鉴定和非标定量,找到差异蛋白,构建联合应用模型进行HCC诊断。所用质谱仪器为ThermoFisher公司HF质谱仪,超滤管为Millipore公司3kDa超滤管(货号:UFC500396),胰酶为Promega公司的胰蛋白酶(货号:V5111),Bradford蛋白定量试剂购自ThermoFisher公司,试剂二硫苏糖醇(DTT),碘乙酰胺(IAA),尿素,碳酸氢钠,甲酸购自Sigma公司。具体方法如下:
1、取1ml尿液样本加入超滤管中,14000g离心浓缩至100微升,得到浓缩尿液;
2、在浓缩尿液中加入10微升1MDTT溶液,37摄氏度还原30分钟;
3、加入40微升1MIAA溶液,避光反应30分钟,14000g离心20min;
4、加入100微升8M尿素溶液,14000g离心20min洗一次;
5、加入100微升50mM碳酸氢铵溶液,14000g离心20min,重复两次,使最终尿素浓度低于1M;
6、使用Bradford试剂进行蛋白定量,取20微克蛋白,按照酶:蛋白=1:50的比例加入胰蛋白酶,进行滤膜辅助酶切,37摄氏度过夜酶切;
7、第二天将样品14000g离心20min,滤出液即酶切后的肽段,在滤膜内加入50微升质谱级水,14000g离心20min,合并滤液,进行真空干燥;
8、用含0.1%甲酸的水溶液复溶肽段,取500ng进行质谱上样;
9、质谱采用75分钟梯度,得到的质谱文件通过MaxQuant软件搜库得到定性和非标定量信息,蛋白定量数据通过总面积法进行标准化,并进行log2转换,缺失值以最小值填充;
10、在43例HR和36例HCC尿液样本组成的发现集里,利用R软件,筛选两组间表达量差异显著的蛋白(Wilcoxon检验,p<0.05),通过递归特征消除(RFE)的策略筛选其中排名前十的10个蛋白,分别为HPX、GOT1、APOH、APCS、TMEM27、GLRX、PLG、NCR3LG1、LPA和TINAG,如图1所示;
11、对上述10个蛋白进行ROC分析,曲线下面积分别为0.85,0.76,0.76,0.77,0.71,0.77,0.77,0.80,0.75和0.72,可见所有蛋白的AUC均在0.7以上,如图2所示,最大约登指数高于50%的蛋白有7个蛋白,分别为HPX、GOT1、APOH、APCS、GLRX、PLG和NCR3LG1,说明这7个蛋白在分类的时候具有更好的诊断效果。
实施例2
本实施例用于验证NCR3LG1诊断肝细胞癌的预测性能
本实施例中直接利用尿液NCR3LG1的表达值与其在HCC的表达阈值来进行肝细胞癌的诊断,NCR3LG1在肝细胞癌中的异常表达为低表达,当NCR3LG1的表达值低于其在HCC的低表达阈值时,说明受试者患有肝细胞癌,当NCR3LG1的表达值高于其在HCC的低表达阈值时,说明受试者患未有肝细胞癌。对发现集中诊断结果进行ROC分析,结果显示AUC=0.80,灵敏度为86%、特异度为67%,说明本公开提供的尿液蛋白NCR3LG1可用于肝细胞癌的诊断。
重新选取19例有HBV慢性感染背景的肝炎患者和/或肝硬化患者(HR);18例有HBV慢性感染背景的肝细胞癌患者(HCC),组成验证集,获取每个患者的尿液样本,并按照实施例1的方法检测每个患者的尿液样本中NCR3LG1的表达值,进行ROC分析,结果显示AUC=0.73,灵敏度为89%、特异度为68%。
实施例3
本实施例用于说明如式(1)所示的预测模型的建立
利用R软件,计算实施例1尿液样本中HPX、APOH、GLRX和PLG的最大约登指数,确定其阈值(cutoff),将每个样本中此4个蛋白的表达值与阈值对比,根据表达情况进行打分,高于HCC组高表达蛋白的阈值或者低于HCC组低表达蛋白的阈值记为1分,否则为0分,每个样本的得分为4个蛋白打分之和,利用此方法构建投票模型,整合多个蛋白进行诊断,该模型如式(1)所示:
F(C)=sgn[F1(C1)+F2(C2)+F3(C3)+F4(C4)+b1]
式(1),
式(1)中,F(C)表示受试者是否患有肝细胞癌的诊断结果,F(C)返回值为1表示受试者患有肝细胞癌,F(C)返回值为-1表示受试者未患有肝细胞癌;C1、C2、C3和C4依次分别表示HPX、APOH、GLRX和PLG的相对表达分值;F1(C1)、F2(C2)、F3(C3)和F4(C4)分别为依据建模算法训练得到的核函数,b1为依据建模算法训练得到的临界打分值。具体地,式(1)中,F1(C1)=C1,F2(C2)=C2,F3(C3)=C3,F4(C4)=C4,b1为大于-3小于-2的任意数值,例如b1=-2.5,也就是说判别函数具体可以为:
F(C)=sgn[C1+C2+C3+C4-2.5]式 (3)
在发现集中进行ROC分析,AUC为AUC=0.92,灵敏度为81%、特异度为83%,如图3所示。
实施例4
本实施例用于说明如式(3)所示的预测模型的验证
重新选取19例有HBV慢性感染背景的肝炎患者和/或肝硬化患者(HR);18例有HBV慢性感染背景的肝细胞癌患者(HCC)组成验证集,获取每个患者的尿液样本,通过实施例1的方法检测每个患者的尿液样本中HPX、APOH、GLRX和PLG的表达值,并利用验证集对式(3)的诊断效果进行验证,验证结果显示,AUC=0.86,灵敏度为78%、特异度为89%,如图4所示。
对比例1
在进行实施例3的同时,在筛选出来的差异尿液蛋白中选取不同于HPX、APOH、GLRX和PLG的组合的尿液蛋白组合,作为诊断肝细胞癌的生物标志物,具体为GOT1、TMEM27、LPA和TINAG。
在进行实施例4的同时,采用与实施例4相同的方法进行评估,结果显示,AUC=0.72,灵敏度为72%、特异度为53%。
实施例5
本实施例用于说明标志物HPX、APOH、GLRX和PLG的验证
重新选取20例有HBV慢性感染背景的肝炎患者和/或肝硬化患者(HR);20例有HBV慢性感染背景的肝细胞癌患者(HCC),获取每个患者的尿液样本,通过多重反应监测(MRM)方法检测每个患者的尿液样本中HPX、APOH、GLRX和PLG的表达值。利用R软件,计算这4个蛋白的最大约登指数,确定其阈值(cutoff),分别为:HPX:9.3,APOH:5.7,GLRX:4.8,PLG:5.0。将每个样本中此4个蛋白的表达值与阈值对比,根据表达情况进行打分,高于HCC组高表达蛋白的阈值或者低于HCC组低表达蛋白的阈值记为1分,否则为0分,每个样本的得分为4个蛋白打分之和,利用此方法构建投票模型,整合多个蛋白进行诊断,该模型如式(1)所示:
F(C)=sgn[F1(C1)+F2(C2)+F3(C3)+F4(C4)+b1]
式(1),
式(1)中,F(C)表示受试者是否患有肝细胞癌的诊断结果,F(C)返回值为1表示受试者患有肝细胞癌,F(C)返回值为-1表示受试者未患有肝细胞癌;C1、C2、C3和C4依次分别表示HPX、APOH、GLRX和PLG的相对表达分值;F1(C1)、F2(C2)、F3(C3)和F4(C4)分别为依据建模算法训练得到的核函数,b1为依据建模算法训练得到的临界打分值。具体地,式(1)中,F1(C1)=C1,F2(C2)=C2,F3(C3)=C3,F4(C4)=C4,b1为大于-3小于-2的任意数值,例如b1=-2.7,也就是说判别函数具体可以为:
F(C)=sgn[C1+C2+C3+C4-2.7]式 (4)
在MRM数据集中进行ROC分析,AUC=0.91,灵敏度为90%、特异度为80%,如图5所示。
实施例6
本实施例用于说明如式(2)所示的预测模型的建立
利用R软件,对实施例1的尿液样本中HPX、APOH、GLRX、PLG、NCR3LG1、GOT1和APCS的最大约登指数进行计算,确定其阈值(cutoff),将每个样本中此7个蛋白的表达值与阈值对比,根据表达情况进行打分,高于HCC组高表达蛋白的阈值或者低于HCC组低表达蛋白的阈值记为1分,否则为0分,每个样本的得分为7个蛋白打分之和,利用此方法构建投票模型,整合多个蛋白进行诊断,该模型如式(2)所示:
f(c)=sgn[f1(c1)+f2(c2)+f3(c3)+f4(c4)+f5(c5)+f6(c6)+f7(c7)+b2]
式(2),
式(2)中,f(c)表示受试者是否患有肝细胞癌的诊断结果,f(c)返回值为1表示受试者患有肝细胞癌,f(c)返回值为-1表示受试者未患有肝细胞癌;c1、c2、c3、c4、c5、c6和c7依次分别表示HPX、APOH、GLRX、PLG、NCR3LG1、GOT1和APCS的相对表达分值;f1(c1)、f2(c2)、f3(c3)、f4(c4)、f5(c5)、f6(c6)和f7(c7)分别为依据建模算法训练得到的核函数,b2为依据建模算法训练得到的临界打分值。具体地,式(2)中,f1(c1)=c1,f2(c2)=c2,f3(c3)=c3,f4(c4)=c4,f5(c5)=c5,f6(c6)=c6,f7(c7)=c7,b2为大于-5小于-4的任意数值,例如b2=-4.5,也就是说判别函数具体为:
f(c)=sgn[c1+c2+c3+c4+c5+c6+c7-4.5]式 (5)
在发现集中进行ROC分析,AUC=0.96,灵敏度为89%、特异度为88%,如图6所示。
实施例7
本实施例用于说明如如式(5)所示的预测模型的验证。
重新选取19例有HBV慢性感染背景的肝炎患者和/或肝硬化患者(HR);18例有HBV慢性感染背景的肝细胞癌患者(HCC),获取每个患者的尿液样本,并按照实施例1的方法检测每个患者的尿液样本中HPX、GOT1、APOH、APCS、GLRX、PLG和NCR3LG1的表达值,组成验证集,并利用验证集对式(4)的诊断效果进行验证,验证结果显示,AUC=0.90(图7),灵敏度为100%、特异度为79%。
对比例2
在进行实施例5的同时,在筛选出来的差异尿液蛋白中选取不同于HPX、GOT1、APOH、APCS、GLRX、PLG和NCR3LG1的组合的尿液蛋白组合,作为诊断肝细胞癌的生物标志物,具体为TMEM27、LPA、TINAG、MASP2、ALDH1A1、ACY1和RAB7A。
在进行实施例6的同时,采用与实施例6相同的方法进行评估,结果显示,AUC=0.79,灵敏度为83%、特异度为63%。
以上结合附图详细描述了本公开的优选实施方式,但是,本公开并不限于上述实施方式中的具体细节,在本公开的技术构思范围内,可以对本公开的技术方案进行多种简单变型,这些简单变型均属于本公开的保护范围。
另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合,为了避免不必要的重复,本公开对各种可能的组合方式不再另行说明。
此外,本公开的各种不同的实施方式之间也可以进行任意组合,只要其不违背本公开的思想,其同样应当视为本公开所公开的内容。

Claims (10)

1.一种基于多个尿液蛋白诊断肝细胞癌的系统,其特征在于,该系统包括输入装置、计算装置和输出装置;其中,
所述输入装置用于输入受试者的多个尿液蛋白的相对表达分值,其中所述多个尿液蛋白包括HPX、APOH、GLRX和PLG,所述相对表达分值是指所述多个尿液蛋白的表达值相对于其各自在肝细胞癌中异常表达时的表达阈值的打分值;
所述计算装置包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被配置为执行所述存储器中存储的计算机程序,以实现建模算法和如式(1)所示的判别函数的算法;
F(C)=sgn[F1(C1)+F2(C2)+F3(C3)+F4(C4)+b1]
式(1),
式(1)中,F(C)表示受试者是否患有肝细胞癌的诊断结果,F(C)返回值为1表示受试者患有肝细胞癌,F(C)返回值为-1表示受试者未患有肝细胞癌;C1、C2、C3和C4依次分别表示HPX、APOH、GLRX和PLG的相对表达分值;F1(C1)、F2(C2)、F3(C3)和F4(C4)分别为依据建模算法训练得到的核函数,b1为依据建模算法训练得到的临界打分值;
所述输出装置用于输出肝细胞癌的诊断结果。
2.根据权利要求1所述的系统,其特征在于,所述多个尿液蛋白包括HPX、APOH、GLRX、PLG、NCR3LG1、GOT1和APCS,则所述判别函数如式(2)所示:
f(c)=sgn[f1(c1)+f2(c2)+f3(c3)+f4(c4)+f5(c5)+f6(c6)+f7(c7)+b2]
式(2),
式(2)中,f(c)表示受试者是否患有肝细胞癌的诊断结果,f(c)返回值为1表示受试者患有肝细胞癌,f(c)返回值为-1表示受试者未患有肝细胞癌;c1、c2、c3、c4、c5、c6和c7依次分别表示HPX、APOH、GLRX、PLG、NCR3LG1、GOT1和APCS的相对表达分值;f1(c1)、f2(c2)、f3(c3)、f4(c4)、f5(c5)、f6(c6)和f7(c7)分别为依据建模算法训练得到的核函数,b2为依据建模算法训练得到的临界打分值。
3.根据权利要求1所述的系统,其特征在于,尿液蛋白在肝细胞癌中的异常表达包括高表达和低表达,则所述相对表达分值是指所述多个尿液蛋白的表达值相对于其各自在肝细胞癌中异常表达时的表达阈值的打分值,包括:
若尿液蛋白在肝细胞癌中的异常表达为高表达,则所述相对表达分值是指尿液蛋白的表达值相对于其在肝细胞癌中的高表达阈值的打分值;
若尿液蛋白在肝细胞癌中的异常表达为低表达,则所述相对表达分值是指尿液蛋白的表达值相对于其在肝细胞癌中的低表达阈值的打分值。
4.根据权利要求3所述的系统,其特征在于,当尿液蛋白在肝细胞癌中的异常表达为高表达时,若所述尿液蛋白的表达值大于其在肝细胞癌中的高表达阈值,则所述尿液蛋白的相对表达分值为第一正相关分值,优选地,所述第一正相关分值的取值为1;若所述尿液蛋白的表达值小于等于其在肝细胞癌中的高表达阈值,则所述尿液蛋白的相对表达分值为第一负相关分值,优选地,所述第一负相关分值的取值为0;
当尿液蛋白在肝细胞癌中的异常表达为低表达时,若所述尿液蛋白的表达值小于其在肝细胞癌中的低表达阈值,则所述尿液蛋白的相对表达分值为第二正相关分值,优选地,所述第二正相关分值的取值为1;若所述尿液蛋白的表达值大于等于其在肝细胞癌中的低表达阈值,则所述尿液蛋白的相对表达分值为第二负相关分值,优选地,所述第二负相关分值的取值为0。
5.根据权利要求2所述的系统,其特征在于,式(1)中,F1(C1)=C1,F2(C2)=C2,F3(C3)=C3,F4(C4)=C4,b1为大于-3小于-2的任意数值;
式(2)中,f1(c1)=c1,f2(c2)=c2,f3(c3)=c3,f4(c4)=c4,f5(c5)=c5,f6(c6)=c6,f7(c7)=c7,b2为大于-5小于-4的任意数值。
6.根据权利要求1-5中任意一项所述的系统,其特征在于,所述受试者包括具有乙型肝炎病毒感染背景的受试者,优选地,所述受试者包括慢性乙型肝炎患者和/或肝硬化患者。
7.用于检测分子标记物的表达值的试剂在制备诊断肝细胞癌的试剂盒和/或系统中的用途,其特征在于,所述分子标记物包括第一尿液蛋白和/或第二尿液蛋白,其中,所述第一尿液蛋白包括NCR3LG1,所述第二尿液蛋白包括HPX、APOH、GLRX和PLG。
8.根据权利要求7所述的用途,其特征在于,所述第一尿液蛋白还包括HPX、APOH、GLRX、PLG、GOT1和APCS中的至少一种;
所述第二尿液蛋白还包括NCR3LG1、GOT1和APCS中的至少一种。
9.一种用于诊断肝细胞癌的试剂盒,其特征在于,所述试剂盒含有分子标记物和/或用于检测分子标记物的表达值的试剂,所述分子标记物包括第一尿液蛋白和/或第二尿液蛋白,其中,所述第一尿液蛋白包括NCR3LG1,所述第二尿液蛋白包括HPX、APOH、GLRX和PLG。
10.根据权利要求9所述的试剂盒,其特征在于,所述第一尿液蛋白还包括HPX、APOH、GLRX、PLG、GOT1和APCS中的至少一种;
所述第二尿液蛋白还包括NCR3LG1、GOT1和APCS中的至少一种。
CN202010306740.3A 2020-04-17 2020-04-17 基于多个尿液蛋白诊断肝细胞癌的系统及试剂盒 Pending CN113539393A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010306740.3A CN113539393A (zh) 2020-04-17 2020-04-17 基于多个尿液蛋白诊断肝细胞癌的系统及试剂盒

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010306740.3A CN113539393A (zh) 2020-04-17 2020-04-17 基于多个尿液蛋白诊断肝细胞癌的系统及试剂盒

Publications (1)

Publication Number Publication Date
CN113539393A true CN113539393A (zh) 2021-10-22

Family

ID=78093501

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010306740.3A Pending CN113539393A (zh) 2020-04-17 2020-04-17 基于多个尿液蛋白诊断肝细胞癌的系统及试剂盒

Country Status (1)

Country Link
CN (1) CN113539393A (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107657149A (zh) * 2017-09-12 2018-02-02 中国人民解放军军事医学科学院生物医学分析中心 用于预测肝癌患者预后的系统
CN110760580A (zh) * 2018-10-10 2020-02-07 杭州翱锐生物科技有限公司 一种肝癌的早期诊断设备
CN111690740A (zh) * 2019-03-11 2020-09-22 中国医学科学院肿瘤医院 肝细胞癌早筛试剂盒及其制备方法和用途

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107657149A (zh) * 2017-09-12 2018-02-02 中国人民解放军军事医学科学院生物医学分析中心 用于预测肝癌患者预后的系统
CN110760580A (zh) * 2018-10-10 2020-02-07 杭州翱锐生物科技有限公司 一种肝癌的早期诊断设备
CN110791564A (zh) * 2018-10-10 2020-02-14 杭州翱锐基因科技有限公司 早期癌症的分析方法和设备
CN111690740A (zh) * 2019-03-11 2020-09-22 中国医学科学院肿瘤医院 肝细胞癌早筛试剂盒及其制备方法和用途

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
YINGHUA ZHAO: "Identification of noninvasive diagnostic biomarkers for hepatocellular carcinoma by urinary proteomics", 《JOURNAL OF PROTEOMICS》, vol. 225, pages 1 - 9 *

Similar Documents

Publication Publication Date Title
US20240087754A1 (en) Plasma based protein profiling for early stage lung cancer diagnosis
CN110444248B (zh) 基于网络拓扑参数的癌症生物分子标志物筛选方法及系统
CN105005680B (zh) 使用分类系统及其试剂盒识别和诊断肺部疾病的方法
US20080086272A1 (en) Identification and use of biomarkers for the diagnosis and the prognosis of inflammatory diseases
US20170059581A1 (en) Methods for diagnosis and prognosis of inflammatory bowel disease using cytokine profiles
CN115862838A (zh) 一种基于机器学习算法的胆管癌诊断模型及其构建方法和应用
CN114864080A (zh) 一种肝癌诊断模型c-galad ii的建立方法、系统、设备及介质
CN117147672A (zh) 用于糖尿病肾病风险判别的生物标志物组合及其应用
WO2021180182A1 (zh) 基于免疫表征技术对样本分类的方法、装置及存储介质
CN112710627B (zh) 一种特定蛋白浓度的检测方法及检测装置
CN116087482B (zh) 用于2019新型冠状病毒感染患者病程严重程度分型的生物标志物
CN113539393A (zh) 基于多个尿液蛋白诊断肝细胞癌的系统及试剂盒
CN113539478A (zh) 基于代谢组学的深静脉血栓形成预测模型的建立方法
CN117031042B (zh) 用于筛查诊断先天性心脏病胎儿的生物标志物及其应用
CN117607432B (zh) Msr1蛋白及其特异性抗体在制备神经梅毒或神经损伤诊断产品中的应用
CN114550942B (zh) 一种肝脏显著纤维化预测模型及构建方法
CN113241177B (zh) 一种评估免疫力水平的方法、装置、设备及存储介质
CN117153384A (zh) 尿液多肽的检测方法
WO2022160499A1 (zh) 特定蛋白反应曲线的异常识别方法及识别装置
CN116106398A (zh) 用于诊断ckd的标志物
CN117612741A (zh) 新型冠状病毒感染代谢特征谱及其构建方法、装置、系统、应用
CN118471469A (zh) 通过分子标志物表达量诊断复发性多软骨炎的系统、试剂盒
Kim et al. Liver Fibrosis Biomarker Validation Using Machine Learning Algorithms
CN117405896A (zh) 辅助诊断方法、装置、设备、系统及介质
CN118213079A (zh) 疾病机器学习鉴别模型的构建方法、标志物及其应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20220310

Address after: 100850 No. 27 Taiping Road, Beijing, Haidian District

Applicant after: ACADEMY OF MILITARY MEDICAL SCIENCES

Address before: 102206 Building 1, No.33, kekeyuan Road, Changping District, Beijing

Applicant before: BEIJING PROTEOME RESEARCH CENTER

TA01 Transfer of patent application right