CN104969071A - 用于评估结肠肿瘤的存在或风险的方法 - Google Patents

用于评估结肠肿瘤的存在或风险的方法 Download PDF

Info

Publication number
CN104969071A
CN104969071A CN201380071930.XA CN201380071930A CN104969071A CN 104969071 A CN104969071 A CN 104969071A CN 201380071930 A CN201380071930 A CN 201380071930A CN 104969071 A CN104969071 A CN 104969071A
Authority
CN
China
Prior art keywords
protein
existence
methods according
experimenter
polyp
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201380071930.XA
Other languages
English (en)
Other versions
CN104969071B (zh
Inventor
约翰·布卢姆
瑞恩·本茨
莉萨·克罗纳
罗斯林·狄龙
阿尔洛·兰德尔
杰弗里·琼斯
希瑟·斯科尔
汤姆·斯托克菲希
布鲁斯·威尔考克斯
丹尼尔·鲁德尔曼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Applied Proteomics Inc
Original Assignee
Applied Proteomics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Applied Proteomics Inc filed Critical Applied Proteomics Inc
Priority to CN201910577840.7A priority Critical patent/CN110596385A/zh
Publication of CN104969071A publication Critical patent/CN104969071A/zh
Application granted granted Critical
Publication of CN104969071B publication Critical patent/CN104969071B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57407Specifically defined cancers
    • G01N33/57419Specifically defined cancers of colon
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/52Predicting or monitoring the response to treatment, e.g. for selection of therapy based on assay results in personalised medicine; Prognosis
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/60Complex ways of combining multiple protein biomarkers for diagnosis
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/70Mechanisms involved in disease identification
    • G01N2800/7023(Hyper)proliferation
    • G01N2800/7028Cancer
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding

Abstract

公开的方法用于预测或评估患者的结肠肿瘤状态。这些方法可用于确定肿瘤的性质、复发或患者对治疗的反应。该方法的一些实施方案包括生成用于临床管理的报告。本文提供的方法旨在检测技术变化,并允许数据归一化及提高信号检测,以及构建疾病状态和反应的预测性蛋白质谱。

Description

用于评估结肠肿瘤的存在或风险的方法
交叉引用
本申请根据35 U.S.C.§119(e)要求2012年11月30日提交的美国临时申请号61/732,024和2013年3月5日提交的美国临时申请号61/772,979的优先权,所有这些临时申请均通过引用而整体并入本文。
序列表
本申请包含序列表,该序列表已经以ASCII格式电子提交,且通过引用而整体并入于此。所述ASCII副本在2013年11月27日创建,被命名为36765-703.201_SL.txt,大小为783,936个字节。
发明背景
如本领域已知,基因组的信息内容作为DNA而携带。基因表达的第一步是将DNA转录成mRNA。基因表达的第二步是从mRNA合成多肽,使得mRNA的每三个核苷酸编码一个将组成多肽的氨基酸残基。翻译后,多肽通常通过添加不同的化学基团如碳水化合物、脂质和磷酸基团以及通过对特定肽键的蛋白水解裂解进行翻译后修饰。这些化学修饰使多肽呈现独特的三维构象,从而形成成熟蛋白质。虽然这些翻译后修饰不是由mRNA模板直接编码的,但它们是蛋白质的关键特质,其通过改变整体构象和可用的相互作用位点来起到调节蛋白质功能的作用。此外,细胞内的蛋白质水平可反映个体是否处于健康或疾病状态。因此,蛋白质是疾病状态、疾病的早期发作和疾病风险的非常有价值的生物标志物来源。
mRNA和蛋白质均通过单独的途径不断地合成并降解。此外,存在对合成和降解途径的多个水平的调节。鉴于此,在mRNA种类的丰度与它们编码的蛋白质的实际量之间不存在简单的关联也就不足为奇了(Anderson和Seilhamer,Electrophoresis 18:533-537;Gygi等人,Mol.Cell.Biol.19:1720-1730,1999)。因此,尽管通常外推mRNA水平以指示表达的蛋白质的水平,但蛋白质的最终水平并非必需通过测量mRNA水平才可获得(Patton,J.Chromatogr.722:203-223,1999;Patton等人,J.Biol.Chem.270:21404-21410(1995))。
因此,需要确定生物样品的蛋白质谱的方法。
发明内容
公开了用于以大于70%的灵敏度或大于70%的选择性检测受试者的结肠的腺瘤、癌症或息肉的存在的方法。在各个实施方案中,所述方法包括以下步骤:(a)从受试者获得血液样品;(b)裂解所述血液样品中的蛋白质以提供包含肽的样品;(c)分析所述样品中至少十种肽的存在;(d)将分析所述样品的结果与对照参考值进行比较,从而以大于70%的灵敏度或大于70%的选择性确定存在结肠的腺瘤或息肉的正或负得分。还公开了治疗受试者的结肠的腺瘤、癌症或息肉的方法,该方法包括:(a)执行如本文所述的检测方法以得到具有存在腺瘤、癌症或息肉的正得分的受试者;以及(b)进行用于去除所述受试者的腺瘤或息肉组织的程序。
此外,公开了用于检测受试者的结肠的腺瘤或息肉的存在与否的方法,其中所述受试者没有结肠的腺瘤或息肉的症状或家族史,所述方法包括以下步骤:(a)从所述受试者获得生物样品;(b)对所述生物样品进行关于一种或多种蛋白质和/或肽的存在和量的分析;(c)将来自所述生物样品的一种或多种蛋白质和/或肽的存在和量与对照参考值进行比较;以及(d)将一种或多种蛋白质和/或肽的存在和量与所述受试者的腺瘤、癌症或息肉状态相关联。
此外,公开了用于检测在结肠镜检查得到阴性结果的受试者中结肠的腺瘤、癌症或息肉的存在与否的方法,该方法包括以下步骤:(a)从基于结肠镜检查具有腺瘤、癌症或息肉的阴性诊断的受试者获得生物样品;(b)对所述生物样品进行关于一种或多种蛋白质和/或肽的存在和量的分析;(c)将来自所述生物样品的一种或多种蛋白质和/或肽的存在和量与对照参考值进行比较;以及(d)将一种或多种蛋白质和/或肽的存在和量与所述受试者的腺瘤、癌症或息肉状态相关联。
公开了用于检测先前治疗结肠的腺瘤、癌症或息肉的受试者中结肠的腺瘤、癌症或息肉的复发或不存在的方法,该方法包括以下步骤:(a)从先前治疗结肠的腺瘤、癌症或息肉的受试者获得生物样品;(b)对所述生物样品进行关于一种或多种蛋白质和/或肽的存在和量的分析;(c)将来自所述生物样品的一种或多种蛋白质和/或肽的存在和量与对照参考值进行比较;以及(d)将一种或多种蛋白质和/或肽的存在和量与所述受试者的腺瘤、癌症或息肉状态相关联。
此外,公开了针对诊断应用的蛋白质和/或肽检测方法,该方法包括以下步骤:(a)从受试者获得生物样品;(b)对所述生物样品进行关于一种或多种蛋白质和/或肽的存在和量的分析;(c)将来自所述生物样品的一种或多种蛋白质和/或肽的存在和量与对照参考值进行比较;以及(d)将一种或多种蛋白质和/或肽的存在和量与所述受试者的诊断相关联;其中所述分析检测如本文公开的一种或多种蛋白质、肽或分类器的存在和量。
此外,公开了用于执行如本文所述的方法的试剂盒,其中该试剂盒包含:(a)用于从受试者采集样品的容器;(b)用于检测一种或多种蛋白质或肽的工具(means),或用于将所述容器转移至测试设备的工具;以及(c)书面说明书。
最后,本公开提供了用于诊断、预测、预后和/或监测结肠疾病的方法。还公开了用于诊断、预测、预后和/或监测受试者的结肠疾病或结肠直肠癌的方法,该方法包括:测量来自受试者的生物样品中选自下组的至少一种生物标志物:ACTB、ACTH、ANGT、SAHH、ALDR、AKT1、ALBU、AL1A1、AL1B1、ALDOA、AMY2B、ANXA1、ANXA3、ANXA4、ANXA5、APC、APOA1、APOC1、APOH、GDIR1、ATPB、BANK1、MIC1、CA195、CO3、CO9、CAH1、CAH2、CALR、CAPG、CD24、CD63、CDD、CEAM3、CEAM5、CEAM6、CGHB、CH3L1、KCRB、CLC4D、CLUS、CNN1、COR1C、CRP、CSF1、CTNB1、CATD、CATS、CATZ、CUL1、SYDC、DEF1、DEF3、DESM、DPP4、DPYL2、DYHC1、ECH1、EF2、IF4A3、ENOA、EZRI、NIBL2、SEPR、FBX4、FIBB、FIBG、FHL1、FLNA、FRMD3、FRIH、FRIL、FUCO、GBRA1、G3P、SYG、GDF15、GELS、GSTP1、HABP2、HGF、1A68、HMGB1、ROA1、ROA2、HNRPF、HPT、HS90B、ENPL、GRP75、HSPB1、CH60、SIAL、IFT74、IGF1、IGHA2、IL2RB、IL8、IL9、RASK、K1C19、K2C8、LAMA2、LEG3、LMNB1、MARE1、MCM4、MIF、MMP7、MMP9、CD20、MYL6、MYL9、NDKA、NNMT、A1AG1、PCKGM、PDIA3、PDIA6、PDXK、PEBP1、PIPNA、KPYM、UROK、IPYR、PRDX1、KPCD1、PRL、TMG4、PSME3、PTEN、FAK1、FAK2、RBX1、REG4、RHOA、RHOB、RHOC、RSSA、RRBP1、S10AB、S10AC、S10A8、S109、SAA1、SAA2、SEGN、SDCG3、DHSA、SBP1、SELPL、SEP9、A1AT、AACT、ILEU、SPB6、SF3B3、SKP1、ADT2、ISK1、SPON2、OSTP、SRC、STK11、HNRPQ、TAL1、TRFE、TSP1、TIMP1、TKT、TSG6、TR10B、TNF6B、P53、TPM2、TCTP、TRAP1、THTR、TBB1、UGDH、UGPA、VEGFA、VILI、VIME、VNN1、1433Z、CCR5、FUCO及其组合。
还公开了用于诊断、预测、预后和/或监测受试者的结肠疾病或结肠直肠癌的方法,该方法包括:测量来自所述受试者的生物样品中选自SPB6、FRIL、P53、1A68、ENOA、TKT及其组合的至少一种生物标志物。
公开了用于诊断、预测、预后和/或监测受试者的结肠疾病或结肠直肠癌的方法,该方法包括:测量来自所述受试者的生物样品中选自SPB6、FRIL、P53、1A68、ENOA、TKT、TSG6、TPM2、ADT2、FHL1、CCR5、CEAM5、SPON2、1A68、RBX1、COR1C、VIME、PSME3及其组合的至少一种生物标志物。
公开了用于诊断、预测、预后和/或监测受试者的结肠疾病或结肠直肠癌的方法,该方法包括:测量来自所述受试者的生物样品中选自SPB6、FRIL、P53、1A68、ENOA、TKT、TSG6、TPM2、ADT2、FHL1、CCR5、CEAM5、SPON2、1A68、RBX1、COR1C、VIME、PSME3、MIC1、STK11、IPYR、SBP1、PEBP1、CATD、HPT、ANXA5、ALDOA、LAMA2、CATZ、ACTB、AACT及其组合的至少一种生物标志物。
援引并入
本说明书中提到的所有出版物、专利和专利申请均通过引用以相同的程度并入本文,犹如特别地且单独地指出每个单独的出版物、专利或专利申请通过引用而并入。
附图说明
本公开的新颖特征在所附的权利要求书中特别地提出。通过参考以下对利用本公开原理的说明性实施方案加以阐述的详细描述以及附图,将获得对本公开的特征和优点的更好的理解,附图中:
图1A示出了显示根据实施例3A的结肠息肉生物标志物谱的预测性能的曲线图。
图1B示出了显示根据实施例3B的结肠息肉生物标志物谱的预测性能的曲线图,其中Y轴为平均真阳性率而X轴为假阳性率。
图2A示出了实施例3A的测试集性能的验证。
图2B示出了实施例3B的测试集性能的验证,其中Y轴为平均真阳性率而X轴为假阳性率。
图3示出了实施例3A的特征-频率表的帕累托图(pareto plot)。
图4示出了实施例3B的特征-频率表的帕累托图,其中Y轴为特征出现率而X轴为特征等级(feature rank)。
图5示出了显示根据实施例3A的具有较小集的结肠息肉的生物标志物谱的预测性能的曲线图。
图6示出了实施例3A的具有较小集的测试集性能的验证。
图7示出了实施例3A中组装的分类器中表示的1014个特征的质量,每个特征出现3次或更多次。
图8示出了实施例3B中组装的分类器中表示的206个特征的质量。
图9提供了供包含或排除的附加生物标志物的列表。
图10示出了显示根据实施例4的CRC的生物标志物谱的预测性能的曲线图,其中Y轴为平均真阳性率而X轴为假阳性率。
图11示出了实施例4中组装的特征-频率表的帕累托图。
图12示出了预测实施例4中组装的CRC的分类器中表示的肽片段过渡离子。
图13显示了通用计算机系统1300的各种组件的实施方案。
图14为显示了可与本公开实施方案1400结合使用的计算机系统架构的实施方案的示意图。
图15为显示了可与本公开实施方案1500结合使用的计算机网络的实施方案的示意图。
图16为显示了可与本公开实施方案1600结合使用的计算机系统架构的实施方案的示意图。
具体实施方式
I.定义
术语“结肠直肠癌状态”是指受试者的疾病状态。结肠直肠癌状态的类型的实例包括但不限于,受试者患包括结肠直肠癌在内的癌症的风险,疾病(例如,息肉或腺癌)的存在与否,患者的疾病阶段(例如,癌),和疾病治疗的疗效。
术语“质谱仪”是指测量可以转变成气相离子的质-荷(m/z)比的参数的气相离子谱仪。质谱仪通常包括离子源和质量分析器。质谱仪的实例为飞行时间(time-of-flight)、扇形磁场(magnetic sector)、四极滤质器、离子阱、离子回旋共振、静电扇形分析器以及这些的混合。“质谱法”是指使用质谱仪对气相离子的检测。
术语“串联质谱仪”是指能够进行基于m/z的离子(包括离子混合物中的离子)鉴别或测量的两个连续阶段的任何质谱仪。该词语包括具有两个质量分析器的质谱仪,该质量分析器能够空间串联地进行基于m/z的离子鉴别或测量的两个连续阶段。该词语进一步包括具有单个质量分析器的质谱仪,该质量分析器能够时间串联地进行基于m/z的离子鉴别或测量的两个连续阶段。该词语因此明确包括Qq-TOF质谱仪、离子阱质谱仪、离子阱-TOF质谱仪、TOF-TOF质谱仪、傅立叶变换离子回旋共振质谱仪、静电扇形-扇形磁场质谱仪以及它们的组合。
术语“生物芯片”是指具有附着有吸附剂的通常平坦的表面的固体基底。通常,生物芯片的表面包含多个可寻址位置,每个可寻址位置具有与其结合的吸附剂。生物芯片可适应于接合探针界面,并因此起到探针的作用。蛋白质生物芯片适应于捕获多肽并且可包含在可寻址位置附着有色谱或生物特异性吸附剂的表面。微阵列芯片通常用于DNA和RNA基因表达检测。
术语“生物标志物”是指(具有特定的表观分子量的)多肽,与取自对照受试者(例如,具有阴性诊断或检测不到结肠直肠癌的人,正常或健康的受试者,或者,例如在不同时间点来自同一个体)的类似样品相比,该多肽差异性地存在于取自患有人结肠直肠癌的受试者的样品中。术语“生物标志物”可与术语“标志物”互换使用。生物标志物可以是基因,如DNA或RNA或DNA或RNA的遗传变异,它们的结合配偶体、剪接变体。生物标志物可以是蛋白质或蛋白质片段或氨基酸序列的过渡离子,或者蛋白质氨基酸序列上的一种或多种修饰。此外,蛋白质生物标志物可以是蛋白质或蛋白质片段或氨基酸序列的过渡离子的结合配偶体。
术语“多肽”、“肽”和“蛋白质”在本文中可互换使用,意指氨基酸残基的聚合物。多肽是通过相邻氨基酸残基的羧基与氨基之间的肽键结合在一起的氨基酸的单个线性聚合物链。多肽可以例如通过加入碳水化合物、磷酸化等来修饰。
术语“免疫测定”是使用抗体来特异性地结合抗原(例如,标志物)的测定。免疫测定的特征在于使用特定抗体的特异性结合性质来分离、靶向和/或量化抗原。
术语“抗体”是指基本由一个免疫球蛋白基因或多个免疫球蛋白基因或其片段编码的、特异性结合并识别表位的多肽配体。抗体,例如作为完整的免疫球蛋白存在或作为由各种肽酶消化产生的多个良好表征的片段存在。这包括,例如Fab”和F(ab)”2片段。如本文所用的,术语“抗体”还包括通过整个抗体的修饰产生的抗体片段或使用重组DNA方法从头合成的抗体片段。它还包括多克隆抗体、单克隆抗体、嵌合抗体、人源化抗体或单链抗体。抗体的“Fc”部分是指免疫球蛋白重链的包含一个或多个重链恒定区结构域但不包含重链可变区的部分。
术语“肿瘤”是指可由癌性或非癌性细胞形成的、固体或液体填充的病变。术语“肿块”和“结节”经常与“肿瘤”同义使用。肿瘤包括恶性肿瘤或良性肿瘤。恶性肿瘤的实例可以是已知包含转化细胞的癌。
术语“息肉”是指从粘膜凸出的组织异常生长。如果它通过狭长的柄附接至表面,则它被称为有蒂息肉。如果不存在柄,则它被称为无蒂息肉。息肉可以是恶性的、癌变前的或良性的。息肉可通过各种程序如手术或者例如在结肠镜检查期间采用息肉切除术而除去。
术语“腺瘤性息肉”或“腺瘤”在本文中可互换使用,意指在结肠内衬(lining)上生长并具有增加的癌症风险的息肉。腺瘤性息肉被认为是恶变前的;然而,一些可能发展成结肠癌。管状腺瘤是腺瘤性息肉中最常见的并且它们是最不可能发展成结肠癌的结肠息肉。管状绒毛状腺瘤是另一种类型。绒毛状腺瘤是尺寸通常大于其他两种类型的腺瘤的第三种类型,且它们在所有息肉中具有最高的发病率和死亡率。
术语“结合配偶体”是指分子对——通常是表现出特异性结合的生物分子对。蛋白质-蛋白质相互作用可发生在两个或更多个蛋白质之间,当蛋白质结合在一起时,它们通常行使它们的生物功能。蛋白质间的相互作用对大多数生物功能至关重要。例如,来自细胞外部的信号通过信号分子的蛋白质-蛋白质相互作用,经由配体和受体蛋白质被介导至该细胞的内部。例如,分子结合配偶体包括但不限于受体和配体、抗体和抗原、生物素和抗生物素蛋白等。
术语“对照参考”是指已知的稳态分子或非患病健康状态,其在其中用作相对标志物以研究波动或比较非稳态分子或正常非患病健康状况,或者它也可以用于对值进行校准或归一化。在各个实施方案中,对照参考值是由多个因素的组合或因素范围的组合如生物标志物浓度的组合或浓度范围的组合计算的值。
术语“受试者”、“个体”或“患者”在本文中可互换使用,其指脊椎动物,优选哺乳动物,更优选人。哺乳动物包括但不限于鼠类、猿、家畜、竞技动物以及宠物。具体的哺乳动物包括大鼠、小鼠、猫、狗、猴子和人。非人类哺乳动物包括除人之外的所有哺乳动物。在体外获得或在体外培养的生物实体的组织、细胞及其后代也涵盖在内。
术语“体内”是指发生在受试者身体内的事件。
术语“体外”是指发生在受试者身体之外的事件。例如,体外测定包括在受试者之外进行测定的任何测定。体外测定涵盖采用活细胞或死细胞的基于细胞的测定。体外测定还涵盖不采用完整细胞的无细胞测定。
术语“测量”意指包括检测样品中的标志物的存在与否、量化样品中的标志物的量和/或定性生物标志物的类型的方法。测量可以通过本领域中已知的方法和本文进一步描述的方法来完成,这些方法包括但不限于质谱法和免疫测定法或可用于检测和测量本文所述的一种或多种标志物的任何合适的方法。
术语“检测”是指鉴定待检测的物体的存在、不存在或量。非限制性实例包括但不限于DNA分子、蛋白质、肽、蛋白质复合物、RNA分子或代谢物的检测。
术语“差异性存在”是指在取自受试者的样品中存在的标志物与对照参考或对照非患病健康受试者相比在量和/或频率上的差异。标志物可以在量、频率或这两个方面差异性存在。
术语“监测”是指记录连续变化参数的改变。
术语“诊断的”或“诊断”在本文中可互换使用,意指鉴定病理状况的存在或性质,或病理状况的亚型,即结肠息肉的存在或风险。诊断方法在它们的灵敏度和特异性上不同。诊断方法可不提供状况的确诊;然而,如果该方法提供了有助于诊断的正向指示,那就足够了。
术语“预后”在本文中用来指疾病或疾病进展(包括复发和治疗反应)的可能性的预测。
术语“预测”在本文中用来指患者将具有特定临床结果(无论是阳性还是阴性)的可能性。本公开的预测方法可以在临床上用来通过为任何特定患者选择最合适的治疗方式来作出治疗决定。
术语“报告”是指由本公开的方法提供给医师的不确定的或必要时为确定的打印结果。该报告可指示病理状况的存在、性质或风险。该报告还可指示什么样的治疗是最合适的;例如,不处理、手术、进一步测试或施用治疗剂。
II.总体概述
用于诊断疾病、疾病预后和预测对疾病的药物反应的生物标志物谱的开发对于医学界可能是有用的。
本公开提供了通过使用各种测定外加由受计算机可读介质指示的处理器执行的算法以确定生物标志物来分析来自个体的复杂生物样品的方法、组合物、系统和试剂盒,该生物标志物指示临床状态或健康的恶化或改善。通常,该方法使用来自生物系统的多个分子生物学水平(例如,多核苷酸(DNA或RNA)、多肽和代谢物水平)的多种分子来鉴定疾病如结肠癌、结肠息肉和预期的各种结肠直肠疾病的生物标志物或生物标志物谱。
本公开还提供了可用于诊断、预测、预后或监测个体的结肠息肉或结肠癌的存在或从其恢复的生物标志物和系统。
本公开还提供了商业化诊断试剂盒,其通常将包括用于检测本文所提供的生物标志物的组合物、说明以及指示个体的结肠息肉或结肠癌的诊断、预测、预后、存在或从其恢复的报告。由该报告提供的临床预测或状态可指示,例如,尚未在临床上表现出结肠息肉或癌的个体在某一时间段内或者在给定年龄下,受试者将患有临床上表现的结肠息肉和结肠癌的可能性、几率或风险。
III.方法
本公开提供了使用通过质谱法获得的数据,基于蛋白质组和/或基因组模式的医学诊断方法。该方法允许基于患者的蛋白质组和/或基因组模式按照患者的疾病阶段对患者进行分类。
结肠直肠癌,也被称为结肠癌、直肠癌或肠癌,是由结肠或直肠中的不受控的细胞生长而导致的癌症。此外,本公开提供了用于结肠息肉和结肠直肠癌的医学诊断的新的生物标志物。
结肠息肉为在大肠或结肠的内衬上形成的细胞良性块。几乎所有的息肉最初都是非恶性的。然而,随着时间的推移,一些可能变成癌性病变。大部分结肠息肉的原因是未知的,但它们常见于成人中。由于结肠息肉是无症状的,因此建议定期筛查结肠息肉。当前,用于筛查息肉的方法是高度侵入性的且昂贵的。因此,尽管结肠镜检查筛查在预防和减少结肠癌方面存在益处,但被建议该程序的许多人拒绝进行此筛查,主要是因为担心成本、不适和不良事件。这类人仅在美国就有数千万人。
有助于对患者具有存在结肠息肉、腺瘤或癌性肿瘤如癌的较高风险的可能性进行分类的分子测试可帮助医师指导患者关于抗拒进行结肠镜检查的态度和行为。增加的结肠镜检查筛查依从性将导致早期检测出癌症或癌变前腺瘤,并减少与结肠癌相关的发病率和死亡率。
本公开提供了侵入性低于结肠镜检查并且将确定个体的蛋白质表达指纹或谱的蛋白质生物标志物测试。在本公开的一些应用中,基于所预测的个体的息肉状态和/或患有结肠息肉或结肠癌的风险的可能性而生成报告。因此,本公开提供了提供关于个体的结肠息肉状态和/或患有结肠息肉或结肠癌的风险的信息的方法、试剂盒、组合物和系统。
在本公开的一个方面,已通过基于LCMS的程序鉴定出一组基于蛋白质的分类器(例如,生物标志物谱),该程序能够预测关于患者的结肠息肉、腺瘤或癌的存在与否的结肠镜检查程序结果。
在本公开的一个方面,已使用基于LCMS的方法来鉴定基于血浆-蛋白质的分子特征,该分子特征可包含鉴别更可能患有息肉、腺瘤或肿瘤的患者的一个或多个分类器。
在本公开的一个方面,分类器用于确定哪些个体不可能患有息肉、腺瘤或肿瘤,并因此可能无需进行结肠镜检查。
在本公开的一个方面,分类器用于通过比较程序之前与之后的分类器值来测量结肠镜检查期间疑似息肉去除的完成度。
在本公开的一个方面,在定期筛查结肠镜检查之间的间隔期间使用分类器来捕捉所谓的间期疾病(interval disease)。
在本公开的一个方面,分类器用于增加具有升高的风险谱的患者的连续结肠镜检查之间的时间。具有升高的风险谱的患者的实例可包括先前进行过息肉切除术或其他病理操作的患者。
本公开提供了在从完整蛋白质衍生的特定片段的大小和序列以及沿全蛋白质多肽链发生酶切(例如,胰蛋白酶消化等)的位置(其为结肠的病变状态的特征)方面生成和分析血液蛋白质片段谱的方法。
预期本公开提供的方法、试剂盒、组合物和系统还可根据应用全部或部分自动化。
A.基于算法的方法
本公开提供了用于预测结肠息肉或结肠癌患者的临床结果的基于算法的诊断测定。可单独使用一种或多种蛋白质生物标志物的表达水平或将其设置成功能子集来计算可用于预测临床结果的可能性的定量得分。
本公开的“生物标志物”或“标志物”可以是具有特定表观分子量的多肽,基因如DNA或RNA或DNA或RNA的遗传变异,它们的结合配偶体,剪接变体。生物标志物可以是蛋白质或蛋白质片段或氨基酸序列的过渡离子,或者蛋白质氨基酸序列上的一个或多个修饰。此外,蛋白质生物标志物可以是蛋白质或蛋白质片段或氨基酸序列的过渡离子的结合配偶体。
通过实施本公开方法提供的基于算法的测定和相关信息促进了对表现出结肠肿瘤的患者的最佳治疗决策制定。例如,这样的临床工具将使医师能够鉴定具有患息肉或癌的低可能性并因此无需抗癌治疗的患者,或具有患侵袭性癌症的高可能性并因此将需要抗癌治疗的患者。
可通过应用特定算法来确定定量得分。在本文公开的方法中用于计算定量得分的算法可对一种生物标志物或成组生物标志物的表达水平值进行分组。此外,特定一组生物标志物的形成可促进生物标志物或生物标志物子集(例如分类器)的各个表达水平对定量得分的贡献的数学权重。本公开提供了用于计算定量得分的各种算法。
B.数据的归一化
在本文公开的方法中使用的表达数据可进行归一化。归一化是指对例如所测定的基因的量或蛋白质水平的差异以及所用模板的质量的可变性进行校正,以除去在处理和检测基因或蛋白质表达中涉及的不期望的系统变异测量来源的过程。其他的系统变异来源可归因于实验室处理条件。
在一些情况下,归一化方法可用于实验室处理条件的归一化。可与本公开的方法一起使用的实验室处理的归一化的非限制性实例包括但不限于:解释在数据生成过程中使用的仪器、试剂和设备之间的系统性差异,和/或在数据采集中的日期和时间或时间消逝。
测定可通过并入某些归一化的标准基因或蛋白质的表达来提供归一化,这些归一化的标准基因或蛋白质在相关条件下在表达水平上无显著不同,也就是说,在该特定样品类型中,它们已知具有稳定且一致的表达水平。可在本公开中使用的合适的归一化基因和蛋白质包括持家基因。(参见,例如E.Eisenberg等人,Trends in Genetics19(7):362-365(2003))。在一些应用中,归一化的生物标志物(基因和蛋白质),也被称为参考基因,已知与无结肠息肉的患者相比,不表现出结肠息肉或癌症的在意义上不同的表达水平。在一些应用中,添加可被使用并代表具有已知性质的实体的稳定同位素标记的标准物以用于数据归一化可能是有用的。在其他应用中,标准的固定化样品可与每个分析批次一起进行测量,以解释仪器和日常测量的可变性。
在一些应用中,诊断、预后和预测基因可相对于至少2、3、4、5、6、7、8、9、10、15、20、25、30、40或50个或更多个参考基因和蛋白质的平均值进行归一化。归一化可基于所有测定的生物标志物的信号平均值或中值或通过整体生物标志物归一化方法来进行。本领域技术人员将认识到,可以采用许多种方式来实现归一化,并且上述技术仅旨在示例。
C.数据的标准化
在本文公开的方法中使用的表达数据可以被标准化。标准化是指有效地将所有基因置于可比标度上的过程。因一些基因将比其他基因表现出更多的变异(更广范围的表达)而进行该过程。标准化通过将每个表达值除以其在该基因或蛋白质的所有样品中的标准差来进行。
D.临床结果得分
用于亚选择鉴别性生物标志物和用于构建分类模型的机器学习算法的使用可用于确定临床结果得分。这些算法包括但不限于,弹性网络、随机森林、支持向量机和逻辑回归。这些算法可对重要的生物标志物特征进行磨砺(hone in)并将基础测量值转换成与例如临床结果、疾病风险、治疗反应和/或疾病状态的分类相关的得分或概率。
在一些应用中,定量得分的增加指示不良临床结果、良好临床结果、疾病的高风险、疾病的低风险、完全反应、部分反应、病情稳定、无反应和为疾病管理推荐的治疗的可能性的增加。在一些应用中,定量得分的降低指示不良临床结果、良好临床结果、疾病的高风险、疾病的低风险、完全反应、部分反应、病情稳定、无反应和为疾病管理推荐的治疗的可能性的增加。
在一些应用中,来自患者的与参考谱类似的生物标志物谱指示不良临床结果、良好临床结果、疾病的高风险、疾病的低风险、完全反应、部分反应、病情稳定、无反应和为疾病管理推荐的治疗的可能性的增加。在一些应用中,来自患者的与参考谱不同的生物标志物谱表明不良临床结果、良好临床结果、疾病的高风险、疾病的低风险、完全反应、部分反应、病情稳定、无反应和为疾病管理推荐的治疗的可能性的增加。
在一些应用中,一个或多个生物标志物阈值的增加指示不良临床结果、良好临床结果、疾病的高风险、疾病的低风险、完全反应、部分反应、病情稳定、无反应和为疾病管理推荐的治疗的可能性的增加。在一些应用中,一个或多个生物标志物阈值的降低指示不良临床结果、良好临床结果、疾病的高风险、疾病的低风险、完全反应、部分反应、病情稳定、无反应和为疾病管理推荐的治疗的可能性的增加。
在一些应用中,定量得分、一个或多个生物标志物阈值、类似的生物标志物谱值或其组合的增加指示不良临床结果、良好临床结果、疾病的高风险、疾病的低风险、完全反应、部分反应、病情稳定、无反应和为疾病管理推荐的治疗的可能性的增加。在一些应用中,定量得分、一个或多个生物标志物阈值、类似的生物标志物谱值或其组合的降低指示不良临床结果、良好临床结果、疾病的高风险、疾病的低风险、完全反应、部分反应、病情稳定、无反应和为疾病管理推荐的治疗的可能性的增加。
E.样品制备和处理
在分析样品之前,可能期望对样品进行一个或多个样品制备操作。通常,这些样品制备操作可包括,如从细胞或组织提取和分离细胞内物质等操作,例如,从样品提取核酸、蛋白质或其他大分子。
可与本公开的方法一起使用的样品制备包括但不限于,离心、亲和色谱法、磁分离、免疫测定、核酸分析、基于受体的测定、细胞计数测定、比色测定、酶测定、电泳分析、电化学测定、光谱测定、色谱测定、显微检测、地形分析(topographic assay)、量热分析、放射性同位素测定、蛋白质合成分析、组织学测定、培养试验以及它们的组合。
样品制备可进一步包括用合适的溶剂和量进行稀释,以确保适当的浓度水平范围通过给定的测定法能检测到。
从样品的细胞内空间接近核酸和大分子通常可通过物理、化学方法或二者的组合来进行。在该方法的一些应用中,在分离粗提取物后,通常期望分离核酸、蛋白质、细胞膜颗粒等。在该方法的一些应用中,期望将核酸与其蛋白质和细胞膜颗粒保持在一起。
在本文提供的方法的一些应用中,可在使用本公开的方法进行分析之前,从生物样品中提取核酸和蛋白质。提取可通过包括但不限于使用去污剂裂解物、超声处理或采用玻璃珠涡旋的手段进行。
在一些应用中,分子可以使用本领域中适合的任何技术进行分离,该技术包括但不限于,使用梯度离心(例如,氯化铯梯度、蔗糖梯度、葡萄糖梯度等)、离心方案、沸腾、纯化试剂盒以及使用采用试剂提取方法(如使用Trizol或DNAzol的方法)的液体提取的技术。
可根据期望的检测方法,基于标准生物样品制备法制备样品。例如对于质谱法检测,可以对从患者获得的生物样品进行离心、过滤、通过免疫亲和柱的处理、分离成级分、部分消化以及它们的组合。各种级分可再悬浮于适当的载体中,如缓冲液或用于检测和分析的其他类型的上样溶液,包括LCMS上样缓冲液。
F.检测方法
本公开提供了用于检测生物样品中的生物标志物的方法。生物标志物可包括但不限于,蛋白质、代谢物、DNA分子和RNA分子。更具体地,本公开基于在患有结肠息肉或可能发展结肠息肉的受试者中差异性表达的蛋白质生物标志物的发现。因此,生物样品中这些差异性表达的生物标志物中的一种或多种的检测提供了关于受试者是否处于结肠息肉的风险下或患有结肠息肉以及该状况的性质或状态的类型的有用信息。任何合适的方法可用于检测本文所述的一种或多种生物标志物。
可在本公开中使用的有用的分析物捕获剂包括但不限于,抗体,如含有抗体的粗血清、纯化的抗体、单克隆抗体、多克隆抗体、合成抗体、抗体片段(例如,Fab片段);抗体相互作用剂,如蛋白A、碳水化合物结合蛋白质和其他相互作用物;蛋白质相互作用物(例如,抗生物素蛋白及其衍生物);肽;以及小化学实体,如酶底物、辅因子、金属离子/螯合物和半抗原。可对抗体进行修饰或化学处理,以优化与靶标或固体表面(例如,生物芯片和柱)的结合。
在本公开的一个方面,可以使用免疫测定在生物样品中检测生物标志物。免疫测定是使用特异性结合至或识别抗原(例如,蛋白质或肽上的位点,即生物标志物靶标)的抗体的测定。该方法包括以下步骤:使生物样品与抗体接触,并使该抗体与样品中的抗原形成复合物,洗涤该样品并用检测试剂检测抗体-抗原复合物。在一个实施方案中,识别生物标志物的抗体可以是市售的。在另一个实施方案中,识别生物标志物的抗体可以通过已知的抗体产生方法生成。
或者,可以使用间接测定法检测样品中的标志物,其中,例如使用标记的第二抗体来检测结合的标志物-特异性抗体。示例性的可检测标记物包括磁珠(例如,DYNABEADSTM)、荧光染料、放射性标记物、酶(例如,辣根过氧化物、碱性磷酸酶以及其他常用的酶)和量热标记物,如胶体金或有色玻璃或塑料珠。可以使用竞争或抑制试验和/或在竞争或抑制试验中检测样品中的标志物,其中,例如,与标志物的不同表位结合的单克隆抗体与该混合物同时孵育。
使用免疫测定检测抗原的条件将取决于所用的特定抗体。而且,孵育时间将取决于测定形式、标志物、溶液体积、浓度等。尽管根据所用的抗体,免疫测定可以在诸如10摄氏度到40摄氏度的温度范围进行,但通常免疫测定将在室温下进行。
存在本领域中已知的多种类型的免疫测定,其作为起始基础可用于对该测定进行调整以用于检测本公开的生物标志物。有用的测定可包括,例如,酶免疫测定(EIA),诸如酶联免疫吸附测定(ELISA)。存在这些方法的许多变化形式,但这些变化形式都是基于类似的理念。例如,如果抗原可与固体支持物或表面结合,则它可通过使其与特异性抗体反应进行检测,并且该抗体可通过使其与第二抗体反应或者通过将标记物直接引入第一抗体来进行定量。或者,抗体可与固体表面和添加的抗原结合。随后,可添加并检测识别抗原上的不同表位的第二抗体。这通常称为“夹心法测定(sandwich assay)”并通常可用于避免高背景或非特异性反应的问题。这些类型的测定具有足以测定生物样品中低浓度的抗原的灵敏性和重现性。
免疫测定可用于确定样品中标志物的存在与否以及样品中的标志物的量。用于测量抗体-标志物复合物的量或存在的方法包括但不限于,荧光法、发光法、化学发光法、吸光度法、反射率法、透射率法、双折射法或折射率法(例如,表面等离子体共振、椭圆测量法、共振镜法、光栅耦合器波导法或干涉法)。通常,这些试剂与光学检测方法如各种形式的显微术、成像方法和非成像方法一起使用。电化学方法包括伏安法和安培法。射频法包括多极共振光谱法。
在一个方面,本公开可使用抗体来检测生物标志物。可以使抗体与该测定的生物标志物特异性结合,这样的抗体可使用本领域中已知的标准方法来制备。例如,多克隆抗体可通过将抗原注射至诸如小鼠、大鼠、兔、山羊、绵羊或马等哺乳动物来产生,以用于产生大量抗体。从这些动物中分离的血液含有多克隆抗体——与相同抗原结合的多种抗体。或者,多克隆抗体可以通过将抗原注射至鸡以便在蛋黄中产生多克隆抗体来产生。此外,可以使抗体特异性识别生物标志物的修饰形式,如生物标志物的磷酸化形式,也就是说,它们将识别磷酸化后的酪氨酸或丝氨酸,但在不存在磷酸的情况下不识别。这样,抗体可用于确定特定生物标志物的磷酸化状态。
抗体可商购获得或使用已确立的方法产生。为了获得对抗原的单个表位具有特异性的抗体,从动物中分离分泌抗体的淋巴细胞并通过将它们与癌细胞系融合而永生化。该融合的细胞被称为杂交瘤,并将在培养中持续生长并分泌抗体。单个杂交瘤细胞通过稀释克隆以生成均产生相同抗体的细胞克隆来分离;这些抗体被称为单克隆抗体。
多克隆和单克隆抗体可以采用若干种方式进行纯化。例如,可以使用抗原亲和色谱法分离抗体,该抗原亲和色谱法与细菌蛋白质如蛋白A、蛋白G、蛋白L或重组融合蛋白、蛋白A/G偶联,随后通过280nm处的紫外线吸光度来检测洗脱物级分,以确定哪些级分含有所述抗体。蛋白A/G与人IgG的所有亚类结合,从而使它对于纯化其亚类尚未确定的多克隆或单克隆IgG抗体是有用的。另外,它与IgA、IgE、IgM和(在较小程度上)IgD结合。蛋白A/G还与小鼠IgG的所有亚类结合但不结合小鼠IgA、IgM或血清白蛋白。这一特征使得蛋白A/G用于纯化和检测小鼠单克隆IgG抗体,而不受IgA、IgM和血清白蛋白的干扰。
抗体可来源于分子的不同类别或同种型,如IgA、IgA IgD、IgE、IgM和IgG。将IgA设计成用于在体液中分泌,而将其他抗体如IgM设计成在细胞表面上表达。在生物研究中最有用的抗体是IgG类别——被制备并分泌并可识别特异性抗原的蛋白质分子。IgG包含两个亚基,包括两个“重”链和两个“轻”链。它们组装成对称结构且每个IgG具有两个相同的抗原识别域。该抗原识别域为来自重链和轻链的氨基酸的组合。该分子的形状大致类似于“Y”,且该分子的臂/尖端包含抗原识别区或Fab(片段,抗原结合)区,而Fc(片段,可结晶)区的茎不参与识别并且相当恒定。恒定区在相同同种型的所有抗体中相同,但在不同同种型的抗体中不同。
也可以在通过Western印迹法分级分离之后,使用抗体来检测蛋白质。在一个方面,本公开可使用Western印迹法来检测生物标志物。Western印迹法(蛋白质免疫印迹)是用于检测给定样品或来自样品的蛋白质提取物中的特异性蛋白质的分析技术。它使用凝胶电泳(SDS-PAGE)根据蛋白质的三维结构来分离任一天然蛋白质,或者它可在变性条件下运行以根据蛋白质长度来分离蛋白质。通过凝胶电泳分离后,随后将蛋白质转移到膜(通常为硝酸纤维素或PVDF)上。然后,可将从SDS-PAGE转移到膜上的蛋白质与特定抗体在轻柔搅拌下一起孵育,漂洗以除去非特异性结合物,并且与印迹结合的蛋白质-抗体复合物可使用一步或两步检测法进行检测。一步法包括既识别感兴趣的蛋白质又包含可检测标记物的探针抗体,探针通常对已知的蛋白质标签是可用的。两步检测法包含具有报道酶或与其结合的报道分子的第二抗体。采用适当的参考对照,这种方法可用于测量蛋白质的丰度。
在一个方面,本公开的方法可使用流式细胞术。流式细胞术是可用于生物标志物的检测、定量(细胞计数)和细胞分离的基于激光的生物物理技术。该技术常规用于健康病症,尤其是血癌的诊断。在通常情况下,流式细胞术通过下列步骤工作:将单细胞悬浮在液体流中,将单波长光束(通常为激光)导向至液体流上,并由电子检测装置检测由穿过细胞而引起的散射光。荧光激活细胞分选(FACS)是专业型的流式细胞术,其通常借助于荧光标记的抗体来检测细胞上感兴趣的抗原。这一在FACS中使用抗体标记的附加特征提供了基于特定的光散射和每个细胞的荧光特性对荧光标记的细胞的同时多参数分析和定量,并且它提供了感兴趣的细胞群体的物理分离以及传统流式细胞术所实现的那些。
很多种荧光团可用作流式细胞术中的标记物。荧光团通常附接至识别细胞之上或之内的靶特征的抗体。合适的荧光标记物的实例包括但不限于:荧光素(FITC),5,6-羧甲基荧光素,德克萨斯红(Texasred),硝基苯-2-氧杂-1,3-二唑-4-基(NBD),以及花青染料Cy3、CY3.5、Cy5、Cy5.5和Cy7。其他荧光标记物如Alexa染料、DNA内容物染料如DAPI、Hoechst染料是本领域中公知的,并且均可从多个商业来源容易地获得。每个荧光团具有特征峰激发和发射波长,并且发射光谱通常重叠。这些荧光标记物的吸收和发射最大值分别为:FITC(490nm;520nm)、Cy3(554nm;568nm)、Cy3.5(581nm;588nm)、Cy5(652nm;672nm)、Cy5.5(682nm;703nm)和Cy7(755nm;778nm),因此选择不具有很多光谱重叠的荧光标记物允许它们的同时检测。荧光标记物可以从多个商业来源获得。可区分的荧光标记物的最大数目被认为是约17或18种不同的荧光标记物。这个水平的复杂读出需要进行费时费力的优化以限制伪迹,以及进行复杂的反卷积算法以分离重叠的光谱。量子点因其较窄的发射峰而有时用来代替传统的荧光团。可用于检测的其他方法包括同位素(如镧系元素的同位素)标记的抗体。然而,该技术最终破坏细胞,从而阻止对其回收用于进一步的分析。
在一个方面,本公开的方法可以使用免疫组织化学法来检测本公开的生物标志物的表达水平。因此,使用对每个标志物具有特异性的抗体来检测组织样品中所请求保护的生物标志物的表达。该抗体可通过抗体本身的直接标记,例如用放射性标记物、荧光标记物、半抗原标记物如生物素或酶(如辣根过氧化物酶或碱性磷酸酶)标记来检测。或者,将未标记的第一抗体与标记的第二抗体结合使用,该第二抗体包含对第一抗体具有特异性的抗血清、多克隆抗血清或单克隆抗体。免疫组织化学方案是本领域公知的,并且方案和抗体可商购获得。或者,可制备针对如本文公开的生物标志物或生物标志物的修饰形式或结合配偶体的抗体,其对于确定组织样品中的表达水平将是有用的。
在一个方面,本公开的方法可使用生物芯片。生物芯片可用于筛选大量大分子。在该技术中,大分子以有序的阵列形式附着到生物芯片的表面。测试区的网格图案允许由成像软件进行分析,以快速且同时量化在分析物的预定位置(地址)处的单个分析物。CCD相机是能够准确地检测并量化芯片上的非常低水平的光的灵敏且高分辨率的传感器。
生物芯片可采用固定的核酸分子、全长蛋白质、抗体、亲和体(affibodies)(被工程化为模拟单克隆抗体的小分子)、适体(基于核酸的配体)或化学化合物进行设计。芯片可被设计用于在一个芯片上检测多种大分子类型。例如,芯片可被设计用于在一个芯片上检测核酸分子、蛋白质和代谢物。生物芯片用于并被设计成同时分析单个样品中的一组生物标志物,从而产生这些生物标志物的受试者谱。生物芯片的使用允许进行多个分析,从而减少了总处理时间和所需样品的量。
蛋白质微阵列是可在本公开中使用的特定类型的生物芯片。该芯片包含支持表面如载玻片、硝酸纤维素膜、珠子或微量滴定板,捕获蛋白质阵列以阵列的形式结合到固体表面上。蛋白质阵列检测方法必须提供高信号和低背景。将通常用荧光染料标记的检测探针分子添加至阵列。探针与固定的蛋白质之间的任何反应发射出可由激光扫描仪读取的荧光信号。此类蛋白质微阵列是快速、自动化的,并为诊断试验提供高灵敏度的蛋白质生物标志物读出。然而,本领域技术人员将立即理解它们是可与该技术一起使用的多种检测方法。
存在至少三种类型的当前用于研究蛋白质的生物化学活性的蛋白质微阵列。例如,存在分析微阵列(也称为捕获阵列)、功能性蛋白质微阵列(也称为靶蛋白质阵列)和反相蛋白质微阵列(RPA)。
本公开提供了使用分析型蛋白质微阵列对生物标志物的检测。分析型蛋白质微阵列使用抗体、适体或亲和体的文库来构建。该阵列用复杂蛋白质溶液如血液、血清或细胞裂解物进行探查,该复杂蛋白质溶液通过捕获与其特异性结合的蛋白质分子而起作用。使用各种检测系统对所产生的结合反应的分析可提供关于样品中的特定蛋白质的表达水平以及结合亲和性和特异性的测量的信息。这种类型的蛋白质微阵列在比较不同样品中的蛋白质表达方面是特别有用的。
在一个方面,本公开的方法可以使用功能性蛋白质微阵列,该功能性蛋白质微阵列通过固定大量的纯化的全长功能性蛋白质或蛋白质结构域而构建,并用于鉴定蛋白质-蛋白质、蛋白质-DNA、蛋白质-RNA、蛋白质-磷脂和蛋白质-小分子相互作用,以测定酶活性以及检测抗体并证明抗体的特异性。这些蛋白质微阵列生物芯片可用于研究样品中的整个蛋白质组的生化活性。
在一个方面,本公开的方法可使用反相蛋白质微阵列(RPA)。反相蛋白质微阵列由排列到该微阵列上的组织和细胞裂解物构建,并用针对感兴趣的靶蛋白质的抗体来探查。这些抗体通常用化学发光、荧光或比色测定法进行检测。除了裂解物中的蛋白质外,也将参考对照肽打印在载玻片上,以允许蛋白质定量。RPA允许确定改变的蛋白质或可能是疾病的结果并存在于病变细胞中的其他物质的存在。
本公开提供了使用质谱分析法(或者称为质谱法)对生物标志物的检测。质谱法(MS)是测量带电粒子的质荷比的分析技术。它主要用于确定样品或分子的元素组成,并用于解释分子如肽和其他化学化合物的化学结构。MS通过电离化学化合物以产生带电分子或分子片段并测量它们的质荷比而工作。MS仪器通常由以下三个模块组成:(1)离子源,其可将气相样品分子转化为离子(或者,在电喷雾电离的情况下,使溶液中存在的离子移动至气相中);(2)质量分析器,其通过施加电磁场根据离子的质量对其进行分选;以及(3)检测器,其测量指标量(indicator quantity)的值并由此提供数据以供计算存在的每个离子的丰度。
将在本公开中使用的合适的质谱方法包括但不限于以下方法中的一种或多种:电喷雾电离质谱法(ESI-MS)、ESI-MS/MS、ESI-MS/(MS)n、基质辅助激光解吸电离飞行时间质谱法(MALDI-TOF-MS)、表面增强激光解吸/电离飞行时间质谱法(SELDI-TOF-MS)、串联液相色谱-质谱(LC-MS/MS)质谱法、硅上解吸/电离(DIOS)、二次离子质谱法(SIMS)、四极杆飞行时间(Q-TOF)、大气压化学电离质谱法(APCI-MS)、APCI-MS/MS、APCI-(MS)、大气压光电离质谱法(APPI-MS)、APPI-MS/MS和APPI-(MS)n、四极杆质谱法、傅立叶变换质谱法(FTMS)和离子阱质谱法,其中n是大于零的整数。
为了深入了解样品的基础蛋白质组,通常使用LC-MS来解析复杂混合物的组分。LC-MS方法通常包括蛋白酶消化和变性(通常涉及蛋白酶如胰蛋白酶,和变性剂,如用于使三级结构变性的尿素和用于为半胱氨酸残基加帽的碘乙酰胺),随后进行具有肽质量指纹分析的LC-MS或LC-MS/MS(串联MS)以获得单个肽的序列。LC-MS/MS最常用于复杂样品的蛋白质组分析,其中即使采用高分辨率质谱仪,肽质量仍可能重叠。复杂生物流体如人血清的样品可首先在SDS-PAGE凝胶或HPLC-SCX上分离并随后在LC-MS/MS中运行,以允许鉴定超过1000种蛋白质。
尽管多种质谱方法可与本文所提供的方法一起使用,但在一些应用中,可能期望量化生物样品中来自所选的感兴趣的蛋白质子集中的蛋白质。可在本公开中使用的一种这样的MS技术是多重反应监测质谱法(MRM-MS),或者可替代地被称为选择反应监测质谱法(SRM-MS)。
MRM-MS技术使用三重四极杆(QQQ,triple quadrupole)质谱仪来从感兴趣的肽中选择带正电荷的离子,使带正电荷的离子片段化,并随后测量所选带正电荷的片段离子的丰度。这种测量方法通常被称为过渡法(transition)。例如,从该方法得到的过渡离子参见表1。
在一些应用中,MRM-MS与高压液相色谱法(HPLC)和最近的超高压液相色谱法(UHPLC)耦合。在其他应用中,MRM-MS与采用QQQ质谱仪的UHPLC耦合,以对所有感兴趣的肽和蛋白质进行所需的LC-MS过渡测量。
在一些应用中,可使用四极杆飞行时间(qTOF)质谱仪、飞行时间-飞行时间(TOF-TOF)质谱仪、轨道阱质谱仪、四极杆轨道阱质谱仪或任何四极杆离子阱质谱仪从一种或多种感兴趣的肽中选择带正电荷的离子。然后,可测量片段化的带正电荷的离子来确定带正电荷的离子的丰度以用于量化感兴趣的肽或蛋白质。
在一些应用中,可使用飞行时间(TOF)、四极杆飞行时间(qTOF)质谱仪、飞行时间-飞行时间(TOF-TOF)质谱仪、轨道阱质谱仪或四极杆轨道阱质谱仪来测量来自未片段化的感兴趣的蛋白质的带正电荷的肽离子的质量和丰度,以供定量。在本申请中,分析物质量测量的准确度可用作测定的选择标准。具有已知组成和浓度的同位素标记的内标物可用作质谱定量方法的一部分。
在一些应用中,可使用飞行时间(TOF)、四极杆飞行时间(qTOF)质谱仪、飞行时间-飞行时间(TOF-TOF)质谱仪、轨道阱质谱仪或四极杆轨道阱质谱仪来测量感兴趣的蛋白质的质量和丰度以供定量。在本申请中,分析物质量测量的准确度可用作测定的选择标准。任选地,本申请在通过质谱法分析之前,可使用蛋白质的蛋白水解消化。具有已知组成和浓度的同位素标记的内标物可用作质谱定量方法的一部分。
在一些应用中,各种电离技术可与本文提供的质谱仪耦合,以产生所需的信息。可与本公开一起使用的非限制性的示例性电离技术包括但不限于:基质辅助激光解吸电离(MALDI)、解吸电喷雾电离(DESI)、直接辅助实时(DART)、表面辅助激光解吸电离(SALDI)或电喷雾电离(ESI)。
在一些应用中,HPLC和UHPLC可与质谱仪耦合。在质谱分析前,可进行多种其他肽和蛋白质分离技术。可用于从基质背景中分离所需分析物(例如,肽或蛋白质)的一些示例性分离技术包括但不限于,蛋白质或肽的反相液相色谱法(RP-LC)、MALDI前的离线液相色谱法(LC)、一维凝胶分离、二维凝胶分离、强阳离子交换(SCX)色谱法、强阴离子交换(SAX)色谱法、弱阳离子交换(WCX)和弱阴离子交换(WAX)。在质谱分析前可使用上述技术中的一种或多种。
在本公开的一个方面,可使用微阵列检测生物样品中的生物标志物。还可以使用微阵列技术鉴定或确认差异性基因表达。因此,可使用微阵列技术测量新鲜或固定的组织中的表达谱生物标志物。在该方法中,将感兴趣的多核苷酸序列(包括cDNA和寡核苷酸)铺在或排列在微芯片基底上。随后,将排列的序列与来自感兴趣的细胞或组织的特异性DNA探针杂交。mRNA的来源通常是从生物样品中分离的总RNA,并且可使用相应的正常组织或细胞系来确定差异性表达。
在微阵列技术的具体实施方案中,将PCR扩增的cDNA克隆插入物以密集阵列形式施加至基底。优选将至少10,000个核苷酸序列施加至基底。以每个基底10,000个元件固定在微芯片上的微阵列基因适于严格条件下的杂交。荧光标记的cDNA探针可通过经由从感兴趣组织中提取的RNA的逆转录掺入荧光核苷酸而产生。施加至芯片的标记的cDNA探针与阵列上的每个DNA位点特异性地杂交。严格洗涤以除去非特异性结合的探针后,通过诸如共聚焦激光显微镜的设备或通过诸如CCD相机的另一种检测方法来扫描微阵列芯片。对每个排列的元件的杂交的定量允许评估相应的mRNA丰度。通过采用双色荧光,从两个RNA来源产生的分别标记的cDNA探针与阵列成对杂交。来自两个来源的与每个指定基因相对应的转录物的相对丰度因此同时得以确定。微阵列分析可通过市售设备按照生产商的方案来进行。
在本公开的一个方面,生物标志物可使用qRT-PCR在生物样品中进行检测,该生物标志物可用于比较在进行或不进行药物治疗下正常和肿瘤组织中的不同样品群体的mRNA水平,以表征基因表达模式,区分密切相关的mRNA,并分析RNA结构。通过RT-PCR进行基因表达谱分析的第一步是从生物样品中提取RNA,接着将RNA模板逆转录成cDNA,并通过PCR反应进行扩增。逆转录反应步骤通常使用特异性引物、随机六聚体或寡-dT引物根据表达谱分析的目标来引发。两种常用的逆转录酶是禽(avilo)成髓细胞瘤病毒逆转录酶(AMV-RT)和莫洛尼(Moloney)鼠白血病病毒逆转录酶(MLV-RT)。
尽管PCR步骤可使用多种热稳定的DNA依赖性DNA聚合酶,但它通常采用Taq DNA聚合酶,Taq DNA聚合酶具有5'-3'核酸酶活性但缺乏3'-5'校正核酸内切酶活性。因此,TaqManTM PCR通常使用Taq或Tth聚合酶的5'-核酸酶活性来水解与其靶扩增子结合的杂交探针,但具有等效的5'核酸酶活性的任何酶均可以使用。使用两个寡核苷酸引物产生PCR反应的典型扩增子。第三寡核苷酸或探针被设计用于检测位于两个PCR引物之间的核苷酸序列。探针不可由Taq DNA聚合酶延伸,并采用报道荧光染料和猝灭荧光染料进行标记。当报道染料和猝灭染料在探针上位置靠近时,来自报道染料的任何激光诱导的发射被猝灭染料猝灭。在扩增反应过程中,Taq DNA聚合酶以模板依赖性方式裂解探针。所得探针片段在溶液中解离,并且来自释放的报道染料的信号不受第二荧光团的猝灭效应的影响。释放报道染料的一个分子用于每个新合成的分子,并且非猝灭的报道染料的检测提供了数据的定量解释的基础。
TaqManTM RT-PCR可使用市售的设备如ABI PRISM 7700TMSequence Detection SystemTM(Perkin-Elmer-Applied Biosystems,FosterCity,Calif.,USA)或LightCycler(Roche Molecular Biochemicals,Mannheim,德国)进行。在一个优选的实施方案中,5'核酸酶程序在实时定量PCR设备如ABI PRISM 7700TM Sequence Detection SystemTM上运行。该系统包含热循环仪、激光器、电荷耦合器件(CCD)、照相机和计算机。该系统包含用于运行仪器和用于分析数据的软件。5'-核酸酶测定数据最初表述为Ct或循环阈值。如上所讨论的,在每个循环期间记录荧光值且荧光值代表在扩增反应中扩增至该点的产物的量。首次记录到荧光信号为统计学上显著时的点为循环阈值(Ct)。
为了使误差和样品间变化的影响最小化,RT-PCR通常使用内标物进行。理想的内标物在不同组织间以恒定的水平表达并且不受实验处理的影响。最常用于对基因表达模式进行归一化的RNA是管家基因甘油醛-3-磷酸脱氢酶(GAPDH)和β-肌动蛋白的mRNA。
RT-PCR技术的较新变化形式是实时定量PCR,其通过双标记的荧光生成探针(即TaqManTM探针)测量PCR产物累积。实时PCR与定量竞争PCR(其中每个靶序列的内部竞争物均用于归一化)以及定量比较PCR(其使用样品内包含的归一化基因或用于RT-PCR的管家基因)均相容。进一步的细节参见,例如Held等人,Genome Research6:986-994(1996)。
G.数据处理
上述测定获得的值可手动计算并存储。或者,上述步骤可完全或部分地由计算机程序产品进行。因此,本公开提供了包括计算机可读存储介质的计算机程序产品,该计算机可读存储介质具有存储在其上的计算机程序。该程序在被计算机读取时,可基于从来自个体的一个或多个生物样品的分析获得的值(例如,基因或蛋白质表达水平、归一化、标准化、取阈和从测定的值到临床结果得分和/或临床状态或阶段的文本或图形描述的转换以及相关信息)来执行相关计算。该计算机程序产品在其中存储用于执行计算的计算机程序。
本公开提供了用于执行数据采集和处理或计算上述软件程序的系统,该系统通常包括:a)中央计算环境;b)输入设备,其可操作地连接到所述计算环境,以接收患者数据,其中所述患者数据可以包括,例如基因或蛋白质表达水平或从使用来自患者的生物样品的测定获得的其他值,或质谱数据或由本公开提供的任何测定的数据;c)输出设备,其连接至所述计算环境,以向用户(例如,医务人员)提供信息;以及d)由中央计算环境(例如,处理器)执行的算法,其中该算法基于由所述输入设备接收的数据来执行,并且其中所述算法计算表达得分、取阈或本文描述的其他功能。本公开提供的方法也可以是整体或部分自动化的。
H.受试者
生物样品从想要确定其患有结肠肿瘤或息肉的可能性的受试者采集。本公开提供了可为健康且无症状的受试者。在各个实施方案中,受试者是健康的、无症状的且年龄在20-50岁之间。在各个实施方案中,受试者是健康且无症状的并且没有腺瘤或息肉的家族史。在各个实施方案中,受试者是健康且无症状的并且从未接受过结肠镜检查。本公开还提供了正在接受作为例行检查的一部分或用于建立生物标志物的基线水平的检测的健康受试者。
本公开提供了没有结肠直肠癌的症状、没有结肠直肠癌家族史且没有经识别的结肠直肠癌风险因素的受试者。本公开提供了没有结肠直肠癌的症状、没有结肠直肠癌家族史且没有除年龄之外的经识别的结肠直肠癌风险因素的受试者。
生物样品也可以从已根据其家族史确定具有结肠直肠息肉或癌症的高风险、先前曾治疗结肠直肠息肉或癌症和或处于缓解期的受试者采集。生物样品还可从表现出已知与结肠直肠癌相关的身体症状的受试者、通过筛选测定(例如,粪便隐血试验或乙状结肠镜检查)或直肠数字检查(rectal digital exam)或刚性或柔性结肠镜检查或CT扫描或其他X射线技术确认的受试者采集。生物样品也可从目前正在经受治疗的受试者采集,以确定他们正在接受的疗法或治疗的有效性。
I.生物样品
生物标志物可以在不同类型的生物样品中测量。该样品优选来自汇集并概括了整个系统的生物样品。本公开中有用的生物样品类型的实例包括但不限于以下的一种或多种:尿、粪便、泪液、全血、血清、血浆、血液成分、骨髓、组织、细胞、器官、唾液、脸颊拭子、淋巴液、脑脊髓液、病变渗出物和由身体产生的其他流体。该生物标志物也可从冷冻的、固定的、石蜡包埋的或新鲜的活检样品中提取。
IV.生物标志物和生物标志物谱
本公开的生物标志物允许在健康个体与患有结肠息肉或处于发展结肠息肉的风险下的个体之间以及在结肠息肉的不同状态(例如增生的、恶性的、癌或肿瘤亚型)之间进行区分。具体地,本公开对生物标志物的发现提供了有助于结肠息肉和结肠癌的临床评价和管理的诊断方法、试剂盒。
可用于结肠息肉的临床评价和管理的生物标志物包括下列蛋白质(UNIprotein ID号)的全蛋白、肽片段、核酸或过渡离子:SPB6_HUMAN、FRIL_HUMAN、P53_HUMAN、1A68_HUMAN、ENOA_HUMAN、TKT_HUMAN及其组合。
可用于结肠息肉的临床评价和管理的生物标志物包括下列蛋白质(UNIprotein ID号)的全蛋白、肽片段、核酸或过渡离子:SPB6_HUMAN、FRIL_HUMAN、P53_HUMAN、1A68_HUMAN、ENOA_HUMAN、TKT_HUMAN、TSG6_HUMAN、TPM2_HUMAN、ADT2_HUMAN、FHL1_HUMAN、CCR5_HUMAN、CEAM5_HUMAN、SPON2_HUMAN、1A68_HUMAN、RBX1_HUMAN、COR1C_HUMAN、VIME_HUMAN、PSME3_HUMAN及其组合。
可用于结肠息肉的临床评价和管理的生物标志物包括下列蛋白质(UNIprotein ID号)的全蛋白、肽片段、核酸或过渡离子:SPB6_HUMAN、FRIL_HUMAN、P53_HUMAN、1A68_HUMAN、ENOA_HUMAN和TKT_HUMAN、TSG6_HUMAN、TPM2_HUMAN、ADT2_HUMAN、FHL1_HUMAN、CCR5_HUMAN、CEAM5_HUMAN、SPON2_HUMAN、1A68_HUMAN、RBX1_HUMAN、COR1C_HUMAN、VIME_HUMAN、PSME3_HUMAN、MIC1_HUMAN、STK11_HUMAN、IPYR_HUMAN、SBP1_HUMAN、PEBP1_HUMAN、CATD_HUMAN、HPT_HUMAN、ANXA5_HUMAN、ALDOA_HUMAN、LAMA2_HUMAN、CATZ_HUMAN、ACTB_HUMAN、AACT_HUMAN及其组合。
可用于结肠息肉的临床评价和管理的生物标志物包括图12中的过渡离子。
通过本公开的方法从全血清中鉴定出的生物标志物包括与下列蛋白质(UNIprotein ID号)相对应的全蛋白、肽片段、核酸或过渡离子:细胞质肌动蛋白1(ACTB_HUMAN)(SEQ ID NO:1)、肌动蛋白γ-肠平滑肌前体(ACTH_HUMAN)(SEQ ID NO:2)、血管紧张素原前体(ANGT_HUMAN)(SEQ ID NO:3)、腺苷高半胱氨酸酶(SAHH_HUMAN)(SEQ ID NO:4)、醛糖还原酶(ALDR_HUMAN)(SEQ ID NO:5)、RAC-α丝氨酸/苏氨酸-蛋白激酶(AKT1_HUMAN)(SEQ ID NO:6)、血清白蛋白前体(ALBU_HUMAN)(SEQ ID NO:7)、视黄醛脱氢酶1(AL1A1_HUMAN)(SEQ ID NO:8)、醛脱氢酶X线粒体前体(AL1B1_HUMAN)(SEQ ID NO:9)、果糖-二磷酸醛缩酶A(ALDOA_HUMAN)(SEQ ID NO:10)、α-淀粉酶2B前体(AMY2B_HUMAN)(SEQ ID NO:11)、膜联蛋白A1(ANXA1_HUMAN)(SEQ ID NO:12)、膜联蛋白A3(ANXA3_HUMAN)(SEQ ID NO:13)、膜联蛋白A4(ANXA4_HUMAN)(SEQ ID NO:14)、膜联蛋白A5(ANXA5_HUMAN)(SEQ ID NO:15)、腺瘤性结肠息肉病蛋白(APC_HUMAN)(SEQ ID NO:16)、载脂蛋白A-I前体(APOA1_HUMAN)(SEQ ID NO:17)、载脂蛋白C-I前体(APOC1_HUMAN)(SEQ ID NO:18)、β-2-糖蛋白1前体(APOH_HUMAN)(SEQ ID NO:19)、Rho GDP解离抑制剂1(GDIR1_HUMAN)(SEQ ID NO:20)、ATP合酶β亚基线粒体前体(ATPB_HUMAN)(SEQ ID NO:21)、具有锚蛋白重复序列的B细胞支架蛋白(BANK1_HUMAN)(SEQ ID NO:22)、未表征的蛋白C18orf8(MIC1_HUMAN)(SEQ ID NO:23)、推定的未表征的蛋白C1orf195(CA195_HUMAN)(SEQ ID NO:24)、补体C3前体(CO3_HUMAN)(SEQ ID NO:25)、补体成分C9前体(CO9_HUMAN)(SEQ ID NO:26)、碳酸酐酶1(CAH1_HUMAN)(SEQ ID NO:27)、碳酸酐酶2(CAH2_HUMAN)(SEQ ID NO:28)、钙网蛋白前体(CALR_HUMAN)(SEQ ID NO:29)、巨噬细胞加帽蛋白(CAPG_HUMAN)(SEQ ID NO:30)、信号转导蛋白CD24前体(CD24_HUMAN)(SEQ ID NO:31)、CD63抗原(CD63_HUMAN)(SEQ ID NO:32)、胞苷脱氨酶(CDD_HUMAN)(SEQ ID NO:33)、癌胚抗原相关细胞粘附分子3(CEAM3_HUMAN)(SEQ ID NO:34)、癌胚抗原相关细胞粘附分子5(CEAM5_HUMAN)(SEQ ID NO:35)、癌胚抗原相关细胞粘附分子6(CEAM6_HUMAN)(SEQ ID NO:36)、绒毛膜促性腺激素β亚基前体(CGHB_HUMAN)(SEQ ID NO:37)、几丁质酶-3样蛋白1前体(CH3L1_HUMAN)(SEQ ID NO:38)、肌酸激酶B型(KCRB_HUMAN)(SEQ ID NO:39)、C型凝集素结构域家族4成员D(CLC4D_HUMAN)(SEQ IDNO:40)、簇蛋白前体(CLUS_HUMAN)(SEQ ID NO:41)、钙调理蛋白-1(CNN1_HUMAN)(SEQ ID NO:42)、冠蛋白-1C(COR1C_HUMAN)(SEQ ID NO:43)、C-反应蛋白前体(CRP_HUMAN)(SEQ ID NO:44)、巨噬细胞集落刺激因子1前体(CSF1_HUMAN)(SEQ ID NO:45)、连环蛋白β-1(CTNB1_HUMAN)(SEQ ID NO:46)、组织蛋白酶D前体(CATD_HUMAN)(SEQID NO:47)、组织蛋白酶S前体(CATS_HUMAN)(SEQ ID NO:48)、组织蛋白酶Z前体(CATZ_HUMAN)(SEQ ID NO:49)、滞蛋白-1(CUL1_HUMAN)(SEQ ID NO:50)、细胞质天冬氨酸-tRNA连接酶(SYDC_HUMAN)(SEQ ID NO:51)、嗜中性粒细胞防御素1(DEF1_HUMAN)(SEQ ID NO:52)、嗜中性粒细胞防御素3(DEF3_HUMAN)(SEQ ID NO:53)、结蛋白(DESM_HUMAN)(SEQ ID NO:54)、二肽基肽酶4(DPP4_HUMAN)(SEQ ID NO:55)、二氢嘧啶酶相关蛋白2(DPYL2_HUMAN)(SEQ ID NO:56)、细胞质动力蛋白1重链1(DYHC1_HUMAN)(SEQ ID NO:57)、δ(3,5)-δ(2,4)-二烯酰-CoA异构酶线粒体前体(ECH1_HUMAN)(SEQID NO:58)、延伸因子2(EF2_HUMAN)(SEQ ID NO:59)、真核起始因子4A-III(IF4A3_HUMAN)(SEQ ID NO:60)、α-烯醇化酶(ENOA_HUMAN)(SEQ ID NO:61)、埃兹蛋白(EZRI_HUMAN)(SEQ ID NO:62)、Niban样蛋白2(NIBL2_HUMAN)(SEQ ID NO:63)、Seprase(SEPR_HUMAN)(SEQ ID NO:64)、仅F框蛋白4(F-box only protein 4)(FBX4_HUMAN)(SEQ ID NO:65)、纤维蛋白原β链前体(FIBB_HUMAN)(SEQ ID NO:66)、纤维蛋白原γ链(FIBG_HUMAN)(SEQ ID NO:67)、四个半LIM结构域蛋白1(FHL1_HUMAN)(SEQ ID NO:68)、细丝蛋白-A(FLNA_HUMAN)(SEQ ID NO:69)、包含FERM结构域的蛋白3(FRMD3_HUMAN)(SEQ ID NO:70)、铁蛋白重链(FRIH_HUMAN)(SEQ ID NO:71)、铁蛋白轻链(FRIL_HUMAN)(SEQ ID NO:72)、组织α-L-岩藻糖苷酶前体(FUCO_HUMAN)(SEQ ID NO:73)、γ-氨基丁酸受体亚基α-1前体(GBRA1_HUMAN)(SEQ ID NO:74)、甘油醛-3-磷酸脱氢酶(G3P_HUMAN)(SEQ ID NO:75)、甘氨酸-tRNA连接酶(SYG_HUMAN)(SEQ ID NO:76)、生长/分化因子15前体(GDF15_HUMAN)(SEQ ID NO:77)、凝溶胶蛋白前体(GELS_HUMAN)(SEQ ID NO:78)、谷胱甘肽S-转移酶P(GSTP1_HUMAN)(SEQ ID NO:79)、透明质酸结合蛋白2前体(HABP2_HUMAN)(SEQ ID NO:80)、肝细胞生长因子前体(HGF_HUMAN)(SEQ ID NO:81)、HLA I类组织相容性抗原A-68α链(1A68_HUMAN)(SEQ ID NO:82)、高速泳动族蛋白B1(HMGB1_HUMAN)(SEQ ID NO:83)、核内不均一核糖核蛋白A1(ROA1_HUMAN)(SEQ ID NO:84)、核内不均一核糖核蛋白A2/B1(ROA2_HUMAN)(SEQ ID NO:85)、核内不均一核糖核蛋白F(HNRPF_HUMAN)(SEQ ID NO:86)、触珠蛋白前体(HPT_HUMAN)(SEQ ID NO:87)、热休克蛋白HSP 90-β(HS90B_HUMAN)(SEQ ID NO:88)、内质网素(Endoplasmin)前体(ENPL_HUMAN)(SEQ ID NO:89)、Stress-70蛋白线粒体前体(Stress-70protein,mitochondrial precursor)(GRP75_HUMAN)(SEQ ID NO:90)、热休克蛋白β-1(HSPB1_HUMAN)(SEQ IDNO:91)、线粒体60kDa热休克蛋白(CH60_HUMAN)(SEQ ID NO:92)、骨唾液蛋白2(SIAL_HUMAN)(SEQ ID NO:93)、鞭毛内转运蛋白74同系物(IFT74_HUMAN)(SEQ ID NO:94)、胰岛素样生长因子I(IGF1_HUMAN)(SEQ ID NO:95)、Igα-2链C区(IGHA2_HUMAN)(SEQ ID NO:96)、白介素-2受体β亚基前体(IL2RB_HUMAN)(SEQ ID NO:97)、白介素-8(IL8_HUMAN)(SEQ ID NO:98)、白介素-9(IL9_HUMAN)(SEQ ID NO:99)、GTP酶KRas前体(RASK_HUMAN)(SEQ ID NO:100)、角蛋白I型细胞骨架19(K1C19_HUMAN)(SEQ ID NO:101)、角蛋白II型细胞骨架8(K2C8_HUMAN)(SEQ ID NO:102)、层粘连蛋白亚基α-2前体(LAMA2_HUMAN)(SEQ ID NO:103)、半乳凝集素-3(LEG3_HUMAN)(SEQ ID NO:104)、核纤层蛋白-B1前体(LMNB1_HUMAN)(SEQ ID NO:105)、微管相关蛋白RP/EB家族成员1(MARE1_HUMAN)(SEQ ID NO:106)、DNA复制许可因子MCM4(MCM4_HUMAN)(SEQ ID NO:107)、巨噬细胞游走抑制因子(MIF_HUMAN)(SEQ ID NO:108)、基质溶解素前体(MMP7_HUMAN)(SEQ ID NO:109)、基质金属蛋白酶9前体(MMP9_HUMAN)(SEQ ID NO:110)、B淋巴细胞抗原CD20(CD20_HUMAN)(SEQ ID NO:111)、肌球蛋白轻链多肽6(MYL6_HUMAN)(SEQ ID NO:112)、肌球蛋白调节轻链多肽9(MYL9_HUMAN)(SEQ ID NO:113)、核苷二磷酸激酶A(NDKA_HUMAN)(SEQ ID NO:114)、烟酰胺N-甲基转移酶(NNMT_HUMAN)(SEQ ID NO:115)、α-1-酸性糖蛋白1前体(A1AG1_HUMAN)(SEQ ID NO:116)、磷酸烯醇丙酮酸羧激酶[GTP]线粒体前体(PCKGM_HUMAN)(SEQ ID NO:117)、蛋白质二硫键异构酶A3前体(PDIA3_HUMAN)(SEQ ID NO:118)、蛋白质二硫键异构酶A6前体(PDIA6_HUMAN)(SEQ ID NO:119)、吡哆醛激酶(PDXK_HUMAN)(SEQ ID NO:120)、磷脂酰乙醇胺结合蛋白1(PEBP1_HUMAN)(SEQ ID NO:121)、磷脂酰肌醇转移蛋白α同种型(PIPNA_HUMAN)(SEQ ID NO:122)、丙酮酸激酶同工酶M1/M2(KPYM_HUMAN)(SEQ ID NO:123)、尿激酶型纤溶酶原激活剂前体(UROK_HUMAN)(SEQ ID NO:124)、无机焦磷酸酶(IPYR_HUMAN)(SEQ ID NO:125)、过氧化物氧还蛋白-1(PRDX1_HUMAN)(SEQ ID NO:126)、丝氨酸/苏氨酸-蛋白激酶D1(KPCD1_HUMAN)(SEQ ID NO:127)、催乳素(PRL_HUMAN)(SEQ ID NO:128)、跨膜γ-羧基谷氨酸蛋白4前体(TMG4_HUMAN)(SEQ ID NO:129)、蛋白酶体激活剂复合物亚基3(PSME3_HUMAN)(SEQ ID NO:130)、磷脂酰肌醇3,4,5-三磷酸3-磷酸酶和双特异性蛋白质磷酸酶PTEN(PTEN_HUMAN)(SEQ ID NO:131)、黏着斑激酶1(FAK1_HUMAN)(SEQ ID NO:132)、蛋白质酪氨酸激酶2-β(FAK2_HUMAN)(SEQ ID NO:133)、E3泛素-蛋白质连接酶RBX1(RBX1_HUMAN)(SEQ ID NO:134)、再生胰岛衍生蛋白4前体(REG4_HUMAN)(SEQ ID NO:135)、转化蛋白RhoA(RHOA_HUMAN)(SEQ ID NO:136)、Rho相关GTP结合蛋白RhoB(RHOB_HUMAN)(SEQ ID NO:137)、Rho相关GTP结合蛋白RhoC(RHOC_HUMAN)(SEQ ID NO:138)、40S核糖体蛋白SA(RSSA_HUMAN)(SEQ ID NO:139)、核糖体结合蛋白1(RRBP1_HUMAN)(SEQ ID NO:140)、蛋白S100-A11(S10AB_HUMAN)(SEQ ID NO:141)、蛋白S100-A12(S10AC_HUMAN)(SEQ ID NO:142)、蛋白S100-A8(S10A8_HUMAN)(SEQ ID NO:143)、蛋白S100-A9(S10A9_HUMAN)(SEQ ID NO:144)、血清淀粉样蛋白A-1蛋白(SAA1_HUMAN)(SEQ ID NO:145)、血清淀粉样蛋白A-2蛋白前体(SAA2_HUMAN)(SEQ ID NO:146)、促泌素(SEGN_HUMAN)(SEQ ID NO:147)、血清学定义结肠癌抗原3(SDCG3_HUMAN)(SEQ ID NO:148)、琥珀酸脱氢酶[泛醌]黄素蛋白亚基线粒体前体(DHSA_HUMAN)(SEQ ID NO:149)、硒结合蛋白1(SBP1_HUMAN)(SEQ ID NO:150)、P-选择蛋白糖蛋白配体1前体(SELPL_HUMAN)(SEQ ID NO:151)、隔蛋白-9(SEPT9_HUMAN)(SEQ ID NO:152)、α-1抗胰蛋白酶前体(A1AT_HUMAN)(SEQ ID NO:153)、α-1抗胰凝乳蛋白酶前体(AACT_HUMAN)(SEQ ID NO:154)、白细胞弹性蛋白酶抑制剂(ILEU_HUMAN)(SEQ ID NO:155)、丝氨酸蛋白酶抑制蛋白B6(SPB6_HUMAN)(SEQ ID NO:156)、剪接因子3B亚基3(SF3B3_HUMAN)(SEQ ID NO:157)、S相激酶相关蛋白1(SKP1_HUMAN)(SEQ ID NO:158)、ADP/ATP移位酶2(ADT2_HUMAN)(SEQ ID NO:159)、胰分泌型胰蛋白酶抑制剂(ISK1_HUMAN)(SEQ ID NO:160)、脊椎蛋白-2(SPON2_HUMAN)(SEQ ID NO:161)、骨桥蛋白(OSTP_HUMAN)(SEQ ID NO:162)、原癌基因酪氨酸蛋白激酶Src(SRC_HUMAN)(SEQ ID NO:163)、丝氨酸/苏氨酸-蛋白激酶STK11(STK11_HUMAN)(SEQ ID NO:164)、核内不均一核糖核蛋白Q(HNRPQ_HUMAN)(SEQ ID NO:165)、T细胞急性淋巴细胞性白血病蛋白1(TAL1_HUMAN)(SEQ ID NO:166)、血清铁传递蛋白前体(TRFE_HUMAN)(SEQ ID NO:167)、血小板反应蛋白-1前体(TSP1_HUMAN)(SEQ ID NO:168)、金属蛋白酶抑制剂1(TIMP1_HUMAN)(SEQ ID NO:169)、转酮醇酶(TKT_HUMAN)(SEQ ID NO:170)、肿瘤坏死因子诱导型基因6蛋白前体(TSG6_HUMAN)(SEQ ID NO:171)、肿瘤坏死因子受体超家族成员10B(TR10B_HUMAN)(SEQ ID NO:172)、肿瘤坏死因子受体超家族成员6B(TNF6B_HUMAN)(SEQ ID NO:173)、细胞肿瘤抗原p53(P53_HUMAN)(SEQ ID NO:174)、原肌球蛋白β链(TPM2_HUMAN)(SEQ ID NO:175)、翻译控制肿瘤蛋白(TCTP_HUMAN)(SEQ ID NO:176)、热休克蛋白75kDa线粒体前体(TRAP1_HUMAN)(SEQ ID NO:177)、硫代硫酸硫基转移酶(THTR_HUMAN)(SEQ ID NO:178)、微管蛋白β-1链(TBB1_HUMAN)(SEQ ID NO:179)、UDP-葡萄糖6-脱氢酶(UGDH_HUMAN)(SEQ ID NO:180)、UTP-葡萄糖-1-磷酸尿苷酰转移酶(UGPA_HUMAN)(SEQ ID NO:181)、血管内皮生长因子A(VEGFA_HUMAN)(SEQ ID NO:182)、绒毛蛋白-1(VILI_HUMAN)(SEQ ID NO:183)、波形蛋白(VIME_HUMAN)(SEQ ID NO:184)、泛酰巯基乙胺酶前体(VNN1_HUMAN)(SEQID NO:185)、14-3-3蛋白ζ/δ(1433Z_HUMAN)(SEQ ID NO:186)、C-C趋化因子受体5型(CCR5_HUMAN)(SEQ ID NO:187)或血浆α-L-岩藻糖苷酶(FUCO2_HUMAN)(SEQ ID NO:188)。本公开的方法预期确定上文提供的至少一种、至少两种、至少三种、至少四种、至少五种、至少六种、至少七种、至少八种、至少九种生物标志物的表达水平。该方法可包括确定上文提供的至少十种、至少十五种或至少二十种生物标志物的表达水平。
对于本公开的所有方面,所述方法可进一步包括确定本文提供的至少两种生物标志物的表达水平。进一步预期:本公开的方法可进一步包括确定本文提供的至少三种、至少四种、至少五种、至少六种、至少七种、至少八种、至少九种生物标志物的表达水平。该方法可包括确定本文提供的至少十种、至少十五种或至少二十种生物标志物的表达水平。
通过本公开的方法从全血清中鉴定的生物标志物包括与下列蛋白质相对应的肽/蛋白质片段或基因:SCDC26(CD26)、CEA分子5(CEACAM5)、CA195(CCR5)、CA19-9、M2PK(PKM2)、TIMP1、P-选择蛋白(SELPLG)、VEGFA、HcGB(CGB)、绒毛蛋白(VILLIN)、TATI(SPINK1)和A-L-岩藻糖苷酶(FUCA2)。包括上述蛋白质或基因中的两种、三种、四种、五种、六种、七种、八种、九种、十种、十一种和全部十二种的群组。这样的群组可排除这一组内的蛋白质或基因,或者可排除另外的蛋白质或基因,或可进一步包含另外的蛋白质。
通过本公开的方法从全血清中鉴定的生物标志物包括与下列蛋白质相对应的肽/蛋白质片段或基因:ANXA5、GAPDH、PKM2、ANXA4、GARS、RRBP1、KRT8、SYNCRIP、S100A9、ANXA3、CAPG、HNRNPF、PPA1、NME1、PSME3、AHCY、TPT1、HSPB1和RPSA。包括上述蛋白质或基因中的两种、三种、四种、五种、六种、七种、八种、九种、十种、十一种、十二种、十三种、十四种、十五种、十六种、十七种、十八种和所有十九种的群组。这样的群组可排除这一组内的蛋白质或基因,或者可排除另外的蛋白质或基因,或可以进一步包含另外的蛋白质。
通过本公开的方法从全血清中鉴定的生物标志物包括与图9中鉴定的蛋白质相对应的肽/蛋白质片段或基因。包括上述蛋白质或基因中的两种、三种、四种、五种、六种、七种、八种、九种、十种、十一种、十二种及更多种的群组。这样的群组可排除这一组内的蛋白质或基因,或者可排除另外的蛋白质,或可以进一步包含另外的蛋白质。
已知由于蛋白质可以以各种形式缔合以形成各种蛋白质复合物,因此蛋白质通常以多种不同的形式存在于样品中。这些形式可由翻译前和翻译后修饰中的任一种或两种产生。翻译前修饰形式包括等位基因变体、剪接变体和RNA编辑形式。在这样的情况下,已知基因表达产物将与人类数据库中定义的蛋白质呈现各种同源性。因此,本公开认识到,可以存在所定义的生物标志物的各种形式。例如,所述序列同源性选自大于75%、大于80%、大于85%、大于90%、大于95%以及大于99%。此外,可以存在生物标志物的翻译后修饰形式。翻译后修饰形式包括但不限于由蛋白质生物标志物的蛋白水解裂解(例如,亲本蛋白质的片段)、糖基化、磷酸化、脂化、氧化、甲基化、半胱氨酰化(cystinylation)、磺化和乙酰化产生的形式。
本公开的生物标志物包括全长蛋白质、它们相应的RNA或DNA及所有的修饰形式。该生物标志物的修饰形式包括,例如所公开的生物标志物和它们相应的编码它们的RNA或DNA的任何剪接变体。在某些情况下,蛋白质或它们相应的RNA或DNA的修饰形式或截短形式可在诊断上表现出比全长蛋白质更好的鉴别能力。
蛋白质、多肽或肽的截短形式或片段通常是指所述蛋白质、多肽或肽的N-末端和/或C-末端缺失或截短形式。该术语涵盖通过任何机制,诸如但不限于,通过所述肽、多肽或蛋白质例如在体内或体外的选择性翻译、外切和/或内切蛋白水解和/或降解(例如,通过物理、化学和/或酶促蛋白水解)产生的片段。非限制性地,蛋白质、多肽或肽的截短形式或片段可以代表所述蛋白质、多肽或肽的至少约5%或至少约10%(例如>20%、>30%或>40%,如>50%,例如>60%、>70%或>80%或甚至90%或>95%)的氨基酸序列。
非限制性地,蛋白质的截短形式或片段可包含相应全长蛋白质的5个连续氨基酸或10个连续氨基酸或20个连续氨基酸或30个连续氨基酸或多于50个连续氨基酸,例如60、70、80、90、100、200、300、400、500或600个连续氨基酸的序列。
在一些情况下,与相应成熟的全长蛋白质或其可溶性或血浆循环形式相比,片段可以是N末端和/或C末端截短1至约20个氨基酸,如1至约15个氨基酸或者1至约10个氨基酸或者1至约5个氨基酸。
本公开的任何蛋白质生物标志物如肽、多肽或蛋白质及其片段也可涵盖所述标志物、肽、多肽或蛋白质和片段的修饰形式,如具有表达后修饰,包括但不限于,诸如磷酸化、糖基化、脂化、甲基化、半胱氨酰化、磺化、谷胱甘肽化、乙酰化、甲硫氨酸氧化成甲硫氨酸亚砜或甲硫氨酸砜等修饰。
在一些情况下,给定蛋白质、多肽或肽的片段可通过所述蛋白质、多肽或肽的体外蛋白水解来实现,以从样品获得可有利地检测的肽。例如,这样的蛋白水解可通过合适的物理、化学和/或酶试剂,例如蛋白酶、优选内切蛋白酶(即,在蛋白质、多肽或肽链内进行内部切割的蛋白酶)来实现。
内切蛋白酶的合适的非限制性实例包括但不限于,丝氨酸蛋白酶(EC 3.4.21)、苏氨酸蛋白酶(EC 3.4.25)、半胱氨酸蛋白酶(EC3.4.22)、天冬氨酸蛋白酶(EC 3.4.23)、金属蛋白酶(EC 3.4.24)和谷氨酸蛋白酶。示例性的非限制性内切蛋白酶包括胰蛋白酶、糜蛋白酶、弹性蛋白酶、产酶溶杆菌内切蛋白酶Lys-C、金黄色葡萄球菌内切蛋白酶Glu-C(肽链内切酶V8)或溶组织梭菌内切蛋白酶Arg-C(梭菌蛋白酶)。
优选地,所述蛋白水解可通过胰蛋白酶型的肽链内切酶(EC3.4.21.4),优选胰蛋白酶,诸如但不限于,来自牛胰脏、人胰脏、猪胰脏的胰蛋白酶、重组胰蛋白酶、Lys-乙酰化的胰蛋白酶、溶液中的胰蛋白酶、固定于固体支持物的胰蛋白酶等的制剂来实现。胰蛋白酶尤其因裂解的高特异性和高效性而特别有用。本公开还提供了任何胰蛋白酶样蛋白酶(即具有与胰蛋白酶的特异性相似的特异性)的使用。另外,化学试剂可用于蛋白水解。仅举例而言,CNBr可在Met处裂解;BNPS-粪臭素可以在Trp处裂解。用于处理的条件,例如蛋白质浓度、酶或化学试剂浓度、pH、缓冲液、温度、时间,可由技术人员根据所用酶或化学试剂来确定。其他已知的或尚未鉴定的酶可基于它们的裂解特异性和频率在本公开中使用,以获得期望的肽形式。
在一些情况下,片段化的蛋白质或肽可以是N-末端和/或C-末端截短的,且为N-末端(a、b、c-离子)和/或C-末端(x、y、z-离子)截短的蛋白质或肽的一个或全部过渡离子。例如,如果肽片段由氨基酸序列IAELLSPGSVDPLTR组成,则该肽片段的过渡离子生物标志物可包括表1中提供的下列过渡离子生物标志物中的一种或多种。
表1:肽序列IAELLSPGSVDPLTR的所有过渡离子的实例
过渡离子 氨基酸序列
b1 I
b2 IA
b3 IAE
b4 IAEL
b5 IAELL
b6 IAELLS
b7 IAELLSP
b8 IAELLSPG
b9 IAELLSPGS
b10 IAELLSPGSV
b11 IAELLSPGSVD
b12 IAELLSPGSVDP
b13 IAELLSPGSVDPL
b14 IAELLSPGSVDPLT
y14 AELLSPGSVDPLTR
y13 ELLSPGSVDPLTR
y12 LLSPGSVDPLTR
y11 LSPGSVDPLTR
y10 SPGSVDPLTR
y9 PGSVDPLTR
y8 GSVDPLTR
y7 SVDPLTR
y6 VDPLTR
y5 DPLTR
y4 PLTR
y3 LTR
y2 TR
y1 R
本公开的生物标志物包括SCDC26(CD26)、CEA分子5(CEACAM5)、CA195(CCR5)、CA19-9、M2PK(PKM2)、TIMP1、P-选择蛋白(SELPLG)、VEGFA、HcGB(CGB)、绒毛蛋白、TATI(SPINK1)和A-L-岩藻糖苷酶(FUCA2)的结合配偶体。包括上述蛋白质中的两种、三种、四种、五种、六种、七种、八种、九种、十种、十一种和所有十二种的群组。这样的群组可排除这一组内的蛋白质,或可排除另外的蛋白质,或可以进一步包含另外的蛋白质。
本公开的生物标志物包括ANXA5、GAPDH、PKM2、ANXA4、GARS、RRBP1、KRT8、SYNCRIP、S100A9、ANXA3、CAPG、HNRNPF、PPA1、NME1、PSME3、AHCY、TPT1、HSPB1和RPSA的结合配偶体。包括上述蛋白质中的两种、三种、四种、五种、六种、七种、八种、九种、十种、十一种、十二种、十三种、十四种、十五种、十六种、十七种、十八种和所有十九种的群组。这样的群组可排除这一组内的蛋白质,或可排除另外的蛋白质,或可以进一步包含另外的蛋白质。
如本文所教导的示例性的人标志物、核酸、蛋白质或多肽可以如NCBI Genbank(http://www.ncbi.nlm.nih.gov/)或Swissprot/Uniprot(http://www.uniprot.org/)登录号下所注释的。在一些情况下,所述序列可以是如本文所教导的标志物、核酸、蛋白质或多肽的前体(例如,前蛋白质)的序列,并且可包含从成熟分子加工除去的部分。在一些情况下,虽然可能仅公开一个或多个同种型,但旨在涵盖该序列的所有同种型。
本公开的生物标志物包括图9中鉴定的蛋白质的结合配偶体。包括上述蛋白质中的两种、三种、四种、五种、六种、七种、八种、九种、十种、十一种、十二种和更多种的群组。这样的群组可排除这一组内的蛋白质,或可排除另外的蛋白质,或可进一步包含另外的蛋白质。
上述鉴定的生物标志物是如根据分子量和部分序列确定的,通过本公开的方法鉴定的生物标志物的实例,并且仅仅作为说明性实例且并不意在以任何方式限制本公开。可用于检测一种或多种生物标志物或修饰的生物标志物的合适的方法在本文中进行了描述。在某一方面,本公开提供了对生物样品进行关于存在选自代谢物、DNA序列、RNA序列及其组合的一种或多种分析物的附加生物标志物的分析。本文所列出的生物标志物可进一步与其他信息,如遗传分析,例如受试者的全基因组DNA或RNA测序进行组合。
本公开的所有方面也可采用有限数目的公开的生物标志物、它们的结合配偶体、剪接变体和相应的DNA和RNA来实施。
除了相应的DNA和RNA外,在本公开提供的生物标志物的DNA和RNA内发现的变异也可提供用于区分个体的临床状态的手段。可在本公开的方法中使用的此类DNA和RNA遗传变异标志物的实例包括但不限于限制性片段长度多态性、单核苷酸DNA多态性、单核苷酸cDNA多态性、单核苷酸RNA多态性、单核苷酸RNA多态性、插入、缺失、插入缺失(indel)、微卫星重复(简单序列重复)、小卫星重复(可变数目的串联重复)、短串联重复、转座因子、随机扩增多态性DNA和扩增片段长度多态性。
生物标志物谱
本公开的方法还提供了将要生成并用于商业医疗诊断产品或试剂盒的生物标志物谱。
所述方法提供了将要以多种方式确定的并且可以是使用诸如比例或其他更复杂的关联方法或算法(例如,基于规则的方法)的方法确定的可测量生物标志物或生物标志物的多个方面的组合的生物标志物谱。生物标志物谱可包含至少两个测量值,其中该测量值可对应于相同或不同的生物标志物。生物标志物谱还可包含至少3、4、5、10、15、20、25、30、35、40、45、50、55个或更多个测量值。在一些应用中,生物标志物谱包含数百个或甚至数千个测量值。生物标志物谱可包含仅来自个体或包含来自个体的测量值以及来自已知与个体相关的分层群体或已知与个体无关的分层群体或两者的测量值。
此外,生物标志物谱还提供了本文提供的可各自独立地且独立地评估的生物标志物的存在与否或量,或者此类其他生物标志物的存在与否和/或量可包含在本文公开的方法中建立的受试者谱或参考谱内。
V.生物标志物的应用
通常,所述方法至少包括以下步骤:(a)获得生物样品,(b)进行生物样品分析,(c)将该样品与参照对照进行比较,以及(d)将蛋白质的存在或量与受试者的结肠息肉状态相关联。在本公开的一些方面,定量包括将测量值相对于已知处在恒定水平的内标对照进行归一化。在本公开的其他方面,定量包括与来自健康非患病无肿瘤的受试者的参考对照进行比较并确定差异表达。在本公开的其他方面,定量包括与来自患有肿瘤的患病受试者的参考对照进行比较并确定差异表达。从该方法获得的数据可用于创建“谱”,该谱用于预测疾病状态、复发或对治疗的反应。一旦创建了谱,则可将试验结果与标准谱进行比较,并可得到与反应的相关性。应当理解,通常对描述的谱进行优化。本公开并不限于这种特定的生物标志物谱的使用。提供有用信息的一种或多种标志物的任何组合可在本公开的方法中使用。例如,应当理解,可以加入或从签名中减去一种或多种标志物,同时保持该签名产生有用信息的能力。
在本公开的一个方面,所有或一些生物标志物或生物标志物的组合的定量可用于检测受试者中存在结肠息肉的可能性。在本公开的另一方面,所有或一些生物标志物或生物标志物的组合可用于通过鉴定受试者样品的一种或多种性质来检测结肠肿瘤的性质,包括但不限于,良性的存在、息肉的类型、癌变前的阶段、发育异常的程度、亚型腺瘤性息肉或良性结肠肿瘤疾病的亚型以及预后。在本公开的一个方面,所有或一些生物标志物或生物标志物的组合可用于检测患上结肠肿瘤或息肉的可能性。在本公开的一个方面,所有或一些生物标志物或生物标志物的组合可用于排除结肠肿瘤或息肉的存在,即确定受试者不存在结肠息肉、癌或两者均不存在。在本公开的另一方面,所有或一些生物标志物或生物标志物的组合可用于确定肿瘤的性质,即,它是否是良性肿瘤息肉、恶性肿瘤、腺瘤性息肉、有蒂息肉或无蒂息肉型。
在本公开的一个方面,所有或一些生物标志物或生物标志物的组合可用于生成报告,该报告有助于结肠直肠癌或结肠肿瘤的临床管理的下一步骤。在本公开的一个方面,所有或一些生物标志物或生物标志物的组合可用于监测对结肠直肠癌或结肠肿瘤的各种治疗的反应性。在本公开的一个方面,所有或一些生物标志物或生物标志物的组合可用于监测具有患结肠直肠癌或结肠肿瘤的倾向的受试者。在本公开的一个方面,所有或一些生物标志物或生物标志物的组合可用于监测受试者的结肠直肠癌或结肠肿瘤的复发。在本公开的一个方面,所有或一些生物标志物或生物标志物的组合可用于监测受试者的结肠直肠癌或息肉的复发。
在一些实施方案中,所述方法包括鉴定来自受试者的生物样品的细胞中的生物标志物的谱,其中所述模式与疾病或状况或反应的可能性相关联。
在该方法的一些方面,通过由例如定量免疫荧光或基于ELISA的测定法、流式细胞术或本文提供的其他免疫测定来对蛋白质表达水平进行定量来检测一种或多种生物标志物或生物标志物谱。在该方法的一些方面,通过例如使用特异性扩增与DNA或RNA相对应的生物标志物的引物组的实时PCR对多核苷酸的表达水平进行定量来检测生物标志物谱。在本公开的另一方面,该谱由包含生物标志物的捕获特征(例如,抗体、探针等)的生物芯片来检测。生物芯片可根据生物样品中或来自受试者的多核苷酸例如mRNA的表达水平或者通过使用例如抗体检测患者样品中的蛋白质的表达水平来检测生物标志物谱的存在。在另一些实施方案中,通过使用引物组的实时PCR来检测肿瘤细胞谱,该引物组特异性地扩增包含癌干细胞签名的基因。在本公开的其他实施方案中,提供了包含多核苷酸或蛋白质(即抗体)的微阵列,该多核苷酸或蛋白质(即抗体)检测癌干细胞签名的表达以用于预后。
可将生物样品的生物标志物谱与参考谱进行比较并可确定结果。在本公开的一个方面,将从本文所述的试验产生的数据与由谱模型定义的参考谱进行比较,该谱模型由一个或多个生物样品的测量值得到。可以将试验安排为使得单个患者样品可与考虑到的这些群体一起查看并被分配给一个群体或其他群体或者两者的混合,并随后使用这种与患者管理、疗法、预后等的相关性。
在本公开的一个方面,从本文所述的方法和试剂盒检测产生的数据与可视化手段一起使用,该可视化手段能够指示样品中的所述一种或多种标志物或片段的量是否在某个阈值水平以上或以下,或者样品中的所述一种或多种标志物或片段的量是否偏离或不偏离所述一种或多种标志物或片段的量的参考值,所述参考值表示如本文所教导的疾病或状况的已知诊断、预测或预后。
在本公开的一个方面,选择从本文所述的方法或试剂盒检测产生的确定为阈值水平的数据,使得样品中的所述一种或多种标志物和/或片段的量在所述阈值水平以上或以下(取决于标志物以及疾病或状况)指示受试者患有相应的疾病或状况或处于患有相应的疾病或状况的风险下,或者指示受试者的相应的疾病或状况的不良预后,以及样品中的所述一种或多种标志物和/或片段的量在所述阈值水平以下或以上(取决于标志物以及疾病或状况)指示受试者不患有如本文所教导的疾病或状况或不处于患有该疾病或状况的风险下,或者指示受试者的该疾病或状况的良好预后。
在本公开的一个方面,从本文所述的方法和试剂盒检测产生的确定样品中的核酸分子或分析物的相对量的数据可有利地表示为相对于所述另一个值,诸如相对于如本文教导的参考值、权重或等级的增加或减少,或表示为倍数增加或倍数减少。在第一和第二参数(例如,第一和第二量)间进行相对比较可以但不是必然需要首先确定所述第一和第二参数的绝对值。例如,测量方法可以产生所述第一和第二参数的可量化读数(例如,信号强度),其中所述读数是所述参数的值的函数,并且其中可以直接比较所述读数,以产生第一参数相对于第二参数的相对值,而实际上无需首先将读数转化为相应参数的绝对值。
A.灵敏度和特异性
灵敏度和特异性是二元分类试验的性能的统计度量。完美的分类预测指标(predictor)被描述为100%灵敏(即,将来自患病组的所有人预测为患病)和100%特异(即,不将来自健康组的任何人预测为患病);然而,理论上任何分类预测指标将具有最小误差。(AltmanDG,Bland JM(1994)."Diagnostic tests Sensitivity and Specificity".BMJ 308(6943):1552和Loong T(2003)."Understanding sensitivity andspecificity with the right side of the brain".BMJ 327(7417):716-719)。
在本公开方法的一个方面,使用全部或一些生物标志物或生物标志物的组合针对受试者的腺瘤或息肉状态实现了选自大于60%真阳性、70%真阳性、75%真阳性、85%真阳性、90%真阳性、95%真阳性或99%真阳性的灵敏度。在本公开方法的一个方面,使用全部或一些生物标志物或生物标志物的组合针对受试者的腺瘤、癌症或息肉状态实现了选自大于60%真阴性、70%真阴性、75%真阴性、85%真阴性、90%真阴性、95%真阴性或99%真阴性的特异性。在本公开方法的一个方面,使用全部或一些生物标志物或生物标志物的组合排除了或没有确定结肠直肠癌的存在与否。在本公开方法的一个方面,通过附加试验如结肠镜检查、其他成像方法或诊断试验或手术来确认腺瘤、癌症或息肉状态的存在与否。在本公开方法的一个方面,使用全部或一些生物标志物或生物标志物的组合针对受试者的腺瘤、癌症或息肉状态实现了选自大于70%真阳性和小于30%真阴性、75%真阳性和小于25%真阴性、85%真阳性和小于15%真阴性、90%真阳性和小于10%真阴性、95%真阳性和小于5%真阴性、或99%真阳性和小于1%真阴性的灵敏度和特异性。
在本公开方法的一个方面,使用全部或一些生物标志物或生物标志物的组合针对受试者的结肠直肠癌的存在与否实现了选自大于70%真阳性、75%真阳性、85%真阳性、90%真阳性、95%真阳性或99%真阳性的灵敏度。在本公开方法的一个方面,使用全部或一些生物标志物或生物标志物的组合针对受试者的结肠直肠癌的存在与否实现了选自大于70%真阴性、75%真阴性、85%真阴性、90%真阴性、95%真阴性或99%真阴性的特异性。在本公开方法的一个方面,不检测结肠直肠癌的存在与否。在本公开方法的一个方面,通过附加试验如结肠镜检查、其他成像方法或诊断试验或手术来确认结肠直肠癌的存在与否。在本公开方法的一个方面,使用全部或一些生物标志物或生物标志物的组合针对受试者的结肠直肠癌的存在与否实现了选自大于70%真阳性和小于30%真阴性、75%真阳性和小于25%真阴性、85%真阳性和小于15%真阴性、90%真阳性和小于10%真阴性、95%真阳性和小于5%真阴性、或99%真阳性和小于1%真阴性的灵敏度和特异性。
在本公开方法的一个方面,使用全部或一些生物标志物或生物标志物的组合针对受试者的腺瘤性息肉或息肉样腺瘤的存在与否实现了选自大于70%真阳性、75%真阳性、85%真阳性、90%真阳性、95%真阳性或99%真阳性的灵敏度。在本公开方法的一个方面,使用全部或一些生物标志物或生物标志物的组合针对受试者的腺瘤性息肉或息肉样腺瘤的存在与否实现了选自大于70%真阴性、75%真阴性、85%真阴性、90%真阴性、95%真阴性或99%真阴性的特异性。在本公开方法的一个方面,通过附加试验如结肠镜检查、其他成像方法或诊断试验或手术来确认腺瘤性息肉或息肉样腺瘤。在本公开方法的一个方面,使用全部或一些生物标志物或生物标志物的组合针对受试者的腺瘤性息肉或息肉样腺瘤的存在与否实现了选自大于70%真阳性和小于30%真阴性、75%真阳性和小于25%真阴性、85%真阳性和小于15%真阴性、90%真阳性和小于10%真阴性、95%真阳性和小于5%真阴性、或99%真阳性和小于1%真阴性的灵敏度和特异性。
在本公开方法的一个方面,使用全部或一些生物标志物或生物标志物的组合针对受试者的有蒂息肉和无蒂息肉的存在与否实现了选自大于70%真阳性、75%真阳性、85%真阳性、90%真阳性、95%真阳性或99%真阳性的灵敏度。在本公开方法的一个方面,使用全部或一些生物标志物或生物标志物的组合针对受试者的有蒂息肉和无蒂息肉的存在与否实现了选自大于70%真阴性、75%真阴性、85%真阴性、90%真阴性、95%真阴性或99%真阴性的特异性。在本公开方法的一个方面,通过附加试验如结肠镜检查、其他成像方法或诊断试验或手术来确认有蒂息肉和无蒂息肉的存在与否。在本公开方法的一个方面,使用全部或一些生物标志物或生物标志物的组合针对受试者的有蒂息肉和无蒂息肉的存在与否实现了选自大于70%真阳性和小于30%真阴性、75%真阳性和小于25%真阴性、85%真阳性和小于15%真阴性、90%真阳性和小于10%真阴性、95%真阳性和小于5%真阴性、或99%真阳性和小于1%真阴性的灵敏度和特异性。
在本公开方法的一个方面,使用全部或一些生物标志物或生物标志物的组合针对根据细胞发育异常或恶变前的程度表征的受试者的腺瘤性息肉或息肉样腺瘤实现了选自大于70%真阳性、75%真阳性、85%真阳性、90%真阳性、95%真阳性或99%真阳性的灵敏度。在本公开方法的一个方面,使用全部或一些生物标志物或生物标志物的组合针对根据细胞发育异常或恶变前的程度表征的受试者的腺瘤性息肉或息肉样腺瘤实现了选自大于70%真阴性、75%真阴性、85%真阴性、90%真阴性、95%真阴性或99%真阴性的特异性。在本公开方法的一个方面,通过附加试验如结肠镜检查、其他成像方法或诊断试验或手术来确认根据细胞发育异常或恶变前的程度表征的腺瘤性息肉或息肉样腺瘤。在本公开方法的一个方面,使用全部或一些生物标志物或生物标志物的组合针对根据细胞发育异常或恶变前的程度表征的受试者的腺瘤性息肉或息肉样腺瘤实现了选自大于70%真阳性和小于30%真阴性、75%真阳性和小于25%真阴性、85%真阳性和小于15%真阴性、90%真阳性和小于10%真阴性、95%真阳性和小于5%真阴性、或99%真阳性和小于1%真阴性的灵敏度和特异性。
VI.系统
本公开的系统和方法基于和/或通过使用一个或多个计算机处理器系统而设计。本公开的计算机系统的实例在下文进行了描述。所述计算机系统的变化形式是可能的,只要它们提供用于本公开的系统和方法的平台。
本公开的计算机系统的一个实例显示于图13中。图13中显示的计算机系统1300可被理解为可从介质1311和/或网络端口1305读取指令的逻辑装置,该介质1311和/或网络端口1305可任选地连接到具有固定介质1312的服务器1309。如在图13中所示的系统可包含CPU 1301、磁盘驱动器1303、任选的输入设备(如键盘1315和/或鼠标1316)以及任选的监视器1307。数据通信可通过通往在本地或远程位置的服务器的指定通信介质来实现。通信介质可包括传送和/或接收数据的任何手段。例如,通信介质可以是网络连接、无线连接或因特网连接。这样的连接可提供在万维网上的通信。可以预想到,与本公开相关的数据可以通过这样的网络或连接进行传送,以便由如图13显示的主体1322接收和/或审查。
图14为显示了可以与本公开的示例性实施方案结合使用的计算机系统1400的示例性架构的框图。如图14中所示,该示例性的计算机系统可以包括用于处理指令的处理器1402。处理器的非限制性实例包括:Intel XeonTM处理器、AMD OpteronTM处理器、Samsung32-bit RISC ARM 1176JZ(F)-S vl.OTM处理器、ARM Cortex-A8Samsung S5PC100TM处理器、ARM Cortex-A8 Apple A4TM处理器、Marvell PXA 930TM处理器或功能上等同的处理器。多个执行线程可用于并行处理。在本公开的一些方面,也可使用多个处理器或具有多个核的处理器,无论是在单个计算机系统中,在集群中,还是通过包括多个计算机、蜂窝电话和/或个人数据助理设备的网络分布在整个系统上。
如图14中所示,高速缓冲存储器1404可以连接到或并入处理器1402以提供处理器1402最近或频繁使用的指令或数据的高速存储器。处理器1402通过处理器总线1408连接到北桥1406。北桥1406通过存储器总线1412连接到随机存取存储器(RAM)1410,并管理处理器1402对RAM 1410的访问。北桥1406还通过芯片组总线1416连接到南桥1414。南桥1414又连接到外围总线1418。该外围总线可以是,例如,PCI、PCI-X、PCI Express或其他外围总线。北桥和南桥通常称作处理器芯片组,并管理处理器、RAM以及外围总线1418上的外围组件之间的数据传输。在一些可替代的架构中,北桥的功能可并入处理器中而不是使用单独的北桥芯片。在本公开的一些方面,系统100可以包括连接到外围总线1418的加速器卡1422。该加速器可以包括现场可编程门阵列(FPGA)或用于加速某种处理的其他硬件。例如,加速器可以用于自适应数据重组或用于评估在扩展集处理中使用的代数表达式。
软件和数据存储在外部存储1424中并且可以加载到RAM 1410和/或缓存1404中,以供处理器使用。系统1400包括用于管理系统资源的操作系统;操作系统的非限制性实例包括:Linux、WindowsTM、MACOSTM、BlackBerry OSTM、iOSTM和其他功能等同的操作系统,以及在操作系统的顶端上运行的用于管理数据存储并根据本公开的示例性实施方案进行优化的应用软件。
在这个实例中,系统1400还包括连接至外围总线的网络接口卡(NIC)1420和1421,以用于向外部存储如网络附加存储(NAS)和可用于分布式并行处理的其他计算机系统提供网络接口。
图15为示出了具有多个计算机系统1502a和1502b、多个蜂窝电话和个人数字助理1502c以及网络附加存储(NAS)1504a和1504b的网络1500的示意图。在示例性的实施方案中,系统1502a、1502b和1502c可以管理数据存储并优化存储在网络附加存储(NAS)1504a和1504b中的数据的数据存取。数学模型可用于该数据并使用跨计算机系统1502a和1502b以及蜂窝电话和个人数字助理系统1502c的分布式并行处理进行评价。计算机系统1502a和1502b以及蜂窝电话和个人数字助理系统1502c也可提供用于存储在网络附加存储(NAS)1504a和1504b中的数据的自适应数据重组的并行处理。很多种其他计算机构架和系统可与本公开的各个实施方案结合使用。例如,刀片式服务器可用于提供并行处理。处理器刀片可以通过底板连接,以提供并行处理。存储也可通过单独的网络接口连接到底板或作为网络附加存储(NAS)。
在一些示例性实施方案中,处理器可以保持独立的存储器空间,并通过网络接口、底板或用于其他处理器进行并行处理的其他连接器传送数据。在其他实施方案中,一些或所有处理器可使用共享的虚拟地址存储空间。
图16为根据示例性实施方案的使用共享的虚拟地址存储空间的多处理器计算机系统1600的框图。该系统包括可访问共享的存储器子系统1604的多个处理器1602a-f。该系统在存储器子系统1604中并入多个可编程硬件存储算法处理器(MAP)1606a-f。每个MAP1606a-f可包含存储器1608a-f以及一个或多个现场可编程门阵列(FPGA)1610a-f。该MAP提供可配置功能单元,并且特定算法或算法的一部分可提供给FPGA 1610a-f以用于密切配合相应的处理器进行处理。例如,该MAP可用于评估关于数据模型的代数表达式并用于进行示例性实施方案中的自适应数据重组。在该实例中,每个MAP可由所有处理器进行全局访问以用于这些目的。在一种配置中,每个MAP可以使用直接存储器存取(DMA)来访问相关联的存储器1608a-f,从而允许它独立于相应的微处理器1602a-f且与相应的微处理器1602a-f异步地执行任务。在该配置中,MAP可将结果直接馈送至另一个MAP,以用于算法的流水线和并行执行。本公开预想计算机可读存储介质,例如CD-ROM、存储键、闪存卡、软磁盘或其上存储有程序的其他有形介质,其在计算环境中执行时,执行自定义算法以实现如本公开方法所述的所提供的生物样品的预测可能性或评估的全部或部分结果。在各个实施方案中,该计算机可读存储介质是非暂时性的。
本公开的系统和方法整合了一个或多个实验室设备。
在一些实施方案中,该整合在实验室信息管理系统(LIMS)或更低的水平下进行。计算机系统可以运行多个实验室设备。用于实验室应用的软件和硬件可使用本公开的方法和系统进行整合。在各个实施方案中,具有共有功能的相似组件在多个实验室设备中重复使用。
计算机系统可控制各个设备中的多个组件,从而创建可用组件的新的组合。在另一实例中,本公开的计算机系统可通过控制该实验室设备内的泵、传感器或其他组件来控制质谱法、板处理法、液相色谱法。软件可由包括独立的实验室最终用户或任何其他合适的用户在内的任何人提供。LIMS在整合实验室系统中的使用进一步描述于美国专利申请7,991,560中,该专利申请通过引用以其整体并入本文。
在其中试剂盒提供计算机可读介质的方案中,它将包含用于执行本公开的方法的完整程序。该程序包含用于收集、分析并生成输出的程序指令,并且通常包含用于与本文所述的用户交互、处理该数据以及分析信息并生成针对该用户独特的印刷或电子介质的计算机可读代码和设备。
在其他方面,所述试剂盒提供了仅运行本公开方法的一部分的有限的计算机可读介质。在这方面,该试剂盒提供了这样的程序,该程序提供来自用户的数据输入并用于将用户输入(例如,经由因特网,经由内部网等)的数据传送至在远程地点的计算环境如服务器(在其上将进行本公开的自定义数学算法)。由用户提供的数据处理的处理或完成在远程地点进行,并且该服务器也将用来生成报告。在审查报告并完成提供完整报告所需的任何人工干预后,将完整的报告作为电子报告或打印的报告传送回用户。
根据本公开的包含程序的存储介质可与用于程序安装和使用的说明或可以从中获得这样的说明的网址一起包装。
VII.报告
当本公开的方法用于商业诊断目的,例如用于医疗领域中时,通常将生成从该方法获得的信息的报告或汇总。
该方法的报告或汇总可包含关于一种或多种基因或蛋白质的表达水平、息肉或肿瘤的分类、患者的风险水平(如高、中或低)、患者的预后、治疗选择、治疗建议、生物标志物表达以及如何确定生物标志物水平、生物标志物谱、临床和病理因素的信息和/或与患者疾病状态相关的患者或群组的其他标准临床信息。
所述方法和报告可存储在数据库中。该方法可以在数据库中创建受试者的记录并将数据填入该记录。该报告可以是纸质报告、音频报告或电子记录。该报告可以显示和/或存储在计算设备(例如,手持设备、台式计算机、智能设备、网站等)上。可以预期,报告将提供给医师和/或患者。报告的接收可进一步包括建立与包含所述数据和报告的服务器计算机的网络连接,并从该服务器计算机请求该数据和报告。
在另一方面,本公开提供了生成包含关于从受试者获得的生物样品的生物标志物信息的报告的方法,该方法包括以下步骤:确定样品中以下一种或多种生物标志物或其结合配偶体之一的生物标志物谱表达水平:SCDC26(CD26)、CEA分子5(CEACAM5)、CA195(CCR5)、CA19-9、M2PK(PKM2)、TIMP1、P-选择蛋白(SELPLG)、VEGFA、HcGB(CGB)、绒毛蛋白、TATI(SPINK1)、A-L-岩藻糖苷酶(FUCA2)、ANXA5、GAPDH、PKM2、ANXA4、GARS、RRBP1、KRT8、SYNCRIP、S100A9、ANXA3、CAPG、HNRNPF、PPA1、NME1、PSME3、AHCY、TPT1、HSPB1和RPSA和/或图9中的蛋白质或它们的修饰形式,并创建汇总它们的表达水平的报告。在一些方面,该报告可进一步包含将受试者分类成风险组,诸如“低风险”、“中等风险”或“高风险”的分类。在各个实施方案中,包括上述蛋白质中的两种、三种、四种、五种、六种、七种、八种、九种、十种、十一种和全部十二种的群组。这样的群组可排除另外的蛋白质,或可以进一步包含另外的蛋白质。
在所述方法的一个方面,如果确定了以下一种或多种生物标志物或其结合配偶体之一的表达增加:SCDC26(CD26)、CEA分子5(CEACAM5)、CA195(CCR5)、CA19-9、M2PK(PKM2)、TIMP1、P-选择蛋白(SELPLG)、VEGFA、HcGB(CGB)、绒毛蛋白、TATI(SPINK1)、A-L-岩藻糖苷酶(FUCA2)、ANXA5、GAPDH、PKM2、ANXA4、GARS、RRBP1、KRT8、SYNCRIP、S100A9、ANXA3、CAPG、HNRNPF、PPA1、NME1、PSME3、AHCY、TPT1、HSPB1和RPSA和/或图9中的蛋白质或它们的修饰形式,则所述报告包含关于所述受试者具有患有结肠息肉的增加的可能性的预测。在各个实施方案中,包括上述蛋白质中的两种、三种、四种、五种、六种、七种、八种、九种、十种、十一种和全部十二种的群组。这样的群组可排除另外的蛋白质,或可以进一步包含另外的蛋白质。
在所述方法的另一方面,如果确定了以下一种或多种生物标志物或其结合配偶体之一的表达增加:SCDC26(CD26)、CEA分子5(CEACAM5)、CA195(CCR5)、CA19-9、M2PK(PKM2)、TIMP1、P-选择蛋白(SELPLG)、VEGFA、HcGB(CGB)、绒毛蛋白、TATI(SPINK1)、A-L-岩藻糖苷酶(FUCA2)、ANXA5、GAPDH、PKM2、ANXA4、GARS、RRBP1、KRT8、SYNCRIP、S100A9、ANXA3、CAPG、HNRNPF、PPA1、NME1、PSME3、AHCY、TPT1、HSPB1和RPSA和/或图9中的蛋白质或它们的修饰形式,则所述报告包含关于所述受试者具有患有结肠息肉的降低的可能性的预测。在各个实施方案中,包括上述蛋白质中的两种、三种、四种、五种、六种、七种、八种、九种、十种、十一种和全部十二种的群组。这样的群组可排除另外的蛋白质,或可以进一步包含另外的蛋白质。
在一个方面,该报告包括支持针对所述患者的治疗建议的信息。例如,该信息可以包括定制诊断试验、结肠镜检查、手术、治疗性治疗中的一个或多个以及不采取进一步的医疗行动的建议,此类治疗的有益得分的可能性,或其他此类数据。在一些实施方案中,该报告进一步包括对所述患者的治疗方式的建议。
在本公开的一个方面,所述报告是纸质形式。在本公开的一个方面,所述报告是电子形式,如CD-ROM、闪存驱动器、本领域中已知的其他电子存储设备。在本公开的另一方面,电子报告从有线或无线网络下载到第二计算机设备,如膝上型计算机、移动电话或平板电脑上。
在一个方面,所述报告指示,如果确定了以下一种或多种生物标志物或其结合配偶体之一的表达增加:SCDC26(CD26)、CEA分子5(CEACAM5)、CA195(CCR5)、CA19-9、M2PK(PKM2)、TIMP1、P-选择蛋白(SELPLG)、VEGFA、HcGB(CGB)、绒毛蛋白、TATI(SPINK1)、A-L-岩藻糖苷酶(FUCA2)、ANXA5、GAPDH、PKM2、ANXA4、GARS、RRBP1、KRT8、SYNCRIP、S100A9、ANXA3、CAPG、HNRNPF、PPA1、NME1、PSME3、AHCY、TPT1、HSPB1和RPSA和/或图9中的蛋白质或它们的修饰形式,则所述报告包含关于所述受试者在5-10年具有结肠息肉或肿瘤复发的增加的可能性的预测。在各个实施方案中,包括上述蛋白质中的两种、三种、四种、五种、六种、七种、八种、九种、十种、十一种和全部十二种的群组。这样的群组可排除另外的蛋白质,或可以进一步包含另外的蛋白质。
在另一方面,所述报告指示,如果确定了以下一种或多种生物标志物或其结合配偶体之一的表达增加:SCDC26(CD26)、CEA分子5(CEACAM5)、CA195(CCR5)、CA19-9、M2PK(PKM2)、TIMP1、P-选择蛋白(SELPLG)、VEGFA、HcGB(CGB)、绒毛蛋白、TATI(SPINK1)、A-L-岩藻糖苷酶(FUCA2)、ANXA5、GAPDH、PKM2、ANXA4、GARS、RRBP1、KRT8、SYNCRIP、S100A9、ANXA3、CAPG、HNRNPF、PPA1、NME1、PSME3、AHCY、TPT1、HSPB1和RPSA和/或图9中的蛋白质或它们的修饰形式,则所述报告包含关于所述受试者在5-10年具有结肠息肉或肿瘤复发的降低的可能性的预测。在各个实施方案中,包括上述蛋白质中的两种、三种、四种、五种、六种、七种、八种、九种、十种、十一种和全部十二种的群组。这样的群组可排除另外的蛋白质,或可以进一步包含另外的蛋白质。
在本公开的一些方面,所述报告进一步包括针对所述患者的结肠疾病的治疗管理的治疗方式的建议。治疗管理选项可包括但不限于,其他诊断试验,如结肠镜检查、可屈性乙状结肠镜检查(flexsigmoidscopy)、CT结肠成像术、粪便检验、排泄物检验、用治疗剂进一步治疗、手术干预以及不采取进一步行动。
本公开还提供了通过以下步骤制备针对患者的个人生物标志物谱的方法:a)确定从受试者t获得的生物样品中以下至少一种或多种的归一化表达水平:SCDC26(CD26)、CEA分子5(CEACAM5)、CA195(CCR5)、CA19-9、M2PK(PKM2)、TIMP1、P-选择蛋白(SELPLG)、VEGFA、HcGB(CGB)、绒毛蛋白、TATI(SPINK1)、A-L-岩藻糖苷酶(FUCA2)、ANXA5、GAPDH、PKM2、ANXA4、GARS、RRBP1、KRT8、SYNCRIP、S100A9、ANXA3、CAPG、HNRNPF、PPA1、NME1、PSME3、AHCY、TPT1、HSPB1和RPSA和/或图9中的蛋白质或它们的修饰形式或其表达产物;以及(b)创建报告,该报告汇总了通过基因表达分析获得的数据。在各个实施方案中,包括上述蛋白质中的两种、三种、四种、五种、六种、七种、八种、九种、十种、十一种和全部十二种的群组。这样的群组可排除另外的蛋白质,或可以进一步包含另外的蛋白质。
VIII.试剂盒
用于本公开方法的材料适于根据公知的程序生产的试剂盒的制备。本公开提供的试剂盒销售给医疗服务提供者,包括医师、临床实验室科学家、护士、药剂师、处方人员(formulary official)或直接销售给消费者。
试剂盒通常可包含插入材料、组合物、试剂、装置的组件以及关于如何对特定的生物样品类型进行该方法或试验的说明。该试剂盒可进一步包含能够通过各种测定类型(诸如ELISA测定、免疫测定、蛋白质芯片或微阵列、DNA/RNA芯片或微阵列、RT-PCR、核酸测序、质谱法、免疫组织化学法、流式细胞术或高含量细胞筛选)检测生物标志物的试剂。
本公开提供了组合物,诸如能够与如本文所教导的生物标志物、肽、多肽或蛋白质及其片段中的任意一种或多种特异性结合的结合剂。结合剂可包括抗体、适体、光适体(photoaptamer)、蛋白质、肽、肽模拟物或小分子。本公开提供的结合剂包括两种特异性结合剂,该特异性结合剂通过与一种或多种期望的分子或分析物结合,诸如与感兴趣的一种或多种蛋白质、多肽或肽或其片段结合(基本上排除随机或不相关的其他分子,并且任选地基本排除结构相似或相关的其他分子)而起作用。术语“特异性结合”并非必需要求结合剂排他地与其预期的靶标结合。例如,如果在结合条件下,结合剂对预期的靶标的亲和力是其对非靶标分子的亲和力的至少约2倍、优选至少约5倍、更优选至少约10倍、更优选至少约25倍、更优选至少约50倍以及甚至更优选至少约100倍或更多倍,则该结合剂可被称为与感兴趣的蛋白质、多肽、肽和/或其片段特异性结合。
优选地,所述结合剂可以以此类结合的以下亲和常数(KA)与其预期的靶标结合:KA 1x106M-1、更优选KA 1x107M-1、更优选KA1x108M-1、甚至更优选KA 1x109M-1并且更优选KA 1x1010M-1或KA1x1011M-1,其中KA=[SBA_T]/[SBA][1],SBA表示特异性结合剂,T表示预期的靶标。KA的确定可通过本领域中已知的方法进行,例如,使用平衡透析和Scatchard作图分析。
在所述方法和试剂盒的一些应用中,结合剂将为免疫结合剂,如抗体。可在本公开中使用的抗体的实例包括本领域中公知的多克隆和单克隆抗体以及它们的片段。可在本公开的方法和试剂盒中使用的抗体的另外的实例包括由至少两个完整的抗体形成的多价(例如,2价、3价或更高价)和/或多特异性抗体(例如,双特异性或多特异性抗体),以及抗体片段(只要它们表现出期望的生物活性(特别是,特异性结合感兴趣的抗原的能力)),以及这些片段的多价和/或多特异性复合物。
抗体可以是IgA、IgD、IgE、IgG和IgM类中的任意类别,并优选IgG类抗体。抗体可以是多克隆抗体,例如从其纯化的(例如,亲和纯化的)抗血清或免疫球蛋白。抗体可以是单克隆抗体或单克隆抗体的混合物。单克隆抗体可以以较高的选择性和重现性靶向抗原内的特定抗原或特定表位。举例来说,但非限制性地,单克隆抗体可以通过首先由Kohler等人1975(Nature 256:495)描述的杂交瘤方法来制备,或者可以通过重组DNA方法(例如,在US 4,816,567中的)来制备。例如,单克隆抗体还可以使用如Clackson等人1991(Nature 352:624-628)和Marks等人1991(J MolBiol 222:581-597)所述的技术从噬菌体抗体文库中分离。
抗体结合剂可以是抗体片段。“抗体片段”包含完整抗体的一部分,包括其抗原结合区或可变区。抗体片段的实例包括Fab、Fab'、F(ab')2、Fv和scFv片段;双抗体;线性抗体;单链抗体分子;以及由抗体片段形成的多价和/或多特异性抗体,例如双体、三体和多体。上述称谓Fab、Fab'、F(ab')2、Fv、scFv等旨在具有其本领域确定的含义。
制备多克隆和单克隆抗体以及它们的片段的方法是本领域公知的,如用于制备重组抗体或其片段的方法(参见,例如,Harlow和Lane,"Antibodies:A Laboratory Manual",Cold Spring HarbourLaboratory,New York,1988;Harlow和Lane,"Using Antibodies:ALaboratory Manual",Cold Spring Harbour Laboratory,New York,1999,ISBN 0879695447;"Monoclonal Antibodies:A Manual of Techniques",Zola编著,CRC Press 1987,ISBN 0849364760;"Monoclonal Antibodies:A Practical Approach",Dean和Shepherd编著,Oxford University Press2000,ISBN 0199637229;Methods in Molecular Biology,vol.248:"Antibody Engineering:Methods and Protocols",Lo编著,Humana Press2004,ISBN 1588290921)。
本公开的抗体可来源于任何动物物种,优选脊椎动物物种,包括,例如禽类和哺乳动物,或包含由其衍生的一个或多个部分。非限制性地,抗体可以是鸡、鸡蛋、火鸡、鹅、鸭、珍珠鸡、鹌鹑或雉鸡抗体。仍非限制性地,抗体可以是人、鼠(例如,小鼠、大鼠等)、驴、兔、山羊、绵羊、豚鼠、骆驼(例如双峰骆驼(Camelus bactrianus)和单峰骆驼(Camelus dromaderius))、美洲驼(例如,羊驼(Lamapaccos)、大羊驼或骆马)或马抗体。
本公开还提供了针对本文提供的生物标志物的抗体,该抗体可包含一个或多个氨基酸缺失、添加和/或置换(例如,保守置换),只要这样的改变保持其与相应抗原的结合。抗体还可以包含其组成氨基酸残基的一个或多个天然或人工修饰(例如,糖基化等)。
本公开提供的抗体不限于通过包括免疫的方法产生的抗体,且还包括被制备成包含至少一种能够与感兴趣抗原上的表位特异性结合的互补性决定区(CDR)的任何多肽,例如重组表达的多肽。因此,术语抗体或免疫结合剂适用于此类分子,而不论它们是在体外还是在体内产生。
本公开试剂盒中的抗体或免疫结合剂、肽、多肽、蛋白质、生物标志物等可以是各种形式,例如冻干的、在溶液中游离或固定在固相上。抗体或免疫结合剂可以例如在多孔板中或作为阵列或微阵列来提供,或者它们可以单独地和/或分别进行包装。它们可适当地标记以进行检测,如本文所教导的。本文提供的试剂盒可以特别适于进行本公开的测定方法,如免疫测定、ELISA测定、质谱测定、流式细胞术等。
在本公开中提供了将由合格的临床科学家递送并使用的试剂盒。在这样的试剂盒中,本公开提供了包含各种试剂的试剂盒,该试剂可包括识别一种或多种所公开的生物标志物的抗体读出检测抗体,用于量化一种或多种所公开的生物标志物的表达的基因特异性或基因选择性探针和/或引物,用于预测结肠肿瘤状态或对治疗的反应的生物标志物的修饰形式或结合配偶体。
试剂盒可以进一步包含容器(包括适用于所述方法的自动化实现的微量滴定板)、预制的生物芯片、缓冲液、适当的试剂抗体、探针、酶以进行测定。在本公开的一些方面,试剂盒可包含用于从生物样品中提取蛋白质和核酸的试剂,和/或用于DNA或RNA扩增或蛋白质分级分离或纯化的试剂,以及检测生物标志物的捕获生物芯片。试剂盒中的试剂将具有与它们的使用或进行测定的步骤相关的标识描述或标签或说明。此外,该试剂盒可进一步包含与它们在用于确定结肠息肉/肿瘤状态和复发和治疗反应的可能性的方法中的使用相关的说明,或者也可以组合提供计算机可读存储介质以确定结肠息肉/肿瘤状态和复发和治疗反应的可能性。
试剂盒可进一步包含用于数据分析的软件包,其可包含用于比较的参考生物标志物谱。在一些应用中,试剂盒的软件包包含与中心服务器的连接,以进行数据分析,并且其中包含具有对疾病状态的建议、治疗建议或对用于疾病管理的治疗或程序的推荐的报告。
试剂盒中提供的报告可以是纸质或电子报告。它可以由试剂盒中提供的计算机软件或者由计算机服务器来生成,其由用户上传至网站,其中该计算机服务器生成该报告。
在本公开的一些方面,试剂盒可包含用于评估或量化作为试剂盒的组件的预后、诊断、临床状态或预测信息的数学算法。在一些方面,这将通过计算机可读存储介质递送,并且在本公开的其他方面,这可以通过向用户提供访问包含运行数学算法的逻辑的计算机服务器的密码来给出。
试剂盒可以以任何合适的方式进行包装,通常所有元件在单个容器中,并随附用于执行该方法或试验的打印的说明书页。
在本公开中提供了将递送给医师的试剂盒。用于此目的的试剂盒将包含供医师提供医疗信息的电子或书面文件,以及粘贴到含有生物样品和任选的固定/防腐试剂的无菌容纳容器上的条形码标签。在一些方面,这样的试剂盒将包含将通过邮件发送以供通过本文提供的方法进行处理的邮寄说明和供给。
实施例
实施例1
结肠镜检查呈阴性诊断的个体的腺瘤或息肉状态的鉴定
通过使用经验证的生物标志物分类器,针对结肠息肉的存在与否,检测来自基于结肠镜检查为腺瘤或息肉诊断阴性的患者的全血清进行检测。独立地分析来自每个部位的样品的数据(即,验证数据集不用于在发现交叉验证中的训练或测试),并继而对结果间的重叠进行评价。对表E1中的分类器的蛋白质和/或肽进行LC-MS/MS分析。
鉴定生物标志物。例如,生物标志物集示于表E1和表E2以及图7中。
表E1
表E2
序号 名称(别名)
1 ANXA5 膜联蛋白A5
2 GAPDH 甘油醛-3-磷酸脱氢酶
3 PKM2 丙酮酸激酶同工酶M1/M2
4 ANXA4 膜联蛋白A4
5 GARS 甘氨酰-tRNA合成酶
6 RRBP1 核糖体结合蛋白1
7 KRT8 角蛋白II型细胞骨架8
8 SYNCRIP 核内不均一核糖核蛋白Q
9 S100A9 S100A9钙结合蛋白
10 ANXA3 膜联蛋白A3
11 CAPG 巨噬细胞加帽蛋白
12 HNRNPF 核内不均一核糖核蛋白F
13 PPA1 无机焦磷酸酶
14 NME1 核苷二磷酸激酶A
15 PSME3 蛋白酶体激活剂复合物亚基3
16 AHCY 腺苷高半胱氨酸酶
17 TPT1 翻译控制肿瘤蛋白
18 HSPB1 热休克蛋白β-1
19 RPSA 40S核糖体蛋白SA
将这些值与对照参考值进行比较。最后,将分类器谱与低或无风险、中等风险和高风险的分类器谱进行比较,从而使患者样品以约90%或更高的准确率与受试者的预测的腺瘤/息肉状态或正常状态相关联。参见表E3。或者,通过免疫分析如免疫印迹、生物芯片、免疫染色和/或流式细胞术分析使用生物标志物分类器进行临床检测。
表E3
实施例2
先前具有结肠息肉的个体的息肉状态复发的鉴定
使用具有特异性结合或识别针对表E1和/或表E2中的蛋白质生物标志物分类器的抗原的抗体的捕获生物芯片以及对照参考对来自早先具有结肠息肉肿瘤的患者的全血清样品中的抗原进行谱分析。
筛选样品,以确定患者是否具有结肠息肉或息肉的复发。芯片与样品在室温下一起孵育,以使抗体与样品中的抗原形成复合物。接着,用温和的去污剂溶液洗涤芯片,以去除未特异性结合的任何蛋白质或抗体。添加第二抗体与检测试剂的复合物且使其结合该芯片,并用温和的洗涤剂进行洗涤。使用阅读器如CCD相机对蛋白质进行定量。最后,将来自生物芯片读出的分类器谱与低或无风险、中等风险和高风险复发分类器的谱进行比较,以确定患者的复发状态。
实施例3A
在本研究中,从即将接受结肠镜检查的患者中采集血液。使用基于串联质谱法的方法采集关于血浆中存在的基于蛋白质的分子特征的谱的定量数据,并且使用该数据来鉴定特征,该特征包含能够预测结肠镜检查程序的结果的分类器。
研究设计和患者样品采集
为了将血浆蛋白质谱与患者结肠镜检查结果相关联,在他们进行结肠镜检查的当天,从进行结肠镜检查的患者中采集血液样品。入选标准要求患者等于或大于18岁,且愿意并能够签署知情同意书。这是一个“全体愿意参加者(all comers)”研究,其中患者可能经受根据所建议的常规筛查、因先前个人或家族病史而采取的预防措施或对个人健康症状的随访的程序。
在结肠镜检查的常规准备(包含过夜禁食、液体型限制以及去除粪便物质的肠道准备)后,将血液样品吸至包含作为抗凝剂的EDTA的血浆采集设备。根据制造商的说明,将血液样品混合、离心以分离血浆,并在四小时内收集分离的血浆并将其在-80℃下冷冻。
除了血浆样品之外,还收集患者临床数据如年龄、体重、性别、种族、当前的用药和指征以及个人和家族健康史,如同针对任何采集和检查的组织的结肠镜检查程序报告和病理学报告。收集了超过500名患者的样品。在表E4、表E5和表E6中提供了患者人口统计数据。
表E4
表E5
p值来自相关性的卡方检验
表E6
用于血浆蛋白质分析的样品制备
选择152个样品(76个息肉和/或腺瘤和76个对照)用于分类器分析。患者的息肉和/或腺瘤组随机地选自较大的研究组且与对照在年龄和性别上相匹配。制备患者的血浆蛋白质样品用于如下的LCMS测量。将血浆样品从-80℃的存储中解冻并通过过滤器离心去除脂质和颗粒。通过基于免疫亲和柱的消耗去除滤出的血浆中的高丰度蛋白质。通过反相HPLC将较低丰度的流过蛋白质分离成级分。将所选择的蛋白质级分(每个样品6份)通过胰蛋白酶-TFE消化还原成肽,并使所得肽再悬浮于乙腈/甲酸LCMS上样缓冲液中。
LCMS数据采集和蛋白质分子特征量化
将来自每个患者的血浆样品的若干级分的再悬浮的肽通过UHPLC注射至串联质谱仪(Q-TOF)用于定量分析。分析收集的数据(保留时间、质/荷比和离子丰度)以检测观察到的被称为分子特征的峰。三维峰积分算法决定了该分子特征的相对丰度。
在使用三次样条算法进行数据集叠加和校准之后比较来自多个患者样品的分子特征数据。仅被确定为以50%或更高的百分比存在于至少一个患者类别(无或有息肉/腺瘤)中的特征被考虑用于进一步的分析。在该集中缺少患者特征数据的情况下,通过对如在其他样品中观察到的先验峰位置上的原始离子丰度数据进行积分来估算特征值。来自152个患者样品中的每个样品的大于145,000个分子特征包含用于随后的分类器分析的最终数据集。
数据归一化、特征选择和分类器组装
将来源于单个原始中性质量的不同分子特征的定量数据组合并汇总。例如,来自同一母体分子的+2m/z和+3m/z特征通过合并成单个中性质量簇(NMC)值而进行组合。
通过在相同的研究日期以及同一仪器上收集的样品的平均值调节NMC对来自不同样品的分子特征数据进行归一化。平衡数据采集以使得在每个仪器-日期组中评价近似相等数目的无和有息肉/腺瘤样品。这种方法被定义为簇-仪器-日期(“CID”)归一化。
数据的初始分析表明,女性样品的激素替代疗法状态的不平衡可能是分类器构建中的混杂因素。为了消除这种可能性,将表明与HRT相关的分子特征通过不同的分类器组装进行鉴定并从随后的分析中去除。
仅具有来自所有实验级分的完整数据的样品用于分析。在最初测量的152个样品中,保留108个完整的样品。对于大多数排除的样品,6个样品级分中的一个或多个的QC失败导致被排除。
使用最终的归一化数据,创建分类器并对它们从息肉和/或腺瘤样品中鉴别无息肉和腺瘤的患者样品的能力进行评估。在样品数据的五十个70/30训练/测试分割(splits)中的每一个中,使用弹性网络方法进行特征选择,从而将所考虑的NMC的数目从多于100,000个减少至约200-250个。然后,使用这些选定的NMC来构建基于SVM(乙状结肠-核)的分类器。在五十个训练/测试分割的每次迭代中,确定如通过ROC图上的AUC测量的测试数据(灵敏度和特异性的组合测量)的分类器的性能。所得的平均AUC(0.79+/-0.08)示于图1A中。根据二等分该图的虚线,该AUC明显不同于0.5——不能达到鉴别能力的随机测定的值。因此,图1A提供了测试集性能的比较。X轴表示假阳性率。Y轴表示真阳性率。
为了确认弹性网络/SVM分类器性能的稳健性,对类别分配,即息肉/腺瘤相比无息肉/腺瘤进行随机排列,并在整个五十次迭代中再次进行整个特征选择和分类器组装过程。所得平均AUC(0.52+/-0.09)示于图2A中,且表明诸如正确分配确定的结果不太可能偶然出现。因此,图2A提供了测试集性能的验证。X轴表示假阳性率。Y轴表示真阳性率。
结果的显著性的另外的测量是单个NMC在五十个70/30训练/测试分割分类器中出现的频率的列表。在每一次迭代中,为分类器选择约200-250个特征;特征在50次迭代中出现至少3次或更多次是非偶然预期的结果。特征频率表的帕累托图(排序的直方图)示于图3A中。该数据指示大量特征被多次选择,从而表明它们参与鉴别分类器的稳健性。当选择频率最高的特征(即,不同相关组中的前30个)并将其用于在嵌套的70(70/30)/30分析结构中构建分类器时,所得平均AUC仍然明显不同于随机的。该结果指示存在可由选定的特征集构建的多个分类器。
分类器分子特征的子集
通过外循环/内循环策略来鉴定分类器特征的较小子集。在该方法中,样品分成50个外循环70/30分割和500个内循环70/30分割。进行多个内循环用于特征选择,计算SVM分类器内部测试的ROCAUC,并且选择500次迭代中最好的5%并保留所包含的特征。使用弹性网络选择最终的一组特征,以构建外循环SVM分类器。对于不同大小的分类器,使用来自选定的内循环的特征的频率等级来确定特征的优先顺序(例如,频率最高的10、20、30个等)。基于外循环测试集评估所得分类器,且测量性能AUC。图5示出了50次外循环迭代的平均ROC,且表明大小为30的分类器保留了显著的预测值(AUC=0.645+/-0.092)。在图5中,Y轴显示真阳性率而X轴显示假阳性率。由于确认该结果不能偶然得到,因此对50个不同的样品集(其中样品类别分配已随机重新分配)执行该程序。所得AUC(0.502+/-0.101,如图6中所示)是随机的,从而确认了正确的类别分配结果的稳健性。在图6中,Y轴显示真阳性率而X轴显示假阳性率。表E7表明已用大小为10个特征或NMC的分类器证明了显著性能的类似迹象。
表E7
大小 AUC sd
100 0.70 0.08
50 0.66 0.09
40 0.65 0.09
30 0.64 0.09
20 0.63 0.09
10 0.60 0.09
分类器分子特征的鉴定
通过质谱法进行的分子特征的质量测定足够准确和精确地提供唯一的鉴定。在本实施例中组装的分类器中表示的1014个特征(每个特征出现3次或更多次)的质量在如图7的附表中列出。准确的质量对于分子特征是固有唯一地鉴定性的,因此可以确定这些特征的一级氨基酸序列和任何翻译后修饰以便将它们的测量值转化为可替代的表示。
实施例3B
研究设计对应于实施例3A的研究设计,并具有以下附加细节。
LCMS数据采集和蛋白质分子特征量化
经由UHPLC将来自每个患者的血浆样品的若干级分的再悬浮的肽注射至串联质谱仪(Q-TOF),以用于定量分析。对收集的数据(保留时间、质/荷比和离子丰度)进行分析,以检测所观察到的被称为分子特征的峰。三维峰积分算法确定了分子特征的相对丰度。平均来说,从每个血浆样品中检测并定量出约364,000个分子特征。
在使用三次样条算法进行数据集叠加和校准之后比较来自多个患者样品的分子特征数据。仅被确定为以50%或更高的百分比存在于至少一个患者类别(无或有息肉/腺瘤)中的特征被考虑用于进一步的分析。在该集中缺失患者特征数据的情况下,通过对如在其他样品中观察到的先验峰位置上的原始离子丰度数据进行积分来估算特征值。来自152个患者样品中的每个样品的约149,000个分子特征包含用于随后的分类器分析的最终数据集。
数据归一化、特征选择和分类器组装
将来源于单个原始中性质量的不同分子特征的定量数据组合并汇总。例如,来自同一母体分子的+2m/z和+3m/z特征通过合并成单个中性质量簇(NMC)值而进行组合。NMC的总数目为约105,000个。
细节如实施例3A中所述。此外,通过用于指示较高鉴定概率的参数对特征进行过滤;例如,仅考虑电荷状态大于1(z>1)的特征。这将用于分类器分析的NMC的总数目减少至约47,000个。
进一步参考对实施例3A的分析,在该分析中,使用十轮10折交叉验证来选择特征并构建分类器。在每一轮中,90%的数据用于使用弹性网络回归算法来选择特征,基于所确定的特征系数的排序来选择前20个特征,并随后构建具有线性核的SVM分类器。然后,基于所给倍数的测试集中提供的10%的样品对这个最终的分类器进行评估。因此,在每一轮的10折交叉验证中,每一个样品在测试集中仅出现一次。使用来自每一个样品的分类器的预测测试集值来构建该轮的ROC图,其中每个样品一个点。对十个ROC图(每一轮一个)进行平均化并绘图。针对分析中使用的108个完整的样品,以及通过使用原始结肠镜检查确定的诊断作为比较物,得到20个特征分类器的中值AUC为0.91。平均AUC为0.91±0.021。图1B。
为了确认分类器性能的稳健性,对类别分配,即息肉/腺瘤相比无息肉/腺瘤进行随机排列,并在整个十轮的10折交叉验证中再次进行整个特征选择和分类器组装过程,如本文所述。中值AUC(0.52)和平均AUC(0.52±0.033)(图2B)表明诸如正确分配确定的结果(AUC 0.91)不大可能偶然出现。
结果的显著性的另外的测量是单个NMC在十轮的10折交叉验证中创建的100个分类器中出现的频率的列表。在每一次迭代中,选择20个特征用于分类器;特征在多个分类器中的出现指示特征选择和分类器过程的稳健性。通过使用原始诊断构建分类器(如在图1B中观察到的),多数特征被选择了不止一次。最频繁被选的特征从100个分类器中的99个中选择。参见图4。相比之下,通过使用随机特征选择,最频繁被选的特征仅被选择了三次。总之,206个特征在100个20特征分类器中的一个或多个中出现。
分类器分子特征的鉴定
通过质谱法进行的分子特征的质量测定足够准确和精确地提供唯一的鉴定。在本实施例中组装的分类器中表示的206个特征的质量在如图8的附表中列出。准确的质量对于分子特征是固有唯一地鉴定性的,因此可以确定这些特征的一级氨基酸序列和任何翻译后修饰以便将它们的测量值转化为可替代的表示。
实施例4
MRM测定发展
最初,对先前报道为与结肠直肠癌具有关联的188种蛋白质在计算机上进行查询以揭示用于靶向蛋白质组谱分析的潜在肽候选物。从成千上万个潜在的胰蛋白酶肽中,选择初步的一组1056个用于实验验证。从实验验证中选择最终一组337个肽(代表187种蛋白质),以包含最终的多反应监测(MRM)试验。此外,将用重(全部为C13)精氨酸(R)或赖氨酸(K)标记的具有确切序列组成的337个补充肽作为内标物而并入,以在最终分析中用作归一化参考。
用于血浆蛋白质分析的样品制备
根据两种方法(称为稀释和消耗)制备用于MRM LCMS测量的患者血浆蛋白质样品。
在稀释方法中,将血浆样品从-80℃存储中解冻并通过过滤器离心去除脂质和颗粒。将剩余的蛋白质通过胰蛋白酶-TFE消化还原成肽,并使所得肽再悬浮于乙腈/甲酸MRM LCMS上样缓冲液中。
在消耗方法中,将血浆样品从-80℃存储中解冻并通过过滤器离心去除脂质和颗粒。通过基于免疫亲和柱的消耗去除滤出的血浆中的高丰度蛋白质。将较低丰度的流过蛋白质用胰蛋白酶-TFE消化还原成肽,并使所得肽再悬浮于乙腈/甲酸MRM LCMS上样缓冲液中。
LCMS数据采集和过渡特征量化
经由UHPLC将来自每个患者的血浆样品的再悬浮的肽注射至三重四极杆质谱仪(QQQ),以用于定量分析。对收集的数据(保留时间、前体质量、碎片质量和离子丰度)进行分析,以检测所观察到的被称为过渡的峰。
采用二维峰积分算法来确定每个过渡峰的曲线下面积(AUC)。
将用重(全部为C13)精氨酸(R)或赖氨酸(K)标记的具有确切序列组成的补充肽用作676个靶向过渡中的每一个的内标物。采用补充的内标AUC值对过渡AUC值进行归一化,以得到每个过渡的浓度值。
数据归一化、特征选择和分类器组装
对于分类器组装和性能评估,基于原始肽峰面积与相关联的标记的标准肽原始峰面积的比值来使用特征浓度值。不对其原始峰面积应用归一化。将过渡的缺失值设置为0。
使用10×10折交叉验证过程来评估分类器模型和相关的分类性能。在该过程中,首先应用特征选择来减少所使用的特征的数目,接着是分类器模型的开发以及随后的分类性能评估。对于每轮10折交叉验证,将数据分成10个分割份,每个包含90%的样品作为训练集而剩余10%的样品作为测试集。在该过程中,总共95个样品中的每一个在测试集中评估一次。仅使用训练集进行特征选择和模型组装过程,并且随后将这些模型应用于测试集以评估分类器性能。
为了进一步评估分类性能的概括,将该整个10折交叉验证程序重复10次,每次具有训练集和测试集的不同取样。
用于分类器分析的过渡特征的总数目为674。为了探索具有较少数目的特征的分类性能,在构建分类模型之前应用弹性网络特征选择。在该过程中,构建了弹性网络模型并在分类模型的开发中使用给出20个过渡特征的模型。由于交叉-折回验证过程的每一折具有它自己的特征选择步骤,因此每一折可选择不同的特征,从而在整个10×10折交叉验证过程的模型中使用的特征的总数目将大于或等于20。
在特征选择步骤之后,使用具有线性核的支持向量机(SVM)算法构建分类器模型。在构建训练集的分类器模型后,将其在未经修改的情况下直接应用于测试集,并且产生相关的受试者工作特征(ROC)曲线,从该曲线计算曲线下面积(AUC)。在10×10折交叉验证过程中,得到平均测试集AUC(0.76+/-0.035),图10指示了分类模型鉴别结肠直肠癌和正常患者样品的能力。为了进一步评估特征选择过程中选定的特征,提供了频率/等级图(图11)。该图显示了若干特征,这些特征在全部或几乎全部的交叉验证折中被选定,突出了它们区分结肠直肠癌与正常样品的效用。通过分类过程鉴定的特征的列表在图12中列出。
研究设计和患者样品采集
对照 CRC疾病
女性 24 23
男性 24 24
p=1
年龄 65.0+/-9.7 65.5+/-9.6
(平均值+/-标准差,岁)
p=0.82
尽管本文中已经示出并描述了本公开的优选实施方案,但对本领域技术人员显而易见的是这样的实施方案仅通过示例的方式提供。本领域技术人员在不脱离本公开的情况下现将想到许多变化、改变和替换。应当理解,本文所述的本公开实施方案的各种替代方案均可用于实施本公开。其意图在于以下述权利要求限定本公开的范围并由此涵盖这些权利要求范围内的方法和结构及其等同物。

Claims (139)

1.一种以大于70%的灵敏度或大于70%的选择性检测受试者结肠的腺瘤或息肉的存在的方法;所述方法包括以下步骤:
(a)从受试者获得血液样品;
(b)裂解所述血液样品中的蛋白质以提供包含肽的样品;
(c)分析所述样品中至少十种肽的存在;
(d)将分析所述样品的结果与对照参考值进行比较,从而以大于70%的灵敏度或大于70%的选择性确定存在结肠的腺瘤或息肉的正或负得分。
2.根据权利要求1所述的方法,其中所述灵敏度选自大于75%、大于80%、大于85%、大于90%、大于95%以及大于99%。
3.根据权利要求1所述的方法,其中所述选择性选自大于75%、大于80%、大于85%、大于90%、大于95%以及大于99%。
4.根据权利要求1所述的方法,其中所述选择性和所述灵敏度大于90%。
5.根据权利要求1所述的方法,其中所述受试者无症状。
6.根据权利要求1所述的方法,其中所述受试者先前已接受针对结肠息肉的治疗。
7.根据权利要求1所述的方法,其中所述分析步骤包括光谱分析、质谱法、免疫分析、酶反应性分析及其组合。
8.根据权利要求1所述的方法,其中所述分析包括质谱法。
9.根据权利要求1所述的方法,其中所述至少十种肽选自图8的中性质量分类器。
10.一种治疗受试者的结肠的腺瘤或息肉的方法,该方法包括:
(a)执行权利要求1所述的方法以得到具有存在腺瘤或息肉的正得分的受试者;以及
(b)进行用于去除所述受试者的腺瘤或息肉组织的程序。
11.一种检测受试者的结肠的腺瘤或息肉的存在与否的方法,其中所述受试者没有结肠的腺瘤或息肉的症状或家族史,所述方法包括以下步骤:
(a)从所述受试者获得生物样品;
(b)对所述生物样品进行关于一种或多种蛋白质和/或肽的存在和量的分析;
(c)将来自所述生物样品的一种或多种蛋白质和/或肽的存在和量与对照参考值进行比较;以及
(d)将一种或多种蛋白质和/或肽的存在和量与所述受试者的腺瘤或息肉状态相关联。
12.根据权利要求11所述的方法,其中所述方法实现了选自大于70%、大于75%、大于80%、大于85%、大于90%、大于95%以及大于99%的灵敏度。
13.根据权利要求11所述的方法,其中所述方法实现了选自大于70%、大于75%、大于80%、大于85%、大于90%、大于95%以及大于99%的特异性。
14.根据权利要求11所述的方法,其中所述方法实现了各自独立地选自大于70%、大于75%、大于80%、大于85%、大于90%、大于95%以及大于99%的灵敏度和特异性。
15.根据权利要求11所述的方法,进一步包括准备关于所述受试者的报告,其中所述报告指示腺瘤或息肉的存在与否。
16.根据权利要求15所述的方法,其中所述报告指示息肉发展的倾向或风险、细胞发育异常的程度、腺瘤性息肉的亚型或良性结肠肿瘤疾病的亚型。
17.根据权利要求11所述的方法,其中所述方法检测腺瘤的存在与否。
18.根据权利要求17所述的方法,其中所述腺瘤是腺瘤性息肉或息肉样腺瘤。
19.根据权利要求18所述的方法,其中所述腺瘤性息肉或息肉样腺瘤选自有蒂息肉和无蒂息肉。
20.根据权利要求18所述的方法,其中对所述腺瘤性息肉或息肉样腺瘤根据细胞发育异常或恶变前的程度进行表征。
21.根据权利要求11所述的方法,其中所述方法进一步检测结肠直肠癌的存在与否。
22.根据权利要求11所述的方法,其中所述方法不检测结肠直肠癌的存在与否。
23.根据权利要求11所述的方法,其中不对结肠直肠癌的存在与否进行确定。
24.根据权利要求11所述的方法,其中所述存在与否通过结肠镜检查、成像和/或手术来确认。
25.根据权利要求11所述的方法,其中所述生物样品选自全血、血清、血浆、血液成分、骨髓、唾液、脸颊拭子、尿、粪便、淋巴液、CNS液和病变渗出物。
26.根据权利要求25所述的方法,其中所述生物样品选自全血、血清和血浆。
27.根据权利要求11所述的方法,其中所述受试者无症状。
28.根据权利要求11所述的方法,其中所述受试者为18至49岁。
29.根据权利要求11所述的方法,其中所述受试者先前未接受过结肠镜检查。
30.根据权利要求11所述的方法,其中所述受试者没有结肠直肠癌的症状,没有结肠直肠癌家族史,并且没有经识别的结肠直肠癌风险因素。
31.根据权利要求11所述的方法,其中所述受试者没有结肠直肠癌的症状,没有结肠直肠癌家族史,并且没有除年龄之外的经识别的结肠直肠癌风险因素。
32.根据权利要求11所述的方法,其中步骤(b)中的所述分析包括选自光谱分析、质谱法、免疫分析和酶反应性分析的方法。
33.根据权利要求32所述的方法,其中所述分析为质谱法。
34.根据权利要求32所述的方法,其中所述免疫分析包括酶联免疫吸附测定或放射免疫测定。
35.根据权利要求32所述的方法,其中所述免疫分析包括免疫印迹、免疫扩散、免疫电泳或免疫沉淀。
36.根据权利要求32所述的方法,其中所述免疫分析包括免疫染色和/或流式细胞术分析。
37.根据权利要求11所述的方法,其中所述对照参考为相同生物样品中的一组一种或多种非重叠蛋白质和/或肽的存在和量。
38.根据权利要求11所述的方法,其中所述对照参考为从一个或多个存在结肠的腺瘤或息肉的受试者获得的重叠的一组蛋白质和/或肽的存在和量。
39.根据权利要求11所述的方法,其中所述对照参考为从一个或多个不存在结肠的腺瘤或息肉的受试者获得的重叠的一组蛋白质和/或肽的存在和量。
40.根据权利要求11所述的方法,其中所述分析检测一定数目的蛋白质或多肽的存在和量,其中所述数目选自至少2种、至少5种、至少10种、至少50种、至少100种以及至少1000种。
41.根据权利要求11所述的方法,其中所述分析检测下组中的一种或多种的存在和量:
i)选自SCDC26(CD26)、CEA分子5(CEACAM5)、CA195(CCR5)、CA19-9、M2PK(PKM2)、TIMP1、P-选择蛋白(SELPLG)、VEGFA、HcGB(CGB)、绒毛蛋白、TATI(SPINK1)、A-L-岩藻糖苷酶(FUCA2)、ANXA5、GAPDH、PKM2、ANXA4、GARS、RRBP1、KRT8、SYNCRIP、S100A9、ANXA3、CAPG、HNRNPF、PPA1、NME1、PSME3、AHCY、TPT1、HSPB1和RPSA、和/或图9中的蛋白质,以及它们的组合的一种或多种蛋白质;
ii)SCDC26(CD26)、CEA分子5(CEACAM5)、CA195(CCR5)、CA19-9、M2PK(PKM2)、TIMP1、P-选择蛋白(SELPLG)、VEGFA、HcGB(CGB)、绒毛蛋白、TATI(SPINK1)、A-L-岩藻糖苷酶(FUCA2)、ANXA5、GAPDH、PKM2、ANXA4、GARS、RRBP1、KRT8、SYNCRIP、S100A9、ANXA3、CAPG、HNRNPF、PPA1、NME1、PSME3、AHCY、TPT1、HSPB1和RPSA、和/或图9中的蛋白质,以及它们的组合的一种或多种肽片段;
iii)与SCDC26(CD26)、CEA分子5(CEACAM5)、CA195(CCR5)、CA19-9、M2PK(PKM2)、TIMP1、P-选择蛋白(SELPLG)、VEGFA、HcGB(CGB)、绒毛蛋白、TATI(SPINK1)、A-L-岩藻糖苷酶(FUCA2)、ANXA5、GAPDH、PKM2、ANXA4、GARS、RRBP1、KRT8、SYNCRIP、S100A9、ANXA3、CAPG、HNRNPF、PPA1、NME1、PSME3、AHCY、TPT1、HSPB1和RPSA、和/或图9中的蛋白质,以及它们的组合具有序列同源性的一种或多种肽,其中所述序列同源性选自大于75%、大于80%、大于85%、大于90%、大于95%及大于99%;以及
iv)SCDC26(CD26)、CEA分子5(CEACAM5)、CA195(CCR5)、CA19-9、M2PK(PKM2)、TIMP1、P-选择蛋白(SELPLG)、VEGFA、HcGB(CGB)、绒毛蛋白、TATI(SPINK1)、A-L-岩藻糖苷酶(FUCA2)、ANXA5、GAPDH、PKM2、ANXA4、GARS、RRBP1、KRT8、SYNCRIP、S100A9、ANXA3、CAPG、HNRNPF、PPA1、NME1、PSME3、AHCY、TPT1、HSPB1和RPSA、和/或图9中的蛋白质,以及它们的组合的一种或多种结合配偶体。
42.根据权利要求11所述的方法,其中所述分析检测图7或图8中的一个或多个中性质量簇的存在和/或量。
43.根据权利要求42所述的方法,其中所述分析检测图7或图8中的一定数目的中性质量簇的存在和/或量,其中所述数目选自至少2个、至少5个、至少10个、至少50个、至少100个、至少200个、至少500个以及至少1000个。
44.根据权利要求42所述的方法,其中所述分析检测图7或图8中的一定数目的中性质量簇的存在和/或量,其中所述数目为至少一个,并选自少于5个、少于10个、少于50个、少于100个、少于200个、少于500个以及少于1000个。
45.根据权利要求42所述的方法,其中所述分析检测图7或图8中的一定数目的中性质量簇的存在和/或量,其中所述数目选自10-50个、60-100个、150-300个、400-600个以及800-1000个,包含端值。
46.根据权利要求42所述的方法,其中所述中性质量簇在根据针对分割分类器的70/30训练/测试进行测试时具有下述分类器频率,所述分类器频率选自至少3/50、至少10/50、至少20/50、至少30/50以及至少40/50。
47.根据权利要求42所述的方法,其中所述分析检测从中得到图7或图8中的一个或多个中性质量簇的蛋白质或肽的存在和/或量。
48.根据权利要求11所述的方法,进一步包括:
(e)对所述生物样品进行关于选自代谢物、DNA序列、RNA序列及其组合的一种或多种分析物的存在和量的分析;以及
(f)将所述分析物的存在和量与对照参考值进行比较;以及
(g)将所述分析物的存在和量与所述受试者的腺瘤或息肉状态相关联。
49.一种检测在结肠镜检查得到阴性结果的受试者中结肠的腺瘤或息肉的存在与否的方法,所述方法包括以下步骤:
(a)从基于结肠镜检查具有腺瘤或息肉的阴性诊断的受试者获得生物样品;
(b)对所述生物样品进行关于一种或多种蛋白质和/或肽的存在和量的分析;
(c)将来自所述生物样品的一种或多种蛋白质和/或肽的存在和量与对照参考值进行比较;以及
(d)将一种或多种蛋白质和/或肽的存在和量与所述受试者的腺瘤或息肉状态相关联。
50.根据权利要求49所述的方法,其中所述方法实现了选自大于70%、大于75%、大于80%、大于85%、大于90%、大于95%以及大于99%的灵敏度。
51.根据权利要求49所述的方法,其中所述方法实现了选自大于70%、大于75%、大于80%、大于85%、大于90%、大于95%以及大于99%的特异性。
52.根据权利要求49所述的方法,其中所述方法实现了各自独立地选自大于70%、大于75%、大于80%、大于85%、大于90%、大于95%以及大于99%的灵敏度和特异性。
53.根据权利要求49所述的方法,进一步包括准备关于所述受试者的报告,其中所述报告指示腺瘤或息肉的存在与否。
54.根据权利要求53所述的方法,其中所述报告指示息肉发展的倾向或风险、细胞发育异常的程度、腺瘤性息肉的亚型或良性结肠肿瘤疾病的亚型。
55.根据权利要求49所述的方法,其中所述方法检测腺瘤的存在与否。
56.根据权利要求55所述的方法,其中所述腺瘤是腺瘤性息肉或息肉样腺瘤。
57.根据权利要求56所述的方法,其中所述腺瘤性息肉或息肉样腺瘤选自有蒂息肉和无蒂息肉。
58.根据权利要求56所述的方法,其中对所述腺瘤性息肉或息肉样腺瘤根据细胞发育异常或恶变前的程度进行表征。
59.根据权利要求49所述的方法,其中所述方法进一步检测结肠直肠癌的存在与否。
60.根据权利要求49所述的方法,其中所述方法不检测结肠直肠癌的存在与否。
61.根据权利要求49所述的方法,其中不对结肠直肠癌的存在与否进行确定。
62.根据权利要求49所述的方法,其中所述存在与否通过结肠镜检查、成像和/或手术来确认。
63.根据权利要求49所述的方法,其中所述生物样品选自全血、血清、血浆、血液成分、骨髓、唾液、脸颊拭子、尿、粪便、淋巴液、CNS液和病变渗出物。
64.根据权利要求63所述的方法,其中所述生物样品选自全血、血清和血浆。
65.根据权利要求49所述的方法,其中所述受试者无症状。
66.根据权利要求49所述的方法,其中所述受试者为18至49岁。
67.根据权利要求49所述的方法,其中所述受试者没有结肠直肠癌的症状,没有结肠直肠癌家族史,并且没有经识别的结肠直肠癌风险因素。
68.根据权利要求49所述的方法,其中所述受试者没有结肠直肠癌的症状,没有结肠直肠癌家族史,并且没有除年龄之外的经识别的结肠直肠癌风险因素。
69.根据权利要求49所述的方法,其中步骤(b)中的所述分析包括选自光谱分析、质谱法、免疫分析和酶反应性分析的方法。
70.根据权利要求69所述的方法,其中所述分析为质谱法。
71.根据权利要求69所述的方法,其中所述免疫分析包括酶联免疫吸附测定或放射免疫测定。
72.根据权利要求69所述的方法,其中所述免疫分析包括免疫印迹、免疫扩散、免疫电泳或免疫沉淀。
73.根据权利要求69所述的方法,其中所述免疫分析包括免疫染色和/或流式细胞术分析。
74.根据权利要求49所述的方法,其中所述对照参考为相同生物样品中的一组一种或多种非重叠蛋白质和/或肽的存在和量。
75.根据权利要求49所述的方法,其中所述对照参考为从一个或多个存在结肠的腺瘤或息肉的受试者获得的重叠的一组蛋白质和/或肽的存在和量。
76.根据权利要求49所述的方法,其中所述对照参考为从一个或多个不存在结肠的腺瘤或息肉的受试者获得的重叠的一组蛋白质和/或肽的存在和量。
77.根据权利要求49所述的方法,其中所述分析检测一定数目的蛋白质或多肽的存在和量,其中所述数目选自至少2种、至少5种、至少10种、至少50种、至少100种以及至少1000种。
78.根据权利要求49所述的方法,其中所述分析检测下组中的一种或多种的存在和量:
i)选自SCDC26(CD26)、CEA分子5(CEACAM5)、CA195(CCR5)、CA19-9、M2PK(PKM2)、TIMP1、P-选择蛋白(SELPLG)、VEGFA、HcGB(CGB)、绒毛蛋白、TATI(SPINK1)、A-L-岩藻糖苷酶(FUCA2)、ANXA5、GAPDH、PKM2、ANXA4、GARS、RRBP1、KRT8、SYNCRIP、S100A9、ANXA3、CAPG、HNRNPF、PPA1、NME1、PSME3、AHCY、TPT1、HSPB1和RPSA、和/或图9中的蛋白质,以及它们的组合的一种或多种蛋白质;
ii)SCDC26(CD26)、CEA分子5(CEACAM5)、CA195(CCR5)、CA19-9、M2PK(PKM2)、TIMP1、P-选择蛋白(SELPLG)、VEGFA、HcGB(CGB)、绒毛蛋白、TATI(SPINK1)、A-L-岩藻糖苷酶(FUCA2)、ANXA5、GAPDH、PKM2、ANXA4、GARS、RRBP1、KRT8、SYNCRIP、S100A9、ANXA3、CAPG、HNRNPF、PPA1、NME1、PSME3、AHCY、TPT1、HSPB1和RPSA、和/或图9中的蛋白质,以及它们的组合的一种或多种肽片段;
iii)与SCDC26(CD26)、CEA分子5(CEACAM5)、CA195(CCR5)、CA19-9、M2PK(PKM2)、TIMP1、P-选择蛋白(SELPLG)、VEGFA、HcGB(CGB)、绒毛蛋白、TATI(SPINK1)、A-L-岩藻糖苷酶(FUCA2)、ANXA5、GAPDH、PKM2、ANXA4、GARS、RRBP1、KRT8、SYNCRIP、S100A9、ANXA3、CAPG、HNRNPF、PPA1、NME1、PSME3、AHCY、TPT1、HSPB1和RPSA、和/或图9中的蛋白质,以及它们的组合具有序列同源性的一种或多种肽,其中所述序列同源性选自大于75%、大于80%、大于85%、大于90%、大于95%及大于99%;以及
iv)SCDC26(CD26)、CEA分子5(CEACAM5)、CA195(CCR5)、CA19-9、M2PK(PKM2)、TIMP1、P-选择蛋白(SELPLG)、VEGFA、HcGB(CGB)、绒毛蛋白、TATI(SPINK1)、A-L-岩藻糖苷酶(FUCA2)、ANXA5、GAPDH、PKM2、ANXA4、GARS、RRBP1、KRT8、SYNCRIP、S100A9、ANXA3、CAPG、HNRNPF、PPA1、NME1、PSME3、AHCY、TPT1、HSPB1和RPSA、和/或图9中的蛋白质以及它们的组合的一种或多种结合配偶体。
79.根据权利要求49所述的方法,其中所述分析检测图7或图8中的一个或多个中性质量簇的存在和/或量。
80.根据权利要求79所述的方法,其中所述分析检测图7或图8中的一定数目的中性质量簇的存在和/或量,其中所述数目选自至少2个、至少5个、至少10个、至少50个、至少100个、至少200个、至少500个以及至少1000个。
81.根据权利要求79所述的方法,其中所述分析检测图7或图8中的一定数目的中性质量簇的存在和/或量,其中所述数目为至少一个,并选自少于5个、少于10个、少于50个、少于100个、少于200个、少于500个以及少于1000个。
82.根据权利要求79所述的方法,其中所述分析检测图7或图8中的一定数目的中性质量簇的存在和/或量,其中所述数目选自10-50个、60-100个、150-300个、400-600个以及800-1000个,包含端值。
83.根据权利要求79所述的方法,其中所述中性质量簇在根据针对分割分类器的70/30训练/测试进行测试时具有下述分类器频率,所述分类器频率选自至少3/50、至少10/50、至少20/50、至少30/50以及至少40/50。
84.根据权利要求79所述的方法,其中所述分析检测从中得到图7或图8中的一个或多个中性质量簇的蛋白质或肽的存在和/或量。
85.根据权利要求79所述的方法,进一步包括:
(e)对所述生物样品进行关于选自代谢物、DNA序列、RNA序列及其组合的一种或多种分析物的存在和量的分析;以及
(f)将所述分析物的存在和量与对照参考值进行比较;以及
(g)将所述分析物的存在和量与所述受试者的腺瘤或息肉状态相关联。
86.一种检测先前治疗结肠的腺瘤或息肉的受试者中结肠的腺瘤或息肉的复发或不存在的方法,该方法包括以下步骤:
(a)从先前治疗结肠的腺瘤或息肉的受试者获得生物样品;
(b)对所述生物样品进行关于一种或多种蛋白质和/或肽的存在和量的分析;
(c)将来自所述生物样品的一种或多种蛋白质和/或肽的存在和量与对照参考值进行比较;以及
(d)将一种或多种蛋白质和/或肽的存在和量与所述受试者的腺瘤或息肉状态相关联。
87.根据权利要求86所述的方法,其中所述方法实现了选自大于70%、大于75%、大于80%、大于85%、大于90%、大于95%以及大于99%的灵敏度。
88.根据权利要求86所述的方法,其中所述方法实现了选自大于70%、大于75%、大于80%、大于85%、大于90%、大于95%以及大于99%的特异性。
89.根据权利要求86所述的方法,其中所述方法实现了各自独立地选自大于70%、大于75%、大于80%、大于85%、大于90%、大于95%以及大于99%的灵敏度和特异性。
90.根据权利要求86所述的方法,进一步包括准备关于所述受试者的报告,其中所述报告指示腺瘤或息肉的存在与否。
91.根据权利要求90所述的方法,其中所述报告指示息肉发展的倾向或风险、细胞发育异常的程度、腺瘤性息肉的亚型或良性结肠肿瘤疾病的亚型。
92.根据权利要求86所述的方法,其中所述方法检测腺瘤的存在与否。
93.根据权利要求92所述的方法,其中所述腺瘤是腺瘤性息肉或息肉样腺瘤。
94.根据权利要求93所述的方法,其中所述腺瘤性息肉或息肉样腺瘤选自有蒂息肉和无蒂息肉。
95.根据权利要求93所述的方法,其中对所述腺瘤性息肉或息肉样腺瘤根据细胞发育异常或恶变前的程度进行表征。
96.根据权利要求86所述的方法,其中所述方法进一步检测结肠直肠癌的存在与否。
97.根据权利要求86所述的方法,其中所述方法不检测结肠直肠癌的存在与否。
98.根据权利要求86所述的方法,其中不对结肠直肠癌的存在与否进行确定。
99.根据权利要求86所述的方法,其中所述存在与否通过结肠镜检查、成像和/或手术来确认。
100.根据权利要求86所述的方法,其中所述生物样品选自全血、血清、血浆、血液成分、骨髓、唾液、脸颊拭子、尿、粪便、淋巴液、CNS液和病变渗出物。
101.根据权利要求100所述的方法,其中所述生物样品选自全血、血清和血浆。
102.根据权利要求86所述的方法,其中所述受试者无症状。
103.根据权利要求86所述的方法,其中所述受试者为18至49岁。
104.根据权利要求86所述的方法,其中所述受试者没有结肠直肠癌的症状,没有结肠直肠癌家族史,并且没有经识别的结肠直肠癌风险因素。
105.根据权利要求86所述的方法,其中所述受试者没有结肠直肠癌的症状,没有结肠直肠癌家族史,并且没有除年龄之外的经识别的结肠直肠癌风险因素。
106.根据权利要求86所述的方法,其中步骤(b)中的所述分析包括选自光谱分析、质谱法、免疫分析和酶反应性分析的方法。
107.根据权利要求106所述的方法,其中所述分析为质谱法。
108.根据权利要求106所述的方法,其中所述免疫分析包括酶联免疫吸附测定或放射免疫测定。
109.根据权利要求106所述的方法,其中所述免疫分析包括免疫印迹、免疫扩散、免疫电泳或免疫沉淀。
110.根据权利要求106所述的方法,其中所述免疫分析包括免疫染色和/或流式细胞术分析。
111.根据权利要求86所述的方法,其中所述对照参考为相同生物样品中的一组一种或多种非重叠蛋白质和/或肽的存在和量。
112.根据权利要求86所述的方法,其中所述对照参考为从一个或多个存在结肠的腺瘤或息肉的受试者获得的重叠的一组蛋白质和/或肽的存在和量。
113.根据权利要求86所述的方法,其中所述对照参考为从一个或多个不存在结肠的腺瘤或息肉的受试者获得的重叠的一组蛋白质和/或肽的存在和量。
114.根据权利要求86所述的方法,其中所述分析检测一定数目的蛋白质或多肽的存在和量,其中所述数目选自至少2种、至少5种、至少10种、至少50种、至少100种以及至少1000种。
115.根据权利要求86所述的方法,其中所述分析检测下组中的一种或多种的存在和量:
i)选自SCDC26(CD26)、CEA分子5(CEACAM5)、CA195(CCR5)、CA19-9、M2PK(PKM2)、TIMP1、P-选择蛋白(SELPLG)、VEGFA、HcGB(CGB)、绒毛蛋白、TATI(SPINK1)、A-L-岩藻糖苷酶(FUCA2)、ANXA5、GAPDH、PKM2、ANXA4、GARS、RRBP1、KRT8、SYNCRIP、S100A9、ANXA3、CAPG、HNRNPF、PPA1、NME1、PSME3、AHCY、TPT1、HSPB1和RPSA、和/或图9中的蛋白质,以及它们的组合的一种或多种蛋白质;
ii)SCDC26(CD26)、CEA分子5(CEACAM5)、CA195(CCR5)、CA19-9、M2PK(PKM2)、TIMP1、P-选择蛋白(SELPLG)、VEGFA、HcGB(CGB)、绒毛蛋白、TATI(SPINK1)、A-L-岩藻糖苷酶(FUCA2)、ANXA5、GAPDH、PKM2、ANXA4、GARS、RRBP1、KRT8、SYNCRIP、S100A9、ANXA3、CAPG、HNRNPF、PPA1、NME1、PSME3、AHCY、TPT1、HSPB1和RPSA、和/或图9中的蛋白质,以及它们的组合的一种或多种肽片段;
iii)与SCDC26(CD26)、CEA分子5(CEACAM5)、CA195(CCR5)、CA19-9、M2PK(PKM2)、TIMP1、P-选择蛋白(SELPLG)、VEGFA、HcGB(CGB)、绒毛蛋白、TATI(SPINK1)、A-L-岩藻糖苷酶(FUCA2)、ANXA5、GAPDH、PKM2、ANXA4、GARS、RRBP1、KRT8、SYNCRIP、S100A9、ANXA3、CAPG、HNRNPF、PPA1、NME1、PSME3、AHCY、TPT1、HSPB1和RPSA、和/或图9中的蛋白质,以及它们的组合具有序列同源性的一种或多种肽,其中所述序列同源性选自大于75%、大于80%、大于85%、大于90%、大于95%及大于99%;以及
iv)SCDC26(CD26)、CEA分子5(CEACAM5)、CA195(CCR5)、CA19-9、M2PK(PKM2)、TIMP1、P-选择蛋白(SELPLG)、VEGFA、HcGB(CGB)、绒毛蛋白、TATI(SPINK1)、A-L-岩藻糖苷酶(FUCA2)和ANXA5、GAPDH、PKM2、ANXA4、GARS、RRBP1、KRT8、SYNCRIP、S100A9、ANXA3、CAPG、HNRNPF、PPA1、NME1、PSME3、AHCY、TPT1、HSPB1和RPSA、和/或图9中的蛋白质,以及它们的组合的一种或多种结合配偶体。
116.根据权利要求86所述的方法,其中所述分析检测图7或图8中的一个或多个中性质量簇的存在和/或量。
117.根据权利要求116所述的方法,其中所述分析检测图7或图8中的一定数目的中性质量簇的存在和/或量,其中所述数目选自至少2个、至少5个、至少10个、至少50个、至少100个、至少200个、至少500个以及至少1000个。
118.根据权利要求116所述的方法,其中所述分析检测图7或图8中的一定数目的中性质量簇的存在和/或量,其中所述数目为至少一个,并选自少于5个、少于10个、少于50个、少于100个、少于200个、少于500个以及少于1000个。
119.根据权利要求116所述的方法,其中所述分析检测图7或图8中的一定数目的中性质量簇的存在和/或量,其中所述数目选自10-50个、60-100个、150-300个、400-600个以及800-1000个,包含端值。
120.根据权利要求116所述的方法,其中所述中性质量簇在根据针对分割分类器的70/30训练/测试进行测试时具有下述分类器频率,所述分类器频率选自至少3/50、至少10/50、至少20/50、至少30/50以及至少40/50。
121.根据权利要求116所述的方法,其中所述分析检测从中得到图7或图8中的一个或多个中性质量簇的蛋白质或肽的存在和/或量。
122.根据权利要求86所述的方法,进一步包括:
(e)对所述生物样品进行关于选自代谢物、DNA序列、RNA序列以及它们的组合的一种或多种分析物的存在和量的分析;
(f)将所述分析物的存在和量与对照参考值进行比较;以及
(g)将所述分析物的存在和量与所述受试者的腺瘤或息肉状态相关联。
123.根据权利要求86所述的方法,其中所述受试者先前通过去除息肉而治疗结肠息肉。
124.根据权利要求86所述的方法,其中所述受试者先前通过从结肠中去除至少1厘米的组织进行治疗。
125.一种针对诊断应用的蛋白质和/或肽检测方法,该方法包括以下步骤:
(a)从受试者获得生物样品;
(b)对所述生物样品进行关于一种或多种蛋白质和/或肽的存在和量的分析;
(c)将来自所述生物样品的一种或多种蛋白质和/或肽的存在和量与对照参考值进行比较;以及
(d)将一种或多种蛋白质和/或肽的存在和量与所述受试者的诊断相关联;
其中所述分析检测下组中的一种或多种的存在和量:
i)选自SCDC26(CD26)、CEA分子5(CEACAM5)、CA195(CCR5)、CA19-9、M2PK(PKM2)、TIMP1、P-选择蛋白(SELPLG)、VEGFA、HcGB(CGB)、绒毛蛋白、TATI(SPINK1)、A-L-岩藻糖苷酶(FUCA2)、ANXA5、GAPDH、PKM2、ANXA4、GARS、RRBP1、KRT8、SYNCRIP、S100A9、ANXA3、CAPG、HNRNPF、PPA1、NME1、PSME3、AHCY、TPT1、HSPB1和RPSA、和/或图9中的蛋白质,以及它们的组合的一种或多种蛋白质;
ii)SCDC26(CD26)、CEA分子5(CEACAM5)、CA195(CCR5)、CA19-9、M2PK(PKM2)、TIMP1、P-选择蛋白(SELPLG)、VEGFA、HcGB(CGB)、绒毛蛋白、TATI(SPINK1)、A-L-岩藻糖苷酶(FUCA2)和ANXA5、GAPDH、PKM2、ANXA4、GARS、RRBP1、KRT8、SYNCRIP、S100A9、ANXA3、CAPG、HNRNPF、PPA1、NME1、PSME3、AHCY、TPT1、HSPB1和RPSA、和/或图9中的蛋白质,以及它们的组合的一种或多种肽片段;
iii)与SCDC26(CD26)、CEA分子5(CEACAM5)、CA195(CCR5)、CA19-9、M2PK(PKM2)、TIMP1、P-选择蛋白(SELPLG)、VEGFA、HcGB(CGB)、绒毛蛋白、TATI(SPINK1)、A-L-岩藻糖苷酶(FUCA2)、ANXA5、GAPDH、PKM2、ANXA4、GARS、RRBP1、KRT8、SYNCRIP、S100A9、ANXA3、CAPG、HNRNPF、PPA1、NME1、PSME3、AHCY、TPT1、HSPB1和RPSA、和/或图9中的蛋白质,以及它们的组合具有序列同源性的一种或多种肽,其中所述序列同源性选自大于75%、大于80%、大于85%、大于90%、大于95%及大于99%;
iv)SCDC26(CD26)、CEA分子5(CEACAM5)、CA195(CCR5)、CA19-9、M2PK(PKM2)、TIMP1、P-选择蛋白(SELPLG)、VEGFA、HcGB(CGB)、绒毛蛋白、TATI(SPINK1)、A-L-岩藻糖苷酶(FUCA2)和ANXA5、GAPDH、PKM2、ANXA4、GARS、RRBP1、KRT8、SYNCRIP、S100A9、ANXA3、CAPG、HNRNPF、PPA1、NME1、PSME3、AHCY、TPT1、HSPB1和RPSA、和/或图9中的蛋白质,以及它们的组合的一种或多种结合配偶体;以及
v)从中得到图7或图8中的一个或多个中性质量簇的蛋白质或肽。
126.根据权利要求125所述的方法,其中所述诊断为选自结肠的腺瘤、息肉、结肠直肠癌及其组合的病况的存在与否。
127.根据权利要求125所述的方法,进一步包括通过以下步骤确定步骤(b)中的所述量:
(b1)使所述生物样品或其部分与对第一肽具有特异性的第一抗肽抗体接触;
(b2)使所述生物样品或其部分与对第二肽具有特异性的第二抗肽抗体接触,其中所述第二抗肽抗体不同于所述第一抗肽抗体;
(b3)将被所述第一和第二抗肽抗体结合的肽与未结合的肽分离;
(b4)使用质谱法、流式细胞术、非重叠激发光谱、Western分析、酶联免疫吸附测定、密度测定法或其组合来检测和/或测量被所述第一和第二抗肽抗体结合的所述肽的量。
128.根据权利要求127所述的方法,其中所述生物样品或其部分为所述生物样品的蛋白水解消化物。
129.根据权利要求127所述的方法,其中步骤(b4)包括质谱法。
130.一种用于执行根据权利要求1-129中任一项所述的方法的试剂盒:
(a)用于从受试者采集样品的容器;
(b)用于检测一种或多种蛋白质或肽的工具,或用于将所述容器转移至测试设备的工具;以及
(c)书面说明书。
131.根据权利要求130所述的试剂盒,其中所述用于检测一种或多种蛋白质或肽的工具包含与下组中的一种或多种结合的一种或多种抗体:
i)选自SCDC26(CD26)、CEA分子5(CEACAM5)、CA195(CCR5)、CA19-9、M2PK(PKM2)、TIMP1、P-选择蛋白(SELPLG)、VEGFA、HcGB(CGB)、绒毛蛋白、TATI(SPINK1)、A-L-岩藻糖苷酶(FUCA2)、ANXA5、GAPDH、PKM2、ANXA4、GARS、RRBP1、KRT8、SYNCRIP、S100A9、ANXA3、CAPG、HNRNPF、PPA1、NME1、PSME3、AHCY、TPT1、HSPB1和RPSA、和/或图9中的蛋白质,以及它们的组合的一种或多种蛋白质;
ii)SCDC26(CD26)、CEA分子5(CEACAM5)、CA195(CCR5)、CA19-9、M2PK(PKM2)、TIMP1、P-选择蛋白(SELPLG)、VEGFA、HcGB(CGB)、绒毛蛋白、TATI(SPINK1)、A-L-岩藻糖苷酶(FUCA2)和ANXA5、GAPDH、PKM2、ANXA4、GARS、RRBP1、KRT8、SYNCRIP、S100A9、ANXA3、CAPG、HNRNPF、PPA1、NME1、PSME3、AHCY、TPT1、HSPB1和RPSA、和/或图9中的蛋白质,以及它们的组合的一种或多种肽片段;
iii)与SCDC26(CD26)、CEA分子5(CEACAM5)、CA195(CCR5)、CA19-9、M2PK(PKM2)、TIMP1、P-选择蛋白(SELPLG)、VEGFA、HcGB(CGB)、绒毛蛋白、TATI(SPINK1)、A-L-岩藻糖苷酶(FUCA2)、ANXA5、GAPDH、PKM2、ANXA4、GARS、RRBP1、KRT8、SYNCRIP、S100A9、ANXA3、CAPG、HNRNPF、PPA1、NME1、PSME3、AHCY、TPT1、HSPB1和RPSA、和/或图9中的蛋白质,以及它们的组合具有序列同源性的一种或多种肽,其中所述序列同源性选自大于75%、大于80%、大于85%、大于90%、大于95%及大于99%;
iv)SCDC26(CD26)、CEA分子5(CEACAM5)、CA195(CCR5)、CA19-9、M2PK(PKM2)、TIMP1、P-选择蛋白(SELPLG)、VEGFA、HcGB(CGB)、绒毛蛋白、TATI(SPINK1)、A-L-岩藻糖苷酶(FUCA2)、ANXA5、GAPDH、PKM2、ANXA4、GARS、RRBP1、KRT8、SYNCRIP、S100A9、ANXA3、CAPG、HNRNPF、PPA1、NME1、PSME3、AHCY、TPT1、HSPB1和RPSA、和/或图9中的蛋白质,以及它们的组合的一种或多种结合配偶体;以及
v)从中得到图7或图8中的一个或多个中性质量簇的蛋白质或肽。
132.根据权利要求131所述的试剂盒,其中一种或多种抗体各自用标记物进行标记。
133.根据权利要求132所述的试剂盒,其中所述标记物选自放射性标记物、荧光标记物、酶、化学发光标签及其组合。
134.根据权利要求131所述的试剂盒,其中所述抗体被包装在水性介质中或以冻干形式包装。
135.根据权利要求130所述的试剂盒,其中所述用于检测一种或多种蛋白质或肽的工具包括酶联免疫吸附测定。
136.一种用于诊断、预测、预后和/或监测受试者的结肠疾病的方法,该方法包括:测量来自所述受试者的生物样品中选自下组的至少一种生物标志物:ACTB、ACTH、ANGT、SAHH、ALDR、AKT1、ALBU、AL1A1、AL1B1、ALDOA、AMY2B、ANXA1、ANXA3、ANXA4、ANXA5、APC、APOA1、APOC1、APOH、GDIR1、ATPB、BANK1、MIC1、CA195、CO3、CO9、CAH1、CAH2、CALR、CAPG、CD24、CD63、CDD、CEAM3、CEAM5、CEAM6、CGHB、CH3L1、KCRB、CLC4D、CLUS、CNN1、COR1C、CRP、CSF1、CTNB1、CATD、CATS、CATZ、CUL1、SYDC、DEF1、DEF3、DESM、DPP4、DPYL2、DYHC1、ECH1、EF2、IF4A3、ENOA、EZRI、NIBL2、SEPR、FBX4、FIBB、FIBG、FHL1、FLNA、FRMD3、FRIH、FRIL、FUCO、GBRA1、G3P、SYG、GDF15、GELS、GSTP1、HABP2、HGF、1A68、HMGB1、ROA1、ROA2、HNRPF、HPT、HS90B、ENPL、GRP75、HSPB1、CH60、SIAL、IFT74、IGF1、IGHA2、IL2RB、IL8、IL9、RASK、K1C19、K2C8、LAMA2、LEG3、LMNB1、MARE1、MCM4、MIF、MMP7、MMP9、CD20、MYL6、MYL9、NDKA、NNMT、A1AG1、PCKGM、PDIA3、PDIA6、PDXK、PEBP1、PIPNA、KPYM、UROK、IPYR、PRDX1、KPCD1、PRL、TMG4、PSME3、PTEN、FAK1、FAK2、RBX1、REG4、RHOA、RHOB、RHOC、RSSA、RRBP1、S10AB、S10AC、S10A8、S109、SAA1、SAA2、SEGN、SDCG3、DHSA、SBP1、SELPL、SEP9、A1AT、AACT、ILEU、SPB6、SF3B3、SKP1、ADT2、ISK1、SPON2、OSTP、SRC、STK11、HNRPQ、TAL1、TRFE、TSP1、TIMP1、TKT、TSG6、TR10B、TNF6B、P53、TPM2、TCTP、TRAP1、THTR、TBB1、UGDH、UGPA、VEGFA、VILI、VIME、VNN1、1433Z、CCR5、FUCO及其组合。
137.一种用于诊断、预测、预后和/或监测受试者的结肠疾病的方法,该方法包括:测量来自所述受试者的生物样品中选自SPB6、FRIL、P53、1A68、ENOA、TKT及其组合的至少一种生物标志物。
138.一种用于诊断、预测、预后和/或监测受试者的结肠疾病的方法,该方法包括:测量来自所述受试者的生物样品中选自SPB6、FRIL、P53、1A68、ENOA、TKT、TSG6、TPM2、ADT2、FHL1、CCR5、CEAM5、SPON2、1A68、RBX1、COR1C、VIME、PSME3及其组合的至少一种生物标志物。
139.一种用于诊断、预测、预后和/或监测受试者的结肠疾病的方法,该方法包括:测量来自所述受试者的生物样品中选自SPB6、FRIL、P53、1A68、ENOA、TKT、TSG6、TPM2、ADT2、FHL1、CCR5、CEAM5、SPON2、1A68、RBX1、COR1C、VIME、PSME3、MIC1、STK11、IPYR、SBP1、PEBP1、CATD、HPT、ANXA5、ALDOA、LAMA2、CATZ、ACTB、AACT及其组合的至少一种生物标志物。
CN201380071930.XA 2012-11-30 2013-12-02 用于评估结肠肿瘤的存在或风险的方法 Expired - Fee Related CN104969071B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910577840.7A CN110596385A (zh) 2012-11-30 2013-12-02 用于评估结肠肿瘤的存在或风险的方法

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201261732024P 2012-11-30 2012-11-30
US61/732,024 2012-11-30
US201361772979P 2013-03-05 2013-03-05
US61/772,979 2013-03-05
PCT/US2013/072691 WO2014085826A2 (en) 2012-11-30 2013-12-02 Method for evaluation of presence of or risk of colon tumors

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN201910577840.7A Division CN110596385A (zh) 2012-11-30 2013-12-02 用于评估结肠肿瘤的存在或风险的方法

Publications (2)

Publication Number Publication Date
CN104969071A true CN104969071A (zh) 2015-10-07
CN104969071B CN104969071B (zh) 2019-09-03

Family

ID=50828610

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201380071930.XA Expired - Fee Related CN104969071B (zh) 2012-11-30 2013-12-02 用于评估结肠肿瘤的存在或风险的方法
CN201910577840.7A Pending CN110596385A (zh) 2012-11-30 2013-12-02 用于评估结肠肿瘤的存在或风险的方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201910577840.7A Pending CN110596385A (zh) 2012-11-30 2013-12-02 用于评估结肠肿瘤的存在或风险的方法

Country Status (11)

Country Link
US (6) US20140234854A1 (zh)
EP (1) EP2926138A4 (zh)
JP (1) JP2016507723A (zh)
KR (1) KR20150090240A (zh)
CN (2) CN104969071B (zh)
AU (1) AU2013351947A1 (zh)
BR (1) BR112015012616A2 (zh)
CA (1) CA2893158A1 (zh)
MX (1) MX2015006757A (zh)
SG (1) SG11201504241QA (zh)
WO (1) WO2014085826A2 (zh)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106202984A (zh) * 2016-08-26 2016-12-07 赵毅 一种基于多层复杂网络对肿瘤miRNA标志物的筛选方法
CN106908608A (zh) * 2017-04-17 2017-06-30 首都医科大学附属北京胸科医院 辅助诊断重症继发性肺结核的蛋白标志物
CN106919801A (zh) * 2017-03-08 2017-07-04 上海大伽信息科技有限公司 一种免疫组织化学染色辅助分析系统及使用方法
CN107345236A (zh) * 2016-05-04 2017-11-14 北京美泽福临科技发展有限公司 一种amy2b信使rna的特异性扩增引物和肝癌辅助诊断试剂盒
WO2019033866A1 (zh) * 2017-08-18 2019-02-21 山东泽济生物科技有限公司 肿瘤血液标志物及其应用
CN110073220A (zh) * 2016-09-29 2019-07-30 米密德诊断学有限公司 风险评估和疾病分类的方法
CN110214271A (zh) * 2017-01-19 2019-09-06 株式会社岛津制作所 分析数据解析方法以及分析数据解析装置
CN111164700A (zh) * 2017-07-14 2020-05-15 余因子基因组学公司 使用下一代测序的免疫-肿瘤学应用
CN111699391A (zh) * 2017-12-29 2020-09-22 雅培实验室 用于诊断和评估创伤性脑损伤的新型生物标志物和方法
CN112034182A (zh) * 2020-09-01 2020-12-04 复旦大学附属中山医院 一种结肠癌转移预测方法和系统
CN112266961A (zh) * 2020-10-29 2021-01-26 中山大学附属第六医院 Tsg-6基因在预测结直肠癌转移及预后方面的应用
CN114445406A (zh) * 2022-04-07 2022-05-06 武汉大学 肠镜图像分析方法、装置和医学图像处理设备
US11450406B2 (en) 2014-08-14 2022-09-20 Memed Diagnostics Ltd. Computational analysis of biological data using manifold and a hyperplane
US11466331B2 (en) 2016-03-03 2022-10-11 Memed Diagnostics Ltd. RNA determinants for distinguishing between bacterial and viral infections
US11937932B2 (en) 2022-05-25 2024-03-26 Taichung Veterans General Hospital Acute kidney injury predicting system and method thereof

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9141756B1 (en) 2010-07-20 2015-09-22 University Of Southern California Multi-scale complex systems transdisciplinary analysis of response to therapy
SG11201608053PA (en) * 2014-03-28 2016-10-28 Applied Proteomics Inc Protein biomarker profiles for detecting colorectal tumors
KR20170126846A (ko) * 2014-09-05 2017-11-20 난토믹스, 엘엘씨 출처의 결정을 위한 시스템들 및 방법들
KR102457151B1 (ko) * 2014-12-11 2022-10-19 위스콘신 얼럼나이 리서어치 화운데이션 대장암의 검출 및 치료를 위한 방법
CN105807062A (zh) * 2014-12-28 2016-07-27 复旦大学 人结肠癌蛋白Spondin-2在制备结肠癌诊断制剂中的应用
CN105385752A (zh) * 2015-03-23 2016-03-09 复旦大学 一种人结肠癌蛋白质标志物Spondin-2的检测方法及其检测试剂盒
JP2018517892A (ja) * 2015-04-10 2018-07-05 アプライド プロテオミクス,インク. 結腸直腸癌と進行腺腫を検知するためのタンパク質バイオマーカーパネル
WO2017078787A1 (en) * 2015-11-05 2017-05-11 Vanderbilt University Protein quantitation in multicellular tissue specimens
EP3443497A1 (en) * 2016-04-11 2019-02-20 DiscernDx, Inc. Mass spectrometric data analysis workflow
JP6754116B2 (ja) * 2016-04-26 2020-09-09 学校法人近畿大学 大腸癌マーカー
EP3469369A1 (en) * 2016-06-10 2019-04-17 Wisconsin Alumni Research Foundation Methods for detection, staging, and surveillance of colorectal adenomas and carcinomas
US20180100858A1 (en) * 2016-10-07 2018-04-12 Applied Proteomics, Inc. Protein biomarker panels for detecting colorectal cancer and advanced adenoma
US11204355B2 (en) 2017-02-20 2021-12-21 Vanderbilt University Immune checkpoint molecular fitness profiling by mass spectrometry
US20180330059A1 (en) 2017-05-09 2018-11-15 James Stewart Bates Patient treatment systems and methods
US10455457B2 (en) 2017-05-24 2019-10-22 Qualcomm Incorporated NR-SS unified operation mode in coordinated and uncoordinated bands
US11164679B2 (en) 2017-06-20 2021-11-02 Advinow, Inc. Systems and methods for intelligent patient interface exam station
EP3647788A4 (en) * 2017-06-30 2021-07-14 National Institutes of Biomedical Innovation, Health and Nutrition BIOMARKER FOR THE DETECTION OF COLORECTAL CANCER
EP3721232A1 (en) * 2017-12-05 2020-10-14 DiscernDx, Inc. Robust panels of colorectal cancer biomarkers
ES2917629T3 (es) * 2018-01-22 2022-07-11 Liquid Biopsy Res Llc Métodos para la detección del cáncer de colon y monitorización del tratamiento
US11348688B2 (en) 2018-03-06 2022-05-31 Advinow, Inc. Systems and methods for audio medical instrument patient measurements
SG11202009696WA (en) 2018-04-13 2020-10-29 Freenome Holdings Inc Machine learning implementation for multi-analyte assay of biological samples
US20200011871A1 (en) * 2018-07-05 2020-01-09 Edp Biotech Corporation Kits and methods for detecting markers
EA202190355A1 (ru) * 2018-08-08 2021-05-25 Ридженерон Фармасьютикалз, Инк. Применение жх-мс/мс для количественного определения белковых биомаркеров
EP3623813A1 (en) * 2018-09-17 2020-03-18 Institut d'Investigació Sanitària Pere Virgili Methods for the prognosis of hiv-infected subjects
WO2020178620A1 (en) * 2019-03-06 2020-09-10 Diadem S.R.L. p53 PEPTIDES AS MARKERS IN THE DIAGNOSIS AND PROGNOSIS OF ALZHEIMER'S DISEASE
US20220398458A1 (en) * 2019-11-13 2022-12-15 University Of South Florida Systems and methods of deep learning for colorectal polyp screening
CN110951707B (zh) * 2019-12-31 2022-11-11 南京医科大学 丙酮酸激酶m2突变体及其在心血管疾病中的应用
WO2022006628A1 (en) * 2020-07-08 2022-01-13 Southern Adelaide Local Health Network Inc. Computer-implemented method and system for identifying measurable features for use in a predictive model
CN112194719A (zh) * 2020-09-01 2021-01-08 中日友好医院(中日友好临床医学研究所) Crt抗原和mage-a1抗原的制备及其应用
CN112710856B (zh) * 2020-12-16 2022-12-02 江西省肿瘤医院(江西省癌症中心) 检测血清igf1蛋白的制剂在制备结直肠癌疗效监测试剂中的应用
CN114878833A (zh) * 2021-07-01 2022-08-09 浙江大学 一种检测抗过氧化物还原酶-1-IgG抗体的试剂盒
CN113956327B (zh) * 2021-10-11 2024-01-30 中山大学肿瘤防治中心 靶向人apc蛋白的多肽及其在制备药物中的应用
WO2023183481A1 (en) * 2022-03-23 2023-09-28 Serum Detect, Inc. Biomarker signatures indicative of early stages of cancer
CN114668836B (zh) * 2022-05-27 2022-08-19 暨南大学 Pdia6在制备治疗脊髓损伤和修复的药物中的应用
CN114958794B (zh) * 2022-06-14 2023-06-02 南京工业大学 一种苯乙醇胺-N-甲基转移酶hPNMT54及其克隆表达与应用

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101014859A (zh) * 2004-08-13 2007-08-08 因迪维姆德有限公司 运甲状腺素蛋白作为结肠直肠腺瘤和/或癌的生物标志的用途;检测方法和测试系统
CN101283280A (zh) * 2005-08-18 2008-10-08 Zadec私人有限公司 用于诊断结直肠癌的蛋白质标记和所述标记作为所述癌症类型治疗的药物靶点的用途
CN101896818A (zh) * 2007-12-10 2010-11-24 霍夫曼-拉罗奇有限公司 作为癌症的标记物的Seprase

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4444879A (en) * 1981-01-29 1984-04-24 Science Research Center, Inc. Immunoassay with article having support film and immunological counterpart of analyte
US4517289A (en) * 1982-08-18 1985-05-14 Brigham And Women's Hospital Monoclonal antibodies for human tissue cross-matching
US5736343A (en) * 1995-08-18 1998-04-07 Landry; Donald Detection of organic compounds through regulation of antibody-catalyzed reactions
US5800347A (en) * 1995-11-03 1998-09-01 The General Hospital Corporation ROC method for early detection of disease
NO954667D0 (no) * 1995-11-17 1995-11-17 Dagfinn Oegreid Fremgangsmåte til deteksjon av Ki-ras mutasjoner
WO2000070096A2 (en) * 1999-01-10 2000-11-23 Exact Laboratories, Inc. Methods of detecting colorectal disease by conduction an assay to detect a mutation in a bat-26 locus
US20010041365A1 (en) * 2000-01-10 2001-11-15 Michael Laposata Methods for monitoring alcohol consumption
US20040018973A1 (en) * 2002-01-25 2004-01-29 University Of Pittsburgh Nuclear matrix protein alterations associated with colon cancer and colon metastasis to the liver, and uses thereof
US20050153382A1 (en) * 2002-06-06 2005-07-14 Chengdu Kuachang Science And Technology Co., Ltd. Biochip kit comprising biochip based on antigen-antibody reactions, and its usage
US7666583B2 (en) * 2004-02-19 2010-02-23 Yale University Identification of cancer protein biomarkers using proteomic techniques
US20060105419A1 (en) * 2004-08-16 2006-05-18 Biosite, Inc. Use of a glutathione peroxidase 1 as a marker in cardiovascular conditions
WO2006094149A2 (en) * 2005-03-01 2006-09-08 Exact Sciences Corporation Methods and compositions for detecting adenoma
WO2007141595A2 (en) * 2005-11-10 2007-12-13 Aurelium Biopharma Inc. Method of diagnosing breast cancer using protein markers
CA2693098C (fr) * 2007-07-19 2019-06-18 Yasemin Ataman-Onal Procede de dosage de la proteine de liaison hepatique aux acides gras, de l'antigene carcino-embryonnaire, et de l'antigene carbohydrate 19-9 pour le diagnostic in vitro du cancercolorectal
WO2009040782A2 (en) * 2007-09-28 2009-04-02 Royal College Of Surgeons In Ireland A method of assessing colorectal cancer status in an individual
CN101896817A (zh) * 2007-12-10 2010-11-24 霍夫曼-拉罗奇有限公司 用于结直肠癌的标记物组
CA2715170A1 (en) * 2008-02-11 2009-08-20 Hadasit Medical Research Services & Development Limited Colon cancer associated transcript 1 (ccat-1) as a cancer marker
WO2009107170A1 (ja) * 2008-02-29 2009-09-03 学校法人日本大学 抗crp抗体及びその利用
WO2009115920A1 (en) * 2008-03-18 2009-09-24 Epigenomics Ag A method for optimizing and validating an assay for determining the presence or absence of a medical condition
EP2281201B1 (en) * 2008-05-14 2018-03-28 ETH Zurich Method for biomarker and drug-target discovery for prostate cancer diagnosis and treatment as well as biomarker assays determined therewith
WO2009141359A1 (en) * 2008-05-23 2009-11-26 Pronota N.V. New biomarker for diagnosis, prediction and/or prognosis of sepsis and uses thereof
CN102858991A (zh) * 2009-10-15 2013-01-02 克雷桑多生物科技公司 生物标志物及炎性疾病活动性的测量和监测方法
US10119959B2 (en) * 2010-06-25 2018-11-06 The Board Of Trustees Of The Leland Stanford Junior University Method of assaying an individual for immune impairment
US20140364326A1 (en) * 2011-01-28 2014-12-11 F. Hoffmann-La Roche Sa Combinatorial biomarkers for clinical applications in lung cancer patient management
WO2012115885A1 (en) * 2011-02-22 2012-08-30 Caris Life Sciences Luxembourg Holdings, S.A.R.L. Circulating biomarkers
EP2744919A4 (en) * 2011-08-19 2015-04-08 Myriad Genetics Inc GENE SIGNATURES FOR PROGNOSIS OF LUNG CANCER AND SELECTION OF THERAPY

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101014859A (zh) * 2004-08-13 2007-08-08 因迪维姆德有限公司 运甲状腺素蛋白作为结肠直肠腺瘤和/或癌的生物标志的用途;检测方法和测试系统
CN101283280A (zh) * 2005-08-18 2008-10-08 Zadec私人有限公司 用于诊断结直肠癌的蛋白质标记和所述标记作为所述癌症类型治疗的药物靶点的用途
CN101896818A (zh) * 2007-12-10 2010-11-24 霍夫曼-拉罗奇有限公司 作为癌症的标记物的Seprase

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
KRYSTYNA BERNACKA ET AL.: "The Levels of Alpha1-Antitrypsin and Alpha1-Antichymotrypsin in the Sera of Patients With Gastrointestinal Cancers During Diagnosis", 《CANCER》 *
TAKUJI TANAKA ET AL.: "Biomarkers for Colorectal Cancer", 《INTERNATIONAL JOURNAL OF MOLECULAR SCIENCES》 *
YINGHUA QIU ET AL.: "Plasma Glycoprotein Profiling for Colorectal Cancer Biomarker Identification by Lectin Glycoarray and Lectin Blot", 《JOURNAL OF PROTEOME RESEARCH》 *
YUSUKE MURAKOSHI ET AL.: "Plasma biomarker discovery and validation for colorectal cancer by quantitative shotgun mass spectrometry and protein microarray", 《CANCER SCIENCE》 *

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11450406B2 (en) 2014-08-14 2022-09-20 Memed Diagnostics Ltd. Computational analysis of biological data using manifold and a hyperplane
US11776658B2 (en) 2014-08-14 2023-10-03 Memed Diagnostics Ltd. Computational analysis of biological data using manifold and a hyperplane
US11466331B2 (en) 2016-03-03 2022-10-11 Memed Diagnostics Ltd. RNA determinants for distinguishing between bacterial and viral infections
CN107345236A (zh) * 2016-05-04 2017-11-14 北京美泽福临科技发展有限公司 一种amy2b信使rna的特异性扩增引物和肝癌辅助诊断试剂盒
CN106202984B (zh) * 2016-08-26 2018-09-04 赵毅 一种基于多层复杂网络对肿瘤miRNA标志物的筛选方法
CN106202984A (zh) * 2016-08-26 2016-12-07 赵毅 一种基于多层复杂网络对肿瘤miRNA标志物的筛选方法
CN110073220A (zh) * 2016-09-29 2019-07-30 米密德诊断学有限公司 风险评估和疾病分类的方法
CN110214271A (zh) * 2017-01-19 2019-09-06 株式会社岛津制作所 分析数据解析方法以及分析数据解析装置
CN106919801A (zh) * 2017-03-08 2017-07-04 上海大伽信息科技有限公司 一种免疫组织化学染色辅助分析系统及使用方法
CN106919801B (zh) * 2017-03-08 2023-07-18 杭州大伽信息科技有限公司 一种免疫组织化学染色辅助分析系统及使用方法
CN106908608A (zh) * 2017-04-17 2017-06-30 首都医科大学附属北京胸科医院 辅助诊断重症继发性肺结核的蛋白标志物
CN111164700A (zh) * 2017-07-14 2020-05-15 余因子基因组学公司 使用下一代测序的免疫-肿瘤学应用
WO2019033866A1 (zh) * 2017-08-18 2019-02-21 山东泽济生物科技有限公司 肿瘤血液标志物及其应用
CN109406785A (zh) * 2017-08-18 2019-03-01 山东泽济生物科技有限公司 肿瘤血液标志物及其应用
US11913956B2 (en) 2017-08-18 2024-02-27 Shandong Zeji Biotechnology Co., Ltd. Tumor blood marker, use thereof, and kit comprising the same
CN111699391A (zh) * 2017-12-29 2020-09-22 雅培实验室 用于诊断和评估创伤性脑损伤的新型生物标志物和方法
CN112034182A (zh) * 2020-09-01 2020-12-04 复旦大学附属中山医院 一种结肠癌转移预测方法和系统
CN112266961A (zh) * 2020-10-29 2021-01-26 中山大学附属第六医院 Tsg-6基因在预测结直肠癌转移及预后方面的应用
CN114445406A (zh) * 2022-04-07 2022-05-06 武汉大学 肠镜图像分析方法、装置和医学图像处理设备
US11937932B2 (en) 2022-05-25 2024-03-26 Taichung Veterans General Hospital Acute kidney injury predicting system and method thereof

Also Published As

Publication number Publication date
SG11201504241QA (en) 2015-06-29
EP2926138A2 (en) 2015-10-07
MX2015006757A (es) 2015-11-30
JP2016507723A (ja) 2016-03-10
US20170285033A1 (en) 2017-10-05
AU2013351947A1 (en) 2015-06-18
EP2926138A4 (en) 2016-09-14
BR112015012616A2 (pt) 2017-09-12
US20140234854A1 (en) 2014-08-21
US20150111220A1 (en) 2015-04-23
KR20150090240A (ko) 2015-08-05
US20150111223A1 (en) 2015-04-23
CN104969071B (zh) 2019-09-03
US20150111221A1 (en) 2015-04-23
WO2014085826A3 (en) 2014-10-23
CN110596385A (zh) 2019-12-20
CA2893158A1 (en) 2014-06-05
WO2014085826A2 (en) 2014-06-05
US20150111230A1 (en) 2015-04-23

Similar Documents

Publication Publication Date Title
CN104969071B (zh) 用于评估结肠肿瘤的存在或风险的方法
US9689874B2 (en) Protein biomarker panels for detecting colorectal cancer and advanced adenoma
US20170176441A1 (en) Protein biomarker profiles for detecting colorectal tumors
CN103415624A (zh) 胰腺癌生物标记及其用途
CA3000192C (en) Biomarkers and methods for assessing psoriatic arthritis disease activity
US20220057394A1 (en) Biomarkers and methods for measuring and monitoring axial spondyloarthritis activity
US11946939B2 (en) Biomarkers and methods for assessing myocardial infarction and serious infection risk in rheumatoid arthritis patients
US20180100858A1 (en) Protein biomarker panels for detecting colorectal cancer and advanced adenoma
Fabian et al. A Current State of Proteomics in Adult and Pediatric Inflammatory Bowel Diseases: A Systematic Search and Review
JP2024516489A (ja) 腫瘍免疫応答を判定するためのバイオマーカー
CA3233138A1 (en) Lung cancer prediction and uses thereof

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20190703

Address after: California, USA

Applicant after: APPLIED PROTEOMICS, Inc.

Address before: California, USA

Applicant before: Applied Proteomics, Inc.

GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20190903

Termination date: 20211202