CN110662966A - 用于检测结直肠癌和晚期腺瘤的蛋白质生物标志物小组 - Google Patents

用于检测结直肠癌和晚期腺瘤的蛋白质生物标志物小组 Download PDF

Info

Publication number
CN110662966A
CN110662966A CN201780076307.1A CN201780076307A CN110662966A CN 110662966 A CN110662966 A CN 110662966A CN 201780076307 A CN201780076307 A CN 201780076307A CN 110662966 A CN110662966 A CN 110662966A
Authority
CN
China
Prior art keywords
panel
individual
crc
protein
biomarker
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201780076307.1A
Other languages
English (en)
Inventor
约翰·布卢姆
阿提特·卡欧
罗斯林·狄龙
莉萨·克罗纳
布鲁斯·威尔考克斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dysendex Co
Applied Proteomics Inc
Original Assignee
Dysendex Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dysendex Co filed Critical Dysendex Co
Publication of CN110662966A publication Critical patent/CN110662966A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57407Specifically defined cancers
    • G01N33/57419Specifically defined cancers of colon
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/472Complement proteins, e.g. anaphylatoxin, C3a, C5a
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • C07K14/70596Molecules with a "CD"-designation not provided for elsewhere
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y304/00Hydrolases acting on peptide bonds, i.e. peptidases (3.4)
    • C12Y304/14Dipeptidyl-peptidases and tripeptidyl-peptidases (3.4.14)
    • C12Y304/14005Dipeptidyl-peptidase IV (3.4.14.5)
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57484Immunoassay; Biospecific binding assay; Materials therefor for cancer involving compounds serving as markers for tumor, cancer, neoplasia, e.g. cellular determinants, receptors, heat shock/stress proteins, A-protein, oligosaccharides, metabolites
    • G01N33/57488Immunoassay; Biospecific binding assay; Materials therefor for cancer involving compounds serving as markers for tumor, cancer, neoplasia, e.g. cellular determinants, receptors, heat shock/stress proteins, A-protein, oligosaccharides, metabolites involving compounds identifable in body fluids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2333/00Assays involving biological materials from specific organisms or of a specific nature
    • G01N2333/435Assays involving biological materials from specific organisms or of a specific nature from animals; from humans
    • G01N2333/46Assays involving biological materials from specific organisms or of a specific nature from animals; from humans from vertebrates
    • G01N2333/47Assays involving proteins of known structure or function as defined in the subgroups
    • G01N2333/4701Details
    • G01N2333/4716Complement proteins, e.g. anaphylatoxin, C3a, C5a
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2333/00Assays involving biological materials from specific organisms or of a specific nature
    • G01N2333/435Assays involving biological materials from specific organisms or of a specific nature from animals; from humans
    • G01N2333/705Assays involving receptors, cell surface antigens or cell surface determinants
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2333/00Assays involving biological materials from specific organisms or of a specific nature
    • G01N2333/435Assays involving biological materials from specific organisms or of a specific nature from animals; from humans
    • G01N2333/705Assays involving receptors, cell surface antigens or cell surface determinants
    • G01N2333/70503Immunoglobulin superfamily, e.g. VCAMs, PECAM, LFA-3
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2333/00Assays involving biological materials from specific organisms or of a specific nature
    • G01N2333/435Assays involving biological materials from specific organisms or of a specific nature from animals; from humans
    • G01N2333/705Assays involving receptors, cell surface antigens or cell surface determinants
    • G01N2333/70596Molecules with a "CD"-designation not provided for elsewhere in G01N2333/705
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2333/00Assays involving biological materials from specific organisms or of a specific nature
    • G01N2333/90Enzymes; Proenzymes
    • G01N2333/91Transferases (2.)
    • G01N2333/912Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • G01N2333/91205Phosphotransferases in general
    • G01N2333/9121Phosphotransferases in general with an alcohol group as acceptor (2.7.1), e.g. general tyrosine, serine or threonine kinases
    • G01N2333/91215Phosphotransferases in general with an alcohol group as acceptor (2.7.1), e.g. general tyrosine, serine or threonine kinases with a definite EC number (2.7.1.-)
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2333/00Assays involving biological materials from specific organisms or of a specific nature
    • G01N2333/90Enzymes; Proenzymes
    • G01N2333/914Hydrolases (3)
    • G01N2333/948Hydrolases (3) acting on peptide bonds (3.4)
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/50Determining the risk of developing a disease
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/52Predicting or monitoring the response to treatment, e.g. for selection of therapy based on assay results in personalised medicine; Prognosis
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/56Staging of a disease; Further complications associated with the disease
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/60Complex ways of combining multiple protein biomarkers for diagnosis

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Hematology (AREA)
  • Biomedical Technology (AREA)
  • Urology & Nephrology (AREA)
  • Organic Chemistry (AREA)
  • Biochemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Pathology (AREA)
  • Cell Biology (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Oncology (AREA)
  • Hospice & Palliative Care (AREA)
  • Genetics & Genomics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Physics & Mathematics (AREA)
  • Food Science & Technology (AREA)
  • Zoology (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Toxicology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)

Abstract

本文公开了涉及受试者中的晚期腺瘤和结直肠癌的诊断或识别的小组。所公开的小组和相关方法用于预测或评估患者中的结肠肿瘤状态。其可用于确定肿瘤的性质、复发或患者对治疗的反应。所述方法的一些实施方案包括生成用于临床管理的报告。

Description

用于检测结直肠癌和晚期腺瘤的蛋白质生物标志物小组
交叉引用
本申请要求于2016年10月7日提交的美国临时申请序列号62/405,771的优先权的权益,该申请通过引用以其全文并入于此,并且本申请要求于2017年1月24日提交的美国申请号15/414,456的优先权的权益,该申请通过引用以其全文并入于此。
背景技术
结直肠癌是美国癌症相关死亡的主要原因,其中在2013年有超过142,820例诊断和超过50,000例死亡。根据2011年的一项研究,估计全球每年有120万例诊断和600,000例死亡。
结直肠癌(CRC)由下胃肠道如结肠、直肠或阑尾中不受控制的细胞生长引起。CRC可由结肠息肉发展而来。结肠息肉通常包括在大肠或直肠的内衬上形成的良性细胞团。虽然许多结肠息肉是非恶性的,但息肉可发展成腺瘤。然后,结直肠腺瘤可生长成晚期结直肠腺瘤,随后可发展成CRC。
发生CRC的风险随着年龄而增加。90%的新病例和93%的死亡发生在50岁及以上的群体中。男性在其60多岁时发生CRC的风险相较于其40多岁时增加10倍。定期筛查允许去除晚期结直肠腺瘤或癌前息肉并检测早期癌症,这是有效治疗该疾病的关键因素。
被诊断患有CRC的患者的生存率高度取决于其发现的时间。CRC通常经历四个阶段,定义为I期至IV期。I期和II期是局部阶段,在此期间异常细胞生长局限于结肠或直肠。III期是区域性阶段,意味着癌症已扩散到周围组织,但仍然是局部的。IV期是远端,表明癌症已经扩散到身体的其他器官,最常见的是肝或肺。据估计,被诊断为I期CRC的患者的五年生存率超过90%,而被诊断为IV期的患者的五年生存率为13%。如果在早期发现,CRC通常通过手术切除癌症来治疗。在癌症扩散后,通常在手术切除癌症之后进行化疗。
CRC是最可预防的癌症之一,因为其从早期阶段到转移性疾病通常进展缓慢,并且存在有效工具用于其诊断。
CRC也是预防最少的癌症之一。这很大程度上是由于对现有CRC筛查途径的依从性差。目前的筛选途径涉及粪便样品分析或者通过结肠镜检查或乙状结肠镜检查直接观察,每种方法都具有较低的依从率。因此,通常只有在进展超过治疗成功率大幅下降的点之后才检测出CRC。
结肠镜检查和乙状结肠镜检查仍然是检测结肠癌的黄金标准。然而,这些检查的高度侵入性和费用导致人们接受度较低。此外,这类高度侵入性的程序使受试者面临诸如感染等并发症的风险。
结直肠癌的最常见的非侵入性试验是粪便潜血试验(“FOBT”)。不幸的是,除了假阳性率较高之外,FOBT的灵敏度仍然保持在50%左右,并且可能对早期CRC的检测灵敏度较低。已经在结直肠癌中研究了许多血清标志物,如癌胚抗原(“CEA”)、碳水化合物抗原19-9和脂质相关的唾液酸。然而,它们的低灵敏度促使美国临床肿瘤学会(the AmericanSociety of Clinical Oncology)声明它们均不能被推荐用于筛查和诊断,并且它们的使用应限于术后监测。
由于在疾病进展的早期检测到CRC使生存率显著增加,因此CRC是美国癌症协会(the American Cancer Society)或称ACS推荐进行常规筛查的三种癌症之一(另外两种是乳腺癌和宫颈癌)。在美国,ACS和美国预防服务工作组(the U.S.Preventative ServicesTask Force)或称USPSTF目前推荐对所有50-75岁的男性和女性使用粪便潜血试验或称FOBT(一种粪便试验)或者结肠镜检查或乙状结肠镜检查这两种程序之一来进行CRC筛查。尽管常规筛查如果在早期诊断出CRC则具有提高五年生存率的益处,但筛查依从性的比率较低,部分原因是现有解决方案的局限性。
CRC通常由下胃肠道如结肠、直肠或阑尾中的癌前腺瘤发展而来。因此,晚期腺瘤(AA)检测是CRC的早期检测的有价值的手段。虽然并非所有AA都发展成CRC,但个体中AA的检测是在它们发展成CRC之前或早期(此时病况最容易治疗)鉴别和处理错误分裂的细胞簇的有价值的手段。
发明内容
本文提供了评估个体中的CRC状态的非侵入性方法,例如使用个体的血液样品。一些这样的方法包括以下步骤:从所述个体获得循环血液样品;获得包含样品中的蛋白质列表的生物标志物小组的生物标志物小组水平,该蛋白质列表包含C9、CEA、DPP4、MIF、ORM1、PKM、SAA和TFRC,并且还包括个体年龄和性别作为生物标志物以构成来自所述个体的小组信息,以及使用所述小组信息进行CRC健康评估。一些途径包括将来自所述个体的所述小组信息与对应于已知结直肠癌状态的参考小组信息集进行比较,所述已知结直肠癌状态诸如无CRC、I期CRC、II期CRC、III期CRC、IV期CRC以及更笼统的早期CRC、晚期CRC中的至少一种;以及如果所述个体的参考小组信息与所述参考小组信息集没有显著差异,则将所述个体分类为具有所述结直肠癌状态。一些途径包括在算法中使用小组水平以获得小组得分,并将所述小组得分与对应于已知结直肠癌状态的至少一个参考小组信息集得分的小组得分进行比较,所述已知结直肠癌状态诸如无CRC、I期CRC、II期CRC、III期CRC、IV期CRC以及更笼统的早期CRC、晚期CRC中的至少一种;以及如果所述个体的参考小组信息与所述参考小组信息集没有显著差异,则将所述个体分类为具有所述结直肠癌状态。一些途径包括在算法中使用所选生物标志物相对于彼此的比率以获得小组得分,并将所述小组得分与对应于已知结直肠癌状态的至少一个参考小组信息集得分的小组得分进行比较,所述已知结直肠癌状态诸如无CRC、I期CRC、II期CRC、III期CRC、IV期CRC以及更笼统的早期CRC、晚期CRC中的至少一种;以及如果所述个体的参考小组信息与所述参考小组信息集没有显著差异,则将所述个体分类为具有所述结直肠癌状态。
一些途径包括将来自所述个体的所述小组信息与对应于已知结直肠癌状态的参考小组信息集进行比较,所述已知结直肠癌状态诸如无CRC、I期CRC、II期CRC、III期CRC、IV期CRC以及更笼统的早期CRC、晚期CRC中的至少一种;以及如果所述个体的参考小组信息与所述参考小组信息集显著不同,则将所述个体分类为具有与所述参考小组不同的CRC状态。一些途径包括在算法中使用小组水平以获得小组得分,并将所述小组得分与对应于已知结直肠癌状态的至少一个参考小组信息集得分的小组得分进行比较,所述已知结直肠癌状态诸如无CRC、I期CRC、II期CRC、III期CRC、IV期CRC以及更笼统的早期CRC、晚期CRC中的至少一种;以及如果所述个体的参考小组信息与所述参考小组信息集显著不同,则将所述个体分类为不具有所述结直肠癌状态。一些途径包括在算法中使用所选生物标志物相对于彼此的比率以获得小组得分,并将所述小组得分与对应于已知结直肠癌状态的至少一个参考小组信息集得分的小组得分进行比较,所述已知结直肠癌状态诸如无CRC、I期CRC、II期CRC、III期CRC、IV期CRC以及更笼统的早期CRC、晚期CRC中的至少一种;以及如果所述个体的参考小组信息与所述参考小组信息集显著不同,则将所述个体分类为不具有所述结直肠癌状态。
本文公开的一些CRC小组显示曲线下验证面积(AUC)——小组测试成功的参数——为至少0.83,如0.83、0.84、0.85、0.86、0.87、0.88、0.89、0.90或大于0.90。如果采用0%的无判定(No Call)率,则在一些情况下观察到CRC AUC为0.83或约0.83,并且验证灵敏度为0.80或约0.80,且验证特异性为0.71或约0.71。如果采用12.3%或约12.3%的无判定率,则在一些情况下观察到CRC AUC为0.85或约0.85,并且验证灵敏度为0.80或约0.80,且验证特异性为0.76或约0.76。如果采用18.2%或约18.2%的无判定率,则在一些情况下观察到CRC AUC为0.85或约0.85,并且验证灵敏度为0.82或约0.82,且验证特异性为0.78或约0.78。如果采用23.2%或约23.2%的无判定率,则在一些情况下观察到CRC AUC为0.86或约0.86,并且验证灵敏度为0.80或约0.80,且验证特异性为0.83或约0.83。
本文还提供了评估个体中的晚期腺瘤状态的非侵入性方法,例如使用个体的血液样品。一些这样的方法包括以下步骤:从所述个体获得循环血液样品;获得包含样品中的蛋白质列表的生物标志物小组的生物标志物小组水平,该蛋白质列表包含CLU、CTSD、DPP4、GDF15、GSN、MIF、PKM、SERPINA1、SERPINA3、TFRC和TIMP1,并且获得个体的年龄作为生物标志物以构成来自所述个体的小组信息,以及使用所述小组信息进行CRC健康评估。一些途径包括将来自所述个体的所述小组信息与对应于已知AA状态的参考小组信息集进行比较;以及如果所述个体的参考小组信息与所述参考小组信息集没有显著差异,则将所述个体分类为具有所述AA状态。一些途径包括在算法中使用小组水平以获得小组得分,并将所述小组得分与对应于已知AA状态的至少一个参考小组信息集得分的小组得分进行比较;以及如果所述个体的参考小组信息与所述参考小组信息集没有显著差异,则将所述个体分类为具有所述AA状态。一些途径包括在算法中使用所选生物标志物相对于彼此的比率以获得小组得分,并将所述小组得分与对应于已知AA状态的至少一个参考小组信息集得分的小组得分进行比较;以及如果所述个体的参考小组信息与所述参考小组信息集没有显著差异,则将所述个体分类为具有所述AA状态。
一些途径包括将来自所述个体的所述小组信息与对应于已知AA状态的参考小组信息集进行比较;以及如果所述个体的参考小组信息与所述参考小组信息集显著不同,则将所述个体分类为具有与所述参考小组不同的AA状态。一些途径包括在算法中使用小组水平以获得小组得分,并将所述小组得分与对应于已知AA状态的至少一个参考小组信息集得分的小组得分进行比较;以及如果所述个体的参考小组信息与所述参考小组信息集显著不同,则将所述个体分类为不具有所述AA状态。一些途径包括在算法中使用所选生物标志物相对于彼此的比率以获得小组得分,并将所述小组得分与对应于已知AA状态的至少一个参考小组信息集得分的小组得分进行比较;以及如果所述个体的参考小组信息与所述参考小组信息集显著不同,则将所述个体分类为不具有所述AA状态。
本文公开的一些AA小组显示曲线下验证面积(AUC)——小组测试成功的参数——为至少0.69,如0.69、0.70、0.71、0.72、0.73、0.74、0.75、0.80、0.85或大于0.85。如果采用0%的无判定率,则在一些情况下观察到AA AUC为0.69或约0.69,并且验证灵敏度为0.44或约0.44,且验证特异性为0.80或约0.80。如果采用8.5%或约8.5%的无判定率,则在一些情况下观察到CRC AUC为0.69或约0.69,并且验证灵敏度为0.47或约0.47,且验证特异性为0.80或约0.80。
鉴于以上和本文的公开内容,本文提供了用于诊断和/或治疗晚期结直肠腺瘤和结直肠癌中的至少一种的方法、组合物、试剂盒、计算机可读介质和系统。通过本文提供的方法和组合物,从个体获取样品。在一些情况下,所述个体不呈现结直肠癌或晚期腺瘤或结直肠癌和腺瘤二者的症状。作为常规健康观察或监测的一部分对一些个体进行测试。或者,关于呈现出诸如结直肠癌或晚期腺瘤或结直肠癌和腺瘤二者等结直肠健康问题的至少一种症状对一些个体进行测试。在一些情况下,所述个体被鉴别为具有结直肠癌或晚期腺瘤或结直肠癌和腺瘤二者的风险。对样品进行测定以确定标志物小组如蛋白质或者蛋白质和年龄或者蛋白质和性别或者蛋白质和年龄和性别的累积水平,该标志物小组例如包含本文公开的小组中的标志物或由之组成的标志物小组。在许多情况下,所述小组包含单个已知在表明晚期结直肠腺瘤或结直肠癌的存在中起作用的蛋白质,而在其他情况下,所述小组包含未知与晚期结直肠腺瘤或结直肠癌相关的蛋白质。然而,在所有情况下,小组中标志物的鉴别和累积导致特异性、灵敏度或者特异性和灵敏度水平基本上优于单个标志物或者更小或更不准确的标志物集的水平。
另外,本文公开的方法、小组和其他测试基本上优于许多商业可用的测试,特别是许多当前可用的基于血液的测试的灵敏度、特异性或者灵敏度和特异性。本文公开的方法、小组和其他测试具有易于执行的进一步益处,使得需要胃肠健康评估测试结果的个体更有可能进行该测试,而不是采集粪便样品或进行侵入性程序例如结肠镜检查。在各种实施方案中,以多种方式测量小组累积水平,例如通过抗体荧光结合测定或ELISA测定、通过质谱分析、通过检测抗体集的荧光或者通过进行蛋白质累积水平定量的备选途径。
通过与本文公开内容一致的多种途径评估小组累积水平。例如,将小组累积水平与阳性对照或阴性对照标准品进行比较,所述阳性对照或阴性对照标准品包含至少一种和至多10种、100种或超过100种已知结直肠健康状态的标准品,或者与晚期结直肠腺瘤或结直肠癌累积水平或健康累积水平的模型进行比较,以便关于被测个体的健康状态进行预测。备选地或组合地,将小组结果与机器学习或者根据从已知的阳性或已知的阴性患者样品获得的数据进行训练或建立的其他模型进行比较。在一些情况下,小组测定结果伴随有关于干预或者小组测定结果的备选验证的推荐。
因此,本文提供了对于诊断和/或治疗晚期结直肠腺瘤和结直肠癌中的至少一种有用的生物标志物小组和测定。
本文还提供了试剂盒,其包含本文所述的计算机可读介质,以及所述计算机可读介质的使用说明。
多种治疗方案在本文进行考虑并且对于本领域技术人员是已知的,诸如化疗、施用生物治疗剂以及手术干预,诸如低位前切除术或经腹会阴联合切除术,或者造口术。
附图说明
图1示出了具有0%无判定的主导(lead)CRC小组的AUC曲线。
图2示出了具有15%无判定的主导CRC小组的AUC曲线。
图3示出了具有20%无判定的主导CRC小组的AUC曲线。
图4示出了具有25%无判定的主导CRC小组的AUC曲线。
图5示出了具有0%无判定的主导AA小组的AUC曲线。
图6示出了具有10%无判定的主导AA小组的AUC曲线。
图7描绘了与指示如本文所公开的CRC小组的AUC的细垂直线相比,来自随机生成的CRC小组(列)的发现AUC。
图8描绘了与指示如本文所公开的CRC小组的AUC的细垂直线相比,来自随机生成的AA小组(列)的发现AUC。
图9A描绘了针对CRC小组成员的第一子集的生物标志物水平与整体模型得分之间的相关性。
图9B描绘了针对CRC小组成员的第二子集的生物标志物水平与整体模型得分之间的相关性。
图9C描绘了针对CRC小组成员的第三子集的生物标志物水平与整体模型得分之间的相关性。
图10描绘了与本文公开内容一致的计算机系统。
图11描绘了与指示如本文所公开的CRC小组的AUC的细垂直线相比,来自随机生成的CRC小组(列)的发现AUC(如图7中),其中包含CEA、CO9和DPPIV的小组相对于不包含这三种标志物的小组是有阴影的。
具体实施方式
本文提供了用于非侵入性评估结直肠健康(例如通过检测晚期结直肠腺瘤(“AA”)和结直肠癌(“CRC”)中的至少一种)的生物标志物小组、方法、组合物、试剂盒和系统。本文所述的生物标志物小组、方法、组合物、试剂盒和系统用于通过对从循环血液采集的样品进行非侵入性测定来确定受试者具有结直肠病况如晚期结直肠腺瘤和CRC中的至少一种的可能性。一些此类生物标志物小组用于非侵入性地检测结直肠健康问题如结直肠癌,其灵敏度高达81%或更高,且特异性高达78%或更高。示例性CRC生物标志物小组包含标志物C9、CEA、DPP4、MIF、ORM1、PKM、SAA和TFRC,以及提供样品的个体的年龄和性别等非蛋白质生物标志物。一些此类生物标志物小组用于非侵入性地检测结直肠健康问题如晚期腺瘤,其灵敏度高达50%或更高,且特异性高达80%或更高。与晚期腺瘤评估相关的示例性生物标志物小组包含标志物CLU、CTSD、DPP4、GDF15、GSN、MIF、PKM、SERPINA1、SERPINA3、TFRC和TIMP1,并且还包括获得个体的年龄。
如本文所公开的生物标志物小组具有以下特性:单独使用衍生自循环血液的蛋白质水平信息或者将其与其他信息如个体的年龄、性别、健康史或其他特性组合,做出有关个体的结直肠健康的灵敏的、特异性的结论。本发明生物标志物小组的益处在于它们使用方便的、非侵入性获得的样品提供灵敏的、特异性的结直肠健康评估。不需要依赖从侵入性腹部测定如结肠镜检查或乙状结肠镜检查或者从粪便样品材料获得的数据。因此,依从率显著提高,并且在其进展的早期更容易识别结直肠健康问题,从而可更有效地治疗它们。最终,这种益处的效果在挽救的生命中得以衡量,并且是实质性的。
选择如本文所公开的生物标志物小组,使得它们作为小组的预测值基本上大于其单个成员的预测值。小组成员通常不会彼此共同变化,使得小组成员为小组的整体健康信号提供独立的贡献。因此,小组能够基本上胜过指示个体的结直肠健康状态的任何单个成分的表现,从而获得商业上和医学上相关的置信度(诸如灵敏度、特异性或者灵敏度和特异性)。因此,在如本文所公开的小组中,指示健康问题的多个小组成员提供比例如在其中两个或更多个成员严格一致地上升或下降使得由其导出的信号实际上是重复两次的单个信号的小组中发现的信号更强的信号。因此,如本文所公开的小组对于单一成分测量的变化是稳健的。例如,因为小组成员彼此独立地变化,所以本文中的小组通常指示健康风险,尽管所述小组的一个或超过一个单个成员在单独测量时将不会指示存在健康风险。在一些情况下,本文中的小组指示健康风险处于显著的置信水平,尽管没有单个小组成员自身指示健康风险处于显著的置信水平。在一些情况下,本文中的小组指示健康风险处于显著的置信水平,尽管至少一个单个成员指示不存在健康风险的显著的置信水平。
与本文中的小组一致的生物标志物包括在个体的血流中循环的生物分子,如蛋白质。在一些情况下,还包括容易获得的信息,包括诸如个体的年龄或性别等人口统计信息。包括体重、身高、身体质量指数在内的生理信息以及其他容易测量或获得的信息也有资格作为标志物。特别地,本文中的一些小组依赖于年龄、性别或者年龄和性别作为生物标志物。
本文中许多生物标志物的共同之处在于它们在个体中进行测定的容易性。本文中的生物标志物通过从个体的动脉或静脉抽血而容易地获得,或者通过访谈或通过简单的生物计量学分析获得。获得本文生物标志物的容易性的益处在于诸如结肠镜检查或乙状结肠镜检查等侵入性测定不是生物标志物测量所必需的。类似地,粪便样品不是生物标志物测定所必需的。因此,如本文公开的小组信息通常通过抽血结合拜访医生办公室而容易地获得。因此,依从率基本上高于涉及粪便样品或侵入性程序的结直肠健康测定的依从率。
本文公开的示例性小组包含可识别地或独特地映射到其亲本蛋白的循环蛋白质或其片段,并且在一些情况下包含易于获得的生物标志物如个体的年龄。
小组成分
一些生物标志物小组包含本文列举的一些或所有蛋白质标志物、其子集或者所列标志物与另外的标志物或生物学参数的组合。与结直肠癌评估相关的主导生物标志物小组单独地或与另外的标志物组合地包含至少4种标志物,直至完整列表,所述列表选自以下:C9、CEA、DPP4、MIF、ORM1、PKM、SAA和TFRC,并且还包含年龄和性别作为生物标志物。与晚期腺瘤评估相关的主导生物标志物小组包含选自以下的标志物:CLU、CTSD、DPP4、GDF15、GSN、MIF、PKM、SERPINA1、SERPINA3、TFRC和TIMP1,并且还包含个体的年龄作为生物标志物。具有组合的结直肠癌和晚期腺瘤评估能力的主导生物标志物小组或生物标志物小组的组合包含诸如C9、CEA、ORM1、PKM、SAA、CLU、CTSD、DPP4、GDF15、GSN、MIF、SERPINA1、SERPINA3、TFRC和TIMP1等生物标志物,以及年龄和性别作为生物标志物,或者任选地具有至少一种单个标志物被排除或被一种或多种标志物替代的其子集。
通常,将CRC生物标志物小组和晚期腺瘤小组组合成单个试剂盒或单个生物标志物小组是方便或有效的。在这些情况下,观察到包含十一种生物标志物或者其子集或更大集合的试剂盒,包含C9、CEA、ORM1、PKM、SAA、CLU、CTSD、DPP4、GDF15、GSN、MIF、SERPINA1、SERPINA3、TFRC和TIMP1,其中C9、CEA、DPP4、MIF、ORM1、PKM、SAA和TFRC或者包含这些标志物的子集或更大的组提供有关结直肠癌状态的信息;CLU、CTSD、DPP4、GDF15、GSN、MIF、PKM、SERPINA1、SERPINA3、TFRC和TIMP1或者包含这些标志物的子集或更大的组提供有关晚期腺瘤状态的信息;并且C9、CEA、CLU、CTSD、DPP4、GDF15、GSN、MIF、ORM1、PKM、SAA、SERPINA1、SERPINA3、TFRC和TIMP1(如果包含在内)提供有关结直肠癌状态和晚期腺瘤状态二者的信息,特别地,与有关患者年龄和性别的信息进行组合。下文列出了备选的和变体结直肠癌生物标志物小组。
与上文讨论的小组非常相似,这些小组或子集或添加物单独使用或与上述晚期腺瘤小组联合使用来指示晚期腺瘤,任选地使用诸如CLU、CTSD、DPP4、GDF15、GSN、MIF、PKM、SERPINA1、SERPINA3、TFRC和TIMP1等标志物。示例性生物标志物小组单独地或与另外的标志物组合地包含至少4种标志物,直至完整列表,所述列表选自以下:C9、CEA、DPP4、MIF、ORM1、PKM、SAA和TFRC,并且还包含个体年龄和性别。
因此,本文公开了包含上述生物标志物的结直肠健康评估小组。小组包含至少3、4、5、6、7、8、9、10、11、12种或多于12种本文所述的生物标志物。
类似地,本文公开了由上述生物标志物小组成的结直肠健康评估小组。小组包含至少3、4、5、6、7、8、9、10、11、12种或多于12种本文所述的生物标志物。
生物标志物
在一些情况下,本文所述的生物标志物小组包含至少三种生物标志物。生物标志物选自表1中列出的17种生物标志物的可鉴别多肽或片段。本文所述的任何生物标志物可以是蛋白质生物标志物。此外,本实例中的生物标志物组在一些情况下可另外包含具有表1中所示特性的多肽。
以下表1中列出了示例性蛋白质生物标志物以及它们的人氨基酸序列(适用时)。蛋白质生物标志物包括表1的多肽序列的全长分子,以及表1的多肽序列的独特可鉴别片段。标志物可以是全长的但不需要是全长的以提供信息。在许多情况下,只要片段独特地可鉴别为衍生自或代表表1的多肽,则其出于本文的目的提供信息。
表1:生物标志物和相应的描述符
Figure BDA0002088958580000121
Figure BDA0002088958580000131
Figure BDA0002088958580000141
Figure BDA0002088958580000151
本文考虑的生物标志物还包括在8个残基、9个残基、10个残基、20个残基、50个残基或者5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、95%或大于95%的生物标志物序列的跨度上具有与表1中列出的标志物相同的氨基酸序列的多肽。生物标志物的变体形式或备选形式包括例如由编码所公开的生物标志物的转录物的任何剪接变体编码的多肽。在某些情况下,修饰形式、片段或者其相应的RNA或DNA在诊断中可表现出比全长蛋白质更好的辨别能力。
本文考虑的生物标志物还包括本文所述的任何蛋白质的截短形式或多肽片段。蛋白质的截短形式或多肽片段可包括N末端缺失或截短的形式和C末端缺失或截短的形式。蛋白质的截短形式或片段可包括通过任何机制产生的片段,诸如但不限于,通过备选的翻译、外切和/或内切蛋白水解和/或降解,例如通过物理、化学和/或酶促的蛋白水解。不受限制地,生物标志物可包含蛋白质的截短或片段,多肽或肽可表现约1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的蛋白质的氨基酸序列。
不受限制地,蛋白质的截短或片段可包括相应的全长蛋白质的约5-20个连续氨基酸、或约10-50个连续氨基酸、或约20-100个连续氨基酸、或约30-150个连续氨基酸、或约50-500个连续氨基酸残基的序列。
在一些情况下,与相应的成熟全长蛋白质或者其可溶或血浆循环形式相比,片段在N末端和/或C末端截短1至约20个氨基酸,例如,1至约15个氨基酸、或1至约10个氨基酸、或1至约5个氨基酸。
本公开内容的任何蛋白质生物标志物如肽、多肽或蛋白质及其片段还可包括所述标志物、肽、多肽或蛋白质和片段的修饰形式,如携带表达后修饰的片段,所述修饰包括但不限于诸如磷酸化、糖基化、脂化、甲基化、硒代胱氨酸修饰、半胱氨酰化、磺化、谷胱甘肽化、乙酰化、甲硫氨酸到甲硫氨酸亚砜或甲硫氨酸砜的氧化等修饰。
在一些情况下,片段化蛋白质是N末端和/或C末端截短的。这样的片段化蛋白质可包含N末端(a、b、c-离子)和/或C末端(x、y、z-离子)截短蛋白质或肽的一种或多种或所有转变(transitional)离子。如本文所教导的示例性人标志物、核酸、蛋白质或多肽以NCBIGenbank(可在网站ncbi.nlm.nih.gov访问)或Swissprot/Uniprot(可在网站uniprot.org访问)登录号的方式进行注释。在一些情况下,所述序列属于如本文所教导的标志物、核酸、蛋白质或多肽的前体(例如,前蛋白),并且可包含被加工离开成熟分子的部分。在一些情况下,尽管仅公开了一种或多种同种型,但序列的所有同种型都是预期的。
用于检测本文列出的生物标志物的抗体是可商购的。以下表2中呈现了可用于本文生物标志物的测定的试剂的部分来源列表。
表2-试剂来源
Figure BDA0002088958580000181
对于本文列举的给定生物标志物小组,还考虑到一种或多于一种成分不同的变体生物标志物小组。因此,作为实例,转向主导CRC小组C9、CEA、DPP4、MIF、ORM1、PKM、SAA和TFRC,并且还包括个体年龄和性别,公开了多个相关小组。对于本文公开的该小组和其他小组,考虑变体包含所列举的生物标志物小组的至少8种、至少7种、至少6种、至少5种、至少4种、至少3种或至少2种生物标志物成分。
表3中列出了与本文公开内容一致的示例性CRC小组。还公开了包含表3的条目中列出的标志物的小组。
表3-CRC生物标志物小组成分
Figure BDA0002088958580000201
Figure BDA0002088958580000211
Figure BDA0002088958580000221
Figure BDA0002088958580000231
Figure BDA0002088958580000241
Figure BDA0002088958580000251
Figure BDA0002088958580000271
Figure BDA0002088958580000281
Figure BDA0002088958580000291
Figure BDA0002088958580000311
Figure BDA0002088958580000321
Figure BDA0002088958580000331
Figure BDA0002088958580000341
Figure BDA0002088958580000381
Figure BDA0002088958580000391
Figure BDA0002088958580000411
Figure BDA0002088958580000421
表4中列出了与本文公开内容一致的另外的示例性CRC小组。还公开了包含表4的条目中列出的标志物的小组。在一些情况下,表4中列出的小组可用作在以上表3中列出的小组的替代。表4还包含对应于每个组的曲线下面积值“AUC”、灵敏度值“Sens”和特异性值“Spec”。
表4-CRC生物标志物小组成分
Figure BDA0002088958580000422
Figure BDA0002088958580000431
表5中列出了与本文公开内容一致的示例性AA小组。还公开了包含表5的条目中列出的标志物的小组。
表5-AA生物标志物小组成分
Figure BDA0002088958580000432
Figure BDA0002088958580000461
Figure BDA0002088958580000471
Figure BDA0002088958580000481
Figure BDA0002088958580000491
Figure BDA0002088958580000511
Figure BDA0002088958580000521
Figure BDA0002088958580000531
Figure BDA0002088958580000541
Figure BDA0002088958580000551
Figure BDA0002088958580000561
Figure BDA0002088958580000571
Figure BDA0002088958580000581
Figure BDA0002088958580000591
Figure BDA0002088958580000601
Figure BDA0002088958580000611
Figure BDA0002088958580000621
Figure BDA0002088958580000631
Figure BDA0002088958580000641
Figure BDA0002088958580000651
Figure BDA0002088958580000661
Figure BDA0002088958580000671
Figure BDA0002088958580000681
Figure BDA0002088958580000701
Figure BDA0002088958580000721
Figure BDA0002088958580000731
Figure BDA0002088958580000741
Figure BDA0002088958580000761
Figure BDA0002088958580000771
Figure BDA0002088958580000781
Figure BDA0002088958580000791
Figure BDA0002088958580000801
Figure BDA0002088958580000811
Figure BDA0002088958580000821
Figure BDA0002088958580000831
Figure BDA0002088958580000851
Figure BDA0002088958580000861
Figure BDA0002088958580000901
Figure BDA0002088958580000921
Figure BDA0002088958580000931
Figure BDA0002088958580000941
Figure BDA0002088958580000951
Figure BDA0002088958580000971
Figure BDA0002088958580000981
Figure BDA0002088958580000991
Figure BDA0002088958580001011
Figure BDA0002088958580001021
Figure BDA0002088958580001051
Figure BDA0002088958580001061
Figure BDA0002088958580001071
Figure BDA0002088958580001081
Figure BDA0002088958580001091
Figure BDA0002088958580001101
Figure BDA0002088958580001111
Figure BDA0002088958580001121
Figure BDA0002088958580001131
Figure BDA0002088958580001151
Figure BDA0002088958580001171
Figure BDA0002088958580001181
Figure BDA0002088958580001191
Figure BDA0002088958580001221
Figure BDA0002088958580001231
Figure BDA0002088958580001251
Figure BDA0002088958580001261
Figure BDA0002088958580001271
Figure BDA0002088958580001281
Figure BDA0002088958580001291
Figure BDA0002088958580001301
Figure BDA0002088958580001321
Figure BDA0002088958580001331
Figure BDA0002088958580001341
Figure BDA0002088958580001351
Figure BDA0002088958580001361
Figure BDA0002088958580001371
Figure BDA0002088958580001381
Figure BDA0002088958580001391
Figure BDA0002088958580001401
Figure BDA0002088958580001421
Figure BDA0002088958580001431
Figure BDA0002088958580001441
Figure BDA0002088958580001451
Figure BDA0002088958580001461
Figure BDA0002088958580001471
Figure BDA0002088958580001481
Figure BDA0002088958580001491
Figure BDA0002088958580001501
Figure BDA0002088958580001511
Figure BDA0002088958580001521
Figure BDA0002088958580001531
Figure BDA0002088958580001541
Figure BDA0002088958580001551
表6中列出了与本文公开内容一致的另外的示例性AA小组。还公开了包含表6的条目中列出的标志物的小组。在一些情况下,表6中列出的小组可用作以上表5中列出的小组的替代。表6还包含对应于每个小组的曲线下面积值“AUC”、灵敏度值“Sens”和特异性值“Spec”。
表6-AA生物标志物小组成分
Figure BDA0002088958580001552
健康评估测定
本文所述的生物标志物小组、方法、组合物和试剂盒基于对获自受试者的生物样品中的生物标志物的检测或测量,提供针对晚期结直肠腺瘤和CRC中的至少一种的测定。生物样品优选从个体的动脉或静脉抽取的血液样品。血液样品可以是全血样品、血浆样品或血清样品。本文提供的公开内容从样品如血液样品检测晚期结直肠腺瘤和CRC中的至少一种,其灵敏度和特异性使得测试结果足够可靠以在医学上可操作。本文的健康评估方法、系统、试剂盒和小组具有至少40%、至少50%、至少60%、至少70%的灵敏度和至少70%的特异性中的至少一种。基于对生物样品中15种或更少的生物标志物的测量,这样的CRC相关方法可具有70%或更高的灵敏度和至少70%的特异性中的至少一种。在一些情况下,本文提供的方法检测晚期结直肠腺瘤和CRC中的至少一种。基于对不超过4种生物标志物、5种生物标志物、6种生物标志物、7种生物标志物、8种生物标志物、9种生物标志物、10种生物标志物、11种生物标志物、12种生物标志物、13种生物标志物、14种生物标志物或15种生物标志物的测量,这样的方法可具有对于AA检测至少40%的灵敏度和对于CRC检测至少70%的灵敏度以及至少70%的特异性中的至少一种。一些优选的实施方案允许使用至少8种标志物的生物标志物小组评估结直肠癌。一些优选的实施方案允许使用至少4种生物标志物的小组评估晚期腺瘤。一些生物标志物小组允许使用11、12、13、14、15、16、17种或超过17种生物标志物的组合小组评估结直肠癌和晚期腺瘤二者。
在一些情况下,本文所述的生物标志物小组、方法、组合物和试剂盒可用于筛选对于CRC或晚期腺瘤风险升高的个体。在一些情况下,基于本文所述的方法对晚期结直肠腺瘤和CRC中的至少一种的阳性检测用于鉴别向其推荐另外的诊断方法的患者。例如,在其中本文中的方法产生阳性结果的一些情况下,这样的方法用于警示护理人员进行另外的测试如结肠镜检查、乙状结肠镜检查、独立癌症测定或粪便癌症测定。
本文所述的生物标志物小组、方法、组合物和试剂盒还可用作结肠镜检查、乙状结肠镜检查或结肠组织活检的质量控制度量。例如,基于本文所述的方法对晚期结直肠腺瘤和CRC中的至少一种的阳性检测可用于验证结肠镜检查、乙状结肠镜检查或结肠组织活检的结果。例如,在其中结肠镜检查、乙状结肠镜检查或结肠组织活检产生阴性结果,但本文所述的方法产生阳性结果的一些情况下,这样的方法可用于警示护理人员进行另外的结肠镜检查、乙状结肠镜检查或结肠组织活检,或者启动治疗方案如施用药物组合物。治疗方案可包括如本文所述的一种或多种其他程序。
本文提供的一些方法包括(a)从受试者获得生物样品;(b)测量受试者生物样品中的生物标志物小组;(c)基于所述测量检测受试者中是否存在晚期结直肠腺瘤和CRC中的至少一种;以及(d)(i)基于所述检测,治疗受试者中的晚期结直肠腺瘤CRC中的至少一种,或(ii)基于所述检测结果,向受试者推荐结肠镜检查、乙状结肠镜检查或结直肠组织活检。出于本文所述的一种或多种方法的目的,“治疗”包括向受试者或受试者的看护者提供书面报告,该书面报告包括启动针对CRC的治疗的推荐。出于本文所述的一种或多种方法的目的,“向受试者推荐结肠镜检查”包括向受试者或受试者的看护者提供书面报告,该书面报告包括对受试者进行结肠镜检查、乙状结肠镜检查或组织活检以确认对CRC的评估的推荐。在一些情况下,结肠镜检查、乙状结肠镜检查或组织活检可用于去除晚期结直肠腺瘤和CRC中的至少一种,从而治疗晚期结直肠腺瘤和CRC中的至少一种。
示例性方法任选地包括(a)获得包含对获自受试者的生物样品中的生物标志物小组的测量的数据,(b)基于测量数据生成生物标志物小组的受试者特异性概况,(c)将生物标志物小组的受试者特异性概况与生物标志物小组的参考概况进行比较;以及(d)基于(c)确定晚期结直肠腺瘤和结直肠癌中的至少一种的可能性。
示例性方法任选地包括(a)测量获自受试者的生物样品中的生物标志物小组;(b)基于所述测量检测受试者中是否存在结直肠癌和/或晚期结直肠腺瘤;以及(c)基于所述检测治疗受试者中的结直肠癌。
示例性方法任选地包括(a)获得包含对获自受试者的生物样品中的生物标志物小组的测量的数据,(b)基于测量数据生成生物标志物小组的受试者特异性概况,(c)将生物标志物小组的受试者特异性概况与生物标志物小组的参考概况进行比较;以及(d)基于(c)确定晚期结直肠腺瘤和结直肠癌中的至少一种的可能性。本文提供的一些方法包括(a)测量获自受试者的生物样品中的生物标志物小组;(b)基于所述测量检测受试者中是否存在结直肠癌和/或晚期结直肠腺瘤;以及(c)基于所述检测,向受试者推荐受试者中的结肠镜检查、乙状结肠镜检查和组织活检中的至少一种。示例性方法任选地包括诊断结直肠癌或监测结直肠癌,以便为受试者建立预后。所列蛋白质中的一种或组合的水平可随着时间的推移与癌症患者的不同结果相关联,这可能取决于所选择的治疗。示例性方法任选地包括通过将来自受试者的样品中的一种或多种生物标志物的累积水平与在随后的时间点获自受试者的样品中的一种或多种生物标志物的累积水平进行比较来监测受试者中癌症的进展,其中所述一种或多种生物标志物的表达差异诊断或有助于诊断受试者中癌症的进展。一些示例性方法包括监测治疗的有效性。在一些情况下,用于监测治疗有效性的方法包括将在提供至少一部分治疗之前来自受试者的样品中的一种或多种生物标志物的累积水平与在受试者已经接受至少一部分治疗之后获自受试者的样品中的所述一种或多种生物标志物的累积水平进行比较,并且其中所述一种或多种生物标志物的累积水平的差异诊断或有助于诊断治疗的功效。
对受试者的监测可进行超过约3个月、约6个月、约9个月、约12个月、约15个月、约18个月、约21个月或约24个月的持续时间。例如,对受试者健康状态和对施用的治疗的有效性的监测中的至少一种可进行上述持续时间中的一种或多种。在一些情况下,受试者的测试和治疗中的至少一种可在上述一种或多种持续时间之后重复。例如,可在约3个月、约6个月、约9个月、约12个月、约15个月、约18个月、约21个月或约24个月重新测试受试者。
在一些情况下,示例性方法包括推荐化疗、放疗、免疫疗法、施用生物治疗剂、息肉切除术、部分结肠切除术、低位前切除术或经腹会阴联合切除术和结肠造口术中的一种或多种。在一些情况下,示例性方法可包括推荐向受试者施用以下中的一种或多种:亚叶酸、5-FU、奥沙利铂
Figure BDA0002088958580001591
伊立替康
Figure BDA0002088958580001592
卡培他滨
Figure BDA0002088958580001593
西妥昔单抗、帕尼单抗、瑞戈非尼
Figure BDA0002088958580001594
曲氟尿苷和胸苷磷酸化酶抑制剂(tipiracil)在一些情况下,示例性方法可包括推荐向受试者施用以下中的一种或多种:FOLFOX:亚叶酸、5-FU和奥沙利铂
Figure BDA0002088958580001596
FOLFIRI:亚叶酸、5-FU和伊立替康
Figure BDA0002088958580001597
CapeOX:卡培他滨
Figure BDA0002088958580001598
和奥沙利铂;以及FOLFOXIRI:亚叶酸、5-FU、奥沙利铂和伊立替康。在一些情况下,示例性方法可包括推荐向受试者施用以下中的一种或多种:靶向VEGF的药物(例如,贝伐单抗阿柏西普雷莫芦单抗
Figure BDA0002088958580001603
)和靶向EGFR的药物(例如,西妥昔单抗
Figure BDA0002088958580001604
帕尼单抗
Figure BDA0002088958580001605
)。例如,示例性方法可包括向诸如受试者或受试者的看护者提供书面报告,该书面报告包括对受试者进行本文所述的一种或多种方案的推荐,所述方案包括化疗、放疗、免疫疗法、施用生物治疗剂、息肉切除术、部分结肠切除术、低位前切除术或经腹会阴联合切除术和结肠造口术中的一种或多种。
生物标志物测量
通过与本文公开内容一致的多种方法测量生物标志物。在许多情况下,通过免疫相互作用测量生物标志物,诸如发生在ELISA测定中的免疫相互作用,通过该测定,来自个体的血液样品中的蛋白质或蛋白质片段与特异性抗体结合,并且结合程度被定量为样品中的蛋白质丰度的量度。如本文所公开的能够测量生物标志物小组的ELISA测定被考虑作为试剂盒的本公开内容的实施方案。
备选地或组合地,通过质谱法如MS、MS/MS、MALDI-TOF或其他适当的质谱途径测量生物标志物。通常,MS方法定量生物标志物的片段而不是全长蛋白质。然而,此类途径足以将生物标志物的蛋白质水平确定到足以进行如本文所公开的结直肠健康评估的准确度。
小组表现的一些细节取决于测定途径,使得一些小组使用免疫学或质谱途径表现稍好。然而,观察到在许多情况下,小组表现很大程度上与测定方法无关,由此使用免疫学测定表现稍好的小组在使用质谱分析进行测定时仍然提供关于个体的结直肠健康状态的信息,反之亦然。
一旦确定了生物标志物小组的表达水平,就可对样品从其中获得的个体进行结直肠健康评估。本领域技术人员可利用多种方法由个体的生物标志物小组表达水平生成或得出结直肠健康评估。
一些评估依赖于个体的生物标志物小组水平与参考水平的比较,该参考水平诸如来自已知或被独立验证处于良好结直肠健康的个体或者来自已知或被独立验证处于不良结直肠健康的个体(诸如在具有结直肠癌或至少一种晚期腺瘤的个体的情况下)的参考生物标志物小组水平。备选地或组合地,将个体的生物标志物小组水平与由具有共同的已知结直肠健康状态的多个个体构建的参考水平进行比较。在一些情况下,所述参考是来自多个个体的已知小组水平的平均值,或者是由在参考个体中观察到的小组水平范围限定的范围。在一些情况下,范围参考小组水平是加权范围,使得具有共同结直肠健康状态的个体之间的异常值被赋予比多个或大多数或所有小组水平共有的小组水平更低的预测性值。
在更复杂的评估途径中,将个体的生物标志物小组水平与由具有共同的已知结直肠健康状态的大量个体如至少10、至少50、至少100、至少500、至少1000或更多个体构建的参考水平进行比较。通常,参考个体的健康状态在结直肠健康状态的阳性和阴性之间均匀分布,如结直肠癌的阳性和阴性,或者晚期腺瘤的阳性和阴性。在一些情况下,评估包括个体的生物标志物小组水平与已知健康状态的多个参考的迭代或同时的比较。
备选地或组合地,使用多个已知的参考生物标志物小组水平来训练计算评估算法如机器学习模型,使得个体的生物标志物小组水平与参考之间的单一比较提供整合或聚集来自具有共同的已知结直肠健康状态的大量个体如至少10、至少50、至少100、至少500、至少1000或更多个体的信息。这样的参考的生成通常有助于更快地评估个体的结直肠健康状态,或使用更少的计算能力进行评估。
通过本领域技术人员已知的多种计算途径中的任何一种,从多个参考个体生物标志物水平生成参考。机器学习模型易于构建,例如,使用任何数目的统计编程的编程语言如R、脚本语言如Python和相关的机器学习包、数据挖掘软件如Weka或Java、Mathematica、Matlab或SAS来构建。
将个体的生物标志物小组水平与本领域技术人员如以上或以其他方式生成的参考进行比较,并生成输出评估。多个输出评估与本文的公开内容一致。输出评估包括单一评估,通常限于灵敏度、特异性或者灵敏度和特异性参数,指示结直肠健康状态评估。备选地或组合地,提供另外的参数,诸如指示根据个体的生物标志物小组水平或生物标志物小组水平评估,患有结直肠健康问题的机会的相对增加的优势比。
结果以不同方式提供给个体或医疗保健专业人员或其他专业人员。结果任选地伴随有健康推荐,诸如确认或独立评估结直肠健康状态评估的推荐,例如使用粪便样品测定或侵入性途径如结肠镜检查、乙状结肠镜检查或结直肠健康的其他补充测定。
推荐任选地包括与治疗方案相关的信息,诸如指示治疗方案如息肉切除术、放疗、化疗、抗体疗法、生物仿制药治疗或其他治疗方案的信息,诸如指示方案的成功或功效的信息。在一些情况下,通过比较在第一时间点(任选地在治疗之前)和随后的第二时间点(任选地在治疗情况之后)个体的生物标志物小组水平来评估方案的功效。将生物标志物小组水平彼此进行比较、每种与参考进行比较或以其他方式进行评估,以便确定治疗方案是否表现出使其应当继续、增加、用备选方案替代或者因其成功解决结直肠健康问题如结直肠癌或晚期腺瘤而停止的功效。一些评估依赖于在多个时间点诸如治疗前的至少一个时间点和治疗后的至少一个时间点对个体的生物标志物小组水平的比较。生物标志物小组水平彼此进行比较,或与至少一个参考生物标志物小组水平进行比较,或进行彼此比较和与至少一个参考生物标志物小组水平比较两者。
生物标志物小组评估
本文描述的一些方法包括将生物样品中的至少两种生物标志物中的每一种的量与所述至少两种生物标志物中的每一种的参考量进行比较。本文的一些方法包括将受试者中生物标志物小组的概况与生物标志物小组的参考概况进行比较。在一些情况下,参考量是对照受试者中生物标志物的量。在一些情况下,生物标志物小组的参考概况是对照受试者的生物标志物概况。在一些情况下,对照受试者是具有已知诊断的受试者。例如,对照受试者可以是阴性对照受试者。阴性对照受试者可以是不具有晚期结直肠腺瘤的受试者。阴性对照受试者可以是不具有CRC的受试者。阴性对照受试者可以是不具有结肠息肉的受试者。对于其他实例,对照受试者可以是阳性对照受试者。阳性对照受试者可以是具有确诊的晚期结直肠腺瘤的受试者。阳性对照受试者可以是具有确诊的CRC的受试者。阳性对照受试者可以是具有确诊的任何CRC阶段(例如,0期、I期、II期、IIA期、IIB期、IIC期、III期、IIIA期、IIIB期、IIIC期、IV期、IVA期或IVB期)的受试者。参考量可以是生物标志物的预定水平,其中基于对照受试者中生物标志物所测量的量来设定预定水平。
一些参考生物标志物小组水平包括多个具有共同病况状态的个体诸如10个无CRC或AA的个体或者10个已知CRC阶段或已知AA状态的个体的平均值。或者,在一些情况下,参考包括对应于已知CRC或AA状态的个体的集合的蛋白质累积水平的集合,并在一些实施方案中包括年龄。在这些情况下,水平不是平均的;而是将患者的水平与该集合中每个标准或参考个体的每个集合的累积水平进行比较,并且确定患者的累积水平与至少一个参考集合的累积水平是否没有显著差异。在一些情况下,参考集合包括已知无癌症状态的个体,而在一些情况下,参考集合包括已知CRC或AA阶段状态如0期、I期、II期、IIA期、IIB期、IIC期、III期、IIIA期、IIIB期、IIIC期、IV期、IVA期或IVB期的个体。在一些情况下,如果患者的小组累积水平与参考的累积水平匹配或没有显著差异,则患者被归类为具有病况。在一些情况下,如果患者的小组累积水平与参考的累积水平显著不同,则患者被归类为没有病况。
在一些情况下,比较包括确定从受试者获得的生物样品中的生物标志物的量与生物标志物的参考量之间的差异。在一些情况下,所述方法包括基于从受试者获得的生物样品中至少一种测量的生物标志物的量与至少一种测量的生物标志物的参考量相比的偏差(例如,所测量的差异)检测是否存在晚期结直肠腺瘤和CRC中的至少一种。在一些情况下,该方法包括如果来自从受试者获得的生物样品的至少一种测量的生物标志物的量与阳性参考值(例如,来自阳性对照受试者的测量的生物标志物的量)相比的偏差较低,则检测存在晚期结直肠腺瘤和CRC中的至少一种。在其他情况下,该方法包括如果来自从受试者获得的生物样品的至少一种测量的生物标志物的量与阴性参考值(例如,从阴性对照受试者所测量的)较高,则检测存在晚期结直肠腺瘤和CRC中的至少一种。在一些情况下,该方法包括如果来自从受试者获得的生物样品的至少一种测量的生物标志物的量与阳性参考值(例如,从阳性对照受试者所测量的)相比的偏差较高,则检测不存在晚期结直肠腺瘤和CRC中的至少一种。在一些实例中,该方法包括如果来自从受试者获得的生物样品的至少一种测量的生物标志物的量与阴性参考值(例如,从阴性对照受试者所测量的)相比的偏差较低,则检测不存在晚期结直肠腺瘤和CRC中的至少一种。在一些情况下,检测是否存在晚期结直肠腺瘤和CRC中的至少一种可基于由本文所述的算法产生的临床结果得分。在一些情况下,该方法包括基于将特征空间划分为预测结直肠癌存在的特征值和预测结直肠癌不存在的特征值的分类器来检测是否存在结直肠癌。在一些情况下,该方法包括将受试者的结直肠癌状态分类为“不确定”(例如,“无判定”)以便减少假阳性和/或假阴性。在一些情况下,在稍后的时间点对具有不确定结直肠癌状态的患者进行重新测试。所述算法可用于评估从受试者获得的生物样品中测量的生物标志物的量与生物标志物的参考量之间的偏差。
在一些情况下,使用分类器来确定受试者的结直肠癌状态。例如,给定N个测量值作为分类器的输入(例如,包括蛋白质的生物标志物和受试者的年龄),受试者可表示为N维空间中的一个点,其中每个轴是一个测量值。在一些情况下,分类器定义(N-1)维形状,将N维空间划分为两个或更多个类别。在一些情况下,这两个类别是具有癌症的受试者和没有癌症的受试者。在一些情况下,存在三个类别。在一些情况下,该类别是具有癌症的受试者、没有癌症的受试者,以及无法可靠地确定受试者的癌症状态的无判定区域。在一些情况下,分类器允许“移动”特定蛋白质的截止值。例如,考虑由边界y=1/x定义的分类器,其中x和y都大于零,并且两个轴中各自是指示癌症状态的蛋白质累积水平。在这种情况下,蛋白质累积水平低于边界(例如,[0,0]、[2,0.3]等)的所有受试者被分类为不具有该病况,而蛋白质累积水平高于边界的任何受试者被分类为具有该病况。如果x轴蛋白质的值为1,则在该实例中,y轴蛋白质必须大于1才能导致癌症诊断。然而,如果x轴蛋白质的值为10,则y轴蛋白质仅需要具有大于0.1的值即可导致癌症诊断。该实例可以使用(N-1)维形状作为分类器外推到N维形状。
特定分类模型的固有表现取决于两个类别的模型得分的分布和分离。除了完美的类别分离之外,大多数分类模型都会因为分类器得分范围之间的类别重叠而出错。例如,这样的重叠可发生在得分范围的中间附近,在该处属于一个类别或另一个类别的概率接近50%。
在这样的重叠区域内,有时将第三类别添加到分类判定的最终集合中是有利的。第三类别任选地指示该得分区域中判定的不确定性。例如,这通过定义分类得分的不确定区域来实现。具有该区域中的得分的样品将得到“不确定”或“无判定”测试结果。具有高于或低于该区域的得分的样品将根据其相对于测试截止值的位置得到标准的阳性或阴性测试结果。在一些情况下,“无判定”率或样品落入“无判定”区域的频率为约1%、约2%、约3%、约4%、约5%、约10%、约15%或约20%。特别地,“无判定”率可为约10%。向分类模型添加不确定区域的益处在于,对于不确定区域之外的样品,分类表现可得到改善,即对于剩余的阳性和阴性测试错误的可能性较小。但是,如果不确定范围过大,则可能会有过多不确定结果,并且测试的值可能会受到质疑。
分类器构建
本领域技术人员使用任何数目的可用技术容易构建参考分类器。例如,通过测定从已知结直肠健康状态的个体获得的多个样品如血液样品的小组水平生成参考分类器。多达1000个样品或更多样品,包括从已知或稍后证实具有结直肠癌或者已知或稍后证实没有结直肠癌的个体获得的样品,就其生物标志物小组水平进行测定。年龄是一些小组的非蛋白质生物标志物成分,也在样品采集时针对每个个体进行记录。
在一些情况下,将每个样品的生物标志物小组水平单独用作参考小组水平以供比较,以便将个体的生物标志物小组水平分类为指示健康的结直肠健康状态或需要进一步研究的结直肠健康问题。将待分类的小组水平与阳性和阴性生物标志物小组水平进行比较,并且通过例如测试的个体的小组水平与之没有显著差异的每个类别的样品数目来判断结果。
或者,从生物标志物小组水平的集合组装分类器。分级器组件是本领域技术人员公知的。特别地,机器学习模型可用于从获自已知结直肠健康状态的样品的小组水平集合来组装分类器。机器学习模型易于构建,例如,使用任何数目的统计编程的编程语言如R、脚本语言如Python和相关的机器学习包、数据挖掘软件如Weka或Java、Mathematica、Matlab或SAS来构建。
结直肠健康评估中分类器的实现
在实施本文所述的任何方法时,比较任选地包括确定受试者的生物标志物概况与参考生物标志物概况之间的差异。例如,所述方法可包括基于受试者的生物标志物概况与参考生物标志物概况相比的偏差(例如,所测量的差异)检测是否存在晚期结直肠腺瘤和CRC中的至少一种。例如,一些方法包括如果受试者的生物标志物概况与阳性参考生物标志物概况(例如,基于来自阳性对照受试者的小组生物标志物的测量的生物标志物概况)相比的偏差较低,则检测存在晚期结直肠腺瘤和CRC中的至少一种。作为另外的实例,一些方法包括如果受试者的生物标志物概况与阴性参考生物标志物概况(例如,基于来自阴性对照受试者的小组生物标志物的测量的生物标志物概况)相比的偏差较高,则检测存在晚期结直肠腺瘤和CRC中至少一种。在一些情况下,该方法包括如果受试者的生物标志物概况与阳性参考生物标志物概况相比的偏差较高,则检测不存在晚期结直肠腺瘤和CRC中的至少一种。在一些实例中,该方法包括如果受试者的生物标志物概况与阴性参考生物标志物概况相比的偏差较低,则检测不存在晚期结直肠腺瘤和CRC中的至少一种。在一些情况下,检测是否存在晚期结直肠腺瘤和CRC中的至少一种可基于由本文所述的算法产生的临床结果得分。该算法可用于评估受试者的生物标志物概况与参考生物标志物概况之间的偏差。
在一些情况下,一些方法包括检测受试者中是否存在晚期结直肠腺瘤。晚期结直肠腺瘤可以是结直肠晚期结直肠腺瘤。本文所述的方法用于检测是否存在任何大小的晚期结直肠腺瘤,诸如具有大于1cm的尺寸的晚期腺瘤。本文所述的方法用于检测是否存在绒毛状、锯齿状、固着或无蒂特性的晚期结直肠腺瘤。
在一些情况下,本文提供的诊断方法包括测量生物标志物小组,该生物标志物小组包含生物样品中的至少五种生物标志物,其中至少三种生物标志物包含AACT、CATD、CEA、CO3、CO9、MIF、PSGL和SEPR。在一些情况下,该方法包括如果从受试者获得的生物样品中包含AACT、CATD、CEA、CO3、CO9、MIF、PSGL和SEPR的小组的小组水平与阳性参考值相比的偏差较低,则提供晚期结直肠腺瘤的阳性诊断。在一些情况下,该方法包括如果从受试者获得的生物样品中包含AACT、CATD、CEA、CO3、CO9、MIF、PSGL和SEPR的小组的小组水平与阴性参考值相比的偏差较高,则提供晚期结直肠腺瘤的阳性诊断。在一些情况下,该方法包括如果从受试者获得的生物样品中包含AACT、CATD、CEA、CO3、CO9、MIF、PSGL和SEPR的小组的小组水平与阳性参考值相比的偏差较高,则提供晚期结直肠腺瘤的阳性诊断。在一些情况下,该方法包括如果从受试者获得的生物样品中包含AACT、CATD、CEA、CO3、CO9、MIF、PSGL和SEPR的小组的小组水平与阴性参考值相比的偏差较低,则提供晚期结直肠腺瘤的阳性诊断。
本文公开的方法、组合物、试剂盒和系统以至少40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、40%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、70%、75%、80%或大于80%的灵敏度检测晚期结直肠腺瘤。
在一些情况下,小组包含第一生物标志物水平与第二生物标志物水平的比率。因此,在一些情况下,本文提供的诊断方法包括确定从受试者获得的生物样品中第一生物标志物水平与第二生物标志物水平的比率。在一些情况下,该方法包括如果从受试者获得的生物样品中第一生物标志物与第二生物标志物的比率与阳性参考值相比的偏差较低,则提供CRC的阳性诊断。在一些情况下,该方法包括如果从受试者获得的生物样品中第一生物标志物与第二生物标志物的比率与阴性参考值相比的偏差较高,则提供CRC的阳性诊断。在一些情况下,该方法包括如果从受试者获得的生物样品中第一生物标志物与第二生物标志物的比率与阳性参考值相比的偏差较高,则提供CRC的阳性诊断。在一些情况下,该方法包括如果从受试者获得的生物样品中第一生物标志物与第二生物标志物的比率与阴性参考值相比的偏差较低,则提供CRC的阳性诊断。
在一些情况下,小组包含第一生物标志物水平与第二生物标志物水平的比率。因此,在一些情况下,本文提供的诊断方法包括确定从受试者获得的生物样品中第一生物标志物水平与第二生物标志物水平的比率。在一些情况下,该方法包括如果从受试者获得的生物样品中第一生物标志物与第二生物标志物的比率与阳性参考值相比的偏差较低,则提供AA的阳性诊断。在一些情况下,该方法包括如果从受试者获得的生物样品中第一生物标志物与第二生物标志物的比率与阴性参考值相比的偏差较高,则提供AA的阳性诊断。在一些情况下,该方法包括如果从受试者获得的生物样品中第一生物标志物与第二生物标志物的比率与阳性参考值相比的偏差较高,则提供阳性诊断。在一些情况下,该方法包括如果从受试者获得的生物样品中第一生物标志物与第二生物标志物的比率与阴性参考值相比的偏差较低,则提供AA的阳性诊断。
本文所述的用于检测受试者中的CRC的诊断方法以大于75%、大于80%、大于85%、大于90%、大于95%、大于96%、大于97%、大于98%、大于99%或约100%的灵敏度检测CRC。此类诊断方法以约70%-100%、约80%-100%或约90-100%的灵敏度检测CRC。此类诊断方法以大于70%、大于75%、大于80%、大于85%、大于90%、大于95%、大于96%、大于97%、大于98%、大于99%或约100%的特异性检测CRC。此类诊断方法以约50%-100%、约60%-100%、约70%-100%、约80%-100%或约90-100%的特异性检测CRC。在特定的实施方案中,此类诊断方法以50%或更高、60%或更高、70%或更高、75%或更高、80%或更高、85%或更高、90%或更高的灵敏度和特异性检测CRC。在特定的实施方案中,此类诊断方法以约50%-100%、约60%-100%、约70%-100%、约80%-100%或约90-100%的灵敏度和特异性检测CRC。
在一些情况下,通过如本文报道的ROC的AUC评估分类器的总体表现。ROC考虑到分类器在所有可能的模型得分截止值处的表现。然而,当需要做出分类决定时(例如,该患者是患病还是健康?),使用截止值来定义两个组。在各个实施方案中,将截止值处或其上方的分类得分评估为阳性(或患病),而将其下方的各点评估为阴性(或健康)。
对于本文公开的一些分类模型,通过选择验证ROC上的最大准确度点来建立分类得分截止值。ROC上的最大准确度点是截止值或使正确分类判定的总数目最大化的点。在这里,阳性和阴性分类判定的权重相等。在给定ROC上存在多个最大准确度点的情况下,在一些情况下选择具有相关的最大灵敏度的点。
基于算法的方法
本文所述的方法、组合物、试剂盒和系统利用基于算法的诊断测定来预测受试者中是否存在以下中的至少一种:晚期结直肠腺瘤和CRC。一种或多种蛋白质生物标志物的表达水平以及任选的一种或多种受试者特性,诸如年龄、体重、性别、病史、危险因素或家族史,被单独使用或安排到功能子集中以计算用于预测是否存在晚期结直肠腺瘤和CRC中的至少一种的可能性的定量得分。虽然本文的主要实施方案集中于的生物标志物小组主要是蛋白质或多肽小组,但任何生物标志物小组的测量可包括蛋白质和非蛋白质组分如RNA、DNA、有机代谢物或者无机分子或代谢物(例如,铁、镁、硒、钙等等)。
通过本文所述的任何方法的实践提供的基于算法的测定和相关信息可便于受试者中的最佳治疗决策。例如,这样的临床工具可使医师或看护者能够鉴别有较低可能性患有晚期结直肠腺瘤或癌并因此将不需要治疗或对增加晚期结直肠腺瘤或CRC的监测的患者,或者有较高可能性患有晚期结直肠腺瘤或CRC并因此将会需要治疗或增加对所述晚期结直肠腺瘤或CRC的监测的患者。
在一些情况下,通过应用特定算法来确定定量得分。用于计算本文公开的方法中的定量得分的算法可将生物标志物或生物标志物组的表达水平值分组。此外,特定生物标志物组的形成可便于生物标志物或生物标志物子集(例如分类器)的各种表达水平对定量得分的贡献的数学加权。本文描述了用于计算定量得分的示例性算法。
表1和表3-4的小组中列出了示例性生物标志物以及它们的人氨基酸序列(适用时)。生物标志物可包括表1的多肽序列的全长分子,以及表1的多肽序列的独特可鉴别片段。标志物可以是全长的但不需要是全长的以提供信息。在许多情况下,只要片段独特地可鉴别为衍生自或代表表1的多肽,则其出于本文的目的提供信息。
示例性受试者
从许多合格的受试者如想要确定他们患有晚期结直肠腺瘤和CRC中的至少一种的可能性的受试者采集生物样品。在一些情况下,受试者是健康且无症状的。受试者的年龄不受限制。例如,受试者的年龄为0至约30岁、约20至约50岁或约40岁或更大。在各种情况下,受试者是健康的、无症状的并且年龄为0-30岁、20-50岁或40岁或更大。受试者的年龄为至少30岁、年龄为至少40岁或年龄为至少50岁。受试者的年龄为小于50岁、年龄为小于40岁或年龄为小于30岁。在各个实例中,受试者是健康且无症状的。在各个实例中,受试者没有以下至少一种的家族史:CRC、腺瘤和息肉。在各个实例中,受试者未进行过结肠镜检查、乙状结肠镜检查或结肠组织活检。在各个实例中,受试者是健康且无症状的,并且未接受过结肠镜检查、乙状结肠镜检查或结肠组织活检。在一些情况下,受试者未接受过结肠镜检查、乙状结肠镜检查或结肠组织活检,并且具有以下中的一种或多种:CRC的症状、CRC的家族史和CRC的危险因素。在一些情况下,可在常规检查期间从受试者获得生物样品,或者以建立生物标志物的基线水平。在一些情况下,受试者不具有结直肠癌的症状、不具有结直肠癌的家族史、不具有公认的结直肠癌危险因素。
在一些情况下,受试者呈现以下中的至少一种:结直肠癌的症状、结直肠癌的家族史和公认的结直肠癌危险因素。在一些情况下,通过筛选测定(例如,粪便潜血试验或乙状结肠镜检查)或者直肠数字检查或者刚性或柔性结肠镜检查或者CT扫描或者其他X射线技术将受试者鉴别为具有CRC的高风险或患有CRC。例如,将本文所述的一种或多种方法应用于正在接受CRC治疗的受试者,以确定他们接受的疗法或治疗的有效性。
示例性生物样品
在一些示例性实施方案中,生物样品是循环血液样品或者是从个体的静脉或动脉获得的样品。任选地对样品进行处理,以便从血液样品中分离血浆、循环游离蛋白质或全蛋白质部分。通常对样品进行处理以便于储存或允许在室温下装运,但是在优选的实施方案中,样品例如利用干冰或在干冰上来冷冻装运,以保存样品以供在与抽血师的办公室分隔的处理中心处进行分析。
作为代表性样品采集方案,使用来自Becton-Dickinson,Franklin Lakes,NewJersey,USA和Almeco A/S,Esbjerg,Denmark的无内毒素、无脱氧核糖核酸酶(DNA酶)和无核糖核酸酶(RNA酶)采集和处理设备、采集管和存储瓶,利用来自肘前静脉的轻型止血带采集血清、EDTA血浆、柠檬酸盐血浆和血沉棕黄层的血液样品。将血液样品在21℃下以3,000xG离心10分钟,并立即将血清和血浆与红细胞和血沉棕黄层分离。通过在被单独转移进行冷冻的血沉棕黄层上方留下0.5cm未经接触的血清或血浆来减少白细胞和血小板的污染。所有分离的样品用独特的条形码进行标记以供储存鉴别,该储存鉴别使用Seattle,WA,USA跟踪系统进行。将分离的样品在-80℃下在连续电子监视下冷冻。整个程序在初始抽样后2小时内完成。
另外的生物样品包括但不限于以下一种或多种:尿液、粪便、泪液、全血、血清、血浆、血液成分、骨髓、组织、细胞、器官、唾液、颊拭子、淋巴液、脑脊液、病变渗出液和由身体产生的其他流体。在一些情况下,生物样品是固体生物样品,例如组织活检。活检可以是固定的、石蜡包埋的或新鲜的。在本文的许多实施方案中,优选的样品是从个体的静脉或动脉抽取的血液样品或其加工产物。
任选地使用本领域已知的或以其他方式在本文描述的任何方法处理生物样品,以便于如本文所述的一种或多种生物标志物的测量。样品制备操作包括例如从细胞或组织提取和/或分离细胞内物质,诸如提取核酸、蛋白质或其他大分子。可与本公开内容方法一起使用的样品制备包括但不限于离心、亲和色谱法、磁性分离、免疫测定、核酸测定、基于受体的测定、细胞计数测定、比色测定、酶测定、电泳测定、电化学测定、光谱测定、色谱测定、显微测定、形貌测定、量热测定、放射性同位素测定、蛋白质合成测定、组织学测定、培养测定及其组合。
样品制备任选地包括通过适当的溶剂和量进行稀释,以确保通过给定的测定检测适当的浓度水平范围。
通过物理、化学方法或两者的组合进行从样品的细胞间隙接近核酸和大分子。在该方法的一些应用中,在分离粗提取物后,通常期望分离核酸、蛋白质、细胞膜颗粒等。在该方法的一些应用中,期望将核酸与其蛋白质和细胞膜颗粒保持在一起。
在本文提供的方法的一些应用中,在使用本公开内容的方法进行分析之前,从生物样品提取核酸和蛋白质。例如通过使用洗涤剂裂解物、超声处理或使用玻璃珠的涡旋来完成提取。
可使用本领域合适的任何技术分离分子,包括但不限于使用梯度离心(例如,氯化铯梯度、蔗糖梯度、葡萄糖梯度或其他梯度)、离心方案、煮沸、纯化试剂盒等技术,以及使用采用试剂提取方法如使用Trizol或DNAzol的方法的液体提取。
在送去分析之前,在分隔的位置处部分地制备一些样品。例如,抽血师在诊所或医院抽取血液样品。可对样品进行部分处理,例如,通过置于抗凝剂处理的管中并离心以产生血浆。然后将部分处理的样品如血浆装运(例如,在冰上或在室温下的防腐剂中邮寄)到分隔的设施,在该设施处可进行本文公开的任何方法以确定生物标志物小组水平以及/或者CRC或晚期腺瘤健康状态。
取决于于所需的检测方法,根据标准生物样品制备来制备样品。例如,对于质谱检测,从患者获得的生物样品可进行离心、过滤、通过免疫亲和柱处理、分离成级分、部分消化及其组合。可将各个级分重悬于适当的载体如缓冲液或其他类型的加样溶液中以供检测和分析,包括LCMS加样缓冲液。
生物标志物评估
本公开内容提供了用于测量生物样品中的一种或多种生物标志物小组的方法。可使用任何合适的方法来检测本文所述的任何小组的一种或多种生物标志物。
在一些情况下,仅报告落入特定范围内的值。例如,在一些情况下,低于给定截止值的测定的蛋白质浓度或其他生物标志物水平指示测试失败,而高于阈值的测定的蛋白质浓度或其他生物标志物水平可指示读数可疑或不准确。
用于实践本文所述方法的有用的分析物捕获剂包括但不限于抗体,如含有抗体的粗血清、纯化抗体、单克隆抗体、多克隆抗体、合成抗体、抗体片段(例如,Fab片段);抗体相互作用剂,如蛋白A、碳水化合物结合蛋白和其他相互作用物;蛋白质相互作用物(例如抗生物素蛋白及其衍生物);肽;以及小的化学实体,如酶底物、辅因子、金属离子/螯合物、适体和半抗原。可对抗体进行修饰或化学处理以优化与靶标或固体表面(例如生物芯片和柱)的结合。
在一些情况下,使用免疫测定在生物样品中测量生物标志物。一些免疫测定使用特异性或信息性地结合或识别抗原(例如蛋白质或肽上的位点、生物标志物靶标)的抗体。一些免疫测定包括以下步骤:使用抗体接触生物样品并使抗体与样品中的抗原形成复合物,洗涤样品并用检测试剂检测抗体-抗原复合物。识别生物标志物的抗体可以是可商购的。识别生物标志物的抗体可通过已知的抗体产生方法而生成。
免疫测定包括间接测定,其中例如可使用第二标记的抗体来检测结合的标志物-特异性抗体。示例性的可检测标记物包括磁珠(例如,DYNABEADSTM)、荧光染料、放射性标记、酶(例如,辣根过氧化物酶、碱性磷酸酶和其他常用的酶)以及量热标记如胶体金或者有色的玻璃或塑料珠。可使用竞争或抑制测定来测量样品中的生物标志物,其中例如与标志物的不同表位结合的单克隆抗体与混合物同时温育。
使用免疫测定检测抗原的条件取决于所使用的特定抗体。此外,温育时间可取决于测定形式、标志物、溶液体积、浓度等。免疫测定可在室温下进行,然而它们可取决于所使用的抗体在一定温度范围内如约0℃至约40℃进行。
本领域已知作为起始基础的各种类型的免疫测定可用于定制用于检测本公开内容的生物标志物的测定。有用的测定可包括例如酶免疫测定(EIA)如酶联免疫吸附测定(ELISA)。例如,如果抗原可与固体支持物或表面结合,则可通过使其与特定抗体反应来检测该抗原,并且可通过使抗体与第二抗体反应或通过将标记直接掺入第一抗体来对该抗体进行定量。或者,可将抗体与固体表面结合并添加抗原。然后可添加并检测识别抗原上的不同表位的第二抗体。这样的测定可被称为“夹心测定”,并且可用于避免高背景或非特异性反应的问题。这些类型的测定可以是灵敏的且可重复的,足以测量生物样品中的低浓度抗原。
免疫测定可用于确定样品中是否存在标志物以及样品中标志物的量。测量抗体-标志物复合物的量或存在的方法包括但不限于荧光、萤光、化学发光、吸光度、反射率、透射率、双折射率或折射率(例如,表面等离子共振、椭圆偏振法、共振镜法、光栅耦合器波导法或干涉法)。此类试剂可与光学检测方法如各种形式的显微镜检查、成像方法和非成像方法一起使用。电化学方法可包括伏安法和电流滴定法。射频方法可包括多极共振光谱。
生物标志物的测量任选地涉及使用抗体。可使用本领域已知的标准方法制备与本文所述的任何生物标志物特异性结合的抗体。例如,可通过将抗原注射到哺乳动物如小鼠、大鼠、兔、山羊、绵羊或马中来产生多克隆抗体,以生成大量抗体。从这些动物分离的血液可含有多克隆抗体,即与同一抗原结合的多种抗体。或者,可通过将抗原注射到鸡中来产生多克隆抗体,以在卵黄中生成多克隆抗体。此外,可使抗体特异性识别生物标志物的修饰形式,如生物标志物的磷酸化形式,例如,它们可识别磷酸化后的酪氨酸或丝氨酸,但不在不存在磷酸的情况下识别酪氨酸或丝氨酸。以这种方式,抗体可用于确定特定生物标志物的磷酸化状态。
抗体是商业获得的或使用完备的方法产生的。为了获得对抗原的单个表位具有特异性的抗体,从动物分离分泌抗体的淋巴细胞,并通过将它们与癌细胞系融合而永生化。融合细胞被称为杂交瘤,并且可在培养时连续生长和分泌抗体。通过稀释克隆来分离单个杂交瘤细胞,以生成均产生相同抗体的细胞克隆;这些抗体可被称为单克隆抗体。
可以以几种方式纯化多克隆和单克隆抗体。例如,可使用抗原亲和色谱法分离抗体,所述抗体亲和色谱法可与细菌蛋白质如蛋白A、蛋白G、蛋白L或重组融合蛋白蛋白A/G耦合,然后通过在280nm处的UV光检测洗脱液级分的吸光度以确定哪些级分含有抗体。蛋白A/G可与人IgG的所有亚类结合,从而使其可用于纯化亚类尚未确定的多克隆或单克隆IgG抗体。此外,蛋白A/G可与IgA、IgE、IgM和(在一些情况下在较小程度上)IgD结合。蛋白A/G可与小鼠IgG的所有亚类结合,但在一些情况下不与小鼠IgA、IgM或血清白蛋白结合。该特征可允许蛋白A/G用于纯化和检测小鼠单克隆IgG抗体,而不受IgA、IgM和血清白蛋白的干扰。
抗体衍生自分子的不同类别或同种型,例如IgA、IgA IgD、IgE、IgM和IgG。IgA可被设计用于在体液中分泌,而其他如IgM被设计为在细胞表面上表达。抗体可以是IgG抗体。在一些情况下,IgG包含两个亚基,包括两个“重”链和两个“轻”链。这些可以以对称结构组装,并且每个IgG可具有两个相同的抗原识别结构域。抗原识别结构域可以是来自重链和轻链两者的氨基酸的组合。分子可大致成形为“Y”状,并且分子的臂/尖端包含抗原识别区或Fab(抗原结合片段)区,而Fc(可结晶片段)区的茎不一定参与识别并且可相当恒定。恒定区在相同同种型的所有抗体中可以是相同的,但在不同同种型的抗体中可以不同。
在通过western印迹分级后,还可使用抗体来检测蛋白质。在一些情况下,western印迹用于检测和/或测量蛋白质或多肽生物标志物。
一些检测方法可采用流式细胞术。流式细胞术可以是基于激光的生物物理技术,其可用于生物标志物检测、定量(细胞计数)和细胞分离。该技术可用于诊断健康病症,尤其是血癌。通常,流式细胞术可包括将单细胞悬浮于流体流中。可将单波长的光束(通常是激光)引导到液体流上,并且可通过电子检测设备来检测由经过的细胞引起的散射光。可用于本文所述的一种或多种方法的流式细胞术方法可包括荧光激活细胞分选(FACS)。FACS可使用荧光标记的抗体来检测感兴趣的细胞上的抗原。在FACS中使用抗体标记的这一附加功能可基于每种细胞荧光标记细胞的特定光散射和荧光特性实现同时的多参数分析和定量,并且其与传统流式细胞术相同地提供了感兴趣的细胞群体的物理分离。
可使用多种荧光团作为流式细胞术中的标记。荧光团通常可附着于识别细胞上或细胞中的靶特征的抗体。合适的荧光标记的实例包括但不限于:荧光素(FITC)、5,6-羧甲基荧光素、德克萨斯红、硝基苯-2-氧杂-1,3-二唑-4-基(NBD)以及花青染料Cy3、Cy3.5、Cy5、Cy5.5和Cy7。其他荧光标记如Alexa
Figure BDA0002088958580001771
染料、DNA含量染料如DAPI以及Hoechst染料是本领域公知的,并且可从各种商业来源容易地获得。每个荧光团可具有特征峰值激发和发射波长,并且发射光谱经常重叠。这些荧光团的吸收和发射最大值可分别为:FITC(490nm;520nm),Cy3(554nm;568nm),Cy3.5(581nm;588nm),Cy5(652nm:672nm),Cy5.5(682nm;703nm),以及Cy7(755nm;778nm)。荧光标记可从各种商业来源获得。量子点可用于代替传统的荧光团。可用于检测的其他方法包括同位素标记的抗体,如镧系元素同位素。
免疫测定任选地包含免疫组织化学。免疫组织化学用于检测组织样品中要求保护的生物标志物的表达。可通过例如使用放射性标记、荧光标记、半抗原标记如生物素或者酶如辣根过氧化物酶或碱性磷酸酶直接标记抗体本身来检测抗体。或者,未标记的第一抗体可与标记的第二抗体(包括抗血清、多克隆抗血清)或对第一抗体具有特异性的单克隆抗体结合使用。免疫组织化学方案是本领域公知的,并且方案和抗体是可商购的。或者,产生针对于如本文所公开生物标志物或修饰形式的生物标志物或结合配偶体的抗体,其可用于确定组织样品中蛋白质的表达水平。
生物标志物的一些测量包括生物芯片的使用。生物芯片可用于筛选较大数目的大分子。生物芯片可被设计成具有固定的核酸分子、全长蛋白质、抗体、亲和体(被工程化以模拟单克隆抗体的小分子)、适体(基于核酸的配体)或化学化合物。芯片可被设计成在一个芯片上检测多种大分子类型。例如,芯片可被设计成在一个芯片上检测核酸分子、蛋白质和代谢物。生物芯片可用于并被设计成同时分析单个样品中的小组生物标志物,从而产生针对这些生物标志物的受试者概况。生物芯片的使用允许进行多重分析,从而减少总处理时间和所需的样品量。
蛋白质微阵列可以是可与本公开内容一起使用的特定类型的生物芯片。在一些情况下,芯片包括支撑表面如载玻片、硝酸纤维素膜、珠子或微量滴定板,捕获蛋白质阵列可以以阵列形式与之结合到固体表面上。蛋白质阵列检测方法可提供高信号和低背景。可将通常用荧光染料标记的检测探针分子添加到阵列。探针与固定化蛋白质之间的任何反应都可导致发射可检测信号。此类蛋白质微阵列可以是快速的、自动化的,并且向诊断测试提供高灵敏度的蛋白质生物标志物读出。然而,本领域技术人员将立即意识到存在可与该技术一起使用的多种检测方法。示例性微阵列包括分析微阵列(也称为捕获阵列)、功能性蛋白质微阵列(也称为靶蛋白阵列)和反相蛋白质微阵列(RPA)。
可使用抗体、适体或亲和体的文库构建分析蛋白质微阵列。该阵列可用复杂的蛋白质溶液如血液、血清或细胞裂解物进行探测,所述复杂的蛋白质溶液通过捕获它们与之特异性结合的蛋白质分子而起作用。使用多种检测系统分析所得结合反应可提供关于样品中特定蛋白质的表达水平以及结合亲和力和特异性的测量的信息。这种类型的蛋白质微阵列在比较不同样品中的蛋白质表达方面特别有用。功能性蛋白质微阵列可通过固定大量纯化的全长功能性蛋白质或蛋白质结构域来构建,并可用于鉴别蛋白质-蛋白质、蛋白质-DNA、蛋白质-RNA、蛋白质-磷脂和蛋白质-小分子的相互作用,以测定酶活性并检测抗体并且证明其特异性。这些蛋白质微阵列生物芯片可用于研究样品中整个蛋白质组的生物化学活性。
可使用反相蛋白质微阵列(RPA)测量一种或多种生物标志物。可由组织和细胞裂解物构建反相蛋白质微阵列,所述组织和细胞裂解物可排列在微阵列上并用针对感兴趣的靶蛋白的抗体进行探测。可采用化学发光、荧光或比色测定来检测这些抗体。除了裂解物中的蛋白质之外,可在载玻片上印出参考对照肽以允许蛋白质定量。RPA允许确定可能由疾病引起并存在于患病细胞中的改变的蛋白质或其他试剂的存在。
可使用质谱(或者称为质谱法)测量一种或多种生物标志物。质谱(MS)可以指测量带电粒子的质荷比的分析技术。其可主要用于确定样品或分子的元素组成,以及用于阐明分子如肽和其他化学化合物的化学结构。MS通过电离化学化合物以生成带电分子或分子片段并测量它们的质荷比来工作。MS仪器通常由以下三个模块组成:(1)离子源,其可将气相样品分子转化成离子(或者,在电喷雾电离的情况下,将溶液中存在的离子移入气相中);(2)质量分析仪,其通过施加电磁场对离子的质量进行分选;以及(3)检测器,其测量指示物量的值,从而提供用于计算存在的每种离子的丰度的数据。
与本公开内容一起使用的合适的质谱法包括但不限于电喷雾电离质谱(ESI-MS)、ESI-MS/MS、ESI-MS/(MS)n、基质辅助激光解吸电离飞行时间质谱(MALDI-TOF-MS)、表面增强激光解吸/电离飞行时间质谱(SELDI-TOF-MS)、串联液相色谱-质谱(LC-MS/MS)质谱、硅上解吸/电离(DIOS)、二次离子质谱(SIMS)、四极飞行时间(Q-TOF)、大气压化学电离质谱(APCI-MS)、APCI-MS/MS、APCI-(MS)、大气压光电离质谱(APPI-MS)、APPI-MS/MS和APPI-(MS)n、四极质谱、傅立叶变换质谱(FTMS)和离子阱质谱,其中n可以是大于零的整数。
LC-MS通常可用于解析复杂混合物的组分。LC-MS方法通常涉及蛋白酶消化和变性(通常涉及蛋白酶如胰蛋白酶,以及变性剂如尿素,以使三级结构和碘乙酰胺变性以给半胱氨酸残基加帽),然后进行LC-MS与肽质量指纹图谱或LC-MS/MS(串联MS)以得到单个肽的序列。LC-MS/MS可用于复杂样品的蛋白质组学分析,其中即使使用高分辨率质谱仪,肽质量仍然可能重叠。可以首先在SDS-PAGE凝胶或HPLC-SCX上分离复杂生物流体如人血清的样品,然后在LC-MS/MS中运行,从而允许鉴别超过1000种蛋白质。
虽然多种质谱方法与本文提供的本公开内容的方法相容,但在一些应用中,期望对来自感兴趣的蛋白质的选定子集的生物样品中的蛋白质进行定量。与本公开内容相容的一种这样的MS技术是多重反应监测质谱(MRM-MS),或者被称为选择反应监测质谱(SRM-MS)。
MRM-MS技术涉及三重四极(QQQ)质谱仪,以从感兴趣的肽选择带正电荷的离子,使正电荷的离子片段化,然后测量所选择的待正电荷的片段离子的丰度。该测量通常称为转变和/或转变离子。
备选地或组合地,被制备用于MS分析的样品补充有至少一种标记的蛋白质或多肽,使得标记的蛋白质或多肽与样品中的蛋白质或片段一起迁移或在样品中的蛋白质或片段附近迁移。在一些情况下,将重同位素标记的蛋白质或片段引入样品中,使得标记的蛋白质或片段在样品中未标记的天然形式的蛋白质附近但与之不同地迁移。通过了解标记蛋白质的位置及其标记对MS迁移的影响,可容易地鉴别样品中相应的天然蛋白质。在一些情况下,采用标记的蛋白质或蛋白质片段的小组,从而从MS数据容易地测定蛋白质小组,但同时也获得了广泛的蛋白质或片段的非靶向数据。
在一些应用中,MRM-MS与高压液相色谱(HPLC)和最近的超高压液相色谱(UHPLC)联用。在其他应用中,MRM-MS可与具有QQQ质谱仪的UHPLC联用,以对所有感兴趣的肽和蛋白质进行所需的LC-MS转变测量。
在一些应用中,可使用四极飞行时间(qTOF)质谱仪、飞行时间-飞行时间(TOF-TOF)质谱仪、Orbitrap质谱仪、四极Orbitrap质谱仪或任何四极离子阱质谱仪的应用来从一种或多种感兴趣的肽选择带正电荷的离子。然后可测量片段化的带正电荷的离子以确定带正电荷的离子的丰度,用于定量感兴趣的肽或蛋白质。
在一些应用中,使用飞行时间(TOF)、四极飞行时间(qTOF)质谱仪、飞行时间-飞行时间(TOF-TOF)质谱仪、Orbitrap质谱仪或四极Orbitrap质谱仪的应用来测量来自感兴趣的蛋白质的带正电荷的肽离子的质量和丰度,而无需进行片段化以进行定量。在该应用中,分析物质量测量的准确度可用作测定的选择标准。已知组成和浓度的同位素标记的内标可用作质谱定量方法的一部分。
在一些应用中,使用飞行时间(TOF)、四极飞行时间(qTOF)质谱仪、飞行时间-飞行时间(TOF-TOF)质谱仪、Orbitrap质谱仪或四极Orbitrap质谱仪来测量感兴趣的蛋白质的质量和丰度以用于定量。在该应用中,分析物质量测量的准确度可用作测定的选择标准。任选地,该应用可在通过质谱分析之前使用蛋白质的蛋白水解消化。已知组成和浓度的同位素标记的内标可用作质谱定量方法的一部分。
在一些应用中,多种电离技术可与本文提供的质谱仪联用以生成所需信息。与本公开内容一起使用的非限制性示例性电离技术包括但不限于基质辅助激光解吸电离(MALDI)、解吸电喷雾电离(DESI)、直接辅助实时(DART)、表面辅助激光解吸电离(SALDI)或电喷雾电离(ESI)。
在一些应用中,HPLC和UHPLC可与质谱仪联用,可在质谱分析之前进行许多其他的肽和蛋白质分离技术。可用于从基质背景分离所需分析物(例如,肽或蛋白质)的一些示例性分离技术包括但不限于蛋白质或肽的反相液相色谱(RP-LC)、在MALDI之前进行离线液相色谱法(LC)、1维凝胶分离、2维凝胶分离、强阳离子交换(SCX)色谱、强阴离子交换(SAX)色谱、弱阳离子交换(WCX)和弱阴离子交换(WAX)。可在质谱分析之前使用上述技术中的一种或多种。
可使用微阵列测量一种或多种生物标志物。还可使用微阵列技术鉴别或确认差异基因表达。因此,可使用微阵列技术在新鲜或固定的组织中测量表达谱生物标志物。在该方法中,可将感兴趣的多核苷酸序列(包括cDNA和寡核苷酸)铺在微芯片基板上或排列在微芯片基板上。然后可将排列的序列与来自感兴趣的细胞或组织的特异性DNA探针杂交。mRNA的来源可以是从生物样品分离的总RNA,并且相应的正常组织或细胞系可用于确定差异表达。
可通过测序来测量一种或多种生物标志物。还可使用测序技术鉴别或确认差异基因表达。因此,可使用测序技术在新鲜或固定的样品中测量表达谱生物标志物。在该方法中,感兴趣的多核苷酸序列(包括cDNA和寡核苷酸)可用作模板以合成测序文库。可对文库进行测序,并将读数映射到适当的参考。mRNA的来源可以是从生物样品分离的总RNA,并且相应的正常组织或细胞系可用于确定差异表达。示例性测序技术可包括例如乳液PCR(来自Roche 454的焦磷酸测序、来自Ion Torrent的半导体测序、来自Life Technologies的通过连接的SOLiD测序、来自Intelligent Biosystems的合成测序)、流动槽上的桥式扩增(例如Solexa/111umina)、Wildfire技术的等温扩增(Life Technologies)或滚环扩增生成的rolony/纳米球(Complete Genomics,Intelligent Biosystems,Polonator)。允许单个分子的直接测序而不进行先前克隆扩增的诸如Heliscope(Helicos)、SMRT技术(PacificBiosciences)或纳米孔测序(Oxford Nanopore)等测序技术可以是合适的测序平台。可在有或没有靶标富集的情况下进行测序。在一些情况下,在测序之前和/或期间,通过任何合适的手段对来自样品的多核苷酸进行扩增。
可将cDNA克隆的PCR扩增的插入物以密集阵列施加到基板上。优选地,可将至少10,000个核苷酸序列施加到基板上。以每种10,000个元素固定在微芯片上的微阵列化基因可适用于在严格条件下的杂交。荧光标记的cDNA探针可通过经过从感兴趣的组织中提取的RNA的逆转录来掺入荧光核苷酸而生成。施加到芯片的标记的cDNA探针与阵列上每个DNA点特异性杂交。在严格洗涤以去除非特异性结合的探针后,可通过诸如共聚焦激光显微镜等装置或通过另外的检测方法如CCD照相机来扫描微阵列芯片。每个阵列化元件的杂交的定量允许评估相应的mRNA丰度。对于双色荧光,由两个RNA来源生成的单独标记的cDNA探针可成对地与阵列杂交。因此可同时确定对应于每个指定基因的来自两个来源的转录物的相对丰度。微阵列分析可按照制造商的方案通过可商购的设备进行。
可使用qRT-PCR测量一种或多种生物标志物,其可用于比较在不同样品群体中、在正常和肿瘤组织中、在有或没有药物治疗的情况下的mRNA水平,以表征基因表达的模式、区分密切相关的mRNA以及分析RNA结构。通过RT-PCR进行基因表达谱分析的第一步可以是从生物样品提取RNA,然后将RNA模板逆转录成cDNA并通过PCR反应进行扩增。取决于表达谱分析的目标,逆转录反应步骤通常可使用特异性引物、随机六聚体或寡聚dT引物引发。逆转录酶可以是禽类成髓细胞性白血病病毒逆转录酶(AMV-RT)和/或莫洛尼鼠白血病病毒逆转录酶(MLV-RT)。
虽然PCR步骤可使用多种热稳定的DNA依赖性DNA聚合酶,但其通常采用Taq DNA聚合酶,其可具有5’-3’核酸酶活性但缺乏3’-5’校正内切核酸酶活性。因此,TaqManTM PCR通常利用Taq或Tth聚合酶的5’-核酸酶活性来水解与其靶扩增子结合的杂交探针,但是可使用具有同等5’核酸酶活性的任何酶。两种寡核苷酸引物可用于生成PCR反应的典型扩增子。第三寡核苷酸或探针可被设计为检测位于两个PCR引物之间的核苷酸序列。探针可通过TaqDNA聚合酶不可延伸,并且可使用报道荧光染料和猝灭荧光染料进行标记。当两种染料在探针上位于靠近在一起时,可通过猝灭染料猝灭来自报道染料的任何激光诱导的发射。在扩增反应期间,Taq DNA聚合酶可以以模板依赖性方式切割探针。所得到探针片段可在溶液中解离,并且来自释放的报道染料的信号可不受第二荧光团的猝灭效应的影响。对于合成的每个新分子,可释放一个报道染料分子,并且未猝灭的报道染料的检测可以为数据的定量解释提供基础。
TaqManTM RT-PCR可使用可商购的设备进行,例如ABI PRISM 7700TM序列检测系统TM(Perkin-Elmer-Applied Biosystems,Foster City,Calif.,USA)或Lightcycler(Roche Molecular Biochemicals,Mannheim,Germany)。在优选的实施方案中,5’核酸酶程序在实时定量PCR装置如ABI PRISM 7700TM序列检测系统TM上运行。所述系统包括热循环仪、激光器、电荷耦合器件(CCD)、照相机和计算机。该系统包括用于运行仪器和用于分析数据的软件。5’-核酸酶测定数据最初表示为Ct或称阈值循环。如上所述,在每个循环期间记录荧光值,并表示在扩增反应中扩增至该点的产物量。荧光信号被首次记录为统计学上显著的点可以是阈值循环(Ct)。
为了使错误和样品与样品之间变化的影响最小化,可以使用内标进行RT-PCR。内标可以在不同组织中以恒定水平表达,并且可以不受实验处理的影响。最常用于使基因表达模式归一化的RNA是管家基因甘油醛-3-磷酸-脱氢酶(GAPDH)和β-肌动蛋白的mRNA。
RT-PCR技术的最新变化可包括实时定量PCR,其可通过双标记的荧光基因探针(即,TaqManTM探针)测量PCR产物累积。实时PCR可以与定量竞争PCR(其中每个靶序列的内部竞争物可用于归一化)和定量比较PCR(使用样品内包含的归一化基因或管家基因进行RT-PCR)相容。进一步的细节参见例如Held等人,Genome Research 6:986-994(1996)。
数据归一化
任选地对本文公开的方法、系统、试剂盒和组合物中使用的测量数据进行归一化。归一化是指校正例如所测定的基因或蛋白质水平的量的差异以及所用模板质量的变异性,以去除涉及基因或蛋白质表达的处理和检测的不期望的系统变异测量来源。其他系统变异来源可归因于实验室处理条件。
在一些情况下,归一化方法用于实验室处理条件的归一化。可与本公开内容的方法一起使用的实验室处理的归一化的非限制性实例包括但不限于:考虑数据生成过程期间使用的仪器、试剂和设备之间的系统差异以及/或者数据采集中的日期和时间或时间流逝。
测定可通过掺入某些归一化标准基因或蛋白质的表达来提供归一化,所述归一化标准基因或蛋白质在相关条件下的表达水平没有显著差异,也就是说已知它们在该特定样品类型中具有稳定且一致的表达水平。可与本公开内容一起使用的合适的归一化基因和蛋白质包括管家基因(参见,例如,E.Eisenberg等人,Trends in Genetics 19(7):362-365(2003))。在一些应用中,归一化生物标志物(基因和蛋白质)也称为参考基因,已知在在具有晚期结直肠腺瘤或CRC的受试者中与没有晚期结直肠腺瘤或CRC的对照受试者中相比,不表现出有意义的不同表达水平。在一些应用中,添加可使用的稳定同位素标记的标准品并且代表具有用于数据归一化的已知性质的实体可能是有用的。在其他应用中,可伴随每个分析批次测量标准的固定样品,以考虑仪器和每日测量的变异性。
临床结果得分
用于子选择区分生物标志物和任选的受试者特性以及用于构建分类模型的机器学习算法在本文中的一些方法和系统中用于确定临床结果得分。这些算法包括但不限于弹性网络、随机森林、支持向量机和逻辑回归。这些算法可帮助选择重要的生物标志物特征并将基础测量转换成与例如临床结果、疾病风险、疾病可能性、是否存在疾病、治疗反应和/或疾病状态分类相关的得分或概率。
通过将从受试者获得的生物样品中的至少两种生物标志物的水平与所述至少两种生物标志物的参考水平进行比较来确定临床结果得分。备选地或组合地,通过将生物标志物小组的受试者特异性概况与所述生物标志物小组的参考概况进行比较来确定临床结果得分。通常,参考水平或参考概况代表已知诊断。例如,参考水平或参考概况代表晚期结直肠腺瘤的阳性诊断。参考水平或参考概况可代表CRC的阳性诊断。作为另一个实例,参考水平或参考概况代表晚期结直肠腺瘤的阴性诊断。类似地,参考水平或参考概况可代表CRC的阴性诊断。
在一些情况下,得分的增大指示以下一种或多种的可能性增大:不良临床结果、良好临床结果、高疾病风险、低疾病风险、完全反应、部分反应、稳定疾病、无反应和疾病管理的推荐治疗。在一些情况下,定量得分的减小指示以下一种或多种的可能性增大:不良临床结果、良好临床结果、高疾病风险、低疾病风险、完全反应、部分反应、稳定疾病、无反应和疾病管理的推荐治疗。
相似的来自患者的生物标志物概况与参考概况通常指示以下一种或多种的可能性增大:不良临床结果、良好临床结果、高疾病风险、低疾病风险、完全反应、部分反应、稳定疾病、无反应和疾病管理的推荐治疗。在一些应用中,不相似的来自患者的生物标志物概况与参考概况指示以下一种或多种的可能性增大:不良临床结果、良好临床结果、高疾病风险、低疾病风险、完全反应、部分反应、稳定疾病、无反应和疾病管理的推荐治疗增大。
一种或多种生物标志物阈值的增大通常指示以下一种或多种的可能性增大:不良临床结果、良好临床结果、高疾病风险、低疾病风险、完全反应、部分反应、稳定疾病、无反应和疾病管理的推荐治疗。在一些应用中,一种或多种生物标志物阈值的减小指示以下一种或多种的可能性增大:不良临床结果、良好临床结果、高疾病风险、低疾病风险、完全反应、部分反应、稳定疾病、无反应和疾病管理的推荐治疗。
定量得分、一种或多种标志物阈值、类似生物标志物概况值中的至少一种的增大指示以下一种或多种的可能性增大:不良临床结果、良好临床结果、高疾病风险、低疾病风险、完全反应、部分反应、稳定疾病、无反应和疾病管理的推荐治疗。类似地,定量得分、一种或多种生物标志物阈值、类似生物标志物概况值或其组合中的至少一种的减小指示以下一种或多种的可能性增大:不良临床结果、良好临床结果、高疾病风险、低疾病风险、完全反应、部分反应、稳定疾病、无反应和疾病管理的推荐治疗。
基于治疗期间获得的另外的信息,任选地更新临床结果得分。此类更新通常包括添加其他生物标志物。此类生物标志物包括另外的蛋白质、代谢物累积水平、受试者的身体特征(例如,年龄、种族、体重、人口统计学史)、受试者的病史(例如,晚期结直肠腺瘤的家族史、蛋白质小组的先前定量得分)。此类更新可包括调整测试灵敏度。此类更新可包括调整测试灵敏度。此类更新可包括调整测试阈值。此类更新可包括调整预测的临床结果。
例如,在一些情况下,使用如本文公开的小组来测试具有晚期结直肠腺瘤风险的患者。患者可被归类为患有或可能患有晚期结直肠腺瘤。在一些情况下,本文公开的蛋白质小组的阈值将基于另外的生物标志物如患者的年龄进行更新。例如,60岁以上的患者比60岁以下的患者更有可能患有晚期结直肠腺瘤。因此,60岁以上群体中蛋白质小组的阳性预测值可高于60岁以下群体。在一些情况下,蛋白质小组中蛋白质的阈值可基于另外的生物标志物(例如,年龄)进行改变以反映这一点,诸如通过相比于60岁以下群体降低60岁以上群体的阈值。患者的个人阈值可以基于先前的测试结果进行更新。例如,患者可具有不确定或阳性的临床结果得分。这样的患者可被推荐另外的测试。这样的患者可被推荐结肠镜检查。此类另外的测试和结肠镜检查可能回到阴性,并且持续存在确定或阳性的临床结果得分可导致患者的阈值更新以反映其持续的不确定或阳性的临床结果得分。
在一些情况下,基于另外的生物标志物来调整测试的特异性和灵敏度。例如,本文公开的蛋白质小组可以在具有给定遗传或种族背景的个体群体中具有不同的灵敏度或特异性。在一些情况下,基于另外的生物标志物,可以调整临床结果得分以反映测试灵敏度或特异性的变化。
治疗和诊断方案
本文提供了用于实施本文所述的任何方法的治疗和诊断方案,用于检测是否存在晚期结直肠腺瘤及其治疗。
本文提供了用于检测是否存在结直肠癌的方法。本文公开的方法可包括进行结直肠癌的测试、进行结肠镜检查,在此期间手术切除或以其他方式去除检测到的结直肠癌,并且在稍后的日期第二次进行结直肠癌的测试。第二次测试可以是阳性的,并且可以进行第二次结肠镜检查。在一些情况下,第二次结肠镜检查可包括搜寻和监测固着结直肠癌。在一些情况下,第二次结肠镜检查可包括搜寻和手术去除固着结直肠癌。在一些情况下,对结直肠癌的第二次测试可以是阳性的,并且可以推荐另外的治疗方案。在一些情况下,对结直肠癌的第二次测试可以是阴性的,并且可以不推荐另外的测试。在一些情况下,对晚期结直肠腺瘤的第二次测试可能是阴性的,并且可以推荐在给定的时间段内更频繁的测试。
本文考虑到多种治疗方案,诸如化疗、放射、免疫疗法、施用生物治疗剂和手术干预。可响应于阳性结果,例如针对结直肠癌的阳性执行治疗方案。可响应于针对晚期结直肠腺瘤的阳性结果执行治疗方案。手术干预可包括例如息肉切除术以去除检测到的息肉。在一些情况下,手术干预可包括部分结肠切除术以去除一部分结肠。在一些情况下,手术干预可包括低位前切除术或经腹会阴联合切除术和结肠造口术。在一些情况下,治疗方案可包括向受试者施用以下中的一种或多种:亚叶酸、5-FU、奥沙利铂
Figure BDA0002088958580001881
伊立替康
Figure BDA0002088958580001882
卡培他滨
Figure BDA0002088958580001883
西妥昔单抗、帕尼单抗、瑞戈非尼
Figure BDA0002088958580001884
曲氟尿苷和胸苷磷酸化酶抑制剂
Figure BDA0002088958580001885
在一些情况下,治疗方案可包括向受试者施用以下中的一种或多种:FOLFOX:亚叶酸、5-FU和奥沙利铂FOLFIRI:亚叶酸、5-FU和伊立替康
Figure BDA0002088958580001887
CapeOX:卡培他滨
Figure BDA0002088958580001888
和奥沙利铂;以及FOLFOXIRI:亚叶酸、5-FU、奥沙利铂和伊立替康。在一些情况下,治疗方案可包括向受试者施用以下中的一种或多种:靶向VEGF的药物(例如,贝伐单抗
Figure BDA0002088958580001889
阿柏西普雷莫芦单抗
Figure BDA00020889585800018811
)和靶向EGFR的药物(例如,西妥昔单抗
Figure BDA00020889585800018812
帕尼单抗
Figure BDA00020889585800018813
)。
如本文所述的一种或多种治疗方案可以单独施用或彼此联合施用。例如,治疗方案可包括去除恶性组织联合放疗、免疫疗法和化疗中的一种或多种。在一些情况下,可以施用超过一种治疗方案。在一些情况下,可以重复治疗方案。例如,可以在第一治疗方案之后监测受试者,诸如在本文所述的一个或多个时间段之后,并且可以在适当的情况下施用后续治疗方案。
在一些情况下,阳性临床结果得分可导致药物治疗方案的推荐。例如,阳性临床结果得分可导致向受试者施用Wnt途径抑制剂的推荐。在施用Wnt途径抑制剂后,可以向受试者施用针对晚期结直肠腺瘤的第二次测试。阴性或不太严重的临床结果得分可指示治疗有效。第二次阳性或更严重的临床结果得分可指示治疗无效。
计算机系统
本文提供了用于实现本文所述的任何方法的计算机系统,用于检测是否存在晚期结直肠腺瘤和CRC中的至少一种。本文还提供了用于检测是否存在CRC的计算机系统。本文公开的计算机系统包含存储器单元。存储器单元可被配置用于接收包含来自受试者的生物样品的生物标志物小组测量的数据。生物标志物小组可以是本文所述的任何生物标志物小组。例如,生物标志物小组可包含选自C9、CEA、DPP4、MIF、ORM1、PKM、SAA和TFRC的至少两种生物标志物,并且还包含个体年龄和性别。任选地,生物标志物小组包含CLU、CTSD、DPP4、GDF15、GSN、MIF、PKM、SERPINA1、SERPINA3、TFRC和TIMP1,并且在一些情况下包含年龄作为另外的生物标志物。在一些情况下,生物标志物小组选自表3,或选自表4,或选自表5,或选自表6,或者是表3、表4、表5和表6中至少两个的生物标志物的组合。
本文公开的计算机系统包含用于执行以下中的至少一种的计算机可执行代码:基于测量数据生成本文所述的生物标志物小组的受试者特异性概况,将生物标志物小组的受试者特异性概况与生物标志物小组的参考概况进行比较,以及确定受试者中晚期结直肠腺瘤的可能性。本文公开的计算机系统包含用于执行以下中的至少一种的计算机可执行代码:基于测量数据生成本文所述的生物标志物小组的受试者特异性概况,将生物标志物小组的受试者特异性概况与生物标志物小组的参考概况进行比较,以及确定受试者中CRC的可能性。
另外,本文提供了用于实现本文所述的任何方法的计算机系统,用于检测是否存在晚期结直肠腺瘤和CRC中的至少一种。例如,本文提供了用于检测是否存在晚期结直肠腺瘤的计算机系统。本文还提供了用于检测是否存在CRC的计算机系统。本文公开的计算机系统包含存储器单元。存储器单元可被配置用于接收包含来自受试者的生物样品的生物标志物小组测量的数据。生物标志物小组可以是本文所述的任何生物标志物小组。例如,生物标志物小组可包含选自C9、CEA、DPP4、MIF、ORM1、PKM、SAA和TFRC的至少两种生物标志物,并且还包含个体年龄和性别,或者选自CLU、CTSD、DPP4、GDF15、GSN、MIF、PKM、SERPINA1、SERPINA3、TFRC和TIMP1的至少两种生物标志物,并获得个体的年龄,或者表3、表4、表5和表6中的至少一个的生物标志物小组,如表3、表4、表5和表6中至少两个的生物标志物的组合。
本文公开的计算机系统任选地包含用于执行以下中的至少一种的计算机可执行代码:基于测量数据生成本文所述的生物标志物小组的受试者特异性概况,将生物标志物小组的受试者特异性概况与生物标志物小组的参考概况进行比较,以及确定受试者中晚期结直肠腺瘤的可能性。本文公开的计算机系统任选地包含用于执行以下中的至少一种的计算机可执行代码:基于测量数据生成本文所述的生物标志物小组的受试者特异性概况,将生物标志物小组的受试者特异性概况与生物标志物小组的参考概况进行比较,以及确定受试者中CRC的可能性。
本文所述的计算机系统任选地包含用于执行本文所述的任何算法的计算机可执行代码。计算机系统可进一步包含用于提供传达是否存在晚期结直肠腺瘤和CRC中的至少一种的报告,用于推荐结肠镜检查、乙状结肠镜检查或结直肠组织活检,以及/或者用于推荐治疗的计算机可执行代码。在一些实施方案中,计算机系统执行包含在计算机可读介质中的指令。
在一些实施方案中,处理器与计算机系统的一个或多个控制器、计算单元和/或其他单元相关联,或者植入固件中。在一些实施方案中,所述方法的一个或多个步骤在硬件中实现。在一些实施方案中,所述方法的一个或多个步骤在软件中实现。软件例程可存储在任何计算机可读存储器单元如闪速存储器、RAM、ROM、磁盘、光盘或者如本文所述的或本领域已知的其他存储介质中。软件可通过任何已知的通信方法与计算设备通信,所述通信方法包括例如通过通信信道如电话线、互联网、无线连接,或者通过可传输介质如计算机可读盘、闪存驱动器等。本文所述的方法的一个或多个步骤可以实现为各种操作、工具、块、模块和技术,其继而可以在固件、硬件、软件或者固件、硬件和软件的任何组合中实现。当在硬件中实现时,一些或所有块、操作、技术等可在例如专用集成电路(ASIC)、定制集成电路(IC)、现场可编程逻辑阵列(FPGA)或可编程逻辑阵列(PLA)中实现。
图10描绘了适于实现本文所述的方法的示例性计算机系统1000。系统1000包含中央计算机服务器1001,其被编程用于实现本文所述的示例性方法。服务器1001包含中央处理单元(CPU,也称为“处理器”)1005,其可以是单核处理器、多核处理器或用于并行处理的多个处理器。服务器1001还包含存储器1010(例如随机存取存储器、只读存储器,闪速存储器);电子存储单元1015(例如硬盘);用于与一个或多个其他系统通信的通信接口1020(例如网络适配器);以及外围设备1025,其可包括高速缓冲存储器、其他存储器、数据存储和/或电子显示适配器。存储器1010、存储单元1015、接口1020和外围设备1025通过的通信总线(实线)如主板与处理器1005通信。存储单元1015可以是用于存储数据的数据存储单元。服务器1001借助于通信接口1020可操作地耦合到计算机网络(“网络”)1030。网络1030可以是因特网、内联网和/或外联网、与因特网通信内联网和/或外联网、电信或数据网络。在一些情况下,网络1030可借助于服务器1001实现对等网络,这可以使耦合到服务器1001的设备能够充当客户端或服务器。
存储单元1015可存储文件,如受试者报告和/或与护理人员的通信、测序数据、关于个体的数据或与本文公开内容相关联的数据的任何方面。
服务器可通过网络1030与一个或多个远程计算机系统通信。一个或多个远程计算机系统可以是例如个人计算机、膝上型计算机、平板计算机、电话、智能电话或个人数字助理。
在一些情况下,系统1000包含单个服务器1001。在其他情况下,系统包含通过内联网、外联网和/或因特网彼此通信的多个服务器。
服务器1001可适于存储测量数据、来自受试者的患者信息,例如多态性、突变、病史、家族史、人口统计数据和/或潜在相关的其他信息。这样的信息可存储在存储单元1015或服务器1001上,并且这样的数据可通过网络传输。
在一些情况下,如本文所述的方法通过存储在服务器1001的电子存储位置上,例如存储器1010或电子存储单元1015上的机器(或计算机处理器)可执行代码(或软件)来实现。在使用期间,代码可以由处理器1005执行。在一些情况下,可从存储单元1015检索代码并将其存储在存储器1010上以供处理器1005迅速存取。在一些情况下,可不包含电子存储单元1015,并且机器可执行指令存储在存储器1010上。或者,可在第二计算机系统1040上执行代码。
本文提供的系统和方法的各方面,如服务器1001,可在编程中体现。所述技术的各个方面可被认为是“产品”或“制品”,其通常为在一种类型的机器可读介质上携带或体现的机器(或处理器)可执行代码和/或相关数据的形式。机器可执行代码可存储在电子存储单元如存储器(例如,只读存储器、随机存取存储器、闪速存储器)或硬盘上。“存储”型介质可包括计算机的任何或全部有形存储器、处理器等,或其相关模块如各种半导体存储器、磁带驱动器、磁盘驱动器等,其可以在任何时间为软件编程提供非暂时性存储。软件的全部或部分有时可以通过因特网或各种其他电信网络进行通信。这样的通信例如可以使软件能够从一个计算机或处理器加载到另一个计算机或处理器中,例如,从管理服务器或主计算机加载到应用服务器的计算机平台中。因此,可以承载软件元素的另一种类型的介质包括光波、电波和电磁波,诸如跨本地设备之间的物理接口、通过有线和光学陆线网络以及通过各种空中链路而使用的。携带此类波的物理元件,如有线或无线类似物、光学链路等,也可被认为是承载软件的介质。如本文所用,除非限于非暂时性有形“存储”介质,否则诸如计算机或机器“可读介质”等术语可以指参与向处理器提供指令以供执行的任何介质。
因此,机器可读介质如计算机可执行代码可采取多种形式,包括但不限于有形存储介质、载波介质或物理传输介质。非易失性存储介质可包括例如光盘或磁盘,诸如任何计算机中的任何存储设备等,这些可用于实现该系统。有形传输介质可包括:同轴电缆、铜线和光纤(包括构成计算机系统内总线的导线)。载波传输介质可采取电信号或电磁信号或者声波或光波的形式诸如在射频(RF)和红外(IR)数据通信期间生成的那些电信号或电磁信号或者声波或光波。因此,计算机可读介质的常见形式包括例如:软盘、柔性盘、硬盘、磁带、任何其他磁性介质、CD-ROM、DVD、DVD-ROM、任何其他光学介质、穿孔卡片、纸带、任何其他具有孔洞图案的物理存储介质、RAM、ROM、PROM和EPROM、FLASH-EPROM、任何其他存储器芯片或匣盒、传送数据或指令的载波、传送这样的载波的电缆或链路,或者计算机可从中读取编程代码和/或数据的任何其他介质。许多这些形式的计算机可读介质可涉及将一个或多个指令的一个或多个序列载送到处理器以供执行。
可借助于用户界面如图形用户界面向用户呈现检测是否存在晚期结直肠腺瘤和CRC中的至少一种的结果,生成受试者报告,以及/或者将该报告传达给护理人员。
计算机系统可用于实现本文所述方法的一个或多个步骤,包括例如样品采集,样品处理、测量本文所述的一种或多种蛋白质的量以产生测量数据、测定蛋白质与另一种蛋白质的比率以产生测量数据、将测量数据与参考量进行比较、生成生物标志物小组的受试者特异性概况、将受试者特异性概况与参考概况进行比较、接收病史、接收病历、接收并存储通过本文所述的一种或多种方法获得的测量数据、分析所述测量数据以确定是否存在晚期结直肠腺瘤和CRC中的至少一种(例如,通过执行本文所述的算法)、生成报告、以及向接收者报告结果。
客户端-服务器和/或关系数据库架构可用于本文所述的任何方法。通常,客户端-服务器架构是其中网络上的每个计算机或进程均为客户端或服务器的网络架构。服务器计算机可以是专用于管理磁盘驱动器(文件服务器)、打印机(打印服务器)或网络通信量(网络服务器)的功能强大的计算机。客户端计算机可包括用户在其上运行应用的PC(个人计算机)或工作站,以及如本文所公开的示例性输出设备。客户端计算机可依赖于服务器计算机来获取资源,如文件、设备甚至处理能力。服务器计算机处理所有数据库功能。客户端计算机可具有处理前端数据管理和接收来自用户的数据输入的软件。
在执行计算之后,处理器可将输出(诸如来自计算)提供到返回例如输入设备或存储单元、提供到相同或不同计算机系统的另一存储单元或者提供到输出设备。处理器的输出可通过数据显示器显示,例如显示屏(例如,监视器或者数字设备上的屏幕)、打印输出、数据信号(例如,数据包)、图形用户界面(例如,网页)、警示(例如,闪烁的光或声音)或上述任何组合。在一个实施方案中,通过网络(例如,无线网络)将输出传输到输出设备。用户可使用输出设备来接收来自数据处理计算机系统的输出。在用户接收到输出之后,用户可确定行动过程,或者可执行行动过程,诸如当用户是医务人员时执行医疗处理。在一些实施方案中,输出设备是与输入设备相同的设备。示例性输出设备包括但不限于电话、无线电话、移动电话、PDA、闪存驱动器、光源、声音发生器、传真机、计算机、计算机监视器、打印机、iPod和网页。用户站可与打印机或显示监视器通信,以输出由服务器处理的信息。此类显示器、输出设备和用户站可用于向受试者或其护理人员提供警示。
与本公开内容有关的数据可通过网络或连接传输,以供接收器接收和/或查看。接收者可以是但不限于报告所属的受试者;或其护理人员,例如,医疗保健提供者、管理人员、其他医疗保健专业人员或其他看护者;执行和/或预订基因型分型分析的个人或实体;遗传咨询师。接收者还可以是用于存储此类报告的本地或远程系统(例如服务器或“云计算”架构的其他系统)。在一个实施方案中,计算机可读介质包括适合于传输生物样品的分析结果的介质。
试剂盒
本公开内容还提供了试剂盒。在一些情况下,本文所述的试剂盒包含用于测量和/或检测本文所述的一种或多种生物标志物的一种或多种组合物、试剂和/或设备组件。如本文所述的试剂盒可进一步包含用于实践本文提供的任何方法的说明。所述试剂盒可进一步包含能够通过各种测定类型如抗体结合荧光测定、ELISA测定、免疫测定、蛋白质芯片或微阵列、质谱、免疫组织化学、流式细胞术或高含量细胞筛选来检测生物标志物的试剂。试剂盒还可包含计算机可读介质,该计算机可读介质包含用于实现本文所述的方法的计算计可执行代码。
在一些实施方案中,本文提供的试剂盒包含针对本公开内容其他各处所述的生物标志物的抗体。试剂盒可包含至少两种抗体,每种抗体对选自C9、CEA、CLU、CTSD、DPP4、GDF15、GSN、MIF、ORM1、PKM、SAA、SERPINA1、SERPINA3、TFRC和TIMPI的生物标志物具有反应性。试剂盒可包含用于检测表3的小组的蛋白质的抗体,以及任选地用于指示年龄和任选的性别的形式。在一些情况下,本文提供的试剂盒包含针对C9、CEA、DPP4、MIF、ORM1、PKM、SAA和TFRC的抗体。在其他情况下,本文提供的试剂盒包含针对CLU、CTSD、DPP4、GDF15、GSN、MIF、PKM、SERPINA1、SERPINA3、TFRC和TIMP1的抗体。试剂盒可包含用于检测表5的小组的蛋白质的抗体,以及任选地用于指示年龄和任选的性别的形式。
在一些实施方案中,本文所述的试剂盒包含包装材料。如本文所用,术语“包装材料”可以指容纳试剂盒组件的物理结构。包装材料可维持试剂盒组件的无菌性,并且可以由通常用于此类目的的材料(例如,纸、波纹纤维、玻璃、塑料、箔、安瓿等)制成。试剂盒还可包含缓冲剂、防腐剂或蛋白质/核酸稳定剂。试剂盒可包含用于从患者获得生物样品的组件。此类组件的非限制性实例可以是手套、皮下注射针或注射器、用于容纳生物样品的管、管子或容器、灭菌组件(例如异丙醇擦拭物或无菌纱布)以及/或者冷却材料(例如,冷冻包、干冰或冰)。
在一些情况下,根据任何公开的方法使用本文公开的试剂盒。纳入不确定分类判定(NoC方法)
特定分类模型的固有表现取决于两个类别的模型得分的分布和分离。除了完美的类别分离之外,大多数分类模型都会因为分类器得分范围之间的类别重叠而出错。例如,这样的重叠可发生在得分范围的中间附近,在该处属于一个类别或另一个类别的概率接近50%。
在这样的重叠区域内,将第三类别添加到分类判定的最终集合中可能是有利的;第三类别将指示该得分区域中判定的不确定性。例如,这可通过定义分类得分的不确定区域来实现。具有该区域中的得分的样品将得到“不确定”或“无判定”测试结果。具有高于或低于该区域的得分的样品将根据其相对于其测试截止值的位置得到标准的阳性或阴性测试结果。向分类模型添加不确定区域的益处在于,对于不确定区域之外的样品,分类表现可得到改善,即对于剩余的阳性和阴性测试错误的可能性较小。但是,如果不确定范围过大,则可能会有过多不确定结果,并且测试的值可能会受到质疑。
在一些分析中,研究了在分类模型使用不确定区域的效果,本文称为NoC(“无判定”)。在这些分析之一中,靶向接收“无判定”结果的样品的百分比设置为10%。为了确定具有10%样品的不确定区域(NoC区域)的最佳得分范围,使特异性在>=90%的灵敏度下最大化如下:在分类器得分范围内确定10%样品的所有可能的连续集。对于每个集合,10%样品的相关集合被标记为无判定。从分析集去除这些样品,并由剩余的90%样品中生成ROC曲线。然后确定在>=90%灵敏度下的最大特异性并将其用作所讨论的NoC区域的评估得分。在以这种方式评估所有NoC区域之后,选择给出标准最小灵敏度得分的具有最高特异性得分的区域作为最佳NoC区域。定义该NOC区域的得分范围取自相关的10%无判定样品的上方和下方分类得分。
本文公开的小组相对于其他生物标志物小组的特性
本文公开的小组基本上优于单个标志物或随机生成的小组。尽管本文的小组中的至少一些成员涉及癌症,但本文的小组远远优于从任何本领域教导中随机衍生的小组。通过检查与个体成员、随机生成的小组相比的小组表现以及考虑到单个标志物对任何个体健康评估的不可预测性来说明这一点。
由选自文献的187个潜在生物标志物的原始候选库构建小组。使用274个成员年龄和性别匹配的发现样品集,采用靶向质谱法鉴别出来自原始集的31个生物标志物与发现样品集的274个成员的健康状态共同变化。该31个成员的集合不是对187成员原始候选库的随机选择,该并且31个成员的集合并非根据本领域的任何教导从原始187个成员的候选库中选择。尽管如此,31个成员的小组在一些情况下可用作人们可在相关领域中鉴别的标志物的代理。
将经整合的31个生物标志物的小组进一步缩小以鉴别蛋白质集。使用原始31个生物标志物中的27个生物标志物的集合来运行4,507个样品以生成新的分类器集合。27个生物标志物中的两个由于它们对涉及到试剂强度而被认为质量差,从而产生25个生物标志物的集合,其中15个生物标志物在分类器构建工作中包含在内。使用蛮力方法来评价作为构建工作的一部分的数百万分类器的表现,以及其对蛋白质的发现集的影响。
针对单独的年龄和性别匹配的300个成员的样品集对25个成员的集合进行测试,以获得如本文所公开的CRC小组,如包含C9、CEA、DPP4、MIF、ORM1、PKM、SAA和TFRC的8成员小组。该小组和类似的小组选自原始的187成员候选库。该小组通过对独立衍生的样品进行重复分析得出。
本文中的生物标志物小组基本上比单独涉及癌症的生物标志物(诸如187成员候选库的那些)的任何随机选择表现得更好。也就是说,如果本领域技术人员从文献中可获得的生物标志物列表开始并随机组装,或根据本领域技术人员可获得的教导组装生物标志物小组来用于测定结直肠健康问题,如个体中的结直肠癌或晚期腺瘤,则不会得到如本文所公开的生物标志物。本文公开的生物标志物小组基本上优于随机选择的小组和根据本领域选择的小组。
本文中的生物标志物小组通常比单独涉及癌症的任何单个组成标志物(诸如187成员候选库的那些)表现得更好。一些单个生物标志物指示CRC或晚期腺瘤,但具有远低于如本文所公开的生物标志物小组的灵敏度和特异性。根据本公开内容,不考虑使用单独的生物标志物,或者未列举或本领域技术人员从本文公开内容中并非显而易见的生物标志物的组合。
单独的蛋白质标志物的聚集未实现本文公开的小组的表现水平。作为该论断的说明,由靶标富集的25个标志物的集合生成随机小组,并将其表现与本文中小组的表现进行比较(参见图7-图8)。已经预期富集的25成员的集合产生的小组比由未富集的亲本187个标志物的集合生成的小组表现更好。观察到,如图所示,本文的小组基本上优于由已经富集的蛋白质标志物的集合随机生成的小组。这些随机小组不代表将从本领域获得的小组,因为它们已经从本领域中提到与癌症检测相关的187成员的列表得以富集。
本文中的生物标志物小组产生的结果比它们的单个成分的简单集合更可靠、更灵敏和更具特异性。也就是说,在一些情况下,单个生物标志物被检测到的水平单独不提供灵敏度和特异性的程度在医学上相关的信息,但生物标志物小组的水平仍然提供了置信度程度是医学上可操作性的结直肠健康评估。在一些情况下,该小组没有单个生物标志物以单独指示需要随访的健康问题的水平存在,但是如本文所示评估的生物标志物小组作为整体提供了指示需要随访的健康问题的评估。
本文的生物标志物产生的结果在一些情况下在定性上不同于其成分生物标志物的结果。也就是说,在一些情况下,该小组的一个或多个单个生物标志物以单独指示结直肠健康状态的水平存在,该水平与该小组作为包含矛盾生物标志物的整体的水平所指示的健康状态相矛盾。在这种情况下,经常发现独立的健康评估,例如通过结肠镜检查或通过粪便样品分析的健康评估支持小组评估,而不是由矛盾的单个标志物提供的健康状态评估。
参考表7。在该表中,观察到在确定患者CRC风险时使用CRC小组的数据。观察到CRC生物标志物小组提供的预测与单独观察成分生物标志物水平产生的预测不一致。阴影单元突出显示在不同患者样品中相同测量对应于不同患者CRC状态判定的情况。
在单个测量水平有助于在连续样品中得出不同结论的情况下,蛋白质CEA和年龄标志物在以下表7中以阴影显示。已知CEA在许多癌症状况下与癌症状态相对应。然而,如下表所示,如本文所公开的小组提供的精确度水平超过任何单个标志物成分的精确度水平,使得来自单个标志物的异常信号仍然可导致正确的整体小组健康状态判定。
如果要单独使用CEA,则可以预期表7中的第一和第二条目具有共同的健康状态判定。然而,使用如本文所公开的小组分析,得到的结果与通过单独检查单个小组生物标志物所预期的结果在定性上不同。如以下表7中所示的该数据突出了这样的事实,即本文中的小组不仅在定量上更佳,而且在一些情况下在定性上不同于它们的单个生物标志物成分。
表7.测定结果
Figure BDA0002088958580001991
因此,本文公开的生物标志物小组被理解为比文献所教导的候选标志物的随机集合表现更好。本文公开的生物标志物小组还被理解为在统计学上表现更好,并且在一些情况下在定性上不同于其单个生物标志物成分,使得来自生物标志物小组作为整体的健康评估更准确,或在一些情况下提供的结果在定性上不同于一种或多种单个生物标志物成分的结果。
另外的体外分析
本文的公开内容涉及包括从个体获得样品并分析所述样品形成循环蛋白质或多肽的存在或水平的方法。在备选实施方案中,方法独立于样品来源对体外样品进行。在这些实施方案中,进行类似或相同的小组、检测步骤和分析,但这些实施方案不叙述从个体抽取血液。更确切地说,在实验室或其他实验环境中独立于来源获得样品,并对其进行分析,以便获得如本文所公开的用于下游分析的小组信息。在这些实施方案中,样品可最终来自人类患者,但样品来源不在任何相关的权利要求中叙述,使得权利要求不叙述作用于人类患者。替代地,权利要求叙述对实验室中获得的体外样品进行分析。
附图的另外参考
在附图的支持下,在整个说明书和与之所附的权利要求中描述了本文的公开内容。更详细地参考附图,观察到以下内容。
在图1中,观察到主导CRC小组的AUC图。该小组表现出0.8278验证AUC(95%AUC置信区间为0.7879-0.8646),其中种子为123456且进行10,000次引导(Bootstrap)迭代。在该图上描绘了小组的表现为在71%特异性下为80%灵敏度。在重复的小组测试中,小组正确分类了75个I/II类CRC血液样品中的59个,灵敏度为0.79,并且正确分类了73个III/IV类样品中的58个,灵敏度为0.81,其中Fisher检验P值为0.839。
在AUC图上还描绘了单个小组成分。观察到小组基本上优于单个成员,其中单个小组成分表现出如下的AUC值:CO9 0.73;CEA 0.70;A1AG 0.70;DPP4 0.68;SAA 0.68;AGE0.67;TFRC 0.63;PKM2 0.61;性别0.59;MIF 0.53。
在图2中,观察到具有15%NoC的图1的主导CRC小组的AUC图。该小组表现出0.8472验证AUC(95%AUC置信区间为0.8052-0.8851),其中种子为123456且进行10,000次引导迭代。在该图上描述了小组的表现为在76%特异性下为80%灵敏度。在重复的小组测试中,小组正确分类了63个I/II类CRC血液样品中的50个,灵敏度为0.79,并且正确分类了66个III/IV类样品中的53个,灵敏度为0.80,其中Fisher检验P值为0.839。AUC图为0.85,并且ValNoC为12.3%(此处:是否验证NoC?)
在AUC图上还描绘了单个小组成分。观察到小组基本上优于单个成员,其中单个小组成分表现出如下的AUC值:CO9 0.73;CEA 0.70;A1AG 0.70;DPP4 0.68;SAA 0.68;AGE0.67;TFRC 0.63;PKM2 0.61;性别0.59;MIF 0.53。
在图3中,观察到具有20%NoC的图1的主导CRC小组的AUC图。该小组表现出0.8546验证AUC(95%AUC置信区间为0.8113-0.8939),其中种子为123456且进行10,000次引导迭代。在该图上描绘了该小组的表现为在78%特异性下为82%灵敏度。在重复的小组测试中,小组正确分类了57个I/II类CRC血液样品中的45个,灵敏度为0.79,并且正确分类了73个III/IV类样品中的54个,灵敏度为0.74,其中Fisher检验P值为0.485。AUC图为0.85,并且Val NoC为18.2%。
在AUC图上还描绘了单个小组成分。观察到该小组基本上优于单个成员,其中单个小组成分表现出如下的AUC值:CO9 0.73;CEA 0.70;A1AG 0.70;DPP4 0.68;SAA 0.68;AGE0.67;TFRC 0.63;PKM2 0.61;性别0.59;MIF 0.53。
在图4中,观察到具有25%NoC的图1的主导CRC小组的AUC图。该小组表现出0.8618验证AUC(95%AUC置信区间为0.816-0.902),其中种子为123456且进行10,000次引导迭代。在该图上描绘了该小组的表现为在83%特异性下为80%灵敏度。在重复的小组测试中,小组正确分类了48个I/II类CRC血液样品中的36个,灵敏度为0.75,并且正确分类了61个III/IV类样品中的51个,灵敏度为0.84,其中Fisher检验P值为0.338。AUC图为0.86,并且ValNoC为23.2%。
在AUC图上还描绘了单个小组成分。观察到小组基本上优于单个成员,其中单个小组成分表现出如下的AUC值:CO9 0.78;CEA 0.77;A1AG 0.76;DPP4 0.73(反向的(inverted));SAA 0.74;AGE 0.71;TFRC 0.66;PKM2 0.61;性别0.58;MIF 0.55。
在图5中,观察到主导AA小组的AUC图。该小组表现出0.6883验证AUC(95%AUC置信区间为0.6233-0.7478),其中种子为123456且进行10,000次引导迭代。在该图上描绘了该小组的表现为在80%特异性下为44%灵敏度,并且AUC为0.69。
在AUC图上还描绘了单个小组成分。观察到小组基本上优于单个成员,其中单个小组成分表现出如下的AUC值:MIF PKM2 0.73;CATD MIF 0.70;GELS PKM2 0.70;CLUS PKM20.68;DPP4 GDF15 0.68;CATD TIMP1 0.67;CATD TFRC 0.63;A1AT AGE 0.61;AACT CATD0.59。
在图6中,观察到主导AA小组的AUC图。该小组表现出0.6975验证AUC(95%AUC置信区间为0.633-0.7582),其中种子为123456且进行10,000次引导迭代。在该图上描绘了该小组的表现为在80%特异性下为47%灵敏度,并且AUC为0.69且Val NoC为8.5%。
在AUC图上还描绘了单个小组成分。观察到小组基本上优于单个成员,其中单个小组成分表现出如下的AUC值:MIF PKM2 0.65;CATD MIF 0.62;GELS PKM2 0.60;CLUS PKM20.58;DPP4 GDF15 0.58;CATD TIMP1 0.57;CATD TFRC 0.53;A1AT AGE 0.53;AACT CATD0.51。
在图7中,观察到1000个随机选择的10特征CRC分类器的分析。分类器选自与CRC和AA相关的25个成员的前体标志物集。Y轴指示频率,间隔为20,范围为0至80,而X轴指示发现AUC,范围为0.70至0.85,间隔为0.05。对于每个小组,确定AUC值,并将给定AUC值的小组的频率作为AUC值的函数作图。AUC值范围为0.71至0.84,在AUC值为0.77至0.79时具有峰值小组频率。每列的高度指示来自25个富集的生物标志物的集合的随机选择的小组表现出指示的AUC的频率。图7是对可由本领域标志物的随机选择生成的AUC值的高估,因为图7的小组的绘制所来自的库已经针对更高表现的标志物进行富集。最右方的细线指示如本文所公开的主导CRC小组表现出的发现AUC。这些结果指示,本文公开的主导小组基本上优于随机选择的小组,甚至优于选自针对CRC检测的相关性进行基本上富集的标志物集。
在图11中,观察到上述图7的细化,其中包含CEA、CO9和DPPIV的小组为黑色阴影。分类器选自与CRC和AA相关的25个成员的前体标志物集。Y轴指示频率,间隔为20,范围为0至80,而X轴指示发现AUC,范围为0.70至0.85,间隔为0.05。对于每个小组,确定AUC值,并将给定AUC值的小组的频率作为AUC值的函数作图。AUC值范围为0.71至0.84,在AUC值为0.77至0.79时具有峰值小组频率。每列的高度指示来自25个富集的生物标志物的集合的随机选择的小组表现出指示的AUC的频率。图7是对可由本领域标志物的随机选择生成的AUC值的高估,因为图7的小组的绘制所来自的库已经针对更高表现的标志物进行富集。最右方的细虚线指示如本文所公开的主导CRC小组表现出的发现AUC。包含DPPIV、CEA和CO9的小组仅存在于图的右下侧,与它们在整个图7的小组库中的最高表现子集中的过多表示相一致。包含DPPIV、CEA和CO9的小组表现出范围为0.79至0.84的AUC值。三个最高AUC类别仅由在其10个组分中包含DPPIV、CEA和CO9的小组组成。包含DPPIV、CEA和CO9的大多数小组具有至少0.80的AUC值,甚至比图7中的完整随机小组集的最丰富的小组频率0.77至0.79更大。这些结果指示本文公开的主导小组基本上优于随机选择的小组,甚至优于选自针对CRC检测的相关性进行基本上富集的标志物集,如图7所示,并且还指示包含CEA、CO9和DPPIV的主导小组比不包含这些标志物的小组出乎意料地表现更好,即使另外的标志物选自针对CRC检测的相关性进行基本上富集的标志物集。该分析对10个成员的小组进行,但声称广泛适用于其他大小的小组,例如4、5、6、7、8、9、11、12、13、14、15或大于15个标志物的小组。
在图8中,观察到1000个随机选择的9特征AA分类器的分析。分类器选自与CRC和AA相关的25个成员的前体标志物集,其中标志物值在数学上组合成9个单独的特征,如在主导AA分类器中所示。Y轴指示频率,而X轴指示发现AUC。每列的高度指示来自25个富集生物标志物的集合的随机选择的小组表现出指示的AUC的频率。最右方的细线指示如本文所公开的主导AA小组表现出的发现AUC。这些结果表明,本文公开的主导小组基本上优于随机选择的小组,甚至优于选自针对CRC检测的相关性进行基本上富集的标志物集。
在图9A-图9C中,观察到针对单个标志物log2浓度(9A,9B)或者年龄(以岁计)或性别(9C)的CRC模型得分的图。标志物身份在每个小组的顶部指示。模型得分在Y轴上指示。每个点均映射到其浓度和其作为成员所属模型的得分。正判定与负判定之间的边界在y轴上为-2.5。低于Y=-2.5的点比高于Y=-2.5的点具有更暗的阴影。
从图9A-图9C可以看出,单个CRC标志物显示出与整体小组预测不同程度的相关性。对于A1AG、CEA、CO9、PKM2、SAA、TRFC和年龄,浓度或量与疾病判定之间存在显著的正相关。对于MIF和DPPIV,相关性为负。
然而,还观察到相关性较弱,并且没有确切地预测整体CRC模型疾病判定的明确的浓度或累积水平。例如,参考图9A中的A1AG,观察到浓度与阳性CRC模型判定之间的一般正相关。然而存在很多例外。特别地,在29至30之间的浓度观察到大量不遵循一般相关性的点。也就是说,在浓度为29时,有许多点仍然与CRC阳性模型相对应,而在浓度为30时,有许多点仍然与CRC阴性模型相对应。
类似地,观察TFRC累积水平,观察到浓度与CRC模型阳性预测之间的一般正相关。然而,即使在最高浓度下,也观察到高TFRG浓度映射到阴性小组结果的样品。
在图10中,观察到与本文公开的方法和小组一致的计算机系统。
参考领域和定义
在整个本申请中,各个实施方案可以以范围格式呈现。应当理解,范围格式的描述仅为了方便和简洁起见,而不应被解释为对本公开内容范围的硬性限制。相应地,对范围的描述应被认为明确公开了所有可能的子范围以及该范围内的单个数值。例如,描述诸如1至6的范围应被认为明确公开了诸如1至3、1至4、1至5、2至4、2至6、3至6等子范围,以及该范围内的单个值,例如,1、2、3、5和6。无论范围的宽度如何,这都是适用的。
除非另有说明,否则本公开内容的实践可采用免疫学、生物化学、化学、分子生物学、微生物学、细胞生物学、基因组学和重组DNA的常规技术,这些技术在本领域的技术范围内。参见,例如,Sambrook,Fritsch和Maniatis,MOLECULAR CLONING:A LABORATORYMANUAL,第4版(2012);CURRENT PROTOCOLS IN MOLECULAR BIOLOGY(F.M.Ausubel等人编著,(1987));系列METHODS IN ENZYMOLOGY(Academic Press,Inc.):PCR 2:A PRACTICALAPPROACH(M.J.MacPherson,B.D.Hames和G.R.Taylor 编著(1995)),CULTURE OF ANIMALCELLS:A MANUAL OF BASIC TECHNIQUE AND SPECIALIZED APPLICATIONS,第6版(R.I.Freshney编著(2010)),以及Lange等人,Molecular Systems Biology Vol.4:Article 222(2008),以上参考文献均通过引用并入于此。
构成小组的一些结直肠健康测定描述于例如于2016年10月13日公开的美国专利申请公开号US2016/0299144中,该专利申请通过引用以其全文并入于此。
如说明书和权利要求中所用,除非上下文另有明确说明,否则单数形式“一个”、“一种”和“该”包括指代物的复数形式。例如,术语“样品”包括多个样品,包括其混合物。
术语“确定”、“测量”、“评价”、“评估”、“测定”和“分析”在本文通常可互换使用以指代测量形式,并且包括确定元素是否存在(例如,检测)。这些术语可包括定量、定性或者定量和定性确定。评估是相对的或绝对的。“检测存在”包括确定存在的物质的量,以及确定其是否存在。
术语“小组”、“生物标志物小组”、“蛋白质小组”、“分类器模型”和“模型”在本文可互换使用以指代生物标志物集合,其中该生物标志物集合包含至少两种生物标志物。示例性生物标志物是独特地或可靠地映射到特定蛋白质的蛋白质或蛋白质的多肽片段。然而,还考虑到另外的生物标志物,例如提供样品的个体的年龄或性别。生物标志物小组通常预测受试者的健康状态、疾病或病况以及/或者提供受试者健康状态、疾病或病况的信息。
生物标志物小组的“水平”是指小组的成分标志物的绝对和相对水平以及小组的成分生物标志物的相对模式。
术语“结直肠癌”和“CRC”在本文可互换使用。术语“结直肠癌状态”、“CRC状态”可以指受试者中该疾病的状态。CRC状态的类型的实例包括但不限于受试者患有包括结直肠癌在内的癌症的风险、是否存在疾病(例如,息肉或腺癌)、患者中疾病(例如,癌)的阶段以及疾病治疗的有效性。
术语“质谱仪”可以指可测量能够转换为气相离子的质荷比(m/z)的参数的气相离子谱仪。质谱仪通常包含离子源和质量分析仪。质谱仪的实例是飞行时间、扇形磁场、四极滤波器、离子阱、离子回旋共振、扇形静电分析仪以及这些的混合。“质谱”可以指使用质谱仪来检测气相离子。
术语“串联质谱仪”可以指任何能够进行两个连续阶段的离子的基于m/z的区分或测量的质谱仪,该离子包括离子混合物中的离子。该用语包括具有两个质量分析仪的质谱仪,其能够进行两个连续阶段的空间串联的离子的基于m/z的区分或测量。该用语进一步包括具有单个质量分析仪的质谱仪,其能够进行两个连续阶段的时间串联的离子的基于m/z的区分或测量。因此,该用语明确地包括Qq-TOF质谱仪、离子阱质谱仪、离子阱-TOF质谱仪、TOF-TOF质谱仪、傅立叶变换离子回旋共振质谱仪、扇形静电-扇形磁场质谱仪及其组合。
术语“生物芯片”可以指具有大致平坦表面的固体基板,吸附剂附着在该表面上。在一些情况下,生物芯片的表面包含多个可寻址位置,每个可寻址位置可具有在该处结合的吸附剂。生物芯片可适合于接合探针接口,并因此起探针的作用。蛋白质生物芯片适合于捕获多肽,并且可包含在可寻址位置附着有色谱或生物特异性吸附剂的表面。微阵列芯片通常用于DNA和RNA基因表达检测。
术语“生物标志物”和“标志物”在本文可互换使用,并且可以指与取自未患有疾病的对照受试者(例如,具有阴性诊断的或不可检测的CRC的正常或健康受试者,或者例如在不同时间点的相同个体)的相当的样品或相当的数据相比,在取自患有需要诊断的疾病(例如,CRC)的受试者的样品中差异存在的多肽、基因、核酸(例如,DNA和/或RNA),或者从具有或没有样品获取的受试者获得的其他数据,如患者年龄信息或患者性别信息。本文的常见生物标志物包括独特地或可靠地映射到特定蛋白质(或者,在诸如上述的SAA的情况下,映射到一对或一组紧密相关的蛋白质)的蛋白质或蛋白质片段,氨基酸序列的转变离子,或者蛋白质的一种或多种修饰如磷酸化、糖基化或其他翻译后或共翻译修饰。此外,蛋白质生物标志物可以是蛋白质、蛋白质片段或氨基酸序列的转变离子的结合配偶体。
术语“多肽”、“肽”和“蛋白质”在本文通常可互换使用,指代氨基酸残基的聚合物。蛋白质通常是指从编码开放阅读框翻译的全长多肽,或加工成其成熟形式,而多肽或肽非正式地指仍然独特地或可鉴别地映射到特定蛋白质的蛋白质的降解片段或加工片段。多肽可以是由相邻氨基酸残基的羧基基团与氨基基团之间的肽键结合在一起的氨基酸的单个线性聚合物链。可以例如通过添加碳水化合物、磷酸化等来修饰多肽。蛋白质可包括一种或多种多肽。
“免疫测定”是使用抗体以与抗原(例如,标志物)特异性结合的测定。免疫测定的特征可在于通过使用特定抗体的特异性结合特性来分离、靶向和/或定量该抗原。
术语“抗体”可以指基本上由免疫球蛋白基因或其片段编码的多肽配体,其特异性结合并识别表位。例如,抗体作为完整的免疫球蛋白或作为通过用各种肽酶消化而产生的多种良好表征的片段存在。这包括例如Fab”和F(ab)”2片段。如本文所用,术语“抗体”还包括通过修饰完整抗体产生的抗体片段或使用重组DNA方法从头合成的抗体片段。其还包括多克隆抗体、单克隆抗体、嵌合抗体、人源化抗体或单链抗体。抗体的“Fc”部分可以指免疫球蛋白重链的包含一个或多个重链恒定区结构域但不包含重链可变区的部分。
术语“肿瘤”可以指可由癌细胞或非癌细胞形成的固体或充满流体填充的病灶或结构,诸如表现出异常细胞生长或分裂的细胞。术语“肿块”和“结节”通常与“肿瘤”同义使用。肿瘤包括恶性肿瘤或良性肿瘤。恶性肿瘤的实例可以是已知包含转化细胞的癌。
术语“结合配偶体”可以指分子对,通常是表现出特异性结合的生物分子对。蛋白质-蛋白质相互作用可发生在两个或更多个蛋白质之间,当结合在一起时,它们通常发挥其生物学功能。蛋白质之间的相互作用对于大多数生物学功能是重要的。例如,来自细胞外部的信号经由配体受体蛋白通过信号分子的蛋白质-蛋白质相互作用介导到该细胞内部。例如,分子结合配偶体包括但不限于受体和配体、抗体和抗原、生物素和抗生物素蛋白等等。
术语“对照参考”可以指与已知病况相关的已知的或确定量的生物标志物,其可用于与同未知病况相关的生物标志物的量进行比较。对照参考还可以指稳态分子,其可用于校准或归一化非稳态分子的值。对照参考值可以是由因子组合或一系列因子的组合计算的值,该组合诸如生物标志物浓度的组合或一系列浓度的组合。
术语“受试者”、“个体”或“患者”在本文通常可互换使用。“受试者”可以是含有表达的遗传物质的生物实体。生物实体可以是植物、动物或微生物,包括例如细菌、病毒、真菌和原生动物。受试者可以是体内获得或体外培养的生物实体的组织、细胞及其后代。受试者可以是哺乳动物。哺乳动物可以是人。受试者可被诊断出疾病或疑似具有疾病的高风险。该疾病可以是癌症。癌症可以是CRC(CRC)。在一些情况下,受试者不一定被诊断出疾病或疑似具有该疾病的高风险。
术语“体内”用于描述发生在受试者身体内的事件。
术语“离体”用于描述发生在受试者身体外的事件。“离体”测定不是对受试者进行的。更确切地说,“离体”测定是在与受试者分隔开的样品上进行的。对样品进行的“离体”测定的实例是“体外”测定。
术语“体外”用于描述其发生包含在用于容纳实验室试剂的容器中的事件,使得其与材料所获自的活生物来源生物体分离。体外测定可包括基于细胞的测定,其中使用活细胞或死细胞。体外测定还可包括无细胞测定,其中不使用完整细胞。
术语特异性或真阴性率可以指测试正确排除病况的能力。例如,在诊断测试中,测试的特异性是将测试为阴性的已知未患有疾病的患者的比例。在一些情况下,且通过确定真阴性(即测试呈阴性且未患有疾病的患者)与群体中健康个体的总数目(即测试呈阴性且未患有疾病的患者和测试呈阳性且未患有疾病的患者的总和)的比例来计算。
术语灵敏度或真阳性率可以指测试正确鉴别病况的能力。例如,在诊断测试中,测试的灵敏度是将测试为阳性的已知患有疾病的患者的比例。在一些情况下,这通过确定真阳性(即测试呈阳性且患有疾病的患者)与患有该病况的群体中个体的总数目(即,测试呈阳性且患有病况的患者和测试呈阴性且患有病况的患者的总和)的比例来计算。
当选择不同的诊断截止值时,灵敏度与特异性之间的定量关系可发生改变。可以使用ROC曲线表示该变化。ROC曲线的x轴显示测定的假阳性率,其可计算为(1-特异性)。ROC曲线的y轴报告测定的灵敏度。这允许人们容易地确定测定针对于给定特异性的灵敏度,反之亦然。
如本文所用,术语“约”数值是指该数值加上或减去该数值的10%。术语“约”范围是指该范围减去其最低值的10%并加上其最大值的10%。
如本文所用,术语“治疗”或“处理”用于指代用于在接受者中获得有益或期望的结果的药物或其他干预方案。有益或期望的结果包括但不限于治疗益处和/或预防益处。治疗益处可以指根除或改善症状获自正在治疗的潜在病症。此外,可通过根除或改善与潜在病症相关的一种或多种生理症状实现治疗益处,使得在受试者中观察到改善,尽管受试者可能仍患有潜在病症。预防作用包括延迟、防止或消除疾病或病况的出现,延迟或消除疾病或病况的症状发作,减缓、停止或逆转疾病或病况的进展,或其任何组合。对于预防益处,具有发生特定疾病风险的受试者或报告疾病的一种或多种生理症状的受试者可接受治疗,即使可能尚未作出该疾病的诊断。
编号实施方案
以下实施方案列举了本文公开的特征组合的非限制性排列。还考虑到特征组合的其他排列。1.一种评估个体中的结直肠健康风险状态的方法,包括以下步骤:从所述个体获得循环血液样品;以及获得表3和表5中的至少一个中指示的生物标志物小组的生物标志物小组水平,并评估结直肠健康风险状态。2.一种分析生物样品的方法,包括:针对包含C9、CEA、DPP4、MIF、ORM1、PKM、SAA和TFRC的生物标志物小组的每种蛋白质获得所述生物样品中的蛋白质水平以确定所述生物标志物小组的小组信息;将所述小组信息与参考小组信息进行比较,其中所述参考小组信息对应于已知的结直肠癌状态;以及如果所述小组信息与所述参考小组信息没有显著差异,则将所述生物样品分类为具有阳性结直肠癌风险状态,其中所述生物样品衍生自循环血液样品。3.根据实施方案2所述的方法,其中所述生物标志物小组进一步包含个体年龄和个体性别中的至少一种。4.根据实施方案2所述的方法,其中所述已知的结直肠癌状态包括早期CRC和晚期CRC中的至少一种。5.根据实施方案2所述的方法,其中所述已知的结直肠癌状态包括0期CRC、I期CRC、II期CRC、III期CRC和IV期CRC中的至少一种。6.根据实施方案2所述的方法,其中所述生物标志物小组包含不超过15种蛋白质。7.根据实施方案2所述的方法,其中所述生物标志物小组包含不超过8种蛋白质。8.根据实施方案2所述的方法,其中所述分类具有至少80%的灵敏度和至少71%的特异性。9.根据实施方案2所述的方法,进一步包括响应于所述分类执行治疗方案。10.根据实施方案9所述的方法,其中所述治疗方案包括化疗、放射、免疫疗法、施用生物治疗剂、息肉切除术、部分结肠切除术、低位前切除术或经腹会阴联合切除术和结肠造口术中的至少一种。11.根据实施方案2所述的方法,进一步包括将所述分类的结果的报告传输给健康从业者。12.根据实施方案11所述的方法,其中所述报告指示至少80%的灵敏度。13.根据实施方案11所述的方法,其中所述报告指示至少71%的特异性。14.根据实施方案11所述的方法,其中所述报告指示对治疗方案的推荐,所述治疗方案包括化疗、放射、免疫疗法、施用生物治疗剂、息肉切除术、部分结肠切除术、低位前切除术或经腹会阴联合切除术和结肠造口术中的至少一种。15.根据实施方案11所述的方法,其中所述报告指示对结肠镜检查的推荐。16.根据实施方案11所述的方法,其中所述报告指示对进行独立癌症检测的推荐。17.根据实施方案11所述的方法,其中所述报告指示对进行粪便癌症检测的推荐。18.根据实施方案2所述的方法,进一步包括响应于所述分类进行粪便癌症检测。19.根据实施方案2所述的方法,进一步包括持续监测3个月或更长的时间段。20.根据实施方案2所述的方法,进一步包括持续监测3个月至24个月的时间段。21.根据实施方案2所述的方法,其中所述获得所述蛋白质水平包括使所述生物样品经受质谱分析。22.根据实施方案2所述的方法,其中所述获得所述蛋白质水平包括使所述生物样品经受免疫测定分析。23.一种分析生物样品的方法,其包括:针对包含CLU、CTSD、DPP4、GDF15、GSN、MIF、PKM、SERPINA1、SERPINA3、TFRC和TIMP1的生物标志物小组的每种蛋白质获得所述生物样品中的蛋白质水平以确定所述生物标志物小组的小组信息;将所述小组信息与参考小组信息进行比较,其中所述参考小组信息对应于已知的晚期腺瘤状态;以及如果所述小组信息与所述参考小组信息没有显著差异,则将所述血液样品分类为具有阳性晚期腺瘤风险状态,其中所述生物样品衍生自循环血液样品。24.根据实施方案23所述的方法,其中所述生物标志物小组进一步包含个体年龄和个体性别中的至少一种。25.根据实施方案23所述的方法,其中所述生物标志物小组包含不超过15种蛋白质。26.根据实施方案23所述的方法,其中所述生物标志物小组包含不超过8种蛋白质。27.根据实施方案23所述的方法,其中所述分类具有至少44%的灵敏度和至少80%的特异性。28.根据实施方案23所述的方法,进一步包括响应于所述分类执行治疗方案。29.根据实施方案28所述的方法,其中所述治疗方案包括化疗、放射、免疫疗法、施用生物治疗剂、息肉切除术、部分结肠切除术、低位前切除术或经腹会阴联合切除术和结肠造口术中的至少一种。30.根据实施方案23所述的方法,包括将所述分类的结果的报告传输给健康从业者。31.根据实施方案30所述的方法,其中所述报告指示至少44%的灵敏度。32.根据实施方案30所述的方法,其中所述报告指示至少80%的特异性。33.根据实施方案30所述的方法,其中所述报告指示对治疗方案的推荐,所述治疗方案包括化疗、放射、免疫疗法、施用生物治疗剂、息肉切除术、部分结肠切除术、低位前切除术或经腹会阴联合切除术和结肠造口术中的至少一种。34.根据实施方案30所述的方法,其中所述报告指示对结肠镜检查的推荐。35.根据实施方案30所述的方法,其中所述报告指示对进行独立癌症检测的推荐。36.根据实施方案30所述的方法,其中所述报告指示对进行粪便癌症检测的推荐。37.根据实施方案23所述的方法,进一步包括进行粪便癌症检测。38.根据实施方案23所述的方法,进一步包括持续监测3个月或更长的时间段。39.根据实施方案23所述的方法,进一步包括持续监测3个月至24个月的时间段。40.根据实施方案23所述的方法,其中获得所述蛋白质水平包括使所述生物样品经受质谱分析。41.根据实施方案23所述的方法,其中所述获得所述蛋白质水平包括使所述生物样品经受免疫测定分析。42.一种分析体外生成的数据的方法,包括:通过处理器存储对应于生物样品的小组信息,其中所述小组信息包含针对包含C9、CEA、DPP4、MIF、ORM1、PKM、SAA和TFRC的生物标志物小组的每种蛋白质的蛋白质水平;通过所述处理器将所述小组信息与参考小组信息进行比较,其中所述参考小组信息对应于已知的结直肠癌状态;以及如果所述小组信息与所述参考小组信息没有显著差异,则通过所述处理器将所述小组信息分类为具有阳性结直肠癌风险状态。43.根据实施方案42所述的方法,其中所述生物标志物小组进一步包含个体年龄和个体性别中的至少一种。44.根据实施方案42所述的方法,其中所述已知的结直肠癌状态包括早期CRC和晚期CRC中的至少一种。45.根据实施方案42所述的方法,其中所述已知的结直肠癌状态包括0期CRC、I期CRC、II期CRC、III期CRC和IV期CRC中的至少一种。46.根据实施方案42所述的方法,其中所述生物标志物小组包含不超过15种蛋白质。47.根据实施方案42所述的方法,其中所述生物标志物小组包含不超过8种蛋白质。48.根据实施方案42所述的方法,其中所述分类具有至少80%的灵敏度和至少71%的特异性。49.根据实施方案42所述的方法,其中所述处理器被进一步配置用于生成指示所述阳性结直肠癌风险状态的报告。50.根据实施方案49所述的方法,其中所述报告进一步指示对响应于所述分类的治疗方案的推荐。51.根据实施方案49所述的方法,其中所述治疗方案包括化疗、放射、免疫疗法、施用生物治疗剂、息肉切除术、部分结肠切除术、低位前切除术或经腹会阴联合切除术和结肠造口术中的至少一种。52.根据实施方案49所述的方法,其中所述报告指示至少80%的灵敏度。53.根据实施方案49所述的方法,其中所述报告指示至少71%的特异性。54.根据实施方案49所述的方法,其中所述报告指示对结肠镜检查的推荐。55.根据实施方案49所述的方法,其中所述报告指示对进行独立癌症检测的推荐。56.根据实施方案49所述的方法,其中所述报告指示对进行粪便癌症检测的推荐。57.一种分析体外生成的数据的方法,包括:存储包含针对包含CLU、CTSD、DPP4、GDF15、GSN、MIF、PKM、SERPINA1、SERPINA3、TFRC和TIMP1的生物标志物小组的每种蛋白质的蛋白质水平的小组信息;将所述小组信息与参考小组信息进行比较,其中所述参考小组信息对应于已知的晚期腺瘤状态;以及如果所述小组信息与所述参考小组信息没有显著差异,则将所述小组信息分类为具有阳性晚期腺瘤风险状态。58.根据实施方案57所述的方法,其中所述生物标志物小组进一步包含个体年龄和个体性别中的至少一种。59.根据实施方案57所述的方法,其中所述生物标志物小组包含不超过15种蛋白质。60.根据实施方案57所述的方法,其中所述生物标志物小组包含不超过8种蛋白质。61.根据实施方案57所述的方法,其中所述分类具有至少44%的灵敏度和至少80%的特异性。62.根据实施方案57所述的方法,进一步包括生成指示所述阳性晚期腺瘤状态的报告。63.根据实施方案62所述的方法,其中所述报告进一步指示对响应于所述分类的治疗方案的推荐。64.根据实施方案63所述的方法,其中所述治疗方案包括化疗、放射、免疫疗法、施用生物治疗剂、息肉切除术、部分结肠切除术、低位前切除术或经腹会阴联合切除术和结肠造口术中的至少一种。65.根据实施方案62所述的方法,其中所述报告指示至少44%的灵敏度。66.根据实施方案62所述的方法,其中所述报告指示至少80%的特异性。67.根据实施方案62所述的方法,其中所述报告指示对结肠镜检查的推荐。68.根据实施方案62所述的方法,其中所述报告指示对进行独立癌症检测的推荐。69.根据实施方案62所述的方法,其中所述报告指示对进行粪便癌症检测的推荐。70.一种用于分析体外生成的数据的计算机系统,包含:(a)用于接收小组信息的存储器单元,该小组信息包括对来自生物样品的生物标志物小组中每种蛋白质的蛋白质水平的测量,其中所述生物标志物小组包含C9、CEA、DPP4、MIF、ORM1、PKM、SAA和TFRC;(b)用于将所述小组信息与参考小组信息进行比较的计算机可执行指令,其中所述参考小组信息对应于已知的结直肠癌状态;以及(c)用于如果所述小组信息与所述参考小组信息没有显著差异,则将所述小组信息分类为具有阳性结直肠癌状态的计算机可执行指令。71.根据实施方案70所述的计算机系统,进一步包含用于生成所述阳性结直肠癌状态的报告的计算机可执行指令。72.根据实施方案70所述的计算机系统,其中所述生物标志物小组进一步包含个体年龄和个体性别中的至少一种。73.根据实施方案70所述的计算机系统,其中所述已知的结直肠癌状态包括早期CRC和晚期CRC中的至少一种。74.根据实施方案70所述的计算机系统,其中所述已知的结直肠癌状态包括0期CRC、I期CRC、II期CRC、III期CRC和IV期CRC中的至少一种。75.根据实施方案70所述的计算机系统,其中所述生物标志物小组包含不超过15种蛋白质。76.根据实施方案70所述的计算机系统,其中所述生物标志物小组包含不超过8种蛋白质。77.根据实施方案70所述的计算机系统,其中所述分类具有至少80%的灵敏度和至少71%的特异性。78.根据实施方案70所述的计算机系统,进一步包含生成指示所述阳性结直肠癌风险状态的报告。79.根据实施方案78所述的计算机系统,其中所述报告进一步指示对响应于所述分类的治疗方案的推荐。80.根据实施方案79所述的计算机系统,其中所述治疗方案包括化疗、放射、免疫疗法、施用生物治疗剂、息肉切除术、部分结肠切除术、低位前切除术或经腹会阴联合切除术和结肠造口术中的至少一种。81.根据实施方案78所述的计算机系统,其中所述报告指示至少80%的灵敏度。82.根据实施方案78所述的计算机系统,其中所述报告指示至少71%的特异性。83.根据实施方案78所述的计算机系统,其中所述报告指示对结肠镜检查的推荐。84.根据实施方案78所述的计算机系统,其中所述报告指示对进行独立癌症检测的推荐。85.根据实施方案79所述的计算机系统,其中所述报告指示对进行粪便癌症检测的推荐。86.根据实施方案70所述的计算机系统,进一步包含被配置用于向用户传达或显示所述报告的用户界面。87.一种用于分析体外生成的数据的计算机系统:(a)用于接收小组信息的存储器单元,所述小组信息包含对来自生物样品的生物标志物小组中每种蛋白质的蛋白质水平的测量,其中所述生物标志物小组包含CLU、CTSD、DPP4、GDF15、GSN、MIF、PKM、SERPINA1、SERPINA3、TFRC和TIMP1;(b)用于将所述小组信息与参考小组信息进行比较的计算机可执行指令,其中所述参考小组信息对应于已知的晚期腺瘤状态;以及(c)用于如果所述小组信息与所述参考小组信息没有显著差异,则将所述小组信息分类为具有阳性晚期腺瘤状态的计算机可执行指令。88.根据实施方案87所述的计算机系统,其中所述生物标志物小组进一步包含个体年龄和个体性别中的至少一种。89.根据实施方案87所述的计算机系统,其中所述生物标志物小组包含不超过15种蛋白质。90.根据实施方案87所述的计算机系统,其中生物标志物小组包含不超过8种蛋白质。91.根据实施方案87所述的计算机系统,其中所述分类具有至少80%的灵敏度和至少71%的特异性。92.根据实施方案87所述的计算机系统,进一步包含用于生成所述阳性晚期腺瘤状态的报告的计算机可执行指令。93.根据实施方案92所述的计算机系统,其中所述报告进一步指示对响应于所述分类的治疗方案的推荐。94.根据实施方案93所述的计算机系统,其中所述治疗方案包括化疗、放射、免疫疗法、施用生物治疗剂、息肉切除术、部分结肠切除术、低位前切除术或经腹会阴联合切除术和结肠造口术中的至少一种。95.根据实施方案92所述的计算机系统,其中所述报告指示至少44%的灵敏度。96.根据实施方案92所述的计算机系统,其中所述报告指示至少80%的特异性。97.根据实施方案92所述的计算机系统,其中所述报告指示对结肠镜检查的推荐。98.根据实施方案92所述的计算机系统,其中所述报告指示对进行独立癌症检测的推荐。99.根据实施方案92所述的计算机系统,其中所述报告指示对进行粪便癌症检测的推荐。100.一种评估个体的结直肠健康的方法,包括:从所述个体获得循环血液样品;以及检测针对所述样品中的蛋白质列表的每个成员的蛋白质水平,所述蛋白质列表包含C9、CEA、ORM1和DPP4。101.根据实施方案100所述的方法,进一步包括当来自所述个体的所述蛋白质水平与对应于已知的结直肠癌风险状态的参考小组信息集没有显著差异时,将所述个体诊断为具有结直肠癌状态。102.根据实施方案101所述的方法,进一步包括对所述个体执行结肠镜检查。103.根据实施方案101所述的方法,其中所述已知的结直肠癌状态包括早期CRC和晚期CRC中的至少一种。104.根据实施方案101所述的方法,其中所述已知的结直肠癌状态包括0期CRC、I期CRC、II期CRC、III期CRC和IV期CRC中的至少一种。105.根据实施方案101所述的方法,进一步对所述个体执行治疗方案。106.根据实施方案105所述的方法,其中所述治疗方案包括息肉切除术。107.根据实施方案105所述的方法,其中所述治疗方案包括放射。108.根据实施方案105所述的方法,其中所述治疗方案包括化疗。109.根据实施方案100所述的方法,其中所述蛋白质列表进一步包含SAA、TFRC、PKM和MIF中的至少一种。110.根据实施方案100所述的方法,其中所述蛋白质列表进一步包含SAA、TFRC、PKM和MIF中的至少两种。111.根据实施方案100所述的方法,其中所述蛋白质列表进一步包含SAA、TFRC、PKM和MIF中的每一种。112.根据实施方案100所述的方法,进一步包括获得所述个体的年龄和性别中的至少一种。113.根据实施方案100所述的方法,进一步包括向健康从业者传输所述检测的结果的报告。114.根据实施方案113所述的方法,其中所述报告指示对所述个体的结肠镜检查的推荐。115.根据实施方案113所述的方法,其中所述报告指示对所述个体的息肉切除术的推荐。116.根据实施方案113所述的方法,其中所述报告指示对所述个体的放射的推荐。117.根据实施方案113所述的方法,其中所述报告指示对所述个体的化疗的推荐。118.根据实施方案113所述的方法,其中所述报告指示对进行独立癌症检测的推荐。119.根据实施方案113所述的方法,其中所述报告指示对进行粪便癌症检测的推荐。120.根据实施方案100所述的方法,其中所述蛋白质列表包含不超过15种蛋白质。121.根据实施方案100所述的方法,其中所述蛋白质列表包含不超过8种蛋白质。122.一种评估个体的结直肠健康的方法,包括:从所述个体获得循环血液样品;以及检测针对所述样品中的蛋白质列表的每个成员的蛋白质水平,所述蛋白质列表包含ORM和MIF;以及获得所述个体的年龄。123.根据实施方案122所述的方法,进一步包括当来自所述个体的所述蛋白质水平与对应于已知结直肠癌风险状态的参考小组信息集没有显著差异时,将所述个体诊断为具有结直肠癌状态。124.根据实施方案123所述的方法,进一步包括对所述个体执行结肠镜检查。125.根据实施方案123所述的方法,其中所述已知的结直肠癌状态包括早期CRC和晚期CRC中的至少一种。126.根据实施方案123所述的方法,其中所述已知的结直肠癌状态包括0期CRC、I期CRC、II期CRC、III期CRC和IV期CRC中的至少一种。127.根据实施方案123所述的方法,进一步对所述个体执行治疗方案。128.根据实施方案127所述的方法,其中所述治疗方案包括息肉切除术。129.根据实施方案127所述的方法,其中所述治疗方案包括放射。130.根据实施方案127所述的方法,其中所述治疗方案包括化疗。131.根据实施方案122所述的方法,其中所述蛋白质列表进一步包含SAA、CEA、DPP4、PKM和C9中的至少一种。132.根据实施方案122所述的方法,其中所述蛋白质列表进一步包含SAA、CEA、DPP4、PKM和C9中的至少两种。133.根据实施方案122所述的方法,其中所述蛋白质列表进一步包含SAA、CEA、DPP4、PKM和C9中的至少三种。134.根据实施方案122所述的方法,其中所述蛋白质列表进一步包含SAA、CEA、DPP4、PKM和C9中的每一种。135.根据实施方案122所述的方法,进一步包括获得所述个体的性别。136.根据实施方案122所述的方法,进一步包括向健康从业者传输所述检测的结果的报告。137.根据实施方案136所述的方法,其中所述报告指示对所述个体的结肠镜检查的推荐。138.根据实施方案136所述的方法,其中所述报告指示对所述个体的息肉切除术的推荐。139.根据实施方案136所述的方法,其中所述报告指示对所述个体的放射的推荐。140.根据实施方案136所述的方法,其中所述报告指示对所述个体的化疗的推荐。141.根据实施方案136所述的方法,其中所述报告指示对进行独立癌症检测的推荐。142.根据实施方案136所述的方法,其中所述报告指示对进行粪便癌症检测的推荐。143.根据实施方案122所述的方法,其中所述蛋白质列表包含不超过15种蛋白质。144.根据实施方案122所述的方法,其中所述蛋白质列表包含不超过8种蛋白质。145.一种评估个体的结直肠健康的方法,包括:从所述个体获得循环血液样品;以及检测针对所述样品中的蛋白质列表的每个成员的蛋白质水平,所述蛋白质列表包含MIF、PKM、CTSD、GELS和CLUS。146.根据实施方案145所述的方法,进一步包括当来自所述个体的所述蛋白质水平与对应于已知晚期腺瘤风险状态的参考小组信息集没有显著差异时,将所述个体诊断为具有晚期腺瘤状态。147.根据实施方案146所述的方法,进一步包括对所述个体执行结肠镜检查。148.根据实施方案146所述的方法,进一步对所述个体执行治疗方案。149.根据实施方案148所述的方法,其中所述治疗方案包括息肉切除术。150.根据实施方案148所述的方法,其中所述治疗方案包括放射。151.根据实施方案148所述的方法,其中所述治疗方案包括化疗。152.根据实施方案145所述的方法,其中所述蛋白质列表进一步包含DPP4、GDF15、TIMP1、TFRC和A1AT中的至少一种。153.根据实施方案145所述的方法,其中所述蛋白质列表进一步包含DPP4、GDF15、TIMP1、TFRC和A1AT中的至少两种。154.根据实施方案145所述的方法,其中所述蛋白质列表进一步包含DPP4、GDF15、TIMP1、TFRC和A1AT中的至少三种。155.根据实施方案145所述的方法,其中所述蛋白质列表进一步包含DPP4、GDF15、TIMP1、TFRC和A1AT中的每一种。156.根据实施方案145所述的方法,进一步包括获得所述个体的性别。157.根据实施方案145所述的方法,进一步包括向健康从业者传输所述检测的结果的报告。158.根据实施方案157所述的方法,其中所述报告指示对所述个体的结肠镜检查的推荐。159.根据实施方案157所述的方法,其中所述报告指示对所述个体的息肉切除术的推荐。160.根据实施方案157所述的方法,其中所述报告指示对所述个体的放射的推荐。161.根据实施方案157所述的方法,其中所述报告指示对所述个体的化疗的推荐。162.根据实施方案157所述的方法,其中所述报告指示对进行独立癌症检测的推荐。163.根据实施方案157所述的方法,其中所述报告指示对进行粪便癌症检测的推荐。164.根据实施方案145所述的方法,其中所述蛋白质列表包含不超过15种蛋白质。165.根据实施方案145所述的方法,其中所述蛋白质列表包含不超过8种蛋白质。166.一种评估个体的结直肠健康的方法,其包括:从所述个体获得循环血液样品;检测针对样品中的蛋白质列表的每个成员的蛋白质水平,所述蛋白质列表包含PKM、MIF和CTSD;以及获得所述个体的年龄。167.根据实施方案166所述的方法,进一步包括当来自所述个体的所述蛋白质水平与对应于已知晚期腺瘤风险状态的参考小组信息集没有显著差异时,将所述个体诊断为具有晚期腺瘤状态。168.根据实施方案167所述的方法,进一步包括对所述个体执行结肠镜检查。169.根据实施方案167所述的方法,进一步对所述个体执行治疗方案。170.根据实施方案169所述的方法,其中所述治疗方案包括息肉切除术。171.根据实施方案169所述的方法,其中所述治疗方案包括放射。172.根据实施方案169所述的方法,其中所述治疗方案包括化疗。173.根据实施方案166所述的方法,其中所述蛋白质列表进一步包含SERPINA1、GSN和TIMP1中的至少一种。174.根据实施方案173所述的方法,其中所述蛋白质列表进一步包含CLU、TFCR、DPP4、SERPINA3和GDF15中的至少一种。175.根据实施方案166所述的方法,进一步包括获得所述个体的性别。176.根据实施方案166所述的方法,进一步包括向健康从业者传输所述检测的结果的报告。177.根据实施方案176所述的方法,其中所述报告指示对所述个体的结肠镜检查的推荐。178.根据实施方案176所述的方法,其中所述报告指示对所述个体的息肉切除术的推荐。179.根据实施方案176所述的方法,其中所述报告指示对所述个体的放射的推荐。180.根据实施方案176所述的方法,其中所述报告指示对所述个体的化疗的推荐。181.根据实施方案176所述的方法,其中所述报告指示对进行独立癌症检测的推荐。182.根据实施方案176所述的方法,其中所述报告指示对进行粪便癌症检测的推荐。183.根据实施方案166所述的方法,其中所述蛋白质列表包含不超过15种蛋白质。184.根据实施方案166所述的方法,其中所述蛋白质列表包含不超过8种蛋白质。185.一种评估个体的结直肠健康的方法,包括:从所述个体获得循环血液样品;检测针对样品中的蛋白质列表的每个成员的蛋白质水平,所述蛋白质列表包含DPPIV、CO9和CEA。186.根据实施方案185所述的方法,进一步包括当来自所述个体的所述蛋白质水平与对应于已知结直肠癌风险状态的参考小组信息集没有显著差异时,将所述个体诊断为具有结直肠癌状态。187.根据实施方案185或186所述的方法,进一步包括对所述个体执行结肠镜检查。188.根据实施方案185至187中任一项所述的方法,进一步对所述个体执行治疗方案。189.根据实施方案188所述的方法,其中所述治疗方案包括息肉切除术。190.根据实施方案188所述的方法,其中所述治疗方案包括放射。191.根据实施方案188所述的方法,其中所述治疗方案包括化疗。192.根据实施方案185所述的方法,其中所述蛋白质列表进一步包含ORM1、MIF、PKM2、SAA和TFRC中的至少一种。193.根据实施方案185所述的方法,其中所述蛋白质列表进一步包含ORM1、MIF、PKM2、SAA和TFRC。194.根据实施方案185所述的方法,包括获得所述个体的年龄信息。195.根据实施方案185所述的方法,包括获得所述个体的性别信息。196.根据实施方案185所述的方法,包括获得所述个体的年龄信息和性别信息。197.根据实施方案185至196中任一项所述的方法,进一步包括向健康从业者传输所述检测的结果的报告。198.根据实施方案195至197中任一项所述的方法,进一步包括当来自所述个体的所述蛋白质水平、年龄和性别作为整体与对应于已知结直肠癌风险状态的参考小组信息集没有显著差异时,将所述个体诊断为具有结直肠癌状态。199.根据实施方案185所述的方法,其中所述报告指示对所述个体的结肠镜检查的推荐。200.根据实施方案197所述的方法,其中所述报告指示对所述个体的息肉切除术的推荐。201.根据实施方案197所述的方法,其中所述报告指示对所述个体的放射的推荐。202.根据实施方案197所述的方法,其中所述报告指示对所述个体的化疗的推荐。203.根据实施方案197所述的方法,其中所述报告指示对进行独立癌症检测的推荐。204.根据实施方案197所述的方法,其中所述报告指示对进行粪便癌症检测的推荐。205.根据实施方案185至204中任一项所述的方法,其中所述蛋白质列表包含不超过15种蛋白质。206.根据实施方案185所述的方法,其中所述蛋白质列表包含不超过8种蛋白质。207.208.一种评估个体的结直肠健康的方法,包括:从所述个体获得循环血液样品;检测针对样品中的蛋白质列表的每个成员的蛋白质水平,所述蛋白质列表包含CATD、TFRC和TIMP1。209.根据实施方案208所述的方法,进一步包括当来自所述个体的所述蛋白质水平与对应于已知晚期腺瘤风险状态的参考小组信息集没有显著差异时,将所述个体诊断为具有晚期腺瘤状态。210.根据实施方案208或209所述的方法,进一步包括对所述个体执行结肠镜检查。211.根据实施方案208至210中任一项所述的方法,进一步对所述个体执行治疗方案。212.根据实施方案211所述的方法,其中所述治疗方案包括息肉切除术。213.根据实施方案211所述的方法,其中所述治疗方案包括放射。214.根据实施方案211所述的方法,其中所述治疗方案包括化疗。215.根据实施方案208所述的方法,其中所述蛋白质列表进一步包含MIF、CLUS、PKM2、DPPIV、GDF15、GELS、A1AT和AACT中的至少一种。216.根据实施方案208所述的方法,其中所述蛋白质列表进一步包含MIF、CLUS、PKM2、DPPIV、GDF15、GELS、A1AT和AACT。217.根据实施方案208所述的方法,包括获得所述个体的年龄信息。218.根据实施方案208所述的方法,包括获得所述个体的性别信息。219.根据实施方案208所述的方法,包括获得所述个体的年龄信息和性别信息。220.根据实施方案208至219中任一项所述的方法,进一步包括向健康从业者传输所述检测的结果的报告。221.根据实施方案208至219中任一项所述的方法,进一步包括当来自所述个体的所述蛋白质水平和年龄作为整体与对应于已知晚期腺瘤风险状态的参考小组信息集没有显著差异时,将所述个体诊断为具有晚期腺瘤状态。222.根据实施方案220所述的方法,其中所述报告指示对所述个体的结肠镜检查的推荐。223.根据实施方案220所述的方法,其中所述报告指示对所述个体的息肉切除术的推荐。实施方案220所述的方法,其中所述报告指示对所述个体的放射的推荐。225.根据实施方案220所述的方法,其中所述报告指示对所述个体的化疗的推荐。226.根据实施方案220所述的方法,其中所述报告指示对进行独立癌症检测的推荐。227.根据实施方案220所述的方法,其中所述报告指示对进行粪便癌症检测的推荐。228.根据实施方案208至227中任一项所述的方法,其中所述蛋白质列表包含不超过15种蛋白质。229.根据实施方案208至227中任一项所述的方法,其中所述蛋白质列表包含不超过10种蛋白质。
通过参考以下实施方案获得对本文公开内容的进一步理解。
实施例
实施例1
使用如本文所公开的小组对具有结直肠癌风险的患者进行测试。从患者采集血液样品。将血液样品邮寄给设施,在该处制备血浆并使用抗体荧光结合测定来测量蛋白质累积水平以检测包含C9、CEA、DPP4、MIF、ORM1、PKM、SAA、TFRC的小组的成员,并且还考虑患者的性别和年龄。将患者的小组结果与已知状态的小组结果进行比较,并且患者以至少81%的灵敏度和至少78%的特异性被分类为患有结肠癌。推荐进行结肠镜检查,并在个体中检测到结直肠癌的证据。
实施例2
向实施例1的患者开出包括手术干预的治疗方案。在手术干预之前从患者采集血液样品,并针对包含C9、CEA、DPP4、MIF、ORM1、PKM、SAA、TFRC的小组测量蛋白质累积水平,并且还考虑患者的性别和年龄。将患者的小组结果与已知状态的小组结果进行比较,并且患者以81%的灵敏度、78%的特异性和31%的阳性预测值被分类为患有结肠癌。
在手术干预之后从患者采集血液样品,并针对包含C9、CEA、DPP4、MIF、ORM1、PKM、SAA、TFRC的小组测量蛋白质累积水平,并且还考虑患者的性别和年龄。将患者的小组结果与已知状态的小组结果进行比较,并且患者是以81%的灵敏度和78%的特异性被分类为患有结肠癌的患者。
实施例3
向实施例1的患者开出包括包含5-FU给药的化疗干预的治疗方案。在化疗干预之前从患者采集血液样品,并针对包含C9、CEA、DPP4、MIF、ORM1、PKM、SAA、TFRC的小组测量蛋白质累积水平,并且还考虑患者的性别和年龄。将患者的小组结果与已知状态的小组结果进行比较,并且患者是以81%的灵敏度和78%的特异性被分类为患有结肠癌的患者。
在化疗治疗期间以一周的间隔从患者采集血液样品,并针对包含C9、CEA、DPP4、MIF、ORM1、PKM、SAA、TFRC的小组测量蛋白质累积水平,并且还考虑患者的性别和年龄。将患者的小组结果与已知状态的小组结果进行比较。随着时间的推移,患者的小组结果指示癌症对化疗治疗有反应,并且通过完成治疗方案不再能检测到结直肠癌。
实施例4
向实施例1的患者开出包括包含口服卡培他滨给药的化疗干预的治疗方案。在化疗干预之前从患者采集血液样品,并针对包含C9、CEA、DPP4、MIF、ORM1、PKM、SAA、TFRC的小组测量蛋白质累积水平,并且还考虑患者的性别和年龄。将患者的小组结果与已知状态的小组结果进行比较,并且患者是以81%的灵敏度和78%的特异性被分类为患有结肠癌的患者。
在化疗治疗期间以一周的间隔从患者采集血液样品,并针对包含C9、CEA、DPP4、MIF、ORM1、PKM、SAA、TFRC的小组测量蛋白质累积水平,并且还考虑患者的性别和年龄。随着时间的推移,患者的小组结果指示癌症对化疗治疗有反应,并且通过完成治疗方案不再能检测到结直肠癌。
实施例5
向实施例1的患者开出包括包含口服奥沙利铂给药的化疗干预的治疗方案。在化疗干预之前从患者采集血液样品,并针对包含C9、CEA、DPP4、MIF、ORM1、PKM、SAA、TFRC的小组测量蛋白质累积水平,并且还考虑患者的性别和年龄。将患者的小组结果与已知状态的小组结果进行比较,并且患者是以81%的灵敏度和78%的特异性被分类为患有结肠癌的患者。
在化疗治疗期间以一周的间隔从患者采集血液样品,并针对包含C9、CEA、DPP4、MIF、ORM1、PKM、SAA、TFRC的小组测量蛋白质累积水平,并且还考虑患者的性别和年龄。将患者的小组结果与已知状态的小组结果进行比较。随着时间的推移,患者的小组结果指示癌症对化疗治疗有反应,并且通过完成治疗方案不再能检测到结直肠癌。
实施例6
向实施例1的患者开出包括包含口服奥沙利铂给药联合贝伐单抗的化疗干预的治疗方案。在化疗干预之前从患者采集血液样品,并针对包含C9、CEA、DPP4、MIF、ORM1、PKM、SAA、TFRC的小组测量蛋白质累积水平,并且还考虑患者的性别和年龄。将患者的小组结果与已知状态的小组结果进行比较,并且患者是以81%的灵敏度和78%的特异性被分类为患有结肠癌的患者。
在化疗治疗期间以一周的间隔从患者采集血液样品,并针对包含C9、CEA、DPP4、MIF、ORM1、PKM、SAA、TFRC的小组测量蛋白质累积水平,并且还考虑患者的性别和年龄。将患者的小组结果与已知状态的小组结果进行比较。随着时间的推移,患者的小组结果指示癌症对化疗治疗有反应,并且通过完成治疗方案不再能检测到结直肠癌。
实施例7
使用如本文所公开的小组对具有结直肠癌风险的患者进行测试。从患者采集血液样品并使用ELISA试剂盒中的试剂测量蛋白质累积水平以检测包含C9、CEA、DPP4、MIF、ORM1、PKM、SAA、TFRC的小组的成员,并且还考虑患者的性别和年龄。将患者的小组结果与已知状态的小组结果进行比较,并且患者是以81%的灵敏度和78%的特异性被分类为患有结肠癌的患者。推荐进行结肠镜检查,并在个体中检测结直肠癌的证据。
实施例8
使用如本文所公开的小组对具有结直肠癌风险的患者进行测试。从患者采集血液样品并使用质谱法测量蛋白质累积水平以检测包含C9、CEA、DPP4、MIF、ORM1、PKM、SAA、TFRC的小组的成员,并且还考虑患者的性别和年龄。将患者的小组结果与已知状态的小组结果进行比较,并且患者以81%的灵敏度和78%的特异性被分类为患有结肠癌。推荐进行结肠镜检查,并在个体中检测结直肠癌的证据。
实施例9
使用如本文所公开的小组对1000名具有结直肠癌风险的患者进行测试。从患者采集血液样品并测量蛋白质累积水平以检测包含C9、CEA、DPP4、MIF、ORM1、PKM、SAA、TFRC的小组的成员,并且还考虑患者的性别和年龄。将患者的小组结果与已知状态的小组结果进行比较,并且患者以81%的灵敏度和78%的特异性被分类为结肠癌类别。对于被分类为阳性的患者,推荐进行结肠镜检查。在被分类为患有结肠癌的患者中,80%被独立确认患有结肠癌。在被分类为没有结肠癌的患者中,20%在随后通过独立的随访测试发现患有结肠癌,通过结肠镜检查得到确认。
实施例10
使用如本文所公开的小组对具有晚期腺瘤风险的患者进行测试。从患者采集血液样品。将血液样品邮寄给设施,在该处制备血浆并使用抗体荧光结合测定来测量蛋白质累积水平以检测包含SERPINA1、SERPINA3、CTSD、CLU、DPP4、GDF15、GSN、MIF、PKM、TIMP1、TFRC的小组的成员,并且还考虑患者年龄。将患者的小组结果与已知状态的小组结果进行比较,并且患者被分类为具有晚期腺瘤的风险。
实施例11-非侵入性的准确结直肠健康测定的临床效用
一名顽固患者表现出CRC症状但拒绝结肠镜检查。患者的初级护理医师预订了SimpliPro结直肠健康评估测试。结果表明患者具有CRC和AA的风险较高。患者与家人商量并被说服安排结肠镜检查。结肠镜检查显示出息肉和早期癌性肿块,所有这些都在手术过程中被去除。随访结直肠健康评估显示患者无癌症。在没有结肠镜检查和同时进行的息肉切除术的情况下,患者的早期癌性肿块可能已发展为死亡可能性较高的晚期疾病。
本实施例证明了提供既灵敏又具特异性且易于依从的非侵入性结直肠健康测定对于公众的益处。本实施例表明,不愿进行结肠镜检查是常见的,并且如果其导致在相对容易治疗时未检测到早期癌症,则可能具有严重的健康后果。
实施例12-非侵入性的准确结直肠健康测定的临床效用
一名顽固表现出CRC症状但将结肠镜检查推迟超过6个月。患者的初级护理医师预订了SimpliPro结直肠健康评估测试。结果表明患者具有CRC和AA的风险较高。患者安排了结肠镜检查。在手术过程中,鉴别并去除了6cm的恶性肿块。随访结直肠健康评估显示患者无癌症。在没有结肠镜检查和同时进行的息肉切除术的情况下,患者的早期癌性肿块可能已发展为死亡可能性较高的晚期疾病。
本实施例证明了提供既灵敏又具特异性且易于依从的非侵入性结直肠健康测定对于公众的益处。本实施例表明,不愿进行结肠镜检查是常见的,并且如果其导致在相对容易治疗时未检测到早期癌症,则可能具有严重的健康后果。
尽管本文中已经示出并描述了本公开内容的优选实施方案,但对于本领域技术人员显而易见的是,这些实施方案仅以示例的方式提供。本领域技术人员在不脱离本公开内容的情况下现将会想到多种变化、改变和替代。应当理解,本文中描述的本公开内容实施方案的各种替代方案可用于实施本公开内容。旨在以下述权利要求限定本公开内容的范围,并由此涵盖这些权利要求范围内的方法和结构及其等同物。

Claims (28)

1.一种评估个体的结直肠健康的方法,包括:
从所述个体获得循环血液样品;
检测针对样品中蛋白质列表的每个成员的蛋白质水平,所述蛋白质列表包含DPPIV、CO9和CEA。
2.根据权利要求1所述的方法,进一步包括当来自所述个体的所述蛋白质水平与对应于已知结直肠癌风险状态的参考小组信息集没有显著差异时,将所述个体诊断为具有结直肠癌状态。
3.根据权利要求2所述的方法,进一步包括对所述个体执行结肠镜检查。
4.根据权利要求2所述的方法,进一步包括对所述个体执行治疗方案。
5.根据权利要求4所述的方法,其中所述治疗方案包括息肉切除术。
6.根据权利要求4所述的方法,其中所述治疗方案包括放射。
7.根据权利要求4所述的方法,其中所述治疗方案包括化疗。
8.根据权利要求1所述的方法,其中所述蛋白质列表进一步包含ORM1、MIF、PKM2、SAA和TFRC中的至少一种。
9.根据权利要求1所述的方法,其中所述蛋白质列表进一步包含TFRC。
10.根据权利要求1所述的方法,其中所述蛋白质列表进一步包含SAA。
11.根据权利要求1所述的方法,其中所述蛋白质列表进一步包含PKM2。
12.根据权利要求1所述的方法,其中所述蛋白质列表进一步包含MIF。
13.根据权利要求1所述的方法,其中所述蛋白质列表进一步包含ORM1。
14.根据权利要求1所述的方法,其中所述蛋白质列表进一步包含ORM1、MIF、PKM2、SAA和TFRC。
15.根据权利要求1所述的方法,其中所述蛋白质列表进一步包含ORM1、MIF、PKM2、SAA和TFRC,并且其中还评估年龄和性别。
16.根据权利要求1所述的方法,包括获得所述个体的年龄信息。
17.根据权利要求1所述的方法,包括获得所述个体的性别信息。
18.根据权利要求1所述的方法,包括获得所述个体的年龄信息和性别信息。
19.根据权利要求1所述的方法,包括当来自所述个体的所述蛋白质水平、年龄和性别信息总体上与对应于已知结直肠癌风险状态的参考小组信息集没有显著差异时,将所述个体诊断为具有结直肠癌状态。
20.根据权利要求19所述的方法,进一步包括向健康从业者传输所述检测的结果的报告。
21.根据权利要求20所述的方法,其中所述报告指示对所述个体的结肠镜检查的推荐。
22.根据权利要求20所述的方法,其中所述报告指示对所述个体的息肉切除术的推荐。
23.根据权利要求20所述的方法,其中所述报告指示对所述个体的放疗的推荐。
24.根据权利要求20所述的方法,其中所述报告指示对所述个体的化疗的推荐。
25.根据权利要求20所述的方法,其中所述报告指示对进行独立的癌症检测的推荐。
26.根据权利要求20所述的方法,其中所述报告指示对进行粪便癌症检测的推荐。
27.根据权利要求1所述的方法,其中所述蛋白质列表包含不超过15种蛋白质。
28.根据权利要求1所述的方法,其中所述蛋白质列表包含不超过8种蛋白质。
CN201780076307.1A 2016-10-07 2017-10-06 用于检测结直肠癌和晚期腺瘤的蛋白质生物标志物小组 Pending CN110662966A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201662405771P 2016-10-07 2016-10-07
US62/405,771 2016-10-07
US15/414,456 2017-01-24
US15/414,456 US20180100858A1 (en) 2016-10-07 2017-01-24 Protein biomarker panels for detecting colorectal cancer and advanced adenoma
PCT/US2017/055659 WO2018068020A1 (en) 2016-10-07 2017-10-06 Protein biomarker panels for detecting colorectal cancer and advanced adenoma

Publications (1)

Publication Number Publication Date
CN110662966A true CN110662966A (zh) 2020-01-07

Family

ID=58605370

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780076307.1A Pending CN110662966A (zh) 2016-10-07 2017-10-06 用于检测结直肠癌和晚期腺瘤的蛋白质生物标志物小组

Country Status (8)

Country Link
US (1) US20180100858A1 (zh)
EP (1) EP3523658A1 (zh)
JP (1) JP2020500293A (zh)
CN (1) CN110662966A (zh)
CA (1) CA3039260A1 (zh)
GB (2) GB201808422D0 (zh)
HK (1) HK1248316B (zh)
WO (1) WO2018068020A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108314727A (zh) * 2018-01-03 2018-07-24 西交利物浦大学 膜型金属蛋白酶抑制蛋白及其用途
US11851475B2 (en) 2018-01-03 2023-12-26 Xi'an Jiaotong-Liverpool University Membrane-type metalloprotease inhibitory protein and pharmaceutical and pharmaceutical composition containing same, and respective uses thereof

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210311069A1 (en) * 2018-08-21 2021-10-07 The Board Of Trustees Of The Leland Stanford Junior University Isotopically-encoded nanoparticles for multimodal high-order multiplexed detection and imaging
WO2020081445A1 (en) * 2018-10-15 2020-04-23 Hangzhou New Horizon Health Technology Co. Ltd. Methods and systems for predicting or diagnosing cancer
CN112526138A (zh) * 2019-09-03 2021-03-19 上海早泰生物科技有限公司 一种大肠癌粪便蛋白质生物标志物及其试剂盒和应用
EP3835789A1 (en) * 2019-12-13 2021-06-16 Deutsches Krebsforschungszentrum, Stiftung des öffentlichen Rechts Biomarker panel for diagnosing colorectal cancer
EP4357782A1 (en) * 2022-10-18 2024-04-24 MU Bioteknik Aktiebolag Protein biomarker panel for the diagnosis of colorectal cancer

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120149022A1 (en) * 2009-02-20 2012-06-14 Eva I-Wei Aw Compositions and methods for diagnosis and prognosis of colorectal cancer
WO2015149030A1 (en) * 2014-03-28 2015-10-01 Applied Proteomics, Inc. Protein biomarker profiles for detecting colorectal tumors
WO2016164815A1 (en) * 2015-04-10 2016-10-13 Applied Proteomics, Inc. Protein biomarker panels for detecting colorectal cancer and advanced adenoma

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5805518B2 (ja) * 2011-12-21 2015-11-04 株式会社島津製作所 マルチプレックス大腸がんマーカーパネル
EP2926138A4 (en) * 2012-11-30 2016-09-14 Applied Proteomics Inc METHOD FOR ASSESSING THE PRESENCE OR RISK OF COLON TUMORS
CN103645319B (zh) * 2013-12-20 2016-05-18 张伟 巨噬细胞抑制因子-1在大肠癌诊断中的应用

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120149022A1 (en) * 2009-02-20 2012-06-14 Eva I-Wei Aw Compositions and methods for diagnosis and prognosis of colorectal cancer
WO2015149030A1 (en) * 2014-03-28 2015-10-01 Applied Proteomics, Inc. Protein biomarker profiles for detecting colorectal tumors
WO2016164815A1 (en) * 2015-04-10 2016-10-13 Applied Proteomics, Inc. Protein biomarker panels for detecting colorectal cancer and advanced adenoma

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
ERIN L. SYMONDS 等: "Blood Tests for Colorectal Cancer Screening in the Standard Risk Population", 《CURR COLORECTAL CANCER REP》 *
JEFFREY J. JONES 等: "《A Plasma-Based Protein Marker Panel for Colorectal Cancer Detection Identified by Multiplex Targeted Mass Spectrometry》", 《CLINICAL COLORECTAL CANCER》 *
PAULA ÁLVAREZ-CHAVER 等: "Proteomics for discovery of candidate colorectal cancer biomarkers", 《WORLD JOURNAL OF GASTROENTEROLOGY》 *
RANDALL BROCK 等: "A multiplex serum protein assay for determining the probability of colorectal cancer", 《AM J CANCER RES》 *
WILLIAM TZU-LIANG CHEN 等: "Identification of biomarkers to improve diagnostic sensitivity of sporadic colorectal cancer in patients with low preoperative serum carcinoembryonic antigen by clinical proteomic analysis", 《CLINICA CHIMICA ACTA》 *
YUSUKE MURAKOSHI 等: "Plasma biomarker discovery and validation for colorectal cancer by quantitative shotgun mass spectrometry and protein microarray", 《CANCER SCIENCE》 *
尹晨希等: "恶性肿瘤患者血清中PKM2水平的诊断和预后预测价值", 《肿瘤学杂志》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108314727A (zh) * 2018-01-03 2018-07-24 西交利物浦大学 膜型金属蛋白酶抑制蛋白及其用途
CN108314727B (zh) * 2018-01-03 2021-08-06 西交利物浦大学 膜型金属蛋白酶抑制蛋白及其用途
US11851475B2 (en) 2018-01-03 2023-12-26 Xi'an Jiaotong-Liverpool University Membrane-type metalloprotease inhibitory protein and pharmaceutical and pharmaceutical composition containing same, and respective uses thereof

Also Published As

Publication number Publication date
GB201703816D0 (en) 2017-04-26
US20180100858A1 (en) 2018-04-12
GB2551415B (en) 2018-07-04
GB2551415A (en) 2017-12-20
WO2018068020A1 (en) 2018-04-12
HK1248316B (zh) 2019-11-15
JP2020500293A (ja) 2020-01-09
GB201808422D0 (en) 2018-07-11
CA3039260A1 (en) 2018-04-12
EP3523658A1 (en) 2019-08-14

Similar Documents

Publication Publication Date Title
US9689874B2 (en) Protein biomarker panels for detecting colorectal cancer and advanced adenoma
Borrebaeck Precision diagnostics: moving towards protein biomarker signatures of clinical utility in cancer
US20170285033A1 (en) Method for evaluation of presence of or risk of colon tumors
CN110662966A (zh) 用于检测结直肠癌和晚期腺瘤的蛋白质生物标志物小组
KR101857462B1 (ko) 췌장암 바이오마커 및 그것의 용도
US20170176441A1 (en) Protein biomarker profiles for detecting colorectal tumors
Drake et al. Serum, salivary and tissue proteomics for discovery of biomarkers for head and neck cancers
EP2089712A2 (en) Autoimmune disease biomarkers
Martinez-Garcia et al. Advances in endometrial cancer protein biomarkers for use in the clinic
EP3710831A1 (en) Markers for the diagnosis and treatment of non-alcoholic steatohepatitis (nash) and advanced liver fibrosis
Wan-Ibrahim et al. Biomarkers for bone tumors: discovery from genomics and proteomics studies and their challenges
WO2015164616A1 (en) Biomarkers for detection of tuberculosis
KR20240004546A (ko) 결장직장암에 대한 바이오마커
CA3214819A1 (en) Protein markers for estrogen receptor (er)-positive luminal a(la)-like and luminal b1 (lb1)-like breast cancer
CN117396983A (zh) 多组学评估

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20200107