CN117203352A - 结直肠癌对象的结果的预测 - Google Patents

结直肠癌对象的结果的预测 Download PDF

Info

Publication number
CN117203352A
CN117203352A CN202280009901.XA CN202280009901A CN117203352A CN 117203352 A CN117203352 A CN 117203352A CN 202280009901 A CN202280009901 A CN 202280009901A CN 117203352 A CN117203352 A CN 117203352A
Authority
CN
China
Prior art keywords
gene expression
expression profile
seq
sequence
pde4d
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280009901.XA
Other languages
English (en)
Inventor
R·D·霍夫曼
M·施托费尔斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV filed Critical Koninklijke Philips NV
Publication of CN117203352A publication Critical patent/CN117203352A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6851Quantitative amplification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Immunology (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Pathology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Oncology (AREA)
  • Hospice & Palliative Care (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明涉及预测结肠直肠癌对象的结果的方法,包括:确定针对一个或多个免疫防御反应基因中的每个的第一基因表达谱和/或针对一个或多个T细胞受体信号转导基因中每个的第二基因表达谱,和/或针对一个或多个PDE4D7相关基因中每一个的第三基因表达谱,或者接收对针对所述第一基因表达谱、第二基因表达谱和/或所述第三基因表达谱的确定的结果,所述(一个或多个)第一、第二和第三表达谱是在对从对象获得的样本的生物分析中确定的定,基于所述(一个或多个)第一基因表达谱、或所述(一个或多个)第二基因表达谱、或所述(一个或多个)第三基因表达谱、或者基于所述(一个或多个)第一基因表达谱、第二基因表达谱和第三基因表达谱来确定对所述结果的预测,并且任选地,向医疗护理人员或对象提供所述预测。

Description

结直肠癌对象的结果的预测
技术领域
本发明涉及预测结肠直肠癌对象的结果的方法,并且涉及用于预测结肠直肠癌对象的结果的装置。此外,本发明涉及诊断套件、该套件的使用、该套件在预测结直肠癌对象结果的方法中的使用、(一个或多个)第一基因表达谱、(一个或多个)第二基因表达谱和/或(一个或多个)第三基因表达谱在预测结直肠癌对象结果的方法中的使用,以及相应的计算机程序产品。
背景技术
癌症是一类疾病,其中,一组细胞表现出不受控制的生长、侵袭并且有时候转移。癌症的这三种恶性特性将它们与良性肿瘤区分开来,良性肿瘤是自限性的,不会侵袭或转移。结直肠癌、(CRC)、是相当常见的癌症,在美国新发病例中排名第四(8.2%),甚至在美国2020年估计死亡人数中排名第二。2020年,预计将诊断出近148000例结直肠癌新病例,超过53000人将死于该病。诊断的中位年龄为67岁,5年相对存活率为64.6%。结直肠癌诊断越早,诊断后存活5年以上的机会就越高;局限性结直肠癌的5年存活率为90.2%,而转移性结直肠癌(distant colorectal cancer)的患者只有14.3%能存活至少5年。约38%的患者出现局部疾病。男性比女性更容易受到影响,并且发病率随着年龄的增长而增加(参见国家癌症研究所,SEER癌症统计事实:结直肠癌,https://seer.cancer.gov/statfacts/html/colorect.html,访问日期:2020年9月9日)。结直肠癌的危险因素包括年龄较大、一级亲属有结直肠癌家族史、有结肠癌、直肠癌或卵巢癌的个人病史、有高危腺瘤的个人病史、患有遗传性疾病某些基因的变化会增加家族性腺瘤性息肉病(FAP)或林奇综合征的风险、有慢性溃疡性结肠炎或克罗恩病个人病史超过8年、每天饮酒超过3杯、吸烟、有色人种、以及肥胖。过去二十年来,新发病例的比率正在下降,尽管速度快于死亡率的下降。
结直肠癌始于结肠或直肠,根据其起始位置,也可称为结肠癌或直肠癌。然而,它们经常被归组在一起,因为它们有许多共同的特征。通常,结直肠癌始于结肠或直肠内壁的生长,称为息肉。这些息肉是否会变成癌症取决于息肉的类型。腺瘤有时会转变为癌症。增生性息肉和炎性息肉较为常见,但一般不是癌前病变。无蒂锯齿状息肉(SSP)和传统锯齿状腺瘤(TSA)通常被视为腺瘤,因为它们患结直肠癌的风险较高。除了息肉的类型之外,较大的息肉、多发性息肉和息肉中存在的不典型增生也会增加患结直肠癌的风险。
大多数结直肠癌都是腺癌,起源于产生粘液以润滑结肠和直肠内部的细胞。其他不太常见的类型包括类癌(主要发生在激素产生细胞中)、胃肠道间质瘤(GIST)、淋巴瘤和肉瘤。
局部处置对于早期癌症更有用。根据结直肠癌的类型,也可以给予全身处置。对于每种类型和阶段,可以使用不同的处置类型,或者同时组合,或者相继使用。以下文献中中描述了一些主要处置类型,American Cancer Society,Colorectal Cancer,https://www.cancer.org/cancer/colon-rectal-cancer.html,访问日期:20202年9月9日,以及美国国家癌症研究所,Adult Treatment Editorial Board,PDQ Colorectal CancerTreatment,https://www.cancer.gov/types/colorectal/Patient/colon-treatment-pdq,访问日期:2020年9月9日。
针对早期结直肠癌的主要处置是手术。手术类型取决于癌症的级别。对于直肠癌,通常在手术前或手术后进行放疗和化疗。小转移瘤可以通过栓塞或消融去除。对于癌症无法通过手术治愈或无法进行手术的患者来说,这也是一种选择。放疗在结肠癌处置中并不常见,但可用于特殊情况,例如与手术相结合的(新)辅助治疗,或处置转移。对于直肠癌,放疗更为常见,并且可以在手术前、手术后或手术期间使用。如果无法进行手术,它也可以与化疗一起使用或不与化疗一起使用。化疗可在结直肠癌治疗期间的不同时间用于(新)辅助治疗或治疗转移。它可以系统地或区域性地给予。结直肠癌的靶向治疗可以针对:VEGF(防止血管形成)、EGFR和BRAF(防止癌症生长)。激酶抑制剂也可用于减缓癌细胞的生长。免疫检查点抑制剂(PD-1抑制剂、CTLA4抑制剂)可用于结直肠癌细胞对特定基因变化(例如微卫星不稳定性(MSI-H)或错配修复(MMR)基因)呈阳性的患者。这些药物通常在无法进行手术或复发或转移性结直肠癌时使用。
通过使用大量肿瘤进行全面的分子表征,传统的肿瘤分类得到了改进。结直肠癌可根据染色体不稳定性(CIN)、微卫星不稳定性(MSI)和高甲基化进行分类。癌症基因组图谱网络于2012年发表了CRC的综合分子表征(参见Cancer Genome Atlas Network,“Comprehensive molecular characterization of human colon and rectal cancer”,Nature,Vol.487,No.7407,第330-337页,2012年)。此前许多研究报道了对CRC发生和进展重要的基因和途径,如WNT、RAS-MAPK、PI3K、TGF-β、P53和DNA错配修复途径。TCGA研究得出的结论是,结肠和直肠的非超突变腺癌在基因组水平上无法区分。WNT信号转导(signaling)途径的激活和TGF-β信号转导途径的失活导致MYC活性降低,这在结直肠癌中几乎普遍存在。基因组经常针对PI3K和MAPK途径畸变,并且针对受体酪氨酸激酶较少这样。后来,Liu Y.等人系统地研究了胃肠道癌症(包括CRC)中共有的分子过程(Liu Y.等人,“Comparative molecular analysis of gastrointestinal adenocarcinomas”,CancerCell,Vol.33,No.4,第721-735页,2018年)。特别是在下胃肠道,他们发现WNT信号转导的激活更加丰富。此外,还发现TGF-β和SMAD信号转导成分受到破坏,这与之前的发现一致。考虑分子亚型对于研究和治疗结直肠癌至关重要。欲了解更详细的信息,请参阅Liu Y等人2018年的出处同上的文章和Cancer Genome Atlas Network,2018,如上所述)。
例如,EP1777523A1,WO2007/082099A2,He等人2020年(Journal of Cancer,col.11,no.4,1Jan2020,pages 893-905),He等人2019年(Translational CancerResearch,vol.8,no.4,2019年8月1日,第1351-1363页),Sheelu等人(Annals of SurgicalOncology,vol.14,no.12,2007年9月25日,第3460-3471页)和WO2016/109546A2描述了针对结直肠癌的标记基因。
治疗结果的预测非常复杂,因为许多因素在治疗效果和疾病复发中发挥作用。很可能的是,尚未识别出重要因素,而无法准确确定其他因素的影响。目前正在研究多种临床病理学措施并将其应用于临床环境,以改善反应预测和治疗选择,从而提供一定程度的改善。然而,仍然强烈需要更好地预测治疗反应,以提高这些疗法的成功率。
发明内容
本发明的一个目的是提供一种预测结肠直肠癌对象的结果的方法,以及一种用于预测结肠直肠癌对象的结果的装置,其允许做出更好的治疗决策。本发明的另一方面是提供诊断套件、该套件的使用、该套件在预测结直肠癌对象结果的方法中的使用、(一个或多个)第一基因表达谱、(一个或多个)第二基因表达谱和/或(一个或多个)第三基因表达谱在预测结直肠癌对象结果的方法中的使用,以及相应的计算机程序产品。
在本发明的第一方面中,提出了一种预测结直肠癌对象的结果的方法,包括:
确定选自第一基因表达谱、第二基因表达谱和第三基因表达谱的六个或更多个基因表达水平,或者接收对所述六个或更多个基因表达水平的确定的结果,其中,所述六个或更多个基因表达水平包括选自第三基因表达谱的至少一个或多个基因表达水平和选自第一和/或第二基因表达谱的至少一个或多个基因表达水平,其中,
所述第一基因表达谱包括选自包括以下项的组的免疫防御反应基因:AIM2、APOBEC3A、CIAO1、DDX58、DHX9、IFI16、IFIH1、IFIT1、IFIT3、LRRFIP1、MYD88、OAS1、TLR8、以及ZBP1;
所述第二基因表达谱包括选自包括以下项的组的T细胞受体信号转导基因:CD2、CD247、CD28、CD3E、CD3G、CD4、CSK、EZR、FYN、LAT、LCK、PAG1、PDE4D、PRKACA、PRKACB、PTPRC、以及ZAP70;
所述第三基因表达谱包括选自包括以下项的组的PDE4D7相关基因:ABCC5、CUX2、KIAA1549、PDE4D、RAP1GAP2、SLC39A11、TDRD1、以及VWA2;
所述第一基因表达谱、第二基因表达谱和第三基因表达谱是在从所述对象获得的生物样本中测定的;并且
基于所述六个或更多基因表达水平来确定对所述结果的所述预测,并且
任选地,向医疗护理人员或对象提供所述预测。在实施例中,所述六个或更多个基因表达水平包含一个或多个,例如1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个或所有,免疫防御反应基因,以及一个或多个,例如1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个或所有,T细胞受体信号转导基因,以及一个或多个,例如,1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个或所有,PDE4D7相关基因。
替代地,本发明涉及一种预测结直肠癌对象结果的方法,包括:
确定针对从包括以下项的组中选择的一个或多个,例如,1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个或者全部,免疫防御反应基因中的每个的第一基因表达谱:AIM2、APOBEC3A、CIAO1、DDX58、DHX9、IFI16、IFIH1、IFIT1、IFIT3、LRRFIP1、MYD88、OAS1、TLR8和ZBP1,或者接收对所述第一基因表达谱的确定的结果,所述(一个或多个)第一基因表达谱是在从所述对象获得的生物样本中确定的,
确定针对从包括以下项的组中选择的一个或多个,例如,1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个或所有,T细胞受体信号转导转导基因中的中的每个的第二基因表达谱:CD2、CD247、CD28、CD3E、CD3G、CD4、CSK、EZR、FYN、LAT、LCK、PAG1、PDE4D、PRKACA、PRKACB、PTPRC、以及ZAP70,或者接收对所述第二基因表达谱的确定的结果,所述(一个或多个)第二基因表达谱是在从所述对象获得的生物样本中确定的,和/或
确定针对从包括以下项的组中选择的一个或多个,例如,1个、2个、3个、4个、5个、6个、7个或者所有,PDE4D7相关基因中的每个的第三基因表达谱:ABCC5、CUX2、KIAA1549、PDE4D、RAP1GAP2、SLC39A11、TDRD1和VWA2,或者接收对所述第三基因表达谱的确定的结果,所述(一个或多个)第三基因表达谱是在从所述对象获得的生物样本中确定的,
基于所述(一个或多个)第一基因表达谱、或所述(一个或多个)第二基因表达谱、或所述(一个或多个)第三基因表达谱、或者基于所述第一、所述第二和所述(一个或多个)第三基因表达谱来确定对结果的预测,并且
任选地,向医疗护理人员或对象提供所述预测。
近年来,免疫系统在癌症抑制以及癌症起始、促进和转移中的重要性变得非常明显(参见MantovaniA.等人r“Cancer-related inflammation”,Cancer-relatedinflammation”,Nature,Vol.454,No.7203,第436-444页,2008年,以及GiraldoNA等人的“The clinical role of the TME in solid cancer”,Br J Cancer,Vol.120,No.1,第45-53页,2019年)。免疫细胞及其分泌的分子构成了肿瘤微环境的重要组成部分,并且大多数免疫细胞可以浸润肿瘤组织。免疫系统和肿瘤相互影响和塑造。因此,抗肿瘤免疫可以防止肿瘤形成,而炎性肿瘤环境可以促进癌症的发生和增殖。与此同时,可能起源于免疫系统非依赖性方式的肿瘤细胞会通过募集免疫细胞来塑造免疫微环境,并且具有促炎作用同时也抑制抗癌免疫。
肿瘤微环境中的一些免疫细胞将具有一般的肿瘤促进或一般的肿瘤抑制作用,而其他免疫细胞表现出可塑性并显示出肿瘤促进和肿瘤抑制两者的潜力。因此,肿瘤的整体免疫微环境是存在的各种免疫细胞、它们产生的细胞因子以及它们与肿瘤细胞和肿瘤微环境中其他细胞的相互作用的混合物(参见Giraldo、N.A等人,2019,出处同上)。
上述关于免疫系统在癌症中的作用的原则通常也适用于前列腺癌。慢性炎症与良性和恶性前列腺组织的形成有关(参见Hall W.A等人,2016年,出处同上),并且大多数前列腺癌组织样本显示免疫细胞浸润。具有促肿瘤作用的特定免疫细胞的存在与较差的预后相关,而自然杀伤细胞被更多激活的肿瘤表现出对治疗有更好的反应和更长的无复发期(参见Shiao S.L.等人的“Regulation of prostate cancer progression by tumormicroenvironment”,Cancer Lett,Vol.380,No.1,第340-348页,2016年)。
虽然治疗会受到肿瘤微环境的免疫成分的影响,但RT本身会广泛影响这些成分的构成(参见Barker H.E.等人,“The tumor microenvironment after radiotherapy:Mechanisms of resistance or recurrence”,Nat Rev Cancer,Vol.15,No.7,第409-425页,2015年)。由于抑制性细胞类型对辐射相对不敏感,因此它们的相对数量会增加。相反,造成的辐射损伤激活细胞存活途径并刺激免疫系统,引发炎症反应和免疫细胞募集。净效应是促进肿瘤还是抑制肿瘤尚不确定,但正在研究其增强癌症免疫疗法的潜力。
本发明基于这样的想法:由于免疫系统和免疫微环境的状态对治疗效果有影响,因此识别预测这种效果的标志物的能力可能有助于更好地预测结直肠癌对象的结果。
这里,术语“结果”涉及可以测量的具体结果或效果。结肠直肠癌对象的结果的实例包括结肠直肠癌的结果、病理学结果、用于处置结肠直肠癌的治疗的结果,例如手术结果、放疗结果、化疗结果和免疫疗法结果,以及其他结果,例如生物标志物相关的结果(例如,CEA(癌胚抗原))、基因组谱相关结果、成像相关的结果(例如,肿瘤形态或纹理的变化)、生物学结果相关结果(例如,炎症或免疫反应)、替代标志物相关的结果、肿瘤尺寸结果、治疗副作用结果、治疗毒性结果、疾病疼痛结果、生活质量结果、癌症特异性存活率,以及总体存活率。
免疫反应防御基因
基因组DNA的完整性和稳定性永久处于由各种细胞内部和外部因素引起的压力下,例如暴露于辐射、病毒或细菌感染,以及氧化和复制压力(参见Gasser S.等人的“Sensing of dangerous DNA”,Mechanisms of Aging and Development,第165卷,第33-46页,2017年)。为了维持DNA结构和稳定性,细胞必须能够识别由各种因素引起的所有类型的DNA损伤,如单链或双链断裂等。这个过程涉及大量特异性蛋白质的参与,具体取决于作为DNA识别途径的部分的损伤类型。
最近的证据表明,错误定位的DNA(例如,与细胞核相反,DNA非自然地出现在细胞的胞质部分)和受损的DNA(例如,通过癌症发展中发生的突变)被免疫系统用于识别感染或者患病细胞,而健康细胞中存在的基因组和线粒体DNA会被DNA识别途径忽略。在患病细胞中,细胞溶质DNA传感器蛋白已被证明参与检测细胞胞质溶胶中非自然发生的DNA。通过不同的核酸传感器检测此类DNA会转化为类似的反应,导致核因子kappa-B(NF-kB)和I型干扰素(IFNI型)信号传导,然后激活先天免疫系统成分。虽然已知病毒DNA的识别会诱导IFNI型反应,但最近才积累了检测DNA损伤可以启动免疫反应的证据。
位于核内体中的TLR9(Toll样受体9)是首批被确定参与DNA免疫识别的DNA传感器分子之一,经由衔接蛋白骨髓分化初级反应蛋白88(MYD88)而向下游发出信号。这种相互作用反过来激活丝裂原活化蛋白激酶(MAPK)和NF-kB。TLR9还通过经由浆细胞样树突状细胞(pDC)中的IkB激酶alpha(IKKalpha)来激活IRF7而诱导I型干扰素的产生。各种其他DNA免疫受体,包括IFI16(IFN-gamma诱导蛋白16)、cGAS(环状DMP-AMP合酶、DDX41(DEAD-box解旋酶41)以及ZBP1(Z-DNA结合蛋白1)与STING相互作用(IFN基因的刺激剂),其通过TBK1(TANK结合激酶1)而激活IKK复合物和IRF3。ZBP1还经由募集RIP1和RIP3(分别为受体相互作用蛋白1和3)而激活NF-kB。虽然解旋酶DHX36(DEAH-box解旋酶36)在复合物中与TRID相互作用以诱导NF-kB和IRF-3/7,但DHX9解旋酶刺激浆细胞样树突状细胞中的MYD88依赖性信号传导。DNA传感器LRRFIP1(富含亮氨酸的重复不能飞行的相互作用蛋白)与β-连环蛋白复合以激活IRF3的转录,而AIM2(黑色素瘤2中不存在)募集衔接蛋白ASC(凋亡斑点样蛋白)以诱导激活caspase-1的感染性复合物导致白介素-1β(Il-1beta)和IL-18的分泌(参见Gasser S.等人2017年文章的图1,出处同上,其提供了DNA损伤和DNA传感器导致炎性细胞因子产生和激活先天免疫受体的配体表达的途径的示意性概览。示出了非同源末端连接通路(橙色)、同源重组(红色)、炎性体(深绿色)、NF-kB和干扰素反应(浅绿色)的成员)。
负责激活癌症中DNA传感器通路的因素和机制目前尚未得到很好的阐明。重要的是要识别在疾病各个阶段的不同癌症类型中的与IFN的表达有关的肿瘤内DNA种类、传感器和通路。除了癌症的治疗目标外,这些因素还可能具有预后和预测价值。目前正在临床前试验中开发和测试新型DNA传感器通路激动剂和拮抗剂。这些化合物将有助于表征DNA传感器通路在癌症、自身免疫和其他潜在疾病的发病机制中的作用。
T细胞受体信号转导基因
可以在不同层面引发针对病原体的免疫反应:物理屏障(例如皮肤)可以将入侵者拒之门外。如果被破坏,先天免疫就会发挥作用;第一个并且快速的非特异性反应。如果这还不够,则会引发适应性免疫反应。这更加特异性,并且在第一次遇到病原体时需要时间来发展。淋巴细胞通过与来自先天免疫系统的活化抗原呈递细胞相互作用而被激活,并且还负责维持记忆以在下次遇到相同病原体时更快地做出反应。
由于淋巴细胞在激活时具有高度特异性和有效性,因此它们会因其识别自身的能力而受到负面选择,这一过程称为中心耐受。由于并非所有自身抗原都在选择位点表达,外周耐受机制也在进化,例如在没有共同刺激的情况下TCR的连接、抑制性共同受体的表达和Tregs的抑制。激活和抑制之间的平衡失调可能分别导致自身免疫性疾病,或免疫缺陷和癌症。
T细胞激活可以产生不同的功能结果,这取决于所涉及的T细胞类型的位置。CD8+T细胞分化为细胞毒性效应细胞,而CD4+T细胞可分化为Th1(IFNγ分泌和促进细胞介导的免疫)或Th2
(IL4/5/13分泌和促进B细胞和体液免疫)。分化为其他最近发现的T细胞亚群也是可能的,例如Tregs,它对免疫激活具有抑制作用(参见Mosenden R.和Tasken K.的“CyclicAMP-mediated immune regulation–Overview of mechanisms of action in T-cells”,Cell Signal,Vol.23,No.6,第1009-1016页,2011年,特别是图4,其中,T细胞激活及其通过PKA的调节,以及Tasken K.和Ruppelt A.的“Negative regulation of T-cell receptoractivation by the cAMP-PKA-Csk signaling pathway in T-cell lipid rafts”,FrontBiosci,Vol.11,第2929-2939页,2006年)。
PKA和PDE4调节的信号与TCR诱导的T细胞激活相交以微调其调节,具有相反的效果(参见Abrahamsen H.等人的“TCR-and CD28-mediated recruitment ofphosphodiesterase 4to lipid rafts potentiates TCR signaling”,J Immunol,Vol.173,第4847-4848页,2004年,特别是图6,其显示了PKA和PDE4对TCR激活的相反作用)。连接这些效应子的分子是环腺苷酸(cAMP),它是细胞外配体作用的细胞内第二信使。在T细胞中,它介导前列腺素、腺苷、组胺、β-肾上腺素能激动剂、神经肽激素和β-内啡肽的作用。这些细胞外分子与GPCR的结合导致它们的构象变化、刺激亚基的释放和随后的腺苷酸环化酶(AC)的激活,其将ATP水解为cAMP(参见Abrahamsen H.等人2004年文章的图6,出处同上)。虽然不是唯一的,但PKA是cAMP信号的主要效应器(参见Mosenden R.和Tasken K.,2011,出处同上,以及Tasken K.和Ruppelt A.,2006,出处同上)。在功能水平上,增加的cAMP水平导致T细胞中IFNγ和IL-2的产生减少(参见Abrahamsen H.等人,2004,出处同上)。除了干扰TCR激活外,PKA还有更多的效应器(参见Torheim E.A.的“ImmunityLeashed–Mechanisms of Regulation in the Human Immune System”,Thesis for thedegree of Philosophiae Doctor(PhD),The Biotechnology Centre of Ola,挪威奥斯陆大学(2009年)中的图15)。
在幼稚T细胞中,过度磷酸化的PAG将Csk靶向脂筏。经由Ezrin-EBP50-PAG支架复合体,PKA靶向Csk。经由PKA的特异性磷酸化,Csk可以负向调节Lck和Fyn以抑制它们的活性并下调T细胞活化(参见Abrahamsen H.等人2004年文章中的图6,出处同上)。在TCR激活后,PAG被去磷酸化,并且Csk从筏中释放出来。T细胞激活需要Csk的解离才能继续进行。在相同的时间过程中,Csk-G3BP复合物形成,并且似乎将Csk隔离在脂筏外(参见Mosenden R.和Tasken K.2011年的文章,出处同上,以及TaskenK.和RuppeltA.2006年的文章,出处同上)。
相比之下,组合的TCR和CD28刺激介导环核苷酸磷酸二酯酶PDE4向脂筏的募集,这增强了cAMP降解(参见Abrahamsen H.等人2004年的文章中的图6,出处同上)。因此,TCR诱导的cAMP产生被抵消,T细胞免疫反应增强。在仅有TCR刺激时,PDE4募集可能太低而无法完全降低cAMP水平,因并且此无法发生最大T细胞激活(参见Abrahamsen H.等人2004年的文章,出处同上)。
因此,通过主动抑制近端TCR信号,通过cAMP-PKA-Csk的信号被认为设置了T细胞激活的阈值(截止)。PDE的募集可以对抗这种抑制。组织或细胞类型的特异性调节是通过表达AC、PKA和PDE的多种亚型来实现的。如上所述,需要严格调节激活和抑制之间的平衡,以防止自身免疫性疾病、免疫缺陷和癌症的发展。
PDE4D7相关基因
磷酸二酯酶(PDE)提供了降解第二信使3'-5'-环AMP的唯一方法。因此,它们准备发挥关键的调整作用。因此,它们的表达、活性和细胞内位置的异常变化都可能导致特定疾病状态的潜在分子病理学。事实上,最近的研究表明,前列腺癌患者体内PDE基因突变较多,导致、cAMP、信号转导升高,并可能诱发前列腺癌。然而,不同细胞类型中不同的表达谱,加上每个PDE家族内复杂的异构体变体阵列,使得理解疾病进展过程中PDE表达异常变化和功能之间的联系变得具有挑战性。几项研究努力描述前列腺中PDE的补充,所有这些研究都识别出PDE4与其他PDE一起表达的显著水平,从而导致PDE4D7生物标志物的开发(参见Alvesde Inda M.等人,“Validation of Cyclic Adenosine MonophosphatePhosphodiesterase-4D7 for its Independent Contribution to Risk Stratificationin a Prostate Cancer Patient Cohort with Longitudinal Biological Outcomes”,Eur Urol Focus,Vol.4,No.3,第376-384页,2018年)。由于PDE4D7生物标志物已被证明是良好的预测因子,因此我们假设识别与PDE47生物标志物高度相关的标志物的能力也可能有助于预测某些癌症对象的结果。
基因的选择
基因列表最初是由我们选择用于前列腺癌对象的预测。在该文件中,表明它们对于结肠直肠癌对象的结果也具有预后价值。
识别出的免疫防御反应基因ZBP1和AIM2、APOBEC3A、CIAO1、DDX58、DHX9、IFI16、IFIH1、IFIT1、IFIT3、LRRFIP1、MYD88、OAS1、TLR8、ZBP1分别如下地被识别:一组538例前列腺癌症患者接受RP治疗,并且前列腺癌组织与临床(例如,病理格里森分级组(pGGG)、病理状态(pT阶段))以及相关结果参数(例如,生化复发(BCR)、转移性复发、前列腺癌特异性死亡(PCa死亡)、挽救性放疗(SRT)、挽救性雄激素剥夺治疗(SADT)、化疗(CTX))一起被存储。对于这些患者中的每一位,计算PDE4D7评分并将其分为四个PDE4D7评分类别(参见Alvesde Inda M.等人的文献,2018年,出处同上)。PDE4D7评分等级1代表具有最低PDE4D7表达水平的患者样本,而PDE4D7评分等级4代表具有最高PDE4D7表达水平的患者样本。然后研究了538名前列腺癌对象的RNASeq表达数据(TPM-每百万转录本),以了解PDE4D7评分等级1与4之间的差异基因表达。特别是,针对大约20,000个蛋白质编码转录本确定了PDE4D7评分1级患者的平均表达水平是否是PDE4D7评分4级患者平均表达水平的两倍以上。该分析得到具有PDE4D7得分类别1/PDE4D7得分类别4的比率>2的637个基因,在四个PDE4D7得分类别中的每个中,最小平均表达为1TPM。然后对这637个基因进一步进行分子路径分析(www.david.ncifcrf.gov),从而产生一系列富集注释簇。注释簇#2显示了具有对病毒的防御反应、病毒基因组复制的负调节以及I型干扰素信号传导的功能的30个基因中的富集(富集分数:10.8)。进一步的热图分析证实,这些免疫防御反应基因在PDE4D7评分1级患者样本中的表达普遍高于PDE4D7评分4级患者样本。具有对病毒的防御反应、病毒基因组复制的负调节以及I型干扰素信号传导功能的基因类别通过文献检索进一步富集到61个基因,以识别具有相同分子功能的其他基因。根据将死于前列腺癌的患者与未死于前列腺癌的患者区分开来的组合能力,从61个基因中进行了进一步选择,从而产生了优选的一组14个基因。结果发现,与总患者群组(#538)和在术后疾病复发后接受挽救性放疗(SRT)的151名患者的子群组相比,具有这些基因低表达的子群组中事件的数量(转移、前列腺癌特异性死亡)有所增加。
所识别的T细胞受体信号转导基因CD2、CD247、CD28、CD3E、CD3G、CD4、CSK、EZR、FYN、LAT、LCK、PAG1、PDE4D、PRKACA、PRKACB、PTPRC、以及ZAP70如下地被识别:一组538名前列腺癌患者接受了RP处置,并且前列腺癌组织与临床(例如,病理格里森分级组(pGGG)、病理状态(pT阶段))以及相关结果参数(例如,生化复发(BCR))、转移性复发、前列腺癌特异性死亡(PCa死亡)、挽救性放疗(SRT)、挽救性雄激素剥夺治疗(SADT)、化疗(CTX))一起被存储。对于这些患者中的每一位,计算PDE4D7评分并将其分为四个PDE4D7评分类别(参见Alves de Inda M.等人的文献,2018年,出处同上)。PDE4D7评分等级1代表具有最低PDE4D7表达水平的患者样本,而PDE4D7评分等级4代表具有最高PDE4D7表达水平的患者样本。然后研究了538名前列腺癌对象的RNASeq表达数据(TPM-每百万转录本),以了解PDE4D7评分等级1与4之间的差异基因表达。特别是,针对大约20,000个蛋白质编码转录本确定了PDE4D7评分1级患者的平均表达水平是否是PDE4D7评分4级患者平均表达水平的两倍以上。该分析得到具有PDE4D7得分类别1/PDE4D7得分类别4的比率>2的637个基因,在四个PDE4D7得分类别中的每个中,最小平均表达为1TPM。然后对这637个基因进一步进行分子路径分析(www.david.ncifcrf.gov),从而产生一系列富集注释簇。注释簇#6显示了17个基因的富集(富集分数:5.9),这些基因在原发性免疫缺陷和T细胞受体信号转导激活中发挥作用。进一步的热图分析证实,这些T细胞受体信号转导基因在来自PDE4D7评分1级患者样本中的表达普遍高于来自PDE4D7评分4级的患者。
识别的PDE4D7相关基因ABCC5、CUX2、KIAA1549、PDE4D、RAP1GAP2、SLC39A11、TDRD1和VWA2如下地被识别:我们在571名前列腺癌患者生成的RNAseq数据中近60,000个转录本上识别了一系列与该数据中已知生物标志物PDE4D7的表达有关的基因。571个样本中的这些基因中的任何基因的表达与PDE4D7之间的相关性通过皮尔森相关性完成,并且在正相关的情况下表示为0到1之间的值,或者在负相关的情况下表示为-1到0之间的值。作为用于计算相关系数的输入数据,我们使用PDE4D7评分(参见Alves de Inda M.等人2018年的文章,出处同上)和RNAseq确定的每个感兴趣基因的TPM基因表达值(见下文)。
在大约60000个转录本中的任何一个的表达与PDE4D7的表达之间确定的最大负相关系数为-0.38,而在大约60000个转录本的任何一个的表达与PDE4D7的表达之间确定的最大正相关系数为+0.56。我们选择了相关性范围为-0.31至-0.38以及+0.41至+0.56的基因。我们总共确定了77个符合这些特征的转录本。我们通过在由于术后生化复发接受补救性放疗(SRT)的186名患者的子群组中迭代测试Cox回归组合模型而从这77个转录本中选择了八个PDE4D7相关基因ABCC5、CUX2、KIAA1549、PDE4D、RAP1GAP2、SLC39A11、TDRD1和VWA2。测试的临床终点是SRT开始后前列腺癌特异性死亡。选择八个基因的边界条件是由多变量Cox回归中的p值对于模型中保留的所有基因<0.1的限制给出的。
术语“ABCC5”是指人类ATP结合盒亚家族C成员5基因(Ensembl:ENSG00000114770),例如,是指NCBI参考序列NM_001023587.2或NCBI参考序列NM_005688.3中定义的序列,特别地,SEQ ID NO:1或SEQ ID No:2中所示的核苷酸序列,其对应于上述ABCC5转录本的NCBI参考序列的序列,并且还涉及相应的氨基酸序列,例如在SEQ ID NO:3或SEQ ID No:4中所示的,其对应于NCBI蛋白质登录参考序列NP_001018881.1和NCBI蛋白质登录参考序列NP_005679中定义的编码ABCC5多肽的蛋白质序列。
术语“ABCC5”还包括显示与ABCC5高度同源性的核苷酸序列,例如,与SEQ ID NO:1或SEQ IDNo:2中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的核酸序列,或与SEQ ID NO:3或SEQ ID No:4所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的氨基酸序列,或与SEQ ID NO:3或SEQ ID No:4所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的编码氨基酸序列的核酸序列或与SEQ IDNo:1或SEQ ID No:2中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的由核酸序列编码的氨基酸序列。
术语“AIM2”是指黑色素瘤2基因缺失(Ensembl:ENSG00000163568),例如,是指NCBI参考序列NM_004833中所定义的序列,特别地,是指SEQ ID No:5中所示的核苷酸序列,其对应于上述AIM2转录本的NCBI参考序列的序列,并且还涉及相应的氨基酸序列,例如,如SEQ ID No:6中所示的,其对应于NCBI蛋白质登录参考序列NP_004824中定义的编码CD28多肽AIM2多肽的蛋白质序列。
术语“AIM2”还包括显示与AIM2高度同源性的核苷酸序列,例如,与SEQ ID NO:5中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的核酸序列,或与SEQ ID No:6所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的氨基酸序列,或与SEQ ID No:6所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的编码氨基酸序列的核酸序列或与SEQ ID No:5中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的由核酸序列编码的氨基酸序列。
术语“APOBEC3A”是指载脂蛋白BmRNA编辑酶催化亚基3A基因(Ensembl:ENSG00000128383),例如,是指NCBI参考序列NM_145699中所定义的序列,特别地,是指SEQID No:7中所示的核苷酸序列,其对应于上述APOBEC3A转录本的NCBI参考序列的序列,并且还涉及相应的氨基酸序列,例如,如SEQ ID No:8中所示的,其对应于NCBI蛋白质登录参考序列NP_663745中定义的编码APOBEC3A多肽的蛋白质序列。
术语“APOBEC3A”还包括显示与APOBEC3A高度同源性的核苷酸序列,例如,与SEQID NO:7中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的核酸序列,或与SEQ ID No:8所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的氨基酸序列,或与SEQ IDNo:8所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的编码氨基酸序列的核酸序列或与SEQ ID No:7中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的由核酸序列编码的氨基酸序列。
术语“CD2”是指分化簇2基因(Ensembl:ENSG00000116824),例如,是指NCBI参考序列NM_001767中所定义的序列,特别地,是指SEQ ID No:9中所示的核苷酸序列,其对应于上述CD2转录本的NCBI参考序列的序列,并且还涉及相应的氨基酸序列,例如,如SEQ ID No:10中所示的,其对应于NCBI蛋白质登录参考序列NP_001758中定义的编码CD2多肽的蛋白质序列。
术语“CD2”还包括显示与CD2高度同源性的核苷酸序列,例如,与SEQ ID NO:9中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的核酸序列,或与SEQ ID No:10所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的氨基酸序列,或与SEQ ID No:10所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的编码氨基酸序列的核酸序列或与SEQ ID No:9中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的由核酸序列编码的氨基酸序列。
术语“CD247”是指分化簇247基因(Ensembl:ENSG00000198821),例如,是指NCBI参考序列NM_000734或NCBI参考序列NM_198053中定义的序列,特别地,SEQ ID NO:11或SEQID No:12中说明的核苷酸序列,其对应于上述CD247转录本的NCBI参考序列的序列,并且还涉及相应的氨基酸序列,例如在SEQ ID NO:13或SEQ ID No:14中所示的,其对应于NCBI蛋白质登录参考序列NP_000725和NCBI蛋白质登录参考序列NP_932170中定义的编码CD247多肽的蛋白质序列。
术语“CD247”还包括显示与CD247高度同源性的核苷酸序列,例如,与SEQ ID NO:11或SEQ IDNo:12中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的核酸序列,或与SEQ ID NO:13或SEQ ID No:14所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的氨基酸序列,或与SEQ ID NO:13或SEQ ID No:14所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的编码氨基酸序列的核酸序列或与SEQID No:11或SEQ ID No:12中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的由核酸序列编码的氨基酸序列。
术语“CD28”是指分化簇28基因(Ensembl:ENSG00000178562),例如,是指NCBI参考序列NM_006139或NCBI参考序列NM_001243078中定义的序列,特别地,SEQ ID NO:15或SEQID No:16中说明的核苷酸序列,其对应于上述CD28转录本的NCBI参考序列的序列,并且还涉及相应的氨基酸序列,例如在SEQ ID NO:17或SEQ ID No:18中所示的,其对应于NCBI蛋白质登录参考序列NP_006130和NCBI蛋白质登录参考序列NP_001230007中定义的编码CD28多肽的蛋白质序列。
术语“CD28”还包括显示与CD28高度同源性的核苷酸序列,例如,与SEQ ID NO:15或SEQ IDNo:16中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的核酸序列,或与SEQ ID NO:17或SEQ ID No:18所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的氨基酸序列,或与SEQ ID NO:17或SEQ ID No:18所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的编码氨基酸序列的核酸序列或与SEQID No:15或SEQ ID No:16中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的由核酸序列编码的氨基酸序列。
术语“CD3E”是指分化簇3E基因(Ensembl:ENSG00000198851),例如,是指NCBI参考序列NM_000733中所定义的序列,特别地,是指SEQ ID No:19中所示的核苷酸序列,其对应于上述CD3E转录本的NCBI参考序列的序列,并且还涉及相应的氨基酸序列,例如,如SEQ IDNo:20中所示的,其对应于NCBI蛋白质登录参考序列NP_000724中定义的编码CD3E多肽的蛋白质序列。
术语“CD2”还包括显示与CD2高度同源性的核苷酸序列,例如,与SEQ ID NO:19中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的核酸序列,或与SEQ ID No:20所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的氨基酸序列,或与SEQ ID No:20所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的编码氨基酸序列的核酸序列或与SEQ ID No:19中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的由核酸序列编码的氨基酸序列。
术语“CD3G”是指分化簇3G基因(Ensembl:ENSG00000160654),例如,是指NCBI参考序列NM_000073中所定义的序列,特别地,是指SEQ ID No:21中所示的核苷酸序列,其对应于上述CD3G转录本的NCBI参考序列的序列,并且还涉及相应的氨基酸序列,例如,如SEQ IDNo:22中所示的,其对应于NCBI蛋白质登录参考序列NP_000064中定义的编码CD3G多肽的蛋白质序列。
术语“CD3G”还包括显示与CD3G高度同源性的核苷酸序列,例如,与SEQ ID NO:21中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的核酸序列,或与SEQ ID No:22所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的氨基酸序列,或与SEQ ID No:22所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的编码氨基酸序列的核酸序列或与SEQ ID No:21中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的由核酸序列编码的氨基酸序列。
术语“CD4”是指分化簇4基因(Ensembl:ENSG00000010610),例如,是指NCBI参考序列NM_000616中所定义的序列,特别地,是指SEQ ID No:23中所示的核苷酸序列,其对应于上述CD4转录本的NCBI参考序列的序列,并且还涉及相应的氨基酸序列,例如,如SEQ IDNo:24中所示的,其对应于NCBI蛋白质登录参考序列NP_000607中定义的编码CD4多肽的蛋白质序列。
术语“CD4”还包括显示与CD4高度同源性的核苷酸序列,例如,与SEQ ID NO:23中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的核酸序列,或与SEQ ID No:24所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的氨基酸序列,或与SEQ ID No:24所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的编码氨基酸序列的核酸序列或与SEQ ID No:23中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的由核酸序列编码的氨基酸序列。
术语“CIAO1”指胞浆铁硫组件1基因(Ensembl:ENSG00000144021),例如,是指NCBI参考序列NM_004804中所定义的序列,特别地,是指SEQ ID No:25中所示的核苷酸序列,其对应于上述CD2转录本的NCBI参考序列的序列,并且还涉及相应的氨基酸序列,例如,如SEQID No:26中所示的,其对应于NCBI蛋白质登录参考序列NP_663745中定义的编码CIAO1多肽的蛋白质序列。
术语“CIAO1”还包括显示与CIAO1高度同源性的核苷酸序列,例如,与SEQ ID NO:25中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的核酸序列,或与SEQ ID No:26所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的氨基酸序列,或与SEQ ID No:26所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的编码氨基酸序列的核酸序列或与SEQ ID No:25中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的由核酸序列编码的氨基酸序列。
术语“CSK”是指C-末端Src激酶基因(Ensembl:ENSG00000103653),例如,是指NCBI参考序列NM_004383中所定义的序列,特别地,是指SEQ ID No:27中所示的核苷酸序列,其对应于上述CSK转录本的NCBI参考序列的序列,并且还涉及相应的氨基酸序列,例如,如SEQID No:28中所示的,其对应于NCBI蛋白质登录参考序列NP_004374中定义的编码CSK多肽的蛋白质序列。
术语“CSK”还包括显示与CSK高度同源性的核苷酸序列,例如,与SEQ ID NO:27中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的核酸序列,或与SEQ ID No:28所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的氨基酸序列,或与SEQ ID No:28所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的编码氨基酸序列的核酸序列或与SEQ ID No:27中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的由核酸序列编码的氨基酸序列。
术语“CUX2”是指人类Cut Like同源盒2基因(Ensembl:ENSG00000111249),例如,是指NCBI参考序列NM_015267.3中所定义的序列,特别地,是指SEQ ID No:29中所示的核苷酸序列,其对应于上述CUX2转录本的NCBI参考序列的序列,并且还涉及相应的氨基酸序列,例如,如SEQ IDNo:30中所示的,其对应于NCBI蛋白质登录参考序列NP_056082.2中定义的编码CUX2多肽的蛋白质序列。
术语“CUX2”还包括显示与CUX2高度同源性的核苷酸序列,例如,与SEQ ID NO:29中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的核酸序列,或与SEQ ID No:30所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的氨基酸序列,或与SEQ ID No:30所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的编码氨基酸序列的核酸序列或与SEQ ID No:29中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的由核酸序列编码的氨基酸序列。
术语“DDX58”是指DExD/H-box解旋酶58基因(Ensembl:ENSG00000107201),例如,是指NCBI参考序列NM_014314中所定义的序列,特别地,是指SEQ ID No:31中所示的核苷酸序列,其对应于上述DDX58转录本的NCBI参考序列的序列,并且还涉及相应的氨基酸序列,例如,如SEQ ID No:32中所示的,其对应于NCBI蛋白质登录参考序列NP_055129中定义的编码DDX58多肽的蛋白质序列。
术语“DDX58”还包括显示与DDX58高度同源性的核苷酸序列,例如,与SEQ ID NO:31中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的核酸序列,或与SEQ ID No:32所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的氨基酸序列,或与SEQ ID No:32所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的编码氨基酸序列的核酸序列或与SEQ ID No:31中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的由核酸序列编码的氨基酸序列。
术语“DHX9”是指DExD/H-box解旋酶9基因(Ensembl:ENSG00000135829),例如,是指NCBI参考序列NM_001357中所定义的序列,特别地,是指SEQ ID No:33中所示的核苷酸序列,其对应于上述DHX9转录本的NCBI参考序列的序列,并且还涉及相应的氨基酸序列,例如,如SEQ ID No:34中所示的,其对应于NCBI蛋白质登录参考序列NP_001348中定义的编码DHX9多肽的蛋白质序列。
术语“DHX9”还包括显示与DHX9高度同源性的核苷酸序列,例如,与SEQ ID NO:33中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的核酸序列,或与SEQ ID No:34所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的氨基酸序列,或与SEQ ID No:34所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的编码氨基酸序列的核酸序列或与SEQ ID No:33中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的由核酸序列编码的氨基酸序列。
术语“EZR”是指Ezrin基因(Ensembl:ENSG00000092820),例如,是指NCBI参考序列NM_003379中所定义的序列,特别地,是指SEQ ID No:35中所示的核苷酸序列,其对应于上述CSK转录本的NCBI参考序列的序列,并且还涉及相应的氨基酸序列,例如,如SEQ ID No:36中所示的,其对应于NCBI蛋白质登录参考序列NP_003370中定义的编码EZR多肽的蛋白质序列。
术语“EZR”还包括显示与EZR高度同源性的核苷酸序列,例如,与SEQ ID NO:35中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的核酸序列,或与SEQ ID No:36所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的氨基酸序列,或与SEQ ID No:36所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的编码氨基酸序列的核酸序列或与SEQ ID No:35中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的由核酸序列编码的氨基酸序列。
术语“FYN”是指FYN原癌基因(Ensembl:ENSG00000010810),例如,是指NCBI参考序列NM_002037或NCBI参考序列NM_153047或NCBI参考序列NM_153048中定义的序列,特别地,是指如在SEQ ID NO:37或SEQ ID NO:38或SEQ ID NO:39所示的核苷酸序列,其对应于上述FYN转录本的NCBI参考序列的序列,并且还涉及相应的氨基酸序列,例如,如在SEQ ID NO:40或SEQ ID NO:41或SEQ ID NO:42中所示的序列,其对应于NCBI蛋白质登录参考序列NP_002028和NCBI蛋白质登录参考序列NP_694592中以及在NCBI蛋白质登录参考序列XP_005266949中定义的编码FYN多肽的蛋白质序列。
术语“FYN”还包括显示与FYN高度同源性的核苷酸序列,例如,与SEQ ID NO:37或SEQ ID NO:38或SEQ ID No:39中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的核酸序列,或与SEQ ID NO:42或SEQ ID NO:41或SEQ ID No:42所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的氨基酸序列,或与SEQ ID NO:40或SEQ ID NO:41或SEQ ID No:42所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的编码氨基酸序列的核酸序列或与SEQ ID No:37或SEQ ID NO:38或SEQ ID No:39中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的由核酸序列编码的氨基酸序列。
术语“IFI16”是指干扰素Gamma可诱导蛋白质16基因(Ensembl:ENSG00000163565),例如,是指NCBI参考序列NM_005531中所定义的序列,特别地,是指SEQID No:43中所示的核苷酸序列,其对应于上述IFI16转录本的NCBI参考序列的序列,并且还涉及相应的氨基酸序列,例如,如SEQ ID No:44中所示的,其对应于NCBI蛋白质登录参考序列NP_005522中定义的编码IFI16多肽的蛋白质序列。
术语“IFI16”还包括显示与IFI16高度同源性的核苷酸序列,例如,与SEQ ID NO:43中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的核酸序列,或与SEQ ID No:44所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的氨基酸序列,或与SEQ ID No:44所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的编码氨基酸序列的核酸序列或与SEQ ID No:43中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的由核酸序列编码的氨基酸序列。
术语“IFIH1”是指个解旋酶C结构域1基因的干扰素诱导的(Ensembl:ENSG00000115267),例如,是指NCBI参考序列NM_022168中所定义的序列,特别地,是指SEQID No:45中所示的核苷酸序列,其对应于上述IFIH1转录本的NCBI参考序列的序列,并且还涉及相应的氨基酸序列,例如,如SEQ ID No:46中所示的,其对应于NCBI蛋白质登录参考序列NP_071451中定义的编码IFIH1多肽的蛋白质序列。
术语“IFIH1”还包括显示与IFIH1高度同源性的核苷酸序列,例如,与SEQ ID NO:45中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的核酸序列,或与SEQ ID No:46所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的氨基酸序列,或与SEQ ID No:46所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的编码氨基酸序列的核酸序列或与SEQ ID No:45中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的由核酸序列编码的氨基酸序列。
术语“IFIT1”是指具有四肽重复序列1基因的干扰素诱导蛋白(Ensembl:ENSG00000185745),例如NCBI参考序列NM_001270929或NCBI参考序列NM_001548.5中定义的序列,特别地,核苷酸序列如SEQ ID NO:47或SEQ ID NO:48所示,其对应于上述IFIT1转录本的NCBI参考序列的序列,并且还涉及相应的氨基酸序列,例如SEQ ID NO:48IDNO:49或SEQ ID NO:50,其对应于NCBI蛋白质登录参考序列NP_001257858和NCBI蛋白质登录参考序列NP_001539中定义的编码IFIT1多肽的蛋白质序列。
术语“IFIT1”还包括显示与IFIT1高度同源性的核苷酸序列,例如,与SEQ ID NO:47或SEQ IDNo:48中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的核酸序列,或与SEQ ID NO:49或SEQ ID No:50所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的氨基酸序列,或与SEQ ID NO:49或SEQ ID No:50所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的编码氨基酸序列的核酸序列或与SEQID No:47或SEQ ID No:48中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的由核酸序列编码的氨基酸序列。
术语“IFIT3”是指具有四肽重复序列3基因的干扰素诱导蛋白(Ensembl:ENSG00000119917),例如,是指NCBI参考序列NM_术语“IFIT3”是指具有四肽重复序列3基因的干扰素诱导蛋白(Ensembl:ENSG00000119917),中所定义的序列,特别地,是指SEQ IDNo:51中所示的核苷酸序列,其对应于上述IFIT3转录本的NCBI参考序列的序列,并且还涉及相应的氨基酸序列,例如,如SEQ ID No:52中所示的,其对应于对IFIT3多肽进行编码的NCBI蛋白质登录参考序列中定义的蛋白质序列NP_001026853。
术语“IFIT3”还包括显示与IFIT3高度同源性的核苷酸序列,例如,与SEQ ID NO:51中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的核酸序列,或与SEQ ID No:52所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的氨基酸序列相同,或与SEQ ID No:52所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的编码氨基酸序列的核酸序列或与SEQ ID No:51中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的由核酸序列编码的氨基酸序列。
术语“KIAA1549”是指人类KIAA1549基因(Ensembl:ENSG00000122778),例如,是指NCBI参考序列NM_020910或NCBI参考序列NM_001164665中定义的序列,具体地,SEQ ID NO:53或SEQ ID No:54中说明的核苷酸序列,其对应于上述KIAA1549转录本的NCBI参考序列的序列,并且还涉及相应的氨基酸序列,例如在SEQ ID NO:55或SEQ ID No:56中所示的,其对应于对KIAA1549多肽进行编码的NCBI蛋白质登录参考序列NP_065961和NCBI蛋白质登录参考序列NP_001158137中定义的蛋白质序列。
术语“KIAA1549”还包括显示与KIAA1549高度同源性的核苷酸序列,例如,与SEQID NO:53或SEQ ID No:54中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的核酸序列,或与SEQ ID NO:55或SEQ ID No:56所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的氨基酸序列相同,或与SEQ ID NO:55或SEQ ID No:56所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的编码氨基酸序列的核酸序列或与SEQ ID No:53或SEQ ID No:54中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的由核酸序列编码的氨基酸序列。
术语“LAT”是指用于激活T细胞基因的接头(Ensembl:ENSG00000213658),例如,是指NCBI参考序列NM_001014987或NCBI参考序列NM_014387中定义的序列,具体地,SEQ IDNO:57或SEQ ID No:58中说明的核苷酸序列,其对应于上述LAT转录本的NCBI参考序列的序列,并且还涉及相应的氨基酸序列,例如在SEQ ID NO:59或SEQ ID No:60中所示的,其对应于对LAT多肽进行编码的NCBI蛋白质登录参考序列NP_001014987和NCBI蛋白质登录参考序列NP_055202中定义的蛋白质序列。
术语“LAT”还包括显示与LAT高度同源性的核苷酸序列,例如,与SEQ ID NO:57或SEQ ID No:58中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的核酸序列,或与SEQ ID NO:59或SEQ ID No:60所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的氨基酸序列相同,或与SEQ ID NO:59或SEQ ID No:60所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的编码氨基酸序列的核酸序列或与SEQ ID No:57或SEQ ID No:58中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的由核酸序列编码的氨基酸序列。
术语“LCK”是指LCK原癌基因(Ensembl:ENSG00000182866),例如,是指NCBI参考序列NM_005356中所定义的序列,特别地,是指SEQ ID No:61中所示的核苷酸序列,其对应于上述LCK转录本的NCBI参考序列的序列,并且还涉及相应的氨基酸序列,例如,如SEQ IDNo:62中所示的,其对应于对LCK多肽进行编码的NCBI蛋白质登录参考序列中定义的蛋白质序列NP_005347。
术语“LCK”还包括显示与LCK高度同源性的核苷酸序列,例如,与SEQ ID NO:61中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的核酸序列,或与SEQ ID No:62所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的氨基酸序列相同,或与SEQ ID No:62所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的编码氨基酸序列的核酸序列或与SEQ ID No:61中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的由核酸序列编码的氨基酸序列。
术语“LRRFIP1”指LRR结合FLII相互作用蛋白质1基因(Ensembl:ENSG00000124831),例如,是指NCBI参考序列NM_004735或NCBI参考序列NM_001137550或NCBI参考序列NM_001137553或NCBI参考序列NM_001137552中定义的序列,特别地,是指如在SEQ ID NO:63或SEQ ID NO:64或SEQ ID NO:65或SEQ ID NO:66所示的核苷酸序列,其对应于上述LRRFIP1转录本的NCBI参考序列的序列,并且还涉及相应的氨基酸序列,例如,如在SEQ ID NO:67或SEQ ID NO:68或SEQ ID NO:69或SEQ ID NO:70中所示的序列,其对应于对LRRFIP1多肽进行编码的NCBI蛋白质登录参考序列NP_004726和NCBI蛋白质登录参考序列NP_001131022和NCBI蛋白质登录参考序列NP_001131025中以及在NCBI蛋白质登录参考序列XP_001131024中定义的蛋白质序列。
术语“LRRFIP1”还包括显示与LRRFIP1高度同源性的核苷酸序列,例如,与SEQ IDNO:63或SEQ ID NO:64或SEQ ID NO:65或SEQ ID No:66中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的核酸序列,或与SEQID NO:67或SEQ ID NO:68或SEQ ID No:69或SEQ ID No:70所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的氨基酸序列相同,或与SEQ ID NO:67或SEQ ID NO:68或SEQ ID No:69或SEQ ID No:70所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的编码氨基酸序列的核酸序列或与SEQ ID NO:63或SEQ ID NO:64或SEQ ID NO:65或SEQ ID No:66中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的由核酸序列编码的氨基酸序列。
术语“MYD88”是指MYD88先天免疫信号转导转导衔接子基因(Ensembl:ENSG00000172936),例如,是指NCBI参考序列NM_001172567或NCBI参考序列NM_001172568或NCBI参考序列NM_001172569或NCBI参考序列NM_001172566或NCBI参考序列NM_0002468中定义的序列,特别地,是指如在SEQ ID NO:71或SEQ ID NO:72或SEQ ID NO:73或SEQ IDNO:74或SEQ ID NO:75所示的核苷酸序列,其对应于上述MYD88转录本的NCBI参考序列的序列,并且还涉及相应的氨基酸序列,例如,如在SEQ ID NO:76或SEQ ID NO:77或SEQ ID NO:78或SEQ ID NO:79或SEQ ID NO:80中所示的序列,其对应于对MYD88多肽进行编码的NCBI蛋白质登录参考序列NP_001166040和NCBI蛋白质登录参考序列NP_001166037中以及在NCBI蛋白质登录参考序列NP_002459中定义的蛋白质序列。
术语“MYD88”还包括显示与MYD88高度同源性的核苷酸序列,例如,与SEQ ID NO:71或SEQ ID NO:72或SEQ ID NO:73或SEQ ID NO:74或SEQ ID No:75中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的核酸序列,或与SEQ ID NO:76或SEQ ID NO:77或SEQ ID NO:78或SEQ ID No:79或SEQ ID No:80所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的氨基酸序列相同,或与SEQ ID NO:76或SEQ ID NO:77或SEQ ID NO:78或SEQ ID No:79或SEQ ID No:80所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的编码氨基酸序列的核酸序列或与SEQ ID NO:71或SEQ IDNO:72或SEQ ID NO:73或SEQ ID NO:74或SEQ IDNo:75中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的由核酸序列编码的氨基酸序列。
术语“OAS1”是指2'-5'-寡聚腺苷酸合成酶1基因(合集:ENSG00000089127),例如,是指NCBI参考序列NM_001320151或NCBI参考序列NM_002534或NCBI参考序列NM_001032409或NCBI参考序列NM_016816中定义的序列,特别地,是指如在SEQ ID NO:81或SEQ ID NO:82或SEQ ID NO:83或SEQ ID NO:84所示的核苷酸序列,其对应于上述OAS1转录本的NCBI参考序列的序列,并且还涉及相应的氨基酸序列,例如,如在SEQ ID NO:85或SEQ ID NO:86或SEQ ID NO:87或SEQ ID NO:88中所示的序列,其对应于对OAS1多肽进行编码的NCBI蛋白质登录参考序列NP_001307080和NCBI蛋白质登录参考序列NP_002525中以及在NCBI蛋白质登录参考序列NP_001027581以及在NCBI蛋白质登录参考序列NP058132中定义的蛋白质序列。
术语“OAS1”还包括显示与OAS1高度同源性的核苷酸序列,例如,与SEQ ID NO:81或SEQ ID NO:82或SEQ ID NO:83或SEQ ID No:84中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的核酸序列,或与SEQ IDNO:85或SEQ ID NO:86或SEQ ID No:87或SEQ ID No:88所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的氨基酸序列相同,或与SEQ ID NO:85或SEQ ID NO:86或SEQ ID No:87或SEQ ID No:88所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的编码氨基酸序列的核酸序列或与SEQ ID NO:81或SEQ ID NO:82或SEQ ID NO:83或SEQ ID No:84中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的由核酸序列编码的氨基酸序列。
术语“PAG1”是指具有糖鞘脂微结构域的磷蛋白膜锚1基因(Ensembl:ENSG00000076641),例如,是指NCBI参考序列NM_018440中所定义的序列,特别地,是指SEQID No:89中所示的核苷酸序列,其对应于上述PAG1转录本的NCBI参考序列的序列,并且还涉及相应的氨基酸序列,例如,如SEQ ID No:90中所示的,其对应于NCBI蛋白质登录参考序列NP_060910中定义的编码PAG1多肽的蛋白质序列。
术语“PAG1”还包括显示与PAG1高度同源性的核苷酸序列,例如,与SEQ ID NO:89中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的核酸序列,或与SEQ ID No:90所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的氨基酸序列,或与SEQ ID No:90所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的编码氨基酸序列的核酸序列或与SEQ ID No:89中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的由核酸序列编码的氨基酸序列。
术语“PDE4D”是指人磷酸二酯酶4D基因(合集:ENSG00000113448),例如,是指如NCBI参考序列NM_001104631或NCBI参考序列NM_001349242或NCBI参考序列NM_001197218或NCBI参考序列NM_006203或在NCBI参考序列NM_001197221或NCBI参考序列NM_001197220或NCBI参考序列NM_001197223或NCBI参考序列NM_001165899或NCBI参考序列NM_001165899中所定义的序列,特别地,是指如SEQ ID NO:91或SEQ ID NO:92或SEQ ID NO:93或SEQ ID NO:94或SEQ ID NO:95或SEQ ID NO:96或SEQ ID NO:97或SEQ ID NO:98或SEQID NO:99中所示的核苷酸序列,其对应于上述PDE4D转录本的NCBI参考序列的序列,并且还涉及例如,如在SEQ ID NO:100或SEQ ID NO:101或SEQ ID NO:102或在SEQ ID NO:10中3或SEQ ID No:104或SEQ ID No:105或SEQ ID No:106或SEQ ID No:107或SEQ ID No:108中所示的对应的氨基酸序列,其对应于NCBI蛋白质登录参考序列NP_001098101和NCBI蛋白质登录参考序列NP_001336171和NCBI蛋白质登录参考序列NP_001184147和NCBI蛋白质登录参考序列NP_006194和NCBI蛋白质登录参考序列NP_001184150和NCBI蛋白质登录参考序列NP_001184149和NCBI蛋白质登录参考序列NP_001184152和在NCBI蛋白质登录参考序列NP_001159371和NCBI蛋白质登录参考序列NP_001184148中定义的编码PDE4D多肽的蛋白质序列。
术语“PDE4D”还包括显示与PDE4D高度同源性的核苷酸序列,例如,与SEQ ID NO:91或SEQ ID NO:92或SEQ ID NO:93或SEQ ID NO:94或SEQ ID NO:95或SEQ ID NO:96或SEQID NO:97或SEQ ID NO:98或SEQ ID No:99中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的核酸序列或者与SEQ ID NO:100或SEQ ID NO:101或SEQ ID NO:102或SEQ ID NO:103或SEQ ID NO:104或SEQ ID NO:105或SEQ ID NO:106或SEQ ID NO:107或SEQ ID No:108中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的氨基酸序列或与SEQ IDNO:100或SEQ ID NO:101或SEQ ID NO:102或SEQ ID NO:103或SEQ ID NO:104或SEQ IDNO:105或SEQ ID NO:106或SEQ ID NO:107或SEQ ID No:108中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的编码氨基酸序列的核酸序列或者与SEQ ID NO:91或SEQ ID NO:92或SEQ ID NO:93或SEQ ID NO:94或SEQ IDNO:95或SEQ ID NO:96或SEQ ID NO:97或SEQ ID NO:98或SEQ ID No:99中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的由核酸序列编码的氨基酸序列。
术语“PRKACA”是指蛋白激酶cAMP激活的催化亚基α基因(Ensembl:ENSG00000072062),例如,是指NCBI参考序列NM_002730或NCBI参考序列NM_207518中所定义的序列,特别地,如在核苷酸序列如SEQ ID NO:109或SEQ ID NO:110中所示,其对应于上述PRKACA转录本的NCBI参考序列的序列,并且还涉及例如在SEQID中NO:111或SEQ ID No:112所示的相应氨基酸序列,其对应于NCBI蛋白质登录参考序列NP_002721和NCBI蛋白质登录参考序列NP_997401中定义的编码PRKACA多肽的蛋白质序列。
术语“PRKACA”还包括显示与PRKACA高度同源性的核苷酸序列,例如,与SEQ IDNO:109或SEQ ID No:110中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的核酸序列,或与SEQ ID NO:111或SEQ ID No:112所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的氨基酸序列,或与SEQ ID NO:111或SEQ ID No:112所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的编码氨基酸序列的核酸序列或与SEQ ID No:109或SEQ ID No:110中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的由核酸序列编码的氨基酸序列。
术语“PRKACB”是指蛋白激酶cAMP激活的催化亚基β基因(Ensembl:ENSG00000142875),例如,是指如NCBI参考序列NM_002731或NCBI参考序列NM_182948或NCBI参考序列NM_001242860或NCBI参考序列NM_001242859或NCBI参考序列NM_001242858或NCBI参考序列NM_001242862或NCBI参考序列NM_001242861或NCBI参考序列NM_001300915或NCBI参考序列NM_207578或NCBI参考序列NM_001242857或NCBI参考序列NM_001300917中所定义的序列,特别地,是指SEQ ID NO:113或SEQ ID NO:114或SEQ ID NO:115或SEQ ID NO:116或SEQ ID NO:117或SEQ ID NO:118或SEQ ID NO:119或SEQ ID NO:120或SEQ ID NO:121或SEQ ID NO:122或SEQ ID NO:123中所示的核苷酸序列,其对应于上述PRKACB转录本的NCBI参考序列的序列,并且还涉及,例如,如在SEQ ID NO:124或SEQ IDNO:125或SEQ ID NO:126或SEQ ID NO:127或SEQ ID NO:128或SEQ ID NO:129或SEQ IDNO:130或SEQ ID NO:131或SEQ ID NO:132或SEQ ID NO:133或SEQ ID No:134中所示的相应的氨基酸序列,其对应于NCBI登录参考序列NP_002722和NCBI蛋白质登录参考序列NP_891993和NCBI蛋白质登录参考序列NP_001229789和NCBI蛋白质登录参考序列NP_001229788和NCBI蛋白质登录参考序列NP_001229787和NCBI蛋白质登录参考序列NP_001229791和NCBI蛋白质登录参考序列NP_001229790和NCBI蛋白质登录参考序列NP_001287844和NCBI蛋白质登录参考序列NP_997461和NCBI蛋白质登录参考序列NP_001229786和NCBI蛋白质登录参考序列NP_001287846中定义的编码PRKACB多肽的蛋白质序列。
术语“PRKACB”还包括示出与PRKACB高度同源性的核苷酸序列,例如与SEQ ID NO:113或SEQ ID NO:114或SEQ ID NO:115或SEQ ID NO:116或SEQ ID NO:117或SEQ ID NO:118或SEQ ID NO:119或SEQ ID NO:120或SEQ ID NO:121或SEQ ID NO:122或SEQ ID No:123中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同核酸序列或者与如在SEQ ID NO:124或SEQ ID NO:125或SEQ ID NO:126或SEQ ID NO:127或SEQ ID NO:128或SEQ ID NO:129或SEQ ID NO:130或SEQ ID NO:131或SEQ ID NO:132或SEQ ID NO:133或SEQ ID No:134中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的氨基酸序列或者与在SEQID NO:124或SEQ ID NO:125或SEQ ID NO:126或SEQ ID NO:127或SEQ ID NO:128或SEQ IDNO:129或SEQ ID NO:130或SEQ ID NO:131或SEQ ID NO:132或SEQ ID NO:133或SEQ IDNo:134中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的编码氨基酸序列的核酸序列或者与在SEQ ID NO:113或SEQ ID NO:114或SEQ ID NO:115或SEQ ID NO:116或SEQ ID NO:117或SEQ ID NO:118或SEQ ID NO:119或SEQ ID NO:120或SEQ ID NO:121或SEQ ID No:122或在SEQ ID No:123中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的由核酸序列编码的氨基酸序列。
术语“PTPRC”是指C型蛋白酪氨酸磷酸酶受体基因(Ensembl:ENSG00000081237),例如,是指NCBI参考序列NM_002838或NCBI参考序列NM_080921中定义的序列,特别地,SEQID NO:135或SEQ ID No:136中说明的核苷酸序列,其对应于上述PTPRC转录本的NCBI参考序列的序列,并且还涉及相应的氨基酸序列,例如在SEQ ID NO:137或SEQ ID No:138中所示的,其对应于NCBI蛋白质登录参考序列NP_002829和NCBI蛋白质登录参考序列NP_563578中定义的编码PTPRC多肽的蛋白质序列。
术语“PTPRC”还包括显示与PTPRC高度同源性的核苷酸序列,例如,与SEQ ID NO:135或SEQ ID No:136中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的核酸序列,或与SEQ ID NO:137或SEQ ID No:138所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的氨基酸序列,或与SEQ ID NO:137或SEQ ID No:138所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的编码氨基酸序列的核酸序列或与SEQ ID No:135或SEQ ID No:136中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的由核酸序列编码的氨基酸序列。
术语“RAP1GAP2”指人类RAP1 GTP酶激活蛋白2基因(ENSG00000132359),例如,是指如在NCBI参考序列NM_015085或NCBI参考序列NM_001100398或NCBI参考序列NM_001330058中所定义的序列,特别地,如在SEQ ID NO:139或SEQ ID NO:140或SEQ ID NO:141所示的核苷酸序列,其对应于上述RAP1GAP2转录本的NCBI参考序列的序列,并且还涉及例如如在SEQ IDNO:142或SEQ ID NO:143或SEQ ID NO:144中所示的相应的氨基酸序列,其对应于NCBI蛋白质登录参考序列NP_055900和NCBI蛋白质登录参考序列NP_001093868和在的NCBI蛋白质登录参考序列NP_001316987中所定义的编码RAP1GAP2多肽的蛋白质序列。
术语“RAP1GAP2”还包括显示与RAP1GAP2高度同源性的核苷酸序列,例如,与SEQID NO:139或SEQ ID NO:140或SEQ ID No:141所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的核酸序列,或与SEQ ID NO:142或SEQ ID NO:143或SEQ ID No:144所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的氨基酸序列,或与SEQ ID NO:142或SEQ IDNO:143或SEQ ID No:144所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的编码氨基酸序列的核酸序列或与SEQ ID NO:139或SEQID NO:140或SEQ ID No:141中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的由核酸序列编码的氨基酸序列。
术语“SLC39A11”是指人类溶质载体家族39成员11基因(Ensembl:ENSG00000133195),例如,是指如在NCBI参考序列NM_139177或NCBI参考序列NM_001352692中所定义的序列,特别地,如在SEQ ID NO:145或SEQ ID No:146中所示的核苷酸序列,其对应于上述SLC39A11转录本的NCBI参考序列的序列,并且还涉及例如SEQ ID NO:147或SEQID NO:148中所示的相应氨基酸序列,其对应于NCBI蛋白质登录参考序列NP_631916和NCBI蛋白质登录参考序列NP_001339621中定义的编码SLC39A11多肽的蛋白质序列。
术语“SLC39A11”还包括显示与SLC39A11高度同源性的核苷酸序列,例如,与SEQID NO:145或SEQ ID No:146中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的核酸序列,或与SEQ ID NO:147或SEQ ID No:148所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的氨基酸序列,或与SEQ ID NO:147或SEQ ID No:148所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的编码氨基酸序列的核酸序列或与SEQ ID No:145或SEQ ID No:146中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的由核酸序列编码的氨基酸序列。
术语“TDRD1”是指人类都铎域包含1基因(Ensembl:ENSG00000095627),例如,是指NCBI参考序列NM_198795中定义的序列,特别地,是指SEQ ID No:149中所示的核苷酸序列,其对应于上述TDRD1转录本的NCBI参考序列的序列,并且还涉及例如SEQ ID NO:150中所示的相应氨基酸序列,其对应于NCBI蛋白质登录参考NP_942090中定义的编码TDRD1多肽的蛋白质序列。
术语“TDRD1”还包括显示与TDRD1高度同源性的核苷酸序列,例如,与SEQ ID NO:149中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的核酸序列,或与SEQ ID No:150所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的氨基酸序列,或与SEQ ID No:150所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的编码氨基酸序列的核酸序列或与SEQ ID No:149中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的由核酸序列编码的氨基酸序列。
术语“TLR8”是指类铎受体8基因(Ensembl:ENSG00000101916),例如,是指NCBI参考序列NM_138636或NCBI参考序列NM_016610中所定义的序列,特别地,是指SEQ ID NO:151或SEQ ID NO:152中所示的核苷酸序列,其对应于上述TLR8转录本的NCBI参考序列的序列,并且还涉及例如SEQ ID NO:153或在SEQ ID No:154中所示的相应的氨基酸序列,其对应于NCBI蛋白质登录参考序列NP_619542和NCBI蛋白质登录参考序列NP_057694中定义的编码TLR8多肽的蛋白质序列。
术语“TLR8”还包括显示与TLR8高度同源性的核苷酸序列,例如,与SEQ ID NO:151或SEQ ID No:152中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的核酸序列,或与SEQ ID NO:153或SEQ ID No:154所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的氨基酸序列,或与SEQ ID NO:153或SEQ ID No:154所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的编码氨基酸序列的核酸序列或与SEQ ID No:151或SEQ ID No:152中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的由核酸序列编码的氨基酸序列。
术语“VWA2”是指人Von Willebrand因子A域包含2基因(Ensembl:ENSG00000165816),例如,是指NCBI参考序列NM_001320804中定义的序列,特别地,是指SEQID No:155中所示的核苷酸序列,其对应于上述VWA2转录本的NCBI参考序列的序列,并且还涉及例如SEQ ID NO:156中所示的相应氨基酸序列,其对应于NCBI蛋白质登录参考NP_001307733中定义的编码VWA2多肽的蛋白质序列。
术语“VWA2”还包括显示与VWA2高度同源性的核苷酸序列,例如,与SEQ ID NO:155中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的核酸序列,或与SEQ ID No:156所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的氨基酸序列,或与SEQ ID No:156所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的编码氨基酸序列的核酸序列或与SEQ ID No:155中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的由核酸序列编码的氨基酸序列。
术语“ZAP70”指T细胞受体相关蛋白激酶70基因的Zeta链(Ensembl:ENSG00000115085),例如,是指NCBI参考序列NM_001079或NCBI参考序列NM_207519中定义的序列,特别地,是指SEQ ID NO:157或SEQ ID NO:158中所示的核苷酸序列,其对应于上述ZAP70转录本的NCBI参考序列的序列,并且还涉及例如在SEQ ID NO:159或SEQ ID NO:160中所示的相应氨基酸序列,其对应于NCBI蛋白质登录参考序列NP_001070和NCBI蛋白质登录参考序列NP_997402中定义的编码ZAP70多肽的蛋白质序列。
术语“ZAP70”还包括显示与ZAP70高度同源性的核苷酸序列,例如,与SEQ ID NO:157或SEQ ID No:158中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的核酸序列,或与SEQ ID NO:159或SEQ ID No:160所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的氨基酸序列,或与SEQ ID NO:159或SEQ ID No:160所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的编码氨基酸序列的核酸序列或与SEQ ID No:157或SEQ ID No:158中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的由核酸序列编码的氨基酸序列。
术语“ZBP1”是指Z-DNA结合蛋白1基因(Ensembl:ENSG00000124256),例如,如NCBI参考序列NM_030776或NCBI参考序列NM_001160418或NCBI参考序列NM_001160419中定义的序列,特别地,是指SEQ ID NO:161或SEQ ID NO:162或SEQ ID NO:163中所示的核苷酸序列,其对应于上述ZBP1转录本的NCBI参考序列的序列,并且还涉及例如在SEQ ID NO:164或SEQ ID NO:165或SEQ ID No:166中所示的相应的氨基酸序列,其对应于NCBI蛋白质登录参考序列NP_110403和NCBI蛋白质登录参考序列NP_001153890和NCBI蛋白质登录参考序列NP_001153891中定义的编码ZBP1多肽的蛋白质序列。
术语“ZBP1”还包括显示与BP1高度同源性的核苷酸序列,例如,与SEQ ID NO:161或SEQ ID NO:162或SEQ ID No:163所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的核酸序列,或与SEQ ID NO:164或SEQ IDNO:165或SEQ ID No:166所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的氨基酸序列,或与SEQ ID NO:164或SEQ ID NO:165或SEQ ID No:166所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的编码氨基酸序列的核酸序列或与SEQ ID NO:161或SEQ ID NO:162或SEQ ID No:163中所示的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的由核酸序列编码的氨基酸序列。
术语“生物样本”或“从对象获得的样本”是指通过本领域技术人员已知的合适方法从对象例如前列腺癌患者获得的任何生物材料。可以以临床上可接受的方式收集所使用的生物样本,例如以保存核酸(特别是RNA)或蛋白质的方式。
生物样本可以包括身体组织和/或液体,例如但不限于血液(或源自血液,例如血清、血浆或PBMC(外周血单核细胞))、汗液、唾液、尿液,以及针吸活检或切除活检。此外,生物样本可包含源自上皮细胞的细胞提取物或细胞群,所述上皮细胞例如癌性上皮细胞或源自疑似癌性组织的上皮细胞。生物样本可包含源自腺体组织的细胞群,例如,样本可源自男性对象的前列腺。此外,如果需要,可以从获得的身体组织和体液中纯化细胞,然后用作生物样本。在一些实现中,样本可以是组织样本、尿液样本、尿液沉渣样本、血液样本、唾液样本、精液样本、包括循环肿瘤细胞的样本、细胞外囊泡、含有前列腺分泌的外来体的样本,或细胞系或癌细胞系。
在一个特定的实现中,可以获得和/或使用活组织检查或切除样本。这样的样本可以包括细胞或细胞裂解物。
还可以设想将生物样本的内容物提交给富集步骤。例如,样本可以与特定细胞类型(例如前列腺细胞)的细胞膜或细胞器特异性的配体接触,例如用磁性颗粒功能化。由磁性颗粒浓缩的材料可随后用于如上文或下文所述的检测和分析步骤。
此外,细胞,例如肿瘤细胞,可以通过流体或液体样本例如血液、尿液等的过滤过程来富集。这样的过滤过程也可以与基于如上文所述的配体特异性相互作用的富集步骤组合。
术语“结直肠癌”是指结肠或直肠的癌症。结直肠癌始于结肠或直肠,它们构成肠道的很大一部分,而肠道又是胃肠(GI)系统的一部分。结直肠癌也可称为结肠癌或直肠癌,具体取决于其起源部位。然而,由于这些癌症的共同性质,它们通常被归为结直肠癌。“TNM”一词是指一种分类系统,用于描述恶性肿瘤的特征。
术语“T阶段”是指根据TNM分类系统的肿瘤程度和尺寸。T阶段可以具有T1属性(局部小肿瘤;尺寸通常<2厘米);T2(局部肿瘤较大;尺寸通常为2-5厘米);T3(较大的局部晚期肿瘤;尺寸通常>5厘米;T4(晚期/转移性肿瘤)。
术语“N分期”是指根据TNM分类系统肿瘤阳性淋巴结的存在和范围。N期可以具有NO属性(无肿瘤阳性淋巴结证据);N1(肿瘤淋巴结阳性的证据;N2/N3(更多数量的肿瘤阳性淋巴结);NX(无法评估淋巴结状态)。
术语“M分期”是指根据TNM分类系统的肿瘤转移的存在和程度。M分期可以具有属性M0(没有证据表明存在远处转移);M1(存在远处转移的证据)。
术语“存活”是指结直肠癌患者的存活。
优选的是:
所述六个或更多个基因表达水平包括:
一个或多个免疫防御反应基因,优选地,免疫防御基因中的两个或更多个,更优选地,三个或更多个,最优选地,所有,以及
一个或多个T细胞受体信号转导基因,优选地,T细胞受体信号转导基因中的两个或更多个,更优选地,三个或更多个,最优选地,所有,以及
一个或多个PDE4D7相关基因,优选地,PDE4D7相关基因中的两个或更多个,更优选地,三个或更多个,最优选地,所有。
在一个实施例中:
所述一个或多个免疫防御反应基因包括免疫防御基因中的三个或更多,优选地,六个或更多,更优选地,九个或更多,最优选,所有的,和/或
所述一个或多个T细胞受体信号转导基因包括T细胞受体信号转导基因中的三个或更多个,优选地六个或更多个,更优选地,九个或更多个,最优选地,所有,并且/或者
所述一个或多个PDE4D7相关基因包括所述PDE4D7相关基因中的三个或更多个,优选地,六个或更多个,最优选地,所有。
优选地,对结果的确定包括:
利用已经从结直肠癌对象的群组导出的回归函数来组合针对免疫防御反应基因中的两个或更多个,例如,2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个或所有免疫防御反应基因的第一基因表达谱,和/或
利用已经从前列腺癌对象的群组导出回归函数来组合针对T细胞受体信号转导基因中的两个或更多个,例如,2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个或所有T细胞受体信号转导基因的第二基因表达谱,和/或
利用已经从结直肠癌对象的群组导出的回归函数来组合针对PDE4D7相关基因的两个或更多个,例如,2个、3个、4个、5个、6个、7个或所有PDE4D7相关基因的第三基因表达谱。
利用已经从结直肠癌对象群组导出的回归函数来组合六个或更多个基因表达水平(例如,6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个或更多或所有)基因表达水平。
Cox比例风险回归允许分析几个风险因素对时间对测试事件(如生存)的影响。因此,风险因素可能是二分变量或离散变量,如风险评分或临床阶段,但也可能是连续变量,如生物标志物测量结果或基因表达值。终点(例如,死亡或疾病复发)的概率称为风险。除了关于例如患者群组中的对象是否达到测试终点的信息(例如,患者是否死亡),在回归分析中也考虑了到达终点的时间。危害建模为:H(t)=H0(t)·exp(w1·V1+w2·V2+w3·V3+…),其中,V1、V2、V3…是预测变量,并且H0(t)是基线危害,而H(t)是任何时间t时的危害。危害比(或到达事件的风险)由Ln[H(t)/H0(t)]=w1·V1+w2·V2+w3·V3+…表示,其中,系数或权重w1、w2、w3…通过Cox回归分析估计,并且可以用与逻辑回归分析类似的方式进行解读。
在一个特定的实现中,针对两个或更多个,例如2、3、4、5、6、7、8、9、10、11、12、13或全部,免疫防御反应的第一基因表达谱与回归函数的基因的组合如下地确定:
其中,w1到w14是权重,并且AIM2、APOBEC3A、CIAO1、DDX58、DHX9、IFI16、IFIH1、IFIT1、IFIT3、LRRFIP1、MYD88、OAS1、TLR8和ZBP1是免疫防御反应基因的表达水平。
在一个示例中,w1可以为大约-0.8至0.2,例如-0.32,w2可以为大约0.0至1.0,例如0.4743,w3可以为大约-0.2至0.8,例如0.2864,w4可以为大约-1.2至-0.2,比如-0.6683,w5可以为大约-0.9至0.1,例如-0.3665,w6可以为大约-0.4至0.6,例如0.1357,w7可以为大约0.0至1.0,例如0.505,w8可以为大约-0.6至0.4,例如-0.1024,w9可以为大约0.2至1.2,例如0.7229,w10可以为大约-0.3至0.7,例如0.2066,w11可以为大约-0.6至0.4,例如-0.1209,w12可以为大约-0.8至0.2,例如-0.2982,w13可以为大约-0.4至0.6,例如0.1005,并且w14可以为大约-0.7至0.3,例如-0.2253。
在一个特定的实现中,利用回归函数来组合针对T细胞受体信号转导基因中的两个或多个,例如,2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个或所有T细胞受体信号转导基因的第二基因表达谱是如下地确定的:
TCR_信号转导_模型:
(w15·C2)+(w16·CD247)+(w17·CD28)+(w18·CD3E)+(w19·CD3G)+ (2)
(w20·CD4)+(w21·CSK)+(w22·EZR)+(w23·FYN)+(w24·LAT)+(w25·LCK)+
(w26·PAG1)+(w27·PDE4D)+(w28·PRKACA)+(w29·PRKACB)+
(w30·PTPRC)+(w31·ZAP70)
其中,w15到w31是权重,并且CD2、CD247、CD28、CD3E、CD3G、CD4、CSK、EZR、FYN、LAT、LCK、PAG1、PDE4D、PRKACA、PRKACB、PTPRC、以及ZAP70是T-细胞受体信号基因的表达水平。
在一个示例中,w15可以为大约-1.2至-0.2,比如-0.72,w16可以为大约0.0至1.0,例如0.5222,w17可以为大约-0.1至0.9,例如0.4222,w18可以为约0.1至1.1,例如0.5981,w19可以为约-0.9至0.1,例如-0.3978,w20可以为大约0.0至1.0,例如0.5332,w21可以为大约-0.5至0.5,例如0.007001,w22可以为大约-0.3至0.7,例如0.1881,w23可以为大约-0.5至0.5,例如0.08063,w24可以为大约-0.7至0.3,例如-0.2047,w25可以为大约-0.4至0.6,例如0.1408,w26可以为大约-0.4至0.6,例如0.1038,w27可以为大约-0.6至0.4,例如-0.1477,w28可以为大约-0.3至0.7,例如0.2311,w29可以为大约-1.0到0.0,例如-0.4637,w30可以为大约-1.4至-0.4,例如-0.8881,w31可以为大约-0.3至0.7,例如0.1936。
在一个具体实现中,利用回归函数来组合针对PDE4D7相关基因中的两个或更多个,例如,2个、3个、4个、5个、6个、7个或所有PDE4D7相关基因的第三基因表达谱是如下地确定的:
PDE4D7_CORR_模型:
(w32·ABCC5)+(w33·CUX2)+(w34·KIAA1549)+(w35·PDE4D)+(w36·RAP1GAP2) (3)
+(w37·SLC39A11)+(w38·TDRD1)+(w39·VWA2)
其中,w32到w39是权重,并且ABCC5、CUX2、KIAA1549、PDE4D、RAP1GAP2、SLC39A11、TDRD1和VWA2是PDE4D7相关基因的表达水平。
在一个示例中,w32可以是大约-0.4到0.6,例如,0.09275,w33可以是大约-0.2到0.7,例如,0.2824,w34可以是大约-0.8到0.2,例如,-0.2594,w35可以是大约-0.5到0.5,比如-0.0217,w36可以是大约-0.4至0.6,例如,0.08958,w37可以是大约-.7至0.3,例如,-0.152,w38可以是大约-0.8至0.2,例如,-0.2854,且w39可以是大约-0.6到0.4,例如,-0.1182。
进一步优选地,确定对所述结果的预测还包括利用已经从结直肠癌对象的群组导出的回归函数来组合所述第一基因表达谱、利用已经从结直肠癌对象的群组导出的回归函数来组合所述第二基因表达谱以及已经从前列腺癌对象的群组导出的回归函数来组合所述第三基因表达谱。
在一个特定的实现中,对结果的预测如下地确定:
CRCAI_模型:
(w40·IDR_模型)+(w41·TCR信号转导模型)+(w42·PDE4D7_CORR_模型) (4)
其中,w40到w42是权重,IDR_模型是基于针对两个或多个,例如2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个或全部,免疫防御响应基因的表达谱的上述回归模型,TCR_信号转导_模型是基于针对两个或多个,例如2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个或全部,T细胞受体信号基因表达谱的上述回归模型,PDE4D7_CORR_模型是基于针对两个或多个,例如,2个、3个、4个、5个、6个、7个或全部,PDE4D7相关基因的表达谱的上述回归模型。
在一个示例中,w40可以是大约0.3到1.3,例如,0.7878,w41可以是大约0.3到1.3,例如,0.7699,并且w42可以是大约0.1到1.1,例如,0.6176。
在一种具体实现中,述六个或更多个基因的表达水平的组合计算如下:
CRCAI_6模型:
(wa·[基因A])+(wb·[基因B])+(wc·[基因C])+(wd·[基因D])+(we·[基因E])+(wf·[基因F])
其中wx表示相应基因基因X的权重。权重和基因组合的示例性值列于下表3-12中,然而,本领域技术人员有能力生成如本文定义的六个或更多个基因的其他组合并计算此类模型的各自权重。
基于对治疗反应的预测的值,也可以将对治疗反应的预测分类或归类为至少两个风险组中的一个。例如,可能有两个风险组,或三个风险组,或四个风险组,或四个以上的预定义风险组。每个风险组涵盖对治疗反应的预测的值的相应范围(非交叠)。例如,风险组可以指示特定临床事件发生的概率从0到<0.1或从0.1到<0.25或从0.25到<0.5或从0.5到1.0等。
进一步优选的是,结果预测的确定还基于从对象获得的一个或多个临床参数。
如上所述,已经研究了基于临床参数的各种指标。通过进一步将结果预测基于这样的临床参数,可以进一步改进预测。
优选地,临床参数包括以下中的一项或多项:(i)T阶段属性(T1、T2、T3或T4);(ii)N阶段属性(N0、N1或N2),以及;(iii)M阶段属性(M0,M1)。额外地或替代地,临床参数包括与结肠直肠癌的诊断和/或预后相关的一个或多个其他临床参数。
还优选的是,对结果预测的确定包括组合以下中的一项或多项:(i)针对一个或多个免疫防御反应基因的第一基因表达谱;(ii)针对所述一个或多个T细胞受体信号转导基因的(一个或多个)第二基因表达谱;(iii)针对所述一个或多个PDE4D7相关基因的(一个或多个)第三基因表达谱,以及;(iv)所述第一基因表达谱、所述第二基因表达谱、以及所述第三基因表达谱与从所述对象获得的一个或多个临床参数与从已经从结直肠癌对象的群组推导出的回归函数的组合。
在一个特定的实现中,对结果的预测如下地确定:
CRCAI&临床_模型:
(w40·IDR_模型)+(w41·TCR_信号转导_模型)+(w42·PDE4D7_CORR_ (5)
模型)+(w43·N_阶段_N1)+(w44·N_阶段_N2)
其中,w40到w44是权重,IDR_模型是基于针对两个或多个,例如2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个或所有,免疫防御响应基因的表达谱的上述回归模型,TCR_信号转导_模型是基于针对两个或多个,例如2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个或所有,T细胞受体信号转导基因表达谱的上述回归模型,PDE4D7_CORR_模型是基于针对两个或多个,例如,2、3、4、6、7或所有,PDE4D7相关基因的表达谱的上述回归模型,并且N_阶段_N1和N_阶段_N1是根据恶性肿瘤TNM分类的临床N阶段属性。
在一个实例中,w40可以是大约0.3至1.3,例如0.8098,w41可以是大约0.2至1.2,例如0.7297,w42可以是大约0.1至1.1,例如0.6221,w43可以是大约0.0至1.2,例如0.4875,并且w44可以是大约0.4至1.4,例如0.9216。
优选地,生物样本在治疗开始之前从对象获得。可以以结直肠癌组织中的mRNA或蛋白质的形式确定所述(一个或多个)基因表达谱。替代地,如果基因以可溶形式存在,则可以在血液中测定基因表达谱。
进一步优选的是,所述治疗是手术、放射疗法、细胞毒性化疗(CTX)、短程或长程化放疗法(CRT)、免疫疗法或其任何组合。
优选地,治疗反应的预测为对于治疗的有效性而言不太可能或可能,其中,基于预测推荐治疗,并且如果预测是否定的,则推荐的治疗包括以下中的一种或多种:(i)早于标准提供的治疗;(ii)有效剂量增加的放疗;(iii)辅助治疗,例如化疗;(iv)长程CRT(化放疗),以及;(iv)替代疗法,例如免疫疗法。
在本发明的另一方面中,提出了一种用于预测结直肠癌对象的结果的装置,包括:
输入部,其适于接收指示针对一个或多个,例如,1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个或所有,选自包括以下项的组的免疫防御反应基因中的每个的第一基因表达谱的数据:AIM2、APOBEC3A、CIAO1、DDX58、DHX9、IFI16、IFIH1、IFIT1、IFIT3、LRRFIP1、MYD88、OAS1、TLR8和ZBP1,所述(一个或多个)第一基因表达谱是在从对象获得的生物样本中确定的,和/或指示针对一个或多个,例如,1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个或所有,选自包括以下项的组的T细胞受体信号转导转导基因中的每个的第二基因表达谱的数据:CD2、CD247、CD28、CD3E、CD3G、CD4、CSK、EZR、FYN、LAT、LCK、PAG1、PDE4D、PRKACA、PRKACB、PTPRC、以及ZAP70,所述(一个或多个)第二基因表达谱是在从对象获得的生物样本中确定的,和/或指示针对一个或多个,例如,1个、2个、3个、4个、5个、6个、7个或所有,选自包括以下项的组的PDE4D7相关基因中的每个的第三基因表达谱的数据:ABCC5、CUX2、KIAA1549、PDE4D、RAP1GAP2、SLC39A11、TDRD1和VWA2,所述(一个或多个)第三基因表达谱是在从对象获得的生物样本中确定的,
处理器,其适于基于所述(一个或多个)第一基因表达谱、或所述(一个或多个)第二基因表达谱、或所述(一个或多个)第三基因表达谱、或者基于所述第一、所述第二和所述(一个或多个)第三基因表达谱来确定对结果的预测,以及
任选地,提供单元,其适于向医疗护理人员或对象提供预测。
在本发明的另一方面中,提供了一种包括指令的计算机程序产品,当所程序由计算机运行时,所述指令使计算机执行包括以下操作的方法:
接收指示针对一个或多个,例如,1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个或所有,选自包括以下项的组的免疫防御反应基因中的每个的第一基因表达谱的数据:AIM2、APOBEC3A、CIAO1、DDX58、DHX9、IFI16、IFIH1、IFIT1、IFIT3、LRRFIP1、MYD88、OAS1、TLR8和ZBP1,所述(一个或多个)第一基因表达谱是在从结直肠癌对象获得的生物样本中确定的,和/或指示针对一个或多个,例如,1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个或所有,选自包括以下项的组的T细胞受体信号转导转导基因中的每个的第二基因表达谱的数据:CD2、CD247、CD28、CD3E、CD3G、CD4、CSK、EZR、FYN、LAT、LCK、PAG1、PDE4D、PRKACA、PRKACB、PTPRC、以及ZAP70,所述(一个或多个)第二基因表达谱是在从结直肠癌对象对象获得的生物样本中确定的,和/或指示针对一个或多个,例如,1个、2个、3个、4个、5个、6个、7个或所有,选自包括以下项的组的PDE4D7相关基因中的每个的第三基因表达谱的数据:ABCC5、CUX2、KIAA1549、PDE4D、RAP1GAP2、SLC39A11、TDRD1和VWA2,所述(一个或多个)第三基因表达谱是在从结直肠癌对象获得的生物样本中确定的,
基于所述(一个或多个)第一基因表达谱、或所述(一个或多个)第二基因表达谱、或所述(一个或多个)第三基因表达谱、或者基于所述第一、所述第二和所述(一个或多个)第三基因表达谱来确定对所述对象的结果的预测,并且
任选地,向医疗护理人员或对象提供所述预测。
在本发明的另一方面中,提出了一种诊断套件,
包括:
至少一个引物和/或探针,其用于确定从对象获得的生物样本中选自第一基因表达谱、第二基因表达谱和第三基因表达谱的六个或更多个基因表达水平,其中,所述六个或更多个基因表达水平包括选自第三基因表达谱的至少一个或多个基因表达水平和选自第一和/或第二基因表达谱的至少一个或多个基因表达水平,其中,
所述第一基因表达谱包括选自包括以下项的组的免疫防御反应基因:AIM2、APOBEC3A、CIAO1、DDX58、DHX9、IFI16、IFIH1、IFIT1、IFIT3、LRRFIP1、MYD88、OAS1、TLR8、以及ZBP1;
所述第二基因表达谱包括选自包括以下项的组的T细胞受体信号转导基因:CD2、CD247、CD28、CD3E、CD3G、CD4、CSK、EZR、FYN、LAT、LCK、PAG1、PDE4D、PRKACA、PRKACB、PTPRC、以及ZAP70;并且
所述第三基因表达谱包括选自包括以下项的组的PDE4D7相关基因:ABCC5、CUX2、KIAA1549、PDE4D、RAP1GAP2、SLC39A11、TDRD1、以及VWA2;并且
任选地,根据权利要求11所定义的装置或根据权利要求12所定义的计算机程序产品。
替代地,公开了一种诊断套件,其包含:
至少一个引物和探针,其用于在从对象获得的生物样本中确定针对从包括以下项的组中选择的一个或多个,例如,1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个或者全部,免疫防御反应基因中的每个的第一基因表达谱:AIM2、APOBEC3A、CIAO1、DDX58、DHX9、IFI16、IFIH1、IFIT1、IFIT3、LRRFIP1、MYD88、OAS1、TLR8和ZBP1,和/或
至少一个引物和探针,其用于在从所述对象获得的生物样本中确定针对从包括以下项的组中选择的一个或多个,例如,1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个或所有,T细胞受体信号转导转导基因中的中的每个的(一个或多个)第二基因表达谱的确定结果:CD2、CD247、CD28、CD3E、CD3G、CD4、CSK、EZR、FYN、LAT、LCK、PAG1、PDE4D、PRKACA、PRKACB、PTPRC、以及ZAP70,和/或
至少一个引物和/或探针,用于在从所述对象获得的生物样本中确定针对从包括以下项的组中选择的一个或多个,例如,1个、2个、3个、4个、5个、6个、7个种或所有,PDE4D7相关基因中的每个的基因表达谱:ABCC5、CUX2、KIAA1549、PDE4D、RAP1GAP2、SLC39A11、TDRD1和VWA2,以及
任选地,根据权利要求11所定义的装置或根据权利要求12所定义的计算机程序产品。
在本发明的另一方面中,提出了如权利要求13所定义的套件的使用。
优选的是,根据权利要求14所述的使用是在预测结肠直肠癌对象的结果的方法中。
在本发明的另一方面中,提出了一种方法,其包括:
接收从结直肠癌对象获得的一个或多个生物样本,
使用根据权利要求13所述的套件来确定选自第一基因表达谱、第二基因表达谱和第三基因表达谱的六个或更多个基因表达水平,其中,所述六个或更多个基因表达水平包括选自第三基因表达谱的至少一个或多个基因表达水平和选自第一和/或第二基因表达谱的至少一个或多个基因表达水平,其中,
所述第一基因表达谱包括选自包括以下项的组的免疫防御反应基因:AIM2、APOBEC3A、CIAO1、DDX58、DHX9、IFI16、IFIH1、IFIT1、IFIT3、LRRFIP1、MYD88、OAS1、TLR8、以及ZBP1;
所述第二基因表达谱包括选自包括以下项的组的T细胞受体信号转导基因:CD2、CD247、CD28、CD3E、CD3G、CD4、CSK、EZR、FYN、LAT、LCK、PAG1、PDE4D、PRKACA、PRKACB、PTPRC、以及ZAP70;并且
所述第三基因表达谱包括选自包括以下项的组的PDE4D7相关基因:ABCC5、CUX2、KIAA1549、PDE4D、RAP1GAP2、SLC39A11、TDRD1、以及VWA2;
替代地,提出了一种方法,包括:
接收从结直肠癌对象获得的一个或多个生物样本,
使用根据权利要求13所述的套件来在从所述对象获得的生物样本中确定针对从包括以下项的组中选择的一个或多个,例如,1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个或者全部,免疫防御反应基因中的每个的第一基因表达谱:AIM2、APOBEC3A、CIAO1、DDX58、DHX9、IFI16、IFIH1、IFIT1、IFIT3、LRRFIP1、MYD88、OAS1、TLR8和ZBP1,并且/或者
使用如权利要求13所定义的套件来在从对象获得的生物样本中确定针对从包括以下项的组中选择的一个或多个,例如,1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个或所有,T细胞受体信号转导转导基因中的中的每个的(一个或多个)第二基因表达谱:CD2、CD247、CD28、CD3E、CD3G、CD4、CSK、EZR、FYN、LAT、LCK、PAG1、PDE4D、PRKACA、PRKACB、PTPRC、以及ZAP70,并且/或者
使用根据权利要求13所述的套件来在从所述对象获得的生物样本中确定针对从包括以下项的组中选择的一个或多个,例如,1个、2个、3个、4个、5个、6个、7个种或所有,PDE4D7相关基因中的每个的基因表达谱:ABCC5、CUX2、KIAA1549、PDE4D、RAP1GAP2、SLC39A11、TDRD1和VWA2。
在本发明的另一方面中,选自第一基因表达谱、第二基因表达谱和第三基因表达谱的六个或更多个基因表达水平的使用,其中,所述六个或更多个基因表达水平包括选自第三基因表达谱的至少一个或多个基因表达水平和选自第一和/或第二基因表达谱的至少一个或多个基因表达水平,其中,在预测结直肠癌对象的结果的方法中,所述第一基因表达谱包括选自包括以下项的组的免疫防御反应基因:AIM2、APOBEC3A、CIAO1、DDX58、DHX9、IFI16、IFIH1、IFIT1、IFIT3、LRRFIP1、MYD88、OAS1、TLR8和ZBP1,所述第二基因表达谱包括选自包括以下项的组的T细胞受体信号转导基因:CD2、CD247、CD28、CD3E、CD3G、CD4、CSK、EZR、FYN、LAT、LCK、PAG1、PDE4D、PRKACA、PRKACB、PTPRC、所述第三基因表达谱包括选自包括以下项的组的PDE4D7相关基因:ABCC5、CUX2、KIAA1549、PDE4D、RAP1GAP2、SLC39A11、TDRD1和VWA2,包括:
基于所述六个或更多基因表达水平来确定对结果的预测,并且
任选地,向医疗护理人员或对象提供所述预测。
替代地,所述方法在预测结直肠癌对象的结果的方法中使用:针对一个或多个,例如,1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个或所有,选自包括以下项的组中的每个的免疫防御反应基因的第一基因表达谱:AIM2、APOBEC3A、CIAO1、DDX58、DHX9、IFI16、IFIH1、IFIT1、IFIT3、LRRFIP1、MYD88、OAS1、TLR8和ZBP1;以及/或者针对一个或多个,例如,1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个或所有,选自包括以下项的组中的每个的T细胞受体信号转导中的每个的第二基因表达谱:CD2、CD247、CD28、CD3E、CD3G、CD4、CSK、EZR、FYN、LAT、LCK、PAG1、PDE4D、PRKACA、PRKACB、PTPRC、以及ZAP70;以及/或者针对一个或多个,例如,1个、2个、3个、4个、5个、6个、7个或所有,选自包括以下项的组中的每个的PDE4D7相关基因的第三基因表达谱:PDE4D、RAP1GAP2、SLC39A11、TDRD1,和VWA2,包括:
基于所述(一个或多个)第一基因表达谱、或所述(一个或多个)第二基因表达谱、或所述(一个或多个)第三基因表达谱、或者基于所述第一、所述第二和所述(一个或多个)第三基因表达谱来确定对结果的预测,并且
任选地,基于所述预测或所述个性化向医疗护理人员或所述对象提供所述预测或所述个性化或治疗推荐。
应该理解,根据权利要求1所述的方法、根据权利要求11所述的装置、根据权利要求12的所述计算机程序产品、根据权利要求13所述的诊断套件、根据权利要求14所述的诊断套件的用途、根据权利要求16所述的方法,以及根据权利要求17所述的第一基因表达谱、第二基因表达谱和第三基因表达谱的使用具有相似和/或相同的优选实施例,特别是如从属权利要求中所定义的。
应该理解,本发明的优选实施例也可以是从属权利要求或以上实施例与各自的独立权利要求的任何组合。
参考本文下文中所描述的实施例,本发明的这些和其他方面将显而易见并将得以阐述。
附图说明
在以下附图中:
图1示意性且示例性地示出了预测结直肠癌对象的结果的方法的实施例的流程图,
图2示出了168名患者TCGA结直肠癌群组中的IDR_模型的Kaplan-Meier曲线(用于开发IDR_模型的训练集),
图3示出了83名患者TCGA结直肠癌群组中的IDR_模型的Kaplan-Meier曲线(测试集用于验证在168名患者训练集上开发的IDR_模型),
图4示出了168名患者TCGA结直肠癌群组中的TCR_信号转导_模型的Kaplan-Meier曲线(用于开发TCR_信号转导_模型的训练集),
图5示出了83名患者TCGA结直肠癌群组中的TCR_信号转导_模型的Kaplan-Meier曲线(测试集用于验证在168名患者训练集上开发的TCR_信号转导_模型),
图6示出了168名患者TCGA结直肠癌群组中的PDE4D7_CORR_模型的Kaplan-Meier曲线(用于开发PDE4D7_CORR_模型的训练集),
图7示出了83名患者TCGA结直肠癌群组中的PDE4D7_CORR_模型的Kaplan-Meier曲线(测试集用于验证在168名患者训练集上开发的PDE4D7_CORR_模型),
图8示出了168名患者TCGA结直肠癌群组中的CRCAI_模型的Kaplan-Meier曲线(训练集用于开发CRCAI_模型),
图9示出了83名患者TCGA结直肠癌群组中的CRCAI_模型的Kaplan-Meier曲线(测试集用于验证在168名患者训练集上开发的CRCAI_模型),
图10示出了168名患者TCGA结直肠癌群组中的CRCAI&临床_模型的Kaplan-Meier曲线(训练集用于开发CRCAI&临床_模型),
图11示出了83名患者TCGA结直肠癌群组中CRCAI&临床_模型的Kaplan-Meier曲线(测试集用于验证在168名患者训练集上开发的CRCAI&临床_模型),
图12示出了从GSE41248数据集导出的结直肠癌群组中CRCAI_模型的Kaplan-Meier曲线。测试的临床终点是总体死亡,
图13示出了从GSE41248数据集导出的结直肠癌群组中CRCAI_模型的Kaplan-Meier曲线,测试的临床终点是癌症特异性死亡,
图14示出了从GSE41248数据集导出的结直肠癌群组中CRCAI&临床_模型的Kaplan-Meier曲线。测试的临床终点是总体死亡,并且
图15示出了从GSE41248数据集导出的结直肠癌群组中CRCAI&临床_模型的Kaplan-Meier曲线。测试的临床终点是癌症特异性死亡。
具体实施方式
结果预测概述
图1示意性且示例性地示出了预测结直肠癌对象的结果的方法的实施例的流程图。
该方法开始于步骤S100。
在步骤S102,从被诊断为患有结直肠癌的第一组患者(对象)中的每个患者获得生物样本。优选地,在获得生物样本后的一段时间内对这些结直肠癌患者执行了结直肠癌监测,例如至少一年,或至少两年,或约五年。
在步骤S104,针对从第一组患者获得的每个生物样本,例如,通过对从每个生物样本中提取的RNA进行RT-qPCR(实时定量PCR),来获得针对一个或多个,例如,1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个或所有,选自包括以下项的组中的每个的免疫防御反应基因的第一基因表达谱:AIM2、APOBEC3A、CIAO1、DDX58、DHX9、IFI16、IFIH1、IFIT1、IFIT3、LRRFIP1、MYD88、OAS1、TLR8和ZBP1,并且/或者针对一个或多个,例如,1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个或所有,选自包括以下项的组中的每个的T细胞受体信号转导中的每个的第二基因表达谱:CD2、CD247、CD28、CD3E、CD3G、CD4、CSK、EZR、FYN、LAT、LCK、PAG1、PDE4D、PRKACA、PRKACB、PTPRC、以及ZAP70,并且/或者针对一个或多个,例如,1个、2个、3个、4个、5个、6个、7个或所有,选自包括以下项的组中的每个的PDE4D7相关基因的第三基因表达谱:PDE4D、RAP1GAP2、SLC39A11、TDRD1,和VWA2。示例性基因表达谱包括两个或更多个基因中每个的表达水平(例如,值),其可以使用针对一组参考基因(例如B2M、HPRT1、POLR2A和/或PUM1)中的每个的值而被标准化。在一个实现方式中,针对第一基因表达谱和/或第二基因表达谱和/或第三基因表达谱的两个或多个基因中的每个的基因表达水平相对于选自包括以下项的组的一个或多个参考基因而被标准化:ACTB、ALAS1、B2M、HPRT1、POLR2A、PUM1、RPLP0、TBP、TUBA1B和/或YWHAZ,例如,这些参考基因中的至少一个,或者至少两个,或者至少三个,或者优选所有。
在步骤S106,基于针对从第一组患者获得的生物样本中的至少一些获得并且从监测中获得的针对两个或多个免疫防御反应基因,AIM2、APOBEC3A、CIAO1、DDX58、DHX9、IFI16、IFIH1、IFIT1、IFIT3、LRRFIP1、MYD88、OAS1、TLR8和/或ZBP1的第一表达谱,针对两个或更多个T细胞受体信号转导基因CD2、CD247、CD28、CD3E、CD3G、CD4、CSK、EZR、FYN、LAT、LCK、PAG1、PDE4D、PRKACA、PRKACB、PTPRC和/或ZAP70的第二基因表达谱,以及针对两个或多个PDE4D7相关基因ABCC5、CUX2、KIAA1549、PDE4D、RAP1GAP2,SLC39A11、TDRD1和/或VWA2的第三基因表达谱,来确定用于分配对结果的预测的回归函数。在一个特定实现方式中,所述回归函数是如以上公式(4)中指定的那样确定的。
在步骤S108,从患者(对象或个体)获得生物样本。患者可以是新患者或第一组患者中的一个。
在步骤S1110,例如,通过对生物样本执行PCR,来获得针对一个或多个,例如,1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个或所有,选自包括以下项的组中的每个的免疫防御反应基因的第一基因表达谱:AIM2、APOBEC3A、CIAO1、DDX58、DHX9、IFI16、IFIH1、IFIT1、IFIT3、LRRFIP1、MYD88、OAS1、TLR8和ZBP1,并且/或者针对一个或多个,例如,1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个或所有,选自包括以下项的组中的每个的T细胞受体信号转导中的每个的第二基因表达谱:CD2、CD247、CD28、CD3E、CD3G、CD4、CSK、EZR、FYN、LAT、LCK、PAG1、PDE4D、PRKACA、PRKACB、PTPRC、以及ZAP70,并且/或者针对一个或多个,例如,1个、2个、3个、4个、5个、6个、7个或所有,PDE4D7相关基因的第三基因表达谱。在一个实现方式中,针对第一基因表达谱和/或第二基因表达谱和/或第三基因表达谱的两个或多个基因中的每个的基因表达水平相对于选自包括以下项的组的一个或多个参考基因而被标准化:ACTB、ALAS1、B2M、HPRT1、POLR2A、PUM1、RPLP0、TBP、TUBA1B和/或YWHAZ,例如,这些参考基因中的至少一个,或者至少两个,或者至少三个,或者优选所有。这与步骤S104基本相同。
在步骤S112,使用所述回归函数为患者确定基于第一基因表达谱、第二基因表达谱和第三基因表达谱的结果预测。这将在后面的描述中更详细地描述。
在S114,可以基于预测或个性化来向例如患者或其监护人、医生或另一医护人员提供治疗建议。为此,可以基于预测或个性化的值将预测或个性化分类到一组预定义的风险组中的一个。在一个特定的实现方式中,治疗可以是放疗并且对治疗反应的预测对于治疗的有效性可以是不太可能或可能。如果预测为不太可能,推荐的治疗可能包括以下一项或多项:(i)比标准更早提供的放疗;(ii)有效剂量增加的放疗;(iii)辅助治疗,例如化疗;(iv)长程CRT(化放疗),以及;(iv)替代疗法,例如免疫疗法。
该方法在S116结束。
在一个实施例中,步骤S104和S110中的基因表达谱是通过使用两个或多个引物和/或探针和/或其两个或更多个集合检测mRNA表达来确定的。
在一个实施例中,步骤S104和S110还包括分别从第一组患者和患者获得临床参数。临床参数可包括以下中的一项或多项:(i)T阶段属性(T1、T2、T3或T4);(ii)N阶段属性(N0、N1或N2),以及;(iii)M阶段属性(M0,M1)。额外地或替代地,临床参数包括与结肠直肠癌的诊断和/或预后相关的一个或多个其他临床参数。然后,用于分配在步骤S106中确定的结果的预测的回归函数还基于从第一组患者中的至少一些患者获得的一个或多个临床参数。在步骤S112中,对结果的预测还基于从患者获得的一个或多个临床参数,例如N阶段属性,并且使用回归函数为患者确定。在一个特定实现方式中,所述回归函数是如以上公式(5)中指定的那样确定的。
基于与治疗后生存结果的显著相关性,我们期望所识别的分子将为原发性结直肠癌的治疗有效性提供预测价值。
结果
对于每个基因,获得了从TCGA数据库下载中提供的log2表达值(TCGA结直肠腺癌,TCGA Colorectal Adenocarcinoma,Firehose legacy,http://linkedomics.org/login.php,2020年3月6日访问)。
通过计算将每个基因的log2表达值转换为z分数:
其中,log2_基因是每个基因的log2基因表达值,平均_样本是所有样本中log2_基因值的数学平均值,stdev_样本是所有样本中log2_基因值的标准差。
此过程将TPM_log2_norm值分布在均值0附近,标准差为1。
为了对感兴趣的基因进行多变量分析,我们使用每个基因的log2_基因变换后的z分数值作为输入。
Cox回归分析
然后我们开始测试14个免疫防御反应基因的组合、17个T细胞受体信号转导基因的组合、8个PDE4D7相关基因的组合以及它们的组合是否会表现出针对结直肠癌更多的预后价值。通过Cox回归,我们分别对14个免疫防御反应基因、17个T细胞受体信号转导基因和8个PDE4D7相关基因的表达水平对377名结直肠癌患者的TCGA群组中的总体存活率进行了建模。
在TCGA结直肠癌群组中,仅包含组合了临床参数、基因表达值和生存信息的样本。在这个子集中,我们只纳入了来自非转移性疾病(m0)患者的样本,总共有251名患者。这251名患者被随机分为3组。群组1(n=168)用作训练群组,由1+2组组成。群组2(n=83)包括组3,用于验证源自训练组的风险模型。
Cox回归函数推导如下:
IDR_模型:
(w1·AIM2)+(w2·APOBEC3A)+(w3·CIAO1)+(w4·DDX58)+(w5·DHX9)+(w6·IFI16)+(w7·IFIH1)+(w8·IFIT1)+(w9·IFIT3)+(w10·LRRFIP1)+(w11·MYD88)+(w12·OAS1)+(w13·TLR8)+(w14·ZBP1)
TCR_信号转导_模型:
(w15·C2)+(w16·CD247)+(w17·CD28)+(w18·CD3E)+(w19·CD3G)+(w20·CD4)+(w21·CSK)+(w22·EZR)+(w23·FYN)+(w24·LAT)+(w25·LCK)+(w26·PAG1)+(w27·PDE4D)+(w28·PRKACA)+(w29·PRKACB)+(w30·PTPRC)+(w31·ZAP70)
PDE4D7_CORR_模型:
(w32·ABCC5)+(w33·CUX2)+(w34·KIAA1549)+(w35·PDE4D)+(w36·RAP1GAP2)+(w37·SLC39A11)+(w38·TDRD1)+(w39·VWA2)
权重w1到w39的详细信息如以下表1中所示。
表1:针对结直肠癌的三个单独的Cox回归模型的变量和权重,即免疫防御反应模型(IDR_模型)、T细胞受体信号转导_模型(TCR信号转导_模型)和PDE4D7相关模型(PDE4D7_CORR_模型);NA——不可用。
基于三个单独的Cox回归模型(IDR_模型、TCR_信号转导_模型、PDE4D7_CORR_模型),我们再次使用Cox回归对其与结直肠癌患者的相应群组具有或不具有(CRCAI_模型)临床变量(N阶段属性)的总存活率(CRCAI&临床_模型)组合进行建模。我们在Kaplan-Meier生存分析中测试了这两个模型。
Cox回归函数推导如下:
CRCAI_模型:
(w40·IDR_模型)+(w41·TCR信号转导模型)+(w42·PDE4D7_CORR_模型)
CRCAI&临床_模型:
(w40·IDR_模型)+(w41·TCR_信号转导_模型)+(w42·PDE4D7_CORR_模型)+(w43·N_阶段_N1)+(w44·N_阶段_N2)
权重w40到w44的详细信息如以下表2中所示。
表2:针对两个组合Cox回归模型(即结直肠癌AI模型(CRCAI_模型)和结直肠癌与临床模型(CRCAI&临床_模型))的变量和权重;NA——不可用。
Kaplan-Meier生存分析
对于Kaplan-Meier生存曲线分析,风险模型(IDR_模型、TCR_信号转导_模型、PDE4D7_CORR_模型、CRCAI_模型和CRCAI&临床_模型)的Cox函数根据截止值被分类为两个子群组。将组分为低风险和高风险的阈值基于经历相应Cox回归模型预测的临床终点(结果)的风险
图2示出了168名患者TCGA结直肠癌群组中的IDR_模型的Kaplan-Meier曲线(用于开发IDR_模型的训练集)。测试的临床终点是总体死亡(logrank p=0.009;HR=2.5;95%CI=1.3-5.0)。以下补充列表示出了所分析的IDR_模型类别处于风险中的患者数量,即,在+20个月的任何时间区间内处于风险中的患者:低风险:80、45、21、15、9、6、4、1、0;高风险(>0.04):88、52、29、14、9、4、3、0、0。
图3示出了83名患者TCGA结直肠癌群组中的IDR_模型的Kaplan-Meier曲线(测试集用于验证在168名患者训练集上开发的IDR_模型)。测试的临床终点是总体死亡(logrankp=0.8;HR=0.9;95%CI=0.3-2.6)。以下补充列表示出了所分析的IDR_模型类别处于风险中的患者数量,即,在+20个月的任何时间区间内处于风险中的患者:低风险:42、29、8、4、4、2、2、1、0;高风险(>0.04):41、19、9、4、2、0、0、0、0。
图4示出了168名患者TCGA结直肠癌群组中的TCR_信号转导_模型的Kaplan-Meier曲线(用于开发TCR_信号转导_模型的训练集)。测试的临床终点是总体死亡(logrank p=0.003;HR=2.9;95%CI=1.4-5.9)。以下补充列表示出了所分析的TCR信号转导_模型类别处于风险中的患者数量,即,在+20个月的任何时间区间内处于风险中的患者:低风险:81、46、23、10、4、3、1、0、0;高风险(>0.04):87、51、27、19、14、7、6、1、0。
图5示出了83名患者TCGA结直肠癌群组中的TCR_信号转导_模型的Kaplan-Meier曲线(测试集用于验证在168名患者训练集上开发的TCR_信号转导_模型)。测试的临床终点是总体死亡(logrank p=0.02;HR=3.7;95%CI=1.3-10.9)。以下补充列表示出了所分析的TCR信号转导_模型类别处于风险中的患者数量,即,在+20个月的任何时间区间内处于风险中的患者:低风险:46、26、10、6、5、2、2、0、1;高风险(>0.04):37、22、7、2、1、0、0、0、0。
图6示出了95名患者TCGA结直肠癌群组中的PDE4D7_CORR_模型的Kaplan-Meier曲线(用于开发PDE4D7_CORR_模型的训练集)。测试的临床终点是总体死亡(logrank p<0.0001;HR=10.7;95%CI=3.5-32.4)。以下补充列表示出了所分析的PDE4D7_CORR_模型类别处于风险中的患者数量,即,在+20个月的任何时间区间内处于风险中的患者:低风险:143、86、45、27、17、10、7、1、0;高风险(>0.04):25、11、5、2、1、0、0、0、0。
图7示出了83名患者TCGA结直肠癌群组中的PDE4D7_CORR_模型的Kaplan-Meier曲线(测试集用于验证在168名患者训练集上开发的PDE4D7_CORR_模型)。测试的临床终点是总体死亡(logrank p<0.8;HR=1.2;95%CI=0.2-5.9)。以下补充列表示出了所分析的PDE4D7_CORR_模型类别处于风险中的患者数量,即,在+20个月的任何时间区间内处于风险中的患者:低风险:72、42、15、7、6、2、2、1、0;高风险(>0.04):11、6、2、1、0、0、0、0、0。
图8示出了168名患者TCGA结直肠癌群组中的CRCAI_模型的Kaplan-Meier曲线(训练集用于开发CRCAI_模型)。测试的临床终点是总体死亡(logrank p=0.0001;HR=4.6;95%CI=2.2-9.7)。以下补充列表示出了所分析的CRCAI_模型类别处于风险中的患者数量,即,在+20个月的任何时间区间内处于风险中的患者:低风险:117、69、37、19、9、6、3、0、0.5;高风险(>0.04):51、28、13、10、9、4、4、1、0。
图9示出了83名患者TCGA结直肠癌群组中的CRCAI_模型的Kaplan-Meier曲线(测试集用于验证在168名患者训练集上开发的CRCAI_模型)。测试的临床终点是总体死亡(logrank p=0.005;HR=5.9;95%CI=1.7-20.2)。以下补充列表示出了所分析的CRCAI_模型类别处于风险中的患者数量,即,在+20个月的任何时间区间内处于风险中的患者:低风险:66、39、10、6、5、2、2、1、0.5;高风险(>0.04):17、9、7、2、1、0、0、0、0。
图10示出了168名患者TCGA结直肠癌群组中的CRCAI&临床_模型的Kaplan-Meier曲线(训练集用于开发CRCAI&临床_模型)。测试的临床终点是总体死亡(logrank p=0.0001;HR=4.0;95%CI=2.0-8.0)。以下补充列表示出了所分析的CRCAI_&临床模型类别处于风险中的患者数量,即,在+20个月的任何时间区间内处于风险中的患者:低风险:105、59、29、15、7、5、3、0、0.5;高风险(>0.04):63、38、21、14、11、5、4、1、0。
图11示出了83名患者TCGA结直肠癌群组中CRCAI&临床_模型的Kaplan-Meier曲线(测试集用于验证在168名患者训练集上开发的CRCAI&临床_模型)。测试的临床终点是总体死亡(logrank p<0;01;HR=5.5;95%CI=1.4-21.8)。以下补充列表示出了所分析的CRCAI_&临床模型类别处于风险中的患者数量,即,在+20个月的任何时间区间内处于风险中的患者:低风险:62、40、14、7、6、2、2、1、0.5;高风险(>0.04):21、8、3、1、0、0、0、0、0。
下面,我们展示了源自GSE41248(www.ncbi.nlm.nih.gov/geo)数据集的结直肠癌群组的一些其他结果:
图12示出了从GSE41248数据集导出的结直肠癌群组中CRCAI_模型的Kaplan-Meier曲线,该模型使用非转移(m0)和转移性疾病(m1)患者的2/3样本进行训练,然后对剩余1/3的m0和m1样本进行测试。然后仅对来自非转移性疾病(m0)患者的样本测试此训练模型,以便获得与TCGA结直肠癌群组相同的情况。测试的临床终点是总体死亡(logrank p=0.001;HR=3.2;95%CI=1.6-6.5)。以下补充列表示出了所分析的CRCAI_模型类别处于风险中的患者数量,即,在+20个月的任何时间区间内处于风险中的患者:低风险:132、123、113、97、75、50、32、14、6、3、2、0;高风险:31、27、23、22、12、8、4、0、0、0、0、0。
图13示出了从GSE41248数据集导出的结直肠癌群组中CRCAI_模型的Kaplan-Meier曲线,该模型使用非转移(m0)和转移性疾病(m1)患者的2/3样本进行训练,然后对剩余1/3的m0和m1样本进行测试。然后仅对来自非转移性疾病(m0)患者的样本测试此训练模型,以便获得与TCGA结直肠癌群组相同的情况。测试的临床终点是癌症特异性死亡(logrank p<0.0001;HR=12.9;95%CI=3.9-43.0)。以下补充列表示出了所分析的CRCAI_模型类别处于风险中的患者数量,即,在+20个月的任何时间区间内处于风险中的患者:低风险:94、86、80、67、51、34、18、8、3、2、2、0;高风险:23、19、16、15、7、4、3、0、0、0、0、0。
图14示出了从GSE41248数据集导出的结直肠癌群组中CRCAI&临床_模型的Kaplan-Meier曲线。该模型使用非转移(m0)和转移性疾病(m1)患者的2/3样本进行训练,然后对剩余1/3的m0和m1样本进行测试。然后仅对来自非转移性疾病(m0)患者的样本测试此训练模型,以便获得与TCGA结直肠癌群组相同的情况。测试的临床终点是总体死亡(logrank p=0.0002;HR=3.3;95%CI=1.8-6.1)。以下补充列表示出了所分析的CRCAI&临床_模型类别处于风险中的患者数量,即,在+20个月的任何时间区间内处于风险中的患者:低风险:120、111、103、90、71、45、30、14、6、3、2、0;高风险:43、39、33、29、16、13、6、0、0、0、0、0。
图15示出了从GSE41248数据集导出的结直肠癌群组中CRCAI&临床_模型的Kaplan-Meier曲线。该模型使用非转移(m0)和转移性疾病(m1)患者的2/3样本进行训练,然后对剩余1/3的m0和m1样本进行测试。然后仅对来自非转移性疾病(m0)患者的样本测试此训练模型,以便获得与TCGA结直肠癌群组相同的情况。测试的临床终点是癌症特异性死亡(logrank p=0.0001;HR=16.8;95%CI=6.0-47.1)。以下补充列表示出了所分析的CRCAI&临床_模型类别处于风险中的患者数量,即,在+20个月的任何时间区间内处于风险中的患者:低风险:84、76、71、61、48、31、17、8、3、2、2、0;高风险:33、29、25、21、10、7、4、0、0、0、0、0。
图2至15所示的Kaplan-Meier生存曲线分析指示存在不同的患者风险组。患者的风险组是根据如图所示的相应风险模型计算出的相应临床终点(总体死亡)的概率来确定的。取决于患者死于结直肠癌的预测风险(即,取决于患者可能属于哪个风险组),可能会指示不同类型的干预措施。在低风险组(概率<0.5)中,护理标准(SOC)可提供可接受的长期肿瘤控制。对于经历任何相关结果的风险>0.5的患者组来说,情况绝对不是这样。在该患者群组中,需要升级干预或应用替代处置。处置升级的替代选择是放射或细胞毒性药物的辅助治疗或免疫疗法等替代疗法(例如,阿特珠单抗;派姆单抗;纳武单抗;阿维鲁单抗;德瓦鲁单抗)或其他实验疗法。
接下来,研究人员研究了较小的基因子集是否仍然具有预测能力。为了研究这一点,生成了十个随机选择的组,每组六个基因,满足以下标准:至少一个基因选自PDE4D7相关基因组。获得以下选择:
表3模型名称:CRCAI_6.1
表4模型名称:CRCAI_6.2
表5模型名称:CRCAI_6.3
表6模型名称:CRCAI_6.4
表7模型名称:CRCAI_6.5
表8模型名称:CRCAI_6.6
表9模型名称:CRCAI_6.7
表10模型名称:CRCAI_6.8
表11模型名称:CRCAI_6.9
表12模型名称:CRCAI_6.10
本节显示了基于两种结直肠癌的多个基因模型的Cox回归模型的其他结果,包括随机选择的六个基因的组合,如上文表3-12中所述。上面提供了变量和相应的权重。Cox回归模型绘制在图16–25的Kaplan-Meier曲线分析中。
对于Kaplan-Meier曲线分析,10个风险模型的Cox回归函数如上所示(CRCAI6.1–CRCAI6.10)根据截止点分为两个子群组(低风险与高风险)。将组分为低风险和高风险的阈值基于经历相应Cox回归模型预测的临床终点(结果)的风险。
图16示出了168名患者TCGA结直肠癌群组(用于开发CRCAI_6.1_模型的训练集)中的CRCAI_6.1_模型的Kaplan-Meier曲线。测试的临床终点是总体死亡(logrank p=0.03;HR=2.2;95%CI=1.1-4.5)。图下方的补充列表表明了所分析的CRCAI_6.1模型类别(阈值=0)中处于危险中的患者数量,即显示了任意时间区间+20个月内处于危险中的患者数量。图中的顶线描绘了低于或等于阈值的患者,图中的底线描绘了高于阈值的患者。
图17示出了168名患者TCGA结直肠癌群组(用于开发CRCAI_6.2_模型的训练集)中的CRCAI_6.2_模型的Kaplan-Meier曲线。测试的临床终点是总体死亡(logrank p=0.01;HR=2.4;95%CI=1.9-4.7)。图下方的补充列表表明了所分析的CRCAI_6.2模型类别(阈值=0)中处于危险中的患者数量,即显示了任意时间区间+20个月内处于危险中的患者数量。图中的顶线描绘了低于或等于阈值的患者,图中的底线描绘了高于阈值的患者。
图18示出了168名患者TCGA结直肠癌群组(用于开发CRCAI_6.2_模型的训练集)中的CRCAI_6.3_模型的Kaplan-Meier曲线。测试的临床终点是总体死亡(logrank p=0.02;HR=2.4;95%CI=1.1-5.1)。图下方的补充列表表明了所分析的CRCAI_6.3模型类别(阈值=0)中处于危险中的患者数量,即示出了任意时间区间+20个月内处于危险中的患者数量。图中的顶线描绘了低于或等于阈值的患者,图中的底线描绘了高于阈值的患者。
图19示出了168名患者TCGA结直肠癌群组(用于开发CRCAI_6.4_模型的训练集)中的CRCAI_6.4_模型的Kaplan-Meier曲线。测试的临床终点是总体死亡(logrank p=0.002;HR=3.0;95%CI=1.5-5.9)。图下方的补充列表表明了所分析的CRCAI_6.4模型类别(阈值=0)中处于危险中的患者数量,即示出了任意时间区间+20个月内处于危险中的患者数量。图中的顶线描绘了低于或等于阈值的患者,图中的底线描绘了高于阈值的患者。
图20示出了168名患者TCGA结直肠癌群组(用于开发CRCAI_6.5_模型的训练集)中的CRCAI_6.5_模型的Kaplan-Meier曲线。测试的临床终点是总体死亡(logrank p=0.007;HR=2.6;95%CI=1.3-5.1)。图下方的补充列表表明了所分析的CRCAI_6.5模型类别(阈值=0)中处于危险中的患者数量,即示出了任意时间区间+20个月内处于危险中的患者数量。图中的顶线描绘了低于或等于阈值的患者,图中的底线描绘了高于阈值的患者。
图21示出了168名患者TCGA结直肠癌群组(用于开发CRCAI_6.6_模型的训练集)中的CRCAI_6.6_模型的Kaplan-Meier曲线。测试的临床终点是总体死亡(logrank p=0.001;HR=3.4;95%CI=1.6-7.2)。图下方的补充列表表明了所分析的CRCAI_6.6模型类别(阈值=0)中处于危险中的患者数量,即示出了任意时间区间+20个月内处于危险中的患者数量。图中的顶线描绘了低于或等于阈值的患者,图中的底线描绘了高于阈值的患者。
图22示出了168名患者TCGA结直肠癌群组(用于开发CRCAI_6.7_模型的训练集)中的CRCAI_6.7_模型的Kaplan-Meier曲线。测试的临床终点是总体死亡(logrank p=0.03;HR=2.1;95%CI=1.1-4.2)。图下方的补充列表表明了所分析的CRCAI_6.7模型类别(阈值=0)中处于危险中的患者数量,即示出了任意时间区间+20个月内处于危险中的患者数量。图中的顶线描绘了低于或等于阈值的患者,图中的底线描绘了高于阈值的患者。
图23示出了168名患者TCGA结直肠癌群组(用于开发CRCAI_6.8_模型的训练集)中的CRCAI_6.8_模型的Kaplan-Meier曲线。测试的临床终点是总体死亡(logrank p=0.004;HR=2.8;95%CI=1.4-5.5)。图下方的补充列表表明了所分析的CRCAI_6.8模型类别(阈值=0)中处于危险中的患者数量,即示出了任意时间区间+20个月内处于危险中的患者数量。图中的顶线描绘了低于或等于阈值的患者,图中的底线描绘了高于阈值的患者。
图24示出了168名患者TCGA结直肠癌群组(用于开发CRCAI_6.9_模型的训练集)中的CRCAI_6.9_模型的Kaplan-Meier曲线。测试的临床终点是总体死亡(logrank p=0.01;HR=2.5;95%CI=1.2-5.1)。图下方的补充列表表明了所分析的CRCAI_6.9模型类别(阈值=0)中处于危险中的患者数量,即示出了任意时间区间+20个月内处于危险中的患者数量。图中的顶线描绘了低于或等于阈值的患者,图中的底线描绘了高于阈值的患者。
图25示出了168名患者TCGA结直肠癌群组(用于开发CRCAI_6.10_模型的训练集)中的CRCAI_6.10_模型的Kaplan-Meier曲线。测试的临床终点是总体死亡(logrank p=0.004;HR=3.0;95%CI=1.4-6.2)。图下方的补充列表表明了所分析的CRCAI_6.10模型类别(阈值=0)中处于危险中的患者数量,即示出了任意时间区间+20个月内处于危险中的患者数量。图中的顶线描绘了低于或等于阈值的患者,图中的底线描绘了高于阈值的患者。
从这些数据可以得出结论,选自如本文所述的免疫防御反应特征、T细胞信号转导特征和PDE4D7相关特征的六个基因的模型,考虑到至少来自这六个基因的基因选自PDE4D7相关基因签名,足以做出预测。因为满足这些标准的10组随机选择的6个基因导致了患者的显著风险分层,所以预计这些结果可以外推到任何6个或更多基因的选择。
讨论
结直肠癌治疗的有效性有限,导致疾病进展并最终导致患者死亡,特别是对于那些在初次干预后疾病复发风险较高的患者。对治疗结果的预测非常有挑战性,因为许多因素在治疗效果和疾病复发中发挥作用。很可能的是,尚未识别出重要因素,而无法准确确定其他因素的影响。目前正在研究多种临床病理学措施并将其应用于临床环境,以改善反应预测和治疗选择,从而提供一定程度的改善。然而,仍然强烈需要更好地预测治疗反应,以提高结直肠癌治疗的成功率。
我们已经鉴定出其表达与结直肠癌初始治疗后死亡率显著相关的分子,因此有望改善对次级治疗有效性的预测。这可以通过以下方式实现:1)对那些与癌症死亡相关的进行性疾病风险较低的患者提供标准护理和/或2)指导患有进行性疾病高风险并随后因癌症死亡的患者采用替代的、与目前应用的护理标准相比可能更有效的处置形式。这将减少那些免于无效治疗的患者的痛苦并减少在无效治疗上花费的成本。
本领域技术人员通过研究附图、公开以及权利要求书,在实践请求保护的本发明时,可以理解和实现对所公开的实现方式的其他的变型。
在权利要求中,“包括”一词不排除其他元件或步骤,并且词语“一”或“一个”不排除多个。
图1中图示方法的一个或多个步骤可以在可以在计算机上运行的计算机程序产品中实现。计算机程序产品可以包括其上记录(存储)控制程序的非瞬态计算机可读记录介质,例如磁盘、硬盘驱动器等。非瞬态计算机可读介质的常见形式包括例如软盘、软盘、硬盘、磁带或任何其他磁性存储介质、CD-ROM、DVD或任何其他光学介质、RAM、PROM、EPROM、FLASH-EPROM或其他存储芯片或盒式磁带,或计算机可以从中读取和使用的任何其他非瞬态介质。
或者,该方法的一个或多个步骤可以在瞬态介质中实现,例如可传输的载波,其中,控制程序被体现为使用传输介质的数据信号,例如声波或光波,例如在无线电波和红外数据通信等期间产生的那些。
该示例性方法可以被实现在或实现为一个或多个通用计算机、(一个或多个)专用计算机、经编程的微处理器或微控制器和外围集成电路元件、ASIC或其他集成电路、数字信号处理器、诸如离散元件电路的硬连线电子或逻辑电路、诸如PLD、PLA、FPGA、图形卡CPU(GPU)或PAL的可编程逻辑设备等。一般而言,图示了任何能够实现有限状态机的设备,该有限状态机继而能够实现图1中所示的流程图,能够用于实施用于前列腺癌的患者的治疗选择的风险分层的方法的一个或多个步骤。应当理解,虽然该方法的步骤可以全部由计算机实现,但在一些实施例中,一个或多个步骤可以至少部分地手动执行。
所述计算机程序指令还可以被加载到计算机、其他可编程数据处理装置或其他设备上以令一系列操作步骤在计算机、其他可编程装置或其他设备上执行以产生计算机实施的过程,使得在计算机或其他可编程装置上运行的指令提供用于实施本方中描述的功能/动作。
权利要求书中的任何附图标记都不应被解读为对范围的限制。
本发明涉及一种预测结直肠癌对象的结果的方法,包括:
确定选自第一基因表达谱、第二基因表达谱和第三基因表达谱的六个或更多个基因表达水平,或者接收对所述六个或更多个基因表达水平的确定的结果,其中,所述六个或更多个基因表达水平包括选自第三基因表达谱的至少一个或多个基因表达水平和选自第一和/或第二基因表达谱的至少一个或多个基因表达水平,其中,
第一基因表达谱包括选自包括以下项的组的免疫防御反应基因:AIM2、APOBEC3A、CIAO1、DDX58、DHX9、IFI16、IFIH1、IFIT1、IFIT3、LRRFIP1、MYD88、OAS1、TLR8、以及ZBP1;
第二基因表达谱包括选自包括以下项的组的T细胞受体信号转导基因:CD2、CD247、CD28、CD3E、CD3G、CD4、CSK、EZR、FYN、LAT、LCK、PAG1、PDE4D、PRKACA、PRKACB、PTPRC、以及ZAP70;
第三基因表达谱包括选自包括以下项的组的PDE4D7相关基因:ABCC5、CUX2、KIAA1549、PDE4D、RAP1GAP2、SLC39A11、TDRD1、以及VWA2;
所述第一基因表达谱、第二基因表达谱和第三基因表达谱是在从对象获得的生物样本中测定的;并且
基于六个或更多基因表达水平来确定对所述结果的所述预测,并且
任选地,向医疗护理人员或对象提供所述预测。在一个实施例中,六个或更多个基因表达水平包含一种或多种,例如1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个或所有,免疫防御反应基因,以及一种或多种,例如1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个或所有,T细胞受体信号转导基因,以及一种或多种,例如,1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个或所有,PDE4D7相关基因。
替代地,本发明涉及一种预测结肠直肠癌对象的结果的方法,包括:确定针对一个或多个,例如1介、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个或所有,选自包括以下项的组的免疫防御反应基因的中的每个的第一基因表达谱:AIM2、APOBEC3A、CIAO1、DDX58、DHX9、IFI16、IFIH1、IFIT1,IFIT3、LRRFIP1、MYD88、OAS1、TLR8以及ZBP1,或者接收对所述第一基因表达谱的确定的结果,所述第一基因表达谱是在获自对象的生物样本中确定的,并且/或者确定针对从包括以下项的组中选择的一个或多个,例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16或全部,T细胞受体信号转导基因中的中的每个的(一个或多个)第二基因表达谱:CD2、CD247、CD28、CD3E、CD3G、CD4、CSK、EZR、FYN、LAT、LCK、
PAG1、PDE4D、PRKACA、PRKACB、PTPRC、以及ZAP70,或者接收对所述第二基因表达谱的确定的结果,所述(一个或多个)第二基因表达谱是在从所述对象获得的生物样本中确定的,并且/或者确定针对从包括以下项的组中选择的一个或多个,例如,1、2、3、4、5、6、7或者所有,PDE4D7相关基因中的每个的(一个或多个)第三基因表达谱:ABCC5、CUX2、KIAA1549、PDE4D、RAP1GAP2、SLC39A11、TDRD1和VWA2,或者接收对所述第直基因表达谱的确定的结果,所述(一个或多个)第三基因表达谱是在从所述对象获得的生物样本中确定的,基于所述(一个或多个)第一基因表达谱、或所述(一个或多个)第二基因表达谱、或所述(一个或多个)第三基因表达谱、或者基于所述第一、所述第二和所述(一个或多个)第三基因表达谱来确定对结果的预测,并且任选地,向医疗护理人员或对象提供所述预测。
在一些实施例中,对所述结果的所述预测还可以基于(一个或多个)第一基因表达谱和(一个或多个)第二基因表达谱来确定。在一些实施例中,对所述结果的所述预测还可以基于(一个或多个)第一基因表达谱和(一个或多个)第三基因表达谱来确定。在一些实施例中,对所述结果的所述预测还可以基于(一个或多个)第二基因表达谱和(一个或多个)第三基因表达谱来确定。
标题为2020PF00762_Sequence Listing_ST25的所附序列表通过引用整体并入本文。

Claims (17)

1.一种预测结直肠癌对象的结果的方法,包括:
确定选自第一基因表达谱、第二基因表达谱和第三基因表达谱的六个或更多个基因表达水平,或者接收对所述六个或更多个基因表达水平的确定的结果,其中,所述六个或更多个基因表达水平包括选自所述第三基因表达谱的至少一个或多个基因表达水平和选自所述第一基因表达谱和/或所述第二基因表达谱的至少一个或多个基因表达水平,其中,
所述第一基因表达谱包括选自包括以下项的组的免疫防御反应基因:AIM2、APOBEC3A、CIAO1、DDX58、DHX9、IFI16、IFIH1、IFIT1、IFIT3、LRRFIP1、MYD88、OAS1、TLR8、以及ZBP1;
所述第二基因表达谱包括选自包括以下项的组的T细胞受体信号转导基因:CD2、CD247、CD28、CD3E、CD3G、CD4、CSK、EZR、FYN、LAT、LCK、PAG1、PDE4D、PRKACA、PRKACB、PTPRC、以及ZAP70;
所述第三基因表达谱包括选自包括以下项的组的PDE4D7相关基因:ABCC5、CUX2、KIAA1549、PDE4D、RAP1GAP2、SLC39A11、TDRD1、以及VWA2;
所述第一基因表达谱、所述第二基因表达谱和所述第三基因表达谱是在从所述对象获得的生物样本中测定的;并且
基于所述六个或更多基因表达水平来确定对所述结果的所述预测,并且
任选地,向医疗护理人员或所述对象提供所述预测。
2.根据权利要求1所述的方法,其中,
所述六个或更多个基因表达水平包括:
一个或多个免疫防御反应基因,优选地,所述免疫防御基因中的两个或更多个,更优选地,三个或更多个,最优选地,所有,以及
一个或多个T细胞受体信号转导基因,优选地,所述T细胞受体信号转导基因中的两个或更多个,更优选地,三个或更多个,最优选地,所有,以及
一个或多个PDE4D7相关基因,优选地,所述PDE4D7相关基因中的两个或更多个,更优选地,三个或更多个,最优选地,所有。
3.根据权利要求1或2所述的方法,其中,确定对所述结果的所述预测包括:
利用已经从结直肠癌对象的群组导出的回归函数来组合针对所述免疫防御反应基因中的两个或更多个,例如,2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个或所有,免疫防御反应基因的所述第一基因表达谱,和/或
利用已经从结直肠癌对象的群组导出回归函数来组合针对所述T细胞受体信号转导基因中的两个或更多个,例如,2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个或所有,T细胞受体信号转导基因的所述第二基因表达谱,和/或
利用已经从结直肠癌对象的群组导出的回归函数来组合针对所述PDE4D7相关基因的两个或更多个,例如,2个、3个、4个、5个、6个、7个或所有,PDE4D7相关基因的所述第三基因表达谱,并且/或者
利用已经从结直肠癌对象的群组导出的回归函数来组合所述六个或更多个基因表达水平,例如,6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个或更多或所有,基因表达水平。
4.根据权利要求3所述的方法,其中,确定对所述结果的所述预测还包括:利用已经从结直肠癌对象的群组导出的回归函数来组合所述第一基因表达谱的组合、所述第二基因表达谱的组合、以及所述第三基因表达谱的组合。
5.根据权利要求1至4中的任一项所述的方法,其中,对所述结果的所述确定还基于从所述对象获得的一个或多个临床参数。
6.根据权利要求4所述的方法,其中,所述临床参数包括以下中的一项或多项:(i)T阶段属性(T1、T2、T3或T4);(ii)N阶段属性(N0、N1或N2),以及;(iii)M阶段属性(M0、M1)。
7.根据权利要求5或6所述的方法,其中,确定对所述结果的所述预测包括组合以下中的一项或多项:(i)针对所述一个或多个免疫防御反应基因的一个或多个第一基因表达谱;(ii)针对所述一个或多个T细胞受体信号转导基因的一个或多个第二基因表达谱;(iii)针对所述一个或多个PDE4D7相关基因的一个或多个第三基因表达谱,以及;(iv)利用已经从结直肠癌对象的群组导出的回归函数的对所述第一基因表达谱、所述第二基因表达谱和所述第三基因表达谱与从所述对象获得的所述一个或多个临床参数的组合。
8.根据权利要求1至7中的任一项所述的方法,其中,所述一个或多个生物样本是在所述治疗的开始之前从所述对象获得的。
9.根据权利要求1至8中的任一项所述的方法,其中,所述治疗是手术、放射疗法、细胞毒性化疗(CTX)、短程或长程化放疗法(CRT)、免疫疗法、或其任何组合。
10.根据权利要求1至9中的任一项所述的方法,其中,对治疗反应的所述预测为对于所述治疗的有效性而言不太可能或者可能,其中,基于所述预测来推荐治疗,并且如果所述预测是不太可能,则所推荐的治疗包括以下中的一种或多种:(i)早于标准提供的治疗;(ii)有效剂量增加的放疗;(iii)辅助治疗,例如化疗;(iv)长程CRT(化放疗);以及(iv)替代疗法,例如免疫疗法。
11.一种用于预测结直肠癌对象的结果的装置,包括:
输入部,其适于接收:指示针对一个或多个,例如,1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个或所有,选自包括以下项的组的免疫防御反应基因中的每个的第一基因表达谱的数据:AIM2、APOBEC3A、CIAO1、DDX58、DHX9、IFI16、IFIH1、IFIT1、IFIT3、LRRFIP1、MYD88、OAS1、TLR8和ZBP1,所述一个或多个第一基因表达谱是在从所述对象获得的生物样本中确定的;和/或指示针对一个或多个,例如,1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个或所有,选自包括以下项的组的T细胞受体信号转导转导基因中的每个的第二基因表达谱的数据:CD2、CD247、CD28、CD3E、CD3G、CD4、CSK、EZR、FYN、LAT、LCK、PAG1、PDE4D、PRKACA、PRKACB、PTPRC、以及ZAP70,所述一个或多个第二基因表达谱是在从所述对象获得的生物样本中确定的;和/或指示针对一个或多个,例如,1个、2个、3个、4个、5个、6个、7个或所有,选自包括以下项的组的PDE4D7相关基因中的每个的第三基因表达谱的数据:ABCC5、CUX2、KIAA1549、PDE4D、RAP1GAP2、SLC39A11、TDRD1和VWA2,所述一个或多个第三基因表达谱是在从所述对象获得的生物样本中确定的,
处理器,其适于基于所述一个或多个第一基因表达谱、或所述一个或多个第二基因表达谱、或所述一个或多个第三基因表达谱、或者基于所述一个或多个第一基因表达谱、所述一个或多个第二基因表达谱和所述一个或多个第三基因表达谱来确定对结果的所述预测,以及
任选地,提供单元,其适于向医疗护理人员或所述对象提供所述预测。
12.一种包括指令的计算机程序产品,所述指令当所述程序由计算机运行时使所述计算机执行包括以下操作的方法:
接收:指示针对一个或多个,例如,1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个或所有,选自包括以下项的组的免疫防御反应基因中的每个的第一基因表达谱的数据:AIM2、APOBEC3A、CIAO1、DDX58、DHX9、IFI16、IFIH1、IFIT1、IFIT3、LRRFIP1、MYD88、OAS1、TLR8和ZBP1,所述一个或多个第一基因表达谱是在从结直肠癌对象获得的生物样本中确定的;和/或指示针对一个或多个,例如,1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个或所有,选自包括以下项的组的T细胞受体信号转导转导基因中的每个的第二基因表达谱的数据:CD2、CD247、CD28、CD3E、CD3G、CD4、CSK、EZR、FYN、LAT、LCK、PAG1、PDE4D、PRKACA、PRKACB、PTPRC、以及ZAP70,所述一个或多个第二基因表达谱是在从结直肠癌对象对象获得的生物样本中确定的;和/或指示针对一个或多个,例如,1个、2个、3个、4个、5个、6个、7个或所有,选自包括以下项的组的PDE4D7相关基因中的每个的第三基因表达谱的数据:ABCC5、CUX2、KIAA1549、PDE4D、RAP1GAP2、SLC39A11、TDRD1和VWA2,所述一个或多个第三基因表达谱是在从结直肠癌对象获得的生物样本中确定的,
基于所述一个或多个第一基因表达谱、或基于所述一个或多个第二基因表达谱、或基于所述一个或多个第三基因表达谱、或者基于所述一个或多个第一基因表达谱、所述一个或多个第二基因表达谱和所述一个或多个第三基因表达谱来确定对所述对象的结果的预测,并且
任选地,向医疗护理人员或所述对象提供所述预测。
13.一种诊断套件,包括:
至少一个引物和/或探针,其用于在从对象获得的生物样本中确定针对选自第一基因表达谱、第二基因表达谱和第三基因表达谱的六个或更多个基因表达水平,其中,所述六个或更多个基因表达水平包括选自所述第三基因表达谱的至少一个或多个基因表达水平和选自所述第一基因表达谱和/或所述第二基因表达谱的至少一个或多个基因表达水平,其中,
所述第一基因表达谱包括选自包括以下项的组的免疫防御反应基因:AIM2、APOBEC3A、CIAO1、DDX58、DHX9、IFI16、IFIH1、IFIT1、IFIT3、LRRFIP1、MYD88、OAS1、TLR8、以及ZBP1;
所述第二基因表达谱包括选自包括以下项的组的T细胞受体信号转导基因:CD2、CD247、CD28、CD3E、CD3G、CD4、CSK、EZR、FYN、LAT、LCK、PAG1、PDE4D、PRKACA、PRKACB、PTPRC、以及ZAP70;并且
所述第三基因表达谱包括选自包括以下项的组的PDE4D7相关基因:ABCC5、CUX2、KIAA1549、PDE4D、RAP1GAP2、SLC39A11、TDRD1、以及VWA2;以及
任选地,根据权利要求11所述的装置或根据权利要求12所述的计算机程序产品。
14.根据权利要求13所述的套件的使用。
15.根据权利要求14所述的使用在预测结直肠癌对象的结果的方法中的使用。
16.一种方法,包括:
接收从结直肠癌对象获得的一个或多个生物样本,
使用根据权利要求13所述的套件来确定选自第一基因表达谱、第二基因表达谱和第三基因表达谱的六个或更多个基因表达水平,其中,所述六个或更多个基因表达水平包括选自第三基因表达谱的至少一个或多个基因表达水平和选自第一基因表达谱和/或第二基因表达谱的至少一个或多个基因表达水平,其中,
所述第一基因表达谱包括选自包括以下项的组的免疫防御反应基因:AIM2、APOBEC3A、CIAO1、DDX58、DHX9、IFI16、IFIH1、IFIT1、IFIT3、LRRFIP1、MYD88、OAS1、TLR8、以及ZBP1;
所述第二基因表达谱包括选自包括以下项的组的T细胞受体信号转导基因:CD2、CD247、CD28、CD3E、CD3G、CD4、CSK、EZR、FYN、LAT、LCK、PAG1、PDE4D、PRKACA、PRKACB、PTPRC、以及ZAP70;并且
所述第三基因表达谱包括选自包括以下项的组的PDE4D7相关基因:ABCC5、CUX2、KIAA1549、PDE4D、RAP1GAP2、SLC39A11、TDRD1、以及VWA2。
17.一种对选自第一基因表达谱、第二基因表达谱和第三基因表达谱的六个或更多个基因表达水平的使用,其中,所述六个或更多个基因表达水平包括选自所述第三基因表达谱的至少一个或多个基因表达水平和选自所述第一基因表达谱和/或所述第二基因表达谱的至少一个或多个基因表达水平,其中,在预测结直肠癌对象的结果的方法中,所述第一基因表达谱包括选自包括以下项的组的免疫防御反应基因:AIM2、APOBEC3A、CIAO1、DDX58、DHX9、IFI16、IFIH1、IFIT1、IFIT3、LRRFIP1、MYD88、OAS1、TLR8和ZBP1,所述第二基因表达谱包括选自包括以下项的组的T细胞受体信号转导基因:CD2、CD247、CD28、CD3E、CD3G、CD4、CSK、EZR、FYN、LAT、LCK、PAG1、PDE4D、PRKACA、PRKACB、PTPRC、以及ZAP70,所述第三基因表达谱包括选自包括以下项的组的PDE4D7相关基因:ABCC5、CUX2、KIAA1549、PDE4D、RAP1GAP2、SLC39A11、TDRD1和VWA2,所述使用包括:
基于所述六个或更多基因表达水平来确定对所述结果的所述预测,并且
任选地,向医疗护理人员或所述对象提供所述预测。
CN202280009901.XA 2021-01-12 2022-01-05 结直肠癌对象的结果的预测 Pending CN117203352A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP21151054.0 2021-01-12
EP21151054.0A EP4026918A1 (en) 2021-01-12 2021-01-12 Prediction of an outcome of a colorectal cancer subject
PCT/EP2022/050105 WO2022152597A1 (en) 2021-01-12 2022-01-05 Prediction of an outcome of a colorectal cancer subject

Publications (1)

Publication Number Publication Date
CN117203352A true CN117203352A (zh) 2023-12-08

Family

ID=74141415

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280009901.XA Pending CN117203352A (zh) 2021-01-12 2022-01-05 结直肠癌对象的结果的预测

Country Status (5)

Country Link
US (1) US20240076746A1 (zh)
EP (2) EP4026918A1 (zh)
JP (1) JP2024502489A (zh)
CN (1) CN117203352A (zh)
WO (1) WO2022152597A1 (zh)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1777523A1 (en) * 2005-10-19 2007-04-25 INSERM (Institut National de la Santé et de la Recherche Médicale) An in vitro method for the prognosis of progression of a cancer and of the outcome in a patient and means for performing said method
NZ593225A (en) * 2006-01-11 2012-10-26 Genomic Health Inc Gene expression markers (CMYC and Ki-67) for colorectal cancer prognosis
EP3240908A2 (en) * 2014-12-30 2017-11-08 F. Hoffmann-La Roche AG Methods and compositions for prognosis and treatment of cancers
CA3072061A1 (en) * 2017-08-04 2019-02-07 The Regents Of The University Of Michigan Use of immune cell-specific gene expression for prognosis of prostate cancer and prediction of responsiveness to radiation therapy
EP3636779A1 (en) * 2018-10-11 2020-04-15 Koninklijke Philips N.V. Pre-surgical risk stratification based on pde4d7 and dhx9 expression

Also Published As

Publication number Publication date
WO2022152597A1 (en) 2022-07-21
JP2024502489A (ja) 2024-01-19
EP4026918A1 (en) 2022-07-13
US20240076746A1 (en) 2024-03-07
EP4278013A1 (en) 2023-11-22

Similar Documents

Publication Publication Date Title
Hiraoka et al. Expression of classical human leukocyte antigen class I antigens, HLA‐E and HLA‐G, is adversely prognostic in pancreatic cancer patients
Gumireddy et al. AKAP4 is a circulating biomarker for non-small cell lung cancer
EP3875608A1 (en) Prediction of radiotherapy response for prostate cancer subject based on immune defense response genes
Chen et al. Identification and validation of an 11-ferroptosis related gene signature and its correlation with immune checkpoint molecules in glioma
Shah et al. Clinical and molecular features of innate and acquired resistance to anti-PD-1/PD-L1 therapy in lung cancer
EP4222286B1 (en) Outcome prediction of bladder or kidney cancer
Patarat et al. The expression of FLNA and CLU in PBMCs as a novel screening marker for hepatocellular carcinoma
Park et al. High endothelial venule is a surrogate biomarker for T-cell inflamed tumor microenvironment and prognosis in gastric cancer
US20230114184A1 (en) Prediction of radiotherapy response for prostate cancer subject based on t-cell receptor signaling genes
Park et al. Transcriptional upregulation of CXCL13 is correlated with a favorable response to immune checkpoint inhibitors in lung adenocarcinoma
Deng et al. Immune suppressive microenvironment in liver metastases contributes to organ-specific response of immunotherapy in advanced non-small cell lung cancer
US20230407402A1 (en) Prediction of a response of a prostate cancer subject to therapy or personalization of therapy of a prostate cancer subject
CN117203352A (zh) 结直肠癌对象的结果的预测
Liu et al. Predicting patient outcomes after treatment with immune checkpoint blockade: A review of biomarkers derived from diverse data modalities
EP3960878A1 (en) Selection of a dose for radiotherapy of a prostate cancer subject
EP4343003A1 (en) Prediction of an outcome of a bladder cancer subject
EP4357462A1 (en) Prediction of an outcome of androgen deprivation therapy in a prostate cancer subject
EP4177357A1 (en) Prediction of an outcome of a breast cancer subject
Bird et al. Cancer Immunotherapy Biomarkers of Response and Toxicity; current limitations and future promise
Fojnica et al. An Updated Review of the Biomarkers of Response to Immune Checkpoint Inhibitors in Merkel Cell Carcinoma

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination