CN114846158A - 预测对标准新辅助放化疗的反应和治疗后的预后的组合物、以及预测标准疗法预后不良的患者的方法和组合物 - Google Patents

预测对标准新辅助放化疗的反应和治疗后的预后的组合物、以及预测标准疗法预后不良的患者的方法和组合物 Download PDF

Info

Publication number
CN114846158A
CN114846158A CN202080080943.3A CN202080080943A CN114846158A CN 114846158 A CN114846158 A CN 114846158A CN 202080080943 A CN202080080943 A CN 202080080943A CN 114846158 A CN114846158 A CN 114846158A
Authority
CN
China
Prior art keywords
cancer
leu
ala
gly
lys
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080080943.3A
Other languages
English (en)
Inventor
白淳明
闵丙绍
波格-盖尔·凯瑟琳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Novomics Co ltd
Original Assignee
Novomics Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Novomics Co ltd filed Critical Novomics Co ltd
Publication of CN114846158A publication Critical patent/CN114846158A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57407Specifically defined cancers
    • G01N33/57419Specifically defined cancers of colon
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57407Specifically defined cancers
    • G01N33/57446Specifically defined cancers of stomach or intestine
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57484Immunoassay; Biospecific binding assay; Materials therefor for cancer involving compounds serving as markers for tumor, cancer, neoplasia, e.g. cellular determinants, receptors, heat shock/stress proteins, A-protein, oligosaccharides, metabolites
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/106Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/52Predicting or monitoring the response to treatment, e.g. for selection of therapy based on assay results in personalised medicine; Prognosis
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/60Complex ways of combining multiple protein biomarkers for diagnosis

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Immunology (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Analytical Chemistry (AREA)
  • Pathology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Hematology (AREA)
  • Biomedical Technology (AREA)
  • Urology & Nephrology (AREA)
  • Physics & Mathematics (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Cell Biology (AREA)
  • General Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Food Science & Technology (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本发明涉及用于预测癌症患者预后的生物标志物组合物,该生物标志物组合物包括第一分子亚型或由该第一分子亚型转录和翻译的蛋白。本发明还涉及用于预测癌症患者预后的生物标志物组合物,该生物标志物组合物还包括第二分子亚型或由该第二分子亚型转录和翻译的蛋白。

Description

预测对标准新辅助放化疗的反应和治疗后的预后的组合物、 以及预测标准疗法预后不良的患者的方法和组合物
技术领域
本发明涉及用于预测对直肠癌的新辅助放化疗(neoadjuvantchemoradiotherapy)的反应或直肠癌治疗的预后的组合物,以及使用该组合物的预测方法。
背景技术
直肠癌是肠道最常见的癌症,但它易于早期发现和治疗,治愈率很高。中年以后直肠癌的发病率较高。直肠癌可起源于直肠息肉。症状与直肠粘膜炎(catarrh)相似,可包括恶臭血便。观察到排便后有粘液排出和频繁的排便冲动。此外,直肠狭窄(stenosis)的症状还包括直肠和肛门周围的沉重感、顽固性便秘(stubborn constipation)、大便如兔粪、大便狭窄或稀薄,随着症状的进展,由于括约肌功能不全而出现大便失禁。
触诊时,直肠内可触及肿瘤硬块。用直肠镜直接检查肿瘤、切除肿瘤和进行窥器(speculum)检查,都可以得到明确的诊断。当在癌症进展早期(即局限于直肠壁)时进行手术,后果非常好。当无法进行根治性手术时,会制作人工肛门排便,并在局部照射镭和高压辐射。在某些情况下,即使采用这种治疗方法,患者也可以存活长达10年。
直肠癌和结肠癌虽然形态相似,但治疗方法不同。结肠癌在根治性手术后接受辅助化疗,而直肠癌则在术前放化疗、再进行根治性手术。
由于结肠癌分子亚型归类机制(classifier)很大程度上取决于肿瘤块内间质组织的量,因此直肠癌亚型归类机制可能不适用于通常用小的治疗前(pretreated)活检标本诊断的直肠癌。即,结肠癌根据基因表达模式分为四种分子亚型,已证明CMS4分子亚型预后不良且对现有抗癌药物有耐药性。由于CMS4分子亚型是由癌组织中成纤维细胞的比例决定的,对于治疗前用小活检组织诊断、并且马上治疗而不进行手术的直肠癌,成纤维细胞的比例是未知的,因此不可能应用此种结肠癌分子分型方法。
因此,直肠癌需要一种不同于结肠癌的生物标志物,对直肠癌的固有术前放化疗的反应、复发率和存活率提供临床可利用性。
发明内容
技术问题
本发明旨在提供一种生物标志物组合物,其能够准确且简单地预测针对抗癌疗法的疗效反应(therapeutic response)或该抗癌疗法的预后。
本发明还旨在提供用于预测预后的组合物,其可以准确且简单地预测针对抗癌疗法的疗效反应或该抗癌疗法的预后。
本发明还旨在提供试剂盒,其能够准确且简单地预测针对抗癌疗法的疗效反应或该抗癌疗法的预后。
本发明还旨在提供一种提供信息的方法,该方法可以准确且简单地预测针对抗癌疗法的疗效反应或该抗癌疗法的预后。
本发明还旨在提供一种设备(device),其用于预测对抗癌疗法的疗效反应或抗癌疗法的预后的。
本发明还涉及提供一种生物标志物组合物,其通过分析直肠癌治疗开始前的诊断性活检所得癌症组织来识别用于总的新辅助疗法的目标组别。
本发明还涉及提供一种组合物,其通过分析直肠癌治疗开始前的诊断性活检所得癌症组织来识别用于总的新辅助疗法的目标组别。
本发明还涉及提供一种试剂盒,其通过分析直肠癌治疗开始前的诊断性活检所得癌症组织来识别用于总的新辅助疗法的目标组别。
本发明还涉及提供一种设备,其通过分析直肠癌治疗开始前的诊断性活检所得癌症组织来识别用于总的新辅助疗法的目标组别。
然而,本发明要解决的技术问题不限于上述问题,本领域普通技术人员通过以下描述将充分理解本文未描述的其他问题。
技术方案
在下文中,本发明将参考各种实施例来描述。在以下描述中,为了充分理解本发明,将描述各种具体细节,例如,具体形式、组成和过程。然而,某些实施方案可以在无一个或多个具体细节的情况下实施,或与其他已知方法和形式组合实施。在另一示例中,已知工艺和制造技术未特别详细地描述,以免不必要地模糊本发明。在整个说明书中,提及“一个实施方案”或“实施方案”是指结合该实施方案描述的特定特征、形式、组成或性质包含在本发明的一或多个实施方案中。因此,在整个说明书各处表述的“一个实施方案”或“实施方案”的上下文不一定代表相同的本发明实施方案。此外,特定的特征、形式、组成或性质可以通过任何合适的方式组合在一个或多个实施方案中。
除非另有明确定义,否则本文使用的所有科学和技术术语与本发明所属领域的普通技术人员通常理解的含义相同。
在本发明的一个方面,本发明提供了一种生物标志物组合物,用于预测癌症患者对抗癌疗法的疗效反应或抗癌疗法后的预后,或确定抗癌疗法前的新辅助化疗的目标患者,该组合物包括第一分子亚型和第二分子亚型的至少一个基因或由其编码的蛋白。
在本发明中,第一分子亚型可以包括选自PMP2,AGTR1,PLCXD3,TCEAL6,ANKRD1和ARHGAP26-AS1的一种或多种基因。
本文中“PMP2”基因是编码髓鞘(Myelin)P2蛋白(PMP2蛋白)的基因,PMP2蛋白是外周神经系统(PNS)髓鞘和中枢神经系统(CNS)髓鞘的成分(component),其是P2的组成部分(constituent)。作为一种结构蛋白,P2被认为可稳定髓鞘膜,并可参与雪旺细胞(Schwanncells)中的脂质转运。在本发明中,PMP2蛋白可以由SEQ ID NO:1所示的氨基酸序列组成,但本发明不限于此。
本文中“AGTR1”基因是编码血管紧张素II受体1型(AGTR1)蛋白的基因,该蛋白是最特征性的血管紧张素受体,具有血管收缩效应并调节醛固酮(aldosterone)分泌。在本发明中,AGTR1蛋白可以由SEQ ID NO:2所示的氨基酸序列组成,但本发明不限于此。
本文中“PLCXD3”基因是存在于假常染色体区(PAR)中的磷脂酰肌醇特异性磷脂酶C的包含X结构域的蛋白3的基因,以及编码PI-PLC的包含X结构域的蛋白3的基因(PLCXD3)。在本发明中,PLCXD3可以由SEQ ID NO:3表示的氨基酸序列组成,但本发明不限于此。
本文中“TCEAL6”基因编码转录延伸因A(SII)样6(TCEAL6)或含有锚蛋白重复结构域的蛋白1,可参与转录调控。在本发明中,TCEAL6或含有锚蛋白重复结构域的蛋白1可以由SEQ ID NO:4表示的氨基酸序列组成,但本发明不限于此。
本文中“ANKRD1”基因编码含有锚蛋白重复结构域的蛋白1(ANKRD1),在心脏和骨骼肌中高表达,在应激条件下表达水平增加。在本发明中,ANKRD1可以由SEQ ID NO:5表示的氨基酸序列组成,但本发明不限于此。
本文中术语“ARHGAP26-AS1”基因是与lncRNA类相关的RNA基因,可由SEQ ID NO:6表示,但本发明不限于此。
在本发明一个实施方案中,第一分子亚型还可以包括一种或多种选自下组的基因:GTF2IP1,TBC1D3L,BLOC1S5-TXNDC5,MIR4477B,HIST2H3C,HNRNPA1P33,CTAGE8,GOLGA8K,KRT222,LOC440434,C10orf131,PGM5-AS1,ACADL,PGM5P3-AS1,LOC101929607,KIAA0408,PLGLB2,ZNF676,KIAA2022,SEMA3E,PLCXD3,NLGN1,SLITRK4,GAS1RR,TCEAL2,LOC642131,LONRF2,GRIN2A,ADAMTS9-AS1,LOC644838,LOC100507387,FAM35BP,EPHA6,MIR186,LINC01266,FAM47E-STBD1,LINC01489,TVP23C-CDRT4,FAM133A,NEXN,LGI1,OR7E12P,MIR3911,MYH8,ZNF728,BCHE,CCDC144B,LINC01537,LOC101928509,KCTD8,LOC100507073,ARHGEF18,BVES-AS1,LINGO2,SCN7A,GRIA2,LINC00504,LINC01352,MIR133A1HG,SCN9A,HLX-AS1,LOC100506289,FILIP1,MEIS1-AS2,FGF13-AS1,HCG23,PLN,RANBP3L,SPOCK3,PCDH10,LCN10,COL25A1,MEF2C-AS1,ATP2B2,CDH19,ADIPOQ,CRP,ALB,OTOP2,MYOC,FGL1,ATP1A2,CHRM2,PCSK2,SLITRK3,GPM6A,HAND2-AS1,RIMS4,NRXN1,PDZRN4,KRT24,ANGPTL1,TRARG1,MYH11,CASQ2,NGB,LOC101928731,KCNA1,SLC5A7,PMP2,CTNNA3,OGN,SYT4,FABP4,ADH1B,ADCYAP1R1,PI16,GCG,HP,CADM2,MYH2,CLVS2,MAMDC2,FRMPD4,CA1,FAM180B,CMA1,SERTM1,KCNB1,NEXMIF,GC,PLP1,APCS,SLC17A8,ANGPTL7,SYNM,PHOX2B,AGTR1,C7,ST8SIA3,LMO3,LDB3,RERGL,ASB5,SGCG,OTOP3,CCBE1,BMP3,HAND1,CADM3,SYNPO2,TMIGD1,NPTX1,ABCA8,NEFL,PLIN4,CD300LG,LEP,MORN5,ECRG4,SFRP1,SLC7A14,SCN2B,FMO2,SORCS1,CLCA4,OMD,VEGFD,STMN4,PTPRZ1,AQP4,SMYD1,SCRG1,ADGRB3,TMEFF2,CNR1,CIDEA,CNTN1,DPP6,HAND2,TCEAL5,FRMD6-AS2,SMIM28,SYT10,NOS1,PLD5,TNNT3,ABCA9,EPHA7,GALR1,RSPO2,NPY2R,CHRDL1,APOC3,FUT9,PRIMA1,LINC00924,TNXB,LOC102724050,NTNG1,CNGA3,AQP8,PGM5,ASTN1,RNF150,ADAMTSL3,LYVE1,ZDHHC22,LRRTM4,RBFOX3,ABCA6,NECAB1,FGG,NEFM,APOB,RIC3,VSTM2A,OLFM3,CILP,LINC00682,NIBAN1,LMOD1,MYOT,ABI3BP,PPP1R1A,WSCD2,FDCSP,HSPB8,KHDRBS2,NSG2,PKHD1L1,CHST9,ZMAT4,POU3F4,LIX1,MUSK,NRK,PGR,AADACL2,CLDN8,ADAMTS9-AS2,METTL24,NRSN1,LOC729558,SCGN,BEST4,SLITRK2,RELN,NPR3,CCN5,CDH10,CA7,LINC02268,SPIB,ABCB5,CNTNAP4,PTCHD1,UGT2B4,ANKS1B,LINC01829,DPT,MGAT4C,MYT1L,CPEB1,ERICH3,SORCS3,CYP1B1,LINC02023,SALL3,ANK2,PRELP,ART4,PIRT,MYLK,C1QTNF7,LINC01798,DCLK1,DES,KCNC2,CNN1,BRINP3,FAM135B,PYY,GAP43,NAP1L2,ACSM5,THBS4,HTR2B,PYGM,IGSF10,TAFA4,KRTAP13-2,VIT,LRAT,LRRC3B,TMOD1,EPHA5,IRX6,PCDH11X,SLC4A4,HRK,RBM20,LOC283856,LINC00507,ZBTB16,PRG4,APOA2,ASPA,ANXA8L1,CLCNKB,SERTM2,GABRG2,SLC6A2,ZFHX4,MMRN1,STUM,PCOLCE2,DIRAS2,XKR4,SFTPA1,GNAO1,LVRN,DAO,TMEM100,ANGPTL5,LINC01505,SST,HEPACAM,KCNK2,HRG,MFAP5,LINC02544,RORB,FGF14,CP,MIR8071-1,NEUROD1,MYOCD,CNTN2,SCARA5,CAVIN2,LRRC4C,TCF23,MS4A12,C14orf180,PCDH9,PENK,CARTPT,HPCAL4,ZNF716,PCP4L1,CLEC3B,MYOM1,CCDC160,CA2,GFRA1,LOC107986321,LOC101928134,FHL1,NALCN,MAS1L,MS4A1,PEG3,SFTPC,POPDC2,GPRACR,SLIT2,TRDN,LINC02185,SCNN1G,SNAP25,MAGEB2,ACTG2,MEOX2,C8orf88,ATP2B3,TNS1,GPR119,ZNF385B,SFRP2,KCNQ5,KCNMA1,STON1-GTF2A1L,LIFR,ELAVL4,ADRA1A,ATCAY,LINC01474,FGF10,PIK3C2G,SLC13A5,NUDT10,CCDC169,STMN2,AVPR1B,MAB21L1,MASP1,LINC02408,VXN,PGM5P4-AS1,SNAP91,LRCH2,ISM1,NOVA1,NEGR1,SPHKAP,LINC01697,SHISAL1,CDKN2B-AS1,CR2,MYO3A,AFF3,MROH2B,P2RX2,KIF1A,LINC02015,IGSF11,SV2B,ARPP21,SYT6,GABRA5,EVX2,COL19A1,FGFBP2,FAM106A,VGLL3,KCNT2,PTGIS,EBF2,CTSG,CACNA2D1,B3GALT5-AS1,GUCA2B,UNC80,NETO1,GPR12,LOC105378318,PLIN1,RGS22,SLC30A10,TMEM35A,TACR1,AICDA,MSRB3,NRG3,PLAAT5,CT45A10,LINC01446,TLL1,CLEC4M,DDR2,MAB21L2,MPPED2,CALN1,MICU3,BVES,LOC107986400,DHRS7C,KERA,MAPK4,CDO1,PROKR1,PAPPA2,KCNMB1,P2RY12,MAGEE2,FLNC,GDF6,NBEA,BHMT2,CPXM2,NTRK3,TENM1,RNF180,MRGPRE,CCDC158,PRDM6,RGS13,PAK3,MGP,UGT2B10,和PTPRQ,但本发明不限于此。
在本发明另一实施方案中,第一分子亚型还可以包括一种或多种选自下组的基因:ACADL,ADAMTS9-AS1,ARHGEF18,BCHE,BLOC1S5-TXNDC5,BVES-AS1,C10orf131,CCDC144B,CDH19,CTAGE8,EPHA6,FAM133A,FAM35BP,FAM47E-STBD1,FILIP1,GAS1RR,GOLGA8K,GRIA2,GRIN2A,GTF2IP1,HCG23,HIST2H3C,HLX-AS1,HNRNPA1P33,KCTD8,KIAA0408,KIAA2022,KRT222,LGI1,LINC00504,LINC01266,LINC01352,LINC01489,LINC01537,LINGO2,LOC100507073,LOC100507387,LOC101928509,LOC101929607,LOC440434,LOC642131,LOC644838,LONRF2,MEIS1-AS2,MIR133A1HG,MIR186,MIR3911,MIR4477B,MYH8,NEXN,NLGN1,OR7E12P,PCDH10,PGM5-AS1,PGM5P3-AS1,PLCXD3,PLGLB2,PLN,RANBP3L,SCN7A,SCN9A,SEMA3E,SLITRK4,SYT4,TBC1D3L,TCEAL2,TVP23C-CDRT4,ZNF676,和ZNF728,但本发明不限于此。
在本发明又一实施方案中,第一分子亚型还可以包括一种或多种选自下组的基因:AADACL2,ABCA6,ABCA8,ABCA9,ABCB5,ABI3BP,ACADL,ACSM5,ACTG2,ADAMTS9-AS1,ADAMTS9-AS2,ADAMTSL3,ADCYAP1R1,ADGRB3,ADH1B,ADIPOQ,ADRA1A,AFF3,AGTR1,AICDA,ALB,ANGPTL1,ANGPTL5,ANGPTL7,ANK2,ANKS1B,ANXA8L1,APOA2,APOB,APOC3,AQP4,AQP8,ARPP21,ART4,ASB5,ASPA,ASTN1,ATCAY,ATP1A2,ATP2B2,ATP2B3,AVPR1B,B3GALT5-AS1,BCHE,BEST4,BHMT2,BLOC1S5-TXNDC5,BMP3,BRINP3,BVES,BVES-AS1,C14orf180,C1QTNF7,C7,C8orf88,CA1,CA2,CA7,CACNA2D1,CADM2,CADM3,CALN1,CARTPT,CASQ2,CAVIN2,CCBE1,CCDC144B,CCDC158,CCDC160,CCDC169,CCN5,CD300LG,CDH10,CDH19,CDKN2B-AS1,CDO1,CHRDL1,CHRM2,CHST9,CIDEA,CILP,CLCA4,CLCNKB,CLDN8,CLEC3B,CLEC4M,CLVS2,CMA1,CNGA3,CNN1,CNR1,CNTN1,CNTN2,CNTNAP4,COL19A1,CP,CPEB1,CPXM2,CR2,CRP,CTNNA3,CTSG,CYP1B1,DAO,DCLK1,DDR2,DES,DHRS7C,DIRAS2,DPP6,DPT,EBF2,ECRG4,ELAVL4,EPHA5,EPHA6,EPHA7,ERICH3,EVX2,FABP4,FAM106A,FAM133A,FAM135B,FAM180B,FDCSP,FGF10,FGF13-AS1,FGF14,FGFBP2,FGG,FGL1,FHL1,FILIP1,FLNC,FMO2,FRMD6-AS2,FRMPD4,FUT9,GABRA5,GABRG2,GALR1,GAP43,GAS1RR,GC,GCG,GDF6,GFRA1,GNAO1,GPM6A,GPR119,GPR12,GPRACR,GRIA2,GRIN2A,GTF2IP1,GUCA2B,HAND1,HAND2,HAND2-AS1,HEPACAM,HP,HPCAL4,HRG,HRK,HSPB8,HTR2B,IGSF10,IGSF11,IRX6,ISM1,KCNA1,KCNB1,KCNC2,KCNK2,KCNMA1,KCNMB1,KCNQ5,KCNT2,KCTD8,KERA,KHDRBS2,KIAA0408,KIF1A,KRT222,KRT24,KRTAP13-2,LCN10,LDB3,LEP,LGI1,LIFR,LINC00504,LINC00507,LINC00682,LINC00924,LINC01266,LINC01352,LINC01474,LINC01505,LINC01697,LINC01798,LINC01829,LINC02015,LINC02023,LINC02185,LINC02268,LINC02408,LINC02544,LIX1,LMO3,LMOD1,LOC100506289,LOC101928731,LOC102724050,LOC107986321,LOC283856,LOC440434,LOC729558,LONRF2,LRAT,LRCH2,LRRC3B,LRRC4C,LRRTM4,LVRN,LYVE1,MAB21L1,MAB21L2,MAGEE2,MAMDC2,MAPK4,MASP1,MEF2C-AS1,MEOX2,METTL24,MFAP5,MGAT4C,MGP,MICU3,MIR133A1HG,MIR8071-1,MMRN1,MORN5,MPPED2,MRGPRE,MS4A1,MS4A12,MSRB3,MUSK,MYH11,MYH2,MYLK,MYO3A,MYOC,MYOCD,MYOM1,MYOT,MYT1L,NALCN,NAP1L2,NBEA,NECAB1,NEFL,NEFM,NEGR1,NETO1,NEUROD1,NEXMIF,NEXN,NGB,NIBAN1,NLGN1,NOS1,NOVA1,NPR3,NPTX1,NPY2R,NRG3,NRK,NRSN1,NRXN1,NSG2,NTNG1,NTRK3,NUDT10,OGN,OLFM3,OMD,OTOP2,OTOP3,P2RX2,P2RY12,PAK3,PAPPA2,PCDH10,PCDH11X,PCDH9,PCOLCE2,PCP4L1,PCSK2,PDZRN4,PEG3,PENK,PGM5,PGM5-AS1,PGM5P4-AS1,PGR,PHOX2B,PI16,PIK3C2G,PIRT,PKHD1L1,PLAAT5,PLCXD3,PLD5,PLIN1,PLIN4,PLN,PLP1,PMP2,POPDC2,POU3F4,PPP1R1A,PRDM6,PRELP,PRG4,PRIMA1,PROKR1,PTCHD1,PTGIS,PTPRQ,PTPRZ1,PYGM,PYY,RANBP3L,RBFOX3,RBM20,RELN,RERGL,RGS13,RGS22,RIC3,RIMS4,RNF150,RNF180,RORB,RSPO2,SCARA5,SCGN,SCN2B,SCN7A,SCN9A,SCNN1G,SCRG1,SEMA3E,SERTM1,SERTM2,SFRP1,SFRP2,SFTPA1,SGCG,SHISAL1,SLC13A5,SLC17A8,SLC30A10,SLC4A4,SLC5A7,SLC6A2,SLC7A14,SLIT2,SLITRK2,SLITRK3,SLITRK4,SMIM28,SMYD1,SNAP25,SNAP91,SORCS1,SORCS3,SPHKAP,SPIB,SPOCK3,SST,ST8SIA3,STMN2,STMN4,STON1-GTF2A1L,STUM,SV2B,SYNM,SYNPO2,SYT10,SYT4,SYT6,TACR1,TAFA4,TCEAL2,TCEAL5,TCF23,TENM1,THBS4,TLL1,TMEFF2,TMEM100,TMEM35A,TMIGD1,TMOD1,TNNT3,TNS1,TNXB,TRARG1,TRDN,UGT2B10,UGT2B4,UNC80,VEGFD,VGLL3,VIT,VSTM2A,VXN,WSCD2,XKR4,ZBTB16,ZDHHC22,ZFHX4,ZMAT4,ZNF385B,ZNF676,和ZNF728,但本发明不限于此。
在本发明中,第二分子亚型可包括一或多种选自下组的基因:PGP,SLC26A3,HIST1H4C,RUVBL2,RAB19,HIST2H2AC,和SNORD69。
本文中“PGP”基因编码P-糖蛋白1(PGP),PGP被称为多药耐药蛋白1(MDR1)、ATP结合盒亚家族B成员1(ABCB1)或分化簇243(CD243),是可将多种外来物质泵送细胞外的重要的细胞膜蛋白,或具有广谱底物特异性的ATP依赖性外排泵。在本发明中,PGP可以由SEQ IDNO:7表示的氨基酸序列组成,但本发明不限于此。
本文中“SLC26A3”基因编码氯阴离子交换剂(在腺瘤中下调;DRA),它是SAT家族的阴离子交换剂,可在小肠粘膜中运输硫酸根和其他阴离子。在本发明中,该氯阴离子交换剂可以由SEQ ID NO:8表示的氨基酸序列组成,但本发明不限于此。
本文中“HIST1H4C”基因编码无内含子的组蛋白H4,组蛋白H4形成四种关键组蛋白H1、H2、H3和H4(它们形成组蛋白八聚体)之一。在本发明中,组蛋白H4可由SEQ ID NO:9表示的氨基酸序列组成,但本发明不限于此。
本文中“RAB19”基因编码RuB-1-样蛋白2,是细菌RubB基因的同系物。在本发明中,RuB-1-样蛋白2可由SEQ ID NO:10表示的氨基酸序列组成,但本发明不限于此。
本文中“HIST2H2AC”基因编码组蛋白H2A的2-C型(HIST2H2AC)蛋白,该蛋白形成四种关键组蛋白H1、H2、H3和H4(它们形成组蛋白八聚体)之一,接头组蛋白H1与核小体之间的接头DNA相互作用以便将染色质压缩成更高阶的结构。在发明中,组蛋白H2A 2-C可以由SEQID NO:11表示的氨基酸序列组成,但本发明不限于此。
本文中“SNORD69”属于snoRNA的C/D家族,是小鼠MBII-210的人类直系同源物。
在本发明一个实施方案中,第二分子亚型还可包括一或多种选自下组的基因:TMEM160,TRAPPC5,FEZF2,SNHG25,C4orf48,SNORD38A,PRR7,EIF3IP1,MIR3661,LOC440311,SNORD30,PDF,TPGS1,CTU1,FAM173A,PRSS2,MIR6807,SPRR2E,ADAT3,HIST1H4L,CDH16,GALR3,DEFA5,FOXI3,SMCR5,LIN28B,MESP1,MIR203A,RAET1E-AS1,ANP32D,BOD1L2,SMARCA5-AS1,RNU4-1,RNU5E-1,CCDC85B,ONECUT3,FAM230C,DBET,UBE2NL,MIR4479,CSNK1A1L,BHLHA9,PITPNM2-AS1,SNORA36A,PRSS56,SPRR2G,MAGEA10,GPR25,SLC32A1,LOC101927972,LKAAEAR1,CT83,HES4,TMEM238,RPRML,SNORD41,PTGER1,ITLN2,WBP11P1,MIR324,RNU5A-1,HLA-L,PNMA5,MIR6891,MT4,MIR6858,HIST1H4A,SHISAL2B,LOC101928372,RNU6ATAC,SKOR2,MIR4737,NACA2,FRMD8P1,REG3A,LOC101927795,MIR4767,RNU5B-1,DDC-AS1,PCSK1N,SNORD3B-2,LOC344967,SNORD48,ZAR1,MIR4665,RPL29P2,RNY1,PTTG3P,GJD3,SBF1P1,CLMAT3,KCNE1B,LRRC26,LCN15,HBA1,IGFBP7-AS1,MIR4449,MIR8075,NOXO1,和RNA5S9,但本发明不限于此。
在本发明另一实施方案中,第二分子亚型还可包括一或多种选自下组的基因:C4orf48,CTU1,EIF3IP1,FAM173A,FEZF2,LOC440311,MIR3661,NOXO1,PDF,PRR7,SNHG25,SNORD30,SNORD38A,TMEM160,TPGS1,和TRAPPC5,但本发明不限于此。
在本发明又一实施方案中,第二分子亚型还可包括一或多种选自下组的基因:ADAT3,ANP32D,BHLHA9,BOD1L2,C4orf48,CCDC85B,CDH16,CLMAT3,CSNK1A1L,CTU1,DBET,DDC-AS1,DEFA5,EIF3IP1,FAM173A,FEZF2,FOXI3,FRMD8P1,GALR3,GJD3,GPR25,HBA1,HES4,HIST1H4A,HIST1H4L,HLA-L,IGFBP7-AS1,ITLN2,KCNE1B,LCN15,LKAAEAR1,LOC101927795,LOC101927972,LOC101928372,LOC344967,LRRC26,MAGEA10,MESP1,MIR203A,MIR324,MIR3661,MIR4449,MIR4479,MIR4665,MIR4737,MIR4767,MIR6807,MIR6858,MIR6891,MIR8075,NACA2,NOXO1,ONECUT3,PCSK1N,PDF,PITPNM2-AS1,PNMA5,PRR7,PRSS2,PRSS56,PTGER1,PTTG3P,REG3A,RNA5S9,RNU4-1,RNU5A-1,RNU5B-1,RNU5E-1,RNU6ATAC,RNY1,RPL29P2,RPRML,SBF1P1,SHISAL2B,SKOR2,SLC32A1,SMARCA5-AS1,SMCR5,SNHG25,SNORA36A,SNORD30,SNORD38A,SNORD3B-2,SNORD41,SNORD48,TMEM160,TMEM238,TPGS1,TRAPPC5,UBE2NL,WBP11P1,和ZAR1,但本发明不限于此。
在本发明中,抗癌疗法可以是化疗、放疗、手术治疗或其组合,其中化疗或放疗优选在抗癌疗法之前,更优选抗癌疗法可以是标准新辅助放化疗或标准新辅助放化疗之后的手术治疗,但本发明不限于此。
“在先抗癌疗法”是在具有治愈目的的局部手术或放疗之前进行的抗癌疗法。新辅助化疗通常用于因癌症扩散到周围区域而无法接受全切除术的患者,可以通过减小原发肿瘤的大小和范围来保留主要器官,从而减少结肠癌、直肠癌、头颈部肿瘤、骨肉瘤、肛门癌、乳腺癌等的手术范围。
本文中“化疗”也称为CTX,作为使用一种或多种抗癌剂的标准化化疗类型,可用于治疗目的或旨在延长寿命或减轻症状。
本文中“放疗”是利用高能放射杀死癌细胞的治疗,可以包括外部放射疗法或近距离放疗(brachytherapy),但本发明不限于此。所述放射可以无限制,只要它是能量在空间中传播或在介导这种传播的材料中传播的现象。
本文中“疗效反应(therapeutic response)”是指治疗对受试者的有效程度,优选地,受试者为癌症患者。例如,当与治疗癌症患者联用时,术语“增加的反应”或“良好的反应”可以指用本领域任何已知方法测出的治疗效力的增加。作为另一个示例,癌症患者对治疗的反应可以是完全或部分反应。在又一个示例中,癌症患者对治疗的增加的反应可以通过总存活率、无病存活率、目标反应率、肿瘤进展时间、无进展存活期或治疗失败时间来表征。
本文中“预后”是指预测疾病进程和死亡或存活结果的行为,“预后性预测”是指预测疾病进程和死亡或存活结果的行为。预后或预后性预测可以解释为任何通过考虑患者的状况来预测治疗之前/之后的疾病进程的行为,因为疾病进程可能会因患者的生理或环境状况而变化。此外,预后可以指疾病的进展,例如癌症向组织中的迁移和浸润、转移到不同组织和因疾病而死亡,以及疾病是否完全治愈。根据本发明的目的,预后是指直肠癌患者的进展或直肠癌存活预后。根据本发明的目的,预后可以是识别转移前癌症或转移性癌症状态、确定癌症分期或确定对抗癌治疗的疗效反应,但本发明不限于此。
在本发明中,预后可以是抗癌疗法后的病理完全缓解(pCR)、复发、转移或死亡。
在本发明一个实施方案中,预后可以指抗癌疗法后的手术治疗(优选是标准新辅助放化疗后的手术治疗)后3年内出现远处转移或60%以上死亡率的情形,但本发明不限于此。
在本发明另一实施方案中,预后可以是指抗癌疗法(优选是标准新辅助放化疗后的手术治疗)实现pCR后3年内出现远处转移或60%以上死亡率的情形,但本发明不限于此。
“病理完全缓解(pathologic complete response,pCR)”是指新辅助放化疗后全切除直肠组织病理检查未发现癌细胞的情况。
本文中“生物标志物”是能用体内的细胞、血管、蛋白、DNA、RNA或代谢物来指示身体变化的生物学指标,美国国立卫生研究院(NIH)将生物标志物定义为“被客观测量和评估的特征,以指示正常生物过程、致病过程或对治疗性干预的药理学反应。”即,在特定疾病或癌症的情况下,生物标志物是能区分正常和病理状况、预测疗效反应、并被客观测量的标志物。因此,生物标志物必须用于客观地测量和评估治疗方法中的正常生物过程、疾病进展、和药物反应性。根据使用情况,有根据利用度(availability)确认药物靶标存在的靶标标志物、诊断疾病存在与否的诊断标志物、可区分对特定药物的应答者和非应答者的预测标志物、可以监测药物治疗效果的替代标志物、以及指示疾病预后的预后生物标志物。
本文中“肿瘤”或“癌症(cancer)”是一种细胞周期失控而细胞分裂持续的疾病,根据发生部位分为癌(carcinoma)和肉瘤。癌(carcinoma)是指产生于上皮细胞(如粘膜、皮肤等)的恶性肿瘤,肉瘤是指产生于非上皮细胞(如肌肉、结缔组织、骨、软骨、和血管等)的恶性肿瘤。
本文中癌症可以是选自以下的一种或多种癌症:乳腺癌、子宫癌、食道癌、胃癌、脑癌、直肠癌、结肠癌、肺癌、皮肤癌、卵巢癌、宫颈癌、肾癌、血癌、胰腺癌、前列腺癌、睾丸癌、喉癌、口腔癌、头颈癌、甲状腺癌、肝癌、膀胱癌、骨肉瘤、淋巴瘤和白血病,优选直肠癌。
在本发明的另一方面,本发明提供了一种组合物,用于预测癌症患者针对抗癌疗法的疗效反应或抗癌疗法的预后,或确定抗癌治疗前的新辅助化疗的目标患者,该组合物包括:测量第一分子亚型和第二分子亚型的至少一种基因或由其编码的蛋白的表达水平的试剂。
在本发明中,关于第一分子亚型和第二分子亚型的描述与生物标志物组合物中的描述有重叠,因此省略,以避免说明书过于复杂。
本文中“表达”或“表达水平”可以包括转录和翻译。表达水平的增加可以由多种方法引起,包括例如增加编码多肽的基因的数量、增加基因转录(例如,通过将基因安排在组成型启动子的控制下)、增加基因翻译、敲除竞争基因、或其组合和/或与其他方法的组合。表达的减少可能是由于减少基因数量、减少基因转录和表达竞争基因所致。此外,第一分子亚型或第二分子亚型的表达水平可以通过与比较基因的表达水平进行比较来标准化。
在本发明中,用于测量选自第一分子亚型和第二分子亚型的一种或多种基因的表达水平的试剂可包括选自抗体、寡肽、配体、肽核酸(PNA)和适体(aptamer)的一种或多种,并且,所述试剂与蛋白特异性结合。
本文中“抗体”是指与抗原特异性结合以产生抗原-抗体相互作用的物质。为了本发明的目的,抗体是指与每种蛋白特异性结合的抗体。本发明的抗体包括多克隆抗体、单克隆抗体和重组抗体。使用本领域广为人知的技术可以容易地制备抗体。例如,多克隆抗体可以通过本领域广为人知的方法产生,包括将蛋白的抗原注射到动物体内并从动物收集血液以获得包含抗体的血清的过程。多克隆抗体可由山羊、兔、绵羊、猴、马、猪、牛或狗等任何动物制备。此外,单克隆抗体的制备可以采用杂交瘤方法(Kohler and Milstein(1976)European Journal of Immunology 6:511-519)或噬菌体抗体库技术(Clackson et al,Nature,352:624-628,1991;Marks et al,J.Mol.Biol.,222:58,1-597,1991),其是本领域众所周知的。通过该方法制备的抗体可以通过凝胶电泳、透析、盐析、离子交换层析或亲和层析进行分离和纯化。此外,本发明的抗体不仅包括具有两条全长轻链和两条全长重链的完整形式,还包括抗体分子的功能片段。抗体分子的功能片段是指至少具有抗原结合功能的片段,包括Fab、F(ab')、F(ab')2或Fv。
本文中“寡肽”可由2至20个氨基酸组成,包括二肽、三肽、四肽和五肽,但本发明不限于此。
本文中“肽核酸(PNA)”是指人工合成的类似于DNA或RNA的聚合物,由丹麦哥本哈根大学的Nielsen、Egholm、Berg和Buchardt教授于1991年首次报道。DNA具有磷酸-核糖骨架,而PNA的骨架中重复的N-(2-氨基乙基)-甘氨酸单元通过肽键连接,从而大大增加了与DNA或RNA的结合强度和稳定性,因此用于分子生物学、诊断检测和反义疗法。PNA详见Nielsen PE,Egholm M,Berg RH,Buchardt O(1991年12月),"Sequence-selectiverecognition of DNA by strand Displacement with a thymine-substitutedpolyamide,"Science 254(5037):1497-1500。
本文中“适体(aptamer)”是指一种寡核苷酸或肽分子,其总体描述详见Bock LC等,Nature 355(6360):5646(1992);Hoppe-Seyler F,Butz K"Peptide aptamers:powerful new tools for molecular medicine,"J Mol Med.78(8):42630(2000);CohenBA,Colas P,Brent R."An artificial cell-cycle inhibitor isolated from acombinatorial library,"Proc Natl Acad Sci USA.95(24):142727(1998)。
在本发明中,用于测量第一分子亚型和第二分子亚型的表达水平的试剂可以包括选自引物、探针和反义核苷酸中的一种或多种,其与RNA测序(RNAseq)或基因特异性结合。
本文中“引物”是识别靶基因序列的片段,包括一对正向和反向引物,优选地,提供具有特异性和敏感性的分析结果的引物对。由于引物的核酸序列是与样品中非靶序列不匹配的序列,因此当引物是仅扩增含有互补引物结合位点的靶基因序列且不引起非特异性扩增的引物时,可提供高特异性。
本文中“探针”是指能够特异性结合样品中待检目标物质的物质,以及通过上述结合能够特异性地检测样品中目标物质的存在的物质。探针的类型为本领域常用的物质,但不限于此。探针优选为PNA、锁核酸(LNA)、肽、多肽、蛋白、RNA或DNA,最优选为PNA。更具体地,探针是来源于或类似活体生物的生物材料,或体外制备的探针,例如酶、蛋白、抗体、微生物、动/植物细胞和器官、神经元、DNA或RNA。DNA可以是cDNA、基因组DNA或寡核苷酸,RNA可以是基因组RNA、mRNA或寡核苷酸,蛋白可以是抗体、抗原、酶或肽。
本文中“锁核酸(LNA)”是指具有2’-O,4’-C亚甲基桥的核酸类似物[J Weiler,JHunziker and J Hall Gene Therapy(2006)13,496.502]。LNA核苷包括常见的DNA或RNA核碱基,可以根据Watson-Crick碱基配对规则形成碱基对。然而,由于亚甲基桥对分子的“锁定”,LNA无法在Watson-Crick组合中形成理想的形状。当LNA包含在DNA或RNA寡核苷酸中时,LNA可以更快地与互补核苷酸链配对,从而增加双螺旋的稳定性。本文中“反义”是指具有核苷酸碱基序列和亚基间骨架的寡聚体,其中反义寡聚体通过形成Watson-Crick碱基对与RNA中的靶序列杂交,以通常允许在目标序列中形成mRNA和RNA:寡聚体异二聚体。寡聚体可以与靶序列具有精确的序列互补性或近似的互补性。
由于对应于本发明第一分子亚型和第二分子亚型的基因的序列信息是已知的,基于此,普通技术人员可以容易地设计与该基因特异性结合的引物、探针或反义核苷酸,通过无特定设计的通用RNA测序方法有可能进行定量分析。
在本发明中,抗癌疗法可以是化疗、放疗、手术治疗或其组合,优选地,化疗或放疗在抗癌疗法之前,更优选地,抗癌疗法可以是标准新辅助放化疗或标准新辅助放化疗后的手术治疗,但本发明不限于此。
在本发明一个实施方案中,预后预测可以是预测抗癌疗法后(优选地,标准新辅助放化疗或标准新辅助放化疗后的手术治疗后)的存活率,但本发明不限于此。
在本发明另一实施方案中,预后预测可以是预测抗癌疗法后(优选地,标准新辅助放化疗或标准新辅助放化疗后的手术治疗后)的pCR,但本发明不限于此。
在本发明又一实施方案中,预后预测可以是预测抗癌疗法后(优选地,标准新辅助放化疗或标准新辅助放化疗后的手术治疗后),癌症是否复发,但本发明不限于此。
在本发明又一个实施方案中,预后预测可以是预测抗癌疗法后(优选地,标准新辅助放化疗后的手术治疗后)的癌症转移,但本发明不限于此。
在本发明又一个实施方案中,预后预测可以是预测抗癌疗法后(优选地,标准新辅助放化疗后的手术治疗后)的3年内是否发生远处转移或死亡率为60%以上,但本发明不限于此。
在本发明又一个实施方案中,预后预测可以是预测在作为抗癌疗法(优选地,标准新辅助放化疗后的手术治疗)的结果实现pCR后3年内是否发生远处转移或死亡率为60%以上,但本发明不限于此。
在本发明中,所述癌症可以是选自以下的一种或多种癌症:乳腺癌、子宫癌、食道癌、胃癌、脑癌、直肠癌、结肠癌、肺癌、皮肤癌、卵巢癌、宫颈癌、肾癌、血癌、胰腺癌、前列腺癌、睾丸癌、喉癌、口腔癌、头颈癌、甲状腺癌、肝癌、膀胱癌、骨肉瘤、淋巴瘤、和白血病,优选直肠癌。
在本发明又一方面,本发明提供了一种试剂盒,用于预测癌症患者对抗癌疗法的疗效反应或抗癌疗法后的预后,或鉴别抗癌治疗前新辅助治疗的目标患者。
本文中“试剂盒”是指通过用可检测的标记物标记与生物标志物组分特异性结合的探针或抗体来评估生物标志物的表达水平的工具。试剂盒不仅可以包括直接标记,其直接标记能被检测的物质(就探针或抗体而言通过与底物反应),还可以包括间接标记,其偶联的标记物通过与另一种试剂(被直接标记)的反应而显色。试剂盒可以包括通过与所述标记反应而显色的显色底物溶液、洗涤液和其他溶液,并且可以制造成包括本文使用的试剂组分。在本发明中,该试剂盒可以是包括RT-PCR所需基本组件的试剂盒,并且可以包括试管、反应缓冲溶液、脱氧核苷酸(dNTP)、Taq-聚合酶、逆转录酶、DNase、RNase抑制剂和蒸馏水以及特异于标记基因的引物对。此外,该试剂盒可以是用于检测预后预测所用基因的试剂盒,其包括DNA芯片所需的基本组件。DNA芯片试剂盒可以包括底座,在该底座上对应于基因或其片段的cDNA与探针连接,且该底座可以包括对应于定量对照基因或其片段的cDNA。本发明的试剂盒不受限制,只要它是本领域已知的。
在本发明中,试剂盒可以是RT-PCR试剂盒、DNA芯片试剂盒、ELISA试剂盒、蛋白芯片试剂盒、快速试剂盒或多反应监测(MRM)试剂盒。
本发明的试剂盒还可以包括由一种或多种不同成分组成的适用于分析方法的组合物、溶液或设备。例如,本发明的试剂盒可以进一步包括逆转录聚合酶链式反应(RT-PCR)所需的基本组件。RT-PCR试剂盒包括特异于标记蛋白编码基因特异的引物对。引物是具有特异于所述基因之核酸序列的序列的核苷酸,其长度为约7bp至50bp,更优选约10bp至30bp。此外,引物可以包括特异于对照基因的核酸序列的引物。或者,用于RT-PCR的试剂盒可包括试管或另一合适容器、反应缓冲溶液(pH和镁浓度不同)、脱氧核苷酸(dNTP)、酶如Taq聚合酶和逆转录酶、DNase、RNase抑制剂DEPC-水和蒸馏水。
此外,本发明的试剂盒可以包括DNA芯片所需的必需组件。DNA芯片试剂盒可以包括附着有对应于基因或其片段的cDNA或寡核苷酸的底物,以及用于制备荧光标记探针的试剂(reagent,agent)和酶。此外,所述底物可以包括附着的对应于对照基因或其片段的cDNA或寡核苷酸。
此外,本发明的试剂盒可以包括ELISA所需的必需组件。ELISA试剂盒包括对蛋白特异的抗体。该抗体是对标志物蛋白具有高度特异性和亲和力而与另外的蛋白几乎无交叉反应的单克隆、多克隆或重组抗体。此外,ELISA试剂盒可以包括特异于对照蛋白的抗体。此外,ELISA试剂盒可以包括能检测结合抗体的试剂,例如标记的二抗、发色团、酶(例如,偶联了抗体)及其底物,或其他能与抗体结合的物质。
作为试剂盒中抗原-抗体相互作用的支架,可以使用硝酸纤维素膜、PVDF膜、由聚乙烯树脂或聚苯乙烯树脂合成的孔板、或由玻璃形成的载玻片,但本发明不限于此。
此外,在本发明的试剂盒中,二抗的标记物优选为显色的常规发色团,优选的标记物如聚L-赖氨酸-异硫氰酸荧光素(FITC)等荧光素、罗丹明-B-异硫氰酸(RITC)、辣根过氧化物酶(HRP)、碱性磷酸酶、胶体金、或染料都可以使用,但本发明不限于此。
此外,本发明试剂盒中诱导显色的发色底物优选根据显色的标记来使用,可以是3,3',5,5'-四甲基联苯胺(TMB)、2,2’-联氮-二(3-乙基苯并噻唑-6-磺酸)(ABTS)或邻苯二胺(OPD)。在此,显色底物更优选以溶于缓冲溶液(0.1M NaAc,pH5.5)中的状态提供。TMB等显色底物可被用作二抗偶联物标记物的HRP分解以产生显色沉积物,并通过目测显色沉积物的沉积程度来检测标志物蛋白的存在。
在本发明的试剂盒中,洗涤液优选包括磷酸盐缓冲液、NaCl和Tween 20,更优选地,由0.02M磷酸盐缓冲液、0.13M NaCl和0.05%吐温20组成的缓冲液(PBST)。洗涤液用于洗涤支架,在该支架中,将适量的二抗与抗原-抗体相互作用后的抗原-抗体偶联物的反应产物添加3-6次。作为反应终止液,优选使用硫酸溶液(H2SO4)。
在本发明一个实施方案中,试剂盒可用于诊断对抗癌疗法的敏感程度或疗效反应程度,以及治疗后的预后、分期、癌症转移可能性、复发可能性或存活率。
本发明的癌症可以是选自以下的一或多种癌症:乳腺癌、子宫癌、食道癌、胃癌、脑癌、直肠癌、结肠癌、肺癌、皮肤癌、卵巢癌、宫颈癌、肾癌、血癌、胰腺癌、前列腺癌、睾丸癌、喉癌、口腔癌、头颈癌、甲状腺癌、肝癌、膀胱癌、骨肉瘤、淋巴瘤、和白血病,优选直肠癌。
在本发明的又一方面,本发明提供了一种提供信息的方法,用于预测抗癌疗法的疗效反应或抗癌疗法的预后,或确定在抗癌疗法前的新辅助疗法的目标患者,该方法包括:测量分离自所需受试者的生物样品中第一分子亚型和第二分子亚型的至少一种基因或由其编码的蛋白的表达水平。
本文中“受试者”为患有癌症或患癌概率高的受试者,可以是接受抗癌疗法的受试者或癌症患者,且包括所有哺乳动物。在此,哺乳动物的例子可以包括人、非人灵长类如黑猩猩、其他猿类和猴类;牲畜,如牛、马、绵羊、山羊和猪;家畜,如兔、狗和猫;实验动物,如啮齿动物,包括大鼠、小鼠和豚鼠,但本发明不限于此。
本文中“生物样品”是指从受试者获得或来源于受试者的任何材料、生物流体、组织或细胞,并且可以包括例如全血、白细胞、外周血单核细胞、血沉棕黄层、血浆、血清,痰,眼泪,粘液,洗鼻液,鼻吸液,呼吸气体(breath),尿液,精液,唾液,腹腔洗液(peritonealwashings),腹水,囊液(cystic fluid),脑膜液,羊水,腺液,胰液,淋巴液,胸膜液,乳头抽吸液,支气管抽吸物、滑液(synovial fluid)、关节抽吸物、器官分泌物、细胞、细胞提取物、和脑脊液,优选地,在开始治疗之前从受试者获得的癌组织。
在本发明中,第一分子亚型和第二分子亚型的描述与生物标志物组合物中的描述重叠,因此将被省略以避免说明书的过度复杂性。
在本发明中,用于测量第一分子亚型和第二分子亚型的至少一种基因的表达水平的试剂可以包括从引物、探针和反义核苷酸组成的组中选出的一种或多种,其与所述基因特异性结合。
在本发明中,第一分子亚型和第二分子亚型中至少一种的表达水平的测量可以通过RT-PCR、竞争性RT-PCR、实时RT-PCR、RNA酶保护测定(RPA)、Northern印迹或DNA芯片来进行。
在本发明中,用于测量第一分子亚型和第二分子亚型的至少一种基因或由其编码的蛋白的表达水平的试剂可以包括从抗体、寡肽、配体、PNA和适体中选出的一种或多种,其与所述蛋白特异性结合。
在根据本发明的提供信息的方法中,对抗体、寡肽、配体、PNA和适体的描述与上述描述重叠,因此将被省略以避免说明书过于复杂。
在本发明中,由第一分子亚型和第二分子亚型的至少一种基因编码的蛋白的表达水平的测量可以通过蛋白芯片、免疫试验、配体结合试验、基质辅助激光解吸/电离飞行时间(MALDI-TOF)质谱、表面增强型激光解吸/电离飞行时间(SELDI-TOF)质谱、放射免疫试验、单向免疫扩散(radial immunodiffusion)、双向免疫扩散试验(Ouchterlonyimmunodiffusion assay)、火箭免疫电泳、组织免疫染色、补体固定试验、二维电泳、液相色谱-质谱(LC-MS)、液相色谱-质谱/质谱(LC-MS/MS)、蛋白印迹或酶联免疫吸附试验(ELISA)。
在本发明中,抗癌疗法可以是化疗、放疗、手术治疗或其组合,优选地,化疗或放疗在抗癌疗法之前,更优选地,抗癌疗法可以是标准新辅助放化疗或标准新辅助放化疗之后的手术治疗,但本发明不限于此。
在本发明一个实施方案中,预后预测可以是预测抗癌疗法(优选标准新辅助放化疗后的手术治疗)后的存活率,但本发明不限于此。
在本发明另一实施方案中,预后预测可以是预测抗癌疗法(优选标准新辅助放化疗后的手术治疗)后是否实现pCR,但本发明不限于此。
在本发明又一实施方案中,预后预测可以是预测抗癌疗法(优选标准新辅助放化疗后的手术治疗)后的癌症是否会复发,但本发明不限于此。
在本发明的又一个实施方案中,预后预测可以是预测抗癌疗法(优选标准新辅助放化疗后的手术治疗)后的癌症转移,但本发明不限于此。
在本发明的又一个实施方案中,预测预后不良可能意味着在由于标准新辅助放化疗而实现pCR后3年内显示远处转移和60%或更高死亡率的病例。
在本发明中,所述方法还可以包括确认受试者的TNM分期、年龄、性别、pCR或其组合信息,但本发明不限于此。
本文中“TNM分期”是用于对肿瘤或癌症的解剖学程度进行归类的系统,恶性肿瘤的TNM归类是全球公认的用于对癌症扩散程度进行归类的标准。在TNM分期中,T代表原发肿瘤的大小和是否侵犯周围组织,N代表附近有癌的淋巴结数量,M代表远处转移。
在本发明中,当第一分子亚型或其编码的蛋白在分离自目标受试者的生物样品中表达,或者其表达水平高于对照时,可以预测对抗癌疗法的疗效反应水平低。例如,当第一分子亚型或其编码的蛋白的表达水平高于对照时,可以预测对标准新辅助放化疗的疗效反应或对标准新辅助放化疗后手术治疗的疗效反应水平低。
在本发明中,当第一分子亚型在分离自目标受试者的生物样品中表达,或者其表达水平高于对照时,可以预测抗癌疗法后的预后较差。例如,当第一分子亚型或其编码的蛋白的表达水平高于对照时,可以预测标准新辅助放化疗后的预后或标准新辅助放化疗后手术治疗的预后差,具体地,存活率低,复发概率高,或转移概率高,但本发明不限于此。
在本发明一个实施方案中,当从目标受试者分离的生物样品中测量的第一分子亚型的表达水平高于对照,并且在抗癌疗法(优选标准新辅助放化疗)后未实现pCR时,可以预测预后很差。
在本发明另一个实施方案中,当从目标受试者分离的生物样品中测得的第一分子亚型的表达水平高于对照,且受试者的TNM分期为T3或T4时,可以预测抗癌疗法(优选标准新辅助放化疗或标准新辅助放化疗后的手术治疗)后的预后较差。
在本发明又一实施方案中,当从目标受试者分离的生物样品中测得的第一分子亚型的表达水平高于对照,并且受试者的TNM分期为N1或N2时,可以预测抗癌疗法(优选标准新辅助放化疗或手术治疗)后的预后较差。
在本发明的又一个实施方案中,当从目标受试者分离的生物样品中测得的第一分子亚型的表达水平高于对照,并且受试者的TNM分期为T3或T4、以及N1或N2时,可以预测抗癌疗法(优选标准新辅助放化疗或手术治疗)后的预后较差。
同时,在本发明一个实施方案中,当从目标受试者分离的生物样品中测得的第二分子亚型的表达水平高于对照,并且在抗癌疗法(优选标准新辅助放化疗)后未实现pCR时,可以预测预后良好。
在本发明的另一个实施方案中,当从目标受试者分离的生物样品中测量的第二分子亚型的表达水平高于对照,并且抗癌疗法(优选标准新辅助放化疗)后未实现pCR时,可以预测抗癌疗法后的预后良好。
在本发明又一实施方案中,当从目标受试者分离的生物样品中测得的第二分子亚型的表达水平高于对照,并且受试者的TNM分期为T0、T1或T2时,可以预测抗癌疗法(优选标准新辅助放化疗或标准新辅助放化疗后的手术治疗)的预后良好。
在本发明的又一个实施方案中,当从目标受试者分离的生物样品中测量的第二分子亚型的表达水平高于对照,并且受试者的TNM分期为N0时,可以预测抗癌疗法(优选标准新辅助放化疗或手术治疗)后的预后良好。
在本发明的又一个实施方案中,当在从目标受试者分离的生物样品中测量的第二分子亚型的表达水平高于对照,并且受试者的TNM分期为T0、T1或T2、以及N0时,可以预测抗癌疗法(优选标准新辅助放化疗或手术治疗)后的预后不良。
本文中“对照”可以是第一分子亚型或第二分子亚型或由其编码的蛋白在正常受试者中的表达水平的平均值或中值,或相应基因或蛋白在已患癌症或患癌概率高的受试者(特别是已被诊断患有癌症的受试者)中的表达水平的平均值或中值,但本发明不限于此。
在本发明中,当第一分子亚型或其编码的蛋白的表达水平高于对照时,可以进一步包括进行抗癌疗法的步骤。该抗癌疗法可以是化疗,但本发明不限于此。
在本发明中,当第二分子亚型或其编码的蛋白的表达水平高于对照,且未达到实现pCR时,可以进一步包括进行抗癌疗法的步骤。该抗癌疗法可以为是化疗,但本发明不限于此。
在本发明中,所述癌症可以是选自以下的一种或多种癌症:乳腺癌、子宫癌、食道癌、胃癌、脑癌、直肠癌、结肠癌、肺癌、皮肤癌、卵巢癌、宫颈癌、肾癌、血癌、胰腺癌、前列腺癌、睾丸癌、喉癌、口腔癌、头颈癌、甲状腺癌、肝癌、膀胱癌、骨肉瘤、淋巴瘤、和白血病,优选直肠癌。
在本发明的又一方面,本发明提供一种用于预测抗癌疗法的疗效反应或抗癌疗法后的预后,或识别在抗癌疗法前的新辅助治疗的目标患者的设备,该设备包括:测量单元,用于测量从目标受试者分离的生物样品中第一分子亚型和第二分子亚型的至少一种基因或由其编码的蛋白的表达水平;以及计算单元,其提供用于从第一分子亚型和第二分子亚型的至少一种基因或由其编码的蛋白的表达水平预测受试者针对抗癌疗法的疗效反应或该抗癌疗法后的预后的信息。
在本发明中,对受试者、生物样品的描述和表达水平的测量的描述与用于预测对抗癌疗法的疗效反应或抗癌疗法后的预后、或识别在抗癌疗法前的新辅助治疗的目标受试者的组合物中描述的那些重叠,并因此将被省略以避免说明书的过度复杂。
此外,在本发明中,关于第一分子亚型和第二分子亚型的描述与生物标志物组合物中的描述重叠,并因此将被省略以避免说明书过于复杂。
在本发明中,抗癌疗法可以是化疗、放疗、手术治疗或它们的组合,优选地,化疗或放疗可以在抗癌疗法之前,更优选地,抗癌疗法可以是标准的新辅助放化疗或标准新辅助放化疗后的手术治疗,但本发明不限于此。
在本发明一个实施方案中,预测预后不良可能意味着在标准新辅助放化疗实现pCR后3年内出现远处转移和60%以上死亡率的病例。
在本发明中,所述设备还可以包括输出预测信息的输出单元,但本发明不限于此。输出单元不受限制,只要它可以在所述设备中输出信息,且所述设备不受限制,只要将信息输出为网页或应用程序即可,例如可以包括计算设备、移动设备、服务器等。
在本发明中,所述设备还可以包括输入单元,用于接收受试者的TNM分期、年龄或性别、pCR或其组合信息,本发明不限于此。
在本发明中,当计算单元确定第一分子亚型或其编码的蛋白在从目标受试者分离的生物样品中表达,或表达水平高于对照时,可以预测抗癌疗法的疗效反应水平为低,并且例如,当计算单元确定第一分子亚型或其编码的蛋白的表达水平高于对照时,可以预测标准新辅助放化疗或标准新辅助放化疗后的手术治疗是低的。
在本发明中,当计算单元确定第一分子亚型或其编码的蛋白在从目标受试者分离的生物样品中表达,或表达水平高于对照时,可以预测抗癌疗法后的预后较差。例如,当计算单元确定第一分子亚型或其编码的蛋白的表达水平高于对照时,可以预测标准新辅助放化疗后的预后或标准新辅助放化疗后的手术治疗后的预后较差,并且具体地,可以预测存活率低、复发概率高、或转移概率高,但本发明不限于此。
在本发明一个实施方案中,当计算单元确定在从目标受试者分离的生物样品中测得的第一分子亚型的表达水平高于对照,并且抗癌疗法(优选标准新辅助放化疗)后未实现pCR时,可以预测预后较差。
在本发明另一实施方案中,当计算单元确定在从目标受试者分离的生物样品中测得的第一分子亚型的表达水平高于对照,并且受试者的TNM分期为T3或T4时,可以预测术后抗癌疗法(优选标准新辅助放化疗或标准新辅助放化疗后的手术治疗)的预后不良。
在本发明又一实施方案中,当计算单元确定从目标受试者分离的生物样品中第一分子亚型的表达水平高于对照,且受试者的TNM分期为N1或N2时,可以预测,抗癌疗法(优选标准新辅助放化疗或手术治疗)后的预后较差。
在本发明又一个实施方案中,当计算单元确定从目标受试者分离的生物样品中第一分子亚型的表达水平高于对照,并且受试者的TNM分期为T3或T4、以及N1或N2时,可以预测抗癌疗法(优选标准新辅助放化疗或手术治疗)后的预后较差。
同时,在本发明一个实施方案中,当计算单元确定在从目标受试者分离的生物样品中测得的第二分子亚型的表达水平高于对照,且抗癌疗法(优选标准新辅助放化疗)后未实现pCR时,可以预计预后良好。
在本发明另一实施方案中,当计算单元确定在从目标受试者分离的生物样品中测量的第二分子亚型的表达水平高于对照,并且在抗癌疗法(优选地,标准新辅助放化疗)后实现pCR时,可以预测抗癌疗法后的预后良好。
在本发明的另一个实施方案中,当计算单元确定从目标受试者分离的生物样品中测得的第二分子亚型的表达水平高于对照,且受试者的TNM分期为T0、T1或T2时,可以预测抗癌疗法(优选标准新辅助放化疗或标准新辅助放化疗后的手术治疗)后的预后良好。
在本发明又一实施方案中,当计算单元确定在从目标受试者分离的生物样品中测得的第二分子亚型的表达水平高于对照,且受试者的TNM分期为N0时,可预测抗癌疗法(优选标准新辅助放化疗或手术治疗)的预后良好。
在本发明又一个实施方案中,当计算单元确定在从目标受试者分离的生物样品中测量的第二分子亚型的表达水平高于对照,且受试者的TNM分期为T0、T1或T2、以及N0时,可以预测抗癌疗法(优选标准新辅助放化疗或手术治疗)后的预后较差。
在本发明中,对照可以是第一分子亚型或第二分子亚型或由其编码的蛋白在正常受试者中的表达水平的平均值,或者相应基因在已患癌症或患癌概率高的受试者(特别是已被诊断患有癌症的受试者)中的表达水平的平均值,但本发明不限于此。
在本发明中,所述癌症可以是选自以下的一种或多种癌症:乳腺癌、子宫癌、食道癌、胃癌、脑癌、直肠癌、结肠癌、肺癌、皮肤癌、卵巢癌、宫颈癌、肾癌、血癌、胰腺癌、前列腺癌、睾丸癌、喉癌、口腔癌、头颈癌、甲状腺癌、肝癌、膀胱癌、骨肉瘤、淋巴瘤、和白血病,优选直肠癌。
有益效果
根据本发明,优势在于,可以预测癌症患者(特别是直肠癌患者)对抗癌疗法(优选新辅助放化疗或手术治疗)的疗效反应或所述治疗后的预后,并且可以根据所述预测的预后制定适当的治疗或监测计划。
附图说明
图1的流程图显示了本发明预备例2的研究设计流程。
图2显示了本发明预备例7用2至5个度量(ranks)的非负矩阵分解(non-negativematrix factorization,NMF)所得的TCGA直肠癌数据分析结果。
图3显示了本发明预备例7用2至5个度量的非负矩阵分解(NMF)进行一致性聚类(consensus clustering)分析所得的TCGA直肠癌数据结果。
图4显示了本发明预备例8的基因集富集分析结果,其中第一分子亚型具有上皮间质转化(epithelial mesenchymal transition,EMT)和癌干细胞的特征。
图5显示了本发明预备例9为观察直肠癌固有分子亚型和结肠癌分子亚型之间的差异而进行的基因集富集分析的结果,表明第一分子亚型具有干细胞特征。
图6显示了根据本发明实验例1选出的第一基因集对来自延世癌症中心的230例直肠癌患者进行亚型归类得出的无病存活率(DFS)。
图7显示了根据本发明一个实施方案选出的第二基因集进行亚型归类的患者的无病存活率(DFS)。
图8显示了根据本发明实验例2的分子亚型归类的直肠癌患者的无病存活率(DFS)之间的差异。
图9显示了根据本发明实验例2的直肠癌患者依赖于pCR的总存活率(OS)的差异。
图10显示了根据本发明实验例4的直肠癌患者基于N分期的无病存活率的差异。
图11显示了根据本发明实验例4的直肠癌患者基于分子亚型和N分期的无病存活率的差异。
图12显示了根据本发明实验例4的直肠癌患者基于N分期的总体存活率(OS)的差异。
图13显示了根据本发明实验例4的直肠癌患者基于分子亚型和N分期的总存活率(OS)的差异。
图14显示了根据本发明实验例5的CMS分子亚型预测直肠癌患者无病存活率的能力。
图15显示了根据本发明实验例5的CRIS分子亚型预测直肠癌的能力。
图16显示了根据本发明实施例1的根据第一分子亚型和第二分子亚型和患者的病理特征的直肠癌治疗方案。
具体实施方式
本发明的一个目的在于提供一种生物标志物组合物,其可以准确且简单地预测针对抗癌疗法的疗效反应或该抗癌疗法的预后。
在下文中,本发明将参考实施例更详细地描述。这些实施例仅用于更详细地说明本发明,对本领域的普通技术人员来说显而易见的是,根据本发明的主旨,本发明的范围不受这些实施例的限制。
实施例
[预备例1]研究群组(Research cohort)
为了开发直肠癌特异性分子亚型归类机制,用到两个临床群组,包括可从CancerGenome Atlas Project下载的177例直肠癌患者的公开可用RNAseq数据,以及由来自延世大学癌症中心的230例直肠癌病例组成的验证群组的RNAseq数据。
[预备例2]研究设计
图1是显示研究设计(research design)的示意流程的流程图。
为了找到固有的(intrinsic)直肠癌分子亚型,使用非负矩阵分解(NMF)的基因和在已识别亚型之间差异化表达的基因用DEseq2包进行鉴定。基于对DEseq2数据的基因集富集分析,发明人建立了分子亚型在预测对化疗的反应和预后方面的作用的临床假设,并前瞻性地测试了在延世癌症中心诊断和治疗的230例直肠癌。为了将来自延世癌症中心的直肠癌患者组归类到各个分子亚型,用522个在DESeq2分析中表达水平有两倍以上差异且p值小于10-5的基因的列表构建分子亚型分组基因列表。此外,为了开发针对发现的分子亚型的最佳归类基因列表,使用了微阵列预测分析。
[预备例3]验证群组(Validation cohort)
对延世癌症中心(韩国首尔)1995年至2012年的直肠腺癌患者病史进行调查以预测直肠癌患者的预后,结果确认了264例,根据纳入标准,纳入了1)在放射前疗法(preop-CRT)后进行全肠系膜切除(total mesenteric excision,TME)和2)用福尔马林固定石蜡包埋(FFPE)的治疗前活检样本的病例。3)一例患者接受不完全CRT、转移性疾病或姑息治疗(palliative treatment)的病例被排除在外。
CRT用3D适形技术(conformal technique)每周5次以25个180cGy的份量向骨盆输送总计45Gy,加强放疗的540cGy分3份进行。用5-氟尿嘧啶结合亚叶酸(leucovorin)或卡培他滨(capcitabine)进行同时化疗。TME在CRT完成后6至8周内进行。除非术后病理检查报告pCR,否则给予基于氟尿嘧啶的术后放疗(postop-CRT)。
手术后,前3年每3个月随访一次,接下来的2年每6个月随访一次,此后每年随访一次。常规监测包括体格检查、内窥镜检、血清癌胚胎抗原、胸腹盆腔CT扫描、以及毒性评估。当怀疑复发时,进行组织学确认、MRI或FDG-PET以进一步评估。盆腔内复发定义为局部复发,其他复发定义为远处复发。
[预备例4]RNAseq和质量控制
使用Qiagen AllPrepDNA/RNA FFPE试剂盒(Qiagen,Valencia,CA,USA),从264个病例经福尔马林固定后石蜡包埋的活检组织中提取RNA。根据可用组织的数量,从1到17个5微米厚的组织切片中提取富含肿瘤的区域。RNA浓度通过荧光分析(Qubit RNA Assay kit,ThermoFisher Scientific,USA)定量。RNAseq用Ion Proton平台按厂家说明书执行。排除数据质量差的34例。
[预备例5]RNAseq数据和基因集富集分析
使用HT-seq和Ensembl GRCh37基因模型对基因表达值进行量化。通过DESeq方差稳定变换(variance stabilizing transformation,VST)对计数数据进行归一化。使用最近模板预测(Nearest Template Prediction)和来自DESeq2的522个归类机制基因模板,将病例分配到NMF衍生的原生亚型(native subtypes)。此外,利用基因集富集分析功能、结肠癌和结直肠癌(CRC)共有分子亚型(consensus molecular subtype,CMS)包(package)的“CMSgsa”和“fgsea”包,对结肠癌和癌相关基因集进行富集分析。
[预备例6]按内在亚型对临床结果进行统计分析
所有统计分析均使用R统计编程环境版本3.6.3和R Studio版本1.2.5033进行。主要评估标准是无病存活率(DFS),定义为在首次局部或远处复发事件、死亡或删失(censorship)的情况下,从手术日期到末次随访的时间。次要评估变量包括无远处复发的存活率(DRFS)、无局部复发的存活率(LRFS)和总存活率(OS)。对于LRFS和DRFS分析,数据在竞争(competition)事件当时被删失。OS定义为从手术日期到死亡日期的时间,或删失时的末次随访。对于存活分析,使用了R存活包。Survminer和ggplot2包用于生成Kaplan-Meier图谱(plot)。Kaplan-Meier方法用于比较固有亚型之间的存活差异,并使用对数秩检验来检验。与DFS和OS相关的因素通过Cox比例风险回归分析来分析。双侧p值小于0.05被认为具有统计学意义。每个预后模型的相对准确性使用对数似然比和关联指数(C-index)来评估。
[预备例7]使用来自TCGA-READ群组的RNAseq数据发现直肠癌分子亚型
图2显示了使用非负矩阵分解(NMF)的TCGA直肠癌数据分析结果指标。
图3显示了2到5个度量的非负矩阵分解(NMF)的一致性聚类结果。
从Cancer Genome Atlas Project下载了177个直肠癌样本的RNAseq数据(TCGA-READ.htseq_fpkm-uq.tsv)。为了用R包“NMF”识别亚型的最佳数量,进行了2到5个度量的非负矩阵分解分析。通过一致性聚类发现的共生指数(cophenetic index)和轮廓提示,将直肠癌分为两个分子亚型将是最好的选择。
[预备例8]直肠癌两种固有分子亚型的性质
图4显示了所发现的两种分子亚型的基因集富集分析结果。
为找出所发现的两种分子亚型的生物学特性,利用R的“fgsea”包并利用“CMSgsa”包进行基因集富集分析,以识别两种亚型之间显著不同的生物学通路。如图4所示,对于多个特异性癌症通路而言,在第一分子亚型中,上皮间质转化(EMT)通路和干细胞特异性基因表达相对丰富,而在第二分子亚型中,MYC靶向、细胞分裂、氧化磷酸化和DNA修复通路的基因表达相对丰富。
[预备例9]直肠癌固有分子亚型与结肠癌分子亚型的区别
图5是显示基因集富集分析结果的热图,以查看直肠癌固有分子亚型和结肠癌分子亚型之间的差异。
同时,直肠癌已被纳入结直肠癌的分子亚型归类中,因为它已被判为结直肠癌的一部分。结肠癌的分子亚型被全球共识分为四种分子亚型,即共有分子亚型(CMS)1至4。CMS4亚型预后不良,上皮间质转化通路基因被激活,因此很可能与本发明人发现的第一分子亚型相同。因此,将TCGA-READ RNAseq数据用CMScaller包归类为CMS分子亚型,并检查了本发明人发现的两种分子亚型之间的相关性。只有58.8%的第一分子亚型被归类为CMS4,17.5%的第二分子亚型被归类为CMS4。这表明它们具有统计学上显著的相关性,但不匹配。
表1
CMS1 CMS2 CMS3 CMS4 总计
第一分子亚型 8 13 12 47(58·8%) 80
第二分子亚型 12 46 22 17(17·5%) 97
总计 20 59 34 64 177
使用“CMScaller”包的“CMSgsa”功能对两种归类方法归类的8种直肠癌进行基因集富集分析,以了解CMS4与第一分子亚型的区别,结果如图5所示,被归类为CMS4分子亚型的直肠癌固有第一分子亚型的EMT相关基因表达与第二分子亚型相似,但一个表达在干细胞中的基因集的表达增加。另一方面,发现表达在干细胞中的多个基因集的表达增加,而细胞分裂相关基因集MYC、DNA修复和细胞周期的表达减少。这些结果证明,本发明人发现的直肠癌固有分子亚型与结肠癌分子亚型有显著的差异。
此外,基于上述数据假设,与第二分子亚型相比,第一分子亚型关联着较差的预后和较低的对术前放化疗的反应。
[预备例10]开发针对新发现的分子亚型的归类机制(1)
图5显示了85个最佳基因,它们能够使用Microarray R包(PAMr)的预测分析对两种分子亚型进行归类。
用Microarray R包(PAMr)的预测分析开发新发现的分子亚型的归类机制。为了分析,设阈值为6且prop-selected-in-cv阈值为0.6。作为参考,即使该阈值和该prop-selected-in-cv阈值发生变化,其影响所选基因的数量和归类机制的最终表现,但端部(top)归类机制基因保持不变,临床表现类似于p值的部分变化。该分析的结果,初步选出94个基因作为亚型归类的模板,如表2所示。在表2的分子亚型栏中,1表示第一分子亚型,2表示第二分子亚型。
表2
Figure BDA0003655108640000191
Figure BDA0003655108640000201
Figure BDA0003655108640000211
Figure BDA0003655108640000221
如表2所示,在初步选出的第一分子亚型中相对过表达的归类基因是ACADL,ADAMTS9-AS1,ARHGEF18,BCHE,BLOC1S5-TXNDC5,BVES-AS1,C10orf131,CCDC144B,CDH19,CTAGE8,EPHA6,FAM133A,FAM35BP,FAM47E-STBD1,FILIP1,GAS1RR,GOLGA8K,GRIA2,GRIN2A,GTF2IP1,HCG23,HIST2H3C,HLX-AS1,HNRNPA1P33,KCTD8,KIAA0408,KIAA2022,KRT222,LGI1,LINC00504,LINC01266,LINC01352,LINC01489,LINC01537,LINGO2,LOC100507073,LOC100507387,LOC101928509,LOC101929607,LOC440434,LOC642131,LOC644838,LONRF2,MEIS1-AS2,MIR133A1HG,MIR186,MIR3911,MIR4477B,MYH8,NEXN,NLGN1,OR7E12P,PCDH10,PGM5-AS1,PGM5P3-AS1,PLCXD3,PLGLB2,PLN,RANBP3L,SCN7A,SCN9A,SEMA3E,SLITRK4,SYT4,TBC1D3L,TCEAL2,TVP23C-CDRT4,ZNF676,和ZNF728。
同时,在初选的第二分子亚型中相对过表达的归类基因是C4orf48,CTU1,EIF3IP1,FAM173A,FEZF2,LOC440311,MIR3661,NOXO1,PDF,PRR7,SNHG25,SNORD30,SNORD38A,TMEM160,TPGS1,和TRAPPC5。
当通过RNAseq方法分析基因表达时,由于可以同时测量多个基因的表达水平,因此可以应用由更多基因组成的集合(panel)而不是94个基因的集合。两种亚型之间差异化表达的基因用R中的“DEseq2”包鉴定。在p<10-7的统计显著性水平下,两种分子亚型之间有4877个差异化表达的基因。在4877个基因中,可以通过多种方式选择和组合一些基因来开发分子亚型归类机制,在一个例子中,如表3所示,可以通过选择522个在两种分子亚型之间的表达水平的差异达2倍以上的基因作为模板进行归类。在下表3的分子亚型栏中,1表示第一分子亚型,2表示第二分子亚型。
表3
Figure BDA0003655108640000222
Figure BDA0003655108640000231
Figure BDA0003655108640000241
Figure BDA0003655108640000251
Figure BDA0003655108640000261
Figure BDA0003655108640000271
Figure BDA0003655108640000281
Figure BDA0003655108640000291
Figure BDA0003655108640000301
Figure BDA0003655108640000311
Figure BDA0003655108640000321
Figure BDA0003655108640000331
Figure BDA0003655108640000341
Figure BDA0003655108640000351
Figure BDA0003655108640000361
Figure BDA0003655108640000371
如表3所示,第二次选出的第一分子亚型是AADACL2,ABCA6,ABCA8,ABCA9,ABCB5,ABI3BP,ACADL,ACSM5,ACTG2,ADAMTS9-AS1,ADAMTS9-AS2,ADAMTSL3,ADCYAP1R1,ADGRB3,ADH1B,ADIPOQ,ADRA1A,AFF3,AGTR1,AICDA,ALB,ANGPTL1,ANGPTL5,ANGPTL7,ANK2,ANKS1B,ANXA8L1,APOA2,APOB,APOC3,AQP4,AQP8,ARPP21,ART4,ASB5,ASPA,ASTN1,ATCAY,ATP1A2,ATP2B2,ATP2B3,AVPR1B,B3GALT5-AS1,BCHE,BEST4,BHMT2,BLOC1S5-TXNDC5,BMP3,BRINP3,BVES,BVES-AS1,C14orf180,C1QTNF7,C7,C8orf88,CA1,CA2,CA7,CACNA2D1,CADM2,CADM3,CALN1,CARTPT,CASQ2,CAVIN2,CCBE1,CCDC144B,CCDC158,CCDC160,CCDC169,CCN5,CD300LG,CDH10,CDH19,CDKN2B-AS1,CDO1,CHRDL1,CHRM2,CHST9,CIDEA,CILP,CLCA4,CLCNKB,CLDN8,CLEC3B,CLEC4M,CLVS2,CMA1,CNGA3,CNN1,CNR1,CNTN1,CNTN2,CNTNAP4,COL19A1,CP,CPEB1,CPXM2,CR2,CRP,CTNNA3,CTSG,CYP1B1,DAO,DCLK1,DDR2,DES,DHRS7C,DIRAS2,DPP6,DPT,EBF2,ECRG4,ELAVL4,EPHA5,EPHA6,EPHA7,ERICH3,EVX2,FABP4,FAM106A,FAM133A,FAM135B,FAM180B,FDCSP,FGF10,FGF13-AS1,FGF14,FGFBP2,FGG,FGL1,FHL1,FILIP1,FLNC,FMO2,FRMD6-AS2,FRMPD4,FUT9,GABRA5,GABRG2,GALR1,GAP43,GAS1RR,GC,GCG,GDF6,GFRA1,GNAO1,GPM6A,GPR119,GPR12,GPRACR,GRIA2,GRIN2A,GTF2IP1,GUCA2B,HAND1,HAND2,HAND2-AS1,HEPACAM,HP,HPCAL4,HRG,HRK,HSPB8,HTR2B,IGSF10,IGSF11,IRX6,ISM1,KCNA1,KCNB1,KCNC2,KCNK2,KCNMA1,KCNMB1,KCNQ5,KCNT2,KCTD8,KERA,KHDRBS2,KIAA0408,KIF1A,KRT222,KRT24,KRTAP13-2,LCN10,LDB3,LEP,LGI1,LIFR,LINC00504,LINC00507,LINC00682,LINC00924,LINC01266,LINC01352,LINC01474,LINC01505,LINC01697,LINC01798,LINC01829,LINC02015,LINC02023,LINC02185,LINC02268,LINC02408,LINC02544,LIX1,LMO3,LMOD1,LOC100506289,LOC101928731,LOC102724050,LOC107986321,LOC283856,LOC440434,LOC729558,LONRF2,LRAT,LRCH2,LRRC3B,LRRC4C,LRRTM4,LVRN,LYVE1,MAB21L1,MAB21L2,MAGEE2,MAMDC2,MAPK4,MASP1,MEF2C-AS1,MEOX2,METTL24,MFAP5,MGAT4C,MGP,MICU3,MIR133A1HG,MIR8071-1,MMRN1,MORN5,MPPED2,MRGPRE,MS4A1,MS4A12,MSRB3,MUSK,MYH11,MYH2,MYLK,MYO3A,MYOC,MYOCD,MYOM1,MYOT,MYT1L,NALCN,NAP1L2,NBEA,NECAB1,NEFL,NEFM,NEGR1,NETO1,NEUROD1,NEXMIF,NEXN,NGB,NIBAN1,NLGN1,NOS1,NOVA1,NPR3,NPTX1,NPY2R,NRG3,NRK,NRSN1,NRXN1,NSG2,NTNG1,NTRK3,NUDT10,OGN,OLFM3,OMD,OTOP2,OTOP3,P2RX2,P2RY12,PAK3,PAPPA2,PCDH10,PCDH11X,PCDH9,PCOLCE2,PCP4L1,PCSK2,PDZRN4,PEG3,PENK,PGM5,PGM5-AS1,PGM5P4-AS1,PGR,PHOX2B,PI16,PIK3C2G,PIRT,PKHD1L1,PLAAT5,PLCXD3,PLD5,PLIN1,PLIN4,PLN,PLP1,PMP2,POPDC2,POU3F4,PPP1R1A,PRDM6,PRELP,PRG4,PRIMA1,PROKR1,PTCHD1,PTGIS,PTPRQ,PTPRZ1,PYGM,PYY,RANBP3L,RBFOX3,RBM20,RELN,RERGL,RGS13,RGS22,RIC3,RIMS4,RNF150,RNF180,RORB,RSPO2,SCARA5,SCGN,SCN2B,SCN7A,SCN9A,SCNN1G,SCRG1,SEMA3E,SERTM1,SERTM2,SFRP1,SFRP2,SFTPA1,SGCG,SHISAL1,SLC13A5,SLC17A8,SLC30A10,SLC4A4,SLC5A7,SLC6A2,SLC7A14,SLIT2,SLITRK2,SLITRK3,SLITRK4,SMIM28,SMYD1,SNAP25,SNAP91,SORCS1,SORCS3,SPHKAP,SPIB,SPOCK3,SST,ST8SIA3,STMN2,STMN4,STON1-GTF2A1L,STUM,SV2B,SYNM,SYNPO2,SYT10,SYT4,SYT6,TACR1,TAFA4,TCEAL2,TCEAL5,TCF23,TENM1,THBS4,TLL1,TMEFF2,TMEM100,TMEM35A,TMIGD1,TMOD1,TNNT3,TNS1,TNXB,TRARG1,TRDN,UGT2B10,UGT2B4,UNC80,VEGFD,VGLL3,VIT,VSTM2A,VXN,WSCD2,XKR4,ZBTB16,ZDHHC22,ZFHX4,ZMAT4,ZNF385B,ZNF676,和ZNF728。
同时,第二次选出的第二分子亚型是ADAT3,ANP32D,BHLHA9,BOD1L2,C4orf48,CCDC85B,CDH16,CLMAT3,CSNK1A1L,CTU1,DBET,DDC-AS1,DEFA5,EIF3IP1,FAM173A,FEZF2,FOXI3,FRMD8P1,GALR3,GJD3,GPR25,HBA1,HES4,HIST1H4A,HIST1H4L,HLA-L,IGFBP7-AS1,ITLN2,KCNE1B,LCN15,LKAAEAR1,LOC101927795,LOC101927972,LOC101928372,LOC344967,LRRC26,MAGEA10,MESP1,MIR203A,MIR324,MIR3661,MIR4449,MIR4479,MIR4665,MIR4737,MIR4767,MIR6807,MIR6858,MIR6891,MIR8075,NACA2,NOXO1,ONECUT3,PCSK1N,PDF,PITPNM2-AS1,PNMA5,PRR7,PRSS2,PRSS56,PTGER1,PTTG3P,REG3A,RNA5S9,RNU4-1,RNU5A-1,RNU5B-1,RNU5E-1,RNU6ATAC,RNY1,RPL29P2,RPRML,SBF1P1,SHISAL2B,SKOR2,SLC32A1,SMARCA5-AS1,SMCR5,SNHG25,SNORA36A,SNORD30,SNORD38A,SNORD3B-2,SNORD41,SNORD48,TMEM160,TMEM238,TPGS1,TRAPPC5,UBE2NL,WBP11P1,和ZAR1。
值得注意的是,归类基因模板包括假基因、miRNA和非编码基因,这些基因通常被排除在此类分析之外,这可以解释为什么迄今为止还没有报道过稳健的亚型归类机制。
[预备例11]开发新发现的分子亚型的归类机制(2)
为了确认归类机制基因模板的其他可能版本,根据PAM分析中使用的阈值,发现一个略有不同的具有相似主要贡献基因的模板基因列表。这样的模板基因可以用于类似的临床应用。表4至表7是可以替代第一次或第二次选出的基因模板的模板。在下表4至7的分子亚型栏中,1表示第一分子亚型,2表示第二分子亚型。
表4
Figure BDA0003655108640000381
Figure BDA0003655108640000391
Figure BDA0003655108640000401
Figure BDA0003655108640000411
表5
Figure BDA0003655108640000412
Figure BDA0003655108640000421
Figure BDA0003655108640000431
Figure BDA0003655108640000441
Figure BDA0003655108640000451
Figure BDA0003655108640000461
Figure BDA0003655108640000471
Figure BDA0003655108640000481
表6
Figure BDA0003655108640000482
Figure BDA0003655108640000491
表7
Figure BDA0003655108640000492
Figure BDA0003655108640000501
Figure BDA0003655108640000511
Figure BDA0003655108640000521
[预备例12]开发新发现的分子亚型的归类机制(3)
另外,下表8是可以替换第一分子亚型对应的一个基因亚型的模板,表9是可以替换第二分子亚型对应的一个基因亚型的模板。
表8
Figure BDA0003655108640000522
Figure BDA0003655108640000531
表9
Figure BDA0003655108640000532
Figure BDA0003655108640000541
[实验例1]验证新开发的分子亚型归类机制的临床实用性(1)
图6和7显示了根据本发明一个实施例的来自延世癌症中心的230例直肠癌患者的RNAseq归类数据。
为了对在延世癌症中心治疗的230例直肠癌患者的治疗前活检样本进行归类,使用了最近模板预测(NTP)法。下表10显示了由初选出的94个基因的集合归类的分子亚型与对术前放化疗的反应之间的相关性。
表10
第一分子亚型 第二分子亚型 总计
病理不完全缓解 33 48 81
病理完全缓解 6(15.4%) 26(35.1%) 32(28.3%)
总计 39 74 113
通过对初选的94个基因的集合应用NTP法,对230例直肠癌患者进行归类。113例患者被可靠归类(错误发现率<0.2),但无法准确归类97例患者。在能被归类的113例中,第一分子亚型的pCR率为15.4%(39例患者中有6例),而第二分子亚型的pCR率是第一分子亚型的两倍,为35.1%(74例患者中的26例)(卡方=3.98,p=0.046)。
图6显示了按初选基因集所归类的各亚型的患者的无病存活率(DFS)。正如低pCR关联性所预期的,第一分子亚型(预测=1)的病例比第二分子亚型(预测=2)关联更差的DFS(p=0.0023)。
下面的表11显示了第二次选出的522个基因的基因集所归类的各亚型与对术前放化疗的反应之间的关联性。
表11
第一分子亚型 第二分子亚型 总计
病理不完全缓解 57 78 135
病理完全缓解 6(9.5%) 45(36.6%) 51
总计 63(33.9%) 123(66.1%) 186
通过对第二次选出的522个基因的基因集应用NTP法,对230例直肠癌患者进行归类。186例患者被可靠归类(错误发现率<0.2),但无法准确归类44例患者。在能被归类的186例中,第一分子亚型的pCR率为9.5%(63例中有6例),第二分子亚型的pCR率是第一分子亚型的两倍,为36.6%(123例患者中有45例)(卡方=14.0,p=0.0002)。
图7显示了根据初选基因集归类的亚型的患者的无病存活率(DFS)。正如低pCR关联性所预期的,第一分子亚型(预测=1)的情况比第二分子亚型(预测=2)关联更差的DFS(p=0.0015)。
[实验例2]验证新开发的分子亚型归类机制的临床实用性(2)
在术前放化疗后的手术中,根据表8的第一分子亚型和表9的第二分子亚型预测直肠癌的预后的能力被证实,并被表示为DFS(图8)和OS(图9)。然而,该验证是对整个患者群组(N=230)进行的。
如图8和9所示,证实了在第一分子亚型中比在第二分子亚型中,术前放化疗后的手术中的DFS和OS偏低,而当检查图8和9的分子亚型时,可看到预测直肠癌治疗后的预后的能力是优异的。
[实验例3]确认治疗前根据分子亚型和病理特征预测直肠癌患者的预后的能力
由于直肠癌的诊断是通过对小组织活检标本的病理检查和诸如CT-MRI等放射诊断来进行,因此在开始治疗前预测患者的预后是不容易的。表12显示了对治疗开始前可以实施或测量的候选预后因素进行的单变量和多变量分析的结果。cN_分期(stage)表示临床确定的淋巴结转移程度,cT_分期表示临床确定的肿瘤大小。在表12中,OR表示优势比(oddsratio),CI表示置信区间。
分析结果清楚表明,只有分子亚型才能在治疗开始前预测患者的预后(p<0.001)。这为分子亚型赋予了非常大的临床意义。近来,直肠癌的治疗正在转向总新辅助治疗(TNT),其在手术前进行所有可能的治疗。在这种情况下,可以根据预测的患者预后考虑其他治疗剂。也就是说,在第一分子亚型的情况下,可以考虑更强大的治疗方法,因此分子亚型可以为正在开发的新药的临床试验区分目标群体发挥重要作用。
表12
Figure BDA0003655108640000551
[实验例4]确认在新辅助放化疗后根据分子亚型和病理特征预测直肠癌患者的预 后的能力
表13显示了候选因素与分子亚型之间关联性的调查结果,所述分子亚型是可用于确定直肠癌患者在新辅助放化疗和手术后的预后的那些。结果表明,分子亚型与治疗后的癌症大小(ypT分期)和pCR在统计学上显著相关(在第一分子亚型的情况下,大小大而pCR低),但不与淋巴结转移程度(ypN分期)或患者的年龄和性别相关。
表13
Figure BDA0003655108640000561
表14显示了对可用于确定直肠癌患者新辅助放化疗和手术后预后的候选因素的单变量和多变量统计分析结果。
表14
Figure BDA0003655108640000562
Figure BDA0003655108640000571
如表14所示,在单变量分析中,从DFS和OS可以预测:治疗后的癌症大小(ypT分期)、淋巴结转移程度(ypN分期)、pCR和分子亚型都是统计学显著的。然而,从多变量分析的结果可以看出,只有ypN分期和分子亚型是显著的。即,这表明,由于ypN分期和分子亚型各自独立地影响DFS,因此当两个因素一起使用时,可以更准确地预测预后。为了证明这一点,用Kaplan-Meier图谱研究了基于ypN分期和分子亚型的DFS和OS。
图10的Kaplan-Meier图谱按治疗后手术中发现的淋巴结转移的存在或不存在(ypN分期)来分析DFS。
图11的Kaplan-Meier图谱按治疗后手术中发现的淋巴结转移的存在或不存在(ypN分期)以及分子亚型来分析DFS。
图12的Kaplan-Meier图谱按治疗后手术中发现的淋巴结转移的存在或不存在(ypN分期)来分析OS。
图13的Kaplan-Meier图谱按治疗后手术中发现的淋巴结转移的存在或不存在(ypN分期)以及分子亚型来分析OS。
当如图11和13所示将ypN分期和分子亚型一起使用时,与图10和12仅使用ypN分期相比,尽管有标准的新辅助放化疗,具有极高复发率(三年内复发率60%以上)和低存活率(OS)的患者组仍可以提前预测。该患者组作为新药临床试验的目标组是很重要的,因为这些患者必须尝试不同的治疗药物,而不是新辅助放化疗之后的术后或术前标准疗法。
[实验例5]研究常规开发的CMS分子亚型归类机制对直肠癌的预测能力
另一方面,为了研究CMS和CRIS亚型(它们是预测结直肠癌(CRC)预后的常规分子亚型)的常规归类机制预测直肠癌的能力,使用NTP以及由CMScaller包提供的归类机制基因模板,使用CMS分子亚型时的直肠癌群组中的DFS和OS见图14,使用CRIS分子亚型时获得的DFS和OS见图15。
如图14和15所示,CMS和CRIS均未显示出与临床评估变量的统计学显著关联。具体而言,由于根据CMS分子亚型的直肠癌患者存活率(DFS和OS)没有显著差异,因此预测直肠癌患者预后的能力没有统计学显著性(P=0.12)。此外,根据CRIS分子亚型的直肠癌患者存活率(DFS和OS)无显著差异,预测直肠癌患者预后的能力也无统计学意义(P=0.77)。
[实施例1]根据分子亚型和病理特征的直肠癌治疗方案
基于实验例1-4,根据第一分子亚型和第二分子亚型预测直肠癌预后的方法见图16。
如图16所示,传统上,在标准新辅助放化疗后手术后实现pCR时,不再有进一步治疗,而按本发明根据第一分子亚型(亚型1)和第二分子亚型(亚型2)归类后的方案,(1)当结果对应于第二分子亚型,并且治疗后实现pCR时,不再有进一步的治疗,(2)当结果对应于第二分子亚型且未实现pCR时,进行追加化疗,(3)当结果对应于第一分子亚型时,无论是否达到pCR,都进行持续化疗。
在上文中,已经详细描述了说明书的具体部分,本领域技术人员清楚该具体技术仅仅是优选实施方案,但说明书的范围不限于此。因此,本说明书的实质范围将由所附权利要求及其等同方案来定义。
实用性
本发明涉及用于预测对直肠癌的新辅助放化疗的反应或治疗后的预后的组合物和使用该组合物的预测方法。
序列表
<110> 洛博生物科技有限公司
<120> 预测对标准新辅助放化疗的反应和治疗后的预后的组合物、以及预测标准疗法预后不良的患者的方法和组合物
<130> G22U18C0147P/CN
<150> KR 10-2019-0149594
<151> 2019-11-20
<160> 11
<170> PatentIn version 3.2
<210> 1
<211> 660
<212> PRT
<213> Homo sapiens
<400> 1
Met Glu Ala Leu Met Ala Arg Gly Ala Leu Thr Gly Pro Leu Arg Ala
1 5 10 15
Leu Cys Leu Leu Gly Cys Leu Leu Ser His Ala Ala Ala Ala Pro Ser
20 25 30
Pro Ile Ile Lys Phe Pro Gly Asp Val Ala Pro Lys Thr Asp Lys Glu
35 40 45
Leu Ala Val Gln Tyr Leu Asn Thr Phe Tyr Gly Cys Pro Lys Glu Ser
50 55 60
Cys Asn Leu Phe Val Leu Lys Asp Thr Leu Lys Lys Met Gln Lys Phe
65 70 75 80
Phe Gly Leu Pro Gln Thr Gly Asp Leu Asp Gln Asn Thr Ile Glu Thr
85 90 95
Met Arg Lys Pro Arg Cys Gly Asn Pro Asp Val Ala Asn Tyr Asn Phe
100 105 110
Phe Pro Arg Lys Pro Lys Trp Asp Lys Asn Gln Ile Thr Tyr Arg Ile
115 120 125
Ile Gly Tyr Thr Pro Asp Leu Asp Pro Glu Thr Val Asp Asp Ala Phe
130 135 140
Ala Arg Ala Phe Gln Val Trp Ser Asp Val Thr Pro Leu Arg Phe Ser
145 150 155 160
Arg Ile His Asp Gly Glu Ala Asp Ile Met Ile Asn Phe Gly Arg Trp
165 170 175
Glu His Gly Asp Gly Tyr Pro Phe Asp Gly Lys Asp Gly Leu Leu Ala
180 185 190
His Ala Phe Ala Pro Gly Thr Gly Val Gly Gly Asp Ser His Phe Asp
195 200 205
Asp Asp Glu Leu Trp Thr Leu Gly Glu Gly Gln Val Val Arg Val Lys
210 215 220
Tyr Gly Asn Ala Asp Gly Glu Tyr Cys Lys Phe Pro Phe Leu Phe Asn
225 230 235 240
Gly Lys Glu Tyr Asn Ser Cys Thr Asp Thr Gly Arg Ser Asp Gly Phe
245 250 255
Leu Trp Cys Ser Thr Thr Tyr Asn Phe Glu Lys Asp Gly Lys Tyr Gly
260 265 270
Phe Cys Pro His Glu Ala Leu Phe Thr Met Gly Gly Asn Ala Glu Gly
275 280 285
Gln Pro Cys Lys Phe Pro Phe Arg Phe Gln Gly Thr Ser Tyr Asp Ser
290 295 300
Cys Thr Thr Glu Gly Arg Thr Asp Gly Tyr Arg Trp Cys Gly Thr Thr
305 310 315 320
Glu Asp Tyr Asp Arg Asp Lys Lys Tyr Gly Phe Cys Pro Glu Thr Ala
325 330 335
Met Ser Thr Val Gly Gly Asn Ser Glu Gly Ala Pro Cys Val Phe Pro
340 345 350
Phe Thr Phe Leu Gly Asn Lys Tyr Glu Ser Cys Thr Ser Ala Gly Arg
355 360 365
Ser Asp Gly Lys Met Trp Cys Ala Thr Thr Ala Asn Tyr Asp Asp Asp
370 375 380
Arg Lys Trp Gly Phe Cys Pro Asp Gln Gly Tyr Ser Leu Phe Leu Val
385 390 395 400
Ala Ala His Glu Phe Gly His Ala Met Gly Leu Glu His Ser Gln Asp
405 410 415
Pro Gly Ala Leu Met Ala Pro Ile Tyr Thr Tyr Thr Lys Asn Phe Arg
420 425 430
Leu Ser Gln Asp Asp Ile Lys Gly Ile Gln Glu Leu Tyr Gly Ala Ser
435 440 445
Pro Asp Ile Asp Leu Gly Thr Gly Pro Thr Pro Thr Leu Gly Pro Val
450 455 460
Thr Pro Glu Ile Cys Lys Gln Asp Ile Val Phe Asp Gly Ile Ala Gln
465 470 475 480
Ile Arg Gly Glu Ile Phe Phe Phe Lys Asp Arg Phe Ile Trp Arg Thr
485 490 495
Val Thr Pro Arg Asp Lys Pro Met Gly Pro Leu Leu Val Ala Thr Phe
500 505 510
Trp Pro Glu Leu Pro Glu Lys Ile Asp Ala Val Tyr Glu Ala Pro Gln
515 520 525
Glu Glu Lys Ala Val Phe Phe Ala Gly Asn Glu Tyr Trp Ile Tyr Ser
530 535 540
Ala Ser Thr Leu Glu Arg Gly Tyr Pro Lys Pro Leu Thr Ser Leu Gly
545 550 555 560
Leu Pro Pro Asp Val Gln Arg Val Asp Ala Ala Phe Asn Trp Ser Lys
565 570 575
Asn Lys Lys Thr Tyr Ile Phe Ala Gly Asp Lys Phe Trp Arg Tyr Asn
580 585 590
Glu Val Lys Lys Lys Met Asp Pro Gly Phe Pro Lys Leu Ile Ala Asp
595 600 605
Ala Trp Asn Ala Ile Pro Asp Asn Leu Asp Ala Val Val Asp Leu Gln
610 615 620
Gly Gly Gly His Ser Tyr Phe Phe Lys Gly Ala Tyr Tyr Leu Lys Leu
625 630 635 640
Glu Asn Gln Ser Leu Lys Ser Val Lys Phe Gly Ser Ile Lys Ser Asp
645 650 655
Trp Leu Gly Cys
660
<210> 2
<211> 359
<212> PRT
<213> Homo sapiens
<400> 2
Met Ile Leu Asn Ser Ser Thr Glu Asp Gly Ile Lys Arg Ile Gln Asp
1 5 10 15
Asp Cys Pro Lys Ala Gly Arg His Asn Tyr Ile Phe Val Met Ile Pro
20 25 30
Thr Leu Tyr Ser Ile Ile Phe Val Val Gly Ile Phe Gly Asn Ser Leu
35 40 45
Val Val Ile Val Ile Tyr Phe Tyr Met Lys Leu Lys Thr Val Ala Ser
50 55 60
Val Phe Leu Leu Asn Leu Ala Leu Ala Asp Leu Cys Phe Leu Leu Thr
65 70 75 80
Leu Pro Leu Trp Ala Val Tyr Thr Ala Met Glu Tyr Arg Trp Pro Phe
85 90 95
Gly Asn Tyr Leu Cys Lys Ile Ala Ser Ala Ser Val Ser Phe Asn Leu
100 105 110
Tyr Ala Ser Val Phe Leu Leu Thr Cys Leu Ser Ile Asp Arg Tyr Leu
115 120 125
Ala Ile Val His Pro Met Lys Ser Arg Leu Arg Arg Thr Met Leu Val
130 135 140
Ala Lys Val Thr Cys Ile Ile Ile Trp Leu Leu Ala Gly Leu Ala Ser
145 150 155 160
Leu Pro Ala Ile Ile His Arg Asn Val Phe Phe Ile Glu Asn Thr Asn
165 170 175
Ile Thr Val Cys Ala Phe His Tyr Glu Ser Gln Asn Ser Thr Leu Pro
180 185 190
Ile Gly Leu Gly Leu Thr Lys Asn Ile Leu Gly Phe Leu Phe Pro Phe
195 200 205
Leu Ile Ile Leu Thr Ser Tyr Thr Leu Ile Trp Lys Ala Leu Lys Lys
210 215 220
Ala Tyr Glu Ile Gln Lys Asn Lys Pro Arg Asn Asp Asp Ile Phe Lys
225 230 235 240
Ile Ile Met Ala Ile Val Leu Phe Phe Phe Phe Ser Trp Ile Pro His
245 250 255
Gln Ile Phe Thr Phe Leu Asp Val Leu Ile Gln Leu Gly Ile Ile Arg
260 265 270
Asp Cys Arg Ile Ala Asp Ile Val Asp Thr Ala Met Pro Ile Thr Ile
275 280 285
Cys Ile Ala Tyr Phe Asn Asn Cys Leu Asn Pro Leu Phe Tyr Gly Phe
290 295 300
Leu Gly Lys Lys Phe Lys Arg Tyr Phe Leu Gln Leu Leu Lys Tyr Ile
305 310 315 320
Pro Pro Lys Ala Lys Ser His Ser Asn Leu Ser Thr Lys Met Ser Thr
325 330 335
Leu Ser Tyr Arg Pro Ser Asp Asn Val Ser Ser Ser Thr Lys Lys Pro
340 345 350
Ala Pro Cys Phe Glu Val Glu
355
<210> 3
<211> 321
<212> PRT
<213> Homo sapiens
<400> 3
Met Ala Ser Ser Gln Gly Lys Asn Glu Leu Lys Leu Ala Asp Trp Met
1 5 10 15
Ala Thr Leu Pro Glu Ser Met His Ser Ile Pro Leu Thr Asn Leu Ala
20 25 30
Ile Pro Gly Ser His Asp Ser Phe Ser Phe Tyr Ile Asp Glu Ala Ser
35 40 45
Pro Val Gly Pro Glu Gln Pro Glu Thr Val Gln Asn Phe Val Ser Val
50 55 60
Phe Gly Thr Val Ala Lys Lys Leu Met Arg Lys Trp Leu Ala Thr Gln
65 70 75 80
Thr Met Asn Phe Thr Gly Gln Leu Gly Ala Gly Ile Arg Tyr Phe Asp
85 90 95
Leu Arg Ile Ser Thr Lys Pro Arg Asp Pro Asp Asn Glu Leu Tyr Phe
100 105 110
Ala His Gly Leu Phe Ser Ala Lys Val Asn Glu Gly Leu Glu Glu Ile
115 120 125
Asn Ala Phe Leu Thr Asp His His Lys Glu Val Val Phe Leu Asp Phe
130 135 140
Asn His Phe Tyr Gly Met Gln Lys Tyr His His Glu Lys Leu Val Gln
145 150 155 160
Met Leu Lys Asp Ile Tyr Gly Asn Lys Met Cys Pro Ala Ile Phe Ala
165 170 175
Gln Glu Val Ser Leu Lys Tyr Leu Trp Glu Lys Asp Tyr Gln Val Leu
180 185 190
Val Phe Tyr His Ser Pro Val Ala Leu Glu Val Pro Phe Leu Trp Pro
195 200 205
Gly Gln Met Met Pro Ala Pro Trp Ala Asn Thr Thr Asp Pro Glu Lys
210 215 220
Leu Ile Gln Phe Leu Gln Ala Ser Ile Thr Glu Arg Arg Lys Lys Gly
225 230 235 240
Ser Phe Phe Ile Ser Gln Val Val Leu Thr Pro Lys Ala Ser Thr Val
245 250 255
Val Lys Gly Val Ala Ser Gly Leu Arg Glu Thr Ile Thr Glu Arg Ala
260 265 270
Leu Pro Ala Met Met Gln Trp Val Arg Thr Gln Lys Pro Gly Glu Ser
275 280 285
Gly Ile Asn Ile Val Thr Ala Asp Phe Val Glu Leu Gly Asp Phe Ile
290 295 300
Ser Thr Val Ile Lys Leu Asn Tyr Val Phe Asp Glu Gly Glu Ala Asn
305 310 315 320
Thr
<210> 4
<211> 183
<212> PRT
<213> Homo sapiens
<400> 4
Met Glu Lys Pro Tyr Asn Lys Asn Glu Gly Asn Leu Glu Asn Glu Gly
1 5 10 15
Lys Pro Glu Asp Glu Val Glu Pro Asp Asp Glu Gly Lys Ser Asp Glu
20 25 30
Glu Glu Lys Pro Asp Ala Glu Gly Lys Thr Glu Cys Glu Gly Lys Arg
35 40 45
Lys Ala Glu Gly Glu Pro Gly Asp Glu Gly Gln Leu Glu Asp Lys Gly
50 55 60
Ser Gln Glu Lys Gln Gly Lys Ser Glu Gly Glu Gly Lys Pro Gln Gly
65 70 75 80
Glu Gly Lys Pro Ala Ser Gln Ala Lys Pro Glu Gly Gln Pro Arg Ala
85 90 95
Ala Glu Lys Arg Pro Ala Gly Asp Tyr Val Pro Arg Lys Ala Lys Arg
100 105 110
Lys Thr Asp Arg Gly Thr Asp Asp Ser Pro Lys Asp Ser Gln Glu Asp
115 120 125
Leu Gln Glu Arg His Leu Ser Ser Glu Glu Met Met Arg Glu Cys Gly
130 135 140
Asp Val Ser Arg Ala Gln Glu Glu Leu Arg Lys Lys Gln Lys Met Gly
145 150 155 160
Gly Phe His Trp Met Gln Arg Asp Val Gln Asp Pro Phe Ala Gln Gly
165 170 175
Asp Asn Gly Val Ser Gly Glu
180
<210> 5
<211> 319
<212> PRT
<213> Homo sapiens
<400> 5
Met Met Val Leu Lys Val Glu Glu Leu Val Thr Gly Lys Lys Asn Gly
1 5 10 15
Asn Gly Glu Ala Gly Glu Phe Leu Pro Glu Asp Phe Arg Asp Gly Glu
20 25 30
Tyr Glu Ala Ala Val Thr Leu Glu Lys Gln Glu Asp Leu Lys Thr Leu
35 40 45
Leu Ala His Pro Val Thr Leu Gly Glu Gln Gln Trp Lys Ser Glu Lys
50 55 60
Gln Arg Glu Ala Glu Leu Lys Lys Lys Lys Leu Glu Gln Arg Ser Lys
65 70 75 80
Leu Glu Asn Leu Glu Asp Leu Glu Ile Ile Ile Gln Leu Lys Lys Arg
85 90 95
Lys Lys Tyr Arg Lys Thr Lys Val Pro Val Val Lys Glu Pro Glu Pro
100 105 110
Glu Ile Ile Thr Glu Pro Val Asp Val Pro Thr Phe Leu Lys Ala Ala
115 120 125
Leu Glu Asn Lys Leu Pro Val Val Glu Lys Phe Leu Ser Asp Lys Asn
130 135 140
Asn Pro Asp Val Cys Asp Glu Tyr Lys Arg Thr Ala Leu His Arg Ala
145 150 155 160
Cys Leu Glu Gly His Leu Ala Ile Val Glu Lys Leu Met Glu Ala Gly
165 170 175
Ala Gln Ile Glu Phe Arg Asp Met Leu Glu Ser Thr Ala Ile His Trp
180 185 190
Ala Ser Arg Gly Gly Asn Leu Asp Val Leu Lys Leu Leu Leu Asn Lys
195 200 205
Gly Ala Lys Ile Ser Ala Arg Asp Lys Leu Leu Ser Thr Ala Leu His
210 215 220
Val Ala Val Arg Thr Gly His Tyr Glu Cys Ala Glu His Leu Ile Ala
225 230 235 240
Cys Glu Ala Asp Leu Asn Ala Lys Asp Arg Glu Gly Asp Thr Pro Leu
245 250 255
His Asp Ala Val Arg Leu Asn Arg Tyr Lys Met Ile Arg Leu Leu Ile
260 265 270
Met Tyr Gly Ala Asp Leu Asn Ile Lys Asn Cys Ala Gly Lys Thr Pro
275 280 285
Met Asp Leu Val Leu His Trp Gln Asn Gly Thr Lys Ala Ile Phe Asp
290 295 300
Ser Leu Arg Glu Asn Ser Tyr Lys Thr Ser Arg Ile Ala Thr Phe
305 310 315
<210> 6
<211> 11670
<212> DNA
<213> Homo sapiens
<400> 6
gcacaggggc acccattgaa ccagggcagg gcctgttagc ttatgaccag caggtgacct 60
gatttccttg tccactggca cagagcacac cctgccacag tgcaagcctg agaagcagtg 120
aggaccccat gaagctgaag gacaggccga tcccccgata gacgattagg taatgactgc 180
tggtatggag tcagtattgg gcttcaagcc aatgaggaaa gctgggtaga gcgagaatcc 240
tgatgaatgg acctgaaaaa ggaactcacc tcaggcttga tagaggaatt tttcagtaca 300
gctaaagtgg acacctgtcc ttttacttgt ttggaatcca ttccccagac tttgggacag 360
catctcaagc ttgttttgga gaacctccct tctccacttg cattctatgg ggtgatggtg 420
acagggtgat caaccccaac cccttgcccc caccccaatc ccacagctcc tgggttcaag 480
ttccagctcc aacatagatc agatatgtaa ccaaccctgg gttagtcata aagtctcagt 540
tatctcatct gacggaggct gtcagcccgt gggttaggca gggaggatcc agtgagaaac 600
actgtatagg cactctgcac atcacaagac tcagttctag gtatagctgg gctattcttt 660
cctcatatat gaatcctcca gtaagaggaa ccaggaaagg taagcatgaa taactgtttg 720
gagctcggag aagttaaagg actgacctaa gagtgcaagg ccactaagga gaggacctgt 780
gacttaagtc ctgtgaactg agatccttgt agtatgtggg aacaccatac cacttcaccc 840
cattaaggta aaccctctat gttacttgag agattgaaaa caacactaaa aagagaactc 900
tctacctaaa aaccattgct tcttgccaat ttcaatccag taagattggt ggtatcttat 960
gtagattttc accttggata tggagcagcc caaagattta tttcaagagc tttccctctg 1020
atgcacacag gaatctaaca cacacattcc aataagagga gagagaaaag agaagaggct 1080
ggcactggtg ctgggtgcat gccaagcgtc gtggcaccct cctcatataa ccctgctgtt 1140
tcatgtgcag gcagtgcaag acacagcaag gagccaagca gagtcaataa tatttacttt 1200
gcagaaacat ctgttgctag aaaagcagaa tgctggccag agtggaggga agtcataact 1260
gccggcatct ggggaggcca agtatctgct ttccagagta ggtagggctg tgcttctctg 1320
agtgagggga ccagatggct aagaaatatg gaagcagcta gaagtttggg ccttgagaga 1380
ctgctcccag agccacctgc tcactcaggg actagaggaa gtgcccttct tttcttggag 1440
atgccagcag atattaatct gcaccggatt taagagaatt taacccaaat agatccaact 1500
ttcactaaca cagaaggttt accataattt tttaaaaatt agaatctacc ttaattttat 1560
acaagttgta ccagtaatac cacaagtcaa gccatttcct ttttctcctt gggtaaaact 1620
taacatacat gtgcacacac aaacatggac tcaggtaacc ttactactgt attttcagtg 1680
catctattgc ctttgtgacc tccaaagtta ccaaaattgt gtattaacta cccttgaaat 1740
gttttgctgc tcagtcacat ctttcccttt ggacttagaa agtgattaca gttccgggag 1800
gccaaggcgg gtggatcatg aggtcaggag ttcgagacca gtctggccaa catagtgaaa 1860
cctcatctct actaaaaata caaaaaaaaa taaaataaaa tagccgggtg tactggtgtg 1920
cacctgtaat cccagctact cagggaggct gaggcaggag aatcgcgtga acccgggagg 1980
ctgaggctgc agtgagccga ggttgcacca ttgcactcca gcctaggcga cagtgtgaga 2040
cgctgtctca aaaaaaaaaa aaaaagaaaa aagaaaaaga aaaagaaaag aaaagaaagt 2100
gattacagct cagaaaggcc atcattgagg ttagaacttg caacaggatt ggcctcatgg 2160
ctgcctaaag ttcaagaata ccaaagtccc cgggccttgt taatctcttc ctttcctgga 2220
cgccagttac tctctgtgcc tcatcacctt gtatttggaa taattctgga actagtcatg 2280
aatggcttca tgtcacaatg cacaaagagt gcctcggaca gggctggaca cagtgtccct 2340
ccaaacctgt tgtacgatgt gagcgggcaa ggaaacacaa gctggcttac aggtggaata 2400
cctgagagtc tccagagagg acccatgaca gacagctgag acatggatgg acacgagccc 2460
cagagagact tcaggtttag cccacacccc cattcctagg tcaaactcaa cacactcaaa 2520
acaaaactct ctctactcaa acaccctctg ccaccctctc cccagagagc cagccgaggg 2580
cctcttcctg catccccagt gtaacgaagg gcaccaccat tcaccctgcc gcacaagtca 2640
ccagtacatg tcatcctctc acacagcagg ctccctcatg tgccatgtcc attcccaagt 2700
ctcctaagca catctcaatt ctgcccactc cttcccatca ctatcagcaa cccctaaaca 2760
aaacacctcc atttgcccag ataactgcaa ctgctcctct ctggcctccc cacatccact 2820
tttgtccgtc aaatcagttc tccacccagt tgtgtcaata ccagcagtga gccctgtgat 2880
ggcttcccag agctctggag gtgaagacga aagtccctcc caaggcctga gaggccctgc 2940
agggtctggc ctccccacac ccctctctgg gctccagctg ctccagcctc tgccagttcc 3000
cggggcatgc ccaactccta cctgccacca catgccacct ctgcctgcag cccttggccc 3060
aaaagttctt tcctccagga agccttccct gacttctcta atcaggccaa acccaaccct 3120
atttctcact ctctgagtac tatactatag atcttttctt cagagcaatt ttatatttgt 3180
tcaggtaatt cttctcttca agtaatgcct ccccaactag tacattctat aaggatgagg 3240
atcatatccc ttcatgctca ccactctatc cccaaagccc aacactctac tgcttgactg 3300
agagcaggta ttgcagaaag aacaaagaga gaggaagttg ggcactccat aagtccatta 3360
gccttcatca gaggtgaacc tcccaactca atgtttgaca tgtgaaaaaa aaagcaggta 3420
agttaggaca aactctccaa cttatgtaag tctggctaga gcctgatata tatgtgggaa 3480
tgtgcttcct attagcatgt gaccacctcc cttcatgttg tccattgagg aagagtccca 3540
cagagctgga gggagagcta ccaccagcag gagcataaaa taaaacctca cctataccaa 3600
ggaagctgga gaaatgagct acatacaacc caactgctgg ccacaaccaa ctgtcctctc 3660
ttagccccag cacaagcccc aggttgcagt taaaatggtt taaggaagag tccccagaga 3720
tcgctctttt ctttctcccc gtatctggga aaactgagaa catatccaat cagaaactgt 3780
gcttggagag aggcatttcc aacgactccc catttcccca agtctgtatg tagcagttta 3840
aacctagttc gatgtgcttc attataagaa aagcaagtta cagtcccttg taaataccat 3900
tctgcagccc agactcctgg cattgtacta gcaaaaacaa acaaaacaca cacacacaca 3960
cacacacaca cacacacaca cacaccctgt gcaaatctta gaatgaaaca aaattctcca 4020
tagcattttt ctcgtttccg tgacacacgg tcttacctgt ggccactagg tggcaatcaa 4080
ctatatcaga gaacaccttg accaagcagc taatttaaac aacagctaag actcaaggag 4140
aaatgacagg gccagcctta aaggcagtgc tgagaacaga tcctgtccca ctgaggaaca 4200
aataaccacc tagaaatgtc cagtggacac tcagcaactg agagaggggc cctggcttcc 4260
acattggaag aagtgctcta acacattcgg agggcctgtg ctctcataca gcaagtcaag 4320
cctgagacat ggagtgggag gggtataggg atgaagtcac caccacagtg tctctcacat 4380
tctttcagat ctggctggag cagattcaga aaacctctta tctcccccag gcggatgatg 4440
tgcccaccga ccacatcagc cacggtacgt tacataacat gcattctgat catacatctg 4500
cgtgcttttc ctgaggccat ttccctaaaa cagcatttcc taaatgaggc catcaccagc 4560
actgattctg gaaaatttgt ttttccaacc agagcactaa ggctaatgaa attttcagag 4620
ttgattttta aaatgaaatc aagtagaata aagacgtgct cctctttcca aaatgaggtt 4680
tctaattcta tttagatgaa atacccctta aaaataattt gggctaccca aactcacctt 4740
aatctacatc caaataacta tgaatatatt atatacatta acttactgaa tactgtacct 4800
accaagtact ttaaatccct ccatcctcac aaccattctg ttgagtagat attattacct 4860
ccattttgca gatgggaaac tgaggctcag agaggttaaa taacgtgccc aagatcatgc 4920
agggaatgag tggtaatgta agaaacttgg tctctctgac tccaaaactc ttaactacta 4980
cactatattg cctcatttac tcaaatattt gagaatctgg tatcaatgta ttcaaagaaa 5040
tgaaaagatg gtatgtatac attccgtgcc ttaaggggaa tacaattttt agaagggcct 5100
aatctgtgtg tgcaaaacta caaaattaag gtagactgtg ctagggcaat cagagagtag 5160
acaaaaatgg ctacagaaat gcaagtggga tattattccg gctagggcca ttggaggggg 5220
cttccaaaaa aaaaaaaaga aaaaagaaaa agaacaggga gtagcgtttg agctgaacct 5280
taaagttcag tcctatttgg atatgtagaa aagggaagcg gaagcagtca tgggaagatg 5340
ctatagaagt ggaaacatgg agcaaggaga tgcgaaatgc agaacctacc cagaaaaagc 5400
agcaagttta actagatgga caggaggtca gagtgggaag accggttaga atcaaaccat 5460
ggaaggacct gtatgccaag ctaaggaatt tgaacttact cccttaaaga aatgggaact 5520
ggattgttat acagaggagc aacaagatca acttaaacaa caattaagcc ttttactaag 5580
gagctggccc agaactttgt tggagacacc tactgtaact cctccagcaa gcttcactat 5640
gagaatgtgc aaccacagcc aaggggcatt ctccctgtag gtaactaaat gacaggcaac 5700
acctctcaac ttggacattt gtgcacagac cattggtcag ccaggagata aggaaagagt 5760
tataagggat tcaaaaaaaa aaaaaaaaaa aaaaacttct ccgtgttgaa aactccaagt 5820
tctgggccca ctacgactta tacataactg tatgcaaata atgtatacaa atacatatgt 5880
atttccaaag tgctgtattg gcttttcctc ataagaacat tgagagttaa gtgaaagcac 5940
ctgacctctt ctagatgaag aaattaagga ctggcttaat gacagtgcaa gtcacatagt 6000
aggtgcttaa taaacattta ctggatcaat gaccgctgtg tcaagtgagt tagtcagcat 6060
tggatctccg atgaaaactc aacccctaaa gagcccagcc ccagctcagc cctggcacag 6120
agaactgagg tactgtattt agaacaactg cattcacatg ctgccccaag acatgataag 6180
acagcagaag gtcaccacag gaaaaactcc ctcaaggaag actgtggaca tttcttaatg 6240
aaaacaaaga aacccatttt gagagggact aatcaagtga gggaacaaaa aagagagggt 6300
aattccaggc agctcaagta caaatatcac acacacacgg ggcaagggga aggtaattca 6360
gaggcgtatg acgcgcattg gctgcgcaaa catcagctta aatcccggtc tctcacttcc 6420
cagctgtgtg gcctttggca aattacccaa cctttccaag catgtatgta actgtgagga 6480
cagtatgtac ctcacagggc tgttgtggga attcaaaata ggaaagacac atgttctgga 6540
agagagagga cagggatgcc cccggccctg ccttgctttc cttcccacag cagaggtgga 6600
gtggaagttt accagcaggt tggagaaagg agaatcaacc aaaggagaat cttaattacc 6660
ataacaatta agcaattttt gcctcattga gtcaccagat caaccccatt cttgtgaact 6720
actaaaaaca cacctgagtt cctaagggtt ttcttcagtg ctcagaaaac ccctaatgct 6780
tctacaaatt tacaatttcc tttcacctct ggcagatgaa aggcaaggca aaacccggat 6840
ggaccatttt ttaactaaac caatttttaa ctaaacgaac tcaaagcagt atgggtttct 6900
ttttgtgaag tttattaagc tcaagtcgtg ccttttaaat gcaccgggga aacagtgcta 6960
tcatcaaatc ctttctgtcc actgcctggg gaggcaggcc agccccagat gaaacagata 7020
aaagaatgag tgtgttaaga cgacatttaa gacacaagag actgacagcg ttcacaggcc 7080
tgaagtactg ggcttcctca gaaggtggaa cttgagcttg gcccctaagg tagacacgtt 7140
tctagaaagg ggagggggtg gtgaattaag aggagaccac acaagtcaga cccactcact 7200
gggtcagact agggctggaa aaaccggtag gggctggtgg gtggagatag agggagatag 7260
aggtctaaga atggtgggga ggggcaggtg gagcagggat tcctctctct caacacctca 7320
gcagttctgt tctgctcaac accaagcagg tgcgcagata ggaggcagtg gggctgggag 7380
ggttgatcct ggcttgagcc tcaagactta gattttgttt ctggaatgcc ttttcctctg 7440
cagcagagac agctactcaa gctttaaggt gcacccaatc acctgggatc ttgtcaaaat 7500
tcccatgtga tccagcaggc ctgggagccc gagagtctac atttctaatt cccaggtgaa 7560
gccaatggtg ctgatccagg caccacaccc tccaaggcaa gggtttggac tcccactcaa 7620
gaccctgaca gagaagatca cagcttcttt attctcctag cacgtgcctg gaacatacag 7680
gacctcaata tatattggag gaatgaatga ataaattcct tgagagaact taagctgttg 7740
cagacagaat agaaaagaac ccagaaaaag aaccagaaat ggcgtgtctc cttgtgcagc 7800
caccaactat acatgtgaac ctagggagag ttatgtgaca cactcggcct taaaagaact 7860
cacttgaggc cgggcgcagt ggctcacgcc tgtaatccca gcactctggg aggccgaggt 7920
gggcggatca cgaggtcagg agttcaagac cagcctggcc aacacagtga aaccctgtct 7980
ctggctaata caaaaattag ctgggcttgg tggtgggcac ctgtaatcac agctactcgg 8040
gaggctgagg caggagaatc gcttgaaccc aggaggcggg gcttgcagtg agccgagatc 8100
gtgccatagc actccagcct gtgtgacaga gcaagactcc ttctcaaaaa gaaaaaaaaa 8160
aaaaaaacct cacttgaaaa ccaaggagcc aacccctttc cgtagctcta agatccctcc 8220
caaagtatct tttctgtgcc ttttattttt aatggtgagg ttatatactg gatattccta 8280
cagcaaggca cacctctatg tcattctcaa agagcagttt ccaaaaatcc aattgagaga 8340
acacagactc tgttagtctc agcaaataac catagcaact aatactcccc aaatgaaatg 8400
atgtcttcac aatgatgtgc tggctcaatt agattaagag ggtgacgtgt accatctgaa 8460
aatttatcgt cgtaaactta cagtgaaagc cagaccttct tggaagaggt ttataagtaa 8520
aagaaaggcc ttgccaataa atggaattca ggacaaagag ccagagaagt caagcagatg 8580
aggaaattgg gaaggactgc tctgcctctc caggttcaca cagtcagggc ccacgcaccc 8640
agacagaacc cagaacttgg ttaaacagtt agaaatctga gtaccaccac ttctaccagg 8700
gagttatcaa aagactgcca ttttatcctt gttctatgcc tttcttcata catattacaa 8760
aaggaaaata ctgctacctc agaaaagtct gcagaaatat ttaccaaaat aattgtaaaa 8820
cttttaaatg aaaaagagga caacttcaaa ataacaaatt agggctgata atacatttcc 8880
agccaaatta atttctccac aggtcatcac aggatgcaaa tctttctgtt acaaggtttt 8940
ctgactggag ttagaactgt gaatggaaaa ctcaacgtct ataagttcta caacttactg 9000
tctttccaca tccttaggcc tgcctcttcc agggtccatg caatcacatt tgccctgaac 9060
aaatttgggc aagcaagaac ctcacttgaa aagcaggaaa agagaagcca aggcctgtca 9120
cctccctgta atccctgagc tttctagctt tctctagcaa agaacaaaaa gaaaaaaagg 9180
aacaacaaac aagccaaccc ataaccaagc ccaaagaatc agagtttcac tggcattcaa 9240
cagttgtgaa ttcggaaagt cacagacggc agaacctgga gccatacaca aggatcagaa 9300
acccctgcac tgttcctacc aacagctaac gtgaatttga gggcaatcaa gagaaaaaca 9360
aggtatggtg ggtaaatcga ggccttcatc cagccaaata agcttagatt tgtggttaac 9420
agactcccag cgttcaaaat cccatctcac ccatttacaa ggtactcaat ttccacctgt 9480
gtgaaaaggc actaaaggga aacctgcctc ctgaggctcc tgtgagaaga gagatgatgc 9540
actgaagtgc ttagcacagg gcctggccgg cagcaaacac tcaataaacc ataggtatta 9600
gaatcattta catatatatt taataaataa catgccaggc tgatttgttt ctgcgtaaaa 9660
atgaaaggac aatgaagcca cccggcccct accactttga ctccctctcg ccctcctcac 9720
cgtcagtcca cacagcataa ttaggatcaa aactgaatcc acctgatccc tggacacagc 9780
tcagacactc cttgccacta ataccacagg aagcaaggtg gcaactccta agcatcagaa 9840
taaattcagt taaaaaacaa aaatccgctc atctccccct ggatgaaatt catgtttctg 9900
gaagaaaaaa gaaaaaaaaa aaacggacct agccattctg aacaaagcca cacctaataa 9960
cattcccaga aattggtttc actttctttt atcccctctt taattagtca cttttctgct 10020
atacctcagg ggaggctgtg ctccagggac caagaacgga agcctgagtg ggcaaacact 10080
taccctcctc ataggtgccc acgaaatccc caggctcccc gcctccccac tctgcaccgt 10140
ctcctctcca gcctggattc cagtccaggc aggaactcat gctccagcaa ggagtacccc 10200
ttgccactgc agaccaccac agaatgagag aggccaaaga taagtgtttc tcaaaacgtg 10260
tctgaacacc gcttgcaata ggtgttgcaa gagcccttcc agggagccca ccctcaatca 10320
aaatctctag ggctgaggcc taggagcctg ggcttcccag gcagttctta tccatgctga 10380
agtttgagag ctgataccac ctaacccttc agaacatcta atactaagta ccagtaatgg 10440
aacccctcca gatgacaaag gtggagctcc acagagcaag ccggatcttc taaatcatga 10500
cagtgggttt acaaatgttc ccaaagcagg caattaatgc tcgtggtaga agaaagctag 10560
gtgacagcag gggtgggagg aggaaacatc ctaattcaat ttaaaaatca caaattctga 10620
agcctgagtc ttcttcaaaa catgttctca atcatgtctc cttattctga agcctacaca 10680
actgactggg aacacatctt tgttttgtag aaacccagct catggcacct ggagctgatg 10740
aatggccctg gtgctgactg cccagaaacc aatccggaaa ccaggcttcc cacagaagag 10800
gcagctggag agccaagcac tcttggacta cagtcctagg ctggagctgc caatacaggc 10860
tctgcccagc taatcttctc tgagcctgca aatattaaac ctgacataca gactcaagtg 10920
aatccagaaa acaggctcac agggcagctg aaaattccaa gtgcctaagg tataggcagg 10980
gcggcttcat gggcattcaa ccagtacaga tgcacagggt cccatgctca gaagggcctg 11040
cttggcttaa tgctctgctg tagctgtctt gaaattttta ataattttat ctttgaactt 11100
gtgttttgca agtgagatcc agtgcgacag tggagcatgt gtgcgcagag gagacaggaa 11160
caacaaccgg gatgtcatgc gggcgcactg gggctccttg tggccccagt gcacagaatt 11220
ctggtggacc caccatgtgt gggagctcag tgagactcaa agtaagtgca aggtaagtgt 11280
cttatatcta cgactgagta agggggaacg ctgacagccc tgaggggtta cacctaccat 11340
ttcaaccaga acttgccaga tgcaagaaga tgacaatgag acaatggcat ccaaagaaac 11400
atgaacggcc caggaaccct atcatagcct tcttcctcat gttatttccc tggataagcc 11460
aaccactgac actgatcatg gtaacctagg acagagacag actgggcaac ccatagttcc 11520
tttcctttca ggccctcctc acacatcgta cgctgaaggt ggagcacact gggaaaatgt 11580
gcatgcatca agaagaaaaa tgaaaactga ttttgtgcaa catttccact gttcttggaa 11640
gaatgaaata aatgcatatg agctatgaaa 11670
<210> 7
<211> 1280
<212> PRT
<213> Homo sapiens
<400> 7
Met Asp Leu Glu Gly Asp Arg Asn Gly Gly Ala Lys Lys Lys Asn Phe
1 5 10 15
Phe Lys Leu Asn Asn Lys Ser Glu Lys Asp Lys Lys Glu Lys Lys Pro
20 25 30
Thr Val Ser Val Phe Ser Met Phe Arg Tyr Ser Asn Trp Leu Asp Lys
35 40 45
Leu Tyr Met Val Val Gly Thr Leu Ala Ala Ile Ile His Gly Ala Gly
50 55 60
Leu Pro Leu Met Met Leu Val Phe Gly Glu Met Thr Asp Ile Phe Ala
65 70 75 80
Asn Ala Gly Asn Leu Glu Asp Leu Met Ser Asn Ile Thr Asn Arg Ser
85 90 95
Asp Ile Asn Asp Thr Gly Phe Phe Met Asn Leu Glu Glu Asp Met Thr
100 105 110
Arg Tyr Ala Tyr Tyr Tyr Ser Gly Ile Gly Ala Gly Val Leu Val Ala
115 120 125
Ala Tyr Ile Gln Val Ser Phe Trp Cys Leu Ala Ala Gly Arg Gln Ile
130 135 140
His Lys Ile Arg Lys Gln Phe Phe His Ala Ile Met Arg Gln Glu Ile
145 150 155 160
Gly Trp Phe Asp Val His Asp Val Gly Glu Leu Asn Thr Arg Leu Thr
165 170 175
Asp Asp Val Ser Lys Ile Asn Glu Gly Ile Gly Asp Lys Ile Gly Met
180 185 190
Phe Phe Gln Ser Met Ala Thr Phe Phe Thr Gly Phe Ile Val Gly Phe
195 200 205
Thr Arg Gly Trp Lys Leu Thr Leu Val Ile Leu Ala Ile Ser Pro Val
210 215 220
Leu Gly Leu Ser Ala Ala Val Trp Ala Lys Ile Leu Ser Ser Phe Thr
225 230 235 240
Asp Lys Glu Leu Leu Ala Tyr Ala Lys Ala Gly Ala Val Ala Glu Glu
245 250 255
Val Leu Ala Ala Ile Arg Thr Val Ile Ala Phe Gly Gly Gln Lys Lys
260 265 270
Glu Leu Glu Arg Tyr Asn Lys Asn Leu Glu Glu Ala Lys Arg Ile Gly
275 280 285
Ile Lys Lys Ala Ile Thr Ala Asn Ile Ser Ile Gly Ala Ala Phe Leu
290 295 300
Leu Ile Tyr Ala Ser Tyr Ala Leu Ala Phe Trp Tyr Gly Thr Thr Leu
305 310 315 320
Val Leu Ser Gly Glu Tyr Ser Ile Gly Gln Val Leu Thr Val Phe Phe
325 330 335
Ser Val Leu Ile Gly Ala Phe Ser Val Gly Gln Ala Ser Pro Ser Ile
340 345 350
Glu Ala Phe Ala Asn Ala Arg Gly Ala Ala Tyr Glu Ile Phe Lys Ile
355 360 365
Ile Asp Asn Lys Pro Ser Ile Asp Ser Tyr Ser Lys Ser Gly His Lys
370 375 380
Pro Asp Asn Ile Lys Gly Asn Leu Glu Phe Arg Asn Val His Phe Ser
385 390 395 400
Tyr Pro Ser Arg Lys Glu Val Lys Ile Leu Lys Gly Leu Asn Leu Lys
405 410 415
Val Gln Ser Gly Gln Thr Val Ala Leu Val Gly Asn Ser Gly Cys Gly
420 425 430
Lys Ser Thr Thr Val Gln Leu Met Gln Arg Leu Tyr Asp Pro Thr Glu
435 440 445
Gly Met Val Ser Val Asp Gly Gln Asp Ile Arg Thr Ile Asn Val Arg
450 455 460
Phe Leu Arg Glu Ile Ile Gly Val Val Ser Gln Glu Pro Val Leu Phe
465 470 475 480
Ala Thr Thr Ile Ala Glu Asn Ile Arg Tyr Gly Arg Glu Asn Val Thr
485 490 495
Met Asp Glu Ile Glu Lys Ala Val Lys Glu Ala Asn Ala Tyr Asp Phe
500 505 510
Ile Met Lys Leu Pro His Lys Phe Asp Thr Leu Val Gly Glu Arg Gly
515 520 525
Ala Gln Leu Ser Gly Gly Gln Lys Gln Arg Ile Ala Ile Ala Arg Ala
530 535 540
Leu Val Arg Asn Pro Lys Ile Leu Leu Leu Asp Glu Ala Thr Ser Ala
545 550 555 560
Leu Asp Thr Glu Ser Glu Ala Val Val Gln Val Ala Leu Asp Lys Ala
565 570 575
Arg Lys Gly Arg Thr Thr Ile Val Ile Ala His Arg Leu Ser Thr Val
580 585 590
Arg Asn Ala Asp Val Ile Ala Gly Phe Asp Asp Gly Val Ile Val Glu
595 600 605
Lys Gly Asn His Asp Glu Leu Met Lys Glu Lys Gly Ile Tyr Phe Lys
610 615 620
Leu Val Thr Met Gln Thr Ala Gly Asn Glu Val Glu Leu Glu Asn Ala
625 630 635 640
Ala Asp Glu Ser Lys Ser Glu Ile Asp Ala Leu Glu Met Ser Ser Asn
645 650 655
Asp Ser Arg Ser Ser Leu Ile Arg Lys Arg Ser Thr Arg Arg Ser Val
660 665 670
Arg Gly Ser Gln Ala Gln Asp Arg Lys Leu Ser Thr Lys Glu Ala Leu
675 680 685
Asp Glu Ser Ile Pro Pro Val Ser Phe Trp Arg Ile Met Lys Leu Asn
690 695 700
Leu Thr Glu Trp Pro Tyr Phe Val Val Gly Val Phe Cys Ala Ile Ile
705 710 715 720
Asn Gly Gly Leu Gln Pro Ala Phe Ala Ile Ile Phe Ser Lys Ile Ile
725 730 735
Gly Val Phe Thr Arg Ile Asp Asp Pro Glu Thr Lys Arg Gln Asn Ser
740 745 750
Asn Leu Phe Ser Leu Leu Phe Leu Ala Leu Gly Ile Ile Ser Phe Ile
755 760 765
Thr Phe Phe Leu Gln Gly Phe Thr Phe Gly Lys Ala Gly Glu Ile Leu
770 775 780
Thr Lys Arg Leu Arg Tyr Met Val Phe Arg Ser Met Leu Arg Gln Asp
785 790 795 800
Val Ser Trp Phe Asp Asp Pro Lys Asn Thr Thr Gly Ala Leu Thr Thr
805 810 815
Arg Leu Ala Asn Asp Ala Ala Gln Val Lys Gly Ala Ile Gly Ser Arg
820 825 830
Leu Ala Val Ile Thr Gln Asn Ile Ala Asn Leu Gly Thr Gly Ile Ile
835 840 845
Ile Ser Phe Ile Tyr Gly Trp Gln Leu Thr Leu Leu Leu Leu Ala Ile
850 855 860
Val Pro Ile Ile Ala Ile Ala Gly Val Val Glu Met Lys Met Leu Ser
865 870 875 880
Gly Gln Ala Leu Lys Asp Lys Lys Glu Leu Glu Gly Ser Gly Lys Ile
885 890 895
Ala Thr Glu Ala Ile Glu Asn Phe Arg Thr Val Val Ser Leu Thr Gln
900 905 910
Glu Gln Lys Phe Glu His Met Tyr Ala Gln Ser Leu Gln Val Pro Tyr
915 920 925
Arg Asn Ser Leu Arg Lys Ala His Ile Phe Gly Ile Thr Phe Ser Phe
930 935 940
Thr Gln Ala Met Met Tyr Phe Ser Tyr Ala Gly Cys Phe Arg Phe Gly
945 950 955 960
Ala Tyr Leu Val Ala His Lys Leu Met Ser Phe Glu Asp Val Leu Leu
965 970 975
Val Phe Ser Ala Val Val Phe Gly Ala Met Ala Val Gly Gln Val Ser
980 985 990
Ser Phe Ala Pro Asp Tyr Ala Lys Ala Lys Ile Ser Ala Ala His Ile
995 1000 1005
Ile Met Ile Ile Glu Lys Thr Pro Leu Ile Asp Ser Tyr Ser Thr
1010 1015 1020
Glu Gly Leu Met Pro Asn Thr Leu Glu Gly Asn Val Thr Phe Gly
1025 1030 1035
Glu Val Val Phe Asn Tyr Pro Thr Arg Pro Asp Ile Pro Val Leu
1040 1045 1050
Gln Gly Leu Ser Leu Glu Val Lys Lys Gly Gln Thr Leu Ala Leu
1055 1060 1065
Val Gly Ser Ser Gly Cys Gly Lys Ser Thr Val Val Gln Leu Leu
1070 1075 1080
Glu Arg Phe Tyr Asp Pro Leu Ala Gly Lys Val Leu Leu Asp Gly
1085 1090 1095
Lys Glu Ile Lys Arg Leu Asn Val Gln Trp Leu Arg Ala His Leu
1100 1105 1110
Gly Ile Val Ser Gln Glu Pro Ile Leu Phe Asp Cys Ser Ile Ala
1115 1120 1125
Glu Asn Ile Ala Tyr Gly Asp Asn Ser Arg Val Val Ser Gln Glu
1130 1135 1140
Glu Ile Val Arg Ala Ala Lys Glu Ala Asn Ile His Ala Phe Ile
1145 1150 1155
Glu Ser Leu Pro Asn Lys Tyr Ser Thr Lys Val Gly Asp Lys Gly
1160 1165 1170
Thr Gln Leu Ser Gly Gly Gln Lys Gln Arg Ile Ala Ile Ala Arg
1175 1180 1185
Ala Leu Val Arg Gln Pro His Ile Leu Leu Leu Asp Glu Ala Thr
1190 1195 1200
Ser Ala Leu Asp Thr Glu Ser Glu Lys Val Val Gln Glu Ala Leu
1205 1210 1215
Asp Lys Ala Arg Glu Gly Arg Thr Cys Ile Val Ile Ala His Arg
1220 1225 1230
Leu Ser Thr Ile Gln Asn Ala Asp Leu Ile Val Val Phe Gln Asn
1235 1240 1245
Gly Arg Val Lys Glu His Gly Thr His Gln Gln Leu Leu Ala Gln
1250 1255 1260
Lys Gly Ile Tyr Phe Ser Met Val Ser Val Gln Ala Gly Thr Lys
1265 1270 1275
Arg Gln
1280
<210> 8
<211> 764
<212> PRT
<213> Homo sapiens
<400> 8
Met Ile Glu Pro Phe Gly Asn Gln Tyr Ile Val Ala Arg Pro Val Tyr
1 5 10 15
Ser Thr Asn Ala Phe Glu Glu Asn His Lys Lys Thr Gly Arg His His
20 25 30
Lys Thr Phe Leu Asp His Leu Lys Val Cys Cys Ser Cys Ser Pro Gln
35 40 45
Lys Ala Lys Arg Ile Val Leu Ser Leu Phe Pro Ile Ala Ser Trp Leu
50 55 60
Pro Ala Tyr Arg Leu Lys Glu Trp Leu Leu Ser Asp Ile Val Ser Gly
65 70 75 80
Ile Ser Thr Gly Ile Val Ala Val Leu Gln Gly Leu Ala Phe Ala Leu
85 90 95
Leu Val Asp Ile Pro Pro Val Tyr Gly Leu Tyr Ala Ser Phe Phe Pro
100 105 110
Ala Ile Ile Tyr Leu Phe Phe Gly Thr Ser Arg His Ile Ser Val Gly
115 120 125
Pro Phe Pro Ile Leu Ser Met Met Val Gly Leu Ala Val Ser Gly Ala
130 135 140
Val Ser Lys Ala Val Pro Asp Arg Asn Ala Thr Thr Leu Gly Leu Pro
145 150 155 160
Asn Asn Ser Asn Asn Ser Ser Leu Leu Asp Asp Glu Arg Val Arg Val
165 170 175
Ala Ala Ala Ala Ser Val Thr Val Leu Ser Gly Ile Ile Gln Leu Ala
180 185 190
Phe Gly Ile Leu Arg Ile Gly Phe Val Val Ile Tyr Leu Ser Glu Ser
195 200 205
Leu Ile Ser Gly Phe Thr Thr Ala Ala Ala Val His Val Leu Val Ser
210 215 220
Gln Leu Lys Phe Ile Phe Gln Leu Thr Val Pro Ser His Thr Asp Pro
225 230 235 240
Val Ser Ile Phe Lys Val Leu Tyr Ser Val Phe Ser Gln Ile Glu Lys
245 250 255
Thr Asn Ile Ala Asp Leu Val Thr Ala Leu Ile Val Leu Leu Val Val
260 265 270
Ser Ile Val Lys Glu Ile Asn Gln Arg Phe Lys Asp Lys Leu Pro Val
275 280 285
Pro Ile Pro Ile Glu Phe Ile Met Thr Val Ile Ala Ala Gly Val Ser
290 295 300
Tyr Gly Cys Asp Phe Lys Asn Arg Phe Lys Val Ala Val Val Gly Asp
305 310 315 320
Met Asn Pro Gly Phe Gln Pro Pro Ile Thr Pro Asp Val Glu Thr Phe
325 330 335
Gln Asn Thr Val Gly Asp Cys Phe Gly Ile Ala Met Val Ala Phe Ala
340 345 350
Val Ala Phe Ser Val Ala Ser Val Tyr Ser Leu Lys Tyr Asp Tyr Pro
355 360 365
Leu Asp Gly Asn Gln Glu Leu Ile Ala Leu Gly Leu Gly Asn Ile Val
370 375 380
Cys Gly Val Phe Arg Gly Phe Ala Gly Ser Thr Ala Leu Ser Arg Ser
385 390 395 400
Ala Val Gln Glu Ser Thr Gly Gly Lys Thr Gln Ile Ala Gly Leu Ile
405 410 415
Gly Ala Ile Ile Val Leu Ile Val Val Leu Ala Ile Gly Phe Leu Leu
420 425 430
Ala Pro Leu Gln Lys Ser Val Leu Ala Ala Leu Ala Leu Gly Asn Leu
435 440 445
Lys Gly Met Leu Met Gln Phe Ala Glu Ile Gly Arg Leu Trp Arg Lys
450 455 460
Asp Lys Tyr Asp Cys Leu Ile Trp Ile Met Thr Phe Ile Phe Thr Ile
465 470 475 480
Val Leu Gly Leu Gly Leu Gly Leu Ala Ala Ser Val Ala Phe Gln Leu
485 490 495
Leu Thr Ile Val Phe Arg Thr Gln Phe Pro Lys Cys Ser Thr Leu Ala
500 505 510
Asn Ile Gly Arg Thr Asn Ile Tyr Lys Asn Lys Lys Asp Tyr Tyr Asp
515 520 525
Met Tyr Glu Pro Glu Gly Val Lys Ile Phe Arg Cys Pro Ser Pro Ile
530 535 540
Tyr Phe Ala Asn Ile Gly Phe Phe Arg Arg Lys Leu Ile Asp Ala Val
545 550 555 560
Gly Phe Ser Pro Leu Arg Ile Leu Arg Lys Arg Asn Lys Ala Leu Arg
565 570 575
Lys Ile Arg Lys Leu Gln Lys Gln Gly Leu Leu Gln Val Thr Pro Lys
580 585 590
Gly Phe Ile Cys Thr Val Asp Thr Ile Lys Asp Ser Asp Glu Glu Leu
595 600 605
Asp Asn Asn Gln Ile Glu Val Leu Asp Gln Pro Ile Asn Thr Thr Asp
610 615 620
Leu Pro Phe His Ile Asp Trp Asn Asp Asp Leu Pro Leu Asn Ile Glu
625 630 635 640
Val Pro Lys Ile Ser Leu His Ser Leu Ile Leu Asp Phe Ser Ala Val
645 650 655
Ser Phe Leu Asp Val Ser Ser Val Arg Gly Leu Lys Ser Ile Leu Gln
660 665 670
Glu Phe Ile Arg Ile Lys Val Asp Val Tyr Ile Val Gly Thr Asp Asp
675 680 685
Asp Phe Ile Glu Lys Leu Asn Arg Tyr Glu Phe Phe Asp Gly Glu Val
690 695 700
Lys Ser Ser Ile Phe Phe Leu Thr Ile His Asp Ala Val Leu His Ile
705 710 715 720
Leu Met Lys Lys Asp Tyr Ser Thr Ser Lys Phe Asn Pro Ser Gln Glu
725 730 735
Lys Asp Gly Lys Ile Asp Phe Thr Ile Asn Thr Asn Gly Gly Leu Arg
740 745 750
Asn Arg Val Tyr Glu Val Pro Val Glu Thr Lys Phe
755 760
<210> 9
<211> 103
<212> PRT
<213> Homo sapiens
<400> 9
Met Ser Gly Arg Gly Lys Gly Gly Lys Gly Leu Gly Lys Gly Gly Ala
1 5 10 15
Lys Arg His Arg Lys Val Leu Arg Asp Asn Ile Gln Gly Ile Thr Lys
20 25 30
Pro Ala Ile Arg Arg Leu Ala Arg Arg Gly Gly Val Lys Arg Ile Ser
35 40 45
Gly Leu Ile Tyr Glu Glu Thr Arg Gly Val Leu Lys Val Phe Leu Glu
50 55 60
Asn Val Ile Arg Asp Ala Val Thr Tyr Thr Glu His Ala Lys Arg Lys
65 70 75 80
Thr Val Thr Ala Met Asp Val Val Tyr Ala Leu Lys Arg Gln Gly Arg
85 90 95
Thr Leu Tyr Gly Phe Gly Gly
100
<210> 10
<211> 463
<212> PRT
<213> Homo sapiens
<400> 10
Met Ala Thr Val Thr Ala Thr Thr Lys Val Pro Glu Ile Arg Asp Val
1 5 10 15
Thr Arg Ile Glu Arg Ile Gly Ala His Ser His Ile Arg Gly Leu Gly
20 25 30
Leu Asp Asp Ala Leu Glu Pro Arg Gln Ala Ser Gln Gly Met Val Gly
35 40 45
Gln Leu Ala Ala Arg Arg Ala Ala Gly Val Val Leu Glu Met Ile Arg
50 55 60
Glu Gly Lys Ile Ala Gly Arg Ala Val Leu Ile Ala Gly Gln Pro Gly
65 70 75 80
Thr Gly Lys Thr Ala Ile Ala Met Gly Met Ala Gln Ala Leu Gly Pro
85 90 95
Asp Thr Pro Phe Thr Ala Ile Ala Gly Ser Glu Ile Phe Ser Leu Glu
100 105 110
Met Ser Lys Thr Glu Ala Leu Thr Gln Ala Phe Arg Arg Ser Ile Gly
115 120 125
Val Arg Ile Lys Glu Glu Thr Glu Ile Ile Glu Gly Glu Val Val Glu
130 135 140
Ile Gln Ile Asp Arg Pro Ala Thr Gly Thr Gly Ser Lys Val Gly Lys
145 150 155 160
Leu Thr Leu Lys Thr Thr Glu Met Glu Thr Ile Tyr Asp Leu Gly Thr
165 170 175
Lys Met Ile Glu Ser Leu Thr Lys Asp Lys Val Gln Ala Gly Asp Val
180 185 190
Ile Thr Ile Asp Lys Ala Thr Gly Lys Ile Ser Lys Leu Gly Arg Ser
195 200 205
Phe Thr Arg Ala Arg Asp Tyr Asp Ala Met Gly Ser Gln Thr Lys Phe
210 215 220
Val Gln Cys Pro Asp Gly Glu Leu Gln Lys Arg Lys Glu Val Val His
225 230 235 240
Thr Val Ser Leu His Glu Ile Asp Val Ile Asn Ser Arg Thr Gln Gly
245 250 255
Phe Leu Ala Leu Phe Ser Gly Asp Thr Gly Glu Ile Lys Ser Glu Val
260 265 270
Arg Glu Gln Ile Asn Ala Lys Val Ala Glu Trp Arg Glu Glu Gly Lys
275 280 285
Ala Glu Ile Ile Pro Gly Val Leu Phe Ile Asp Glu Val His Met Leu
290 295 300
Asp Ile Glu Ser Phe Ser Phe Leu Asn Arg Ala Leu Glu Ser Asp Met
305 310 315 320
Ala Pro Val Leu Ile Met Ala Thr Asn Arg Gly Ile Thr Arg Ile Arg
325 330 335
Gly Thr Ser Tyr Gln Ser Pro His Gly Ile Pro Ile Asp Leu Leu Asp
340 345 350
Arg Leu Leu Ile Val Ser Thr Thr Pro Tyr Ser Glu Lys Asp Thr Lys
355 360 365
Gln Ile Leu Arg Ile Arg Cys Glu Glu Glu Asp Val Glu Met Ser Glu
370 375 380
Asp Ala Tyr Thr Val Leu Thr Arg Ile Gly Leu Glu Thr Ser Leu Arg
385 390 395 400
Tyr Ala Ile Gln Leu Ile Thr Ala Ala Ser Leu Val Cys Arg Lys Arg
405 410 415
Lys Gly Thr Glu Val Gln Val Asp Asp Ile Lys Arg Val Tyr Ser Leu
420 425 430
Phe Leu Asp Glu Ser Arg Ser Thr Gln Tyr Met Lys Glu Tyr Gln Asp
435 440 445
Ala Phe Leu Phe Asn Glu Leu Lys Gly Glu Thr Met Asp Thr Ser
450 455 460
<210> 11
<211> 129
<212> PRT
<213> Homo sapiens
<400> 11
Met Ser Gly Arg Gly Lys Gln Gly Gly Lys Ala Arg Ala Lys Ala Lys
1 5 10 15
Ser Arg Ser Ser Arg Ala Gly Leu Gln Phe Pro Val Gly Arg Val His
20 25 30
Arg Leu Leu Arg Lys Gly Asn Tyr Ala Glu Arg Val Gly Ala Gly Ala
35 40 45
Pro Val Tyr Met Ala Ala Val Leu Glu Tyr Leu Thr Ala Glu Ile Leu
50 55 60
Glu Leu Ala Gly Asn Ala Ala Arg Asp Asn Lys Lys Thr Arg Ile Ile
65 70 75 80
Pro Arg His Leu Gln Leu Ala Ile Arg Asn Asp Glu Glu Leu Asn Lys
85 90 95
Leu Leu Gly Lys Val Thr Ile Ala Gln Gly Gly Val Leu Pro Asn Ile
100 105 110
Gln Ala Val Leu Leu Pro Lys Lys Thr Glu Ser His Lys Ala Lys Ser
115 120 125
Lys

Claims (27)

1.一种组合物,用于预测癌症患者对抗癌疗法的疗效反应或抗癌疗法的预后、或确定抗癌疗法前的新辅助化疗的目标患者,该组合物包括:
一种试剂,其测量第一分子亚型和第二分子亚型的至少一种基因或由其编码的蛋白的表达水平,
其中第一分子亚型包含一种或多种选自PMP2,AGTR1,PLCXD3,TCEAL6,ANKRD1,和ARHGAP26-AS1的基因,和
第二分子亚型包括一种或多种选自PGP,SLC26A3,HIST1H4C,RUVBL2,RAB19,HIST2H2AC,和SNORD69的基因。
2.根据权利要求1所述的组合物,其特征在于,第一分子亚型还包括一或多种选自下组的基因:AADACL2,ABCA6,ABCA8,ABCA9,ABCB5,ABI3BP,ACADL,ACSM5,ACTG2,ADAMTS9-AS1,ADAMTS9-AS2,ADAMTSL3,ADCYAP1R1,ADGRB3,ADH1B,ADIPOQ,ADRA1A,AFF3,AGTR1,AICDA,ALB,ANGPTL1,ANGPTL5,ANGPTL7,ANK2,ANKS1B,ANXA8L1,APOA2,APOB,APOC3,AQP4,AQP8,ARPP21,ART4,ASB5,ASPA,ASTN1,ATCAY,ATP1A2,ATP2B2,ATP2B3,AVPR1B,B3GALT5-AS1,BCHE,BEST4,BHMT2,BLOC1S5-TXNDC5,BMP3,BRINP3,BVES,BVES-AS1,C14orf180,C1QTNF7,C7,C8orf88,CA1,CA2,CA7,CACNA2D1,CADM2,CADM3,CALN1,CARTPT,CASQ2,CAVIN2,CCBE1,CCDC144B,CCDC158,CCDC160,CCDC169,CCN5,CD300LG,CDH10,CDH19,CDKN2B-AS1,CDO1,CHRDL1,CHRM2,CHST9,CIDEA,CILP,CLCA4,CLCNKB,CLDN8,CLEC3B,CLEC4M,CLVS2,CMA1,CNGA3,CNN1,CNR1,CNTN1,CNTN2,CNTNAP4,COL19A1,CP,CPEB1,CPXM2,CR2,CRP,CTNNA3,CTSG,CYP1B1,DAO,DCLK1,DDR2,DES,DHRS7C,DIRAS2,DPP6,DPT,EBF2,ECRG4,ELAVL4,EPHA5,EPHA6,EPHA7,ERICH3,EVX2,FABP4,FAM106A,FAM133A,FAM135B,FAM180B,FDCSP,FGF10,FGF13-AS1,FGF14,FGFBP2,FGG,FGL1,FHL1,FILIP1,FLNC,FMO2,FRMD6-AS2,FRMPD4,FUT9,GABRA5,GABRG2,GALR1,GAP43,GAS1RR,GC,GCG,GDF6,GFRA1,GNAO1,GPM6A,GPR119,GPR12,GPRACR,GRIA2,GRIN2A,GTF2IP1,GUCA2B,HAND1,HAND2,HAND2-AS1,HEPACAM,HP,HPCAL4,HRG,HRK,HSPB8,HTR2B,IGSF10,IGSF11,IRX6,ISM1,KCNA1,KCNB1,KCNC2,KCNK2,KCNMA1,KCNMB1,KCNQ5,KCNT2,KCTD8,KERA,KHDRBS2,KIAA0408,KIF1A,KRT222,KRT24,KRTAP13-2,LCN10,LDB3,LEP,LGI1,LIFR,LINC00504,LINC00507,LINC00682,LINC00924,LINC01266,LINC01352,LINC01474,LINC01505,LINC01697,LINC01798,LINC01829,LINC02015,LINC02023,LINC02185,LINC02268,LINC02408,LINC02544,LIX1,LMO3,LMOD1,LOC100506289,LOC101928731,LOC102724050,LOC107986321,LOC283856,LOC440434,LOC729558,LONRF2,LRAT,LRCH2,LRRC3B,LRRC4C,LRRTM4,LVRN,LYVE1,MAB21L1,MAB21L2,MAGEE2,MAMDC2,MAPK4,MASP1,MEF2C-AS1,MEOX2,METTL24,MFAP5,MGAT4C,MGP,MICU3,MIR133A1HG,MIR8071-1,MMRN1,MORN5,MPPED2,MRGPRE,MS4A1,MS4A12,MSRB3,MUSK,MYH11,MYH2,MYLK,MYO3A,MYOC,MYOCD,MYOM1,MYOT,MYT1L,NALCN,NAP1L2,NBEA,NECAB1,NEFL,NEFM,NEGR1,NETO1,NEUROD1,NEXMIF,NEXN,NGB,NIBAN1,NLGN1,NOS1,NOVA1,NPR3,NPTX1,NPY2R,NRG3,NRK,NRSN1,NRXN1,NSG2,NTNG1,NTRK3,NUDT10,OGN,OLFM3,OMD,OTOP2,OTOP3,P2RX2,P2RY12,PAK3,PAPPA2,PCDH10,PCDH11X,PCDH9,PCOLCE2,PCP4L1,PCSK2,PDZRN4,PEG3,PENK,PGM5,PGM5-AS1,PGM5P4-AS1,PGR,PHOX2B,PI16,PIK3C2G,PIRT,PKHD1L1,PLAAT5,PLCXD3,PLD5,PLIN1,PLIN4,PLN,PLP1,PMP2,POPDC2,POU3F4,PPP1R1A,PRDM6,PRELP,PRG4,PRIMA1,PROKR1,PTCHD1,PTGIS,PTPRQ,PTPRZ1,PYGM,PYY,RANBP3L,RBFOX3,RBM20,RELN,RERGL,RGS13,RGS22,RIC3,RIMS4,RNF150,RNF180,RORB,RSPO2,SCARA5,SCGN,SCN2B,SCN7A,SCN9A,SCNN1G,SCRG1,SEMA3E,SERTM1,SERTM2,SFRP1,SFRP2,SFTPA1,SGCG,SHISAL1,SLC13A5,SLC17A8,SLC30A10,SLC4A4,SLC5A7,SLC6A2,SLC7A14,SLIT2,SLITRK2,SLITRK3,SLITRK4,SMIM28,SMYD1,SNAP25,SNAP91,SORCS1,SORCS3,SPHKAP,SPIB,SPOCK3,SST,ST8SIA3,STMN2,STMN4,STON1-GTF2A1L,STUM,SV2B,SYNM,SYNPO2,SYT10,SYT4,SYT6,TACR1,TAFA4,TCEAL2,TCEAL5,TCF23,TENM1,THBS4,TLL1,TMEFF2,TMEM100,TMEM35A,TMIGD1,TMOD1,TNNT3,TNS1,TNXB,TRARG1,TRDN,UGT2B10,UGT2B4,UNC80,VEGFD,VGLL3,VIT,VSTM2A,VXN,WSCD2,XKR4,ZBTB16,ZDHHC22,ZFHX4,ZMAT4,ZNF385B,ZNF676,和ZNF728。
3.根据权利要求1所述的组合物,其特征在于,第二分子亚型还包括一或多种选自下组的基因:ADAT3,ANP32D,BHLHA9,BOD1L2,C4orf48,CCDC85B,CDH16,CLMAT3,CSNK1A1L,CTU1,DBET,DDC-AS1,DEFA5,EIF3IP1,FAM173A,FEZF2,FOXI3,FRMD8P1,GALR3,GJD3,GPR25,HBA1,HES4,HIST1H4A,HIST1H4L,HLA-L,IGFBP7-AS1,ITLN2,KCNE1B,LCN15,LKAAEAR1,LOC101927795,LOC101927972,LOC101928372,LOC344967,LRRC26,MAGEA10,MESP1,MIR203A,MIR324,MIR3661,MIR4449,MIR4479,MIR4665,MIR4737,MIR4767,MIR6807,MIR6858,MIR6891,MIR8075,NACA2,NOXO1,ONECUT3,PCSK1N,PDF,PITPNM2-AS1,PNMA5,PRR7,PRSS2,PRSS56,PTGER1,PTTG3P,REG3A,RNA5S9,RNU4-1,RNU5A-1,RNU5B-1,RNU5E-1,RNU6ATAC,RNY1,RPL29P2,RPRML,SBF1P1,SHISAL2B,SKOR2,SLC32A1,SMARCA5-AS1,SMCR5,SNHG25,SNORA36A,SNORD30,SNORD38A,SNORD3B-2,SNORD41,SNORD48,TMEM160,TMEM238,TPGS1,TRAPPC5,UBE2NL,WBP11P1,和ZAR1。
4.根据权利要求1所述的组合物,其特征在于,所述抗癌疗法是化疗、放疗、手术或其组合。
5.根据权利要求1所述的组合物,其特征在于,所述抗癌疗法是标准新辅助放化疗或标准新辅助放化疗之后的手术治疗。
6.根据权利要求1所述的组合物,其特征在于,所述癌症是直肠癌。
7.一种试剂盒,用于预测癌症患者对抗癌疗法的疗效反应或抗癌疗法的预后、或确定抗癌疗法前的新辅助化疗的目标患者,该试剂盒包括:
权利要求1至6中任一项所述的组合物。
8.根据权利要求7所述的试剂盒,其特征在于,所述试剂盒是RT-PCR试剂盒、DNA芯片试剂盒、ELISA试剂盒、蛋白芯片试剂盒、快速试剂盒或多反应监测(MRM)试剂盒。
9.一种生物标志物组合物,用于预测癌症患者对抗癌疗法的疗效反应或抗癌疗法的预后、或确定抗癌疗法前的新辅助化疗的目标患者,该组合物包括:
第一分子亚型或第二分子亚型中的至少一种基因或由其编码的蛋白,
其中第一分子亚型包含一种或多种选自PMP2,AGTR1,PLCXD3,TCEAL6,ANKRD1,和ARHGAP26-AS1的基因,且
第二分子亚型包括一种或多种选自PGP,SLC26A3,HIST1H4C,RUVBL2,RAB19,HIST2H2AC,和SNORD69的基因。
10.一种提供信息的方法,用于预测癌症患者对抗癌疗法的疗效反应或抗癌疗法的预后、或确定抗癌疗法前的新辅助化疗的目标患者,该方法包括:
测量从目标受试者的生物样品中分离的第一分子亚型或第二分子亚型的至少一种基因或由其编码的蛋白的表达水平,
其中第一分子亚型包含一种或多种选自PMP2,AGTR1,PLCXD3,TCEAL6,ANKRD1,和ARHGAP26-AS1的基因,和
第二分子亚型包括一种或多种选自PGP,SLC26A3,HIST1H4C,RUVBL2,RAB19,HIST2H2AC,和SNORD69的基因。
11.根据权利要求10所述的方法,其特征在于,第一分子亚型还包括一或多种选自下组的基因:AADACL2,ABCA6,ABCA8,ABCA9,ABCB5,ABI3BP,ACADL,ACSM5,ACTG2,ADAMTS9-AS1,ADAMTS9-AS2,ADAMTSL3,ADCYAP1R1,ADGRB3,ADH1B,ADIPOQ,ADRA1A,AFF3,AGTR1,AICDA,ALB,ANGPTL1,ANGPTL5,ANGPTL7,ANK2,ANKS1B,ANXA8L1,APOA2,APOB,APOC3,AQP4,AQP8,ARPP21,ART4,ASB5,ASPA,ASTN1,ATCAY,ATP1A2,ATP2B2,ATP2B3,AVPR1B,B3GALT5-AS1,BCHE,BEST4,BHMT2,BLOC1S5-TXNDC5,BMP3,BRINP3,BVES,BVES-AS1,C14orf180,C1QTNF7,C7,C8orf88,CA1,CA2,CA7,CACNA2D1,CADM2,CADM3,CALN1,CARTPT,CASQ2,CAVIN2,CCBE1,CCDC144B,CCDC158,CCDC160,CCDC169,CCN5,CD300LG,CDH10,CDH19,CDKN2B-AS1,CDO1,CHRDL1,CHRM2,CHST9,CIDEA,CILP,CLCA4,CLCNKB,CLDN8,CLEC3B,CLEC4M,CLVS2,CMA1,CNGA3,CNN1,CNR1,CNTN1,CNTN2,CNTNAP4,COL19A1,CP,CPEB1,CPXM2,CR2,CRP,CTNNA3,CTSG,CYP1B1,DAO,DCLK1,DDR2,DES,DHRS7C,DIRAS2,DPP6,DPT,EBF2,ECRG4,ELAVL4,EPHA5,EPHA6,EPHA7,ERICH3,EVX2,FABP4,FAM106A,FAM133A,FAM135B,FAM180B,FDCSP,FGF10,FGF13-AS1,FGF14,FGFBP2,FGG,FGL1,FHL1,FILIP1,FLNC,FMO2,FRMD6-AS2,FRMPD4,FUT9,GABRA5,GABRG2,GALR1,GAP43,GAS1RR,GC,GCG,GDF6,GFRA1,GNAO1,GPM6A,GPR119,GPR12,GPRACR,GRIA2,GRIN2A,GTF2IP1,GUCA2B,HAND1,HAND2,HAND2-AS1,HEPACAM,HP,HPCAL4,HRG,HRK,HSPB8,HTR2B,IGSF10,IGSF11,IRX6,ISM1,KCNA1,KCNB1,KCNC2,KCNK2,KCNMA1,KCNMB1,KCNQ5,KCNT2,KCTD8,KERA,KHDRBS2,KIAA0408,KIF1A,KRT222,KRT24,KRTAP13-2,LCN10,LDB3,LEP,LGI1,LIFR,LINC00504,LINC00507,LINC00682,LINC00924,LINC01266,LINC01352,LINC01474,LINC01505,LINC01697,LINC01798,LINC01829,LINC02015,LINC02023,LINC02185,LINC02268,LINC02408,LINC02544,LIX1,LMO3,LMOD1,LOC100506289,LOC101928731,LOC102724050,LOC107986321,LOC283856,LOC440434,LOC729558,LONRF2,LRAT,LRCH2,LRRC3B,LRRC4C,LRRTM4,LVRN,LYVE1,MAB21L1,MAB21L2,MAGEE2,MAMDC2,MAPK4,MASP1,MEF2C-AS1,MEOX2,METTL24,MFAP5,MGAT4C,MGP,MICU3,MIR133A1HG,MIR8071-1,MMRN1,MORN5,MPPED2,MRGPRE,MS4A1,MS4A12,MSRB3,MUSK,MYH11,MYH2,MYLK,MYO3A,MYOC,MYOCD,MYOM1,MYOT,MYT1L,NALCN,NAP1L2,NBEA,NECAB1,NEFL,NEFM,NEGR1,NETO1,NEUROD1,NEXMIF,NEXN,NGB,NIBAN1,NLGN1,NOS1,NOVA1,NPR3,NPTX1,NPY2R,NRG3,NRK,NRSN1,NRXN1,NSG2,NTNG1,NTRK3,NUDT10,OGN,OLFM3,OMD,OTOP2,OTOP3,P2RX2,P2RY12,PAK3,PAPPA2,PCDH10,PCDH11X,PCDH9,PCOLCE2,PCP4L1,PCSK2,PDZRN4,PEG3,PENK,PGM5,PGM5-AS1,PGM5P4-AS1,PGR,PHOX2B,PI16,PIK3C2G,PIRT,PKHD1L1,PLAAT5,PLCXD3,PLD5,PLIN1,PLIN4,PLN,PLP1,PMP2,POPDC2,POU3F4,PPP1R1A,PRDM6,PRELP,PRG4,PRIMA1,PROKR1,PTCHD1,PTGIS,PTPRQ,PTPRZ1,PYGM,PYY,RANBP3L,RBFOX3,RBM20,RELN,RERGL,RGS13,RGS22,RIC3,RIMS4,RNF150,RNF180,RORB,RSPO2,SCARA5,SCGN,SCN2B,SCN7A,SCN9A,SCNN1G,SCRG1,SEMA3E,SERTM1,SERTM2,SFRP1,SFRP2,SFTPA1,SGCG,SHISAL1,SLC13A5,SLC17A8,SLC30A10,SLC4A4,SLC5A7,SLC6A2,SLC7A14,SLIT2,SLITRK2,SLITRK3,SLITRK4,SMIM28,SMYD1,SNAP25,SNAP91,SORCS1,SORCS3,SPHKAP,SPIB,SPOCK3,SST,ST8SIA3,STMN2,STMN4,STON1-GTF2A1L,STUM,SV2B,SYNM,SYNPO2,SYT10,SYT4,SYT6,TACR1,TAFA4,TCEAL2,TCEAL5,TCF23,TENM1,THBS4,TLL1,TMEFF2,TMEM100,TMEM35A,TMIGD1,TMOD1,TNNT3,TNS1,TNXB,TRARG1,TRDN,UGT2B10,UGT2B4,UNC80,VEGFD,VGLL3,VIT,VSTM2A,VXN,WSCD2,XKR4,ZBTB16,ZDHHC22,ZFHX4,ZMAT4,ZNF385B,ZNF676,和ZNF728。
12.根据权利要求10所述的方法,其特征在于,第二分子亚型还包括一或多种选自下组的基因:ADAT3,ANP32D,BHLHA9,BOD1L2,C4orf48,CCDC85B,CDH16,CLMAT3,CSNK1A1L,CTU1,DBET,DDC-AS1,DEFA5,EIF3IP1,FAM173A,FEZF2,FOXI3,FRMD8P1,GALR3,GJD3,GPR25,HBA1,HES4,HIST1H4A,HIST1H4L,HLA-L,IGFBP7-AS1,ITLN2,KCNE1B,LCN15,LKAAEAR1,LOC101927795,LOC101927972,LOC101928372,LOC344967,LRRC26,MAGEA10,MESP1,MIR203A,MIR324,MIR3661,MIR4449,MIR4479,MIR4665,MIR4737,MIR4767,MIR6807,MIR6858,MIR6891,MIR8075,NACA2,NOXO1,ONECUT3,PCSK1N,PDF,PITPNM2-AS1,PNMA5,PRR7,PRSS2,PRSS56,PTGER1,PTTG3P,REG3A,RNA5S9,RNU4-1,RNU5A-1,RNU5B-1,RNU5E-1,RNU6ATAC,RNY1,RPL29P2,RPRML,SBF1P1,SHISAL2B,SKOR2,SLC32A1,SMARCA5-AS1,SMCR5,SNHG25,SNORA36A,SNORD30,SNORD38A,SNORD3B-2,SNORD41,SNORD48,TMEM160,TMEM238,TPGS1,TRAPPC5,UBE2NL,WBP11P1,和ZAR1。
13.根据权利要求10所述的方法,其特征在于,所述抗癌疗法是化疗、放疗、手术或其组合。
14.根据权利要求10所述的方法,其特征在于,所述抗癌疗法是标准新辅助放化疗或标准新辅助放化疗之后的手术治疗。
15.根据权利要求10所述的方法,其特征在于,当所述第一分子亚型在分离自目标受试者的生物样品中表达、或者其表达水平高于对照时,预测对所述抗癌疗法的疗效反应或该抗癌疗法的预后不佳。
16.根据权利要求10所述的方法,其特征在于,当所述第二分子亚型在分离自目标受试者的生物样品中表达、或者其表达水平高于对照时,预测对所述抗癌疗法的疗效反应或该抗癌疗法的预后良好。
17.根据权利要求10所述的方法,其特征在于,还包括:
确认受试者的TNM分期、年龄、性别、病理完全缓解(pCR)或其组合信息。
18.根据权利要求17所述的方法,其特征在于,当所述受试者的第一分子亚型的表达水平高于对照、并且所述受试者的TNM分期为T3或T4时,预测抗癌疗法的预后不良。
19.根据权利要求17所述的方法,其特征在于,当所述受试者的第一分子亚型的表达水平高于对照、并且所述受试者的TNM分期为N1或N2时,预测抗癌疗法的预后不良。
20.根据权利要求17所述的方法,其特征在于,当所述受试者的第二分子亚型的表达水平高于对照、并且在抗癌疗法后实现pCR时,预测抗癌疗法的预后良好。
21.根据权利要求17所述的方法,其特征在于,当所述受试者的第二分子亚型的表达水平高于对照、并且所述受试者的TNM分期为T0、T1或T2时,预测抗癌疗法的预后良好。
22.根据权利要求17所述的方法,其特征在于,当所述受试者的第二分子亚型的表达水平高于对照、并且所述受试者的TNM分期为N0时,预测抗癌疗法的预后良好。
23.根据权利要求10所述的方法,其特征在于,所述癌症是一种或多种选自以下的癌症:乳腺癌、子宫癌、食道癌、胃癌、脑癌、直肠癌、结肠癌、肺癌、皮肤癌、卵巢癌、宫颈癌、肾癌、血癌、胰腺癌、前列腺癌、睾丸癌、喉癌、口腔癌、头颈癌、甲状腺癌、肝癌、膀胱癌、骨肉瘤、淋巴瘤、和白血病。
24.一种设备,用于预测对抗癌疗法的疗效反应或抗癌疗法的预后、或确定抗癌疗法前的新辅助化疗的目标患者,该设备包括:
测量单元,用于测量从目标受试者的生物样品中分离的第一分子亚型或第二分子亚型的一或多种基因或由其编码的蛋白的表达水平;和
计算单元,其提供用于从表达水平预测受试者对抗癌疗法的疗效反应或抗癌疗法的预后的信息,
其中第一分子亚型包含一种或多种选自PMP2,AGTR1,PLCXD3,TCEAL6,ANKRD1,ARHGAP26-AS1,和TCEAL6的基因,和
第二分子亚型包括一种或多种选自PGP,SLC26A3,HIST1H4C,RUVBL2,RAB19,HIST2H2AC,和SNORD69的基因。
25.根据权利要求24所述的设备,其特征在于,所述抗癌疗法是化疗、放疗、手术或其组合。
26.根据权利要求24所述的设备,其特征在于,所述抗癌疗法是标准新辅助放化疗或标准新辅助放化疗之后的手术治疗。
27.根据权利要求24所述的设备,其特征在于,还包括:
输入单元,用于接收受试者的TNM分期、年龄或性别、病理完全反应(pCR)或其组合信息。
CN202080080943.3A 2019-11-20 2020-11-20 预测对标准新辅助放化疗的反应和治疗后的预后的组合物、以及预测标准疗法预后不良的患者的方法和组合物 Pending CN114846158A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR20190149594 2019-11-20
KR10-2019-0149594 2019-11-20
PCT/KR2020/016526 WO2021101339A1 (ko) 2019-11-20 2020-11-20 직장암의 선행화학방사선 표준 치료 반응 예측 및 치료 후 예후 예측을 위한 조성물 및 표준 치료 후 예후가 매우 나쁜 환자를 예측하는 방법 및 조성물

Publications (1)

Publication Number Publication Date
CN114846158A true CN114846158A (zh) 2022-08-02

Family

ID=75981436

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080080943.3A Pending CN114846158A (zh) 2019-11-20 2020-11-20 预测对标准新辅助放化疗的反应和治疗后的预后的组合物、以及预测标准疗法预后不良的患者的方法和组合物

Country Status (6)

Country Link
US (1) US20230021094A1 (zh)
EP (1) EP4063522A4 (zh)
JP (1) JP7540765B2 (zh)
KR (1) KR102539897B1 (zh)
CN (1) CN114846158A (zh)
WO (1) WO2021101339A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116042823A (zh) * 2022-09-19 2023-05-02 厦门艾德生物医药科技股份有限公司 用于食管鳞癌预后及疗法疗效评估的分子标记物及其应用
CN118059246A (zh) * 2024-04-18 2024-05-24 呈诺再生医学科技(北京)有限公司 环状RNA circSLC4A4表达促进剂在结直肠癌诊断和治疗中的新用途

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20230064502A (ko) 2021-11-03 2023-05-10 계명대학교 산학협력단 상피 나트륨 채널 관련 유전자들의 자궁경부암 진단 또는 예후 예측 용도
CN114540492A (zh) * 2022-01-10 2022-05-27 中山大学肿瘤防治中心(中山大学附属肿瘤医院、中山大学肿瘤研究所) 检测SCN4A和SCN7A mRNA表达量的产品在制备肝癌预后预测产品中的应用
CN114317603B (zh) * 2022-01-12 2023-10-13 北京航空航天大学 一种Foxi3基因定点突变小鼠模型的构建方法及其应用
KR20230144757A (ko) * 2022-04-08 2023-10-17 (의료)길의료재단 HSPD1 유전자의 mRNA 또는 이들의 유전자에 의해 코딩되는 HSP60 단백질을 이용한 대장암 예후 예측 방법
WO2023231803A1 (zh) * 2022-05-31 2023-12-07 广州市康润生物科技有限公司 Cf48肾损伤生物标志物及在肾损伤治疗药物中的用途

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120184454A1 (en) * 2011-01-14 2012-07-19 Kalady Matthew F Gene signature is associated with early stage rectal cancer recurrence
WO2013158722A1 (en) 2012-04-17 2013-10-24 The Cleveland Clinic Foundation Diagnosis of lymph node involvement in rectal cancer
US20150299807A1 (en) 2012-11-21 2015-10-22 The Johns Hopkins University Genomic classifiers for non-invasive identification of high grade prostate cancer with metastatic potential
US11976332B2 (en) 2018-02-14 2024-05-07 Dermtech, Inc. Gene classifiers and uses thereof in non-melanoma skin cancers

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116042823A (zh) * 2022-09-19 2023-05-02 厦门艾德生物医药科技股份有限公司 用于食管鳞癌预后及疗法疗效评估的分子标记物及其应用
CN116042823B (zh) * 2022-09-19 2024-03-29 广东省人民医院 用于食管鳞癌预后及疗法疗效评估的分子标记物及其应用
CN118059246A (zh) * 2024-04-18 2024-05-24 呈诺再生医学科技(北京)有限公司 环状RNA circSLC4A4表达促进剂在结直肠癌诊断和治疗中的新用途

Also Published As

Publication number Publication date
KR102539897B1 (ko) 2023-06-07
US20230021094A1 (en) 2023-01-19
KR20210061961A (ko) 2021-05-28
EP4063522A4 (en) 2024-05-15
JP7540765B2 (ja) 2024-08-27
JP2023503301A (ja) 2023-01-27
WO2021101339A1 (ko) 2021-05-27
EP4063522A1 (en) 2022-09-28

Similar Documents

Publication Publication Date Title
CN114846158A (zh) 预测对标准新辅助放化疗的反应和治疗后的预后的组合物、以及预测标准疗法预后不良的患者的方法和组合物
US9964542B2 (en) Bladder cancer detection composition, kit, and associated methods
JP6554646B2 (ja) 遺伝子型及び表現型バイオマーカーを用いる無症候性血尿を有する患者のトリアージ
US8781750B2 (en) Cell-type-specific patterns of gene expression
US11208698B2 (en) Methods for detection of markers bladder cancer and inflammatory conditions of the bladder and treatment thereof
KR102055305B1 (ko) 위식도경계부선암의 진단 및 표적 치료를 위한 마커
CA2745961A1 (en) Materials and methods for determining diagnosis and prognosis of prostate cancer
JP2014221073A (ja) 癌の検出のための尿遺伝子発現比
KR20130017525A (ko) 대장암, 유방암, 신장암 또는 갑상선암의 조기 진단을 위한 바이오 마커 및 이의 용도
KR102499664B1 (ko) 암의 진단용 조성물
KR101940450B1 (ko) 비-소세포성 폐암 진단 융합 전사체 및 신규 전사체 마커
EP2440931B1 (en) Method for determining the risk of developing brain metastasis, and a kit to carry out said method
US20150011411A1 (en) Biomarkers of cancer
EP4332242A1 (en) Method for predicting prognosis of gastric cancer
KR102326119B1 (ko) 암의 면역 치료 후 예후 예측용 바이오 마커
KR102499678B1 (ko) 암의 진단용 조성물
KR102175265B1 (ko) Txndc7을 포함하는 간세포암종 진단 또는 예후 예측용 바이오마커 조성물
US20230074311A1 (en) Composition for cancer diagnosis
KR101833983B1 (ko) DOCK10 유전자의 mRNA 또는 이들 유전자에 의해 코딩되는 단백질의 발현수준을 측정하는 제제를 포함하는, 암의 예후 예측용 조성물, 이를 포함하는 키트 및 이들의 이용
KR20230012710A (ko) 구강암의 임프절 전이 예측과 관련된 유전자군
GB2613386A (en) Diagnostic test
JP2024012078A (ja) Her2陽性乳癌治療予後予測用新規バイオマーカーおよびその用途
KR20230030228A (ko) 암의 진단용 조성물
KR20200038045A (ko) 방광암 수술치료법 결정을 위한 유전자 세트

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination