CN114846158A

CN114846158A - 预测对标准新辅助放化疗的反应和治疗后的预后的组合物、以及预测标准疗法预后不良的患者的方法和组合物

Info

Publication number: CN114846158A
Application number: CN202080080943.3A
Authority: CN
Inventors: 白淳明; 闵丙绍; 波格-盖尔·凯瑟琳
Original assignee: Novomics Co ltd
Current assignee: Novomics Co ltd
Priority date: 2019-11-20
Filing date: 2020-11-20
Publication date: 2022-08-02
Also published as: KR102539897B1; US20230021094A1; KR20210061961A; EP4063522A4; JP7540765B2; JP2023503301A; WO2021101339A1; EP4063522A1

Abstract

本发明涉及用于预测癌症患者预后的生物标志物组合物，该生物标志物组合物包括第一分子亚型或由该第一分子亚型转录和翻译的蛋白。本发明还涉及用于预测癌症患者预后的生物标志物组合物，该生物标志物组合物还包括第二分子亚型或由该第二分子亚型转录和翻译的蛋白。

Description

预测对标准新辅助放化疗的反应和治疗后的预后的组合物、以及预测标准疗法预后不良的患者的方法和组合物

技术领域

本发明涉及用于预测对直肠癌的新辅助放化疗(neoadjuvantchemoradiotherapy)的反应或直肠癌治疗的预后的组合物，以及使用该组合物的预测方法。

背景技术

直肠癌是肠道最常见的癌症，但它易于早期发现和治疗，治愈率很高。中年以后直肠癌的发病率较高。直肠癌可起源于直肠息肉。症状与直肠粘膜炎(catarrh)相似，可包括恶臭血便。观察到排便后有粘液排出和频繁的排便冲动。此外，直肠狭窄(stenosis)的症状还包括直肠和肛门周围的沉重感、顽固性便秘(stubborn constipation)、大便如兔粪、大便狭窄或稀薄，随着症状的进展，由于括约肌功能不全而出现大便失禁。

触诊时，直肠内可触及肿瘤硬块。用直肠镜直接检查肿瘤、切除肿瘤和进行窥器(speculum)检查，都可以得到明确的诊断。当在癌症进展早期(即局限于直肠壁)时进行手术，后果非常好。当无法进行根治性手术时，会制作人工肛门排便，并在局部照射镭和高压辐射。在某些情况下，即使采用这种治疗方法，患者也可以存活长达10年。

直肠癌和结肠癌虽然形态相似，但治疗方法不同。结肠癌在根治性手术后接受辅助化疗，而直肠癌则在术前放化疗、再进行根治性手术。

由于结肠癌分子亚型归类机制(classifier)很大程度上取决于肿瘤块内间质组织的量，因此直肠癌亚型归类机制可能不适用于通常用小的治疗前(pretreated)活检标本诊断的直肠癌。即，结肠癌根据基因表达模式分为四种分子亚型，已证明CMS4分子亚型预后不良且对现有抗癌药物有耐药性。由于CMS4分子亚型是由癌组织中成纤维细胞的比例决定的，对于治疗前用小活检组织诊断、并且马上治疗而不进行手术的直肠癌，成纤维细胞的比例是未知的，因此不可能应用此种结肠癌分子分型方法。

因此，直肠癌需要一种不同于结肠癌的生物标志物，对直肠癌的固有术前放化疗的反应、复发率和存活率提供临床可利用性。

发明内容

技术问题

本发明旨在提供一种生物标志物组合物，其能够准确且简单地预测针对抗癌疗法的疗效反应(therapeutic response)或该抗癌疗法的预后。

本发明还旨在提供用于预测预后的组合物，其可以准确且简单地预测针对抗癌疗法的疗效反应或该抗癌疗法的预后。

本发明还旨在提供试剂盒，其能够准确且简单地预测针对抗癌疗法的疗效反应或该抗癌疗法的预后。

本发明还旨在提供一种提供信息的方法，该方法可以准确且简单地预测针对抗癌疗法的疗效反应或该抗癌疗法的预后。

本发明还旨在提供一种设备(device)，其用于预测对抗癌疗法的疗效反应或抗癌疗法的预后的。

本发明还涉及提供一种生物标志物组合物，其通过分析直肠癌治疗开始前的诊断性活检所得癌症组织来识别用于总的新辅助疗法的目标组别。

本发明还涉及提供一种组合物，其通过分析直肠癌治疗开始前的诊断性活检所得癌症组织来识别用于总的新辅助疗法的目标组别。

本发明还涉及提供一种试剂盒，其通过分析直肠癌治疗开始前的诊断性活检所得癌症组织来识别用于总的新辅助疗法的目标组别。

本发明还涉及提供一种设备，其通过分析直肠癌治疗开始前的诊断性活检所得癌症组织来识别用于总的新辅助疗法的目标组别。

然而，本发明要解决的技术问题不限于上述问题，本领域普通技术人员通过以下描述将充分理解本文未描述的其他问题。

技术方案

在下文中，本发明将参考各种实施例来描述。在以下描述中，为了充分理解本发明，将描述各种具体细节，例如，具体形式、组成和过程。然而，某些实施方案可以在无一个或多个具体细节的情况下实施，或与其他已知方法和形式组合实施。在另一示例中，已知工艺和制造技术未特别详细地描述，以免不必要地模糊本发明。在整个说明书中，提及“一个实施方案”或“实施方案”是指结合该实施方案描述的特定特征、形式、组成或性质包含在本发明的一或多个实施方案中。因此，在整个说明书各处表述的“一个实施方案”或“实施方案”的上下文不一定代表相同的本发明实施方案。此外，特定的特征、形式、组成或性质可以通过任何合适的方式组合在一个或多个实施方案中。

除非另有明确定义，否则本文使用的所有科学和技术术语与本发明所属领域的普通技术人员通常理解的含义相同。

在本发明的一个方面，本发明提供了一种生物标志物组合物，用于预测癌症患者对抗癌疗法的疗效反应或抗癌疗法后的预后，或确定抗癌疗法前的新辅助化疗的目标患者，该组合物包括第一分子亚型和第二分子亚型的至少一个基因或由其编码的蛋白。

在本发明中，第一分子亚型可以包括选自PMP2,AGTR1,PLCXD3,TCEAL6,ANKRD1和ARHGAP26-AS1的一种或多种基因。

本文中“PMP2”基因是编码髓鞘(Myelin)P2蛋白(PMP2蛋白)的基因，PMP2蛋白是外周神经系统(PNS)髓鞘和中枢神经系统(CNS)髓鞘的成分(component)，其是P2的组成部分(constituent)。作为一种结构蛋白，P2被认为可稳定髓鞘膜，并可参与雪旺细胞(Schwanncells)中的脂质转运。在本发明中，PMP2蛋白可以由SEQ ID NO：1所示的氨基酸序列组成，但本发明不限于此。

本文中“AGTR1”基因是编码血管紧张素II受体1型(AGTR1)蛋白的基因，该蛋白是最特征性的血管紧张素受体，具有血管收缩效应并调节醛固酮(aldosterone)分泌。在本发明中，AGTR1蛋白可以由SEQ ID NO：2所示的氨基酸序列组成，但本发明不限于此。

本文中“PLCXD3”基因是存在于假常染色体区(PAR)中的磷脂酰肌醇特异性磷脂酶C的包含X结构域的蛋白3的基因，以及编码PI-PLC的包含X结构域的蛋白3的基因(PLCXD3)。在本发明中，PLCXD3可以由SEQ ID NO：3表示的氨基酸序列组成，但本发明不限于此。

本文中“TCEAL6”基因编码转录延伸因A(SII)样6(TCEAL6)或含有锚蛋白重复结构域的蛋白1，可参与转录调控。在本发明中，TCEAL6或含有锚蛋白重复结构域的蛋白1可以由SEQ ID NO：4表示的氨基酸序列组成，但本发明不限于此。

本文中“ANKRD1”基因编码含有锚蛋白重复结构域的蛋白1(ANKRD1)，在心脏和骨骼肌中高表达，在应激条件下表达水平增加。在本发明中，ANKRD1可以由SEQ ID NO：5表示的氨基酸序列组成，但本发明不限于此。

本文中术语“ARHGAP26-AS1”基因是与lncRNA类相关的RNA基因，可由SEQ ID NO：6表示，但本发明不限于此。

在本发明一个实施方案中，第一分子亚型还可以包括一种或多种选自下组的基因：GTF2IP1,TBC1D3L,BLOC1S5-TXNDC5,MIR4477B,HIST2H3C,HNRNPA1P33,CTAGE8,GOLGA8K,KRT222,LOC440434,C10orf131,PGM5-AS1,ACADL,PGM5P3-AS1,LOC101929607,KIAA0408,PLGLB2,ZNF676,KIAA2022,SEMA3E,PLCXD3,NLGN1,SLITRK4,GAS1RR,TCEAL2,LOC642131,LONRF2,GRIN2A,ADAMTS9-AS1,LOC644838,LOC100507387,FAM35BP,EPHA6,MIR186,LINC01266,FAM47E-STBD1,LINC01489,TVP23C-CDRT4,FAM133A,NEXN,LGI1,OR7E12P,MIR3911,MYH8,ZNF728,BCHE,CCDC144B,LINC01537,LOC101928509,KCTD8,LOC100507073,ARHGEF18,BVES-AS1,LINGO2,SCN7A,GRIA2,LINC00504,LINC01352,MIR133A1HG,SCN9A,HLX-AS1,LOC100506289,FILIP1,MEIS1-AS2,FGF13-AS1,HCG23,PLN,RANBP3L,SPOCK3,PCDH10,LCN10,COL25A1,MEF2C-AS1,ATP2B2,CDH19,ADIPOQ,CRP,ALB,OTOP2,MYOC,FGL1,ATP1A2,CHRM2,PCSK2,SLITRK3,GPM6A,HAND2-AS1,RIMS4,NRXN1,PDZRN4,KRT24,ANGPTL1,TRARG1,MYH11,CASQ2,NGB,LOC101928731,KCNA1,SLC5A7,PMP2,CTNNA3,OGN,SYT4,FABP4,ADH1B,ADCYAP1R1,PI16,GCG,HP,CADM2,MYH2,CLVS2,MAMDC2,FRMPD4,CA1,FAM180B,CMA1,SERTM1,KCNB1,NEXMIF,GC,PLP1,APCS,SLC17A8,ANGPTL7,SYNM,PHOX2B,AGTR1,C7,ST8SIA3,LMO3,LDB3,RERGL,ASB5,SGCG,OTOP3,CCBE1,BMP3,HAND1,CADM3,SYNPO2,TMIGD1,NPTX1,ABCA8,NEFL,PLIN4,CD300LG,LEP,MORN5,ECRG4,SFRP1,SLC7A14,SCN2B,FMO2,SORCS1,CLCA4,OMD,VEGFD,STMN4,PTPRZ1,AQP4,SMYD1,SCRG1,ADGRB3,TMEFF2,CNR1,CIDEA,CNTN1,DPP6,HAND2,TCEAL5,FRMD6-AS2,SMIM28,SYT10,NOS1,PLD5,TNNT3,ABCA9,EPHA7,GALR1,RSPO2,NPY2R,CHRDL1,APOC3,FUT9,PRIMA1,LINC00924,TNXB,LOC102724050,NTNG1,CNGA3,AQP8,PGM5,ASTN1,RNF150,ADAMTSL3,LYVE1,ZDHHC22,LRRTM4,RBFOX3,ABCA6,NECAB1,FGG,NEFM,APOB,RIC3,VSTM2A,OLFM3,CILP,LINC00682,NIBAN1,LMOD1,MYOT,ABI3BP,PPP1R1A,WSCD2,FDCSP,HSPB8,KHDRBS2,NSG2,PKHD1L1,CHST9,ZMAT4,POU3F4,LIX1,MUSK,NRK,PGR,AADACL2,CLDN8,ADAMTS9-AS2,METTL24,NRSN1,LOC729558,SCGN,BEST4,SLITRK2,RELN,NPR3,CCN5,CDH10,CA7,LINC02268,SPIB,ABCB5,CNTNAP4,PTCHD1,UGT2B4,ANKS1B,LINC01829,DPT,MGAT4C,MYT1L,CPEB1,ERICH3,SORCS3,CYP1B1,LINC02023,SALL3,ANK2,PRELP,ART4,PIRT,MYLK,C1QTNF7,LINC01798,DCLK1,DES,KCNC2,CNN1,BRINP3,FAM135B,PYY,GAP43,NAP1L2,ACSM5,THBS4,HTR2B,PYGM,IGSF10,TAFA4,KRTAP13-2,VIT,LRAT,LRRC3B,TMOD1,EPHA5,IRX6,PCDH11X,SLC4A4,HRK,RBM20,LOC283856,LINC00507,ZBTB16,PRG4,APOA2,ASPA,ANXA8L1,CLCNKB,SERTM2,GABRG2,SLC6A2,ZFHX4,MMRN1,STUM,PCOLCE2,DIRAS2,XKR4,SFTPA1,GNAO1,LVRN,DAO,TMEM100,ANGPTL5,LINC01505,SST,HEPACAM,KCNK2,HRG,MFAP5,LINC02544,RORB,FGF14,CP,MIR8071-1,NEUROD1,MYOCD,CNTN2,SCARA5,CAVIN2,LRRC4C,TCF23,MS4A12,C14orf180,PCDH9,PENK,CARTPT,HPCAL4,ZNF716,PCP4L1,CLEC3B,MYOM1,CCDC160,CA2,GFRA1,LOC107986321,LOC101928134,FHL1,NALCN,MAS1L,MS4A1,PEG3,SFTPC,POPDC2,GPRACR,SLIT2,TRDN,LINC02185,SCNN1G,SNAP25,MAGEB2,ACTG2,MEOX2,C8orf88,ATP2B3,TNS1,GPR119,ZNF385B,SFRP2,KCNQ5,KCNMA1,STON1-GTF2A1L,LIFR,ELAVL4,ADRA1A,ATCAY,LINC01474,FGF10,PIK3C2G,SLC13A5,NUDT10,CCDC169,STMN2,AVPR1B,MAB21L1,MASP1,LINC02408,VXN,PGM5P4-AS1,SNAP91,LRCH2,ISM1,NOVA1,NEGR1,SPHKAP,LINC01697,SHISAL1,CDKN2B-AS1,CR2,MYO3A,AFF3,MROH2B,P2RX2,KIF1A,LINC02015,IGSF11,SV2B,ARPP21,SYT6,GABRA5,EVX2,COL19A1,FGFBP2,FAM106A,VGLL3,KCNT2,PTGIS,EBF2,CTSG,CACNA2D1,B3GALT5-AS1,GUCA2B,UNC80,NETO1,GPR12,LOC105378318,PLIN1,RGS22,SLC30A10,TMEM35A,TACR1,AICDA,MSRB3,NRG3,PLAAT5,CT45A10,LINC01446,TLL1,CLEC4M,DDR2,MAB21L2,MPPED2,CALN1,MICU3,BVES,LOC107986400,DHRS7C,KERA,MAPK4,CDO1,PROKR1,PAPPA2,KCNMB1,P2RY12,MAGEE2,FLNC,GDF6,NBEA,BHMT2,CPXM2,NTRK3,TENM1,RNF180,MRGPRE,CCDC158,PRDM6,RGS13,PAK3,MGP,UGT2B10,和PTPRQ，但本发明不限于此。

在本发明另一实施方案中，第一分子亚型还可以包括一种或多种选自下组的基因：ACADL,ADAMTS9-AS1,ARHGEF18,BCHE,BLOC1S5-TXNDC5,BVES-AS1,C10orf131,CCDC144B,CDH19,CTAGE8,EPHA6,FAM133A,FAM35BP,FAM47E-STBD1,FILIP1,GAS1RR,GOLGA8K,GRIA2,GRIN2A,GTF2IP1,HCG23,HIST2H3C,HLX-AS1,HNRNPA1P33,KCTD8,KIAA0408,KIAA2022,KRT222,LGI1,LINC00504,LINC01266,LINC01352,LINC01489,LINC01537,LINGO2,LOC100507073,LOC100507387,LOC101928509,LOC101929607,LOC440434,LOC642131,LOC644838,LONRF2,MEIS1-AS2,MIR133A1HG,MIR186,MIR3911,MIR4477B,MYH8,NEXN,NLGN1,OR7E12P,PCDH10,PGM5-AS1,PGM5P3-AS1,PLCXD3,PLGLB2,PLN,RANBP3L,SCN7A,SCN9A,SEMA3E,SLITRK4,SYT4,TBC1D3L,TCEAL2,TVP23C-CDRT4,ZNF676,和ZNF728，但本发明不限于此。

在本发明又一实施方案中，第一分子亚型还可以包括一种或多种选自下组的基因：AADACL2,ABCA6,ABCA8,ABCA9,ABCB5,ABI3BP,ACADL,ACSM5,ACTG2,ADAMTS9-AS1,ADAMTS9-AS2,ADAMTSL3,ADCYAP1R1,ADGRB3,ADH1B,ADIPOQ,ADRA1A,AFF3,AGTR1,AICDA,ALB,ANGPTL1,ANGPTL5,ANGPTL7,ANK2,ANKS1B,ANXA8L1,APOA2,APOB,APOC3,AQP4,AQP8,ARPP21,ART4,ASB5,ASPA,ASTN1,ATCAY,ATP1A2,ATP2B2,ATP2B3,AVPR1B,B3GALT5-AS1,BCHE,BEST4,BHMT2,BLOC1S5-TXNDC5,BMP3,BRINP3,BVES,BVES-AS1,C14orf180,C1QTNF7,C7,C8orf88,CA1,CA2,CA7,CACNA2D1,CADM2,CADM3,CALN1,CARTPT,CASQ2,CAVIN2,CCBE1,CCDC144B,CCDC158,CCDC160,CCDC169,CCN5,CD300LG,CDH10,CDH19,CDKN2B-AS1,CDO1,CHRDL1,CHRM2,CHST9,CIDEA,CILP,CLCA4,CLCNKB,CLDN8,CLEC3B,CLEC4M,CLVS2,CMA1,CNGA3,CNN1,CNR1,CNTN1,CNTN2,CNTNAP4,COL19A1,CP,CPEB1,CPXM2,CR2,CRP,CTNNA3,CTSG,CYP1B1,DAO,DCLK1,DDR2,DES,DHRS7C,DIRAS2,DPP6,DPT,EBF2,ECRG4,ELAVL4,EPHA5,EPHA6,EPHA7,ERICH3,EVX2,FABP4,FAM106A,FAM133A,FAM135B,FAM180B,FDCSP,FGF10,FGF13-AS1,FGF14,FGFBP2,FGG,FGL1,FHL1,FILIP1,FLNC,FMO2,FRMD6-AS2,FRMPD4,FUT9,GABRA5,GABRG2,GALR1,GAP43,GAS1RR,GC,GCG,GDF6,GFRA1,GNAO1,GPM6A,GPR119,GPR12,GPRACR,GRIA2,GRIN2A,GTF2IP1,GUCA2B,HAND1,HAND2,HAND2-AS1,HEPACAM,HP,HPCAL4,HRG,HRK,HSPB8,HTR2B,IGSF10,IGSF11,IRX6,ISM1,KCNA1,KCNB1,KCNC2,KCNK2,KCNMA1,KCNMB1,KCNQ5,KCNT2,KCTD8,KERA,KHDRBS2,KIAA0408,KIF1A,KRT222,KRT24,KRTAP13-2,LCN10,LDB3,LEP,LGI1,LIFR,LINC00504,LINC00507,LINC00682,LINC00924,LINC01266,LINC01352,LINC01474,LINC01505,LINC01697,LINC01798,LINC01829,LINC02015,LINC02023,LINC02185,LINC02268,LINC02408,LINC02544,LIX1,LMO3,LMOD1,LOC100506289,LOC101928731,LOC102724050,LOC107986321,LOC283856,LOC440434,LOC729558,LONRF2,LRAT,LRCH2,LRRC3B,LRRC4C,LRRTM4,LVRN,LYVE1,MAB21L1,MAB21L2,MAGEE2,MAMDC2,MAPK4,MASP1,MEF2C-AS1,MEOX2,METTL24,MFAP5,MGAT4C,MGP,MICU3,MIR133A1HG,MIR8071-1,MMRN1,MORN5,MPPED2,MRGPRE,MS4A1,MS4A12,MSRB3,MUSK,MYH11,MYH2,MYLK,MYO3A,MYOC,MYOCD,MYOM1,MYOT,MYT1L,NALCN,NAP1L2,NBEA,NECAB1,NEFL,NEFM,NEGR1,NETO1,NEUROD1,NEXMIF,NEXN,NGB,NIBAN1,NLGN1,NOS1,NOVA1,NPR3,NPTX1,NPY2R,NRG3,NRK,NRSN1,NRXN1,NSG2,NTNG1,NTRK3,NUDT10,OGN,OLFM3,OMD,OTOP2,OTOP3,P2RX2,P2RY12,PAK3,PAPPA2,PCDH10,PCDH11X,PCDH9,PCOLCE2,PCP4L1,PCSK2,PDZRN4,PEG3,PENK,PGM5,PGM5-AS1,PGM5P4-AS1,PGR,PHOX2B,PI16,PIK3C2G,PIRT,PKHD1L1,PLAAT5,PLCXD3,PLD5,PLIN1,PLIN4,PLN,PLP1,PMP2,POPDC2,POU3F4,PPP1R1A,PRDM6,PRELP,PRG4,PRIMA1,PROKR1,PTCHD1,PTGIS,PTPRQ,PTPRZ1,PYGM,PYY,RANBP3L,RBFOX3,RBM20,RELN,RERGL,RGS13,RGS22,RIC3,RIMS4,RNF150,RNF180,RORB,RSPO2,SCARA5,SCGN,SCN2B,SCN7A,SCN9A,SCNN1G,SCRG1,SEMA3E,SERTM1,SERTM2,SFRP1,SFRP2,SFTPA1,SGCG,SHISAL1,SLC13A5,SLC17A8,SLC30A10,SLC4A4,SLC5A7,SLC6A2,SLC7A14,SLIT2,SLITRK2,SLITRK3,SLITRK4,SMIM28,SMYD1,SNAP25,SNAP91,SORCS1,SORCS3,SPHKAP,SPIB,SPOCK3,SST,ST8SIA3,STMN2,STMN4,STON1-GTF2A1L,STUM,SV2B,SYNM,SYNPO2,SYT10,SYT4,SYT6,TACR1,TAFA4,TCEAL2,TCEAL5,TCF23,TENM1,THBS4,TLL1,TMEFF2,TMEM100,TMEM35A,TMIGD1,TMOD1,TNNT3,TNS1,TNXB,TRARG1,TRDN,UGT2B10,UGT2B4,UNC80,VEGFD,VGLL3,VIT,VSTM2A,VXN,WSCD2,XKR4,ZBTB16,ZDHHC22,ZFHX4,ZMAT4,ZNF385B,ZNF676,和ZNF728，但本发明不限于此。

在本发明中，第二分子亚型可包括一或多种选自下组的基因：PGP,SLC26A3,HIST1H4C,RUVBL2,RAB19,HIST2H2AC,和SNORD69。

本文中“PGP”基因编码P-糖蛋白1(PGP)，PGP被称为多药耐药蛋白1(MDR1)、ATP结合盒亚家族B成员1(ABCB1)或分化簇243(CD243)，是可将多种外来物质泵送细胞外的重要的细胞膜蛋白，或具有广谱底物特异性的ATP依赖性外排泵。在本发明中，PGP可以由SEQ IDNO:7表示的氨基酸序列组成，但本发明不限于此。

本文中“SLC26A3”基因编码氯阴离子交换剂(在腺瘤中下调；DRA)，它是SAT家族的阴离子交换剂，可在小肠粘膜中运输硫酸根和其他阴离子。在本发明中，该氯阴离子交换剂可以由SEQ ID NO:8表示的氨基酸序列组成，但本发明不限于此。

本文中“HIST1H4C”基因编码无内含子的组蛋白H4，组蛋白H4形成四种关键组蛋白H1、H2、H3和H4(它们形成组蛋白八聚体)之一。在本发明中，组蛋白H4可由SEQ ID NO:9表示的氨基酸序列组成，但本发明不限于此。

本文中“RAB19”基因编码RuB-1-样蛋白2，是细菌RubB基因的同系物。在本发明中，RuB-1-样蛋白2可由SEQ ID NO:10表示的氨基酸序列组成，但本发明不限于此。

本文中“HIST2H2AC”基因编码组蛋白H2A的2-C型(HIST2H2AC)蛋白，该蛋白形成四种关键组蛋白H1、H2、H3和H4(它们形成组蛋白八聚体)之一，接头组蛋白H1与核小体之间的接头DNA相互作用以便将染色质压缩成更高阶的结构。在发明中，组蛋白H2A 2-C可以由SEQID NO:11表示的氨基酸序列组成，但本发明不限于此。

本文中“SNORD69”属于snoRNA的C/D家族，是小鼠MBII-210的人类直系同源物。

在本发明一个实施方案中，第二分子亚型还可包括一或多种选自下组的基因：TMEM160,TRAPPC5,FEZF2,SNHG25,C4orf48,SNORD38A,PRR7,EIF3IP1,MIR3661,LOC440311,SNORD30,PDF,TPGS1,CTU1,FAM173A,PRSS2,MIR6807,SPRR2E,ADAT3,HIST1H4L,CDH16,GALR3,DEFA5,FOXI3,SMCR5,LIN28B,MESP1,MIR203A,RAET1E-AS1,ANP32D,BOD1L2,SMARCA5-AS1,RNU4-1,RNU5E-1,CCDC85B,ONECUT3,FAM230C,DBET,UBE2NL,MIR4479,CSNK1A1L,BHLHA9,PITPNM2-AS1,SNORA36A,PRSS56,SPRR2G,MAGEA10,GPR25,SLC32A1,LOC101927972,LKAAEAR1,CT83,HES4,TMEM238,RPRML,SNORD41,PTGER1,ITLN2,WBP11P1,MIR324,RNU5A-1,HLA-L,PNMA5,MIR6891,MT4,MIR6858,HIST1H4A,SHISAL2B,LOC101928372,RNU6ATAC,SKOR2,MIR4737,NACA2,FRMD8P1,REG3A,LOC101927795,MIR4767,RNU5B-1,DDC-AS1,PCSK1N,SNORD3B-2,LOC344967,SNORD48,ZAR1,MIR4665,RPL29P2,RNY1,PTTG3P,GJD3,SBF1P1,CLMAT3,KCNE1B,LRRC26,LCN15,HBA1,IGFBP7-AS1,MIR4449,MIR8075,NOXO1,和RNA5S9，但本发明不限于此。

在本发明另一实施方案中，第二分子亚型还可包括一或多种选自下组的基因：C4orf48,CTU1,EIF3IP1,FAM173A,FEZF2,LOC440311,MIR3661,NOXO1,PDF,PRR7,SNHG25,SNORD30,SNORD38A,TMEM160,TPGS1,和TRAPPC5，但本发明不限于此。

在本发明又一实施方案中，第二分子亚型还可包括一或多种选自下组的基因：ADAT3,ANP32D,BHLHA9,BOD1L2,C4orf48,CCDC85B,CDH16,CLMAT3,CSNK1A1L,CTU1,DBET,DDC-AS1,DEFA5,EIF3IP1,FAM173A,FEZF2,FOXI3,FRMD8P1,GALR3,GJD3,GPR25,HBA1,HES4,HIST1H4A,HIST1H4L,HLA-L,IGFBP7-AS1,ITLN2,KCNE1B,LCN15,LKAAEAR1,LOC101927795,LOC101927972,LOC101928372,LOC344967,LRRC26,MAGEA10,MESP1,MIR203A,MIR324,MIR3661,MIR4449,MIR4479,MIR4665,MIR4737,MIR4767,MIR6807,MIR6858,MIR6891,MIR8075,NACA2,NOXO1,ONECUT3,PCSK1N,PDF,PITPNM2-AS1,PNMA5,PRR7,PRSS2,PRSS56,PTGER1,PTTG3P,REG3A,RNA5S9,RNU4-1,RNU5A-1,RNU5B-1,RNU5E-1,RNU6ATAC,RNY1,RPL29P2,RPRML,SBF1P1,SHISAL2B,SKOR2,SLC32A1,SMARCA5-AS1,SMCR5,SNHG25,SNORA36A,SNORD30,SNORD38A,SNORD3B-2,SNORD41,SNORD48,TMEM160,TMEM238,TPGS1,TRAPPC5,UBE2NL,WBP11P1,和ZAR1，但本发明不限于此。

在本发明中，抗癌疗法可以是化疗、放疗、手术治疗或其组合，其中化疗或放疗优选在抗癌疗法之前，更优选抗癌疗法可以是标准新辅助放化疗或标准新辅助放化疗之后的手术治疗，但本发明不限于此。

“在先抗癌疗法”是在具有治愈目的的局部手术或放疗之前进行的抗癌疗法。新辅助化疗通常用于因癌症扩散到周围区域而无法接受全切除术的患者，可以通过减小原发肿瘤的大小和范围来保留主要器官，从而减少结肠癌、直肠癌、头颈部肿瘤、骨肉瘤、肛门癌、乳腺癌等的手术范围。

本文中“化疗”也称为CTX，作为使用一种或多种抗癌剂的标准化化疗类型，可用于治疗目的或旨在延长寿命或减轻症状。

本文中“放疗”是利用高能放射杀死癌细胞的治疗，可以包括外部放射疗法或近距离放疗(brachytherapy)，但本发明不限于此。所述放射可以无限制，只要它是能量在空间中传播或在介导这种传播的材料中传播的现象。

本文中“疗效反应(therapeutic response)”是指治疗对受试者的有效程度，优选地，受试者为癌症患者。例如，当与治疗癌症患者联用时，术语“增加的反应”或“良好的反应”可以指用本领域任何已知方法测出的治疗效力的增加。作为另一个示例，癌症患者对治疗的反应可以是完全或部分反应。在又一个示例中，癌症患者对治疗的增加的反应可以通过总存活率、无病存活率、目标反应率、肿瘤进展时间、无进展存活期或治疗失败时间来表征。

本文中“预后”是指预测疾病进程和死亡或存活结果的行为，“预后性预测”是指预测疾病进程和死亡或存活结果的行为。预后或预后性预测可以解释为任何通过考虑患者的状况来预测治疗之前/之后的疾病进程的行为，因为疾病进程可能会因患者的生理或环境状况而变化。此外，预后可以指疾病的进展，例如癌症向组织中的迁移和浸润、转移到不同组织和因疾病而死亡，以及疾病是否完全治愈。根据本发明的目的，预后是指直肠癌患者的进展或直肠癌存活预后。根据本发明的目的，预后可以是识别转移前癌症或转移性癌症状态、确定癌症分期或确定对抗癌治疗的疗效反应，但本发明不限于此。

在本发明中，预后可以是抗癌疗法后的病理完全缓解(pCR)、复发、转移或死亡。

在本发明一个实施方案中，预后可以指抗癌疗法后的手术治疗(优选是标准新辅助放化疗后的手术治疗)后3年内出现远处转移或60％以上死亡率的情形，但本发明不限于此。

在本发明另一实施方案中，预后可以是指抗癌疗法(优选是标准新辅助放化疗后的手术治疗)实现pCR后3年内出现远处转移或60％以上死亡率的情形，但本发明不限于此。

“病理完全缓解(pathologic complete response,pCR)”是指新辅助放化疗后全切除直肠组织病理检查未发现癌细胞的情况。

本文中“生物标志物”是能用体内的细胞、血管、蛋白、DNA、RNA或代谢物来指示身体变化的生物学指标，美国国立卫生研究院(NIH)将生物标志物定义为“被客观测量和评估的特征，以指示正常生物过程、致病过程或对治疗性干预的药理学反应。”即，在特定疾病或癌症的情况下，生物标志物是能区分正常和病理状况、预测疗效反应、并被客观测量的标志物。因此，生物标志物必须用于客观地测量和评估治疗方法中的正常生物过程、疾病进展、和药物反应性。根据使用情况，有根据利用度(availability)确认药物靶标存在的靶标标志物、诊断疾病存在与否的诊断标志物、可区分对特定药物的应答者和非应答者的预测标志物、可以监测药物治疗效果的替代标志物、以及指示疾病预后的预后生物标志物。

本文中“肿瘤”或“癌症(cancer)”是一种细胞周期失控而细胞分裂持续的疾病，根据发生部位分为癌(carcinoma)和肉瘤。癌(carcinoma)是指产生于上皮细胞(如粘膜、皮肤等)的恶性肿瘤，肉瘤是指产生于非上皮细胞(如肌肉、结缔组织、骨、软骨、和血管等)的恶性肿瘤。

本文中癌症可以是选自以下的一种或多种癌症：乳腺癌、子宫癌、食道癌、胃癌、脑癌、直肠癌、结肠癌、肺癌、皮肤癌、卵巢癌、宫颈癌、肾癌、血癌、胰腺癌、前列腺癌、睾丸癌、喉癌、口腔癌、头颈癌、甲状腺癌、肝癌、膀胱癌、骨肉瘤、淋巴瘤和白血病，优选直肠癌。

在本发明的另一方面，本发明提供了一种组合物，用于预测癌症患者针对抗癌疗法的疗效反应或抗癌疗法的预后，或确定抗癌治疗前的新辅助化疗的目标患者，该组合物包括：测量第一分子亚型和第二分子亚型的至少一种基因或由其编码的蛋白的表达水平的试剂。

在本发明中，关于第一分子亚型和第二分子亚型的描述与生物标志物组合物中的描述有重叠，因此省略，以避免说明书过于复杂。

本文中“表达”或“表达水平”可以包括转录和翻译。表达水平的增加可以由多种方法引起，包括例如增加编码多肽的基因的数量、增加基因转录(例如，通过将基因安排在组成型启动子的控制下)、增加基因翻译、敲除竞争基因、或其组合和/或与其他方法的组合。表达的减少可能是由于减少基因数量、减少基因转录和表达竞争基因所致。此外，第一分子亚型或第二分子亚型的表达水平可以通过与比较基因的表达水平进行比较来标准化。

在本发明中，用于测量选自第一分子亚型和第二分子亚型的一种或多种基因的表达水平的试剂可包括选自抗体、寡肽、配体、肽核酸(PNA)和适体(aptamer)的一种或多种，并且，所述试剂与蛋白特异性结合。

本文中“抗体”是指与抗原特异性结合以产生抗原-抗体相互作用的物质。为了本发明的目的，抗体是指与每种蛋白特异性结合的抗体。本发明的抗体包括多克隆抗体、单克隆抗体和重组抗体。使用本领域广为人知的技术可以容易地制备抗体。例如，多克隆抗体可以通过本领域广为人知的方法产生，包括将蛋白的抗原注射到动物体内并从动物收集血液以获得包含抗体的血清的过程。多克隆抗体可由山羊、兔、绵羊、猴、马、猪、牛或狗等任何动物制备。此外，单克隆抗体的制备可以采用杂交瘤方法(Kohler and Milstein(1976)European Journal of Immunology 6:511-519)或噬菌体抗体库技术(Clackson et al,Nature,352:624-628,1991；Marks et al,J.Mol.Biol.,222:58,1-597,1991)，其是本领域众所周知的。通过该方法制备的抗体可以通过凝胶电泳、透析、盐析、离子交换层析或亲和层析进行分离和纯化。此外，本发明的抗体不仅包括具有两条全长轻链和两条全长重链的完整形式，还包括抗体分子的功能片段。抗体分子的功能片段是指至少具有抗原结合功能的片段，包括Fab、F(ab')、F(ab')₂或Fv。

本文中“寡肽”可由2至20个氨基酸组成，包括二肽、三肽、四肽和五肽，但本发明不限于此。

本文中“肽核酸(PNA)”是指人工合成的类似于DNA或RNA的聚合物，由丹麦哥本哈根大学的Nielsen、Egholm、Berg和Buchardt教授于1991年首次报道。DNA具有磷酸-核糖骨架，而PNA的骨架中重复的N-(2-氨基乙基)-甘氨酸单元通过肽键连接，从而大大增加了与DNA或RNA的结合强度和稳定性，因此用于分子生物学、诊断检测和反义疗法。PNA详见Nielsen PE,Egholm M,Berg RH,Buchardt O(1991年12月),"Sequence-selectiverecognition of DNA by strand Displacement with a thymine-substitutedpolyamide,"Science 254(5037):1497-1500。

本文中“适体(aptamer)”是指一种寡核苷酸或肽分子，其总体描述详见Bock LC等,Nature 355(6360):5646(1992)；Hoppe-Seyler F,Butz K"Peptide aptamers:powerful new tools for molecular medicine,"J Mol Med.78(8):42630(2000)；CohenBA,Colas P,Brent R."An artificial cell-cycle inhibitor isolated from acombinatorial library,"Proc Natl Acad Sci USA.95(24):142727(1998)。

在本发明中，用于测量第一分子亚型和第二分子亚型的表达水平的试剂可以包括选自引物、探针和反义核苷酸中的一种或多种，其与RNA测序(RNAseq)或基因特异性结合。

本文中“引物”是识别靶基因序列的片段，包括一对正向和反向引物，优选地，提供具有特异性和敏感性的分析结果的引物对。由于引物的核酸序列是与样品中非靶序列不匹配的序列，因此当引物是仅扩增含有互补引物结合位点的靶基因序列且不引起非特异性扩增的引物时，可提供高特异性。

本文中“探针”是指能够特异性结合样品中待检目标物质的物质，以及通过上述结合能够特异性地检测样品中目标物质的存在的物质。探针的类型为本领域常用的物质，但不限于此。探针优选为PNA、锁核酸(LNA)、肽、多肽、蛋白、RNA或DNA，最优选为PNA。更具体地，探针是来源于或类似活体生物的生物材料，或体外制备的探针，例如酶、蛋白、抗体、微生物、动/植物细胞和器官、神经元、DNA或RNA。DNA可以是cDNA、基因组DNA或寡核苷酸，RNA可以是基因组RNA、mRNA或寡核苷酸，蛋白可以是抗体、抗原、酶或肽。

本文中“锁核酸(LNA)”是指具有2’-O,4’-C亚甲基桥的核酸类似物[J Weiler,JHunziker and J Hall Gene Therapy(2006)13,496.502]。LNA核苷包括常见的DNA或RNA核碱基，可以根据Watson-Crick碱基配对规则形成碱基对。然而，由于亚甲基桥对分子的“锁定”，LNA无法在Watson-Crick组合中形成理想的形状。当LNA包含在DNA或RNA寡核苷酸中时，LNA可以更快地与互补核苷酸链配对，从而增加双螺旋的稳定性。本文中“反义”是指具有核苷酸碱基序列和亚基间骨架的寡聚体，其中反义寡聚体通过形成Watson-Crick碱基对与RNA中的靶序列杂交，以通常允许在目标序列中形成mRNA和RNA：寡聚体异二聚体。寡聚体可以与靶序列具有精确的序列互补性或近似的互补性。

由于对应于本发明第一分子亚型和第二分子亚型的基因的序列信息是已知的，基于此，普通技术人员可以容易地设计与该基因特异性结合的引物、探针或反义核苷酸，通过无特定设计的通用RNA测序方法有可能进行定量分析。

在本发明中，抗癌疗法可以是化疗、放疗、手术治疗或其组合，优选地，化疗或放疗在抗癌疗法之前，更优选地，抗癌疗法可以是标准新辅助放化疗或标准新辅助放化疗后的手术治疗，但本发明不限于此。

在本发明一个实施方案中，预后预测可以是预测抗癌疗法后(优选地，标准新辅助放化疗或标准新辅助放化疗后的手术治疗后)的存活率，但本发明不限于此。

在本发明另一实施方案中，预后预测可以是预测抗癌疗法后(优选地，标准新辅助放化疗或标准新辅助放化疗后的手术治疗后)的pCR，但本发明不限于此。

在本发明又一实施方案中，预后预测可以是预测抗癌疗法后(优选地，标准新辅助放化疗或标准新辅助放化疗后的手术治疗后)，癌症是否复发，但本发明不限于此。

在本发明又一个实施方案中，预后预测可以是预测抗癌疗法后(优选地，标准新辅助放化疗后的手术治疗后)的癌症转移，但本发明不限于此。

在本发明又一个实施方案中，预后预测可以是预测抗癌疗法后(优选地，标准新辅助放化疗后的手术治疗后)的3年内是否发生远处转移或死亡率为60％以上，但本发明不限于此。

在本发明又一个实施方案中，预后预测可以是预测在作为抗癌疗法(优选地，标准新辅助放化疗后的手术治疗)的结果实现pCR后3年内是否发生远处转移或死亡率为60％以上，但本发明不限于此。

在本发明中，所述癌症可以是选自以下的一种或多种癌症：乳腺癌、子宫癌、食道癌、胃癌、脑癌、直肠癌、结肠癌、肺癌、皮肤癌、卵巢癌、宫颈癌、肾癌、血癌、胰腺癌、前列腺癌、睾丸癌、喉癌、口腔癌、头颈癌、甲状腺癌、肝癌、膀胱癌、骨肉瘤、淋巴瘤、和白血病，优选直肠癌。

在本发明又一方面，本发明提供了一种试剂盒，用于预测癌症患者对抗癌疗法的疗效反应或抗癌疗法后的预后，或鉴别抗癌治疗前新辅助治疗的目标患者。

本文中“试剂盒”是指通过用可检测的标记物标记与生物标志物组分特异性结合的探针或抗体来评估生物标志物的表达水平的工具。试剂盒不仅可以包括直接标记，其直接标记能被检测的物质(就探针或抗体而言通过与底物反应)，还可以包括间接标记，其偶联的标记物通过与另一种试剂(被直接标记)的反应而显色。试剂盒可以包括通过与所述标记反应而显色的显色底物溶液、洗涤液和其他溶液，并且可以制造成包括本文使用的试剂组分。在本发明中，该试剂盒可以是包括RT-PCR所需基本组件的试剂盒，并且可以包括试管、反应缓冲溶液、脱氧核苷酸(dNTP)、Taq-聚合酶、逆转录酶、DNase、RNase抑制剂和蒸馏水以及特异于标记基因的引物对。此外，该试剂盒可以是用于检测预后预测所用基因的试剂盒，其包括DNA芯片所需的基本组件。DNA芯片试剂盒可以包括底座，在该底座上对应于基因或其片段的cDNA与探针连接，且该底座可以包括对应于定量对照基因或其片段的cDNA。本发明的试剂盒不受限制，只要它是本领域已知的。

在本发明中，试剂盒可以是RT-PCR试剂盒、DNA芯片试剂盒、ELISA试剂盒、蛋白芯片试剂盒、快速试剂盒或多反应监测(MRM)试剂盒。

本发明的试剂盒还可以包括由一种或多种不同成分组成的适用于分析方法的组合物、溶液或设备。例如，本发明的试剂盒可以进一步包括逆转录聚合酶链式反应(RT-PCR)所需的基本组件。RT-PCR试剂盒包括特异于标记蛋白编码基因特异的引物对。引物是具有特异于所述基因之核酸序列的序列的核苷酸，其长度为约7bp至50bp，更优选约10bp至30bp。此外，引物可以包括特异于对照基因的核酸序列的引物。或者，用于RT-PCR的试剂盒可包括试管或另一合适容器、反应缓冲溶液(pH和镁浓度不同)、脱氧核苷酸(dNTP)、酶如Taq聚合酶和逆转录酶、DNase、RNase抑制剂DEPC-水和蒸馏水。

此外，本发明的试剂盒可以包括DNA芯片所需的必需组件。DNA芯片试剂盒可以包括附着有对应于基因或其片段的cDNA或寡核苷酸的底物，以及用于制备荧光标记探针的试剂(reagent,agent)和酶。此外，所述底物可以包括附着的对应于对照基因或其片段的cDNA或寡核苷酸。

此外，本发明的试剂盒可以包括ELISA所需的必需组件。ELISA试剂盒包括对蛋白特异的抗体。该抗体是对标志物蛋白具有高度特异性和亲和力而与另外的蛋白几乎无交叉反应的单克隆、多克隆或重组抗体。此外，ELISA试剂盒可以包括特异于对照蛋白的抗体。此外，ELISA试剂盒可以包括能检测结合抗体的试剂，例如标记的二抗、发色团、酶(例如，偶联了抗体)及其底物，或其他能与抗体结合的物质。

作为试剂盒中抗原-抗体相互作用的支架，可以使用硝酸纤维素膜、PVDF膜、由聚乙烯树脂或聚苯乙烯树脂合成的孔板、或由玻璃形成的载玻片，但本发明不限于此。

此外，在本发明的试剂盒中，二抗的标记物优选为显色的常规发色团，优选的标记物如聚L-赖氨酸-异硫氰酸荧光素(FITC)等荧光素、罗丹明-B-异硫氰酸(RITC)、辣根过氧化物酶(HRP)、碱性磷酸酶、胶体金、或染料都可以使用，但本发明不限于此。

此外，本发明试剂盒中诱导显色的发色底物优选根据显色的标记来使用，可以是3,3',5,5'-四甲基联苯胺(TMB)、2,2’-联氮-二(3-乙基苯并噻唑-6-磺酸)(ABTS)或邻苯二胺(OPD)。在此，显色底物更优选以溶于缓冲溶液(0.1M NaAc，pH5.5)中的状态提供。TMB等显色底物可被用作二抗偶联物标记物的HRP分解以产生显色沉积物，并通过目测显色沉积物的沉积程度来检测标志物蛋白的存在。

在本发明的试剂盒中，洗涤液优选包括磷酸盐缓冲液、NaCl和Tween 20，更优选地，由0.02M磷酸盐缓冲液、0.13M NaCl和0.05％吐温20组成的缓冲液(PBST)。洗涤液用于洗涤支架，在该支架中，将适量的二抗与抗原-抗体相互作用后的抗原-抗体偶联物的反应产物添加3-6次。作为反应终止液，优选使用硫酸溶液(H₂SO₄)。

在本发明一个实施方案中，试剂盒可用于诊断对抗癌疗法的敏感程度或疗效反应程度，以及治疗后的预后、分期、癌症转移可能性、复发可能性或存活率。

本发明的癌症可以是选自以下的一或多种癌症：乳腺癌、子宫癌、食道癌、胃癌、脑癌、直肠癌、结肠癌、肺癌、皮肤癌、卵巢癌、宫颈癌、肾癌、血癌、胰腺癌、前列腺癌、睾丸癌、喉癌、口腔癌、头颈癌、甲状腺癌、肝癌、膀胱癌、骨肉瘤、淋巴瘤、和白血病，优选直肠癌。

在本发明的又一方面，本发明提供了一种提供信息的方法，用于预测抗癌疗法的疗效反应或抗癌疗法的预后，或确定在抗癌疗法前的新辅助疗法的目标患者，该方法包括：测量分离自所需受试者的生物样品中第一分子亚型和第二分子亚型的至少一种基因或由其编码的蛋白的表达水平。

本文中“受试者”为患有癌症或患癌概率高的受试者，可以是接受抗癌疗法的受试者或癌症患者，且包括所有哺乳动物。在此，哺乳动物的例子可以包括人、非人灵长类如黑猩猩、其他猿类和猴类；牲畜，如牛、马、绵羊、山羊和猪；家畜，如兔、狗和猫；实验动物，如啮齿动物，包括大鼠、小鼠和豚鼠，但本发明不限于此。

本文中“生物样品”是指从受试者获得或来源于受试者的任何材料、生物流体、组织或细胞，并且可以包括例如全血、白细胞、外周血单核细胞、血沉棕黄层、血浆、血清,痰,眼泪,粘液,洗鼻液,鼻吸液,呼吸气体(breath),尿液,精液,唾液,腹腔洗液(peritonealwashings),腹水,囊液(cystic fluid),脑膜液,羊水,腺液,胰液,淋巴液,胸膜液,乳头抽吸液,支气管抽吸物、滑液(synovial fluid)、关节抽吸物、器官分泌物、细胞、细胞提取物、和脑脊液，优选地，在开始治疗之前从受试者获得的癌组织。

在本发明中，第一分子亚型和第二分子亚型的描述与生物标志物组合物中的描述重叠，因此将被省略以避免说明书的过度复杂性。

在本发明中，用于测量第一分子亚型和第二分子亚型的至少一种基因的表达水平的试剂可以包括从引物、探针和反义核苷酸组成的组中选出的一种或多种，其与所述基因特异性结合。

在本发明中，第一分子亚型和第二分子亚型中至少一种的表达水平的测量可以通过RT-PCR、竞争性RT-PCR、实时RT-PCR、RNA酶保护测定(RPA)、Northern印迹或DNA芯片来进行。

在本发明中，用于测量第一分子亚型和第二分子亚型的至少一种基因或由其编码的蛋白的表达水平的试剂可以包括从抗体、寡肽、配体、PNA和适体中选出的一种或多种，其与所述蛋白特异性结合。

在根据本发明的提供信息的方法中，对抗体、寡肽、配体、PNA和适体的描述与上述描述重叠，因此将被省略以避免说明书过于复杂。

在本发明中，由第一分子亚型和第二分子亚型的至少一种基因编码的蛋白的表达水平的测量可以通过蛋白芯片、免疫试验、配体结合试验、基质辅助激光解吸/电离飞行时间(MALDI-TOF)质谱、表面增强型激光解吸/电离飞行时间(SELDI-TOF)质谱、放射免疫试验、单向免疫扩散(radial immunodiffusion)、双向免疫扩散试验(Ouchterlonyimmunodiffusion assay)、火箭免疫电泳、组织免疫染色、补体固定试验、二维电泳、液相色谱-质谱(LC-MS)、液相色谱-质谱/质谱(LC-MS/MS)、蛋白印迹或酶联免疫吸附试验(ELISA)。

在本发明中，抗癌疗法可以是化疗、放疗、手术治疗或其组合，优选地，化疗或放疗在抗癌疗法之前，更优选地，抗癌疗法可以是标准新辅助放化疗或标准新辅助放化疗之后的手术治疗，但本发明不限于此。

在本发明一个实施方案中，预后预测可以是预测抗癌疗法(优选标准新辅助放化疗后的手术治疗)后的存活率，但本发明不限于此。

在本发明另一实施方案中，预后预测可以是预测抗癌疗法(优选标准新辅助放化疗后的手术治疗)后是否实现pCR，但本发明不限于此。

在本发明又一实施方案中，预后预测可以是预测抗癌疗法(优选标准新辅助放化疗后的手术治疗)后的癌症是否会复发，但本发明不限于此。

在本发明的又一个实施方案中，预后预测可以是预测抗癌疗法(优选标准新辅助放化疗后的手术治疗)后的癌症转移，但本发明不限于此。

在本发明的又一个实施方案中，预测预后不良可能意味着在由于标准新辅助放化疗而实现pCR后3年内显示远处转移和60％或更高死亡率的病例。

在本发明中，所述方法还可以包括确认受试者的TNM分期、年龄、性别、pCR或其组合信息，但本发明不限于此。

本文中“TNM分期”是用于对肿瘤或癌症的解剖学程度进行归类的系统，恶性肿瘤的TNM归类是全球公认的用于对癌症扩散程度进行归类的标准。在TNM分期中，T代表原发肿瘤的大小和是否侵犯周围组织，N代表附近有癌的淋巴结数量，M代表远处转移。

在本发明中，当第一分子亚型或其编码的蛋白在分离自目标受试者的生物样品中表达，或者其表达水平高于对照时，可以预测对抗癌疗法的疗效反应水平低。例如，当第一分子亚型或其编码的蛋白的表达水平高于对照时，可以预测对标准新辅助放化疗的疗效反应或对标准新辅助放化疗后手术治疗的疗效反应水平低。

在本发明中，当第一分子亚型在分离自目标受试者的生物样品中表达，或者其表达水平高于对照时，可以预测抗癌疗法后的预后较差。例如，当第一分子亚型或其编码的蛋白的表达水平高于对照时，可以预测标准新辅助放化疗后的预后或标准新辅助放化疗后手术治疗的预后差，具体地，存活率低，复发概率高，或转移概率高，但本发明不限于此。

在本发明一个实施方案中，当从目标受试者分离的生物样品中测量的第一分子亚型的表达水平高于对照，并且在抗癌疗法(优选标准新辅助放化疗)后未实现pCR时，可以预测预后很差。

在本发明另一个实施方案中，当从目标受试者分离的生物样品中测得的第一分子亚型的表达水平高于对照，且受试者的TNM分期为T3或T4时，可以预测抗癌疗法(优选标准新辅助放化疗或标准新辅助放化疗后的手术治疗)后的预后较差。

在本发明又一实施方案中，当从目标受试者分离的生物样品中测得的第一分子亚型的表达水平高于对照，并且受试者的TNM分期为N1或N2时，可以预测抗癌疗法(优选标准新辅助放化疗或手术治疗)后的预后较差。

在本发明的又一个实施方案中，当从目标受试者分离的生物样品中测得的第一分子亚型的表达水平高于对照，并且受试者的TNM分期为T3或T4、以及N1或N2时，可以预测抗癌疗法(优选标准新辅助放化疗或手术治疗)后的预后较差。

同时，在本发明一个实施方案中，当从目标受试者分离的生物样品中测得的第二分子亚型的表达水平高于对照，并且在抗癌疗法(优选标准新辅助放化疗)后未实现pCR时，可以预测预后良好。

在本发明的另一个实施方案中，当从目标受试者分离的生物样品中测量的第二分子亚型的表达水平高于对照，并且抗癌疗法(优选标准新辅助放化疗)后未实现pCR时，可以预测抗癌疗法后的预后良好。

在本发明又一实施方案中，当从目标受试者分离的生物样品中测得的第二分子亚型的表达水平高于对照，并且受试者的TNM分期为T0、T1或T2时，可以预测抗癌疗法(优选标准新辅助放化疗或标准新辅助放化疗后的手术治疗)的预后良好。

在本发明的又一个实施方案中，当从目标受试者分离的生物样品中测量的第二分子亚型的表达水平高于对照，并且受试者的TNM分期为N0时，可以预测抗癌疗法(优选标准新辅助放化疗或手术治疗)后的预后良好。

在本发明的又一个实施方案中，当在从目标受试者分离的生物样品中测量的第二分子亚型的表达水平高于对照，并且受试者的TNM分期为T0、T1或T2、以及N0时，可以预测抗癌疗法(优选标准新辅助放化疗或手术治疗)后的预后不良。

本文中“对照”可以是第一分子亚型或第二分子亚型或由其编码的蛋白在正常受试者中的表达水平的平均值或中值，或相应基因或蛋白在已患癌症或患癌概率高的受试者(特别是已被诊断患有癌症的受试者)中的表达水平的平均值或中值，但本发明不限于此。

在本发明中，当第一分子亚型或其编码的蛋白的表达水平高于对照时，可以进一步包括进行抗癌疗法的步骤。该抗癌疗法可以是化疗，但本发明不限于此。

在本发明中，当第二分子亚型或其编码的蛋白的表达水平高于对照，且未达到实现pCR时，可以进一步包括进行抗癌疗法的步骤。该抗癌疗法可以为是化疗，但本发明不限于此。

在本发明的又一方面，本发明提供一种用于预测抗癌疗法的疗效反应或抗癌疗法后的预后，或识别在抗癌疗法前的新辅助治疗的目标患者的设备，该设备包括：测量单元，用于测量从目标受试者分离的生物样品中第一分子亚型和第二分子亚型的至少一种基因或由其编码的蛋白的表达水平；以及计算单元，其提供用于从第一分子亚型和第二分子亚型的至少一种基因或由其编码的蛋白的表达水平预测受试者针对抗癌疗法的疗效反应或该抗癌疗法后的预后的信息。

在本发明中，对受试者、生物样品的描述和表达水平的测量的描述与用于预测对抗癌疗法的疗效反应或抗癌疗法后的预后、或识别在抗癌疗法前的新辅助治疗的目标受试者的组合物中描述的那些重叠，并因此将被省略以避免说明书的过度复杂。

此外，在本发明中，关于第一分子亚型和第二分子亚型的描述与生物标志物组合物中的描述重叠，并因此将被省略以避免说明书过于复杂。

在本发明中，抗癌疗法可以是化疗、放疗、手术治疗或它们的组合，优选地，化疗或放疗可以在抗癌疗法之前，更优选地，抗癌疗法可以是标准的新辅助放化疗或标准新辅助放化疗后的手术治疗，但本发明不限于此。

在本发明一个实施方案中，预测预后不良可能意味着在标准新辅助放化疗实现pCR后3年内出现远处转移和60％以上死亡率的病例。

在本发明中，所述设备还可以包括输出预测信息的输出单元，但本发明不限于此。输出单元不受限制，只要它可以在所述设备中输出信息，且所述设备不受限制，只要将信息输出为网页或应用程序即可，例如可以包括计算设备、移动设备、服务器等。

在本发明中，所述设备还可以包括输入单元，用于接收受试者的TNM分期、年龄或性别、pCR或其组合信息，本发明不限于此。

在本发明中，当计算单元确定第一分子亚型或其编码的蛋白在从目标受试者分离的生物样品中表达，或表达水平高于对照时，可以预测抗癌疗法的疗效反应水平为低，并且例如，当计算单元确定第一分子亚型或其编码的蛋白的表达水平高于对照时，可以预测标准新辅助放化疗或标准新辅助放化疗后的手术治疗是低的。

在本发明中，当计算单元确定第一分子亚型或其编码的蛋白在从目标受试者分离的生物样品中表达，或表达水平高于对照时，可以预测抗癌疗法后的预后较差。例如，当计算单元确定第一分子亚型或其编码的蛋白的表达水平高于对照时，可以预测标准新辅助放化疗后的预后或标准新辅助放化疗后的手术治疗后的预后较差，并且具体地，可以预测存活率低、复发概率高、或转移概率高，但本发明不限于此。

在本发明一个实施方案中，当计算单元确定在从目标受试者分离的生物样品中测得的第一分子亚型的表达水平高于对照，并且抗癌疗法(优选标准新辅助放化疗)后未实现pCR时，可以预测预后较差。

在本发明另一实施方案中，当计算单元确定在从目标受试者分离的生物样品中测得的第一分子亚型的表达水平高于对照，并且受试者的TNM分期为T3或T4时，可以预测术后抗癌疗法(优选标准新辅助放化疗或标准新辅助放化疗后的手术治疗)的预后不良。

在本发明又一实施方案中，当计算单元确定从目标受试者分离的生物样品中第一分子亚型的表达水平高于对照，且受试者的TNM分期为N1或N2时，可以预测，抗癌疗法(优选标准新辅助放化疗或手术治疗)后的预后较差。

在本发明又一个实施方案中，当计算单元确定从目标受试者分离的生物样品中第一分子亚型的表达水平高于对照，并且受试者的TNM分期为T3或T4、以及N1或N2时，可以预测抗癌疗法(优选标准新辅助放化疗或手术治疗)后的预后较差。

同时，在本发明一个实施方案中，当计算单元确定在从目标受试者分离的生物样品中测得的第二分子亚型的表达水平高于对照，且抗癌疗法(优选标准新辅助放化疗)后未实现pCR时，可以预计预后良好。

在本发明另一实施方案中，当计算单元确定在从目标受试者分离的生物样品中测量的第二分子亚型的表达水平高于对照，并且在抗癌疗法(优选地，标准新辅助放化疗)后实现pCR时，可以预测抗癌疗法后的预后良好。

在本发明的另一个实施方案中，当计算单元确定从目标受试者分离的生物样品中测得的第二分子亚型的表达水平高于对照，且受试者的TNM分期为T0、T1或T2时，可以预测抗癌疗法(优选标准新辅助放化疗或标准新辅助放化疗后的手术治疗)后的预后良好。

在本发明又一实施方案中，当计算单元确定在从目标受试者分离的生物样品中测得的第二分子亚型的表达水平高于对照，且受试者的TNM分期为N0时，可预测抗癌疗法(优选标准新辅助放化疗或手术治疗)的预后良好。

在本发明又一个实施方案中，当计算单元确定在从目标受试者分离的生物样品中测量的第二分子亚型的表达水平高于对照，且受试者的TNM分期为T0、T1或T2、以及N0时，可以预测抗癌疗法(优选标准新辅助放化疗或手术治疗)后的预后较差。

在本发明中，对照可以是第一分子亚型或第二分子亚型或由其编码的蛋白在正常受试者中的表达水平的平均值，或者相应基因在已患癌症或患癌概率高的受试者(特别是已被诊断患有癌症的受试者)中的表达水平的平均值，但本发明不限于此。

有益效果

根据本发明，优势在于，可以预测癌症患者(特别是直肠癌患者)对抗癌疗法(优选新辅助放化疗或手术治疗)的疗效反应或所述治疗后的预后，并且可以根据所述预测的预后制定适当的治疗或监测计划。

附图说明

图1的流程图显示了本发明预备例2的研究设计流程。

图2显示了本发明预备例7用2至5个度量(ranks)的非负矩阵分解(non-negativematrix factorization,NMF)所得的TCGA直肠癌数据分析结果。

图3显示了本发明预备例7用2至5个度量的非负矩阵分解(NMF)进行一致性聚类(consensus clustering)分析所得的TCGA直肠癌数据结果。

图4显示了本发明预备例8的基因集富集分析结果，其中第一分子亚型具有上皮间质转化(epithelial mesenchymal transition,EMT)和癌干细胞的特征。

图5显示了本发明预备例9为观察直肠癌固有分子亚型和结肠癌分子亚型之间的差异而进行的基因集富集分析的结果，表明第一分子亚型具有干细胞特征。

图6显示了根据本发明实验例1选出的第一基因集对来自延世癌症中心的230例直肠癌患者进行亚型归类得出的无病存活率(DFS)。

图7显示了根据本发明一个实施方案选出的第二基因集进行亚型归类的患者的无病存活率(DFS)。

图8显示了根据本发明实验例2的分子亚型归类的直肠癌患者的无病存活率(DFS)之间的差异。

图9显示了根据本发明实验例2的直肠癌患者依赖于pCR的总存活率(OS)的差异。

图10显示了根据本发明实验例4的直肠癌患者基于N分期的无病存活率的差异。

图11显示了根据本发明实验例4的直肠癌患者基于分子亚型和N分期的无病存活率的差异。

图12显示了根据本发明实验例4的直肠癌患者基于N分期的总体存活率(OS)的差异。

图13显示了根据本发明实验例4的直肠癌患者基于分子亚型和N分期的总存活率(OS)的差异。

图14显示了根据本发明实验例5的CMS分子亚型预测直肠癌患者无病存活率的能力。

图15显示了根据本发明实验例5的CRIS分子亚型预测直肠癌的能力。

图16显示了根据本发明实施例1的根据第一分子亚型和第二分子亚型和患者的病理特征的直肠癌治疗方案。

具体实施方式

本发明的一个目的在于提供一种生物标志物组合物，其可以准确且简单地预测针对抗癌疗法的疗效反应或该抗癌疗法的预后。

在下文中，本发明将参考实施例更详细地描述。这些实施例仅用于更详细地说明本发明，对本领域的普通技术人员来说显而易见的是，根据本发明的主旨，本发明的范围不受这些实施例的限制。

实施例

[预备例1]研究群组(Research cohort)

为了开发直肠癌特异性分子亚型归类机制，用到两个临床群组，包括可从CancerGenome Atlas Project下载的177例直肠癌患者的公开可用RNAseq数据，以及由来自延世大学癌症中心的230例直肠癌病例组成的验证群组的RNAseq数据。

[预备例2]研究设计

图1是显示研究设计(research design)的示意流程的流程图。

为了找到固有的(intrinsic)直肠癌分子亚型，使用非负矩阵分解(NMF)的基因和在已识别亚型之间差异化表达的基因用DEseq2包进行鉴定。基于对DEseq2数据的基因集富集分析，发明人建立了分子亚型在预测对化疗的反应和预后方面的作用的临床假设，并前瞻性地测试了在延世癌症中心诊断和治疗的230例直肠癌。为了将来自延世癌症中心的直肠癌患者组归类到各个分子亚型，用522个在DESeq2分析中表达水平有两倍以上差异且p值小于10^-5的基因的列表构建分子亚型分组基因列表。此外，为了开发针对发现的分子亚型的最佳归类基因列表，使用了微阵列预测分析。

[预备例3]验证群组(Validation cohort)

对延世癌症中心(韩国首尔)1995年至2012年的直肠腺癌患者病史进行调查以预测直肠癌患者的预后，结果确认了264例，根据纳入标准，纳入了1)在放射前疗法(preop-CRT)后进行全肠系膜切除(total mesenteric excision,TME)和2)用福尔马林固定石蜡包埋(FFPE)的治疗前活检样本的病例。3)一例患者接受不完全CRT、转移性疾病或姑息治疗(palliative treatment)的病例被排除在外。

CRT用3D适形技术(conformal technique)每周5次以25个180cGy的份量向骨盆输送总计45Gy，加强放疗的540cGy分3份进行。用5-氟尿嘧啶结合亚叶酸(leucovorin)或卡培他滨(capcitabine)进行同时化疗。TME在CRT完成后6至8周内进行。除非术后病理检查报告pCR，否则给予基于氟尿嘧啶的术后放疗(postop-CRT)。

手术后，前3年每3个月随访一次，接下来的2年每6个月随访一次，此后每年随访一次。常规监测包括体格检查、内窥镜检、血清癌胚胎抗原、胸腹盆腔CT扫描、以及毒性评估。当怀疑复发时，进行组织学确认、MRI或FDG-PET以进一步评估。盆腔内复发定义为局部复发，其他复发定义为远处复发。

[预备例4]RNAseq和质量控制

使用Qiagen AllPrepDNA/RNA FFPE试剂盒(Qiagen,Valencia,CA,USA)，从264个病例经福尔马林固定后石蜡包埋的活检组织中提取RNA。根据可用组织的数量，从1到17个5微米厚的组织切片中提取富含肿瘤的区域。RNA浓度通过荧光分析(Qubit RNA Assay kit，ThermoFisher Scientific，USA)定量。RNAseq用Ion Proton平台按厂家说明书执行。排除数据质量差的34例。

[预备例5]RNAseq数据和基因集富集分析

使用HT-seq和Ensembl GRCh37基因模型对基因表达值进行量化。通过DESeq方差稳定变换(variance stabilizing transformation,VST)对计数数据进行归一化。使用最近模板预测(Nearest Template Prediction)和来自DESeq2的522个归类机制基因模板，将病例分配到NMF衍生的原生亚型(native subtypes)。此外，利用基因集富集分析功能、结肠癌和结直肠癌(CRC)共有分子亚型(consensus molecular subtype,CMS)包(package)的“CMSgsa”和“fgsea”包，对结肠癌和癌相关基因集进行富集分析。

[预备例6]按内在亚型对临床结果进行统计分析

所有统计分析均使用R统计编程环境版本3.6.3和R Studio版本1.2.5033进行。主要评估标准是无病存活率(DFS)，定义为在首次局部或远处复发事件、死亡或删失(censorship)的情况下，从手术日期到末次随访的时间。次要评估变量包括无远处复发的存活率(DRFS)、无局部复发的存活率(LRFS)和总存活率(OS)。对于LRFS和DRFS分析，数据在竞争(competition)事件当时被删失。OS定义为从手术日期到死亡日期的时间，或删失时的末次随访。对于存活分析，使用了R存活包。Survminer和ggplot2包用于生成Kaplan-Meier图谱(plot)。Kaplan-Meier方法用于比较固有亚型之间的存活差异，并使用对数秩检验来检验。与DFS和OS相关的因素通过Cox比例风险回归分析来分析。双侧p值小于0.05被认为具有统计学意义。每个预后模型的相对准确性使用对数似然比和关联指数(C-index)来评估。

[预备例7]使用来自TCGA-READ群组的RNAseq数据发现直肠癌分子亚型

图2显示了使用非负矩阵分解(NMF)的TCGA直肠癌数据分析结果指标。

图3显示了2到5个度量的非负矩阵分解(NMF)的一致性聚类结果。

从Cancer Genome Atlas Project下载了177个直肠癌样本的RNAseq数据(TCGA-READ.htseq_fpkm-uq.tsv)。为了用R包“NMF”识别亚型的最佳数量，进行了2到5个度量的非负矩阵分解分析。通过一致性聚类发现的共生指数(cophenetic index)和轮廓提示，将直肠癌分为两个分子亚型将是最好的选择。

[预备例8]直肠癌两种固有分子亚型的性质

图4显示了所发现的两种分子亚型的基因集富集分析结果。

为找出所发现的两种分子亚型的生物学特性，利用R的“fgsea”包并利用“CMSgsa”包进行基因集富集分析，以识别两种亚型之间显著不同的生物学通路。如图4所示，对于多个特异性癌症通路而言，在第一分子亚型中，上皮间质转化(EMT)通路和干细胞特异性基因表达相对丰富，而在第二分子亚型中，MYC靶向、细胞分裂、氧化磷酸化和DNA修复通路的基因表达相对丰富。

[预备例9]直肠癌固有分子亚型与结肠癌分子亚型的区别

图5是显示基因集富集分析结果的热图，以查看直肠癌固有分子亚型和结肠癌分子亚型之间的差异。

同时，直肠癌已被纳入结直肠癌的分子亚型归类中，因为它已被判为结直肠癌的一部分。结肠癌的分子亚型被全球共识分为四种分子亚型，即共有分子亚型(CMS)1至4。CMS4亚型预后不良，上皮间质转化通路基因被激活，因此很可能与本发明人发现的第一分子亚型相同。因此，将TCGA-READ RNAseq数据用CMScaller包归类为CMS分子亚型，并检查了本发明人发现的两种分子亚型之间的相关性。只有58.8％的第一分子亚型被归类为CMS4，17.5％的第二分子亚型被归类为CMS4。这表明它们具有统计学上显著的相关性，但不匹配。

表1

	CMS1	CMS2	CMS3	CMS4	总计
						第一分子亚型	8	13	12	47(58·8％)	80
第二分子亚型	12	46	22	17(17·5％)	97
						总计	20	59	34	64	177

使用“CMScaller”包的“CMSgsa”功能对两种归类方法归类的8种直肠癌进行基因集富集分析，以了解CMS4与第一分子亚型的区别，结果如图5所示，被归类为CMS4分子亚型的直肠癌固有第一分子亚型的EMT相关基因表达与第二分子亚型相似，但一个表达在干细胞中的基因集的表达增加。另一方面，发现表达在干细胞中的多个基因集的表达增加，而细胞分裂相关基因集MYC、DNA修复和细胞周期的表达减少。这些结果证明，本发明人发现的直肠癌固有分子亚型与结肠癌分子亚型有显著的差异。

此外，基于上述数据假设，与第二分子亚型相比，第一分子亚型关联着较差的预后和较低的对术前放化疗的反应。

[预备例10]开发针对新发现的分子亚型的归类机制(1)

图5显示了85个最佳基因，它们能够使用Microarray R包(PAMr)的预测分析对两种分子亚型进行归类。

用Microarray R包(PAMr)的预测分析开发新发现的分子亚型的归类机制。为了分析，设阈值为6且prop-selected-in-cv阈值为0.6。作为参考，即使该阈值和该prop-selected-in-cv阈值发生变化，其影响所选基因的数量和归类机制的最终表现，但端部(top)归类机制基因保持不变，临床表现类似于p值的部分变化。该分析的结果，初步选出94个基因作为亚型归类的模板，如表2所示。在表2的分子亚型栏中，1表示第一分子亚型，2表示第二分子亚型。

表2

如表2所示，在初步选出的第一分子亚型中相对过表达的归类基因是ACADL,ADAMTS9-AS1,ARHGEF18,BCHE,BLOC1S5-TXNDC5,BVES-AS1,C10orf131,CCDC144B,CDH19,CTAGE8,EPHA6,FAM133A,FAM35BP,FAM47E-STBD1,FILIP1,GAS1RR,GOLGA8K,GRIA2,GRIN2A,GTF2IP1,HCG23,HIST2H3C,HLX-AS1,HNRNPA1P33,KCTD8,KIAA0408,KIAA2022,KRT222,LGI1,LINC00504,LINC01266,LINC01352,LINC01489,LINC01537,LINGO2,LOC100507073,LOC100507387,LOC101928509,LOC101929607,LOC440434,LOC642131,LOC644838,LONRF2,MEIS1-AS2,MIR133A1HG,MIR186,MIR3911,MIR4477B,MYH8,NEXN,NLGN1,OR7E12P,PCDH10,PGM5-AS1,PGM5P3-AS1,PLCXD3,PLGLB2,PLN,RANBP3L,SCN7A,SCN9A,SEMA3E,SLITRK4,SYT4,TBC1D3L,TCEAL2,TVP23C-CDRT4,ZNF676,和ZNF728。

同时，在初选的第二分子亚型中相对过表达的归类基因是C4orf48,CTU1,EIF3IP1,FAM173A,FEZF2,LOC440311,MIR3661,NOXO1,PDF,PRR7,SNHG25,SNORD30,SNORD38A,TMEM160,TPGS1,和TRAPPC5。

当通过RNAseq方法分析基因表达时，由于可以同时测量多个基因的表达水平，因此可以应用由更多基因组成的集合(panel)而不是94个基因的集合。两种亚型之间差异化表达的基因用R中的“DEseq2”包鉴定。在p<10^-7的统计显著性水平下，两种分子亚型之间有4877个差异化表达的基因。在4877个基因中，可以通过多种方式选择和组合一些基因来开发分子亚型归类机制，在一个例子中，如表3所示，可以通过选择522个在两种分子亚型之间的表达水平的差异达2倍以上的基因作为模板进行归类。在下表3的分子亚型栏中，1表示第一分子亚型，2表示第二分子亚型。

表3

如表3所示，第二次选出的第一分子亚型是AADACL2,ABCA6,ABCA8,ABCA9,ABCB5,ABI3BP,ACADL,ACSM5,ACTG2,ADAMTS9-AS1,ADAMTS9-AS2,ADAMTSL3,ADCYAP1R1,ADGRB3,ADH1B,ADIPOQ,ADRA1A,AFF3,AGTR1,AICDA,ALB,ANGPTL1,ANGPTL5,ANGPTL7,ANK2,ANKS1B,ANXA8L1,APOA2,APOB,APOC3,AQP4,AQP8,ARPP21,ART4,ASB5,ASPA,ASTN1,ATCAY,ATP1A2,ATP2B2,ATP2B3,AVPR1B,B3GALT5-AS1,BCHE,BEST4,BHMT2,BLOC1S5-TXNDC5,BMP3,BRINP3,BVES,BVES-AS1,C14orf180,C1QTNF7,C7,C8orf88,CA1,CA2,CA7,CACNA2D1,CADM2,CADM3,CALN1,CARTPT,CASQ2,CAVIN2,CCBE1,CCDC144B,CCDC158,CCDC160,CCDC169,CCN5,CD300LG,CDH10,CDH19,CDKN2B-AS1,CDO1,CHRDL1,CHRM2,CHST9,CIDEA,CILP,CLCA4,CLCNKB,CLDN8,CLEC3B,CLEC4M,CLVS2,CMA1,CNGA3,CNN1,CNR1,CNTN1,CNTN2,CNTNAP4,COL19A1,CP,CPEB1,CPXM2,CR2,CRP,CTNNA3,CTSG,CYP1B1,DAO,DCLK1,DDR2,DES,DHRS7C,DIRAS2,DPP6,DPT,EBF2,ECRG4,ELAVL4,EPHA5,EPHA6,EPHA7,ERICH3,EVX2,FABP4,FAM106A,FAM133A,FAM135B,FAM180B,FDCSP,FGF10,FGF13-AS1,FGF14,FGFBP2,FGG,FGL1,FHL1,FILIP1,FLNC,FMO2,FRMD6-AS2,FRMPD4,FUT9,GABRA5,GABRG2,GALR1,GAP43,GAS1RR,GC,GCG,GDF6,GFRA1,GNAO1,GPM6A,GPR119,GPR12,GPRACR,GRIA2,GRIN2A,GTF2IP1,GUCA2B,HAND1,HAND2,HAND2-AS1,HEPACAM,HP,HPCAL4,HRG,HRK,HSPB8,HTR2B,IGSF10,IGSF11,IRX6,ISM1,KCNA1,KCNB1,KCNC2,KCNK2,KCNMA1,KCNMB1,KCNQ5,KCNT2,KCTD8,KERA,KHDRBS2,KIAA0408,KIF1A,KRT222,KRT24,KRTAP13-2,LCN10,LDB3,LEP,LGI1,LIFR,LINC00504,LINC00507,LINC00682,LINC00924,LINC01266,LINC01352,LINC01474,LINC01505,LINC01697,LINC01798,LINC01829,LINC02015,LINC02023,LINC02185,LINC02268,LINC02408,LINC02544,LIX1,LMO3,LMOD1,LOC100506289,LOC101928731,LOC102724050,LOC107986321,LOC283856,LOC440434,LOC729558,LONRF2,LRAT,LRCH2,LRRC3B,LRRC4C,LRRTM4,LVRN,LYVE1,MAB21L1,MAB21L2,MAGEE2,MAMDC2,MAPK4,MASP1,MEF2C-AS1,MEOX2,METTL24,MFAP5,MGAT4C,MGP,MICU3,MIR133A1HG,MIR8071-1,MMRN1,MORN5,MPPED2,MRGPRE,MS4A1,MS4A12,MSRB3,MUSK,MYH11,MYH2,MYLK,MYO3A,MYOC,MYOCD,MYOM1,MYOT,MYT1L,NALCN,NAP1L2,NBEA,NECAB1,NEFL,NEFM,NEGR1,NETO1,NEUROD1,NEXMIF,NEXN,NGB,NIBAN1,NLGN1,NOS1,NOVA1,NPR3,NPTX1,NPY2R,NRG3,NRK,NRSN1,NRXN1,NSG2,NTNG1,NTRK3,NUDT10,OGN,OLFM3,OMD,OTOP2,OTOP3,P2RX2,P2RY12,PAK3,PAPPA2,PCDH10,PCDH11X,PCDH9,PCOLCE2,PCP4L1,PCSK2,PDZRN4,PEG3,PENK,PGM5,PGM5-AS1,PGM5P4-AS1,PGR,PHOX2B,PI16,PIK3C2G,PIRT,PKHD1L1,PLAAT5,PLCXD3,PLD5,PLIN1,PLIN4,PLN,PLP1,PMP2,POPDC2,POU3F4,PPP1R1A,PRDM6,PRELP,PRG4,PRIMA1,PROKR1,PTCHD1,PTGIS,PTPRQ,PTPRZ1,PYGM,PYY,RANBP3L,RBFOX3,RBM20,RELN,RERGL,RGS13,RGS22,RIC3,RIMS4,RNF150,RNF180,RORB,RSPO2,SCARA5,SCGN,SCN2B,SCN7A,SCN9A,SCNN1G,SCRG1,SEMA3E,SERTM1,SERTM2,SFRP1,SFRP2,SFTPA1,SGCG,SHISAL1,SLC13A5,SLC17A8,SLC30A10,SLC4A4,SLC5A7,SLC6A2,SLC7A14,SLIT2,SLITRK2,SLITRK3,SLITRK4,SMIM28,SMYD1,SNAP25,SNAP91,SORCS1,SORCS3,SPHKAP,SPIB,SPOCK3,SST,ST8SIA3,STMN2,STMN4,STON1-GTF2A1L,STUM,SV2B,SYNM,SYNPO2,SYT10,SYT4,SYT6,TACR1,TAFA4,TCEAL2,TCEAL5,TCF23,TENM1,THBS4,TLL1,TMEFF2,TMEM100,TMEM35A,TMIGD1,TMOD1,TNNT3,TNS1,TNXB,TRARG1,TRDN,UGT2B10,UGT2B4,UNC80,VEGFD,VGLL3,VIT,VSTM2A,VXN,WSCD2,XKR4,ZBTB16,ZDHHC22,ZFHX4,ZMAT4,ZNF385B,ZNF676,和ZNF728。

同时，第二次选出的第二分子亚型是ADAT3,ANP32D,BHLHA9,BOD1L2,C4orf48,CCDC85B,CDH16,CLMAT3,CSNK1A1L,CTU1,DBET,DDC-AS1,DEFA5,EIF3IP1,FAM173A,FEZF2,FOXI3,FRMD8P1,GALR3,GJD3,GPR25,HBA1,HES4,HIST1H4A,HIST1H4L,HLA-L,IGFBP7-AS1,ITLN2,KCNE1B,LCN15,LKAAEAR1,LOC101927795,LOC101927972,LOC101928372,LOC344967,LRRC26,MAGEA10,MESP1,MIR203A,MIR324,MIR3661,MIR4449,MIR4479,MIR4665,MIR4737,MIR4767,MIR6807,MIR6858,MIR6891,MIR8075,NACA2,NOXO1,ONECUT3,PCSK1N,PDF,PITPNM2-AS1,PNMA5,PRR7,PRSS2,PRSS56,PTGER1,PTTG3P,REG3A,RNA5S9,RNU4-1,RNU5A-1,RNU5B-1,RNU5E-1,RNU6ATAC,RNY1,RPL29P2,RPRML,SBF1P1,SHISAL2B,SKOR2,SLC32A1,SMARCA5-AS1,SMCR5,SNHG25,SNORA36A,SNORD30,SNORD38A,SNORD3B-2,SNORD41,SNORD48,TMEM160,TMEM238,TPGS1,TRAPPC5,UBE2NL,WBP11P1,和ZAR1。

值得注意的是，归类基因模板包括假基因、miRNA和非编码基因，这些基因通常被排除在此类分析之外，这可以解释为什么迄今为止还没有报道过稳健的亚型归类机制。

[预备例11]开发新发现的分子亚型的归类机制(2)

为了确认归类机制基因模板的其他可能版本，根据PAM分析中使用的阈值，发现一个略有不同的具有相似主要贡献基因的模板基因列表。这样的模板基因可以用于类似的临床应用。表4至表7是可以替代第一次或第二次选出的基因模板的模板。在下表4至7的分子亚型栏中，1表示第一分子亚型，2表示第二分子亚型。

表4

表5

表6

表7

[预备例12]开发新发现的分子亚型的归类机制(3)

另外，下表8是可以替换第一分子亚型对应的一个基因亚型的模板，表9是可以替换第二分子亚型对应的一个基因亚型的模板。

表8

表9

[实验例1]验证新开发的分子亚型归类机制的临床实用性(1)

图6和7显示了根据本发明一个实施例的来自延世癌症中心的230例直肠癌患者的RNAseq归类数据。

为了对在延世癌症中心治疗的230例直肠癌患者的治疗前活检样本进行归类，使用了最近模板预测(NTP)法。下表10显示了由初选出的94个基因的集合归类的分子亚型与对术前放化疗的反应之间的相关性。

表10

	第一分子亚型	第二分子亚型	总计
				病理不完全缓解	33	48	81
病理完全缓解	6(15.4％)	26(35.1％)	32(28.3％)
				总计	39	74	113

通过对初选的94个基因的集合应用NTP法，对230例直肠癌患者进行归类。113例患者被可靠归类(错误发现率<0.2)，但无法准确归类97例患者。在能被归类的113例中，第一分子亚型的pCR率为15.4％(39例患者中有6例)，而第二分子亚型的pCR率是第一分子亚型的两倍，为35.1％(74例患者中的26例)(卡方＝3.98，p＝0.046)。

图6显示了按初选基因集所归类的各亚型的患者的无病存活率(DFS)。正如低pCR关联性所预期的，第一分子亚型(预测＝1)的病例比第二分子亚型(预测＝2)关联更差的DFS(p＝0.0023)。

下面的表11显示了第二次选出的522个基因的基因集所归类的各亚型与对术前放化疗的反应之间的关联性。

表11

	第一分子亚型	第二分子亚型	总计
				病理不完全缓解	57	78	135
病理完全缓解	6(9.5％)	45(36.6％)	51
				总计	63(33.9％)	123(66.1％)	186

通过对第二次选出的522个基因的基因集应用NTP法，对230例直肠癌患者进行归类。186例患者被可靠归类(错误发现率<0.2)，但无法准确归类44例患者。在能被归类的186例中，第一分子亚型的pCR率为9.5％(63例中有6例)，第二分子亚型的pCR率是第一分子亚型的两倍，为36.6％(123例患者中有45例)(卡方＝14.0，p＝0.0002)。

图7显示了根据初选基因集归类的亚型的患者的无病存活率(DFS)。正如低pCR关联性所预期的，第一分子亚型(预测＝1)的情况比第二分子亚型(预测＝2)关联更差的DFS(p＝0.0015)。

[实验例2]验证新开发的分子亚型归类机制的临床实用性(2)

在术前放化疗后的手术中，根据表8的第一分子亚型和表9的第二分子亚型预测直肠癌的预后的能力被证实，并被表示为DFS(图8)和OS(图9)。然而，该验证是对整个患者群组(N＝230)进行的。

如图8和9所示，证实了在第一分子亚型中比在第二分子亚型中，术前放化疗后的手术中的DFS和OS偏低，而当检查图8和9的分子亚型时，可看到预测直肠癌治疗后的预后的能力是优异的。

[实验例3]确认治疗前根据分子亚型和病理特征预测直肠癌患者的预后的能力

由于直肠癌的诊断是通过对小组织活检标本的病理检查和诸如CT-MRI等放射诊断来进行，因此在开始治疗前预测患者的预后是不容易的。表12显示了对治疗开始前可以实施或测量的候选预后因素进行的单变量和多变量分析的结果。cN_分期(stage)表示临床确定的淋巴结转移程度，cT_分期表示临床确定的肿瘤大小。在表12中，OR表示优势比(oddsratio)，CI表示置信区间。

分析结果清楚表明，只有分子亚型才能在治疗开始前预测患者的预后(p<0.001)。这为分子亚型赋予了非常大的临床意义。近来，直肠癌的治疗正在转向总新辅助治疗(TNT)，其在手术前进行所有可能的治疗。在这种情况下，可以根据预测的患者预后考虑其他治疗剂。也就是说，在第一分子亚型的情况下，可以考虑更强大的治疗方法，因此分子亚型可以为正在开发的新药的临床试验区分目标群体发挥重要作用。

表12

[实验例4]确认在新辅助放化疗后根据分子亚型和病理特征预测直肠癌患者的预后的能力

表13显示了候选因素与分子亚型之间关联性的调查结果，所述分子亚型是可用于确定直肠癌患者在新辅助放化疗和手术后的预后的那些。结果表明，分子亚型与治疗后的癌症大小(ypT分期)和pCR在统计学上显著相关(在第一分子亚型的情况下，大小大而pCR低)，但不与淋巴结转移程度(ypN分期)或患者的年龄和性别相关。

表13

表14显示了对可用于确定直肠癌患者新辅助放化疗和手术后预后的候选因素的单变量和多变量统计分析结果。

表14

如表14所示，在单变量分析中，从DFS和OS可以预测：治疗后的癌症大小(ypT分期)、淋巴结转移程度(ypN分期)、pCR和分子亚型都是统计学显著的。然而，从多变量分析的结果可以看出，只有ypN分期和分子亚型是显著的。即，这表明，由于ypN分期和分子亚型各自独立地影响DFS，因此当两个因素一起使用时，可以更准确地预测预后。为了证明这一点，用Kaplan-Meier图谱研究了基于ypN分期和分子亚型的DFS和OS。

图10的Kaplan-Meier图谱按治疗后手术中发现的淋巴结转移的存在或不存在(ypN分期)来分析DFS。

图11的Kaplan-Meier图谱按治疗后手术中发现的淋巴结转移的存在或不存在(ypN分期)以及分子亚型来分析DFS。

图12的Kaplan-Meier图谱按治疗后手术中发现的淋巴结转移的存在或不存在(ypN分期)来分析OS。

图13的Kaplan-Meier图谱按治疗后手术中发现的淋巴结转移的存在或不存在(ypN分期)以及分子亚型来分析OS。

当如图11和13所示将ypN分期和分子亚型一起使用时，与图10和12仅使用ypN分期相比，尽管有标准的新辅助放化疗，具有极高复发率(三年内复发率60％以上)和低存活率(OS)的患者组仍可以提前预测。该患者组作为新药临床试验的目标组是很重要的，因为这些患者必须尝试不同的治疗药物，而不是新辅助放化疗之后的术后或术前标准疗法。

[实验例5]研究常规开发的CMS分子亚型归类机制对直肠癌的预测能力

另一方面，为了研究CMS和CRIS亚型(它们是预测结直肠癌(CRC)预后的常规分子亚型)的常规归类机制预测直肠癌的能力，使用NTP以及由CMScaller包提供的归类机制基因模板，使用CMS分子亚型时的直肠癌群组中的DFS和OS见图14，使用CRIS分子亚型时获得的DFS和OS见图15。

如图14和15所示，CMS和CRIS均未显示出与临床评估变量的统计学显著关联。具体而言，由于根据CMS分子亚型的直肠癌患者存活率(DFS和OS)没有显著差异，因此预测直肠癌患者预后的能力没有统计学显著性(P＝0.12)。此外，根据CRIS分子亚型的直肠癌患者存活率(DFS和OS)无显著差异，预测直肠癌患者预后的能力也无统计学意义(P＝0.77)。

[实施例1]根据分子亚型和病理特征的直肠癌治疗方案

基于实验例1-4，根据第一分子亚型和第二分子亚型预测直肠癌预后的方法见图16。

如图16所示，传统上，在标准新辅助放化疗后手术后实现pCR时，不再有进一步治疗，而按本发明根据第一分子亚型(亚型1)和第二分子亚型(亚型2)归类后的方案，(1)当结果对应于第二分子亚型，并且治疗后实现pCR时，不再有进一步的治疗，(2)当结果对应于第二分子亚型且未实现pCR时，进行追加化疗，(3)当结果对应于第一分子亚型时，无论是否达到pCR，都进行持续化疗。

在上文中，已经详细描述了说明书的具体部分，本领域技术人员清楚该具体技术仅仅是优选实施方案，但说明书的范围不限于此。因此，本说明书的实质范围将由所附权利要求及其等同方案来定义。

实用性

本发明涉及用于预测对直肠癌的新辅助放化疗的反应或治疗后的预后的组合物和使用该组合物的预测方法。

序列表

<110> 洛博生物科技有限公司

<120> 预测对标准新辅助放化疗的反应和治疗后的预后的组合物、以及预测标准疗法预后不良的患者的方法和组合物

<130> G22U18C0147P/CN

<150> KR 10-2019-0149594

<151> 2019-11-20

<160> 11

<170> PatentIn version 3.2

<210> 1

<211> 660

<212> PRT

<213> Homo sapiens

<400> 1

Met Glu Ala Leu Met Ala Arg Gly Ala Leu Thr Gly Pro Leu Arg Ala

1 5 10 15

Leu Cys Leu Leu Gly Cys Leu Leu Ser His Ala Ala Ala Ala Pro Ser

20 25 30

Pro Ile Ile Lys Phe Pro Gly Asp Val Ala Pro Lys Thr Asp Lys Glu

35 40 45

Leu Ala Val Gln Tyr Leu Asn Thr Phe Tyr Gly Cys Pro Lys Glu Ser

50 55 60

Cys Asn Leu Phe Val Leu Lys Asp Thr Leu Lys Lys Met Gln Lys Phe

65 70 75 80

Phe Gly Leu Pro Gln Thr Gly Asp Leu Asp Gln Asn Thr Ile Glu Thr

85 90 95

Met Arg Lys Pro Arg Cys Gly Asn Pro Asp Val Ala Asn Tyr Asn Phe

100 105 110

Phe Pro Arg Lys Pro Lys Trp Asp Lys Asn Gln Ile Thr Tyr Arg Ile

115 120 125

Ile Gly Tyr Thr Pro Asp Leu Asp Pro Glu Thr Val Asp Asp Ala Phe

130 135 140

Ala Arg Ala Phe Gln Val Trp Ser Asp Val Thr Pro Leu Arg Phe Ser

145 150 155 160

Arg Ile His Asp Gly Glu Ala Asp Ile Met Ile Asn Phe Gly Arg Trp

165 170 175

Glu His Gly Asp Gly Tyr Pro Phe Asp Gly Lys Asp Gly Leu Leu Ala

180 185 190

His Ala Phe Ala Pro Gly Thr Gly Val Gly Gly Asp Ser His Phe Asp

195 200 205

Asp Asp Glu Leu Trp Thr Leu Gly Glu Gly Gln Val Val Arg Val Lys

210 215 220

Tyr Gly Asn Ala Asp Gly Glu Tyr Cys Lys Phe Pro Phe Leu Phe Asn

225 230 235 240

Gly Lys Glu Tyr Asn Ser Cys Thr Asp Thr Gly Arg Ser Asp Gly Phe

245 250 255

Leu Trp Cys Ser Thr Thr Tyr Asn Phe Glu Lys Asp Gly Lys Tyr Gly

260 265 270

Phe Cys Pro His Glu Ala Leu Phe Thr Met Gly Gly Asn Ala Glu Gly

275 280 285

Gln Pro Cys Lys Phe Pro Phe Arg Phe Gln Gly Thr Ser Tyr Asp Ser

290 295 300

Cys Thr Thr Glu Gly Arg Thr Asp Gly Tyr Arg Trp Cys Gly Thr Thr

305 310 315 320

Glu Asp Tyr Asp Arg Asp Lys Lys Tyr Gly Phe Cys Pro Glu Thr Ala

325 330 335

Met Ser Thr Val Gly Gly Asn Ser Glu Gly Ala Pro Cys Val Phe Pro

340 345 350

Phe Thr Phe Leu Gly Asn Lys Tyr Glu Ser Cys Thr Ser Ala Gly Arg

355 360 365

Ser Asp Gly Lys Met Trp Cys Ala Thr Thr Ala Asn Tyr Asp Asp Asp

370 375 380

Arg Lys Trp Gly Phe Cys Pro Asp Gln Gly Tyr Ser Leu Phe Leu Val

385 390 395 400

Ala Ala His Glu Phe Gly His Ala Met Gly Leu Glu His Ser Gln Asp

405 410 415

Pro Gly Ala Leu Met Ala Pro Ile Tyr Thr Tyr Thr Lys Asn Phe Arg

420 425 430

Leu Ser Gln Asp Asp Ile Lys Gly Ile Gln Glu Leu Tyr Gly Ala Ser

435 440 445

Pro Asp Ile Asp Leu Gly Thr Gly Pro Thr Pro Thr Leu Gly Pro Val

450 455 460

Thr Pro Glu Ile Cys Lys Gln Asp Ile Val Phe Asp Gly Ile Ala Gln

465 470 475 480

Ile Arg Gly Glu Ile Phe Phe Phe Lys Asp Arg Phe Ile Trp Arg Thr

485 490 495

Val Thr Pro Arg Asp Lys Pro Met Gly Pro Leu Leu Val Ala Thr Phe

500 505 510

Trp Pro Glu Leu Pro Glu Lys Ile Asp Ala Val Tyr Glu Ala Pro Gln

515 520 525

Glu Glu Lys Ala Val Phe Phe Ala Gly Asn Glu Tyr Trp Ile Tyr Ser

530 535 540

Ala Ser Thr Leu Glu Arg Gly Tyr Pro Lys Pro Leu Thr Ser Leu Gly

545 550 555 560

Leu Pro Pro Asp Val Gln Arg Val Asp Ala Ala Phe Asn Trp Ser Lys

565 570 575

Asn Lys Lys Thr Tyr Ile Phe Ala Gly Asp Lys Phe Trp Arg Tyr Asn

580 585 590

Glu Val Lys Lys Lys Met Asp Pro Gly Phe Pro Lys Leu Ile Ala Asp

595 600 605

Ala Trp Asn Ala Ile Pro Asp Asn Leu Asp Ala Val Val Asp Leu Gln

610 615 620

Gly Gly Gly His Ser Tyr Phe Phe Lys Gly Ala Tyr Tyr Leu Lys Leu

625 630 635 640

Glu Asn Gln Ser Leu Lys Ser Val Lys Phe Gly Ser Ile Lys Ser Asp

645 650 655

Trp Leu Gly Cys

660

<210> 2

<211> 359

<212> PRT

<213> Homo sapiens

<400> 2

Met Ile Leu Asn Ser Ser Thr Glu Asp Gly Ile Lys Arg Ile Gln Asp

1 5 10 15

Asp Cys Pro Lys Ala Gly Arg His Asn Tyr Ile Phe Val Met Ile Pro

20 25 30

Thr Leu Tyr Ser Ile Ile Phe Val Val Gly Ile Phe Gly Asn Ser Leu

35 40 45

Val Val Ile Val Ile Tyr Phe Tyr Met Lys Leu Lys Thr Val Ala Ser

50 55 60

Val Phe Leu Leu Asn Leu Ala Leu Ala Asp Leu Cys Phe Leu Leu Thr

65 70 75 80

Leu Pro Leu Trp Ala Val Tyr Thr Ala Met Glu Tyr Arg Trp Pro Phe

85 90 95

Gly Asn Tyr Leu Cys Lys Ile Ala Ser Ala Ser Val Ser Phe Asn Leu

100 105 110

Tyr Ala Ser Val Phe Leu Leu Thr Cys Leu Ser Ile Asp Arg Tyr Leu

115 120 125

Ala Ile Val His Pro Met Lys Ser Arg Leu Arg Arg Thr Met Leu Val

130 135 140

Ala Lys Val Thr Cys Ile Ile Ile Trp Leu Leu Ala Gly Leu Ala Ser

145 150 155 160

Leu Pro Ala Ile Ile His Arg Asn Val Phe Phe Ile Glu Asn Thr Asn

165 170 175

Ile Thr Val Cys Ala Phe His Tyr Glu Ser Gln Asn Ser Thr Leu Pro

180 185 190

Ile Gly Leu Gly Leu Thr Lys Asn Ile Leu Gly Phe Leu Phe Pro Phe

195 200 205

Leu Ile Ile Leu Thr Ser Tyr Thr Leu Ile Trp Lys Ala Leu Lys Lys

210 215 220

Ala Tyr Glu Ile Gln Lys Asn Lys Pro Arg Asn Asp Asp Ile Phe Lys

225 230 235 240

Ile Ile Met Ala Ile Val Leu Phe Phe Phe Phe Ser Trp Ile Pro His

245 250 255

Gln Ile Phe Thr Phe Leu Asp Val Leu Ile Gln Leu Gly Ile Ile Arg

260 265 270

Asp Cys Arg Ile Ala Asp Ile Val Asp Thr Ala Met Pro Ile Thr Ile

275 280 285

Cys Ile Ala Tyr Phe Asn Asn Cys Leu Asn Pro Leu Phe Tyr Gly Phe

290 295 300

Leu Gly Lys Lys Phe Lys Arg Tyr Phe Leu Gln Leu Leu Lys Tyr Ile

305 310 315 320

Pro Pro Lys Ala Lys Ser His Ser Asn Leu Ser Thr Lys Met Ser Thr

325 330 335

Leu Ser Tyr Arg Pro Ser Asp Asn Val Ser Ser Ser Thr Lys Lys Pro

340 345 350

Ala Pro Cys Phe Glu Val Glu

355

<210> 3

<211> 321

<212> PRT

<213> Homo sapiens

<400> 3

Met Ala Ser Ser Gln Gly Lys Asn Glu Leu Lys Leu Ala Asp Trp Met

1 5 10 15

Ala Thr Leu Pro Glu Ser Met His Ser Ile Pro Leu Thr Asn Leu Ala

20 25 30

Ile Pro Gly Ser His Asp Ser Phe Ser Phe Tyr Ile Asp Glu Ala Ser

35 40 45

Pro Val Gly Pro Glu Gln Pro Glu Thr Val Gln Asn Phe Val Ser Val

50 55 60

Phe Gly Thr Val Ala Lys Lys Leu Met Arg Lys Trp Leu Ala Thr Gln

65 70 75 80

Thr Met Asn Phe Thr Gly Gln Leu Gly Ala Gly Ile Arg Tyr Phe Asp

85 90 95

Leu Arg Ile Ser Thr Lys Pro Arg Asp Pro Asp Asn Glu Leu Tyr Phe

100 105 110

Ala His Gly Leu Phe Ser Ala Lys Val Asn Glu Gly Leu Glu Glu Ile

115 120 125

Asn Ala Phe Leu Thr Asp His His Lys Glu Val Val Phe Leu Asp Phe

130 135 140

Asn His Phe Tyr Gly Met Gln Lys Tyr His His Glu Lys Leu Val Gln

145 150 155 160

Met Leu Lys Asp Ile Tyr Gly Asn Lys Met Cys Pro Ala Ile Phe Ala

165 170 175

Gln Glu Val Ser Leu Lys Tyr Leu Trp Glu Lys Asp Tyr Gln Val Leu

180 185 190

Val Phe Tyr His Ser Pro Val Ala Leu Glu Val Pro Phe Leu Trp Pro

195 200 205

Gly Gln Met Met Pro Ala Pro Trp Ala Asn Thr Thr Asp Pro Glu Lys

210 215 220

Leu Ile Gln Phe Leu Gln Ala Ser Ile Thr Glu Arg Arg Lys Lys Gly

225 230 235 240

Ser Phe Phe Ile Ser Gln Val Val Leu Thr Pro Lys Ala Ser Thr Val

245 250 255

Val Lys Gly Val Ala Ser Gly Leu Arg Glu Thr Ile Thr Glu Arg Ala

260 265 270

Leu Pro Ala Met Met Gln Trp Val Arg Thr Gln Lys Pro Gly Glu Ser

275 280 285

Gly Ile Asn Ile Val Thr Ala Asp Phe Val Glu Leu Gly Asp Phe Ile

290 295 300

Ser Thr Val Ile Lys Leu Asn Tyr Val Phe Asp Glu Gly Glu Ala Asn

305 310 315 320

Thr

<210> 4

<211> 183

<212> PRT

<213> Homo sapiens

<400> 4

Met Glu Lys Pro Tyr Asn Lys Asn Glu Gly Asn Leu Glu Asn Glu Gly

1 5 10 15

Lys Pro Glu Asp Glu Val Glu Pro Asp Asp Glu Gly Lys Ser Asp Glu

20 25 30

Glu Glu Lys Pro Asp Ala Glu Gly Lys Thr Glu Cys Glu Gly Lys Arg

35 40 45

Lys Ala Glu Gly Glu Pro Gly Asp Glu Gly Gln Leu Glu Asp Lys Gly

50 55 60

Ser Gln Glu Lys Gln Gly Lys Ser Glu Gly Glu Gly Lys Pro Gln Gly

65 70 75 80

Glu Gly Lys Pro Ala Ser Gln Ala Lys Pro Glu Gly Gln Pro Arg Ala

85 90 95

Ala Glu Lys Arg Pro Ala Gly Asp Tyr Val Pro Arg Lys Ala Lys Arg

100 105 110

Lys Thr Asp Arg Gly Thr Asp Asp Ser Pro Lys Asp Ser Gln Glu Asp

115 120 125

Leu Gln Glu Arg His Leu Ser Ser Glu Glu Met Met Arg Glu Cys Gly

130 135 140

Asp Val Ser Arg Ala Gln Glu Glu Leu Arg Lys Lys Gln Lys Met Gly

145 150 155 160

Gly Phe His Trp Met Gln Arg Asp Val Gln Asp Pro Phe Ala Gln Gly

165 170 175

Asp Asn Gly Val Ser Gly Glu

180

<210> 5

<211> 319

<212> PRT

<213> Homo sapiens

<400> 5

Met Met Val Leu Lys Val Glu Glu Leu Val Thr Gly Lys Lys Asn Gly

1 5 10 15

Asn Gly Glu Ala Gly Glu Phe Leu Pro Glu Asp Phe Arg Asp Gly Glu

20 25 30

Tyr Glu Ala Ala Val Thr Leu Glu Lys Gln Glu Asp Leu Lys Thr Leu

35 40 45

Leu Ala His Pro Val Thr Leu Gly Glu Gln Gln Trp Lys Ser Glu Lys

50 55 60

Gln Arg Glu Ala Glu Leu Lys Lys Lys Lys Leu Glu Gln Arg Ser Lys

65 70 75 80

Leu Glu Asn Leu Glu Asp Leu Glu Ile Ile Ile Gln Leu Lys Lys Arg

85 90 95

Lys Lys Tyr Arg Lys Thr Lys Val Pro Val Val Lys Glu Pro Glu Pro

100 105 110

Glu Ile Ile Thr Glu Pro Val Asp Val Pro Thr Phe Leu Lys Ala Ala

115 120 125

Leu Glu Asn Lys Leu Pro Val Val Glu Lys Phe Leu Ser Asp Lys Asn

130 135 140

Asn Pro Asp Val Cys Asp Glu Tyr Lys Arg Thr Ala Leu His Arg Ala

145 150 155 160

Cys Leu Glu Gly His Leu Ala Ile Val Glu Lys Leu Met Glu Ala Gly

165 170 175

Ala Gln Ile Glu Phe Arg Asp Met Leu Glu Ser Thr Ala Ile His Trp

180 185 190

Ala Ser Arg Gly Gly Asn Leu Asp Val Leu Lys Leu Leu Leu Asn Lys

195 200 205

Gly Ala Lys Ile Ser Ala Arg Asp Lys Leu Leu Ser Thr Ala Leu His

210 215 220

Val Ala Val Arg Thr Gly His Tyr Glu Cys Ala Glu His Leu Ile Ala

225 230 235 240

Cys Glu Ala Asp Leu Asn Ala Lys Asp Arg Glu Gly Asp Thr Pro Leu

245 250 255

His Asp Ala Val Arg Leu Asn Arg Tyr Lys Met Ile Arg Leu Leu Ile

260 265 270

Met Tyr Gly Ala Asp Leu Asn Ile Lys Asn Cys Ala Gly Lys Thr Pro

275 280 285

Met Asp Leu Val Leu His Trp Gln Asn Gly Thr Lys Ala Ile Phe Asp

290 295 300

Ser Leu Arg Glu Asn Ser Tyr Lys Thr Ser Arg Ile Ala Thr Phe

305 310 315

<210> 6

<211> 11670

<212> DNA

<213> Homo sapiens

<400> 6

gcacaggggc acccattgaa ccagggcagg gcctgttagc ttatgaccag caggtgacct 60

gatttccttg tccactggca cagagcacac cctgccacag tgcaagcctg agaagcagtg 120

aggaccccat gaagctgaag gacaggccga tcccccgata gacgattagg taatgactgc 180

tggtatggag tcagtattgg gcttcaagcc aatgaggaaa gctgggtaga gcgagaatcc 240

tgatgaatgg acctgaaaaa ggaactcacc tcaggcttga tagaggaatt tttcagtaca 300

gctaaagtgg acacctgtcc ttttacttgt ttggaatcca ttccccagac tttgggacag 360

catctcaagc ttgttttgga gaacctccct tctccacttg cattctatgg ggtgatggtg 420

acagggtgat caaccccaac cccttgcccc caccccaatc ccacagctcc tgggttcaag 480

ttccagctcc aacatagatc agatatgtaa ccaaccctgg gttagtcata aagtctcagt 540

tatctcatct gacggaggct gtcagcccgt gggttaggca gggaggatcc agtgagaaac 600

actgtatagg cactctgcac atcacaagac tcagttctag gtatagctgg gctattcttt 660

cctcatatat gaatcctcca gtaagaggaa ccaggaaagg taagcatgaa taactgtttg 720

gagctcggag aagttaaagg actgacctaa gagtgcaagg ccactaagga gaggacctgt 780

gacttaagtc ctgtgaactg agatccttgt agtatgtggg aacaccatac cacttcaccc 840

cattaaggta aaccctctat gttacttgag agattgaaaa caacactaaa aagagaactc 900

tctacctaaa aaccattgct tcttgccaat ttcaatccag taagattggt ggtatcttat 960

gtagattttc accttggata tggagcagcc caaagattta tttcaagagc tttccctctg 1020

atgcacacag gaatctaaca cacacattcc aataagagga gagagaaaag agaagaggct 1080

ggcactggtg ctgggtgcat gccaagcgtc gtggcaccct cctcatataa ccctgctgtt 1140

tcatgtgcag gcagtgcaag acacagcaag gagccaagca gagtcaataa tatttacttt 1200

gcagaaacat ctgttgctag aaaagcagaa tgctggccag agtggaggga agtcataact 1260

gccggcatct ggggaggcca agtatctgct ttccagagta ggtagggctg tgcttctctg 1320

agtgagggga ccagatggct aagaaatatg gaagcagcta gaagtttggg ccttgagaga 1380

ctgctcccag agccacctgc tcactcaggg actagaggaa gtgcccttct tttcttggag 1440

atgccagcag atattaatct gcaccggatt taagagaatt taacccaaat agatccaact 1500

ttcactaaca cagaaggttt accataattt tttaaaaatt agaatctacc ttaattttat 1560

acaagttgta ccagtaatac cacaagtcaa gccatttcct ttttctcctt gggtaaaact 1620

taacatacat gtgcacacac aaacatggac tcaggtaacc ttactactgt attttcagtg 1680

catctattgc ctttgtgacc tccaaagtta ccaaaattgt gtattaacta cccttgaaat 1740

gttttgctgc tcagtcacat ctttcccttt ggacttagaa agtgattaca gttccgggag 1800

gccaaggcgg gtggatcatg aggtcaggag ttcgagacca gtctggccaa catagtgaaa 1860

cctcatctct actaaaaata caaaaaaaaa taaaataaaa tagccgggtg tactggtgtg 1920

cacctgtaat cccagctact cagggaggct gaggcaggag aatcgcgtga acccgggagg 1980

ctgaggctgc agtgagccga ggttgcacca ttgcactcca gcctaggcga cagtgtgaga 2040

cgctgtctca aaaaaaaaaa aaaaagaaaa aagaaaaaga aaaagaaaag aaaagaaagt 2100

gattacagct cagaaaggcc atcattgagg ttagaacttg caacaggatt ggcctcatgg 2160

ctgcctaaag ttcaagaata ccaaagtccc cgggccttgt taatctcttc ctttcctgga 2220

cgccagttac tctctgtgcc tcatcacctt gtatttggaa taattctgga actagtcatg 2280

aatggcttca tgtcacaatg cacaaagagt gcctcggaca gggctggaca cagtgtccct 2340

ccaaacctgt tgtacgatgt gagcgggcaa ggaaacacaa gctggcttac aggtggaata 2400

cctgagagtc tccagagagg acccatgaca gacagctgag acatggatgg acacgagccc 2460

cagagagact tcaggtttag cccacacccc cattcctagg tcaaactcaa cacactcaaa 2520

acaaaactct ctctactcaa acaccctctg ccaccctctc cccagagagc cagccgaggg 2580

cctcttcctg catccccagt gtaacgaagg gcaccaccat tcaccctgcc gcacaagtca 2640

ccagtacatg tcatcctctc acacagcagg ctccctcatg tgccatgtcc attcccaagt 2700

ctcctaagca catctcaatt ctgcccactc cttcccatca ctatcagcaa cccctaaaca 2760

aaacacctcc atttgcccag ataactgcaa ctgctcctct ctggcctccc cacatccact 2820

tttgtccgtc aaatcagttc tccacccagt tgtgtcaata ccagcagtga gccctgtgat 2880

ggcttcccag agctctggag gtgaagacga aagtccctcc caaggcctga gaggccctgc 2940

agggtctggc ctccccacac ccctctctgg gctccagctg ctccagcctc tgccagttcc 3000

cggggcatgc ccaactccta cctgccacca catgccacct ctgcctgcag cccttggccc 3060

aaaagttctt tcctccagga agccttccct gacttctcta atcaggccaa acccaaccct 3120

atttctcact ctctgagtac tatactatag atcttttctt cagagcaatt ttatatttgt 3180

tcaggtaatt cttctcttca agtaatgcct ccccaactag tacattctat aaggatgagg 3240

atcatatccc ttcatgctca ccactctatc cccaaagccc aacactctac tgcttgactg 3300

agagcaggta ttgcagaaag aacaaagaga gaggaagttg ggcactccat aagtccatta 3360

gccttcatca gaggtgaacc tcccaactca atgtttgaca tgtgaaaaaa aaagcaggta 3420

agttaggaca aactctccaa cttatgtaag tctggctaga gcctgatata tatgtgggaa 3480

tgtgcttcct attagcatgt gaccacctcc cttcatgttg tccattgagg aagagtccca 3540

cagagctgga gggagagcta ccaccagcag gagcataaaa taaaacctca cctataccaa 3600

ggaagctgga gaaatgagct acatacaacc caactgctgg ccacaaccaa ctgtcctctc 3660

ttagccccag cacaagcccc aggttgcagt taaaatggtt taaggaagag tccccagaga 3720

tcgctctttt ctttctcccc gtatctggga aaactgagaa catatccaat cagaaactgt 3780

gcttggagag aggcatttcc aacgactccc catttcccca agtctgtatg tagcagttta 3840

aacctagttc gatgtgcttc attataagaa aagcaagtta cagtcccttg taaataccat 3900

tctgcagccc agactcctgg cattgtacta gcaaaaacaa acaaaacaca cacacacaca 3960

cacacacaca cacacacaca cacaccctgt gcaaatctta gaatgaaaca aaattctcca 4020

tagcattttt ctcgtttccg tgacacacgg tcttacctgt ggccactagg tggcaatcaa 4080

ctatatcaga gaacaccttg accaagcagc taatttaaac aacagctaag actcaaggag 4140

aaatgacagg gccagcctta aaggcagtgc tgagaacaga tcctgtccca ctgaggaaca 4200

aataaccacc tagaaatgtc cagtggacac tcagcaactg agagaggggc cctggcttcc 4260

acattggaag aagtgctcta acacattcgg agggcctgtg ctctcataca gcaagtcaag 4320

cctgagacat ggagtgggag gggtataggg atgaagtcac caccacagtg tctctcacat 4380

tctttcagat ctggctggag cagattcaga aaacctctta tctcccccag gcggatgatg 4440

tgcccaccga ccacatcagc cacggtacgt tacataacat gcattctgat catacatctg 4500

cgtgcttttc ctgaggccat ttccctaaaa cagcatttcc taaatgaggc catcaccagc 4560

actgattctg gaaaatttgt ttttccaacc agagcactaa ggctaatgaa attttcagag 4620

ttgattttta aaatgaaatc aagtagaata aagacgtgct cctctttcca aaatgaggtt 4680

tctaattcta tttagatgaa atacccctta aaaataattt gggctaccca aactcacctt 4740

aatctacatc caaataacta tgaatatatt atatacatta acttactgaa tactgtacct 4800

accaagtact ttaaatccct ccatcctcac aaccattctg ttgagtagat attattacct 4860

ccattttgca gatgggaaac tgaggctcag agaggttaaa taacgtgccc aagatcatgc 4920

agggaatgag tggtaatgta agaaacttgg tctctctgac tccaaaactc ttaactacta 4980

cactatattg cctcatttac tcaaatattt gagaatctgg tatcaatgta ttcaaagaaa 5040

tgaaaagatg gtatgtatac attccgtgcc ttaaggggaa tacaattttt agaagggcct 5100

aatctgtgtg tgcaaaacta caaaattaag gtagactgtg ctagggcaat cagagagtag 5160

acaaaaatgg ctacagaaat gcaagtggga tattattccg gctagggcca ttggaggggg 5220

cttccaaaaa aaaaaaaaga aaaaagaaaa agaacaggga gtagcgtttg agctgaacct 5280

taaagttcag tcctatttgg atatgtagaa aagggaagcg gaagcagtca tgggaagatg 5340

ctatagaagt ggaaacatgg agcaaggaga tgcgaaatgc agaacctacc cagaaaaagc 5400

agcaagttta actagatgga caggaggtca gagtgggaag accggttaga atcaaaccat 5460

ggaaggacct gtatgccaag ctaaggaatt tgaacttact cccttaaaga aatgggaact 5520

ggattgttat acagaggagc aacaagatca acttaaacaa caattaagcc ttttactaag 5580

gagctggccc agaactttgt tggagacacc tactgtaact cctccagcaa gcttcactat 5640

gagaatgtgc aaccacagcc aaggggcatt ctccctgtag gtaactaaat gacaggcaac 5700

acctctcaac ttggacattt gtgcacagac cattggtcag ccaggagata aggaaagagt 5760

tataagggat tcaaaaaaaa aaaaaaaaaa aaaaacttct ccgtgttgaa aactccaagt 5820

tctgggccca ctacgactta tacataactg tatgcaaata atgtatacaa atacatatgt 5880

atttccaaag tgctgtattg gcttttcctc ataagaacat tgagagttaa gtgaaagcac 5940

ctgacctctt ctagatgaag aaattaagga ctggcttaat gacagtgcaa gtcacatagt 6000

aggtgcttaa taaacattta ctggatcaat gaccgctgtg tcaagtgagt tagtcagcat 6060

tggatctccg atgaaaactc aacccctaaa gagcccagcc ccagctcagc cctggcacag 6120

agaactgagg tactgtattt agaacaactg cattcacatg ctgccccaag acatgataag 6180

acagcagaag gtcaccacag gaaaaactcc ctcaaggaag actgtggaca tttcttaatg 6240

aaaacaaaga aacccatttt gagagggact aatcaagtga gggaacaaaa aagagagggt 6300

aattccaggc agctcaagta caaatatcac acacacacgg ggcaagggga aggtaattca 6360

gaggcgtatg acgcgcattg gctgcgcaaa catcagctta aatcccggtc tctcacttcc 6420

cagctgtgtg gcctttggca aattacccaa cctttccaag catgtatgta actgtgagga 6480

cagtatgtac ctcacagggc tgttgtggga attcaaaata ggaaagacac atgttctgga 6540

agagagagga cagggatgcc cccggccctg ccttgctttc cttcccacag cagaggtgga 6600

gtggaagttt accagcaggt tggagaaagg agaatcaacc aaaggagaat cttaattacc 6660

ataacaatta agcaattttt gcctcattga gtcaccagat caaccccatt cttgtgaact 6720

actaaaaaca cacctgagtt cctaagggtt ttcttcagtg ctcagaaaac ccctaatgct 6780

tctacaaatt tacaatttcc tttcacctct ggcagatgaa aggcaaggca aaacccggat 6840

ggaccatttt ttaactaaac caatttttaa ctaaacgaac tcaaagcagt atgggtttct 6900

ttttgtgaag tttattaagc tcaagtcgtg ccttttaaat gcaccgggga aacagtgcta 6960

tcatcaaatc ctttctgtcc actgcctggg gaggcaggcc agccccagat gaaacagata 7020

aaagaatgag tgtgttaaga cgacatttaa gacacaagag actgacagcg ttcacaggcc 7080

tgaagtactg ggcttcctca gaaggtggaa cttgagcttg gcccctaagg tagacacgtt 7140

tctagaaagg ggagggggtg gtgaattaag aggagaccac acaagtcaga cccactcact 7200

gggtcagact agggctggaa aaaccggtag gggctggtgg gtggagatag agggagatag 7260

aggtctaaga atggtgggga ggggcaggtg gagcagggat tcctctctct caacacctca 7320

gcagttctgt tctgctcaac accaagcagg tgcgcagata ggaggcagtg gggctgggag 7380

ggttgatcct ggcttgagcc tcaagactta gattttgttt ctggaatgcc ttttcctctg 7440

cagcagagac agctactcaa gctttaaggt gcacccaatc acctgggatc ttgtcaaaat 7500

tcccatgtga tccagcaggc ctgggagccc gagagtctac atttctaatt cccaggtgaa 7560

gccaatggtg ctgatccagg caccacaccc tccaaggcaa gggtttggac tcccactcaa 7620

gaccctgaca gagaagatca cagcttcttt attctcctag cacgtgcctg gaacatacag 7680

gacctcaata tatattggag gaatgaatga ataaattcct tgagagaact taagctgttg 7740

cagacagaat agaaaagaac ccagaaaaag aaccagaaat ggcgtgtctc cttgtgcagc 7800

caccaactat acatgtgaac ctagggagag ttatgtgaca cactcggcct taaaagaact 7860

cacttgaggc cgggcgcagt ggctcacgcc tgtaatccca gcactctggg aggccgaggt 7920

gggcggatca cgaggtcagg agttcaagac cagcctggcc aacacagtga aaccctgtct 7980

ctggctaata caaaaattag ctgggcttgg tggtgggcac ctgtaatcac agctactcgg 8040

gaggctgagg caggagaatc gcttgaaccc aggaggcggg gcttgcagtg agccgagatc 8100

gtgccatagc actccagcct gtgtgacaga gcaagactcc ttctcaaaaa gaaaaaaaaa 8160

aaaaaaacct cacttgaaaa ccaaggagcc aacccctttc cgtagctcta agatccctcc 8220

caaagtatct tttctgtgcc ttttattttt aatggtgagg ttatatactg gatattccta 8280

cagcaaggca cacctctatg tcattctcaa agagcagttt ccaaaaatcc aattgagaga 8340

acacagactc tgttagtctc agcaaataac catagcaact aatactcccc aaatgaaatg 8400

atgtcttcac aatgatgtgc tggctcaatt agattaagag ggtgacgtgt accatctgaa 8460

aatttatcgt cgtaaactta cagtgaaagc cagaccttct tggaagaggt ttataagtaa 8520

aagaaaggcc ttgccaataa atggaattca ggacaaagag ccagagaagt caagcagatg 8580

aggaaattgg gaaggactgc tctgcctctc caggttcaca cagtcagggc ccacgcaccc 8640

agacagaacc cagaacttgg ttaaacagtt agaaatctga gtaccaccac ttctaccagg 8700

gagttatcaa aagactgcca ttttatcctt gttctatgcc tttcttcata catattacaa 8760

aaggaaaata ctgctacctc agaaaagtct gcagaaatat ttaccaaaat aattgtaaaa 8820

cttttaaatg aaaaagagga caacttcaaa ataacaaatt agggctgata atacatttcc 8880

agccaaatta atttctccac aggtcatcac aggatgcaaa tctttctgtt acaaggtttt 8940

ctgactggag ttagaactgt gaatggaaaa ctcaacgtct ataagttcta caacttactg 9000

tctttccaca tccttaggcc tgcctcttcc agggtccatg caatcacatt tgccctgaac 9060

aaatttgggc aagcaagaac ctcacttgaa aagcaggaaa agagaagcca aggcctgtca 9120

cctccctgta atccctgagc tttctagctt tctctagcaa agaacaaaaa gaaaaaaagg 9180

aacaacaaac aagccaaccc ataaccaagc ccaaagaatc agagtttcac tggcattcaa 9240

cagttgtgaa ttcggaaagt cacagacggc agaacctgga gccatacaca aggatcagaa 9300

acccctgcac tgttcctacc aacagctaac gtgaatttga gggcaatcaa gagaaaaaca 9360

aggtatggtg ggtaaatcga ggccttcatc cagccaaata agcttagatt tgtggttaac 9420

agactcccag cgttcaaaat cccatctcac ccatttacaa ggtactcaat ttccacctgt 9480

gtgaaaaggc actaaaggga aacctgcctc ctgaggctcc tgtgagaaga gagatgatgc 9540

actgaagtgc ttagcacagg gcctggccgg cagcaaacac tcaataaacc ataggtatta 9600

gaatcattta catatatatt taataaataa catgccaggc tgatttgttt ctgcgtaaaa 9660

atgaaaggac aatgaagcca cccggcccct accactttga ctccctctcg ccctcctcac 9720

cgtcagtcca cacagcataa ttaggatcaa aactgaatcc acctgatccc tggacacagc 9780

tcagacactc cttgccacta ataccacagg aagcaaggtg gcaactccta agcatcagaa 9840

taaattcagt taaaaaacaa aaatccgctc atctccccct ggatgaaatt catgtttctg 9900

gaagaaaaaa gaaaaaaaaa aaacggacct agccattctg aacaaagcca cacctaataa 9960

cattcccaga aattggtttc actttctttt atcccctctt taattagtca cttttctgct 10020

atacctcagg ggaggctgtg ctccagggac caagaacgga agcctgagtg ggcaaacact 10080

taccctcctc ataggtgccc acgaaatccc caggctcccc gcctccccac tctgcaccgt 10140

ctcctctcca gcctggattc cagtccaggc aggaactcat gctccagcaa ggagtacccc 10200

ttgccactgc agaccaccac agaatgagag aggccaaaga taagtgtttc tcaaaacgtg 10260

tctgaacacc gcttgcaata ggtgttgcaa gagcccttcc agggagccca ccctcaatca 10320

aaatctctag ggctgaggcc taggagcctg ggcttcccag gcagttctta tccatgctga 10380

agtttgagag ctgataccac ctaacccttc agaacatcta atactaagta ccagtaatgg 10440

aacccctcca gatgacaaag gtggagctcc acagagcaag ccggatcttc taaatcatga 10500

cagtgggttt acaaatgttc ccaaagcagg caattaatgc tcgtggtaga agaaagctag 10560

gtgacagcag gggtgggagg aggaaacatc ctaattcaat ttaaaaatca caaattctga 10620

agcctgagtc ttcttcaaaa catgttctca atcatgtctc cttattctga agcctacaca 10680

actgactggg aacacatctt tgttttgtag aaacccagct catggcacct ggagctgatg 10740

aatggccctg gtgctgactg cccagaaacc aatccggaaa ccaggcttcc cacagaagag 10800

gcagctggag agccaagcac tcttggacta cagtcctagg ctggagctgc caatacaggc 10860

tctgcccagc taatcttctc tgagcctgca aatattaaac ctgacataca gactcaagtg 10920

aatccagaaa acaggctcac agggcagctg aaaattccaa gtgcctaagg tataggcagg 10980

gcggcttcat gggcattcaa ccagtacaga tgcacagggt cccatgctca gaagggcctg 11040

cttggcttaa tgctctgctg tagctgtctt gaaattttta ataattttat ctttgaactt 11100

gtgttttgca agtgagatcc agtgcgacag tggagcatgt gtgcgcagag gagacaggaa 11160

caacaaccgg gatgtcatgc gggcgcactg gggctccttg tggccccagt gcacagaatt 11220

ctggtggacc caccatgtgt gggagctcag tgagactcaa agtaagtgca aggtaagtgt 11280

cttatatcta cgactgagta agggggaacg ctgacagccc tgaggggtta cacctaccat 11340

ttcaaccaga acttgccaga tgcaagaaga tgacaatgag acaatggcat ccaaagaaac 11400

atgaacggcc caggaaccct atcatagcct tcttcctcat gttatttccc tggataagcc 11460

aaccactgac actgatcatg gtaacctagg acagagacag actgggcaac ccatagttcc 11520

tttcctttca ggccctcctc acacatcgta cgctgaaggt ggagcacact gggaaaatgt 11580

gcatgcatca agaagaaaaa tgaaaactga ttttgtgcaa catttccact gttcttggaa 11640

gaatgaaata aatgcatatg agctatgaaa 11670

<210> 7

<211> 1280

<212> PRT

<213> Homo sapiens

<400> 7

Met Asp Leu Glu Gly Asp Arg Asn Gly Gly Ala Lys Lys Lys Asn Phe

1 5 10 15

Phe Lys Leu Asn Asn Lys Ser Glu Lys Asp Lys Lys Glu Lys Lys Pro

20 25 30

Thr Val Ser Val Phe Ser Met Phe Arg Tyr Ser Asn Trp Leu Asp Lys

35 40 45

Leu Tyr Met Val Val Gly Thr Leu Ala Ala Ile Ile His Gly Ala Gly

50 55 60

Leu Pro Leu Met Met Leu Val Phe Gly Glu Met Thr Asp Ile Phe Ala

65 70 75 80

Asn Ala Gly Asn Leu Glu Asp Leu Met Ser Asn Ile Thr Asn Arg Ser

85 90 95

Asp Ile Asn Asp Thr Gly Phe Phe Met Asn Leu Glu Glu Asp Met Thr

100 105 110

Arg Tyr Ala Tyr Tyr Tyr Ser Gly Ile Gly Ala Gly Val Leu Val Ala

115 120 125

Ala Tyr Ile Gln Val Ser Phe Trp Cys Leu Ala Ala Gly Arg Gln Ile

130 135 140

His Lys Ile Arg Lys Gln Phe Phe His Ala Ile Met Arg Gln Glu Ile

145 150 155 160

Gly Trp Phe Asp Val His Asp Val Gly Glu Leu Asn Thr Arg Leu Thr

165 170 175

Asp Asp Val Ser Lys Ile Asn Glu Gly Ile Gly Asp Lys Ile Gly Met

180 185 190

Phe Phe Gln Ser Met Ala Thr Phe Phe Thr Gly Phe Ile Val Gly Phe

195 200 205

Thr Arg Gly Trp Lys Leu Thr Leu Val Ile Leu Ala Ile Ser Pro Val

210 215 220

Leu Gly Leu Ser Ala Ala Val Trp Ala Lys Ile Leu Ser Ser Phe Thr

225 230 235 240

Asp Lys Glu Leu Leu Ala Tyr Ala Lys Ala Gly Ala Val Ala Glu Glu

245 250 255

Val Leu Ala Ala Ile Arg Thr Val Ile Ala Phe Gly Gly Gln Lys Lys

260 265 270

Glu Leu Glu Arg Tyr Asn Lys Asn Leu Glu Glu Ala Lys Arg Ile Gly

275 280 285

Ile Lys Lys Ala Ile Thr Ala Asn Ile Ser Ile Gly Ala Ala Phe Leu

290 295 300

Leu Ile Tyr Ala Ser Tyr Ala Leu Ala Phe Trp Tyr Gly Thr Thr Leu

305 310 315 320

Val Leu Ser Gly Glu Tyr Ser Ile Gly Gln Val Leu Thr Val Phe Phe

325 330 335

Ser Val Leu Ile Gly Ala Phe Ser Val Gly Gln Ala Ser Pro Ser Ile

340 345 350

Glu Ala Phe Ala Asn Ala Arg Gly Ala Ala Tyr Glu Ile Phe Lys Ile

355 360 365

Ile Asp Asn Lys Pro Ser Ile Asp Ser Tyr Ser Lys Ser Gly His Lys

370 375 380

Pro Asp Asn Ile Lys Gly Asn Leu Glu Phe Arg Asn Val His Phe Ser

385 390 395 400

Tyr Pro Ser Arg Lys Glu Val Lys Ile Leu Lys Gly Leu Asn Leu Lys

405 410 415

Val Gln Ser Gly Gln Thr Val Ala Leu Val Gly Asn Ser Gly Cys Gly

420 425 430

Lys Ser Thr Thr Val Gln Leu Met Gln Arg Leu Tyr Asp Pro Thr Glu

435 440 445

Gly Met Val Ser Val Asp Gly Gln Asp Ile Arg Thr Ile Asn Val Arg

450 455 460

Phe Leu Arg Glu Ile Ile Gly Val Val Ser Gln Glu Pro Val Leu Phe

465 470 475 480

Ala Thr Thr Ile Ala Glu Asn Ile Arg Tyr Gly Arg Glu Asn Val Thr

485 490 495

Met Asp Glu Ile Glu Lys Ala Val Lys Glu Ala Asn Ala Tyr Asp Phe

500 505 510

Ile Met Lys Leu Pro His Lys Phe Asp Thr Leu Val Gly Glu Arg Gly

515 520 525

Ala Gln Leu Ser Gly Gly Gln Lys Gln Arg Ile Ala Ile Ala Arg Ala

530 535 540

Leu Val Arg Asn Pro Lys Ile Leu Leu Leu Asp Glu Ala Thr Ser Ala

545 550 555 560

Leu Asp Thr Glu Ser Glu Ala Val Val Gln Val Ala Leu Asp Lys Ala

565 570 575

Arg Lys Gly Arg Thr Thr Ile Val Ile Ala His Arg Leu Ser Thr Val

580 585 590

Arg Asn Ala Asp Val Ile Ala Gly Phe Asp Asp Gly Val Ile Val Glu

595 600 605

Lys Gly Asn His Asp Glu Leu Met Lys Glu Lys Gly Ile Tyr Phe Lys

610 615 620

Leu Val Thr Met Gln Thr Ala Gly Asn Glu Val Glu Leu Glu Asn Ala

625 630 635 640

Ala Asp Glu Ser Lys Ser Glu Ile Asp Ala Leu Glu Met Ser Ser Asn

645 650 655

Asp Ser Arg Ser Ser Leu Ile Arg Lys Arg Ser Thr Arg Arg Ser Val

660 665 670

Arg Gly Ser Gln Ala Gln Asp Arg Lys Leu Ser Thr Lys Glu Ala Leu

675 680 685

Asp Glu Ser Ile Pro Pro Val Ser Phe Trp Arg Ile Met Lys Leu Asn

690 695 700

Leu Thr Glu Trp Pro Tyr Phe Val Val Gly Val Phe Cys Ala Ile Ile

705 710 715 720

Asn Gly Gly Leu Gln Pro Ala Phe Ala Ile Ile Phe Ser Lys Ile Ile

725 730 735

Gly Val Phe Thr Arg Ile Asp Asp Pro Glu Thr Lys Arg Gln Asn Ser

740 745 750

Asn Leu Phe Ser Leu Leu Phe Leu Ala Leu Gly Ile Ile Ser Phe Ile

755 760 765

Thr Phe Phe Leu Gln Gly Phe Thr Phe Gly Lys Ala Gly Glu Ile Leu

770 775 780

Thr Lys Arg Leu Arg Tyr Met Val Phe Arg Ser Met Leu Arg Gln Asp

785 790 795 800

Val Ser Trp Phe Asp Asp Pro Lys Asn Thr Thr Gly Ala Leu Thr Thr

805 810 815

Arg Leu Ala Asn Asp Ala Ala Gln Val Lys Gly Ala Ile Gly Ser Arg

820 825 830

Leu Ala Val Ile Thr Gln Asn Ile Ala Asn Leu Gly Thr Gly Ile Ile

835 840 845

Ile Ser Phe Ile Tyr Gly Trp Gln Leu Thr Leu Leu Leu Leu Ala Ile

850 855 860

Val Pro Ile Ile Ala Ile Ala Gly Val Val Glu Met Lys Met Leu Ser

865 870 875 880

Gly Gln Ala Leu Lys Asp Lys Lys Glu Leu Glu Gly Ser Gly Lys Ile

885 890 895

Ala Thr Glu Ala Ile Glu Asn Phe Arg Thr Val Val Ser Leu Thr Gln

900 905 910

Glu Gln Lys Phe Glu His Met Tyr Ala Gln Ser Leu Gln Val Pro Tyr

915 920 925

Arg Asn Ser Leu Arg Lys Ala His Ile Phe Gly Ile Thr Phe Ser Phe

930 935 940

Thr Gln Ala Met Met Tyr Phe Ser Tyr Ala Gly Cys Phe Arg Phe Gly

945 950 955 960

Ala Tyr Leu Val Ala His Lys Leu Met Ser Phe Glu Asp Val Leu Leu

965 970 975

Val Phe Ser Ala Val Val Phe Gly Ala Met Ala Val Gly Gln Val Ser

980 985 990

Ser Phe Ala Pro Asp Tyr Ala Lys Ala Lys Ile Ser Ala Ala His Ile

995 1000 1005

Ile Met Ile Ile Glu Lys Thr Pro Leu Ile Asp Ser Tyr Ser Thr

1010 1015 1020

Glu Gly Leu Met Pro Asn Thr Leu Glu Gly Asn Val Thr Phe Gly

1025 1030 1035

Glu Val Val Phe Asn Tyr Pro Thr Arg Pro Asp Ile Pro Val Leu

1040 1045 1050

Gln Gly Leu Ser Leu Glu Val Lys Lys Gly Gln Thr Leu Ala Leu

1055 1060 1065

Val Gly Ser Ser Gly Cys Gly Lys Ser Thr Val Val Gln Leu Leu

1070 1075 1080

Glu Arg Phe Tyr Asp Pro Leu Ala Gly Lys Val Leu Leu Asp Gly

1085 1090 1095

Lys Glu Ile Lys Arg Leu Asn Val Gln Trp Leu Arg Ala His Leu

1100 1105 1110

Gly Ile Val Ser Gln Glu Pro Ile Leu Phe Asp Cys Ser Ile Ala

1115 1120 1125

Glu Asn Ile Ala Tyr Gly Asp Asn Ser Arg Val Val Ser Gln Glu

1130 1135 1140

Glu Ile Val Arg Ala Ala Lys Glu Ala Asn Ile His Ala Phe Ile

1145 1150 1155

Glu Ser Leu Pro Asn Lys Tyr Ser Thr Lys Val Gly Asp Lys Gly

1160 1165 1170

Thr Gln Leu Ser Gly Gly Gln Lys Gln Arg Ile Ala Ile Ala Arg

1175 1180 1185

Ala Leu Val Arg Gln Pro His Ile Leu Leu Leu Asp Glu Ala Thr

1190 1195 1200

Ser Ala Leu Asp Thr Glu Ser Glu Lys Val Val Gln Glu Ala Leu

1205 1210 1215

Asp Lys Ala Arg Glu Gly Arg Thr Cys Ile Val Ile Ala His Arg

1220 1225 1230

Leu Ser Thr Ile Gln Asn Ala Asp Leu Ile Val Val Phe Gln Asn

1235 1240 1245

Gly Arg Val Lys Glu His Gly Thr His Gln Gln Leu Leu Ala Gln

1250 1255 1260

Lys Gly Ile Tyr Phe Ser Met Val Ser Val Gln Ala Gly Thr Lys

1265 1270 1275

Arg Gln

1280

<210> 8

<211> 764

<212> PRT

<213> Homo sapiens

<400> 8

Met Ile Glu Pro Phe Gly Asn Gln Tyr Ile Val Ala Arg Pro Val Tyr

1 5 10 15

Ser Thr Asn Ala Phe Glu Glu Asn His Lys Lys Thr Gly Arg His His

20 25 30

Lys Thr Phe Leu Asp His Leu Lys Val Cys Cys Ser Cys Ser Pro Gln

35 40 45

Lys Ala Lys Arg Ile Val Leu Ser Leu Phe Pro Ile Ala Ser Trp Leu

50 55 60

Pro Ala Tyr Arg Leu Lys Glu Trp Leu Leu Ser Asp Ile Val Ser Gly

65 70 75 80

Ile Ser Thr Gly Ile Val Ala Val Leu Gln Gly Leu Ala Phe Ala Leu

85 90 95

Leu Val Asp Ile Pro Pro Val Tyr Gly Leu Tyr Ala Ser Phe Phe Pro

100 105 110

Ala Ile Ile Tyr Leu Phe Phe Gly Thr Ser Arg His Ile Ser Val Gly

115 120 125

Pro Phe Pro Ile Leu Ser Met Met Val Gly Leu Ala Val Ser Gly Ala

130 135 140

Val Ser Lys Ala Val Pro Asp Arg Asn Ala Thr Thr Leu Gly Leu Pro

145 150 155 160

Asn Asn Ser Asn Asn Ser Ser Leu Leu Asp Asp Glu Arg Val Arg Val

165 170 175

Ala Ala Ala Ala Ser Val Thr Val Leu Ser Gly Ile Ile Gln Leu Ala

180 185 190

Phe Gly Ile Leu Arg Ile Gly Phe Val Val Ile Tyr Leu Ser Glu Ser

195 200 205

Leu Ile Ser Gly Phe Thr Thr Ala Ala Ala Val His Val Leu Val Ser

210 215 220

Gln Leu Lys Phe Ile Phe Gln Leu Thr Val Pro Ser His Thr Asp Pro

225 230 235 240

Val Ser Ile Phe Lys Val Leu Tyr Ser Val Phe Ser Gln Ile Glu Lys

245 250 255

Thr Asn Ile Ala Asp Leu Val Thr Ala Leu Ile Val Leu Leu Val Val

260 265 270

Ser Ile Val Lys Glu Ile Asn Gln Arg Phe Lys Asp Lys Leu Pro Val

275 280 285

Pro Ile Pro Ile Glu Phe Ile Met Thr Val Ile Ala Ala Gly Val Ser

290 295 300

Tyr Gly Cys Asp Phe Lys Asn Arg Phe Lys Val Ala Val Val Gly Asp

305 310 315 320

Met Asn Pro Gly Phe Gln Pro Pro Ile Thr Pro Asp Val Glu Thr Phe

325 330 335

Gln Asn Thr Val Gly Asp Cys Phe Gly Ile Ala Met Val Ala Phe Ala

340 345 350

Val Ala Phe Ser Val Ala Ser Val Tyr Ser Leu Lys Tyr Asp Tyr Pro

355 360 365

Leu Asp Gly Asn Gln Glu Leu Ile Ala Leu Gly Leu Gly Asn Ile Val

370 375 380

Cys Gly Val Phe Arg Gly Phe Ala Gly Ser Thr Ala Leu Ser Arg Ser

385 390 395 400

Ala Val Gln Glu Ser Thr Gly Gly Lys Thr Gln Ile Ala Gly Leu Ile

405 410 415

Gly Ala Ile Ile Val Leu Ile Val Val Leu Ala Ile Gly Phe Leu Leu

420 425 430

Ala Pro Leu Gln Lys Ser Val Leu Ala Ala Leu Ala Leu Gly Asn Leu

435 440 445

Lys Gly Met Leu Met Gln Phe Ala Glu Ile Gly Arg Leu Trp Arg Lys

450 455 460

Asp Lys Tyr Asp Cys Leu Ile Trp Ile Met Thr Phe Ile Phe Thr Ile

465 470 475 480

Val Leu Gly Leu Gly Leu Gly Leu Ala Ala Ser Val Ala Phe Gln Leu

485 490 495

Leu Thr Ile Val Phe Arg Thr Gln Phe Pro Lys Cys Ser Thr Leu Ala

500 505 510

Asn Ile Gly Arg Thr Asn Ile Tyr Lys Asn Lys Lys Asp Tyr Tyr Asp

515 520 525

Met Tyr Glu Pro Glu Gly Val Lys Ile Phe Arg Cys Pro Ser Pro Ile

530 535 540

Tyr Phe Ala Asn Ile Gly Phe Phe Arg Arg Lys Leu Ile Asp Ala Val

545 550 555 560

Gly Phe Ser Pro Leu Arg Ile Leu Arg Lys Arg Asn Lys Ala Leu Arg

565 570 575

Lys Ile Arg Lys Leu Gln Lys Gln Gly Leu Leu Gln Val Thr Pro Lys

580 585 590

Gly Phe Ile Cys Thr Val Asp Thr Ile Lys Asp Ser Asp Glu Glu Leu

595 600 605

Asp Asn Asn Gln Ile Glu Val Leu Asp Gln Pro Ile Asn Thr Thr Asp

610 615 620

Leu Pro Phe His Ile Asp Trp Asn Asp Asp Leu Pro Leu Asn Ile Glu

625 630 635 640

Val Pro Lys Ile Ser Leu His Ser Leu Ile Leu Asp Phe Ser Ala Val

645 650 655

Ser Phe Leu Asp Val Ser Ser Val Arg Gly Leu Lys Ser Ile Leu Gln

660 665 670

Glu Phe Ile Arg Ile Lys Val Asp Val Tyr Ile Val Gly Thr Asp Asp

675 680 685

Asp Phe Ile Glu Lys Leu Asn Arg Tyr Glu Phe Phe Asp Gly Glu Val

690 695 700

Lys Ser Ser Ile Phe Phe Leu Thr Ile His Asp Ala Val Leu His Ile

705 710 715 720

Leu Met Lys Lys Asp Tyr Ser Thr Ser Lys Phe Asn Pro Ser Gln Glu

725 730 735

Lys Asp Gly Lys Ile Asp Phe Thr Ile Asn Thr Asn Gly Gly Leu Arg

740 745 750

Asn Arg Val Tyr Glu Val Pro Val Glu Thr Lys Phe

755 760

<210> 9

<211> 103

<212> PRT

<213> Homo sapiens

<400> 9

Met Ser Gly Arg Gly Lys Gly Gly Lys Gly Leu Gly Lys Gly Gly Ala

1 5 10 15

Lys Arg His Arg Lys Val Leu Arg Asp Asn Ile Gln Gly Ile Thr Lys

20 25 30

Pro Ala Ile Arg Arg Leu Ala Arg Arg Gly Gly Val Lys Arg Ile Ser

35 40 45

Gly Leu Ile Tyr Glu Glu Thr Arg Gly Val Leu Lys Val Phe Leu Glu

50 55 60

Asn Val Ile Arg Asp Ala Val Thr Tyr Thr Glu His Ala Lys Arg Lys

65 70 75 80

Thr Val Thr Ala Met Asp Val Val Tyr Ala Leu Lys Arg Gln Gly Arg

85 90 95

Thr Leu Tyr Gly Phe Gly Gly

100

<210> 10

<211> 463

<212> PRT

<213> Homo sapiens

<400> 10

Met Ala Thr Val Thr Ala Thr Thr Lys Val Pro Glu Ile Arg Asp Val

1 5 10 15

Thr Arg Ile Glu Arg Ile Gly Ala His Ser His Ile Arg Gly Leu Gly

20 25 30

Leu Asp Asp Ala Leu Glu Pro Arg Gln Ala Ser Gln Gly Met Val Gly

35 40 45

Gln Leu Ala Ala Arg Arg Ala Ala Gly Val Val Leu Glu Met Ile Arg

50 55 60

Glu Gly Lys Ile Ala Gly Arg Ala Val Leu Ile Ala Gly Gln Pro Gly

65 70 75 80

Thr Gly Lys Thr Ala Ile Ala Met Gly Met Ala Gln Ala Leu Gly Pro

85 90 95

Asp Thr Pro Phe Thr Ala Ile Ala Gly Ser Glu Ile Phe Ser Leu Glu

100 105 110

Met Ser Lys Thr Glu Ala Leu Thr Gln Ala Phe Arg Arg Ser Ile Gly

115 120 125

Val Arg Ile Lys Glu Glu Thr Glu Ile Ile Glu Gly Glu Val Val Glu

130 135 140

Ile Gln Ile Asp Arg Pro Ala Thr Gly Thr Gly Ser Lys Val Gly Lys

145 150 155 160

Leu Thr Leu Lys Thr Thr Glu Met Glu Thr Ile Tyr Asp Leu Gly Thr

165 170 175

Lys Met Ile Glu Ser Leu Thr Lys Asp Lys Val Gln Ala Gly Asp Val

180 185 190

Ile Thr Ile Asp Lys Ala Thr Gly Lys Ile Ser Lys Leu Gly Arg Ser

195 200 205

Phe Thr Arg Ala Arg Asp Tyr Asp Ala Met Gly Ser Gln Thr Lys Phe

210 215 220

Val Gln Cys Pro Asp Gly Glu Leu Gln Lys Arg Lys Glu Val Val His

225 230 235 240

Thr Val Ser Leu His Glu Ile Asp Val Ile Asn Ser Arg Thr Gln Gly

245 250 255

Phe Leu Ala Leu Phe Ser Gly Asp Thr Gly Glu Ile Lys Ser Glu Val

260 265 270

Arg Glu Gln Ile Asn Ala Lys Val Ala Glu Trp Arg Glu Glu Gly Lys

275 280 285

Ala Glu Ile Ile Pro Gly Val Leu Phe Ile Asp Glu Val His Met Leu

290 295 300

Asp Ile Glu Ser Phe Ser Phe Leu Asn Arg Ala Leu Glu Ser Asp Met

305 310 315 320

Ala Pro Val Leu Ile Met Ala Thr Asn Arg Gly Ile Thr Arg Ile Arg

325 330 335

Gly Thr Ser Tyr Gln Ser Pro His Gly Ile Pro Ile Asp Leu Leu Asp

340 345 350

Arg Leu Leu Ile Val Ser Thr Thr Pro Tyr Ser Glu Lys Asp Thr Lys

355 360 365

Gln Ile Leu Arg Ile Arg Cys Glu Glu Glu Asp Val Glu Met Ser Glu

370 375 380

Asp Ala Tyr Thr Val Leu Thr Arg Ile Gly Leu Glu Thr Ser Leu Arg

385 390 395 400

Tyr Ala Ile Gln Leu Ile Thr Ala Ala Ser Leu Val Cys Arg Lys Arg

405 410 415

Lys Gly Thr Glu Val Gln Val Asp Asp Ile Lys Arg Val Tyr Ser Leu

420 425 430

Phe Leu Asp Glu Ser Arg Ser Thr Gln Tyr Met Lys Glu Tyr Gln Asp

435 440 445

Ala Phe Leu Phe Asn Glu Leu Lys Gly Glu Thr Met Asp Thr Ser

450 455 460

<210> 11

<211> 129

<212> PRT

<213> Homo sapiens

<400> 11

Met Ser Gly Arg Gly Lys Gln Gly Gly Lys Ala Arg Ala Lys Ala Lys

1 5 10 15

Ser Arg Ser Ser Arg Ala Gly Leu Gln Phe Pro Val Gly Arg Val His

20 25 30

Arg Leu Leu Arg Lys Gly Asn Tyr Ala Glu Arg Val Gly Ala Gly Ala

35 40 45

Pro Val Tyr Met Ala Ala Val Leu Glu Tyr Leu Thr Ala Glu Ile Leu

50 55 60

Glu Leu Ala Gly Asn Ala Ala Arg Asp Asn Lys Lys Thr Arg Ile Ile

65 70 75 80

Pro Arg His Leu Gln Leu Ala Ile Arg Asn Asp Glu Glu Leu Asn Lys

85 90 95

Leu Leu Gly Lys Val Thr Ile Ala Gln Gly Gly Val Leu Pro Asn Ile

100 105 110

Gln Ala Val Leu Leu Pro Lys Lys Thr Glu Ser His Lys Ala Lys Ser

115 120 125

Lys

Claims

1.一种组合物，用于预测癌症患者对抗癌疗法的疗效反应或抗癌疗法的预后、或确定抗癌疗法前的新辅助化疗的目标患者，该组合物包括：

一种试剂，其测量第一分子亚型和第二分子亚型的至少一种基因或由其编码的蛋白的表达水平，

其中第一分子亚型包含一种或多种选自PMP2,AGTR1,PLCXD3,TCEAL6,ANKRD1,和ARHGAP26-AS1的基因，和

第二分子亚型包括一种或多种选自PGP,SLC26A3,HIST1H4C,RUVBL2,RAB19,HIST2H2AC,和SNORD69的基因。

2.根据权利要求1所述的组合物，其特征在于，第一分子亚型还包括一或多种选自下组的基因：AADACL2,ABCA6,ABCA8,ABCA9,ABCB5,ABI3BP,ACADL,ACSM5,ACTG2,ADAMTS9-AS1,ADAMTS9-AS2,ADAMTSL3,ADCYAP1R1,ADGRB3,ADH1B,ADIPOQ,ADRA1A,AFF3,AGTR1,AICDA,ALB,ANGPTL1,ANGPTL5,ANGPTL7,ANK2,ANKS1B,ANXA8L1,APOA2,APOB,APOC3,AQP4,AQP8,ARPP21,ART4,ASB5,ASPA,ASTN1,ATCAY,ATP1A2,ATP2B2,ATP2B3,AVPR1B,B3GALT5-AS1,BCHE,BEST4,BHMT2,BLOC1S5-TXNDC5,BMP3,BRINP3,BVES,BVES-AS1,C14orf180,C1QTNF7,C7,C8orf88,CA1,CA2,CA7,CACNA2D1,CADM2,CADM3,CALN1,CARTPT,CASQ2,CAVIN2,CCBE1,CCDC144B,CCDC158,CCDC160,CCDC169,CCN5,CD300LG,CDH10,CDH19,CDKN2B-AS1,CDO1,CHRDL1,CHRM2,CHST9,CIDEA,CILP,CLCA4,CLCNKB,CLDN8,CLEC3B,CLEC4M,CLVS2,CMA1,CNGA3,CNN1,CNR1,CNTN1,CNTN2,CNTNAP4,COL19A1,CP,CPEB1,CPXM2,CR2,CRP,CTNNA3,CTSG,CYP1B1,DAO,DCLK1,DDR2,DES,DHRS7C,DIRAS2,DPP6,DPT,EBF2,ECRG4,ELAVL4,EPHA5,EPHA6,EPHA7,ERICH3,EVX2,FABP4,FAM106A,FAM133A,FAM135B,FAM180B,FDCSP,FGF10,FGF13-AS1,FGF14,FGFBP2,FGG,FGL1,FHL1,FILIP1,FLNC,FMO2,FRMD6-AS2,FRMPD4,FUT9,GABRA5,GABRG2,GALR1,GAP43,GAS1RR,GC,GCG,GDF6,GFRA1,GNAO1,GPM6A,GPR119,GPR12,GPRACR,GRIA2,GRIN2A,GTF2IP1,GUCA2B,HAND1,HAND2,HAND2-AS1,HEPACAM,HP,HPCAL4,HRG,HRK,HSPB8,HTR2B,IGSF10,IGSF11,IRX6,ISM1,KCNA1,KCNB1,KCNC2,KCNK2,KCNMA1,KCNMB1,KCNQ5,KCNT2,KCTD8,KERA,KHDRBS2,KIAA0408,KIF1A,KRT222,KRT24,KRTAP13-2,LCN10,LDB3,LEP,LGI1,LIFR,LINC00504,LINC00507,LINC00682,LINC00924,LINC01266,LINC01352,LINC01474,LINC01505,LINC01697,LINC01798,LINC01829,LINC02015,LINC02023,LINC02185,LINC02268,LINC02408,LINC02544,LIX1,LMO3,LMOD1,LOC100506289,LOC101928731,LOC102724050,LOC107986321,LOC283856,LOC440434,LOC729558,LONRF2,LRAT,LRCH2,LRRC3B,LRRC4C,LRRTM4,LVRN,LYVE1,MAB21L1,MAB21L2,MAGEE2,MAMDC2,MAPK4,MASP1,MEF2C-AS1,MEOX2,METTL24,MFAP5,MGAT4C,MGP,MICU3,MIR133A1HG,MIR8071-1,MMRN1,MORN5,MPPED2,MRGPRE,MS4A1,MS4A12,MSRB3,MUSK,MYH11,MYH2,MYLK,MYO3A,MYOC,MYOCD,MYOM1,MYOT,MYT1L,NALCN,NAP1L2,NBEA,NECAB1,NEFL,NEFM,NEGR1,NETO1,NEUROD1,NEXMIF,NEXN,NGB,NIBAN1,NLGN1,NOS1,NOVA1,NPR3,NPTX1,NPY2R,NRG3,NRK,NRSN1,NRXN1,NSG2,NTNG1,NTRK3,NUDT10,OGN,OLFM3,OMD,OTOP2,OTOP3,P2RX2,P2RY12,PAK3,PAPPA2,PCDH10,PCDH11X,PCDH9,PCOLCE2,PCP4L1,PCSK2,PDZRN4,PEG3,PENK,PGM5,PGM5-AS1,PGM5P4-AS1,PGR,PHOX2B,PI16,PIK3C2G,PIRT,PKHD1L1,PLAAT5,PLCXD3,PLD5,PLIN1,PLIN4,PLN,PLP1,PMP2,POPDC2,POU3F4,PPP1R1A,PRDM6,PRELP,PRG4,PRIMA1,PROKR1,PTCHD1,PTGIS,PTPRQ,PTPRZ1,PYGM,PYY,RANBP3L,RBFOX3,RBM20,RELN,RERGL,RGS13,RGS22,RIC3,RIMS4,RNF150,RNF180,RORB,RSPO2,SCARA5,SCGN,SCN2B,SCN7A,SCN9A,SCNN1G,SCRG1,SEMA3E,SERTM1,SERTM2,SFRP1,SFRP2,SFTPA1,SGCG,SHISAL1,SLC13A5,SLC17A8,SLC30A10,SLC4A4,SLC5A7,SLC6A2,SLC7A14,SLIT2,SLITRK2,SLITRK3,SLITRK4,SMIM28,SMYD1,SNAP25,SNAP91,SORCS1,SORCS3,SPHKAP,SPIB,SPOCK3,SST,ST8SIA3,STMN2,STMN4,STON1-GTF2A1L,STUM,SV2B,SYNM,SYNPO2,SYT10,SYT4,SYT6,TACR1,TAFA4,TCEAL2,TCEAL5,TCF23,TENM1,THBS4,TLL1,TMEFF2,TMEM100,TMEM35A,TMIGD1,TMOD1,TNNT3,TNS1,TNXB,TRARG1,TRDN,UGT2B10,UGT2B4,UNC80,VEGFD,VGLL3,VIT,VSTM2A,VXN,WSCD2,XKR4,ZBTB16,ZDHHC22,ZFHX4,ZMAT4,ZNF385B,ZNF676,和ZNF728。

3.根据权利要求1所述的组合物，其特征在于，第二分子亚型还包括一或多种选自下组的基因：ADAT3,ANP32D,BHLHA9,BOD1L2,C4orf48,CCDC85B,CDH16,CLMAT3,CSNK1A1L,CTU1,DBET,DDC-AS1,DEFA5,EIF3IP1,FAM173A,FEZF2,FOXI3,FRMD8P1,GALR3,GJD3,GPR25,HBA1,HES4,HIST1H4A,HIST1H4L,HLA-L,IGFBP7-AS1,ITLN2,KCNE1B,LCN15,LKAAEAR1,LOC101927795,LOC101927972,LOC101928372,LOC344967,LRRC26,MAGEA10,MESP1,MIR203A,MIR324,MIR3661,MIR4449,MIR4479,MIR4665,MIR4737,MIR4767,MIR6807,MIR6858,MIR6891,MIR8075,NACA2,NOXO1,ONECUT3,PCSK1N,PDF,PITPNM2-AS1,PNMA5,PRR7,PRSS2,PRSS56,PTGER1,PTTG3P,REG3A,RNA5S9,RNU4-1,RNU5A-1,RNU5B-1,RNU5E-1,RNU6ATAC,RNY1,RPL29P2,RPRML,SBF1P1,SHISAL2B,SKOR2,SLC32A1,SMARCA5-AS1,SMCR5,SNHG25,SNORA36A,SNORD30,SNORD38A,SNORD3B-2,SNORD41,SNORD48,TMEM160,TMEM238,TPGS1,TRAPPC5,UBE2NL,WBP11P1,和ZAR1。

4.根据权利要求1所述的组合物，其特征在于，所述抗癌疗法是化疗、放疗、手术或其组合。

5.根据权利要求1所述的组合物，其特征在于，所述抗癌疗法是标准新辅助放化疗或标准新辅助放化疗之后的手术治疗。

6.根据权利要求1所述的组合物，其特征在于，所述癌症是直肠癌。

7.一种试剂盒，用于预测癌症患者对抗癌疗法的疗效反应或抗癌疗法的预后、或确定抗癌疗法前的新辅助化疗的目标患者，该试剂盒包括：

权利要求1至6中任一项所述的组合物。

8.根据权利要求7所述的试剂盒，其特征在于，所述试剂盒是RT-PCR试剂盒、DNA芯片试剂盒、ELISA试剂盒、蛋白芯片试剂盒、快速试剂盒或多反应监测(MRM)试剂盒。

9.一种生物标志物组合物，用于预测癌症患者对抗癌疗法的疗效反应或抗癌疗法的预后、或确定抗癌疗法前的新辅助化疗的目标患者，该组合物包括：

第一分子亚型或第二分子亚型中的至少一种基因或由其编码的蛋白，

其中第一分子亚型包含一种或多种选自PMP2,AGTR1,PLCXD3,TCEAL6,ANKRD1,和ARHGAP26-AS1的基因，且

10.一种提供信息的方法，用于预测癌症患者对抗癌疗法的疗效反应或抗癌疗法的预后、或确定抗癌疗法前的新辅助化疗的目标患者，该方法包括：

测量从目标受试者的生物样品中分离的第一分子亚型或第二分子亚型的至少一种基因或由其编码的蛋白的表达水平，

11.根据权利要求10所述的方法，其特征在于，第一分子亚型还包括一或多种选自下组的基因：AADACL2,ABCA6,ABCA8,ABCA9,ABCB5,ABI3BP,ACADL,ACSM5,ACTG2,ADAMTS9-AS1,ADAMTS9-AS2,ADAMTSL3,ADCYAP1R1,ADGRB3,ADH1B,ADIPOQ,ADRA1A,AFF3,AGTR1,AICDA,ALB,ANGPTL1,ANGPTL5,ANGPTL7,ANK2,ANKS1B,ANXA8L1,APOA2,APOB,APOC3,AQP4,AQP8,ARPP21,ART4,ASB5,ASPA,ASTN1,ATCAY,ATP1A2,ATP2B2,ATP2B3,AVPR1B,B3GALT5-AS1,BCHE,BEST4,BHMT2,BLOC1S5-TXNDC5,BMP3,BRINP3,BVES,BVES-AS1,C14orf180,C1QTNF7,C7,C8orf88,CA1,CA2,CA7,CACNA2D1,CADM2,CADM3,CALN1,CARTPT,CASQ2,CAVIN2,CCBE1,CCDC144B,CCDC158,CCDC160,CCDC169,CCN5,CD300LG,CDH10,CDH19,CDKN2B-AS1,CDO1,CHRDL1,CHRM2,CHST9,CIDEA,CILP,CLCA4,CLCNKB,CLDN8,CLEC3B,CLEC4M,CLVS2,CMA1,CNGA3,CNN1,CNR1,CNTN1,CNTN2,CNTNAP4,COL19A1,CP,CPEB1,CPXM2,CR2,CRP,CTNNA3,CTSG,CYP1B1,DAO,DCLK1,DDR2,DES,DHRS7C,DIRAS2,DPP6,DPT,EBF2,ECRG4,ELAVL4,EPHA5,EPHA6,EPHA7,ERICH3,EVX2,FABP4,FAM106A,FAM133A,FAM135B,FAM180B,FDCSP,FGF10,FGF13-AS1,FGF14,FGFBP2,FGG,FGL1,FHL1,FILIP1,FLNC,FMO2,FRMD6-AS2,FRMPD4,FUT9,GABRA5,GABRG2,GALR1,GAP43,GAS1RR,GC,GCG,GDF6,GFRA1,GNAO1,GPM6A,GPR119,GPR12,GPRACR,GRIA2,GRIN2A,GTF2IP1,GUCA2B,HAND1,HAND2,HAND2-AS1,HEPACAM,HP,HPCAL4,HRG,HRK,HSPB8,HTR2B,IGSF10,IGSF11,IRX6,ISM1,KCNA1,KCNB1,KCNC2,KCNK2,KCNMA1,KCNMB1,KCNQ5,KCNT2,KCTD8,KERA,KHDRBS2,KIAA0408,KIF1A,KRT222,KRT24,KRTAP13-2,LCN10,LDB3,LEP,LGI1,LIFR,LINC00504,LINC00507,LINC00682,LINC00924,LINC01266,LINC01352,LINC01474,LINC01505,LINC01697,LINC01798,LINC01829,LINC02015,LINC02023,LINC02185,LINC02268,LINC02408,LINC02544,LIX1,LMO3,LMOD1,LOC100506289,LOC101928731,LOC102724050,LOC107986321,LOC283856,LOC440434,LOC729558,LONRF2,LRAT,LRCH2,LRRC3B,LRRC4C,LRRTM4,LVRN,LYVE1,MAB21L1,MAB21L2,MAGEE2,MAMDC2,MAPK4,MASP1,MEF2C-AS1,MEOX2,METTL24,MFAP5,MGAT4C,MGP,MICU3,MIR133A1HG,MIR8071-1,MMRN1,MORN5,MPPED2,MRGPRE,MS4A1,MS4A12,MSRB3,MUSK,MYH11,MYH2,MYLK,MYO3A,MYOC,MYOCD,MYOM1,MYOT,MYT1L,NALCN,NAP1L2,NBEA,NECAB1,NEFL,NEFM,NEGR1,NETO1,NEUROD1,NEXMIF,NEXN,NGB,NIBAN1,NLGN1,NOS1,NOVA1,NPR3,NPTX1,NPY2R,NRG3,NRK,NRSN1,NRXN1,NSG2,NTNG1,NTRK3,NUDT10,OGN,OLFM3,OMD,OTOP2,OTOP3,P2RX2,P2RY12,PAK3,PAPPA2,PCDH10,PCDH11X,PCDH9,PCOLCE2,PCP4L1,PCSK2,PDZRN4,PEG3,PENK,PGM5,PGM5-AS1,PGM5P4-AS1,PGR,PHOX2B,PI16,PIK3C2G,PIRT,PKHD1L1,PLAAT5,PLCXD3,PLD5,PLIN1,PLIN4,PLN,PLP1,PMP2,POPDC2,POU3F4,PPP1R1A,PRDM6,PRELP,PRG4,PRIMA1,PROKR1,PTCHD1,PTGIS,PTPRQ,PTPRZ1,PYGM,PYY,RANBP3L,RBFOX3,RBM20,RELN,RERGL,RGS13,RGS22,RIC3,RIMS4,RNF150,RNF180,RORB,RSPO2,SCARA5,SCGN,SCN2B,SCN7A,SCN9A,SCNN1G,SCRG1,SEMA3E,SERTM1,SERTM2,SFRP1,SFRP2,SFTPA1,SGCG,SHISAL1,SLC13A5,SLC17A8,SLC30A10,SLC4A4,SLC5A7,SLC6A2,SLC7A14,SLIT2,SLITRK2,SLITRK3,SLITRK4,SMIM28,SMYD1,SNAP25,SNAP91,SORCS1,SORCS3,SPHKAP,SPIB,SPOCK3,SST,ST8SIA3,STMN2,STMN4,STON1-GTF2A1L,STUM,SV2B,SYNM,SYNPO2,SYT10,SYT4,SYT6,TACR1,TAFA4,TCEAL2,TCEAL5,TCF23,TENM1,THBS4,TLL1,TMEFF2,TMEM100,TMEM35A,TMIGD1,TMOD1,TNNT3,TNS1,TNXB,TRARG1,TRDN,UGT2B10,UGT2B4,UNC80,VEGFD,VGLL3,VIT,VSTM2A,VXN,WSCD2,XKR4,ZBTB16,ZDHHC22,ZFHX4,ZMAT4,ZNF385B,ZNF676,和ZNF728。

12.根据权利要求10所述的方法，其特征在于，第二分子亚型还包括一或多种选自下组的基因：ADAT3,ANP32D,BHLHA9,BOD1L2,C4orf48,CCDC85B,CDH16,CLMAT3,CSNK1A1L,CTU1,DBET,DDC-AS1,DEFA5,EIF3IP1,FAM173A,FEZF2,FOXI3,FRMD8P1,GALR3,GJD3,GPR25,HBA1,HES4,HIST1H4A,HIST1H4L,HLA-L,IGFBP7-AS1,ITLN2,KCNE1B,LCN15,LKAAEAR1,LOC101927795,LOC101927972,LOC101928372,LOC344967,LRRC26,MAGEA10,MESP1,MIR203A,MIR324,MIR3661,MIR4449,MIR4479,MIR4665,MIR4737,MIR4767,MIR6807,MIR6858,MIR6891,MIR8075,NACA2,NOXO1,ONECUT3,PCSK1N,PDF,PITPNM2-AS1,PNMA5,PRR7,PRSS2,PRSS56,PTGER1,PTTG3P,REG3A,RNA5S9,RNU4-1,RNU5A-1,RNU5B-1,RNU5E-1,RNU6ATAC,RNY1,RPL29P2,RPRML,SBF1P1,SHISAL2B,SKOR2,SLC32A1,SMARCA5-AS1,SMCR5,SNHG25,SNORA36A,SNORD30,SNORD38A,SNORD3B-2,SNORD41,SNORD48,TMEM160,TMEM238,TPGS1,TRAPPC5,UBE2NL,WBP11P1,和ZAR1。

13.根据权利要求10所述的方法，其特征在于，所述抗癌疗法是化疗、放疗、手术或其组合。

14.根据权利要求10所述的方法，其特征在于，所述抗癌疗法是标准新辅助放化疗或标准新辅助放化疗之后的手术治疗。

15.根据权利要求10所述的方法，其特征在于，当所述第一分子亚型在分离自目标受试者的生物样品中表达、或者其表达水平高于对照时，预测对所述抗癌疗法的疗效反应或该抗癌疗法的预后不佳。

16.根据权利要求10所述的方法，其特征在于，当所述第二分子亚型在分离自目标受试者的生物样品中表达、或者其表达水平高于对照时，预测对所述抗癌疗法的疗效反应或该抗癌疗法的预后良好。

17.根据权利要求10所述的方法，其特征在于，还包括：

确认受试者的TNM分期、年龄、性别、病理完全缓解(pCR)或其组合信息。

18.根据权利要求17所述的方法，其特征在于，当所述受试者的第一分子亚型的表达水平高于对照、并且所述受试者的TNM分期为T3或T4时，预测抗癌疗法的预后不良。

19.根据权利要求17所述的方法，其特征在于，当所述受试者的第一分子亚型的表达水平高于对照、并且所述受试者的TNM分期为N1或N2时，预测抗癌疗法的预后不良。

20.根据权利要求17所述的方法，其特征在于，当所述受试者的第二分子亚型的表达水平高于对照、并且在抗癌疗法后实现pCR时，预测抗癌疗法的预后良好。

21.根据权利要求17所述的方法，其特征在于，当所述受试者的第二分子亚型的表达水平高于对照、并且所述受试者的TNM分期为T0、T1或T2时，预测抗癌疗法的预后良好。

22.根据权利要求17所述的方法，其特征在于，当所述受试者的第二分子亚型的表达水平高于对照、并且所述受试者的TNM分期为N0时，预测抗癌疗法的预后良好。

23.根据权利要求10所述的方法，其特征在于，所述癌症是一种或多种选自以下的癌症：乳腺癌、子宫癌、食道癌、胃癌、脑癌、直肠癌、结肠癌、肺癌、皮肤癌、卵巢癌、宫颈癌、肾癌、血癌、胰腺癌、前列腺癌、睾丸癌、喉癌、口腔癌、头颈癌、甲状腺癌、肝癌、膀胱癌、骨肉瘤、淋巴瘤、和白血病。

24.一种设备，用于预测对抗癌疗法的疗效反应或抗癌疗法的预后、或确定抗癌疗法前的新辅助化疗的目标患者，该设备包括：

测量单元，用于测量从目标受试者的生物样品中分离的第一分子亚型或第二分子亚型的一或多种基因或由其编码的蛋白的表达水平；和

计算单元，其提供用于从表达水平预测受试者对抗癌疗法的疗效反应或抗癌疗法的预后的信息，

其中第一分子亚型包含一种或多种选自PMP2,AGTR1,PLCXD3,TCEAL6,ANKRD1,ARHGAP26-AS1,和TCEAL6的基因，和

25.根据权利要求24所述的设备，其特征在于，所述抗癌疗法是化疗、放疗、手术或其组合。

26.根据权利要求24所述的设备，其特征在于，所述抗癌疗法是标准新辅助放化疗或标准新辅助放化疗之后的手术治疗。

27.根据权利要求24所述的设备，其特征在于，还包括：

输入单元，用于接收受试者的TNM分期、年龄或性别、病理完全反应(pCR)或其组合信息。