CN113881771A

CN113881771A - 与结直肠癌预后相关的标志分子

Info

Publication number: CN113881771A
Application number: CN202111060999.5A
Authority: CN
Inventors: 王艳; 余和芬; 黄蔚; 高天杨
Original assignee: Capital Medical University
Current assignee: Capital Medical University
Priority date: 2021-09-10
Filing date: 2021-09-10
Publication date: 2022-01-04

Abstract

本发明涉及与结直肠癌预后相关的标志分子，所述标志分子包括如SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12以及SEQ ID NO:13所示的至少一个基因序列。本发明提供的标志分子与结直肠癌的预后密切相关，结直肠癌患者预后预测与分析提供了新策略。

Description

与结直肠癌预后相关的标志分子

技术领域

本发明涉及癌症治疗以及预后评价领域，具体涉及与结直肠癌预后相关的标志分子。

背景技术

结直肠癌(colorectal cancer，CRC)是指发生在结肠或直肠上的恶性肿瘤。如今，它约占全球所有诊断出的癌症和与癌症相关的死亡病例的10％，每年约有90万人因该病去世。CRC大部分是零星散发的，并且在很大程度上归因于西化的环境风险因素，例如肥胖、不良饮食习惯、饮酒和吸烟。其诊断主要是依靠结肠镜检查以及在结肠镜下取样进行病理确诊。结直肠癌在治疗上大多采取以手术治疗为主的综合治疗，相对于结肠癌，直肠癌对放疗的敏感性更高，效果更好一些。结直肠癌由于解剖位置关系复杂，彻底手术难度大，术后复发率高；结肠癌由于发生快和转移多而通常预后较差。

转录因子(TFs)是具有调节功能的蛋白质。它们通过识别基因上游的特定DNA序列来调节基因转录，从而在发育和分化中起关键作用。许多转录因子不仅影响细胞类型的决定和个体发育模式，还参与许多生物途径的调节(例如免疫应答)。大量研究表明，TFs与肿瘤的形成和治疗密切相关。以往研究都是利用少量样本的RNA-seq数据筛选与结直肠癌预后相关的基因集；很少关注转录因子在结直肠癌早期诊断与预后方面的提示作用；大多研究是基于已知的结直肠癌相关调控因子，结合测序数据或者文献报道挖掘与该调控因子具有显著上下游相关调控关系的基因或信号通路及其在结直肠癌中的调控作用，未有研究利用数据库大量癌症与癌旁样本的测序数据结合WGCNA分析筛选与结直肠癌预后相关的特征转录因子。因此，直接利用CRC相关的TFs来构建结直肠癌的预后模型可能为CRC的诊断和治疗提供新的思路。

发明内容

在过去十年中，新技术的飞速发展使我们能够快速获取大量的CRC生理和病理信息。加权基因共表达网络分析(WGCNA)是探索基因与表型之间复杂关系的有效方法。WGCNA的独特优势是其可将基因表达数据转换为共表达模块，从而深入了解可能负责人们感兴趣表型特征的信号网络。它不仅可以比较差异表达的基因，还可以帮助我们弄清楚不同共表达模块中基因间的相互作用。因此，本发明通过提取CRC癌症和癌旁组织中的差异表达基因，利用WGCNA分析来筛选疾病相关TFs，同时建立疾病预后风险模型，实现TFs靶标调控网络的构建。

本发明的第一目的在于提供分离的与结直肠癌预后相关的标志分子，包括：如SEQID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ IDNO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12以及SEQ IDNO:13所示的至少一个基因序列。

具体而言，本发明提供的与结直肠癌预后相关的标志分子可以是SEQ ID NO:1～SEQ ID NO:13中的任意一个序列，也可以包括其中的任意两个、三个、四个、五个、六个、七个、八个、九个、十个、十一个、十二个或全部十三个序列。

其中，如SEQ ID NO:1所示的基因序列，其编码的蛋白又名ZEB1。ZEB1是肿瘤上皮-间质转化的关键驱动因子，直接与CDH1启动子结合，抑制E-cadherin转录。目前，尚未见该基因序列与结直肠癌预后相关的报道。

如SEQ ID NO:2所示的基因序列，其编码的蛋白又名转录因子7样蛋白1，TCF7L1。TCF7L1是一种定位于内质网的氨基酸蛋白，属于糖基转移酶的岩藻糖基转移酶亚家族，在胰腺、肾、肺、心脏、脑、肝、胎盘和骨骼肌中高表达。目前，尚未见该基因序列与结直肠癌预后相关的报道。

如SEQ ID NO:3所示的基因序列，其编码的蛋白又名MEIS1。MEIS1是调控细胞发育和增殖过程中决定细胞命运的重要转录因子，其在非小细胞肺癌细胞中的表达增加会导致肿瘤细胞增殖受限。目前，尚未见该基因序列与结直肠癌预后相关的报道。

如SEQ ID NO:4所示的基因序列，其编码的蛋白又名微邻苯二甲酸相关转录因子，MITF。MITF能够协调十分广泛的生物学过程，包括细胞存活、分化、增殖、侵袭、衰老、新陈代谢和DNA损伤修复等。目前，尚未见该基因序列与结直肠癌预后相关的报道。

如SEQ ID NO:5所示的基因序列，其编码的蛋白又名NK3同源框蛋白，NKX3-2。经人卵巢癌验证，NKX3-2在耐药性肿瘤中显著上调，其过表达与远处转移显著相关。目前，尚未见该基因序列与结直肠癌预后相关的报道。

如SEQ ID NO:6所示的基因序列，其编码的蛋白又名PGR。PGR基因位于染色体11q22上，可编码孕酮受体(PGR或PR)。大多数乳腺癌显示具有雌激素受体或孕激素受体的过表达。根据ER、PR、HER2三种激素受体状态的变化，乳腺癌可被分为四种亚型，这些分类影响疾病治疗方法的选择。目前，尚未见该基因序列与结直肠癌预后相关的报道。

如SEQ ID NO:7所示的基因序列，其编码的蛋白又名MEIS2。MEIS2蛋白通常与HOX或PBX蛋白相互作用形成同源蛋白-DNA复合物，在调节神经嵴和肢体发育中起重要作用。目前，尚未见该基因序列与结直肠癌预后相关的报道。

如SEQ ID NO:8所示的基因序列，其编码的蛋白又名WWTR1(TAZ)。WWTR1(TAZ)是Hippo信号通路的核心组分，YAP/TAZ使癌细胞克服接触抑制，不受控制地生长和扩散。小G蛋白Rac1的鸟苷酸交换因子TIAM1在细胞质中可与TAZ相互作用，促进TAZ降解。目前，尚未见该基因序列与结直肠癌预后相关的报道。

如SEQ ID NO:9所示的基因序列，其编码的蛋白又名KCNIP3。钾离子电压门控通道相互作用蛋白KCNIP3目前与癌症疾病相关关系的研究较少。目前，尚未见该基因序列与结直肠癌预后相关的报道。

如SEQ ID NO:10所示的基因序列，其编码的蛋白又名APBB1。APBB1最初作为脑发育过程中的淀粉样前体蛋白结合蛋白被发现，与阿尔兹海默症的发病过程密切相关，但它在癌症中的作用研究甚少。有研究发现APBB1与增强癌症干细胞(CSC)和上皮-间充质转化(EMT)以及增强肺癌细胞的抗辐射特性有关。目前，尚未见该基因序列与结直肠癌预后相关的报道。

如SEQ ID NO:11所示的基因序列，其编码的蛋白又名CBX7。CBX7蛋白属于转录抑制因子的一种，能够参与细胞增殖转录过程，在维持胚胎干细胞自身更新和全能性、抑制ESC分化中有着非常重要的作用。已有文献报道CBX7与甲状腺癌的恶性表型相关。目前，尚未见该基因序列与结直肠癌预后相关的报道。

如SEQ ID NO:12所示的基因序列，其编码的蛋白又名HAND2。HAND2是心脏形成的一种关键调节因子，同时也是子宫内膜癌中差异甲基化的热点，HAND2甲基化是子宫内膜癌中常见而重要的分子改变。目前，尚未见该基因序列与结直肠癌预后相关的报道。

如SEQ ID NO:13所示的基因序列，其编码的蛋白又名LMO3。神经特异性转录因子LMO3可通过Akt-mTOR和Akt-GSK3β信号通路促进前列腺癌细胞增殖和转移，同时LMO3-BORCS5融合癌基因在尤文氏肉瘤复发时是肿瘤进展的驱动因素。目前，尚未见该基因序列与结直肠癌预后相关的报道。

本发明的第二目的是提供评价结直肠癌预后效果的检测试剂盒，其中包括：用于检测与结直肠癌预后相关的标志分子表达量的试剂；所述标志分子包括：如SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12以及SEQ ID NO:13所示的至少一个基因序列。

具体而言，所述标志分子可以是SEQ ID NO:1～SEQ ID NO:13中的任意一个序列，也可以包括其中的任意两个、三个、四个、五个、六个、七个、八个、九个、十个、十一个、十二个或者全部十三个序列。

作为本发明的优选方案，所述试剂盒用于检测标志分子mRNA的表达量，所述试剂包括针对所述标志分子的反转录引物对，优选还包括针对所述标志分子的特异性荧光探针，通过实时监控PCR体系中的荧光信号，对检测患者样品中所述标志分子的表达量进行定量检测。

本发明的第三目的是提供结直肠癌预后效果的评价模型，所述模型具体为：

RiskScore＝-1.140*ZEB1-0.301*MITF-0.146*APBB1-0.142*CBX7-0.052*HAND2+0.013*LMO3+0.164*KCNIP3+0.189*WWTR1+0.213*MEIS2+0.213*PGR+0.215*NKX3-2+0.311*MEIS1+0.895*TCF7L1；

其中，ZEB1代表样品中如SEQ ID NO:1所示基因序列的表达量，MITF代表样品中如SEQ ID NO:4所示基因序列的表达量，APBB1代表样品中如SEQ ID NO:10所示基因序列的表达量，CBX7代表样品中如SEQ ID NO:11所示基因序列的表达量，HAND2代表样品中如SEQ IDNO:12所示基因序列的表达量，LMO3代表样品中如SEQ ID NO:13所示基因序列的表达量，KCNIP3代表样品中如SEQ ID NO:9所示基因序列的表达量，WWTR1代表样品中如SEQ ID NO:8所示基因序列的表达量，MEIS2代表样品中如SEQ ID NO:7所示基因序列的表达量，PGR代表样品中如SEQ ID NO:6所示基因序列的表达量，NKX3-2代表样品中如SEQ ID NO:5所示基因序列的表达量，MEIS1代表样品中如SEQ ID NO:3所示基因序列的表达量，TCF7L1代表样品中如SEQ ID NO:2所示基因序列的表达量；所述表达量为基因序列对应的mRNA含量。

本发明的第四目的是提供结直肠癌预后效果的评价系统，所述评价系统包括：(1)数据输入模块，用于将与结直肠癌预后相关的标志分子的表达量检测结果输入模型计算模块；所述表达量为标志分子对应的mRNA含量；(2)模型计算模块，用于对输入的检测结果进行计算处理，得到被测患者的预后效果数据；(3)结果输出模块，用于根据结直肠癌预后效果评价标准对被测患者的预后效果数据进行评价，输出评价结果。

作为本发明的优选方案，所述模型计算模块采用的模型具体为：

所述与结直肠癌预后相关的标志分子包括：如SEQ ID NO:1、SEQ ID NO:2、SEQ IDNO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12以及SEQ ID NO:13所示的至少一个基因序列。

本发明的第五目的是提供所述标志分子、所述试剂盒、所述评价模型或所述评价系统在结直肠癌诊断中的应用。

本发明的第六目的是提供所述标志分子、所述试剂盒、所述评价模型或所述评价系统在结直肠癌患者预后评价中的应用。

本发明首次从转录因子与疾病预后关系的角度出发，在结直肠癌组织和癌旁组织中筛选出差异表达的TFs基因集(DF-TFs)，后续通过WGCNA分析、lasso回归分析、COX回归分析、ROC曲线分析和风险评分等方法，筛选出与结直肠癌预后显著相关的13个转录因子。在利用特征计算的风险评分预测肿瘤患者的预后和临床病理特征时，其ROC曲线下面积值较高，表明这13个基因能很好的反应直肠癌患者的预后，为提高临床结直肠癌患者的诊断和生存预后提供了新思路。

附图说明

图1为TCGA数据库结直肠癌样本中差异转录因子的表达热图；

图2为WGCNA分析结果；A.软阈值筛选；B.聚类结果；C.模块内GS指标均值；D.模块与表型的相关性计算；

图3为Turquoise模块内TFs的共表达网络图；外围为hub TFs，内部为相对低节点的TFs，后续选择外围TFs进行分析；

图4为利用COX单因素回归结果进行lasso回归；

图5为模型的KM曲线验证(A)和ROC曲线(B)验证；

图6为外部数据集验证；A.高低风险组的K-M曲线图；B.样本风险表；C.样本删失图；D.模型中TFs的表达热图；

图7为单因素和多因素COX分析结果；

图8为基于COX多因素回归的列线图(A)和1年(B)、2年(C)、3年(D)、5年(E)OS的校正曲线；

图9为模型内TFs的TF-target调控网络；网络内围为TFs，点的大小符合TFs节点度的大小，外围为作用靶点基因。

具体实施方式

以下实施例用于说明本发明，但不用来限制本发明的范围。

实施例

本实施例利用TCGA数据库得到具有表型信息的结直肠癌RNA-seq测序样本；整合TRRUST数据库和JASPAR数据库收集目前已报道的所有TFs；通过WGCNA分析、lasso回归分析、COX回归分析、ROC曲线分析和风险评分筛选出与结直肠癌预后密切相关的基因。

具体采用包括如下步骤的方法：

首先从TCGA数据库中下载得到434份具有表型的RNA-seq测序样本，其中有383个癌症样本和51个癌旁样本。进一步整合TRRUST数据库和JASPAR数据库提供的转录因子信息，最终得到981个TFs的表达矩阵用于后续分析。进一步使用R包limma进行差异表达TFs的鉴定，去掉低表达的TFs，最终利用978个TFs进行差异分析，筛选出250个TFs，其中上调102个，下调148个。TCGA数据库结直肠癌样本中差异转录因子的表达热图如图1所示。

进一步利用DE_TFs进行WGCNA分析(结果如图2所示)，通过软阈值筛选得到最适power＝3，然后以此通过一步法构建网络，合并相似模块后最终的得到两个模块，通过模块与预后表型的关联分析，确定与OS_status相关性最高turquoise模块(113TFs)，导出网络，导入Cytoscape，以degree＝112筛选出62个具有高节点数的TFs(hub TFs)，用于后期模型构建。Turquoise模块内TFs的共表达网络图如图3所示。

对62个hub TFs进行批量COX单因素回归分析，最终筛选到14个显著相关的TFs。对相关TFs进行功能富集分析，主要富集在各器官系统发育，转录因子复合体，癌症相关的转录失调以及RNA聚合酶II特异的DNA结合活性等通路。

进一步利用lasso回归从COX单因素回归分析结果(如图4所示)中筛选出更加显著相关的13个TFs，利用公式计算每个样本依赖模型的风险得分，并以median为cutoff区分高低风险组，利用该分组结合生存数据绘制KM曲线(如图5A所示)，发现高风险组的生存率显著低于低风险组，表明构建的模型具有代表性，之后进一步绘制ROC曲线(如图5B所示)，得到的AUC＝0.706，暗示模型的预测能力较强。

然后利用GEO数据库中的GSE14333数据进行模型验证，按照同上的数据处理方法，对测试数据进行基于模型的高低风险分组，然后结合生存数据绘制K-M曲线，曲线表明高风险组的生存率显著低于低风险组，暗示构建模型的的预后效果较好(如图6所示)。

为了鉴定Risk Score是否为唯一预后影响因素，选择年龄，性别，PathologicStage和Lymphatic Invasion为其他因素，分别利用COX单因素回归和多因素回归鉴定相关因素与疾病预后的相关性(结果如图7所示)，在COX单因素回归分析中，Pathologic Stage的Hazardratio值最高，其次为Risk Score和Lymphatic Invasion。之后进一步对以上5种因素进行了COX多因素回归分析(结果如图8所示)，除了Pathologic Stage，其他因素分析结果的Hazard ratio值均有所下降，Risk Score的Hazardratio值仍为第二高，表明除了Pathologic Stage外，依赖模型的Risk Score是较合适的预后因素。模型内TFs的TF-target调控网络图如图9所示。

RiskScore＝-1.140*ZEB1-0.301*MITF-0.146*APBB1-0.142*CBX7-0.052*HAND2+0.013*LMO3+0.164*KCNIP3+0.189*WWTR1+0.213*MEIS2+0.213*PGR+0.215*NKX3-2+0.311*MEIS1+0.895*TCF7L1。

以上结果表明如SEQ ID NO:1～SEQ ID NO:13所示的13个因子与结直肠癌的预后密切相关，有潜力作为结直肠癌患者预后预测与分析的特征因子，且基于上述13个因子提供的直肠癌预后效果的评价模型能够有效评价直肠癌的预后效果。

虽然，上文中已经用一般性说明、具体实施方式及试验，对本发明作了详尽的描述，但在本发明基础上，可以对之作一些修改或改进，这对本领域技术人员而言是显而易见的。因此，在不偏离本发明精神的基础上所做的这些修改或改进，均属于本发明要求保护的范围。

序列表

<110> 首都医科大学

<120> 与结直肠癌预后相关的标志分子

<160> 13

<170> SIPOSequenceListing 1.0

<210> 1

<211> 3327

<212> DNA

<213> 人(Homo sapiens)

<400> 1

atgaaagtta caaattataa tactgtggta gaaacaaatt cagattcaga tgatgaagac 60

aaactgcata ttgtggaaga agaaagtgtt acagatgcag ctgactgtga aggtgtacca 120

gaggatgacc tgccaacaga ccagacagtg ttaccaggga ggagcagtga aagagaaggg 180

aatgctaaga actgctggga ggatgacaca ggaaaggaag ggcaagaaat cctggggcct 240

gaagctcagg cagatgaagc aggatgtaca gtaaaagatg atgaatgcga gtcagatgca 300

gaaaatgagc aaaaccatga tcctaatgtt gaagagtttc tacaacaaca agacactgct 360

gtcatttttc ctgaggcacc tgaagaggac cagaggcagg gcacaccaga agccagtggt 420

catgatgaaa atggaacacc agatgcattt tcacaattac tcacctgtcc atattgtgat 480

agaggctata aacgctttac ctctctgaaa gaacacatta aatatcgtca tgaaaagaat 540

gaagataact ttagttgctc cctgtgcagt tacacctttg catacagaac ccaacttgaa 600

cgtcacatga catcacataa atcaggaaga gatcaaagac atgtgacgca gtctgggtgt 660

aatcgtaaat tcaaatgcac tgagtgtgga aaagctttca aatacaaaca tcacctaaaa 720

gagcacttaa gaattcacag tggagagaag ccatatgaat gcccaaactg caagaaacgc 780

ttttcccatt ctggctccta tagctcacac ataagcagta agaaatgtat cagcttgata 840

cctgtgaatg ggcgaccaag aacaggactc aagacatctc agtgttcttc accgtctctt 900

tcagcatcac caggcagtcc cacacgacca cagatacggc aaaagataga gaataaaccc 960

cttcaagaac aactttctgt taaccaaatt aaaactgaac ctgtggatta tgaattcaaa 1020

cccatagtgg ttgcttcagg aatcaactgt tcaacccctt tacaaaatgg ggttttcact 1080

ggtggtggcc cattacaggc aaccagttct cctcagggca tggtgcaagc tgttgttctg 1140

ccaacagttg gtttggtgtc tcccataagt atcaatttaa gtgatattca gaatgtactt 1200

aaagtggcgg tagatggtaa tgtaataagg caagtgttgg agaataatca agccaatctt 1260

gcatccaaag aacaagaaac aatcaatgct tcacccatac aacaaggtgg ccattctgtt 1320

atttcagcca tcagtcttcc tttggttgat caagatggaa caaccaaaat tatcatcaac 1380

tacagtcttg agcagcctag ccaacttcaa gttgttcctc aaaatttaaa aaaagaaaat 1440

ccagtcgcta caaacagttg taaaagtgaa aagttaccag aagatcttac tgttaagtct 1500

gagaaggaca aaagctttga agggggggtg aatgatagca cttgtcttct gtgtgatgat 1560

tgtccaggag atattaatgc acttccagaa ttaaagcact atgacctaaa gcagcctact 1620

cagcctcctc cactccctgc agcagaagct gagaagcctg agtcctctgt ttcatcagct 1680

actggagatg gcaatttgtc tcctagtcag ccacctttaa agaacctctt gtctctccta 1740

aaagcatatt atgctttgaa tgcacaacca agtgcagaag agctctcaaa aattgctgat 1800

tcagtaaacc taccactgga tgtagtaaaa aagtggtttg aaaagatgca agctggacag 1860

atttcagtgc agtcttctga accatcttct cctgaaccag gcaaagtaaa tatccctgcc 1920

aagaacaatg atcagcctca atctgcaaat gcaaatgaac cccaggacag cacagtaaat 1980

ctacaaagtc ctttgaagat gactaactcc ccagttttac cagtgggatc aaccaccaat 2040

ggttccagaa gtagtacacc atccccatca cctctaaacc tttcctcatc cagaaataca 2100

cagggttact tgtacacagc tgagggtgca caagaagagc cacaagtaga acctcttgat 2160

ctttcactac caaagcaaca gggagaatta ttagaaaggt caactatcac tagtgtttac 2220

cagaacagtg tttattctgt ccaggaagaa cccttgaact tgtcttgcgc aaaaaaggag 2280

ccacaaaagg acagttgtgt tacagactca gaaccagttg taaatgtaat cccaccaagt 2340

gccaacccca taaatatcgc tatacctaca gtcactgccc agttacccac aatcgtggcc 2400

attgctgacc agaacagtgt tccatgctta agagcgctag ctgccaataa gcaaacgatt 2460

ctgattcccc aggtggcata cacctactca actacggtca gccctgcagt ccaagaacca 2520

cccttgaaag tgatccagcc aaatggaaat caggatgaaa gacaagatac tagctcagaa 2580

ggagtatcaa atgtagagga tcagaatgac tctgattcta caccgcccaa aaagaaaatg 2640

cggaagacag aaaatggaat gtatgcttgt gatttgtgtg acaagatatt ccaaaagagt 2700

agttcattat tgagacataa atatgaacac acaggtaaaa gacctcatga gtgtggaatc 2760

tgtaaaaagg catttaaaca caaacatcat ttgattgaac acatgcgatt acattctgga 2820

gaaaagccct atcaatgtga caaatgtgga aagcgcttct cacactctgg gtcttattct 2880

caacacatga atcatcgcta ctcctactgt aagagagaag cggaagaacg tgacagcaca 2940

gagcaggaag aggcagggcc tgaaatcctc tcgaatgagc acgtgggtgc cagggcgtct 3000

ccctcacagg gcgactcgga cgagagagag agtttgacaa gggaagagga tgaagacagt 3060

gaaaaagagg aagaggagga ggataaagag atggaagaat tgcaggaaga aaaagaatgt 3120

gaaaaaccac aaggggatga ggaagaggag gaggaggagg aagaagtgga agaagaagag 3180

gtagaagagg cagagaatga gggagaagaa gcaaaaactg aaggtctgat gaaggatgac 3240

agggctgaaa gtcaagcaag cagcttagga caaaaagtag gcgagagtag tgagcaagtg 3300

tctgaagaaa agacaaatga agcctaa 3327

<210> 2

<211> 1767

<212> DNA

<213> 人(Homo sapiens)

<400> 2

atgccccagc tcggcggcgg gggcggcggc ggcggcggcg gcagcggggg aggcggcggc 60

tccagcgccg gggcggccgg cggaggggac gacctcgggg cgaacgacga gctgatcccc 120

ttccaggacg aggggggcga ggagcaggag ccgagcagcg atagcgcctc ggcgcagcgg 180

gacctagacg aggtcaagtc gtccctggtc aacgagtcgg agaaccagag cagcagctcg 240

gactcggagg cggagaggcg cccgcagccc gtccgggaca ctttccagaa gccgcgggac 300

tatttcgccg aagtgagaag gcctcaggac agcgcgttct ttaaaggacc cccgtaccct 360

gggtacccct tcctgatgat cccggacctg agcagcccgt acctctccaa cggacccctg 420

tctcccggag gagcgcgcac ctacctgcag atgaaatggc ccctcctcga tgtcccctcc 480

agcgccacag tcaaggacac gaggtcacca tctccagcac acttgtctaa taaagttcct 540

gtcgttcagc acccgcatca catgcatccg ctgactcccc tcatcaccta cagcaatgac 600

cacttctccc ccggctcccc tcccacccac ctctccccag agatcgatcc aaagacagga 660

atcccccggc cccctcaccc atccgagctg tcaccgtatt acccactctc tcccggagct 720

gtcggacaaa tcccccaccc cctcggctgg ctcgtcccac agcaaggcca gcccatgtac 780

tcccttcctc ccggtggctt ccggcaccct taccccgccc tcgccatgaa cgcctcgatg 840

tccagcctgg tctccagtcg gttctctcct cacatggtgg ctcctgccca ccctggcctg 900

cccacctcag ggatccccca ccctgccatc gtctccccca tcgtcaagca ggaaccggca 960

ccccccagcc tgagccctgc agtgagcgtg aaatcaccag tcaccgtgaa aaaggaggag 1020

gaaaagaagc cccacgtgaa gaagcctctg aatgccttca tgttgtatat gaaggagatg 1080

agggccaagg tggtggctga gtgcaccctg aaggaaagtg cagccattaa ccagatcctt 1140

ggaagaaagt ggcacaacct gtctcgagaa gaacaggcca agtactacga gctggcccgg 1200

aaggagcggc agcttcactc gcagctctac ccaacctggt cagcccggga caactatggt 1260

aagaaaaaga agaggaagag agaaaagcag ctgtcccaga cacagtcaca gcagcaagtc 1320

caggaggcag agggtgccct ggcctccaag agcaagaagc catgtgttca gtacctgccc 1380

cccgagaagc cctgtgacag ccctgcctcc tcccacggga gcatgctgga ctccccggcc 1440

actccctctg cagctttggc ctcaccagct gcccctgctg ccacccattc ggagcaagcc 1500

cagcccctct ccctcaccac caaaccagaa acccgggccc agctggctct ccactctgcc 1560

gccttcctgt cggctaaggc tgcagcctcc tcctctgggc agatgggcag ccagcctccc 1620

ctcctgtccc ggcccctccc ccttgggtcc atgcccacag ctctgctggc ctctcccccg 1680

tccttccccg ccacgctcca tgcccaccag gccctcccgg tgctacaggc ccagcctctt 1740

tccctggtca ccaagtctgc ccactaa 1767

<210> 3

<211> 1173

<212> DNA

<213> 人(Homo sapiens)

<400> 3

atggcgcaaa ggtacgacga tctaccccat tacgggggca tggatggagt aggcatcccc 60

tccacgatgt atggggaccc gcatgcagcc aggtccatgc agccggtcca ccacctgaac 120

cacgggcctc ctctgcactc gcatcagtac ccgcacacag ctcataccaa cgccatggcc 180

cccagcatgg gctcctctgt caatgacgct ttaaagagag ataaagatgc catttatgga 240

caccccctct tccctctctt agcactgatt tttgagaaat gtgaattagc tacttgtacc 300

ccccgcgagc cgggggtggc gggcggggac gtctgctcgt cagagtcatt caatgaagat 360

atagccgtgt tcgccaaaca gattcgcgca gaaaaacctc tattttcttc taatccagaa 420

ctggataact tgatgattca agccatacaa gtattaaggt ttcatctatt ggaattagag 480

aaggtacacg aattatgtga caatttctgc caccggtata ttagctgttt gaaagggaaa 540

atgcctatcg atttggtgat agacgataga gaaggaggat caaaatcaga cagtgaagat 600

ataacaagat cagcaaatct aactgaccag ccctcttgga acagagatca tgatgacacg 660

gcatctactc gttcaggagg aaccccaggc ccttccagcg gtggccacac gtcacacagt 720

ggggacaaca gcagtgagca aggtgatggc ttggacaaca gtgtagcttc ccccagcaca 780

ggtgacgatg atgaccctga taaggacaaa aagcgtcaca aaaagcgtgg catctttccc 840

aaagtagcca caaatatcat gagggcgtgg ctgttccagc atctaacaca cccttaccct 900

tctgaagaac agaaaaagca gttggcacaa gacacgggac tcaccatcct tcaagtgaac 960

aattggttta ttaatgcccg gagaagaata gtgcagccca tgatagacca gtccaaccga 1020

gcagtaagtc aaggaacacc ttataatcct gatggacagc ccatgggagg tttcgtaatg 1080

gacggtcagc aacatatggg aattagagca ccaggaccta tgagtggaat gggcatgaat 1140

atgggcatgg aggggcagtg gcactacatg taa 1173

<210> 4

<211> 1260

<212> DNA

<213> 人(Homo sapiens)

<400> 4

atgctggaaa tgctagaata taatcactat caggtgcaga cccacctcga aaaccccacc 60

aagtaccaca tacagcaagc ccaacggcag caggtaaagc agtacctttc taccacttta 120

gcaaataaac atgccaacca agtcctgagc ttgccatgtc caaaccagcc tggcgatcat 180

gtcatgccac cggtgccggg gagcagcgca cccaacagcc ccatggctat gcttacgctt 240

aactccaact gtgaaaaaga gggattttat aagtttgaag agcaaaacag ggcagagagc 300

gagtgcccag gcatgaacac acattcacga gcgtcctgta tgcagatgga tgatgtaatc 360

gatgacatca ttagcctaga atcaagttat aatgaggaaa tcttgggctt gatggatcct 420

gctttgcaaa tggcaaatac gttgcctgtc tcgggaaact tgattgatct ttatggaaac 480

caaggtctgc ccccaccagg cctcaccatc agcaactcct gtccagccaa ccttcccaac 540

ataaaaaggg agctcacagc gtgtattttt cccacagagt ctgaagcaag agcactggcc 600

aaagagaggc agaaaaagga caatcacaac ctgattgaac gaagaagaag atttaacata 660

aatgaccgca ttaaagaact aggtactttg attcccaagt caaatgatcc agacatgcgc 720

tggaacaagg gaaccatctt aaaagcatcc gtggactata tccgaaagtt gcaacgagaa 780

cagcaacgcg caaaagaact tgaaaaccga cagaagaaac tggagcacgc caaccggcat 840

ttgttgctca gaatacagga acttgaaatg caggctcgag ctcatggact ttcccttatt 900

ccatccacgg gtctctgctc tccagatttg gtgaatcgga tcatcaagca agaacccgtt 960

cttgagaact gcagccaaga cctccttcag catcatgcag acctaacctg tacaacaact 1020

ctcgatctca cggatggcac catcaccttc aacaacaacc tcggaactgg gactgaggcc 1080

aaccaagcct atagtgtccc cacaaaaatg ggatccaaac tggaagacat cctgatggac 1140

gacacccttt ctcccgtcgg tgtcactgat ccactccttt cctcagtgtc ccccggagct 1200

tccaaaacaa gcagccggag gagcagtatg agcatggaag agacggagca cacttgttag 1260

<210> 5

<211> 1002

<212> DNA

<213> 人(Homo sapiens)

<400> 5

atggctgtgc gcggcgccaa caccttgacg tccttctcca tccaggcgat cctcaacaag 60

aaagaggagc gcggcgggct ggccgcgcca gaggggcgcc cggcgcccgg gggcacagcg 120

gcatcggtgg ccgcggctcc cgctgtctgc tgttggcggc tctttgggga gagggacgcg 180

ggcgcgttgg ggggcgccga ggactctctg ctggcgtctc ctgccggtac cagaacagct 240

gcggggcgga ctgcggagag cccggaaggc tgggactcgg actccgcgct cagcgaggag 300

aacgagagca ggcggcgctg cgcggacgcg cggggggcca gcggggccgg ccttgcgggg 360

ggatccttga gcctcggcca gccggtctgt gagctggccg cttccaaaga cctagaggag 420

gaagccgcgg gccggagcga cagcgagatg tccgccagcg tctcaggcga ccgcagccca 480

aggaccgagg acgacggtgt tggccccaga ggtgcacacg tgtccgcgct gtgcagcggg 540

gccggcggcg ggggcggcag cgggccggca ggcgtcgcgg aggaggagga ggagccggcg 600

gcgcccaagc cacgcaagaa gcgctcgcgg gccgctttct cccacgcgca ggtcttcgag 660

ctggagcgcc gctttaacca ccagcgctac ctgtccgggc ccgagcgcgc agacctggcc 720

gcgtcgctga agctcaccga gacgcaggtg aaaatctggt tccagaaccg tcgctacaag 780

acaaagcgcc ggcagatggc agccgacctg ctggcctcgg cgcccgccgc caagaaggtg 840

gccgtaaagg tgctggtgcg cgacgaccag agacaatacc tgcccggcga agtgctgcgg 900

ccaccctcgc ttctgccact gcagccctcc tactattacc cgtactactg cctcccaggc 960

tgggcgctct ccacctgcgc agctgccgca ggcacccagt ga 1002

<210> 6

<211> 2310

<212> DNA

<213> 人(Homo sapiens)

<400> 6

atgagccggt ccgggtgcaa ggttggagac agctccggga cggcagctgc ccataaagtg 60

ctgccccggg gcctgtcacc agcccggcag ctgctgctcc cggcctctga gagccctcac 120

tggtccgggg ccccagtgaa gccgtctccg caggccgctg cggtggaggt tgaggaggag 180

gatggctctg agtccgagga gtctgcgggt ccgcttctga agggcaaacc tcgggctctg 240

ggtggcgcgg cggctggagg aggagccgcg gctgtcccgc cgggggcggc agcaggaggc 300

gtcgccctgg tccccaagga agattcccgc ttctcagcgc ccagggtcgc cctggtggag 360

caggacgcgc cgatggcgcc cgggcgctcc ccgctggcca ccacggtgat ggatttcatc 420

cacgtgccta tcctgcctct caatcacgcc ttattggcag cccgcactcg gcagctgctg 480

gaagacgaaa gttacgacgg cggggccggg gctgccagcg cctttgcccc gccgcggagt 540

tcaccctgtg cctcgtccac cccggtcgct gtaggcgact tccccgactg cgcgtacccg 600

cccgacgccg agcccaagga cgacgcgtac cctctctata gcgacttcca gccgcccgct 660

ctaaagataa aggaggagga ggaaggcgcg gaggcctccg cgcgctcccc gcgttcctac 720

cttgtggccg gtgccaaccc cgcagccttc ccggatttcc cgttggggcc accgcccccg 780

ctgccgccgc gagcgacccc atccagaccc ggggaagcgg cggtgacggc cgcacccgcc 840

agtgcctcag tctcgtctgc gtcctcctcg gggtcgaccc tggagtgcat cctgtacaaa 900

gcggagggcg cgccgcccca gcagggcccg ttcgcgccgc cgccctgcaa ggcgccgggc 960

gcgagcggct gcctgctccc gcgggacggc ctgccctcca cctccgcctc tgccgccgcc 1020

gccggggcgg cccccgcgct ctaccctgca ctcggcctca acgggctccc gcagctcggc 1080

taccaggccg ccgtgctcaa ggagggcctg ccgcaggtct acccgcccta tctcaactac 1140

ctgaggccgg attcagaagc cagccagagc ccacaataca gcttcgagtc attacctcag 1200

aagatttgtt taatctgtgg ggatgaagca tcaggctgtc attatggtgt ccttacctgt 1260

gggagctgta aggtcttctt taagagggca atggaagggc agcacaacta cttatgtgct 1320

ggaagaaatg actgcatcgt tgataaaatc cgcagaaaaa actgcccagc atgtcgcctt 1380

agaaagtgct gtcaggctgg catggtcctt ggaggtcgaa aatttaaaaa gttcaataaa 1440

gtcagagttg tgagagcact ggatgctgtt gctctcccac agccagtggg cgttccaaat 1500

gaaagccaag ccctaagcca gagattcact ttttcaccag gtcaagacat acagttgatt 1560

ccaccactga tcaacctgtt aatgagcatt gaaccagatg tgatctatgc aggacatgac 1620

aacacaaaac ctgacacctc cagttctttg ctgacaagtc ttaatcaact aggcgagagg 1680

caacttcttt cagtagtcaa gtggtctaaa tcattgccag gttttcgaaa cttacatatt 1740

gatgaccaga taactctcat tcagtattct tggatgagct taatggtgtt tggtctagga 1800

tggagatcct acaaacacgt cagtgggcag atgctgtatt ttgcacctga tctaatacta 1860

aatgaacagc ggatgaaaga atcatcattc tattcattat gccttaccat gtggcagatc 1920

ccacaggagt ttgtcaagct tcaagttagc caagaagagt tcctctgtat gaaagtattg 1980

ttacttctta atacaattcc tttggaaggg ctacgaagtc aaacccagtt tgaggagatg 2040

aggtcaagct acattagaga gctcatcaag gcaattggtt tgaggcaaaa aggagttgtg 2100

tcgagctcac agcgtttcta tcaacttaca aaacttcttg ataacttgca tgatcttgtc 2160

aaacaacttc atctgtactg cttgaataca tttatccagt cccgggcact gagtgttgaa 2220

tttccagaaa tgatgtctga agttattgct gcacaattac ccaagatatt ggcagggatg 2280

gtgaaacccc ttctctttca taaaaagtga 2310

<210> 7

<211> 1206

<212> DNA

<213> 人(Homo sapiens)

<400> 7

atggcgcaaa ggtacgatga gctgccccat tacggcggga tggacggagt aggggttccc 60

gcttccatgt acggagaccc tcacgcgccg cggccgatcc ccccggttca ccacctgaac 120

cacgggccgc cgctccacgc cacacagcac tacggcgcgc acgccccgca ccccaatgtc 180

atgccggcca gtatgggatc cgctgtcaac gacgccttga agcgggacaa ggacgcgatc 240

tatgggcacc cgttgtttcc tctgttagct ctggtctttg agaagtgcga gctggcgacc 300

tgcactcccc gggaacctgg agtggctggc ggagacgtct gctcctccga ctccttcaac 360

gaggacatcg cggtcttcgc caagcaggtt cgcgccgaaa agccactttt ttcctcaaat 420

ccagagctgg acaatttgat gatacaagca atacaagtac taaggtttca tcttttggag 480

ttagaaaagg tccacgaact gtgcgataac ttctgccacc gatacattag ctgtttgaag 540

gggaaaatgc ccatcgacct cgtcattgat gaaagagacg gcagctccaa gtcagatcat 600

gaagaacttt caggctcctc cacaaatctc gctgaccata acccttcttc ttggcgagac 660

cacgatgatg caacctcaac ccactcagca ggcaccccag ggccctccag tgggggccat 720

gcttcccaga gcggagacaa cagcagtgag caaggggatg gtttagacaa cagtgtagct 780

tcacctggta caggtgacga tgatgatccg gataaggaca aaaaacgcca gaagaaaaga 840

ggcattttcc ccaaagtagc aacaaatatc atgagagcat ggctcttcca gcatctcaca 900

catccgtacc cttccgaaga gcagaagaaa cagttagcgc aagacacagg acttacaatt 960

ctccaagtaa acaactggtt tattaatgcc agaagaagaa tagtacagcc catgattgac 1020

cagtcaaatc gagcaggttt tcttcttgat ccttcagtga gccaaggagc agcatatagt 1080

ccagagggtc agcccatggg gagctttgtg ttggatggtc agcaacacat ggggatccgg 1140

cctgcaggac ctatgagtgg aatgggcatg aatatgggca tggatgggca atggcactac 1200

atgtaa 1206

<210> 8

<211> 1203

<212> DNA

<213> 人(Homo sapiens)

<400> 8

atgaatccgg cctcggcgcc ccctccgctc ccgccgcctg ggcagcaagt gatccacgtc 60

acgcaggacc tagacacaga cctcgaagcc ctcttcaact ctgtcatgaa tccgaagcct 120

agctcgtggc ggaagaagat cctgccggag tctttcttta aggagcctga ttcgggctcg 180

cactcgcgcc agtccagcac cgactcgtcg ggcggccacc cggggcctcg actggctggg 240

ggtgcccagc atgtccgctc gcactcgtcg cccgcgtccc tgcagctggg caccggcgcg 300

ggtgctgcgg gtagccccgc gcagcagcac gcgcacctcc gccagcagtc ctacgacgtg 360

accgacgagc tgccactgcc cccgggctgg gagatgacct tcacggccac tggccagagg 420

tacttcctca atcacataga aaaaatcacc acatggcaag accctaggaa ggcgatgaat 480

cagcctctga atcatatgaa cctccaccct gccgtcagtt ccacaccagt gcctcagagg 540

tccatggcag tatcccagcc aaatctcgtg atgaatcacc aacaccagca gcagatggcc 600

cccagtaccc tgagccagca gaaccacccc actcagaacc cacccgcagg gctcatgagt 660

atgcccaatg cgctgaccac tcagcagcag cagcagcaga aactgcggct tcagagaatc 720

cagatggaga gagaaaggat tcgaatgcgc caagaggagc tcatgaggca ggaagctgcc 780

ctctgtcgac agctccccat ggaagctgag actcttgccc cagttcaggc tgctgtcaac 840

ccacccacga tgaccccaga catgagatcc atcactaata atagctcaga tcctttcctc 900

aatggagggc catatcattc gagggagcag agcactgaca gtggcctggg gttagggtgc 960

tacagtgtcc ccacaactcc ggaggacttc ctcagcaatg tggatgagat ggatacagga 1020

gaaaacgcag gacaaacacc catgaacatc aatccccaac agacccgttt ccctgatttc 1080

cttgactgtc ttccaggaac aaacgttgac ttaggaactt tggaatctga agacctgatc 1140

cccctcttca atgatgtaga gtctgctctg aacaaaagtg agccctttct aacctggctg 1200

taa 1203

<210> 9

<211> 771

<212> DNA

<213> 人(Homo sapiens)

<400> 9

atgcagccgg ctaaggaagt gacaaaggcg tcggacggca gcctcctggg ggacctcggg 60

cacacaccac ttagcaagaa ggagggtatc aagtggcaga ggccgaggct cagccgccag 120

gctttgatga gatgctgcct ggtcaagtgg atcctgtcca gcacagcccc acagggctca 180

gatagcagcg acagtgagct ggagctgtcc acggtgcgcc accagccaga ggggctggac 240

cagctgcagg cccagaccaa gttcaccaag aaggagctgc agtctctcta caggggcttt 300

aagaatgagt gtcccacggg cctggtggac gaagacacct tcaaactcat ttacgcgcag 360

ttcttccctc agggagatgc caccacctat gcacacttcc tcttcaacgc ctttgatgcg 420

gacgggaacg gggccatcca ctttgaggac tttgtggttg gcctctccat cctgctgcgg 480

ggcacagtcc acgagaagct caagtgggcc tttaatctct acgacattaa caaggatggc 540

tacatcacca aagaggagat gctggccatc atgaagtcca tctatgacat gatgggccgc 600

cacacctacc ccatcctgcg ggaggacgcg ccggcggagc acgtggagag gttcttcgag 660

aaaatggacc ggaaccagga tggggtagtg accattgaag agttcctgga ggcctgtcag 720

aaggatgaga acatcatgag ctccatgcag ctgtttgaga atgtcatcta g 771

<210> 10

<211> 2133

<212> DNA

<213> 人(Homo sapiens)

<400> 10

atgtctgttc catcatcact gagccagtcg gccattaatg ccaacagcca cggaggcccc 60

gcactgagcc tacccctgcc tctgcacgct gcccacaacc agctgctcaa cgccaagctg 120

caggccacag ctgtgggacc caaggacctg cgcagcgcca tgggggaggg tggtgggcct 180

gagccaggcc ctgccaatgc caagtggcta aaagagggcc agaaccagct ccggcgggcc 240

gccacggccc accgtgacca gaatcgcaat gtgaccttga ccttggcgga ggaggccagc 300

caggagcctg agatggcacc cttgggcccc aaaggcctga tacacctgta ctctgagctg 360

gagctctcag ctcacaacgc agccaaccga ggcctacgag gacctggcct gatcatcagc 420

actcaagagc aggggccaga tgagggagag gagaaggcgg ccggggaggc cgaggaggag 480

gaggaggatg atgatgatga agaggaggag gaggacttat cttctccccc agggctgcct 540

gagcccctgg agagtgtgga ggcccctccc aggccccaag cccttacaga tggcccccgg 600

gaacacagca agagtgccag cctcctgttt ggcatgcgga acagtgcagc cagtgatgag 660

gactcaagct gggctacctt atcccagggc agcccctcct atggctcccc agaggacaca 720

gattccttct ggaaccccaa cgccttcgag acggattccg acctgccggc tggatggatg 780

agggtccagg acacctcagg gacctattac tggcacatcc caacagggac cacccagtgg 840

gaaccccccg gccgggcctc cccctcacag gggagcagcc cccaagagga gtcccagctc 900

acctggacag gttttgctca tggagaaggc tttgaggatg gagaattttg gaaggatgaa 960

cccagtgatg aggccccaat ggagctggga ctgaaggaac ctgaggaggg gacgttgacc 1020

ttcccagctc agagcctcag cccagagccg ttgccccaag aggaggagaa gcttccccca 1080

cggaatacca acccagggat caagtgtttc gccgtgcgct ccctaggctg ggtagagatg 1140

accgaggagg agctggcccc tggacgcagc agtgtggcag tcaacaattg catccgtcag 1200

ctctcttacc acaaaaacaa cctgcatgac cccatgtctg ggggctgggg ggaaggaaag 1260

gatctgctac tgcagctgga ggatgagaca ctaaagctag tggagccaca gagccaggca 1320

ctgctgcacg cccaacccat catcagcatc cgcgtgtggg gcgtcgggcg ggacagtgga 1380

agagagaggg actttgccta cgtagctcgt gataagctga cccagatgct caagtgccac 1440

gtgtttcgct gtgaggcacc tgccaagaac atcgccacca gcctgcatga gatctgctct 1500

aagatcatgg ccgaacggcg taatgcccgc tgcttggtaa atggactctc cctggaccac 1560

tctaaacttg tggatgtccc tttccaagtg gaattcccag cgcctaagaa tgagttggtc 1620

cagaagttcc aagtctatta cctggggaat gtacctgttg ctaaacctgt tggggtagat 1680

gtgattaatg gggccctcga gtcagtcctg tcctccagca gccgtgaaca atggacccca 1740

agtcatgtca gtgtggcccc tgctaccctc accatcttgc accagcagac agaggcagtg 1800

ctgggagagt gtcgggtgcg tttcctctcc ttcctggccg tgggcagaga tgtccacacg 1860

tttgcattca tcatggctgc cggcccagcc tccttctgct gccacatgtt ctggtgcgag 1920

cccaatgctg ccagcctctc agaggctgtg caggctgcgt gcatgcttcg ctaccagaag 1980

tgtctggatg cccgttccca ggcctccacc tcctgcctcc cagcaccccc tgctgagtct 2040

gtggcacggc gtgtagggtg gactgtccgc aggggtgttc agtcgctgtg gggctccctg 2100

aagcccaaac ggctgggggc ccatacccca tga 2133

<210> 11

<211> 756

<212> DNA

<213> 人(Homo sapiens)

<400> 11

atggagctgt cagccatcgg cgagcaggtg ttcgccgtgg agagcatccg gaagaagcgc 60

gtgcggaagg gtaaagtcga gtatctggtg aagtggaaag gatggccccc aaagtacagc 120

acgtgggagc cagaagagca catcttggac ccccgcctcg tcatggccta cgaggagaag 180

gaggagagag accgagcatc ggggtatagg aagagaggtc cgaaacccaa gcggcttctg 240

ctgcagcggc tgtacagcat ggacctgcgg agctcccaca aggccaaggg caaggagaag 300

ctctgcttct ccctgacgtg cccactcggc agcgggagcc ctgagggggt ggtcaaggcg 360

ggggcacctg agctggtgga caagggcccc ttggtgccca ccctgccctt cccgctccgc 420

aagccccgaa aggcccacaa gtacctgcgg ctctcgcgca agaagttccc gccccgcggg 480

cccaacctgg agagccacag ccatcgacgg gagctcttcc tgcaggagcc accggcccca 540

gacgtcctgc aggcggctgg cgagtgggag cctgctgcgc agccccctga agaggaggca 600

gatgccgacc tggccgaggg gccccctccc tggacacctg cgctcccctc aagtgaggtg 660

accgtgaccg acatcaccgc caactccatc accgtcacct tccgcgaggc ccaggcagct 720

gagggcttct tccgagaccg cagtgggaag ttctga 756

<210> 12

<211> 654

<212> DNA

<213> 人(Homo sapiens)

<400> 12

atgagtctgg taggtggttt tccccaccac ccggtggtgc accacgaggg ctacccgttt 60

gccgccgccg ccgccgcagc tgccgccgcc gccgccagcc gctgcagcca tgaggagaac 120

ccctacttcc atggctggct catcggccac cccgagatgt cgccccccga ctacagcatg 180

gccctgtcct acagccccga gtatgccagc ggcgccgccg gcctggacca ctcccattac 240

gggggggtgc cgccgggcgc cgggcccccg ggcctggggg ggccgcgccc ggtgaagcgc 300

cgaggcaccg ccaaccgcaa ggagcggcgc aggactcaga gcatcaacag cgccttcgcc 360

gaactgcgcg agtgcatccc caacgtaccc gccgacacca aactctccaa aatcaagacc 420

ctgcgcctgg ccaccagcta catcgcctac ctcatggacc tgctggccaa ggacgaccag 480

aatggcgagg cggaggcctt caaggcagag atcaagaaga ccgacgtgaa agaggagaag 540

aggaagaagg agctgaacga aatcttgaaa agcacagtga gcagcaacga caagaaaacc 600

aaaggccgga cgggctggcc gcagcacgtc tgggccctgg agctcaagca gtga 654

<210> 13

<211> 504

<212> DNA

<213> 人(Homo sapiens)

<400> 13

atgctctcag tccagccaga caccaagccg aaaggttgtg ctggctgcaa ccgaaagatc 60

aaggaccggt atcttctaaa ggcactggac aaatactggc atgaagactg cctgaagtgt 120

gcctgctgtg actgtcgctt gggagagcat ttgaagaggt gtggatctat atacatacat 180

gctgcacata cagagattgg aatctgtgta accttagaat ggccattacc ttttgtcatc 240

attgacttta gccaacaaat caccatagct tggctctttg gtgtaacggg aaactgcgct 300

gcctgtagta agctcatccc tgcctttgag atggtgatgc gtgccaagga caatgtttac 360

cacctggact gctttgcatg tcagctttgt aatcagagat tttgtgttgg agacaaattt 420

ttcctaaaga ataacatgat cctttgccag acggactacg aggaaggttt aatgaaagaa 480

ggttatgcac cccaggttcg ctga 504

Claims

1.与结直肠癌预后相关的标志分子，其特征在于，包括如SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12以及SEQ ID NO:13所示的至少一个基因序列。

2.根据权利要求1所述的标志分子，其特征在于，包括SEQ ID NO:1～SEQ ID NO:13中的任意一个、任意两个、任意三个、任意四个、任意五个、任意六个、任意七个、任意八个、任意九个、任意十个、任意十一个、任意十二个或者全部十三个序列。

3.评价结直肠癌预后效果的检测试剂盒，其特征在于，包括：用于检测与结直肠癌预后相关的标志分子表达量的试剂；所述标志分子包括如SEQ ID NO:1、SEQ ID NO:2、SEQ IDNO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12以及SEQ ID NO:13所示的至少一个基因序列；所述表达量为标志分子对应的mRNA含量。

4.根据权利要求3所述的试剂盒，其特征在于，所述标志分子包括SEQ ID NO:1～SEQID NO:13中的任意一个、任意两个、任意三个、任意四个、任意五个、任意六个、任意七个、任意八个、任意九个、任意十个、任意十一个、任意十二个或者全部十三个序列。

5.根据权利要求3或4所述的试剂盒，其特征在于，用于检测所述标志分子表达量的试剂包括针对所述标志分子的引物对；优选还包括针对所述标志分子的特异性荧光探针。

6.结直肠癌预后效果的评价模型，其特征在于，所述模型具体为：

其中，ZEB1代表样品中如SEQ ID NO:1所示基因序列的表达量，MITF代表样品中如SEQID NO:4所示基因序列的表达量，APBB1代表样品中如SEQ ID NO:10所示基因序列的表达量，CBX7代表样品中如SEQ ID NO:11所示基因序列的表达量，HAND2代表样品中如SEQ IDNO:12所示基因序列的表达量，LMO3代表样品中如SEQ ID NO:13所示基因序列的表达量，KCNIP3代表样品中如SEQ ID NO:9所示基因序列的表达量，WWTR1代表样品中如SEQ ID NO:8所示基因序列的表达量，MEIS2代表样品中如SEQ ID NO:7所示基因序列的表达量，PGR代表样品中如SEQ ID NO:6所示基因序列的表达量，NKX3-2代表样品中如SEQ ID NO:5所示基因序列的表达量，MEIS1代表样品中如SEQ ID NO:3所示基因序列的表达量，TCF7L1代表样品中如SEQ ID NO:2所示基因序列的表达量；所述表达量为基因序列对应的mRNA含量。

7.结直肠癌预后效果的评价系统，其特征在于，所述系统包括：

(1)数据输入模块，用于将与结直肠癌预后相关的标志分子的表达量检测结果输入模型计算模块；所述表达量为标志分子对应的mRNA含量；

所述标志分子包括如SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ IDNO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12以及SEQ ID NO:13所示的至少一个基因序列；

(2)模型计算模块，用于对输入的检测结果进行计算处理，得到被测患者的预后效果数据；

(3)结果输出模块，用于根据结直肠癌预后效果评价标准对被测患者的预后效果数据进行评价，输出评价结果；

优选地，所述模型计算模块采用的模型具体为：

8.根据权利要求7所述的评价系统，其特征在于，所述标志分子包括SEQ ID NO:1～SEQID NO:13中的任意一个、任意两个、任意三个、任意四个、任意五个、任意六个、任意七个、任意八个、任意九个、任意十个、任意十一个、任意十二个或者全部十三个序列。

9.权利要求1或2所述标志分子、权利要求3～5任意一项所述试剂盒、权利要求6所述评价模型或权利要求7或8所述评价系统在结直肠癌诊断中的应用。

10.权利要求1或2所述标志分子、权利要求3～5任意一项所述试剂盒、权利要求6所述评价模型或权利要求7或8所述评价系统在结直肠癌患者预后评价中的应用。