CN100393886C - 结直肠癌的预后 - Google Patents

结直肠癌的预后 Download PDF

Info

Publication number
CN100393886C
CN100393886C CNB2004100387523A CN200410038752A CN100393886C CN 100393886 C CN100393886 C CN 100393886C CN B2004100387523 A CNB2004100387523 A CN B2004100387523A CN 200410038752 A CN200410038752 A CN 200410038752A CN 100393886 C CN100393886 C CN 100393886C
Authority
CN
China
Prior art keywords
seq
gene
library
value
patient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB2004100387523A
Other languages
English (en)
Other versions
CN1542143A (zh
Inventor
Y·王
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Janssen Diagnostics LLC
Original Assignee
Janssen Diagnostics LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Janssen Diagnostics LLC filed Critical Janssen Diagnostics LLC
Publication of CN1542143A publication Critical patent/CN1542143A/zh
Application granted granted Critical
Publication of CN100393886C publication Critical patent/CN100393886C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H21/00Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids
    • C07H21/04Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids with deoxyribosyl as saccharide radical
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01MCATCHING, TRAPPING OR SCARING OF ANIMALS; APPARATUS FOR THE DESTRUCTION OF NOXIOUS ANIMALS OR NOXIOUS PLANTS
    • A01M1/00Stationary means for catching or killing insects
    • A01M1/08Attracting and catching insects by using combined illumination or colours and suction effects
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57407Specifically defined cancers
    • G01N33/57419Specifically defined cancers of colon
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6834Enzymatic or biochemical coupling of nucleic acids to a solid phase
    • C12Q1/6837Enzymatic or biochemical coupling of nucleic acids to a solid phase using probe arrays or probe chips
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Organic Chemistry (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Analytical Chemistry (AREA)
  • Pathology (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Physics & Mathematics (AREA)
  • Oncology (AREA)
  • Hospice & Palliative Care (AREA)
  • Urology & Nephrology (AREA)
  • Hematology (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Pest Control & Pesticides (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Cell Biology (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Insects & Arthropods (AREA)
  • Environmental Sciences (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

一种通过分析一组基因的表达从而提供结直肠癌预后的方法。多种介质如微阵列中的基因表达模式也包括在内,如含有它们的试剂盒。

Description

结直肠癌的预后
技术领域
本发明涉及一种基于生物样品基因表达模式的结直肠癌的预后方法。
背景技术
结直肠癌是一种起源复杂的异源疾病。一旦患者接受结直肠癌治疗,复发的可能性与肿瘤穿透肠壁的程度和淋巴结累及的存在或缺乏有关。这些特征构成了目前杜克分类定义的分期系统的基础,杜克A类疾病被定义为结肠或直肠的黏膜下层。杜克B类肿瘤通过固有肌层侵入,而且能穿透结肠或直肠壁。杜克C类疾病包括具有区域淋巴结转移而致的任何程度的肠壁侵入。
外科切除术对早期的结直肠癌是很有效的,它对杜克A类患者和B类患者分别能提供95%和75%的治愈率。在杜克C类患者中存在阳性淋巴结预计在5年内复发的可能性为60%。手术后阶段对杜克C类患者进行化疗,可把复发率降至40%-50%,它是现阶段治疗杜克C类患者的标准治疗方法。由于相对低的复发率,手术后的化疗在杜克B类患者中的益处很难检测,而且还存有争议。但是,杜克B分类并不完善,因为大约有20-30%的杜克B类患者其表现更类似于杜克C类患者,而且在5年时间内复发。很显然有必要确定比淋巴结累及更好的预后因子,来指导筛选杜克B类患者中可能复发和将存活的人。
发明内容
本发明涉及一种评估在诊断患有结直肠癌或对结直肠癌进行治疗的患者中结直肠癌复发的可能性的方法。该方法涉及基因表达模式(profile)的分析。
在本发明的一个方面,所述的基因的表达模式包括至少三个基因。
在本发明的另一个方面,所述的基因表达描述包括至少四个基因。
用于实施本发明的方法的制品也是本发明的一个方面。这些制品包括固定于机器可读介质如计算机可读介质上的基因表达模式,或基因表达模式的表示物(representations)。
用于鉴定基因表达模式的制品,也包括用于捕获和/或显示基因表达的存在,缺乏或程度的基体或表面,如微阵列。
本发明的另一个方面为一种试剂盒,其包括进行结直肠癌复发预后的基因表达分析的试剂。
附图说明
图1是患者样品(x-轴)中人脂肪酸结合蛋白基因1强度的测量值(y-轴)的图示。强度越大,表明基因表达越强,该图说明在复发患者中这些基因被下调。
图2是患者样品(x-轴)中人肠肽相关转运基因强度的测量值(y-轴)的图示。强度越大,表明基因表达越强,该图说明在复发患者中这些基因被下调。
图3a是患者样品(x-轴)中MHC II类抗原(HLA-DRB1)基因强度的测量值(y-轴)的图示。强度越大,表明基因表达越强,该图说明在复发患者中这些基因被下调。
图3b是患者样品(x-轴)中免疫球蛋白样转录蛋白5基因强度的测量值(y-轴)的图示。强度越大,表明基因表达越强,该图说明在复发患者中这些基因被下调。
图4是根据实施例中描述的训练组的患者资料构建的标准Kaplan-Meier图。
图5是根据实施例中描述的测试组的患者资料构建的标准Kaplan-Meier图。
图6是根据实施例中描述的所有的患者资料构建的标准Kaplan-Meier图。
图7是标准的ROC曲线。
具体实施方式
组织样品中,仅仅是特定核苷酸序列的存在或缺乏很少被认为具有诊断或预后的价值。另一方面,各种蛋白质,肽或mRNA表达的信息正越来越受到重视。仅仅基因组内具有表达蛋白质,肽或mRNA潜能的核酸序列(这种序列被称为“基因”)的存在,本身不能确定蛋白质,肽或mRNA是否在特定细胞中表达。能表达蛋白质,肽或mRNA的一个特定基因是否表达蛋白质,肽或mRNA以及如果表达,这种表达发生的程度,由多种复杂因素决定。不考虑理解和评估这些因素的困难,测定基因表达能为如肿瘤发生,转移,细胞凋亡及其它临床相关现象等重要事件的出现提供有用信息。在基因表达模式中可以发现基因激活或失活程度的相对指标。本发明的基因表达模式用于为结直肠癌提供预后和治疗。
样品制备需要收集患者样品。本发明方法中使用的患者样品是那些被怀疑含有患病细胞,如从结肠样品或手术野边缘得到的上皮细胞的样品。一种获得被怀疑样品的有用的技术是激光捕获显微切割法(LCM)。LCM技术提供了一种筛选要研究的细胞的方法,并最小化了由细胞类型的不均一导致的变异。因此,正常细胞和癌症细胞间基因表达的中度或细小的差异都可以被容易地检测到。在一种优选的方法中,所述样品包括从外周血中提取的循环表皮细胞。这些样品可以根据多种方法获得,但是最优选的方法为磁分离技术,该技术描述于Imunivest公司的美国专利6136182中,该专利在此引入作为参考。一旦获得了含有感兴趣细胞的样品,就可以提取RNA并进行扩增,获得处于合适的文库(portfolios)中的基因的基因表达模式,优选的是通过微阵列获得。
建立基因表达模式的优选的方法,包括确定编码蛋白质或肽的基因产生的RNA的量。这可通过逆转录酶PCR(RT-PCR),竞争性RT-PCR,实时RT-PCR,差异展示RT-PCR,Northern印迹分析和其它的相关实验来完成。尽管可能使用各个PCR反应完成这些技术,最好扩增mRNA产生的互补DNA(cDNA)或互补RNA(cRNA),并通过微阵列法进行分析。各种不同的阵列构型和生产方法,对于本领域的普通技术人员来说是已知的,并描述于美国专利,如5445934;5532128;5556752;5242974;5384261;5405783;5412087;5424186;5429807;5436327;5472672;5527681;5529756;5545531;5554501;5561071;5571639;5593839;5559695;5624711;5658734;和5700637;在此引入它们的公开内容作为参考。
微阵列技术可以同时测量成千的基因的处于稳态mRNA水平,由此为确定如失控的细胞增殖的启动,阻止,或调节的作用提供了一个强有力的工具。目前广泛使用的为两种微阵列技术。第一种是cDNA阵列,第二种是寡核苷酸阵列。虽然这些芯片存在构造差异,但是基本上所有的下游数据分析和输出是相同的。这些分析的结果,典型地是从用于检测与微阵列中已知位置的核苷酸序列杂交的样品中的cDNA序列的标记探针接收的信号强度的测量值。典型地,信号强度与在样品细胞中表达的cDNA以及的mRNA的量成比例。大量的这种技术是可以获得和有用的。确定基因表达的优选的方法参见,Linsley等的美国专利6271002;Friend等的美国专利6218122;Peck等的美国专利6218114;Wang等的美国专利6004755,在此引入它们的公开内容作为参考。
可以通过比较所述强度来分析表达水平。最好建立一个测试样品与对照样品中基因表达强度的比值矩阵。例如,可以把患病组织的基因表达强度,与从相同类型的正常组织中得到的表达强度进行比较(例如,患病的结肠组织样品与正常结肠组织样品)。这些表达强度的比值显示了测试样品与对照样品之间在基因表达方面的成倍改变。
基因表达模式也可用很多方式显示。最常用的方法是将原始荧光强度或比值矩阵排列为树状图,其中的列表示测试样品,行表示基因。这样排列数据以便具有相似表达模式的基因能彼此接近。每个基因的表达比用一种颜色显示。例如,小于1的比值(表示下调)可以用图谱的蓝色部分表示,而大于1的比例(表示上调)可用图谱的红色部分来表示。商业化的计算机软件程序可用于显示这种数据,这些软件包括来自Silicon Genetics公司的“GENESPRINT”,以及来自Partek公司的“DISCOVERY”和“INFER”软件。
实施例中描述了本发明的方法中使用的受调节基因。差异表达的基因在结直肠癌复发的患者中相对于那些无复发的患者是上调或下调的。上调和下调是相对的术语,其含义为在相对于特定基线的基因表达量中的可检测到差异(超出检测系统的噪音影响)。在这种情况下,基线是非复发患者的测量的基因表达量。用同样方法测量,患病细胞(来自复发患者)中感兴趣的基因,相对于基线水平是上调或者下调的。在上下文中,患病的,是指机体状态发生改变,从而打断或干扰,或者可能干扰机体功能的正常表现,并伴随有细胞的不受孔增殖现象的出现。当某人的基因型或表型的某个方面和某种疾病存在一致的时候,他就被诊断为患了该病。但是,进行诊断或预后的行为包括疾病/状况问题的测定,如测定复发的可能性和治疗的监测。在治疗监测中,通过比较随时间的基因表达,来确定基因表达模式是否已经改变了,或者正在改变到和正常组织更一致的模式来考虑一个确定疗程的效果,从而作出临床判断。
更优选地,可以根据杂交微阵列探针的强度测量值的成倍改变来辨别上调和下调的水平。一个2.0倍差异或p值小于0.5优选用于作出这种区分。也就是说,当一个基因被认为在患病/复发细胞中相对正常/非复发细胞中差异表达前,患病细胞中应产生比正常细胞至少多2倍,或少2倍的强度。倍数差异越大,越优选用该基因作为诊断或预后的工具。本发明的基因表达模式中选用的基因具有能产生可以区别于正常或未调节基因的信号的表达水平,其表达量超过了临床试验仪器的背景。
统计值可信赖地用于将受调节的基因与未调节基因和噪音区分开。统计试验发现在不同组样品之间基因差异显著。斯氏t检验是可用于发现两组之间有显著差异的有效统计检验的一个例子。P值越低,就越能说明不同组之间基因的差异。不过,由于微阵列能一次测量多个基因,那么就需要同时进行数万个统计检验。因此,不可能仅由于偶然看到小的p值,为了进行校正,可以使用Sidak校正和随机化/置换实验。通过t检验得到的p值小于0.05表明基因存在显著差异。在进行Sidak校正后p值小于0.05是更强有力的证据。对于每组中具有大量的样品来说,在随机化/置换实验后p值小于0.05是差异显著的最强有力的证据。
可以用于选择产生比未调节基因或噪音更强的信号的基因的另一个参数为绝对信号差异测量值。优选地,受调节基因表达产生的信号,与正常的或未调节基因(以绝对值为基础)相比至少有20%差异。更优选的是,这种基因的表达模式与正常的或未调节基因的表达模式相比至少有30%的差异。
将基因分组,以便获得的关于关于组中的一系列基因的信息可以为临床相关判断,如诊断,预后,或治疗选择等提供可靠的基础。这些基因系列构成了本发明的文库。在此,由这些文库支持的判断涉及结直肠癌。对于大多数的诊断标记来说,常常希望用最少的标记就足以作出一个正确的医学判断。这就防止了需要进一步的分析导致的治疗延误以及时间和资源的不合理使用。
更优选地,建立文库,从而文库中的这些基因组合,显示出比单个基因或随机选择的基因组合具有更好的灵敏度和特异性。在本发明中,文库的灵敏度可以由基因在患病状态相对于正常状态的表达中显示的成倍变化反应出来。特异性可以基因表达信号与感兴趣条件的相关性的统计学测量值反应出来。例如,标准差可用作这种测量值。在考虑到包括在一个文库中的一组基因时,表达测量值中标准差越小其特异性越大。其它变量的测量值如相关系数在这里也可使用。
建立基因表达文库的一个优选的方法是通过使用最优化算法,如广泛用于建立股票投资组合的平均方差算法。这种方法的详细描述见Tim Jatkoe等,2003年3月21日提交的名为“文库选择”(“Portfolio Selection”)的专利申请。实质上,这种方法要求建立一系列输入值(金融应用中的股票,这里指通过强度检测的表达),该输入值将优化使用其接受的返回值(例如形成的信号),同时使返回值的变异最小。很多商业软件程序可以用来进行这种操作。在整个说明书中称为“Wagner软件”的“Wagner联合均值-方差优化应用程序”是优选的。这个软件使用“Wagner联合均值-方差优化库”的功能来测定有效的边界,同时在Markowitz意义上的优化文库是优选。
使用这种类型的软件要求转换微阵列数据,以便当该软件用于金融分析目的时,数据能以使用股票返回值和风险测量值的方式作为输入值而处理。例如,当Wagner软件与微阵列强度测量值联合使用时,使用下面的数据转换方法。
首先通过确定那些至少显示出有细微表达水平差异的基因而对基因进行预选。优选的预选过程如下。选择基线类(baseline class)。典型地,它包括来自一个不具有感兴趣条件的群体的基因。例如,如果要选择用于对复发性结直肠癌进行预后的基因文库,来自没有复发的患者的样品可用于构成基线类。一旦选择了基线类,就要计算出算术平均值和标准差,作为基线类样品每个基因的基因表达的指标。该指标典型的是微阵列读数的荧光强度。然后用计算出的统计数据计算每个基因的基线值(X*标准差+平均值)。这是基因的基线读数,所有其它样品可以和它比较。X是一个人为选择的严格变量,用以组成文库。高的X值比低的X值更严格。优选地,X值的范围为0.5到3,更优选的是2到3,最优选的为3。
然后计算每个试验样品(显示了感兴趣的条件)与基线读数的比值。为了易于软件进行数据处理,这些比值被转换为底数为10的对数值。这可使基因下调以显示负数值,它对使用Wagner软件根据Markman平均方差算法进行最优化是必须的。
当用于金融分析目的时,将包含这些转换比值的预处理数据作为输入值,从而替代在Wagner软件中通常使用的资产返回值。
一旦确定出了一个有效的边界,选择对一个给定的输入值(返回值)或对应于边界上某个点的方差的最优化文库。这些输入值或方差是建文库的人预先设定的标准。换句话说,寻找最优化文库的人确定一个可接受的输入水平(表明敏感度)或一个给定水平的方差(表明特异性),并选择沿着与该输入水平或方差相应的有效边界的基因。当选择了输入水平或方差时,Wagner软件就能选择出这些基因。Wagner软件可以像对股票组合中每个股票所做的那样,分配基因库中每个基因的权重。
将患者样品的文库中的基因表达,与用于建立该文库的差异表达基因的计算值相比较,就可以确定该样品是否具有该文库所诊断的状况。优选地,首先通过将文库中每个基因的强度值与文库选择过程中该基因分配的权重的乘积求和而产生文库值。然后可以通过(Y*标准差+基线组文库值的平均值)来计算边界值,其中Y是和上述的X有相同含义的严格性值。一个样品具有的文库值大于基线类的文库值时,此样品就被归为具有该状况。如果需要,为了提高置信水平,可以依照已知的统计方法来重复该过程。
任选的,可以重复这个过程直到获得最佳的预测准确性。
文库选择的过程和未知量的鉴定概述如下:
1.选择基线类
2.计算基线组样品中的每个基因的平均值和标准差
3.计算每个基因的(X*标准差+平均值)。这是基线读数,所有其它的样品将和它进行比较。X是一个严格性变量,高的X值比低的X值更严格。
4.计算每个试验样品与在步骤3中计算的基线读数的比值。
5.转换比值,使比值小于1的为负数(如使用底数为10的对数)(下调基因校正为具有MV优化所必须的负值)。
6.这些转换的比值用作输入值,来替代软件应用中通常使用的资产返回值。
7.该软件将标绘出有效的边界,并沿着该有效边界的任何点返回优化的文库。
8.在有效边界上选择理想的返回值或方差。
9.通过对每个基因的强度与文库选择算法产生的权重的乘积求和,计算每个样品的文库值。
10.将基线组的平均文库值加上Y与基线组的文库值的标准差的乘积计算得到边界值。比该边界值大的比值将被划分到试验组。
11.任选的,可以重复该过程直到获得最佳的预测准确性。
可选择地,可以通过确定那些有细小表达差异的基因来预先选择基因。在这种可选择的方法中,预选过程优选的是基于 1 ≤ | ( μ t - μ n ) ( σ t + σ n ) | 给定的阈值,其中μt是已知有疾病或状况的子集的平均值,μn是正常样品的子集的平均值,σtn代表联合的标准差。在根据如 0.5 ≤ | ( μ t - MA X n ) ( σ t + σ n ) | 所述的关系来预选数据过程中,也可以使用信噪比截止值。这保证基于差异调节预选的基因具有临床上的显著差异。也就是,超过了适于测定各种诊断参数的仪器产生的噪音水平。对根据这些标准预选的每一个标记,构建了一个矩阵,其中列代表样品,行代表标记,而且每个元件都是根据对该标记的表达进行标准化后所得到的强度测量值,其中I是强度测量值。
也能设置附加的边界条件来限定最优文库。例如,文库大小可以限定到一个固定范围或数量的际记。这可以通过制定更严格的数据预选标准(如以 0.8 ≤ | ( μ t - MA X n ) ( σ t + σ n ) | 代替 0.5 ≤ | ( μ t - MA X n ) ( σ t + σ n ) | ),或通过使用编程特征如限制文库大小来实现。例如,可以设置边界条件,仅从最优的10个基因中选择有效的边界。也可以使用所有的预选基因来确定有效边界,然后限定选择的基因的数量(例如,不超过10)。
选择文库的过程也包括启发式规则的应用。优选地,这些规则是基于生物学和用于得到临床结果的技术的理解而制定的。更优选地,它们也可用于从优化的方法中输出数据。例如,文库选择的平均方差方法能用于结直肠癌患者中大量差异表达基因的微阵列数据。从该方法中得到的输出值将是一系列优化的基因,其包括一些既在外周血液中也在患病组织中表达的基因。如果用于测试方法中的样品是获自外周血液,而且在乳癌中差异表达的某些基因也能在外周血中差异表达,那么就可以应用启发式规则,其中从排除了那些在外周血液中差异表达的基因的有效边界选择文库。当然,通过例如在数据预选中运用该规则,可以在形成有效边界前运用该规则。
也可以运用与所讨论的生物学问题没有必然联系的其它启发式规则。例如,可以运用只有特定百分比的文库能被特定的一种或多种基因所代表的规则。商业化的软件,如Wagner软件,也容易提供这些类型的启发式规则。这也是有用的,例如,当准确度和精确度以外的因素(如预期的许可费),对包括一个或多个基因的需要性有影响时。
本发明的一种方法包括比较多种基因(或文库)的基因表达模式来进行预后。组成文库的每个基因的基因表达模式被固定于如计算机可读介质等的介质上。这可以采取多种形式。例如,可以建立一个表格,从而将指示疾病的信号(例如,强度测量值)范围输入其中。比较实际患者的数据和表格中的数值,从而确定患者样品是正常还是患病的。在一个更精确的实施方案中,表达信号的模式(如荧光强度)以数字或图形方式记录。再将与患者样品相结合的基因文库的基因表达模式与上述表达模式比较。模式比较软件可用于确定患者样品是否具有指示疾病复发的模式。当然,这些比较也可用于确定患者是否可能经历疾病复发。然后将样品表达模式与对照细胞文库相比较。如果样品表达模式与结直肠癌复发的表达模式一致(无相反的医学考虑),那么该患者将以一个复发患者对待。如果样品表达模式与正常/对照细胞的表达模式一致,那么该患者被诊断为结直肠癌阴性。
许多公知的模式识别方法都可采用。下面的文献可以提供一些实例:
加权投票(Weighted Voting):
Golub,TR,Sclonim,DK.Tamaya,P.,Huard,C.,Gaasenbeek,M.,Mesirov,JP.,Coller,H.,Loh,L.,Downing,JR.,Caligiuri,MA.,Bloomfield,CD.,Lander,ES.癌症的分子分类:利用基因表达监视的类型发现和类型预测。科学(Science)286:531-537,1999
支持矢量机器(Support Vector Machines):
Su,AI.,Welsh,JB.,Sapinoso,LM.,Kern,SG.,Dimitrov,P.,Lapp,H.,Schultz,PG.,Powell,SM.,Moskaluk,CA.,Frierson,HF.Jr.,Hampton,GM.利用基因表达标志的人类癌症的分子分类。癌症研究(Cancer Research)61:7388-93,2001
Ramaswamy,S.,Tamayo,P.,Rifkin,R.,Mukherjee,S.,Yeang,GH.,Angelo,M.,Ladd,C.,Reich,M.,Latulippe,E.,Mesirov,JP.,Poggio,T.,Gerald,W.,Loda,M.,lander,ES.,Gould,TR.利用肿瘤基因表达标志的多种癌症诊断。美国国家科学院院刊(Proceedings ofthe National Academy of Sciences of the USA)98:15149-15154,2001
K-最邻近值(K-nearest Neighbors):
Ramaswamy,S.,Tamayo,P.Rifkin,R,Mukherjee,S.,Yeang,GH.,Angelo,M.,Ladd,C.,Reich,M,Latulippe,E.,Mesirov,JP.,Poggio,T.,Gerald,W.,Loda,M.,Lander,ES.,Gould,TR.利用肿瘤基因表达信号的多种类癌症诊断。美国国家科学院院刊(Proceedingsof the National Academy of Sciences of the USA)98:15149-15154,2001
校正系数(Correlation Coefficients):
van’t Veer LJ,Dai H,van de Vijver MJ,He YD,Hart AA,Mao M,Peterse HL,vander Kooy K,Marton MJ,Witteveen AT,Schreiber GJ,Kerkhoven RM,Roberts C,LinsleyPS,Bernards R,Friend SH.基因表达模式预测乳腺癌的临床结果。自然(Nature)2002 Jan 31:415(6871):530-6。
本发明的基因表达模式也可以与在癌症诊断,预后,或治疗监视中使用的其它非遗传诊断方法联合使用。例如,在一些情况下,把上述的基于基因表达诊断能力的方法,与来自传统的标记,如血清蛋白标记物(如癌胚抗原)的数据结合起来是有益的。这种存在的标记范围包括分析物如CEA。在这样的一个方法中,从治疗的患者中定期采血,然后对上述的血清标记之一进行酶免疫测定。当标记物的浓度显示肿瘤复发或治疗失败时,可对样品源进行基因表达分析。对于存在疑似的肿块的部位,可以进行细针吸取采样,然后用上述方法对从肿块采集的细胞进行基因表达模式分析。可选择地,可以从与先前肿瘤切除的组织相邻的区域采集组织样品。当其它测试结果不明确时,这种方法是特别有效的。
本发明的制品包括在治疗,诊断,预后和评估疾病中使用的基因表达模式的表示物。这些模式表示物压缩至一种可被机器自动读取的介质,如计算机可读介质(磁性的,光学的及类似的)。制品也可包括在这种介质中评估基因表达模式的说明。例如,制品也可包括CD ROM,它具有比较上述基因文库的基因表达模式的计算机说明。制品也可包括数字化记录在其中的基因表达模式,以便用于与患者样品的基因表达数据进行比较。可选择地,模式可以不同的表示形式记录。图形记录就是这样一种格式。上面提到的Partek公司的“DISCOVERY”和“INFER”软件中整合的聚类算法,能最好的协助这些数据可视化。
本发明的制品的不同类型,是用于揭示基因表达模式的介质或格式化的测定。这些可以包括,例如,微阵列,其中序列互补物或探针固定于基质上,指示感兴趣基因的序列与之结合产生一种确定其存在的可读判定。可选择地,本发明的制品可被制作成试剂盒,用于进行杂交,扩增,和产生表示检测结直肠癌的感兴趣基因表达水平的信号。
根据本发明制备的试剂盒,包括确定基因表达模式的格式化测定。这些也包括进行测定所需的所有的或部分的物质,如试剂和说明。
本发明进一步地通过下面的非限制性实施例进行说明。
实施例:根据本发明进行分析的基因,典型地与编码蛋白质或肽产物的全长核酸序列相关。本领域的普通技术人员公认,全长序列的鉴定从分析的角度来说不是必需的。也就是,可以根据熟知的为评估相关基因表达而设计探针的原理进行部分序列或ESTs选择。
实施例1-样品处理和LCM
收集接受结直肠肿瘤外科手术患者的新鲜冷冻组织样品。使用的样品来自根据标准的临床诊断和病理学分期为杜克B类的63个患者。患者的临床结局已知。36个患者已经超过3年没有患病,27个患者在3年内肿瘤复发。
组织在获得后20-30分钟内于液氮中快速冷冻,然后在-80℃下储存。为了激光捕获,将样品切片(6μm),并将一切片封固于载玻片上,另一切片封固于已被固定于玻璃载玻片(Micro Slides Colorfrost,VWR Scientific,Media,PA)上的膜(P.A.L.M.)上。封固于玻璃载片上的切片随后在冷的丙酮中固定,并用Mayer’s苏木精(Sigma,St.Louis,MO)染色。病理学家将该为样品用于诊断和分期而进行分析。根据外科病理学分析和验证杜克分类体系的临床报告来评价其临床阶段。封固于膜上的切片随后在100%乙醇中固定5分钟,在曙红/100%乙醇(100μg曙红溶于100ml脱水乙醇)中负染1分钟,快速在100%乙醇中浸泡一次以除去游离的染料,并空气中干燥10分钟。
在LCM使用前,膜(LPC-MEMBERANE PEN FOIL 1.35μmNo.8100,P.A.L.M.GmbH Mikrolaser Technologie,Bernried,Germany)和载玻片经过预处理以除去RNA酶,并且增强组织样品在膜上的附着。简要的,载玻片用DEP H2O洗涤,膜用RNA酶AWAY(Molecular Bioproducts,Inc.,SanDiego,CA)洗涤并用DEP H2O冲洗。膜附着到载玻片上后,载玻片于+120℃烘烤8小时,用TI-SAD(Diagnostic Products Corporation,Los Angeles,CA,以1∶50溶于DEP H2O,用脱脂棉过滤)处理,+37℃孵育30分钟。使用前,立即将10μl RNA酶抑制剂溶液等分物(RNA酶蛋白质抑制剂2500U=33U/μlN211A,Promega GmbH,Mannheim,Germany,0.5μl溶于400μl冷的含有0.15molNaCl,10mmol Tris pH8.0,0.25mmol二硫苏糖醇的溶液)铺展到膜上,在此封固组织样品。
封固于膜上的组织切片用于LCM。利用连接于Zeiss Axiovert 135显微镜(Carl Zeiss Jena GmbH,Jena,Germany)的PALM Robot微光束技术(P.A.L.M.Microlaser Technologie,Carl Zeiss,Inc.,Thornwood,NY)可捕获约2000个上皮细胞/样品。正常粘膜周围的基质和癌症样品中偶然的干扰基质成分都包括在内。捕获到的细胞置于100%乙醇的小管中于-80℃保存。
实施例2-RNA提取和扩增
利用Zymo-Spin柱(Zymo Research,Orange,CA92867)从LCM捕获的样品中提取总RNA。将约2ng的总RNA重悬于10μl水并且利用T7 RNA聚合酶进行两轮扩增产生约为50μg的扩增的RNA。
实施例3-cDNA微阵列杂交和定量
用从Affymetrix公司获得并商业化的人U133a芯片,利用包括约23,000个人的cDNA克隆的一套cDNA微阵列来检测样品。获得总RNA并用上述的制备方法制备,将其应用于芯片并根据制造商的使用说明采用AgilentBioAnalyzer进行分析。所有的63个样品均通过质量控制标准检测,并将数据用于标记物选择。
芯片强度数据通过Affymetrix公司商业化的5.0版本的MAS软件(“MAS5.0”)进行分析。如下所述,进行无监督分析用于确定区别复发患者和不复发患者的两个基因。采用上述方法获得的芯片强度数据,作为输入值输入商业化的PARTEK5.1版软件的无监督聚类软件中。这种无监督聚类算法确定了一组高频率复发的20个患者(13个复发者和7个存活者)。从最初的23,000个基因中,t-检验分析选择了在这些患者中显著差异表达的276个基因。从该组中,选择了能最好区别复发患者和不复发患者的两种基因:人肠肽相关转运蛋白(Seq ID No.3)和人脂肪酸结合蛋白1(Seq ID No.1)。在该患者组中,这两种基因在复发患者中下调(实际上,它们被关闭或不表达)。该结果示于图1和图2中,其中信号强度(y-轴)对患者样品数(x-轴)作图。
监督分析用于更进一步区别剩下的43个患者中的复发患者和不复发患者。这组患者数据分为如下的组:27个患者被分配至训练组,16个患者被分配至测试组。这确保了同样的数据不用于先确定标记,然后再验证它们的用途。
对训练组进行不等方差t检验。从有显著相关p值的一列28个基因中,选择MHC II-DR-B。这些基因在复发者中是下调的。MHC II-DR-B(Seq IDNo.2)也有最小的p值(图3a)。
在另一轮附加的监督分析中,采用上述的Partek 5.0版本软件来实现用于线性辨别分析的变量选择程序,从而在训练组中区别复发者和存活者。该搜索方法为正向选择。经最低后误差选择的变量为免疫球蛋白样转录蛋白5(Seq IDNo.4)(图3b)。然后用Cox比例危险模型(用nsightful公司的“S Plus”软件)进行基因选择,用于证实上述基因选择的存活时间。在全部27个循环的每个循环中,训练组中27个患者中的每一个都进行该步骤,剩下的26个患者采用单变量Cox回归模型来评估基因表达与患者存活时间相关性的强度。这种相关性的强度,由相应的估计的标准化参数估计值和从Cox模型回归返回的P值来评价。0.01的P值为用作从留一法(leave-one-out)基因选择的每个循环中选择最高基因的域值。然后比较那些从每个循环中选择的最高基因,以便从全部27个留一法(leave-one-out)基因选择循环中选择出至少有26次显示上调的那些基因。总共选择出了70个基因,MHC II-DR-B和免疫球蛋白样转录蛋白5也在其中(再一次,显示下调)。
多基因预测标准的构建:通过线性辨别分析,用两个基因,MHC II-DR-B和免疫球蛋白样转录蛋白5,产生预测标准。投票分数被定义为复发的后验概率。如果患者的分数高于0.5,患者被划分到复发者一类。如果患者的分数低于0.5,患者被划分到存活者一类。在训练组中测验该预测标准(表1)。对预测的复发者和存活者构建Kaplan-Meier曲线(图4)。
交叉证实和预测标准评估:预测标准应该基于一个独立数据组来确定,因为大多数分类方法在用于它们的建立的实例中都很有效。16个患者的测试组被用于评估预测的准确性。分类的截止值通过使用ROC曲线(图5)来确定。根据选择的截止值,确定并概括了测试组中复发和存活患者的正确预测数目(表2)。根据预测的复发者和存活者构建了Kaplan-Meier曲线(图6)。
总体预测:63个杜克B结直肠癌患者的基因表达模式确定了在这些患者中差异表达(下调或关闭)的4个基因。这些基因是Seq ID No.1,Seq ID No.2,SeqID No.3,和Seq ID No.4。这些患者中有36个已经超过3年无病,而27个患者在3年内肿瘤复发。用Seq ID No.2,Seq ID No.3,和Seq ID No.4这3个基因标记物文库,正确地确定了27个复发患者中的22个和36个无病患者中的27个。结果显示了该方法具有82%的灵敏度和75%的特异性。阳性预测值是71%,阴性预测值是84%(表3)。根据预测的复发者和存活者构建了Kaplan-Meier曲线(图6)。
包括本发明模式的基因在下文中描述。
人脂肪酸结合蛋白1(FABP1):
人的肝脂肪酸结合蛋白(L-FABP)基因首先由Smith LC等在Bio.Chem.260(5),2629-2632(1985)中从肝脏cDNA文库中鉴定出。L-FABP包含127个氨基酸残基。脂肪酸结合蛋白是一个能结合长链脂肪酸和其它的疏水配体的小而高度保守的细胞质蛋白质家族。研究认为,FABPs的功能包括脂肪酸摄取,转运和代谢。它们也可能负责调节细胞的生长和增殖。L-FABP与在结肠组织中特异性表达的I-FABP有显著的同源性。
人肠肽相关转运蛋白HPT-1mRNA:
来自Eli Lilly公司的一组科学家鉴定了这个基因。论文发表于Science,1994年4月15日,264(5157):430-3。这个基因编码一个大约92kda的膜蛋白,它的氨基酸序列表明,这个转运相关蛋白与钙依赖性,细胞-细胞粘附蛋白的钙粘着蛋白超家族共有几个保守结构元件。
人MHC II类抗原(HLA-DRB1)mRNA:
这个基因于1997年在一个西班牙婴儿中首次发现,并发表于组织抗原(Tissue Antigens),1997年1月,49(6):658-61。正如其名称表示的那样,它属于MHC II类抗原超家族。这个基因编码267个氨基酸的蛋白质。
人克隆6的免疫球蛋白样转录蛋白5的mRNA:
该基因编码一个不仅由NK和T细胞的亚型表达,也由B细胞,单核细胞,巨噬细胞和树突细胞表达的免疫球蛋白超家族的抑制性MHC I类受体的蛋白产物。该分子包含194个氨基酸。序列发表在J Exp Med,1997年12月1日,186(11):189-18上。该受体结合了MHC I类分子,并递送抑制NK和T细胞导致的杀伤,以及抑制B细胞抗原受体和人组织相容性白细胞抗原(HLA)-DR引发的B细胞和骨髓单核细胞中的Ca2+动员的负信号。
人羟甲基胆色烷合成酶(也可称为胆色素原脱氨基酶-PBGD):
该基因作为对照基因。这是实体瘤和正常组织间的一个最少变异的基因。其序列首次发表于Nucleic Acids Res,14(15),5955-5968(1986)。
表1.在训练组中采用2基因预测标准的预测准确度
Figure C20041003875200181
表2.在测试组中采用2基因预测标准的预测准确度
Figure C20041003875200182
表3.对全部患者采用3基因预测标准(Seq ID 2,Seq ID 3,Seq ID 4)的预测准确度
序列表
<110>Y.王
<120>结直肠癌的预后
<130>CDS5005
<140>tbd
<141>2003-03-31
<160>5
<170>PatentIn version 3.1
<210>1
<211>489
<212>DNA
<213>人
<400>1
agagccgcag gtcagtcgtg aagagggagc tctattgcca ccatgagttt ctccggcaag   60
taccaactgc agagccagga aaactttgaa gccttcatga aggcaatcgg tctgccggaa  120
gagctcatcc agaaggggaa ggatatcaag ggggtgtcgg aaatcgtgca gaatgggaag  180
cacttcaagt tcaccatcac cgctgggtcc aaagtgatcc aaaacgaatt cacggtgggg  240
gaggaatgtg agctggagac aatgacaggg gagaaagtca agacagtggt tcagttggaa  300
ggtgacaata aactggtgac aactttcaaa aacatcaagt ctgtgaccga actcaacggc  360
gacataatca ccaataccat gacattgggt gacattgtct tcaagagaat cagcaagaga  420
atttaaacaa gtctgcattt catattattt tagtgtgtaa aattaatgta ataaagtgaa  480
ctttgtttt                                                          489
<210>2
<211>853
<212>DNA
<213>人
<400>2
gcctgctgct ctggcccctg gtcctgtcct gttctccagc atggtgtgtc tgaggctccc  60
tggaggctcc tgcatggcag ttctgacagt gacactgatg gtgctgagct ccccactggc    120
tttggctggg gacaccagac cacgtttctt ggagtactct acgtctgagt gtcatttctt    180
caatgggacg gagcgggtgc ggtacctgga cagatacttc cataaccagg aggagaacgt    240
gcgcttcgac agcgacgtgg gggagttccg ggcggtgacg gagctggggc ggcctgctgc    300
ggagcactgg aacagccaga aggacctcct ggagcagaag cggggccggg tggacaacta    360
ctgcagacac aactacgggg ttgtggagag cttcacagtg cagcggcgag tccatcctaa    420
ggtgactgtg tatccttcaa agacccagcc cctgcagcac cataacctcc tggtctgttc    480
tgtgagtggt ttctatccag gcagcattga agtcaggtgg ttccggaatg gccaggaaga    540
gaagactggg gtggtgtcca caggcctgat ccacaatgga gactggacct tccagaccct    600
ggtgatgctg gaaacagttc ctcggagtgg agaggtttac acctgccaag tggagcaccc    660
aagcgtgaca agccctctca cagtggaatg gagagcacgg tctgaatctg cacagagcaa    720
gatgctgagt ggagtcgggg gctttgtgct gggcctgctc ttccttgggg ccgggctgtt    780
catctacttc aggaatcaga aaggacactc tggacttcag ccaagaggat tcctgagctg    840
aagtgcagat gac                                                       853
<210>3
<211>3345
<212>DNA
<213>人
<400>3
gaattccgtc tcgaccactg aatggaagaa aaggactttt aaccaccatt ttgtgactta     60
cagaaaggaa tttgaataaa gaaaactatg atacttcagg cccatcttca ctccctgtgt    120
cttcttatgc tttatttggc aactggatat ggccaagagg ggaagtttag tggacccctg    180
aaacccatga cattttctat ttatgaaggc caagaaccga gtcaaattat attccagttt    240
aaggccaatc ctcctgctgt gacttttgaa ctaactgggg agacagacaa catatttgtg    300
atagaacggg agggacttct gtattacaac agagccttgg acagggaaac aagatctact    360
cacaatctcc aggttgcagc cctggacgct aatggaatta tagtggaggg tccagtccct    420
atcaccatag aagtgaagga catcaacgac aatcgaccca cgtttctcca gtcaaagtac   480
gaaggctcag taaggcagaa ctctcgccca ggaaagccct tcttgtatgt caatgccaca   540
gacctggatg atccggccac tcccaatggc cagctttatt accagattgt catccagctt   600
cccatgatca acaatgtcat gtactttcag atcaacaaca aaacgggagc catctctctt   660
acccgagagg gatctcagga attgaatcct gctaagaatc cttcctataa tctggtgatc   720
tcagtgaagg acatgggagg ccagagtgag aattccttca gtgataccac atctgtggat   780
atcatagtga cagagaatat ttggaaagca ccaaeacctg tggagatggt ggaaaactca   840
actgatcctc accccatcaa aatcactcag gtgcggtgga atgatcccgg tgcacaatat   900
tccttagttg acaaagagaa gctgccaaga ttcccatttt caattgacca ggaaggagat   960
atttacgtga ctcagccctt ggaccgagaa gaaaaggatg catatgtttt ttatgcagtt  1020
gcaaaggatg agtacggaaa accactttca tatccgctgg aaattcatgt aaaagttaaa  1080
gatattaatg ataatccacc tacatgtccg tcaccagtaa ccgtatttga ggtccaggag  1140
aatgaacgac tgggtaacag tatcgggacc cttactgcac atgacaggga tgaagaaaat  1200
actgccaaca gttttctaaa ctacaggatt gtggagcaaa ctcccaaact tcccatggat  1260
ggactcttcc taatccaaac ctatgctgga atgttacagt tagctaaaca gtccttgaag  1320
aagcaagata ctcctcagta caacttaacg atagaggtgt ctgacaaaga tttcaagacc  1380
ctttgttttg tgcaaatcaa cgttattgat atcaatgatc agatccccat ctttgaaaaa  1440
tcagattatg gaaacctgac tcttgctgaa gacacaaaca ttgggtccac catcttaacc  1500
atccaggcca ctgatgctga tgagccattt actgggagtt ctaaaattct gtatcatatc  1560
ataaagggag acagtgaggg acgcctgggg gttgacacag atccccatac caacaccgga  1620
tatgtcataa ttaaaaagcc tcttgatttt gaaacagcag ctgtttccaa cattgtgttc  1680
aaagcagaaa atcctgagcc tctagtgttt ggtgtgaagt acaatgcaag ttcttttgcc  1740
aagttcacgc ttattgtgac agatgtgaat gaagcacctc aattttccca acacgtattc  1800
caagcgaaag tcagtgagga tgtagctata ggcactaaag tgggcaatgt gactgccaag  1860
gatccagaag gtctggacat aagctattca ctgaggggag acacaagagg ttggcttaaa    1920
attgaccacg tgactggtga gatctttagt gtggctccat tggacagaga agccggaagt    1980
ccatatcggg tacaagtggt ggccacagaa gtaggggggt cttccttaag ctctgtgtca    2040
gagttccacc tgatccttat ggatgtgaat gacaaccctc ccaggctagc caaggactac    2100
acgggcttgt tcttctgcca tcccctcagt gcacctggaa gtctcatttt cgaggctact    2160
gatgatgatc agcacttatt tcggggtccc cattttacat tttccctcgg cagtggaagc    2220
ttacaaaacg actgggaagt ttccaaaatc aatggtactc atgcccgact gtctaccagg    2280
cacacagact ttgaggagag ggcgtatgtc gtcttgatcc gcatcaatga tgggggtcgg    2340
ccacccttgg aaggcattgt ttctttacca gttacattct gcagttgtgt ggaaggaagt    2400
tgtttccggc cagcaggtca ccagactggg atacccactg tgggcatggc agttggtata    2460
ctgctgacca cccttctggt gattggtata attttagcag ttgtgtttat ccgcataaag    2520
aaggataaag gcaaagataa tgttgaaagt gctcaagcat ctgaagtcaa acctctgaga    2580
agctgaattt gaaaaggaat gtttgaattt atatagcaag tgctatttca gcaacaacca    2640
tctcatccta ttacttttca tctaacgtgc attataattt tttaaacaga tattccctct    2700
tgtcctttaa tatttgctaa atatttcttt tttgaggtgg agtcttgctc tgtcgcccag    2760
gctggagtac agtggtgtga tcccagctca ctgcaacctc cgcctcctgg gttcacatga    2820
ttctcctgcc tcagcttcct aagtagctgg gtttacaggc acccaccacc atgcccagct    2880
aatttttgta tttttaatag agacggggtt tcgccatttg gccaggctgg tcttgaactc    2940
ctgacgtcaa gtgatctgcc tgccttggtc tcccaataca ggcatgaacc actgcaccca    3000
cctacttaga tatttcatgt gctatagaca ttagagagat ttttcatttt tccatgacat    3060
ttttcctctc tgcaaatggc ttagctactt gtgtttttcc cttttggggc aagacagact    3120
cattaaatat tctgtacatt ttttctttat caaggagata tatcagtgtt gtctcataga    3180
actgcctgga ttccatttat gttttttctg attccatcct gtgtcccctt catccttgac    3240
tcctttggta tttcactgaa tttcaaacat ttgtcagaga agaaaaaagt gaggactcag    3300
gaaaaataaa taaataaaag aacagccttt tgcggccgcg aattc                    3345
<210>4
<211>1924
<212>DNA
<213>人
<400>4
ccatgacgcc cgccctcaca gccctgctct gccttgggct gagtctgggc cccaggaccc      60
gcatgcaggc agggcccttc cccaaaccca ccctctgggc tgagccaggc tctgtgatca     120
gctgggggag ccccgtgacc atctggtgtc aggggagcct ggaggcccag gagtaccaac     180
tggataaaga gggaagccca gagccctggg acagaaataa cccactggaa cccaagaaca     240
aggccagatt ctccatccca tccatgacac agcaccatgc agggagatac cgctgccact     300
attacagctc tgcaggctgg tcagagccca gcgaccccct ggagctggtg atgacaggat     360
tctacaacaa acccaccctc tcagccctgc ccagccctgt ggtggcctca ggggggaata     420
tgaccctccg atgtggctca cagaagggat atcaccattt tgttctgatg aaggaaggag     480
aacaccagct cccccggacc ctggactcac agcagctcca cagtgggggg ttccaggccc     540
tgttccctgt gggccccgtg acccccagcc acaggcgtgt ctaggaagcc ctccctcctg     600
accctgcagg gccctgtcct ggcccctggg cagagcctga ccctccagtg tggctctgat     660
gtcggctacg acagatttgt tctgtataag gagggggaac gtgacttcct ccagcgccct     720
ggccagcagc cccaggctgg gctctcccag gccaacttca ccctgggccc  tgtgagccgc    780
tcctacgggg gccagtacag gtgctatggt gcacacaacc tctcctccga gtggtcggcc     840
cccagtgacc ccctggacat cctgatcaca ggacagatct atgacaccgt ctccctgtca     900
gcacagccgg gccccacagt ggcctcagga gagaacatga ccctgctgtg tcagtcacgg     960
gggtattttg acactttcct tctgaccaaa gaaggggcag cccatccccc actgcgtctg    1020
agatcaatgt acggagctca taagtaccag gctgaattcc ccatgagtcc tgtgacctca    1080
gcccacgcgg ggacctacag gtgctacggc tcacgcagct ccaaccccca cctgctgtct    1140
ttccccagtg agcccctgga actcatggtc tcaggacact ctggaggctc cagcctccca  1200
cccacagggc cgccctccac acctggtctg ggaagatacc tggaggtttt gattggggtc  1260
tcggtggcct tcgtcctgct gctcttcctc ctcctcttcc tcctcctccg acgtcagcgt  1320
cacagcaaac acaggacatc tgaccagaga aagactgatt tccagcgtcc tgcaggggct  1380
gcggagacag agcccaagga caggggcctg ctgaggaggt ccagcccagc tgctgacgtc  1440
caggaagaaa acctctagcc cacacgatga agacccccag gcagtgacgt atgccccggt  1500
gaaacactcc agtcctagga gagaaatggc ctctcctccc tcctcactgt ctggggaatt  1560
cctggacaca aaggacagac aggtggaaga ggacaggcag atggacactg aggctgctgc  1620
atctgaagcc tcccaggatg tgacctacgc ccagctgcac agcttgaccc ttagacggaa  1680
ggcaactgag cctcctccat cccaggaagg ggaacctcca gctgagccca gcatctacgc  1740
cactctggcc atccactagc ccggggggta cgcagacccc acactcagca gaaggagact  1800
caggactgct gaaggcacgg gagctgcccc cagtggacac cagtgaaccc cagtcagcct  1860
ggacccctaa cacagaccat gaggagacgc tgggaacttg tgggactcac ctgactcaaa  1920
gatg                                                               1924
<210>5
<211>1536
<212>DNA
<213>人
<400>5
gtgacgcgag gctctgcgga gaccaggagt cagactgtag gacgacctcg ggtcccacgt   60
gtccccggta ctcgccggcc ggagcccccg gcttcccggg gccgggggac cttagcggca  120
cccacacaca gcctactttc caagcggagc catgtctggt aacggcaatg cggctgcaac  180
ggcggaagaa aacagcccaa agatgagagt gattcgcgtg ggtacccgca agagccagct  240
tgctcgcata cagacggaca gtgtggtggc aacattgaaa gcctcgtacc ctggcctgca  300
gtttgaaatc attgctatgt ccaccacagg ggacaagatt cttgatactg cactctctaa  360
gattggagag aaaagcctgt ttaccaagga gcttgaacat gccctggaga agaatgaagt  420
ggacctggtt gttcactcct tgaaggacct gcccactgtg cttcctcctg gcttcaccat     480
cggagccatc tgcaagcggg aaaaccctca tgatgctgtt gtctttcacc caaaatttgt     540
tgggaagacc ctagaaaccc tgccagagaa gagtgtggtg ggaaccagct ccctgcgaag     600
agcagcccag ctgcagagaa agttcccgca tctggagttc aggagtattc ggggaaacct     660
caacacccgg cttcggaagc tggacgagca gcaggagttc agtgccatca tcctggcaac     720
agctggcctg cagcgcatgg gctggcacaa ccgggtgggg cagatcctgc accctgagga     780
atgcatgtat gctgtgggcc agggggcctt gggcgtggaa gtgcgagcca aggaccagga     840
catcttggat ctggtgggtg tgctgcacga tcccgagact ctgcttcgct gcatcgctga     900
aagggccttc ctgaggcacc tggaaggagg ctgcagtgtg ccagtagccg tgcatacagc     960
tatgaaggat gggcaactgt acctgactgg aggagtctgg agtctagacg gctcagatag    1020
catacaagag accatgcagg ctaccatcca tgtccctgcc cagcatgaag atggccctga    1080
ggatgaccca cagttggtag gcatcactgc tcgtaacatt ccacgagggc cccagttggc    1140
tgcccagaac ttgggcatca gcctggccaa cttgttgctg agcaaaggag ccaaaaacat    1200
cctggatgtt gcacggcagc ttaacgatgc ccattaactg gtttgtgggg cacagatgcc    1260
tgggttgctg ctgtccagtg cctacatccc gggcctcagt gccccattct cactgctatc    1320
tggggagtga ttaccccggg agactgaact gcagggttca agccttccag ggatttgcct    1380
caccttgggg ccttgatgac tgccttgcct cctcagtatg tgggggcttc atctctttag    1440
agaagtccaa gcaacagcct ttgaatgtaa ccaatcctac taataaacca gttctgaagg    1500
taaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaa                              1536
1
7

Claims (17)

1.选自Seq ID No.1,Seq ID No.2,Seq ID No.3和Seq ID No.4所示基因核酸序列或其互补序列的组合在制备用于评估结直肠癌状况的预后文库中的用途。
2.权利要求1所述的用途,其中所述组合为Seq ID No.1,Seq ID No.2,Seq IDNo.3和Seq ID No.4。
3.权利要求1所述的用途,其中所述组合为Seq ID No.2,Seq ID No.3和Seq ID No.4。
4.一种用于评估结直肠癌患者预后的预后文库,包括选自Seq ID No.1,SeqID No.2,Seq ID No.3和Seq ID No.4所示基因核酸序列或其互补序列的组合。
5.权利要求4所述的文库,其中所述组合为Seq ID No.1,Seq ID No.2,Seq IDNo.3和Seq ID No.4。
6.权利要求4所述的文库,其中所述组合为Seq ID No.2,Seq ID No.3和Seq ID No.4。
7.权利要求4所述的文库,位于适用于鉴定其中所含的基因的差异表达的基质中。
8.权利要求7所述的文库,其中所述的基质用于微阵列中。
9.权利要求8所述的文库,其中所述的微阵列是cDNA微阵列。
10.权利要求8所述的文库,其中所述的微阵列是寡核苷酸微阵列。
11.一种用于确定结直肠癌患者的预后的试剂盒,包括用于检测选自Seq IDNo.1,Seq ID No.2,Seq ID No.3和Seq ID No.4所示基因核酸序列或其互补序列的组合的物质。
12.权利要求11的试剂盒,其中所述的组合为Seq ID No.2,Seq ID No.3和Seq ID No.4。
13.权利要求11的试剂盒,其中所述的组合为Seq ID No.1,Seq ID No.2,SeqID No.3和Seq ID No.4。
14.权利要求11的试剂盒,包括进行微阵列分析的试剂。
15.权利要求11的试剂盒,进一步包括所述的核苷酸序列或它们的互补序列通过其进行分析的介质。
16.选自Seq ID No.1,Seq ID No.2,Seq ID No.3和Seq ID No.4所示基因核酸序列或其互补序列的组合在制备用于评估对结直肠癌治疗的反应的预后文库中的用途。
17.用于评估结直肠癌状况的制品,包括用于鉴定选自Seq ID No.1,Seq IDNo.2,Seq ID No.3和Seq ID No.4所示基因核酸序列或其互补序列的组合的物质。
CNB2004100387523A 2003-03-31 2004-03-31 结直肠癌的预后 Expired - Fee Related CN100393886C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/403,449 US20040191782A1 (en) 2003-03-31 2003-03-31 Colorectal cancer prognostics
US10/403449 2003-03-31

Publications (2)

Publication Number Publication Date
CN1542143A CN1542143A (zh) 2004-11-03
CN100393886C true CN100393886C (zh) 2008-06-11

Family

ID=32989938

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2004100387523A Expired - Fee Related CN100393886C (zh) 2003-03-31 2004-03-31 结直肠癌的预后

Country Status (14)

Country Link
US (1) US20040191782A1 (zh)
EP (1) EP1526186B1 (zh)
JP (1) JP4913331B2 (zh)
KR (1) KR101088583B1 (zh)
CN (1) CN100393886C (zh)
AR (1) AR043808A1 (zh)
AT (1) ATE412070T1 (zh)
AU (1) AU2004201348B2 (zh)
BR (1) BRPI0403169A (zh)
CA (1) CA2464894C (zh)
CL (1) CL2004000700A1 (zh)
DE (1) DE602004017265D1 (zh)
ES (1) ES2316932T3 (zh)
MX (1) MXPA04003044A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102766679A (zh) * 2011-05-04 2012-11-07 上海人类基因组研究中心 通过二基因表达情况预测大肠癌术后无复发生存的检测方法、探针组和诊断试剂盒

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7297480B2 (en) * 2001-06-28 2007-11-20 Dermtech International Method for detection of melanoma
US20040191782A1 (en) * 2003-03-31 2004-09-30 Yixin Wang Colorectal cancer prognostics
CA2475769C (en) * 2003-08-28 2018-12-11 Veridex, Llc Colorectal cancer prognostics
WO2005054508A2 (en) * 2003-12-01 2005-06-16 Ipsogen Gene expression profiling of colon cancer by dna microarrays and correlation with survival and histoclinical parameters
US7183057B2 (en) * 2004-03-31 2007-02-27 Dermtech International Tape stripping methods for analysis of skin disease and pathological skin state
DE102005026710A1 (de) * 2005-06-09 2006-12-14 Basf Ag Verfahren zum Testen von Substanzen oder Substanzgemischen, dessen Verwendung und entsprechende Analysekits
NZ544432A (en) * 2005-12-23 2009-07-31 Pacific Edge Biotechnology Ltd Prognosis prediction for colorectal cancer using a prognositc signature comprising markers ME2 and FAS
CN101437962A (zh) * 2006-03-03 2009-05-20 维里德克斯有限责任公司 预测杜克氏b结肠癌复发的分子检测
WO2008021183A2 (en) * 2006-08-10 2008-02-21 Millennium Pharmaceuticals, Inc. For the identification, assessment, and treatment of patients with cancer therapy
AU2008247502A1 (en) * 2007-05-04 2008-11-13 Dermtech International Diagnosis of melanoma by nucleic acid analysis
FR2919060B1 (fr) 2007-07-19 2012-11-30 Biomerieux Sa Procede de dosage de l'ezrine pour le diagnostic in vitro du cancer colorectal.
US9726670B2 (en) * 2007-07-19 2017-08-08 Biomerieux Method for the assay of liver fatty acid binding protein, ACE and CA 19-9 for the in vitro diagnosis of colorectal cancer
FR2919063B1 (fr) * 2007-07-19 2009-10-02 Biomerieux Sa Procede de dosage du leucocyte elastase inhibitor pour le diagnostic in vitro du cancer colorectal.
FR2919064B1 (fr) * 2007-07-19 2009-10-02 Biomerieux Sa Procede de dosage de l'apolipoproteine all pour le diagnostic in vitro du cancer colorectal
FR2919061B1 (fr) * 2007-07-19 2009-10-02 Biomerieux Sa Procede de dosage de la plastine-i pour le diagnostic in vitro du cancer colorectal.
FR2919062B1 (fr) * 2007-07-19 2009-10-02 Biomerieux Sa Procede de dosage de l'aminoacylase 1 pour le diagnostic in vitro du cancer colorectal.
FR2919065B1 (fr) 2007-07-19 2009-10-02 Biomerieux Sa Procede de dosage de l'apolipoproteine ai pour le diagnostic in vitro du cancer colorectal
ES2332557B1 (es) * 2007-12-04 2011-02-02 Universidad Autonoma De Madrid Huella genomica para el pronostico de la evolucion de adenocarcinoma colorectal.
BRPI0907440A2 (pt) * 2008-01-22 2016-11-01 Veridex Llc estadiamento molecular de câncer de cólon em estágio ii e iii prognóstico
CN102089444A (zh) 2008-05-14 2011-06-08 德玛泰克国际公司 利用核酸分析方法来诊断黑素瘤和太阳能雀斑
FR2933773B1 (fr) 2008-07-10 2013-02-15 Biomerieux Sa Procede de dosage de la proteine disulfide isomerase pour le diagnostic in vitro du cancer colorectal
EP2977469A1 (en) * 2008-08-28 2016-01-27 Dermtech International Determining age ranges of skin samples
EP3752645A4 (en) 2018-02-14 2022-04-13 Dermtech, Inc. NEW GENE CLASSIFIERS AND THEIR USES IN NON-MELANOMA SKIN CANCERS
US11578373B2 (en) 2019-03-26 2023-02-14 Dermtech, Inc. Gene classifiers and uses thereof in skin cancers

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB8822228D0 (en) * 1988-09-21 1988-10-26 Southern E M Support-bound oligonucleotides
US5242974A (en) * 1991-11-22 1993-09-07 Affymax Technologies N.V. Polymer reversal on solid surfaces
US5143854A (en) * 1989-06-07 1992-09-01 Affymax Technologies N.V. Large scale photolithographic solid phase synthesis of polypeptides and receptor binding screening thereof
US5527681A (en) * 1989-06-07 1996-06-18 Affymax Technologies N.V. Immobilized molecular synthesis of systematically substituted compounds
US5424186A (en) * 1989-06-07 1995-06-13 Affymax Technologies N.V. Very large scale immobilized polymer synthesis
IL103674A0 (en) * 1991-11-19 1993-04-04 Houston Advanced Res Center Method and apparatus for molecule detection
US5412087A (en) * 1992-04-24 1995-05-02 Affymax Technologies N.V. Spatially-addressable immobilization of oligonucleotides and other biological polymers on surfaces
US5384261A (en) * 1991-11-22 1995-01-24 Affymax Technologies N.V. Very large scale immobilized polymer synthesis using mechanically directed flow paths
US5554501A (en) * 1992-10-29 1996-09-10 Beckman Instruments, Inc. Biopolymer synthesis using surface activated biaxially oriented polypropylene
US7229770B1 (en) * 1998-10-01 2007-06-12 The Regents Of The University Of California YKL-40 as a marker and prognostic indicator for cancers
US5472672A (en) * 1993-10-22 1995-12-05 The Board Of Trustees Of The Leland Stanford Junior University Apparatus and method for polymer synthesis using arrays
US5429807A (en) * 1993-10-28 1995-07-04 Beckman Instruments, Inc. Method and apparatus for creating biopolymer arrays on a solid support surface
US5545531A (en) * 1995-06-07 1996-08-13 Affymax Technologies N.V. Methods for making a device for concurrently processing multiple biological chip assays
WO2001094629A2 (en) * 2000-06-05 2001-12-13 Avalon Pharmaceuticals Cancer gene determination and therapeutic screening using signature gene sets
US6812339B1 (en) 2000-09-08 2004-11-02 Applera Corporation Polymorphisms in known genes associated with human disease, methods of detection and uses thereof
US20030194734A1 (en) * 2002-03-29 2003-10-16 Tim Jatkoe Selection of markers
US7348142B2 (en) * 2002-03-29 2008-03-25 Veridex, Lcc Cancer diagnostic panel
US20040191782A1 (en) * 2003-03-31 2004-09-30 Yixin Wang Colorectal cancer prognostics

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
Association of intestinal peptide transport with a proteinrelated to the cadherin superfamily.. Anne H.Dantzig et al.Science,Vol.264 No.5157. 1994
Association of intestinal peptide transport with a proteinrelated to the cadherin superfamily.. Anne H.Dantzig et al.Science,Vol.264 No.5157. 1994 *
Descriotion of two new found in a spanish infant. N.Martinex qulies et al.TISSUE ANTIGENG,No.49. 1997
Descriotion of two new found in a spanish infant. N.Martinex qulies et al.TISSUE ANTIGENG,No.49. 1997 *
Human liver fatty acid binding proten cNDA and aminoacidequence. FUNC TIONOAL ET AL.THE JOURANL OF BIOLOGICAL CHEMISTRY,Vol.260 No.5. 1985
Human liver fatty acid binding proten cNDA and aminoacidequence. FUNC TIONOAL ET AL.THE JOURANL OF BIOLOGICAL CHEMISTRY,Vol.260 No.5. 1985 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102766679A (zh) * 2011-05-04 2012-11-07 上海人类基因组研究中心 通过二基因表达情况预测大肠癌术后无复发生存的检测方法、探针组和诊断试剂盒
CN102766679B (zh) * 2011-05-04 2015-02-25 上海人类基因组研究中心 通过二基因表达情况预测大肠癌术后无复发生存的检测方法、探针组和诊断试剂盒

Also Published As

Publication number Publication date
KR20040088384A (ko) 2004-10-16
EP1526186A2 (en) 2005-04-27
AU2004201348B2 (en) 2008-04-10
US20040191782A1 (en) 2004-09-30
ATE412070T1 (de) 2008-11-15
CN1542143A (zh) 2004-11-03
AU2004201348A1 (en) 2004-10-14
CA2464894A1 (en) 2004-09-30
JP4913331B2 (ja) 2012-04-11
BRPI0403169A (pt) 2005-09-20
CA2464894C (en) 2014-02-11
ES2316932T3 (es) 2009-04-16
EP1526186B1 (en) 2008-10-22
DE602004017265D1 (de) 2008-12-04
CL2004000700A1 (es) 2005-02-25
MXPA04003044A (es) 2005-07-01
EP1526186A3 (en) 2005-08-17
KR101088583B1 (ko) 2011-12-05
JP2004329211A (ja) 2004-11-25
AR043808A1 (es) 2005-08-17

Similar Documents

Publication Publication Date Title
CN100393886C (zh) 结直肠癌的预后
JP5295761B2 (ja) 甲状腺穿刺吸引分子分析
US8183353B2 (en) Breast cancer prognostics
ES2962775T3 (es) Método para predecir el pronóstico de pacientes con cáncer de mama
KR101530689B1 (ko) 직장결장암용 예후 예측
US10266902B2 (en) Methods for prognosis prediction for melanoma cancer
JP4409845B2 (ja) 癌診断パネル
Galamb et al. Dysplasia-carcinoma transition specific transcripts in colonic biopsy samples
MX2014009283A (es) Algoritmo de perfil de expresion genica y prueba para determinar la prognosis de cancer de prostata.
KR20030078803A (ko) 마커의 선택
US20110159492A1 (en) Diffuse Large B-Cell Lymphoma Markers and Uses Therefore
CN101194166A (zh) 有关乳癌分类的材料和方法
JP2009153522A (ja) 結腸直腸癌の評価
KR20030078805A (ko) 유방암 예후 포트폴리오
JP4354725B2 (ja) 結腸直腸癌の評価
US20050048494A1 (en) Colorectal cancer prognostics
CA2475769C (en) Colorectal cancer prognostics
EP2906713A1 (en) Micro-rna biomarkers for prostate cancer

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20080611

Termination date: 20150331

EXPY Termination of patent right or utility model