CN104755627A - 用于肝样本的分类和局灶性结节不典型增生、肝细胞腺瘤和肝细胞癌的诊断的新方法 - Google Patents

用于肝样本的分类和局灶性结节不典型增生、肝细胞腺瘤和肝细胞癌的诊断的新方法 Download PDF

Info

Publication number
CN104755627A
CN104755627A CN201380048859.3A CN201380048859A CN104755627A CN 104755627 A CN104755627 A CN 104755627A CN 201380048859 A CN201380048859 A CN 201380048859A CN 104755627 A CN104755627 A CN 104755627A
Authority
CN
China
Prior art keywords
expression level
sample
hca
gene
liver
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201380048859.3A
Other languages
English (en)
Inventor
A·德雷尼斯
P·洛朗-普伊赫
J·楚克曼-罗西
J-C·诺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ying Tegaigen Co
Universite Paris 5 Rene Descartes
National Institute of Health Sciences
Original Assignee
Ying Tegaigen Co
Universite Paris 5 Rene Descartes
National Institute of Health Sciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ying Tegaigen Co, Universite Paris 5 Rene Descartes, National Institute of Health Sciences filed Critical Ying Tegaigen Co
Publication of CN104755627A publication Critical patent/CN104755627A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P1/00Drugs for disorders of the alimentary tract or the digestive system
    • A61P1/16Drugs for disorders of the alimentary tract or the digestive system for liver or gallbladder disorders, e.g. hepatoprotective agents, cholagogues, litholytics
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P43/00Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/112Disease subtyping, staging or classification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/16Primer sets for multiplex assays

Abstract

本发明涉及肝疾病、其分类和诊断的技术领域。本发明提供了一种新方法,该方法使用用参照样本校准的算法、根据体外基因表达谱的确定和表达谱的分析,用于分类非肝细胞样本间的肝样本;进一步分类为亚组G1至G6之一的肝细胞癌(HCC)样本;局灶性结节不典型增生(FNH)样本;进一步分类为HNF1A突变的HCA、炎性HCA、β连环蛋白突变的HCA或其它HCA样本的肝细胞腺瘤(HCA)样本;和其它良性肝样本。本发明还提供了用于分类肝样本的试剂盒,以及根据对受试者肝样本的初步分类治疗所述受试者中肝疾病的方法。

Description

用于肝样本的分类和局灶性结节不典型增生、肝细胞腺瘤和肝细胞癌的诊断的新方法
技术领域
本发明涉及肝疾病、其分类和诊断的技术领域。本发明提供了一种新方法,该方法使用用参照样本校准的算法、根据体外基因表达谱的确定和表达谱的分析,用于分类非肝细胞样本间的肝样本;进一步分类为亚组G1至G6之一的肝细胞癌(HCC)样本;局灶性结节不典型增生(FNH)样本;进一步分类为HNF1A突变的HCA、炎性HCA、β连环蛋白突变的HCA或其它HCA样本的肝细胞腺瘤(HCA)样本;和其它良性肝样本。本发明还提供了用于分类肝样本的试剂盒,以及根据对受试者肝样本的初步分类治疗所述受试者中肝疾病的方法。
背景技术
肝细胞癌(HCC)代表全球范围癌症引起死亡的首要原因之一(EI Serag HNEJM 2011)。尽管广泛使用成像/非侵入性标准诊断肝硬化发展的HCC,即使病理学专家而言,HCC和其它肝肿瘤的鉴别诊断仍然很困难(国际用药评议小组(international consensus group)2009)。在这种背景下,再生和不典型增生的大结节、胆管癌或其它组织来源的转移癌组成了典型的陷阱(Forner A Lancet 2012)。此外,非侵袭性标准还没有被证实用于诊断非肝硬化发展的HCC,这样的HCC占西方国家病例的10%,而在东方国家超过20%(Forner A Hepatology 2008)。在这种背景下,肿瘤活检是强制性,以及鉴别诊断良性肝肿瘤(局灶性结节性增生、FNH和肝细胞腺瘤、HCA)可能是具有挑战性的,尤其在分化非常好的HCC和HCA之间的鉴别(Bioulac-Sage P,sem liv dis 2011)。
此外,HCA组成良性肝肿瘤的异质组,而且最近发现其基因型/表型的分类与预后相关(Zucman Rossi J Hepatology 2006;Van aalten SM J hepatol 2011)。描述了四组HCA(HNF1A突变、β连环蛋白突变、炎性和未分类肝细胞腺瘤),具有激活β连环蛋白的突变的HCA与HCC中增加的恶性转化风险相关。
因此,良性和恶性肝细胞肿瘤包括由特定表型和分子特征定义的各种肿瘤的亚组,这导致了诊断陷阱和评估其预后的困难。
因此,需要新的工具,以帮助临床医生和病理学家在临床实践中可靠地区分可能存在于肝样本的各种类型的组织(是否是肝细胞;如果是肝细胞,是良性或恶性;如果是良性肝细胞,是局灶结节增生、肝细胞腺瘤、或二者均不是;如果是肝细胞腺瘤,其类型),因此能够可靠地分类来自疑似患有肝肿瘤的受试者的肝样本。
实际上,根据肝样本分类,以及从而根据最终诊断,患者将被给予不同的处理:
-如果是良性局灶性结节增生(FNH),建议放弃治疗,不需要随访;
-如果是良性肝细胞腺瘤(HCA),通常的治疗包括手术切除或放弃治疗,随访。最佳治疗的选择还可以取决于HCA更精确的分类成HNF1A突变的、炎性的和β连环蛋白突变的HCA。例如,如果样本被诊断为小于5cm的HNF1A突变的HCA,可能仅仅随访,即影像/临床随访是特别有用的,因为出血和恶变的风险低。如果样本被诊断为大小大于5cm的HNF1A突变的HCA,手术切除治疗可能是特别有用的,因为出血的风险。如果样本被诊断为大小小于5cm的炎性HCA,仅仅随访,即影像/临床随访可能是特别有用的,因为出血和恶变的风险低。如果样本被诊断为大小大于5cm的炎性HCA,则手术切除治疗可能是特别有用的,因为出血的风险。如果样本被诊断为β连环蛋白突变的HCA,无论大小,手术切除的治愈性治疗可能是特别有用的,因为恶性转化的风险高。
-如果是肝细胞癌(HCC),第一次治疗通常包括肿瘤手术切除,但如果肿瘤手术切除是不可能的,可使用替代治疗。此外,各种辅助疗法可能在肿瘤手术切除后进行。这样的辅助疗法包括细胞毒性化疗(特别是阿霉素,或者,吉西他滨和奥沙利铂的联合)和/或靶向治疗(特别是索拉非尼)。最好的治疗策略(包括使用或不使用辅助疗法)的选择可取决于更精确的HCC类型(见WO2007/063118A1中所描述的HCC分类成亚组G1至G6之一)和/或取决于患者的预后。特别是,如果预后不良,一般给予辅助疗法,然而,如果预后良好,则不按部就班地使用辅助疗法。此外,如果肝样本进一步分类为HCC亚组G1,则用IGFR1抑制剂治疗可能是特别有用的,因为胰岛素生长因子途径的活化。如果肝样本被进一步分类为HCC亚组G1或G2,则用Akt/mtor抑制剂治疗可能是特别有用的,因为对akt/mtor途径的激活。如果肝样本已被进一步分类为HCC亚组G3,则用蛋白酶抑制剂治疗可能是特别有用的,因为细胞/周期基因失调。如果肝样本被进一步分类为HCC亚组G5或G6,则用Wnt抑制剂治疗可能是特别有用的,因为Wnt/连环蛋白途径的活化。
在这种背景下,基于受试者肝样本的分子谱的简单的分类/诊断工具将是非常有益的。
几个基因已经被关联到肝样本的分类或特定肝疾病的诊断。例如,在Odom等人-2004中描述了在肝细胞和非肝细胞组织中差异表达的基因。已在Llovet等人-2006,Capurro等人-2003,Chuma等人-2003,Tsunedomi等人-2005和Kondoh等人-1999中鉴定了与良性或恶性肝肿瘤相关的基因。已经在Rebouissou等人-2008和Paradis等人-2003中公开了局灶性结节增生(FNH)中差异表达的基因。在Rebouissou等人-2007和Bioulac Sage等人-2007中公开了HNF1A突变的HCA中差异表达的基因。在Boyault等人-2007,Bioulac Sage等人-2007,Cadoret等人-2002,Yamamoto等人-2005,Benhamouche等人-2006,和Rebouissou等人-2008中已经描述了与β连环蛋白突变相关的基因。在Rebouissou等人-2009和Bioulac Sage等人-2007中公开了炎性HCA中差异表达的基因。
然而,在现有技术中没有公开真正允许简单且可靠地分类各种类型肝脏疾病中肝样本的方法,以及简单且可靠地诊断肝脏中非肝癌组织的存在、恶性肝细胞癌(HCC)、良性局灶性结节增生(FNH)、肝细胞腺瘤及其亚型的方法。
基于从各种类型肝样本获得的微阵列和定量PCR数据分析的一个新的策略,本发明人构建了一种简单且可靠的分子算法用于精确分类和诊断肝样本。特别是,本发明人已建立了几个标签,其能够:
·可靠地区分肝细胞和非肝细胞样本(其它组织起源的转移,胆管癌)或者区分良性和恶性(肝细胞癌)肝细胞样本;
·精确诊断存在局灶性结节增生(FNH)或肝细胞腺瘤(HCA)的良性肝癌样本;和
·精确诊断HCA样本中的HCA样本类型:HNF1A突变的HCA、炎性HCA、β连环蛋白突变的HCA或其它HCA。
55个基因的一整组允许可靠地分类肝样本的所有那些类型之间的肝脏。
发明内容
因此,本发明涉及一种用于在体外分类作为非肝细胞样本、肝细胞癌(HCC)样本、局灶性结节不典型增生(FNH)样本、肝细胞腺瘤(HCA)样本或其它良性肝样本的肝样本的方法,所述方法包括:
a)在体外确定来自所述肝样本的包括或由以下38个基因组成的表达谱:EPCAM,HNF4A,CYP3A7,FABP1,HAL,AFP,GNMT,TFRC,C8A,CAP2,LCAT,ANGPT2,AURKA,CDC20,DHRS2,LYVE1,ADM,ANGPTL7,GLUL,ANGPT1,HMGB3,GMNN,RAMP3,RHBG,UGT2B7,LGR5,RARRES2,RBM47,GIMAP5,AKR1B10,GLS2,KRT19,ESR1,SDS,MERTK,EPHA1,CCL5和CYP2C9,和任选地一个或多个内部对照基因,或其等效表达谱;
b)根据对包含或由以下9个基因组成的表达谱测得的表达水平:EPCAM,HNF4A,CYP3A7,FABP1,HAL,AFP,GNMT,TFRC和C8A,和任选地一个或多个内部对照基因,或其等效表达谱,使用至少一种用至少一个参照肝样本校准的算法,确定所述肝样本是肝细胞或是非肝细胞样本;
c)如果所述肝样本是肝细胞样本,则根据对包含或由以下9个基因组成的表达谱测得的表达水平:AFP,CAP2,LCAT,ANGPT2,AURKA,CDC20,DHRS2,LYVE1和ADM,和任选地一个或多个内部对照基因,或其等效表达谱,使用至少一种用至少一个参照肝样本校准的算法,确定所述肝细胞样本是HCC样本或是良性肝细胞样本;
d)如果所述肝样本是良性肝细胞样本,则根据对包含或由以下13个基因组成的表达谱测得的表达水平:HAL,ANGPTL7,GLUL,ANGPT1,HMGB3,GMNN,RAMP3,RHBG,UGT2B7,LGR5,RARRES2,RBM47和GIMAP5,和任选地一个或多个内部对照基因,或其等效表达谱,使用至少一种用至少一个参照肝样本校准的算法,确定所述良性肝细胞样本是否是FNH样本;
e)如果所述肝样本是良性肝细胞样本,则根据对包含或由以下13个基因组成的表达谱测得的表达水平:HAL,CYP3A7,LCAT,LYVE1,AKR1B10,GLS2,KRT19,ESR1,SDS,MERTK,EPHA1,CCL5和CYP2C9,和任选地一个或多个内部对照基因,或其等效表达谱,使用至少一种用至少一个参照肝样本校准的算法,确定所述良性肝细胞样本是否是HCA样本;
f)如果所述良性肝细胞样本既不是FNH样本也不是HCA样本,则其被分类为其它良性肝样本。
在一个有利的实施方案中,根据本发明的方法还包括,如果肝样本被诊断为HCA样本,通过以下步骤将所述HCA样本分类为以下HCA亚组之一:HNF1A突变的HCA,炎性HCA,β连环蛋白突变的HCA或其它HCA:
a)进一步体外确定来自所述HCA样本的包含或由以下8个额外的基因组成的表达谱:HAMP,SAA2,NRCAM,REG3A,AMACR,TAF9,LAPTM4B和IGF2BP3;
b)根据对包含或由以下4个基因组成的表达谱测得的表达水平:FABP1,ANGPT2,DHRS2和UGT2B7,和任选地一个或多个内部对照基因,或其等效表达谱,使用至少一种用至少一个参照肝样本校准的算法,确定所述HCA样本是否是HNF1A突变的HCA样本;
c)根据对包含或由以下7个基因组成的表达谱测得的表达水平:ANGPT2,GLS2,EPHA1,CCl5,HAMP,SAA2和NRCAM,和任选地一个或多个内部对照基因,或其等效表达谱,使用至少一种用至少一个参照肝样本校准的算法,确定所述HCA样本是否是炎性HCA样本;
d)根据对包含或由以下13个基因组成的表达谱测得的表达水平:TFRC,HAL,CAP2,GLUL,HMGB3,LGR5,GIMAP5,AKR1B10,REG3A,AMACR,TAF9,LAPTM4B和IGF2BP3,和任选地一个或多个内部对照基因,或其等效表达谱,使用至少一种用至少一个参照肝样本校准的算法,确定所述HCA样本是否是β连环蛋白突变的HCA样本;
e)如果所述HCA样本既不是HNF1A突变的HCA样本,炎性HCA样本,也不是β连环蛋白突变的HCA样本,则其被分类为其它HCA样本。
在另一个有利的实施方案中,根据本发明的方法还包括,如果肝样本被诊断为HCC样本,将所述HCC样本分类为通过下述表1中记载的临床和遗传主要特征限定的亚组G1至G6之一:
其中通过以下分类:
a)进一步体外确定来自所述HCC样本的包含或由以下11个额外的基因组成的表达谱:RAB1A,REG3A,NRAS,PIR,LAMA3,G0S2,HN1,PAK2,CDH2,HAMP和SAE1;和
b)根据对包含或由以下16个基因组成的表达谱测得的表达水平:RAB1A,REG3A,NRAS,RAMP3,MERTK,PIR,EPHA1,LAMA3,G0S2,HN1,PAK2,AFP,CYP2C9,CDH2,HAMP和SAE1,和任选地一个或多个内部对照基因,或其等效表达谱,计算6个亚组的距离;和
c)将所述HCC肿瘤分类为亚组距离是最低的亚组。
这种将HCC样本分类为亚组G1至G6已详尽地描述于WO2007/063118A1中,涉及这样的分类的内容在此通过参照并入本文。
在一个优选的实施方案中,HCC样本被分类为亚组G1至G6之一,使用下面的公式计算所述HCC样本至每个亚组GK的距离,1≤k≤6:
其中,对于各基因t和亚组Gk,μ(亚组Gk,基因t)和σ(基因t)的值如下:
μ G1 G2 G3 G4 G5 G6 σ
基因1(RAB1A) -16.39 -16.04 -16.29 -17.15 -17.33 -16.95 0.23
基因2(PAP) -28.75 -27.02 -23.48 -27.87 -19.23 -11.33 16.63
基因3(NRAS) -16.92 -17.41 -16.25 -17.31 -16.96 -17.26 0.27
基因4(RAMP3) -23.54 -23.12 -25.34 -22.36 -23.09 -23.06 1.23
基因5(MERTK) -18.72 -18.43 -21.24 -18.29 -17.03 -16.16 7.23
基因6(PIR) -18.44 -19.81 -16.73 -18.28 -17.09 -17.25 0.48
基因7(EPHA1) -16.68 -16.51 -19.89 -17.04 -18.70 -21.98 1.57
基因8(LAMA3) -20.58 -20.44 -20.19 -21.99 -18.77 -16.85 2.55
基因9(G0S2) -14.82 -17.45 -18.18 -14.78 -17.99 -16.06 3.88
基因10(HN1) -16.92 -17.16 -15.91 -17.88 -17.72 -17.93 0.54
基因11(PAK2) -17.86 -16.56 -16.99 -18.14 -17.92 -17.97 0.58
基因12(AFP) -16.68 -12.36 -26.80 -27.28 -25.97 -23.47 14.80
基因13(CYP2C9) -18.27 -16.99 -16.26 -16.23 -13.27 -14.44 5.47
基因14(CDH2) -15.20 -14.76 -18.91 -15.60 -15.48 -17.32 10.59
基因15(HAMP) -19.53 -20.19 -21.32 -18.51 -25.06 -26.10 13.08
基因16(SAE1) -17.37 -17.10 -16.79 -18.22 -17.72 -18.16 0.31
在上述根据本发明的方法中,当HCC样本被进一步分类为亚组G1至G6之一时,或当HCA样本被进一步分类为HNF1A突变的HCA样本、炎性HCA样本或β连环蛋白突变的HCA样本时,可以仅作为一个步骤同时地、或者作为两个不同步骤分别地进行体外确定用于总分类的第一表达谱和用于进一步亚组分类的第二表达谱的两个步骤。优选地,它们仅作为一个步骤同时地进行,因为这是进行该步骤的最简单的方式。
在根据本发明的上述方法中,参照样本用来为了校准算法或距离函数,然后其可被用于分类新的肝样本。在本发明方法的有利的实施方案中,用于校准用于解释表达谱的算法或距离函数的参照样本如下:
a)对于确定肝样本是否是肝细胞样本:至少一个(优选几个)肝细胞样本和至少一个(优选几个)非肝细胞样本;
b)对于确定肝细胞样本是否是HCC样本:至少一个(优选几个)良性样本和至少一个(优选几个)HCC样本;
c)对于确定良性肝细胞样本是否是FNH样本:至少一个(优选几个)FNH样本和至少一个(优选几个)非FNH良性肝细胞样本;
d)对于确定良性肝细胞样本是否是HCA样本:至少一个(优选几个)HCA样本和至少一个(优选几个)非HCA良性肝细胞样本;
e)对于确定HCA样本是否是HNF1A突变的HCA样本:至少一个(优选几个)HNF1A突变的HCA样本和至少一个(优选几个)非HNF1A突变的HCA样本;
f)对于确定HCA样本是否是炎性HCA样本:至少一个(优选几个)炎性HCA样本和至少一个(优选几个)非炎性HCA样本;
g)对于确定HCA样本是否是β连环蛋白突变的HCA样本:至少一个(优选几个)β连环蛋白突变的HCA样本和至少一个(优选几个)非β连环蛋白突变的HCA样本;和
h)对于将HCC样本分类为亚组G1至G6之一:各G1至G6亚组中的至少一个(优选几个)样本。
由“受试者”,是指任何人类受试者,无论性别或年龄。
由“肝样本”,是指由受试者肝脏的一部分获得的任何样本。由“肝细胞”肝样本,是意指分析的肝样本主要由肝细胞或肝细胞的祖细胞组成,其可能或者没有转变。相反地,通过“非肝细胞”肝样本,是意指肝样本主要由不是肝细胞或肝细胞的祖细胞的其它细胞组成。非肝细胞的肝样本特别是包括主要由非肝细胞来源的转移癌(如,例如,肺癌,乳腺癌,结肠癌或皮肤癌)组成的肝样本,以及主要由胆管癌组成的肝样本,胆管癌是由突变的上皮细胞(或显示上皮细胞分化特性的细胞)组成的癌,其起源于从肝脏吸取胆汁从进入小肠的胆管。因而,胆管癌发生在肝脏,但是由非肝细胞组成。
由“恶性肝细胞样本”、“肝细胞癌”或“HCC”,是意指肝的肝细胞或肝细胞祖细胞的主要恶性肿瘤。HCC通常通过组织学分析确诊,并且其特征在于具有升高的核质比例的肝细胞增殖、小梁结构和非典型核。
良性肝细胞样本包括受FNH或HCA影响的样本,和其它良性肝细胞样本。由“局灶性结节增生”或“FNH”,是指肝脏的良性肿瘤,其一般特点是在60-70%的病例可见中央星状瘢痕。镜下,最常见的模式是平状(bland-appearing)肝细胞的小叶增生,伴有胆汁胆管增生和纤维瘢痕内的畸形血管。其它模式包括毛细血管扩张、增生的腺瘤和伴有局灶性大细胞不典型增生的病变。其通常是通过组织学分析诊断。由“肝细胞腺瘤”、“肝腺瘤”、“肝腺瘤”或“HCA”,是指一种良性肝肿瘤,其特征在于由带有气泡空泡细胞质的肝细胞片组成的边界清楚的结节。肝细胞通常是在网状支架上和小于或等于3个细胞厚。其通常是通过组织学分析诊断。HCA的亚组包括“HNF1A突变的HCA”,其是一种特征在于在HNF1A基因中存在突变的HCA,“β连环蛋白突变的HCA”,其是一种特征在于β连环蛋白基因中存在突变的HCA,“炎性HCA”,其是一种特征在于组织学和免疫组织化学分析下存在炎性浸润、肝窦扩张、营养不良性动脉和SAA蛋白过表达的HCA,以及对应于既不是HNF1A“突变的HCA、β连环蛋白突变的HCA、也不是炎性HCA的HCA样本的“其它HCA”。其它良性肝细胞样本包括健康的肝样本、肝硬化肝样本和再生大结节样本(具有或不具有不典型增生)。由“再生大结节”时,是指对坏死、循环改变或其它刺激反应而形成的大于3mm的肝结节,其特征在于,具有或不具有细胞不典型增生的良性肝细胞。其通常是通过组织学分析诊断。
在根据本发明的方法中,进行了肝样本分析。这样的肝样本可以显着地是肝活检或部分或整个肝脏肿瘤手术切除样本。用于校准算法和距离函数的参照样本也是肝样本,优选与分析的那些类型相同。
根据本发明的上述方法是根据在体外测定包含或由特定基因组成的特定表达谱。需要55个基因进行了最完整的分类(非肝细胞;将HCC进一步分类成亚组G1到G6之一;FNH;将HCA进一步分类为HNF1A突变的HCA,炎性HCA,β连环蛋白突变的HCA或其它HCA;和良性肝样本)。关于那55个基因的信息在下面的表2中提供:
表2:描述了包含在分类算法中的55个基因,以及认为是等价物的基因,即,在HCC样本中表达的至多10个基因与原基因最好地相关,Pearson相关系数是≥0.3或≤-0.3。
在根据本发明的上述方法中,为了区别肝细胞/非肝细胞样本、良性/恶性肝细胞样本、FNH/非FNH良性肝细胞样本、HCA/非HCA良性肝细胞样本、HNF1A突变的/非HNF1A突变的HCA样本、炎性/非炎性HCA样本和β连环蛋白突变的/非β连环蛋白突变的HCA样本,对包含或由特定基因组成的表达谱,或者其等效表达谱进行了分析。由“表达谱”,是指包括在表达谱中的一组基因的表达水平。由“包含”,是指该表达谱可进一步包含其他基因。相反,由“由......组成”,意指没有进一步的基因存在于所分析的表达谱中。由“其等效表达谱”或“EEP”,是指原始表达谱(对于该原始表达谱所述EEP是等效的),其中添加、缺失或取代基因中的某些(优选至多1或2个基因),并不显著改变诊断的可靠性,即,对于这些添加、缺失或取代,灵敏度(Sen)值、特异性(Spe)值、阳性预测值(PPV)和阴性预测值(NPV)降低不超过10%。
灵敏度、特异性、PPV和NPV是那些本领域技术人员公知的常规统计参数。
灵敏度涉及识别阳性结果的测试能力,其是患此病且测试此病呈阳性的人数的比例。
特异性涉及识别阴性结果的测试能力,其定义为没有患此病且测试此病为阴性的患者的比例。
阳性预测值(PPV)是真阳性的阳性测试结果的比例。
阴性预测值(NPV)被定义为被正确诊断的阴性测试结果的受试者比例。
在一个优选的实施方案中,等效表达谱包括在选择的基因组合的基因中一个被等效基因取代的表达谱。在本说明书中,当用“基因B”取代表达谱中的“基因A”不显著影响测试性能,即灵敏度(Sen)值、特异性(Spe)值、阳性预测值(PPV)和阴性预测值(NPV)的降低不超过10%时,第一基因(“基因A”)可以被视为等同于另一个第二基因(“基因B”)。典型的例子是,当“基因A”与“基因B”相关时,意味着“基因A”的表达统计上与“基因B”的表达水平相关,如通过如Pearson相关系数测量来确定的。相关性可以是正的(意味着当“基因A”在患者体内上调时,则“基因B”在同一患者也上调),或负的(当“基因A”在患者体内上调时,则“基因B”在同一患者下调)。在上述表2中提及了本发明人使用定量PCR分析的103个基因中最多10个基因,其与全分类必需的55个基因的每一个是最好相关性的,并且具有平均Pearson相关系数≥0.3或≤-0.3。
由“确定表达谱”,是指测量一组选择基因的表达水平。每个基因的表达水平可以在体外使用本领域中已知的任何技术在蛋白或在核酸水平来确定。
例如,体外测量特定蛋白在蛋白水平的表达水平可通过本领域技术人员所熟知的任何剂量方法进行,包括但不限于ELISA或质谱分析。这些技术容易地被任何肝脏样本采用。事实上,可以使用本领域技术人员公知的各种技术提取肝样本的蛋白,用于在溶液中的ELISA或质谱测量。或者,可以使用质谱直接在组织切片上分析肝样本中的蛋白表达水平。
在根据本发明的方法的一个优选实施方案中,表达谱是在体外在核酸水平上确定。可直接对信使RNA(mRNA)、或对逆转录的互补DNA(cDNA)进行在核酸水平上的基因表达水平的体外测量。可以使用任何方法测量表达水平,包括但不限于微阵列分析、定量PCR、Southern分析。在根据本发明方法的优选实施方案中,使用核酸微阵列在体外确定表达谱,特别是使用寡核苷酸的微阵列确定表达谱。在根据本发明方法的另一个优选的实施方案中,使用定量PCR在体外确定表达谱。在任何情况下,优选任何基因的表达水平是归一化的。有许多方法用于归一化获得的表达数据,这取决于用于测量表达的技术。这样的方法是本领域技术人员所熟知的。在一些实施方案中,可与内部对照基因的表达水平比较进行归一化,内部对照基因通常是持家基因,包括但不限于核糖体RNA(如,例如18S核糖体RNA),或基因如HPRT1(次黄嘌呤磷酸核糖基转移酶1)、UBC(泛素C)、YWHAZ(酪氨酸3-单加氧酶/色氨酸5-单加氧酶激活蛋白,ζ多肽)、B2M(β-2-微球蛋白)、GAPDH(甘油醛-3-磷酸脱氢酶)、FPGS(叶酰聚谷氨酸合酶)、DECR1(2,4-二烯酰基CoA还原酶1,线粒体)、PPIB(肽基脯氨基异构酶B(亲环蛋白B))、ACTB(肌动蛋白β)、PSMB2(蛋白酶体(前体,巨蛋白因子(macropain))亚基,β型,2)、GPS1(G蛋白途径抑制剂1)、CANX(钙联接蛋白)、NACA(新生多肽相关复合α亚基)、TAX1BP1(Tax1(人类T细胞白血病病毒I型)结合蛋白1)和PSMD2(蛋白酶体(前体,巨蛋白因子)26S亚基,非ATP酶,2)。
在本发明的上下文中,用于预后的基因“表达值”(也称为“表达水平”)包括以下二者:
·非归一化的原始表达值,和
·原始表达值衍生的值,其可进一步被归一化,无论用于归一化的方法。
特别是,当定量PCR被用于体外测量用于预后的基因表达值时,可以使用从原始表达值衍生的值,其选自ΔCt,-ΔCt,ΔΔCT或-ΔΔCT。
当微阵列被用于体外测量用于预后的基因表达值时,通常使用原始表达值衍生的对数值(特别是衍生的log2)(其可被或不被进一步地归一化)。
这些技术也很容易被任何肝样本采用。事实上,本领域技术人员可获得一些公知的技术,用于从组织样本中提取mRNA并将mRNA逆转录成cDNA。
许多算法可以用于解释表达谱,以区别肝细胞/非肝细胞样本、良性/恶性肝细胞样本、FNH/非FNH良性肝细胞样本、HCA/非HCA良性肝细胞样本、HNF1A突变的/非HNF1A突变的HCA样本、炎性/非炎性HCA样本和β连环蛋白突变的/非β连环蛋白突变的HCA样本。值得注意的是,适当的算法包括PLS(偏最小二乘)回归、支持向量机制(SVM)、线性回归或其衍生的算法(如缩写为GLM的广义线性模型,包括逻辑回归)、线性判别分析(LDA,包括对角线线性判别分析(DLDA))、对角二次方程判别分析(DQDA)、随机森林、K-NN(最近邻)或PAM(微阵列的预测分析)算法。
通常被称为训练数据的一组参照样本被用于选择优化的统计算法,其最好分隔好坏预后(如决策规则)。最好的分隔通常是错误分类尽可能少的样本,且具有最好的机会以良好等同地对不同数据集进行分析。
对于二进制结果,如良好/不良的预后,可以使用线性回归或广义线性模型(简称为GLM),包括逻辑回归。
线性回归是基于线性回归函数的确定,其通式可以表示为:
f(x1,...,xN)=β21x1+...+βxxx
逻辑回归是基于逻辑回归函数的确定:
f ( z ) = e z e z + 1 = 1 1 + e - z ,
其中,z通常被定义为
z=β01x1+...+βNxN
在上述线性或逻辑回归函数中,X1至XN是标签中N个基因的表达值(或其衍生的值,如定量PCR的ΔCT、-ΔCt、ΔΔCT或-ΔΔCT,或微阵列的对数化值),β0是截距,和β1~βN是回归系数。
截距值和回归系数值是基于一组参照样本(“训练数据”)来测定。线性值或逻辑回归函数值则定义了测试表达谱具有良好或不良预后(当基于训练数据来定义线性或逻辑回归函数时,用户决定概率是良好或不良预后的概率)的概率。然后,根据具有良好或不良预后的概率是低于还是高于基于训练数据测定的具体阈值,将测试表达谱分类为具有良好或不良预后。有时,使用两个阈值来限定未确定的区域。也可以使用其他类型的广义线性模型而不是逻辑回归。
替代方法如最近邻(缩写为k-NN)也常用于新样本,基于样本是更接近良好预后组还是不良预后组。“更接近”的概念是在由用于预后的N个基因(因此不包括用于归一化目的的潜在持家基因)组成的标签所限定的n维空间中基于距离(度量,例如但不限于欧几里德距离)的选择。计算在测试表达谱和所有参照良好或不良预后表达谱之间的距离,通过分析k个最接近的参照样本(k是至少为1的正整数,最通常为3或5)将样本进行分类,预建立的分类规则依赖于在k个最接近的参照表达谱中良好或不良预后参照表达谱的数量。例如,当k为1时,如果最接近的参照表达谱是良好预后表达谱,则测试表达谱被分类为良好预后;如果最接近的参照表达谱是不良预后表达谱,则为不良预后。当k为2时,如果两个最接近的参照表达谱是良好预后表达谱,则测试表达谱被分类为响应,如果两个最接近的参照表达谱是不良预后表达谱,则测试表达谱被分类为不响应,如果两个最接近的参照表达谱包括良好预后和不良预后表达谱,则测试表达谱被分类为未确定。当k为3时,如果三个最接近的参照表达谱中的至少两个是良好预后表达谱,则测试表达谱被分类为良好预后,如果三个最接近的参照表达谱中的至少两个是不良预后表达谱,则测试表达谱被分类为不良预后。更常见的,当k为p时,如果p个最接近的参照表达谱中超过半数是良好预后表达谱,则测试表达谱被分类为良好预后,如果p个最接近的参照表达谱中超过半数是不良预后表达谱则测试表达谱被分类为不良预后。如果良好预后和不良预后参照表达谱的数量是相等的,那么测试表达谱被分类为不确定。
存在来自统计、数学或工程领域的其他方法,例如但不限于决策树、支持向量机制(SVM)、神经网络和线性判别分析(LDA)。这些方法是本领域技术人员所熟知的。
总之,算法(其可选自线性回归或其衍生的算法,如广义线性模型(GLM,包括逻辑回归)、最近邻(k-NN)、决策树、支持向量机制(SVM)、神经网络、线性判别分析(LDA)、随机森林、或微阵列的预测分析(PAM))是基于一组参照样本(优选包括几个良好预后参照表达谱和几个不良预后参照表达谱)进行校准并随后施加到测试样本。简单来说,基于标签中所有基因与来自从一组良好预后发展来的参照谱(训练数据)的所有基因的比较结果如何将患者分类为良好预后(或不良预后)。
在良好预后对不良预后样本中表达谱的独立基因是增加或是减少的概念是科学兴趣。对于每个独立的基因,通过使用学生t检验或等同方法可以将在良好预后组中的基因表达水平与不良预后组进行比较。然而,当标签包括几个不同的基因时,这种二元比较一般不用于预后。
在一个优选的实施方案中,用于解释本文中描述的用于区分上述样本的任何表达谱的算法选自:
a)微阵列的预测分析(PAM):
PAM(样本X)=Arg max(θYes(样本X);θNo(样本X))
其中
其中,
·xi,1≤i≤N,代表来自表达谱基因表达水平的N个变量的体外测量值,和
·πiiYes,iNo,i,1≤i≤N,KYes and KNo是用至少一个参照样本校准的固定参数;
b)对角线线性判别分析(DLDA)
DLDA(样本X)=Arg min(ΔYes(样本X);ΔNo(样本X))
其中
其中,
·xi,1≤i≤N,代表来自表达谱基因表达水平的N个变量的体外测量值,和
·υiYes,i,和μNo,i,1≤i≤N是用至少一个参照样本校准的固定参数;
c)对角二次方程判别分析(DQDA)
其中,
其中,
·xi,1≤i≤N,代表来自表达谱基因表达水平的N个变量的体外测量值,和
·υYes,i,υNo,iYes,iNo,i,1≤i≤N是用至少一个参照样本校准的固定参数,和
C Yes = ( Σ i = 1 N log ( v Yes , i ) )
C No = ( Σ i = 1 N log ( v No , i ) ) ;
d)或其任意组合。
为了区别肝细胞/非肝细胞样本、良性/恶性肝细胞样本、FNH/非FNH良性肝细胞样本、HCA/非HCA良性肝细胞样本、HNF1A突变的/非HNF1A突变的HCA样本、炎性/非炎性HCA样本和β连环蛋白突变的/非β连环蛋白突变的HCA样本,用于解释表达谱的目的的特别有利的算法是:
诊断(样本X)
=多数原则(PAM(样本X),DLDA(样本X),DQDA(样本X))
在一个优选的实施方案中,用于解释表达谱的目的,该表达谱是为了区别肝细胞/非肝细胞样本、良性/恶性肝细胞样本、FNH/非FNH良性肝细胞样本、HCA/非HCA良性肝细胞样本、HNF1A突变的/非HNF1A突变的HCA样本、炎性/非炎性HCA样本和β连环蛋白突变的/非β连环蛋白突变的HCA样本,使用定量PCR确定表达谱,PAM,DLDA和DQDA算法的变量和参数如下:
a)对于确定肝样本是否是肝细胞样本:
·使用如下的6个变量x1至x6
x1 (-ΔΔCt TFRC表达水平)-(-ΔΔCt C8A表达水平)
x2 (-ΔΔCt AFP表达水平)+(-ΔΔCt GNMT表达水平)
x3 (-ΔΔCt HAL表达水平)-(-ΔΔCt EPCAM表达水平)
x4 (-ΔΔCt CYP3A7表达水平)-(-ΔΔCt EPCAM表达水平)
x5 (-ΔΔCt FABP1表达水平)-(-ΔΔCt EPCAM表达水平)
x6 (-ΔΔCt EPCAM表达水平)-(-ΔΔCt HNF4A表达水平)
·PAM参数如下:
·DLDA和DQDA参数相同,其如下:
xi μNo,i μYes,i υNo,i υYes,i υi
x1 11.613149 1.3388989 11.690171 4.251989 4.692407
x2 -19.201897 -3.12967394 12.73627 22.662048 22.074337
x3 -13.503695 -0.05789783 17.965523 27.445047 26.883759
x4 -12.948974 3.98966931 6.765985 30.609874 29.198065
x5 -13.727697 -0.17297876 17.267584 26.144739 25.619118
x6 9.292567 -2.21761661 1.913791 25.543753 24.14461
b)对于确定肝细胞样本是否是HCC样本:
·使用如下的6个变量x1至x6
x1 (-ΔΔCt CAP2表达水平)-(-ΔΔCt LCAT表达水平)
x2 (-ΔΔCt ANGPT2表达水平)+(-ΔΔCt AURKA表达水平)
x3 (-ΔΔCt CDC20表达水平)+(-ΔΔCt DHRS2表达水平)
x4 (-ΔΔCt ANGPT2表达水平)-(-ΔΔCt LYVE1表达水平)
x5 (-ΔΔCt ADM表达水平)-(-ΔΔCt CDC20表达水平)
x6 Max(-ΔΔCt AFP表达水平;-ΔΔCt CAP2表达水平)
·PAM参数如下:
·DLDA和DQDA参数相同,其如下:
xi μNo,i μYes,i υNo,i υYes,i υi
x1 2.678847 7.341149 2.2201 8.37556 6.33819
x2 0.06943705 4.519144 3.255149 4.0793 3.806517
x3 -1.96933307 6.891609 25.818236 13.894186 17.840878
x4 1.25620635 5.599034 1.863177 3.311281 2.831979
x5 -1.79861246 -5.706591 2.246134 3.814584 3.295449
x6 1.47414444 4.807026 1.020023 6.078697 4.404347
c)对于确定良性肝细胞样本是否是FNH样本:
·使用如下的12个变量x1至x12
x1 Min(-ΔΔCt ANGPTL7表达水平;-ΔΔCt GLUL表达水平)
x2 (-ΔΔCt ANGPT1表达水平)-(-ΔΔCt HMGB3表达水平)
x3 (-ΔΔCt GMNN表达水平)+(-ΔΔCt RAMP3表达水平)
x4 Min(-ΔΔCt RHBG表达水平;-ΔΔCt UGT2B7表达水平)
x5 Max(-ΔΔCt HAL表达水平;-ΔΔCt RAMP3表达水平)
x6 Min(-ΔΔCt LGR5表达水平;-ΔΔCt UGT2B7表达水平)
x7 (-ΔΔCt RAMP3表达水平)+(-ΔΔCt UGT2B7表达水平)
x8 (-ΔΔCt RAMP3表达水平)+(-ΔΔCt RARRES2表达水平)
x9 Max(-ΔΔCt ANGPT1表达水平;-ΔΔCt RAMP3表达水平)
x10 Min(-ΔΔCt ANGPT1表达水平;-ΔΔCt LGR5表达水平)
x11 (-ΔΔCt RAMP3表达水平)-(-ΔΔCt RBM47表达水平)
x12 Min(-ΔΔCt GIMAP5表达水平;-ΔΔCt UGT2B7表达水平)
·PAM参数如下:
·DLDA和DQDA参数相同,其如下:
xi μNo,i μYes,i υNo,i υYes,i υi
x1 -2.3273759 1.7806145 4.6402628 0.60826433 4.11435
x2 0.245031 2.76437457 1.4145492 0.20686229 1.2570248
x3 1.2709924 3.41230679 1.2978397 0.19883833 1.1544917
x4 -4.0615574 0.05626186 8.3471726 0.0196296 7.2609714
x5 0.9682756 2.52228907 0.6935121 0.30621156 0.6429946
x6 -2.6751666 0.05626186 5.1618051 0.0196296 4.4910865
x7 -0.4951798 2.57855093 3.3012094 0.33314121 2.9140701
x8 0.2778432 2.50466495 1.2384457 0.40087507 1.1291973
x9 1.3248621 2.85116431 0.5424233 0.11837803 0.487113
x10 -2.0337258 2.22805082 6.3954525 0.30614496 5.601195
x11 1.1388737 3.31336105 0.7211325 0.52047864 0.6949603
x12 -1.2373331 0.05049854 1.9692555 0.01620956 1.7145104
d)对于确定良性肝细胞样本是否是HCA样本:
·使用如下的10个变量x1至x10
x1 (-ΔΔCt AKR1B10表达水平)+(-ΔΔCt GLS2表达水平)
x2 (-ΔΔCt LCAT表达水平)-(-ΔΔCt KRT19表达水平)
x3 (-ΔΔCt ESR1表达水平)+(-ΔΔCt SDS表达水平)
x4 Max(-ΔΔCt MERTK表达水平;-ΔΔCt LYVE1表达水平)
x5 Max(-ΔΔCt EPHA1表达水平;-ΔΔCt KRT19表达水平)
x6 (-ΔΔCt CCL5表达水平)+(-ΔΔCt GLS2表达水平)
x7 (-ΔΔCt HAL表达水平)-(-ΔΔCt MERTK表达水平)
x8 (-ΔΔCt CYP2C9表达水平)-(-ΔΔCt MERTK表达水平)
x9 (-ΔΔCt CCL5表达水平)+(-ΔΔCt KRT19表达水平)
x10 Min(-ΔΔCt CYP3A7表达水平;-ΔΔCt EPHA1表达水平)
·PAM参数如下:
·DLDA和DQDA参数相同,其如下:
xi μNo,i μYes,i υNo,i υYes,i υi
x1 5.142698 -3.8017871 1.9223207 16.202619 11.8086811
x2 -2.5047803 1.3207446 4.8696186 4.8642148 4.8658775
x3 -0.759558 2.5990617 1.5948539 4.8438216 3.8441392
x4 -0.5178985 0.2630787 0.1157701 0.4169368 0.3242701
x5 1.9359758 0.2198781 0.9741474 0.8373057 0.8794108
x6 1.1870048 -3.2306184 0.5402267 10.9818415 7.769037
x7 1.5262567 -1.5458196 1.0506355 5.6452689 4.2315355
x8 0.358827 -1.5911525 0.2637763 3.3978705 2.4335338
x9 2.4342454 -2.2294378 3.9252834 3.9034702 3.910182
x10 1.1615001 -0.4994349 0.507857 1.1000088 0.9178082
e)对于确定HCA样本是否是HNF1A突变的HCA样本:
·使用如下的2个变量x1至x2
x1 (-ΔΔCt DHRS2表达水平)-(-ΔΔCt UGT2B7表达水平)
x2 (-ΔΔCt ANGPT2表达水平)+(-ΔΔCt FABP1表达水平)
·PAM参数如下:
·DLDA和DQDA参数相同,其如下:
xi μNo,i μYes,i υNo,i υYes,i υi
x1 -2.8185929 10.68915 15.46252 14.3631833 15.343027
x2 0.5168253 5.47564 1.668767 0.7321017 1.566956
f)对于确定HCA样本是否是炎性HCA样本:
·使用如下的4个变量x1至x4
x1 (-ΔΔCt HAMP表达水平)+(-ΔΔCt SAA2表达水平)
x2 (-ΔΔCt CCL5表达水平)-(-ΔΔCt NRCAM表达水平)
x3 Max(-ΔΔCt EPHA1表达水平;-ΔΔCt KRT19表达水平)
x4 (-ΔΔCt ANGPT2表达水平)+(-ΔΔCt SAA2表达水平)
·PAM参数如下:
·DLDA和DQDA参数相同,其如下:
xi μNo,i μYes,i υNo,i υYes,i υi
x1 1.735214 10.4585747 16.9585649 7.6603747 13.9265464
x2 2.11689 -4.4062595 7.0569419 6.5761749 6.90017
x3 1.746678 -0.0368447 0.7298408 0.3673544 0.6116387
x4 2.540387 8.6838292 4.4787841 4.5955546 4.5168614
g)对于确定HCA样本是否是β连环蛋白突变的HCA样本:
·使用如下的9个变量x1至x9
x1 (-ΔΔCt AKR1B10表达水平)-(-ΔΔCt REG3A表达水平)
x2 (-ΔΔCt AMACR表达水平)+(-ΔΔCt HAL表达水平)
x3 (-ΔΔCt CAP2表达水平)-(-ΔΔCt GLUL表达水平)
x4 (-ΔΔCt HAL表达水平)+(-ΔΔCt TAF9表达水平)
x5 (-ΔΔCt CAP2表达水平)-(-ΔΔCt LGR5表达水平)
x6 Min(-ΔΔCt AKR1B10表达水平;-ΔΔCt HAL表达水平)
x7 (-ΔΔCt LAPTM4B表达水平)+(-ΔΔCt TFRC表达水平)
x8 (-ΔΔCt GIMAP5表达水平)-(-ΔΔCt HAL表达水平)
x9 (-ΔΔCt HMGB3表达水平)-(-ΔΔCt IGF2BP3表达水平)
·PAM参数如下:
·DLDA和DQDA参数相同,其如下:
xi μNo,i μYes,i υNo,i υYes,i υi
x1 4.5103796 -12.5962709 37.671414 6.2381109 33.535453
x2 -0.361299 -4.920416 1.426277 8.2837077 2.328571
x3 1.7186592 -1.5804241 1.203395 0.6218992 1.126882
x4 0.8439509 -4.4347616 1.358794 11.5298442 2.69709
x5 3.3594 -0.6889375 5.646265 1.7986761 5.140003
x6 -0.5624378 -6.6604599 6.819184 8.7029888 7.067053
x7 1.1766229 -1.2029889 2.912529 0.2815287 2.566345
x8 -0.2142184 4.4874493 1.580383 8.8316336 2.534495
x9 0.7059568 -0.2550566 2.287403 0.3047094 2.026522
本发明还涉及包含用于测定含有至多65不同基因的表达谱的试剂的试剂盒,其中所述表达谱选自:
·包含或由以下38个基因组成的表达谱:EPCAM,HNF4A,CYP3A7,FABP1,HAL,AFP,GNMT,TFRC,C8A,CAP2,LCAT,ANGPT2,AURKA,CDC20,DHRS2,LYVE1,ADM,ANGPTL7,GLUL,ANGPT1,HMGB3,GMNN,RAMP3,RHBG,UGT2B7,LGR5,RARRES2,RBM47,GIMAP5,AKR1B10,GLS2,KRT19,ESR1,SDS MERTK,EPHA1,CCL5和CYP2C9,和任选的一个或多个内部对照基因,或其等效表达谱;
·包含或由以下46个基因组成的表达谱:EPCAM,HNF4A,CYP3A7,FABP1,HAL,AFP,GNMT,TFRC,C8A,CAP2,LCAT,ANGPT2,AURKA,CDC20,DHRS2,LYVE1,ADM,ANGPTL7,GLUL,ANGPT1,HMGB3,GMNN,RAMP3,RHBG,UGT2B7,LGR5,RARRES2,RBM47,GIMAP5,AKR1B10,GLS2,KRT19,ESR1,SDS,MERTK,EPHA1,CCL5,CYP2C9,HAMP,SAA2,NRCAM,REG3A,AMACR,TAF9,LAPTM4B和IGF2BP3,和任选的一个或多个内部对照基因,或其等效表达谱;
·包含或由以下49个基因组成的表达谱:EPCAM,HNF4A,CYP3A7,FABP1,HAL,AFP,GNMT,TFRC,C8A,CAP2,LCAT,ANGPT2,AURKA,CDC20,DHRS2,LYVE1,ADM,ANGPTL7,GLUL,ANGPT1,HMGB3,GMNN,RAMP3,RHBG,UGT2B7,LGR5,RARRES2,RBM47,GIMAP5,AKR1B10,GLS2,KRT19,ESR1,SDS,MERTK,EPHA1,CCL5,CYP2C9,RAB1A,REG3A,NRAS,PIR,LAMA3,G0S2,HN1,PAK2,CDH2,HAMP和SAE1,和任选的一个或多个内部对照基因,或其等效表达谱;或
·包含或由以下55个基因组成的表达谱:EPCAM,HNF4A,CYP3A7,FABP1,HAL,AFP,GNMT,TFRC,C8A,CAP2,LCAT,ANGPT2,AURKA,CDC20,DHRS2,LYVE1,ADM,ANGPTL7,GLUL,ANGPT1,HMGB3,GMNN,RAMP3,RHBG,UGT2B7,LGR5,RARRES2,RBM47,GIMAP5,AKR1B10,GLS2,KRT19,ESR1,SDS,MERTK,EPHA1,CCL5,CYP2C9,HAMP,SAA2,NRCAM,REG3A,AMACR,TAF9,LAPTM4B,IGF2BP3,RAB1A,NRAS,PIR,LAMA3,G0S2,HN1,PAK2,CDH2和SAE1,和任选的一个或多个内部对照基因,或其等效表达谱。
根据本发明的试剂盒优选专用于确定以上提到的表达谱之一,并因此包含用于测定含有至多65个不同基因的表达谱的试剂,已知具有最高目的基因数目的表达谱包含55个基因,和任选的一个或多个内部对照基因。当表达谱包含少于55个目的基因时,所述试剂盒优选地包含用于确定包含目的基因数目和不超过约10个额外基因的表达谱的试剂,所述额外基因可包括内部对照基因和/或一些额外的基因。如果样本被确定为HCC样本,这种额外的基因可能对应于可用于例如疾病预后的其他表达谱。
例如,当表达谱包含49个目的基因和任选的一个或多个内部对照基因时,所述试剂盒优选地包含用于测定含有至多59个不同基因的表达谱的试剂。当表达谱包含46个目的基因和任选的一个或多个内部对照基因时,所述试剂盒优选地包含用于测定含有至多56个不同基因的表达谱的试剂。当表达谱包含38个目的基因和任选的一个或多个内部对照基因时,所述试剂盒优选地包含用于测定含有至多48个不同基因的表达谱的试剂。
在所有上述包含用于测定含有至多N个不同基因的表达谱的试剂(N如上所述是整数)的试剂盒的实施方案中,包括在试剂盒中的试剂不允许确定含有多于N个基因的表达谱。特别是,这样的根据本发明的试剂盒不包括pan基因组(pangenomic)微阵列所允许的测定数以千计的基因的表达谱。
用于测定包含N个基因的表达谱的试剂可以包括允许特异性定量包含在所述表达谱中的基因表达水平的任何试剂。例如,当表达谱是在蛋白水平测定时,那么这样的试剂可以包括包含在表达谱中的各基因的特异抗体。优选地,在核酸水平测定表达。在这种情况下,在本发明试剂盒的试剂可特别包括引物对(正向和反向引物)和/或对包括在表达谱中各基因特异的探针(表达谱的定量PCR测定特别有用)或核酸微阵列,特别是寡核苷酸微阵列。在后一种情况下,所述核酸微阵列是专用的核酸微阵列,包括用于检测最大数量基因的探针,如在前面的段落中所定义的。换言之,核酸微阵列不允许测定包含包含于表达谱中的基因超过最大数目的表达谱。
正如在介绍中指出的,根据本发明的分类方法对于临床医生是重要的,因为将允许他们基于独特的和简单的测试,准确地知道受试者患有哪种类型的肝疾病,并因此采用对精确诊断的治疗。
因此,本发明还涉及IGFR1抑制剂、Akt/mTor抑制剂、蛋白酶体抑制剂和/或wnt抑制剂,用于治疗受试者中的HCC,所述受试者基于由本发明的分类方法分类为HCC样本的肝样本被诊断为患有HCC。本发明还涉及IGFR1抑制剂、Akt/mTor抑制剂、蛋白酶体抑制剂和/或wnt抑制剂在制备用于治疗受试者中HCC的药物中的用途,所述受试者基于由本发明的分类方法分类为HCC样本的肝样本被诊断为患有HCC。如果所述受试者的肝样本被进一步划分为亚组G1,则IGFR1抑制剂或Akt/mTor抑制剂是优选的。如果所述受试者的肝样本被进一步划分为亚组G2,则Akt/mTor抑制剂是优选的。如果所述受试者的肝样本被进一步划分为亚组G3,则蛋白酶体抑制剂是优选的。如果所述受试者的肝样本被进一步划分为亚组G5或G6,则wnt抑制剂是优选的。然而,目前的WNT抑制剂具有毒性问题,而且还存在着对更有效和更安全的WNT抑制剂的需要。
本发明还涉及用于治疗有需要的受试者中肝疾病的方法,其包括:
a)使用根据本发明的分类方法将所述受试者的肝样本分类为非肝细胞样本、肝细胞癌(HCC)样本、局灶性结节不典型增生(FNH)样本、肝细胞腺瘤(HCA)样本或其他良性肝样本;
b)如果所述样本是非肝细胞样本,则鉴定所述样本精确的组织学亚型并根据所确定的组织学亚型对所述受试者施用治疗;
c)如果所述样本是HCC样本,则进行手术切除,伴有或不伴有辅助治疗;
d)如果所述样本是FNH样本,则不进行治疗行动;
e)如果所述样本是HCA样本,则只随访受试者或进行手术切除,这取决于HCA亚组;
f)如果所述样本是其他良性肝细胞样本,则不进行治疗行动。
如果所述肝样本是HCC样本,本发明的治疗方法可以进一步包括:
i.将所述HCC样本分类为如上所述的亚组G1至G6之一;和
ii.如果所述的HCC样本被分类为G1亚组,则对所述受试者施用有效量的IGFR1抑制剂或Akt/mTor抑制剂;
iii.如果所述HCC样本被分类为G1-G2亚组,则对所述受试者施用有效量的hen Akt/mTor抑制剂;
iv.如果所述HCC样本被分类为G3亚组,则对所述受试者施用有效量的蛋白酶体抑制剂;
v.如果所述HCC样本被分类为G5-G6亚组,则对所述受试者施用有效量的wnt抑制剂。
本发明的治疗方法可以进一步包括,如果所述肝样本是HCC样本:
i.预后总体生存和/或无复发生存;和
ii.如果所述HCC样本给出良好预后,则不进行辅助治疗;
iii.如果所述HCC样本给出不良预后,则对所述受试者施用辅助治疗,如细胞毒性化疗和/或靶向治疗。
根据本发明,HCC发展的“预后”是指预测相对于患有特定HCC肿瘤的患者,该特定HCC肿瘤未来的发展。根据本发明的方法允许同时进行总体生存预后和无复发生存预后。
由“总体生存预后”是指对有或没有复发的生存的预后。如前所述,针对HCC目前主要的治疗是肿瘤手术切除。作为结果,“不良的总体生存预后”定义为肝切除后3年内发生死亡,而“良好的总体生存预后”定义为在术后5年的期间没有死亡。
由“无复发生存预后”是指没有任何复发的生存预后。“不良的无复发生存预后”定义为肝切除后两年内存在肿瘤复发,而“良好的无复发生存预后”定义为在术后4年的期间没有复发。
可使用任何合适的方法进行这样的总体生存预后和/或无复发生存预后。这种方法的实例在WO2007/063118A1中特别地描述。
在不良预后的情况下施用辅助治疗。所述辅助治疗可以选自:
a)细胞毒性化疗,即,使用任何合适的对杀死癌细胞有用的化学剂的治疗。目前用作HCC辅助治疗且在本发明中优选的细胞毒性化疗剂是阿霉素、吉西他滨,奥沙利铂以及其组合。阿霉素或吉西他滨和奥沙利铂的联合是特别优选的。
b)靶向治疗,即,使用选择性抑制参与HCC恶性转化的信号传导途径的酶的任何适合的试剂的治疗。目前,索拉非尼,几种酪氨酸蛋白激酶(VEGFR和PDGFR)和Raf激酶(C-Raf比B-Raf更有活性)的小分子抑制剂,已被批准用于HCC的辅助治疗,在本发明中优选。索拉非尼是下式的双芳基脲:
如果所述肝样本是HCA样本,本发明的治疗方法也可以进一步包括:
i.将所述HCA样本分类为如上所述的亚组HNF1A突变的HCA、炎性HCA、β连环蛋白突变的HCA或其他HCA;和
ii.如果所述HCA样本被分类为HNF1A突变的HCA样本,如果HCA<5cm则只随访所述受试者,或如果HCA>5cm则进行手术切除;
iii.如果所述HCA样本被分类为炎性HCA样本,如果HCA<5cm则只随访所述受试者,或如果HCA>5cm则进行手术切除;
iv.如果所述HCA样本被分类为β连环蛋白突变的HCA样本,无论HCA大小,进行手术切除。
本发明还涉及进行根据本发明的肝样本分类方法的系统(和用于产生计算机系统的计算机可读介质)。
在一个实施方案中,本发明涉及用于分类肝样本的系统1,其包括:
a)判定模块2,其配置成接收肝样本和确定关于以下的表达水平信息:
·包含或由以下38个基因组成的表达谱:EPCAM,HNF4A,CYP3A7,FABP1,HAL,AFP,GNMT,TFRC,C8A,CAP2,LCAT,ANGPT2,AURKA,CDC20,DHRS2,LYVE1,ADM,ANGPTL7,GLUL,ANGPT1,HMGB3,GMNN,RAMP3,RHBG,UGT2B7,LGR5,RARRES2,RBM47,GIMAP5,AKR1B10,GLS2,KRT19,ESR1,SDS,MERTK,EPHA1,CCL5和CYP2C9,和任选的一个或多个内部对照基因,或其等效表达谱;
·包含或由以下46个基因组成的表达谱:EPCAM,HNF4A,CYP3A7,FABP1,HAL,AFP,GNMT,TFRC,C8A,CAP2,LCAT,ANGPT2,AURKA,CDC20,DHRS2,LYVE1,ADM,ANGPTL7,GLUL,ANGPT1,HMGB3,GMNN,RAMP3,RHBG,UGT2B7,LGR5,RARRES2,RBM47,GIMAP5,AKR1B10,GLS2,KRT19,ESR1,SDS,MERTK,EPHA1,CCL5,CYP2C9,HAMP,SAA2,NRCAM,REG3A,AMACR,TAF9,LAPTM4B和IGF2BP3,和任选的一个或多个内部对照基因,或其等效表达谱;
·包含或由以下49个基因组成的表达谱:EPCAM,HNF4A,CYP3A7,FABP1,HAL,AFP,GNMT,TFRC,C8A,CAP2,LCAT,ANGPT2,AURKA,CDC20,DHRS2,LYVE1,ADM,ANGPTL7,GLUL,ANGPT1,HMGB3,GMNN,RAMP3,RHBG,UGT2B7,LGR5,RARRES2,RBM47,GIMAP5,AKR1B10,GLS2,KRT19,ESR1,SDS,MERTK,EPHA1,CCL5,CYP2C9,RAB1A,REG3A,NRAS,PIR,LAMA3,G0S2,HN1,PAK2,CDH2,HAMP和SAE1,和任选的一个或多个内部对照基因,或其等效表达谱;或
·包含或由以下55个基因组成的表达谱:EPCAM,HNF4A,CYP3A7,FABP1,HAL,AFP,GNMT,TFRC,C8A,CAP2,LCAT,ANGPT2,AURKA,CDC20,DHRS2,LYVE1,ADM,ANGPTL7,GLUL,ANGPT1,HMGB3,GMNN,RAMP3,RHBG,UGT2B7,LGR5,RARRES2,RBM47,GIMAP5,AKR1B10,GLS2,KRT19,ESR1,SDS,MERTK,EPHA1,CCL5,CYP2C9,HAMP,SAA2,NRCAM,REG3A,AMACR,TAF9,LAPTM4B,IGF2BP3,RAB1A,NRAS,PIR,LAMA3,G0S2,HN1,PAK2,CDH2和SAE1,和任选的一个或多个内部对照基因,或其等效表达谱;
b)存储装置3,其配置成存储来自判定模块的表达水平信息的;
c)比较模块4,用于比较存储在存储装置上的表达水平信息和参照数据,并提供比较结果,其中所述比较结果指示肝样本类型;和
d)显示模块5,用于为用户显示部分基于分类结果的内容6,其中所述内容是肝样本类型的信号指示。
在另一个实施方案中,本发明涉及计算机可读介质7,其具有记录在其上的计算机可读指令,来定义在计算机上执行根据本发明的分类方法的步骤(涉及解释表达谱数据)的软件模块。优选地,所述软件模块包括:
a)条目模块8,其允许由用户输入表达水平的信息,并存储(至少暂时地)该信息,用于进一步的比较,其中所述表达水平信息涉及:
·包含或由以下38个基因组成的表达谱:EPCAM,HNF4A,CYP3A7,FABP1,HAL,AFP,GNMT,TFRC,C8A,CAP2,LCAT,ANGPT2,AURKA,CDC20,DHRS2,LYVE1,ADM,ANGPTL7,GLUL,ANGPT1,HMGB3,GMNN,RAMP3,RHBG,UGT2B7,LGR5,RARRES2,RBM47,GIMAP5,AKR1B10,GLS2,KRT19,ESR1,SDS,MERTK,EPHA1,CCL5和CYP2C9,和任选的一个或多个内部对照基因,或其等效表达谱;
·包含或由以下46个基因组成的表达谱:EPCAM,HNF4A,CYP3A7,FABP1,HAL,AFP,GNMT,TFRC,C8A,CAP2,LCAT,ANGPT2,AURKA,CDC20,DHRS2,LYVE1,ADM,ANGPTL7,GLUL,ANGPT1,HMGB3,GMNN,RAMP3,RHBG,UGT2B7,LGR5,RARRES2,RBM47,GIMAP5,AKR1B10,GLS2,KRT19,ESR1,SDS,MERTK,EPHA1,CCL5,CYP2C9,HAMP,SAA2,NRCAM,REG3A,AMACR,TAF9,LAPTM4B和IGF2BP3,和任选的一个或多个内部对照基因,或其等效表达谱;
·包含或由以下49个基因组成的表达谱:EPCAM,HNF4A,CYP3A7,FABP1,HAL,AFP,GNMT,TFRC,C8A,CAP2,LCAT,ANGPT2,AURKA,CDC20,DHRS2,LYVE1,ADM,ANGPTL7,GLUL,ANGPT1,HMGB3,GMNN,RAMP3,RHBG,UGT2B7,LGR5,RARRES2,RBM47,GIMAP5,AKR1B10,GLS2,KRT19,ESR1,SDS,MERTK,EPHA1,CCL5,CYP2C9,RAB1A,REG3A,NRAS,PIR,LAMA3,G0S2,HN1,PAK2,CDH2,HAMP和SAE1,和任选的一个或多个内部对照基因,或其等效表达谱;或
·包含或由以下55个基因组成的表达谱:EPCAM,HNF4A,CYP3A7,FABP1,HAL,AFP,GNMT,TFRC,C8A,CAP2,LCAT,ANGPT2,AURKA,CDC20,DHRS2,LYVE1,ADM,ANGPTL7,GLUL,ANGPT1,HMGB3,GMNN,RAMP3,RHBG,UGT2B7,LGR5,RARRES2,RBM47,GIMAP5,AKR1B10,GLS2,KRT19,ESR1,SDS,MERTK,EPHA1,CCL5,CYP2C9,HAMP,SAA2,NRCAM,REG3A,AMACR,TAF9,LAPTM4B,IGF2BP3,RAB1A,NRAS,PIR,LAMA3,G0S2,HN1,PAK2,CDH2和SAE1,和任选的一个或多个内部对照基因,或其等效表达谱;
b)比较模块4,用于比较用户输入的表达水平信息和参照数据,并提供比较结果,其中所述比较结果指示肝样本类型;和
c)显示模块5,用于为用户显示部分基于比较结果的内容6,其中所述内容是肝样本类型的信号指示。
涉及系统和计算机可读介质的本发明的实施方案已经通过功能模块得以描述,功能模块是由记录在计算机可读介质上的计算机可执行指令所定义的并且其在运行时使计算机执行方法步骤。为清楚起见,所述模块已经通过功能进行隔离。然而,应该理解的是模块不必对应严谨代码块,以及可以通过执行存储在各种介质上的各种代码部分以及在不同时间执行来进行所描述的功能。此外,应该理解的是,模块可以执行其他功能,因而模块不限于具有任何特定功能或一组功能。
所述计算机可读介质可以是能够由计算机访问的任何可用的有形介质。计算机可读介质包括在用于存储信息(例如计算机可读指令、数据结构、程序模块或其它数据)的任何方法或技术中实施的易失性和非易失性、可移动和不可移动的有形介质。计算机可读介质包括,但不限于RAM(随机存取存储器)、ROM(只读存储器)、EPROM(可擦可编程只读存储器)、EEPROM(电可擦可编程只读存储器)、闪存或其它存储器技术、CD-ROM(光盘只读存储器)、DVD(数字多功能盘)或其他光存储介质、卡式磁带、磁带、磁盘存储或其他磁性存储介质、其它类型的易失性和非易失性存储器、以及任何其它有形介质,其可用于存储所需信息并且可以由计算机包括以及前述任何合适组合进行访问。
体现在一个或多个计算机可读介质的计算机可读数据可以定义指令,例如,作为一个或多个程序的部分,即作为由计算机执行的结果,指示计算机执行一个或多个本文所描述的功能(例如,关于系统1,或计算机可读介质7),和/或各种实施方案中,变体和其组合。这样的指令可以用多种编程语言中的任意者来写,例如Java、J#、Visual Basic、C、C#、C++、Fortran、Pascal、Eiffel、Basic、COBOL汇编语言等等,或其各种组合中的任意者。体现这种指令的计算机可读介质可以存在于本文描述的系统1、或计算机可读介质6的组件的一个或多个中,可以分布在一个或多个这样的组件中,并且可以在之间转换。
计算机可读介质可以是可传送的,使得存储在其上的指令可被加载到任何计算机资源来实现本文讨论的本发明各方面。此外,应该理解的是存储在计算机可读介质中的指令、或计算机可读介质,如上所述,不限于作为主机上运行的应用程序的部分所体现的指令。相反,指令可以作为任何类型的计算机代码(例如,软件或微码)来体现,其可用来对计算机编程以执行本发明的各方面。计算机可执行指令可以以合适的计算机语言或几种语言的组合来撰写。基本的计算生物学方法是本领域技术人员已知的并描述于,例如,Setubal和Meidanis等人,Introduction to Computational Biology Methods(PWS Publishing Company,Boston,1997,ref 38);Salzberg,Searles,Kasif,(Ed.),Computational Methods in MolecularBiology,(Elsevier,Amsterdam,1998,ref 39);Rashidi和Buehler,BioinformaticsBasics:Application in Biological Science and Medicine(CRC Press,London,2000,ref40)以及Ouelette and Bzevanis Bioinformatics:A Practical Guide for Analysis of Geneand Proteins(Wiley&Sons,Inc.,2nded.,2001)。
本发明的某些实施方案的功能模块包括判定模块2、存储装置3、比较模块4和显示模块5。功能模块可以在一个或多个计算机上执行,或者通过使用一个或多个计算机网络执行。判定模块2具有计算机可执行指令以便以计算机可读形式提供表达水平信息。
如本文所用,“表达水平信息”是指关于全长或部分的任何核苷酸(RNA或DNA)和/或氨基酸序列的表达水平的信息。在优选的实施方案中,它指的是通过各种技术测量的mRNA或cDNA的表达水平。信息可以是定性的(转录物的存在或不存在)或定量的。优选其是定量的。
用于测定表达水平信息的方法,即判定模块2,包括用于蛋白和DNA/RNA分析的系统,以及特别是用于在核酸或蛋白水平测定表达谱的上述那些。
在判定模块中测定的表达水平信息可以由存储装置3读取。如本文所用,“存储装置”3旨在包括任何适当的计算或处理设备或其它配备的或适于存储数据或信息的装置。适合本发明使用的电子装置的实例包括独立的计算设备、数据通信网络(包括局域网(LAN)、广域网(WAN)、因特网、内联网和外联网)、以及本地和分布式计算机处理系统。存储装置3还包括,但不限于:磁性存储介质,诸如软盘、硬盘存储介质、磁带;光学存储介质,例如CD-ROM、DVD;电子存储介质例如RAM、ROM、EPROM、EEPROM等,普通硬盘和这些类别的混合物,如磁/光存储介质。存储装置3适合或配置为具有在其上记录的表达水平信息。这种信息可以以可电子传输和读取的数字形式提供,例如通过互联网、在软盘上、通过USB(通用串行总线)或者经由通信的任何其它合适方式,包括装置之间的无线通信。
如本文所用,“存储”是指在存储装置3上用于编码信息的方法。本领域技术人员可以容易地采用任何目前已知的方法来在已知介质上记录信息以产生包含表达水平信息的制品。
各种软件程序和格式可用于在存储装置上存储表达水平的信息。可以采用任何数量的数据处理器结构格式(例如,文本文件、电子表格或数据库)以获得或形成具有记录在其上的表达水平信息的介质。
通过以计算机可读形式提供表达水平信息,可使用比较模块4中的可读形式的表达水平信息来比较特定表达谱与存储装置3内的参照数据。可以明显地用上面描述的各种算法来进行比较。以计算机可读形式取得的比较提供计算机可读的比较结果,其可以通过各种方式来处理。基于比较结果的内容可以从比较模块4中检索,并通过显示模块5显示以指示肝样本分类。
优选地,参照数据是指示根据本发明的分类方法可以找到的所有肝样本类型的表达水平谱。
“比较模块”4可以使用各种可用的软件程序和格式用于可操作的比较,其直接或间接使用的任何软件提供的如上描述那些的统计算法,来比较在判定模块2测定的表达水平信息和参照数据。
比较模块4、或本发明的任何其他模块,可包括操作系统(例如,Windows、Linux和Mac OS或UNIX),在其上运行关系数据库管理系统、万维网应用和万维网服务器。万维网应用包括需要用于产生数据库语言语句(例如,结构化查询语言(SQL)语句)的可执行代码。一般情况下,可执行文件将包括嵌入式SQL语句。此外,万维网应用可以包括配置文件,该配置文件含有各种软件实体的指针和地址,包括必须访问的服务器和各种外部和内部数据库以服务用户需求。配置文件还把服务器资源的请求定位到适当的硬件,因为可能需要该服务器被分布在两个或多个单独的计算机。在一个实施方案中,万维网服务器支持TCP/IP协议。本地网络,如有时被称为“内部网(Intranets)”。这样的内部网的优点是其允许与驻留在万维网上的公共领域的数据库进行方便地沟通(如GenBank或Swiss Pro万维网站点)。因此,在本发明的一个特别优选的实施方案中,用户可以使用由Web浏览器和Web服务器提供的HTML接口直接访问驻留在互联网数据库的数据(例如,通过超文本链接)。
比较模块4提供计算机可读的比较结果,其通过预定义的标准、或用户定义的标准以计算机可读形式进行加工,以便提供部分基于比较结果的内容6,其可以通过使用显示模块5根据用户需求进行存储和输出。显示模块5能够为用户显示部分基于比较结果的内容6,其中所述内容是肝样本类型的信号指示。这样的信号可以是,例如,在计算机监视器上显示指示肝样本类型的内容,来自打印机的指示肝样本类型的内容的打印页或打印报告,或指示肝样本类型的光或声音。
显示模块5可以是任何适当的设备,其配置为从计算机接收然后为用户显示计算机可读信息。非限制性实例包括,例如通用计算机,如那些基于英特尔奔腾型处理器、摩托罗拉PowerPC、SUN UltraSPARC、惠普PA-RISC处理器,来自Advanced Micro Devices(AMD)森尼维耳市,加州或来自ARM控股的任何各种处理器、或任何其他类型的处理器、视觉显示设备,诸如平板显示器、阴极射线管等,以及各种类型的计算机打印机或集成设备,如笔记本电脑或平板,特别是ipad。
在一个实施方案中,万维网浏览器被用于提供用户接口以便显示基于比较结果的内容6。应当理解的是,本发明的其它模块可以适于具有web浏览器的接口。通过Web浏览器,用户可以构造用于从比较模块检索数据的请求。因此,用户将通常指向并点击用户接口元件,如按钮、下拉菜单、滚动条等常规使用的图形用户接口。这种用户Web浏览器相配置的的请求被发送Web应用程序,其将请求格式化以产生查询以便用于提取相关的信息。
在一个实施方案中,显示模块5显示比较结果以及所述比较结果是否指示肝样本类型。
在一个实施方案中,基于比较结果所显示的内容6是信号(例如,正的或负的信号),其指示肝样本类型,因此可能仅仅显示正或负指示。
因此,本发明提供了系统1(和计算机可读介质7用于运行计算机系统)以基于表达谱信息进行分类肝样本的方法。
系统1和计算机可读介质7,仅仅是本发明的示例性实施方案,其用于进行基于表达谱的肝样本的分类方法,并不意欲限制本发明的范围。系统1和计算机可读介质7的变体是可能的,并且意欲落入本发明的范围之内。
系统1或在计算机可读介质中使用的模块可以假定多种配置。例如,功能可以提供在单个机器上或分布在多台机器上。
已经大体描述了本发明,可以通过参照本文提供的具体的特定实施例和附图获得对本发明的特点和优点的进一步理解,除非另有说明,本文提供的具体的特定实施例和附图只是为了说明并不旨在进行限制。
附图说明
图1:用于分类和诊断肝细胞肿瘤的55个基因分子算法。灵敏度(sen)、特异性(spe)、阴性预测值(PNV)、阳性预测值(PPV)和精确度(acc)详细描述于各肿瘤亚组下面。算法各分支中的基因归纳于灰色框内。
具体实施方式
实施例
实施例1、鉴定允许分类各种类型肝疾病的肝样本的分子标签
患者和方法
患者和组织样本
在两个法国大学医院,在Bordeaux(从1998到2007年)和Créteil(从2003年到2007年)中从肝脏切除肿瘤后,将肝样本进行了系统冷冻。共有550个样本包括在这项工作中,并且此研究是通过当地的IRB委员会(CCPRB巴黎圣路易斯,1997年和2004年)批准,以及所有患者根据法国法律签署其知情同意书。排除下列:(1)坏死>80%的肿瘤,(2)RNA质量不良的或不足量的肿瘤,(3)非根治性切除的HCC:R1或R2切除或在手术时肝外转移的,(4)通过肝移植治疗的HCC。
因而,包括以下样本:
·40个非肝细胞肿瘤,包括肝内胆管癌(n=19),结肠直肠癌转移(n=14)和神经内分泌(n=2)癌,血管脂肪瘤(n=3),子宫肌瘤(n=1)和血管瘤(n=1),
·324个HCC,
·156个良性肝细胞肿瘤,包括局灶性结节增生(FNH,n=25),肝细胞腺瘤(HCA,n=111),再生的大结节(伴有不典型增生,n=15,或无不典型增生,n=5),和
·30个非肿瘤样本,包括肝硬化(n=23与HCV相关n=10,HBV相关n=3时,酒精相关n=7,NASH n=1,原发性胆汁性肝硬化n=1,α-1抗胰蛋白酶缺乏n=1)和7个正常肝组织。
根据Zucman Rossi J等人,Hepatology 2006中描述的先前的分子分类,利用基因突变和免疫组织化学染色,确定了HCA的分子亚型(激活的β-连环蛋白n=23,非激活的HNF1A n=26,炎性的n=68和未分类的n=8)。14(12.6%)HCA表现出既是炎性表型又是β连环蛋白的激活突变。
肿瘤和非肿瘤肝脏样本在手术后立即冷冻并保存在-80℃。来自冷冻部分的组织样本也被固定在10%甲醛中、进行石蜡包埋并用苏木精和曙红和Masson三色进行染色。HCA、HCC、FNH、大再生结节和所有非肝细胞肿瘤的诊断是基于既定的组织学标准(International working party Hepatology 1995,international consensusgroup Hepatology 2009)。所有的肿瘤是由2位病理学专家(JC和PBS)在不知道患者的结果和初步诊断情况下进行独立评估。如果在关于肝细胞肿瘤的亚型诊断或者关于包括在预后分析中的HCC的病理特点有不同意见,则重检切片至达成共识后再用于研究。在多肿瘤的情况下,在我们的预后研究中对可用的最大结节进行分析。
选择用于通过定量PCR进一步分析的基因
我们选择103个基因用于定量RT-PCR分析。在相同平台上使用AffymetrixHG133A基因芯片TM微阵列进行杂交,分析了82个肝样本的mRNA表达,所述82个肝样本包括57个HCC(E-TABM-36)、5个HNF1A失活的腺瘤(GSE7473)、7个炎性腺瘤(GSE11819)、4个局灶性结节增生(GSE9536)、包括肝硬化和正常肝组织(E-TABM-36和GSE7473)的9个非肿瘤的肝样本。根据3个标准进行选择在肿瘤的特定亚组中差异表达的基因,包括:
(1)38个基因选自本发明人之前获得的微阵列数据,并描述在boyault等人和rebouissou JBC Rebouissou Nature和rebouissou J Hepatol:RAB1A,REG3A,NRAS,RAMP3,MERTK,PIR,EPHA1,LAMA3,G0S2,HN1,PAK2,AFP,CYP2C9,CDH2,HAMP,SAE1,NTS,HAL,SDS,cmkOR1/CXCR7,ID2,GADD45B,CDT6,UGT2B7,LFABP,GLUL,LGR5/GPR49,TBX3,RHBG,SLPI,AMACR,SAA2,CRP,MME,DHRS2,SLC16A1,GLS2和GNMT;
(2)9个基因描述在之前的文献中,(Odom DT等人,2004;Paradis V等人,2003;Rebouissou S等人,2008;Llovet J等人,2006;Capurro M等人,2003;ChumaM等人,2003;Tsunedomi 2005;Kondoh N 1999):HNF1A,HNF4A,SERPIN,ANGPT1,ANGPT2,XLKD1-LYVE1,GPC3,HSP70/HSPA1A和CYP3A7;和
(3)13个基因选自发明人之前微阵列数据的新分析:STEAP3,RRM2,GSN,CYP2C19,C8A,AKR1B10,ESR1,GMNN,CAP2,DPP8,LCAT,NEK7,LAPTM4B。
总共有60个基因被选定用于定量PCR的进一步分析。
在这一阶段,本发明人还希望提供简单而可靠地预后HCC的新工具,因而发现或者已经描述与HCC预后相关的其它基因也包括进来用于进一步定量PCR分析:
(1)通过使用Affymetrix微阵列E-TABM-36分析通过根治性切除处理的44个HCC的表达模式所获得的新微阵列数据,鉴定了特征为预后完全不同的HCC患者之间通常差异表达(显著的和成倍变化的)的41个基因组:TAF9,NRCAM,PSMD1,ARFGEF2,SPP1,CDC20,NRAS,ENO1,RRAGD,CHKA,RAN,TRIP13,IMP-3/IGF2BP3,KLRB1,C14orf156,NPEPPS,PDCD2,PHB,KIAA0090,KPNA2,KIAA0268/UNQ6077/LOC440751,G6PD,STK6,TFRC,GLA,AKR1C1/AKR1C2,GIMAP5,ADM,CCNB1,TKT,AGPS,NUDT9,HLA-DQA1,NEU1,RARRES2,BIRC5,FLJ20273,HMGB3,MPPE1,CCL5和DLG7;和
(2)作为与HCC预后相关描述在文献中的2个基因(KRT19和EPCAM)(LeeJS nat med 2006,Yamashita T肠胃病学2008)
总共有43个基因因为其与HCC预后相关而被选中。
定量RT-PCR
如前面所述进行RNA的提取和定量RT-PCR。103个选择的基因表达以一式两份在所有的550个样本中采用TaqMan微流卡TLDA(Applied Biosystems)基因表达测定法进行分析。用RNA核糖体18S归一化基因表达,肿瘤样本的表达水平与正常肝组织中相应基因表达的平均水平相比,以n倍比例表示。使用2ΔΔCt方法对RNA的相对量进行计算。
突变筛查
提取DNA并对质量进行评估。已经测序所有的HCA样本的CTNNB1(外显子2至4)、HNF1A(外显子1至10)、IL6ST(外显子6和10)、GNAS(外显子8)和STAT3(外显子2、5和20)。已测序所有的HCC样本的CTNNB1(外显子2至4)和TP53(外显子2至11)。通过对两条链上的第二独立扩增产物进行测序来证实所有突变;为了检测任何种系突变在匹配的非肿瘤样本筛选突变。
用于诊断的端点
病理学家之间的共识被视为诊断的金标准。我们评估了灵敏度(Sen)、特异性(Spe)、阴性预测值(PNV)、阳性预测值(PPV)和HCC,FNH,HCA和不同HCA亚型的诊断精确性。非肝细胞肿瘤、再生大结节和非肿瘤肝样本(肝硬化和正常肝)都包括在内,以评估分子算法从HCC、FNH和HCA区分其的能力。这项研究并没有被设计来诊断非肝细胞肿瘤的特定亚型、非肿瘤肝样本(正常肝和肝硬化)和再生大结节的不同亚型。
分子诊断算法的建立
550个样本分成总训练组S1(n=306)和总验证组S2(n=244)。该分组随机建立,以提供对每个待预测变量V(肝细胞型,恶性度…)训练组S1V 和验证组S2V 均含大约50%待分析该变量的样本,“阳性”情况的比例相似(这里所有的变量是二元的,值是“是”或“否”;“阳性”情况是指样本取值“是”)。
测定103个基因(-ΔΔCt测量),四个运算符(加,减,最小,最大)应用到所有对不同基因(n=5886),来创建新的变量,产生总共23653个变量(103初始的,23544个创建的)。
给定一个待预测的变量V,相应的训练组S1V被随机分为两个亚组S1V.A和S1V.B,其具有相等的*大小和相等的*“阳性”情况比例(*:或当n减少时为几乎相等)。
然后根据待预测变量(即,对临床的影响)或者选择对阳性预测值赋予更高权重的标准(局灶性结节性增生、HNF1A、炎性的、β连环蛋白),或者选择对灵敏度赋予更高权重的标准(肝细胞的、恶性度、腺瘤)。在所有情况下,获得的最终标准为0.8标准1 4+0.2标准2(标准1和标准2分别对应于PPV和灵敏度或反过来)。
然后计算S1V.A的23653个变量中每一个的AUC标准(PresenceAbsence Rpackage),选择顶部的2000个变量(由AUC–2sd的递减顺序排序)用于进一步的步骤。
这2000个变量之间的距离矩阵使用S1V.A被计算为1-pearson相关系数。然后在该距离矩阵上进行分层聚类,得到的树状图被削减至50个集群。在每个集群中,保留产生更高的AUC-2 sd值的变量(在先前步骤中获得)。
然后将这50个基因用于逐步过程中,以对S1V构建多变量模型。对于给定的预测变量组合,在S1V.A上训练3种算法(DLDA,DQDA,PAM),得到3个预测,然后将其用于预测S1V.B。然后独立地对S1V.A和S1V.B的3个预测的每个计算标准值。然后平均3个预测的标准值,当前的模型即所述的优于竞争对手的模型,如果其与在S1V.A上的那些同样好和比S1V.B上的更好。
使用改性的逐步向前的步骤:在k>2轮时(即基于之前获得的在(k-1)变量上的模型,在k个变量上建立模型),添加一个变量,然后去除一个变量和再添加一个变量。待添加或去除的变量选自优化标准的那些。当几个变量优化标准时,选择第一次遇到的。构建15个模型,范围从1到15个基因。然后选择最小的模型,即,用尽可能少的变量优化标准。为了验证该模型,其被用于预测来自验证组S2V的样本。由于3种算法用于模型中,使用多数原则获得唯一的分类成员。
统计分析
分别使用曼惠特尼和卡方或Fisher精确检验比较连续和非连续变量。使用Cox模型进行单变量和多变量分析。使用R统计软件和rms包进行统计分析。
结果
构建用于诊断的分子算法,作为决策树中使用的分级工具(参见图1)。
通过定量RT-PCR分析所有的103个选择基因的表达水平。在550个包含的样本的总系列中,样本的每个亚组随机分为(1/1比)训练组和验证组,以分别创建和验证分子算法。使用逐步分析,鉴别了55个能够将样本分类为特定亚组的基因(描述在表2中),该分类使用3个最近质心方法之间(DLDA,DLQA和PAM,如在患者和方法部分详述的)的共同性。然后,在肿瘤验证组中测试了分子分类法的稳健性(如在图1和下表3中描述)。
表3:用于550个肝样本中肝细胞肿瘤诊断的分子算法的精确性
*14(12.6%)HCA既表现出炎性表型又表现出β连环蛋白的激活突变
良性肝细胞组织(n=186)由FNH(n=25),HCA(n=111),正常肝脏(n=7),肝硬化(23例,病因:HCV n=10,HBV n=3,酒精n=7,NASH n=1,原发性胆汁性肝硬化n=1,α-1抗胰蛋白酶缺乏症n=1),不是不典型增生的再生大结节(n=5),不典型增生的大结节(n=15)。
Sen=灵敏度,Spe=特异性,PPV=阳性预测值,NPV=阴性预测值,Acc=精确度,HCC=肝细胞癌,FNH=局灶性结节性增生,HCA=肝细胞腺瘤
首先,通过结合9个基因(EPCAM,HNF4A,CYP3A7,FABP1,HAL,AFP,GNMT,TFRC和C8A,参见图1)从非肝细胞肿瘤有效地鉴定肝细胞样本,然后,使用9个基因的组合(AFP,CAP2,LCAT,ANGPT2,AURKA,CDC20,DHRS2,LYVE1和ADM,参见图1)从HCC中区分良性肝细胞样本。还使用先前在WO2007/063118A1中描述的G1-G6分类分类HCC患者,这允许在HCC大组中确认该方法的可靠性,以及先前描述的与遗传和临床特征的关系(见下面的表4)。
表4:与包括于诊断研究的HCC的G1-G6分类相关的临床和遗传特征(n=324)
a除了预后(n=314)
然后,着眼于肝细胞肿瘤的良性亚型,有可能从其它良性肝细胞组织(包括再生的大结节,不典型增生的大结节和非肿瘤肝组织)鉴定HCA或FNH,对于FNH使用13个基因(HAL,ANGPTL7,GLUL,ANGPT1,HMGB3,GMNN,RAMP3,RHBG,UGT2B7,LGR5,RARRES2,RBM47和GIMAP5,参见图1)和对于HCA使用13个基因(HAL,CYP3A7,LCAT,LYVE1,AKR1B10,GLS2,KRT19,ESR1,SDS,MERTK,EPHA1,CCL5和CYP2C9,参见图1)。
最后,我们分类了HCA的不同亚型:HNF1A突变的(4个基因:FABP1,ANGPT2,DHRS2和UGT2B7,参见图1),β连环蛋白突变的(13个基因:TFRC,HAL,CAP2,GLUL,HMGB3,LGR5,GIMAP5,AKR1B10,REG3A,AMACR,TAF9,LAPTM4B和IGF2BP3,参见图1),和炎性腺瘤(7个基因:ANGPT2,GLS2,EPHA1,CCl5,HAMP,SAA2和NRCAM,参见图1)。
如示于上述表3中,对于肿瘤的每种类型,在训练和验证组在诊断树的几乎每个分支对于灵敏度,特异性,阴性预测值,阳性预测值和准确性得到90%以上。这些数据强调了根据本发明的55个基因分类/诊断算法的稳健性。
结论
在这项研究中,确定了分子55-基因算法,并第一次证实了分类特定亚组中的良性和恶性肝细胞肿瘤。在肝细胞肿瘤的诊断领域,以往的研究主要集中在早期HCC,HCA或FNH的诊断,但其从来没有抓住良性和恶性肝细胞肿瘤的整体(Bioulac Sage P hepatology 2007,Rebouissou S J hepatol 2008,Llovet JMgastroenterology 2006)。在困难的情况下,根据本发明的算法通过评估分子亚类可有助于病理诊断。
先前在WO2007/063118A1中描述的G1-G6分类的16个基因也被保留在通用算法中,因为不同的分子亚组构成不同的潜在治疗靶标(G1与IGFR1抑制剂,G1-G2与mTor抑制剂以及G5-G6与Wnt抑制剂),它可以指导今后的临床试验。
总之,这项研究通过提供分类/诊断分子算法来进行肝样本的整体评估,构成了个性化医疗的新台阶。这可能有助于肿瘤学家对疑似患有肝肿瘤的患者采取其治疗决策。
参考文献
Benhamouche S,Decaens T,Godard C等人,Apc tumor suppressor gene is the"zonation-keeper"of mouse liver.Developmental cell 2006;10:759-70.
Bioulac-Sage P,Rebouissou S,Thomas C等人,Hepatocellular adenoma subtypeclassification using molecular markers and immunohistochemistry.Hepatology2007;46:740-8.
Bioulac-Sage P,Cubel G,Balabaud C,Zucman-Rossi J.Revisiting the pathologyof resected benign hepatocellular nodules using new immunohistochemical markers.Seminars in liver disease 2011;31:91-103.
Boyault S,Rickman DS,de Reynies A等人,Transcriptome classification of HCCis related to gene alterations and to new therapeutic targets.Hepatology 2007;45:42-52.
Cadoret A,Ovejero C,Terris B等人,New targets of beta-catenin signaling in theliver are involved in the glutamine metabolism.Oncogene 2002;21:8293-301.
Capurro M,Wanless IR,Sherman M等人,Glypican-3:a novel serum andhistochemical marker for hepatocellular carcinoma.Gastroenterology 2003;125:89-97.
Chuma M,Sakamoto M,Yamazaki K等人,Expression profiling in multistagehepatocarcinogenesis:identification of HSP70 as a molecular marker of earlyhepatocellular carcinoma.Hepatology 2003;37:198-207.
El-Serag HB.Hepatocellular carcinoma.The New England journal of medicine2011;365:1118-27.
Forner A,Llovet JM,Bruix J.Hepatocellular carcinoma.Lancet2012;379:1245-55.
Forner A,Vilana R,Ayuso C等人,Diagnosis of hepatic nodules 20 mm or smallerin cirrhosis:Prospective validation of the noninvasive diagnostic criteria forhepatocellular carcinoma.Hepatology 2008;47:97-104.
Terminology of nodular hepatocellular lesions.International Working Party.Hepatology 1995;22:983-93.
Pathologic diagnosis of early hepatocellular carcinoma:a report of the internationalconsensus group for hepatocellular neoplasia.Hepatology 2009;49:658-64.
Kondoh N,Wakatsuki T,Ryo A等人,Identification and characterization of genesassociated with human hepatocellular carcinogenesis.Cancer research 1999;59:4990-6.
Lee JS,Heo J,Libbrecht L等人,A novel prognostic subtype of humanhepatocellular carcinoma derived from hepatic progenitor cells.Nature medicine2006;12:410-6.
Llovet JM,Chen Y,Wurmbach E等人,A molecular signature to discriminatedysplastic nodules from early hepatocellular carcinoma in HCV cirrhosis.Gastroenterology 2006;131:1758-67.
Odom DT,Zizlsperger N,Gordon DB等人,Control of pancreas and liver geneexpression by HNF transcription factors.Science 2004;303:1378-81.
Ouelette and Bzevanis Bioinformatics:A Practical Guide for Analysis of Gene andProteins(Wiley&Sons,Inc.,2nd ed.,2001)
Paradis V,Bieche I,Dargere D等人,A quantitative gene expression studysuggests a role for angiopoietins in focal nodular hyperplasia.Gastroenterology2003;124:651-9.
Rashidi and Buehler,Bioinformatics Basics:Application in Biological Science andMedicine(CRC Press,London,2000)
Rebouissou S,Imbeaud S,Balabaud C等人,HNF1alpha inactivation promoteslipogenesis in human hepatocellular adenoma independently of SREBP-1 andcarbohydrate-response element-binding protein(ChREBP)activation.The Journal ofbiological chemistry 2007;282:14437-46.
Rebouissou S,Couchy G,Libbrecht L等人,The beta-catenin pathway is activatedin focal nodular hyperplasia but not in cirrhotic FNH-like nodules.Journal ofhepatology 2008;49:61-71.
Rebouissou S,Amessou M,Couchy G等人,Frequent in-frame somatic deletionsactivate gp130 in inflammatory hepatocellular tumours.Nature 2009;457:200-4.
Salzberg,Searles,Kasif,(Ed.),Computational Methods in Molecular Biology,(Elsevier,Amsterdam,1998);
Setubal and Meidanis等人,Introduction to Computational Biology Methods(PWSPublishing Company,Boston,1997);
Tsunedomi R,Iizuka N,Hamamoto Y等人,Patterns of expression of cytochromeP450 genes in progression of hepatitis C virus-associated hepatocellular carcinoma.International journal of oncology 2005;27:661-7.
van Aalten SM,Verheij J,Terkivatan T,Dwarkasing RS,de Man RA,IjzermansJN.Validation of a liver adenoma classification system in a tertiary referral centre:implications for clinical practice.Journal of hepatology 2011;55:120-5.
WO2007/063118A1
Yamamoto Y,Sakamoto M,Fujii G等人,Overexpression of orphanG-protein-coupled receptor,Gpr49,in human hepatocellular carcinomas withbeta-catenin mutations.Hepatology 2003;37:528-33.
Yamashita T,Forgues M,Wang W等人,EpCAM and alpha-fetoproteinexpression defines novel prognostic subtypes of hepatocellular carcinoma.Cancerresearch 2008;68:1451-61.
Zucman-Rossi J,Jeannot E,Nhieu JT等人,Genotype-phenotype correlation inhepatocellular adenoma:new classification and relationship with HCC.Hepatology2006;43:515-24.

Claims (16)

1.一种用于在体外分类作为非肝细胞样本、肝细胞癌(HCC)样本、局灶性结节不典型增生(FNH)样本、肝细胞腺瘤(HCA)样本或其它良性肝样本的肝样本的方法,所述方法包括:
a)在体外确定来自所述肝样本的包括或由以下38个基因组成的表达谱:EPCAM,HNF4A,CYP3A7,FABP1,HAL,AFP,GNMT,TFRC,C8A,CAP2,LCAT,ANGPT2,AURKA,CDC20,DHRS2,LYVE1,ADM,ANGPTL7,GLUL,ANGPT1,HMGB3,GMNN,RAMP3,RHBG,UGT2B7,LGR5,RARRES2,RBM47,GIMAP5,AKR1B10,GLS2,KRT19,ESR1,SDS,MERTK,EPHA1,CCL5和CYP2C9,和任选地一个或多个内部对照基因;
b)根据对包含或由以下9个基因组成的表达谱测得的表达水平:EPCAM,HNF4A,CYP3A7,FABP1,HAL,AFP,GNMT,TFRC和C8A,和任选地一个或多个内部对照基因,使用至少一种用至少一个参照肝样本校准的算法,确定所述肝样本是肝细胞或是非肝细胞样本;
c)如果所述肝样本是肝细胞样本,则根据对包含或由以下9个基因组成的表达谱测得的表达水平:AFP,CAP2,LCAT,ANGPT2,AURKA,CDC20,DHRS2,LYVE1和ADM,和任选地一个或多个内部对照基因,使用至少一种用至少一个参照肝样本校准的算法,确定所述肝细胞样本是HCC样本或是良性肝细胞样本;
d)如果所述肝样本是良性肝细胞样本,则根据对包含或由以下13个基因组成的表达谱测得的表达水平:HAL,ANGPTL7,GLUL,ANGPT1,HMGB3,GMNN,RAMP3,RHBG,UGT2B7,LGR5,RARRES2,RBM47和GIMAP5,和任选地一个或多个内部对照基因,使用至少一种用至少一个参照肝样本校准的算法,确定所述良性肝细胞样本是否是FNH样本;
e)如果所述肝样本是良性肝细胞样本,则根据对包含或由以下13个基因组成的表达谱测得的表达水平:HAL,CYP3A7,LCAT,LYVE1,AKR1B10,GLS2,KRT19,ESR1,SDS,MERTK,EPHA1,CCL5和CYP2C9,和任选地一个或多个内部对照基因,使用至少一种用至少一个参照肝样本校准的算法,确定所述良性肝细胞样本是否是HCA样本;
f)如果所述良性肝细胞样本既不是FNH样本也不是HCA样本,则其被分类为其它良性肝样本。
2.根据权利要求1所述的方法,所述方法进一步包括:如果肝样本被诊断为HCA样本,则通过以下步骤将所述HCA样本分类为以下HCA亚组之一:HNF1A突变的HCA,炎性HCA,β连环蛋白突变的HCA或其它HCA:
a)进一步体外确定来自所述HCA样本的包含或由以下8个额外的基因组成的表达谱:HAMP,SAA2,NRCAM,REG3A,AMACR,TAF9,LAPTM4B和IGF2BP3;
b)根据对包含或由以下4个基因组成的表达谱测得的表达水平:FABP1,ANGPT2,DHRS2和UGT2B7,和任选地一个或多个内部对照基因,使用至少一种用至少一个参照肝样本校准的算法,确定所述HCA样本是否是HNF1A突变的HCA样本;
c)根据对包含或由以下7个基因组成的表达谱测得的表达水平:ANGPT2,GLS2,EPHA1,CCl5,HAMP,SAA2和NRCAM,和任选地一个或多个内部对照基因,使用至少一种用至少一个参照肝样本校准的算法,确定所述HCA样本是否是炎性HCA样本;
d)根据对包含或由以下13个基因组成的表达谱测得的表达水平:TFRC,HAL,CAP2,GLUL,HMGB3,LGR5,GIMAP5,AKR1B10,REG3A,AMACR,TAF9,LAPTM4B和IGF2BP3,和任选地一个或多个内部对照基因,使用至少一种用至少一个参照肝样本校准的算法,确定所述HCA样本是否是β连环蛋白突变的HCA样本;
e)如果所述HCA样本既不是HNF1A突变的HCA样本,炎性HCA样本,也不是β连环蛋白突变的HCA样本,则其被分类为其它HCA样本。
3.根据权利要求1或2所述的方法,所述方法进一步包括,如果肝样本被诊断为HCC样本,则将所述HCC样本分类为通过以下临床和遗传主要特征限定的亚组G1至G6之一:
其中通过以下进行分类:
a)进一步体外确定来自所述HCC样本的包含或由以下11个额外的基因组成的表达谱:RAB1A,REG3A,NRAS,PIR,LAMA3,G0S2,HN1,PAK2,CDH2,HAMP和SAE1;和
b)根据对包含或由以下16个基因组成的表达谱测得的表达水平:RAB1A,REG3A,NRAS,RAMP3,MERTK,PIR,EPHA1,LAMA3,G0S2,HN1,PAK2,AFP,CYP2C9,CDH2,HAMP和SAE1,和任选地一个或多个内部对照基因,计算6个亚组的距离;和
c)将所述HCC肿瘤分类为亚组距离是最低的亚组。
4.根据权利要求1至3任一项所述的方法,其中用于校准用于解释各表达谱的算法的参照样本如下:
a)对于确定肝样本是否是肝细胞样本:至少一个(优选几个)肝细胞样本和至少一个(优选几个)非肝细胞样本;
b)对于确定肝细胞样本是否是HCC样本:至少一个(优选几个)良性样本和至少一个(优选几个)HCC样本;
c)对于确定良性肝细胞样本是否是FNH样本:至少一个(优选几个)FNH样本和至少一个(优选几个)非FNH良性肝细胞样本;
d)对于确定良性肝细胞样本是否是HCA样本:至少一个(优选几个)HCA样本和至少一个(优选几个)非HCA良性肝细胞样本;
e)对于确定HCA样本是否是HNF1A突变的HCA样本:至少一个(优选几个)HNF1A突变的HCA样本和至少一个(优选几个)非HNF1A突变的HCA样本;
f)对于确定HCA样本是否是炎性HCA样本:至少一个(优选几个)炎性HCA样本和至少一个(优选几个)非炎性HCA样本;
g)对于确定HCA样本是否是β连环蛋白突变的HCA样本:至少一个(优选几个)β连环蛋白突变的HCA样本和至少一个(优选几个)非β连环蛋白突变的HCA样本;和
h)对于将HCC样本分类为亚组G1至G6之一:各G1至G6亚组中的至少一个(优选几个)样本。
5.根据权利要求1至4任一项所述的方法,其中所述肝样本是肝活检或部分或整个肝肿瘤手术切除样本。
6.根据权利要求1至5任一项所述的方法,其中在核酸水平确定所述表达谱。
7.根据权利要求6所述的方法,其中使用定量PCR确定所述表达谱。
8.根据权利要求1-2和4-7任一项所述的方法,其中用于解释任何表达谱的算法选自:
a)微阵列的预测分析(PAM):
PAM(样本X)=Arg max(θYes(样本X);θNo(样本X))
其中
其中,
·xi,1≤i≤N,代表来自表达谱基因的表达水平的N个变量的体外测量值,和
·πi,γiYes,iNo,i,1≤i≤N,KYes和KNo是用至少一个参照样本校准的固定参数;
b)对角线线性判别分析(DLDA)
DLDA(样本X)=Arg min(ΔYes(样本X);ΔNo(样本X))
其中
其中,
·xi,1≤i≤N,代表来自表达谱基因的表达水平的N个变量的体外测量值,和
·υiYes,i,和μNo,i,1≤i≤N是用至少一个参照样本校准的固定参数;
c)对角二次方程判别分析(DQDA)
其中,
其中,
·xi,1≤i≤N,代表来自表达谱基因的表达水平的N个变量的体外测量值,和
·υYes,i,υNo,iYes,iNo,i,1≤i≤N是用至少一个参照样本校准的固定参数,和
C Yes = ( &Sigma; i = 1 N log ( v Yes , i ) )
C No = ( &Sigma; i = 1 N log ( v No . i ) ) ;
d)或其任意组合。
9.根据权利要求8所述的方法,其中用于解释各表达谱的算法是:
10.根据权利要求9所述的方法,其中使用定量PCR确定所述表达谱,以及PAM,DLDA和DQDA算法的变量和参数如下:
a)对于确定肝样本是否是肝细胞样本:
·使用如下的6个变量x1至x6
x1 (-ΔΔCt TFRC表达水平)-(-ΔΔCt C8A表达水平) x2 (-ΔΔCt AFP表达水平)+(-ΔΔCt GNMT表达水平) x3 (-ΔΔCt HAL表达水平)-(-ΔΔCt EPCAM表达水平) x4 (-ΔΔCt CYP3A7表达水平)-(-ΔΔCt EPCAM表达水平) x5 (-ΔΔCt FABP1表达水平)-(-ΔΔCt EPCAM表达水平) x6 (-ΔΔCt EPCAM表达水平)-(-ΔΔCt HNF4A表达水平)
·PAM参数如下:
·DLDA和DQDA参数相同,其如下:
xi μNo,i μYes,i υNo,i υYes,i υi x1 11.613149 1.3388989 11.690171 4.251989 4.692407 x2 -19.201897 -3.12967394 12.73627 22.662048 22.074337 x3 -13.503695 -0.05789783 17.965523 27.445047 26.883759 x4 -12.948974 3.98966931 6.765985 30.609874 29.198065 x5 -13.727697 -0.17297876 17.267584 26.144739 25.619118 x6 9.292567 -2.21761661 1.913791 25.543753 24.14461
b)对于确定肝细胞样本是否是HCC样本:
·使用如下的6个变量x1至x6
x1 (-ΔΔCt CAP2表达水平)-(-ΔΔCt LCAT表达水平) x2 (-ΔΔCt ANGPT2表达水平)+(-ΔΔCt AURKA表达水平) x3 (-ΔΔCt CDC20表达水平)+(-ΔΔCt DHRS2表达水平) x4 (-ΔΔCt ANGPT2表达水平)-(-ΔΔCt LYVE1表达水平) x5 (-ΔΔCt ADM表达水平)-(-ΔΔCt CDC20表达水平) x6 Max(-ΔΔCt AFP表达水平;-ΔΔCt CAP2表达水平)
·PAM参数如下:
·DLDA和DQDA参数相同,其如下:
xi μNo,i μYes,i υNo,i υYes,i υi x1 2.678847 7.341149 2.2201 8.37556 6.33819 x2 0.06943705 4.519144 3.255149 4.0793 3.806517 x3 -1.96933307 6.891609 25.818236 13.894186 17.840878 x4 1.25620635 5.599034 1.863177 3.311281 2.831979 x5 -1.79861246 -5.706591 2.246134 3.814584 3.295449 x6 1.47414444 4.807026 1.020023 6.078697 4.404347
c)对于确定良性肝细胞样本是否是FNH样本:
·使用如下的12个变量x1至x12
x1 Min(-ΔΔCt ANGPTL7表达水平;-ΔΔCt GLUL表达水平) x2 (-ΔΔCt ANGPT1表达水平)-(-ΔΔCt HMGB3表达水平) x3 (-ΔΔCt GMNN表达水平)+(-ΔΔCt RAMP3表达水平) x4 Min(-ΔΔCt RHBG表达水平;-ΔΔCt UGT2B7表达水平) x5 Max(-ΔΔCt HAL表达水平;-ΔΔCt RAMP3表达水平) x6 Min(-ΔΔCt LGR5表达水平;-ΔΔCt UGT2B7表达水平) x7 (-ΔΔCt RAMP3表达水平)+(-ΔΔCt UGT2B7表达水平) x8 (-ΔΔCt RAMP3表达水平)+(-ΔΔCt RARRES2表达水平) x9 Max(-ΔΔCt ANGPT1表达水平;-ΔΔCt RAMP3表达水平) x10 Min(-ΔΔCt ANGPT1表达水平;-ΔΔCt LGR5表达水平) x11 (-ΔΔCt RAMP3表达水平)-(-ΔΔCt RBM47表达水平) x12 Min(-ΔΔCt GIMAP5表达水平;-ΔΔCt UGT2B7表达水平)
·PAM参数如下:
·DLDA和DQDA参数相同,其如下:
xi μNo,i μYes,i υNo,i υYes,i υi x1 -2.3273759 1.7806145 4.6402628 0.60826433 4.11435 x2 0.245031 2.76437457 1.4145492 0.20686229 1.2570248 x3 1.2709924 3.41230679 1.2978397 0.19883833 1.1544917 x4 -4.0615574 0.05626186 8.3471726 0.0196296 7.2609714 x5 0.9682756 2.52228907 0.6935121 0.30621156 0.6429946 x6 -2.6751666 0.05626186 5.1618051 0.0196296 4.4910865 x7 -0.4951798 2.57855093 3.3012094 0.33314121 2.9140701 x8 0.2778432 2.50466495 1.2384457 0.40087507 1.1291973 x9 1.3248621 2.85116431 0.5424233 0.11837803 0.487113 x10 -2.0337258 2.22805082 6.3954525 0.30614496 5.601195 x11 1.1388737 3.31336105 0.7211325 0.52047864 0.6949603 x12 -1.2373331 0.05049854 1.9692555 0.01620956 1.7145104
d)对于确定良性肝细胞样本是否是HCA样本:
·使用如下的10个变量x1至x10
x1 (-ΔΔCt AKR1B10表达水平)+(-ΔΔCt GLS2表达水平) x2 (-ΔΔCt LCAT表达水平)-(-ΔΔCt KRT19表达水平) x3 (-ΔΔCt ESR1表达水平)+(-ΔΔCt SDS表达水平) x4 Max(-ΔΔCt MERTK表达水平;-ΔΔCt LYVE1表达水平) x5 Max(-ΔΔCt EPHA1表达水平;-ΔΔCt KRT19表达水平) x6 (-ΔΔCt CCL5表达水平)+(-ΔΔCt GLS2表达水平) x7 (-ΔΔCt HAL表达水平)-(-ΔΔCt MERTK表达水平) x8 (-ΔΔCt CYP2C9表达水平)-(-ΔΔCt MERTK表达水平) x9 (-ΔΔCt CCL5表达水平)+(-ΔΔCt KRT19表达水平) x10 Min(-ΔΔCt CYP3A7表达水平;-ΔΔCt EPHA1表达水平)
·PAM参数如下:
·DLDA和DQDA参数相同,其如下:
e)对于确定HCA样本是否是HNF1A突变的HCA样本:
·使用如下的2个变量x1至x6
x1 (-ΔΔCt DHRS2表达水平)-(-ΔΔCt UGT2B7表达水平) x2 (-ΔΔCt ANGPT2表达水平)+(-ΔΔCt FABP1表达水平)
·PAM参数如下:
·DLDA和DQDA参数相同,其如下:
xi μNo,i μYes,i υNo,i υYes,i υi x1 -2.8185929 10.68915 15.46252 14.3631833 15.343027 x2 0.5168253 5.47564 1.668767 0.7321017 1.566956
f)对于确定HCA样本是否是炎性HCA样本:
·使用如下的4个变量x1至x6
x1 (-ΔΔCt HAMP表达水平)+(-ΔΔCt SAA2表达水平) x2 (-ΔΔCt CCL5表达水平)-(-ΔΔCt NRCAM表达水平) x3 Max(-ΔΔCt EPHA1表达水平;-ΔΔCt KRT19表达水平) x4 (-ΔΔCt ANGPT2表达水平)+(-ΔΔCt SAA2表达水平)
·PAM参数如下:
·DLDA和DQDA参数相同,其如下:
xi μNo,i μYes,i υNo,i υYes,i υi x1 1.735214 10.4585747 16.9585649 7.6603747 13.9265464 x2 2.11689 -4.4062595 7.0569419 6.5761749 6.90017 x3 1.746678 -0.0368447 0.7298408 0.3673544 0.6116387 x4 2.540387 8.6838292 4.4787841 4.5955546 4.5168614
g)对于确定HCA样本是否是β连环蛋白突变的HCA样本:
·使用如下的9个变量x1至x6
x1 (-ΔΔCt AKR1B10表达水平)-(-ΔΔCt REG3A表达水平) x2 (-ΔΔCt AMACR表达水平)+(-ΔΔCt HAL表达水平) x3 (-ΔΔCt CAP2表达水平)-(-ΔΔCt GLUL表达水平) x4 (-ΔΔCt HAL表达水平)+(-ΔΔCt TAF9表达水平) x5 (-ΔΔCt CAP2表达水平)-(-ΔΔCt LGR5表达水平) x6 Min(-ΔΔCt AKR1B10表达水平;-ΔΔCt HAL表达水平) x7 (-ΔΔCt LAPTM4B表达水平)+(-ΔΔCt TFRC表达水平) x8 (-ΔΔCt GIMAP5表达水平)-(-ΔΔCt HAL表达水平) x9 (-ΔΔCt HMGB3表达水平)-(-ΔΔCt IGF2BP3表达水平)
·PAM参数如下:
·DLDA和DQDA参数相同,其如下:
xi μNo,i μYes,i υNo,i υYes,i υi x1 4.5103796 -12.5962709 37.671414 6.2381109 33.535453 x2 -0.361299 -4.920416 1.426277 8.2837077 2.328571 x3 1.7186592 -1.5804241 1.203395 0.6218992 1.126882 x4 0.8439509 -4.4347616 1.358794 11.5298442 2.69709 x5 3.3594 -0.6889375 5.646265 1.7986761 5.140003 x6 -0.5624378 -6.6604599 6.819184 8.7029888 7.067053 x7 1.1766229 -1.2029889 2.912529 0.2815287 2.566345 x8 -0.2142184 4.4874493 1.580383 8.8316336 2.534495 x9 0.7059568 -0.2550566 2.287403 0.3047094 2.026522
11.根据权利要求3至10任一项所述的方法,其中HCC样本被分类为亚组G1至G6之一,使用下面的公式计算所述HCC样本至每个亚组GK的距离,1≤k≤6:
其中,对于各基因t和亚组Gk,μ(亚组Gk,基因t)和σ(基因t)的值如下:
μ G1 G2 G3 G4 G5 G6 σ 基因1(RAB1A) -16.39 -16.04 -16.29 -17.15 -17.33 -16.95 0.23 基因2(PAP) -28.75 -27.02 -23.48 -27.87 -19.23 -11.33 16.63 基因3(NRAS) -16.92 -17.41 -16.25 -17.31 -16.96 -17.26 0.27 基因4(RAMP3) -23.54 -23.12 -25.34 -22.36 -23.09 -23.06 1.23 基因5(MERTK) -18.72 -18.43 -21.24 -18.29 -17.03 -16.16 7.23 基因6(PIR) -18.44 -19.81 -16.73 -18.28 -17.09 -17.25 0.48 基因7(EPHA1) -16.68 -16.51 -19.89 -17.04 -18.70 -21.98 1.57 基因8(LAMA3) -20.58 -20.44 -20.19 -21.99 -18.77 -16.85 2.55 基因9(G0S2) -14.82 -17.45 -18.18 -14.78 -17.99 -16.06 3.88 基因10(HN1) -16.92 -17.16 -15.91 -17.88 -17.72 -17.93 0.54 基因11(PAK2) -17.86 -16.56 -16.99 -18.14 -17.92 -17.97 0.58 基因12(AFP) -16.68 -12.36 -26.80 -27.28 -25.97 -23.47 14.80 基因13(CYP2C9) -18.27 -16.99 -16.26 -16.23 -13.27 -14.44 5.47 基因14(CDH2) -15.20 -14.76 -18.91 -15.60 -15.48 -17.32 10.59 基因15(HAMP) -19.53 -20.19 -21.32 -18.51 -25.06 -26.10 13.08 基因16(SAE1) -17.37 -17.10 -16.79 -18.22 -17.72 -18.16 0.31
12.一种包含用于测定含有至多65不同基因的表达谱的试剂的试剂盒,其中所述表达谱选自:
·包含或由以下38个基因组成的表达谱:EPCAM,HNF4A,CYP3A7,FABP1,HAL,AFP,GNMT,TFRC,C8A,CAP2,LCAT,ANGPT2,AURKA,CDC20,DHRS2,LYVE1,ADM,ANGPTL7,GLUL,ANGPT1,HMGB3,GMNN,RAMP3,RHBG,UGT2B7,LGR5,RARRES2,RBM47,GIMAP5,AKR1B10,GLS2,KRT19,ESR1,SDS,MERTK,EPHA1,CCL5和CYP2C9,和任选的一个或多个内部对照基因;
·包含或由以下46个基因组成的表达谱:EPCAM,HNF4A,CYP3A7,FABP1,HAL,AFP,GNMT,TFRC,C8A,CAP2,LCAT,ANGPT2,AURKA,CDC20,DHRS2,LYVE1,ADM,ANGPTL7,GLUL,ANGPT1,HMGB3,GMNN,RAMP3,RHBG,UGT2B7,LGR5,RARRES2,RBM47,GIMAP5,AKR1B10,GLS2,KRT19,ESR1,SDS,MERTK,EPHA1,CCL5,CYP2C9,HAMP,SAA2,NRCAM,REG3A,AMACR,TAF9,LAPTM4B和IGF2BP3,和任选的一个或多个内部对照基因;
·包含或由以下49个基因组成的表达谱:EPCAM,HNF4A,CYP3A7,FABP1,HAL,AFP,GNMT,TFRC,C8A,CAP2,LCAT,ANGPT2,AURKA,CDC20,DHRS2,LYVE1,ADM,ANGPTL7,GLUL,ANGPT1,HMGB3,GMNN,RAMP3,RHBG,UGT2B7,LGR5,RARRES2,RBM47,GIMAP5,AKR1B10,GLS2,KRT19,ESR1,SDS,MERTK,EPHA1,CCL5,CYP2C9,RAB1A,REG3A,NRAS,PIR,LAMA3,G0S2,HN1,PAK2,CDH2,HAMP和SAE1,和任选的一个或多个内部对照基因;或
·包含或由以下55个基因组成的表达谱:EPCAM,HNF4A,CYP3A7,FABP1,HAL,AFP,GNMT,TFRC,C8A,CAP2,LCAT,ANGPT2,AURKA,CDC20,DHRS2,LYVE1,ADM,ANGPTL7,GLUL,ANGPT1,HMGB3,GMNN,RAMP3,RHBG,UGT2B7,LGR5,RARRES2,RBM47,GIMAP5,AKR1B10,GLS2,KRT19,ESR1,SDS,MERTK,EPHA1,CCL5,CYP2C9,HAMP,SAA2,NRCAM,REG3A,AMACR,TAF9,LAPTM4B,IGF2BP3,RAB1A,NRAS,PIR,LAMA3,G0S2,HN1,PAK2,CDH2和SAE1,和任选的一个或多个内部对照基因。
13.根据权利要求12所述的试剂盒,其包括:
a)特异的扩增引物对和/或探针,或
b)核酸微阵列。
14.IGFR1抑制剂、Akt/mTor抑制剂、蛋白酶体抑制剂和/或wnt抑制剂,用于治疗受试者中的HCC,所述受试者基于由根据权利要求1至11的任一项的分类方法分类为HCC样本的肝样本被诊断为患有HCC。
15.用于分类肝样本的系统1,其包括:
a)判定模块2,其配置成接收肝样本和确定关于以下的表达水平信息:
·包含或由以下38个基因组成的表达谱:EPCAM,HNF4A,CYP3A7,FABP1,HAL,AFP,GNMT,TFRC,C8A,CAP2,LCAT,ANGPT2,AURKA,CDC20,DHRS2,LYVE1,ADM,ANGPTL7,GLUL,ANGPT1,HMGB3,GMNN,RAMP3,RHBG,UGT2B7,LGR5,RARRES2,RBM47,GIMAP5,AKR1B10,GLS2,KRT19,ESR1,SDS,MERTK,EPHA1,CCL5和CYP2C9,和任选的一个或多个内部对照基因;
·包含或由以下46个基因组成的表达谱:EPCAM,HNF4A,CYP3A7,FABP1,HAL,AFP,GNMT,TFRC,C8A,CAP2,LCAT,ANGPT2,AURKA,CDC20,DHRS2,LYVE1,ADM,ANGPTL7,GLUL,ANGPT1,HMGB3,GMNN,RAMP3,RHBG,UGT2B7,LGR5,RARRES2,RBM47,GIMAP5,AKR1B10,GLS2,KRT19,ESR1,SDS,MERTK,EPHA1,CCL5,CYP2C9,HAMP,SAA2,NRCAM,REG3A,AMACR,TAF9,LAPTM4B和IGF2BP3,和任选的一个或多个内部对照基因;
·包含或由以下49个基因组成的表达谱:EPCAM,HNF4A,CYP3A7,FABP1,HAL,AFP,GNMT,TFRC,C8A,CAP2,LCAT,ANGPT2,AURKA,CDC20,DHRS2,LYVE1,ADM,ANGPTL7,GLUL,ANGPT1,HMGB3,GMNN,RAMP3,RHBG,UGT2B7,LGR5,RARRES2,RBM47,GIMAP5,AKR1B10,GLS2,KRT19,ESR1,SDS,MERTK,EPHA1,CCL5,CYP2C9,RAB1A,REG3A,NRAS,PIR,LAMA3,G0S2,HN1,PAK2,CDH2,HAMP和SAE1,和任选的一个或多个内部对照基因;或
·包含或由以下55个基因组成的表达谱:EPCAM,HNF4A,CYP3A7,FABP1,HAL,AFP,GNMT,TFRC,C8A,CAP2,LCAT,ANGPT2,AURKA,CDC20,DHRS2,LYVE1,ADM,ANGPTL7,GLUL,ANGPT1,HMGB3,GMNN,RAMP3,RHBG,UGT2B7,LGR5,RARRES2,RBM47,GIMAP5,AKR1B10,GLS2,KRT19,ESR1,SDS,MERTK,EPHA1,CCL5,CYP2C9,HAMP,SAA2,NRCAM,REG3A,AMACR,TAF9,LAPTM4B,IGF2BP3,RAB1A,NRAS,PIR,LAMA3,G0S2,HN1,PAK2,CDH2和SAE1,和任选的一个或多个内部对照基因;
b)存储装置3,其配置成存储来自判定模块的表达水平信息;
c)比较模块4,用于比较存储在存储装置上的表达水平信息和参照数据,并提供比较结果,其中所述比较结果指示肝样本类型;和
d)显示模块5,用于为用户显示部分基于分类结果的内容6,其中所述内容是肝样本类型的信号指示。
16.一种计算机可读介质7,其具有记录在其上的计算机可读指令,来定义在计算机上执行根据权利要求1至11任一项的预后方法的步骤的软件模块,所述预后方法的步骤涉及解释表达谱数据。
CN201380048859.3A 2012-09-21 2013-09-23 用于肝样本的分类和局灶性结节不典型增生、肝细胞腺瘤和肝细胞癌的诊断的新方法 Pending CN104755627A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201261704383P 2012-09-21 2012-09-21
US61/704,383 2012-09-21
EP12306145.9 2012-09-21
EP12306145 2012-09-21
PCT/EP2013/069751 WO2014044853A1 (en) 2012-09-21 2013-09-23 A new method for classification of liver samples and diagnosis of focal nodule dysplasia, hepatocellular adenoma, and hepatocellular carcinoma

Publications (1)

Publication Number Publication Date
CN104755627A true CN104755627A (zh) 2015-07-01

Family

ID=47049104

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201380048859.3A Pending CN104755627A (zh) 2012-09-21 2013-09-23 用于肝样本的分类和局灶性结节不典型增生、肝细胞腺瘤和肝细胞癌的诊断的新方法

Country Status (8)

Country Link
US (1) US20150299798A1 (zh)
EP (1) EP2898092A1 (zh)
JP (1) JP2016500512A (zh)
CN (1) CN104755627A (zh)
AU (1) AU2013320165A1 (zh)
BR (1) BR112015006302A2 (zh)
CA (1) CA2884455A1 (zh)
WO (1) WO2014044853A1 (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017011929A1 (zh) * 2015-07-17 2017-01-26 北京大学第一医院 检测血清血管生成素样蛋白2含量的物质在制备检测肝脏炎症和纤维化程度产品中的应用
CN107810008A (zh) * 2014-12-23 2018-03-16 4D制药研究有限公司 Pirin多肽和免疫调控
CN108140072A (zh) * 2015-07-17 2018-06-08 生命技术公司 Pcr结果可视化工具
CN108179192A (zh) * 2018-02-06 2018-06-19 徐州医科大学 一种基因多态性变异位点早期诊断子宫内膜癌的试剂盒
CN108333366A (zh) * 2018-01-26 2018-07-27 南通大学附属医院 一种高迁移率蛋白hmgb3在监测肝细胞恶性转化过程的应用
CN109758577A (zh) * 2019-03-15 2019-05-17 中国科学院上海高等研究院 Dhrs2基因及其抑制剂在制备治疗肝癌药物中的用途
CN111458509A (zh) * 2020-04-14 2020-07-28 中国人民解放军海军军医大学第三附属医院 肝细胞癌预后评估的生物标志物及其试剂盒和方法
CN112501299A (zh) * 2020-12-08 2021-03-16 赵景民 一种用于预测肝癌复发和转移的方法及应用

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016094457A1 (en) * 2014-12-08 2016-06-16 Ray Partha S Methods for treating basal-like and claudin-low breast cancer and combination therapies thereof
CN105079821A (zh) * 2015-06-11 2015-11-25 中国人民解放军第二军医大学 一种长链非编码rna hnf1a-as1在制备治疗人体恶性实体瘤药物中的应用
CA3126476A1 (en) 2019-01-23 2020-07-30 Regeneron Pharmaceuticals, Inc. Treatment of ophthalmic conditions with angiopoietin-like 7 (angptl7) inhibitors
US11845989B2 (en) 2019-01-23 2023-12-19 Regeneron Pharmaceuticals, Inc. Treatment of ophthalmic conditions with angiopoietin-like 7 (ANGPTL7) inhibitors
EP3935581A4 (en) 2019-03-04 2022-11-30 Iocurrents, Inc. DATA COMPRESSION AND COMMUNICATION USING MACHINE LEARNING
WO2022182768A1 (en) 2021-02-26 2022-09-01 Regeneron Pharmaceuticals, Inc. Treatment of inflammation with glucocorticoids and angiopoietin-like 7 (angptl7) inhibitors
CN117604108B (zh) * 2024-01-23 2024-04-09 杭州华得森生物技术有限公司 用于肝癌诊断和预后判断的生物标志物及其应用

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102083967A (zh) * 2007-07-20 2011-06-01 塞拉提斯股份公司 经由定型内胚层(DE-hep)衍生自人胚泡衍生干细胞的新肝细胞群体
US20120196286A1 (en) * 2009-05-27 2012-08-02 University Of Regensburg Method and apparatus for diagnosing age-related macular degeneration

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1830289A1 (en) 2005-11-30 2007-09-05 Institut National De La Sante Et De La Recherche Medicale (Inserm) Methods for hepatocellular carninoma classification and prognosis

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102083967A (zh) * 2007-07-20 2011-06-01 塞拉提斯股份公司 经由定型内胚层(DE-hep)衍生自人胚泡衍生干细胞的新肝细胞群体
US20120196286A1 (en) * 2009-05-27 2012-08-02 University Of Regensburg Method and apparatus for diagnosing age-related macular degeneration

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
AFFYMETRIX: "hgu133-atasheet", 《GENECHIP HUMAN GENOME U133 SET》 *
SHILPA JAIN等: "Molecular genetics of hepatocellular neoplasia", 《AMERICAN JOURNAL OF TRANSLATIONAL RESEARCH》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107810008A (zh) * 2014-12-23 2018-03-16 4D制药研究有限公司 Pirin多肽和免疫调控
WO2017011929A1 (zh) * 2015-07-17 2017-01-26 北京大学第一医院 检测血清血管生成素样蛋白2含量的物质在制备检测肝脏炎症和纤维化程度产品中的应用
CN108140072A (zh) * 2015-07-17 2018-06-08 生命技术公司 Pcr结果可视化工具
CN108333366A (zh) * 2018-01-26 2018-07-27 南通大学附属医院 一种高迁移率蛋白hmgb3在监测肝细胞恶性转化过程的应用
CN108333366B (zh) * 2018-01-26 2020-06-12 南通大学附属医院 一种实验性监测肝细胞恶性转化过程大鼠模型的建立方法
CN108179192A (zh) * 2018-02-06 2018-06-19 徐州医科大学 一种基因多态性变异位点早期诊断子宫内膜癌的试剂盒
CN109758577A (zh) * 2019-03-15 2019-05-17 中国科学院上海高等研究院 Dhrs2基因及其抑制剂在制备治疗肝癌药物中的用途
CN111458509A (zh) * 2020-04-14 2020-07-28 中国人民解放军海军军医大学第三附属医院 肝细胞癌预后评估的生物标志物及其试剂盒和方法
CN111458509B (zh) * 2020-04-14 2023-09-22 中国人民解放军海军军医大学第三附属医院 肝细胞癌预后评估的生物标志物及其试剂盒和方法
CN112501299A (zh) * 2020-12-08 2021-03-16 赵景民 一种用于预测肝癌复发和转移的方法及应用

Also Published As

Publication number Publication date
AU2013320165A1 (en) 2015-04-02
JP2016500512A (ja) 2016-01-14
EP2898092A1 (en) 2015-07-29
BR112015006302A2 (pt) 2017-07-04
US20150299798A1 (en) 2015-10-22
CA2884455A1 (en) 2014-03-27
WO2014044853A8 (en) 2015-06-04
WO2014044853A1 (en) 2014-03-27

Similar Documents

Publication Publication Date Title
CN104755627A (zh) 用于肝样本的分类和局灶性结节不典型增生、肝细胞腺瘤和肝细胞癌的诊断的新方法
Thangaraj et al. Molecular portrait of oral tongue squamous cell carcinoma shown by integrative meta-analysis of expression profiles with validations
Chen et al. Prognostic fifteen-gene signature for early stage pancreatic ductal adenocarcinoma
Yuan et al. Overexpression of COL3A1 confers a poor prognosis in human bladder cancer identified by co-expression analysis
Cho et al. Gene expression signature–based prognostic risk score in gastric cancer
US9447470B2 (en) Tumor grading and cancer prognosis
CN104769131A (zh) 用于在肝细胞癌中预后整体存活和无复发存活的方法
Xu et al. A signature of immune-related gene pairs predicts oncologic outcomes and response to immunotherapy in lung adenocarcinoma
CN101356532A (zh) 基于基因的算法型癌症预后
Rakosy et al. Integrative genomics identifies gene signature associated with melanoma ulceration
Pass et al. Biomarkers and molecular testing for early detection, diagnosis, and therapeutic prediction of lung cancer
WO2015073949A1 (en) Method of subtyping high-grade bladder cancer and uses thereof
Shi et al. Weighted gene coexpression network analysis identifies a new biomarker of CENPF for prediction disease prognosis and progression in nonmuscle invasive bladder cancer
US20110070582A1 (en) Gene Expression Profiling for Predicting the Response to Immunotherapy and/or the Survivability of Melanoma Subjects
Marín-Aguilera et al. Molecular profiling of peripheral blood is associated with circulating tumor cells content and poor survival in metastatic castration-resistant prostate cancer
Sfakianos et al. Validation of ovarian cancer gene expression signatures for survival and subtype in formalin fixed paraffin embedded tissues
US20170183737A1 (en) Method for estimating a risk for a subject suffering from hepatocellular carcinoma and method for the prognosis of hepatocellular carcinoma
Chen et al. Prognostic value of a gene signature in clear cell renal cell carcinoma
US20120184454A1 (en) Gene signature is associated with early stage rectal cancer recurrence
Kim et al. Cancer survival classification using integrated data sets and intermediate information
Yan et al. Association of β-catenin, APC, Smad3/4, TP53, and cyclin D1 genes in colorectal cancer: a systematic review and meta-analysis
Lane et al. Differential expression in clear cell renal cell carcinoma identified by gene expression profiling
Wang et al. A five-gene signature for recurrence prediction of hepatocellular carcinoma patients
US20120129711A1 (en) Biomarkers for the prognosis and high-grade glioma clinical outcome
Tang et al. Development of a tRNA-Derived small RNA prognostic panel and their potential functions in osteosarcoma

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20150701

WD01 Invention patent application deemed withdrawn after publication