CN1695057A - 基于细胞的疾病检测和鉴别 - Google Patents

基于细胞的疾病检测和鉴别 Download PDF

Info

Publication number
CN1695057A
CN1695057A CNA038250519A CN03825051A CN1695057A CN 1695057 A CN1695057 A CN 1695057A CN A038250519 A CNA038250519 A CN A038250519A CN 03825051 A CN03825051 A CN 03825051A CN 1695057 A CN1695057 A CN 1695057A
Authority
CN
China
Prior art keywords
probe
cancer
cell
disease
mark
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA038250519A
Other languages
English (en)
Inventor
N·J·普雷斯曼
K·S·赫施
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
MonoGen Inc
Original Assignee
MonoGen Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by MonoGen Inc filed Critical MonoGen Inc
Publication of CN1695057A publication Critical patent/CN1695057A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/569Immunoassay; Biospecific binding assay; Materials therefor for microorganisms, e.g. protozoa, bacteria, viruses
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H21/00Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids
    • C07H21/04Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids with deoxyribosyl as saccharide radical
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/02Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving viable microorganisms
    • C12Q1/04Determining presence or kind of microorganism; Use of selective media for testing antibiotics or bacteriocides; Compositions containing a chemical indicator therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6809Methods for determination or identification of nucleic acids involving differential detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/569Immunoassay; Biospecific binding assay; Materials therefor for microorganisms, e.g. protozoa, bacteria, viruses
    • G01N33/56966Animal cells
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57484Immunoassay; Biospecific binding assay; Materials therefor for cancer involving compounds serving as markers for tumor, cancer, neoplasia, e.g. cellular determinants, receptors, heat shock/stress proteins, A-protein, oligosaccharides, metabolites
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57484Immunoassay; Biospecific binding assay; Materials therefor for cancer involving compounds serving as markers for tumor, cancer, neoplasia, e.g. cellular determinants, receptors, heat shock/stress proteins, A-protein, oligosaccharides, metabolites
    • G01N33/57492Immunoassay; Biospecific binding assay; Materials therefor for cancer involving compounds serving as markers for tumor, cancer, neoplasia, e.g. cellular determinants, receptors, heat shock/stress proteins, A-protein, oligosaccharides, metabolites involving compounds localized on the membrane of tumor or cancer cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Hematology (AREA)
  • Urology & Nephrology (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Cell Biology (AREA)
  • Organic Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Pathology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Medicinal Chemistry (AREA)
  • Food Science & Technology (AREA)
  • General Physics & Mathematics (AREA)
  • Wood Science & Technology (AREA)
  • Oncology (AREA)
  • Genetics & Genomics (AREA)
  • Hospice & Palliative Care (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Virology (AREA)
  • Toxicology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明提供一种高灵敏度、高特异性地检测和鉴别疾病的方法。该方法允许测定基于细胞的样品是否含有异常细胞,并且对于某些疾病,能够确定所患疾病的组织学类型。该方法检测基于细胞的样品中分子标记的表达水平和表达模式的改变。也提供了探针组的选择和验证程序。

Description

基于细胞的疾病检测和鉴别
相关申请的交叉引用
本申请是2002年3月12日提交的美国申请系列号10/095,298的部分继续,它要求2001年3月12日提交的美国临时申请系列号60/274,638的权益,其完整内容在此引用作为参考。
                      发明背景
本发明涉及对患者的一般病状的早期检测。本发明也涉及具体病状在其早期和晚期的鉴别(differentiation)。
具体病状的早期检测通过早期诊断和早期治疗,能够大大增加患者生存的机会,而疾病仍然局部存在,其病理效应在解剖、生理和临床上受到限制。所有检验或疾病检测方法的可以评价的两个主要指标是灵敏度(灵敏度=真阳性/(真阳性+假阴性))和特异性(特异性=真阴性/(假阳性+真阴性)),它们决定检验如何毫无例外地且没有错误地准确检测所有患病个体,包括未患目标疾病的个体。在历史上,许多诊断试验由于灵敏度和特异性差而遭到批评。
灵敏度是一种试验准确地检测受检个体中靶疾病的能力的指标。灵敏度差的试验产生高比例的假阴性,即个体患有疾病但是被错误地鉴定为未患特定疾病。假阴性的潜在危险是患病个体在一定时期内仍然未被诊断并且未被治疗,在此期间疾病可能发展为晚期,此时即便进行治疗,效果也可能较差。这可能使患者产生较差的后果。低灵敏度试验的一个例子是一种基于蛋白质的HIV血液检查。这类试验显示较差的灵敏度,因为它不能检测病毒的存在,直到疾病发展,病毒大量侵入血流中。相反,高灵敏度试验的一个例子是利用聚合酶链反应(PCR)的病毒载量检测。因为这类试验能够检测极少量的病毒,因此达到高灵敏度(参见,Lewis,D.R.等人,新旧医学的基因组学桥梁:诊断技术和服务工业白皮书″Thomas Weisel Partners,6月13日,2001)。
另一方面,特异性是一种试验准确地鉴定未患病患者的能力的指标。特异性差的试验产生高比例的假阳性,即个体被错误地鉴定为患病。假阳性的一个缺点是它们使患者接受不必要的医学处理,具有伴随的危险,情绪和经济上的压力,并且对患者的健康可能有不利的影响。使之难以发展为高特异性诊断试验的一个疾病特征是,疾病机制通常涉及多种基因和蛋白质。另外,某些蛋白质可能由于与疾病无关的原因增多。具有高特异性的试验的一个例子是能够检测p53突变的一种基于基因的试验。p53突变不会被检测到,除非存在癌细胞(参见,Lewis,D.R.等人″新旧医学的基因组学桥梁:诊断技术和服务工业白皮书″Thomas Weisel Partners,6月13日,2001)。
细胞标记是细胞内天然存在的分子结构,能够发现并用来表征或区别健康与患病的细胞。它们的存在能够用人类发明并研制的探针检测,这些探针与标记结合,使得标记能够通过显示检测和/或用成像系统定量。四类基于细胞的标记检测技术是细胞病理学、细胞计量术、细胞遗传学和蛋白质组学,它们将在下文区别并描述。
细胞病理学依赖于专家对染色的全细胞群体内的细胞形态学改变的目视评价。一个例子是细胞技术人员和细胞病理学家分别对巴氏染色的(即巴氏涂片)子宫颈-阴道标本的细胞学筛选和细胞诊断。与细胞遗传学、蛋白质组学和细胞计量术不同,细胞病理学不是一种定量工具。它是临床诊断细胞学的现有技术,它是主观的,诊断结果通常不是高度灵敏或可再现的,特别是在癌症早期(例如,ASCUS,LSIL)。
依赖于形态学分析的试验包括在光学显微镜下观察患者细胞样品,鉴定细胞和核形状、大小、光学结构或染色行为的异常。当用显微镜观察时,正常成熟上皮细胞看起来较大且分化良好,含有聚缩的核。然而,特征为发育异常的细胞可能处于多种分化阶段,一些细胞非常不成熟。最后,特征在于浸润性癌的细胞通常看起来未分化,含有极少的细胞质和相对较大的核。
依赖形态学分析的诊断试验的缺点是细胞形态学是一个滞后的指示。由于形态落后于功能,到疾病根据形态学分析明显时,疾病通常已经进展为危险的或晚期。疾病初期包括分子水平上的化学改变。通过在显微镜下观察细胞结构可以检测的改变一般不明显,直到疾病晚期。因此,在分子水平上测定化学改变的试验,被称为“分子诊断”试验,比单独依靠形态学分析的试验更可能提供早期检测。
细胞计量术以在溶液中单行移动的荧光染色细胞的流动显微荧光仪器分析(流式细胞术)或沉积在载玻片上的染色细胞的计算机辅助显微镜仪器分析(图像细胞计数)为基础。流式细胞术的用途包括白血病和淋巴瘤的免疫表型定型(immunophenotyping)。图像细胞计数的用途包括DNA倍性、与恶变有关的改变(MAC)、细胞周期动力学和S期分析。流式细胞术和图像细胞计数方法产生可表征悬液中或载玻片上的细胞的定量数据。流式细胞术和图像细胞计数能够产生良好的标记检测和鉴别结果,这取决于细胞染色的灵敏度和特异性和使用的流式/图像测定特征。
与恶变有关的改变(MAC)在二十世纪前十年的早期到中期已经定性观察并且报道(OC Gruner:″恶性疾病某些病例中淋巴细胞所见改变的研究,″Brit J Surg 3:506-522,1916)(HE Neiburgs,FG Zak,DC Allen,H Reisman,T Clardy:″人和动物组织来源物质中的系统性细胞改变″Transactions,7th Ann Mtg Inter Soc Cytol Council,pp 137-144,1959)。从二十世纪前十年的中期到1975年,MAC在颊粘膜和口腔粘膜涂片(Nieburgs,Finch,Klawe)、十二指肠(Nieburgs)、肝(Elias,Nieburgs)、巨核细胞(Ramsdahl)、子宫颈(Nieburgs,Howdon)、皮肤(Kwitiken)、血液和骨髓(Nieburgs)、单核细胞和白细胞(van Haas,Maison,Clausen)和肺及痰(Martuzzi和Oppen Toth)的独立定性组织学和细胞学研究中得到证明。在1975年之前,这些定性研究报道,对于特定疾病的检测,基于MAC的灵敏度从76%提高到97%,特异性从50%提高到90%。1975年,Oppen Toth报道,定性痰分析研究的灵敏度为76%,特异性为81%。
关于基于MAC的探针分析的定量检测始于20-30年前(H Klawe,JRowinski:″由客观成份分析检测的口腔涂片细胞中恶性相关改变,″Acta Cytol 18:30-33,1974)(GL Wied,PH Bartels,M Bibbo,JJ Sychra:″中间细胞中尿道癌的细胞形态学标记″Analyt Quant Cytol 2:257-263,1980)(G Burger,U Jutting,K Rodenacker:″官颈癌及其前体中良性群体的改变″Analyt Quant Cytol 3:261-271,1981)。MAC在颊粘膜和涂片(Klawe,Burger)、子宫颈(Wied,Burger,Bartels,Vooijs,Reinhardt,Rosenthal,Boon,Katzke,Haroske,Zalmiser)、乳腺(King,Bibbo,Susnik)、膀胱和前列腺(Sherman,Montironi)、结肠(Bibbo)、肺和痰(Swank,MacAulay,Payne)和鼻粘膜(Reith)研究的独立定量组织学和细胞学研究中得到证明,基于MAC的灵敏度从70%提高到89%,特异性从52%提高到100%。Marek和Nakhosteen证明(1999,AmericanThoracic Society annual meeting),两个定量肺(支气管冲洗)研究的结果表明,(a)灵敏度为89%,特异性为92%,(b)灵敏度为91%,特异性为100%。
显然,与恶变有关的改变(MAC)是图像-细胞计量标记检测技术产生的可能有用的探针。DNA染色之核的基于MAC的特征能够与其它分子诊断探针联合使用,产生最佳的分子诊断组(panels),用于检测和鉴别肺癌与其它疾病状态。
细胞遗传学例如利用原位杂交(ISH)技术检测基于染色体的特殊细胞内改变。ISH技术可能以荧光(FISH)、多色荧光(M-FISH)或基于光吸收的产色成像(CHRISH)技术为基础。ISH技术家族利用DNA或RNA探针检测克隆的细菌或培养的真核细胞中互补DNA序列的存在。例如,FISH技术能够用来检测与某些癌症有关的遗传异常。例子包括用于三体8和HER-2neu的探针。其它高灵敏度及特异性技术,如聚合酶链反应(PCR),能够用来检测B细胞和T细胞基因重排。细胞遗传学是一种高度特异的标记检测技术,因为它检测产生一种病理学状况的起因或“触发”分子事件。它通常比其它标记检测技术灵敏度低,因为要检测的事件可能较少。原位杂交(ISH)是一种分子诊断方法,它利用基于基因的分析来检测遗传水平上的异常,如突变、染色体错误或者被一种特定病原体插入的遗传物质。例如,原位杂交可能包括测定特定mRNA的水平,方法包括用标记的用来杂交特定mRNA的引物处理患者的细胞样品,洗去未结合的引物,测定标记物的信号。由于基因序列的唯一性,包括基因序列检测的一种试验可能有高特异性,产生极少的假阳性。然而,因为细胞样品中遗传物质的量可能极低,故只可获得极弱的信号。因此,不采用扩增前技术的原位杂交试验可能具有较差的特异性,产生许多假阴性。
蛋白质组学依赖于独特或特定蛋白质在正常或异常细胞型群体中的过量表达、表达不足或存在/缺失产生的细胞表征和鉴别。蛋白质组学不仅包括蛋白质的鉴定和定量,而且包括它们的定位、修饰、相互作用、化学活性和细胞/胞外功能的测定。免疫化学(IC)(在细胞中的免疫细胞化学和组织中的免疫组织化学(IHC))是定性或定量地用抗体染色抗原(即蛋白质组)的技术(QIHC)。免疫染色方法使用一种染料作为检测指示剂。IHC应用的例子包括对ER(雌激素受体)、PR(孕酮受体)、p53肿瘤抑制基因和EGRF预后标记的分析。蛋白质组学一般是一种比细胞遗传学更灵敏的标记检测技术,因为与使用细胞遗传学检测细胞遗传突变或基因序列改变相比,使用蛋白质组学通常检测多几个数量级的蛋白质分子。然而,蛋白质组学可能比细胞遗传标记检测技术特异性更差,因为多种病理可能导致类似的蛋白质过量表达或表达不足的改变。免疫化学分别包括免疫反应性物质在组织切片或细胞制品中的组织学或细胞学定位,通常使用标记的抗体作为探针试剂。免疫化学能够用来测定细胞样品中疾病标记(特定蛋白质)的浓度,方法包括用一种试剂,如标记的对疾病标记上的表位特异的抗体(探针)处理细胞,然后洗去未结合的抗体,测定标记物的信号。免疫化学以癌细胞具有与健康细胞不同水平的某些疾病标记的性质为基础。癌细胞中疾病标记的浓度通常足以产生强信号。因此,依赖于免疫化学的试验可能具有高灵敏度,产生极少的假阴性。然而,因为除病状之外的其它因素也可能引起疾病标记浓度升高或降低,依赖于特定疾病标记的免疫化学分析的试验可能具有较差的特异性,产生高比例的假阳性。
本发明提供了一种高灵敏度、高特异性的非侵入性的疾病状态检测和鉴别方法。该方法可用于患者的筛查。本发明也提供了一种高灵敏度、高特异性的疾病状态检测和鉴别方法。该方法可用于患者的诊断和治疗监测。该方法包括使怀疑含有患病细胞的细胞学样品或多种样品接触一组探针,这些探针包括多种试剂,均可定量结合特定的疾病标记,并且检测和分析探针试剂的结合模式。本发明也提供构建和验证一组探针的方法,这组探针用于检测一种特定疾病(或一组疾病)并鉴别其不同的病状。也提供了检测肺癌和鉴别不同肺癌类型的说明性探针组。也提供了说明性探针组或其它癌症和非癌症病状。
人类疾病起因于人类的适应机制不能中和外部(即当地或全球环境)或内部影响,导致体细胞、组织、器官或系统内的异常结构或功能。疾病可以根据如下表1所述的共同的病因机制分类。
表1:
  疾病类别   病状实例
  变态反应   对食物和植物的不良反应
  心血管   心力衰竭,动脉粥样硬化
  退行性(神经和肌肉)   阿尔茨海默氏病和帕金森氏病
  饮食   非营养物质和过量/不平衡的营养
  遗传性   镰状细胞性贫血,囊性纤维化病
  免疫   HIV和自身免疫
  感染   病毒、细菌、真菌、寄生虫
  代谢性   糖尿病
  分子和细胞生物学   癌症(瘤形成)
  毒性损伤   酒精、药物、环境诱变剂和致癌物
  创伤   汽车碰撞引起的身体损伤
病状起因于或者导致亚细胞、细胞、组织、器官或人体解剖学或生理学系统水平上的异常改变(即病理学状况)。许多病状(例如肺癌)的特征在于亚细胞或细胞水平上的异常改变。可以从患有怀疑的疾病的患者中采集标本(例如子宫颈巴氏涂片、排泄的尿、血液、痰、结肠洗液),诊断这些患者的疾病的存在和类型。分子病理学是鉴定和诊断性研究与这些基于细胞的疾病有关的分子改变的学科。
肺癌是能够用诊断试验(例如分子诊断组测定)筛查高危人群和危险个体,以检测疾病存在的疾病的一个说明性例子。同样,对于已经用这些方法检测出肺癌或其它疾病的患者,能够用相关诊断试验鉴别特定病状与相关的或共存的病状。例如,在肺癌的说明中,其它分子诊断组测定可能指出患者病状与下列肺癌类型之一相一致的可能性:(a)肺鳞状细胞癌,(b)肺腺癌,(c)肺大细胞癌,(d)肺小细胞癌,或(e)间皮瘤。基于细胞的病状的早期检测和鉴别是改善患者预后的一种假设方法。
癌症是一种肿瘤性疾病,其自然进程是致命的。与良性肿瘤细胞不同,癌细胞显示侵入和转移的性质,是高恶性的。癌症包括三大类癌(即基于上皮细胞的癌症)、肉瘤(例如基于骨的癌症)和基于血液的癌症(例如白血病和淋巴瘤),但是在平时使用时,所有这三种类型通常都含义相同地称为癌。据世界卫生组织(WHO)称,癌症每年影响超过1千万人,导致逾620万例死亡。
事实上,癌症是实际上能够在身体任何部位发生的不同种类的疾病集合。结果,对于所有癌症,乃至一种具体癌症类型的不同阶段之间,不同的治疗不是同样有效。当有大量治疗选择,并且治疗倾向于更加有效时,诊断(例如乳房X线照相术、子宫颈细胞学和血清PSA检验)的进展有时允许检测早期癌症。如果实体瘤较小且局部化,则单独的手术即足以治愈。然而,如果肿瘤已经扩散,则手术最多只能产生有限的好处。在这情况下,可以通过增加化学治疗和/或放射治疗来治疗转移性疾病。治疗非基于血液的转移疾病患者尽管在延长生命方面有些效果,但是很少治愈。即使开始时可能有反应,但是随着时间延长,疾病进展,患者最终死于它的作用和/或治疗的毒性作用。
尽管未得到证明,但是通常认为早期检测和治疗可减少发病率、死亡率和癌症的花费。在许多情况下,早期检测可使得在转移之前开始治疗。而且,因为有大量的治疗选择,实现治愈或者长期生存显著改善的可能性较高。
发展一种能够用来筛查“危险”人群的试验长期以来就是卫生工作者的一个目标。尽管曾经取得了一些成功,例如用于乳腺癌的乳房X线照相术,用于前列腺癌的PSA试验,和用于子宫颈癌的巴氏涂片,但是在大多数情况下,癌症在相对晚期才检测到,此时患者表现出症状,疾病几乎总是致死的。对于大多数癌症来说,没有试验或试验组合显示可以成本有效地鉴定早期疾病患者所必须的灵敏度和特异性。
为了使癌症筛查计划能够成功,并且被患者、医生和第三方付费者接受,试验必须具有不言而喻的益处(改变结果),可以广泛使用,并且能够在普通卫生保健的范围内易于实施。试验应当是相对非侵入性的,以导致足够的顺应性,具有高灵敏度,以及合理的特异性和预测值。另外,试验必须能够以相对较低的成本进行。
对于怀疑患有癌症的患者,诊断必须得到证实,肿瘤在细胞学和临床上适当地分期,以使医生可以进行适当的治疗性干预。然而,当前在癌症诊断和分期中使用的一些试验缺乏足够的灵敏度或特异性,太具侵入性,或者成本太高,以致无法用作基于群体的筛查试验。例如,以下表2和表3显示了肺癌诊断学的灵敏度和特异性的估计值和用来检测肺癌的诊断试验的估计成本(美元)。
表2:
肺癌诊断的灵敏度和特异性的评价[1]
  诊断试验   灵敏度(%)   特异性(%)
  常规痰细胞学   51.0   100.0
  胸部X线检查   16-85*   90-95
  白光支气管镜检查   48.0-80.0   91.1-96.8
  LIFE支气管镜检查   72.0   86.7
  计算机断层摄影术   63.0-99.9   80.0-61
  PET扫描   88.0-92.5   83.0-93.0
*取决于诊断时的疾病阶段
表3:
用于肺癌的诊断检验的估计花费[1]
  诊断试验  花费(美元)
  痰细胞学  90
  胸部X线检查  44
  支气管镜检查  725
  计算机断层摄影术  378
  PET扫描  800-3000
  切开活检  12847-14121
胸片(X射线)通常用来检查和定位癌症损伤,因为它具有适当的灵敏度、高特异性和低成本。然而,小的损伤通常难以检测到,尽管较大的肿瘤相对容易在胸片上显示,但是在检查时大多数已经转移。因此,胸部X射线缺乏作为早期检测方法必需的灵敏度。
计算机断层摄影术(CT)可用于证实和表征肺的小结,可以检测到通常被标准胸部X射线忽略的细微的异常[2]。CT,尤其是螺旋CT法,仍然是对先前有恶性痰细胞生物学结果或声带麻痹的患者的选择试验。比常规胸片灵敏度更高的CT已经成为显像中心气管的主要工具[3]。虽然能够检查大区域,尽管通过使用碘化造影剂能够达到提高的分辨率,但是CT也有心脏和呼吸运动造成的伪迹。
螺旋CT是一种更快速且灵敏的CT形式,它能够比常规CT或X射线更可靠地早期检测癌症损伤。螺旋CT在诊断早期疾病中似乎灵敏度大大提高。然而,该试验具有相对较低的特异性,假阳性率为20%[4]。由于工程技术进步提高了螺旋CT仪器的分辨率,假阳性率可能提高。在检测占全部肺癌三分之一的中心损伤时,螺旋CT的灵敏度也较低。此外,虽然最初试验的成本相对较低($300),但是后来的成本可能至少高一个数量级。使用分子诊断组测定的细胞学作为螺旋CT的辅助试验具有广阔的前景,它通过评价螺旋CT怀疑的肺小结的细针抽吸物(FNAs)或活检物(FNBs)最小化假阳性结果,提高了螺旋CT检查的特异性。
荧光支气管镜检查的灵敏度高于常规白光支气管镜检查,显著改善了对中心气道内小损伤的检测[5]。然而,荧光支气管镜检查不能检测周围损伤,它使支气管镜检查者花费长时间来检查患者的气道,而且它是一种昂贵的方法。另外,该方法具有中度的侵入性,对其作为基于人群的筛查试验产生了不可逾越的障碍。
正电子发射断层扫描术(PET)是一种高度灵敏的试验,它利用放射性葡萄糖鉴定肺内癌细胞的存在[6-8]。建造试验设施的成本较高,并且需要现场或附近有回旋加速器。实现集中化检验也是一个后勤问题。这与试验的高成本一起,限制了PET扫描对于肺癌患者分期,而不是对于疾病早期诊断的用途。
尽管有时作为一种肺癌筛查方法使用,但是痰细胞学由于灵敏度低以及不能降低疾病特异的死亡率而只有有限的成功。对于常规痰细胞学,病理学家利用细胞形态学的特有变化鉴定恶性细胞,进行癌症的诊断。今天,具有患肺癌“危险”或者怀疑患有肺癌的患者中只有15%接受痰细胞学试验,不到5%接受多重评价[9]。大量因素,包括肿瘤大小、位置、分化程度、细胞凝集、清除机制无法释放细胞和痰到外部环境中,以及痰内细胞的较差稳定性,导致该试验的总体表现较差。
癌症的诊断传统上依赖于单个分子标记的检测。遗憾的是,癌症是单个标记一般不能检测或者鉴别多种疾病形式的疾病。因此,只识别一种标记的探针已经证明基本无效。对“魔术子弹(magic bullet)”诊断试验的彻底探索已经进行了几十年,但是迄今为止还没有发现普遍成功的魔术子弹探针。
本发明的一个主要前景是,基于细胞的癌症诊断和筛查,对其它疾病的诊断和治疗性监测将比现有技术显著改进,现有技术使用单标记/探针分析,而不是使用同时标记的多种探针的试剂盒。这种多重分析方法特别适合于癌症诊断,因为癌症不是一个单一的疾病。而且,这种多因素“组(panel)”方法符合癌症在细胞学和临床上的多样性。
成功实施基于细胞的诊断试验的组方法的关键是设计和研制在化学上能够识别表征和区别多种病状的标记模式的最佳探针组。本专利申请描述了一种有效、独特的设计并研制这些新型最佳探针组的方法。
改进的标本采集(例如用于痰细胞学的床边混合器)和制备(例如新细胞学保存和运输液体,和基于液体的细胞学制备仪器)方法处在发展中,可以作为商品获得。与现有的这些方法联合,成功实施这种基于细胞的分子诊断组测定将导致:(a)表征恶性肿瘤和其它疾病的分子谱(molecular profile),(b)改进的早期癌症和其它疾病检测和鉴别方法,和(c)改进的临床诊断、预后、患者定制治疗和治疗性监视的机会。
                      发明概述
本发明涉及利用基于细胞的诊断检测一般疾病或鉴别具体疾病的探针组。该探针组包括多种探针,其中每种探针特异地结合与一般或具体疾病有关的标记,其中该探针组的组成探针与细胞学标本中细胞的结合模式可以诊断所述疾病的存在或具体性质。本发明也涉及一种形成探针组的方法,该探针组利用基于细胞的诊断检测患者的疾病或鉴别疾病。该方法包括确定探针结合的灵敏度和特异性,其中每一种探针特异地结合与一种疾病有关的标记文库的一个成员,以及选择有限的多种所述探针,其结合模式可以诊断所述疾病的存在或具体性质。本方法也涉及一种检测疾病或鉴别病状的方法。该方法包括使怀疑含有一种疾病特有的异常细胞的细胞学样品接触根据权利要求1的探针组,并检测所述探针的结合模式,这可以诊断所述疾病的存在或具体性质。
                      附图简述
图1.是用来鉴定不同肺癌组织学类型的探针组中包括的优选标记的分子标记。标以“%”的栏表示表达特定标记的肿瘤标本的百分比。
图2.可以利用不同标记鉴别具体肺癌类型的可能的方法。SQ表示鳞状细胞癌,AD表示腺癌,LC表示大细胞癌,SC表示小细胞癌,ME表示间皮瘤。每个细胞出现的数字代表一种细胞型相对于另外一种细胞型的标记改变的频率。为了包括于表中,该比例必须大于2.0或者小于0.5。大于100的数字通常表示第二种标记不被表达。在这些情况下,为了分析,将分母设为0.1。最后,空细胞代表表达无差异,或者没有表达数据。
图3.探针7和15在对照组织和癌组织中的H-得分的比较。X轴表示H-得分,Y轴表示病例百分比。
图4.相关矩阵,其中相关性取决于一对变量之间线性相关的量。该矩阵中相关数为50%或更高的所有标记都被认为是相关标记。注意该相关矩阵的所有对角元素的值均为1.0(即真),因为这些对角元素显示自相关值(即探针N与探针N相关)。也注意到,该矩阵是对角线对称的(即,探针N对M的相关值与探针M对N的相关值相同)。
图5.检测组的组成、两两鉴别组的组成和联合鉴别组的组成。显示了使用决策树分析、逐步LR和逐步LD的组的组成。注意阴影框代表通过两种或多种这类独立分析方法证明有效的探针。
图6.检测组的组成,其中不含探针7作为探针。显示了使用决策树分析、逐步LR和逐步LD的组的组成。注意阴影框代表通过两种或多种这类独立分析方法证明有效的探针。
图7.只使用商业优选探针的检测组的组成。显示了使用决策树分析、逐步LR和逐步LD的组的组成。注意阴影框代表通过两种或多种这类独立分析方法证明有效的探针。
图8a-c.用于检测和/或诊断肺癌、结肠癌、膀胱癌、前列腺癌、乳腺癌和子宫颈癌的探针组的优选标记(探针)概括。
                      发明详述
1.引言
本发明提供一种高灵敏度、高特异性的非侵入性疾病检测和鉴别方法。该方法包括使细胞学或组织学样品或怀疑含有患病细胞的样品接触一个包括多种试剂的探针组,其中每一种可定量结合一种疾病标记,以及检测这些试剂的结合模式。这种模式包括该探针组的组成探针的结合定位和密度/浓度。本发明也提供制备用于检测疾病及鉴别疾病的探针组,以及用于检测早期肺癌及鉴别不同肺癌类型的探针组的方法。组试验已经在医学中应用。例如,在血液血清分析中使用探针组。然而,因为细胞学分析包括各细胞和组织内特异性标记的成像和定位,在本发明之前,还不清楚组方法对细胞学或组织学样品是否有效。另外,也不清楚是否所有统计学分析都适用于基于细胞的最佳诊断探针组的设计和发展。
基于细胞学的筛查计划的少数几个例子之一是用于筛查子宫颈癌的巴氏涂片。该方法已经使用了50年以上,大大促进了如下事实:今天,定期接受巴氏涂片检查的妇女几乎没有死于子宫颈癌的。但是,巴氏涂片筛查计划也有缺点。例如,巴氏涂片劳动强度大,具有与人力表现有关的变异性,不能普遍采用。此处所述使用探针组的基于细胞的分子诊断筛查方法没有这些缺点。该方法可以完全自动化,从而使得费用较低,可重复,提高了这类试验的可用性。
本发明提供了一种高特异性、高灵敏度的检测疾病和鉴别疾病的方法。本发明适用于所有基于细胞的疾病,如癌症和传染病。
该探针组可诊断疾病的存在或具体性质。本发明通过快速、准确、相对非侵入性地、容易地检测和鉴别细胞学样品中的患病细胞,而同时保持低成本,克服了已知疾病检测方法的限制和缺点。
制备本发明的探针组的本发明方法的一个特征是可以快速发展探针组。
在检测疾病和鉴别疾病类型的方法中使用一组试剂有几个优点。一个优点是一组试剂足够多地允许检测和表征疾病,从而提高了试验的灵敏度和特异性。假如多种疾病有不均一的性质,没有单独一种试剂能够鉴定大多数病例。
使用探针组的另外一个优点是,使用探针组可以根据具体表达模式(探针定位和密度/浓度)鉴别不同疾病类型。由于不同疾病类型在进展速度、对治疗的反应和致死率方面可能显示显著的差异,所以对具体类型的了解能够帮助医生选择最佳治疗方法。
2.探针组
本发明的探针组包括多种试剂,其中每一种与一种疾病标记定量结合,其中该探针组的组成试剂的结合模式(定位和密度/浓度)可以诊断一种疾病的存在或具体性质。因此,该探针组可以是一种检测组或鉴别组。一个检测组检测细胞样品中是否存在一般疾病,而鉴别组鉴别已知患病(包括不同疾病类型)的细胞样品中不同的具体疾病。检测组与鉴别组之间的差别在于探针组所含的具体试剂。检测组包括具有可诊断疾病存在的结合模式的试剂,而鉴别组包括具有可以确定疾病具体性质(即每种类型)的结合模式的试剂。
根据定义,探针组包括一个以上的成员。使用一组标记而不是单独使用一种标记检测一般疾病或者鉴别具体疾病有几个原因。一个原因是,在所有患病细胞中存在而在健康细胞不存在的单一一种标记不太可能存在这样一种探针,它们的行为可以被高特异性、高灵敏度地测定,从而产生准确的试验结果。如果存在用于高特异性、高灵敏度地检测具体疾病的这种探针,早就应当用于临床试验。事实上,定向选择均由多种探针组成的组试验(paneltest)能够提供可确保在临床上充分检测的检测能力范围。
如果选择构建包括一种或极少探针的组试验,则任何一种标记/探针组合由于任何原因(例如,生物学变异性引起的标本细胞反应性降低;许多探针试剂间固有的变异性;处理试剂弱、过时或有缺陷;处理时间或探针条件不当)不能发挥标记功能可使试验完全不能检测或鉴别目标疾病。每个组试验中包括多种,甚至多余的探针可大大提高任何一种探针的失败不会导致试验完全失败的可能性。
探针是可与疾病标记结合的任何分子结构或亚结构。如此处所用的术语“试剂”也可以指可与疾病标记结合的分子结构或亚结构。分子探针是生物学家和临床医生用来检测和定位指示具体疾病的标记的导归器(homing devices)。例如,可以生产与以前被鉴定为小细胞肺癌标记的一种蛋白质特异结合的抗体。然后可以利用适当的免疫化学方案和孵育,用这种抗体探针定位怀疑患病的患者细胞和组织中的靶蛋白质标记。如果这种抗体探针以化学计量(即定量)方式与其靶标记结合,并且用一种生色或有色“标签”标记,则探针及(间接地)其靶标记的定位和定量可以用光学显微镜和图像细胞计量技术完成。
本发明涉及利用普通技术人员可用的大量方法之一检测分子标记在DNA、RNA或蛋白质水平上的表达改变。代表性探针可以是多克隆或单克隆抗体或其片段,或与编码该探针组中一种分子标记的核酸序列互补的核酸序列。探针也可以是一种染色剂,如DNA染色剂。本发明使用的多种抗体对于作为标记物的多种细胞表面或细胞内抗原是特异的。这些抗体可以用本领域技术人员公知的技术合成。例如,在最初产生针对该标记的抗体后,这些抗体可以测序,随后用重组技术制备。此外,抗体也可以购买获得。
在本发明的实施方案中,探针含有标记物。含有标记物的探针在此通常被称为“标记探针”。所述标记物可以是能够与一种探针附着,以便在探针与标记结合时发出信号或者该标记探针可以被观察人或分析仪器检测到的任何物质。这种标记物也可以被称为“标签”。标记物可以用读取设备显示。术语读取设备是指用来检测探针的分析装置。本发明涉及的标记物是发出一种信号并且允许鉴定样品中的一种成分的任何标记物。优选的标记物包括放射性、荧光团、生色或酶部分。因此,可能的检测方法包括但不限于:免疫细胞化学、免疫组织化学、原位杂交、荧光原位杂交、流式细胞术和图像细胞分析。标记探针产生的信号具有足以被医务工作者检测到的强度。
“标记”、“疾病标记”或“分子标记”是与一种疾病或病原体有关的任何分子结构或亚结构。术语“抗原”可以与“标记”互换使用。在广义定义上,标记是一种生物指示剂,它可以被观察者或仪器有意地使用,以显示、检测或测定具体疾病、事件或物质的存在或频率和/或量。例如,一种特殊且独特的核苷酸碱基序列可以作为一种遗传标记,用来追踪个体之间和家族中的遗传模式。类似地,分子标记是特定的分子,如蛋白质或蛋白质片段,它在细胞或组织内的存在表示一种具体的病状。例如,增殖的癌细胞可以表达在相同类型的正常细胞上未发现的新的细胞表面蛋白,或者可能过量表达特定的分泌蛋白,它的升高或降低的丰度(例如,分别是过量表达或表达不足)能够作为特定疾病的标记。
适用于细胞学组的标记是位于核、细胞质或细胞膜之中或之上的物质。标记也可以位于在细胞中任何位置的细胞器内。位于核内的代表性标记包括但不限于:成视网膜细胞瘤基因产物(Rb)、细胞周期蛋白A、核苷二磷酸激酶/nm23、端粒酶、Ki-67、细胞周期蛋白D1、增殖细胞核抗原(PCNA)、p120(增殖相关核仁抗原)和甲状腺转录因子1(TTF-1)。位于细胞质中的代表性标记包括但不限于:VEGF、表面活性脱辅基蛋白A(SP-A)、核苷nm23、黑素瘤抗原-1(MAGE-1)、粘蛋白1、表面活性脱辅基蛋白B(SP-B)、ER相关蛋白p29和黑素瘤抗原-3(MAGE-3)。位于细胞膜中的代表性标记包括但不限于:VEGF、凝血调节蛋白、CD44v6、E-钙粘蛋白、粘蛋白1、人上皮相关抗原(HERA)、成纤维细胞生长因子(FGF)、肝细胞生长因子受体(C-MET)、BCL-2、N-钙粘蛋白、表皮生长因子受体(EGFR)和葡萄糖转运蛋白-3(GLUT-3)。位于细胞质中的细胞器内的标记的一个例子是BCL-2,它(部分)位于线粒体膜中。位于核的细胞器中的标记的一个例子是p120(增殖相关核仁抗原),其位于核仁中。
优选的是如下标记:表达改变在疾病进展的早期发生,大多数患病细胞显示,允许检测超过75%的指定疾病类型;最优选地超过90%的指定疾病类型,和/或允许鉴别不同疾病类型的性质。
应当指出,本发明的组可以指探针组或标记组,因为探针与标记结合。因此,组可以含有大量标记,或者可以含有大量可与特定标记结合的探针。为了一致性起见,所述组是指探针组;然而,也可以指标记组。
标记也可以包括细胞核中的特征,如与恶变有关的改变(MAC),或与患者的癌症家族史有关的特征。与恶变有关的改变或MAC一般是位于癌细胞附近的看似正常的细胞中发生的看不大见的改变。细胞核中这些非常细微的改变在生物学上可能是由于核基质改变和染色质分布模式所致。甚至受过训练的观察者通过目视观察各个细胞也无法鉴别,但是可以使用高度自动化、计算机化的高速图像细胞计量法根据细胞群体的统计学分析确定。MAC的检测技术为本领域技术人员所公知,在以下文献中更详细地描述:Gruner,O.C.Brit J.Surg.3 506-522(1916);Neiburgs,H.E.等人,Transaction,7th Annual Mtg.Inter.Soc.Cytol.Council 137-144(1959);Klawe,H.Acta.Cytol.1830-33(1974);Wied,G.L.等人,Analty.Quant.Cytol.2257-263(1980);Burger,G.等人,Analyt.Quant.Cytol.3261-271(1981)。
本发明涵盖与疾病有关的任何标记。各种标记本身只是本发明的工具。因此,本发明不限于特定的标记。分类标记的一种方法是根据它们与其它分子的功能关系。如此处所用的“功能相关的”标记是与所述标记相同的生物学过程或途径的一种成分,本领域技术人员公知它与所述标记一起异常表达。例如,许多标记与细胞增殖途径有关,如成纤维细胞生长因子(FGF)、VEGF(血管内皮生长因子)、细胞周期蛋白A和细胞周期蛋白D1。其它标记包括葡萄糖转运蛋白,如Glut-1和Glut-3。
本领域普通技术人员受过测定功能相关的标记的良好训练,可以研究不同的标记或者进行测定标记的功能行为的实验。通过非限制性实施例,标记可以被分类为与血管发生有关的分子、跨膜糖蛋白、细胞表面糖蛋白、肺表面活性蛋白、核DNA结合磷蛋白、跨膜Ca2+依赖性细胞粘附分子、细胞周期蛋白依赖性激酶(CDK’s)的调节亚基、核苷二磷酸激酶、核糖核蛋白酶、在增殖的正常和肿瘤细胞中表达的核蛋白、DNA聚合酶δ的辅因子、在正常组织中沉默而在恶性肿瘤中表达时被针对肿瘤的自体特异性细胞毒性T细胞(CTL)识别的基因、糖基化分泌型蛋白质、胃肠道或泌尿生殖道、肺表面活性物质的疏水性蛋白质、跨膜糖蛋白、与增殖、分化和血管发生有关的分子、原癌基因、同源域转录因子、线粒体膜蛋白、在快速增殖细胞的核中发现的分子、葡萄糖转运蛋白或者雌激素相关热休克蛋白。
生物标记和探针的类别包括但不限于:(a)形态学生物标记,包括DNA倍性、MAC和癌前病变;(b)遗传生物标记,包括DNA加合物、DNA突变和凋亡指数;(c)细胞周期生物标记,包括细胞增殖、分化、调节分子和凋亡标记,和(d)分子和生物化学生物标记,包括癌基因、肿瘤抑制基因、肿瘤抗原、生长因子和受体、酶、蛋白质、前列腺素水平和粘附分子。
“疾病(状态)”可以是任何基于细胞的疾病。在一些实施方案中,所述疾病是癌症。在另外一些实施方案中,所述疾病是一种传染病。癌症可以是任何癌症,包括但不限于:来自肺、尿道、胃肠道和生殖道的基于上皮细胞的癌症;基于实体瘤和/或分泌瘤的癌症,如肉瘤、乳腺癌、胰腺癌、肝癌、肾癌,甲状腺癌和前列腺癌;基于血液的癌症,如白血病和淋巴瘤。可以用本发明检测的代表性癌症有肺癌、膀胱癌、胃肠道癌、子宫颈癌、乳腺癌或前列腺癌。可以检测的代表性传染病包括基于细胞的疾病,其中传染性生物是病毒、细菌、原生动物、寄生虫或真菌。例如,传染病可以是HIV、肝炎、流感、脑膜炎、单核细胞增多症、结核病和性传播疾病(STD),如衣原体、毛滴虫、淋病、疱疹和梅毒。
如此处所用的术语“一般疾病”是指这样的疾病,其包括几种具体疾病类型,如肺癌、性传播疾病和基于免疫的疾病。具体疾病也被称为疾病的组织学类型。例如,术语“肺癌”包括几种具体的疾病,其中有鳞状细胞癌、腺癌、大细胞癌、小细胞肺癌和间皮瘤。术语“性传播疾病”包括几种具体疾病,其中有淋病、人乳头状瘤病毒(HPV)、疱疹和梅毒。术语“基于免疫的疾病”包括几种具体疾病,如系统性红斑狼疮(狼疮)、类风湿性关节炎和恶性贫血。
如此处所用的术语“高危人群”是指在家中或者在公开场合暴露于致病因素(例如致癌物)的一群个体(即肺癌“高危人群”可能暴露于吸烟、被动吸烟和职业性暴露)。“高危人群”中的个体也可能有遗传倾向。
术语“处于危险中”是指无症状,但是由于家族史或明显暴露而具有发展疾病的严重危险的个体(即,处于肺癌危险中的个体有>30包-年的吸烟史;“包-年”是每天吸烟包数乘以暴露年数计算的计量单位)。
癌症是例如由于基因表达改变,细胞不加控制地分裂的一种疾病。在本发明的方法和探针组中,癌症可以在任何器官中任何恶性生长。例如,癌症可以是肺癌、膀胱癌、胃肠癌、子宫颈癌、乳腺癌或前列腺癌。每种癌症都可能包括疾病或癌症组织学类型的集合。术语“组织学类型”是指组织学不同的癌症。根据癌症不同,它们可能有一种或几种组织学类型。例如,肺癌包括但不限于:鳞状细胞癌、腺癌、大细胞癌、小细胞癌和间皮瘤。了解患者所患癌症的组织学类型是非常有用的,因为它可以帮助医生定位和表征疾病,确定最佳治疗策略。
传染病包括基于细胞的疾病,其中传染性生物是病毒、细菌、原生动物、寄生虫或真菌。
代表性检测和鉴别组是检测肺癌—一种一般疾病的探针组,和鉴别一种肺癌类型—具体疾病与其它所有肺癌类型和假阳性的探针组。假阳性可能包括不同类型的转移癌,如转移的肝癌、肾癌或胰腺癌。
3.制备探针组的方法
制备检测患者的一般疾病或者鉴别具体疾病的探针组的方法包括测定探针结合与一般或具体疾病有关的标记文库的灵敏度和特异性,以及选择其结合模式(定位和密度/浓度)可诊断该疾病的存在或具体性质的多种所述探针。在一些实施方案中,进行任选的预修剪(pruning)和制备步骤。制备本发明的探针组的方法包括分析探针与已知组织病理样品中的标记(即金标准)的结合模式。然后可以利用根据金标准设计的分类器(classifier)设计用于细胞计量术,特别是自动化细胞计量术的分类器。因此,利用选自病理分析的标记探针组准备由细胞学样品如痰、细针抽吸物、尿等获得的新的训练数据集。特定损伤释放的细胞将以类似于金标准的方式染色。此处所述的方法消除了选择最佳特征组的实验误差,因为以金标准组织学病理样品为基础的诊断的完整性较高。尽管原则上能够使用细胞学样品产生一个探针组,但是不太希望这样,因为细胞学样品含有碎片,在细胞学样品中可能存在细胞的衰退(deterioration),病理学诊断可能难以在临床上证实。
标记文库是一组标记。该文库可以包含任何数量的标记。然而,在一些实施方案中,文库中标记的数量受技术和/或商业实际如标本大小的限制。例如,在一些实施方案中,针对探针组中的所有标记检测每种标本。因此,标记的数量不能大于标本可以分成的样品的数量。另外一个技术实际问题是时间。一般而言,文库含有不到60种标记。优选地,文库含有不到50种标记。更优选地,文库含有不到40种标记。最优选地,文库含有10-30种标记。优选地,可能的探针组成员的文库含有10种以上的标记,以便有机会最佳化探针组的表现。如此处所用的术语“大约”是指加或减3种标记。
在一些实施方案中,通过检索包括关于不同标记和标记与一般/具体疾病之间关系的信息的资源获得一种文库。代表性资源包括实验结果、理论或预测分析和文献资源,如杂志、书、目录和网站。这些不同的资源可以使用组织学或细胞学,可能依赖于细胞遗传学,如原位杂交;蛋白质组学,如免疫组织化学;细胞计量术,如MACs或DNA倍性;和/或细胞病理学,如形态学。这些标记可能位于细胞之中或之上的任何位置。例如,标记可能位于核、细胞质或细胞膜之中或之上。标记也可能位于上述任何位置内的细胞器中。
在一些实施方案中,文库可能大小不当。因此,在开始制备探针组的基本方法之前可能需要一个或多个修剪步骤。修剪步骤可能包括一个或几个连续的修剪步骤。例如,一个修剪步骤可能包括设计灵敏度和/或特异性的任意阈值(arbitrary threshold)。因此,实际或预测的灵敏度和/或特异性低于阈值的所有标记都可以从文库中除去。可以单独进行或者与其它修剪步骤依次进行的其它代表性修剪步骤可能取决于检测技术的要求、报道结果的获取限制和不可重复性。对于检测技术的要求,检测一种具体标记所需的机器可能无法获得。对于获取限制,许可限制可能使得难以或者不可能获得可与具体标记结合的一种探针。在一些实施方案中,对每种标记进行谨慎处理(due diligence)研究。
在一些实施方案中,在开始制备探针组的基本方法之前,可能必须进行制备步骤。代表性制备步骤包括最优化客观定量检测文库中的标记的方案,和采集组织学标本。标记的客观定量检测方案的最优化属于普通技术人员的技能。例如,必须获得必要的试剂和用品,如缓冲液、试剂、软件和设备。试剂的浓度可能需要调节。例如,如果观察到非特异性结合,则本领域普通技术人员可以稀释探针溶液的浓度。
在一些实施方案中,组织学标本是金标准。术语“金标准”为本领域普通技术人员所周知,是指标本的组织学和临床诊断已知。金标准通常被称为“训练”数据集。金标准包括可能有助于鉴别方法的所有特征的一组测定值,或者可靠的估计值。这些特征采集自从患有已知疾病的代表性数量的患者中采集的样品。标准样品可以是细胞学样品,但是对于探针组选择这是不希望的。
组织学样品可以用本领域技术人员公知的任何技术例如活组织检查获得。在一些实施方案中,每名患者的标本大小必须足够大,以便能够获得足够的组织切片来检测文库中的每种标记。
在一些实施方案中,从诊断患有每种具体疾病的多名患者中获得标本。可以从每名患者获得一份标本,或者可以从每名患者获得多份标本。在从各个患者获得多个标本的实施方案中,依靠外科医生的经验确定从一名患者获得的每种标本是否与从该患者获得的其它标本相似。也从对照组患者中获得标本。对照组患者可以是健康患者或者未患所检测的一般或具体疾病的患者。
基本方法的第一步是确定探针结合与希望的疾病有关的标记文库的灵敏度和特异性。在该步骤中,对患者标本样品使用对于每种标记特异的探针。因此,在一些实施方案中,例如,如果文库中有30种标记,则每个患者标本将被分成30份样品,每份样品都用对于30种标记之一特异的探针处理。该探针含有可以被显示的一种标记物。因此,探针与标记结合的模式和水平能够检测。结合模式和水平可以定量检测,即利用分析仪器检测,或者由人如病理学家定性检测。
在一些实施方案中,发展了一种客观的和/或定量的评分方法,来检测探针与标记结合的模式和水平。这种评分方法可以探索性设计。例如,病理学家利用评分方法客观化主观解释。确定适当的评分方法属于普通技术人员的技术。在一些实施方案中,评分方法可以包括将特征如标记探针染色的密度分类为:无,弱,中或强。在另一个实施方案中,可以用在载玻片图像上运行的算法确定这些特征。一种代表性评分方法是将比例和密度综合为一个“H得分”的方法,H得分的获得方法是:将强度分级为:无=0,弱=1,中=2,强=3,细胞百分数分级为:0-5%=0,6-25%=1,26-50%=2,51-75%=3,>75%=4,然后将两个分级相乘。例如,50%弱染色加50%中度染色得分为6=(1x2)+(2x2)。“H得分”以本发明人之一Kenneth Hirsch命名。
普通技术人员能够解决与最小化与病理学家和样品有关的可能的偏性有关的问题。例如,可以利用随机化最小化具有系统误差的机会。进行实验者可以利用盲试排除实验偏差。例如,在一些实施方案中,进行双盲研究可以最小化病理学家之间的差异。如此处所用的术语“双盲研究”是一种公知的避免偏性的方法,其中数据采集和数据分析独立进行。在其它一些实施方案中,通过随机化样品最小化样品之间的差异。例如,样品在病理学家分析之前随机化。也存在与实验方案有关的随机化。在一些实施方案中,每个样品由至少两名病理学家分析。对于每名患者,获得对探针与标记结合的可靠评价。在一个实施方案中,这种诊断由有资质的病理学家进行,每名患者由两名病理学家诊断,以检查可靠性。
为了产生可靠的设计和可靠的统计学表现估计,应当采集足够数量的样品。确定多少样品足以产生可靠的设计和可靠的统计学表现估计属于普通技术人员的技能。大多数标准分类器设计软件包包括测定表现估计可靠性的方法,样本含量应当逐渐增加,直到获得可靠的估计。例如,用采集的200个样品和对每个样品估计的27种不同特征可以获得足以产生可靠设计的估计。
第二步是选择有限数量的探针。该选择步骤可以使用统计学分析和/或模式识别技术。为了进行该选择步骤,可以将数据集合为一个数据库。在一些实施方案中,可以将探针编号,以使它们的作用方法在有效性分析过程中不可见,并且进一步使偏性最小化。要使用严格的统计学技术,因为该方法产生大量的数据。可以使用任何统计学方法,普通技术人员将能够确定哪种和多少方法是合适的。
可以使用任意数量的统计学分析和/或模式识别方法。由于数据结构在开始时未知,并且由于对于不同的结构,不同的分类设计方法表现更好,优选地对数据使用至少两种设计方法。在一些实施方案中,可以使用三种不同的方法。数据集统计学分析和模式识别领域的普通技术人员可以识别某些统计学方法将比其它方法更可能产生有效结果的数据集结构的特征,在这种情况下有效是指使用希望数量的探针达到一定水平的灵敏度和特异性。本领域普通技术人员知道统计学分析和/或方法的效率取决于数据。以下描述了代表性的统计学分析和/或模式识别方法:
a)决策树法,被称为C4.5。C4.5是公共软件,可以通过ftp从http://www.cse.unsw.edu.au/~quinlan/获得。它非常适合通过依次对特定特征连续使用决策阈值能够被最佳分类的数据。使用无关数据工作最好;它也处理均值相似、方差不同的数据。C4.5程序包用来提供此处所述的实施例。
b)线性判别分析。包括发现使类别最佳分离的特征的加权组合。使用相关数据这些方法工作良好,但是对于均值相似、方差不同的数据则无法良好工作。根据需要的表现估计和图形输出,使用几种不同的统计学程序包(SPSS、SAS和R)。利用Fisher′s线性判别函数获得最小化差错率的分类法。利用一种标准判别函数计算接收工作特征(ROC)曲线,显示当决策阈值改变时灵敏度与特异性之间的权衡(trade-off)。
c)Logistic回归。这是线性回归模型的一种非线性变化:因变量被替换为对数优势比(logit)。线性回归如判别分析属于基于线性模型建立的一类统计学方法。这些模型以说明变量之间的线性关系为基础。
使用足够数量的样品能够利用上述技术和软件包搜索可良好鉴别类别的特征组合。其它代表性统计学分析和/或模式识别方法包括SPSS中的线性判别函数法以及R和SAS中的Logistic回归法。SPSS是产品全名,可从位于SPSS,Inc.Headquarters,233S.Wacker Drive,11thfloor,Chicago,Illinois 60606(www.spss.com)的SPSS,Inc.获得。SAS是产品全名,可从SAS Institute,Inc.,100 SAS Campus Drive,Cary,NC27513-2414,USA(www.sas.com)获得。R是产品全名,可以根据自由软件基金会GNU(普通公众许可)的条款作为自由软件获得。http://www.r-project.org/。
在一些实施方案中,获得一种相关性矩阵。相关性取决于一对变量之间线性相关的量。相关矩阵的获得方法是将使用一种标记获得的数据与使用另外一种标记获得的数据相关。可以设定阈值相关值,例如50%相关。在此情况下,相关值为50%或更高的所有标记都被认为是相关的标记。
在本发明的一些实施方案中,可以利用使用者提供的加权因子获得最佳探针组。加权可能与任何因素有关。例如,由于成本、商业考虑、误分类或差错率、一个地理位置内一般疾病的流行、一个地理位置内具体疾病的流行、探针的多余和可用性,某些标记可能比其它标记权重更高。可能促使使用者重视某些标记超过其它标记的与成本有关的一些因素是探针的成本和商业获得问题,如许可有效期和条件。可能促使使用者重视某些标记超过其它标记的与商业考虑有关的一些因素是研究与发展(R&D)时间,R&D成本,R&D风险,即探针有效的概率,最终分析仪器的成本,最终表现和上市时间。例如,对于检测组,可能促使使用者重视某些标记超过其它标记的与误分类或差错率有关的一些因素是可能希望最小化假阴性。另一方面,对于鉴别组,可能希望最小化假阳性。可能促使使用者重视某些标记超过其它标记的与一个地理区域中一般或具体疾病流行有关的一些因素是,在某些地理位置,某些一般或具体疾病的发病率更加流行或者更不流行。对于过剩,有时希望在组中过剩。例如,如果由于某些原因,一种探针不能被检测,由于组中标记的生物学变异性,一种疾病仍能通过其它标记检测。在一些实施方案中,是优选的多余标记的标记可能权重更高。
本发明在适应特征可用性方面灵活,其中成本或供应问题可能不能产生最佳组合。在一个实施方案中,本发明仅仅能够适合可以获得的特征来发现一种备选组合。在另一实施方案中,利用算法选择使成本加权包括于选择过程中以达到最小成本方案(cost solution)的特征。在这些实施例中,描述了对选自收集的所有标记的组合或者只是一组商业上优选的探针的标记表现估计。这些实施例也证明如何能够利用C4.5软件包以它们的高成本为基础降低某些探针的权重。这些探针也许不能进行组合以及最佳组合,但是在成本是一个重要因素的情况下,这种表现可以接受。
使用的一些方法允许对类别应用加权。这可从C4.5中获得,其中树设计能够优化成本。判别函数法也产生单参数输出,后者能够用来产生希望的假阳性或假阴性概率。这些参数对于不同阈值设置的图被称为接收工作特征(ROC)曲线。ROC曲线显示对于分类器的不同阈值水平,估计的假阳性相比真阳性得分的百分比。
假设许多一般疾病具有不均一的性质,可以构建一定程度过剩的探针组,以确保试验具有足够的灵敏度、特异性、阳性预测值(阳性预测值=真阳性/(真阳性+假阳性)和阴性预测值(阴性预测值=真阴性/(假阴性+真阴性),以证明它们可以作为基于群体的筛选。然而,地方和地域差异可能使这些试验在全球市场的不同地区有特殊的用途,因此可能显著影响用来为指定市场构建最终组试验的标准。临床应用的最优化是最重要的,地方因素,包括可负担性(费用)、技术能力、实验室和医疗保健供应资源、工作流问题、人力需求和探针和标记物的可用性,将有助于最终当地选择在探针组中使用的标记。利用众所周知的线性判别函数分析包括并估计所有可能的选择因素,由此用方程式中的一项代表每个当地因素,每一个均根据当地确定的重要性加权。这样,为了在世界上一个地区使用而最优化的组试验可能不同于为了在不同地区使用而最优化的组试验。
一旦利用上述方法设计了检测或鉴别组,下一步即是使用已知的细胞学样品验证该组。在验证之前,可以进行任选的优化步骤。在一些实施方案中,可以改进采集细胞学样品的方法。包括从患者中获得样品的方法,以及混合细胞学样品的方法。在其它一些实施方案中,可以改进细胞学运送方法。例如,确定最佳固定剂(防腐流体)或运输流体。
用来验证利用金标准组织学样品生产的探针组的细胞学样品是已知诊断的细胞学样品。这些样品可以用本领域技术人员公知的任何方法采集。例如,痰标本可以通过自发产生、诱发产生和使用增强痰产生的药物来采集。该标本与探针组中的每种探针接触,分析探针的结合水平和模式,确定该探针组的表现。在一些实施方案中,可能必须进一步优化该探针组。例如,可能必须从该探针组中除去一种探针。或者,可能必须向该探针组中添加另外一种探针。另外,也可能必须将探针组中的一种探针替换为另外一种探针。如果增加一种新探针,则该探针可以是一种由相关矩阵确定的相关标记。此外,该探针也可以是功能相似的标记。一旦该探针组被最优化,该探针组即可继续临床研究中的进一步试验。
在其它一些实施方案中,不一定最优化该探针组。如果使用细胞学样品的结果与使用组织学样品的结果相关,可能不需要优化该探针组,该探针组可以继续临床研究中的进一步试验。
4.应用方法
一旦利用上述方法获得探针组,即可以应用于细胞学样品。为了说明该方法,将以癌症特别是肺癌为例说明。其它疾病可以使用类似的步骤和程序。预期特定损伤释放的细胞将以类似的方式染色,并且以类似于用来获得该探针组的组织学病理学样品的方式在细胞学样品如细针抽吸物、痰、尿中显示。
本发明的基本方法一般包括两步。首先,怀疑含有患病细胞的细胞学样品接触含有多种试剂的探针组,其中每种试剂均定量结合一种疾病标记。然后检测每种试剂与一种疾病标记的结合水平或模式。检测结果可以用来诊断一般疾病的存在,或者鉴别具体疾病。一个任选的预步骤是鉴定一个最优化的药物组,这将有助于检测疾病或者鉴别细胞学样品中的疾病。
细胞学标本可能包括但不限于:采自体液,如血液、尿、脊髓液和淋巴系统;基于上皮细胞的器官系统,如肺通道,例如,肺痰,泌尿道,例如膀胱洗液,生殖道,例如子宫颈巴氏涂片,和胃肠道,例如结肠洗液的细胞样品;和来自器官和系统中的实体组织部位如乳房、胰、肝、肾、甲状腺、骨髓、肌肉、前列腺和肺的细针抽吸物;来自器官和系统中的实体组织部位如乳房、胰、肝、肾、甲状腺、骨髓、肌肉、前列腺和肺的活检物;和组织学标本,如来自手术活检的组织。
根据本发明的一组说明性试剂包括允许准确检测细胞学样品中的恶性细胞的许多试剂。本发明涉及的分子标记可以是帮助检测恶性细胞的任何分子。为了包括于一个组中,可以根据与标记表达水平或模式改变有关的几个不同的标准选择标记。优选的是如下标记:表达改变在疾病进展的早期发生,大多数患病细胞显示,允许检测超过75%的指定肿瘤类型;最优选地超过90%的指定肿瘤类型,和/或允许鉴别癌症的组织学类型。
基本方法的第一步是检测细胞学样品中试剂组的表达水平或模式的改变。该步一般包括使细胞学样品接触一种试剂,如标记的多克隆抗体或单克隆抗体或其片段或核酸探针,以及观察各个细胞中的信号。细胞的检测在信号改变时表示标记探针所针对的分子标记的表达水平改变。这些改变以表达水平相对于从检查组织或部位获得的非恶性细胞的提高或降低为基础。
对试剂组的表达水平或模式改变的分析使得技术人员能够高灵敏度、高特异性地确定细胞学样品中是否存在恶性细胞。术语“灵敏度”是指通过临床试验能够正确地确定患者患有一种疾病的条件概率(真阳性结果数除以真阳性和假阴性结果数)。因此,如果一种癌症检测方法具有高灵敏度,则检测到的癌症的百分比高,例如80%,优选地高于90%。术语“特异性”是指通过临床试验能够正确地确定个体未患疾病的条件概率(即真阴性结果数除以真阴性和假阳性结果数)。因此,如果一种癌症检测方法具有高特异性,为80%,优选地90%,更优选地95%,则该方法产生的假阳性的百分比较低。“细胞学样品”包括从患者采集的含有患者细胞的任何样品。本发明涉及的细胞学样品的例子包括体液、基于上皮细胞的器官系统洗涤液、刮除物、冲刷物、涂片或渗出物和细针抽吸物和活检物。
使用本发明所述的标记使得能够常规获得足够的细胞学样品,并且能够适当地保存这些样品用于随后的评价。细胞学样品可以在适当的防腐剂中处理并贮存。优选地,将细胞学样品收集到一个含有防腐剂的小瓶中。防腐剂是已知可保持细胞形态和抑制或阻断细胞蛋白质和核酸降解的任何一种分子或分子组合。为了确保适当的固定,样品可以在采集地点高速混合,以分解样品和/或打碎不明确的物质,如粘液,从而使细胞暴露于防腐剂。
一旦获得标本,即希望利用适当的混合装置将其匀浆。这允许将等份用于多个目的,包括将等份送往一个以上检测地点的可能性,以及制备多个载玻片和/或在一个载玻片上形成多个沉积。标本和每个等份在使用前的最初匀浆化将确保每个载玻片基本上具有相同的细胞分布,使得一个载玻片与另一个的结果的比较有意义。
用于分析的标本的制备包括将样品涂于载玻片上,使用的方法包括但不限于涂片、离心或细胞单层的沉积。这些方法可以是手动的、半自动的或全自动的。可以抽吸细胞悬液,使细胞沉积在滤膜上,细胞单层转移到制备的载玻片上,可以处理进行进一步的评价。必要时也可以重复这一过程,制备其它载玻片。本发明包括每个载玻片检测一种分子标记。也涉及每个载玻片检测几种分子标记。优选地,每个载玻片检测1-6种标记。在一些实施方案中,每个载玻片检测2种标记。在其它一些实施方案中,每个载玻片检测3种标记。
本发明涉及利用普通技术人员可以使用的大量方法之一检测分子标记在DNA、RNA或蛋白质水平上的表达改变。细胞学样品中分子标记表达水平和模式改变的检测通常包括使细胞样品接触一种多克隆或单克隆抗体或其片段,或与编码该组中一种分子标记的核酸序列互补的核酸序列,通称为“探针”和标记物。探针和标记物成分一般有效连接,使得在探针与分子标记物反应时发出信号(“标记的探针”)。本发明涉及的标记物是发出或者能够产生信号,并且允许鉴定样品中的成分的任何标记物。优选的标记物包括放射性、产荧光、发色或酶部分。因此,可能的检测方法包括但不限于免疫细胞化学;蛋白质组学,如免疫化学;细胞遗传学,如原位杂交,和荧光原位杂交;放射性检测、细胞计量术和场效应,如MACs和DNA倍性(利用自动化计算机化细胞计量术定量化学计量染色的核DNA);细胞病理学,如基于形态学的定量细胞病理学。标记探针产生的信号优选地具有足以被医务工作者或技术人员检测到的强度。
一旦制备载玻片,医务工作者即可对载玻片进行显微镜观察,以鉴定显示癌症诊断特有的标记表达改变的细胞。医务工作者可以使用图像分析系统和自动化显微镜鉴定目标细胞。数据分析可以采用一种信息管理系统和算法,帮助医生作出明确的诊断,并选择最佳治疗方法。医务工作者也可以利用能够检测标记物存在的仪器平台检查样品
分子诊断组测定将产生一个或多个含有标记的细胞和/或组织切片的载玻片。专家客观地以及能够获得有临床意义的结果地评价这些(细胞)病理学多重标记细胞制品的挑战实际上对于任何人都是一个不可克服的检测和感知问题。
能够发展计算机辅助成像系统(即光电显微镜TM),用来定量及可重复地评价探针标记的细胞和组织的量和位置。这种光电显微镜TM结合了机器人载玻片处理能力、数据管理系统(例如医学信息学)和定量数字(光学和电子)图像分析硬件和软件模块,用来检测和报告通过人目测无法获得的基于细胞的探针含量和定位数据,具有相当高的灵敏度和精确性。这些探针数据能够用来根据对于多种疾病的基于细胞的各自标记的有关特征和差异,表征和区别细胞样品。
该方法是这样一种方法:对基于细胞的标本和样品使用分子诊断组,随后利用计算机辅助成像系统定量和报告分子诊断组试验的结果。这种成像系统能够用来评价基于细胞的样品,其中对一种给定的基于载玻片的样品同时使用多种探针,这些探针可以分别分析、定量和报告,因为是根据显微镜细胞学或组织载玻片上的颜色区别这些探针。
样品中的标记物产生的信号如果具有适当的类型和足够的强度,可以由检查者(例如病理学家)用标准显微镜或计算机辅助的显微镜检测[167]。计算机辅助的显微镜是一种计算机界面的工效学显微镜工作站,它整合了用鼠标驱动的显微镜操作控制(例如变级(stage movement)、聚焦)与主要功能的计算机化自动化(例如载玻片扫描模式)。一个集中数据管理系统存储、组织并显示有关患者信息以及所有标本筛查和病理学家检查的结果。在条码上印刻并附于每个样品载玻片的标识编号唯一地确定数据库中的每个样品,并将其与原始标本和患者相关联。
在一个优选实施方案中,利用与集中数据管理系统连接的自动图像分析系统或光电显微镜检测并定量样品中的标记物产生的信号。光电显微镜提供了对显微镜操作的完全自动化的软件控制,加入了适于定量观察者不可检测的信号(如极弱的信号或放射标记部分发出的信号)的检测器和其它组件。为了用自动化仪器快速重新定位,以及为了利用计算机辅助显微镜观察,电子存储检测到的信号的位置[168]。
集中数据管理系统利用条码标识编号保存所有患者和样品的数据。这些数据可以从多个地点不同时获得,可以来自细胞学家和/或自动分析仪的多次观察和分析。这些数据可能包括代表以前均匀化的一种患者标本的等份的多个样品载玻片的结果。这些数据的全部或一部分可以转移到或者来自医院实验室信息系统,以满足报告、存档、记账或管理的要求。可以产生包括组试验和人眼观察的综合结果的一份综合报告,以硬拷贝的形式,或者通过网络计算机或互联网以电子形式发送给医生。
在一些实施方案中,本方法允许差别鉴别不同疾病,如癌症的不同组织学类型。术语“组织学类型”是指具体的疾病。根据一般疾病的不同,可能有一种或几种组织学类型。例如,肺癌包括但不限于鳞状细胞癌、腺癌、大细胞癌、小细胞癌和间皮瘤。了解患者所患癌症的组织学类型是非常有用的,因为它可以帮助医生定位和表征疾病,确定最佳治疗策略。
为了确定具体疾病,选择可以鉴别具体疾病的一组标记。例如,在一组分子标记内,可以鉴定表明癌症具体组织学类型的表达模式。对分子标记组的表达水平的检测通过上述方法实现。优选地,使用一组1-20种分子标记鉴别肺癌的不同组织学类型。然而,最优选使用4-7种标记。可以发展决策树来帮助根据标记表达模式鉴别不同的组织学类型。
除了可以检测细胞学样品中的恶性细胞之外,本发明还可用于疾病的分子表征。这些信息对于预后通常是有意义的,能够帮助医生为特定患者选择最佳治疗方法。另外,本发明所述的标记组也可以用于监测患者的复发,或者测定用来治疗疾病的疗法的有效性。
通过非限制性实施例,可以用一个肺癌检测组检测肺癌的存在,可以用一个鉴别组检测肺癌的具体类型。如果医生确定细胞学样品中存在恶性细胞,则可以对肺癌组织学类型进行进一步的分析。本发明中包括的肺癌的组织学类型包括但不限于鳞状细胞癌、腺癌、大细胞癌、小细胞癌和间皮瘤。图1说明在用于鉴定肺癌不同组织学类型的一个组中包括的是优选标记的分子标记。标以“%”的栏表示表达一种具体标记的肿瘤标本的百分比。
在确定肺癌不同组织学类型的过程中,分析一种标记的相对表达水平。图2说明如何利用不同的标记鉴别癌症的不同组织学类型。在该表中,SQ表示鳞状细胞癌,AD表示腺癌,LC表示大细胞癌,SC表示小细胞癌,ME表示间皮瘤。每个细胞中出现的数字代表一种细胞型相对于另外一种细胞型的标记改变的频率。为了包含于该表中,比例必须大于2.0或者小于0.5。大于100的数字通常表示第二种标记不表达。在这些情况下,为了分析,将分母设为0.1。最后,空细胞代表表达没有差异或者没有表达数据。
分析采集的数据的一种方法是构建决策树。方案1-4是决策树的实例,可以构建,以便能够利用表达模式差异确定肺癌的组织学类型。本发明绝非只限于方案1-4所示的决策树。一种标记的相对表达水平可能高于、低于或者等于(ND)不同组织学类型的恶性细胞中分子标记的表达水平。每个方案利用指定分子标记组可以鉴别肺癌的5种组织学类型。
例如,在方案1中,探针组由HERA、MAGE-3、凝血调节蛋白和细胞周期蛋白D1组成。首先,样品与一种针对HERA的标记探针接触。如果HERA的表达低于对照,该试验表明肺癌的组织学类型是间皮瘤(ME)。然而,如果表达高于或等于对照,则样品与一种针对MAGE-3的探针接触。如果MAGE-3的表达低于对照,则样品与一种针对细胞周期蛋白D1的标记探针接触,能够确定小细胞癌(SC)或腺癌(AD)。如果MAGE-3的表达高于或等于对照,则样品与一种针对凝血调节蛋白的标记探针接触,能够确定鳞状细胞癌(SC)或大细胞癌(LC)。
方案1
在方案2中,探针组由E-钙粘蛋白、肺表面活性物质B和凝血调节蛋白组成。首先,样品与一种针对E-钙粘蛋白的标记探针接触。如果E-钙粘蛋白的表达低于对照,该试验表明肺癌的组织学类型是间皮瘤(ME)。然而,如果表达高于或等于对照,则样品与一种针对肺表面活性物质B的探针接触。如果肺表面活性物质B的表达低于对照,则样品与一种针对凝血调节蛋白的标记探针接触,能够确定鳞状细胞癌(SC)或大细胞癌(LC)。如果肺表面活性物质B的表达高于或等于对照,则样品与一种针对CD44v6的标记探针接触,能够确定腺癌(AD)和小细胞癌(SC)。(关于决策树的更多实例,参见方案3和4)。
方案2
Figure A0382505100371
方案3
方案4
一种优选方法包括使用分子标记组,其中表达模式的差异可以鉴别肺癌的不同组织学类型。
为了分析标记表达模式,可以构建多个不同的决策树。医生或其他医疗保健人员可以利用该信息进行患者管理决策以及选择最佳治疗策略。
5.组分析结果的报告
组分析的结果可以用多种方式报告。例如,结果可以报告为简单的“是或否”结果。此外,结果也可以报告为试验结果正确的概率。例如,一项检测组研究的结果可能表明一名患者是否患有一种一般疾病。由于探针组也报告特异性和灵敏度,结果也可以报告为患者患有一种一般疾病的概率。鉴别组分析的结果将鉴别具体的疾病。这些结果可以报告为“是或否”,相对于是否存在具体疾病。此外,结果也可以报告为存在一种具体疾病的概率。也能够对来自一名患者的标本进行几次鉴别组分析,报告存在的疾病是一种具体疾病的概率相对于其它概率的概率谱。其它概率也可包括假阳性。
在产生存在的每种具体疾病的概率谱的实施方案中,有几个可能的结果。例如,可能所有概率都是一个极小概率。在这种情况下,医生能够得出结论,患者的标本诊断为假阳性。也可能除了一个高于80-90%以外,所有概率都低。在这种情况下,医生能够得出结论,该试验证实患者患有具体疾病,显示高概率。也可能大多数概率都低,但是两种具体疾病报告有类似的高概率。在这种情况下,医生可以推荐更多的组试验来确保鉴定正确的疾病。另一种可能性是报告的所有概率都低,有一个略高于其它,但是不足以高到80-90%的范围。在这种情况下,医生可以推荐更多的组试验来确保鉴定正确的疾病,和/或从不同癌症类型的远端原发性肿瘤中排除转移癌。
下列实施例说明选择疾病检测组、疾病鉴别组的本发明的方法,组的证实和在临床上用于筛查疾病和鉴别疾病不同亚类的用途。这个说明性实施例选择了肺癌,部分是因为它对世界健康的重要性,但是应当理解,根据前面的概述公开内容,其它癌症类型以及传染病、退行性疾病和自身免疫病可使用类似的方法。
                      说明性实施例
1.肺癌
本方法用来发展肺癌检测组以及单肺癌型特异的鉴别组。肺癌是一种极其复杂的疾病的集合,可以分为两个主要类别。非小细胞肺癌(NSCLC)占全部肺癌的大约70-80%,可以进一步细分为3个主要的组织学类型,包括鳞状细胞癌、腺癌和大细胞癌。其余20-30%的肺癌患者表现为小细胞肺癌(SCLC)。另外,接触石棉的个体可能发展胸膜腔恶性间皮瘤,通常广泛扩散,侵袭其它胸结构。肺癌的不同形式倾向于位于肺的不同区域,预后不同,对不同的治疗形式有不同的反应。
根据世界卫生组织的最新统计(Globocan 2000),肺癌已经成为男性和女性中最常见的致死性恶性肿瘤,估计每年有124万例新病例和110万例死亡。仅在美国,国立癌症研究院报道,每年有接近186,000例新肺癌病例,162,000人死于该病,占全部与癌症相关死亡的25%。在美国,肺癌患者的1年总生存率为40%,然而,只有14%生存5年。在世界其它地区,5年生存率明显较低(英国为5%)。肺癌的高死亡率可能是由于如下事实:大多数患者(85%)在晚期疾病时被诊断,此时治疗选择受到限制,疾病可能已经转移。在这些患者中,根据诊断时的阶段不同,5年生存率为2-30%。这与早期诊断的患者截然不同,他们的5年生存率高于75%。为了治疗晚期肺癌,在临床实践中引入了大量新化疗剂,但是迄今为止,还没有一种在长期生存率方面有显著改善。即使早期疾病患者能够通过手术治愈,他们仍然处于高危险之中,因为他们有发展第二次恶性肿瘤的高可能性。因此,对于肺癌患者,早期检测和治疗,随后进行主动性(aggressive)监测,提供了实现长期生存率显著改善以及发病率和费用降低的最佳机会。
目前,患者由于X射线检查具有怀疑的损伤,或者由于患者出现症状,而被怀疑患者患有肺癌。结果,大多数患者被诊断为相对晚期疾病。另外,因为大多数方法都缺乏检测早期疾病的足够的灵敏度,美国国立癌症研究院(NCI)、国立卫生研究院目前的方针推荐甚至在具有明显危险的患者群体中筛查肺癌。然而,在本发明的这个实施方案中,利用痰细胞学提供相对非侵入性的、更有效且成本效益更高的早期检测肺癌的方法。
痰细胞学的特异性相对较高。最近的研究表明,有经验的细胞技术人员能够高度准确、可靠地识别恶性或重度发育异常的细胞[10]。当从相对晚期疾病患者中采集样品时,检测率可能高达80-90%[11,12],痰细胞学的总灵敏度只有30-40%[13,14]。假如获得及制备标本可能相对昂贵,则痰细胞学的低灵敏度特别重要。此外,不能检测恶性肿瘤可能明显延误治疗,从而减少治愈的机会。
“危险”人群的筛查也能影响痰细胞学作为一种筛查工具的价值。处于明显危险中的个体包括先前诊断为肺癌者、长期吸烟者或曾吸烟者(>30包年)和长期暴露于石棉或肺致癌物的个体。“危险”人群也包括具有遗传倾向或家族史的人。这些个体能够从试验中受益。包括低危险个体可导致检测的病例的绝对数增加,这将难以证明应当大大增加医疗保健成本。
导致常规痰细胞学表现相对较差的其它因素包括损伤位置、肿瘤大小、组织学类型和样品质量。鳞状细胞癌占全部原发性肺肿瘤的31%。大多数这些肿瘤起因于段支气管,并扩展到近端肺叶和远端次级分支(subsegmental branches)[15]。由于这个原因,痰细胞学在检测这些损伤方面相当有效(79%)。当前,鳞状细胞癌被视为适合在原位和放射性隐伏阶段进行细胞学检测的唯一肺癌类型[15],因为更可能获得脱落的细胞进行评价。在患者进行胸部X射线和痰细胞学的一项大规模研究中,所有肺癌的23%只用细胞学即可检测,提示肿瘤处于早期,在放射学上隐伏[16]。在另外一项研究中[17],痰细胞学检测76%的放射学隐伏肿瘤患者。
对于腺癌,70%的肿瘤发生于肺的周围,使得在常规痰标本中发现恶性细胞的可能性较低。由于这个原因,通过痰细胞学很少检测出腺癌(45%)[12,18,19],这是一个重要的考虑,因为腺癌的发病率似乎提高,特别是在妇女中[20-22]。
肿瘤大小也能够影响获得正确诊断的可能性,当考虑用于检测无症状个体的疾病的筛查试验时,这是一个特别重要的因素。肿瘤<24mm时只有50%的机会被检验为真阳性,检测较大损伤的可能性超过84%[12]。
最近的研究也表明,样本的细胞构成将影响痰细胞学的灵敏度[14,23]。鳞状细胞癌患者通常产生含有显著数量肿瘤细胞的标本,从而提高正确诊断的可能性[14,23]。对于腺癌患者,在95%的标本中,痰标本中存在肿瘤细胞报告不到10%,在75%的标本中报告不到2%,这使诊断明显更加困难。
分化程度也能够影响病理学家检测恶性细胞的能力,特别是对于腺癌。分化良好的肿瘤细胞通常类似于非肿瘤呼吸上皮细胞。对于小细胞肺癌,痰样品常常含有具有不同外观的松散聚集的细胞。然而,目前用来处理痰样品的技术倾向于解聚细胞,这使得诊断更加困难。
样品质量是可能使痰细胞学灵敏度低的另一个因素。最近的报道提示,能够从70-85%的研究对象中获得足够的样品。然而,成功地实现这种测定常常需要患者提供多份标本[13]。该程序不便、耗时且昂贵。患者的顺应性通常也较差,因为常常要求患者连续几天采样[13]。同样重要的是观察到具有发展为肺癌的明显危险的曾吸烟者常常不能产生足够的标本。样品的保存和处理是另外一个关键因素,它能影响痰细胞学作为诊断试验的价值。
最后,即使能够获得并且最佳地制备足够的样品,细胞技术人员通常仍然不得不每个标本检查2-4个载玻片,每个一般需要可达4分钟[24]。假如常规痰细胞学的灵敏度低、技术复杂性高、劳动强度大,作为早期检测肺癌的基于人群的筛查,几乎完全排除这种试验并不令人惊讶[25]。
即使这些技术问题得到解决,痰细胞学的低灵敏度仍然是一个重要的问题。假阴性结果的高发病率能够明显延迟患者接受可能治愈的治疗。发展较高灵敏度的试验是可能的,但是这些改进不能以牺牲特异性为代价。假阳性结果数量的增加将使患者经受不必要的、常常侵入性的且昂贵的随访(follow-up),对患者的生活质量将造成负面的影响。本发明克服了与以前的早期癌症检测方法有关的许多限制,包括与使用痰细胞学早期检测肺癌有关的限制。
肺癌是一种不均一的疾病集合。为了确保试验具有必要的灵敏度和特异性水平,以证明它可以用作基于人群的筛查方法,本发明设想使用例如10-30种细胞标记的文库发展探针组。本发明的文库的选择以相关科学文献的综述和再分析为基础,在大多数情况下,测定取自肺癌患者的活检标本中的标记表达,以将表达与预后相关联。
例如,早期检测、表征和/或监测患者痰中的肺癌的一个优选探针组可能包括在至少75%的肿瘤标本中发生表达改变的分子标记。一个代表性探针组包括选自下列的标记:VEGF、凝血调节蛋白、CD44v6、SP-A、Rb、E-钙粘蛋白、细胞周期蛋白A、nm23、端粒酶、Ki-67、细胞周期蛋白D1、PCNA、MAGE-1、粘蛋白、SP-B、HERA、FGF-2、C-MET、甲状腺转录因子、Bcl-2、N-钙粘蛋白、EGFR、Glut-1、ER-相关(p29)、MAGE-3和Glut-3。一个最优选的探针组包括在85%以上的肿瘤标本中发生表达改变的分子标记。一个代表性探针组包括选自下列的标记:Glut1、HERA、Muc-1、端粒酶、VEGF、HGF、FGF、E-钙粘蛋白、细胞周期蛋白A、EGF受体、Bcl-2、细胞周期蛋白D1和N-钙粘蛋白。除了Rb和E-钙粘蛋白之外,肺癌的诊断与标记表达的增强有关。关于本发明中使用的探针/标记文库的简述在以下表4中提供。应当指出,下表中的抗体编号与整个实施例中抗体/探针/标记的编号一致。
表4:
                                 用于肺探针组的探针和标记
  编号   标记缩写   抗体探针全称   靶标记名称/描述
  1   VEGF   抗VEGF   血管内皮生长因子蛋白
  2   凝血调节蛋白   抗凝血调节蛋白   跨膜糖蛋白
  3   CD44v6   抗CD44v6   细胞表面糖蛋白(CD44变体6基因);细胞粘附分子
  4   SP-A   抗表面活性脱辅蛋白质A   肺表面活性脱辅蛋白质
  5   成视网膜细胞瘤   抗成视网膜细胞瘤基因产物   磷蛋白
  6   E-钙粘蛋白   抗-E-钙粘蛋白   跨膜Ca2+依赖性细胞粘附分子
  7   细胞周期蛋白A   抗细胞周期蛋白A   细胞周期蛋白依赖性激酶的亚基;用于细胞周期调节
  8   nm23   抗nm23   nm23-H1和nm23-H2基因产生的两种密切相关的蛋白质
  9   端粒酶   抗端粒酶   用于染色体修复的核糖核蛋白酶
  10   Mib-1(Ki-67)   抗-Ki-67   核蛋白;在增殖的细胞中表达
  11   细胞周期蛋白D1   抗细胞周期蛋白D1   细胞周期蛋白依赖性激酶的亚基;用于细胞周期调节
  12   PCNA   抗增殖细胞核抗原   DNA聚合酶δ的蛋白质辅因子
  13   MAGE-1   抗黑素瘤相关抗原1   MAGE基因家族编码的细胞识别蛋白
  14   粘蛋白1(MUC-1)   抗粘蛋白1   细胞表面和分泌的粘蛋白(高度糖基化的蛋白质)
  15   SP-B   抗成熟表面活性脱辅基蛋白B   肺表面活性脱辅基蛋白
  16   HERA   抗人上皮相关抗原(MOC-31)   细胞表面抗原(跨膜蛋白)
  17   FGF-2(碱性FGF)   抗成纤维细胞生长因子   与细胞表面结合的蛋白质
  18   c-MET   抗c-MET   肝细胞生长因子(HGF)的跨膜受体蛋白
  19   甲状腺转录因子   抗TTF-1   甲状腺特异性基因的调节剂;也在肺中表达
  20   BCL-2   抗BCL2   BCL2基因编码的细胞内膜结合蛋白
  21   p120   抗p120   增殖相关核仁抗原蛋白
  22   N-钙粘蛋白   抗N-钙粘蛋白   跨膜Ca2+依赖性细胞粘附分子
  23   EGFR   抗EGFR   表皮生长因子受体,跨膜糖蛋白
  24   Glut1   抗-Glut1   转运葡萄糖的跨膜Glut蛋白质家族
  25   ER相关(p29)   抗ER相关P29;抗HSP27   雌激素受体相关p29蛋白;热休克蛋白27
  26   Mage3   抗黑素瘤相关抗原3   MAGE基因家族编码的细胞识别蛋白
  27   Glut3   抗Glut3   转运葡萄糖的跨膜Glut基因家族
  28   PCNA(较高稀释度)   抗增殖细胞核抗原   DNA聚合酶δ的蛋白质辅因子
优选探针组中的每种分子标记都在下文描述。在本章节结尾处提供了表5,其中列出了对于每种肺癌类型,标记在组织中表达的百分比。
葡萄糖转运蛋白(Glut1和Glut3)[26-28]
葡萄糖转运蛋白-1(Glut1)和葡萄糖转运蛋白-3(Glut-3)是一种普遍表达的高亲和性葡萄糖转运蛋白。肿瘤细胞通常显示比正常细胞更高的呼吸频率、葡萄糖摄取和葡萄糖代谢,肿瘤细胞中葡萄糖摄取增加被认为是由葡萄糖转运蛋白介导。已经报道了肺癌中某些类型GLUT同工型的过量表达。Glut1的细胞定位在细胞膜中。GLUT-1和GLUT-3是可用于检测疾病的疾病标记。
恶性细胞显示葡萄糖摄取增加,这似乎被一个葡萄糖转运蛋白(Gluts)家族介导。癌基因和生长因子似乎调节这些蛋白质的表达及其活动。Glut蛋白质家族成员在不同人组织中显示不同的分布模型,快速增殖通常与它们的过量表达有关。最近的证据提示,大部分NSCLC和大多数SCLC表达Glut1。
在NSCLC和SCLC中Glut 3的表达相对较低,相当百分比(39.5%)的大细胞癌表达该蛋白质。在I期肿瘤中,83%以一定水平表达Glut1,在25%的病例中有75-100%的细胞染色。这些数据提示,Glut1的过量表达是肿瘤进展中相对早期的事件。也在>90%的II期和IIIA期癌症中检测到Glut1免疫反应性。Glutl和Glut3免疫反应性与肿瘤分化之间似乎也是反相关。表达高水平Glut1的肿瘤似乎特别具有攻击性,预后较差。如果肿瘤是这些蛋白质阴性的,则观察到较好的生存率。
人上皮相关抗原(HERA)[29,30]
HERA是一种功能尚且不清楚的跨膜糖蛋白。HERA存在于大多数正常和恶性上皮上。最近的报道提示,在NSCLC的所有组织学类型中HERA均高表达,使其可以作为一种检测标记。相反,在间皮瘤中HERA不表达,因此提示作为一种鉴别标记的用途。HERA的细胞定位在细胞表面。
碱性成纤维细胞生长因子(FGF)[31-34]
碱性成纤维细胞生长因子(FGF)是一种多肽生长因子,它对肝素和其它糖胺聚糖有高亲和力。在癌症中,FGF作为一种强丝裂原起作用,在血管发生、分化和增殖中起作用,与肿瘤进展和转移有关。FGF的过量表达通常在SCLC和鳞状细胞癌中发生。在许多情况下(62%),细胞也表达FGF受体,提示存在自分泌环。48%的I期肿瘤过量表达FGF。II期肺癌中FGF的频率为84%。该生长因子或其受体的表达与较差的预后有关。对于表达FGF者,I期疾病患者的5年生存率为73%,与之相比,FGF阴性者为80%。细胞定位为细胞膜。
端粒酶[35-42]
端粒酶是延长并保持真核生物染色体的端粒的一种核糖核蛋白酶。它由具有逆转录酶活性的催化蛋白亚基和具有逆转录酶活性的RNA亚基和作为端粒延伸模板的RNA亚基组成。不表达端粒酶的细胞含有每次细胞分裂连续缩短的端粒,最终导致染色体的不稳定性、老化和细胞死亡。端粒酶的细胞定位在核中。
端粒酶的表达似乎在无限增殖化细胞中发生,酶活性是恶性表型的一个共同特征。接近80-94%的肺肿瘤显示高水平的端粒酶活性。另外,71%的增生、80%的化生和82%的发育异常表达酶活性。所有癌原位(CIS)标本都显示酶活性。在恶化前组织中的低水平表达可能与样品中只有小部分细胞(5%和20%)表达酶活性的事实有关。这与肿瘤不同,在肿瘤中,20-60%的细胞可能表达酶活性。根据有限数量的样品,端粒酶活性的表达似乎在SCLC中也常见。
增殖细胞核抗原(PCNA)[43-51]
PCNA是DNA聚合酶δ的一种辅因子。PCNA在细胞周期的S期和与DNA修复有关的DNA合成过程中表达。PCNA在广泛正常和恶性组织中的增殖细胞中表达。PCNA的细胞定位在核中。
PCNA的表达是快速分裂的细胞的一个共同特征,在98%的肿瘤中检测到。免疫组化染色是在83%的NSCLC中检测的中度到强烈染色的核。在51%的p53-阴性肿瘤中观察到强烈的PCNA染色。然而,当PCNA(>50%的细胞染色)和p53过量表达时(>10%的细胞染色),预后可能较差,发展时间较短。尽管在肺癌的所有阶段常常检测到,但是PCNA的强染色在转移性疾病中更常见。31%的CIS也过量表达PCNA。
CD44[51-58]
CD44v6是一种作为细胞粘附分子的细胞表面糖蛋白。它在上皮、间皮和造血组织中的大量正常和恶性细胞上表达。特异性CD44剪接变体的表达已经证明与某些人类恶性肿瘤中的转移和较差的预后有关。预期它可用于检测和鉴别鳞状细胞癌和腺癌。CD44是一种细胞粘附分子,似乎在肿瘤侵入和转移中起作用。旁路剪接导致几种变异同种型的表达。CD44表达在SCLC中通常缺乏,在NSCLC中可变地表达。在鳞状细胞癌中发生最高水平的表达,从而使其在鉴别肿瘤类型中有价值。在非肿瘤组织中,在支气管上皮细胞、巨噬细胞、淋巴细胞和肺泡性肺细胞中观察到CD44染色。特别是在早期疾病中发生过量表达时,CD44表达与肿瘤阶段、复发或生存率之间没有显著相关性。在转移损伤中,100%的鳞状细胞癌和75%的腺癌显示强CD44v6阳性。这些数据倾向于表明在肿瘤进展中相对晚期地发生CD44表达的改变,这能够限制它作为早期检测标记的价值。最近的发现提示,大多数NSCLC表达CD44v8-10变体,这使其成为一种可能的候选标记。
细胞周期蛋白A[59-62]
细胞周期蛋白A是细胞周期蛋白依赖性激酶(CDK′s)的一种调节亚基,控制细胞周期特定阶段的转变点。它在S期和向G2期进展过程中可以检测到。细胞周期蛋白A的细胞定位在核中。
由细胞周期蛋白和细胞周期蛋白依赖性激酶组成的蛋白质复合物用来调节细胞周期进展。细胞周期蛋白表达的改变与影响CCDN1基因的遗传改变有关。细胞周期蛋白作为调节分子,细胞周期蛋白依赖性激酶用作激活和灭活Rb的催化亚基。
免疫组化分析显示,如高Ki-67标记指数所表明的,细胞周期蛋白的过量表达与细胞增殖的增加有关。细胞周期蛋白的过量表达在75%的NSCLC中发生,似乎在肿瘤进展中相对早期地发生。最近的报道表明,66.7%的I/II期和70.9%的III期肿瘤过量表达细胞周期蛋白A。核染色在分化较差的肿瘤中常见。细胞周期蛋白A的表达通常与平均生存期的缩短和发展耐药性的倾向有关。然而,表达增强也与对阿霉素的较强应答有关。
细胞周期蛋白D1[63-73]
如同细胞周期蛋白A一样,细胞周期蛋白D1是细胞周期蛋白依赖性激酶(CDK′s)的一个调节亚基,控制细胞周期特定阶段的转变点。细胞周期蛋白D1调节细胞进入细胞周期的S期。在多种人类恶性肿瘤中,该基因通常扩增和/或它的表达解调节(deregulated)。细胞周期蛋白D1的细胞定位在核中。
如同细胞周期蛋白A一样,细胞周期蛋白D1用来调节细胞周期进展。细胞周期蛋白D1的染色主要在细胞质中,不依赖于组织学类型。报道提示,在40-70%的NSCLC和80%的SCLC中发生细胞周期蛋白D1的过量表达。在37.9%的I期、60%的II期和57.9%的III期肿瘤中观察到细胞周期蛋白D1染色。在发育异常和增生组织中也见到细胞周期蛋白D1的表达,提供了这些改变在肿瘤进展中相对早期发生的证据。过量表达细胞周期蛋白D1的患者显示较短的平均生存期和较低的5年生存率。
肝细胞生长因子受体(C-MET)[74-77]
C-MET是一种原癌基因,编码HGF的一种跨膜受体酪氨酸激酶。HGF是肝细胞和内皮细胞的一种丝裂原,对上皮来源的几种细胞型发挥多效性活性。C-MET的细胞定位在细胞表面。
肝细胞生长因子/分散因子(HGF/SF)刺激多种上皮细胞,使它们增殖、迁移并进行复杂的分化程序,包括血管发生。HGF/SF与c-MET癌基因编码的一种受体结合。正常和恶性组织都表达HGF受体,HGF/SF的表达似乎仅限于恶性组织。
人肺通常表达低水平的HGF/SF,在NSCLC中表达显著提高。利用Western印迹分析,88.5%的肺癌显示蛋白质表达增强。肿瘤的所有组织学类型都以升高的浓度表达蛋白质。在疾病的所有阶段都发生蛋白质水平的提高,最近的证据提示,除了癌细胞以外,基质细胞和/或炎症细胞也可能引起生长因子的产生。
粘蛋白-UC-I[78-32]
粘蛋白-1来自高度糖基化的分泌型蛋白家族,该家族包括覆盖和保护支气管树、胃肠道和生殖泌尿道的粘液胶的主要蛋白质组分。粘蛋白-1在上皮肿瘤中非典型地表达。粘蛋白-1的细胞定位在细胞质和细胞表面。
粘蛋白是一个高分子量糖蛋白家族,它由多种分泌型上皮细胞合成,是膜结合或分泌型的。在呼吸道内,这些蛋白质有利于覆盖并保护支气管树的粘液胶。粘蛋白表达的改变通常与包括肺癌在内的恶变一起发生。有证据表明这些改变可能引起细胞生长调节的改变,免疫系统的识别和肿瘤的转移能力。
尽管正常肺组织表达MUC-1,但是在肺癌中发现显著更高水平的表达,在腺癌中发生最高水平的表达。染色似乎不依赖于阶段,在吸烟者中比在曾吸烟者或不吸烟者中更常见。某些恶变前损伤也显示MUC-1表达提高。
甲状腺转录因子-1(TTF-1)[83,84]
TTF-1属于激活甲状腺特异性和肺特异性分化基因的同源域转录因子的家族。TTF-1的细胞定位在核中。
TTF-1是最初发现介导甲状腺球蛋白转录的一种蛋白质。最近,在间脑和支气管肺泡上皮中也发现了TTF-1的表达。在肺中,TTF-1作为调节表面蛋白质和clara分泌型蛋白质合成的一种转录因子。TTF-1的过量表达在高比例的肺腺癌中发生,能够帮助鉴别原发性肺癌和转移到肺的癌症。能够以95%的灵敏度检测表达TTF-1且为细胞角蛋白7阳性和细胞角蛋白20阴性的腺癌。
血管内皮生长因子(VEGF)[33,61,85-89]
VEGF在血管发生中起重要作用,它促进肿瘤进展和转移。VEGF存在多种形式;两种较小的同种型是分泌的蛋白质,作为扩散剂,而较大的两种仍然与细胞结合。VEGF的细胞定位在细胞质、细胞表面和细胞外基质中。
血管内皮生长因子(VEGF)是一种重要的血管生成因子和内皮细胞特异的丝裂原。血管发生是癌发生晚期、肿瘤进展的一个重要过程,在远端转移的发展中特别重要。VEGF与通常存在于表达生长因子的肿瘤中的特异性受体Flt结合,提示存在自分泌环。
免疫组化分析揭示,表达VEGF的细胞显示弥散和细胞质的染色模型。发亮非肿瘤细胞不表达,但是VEGF存在于大多数NSCLC和少部分SCLC中。有几篇报道表示早期肺癌中有高水平的VEGF。
VEGF的表达与转移频率增加有关。研究表明,VEGF表达表明腺癌有较差的预后和较短的无病间隔期,但是鳞状细胞癌则不然。表达高水平VEGF的组的三年和五年生存率为50%和16.7%,与之相比,低VEGF组分别为90.9%和77.9%。
表皮生长因子受体(EGFR)[90-104]
表皮生长因子受体(EGFR)是一种跨膜糖蛋白,能够被不同配体结合并激活。结合启动一系列事件,导致DNA合成、细胞增殖和细胞分化。EGFR已经在多种正常组织中得到证明,在多种肿瘤中发现EGFR的过量表达。在肺腺癌和大细胞癌中观察到表达提高,但是在小细胞肺癌中未观察到。EGFR的细胞定位在细胞表面。
EGFR在细胞生长和分化中起重要作用。EGFR均匀存在于基底细胞层中,而在多数组织学正常的支气管上皮浅层中不存在。除此之外,正常组织中没有一致的染色。最近的证据提示,EGF受体的过量表达可能不是发展侵入性肺癌的必要条件。然而,如果发生EGFR的过量表达,则似乎是相对早期事件,在更晚期疾病中有更高的染色强度。
对于侵入性癌患者,50-77%的肿瘤对EGF染色。EGFR的过量表达在鳞状细胞癌中比在腺癌中更常见,在SCLC中常见。最高水平的EGFR与晚期和转移性疾病一起发生,其EGFR浓度约两倍于I/II期肿瘤。估计提示在I期肿瘤中观察到的EGFR水平约两倍于正常组织。另外,48%的支气管损伤也显示EGFR染色,包括化生、不典型(atypia)、发育异常和CIS。在相同癌症患者的“正常”支气管粘膜中,在39%的病例中观察到EGFR的过量表达,但是在非癌症的支气管上皮中未见。另外,EGFR的过量表达在吸烟者比非吸烟者的肿瘤中更常见,特别是在鳞状细胞癌病例中。
几项研究提示,EGFR的过量表达与较差的预后有关,其它研究不能进行这种关联。
核苷二磷酸激酶/nm23[105-111]
核苷二磷酸激酶(NDP激酶)/nm23是一种核苷二磷酸激酶。具有高转移能力的肿瘤细胞通常缺乏或者只表达少量的nm23蛋白,因此nm23蛋白被描述为一种转移抑制蛋白。nm23的细胞定位在核和细胞质中。
nm23/核苷二磷酸激酶A(nm23)的表达是肿瘤进展的标志,表达与转移能力之间有反相关。在I期肿瘤过量表达nm23的情况下,在35个月的平均随访期未见转移的证据。免疫组化分析显示弥散的细胞质染色,通常只限于恶性细胞。肺泡巨噬细胞也表达该蛋白质。假定高水平的表达与低转移能力有关,当前对正常上皮细胞为什么不表达nm93没有解释。
在高比例的NSCLC中,特别是在大细胞肺癌中,和74%的SCLC中,观察到强染色,提示该蛋白质在肿瘤进展中起重要作用。除了鳞状细胞癌以外,染色强度倾向于随阶段而提高。根据可以获得的证据,似乎nm23是SCLC和NSCLC的一种预后因素。
Bc1-2[101,112-125]
Bcl-2是一种线粒体膜蛋白,在凋亡的抑制中起中心作用。bcl-2的过量表达是程序性细胞死亡已被阻止的细胞的一个共同特征。Bcl-2的细胞定位在细胞表面。
Bcl-2是一种原癌基因,认为它在促进细胞的终末分化、延长非循环细胞的存活期和阻断循环细胞的凋亡中起作用。Bcl-2能够作为一种同型二聚体存在,或者能够与Bax形成异二聚体。作为同型二聚体,Bax的功能在于诱导凋亡。然而,Bax-bcl-2复合物的形成阻断凋亡。通过阻断凋亡,bcl-2的表达似乎使影响到的细胞具有生存优势。Bcl-2表达也可能在耐药性的发展中起作用。bcl-2的表达被p53负调节。
对bcl-2的免疫组化分析揭示了细胞质染色的一种异源模型。在腺癌中,bcl-2的表达与较小的肿瘤(<2cm)和较低的增殖活性显著相关。bcl-2的表达似乎与神经内分泌分化更加密切相关,在高比例的SCLC中发生。
瘤前病变中没有bcl-2的过量表达,提示bcl-2的改变在肿瘤进展中相对晚期发生。除了肿瘤细胞以外,bcl-2免疫染色也在基底细胞中和正常细支气管腔表面发生。但是在更多分化的细胞型中通常检测不到。
在NSCLC中,bcl-2免疫反应性与预后改善的相关性有争论。有几篇报道提示表达bcl-2的肿瘤患者具有良好的预后和较长的复发时间。有几篇报道表明,在发展转移性疾病的患者中,bcl-2的表达趋于降低。对于鳞状细胞癌患者,bcl-2的表达与5年生存期的改善相关。然而,在三项相对较大的研究中,没有与bcl-2表达相关的生存优势,特别是对于早期疾病患者。
雌激素受体相关蛋白(p29)[126]
ER相关蛋白p29是一种雌激素相关热休克蛋白,已经发现它与雌激素受体的表达有关。p29的细胞定位在细胞质中。
雌激素依赖的细胞内过程在正常组织的生长调节中至关重要,并且可能在恶性肿瘤的调节中起作用。在一项研究中,在111例肺癌中的109例(98%)中检测到p29表达。男性与女性的p29表达与生存期之间的关系不同。p29的表达与较差的生存期有关,特别是在患有I期和II期疾病的女性中。在男性中,p29表达与长期生存之间没有相关性。
成视网膜细胞瘤基因产物(Rb)[68,73,123,127-141]
成视网膜细胞瘤基因产物(Rb)是一种核DNA-结合磷蛋白。磷酸化不足的Rb结合DNA肿瘤病毒的癌蛋白和基因调节蛋白,从而抑制DNA复制。Rb蛋白可以通过调节转录起作用;Rb功能的丧失导致细胞生长失去控制。Rb的细胞定位在核中。
成视网膜细胞瘤蛋白(pRb)是由成视网膜细胞瘤基因编码的一种蛋白质,以依赖细胞周期的方式磷酸化及去磷酸化。pRb被认为是一种重要的肿瘤抑制基因,作用在于在G0和G1期调节细胞周期。在其低磷酸化状态时,pRb抑制从G1到S期的转变。在G1期间,当细胞周期蛋白依赖性激酶(CDK′s)磷酸化该蛋白质时,发生pRb的生长抑制性质的失活。pRb的高度磷酸化阻止它与作为DNA合成所需的转录因子蛋白的E2F形成复合物。
成视网膜细胞瘤(Rb)基因的失活已经在包括肺癌在内的多种癌症类型中得到证明。小细胞癌不能对pRb染色,表明Rb功能丧失。总之,17.6%的肿瘤不能表达pRb,关于阶段或结节状态未见相关性。在31%的发育异常支气管活检中也见到染色的减少。然而,pRb表达与发育异常的严重性之间似乎没有相关性。相反,正常支气管上皮和采自肿瘤相邻区域的细胞表达pRb阳性核。这些数据提示,Rb蛋白表达的改变可能在一些肺癌发展早期出现。
Rb-阳性癌症患者可能具有略好的预后,但是在大多数研究中,这种差异不显著。然而,肿瘤为pRb阴性且p53或ras阳性的腺癌患者显示5年生存期缩短。在鳞状细胞癌中未发生类似的关系。据报道,pRb阴性肿瘤比Rb阳性癌更可能显示阿霉素抗性。
凝血调节蛋白[142-147]
凝血调节蛋白是一种跨膜糖蛋白。通过加速的蛋白C激活(随后通过结合蛋白S和凝血酶作为一种抗凝剂),TM的合成是在减少内皮细胞表面血块形成中至关重要的几种机制之一。凝血调节蛋白的细胞定位是细胞表面。
循环肿瘤细胞对宿主血小板的凝集在转移过程中似乎起重要作用。凝血调节蛋白在凝血酶激活抗凝剂蛋白C中起重要作用,是血管内凝血的一种重要调节剂。除了它在正常扁平上皮中的表达之外,凝血调节蛋白的表达也在鳞状化生、原位癌和侵入性鳞状细胞癌中发生。尽管在74%的原发性鳞状细胞癌中存在,但是只有44%的转移病变对凝血调节蛋白染色。这些数据提示,随着进展,凝血调节蛋白的表达降低。与分化较差的肿瘤相比,在分化良好和适度的肿瘤中倾向于发生高水平的表达。
凝血调节蛋白阴性的鳞状细胞癌患者倾向于具有较差的预后。18%的凝血调节蛋白阴性患者具有5年生存期,与之相比,对于肿瘤对该蛋白质染色阳性的病例,这个数字为60%。在凝血调节蛋白阴性肿瘤中发展为转移性疾病也更为常见(69%比37%),这些肿瘤在胸腔外部位发展的倾向性也更高。因此,对于鳞状细胞癌,凝血调节蛋白表达的丧失似乎是预后。在NSCLC晚期发生凝血调节蛋白表达改变和正常支气管上皮细胞表达该蛋白质的发现将限制它作为早期检测标记的用途。然而,由于大多数间皮瘤和只有少部分腺癌表达凝血调节蛋白,该标记具有鉴别这两种肿瘤类型的可能的用途。
E-钙粘蛋白和N-钙粘蛋白[148-151]
E-钙粘蛋白是一种跨膜Ca2+依赖性细胞粘附分子。它在细胞生长和发育中通过控制组织结构和保持组织完整性的机制起重要作用。E-钙粘蛋白有助于上皮细胞的细胞间粘附,上皮极化的建立,腺分化和分层。E-钙粘蛋白表达的下调在大量癌中观察到,通常与晚期和进展有关。E-钙粘蛋白的细胞定位在细胞表面。
E-钙粘蛋白是一种钙依赖性上皮细胞粘附分子。E-钙粘蛋白表达的降低与肿瘤去分化和转移和生存率降低有关。在中度和较差分化的鳞状细胞癌和SCLC中观察到表达降低。在腺癌中E-钙粘蛋白的表达没有改变。此外,腺癌表达E-钙粘蛋白,但是这些肿瘤不能表达N-钙粘蛋白,这与表达N-钙粘蛋白但不表达E-钙粘蛋白的间皮瘤不同。因此,能够利用这些标记鉴别腺癌和间皮瘤。
也能够利用E-钙粘蛋白表达评价鳞状细胞癌患者的预后。表达E-钙粘蛋白的肿瘤患者中有60%生存3年,表达降低的患者只有36%生存3年。
MAGE-1和MAGE-3[152-156]
黑素瘤抗原-1(MAGE-1)和黑素瘤抗原-3(MAGE-3)是一个基因家族的成员,它们在正常组织中通常沉默,但是在恶性肿瘤中表达时可被自体肿瘤定向的特异性细胞毒性T细胞(CTL′s)识别。MAGE-1和MAGE-3的细胞定位在细胞质中。
MAGE-1、MAGE-3和MAGE 4基因产物是可被细胞毒性T淋巴细胞识别的肿瘤相关抗原。因此,它们能够用作NSCLC免疫治疗的靶标。MAGE蛋白也被一些SCLC表达,但是正常细胞不表达。MAGE的表达率低于作为检测标记所必需的水平,组织学类型之间表达模式的差异提示MAGE表达可以用作鉴别标记。如下发现也支持这种用途:在50%的鳞状细胞癌中,90%以上的肿瘤细胞显示MAGE-3过量表达,在至少50%的细胞中30%的肿瘤显示过量表达。
核仁蛋白(p120)[157]
p120(增殖相关核仁抗原)在G1期早期在快速增殖细胞的核仁细胞中发现。p120的细胞定位在核中。
核仁蛋白p120是一种增殖相关的蛋白质,其功能尚未阐明。在肿瘤组织中检测到强染色,但是在巨噬细胞或正常组织中未检测到。p120的过量表达在鳞状细胞癌中更常见,在腺癌或大细胞癌中,该标记用于鉴别肿瘤类型的可能性提高。
肺表面活性物质[83,158-166]
肺表面活性物质是一种富含磷脂的混合物,用来降低肺泡-液体界面的表面张力,从而提供通气必需的肺泡稳定性。表面活性蛋白质似乎只在气管中表达,由肺泡II型细胞产生。在无肿瘤肺中,在正常和增生的肺泡II型细胞和一些无纤毛的细支气管上皮细胞中检测到原表面活性物质B免疫反应性。在大多数情况下,60%的腺癌具有强细胞质免疫反应性,10-50%的肿瘤细胞显示染色。鳞状细胞癌和大细胞癌不能对原表面活性物质-B染色。
表面活性脱辅基蛋白B(SP-B)是组成肺表面活性物质的4种疏水蛋白质之一,它是II型肺泡细胞分泌的一种磷脂和蛋白质复合物。肺鳞状细胞癌和大细胞癌和非肺腺癌不表达SP-B。SP-B的细胞定位在细胞质中。
SP-A是一种肺表面活性蛋白质,在使肺泡在呼气结束时保持不塌陷方面起关键作用。SP-A是肺泡上皮细胞(II型肺细胞)的一种独特的鉴别标记;该抗原甚至在肿瘤形成状态下仍然保持。SP-A的细胞定位在细胞质中。
肺表面活性物质A似乎对于非粘液性支气管-肺泡癌是特异的,100%染色,而与之相比,粘液型癌均不染色。肺表面活性物质可能用于鉴别肺癌与转移到肺的其它癌症。除了肿瘤细胞之外,非肿瘤肺细胞也对肺表面活性物质A染色。对于肺表面活性物质B,对肺表面活性物质A的染色在腺癌中相对常见,但是在其它NSCLC形式或SCLC中不常见。间皮瘤也不能表达肺表面活性物质A,从而提示肺表面活性物质A可以用于鉴别腺癌与间皮瘤。
Ki-67
Ki-67是在增殖的正常和肿瘤细胞中表达的一种核蛋白,在静止细胞中下调。它在细胞周期的G1、S、G2和M期存在,但是在G0期不存在。常用作增殖的标志。Ki-67的细胞定位在核内。
表5:
  标记   鳞状细胞癌   腺癌   大细胞癌   小细胞癌   间皮瘤
  Glut1   100.0+   64.5   80.5   64.0   NDA*
  Glut3   17.5   16.0   39.5   9.0   NDA*
  HERA   100.0   100.0   100.0   NDA   4.5
  碱性FGF   83.0   48.7   50.0   100.0   NDA
  端粒酶   82.3   86.3   93.0   66.7   NDA
  PCNA   80.0   69.8   87.7   51.0   NDA
  CD44v6   79.3   34.8   44.2   0.0   NDA
  细胞周期蛋白A   79.0   68.0   83.5   97.0   NDA
  细胞周期蛋白D1   42.7   36.0   62.0   90.0   NDA
  肝细胞生长因子/分散因子   75.5   78.3   100.0   NDA   100.0
  MUC-1   55.5   90.0   100.0   100   NDA
  TTF-1   38.0   76.0   NDA   83.0   NDA
  VEGF   61.8   68.3   100.0   43.5   NDA
  EGF受体   63.1   45.3   96.0   频繁   NDA
  nm23   68.0   52.6   83.5   73.5   NDA
  Bcl-2   45.5   43.3   42.5   92.0   NDA
  pRb表达的丧失   70.1   25.8   35.4   85.3   NDA
  凝血调节蛋白   66.8   12.2   4.0   0.0   81.0
  E-钙粘蛋白   69.0   85.0   NDA   100.0   0.0
  N-钙粘蛋白   NDA   4.0   NDA   NDA   94.0
  MAGE1   45.0   35.0   NDA   16.5   NDA
  MAGE3   72.0   33.3   NDA   33.5   NDA
  MAGE4   45.5   11.0   NDA   50.0   NDA
  核仁蛋白(p120)   68.0   35.0   30.0   NDA   NDA
  肺表面活性物质B   0.0   61.5   0.0   NDA   NDA
  肺表面活性物质A   12.0   52.9   17.5   20   0.0
+显示标记表达改变的肿瘤的百分比
*未获得数据
a.获得适当大小的标记文库
为了获得适当大小的与肺癌有关的标记文库,需要预修剪步骤。文献中已知有100种以上与肺癌有关的标记。文献中确定的并且评价可能包括于探针组中的候选探针的部分列表包括针对如下成分的抗体:bax、Bcl-2、c-MET(HGFr)、CD44S、CD44v4、CD44v5、CD44v6、cdk2激酶、CEA(癌胚抗原)、细胞周期蛋白A、细胞周期蛋白D1、E-钙粘蛋白、EGFR、ER-相关(p29)、erbB-1、erbB-2、FGF-2(bFGF)、FOS、Glut-1、Glut-2、Glut-3、Glut-4、Glut-5、HERA(MOC-31)、HPV-16、HPV-18、HPV-31、HPV-33、HPV-51、整联蛋白VLA2、整联蛋白VLA3、整联蛋白VLA6、JUN、角蛋白、角蛋白7、角蛋白8、角蛋白10、角蛋白13、角蛋白14、角蛋白16、角蛋白17、角蛋白18、角蛋白19、A-型核纤层蛋白(A;C)、B-型核纤层蛋白(Bl;B2)、MAGE-1、MAGE-3、MAGE-4、黑素瘤相关抗原克隆NKI/C3、mdm2、mib-1(Ki-67)、粘蛋白1(MUC-1)、粘蛋白2(MUC-2)、粘蛋白3(MUC-3)、粘蛋白1(MUC-4)、MYC、N-钙粘蛋白、NCAM(神经细胞粘附分子)、nm23、p16、p21、p27、p53、p120、P-钙粘蛋白、PCNA、成视网膜细胞瘤、SP-A、SP-B、端粒酶、凝血调节蛋白、甲状腺转录因子1、VEGF、波形蛋白和waf1。最初的标记列表如下修剪:开始时根据文献评价探针在检测早期癌细胞方面的明显有效性,鉴别癌症状态不同的细胞,并将标记定位于靶癌细胞。通过除去难以使用的标记进一步修剪这个标记列表,以减少实施,因为它们难以产生或获得,具有不合适的检测技术要求或者报告结果的再现性较差。在完成所有修剪步骤后,获得一个27种标记的文库。
b.优化方案及获得金标准肺癌样品
在获得这些探针组之前也需要预制备步骤。含有适当标记物的探针可以从供应商处获得。为了最佳客观定量检测,分析探针方案。例如,确定PCNA的浓度太低。开始时,PCNA用S809缓冲液1∶4000稀释。用S809以1∶3200进行第二次稀释。每种标记的优化方案在下文列出。应当指出,第二列标为“抗体名称”。除了MOC-31以外,此列表中的探针均根据标记名称列出,因为许多供应商称抗体为标记名称。应当指出,可以列出这些试剂的一个备选方式是,例如,抗VEGF、抗凝血调节蛋白、抗CD44v6等。
金标准组织标本从UCLA获得。组织标本来自两个来源。病例已经用标准方法诊断,包括检查苏木精和伊红(H&E)染色的载玻片和临床史。对标本载玻片编码,并用任意数字标记,以使研究病理学家不知道历史诊断和抗体标记,并且保护患者的隐私。
使用含有来自癌和非癌(对照)组织的组织切片的标本载玻片。总共分析了175个不同的病例。在这一组内,在表6中列出的下列诊断具有如下频率:
表6:
  诊断   发生数
  癌症   腺癌   25
  大细胞癌   18
  间皮瘤   26
  小细胞肺癌   20
  鳞状细胞癌   24
  对照   肺气肿   34
  肉芽肿病   3
  间质性肺病   25
c.分子标记组表达水平的测定
每个病例都制备足够的标本载玻片,以便每个载玻片只检测一种探针。载玻片通常制备为含有细胞学样品,该样品与针对特定分子标记的一种或多种标记探针接触。每名研究病理学家独立地检查H&E染色的载玻片,对每个病例做出诊断,然后检查每个与探针反应的免疫化学染色的载玻片,估计探针结合水平,在标准数据表上记录结果。
更详细地来说,对福尔马林固定的、石蜡包埋的(FFPE)组织进行免疫组化染色。组织切片在聚L赖氨酸包被的载玻片上切成4微米厚,室温下干燥过夜。组织切片的去石蜡化和再水合如下进行:为了完全从标本中除去所有包埋的介质,载玻片在连续两次二甲苯替代(Histoclear)浴中孵育,每次5分钟。从载玻片上除去所有液体,之后在连续两次100%试剂级乙醇浴中孵育,每次3分钟。再次从载玻片上除去所有多余的液体,之后在最后两次95%试剂纯乙醇浴中孵育,每次3分钟。最后一次95%浴后,载玻片在自来水中漂洗,置于洗涤缓冲液(Tris-缓冲盐洗涤缓冲液,含有0.05%Tween 20,相当于代码为S3306的DAKOAutostainer洗涤缓冲液的1∶10稀释液)中。以下表7是该研究中使用的试剂以及相应产品代号的完整列表。该研究中使用的检测系统是DAKOEnVision+HRP小鼠(代码为K4007)或兔(代码为K4003)和LSAB+HRP(代码为K0690)。免疫测定方案按照包装说明书进行。试剂盒包括两种液体成分DAB+底物色原(代码为K3468)。
表7:
 该研究中使用的试剂
 试剂   代码#
 National Diagnostics Histo Clear   HS-200
 Mallinckrodt Reagent Alcohol Absolute   7019-10
 DAKO抗体稀释剂   S809
 DAKO背景减少抗体稀释剂   S3022
 DAKO Autostainer缓冲液10X   S3306
 DAKO靶标回收溶液   S1700
 DAKO Hi pH靶标回收溶液   S3307
 DAKO蛋白酶K   S3020
 Rite Aid过氧化氢3%   无
 DAKO无血清蛋白质封闭液   X0909
 DAKO山羊血清   X0501
 DAKO猪血清   X0901
 DAKO En Vision+小鼠   K4007
 DAKO En Vision+兔   K4003
 DAKO LSAB+   K0690
 DAKO DAB+   K3468
 DAKO苏木精   S3302
 Dakomount封固介质   S3025
 仪器   序列号
 DAKO自动染色机   3400-6613-03
  3400-6142R-03
 自动染色机IHC软件Version V3.0.2
预处理在对肺组织优化这些抗体中非常关键。对于需要酶消化的抗体,在室温下使用DAKO蛋白酶K(代码为S3020)5分钟。需要热诱导的靶标回收的抗体接受DAKO靶标回收溶液(代码为S1700)或DAKOHigh pH靶标回收溶液(代码为S3307)的预处理。将组织置于预先加热的靶标回收溶液中,在95℃水浴中孵育20或10分钟,这取决于具体方案。然后使组织切片在室温下再冷却20分钟。
在去石蜡化、再水合和组织预处理后,所有标本都在3%过氧化氢溶液中孵育,以淬灭内源过氧化物酶活性。为了最小化非特异性背景,对两种抗体FGF和端粒酶特别使用封闭试剂。
如以下表8所示,组织标本与200微升最佳稀释的第一抗体孵育特定长度的时间。应当指出,表8中标记/抗体的编号与该文件中抗体探针和标记的编号一致。然后用DAKO IX Autostainer缓冲液(代码为S3306)洗涤载玻片。根据抗体不同,使用正确的检测系统。DAKOEn Vision+HRP和LSAB+HRP检测系统的步骤和总孵育时间在以下表9中列出。颜色反应用3,3′-二氨基联苯胺(DAB)显色,在反应部位产生褐色沉淀。
表8:
  用于肺探针组的抗体
  抗体针对
  #   标记   预处理  封闭   稀释   第一次孵育   检测系统   克隆   供应者   代码#
  1   VEGF   Hi pH TRS 20minS3307  无   1∶15,用S809   30分钟   EnV+小鼠   JH121   NeoMarkers   MS350-P
  2   凝血调节蛋白   无  无   1∶100,用S809   30分钟   EnV+小鼠   1009   DAKO   M0617
  3   CD44v6   TRS 20min S1700  无   RTU   30分钟   EnV+小鼠   VFF-7   NeoMarkers   MS1093R7
  4   SPA   无  无   1∶200,用S809   30分钟   EnV+小鼠   PE10   DAKO   M4501
  5   成视网膜细胞瘤   TRS 40min S1700  无   1∶25,用S809   30分钟   EnV+小鼠   Rb1   DAKO   M7131
  6   E-钙粘蛋白   TRS 20min S1700  无   1∶100,用S809   30分钟   EnV+小鼠   NCH-38   DAKO   M3612
  7   细胞周期蛋白A   TRS 20min S1700  无   1∶25,用S809   30分钟   EnV+小鼠   6E6   Novocastra   NCL117206
  8   nm23   Hi pH TRS20minS3307  无   1∶50,用S809   30分钟   EnV+兔   多克隆   DAKO   A0096
  9   端粒酶   TRS 20min S1700  蛋白质封闭液X0909,30mm   1∶400,用S809   过夜   EnV+兔   多克隆   AlphaDiagnostic   EST21-A
 wt5%山羊血清X0501
  10   KI-67   TRS 40min S1700  无   1∶200,用S809   30分钟   EnV+小鼠   IVAK-2   DAKO   M7240
  11   细胞周期蛋白D1   Hi pH TRS 20minS3307  无   1∶200,用S3022   30分钟   EnV+小鼠   DCS-6   DAKO   M0879
  12   PCNA稀释液1   TRS 20min S1700  无   1∶4000,用S809   30分钟   EnV+小鼠   PC10   DAKO   MS1067
  13   MAGE-1   Hi pH TRS 20minS3307  无   1∶250,用S809   30分钟   EnV+小鼠   MA454   NeoMarkers   MS1067
  14   粘蛋白1   TRS 20min S1700  无   1∶40,用S809   30分钟   EnV+小鼠   VU4H5   SantaCruzBiotech   Sc-7313
  15   SP-8   TRS 20min S1700  无   1∶100,用S809   30分钟   EnV+小鼠   SPB02   NeoMarkers   MS-1300-P1
  16   HERA   TRS 40min S1700  无   1∶50,用S809   30分钟   EnV+小鼠   MOC-31   DAKO   M3523
  17   FGF-2   无  蛋白质封闭液X0909,30mun   1∶50,用S809   过夜   EnV+小鼠   bFM-2   UpstateBiotech   #05-118
 wt5%猪血清X0901
  18   C-Met   不完全  无   不完全   不完全   EnV+小鼠   8F11   Novocastra   118406
  19   TTF-1   TRS 40min S1700  无   1∶25,用S809   30分钟   EnV+小鼠   8G7G3/1   DAKO   M3575
  20   Bcl-2   Hi pH TRS 20minS3307  无   1∶75,用S809   30分钟   EnV+小鼠   124   DAKO   M0887
  21   p120   TRS 20min S1700  无   1∶10,用S809   30分钟   EnV+小鼠   FB-2   Biogenex   MU196-UC
  22   N-钙粘蛋白   TRS 40min S1700  无   1∶75,用S809   30分钟   EnV+小鼠   6G4和6G11   DAKO   N/A
  23   EGFR   蛋白酶K 1∶25 5min  无   1∶1500,用S809   30分钟   EnV+小鼠   2-18C9   DAKO   K1492
  24   Glut1   TRS 40min S1700  无   1∶200,用S809   30分钟   LSAB+   多克隆   SantaCruzBiotech   SC1605
  25   ER相关(p29)   TRS 40min S1700  无   1∶200,用S809   30分钟   EnV+小鼠   G3.1   Biogenex   MU171-UC
  26   Mage3   TRS 40min S1700  无   1∶20,用S809   30分钟   EnV+小鼠   57B   G.Spagnoli   N/A
  27   Glut3   TRS 20min S1700  无   1∶80,用S809   30分钟   LSAB+   多克隆   SantaCruzBiotech   SC7581
  28   PCNA稀释液2   TRS 20min S1700  无   1∶3200,用S809   30分钟   EnV+小鼠   PC10   DAKO   M0879
表9:
  研究中使用的检测系统
  步骤
  1   去石蜡化和再水合
  2次Histoclear浴,每次5分钟
  2次100%乙醇浴,每次3分钟
  2次95%乙醇浴,每次3分钟
  水漂洗
  2   预处理
  TRS40或20分钟
  高pHTRs20分钟
  蛋白酶K5分钟
  水漂洗
  3   过氧化物酶封闭
  过氧化物浴5分钟
  水漂洗
  缓冲液5分钟
  在H2O2封闭后蛋白质封闭30分钟
  4   第一抗体
  在室温下30分钟或过夜
  5   检测系统
  Env+系统   标记的聚合物   或  LSAB+系统   第二试剂
  30分钟   15分钟第二抗体连接
  第三试剂
  15分钟SA-HRP
  6   色原
  色原   色原
  10分钟DAB+   5分钟DAB+
在免疫染色后,所有载玻片都在DAKO苏木精(代码S3302)中孵育3分钟,用DAKOMount封固介质(S3025)盖上盖玻片。所有方案都在DAKO自动染色机(系列号为3400-6612-03和3400-6142R-03)上使用IHC软件版本3.0.2进行。
免疫染色在光学显微镜下观察,以确定对照正确染色且组织完整。载玻片标记、装盒、送给指定病理学家进行结果评价。受过训练的病理学家鉴定样品中所见的癌症或其它损伤的类型。受过训练的病理学家通过估计染色强度和染色细胞的比例评价对标记探针的灵敏度。这些得分输入患者的数据表中。病理学家不知道最初的诊断和免疫染色中使用的抗体标记。每个载玻片由至少两名病理学家阅读,结果记录在数据收集表中。为了提供该过程的完整性,该方法由第二名或第三名病理学家重复。然后可以匹配获得的得分,以区别数据录入错误。其它数据也利于更好的分类器设计。
对于每个病例,可以分析可达27个载玻片,每个对以数字1-17、19-28编码的标记染色。对标记18(C-MET)的染色不能优化,因此不使用该标记/探针。病理学家1评分来自全部175个病例的载玻片。病理学家2评分来自99个病例的载玻片。病理学家3评分来自80个病例的载玻片。
以下表10表示每名病理学家每次诊断评分多少例的载玻片:
表10:
  诊断  病理学家1  病理学家2  病理学家3
  癌症   腺癌  25  12  14
  大细胞癌  18  9  9
  间皮瘤  26  14  8
  小细胞肺癌  20  12  6
  鳞状细胞癌  24  13  11
  对照   肺气肿  34  23  13
  肉芽肿病  3  3  2
  间质性肺病  25  13  17
为了选择的一些统计学分析技术,必须只考虑对全部27个载玻片评分的情况。以下表11列出了对于来自全部27个载玻片的得分,每次诊断完成多少例数。
表11:
  诊断  病理学家1  病理学家2  病理学家3
  癌症   腺癌  14  10  8
  大细胞癌  12  9  3
  间皮瘤  17  13  3
  小细胞肺癌  7  9  1
  鳞状细胞癌  12  13  4
  对照   肺气肿  32  21  1
  肉芽肿病  2  1  0
  间质性肺病  23  7  3
根据该表,能够计算出每名病理学家评分以下总数的完整病例。病理学家1评分119个病例的全部27个载玻片,病理学家2评分83个病例的全部27个载玻片。病理学家3评分23个病例的全部27个载玻片。
癌症数据点的总数为172。这包括来自病理学家1的113个数据点和来自病理学家2的60个数据点。对照数据点的总数为101。这包括来自病理学家1的62个数据点和来自病理学家2的39个数据点。
图3显示探针7和15在对照组织和癌组织中的H得分之间的比较。x轴显示H得分,而y轴显示具有特定H得分的病例的百分比。H得分的差异是明显的。
对于每名患者,将得分电子输入病理学评价单中,它将这些得分整理到一个数据库中,它显示患者的标识号,以及诊断、染色细胞比例和染色强度。比例和密度综合为一个“H得分”的方法,H得分的获得方法是:将强度分级为:无=0,弱=1,中=2,强=3,细胞百分数分级为:0-5%=0,6-25%=1,26-50%=2,51-75%=3,>75%=4,然后将两个分级相乘。例如,50%弱染色加50%中度染色得分为10=(2x2)+(2x3)。除了下文中研究备选评分系统的题为“使用其它(非H得分)客观评分参数的效果”的章节3(f)以外,这是整个分析中的标准评分系统。
利用标准分类方法发现最佳探针组合。一般使用一种搜索方法,如“分支与结合算法”来发现按照判别能力测试排序并按照显著性检验截短的最佳特征的层次。该方法也定义了最佳分类的决策规则。
能够根据用来设计分类器的数据评价用这些特征设计的分类器的表现。分类器直接使用所有设计数据产生非常不全面的表现评价。
对本实施例中收集的数据的分析提供了可最佳分辨类别的探针的最佳选择。因此,获得只需要少量探针进行分析的探针组。然而数据表明,利用其它探针组合能够获得接近最佳的表现。本发明在适应特征可用性方面灵活,其中成本或供应问题可能不能产生最佳组合。在一些情况下,本发明仅仅能够适合可以获得的特征来发现一种备选组合。在另外一些情况下,可以利用该算法选择特征,以使成本加权包括于选择过程中,以达到最低成本解决方案。
选择数据采集和分析实验的设计,以通过良好建立的双盲法避免偏性,其中数据采集和数据分析独立进行。
在第一种情况下,病理学家检查常规染色的载玻片,以进行诊断。将这种诊断输入病理学评价单中。然后以随机顺序给予病理学家被标记探针染色的载玻片,以评分染色的细胞的百分比和染色的相对强度。对载玻片编号,以排除来自病理学家的关于探针的信息。为了核对数据的完整性,两名病理学家检查所有患者。
将数据整理到一个数据库中,然后由一组统计学家检查。对探针编号,使它们的作用方法在有效性分析过程中不可见。
分析的第一阶段是通过比较每名患者的输入核对数据的完整性。当发现大的差异时,核对数据输入,更正任何明显的错误。无法解释的差异则保留在数据中。
然后由四名统计学家分别分析数据,由于事实上不同的统计学方法适合数据中不同类型的判别信息,因此使用不同的技术。
选择最佳探针组合的方法的第一步是将数据分成两组,一组用于设计分类器,一组用于测试分类器的表现。通过选择用设计(训练)组进行的,但是对于试验组显示最佳表现的设计,能够有把握地得出结论,分类器已经对数据结构标准化,不适合在训练组中所见的特定病例。
为了检测可靠性,一般用随机选择的多组训练数据和试验数据重复这种分析。该方法公认产生分类器表现的良好评价。当这些试验显示不一致的探针选择时,这些探针选择不可靠。
d.统计学分析和/或模式识别
1.数据分析简介
a.输入数据
i.原始数据
对于每名患者,将得分电子输入病理学家评价单中,将得分整理到一个数据库中,显示患者的标识号以及诊断、染色细胞比例和染色强度。
ii.计算的数据
根据强度/百分比表计算该分析中使用的每种探针的得分率。将比例和强度按照一个简单的公式H=染色比例x(如果染色强为3+如果中为2+如果弱为1)综合为一个“H得分”。这是与该探针有关的特征值。
iii.备选计算数据参数
上述H得分通过探索法产生,用来寻找组合百分比和强度的更好方法的一种简单分析没有优于H得分的明显改进(章节3(f),题为“使用其它(非H得分)客观评分参数的效果”)。较大的数据库可以在将来抽象出(extraction)更好的规则。
iv.为使用者提供的每种标记的加权标准
本发明在适应特征可用性方面灵活,其中成本或供应问题可能不能产生最佳组合。例如,本发明仅仅能够适合可以获得的特征来发现一种备选组合。此外,用来选择特征的算法选择可使选择过程中包括成本加权,以达到最小成本方案。描述了对选自收集的所有标记的组合或者只是来自一个供应商的标记的表现估计。也显示了如何能够利用C4.5软件包以它们的高成本为基础降低某些探针的权重。这些探针也许不能进行组合以及最佳组合,但是在成本是一个重要因素的情况下,这种表现可以接受。
v.为使用者提供的每个类别的加权标准
使用的一些方法允许对类别加权。这可在C4.5中获得,其中树设计能够最优化成本。判别函数法也产生一个参数输出,它能够用来产生希望的假阳性或假阴性概率。这些参数对不同阈值设置的图被称为接收工作曲线。
vi.检测组-假设
对于癌症检测方法,假设希望低概率的假阴性(避免以需要再筛查的假阳性数增加为代价错过阳性患者)。也假设癌症判别方法需要较低的假阳性得分(以使接受错误治疗的患者最少)。
假设需要6种或更多探针才能达到可以接受的表现的检测组不是成本有效的。也假设假阴性差错率高于5%的检测组不可接受。不接受落于该范围(box)之外的检测组。这个假设认为细胞计数组可能比此处分析的基于组织学的组表现更差。最终目标是表现好于20%差错率的细胞计数组,这接近子宫颈巴氏涂片筛查的表现。
vii.鉴别组-假设
假设需要6种或更多探针的组不是成本有效的,并且假设需要好于20%的差错率。不接受落于该范围之外的组。
b.输出数据
本分析提供的输出包括:
●  含混矩阵(Confusion Matrices),它显示来自试验组的数据如何被分类为真阳性、假阳性、真阴性或假阴性。它们可以表示为实际计数或百分比。含混矩阵在题为“表现量度”的章节2(d)中讨论。含混矩阵显示来自试验组的数据如何被分类为真阳性、假阳性、真阴性或假阴性。下表12列出了一个由通过决策树分析的数据获得的代表性含混矩阵,用于同时鉴别腺癌、鳞状细胞癌、大细胞癌、间皮瘤和小细胞癌。
表12:
  腺   鳞状   大细胞   间皮瘤   小细胞
  腺   67.74%   6.45%   19.40%   0.00%   6.45%
  鳞状   2.94%   76.47%   11.67%   0.00%   8.82%
  大细胞   28.00%   8.00%   44.00%   8.00%   12.00%
  间皮瘤   0.00%   25.64%   51.28%   89.74%   2.56%
  小细胞   0.00%   3.85%   23.08%   3.85%   69.23%
●  差错率,将含混矩阵中的数据总结为所有假分类的和除以总分类数,表示为一个百分数。
●  接收工作特征(ROC)曲线显示对于分类器中的不同阈值水平估计的假阳性和假阴性得分的百分比(或者每单位概率)。不能比随机选择更好地鉴别的一种普通(indifferent)分类器将使ROC曲线具有相等的真及假读数。该曲线下的面积为50%(0.5概率)。
●  曲线下面积(AUC)通常用作分类器表现的总评价,大多数标准判别函数包提供这个AUC值。一个完美的分类器将有100%的曲线下面积,一个无用的分类器有接近50%的AUC(0.5概率)。
●  灵敏度和特异性(能够由含混矩阵得出)。见题为“灵敏度和特异性”的章节(d)(iii)。
●  标记相关矩阵。见图4。
i.检测组:组成
这些检测组对分成两类的数据进行训练:患有5种癌症之一的患者和未患癌症的患者。不是对所有患者使用所有探针。当特定分析缺少一种或多种探针时,从数据中删去这些病例。因此,当对数量减少的探针进行分析时,数据集可包括略多一些的病例。
分析中包括的探针数量是27个。尽管在许多情况下增加一种假探针,其中输入的该探针的数据来自一个随机数生成程序,以在0-12之间均匀地产生数字。为了确保探针选择过程的完整性,许多早期分析中都包括这种假探针。一种方法也使用这种假探针,从分析中逐渐除去探针。比假探针提供更少信息的探针容易鉴定,并且从选择过程中排除。早期清除这些探针可加速分析,并且使分析较不易受这些探针引起的结果变异(噪音)的影响。
ii.检测组表现
作为该研究的输出,报告了用不同方法选择的探针组合及其在含混矩阵、%差错率和AUC方面的表现评价。
iii.检测组-备选组成
检测组也选自减少的探针组。对于一组检测组,获得对商业上优选的标记加权的检测组的表现测定。也分析了当从分析中除去最佳探针以寻找新鉴别探针组合时获得的表现。发现作用于其自身的一种探针的表现非常好(探针7)。然而,如以下用线性判别分析评价的表现图表13所示,当增加更多标记时表现得到改进。最佳探针亚组用最佳亚组logistic回归测定。这种改进在统计学上显著。
表13:
探针7
  癌症   对照
  癌症   87.93%   12.07%
  对照   0.00%   100.00%
探针7和16
  癌症   对照
  癌症   93.10%   6.90%
  对照   1.16%   98.84%
探针7、15和16
  癌症   对照
  癌症   90.52%   9.48%
  对照   1.16%   98.84%
探针1、7、15和16
  癌症   对照
  癌症   90.52%   9.48%
  对照   0.00%   100.00%
探针1、4、7、15和16
  癌症   对照
  癌症   92.24%   7.76%
  对照   1.16%   98.84%
最佳和次最佳的探针亚组(用最佳亚组logistic回归测定)用logistic回归评价,在下文显示。AUC=ROC曲线下的面积。应当指出,平均AUC是对随机训练和试验区(70%∶30%)的100次试验的平均值。结果在下表14中显示。
表14:
  探针   平均AUC
  7   94.28
  28   80.14
  7,16   95
  7,15   94.59
  7,15,16   95.94
  1,7,16   95.33
  1,7,15,16   95.61
  4,7,15,16   95.34
  1,4,7,15,16   95.3
  1,7,11,15,16   95.57
iv.鉴别组-组成
对于该部分研究,设计并试验了5种分类器,每一种均用来从全部癌症患者中检测癌症之一的存在。这种5路成对系统的使用使得可疑病例在分析中出现一次以上,或者根本不出现。这些病例可被鉴定,更详细地检查,再检测或者进行其它检测方案。
研究中的探针数再次为27个,为了减少分析的数量,在早期使用一种假探针。
v.鉴别组-表现
利用上述表现估计法显示通过不同技术发现的最佳探针组合的表现。
vi.鉴别组-备选组成
对包含商业上优选的探针的探针组合重复这一分析。表现下降,但是仍然可用于几种组数减少的(reduced-set)分类器。下面,表15显示了利用最佳亚组logistic回归确定的不含探针7的最佳探针亚组。数据用线性判别分析评价。
表15:
探针28
  癌症   对照
  癌症   0.706897   0.293103
  对照   0.093023   0.906977
探针10和28
  癌症   对照
  癌症   0.793103   0.206897
  对照   0.034884   0.965116
探针10、15和28
  癌症   对照
  癌症   0.810345   0.189655
  对照   0.011628   0.988372
探针1、10、15和28
  癌症   对照
  癌症   0.827586   0.172414
  对照   0.011628   0.988372
探针1、10、15、16和28
  癌症   对照
  癌症   0.827586   0.172414
  对照   0.011628   0.988372
以下列出了用logistic回归评价的含有探针7(利用最佳亚组logistic回归确定的)的最佳和次最佳探针亚组。AUC=ROC曲线下的面积。应当指出,平均AUC是对随机训练和试验区(70%∶30%)的100次试验的平均值。结果在下表16中显示。
表16:
  探针   平均AUC
  28   79.36%
  10   32.28%
  10,28   94.21%
  15,28   88.68%
  10,15,28   92.90%
  1,10,28   93.59%
  1,10,15,28   92.99%
  8,10,15,28   93.20%
  1,10,15,16,28   93.13%
  1,8,10,15,28   93.57%
2.数据分析方法
在本节中描述了最初理解数据结构的方法,作为解释所用不同方法的结果的指南。
a.方差分析
i.病理学家-病理学家之间的变异和集中的病理学家评分
(1)t-检验
两名病理学家在这个临床试验中检查每名患者的载玻片。病理学家1检查所有患者,病理学家2也检查这一组的大约一半,病理学家3检查其余的。通过对H得分的两次独立评价,能够检测出病理学家表现的一致性。
利用一种易于获得的统计学工具检测病理学家之间的变异性。即配对样本t-检验。它获得每对估计值之间的差异,将其平均,表示为占总方差的比例。t-检验然后将这个比值转化为一个概率,估计两个样品组来自同一群体的可能性(P值)。
该检验可用于每种标记探针的得分,病理学家1和病理学家2检查的所有病例,以及病理学家1和病理学家3检查的所有病例。由于使用27次检验(覆盖所有探针),选择低P=0.01值作为“显著性阈值”。显示每种探针和两对病理学家的P得分的结果在下表17、18、19、20中列出。显然病理学家1与病理学家2比病理学家1与病理学家3更一致。
表17:
病理学家1、病理学家2的评分
  X1   X2   X3   X4   X5   X6   X7
  0.5875446   0.01051847   0.4659704   0.4659704   0.3772894   0.2307273   0.01001357
  X8   X9   X10   X11   X12   X13   X14
  0.004131056   0.7703014   0.1640003   0.2374452   0.9580652   0.1587876   0.001200265
  X15   X16   X17   X18   X19   X20   X21
  0.19742   0.3860899   0.3829022   NA   0.544601   0.08873848   0.1686243
  X22   X23   X24   X25   X26   X27   X28
  0.5428451   0.1912477   0.4031977   0.2477236   0.5673386   0.9174037   0.00339071
表18:
病理学家1、病理学家2的评分,阈值为0.01(α=1%显著性水平)
  X1   X2   X3   X4   X5   X6   X7
  TRUE   TRUE   TRUE   TRUE   TRUE   TRUE   TRUE
  X8   X9   X10   X11   X12   X13   X14
  FALSE   TRUE   TRUE   TRUE   TRUE   TRUE   FALSE
  X15   X16   X17   X18   X19   X20   X21
  TRUE   TRUE   TRUE   NA   TRUE   TRUE   TRUE
  X22   X23   X24   X25   X26   X27   X28
  TRUE   TRUE   TRUE   TRUE   TRUE   TRUE   FALSE
表19:
病理学家2、病理学家3的评分
  X1   X2   X3   X4   X5   X6   X7
  3.814506e-09   0.0399131   0.1954867   5.671062e-05   0.01856276   0.2757166   0.2292583
  X8   X9   X10   X11   X12   X13   X14
  2.044038e-12   0.004166467   0.00983267   0.003710155   0.01461007   0.03312421   0.0003367823
  X15   X16   X17   X18   X19   X20   X21
  0.0005162036   0.2276537   0.002987705   4.267708e-06   0.007287372   0.1654067
  X22   X23   X24   X25   X26   X27   X28
  0.02400127   0.0009497766   2.478456e-07   0.1591684   0.08318303   3.122143e-05   1
表20:
病理学家1、病理学家3的评分,阈值为0.01(α=1%显著性水平)
  X1   X2   X3   X4   X5   X6   X7
  FALSE   TRUE   FALSE   FALSE   TRUE   TRUE   TRUE
  X8   X9   X10   X11   X12   X13   X14
  FALSE   FALSE   FALSE   FALSE   TRUE   TRUE   FALSE
  X15   X16   X17   X18   X19   X20   X21
  FALSE   TRUE   FALSE   FALSE   FALSE   FALSE   TRUE
  X22   X23   X24   X25   X26   X27   X28
  TRUE   FALSE   FALSE   TRUE   TRUE   FALSE   TRUE
因为H得分是主观的,因此它倾向于放大边缘病例(marginal case)的因子差异和噪音。因此,尽管有三个特征显示病理学家1与病理学家2之间的统计学上不同的得分,但是接受这种综合数据(joint data)代表测量仪器。病理学家1与病理学家2组合为该分析方法的一个数据集。为了独立检验,排除病理学家3的结果。由于显著差异,使用病理学家3的数据的检验倾向于显示较差的表现。
病理学家1和病理学家2的数据通过将其视为不同的病例来组合,在任一病例的结果之间有产生一定程度的独立性的变异性。当用这些数据检验时,表现评价将偏向于更乐观的值。这是因为来自同一患者的样品可以在训练试验亚组时同时存在。然而这不会使发现最佳特征组合的方法无效,它只是使表现评价有偏性。
(2)H得分的方差分析
(a)背景
对于每种探针,H得分可能由于多种原因而不同。由于疾病类型不同它们一致地改变是有用的,病理学家阅读载玻片产生的变异是有益的,而随机变异对以前两个变异来源的检测设置了限制。
方差分析(ANOVA)是分离数据的变异来源和检验其统计学显著性的一种标准技术。ANOVA将一组数据的总变异概括为能够归因于特定变异来源或原因的项的总和。
ANOVA可以在许多统计软件包中获得。选择公用软件包“R”(′TheR Project for Statistical Computing″,http://www.R-project.org/)。
(b)目的
对来自病理学家1和2的H得分数据进行ANOVA分析,考虑该数据是否能够安全地合并为一个一致的组,以进一步分析组的选择。
(c)方法学
来自数据库的数据选自病理学家1和2。只有指定探针的完整数据才能在该探针的ANOVA中使用。
将肺气肿、肉芽肿病和间质性肺病的对照类别归类在一起,称为“正常的”,在因素疾病内产生6个水平。
病理学家被编码为一个2水平因素(病理学家1,病理学家2)。
写作R脚本,随后对每种探针进行标准ANOVA分析,使用因素:疾病、病理学家和交互项,疾病:病理学家。结果在下表21中显示。“Df”被定义为自由度。在知道n-1离均差的n次观察的数据集中,自动测定第n个。N-1是自由度的数值。和Sq和均值Sq是变异的量度。F是关于基于F分布的两组变异等式的检验统计量。Pr(>F)是用来确定变异性在统计学上是否显著的概率。
表21:
H得分的方差分析
探针1Df       平方和      均方      F值      Pr(>F)疾病           5        443.56      88.71     15.8202  3.690e-13***病理学家       1        0.66        0.60      0.1174   0.7323疾病:病理学家 5        15.34       3.07      0.5470   0.7405残差           204      1143.93     5.61显著性代码     0′***′0.001′**′0.01′*′0.05‘.′0.1′′1
  探针2Df       平方和      均方      F值      Pr(>F)疾病           5        1067.39     213.48    24.1234  <2e-16***病理学家       1        13.02       13.02     1.4709   0.2263疾病:病理学家 5        27.98       5.60      0.6324   0.6752残差           249      2203.50     8.85显著性代码     0′***′0.001′**′0.01′*′0.05‘.′0.1′′1
探针3Df       平方和      均方      F值    Pr(>F)疾病           5        1098.49     219.70    21.0751  <2e-16***病理学家       1        6.73        6.73      0.6458   0.4224疾病:病理学家 5        29.72       5.94      0.5703   0.7227残差           243      2533.16     10.42显著性代码     0′***′0.001′**′0.01′*′0.05‘.′0.1′′1
  探针4Df       平方和      均方      F值      Pr(>F)疾病           5        631.8       126.4     9.3707   3.454e-08***病理学家       1        6.6         6.6       0.4869   0.4860疾病:病理学家 5        13.1        2.6       0.1939   0.9647残差           246      3317.1      13.5显著性代码     0′***′0.001′**′0.01′*′0.05‘.′0.1′′1
探针5Df      平方和      均方      F值      Pr(>F)疾病           5       754.30      150.86    25.2826  <2e-16***病理学家       1       14.25       14.25     2.3875   0.1236疾病:病理学家 5       7.54        1.51      0.2528   0.9381残差           248     1479.80     5.97显著性代码    0′***′0.001′**′0.01′*′0.05‘.′0.1′′1
  探针6Df       平方和      均方      F值      Pr(>F)疾病           5        721.91      144.38    11.8515  2.771e-10***病理学家       1        1.91        1.91      0.1568   0.6925疾病:病理学家 5        47.82       9.56      0.7850   0.5613残差           246      2996.93     12.18显著性代码     0′***′0.001′**′0.01′*′0.05‘.′0.1′′1
  探针7Df       平方和      均方      F值      Pr(>F)疾病           5        1171.47     234.29    77.6802  <2e-16***病理学家       1        8.84        8.84      2.9294   0.08847.疾病:病理学家 5        46.36       9.27      3.0742   0.01063*残差           209      630.37      3.02显著性代码     0′***′0.001′**′0.01′*′0.05‘.′0.1′′1
 探针8Df       平方和      均方     F值      Pr(>F)疾病           5        209.82      41.96    6.4352   1.201e-05***病理学家       1        12.66       12.66    1.9407   0.16483疾病:病理学家 5        71.20       14.24    2.1838   0.05654.残差           251      1636.76     6.52显著性代码     0′***′0.001′**′0.01′*′0.05‘.′0.1′′1
探针9Df       平方和      均方      F值      Pr(>F)疾病           5        197.21      39.44     8.4348   2.015e-07***病理学家       1        7.33        7.33      1.5681   0.2116疾病:病理学家 5        24.56       4.91      1.0505   0.3884残差           265      1239.17     4.68显著性代码     0′***′0.001′**′0.01′*′0.05‘.′0.1′′1
探针10Df       平方和      均方      F值      Pr(>F)疾病           5        1113.46     222.69    39.0730  <2e-16***病理学家       1        1.01        1.01      0.1778   0.67371疾病:病理学家 5        62.45       12.49     2.1916   0.05635.残差           213      1213.96     5.70显著性代码     0′***′0.001′**′0.01′*′0.05‘.′0.1′′1
  探针11Df       平方和      均方      F值      Pr(>F)疾病           5        320.15      64.03     9.5553   2.416e-08***病理学家       1        1.28        1.28      0.1918   0.6618疾病:病理学家 5        10.04       2.01      0.2996   0.9128残差           245      1641.76     6.70显著性代码     0′***′0.001′**′0.01′*′0.05‘.′0.1′′1
  探针12Df       平方和      均方      F值      Pr(>F)疾病           5        832.26      219.70    27.8793  <2e-16***病理学家       1        0.18        0.18      0.0307   0.8610疾病:病理学家 5        15.16       3.03      0.5079   0.7701残差           248      1480.68     5.97显著性代码     0′***′0.001′**′0.01′*′0.05‘.′0.1′′1
探针13Df       平方和      均方      F值      Pr(>F)疾病           5        46.594      9.319     7.8408   8.674e-07***病理学家       1        0.044       0.044     0.0368   0.8481疾病:病理学家 5        10.143      2.029     1.7069   0.1343残差           210      249.584     1.188显著性代码     0′***′0.001′**′0.01′*′0.05‘.′0.1′′1
探针14Df       平方和      均方      F值      Pr(>F)疾病           5        1305.69     261.14    23.9460  <2e-16***病理学家       1        28.66       28.66     2.6279   0.10630疾病:病理学家 5        142.90      28.58     2.6208   0.02492*残差           243      2649.98     10.91显著性代码     0′***′0.001′**′0.01′*′0.05‘.′0.1′′1
探针15Df       平方和      均方      F值      Pr(>F)疾病           5        401.02      80.20     21.268   <2e-16***病理学家       1        13.17       13.17     3.493    0.0630.疾病:病理学家 5        6.17        1.23      0.327    0.8963残差           214      807.02      3.77显著性代码     0′***′0.001′**′0.01′*′0.05‘.′0.1′′1
探针16Df       平方和      均方      F值      Pr(>F)疾病           5        2520.26     504.05    65.5572  <2e-16***病理学家       1        0.15        0.15      0.0194   0.3892疾病:病理学家 5        24.29       4.86      0.6318   0.6757残差           247      1899.12     7.69显著性代码     0′***′0.001′**′0.01′*′0.05‘.′0.1′′1
探针17Df       平方和      均方      F值      Pr(>F)疾病           5        530.64      106.13    13.0178  2.426e-11***病理学家       1        8.42        8.42      1.0325   0.31050疾病:病理学家 5        109.96      21.99     2.6975   0.02131*残差           266      2168.55     8.15显著性代码     0′***′0.001′**′0.01′*′0.05‘.′0.1′′1
探针19Df       平方和      均方      F值      Pr(>F)疾病           5        1670.86     334.17    29.1960  <2e-16***病理学家       1        2.17        2.17      0.1895   0.6637疾病:病理学家 5        32.61       6.52      0.5698   0.7231残差           248      2838.56     11.45显著性代码     0′***′0.001′**′0.01′*′0.05‘.′0.1′′1
  探针20Df       平方和      均方      F值      Pr(>F)疾病           5        964.71      192.94    34.2760  <2e-16***病理学家       1        8.83        8.83      1.5687   0.2116疾病:病理学家 5        19.60       3.92      0.6963   0.6267残差           245      1379.12     5.63显著性代码     0′***′0.001′**′0.01′*′0.05‘.′0.1′′1
  探针21Df       平方和      均方      F值      Pr(>F)疾病           5        6.927       1.385     2.0604   0.07076病理学家       1        0.464       0.464     0.6906   0.40670疾病:病理学家 5        1.576       0.315     0.4687   0.79945残差           263      176.830     0.672显著性代码     0′***′0.001′**′0.01′*′0.05‘.′0.1′′1
  探针22Df       平方和      均方      F值      Pr(>F)疾病           5        640.16      128.03    31.7250  <2e-16***病理学家       1        1.64        1.64      0.4058   0.5247疾病:病理学家 5        18.78       3.76      0.9305   0.4617残差           247      996.81      4.04显著性代码     0′***′0.001′**′0.01′*′0.05‘.′0.1′′1
探针23Df       平方和      均方      F值      Pr(>F)疾病           5        1915.62     383.12    46.5565  <2e-16***病理学家       1        10.77       10.77     1.3092   0.2537疾病:病理学家 5        20.92       4.18      0.5084   0.7698残差           246      2024.39     8.23显著性代码     0′***′0.001′**′0.01′*′0.05‘.′0.1′′1
  探针24Df       平方和      均方      F值      Pr(>F)疾病           5        516.06      103.21    24.0786  <2e-16***病理学家       1        9.52        9.52      2.2210   0.1376疾病:病理学家 5        12.48       2.50      0.5823   0.7135残差           216      925.87      4.29显著性代码     0′***′0.001′**′0.01′*′0.05‘.′0.1′′1
探针25Df       平方和      均方      F值      Pr(>F)疾病           5        1761.26     352.25    34.5245  <2e-16***病理学家       1        11.51       11.51     1.1285   0.2891疾病:病理学家 5        41.49       8.30      0.8134   0.5411残差           248      2530.33     10.20显著性代码     0′***′0.001′**′0.01′*′0.05‘.′0.1′′1
探针26Df       平方和      均方      F值      Pr(>F)疾病           5        399.85      79.97     13.6548  1.428e-11***病理学家       1        0.30        0.30      0.0517   0.8204疾病:病理学家 5        14.81       2.96      0.5056   0.7719残差           214      1253.31     5.86显著性代码     0′***′0.001′**′0.01′*′0.05‘.′0.1′′1
探针27Df       平方和      均方      F值      Pr(>F)疾病           5        117.92      23.58     6.2551   1.956e-05***病理学家       1        0.54        0.64      0.1595   0.6810疾病:病理学家 5        25.52       5.10      1.3539   0.2431残差           212      799.31      3.77显著性代码     0′***′0.001′**′0.01′*′0.05‘.′0.1′′1
  探针28Df       平方和      均方      F值      Pr(>F)疾病           5        1634.60     326.92    38.171   <2e-16***病理学家       1        8.40        8.40      0.981    0.3229疾病:病理学家 5        16.15       3.23      0.377    0.8643残差           267      2286.76     8.56显著性代码     0′***′0.001′**′0.01′*′0.05‘.′0.1′′1
(d)结果分析
在所有情况下(除了探针21之外),探针的应答都与疾病有关。这并不令惊讶,因为这些探针大概是为此目的而选择的。探针应答与病理学家无关(在p=0.05水平上)。这表明合并该数据并用两名病理学家对数据进行两次评价是安全的。
在探针7、14、17的少数情况下,有一些交互相具有显著性的证据。这表明在评分某些疾病时病理学家之间有一定的差异。一些这样的情况可能是由于数据中的偶然离群值。
(e)结论
结果表明,合并该数据进一步分析是安全的。数据表明,在某些情况下病理学家与疾病之间的轻微的交互影响似乎是由于随机来源。
ii.患者与患者之间的变异性
根据章节2(a)(i)(2)(见上文,“H得分的方差分析”)的疾病:疾病变异性确定患者与患者之间的变异性。
iii.标记-标记之间的变异性
作直方图(PathologistData.xls,工作表:直方图),显示每种探针对于对照与癌症的标记得分的分布。
b.标记相关矩阵分析
群体相关系数(″Applied Mulitvariate Statistical Analysis″,R.A.Johnson和D.W.Wichem,2nd Ed,1988,Prentice-Hall,N.J.)决定了一对随机变量之间的线性相关的量。随机变量的分布和相关参数一般不清楚,且不能直接计算群体相关系数。在此情况下,能够由样品数据库计算样品相关系数。见图4。然而,样品相关系数只是群体相关系数的估计值。而且,因为它是以样品数据为基础计算的,所以当相应的随机变量之间实际上可能没有实际关系时,有可能纯粹偶然地显示强正相关或负相关(″Modern Elementary Statistics″,J.E.Freund,6th Ed,1984,Prentice-Hall,N.J.)。
相关系数决定一个变量预测另外一个变量的能力。然而,强线性相关并不意味着是一种因果关系。相关系数的平方被称为决定系数。为双变量数据集计算的决定系数决定可以通过与另一个变量的线性关系说明的一个变量中的变异性比例。当涉及几个变量时,随后能够计算每一对的相关系数,系数集合能够写成一个被称为相关矩阵的矩阵。见图4。
各种标记的H得分可以作为随机变量模建。这个多变量数据集的样品相关矩阵可以由上文中题为“输入数据”的章节所述的输入数据来计算。
c.模式识别
统计学模式识别是一种根据定量测定值(称为特征)分类信号或几何物体的方法。统计学模型识别大大减少了将n维特征空间分成对应于目标类别的区域的问题。
该研究中使用的三种不同的分类器方法对不同的数据结构形式敏感。
对于决策树方法,对不同数据集合的预分析鉴定了C4.5从未用于检测组的标记。将其从分析中除去,产生更一致的结果,剔除的(left-out)探针的症状只会对选择过程贡献噪音。
类似地,对检测组中使用的探针的预分析鉴定了噪音探针,在详细分析之前去除。
SPSS中的线性判别函数法已经内建了减少分析中标记数量的逐步法。一般而言,将分析中使用的探针减少到2-7个。
R和SAS中的Logistic回归法实现变量选择的逐步程序。在SAS中也提供了一个最佳亚组的变量选择选项。在R中,逐步法与多重随机试验一起使用,以发展一种探索性方法,用于根据训练和试验数据(分别以70%∶30%分开)的100次随机选择中使用指定特征的次数选择变量。逐渐除去与人工随机特征次数相当的特征,直到在100次后获得一组一致性最小的特征。
i.统计学方法
基于多元统计分忻的观点,问题是估计多维空间中的密度函数之一(以及将这个空间分区为目标区)。假设随机(特征)载体的分布已知,理论上最佳的分类器是贝叶斯分类器,因为它使分类错误的概率最小化(K.Fukunaga,″Statistical Pattern Recognition″,2nd Ed.,Academic Press1990,p.3)。遗憾的是,因为其复杂性,贝叶斯分类器难以实现,特别是在特征空间的维数高时。实际中使用较简单的参数分类器。参数分类器基于关于密度或判别函数的假设。最常见的这类分类器是线性和平方分类器。在多元统计分析中,这些分类器归于判别分析。判别分析技术与多元线性回归模型和广义线性模型(包括logistic和多项式回归)密切相关。
(1)具有二项式反应的Logistic回归
(a)背景
选择一个检测组使用的一组标记的问题可以用公式表示为一个具有二项式反应的logistic回归问题。反应变量是一个两水平因素:正常(无癌症)和异常(癌症)。说明变量是标记的H得分。
选择一个癌症鉴别组使用的一组标记的问题也可以用公式表示为一个具有二项式反应的logistic回归问题。反应变量是一个两水平因素:正常(无目标癌症)和异常(目标癌症)。说明变量是标记的H得分。
可以利用逐步变量选择法选择用于鉴别两个类别的一亚类原始变量(标记)。这是一个需要大量计算的工作,最适合计算机。有几种商品和公共软件包,例如R、S-plus和SAS,可实现逐步logistic回归。
以分别在R和SAS中的逐步变量选择程序为基础,研究两种不同的特征选择方法。
(b)实验数据
用于该分析的数据包括对于病理学家1和病理学家2检查的在该报道其它部分描述的病例,标记1-17及19-28的H得分。另外向该数据集中加入一种伪(dummy)标记18。这种伪标记包括从均匀分布随机选择的0-12之间的整数值。
c)方法1:使用R软件包(版本1.4.1)
计算机化模型拟合程序通常不能处理遗漏的数据。R中使用的glm(glm代表广义线性模型)程序即是如此。因此,当用glm拟合一个模型时,必须排除具有一个或多个遗漏值的所有情况。当拟合最初包括27种真标记和1种伪标记的完全模型时,使数据集减少为只有202例。用如此少的观测数据决定进行变量选择、用选择的变量训练分类器以及评价其表现的最佳方法对数据随机分区为训练和试验组进行100次试验。
(i)数据随机分区为训练和试验组
在每次试验开始时,将数据分区为一个试验组和一个试验组。其实现方法是:随机选择30%的异常和30%的正常构成试验组,并用其余的观测数据构成训练组。
(ii)变量(标记)选择
在每次试验开始时,包括所有变量(标记的)完全模型与训练数据拟合。在R中,用glm拟合logistic回归模型。使用的编码片段如下:
my.model<-Class~X1+X2+X2+X3+X4+X5+X6+X7+X8+
X9+X10+X11+X12+X13+X14+X15+X16+X17+X18+X19+
X20+X21+X22+X23+X24+X25+X26+X27+X28
my.glm<-glm(my.model,family=binomial(link=logit),
data=training.data)
然后利用程序stepAIC以Akaike信息准则(AIC)为基础进行逐步变量选择。该程序是可以公开获得的MASS库的一部分。该库和程序在“Modern Applied Statistics with S-PLUS”中描述(W.N.Venables和B.D.Ripley,Springer-Verlag,Pathologist 3 New York,1999)。进行这一步的R编码片段如下:
my.step<-stepAIC(my.glm,direction=both)
然后用试验数据评价获得的模型。使用的编码片段如下:
probability_is_abnormal<-
predict(my.step,testing.data,type=″response″)
记录该分类器在误分类的实际差错率(AER)和ROC曲线下的面积(AUC)方面的表现。在100次试验后,留下100个模型和与它们有关的AERs和AUCs。构建一个频率表,记录每个变量在100次试验中出现的次数。表22显示一个实例:
表22
  变量   1   2   3   4   5   6   7   8   9   11   12   14
  频率   2   6   4   1   4   16   100   40   3   10   43   1
  变量   15   16   17   18   19   20   22   23   24   25   28
  频率   4   28   2   1   3   2   2   18   10   84   4
该表用来决定弃用哪些标记。首先,弃用所有频率低于或等于10的标记。其次,根据伪标记的频率选择截止频率(一般为伪标记的1或1.5倍)。弃用频率低于该截止值的所有标记。然后用其余的标记以及伪标记作为另外100个试验的完全模型,重复修剪步骤。必要时,可以提高修剪的严格程度,以使该模型排除一种或多种标记。必要时,可以用剩余的标记作为再另外100次试验的完全模型。当达到希望数量的组成员或者当前模型的平均AUC低于前述模型时,停止修剪。
为了说明修剪步骤,见上表。该表是用检测组数据获得的。阴影部分表示这些标记在修剪后仍然保留。另外100次试验用下列完全模型进行:
my.model<-Class~X6+X7+X8+X12+X16+X18+X23+X25
又构建了一个频率表,表23:
表23
  变量   6   7   8   12   16   18   23   25
  频率   63   100   51   48   30   47   66   98
阴影部分显示在修剪后仍然保留的标记(使用47的截止值)。另外100次试验用下列完全模型进行:
my.model<-Class~X6+X7+X8+X12+X18+X23+X25
另外构建一个频率表,表24:
表24
  变量   6   7   8   12   18   23   25
  频率   96   100   23   73   3   88   98
此时选择50的截止值。阴影部分显示在一个5成员组中使用的剩余标记。在每一步中,平均AUC提高:94.37%→95.45%→95.78%。
(iii)评价探针组的表现
为了评价探针组的表现,如以前一样进行100次试验,但是不进行逐步选择程序。每次试验都记录AUC、灵敏度和特异性。对于上述检测组实例,结果为:
>my.model<-Class~X7+X25+X6+X23+X12
>summary(AUC)
Min.1st Qu.Median Mean 3rd Qu.Max.
0.9289 0.9590 0.9615 0.9601 0.9630 0.9630
>summary(sensitivity)
Min.1st Qu.Median Mean 3rd Qu.Max.
0.8519 0.9630 0.9630 0.9737 1.0000 1.0000
>summary(specificity)
Min.1st Qu.Median Mean 3rd Qu.Max.
0.8378 0.9730 0.9730 0.9749 1.0000 1.0000
总之,该探针组的灵敏度为97.37%,特异性为97.49%。ROC下的面积为96.01%。
(d)方法2:应用SAS(版本8.2)
Logistic回归能够利用程序LOGISTIC以SAS进行。当反应变量是一个两水平因素时,该程序拟合一个二元logit模型(相当于R中的glm,family=二项式,link=logit)。SAS自动排除指定模型的所有遗漏的多变量观测数据。与R不同,SAS能够进行最佳亚组变量选择程序。所需的SAS中的编码片段如下:
PROC LOGISTICDATA=WORK.panel;
CLASS Class;
MODEL Class=X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12 X13X14 X15 X16 X17 X18 X19 X20 X21 X22 X23 X24 X25 X26 X27 X28/SELECTION=SCORE BEST=28;
RUN;
对整个数据集使用该程序。参数BEST=28指导SAS寻找28个最佳单变量模型,28个最佳双变量模型,28个最佳三变量模型,可达28个最佳28变量模型。
(i)评价探针组的表现
利用方法1所述的程序评价每个探针组的表现。下表25由检测组数据产生。其中只列出了两个最佳单、双、三、四、五标记组的结果。
表25:
  组   组成员   灵敏度   特异性  ROC下的面积
  1   7  94.28%
  2   28  80.14%
  3   7,16  95.00%
  4   7,15  94.59%
  5   7,15,16  95.94%
  6   1,7,16  95.33%
  7   1,7,15,16  95.61%
  8   4,7,15,16  95.34%
  9   1,4,7,15,16  95.30%
  10   1,7,11,15,16  95.57%
(2)线性判别分析
(a)背景
商品统计学软件包SPSS包括可以设计和测试简单线性判别函数的程序。
一个常用的方法是Fisher′s线性判别函数。其用来发现特征空间中可良好分离类别的超平面。对于类别分布有不同均值,但是具有类似的多元高斯分布的一个两级别问题,该分类器具有最佳表现。该方法能够探索式地扩展到多级别问题,但是在该研究中不使用。
该方法的步骤过于简单,但是对于与包含大量特征的数据集有关的问题足够了(我们的情况中探针编号27个,只含大约200个样本(病例)的数据集产生问题)。
该软件包包括鉴定有利于鉴别过程的特征的程序。这种“逐步法”首先发现大多数鉴别特征。然后连续加入其它特征,并对分类器进行评价。研究组合,如果发现更好的组合,最终解决方案可能不包括最初选择的特征。特征数逐渐增加,直到统计检验显示对分类过程没有可靠贡献的其余的特征。
对表现的评价利用“去除一个”的(leave one out)方法获得。它从数据集中除去一个样本,形成训练组。保留除去的这个样本作为检验组,用于分类器,产生的分类累加于含混矩阵中。对数据中的病例重复该程序。该程序产生对表现没有偏性的估计,但是该估计的方差高。
在SPSS中选择适当的数据集进行分析,选择“分析”,选择“分类”,选择“鉴别...”,在表上选择“Fishers法”,““去除一个”检验”和“使用逐步法”。输入诊断作为分组变量,输入所有特征作为独立变量。输入“OK”完成分析。其它参数保持预设值。
该分析的输出包括该分析中使用的特征列表,标准判别函数和含混矩阵和正确分类率(1-差错率)。
为了计算ROC曲线,对选择的特征使用标准判别函数产生一个新的特征。在SPSS中使用图ROC对该曲线作图。
ii.层次法:决策树
(1)背景
决策树学习是最广泛使用的归纳推理方法之一。它是一种增加噪音数据并且能够学习分隔表达(disjunctive expressions)的分类法(Tom M.Mitchell,″Machine Learning″,McGraw-Hill,New York,NY,1997)。
最流行的并且可以获得的机器学习软件包是“C4.5”,其源代码公开在:(J.Ross Quinlan,″C4.5:Programs for Machine Learning″,MorganKaufmann,San Mateo CA,1993)。
当(用训练数据)训练决策树时,该算法在树的每个结点处决策,在该结点处使用的数据的单一属性进行最佳决策。因此,当决策树完全构建好后,应当选择使用几组属性,而忽略其它属性。在我们的使用中,利用决策树处理由分子探针获得的测量值,决策树有效地选择一组探针,和组合探针得分的方法,这最好地解释了数据的分类。为了获得探针组表现的无偏估计,产生的决策树必须用训练中未使用的数据评价。进行评价的一个标准技术是交叉验证。使用10倍交叉验证。
交叉验证是最好地利用有限数据的一种技术。在10倍交叉验证中,数据被随机分配到10个大小几乎相等的区中,务必使一个类别在每个区之间有几乎相同的例数。然后该决策树用在1区上组合并检验的2-9区训练,随后用在2区上组合并检验的1、3-9区训练,等等,共10次试验,使维持试验组(held-out test set)在数据中循环一次。这样,只对维持(held-out)数据进行检验,因此无偏性,所有数据实际上只检测一次,因此能够计算整个数据集间的集合差错率。
通常构建决策树,直到与训练数据极好地拟合,然后通过剪去“噪音”分支和叶“修剪”。这提高了决策树对看不见的数据的概括能力,是获得良好表现所必需的。C4.5软件包包括两种修剪树的方法,第一种是一种标准树修剪算法,第二种是一种规则提取(rule extraction)算法。通常发现基于树的方法对该数据产生极好的结果。因此,未报道基于规则的方法。
(2)数据准备
不同探针对正常组织和5种不同癌症(腺癌、大细胞癌、间皮瘤、小细胞癌和鳞状细胞癌)的反应的数据如别处所述获得。从数据库中提取出探针1-28的和病理学家1和病理学家2的H得分,写成一个纯(flat)数据文件。为了决策树分析,采集每个数据点(两名病理学家对同一个物理载玻片平均)作为疾病对染色的影响的独立观测数据。这可能略微正偏置了分类的表现,但是对组的选择应当没有影响。
●将肺气肿、肉芽肿病和间质性肺病的对照分类归为一起,称为“正常的”。
●对于检测组,将所有癌症归类为一起,称为“异常的”,使之成为一个两级别问题。
●对于一个鉴别组,从数据中去除正常情况,形成一个5级别问题。
●对于维持(hold-out)鉴别组,每种癌症依次保持,其余的癌症归类为“其它”,产生一组5个两级别问题。
C4.5需要一个“.names”文件来描述该分析中包括的数据和属性。鉴别组的一个实例名称文件是表26:
表26:
  |C4.5 MonoGen ZF21诊断数据的名称文件|腺癌,大细胞癌,间皮瘤,小细胞肺癌,|鳞状细胞癌 类别P1: continuous.P2: continuous.P3: continuous.P4: continuous.P5: continuous.P7: continuous.P8: continuous.P9: continuous.P10:continuous.P11:continuous.P12:continuous.P13:continuous.P14:continuous.P15:continuous.P16:continuous.P17:continuous.P18:ignore.P19:continuous.P20:continuous.P21:continuous.P22:continuous.P23:continuous.P24:continuous.P25:continuous.P26:continuous.P27:continuous.P28:continuous.
数据中不含探针18,在所有设计中均设置为“忽略”。在名称文件中设置属性为“忽略”是从探针组中削减探针的一种容易、有效的方法,在数据分析中使用。
(3)数据分析
每个数据集都使用C4.5提供的“xval.sh”脚本进行10倍交叉验证。使用软件包的标准(缺省)参数。交叉验证是为用小数据集训练和检验的分类器发展的一种技术。它包括将数据随机分配到N个大小相等的区内。然后该分类器用N-1区一起训练,并用其余区检验。其重复N次。
由于在一个交叉验证(CV)试验中训练的决策树可能不同于另一个中获得的决策树(选择的两种探针和树系数不同),计算在10次试验中该树选择每个探针的次数。
通过设置为忽略在10次CV试验中在修剪的树中不出现5次或5次以上的任何探针,进行探针的第一次选择。
然后用较小一组候选探针重复交叉验证。通过设置为忽略在10次CV试验中在修剪的树中不出现5次或5次以上的任何探针,进行探针的第二次选择。如果弃用其它任何探针,则进行第三次CV。
探针组通过多个回合选择,它们的估计的差错表现在结果表中显示。探针组对于决策树分析的表现在下表27中显示。
表27:
探针组表现-决策树
检测组
探针3、7、19、25和28
  癌症   对照
  癌症   99.42%   0.58%
  对照   17.82%   82.18%
两两鉴别
4、6、14、19和23
  腺癌   其它
  腺癌   67.74%   32.26%
  其它   11.20%   88.80%
两两鉴别
3、6、17、19和25
  鳞状细胞癌   其它
  鳞状细胞癌   70.59%   29.41%
  其它   4.07%   95.93%
两两鉴别
1、5、10、13、21、27和28
  大细胞癌   其它
  大细胞癌   36.36%   63.64%
  其它   7.37%   92.63%
两两鉴别
3、12和16
  间皮瘤   其它
  间皮瘤   82.05%   17.95%
  其它   5.00%   95.00%
两两鉴别
12、17、20、23和25
  小细胞癌   对照
  小细胞癌   69.23%   30.77%
  对照   1.49%   98.51%
检测(不含探针7)
6、10、16和19
  癌症   对照
  癌症   89.60%   10.40%
  对照   3.30%   96.70%
检测(只有商业上优选的探针)
5、6、10、16、19和23
  癌症   对照
  癌症   92.80%   7.20%
  对照   5.49%   94.51%
决策树结构的一个例子在下表28和表29中显示,用于鉴别小细胞肺癌与其它4种癌症类型。
表28:
C4.5输出格式
P23<=3:|P25<=2:Small Cell Lung Cancer(18.0)|P25>2:||P17<=5:Small Cell Lung Cancer(2.0)||P17>5:|||P20<=11:Other(9.0)|||P20>11:Small Cell Lung Cancer(2.0)P23>3:|P12>7:Other(120.0)|P12<=7:||P20<=2:Other(5.0)||P20>2:Small Cell Lung Cancer(4.0)Tree savedEvaluation on training data(160 items):Before Pruning     After Pruning----------------  ----------- ----Size  Errors   Size  Errors   Estimate13    0(0.0%) 13    0(0.0%) (5.2%)
表29:
图示格式
Figure A0382505100971
探针组用于逐步线性判别的表现在下表30中显示:
表30:
探针组表现-逐步LD
检测组
1、4、7、15和16
  癌症   对照
  癌症   92.24%   7.76%
  对照   1.16%   98.84%
两两鉴别
4、5、14、19、20、25和27
  腺癌   其它
  腺癌   91.67%   8.33%
  其它   5.43%   94.57%
两两鉴别
1、2、3、24、25和26
  鳞状细胞癌   其它
  鳞状细胞癌   88.00%   12.00%
  其它   6.59%   93.41%
两两鉴别
1和7
  大细胞癌   其它
  大细胞癌   80.95%   19.05%
  其它   26.32%   73.68%
两两鉴别
3、12和16
  间皮瘤   其它
  间皮瘤   96.67%   3.33%
  其它   4.65%   95.35%
两两鉴别
12、19、22和23
  小细胞癌   其它
  小细胞癌   93.75%   6.25%
  其它   5.00%   95.00%
两两鉴别
1、2、3、4、10、11、15、16、23、24、27和28
  癌症   对照
  癌症   85.34%   14.66%
  对照   2.33%   97.67%
两两鉴别
8、10、11、19、23和28
  癌症   对照
  癌症   81.20%   18.80%
  对照   1.16%   98.84%
探针组用于逐步logistic回归分析的表现在下表31中显示:
表31:
探针组表现-逐步LR
检测组
6、7、12、23和25
  癌症   对照
  癌症   97.49%   2.63%
  对照   2.51%   97.49%
两两鉴别
14、19、20、25和27
  腺癌   其它
  腺癌   96.39%   3.61%
  其它   12.29%   87.71%
两两鉴别
3和10
  鳞状细胞癌   其它
  鳞状细胞癌   94.93%   5.07%
  其它   35.86%   64.14%
两两鉴别
1、4、6、16和21
  大细胞癌   其它
  大细胞癌   95.11%   4.89%
  其它   61.00%   39.00%
两两鉴别
3、7、12和16
  间皮瘤   其它
  间皮瘤   95.07%   4.93%
  其它   10.89%   89.11%
两两鉴别
12、13和23
  小细胞癌   其它
  小细胞癌   98.90%   1.10%
  其它   4.00%   96.00%
检测(不含探针7)
1、10、19、23和28
  癌症   对照
  癌症   94.00%   6.00%
  对照   5.80%   94.20%
检测(只有商业上优选的探针)
10、19、20、23和28
  癌症   对照
  癌症   93.88%   6.12%
  对照   6.39%   93.61%
iii.神经网络和备选方法
人工神经网络ANN′s是候选模式识别技术,它可用来容易地选择特征和设计与本发明有关的分类器。然而,这些技术以LDF的方式对数据结构和特定探针的影响获得极少的了解。由于这个原因,本研究不使用这类算法。LDF代表线性判别函数,这是特征的一种线性组合,其结果为决定分类的阈值。
这类技术包括算法如Multi-Layer Percsptron MLP、Back-Prop、Kohonen′s Self-Organizing Maps、Learning VectorQuantization、K-nearest neighbors和遗传算法(Genetic Algorithms)。
iv.专题
(1)假设
线性判别分析
●假设两个类别的协方差阵相等。
●只有当两个类别是多元正态时,误分类的成本才最小化。
●假设说明变量连续的而不是分类的(categorical)(在本研究中,H得分是分类的,而实际上(即在自动化系统中)能够以连续方式测定强度)。
Logistic回归(二项式广义线性模型)
参见Venerables和Ripley,第7章(″Modem Applied Statistics withS-PLUS″(W.N.Venables和B.D.Ripley,Springer-Verlag,New York,1999))。
(2)标记排除(取消选择)
判别分析和回归程序的计算机实现包括逐步变量选择程序;例如R中的stepAIC。这些程序用来选择最佳变量亚组用作说明变量。实际上,由于这些程序的步进式性质,无法保证为预测选择到最佳变量(Johnson和Wichern,p.299)。但是这些程序确实为标记选择和取消选择提供了基础。
(3)成对检验
设计多类别分类器所固有的问题在“Applied MulitvariateStatistical Analysis″,R.A.Johnson和D.W.Wichern,2nd Ed,1988,Prentice-Hall,N.J.中描述。这是发展几种不同的双类别分类器(鉴别组)的动力。
(4)探针组组成中的冗余(Redundancy)考虑
“线性模型组成了经典统计学的核心,仍然是大多数统计学实践的基础“Modem Applied Statistics with S-PLUS″(W.N.Venables和B.D.Ripley,Springer-Verlag,New York,1999)。线性模型是t-检验、方差分析(ANOVA)、回归分析以及包括鉴别分析在内的多种多元方法的基础。说明变量可以或者可以不输入模型内作为一级项。(非线性)logistic回归也是如此。Logistic回归模型只是线性回归模型的一种非线性转化:将因变量替换为对数优势比(logit)。总之,这些统计学方法是基于说明变量之间的线性关系。因此,用于寻找探针组中冗余的一个方法是鉴定高度相关的变量(标记)。可以将一种标记替换为探针组中的另外一种标记,以获得相似的表现。
寻找探针组中冗余的另外一个方法是进行“最佳亚组”回归分析。假如一个初始模型具有所有的目标说明变量,则目标在于发现最佳单变量回归模型,最佳双变量回归等。该方法用SAS统计学软件包实现。
(5)加权得分的使用
(a)商业和临床考虑
由于许多原因,包括策略和商业因素;成本;可用性;易于使用,优选地可能鼓励选择探针组中的某些探针,而不选择另外一些探针,同时对探针组大小或表现做出权衡。
(b)属性成本计算(costing)
在机器学习文献的其它内容中,已经提出了这些属性加权(在决策树中)的方法,如背景知识的加入(M.Nunez,″The Use of BackgroundKnowledge″,Machine Learning 6:231-250,1991.),从机器人传感器获得信息的不同成本(M.Tan,″Cost-sensitive Learning of ClassificationKnowledge and its Applications in Robotics″,Machine Learning.13:7-33,1993)。
这两种对成本敏感的算法在文献中已经通过较小地改变被称为C4.5的标准机器学习软件包实现(J.Ross Quinlan,″C4.5:programs formachine learning″,Morgan Kaufmann,CA.1993)。为了方便起见,用该方法实现Nunez的“EG2”算法。
在C4.5决策树的构建阶段,该算法比较每个可以获得的属性,分开(split on)并选择一种,使信息增益Gi最大化。在EG2算法中,(2Gi-1)/(Ci+1)被最大化,其中加入了该属性的信息成本Ci。权重的载体需要使用者通过推理设置。
(i)代码修改
修改C4.5的源代码以实现M.Nunez提出的经济的普通(generalizer)“EG2”算法(The Use of Background Knowledge,Machine Learning6:231-250,1991)。
C4.5软件包的准确修改如下。
在文件“R8/Src/contin.c”中的以下行之后(J.Ross Quinlan,″C4.5:programs for machine learning″,Morgan Kaufmann,CA.1993),
  ForEach(i,Xp,Lp-1){if{(Val=SplitGain[i]-ThreshCost)>BestVal){BestI=i;BestVal=Val;}}
插入新的一行:
  BestVal=(powf(2.0,BestVal)-1.0)/(AttributeCosts[Att]+1.0);
属性成本的载体预先从使用者保留的文本文件中读取。
(ii)实验方法
商业上优选的探针是:2、4、5、6、8、10、11、12、16、19、20、22、23、28。
对于实施例,由于成本,推测上述探针在商业上是优选的,希望考虑这个成本再选择检测组。
用修改的C4.5决策树软件给商业上优选的探针一个为0的罚分,给商业上不优选的探针一个为2的罚分。10倍交叉验证的探针组选择方法(如其它部分所述)用修改的C4.5算法运行。
(iii)结果
标准决策树检测组包括探针3、7、19、25、28。产生的组成员是2、6、7、10、19、25、28,只使用2种商业上优选的探针P7和P25。注意由于它们对该数据的优异表现,尽管它们的成本提高,但仍通过该方法选择这些探针。与最初的5种相比,探针组现在较大:有7种探针。探针组对该数据的表现没有可以证明的下降,尽管这种表现现在是次最佳的,以对降低的探针成本权衡。
(iv)结论
建立一种简明的(straightforward)方法,以向探针组选择方法中加入使用探针的成本。
(c)误分类成本计算
(i)背景
由于许多原因,可能希望选择一个最佳探针组,记住不同种类的分类错误的成本可能不同。例如,可能希望选择一个探针组,它对一种疾病(如大细胞癌)的灵敏度提高,并且在含混矩阵中对降低的特异性和灵敏度作出权衡。
理论上,可能需要加入所有可能的成本组合的误分类成本矩阵(与含混矩阵维度相同)。实际上,只输入那些非均一的成本(缺省)。
商品决策树软件See5.(RuleQuest Research Pty Ltd,30 AthenaAvenue,St Ives Pathologist 3SW 2075,Australia.(http://wwsv.rulequest.com))加入了这种能力,在下列证明中使用。
(ii)目标
标准联合鉴别组(其它部分所述)包括成员P2、3、4、5、12、14、16、19、22、23、28。产生下列估计的含混矩阵:
 (a)    (b)      (c)     (d)    (e)    <-分类为----   ----     ----    ----   ----24     4        2       5      2      (a):腺癌类8      7        3       5      4      (b):大细胞癌类1      1        33      1      4      (c):间皮瘤类6      2        1       23            (d):小细胞肺癌类4      4        3       2      24     (e):鳞状细胞癌类
大细胞癌的灵敏度低至26%。如果希望在新设计的探针组中提高这种灵敏度,可以使用下列方法。
(iii)方法学
产生以下成本文件:
ZF21Discrim的成本文件
提高对“大细胞癌”的灵敏度
间皮瘤,大细胞癌:10
腺癌,大细胞癌:10
间皮瘤,大细胞癌:10
小细胞肺癌,大细胞癌:10
鳞状细胞癌,大细胞癌:10
该文件使得将大细胞癌误分类为另外任何一种癌症的权重提高了10倍。这倾向于提高这一类别的检测灵敏度(表现降低),而没有加权能够确保正确的分类。
使用标准决策树探针组选择方法(使用See5代替C4.5)。
(iv)结果
新的探针组成员是:P2、3、4、5、6、9、12、14、16、17、25、28。估计的表现如下:
  (a)   (b)   (c)     (d)    (e)    <-分类为----  ----   ----   ----   ----20    13     1      1      2      (a):腺癌类3     13     3      2      6      (b):大细胞癌类1     9      27     2      1      (c):间皮瘤类2     9             21            (d):小细胞肺癌类1     15     2      1      18     (e):鳞状细胞癌类
以上证明了估计的大细胞癌的灵敏度现在已经提高到48%。
(v)结论
已经证明一种简明方法向探针组选择方法中加入了误分类的差别成本。
d.表现量度
显示每种方法的估计表现的分析所提供的输出包括:
i.ROC分析
接收工作特征(ROC)曲线显示假阳性和假阴性得分对于分类法中不同阈值水平的估计的百分比(或每单位概率)。不能比随机选择更好地鉴别的一种普通(indifferent)分类器将使ROC曲线具有相等的真及假读数。该曲线下的面积为50%(0.5概率)。
曲线下面积(AUC)通常用作分类器表现的总评价,大多数商品判别函数软件包提供这个指标。一个完美的分类器将有100%的曲线下面积,一个无用的分类器有接近50%的AUC(0.5概率)。
ii.含混矩阵:计数和百分数
含混矩阵显示来自试验组的数据如何分类。对于成对检验,有真阳性、假阳性、真阴性或假阴性得分的计数。其可以表示为实际计数或百分数。对于试图只用一个探针组得到唯一诊断的多向探针组,含混矩阵将显示每次正确分类的计数。例如,每次检测小细胞癌,将其输入矩阵的一个对角线。不正确的得分;例如小细胞癌多长时间一次被不正确地鉴定为鳞状细胞癌,将被输入矩阵的适当的非对角元(off-diagonalelement)。用差错率将含混矩阵中的数据概括为所有假分类的总和除以进行分类的总数,表示为百分数。
iii.灵敏度和特异性
特异性是指任何定义排除无效病例的程度。如果一个定义特异性较差,则假阳性高。意思是,在个体实际上未患疾病时,将个体标记为患有一种疾病。灵敏度是指任何定义包括所有有效病例的程度。如果一个定义灵敏度低,则假阴性高(患有一种疾病的个体被错误地诊断为未患病)。
3.数据分析和结果
a.样本含量和变异性
●  在合并的病理学家1和病理学家2的数据集的354个病例中,只有202例具有对于每种标记(变量或特征)的H得分。
●  少量的全面观察和大量变量产生估计问题(维数的原因)。因此必须严格地修剪回用来建立分类器的变量数。
●  由于只有少量观测数据,不须小心地将数据分成不同的训练组和试验组(是加强分类器表现估计所必需的)。由于这个原因,必须使用再取样法(如交叉验证和多重随机试验)。
●  用于癌症鉴别的多类别分类器的设计较难,因为对每种癌症类型的观测数据太少。
b.解除选择的标记
标记用上述方法解除选择。解除选择的标记在探针组中以未选择表示。
c.检测组的组成
i.选择的标记探针
为所有三种方法选择的标记探针总结于表5中。
ii.最小化选择的标记组
对于检测组,显然探针7对一种标记有最佳的检测表现。分析探针组合,观察用更多探针是否能够获得可靠的探针组。
(1)方法
Logistic回归法使最佳亚组根据表现量度(Fisher得分)排序。利用该分析选择1-5种探针的组合。利用Fishers线性判别函数和logit模型(logistic回归)说明这些组合的表现。数据如上所示。
(2)结论
探针7本身作为一种分类器表现良好;然而,只使用探针7的一个缺点是探针7具有高假阴性得分。使用Fishers线性判别函数作为分类器,探针7和16有最佳表现。使用其它组合,探针组之间的结果变异性提示更多特征增加的噪音权重超过提高分类得分的可能。少量不正确评分的样品使这些稀有事件的统计学有较差表现。用大量病例设计的一种分类器可以设计一个更好的分类器。用不同分类器选择最佳探针组合的技术可以产生一个不同的最佳探针组,这取决于数据结构。
iii.补充标记
已经证明能够设计探针组来适合不同探针的可用性。筛选这些亚组能够使用不同的方法:决策树、Logistic回归和线性判别函数。数据如上所示。
使用SPSS,对由该探针组获得的得分使用Fisher′s线性判别函数,其中由于存取约束施加约束。例如,所有探针均来自一个供应商。再选择逐步选项来发现最佳特征组合。用“去除一个”(Leave-One-Out)交叉验证试验估计其表现。
iv.备选标记:生物作用机制(功能相当的标记)
本领域普通技术人员能够确定功能上相当的标记。在该探针组中使用的标记的功能行为在本文件中描述。
v.标记定位
本研究中使用的不同标记的定位在该文件的其它部分描述。
vi.探针组表现
这三种方法的表现如上所示。
vii.对探针组表现解释的限制
●由于数据集小且需要使用重采样法,因此具有分类器训练过度(为了太紧密地拟合数据)的危险。
●使用细胞学标本的探针组表现难以精确地预测,因为还不清楚痰细胞学样品是否含有代表在组织学验证研究中分析的细胞的足够数量的细胞。但是,如果有足够的细胞样本容量,预期最优化的探针组与细胞学标本行为类似。
d.鉴别组的组成
i.用于所有癌症的一个5向探针组
在三种分析技术中,只有一种决策树适合一种5向探针组。因此构建一个决策树,以同时分类所有肺癌类型。探针组成员在图5中显示。探针组表现在以上探针组表现表中显示。
ii.用于鉴别一种肺癌类型与其它所有类型的探针组
线性判别函数不太适合同时进行多类别鉴别。分析了5种不同分类器的表现,其中每一种都分别设计,以从合并的所有癌症中鉴别癌症之一。这些组合不能将病例分类为候选癌症之一,或者能够将一种病例分类为两种或更多的候选癌症。它在为了进一步检查鉴别不一致的病例方面可能有利。
已经发现单个鉴别组对于所有癌症类型的总差错率有相当高的差错率(一个5向分类器)。在上述探针组表现数据中,显示了5种成对分类器的表现,其中的每一个都用来鉴别一种癌症与其它4种可能的癌症。该方法适合用决策树和线性判别函数分析。使用时,该技术能够得到一个不确定的发现,对一名患者产生两种或者更多的诊断,提示需要进一步的临床研究。该技术也可能没有发现,也提示需要进一步的临床研究(也许用检测组再检验)。
iii.说明假阳性病例来自检测组的可能性的探针组
能够训练另外一个探针组,来鉴别假阳性病例(来自检测组)与5种癌症类型。包括从检测组中选择不正确地分类为异常的个体病例。用检测这些“特殊”病例的“更难的”问题训练一种指定的分类器。然而,这是一个理论上合理的任务,该数据集只产生这些病例中的4个,认为分析未充分代表该群体。
iv.选择的标记
为全部三种方法选择的标记探针总结于图5中。
v.最小化选择的标记组
该主题位于“用不同方法获得类似结果证明的方法的可靠性Robustness”下。
vi.补充标记
该主题位于“用不同方法获得类似结果证明的方法的可靠性”下。
vii.备选标记:生物作用机制
本领域普通技术人员能够确定功能上相当的标记。在该探针组中使用的标记的功能行为在本文件中描述。
viii.标记定位
本研究中使用的不同标记的定位在该文件的其它部分描述。
ix.探针组表现
这三种方法的表现总结于图5中。
e.加权参数的作用
除了为使用者提供的上述标记和疾病(类别)的加权标准以外,也能够使用一个二元(binary)加权方案。例如,如果所有非-DAKO供应的探针都加权为“0”,而所有DAKO供应的探针都加权为“1”,则优化的探针组将只含有DAKO供应的探针。对于旨在只通过自己的供应发展和销售分子诊断组试剂盒的所有供应商来说,这是一个重要的产品设计能力。
f.使用其它(非H得分)客观评分参数的作用
i.背景
病理学评价表包括如下表32所示的一组表格。
表32:
  强度   无   弱   中   强
  0-5%6-25%26-50%51-75%>75%   □0□1□2□3□4   □0□1□2□3□4   □0□1□2□3□4   □0□1□2□3□4
标准评分系统使用“H得分”,H得分如下获得:将强度分级为:无=0,弱=1,中=2,强=3,将细胞百分比分级为:0-5%=0,6-25%=1,26-50%=2,51-75%=3,>75%=4,然后将两个级别相乘。例如,50%弱染色+50%中度染色将获得得分10=2×2+2×3。
ii.方法
分析一种备选评分方法,其中如下将反应分为低、中、高:
(a)如果50%以上的细胞含有中度或者中度以上的染色→高
(b)如果50%以上的细胞未染色→低
(c)其它→中
用这个三水平因素代替H得分重复决策树检测组选择方法。这使决策树需要时在每个结点分出3个分支。
iii.结果
选择的探针组是:探针3、7、10、11、16、19、20、28。估计的表现为:
  分类为→   (a)   (b)
  对照(a)   79   22   特异性=78%
  癌症(b)   24   149   灵敏度=86%
这应当与H得分如下的参照表现相比:
  分类为→  (a)   (b)
  对照(a)  85   6   特异性=93%
  癌症(b)  5   120   灵敏度=96%
iv.结论
●  当使用提出的备选评分系统时,表现(较大探针组、较低的灵敏度和较低的特异性)大大降低。
●  对于根据检查数据的探针组选择,作为一个连续变量处理H得分(0-12)似乎是接近最佳的。
●  没有检查其它许多可能的评分系统,但是它们可能是可行的,并且适合实验检测的探针组设计和发展方法。
4.肺癌检测组和鉴别组
以下列出了上述说明性实施例确定的代表性肺癌检测组和鉴别组。应当指出,尽管以下列出的探针组列举了具体探针,但是每种具体探针都可能被一种相关探针或功能相关的探针代替。
检测(没有约束)
●  抗细胞周期蛋白A,与一种或多种其它探针组合。
●  抗-细胞周期蛋白A,抗人上皮相关蛋白(MOC-31)。
●  抗-细胞周期蛋白A,抗-ER-相关P29。
●  抗细胞周期蛋白A,抗成熟表面活性脱辅蛋白质B。
●  抗细胞周期蛋白A,抗人上皮相关抗原(MOC-31),抗-VEGF。
●  抗细胞周期蛋白A,抗人上皮相关抗原(MOC-31),抗成熟表面活性脱辅蛋白质B。
●  抗细胞周期蛋白A,抗成熟表面活性脱辅蛋白质B,抗人上皮相关抗原(MOC-31),抗VEGF。
●  抗细胞周期蛋白A,抗成熟表面活性脱辅蛋白质B,抗人上皮相关抗原(MOC-31),抗表面活性脱辅蛋白质A。
●  抗细胞周期蛋白A,抗成熟表面活性脱辅蛋白质B,抗人上皮相关抗原(MOC-31),抗VEGF,抗表面活性脱辅蛋白质A。
●  抗细胞周期蛋白A,抗成熟表面活性脱辅蛋白质B,抗人上皮相关抗原(MOC-31),抗VEGF,抗细胞周期蛋白D1。
●  抗细胞周期蛋白A,抗人上皮相关抗原(MOC-31),与一种或多种其它探针组合。
●  抗细胞周期蛋白A,抗ER相关P29,与一种或多种其它探针组合。
●  抗细胞周期蛋白A,抗成熟表面活性脱辅蛋白质B,与一种或多种其它探针组合。
●  抗细胞周期蛋白A,抗人上皮相关抗原(MOC-31),抗VEGF,与一种或多种其它探针组合。
●  抗细胞周期蛋白A,抗人上皮相关抗原(MOC-31),抗成熟表面活性脱辅蛋白质B,与一种或多种其它探针组合。
●  抗细胞周期蛋白A,抗成熟表面活性脱辅蛋白质B,抗人上皮相关抗原(MOC-31),抗VEGF,与一种或多种其它探针组合。
●  抗细胞周期蛋白A,抗成熟表面活性脱辅蛋白质B,抗人上皮相关抗原(MOC-31),抗表面活性脱辅蛋白质A,与一种或多种其它探针组合。
●  抗细胞周期蛋白A,抗成熟表面活性脱辅蛋白质B,抗人上皮相关抗原(MOC-31),抗VEGF,抗表面活性脱辅蛋白质A,与一种或多种其它探针组合。
●  抗细胞周期蛋白A,抗成熟表面活性脱辅蛋白质B,抗人上皮相关抗原(MOC-31),抗VEGF,抗细胞周期蛋白D1,与一种或多种其它探针组合。
检测(W/O抗细胞周期蛋白A)
●  抗Ki-67,与一种或多种其它探针组合。
●  抗Ki-67,与选自下列的任一种探针组合:抗VEGF,抗人上皮相关抗原(MOC-31),抗TTF-1,抗EGFR,抗增殖细胞核抗原和抗成熟表面活性脱辅蛋白质B。
●  抗Ki-67,与选自下列的任何两种探针组合:抗VEGF,抗人上皮相关抗原(MOC-31),抗TTF-1,抗EGFR,抗增殖细胞核抗原和抗成熟表面活性脱辅蛋白质B。
●  抗Ki-67,与选自下列的任何三种探针组合:抗VEGF,抗人上皮相关抗原(MOC-31),抗TTF-1,抗EGFR,抗增殖细胞核抗原和抗成熟表面活性脱辅蛋白质B。
●  抗Ki-67,与选自下列的任何四种探针组合:抗VEGF,抗人上皮相关抗原(MOC-31),抗TTF-1,抗EGFR,抗增殖细胞核抗原和抗成熟表面活性脱辅蛋白质B。
●  抗Ki-67,与选自下列的任何五种探针组合:抗VEGF,抗人上皮相关抗原(MOC-31),抗TTF-1,抗EGFR,抗增殖细胞核抗原和抗成熟表面活性脱辅蛋白质B。
●  抗Ki-67,抗VEGF,抗人上皮相关抗原(MOC-31),抗TTF-1,抗EGFR,抗增殖细胞核抗原和抗成熟表面活性脱辅蛋白质B。
●  抗Ki-67,与选自下列的任何一种探针组合:抗VEGF,抗人上皮相关抗原(MOC-31),抗TTF-1,抗EGFR,抗增殖细胞核抗原和抗成熟表面活性脱辅蛋白质B,以及一种或多种其它探针。
●  抗Ki-67,与选自下列的任何两种探针组合:抗VEGF,抗人上皮相关抗原(MOC-31),抗TTF-1,抗EGFR,抗增殖细胞核抗原和抗成熟表面活性脱辅蛋白质B,以及一种或多种其它探针。
●  抗Ki-67,与选自下列的任何三种探针组合:抗VEGF,抗人上皮相关抗原(MOC-31),抗TTF-1,抗EGFR,抗.增殖细胞核抗原和抗成熟表面活性脱辅蛋白质B,以及一种或多种其它探针。
●  抗Ki-57,与选自下列的任何四种探针组合:抗VEGF,抗人上皮相关抗原(MOC-31),抗TTF-1,抗EGFR,抗增殖细胞核抗原和抗成熟表面活性脱辅蛋白质B,以及一种或多种其它探针。
●  抗Ki-67,与选自下列的任何五种探针组合:抗VEGF,抗人上皮相关抗原(MOC-31),抗TTF-1,抗EGFR,抗增殖细胞核抗原和抗成熟表面活性脱辅蛋白质B,以及一种或多种其它探针。
●  抗Ki-67,抗VEGF,抗人上皮相关抗原(MOC-31),抗TTF-1,抗EGFR,抗增殖细胞核抗原,抗成熟表面活性脱辅蛋白质B,以及一种或多种其它探针。
用商业上优选的探针检测
●  抗Ki-67,与一种或多种其它探针组合。
●  抗TTF-1,与一种或多种其它探针组合。
●  抗EGFR,与一种或多种其它探针组合。
●  抗增殖细胞核抗原,与一种或多种其它探针组合。
●  选自下列的两种探针:抗Ki-67,抗TTF-1,抗EGFR和抗增殖细胞核抗原。
●  选自下列的三种探针:抗Ki-67,抗TTF-1,抗EGFR和抗增殖细胞核抗原。
●  抗Ki-67,抗TTF-1,抗EGFR和抗增殖细胞核抗原
●  选自下列的两种探针:抗Ki-67,抗TTF-1,抗EGFR和抗增殖细胞核抗原,以及一种或多种其它探针。
●  选自下列的三种探针:抗Ki-67,抗TTF-1,抗EGFR和抗增殖细胞核抗原,以及一种或多种其它探针。
●  抗Ki-67,抗TTF-1,抗EGFR,抗增殖细胞核抗原,以及一种或多种其它探针。
鉴别腺癌与其它肺癌
●  抗粘蛋白1和抗TTF-1。
●  抗粘蛋白1和抗TTF-1,与选自下列的任何一种探针组合:抗VEGF,抗表面活性脱辅基蛋白A,抗BCL2,抗ER相关P29和抗Glut3。
●  抗粘蛋白1和抗TTF-1,与选自下列的任何两种探针组合:抗VEGF,抗表面活性脱辅基蛋白A,抗BCL2,抗ER相关P29和抗Glut3。
●  抗粘蛋白1和抗TTF-1,与选自下列的任何三种探针组合:抗VEGF,抗表面活性脱辅基蛋白A,抗BCL2,抗ER相关P29和抗Glut3。
●  抗粘蛋白1和抗TTF-1,与选自下列的任何四种探针组合:抗VEGF,抗表面活性脱辅蛋白质A,抗BCL2,抗ER相关P29和抗Glut3。
●  抗VEGF,抗表面活性脱辅蛋白质A,抗粘蛋白1,抗TTF-1,抗BCL2,抗ER-相关P29和抗Glut3。
●  抗粘蛋白1,抗TTF-1以及一种或多种其它探针。
●  抗粘蛋白1和抗TTF-1,与选自下列的任何一种探针组合:抗VEGF,抗表面活性脱辅蛋白质A,抗BCL2,抗ER相关P29和抗Glut3,以及一种或多种其它探针。
●  抗粘蛋白1和抗TTF-1,与选自下列的任何两种探针组合:抗VEGF,抗表面活性脱辅蛋白质A,抗BCL2,抗ER相关P29和抗Glut3,以及一种或多种其它探针。
●  抗粘蛋白1和抗TTF-1,与选自下列的任何三种探针组合:抗VEGF,抗表面活性脱辅蛋白质A,抗BCL2,抗ER相关P29和抗Glut3,以及一种或多种其它探针。
●  抗粘蛋白1和抗TTF-1,与选自下列的任何四种探针组合:抗VEGF,抗表面活性脱辅基蛋白A,抗BCL2,抗ER相关P29和抗Glut3,以及一种或多种其它探针。
●  抗VEGF,抗表面活性脱辅蛋白质A,抗粘蛋白1,抗TTF-1,抗BCL2,抗ER相关P29,抗Glut3以及一种或多种其它探针。
鉴别鳞状细胞癌与其它肺癌
●  抗CD44v6,与一种或多种其它探针组合。
●  抗CD44v6,与选自下列的任何一种探针组合:抗VEGF,抗凝血调节蛋白,抗Glut 1,抗ER相关P29和抗黑素瘤相关抗原3。
●  抗CD44v6,与选自下列的任何两种探针组合:抗VEGF,抗凝血调节蛋白,抗Glut1,抗ER相关P29和抗黑素瘤相关抗原3。
●  抗CD44v6,与选自下列的任何三种探针组合:抗VEGF,抗凝血调节蛋白,抗Glut1,抗ER相关P29和抗黑素瘤相关抗原3。
●  抗CD44v6,与选自下列的任何四种探针组合:抗VEGF,抗凝血调节蛋白,抗Glut1,抗ER相关P29和抗黑素瘤相关抗原3。
●  抗CD44v6,抗VEGF,抗凝血调节蛋白,抗Glut1,抗ER相关P29和抗黑素瘤相关抗原3。
●  抗CD44v6,与选自下列的任何一种探针组合:抗VEGF,抗凝血调节蛋白,抗Glut1,抗ER相关P29和抗黑素瘤相关抗原3,以及一种或多种其它探针。
●  抗CD44v6,与选自下列的任何两种探针组合:抗VEGF,抗凝血调节蛋白,抗Glut1,抗ER相关P29和抗黑素瘤相关抗原3,以及一种或多种其它探针。
●  抗CD44v6,与选自下列的任何三种探针组合:抗VEGF,抗凝血调节蛋白,抗Glut1,抗ER相关P29和抗黑素瘤相关抗原3,以及一种或多种其它探针。
●  抗CD44v6,与选自下列的任何四种探针组合:抗VEGF,抗凝血调节蛋白,抗Glut1,抗ER相关P29和抗黑素瘤相关抗原3,以及一种或多种其它探针。
●  抗CD44v6,抗VEGF,抗凝血调节蛋白,抗Glut1,抗ER相关P29,抗黑素瘤相关抗原3,以及一种或多种其它探针。
鉴别大细胞癌与其它肺癌
●  抗VEGF,与一种或多种其它探针组合。
●  抗VEGF和抗p120。
●  抗VEGF和抗Glut3。
●  抗VEGF,抗p120和抗细胞周期蛋白A。
●  抗VEGF,抗p120,以及一种或多种其它探针。
●  抗VEGF,抗Glut3,以及一种或多种其它探针。
●  抗VEGF,抗p120,抗细胞周期蛋白A,以及一种或多种其它探针。
鉴别间皮瘤与其它肺癌
●  抗CD44v6,与一种或多种其它探针组合。
●  抗增殖细胞核抗原,与一种或多种其它探针组合。
●  抗人上皮相关抗原(MOC-31),与一种或多种其它探针组合。
●  两种选自下列的探针:抗CD44v6,抗增殖细胞核抗原和抗人上皮相关抗原(MOC-31),与一种或多种其它探针组合。
●  抗CD44v6,抗增殖细胞核抗原,抗人上皮相关抗原(MOC-31),以及一种或多种其它探针。
鉴别小细胞和其它肺癌
●  抗增殖细胞核抗原,与一种或多种其它探针组合。
●  抗BCL2,与一种或多种其它探针组合。
●  抗EGFR,与一种或多种其它探针组合。
●  两种选自下列的探针:抗增殖细胞核抗原,抗BCL2和抗EGFR。
●  抗增殖细胞核抗原,抗BCL2,抗EGFR。
●  两种选自下列的探针:抗增殖细胞核抗原,抗BCL2和抗EGFR,与一种或多种其它探针组合。
●  抗增殖细胞核抗原,抗BCL2,抗EGFR,以及一种或多种其它探针。
同时鉴别腺癌、鳞状细胞癌、大细胞癌、间皮瘤和小细胞癌
●  两种或多种选自下列的探针:抗VEGF,抗凝血调节蛋白,抗CD44v6,抗表面活性脱辅基蛋白A,抗增殖细胞核抗原,抗粘蛋白1,抗人上皮相关抗原(MOC-31),抗TTF-1,抗N-钙粘蛋白,抗EGFR和抗增殖细胞核抗原。
●  抗VEGF,抗凝血调节蛋白,抗CD44v6,抗表面活性脱辅蛋白质A,抗增殖细胞核抗原,抗粘蛋白1,抗人上皮相关抗原(MOC-31),抗TTF-1,抗N-钙粘蛋白,抗EGFR和抗增殖细胞核抗原。
●  两种或多种选自下列的探针:抗VEGF,抗凝血调节蛋白,抗CD44v6,抗表面活性脱辅基蛋白A,抗增殖细胞核抗原,抗粘蛋白1,抗人上皮相关抗原(MOC-31),抗TTF-1,抗N-钙粘蛋白,抗EGFR和抗增殖细胞核抗原,与一种或多种其它探针组合。
●  抗VEGF,抗凝血调节蛋白,抗CD44v6,抗表面活性脱辅蛋白质A,抗增殖细胞核抗原,抗粘蛋白1,抗人上皮相关抗原(MOC-31),抗TTF-1,抗N-钙粘蛋白,抗EGFR和抗增殖细胞核抗原,与一种或多种其它探针组合。
5.结论
a.用于分子诊断的探针组方法的有效性
i.非直觉解决方案
作直方图(PathologistData.xls,工作表:直方图),显示每种探针对于对照与癌症的标记得分的分布。从这些直方图来看,显然根据直觉为具体探针组选择探针确实不明显,此处描述的本发明确实允许在不使用明显方法的情况下发现有效的组合。
ii.对不同产品用途的优化
iii.用不同方法获得类似结果证明的方法的可靠性
仔细研究在该报告中利用不同分析获得的结果,总结于表和图中,显示下列发现。
1.仔细研究各种探针的表现不能确定可能比任何一种单独的探针表现更好的探针组合。
2.所有三种分类方法都用类似的特征组评价。小的差异可能是由于数据结构的原因,可能偏爱一种分类器胜过另外一种。
3.当用设计过程中看不到的来自独立病理学家的数据检验时,用这些方法之一设计的所有分类器都证明产生良好的表现。这在本发明中产生高置信度。
4.以单独的探针7为基础的一个检测组获得好的表现。
5.如果探针7与探针16或25组合,则获得更好的表现。
6.其它探针与探针7的组合似乎可进一步提高表现,捕获的确切病例数太少,以至于它们可能没有代表性,而这样设计的分类器可能没有概括性。
7.选自除探针7之外的探针的探针组的表现提供了一定的鉴别,与用人类筛查的现有方法相比已经足够好,但是对于明天的临床诊断细胞学世界中的自动化细胞计数器来说,也许还不够好(见图6)。
8.其它探针组合能够提供有用的,但是较低的表现。
9.如果某些探针无法获得,本发明允许选择其它探针组合。这用只根据商业上优选的探针组设计的分类器说明。见图7。
10.本发明允许对昂贵的探针使用加权。如果它们的作用重要的话,不是从分析中完全排除它们,而是使它们包含于探针组中。
11.本发明允许设计一种单一肺癌类型特异的鉴别组,它能够将一种肺癌类型与其它所有癌症相区别。
12.一个探针组分类5种癌症的表现之分析表明,鉴别是可能的,但是总差错率低于一组5个为鉴别癌症之一与其它癌症而设计的探针组。
13.用5个双向分类器的组合获得非常有用的鉴别。
14.对于5个鉴别组,用三种分类方法选择常见的探针组,再次产生该结果的置信度。
15.用于分离腺癌病例的探针是4、14、19、20、25和27。
16.用于分离鳞状细胞癌病例的探针是1、2、3、24、25和26。
17.用于分离大细胞癌病例的探针是1和7,或者1和21。
18.用于分离间皮瘤病例的探针是3、12和16。
19.用于分离小细胞癌病例的探针是12、20和23。
20.用于同时区别所有癌症的探针是1、2、3、4、12、14、19、22、23和28。
21.使用本发明定义的多重成对探针组的一个优点是,可疑病例可能不能用5个探针组之任一个评分,不明确的病例也可能使用两个或更多探针组。这些反常报告警告细胞学家需要进一步的分析。
iv.风险管理研究
本研究中使用的所有试验实际上都是统计学的。存在一种风险:根据表现的小改进选择的探针当对新数据检验时具有统计学变异。为了在结果中产生置信度,测试了对病理学家1和病理学家2的数据的线性判别分析出现的最佳分类器。应当记住,病理学家3的数据在统计学上不同于病理学家1和病理学家2的数据,因此如果当使用病理学家3的数据也获得良好表现时,实际上是令人鼓舞的。
(1)关于用看不见的数据检验的报告——检测组
(a)方法
在上文题为“检测组的组成”的章节中,我们表示用特征7和16能获得良好的分类。利用SPSS,选择报告7和16的H得分的病理学家3的所有数据。然后利用转化和计算,产生标准判别函数作为一个新的特征。然后测试这种该特征单独的表现。
(b)结果
这些是用病理学家1和病理学家2的数据设计并用病理学家3的数据检测的分类器的检测结果。该分类器用探针7和16的线性判别函数设计。标准病理学家2函数为=0.965*探针7-0.298*探针16。
使用探针7和16对病理学家3数据的分类结果
  预测组成员   总数
  诊断(UCLA)   0   1
  原始计数%   0101   20695.212.8   1414.887.2   2147100.0100.0
  交叉验证计数%   0101   20695.212.8   1414.887.2   2147100.0100.0
a 交叉验证只对分析中的病例进行。在交叉验证中,每个病例都根据除该病例之外的所有病例得出的函数分类。
b 原始分组的病例中89.7%正确分类。
c 交叉验证的分组病例中89.7%正确分类。
这好于只用探针7分类病理学家3的数据,显示如下:
只使用探针7对病理学家3的数据的分类结果
  预测组成员   总数
  诊断(UCLA)   0   1
  原始计数%   0101   20895.217.0   1394.883.0   2147100.0100.0
  交叉验证计数%   0101   20895.217.0   1394.883.0   2147100.0100.0
a 交叉验证只对分析中的病例进行。在交叉验证中,每个病例都根据除该病例之外的所有病例得出的函数分类。
b 原始分组的病例中86.8%正确分类。
c 交叉验证的分组的病例中86.8%正确分类。
(c)结论
这产生了基于7和16的两探针分类器优于单独的探针7的信心。
(2)关于用看不见的数据检测的报告——鉴别组
(a)背景
以下报告的是利用LDF用病理学家1和病理学家2的数据设计,并用看不见的病理学家3的数据检验的分类器的表现。设计阶段的病例数相对较少,试验数据的数量也较小,因此在第一组与第二组的表现之间可以预期良好的变异性程度。
(b)方法
在SPSS中,建立在题为“模式识别”的章节中获得的标准判别函数,对于所有5类癌症,对病理学家3的数据进行检测。
(c)结果
间皮瘤LDF=探针3sc*.385-探针12s*.317+探针16s*1.006。
分类结果
  预测组成员   总数
 间皮瘤=1其它=0   0   1
  原始计数%  0101   38195.012.5   275.087.5   408100.0100.0
  交叉验证计数%  01   381   27   408
  01   95.012.5   5.087.5   100.0100.0
a 交叉验证只对分析中的病例进行。在交叉验证中,每个病例都根据除该病例之外的所有病例得出的函数分类。
b 原始分组的病例中93.8%正确分类。
c 交叉验证的分组的病例中93.8%正确分类。
小细胞癌LDF=探针12s*.575-探针20s*.408-探针22s*.423+探针23s*.344.
分类结果
  预测组成员   总数
 小细胞癌=1其它=0   0   1
  原始计数%  0101   39192.916.7   357.183.3   426100.0100.0
  交叉验证计数%  0101   39192.916.7   357.183.3   426100.0100.0
a 交叉验证只对分析中的病例进行。在交叉验证中,每个病例都根据除该病例之外的所有病例得出的函数分类。
b 原始分组的病例中91.7%正确分类。
c 交叉验证的分组的病例中91.7%正确分类。
鳞状细胞癌LDF=-探针1sc*.328-探针2sc*.295+探针3sc*.741+探针24s*.490+探针25s*.393+探针26s*.426。
分类结果
  预测组成员   总数
 鳞状细胞癌=1其它=0   0   1
  原始计数%  0101   31288.618.2   4911.481.8   3511100.0100.0
  交叉验证计数%  0101   31288.618.2   4911.481.8   3511100.0100.0
a 交叉验证只对分析中的病例进行。在交叉验证中,每个病例都根据除该病例之外的所有病例得出的函数分类。
b 原始分组的病例中87.0%正确分类。
c 交叉验证的分组的病例中87.0%正确分类。
大细胞癌LDF=探针1sc*.847+探针7sc*.452。
分类结果
  预测组成员   总数
 大细胞癌=1其它=0   0   1
  原始计数%  0101   23460.544.4   15539.555.6   389100.0100.0
  交叉验证计数%  0101   23460.544.4   15539.555.6   389100.0100.0
a 交叉验证只对分析中的病例进行。在交叉验证中,每个病例都根据除该病例之外的所有病例得出的函数分类。
b 原始分组的病例中59.6%正确分类。
c 交叉验证的分组的病例中59.6%正确分类。
用极少量大细胞癌病例设计并检验的分类器具有较低但是有用的表现,因此该结果仍然是非常令人鼓舞的。
腺癌LDF=-探针4sc*.515+探针5sc*.299-探针14s*.485-探针19s*.347+探针20s*.723+探针25s*.327-探针27s*.327。
分类结果
  预测组成员   总数
 腺癌=1其它=0   0   1
  原始计数%  0101   29085.3.0   51414.7100.0   3414100.0100.0
  交叉验证计数%  0101   29085.3.0   51414.7100.0   3414100.0100.0
a 交叉验证只对分析中的病例进行。在交叉验证中,每个病例都根据除该病例之外的所有病例得出的函数分类。
b 原始分组的病例中89.6%正确分类。
c 交叉验证的分组的病例中89.6%正确分类。
(d)结论
非常令人鼓舞地注意到,这些分类器的表现经受住了使用看不见的数据的检验。这在检测各种癌症的能力方面获得了极大的信心。
(3)对不同患者和病理学家的数据的训练和检验
作为“最终最终的”可靠性检验,LDF用病理学家1和病理学家2检查的数据训练。其中除去了病理学家3检查的数据。因此,对病理学家3检查的数据加病理学家1的数据的检验没有偏性。以前,通过使用来自同一名患者的数据进行检验和训练,该检验方法有偏性。
除了不包括在内的探针4以外,LDF产生同一组特征。LDF=探针1sc*.288+探针7sc*.846-探针15s*.249-探针16s*.534。
分类结果
曲线下面积=.977
  预测组成员   总数
  诊断(UCLA)   0   1
  原始计数%   0101   209100.019.6   037.080.4   2046100.0100.0
  交叉验证计数%   0101   209100.019.6   037.080.4   2046100.0100.0
a 交叉验证只对分析中的病例进行。在交叉验证中,每个病例都根据除该病例之外的所有病例得出的函数分类。
b 原始分组的病例中86.4%正确分类。
c 交叉验证的分组的病例中86.4%正确分类。
单独使用探针7用病理学家3的数据获得一个合理的但是类似的结果,但是曲线下的面积较小。
分类结果
曲线下面积=.908
  预测组成员   总数
  诊断(UCLA)   0   1
  原始计数%   0101   19795.015.2   1395.084.8   2046100.0100.0
  交叉验证计数%   0101   19795.015.2   1395.084.8   2046100.0100.0
a 交叉验证只对分析中的病例进行。在交叉验证中,每个病例都根据除该病例之外的所有病例得出的函数分类。
b 原始分组的病例中87.9%正确分类。
c 交叉验证的分组的病例中87.9%正确分类。
II.结肠直肠癌
肠上皮肿瘤是全世界发病率和死亡率的一个主要原因。结肠(包括直肠)比体内的其它任何器官荷生更多的原发性肿瘤。结肠直肠癌在癌症杀手中排行第2,仅次于支气管癌。腺癌占结肠直肠癌的大多数,占胃肠(GI)道中产生的所有恶性肿瘤的70%。对于良性或恶性肿瘤,小肠是一个不常见的部位,尽管分裂的粘膜细胞具有极大的长度和巨大池(pool)。(Crawford,J.M.,The Gastrointestinal Tract,RobbinsPathologic Basis of Disease,R.S.e.a.Cotran,Editor.1999,W.B.Saunders Company:Philadelphia.p.775-843)。
结肠直肠癌的峰发病率在60-79岁的患者年龄范围。不到20%的病例发生在50岁之前。当在年轻人中发现结肠直肠癌时,必须怀疑预先存在溃疡性结肠炎或息肉综合征之一。结肠直肠癌分布于全世界。在美国和东欧国家发现最高的死亡率,比墨西哥、南美和非洲的死亡率高可达10倍。环境因素,特别是饮食习惯,与这种明显的地域差别有关。另外,许多研究将肥胖症和身体不运动视为结肠癌的危险因素。(Crawford,J.M.,The Gastrointestinal Tract,Robbins Pathologic Basisof Disease,R.S.E.A.Cotran,Editor.1999,W.B.Saunders Company:Philadelphia.p.775-843)。
大肠中发现的几乎所有的癌症(98%)都是腺癌。实际上所有结肠直肠癌都显示遗传改变,包括腺瘤性结肠息肉病(APC)中的E-钙粘蛋白和β-连环蛋白;遗传性非息肉性结肠癌(HNPCC)中的人类错配修复基因、hMSH2、hMLH1和hPMS2;以及K-ras和p53基因的突变。(Crawford,J.M.,The Gastrointestinal Tract,Robbins Pathologic Basis of Disease,R.S.E.A.Cotran,Editor.1999,W.B.Saunders Company:Philadelphia.p.775-843)。早期诊断结肠直肠癌是医学专业人员的主要挑战之一,因为这些癌具有非特异的临床症状,如疲劳、贫血、腹痛和血便。当前主要的诊断方法是目视检查是否存在肿瘤块的结肠镜检查。然而,有一种侵入性方法,它涉及患者的结肠准备和整个过程中的麻醉,以使其无意识。患者的顺应性是一个主要问题并不令人吃惊。遗憾的是,可以采用的大便潜血试验或Guaic试验不够特异。因此,当前对结肠直肠癌的检测方法,如结肠镜检查或乙状结肠镜检查,由于方法的侵入性、准确性的相对缺乏和较差的患者顺应性,已经证明是不当的筛查工具。此外,非侵入性大便潜血试验(FOBT)不是有效的,并且缺乏灵敏度或特异性。
结肠直肠癌的分子诊断受到更多的关注,因为大多数这类癌症具有遗传异常。在这些技术中,广泛使用免疫组化(IHC)和免疫细胞化学(ICC)评价结肠直肠的癌发生。已经发现有多种结肠直肠肿瘤标记可以帮助医生及时、准确地做出诊断,并提供明显更好的患者管理。遗憾的是,这些前列腺肿瘤标记都不是具有高灵敏度和特异性的“魔术子弹”。因此,提高诊断准确性的备选方法是必要的。
提高诊断准确性的一个备选方法是发展一个探针组,其包含多种探针,每个探针特异地结合与结肠直肠癌有关的一种标记。所有候选探针都用ICC技术检测。在一些实施方案中,可以从结肠洗涤物中获得标本。尽管从结肠洗涤物中获得的细胞学标本通常比组织切片含有更少的细胞,但是使用高质量的多克隆或单克隆抗体可以确保良好的测定表现。在一些实施方案中,试验载玻片可以如下制备:在检测实际患者标本之前,将肿瘤细胞掺入细胞悬液中。在其它一些实施方案中,通过研究变量(如年龄、性别、诊断、肿瘤分级、肿瘤大小、临床阶段等)尽可能密切匹配的患者,可以克服由于结肠洗涤物通常比组织切片含有更少细胞导致的限制。
一旦采集到标本,即对该标本进行处理和分析。如以上对于肺癌所述,利用统计学分析设计探针组。在一些实施方案中,在处理过程中可能发生技术问题,如粗洗过程中细胞涂片或沉淀不与载玻片附着。然而,通过软件操作或者修改染色方案缓解这些问题,能够容易地解决这些问题。在一些实施方案中,利用一种自动采样标本并为诊断制备载玻片的装置处理并分析标本。预计最初将使用多种探针。为了保持高水平的灵敏度和特异性,应当为适当大小的探针组修剪探针的数量。最终探针的选择以预先确定的染色阳性肿瘤细胞的百分比阈值为基础。将利用复杂的统计学分析进行这些测定。由于检测恶性肿瘤的探针组测定法适用于实体瘤,并且在不同探针组中含有几种相同的肿瘤标记,所以该方法可以平行以及连续进行。这样,能够加快测定发展过程。
与具有5种亚型(腺癌、鳞状细胞癌、小细胞癌、大细胞癌、间皮瘤)的肺癌相比,结肠直肠上皮肿瘤主要是腺癌。这使得结肠直肠肿瘤探针组能够特异地只针对一种癌症类型。因为可以对活检或结肠切除组织检测该探针组,因此不需要大量细胞学标本。
探针/标记文库
检查了包括关于癌症标记信息的不同来源。利用20%或更高的乳腺癌阳性率作为任意标准为检测和/或诊断乳腺癌的一个优选探针组选择探针。术语“20%或更高的阳性率”是指如果研究100个肿瘤病例,则20个或者更多的病例显示存在各种标记,其余的80个或者更少病例显示不合标记。一个优选探针组可能包括选自下列的分子标记:AKT、β-连环蛋白、脑型糖原磷酸化酶(BPG)、小窝蛋白-1、CD44v6、cFLIP、Cripto-I、双调蛋白、细胞周期蛋白D1、环加氧酶(COX-2)、细胞角蛋白20(CK20)、癌胚抗原(CEA)、E-钙粘蛋白、Bcl-2、Bax、hMLH1、hMSH2、表皮生长因子受体(EGFR)、Ephrin-B2(Eph-B2)、Ephrin-B4(Eph-B4)、FasL、HMGI(Y)、Ki-67、溶菌酶、基质溶解因子(MMP-7)、p16、p68、成视网膜细胞瘤(Rb)、cdk2/cdc2、S100A4、YB-1和p53。下文中提供了关于本实施例使用的探针/标记文库的简述。
AKT
这是一种具有强抗凋亡活性的原癌基因。这种丝氨酸-苏氨酸激酶在大量恶性肿瘤中过量表达。Roy等人表示,正常结肠粘膜和增生性息肉不显示明显的AKT表达,这与在结肠直肠癌(57%阳性)中所见的明显的AKT免疫反应性截然不同。另外,在57%的腺瘤中也检测到AKT,表明该原癌基因的过量表达是结肠癌发生过程中的一个早期事件。(Roy,H.K.等人,KT原癌基因过量表达是散发结肠癌症发生过程中的早期事件,Carcinogenesis,2002.23(1):p.201-5)。
β-连环蛋白
肿瘤抑制基因,腺瘤性结肠息肉病(APC),在80%的散发性结肠直肠癌中检测到。它们存在于较小的腺瘤中,甚至具有瘤形成危险的最小损伤中,发育异常的隐窝病灶中。APC基因产物调节细胞内β-连环蛋白。研究表明,突变的APC导致更新率降低,并且导致β-连环蛋白积累。Herter等人不仅在大多数病例中发现了表达水平线性增加的β-连环蛋白,而且发现了来自腺瘤的β-连环蛋白对于癌的不同定位。在轻度和中度发育异常的腺瘤中,β-连环蛋白只存在于核中。在重度发育异常的腺瘤和癌中,它存在于细胞质和核中。在正常的结肠粘膜中,细胞-细胞边界膜和细胞质内只有弱染色。这些结果对于诊断和临床目的可能至关重要,因为核存在β-连环蛋白可能是结肠直肠恶变的最早的分子证据。(Herter,P.等人,β-连环蛋白在腺瘤、癌和P-J息肉中的细胞内分布,J Cancer Res Clin Oncol,1999,125(5):p.297-304)。
脑型糖原磷酸化酶(BPG)
脑型糖原磷酸化酶(BPG)是一种独特的肠恶性肿瘤标记。它有三个主要的同种型:肌肉、肝和脑。以前通过免疫组织化学(IHC)技术曾经证实胃癌与BPG的异常表达有关。Tashima等人的一项新研究通过IHC第一次证实BPG存在于83%的结肠直肠癌中。更令人感兴趣的是,远部位的正常结肠粘膜是BPG阴性的,而与肿瘤相邻的看起来正常的粘膜明显是阳性的。(Tashima,S.等人,脑型糖原磷酸化酶的表达是人结肠癌的癌症发生中可能的新早期生物标记,Am J Gastroenterol,2000.95(1):p.255-63)。
小窝蛋白-1
它是质膜的囊状内陷——细胞膜穴样凹陷的一种主要结构蛋白。研究表明,小窝蛋白家族成员含有一个共同的结构域,称为小窝蛋白支架,它用来组织信号分子,包括G-蛋白、Ha-ras、Src-家族酪氨酸激酶和表皮生长因子受体(EGFR)。体外和体内动物实验证明小窝蛋白-1在细胞转化和乳腺癌发生中有抑制作用,其它研究,包括人乳腺癌和前列腺癌的研究,显示小窝蛋白-1表达与肿瘤发生和进展有正相关,提示有肿瘤促进功能。Fine等人利用IHC的研究表明,88%的结肠腺癌是小窝蛋白-1阳性的。(Fine,S.W.等人,结肠腺癌中小窝蛋白-1的增高表达,AmJ Clin Pathol,2001.115(5):p.719-24)。
CD44v6
这是一种广泛表达的细胞表面糖蛋白,可能与细胞-细胞和细胞-基质相互作用有关。丰富的CD44存在于正常上皮和造血来源的细胞上。相反,以其它方式剪接的CD44变体(CD44v)主要在上皮来源的细胞和肿瘤上表达。几篇报道证实了明基结肠直肠癌有CD44v6的表达。Ishida利用IHC技术研究了63例结肠直肠癌患者,发现59%的病例是CD44v6阳性的。正常结肠粘膜是CD44v6阴性的。(Ishida,T.,结肠直肠腺癌中CD44变体6的免疫组化表达,Surg Today,2000.30(1):p.28-32)。
细胞FLICE-样抑制蛋白(cFLIP)
细胞FLICE-样抑制蛋白(cFLIP)是Fas-介导的凋亡的一种内源抑制调节剂。尽管cFLIP的生理功能尚未阐明,但是它与包括肿瘤在内的疾病的致病关系已经受到怀疑。而且,最近报道cFLIP的过量表达导致肿瘤细胞逃避T细胞免疫,并且可能与肿瘤建立和生长有关。Ryu等人证实,100%(52/52)的结肠腺癌为cFLIP阳性。正常结肠上皮、腺瘤性息肉的染色强度更低。(Ryu,B.K.等人,cFLIP(L)在结肠腺癌中增加的表达,J Pathol,2001.194(1):p.15-9)。
Cripto-I和双调蛋白
Cripto-I(CR-I)和双调蛋白(AR)是表皮生长因子(EGF)-相关肽。有几篇报道已经证实,AR和CR-I在体外在人结肠上皮细胞中作为自分泌生长因子起作用。此外也已经证明,AR和CR-I在大多数人原发结肠癌中表达。具体而言,通过IHC在接近70%的人结肠腺瘤和癌中发现AR或CR-I蛋白的过量表达。(De Angels,E.等人,在来自高危肠癌家族的肠粘膜中表达双调蛋白,Int J Oncol,1999.14(3):p.437-40)。
细胞周期蛋白D1
该蛋白质在细胞增殖中起重要作用。细胞周期蛋白D1的突变和/或表达改变与瘤形成有关。在食道癌、头癌、颈癌、肝癌、乳腺癌和结肠直肠癌中观察到细胞周期蛋白D1表达增强。Arber等人的一项研究揭示,在30%的结肠直肠腺癌和34%的腺瘤性息肉中细胞周期蛋白D1染色增强,但是在增生性息肉或正常粘膜中未见增强。(Arber,N.等人,细胞周期蛋白D1的表达增加是多阶段结肠直肠癌中的早期事件,Gastroenterology,1996.110(3):p.669-74)。
环加氧酶(COX-2)
这是一种与花生四烯酸代谢有关的前列腺素合酶。由于有证据表明非类固醇类抗炎药(NSAIDs)对结肠直肠癌有肿瘤抑制作用,环加氧酶已经受到关注,因为NSAIDs的肿瘤抑制作用似乎可能是由于它们的COX-2活性降低。Sakuma等人证实38%的结肠直肠癌为COX-2阳性。癌组织区比非癌组织区的COX-2染色更强。在一些标本中,靠近癌的组织比远离癌的组织染色更强。(Sakuma,K.等人,环加氧酶(COX)-2对p53的免疫活性和关系以及Ki-67在结肠直肠癌中的表达,JGastroenterol,1999.34(2):p.189-94)。
细胞角蛋白20(CK 20)和癌胚抗原(CEA)
它们是众所周知的结肠直肠癌标记。在许多学术文章中有报道。即使它们不是结肠直肠肿瘤特异的,但是Lagendijk等人的一项研究揭示免疫组化CK 20和CEA是区别向卵巢转移的结肠腺癌与乳腺癌和原发性卵巢癌的两种重要的鉴别标记。(Lagendijk,J.H.等人,原发性卵巢腺癌与结肠和乳腺源的卵巢癌转移之间的免疫组化区别:统计学和推测的比较,J Clin Pathol,1999.52(4):p.283-90)。
E-钙粘蛋白、p53、Bcl-2、Bax、hMLH1、hMSH2
Kapiteijn等人和Bukholm等人在不同的研究中发现了大量与结肠直肠癌的肿瘤生成有关的癌基因和肿瘤抑制基因。在肿瘤细胞中,E-钙粘蛋白、p53、Bcl-2、Bax均显示超过20%的免疫染色。错配修复基因hMLH1和hMSH2也显著增加。这些修复基因与DNA复制期间的遗传“校读”有关,因此被称为看护基因(aretaker gene)。已经证明这些基因的突变与胃肠恶性肿瘤的早期发展有关。(Kapiteijn,E.等人,结肠对直肠癌中癌症发生的机制,J Pathol,2001.95(2):p.171-8;Bukholm,I.K.和J.M.Nesland,在人结肠癌中p53、p21(WAF1/CIP1)、bcl-2、Bax、细胞周期蛋白D1和pRb的蛋白质表达,Virchows Arch,2000.436(3):p.224-8)。Yantiss等人表示,p53和E-钙粘蛋白是区别含有错位上皮的腺瘤与攻击性腺癌的腺瘤的两种标记,表明这两种标记对于结肠直肠细胞有特异性。(Yantiss,R.K.等人,MMP-1、p53、E-钙粘蛋白和胶原IV免疫组化染色在带有错置上皮的腺瘤与带有入侵性腺癌的腺瘤的分化诊断中的用途,Arn J Surg Pathol,2002.26(2):p.206-15)。这些标记是几乎所有实体瘤所共有的。
表皮生长因子受体(EGFR)
表皮生长因子是一种170-道尔顿的跨膜细胞表面受体。它与c-erbB-2、c-erbB3和c-erbB4一起具有酪氨酸激酶活性,由c-erb-B原癌基因编码。嵌合抗EGFR单克隆抗体是研究的一种针对晚期结肠腺癌的疗法。在包括结肠直肠癌、肺鳞状细胞癌、头癌、颈癌、子宫颈癌、乳腺癌、前列腺癌和膀胱癌在内的许多实体瘤中发现EGFR水平升高。Goldstein等人的一项研究表明,75%的结肠腺癌为EGFR免疫组化阳性(Goldstein,N.S.和M.Armin,在带有AJC癌症IV期结肠腺癌患者中表皮生长因子受体免疫组化反应性:对标准化评分系统的影响,Cancer,2001.92(5):p.1331-46)。
Ephrin-B2(Eph-B2)和Ephrin-B4(Eph-B4)
产生促红细胞生成素的扩增序列(Eph)家族是受体酪氨酸激酶(RTKs)的最大的亚家族。Eph-B2和B4是可与Eph结合的配体。ephrin-Eph系统在胚胎学发育和神经及血管系统分化中至关重要。有几项研究表明,ephrins的高表达可能与肿瘤生长、致肿瘤性和转移的可能性增加有关。利用免疫组合化分析,Liu等人表明,Eph-B2和Eph-B4在100%(515)的研究病例中比相邻的正常粘膜有更高的染色强度。(Liu,W.等人,Ephrin-B及其受体在结肠腺癌中的共表达,Cancer,2002.94(4):p.934-9)。
FasL
它是肿瘤坏死因子超家族的一个跨膜蛋白成员,诱导表达其受体Fas(CD90/APO-I)的凋亡敏感细胞的细胞死亡。已经广泛证实,FasL在几种癌症类型中上调。另外,体外和体内研究也表明,FasL能够使癌细胞产生Fas反击,通过在抗肿瘤免疫效应细胞中诱导凋亡损害免疫应答。这些发现提示,癌细胞表达FasL可能是抑制抗肿瘤免疫应答的一个重要因素。Belluco等人表示,FasL的表达是癌和结肠直肠肿瘤发生中的一个相对早期的事件。在28%的增生性息肉、76%的低等级和93%的高等级息肉中可见FasL表达(Belluco,C.等人,Fas配体在结肠直肠癌序列中上调,Eur J Surg Oncol,2002.28(2):p.120-5)。结果与如下其它发现一致:在81%的癌和41%的腺瘤中检测到FasL表达。而且,高等级的发育异常腺瘤比低等级的腺瘤明显更频繁地表达FasL。
HMGI(Y)
蛋白质HMG-I、HMG-Y和HMGI-C组成了高迁移率组I蛋白质家族。前两种蛋白质由同一基因HMGI(Y)编码,通过另外的剪接,HMGI-C是一种不同基因的产物。HMGI基因与良性和恶性肿瘤的产生有关。以前的报道表明,HMGI(Y)蛋白在结肠癌细胞系和组织中丰富表达,但在正常结肠粘膜中不大量表达。Chiappetta等人发现,根据IHC,36例结肠直肠癌均为HMGI(Y)阳性,而在正常结肠粘膜中未检测到表达。腺瘤中的HMGI(Y)表达与细胞非典型程度密切相关。检测的18例非肿瘤息肉中只有2例是HMGI(Y)阳性的。(Chiappetta,G.等人,在人结肠直肠增生性和瘤性疾病中高迁移率组/蛋白质HMGI(Y)的表达,IntJ Cancer,2001.91(2):p.147-51)。这些结果表明,HMGI(Y)蛋白诱导与结肠细胞的早期肿瘤转化有关,很少与结肠细胞的过度增殖有关。
Ki-67
Ki-67是一种细胞增殖核标记。在包括结肠直肠癌在内的多种肿瘤中表达。Sakuma等人的一项研究证明,48%的结肠直肠癌是Ki-67阳性的。(Sakuma,K.等人,结肠直肠癌中环加氧酶(COX)-2免疫反应性和与p53的关系以及Ki-67表达,J Gastroenterol,1999.34(2):p.189-94)。
溶菌酶
溶菌酶是一种具有广谱抗菌活性的酶。它存在于大量人组织液和分泌物中,包括唾液、眼泪、mils、血清和胃液及小肠液。溶菌酶在正常结肠上皮中不存在。有意思的是,大量免疫组化研究证实,在胃腺瘤和腺癌的肿瘤细胞中有溶菌酶表达。许多研究表明,结肠癌的溶菌酶阳性率为28%-80%,而与腺癌相邻的正常结肠腺不显示任何溶菌酶蛋白表达。(Yuen,S.T.等人,在结肠腺瘤和腺癌中溶菌酶的产生上调,Histopathology,1998.32(2):p.126-32)。
基质溶解因子
基质溶解因子是MMP基因家族的一员,对一系列底物(如胶原、蛋白聚糖、弹性蛋白、层粘连蛋白、纤连蛋白和酪蛋白)有蛋白水解活性。它是恶性肿瘤细胞产生的,如食道癌、结肠直肠癌、胃癌、头癌、颈癌、肺癌、前列腺癌和肝细胞癌。免疫组化研究表明,基质溶解因子的表达与胃癌及结肠直肠癌中的节点或远端转移显著相关。Masaki等人的一项研究表明,34%的结肠直肠癌是基质溶解因子阳性的。(Masaki,T.等人,基质溶解因子(MMP-7)作为早期侵入性结肠直肠癌恶变潜能的明显决定因素,Br J Cancer,2001.84(10):p.1317-21)。
p16
它是一种细胞周期抑制剂和一种主要的肿瘤抑制蛋白。在人结肠肿瘤的一个亚类中启动区被甲基化的发现提示p16在肠肿瘤形成中的作用。Dai等人表明,在正常粘膜中以及在28例原发性结肠癌中的18例中和5例转移结肠癌中的5例中p16的表达极低。另外,p16染色与Ki-67、细胞周期蛋白A和成视网膜细胞瘤蛋白的染色反相关,提示细胞周期进展受到抑制。(Dai,C.Y.等人,p16(INK4a)表达开始于人结肠癌早期且与细胞增生标记反相关,Gastroenterology,2000.119(4):p.929-42)。
p68
这是一种干扰素诱导型蛋白质激酶,它是病毒和细胞蛋白合成调节中的一种关键因子。其表达与正常和肿瘤细胞型中的细胞分化有关。Singh等人发现,76%的结肠直肠癌患者为p68阳性。正常结肠粘膜显示弱p68染色。高p68表达证明有生存率提高的趋势。表达高水平(3-4+)p68的肿瘤的患者比低表达患者的5年生存率更高。(Singh,C.等人,人结肠癌中p68的表达,Tumour Biol,1995.16(5):p.281-9)。
Rb和cdl/cdc7
成视网膜细胞瘤(Rb)基因是一种肿瘤抑制基因,它的产物pRB已知作为细胞周期的一种负调节剂。尽管基因改变导致的pRB表达缺乏被认为引起几种恶性肿瘤的发生,包括骨肉瘤和肺癌、乳腺癌和膀胱癌。相反,据报道结肠直肠癌显示该基因不常见地失活,Southern印迹分析证实在接近30%的结肠直肠癌中有Rb基因扩增。Yamamoto等人通过Western blot研究了Rb及其相关激酶cdk2和cdc2,发现结肠直肠癌中cdk2/cdc2以及pRB的过度磷酸化形式水平升高。此外,免疫组化研究也表明,cdc2/cdc2只在pRB阳性的癌细胞中表达。这些结果提示,结肠直肠癌中cdk2/cdc2表达增强可能阻止pRB通过磷酸化阻碍细胞周期。(Yamamoto,H.等人,cdk2/cdc2和成视网膜细胞瘤基因产物在结肠直肠癌中的共表达,Br J Cancer,1995.71(6):p.1231-6)。
S100A4
这是一种钙结合蛋白,与细胞无限增殖化、细胞生长、乳房上皮干细胞分化为肌上皮样细胞和纤维形成有关。另外,也报道S100A4在转移肿瘤细胞中特异性表达。Takenaga等人观察到44%的局灶性癌和94%的腺癌是免疫阳性的,而腺瘤没有阳性的。有意思的是,根据侵入深度,免疫阳性细胞的发病率提高,在14例肝转移中,几乎所有癌细胞均为阳性。这些结果提示,S100A4是区别腺瘤与腺癌的一种良好标记,可能与结肠直肠肿瘤细胞的进展和转移过程有关。(Takenaga,K.等人,人结肠直肠腺癌中S100A4(转移相关基因)的表达增加,ClinCancer Res,1997.3(12Pt1):p.2309-16)。
Y-盒结合蛋白(YB-1)
Y-盒结合蛋白(YB-1)是含有高度保守的冷休克结构域并且可与反向CCAAT盒(Y盒)相互作用的DNA结合蛋白家族的一员。YB-1在许多细胞型中表达,与不同细胞增殖相关基因的调节有关。它也在顺铂抗性癌细胞系中过量表达,提示除了作为转录因子的作用以外,YB-1还可能与DNA修复或DNA损伤应答有关。Shibao等人表示,与正常粘膜相比,在几乎所有结肠直肠癌病例中YB-1均过量表达。(Shibao,K.等人,YB-1和DNA拓扑异构酶IIα基因在人结肠直肠癌中的共表达增加,Int J Cancer,1999.83(6):p.732-7)。
结肠直肠癌探针组的应用
结肠直肠癌探针组不仅含有早期检测结肠直肠癌的标记,而且含有评价转移能力和预后的标记。例如,阳性CEA(癌胚抗原)反应与结肠直肠癌的分化等级有明显的关系,而该抗原的弥散性细胞表达通常表示肿瘤扩大超过了肠壁,并且侵入淋巴管。表达的组织抗原数量与肿瘤通过肠壁扩散的程度明显相关(Lorenzi,M.等人,结肠直肠癌中免疫组化发现物的组织病理学和预后评价,Int J Biol Markers,1997.12(2):p.68-74)。血清CEA水平和p53蛋白的表达也提供了补充的关于结肠直肠癌的预后信息。p53的阳性免疫染色和升高的CEA水平与低积累无瘤生存率有关,已经证实具有独立的预后重要性(Diez,M.等人,癌症发生抗原和p53蛋白在结肠直肠癌中的预后效果之时间依赖性,Cancer,2000.88(1):p.35-41)。Nasierowska-Guttmejer 及同事(Nasierowska-Guttmejer,A.,在用手术治疗或操作前放化疗处理的直肠癌中免疫组化增生和凋亡标记的比较,Pol J Pathol,2001.52(1-2):p.53-61)表示,Ki-67的低表达和高水平的Bax表达与全部或接近全部的结肠直肠癌对治疗的反应和肿瘤块的消退有关。然而,不到三分之二的病例与p53、MIB1、bax和bcl-2的低表达有关。另外一项研究表明,较高的p53和Ki67值与预后较差的组织病理学特征有关(Saleh,H.A.,H.Jackson和M.Banerjee,bcl-2和p53癌蛋白的免疫组化表达:与K167增生指数和预后组织病理参数的相关性,ApplImmunohistochem Mol Morphol,2000.8(3):p.175-82)。另外也证明结肠直肠癌中细胞周期蛋白D1、CD4Av6和基质溶解因子(MMP-7)的表达与高复发率、低无复发生存率和总体上较差的生存率有关(McKay,J.A.等人,结肠直肠肿瘤中关键细胞周期校验蛋白的分析,J Pathol,2002.196(4):p.386-93;Ropponen,K.M.等人,CD44及其变体蛋白在人结肠癌中的表达及其与预后的相关性,Scand J Gastroenterol,1998.33(3):p.301-9;Bhatavdekar,J.M.等人,分子标记是患有Duke B和DukeC直肠结肠腺癌患者复发和存活的预示剂,Dis Colon Rectum,2001.44(4):p.523-3;Adachi,Y.等人,在人结肠直肠癌侵入前线基质溶解蛋白的临床病理和预后显著性,Int J Cancer,2001.95(5):p.290-4)。研究也证实,结肠直肠癌中p53、MMP-7、β-连环蛋白表达增强和E-钙粘蛋白表达减少与它们的转移能力的提高有关(Zeng,Z.S.等人,基质金属蛋白-7在结肠直肠癌肝转移中表达:MMP-7活化参与人癌症转移的证据,ClinCancer Res,2002.8(1):p.144-8;Ikeguchi,M.等人,E钙粘蛋白表达和癌症核增大与结肠直肠生血性转移强烈相关,Scand J Gastroenterol,2000.35(8):p.839-46;Sory,A.等人,p53真得在早期侵入性结肠直肠腺癌中引起转移?Eur J Surg,1997.163(9):p.685-92;Hiscox,S.和W.G.Jiang,E-钙粘蛋白、α、β和γ连环蛋白在人结肠直肠癌中的表达,Anticancer Res,1997.17(2B):p.1349-54)。因此,结肠直肠探针组将具有诊断和预后价值,并提供指导临床治疗的患者危险分级。
优选的探针/标记
用于检测和/或诊断结肠直肠癌的一个优选探针组包括以上所列的一种或多种肿瘤标记。用于检测和/或诊断结肠直肠癌的一个更优选的探针组包括一种或多种选自β-连环蛋白、E-钙粘蛋白、hMSH2、hMLH1、p53和细胞角蛋白20的肿瘤标记。实际上所有结肠直肠癌都显示遗传改变,从而提供早期检测的机会。E-钙粘蛋白和β-连环蛋白与APC(腺瘤性结肠息肉病)肿瘤抑制基因密切相互作用。APC基因的一种缺陷与FAP(家族性腺瘤性息肉病)和加德纳综合征有关,具有极高的结肠直肠癌发病率。结肠直肠癌中的另外一种遗传改变涉及DNA修复基因。两种重要的错配修复基因hMSH2和hMLHI负责DNA复制过程中的“校读”。另外一种标记p53位于染色体17上,70%以上的结肠直肠癌在染色体17p处丢失。细胞角蛋白20(CK20)在结肠直肠癌中一直表达,当与阴性细胞角蛋白7(CK7)染色组合时,该组合(CK20+/CK7-)对于结肠直肠癌是高度特异的(Chu,P.,E.Wu和L.M.Weiss,细胞角蛋白7和20在上皮癌中的表达:435例调查,Mod Pathol,2000.13(9):p.962-72)。这些肿瘤标记对于结肠直肠癌的重要性在下文详述。
β-连环蛋白
导致家族性腺瘤性息肉病(FAP)和加德纳综合征的遗传缺陷已经对APC肿瘤抑制基因位点5q21作图。APC蛋白与细胞粘附分子复合物中的细胞骨架蛋白连环蛋白结合,该复合物包括细胞间粘附分子E-钙粘蛋白。β-连环蛋白也能够作为一种癌基因。当它不与E-钙粘蛋白结合(从而参与细胞-细胞粘附)时,β-连环蛋白与被称为T细胞因子-淋巴增加因子(Tcf-Lef)蛋白的一个t-家族蛋白质配偶体结合,后者激活其它基因。这种被β-连环蛋白:Tcf复合物激活的基因被认为包括刺激细胞增殖和抑制凋亡的基因。APC与β-连环蛋白结合针对降解,从而抑制β-连环蛋白:Tcf信号传导途径。APC基因中的突变降低了APC蛋白对β-连环蛋白的亲和力,一方面导致细胞间接触丧失,另一方面使β-连环蛋白的细胞质汇集增多。所致Tcf-介导的细胞增殖的增加启动了诱发癌发展的一系列事件(Peifer,M.,β-连环蛋白作为癌基因:无疑铁证Science,1997.275(5307):p.1752-3)。因此,APC被认为是一种“看门”基因。APC中的突变导致FAP,是散发性结肠癌进展中的早期事件,在85%的结肠直肠癌中发现突变(Crawford,J.M.,The Gastrointestinal Tract,Robbins Pathologic Basis of Disease,R.S.e.a.Cotran,Editor.1999,W.B.Saunders Company:Philadelphia,p.775-843)。值得注意的是,没有APC突变的大多数肿瘤显示β-连环蛋白的突变。
hMSH2和hMLH1
与DNA修复有关的所有基因的遗传突变据推断可引起家族性HNPCC综合征。这些错配修复基因FISH2、hMLH1与DNA复制过程中的遗传“校读”有关,因此被称为“看护”基因。在人类基因组中存在50,000~100,000个二核苷酸重复序列,可以根据这些重复序列中存在广布的改变检测错配修复基因中的突变。这被称为微卫星不稳性。遗传有突变DNA修复基因的患者由于剩余的正常等位基因而具有正常的修复活性。然而,某些器官(结肠、胃、子宫内膜)中的细胞容易遭受第二次体细胞突变,使野生型等位基因失活。接着发生可达1000倍于正常的突变率,使得大多数HNPCC肿瘤显示微卫星不稳定性。已经证实这些基因的突变与胃肠癌的早期发展有关(Kapiteijn,E.等人,癌发生在结肠对直肠癌中的机制,J Pathol,2001.195(2):p.171-8;Bulcholm,I.K.和J.M.Nesland,在人结肠癌中p53、p21(WAF1/CIP1)、bcl-2、Bax、细胞周期蛋白和pRb的蛋白质表达,Virchows Arch,2000.436(3):p.224-8)。
p53
在70%-80%的结肠癌中发现染色体17p丢失。这些染色体缺失影响p53基因,提示p53中的突变在结肠癌发生晚期发生。同样众所周知,p53在细胞周期调节中起重要作用。对于结肠癌癌发生提出了一个多次命中(multi-hit)概念的假说。在大约80%的散发性结肠癌中,APC突变通常最早,可能是开始事件,在错配的修复基因中突变的贡献频率较低。在接着由腺瘤发展为癌期间,接着发生其它突变,如染色体17p上和染色体18q上DCC区中p53处的晚期突变或杂合性的丧失(LOH)。基因组的累积改变于是导致肿瘤损伤的大小、发育异常水平和侵入能力逐渐提高(Crawford,J.M.,The Gastrointestinal Tract,Rbbins PathologicBasis of Disease,R.S.e.a.Cotran,Editor.1999,W.B.SaundersCompany:Philadelphia.p.775-843)。
细胞角蛋白20(CK 20)
CK20是一种低分子量的中间丝。由于它的有限范围的表达,它是特别有意义的。CK 20在正常和恶性上皮中一致地表达。表达局限于骨和肠上皮和梅克尔细胞。调查上百种来自不同器官体系的上皮瘤的研究通过免疫组化技术证实,实际上所有结肠直肠癌病例都是CK 20阳性的(Chu,P.,E.Wu和L.M.Weiss,细胞角蛋白7和20在上皮癌中的表达:435例调查,Mod Pathol,2000.13(9):p.962-72)。CK 20/CK 7免疫谱的组合在鉴定细胞学标本中转移肿瘤的原发部位中特别有用。CK 20+/CK7只在结肠直肠是原发部位的细胞块中发现(Blumenfeld,W.等人,细胞角蛋白7和20亚组分析作为鉴别细胞样本中恶变发生的原初位点的辅助,Diagn Cytopathol,1999.20(2):p.63-6)。Ascoli及同事(Ascoli,V.等人,细胞角蛋白20在鉴别渗出物中转移癌的来源中的用途,DiagnCytopathol,1995.12(4):303-8)确定,根据免疫组化,在结肠来源的恶性流出物中一致地可见CK20表达。
在本实施例中使用下列缩写:APC=腺瘤性结肠息肉病,AR=双调蛋白,BGP=脑型糖原磷酸化酶,CD44v6=CD44剪接变体6,CEA=癌胚抗原,CFLIP=细胞FLICE样抑制蛋白,CK=细胞角蛋白,COX=环加氧酶,CR-I=Cripto,EGFR=表皮生长因子受体,EphB=产生促红细胞生成素的扩增序列,FasL=Fas配体,FOBT=大便潜血试验,HNPCC=遗传性非息肉病结肠癌,ICC=免疫细胞化学,IHC=免疫组织化学,MLH=人错配修复基因,MMP=基质溶解因子(MMP-7),MSH=人错配修复基因,PLAP=胎盘碱性磷酸酶,Rb=成视网膜细胞瘤,YB=Y盒结合蛋白。
III.膀胱癌
膀胱肿瘤带来了生物学和临床挑战。在美国,过去几年来,这些上皮肿瘤的发生率稳步增长,现在达到每年新发病例超过50000例。尽管对这些肿瘤的检测和管理都有提高,但是死亡人数每年仍然有大约10000例(Crawford,J.M.和R.S.Cortran,The Lower Urinary Tract,Robbins Pathologic Basis of Disease,T.Collins,Editor.1999,W.B.Saunders Company:Philadelphia.p.1003-1008)。当前还没有可靠的方法来筛查和检测膀胱癌。因此,为了降低发病率和死亡率,更好的早期检测膀胱肿瘤的方法是必要的。
95%以上的膀胱肿瘤是上皮来源的,其余的是间质肿瘤。接近90%的上皮肿瘤由移行细胞组成,被称为移行细胞癌(TCC),其余10%是鳞癌和腺癌。在美国TCC是第5位最常见的恶性肿瘤,和第2位最常见的泌尿生殖器癌。TCC被分为两个主要的类别:低等级和高等级。低等级TCCs总是说明正常移行上皮的乳头状、非侵入性损伤。这些病例具有极好的预后。高等级TCCs可能是乳头状、结节性或此两者,显示相当的细胞多形性和间变。它们占膀胱肿瘤的50%,具有转移能力,在诊断10年内使60%的病例死亡(Crawford,J.M.和R.S.Cotran,TheLower Urinary Tract,Robbins Pathologic Basis of Disease,T.Collins,Editor.1999,W.B.Saunders Company:Philadelphia.p.1003-1008)。
尿细胞学是一种常规筛查方法,提供有用的关于高等级膀胱癌的诊断信息(Koss,L.G.等人,排空尿的细胞学的诊断价值,Acta Cytol,1985.29(5):p.810-6)。然而,由于低等级肿瘤缺乏形态学改变,它检测低等级乳头状移行细胞癌(TCC)的能力可靠性较差(Busch,C.等人,上皮膀胱癌的恶变分级:分级的复现性和钳活检、吸出活检与表皮细胞学比较,Scand J Urol Nephrol,1977.11(2):p.143-8;Murphy,W.M.等人,尿细胞学和膀胱癌,瞬时细胞癌的细胞学特征,Cancer,,1984.53(7):p.1555-65;Shenoy,U.A.,T.V.Colby和G.B.Schumann,膀胱上皮癌中尿细胞学诊断的可靠性,Cancer,1985.56(8):p.2041-5)。膀胱镜检查对于患者是侵入性的和令人讨厌的。外部生长的肿瘤通过膀胱镜检查可靠地诊断,但是扁平TCC,特别是原位癌,仍然存在内窥镜检查的困难(Lin,S.等人,细胞角蛋白20作为免疫细胞化学标记用于检测非典型细胞学中的膀胱上皮癌:对档案尿玻片的初步回顾性研究,Cancer Detect Prev,2001.25(2):p.202-9;Heicappell,R.等人,尿膀胱癌抗原作为诊断尿膀胱过渡性细胞癌的标记之评价,Scand J Clin Lab Invest,2000.60(4):p.275-S2)。一般而言,必要时尿细胞学和膀胱镜检查与活检一起使用,以优化诊断的灵敏度。单独或组合的这些试验不足以早期检测或评价复发或疾病的进展。
免疫细胞化学(ICC)普及性增加,因为它是非侵入性的,并且比尿细胞学的灵敏度高。对核基质蛋白(NMP22)和人补体因子H相关蛋白(BTA stat)的尿检已经上市多年,但是对于膀胱镜检查的应用只有有限的影响。NMP22是一种比BTA stat更灵敏的试验,但是它们都有特异性不足和假阳性率的问题(Ramakumar,S.等人,检测膀胱癌的筛选方法之比较,J Urol,1999.161(2):p.388-94;Ross,J.S.和M.B.Cohen,复发膀胱癌的检测:新方法和生物标记,Expert Rev Mol Diagn,2001.1(1):p.39-52)。然而,FDA最近从Matritech中清除了一种改进的NMP22测定,ImmunoCyt。这种新的测定包含两种抗体,与家庭妊娠试验一样工作。其权利要求包括较低的假阳性率,因为该测定不受尿中存在血液的影响,与膀胱镜检查联用可提高诊断准确性。ImmunoCyt是用荧光标记标记的三种肿瘤标记的混合物。它识别一种粘蛋白糖蛋白和由膀胱中肿瘤细胞表达的一种形式的癌胚抗原(CEA)。然而,它用于监测而不是筛查复发的膀胱癌,需要用荧光显微镜检查(Mian,C.等人,Immunocyt:一种检测尿道过渡性细胞癌的新工具,J Urol,1999.161(5):p.1486-9)。
免疫组化(IHC)是临床泌尿科医师最广泛使用的膀胱癌评价方法。已经研究的并且在膀胱癌临床决定方法中发挥作用的大多数肿瘤标记由IHC的应用发展而来(Williams,S.G.,M.Buscarini和J.P.Stein,用于膀胱癌诊断、分级和预后的分子标记,Oncology(Huntingt),2001.15(11):p.1461-70,1473-4,1476;discussion 1476-84)。遗憾的是,用于检测膀胱癌的肿瘤标记都不是具有高灵敏度和特异性的“魔方”。提高诊断准确性的备选方法是必需的。
提高诊断准确性的一个备选方法是发展一个探针组,其包含多种探针,每个探针特异地结合与膀胱癌有关的一种标记。每种候选探针都用IHC或ICC检测。对于ICC,标本通常是尿样。进行ICC而不是IHC的折衷是尿细胞学标本通常比组织切片含有更少的细胞。在一些实施方案中,可以使用高质量的单克隆抗体或多克隆抗体确保测定的良好表现。在其它实施方案中,可以研究在年龄、性别、诊断、肿瘤级别、肿瘤大小、临床阶段等方面尽可能接近的患者。在其它实施方案中,同一患者可以如医学上所说的并尽可能的经常进行尿采集。另外,在检测实际患者标本之前也可以通过将肿瘤细胞掺入细胞悬液中制备载玻片并检测。
标本,对于IHC是福尔马林固定的石蜡包埋的(FFPE)组织,或者对于ICC是尿细胞学,从医疗机构获得。一旦采集到标本,即对该标本进行处理和分析。如以上对于肺癌所述,利用统计学分析设计探针组。在一些实施方案中,在处理过程中可能发生技术问题,如粗洗过程中细胞涂片或沉淀不与载玻片附着。然而,通过软件操作或者修改染色方案缓解这些问题,能够容易地解决这些问题。在一些实施方案中,利用一种自动采样标本并为细胞解释或诊断制备单层的装置处理并分析标本。
预期最初将使用多种探针。为了保持高水平的灵敏度和特异性,应当为适当大小的探针组修剪探针的数量。最终探针的选择以预先确定的染色阳性肿瘤细胞的百分比阈值为基础。将利用复杂的统计学分析进行这些测定。由于检测恶性肿瘤的探针组测定法适用于实体瘤,并且在不同探针组中含有几种相同的肿瘤标记,所以该方法可以平行以及连续进行。这样,能够加快测定发展过程。
为具有高灵敏度和特异性,为适当大小的探针组修剪最初的探针。最终探针的选择以预先确定的染色阳性肿瘤细胞的百分数阈值为基础。一旦确定使用IHC的最终试验组,即通过ICC检测标本。建立的ICC探针将作为一个探针组检测尿液标本。在一些实施方案中将使用自动染色,因此,能够实现标准化,结果的解释也将更加一致。
与具有5种亚型(腺癌、鳞状细胞癌、小细胞癌、大细胞癌、间皮瘤)的肺癌相比,90%以上的膀胱癌被归类为移行细胞癌(TCC)。这使得膀胱肿瘤探针组更具针对一种癌症类型的特异性。另外,膀胱肿瘤的检测和诊断也可以是基于FFPE和/或基于细胞的(尿细胞学)。
探针/标记文库
检查了包括关于癌症标记信息的不同来源。利用20%或更高的乳腺癌阳性率作为任意标准为检测和/或诊断膀胱癌的一个优选探针组选择探针。术语“20%或更高的阳性率”是指如果研究100个肿瘤病例,则20个或者更多的病例显示存在各种标记,其余的80个或者更少病例显示不含标记。一个优选探针组可能包括选自下列的分子标记:BL2-10D1、C-erbB-2、CD44s标准、剪接变体CD44v6、剪接变体CD44v3、小窝蛋白-1、胶原酶、细胞周期蛋白D1、环加氧酶-1(COX-1)、环加氧酶-2(COX-2)、细胞角蛋白20(CK20)、E-钙粘蛋白、表皮生长因子受体(EGFR)、热休克蛋白-90(HSP-90)、IL-6、IL-10、HLA-DR、人类错配修复基因(hMSH2)、Lewis X、MDM2、核基质蛋白22(NMP-22)、p53、PCNA、MIB1(Ki-67)、成视网膜细胞瘤(Rb)、存活素、转化生长因子-1、转化生长因子-β1受体I、转化生长因子-β1受体II和UBC(CK8和CK18)。下文中提供了对本发明使用的探针/标记文库的简述。
BL2-10D1
这是一种IgM抗体。用RT4细胞和人膀胱癌细胞悬液免疫小鼠后产生分泌一种IgM单克隆抗体的杂交瘤细胞(Longin,A.等人,与膀胱癌相关抗原反应的单抗BL2-10D1,Int J Cancer,1989.43(2):p.183-9)。它显示与膀胱肿瘤有强烈的反应性,但是除了5%-10%的伞细胞外,与正常尿路上皮没有反应性。该抗体与大多数1级和2级乳头TCC和原位癌反应,而3级乳头TCC和攻击性非乳头TCC显示较差的反应性。Longin(Longin,A.等人,一种鉴别尿细胞学中肿瘤细胞的有用单抗BL2-10D1,Cancer,1990.65(6):p.1412-7)及同事证明,所有来自低等级(G1)肿瘤患者的尿都用BL2-10D1都染色。2级或3级不总是染色。这些结果提示,BL2-10D1可能被认为是膀胱癌早期检测的一种有价值的标记。
C-erbB-2
c-erbB-2基因编码一种跨膜酪氨酸激酶,后者是肽激素家族的受体。C-erbB-2扩增已经在移行细胞癌中发现。以前的研究发现c-erbB-2与转移以及与肿瘤等级或阶段有关(Ioachim,E.等人,人泌尿膀胱癌中成视网膜细胞瘤基因产物(Rb)、p53蛋白、MDM2、C-erbB-2、HLA-DR的免疫组化表达和增殖系数,Histol Histopathol,2000.15(3):p.721-7)。
CD44标准(CD44s)和剪接变体CD44v6和CD44v3
CD44是一种跨膜细胞表面受体。它与包括细胞-细胞粘附、细胞基质相互作用和肿瘤转移的不同功能有关。对于多种肿瘤已经报道了CD44同种型在肿瘤发展及进展中的重要性。在Masuda等人的研究中(Masuda,M.等人,肾盂和输尿管中过渡性细胞癌中CD44同功型的表达和预后价值,J Urol,1999.161(3):p.805-8;discussion 808-9),CD44s、CD44v6和CD44v3的表达显著降低,与膀胱癌的组织学等级有关。然而,所有这些同种型都在正常尿路粘膜的基底细胞的细胞质膜上强烈表达。然而,正常尿路粘膜的浅层不表达它们。
小窝蛋白-1
在从脂肪细胞和内皮细胞到I型肺细胞和骨骼肌细胞的大量细胞型中富含细胞膜穴样凹陷。已经鉴定了三个组成小窝蛋白家族成员:小窝蛋白-1、小窝蛋白-2和小窝蛋白-3。CAV-1基因已经对染色体7q31作图,作为肿瘤抑制活性的潜在位点具有相当大的科学意义。它可能通过与多种信号转导分子和受体(Src、G蛋白和EGFR)相互作用,与信号传导有关。Rajjayabun(Ioachim,E.等人,人泌尿膀胱癌中成视网膜细胞瘤基因产物(Rb)、p53蛋白、MDM2、C-erbB-2、HLA-DR的免疫组化表达和增殖系数,Histol Histopathol,2000.15(3):p.721-7)第一次证实了CAV-1在高等级膀胱癌中的免疫反应性。
胶原酶
已知胶原酶溶解胶原,修复和维持组织。它由上皮细胞、嗜中性粒细胞、组织细胞和成纤维细胞分泌。胶原酶表达提高与乳腺癌和甲状腺癌有关。RT-PCR研究表明尿路上皮癌中mRNA增多,一项研究证明对于细胞学和组织学标本,分别有34%和45%的TCC患者显示胶原酶表达阳性。良性损伤未见表达(Hattori,M.,E.Ohno和H.Kuramoto,膀胱的过渡细胞癌中胶原酶表达的免疫组化,Acta Cytol,2000.44(5):p.771-7)。
细胞周期蛋白D1
细胞周期蛋白D1基因产物有助于细胞周期G1/S期转变的调节,是一种候选癌基因。已经证明它与原发性膀胱癌的低等级、早期乳头瘤生长有关,提示它在膀胱癌进展中起重要作用(Byrne,R.R.等人,长期随访原位及淋巴结转移的膀胱过渡细胞癌的E-钙粘蛋白免疫染色,J Urol,2001.165(5):p.1473-9)。
环加氧酶-1(Cox-1)和环加氧酶-2(Cox-2)
环加氧酶是催化形成与炎症、免疫应答、致有丝分裂和调亡有关的前列腺素的最初步骤的限速酶。环加氧酶-1(Cox-1)在大多数组织中以相当稳定的水平组成型表达。在炎症过程中,细胞因子、生长因子、癌基因和肿瘤促进剂提高了其诱导型环加氧酶-2(Cox-2)的低基础活性。在胃肠恶性肿瘤以及膀胱癌中已经观察到环加氧酶活性的升高,因此前列腺素水平升高。Bostrom等人(Bostrom,P.J.等人,环加氧酶-1和环加氧酶-2在尿膀胱癌中的体内和体外表达以及在培养的膀胱癌细胞中前列腺素E2合成,Pathology,2001.33(4):p.469-74)证明有弥散的,中度到强烈的Cox-2的细胞质免疫信号,在所有29例膀胱TCC中都检测到。标本中的正常尿路上皮也染色,但是强度较弱。在29个TCC标本的18个中检测到Cox-1染色(62%),但是在18个标本中有16个信号较弱。来自Cox-1的免疫信号只在少数正常标本中检测到,为弱到中度。
细胞角蛋白20(CK 20)
细胞角蛋白20(CK 20)是20种已知的细胞角蛋白之一,是上皮细胞的中间丝的组份。IHC研究表明,CK 20在膀胱上皮癌或泌尿道上皮发育异常患者的膀胱上皮细胞中表达。在正常的泌尿道上皮中,CK 20表达局限于浅表伞细胞。Lin(Lin,S.等人,细胞角蛋白20作为免疫细胞化学标记用于检测非典型细胞学中的膀胱上皮癌:对档案尿玻片的初步回顾性研究,Cancer Detect Prev,2001.25(2):p.202-9)及同事利用ICC证明CK 20在95%的膀胱癌患者中呈阳性,只在10%的正常对照中呈阳性。
E-钙粘蛋白
E-钙粘蛋白在所有上皮组织中表达,并且在鳞状细胞和移行细胞的质膜上发现。E-钙粘蛋白介导的细胞粘附与肿瘤进展和转移有关。对膀胱移行细胞癌中E-钙粘蛋白的IHC研究证明,异常E-钙粘蛋白表达与肿瘤晚期及分化的丧失有关。Byrne等人(Byrne,R.R.等人,长期随访原位及淋巴结转移的膀胱过渡细胞癌的E-钙粘蛋白免疫染色,J Urol,2001.165(5):p.1473-9)证实,有59例(77%)膀胱肿瘤丢失了正常的膜E-钙粘蛋白,而在正常的尿路上皮中发现保留的E-钙粘蛋白表达。
表皮生长因子受体(EGFR)
表皮生长因子是一种强有丝分裂原,它的作用通过与表皮生长因子受体(EFGR)的外部结构域结合来介导。EGFR是一种跨膜蛋白质受体,具有酪氨酸激酶活性。EGFR的细胞质和内部结构域与禽骨髓成红血细胞增多症病毒的癌基因产物(v-erb-B-2)有紧密的相似性。在实体瘤中发现EGFR水平升高,包括肺鳞状细胞癌、头癌、颈癌、子宫颈癌、乳腺癌、前列腺癌和膀胱癌(Neal,D.E.等人,表皮生长因子受体和膀胱癌预后,Cancer,1990.65(7):p.1619-25)。膀胱癌的阳性范围为31-48%(American Cancer Society.2000)。
热休克蛋白-90(HSP-90)、IL-6和IL-10
在膀胱癌的早期阶段,发生免疫反应级联,大量分泌多种蛋白质,包括热休克蛋白(HSP-90)和细胞因子。HSP-90是HSP家族的最重要的成员之一。通过IHC研究,在56例膀胱癌中有52例(93%)表达HSP-90,48例(86%)表达IL-6,45例(80%)表达IL-10。高等级的、侵入肌肉的肿瘤比低等级的肿瘤含有显著高水平的HSP-90和IL-6。与肿瘤区域相邻的正常尿路上皮不显示HSP-90染色。IL-6和IL-10显示免疫反应性缺乏(Cardillo,M.R.,P.Sale和F.Di Silverio,膀胱癌中热休克蛋白-90、IL-6和IL-10,Anticancer Res,2000.20(6B):p.4579-83)。这提示IL-6和IL-10可能在肿瘤发展过程中相对早期地开启。
HLA-DR
尽管HLA-DR的功能作用是介导免疫活性细胞之间的通讯,但是也已经证实,HLA-DR抗原表达不依赖于膀胱癌中的淋巴细胞亚群(Ioachim,E.等人,人泌尿膀胱癌中成视网膜细胞瘤基因产物(Rb)、p53蛋白、MDM2、C-erbB-2、HLA-DR的免疫组化表达和增殖系数,HistolHistopathol,2000.15(3):p.721-7)。
人类错配修复基因(hMSH2)
这是原型错配修复基因(MMR)。hMHS2识别并结合核苷酸错配,与其它MMR蛋白一起引导对DNA复制错误的协同修正。报道在40%的遗传性非息肉病结肠癌(HNPCC)中有MMR基因突变,最近的IHC研究提示,MSH2表达降低的膀胱肿瘤与较高的等级和复发有关。一项研究显示,根据IHC,所有膀胱肿瘤都是hMSH2阳性的,而正常膀胱粘膜是阴性的(Leach,F.S.等人,人错配修复基因hMSH2表达:膀胱上皮癌变的强标记,Cancer,2000.88(10):p.2333-41)。
Lewis X
ABH和Lewis血型相关抗原存在于正常尿路上皮的表面。除了偶尔的伞细胞之外,成人尿路上皮细胞通常不含Lewis X抗原。Sheinfeld(Sheinfeld,J.等人,用Lewis X抗原作为癌症转移标记的膀胱癌检测,JUrol,1990.143(2):p.285-8)及同事利用来自膀胱冲洗标本的上皮细胞上的Lewis X抗原的免疫染色检测膀胱肿瘤,报道的灵敏度为86%,特异性为87%。Golijanin(Golijanin,D.等人,免疫染色排出尿中细胞中之lewis X抗原检测膀胱癌,Urology,1995.46(2):p.173-7)及同事也证实了尿标本的Lewis X免疫染色的高灵敏度和特异性。高等级和低等级的过渡性细胞肿瘤以同样的效率检测。
MDM2
这是一种细胞原癌基因产物。已经证明MDM2可结合p53,并且作为一种阴性调节剂起作用,抑制它的转录反式激活。已经证明,异常的MDM2和p53表型可能是膀胱癌患者的重要诊断标记(Ioachim,E.等人,人泌尿膀胱癌中成视网膜细胞瘤基因产物(Rb)、p53蛋白、MDM2、C-erbB-2、HLA-DR的免疫组化表达和增殖系数,Histol Histopathol,2000.15(3):p.721-7)。
核基质蛋白22(NMP-22)
这种核基质蛋白在核的结构框架、DNA复制和基因表达中起重要作用。肿瘤转化以及在乳腺、结肠和膀胱中发现NMPs浓度显著提高。利用针对选择的NMP表位(NMP-22)的抗体,能够在膀胱癌患者的尿中检测到可溶性NMPs。Landman等人(Landman,J.等人,NMP-22、端粒酶和BTA在人膀胱癌检测中的灵敏性和特异性,Urology,1998.52(3):p.398-402)发现总灵敏度可达81%。
p53
这种人肿瘤抑制基因编码一种在基因组损伤后促进DNA修复的核磷蛋白。野生型p53降解。突变p53不降解,因此在细胞中积累。突变p53能够通过IHC检测。有几项研究将p53突变与高等级膀胱癌和不利的预后联系起来(Vollmer,R.T等人,过渡性细胞瘤对膀胱的入侵:与组织学分级和p53、MIB-1、c-erbB-2、表皮生长因子受体和bcl-2表达的关系。Cancer,1998.82(4):p.715-23;Nakopoulou,L.等人,过渡性细胞膀胱癌中bcl-2、p53和Ki-67免疫反应性的盛行及其临床病理相关性,Hum Pathol,1998.29(2):p.146-54;Vorreuther,R.等人,石蜡切片上免疫组化标记(PCNA、Ki-67、486p和p53)的表达及其与表面膀胱肿瘤复发率的关系,Urol Int,1997.59(2):p.88-94;Li,B.等人,bcl-2和p53癌蛋白在宫颈发育异常和尿膀胱癌中的相互作用表达,Urol Res,1998.26(4):p.235-41)。报道的膀胱癌的p53突变率为30%-58%。Wu等人(Wu,T.T.等人,bcl-2、p53和Ki-67指数在预测低分级表面过渡性细胞膀胱癌的肿瘤复发中的作用,J Urol,2000.163(3)):p.758-60)证明60例病例中有42例(70%)具有p53突变。
PCNA和MIB1(Ki-67)
这两者都是细胞增殖核标记。它们在包括膀胱癌在内的多种肿瘤中表达。研究表明,PCNA与MIB1之间具有强相关性,提示能够使用这两种标记中的任意一种(Ioachim,E.等人,人泌尿膀胱癌中成视网膜细胞瘤基因产物(Rb)、p53蛋白、MDM2、C-erbB-2、HLA-DR的免疫组化表达和增殖系数,Histol Histopathol,2000.15(3):p.721-7;Lavezzi,A.M.,L.Terni和L.Matturri,PCNA免疫染色作为滴定胸苷放射自显影的有效替代检测过渡性细胞膀胱癌中增殖细胞级分,In Vivo,2000.14(3):p.447-51)。
成视网膜细胞瘤(Rb)
Rb是一种肿瘤抑制基因,在人类肿瘤的开始和进展中可能起作用。Rb编码正常细胞中存在的核磷蛋白,认为它与细胞周期和细胞生长的负调节有关。在几种上皮肿瘤中观察到Rb基因的改变,提示结构异常,包括该基因的突变和/或缺失,可导致肿瘤抑制蛋白无活性,并且可能与肿瘤发生有关。
存活素
存活素是一种142个氨基酸的蛋白质。它在细胞周期的G2/M期表达,与有丝分裂纺锤体的微管有关。它是一种凋亡抑制剂,在普通人癌症中选择性过量表达,但是在正常组织中不表达,与攻击性疾病和不利的后果有关(Lehner,R.等人,IAP蛋白存活素在膀胱粘膜和过渡性细胞癌中的免疫组化定位,Appl Immunohistochem Mol Morphol,2002.10(2):p.134-8)。
转化生长因子-β1和受体I和II
TGF-β1是调节细胞增殖、分化、迁移、免疫应答、血管发生和凋亡的一种多效性生长因子。已经证实它通过降低细胞进入S期的能力抑制正常上皮细胞生长。反之,许多癌细胞显示对TGF-1的生长抑制有抗性。TGF-β1的作用由膜结合的丝氨酸-苏氨酸激酶受体介导,后者现在被称为TGF-β1受体I(TGF-β1I)和TGF-β1受体II(TGF-β1II)。受体I和II表达的丧失在几种癌症中可见,包括前列腺、结肠、卵巢和膀胱癌。在一项研究中,在51例(64%)、34例(43%)和38例(48%)膀胱癌病例中TGF-β1、TGF-β1I和TGF-β1II的表达改变。TGF-β1的过量表达在高等级肿瘤中可见,在正常膀胱粘膜中为阴性。TGF-β1I和β1II的丢失与侵入性肿瘤阶段有关(Kim,J.H.等人,转化生长因子-β(I)及其受体在膀胱的过渡性细胞癌中表达的预见性价值,Cancer,2001.92(6):p.1475-83)。
UBC(CK8和CK18)
这是测定尿中细胞角蛋白片段8和18的浓度的一种酶免疫测定。普通的上皮和癌同时表达这些细胞角蛋白,其中包括正常尿路上皮和TCC。Heicappell等人证明,UBC的灵敏度为22%-75%,总特异性为77%(Heicappell,R.等人,尿膀胱癌抗原作为标记诊断尿膀胱过渡性细胞癌的评估,Scand J Clin Lab Invest,2000.60(4):p.275-82)。
基于组织的标记
检测和/或诊断膀胱癌的一种基于组织的探针组包括诊断和预后标记,以及与转移能力、肿瘤分级和阶段确定有关的标记。它不仅在患者筛查和诊断中,而且在患者分级中具有指导临床治疗的潜在价值。也能够用尿标本检测基于组织的探针组,来观察结果是否优于现有的基于细胞的探针组。检测和/或诊断膀胱癌的一种优选的基于组织的探针组包括选自p53、Rb、X、EGER和存活素的标记。下面以膀胱癌为例详述了这些肿瘤标记的重要性。
高等级膀胱癌的检测通常不是问题,因为它存在重度非典型细胞学。另一方面,低等级肿瘤的检测对细胞病理学家来说仍然是一个挑战。了解膀胱癌的发病机理对于查明肿瘤发生过程中的初期事件至关重要。吸烟、暴露于芳基胺、长期使用止痛剂以及暴露于环磷酰胺增加了患膀胱癌的危险。这些影响如何诱发癌症还不清楚,但是在过渡期细胞癌中观察到大量遗传改变。有证据表明,与肿瘤抑制基因有关的染色体缺失及随后细胞周期控制的丧失在膀胱癌的早期发展方面至关重要(Crawford,J.M.和R.S.Cotran,The Lower Urinaty Tract,RobbinsPathologic Basis of Disease,T.Collins,Editor.1999,W.B.SaundersCompany:Philadelphia.p.1003-1008;Williams,S.G.,M.Buscarini和J.P.Stein,用于膀胱癌的诊断、分级和预后的分子标记,Oncology(Huntingt),2001.15(11):p.1461-70,1473-4,1476;discussion1476-84)。
30%-60%的膀胱肿瘤含有染色体9单体或9p和9q缺失,以及17p、13q、11p和14q缺失(Gibas,Z.和L.Gibas,膀胱癌的细胞发生,CancerGenet Cytogenet,1997.95(1):p.108-15)。染色体9缺失经常存在于浅表乳头状瘤中,而偶尔存在于非侵入性扁平(flat)肿瘤中的唯一的遗传改变。9p缺失,9p21,与肿瘤抑制基因p16有关。然而,研究证明,在9p缺失中p16蛋白质表达不降低。另一方面,许多侵入性过渡期细胞癌显示17p缺失和p53基因突变,提示p53的改变引起过渡期细胞癌的进展。
在扁平原位细胞癌中也发现p53的突变。一种原癌基因MDM2,通过与p53结合,在细胞周期的调节中起关键作用。MDM2也能够与细胞周期和凋亡调节控制的其它关键元件相互作用,如E2F和Rb(Martin,K.等人,E2F1/DP1转录活性被MDM2癌蛋白的刺激,Nature,1995.375(6533):p.691-4;Xiao,Z.X.等人,成视网膜细胞瘤蛋白和癌蛋白Af DM2,Nature,1995.375(6533):p.694-8)。13q缺失是成视网膜细胞瘤基因(Rb)的缺失,Rb基因的突变被认为在多种人类恶性肿瘤的发病机理中具有中心的重要性。最近,已经清楚pRb的基因组丢失导致无法控制的细胞生长和凋亡(即细胞死亡)。以前对膀胱癌的研究报道,Rb无活性与肿瘤进展有关(Ioachim,E.等人,人泌尿膀胱癌中成视网膜细胞瘤基因产物(Rb)、p53蛋白、MDM2、C-erbB-2、HLA-DR的免疫组化表达和增殖系数,Histol Histopathol,2000.15(3):p.721-7)。
低等级膀胱癌的复发率高。对于没有肌肉侵入的患者,长期状况较好,但是超过一半在膀胱内发生复发的肿瘤,在阶段和等级上通常类似于原发性癌症。EGFR已经证明与升高的复发率和浅表到侵入性膀胱癌的进展有关(Neal,D.E.等人,表皮生长因子受体及膀胱癌预后,Cancer,1990.65(7):p.1619-25;Izawa,J.I.等人,表面至侵入性膀胱过渡性细胞癌过程中进程相关基因的差异表达,Oncol Rep,2001.8(1):p.9-15)。
存活素是在细胞周期G2/M期表达的一种新的膀胱肿瘤标记,与有丝分裂纺锤体的微管有关(Li,B.等人,bcl-2和p53癌蛋白在宫颈发育异常和尿膀胱癌中的相互作用表达,Urol Res,1998.26(4):p.235-41)。存活素-微管相互作用的破坏导致存活素抗凋亡功能的丢失和caspase-3的激活。Caspase-3是Fas-介导的细胞死亡的一种必要的死亡因子,与p21的相互作用启动它在细胞中的失活(Tamm,I.等人,IAP家族蛋白存活素抑制caspase活性以及由Fas(CD95)、Bax、caspases、和抗癌药物诱发的凋亡,Cancer Res,1998.58(23):p.5315-20)。存活素也与细胞周期控制有关。更重要的是,研究表明在大多数移行细胞癌中存在存活素的核染色,而在健康膀胱粘膜中不存在(Lehner,R.等人,IAP蛋白存活素在膀胱粘膜和过渡性细胞癌中的免疫组化定位,ApplImmunohistochem Mol Morphol,2002.10(2):p.134-8)。
基于细胞的免疫细胞化学标记
基于细胞的探针组含有对于早期、低等级TCC以及晚期、高等级TCC特异的标记。它能够用来筛查和检测早期、低等级TCC。对于困难的情况,可以进行细胞检查活检,以用基于组织的探针组证实诊断。如果患者处于晚期,也能够用它来诊断高度TCC,结果可以指导泌尿科医生的治疗决定。检测和/或诊断膀胱癌免疫细胞化学技术的一个优选的基于细胞的探针组包括选自BL2-10D1、细胞角蛋白20、Lewis X和NMP-22的标记。这些肿瘤标记对于膀胱癌的重要性在下文详述。
向临床泌尿学中引入新型分子标记与常规尿细胞学相比提高了膀胱癌的诊断准确性。大量商品以及多种标记可以获得。然而,每种标记都显示不同的灵敏度和特异性。此外,还没有一种免疫细胞化学测定能够代替侵入性膀胱镜检查。
使用几种标记,唯一性变得明显。例如,BL2-10D1与低等级TCC有一致的反应性,相反,它与高等级TCC有不一致的反应性(Longin,A.等人,鉴别尿细胞学中肿瘤细胞的有用单抗BL2-10D1,Cancer,1990.65(6):p.1412-7)。对于TCC检测,CK 20的总灵敏度为94%,特异性为80%(Lin,C.W.等人,通过人膀胱肿瘤相关抗原的单抗在膀胱灌洗液中检测肿瘤细胞,J Urol,1988.140(3):p.672-7),在良性上皮中,染色局限于伞细胞表面,而在发育异常的上皮中,染色涉及整个厚度(Hamden,P.等人,细胞角蛋白20作为宫颈发育异常的客观标记,Br J Urol,1996.78(6):p.870-5)。发现来自膀胱冲洗标本的上皮细胞上的Lewis X抗原的免疫染色灵敏度为86%,特异性为87%(Sheinfeld,J.等人,用Lewix X抗原作为肿瘤转化标记增强膀胱癌检测,J Urol,1990.143(2):p.285-8)。用来比较NMP-22、端粒酶的研究和BTA测定证明,NM-22具有最高的灵敏度和特异性(Landman,J.等人,1VNIP-22、端粒酶和BTA在人膀胱癌检测中的灵敏性和特异性,Urology,1998.52(3):p.398-402;Friedrich,M.G.等人,用于膀胱癌检测和预后的尿标记的临床用途,J Urol,2002.168(2):p.470-4)。
通过组合生物标记进行一个或多个组测定,灵敏度和特异性显著提高(Eissa,S.等人,核基质蛋白、纤连蛋白、尿膀胱癌抗原和排空尿细胞学在检测膀胱癌中的比较性评估,J Urol,2002.168(2):p.465-9)。一种理想的膀胱癌测定是非侵入性的、灵敏、特异、且成本有效的。基于组织的探针组和基于细胞的探针组可以单独使用,来自基于组织的探针组和来自基于细胞的探针组的标记能够再次组合,获得最终优化的探针组。
在整个实施例中使用下列缩写:CD44s=CD44标准,CD44v6=CD44剪接变体6,CD44v3=CD44剪接变体3,CK=细胞角蛋白,Cox-1=环加氧酶-1,Cox-2=环加氧酶-2,EGFR=表皮生长因子受体,ELISA=酶联免疫吸附测定,FFPE=福尔马林固定的石蜡包埋的,FNA=细针抽吸,FNB=细针活组织检查,HLA-DR=人白细胞抗原-DR,hMSH2=人类错配修复基因,HNPCC=遗传性非息肉性结肠癌,HSP-90=热休克蛋白-90,IL-6=白介素-6,IL-10=白介素-10,ICC=免疫细胞化学,IHC=免疫组织化学,ISH=原位杂交,NNIP22=核基质蛋白,PCNA=增殖的细胞核抗原,PCR=聚合酶链反应,TCC=移行细胞癌,TGF=转化生长因子,STDs=性传播疾病和Rb=成视网膜细胞瘤。
IV.前列腺癌
已经发现多种前列腺肿瘤标记可以帮助医生及时、准确地做出诊断,并提供明显更好的患者管理。遗憾的是,这些前列腺肿瘤标记都不是具有高灵敏度和特异性的“魔方”。因此,提高诊断准确性的备选方法是必要的。
提高诊断准确性的一个备选方法是发展一个探针组,其包含多种探针,每个探针特异地结合与前列腺癌有关的一种标记。所有候选探针都用ICC和/或IHC技术检测。在一些实施方案中,可以从细针活检中获得标本。浅表和外部器官通常使用细针抽吸(FNA),从而能够例如从乳腺、甲状腺或类似的软组织中获得细胞悬浮细胞学标本。对于深层和内部器官,如前列腺、肾脏或肝脏,通常使用细针活检(FNB)技术,可以由超声波或CT指导,获得组织标本。对于前列腺,通常使用超声波,FNB经直肠进行。在另外一些实施方案中,能够进行FNB的接触制备(touch preps),在载玻片上产生来自组织的细胞印痕。对于来自FNB方法的液体或血液标本,可以产生细胞悬浮标本。
一旦采集到标本,即对该标本进行处理和分析。如以上对于肺癌所述,利用统计学分析设计探针组。在一些实施方案中,在处理过程中可能发生技术问题,如粗洗过程中细胞涂片或沉淀不与载玻片附着。然而,通过软件操作或者修改染色方案缓解这些问题,能够容易地解决这些问题。在一些实施方案中,利用一种自动采样标本并为诊断制备载玻片的装置处理并分析标本。预计最初将使用多种探针。为了保持高水平的灵敏度和特异性,应当为适当大小的探针组修剪探针的数量。最终探针的选择以预先确定的染色阳性肿瘤细胞的百分比阈值为基础。将利用复杂的统计学分析进行这些测定。由于检测恶性肿瘤的组测定法适用于实体瘤,并且在不同探针组中含有几种相同的肿瘤标记,所以该方法可以平行以及连续进行。这样,能够加快测定发展过程。
探针/标记文库
检查了包括关于癌症标记信息的不同来源。利用20%或更高的乳腺癌阳性率作为任意标准为检测和/或诊断前列腺癌的一个优选探针组选择探针。术语“20%或更高的阳性率”是指如果研究100个肿瘤病例,则20个或者更多的病例显示存在各种标记,其余的80个或者更少病例显示不含各种标记。一个优选探针组可能包括选自下列的分子标记:34βE12、B72.3、C-erb.B2、E-钙粘蛋白、表皮生长因子受体(EGFR)、脂肪酸合酶(FAS)、ID-1、激肽释放酶、Ki-67、Leu 7、MDM2、N-钙粘蛋白、P504S、p53、前列腺酸性磷酸酶(PAP)、前列腺抑制素肽(PI)和前列腺特异性抗原(PSA)。关于本实施例中使用的探针/标记文库的简述在下文提供。
34βE12
这是存在于前列腺基细胞中的一种高分子量的细胞角蛋白(HMWCK)。前列腺腺癌缺乏与该抗体的免疫反应性。Yang及同事(Yang,X.J.等人,高分子量细胞角蛋白在前列腺腺癌中的罕见表达,AmJ Surg Pathol,1999.23(2):p.147-52)用34βE12通过免疫组化研究了100例转移和局部晚期前列腺癌。只有4例是34βE12阳性的。它们的结论是,34βE12是一种非常有用的区别前列腺腺癌与正常前列腺的标记。另一个小组研究了228个可疑病例,发现34βE12在证实、建立或者改变在外科病理学的每天实践中所见的可疑焦点的诊断方面有很高的价值(Wojno,K.J.和J.I.Epstein,基础细胞特异性抗细胞角蛋白抗体(34βE12)在诊断前列腺癌中的应用:228病例综述,Am J Surg Pathol,1995.19(3):p.251-60)。
B72.3
这是一种可识别与糖蛋白72有关的肿瘤的单克隆抗体。已经证明它与包括前列腺腺癌在内的不同类型的腺癌反应。Mazur及同事(Mazur,M.T.和J.J.Shultz,前列腺腺瘤,对单抗B72.3的免疫反应性评估,AmJ Clin Pathol,1990.93(4):p.466-70)表示,95%以上的良性前列腺疾病是B72.3阴性的,而77%的前列腺腺癌至少在病灶是阳性的,明确鉴定的前列腺腺癌中100%是B72.3阳性的。另外一项研究证明,良性上皮和基质组织用B72.3不能免疫染色。在30%的局限性前列腺腺癌中,在恶性细胞内检测到免疫染色(Myers,R.B.等人,肿瘤相关糖蛋白72在前列腺上皮内瘤和前列腺腺瘤中的表达,Mod Pathol,1995.8(3):p.260-5)。
C-erb-B2
这是一种癌基因,也被称为Her2/neu,它的产物被称为癌蛋白。C-erb-B2属于表皮生长因子受体(EGFR)家族,包括c-erb-B1、c-erb-B2和c-erb-B3。c-erb-B2的过量表达在乳腺癌中众所周知。c-erb-B2在人前列腺癌的发病机理和发展中的作用还不明确。以前的研究报道了c-erb-B2在原发性前列腺肿瘤中的表达率大大分歧,这可能是由于这些研究中的明显的方法差异。Reese及同事(Reese,D.M.等人,HER-2蛋白在雄激素不依赖型前列腺癌中的表达和基因扩增,Am J Clin Pathol,2001.116(2):234-9)通过免疫组化和荧光原位杂交(FISH)研究了Her2蛋白在不依赖雄激素的前列腺癌中的表达。他们发现36%的标本是Her2阳性的,但是只有6%有基因扩增,表明Her2扩增和蛋白质表达机制不同于乳腺癌。另外一项研究证明,c-erb-B2是晚期前列腺癌的一种非常有用的生物标记(Arai,Y.,T.Yoshiki和O.Yoshida,c-erbB-2癌蛋白:晚期前列腺癌的有力生物标记,Prostate,1997.30(3):p.195-201)。
E-钙粘蛋白
这是一种Ca++依赖的跨膜细胞粘附分子。E-钙粘蛋白表达降低已经在大量癌中得到证实,与较高的转移倾向和生存率降低有关。Kuniyasu及同事(Kuniyasu,H.等人,IV型胶原酶、E-钙粘蛋白和血管内皮生长因子/血管渗透因子在前列腺切片样本中的相对表达区别病理晚期前列腺癌,Clin Cancer Res,2000.6(6):p.2295-308)表示,E-钙粘蛋白表达降低与Gleason得分提高有关。另外一些研究也揭示,E-钙粘蛋白在前列腺骨转移中下调,在前列腺癌患者中,E-钙粘蛋白减少与较差的预后有关(Bryden,A.A.等人,E-钙粘蛋白和β-连环蛋白在前列腺骨转移中下调,BJU Int,2002.89(4):p.400-3;Umbas,R.等人,E-钙粘蛋白表达降低与前列腺癌患者预后较差相关,Cancer Res,1994.54(14):p.3929-33)。
EGFR
表皮生长因子受体(EGFR)是一种跨膜糖蛋白。它在细胞生长和分化中起重要作用。表皮生长因子(EGF)是配体之一,可与细胞表面的表皮生长因子受体(EGFR)相互作用,诱导受体酪氨酸磷酸化和胞内信号转导途径的激活。EGF似乎是正常前列腺和良性前列腺增生(BPH)中主要的EGF相关生长因子。EGFR位于良性前列腺的基底和神经内分泌(NE)区,显示相对的依赖雄激素的表达。EGF-相关肽和EGFR也存在于肿瘤前列腺组织中。依赖雄激素的细胞比雄激素反应性前列腺癌细胞显示更多的EGFR表达和磷酸化(Sherwood,E.R.和C.Lee,正常和恶变前列腺中的表皮生长因子相关肽和表皮生长因子受体,World J Urol,1995.13(5):p.290-6)。一项研究发现,46例前列腺腺癌中有22例表达EGFR(Cohen,D.W.等人,转化生长因子α和表皮生长因子受体在人前列腺组织中的表达,J Urol,1994.152(6 Pt1):p.2120-4)。
脂肪酸合酶(FAS)
脂肪酸合酶(FAS)或者癌抗原519(OA-519)是一种重要的生脂肪酶。最近认为它与乳腺癌的预后较差有关。Shurbaji及同事(Shurbaji,M.S.,J.H.Kalbfleisch和T.S.Thurmond,脂肪酸合酶DA-519作为前列腺癌进展指示物的免疫组化检测,Hum Pathol,1996.27(9):p.917-21)证实,在57%的前列腺癌中有FAS的表达,FAS阳性癌症比FAS阴性癌症更可能进展。在Swinnen的研究中(Swinnen,J.V.等人,脂肪酸合酶的过量表达是前列腺癌发展中的早期和共同事件,Int J Cancer,2002.98(1):p.19-22),增生的良性腺体结构均为FAS染色阴性,25例低等级前列腺上皮瘤形成(PIN)损伤中有24例,26例高等级PIN损伤中26例,87例浸润性癌中有82例,其免疫组化信号明显。从低等级到高等级PIN到浸润性癌,染色强度趋于提高。FAS高表达的癌症具有总体较高的增生指数。另外一项研究发现,FAS是前列腺的一种重要的预后标记,是提供除Gleason得分之外的其它预测信息的少数标记之一(Epstein,J.I.,M.Carmichael和A.W.Partin,.OA-519(脂肪酸合酶)作为前列腺腺癌中病理阶段的独立指示物,Urology,1995.45(1):p.81-6)。
ID-1
螺旋-环-螺旋蛋白质ID-1用于防止碱性螺旋-环-螺旋转录因子与DNA结合,从而抑制分化相关基因的转录。在某些肿瘤,如乳腺癌、食道癌、胰腺癌和髓样甲状腺癌中,已经报道了ID-1的过量表达。Ouyang及同事(Ouyang,X.S.等人,ID-1在前列腺癌中的过量表达,JUrol,2002.167(6):p.2598-602)证明,通过免疫组化研究和原位杂交,观察到ID-1在正常前列腺或BPH组织中的负表达至弱表达。相反,所有前列腺癌在肿瘤细胞中都显示信使RNA和蛋白质水平的显著阳性ID-1表达。此外,在分化较差的癌中ID-1的表达强于分化良好的癌,提示ID-1表达水平可能与肿瘤级别有关。
激肽释放酶2
人腺体激肽释放酶2(hK2)是丝氨酸蛋白酶多基因家族的一个成员。它在前列腺上皮中表达,受雄激素调节。激肽释放酶2存在于血清和精液中。它能够与内源蛋白酶抑制剂(例如α2-巨球蛋白和α1-抗凝乳胰蛋白酶)形成复合物。研究表明,当激肽释放酶2与前列腺特异性抗原(PSA)联用时,前列腺癌检测的特异性提高(Partin,A.W.等人,人腺体激肽释放酶2用于检测前列腺癌的用途,Urology,1999.54(5):p.839-45)。另外一项研究表明,人腺体激肽释放酶和游离前列腺特异性抗原(PSA)的组合提高了对总PSA中度增高的患者中前列腺癌与良性前列腺增生的鉴别(Magklara,A.等人,人腺体激肽释放酶和游离前列腺特异性抗原(PSA)增强带有中度增加的总PSA患者中前列腺癌与良性前列腺增生之间的区分,Clin Chem,1999.45(11):p.1960-6)。Nam及同事(Nam,R.K.等人,血清人腺体激肽释放酶水平预测PSA升高男性中前列腺癌的存在,J.Clin Oncol,2000.18(5):p.1036-42)证明,血清人腺体激肽释放酶2水平预测PSA升高者中前列腺癌的存在。
Ki-67
这是在增殖的正常和肿瘤细胞中表达的一种核蛋白。Ki-67的表达在细胞周期中被称为G1晚期、S、M和G2的阶段发生,而在G0期不发生(Cattoretti,G.等人,针对重组部分Ki-67抗原(MIB1和MIB3)的单抗检测微波加工、甲醛固定的石蜡切片中增殖细胞,J Pathol,1992.168(4):p.357-63)。Ki-67常用作细胞增殖标记,位于核中。研究表明,前列腺癌中的Ki-67染色在根治性前列腺切除术后提供独立的预后信息,Ki-67免疫反应性是前列腺癌生存率的一个预测器(Halvorsen,O.J.等人,前列腺癌中Ki-67染色最大化提供了放射前列腺切除术后独立的预后信息,Anticancer Res,2001.21(6A):p.4071-6;Stattin,P.等人,甲醛固定组织上Ki-67免疫反应性的细胞增殖评估是前列腺癌存活的预示因素,J Urol,1997.157(1):p.219-22)。
Leu7
该抗原存在于非癌性和癌性前列腺上皮以及自然杀伤细胞和有髓鞘神经上。Liu及同事(Liu,X.等人,HNK-1(leu-7)抗原在前列腺癌中的免疫组化研究及其临床意义,Chin Med J(Engl),1995.108(7):p.516-21)表示,94%的前列腺癌为Leu 7阳性。分化良好的癌症显示最高百分比的阳性癌细胞和最强的染色,而分化较差的癌症含有最低百分比的阳性癌细胞和最弱的染色。另外一项研究提示,前列腺癌上Leu 7的表达可能是前列腺癌患者的一种有用的预后因素(Liu,X.H.等人,HNK-1(leu-7)抗原在前列腺癌中的预后价值:免疫组化研究,Hinyokika Kiyo,1993.39(5):p.439-44)。
MDM2
这是一种细胞原癌基因产物。MDM2与p53结合,促进通过遍在蛋白的降解,掩蔽其反式激活结构域,抑制与细胞周期停滞和凋亡有关的基因的转录激活(Momand,J.和G.P.Zambetti,tVlcm-2:p53的大兄弟J Cell Biochem,1997.64(3):p.343-52)。MDM2基因的扩增或MDM2蛋白质的过量表达与肿瘤的发展有关,MDM2的过量表达与很多攻击性疾病和较差的生存率有关(Freedman,D.A.,L.wu和A.J.Levine,MDM2癌蛋白的功能Cell Mol Life Sci,1999.55(1):p.96-107)。Leite及同事(Leite,K.R.等人,前列腺癌中MDM2的异常表达,Mod Pathol,2001.14(5):p.428-36)表示,MDM2在41%的前列腺腺癌病例中过量表达。p53和MDM2均阳性的肿瘤较大,处于更晚期。结果提示,MDM2-阳性/p53-阳性表型可确定具有攻击性行为的前列腺癌。
N-钙粘蛋白
与E-钙粘蛋白相似,这是一种细胞粘附分子。细胞-细胞相互作用的改变在癌症进展过程中非常重要。同样,已经证明细胞粘附分子E-钙粘蛋白表达的丧失与包括前列腺癌在内的许多癌的分级、阶段和预后有关。E-钙粘蛋白-介导的相互作用削弱导致一种攻击性表型。然而,仅仅细胞-细胞接触和通讯的丧失不是观察到的E-钙粘蛋白-介导的粘附与较差的临床后果之间相关性的唯一解释(Kuniyasu,H.等人,IV型胶原酶、E-钙粘蛋白和血管内皮生长因子/血管渗透因子在前列腺切片样本中的相对表达区别病理晚期前列腺癌,Clin Cancer Res,2000.6(6):p.2295-308;(Bryden,A.A.等人,E-钙粘蛋白和β-连环蛋白在前列腺骨转移中下调,BJU Int,2002.89(4):p.400-3;Umbas,R.等人,E-钙粘蛋白表达降低与前列腺癌患者预后较差相关,Cancer Res,1994.54(14):p.3929-33)。Bussemakers及同事(Bussemakers,M.J.等人,复合钙粘蛋白在人前列腺癌细胞中的表达,Int J Cancer,2000.85(3):p.446-50)证明,N-钙粘蛋白在人前列腺癌细胞系中上调。另外一项研究表明,N-钙粘蛋白在正常前列腺组织中不表达,然而,在前列腺癌中,发现N-钙粘蛋白在分化较差的区表达,这主要显示异常的或阴性的E-钙粘蛋白染色(Tomita,K.等人,人前列腺癌进展中的钙粘蛋白开关控制,Cancer Res,2000.60(13):p.3650-4)。
P504S
A-甲基酰基-CoA消旋酶(P504S)是一种细胞质蛋白。它在最近通过cDNA文库扣减联合前列腺癌高通量微阵列筛查鉴定。Jiang及同事(Jiang,Z.等人,P504S:前列腺癌检测的新分子标记,Am J Surg Pathol,2001.25(11):p.1397-404)通过免疫细胞化学对良性和癌性前列腺组织检测了P504S。在100%的前列腺癌中,P504S显示强细胞质颗粒染色,与gleason得分和扩散无关。相反,194例良性前列腺中的171例(88%),包括67例良性前列腺中的56例(84%)和127个与癌相邻的良性腺体中的115个(91%)是P504S阴性的。另外一项研究表明,P504S是区别前列腺的非典型腺瘤性增生与前列腺腺癌的一种非常有用的标记(Yang,X.J.等人,α-甲基酰基-CoA消旋酶P504S在前列腺非典型腺瘤性增生中的表达,Am J Surg Pathol,2002.26(7):p.921-5)。
p53
这是一种肿瘤抑制基因。p53的失活与全部人类肿瘤中一半以上的肿瘤发生有关。它作为一种转录调节剂起作用,与DNA损伤引起的细胞的G1期生长停滞有关,并且在纺锤体检查点、中心体内稳态和G2-M期转变的调节中起作用。它也通过依赖和不依赖转录的机制在多种细胞型中诱导凋亡,并调节肿瘤血管发生(Kirsch,D.G.和M.B.Kastan,肿瘤抑制剂p53:肿瘤发展和预后的提示,J Clin Oncol,1998.16(9):p.3158-68;Agarwal,M.L.等人,p53网络J Biol Chem,1998.273(1):p.1-4;Liebermann,D.A.,B.Hoffman和R.A.Steinman,生长抑制和凋亡的分子控制:p53依赖性和非依赖性途径,Oncogene,1995.11(1):p.199-210)。Thompson及同事(Thompson,S.J.等人,在人前列腺癌和良性增生中p53和Ki-67的免疫反应性.Br J Urol,1992.69(6):p.609-13)表示含有p53的前列腺癌标本染色,而良性前列腺增生(BPH)未见染色。另外一项研究表明,p53的核积累是前列腺癌的一个重要的预后指标(Quinn,D.I.等人,在用放射前列腺切除术治疗的前列腺癌中累积的p53核的预后意义,Cancer Res,2000.60(6):p.1585-94)。
前列腺酸性磷酸酶(PAP)
前列腺酸性磷酸酶(PAP)作为前列腺特异的抗原(PSA)大大提高了可靠诊断原发性或转移性前列腺癌的可行性。研究表明,PAP的诊断灵敏度为90-100%,特异性为87-100%,PAP是晚期前列腺癌的一种有用的预后指标(Svahholm,H.和M.Horder,前列腺标记的临床应用I:利用免疫组化技术的前列腺肿瘤分类,Scand J Urol Nephrol Suppl,1988.107:p.65-70;(Sakai,H.等人,前列腺特异性抗原和前列腺酸性磷酸酶的免疫反应性作为晚期前列腺癌的预后指示物,J Urol,1993.149(5):p.1020-3)。
前列腺抑制素肽(PIP)
前列腺抑制素肽(PIP)是前列腺合成的一种多肽。它与前列腺生长和分化有关。PIP基因位于7q34区,含有大量脆性位点。在前列腺癌中发现PIP基因的重排(Autiero,M.等人,与人原发前列腺癌相关的PIP基因的异常限制性模式,DNA Cell Biol,1999.18(6):p.481-7)。Garde及同事(Garde,S.V.等人,前列腺癌中的前列腺抑制素肽(PIP):与PSA和Ps1P的比较性免疫组化研究,Cancer Lett,1994.78(1-3):p.11-7)表示,在前列腺癌的诊断方面,PIP是与PSA和PAP同样灵敏、特异的一种免疫组化标记。此外,PIP的不依赖雄激素的性质可能使之对于暴露于雄激素消除剂的肿瘤具有优于PSA/PAP的优点。
前列腺特异性抗原(PSA)
前列腺特异性抗原(PSA)是前列腺上皮的一种产物,在精液中正常分泌。它是一种丝氨酸蛋白酶,其功能是切割并液化射精后形成的精液凝结物。PAS是器官特异的,不是癌症特异的。因此,PSA水平的升高不仅在癌症中,而且在非肿瘤疾病中也发生,如前列腺结节性增生和前列腺炎。PSA本身不能用于检测早期癌症。然而,当与直肠检查和经直肠超声检查结合时,测定PSA水平被认为可用于检测早期癌症(Crawford,J.M.和R.S.Cotran,The Male Genital Tract,RobbinsPathologic Basis of Disease,R.S.Cotran,V.Kuman,and T.Collins,Editors.1999,W.B.Saunders Company:Philadelphia.p.1011-1034)。有更多的证据表明,在前列腺癌的诊断中,游离血清PSA比总PSA更精确(Catalona,W.J.等人,游离PSA百分比增加前列腺癌与良性前列腺疾病的区分之用途:多中心临床试验Jama,1998.279(19):p.1542-7)。用于前列腺癌诊断的PSA的免疫组织化学研究也是非常灵敏和特异的。Svanholm及同事(Svanholm,H.和M.Horder,前列腺标记的临床应用I:利用免疫组化技术的前列腺肿瘤分类,Scand J Urol Nephrol Suppl,1988.107:p.65-70)证明用于前列腺癌诊断的PSA的灵敏度为94-100%,特异性为100%。
V.乳腺癌
作为乳腺癌的筛查工具,非侵入性乳房X线照相术无效(Gotzsche,P.C.和O.Olsen,用乳房X线造影术筛查乳腺癌正确吗?Lancet,2000.355(9198):p.129-34)。因此,研究了筛查乳腺癌的其它一些技术。已经发现有多种乳腺癌标记可以帮助医生及时、准确地诊断,并提供明显更好的患者管理。遗憾的是,这些肿瘤标记都不是具有高灵敏度和特异性的“魔方”。因此,提高诊断准确性的备选方法是必要的。
提高诊断准确性的一个备选方法是发展一个探针组,其包含多种探针,每个探针特异地结合与乳腺癌有关的一种标记。所有候选探针都用ICC和/或IHC技术检测。在一些实施方案中,可以从细针抽吸物(FNA)中获得标本。在另外一些实施方案中,可以从细针活检(FNB)中获得标本。超声波和其它图像指导技术可以帮助通过FNA和FNB方法对肿瘤适当定位和采样。在一些实施方案中,从乳腺导管灌洗液中获得检测细胞。用于该目的的装置易于获得,可以通过一个类似于手动抽乳器的抽吸器采集细胞工作。用一个小吸力杯通过乳头吸取乳头吸出液(NAF)。NAF的存在有助于将导管的开口定位于乳头表面上。然后将一个可弯曲的小微导管插入将要灌洗的导管内约半英寸,以采集乳腺导管的细胞内层。
一旦采集到标本,即对该标本进行处理和分析。如以上对于肺癌所述,利用统计学分析设计探针组。在一些实施方案中,在处理过程中可能发生技术问题,如粗洗过程中细胞涂片或沉淀不与载玻片附着。然而,通过软件操作或者修改染色方案缓解这些问题,能够容易地解决这些问题。在一些实施方案中,利用一种自动采样标本并为诊断制备载玻片的装置处理并分析标本。预计最初将使用多种探针。为了保持高水平的灵敏度和特异性,应当为适当大小的探针组修剪探针的数量。最终探针的选择以预先确定的染色阳性肿瘤细胞的百分比阈值为基础。将利用复杂的统计学分析进行这些测定。由于检测恶性肿瘤的组测定法适用于实体瘤,并且在不同探针组中含有几种相同的肿瘤标记,所以该方法可以平行以及连续进行。这样,能够加快测定发展过程。
探针/标记文库
检查了包括关于癌症标记信息的不同来源。利用20%或更高的乳腺癌阳性率作为任意标准为检测和/或诊断乳腺癌的一个优选探针组选择探针。术语“20%或更高的阳性率”是指如果研究100个肿瘤病例,则20个或者更多的病例显示存在各种标记,其余的80个或者更少病例显示不含各种标记。一个优选探针组可能包括选自下列的分子标记:AE1/AE3、BCA-225、Bcl-2、BRCA-1、癌抗原15.3(CA15.3)、组织蛋白酶D、癌胚抗原(CEA)、C-erb-B2、E-钙粘蛋白、表皮生长因子受体(EGFR)、雌激素受体(ER)、巨囊性病液状蛋白15(GCDFP-15)、HOX-B3、Ki-67、MUC-1、p53、p65、孕酮受体(PR)、成视网膜细胞瘤(Rb)和转谷氨酰胺酶K(TGK)。关于本发明中使用的探针/标记文库的简述在下文给出。
AE1/AE3
这是抗角蛋白抗体的一种混合物。角蛋白是一组水溶性蛋白质,在上皮来源的细胞如乳腺导管(breast ductal)上皮中可形成中间丝。抗角蛋白AE1识别酸性亚家族的56和40kD的角蛋白。抗角蛋白AE3识别碱性亚家族。已经证明在鉴定乳腺导管癌的淋巴结转移方面,AE1和AE3比其它抗细胞角蛋白更有效(Elson,C.E.,D.Kufe和W.W.Johnston,乳腺癌中辅助淋巴结微转移的免疫组化检测和意义,AnalQuant Cytol Histol,1993.15(3):p.171-8)。Kowolik及同事(Kowolik,J.H.等人,应用针对pancytokerntins的抗体AE1/AE3检测乳腺哨兵淋巴结的微转移,Oncol Rep,2000.7(4):p.745-9)表示,根据AE1/AE3免疫组化染色,33个腋淋巴结中的32个有正确预测的乳腺癌转移。已经证明AE1/AE3是检测浸润上叶乳腺癌结节中隐蔽转移的最灵敏的标记(Kainz,C.等人,浸润上叶乳腺癌:免疫组化检测隐性区域性淋巴结转移,Anticancer Res,1993.13(1):p.73-4)。
BCA-225
该抗体识别一种人乳腺癌相关糖蛋白BCA-225(220-225kD),它在大小和分布上与其它乳腺癌抗原不同。然而,与针对乳腺癌抗原的其它癌症抗体不同,BCA-225不与良性或恶性胃肠组织反应。一项研究表明,94%的乳腺癌是BCA-225阳性的(Mesa-Tejada,R.等人,单抗鉴别的乳腺癌相关糖蛋白的免疫细胞化学分布,Am J Pathol,1988.130(2):p.305-14),而另外一项研究表明,根据免疫细胞化学,含乳腺癌的流出物有78%是BCA-225阳性的,而所有良性流出物都是阴性的。BCA-225是高度特异的鉴别物,在腺癌和反应性间皮细胞的鉴别诊断中非常有用(Loy,T.S.,A.A.Diaz-Arias和J.T.Bickel,恶性渗出物中细胞学诊断的BCA-225价值,Mod Pathol,1990.3(3);p.294-7)。
Bcl-2
细胞的存活阈值取决于外部因素或刺激提供的细胞死亡抑制与细胞死亡促进信号之间的平衡,以及细胞内分子。Bcl-2在这种测定中具有中心作用,其产物作为一种抗凋亡分子起作用(Daidone,M.G.等人,Bcl-2的临床研究和治疗有益于乳腺癌患者,Endocr Relat Cancer,1999.6(1):p.61-8)。Bcl-2蛋白已被证明有助于肿瘤生成,因为它能够与c-myc、ras或病毒基因协同转化细胞并使细胞无限增殖(Del Bufalo,D.等人,Bcl-2过量表达增加了人乳腺癌细胞系转移的可能,Faseb J,1997.11(12):p.947-53)。在大多数滤泡性淋巴瘤中,Bcl-2表达与t(14;18)易位最常相关。最近,已经在非血液恶性肿瘤中鉴定了Bcl-2。Alsabeh及同事确定Bcl-2是区别转移性乳腺癌与原发性肺癌和胃癌的一种有用的标记,它也是一种有用的预后指标(Alsabeh,R.等人,乳腺癌的bcl-2表达:可能的诊断应用,Mod Pathol,1996.9(4):p.439-44)。
BRCA-1
这是位于染色体17长臂上的一种肿瘤抑制基因。肿瘤抑制基因在调节细胞生长方面起关键作用。BRCA-1是一种核磷蛋白,通常作为细胞周期的负调节剂,并且可能是肿瘤进展的一种活性抑制剂。BRCA1基因的突变已经在80%的家族性乳腺癌中得到证明。在乳腺癌系和乳腺癌组织的散发病例中已经鉴定了mRNA水平的降低或BRCA1的异常亚细胞定位。BRCA1突变也与卵巢癌有关(Lee,W.Y.等人,BRCA1蛋白在正常乳腺组织和散发性侵入性导管癌中的免疫定位:与其它生物参数的相关性,Histopathology,1999.34(2):p.106-12)。Jarvis及同事(Jarvis,E.M.,J.A.Kirk和C.L.Clarke,核BRCA1表达在肺癌中丧失与高增殖性肿瘤表型相关,Cancer Genet Cytogenet,1998.101(2):p.109-15)发现,在大多数散发肿瘤中观察到BRCA-1核染色,但是在大多数家族性和早发乳腺肿瘤中核BRCA-1减少或者没有。在核BRCA-1与增殖标记Ki-67表达之间发现显著的反相关。另外一项研究表明,BRCA-1表达与其它预后标记有关,包括p53、c-erb-B2、Bcl-2、ER、组织学级别、肿瘤大小、腋窝淋巴结状态和年龄(Lee,W.Y.等人,BRCA1蛋白在正常乳腺组织和散发性侵入性导管癌中的免疫定位:与其它生物参数的相关性,Histopathology,1999.34(2):p.106-12)。
癌抗原15.3(CA-15.3)
癌抗原15.3是一种血清碳水化合物抗原。CA-15.3血清浓度升高与乳腺癌以及正常和良性乳腺疾病有关。然而,乳腺癌中CA-15.3的水平显著高于正常或良性乳腺疾病的水平(Barak,M.等人,CA-15.3,TPA和MCA是乳腺癌的标记,Eur J Cancer,1990.26(5):p.577-80)。Martoni及同事(Martoni,A.等人,CEA,MCA,CA 15.3和CA 549及其组合在表达和监测乳癌转移中的用途,Eur J Cancer,1995.31A(10):p.1615-21)证明,在检测转移性乳腺癌过程中,CA15.3的灵敏度高于其它肿瘤标记。
组织蛋白酶D
这是一种可溶性溶酶体天冬氨酸蛋白酶。它在内质网中合成为前原组织蛋白酶D。组织蛋白酶原D含有一个甘露糖-6-磷酸标签,组织蛋白酶原D被甘露糖-6-磷酸受体识别。在进入酸性溶酶体后,单链组织蛋白酶原D(52kD)被激活为组织蛋白酶D。组织蛋白酶D的基本作用是胞内和内化蛋白质的降解。80年代中期,首先报道了几种人类肿瘤组织的组织蛋白酶D水平升高(mRNA和蛋白质水平)。这些发现对组织蛋白酶D在肿瘤过程中可能的作用进行了大量研究。发现组织蛋白酶D的浓度对乳腺癌以及其它多种类型有很高的预测价值(Vetvicka,V.等人,原组织蛋白酶D活化肽与乳腺癌细胞相互作用分析,Int J Cancer,1997.73(3):p.403-9;Vetvicka,V.,J.Vetvickova和M.Fuse,原组织蛋白酶D和前列腺癌细胞的作用,Cancer Lett,1998.129(1):p.55-9)。Niu及同事(Niu,Y.等人,Potential Int J Cancer,2002.98(5):p.754-60)发现组织蛋白酶D是预测腋窝淋巴结阴性乳腺癌患者远端转移的一种可能的标记。
癌胚抗原(CEA)
癌胚抗原(CEA)由于在诊断和随访结肠直肠癌中的作用而众所周知。也报道了乳腺癌的CEA阳性。Alexiev(Alexiev,B.A.等人,Immunocytochemical from Diagn Cytopathol,1993.9(4):p.377-82)及同事报道,90%的原发性乳腺癌显示CEA阳性细胞质染色,而对于细针抽吸物和石蜡包埋的组织切片,良性乳腺疾病没有阳性。其它人报道,25%-64%的纤维腺瘤和囊性改变疾病为CEA阳性(Wittekind,C.,S.VonKleist和W.Sandritter,良性乳腺损伤患者组织和血清中CEA阳性,Oncodev Biol Med,1981.2(6):p.381-90)。
C-erb-B2
这是一种癌基因,其产物被称为癌蛋白。C-erb-B2也被称为Her2/neu,属于表皮生长因子受体(EGFR)家族,诱导c-erb-Bc-erb-B2和c-erb-B3。c-erb-B2的过量表达与乳腺、卵巢、肺、前列腺、胃和唾液腺内产生的高百分比的人类癌症有关。提示过量表达生长因子如c-erb-B2的肿瘤对少量生长因子的生长促进作用极其敏感,因此可能更具攻击性,乳腺癌细胞上的高水平e-erb-B2蛋白是较差预后的前兆这一发现支持了这一假说(Mitchell,R.N.和R.S.Cotran,Neoplasia,RobbinsPathologic Basis of Disease,R.S.Cotran,V.K.Kumar和T.Collins,Editors.1999,W.B.Sauders Company:Philadelphia.p.260-327)。Inaji及同事(Inaji,H.等人,乳头溢液中ErbB-2蛋白水平:早期乳腺癌诊断中的作用,Tumour Biol,1993.14(5):p.271-8)发现,乳腺癌患者的乳头溢液中c-erb-B2癌蛋白的水平升高。一项研究揭示,34%的乳腺癌细针抽吸物和除了一种之外的所有相应组织切片都是c-erb-B2癌蛋白阳性的(Jorda,M.,P.Ganjei和M.Nadji,乳腺癌抽出细胞学中c-erbB-7免疫染色,Diagn Cytopathol,1994.11(3):p.262-5)。
E-钙粘蛋白
该蛋白质被认为是乳腺中的主要细胞粘附分子。在细胞质中,E-钙粘蛋白与介导细胞骨架连接的α-和β-连环蛋白连接。另外,c-erbB-2癌蛋白也通过β-连环蛋白磷酸化使细胞粘附系统被破坏(Nagae,Y.等人,E-钙粘蛋白和C-erbB2基因产物在侵入性导管型乳腺癌中的表达,JNippon Med Sch,2002.69(2):p.165-71)。在乳腺癌中发现E-钙粘蛋白表达降低(Mitchell,R.N.和R.S.Cotran,Neoplasia,Robbins PathologistBasis of Disease,R.S.Cotran,V.K.Kumar,and T.Collins,Editors.1999,W.B.Sauders Company:Philadelphia.p.260-327)。
表皮生长因子受体(EGFR)
表皮生长因子受体(EGFR)是一种跨膜糖蛋白。它在细胞生长和分化中起重要作用。EGFR表达已经在大量正常组织中得到证明,而过量表达与多种肿瘤有关。Sue及同事(Suo,Z.等人,良性和恶性乳腺损伤中的I型蛋白质酪氨酸激酶,Histopathology,1998.33(6):p.514-21)检查了乳腺肿瘤组织中4个EGFR家族成员的表达模式,发现53%的乳腺肿瘤组织为EGFR强阳性,良性肿瘤也表达EGFR蛋白,但是均为较低、中等的水平。在一组浸润导管癌中发现EGFR表达与恶性等级提高之间的联系。
雌激素受体
雌激素控制多种生理和与疾病有关的过程,最明显的是生殖、骨的再建和乳腺癌,它们的作用通过被称为雌激素受体(ER)的经典受体转导。该单克隆抗体与雌激素受体的67kD多肽链的N端结构域(A/B区)反应,显示只有很低的或者没有细胞质反应性的核染色图案。在肿瘤组织中,ER与乳腺癌上皮细胞和来源于其它雌激素依赖组织的人肿瘤强烈反应。含有在核中表达ER的细胞的癌症通常具有较好的预后,因为这些阳性肿瘤细胞较好地分化,并且能够响应激素操作。一种药物它莫西芬经常用于此目的(Barnes,D.M.等人,雌激素受体的免疫组化确定:染色评价之不同方法比较和与乳腺癌患者临床结果的相关性,Br JCancer,1996.74(9):p.1445-51;Pichon,M.F.等人,2257例可操作乳腺癌长期随访后的类固醇受体的预后价值,Br J Cancer,1996.73(12):p.1545-51)。
巨囊性病液状蛋白15(GCDFP-15)
巨囊性病液状蛋白15(GCDFP-15)是大汗腺、外分泌腺、小唾液腺、支气管淋巴结和乳腺化生上皮表达的一种糖蛋白(15kD)。具有顶质分泌特征的乳腺癌(原发和转移损伤)表达GCDFP-15抗原。在乳腺外佩吉特氏病中,CDFP-15为阳性,而检测的其它肿瘤为阴性。大量组织病理学研究表明,GCFDP-15是外科标本中乳腺癌的一种特异性标记。Fiel及同事(Fiel,M.I.等人,GCDFP-15(BRST-2)作为乳腺癌细胞学标本中的特异性免疫细胞化学标记,Acta Cytol,1996.40(4):p.637-41)也证明了GCFDP-15是细胞学标本中乳腺癌的一种特异性免疫细胞化学标记。
HOX-B3
同源框(HOX)基因编码含有61个氨基酸的DNA结合同源域的蛋白质,与正常癌发生和组织发生过程中其它基因的转录调节有关。I类HOX基因在不同的人染色体上组成4个簇,在这些簇的每一个内基因簇的顺序上非常保守。已经在许多肿瘤转化的细胞中报道了HOX基因产物的再表达,HOX似乎极有可能是另外一类与正常发育和癌发生以及肿瘤进展有关的癌胚抗原。HOX-3是HOX基因产物(HOX-B3、-B4和-C6)之一。一项研究表明,90%以上的乳腺癌为HOX-B3阳性(Bodey,B.等人,乳腺癌中同源框B3、B4和C6基因产物的免疫细胞化学检测,Anticancer Res,2000.20(5A):p.3281-6)。
Ki-67
这是在增殖的正常和肿瘤细胞中表达的一种核蛋白。Ki-67的表达在细胞周期中被称为G1晚期、S、M和G2的阶段发生。然而,在G0期无法检测到抗原。研究表明,Ki-67的表达与雌激素和孕酮受体反相关,提示高Ki-67水平似乎表征一个更具攻击性的表型和较差的预后(Ceccarelli,C.等人,用不同预后指示物定量p21(waf-1)/p53免疫组化分子限定原发侵入性乳腺癌的组,Int J Cancer,2001.95(2):p.128-34;Ceccarelli,C.等人,乳腺癌中的成视网膜细胞瘤(B1)基因产物表达:与Ki-67生长级分和生物病理图谱的相关性,J Clin Pathol,1998.51(11):p.818-24)。
MUC-1
上皮粘蛋白是上皮细胞及上皮癌分泌的糖蛋白。已经鉴定了至少9种粘蛋白基因,它们的产物MUC1-MUC9在不同上皮中表达。MUC1是乳腺上皮细胞中表达的一种粘蛋白,而MUC2和MUC3主要是肠粘蛋白。MUC-1抗原是一种细胞表面糖蛋白。该抗原在90%的人乳腺癌中以正常组织中没有的形式富含(Diaz,L.K.,E.L.Wiley和M.Morrow,在导管癌中乳房原位表达上皮粘蛋白Muc1,Muc2和Muc3,Breast J,2001.7(1):p.40-5)。一项研究(Croce,M.V.等人,正常、良性和恶性人哺乳上皮组织中肿瘤相关抗原的表达,Anticancer Res,1997.17(6D):p.4287-92)表明,良性乳腺组织表达低强度的MUC-1,只限于顶端细胞表面膜和腔碎片。
p53
这是肿瘤抑制基因。在大量肿瘤和肿瘤细胞系中存在高浓度的p53蛋白,而在正常细胞和组织中仅少量存在。在肿瘤细胞中的表达提高可能是由p53蛋白的突变或与其它蛋白质的复合引起的。p53的基因位于染色体17p上,在乳腺癌、肺癌、结肠癌、卵巢癌、睾丸癌、膀胱癌、脑癌、黑素瘤、某些类型的白血病和神经纤维肉瘤中丢失的常见等位基因位点。肿瘤细胞表达p53蛋白可以通过免疫组织化学检测,显示核染色图案。已经证明p53癌蛋白的表达与乳腺癌较差的预后有关(Lee,W.Y.等人,BRCA1蛋白在正常乳腺组织和散发性侵入性导管癌中的免疫定位:与其它生物参数的相关性,Histopathology,1999.34(2):p.106-12;Midulla,C.等人,p53,nm23-HI,Ki67和DNA信体免疫组化表达:与淋巴结状态和其它乳腺癌临床病理参数的相关性,Anticancer Res,1999.19(5B):p.4033-7)。
p65
这种65kD的癌胚蛋白已经被确定为是类固醇/甲状腺基因超家族的一个新成员,其配体尚不清楚。已经提出,这种受体可能在肿瘤发展中起重要作用。p65形式的改变与可能导致乳腺癌的某些激素的过量产生有关(Hanausek,M.等人,癌胚蛋白65:类固醇/甲状腺受体超家族的新成员,Cancer Detect Prev,1996.20(2):p.94-102)。Mirowski及同事(Mirowski,M.等人,65-KDa癌胚蛋白在乳癌中的血清学和免疫组化检测,Eur J Cancer,1994.30A(8):p.1108-13)揭示90%的乳腺癌患者血清为p65阳性,根据免疫组织化学评价,80%的相应活检组织为阳性。结果表明p65可能是乳腺癌的一种潜在的血清和/或免疫组化标记。
孕酮受体(PR)
抗孕酮受体(PR)的单克隆抗体显示核染色图案。在肿瘤组织中,PR在乳腺癌和来源于其它依赖孕酮的组织的人肿瘤的上皮细胞中强烈表达,而在正常组织中,在乳腺和子宫中为阳性。乳腺癌中PR阳性的意义还不太清楚。ER阳性的癌症通常也是PR阳性的。但是,PR阳性但是ER不阳性的癌可能预后较差(Blanco,G.等人,乳腺癌中雌激素和孕酮受体:与肿瘤组织病理学和患者存活的关系Anticancer Res,1984.4(6):p.383-9)。一项研究表明,PR在所有皮肤转移乳腺肿瘤中都为阳性,而只有一种肿瘤为ER阳性(Wallace,M.L.和B.R.Smoller,雌激素/孕酮受体和BRST-2标记在转移性导管和小叶乳腺癌至皮肤的差异敏感性,Am J Dermatopathol,1996.18(3):p.241-7)。
成视网膜细胞瘤(Rb)
这是肿瘤抑制基因之一。成视网膜细胞瘤蛋白(pRb)是一种由成视网膜细胞瘤基因编码的蛋白质,其作用是在G0/G1期调节细胞周期。Rb功能的丧失导致细胞生长失去控制。成视网膜细胞瘤基因的灭活在包括乳腺癌在内的不同类型的癌症中得到证明。成视网膜细胞瘤基因的表达不足促进了乳腺肿瘤的攻击性和肿瘤细胞的快速增殖(Bieche,I.和R.Lidereau,13q14杂合丧失与人乳腺癌中RB1基因不足表达相关,MolCarcinog,2000.29(3):p.151-8)。Ceccarelli及同事(Ceccarelli,C.等人,乳腺瘤中成视网膜细胞瘤(RB1)基因产物表达:与Ki-67生长部分和生物病理的相关性,J Clin Pathol,1998.51(11):p.818-24)研究了攻击性乳腺癌中的pRb表达和肿瘤标记Ki-67、ER/P、p53和EGFR,发现在检查的大多数乳腺癌中,pRb的表达与增殖活性平行,提示在这些情况下,该蛋白质在调节细胞周期方面具有正常行为。相反,在pRb免疫染色丢失的情况下,高攻击性的特异性因子如EGFR和p53表达、雌激素受体/孕酮受体阴性状态和高K67的组合表达似乎可以表征一种更具攻击性的表型。
转谷氨酰胺酶K(TGK)
转谷氨酰胺酶K尚未对乳腺癌诊断充分研究。但是,Friedrich及同事(Friedrich,M.等人,正常乳腺组织和乳腺癌中转谷氨酸酶K和增生及分化标记的免疫反应性之间的相关性,Eur J Gynaecol Oncol,1998.1(5):p.444-8)证实,在30例乳腺癌的17例中检测到由弱到强的膜染色,而90%的正常乳腺组织显示没有对TGK的免疫反应性。结果提示,通过调节细胞-基质相互作用,或者通过帮助基质装配和组织重建(remodeling),乳腺癌中TGK的上调在肿瘤细胞攻击性的调节中可能起重要作用。
VI.子宫颈癌
已经发现多种子宫颈癌标记可以帮助医生及时、准确地做出诊断,并提供明显更好的患者管理。遗憾的是,这些肿瘤标记都不是具有高灵敏度和特异性的“魔方”。因此,提高诊断准确性的备选方法是必要的。
提高诊断准确性的一个备选方法是发展一个探针组,其包含多种探针,每个探针特异地结合与子宫颈癌有关的一种标记。所有候选探针都用ICC和/或IHC技术检测。在一些实施方案中,可以利用巴氏涂片获得标本。常规巴氏涂片使用手术铲和手术刷采集子宫颈细胞。对于基于液体的制备(LBP)巴氏试验,可以用帚、刷子和气囊采集细胞。例如,可以使用Cytyc′s Thin Prep产品和TriPath′s SurePrepTM产品。另外,也可以利用Molecular Diagnostics′“e2 CollectorTM”获得子宫颈细胞。它是一种硅酮胶囊,形状类似于子宫颈的镜像。当向子宫颈膨胀时,细胞附着于胶囊表面,用一步采集宫颈内膜和外宫颈细胞。
一旦采集到标本,即对该标本进行处理和分析。如以上对于肺癌所述,利用统计学分析设计探针组。在一些实施方案中,在处理过程中可能发生技术问题,如粗洗过程中细胞涂片或沉淀不与载玻片附着。然而,通过软件操作或者修改染色方案缓解这些问题,能够容易地解决这些问题。在一些实施方案中,利用一种自动采样标本并为诊断制备载玻片的装置处理并分析标本。预计最初将使用多种探针。为了保持高水平的灵敏度和特异性,应当为适当大小的探针组修剪探针的数量。最终探针的选择以预先确定的染色阳性肿瘤细胞的百分比阈值为基础。将利用复杂的统计学分析进行这些测定。由于检测恶性肿瘤的组测定法适用于实体瘤,并且在不同探针组中含有几种相同的肿瘤标记,所以该方法可以平行以及连续进行。这样,能够加快测定发展过程。
流行病学研究提示,子宫颈癌是由性传播微生物引起的,主要怀疑人乳头状瘤病毒(HPV)。已经鉴定了接近70个遗传学上不同的HPV类型。16和18型,较少见的31、33、35和51型在约55%的鳞状上皮细胞癌及其前体(重度发育异常和原位癌)中发现。与子宫颈癌不同,恶性潜能低的生殖器疣与HPV-6和HPV-11的“低危险”类型有关。(Mitchell,R.N.和R.S.Cotran,Neoplasia,Robbins Pathologic Basis of Disease,R.S.Cotran,V.Kumar,and T.Collins,Editors.1999,W.B.SaundersCompany:Philadelphia.p.260-327)。
HPV感染的分子诊断比常规巴氏涂片更灵敏、更特异,在评价巴氏涂片结果不明确的妇女中价值提高。Digene’s hybrid Capture II HPVDNA试验在检测高等级发育异常患者方面非常有效。(Solomon,D.,M.Schiffman和R.Tarone,患有非典型未确定意义鳞状细胞患者的三种处理策略比较:随机试验产生的基线,J Natl Cancer Inst,2001.93(4):p.293-9)。另外一种HPV方法是检测Molecular Diagnostics发展的HPV16和HPV 18的E6和E7蛋白。HPV-16和HPV-18的致癌潜能与这两种早期病毒基因产物有关。(Huibregtse,J.M.和S.L.Beaudenon,HPVEb蛋白在细胞转化中的机制,Semin Cancer Biol,1996.7(6):p.317-26)和zur Hausen,H.,乳头瘤病毒和p53Nature,1998.393(6682):p.217)。Roche Diagnostics最近从巴斯德研究所获得了HPV试验的专利。
探针/标记文库
检查了包括关于癌症标记信息的不同来源。利用20%或更高的乳腺癌阳性率作为任意标准为检测和/或诊断乳腺癌的一个优选探针组选择探针。术语“20%或更高的阳性率”是指如果研究100个肿瘤病例,则20个或者更多的病例显示存在各种标记,其余的80个或者更少病例显示不含各种标记。一个优选探针组可能包括选自下列的分子标记:癌胚抗原(CEA)、C-erb-B2、细胞周期蛋白E、E6/E7、表皮生长因子受体(EGFR)、Ki-67、p16、p53、增殖的细胞核抗原(PCNA)、存活素、端粒酶和血管内皮生长因子。关于本发明中使用的探针/标记文库的简述在下文给出。
癌胚抗原(CEA)
这种癌胚抗原是一种高度糖基化的细胞表面蛋白质,在多种人类肿瘤中过量表达,已经用作结肠直肠癌患者的疾病进展的肿瘤标记。以前的报道发现,子宫颈癌患者的血清CEA水平升高,但是这与疾病的进展无关(Borras,G.等人,宫颈癌中肿瘤抗原CA19.9、CA125和CEAGynecol Oncol,1995.57(2):p.205-11)。Sarandakou及同事(Sarandakou,A.等人,妇科癌症中肿瘤相关抗原CEA、CA125、SCC和TPS,Eur JGynaecol Oncol,1998.19(1):p.73-7)证明,与良性妇科疾病相比,子宫颈癌患者的血清CEA水平显著提高。另外一项研究报道,根据免疫组织化学染色,宫颈上皮内瘤(CIN III)和原位癌(CIS)中CEA表达提高,但是这些患者的血清CEA水平没有升高。结果提示,在早期诊断子宫颈发育异常或癌症方面,CEA免疫染色可能比血清CEA更灵敏(Tendler,A.,H.L.Kaufman和A.S.Kadish,宫颈上皮内瘤(3级)和宫颈鳞状细胞癌中癌胚抗原表达增加,Hum Pathol,2000.31(11):p.1357-62)。
C-erb-B2
该癌蛋白是一种185kD的膜结合糖蛋白。它是细胞质膜上的一种受体,与表皮生长因子受体(c-erb-B1)同源。几个研究小组独立地发现了c-erb-B2癌基因,因此有不同的名称,包括HER2和neu(Coussens,L.等人,带有充分EGF同源性之酪氨酸激酶受体与neu癌基因共享染色体位置,Science,1985.230(4730):p.1132-9;Bargmann,C.I.,M.C.Hung和R.A.Weinberg,neu癌基因编码表皮生长因子受体相关蛋白,Nature,1986.319(6050):p.226-30)。c-erb-B2的过量表达已经在14%-38%的子宫颈癌患者中得到证明,并且发现与较差的预后有关(Hale,R.J.等人,c-erbB2表达在宫颈癌中的预后价值,J Clin Pathol,1992.45(7):p.594-6)。其它一些研究(Sharma,A.等人,如非荧光原位杂交技术在石蜡切片上检测C-erbB-2(HER-2/Neu)癌基因在宫颈癌中频繁扩增,Oncology,1999.56(1):p.83-7;Mitra,A.B.等人,ERBB2(HER2/neu)癌基因在宫颈鳞状细胞癌中频繁扩增,Cancer Res,1994.54(3):p.637-9)在子宫颈癌中发现c-erb-B2的频繁扩增。根据酶联免疫吸附测定(ELISA)和免疫组织化学(IHC)测定,C-erb-B2在子宫颈癌中的表达增加(Kim,J.W.,Y.T.Kim和D.K.Kim,EGFR和C-erbB-2癌蛋白状态相关性以及宫颈癌中对新佐剂化疗的应答,Yonsei Med J,1999.40(3):p.207-14;Ngan,H.Y.等人,宫颈鳞状细胞癌中表皮生长因子受体和c-erbB2的异常表达:与人乳头状瘤病毒的相关性和预后,Tumour Biol,2001.22(3):p.176-83)。
细胞周期蛋白E
被称为细胞周期蛋白的蛋白质和被称为细胞周期蛋白依赖性激酶(CDKs)的一组相关调节蛋白调节主要的检查点。细胞周期蛋白E是一种50kD的蛋白质,在细胞周期的G1晚期它与CDK2复合。癌发生的特征在于细胞周期的解调节。尽管在人类恶性肿瘤中,p53仍然是最重要的细胞周期调节剂,但是有越来越多的证据表明,细胞周期蛋白和细胞周期蛋白依赖性激酶(CDK)抑制剂的异常表达被认为是不同人癌症的恶变中最重要的事件之一。Cho及同事(Cho,N.H.,Y.T.Kim和J.W.Kim,宫颈癌中G1细胞周期蛋白和HPV的相关性,Int J GynecolPathol,1997.16(4):p.339-47)发现在正常子宫颈上皮中细胞周期蛋白E不表达,但是在HPV阳性病例中显著较高。另外一项研究揭示,攻击性子宫颈癌或宫颈发育异常患者的细胞周期蛋白E指数(CEI)显著高于对照患者(Tae Kim,Y.等人,宫颈癌中细胞周期蛋白E和p27(KIPI)的表达,Cancer Lett,2000.153(1-2):p.41-50)。
E6/E7
人乳头状瘤病毒(HPV)感染与子宫颈癌有关。E1和E2乳头状瘤病毒蛋白在感染早期表达,调节DNA复制。E2蛋白激活并抑制由不同HPV启动子开始的转录。在病毒DNA整合到细胞基因组内的某些阶段,E2基因遭到破坏或者灭活。这一事件导致E6和E7病毒癌基因的抑制。E6和E7影响细胞增殖、基因表达和向恶性肿瘤的进展(Rosales,R.,M.Lopez-Contreras和R.R.Cortes,针对人乳头状瘤病毒HPV16和18E7、E6以及E7蛋白的抗体:与存在乳头状瘤病毒DNA的相关性,J MedVirol,2001.65(4)736-44)。研究表明,对于HPV 16或18,E6/E7 mRNA在良性子宫颈疾病中检测不到。然而,60%的原位子宫颈腺癌(ACIS)和24%的子宫颈腺癌表达HPV 16癌基因。在27%的ACIS和51%的攻击性子宫颈癌中检测到HPV 18癌基因的表达(Riethdorf,S.等人,在宫颈和宫颈内膜腺癌中HPV16和18E6/E7癌基因表达的分析,CancerDetection and Prevention,2000.24(Supplement1))。Rosales及同事(Rosales,R.,M.Lopez-Contreras和R.R.Cortes,针对血清中人乳头状瘤病毒HPV16和18E2、E6和E7蛋白的抗体:与存在乳头状瘤病毒DNA的相关性,J Med Virol,2001.65(4):p.736-44)研究了172名感染HPV的妇女,分别在52%和37%的患者中发现抗HPV 16E6和E7蛋白的抗体。分别在35%和45%的患者中发现抗HPV 18E6和E7蛋白的抗体。另外一项研究表明,对于HPV16和HPV18,利用酶联免疫吸附测定(ELISA)在48%的子宫颈阴道清洗物和29%的子宫颈癌患者血清中检测到E6/E7蛋白。
表皮生长因子受体(EGFR)
表皮生长因子受体(EGFR)是一种跨膜糖蛋白。与其配体的结合启动了事件链,导致DNA合成、细胞增殖和细胞分化。已经证实,EGFR的激活是由于许多不同类型的实体瘤的生长和扩散。EGFR的上调和过量表达与癌症相关的许多过程有关,包括失去控制的细胞增殖和凋亡的预防(Wu,X.等人,由人结肠直肠癌细胞系中抗表皮生长因子受体单抗诱导的凋亡及通过胰岛素的延迟,J Clin Invest,1995.95(4):p.1897-905)。许多上皮肿瘤表达高水平的EGFR,这与晚期疾病和较差的临床预后有关,包括子宫颈癌和胃癌,以及结肠直肠癌、头颈癌(Salomon,D.S.等人,人恶病质中表皮生长因子相关肽及其受体,Crit Rev Oncol Hematol,1995.19(3):p.183-232)。Kim及同事(Kim,J.W.等人,宫颈癌中表皮生长因子受体的表达,Gynecol Oncot,1996.60(2):p.283-7)证明,在40名攻击性子宫颈癌患者的29名中(72%)和20名宫颈上皮内瘤(CIN)患者的5名中发现EGFR的过量表达。EGFR的过量表达似乎是一个不利的预后因素,而与HPV16/18的存在无关(Kedzia,W.等人,在外阴癌HPV-16阳性和阴性中免疫组化检查生癌c-erb-b2、egf-r蛋白和抗生癌p53蛋白,Ginekol Pol,2000.71(2):p.63-9)。
Ki-67
这是在增殖的正常和肿瘤细胞中表达的一种核蛋白。Ki-67的表达在细胞周期被称为晚期G1、S、M和G2的阶段发生。然而,在G0期检测不到抗原(Cattoretti,G.等人,针对重组部分Ki-67抗原(MIB1和MIB3)的单抗检测微波加工、甲醛固定的石蜡切片中增殖细胞,J.Pathol,1992.168(4):p.357-63)。Bar及同事(Bar,J.K.等人,p53,c-erbB2,Ki-67表达和宫颈癌和宫颈发育异常中HPV感染的关系,Anticancer Res,2001.21(2A):p.1001-16)证明,HPV感染,特别是伴随着发育异常中增殖活性的提高,可确定易发展恶性过程的细胞亚群。这得到了结果的支持,结果表明发现Ki-67活性的HPV阳性肿瘤和发育异常患者的百分比高于HPV阴性的患者。
p16
该基因是一种细胞周期蛋白依赖性激酶抑制剂(CDKI),可以通过作为一种肿瘤抑制基因起作用,负调节细胞周期。持续感染高危险类型的人乳头状瘤病毒(HPVs)诱发宫颈发育异常。两种病毒癌基因E6和E7的表达提高触发发育异常损伤的向外生长,这两种基因都与不同的细胞周期调节蛋白相互作用。其中有成视网膜细胞瘤基因产物pRB,它被E7灭活。pRB产物抑制依赖细胞周期蛋白的激酶抑制剂基因p16(INK4a)的转录。发育异常的子宫颈细胞中病毒癌基因的表达提高可能是p16(INK4a)表达提高的反映。Sano及同事(Sano,T.等人,与在宫颈癌和宫颈内皮瘤中完整成视网膜细胞瘤蛋白表达相关的p16蛋白的免疫组化过量表达,Pathol Int,1998.48(8):p.580-5)证明,除了几种低等级CIN损伤外,在所有VIN和攻击性癌症病例的核和细胞质中观察到对p16蛋白的强免疫反应性。研究也表明,p16(INK4a)的过量表达是子宫颈的发育异常和肿瘤上皮细胞的一种特异性标记,p16与Ki-67和细胞周期蛋白E一起是HPV相关子宫颈肿瘤的补合的替代生物标记(Klaes,R.等人,过量表达p16(INK4A)作为子宫颈发育异常和癌上皮细胞特异性标记,Int J Cancer,2001.92(2):p.276-84;Keating,J.T.,T.Ince和C.P.Crum,宫颈癌筛选和诊断中HPV感染的代理生物标记,Adv AnatPathol,2001.8(2):p.83-99)。
p53
这是众所周知的肿瘤抑制基因之一。p53蛋白少量存在于正常细胞和组织中,但是在大量肿瘤和肿瘤细胞系中高浓度存在。因此,它可以通过免疫组织化学(核染色)检测。肿瘤细胞中的浓度提高可能是由于与其它蛋白质复合或者p53蛋白的突变引起的。p53基因位于染色体17p上,是在许多肿瘤中丢失的一个常见的等位基因位点。Vassallo及同事(Vassallo,J.等人,宫颈内皮瘤中高危HPV和p53蛋白表达,Int JGynaecol Obstet,2000.71(1):p.45-8)证明,CIN中p53蛋白的过量表达与高危HPV感染有关。利用Western印迹分析和免疫组织化学,在原发性子宫颈癌中发现p53基因重排和p53蛋白的过量表达(Sahu,G.R.等人,原发宫颈癌中伴有p53蛋白过量表达的p53基因重排,Oncol Rep,2002.9(2):p.433-7)。
增殖细胞核抗原(PCNA)
这种增殖细胞核抗原(PCNA)是DNA聚合酶δ的一种辅因子。PCNA在细胞周期的S期和与DNA修复有关的DNA合成过程中表达。PCNA在广泛正常和恶性组织中的增殖细胞中表达。PCNA定位于核中。Kobayashi和其他人证明,在重度发育异常和原位癌(CIS)中,PCNA与有丝分裂指数之间有密切相关性(Kobayashi,I.等人,通过增殖细胞核抗原免疫染色和银结合嗜银性核器官区染色分析子宫颈中发育异常和原位癌的增殖活性,Hum Pathol,1994.25(2):p.198-202;Smela,M.,M.Chosia和W.Domagala,宫颈内皮瘤中增殖细胞核抗原PCNA表达,An immunohistochemical study.Pol J Pathol,1996.47(4):p.171-4)。另外一项研究表明,PCNA似乎是比Ki-67更好的CIN免疫反应性的标记(Maeda,M.Y.等人,PCNA、Ki-67和p53表达速率根据宫颈损伤中上皮区域的相关性,Pathologica,2001.93(3):p.189-95)。
存活素
这是一种142个氨基酸的蛋白质,在细胞周期的G2/M期表达。它是一种凋亡抑制剂,在常见的人癌症中选择性过量表达,但是在正常组织中不表达,与攻击性疾病和不利的后果有关(Lehner,R.等人,IAP蛋白质存活素在膀胱粘膜和过渡性细胞癌中的免疫组化定位,ApplImmunohistochem Mol Morphol,2002.10(2):p.134-8)。在子宫颈癌组织中检测到存活素mRNA(Saitoh,Y.,Y.Yaginuma和M.Ishikawa,宫颈癌中Bcl-2、Bax和存活素基因的分析,Int J Oncol,1999.15(1):p.137-41)。存活素在良性子宫颈粘膜、宫颈发育异常和浸润性鳞状细胞癌中的免疫组化定位显示在正常粘膜、低等级发育异常和高等级发育异常中检测到核染色。在HPV感染的形态学证据的情况下,染色强度最大(Frost,M.等人,在良性宫颈粘膜、宫颈发育不全和侵入性鳞状细胞癌中存活素的免疫组化定位,Am J Clin Pathol,2002.117(5):p.738-44)。
端粒酶
这是一种核糖核苷酶,它延长和保持真核染色体的端粒。不表达端粒酶的细胞通过每次细胞分裂连续缩短端粒,最终导致染色体的不稳定性、老化和细胞死亡。已经假设,高危人群乳头状瘤病毒(HPVs)感染与其它细胞事件一起在子宫颈癌的发展中起重要作用。合成端粒重复片段的端粒酶复合物的激活与体外无限增殖表型的获得有关,在人类癌症中经常发现(Anderson,S.等人,宫颈癌中端粒酶活化Am J Pathol,1997.151(1):p.25-31)。研究表明,端粒酶只是存在于子宫颈癌和宫颈上皮内瘤III度损伤的一个亚类中,但是在正常宫颈组织中不存在。端粒酶的激活与高危HPV感染、无活性p53蛋白积累和宫颈损伤中细胞增殖增加有关(Snijders,P.J.等人,端粒酶活性仅存在于子宫颈癌和宫颈上皮内瘤III度损伤的亚类:与其催化亚基升高的位使RNA水平和高危人乳头状瘤病毒DNA强烈相关,Cancer Res,1998.58(17):p.3812-8;Nair,P.等人,端粒酶,p53以及子宫颈中人乳头状瘤病毒感染,Acta Oncol,2000.39(1):p.65-70)。另一项研究表明,在96%的宫颈癌标本和69%的恶化前子宫颈刮取物中检测到端粒酶活性,但是在对照子宫切除标本和正常健康者的子宫颈刮取物中未检测到。这表明端粒酶是用于宫颈癌筛查的一种极其灵敏、特异的分子标记(Reddy,V.G.等人,用于子宫颈癌筛查的端粒酶-A分子标记,Int J Gynecol Cancer,2001.11(2):p.100-6)。
血管内皮生长因子(VEGF)
血管内皮生长因子(VEGF)是一种重要的血管生成因子和一种内皮细胞特异的丝裂原。血管发生在癌发生和肿瘤进展后期起重要作用,在远端转移的发展中特别重要。已知VEGF是最重要的血管发生诱导剂之一,在子宫颈癌中上调。Lopez-Ocejo及同事(Lopez-Ocejo,O.等人,癌基因和肿瘤血管发生:HPV-16E6原癌蛋白以非依赖p53的方式活化血管内皮生长因子(VEGF)基因启动子,Oncogene,2000.19(40):p.4611-20)证明,HPV-16E6-阳性细胞通常表达高水平的VEGF信息,提示HPV癌蛋白E6通过直接刺激VEGF基因导致肿瘤血管发生的可能性。另一项研究证明VEGF的表达与宫颈癌中血管发生的促进有关,在早期癌症浸润中起重要作用(Kodama,J.等人,血管内皮生长因子在早期侵入子宫颈癌中的提示,Eur J Cancer,1999.35(3):p.485-9)。
VII.实施例I-VI概述
上述实施例I-VI提供了在探针组中包括的优选探针/标记,用于检测和/或诊断肺癌、结肠直肠癌、膀胱癌、前列腺癌、乳腺癌和子宫颈癌。图8a-c提供了用于每种癌症类型的优选探针/标记的概括。图8a-c也确定了哪种标记可用于一般的癌症检测用途,以及由于对特定癌症类型的特异性更有价值的标记。例如,EGFR和Ki-67可用于一般癌症检测。BL2-10D1、CD44v3、胶原酶、COX-1、HLA-DR、HSP-90、IL-6、IL-10、Lewis X、AP-22、TGF-β1、TGF-1I、TGF1II和UBC可用于膀胱癌的检测和/或诊断,AE1/AE3、BCA-225、BRCA-1、CA-15.3、组织蛋白酶D、GCDFP-15、HOX-B3、p65、PR和TGK可用于乳腺癌的检测和/或诊断,细胞周期蛋白E、E6和E7可用于子宫颈癌的检测和/或诊断,AKT、双调蛋白、β-连环蛋白、Bax、BPG、Cdk/2/cdc2、cFLIP、Cuipto-I、Ephrin-B2、Ephrin-B4、Fas-L、HMGI(Y)、hMLH1、溶菌酶、基质溶解因子、p68、S100A4和YB-1可用于结肠直肠癌的检测和诊断,C-MET、细胞周期蛋白A、FGF-2、Glut-1、Glut-3、HERA、MAGE-1、MAGE-3、粘蛋白1、Nm23、p120、SP-1、SP-B、凝血调节蛋白和TTF-1可用于肺癌的检测和诊断;34βE12、B72.3、FAS、ID-1、激肽释放酶2、Leu 7、P504S、PAP、PIP和PSA可用于前列腺癌的检测和/或诊断。
参考文献:
[1]Goldberg-Kahn,B.,Healy,J.C.和Bishop,J.W.(1997)诊断成本:建立单一放射照相肺损伤的四种不同策略的比较.Chest 111,870-6。
[2]O′Donovan,P.B.(1997)肺癌的放射学表现.Oncology(Huntingt)11,1387-402;讨论1402-4。
[3]worrell,J.A.(1995)中央气道的放射学.Otolaryngol Clin NorthAm 28,701-20。
[4]Henschke,C.I.,Miettinen,O.S.,Yankelevitz,D.F.,Libby,D.M.和Smith,J.P.(1994)癌症的放射照相筛查.提出的必需研究的示例.ClinImaging 18,16-20。
[5]Lam,S.,Kennedy,T.,Unger,M.,Miller,Y.E.,Gelmont,D.,Rusch,V.,Gipe,B.,Howard,D.,LeRiche,J.C,Goldman,A.和Gazdar,A.F.(1998)通过荧光支气管镜检查法定位支气管上皮内肿瘤损伤.Chest 113,696-702。
[6]Sazon,D.A.,Santiago,S.M.,Soo Hoo,G.W.,Khonsary,A.,Brown,C,Mandelkern,M.,Blahd,W.和Williams,A.J.(1996)肺癌检测和分期中的氟脱氧葡萄糖-正电子发射断层扫描术.Am J Respir Crit Care Med 153,417-21。
[7]Lowe,V.J.,DeLong,D.M.,Hoffman,J.M.和Coleman,R.E.(1995)FDG-PET评价肺恶性肿瘤的最佳扫描方案.J Nucl Med 36,883-7。
[8]Lowe,V.J.,Fletcher,J.W.,Gobar,L.,Lawson,M.,Kirchner,P.,Valk,P.,Karis,J.,Hubner,K.,Delbeke,D.,Heiberg,E.V.,Patz,E.F.和Coleman,R.E.(1998)正电子发射断层扫描术在肺结核中的前瞻性研究.JClin Oncol 16,1075-84。
[9]Raab,S.S.,Homberger,J.和Raffin,T.(1997)肺癌诊断中痰细胞学的重要性:一种成本效率分析.Chest 112,937-45。
[10]Franklin,W.A.(1998)肺癌检测的新分子和细胞方法.《(肺癌生物学》(Biology of Lung Cancer),529-570页。
[11]Kern,W.H.(1988)痰和尿细胞学的诊断准确性.Acta Cytol 32,651-4。
[12]Mehta,A.C.,Marty,J.J.和Lee,F.Y.(1993)痰细胞学.Clin ChestMed 14,69-85。
[13]Gledhill,A.,Bates,C,Henderson,D.,DaCosta,P.和Thomas,G.(1997)痰细胞学:有限的作用.J Clin Pathol 50,566-8。
[14]Steffee,C.H.,Segletes,L.A.和Geisinger,K.R.(1997)在515例原发性肺恶性肿瘤的诊断中改变细胞学和组织学应用模式.Cancer 81,105-15。
[15]Zaman,M.B.(1991)肺细胞学.Clin Lab Med 11,293-315。
[16]Flehinger,B.J.和Melamed,M.R.(1994)肺癌筛查现状.ChestSurg Clin N Am 4,1-15。
[17]Koss,L.G.,Melamed,M.R.和Goodner,J.T.(1964)肺细胞学:1952年7月1日到1960年12月31日的诊断结果的简单调查.Acta Cytol 8,104。
[18]Saccomanno,G.,Saunders,R.P.,Ellis,H.,Archer,V.E.,Wood,B.G.和Beclder,P.A.(1963)痰中癌或非典型细胞的浓度.Acta Cytol 5,305-310。
[19]Miura,H.,Konaka,C,Kawate,N.,Tsuchida,T.和Kato,H.(1992)痰细胞学阳性、支气管镜检查阴性的肺腺癌[见注释].Chest 102,1328-32。
[20]Valatis,J.,warrens,D.和Gamble,D.(1981)升高的肺腺癌发病率.Cancer 47,1042-1046。
[21] Baldini,E.H.和Strauss,G.M.(1997)妇女与肺癌:等待呼气.Chest112,229S-234S。
[22]Caldwell,C.J.和Berry,C.L.(1996)原发性肺腺癌的发病率升高吗?Virchows Arch 429,359-63。
[23]Risse,E.K.,Vooijs,G.P.和van′t Hof,M.A.(1987)痰的细胞组成与肺癌的细胞学诊断之间的关系.Acta Cytol 31,170-6。
[24]Holiday,D.B.,McLarty,J.W.,Farley,ML.,Mabry,L.C.,Cozens,D.,Roby,T.,Waldron,E.,Underwood,R.D.,Anderson,E.,Culbreth,W.等人(1995)实验室之内和之间的痰细胞学.一项可靠性研究.Acta Cytol 39,195-206。
[25]Eddy,D.M.(1989)肺癌的筛查[见注释].Ann Intern Med 111,232-7。
[26]Younes,M.,Brown,R.W.,Stephenson,M.,Gondo,M.和Cagle,P.T.(1997)I期非小细胞肺癌中Glut 1和Glut3的过量表达与较差的生存率有关.Cancer 80,1046-51。
[27]Ogawa,J.,Inoue,H.和Koide,S.(1997)肺癌中葡萄糖转运蛋白I型基因扩增与唾液酸-Lewis-X合成和增殖有关.Int J Cancer 74,189-92。
[28]Ito,T.,Noguchi,Y.,Satoh,S.,Hayashi,H.,Inayama,Y.和Kitamura,H.(1998)肺癌中促进的葡萄糖转运蛋白同工型的表达:与组织学类型、分化分级和肿瘤分期的关系[见注释].Mod Pathol 11,437-43。
[29]Sosolik,R.C.,McGaughy,V.R.和De Young,B.R.(1997)抗-MOC-31:肺腺癌对间皮瘤免疫组化组的一个可能的增加.Mod Pathol 10,716-9。
[30]Ordonez,N.G.(1998)MOC-31单克隆抗体在鉴别上皮胸膜间皮瘤与肺腺癌中的价值.Hum Pathol 29,166-9。
[31]Takanami,I.,Tanaka,F.,Hashizume,T.,Kikuchi,K.,Yamamoto,Y.,Yamamoto,T.和Kodaira,S.(1996)肺腺癌中的碱性成纤维细胞生长因子及其受体:对它们的表达作为预后标记的研究.Eur J Cancer 32 A,1504-9。
[32]Takanami,I.,Imamura,T.,Hashizume,T.,Kikuchi,K.,Yamamoto,Y.,Yamamoto,T.和Kodaira,S.(1996)碱性成纤维细胞生长因子作为肺腺癌的一种预后指标的免疫组化检测.Jpn J Clin Oncol 26,293-7。
[33]Ohta,Y.,Endo,Y.,Tanaka,M.,Shimizu,J.,Oda,M.,Hayashi,Y.,Watanabe,Y.和Sasaki,T.(1996)原发性肺癌中血管内皮生长因子信使RNA表达的意义.Clin Cancer Res 2,1411-61996。
[34]Volm,M.,Koomagi,R.,Mattem,J.和Stammler,G.(1997)碱性成纤维细胞生长因子及其受体(FGFR-1)在非小细胞肺癌患者中的预后价值.Eur J Cancer 33,691-3。
[35]Hiyama,K.,Hiyama,E.,Ishioka,S.,Yamakido,M.,Inai,K.,Gazdar,A.F.,Piatyszek,M.A.和Shay,J.W.(1995)小细胞和非小细胞肺癌中的端粒酶活性[见注释].J Natl Cancer Inst 87,895-902。
[36]Yashima,K.,Litzky,L.A.,Kaiser,L.,Rogers,T.,Lam,S.,Wistuba,II,Milchgrub,S.,Srivastava,S.,Piatyszek,M.A.,Shay,J.W.和Gazdar,A.F.(1997)肺癌多阶段发病过程中呼吸上皮中的端粒酶表达.Cancer Res 57,2373-7。
[37]Ahrendt,S.A.,Yang,S.C.,Wu,L.,Westra,W.H.,Jen,J.,Califano,J.A.和Sidransky,D.(1997)对于非小细胞肺癌的分子分期,癌基因突变检测与端粒酶活性的比较.Clin Cancer Res 3,1207-14。
[38]Albanell,J.,Lonardo,F.,Rusch,V.,Engelhardt,M.,Langenfeld,J.,Han,W.,Klimstra,D.,Venkatraman,E.,Moore,M.A.和Dmitrovsky,E.(1997)原发性肺癌中的高端粒酶活性:与升高的细胞增殖率和晚期病理分期的相关性.J Natl Cancer Inst 89,1609-15。
[39]Hiyama,K.,Ishioka,S.,Shay,J.W.,Taooka,Y.,Maeda,A.,Isobe,T.,Hiyama,E.,Maeda,H.和Yamakido,M.(1998)端粒酶活性作为肺癌和免疫相关肺病的一种新标记.Int J Mol Med 1,545-9。
[40]Yahata,N.,Ohyashiki,K.,Ohyashiki,J.H.,Iwama,H.,Hayashi,S.,Ando,K.,Hirano,T.,Tsuchida,T.,Kato,H.,Shay,J.W.和Toyama,K.(1998)从支气管冲洗液中获得的肺癌细胞的端粒酶活性.J Natl CancerInst 90,684-90。
[41]Lee,J.C.,Jong,H.S.,Yoo,C.G.,Han,S.K.,Shim,Y.S.和Kim,Y.W.(1998)肺癌细胞系和组织中的端粒酶活性.Lung Cancer 21,99-103。
[42]Arai,T.,Yasuda,Y.,Takaya,T.,Ito,Y.,Hayakawa,K.,Toshima,S.,Shibuya,C,Yoshimi,N.和Kashiki,Y.(1998)端粒酶活性在用支气管肺泡灌洗液筛查原发性肺癌中的用途.Oncol Rep 5,405-8。
[43]Fujii,M.,Motoi,M.,Saeki,H.,Aoe,K.和Moriwaki,S.(1993)增殖细胞核抗原(PCNA)表达在非小细胞肺癌中的预后意义.Acta MedOkayama 47,103-8。
[44]Kawai,T.,Suzuki,M.,Kono,S.,Shinomiya,N.,Rokutanda,M.,Takagi,K.,Ogata,T.和Tamai,S.(1994)肺癌中的增殖细胞核抗原和Ki-67.与DNA流式细胞检测分析的相关性.Cancer 74,2468-75。
[45]Ogawa,J.,Tsurumi,T.,Yamada,S.,Koide,S.和Shohtsu,A.(1994)I期非小细胞肺癌中的血管侵入和唾液酸Lewisx和增殖细胞核抗原的表达.与术后复发的关系.Cancer 73,1177-83。
[46]Ebina,M.,Steinberg,S.M.,Mulshine,J.L.和Linnoila,R.I.(1994)p53过量表达和增殖细胞核抗原上调与非小细胞肺癌临床过程的关系.Cancer Res 54,2496-503。
[47]Fontanini,G.,Vignati,S.,Bigini,D.,Merlo,G.R.,Ribecchini,A.,Angeletti,C.A.,Basolo,F.,Pingitore,R.和Bevilacqua,G.(1994)人类非小细胞肺癌:p53蛋白积累是早期事件,在转移进展过程中持续[见注释].J Pathol 174,23-31。
[48]Wiethege,T.,Voss,B.和Muller,K.M.(1995)人类肺癌中的p53积累和增殖细胞核抗原表达.J Cancer Res Clin Oncol 121,371-7。
[49]Esposito,V.,Baldi,A.,De Luca,A.,Micheli,P.,Mazzarella,G.,Baldi,F.,Caputi,M.和Giordano,A.(1997)p53在小细胞肺癌中的预后价值:与增殖细胞核抗原和吸烟之间的关系.Hum Pathol 28,233-7。
[50]Caputi,M.,Esposito,V.,Groger,A.M.,Pacilio,C,Murabito,M.,Dekan,G.,Baldi,F.,Wolner,E.和Giordano,A.(1998)增殖细胞核抗原在肺癌中的预后作用:一种免疫组化分析.In Vivo 12,85-8。
[51]Hirata,T.,Fukuse,T.,Naili,H.,Hitomi,S.和Wada,H.(1998)CD44变异外显子6在I期非小细胞肺癌中的表达,作为一种预后因子.Cancer Res 58,1108-10。
[52]Ariza,A.,Mate,J.L.,Isamat,M.,Lopez,D.,VonUexkull-Guldeband,C,Rosell,R,Fernandez-Vasalo,A.和Navas-Palacios,JJ.(1995)标准及变异CD44同工型在非小细胞型肺癌中通常表达,在小细胞型肺癌中不表达.J Pathol 177,363-8。
[53]Fasano,M.,Sabatini,M.T.,Wieczorek,R.,Sidhu,G.,Goswami,S.和Jagirdar,J.(1997)肺肿瘤中的CD44及其v6剪接变体:在组织发生中的作用?Cancer 80,34-41。
[54]Miyoshi,T.,Kondo,K.,Hino,N.,Uyama,T.和Monden,Y.(1997)非小细胞肺癌中CD44变异外显子6的表达与淋巴结转移有关.Clin CancerRes 3,1289-97。
[55]Tran,T.A.,Kallakury,B.V.,Sheehan,C.E.和Ross,J.S.(1997)CD44标准型和变异同工型在非小细胞肺癌中的表达.Hum Pathol 28,809-14。
[56]Takigawa,N.,Segawa,Y.,Mandai,K.,Takata,I.和Fujimoto,N.(1997)非小细胞肺癌患者中的血清CD44水平及其与临床病理学特征的关系.Lung Cancer 18,147-57。
[57]Kondo,K.,Miyoshi,T.,Hino,N.,Shimizu,E.,Masuda,N.,Takada,M.,Uyama,T.和Monden,Y.(1998)CD44标准及变异形式在非小细胞肺癌中高频表达,但在小细胞肺癌中无高频表达.J Surg Oncol 69,128-36。
[58]Sasaki,J.I.,Tanabe,K.K.,Takahashi,K.,Okamoto,I,Fujimoto,H.,Matsumoto,M.,Suga,M.,Ando,M.和Saya,H.(1998)CD44剪接同工型在肺癌中的表达:CD44v8-10在非小细胞肺癌中的优势表达.Int J Oncol 12,525-33。
[59]Volm,M.,Koomagi,R.,Mattern,J.和Stammler,G.(1997)细胞周期蛋白A与非小细胞肺癌患者的不利结果有关.Br J Cancer 75,1774-8。
[60]Dobashi,Y.,Shoji,M.,Jiang,S.X.,Kobayashi,M.,Kawakubo,Y.和Kameya,T.(1998)活性细胞周期蛋白A-CDK2复合物,人类原发性肺癌中细胞增殖的一种可能的关键因子.Am J Pathol 153,963-72。
[61]Volm,M.,Rittgen,W.和Drings,P.(1998)ERBB-1、VEGF、细胞周期蛋白A、FOS、JUN和MYC在鳞状细胞肺癌患者中的预后价值[Br JCancer 1998 Apr;77(7):1198中有勘误表].Br J Cancer 77,663-9。
[62]Shoji,M.,Dobashi,Y.,Morinaga,S.,Jiang,S.X.和Kameya,T.(1999)肺腺癌的肿瘤扩增和细胞增殖.Am J Pathol 154,909-18。
[63]Shapiro,G.I.,Edwards,C.D.,Kobzik,L.,Godleslki,J.,Richards,W.,Sugarbaker,D.J.和Rollins,B.J.(1995)原发性肺癌和细胞系中交互的Rb灭活和p16INK4表达.Cancer Res 55,505-9。
[64]Betticher,D.C.,Heighway,J.,Hasleton,P.S.,Altermatt,H.J.,Ryder,W.D.,Cerny,T.和Thatcher,N.(1996)CCND1(细胞周期蛋白D1)过量表达在切除后原发性非小细胞肺癌中的预后意义.Br J Cancer 73,294-300。
[65]Mate,J.L.,Ariza,A.,Aracil,C,Lopez,D.,Isamat,M.,Perez-Piteira,J.和Navas-Palacios,J.J.(1996)小细胞肺癌中细胞周期蛋白D1的过量表达:与Ki67标记指数和较差的细胞质分化的相关性.J Pathol180,395-9。
[66]Yang,W.I.,Chung,K.Y.,Shin,D.H.和Kim,Y.B.(1996)肺癌中细胞周期蛋白D1蛋白质的表达.Yonsei Med J 37,142-50。
[67]Betticher,D.C.,Heighway.J.,Thatcher,N.和Hasleton,P.S.(1997)肺癌患者的切除边缘上皮中CCND1和RB1的异常表达.Br JCancer 75,1761-8。
[68]Nishio,M.,Koshikawa,T.,Yatabe,Y.,Kuroishi,T.,Suyama,M.,Nagatake,M.,Sugiura,T.,Ariyoshi,Y.,Mitsudomi,T.和Takahashi,T.(1997)细胞周期蛋白D1和成视网膜细胞瘤表达与p53异常相结合在切除后的原发性非小细胞肺癌中的预后意义.Clin Cancer Res 3,1051-8。
[69]Caputi,M.,De Luca,L.,Papaccio,G.,A,D.A.,Cavallotti,I,Scala,P.,Scarano,F.,Manna,M.,Gualdiero,L.和De Luca,B.(1997)细胞周期蛋白D1在非小细胞肺癌中的预后作用:一种免疫组化分析.Eur JHistochem 41,133-8。
[70]Betticher,D.C.,White,G.R.,Vonlanthen,S.,Liu,X.,Kappeler,A.,Altermatt,H.J.,Thatcher,N.和Heighway,J.(1997)G1控制基因状态在可切除的非小细胞肺癌中频繁改变.IntJ Cancer 74,556-62。
[71]Volm,M.,Koomagi,R.和Rittgen,W.(1998)细胞周期蛋白、细胞周期蛋白依赖性激酶RB和E2F1在鳞状细胞肺癌中的临床意义.Int JCancer 79,294-9。
[72]Kurasono,Y.,Ito,T.,Kameda,Y.,Nakamura,N.和Kitamura,H.(1998)非典型腺瘤性增生和肺腺癌中细胞周期蛋白D1、成视网膜细胞瘤基因蛋白和p16 MTS1蛋白的表达.一种免疫组化分析.Virchows Arch432,207-15。
[73]Tanaka,H.,Fujii,Y.,Hirabayashi,H.,Miyoshi,S.,Sakaguchi,M.,Yoon,H.E.和Matsuda,H.(1998)非小细胞肺癌中RB途径和细胞增殖活性的破坏.Int J Cancer 79,111-5。
[74]Olivero,M.,Rizzo,M.,Madeddu,R.,Casadio,C,Pennacchietti,S.,Nicotra,M.R.,Prat,M.,Maggi,G.,Arena,N.,Natali,P.G.,Comoglio,P.M.和Di Renzo,M.F.(1996)人类非小细胞肺癌中肝细胞生长因子/分散因子的过量表达和激活.Br J Cancer 74,1862-8。
[75]Harvey,P.,Warn,A.,Newman,P.,Perry,L.J.,Ball,R.Y.和Warn,R.M.(1996)人类肺癌和恶性间皮瘤中肝细胞生长因子/分散因子及其受体的免疫反应性相符.J Pathol 180,389-94。
[76]Takanami,I.,Tanana,F.,Hashizume,T.,Kikuchi,K.,Yamamoto,Y.,Yamamoto,T.和Kodaira,S.(1996)肺腺癌中的肝细胞生长因子和c-Met/肝细胞生长因子受体:对它们的表达作为预后标记的评价。Oncology 53,392-7。
[77]Siegfried,J.M.,Weissfeld,L.A.,Luketich,J.D.,Weyant,R.J.,Gubish,C.T.和Landreneau,R.J.(1998)肝细胞生长因子对于非小细胞肺癌的临床意义.Ann Thorac Surg 66,1915-8。
[78]Nguyen,P.L.,Niehans,G.A.,CherwitZ,D.L.,Kim,Y.S.和Ho,S.B.(1996)人肺癌中膜结合(MUC1)和分泌型(MUC2、MUC3和MUC4)粘蛋白基因的表达.Tumour Biol 17,176-92。
[79]Yu,C.J.,Yang,P.C.,Shun,C.T.,Lee,Y.C.,Kuo,S.H.和Luh,K.T.(1996)MUC5基因的过量表达与非小细胞肺癌的早期手术后转移有关.IntJ Cancer 69,457-65。
[80]Yu,C.J.,Shun,C.T.,Yang,P.C.,Lee,Y.C.,Shew,J.Y.,Kuo,S.H.和Luh,K.T.(1997)非小细胞肺癌中唾液粘蛋白表达与erbB-2癌蛋白过量表达、早期复发和癌症死亡有关[Am J Respir Grit Care Med 1997Aug;156(2 Pt 1):677-8中有勘误表].Am J Respir Grit Care Med 155,1419-27。
[81]Jarrard,J.A.,Linnoila,R.I.,Lee,H.,Steinberg,S.M.,Witschi,H.和Szabo,E.(1998)MUC1是肺癌发生过程中II型肺细胞谱系的一种新型标记.Cancer Res 58,5582-9。
[82]Ohgami,A.,Tsuda,T.,Osaki,T.,Mitsudomi,T.,Morimoto,Y.,Higashi,T.和Yasumoto,K.(1999)I期肺腺癌中MUC1粘蛋白mRNA的表达以及与早期复发的相关性.Ann Thorac Surg 67,810-4。
[83]Bejarano,P.A.,Baughman,R.P.,Biddinger,P.W.,Miller,M.A.,Fenoglio-Preiser,C,al-Kafaji,B.,Di Lauro,R.和Whitsett,J.A.(1996)肺癌和乳腺癌中的表面活性蛋白质和甲状腺转录因子-1.Mod Pathol 9,445-52。
[84]Harlamert,H.A.,Mira,J.,Bejarano,P.A.,Baughman,R.P.,Miller,M.A.,Whitsett,J.A.和Yassin,R.(1998)肺癌和乳腺癌中的甲状腺转录因子-1和细胞角蛋白7和20.Acta Cytol 42,1382-8。
[85]Fontanini,G.,Vignati,S.,Lucchi,M.,Mussi,A.,Calcinai,A.,Boldrini,L.,Chine,S.,Silvestri,V.,Angeletti,C.A.,Basolo,F.和Bevilacqua,G.(1997)肺癌中的新血管发生和p53蛋白:它们的预后作用及其与血管内皮生长因子(VEGF)表达之间的关系[见注释].Br J Cancer 75,1295-301。
[86]Shibusa,T.,Shijubo,N.和Abe,S.(1998)I期肺腺癌中的肿瘤血管发生和血管内皮生长因子表达.Clin Cancer Res 4,1483-7。
[87]Giatromanolaki,A.,Koukourakis,M.I.,Kakolyris,S.,Turley,H.,O′Byrne,K.,Scott,P.A.,Pezzella,F.,Georgoulias,V.,Harris,A.L.和Gatter,K.C.(1998)早期可手术非小细胞肺癌中的血管内皮生长因子、野生型p53和血管发生.Clin Cancer Res 4,3017-24。
[88]Fontanini,G.,Boldrini,L.,Vignati,S.,Chine,S.,Basolo,F.,Silvestri,V.,Lucchi,M.,Mussi,A.,Angeletti,C.A.和Bevilacqua,G.(1998)在非小细胞肺癌中Bcl2和p53调节血管内皮生长因子(VEGF)-介导的血管发生.Eur J Cancer 34,718-23。
[89]Takahama,M.,Tsutsumi,M.,Tsujiuchi,T.,Kido,A.,Okajima,E.,Nezu,K.,Tojo,T.,Kushibe,K.,Kitamura,S.和Konishi,Y.(1998)人类非小细胞肺癌中血管内皮生长因子的频繁表达.Jpn.J Clin Oncol 28,176-81。
[90]Sozzi,G.,Miozzo,M.,Tagliabue,E.,Calderone,C,Lombardi,L.,Pilotti,S.,Pastorino,U.,Pierotti,M.A.和Delia Porta,G.(1991)肺癌患者的正常支气管上皮和肿瘤标本中的细胞遗传异常和生长因子受体过量表达.Cancer Res 51,400-4。
[91]Volm,M.,Efferth,T.,Mattern,J.和Wodrich,W.(1992)吸烟者鳞状细胞肺癌中c-fos和c-erbB1编码的蛋白质的过量表达.Int J Oncol 1,69-71 1992。
[92]Wodrich,W.和Volm,M.(1993)吸烟者的非小细胞肺癌中癌蛋白的过量表达.Carcinogenesis 14,1121-4。
[93]Pastorino,U.,Sozzi,G.,Miozzo,M.,Tagliabue,E.,Pilotti,S.和Pierotti,M.A.(1993)肺癌的遗传改变.J Cell Biochem Suppl 17F,237-48。
[94]Gorgoulis,V.,Sfikalis,P.P.,Karameris,A.,Papastamatiou,H.,Trigidou,R.,Veslemes,M.,Spandidos,D.A.,Sfikakis,P.和Jordanoglou,J.(1995)鳞状细胞肺癌中I类生长因子受体的分子和免疫组化研究.PatholRes Pract 191,973-81。
[95]Rusch,V.,Klimstra,D.,Linkov,I.和Dmitrovsky,E.(1995)p53或表皮生长因子受体的异常表达在早期支气管瘤形成中频繁,共表达早于鳞状细胞癌的发展.Cancer Res 55,1365-72。
[96]Rnsch,V.W.和Dmitrovsky,E.(1995)非小细胞肺癌的分子生物学特征.临床意义.Chest Surg Clin N Am 5,39-55。
[97]Fontanini,G.,Vignati,S.,Bigini,D.,Mussi,A.,Lucchi,EL,Angeletti,C.A.,Pingitore,R.,Pepe,S.,Basolo,F.和Bevilacqua,G.(1995)非小细胞肺癌中表皮生长因子受体(EGFr)的表达与鳞状亚型中肺门淋巴结和纵隔淋巴结的转移有关.Eur J Cancer 31A,178-83。
[98]Pflug,B.和Djakiew,D.(1996)前列腺上皮细胞中低亲和力神经生长因子受体的表达通过诱导凋亡负调节神经生长因子介导的生长(会议摘要).Proc Annu Meet Am Assoc Cancer Res 37,A262 1996。
[99]Rusch,V.,Klimstra,D.,Venkatraman,E.,Langenfeld,J.,Pisters,P.和Dmitrovsky,E.(1996)早期非小细胞肺癌中EGFR和TGF-alpha的过量表达频繁,但是不能预测肿瘤进展(会议摘要).Proc Annu Meet Am AssocCancer Res 37.A1314 1996。
[100]Fujino,S.,Enokibori,T.,Tezuka,N.,Asada,Y.,Inoue,S.,Kato,H.和Mori,A.(1996)非小细胞肺癌中表皮生长因子受体水平与其它预后参数的比较.Eur J Cancer 32A,2070-4。
[101]Pastorino,U.,Andreola,S.,Tagliabue,E.,Pezzella,F.,Incarbone,M.,Sozzi,G.,Buyse,M.,Menard,S.,Pierotti,M.和Rilke,F.(1997)I期肺癌中的免疫细胞化学标记:与预后相关.J Clin Oncol 15,2858-65。
[102]Sekine,L,Takami,S.,Guang,S.G.,Yokose,T.,Kodama,T.,Nishiwaki,Y.,Kinoshita,M.,Matsumoto,H.,Ogura,T.和Nagai,K.(1998)表皮生长因子受体过量表达、K-ras点突变和c-myc扩增在非小细胞肺癌癌发生中的作用.Oncol Rep 5,351-4。
[103]Pfeiffer,P.,Nexo,E.,Bentzen,S.M.,Clausen,P.P.,Andersen,K.,Rose,C.和Nex,E.(1998)肺癌中表皮生长因子受体的酶联免疫吸附测定:与免疫组化、临床病理特征和预后的比较.Br J Cancer 78,96-9。
[104]D’Amico,T.A.,Massey,M.,Herndon,J.E.,2nd,Moore,M.B.和Harpole,D.H.,Jr.(1999)I期肺癌的一种生物学危险模型:使用10种分子标记对408名患者的免疫组化分析.J Thorac Cardiovasc Surg 117,736-43。
[105]Engel,M.,Theisinger,B.,Seib,T.,Seitz,G.,Huwer,H.,Zang,K.D.,welter,C.和Dooley,S.(1993)人类鳞状细胞肺癌中的高水平nm23-H1和nm23-H2信使RNA与较差的分化和肿瘤晚期有关.Int JCancer 55,375-9。
[106]Ozeki,Y.,Takishima,K.和Mamiya,G.(1994)人肺腺癌中nm23/NDP激酶表达的免疫组化分析:与克拉拉细胞型中肿瘤进展相关.Jpn J Cancer Res 85,840-6。
[107]Lai,W.W.,Wu,M.H.,Yan,J.J.和Chen,F.F.(1996)I期非小细胞肺癌中nm23-H1的免疫组化分析:在预测转移中有用的一种标记.AnnThorac Surg 62,1500-4。
[108]Gazzeri,S.,Brambilla,E.,Negoescu,A.,Thoraval,D.,Veron,M.,Moro,D.和Brambilla,C.(1996)人肺肿瘤中核苷二磷酸/激酶A/nm23-H1蛋白的过量表达:与鳞癌中肿瘤进展相关.Lab Invest 74,158-67。
[109]MacKinnon,M.,Kerr,K.M.,King,G.,Kennedy,M.M.,Cockburn,J.S.和Jeffrey,R.R.(1997)p53、c-erbB-2和nm23表达在原发性肺腺癌中没有预后意义.Eur J Cardiothorac Surg 11,838-42。
[110]Bosnar,M.H.,Pavelic,K.,Krizanac,S.,Slobodnjak,Z.和Pavelic,J.(1997)鳞状细胞肺癌:nm23-H1基因的作用.J Mol Med 75,609-13。
[111]Kawakubo,Y.,Sato,Y.,Koh,T.,Kono,H.和Kameya,T.(1997)肺腺癌中nm23蛋白的表达:与肿瘤进展负相关.Lung Cancer 17,103-13。
[112]Fitter,J.H.,Dresler,CM.和Wick,M.R.(1995)T1N0M0期非小细胞肺癌中bcl-2蛋白的表达.Hum Pathol 26,1227-32。
[113]Kitagawa,Y.,Wong,F.,Lo,P.,Elliott,M.,Verburgt,L.M.,Hogg,J.C.和Daya,M.(1996)切除后人类非小细胞肺癌中Bcl-2的过量表达和p53和K-ras的突变.Am J Respir Cell Mol Biol 15,45-54。
[114]Rao,S.K.,Krishna,M.,Woda,B.A.,Savas,L.和Fraire,A.E.(1996)肺腺癌和非肿瘤细胞腔隙中bcl-2蛋白的免疫组化检测.Mod Pathol9,555-9。
[115]Boers,J.E.,ten Velde,G.P.和Thunnissen,F.B.(1996)鳞状化生中的p53:呼吸道癌危险的一种标记.Am J Respir Crit Care Med 153,411-6。
[116]Coppola,D.,Clarke,M.,Landreneau,R.,Weyant,R.J.,Cooper,D.和Yousem,S.A.(1996)肺神经内分泌肿瘤中Bcl-2、p53、CD44和CD44v6同工型的表达.Mod Pathol 9,484-90。
[117]Higashiyama,M.,Doi,O.,Kodama,K.,Yokouchi,H.和Tateishi,R.(1996)在组合类型的小细胞肺癌中,小细胞癌部分的Bcl-2癌蛋白表达特别增强.Tumour Biol 17,341-4。
[118]Strauss,G.M.(1997)可切除非小组细胞肺癌中的预后标记。Hematol Oncol Clin North Am 11.409-34。
[119]Anton,R.C.,Brown,R.W.,Younes,M.,Gondo,M.M.,Stephenson,M.A.和Cagle,P.T.(1997)bd-2免疫阳性在非小细胞肺癌中没有预后意义:对427个病例的分析.Hum Pathol 28,1079-82。
[120]Ishida,H.,Irie,K.,Itoh,T.,Furukawa,T.和Tokunaga,O.(1997)p53和bcl-2表达在肺腺癌中的预后意义并与Ki-67生长分数相关,Cancer80,1034-45。
[121]Stefanaki,K.,Rontogiannis,D.,Vamvouka,C,Bolioti,S.,Chaniotis,V.,Sotsiou,F.,Vlychou,M.,Delidis,G.,Kakolyris,S.,Georgoulias,V.和Kanavaros,P.(1998)小细胞肺癌中bcl2、p53、mdm2和p21/waf1蛋白的免疫组化检测.Anticancer Res 18,1167-73。
[122]Brambilla,E.,Gazzeri,S.,Lantuejoul,S.,Coll,J.L.,Moro,D.,Negoescu,A.和Brambilla,C.(1998)肺癌前身支气管损伤中的p53突变免疫表型和p53转录途径(Bcl2、Bax和waf1)的解调节.Clin Cancer Res 4,1609-18。
[123]Salgia,R.和Skarin,A.T.(1998)肺癌的分子异常.J Clin oncol16,1207-17。
[124]Kim,Y.C.,Park,K.O.,Kern,J.A.,Park,C.S.,Lim,S.C.,Jang,A.S.和Yang,J.B.(1998)Ras、HER2、P53和Bcl-2表达在预测非小细胞肺癌患者生存率方面的交互影响.Lung Cancer 22,181-90。
[125]Groeger,A.M.,Caputi,M.,Esposito,V.,De Luca,A.,Salat,A.,Murabito,M.,Giordano,G.G.,Baldi,F.,Giordano,A.和Wolner,E.(1999)非小细胞肺癌中,Bcl-2蛋白表达与结节状态相关.Anticancer Res 19,821-4。
[126]Vargas,S.O.,Leslie,K.O.,Vacek,P.M.,Socinski,M.A.和Weaver,D.L.(1998)原发性非小细胞肺癌中的雌激素受体相关蛋白p29:病理学和预后相关性.Cancer 82,1495-500。
[127]Higashiyama,M.,Doi,O.,Kodama,K.,Yokouchi,H.和Tateishi,R.(1994)肺癌中成视网膜细胞瘤蛋白的表达:一种免疫组化分析.Oncology 51,544-51。
[128]Xu,H.J.,Quinlan,D.C.,Davidson,A.G.等人.(1994)早期非小细胞肺癌中改变的成视网膜细胞瘤蛋白表达和预后.J.Natl.Cancer Inst.86,695-699。
[129]Lee,J.S.,Kalapurakal,S.,Ro,J.Y.和Hong,W.K.(1995)成视网膜细胞瘤蛋白表达在非小细胞肺癌中的预后意义(会议摘要).Proc AnnuMeet Am Assoc Cancer Res 36,A3787 1995。
[130]Dixon,G.,Salisbury,J.和Walker,C.(1995)正常的和发育异常的支气管上皮和肺癌中成视网膜细胞瘤蛋白的表达(会议摘要).J Pathol176,32A 1995。
[131]Shapiro,G.I.,Edwards,C.D.,Kobzik,L.,Godleski,J.,Richards,W.,Sugarbaker,D.J.和Rollins,B.J.(1995)肺癌中交互的Rb灭活和p16表达(会议摘要).Proc Annu Meet Am Assoc Cancer Res.36,A1641995。
[132]Volm,M.和Stammler,G.(1996)鳞状细胞肺癌中的成视网膜细胞瘤(Rb)蛋白表达和抗性.Anticancer Res 16,891-4。
[133]Dosaka-Akita,H.,Hu,S.X.,Kinoshita,I.,Fujino,M.,Harada,M.,Kawakami,Y.和Benedict,W.F.(1996)Rb蛋白表达在非小细胞肺癌(NSCLC)中的预后意义(会议摘要).Proc Annu Meet Am Assoc Cancer Res37,A1401 1996。
[134]Kinoshita,I.,Dosaka-Akita,H.,Akie,K.,Mishina,T.,Hiroumi,H.和Kawakami,Y.(1996)异常p16INK4和RB蛋白表达在非小细胞肺癌(NSCLC)中的意义(会议摘要).Proc Annu Meet Am Assoc Cancer Res 37,A3979 1996。
[135]Kratzke,R.A.,Greatens,T.M.,Rubins,J.B.,Maddaus,M.A.,Niewoehner,D.E.,Niehans,G.A.和Geradts,J.(1996)切除后非小细胞肺肿瘤中的Rb和p16INK4a表达.Cancer Res 56,3415-20。
[136]Sakaguchi,M.,Fujii,Y.,Hirabayashi,H.,Yoon,H.E.,Kornoto,Y.,Due,T.,Kusafuka,T.,Okada,A.和Matsuda,H.(1996)非小细胞肺癌中负相关的p16和Rb蛋白的表达:一种免疫组化研究.Int J Cancer 65,442-5。
[137]Xu,H.J.,Cagle,P.T.,Hu,S.X.,Li,J.和Benedict,W.F.(1996)非小细胞肺癌中改变的成视网膜细胞瘤和p53蛋白状态:对预后的可能的协同影响.Clin Cancer Res 2,1169-761996。
[138]Dosaka-Akita,H.,Hu,S.X.,Fujino,M,Harada,M.,Kinoshita,I.Xu,H.J.,Kuzumaki,N.,Kawakami,Y.和Benedict,W.F.(1997)非小细胞肺癌中改变的成视网膜细胞瘤蛋白表达:与改变的ras和p53蛋白状态对预后的协同影响.Cancer 79,1329-37。
[139]Cagle,P.T.,el-Naggar,A.K.,Xu,H.J.,Hu,S.X.和Benedict,W.F.(1997)神经内分泌肺肿瘤中不同的成视网膜细胞瘤蛋白表达.可能的诊断意义.Am J Pathol 150,393-400。
[140]Kashiwabara,K.,Oyama,T.,Sano,T.,Fulcuda,T.和Nakajima,T.(1998)原发性非小细胞肺癌中p16/CDKN2基因的甲基化状态与p16和Rb蛋白表达之间的相关性.Int J Cancer 79,215-20。
[141]Caputi,M.,Esposito,V.,Groger,A.M.,De Luca,A.,Pacilio,C,Dekan,G.,Giordano,G.G.,Baldi,F.,Wolner,E.和Giordano,A.(1998)肺癌中的RB生长控制逃脱.Anticancer Res 18,2371-4。
[142]Tamura,A.,Matsubara,O.,Hirokawa,K.和Aoki,N.(1993)人肺癌细胞中凝血调节蛋白的检测.Am J Pathol 142,79-85。
[143]Tamura,A.,Komatsu,H.,Hebisawa,A.,Kurashima,A.,Mori,M.和Katayama,T.(1996)凝血调节蛋白可以用作肺癌的肿瘤标记吗?Lung Cancer 15,189-95。
[144]Collins,C.L.,Ordonez,N.G.,Schaefer,R.,Cook,CD.,Xie,S.S.,Granger,J.,Hsu,P.L.,Fink,L.和Hsu,S.M.(1992)恶性胸膜间皮瘤和肺腺癌中凝血调节蛋白的表达.Am J Pathol 141,827-33。
[145]Hamatake,M.,Ishida,T.,Mitsudomi,T.,Alcazawa,K.和Sugimachi,K.(1996)凝血调节蛋白在人鳞状细胞肺癌中的预后价值和临床病理学相关性.Clin Cancer Res 2,763-6 1996。
[146]Ordonez,N.G.(1997)凝血调节蛋白免疫染色在间皮瘤诊断中的价值.Histopathology 31,25-30。
[147]Tolnay,E.,Wiethege,T.和Muller,K.M.(1997)肿瘤发生前支气管损伤和肺癌中凝血调节蛋白的表达和定位.Virchows Arch 430,209-12。
[148]Bohm,M.,Totzeck,B.和Wieland,I.(1994)人肺癌中E-钙粘蛋白表达水平和模式的差异.Ann Hematol 68,81-3。
[149]Bohm,M.,Totzeck,B.,Birchmeier,W.和Wieland,I.(1994)原发性和转移人肺癌中E-钙粘蛋白表达水平和模式的差异.Clin ExpMetastasis 12,55-62。
[150]Peralta Soler,A.,Knudsen,K.A.,Jaurand,M.C.,Johnson,K.R.,Wheelock,M.J.,Klein-Szanto,A.J.和Salazar,H.(1995)N-钙粘蛋白和E-钙粘蛋白的差异表达区别胸膜间皮瘤与肺腺癌[见注释].Hum Pathol 26,1363-9。
[151]Han,A.C.,Peralta-Soler,A.,Knudsen,K.A.,Wheelock,M.J.,Johnson,K.R.和Salazar,H.(1997)胸膜间皮瘤中的N-钙粘蛋白和肺腺癌中的E-钙粘蛋白在福尔马林固定的、石蜡包埋的组织中的差异表达[见注释].Hum Pathol 28,641-5。
[152]Weynants,P.,Lethe,B.,Brasseur,F.,Marchand,M.和Boon,T.(1994)非小细胞肺癌表达mage基因.Int J Cancer 56,826-9。
[153]Shichijo,S.,Hayashi,A.,Takamori,S.,Tsunosue,R.,Hoshino,T.,Sakata,M.,Kuramoto,T.,Oizumi,K.和Itoh,K.(1995)肺癌中MAGE-4蛋白的检测.Int J Cancer 64,158-65。
[154]Sakata,M.(1996)肺癌中MAGE基因家族的表达.Kurume MedJ 43,55-61。
[155]Fischer,C,Gudat,F.,Stulz,P.,Noppen,C,Schaefer,C,Zajac,P.,Trutmann,M.,Kocher,T.,Zuber,M.,Harder,F.,Heberer,M.和Spagnoli,G.C.(1997)鳞状细胞肺癌中MAGE-3蛋白的高表达[信件].Int JCancer 71,1119-21。
[156]Gotoh,K.,Yatabe,Y.,.Sugiura,T.,Takagi,K.,Ogawa,M.,Takahashi,T.和Mitsudomi,T.(1998)HLA-A2阳性非小细胞肺癌患者中MAGE-3基因表达的频率.Lung Caacer 20,117-25。
[157]Uchiyama,B.,Saijo,Y.,Kumano,N.,Abe,T.,Fujimura,S.,Ohkuda,K.,Handa,M.,Satoh,K.和Nukiwa,T.(1997)人肺癌中核仁蛋白p120的表达:作为增殖标记的组织学类型的差异。Clin Cancer Res 3,1873-7。
[158]Singh,G.,Scheithauer,B.W.和Katyal,S.L.(1986)II型肺细胞癌的病理生物学特征.一项免疫细胞学研究.Cancer 57,994-9。
[159]Mizutani,Y.,Nakajima,T.,Morinaga,S.,Gotoh,M.,Shimosato,Y.,Akino,T.和Suzuki,A.(1988)肺表面活性脱辅基蛋白在不同肺肿瘤中的免疫组化定位.非粘液肺癌腺癌的特殊参照.Cancer 61,532-7。
[160]Noguchi,M.,Nakajima,T.,Hirohashi,S.,Akiba,T.和Shimosato,Y.(1989)使用抗表面活性脱辅基蛋白、抗-Lewisa和抗-Tn抗体对恶性间皮瘤与肺腺癌的免疫组化鉴别.Hum Pathol 20,53-7。
[161]Linnoila,R.I.,Jensen,S.M.,Steinberg,S.M.,Mulshine,J.L.,Eggleston,J.C.和Gazdar,A.F.(1992)非小细胞肺癌中周围气道细胞标记的表达.与不同临床病理学特征的相关性[见注释].Am J Clin Pathol 97,233-43。
[162]Shijubo,N.,Tsutahara,S.,Hirasawa,M.,Takahashi,H.,Honda,Y.,Suzuki,A.,Kuroki,Y.和Akino,T.(1992)胸腔积液中的肺表面活性蛋白A.Cancer 69,2905-9。
[163]Shijubo,N.,Honda,Y.,Fujishima,T.,Takahashi,H.,Kodama,T.,Kuroki,Y.,Akino,T.和Abe,S.(1995)肺腺癌和恶性间皮瘤引起的胸腔积液中的肺表面活性蛋白A和癌胚抗原.Eur Respir J 8,403-6。
[164]Nicholson,A.G.,McCormick,C.J.,Shimosato,Y.,Butcher,D.N.和Sheppard,M.N.(1995)针对肺表面活性物质的一种单克隆抗体PE-10在鉴别原发性与转移肺肿瘤中的价值.Histopathology 27,57-60。
[165]Khoor,A.,Whitsett,J.A.,Stahlman,M.T.和Halter,S.A.(1997)肺腺癌中表面活性蛋白B前体与表面活性蛋白B mNA的表达.Mod Pathol10,62-7。
[166]Saitoh,H.,Shimura,S.,Fushimi,T.,Okayama,H.和Shirato,K.(1997)来自胸腔积液的细胞中表面活性蛋白A基因转录物的检测,用于诊断肺腺癌.Am J Med 103,400-4。
[167]Grohs等人,Acta Cytologica,1996,40(1):26-30。
[168]Grohs等人,Acta Cytologica,1997,41(1):144-152。

Claims (35)

1.一种使用基于细胞的诊断检测一般疾病状态或鉴别具体疾病状态之探针组,其包括多种探针,每种探针特异性结合与一般或具体疾病状态有关的标记,其中该探针组的组成探针与细胞学样品中细胞结合的模式是所述疾病状态存在或具体性质的诊断性特征。
2.权利要求1的探针组,其中所述一般疾病状态选自癌症和传染病。
3.权利要求2的探针组,其中所述癌症选自基于上皮细胞的癌症、基于实体瘤的癌症、基于分泌型肿瘤的癌症和基于血液的癌症。
4.权利要求2的探针组,其中所述传染病选自基于细胞的疾病,其中传染性生物是病毒、细菌、原生生物、寄生虫或真菌。
5.权利要求1的探针组,其中所述探针组用加权因子优化,所述加权因子选自:费用、一般疾病状态在地理位置的流行、具体疾病状态在地理位置的流行、探针的可获得性和商业考虑。
6.权利要求1的探针组,其中所述探针的每一个包含可检测的标记物。
7.权利要求6的探针组,其中所述探针包括抗体。
8.权利要求6的探针组,其中所述标记物选自发色团、荧光团、染料、放射性同位素和酶。
9.权利要求8的探针组,其中所述标记物是用电磁辐射检测的发色团,所述电磁辐射选自β射线、γ射线、X射线、紫外线辐射、可见光、红外线辐射和微波。
10.权利要求1的探针组,其中所述结合模式用光电显微镜检测。
11.权利要求10的探针组,其中所述光电显微镜利用至少一种电磁辐射,其选自γ射线、X射线、β射线、紫外线辐射、可见光、红外线辐射和微波。
12.权利要求1的探针组,其中所述检测针对性传播疾病,而所述鉴别是鉴别衣原体、滴虫、淋病、疱疹和梅毒。
13.一种形成探针组的方法,该探针组用于利用基于细胞的诊断检测患者中的疾病状态或者鉴别疾病状态,该方法包括:
(a)确定探针结合的灵敏度和特异性,其中所述探针的每一个特异性结合与疾病状态有关的标记文库的成员;和
(b)选择有限数量的所述探针,其结合模式是所述疾病状态存在或具体性质的诊断性特征。
14.权利要求13的方法,其中所述确定包括:
(a)分别使已知患有所述疾病的患者之组织学或细胞学样品和已知未患所述疾病的患者之组织学或细胞学样品与所述探针的每一个接触;
(b)测定每一探针与其互补疾病标记在已知所述标记存在于所述样品细胞中的位置处特异结合的量;和
(c)将每个所述量与所述疾病的存在或具体性质相关联。
15.权利要求13的方法,其中所述选择包括一种或多种统计学分析方法、模式识别方法和神经网络分析。
16.权利要求13的方法,其中所述选择包括使用加权因子。
17.一种检测疾病或鉴别疾病状态的方法,包括:
(a)用一种怀疑含有疾病状态特征性异常细胞之细胞学样品接触根据权利要求1的探针组;和
(b)检测所述探针的结合模式,其是所述疾病状态的存在或具体性质的诊断性特征。
18.权利要求17的方法,其中所述细胞学样品是从体液、基于上皮细胞的器官系统、细针抽吸物或活检中采集的细胞样品。
19.权利要求18的方法,其中所述细胞学样品是痰。
20.一种探针组,其利用基于细胞的诊断检测一般疾病状态或鉴别具体疾病的状态,其中根据权利要求13的方法形成所述探针组。
21.权利要求1的探针组,其中所述疾病标记选自形态学生物标记、遗传生物标记、细胞周期生物标记、分子生物标记和生物化学生物标记。
22.权利要求3的探针组,其中所述基于上皮细胞的癌症来自肺、尿道、胃肠道或生殖道。
23.权利要求3的探针组,其中所述基于实体瘤的癌症选自肉瘤、乳腺癌、胰腺癌、肝癌、肾癌、甲状腺癌和前列腺癌。
24.权利要求3的探针组,其中所述基于分泌型肿瘤的癌症选自肉瘤、乳腺癌、胰腺癌、肝癌、肾癌、甲状腺癌和前列腺癌。
25.权利要求3的探针组,其中所述基于血液的癌症选自白血病和淋巴瘤。
26.权利要求18的方法,其中所述体液选自血液、尿液、脊髓液和淋巴。
27.权利要求18的方法,其中所述基于上皮细胞的器官系统选自肺通道、尿道、生殖道和胃肠道。
28.权利要求18的方法,其中所述细针抽吸物来自器官和系统中的实体组织类型。
29.权利要求18的方法,其中所述活检来自器官和系统中的实体组织类型。
30.权利要求28的方法,其中所述器官和系统选自乳腺、胰、肝、肾、甲状腺、骨髓、肌肉、前列腺和肺。
31.权利要求21的探针组,其中所述形态学生物标记选自DNA倍性、MAC和癌前病变。
32.权利要求21的探针组,其中所述遗传生物标记选自DNA加合物、DNA突变和凋亡指数。
33.权利要求21的探针组,其中所述细胞周期生物标记选自细胞增殖标记、分化标记、调节分子和凋亡标记。
34.权利要求21的探针组,其中所述分子生物标记或生物化学生物标记选自癌基因、肿瘤抑制基因、肿瘤抗原、生长因子和受体、酶、蛋白质、前列腺素和粘附分子。
35.权利要求29的方法,其中所述器官和系统选自乳腺、胰、肝、肾、甲状腺、骨髓、肌肉、前列腺和肺。
CNA038250519A 2002-09-12 2003-09-11 基于细胞的疾病检测和鉴别 Pending CN1695057A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/241,753 2002-09-12
US10/241,753 US20030190602A1 (en) 2001-03-12 2002-09-12 Cell-based detection and differentiation of disease states

Publications (1)

Publication Number Publication Date
CN1695057A true CN1695057A (zh) 2005-11-09

Family

ID=31991242

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA038250519A Pending CN1695057A (zh) 2002-09-12 2003-09-11 基于细胞的疾病检测和鉴别

Country Status (9)

Country Link
US (1) US20030190602A1 (zh)
EP (1) EP1546709A4 (zh)
JP (1) JP2006509185A (zh)
KR (1) KR20060011817A (zh)
CN (1) CN1695057A (zh)
AU (1) AU2003267105A1 (zh)
CA (1) CA2498411A1 (zh)
WO (1) WO2004025251A2 (zh)
ZA (1) ZA200502575B (zh)

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101971180A (zh) * 2008-02-08 2011-02-09 法蒂亚公司 使得能够进行临床决策支持的方法、计算机程序产品和系统
US8916342B2 (en) 2006-11-13 2014-12-23 Oncohealth Corp. Identification of high grade or ≧ CIN2 for early stages and late stages detection, screening, and diagnosis of human papillomavirus (HPV) and HPV-associated cancers
WO2015010596A1 (zh) * 2013-07-22 2015-01-29 北京盛诺基医药科技有限公司 一种乳腺癌预后诊断的方法
TWI497075B (zh) * 2009-06-11 2015-08-21 Oncohealth Corp 早期及晚期人類乳突病毒感染之偵測
US9128094B2 (en) 2010-01-08 2015-09-08 Oncohealth Corp. High throughput cell-based HPV immunoassays for diagnosis and screening of HPV-associated cancers
CN106919801A (zh) * 2017-03-08 2017-07-04 上海大伽信息科技有限公司 一种免疫组织化学染色辅助分析系统及使用方法
CN107194137A (zh) * 2016-01-31 2017-09-22 青岛睿帮信息技术有限公司 一种基于医疗数据建模的坏死性小肠结肠炎分类预测方法
CN107367616A (zh) * 2017-07-27 2017-11-21 临沂大学 一种前列腺特异性抗原检测试剂与试剂盒
CN107475202A (zh) * 2017-08-18 2017-12-15 河南省肿瘤医院 一种肺癌循环肿瘤细胞捕获与活性检测、分析方法及其应用
CN108133122A (zh) * 2016-12-01 2018-06-08 深圳华大基因股份有限公司 基因聚类方法和基于该方法的宏基因组组装方法和装置
CN108760448A (zh) * 2018-05-31 2018-11-06 广州江元医疗科技有限公司 全自动阴道分泌物染色机
CN108846896A (zh) * 2018-06-29 2018-11-20 南华大学 一种自动分子蛋白质分子体学诊断系统
CN109554505A (zh) * 2018-12-26 2019-04-02 广东和信健康科技有限公司 一组检测hpv高危型和中危型核酸的探针及其检测试剂盒和应用
CN110376198A (zh) * 2019-08-29 2019-10-25 广州锟元方青医疗科技有限公司 一种宫颈液基细胞切片质量检测系统
CN111596059A (zh) * 2020-05-19 2020-08-28 上海长海医院 Gankyrin蛋白作为新型分子标志物在前列腺癌预后评估中的应用
CN112002414A (zh) * 2020-08-23 2020-11-27 吾征智能技术(北京)有限公司 一种基于胃液认知胃病的系统、设备、存储介质
CN112292697A (zh) * 2018-04-13 2021-01-29 弗里诺姆控股股份有限公司 用于生物样品的多分析物测定的机器学习实施方式
CN112930568A (zh) * 2019-04-23 2021-06-08 艾斯皮雷科技股份有限公司 用于定位或识别恶性肿瘤的装置和方法

Families Citing this family (83)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19983691T1 (de) * 1998-10-29 2001-11-29 Cell Works Inc Charakterisierung mehrerer Marker von Einzelzellen
US20040115692A1 (en) * 2000-04-03 2004-06-17 Cytyc Corporation Methods, compositions and apparatuses for detecting a target in a preservative solution
US7298877B1 (en) * 2001-11-20 2007-11-20 Icad, Inc. Information fusion with Bayes networks in computer-aided detection systems
EP2359689B1 (en) 2002-09-27 2015-08-26 The General Hospital Corporation Microfluidic device for cell separation and use thereof
US20100246837A1 (en) * 2009-03-29 2010-09-30 Krause Lee S Systems and Methods for Tuning Automatic Speech Recognition Systems
WO2006026020A2 (en) 2004-07-30 2006-03-09 Adeza Biomedical Corporation Oncofetal fibronectin as a marker for disease and other conditions and methods for detection of oncofetal fibronectin
WO2006026714A2 (en) * 2004-08-31 2006-03-09 Board Of Regents, The University Of Texas System Diagnosis and prognosis of cancer based on telomere length as measured on cytological specimens
ATE534905T1 (de) 2004-10-14 2011-12-15 Genentech Inc Cop1-moleküle und verwendungen davon
US8719045B2 (en) * 2005-02-03 2014-05-06 The United States Of America As Represented By The Secretary Of The Department Of Health And Human Services, Centers For Disease Control And Prevention Personal assessment including familial risk analysis for personalized disease prevention plan
US20070196820A1 (en) 2005-04-05 2007-08-23 Ravi Kapur Devices and methods for enrichment and alteration of cells and other particles
JP4790012B2 (ja) * 2005-04-27 2011-10-12 シーメンス メディカル ソリューションズ ユーエスエー インコーポレイテッド 高親和性の分子イメージングプローブをスクリーニングするためのインサイチュクリックケミストリー法
US8921102B2 (en) 2005-07-29 2014-12-30 Gpb Scientific, Llc Devices and methods for enrichment and alteration of circulating tumor cells and other particles
US7910316B2 (en) * 2005-09-02 2011-03-22 Toray Industries, Inc. Kit and method for detecting urothelial cancer
AU2006304883A1 (en) * 2005-10-21 2007-04-26 Genenews Inc. Method and apparatus for correlating levels of biomarker products with disease
US20070122041A1 (en) * 2005-11-29 2007-05-31 Baback Moghaddam Spectral method for sparse linear discriminant analysis
ATE483972T1 (de) * 2006-02-16 2010-10-15 Ventana Med Syst Inc Reagenzien und verfahren für krebsprognose und pathologische einstufung
US20070207467A1 (en) * 2006-03-01 2007-09-06 Ming Xu Detection of lymph node metastasis from gastric carcinoma
AU2007227195A1 (en) * 2006-03-21 2007-09-27 The Regents Of The University Of California N-cadherin and Ly6 E: targets for cancer diagnosis and therapy
US20100278821A1 (en) * 2006-03-21 2010-11-04 The Regents Of The University Of California N-cadherin: target for cancer diagnosis and therapy
US8663635B2 (en) 2006-03-21 2014-03-04 The Regents Of The University Of California N-cadherin: target for cancer diagnosis and therapy
US20070281305A1 (en) * 2006-06-05 2007-12-06 Sean Wuxiong Cao Detection of lymph node metastasis from gastric carcinoma
US20080070792A1 (en) 2006-06-14 2008-03-20 Roland Stoughton Use of highly parallel snp genotyping for fetal diagnosis
EP2589668A1 (en) 2006-06-14 2013-05-08 Verinata Health, Inc Rare cell analysis using sample splitting and DNA tags
US8137912B2 (en) 2006-06-14 2012-03-20 The General Hospital Corporation Methods for the diagnosis of fetal abnormalities
US20080050739A1 (en) 2006-06-14 2008-02-28 Roland Stoughton Diagnosis of fetal abnormalities using polymorphisms including short tandem repeats
US8338109B2 (en) 2006-11-02 2012-12-25 Mayo Foundation For Medical Education And Research Predicting cancer outcome
US8968995B2 (en) * 2008-11-12 2015-03-03 Oncohealth Corp. Detection, screening, and diagnosis of HPV-associated cancers
US8859218B2 (en) 2008-06-13 2014-10-14 Oncohealth Corp. In situ detection of early stages and late stages HPV infection
US7824871B2 (en) * 2007-06-14 2010-11-02 George Mason Intellectual Properties Methods of diagnosing non-alcoholic steatohepatitis (NASH)
WO2009036123A1 (en) * 2007-09-11 2009-03-19 Cancer Prevention And Cure, Ltd. Method of identifying biomarkers in human serum indicative of pathologies of human lung tissues
US8541183B2 (en) * 2007-09-11 2013-09-24 Cancer Prevention And Cure, Ltd. Methods of identification, assessment, prevention and therapy of lung diseases and kits thereof
EP2204643B1 (en) * 2007-10-29 2019-08-21 Sysmex Corporation Cell analysis apparatus and cell analysis method
US8617806B2 (en) * 2008-01-25 2013-12-31 Hansabiomed Ou Method to measure and characterize microvesicles in the human body fluids
BRPI0911152A2 (pt) * 2008-04-04 2015-10-06 Univ California linhagem de célula de hibridoma, anticorpo ou fragmento do memso, e, métodos para inibir o crescimento de células cancerosas em um pacientte, para tratar e diagnosticar um paciente com câncer, para identificar células tronco cancerosas e para identificar um anti-n-caderina ou um composto que inibe o crescimento de células cancerosas em um paciente.
CA2725978A1 (en) 2008-05-28 2009-12-03 Genomedx Biosciences, Inc. Systems and methods for expression-based discrimination of distinct clinical disease states in prostate cancer
US10407731B2 (en) 2008-05-30 2019-09-10 Mayo Foundation For Medical Education And Research Biomarker panels for predicting prostate cancer outcomes
SI2340506T1 (sl) * 2008-09-09 2016-02-29 Somalogic, Inc. Biomarkerji za pljučni rak in njihove uporabe
CA3069082C (en) 2008-09-20 2022-03-22 The Board Of Trustees Of The Leland Stanford Junior University Noninvasive diagnosis of fetal aneuploidy by sequencing
US8703920B2 (en) * 2008-11-10 2014-04-22 The Regents Of The University Of California Fully human antibodies against N-cadherin
US10236078B2 (en) 2008-11-17 2019-03-19 Veracyte, Inc. Methods for processing or analyzing a sample of thyroid tissue
GB2477705B (en) * 2008-11-17 2014-04-23 Veracyte Inc Methods and compositions of molecular profiling for disease diagnostics
US9495515B1 (en) 2009-12-09 2016-11-15 Veracyte, Inc. Algorithms for disease diagnostics
FR2942319B1 (fr) * 2009-02-13 2011-03-18 Novacyt Procede de preparation d'une plaque d'analyse virtuelle traitee
US9074258B2 (en) 2009-03-04 2015-07-07 Genomedx Biosciences Inc. Compositions and methods for classifying thyroid nodule disease
EP2857522A3 (en) 2009-03-12 2015-10-14 Cancer Prevention And Cure, Ltd. Methods of identification, assessment, prevention and therapy of lung diseases and kits thereof including gender-based disease identification, assessment, prevention and therapy
US8669057B2 (en) 2009-05-07 2014-03-11 Veracyte, Inc. Methods and compositions for diagnosis of thyroid conditions
US8811535B2 (en) * 2009-07-17 2014-08-19 Mitre Corporation Time-frequency space constructions of families of signals
CA2781408A1 (en) * 2009-11-20 2011-05-26 University Of Louisville Research Foundation Inc. Biomarkers of cancer
US10446272B2 (en) 2009-12-09 2019-10-15 Veracyte, Inc. Methods and compositions for classification of samples
EP2569626B1 (en) 2010-05-11 2019-11-27 Veracyte, Inc. Methods and compositions for diagnosing conditions
US9514250B2 (en) * 2010-07-29 2016-12-06 General Electric Company System and method for analyzing and visualizing enumerated information
WO2012070970A1 (ru) * 2010-11-22 2012-05-31 Farber Boris Slavinovich Диагностический способ для прогноза развития и контроля эффективности лечения онкологических заболеваний
US20130029302A1 (en) * 2011-07-28 2013-01-31 Jill Joyce Psychiatric assessment by pre-screening and correlation of underlying physical conditions
SG11201402711SA (en) 2011-11-29 2014-06-27 Genentech Inc Compositions and methods for prostate cancer analysis
EP2791359B1 (en) 2011-12-13 2020-01-15 Decipher Biosciences, Inc. Cancer diagnostics using non-coding transcripts
US10158898B2 (en) 2012-07-26 2018-12-18 Comcast Cable Communications, Llc Customized options for consumption of content
CA2881627A1 (en) 2012-08-16 2014-02-20 Genomedx Biosciences Inc. Cancer diagnostics using biomarkers
US11976329B2 (en) 2013-03-15 2024-05-07 Veracyte, Inc. Methods and systems for detecting usual interstitial pneumonia
BR112015022490A2 (pt) 2013-03-15 2017-07-18 Veracyte Inc métodos e composições para classificação de amostras
EP2978863B1 (en) * 2013-03-28 2021-03-10 Advanced Cell Diagnostics, Inc. Differentiation between transient and persistent high risk hpv infection by in situ hybridization
DE102013015156B4 (de) 2013-09-11 2016-10-20 Unify Gmbh & Co. Kg System und Verfahren zum Ermitteln des Präsenzstatus eines in einem Netzwerk registrierten Benutzers
CN106574927A (zh) * 2014-01-14 2017-04-19 崔元哲 使用luterial的形态学特征筛选癌症预防剂或抗癌剂的方法
US11060149B2 (en) 2014-06-18 2021-07-13 Clear Gene, Inc. Methods, compositions, and devices for rapid analysis of biological markers
EP3770274A1 (en) 2014-11-05 2021-01-27 Veracyte, Inc. Systems and methods of diagnosing idiopathic pulmonary fibrosis on transbronchial biopsies using machine learning and high dimensional transcriptional data
US11401558B2 (en) 2015-12-18 2022-08-02 Clear Gene, Inc. Methods, compositions, kits and devices for rapid analysis of biological markers
CN106282116A (zh) * 2016-08-08 2017-01-04 北京科迅生物技术有限公司 一种结直肠癌循环肿瘤细胞的富集和分析方法
WO2018039490A1 (en) 2016-08-24 2018-03-01 Genomedx Biosciences, Inc. Use of genomic signatures to predict responsiveness of patients with prostate cancer to post-operative radiation therapy
WO2018132916A1 (en) 2017-01-20 2018-07-26 Genomedx Biosciences, Inc. Molecular subtyping, prognosis, and treatment of bladder cancer
AU2018230784A1 (en) 2017-03-09 2019-10-10 Decipher Biosciences, Inc. Subtyping prostate cancer to predict response to hormone therapy
CA3058481A1 (en) 2017-04-04 2018-10-11 Lung Cancer Proteomics, Llc Plasma based protein profiling for early stage lung cancer prognosis
EP3622087A4 (en) 2017-05-12 2021-06-16 Decipher Biosciences, Inc. GENETIC SIGNATURES FOR PREDICTING PROSTATE CANCER METASTASIS AND IDENTIFYING TUMOR VIRULENCE
US10327637B2 (en) * 2017-06-08 2019-06-25 Fdna Inc. Systems, methods, and computer-readable media for patient image analysis to identify new diseases
US11217329B1 (en) 2017-06-23 2022-01-04 Veracyte, Inc. Methods and systems for determining biological sample integrity
US11348688B2 (en) 2018-03-06 2022-05-31 Advinow, Inc. Systems and methods for audio medical instrument patient measurements
US10939806B2 (en) * 2018-03-06 2021-03-09 Advinow, Inc. Systems and methods for optical medical instrument patient measurements
MX2020010825A (es) * 2018-04-13 2021-01-15 Bioaffinity Tech Inc Sistema y metodo para determinar la salud pulmonar.
WO2019241508A1 (en) * 2018-06-15 2019-12-19 West Virginia University Predictive 7-gene assay and prognostic protein biomarker for non-small cell lung cancer
CA3128973A1 (en) 2019-03-04 2020-09-10 Bhaskar Bhattacharyya Data compression and communication using machine learning
US11795495B1 (en) * 2019-10-02 2023-10-24 FOXO Labs Inc. Machine learned epigenetic status estimator
EP4196599A1 (en) * 2020-08-11 2023-06-21 The Regents Of The University Of Michigan Methods of determining risk of and treating cancer recurrence
KR102577229B1 (ko) * 2021-05-25 2023-09-12 주식회사 에이치이엠파마 머신러닝 모델을 이용하여 복통 유무를 판별하는 방법 및 진단 장치
CN114638782B (zh) * 2022-01-10 2023-02-07 武汉中纪生物科技有限公司 一种宫颈脱落细胞标本的检测方法
WO2024090265A1 (ja) * 2022-10-28 2024-05-02 株式会社biomy 情報処理装置、情報処理方法及びプログラム

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4579827A (en) * 1983-03-11 1986-04-01 Sloan-Kettering Institute For Cancer Research Monoclonal antibodies to human gastrointestinal cancers and hybridoma method of production of the monoclonal antibodies
AU7357687A (en) * 1986-04-29 1987-11-24 Murex Corp. Diagnostic kit for sexually transmitted diseases
US4853770A (en) * 1988-03-01 1989-08-01 Joe Schneller Video system for viewing microscopic specimens
US5380645A (en) * 1989-03-16 1995-01-10 The Johns Hopkins University Generalized method for assessment of colorectal carcinoma
US5784162A (en) * 1993-08-18 1998-07-21 Applied Spectral Imaging Ltd. Spectral bio-imaging methods for biological research, medical diagnostics and therapy
US5543291A (en) * 1993-01-29 1996-08-06 Dana Farber Cancer Institute Method of detecting carcinoma
BR9404967A (pt) * 1993-04-14 1999-06-15 Int Murex Tech Corp Imunoensaio
EP0656070A4 (en) * 1993-05-24 1996-03-20 Amoco Corp NUCLEIC ACID SAMPLES FOR LEGIONELLA GENERATIONS.
IT1270951B (it) * 1993-06-07 1997-05-26 Boehringer Mannheim Italia Metodo e dispositivo per il rilevamento simultano di neisseria gonorrhoeae, chlamydia trachomatis e mycoplasma
US5895748A (en) * 1996-11-27 1999-04-20 Johnson; Keith R. Panel of antibodies for detecting cadherins and catenins in tissues and method of using the panel of antibodies
NO308755B1 (no) * 1996-12-20 2000-10-23 Iystein Fodstad FremgangsmÕte til karakterisering av unormale celler, anvendelse og sett for utførelse av fremgangsmÕten
AU3316600A (en) * 1999-02-22 2000-09-21 Torben F. Orntoft Gene expression in bladder tumors
GB0018140D0 (en) * 2000-07-24 2000-09-13 Medical Res Council Screening for abnormalities
US20030049701A1 (en) * 2000-09-29 2003-03-13 Muraca Patrick J. Oncology tissue microarrays
EP1373896A2 (en) * 2001-03-12 2004-01-02 MonoGen, Inc. Cell-based detection and differentiation of disease states
US7219016B2 (en) * 2001-04-20 2007-05-15 Yale University Systems and methods for automated analysis of cells and tissues

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8916342B2 (en) 2006-11-13 2014-12-23 Oncohealth Corp. Identification of high grade or ≧ CIN2 for early stages and late stages detection, screening, and diagnosis of human papillomavirus (HPV) and HPV-associated cancers
CN101971180B (zh) * 2008-02-08 2014-04-30 法蒂亚公司 使得能够进行临床决策支持的方法、计算机程序产品和系统
CN101971180A (zh) * 2008-02-08 2011-02-09 法蒂亚公司 使得能够进行临床决策支持的方法、计算机程序产品和系统
TWI497075B (zh) * 2009-06-11 2015-08-21 Oncohealth Corp 早期及晚期人類乳突病毒感染之偵測
US9128094B2 (en) 2010-01-08 2015-09-08 Oncohealth Corp. High throughput cell-based HPV immunoassays for diagnosis and screening of HPV-associated cancers
WO2015010596A1 (zh) * 2013-07-22 2015-01-29 北京盛诺基医药科技有限公司 一种乳腺癌预后诊断的方法
CN107194137A (zh) * 2016-01-31 2017-09-22 青岛睿帮信息技术有限公司 一种基于医疗数据建模的坏死性小肠结肠炎分类预测方法
CN107194137B (zh) * 2016-01-31 2023-05-23 北京万灵盘古科技有限公司 一种基于医疗数据建模的坏死性小肠结肠炎分类预测方法
CN108133122A (zh) * 2016-12-01 2018-06-08 深圳华大基因股份有限公司 基因聚类方法和基于该方法的宏基因组组装方法和装置
CN108133122B (zh) * 2016-12-01 2020-09-15 深圳华大基因股份有限公司 基因聚类方法和基于该方法的宏基因组组装方法和装置
CN106919801A (zh) * 2017-03-08 2017-07-04 上海大伽信息科技有限公司 一种免疫组织化学染色辅助分析系统及使用方法
CN106919801B (zh) * 2017-03-08 2023-07-18 杭州大伽信息科技有限公司 一种免疫组织化学染色辅助分析系统及使用方法
CN107367616A (zh) * 2017-07-27 2017-11-21 临沂大学 一种前列腺特异性抗原检测试剂与试剂盒
CN107475202A (zh) * 2017-08-18 2017-12-15 河南省肿瘤医院 一种肺癌循环肿瘤细胞捕获与活性检测、分析方法及其应用
CN112292697A (zh) * 2018-04-13 2021-01-29 弗里诺姆控股股份有限公司 用于生物样品的多分析物测定的机器学习实施方式
CN108760448A (zh) * 2018-05-31 2018-11-06 广州江元医疗科技有限公司 全自动阴道分泌物染色机
CN108846896A (zh) * 2018-06-29 2018-11-20 南华大学 一种自动分子蛋白质分子体学诊断系统
CN109554505A (zh) * 2018-12-26 2019-04-02 广东和信健康科技有限公司 一组检测hpv高危型和中危型核酸的探针及其检测试剂盒和应用
CN109554505B (zh) * 2018-12-26 2022-02-18 广东和信健康科技有限公司 一组检测hpv高危型和中危型核酸的探针及其检测试剂盒和应用
CN112930568A (zh) * 2019-04-23 2021-06-08 艾斯皮雷科技股份有限公司 用于定位或识别恶性肿瘤的装置和方法
CN110376198A (zh) * 2019-08-29 2019-10-25 广州锟元方青医疗科技有限公司 一种宫颈液基细胞切片质量检测系统
CN110376198B (zh) * 2019-08-29 2021-08-10 广州锟元方青医疗科技有限公司 一种宫颈液基细胞切片质量检测系统
CN111596059A (zh) * 2020-05-19 2020-08-28 上海长海医院 Gankyrin蛋白作为新型分子标志物在前列腺癌预后评估中的应用
CN112002414A (zh) * 2020-08-23 2020-11-27 吾征智能技术(北京)有限公司 一种基于胃液认知胃病的系统、设备、存储介质
CN112002414B (zh) * 2020-08-23 2024-01-26 吾征智能技术(北京)有限公司 一种基于胃液认知胃病的系统、设备、存储介质

Also Published As

Publication number Publication date
US20030190602A1 (en) 2003-10-09
AU2003267105A1 (en) 2004-04-30
JP2006509185A (ja) 2006-03-16
EP1546709A4 (en) 2007-09-26
KR20060011817A (ko) 2006-02-03
CA2498411A1 (en) 2004-03-25
ZA200502575B (en) 2006-10-25
EP1546709A2 (en) 2005-06-29
WO2004025251A3 (en) 2004-11-04
WO2004025251A2 (en) 2004-03-25

Similar Documents

Publication Publication Date Title
CN1695057A (zh) 基于细胞的疾病检测和鉴别
CN1554025A (zh) 患病状态的细胞为基础的检测和鉴别
Chen et al. Hereditary leiomyomatosis and renal cell carcinoma syndrome–associated renal cancer: recognition of the syndrome by pathologic features and the utility of detecting aberrant succination by immunohistochemistry
Bartolazzi et al. Application of an immunodiagnostic method for improving preoperative diagnosis of nodular thyroid lesions
Folpe et al. Morphologic and immunophenotypic diversity in Ewing family tumors: a study of 66 genetically confirmed cases
Wang et al. FOXP3 expression and clinical characteristics of hepatocellular carcinoma
Schwingel et al. Bovine leukemia virus DNA associated with breast cancer in women from South Brazil
Dalley et al. Expression of ABCG 2 and B mi‐1 in oral potentially malignant lesions and oral squamous cell carcinoma
Bassiouny et al. Comprehensive clinicopathologic and updated immunohistochemical characterization of primary ovarian mucinous carcinoma
Lawrence et al. Knowing what’s growing: why ductal and intraductal prostate cancer matter
Chai et al. Platelet-coated circulating tumor cells are a predictive biomarker in patients with metastatic castrate-resistant prostate cancer
Allison et al. A review of urine ancillary tests in the era of the Paris system
Chen et al. Cyclin D1-positive mediastinal large B-cell lymphoma with copy number gains of CCND1 gene: a study of 3 cases with nonmediastinal disease
Xian et al. Overexpression/amplification of HER-2/neu is uncommon in hepatocellular carcinoma
Owusu-Afriyie et al. Expression of immunohistochemical markers in non-oropharyngeal head and neck squamous cell carcinoma in Ghana
Hatem et al. The role of BRCA1‐associated protein 1 in the diagnosis of malignant mesothelioma in effusion and fine‐needle aspiration cytology
Shannon et al. Primary renal synovial sarcoma confirmed by cytogenetic analysis: a lesion distinct from sarcomatoid renal cell carcinoma
Park et al. Mesonephric-like differentiation of endometrial endometrioid carcinoma: Clinicopathological and molecular characteristics distinct from those of uterine mesonephric-like adenocarcinoma
Chen et al. NKX3. 1 immunoreactivity is not identified in mesenchymal chondrosarcoma: a 25‐case cohort study
Lee et al. Effects of epstein-barr virus infection on the risk and prognosis of primary laryngeal squamous cell carcinoma: A hospital-based case-control study in taiwan
Weissferdt et al. Neuroendocrine differentiation in thymic carcinomas: a diagnostic pitfall: an immunohistochemical analysis of 27 cases
Wang et al. Diagnostic value of preoperative needle biopsy for tumor grading assessment in hepatocellular carcinoma
Marioni et al. High nuclear expression of the apoptosis inhibitor protein survivin is associated with disease recurrence and poor prognosis in laryngeal basaloid squamous cell carcinoma
Kinoshita et al. Genomic‐based ancillary assays offer improved diagnostic yield of effusion cytology with potential challenges in malignant pleural mesothelioma
Layfield et al. Comparison of dual-ISH (DISH) with fluorescence in situ hybridization (FISH) and correlation with immunohistochemical findings for HER2/Neu status in breast carcinoma

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1082036

Country of ref document: HK

C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: WD

Ref document number: 1082036

Country of ref document: HK