CN102459636B - 用于诊断甲状腺病症的方法和组合物 - Google Patents

用于诊断甲状腺病症的方法和组合物 Download PDF

Info

Publication number
CN102459636B
CN102459636B CN201080026326.1A CN201080026326A CN102459636B CN 102459636 B CN102459636 B CN 102459636B CN 201080026326 A CN201080026326 A CN 201080026326A CN 102459636 B CN102459636 B CN 102459636B
Authority
CN
China
Prior art keywords
sample
gene
thyroid
analysis
cancer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201080026326.1A
Other languages
English (en)
Other versions
CN102459636A (zh
Inventor
G·肯尼迪
B·H·安德森
D·I·查多瓦
E·T·王
王辉
M·帕甘
N·拉比
J·I·怀尔德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Veracyte Inc
Original Assignee
Veracyte Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Veracyte Inc filed Critical Veracyte Inc
Publication of CN102459636A publication Critical patent/CN102459636A/zh
Application granted granted Critical
Publication of CN102459636B publication Critical patent/CN102459636B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/112Disease subtyping, staging or classification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Analytical Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Engineering & Computer Science (AREA)
  • Pathology (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明涉及用于分子谱分型和癌症诊断的组合物、试剂盒和方法,包括但不限于与癌症有关的基因组DNA标志物。特别是,本发明提供与甲状腺癌有关的分子谱、测定分子表达谱的方法和分析结果以提供诊断的方法。

Description

用于诊断甲状腺病症的方法和组合物
交叉引用
本申请要求2009年5月7日提交的名称为“用于诊断甲状腺病症的方法和组合物”的美国临时申请No.61/176,471的权益,该申请以引用方式全部合并于此。
背景技术
癌症是美国第二位的死亡原因以及是全世界的主要死亡原因之一。目前将近2500万人带癌生存,每年确诊1100万新病例。此外,由于总体人口持续老龄化,癌症将变成越来越大的问题。世界卫生组织预测到了2020年,全球癌症率将增加50%。
甲状腺是具有至少两种生成激素的细胞的颈部腺体。滤泡细胞生成甲状腺激素,其影响心率、体温和能量水平。C细胞生成降血钙素,其是有助于控制血钙水平的激素。甲状腺的异常生长可以导致结节形成,其可以是良性或恶性的。甲状腺癌包括至少四种不同种类的甲状腺恶性肿瘤:乳头状瘤、滤泡性瘤、髓样瘤和未分化瘤。
由于疑似恶性肿瘤,据估计美国每年进行超过约120000例甲状腺摘除外科手术,仅约33000例是必要的。因此,进行了约90000例不必要的外科手术。此外,由于需要终身药物疗法来代替损失的甲状腺功能,产生持续的治疗费用和并发症。因此,需要对目前的癌症诊断方法加以改进的改良测试方法。
发明简述
本发明包括用于诊断受试者甲状腺疾病的方法,所述方法包括(a)提供来自受试者的DNA样品;(b)检测选自列于表1、3-6、8或列表1-45的多态性或其互补序列的一种或多种多态性的存在;和(c)基于步骤(b)的结果确定所述受试者是否患有或可能患有恶性或良性甲状腺病症。
本发明也包括含有一种或多种结合剂的组合物,所述结合剂与选自列于表1、3-6、8或列表1-45的多态性或其互补序列的一种或多种多态性特异性结合。
在另一个实施方式中,本发明包括用于诊断受试者的甲状腺疾病的试剂盒,所述试剂盒包含:(a)至少一种结合剂,其与选自列于表1、3-6、8或列表1-45的多态性或其互补序列的一种或多种多态性特异性结合;和(b)用于检测所述至少一种结合剂与来自受试者的DNA样品的结合的试剂。
在另一个实施方式中,本发明包括用于诊断受试者的甲状腺疾病的商业方法,所述商业方法包含:(a)使用上述方法诊断受试者的甲状腺疾病;(b)将诊断结果提供给受试者、保健提供者或第三方;和(c)向所述受试者、保健提供者或第三方收费。
附图说明
本发明的新特征在附加的权利要求书中详细阐明。通过参考使用本发明原理的说明性实施方式的以下详细说明和附图而获得对本发明的特征和优点的更好理解,附图中:
图1描绘了用于识别区分良性和恶性甲状腺组织样品的基因组区域的数据分析流程图。HAPMAP,单体型图版本3-公众可在www.HAPMAP.org获得的一组参考文件;CBS,循环二值分割-一种数据分析算法(Olshen,Venkatraman等2004);PLINK-可在http://pngu.mgh.harvard.edu/~purcell/plink/index.shtml获得的免费的、开源的全基因组关联分析工具集(Purcell,Neale等2007)。
图2是描述分子谱可以如何用于提高常规细胞学检验的准确性的流程图。图2A和图2B描述了分子谱企业的可选实施方式。
图3是由分子谱企业提供的试剂盒的图解。
图4是分子谱结果报告的图解。
图5描绘了可用于显示、储存、取回或计算来自分子谱的诊断结果;或可用于显示、储存、取回或计算来自基因组或核酸表达分析的原始数据;或可用于显示、储存、取回或计算用于本发明方法中的任何样品或客户信息的计算机。
图6是拷贝数数据集的文氏图(Venn diagram)分析,显示基因列表之间的重叠水平。图A,映射到表3、4和5中所描述的基因组区域的基因列表进行的交叉检验以确定其冗余水平。FVPTC对NHP以及PTC对NHP基因列表(表4和5)之间仅2个基因重叠。图B,来自图A的117个独特基因的合并列表与来自恶性对良性分析的199个基因的列表(表6)相比,显示它们之间24个基因的重叠。图C,列于FC对FA中的76个基因相对于列于恶性对良性分析中的199个基因的比较(表3和6)。图D,来自FVPTC对NHP、恶性对良性和PTC对NHP分析的基因列表的比较(表4、5和6),显示各列表之间的重叠水平。
图7:使用DNA拷贝数分析发现的区分甲状腺结节的292个基因相对于预先由mRNA表达和选择性外显子使用(alternative exon usage)分析发现的4918个基因(参见美国专利申请No.12/592,065,其以引用方式全部合并于此)的比较,显示所述列表之间的重叠水平。
发明详述
本发明提供用于诊断生物测试样品的异常细胞增殖的新方法,以及相关的试剂盒和组合物。本发明也提供用于异常细胞增殖(例如癌)的类型的鉴别诊断的方法和组合物,包括滤泡癌(FC)、乳头状甲状腺癌的滤泡变型(FVPTC)、Hurthle细胞癌(HC)、Hurthle细胞腺瘤(HA);乳头状甲状腺癌(PTC)、甲状腺髓样癌(MTC)和未分化癌(ATC);腺瘤,包括滤泡性腺瘤(FA);结节增生(NHP);胶质结节(CN);良性结节(BN);滤泡状瘤(FN);淋巴细胞性甲状腺炎(LCT),包括淋巴细胞性自身免疫性甲状腺炎;甲状旁腺组织;肾癌转移到甲状腺;黑素瘤转移到甲状腺;B细胞淋巴瘤转移到甲状腺;乳腺癌转移到甲状腺;良性(B)肿瘤、恶性(M)肿瘤和正常(N)组织。
本发明的方法和组合物鉴定出可用于检测、诊断和预后甲状腺癌的人基因组区域。在一些实施方式中,所述基因组区域可以区分恶性甲状腺结节和良性甲状腺结节。在其他实施方式中,所述基因组区域可以区分特定的恶性甲状腺结节为乳头状、滤泡性、髓样和未分化的甲状腺结节。所述基因组区域与人甲状腺瘤(包括良性和恶性瘤)中的染色体异常和拷贝数变化有关。这些序列用作探针,并用于检测拷贝数变化从而筛选疾病的存在的方法中,和用于预后侵袭性肿瘤行为和对治疗的反应。此外,本发明提供用于提供细胞增殖的增强诊断、鉴别诊断、监控和治疗的商业方法。
通常,筛选肿瘤或其他类型癌症的存在包括分析通过各种方法例如活组织检查来获取的生物样品。然后由本领域技术人员制备并分析所述生物样品。制备的方法可以包括但不限于和种细胞学染色和免疫组织化学方法。不幸的是,癌症诊断的传统方法有着许多缺陷。这些缺陷包括:1)该诊断可能要求主观评估,并因此易于出现不准确的倾向且缺乏再现性,2)该方法可能不能确定导致发病的基础遗传、代谢或信号传导途径,3)该方法可能不提供测试结果的定量评估,和4)该方法可能不能提供对某些样品的明确诊断。
用于检测拷贝数变异体的标志物的鉴别
在本发明的一个实施方式中,在甲状腺癌样品中可以鉴别与甲状腺良性样品相比具有不同的拷贝数的标志物和基因。具有良性病理的例举性样品包括滤泡性腺瘤、Hurtle细胞腺瘤、淋巴细胞性甲状腺炎和结节增生。恶性病理的例举性样品包括滤泡癌、乳头状甲状腺癌的滤泡变型和乳头状甲状腺癌。在一个实施方式中,本发明方法设法提高目前癌症诊断方法的准确性。可通过测定多个基因和/或表达标志物、鉴别具有高诊断能力或统计显著性的基因表达产物例如miRNA、rRNA、tRNA和mRNA基因表达产物、或鉴别具有高诊断能力或统计显著性的基因和/或表达产物的组或上述的任意组合来获得更高的准确性。
当拷贝数水平高于或低于正常时,限定的组(例如受体酪氨酸激酶)内的基因拷贝数可以指示疾病或病症。该相同组内的其他基因的拷贝数的测定可以提供诊断用途。因此,在一个实施方式中,本发明测定一个组内的两个或更多个基因拷贝数。例如,在一些实施方式中,测定一组中的1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45或50个基因拷贝数。在说明书中限定了各个不同的组,例如可用于诊断甲状腺癌的亚型的组和落入特定本体组中的组。在另一个实施方式中,测量来自多个组的准确指示癌症存在或不存在的基因集合将是有利的。例如,本发明预期使用1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45或50个组,各组测量1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45或50个基因拷贝数。
此外,生物样品中其他致癌基因(例如Ras)的拷贝数增加也可以指示癌细胞的存在。在一些情况下,测定几个不同种类的致癌基因例如受体酪氨酸激酶、细胞质酪氨酸激酶、GTP酶、丝氨酸/苏氨酸激酶、脂质激酶、有丝分裂原、生长因子和转录因子的拷贝数可能是有利的。在一些情况下,测定参与癌症发展的不同种类或组的基因的拷贝数可以提高本发明的诊断能力。
表达标志物的组可以包括代谢或信号传导途径内的标志物,或遗传上或功能上同源的标志物。例如,一组标志物可以包括参与上皮生长因子信号传导途径的基因。另一组标志物可以包括有丝分裂原活化的蛋白激酶。本发明也提供用于检测(即测定)测量来自多个和/或独立的代谢或信号传导途径的基因拷贝数的方法和组合物。
在一个实施方式中,通过使用多个基因拷贝数分析和统计分析,本发明的基因拷贝数可以提供更高的癌症诊断准确性。特别是,本发明提供但不限于与甲状腺癌有关的DNA拷贝数谱。本发明也提供鉴定甲状腺组织样品的方法,以及可用于应用所述方法的试剂盒和组合物。本发明还包括用于运营分子谱企业的方法。
本发明提供用于改善诊断癌症领域的目前状态的方法和组合物。
在一些实施方式中,本发明提供诊断癌症的方法,其使用本文描述的方法提供大于70%的特异性或灵敏度,其中在生物样品和对照样品之间比较基因拷贝数水平;如果生物样品和对照样品之间在指定置信水平上存在基因拷贝数水平的差异,则将该生物样品鉴别为癌性的。在一些实施方式中,本发明的特异性和/或灵敏度为至少70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高。
在一些实施方式中,名义特异性(nominal specificity)大于或等于70%。名义阴性预测值(NPV)大于或等于95%。在一些实施方式中,NPV为至少95%、95.5%、96%、96.5%、97%、97.5%、98%、98.5%、99%、99.5%或更高。
灵敏度通常是指TP/(TP+FN),其中TP是真阳性,FN是假阴性。连续不确定结果(Continued Indeterminate result)数除以基于判断的组织病理诊断的恶性结果的总数。特异性通常是指TN/(TN+FP),其中TN是真阴性和FP是假阳性。良性结果数除以基于判断的组织病理诊断的良性结果的总数。阳性预测值(PPV):TP/(TP+FP);阴性预测值(NPV):TN/(TN+FN)。
在一些实施方式中,基因拷贝数水平的差为至少1、2、3、4、5、6、7、8、9、10或更多个拷贝。在一些实施方式中,基因拷贝数水平的差为至少2、3、4、5、6、7、8、9、10或更多倍。在一些实施方式中,生物样品以高于75%、80%、85%、90%、95%、99%或更高的准确性鉴别为癌性的。在一些实施方式中,生物样品以高于95%的灵敏度鉴别为癌性。在一些实施方式中,生物样品以高于95%的特异性鉴别为癌性的。在一些实施方式中,生物样品以高于95%的灵敏性和高于95%的特异性鉴别为癌性的。在一些实施方式中,使用训练的算法计算准确性。
软件可用于从整个人类基因组的标志物提取、标准化和总结阵列强度数据(arrayintensity data)。在一些实施方式中,良性或恶性样品中给定探针的相对强度可以与参考集相比较,来确定是否存在拷贝数异常。相对强度的增加指示拷贝数增益(扩增),相对强度的降低指示拷贝数损失(缺失)。
例如,可以使用循环二值分割(CBS)(Olshen,Venkatraman等2004)将各样品的所得相对强度转换为片断(相等拷贝数数据的区域)。然后这些片断可用于例如使用PLINK-免费的全基因组关联分析工具集(Purcell,Neale等2007)来产生样品间的非重叠特征。与恶性或良性疾病标记有关的主要特征可使用统计学手段例如卡方检验和PLINK鉴定。例如可以通过使用主要PLINK特征和支持向量机(SVM)分析来进行分类。
诊断标志物
在本发明的一个实施方式中,区分滤泡癌和滤泡性腺瘤的基因组区域显示于表3中。
在本发明的另一个实施方式中,区分乳头状癌的滤泡变型和结节性增生的基因组区域显示于表4中。
在本发明另一个实施方式中,区分乳头状甲状腺癌和结节性增生的基因组区域显示于表5中。
用于检测甲状腺病症的标志物和基因的使用
本发明的标志物和基因可用于鉴定细胞或组织的癌性或非癌性状态。
本发明包括诊断受试者的甲状腺癌的方法,包括测定受试者的甲状腺样品中标志物或基因的扩增,其中所述标志物或基因是表1、3、4、5、6或8或者列表1-45的标志物或基因。使用Affymetrix注释文件GenomeWideSNP_6.na26,基于人类基因组构建(Human GenomeBuild)18将基因映射到微阵列序列。
在一个实施方式中,本发明包括用于从滤泡性腺瘤诊断滤泡癌的方法,包括测定受试者的甲状腺样品中的标志物或基因的扩增,其中所述标志物或基因是表3的标志物或基因。
在一个实施方式中,本发明包括用于从结节性增生诊断乳头状癌的滤泡变型的方法,包括测定受试者的甲状腺样品中标志物或基因的扩增,其中所述标志物或基因是表4的标志物或基因。
在一个实施方式中,本发明包括用于从结节性增生诊断乳头状甲状腺癌的方法,包括测定受试者的甲状腺样品中标志物或基因的扩增,其中所述标志物或基因是表5的标志物或基因。
本发明的方法中,一种或多种标志物或基因可用于检测甲状腺病症。标志物或基因的组合可用于增加甲状腺癌检测的灵敏度和/或特异性和/或检测甲状腺癌的亚型。
本发明也包括用于检测细胞的癌性状态的方法,包括检测细胞中表1、3、4、5、6或8或者列表1-45中公开的至少一种的表达。在一个实施方式中,可以通过与具有相同基因的标准细胞中的表达相比较监测增加的表达。这些基因的表达增加指示癌性状态。
通过使用表1、3、4、5、6或8或者列表1-45中确认的核苷酸序列作为生成用于存在于待测细胞中的DNA的探针的手段可以确定疑似具有甲状腺癌的样品的表达增加(例如拷贝数增加)。因此,可以提取这类细胞的DNA,并使用本发明公开的序列探测这类细胞的基因组中具有增加的量的一种或多种本发明基因的存在。例如,当发现本发明公开的癌症有关或癌症关联的基因以细胞基因组内的多个拷贝存在时,甚至在进行这种测定时其可能不是活跃地过度表达的情况下,这可能指示至少将来发生癌症的一种倾向。
在一些实施方式中,本发明提供诊断癌症的方法,包括使用来自一个或多个以下信号传导途径的基因拷贝数分析。可从其中选择基因的信号传导途径包括但不限于:急性骨髓性白血病信号传导、生长激素抑制素受体2信号传导、cAMP-介导的信号传导、细胞周期和DNA损伤检查点信号传导、G-蛋白偶联受体信号传导、整联蛋白信号传导、黑素瘤细胞信号传导、松弛肽信号传导和甲状腺癌信号传导。在一些实施方式中,从单个信号传导途径中选择一个以上基因来确定和比较生物样品和对照样品之间的差异基因拷贝数水平。其他信号传导途径包括但不限于,粘着、ECM、甲状腺癌、粘着斑、细胞凋亡、p53、紧密连接、TGFβ、ErbB、Wnt、癌症概述中的途径、细胞周期、VEGF、Jak/STAT、MAPK、PPAR、mTOR或自身免疫性甲状腺途径。在其他实施方式中,从至少两种不同的信号传导途径中选择至少两个基因来确定和比较生物样品和对照样品之间的差异基因拷贝数水平。本发明的方法和组合物可以以任何组合具有选自1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50或更多种信号传导途径的基因和可以具有来自各信号传导途径的1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50或更多个基因。在一些实施方式中,组合的基因的集合给出大于70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或99.5%的特异性或灵敏度,或至少95%、95.5%、96%、96.5%、97%、97.5%、98%、98.5%、99%、99.5%或更高的阳性预测值或阴性预测值。
在一些实施方式中,本发明提供诊断癌症的方法,包括选自至少两种不同的本体组的基因。在一些实施方式中,可以从其中选择基因的本体组包括但不限于:多细胞生物体过程、多细胞生物体发育、在前-在后图式形成、表皮发育、区域化、外胚层发育、角质化、发育过程、组织发育、细胞过程的调节、系统发育、生物过程的调节、解剖结构发育、生物调节、图式规范(pattern specification)过程、角化细胞分化、表皮细胞分化、器官发育、序列-特异性DNA结合、转录DNA-依赖性的调节、胚胎发育、RNA代谢过程的调节、ARF鸟嘌呤-核苷酸交换因子活性、转录DNA-依赖性的RNA生物合成过程、细胞表面受体关联的信号转导、信号转导子活性、N-甲基-D-天冬氨酸选择性谷氨酸受体复合体、分子转导子(moleculartransducer)活性或心脏小梁形成。在一些实施方式中,从单个本体组中选择一个以上基因来确定和比较生物样品和对照样品之间的差异基因拷贝数水平。在其他实施方式中,从至少两个不同的本体组中选择至少两个基因来确定和比较生物样品和对照样品之间的差异基因拷贝数水平。本发明的方法和组合物可以以任何组合具有选自1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50或更多个基因本体组的基因和可以具有来自各基因本体组的1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50或更多个基因。在一些实施方式中,组合的基因的集合给出大于70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或99.5%的特异性或灵敏度,或至少95%、95.5%、96%、96.5%、97%、97.5%、98%、98.5%、99%、99.5%或更高的阳性预测值或阴性预测值。
在一些实施方式中,将生物样品分类为对于癌症亚型为癌性或阳性的,其准确性大于75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或99.5%。本发明所使用的诊断准确性包括特异性、灵敏度、阳性预测值、阴性预测值和/或错误发现率。
当为癌症诊断而对生物样品分类时,通常存在来自二元分类器的四种可能的结果。如果预测的结果是p且实际值也是p,则其称为真阳性(TP);然而,如果实际值是n,则其称为假阳性(FP)。相反,当预测结果和实际值都是n时出现真阴性,当预测结果是n而实际值是p时为假阴性。在一个实施方式中,考虑用于确定人是否患有某种疾病的诊断性测试。当该个人测试为阳性,但实际上未患该疾病的情况下出现假阳性。另一方面,当该个人测试为阴性(提示他们是健康的),但他们实际上确实患有该疾病时出现假阴性。在一些实施方式中,假设亚型的真实世界流行度的ROC曲线可通过以相应比例重采样在可用样本上获得的误差产生。
阳性预测值(PPV),或准确率,或疾病的验后概率是正确诊断具有阳性测试结果的患者的比例。它是诊断方法的最重要的判断标准,因为它反映了阳性测试反映出待测试基础病症的可能性。然而,其值确实依赖于可以发生变化的疾病流行度。在一个实施方式中,FP(假阳性);TN(真阴性);TP(真阳性);FN(假阴性)。
假阳性率(α)=FP/(FP+TN)-特异性
假阴性率(β)=FN/(TP+FN)-灵敏度
能力=灵敏度=1-β
似然比阳性=灵敏度/(1-特异性)
似然比阴性=(1-灵敏度)/特异性
阴性预测值是正确诊断具有阴性测试结果的患者的比例。PPV和NPV量度可使用适当的疾病亚型流行度估计值获得。合并的恶性疾病流行度的估计值可由通过外科手术大致分类为B对M的不确定结果的合并而计算。在一些实施方式中对于亚型特异性估计值,疾病流行度有时可能是无法计算的,因为没有任何可用的样本。在这些情况下,亚型疾病流行度可以由合并的疾病流行度估计值替代。
在一些实施方式中,所述方法的遗传分析的结果提供了给定诊断正确的统计学置信水平。在一些实施方式中,这种统计学置信水平为大于85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或99.5%。
在本发明的一个方面,经细胞公司处理的样品经过常规方法和染色、诊断以及分类,然后进行分子谱分型作为第二诊断筛选。该第二诊断筛选能够使得:1)假阳性和假阴性的明显减少,2)确定导致最终病理的基础遗传、代谢或信号传导途径,3)具有为诊断准确性指定统计学概率的能力,4)具有解析模糊结果的能力,和5)具有区分癌症亚型的能力。
例如,在甲状腺癌的特定情况下,本发明的分子谱还可以提供对于甲状腺癌的特定类型(例如乳头状、滤泡性、髓样和未分化)的诊断。分子谱的结果还可以使本领域技术人员,例如科学家或医学专业人员能够提出或指定特定治疗性干预。生物样品的分子谱也可用于监测初始诊断后特定治疗的功效。此外,应理解在一些情况下,分子谱可用于代替癌症诊断的已确定方法而不是作为其附加方法。
一方面,本发明提供可用于诊断和监测遗传障碍的算法和方法。遗传障碍是由基因或染色体异常引起的疾病。而一些疾病,例如癌症,部分归因于遗传障碍,它们也可由环境因素引起。在一些实施方式中,本发明公开的算法和方法用于癌症,例如甲状腺癌的诊断和监测。
通常遗传障碍可以分为两类:单基因障碍及多因子和多基因(复杂)障碍。单基因障碍是单个突变基因的结果。据估计有超过4000种人类疾病由单基因缺陷引起。单基因障碍可以以几种方式遗传给后代。存在着遗传单基因障碍的几种类型,包括但不限于常染色体显性、常染色体隐性、X连锁显性、X连锁隐性、Y连锁和线粒体遗传。仅需要基因的一个突变拷贝使人受常染色体显性障碍的影响。常染色体显性型障碍的例子包括但不限于亨廷顿氏病、神经纤维瘤1、马方综合征、遗传性非息肉病性直肠结肠癌和遗传性多发性骨软骨瘤。在常染色体隐性障碍中,必须有基因的两个拷贝突变以使人受常染色体隐性障碍的影响。这一类型的障碍的例子包括但不限于囊性纤维化、镰状细胞疾病(以及部分镰状细胞疾病)、泰-萨克斯(Tay-Sachs)病、Niemann-Pick病、脊髓性肌萎缩和干耳垢。X连锁显性障碍由X染色体上的基因突变引起。只有少数障碍具有这种遗传模式,其中主要例子是X连锁低磷酸盐佝偻症。男性和女性都受这些障碍的影响,其中通常男性所受影响比女性更严重。一些X连锁显性病症例如Rett综合征、2型色素失调症和艾卡迪(Aicardi)综合征通常在男性中在子宫内或出生后不久是致死的,因此主要在女性中观察到。X连锁隐性障碍也由X染色体上的基因突变所引起。这一类型的障碍的例子包括但不限于血友病A、迪谢内(Duchenne)肌营养不良、红绿色盲、肌营养不良和雄激素性脱发。Y连锁障碍由Y染色体上的突变引起。其例子包括但不限于男性不育症和耳廓多毛症(hypertrichosis pinnae)。线粒体遗传,又名母体遗传,适用于线粒体DNA中的基因。这一类型的障碍的例子是Leber遗传性视神经病变。
遗传障碍也可以是复杂、多因子的或者多基因的,这是指它们可能与结合生活方式和环境因素的多基因作用有关。虽然复杂障碍经常在家族中集中出现,但他们没有明确的遗传模式。这使得难以确定人遗传获得这些障碍或将这些障碍遗传给后代的风险。复杂障碍也是难以研究和治疗的,因为引起大部分这些障碍的具体因素还没有被确认。可以用本发明的算法和方法诊断、鉴定和/或监测的多因子或多基因障碍包括但不限于心脏病、糖尿病、哮喘、孤独症、自身免疫性疾病如多发性硬化、癌症、纤毛疾病(ciliopathies)、腭裂、高血压、炎性肠病、智力迟钝和肥胖。
可以用本发明的算法和方法诊断、鉴定和/或监测的其他遗传障碍包括但不限于1p36缺失综合征、21-羟化酶缺乏、22q11.2缺失综合征、47,XYY综合征、48,XXXX、49,XXXXX、无铜蓝蛋白血症(aceruloplasminemia)、II型软骨成长不全、软骨发育不全、急性间歇性卟啉症、腺苷酸基琥珀酸裂解酶缺陷、肾上腺脑白质营养不良、ALA缺陷性卟啉症、ALA脱水酶缺陷、亚历山大病(Alexander disease)、黑尿酸尿症、α-1抗胰蛋白酶缺陷、阿耳斯特雷姆(Alstrom)综合征、阿尔茨海默病(1、2、3和4型)、釉质形成缺陷、肌萎缩性侧索硬化、2型肌萎缩性侧索硬化、4型肌萎缩性侧索硬化、4型肌萎缩性侧索硬化、雄激素不敏感综合征、贫血、Angelman综合征、阿佩尔(Apert)综合征、共济失调毛细血管扩张、比尔-史蒂文生皮肤回旋综合征(Beare-Stevenson cutis gyrata syndrome)、本杰明综合征、β地中海贫血、生物素酶缺陷、Birt-Hogg-Dubé综合征、膀胱癌、布卢姆(Bloom)综合征、骨疾病、CADASIL、短指发育不良(Camptomelic dysplasia)、卡纳万(Canavan)病、癌症、乳糜泻病、慢性肉芽肿病症、Charcot-Marie-Tooth病、1型Charcot-Marie-Tooth病、4型Charcot-Marie-Tooth病、2型Charcot-Marie-Tooth病、4型Charcot-Marie-Tooth病、科凯恩(Cockayne)综合征、Coffin-Lowry综合征、II型和XI型胶原病(collagenopathy)、结肠直肠癌、先天性输精管缺失、先天性双侧输精管缺失、先天性糖尿病、先天性红细胞生成性卟啉症、先天性心脏病、先天性甲状腺功能低下、结缔组织疾病、Cowden综合征、猫叫综合征(Cri du chat)、克罗恩病、纤维性狭窄病(fibrostenosing)、克鲁宗(Crouzon)综合征、Crouzonodermoskeletal综合征、囊性纤维化、德格罗契(De Grouchy)综合征、退行性神经病、Dent病、发育性残疾(developmental disabilities)、迪格奥尔格(DiGeorge)综合征、V型远端脊髓性肌萎缩、唐氏综合征、侏儒症、埃勒斯-丹洛斯(Ehlers-Danlos)综合征、关节松弛型埃勒斯-丹洛斯综合征、经典型埃勒斯-丹洛斯综合征、皮肤脆裂型埃勒斯-丹洛斯综合征、后突侧弯型埃勒斯-丹洛斯综合征、脉管型、红细胞生成性原卟啉症、法布瑞氏(Fabry)病、脸部损伤和障碍、凝血因子V Leiden血栓形成倾向、家族性腺瘤性息肉病、家族性自主神经异常、范科尼(fanconi)贫血、FG综合征、脆性X染色体综合征、弗里德赖希共济失调(Friedreichataxia)、弗里德赖希氏共济失调、G6PD缺陷、半乳糖血症、戈谢(Gaucher)病(1、2和3型)、遗传性脑病、甘氨酸脑病、2型血色素沉着症、4型血色素沉着症、丑角样鱼鳞病(HarlequinIchthyosis)、头脑畸形、听觉障碍和耳聋、儿童听觉问题、血色沉着病(新生儿、2型和3型)、血友病、肝红细胞生成性卟啉症、遗传性粪卟啉症、遗传性多发性外生骨疣、遗传性压迫易感性神经病、遗传性非息肉性结肠直肠癌、高胱氨酸尿症、亨廷顿病、早年衰老综合征(Hutchinson-Gilford Progeria syndrome)、原发性高草酸尿症、高苯丙氨酸血症、软骨成长不足、软骨发育不良、idic15、色素失调症、婴儿型戈谢病、婴儿-发作上升型遗传性痉挛性瘫痪(infantile-onset ascending hereditary spastic paralysis)、不育症、Jackson-Weiss综合征、Joubert综合征、青少年原发性侧索硬化、Kennedy病、Klinefelter综合征、Kniest发育不良、Krabbe病、学习失能(Learning disability)、Lesch-Nyhan综合征、脑白质营养不良、Li-Fraumeni综合征、家族性脂蛋白脂肪酶缺陷、男性生殖器障碍、马方综合征、McCune-Albright综合征、McLeod综合征、家族性地中海热、MEDNIK、Menkes病、Menkes综合征、代谢障碍、β-球蛋白型高铁血红蛋白血症、先天性高铁血红蛋白血症、甲基丙二酸血症、Micro综合征、小头畸形、运动障碍、Mowat-Wilson综合征、粘多糖贮积病(MPSI)、Muenke综合征、肌营养不良、Duchenne和Becker型肌营养不良症、Duchenne和Becker型肌萎缩症、肌强直性营养不良、1型和2型肌强直性营养不良、新生儿型血色沉着病、神经纤维瘤、神经纤维瘤1、神经纤维瘤2、I型神经纤维瘤、II型神经纤维瘤、神经病、神经肌肉障碍、Niemann-Pick病、非酮性高甘胺酸血症、非综合征型耳聋、常染色体隐性非综合征型耳聋、Noonan综合征、成骨不全(I型和III型)、耳脊椎骨骺发育不良(otospondylomegaepiphyseal dysplasia)、泛酸酯激酶-相关神经退行性变、Patau综合征(13染色体三体性)、Pendred综合征、Peutz-Jeghers综合征、Pfeiffer综合征、苯丙酮尿症、卟啉症、迟发性皮肤卟啉症、Prader-Willi综合征、原发性肺动脉高压、朊蛋白病、早衰、丙酸血症、蛋白C缺陷、蛋白S缺陷、假性戈谢病(pseudo-Gaucher disease)、弹性假黄色瘤、视网膜病症、视网膜母细胞瘤、眼癌FA-弗里德赖希共济失调、Rett综合征、Rubinstein-Taybi综合征、SADDAN、Sandhoff病、感觉和自主神经病III型、镰刀形红细胞贫血、骨骼肌再生、皮肤色素沉着障碍、Smith Lemli Opitz综合征、语言和交流障碍、脊髓性肌萎缩、脊髓延髓肌萎缩、脊髓小脑共济失调、Strudwick型脊椎骨骺发育不良(spondyloepimetaphyseal)、先天性脊椎骨骺发育不良、Stickler综合征、Stickler综合征COL2A1、Tay-Sachs病、四氢生物蝶呤缺陷、致死性骨发育不良(thanatophoric dysplasia)、具有糖尿病和感觉神经性耳聋的硫胺-响应性巨幼细胞贫血、甲状腺疾病、Tourette综合征、Treacher Collins综合征、X染色体三体综合征、结节性硬化、Turner综合征、Usher综合征、混合型卟啉病、von Hippel-Lindau病、Waardenburg综合征、Weissenbacher-Zweymüller综合征、Wilson病、Wolf-Hirschhorn综合征、着色性干皮病、X-连锁重度联合免疫缺陷、X-连锁铁粒幼细胞性贫血和X-连锁脊髓延髓肌萎缩。
在一个实施方式中,所述方法和算法用于诊断、表征和监测甲状腺癌。可用本发明算法和方法判断、表征和/或监测的其他类型癌症包括但不限于肾上腺皮质癌、肛门癌、再生障碍性贫血、胆管癌、膀胱癌、骨癌、骨转移、中枢神经系统(CNS)癌症、外周神经系统(PNS)癌症、乳腺癌、Castleman病、子宫颈癌、儿童非霍奇金淋巴瘤、结肠和直肠癌、子宫内膜癌、食道癌、Ewing氏肿瘤族(例如Ewing氏肉瘤)、眼癌、胆囊癌、胃肠道类癌瘤、胃肠道基质肿瘤、妊娠性滋养层细胞病、毛细胞白血病、霍奇金病、Kaposi氏肉瘤、肾癌、喉癌和下咽癌、急性淋巴细胞性白血病、急性粒细胞性白血病、儿童白血病、慢性淋巴细胞性白血病、慢性粒细胞性白血病、肝癌、肺癌、肺类癌瘤、非霍奇金淋巴瘤、男性乳房癌、恶性间皮瘤、多发性骨髓瘤、脊髓增生异常综合征、骨髓增生性障碍、鼻腔和鼻旁癌(paranasal cancer)、鼻咽癌、神经母细胞瘤、口腔和口咽癌、骨肉瘤、卵巢癌、胰腺癌、阴茎癌、垂体瘤、前列腺癌、视网膜母细胞瘤、横纹肌肉瘤、唾液腺癌、肉瘤(成人软组织癌)、黑素瘤皮肤癌、非黑素瘤皮肤癌、胃癌、睾丸癌、胸腺癌、子宫癌(例如子宫肉瘤)、阴道癌、外阴癌和瓦尔登斯特伦巨球蛋白血症。
根据前述内容,本发明公开的这种一个或多个基因的多个拷贝的存在可使用RNA印迹和DNA印迹技术并使用本发明公开的序列开发用于该目的的探针来测定。这种探针可以由DNA或RNA或合成核苷酸或上述组合构成,且可以有利地由和表1、3、4、5、6或8或列表1-45中确定的基因或序列匹配或互补的核苷酸残基的连续延伸构成。这种探针最有利地包含源自表1、3、4、5、6或8或列表1-45的至少15个、优选至少30个、更优选至少50个、最优选至少80个和特别是至少100个、甚至200个残基的连续延伸。因此,当单个探针与癌性或疑似癌性或倾向于变成癌性的细胞样品的基因组结合多次,而相同探针与源自相同器官或组织的另外非癌性细胞的基因组的相似量DNA的结合导致明显较少的结合的情况下,这指示包含或对应于从中得到测序探针的表1、3、4、5、6或8或列表1-45中确定的序列的基因的多个拷贝的存在。
在一个这样在实施方式中,通过测量RNA转录的相对速率(例如通过产生相应的cDNA)然后用如表1、3、4、5、6或8或列表1-45中确定的基因序列开发的探针分析所得DNA来测定与相同器官的正常细胞和/或组织相比增加的表达。因此,利用疑似癌性的细胞的全RNA互补序列通过逆转录酶产生的cDNA水平产生相应量的随后能用聚合酶链式反应或其它某些手段(例如滚环扩增)而扩增的cDNA,以确定所得cDNA的相对水平并因此确定基因表达的相对水平。
也可以使用与本发明公开的基因的表达产物选择性结合,从而检测该表达产物的存在的试剂来测定增加的表达。例如,可以产生抗包含表1、3、4、5、6或8或列表1-45中确定的序列的多肽之一的抗体,可能是适当标记的抗体(例如其中所述抗体与荧光或放射性标记结合),且然后所述抗体与对应于本发明公开序列的基因之一编码的多肽反应(选择性或特异性地结合)。然后这种抗体结合(尤其是源自疑似癌性的样品中的这种结合的相对程度)与另外的非癌性细胞和组织相反,可以用作本发明确认的癌症相关基因的表达程度或过表达的量度。因此,本发明确认为在癌性细胞和组织中过度表达的基因可能由于拷贝数增加或由于过转录而过表达,例如在过表达归因于激活基因并导致RNA聚合酶的重复结合的转录因子的过度产生,从而产生大于正常量的RNA转录物(其随后翻译成多肽,例如包含表1、3、4、5、6或8或列表1-45中确定的氨基酸序列的多肽)的情况下。这种分析提供了确定根据本发明确认的基因的表达并因此确定来自待测试患者的样品中癌性状态的存在以及所述患者在未来发性癌症的倾向的存在的另外的手段。
在使用本发明方法时,必须记住指示癌性状态的基因表达其特征不必是每个细胞都发现是癌性的。因此,本发明公开的方法可用于检测其中不是所有细胞都显示过表达的完全模式的组织内癌性病症的存在。例如,可使用适当的DNA或RNA探针发现一组选定基因(包括在严格条件下与表1、3、4、5、6或8或者列表1-45中确定的至少一个序列同源的、或具有至少90%、优选95%的同一性的序列)在源自肿瘤或恶性组织的样品中少至60%的细胞中存在,而在源自相应的非癌性组织或其它正常的组织的多至60%的细胞中不存在(且因此在多至40%的这种正常组织细胞中存在)。在一个实施方式中,这种基因模式发现在提取自癌性组织的至少70%的细胞中存在,并在至少70%的相应正常、非癌性组织样品中不存在。在另一个实施方式中,这种基因模式发现在提取自癌性组织的至少80%的细胞中存在,并在至少80%的相应正常、非癌性组织样品中不存在。在另一个实施方式中,这种基因模式发现在提取自癌性组织的至少90%的细胞中存在,并在至少90%的相应正常、非癌性组织样品中不存在。在另一个实施方式中,这种基因模式发现在提取自癌性组织的至少100%的细胞中存在,并在至少100%的相应正常、非癌性组织样品中不存在,尽管后面一种实施方式可能是很少出现的情况。
检测甲状腺肿瘤的方法
本发明方法提供通过利用分子谱的受试者的疾病或病症的诊断。在一些情况下,本发明方法提供通过利用分子表达谱与本领域已知的其他方法,例如细胞学分析或免疫组织化学结合来诊断受试者的疾病或病症。如本发明所使用,术语受试者是指任何动物(例如哺乳动物),包括但不限于人、非人灵长类动物、啮齿类动物、狗、猪等。所述受试者可以知道或可以不知道疾病或病症。
在一些实施方式中,分子谱包括核酸(DNA或RNA)、蛋白或其组合的检测、分析或量化。通过本发明方法诊断的疾病或病症例如包括受试者的一种或多种组织中的异常生长的病症,包括但不限于皮肤、心脏、肺、肾脏、乳房、胰腺、肝脏、肌肉、平滑肌、膀胱、胆囊、结肠、肠、脑、食道或前列腺。在一些实施方式中,由本发明方法分析的组织包括甲状腺组织。
可以处理生物样品来提取核酸,例如DNA或RNA。核酸可在允许杂交的条件下与本发明探针阵列接触。可以使用本领域已知的许多方法以定量方式分析杂交度。在一些情况下,探针位置处的杂交度可以与该分析提供的信号强度有关,因此其与样品中存在的互补核酸序列的量有关。软件可用于提取、标准化、总结和分析来自人基因组或转录物组(包括表达基因、外显子、内含子和miRNA)的探针的阵列强度数据。在一些实施方式中,良性或恶性样品中的给定探针的强度可以与参考集比较以确定样品中是否发生差异表达。阵列上与表达序列对应的标志物位置处的相对强度的增加或降低分别指示相应表达序列的表达的增加或降低。或者,相对强度的降低可以指示表达序列的突变。
可使用特征选择技术分析各样品的所得强度值,所述特征选择技术包括通过观察数据的本征性质评估特征的相关性的过滤器技术;将模型假设嵌入特征子集检索内的包装器方法(wrapper method);以及其中最优特征集的检索构建立到分类器算法中的嵌入技术。
用于本发明方法的过滤器技术包括(1)参数法,例如利用两个样品t-检验、ANOVA分析、贝叶斯框架和伽马分布模型;(2)无模型法(model free method),例如利用Wilcoxon秩和检验、类间内平方和检验、秩产物法(rank products method)、随机排列法或TNoM,其包括设置两个数据集之间表达的成倍差异(fold-change difference)的阈值点,然后检测最小化误分类数目的各基因的该阈值点;(3)和多变量法,例如二变量法、基于相关性的特征选择法(CFS)、最小冗余最大相关法(MRMR)、Markov毯过滤法和非相关收缩质心法(uncorrelated shrunken centroid method)。可用于本发明方法的包装器方法包括顺序检索法、遗传算法和分布式算法的评估。可用于本发明方法的嵌入方法包括随机森林算法、支持向量机算法的权向量和逻辑回归算法的权重。Bioinformatics.2007年10月,1;23(19):2507-17提供了用于分析强度数据的以上提供的过滤器技术的相对优点的综述。
然后可使用分类器算法对选定的特征分类。例证性的算法包括但不限于减少变量数目的方法,例如主成分分析算法、部分最小二乘法和独立成分分析算法。例证性的算法还包括但不限于直接处理大量变量的方法,例如统计方法和基于机器学习技术的方法。统计方法包括惩罚逻辑回归、微阵列的预测分析(PAM)、基于收缩质心的方法、支持向量机分析和正则化线性判别分析。机器学习技术包括装袋程序(bagging procedure)、加速程序(boosting procedure)、随机森林算法及其组合。Cancer Inform.2008;6:77-97提供了用于分析微阵列强度数据的上述提供的分类技术的综述。
本发明的标志物和基因可用于鉴定细胞或组织的癌性或非癌性状态。本发明包括诊断良性组织或细胞和恶性组织或细胞的方法,包括测定受试者的甲状腺样品中的标志物或基因的差异表达,其中所述标志物或基因是表1、3、4、5、6或8或列表1-45中所列的标志物或基因。本发明也包括用于诊断甲状腺髓样癌的方法,包括测定受试者的甲状腺样品中标志物或基因的差异表达。本发明也包括用于诊断甲状腺病理亚型的方法,包括测定受试者的甲状腺样品中标志物或基因的差异表达。
在一些实施方式中,由本发明方法诊断的疾病或病症包括良性和恶性的过度增生性障碍,包括但不限于癌症、增生或肿瘤形成。在一些情况下,由本发明方法诊断的过度增生性障碍包括但不限于乳腺癌,例如乳腺导管组织中的导管癌、髓样癌、胶样癌、管状癌和炎性乳腺癌;卵巢癌,包括上皮卵巢肿瘤,例如卵巢中的腺癌和从卵巢转移到腹腔中的腺癌;子宫癌;子宫颈癌,例如子宫颈上皮的腺癌,包括鳞状细胞癌和腺癌;前列腺癌,例如选自以下的前列腺癌:腺癌或转移到骨的腺癌;胰腺癌,例如胰管组织中的上皮样癌和胰管中的腺癌;膀胱癌,例如膀胱中的移行细胞癌、尿路上皮癌(移行细胞癌)、内衬在膀胱中的膀胱上皮细胞的肿瘤、鳞状细胞癌、腺癌和小细胞癌症;白血病,例如急性粒细胞性白血病(AML)、急性淋巴细胞性白血病、慢性淋巴细胞性白血病、慢性粒细胞性白血病、毛细胞白血病、脊髓发育不良、骨髓增生性障碍、急性骨髓性白血病(AML)、慢性骨髓性白血病(CML)、肥大细胞增多症、慢性淋巴细胞性白血病(CLL)、多发性骨髓瘤(MM)和骨髓发育不良综合征(MDS);骨癌;肺癌,例如非小细胞肺癌(NSCLC),其分成鳞状细胞癌、腺癌和大细胞未分化性癌和小细胞肺癌;皮肤癌,例如基底细胞癌、黑素瘤、鳞状细胞癌和光化性角化病(其是有时发展为鳞状细胞癌的皮肤病症);眼视网膜母细胞瘤;皮肤或眼内(眼)黑素瘤;原发性肝癌(开始于肝脏的癌症);肾癌;AIDS-相关淋巴瘤,例如扩散性大B细胞淋巴瘤、B细胞免疫母细胞性淋巴瘤和小的非核裂细胞淋巴瘤;Kaposi肉瘤;病毒诱导的癌症,包括乙型肝炎病毒(HBV)、丙型肝炎病毒(HCV)和肝细胞癌;1型人亲淋巴病毒(HTLV-1)和成人T细胞白血病/淋巴瘤;和人乳头状瘤病毒(HPV)和子宫颈癌;中枢神经系统癌症(CNS),例如原发性脑肿瘤、其包括神经胶质瘤(星形细胞瘤、间变型星形细胞瘤或多形性胶质母细胞瘤)、少突神经胶质瘤、室管膜瘤、脑膜瘤、淋巴瘤、神经鞘瘤和成神经管细胞瘤;外周神经系统(PNS)癌症,例如听神经瘤和恶性外周神经鞘瘤(MPNST),包括神经纤维瘤和神经鞘瘤、恶性纤维性细胞瘤、恶性纤维组织细胞瘤、恶性脑膜瘤、恶性间皮瘤和恶性混合性Müllerian肿瘤;口腔和口咽癌,例如,下咽癌、喉癌、鼻咽癌和口咽癌;胃癌,例如淋巴瘤、胃间质瘤和类癌瘤;睾丸癌,例如生殖细胞肿瘤(GCT)(其包括精原细胞瘤和非精原细胞瘤)和性腺基质细胞瘤(其包括Leydig细胞瘤和睾丸支持细胞瘤);胸腺癌症,例如胸腺瘤、胸腺癌、霍奇金病、非霍奇金淋巴瘤良性肿瘤或类癌瘤;直肠癌和结肠癌。在一些情况下,由本发明方法诊断的疾病或病症包括但不限于甲状腺障碍,例如良性甲状腺障碍,包括但不限于滤泡性腺瘤、Hurthle细胞腺瘤、淋巴细胞性甲状腺炎和甲状腺增生。在一些情况下,由本发明方法诊断的疾病或病症包括但不限于恶性甲状腺障碍,例如滤泡癌、乳头状甲状腺癌的滤泡变型和乳头状癌。在一些情况下,本发明方法提供组织是疾病或正常的诊断。在其他情况下,本发明方法提供正常、良性或恶性的诊断。在一些情况下,本发明方法提供良性/正常或恶性的诊断。在一些情况下,本发明方法提供本发明提供的本文中提到的一种或多种特定疾病或病症的诊断。
I.获得生物样品
在一些实施方式中,本发明方法用于获得来自受试者的样品。如本发明所使用,术语受试者是指任何动物(例如哺乳动物),包括但不限于人、非人灵长类动物、啮齿类动物、狗、猪等。本发明提供的获得方法包括活组织检查法,包括细针抽吸、芯针活组织检查、真空辅助活组织检查、切取活组织检查、切除活组织检查、钻取活组织检查、刮取活组织检查或皮肤活组织检查。样品可从本发明提供的任何组织中获得,包括但不限于皮肤、心脏、肺、肾脏、乳腺、胰腺、肝脏、肌肉、平滑肌、膀胱、胆囊、结肠、肠、脑、前列腺、食道或甲状腺。或者,样品可从任何其他来源获得,包括但不限于血液、汗液、毛囊、口腔组织、泪液、月经、粪便或唾液。在本发明的一些实施方式中,医学专业人员可以获得用于测试的生物样品。
样品可由本领域已知方法获得,例如本发明提到的活组织检查法、拭取、刮削、放血或本领域已知的任何其他方法。在一些情况下,可使用本发明试剂盒的组件获得、储存或运输样品。在一些情况下,可获得多个样品,例如可获得多个甲状腺样品用于通过本发明方法进行诊断。在一些情况下,可获得多个样品,例如来自一种组织类型(例如甲状腺)的一个或多个样品和来自另一个组织(例如口腔)的一个或多个样品用于通过本发明方法进行诊断。在一些情况下,可在相同或不同时间获得多个样品,例如来自一种组织类型(例如甲状腺)的一个或多个样品和来自另一个组织(例如口腔)的一个或多个样品。在一些情况下,在不同时间获得的样品通过不同方法储存和/或分析。例如,可通过细胞学分析(常规染色)获得并分析样品。在一些情况下,可基于细胞学分析结果从受试者获得进一步的样品。癌症的诊断可以包括医师、护士或其他医学专业人员对受试者的检查。所述检查可以是常规检查的一部分,或所述检查可以源于特定的主诉,包括但不限于以下之一:疼痛、患病、疾病预测、疑似肿块或团块、疾病或病症的存在。所述受试者可以知道或不知道该疾病或病症。医学专业人员可以获得用于测试的生物样品。在一些情况下所述医学专业人员可以指引受试者去测试中心或实验室以提交生物样品。
在一些情况下,所述医学专业人员可以指引受试者去测试中心或实验室以提交生物样品。在其他情况下,所述受试者可以提供样品。在一些情况下,本发明的分子谱企业可以获得样品。所述样品可通过本领域已知方法获得,例如本发明提供的活组织检查法、拭取、刮削、放血或本领域已知的任何其他方法。在一些情况下,可使用本发明试剂盒的组件获得、储存或运输样品。在一些情况下,可获得多个样品,例如可获得多个甲状腺样品用于通过本发明方法进行诊断。在一些情况下,可获得多个样品,例如来自一种组织类型(例如甲状腺)的一个或多个样品和来自另一个组织(例如口腔)的一个或多个样品用于通过本发明方法进行诊断。在一些情况下,可在相同或不同时间获得多个样品,例如来自一种组织类型(例如甲状腺)的一个或多个样品和来自另一个组织(例如口腔)的一个或多个样品。在一些情况下,在不同时间获得的样品通过不同方法储存和/或分析。例如,可通过细胞学分析(常规染色)获得并分析样品。在一些情况下,可基于细胞学分析结果从受试者获得进一步的样品。
在一些情况下,所述受试者可以被指引去看专家,例如肿瘤学家、外科医生或内分泌专家以获得进一步诊断。所述专家同样可以获得用于测试的生物样品,或指引个体去测试中心或实验室以提交生物样品。在任何情况下,可由医师、护士或其他医学专业人员例如医学技师、内分泌专家、细胞学家、抽血者、放射科医师或胸腔科医师获得所述生物样品。所述医学专业人员可以指示对所述样品进行合适的测试或分析,或者本发明的分子达谱企业可以咨询那个分析或测试最适于指定。分子谱企业可以向个体或其医学或保险提供者为其咨询工作、为样品获得和/或储存、为材料或者为所提供的所有产品和服务收费。
在本发明的一些实施方式中,医学专业人员不必参与初始诊断或样品获得。或者个体可以通过使用在药店出售的试剂盒来获得样品。所述试剂盒可以包含用于获得如本发明描述的所述样品的手段,用于储存所述样品用于检验的手段以及正确使用所述试剂盒的说明书。在一些情况下,分子谱服务包括在购买该试剂盒的价格中。在其他情况下,分子谱服务单独收费。
适于分子谱企业使用的样品可以是包含待测试个体的组织、细胞、核酸、基因、基因片段、表达产物、基因表达产物或基因表达产物片段的任何材料。提供了用于确定样品适用性和/或充足性的方法。样品可以包括但不限于,组织、细胞或来自个体的细胞或源自个体的细胞的生物材料。所述样品可以是细胞或组织的异质群体或同质群体。可使用能够提供适于本发明描述的分析法的样品的本领域已知的任何方法获得生物样品。
样品可通过非侵入性法获得,包括但不限于:皮肤或子宫颈的刮削、颊部的擦拭、唾液收集、尿液收集、粪便收集、月经、泪液或精液的收集。在其他情况下,样品通过侵入性方法获得,包括但不限于:活组织检查、肺泡或肺灌洗、针抽吸或放血。针抽吸法还可以包括细针抽吸、芯针活组织检查、真空辅助活组织检查或核芯针活组织检查。在一些实施方式中,可通过本发明方法获得多个样品以确保足够量的生物材料。获得合适的甲状腺样品的方法是本领域已知的,并进一步描述在用于甲状腺结节处理的ATA指南中(Cooper等.Thyroid Vol.16 No.2 2006),其以引用方式全部合并于此。用于获得生物样品的类方法(generic method)也是本领域已知的,并进一步描述在例如Ramzy,Ibrahim ClinicalCytopathology and Aspiration Biopsy 2001中,其以引用方式全部合并于此。在一个实施方式中,所述样品是甲状腺结节或疑似甲状腺瘤的细针抽吸物。在一些情况下,所述细针抽吸物的采样方法可通过使用超声、X-射线或其他成像装置来指导。
在本发明的一些实施方式中,所述分子谱企业可以直接从受试者、从医学专业人员、从第三方或从由分子谱企业或第三方提供的试剂盒获得生物样品。在一些情况下,所述生物样品可在受试者、医学专业人员或第三方获得生物样品并将生物样品递送给分子谱企业后由分子谱企业获得。在一些情况下,所述分子谱企业可以提供用于将所述生物样品储存并运送给分子谱企业的合适容器和赋形剂。
II.储存样品
在一些实施方式中,本发明方法提供用于在获得样品之后和通过本发明的一种或多种方法分析样品之前储存样品一段时间,例如数秒、数分钟、数小时、数天、数周、数月、数年或更久。在一些情况下,在储存步骤或进一步分析之前细分从受试者获得的样品,这样样品的不同部分经受不同的下游方法或处理,包括但不限于储存、细胞学分析、充足性测试、核酸提取、分子谱或其组合。
在一些情况下,一部分样品可以储存而另一部分所述样品可以进一步操作。这种操作可以包括但不限于分子谱;细胞学染色;基因或基因表达产物(RNA或蛋白质)提取、检测或定量;固定和检验。在其他情况下,获得、储存并在储存步骤之后细分样品用于进一步分析,这样样品的不同部分经受不同的下游方法或处理,包括但不限于储存、细胞学分析、充足性测试、核酸提取、分子谱或其组合。在一些情况下,获得样品并通过例如细胞学分析进行分析,且所得样品材料通过本发明的一种或多种分子谱方法进一步分析。在这种情况下,可以在细胞学分析步骤和分子谱步骤之间储存样品。样品可以在获取时储存,以利于运送或等待其他分析的结果。在另一个实施方式中,可以在等待医师或其他医学专业人员的指示的同时储存样品。
所获取的样品可以置于合适介质、赋形剂、溶液或容器中用于短期或长期储存。所述储存可以要求将样品保持在冷藏或冷冻环境中。在储存在冷冻环境之前,样品可以快速冷冻。冷冻样品可以与合适的低温贮藏介质或化合物接触,所述介质或化合物包括但不限于:甘油、乙二醇、蔗糖或葡萄糖。合适的介质、赋形剂或溶液可以包括但不限于:hanks盐溶液、盐水、细胞生长培养基、铵盐溶液例如硫酸铵或磷酸铵、或水。合适的铵盐浓度包括约0.1g/ml、0.2g/ml、0.3g/ml、0.4g/ml、0.5g/ml、0.6g/ml、0.7g/ml、0.8g/ml、0.9g/ml、1.0g/ml、1.1g/ml、1.2g/ml、1.3g/ml、1.4g/ml、1.5g/ml、1.6g/ml、1.7g/ml、1.8g/ml、1.9g/ml、2.0g/ml、2.2g/ml、2.3g/ml、2.5g/ml或更高的溶液。所述介质、赋形剂或溶液可以是无菌的或可以不是无菌的。
样品可以储存在室温下或低温下,例如寒冷温度(例如约20℃至约0℃),或冷冻温度,包括例如0℃、-1℃、-2℃、-3℃、-4℃、-5℃、-6℃、-7℃、-8℃、-9℃、-10℃、-12℃、-14℃、-15℃、-16℃、-20℃、-22℃、-25℃、-28℃、-30℃、-35℃、-40℃、-45℃、-50℃、-60℃、-70℃、-80℃、-100℃、-120℃、-140℃、-180℃、-190℃或约-200℃。在一些情况下,样品可以储存在冰箱中、冰或冷冻凝胶包装上、冷藏箱中、低温冷藏箱中、干冰上、液氮中或与液氮平衡的蒸气相中。
所述介质、赋形剂或溶液可以包含防腐剂以使样品维持在适当状态中用于随后的诊断或操作,或阻止凝结。所述防腐剂可以包括柠檬酸盐、乙二胺四乙酸、叠氮化钠或硫柳汞。所述样品可以通过本领域已知的任何方法例如使用戊二醛、甲醛或甲醇在储存之前或储存期间固定。所述容器可以是适于储存或运输生物样品的任何容器,包括但不限于:杯子、带盖杯子、试管、无菌管、真空管、注射器、瓶子、显微镜载片或任何其他合适的容器。所述容器可以是无菌的或可以不是无菌的。在一些情况下,所述样品可以储存在适于储存用于随后细胞学分析的细胞的商业制剂中,例如但不限于CytycThinPrep、SurePath或Monoprep。
所述样品容器可以是适于储存和/或运输生物样品的任何容器,包括但不限于:杯子、带盖杯子、试管、无菌管、真空管、注射器、瓶子、显微镜载片或任何其他合适的容器。所述容器可以是无菌的或可以不是无菌的。
III.样品的运输
本发明方法提供样品的运输。在一些情况下,所述样品从诊所、医院、医生办公室或其他场所运送到所述样品可以储存和/或通过例如细胞学分析或分子谱进行分析的第二场所。在一些情况下,所述样品可以运送到分子谱公司以进行本发明描述的分析。在其他情况下,所述样品可以运送到实验室,例如经授权或经其它方式能够进行本发明方法的实验室,例如临床实验室改进法案(CLIA)实验室。所述样品可以由样品所来源的个体运输。所述的个体运输可以包括出现在分子谱企业或指定的样品接收点并提供样品的个体。所述样品提供可以包括任何本发明描述的样品获取的技术,或所述样品可以早已获取并储存在如本发明描述的合适容器中。在其他情况下所述样品可以使用快递服务、邮政服务、航运服务或能够以合适方式运送样品的任何方法运送到分子谱企业。在一些情况下,可通过第三方测试实验室(例如细胞学实验室)将样品提供给分子谱企业。在其他情况下,可通过受试者的初级护理医师、内分泌专家或其他医学专业人员将所述样品提供给分子谱企业。运输成本可向该个体、医疗提供者或保险提供者收费。分子谱企业可以在收到样品后立即开始分析,或可以以本发明描述的任何方式储存样品。储存方法可以与样品被分子谱企业接收之前所选择的方法一样或不一样。
样品可以在任何介质或赋形剂中运输,包括本发明提供的适于储存样品的任何介质或赋形剂,例如低温贮藏介质或液体基细胞学制剂。在一些情况下,所述样品可以冷冻或冷藏运输,例如在本发明规定的任何适当的样品储存温度下运输。
在分子谱企业、其代表或被许可人、医学专业人员、研究人员或第三方实验室或测试中心(例如细胞学实验室)收到样品时,可使用本领域已知的多种常规分析对样品进行分析,例如细胞学分析和基因组分析。这种测试可以指示癌症、癌症类型、任何其他疾病或病症、疾病标志物的存在、或者癌症、疾病、病症或疾病标志物的不存在。所述测试可以采取细胞学检查形式,包括如下所述的显微镜检查。所述测试可以包括使用一种或多种细胞学染色。可以在进行该测试前通过本领域已知的任何用于生物样品制备的适当方法处理或制备生物材料以用于测试。所进行的具体分析可由分子谱公司、订购该测试的医师或第三方例如顾问医学专业咨询人员、细胞学实验室、样品所来源的受试者或保险提供者来决定。该具体分析可以基于获得明确诊断的可能性、分析成本、分析速度、分析对于所提供材料类型的适用性来选择。
IV.充足性测试
获取样品之后或获取期间,包括储存样品的步骤之前或之后,可以收集并评估所述生物材料的充足性,例如,评估样品用于本发明方法和组合物的适用性。所述评估可由获得样品的个体、分子谱企业、使用试剂盒的个体或第三方例如细胞学实验室、病理学家、内分泌专家或研究人员来进行。可以由于包括但不限于以下因素的许多因素来确定所述样品对于进一步分析而言是充足的或不充足的:不足的细胞、不足的遗传物质、不足的蛋白质、DNA或RNA、对于指定测试而言不合适的细胞或对于指定测试而言不合适的材料、样品的存在时间、获得样品的方式或者样品储存或运输的方式。可使用本领域已知的多种方法例如细胞染色方法、细胞数目或组织量的测量、总蛋白质测量、核酸测量、目视检查、显微镜检查或者温度或pH测定来确定充足性。在一个实施方式中,样品充足性将从进行基因表达产物水平分析实验的结果来确定。在另一个实施方式中,样品充足性将通过测量样品充足性标志物的含量来确定。这种标志物包括元素,例如碘、钙、镁、磷、碳、氮、硫、铁等;蛋白质,例如但不限于甲状腺球蛋白;细胞团;和细胞组分,例如蛋白质、核酸、脂质或碳水化合物。
在一些情况下,可通过例如美国专利No.3645691描述的化学方法测量碘,所述专利以引用方式全部合并于此,或通过本领域已知的其他化学方法测量碘含量。用于碘测量的化学方法包括但不限于基于Sandell和Kolthoff反应的方法。所述反应按照以下方程式进行:
2Ce4++As3+→2Ce3++As5+I。
碘对该反应过程具有催化作用,即,待分析制剂中存在的碘越多,反应进行越快速。反应速度与碘浓度成正比。在一些情况下,所述分析方法可以以下方式进行:
将预定量的三氧化二砷As2O3的浓硫酸或硝酸溶液添加至生物样品中,并将混合物温度调节至反应温度,即,通常调节至20℃到60℃的温度。再往其中加入预定量的硫酸铈(IV)的硫酸或硝酸溶液。由此,使混合物在预定温度下反应确定时间。所述反应时间根据待测定碘量的数量级以及根据相应的选定反应温度选择。该反应时间通常为大约1分钟到大约40分钟。此后,通过光度计法测定测试溶液的铈(IV)离子含量。光度计法测定的铈(IV)离子浓度越低,反应速度越快且因此催化剂(即碘)的量越大。以这种方式可以直接和定量地测定样品中的碘。
在其他情况下,甲状腺组织样品的碘含量可通过检测碘的特定同位素例如123I、124I、125I和131I来测定。在再其他的情况下,所述标志物可以是另一种放射性同位素,例如碳、氮、硫、氧、铁、磷或氢的同位素。在有些情况下所述放射性同位素可以在样品收集之前给予。适于充足性测试的给予放射性同位素的方法是本领域熟知的,包括注射入静脉或动脉,或通过摄食。在给予同位素和获取甲状腺结节样品之间以实现一部分同位素吸收入甲状腺组织的合适时间段可以包括约一分钟到几天或约一周之间的任何时间段,包括约1分钟、2分钟、5分钟、10分钟、15分钟、半小时、1小时、8小时、12小时、24小时、48小时、72小时、或约一周、一周半或两周,且可以由本领域技术人员容易地确定。或者,可以测定样品的同位素的天然水平,例如碘、钙、镁、碳、氮、硫、氧、铁、磷或氢的放射性同位素。
(i)细胞和/或组织含量充足性测试
用于测定组织量的方法包括但不限于称重样品或测定样品体积。用于测定细胞量的方法包括但不限于计数细胞,其有时可以在利用例如酶(如胰蛋白酶或胶原酶解聚)之后进行,或通过物理手段例如使用组织匀浆器进行。用于测定回收细胞量的替代方法包括但不限于定量与细胞材料结合的染料,或测定离心后获得的细胞团的体积。用于测定存在充足数目的特定类型细胞的方法包括PCR、Q-PCR、RT-PCR、免疫组织化学分析、细胞学分析、显微镜和/或目视分析。
(ii)核酸含量充足性测试
可通过使用本领域已知的多种方法测定从生物样品提取后的核酸含量来分析样品。在一些情况下,从其他核酸中提取RNA或mRNA,然后进行核酸含量分析。可提取、纯化并使用分光光度计通过紫外吸收(包括但不限于在260纳米的吸收)来测定核酸含量。在其他情况下,核酸含量或充足性可在样品与染料接触后通过荧光计测定。在再其他的情况下,核酸含量或充足性可在电泳后测定,或使用仪器例如安捷伦生物分析仪来测定。应理解本发明方法不局限于用于测定核酸含量和/或完整性的特定方法。
在一些实施方式中,在纯化后不久使用NanoDrop分光光度计在纳克到微克范围内测定来自给定样品的RNA量或产量。在一些实施方式中,使用安捷伦2100生物分析仪测定RNA质量,且通过计算得到的RNA完整性指数(RIN,1-10)来表征。NanoDrop是无比色池(cuvette-free)的分光光度计。它使用1微升来测量5ng/μl到3,000ng/μl的样品。NanoDrop的关键特征包括样品的低体积和没有比色池;5ng/μl到3,000ng/μl的大的动态范围;以及它允许DNA、RNA和蛋白的定量。NanoDropTM 2000c允许分析0.5μl-2.0μl的样品,且不需要比色池或毛细管。
RNA质量可以通过计算得到的RNA完整性指数(RIN)来测定。RNA完整性指数(RIN)是用于将完整性值赋予RNA量度的算法。RNA的完整性是基因表达研究主要关心的问题,且常规地使用28S-18S的rRNA比(其是一种已被证明不稳定的方法)来评价。RIN算法应用于电泳RNA测量并且基于贡献有关RNA完整性的信息的不同特征的组合,以提供更加稳定的通用测量。在一些实施方式中,使用安捷伦2100生物分析仪测定RNA质量。用于测定RNA质量的方案是已知的且可在例如安捷伦网站上商购获得。简言之,第一步,研究人员将总RNA样品安置到RNA Nano LabChip中。第二步,将LabChip插入安捷伦生物分析仪中并进行分析,从而生成数字电泳图。第三步,新的RIN算法随后分析RNA样品的整个电泳痕迹(包括降解产物的存在或不存在)以确定样品完整性。然后,该算法赋予1到10的RIN得分,其中水平10的RNA是完全完整的。因为电泳图的解释是自动的且不经过个体解释,因此能够实现通用且无偏倚的样品比较,并改善实验再现性。使用神经网络和适应性学习结合主要从人、大鼠和小鼠组织获得的真核细胞总RNA样品的大型数据库开发了RIN算法。RIN的优点包括获得RNA完整性的数字评定:直接比较RNA样品,例如在归档之前和之后比较不同实验室之间相同组织的完整性;和确保实验的再现性,例如,如果RIN显示给定值并适于微阵列实验,则相同值的RIN可以一直用于类似实验,只要使用相同的有机体/组织/提取方法(Schroeder A,等BMCMolecular Biology 2006,7:3(2006))。
在一些实施方式中,RNA质量按RIN 1到10的尺度测量,10是最高质量。一方面,本发明提供由RNA RIN值等于或者小于6.0的样品分析基因表达的方法。在一些实施方式中,使用本发明的所述方法和算法分析含有RIN值为1.0、2.0、3.0、4.0、5.0或6.0的RNA的样品的微阵列基因表达。在一些实施方式中,样品是甲状腺组织的细针抽吸物。样品可以降解到RIN低至2.0。
给定样品中的基因表达的测定是复杂的、动态的和昂贵的过程。RIN≤5.0的RNA样品通常不用于多基因微阵列分析,而是仅可用于单基因RT-PCR和/或TaqMan分析。因此这种RNA按照质量的使用的二分法大大限制了样品的可用性并妨碍了研究工作。本发明提供了可以使低质量的RNA可用于从包含低浓度RNA的样品(例如甲状腺FNA样品)中获得有意义的多基因表达结果的方法。
此外,可使用本发明所述方法和算法测量并分析具有低的和/或通过NanoDrop通常视为对多基因表达谱不充足的不可测量的RNA浓度的样品。目前用于在实验室中测量核酸产量的最灵敏和“现有技术状态”的仪器是NanoDrop分光光度计。和这种类型的许多定量仪器类似,NanoDrop测量的精确度在极低RNA浓度时明显降低。用于输入微阵列实验所必需的最低量RNA也限制了给定样品的可用性。在本发明中,可以使用NanoDrop和生物分析仪两者的组合测量来评估包含极低量核酸的样品,从而优化用于多基因表达测定和分析的样品。
(iii)蛋白质含量充足性测试
在一些情况下,可使用本领域已知的多种方法测定生物样品中的蛋白质含量,包括但不限于:280纳米处的紫外吸收、本发明描述的细胞染色或例如使用考马斯蓝或二辛可宁酸(bichichonic acid)蛋白质染色。在一些情况下,在样品测量之前从生物样品中提取蛋白质。在一些情况下,样品充足性的多项测试可以并列地进行或一次进行一项。在一些情况下,样品可分成用于在评估充足性之前、期间或之后进行多项诊断性测试的等分样品。在一些情况下,在可以适合或不适合进一步的诊断性测试的少量样品上进行充足性测试。在其他情况下,整个样品评估充足性。在任何情况下,充足性测试可以向受试者、医疗提供者、保险提供者或政府机构收费。
在本发明的一些实施方式中,可在收集后不久或立即测试样品的充足性。在一些情况下,当样品充足性测试未显示足够量的样品或足够质量的样品时,可以收集额外的样品。
V.细胞学分析
样品可以通过细胞染色与生物样品中细胞的显微镜检查相结合来分析。细胞染色或细胞学检查可通过许多方法和本领域已知的合适试剂进行,包括但不限于:EA染色、苏木精染色、细胞染色、巴氏染色、曙红、尼斯尔染色(nissl stain)、甲苯胺蓝、银染色、偶氮胭脂红染色、中性红或詹纳斯绿。在一些情况下,在染色过程之前或期间细胞用例如甲醇、乙醇、戊二醛或甲醛固定和/或渗透。在一些情况下,细胞不进行固定。在一些情况下,组合使用超过一种染色。在其他情况下根本不使用染色。在一些情况下使用染色过程,例如用溴化乙锭、苏木精、尼斯尔染色或本领域已知的任何核酸染色进行核酸含量的测定。
在本发明的一些实施方式中,通过本发明熟知的用于细胞学检查的标准方法将细胞涂抹在载玻片上。在其他情况下,可以使用液体基细胞学(LBC)方法。在一些情况下,LBC方法提供改善的细胞学载玻片制备手段、更均匀的样品、更高的灵敏性和特异性,以及改善的样品处理的效率。在液体基细胞学方法中,将生物样品从受试者转移到含有液体细胞学制剂溶液例如Cytyc ThinPrep、SurePath或Monoprep或本领域已知的任何其他液体基细胞学制剂溶液的容器或小瓶中。另外,可以用液体细胞学制剂溶液将样品从收集装置冲洗到容器或小瓶中,以确保基本上定量地转移样品。液体基细胞学制剂溶液中含有生物样品的溶液然后可以储存和/或通过机器或本领域技术人员处理,从而产生载玻片上的细胞层。样品还可以用和常规细胞学制备一样的方法染色和在显微镜下检查。
在本发明的一些实施方式中,可以通过免疫组织化学染色分析样品。免疫组织化学染色通过利用生物样品(例如细胞或组织)中的抗体提供特定分子或抗原的存在、位置和分布的分析。抗原可以是小分子、蛋白质、肽、核酸或能够被抗体特异性识别的任何其他分子。样品可以通过免疫组织化学方法在有或者没有在先固定和/或渗透步骤的情况下进行分析。在一些情况下,可通过使样品与对抗原特异性的抗体接触来检测目标抗原,然后通过一次或多次洗涤消除非特异性结合。然后可通过抗体检测试剂例如标记的次级抗体或标记的抗生物素蛋白/抗生蛋白链菌素来检测特异性结合的抗体。在一些情况下,抗原特异性抗体可以直接标记。用于免疫组织化学的合适标记包括但不限于荧光团如荧光素和若丹明;酶如碱性磷酸酶和辣根过氧化物酶;和放射性核素如32P和125I。可通过免疫组织化学染色检测的基因产物标志物包括但不限于Her2/Neu、Ras、Rho、EGFR、VEGFR、UbcH10、RET/PTC1、细胞角蛋白20、降血钙素、GAL-3、甲状腺过氧化酶和甲状腺球蛋白。
VI.样品分析
一方面,本发明提供利用低数量和质量的多核苷酸,例如DNA或RNA进行微阵列基因表达分析的方法。在一些实施方式中,本发明描述通过用低数量和质量的RNA分析基因表达从而诊断、表征和/或监测癌症的方法。在一个实施方式中,所述癌症是甲状腺癌。甲状腺RNA可由细针抽吸物(FNA)获得。在一些实施方式中,基因表达谱由RNA RIN值为9.0、8.0、7.0、6.0、5.0、4.0、3.0、2.0、1.0或更低的降解的样品获得。在具体实施方式中,基因表达谱由RIN等于或小于6,即6.0、5.0、4.0、3.0、2.0、1.0或更低的样品获得。本发明提供低质量的RNA可用于从包含低浓度核酸的样品,例如甲状腺FNA样品中获得有意义的基因表达结果的方法。
样品可用性的另一个评估是RNA产量,其在基因表达分析中通常以纳克到微克的量计量。目前用于在实验室中测定核酸产量的最灵敏和“现有技术状态”的仪器是NanoDrop分光光度计。和这种类型的许多定量仪器类似,NanoDrop测量法的精确度在极低RNA浓度时明显降低。用于输入微阵列实验所需的RNA最低量也限制了给定样品的可用性。在一些方面,本发明通过使用NanoDrop和生物分析仪装置两者的组合测量来评估样品输入,从而解决低RNA浓度问题。由于从基因表达研究获得的数据质量依赖于RNA数量,可由具有低的或不可通过NanoDrop测量的RNA浓度的样品产生有意义的基因表达数据。
所述方法和算法使得能够:1)包含低量和/或低质量的核酸的样品用于基因表达分析;2)假阳性和假阴性明显减少,3)确定导致所产生的病理的基础遗传、代谢或信号传导途径,4)将统计学概率赋予遗传障碍的诊断精确性的能力,5)解析不明确结果的能力,和6)区分癌症亚型的能力。
VI.分析结果
常规细胞学或其他分析的结果可以指示样品为阴性(无癌症、疾病或病症)、不明确或疑似(提示癌症、疾病或病症的存在)、诊断性(癌症、疾病或病症的阳性诊断)或非诊断性(对于癌症、疾病或病症的存在或不存在提供的信息不够)。诊断结果还可以分为恶性或良性。诊断结果也可以提供得分,例如指示癌症的严重性或等级,或精确诊断的可能性。在一些情况下,诊断结果可以指示特定类型的癌症、疾病或病症,例如滤泡性腺瘤、Hurthle细胞腺瘤、淋巴细胞性甲状腺炎、增生、滤泡癌、乳头状甲状腺癌的滤泡变型、乳头状癌或本发明提供的任何疾病或病症。在一些情况下,诊断结果可以指示癌症、疾病或病症的特定阶段。所述诊断结果可以为所诊断的特定癌症疾病或病症的类型或阶段提示特定治疗或治疗性干预。在一些实施方式中,所进行的分析的结果可以进入数据库。分子谱公司可以为以下一项或多项向个体、保险提供者、医疗提供者或政府机构收费:所进行的分析、咨询服务、报告结果、数据库访问或数据分析。在一些情况下除了分子谱分型之外的所有或一些步骤可由细胞学实验室或医学专业人员进行。
根据上文,本发明公开的一个或多个基因、或标志物或其组合的差异拷贝数可使用DNA印迹技术和利用本发明确定的序列来开发用于该目的的探针而测定。这种探针可以由DNA或RNA或合成核苷酸或上述的组合组成,且可以有利地由和表1、3、4、5、6或8或者列表1-45中确定的序列匹配或互补的连续核苷酸残基延伸组成。这种探针最有利地包含如源自表1、3、4、5、6或8或者列表1-45确定的一个或多个序列的至少15-200或更多个核苷酸(包括15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、80、85、90、95、100、110、120、130、140、150、160、175或200或更多个核苷酸)的连续延伸。因此,当单个探针与为癌性的、或疑似为癌性的或倾向于变成癌性的细胞的样品的转录物组结合多次,而相同探针与源自相同器官或组织的另外的非癌性细胞的基因组的相似量转录物组的结合导致明显更多或更少的结合时,这指示包含或对应于探针序列所来源的表1、3、4、5、6或8或者列表1-45中确定的序列的一个基因、多个基因、标志物或miRNA的差异表达。
在使用本发明方法时,应当记住指示癌性状态的基因或标志物拷贝数不必是以每个细胞被认为是癌性为特征。因此,本发明公开的方法可用于检测其中不是所有细胞都显示可选基因拷贝数的完全模式的组织内癌性状态的存在。例如,可使用适当的探针(DNA或RNA)发现在源自肿瘤性、恶性组织样品的少至60%的细胞中存在而在源自相应的非癌性的或另外地正常的组织的多至60%的细胞中不存在(并因此在多至40%的这种正常组织细胞中存在)的一组选定的基因或标志物,包括在严格条件下与表1、3、4、5、6或8或者列表1-45确定的至少一种序列同源的、或至少90%、优选95%同一的序列。在一个实施方式中,发现这种模式在提取自癌组织的至少70%的细胞中存在,并在至少70%的相应正常、非癌性组织样品中不存在。在另一个实施方式中,发现这种模式在提取自癌性组织的至少80%的细胞中存在,并在至少80%的相应正常、非癌性组织样品中不存在。在另一个实施方式中,发现这种模式在提取自癌性组织的至少90%的细胞中存在,并在至少90%的相应正常、非癌性组织样品中不存在。在另一个实施方式中,发现这种模式在提取自癌性组织的至少100%的细胞中存在,并在至少100%的相应正常、非癌组织样品中不存在,尽管后面一种实施方式可能很少出现。
VII.分子谱
细胞学分析对于许多类型的疑似肿瘤(包括例如甲状腺瘤或结节)标志着当前的诊断标准。在本发明的一些实施方式中,测定为阴性、不确定、诊断性或非诊断性的样品可以进行随后的分析以获得更多信息。在本发明中,这些随后的分析包括基因组DNA、基因表达产物水平或基因表达产物可变剪接的分子谱步骤。在本发明的一些实施方式中,分子谱是指生物样品中基因组DNA的数目(例如拷贝数)和/或类型的测定。在一些情况下,所述数目和/或类型还可以与对照样品或据认为正常的样品相比较。在一些实施方式中,可以分析基因组DNA的拷贝数变化,例如拷贝数的增加(扩增)或减少,或变异体,例如插入、缺失、截短等。在一个实施方式中,碘酪氨酸脱碘酶基因(IYD)的缺失可用于检测甲状腺癌。之前已经证明IYD突变涉及甲状腺机能减退(Moreno等(2008)N Engl.J Med 358:1811-8)。在本发明中,IYD基因缺失被证明涉及甲状腺癌。在一些实施方式中,IYD缺失是50kD的缺失。IYD基因序列例如可以在Genbank中以登录号NM_203395找到。分子谱可以在相同样品、相同样品的一部分或可使用本发明描述的任何方法获得的新样品上进行。分子谱公司可以通过与个体直接接触或通过中介例如医师、第三方测试中心或实验室或者医学专业人员而要求额外的样品。在一些情况下,使用分子谱企业的方法和组合物与一些或所有细胞学染色或其他诊断方法结合来分析样品。在其他情况下,可使用分子谱企业的方法和组合物而不预先使用常规细胞学染色或其他诊断方法直接分析样品。在一些情况下,分子达谱单独的结果或与细胞学或其他分析结合的结果可以使本领域技术人员能够为受试者诊断或建议治疗。在一些情况下,分子谱可以单独使用或与细胞学方法结合使用来监测肿瘤或疑似肿瘤随着时间的恶性变化。
本发明的分子谱方法用于从受试者的一种或多种生物样品中提取并分析蛋白质或核酸(RNA或DNA)。在一些情况下,从所得整个样品中提取核酸。在其他情况下,从所得样品的一部分中提取核酸。在一些情况下,未进行核酸提取的样品部分可以通过细胞学检查或免疫组织化学进行分析。从生物样品提取RNA或DNA的方法是本领域所熟知的,例如包括使用商业试剂盒,例如Qiagen DNeasy Blood和Tissue Kit或Qiagen EZ1 RNA UniversalTissue Kit。
(i)组织型指纹
在许多情况下,生物样品,例如本发明方法提供的那些,可以包含若干细胞类型或组织,包括但不限于甲状腺滤泡细胞、甲状腺髓细胞、血细胞(RBC、WBC、血小板)、平滑肌细胞、管、管细胞、基底膜、腔、小叶、脂肪组织、皮肤细胞、上皮细胞及浸润巨噬细胞和淋巴细胞。在甲状腺样品的情况下,生物样品的诊断分类可以包括例如主要滤泡细胞(对于来源于滤泡细胞例如乳头状癌、滤泡癌和未分化甲状腺癌的癌症)和髓细胞(对于髓样癌)。在一些情况下来自甲状腺活组织检查的不确定生物样品的诊断涉及滤泡性腺瘤与滤泡癌的区分。因此,滤泡细胞的分子谱信号可以稀释并可能被存在于样品中的其他细胞类型混淆。来自其他组织或器官的生物样品的类似诊断通常包括诊断可能存在于样品中的许多细胞类型中的一种或多种细胞类型。
在一些实施方式中,本发明的方法提供测定特定生物样品的细胞构成(make-up)的先期方法,这样所得的基因组特征可以针对由于其他细胞和/或组织类型的存在而产生的稀释效应进行校准。一方面,该先期方法是一种使用已知细胞和/或组织特异性基因表达模式的组合作为样品的各组分的先期迷你-分类器的算法。该算法利用这一分子指纹以根据其组成预分类样品,并然后应用校正/标准化因子。在一些情况下,该数据随后输入到将该信息整合以利于最终诊断的的最终分类算法。
(ii)基因组分析
在一些实施方式中,基因组序列分析或基因分型可以在样品上进行。该基因分型可采取突变分析的形式,例如单核苷酸多态性(SNP)分析、插入缺失多态性(InDel)分析、可变数目串联重复序列(VNT)分析、拷贝数变异(CNV)分析(或称为拷贝数多态性)或者部分或全基因组测序。进行基因组分析的方法是本领域已知的并可以包括高通量测序,例如但不限于描述在美国专利No.7,335,762;7,323,305;7,264,929;7,244,559;7,211,390;7,361,488;7,300,788和7,280,922中的那些方法。进行基因组分析的方法也可以包括以下描述的微阵列方法。图1图解说明使用微阵列进行本发明的样品的基因组分析的方法。
在一些情况下,基因组分析可与本发明其他方法中的任一种结合进行。例如,可以获得样品,测试充足性并分成等分样品。然后一个或多个等分样品可用于本发明的细胞学分析,一个或多个等分样品可用于本发明的基因谱方法,以及一个或多个等分样品可用于基因组分析。此外,应理解本发明预期本领域技术人员可希望对生物样品进行本发明没有明确规定的其他分析。
在一些实施方式中,分子谱也可以包括但不限于本发明的分析,包括以下的一种或多种分析:蛋白表达产物、RNA表达产物、RNA表达产物水平、RNA表达产物剪接变体或表1、3、4、5、6或8或者列表1-45中提供的基因、DNA标志物或DNA区域的DNA多态性(例如拷贝数变异)。在一些情况下,本发明方法通过约1;2;3;4;5;6;7;8;9;10;15;20;25;30;35;40;45;50;60;70;80;90;100;120;140;160;180;200;240;280;300;350;400;450;500;600;700;800;1000;1500;2000;2500;3000;3500;4000;5000;7500;10,000;15,000;20,000;30,000;45,000;50,000;60,000;100,000;200,000;400,000;600,000;1百万;1百50万;2百万或更多个基因组DNA标志物的分子谱提供改善的癌症诊断。
在一个实施方式中,分子谱包括微阵列杂交,其被进行以确定选自表1、3、4、5、6或8或者列表1-45中的一个或多个基因的DNA多态性的存在或不存在。在一些实施方式中,确定参与一个或多个以下代谢或信号传导途径的一个或多个基因的DNA多态性:甲状腺激素产生和/或释放、蛋白激酶信号传导途径、脂质激酶信号传导途径和细胞周期蛋白。在一些情况下,本发明的方法提供1、2、3、4、5、6、7、9、10、11、12、13、14或15或者更多个不同的代谢或信号传导途径的至少一个基因的DNA多态性的分析。
在本发明的一些实施方式中,分子谱包括将样品或样品的一部分与本发明的一种或多种探针结合的步骤。与待测量样品组分即基因产物结合的合适的探针包括但不限于抗体或抗体片段、适体、核酸和寡核苷酸。样品与本发明探针的结合代表样品到与一种或多种探针结合的样品的物质转化。
(iii)表达产物谱
基因表达谱是一次测定数千基因的活性(表达)以产生细胞功能的全局图象的测量方法。这些谱例如可以区分活跃分裂的细胞或显示细胞如何对特定治疗作出反应。这种类型的许多实验同时测量整个基因组,也就是说,存在于特定细胞中的每个基因。微阵列技术测量预先确定的靶基因的相对活性。基于序列的技术,如基因表达的系列分析(SAGE、SuperSAGE)也用于基因表达谱。SuperSAGE是特别精确的,并可以测量任何活性基因,而不仅仅是预先确定的组。在RNA、mRNA或基因表达谱微阵列中,同时监测数千基因的表达水平以研究特定治疗、疾病和发育阶段对基因表达的效果。例如,基于微阵列的基因表达谱可用于表征本发明公开的遗传障碍、或不同癌症类型、癌症亚型和/或癌症阶段的基因特征。
表达谱实验通常包括测量在两种或更多种实验条件下表达的基因表达产物例如mRNA的相对量。这是因为基因表达产物的特定序列水平的改变提示对由基因表达产物编码的蛋白的需要的变化,也许指示体内平衡的反应或病理状态。例如,如果乳腺癌细胞表达比正常细胞高的水平的与特定跨膜受体有关的mRNA,则可能该受体在乳腺癌中发挥作用。本发明的一个方面包括作为用于遗传障碍和癌症,特别是甲状腺癌的重要的诊断性测试的一部分的基因表达谱。
在一些实施方式中,RIN≤5.0的RNA样品通常不用于多基因微阵列分析,而是仅可用于单基因RT-PCR和/或TaqMan分析。微阵列、RT-PCR和TaqMan分析是相关领域中熟知的标准分子技术。基于TaqMan探针的分析广泛用于实时PCR中,包括基因表达分析、DNA定量和SNP基因分型。
在一个实施方式中,建立本领域已知与癌症相关的基因表达产物的表达谱。这种基因表达产物已有描述,包括但不限于在美国专利No.7,358,061;7,319,011;5,965,360;6,436,642和美国专利申请2003/0186248、2005/0042222、2003/0190602、2005/0048533、2005/0266443、2006/0035244、2006/083744、2006/0088851、2006/0105360、2006/0127907、2007/0020657、2007/0037186、2007/0065833、2007/0161004、2007/0238119和2008/0044824中详细描述的基因表达产物。
进一步预期可能得知与癌症相关的其他基因表达产物,而且本发明描述的方法和组合物可以包括这种新发现的基因表达产物。
在本发明的一些实施方式中,替代地或额外地分析基因表达产物的表达水平之外的特征。例如,可以分析基因产物的可变剪接。可变剪接,也称为选择性外显子使用,是其中初级基因转录物(pre-mRNA)的外显子分离并且重新连接(即剪接)从而由相同基因产生选择性的mRNA分子的RNA剪接变异机制。在一些情况下,然后这些线性组合其中特定和独特的氨基酸序列由来自相同基因的各选择性mRNA分子确定的翻译过程,从而得到蛋白质同种型。可变剪接可以包括整合不同的外显子或不同的外显子组、保持特定内含子或使用可变剪接供体和受体位点。
在一些情况下,可以鉴别显示用于诊断良性、恶性或正常样品的可变剪接的标志物或标志物组。另外,可变剪接标志物还可以提供甲状腺癌的特定类型(例如乳头状、滤泡状、髓样和未分化癌)的诊断。本领域已知的用于诊断恶性肿瘤的可变剪接标志物包括美国专利No.6,436,642中所列的那些。
在一些情况下,不编码蛋白质的RNA表达产物例如miRNA和siRNA的表达可通过本发明方法测定。这些RNA表达产物的差异表达可以指示良性、恶性或正常样品。这些RNA表达产物的差异表达还可以指示良性样品(例如FA、NHP、LCT、BN、CN、HA)或恶性样品(例如FC、PTC、FVPTC、ATC、MTC)的亚型。在一些情况下,可通过本发明方法测定miRNA、siRNA、可变剪接RNA同种型、mRNA或其任何组合的差异表达。
在一些实施方式中,本发明提供16个的生物标志物组,各组是表征、排除和诊断甲状腺内的病理所要求的。这十六个组是:
1、正常甲状腺(NML)
2、淋巴细胞、自身免疫性甲状腺炎(LCT)
3、结节性增生(NHP)
4、滤泡状甲状腺腺瘤(FA)
5、Hurthle细胞甲状腺腺瘤(HC)
6、甲状旁腺(非甲状腺组织)
7、未分化甲状腺癌(ATC)
8、滤泡状甲状腺癌(FC)
9、Hurthle细胞甲状腺癌(HC)
10、乳头状甲状腺癌(PTC)
11、乳头状癌的滤泡变型(FVPTC)
12、髓样甲状腺癌(MTC)
13、肾癌转移到甲状腺
14、黑素瘤转移到甲状腺
15、B细胞淋巴瘤转移到甲状腺
16、乳腺癌转移到甲状腺
各组包括表征、排除和诊断甲状腺内的给定病理要求的一组生物标志物。组1-6描述良性病理。组7-16描述恶性病理。
甲状腺的生物性质及其内发现的各病理表明一个组中的多个生物标志物相对于另一个组中的多个生物标志物之间存在冗余。反映各病理亚型时,各诊断组相对于另一个组中的生物标志物是异质的和半冗余的。异质性和冗余性反映在给定FNA中取样的组织的生物学和表征各病理亚型的基因表达彼此的差异。
一方面,本发明的诊断价值在于比较i)一个组中的一个或多个标志物相对于ii)各附加组中一个或多个标志物。本发明的用途是其比目前可能的任何其他手段更高的FNA的诊断准确性。
在一些实施方式中,各组内的生物标志物是可互换的(模块的)。所有组中的多个生物标志物可被替代、增加、减少或改善以适应新的病理亚型的定义(例如从其他器官转移到甲状腺的新病例报告)。本发明描述了限定甲状腺中发现的十六个异质的、半冗余的和明显不同的病理中各病理的多个标志物。所有十六个组是达到准确诊断所要求的,且任何给定的面板单独不具有产生真实的诊断确定的足够能力。在一些实施方式中,各组中的生物标志物与合适的生物标志物的组合互换,这样各组中的多个生物标志物仍然定义检验定义所有其他病理亚型的多个生物标志物的情况中的给定病理亚型。在一些实施方式中,可以组合生物标志物以产生较大的生物标志物。在一些实施方式中,可以组合基因组区域以产生较大的基因组区域。例如,大小为100bp、2500bp和3000bp的明显不同基因组区域可以共同映射到给定基因,且可用于由三个基因组区域的组合产生单一生物标志物,以跨越最多达5600bp。
本发明的方法和组合物可以以任何组合具有选自1、2、3、4、5、6、7、8、9、10、11、12、13、14、15或16或者更多个生物标志物组的基因和可以具有来自各生物标志物组的1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50或更多个基因表达产物。在一些实施方式中,组合的基因集给出大于70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或99.5%的特异性或灵敏度,或至少95%、95.5%、96%、96.5%、97%、97.5%、98%、98.5%、99%、99.5%或更高的阳性预测值或阴性预测值。
(1)测定表达产物水平的体外方法
用于测定基因表达产物水平的一般方法是本领域已知的且可以包括但不限于以下一种或多种:其他的细胞学分析、用于特定蛋白质或酶活性的分析、用于特定表达产物包括蛋白质或RNA或特定RNA剪接变异体的分析、原位杂交、全基因组或部分基因组表达分析、微阵列杂交分析、SAGE、酶联免疫吸光度测定、质谱、免疫组织化学或印迹法。基因表达产物水平可以相对于内标(例如总mRNA)或特定基因(包括但不限于甘油醛-3-磷酸脱氢酶或微管蛋白)的表达水平标准化。
在本发明的一些实施方式中,基因表达产物标志物和可变剪接标志物可通过使用例如Affymetrix阵列、cDNA微阵列、寡核苷酸微阵列、点微阵列或来自Biorad、Agilent或Eppendorf的其他微阵列产品的微阵列分析确定。微阵列提供特别的优点,因为它们可以包含可以在单个分析中测定的大量基因或可变剪接变异体。在一些情况下,微阵列装置可以包含允许基因表达模式、基因组序列或可变剪接的综合评估的整个人类基因组或转录物组或其实质部分。可使用如Sambrook Molecular Cloning a Laboratory Manual 2001和Baldi,P.和Hatfield,W.G.,DNA Microarrays and Gene Expression 2002描写的标准分子生物学和微阵列分析技术发现标志物。
微阵列分析从使用本领域已知的方法从生物样品(例如活组织检查或细针抽吸物)提取和纯化核酸开始。对于表达和可变剪接分析,可以有利地从DNA提取和/或纯化RNA。此外可以有利地从其他形式的RNA例如tRNA和rRNA中提取和/或纯化mRNA。
还可以通过例如反转录、PCR、连接、化学反应或其他技术用荧光、放射性核素或化学标记例如生物素或地高辛来标记纯化的核酸。所述标记可以是直接或间接的,其可能还需要偶联阶段。所述偶联阶段可以发生在杂交之前,例如,使用氨基烯丙基-UTP和NHS氨基-活性染料(如花青染料),或在杂交之后,例如,使用生物素和标记的抗生蛋白链菌素。改性核苷酸(例如以1aaUTP∶4TTP的比例)以低于正常核苷酸的速率酶促添加,从而通常导致每60个碱基中1个改性核苷酸(用分光光度计测量)。然后,可用例如柱或渗滤装置纯化aaDNA。氨基烯丙基是连接到与反应性标签(例如荧光染料)反应的核碱基上的长接头上的胺基。
然后标记的样品可与杂交溶液混合,所述杂交溶液可以包含SDS、SSC、硫酸葡聚糖、封闭剂(例如COT1 DNA、鲑鱼精子DNA、小牛胸腺DNA、PolyA或PolyT)、Denhardt溶液、六亚甲基四胺或其组合。
杂交探针是可变长度的DNA或RNA片段,其用于检测DNA或RNA样品中与探针中的序列互补的核苷酸序列(DNA靶)的存在。因此所述探针与单链核酸(DNA或RNA)杂交,所述单链核酸的碱基序列由于探针和靶间的互补性而允许探针-靶碱基配对。标记的探针首先(通过加热或在碱性条件下)变性成单DNA链,然后与靶DNA杂交。
为检测探针与其靶序列的杂交,用分子标记物标示(或标记)所述探针;通常使用的标记物是32P或地高辛配基,后者是非放射性的基于抗体的标记物。然后通过经由自动射线照相术或其他成像技术来使杂交探针可视化来检测与探针具有中等或高的序列相似性的DNA序列或RNA转录物。具有中等或高的相似性的序列的检测取决于应用多严格的杂交条件—高严格性(例如高杂交温度和杂交缓冲液中的低盐)仅允许高度相似的核酸序列之间的杂交,而低严格性(例如较低温度和高盐)允许序列较低相似时的杂交。用于DNA微阵列的杂交探针是指和惰性表面例如涂覆的载玻片或基因芯片共价连接且可移动的cDNA靶与其杂交的DNA。
然后可通过加热或化学方法使该混合物变性并添加到微阵列中的口中。然后可以密封孔口,并且微阵列例如在杂交烘箱中杂交,其中微阵列通过旋转混合,或在混合机中混合。杂交过夜后,可洗去非特异性结合(例如用SDS和SSC)。然后可以干燥微阵列并在其中激光激发染料且检测器测量其发射的特殊机器中进行扫描。可用模板栅格覆盖图像并可定量特征(几个像素形成特征)的强度。
各种试剂盒可用于所述方法的核酸扩增和探针产生。可用于本发明中的试剂盒的例子包括但不限于Nugen WT-Ovation FFPE试剂盒、带有Nugen外显子模块和Frag/Label模块的cDNA扩增试剂盒。NuGEN WT-OvationTM FFPE System V2是全转录物组扩增系统,其使得能够在来源于FFPE样品的小的和降解的RNA的大量存档文件上进行全面基因表达分析。该系统由扩增少至50ng的总FFPE RNA所需的试剂和方案组成。所述方案可用于qPCR、样品存档、片段化和标记。可以使用NuGEN’s FL-OvationTM cDNA生物素模块V2使扩增的cDNA在少于两小时内片段化并标记用于GeneChip3’表达阵列分析。对于使用AffymetrixGeneChipExon和Gene ST阵列的分析,扩增的cDNA可和WT-Ovation外显子模块一起使用,然后使用FL-OvationTM cDNA生物素模块V2片段化并标记。对于Agilent阵列上的分析,可使用NuGEN’s FL-OvationTM cDNA荧光模块使扩增的cDNA片段化并标记。关于WT-OvationFFPE的更多的信息可在http://www.nugeninc.com/nugen/index.cfm/products/amplification-systems/wt-ovation-ffpe/上获得。
在一些实施方式中,可使用Ambion WT-表达试剂盒。Ambion WT-表达试剂盒允许直接扩增总RNA,而无需单独的核糖体RNA(rRNA)耗竭步骤。用Ambion WT-表达试剂盒,可在AffymetrixGeneChip人、小鼠和大鼠外显子和基因1.0ST阵列上分析少至50ng总RNA的样品。除低RNA输入要求及Affymetrix方法和Taqman实时PCR数据之间的高度一致性之外,AmbionWT表达试剂盒提供灵敏度的明显提高。例如,由于信噪比增加,用AmbionWT表达试剂盒可以获得在外显子水平上的上述背景检测的更大量的探针集。Ambion WT-表达试剂盒可和其他Affymetrix标记试剂盒组合使用。
在一些实施方式中,AmpTec Trinucleotide Nano mRNA扩增试剂盒(6299-A15)可用于所述方法。ExpressArtTRinucleotide mRNA扩增Nano试剂盒适用于大范围,从1ng到700ng的总RNA输入量。根据总RNA输入量和所需aRNA的产量,其可以用于1个循环(输入量>300ng总RNA)或2个循环(最小输入量1ng总RNA),其中RNA产量在>10μg的范围内。mpTec专用TRinucleotide引发技术导致与相对rRNA的选择结合的mRNA的优先扩增(与通用的真核3′-聚(A)-序列)无关)。AmpTec Trinucleotide Nano mRNA扩增试剂盒的更多信息可在http://www.amp-tec.com/products.htm上获得。该试剂盒可和cDNA转化试剂盒和Affymetrix标记试剂盒结合使用。
然后可以例如通过减去背景强度和随后再除使得各途径上的特征总强度相等的强度或参考基因的强度而标准化原始数据,且之后可以计算所有强度的t值。更精密的方法包括z比、局部加权最小二乘(loess)和局部加权(lowess)回归及用于Affymetrix芯片的RMA(加强的多芯片分析)。
(2)测定基因表达产物水平的体内方法
还预期本发明的方法和组合物可用于测定个体的基因表达产物水平而无需首先获得样品。例如,个体内的基因表达产物水平可在体内测定。用于体内测定基因表达产物水平的方法是本领域已知的,并包括成像技术,例如CAT、MRI;NMR;PET;和使用抗体或分子信标的蛋白或RNA水平的光学、荧光或生物光子成像。这种方法在US 2008/0044824、US 2008/0131892中描述,其以引用方式合并于此。预期用于体内分子谱的其他方法也在本发明范围内。
在本发明的一些实施方式中,分子谱包括使样品或样品的一部分与本发明一种或多种探针结合的步骤。合适的探针与待测量的样品组分即基因产物结合,且包括但不限于抗体或抗体片段、适体、核酸和寡核苷酸。样品和本发明探针的结合代表样品到与一种或多种探针结合的样品的物质转化。基于分子谱的诊断癌症方法还包括以下步骤:检测样品的基因表达产物(即mRNA或蛋白)和水平,从而将其与正常对照样品中的量比较来确定样品和对照之间的差异基因表达产物水平;和通过将一种或多种差异基因表达产物水平输入本发明的训练算法中来分类测试样品;使用本发明选择和分类算法确认样品分类;和鉴别样品对于遗传障碍或癌症的类型为阳性的。
(iii)样品与正常的比较
在由个体提供的样品(试验样品)上进行的分子谱分析的结果可以与已知或觉得是正常的生物样品比较。正常样品是没有或期望没有任何癌症、疾病或病症的样品,或在分子谱分析中对于任何癌症疾病或病症测试阴性的样品。正常样品可以来自不同于正测试个体的个体,或来自相同个体。正常样品可以与测试样品同时分析或在不同的时间分析。在一些情况下,正常样品可以从口腔拭子获得。
测试样品的分析结果可与正常样品的相同分析的结果相比较。在一些情况下正常样品的分析结果来自于数据库或参考文献。在一些情况下,正常样品的分析结果是本领域技术人员已知或普遍接受的值。在一些情况下这种比较是定性的。在其他情况下这种比较是定量的。在一些情况下定性或定量比较可以包括但不限于以下一种或多种:比较荧光值、点强度、吸光度值、化学发光信号、柱状图、临界阈值、统计显著性值、基因产物表达水平、基因产物表达水平变化、选择性外显子使用、选择性外显子使用的变化、DNA多态性、拷贝数变异、一种或多种DNA标志物或区域的存在或不存在的指示或者核酸序列。
(iv)结果评估
在一些实施方式中,使用用于使DNA多态性与特定表型相关的本领域已知方法评估分子谱结果,所述表型例如恶性肿瘤、恶性肿瘤的类型(例如滤泡癌)、良性或正常(例如无疾病或病症)。在一些情况下,可以确定规定的统计学置信水平以提供诊断置信水平。例如,可以确定大于90%的置信水平是恶性肿瘤、恶性肿瘤类型、正常或良性的可用预测器。在其他实施方式中,可以选择更严格或更宽松的置信水平。例如,可以选择大约70%,75%,80%,85%,90%,95%,97.5%,99%,99.5%或99.9%的置信水平作为可用的表型预测器。在一些情况下,所提供的置信水平可与样品质量、数据质量、分析质量、所用的特定方法和所分析的基因、标志物或基因组区域的数目有关。提供诊断的规定置信水平可基于假阳性或假阴性和/或成本的期望值来选择。用于选择实现规定的置信水平的参数或用于识别具有诊断能力的标志物的方法包括但不限于接收者操作曲线分析(ROC)、双正态ROC、主成分分析、部分最小二乘法分析、奇异值分解、最小绝对收缩和选择算子分析、最小角回归和阈值梯度定向正则化方法。
(v)数据分析
在一些情况下,原始数据,例如微阵列数据,可通过应用设计来标准化和/或提高数据可靠性的算法而改进。在本发明的一些实施方式中,由于需处理大量单个数据点,数据分析需要计算机或其他装置、机器或仪器以应用本发明描述的多种算法。“机器学习算法”是指用于表征基因表达谱的基于计算的预测方法,本领域技术人员也称为“分类器”。例如由基于微阵列的杂交分析获得的对应于某些表达水平的信号通常进行所述算法,从而分类所述表达谱。监督的学习通常包括“训练”分类器以识别各类别之间的区别,然后“测试”分类器在独立测试集的准确性。对于新的未知样品,所述分类器可用于预测样品所属的种类。
在一些情况下,加强的多阵列平均(RMA)法可用于标准化原始数据。RMA法通过计算多个微阵列上各匹配细胞的背景校正强度开始。背景校正的值被限制为正值,如Irizarry等的Biostatistics 2003 April 4(2):249-64所描述的。背景校正后,然后获得各背景校正的匹配细胞强度的基础-2对数。然后使用分位数归一化法标准化各微阵列上的背景校正的、对数转化的匹配强度,其中对于各输入阵列和各探针表达值,用所有阵列百分点的平均值替换阵列百分位探针值,该方法由Bolstad等的Bioinformatics 2003更完整地描述。分位标准化后,然后标准化数据可以拟合线性模型以获得各微阵列上的各探针的表达测量值。然后Tukey中位数平滑算法(Tukey,J.W.,Exploratory Data Analysis.1977)可用于确定标准化探针集数据的对数级表达水平。
还可以过滤数据以去除可能认为是可疑的数据。在一些实施方式中,得自具有少于约4、5、6、7或8个鸟嘌呤核苷+胞嘧啶核苷酸的微阵列探针的数据由于其异常杂交倾向或二级结构问题而被认为是不可靠的。类似地,得自具有超过约12、13、14、15、16、17、18、19、20、21或22个鸟嘌呤核苷+胞嘧啶核苷酸的微阵列探针的数据由于其异常杂交倾向或二级结构问题而被认为是不可靠的。
在一些情况下,可以通过相对于一系列参考数据集对探针集可靠性分级而从数据分析中选择不可靠的探针集以排除。例如,RefSeq或Ensembl(EMBL)被认为是质量非常高的参考数据集。在一些情况下,来自与RefSeq或Ensembl序列匹配的探针集的数据由于其预期的高可靠性而可以特别地包括在微阵列分析实验中。类似地,来自匹配可靠性较低的参考数据集的探针集的数据可从进一步的分析中排除,或视个案情况包括在进一步的分析中。在一些情况下,参考数据集可用于单独或共同地确定探针集可靠性。在一些情况下,可以对探针集的可靠性进行分级。例如,可将与所有参考数据集完全匹配的探针和/或探针集分级为最可靠的(1)。此外,可将与三分之二参考数据集匹配的探针和/或探针集分级为次最可靠的(2),可将与三分之一参考数据集匹配的探针和/或探针集分级为再次的(3)和可将不与参考数据集匹配的探针和/或探针集分级为最末的(4)。然后可以根据其分级从分析中包括或排除探针和/或探针集。例如,可以选择包括来自1、2、3和4类的探针集;1、2和3类的探针集;1和2类的探针集;或1类的探针集的数据用于进一步分析。在另一个实施例中,可通过与参考数据集项错配的碱基对数目对探针集分级。应理解存在许多在本领域知道用于评估给定探针和/或探针集对于分子谱的可靠性的方法,且本发明的方法包括这些方法中的任一种及其组合。
在本发明的一些实施方式中,如果用于给定基因或转录物簇的探针集包含的探针少于通过预先描述的对于GC含量、可靠性、变异等的筛选步骤的最小数目,则它们可从进一步的分析中排除。例如在一些实施方式中,如果用于给定基因或转录物簇的探针集包含少于约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15个,或少于约20个探针,则它们可从进一步的分析中排除。
微阵列数据的数据分析方法还可以包括使用预分类器算法。例如,甲状腺结节的细针抽吸物(FNA)包含几种细胞类型,包括甲状腺滤泡细胞、甲状腺髓细胞、血细胞(RBC、WBC、血小板)、平滑肌细胞及浸润巨噬细胞和淋巴细胞。FNA的诊断分类主要包括初级滤泡细胞(对于源于滤泡细胞例如乳头状癌、滤泡癌和未分化甲状腺癌的癌症)和髓细胞(对于髓样癌)。因为髓样和未分化甲状腺癌很少以不确定分类存在,不确定FNA的诊断主要涉及区分滤泡性腺瘤与滤泡癌。因此,卵泡细胞的分子谱(例如拷贝数变异或其他DNA多态性)信号被稀释并可能被存在于FNA中的其他细胞类型混淆。测定特定FNA的细胞构成的先期方法可以使所得分子表达谱特征相对于稀释效应校准。已知细胞特异性基因表达模式的组合可用作FNA的各细胞组分的先期小分类器。然后算法可利用该细胞特异性分子指纹根据其组成预分类样品,然后应用校正/标准化因子。然后该数据/信息可输入将整合该信息以有利于良性或正常相对恶性的最终诊断的最终分类算法。因此,在一些实施方式中,通过本发明方法分析基因组DNA包括分析基因表达模式,从而提供样品的细胞组成的校正/标准化因子。
在本发明的一些实施方式中,如果它们不表达或以不可检测水平(不高于背景)表达,来自探针集的数据可从分析中排除。如果任何组满足以下情况,则认为探针集判断为高于背景表达:
标准正态分布的T0到无穷大的积分<显著性(0.01)
其中:
T0=Sqr(GroupSize)(T-P)/Sqr(Pvar),
GroupSize=组中的CEL文件数,
T=探针集中探针得分的平均值,
P=GC含量的背景探针平均的平均值,以及
Pvar=背景探针变异的和/(探针集中探针数)2
这允许包括其中组中探针集的平均高于作为对于探针集背景的中心的具有与探针集类似的GC含量的背景探针的平均表达的探针集,并使得能够从背景探针集变异中导出探针集离差。
在本发明的一些实施方式中,不显示变异或显示低差异的探针集可从进一步分析中排除。低变异探针集经由卡方(Chi-Square)检验从分析中排除。如果探针集的转化变异在具有(N-1)自由度的卡方分布的99%置信区间的左侧,则其被认为是低变异。
(N-1)*探针集变异(基因探针集变异)~卡方(N-1)
其中N是输入CEL文件数,(N-1)是卡方分布的自由度,以及′基因的探针集变异′是基因间的探针集变异的平均。
在本发明的一些实施方式中,如果给定基因或转录物簇的探针集包含的探针少于通过之前描述的用于GC含量、可靠性、变异等的过滤器步骤的探针的最小数目,则它们可从进一步分析中排除。例如在一些实施方式中,如果给定基因或转录物簇的探针集包含小于1、2、3、4、5、6、7、8、9、10、11、12、13、14、15个,或小于约20个探针,则它们可从进一步分析中排除。
基因表达水平或可变剪接的数据分析方法还可以包括使用本发明提供的特征选择算法。在本发明的一些实施方式中,通过利用LIMMA软件包(Smyth,G.K.(2005).Limma:linear models for microarray data.In:Bioinformatics and Computational BiologySolutions using R and Bioconductor,R.Gentleman,V.Carey,S.Dudoit,R.Irizarry,W.Huber(eds.),Springer,New York,pages 397-420)提供特征选择。
基因表达水平和/或可变剪接的数据分析方法还可以包括使用预分类器算法。例如,算法可利用细胞-特异性分子指纹根据其组成预分类样品,然后应用校正/标准化因子。然后该数据/信息可输入将整合该信息以有利于最终诊断的最终分类算法中。
基因表达水平和或可变剪接的数据分析方法还可以包括使用本发明提供的分类器算法。在本发明的一些实施方式中,提供支持向量机(SVM)算法、随机森林算法或其组合用于微阵列数据的分类。在一些实施方式中,基于统计显著性选择区分样品(例如良性对恶性,正常对恶性)或区分亚型(例如PTC对FVPTC)的识别标志物。在一些情况下,将BenjaminiHochberg校正应用于错误发现率(FDR)后进行统计显著性选择。
在一些情况下,所述分类器算法可以以荟萃分析方式进行补充,例如由Fishel和Kaufman等,2007 Bioinformatics 23(13):1599-606描述的方式。在一些情况下,该分类器算法可以补充以荟萃分析方式进行补充,例如再现性分析。在一些情况下,所述再现性分析选择出现在至少一个预测的表达产物标志物集中的标志物。
在一些情况下,特征选择和分类的结果可使用贝叶斯后分析法(Bayesian post-analysis method)分级。例如,可使用本领域已知方法例如本发明提供的方法来提取、标准化和总结微阵列数据。然后数据可以进行特征选择步骤,例如本领域已知的任何特征选择方法,例如本发明提供的方法,包括但不限于LIMMA中提供的特征选择方法。然后所述数据可以进行分类步骤,例如本领域已知的任何分类方法,例如使用本发明提供的任何算法或方法,包括但不限于使用SVM或随机森林算法。然后可以根据后验概率函数分级分类器算法的结果。例如,后验概率函数可以由检验已知分子谱结果(例如已公布结果)以从将标志物分配到一类(例如良性、恶性、正常、ATC、PTC、MTC、FC、FN、FA、FVPTC CN、HA、HC、LCT、NHP等)中的I型和II型误差率中导出先验概率而得到。可基于各研究报告的样品大小使用估计的倍数变化值(例如1.1、1.2.、1.3、1.4、1.5、1.6、1.7、1.8、1.9、2、2.2、2.4、2.5、3、4、5、6、7、8、9、10或以上)来计算这些误差率。然后这些先验概率可以和本发明的分子谱数据集结合以评估差异基因表达的后验概率。最后,所述后验概率评估可与本发明第二数据集结合以创制差异表达的最终后验概率。用于导出后验概率并将后验概率应用于微阵列数据分析的其他方法是本领域已知的,且已例如描述在Smyth,G.K.2004Stat.Appl.Genet.Mol.Biol.3:Article 3中。在一些情况下,所述后验概率可用于分级由分类器算法提供的标志物。在一些情况下,可以根据其后验概率分级标志物,且可选择通过所选阈值的那些作为其差异表达指示或诊断例如良性、恶性、正常、ATC、PTC、MTC、FC、FN、FA、FVPTC CN、HA、HC、LCT或NHP的样品的标志物。示例性的阈值包括0.7、0.75、0.8、0.85、0.9、0.925、0.95、0.975、0.98、0.985、0.99、0.995或更高的先验概率。
分子谱结果的统计学评估可以提供指示以下一种或多种可能性的一个或多个定量值:诊断准确性的可能性、癌症、疾病或病症的可能性、特定癌症、疾病或病症的可能性、特定治疗性干预成功的可能性。因此可能没有经过遗传学或分子生物学训练的医师不必了解原始数据。相反,所述数据以指导患者护理的最有用的形式直接提供给医师。分子谱的结果可使用本领域已知的许多方法进行统计学评估,包括但不限于:students T检验、双侧T检验、皮尔森秩和分析、隐马尔可夫模型分析、q-q图分析、主成分分析、单向ANOVA、双向ANOVA、LIMMA等。
在本发明的一些实施方式中,单独使用分子谱或者与细胞学分析结合使用分子谱可以提供约85%准确性到约99%或约100%准确性的诊断。在一些情况下,分子谱企业可以通过使用分子谱和/或细胞学提供约85%、86%、87%、88%、90%、91%、92%、93%、94%、95%、96%、97%、97.5%、98%、98.5%、99%、99.5%、99.75%、99.8%、99.85%或99.9%准确性的恶性、良性或正常的诊断。
在一些情况下,可通过在一段时间内跟访受试者来确定初始诊断的准确性。在其他情况下,可以确定性的方式或者使用统计方法建立准确性。例如,接受者操作特征(ROC)分析可用于确定最优分析参数,从而实现准确性、特异性、阳性预测值、阴性预测值和/或错误发现率的特定水平。在癌症诊断中使用ROC分析的方法是本领域已知的且例如描述在美国专利申请No.2006/019615中,其以引用方式全部合并于此。
在本发明的一些实施方式中,可以选择编码基因组DNA标志物或区域或其互补序列的多核苷酸作为本发明的分子谱试剂,所述基因组DNA标志物或区域确定为在良性和正常、良性和恶性、恶性和正常之间,或者在本发明提供的任何一种疾病或状态和本发明提供的任何其他疾病或状态包括恶性肿瘤、良性或正常之间在存在或不存在一种或多种DNA多态性或者存在或不存在一种或多种拷贝数变异时显示最大差异。这种多核苷酸可通过提供比本领域已知和使用的现有方法更宽的动态范围、更大的信噪比、改善的诊断能力、更低的假阳性或假阴性可能性或更高的统计学置信水平而特别地有用。
在本发明的其他实施方式中,单独使用分子谱或者和细胞学分析结合使用分子谱与使用本领域已知的标准细胞学技术相比可以减少评定为非诊断性的样品的数目约100%、99%、95%、90%、80%、75%、70%、65%或约60%。在一些情况下,本发明方法与本领域已知的标准细胞学方法相比可以减少评定为中间或疑似的样品的数目约100%、99%、98%、97%、95%、90%、85%、80%、75%、70%、65%或约60%。
在一些情况下,将分子谱分析的结果输入数据库中以供分子谱企业、个体、医疗提供者或保险提供者的代表或代理人访问。在一些情况下分析结果包括企业的代表、代理人或顾问,例如医学专业人员的解释或诊断。在其他情况下,自动提供数据的计算机或算法分析。在一些情况下分子谱企业可以向个体、保险提供者、医疗提供者、研究人员或政府机构为以下一项或多项服务收费:所进行的分子谱分析、咨询服务、数据分析、结果报告或数据库访问。
在本发明的一些实施方式中,分子谱结果作为计算机屏幕上的报告或作为纸件报告提供。在一些情况下,所述报告可以包括但不限于以下一种或多种信息:显示多态性或拷贝数变异的DNA标志物或区域的存在或不存在、差异表达的基因数、原始样品的适合性、显示差异可变剪接的基因数、诊断、诊断的统计学置信度、癌症或恶性肿瘤的可能性和指定疗法。
(vi)基于分子谱结果的样品分类
分子表达谱结果可分类为以下之一:阴性(无癌症、疾病或病症)、诊断的(癌症、疾病或病症的阳性诊断)、不确定或疑似的(提示癌症、疾病或病症)或非诊断的(对于癌症、疾病或病症的存在或不存在提供的信息不够)。在一些情况下,诊断结果还可以分类癌症、疾病或病症的类型。在其他情况下,诊断结果可以指示涉及癌症疾病或病症的特定分子途径,或特定癌症疾病或病症的特定等级或阶段。在再其他情况下诊断结果可以告知适当的治疗性干预,例如特定的药物方案(如激酶抑制剂,例如Gleevec或本领域已知的任何药物)或外科手术介入(如甲状腺切除术或偏侧甲状腺切除术)。
在本发明的一些实施方式中,使用训练算法分类结果。本发明的训练算法包括使用已知的恶性、良性和正常样品(包括但不限于表2所列样品)的参考集开发的算法。适于样品分类的算法包括但不限于k-最近邻算法、概念向量算法(concept vector algorithm)、朴素贝叶斯算法、神经网络算法、隐马尔可夫模型算法、遗传算法和互信息特征选择算法或其任何组合。在一些情况下,本发明的训练算法可以整合除了基因组DNA多态性数据(例如拷贝数变异数据)、基因表达数据可变剪接数据以外的数据例如但不限于本发明的细胞学家或病理学家进行的评估或诊断、由本发明的预分类器算法提供的信息或本发明受试者的病史信息。
(vii)经由分子谱监测受试者或治疗性干预
在一些实施方式中,可使用本发明的方法和组合物监测受试者。例如,受试者可以诊断为患有癌症。该初始诊断可以包括或不包括使用分子谱。所述受试者可以被规定治疗性干预,例如,甲状腺切除术、偏侧甲状腺切除术、激素或激素促效剂治疗、化疗治疗或放射治疗。治疗性干预的结果可以通过分子谱在持续进行的基础上监测,以检测治疗性干预的效果。在另一个实施方式中,受试者可能诊断为患有良性肿瘤或癌前病变或结节,且所述肿瘤、结节或病变可以通过分子谱在持续进行的基础上监测,以检测肿瘤或病变状态的任何变化。
分子谱也可以用于在特定治疗性干预施用于受试者之前确定特定治疗性干预的潜在效果。例如,受试者可能诊断为患有癌症。分子谱可以指示已知包含或靠近一种或多种涉及甲状腺疾病或病症的基因(例如RAS致癌基因或碘酪氨酸脱碘酶基因)的基因组DNA区域的拷贝数变化。肿瘤样品可以使用本领域已知方法在体外获得和培养。然后可以测试异常活化的、失活的或失调的途径的各种抑制剂或已知抑制该途径活性的药物的应用对于肿瘤细胞系的生长抑制。分子谱也可以用于监测这些抑制剂对于例如涉及的途径的下游靶标的作用。
(viii)分子谱作为研究工具
在一些实施方式中,分子谱可用作研究工具,以鉴别用于诊断疑似肿瘤的新的标志物;监测药物或候选药物对于生物样品例如肿瘤细胞、细胞系、组织或生物体的作用;或揭示肿瘤发生和/或肿瘤抑制的新途径。
组合物
本发明也提供组合物,所述组合物包含以下一种或多种:对应于表1、3、4、5、6或8或者列表1-45提供的基因间区域、基因或一部分基因的核苷酸(例如DNA或RNA)。本发明核苷酸的长度可以是至少约10、15、20、25、30、35、40、45、50、55、60、65、70、75、100、150、200、250、300、350或约400或500个核苷酸。在本发明的一些实施方式中,所述核苷酸可以是核糖核酸或脱氧核糖核酸的天然或人造衍生物,包括但不限于肽核酸、吡喃糖基RNA(pyranosylRNA)、核苷、甲基化核酸、聚乙二醇化核酸、环核苷酸和和化学改性的核苷酸。在本发明的一些组合物中,本发明核苷酸已经过化学改性从而包括可检测标记。在本发明的一些实施方式中,所述生物样品已经过化学改性从而包括标记。在一些实施方式中,本发明提供的组合物包括固定在固体基质(例如一种或多种珠子、平板、阵列、微阵列或一个或多个孔或斑点)上的核苷酸(例如DNA或RNA)。
本发明的其他组合物包含用于检测或测定DNA多态性例如表1、3、4、5、6或8或者列表1-45中提供的任何基因或DNA区域或其互补序列的拷贝数变异或SNP或本发明提供的任何多态性的寡核苷酸。本发明的其他组合物包含用于检测(即测定)表1、3、4、5、6或8或者列表1-45中提供的基因的多态等位基因或其互补序列的表达产物的寡核苷酸。这种多态等位基因包括但不限于剪接位点变异体、单核苷酸多态性、可变数重复序列多态性、插入、缺失和同源物。在一些情况下,变异等位基因与表1、3、4、5、6或8或者列表1-45所列基因具有约99.9%到约70%的同一性,包括约99.75%、99.5%、99.25%、99%、97.5%、95%、92.5%、90%、85%、80%、75%和约70%的同一性。在一些情况下,变异的等位基因与表1、3、4、5、6或8或者列表1-45提供的基因的差异为约1个核苷酸到约500个核苷酸,包括约1、2、3、5、7、10、15、20、25、30、35、50、75、100、150、200、250、300和约400个核苷酸。
(vii)基于分子谱的生物标志物分组
甲状腺基因可以按照下组来描述:1)良性对恶性,2)可变基因剪接,3)KEGG途径,4)正常甲状腺,5)甲状腺病理亚型,6)基因本体论,和7)从非甲状腺器官转移到甲状腺的转移生物标志物。本发明的方法和组合物可以以任何组合具有选自上列组和/或来自上列任何组的1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50或更多个亚组(例如一种或多种不同的KEGG途径)的一个或多个基因和可以具有来自各组的1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50或更多个基因表达产物。本发明中不同途径中的多个基因的使用可以指示特定的甲状腺病理。例如,这可用于指示不同途径中的遗传变化可以改变细胞调节的冗余系统。在其他实施方式中,本发明中单个途径中的多个基因的使用可以指示特定的甲状腺病理。例如,这可用于确认特定途径中的恶化。在一些实施方式中,组合的基因集得到大于70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或99.5%的特异性或灵敏度,或至少95%、95.5%、96%、96.5%、97%、97.5%、98%、98.5%、99%、99.5%或更高的阳性预测值或阴性预测值。
在一些实施方式中,细胞外基质、粘着连接、粘着斑和紧密连接基因用作甲状腺癌的生物标志物。在一些实施方式中,信号传导途径选自以下三个途径中的一个:粘着途径、粘着斑途径和紧密连接途径。在一些实施方式中,至少一个基因选自该三个途径之一。在一些实施方式中,至少一个基因选自所述三个途径的各一个。在一些实施方式中,至少一个基因选自三个途径中的两个。在一些实施方式中,选择涉及所有三个途径的至少一个基因。在一个实施例中,选择涉及粘着途径、粘着斑途径和紧密连接途径的一组基因作为诊断癌症例如甲状腺癌的标志物。
内衬甲状腺滤泡的滤泡细胞结构上是高度极化和组织化的,从而需要其管腔和顶细胞膜的明显不同作用。在一些实施方式中,细胞骨架、胞质膜和细胞间隙基因用作甲状腺癌的生物标志物。在一些实施方式中,在所有这四个途径(即ECM、粘着斑、粘着和紧密连接途径)中重叠的基因用作甲状腺癌的生物标志物。在一个实施例中,本发明提供作为甲状腺分类基因列表的良性对恶性组。已根据KEGG途径、基因本体论和染色体定位分组该列表(例如参见表1、3、4、5、6或8或者列表1-45)。KEGG途径还描述在表1中。
在一些实施方式中,从以下标志物列表中选择用于诊断癌症例如甲状腺癌的标志物进行检查:
甲状腺外科病理亚型为如下所列:
(i)列表1:FC亚型,n=3:PAX8、PSD4、IYD
(ii)列表2:FVPTC亚型,n=15:ARHGEF5、LOC728377、OR2A20P、OR2A5、OR2A9P、OR2A42、ZNF486、ZNF626、ZNF826、RMST、RMST、OR2A20P、OR2A5、OR2A9P、p12-33192661-33198630(这是否正确?)
(iii)列表3:PTC亚型,n=9:AK129935、BC043197、DUSP22、ENST00000384854、ENST00000398221、LOC645433、LRRK2、RMST、XM_001132965
(vi)列表4:NHP亚型,n=2:OR2T3、OR2T34
显性基因本体论甲状腺生物标志物为如下所列:
列表5:多细胞生物体过程,n=73:ABLIM1 AFAP1L2 AGTR1 CD9 CDK5RAP2DSCAML1 DUSP22 DYSF EPS8 FOS GRIN3A HMGA2 MET MICALCL MLLT3 MSH3 NEDD4L OPRM1OR2T3 PARK2 PAX8 PPAP2B TGFBR3 B4GALT1 C1orf68 CNN3 CSDE1 DAD1 EDN3 EMP1 EPORFAT3 FKBP1A FOXE1 HLA-DOA HNF4A HOXC10 HOXC11 HOXC12 HOXC13 HOXC4 HOXC5 HOXC6HOXC8 HOXC9 KRT71 LCE1C LCE1E LCE3B LCE3C LCE3E LCE6A MMP26 MYT1 NOBOX NOTCH2NOTCH2NL NPNT NRAS OR10J5 OR2A42 OR2A5 OR2T34 OR51A2 OR51A4 OR5A2 OR5B21OR6J1 PLSCR1 SCIN SLC5A3 TMC1 ZFAND5
列表6:多细胞生物体发育,n=53:ABLIM1 AGTR1 CD9 CDK5RAP2 DSCAML1 DUSP22FOS GRIN3A HMGA2 MET MICALCL MLLT3 MSH3 PARK2 PAX8 PPAP2B TGFBR3 B4GALT1C1orf68 CSDE1 DAD1 EDN3 EMP1 EPOR FAT3 FKBP1A FOXE1 HLA-DOA HOXC10 HOXC11HOXC12 HOXC13 HOXC4 HOXC5 HOXC6 HOXC8 HOXC9 KRT71 LCE1C LCE1E LCE3B LCE3CLCE3E LCE6A MYT1 NOBOX NOTCH2 NOTCH2NL NPNT NRAS SCIN SLC5A3 ZFAND5
列表7:前后模式形成(anteriorposterior pattern formation),n=9:MLLT3HOXC10 HOXC11 HOXC13 HOXC4 HOXC5 HOXC6 HOXC8 HOXC9
列表8:表皮发育,n=11:C1orf68 EMP1 FOXE1 HOXC13 KRT71 LCE1C LCE1ELCE3B LCE3C LCE3E LCE6A
列表9:区域化,n=10:DSCAML1 MLLT3 HOXC10 HOXC11 HOXC13 HOXC4 HOXC5HOXC6 HOXC8 HOXC9
列表10:外胚层发育,n=11:FOXE1 HOXC13 KRT71 LCE1C LCE1E LCE3B LCE3CLCE3E LCE6A
列表11:角化,n=6:LCE1C LCE1E LCE3B LCE3C LCE3E LCE6A
列表12:发育过程,n=58:ABLIM1 AGTR1 CD9 CDK5RAP2 CTSB DSCAML1 DUSP22FOS GRIN3A HMGA2 MET MICALCL MLLT3 MSH3 PARK2 PAX8 PDCD4 PPAP2B TGFBR3 ASNSB4GALT1 C1orf68 CSDE1 CTBP2 DAD1 EDN3 EMP1 EPOR FAT3 FKBP1A FOXE1 HLA-DOAHOXC10 HOXC11 HOXC12 HOXC13 HOXC4 HOXC5 HOXC6 HOXC8 HOXC9 KRT71 LCE1C LCE1ELCE3B LCE3C LCE3E LCE6A LRRK2 MYT1 NOBOX NOTCH2 NOTCH2NL NPNT NRAS SCINSLC5A3 ZFAND5
列表13:组织发育,n=19:TGFBR3 B4GALT1 C1orf68 EMP1 EPOR FKBP1A FOXE1HOXC11 HOXC13 HOXC4 KRT71 LCE1C LCE1E LCE3B LCE3C LCE3E LCE6A NRAS ZFAND5
列表14:细胞过程的调节,n=100:AFAP1L2 AFF1 AGTR1 ARHGEF5 CDK5RAP2 CTSBDEK DMAP1 DUSP22 EBAG9 EPS8 FOS GNA14 GNG10 GPR39 HMGA2 IL18R1 KRT8 LMO3MCTP2 MET MLLT3 MSH3 NEDD4L OPRM1 OR2T3 PAX8 PDCD4 PDE8B PPAP2B PPP2R5E PSD4RAF1 RAP1A RCBTB1 SPATA13 TGFBR3 ZNF253 ASNS B4GALT1 CNTNAP4C SDE1 CTBP2 DAD1DTX4 EDN3 EIF4E3 ENY2 EPOR FKBP1A FOXE1 FOXO6 GOLT1B GPR45 HLA-DOA HNF4AHOXC10 HOXC11 HOXC12 HOXC13 HOXC4 HOXC5 HOXC6 HOXC8 HOXC9 IL1RL1 INSIG1IQSEC1 IQSEC3 LOC400713 LRRK2 MYT1 NFIB NOBOX NOTCH2 NOTCH2NL NRAS OR10J5OR2A42 OR2A5 OR2T34 OR51A2 OR51A4 OR5A2 OR5B21 OR6J1 PTPRD RSPO4 SCIN SESN1SIRPB1 SMARCB1 ST18 TTF2 VGLL4 ZFAND5 ZNF486 ZNF610 ZNF626 ZNF826
列表15:系统发育,n=41:ABLIM1 AGTR1 CD9 CDK5RAP2 DSCAML1 FOS GRIN3AMET MSH3 PARK2 PPAP2B TGFBR3 B4GALT1 C1orf68 CSDE1 EMP1 EPOR FKBP1A FOXE1HLA-DOA HOXC10 HOXC11 HOXC13 HOXC4 HOXC5 HOXC6 HOXC8 HOXC9 KRT71 LCE1C LCE1ELCE3B LCE3C LCE3E LCE6A MYT1 NOTCH2 NRAS SCIN SLC5A3 ZFAND5
列表16:生物过程的调节,n=102:AFAP1L2 AFF1 AGTR1 ARHGEF5 CDK5RAP2 CTSBDEK DMAP1 DUSP22 EBAG9 EPS8 FOS GNA14 GNG10 GPR39 GRIN3A HMGA2 IL18R1 KRT8LMO3 MCTP2 MET MLLT3 MSH3 NEDD4L OPRM1 OR2T3 PAX8 PDCD4 PDE8B PPAP2B PPP2R5EPSD4 RAF1 RAP1A RCBTB1 SPATA13 TGFBR3 ZNF253 ASNS B4GALT1 CNTNAP4 CSDE1 CTBP2DAD1 DTX4 EDN3 EIF4E3 ENY2 EPOR FKBP1A FOXE1 FOXO6 GOLT1B GPR45 HLA-DOA HNF4AHOXC10 HOXC11 HOXC12 HOXC13 HOXC4 HOXC5 HOXC6 HOXC8 HOXC9 IL1RL1 INSIG1IQSEC1 IQSEC3 LOC400713 LRRK2 MYT1 NFIB NOBOX NOTCH2 NOTCH2NL NRAS OR10J5OR2A42 OR2A5 OR2T34 OR51A2 OR51A4 OR5A2 OR5B21 OR6J1 PTPRD RSPO4 SCIN SESN1SIRPB1 SLC5A3 SMARCB1 ST18 TTF2 VGLL4 ZFAND5 ZNF486 ZNF610 ZNF626 ZNF826
列表17:解剖结构发育,n=43:ABLIM1 AGTR1 CD9 CDK5RAP2 DSCAML1 FOSGRIN3A MET MSH3 PARK2 PAX8 PPAP2B TGFBR3 B4GALT1 C1orf68 CSDE1 DAD1 EMP1 EPORFKBP1A FOXE1 HLA-DOA HOXC10 HOXC11 HOXC13 HOXC4 HOXC5 HOXC6 HOXC8 HOXC9 KRT71LCE1C LCE1E LCE3B LCE3C LCE3E LCE6A MYT1 NOTCH2NRAS SCIN SLC5A3 ZFAND5
列表18:生物调节,n=105:AFAP1L2 AFF1 AGTR1 ARHGEF5 CD9 CDK5RAP2 CTSBDEK DMAP1 DUSP22 EBAG9 EPS8 FOS GNA14 GNG10 GPR39 GRIN3A HMGA2 IL18R1 KRT8LMO3 MCTP2 MET MLLT3 MSH3 NEDD4L OPRM1 OR2T3 PAX8 PDCD4 PDE8B PPAP2B PPP2R5EPSD4RAF1 RAP1A RCBTB1 SPATA13 TGFBR3 ZNF253 ASNS B4GALT1 CNTNAP4 CSDE1 CTBP2DAD1 DTX4 EDN3 EIF4E3 EMP1 ENY2 EPOR FKBP1A FOXE1 FOXO6 GOLT1B GPR45 HLA-DOAHNF4A HOXC10 HOXC11 HOXC12 HOXC13 HOXC4 HOXC5 HOXC6 HOXC8 HOXC9 IL1RL1 INSIG1IQSEC1 IQSEC3 LOC400713 LRRK2 MYT1 NFIB NOBOX NOTCH2 NOTCH2NL NRAS OR10J5OR2A42 OR2A5 OR2T34 OR51A2 OR51A4 OR5A2 OR5B21 OR6J1 PLSCR1 PTPRD RSPO4 SCINSESN1 SIRPB1 SLC5A3 SMARCB1 ST18 TTF2 VGLL4 ZFAND5 ZNF486 ZNF610 ZNF626ZNF826
列表19:模式说明过程(pattern specification process),n=10:DSCAML1MLLT3HOXC10 HOXC11 HOXC13 HOXC4 HOXC5 HOXC6 HOXC8 HOXC9
列表20:角化细胞分化,n=6:LCE1C LCE1E LCE3B LCE3C LCE3E LCE6A
列表21:表皮细胞分化,n=6:LCE1C LCE1E LCE3B LCE3C LCE3E LCE6A
列表22:器官发育,n=31:ABLIM1 AGTR1 CDK5RAP2 DSCAML1 MET PPAP2B TGFBR3B4GALT1 C1orf68 CSDE1 EMP1 EPOR FKBP1A FOXE1 HLA-DOA HOXC11 HOXC13 HOXC4HOXC8 HOXC9 KRT71 LCE1C LCE1E LCE3B LCE3C LCE3E LCE6A NOTCH2 NRAS SCIN ZFAND5
列表23:序列特异性DNA结合,n=16:FOS HMGA2 MSH3 FOXE1 FOXO6 HNF4AHOXC10 HOXC11 HOXC12 HOXC13 HOXC4 HOXC5 HOXC6 HOXC8 HOXC9 NOBOX
列表24:转录调节,DNA-依赖型,n=33:AFAP1L2 AFF1 DEK FOS HMGA2 MLLT3PAX8 PDE8B ZNF253 CSDE1 ENY2 FOXE1 FOXO6 HNF4A HOXC10 HOXC11 HOXC12 HOXC13HOXC4 HOXC5 HOXC6 HOXC8 HOXC9 LOC400713 MYT1 NFIB NOBOX NOTCH2 SMARCB1 ST18ZNF486 ZNF610 ZNF626
列表25:胚胎发育,n=13:DSCAML1 MLLT3 PPAP2B DAD1 EPOR FOXE1 HOXC10HOXC11 HOXC4 HOXC5 HOXC6 HOXC9 ZFAND5
列表26:RNA代谢过程的调节,n=33:AFAP1L2 AFF1 DEK FOS HMGA2 MLLT3 PAX8PDE8B ZNF253 CSDE1 ENY2 FOXE1 FOXO6 HNF4A HOXC10 HOXC11 HOXC12 HOXC13 HOXC4HOXC5 HOXC6 HOXC8 HOXC9 LOC400713 MYT1 NFIB NOBOX NOTCH2 SMARCB1 ST18 ZNF486ZNF610 ZNF626
列表27:ARF脒基-核苷酸交换因子活性,n=3:PSD4 IQSEC1 IQSEC3
列表28:转录,DNA-依赖型,n=34:AFAP1L2 AFF1 DEK FOS HMGA2 MLLT3 PAX8PDE8B ZNF253 CSDE1 ENY2 FOXE1 FOXO6 HNF4A HOXC10 HOXC11 HOXC12 HOXC13 HOXC4HOXC5 HOXC6 HOXC8 HOXC9 LOC400713 MYT1 NFIB NOBOX NOTCH2 SMARCB1 ST18 TTF2ZNF486 ZNF610 ZNF626
列表29:RNA生物合成过程,n=34:AFAP1L2,AFF1,DEK,FOS,HMGA2,MLLT3,PAX8,PDE8B,ZNF253,CSDE1,ENY2,FOXE1,FOXO6,HNF4A,HOXC10,HOXC11,HOXC12,HOXC13,HOXC4,HOXC5,HOXC6,HOXC8,HOXC9,LOC400713,MYT1,NFIB,NOBOX,NOTCH2,SMARCB1,ST18,TTF2,ZNF486,ZNF610,ZNF626
列表30:细胞表面受体关联的信号转导,n=34:AFAP1L2,AGTR1,DUSP22,EPS8,FOS,GNA14,GNG10,GPR39,KRT8,MET,OPRM1,OR2T3,PPAP2B,RAF1,TGFBR3,DTX4,EDN3,FKBP1A,GPR45,NOTCH2,NOTCH2NL,OR10J5,OR2A42,OR2A5,OR2T34,OR51A2,OR51A4,OR5A2,OR5B21,OR6J1,PTPRD,RSPO4,SIRPB1,ZFAND5
列表31:信号传感器活性,n=37:AGTR1,EPS8,GNA14,GNG10,GPR39,GRIN3A,IL18R1,MET,OPRM1,OR2T3,PAX8,PDE8B,PKHD1L1,RAF1,SNX25,TGFBR3,TRA@,ZP4,ANTXRL,EPOR,FKBP1A,GOLT1B,GPR45,HLA-DOA,HNF4A,IL1RL1,NOTCH2,OR10J5,OR2A42,OR2A5,OR2T34,OR51A2,OR51A4,OR5A2,OR5B21,OR6J1,PTPRD
列表32:N-甲基-D-天冬氨酸选择性谷氨酸受体复合物,n=2:EPS8,GRIN3A
列表33:分子传感器活性:AGTR1,EPS8,GNA14,GNG10,GPR39,GRIN3A,IL18R1,MET,OPRM1,OR2T3,PAX8,PDE8B,PKHD1L1,RAF1,SNX25,TGFBR3,TRA@,ZP4,ANTXRL,EPOR,FKBP1A,GOLT1B,GPR45,HLA-DOA,HNF4A,IL1RL1,NOTCH2,OR10J5,OR2A42,OR2A5,OR2T34,OR51A2,OR51A4,OR5A2,OR5B21,OR6J1,PTPRD
列表34:心脏小梁形成,n=2:TGFBR3,FKBP1A
在一些实施方式中,定位在特定染色体上的基因或标志物可以用于本发明。本发明可通过确定多态性组合的存在或不存在并生成生物标志物组来实施。可以组合各组的生物标志物从而增加准确性、灵敏度和/或特异性。在一些实施方式中,各组内的生物标志物是可互换的(模块化的)。所有组中的多个生物标志物可被替代、增加、减少或改善,以适应新的病理亚型的定义(例如从其他器官转移到甲状腺的新病例报告)。甲状腺标志物的染色体定位显示如下:
列表35:ADAMTS18、LOC129656、OR2A9P、OR2T34、ENST00000361820、LMO3、OR7E35P、ZFAND5、ACSM2、B4GALT1、ENST00000237937、ENST00000345125、NPNT、PAX8、PHF11、XM_001132965、ACSM2A、ENST00000307431、MYT1、C8orf79、ENST00000385399、GPR39、ENST00000358816、FDFT1、GSTCD
列表36:AK129935、C20orf69、CTBP2、ENST00000334383、KPRP、MGC16169、AK091978、ENST00000219054、LCE3B、LCE3C、RCBTB1、IYD、DUSP22、LCE6A、OR2A5、LCE3E、EPOR、OPRM1、OR2A20P、C9orf156、ENY2、PCMTD2、ARHGEF5、TMC1、CTSB
列表37:ENST00000384854、ENST00000337573、BC043197、EDN3、FOXO6、LOC728377、PIP3-E、PKHD1L1、PPP3R2、SNX25、ENST00000398221、C1orf68、EBAG9、IQSEC3、LRRK2、ZNF826、RMST、SCIN、GRIN3A、CR619628、FOXE1、C20orf174、ENST00000353047、LCE1E、MRPS11
列表38:MRPL46、OR2T3、AFAP1L2、LOC392352、ZNF486、MGST1、GCNT1、SIRPB1、ZNF626、CNTNAP4、ENST00000329697、ACSM2B、LOC645433、MON1B、OR2A42、GPR103、TGFBR3、PDE8B、PSD4、LMO3、LOC129656、GSTCD、CTBP2、CTSB、ENST00000337573
列表39:OR2A5、OR7E35P、C8orf79、EDN3、IQSEC3、ENST00000345125、GPR103、LOC129656、ENST00000385399、XM_001132965、LCE1E、DUSP22、ADAMTS18、OR2T34、PAX8、ENY2、OR2T3、PCMTD2、LCE3C、OPRM1、ENST00000358816、ZNF826、GCNT1、LCE6A、EBAG9
列表40:PDE8B、LOC728377、ACSM2、ENST00000334383、ENST00000219054、AK129935、AFAP1L2、CTSB、KPRP、PSD4、SIRPB1、LCE3B、AK091978、RCBTB1、ACSM2A、CNTNAP4、OR2A42、FOXO6、ZNF486、ZNF626、BC043197、FOXE1、GPR39、CR619628、LOC392352
列表41:C1orf68、ENST00000237937、ARHGEF5、NPNT、PHF11、C20orf174、EPOR、MYT1、GSTCD、LRRK2、PKHD1L1、ENST00000353047、MGST1、LOC645433、TMC1、C20orf69、MRPL46、SNX25、RMST、MON1B、ZFAND5、ACSM2B、SCIN、OR2A20P、LMO3
列表42:C9orf156、ENST00000384854、ENST00000361820、B4GALT1、IYD、FDFT1、CTBP2、PIP3-E、MRPS11、ENST00000337573、PPP3R2、ENST00000329697、MGC16169、TGFBR3、LCE3E、GRIN3A、ENST00000398221、OR2A9P、ENST00000307431、ADAMTS18、SIRPB1、CNTNAP4、ARHGEF5、AFAP1L2、ACSM2B
列表43:ACSM2A、RMST、ZNF486、SNX25、TGFBR3、OR2T3、PCMTD2、ENST00000398221、AK129935、ENST00000329697、OR2A9P、MRPL46、MGC16169、LCE3E、ENST00000219054、NPNT、PHF11、GPR103、C20orf69、PAX8、RCBTB1、C20orf174、EDN3、OR2T34、PSD4
列表44:TMC1、ENY2、FOXE1、EPOR、C9orf156、PPP3R2、PDE8B、ENST00000345125、ZNF826、ACSM2、ZNF626、ENST00000361820、C8orf79、LCE6A、LOC645433、LCE1E、OPRM1、LCE3B、OR2A42、BC043197、CR619628、MGST1、IQSEC3、ENST00000334383、GPR39
列表45:ABLIM1、ADAMTS18、AFAP1L2、AFF1、AGTR1、ARHGEF5、C8orf79、C9orf156、CD9、CDK5RAP2、CTSB、DEK、DMAP1、DSCAML1、DUSP22、DYSF、EBAG9、EPS8、FDFT1、FOS、FRMD3、GLCCI1、GNA14、GNG10、GPR39、GRIN3A、GSTCD、HMGA2、IL18R1、IYD、KCNIP4、KRT8、LINGO2、LMO3、LOC51233、MCTP2、MET、MGC16169、MGST1、MICAL2、MICALCL、MLLT3、MSH3、NEDD4L、NSUN2、OLFML1、OPRM1、OR2T3、OR7E37P、PARK2、PAX8、PDCD4、PDE8B、PDLIM4、PHF11、PIP3-E、PKHD1L1、PPAP2B、PPFIBP2、PPP2R5E、PSD4、RAF1、RAP1A、RBMS3、RCBTB1、SLC2A13、SNX25、SPATA13、ST3GAL5、TGFBR3、TRA@、ZNF253、ZP4。
商业方法
如本发明所描述,术语客户或潜在客户是指可能使用分子谱企业的方法或服务的个体或机构。本发明描述的分子谱方法和服务的潜在客户例如包括患者、受试者、医师、细胞学实验室、健康护理提供者、研究人员、保险公司、政府机构例如医疗补助机构(Medicaid)、雇主或对实现用于癌症诊断、监测和治疗的更经济或有效的系统感兴趣的任何其他机构。
例如,这些方面可以利用分子谱结果来选择性地为可能从昂贵药物或干预中获得最大益处的患者指定所述药物或治疗性干预,或鉴别不能通过不必要地使用药物或其他治疗性干预而受益或甚至受害的个体。
I.销售方法
本发明的分子谱企业的服务可以例如作为增强诊断和护理的方法销售给关心其健康的个体、医师或其他医学专业人员;例如作为为客户提供增强诊断的服务销售给细胞学实验室;例如作为通过消除不正当的治疗性干预而降低成本的方法销售给健康护理提供者、保险公司和政府机构。销售给潜在客户的方法还包括将数据库访问权销售给试图找到DNA多态性和疾病或病症之间的新相关性的研究人员和医师。
销售方法可以包括对潜在客户使用基于印刷品、广播、电视或因特网的广告。可通过特定媒介向潜在客户推销,例如,可通过在包括但不限于以下的商业杂志和医学期刊中投放广告来向内分泌专家推销:The Journal of the American Medical Association,Physicians Practice,American Medical News,Consultant,Medical Economics,Physician’s Money Digest,American Family Physician,Monthly PrescribingReference,Physicians’Travel and Meeting Guide,Patient Care,Cortlandt Forum,Internal Medicine News,Hospital Physician,Family Practice Management,InternalMedicine World Report,Women’s Health in Primary Care,Family Practice News,Physician’s Weekly,Health Monitor,The Endocrinologist,Journal ofEndocrinology,The Open Endocrinology Journal,and The Journal of MolecularEndocrinology。销售也可以采取与医学专业人员合作的形式,从而使用本发明方法和服务实验进行实验并在一些情况下公开结果或寻找进一步研究的基金。在一些情况下,销售方法可包括使用医师或医学专业人员数据库,例如,美国医学会(AMA)数据库,来确定联系信息。
在一个实施方式中,销售方法包括与细胞学测试实验室合作,来向不能使用常规方法明确诊断其样品的客户提供分子谱服务。
II.使用计算机的商业方法
分子谱企业可以在本发明方法中利用一台或多台计算机,例如图5中说明的计算机800。计算机800可用于管理客户和样品信息(例如样品或客户追踪)、数据库管理、用于分析分子谱数据、用于分析细胞学数据、储存数据、发帐单、销售、报告结果或储存结果。该计算机可以包括监视器807或用于显示数据、结果、帐单信息、销售信息(例如人口统计数据)、客户信息或样品信息的其他图形界面。该计算机也可以包括用于数据或信息输入的装置816、815。该计算机可以包括处理单元801和固定介质803或可移动介质811或其组合。该计算机可由用户以物理邻近的方式例如经由键盘和/或鼠标访问该计算机,或由不一定接触该物理计算机的用户822通过通信媒介805例如调制解调器、因特网连接、电话连接或者有线或无线通信信号载波访问该计算机。在一些情况下,该计算机可以连接到服务器809或其他通信装置,从而将信息从用户传递到计算机或从计算机传递到用户。在一些情况下,用户可以通过通信媒介805储存从计算机获得的数据或信息在介质例如可移动介质812上。
分子谱企业可出于以下一种或多种目的将样品信息输入数据库中:库存追踪、分析结果追踪、订单跟踪、客户管理、客户服务、帐单和销售。样品信息可以包括但不限于:客户名、唯一的用户标识、用户相关的医学专业人员、指示的一种或多种分析、分析结果、充足性状态、指示的充足性测试、个体病史、初步诊断、疑似诊断、样品史、保险提供者、医疗提供者、第三方测试中心或适于在数据库中储存的任何信息。样品史可以包括但不限于:样品存在时间、样品类型、获得方法、储存方法或运输方法。
可被客户、医学专业人员、保险提供者、第三方或分子谱企业授权访问的任何个体或机构可使用数据库。数据库访问可以采取电子通讯例如计算机或电话的形式。可通过中介例如客户服务代表、商业代表、顾问、独立测试中心或医学专业人员访问数据库。数据库访问或样品信息例如分析结果的可利用性或级别可根据提供或待提供的产品和服务的费用支付而改变。数据库访问或样品信息的级别可以限制为遵从患者或用户保密性的普遍接受的或合法的要求。分子谱公司可以为一种或多种以下服务向个体、保险提供者、医学提供者或政府机构收费:样品接收、样品储存、样品制备、细胞学测试、分子谱、将样品信息输入数据库和更新或数据库访问。
III.商业流程
图2是说明可以通过分子谱处理样品的一种方式的流程图。图2A描写可通过本发明分子谱企业处理样品的一种方式的实施方式。例如,甲状腺细胞样品可通过内分泌专家也许经由细针抽吸100获得。样品进行常规细胞学染色过程125。所述常规细胞学染色提供四种不同的可能初步诊断-非诊断性的105、良性的110、模糊或疑似的115或恶性的120。然后分子谱企业可以分析本发明描述的基因组DNA、基因产物表达水平、选择性的基因产物外显子使用或其组合130。所述基因组DNA、基因产物表达水平、选择性基因产物外显子使用或其组合(分子谱)的分析可以导致恶性140或良性135的确定诊断。在一些情况下仅样品子集经由分子谱进行分析,例如在常规细胞学检查期间提供模糊和非诊断性结果的那些。
在一些情况下分子谱结果证实常规细胞学测试结果。在其他情况下,分子谱结果不同。在这种情况下,可以进一步测试样品、再检查数据或可将分子谱结果或细胞学分析结果作为正确诊断。良性诊断也可以包括可能指示进一步监测或治疗的疾病或病症(尽管不是恶性癌症)。类似地,恶性诊断也可以包括癌症的特定类型或涉及疾病或病症的特定代谢或信号传导途径的诊断。所述诊断可以指示治疗或治疗性干预(例如放射性碘消融、外科手术、甲状腺切除术)或进一步监测。
试剂盒
分子谱企业可以提供用于获得适当的样品的试剂盒。图3描绘的所述试剂盒203可以包含容器202、用于获得样品200的装置、用于储存样品205的试剂、以及使用所述试剂盒的说明书。在另一个实施方式中,所述试剂盒还包含用于进行分子谱分析的试剂和材料。在一些情况下,所述试剂和材料包括用于分析由分子谱方法所产生的数据的计算机程序。在再其他情况中,所述试剂盒包含储存生物样品并将其运送到测试机构例如分子谱企业或第三方测试中心的装置。
分子谱企业也可以提供用于进行分子谱的试剂盒。所述试剂盒可以包含用于提取蛋白质或核酸的装置包括所有必要的缓冲剂和试剂;以及用于分析蛋白质或核酸的水平的装置包括对照和试剂。所述试剂盒还可以包含软件或获得并使用软件以分析使用本发明方法和组合物提供的数据的许可。
具体实施方式
实施例
实施例1:甲状腺样品的杂交分析
为了鉴别区分恶性甲状腺结节和良性甲状腺结节的基因组区域,我们检验了HumanSNP 6.0(SNP6.0)阵列的86个杂交并采用传统的单个核苷酸多态性(SNP)和拷贝数分析,具有新型的下游分析方法。SNP 6.0阵列的初步结果用作算法的输入,其允许对我们同龄群组中DNA拷贝数异常的完全表征。这里我们描述我们发现能区分恶性甲状腺结节和良性甲状腺结节的各基因组区域的i)准确的染色体位置,ii)基因组区域大小和iii)异常性质(拷贝数增加和/或拷贝数损失损失)。
基于亚型甲状腺结节病理在样品组间进行几项比较。四项比较中的第一项集中在滤泡癌对滤泡性腺瘤(FC对FA)并获得47个显著的基因组区域。在乳头状甲状腺癌的滤泡变型和结节性增生(FVPTC对NHP)之间的类似比较获得30个显著的基因组区域,而乳头状甲状腺癌对结节性增生(PTC对NHP)获得12个显著的基因组区域。第四项比较将所有恶性样品分组并与所有良性样品组比较。该分析获得250个显著的基因组区域。总之,我们总共鉴别了339个在良性和恶性的甲状腺样品之间显示明确的基因组拷贝数差异的基因组区域。这些基因组区域映射到至少740个独特基因和/或蛋白质上。
方法
微阵列和数据集
用Affymetrix HumanSNP 6.0DNA阵列检验总共86个甲状腺样品以鉴别在良性和恶性样品之间拷贝数明显不同的基因。按照甲状腺病理分类样品:研究了滤泡性腺瘤(FA,n=20)、Hurthle细胞腺瘤(HA,n=10)、淋巴细胞性甲状腺炎(LCT,n=5)和结节性增生(NHP,n=20)。当分组时,这些样品归类为良性(n=55)。类似地,也检验了滤泡癌(FC,n=4)、乳头状甲状腺癌的滤泡变型(FVPTC,n=12)和乳头状甲状腺癌(PTC,n=15)并在分组时将其归类为恶性的(n=31)。
Affymetrix软件用于提取、正常化和总结来自包括沿着人类基因组均匀间隔的744,000个探针的180万个标志物的SNP6.0阵列强度数据。在全部86个阵列上的各探针的中值强度和公众可得的参考HAPMAP3 CEL文件(www.HAPMAP.org)的数据集一起用作参考集,其中这一参考集代表给定探针的正常拷贝数。然后样品中的给定探针相对于参考集的相对强度用于确定是否存在拷贝数异常。相对强度的增加指示拷贝数增加(扩增),相对强度的降低指示拷贝数损损失(缺失)。
然后使用循环二值分割(CBS)(Olshen,Venkatraman等2004)将各样品的所得SNP6.0相对强度转化为片段(相等拷贝数数据的区域)。然后这些片段使用PLINK-免费的全基因组相关性分析工具集(Purcell,Neale等2007)生成各样品间的非重叠特征。使用卡方检验和PLINK鉴别与疾病标记有关的主要特征。使用主要PLINK特征和支持向量机(SVM)分析进行分类。各样品的CEL输入文件名称列于表2中。
表2、所分析的样品和病理分类。输入CEL文件与各样品的具体甲状腺亚型和简化的病理分类一起列出。甲状腺亚型是滤泡性腺瘤(FA)、Hurthle细胞腺瘤(HA)、淋巴细胞性甲状腺炎(LCT)、结节性增生(NHP)、滤泡癌(FC)、乳头状甲状腺癌的滤泡变型(FVPTC)和乳头状癌(PTC)。
结果
甲状腺中的新型DNA拷贝数分析
为鉴别区分恶性甲状腺结节和良性甲状腺结节的基因组区域,我们检验了与SNP6.0阵列的86个杂交并且使用这些初步结果作为输入新型分析算法中的输入数据集。基于人类基因组构建(Human Genome Build)18使用Affymetrix注释文件GenomeWideSNP_6.na26将基因映射于微阵列序列。四项比较中的第一项集中在滤泡癌(FC,n=4)对滤泡性腺瘤(FA,n=20)。这些分析导致识别47个统计学显著的基因组区域(p<0.05),其映射于186个已知基因和/或蛋白质(表3)。
在乳头状癌的滤泡变型(FVPTC,n=12)和归类为结节性增生(NHP,n=20)的样品之间进行类似比较。该分析导致识别30个显著的基因组区域,其映射于49个已知基因和/或蛋白质(表4)。针对与NHP(n=20)比较的乳头状甲状腺癌(PTC,n=15)的第三种分析导致识别12个显著的基因组区域,其映射于15个已知基因和/或蛋白质(表5)。
第四项分析将来自该同龄组(n=31)中所有可得的恶性样品的数据分组并将它们与所有可得的良性样品组(n=55)比较。该分析导致识别250个显著的基因组区域,其映射于561个已知基因和或蛋白质(表6)。
总之,我们鉴别了在良性和恶性样品的不同亚组之间显示明显不同的基因组拷贝数差异的总共339个基因组区域。这些基因组区域映射于740个已知人基因和/或蛋白质。
表3、区分滤泡癌(FC)和滤泡性腺瘤(FA)的47个主要基因组区域。使用p<0.05的显著性过滤器,然后以递减顺序分级。FC(n=4)中的PLINK特征与FA(n=20)相比。区别FC和FA的47个基因组映射于56个已知基因和/或蛋白质。
基因组区域:给定PLINK特征的染色体号和基因组位置的起点;P:给定PLINK特征的组比较p值;具有特征的总FC:携带给定PLINK特征的FC样品数;具有特征的总FA:携带给定PLINK特征的FA样品数;基因组大小:给定PLINK特征的大小;基因:映射于给定基因组区域的已知基因的名称。单一的基因组区域通常编码多个基因和/或蛋白质。类似地,若干基因组区域(或显著PLINK特征)通常彼此映射然后映射于相同的一个或多个基因。
在乳头状癌的滤泡变型(FVPTC,n=12)和归类为结节性增生(NHP,n=20)的样品之间进行类似比较。该分析导致识别30个显著的基因组区域,其映射于49个已知基因和/或蛋白质(表3)。针对与NHP(n=20)比较的乳头状甲状腺癌(PTC,n=15)的第三项分析导致识别12个显著的基因组区域,其映射于15个已知基因和/或蛋白质(表4)。
表4、区分乳头状癌的滤泡变型(FVPTC)和结节性增生(NHP)的30个主要基因组区域。使用p<0.05的显著性过滤器,然后以递减顺序分级。FVPTC(n=12)中的PLINK特征与NHP(n=20)相比较。区分FVPTC和NHP的30个基因组区域映射于29个已知基因和/或蛋白质。
基因组区域:给定PLINK特征的染色体号和基因组位置的起点;P:给定PLINK特征的组比较的p值;具有特征的总FC:携带给定PLINK特征的FC样品数;具有特征的总FA:携带给定PLINK特征的FA样品数;基因组大小:给定PLINK特征的大小;基因:映射于给定基因组区域的已知基因的名称。单个基因组区域通常编码多个基因和/或蛋白质。类似地,几个基因组区域(或显著PLINK特征)通常彼此映射且然后映射于相同的一个或多个基因。
表5、区分乳头状甲状腺癌(PTC)和结节性增生(NHP)的12个主要标志物。基于p值(<0.05)分级标志物。PTC(n=15)中的DNA拷贝数与NHP(n=20)相比。区分PTC和NHP的12个标志物映射于15个已知基因和/或蛋白质。
基因组区域:给定PLINK特征的染色体号和基因组位置的起点;P:给定PLINK特征的组比较的p值;具有特征的总FC:携带给定PLINK特征的FC样品数;具有特征的总FA:携带给定PLINK特征的FA样品数;基因组大小:给定PLINK特征的大小;基因:映射位于给定基因组区域的已知基因的名称。单基因组区域通常编码多个基因和/或蛋白质。类似地,几个基因组区域(或显著PLINK特征)通常彼此映射并然后映射于相同的一个或多个基因。
第四项分析将来自该同龄组(n=31)中所有可得的恶性样品的数据分组并将它们与所有可得的良性样品组(n=55)比较。该分析导致识别250个显著的基因组区域,其映射于561个已知基因和/或蛋白质(表5)。
表6、区分恶性(M)和良性(B)的100个主要标志物。基于p值(<0.05)分级标志物。M(n=31)中的DNA拷贝数与B(n=55)相比。总共250个标志物区分恶性和良性,这些标志物映射于473个已知基因和/或蛋白质。
基因组区域:给定PLINK特征的染色体号和基因组位置起点;P:给定PLINK特征的组比较的p值;具有特征的总FC:携带给定PLINK特征的FC样品数;具有特征的总FA:携带给定PLINK特征的FA样品数;基因组大小:给定PLINK特征的大小;基因:映射于给定基因组区域的已知基因的名称。单基因组区域通常编码多个基因和/或蛋白质。类似地,几个基因组区域(或显著PLINK特征)通常彼此映射且然后映射于相同的一个或多个基因。
总之,我们总共识别了在良性和恶性样品的不同子组之间显示明显不同的基因组拷贝数差异的339个基因组区域。这些基因组区域映射于740个已知的人类基因和/或蛋白质,虽然若干显著基因组区域的性质仍然未知。
实施例2:所有四种分析的显著基因组区域基因列表的交叉校验
在由各比较产生的所得基因列表(表7)之间的冗余性水平用文氏图检验。119个基因中的2个基因与FC对FA(表3)、FVPTC对NHP(表4)和PTC对NHP(表5)基因列表重叠(图6A)。我们组合117个独特基因的这一列表并将它与来自恶性对良性分析的映射基因的列表相比较(表6)。我们的结果显示24个基因与所有四个基因列表重叠(图6B)。此外,另一套文氏比较显示FC对FA列表导致与M对B基因列表(图6C)重叠的大部分基因(14/24)。相反,当组合时,FVPTC对NHP和PTC对NHP列表仅导致与M对B列表(图6D)共有基因的10/24。
进一步,我们检验了不同同龄组的甲状腺样品的mRNA基因表达和选择性外显子使用。该分析导致发现可以区分恶性甲状腺结节和良性甲状腺结节的4918个基因。参见美国专利申请No.12/592,065,其以引用方式全部合并于此。在本发明所述研究中,我们将发现工作集中在DNA拷贝数分析上,并因此迄今已经发现映射于可以区分甲状腺病理的至少292个基因的339个基因组区域。我们比较了“mRNA基因”的老列表和“DNA拷贝数基因”的新列表,且发现73个基因在两个列表重叠,从而加强了这些基因作为甲状腺病理的标志物的重要性(图7)。
表7、显著基因组区域(PLINK特征)和由各比较产生的基因的总数
实施例3:分子谱的示例装置
在一些优选的实施方式中,本发明的分子谱企业汇编表1、3、4、5、6或8或者列表1-45或其组合的与多态性例如良性和恶性、良性和正常或恶性和正常样品之间的拷贝数变异有关的DNA序列的列表。由分子谱企业选择基因或DNA序列的子集用于诊断生物样品。与分子谱企业选择的基因组区域的子集一致的短(即12-25个核苷酸长)寡核苷酸组合物由本领域已知的标准方法合成并固定在固体载体的已知位置上,所述固定载体例如硝化纤维、玻璃、聚合物或芯片。
实施例4:生物样品的分子谱
核糖核酸从生物样品中提取,用可检测的荧光标记进行标记并在严格条件下与固体载体结合的寡核苷酸杂交。洗去未杂交核糖核酸,通过用光度计测量各已知寡核苷酸位置的粗荧光强度来测定结合核糖核酸的量。粗荧光强度值被标准化和过滤并转化为基因表达产物水平。将基因表达产物水平输入校正生物样品的细胞类型组合物的基因表达产物水平的预分类器算法中。将校正的基因表达产物水平输入将生物样品分类为良性、恶性或正常的训练算法中。训练算法提供其输出的记录,包括诊断和置信水平。
实施例5:甲状腺结节的分子谱
个体注意到其甲状腺上的肿块。该个体咨询他的家庭医师。该家庭医师决定从肿块获得样品并使其进行分子谱分析。所述医师使用来自分子谱企业的试剂盒以通过使用细针抽吸获得样品,进行充足性测试,将样品储存在液体基细胞学溶液中并将其送到分子谱企业。分子谱企业将样品分割以将一部分样品用于细胞学分析,其余样品用于从样品中提取核酸,分析所提取的mRNA和DNA样品的质量和适用性,并分析表1、3、4、5、6或8所列基因子集的表达水平、选择性外显子使用和基因组DNA标志物拷贝数变异。在这种情况下,特定标志物(DNA或RNA)谱由样品类型、医师的初步诊断和分子谱公司确定。
分子谱企业分析数据并为个体的医师提供所得诊断,如图4所示。该结果提供1)建谱的DNA标志物的列表,2)该谱的结果(例如相对于标准(例如来自由口腔拭子获得的组织分离的核酸的DNA标志物拷贝数)标准化的DNA标志物拷贝数),3)匹配类型的正常组织预期的DNA标志物拷贝数,和)基于分子谱结果的诊断和推荐治疗。分子谱企业向个体的保险提供者为所提供的产品和服务收费。
实施例6:分子谱是单独的细胞学检查的改进
个体注意到其甲状腺上的可疑肿块。该个体咨询她的初级护理医师,该医师检查了个体并建议她去看内分泌专家。所述内分泌专家通过细针抽吸获得样品并将样品送到细胞学测试实验室。细胞学测试实验室对一部分细针抽吸物进行常规细胞学测试,其结果是模糊的(即不确定的)。该细胞学测试实验室向内分泌专家建议其余样品可能适于分子谱分析,且内分泌专家赞成。
其余样品用本发明方法和组合物进行分析。分子谱分析的结果提示早期滤泡状细胞癌的高度可能性。该结果进一步建议与患者数据(包括患者年龄)、肿块或结节大小结合的分子谱分析指示甲状腺切除术继之以放射性碘消融。该内分泌专家审阅该结果并指定推荐的疗法。
该细胞学测试实验室向内分泌专家为常规细胞学测试和分子谱收费。该内分泌专家付费给细胞学测试实验室,并向个体的保险提供者为所提供的所有产品和服务收费。该细胞学测试实验室将分子谱的报酬转给分子谱企业并保留小的差额。
实施例7:由第三方进行的分子谱
个体向她的医师主诉颈上的可疑肿块。医师检查个体并指定分子表测试以及得到结果后的后续检查。该个体参观了临床测试实验室,又名CLIA实验室。CLIA实验室被许可进行本发明的分子谱。该个体在CLIA实验室经由细针抽吸提供样品,并使用本发明的分子谱方法和组合物分析样品。分子谱的结果通过电子手段传递给个体的医师,并且该个体联系以预约后续检查。医师将分子谱的结果呈递给个体并指定疗法。
尽管本文已经显示并描述了本发明的优选实施方式,但这种实施方式仅以举例方式提供,这对本领域技术人员而言是显而易见的。在不脱离本发明的情况下,本领域技术人员将想到许多变型、改变和替代。应理解,文本描述的本发明实施方式的各种替代方式可用于实施本发明。意图的是以下权利要求限定本发明的范围,且因此覆盖这些权利要求范围内的方法和结构及其等价物。
以引用方式引入
本说明书提到的所有公开出版物和专利申请以引用方式合并于此,如同各单个公开出版物或专利申请具体和单独地表明以引用方式合并一样。

Claims (15)

1.试剂用于制备组合物的用途,所述组合物用于确定受试者中恶性甲状腺病症的可能性,其中所述试剂适于检测所述受试者的DNA样品中IYD或其互补序列与正常样品相比的一种或多种拷贝数变异,并且包含对应于IYD或其互补序列的一种或多种生物标志物,并且其中所述甲状腺病症是异常细胞增殖,其中所述可能性如下确定:
(a)提供所述受试者的DNA样品;
(b)使用所述组合物分析所述DNA样品中IYD或其互补序列的一种或多种拷贝数变异的存在;和
(c)基于步骤(b)的结果确定所述受试者是否患有或可能患有恶性甲状腺病症。
2.权利要求1的用途,其中所述甲状腺病症是恶性的,且其中所述恶性病症选自滤泡癌、乳头状癌的滤泡变型和乳头状甲状腺癌。
3.权利要求1的用途,其中所述DNA样品由包含甲状腺组织的样品获得。
4.权利要求1的用途,其中所述与正常样品相比拷贝数的变异包括缺失。
5.权利要求1的用途,其中与正常样品相比拷贝数的变异包括拷贝数增加。
6.权利要求1的用途,其中所述正常样品包括来自同一受试者的DNA样品。
7.权利要求1的用途,其中所述正常样品包括来自不同受试者的DNA样品。
8.权利要求1的用途,其中所述正常样品包括已知或普遍接受的值。
9.权利要求1的用途,其中所述分析步骤(b)包括:
(a)使所述DNA样品与特异性结合IYD或其互补序列的一种或多种结合剂接触;和
(b)测定所述DNA样品是否与所述一种或多种结合剂特异性结合,
其中所述DNA样品与所述一种或多种结合剂结合指示所述受试者中该拷贝数变异的存在。
10.权利要求1的用途,其中所述分析步骤(b)包括对包含列于表3-6的一种或多种标志物区域或其互补序列的一种或多种核酸区域测序。
11.权利要求1的用途,其中所述分析步骤(b)包括对包含列于表3-6的一种或多种标志物区域或其互补序列的DNA定量。
12.权利要求11的用途,其中所述定量包括PCR。
13.权利要求12的用途,其中所述PCR包括实时PCR。
14.权利要求11的用途,其中所述定量包括杂交。
15.权利要求1的用途,其中确定所述可能性还包括测定与滤泡性腺瘤、滤泡癌、结节性增生、乳头状癌的滤泡变型或乳头状甲状腺癌有关的一个或多个基因的表达水平。
CN201080026326.1A 2009-05-07 2010-05-07 用于诊断甲状腺病症的方法和组合物 Active CN102459636B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US17647109P 2009-05-07 2009-05-07
US61/176,471 2009-05-07
PCT/US2010/034140 WO2010129934A2 (en) 2009-05-07 2010-05-07 Methods and compositions for diagnosis of thyroid conditions

Publications (2)

Publication Number Publication Date
CN102459636A CN102459636A (zh) 2012-05-16
CN102459636B true CN102459636B (zh) 2016-08-17

Family

ID=43050916

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201080026326.1A Active CN102459636B (zh) 2009-05-07 2010-05-07 用于诊断甲状腺病症的方法和组合物

Country Status (5)

Country Link
US (3) US8669057B2 (zh)
EP (2) EP2427575B1 (zh)
JP (4) JP6078339B2 (zh)
CN (1) CN102459636B (zh)
WO (1) WO2010129934A2 (zh)

Families Citing this family (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8338109B2 (en) 2006-11-02 2012-12-25 Mayo Foundation For Medical Education And Research Predicting cancer outcome
WO2009143603A1 (en) 2008-05-28 2009-12-03 Genomedx Biosciences, Inc. Systems and methods for expression-based discrimination of distinct clinical disease states in prostate cancer
US10407731B2 (en) 2008-05-30 2019-09-10 Mayo Foundation For Medical Education And Research Biomarker panels for predicting prostate cancer outcomes
US10236078B2 (en) 2008-11-17 2019-03-19 Veracyte, Inc. Methods for processing or analyzing a sample of thyroid tissue
US9495515B1 (en) 2009-12-09 2016-11-15 Veracyte, Inc. Algorithms for disease diagnostics
AU2009314502B2 (en) * 2008-11-17 2015-01-22 Veracyte, Inc. Methods and compositions of molecular profiling for disease diagnostics
US9074258B2 (en) 2009-03-04 2015-07-07 Genomedx Biosciences Inc. Compositions and methods for classifying thyroid nodule disease
WO2010129934A2 (en) 2009-05-07 2010-11-11 Veracyte, Inc. Methods and compositions for diagnosis of thyroid conditions
US10446272B2 (en) 2009-12-09 2019-10-15 Veracyte, Inc. Methods and compositions for classification of samples
US8945829B2 (en) 2011-03-22 2015-02-03 Cornell University Distinguishing benign and malignant indeterminate thyroid lesions
WO2013082123A2 (en) * 2011-11-28 2013-06-06 University Of Chicago Method, system, software and medium for advanced image-based arrays for analysis and display of biomedical information
US20140371096A1 (en) * 2011-12-09 2014-12-18 The Johns Hopkins University Compositions and methods for characterizing thyroid neoplasia
AU2012352153B2 (en) 2011-12-13 2018-07-26 Veracyte, Inc. Cancer diagnostics using non-coding transcripts
ES2945036T3 (es) 2012-08-16 2023-06-28 Veracyte Sd Inc Pronóstico del cáncer de próstata mediante biomarcadores
US20150299807A1 (en) * 2012-11-21 2015-10-22 The Johns Hopkins University Genomic classifiers for non-invasive identification of high grade prostate cancer with metastatic potential
AU2013352339B2 (en) 2012-11-27 2019-07-04 Pontificia Universidad Catolica De Chile Compositions and methods for diagnosing thyroid tumors
JP6644328B2 (ja) * 2013-02-28 2020-02-12 ロート製薬株式会社 アトピー性疾患の発症又は重症化リスクの評価法
US11976329B2 (en) 2013-03-15 2024-05-07 Veracyte, Inc. Methods and systems for detecting usual interstitial pneumonia
GB2525804B (en) * 2013-03-15 2020-08-05 Veracyte Inc Methods and compositions for classification of samples
CN105431552B (zh) * 2013-04-12 2020-03-03 香港中文大学 多组学标记在预测糖尿病中的用途
WO2016057629A1 (en) * 2014-10-07 2016-04-14 Duke University Methods and therapeutics relating to human r-spondin protein and leucine-rich repeat-containing g protein-coupled receptor protein
EP3770274A1 (en) 2014-11-05 2021-01-27 Veracyte, Inc. Systems and methods of diagnosing idiopathic pulmonary fibrosis on transbronchial biopsies using machine learning and high dimensional transcriptional data
CN104845970B (zh) * 2015-05-13 2017-10-10 亳州市新健康科技有限公司 与乳头状甲状腺瘤相关的基因
US10905359B2 (en) 2015-06-12 2021-02-02 Koninklijke Philips N.V. Apparatus, system, method, and computer program for distinguishing between active and inactive time periods of a subject
WO2017062867A1 (en) * 2015-10-09 2017-04-13 Helmy Eltoukhy Population based treatment recommender using cell free dna
CN105385781B (zh) * 2015-12-29 2019-08-13 北京泱深生物信息技术有限公司 Lce3e在诊治口腔癌中的应用
JP6428655B2 (ja) 2016-01-14 2018-11-28 株式会社デンソー 電子キーシステム、車載機、および電子キー
US11414708B2 (en) 2016-08-24 2022-08-16 Decipher Biosciences, Inc. Use of genomic signatures to predict responsiveness of patients with prostate cancer to post-operative radiation therapy
CA3050984A1 (en) 2017-01-20 2018-07-26 Decipher Biosciences, Inc. Molecular subtyping, prognosis, and treatment of bladder cancer
CA3055925A1 (en) 2017-03-09 2018-09-13 Decipher Biosciences, Inc. Subtyping prostate cancer to predict response to hormone therapy
US11078542B2 (en) 2017-05-12 2021-08-03 Decipher Biosciences, Inc. Genetic signatures to predict prostate cancer metastasis and identify tumor aggressiveness
US11217329B1 (en) 2017-06-23 2022-01-04 Veracyte, Inc. Methods and systems for determining biological sample integrity
JP6965621B2 (ja) * 2017-08-02 2021-11-10 富士通株式会社 検出プログラム、検出方法及び検出装置
JP7098373B2 (ja) * 2018-03-26 2022-07-11 株式会社三共 スロットマシン
JP2021524758A (ja) * 2018-05-18 2021-09-16 リセン インプリンティング ダイアグノステックス,インク.Lisen Imprinting Diagnostics,Inc. 生検細胞サンプルによるがんを診断する方法
JP7152734B2 (ja) * 2018-06-28 2022-10-13 ネット株式会社 遊技機
CN109762902B (zh) * 2018-07-27 2022-07-05 四川大学华西医院 一种人类map2k5第1100位碱基突变基因的arms-pcr检测试剂盒
CN109652552B (zh) * 2018-07-27 2022-07-05 四川大学华西医院 一种人类map2k5第961位碱基突变基因的arms-pcr检测试剂盒
WO2020160108A1 (en) * 2019-01-30 2020-08-06 Arizona Board Of Regents On Behalf Of The University Of Arizona Lipid biomarkers for cancer screening and monitoring
JP2020185382A (ja) * 2019-05-10 2020-11-19 キヤノンメディカルシステムズ株式会社 診断支援装置
CN111292801A (zh) * 2020-01-21 2020-06-16 西湖大学 蛋白质质谱结合深度学习评估甲状腺结节的方法
KR20230162795A (ko) * 2021-03-30 2023-11-28 각꼬호우징 닛뽄 이까다이가꾸 갑상선 여포암 특이적 마커
CN115558714A (zh) * 2021-07-01 2023-01-03 上海鹍远生物科技股份有限公司 甲状腺结节良恶性相关标志物及其应用
CN115927610A (zh) * 2022-07-19 2023-04-07 武汉艾米森生命科技有限公司 检测foxo6基因中目标区域的甲基化水平的试剂在制备膀胱癌诊断产品中的应用

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1975245A1 (de) * 2007-03-28 2008-10-01 Greenpeace e.V. Gen-Profiling zur Auswahl von politischen Kandidaten, kommerzielle Nutzung von Politikern
WO2009042728A1 (en) * 2007-09-24 2009-04-02 Allelogic Biosciences Corporation Detection and /or quantification of nucleic acids

Family Cites Families (195)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AT277936B (de) 1968-02-27 1970-01-12 Guenter Dipl Ing Knapp Verfahren zur quantitativen Bestimmung von Jod und von Schilddrüsenhormonen sowie Vorrichtung zur Durchführung des Verfahrens
US3687808A (en) 1969-08-14 1972-08-29 Univ Leland Stanford Junior Synthetic polynucleotides
US5130238A (en) 1988-06-24 1992-07-14 Cangene Corporation Enhanced nucleic acid amplification process
US5143854A (en) 1989-06-07 1992-09-01 Affymax Technologies N.V. Large scale photolithographic solid phase synthesis of polypeptides and receptor binding screening thereof
CA2020958C (en) 1989-07-11 2005-01-11 Daniel L. Kacian Nucleic acid sequence amplification methods
US5494810A (en) 1990-05-03 1996-02-27 Cornell Research Foundation, Inc. Thermostable ligase-mediated DNA amplifications system for the detection of genetic disease
US5798257A (en) 1990-07-09 1998-08-25 Research Corporation Technologies, Inc. Nucleic acid encoding human MTS-1 protein
DE69133293T2 (de) 1990-12-06 2004-05-27 Affymetrix, Inc., Santa Clara Verfahren und Reagenzien für immobilisierten Polymersynthese in sehr grossem Masstab
US5455166A (en) 1991-01-31 1995-10-03 Becton, Dickinson And Company Strand displacement amplification
US5994069A (en) 1996-01-24 1999-11-30 Third Wave Technologies, Inc. Detection of nucleic acids by multiple sequential invasive cleavages
US5846717A (en) 1996-01-24 1998-12-08 Third Wave Technologies, Inc. Detection of nucleic acid sequences by invader-directed cleavage
US5384261A (en) 1991-11-22 1995-01-24 Affymax Technologies N.V. Very large scale immobilized polymer synthesis using mechanically directed flow paths
EP0624059A4 (en) 1991-11-22 1994-12-21 Affymax Technologies N.V. Combinatorial strategies for polymer synthesis.
US6027887A (en) 1992-03-11 2000-02-22 Institute Of Virology, Solvak Academy Of Sciences MN gene and protein
US6204370B1 (en) 1992-03-11 2001-03-20 Institute Of Virology, Slovak Academy Of Sciences MN gene and protein
US5541061A (en) 1992-04-29 1996-07-30 Affymax Technologies N.V. Methods for screening factorial chemical libraries
US5288514A (en) 1992-09-14 1994-02-22 The Regents Of The University Of California Solid phase and combinatorial synthesis of benzodiazepine compounds on a solid support
US5538848A (en) 1994-11-16 1996-07-23 Applied Biosystems Division, Perkin-Elmer Corp. Method for detecting nucleic acid amplification using self-quenching fluorescence probe
US5529925A (en) 1993-12-03 1996-06-25 St. Jude Children's Research Hospital Nucleic acid sequences and fusion proteins present in human t(2;5) lymphoma
US5989815A (en) 1994-03-18 1999-11-23 University Of Utah Research Foundation Methods for detecting predisposition to cancer at the MTS gene
US5648211A (en) 1994-04-18 1997-07-15 Becton, Dickinson And Company Strand displacement amplification using thermophilic enzymes
US7625697B2 (en) 1994-06-17 2009-12-01 The Board Of Trustees Of The Leland Stanford Junior University Methods for constructing subarrays and subarrays made thereby
US5830753A (en) 1994-09-30 1998-11-03 Ludwig Institute For Cancer Research Isolated nucleic acid molecules coding for tumor rejection antigen precursor dage and uses thereof.
US5705365A (en) 1995-06-07 1998-01-06 Gen-Probe Incorporated Kits for determining pre-amplification levels of a nucleic acid target sequence from post-amplification levels of product
US5710029A (en) 1995-06-07 1998-01-20 Gen-Probe Incorporated Methods for determining pre-amplification levels of a nucleic acid target sequence from post-amplification levels of product
US5854033A (en) 1995-11-21 1998-12-29 Yale University Rolling circle replication reporter systems
US5985557A (en) 1996-01-24 1999-11-16 Third Wave Technologies, Inc. Invasive cleavage of nucleic acids
ATE298887T1 (de) 1996-04-16 2005-07-15 Kishimoto Tadamitsu Verfahren zum nachweis solider krebszellen und histologischer heterotypien und verfahren zur prüfung von gewebe für die knochenmarktransplantation und die transplantation von peripheren blutstammzellen
US6136182A (en) 1996-06-07 2000-10-24 Immunivest Corporation Magnetic devices and sample chambers for examination and manipulation of cells
GB9711040D0 (en) 1997-05-29 1997-07-23 Duff Gordon W Prediction of inflammatory disease
US20020076735A1 (en) 1998-09-25 2002-06-20 Williams Lewis T. Diagnostic and therapeutic methods using molecules differentially expressed in cancer cells
EP1092772B1 (en) 1998-06-08 2007-08-08 Fuso Pharmaceutical Industries Ltd. Antibody against lar phosphatase subunit
US6468476B1 (en) 1998-10-27 2002-10-22 Rosetta Inpharmatics, Inc. Methods for using-co-regulated genesets to enhance detection and classification of gene expression patterns
EP2045337B1 (en) 1998-11-09 2011-08-24 Eiken Kagaku Kabushiki Kaisha Process for synthesizing nucleic acid
US6436642B1 (en) 1999-04-20 2002-08-20 Curagen Corporation Method of classifying a thyroid carcinoma using differential gene expression
US6251639B1 (en) 1999-09-13 2001-06-26 Nugen Technologies, Inc. Methods and compositions for linear isothermal amplification of polynucleotide sequences, using a RNA-DNA composite primer
US7211390B2 (en) 1999-09-16 2007-05-01 454 Life Sciences Corporation Method of sequencing a nucleic acid
US7244559B2 (en) 1999-09-16 2007-07-17 454 Life Sciences Corporation Method of sequencing a nucleic acid
US6723506B2 (en) 2000-01-20 2004-04-20 Brigham And Women's Hospital Method of identifying PAX8-PPAR gamma-nucleic acid molecules
US7361488B2 (en) 2000-02-07 2008-04-22 Illumina, Inc. Nucleic acid detection methods using universal priming
US6988040B2 (en) 2001-01-11 2006-01-17 Affymetrix, Inc. System, method, and computer software for genotyping analysis and identification of allelic imbalance
US20020169137A1 (en) 2001-02-09 2002-11-14 Active Pass Pharmaceuticals, Inc. Regulation of amyloid precursor protein expression by modification of ABC transporter expression or activity
US7026163B1 (en) 2001-02-23 2006-04-11 Mayo Foundation For Medical Education And Research Sulfotransferase sequence variants
US20030190602A1 (en) 2001-03-12 2003-10-09 Monogen, Inc. Cell-based detection and differentiation of disease states
KR20030094281A (ko) 2001-03-12 2003-12-11 모노젠, 인크. 세포에 기초한 질병상태의 검출 및 질병상태의 구별
EP1440311B1 (en) 2001-08-31 2009-01-07 Gen-Probe Incorporated Affinity-shifted probes for quantifying analyte polynucleotides
US20030186248A1 (en) 2002-03-29 2003-10-02 Erlander Mark G. Interpreting cytological specimens via molecular histological signatures
US20030194734A1 (en) 2002-03-29 2003-10-16 Tim Jatkoe Selection of markers
US20050143933A1 (en) 2002-04-23 2005-06-30 James Minor Analyzing and correcting biological assay data using a signal allocation model
EP1540012A4 (en) 2002-07-31 2006-03-22 Univ Southern California POLYMORPHISMS FOR PREDICTING DISEASES AND THERAPEUTIC RESULTS
WO2004027025A2 (en) 2002-09-20 2004-04-01 New England Biolabs, Inc. Helicase dependent amplification of nucleic acids
US7300788B2 (en) 2002-10-08 2007-11-27 Affymetrix, Inc. Method for genotyping polymorphisms in humans
US20050266443A1 (en) 2002-10-11 2005-12-01 Thomas Jefferson University Novel tumor suppressor gene and compositions and methods for making and using the same
CN100343389C (zh) 2002-11-07 2007-10-17 松原洋一 基因突变检出法
ES2396245T3 (es) 2003-01-29 2013-02-20 454 Life Sciences Corporation Método de amplificación y secuenciamiento de ácidos nucleicos
ATE412779T1 (de) 2003-02-20 2008-11-15 Genomic Health Inc Benutzung von intronischen rna sequenzen zur quantifizierung der genexpression
WO2004081564A1 (en) 2003-03-14 2004-09-23 Peter Maccallum Cancer Institute Expression profiling of tumours
US7378233B2 (en) 2003-04-12 2008-05-27 The Johns Hopkins University BRAF mutation T1796A in thyroid cancers
EP1633889B1 (en) 2003-05-30 2010-09-01 The Board Of Trustees Of The University Of Illinois Gene expression profiles that identify genetically elite ungulate mammals
KR20060031809A (ko) 2003-06-09 2006-04-13 더 리젠츠 오브 더 유니버시티 오브 미시간 암 치료 및 진단용 조성물 및 방법
JP4906505B2 (ja) 2003-07-10 2012-03-28 ジェノミック ヘルス, インコーポレイテッド 癌診断のための発現プロフィールアルゴリズムおよび試験
US20070048738A1 (en) 2003-07-14 2007-03-01 Mayo Foundation For Medical Education And Research Methods and compositions for diagnosis, staging and prognosis of prostate cancer
EP1694866A4 (en) 2003-12-12 2007-12-26 Bayer Pharmaceuticals Corp GENE EXPRESSION PROFILES AND METHODS OF USE
US20050130177A1 (en) 2003-12-12 2005-06-16 3M Innovative Properties Company Variable valve apparatus and methods
JP2005168432A (ja) 2003-12-12 2005-06-30 Nara Institute Of Science & Technology 甲状腺濾胞癌と甲状腺濾胞腺腫を判別するためのデータを収集するための方法及び該方法のためのキット
US20050250125A1 (en) 2003-12-19 2005-11-10 Novakoff James L Method for conducting pharmacogenomics-based studies
US7407755B2 (en) 2004-01-15 2008-08-05 Lubinski Jan Determining a predisposition to cancer
EP1713938A2 (en) 2004-02-09 2006-10-25 Thomas Jefferson University DIAGNOSIS AND TREATMENT OF CANCERS WITH MicroRNA LOCATED IN OR NEAR CANCER-ASSOCIATED CHROMOSOMAL FEATURES
WO2005085471A2 (de) 2004-03-03 2005-09-15 Universität Leipzig Verfahren und mittel zur differentiellen diagnose von schilddrüsentumoren
US8426126B2 (en) 2004-03-18 2013-04-23 Applied Biosystems, Llc Modified surfaces as solid supports for nucleic acid purification
WO2005095654A1 (en) 2004-03-25 2005-10-13 Biohelix Corporation Helicase-dependent amplification of circular nucleic acids
JP2005304497A (ja) 2004-03-25 2005-11-04 Joji Inasawa 特定の癌関連遺伝子を用いる癌の検出方法及び癌の抑制方法
US7319011B2 (en) * 2004-04-08 2008-01-15 Duke University Method for distinguishing follicular thyroid adenoma (FTA) from follicular thyroid carcinoma (FTC)
WO2005100608A2 (en) 2004-04-09 2005-10-27 The Government Of The United States Of America, As Represented By The Secretary, Department Of Health And Human Services, National Institutes Of Health Diagnostic tool for diagnosing benign versus malignant thyroid lesions
US20050240357A1 (en) 2004-04-26 2005-10-27 Minor James M Methods and systems for differential clustering
EP2290066B1 (en) 2004-05-28 2015-03-18 Asuragen, Inc. Methods and compositions involving microRNA
AU2005260113A1 (en) 2004-06-04 2006-01-12 Aviaradx, Inc. The importance of the gene HoxB13 for cancer
US20060019615A1 (en) 2004-07-24 2006-01-26 Ditmer Larry R Wireless keying for a continuous wave (CW) amateur radio transmitter
GB0417740D0 (en) 2004-08-10 2004-09-08 Uc3 Methods and kit for the prognosis of breast cancer
WO2006020837A2 (en) * 2004-08-11 2006-02-23 The Cleveland Clinic Foundation Method of detecting thyroid cancer
EP3428191A1 (en) 2004-10-06 2019-01-16 Mayo Foundation for Medical Education and Research B7-h1 and pd-1 in treatment of renal cell carcinoma
US7629325B2 (en) 2004-10-11 2009-12-08 Technion Research & Development Foundation Ltd. Human Sef isoforms and methods of using same for cancer diagnosis and gene therapy
US7485468B2 (en) 2004-10-15 2009-02-03 Galapagos Bv Molecular targets and compounds, and methods to identify the same, useful in the treatment of joint degenerative and inflammatory diseases
US20060141497A1 (en) 2004-10-22 2006-06-29 Finkelstein Sydney D Molecular analysis of cellular fluid and liquid cytology specimens for clinical diagnosis, characterization, and integration with microscopic pathology evaluation
JP5629894B2 (ja) 2004-12-07 2014-11-26 国立大学法人大阪大学 甲状腺乳頭癌を診断するための新規のマーカー
US20120122718A1 (en) 2005-03-01 2012-05-17 Reisman David N BRM Expression and Related Diagnostics
US20070020657A1 (en) 2005-05-20 2007-01-25 Grebe Stefan K Methods for detecting circulating tumor cells
US20070037186A1 (en) 2005-05-20 2007-02-15 Yuqiu Jiang Thyroid fine needle aspiration molecular assay
CA2610752A1 (en) 2005-06-03 2006-12-14 Aviaradx, Inc. Identification of tumors and tissues
WO2006135886A2 (en) 2005-06-13 2006-12-21 The Regents Of The University Of Michigan Compositions and methods for treating and diagnosing cancer
CA2612021A1 (en) 2005-06-13 2006-12-28 The Regents Of The University Of Michigan Compositions and methods for treating and diagnosing cancer
IL177006A0 (en) 2005-08-02 2006-12-10 Veridex Llc Predicting bone relapse of breast cancer
CA2619577A1 (en) 2005-08-15 2007-02-22 Genentech, Inc. Gene disruptions, compositions and methods relating thereto
US7998674B2 (en) 2005-09-22 2011-08-16 China Synthetic Rubber Corporation Gene expression profiling for identification of prognostic subclasses in nasopharyngeal carcinomas
WO2007038792A2 (en) 2005-09-28 2007-04-05 H. Lee Moffitt Cancer Center Individualized cancer treatments
US7962291B2 (en) 2005-09-30 2011-06-14 Affymetrix, Inc. Methods and computer software for detecting splice variants
WO2007039290A2 (en) 2005-10-03 2007-04-12 Epigenomics Ag Methods and nucleic acids for the analysis of gene expression associated with the prognosis of cell proliferative disorders
US7598052B2 (en) 2005-10-11 2009-10-06 The Regents Of The University Of Michigan Expression profile of thyroid cancer
US20070220621A1 (en) 2005-10-31 2007-09-20 Clarke Michael F Genetic characterization and prognostic significance of cancer stem cells in cancer
FR2896881B1 (fr) 2006-01-31 2008-04-18 Biomerieux Sa Procede de dosage du prongf pour le diagnostic in vitro du cancer du sein et utilisation du prongf en therapie
US7670775B2 (en) * 2006-02-15 2010-03-02 The Ohio State University Research Foundation Method for differentiating malignant from benign thyroid tissue
JP4867018B2 (ja) 2006-03-22 2012-02-01 富士フイルム株式会社 癌の検出方法および抑制方法
WO2007126882A2 (en) 2006-03-27 2007-11-08 Jivan Biologics, Inc. Analysis of splice variant expression data
US20080028302A1 (en) 2006-07-31 2008-01-31 Steffen Meschkat Method and apparatus for incrementally updating a web page
BRPI0807384A2 (pt) 2007-02-27 2014-05-20 Sentoclone Ab Método de uma etapa para detecção direta ou simultânea de uma célula cancerosa ou elemento de célula cancerosa em uma amostra biológica, kit para uso em um método, base de dados, método para indetificar células cancerosas, e, uso de uma base de dados.
US9096906B2 (en) 2007-03-27 2015-08-04 Rosetta Genomics Ltd. Gene expression signature for classification of tissue of origin of tumor samples
US8802599B2 (en) 2007-03-27 2014-08-12 Rosetta Genomics, Ltd. Gene expression signature for classification of tissue of origin of tumor samples
US20100273172A1 (en) 2007-03-27 2010-10-28 Rosetta Genomics Ltd. Micrornas expression signature for determination of tumors origin
JP2010522554A (ja) 2007-03-27 2010-07-08 ロゼッタ ゲノミックス エルティーディー. 癌の分類のための遺伝子発現サイン
EP1975252A1 (en) 2007-03-29 2008-10-01 INSERM (Institut National de la Santé et de la Recherche Medicale) Methods for the prognosis or for the diagnosis of a thyroid disease
US8455208B2 (en) 2007-04-14 2013-06-04 The Regents Of The University Of Colorado Biomarkers for follicular thyroid carcinoma and methods of use
US7901888B2 (en) 2007-05-09 2011-03-08 The Regents Of The University Of California Multigene diagnostic assay for malignant thyroid neoplasm
US8465918B2 (en) * 2007-08-03 2013-06-18 The Ohio State University Research Foundation Ultraconserved regions encoding ncRNAs
WO2009029266A2 (en) 2007-08-27 2009-03-05 The Government Of The United States Of America, As Represented By The Secretary, Department Of Health Of Human Services, National Institutes Of Health Diagnostic tool for diagnosing benign versus malignant thyroid lesions
AT505726A2 (de) 2007-08-30 2009-03-15 Arc Austrian Res Centers Gmbh Set von tumor-markern
CN101802226A (zh) 2007-09-17 2010-08-11 皇家飞利浦电子股份有限公司 分析卵巢癌病症的方法
WO2009037337A1 (en) 2007-09-20 2009-03-26 Novartis Ag Robust and tissue independent gender-specific transcript markers for molecular gender determination
US20100255485A1 (en) 2007-11-28 2010-10-07 Pico Caroni Biomarkers for the onset of neurodegenerative diseases
CA2709395A1 (en) 2007-12-14 2009-06-25 Veridex, Llc Copy number alterations that predict metastatic capability of human breast cancer
US20090191535A1 (en) 2007-12-22 2009-07-30 Mark Carle Connelly Method of assessing metastatic carcinomas from circulating endothelial cells and disseminated tumor cells
US8299233B2 (en) 2008-01-04 2012-10-30 Centre National De La Recherche Scientifique Molecular in vitro diagnosis of breast cancer
WO2009094318A2 (en) 2008-01-22 2009-07-30 Veridex, Llc Molecular staging of stage ii and iii colon cancer and prognosis
EP2247775B1 (en) 2008-01-28 2012-12-19 National University of Singapore Method of generating a classification model
WO2009111881A1 (en) 2008-03-13 2009-09-17 British Columbia Cancer Agency Branch Biomarkers for diagnosis of differentiated thyroid cancer
WO2009120800A2 (en) 2008-03-25 2009-10-01 University Of Southern California Prognostic panel for urinary bladder cancer
WO2009126271A1 (en) 2008-04-11 2009-10-15 China Synthetic Rubber Corporation Methods, agents and kits for the detection of cancer
AU2009246256A1 (en) 2008-05-14 2009-11-19 Dnar, Inc. Biomarkers for the identification, monitoring, and treatment of head and neck cancer
WO2009143603A1 (en) 2008-05-28 2009-12-03 Genomedx Biosciences, Inc. Systems and methods for expression-based discrimination of distinct clinical disease states in prostate cancer
WO2009153775A2 (en) 2008-06-17 2009-12-23 Rosetta Genomics Ltd. Methods for distinguishing between specific types of lung cancers
US20120122698A1 (en) 2008-07-07 2012-05-17 Decode Genetics Ehf. Genetic Variants Predictive of Cancer Risk in Humans
AU2009280807A1 (en) 2008-08-12 2010-02-18 Decode Genetics Ehf Genetic variants useful for risk assessment of thyroid cancer
EP2329037B1 (en) 2008-08-15 2015-01-28 Decode Genetics EHF Genetic variants predictive of cancer risk
US20120115735A1 (en) 2008-09-03 2012-05-10 The Johns Hopkins University Pathways Underlying Pancreatic Tumorigenesis and an Hereditary Pancreatic Cancer Gene
WO2010030365A2 (en) 2008-09-12 2010-03-18 Cornell Research Foundation, Inc. Wmc Thyroid tumors identified
EP2347009A4 (en) 2008-10-14 2012-05-30 Caris Mpi Inc GENE AND GENE EXPRESSED TARGET PROTEINS FOR THE PRESENTATION OF BIOMARKERS AND SIGNATURES BY TUMOR TYPE
WO2010056931A1 (en) 2008-11-14 2010-05-20 Intelligent Oncotherapeutics, Inc. Methods for identification of tumor phenotype and treatment
WO2010056351A2 (en) 2008-11-14 2010-05-20 Stc.Unm Gene expression classifiers for relapse free survival and minimal residual disease improve risk classification and out come prediction in pedeatric b-precursor acute lymphoblastic leukemia
AU2009314502B2 (en) * 2008-11-17 2015-01-22 Veracyte, Inc. Methods and compositions of molecular profiling for disease diagnostics
US10236078B2 (en) 2008-11-17 2019-03-19 Veracyte, Inc. Methods for processing or analyzing a sample of thyroid tissue
US9495515B1 (en) 2009-12-09 2016-11-15 Veracyte, Inc. Algorithms for disease diagnostics
CA2777638A1 (en) 2008-11-26 2010-06-03 Decode Genetics Ehf. Genetic variants useful for risk assessment of thyroid cancer
WO2010061396A1 (en) 2008-11-30 2010-06-03 Rosetta Genomics Ltd. Methods for detecting an increased susceptibility to cancer
CN102333888B (zh) 2008-12-24 2013-07-10 姜桥 用于肿瘤样本起源组织分类的基因表达签名
EP2382328A2 (en) 2009-01-09 2011-11-02 The Regents of the University of Michigan Recurrent gene fusions in cancer
WO2010091049A2 (en) 2009-02-03 2010-08-12 Children's Medical Center Corporation Diagnosis and treatment of cancer
US9074258B2 (en) 2009-03-04 2015-07-07 Genomedx Biosciences Inc. Compositions and methods for classifying thyroid nodule disease
US8697275B2 (en) 2009-03-04 2014-04-15 Samsung Sdi Co., Ltd. Rechargeable battery having an extendable case region
US20120100997A1 (en) 2009-04-24 2012-04-26 University Of Southern California Cd133 polymorphisms and expression predict clinical outcome in patients with cancer
CA2753916C (en) 2009-04-29 2020-08-25 Genomedx Biosciences Inc. Systems and methods for expression-based classification of thyroid tissue
EP2425020A4 (en) 2009-05-01 2016-04-20 Genomic Health Inc GENE EXPRESSION PROFILE ALGORITHM AND COLORECTAL CANCER RECURRENCE PROBABILITY ANALYSIS AND RESPONSE TO CHEMOTHERAPY
WO2010129934A2 (en) 2009-05-07 2010-11-11 Veracyte, Inc. Methods and compositions for diagnosis of thyroid conditions
WO2011023413A1 (en) 2009-08-31 2011-03-03 Alcedo Biotech Gmbh Microrna-based methods and compositions for reprogramming cells
US9110065B2 (en) 2009-09-21 2015-08-18 Paul Walfish Methods and compositions for the diagnosis and treatment of thyroid cancer
WO2011038461A1 (en) 2009-10-01 2011-04-07 Chipdx Llc System and method for classification of patients
US8975019B2 (en) 2009-10-19 2015-03-10 University Of Massachusetts Deducing exon connectivity by RNA-templated DNA ligation/sequencing
US20130231258A1 (en) 2011-12-09 2013-09-05 Veracyte, Inc. Methods and Compositions for Classification of Samples
US10446272B2 (en) 2009-12-09 2019-10-15 Veracyte, Inc. Methods and compositions for classification of samples
EP2519651A2 (en) 2009-12-30 2012-11-07 Rigshospitalet Classication of thyroid follicular neoplasia based on mrna expression
EP2366800A1 (en) 2010-03-01 2011-09-21 Centrum Onkologii-Instytut im M. Sklodowskiej-Curie Oddzial w Gliwicach Kit, method and use for the diagnosis of papillary thyroid cancer using a gene expression profile
WO2011116380A2 (en) 2010-03-19 2011-09-22 H. Lee Moffitt Cancer Center And Research Institute, Inc. Hybrid model for the classification of carcinoma subtypes
US9157123B2 (en) 2010-04-20 2015-10-13 The Johns Hopkins University Genetic amplification of IQGAP1 in cancer
EP2569626B1 (en) 2010-05-11 2019-11-27 Veracyte, Inc. Methods and compositions for diagnosing conditions
US20190100809A1 (en) 2010-05-11 2019-04-04 Veracyte, Inc. Algorithms for disease diagnostics
EP2772550B1 (en) 2010-11-17 2017-03-29 Interpace Diagnostics, LLC Mirnas as biomarkers for distinguishing benign from malignant thyroid neoplasms
WO2012085948A1 (en) 2010-12-21 2012-06-28 Decode Genetics Ehf Genetic variants useful for risk assessment of thyroid cancer
WO2012094744A1 (en) 2011-01-11 2012-07-19 University Health Network Prognostic signature for oral squamous cell carcinoma
WO2012123972A1 (en) 2011-03-17 2012-09-20 Decode Genetics Ehf Genetic variants useful for risk assessment of thyroid cancer
US8945829B2 (en) 2011-03-22 2015-02-03 Cornell University Distinguishing benign and malignant indeterminate thyroid lesions
EP2505664B1 (en) 2011-03-30 2014-12-03 Universität Leipzig Method and means for distinguishing malignant from benign tumor samples, in particular in routine air dried fine needle aspiration biopsy (FNAB)
WO2013006495A2 (en) 2011-07-01 2013-01-10 Dana-Farber Cancer Institute, Inc. Methods of predicting prognosis in cancer
US20140243240A1 (en) 2011-10-26 2014-08-28 Georgetown University microRNA EXPRESSION PROFILING OF THYROID CANCER
US20130142728A1 (en) 2011-10-27 2013-06-06 Asuragen, Inc. Mirnas as diagnostic biomarkers to distinguish benign from malignant thyroid tumors
US20140371096A1 (en) 2011-12-09 2014-12-18 The Johns Hopkins University Compositions and methods for characterizing thyroid neoplasia
GB2513732B (en) 2011-12-10 2020-12-02 Veracyte Inc Methods and compositions for sample identification
WO2013088457A1 (en) 2011-12-13 2013-06-20 Decode Genetics Ehf Genetic variants useful for risk assessment of thyroid cancer
US20130184999A1 (en) 2012-01-05 2013-07-18 Yan Ding Systems and methods for cancer-specific drug targets and biomarkers discovery
WO2013138726A1 (en) 2012-03-15 2013-09-19 Sabiosciences Corp. Thyroid cancer biomarker
JP2013212052A (ja) 2012-03-30 2013-10-17 Yale Univ Krasバリアントおよび腫瘍生物学
US20150141470A1 (en) 2012-05-08 2015-05-21 The Broad Institute, Inc. Diagnostic and treatment methods in patients having or at risk of developing resistance to cancer therapy
CA2885202A1 (en) 2012-09-20 2014-03-27 Genomedx Biosciences, Inc. Thyroid cancer diagnostics
WO2014058317A1 (en) 2012-10-10 2014-04-17 Stichting Het Nederlands Kanker Instituut-Antoni van Leeuwenhoek Ziekenhuis Methods and means for predicting resistance to anti-cancer treatment
US20140121126A1 (en) 2012-10-25 2014-05-01 Memorial Sloan-Kettering Cancer Center Methods of detecting axl and gas6 in cancer patients
US20140143188A1 (en) 2012-11-16 2014-05-22 Genformatic, Llc Method of machine learning, employing bayesian latent class inference: combining multiple genomic feature detection algorithms to produce an integrated genomic feature set with specificity, sensitivity and accuracy
AU2013352339B2 (en) 2012-11-27 2019-07-04 Pontificia Universidad Catolica De Chile Compositions and methods for diagnosing thyroid tumors
WO2014089241A2 (en) 2012-12-04 2014-06-12 Caris Mpi, Inc. Molecular profiling for cancer
CA2902871A1 (en) 2013-03-12 2014-10-09 Cepheid Methods of detecting cancer
WO2014160645A2 (en) 2013-03-15 2014-10-02 Biotheranostics, Inc. Neuroendocrine tumors
GB2525804B (en) 2013-03-15 2020-08-05 Veracyte Inc Methods and compositions for classification of samples
JP6577873B2 (ja) 2013-03-15 2019-09-18 フンダシオ、インスティトゥト、デ、レセルカ、ビオメディカ(イエレベ、バルセロナ)Fundacio Institut De Recerca Biomedica (Irb Barcelona) がんの転移の予後診断および処置のための方法
JP2016518123A (ja) 2013-04-17 2016-06-23 ライフ テクノロジーズ コーポレーション 癌に関連付けられる遺伝子融合物及び遺伝子変異型
CA2912052C (en) 2013-05-10 2021-12-14 Memorial Sloan Kettering Cancer Center Lipid scavenging in ras cancers
PL406033A1 (pl) 2013-11-14 2015-05-25 Warszawski Uniwersytet Medyczny Sposób diagnozowania raka brodawkowatego tarczycy, zastosowanie markera mikroRNA do diagnozowania nowotworu tarczycy, oceny stopnia zaawansowania choroby oraz oceny podatności pacjenta i/lub choroby na zaproponowane leczenie oraz zawierający takie markery zestaw diagnostyczny
US9708667B2 (en) 2014-05-13 2017-07-18 Rosetta Genomics, Ltd. MiRNA expression signature in the classification of thyroid tumors
CN107636171A (zh) 2015-03-04 2018-01-26 威拉赛特公司 使用表达水平和序列变体信息评估疾病发生或复发风险的方法
WO2019023517A2 (en) 2017-07-27 2019-01-31 Veracyte, Inc. GENOMIC SEQUENCING CLASSIFIER

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1975245A1 (de) * 2007-03-28 2008-10-01 Greenpeace e.V. Gen-Profiling zur Auswahl von politischen Kandidaten, kommerzielle Nutzung von Politikern
WO2009042728A1 (en) * 2007-09-24 2009-04-02 Allelogic Biosciences Corporation Detection and /or quantification of nucleic acids

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Genome-wide gene expression profiles of thyroid carcinana: Identification of molecular targets for treatment of thyroid carcinoma;Nikolova et al.;《Oncol Rep》;20080630;第20卷(第1期);摘要、表4 *

Also Published As

Publication number Publication date
US20140228237A1 (en) 2014-08-14
EP2427575A4 (en) 2013-02-27
JP2012525855A (ja) 2012-10-25
JP2016005471A (ja) 2016-01-14
EP2427575B1 (en) 2018-01-24
US20210238686A1 (en) 2021-08-05
JP2018029612A (ja) 2018-03-01
JP6684775B2 (ja) 2020-04-22
US10934587B2 (en) 2021-03-02
JP6078339B2 (ja) 2017-02-08
US20120220474A1 (en) 2012-08-30
JP2020108402A (ja) 2020-07-16
EP3360978A2 (en) 2018-08-15
WO2010129934A2 (en) 2010-11-11
CN102459636A (zh) 2012-05-16
EP3360978A3 (en) 2018-09-26
US8669057B2 (en) 2014-03-11
WO2010129934A3 (en) 2011-04-21
EP2427575A2 (en) 2012-03-14

Similar Documents

Publication Publication Date Title
CN102459636B (zh) 用于诊断甲状腺病症的方法和组合物
CN103038635B (zh) 用于诊断病状的方法和组合物
JP6590878B2 (ja) 疾患診断のための分子プロファイリングの方法および組成物
US20230023867A1 (en) Identification of tumors and tissues
US9856537B2 (en) Algorithms for disease diagnostics
US20200190597A1 (en) Identification of tumors
CN107636171A (zh) 使用表达水平和序列变体信息评估疾病发生或复发风险的方法
US20190100809A1 (en) Algorithms for disease diagnostics
CN105378104A (zh) 用于样品分类的方法和组合物
AU2017268578A1 (en) Methods and compositions of molecular profiling for disease diagnostics

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant