CN111868261A

CN111868261A - 用于检测头颈癌的组合物和方法

Info

Publication number: CN111868261A
Application number: CN201880082894.XA
Authority: CN
Inventors: G·J·沃韦伯
Original assignee: American Holding Laboratories
Current assignee: American Holding Laboratories
Priority date: 2017-12-20
Filing date: 2018-12-19
Publication date: 2020-10-30
Also published as: EP4455310A2; CA3084826C; EP3728641B1; JP2024040515A; US20240125785A1; EP3728641A1; AU2018393024A1; JP7441346B2; JP7227254B2; WO2019126249A1; US20190187143A1; CA3084826A1; JP2023054051A; JP2021506298A; CA3211135A1

Abstract

本发明公开了用于检测通常与头颈癌相关的蛋白质或更具体地头颈鳞状细胞癌(HNSCC)的生物标志物的组合物和方法。这样的标志物可用于允许易患HNSCC的个体管理其生活方式和/或药物治疗以避免疾病的进一步发展。

Description

用于检测头颈癌的组合物和方法

相关申请

本申请要求于2017年12月20日提交的美国临时专利申请No.62/608,296的优先权。美国临时专利申请No.62/608,296的公开内容通过引用整体并入本文。

背景

头颈癌是一种常见疾病。从组织学上讲，大多数头颈癌属于鳞状细胞类型，因此被归类为头颈鳞状细胞癌(HNSCC)。HNSCC是全世界第六大最常见的癌症，也是发展中国家第三大最常见的癌症。

HNSCC背后的生物学机制尚不清楚，并且几乎没有生物标志物可提供这种病状的可靠指示。仍然，对易患HNSCC的个体调整其生活方式以避免触发症状发作和/或促进疾病的进一步发展将是有帮助的。因此，需要开发和评估HNSCC的生物标志物。

概述

本公开内容可以以多种方式来体现。

在一个实施方案中，公开了一种检测个体中与头颈鳞状细胞癌(HNSCC)相关的生物标志物的方法，该方法包括以下步骤：从所述个体获得样品；以及测量样品中表4和/或表6中的至少一种基因的表达的量。在一个实施方案中，公开了一种检测个体中与HNSCC相关的生物标志物的方法，其包括以下步骤：从所述个体获得样品；并测量样品中的以下基因中的至少一种的表达的量：CAB39L、ADAM12、SH3BGRL2、NRG2、COL13A1、GRIN2D、LOXL2、KRT4、EMP1和HSD17B6。在另一个实施方案中，公开了一种检测个体中与HNSCC相关的生物标志物的方法，其包括以下步骤：从所述个体获得样品；并测量人类乳头瘤病毒(HPV)E6或E7基因中的至少一种的表达的量。另外和/或可替代地，该方法可以包括测量至少一种标准化基因(例如管家基因)。在一个实施方案中，标准化基因可以是KHDRBS1。在一个实施方案中，标准化基因可以是RPL30或另一种标准化基因。或者，可以测量这些基因的各种组合的表达。

在一个实施方案中，使用多个公开的生物标志物的组。在一个实施方案中，本公开内容包括用于检测个体中与头颈鳞状细胞癌(HNSCC)相关的生物标志物的组合物，所述组合物包含对表4和/或表6中的至少一种基因，和/或CAB39L、ADAM12、SH3BGRL2、NRG2、COL13A1、GRIN2D、LOXL2、KRT4、EMP1或HSD17B6中的至少一种，和/或HPV E6和E7基因中的至少一种的表达水平进行定量的试剂。另外和/或可替代地，该组合物可以包括至少一种标准化基因(例如管家基因)。在一个实施方案中，标准化基因可以是KHDRBS1。在一个实施方案中，标准化基因可以是RPL30或另一种标准化基因。在某些实施方案中，组合物可以包含针对这些基因中任一种的引物和/或探针，其中所述引物和/或探针用本文所述的可检测的部分标记。

其他实施方案包括用于执行本文公开的方法和/或使用本文公开的组合物的系统。

在所附的详细描述、附图和权利要求书中，本公开内容的其他特征、目的和优点是明显的。然而，应该理解的是，详细描述、附图和权利要求虽然指示了所公开的方法、组合物和系统的实施方案，但是仅是出于举例说明而非限制的目的。对于本领域技术人员而言，在本发明范围内的各种改变和修改将变得明显。

附图

参考以下非限制性附图可以更好地理解本发明。

图1显示了根据本公开内容的实施方案的使用TCGA数据集和随机森林分析来识别HNSCC中的差异表达的基因的实验的结果。

图2显示了根据本公开内容的各种实施方案，对包含多个标志物的基因组的评估可以改善测定性能。

图3显示了在正常和HNSCC组织中本公开内容的四个标志物(SH3BGRL2、CAB39L、NRG2和ADAM12)的在各部位的基因表达。在图3中，对于每个图，x轴左端的3个数据集(喉、口腔和口咽)来自正常组织，x轴右端的4个数据集(下咽部、喉、口腔和口咽)来自HNSCC组织。

图4显示了根据本公开内容的各种实施方案的在正常和HNSCC组织中本公开内容的四个另外的标志物(LOXL2、COL13A1、HSD17B6和GRIN2D)的在各部位的基因表达。在图4中，对于每个图，x轴左端的3个数据集(喉、口腔和口咽)来自正常组织，x轴右端的3个数据集(下咽部、喉、口腔和口咽)来自HNSCC组织。

图5显示了根据本公开内容的实施方案的对于所有数据的HNSCC样品相对正常样品中的所有HNSCC标志物的比较，以及HNSCC相对正常样品中口腔(OC)或口咽(OP)中的所有HNSCC标志物的比较。

图6，图A(即图6A)显示了根据本公开内容的实施方案的TCGA基因组的差异表达。图B(即图6B)显示了根据本公开内容的各种实施方案的来自随机森林分析的36个基因(图中的较暗符号)的中位数等级。对于HNSCC中基因表达的增加，截断值是HNSCC的第5个百分位数和正常值的第95个百分位数(例如，图6B，GRIN2D插图)。

图7显示了根据本公开内容的各种实施方案的从文献搜索中识别出的差异表达的标志物(图中的较深色符号)。

图8显示了根据本公开内容的各种实施方式的来自文献检索的标准化标志物。

图9，图A(即图9A)显示了使用TCGA数据集鉴定标准化基因。左图显示了整个数据集；中图显示的是正常和癌症之间基因表达的中位数倍数变化小于2(阳性或阴性)且四分位间距(IQR)小于2的那些基因，其中IQR＝第75个百分位数的表达/第25个百分位数的表达；右图显示根据本公开内容的各种实施方案的TCGA数据库的基因的正常相对HNSCC中的表达水平，以鉴定具有与目的组相似的中位数表达水平的基因。图B(即图9B)显示了根据本公开内容的各种实施方案的KHDRBS1差分图。

图10显示了根据本公开内容的各种实施方案的与正常组织(即颊粘膜)相比癌组织(即舌鳞状细胞癌)中的潜在标志物基因ADAM12和SH3BGRL2的基因表达水平的液滴数字PCR(ddPCR)数据相对TCGA RNASeq数据的比较。

图11显示了使用ddPCR的三个福尔马林固定的石蜡包埋的患者样品(DA1081983；DR1041686；DA0063595)和一个URNA对照样品(源自细胞培养的癌组织)的其他ddPCR数据；根据本公开内容的各种实施方案，执行重复或三次采样。

图12显示了根据本公开内容的各种实施方案的三种不同患者样品(RNA 1、3和5)和URNA对照中SH3BGRL2(潜在的癌症标志物)(·)表达与KHDRBS1(x)(潜在的标准化基因)表达相比的浓度依赖性，其显示相对恒定的比率(虚线)直到一个拷贝/μL的测定极限。

图13显示了根据本公开内容的各种实施方案，与URNA对照相比，福尔马林固定的石蜡包埋(FFPE)样品中潜在的癌症标志物SH3BGRL2的表达(左图)；癌组织相对正常组织中SH3BGRL2/KHDRBS1的ddPCR产物之比(中图)；在TCGA数据库中这两种标志物的报道基因表达的分布(右图)；在该图中，x是来自癌症患者的样品，圆圈(空心或实心)是正常组织样品。

图14显示了根据本公开内容的各种实施方案的使用单重测定形式(单一)(即仅包含SH3BGRL2引物)或双重测定形式(双重)(包含SH3BGRL2和KHDRBS1引物)对SH3BGRL2的各种患者样品的分析。

图15显示了根据本公开内容的各种实施方案的来自22个良性(圆圈)和8个癌(x)FFPE样品的使用双重ddPCR的5种生物标志物(SH3BGRL2、KRT4、EMP1、LOXL2和ADAM12)和管家基因KHDRBS1的表达。

图16显示了根据本公开内容的各种实施方案的来自22个良性和8个癌FFPE样品的5种生物标志物的通过ddPCR测定的针对管家基因KHDRBS1进行标准化后的表达(左图)，与相同的生物标志物和管家基因的HNSCC TCGA的RNASeq数据相比(右图)，总结了(表)每种生物标志物的表达的中位数倍数变化。在该图中，N＝正常组织，C＝癌组织。

图17显示了根据本公开内容的各种实施方案的用于将癌症与正常FFPE样品区分开的标准化的ddPCR表达的ddPCR评分算法结果(左图)，显示了接收者操作特征(ROC)分析(右图)。

图18显示根据本公开内容的各种实施方案的在p16阳性FFPE HNSCC样品(上图)和p16阴性FFPE HNSCC样品(下图)中通过ddPCR测定的E6和E7 HPV16表达之间的相关性；以及来自p16阳性样品的E6和E7的标准化ddPCR表达水平(右图)。

图19显示了根据本公开内容的各种实施方案的来自15种唾液样品的RNA产率(μgRNA/2mL唾液)和A260/A280比率的表格形式(左表)和盒须图(右图)。

图20显示了根据本公开内容的各种实施方案的来自15个唾液样品的使用双链ddPCR测定的5种生物标志物(LOXL2、SH3BGRL2、CRISP3、EMP1和KRT4)和管家基因RPL30的表达(左图)，以及来自5个双链ddPCR反应的管家基因RPL30的表达(右图)。

图21显示根据本公开内容的各种实施方案的来自15个唾液样品中的5种生物标志物的通过ddPCR测定的针对管家基因RPL30进行标准化后的表达(左图)，其是与来自HNSCCTCGA的相同生物标志物的RNASeq数据(右图)相比，其中总结了每个生物标志物的相对于LOXL2的表达的中位数倍数增加(表)。

详细描述

术语和定义

为了使本公开内容更容易理解，首先定义某些术语。在整个说明书中阐述了以下术语和其他术语的附加定义。

尽管阐述本发明的广泛范围的数值范围和参数是近似值，但是在具体实例中阐述的数值被尽可能精确地报告。但是，任何数值都固有地包含某些误差，这些误差必然是由它们各自的测试测量中发现的标准偏差引起的。此外，本文公开的所有范围应理解为涵盖其中包含的任何和所有子范围。例如，规定的范围“1到10”应被视为包括最小值1和最大值10之间(包括端值)之间的任何和所有子范围；也就是说，所有子范围均以最小值1或较大的值(例如1至6.1)开始，并且以最大值10或较小的值(例如5.5至10)结束。另外，任何被称为“并入本文”的参考文献应理解为全文并入。

还应注意的是，如在本说明书中使用的，单数形式“一个(a)”、“一种(an)”和“该(the)”包括复数个指示物，除非清楚地和明确地限于一个指示物。术语“和/或”通常用于指代至少一个或另一个。在某些情况下，术语“和/或”与术语“或”可互换使用。术语“包括”在本文中用来表示短语“包括但不限于”，并且可以与短语“包括但不限于”互换使用。术语“例如”在本文中用于表示短语“例如但不限于”并与其互换使用。

除非另有定义，否则本文中使用的所有技术和科学术语具有与本领域普通技术人员通常理解的相同含义。从业者特别参考Current Protocols in Molecular Biology(Ausubel)来获得本领域的定义和术语。

抗体：如本文所用，术语“抗体”是指由基本上由免疫球蛋白基因或免疫球蛋白基因的片段编码的一种或多种多肽组成的多肽。公认的免疫球蛋白基因包括κ、λ、α、γ、δ、ε和μ恒定区基因，以及无数免疫球蛋白可变区基因。轻链通常分类为κ或λ。重链通常被分类为γ、μ、α、δ或ε，它们进而分别定义了免疫球蛋白类别IgG、IgM、IgA、IgD和IgE。已知典型的免疫球蛋白(抗体)结构单元包含四聚体。每个四聚体由两对相同的多肽链组成，每对具有一条“轻”链(约25kD)和一条“重”链(约50-70kD)。每条链的N末端定义了约100至110个或更多个氨基酸的可变区，其主要负责抗原识别。术语“可变轻链”(VL)和“可变重链”(VH)分别是指这些轻链和重链。抗体可以对特定抗原具有特异性。抗体或其抗原可以是分析物或结合伴侣。抗体以完整的免疫球蛋白形式存在，或以各种肽酶消化产生的许多充分表征的片段形式存在。因此，例如，胃蛋白酶在铰链区中二硫键消化抗体以产生F(ab)’2(Fab的二聚体)，Fab本身是一条通过二硫键与VH-CH1连接的轻链。F(ab)’2可以在温和条件下还原，以破坏铰链区的二硫键，从而将(Fab’)2二聚体转化为Fab’单体。Fab’单体本质上是具有部分铰链区的Fab(参见，Fundamental Immunology,W.E.Paul,ed.,Raven Press,N.Y.(1993)，以获得其他抗体片段的更详细的描述)。虽然根据完整抗体的消化来定义各种抗体片段，但是本领域普通技术人员将理解，可以通过化学方法或利用重组DNA方法从头合成此类Fab’片段。因此，本文所用的术语“抗体”还包括通过修饰完整抗体或使用重组DNA方法从头合成的抗体片段。在一些实施方案中，抗体是单链抗体，例如单链Fv(scFv)抗体，其中可变重链和可变轻链(直接或通过肽接头)连接在一起以形成连续多肽。单链Fv(“scFv”)多肽是共价连接的VH::VL异二聚体，其可以从包括直接连接或通过肽编码接头连接的VH和VL编码序列的核酸表达。(参见例如，Huston等人(1988)Proc.Nat.Acad.Sci.USA,85:5879-5883，其全部内容通过引用并入本文)。存在许多结构用于将天然聚集但化学分离的轻和重多肽链从抗体V区转化scFv分子，该scFv分子将折叠成与抗原结合位点的结构基本上相似的三维结构。参见例如美国专利5,091,513和5,132,405和4,956,778。

术语“抗体”包括例如通过组合诱变和噬菌体展示产生的单克隆抗体、多克隆抗体、合成抗体和嵌合抗体。术语“抗体”还包括抗体的模拟物或拟肽。拟肽是基于或衍生自肽和蛋白质的化合物。本公开内容的拟肽通常可以通过使用非天然氨基酸、构象限制、等位置换等对已知肽序列进行结构修饰来获得。

等位基因：如本文所用，术语“等位基因”是指相同遗传基因座(例如，基因)的核苷酸序列的不同形式。

等位基因特异性引物延伸(ASPE)：如本文所用，术语“等位基因特异性引物延伸(ASPE)”是指利用引物的突变检测方法，该引物与相应DNA序列杂交并取决于这样的引物的3’末端核苷酸的成功杂交而延伸。通常，将具有与靶序列形成完美匹配的3'末端核苷酸的延伸引物延伸以形成延伸产物。可以将修饰的核苷酸掺入延伸产物中，这样的核苷酸有效地标记延伸产物以用于检测目的。或者，延伸引物可替代地包含与靶序列形成错配的3'末端核苷酸。在这种情况下，除非用于延伸的聚合酶无意中具有核酸外切酶活性，否则不会发生引物延伸。

扩增：如本文所用，术语“扩增”是指本领域已知的用于复制靶核酸，从而增加所选核酸序列的拷贝数的任何方法。扩增可以是指数的或线性的。靶核酸可以是DNA或RNA。通常，以这种方式扩增的序列形成“扩增子”。可以用各种方法来完成扩增，包括但不限于聚合酶链反应(“PCR”)、基于转录的扩增、等温扩增、滚环扩增等。可以使用引物对的相对相似量的每种引物进行扩增以产生双链扩增子。然而，如本领域中众所周知的，不对称PCR可用于主要地或专门地扩增单链产物(例如，Poddar,Molec.And Cell.Probes 14:25-32(2000))。这可以通过将相对于引物对中的一种引物显著降低另一种引物的浓度(例如，相差100倍)使用每对引物来实现。通过不对称PCR的扩增通常是线性的。本领域技术人员将理解可以一起使用不同的扩增方法。

动物：如本文所用，术语“动物”是指动物界的任何成员。在一些实施方案中，“动物”是指处于任何发育阶段的人类。在一些实施方案中，“动物”是指处于任何发育阶段的非人类动物。在某些实施方案中，非人类动物是哺乳动物(例如，啮齿动物、小鼠、大鼠、兔子、猴子、狗、猫、羊、牛、灵长类和/或猪)。在一些实施方案中，动物包括但不限于哺乳动物、鸟类、爬行动物、两栖动物、鱼、昆虫和/或蠕虫。在一些实施方案中，动物可以是转基因动物、遗传改造的动物和/或克隆。

大约：如本文所用，术语“大约”或“约”应用于一个或多个感兴趣的值时是指类似于所述参考值的值。在某些实施方案中，术语“大约”或“约”是指落入所述参考值的任一方向上(大于或小于)的25％、20％、19％、18％、17％、16％、15％、14％、13％、12％、11％、10％、9％、8％、7％、6％、5％、4％、3％、2％、1％或更小的范围内的值的范围，除非另有说明或从上下文中可以明显看出(除了该数字会超过可能值的100％之外)。因此，术语“约”用于表示值包括设备、用于确定该值的方法的固有误差变化，或样品之间存在的变化。

与感兴趣的综合征或疾病相关：如本文所用，“与感兴趣的综合征或疾病相关”是指与非综合征或非疾病对照相比，在具有感兴趣的综合征或疾病的患者中更多地发现该变异。通常，可以通过分析多个患者来确定这种关联的统计显著性。

生物样品：如本文所用，术语“生物样品”或“样品”涵盖从生物来源获得的任何样品。作为非限制性实例，生物样品可以包括血液、羊水、血清、血浆、液体或组织活检、尿液、粪便、表皮样品、皮肤样品、面颊拭子、精子、羊水、培养的细胞、骨髓样品和/或绒膜绒毛。方便的生物样品可以通过例如从颊腔表面刮下细胞而获得。术语生物样品包括已经被处理以释放或以其他方式使核酸或蛋白质可用于本文所述的检测的样品。术语生物样品还包括可存在于样品(例如血浆或羊水)中的无细胞核酸。例如，生物样品可以包括通过从生物样品中的细胞逆转录RNA获得的cDNA。生物样品可以从生命阶段例如胎儿、年轻人、成年人等获得。也可以使用固定或冷冻的组织。

生物标志物：如本文所用，术语“生物标志物”或“标志物”是指可用于诊断或帮助诊断或预后的感兴趣的疾病或综合征(单独地或与其他生物标志物组合)；监测感兴趣的疾病或综合征的进展；和/或监测感兴趣的综合征或疾病的治疗效果的一种或多种核酸、多肽和/或其他生物分子(例如胆固醇、脂质)。

结合剂：如本文所用，术语“结合剂”是指可以特异性地和选择性地结合至感兴趣的第二(即不同)分子的分子。该相互作用可以是非共价的，例如由于氢键、范德华相互作用或静电或疏水相互作用的结果，或者可以是共价的。术语“可溶性结合剂”是指不与固体支持物缔合(即共价或非共价结合)的结合剂。

携带者：术语“携带者”是指无症状但携带可以传递给他/她的孩子的突变的人。通常，对于常染色体隐性遗传疾病，携带者具有包含引起疾病的突变的一个等位基因和正常的或与疾病无关的另一个等位基因。

编码序列与非编码序列：如本文所用，术语“编码序列”是指可被转录和/或翻译以产生多肽或其片段和/或用于多肽或其片段的mRNA的核酸序列或其互补序列或其一部分。编码序列包括基因组DNA或未成熟的初级RNA转录物中的外显子，它们通过细胞的生化机制连接在一起以提供成熟的mRNA。反义链是这种核酸的互补序列，并且可以从其推导编码序列。如本文所用，术语“非编码序列”是指在体内不转录成氨基酸或tRNA不与其相互作用以放置或试图放置一个氨基酸的核酸序列或其互补序列或其一部分。非编码序列包括基因组DNA的内含子序列，或未成熟的初级RNA转录物，以及与基因相关的序列，例如启动子、增强子、沉默子等。

互补序列：如本文所用，术语“互补序列(complement)”、“互补(complementary)”和“互补性(complementarity)”是指根据Watson/Crick配对规则的核苷酸序列配对。例如，序列5'-GCGGTCCCA-3'具有5'-TGGGACCGC-3'的互补序列。互补序列也可以是与DNA序列互补的RNA序列。天然核酸中不常见的某些碱基可包括在互补核酸中，包括但不限于肌苷、7-脱氮鸟嘌呤、锁核酸(LNA)和肽核酸(PNA)。互补不一定是完美的；稳定的双链体可能包含不匹配的碱基对、变性或不匹配的碱基。核酸技术领域的技术人员可以根据经验在考虑多个变量的情况下确定双链体稳定性，这些变量包括例如寡核苷酸的长度、寡核苷酸的碱基组成和序列、离子强度和错配碱基对的发生率。

保守的：如本文所用，术语“保守的残基”是指在具有相同结构和/或功能的多种蛋白质中相同的氨基酸。保守残基的区域对于蛋白质结构或功能可能是重要的。因此，在三维蛋白质中鉴定出的连续保守残基对于蛋白质结构或功能可能很重要。为了找到3-D结构的保守残基或保守区域，可以对来自不同物种或相同物种的个体的相同或相似蛋白质的序列进行比较。

对照：如本文所用，术语“对照”具有其在本领域所理解的含义，即其是与结果进行比较的标准。通常，对照通过隔离变量来增加实验的完整性，以便得出关于此类变量的结论。在一些实施方案中，对照是与测试反应或测定同时进行以提供比较物的反应或测定。在一个实验中，(即正在测试的变量)应用于“测试”。在第二个实验中，正在测试的变量没有应用于“对照”。在一些实施方案中，对照是历史对照(即先前进行的测试或测定或先前已知的量或结果)。在一些实施方案中，对照是或包括打印的或以其他方式保存的记录。对照可以是阳性对照或阴性对照。

生物标志物的“对照”或“预定标准”是指健康受试者中生物标志物的表达水平或来自同一受试者的未患病或无症状的组织中所述生物标志物的表达水平。给定生物标志物的对照或预定标准表达水平或蛋白质的量可以通过仅使用常规实验的前瞻性和/或回顾性统计研究来确定。这样的预定标准表达水平和/或蛋白质水平(量)可以由本领域普通技术人员使用熟知的方法来确定。阳性对照是提供预定量的待测信号的样品(或试剂)。

粗制品：如本文所用，术语“粗制品”在与生物样品结合使用时是指基本上处于未精制状态的样品。例如，粗制样品可以是细胞裂解物或活检组织样品。粗制样品可能以溶液形式存在或以干制剂形式存在。

缺失：如本文所用，术语“缺失”涵盖从天然存在的核酸中去除一个或多个核苷酸的突变。

感兴趣的疾病或综合征：如本文所用，感兴趣的疾病或综合征是头颈癌，并且在一些实施方案中，更具体地是HNSCC。

检测：如本文所用，术语“检测”、“检测到”或“正在检测”包括“测量”、“测量到”或“正在测量”，反之亦然。

可检测的部分：如本文所用，术语“可检测的部分”或“可检测的生物分子”或“报道分子”是指可以在定量测定中测量的分子。例如，可检测的部分可包含可用于将底物转化为可测量的产物(例如，可见产物)的酶。或者，可检测的部分可以是可以定量的放射性同位素。或者，可检测的部分可以是荧光团。或者，可检测的部分可以是发光分子。或者，可以使用其他可检测的分子。

表观遗传：如本文所用，表观遗传元件可以通过不同于基础DNA序列变化的机制改变基因表达。这样的元件可以包括调节副突变、印记、基因沉默、X染色体失活、位置效应、重编程、转位、母体效应、组蛋白修饰和异染色质的元件。

表位：如本文所用，术语“表位”是指与特定抗体或抗体样蛋白质接触的分子或分子化合物(例如，多肽或蛋白质复合物)的片段或部分。

外显子：如本文所用，外显子是在RNA的其他部分(例如，称为内含子的中间区域)已通过RNA剪接除去后在成熟或加工的RNA中发现的核酸序列。这样，外显子序列通常蛋白质的一部分或编码蛋白质。内含子是通过RNA剪接从周围外显子序列中除去的RNA部分。

表达和表达的RNA：如本文所用，表达的RNA是编码蛋白质或多肽的RNA(“编码RNA”)，以及转录但未翻译的任何其他RNA(“非编码RNA”)。本文所用的术语“表达”是指从DNA产生多肽的过程。该过程涉及基因转录成mRNA和该mRNA翻译成多肽。取决于使用的上下文，“表达”可以指RNA、蛋白质或两者的产生。

可以通过用于检测转录分子或其相应蛋白质的表达的多种众所周知的方法中的任一种来评估本公开内容的蛋白质的量和/或生物标志物的表达的测量。此类方法的非限制性实例包括用于检测分泌的蛋白质的免疫学方法、蛋白质纯化方法、蛋白质功能或活性测定、核酸杂交方法、核酸逆转录方法和核酸扩增方法。在某些实施方案中，标志物基因的表达使用与对应于标志物基因的蛋白质(例如由对应于标志物基因的开放阅读框编码的蛋白质或已经历其全部或部分的正常翻译后修饰的此类蛋白质)特异性结合的抗体(例如，放射性标记的、发色团标记的、荧光团标记的或酶标记的抗体)、抗体衍生物(例如与底物或与蛋白质-配体对(例如生物素-链霉抗生物素蛋白)的蛋白质或配体缀合的抗体)或抗体片段(例如单链抗体、分离的抗体高变结构域等)来评估。在某些实施方案中，试剂可以直接或间接地用可检测的物质标记。可检测的物质可以例如选自放射性同位素、荧光化合物、酶和酶辅因子。标记抗体的方法是本领域众所周知的。

在另一个实施方案中，通过从样品中的细胞制备mRNA/cDNA(即转录的多核苷酸)，并且通过使mRNA/cDNA与作为包含标志物基因的多核苷酸的互补序列的参考多核苷酸及其片段杂交来评估标志物基因的表达。在与参考多核苷酸杂交之前，可以任选地使用多种聚合酶链反应方法中的任何一种来扩增cDNA；优选地，它不被扩增。

家族史：如本文所用，术语“家族史”通常是指与包括父母和兄弟姐妹在内的个体直系亲属成员相关的事件(例如疾病相关的病症或突变携带者)的发生。家族史也可能包括祖父母和其他亲戚。

侧接：如本文所用，术语“侧接”是指引物与在靶上与要扩增的感兴趣的区域邻接的靶核酸杂交。本领域技术人员将理解，优选的引物是在靶双链DNA分子的每条链上在感兴趣的区域的5'(上游)杂交的引物对，使得可以通过合适的DNA聚合酶将核苷酸添加至引物的3'端。例如，侧接突变序列的引物实际上不与突变序列退火，而是与邻接突变序列的序列退火。在一些情况下，侧接外显子的引物通常设计为不与外显子序列退火，而是与邻接外显子的序列(例如内含子序列)退火。但是，在一些情况下，扩增引物可设计为与外显子序列退火。

基因：如本文所用，基因是遗传单位。通常，基因是编码蛋白质或功能性RNA的DNA的一部分。基因是对应于遗传单位的基因组序列的可定位区域。基因可以与调节区、转录区和/或其他功能序列区相关。

基因型：如本文所用，术语“基因型”是指生物的遗传组成。更具体地，该术语是指个体中存在的等位基因的身份。个体或DNA样品的“基因分型”是指根据核苷酸碱基鉴定个体在已知多态性位点处具有的两个等位基因的性质。

基因调节元件：如本文所用，基因调节元件或调节序列是DNA的片段，其中诸如转录因子的调节蛋白结合以调节基因表达。这样的调节区域通常在被调节的基因的上游。

健康个体：如本文所用，术语“健康个体”或“对照”是指尚未被诊断患有感兴趣的综合征和/或疾病的受试者。

杂合子：如本文所用，术语“杂合子”或“HET”是指具有相同基因的两个不同等位基因的个体。如本文所用，术语“杂合子”涵盖“化合物杂合子”或“化合物杂合突变体”。如本文所用，术语“化合物杂合子”是指具有两个不同等位基因的个体。如本文所用，术语“化合物杂合突变体”是指具有等位基因的两个不同拷贝的个体，这样的等位基因被表征为基因的突变体形式。

纯合子：如本文所用，术语“纯合子”是指具有相同等位基因的两个拷贝的个体。如本文所用，术语“纯合突变体”是指具有相同等位基因的两个拷贝的个体，这样的等位基因被表征为基因的突变体形式。

管家或标准化基因：如本文所用，“管家基因”是通常在所有细胞中组成性表达的那些基因，因为它们提供维持所有细胞类型所需的基本功能。管家基因或“标准化基因”与感兴趣的基因同时进行测量，以考虑由于样品之间的差异而引起的差异。此类样品之间的差异可能反映了实验变量(例如但不限于RNA分离以及逆转录和PCR效率)的差异。标准化涉及报告感兴趣的基因与管家基因的比率。参见例如，Bustin,S.A.等人2009.The MIQEguidelines:minimum information for publication of quantitative real-time PCRexperiments.Clin Chem,Apr；55(4):611-622。

杂交：如本文所用，术语“杂交”或“杂交的”是指两个互补核酸链在适当严格的条件下彼此退火的过程。适用于杂交的寡核苷酸或探针的长度通常为10-100个核苷酸(例如长度为18-50、12-70、10-30、10-24、18-36个核苷酸)。核酸杂交技术是本领域众所周知的。本领域技术人员理解如何估计和调节杂交条件的严格性，使得具有至少所需水平的互补性的序列将稳定地杂交，而具有较低互补性的序列则不会。关于杂交条件和参数的例子，参见例如，Sambrook等人,1989,Molecular Cloning:A Laboratory Manual,Second Edition,Cold Spring Harbor Press,Plainview,N.Y.；Ausubel,F.M.等人.1994,CurrentProtocols in Molecular Biology.John Wiley&Sons,Secaucus,N.J.。

同一性或同一性百分比：如本文所用，术语“同一性”或“同一性百分比”是指两个氨基酸序列之间或两个核酸序列之间的序列同一性。同一性百分比可以通过比对两个序列来确定，并且是指比较的序列所共有的位置上相同残基(即氨基酸或核苷酸)的数目。序列比对和比较可以使用本领域中的算法标准(例如Smith and Waterman,1981,Adv.Appl.Math.2:482-489；Needleman and Wunsch,1970,J.Mol.Biol.48:443-453；Pearson and Lipman,1988,Proc.Natl.Acad.Sci.,USA,85:2444-2448)或通过这些算法的计算机化版本(Wisconsin Genetics Software Package Release 7.0,GeneticsComputer Group,575Science Drive,Madison,WI)(可作为BLAST和FASTA公开获得)进行。另外，可使用可通过美国国立卫生研究院(Bethesda MD)获得的ENTREZ用于序列比较。在其他情况下，可以使用商用软件(例如GenomeQuest)确定同一性百分比。当使用BLAST和Gapped BLAST程序时，可以使用各个程序的默认参数(例如，BLASTN；可在National Centerfor Biotechnology Information的因特网网站上获得)。在一个实施方案中，可以使用缺口权重为1的GCG确定两个序列的同一性百分比，使得每个氨基酸缺口被加权，就好像它是两个序列之间的单个氨基酸错配一样。或者，可以使用ALIGN程序(2.0版)，其是GCG(Accelrys,San Diego,CA)序列比对软件包的一部分。

如本文所使用的，术语“与其至少90％相同”包括与所指示的序列具有90至100％同一性的序列，并且包括其间的所有范围。因此，术语“与其至少90％相同”包括与所指示的序列91、91.5、92、92.5、93、93.5、94、94.5、95、95.5、96、96.5、97、97.5、98、98.5、99、99.5％相同的序列。类似地，术语“至少70％相同”包括70至100％相同的序列，包括其间的所有范围。使用本文描述的算法确定同一性百分比。

插入或添加：如本文所用，术语“插入”或“添加”是指氨基酸或核苷酸序列的变化，其导致与天然存在的分子相比分别地一个或多个氨基酸残基或核苷酸的添加。

体外：如本文所用，术语“体外”是指在人工环境中例如在试管或反应容器中、在细胞培养物中等而不是在多细胞生物中发生的事件。

体内：如本文所用，术语“体内”是指在多细胞生物例如人类或非人类动物中发生的事件。

分离的：如本文所用，术语“分离的”是指一种物质和/或实体，该物质和/或实体(1)与在最初生产时(无论是在自然界中和/或在实验环境中)与其相关联的至少某些组分分离，和/或(2)由人工生产、准备和/或制造。分离的物质和/或实体可以与最初与它们关联的其他组分的至少约10％、约20％、约30％、约40％、约50％、约60％、约70％、约80％、约90％、约95％、约98％、约99％、基本上100％或100％分离。在一些实施方案中，分离的试剂大于约80％、约85％、约90％、约91％、约92％、约93％、约94％、约95％、约96％、约97％、约98％、约99％、基本上100％或100％纯。如本文所用，如果一种物质基本上不含其他组分，则该物质是“纯的”。如本文所用，术语“分离的细胞”是指不包含在多细胞生物中的细胞。

标记的：术语“标记的”和“用可检测的试剂或部分标记的”在本文中可互换使用，以指定可通过例如在结合至另一实体(例如核酸，多肽等)之后检测标记(例如，可视化、检测放射性等)来测量实体(例如，核酸探针、抗体等)。可以选择可检测的试剂或部分以使得其产生可以被测量并且其强度与结合的实体的量相关(例如成比例)的信号。用于标记和/或检测蛋白质和肽的各种系统是本领域已知的。标记的蛋白质和肽可通过掺入或缀合可通过光谱、光化学、生物化学、免疫化学、电、光学、化学或其他方式检测的标记来制备。标记或标记部分可以直接检测(即其不需要任何进一步的反应或操作来检测，例如荧光团可直接检测)或其可以间接检测(即通过反应或与另一种可检测的实体结合以使其可检测)(例如，半抗原可通过与包含报道分子(例如荧光团)的适当抗体反应后进行免疫染色来检测)。合适的可检测的试剂包括但不限于放射性核苷酸、荧光团、化学发光剂、微粒、酶、比色标记、磁性标记、半抗原、分子信标、适体信标等。

微RNA：如本文所用，微RNA是这样的微RNA(miRNA)，其是短的(20-24个核苷酸)非编码RNA，其参与基因表达的转录后调节。微RNA可以影响mRNA的稳定性和翻译。例如，微RNA可以结合靶mRNA的3'UTR中的互补序列，并导致基因沉默。miRNA被RNA聚合酶II转录为封端的和聚腺苷酸化的初级转录物(pri-miRNA)的一部分，该转录物可以是编码蛋白质的也可以是非编码的。初级转录物可以被Drosha核糖核酸酶III酶切割以产生约70个核苷酸的茎环前体miRNA(pre-miRNA)，然后其可以被细胞质Dicer核糖核酸酶切割以生成成熟的miRNA和反义miRNA星(miRNA*)产物。可以将成熟的miRNA掺入RNA诱导的沉默复合物(RISC)中，该复合物可以通过与miRNA的不完美碱基配对来识别靶mRNA，并且最常见地导致靶mRNA的翻译抑制或不稳定。

多重PCR：如本文所用，术语“多重PCR”是指同时扩增两个或更多个区域，每个区域使用不同的引物对引发。

多重ASPE：如本文所用，术语“多重ASPE”是指结合多重PCR和等位基因特异性引物延伸(ASPE)以检测多态性的测定。通常，多重PCR首先用于扩增将用作ASPE引物的靶序列的DNA区域。参见等位基因特异性引物延伸的定义。

突变和/或变体：如本文所用，术语突变和变体可互换使用，以描述核酸或蛋白质序列的变化。如本文所用，术语“突变体”是指基因的突变或潜在的非功能形式。

核酸：如本文所用，“核酸”是多核苷酸，例如脱氧核糖核酸(DNA)或核糖核酸(RNA)。该术语用于包括单链核酸、双链核酸以及由核苷酸或核苷类似物制成的RNA和DNA。

获得(obtain)或获取(obtaining)：如本文所用，术语“获得”或“获取”包括直接或间接接收(即从第三方)取得。

多肽或蛋白质：如本文所用，术语“多肽”和/或“蛋白质”是指氨基酸的聚合物，而不是指特定的长度。因此，在多肽和/或蛋白质的定义内包括肽、寡肽和蛋白质。“多肽”和“蛋白质”在本文可互换使用，以描述可包含部分或全长蛋白质的蛋白质分子。除非上下文另外指出，否则术语“肽”用于表示小于全长的蛋白质或非常短的蛋白质。

如本领域已知，“蛋白质”、“肽”、“多肽”和“寡肽”是氨基酸(通常为L-氨基酸)的链，其α碳通过由一个氨基酸的α碳的羧基和另一个氨基酸的α碳的氨基之间的缩合反应形成的肽键连接。通常，组成蛋白质的氨基酸按顺序编号，从氨基末端残基开始，并朝着蛋白质的羧基末端残基的方向增加。氨基酸残基的缩写是本领域中用来指代20种常见L-氨基酸之一的标准3字母和/或1字母代码。

如本文所用，多肽或蛋白质的“结构域”包括沿着多肽或蛋白质的包含独立单元的区域。可以根据结构、序列和/或生物学活性来定义结构域。在一个实施方案中，多肽结构域可包含以基本上独立于蛋白质的其余部分的方式折叠的蛋白质区域。可以使用结构域数据库(例如但不限于PFAM、PRODOM、PROSITE、BLOCKS、PRINTS、SBASE、ISREC PROFILES、SAMRT和PROCLASS)来鉴定结构域。

引物：如本文所用，术语“引物”是指能够与核酸样品中的互补序列杂交的短的单链寡核苷酸。通常，引物用作模板依赖性DNA合成的起始点。脱氧核糖核苷酸可以通过DNA聚合酶添加至引物。在一些实施方案中，将此类脱氧核糖核苷酸添加至引物也称为引物延伸。如本文所用，术语引物包括可以合成的所有形式的引物，包括肽核酸引物、锁核酸引物、硫代磷酸酯修饰的引物、标记的引物等。用于PCR反应的“引物对”或“引物组”通常是指通常包括“正向引物”和“反向引物”的引物组。如本文所用，“正向引物”是指与dsDNA的反义链退火的引物。“反向引物”与dsDNA的有义链退火。

多态性：如本文所用，术语“多态性”是指多于一种形式的基因或其部分的共存。

部分和片段：如本文所用，术语“部分”和“片段”可互换使用，是指多肽、核酸或其他分子构建体的部分。

样品：如本文所用，术语“样品”是指获自个体或受试者或患者的材料。样品可以来自任何生物来源，包括所有体液(例如全血、血浆、血清、唾液、眼晶状体液、汗液、尿液、奶等)、组织或提取物、细胞、无细胞核酸、福尔马林固定的石蜡包埋(FFPE)组织等。

有义链与反义链：如本文所用，术语“有义链”是指双链DNA(dsDNA)的链，其包含功能性蛋白质的编码序列的至少一部分。如本文所用，术语“反义链”是指dsDNA的这样的链，其是有义链的反向互补序列。

显著差异：如本文所用，术语“显著差异”完全在本领域技术人员的知识范围内，并且将参照每种特定的生物标志物凭经验确定。例如，与健康受试者相比，在具有感兴趣的疾病或综合征的受试者中生物标志物表达的显著差异是蛋白质量的统计学上显著的任何差异。

相似或同源物：如本文所用，术语“相似”或“同源物”在指氨基酸或核苷酸序列时是指与野生型氨基酸序列具有一定程度的同源性或同一性的多肽。同源性比较可以通过眼睛进行，或更通常地，借助于容易获得的序列比较程序进行。这些可商购的计算机程序可以计算两个或更多个序列之间的同源性百分比(例如，Wilbur,W.J.and Lipman,D.J.,1983,Proc.Natl.Acad.Sci.USA,80:726-730)。例如，同源序列可以被认为包括这样的氨基酸序列，其在替代实施方案中彼此至少70％相同，75％相同，80％相同，85％相同，90％相同，95％相同，97％相同或完全相同98％。

特异性：如本文所用，术语“特异性”当与寡核苷酸引物结合使用时是指寡核苷酸或引物在适当的杂交或洗涤条件下能够与感兴趣的靶标杂交而基本上不与不感兴趣的核酸杂交。较高水平的序列同一性是优选的，并且包括至少60％、65％、70％、75％、80％、85％、90％、95％、98％、99％或100％序列同一性。在一些实施方案中，当比对寡核苷酸和核酸时，特异性寡核苷酸或引物包含与待杂交或扩增的核酸的一部分具有至少4、6、8、10、12、14、16、18、20、22、24、26、28、30、35、40、45、50、55、60、65、70或更多个碱基的序列同一性。

如本领域中已知的，核酸序列彼此杂交的条件可以描述为从低到高严格性。通常，高度严格的杂交条件是指在高温下在低盐缓冲液中洗涤杂交体。杂交可以使用本领域标准的杂交溶液(例如0.5M NaHPO₄、7％十二烷基硫酸钠(SDS))在65℃过滤结合的DNA，然后在0.25M NaHPO₄、3.5％SDS中洗涤，然后取决于探针的长度在室温到68℃的温度范围下洗涤0.1x SSC/0.1％SDS(参见例如Ausubel,F.M.等人,Short Protocols in MolecularBiology,4^th Ed.,Chapter 2,John Wiley&Sons,N.Y)。例如，高严格度洗涤包括用6x SSC/0.05％焦磷酸钠在37℃下洗涤14个碱基的寡核苷酸探针，或在48℃下洗涤17个碱基的寡核苷酸探针，或在55℃下洗涤20个碱基的寡核苷酸探针，或在60℃下洗涤25个碱基的寡核苷酸探针，或在65℃下洗涤长约250个核苷酸的核苷酸探针。核酸探针可以通过例如用[γ-³²P]ATP进行末端标记来用放射性核苷酸标记，或者可以通过随机引物标记掺入放射性标记的核苷酸例如[α-³²P]dCTP。或者，可以通过掺入生物素化的或荧光素标记的核苷酸来标记探针，并使用链霉抗生物素蛋白或抗荧光素抗体检测探针。

siRNA：如本文所用，siRNA(小抑制性RNA)本质上是由约20个互补核苷酸组成的双链RNA分子。siRNA是由较大的双链(ds)RNA分子的分解产生的。siRNA可以通过siRNA与mRNA的相互作用将其对应的mRNA固有地分为两部分来抑制基因表达，从而导致mRNA降解。siRNA也可以与DNA相互作用，以促进染色质沉默和异染色质的扩增。

受试者：如本文所用，术语“受试者”是指人类或任何非人类动物。受试者可以是患者，其是指向医疗提供者提出诊断或治疗疾病的人。人类包括产前和产后形式。同样，如本文所用，术语“个体”、“受试者”或“患者”包括所有温血动物。在一个实施方案中，受试者是人。在一个实施方案中，个体是具有增加的发展HNSCC的风险的受试者。

基本上：如本文所用，术语“基本上”是指展现出感兴趣的特征或特性的全部或接近全部范围或程度的定性条件。生物学领域的普通技术人员将理解，生物学和化学现象很少(如果有的话)达到完全和/或继续直至完全或实现或避免绝对结果。因此，在本文中使用术语“基本上”来捕获许多生物学和化学现象中固有的完全性的潜在缺失。

基本上互补：如本文所用，术语“基本上互补”是指可以在严格杂交条件下杂交的两个序列。本领域技术人员将理解，基本上互补的序列不需要沿其整个长度杂交。在一些实施方案中，“严格杂交条件”是指至少如下严格的杂交条件：在50％甲酰胺、5XSSC、50mMNaH₂PO₄、pH 6.8、0.5％SDS、0.1mg/mL超声处理的鲑鱼精DNA和5XDenhart溶液中在42℃下杂交过夜；在45℃下用2XSSC、0.1％SDS洗涤；并在45℃下用0.2XSSC、0.1％SDS洗涤。在一些实施方案中，严格的杂交条件不应允许在一段20个连续核苷酸上差异超过两个碱基的两个核酸的杂交。

取代：如本文所用，术语“取代”是指与天然分子相比，一个或多个氨基酸或核苷酸分别被不同的氨基酸或核苷酸取代。

患有：“患有”疾病、病症和/或病状的个体已被诊断出患有该疾病、病症和/或病状或表现该疾病出、病症和/或病状的一种或多种症状。

易患：“易患”疾病、病症和/或病状的个体尚未被诊断出患有该疾病、病症和/或病状。在一些实施方案中，易患疾病、病症和/或病状的个体可能不表现出该疾病、病症和/或病状的症状。在一些实施方案中，易患疾病、病症和/或病状的个体将发展该疾病、病症和/或病状。在一些实施方案中，易患疾病、病症和/或病状的个体将不会发展该疾病、病症和/或病状。

固体支持物：术语“固体支持物”是指提供在其上可结合生物分子的基底的结构。例如，固体支持物可以是测定孔(例如，微量滴定板)，或者固体支持物可以是阵列上的位置，或者可以是移动性支持物，例如珠。

上游和下游：如本文所用，术语“上游”是指在分子是蛋白质的情况下在第二残基的N末端或在分子是核酸的情况下在第二残基的5′的残基。同样如本文所用，术语“下游”是指在分子是蛋白质的情况下在第二残基的C-末端或在分子是核酸的情况下在第二残基的3′的残基。本文公开的蛋白质、多肽和肽序列均从N末端氨基酸至C末端酸列出，本文公开的核酸序列均从分子的5'端至分子的3'端列出。

概览

本文的公开内容提供了在某些基因中鉴定的与感兴趣的疾病和/或综合征相关并且可用于更准确地诊断与感兴趣的基因和/或综合征相关的疾病的新颖突变。

在一些实施方案中，样品包含核酸。在一些实施方案中，测试步骤包括核酸测序。在一些实施方案中，测试步骤包括杂交。在一些实施方案中，使用对感兴趣的生物标志物中的区域具有特异性的一种或多种寡核苷酸探针进行杂交。在一些实施方案中，为了检测突变，在足够严格以不允许单核苷酸错配的条件下进行杂交。在一些实施方案中，用微阵列进行杂交。在一些实施方案中，测试步骤包括限制酶消化。在一些实施方案中，测试步骤包括PCR扩增。在一些实施方案中，测试步骤包括逆转录酶PCR(rtPCR)。在一些实施方案中，PCR扩增是数字PCR扩增。在一些实施方案中，测试步骤包括引物延伸。在一些实施方案中，引物延伸是单碱基引物延伸。在一些实施方案中，测试步骤包括进行多重等位基因特异性引物延伸(ASPE)。

在一些实施方案中，样品包含蛋白质。在一些实施方案中，测试步骤包括氨基酸测序。在一些实施方案中，测试步骤包括使用一种或多种特异性识别感兴趣的生物标志物的抗体进行免疫测定。在一些实施方案中，测试步骤包括蛋白酶消化(例如，胰蛋白酶消化)。在一些实施方案中，测试步骤还包括进行2D凝胶电泳。

在一些实施方案中，测试步骤包括使用质谱法确定一种或多种生物标志物的存在。在一些实施方案中，质谱形式选自矩阵辅助激光解吸/电离、飞行时间(MALDI-TOF)、电喷雾(ES)、IR-MALDI、离子回旋共振(ICR)、傅立叶变换及其组合。

在一些实施方案中，样品获自细胞、组织(例如，FFPE组织)、全血、漱口水、血浆、血清、尿液、粪便、唾液、脐带血、绒膜绒毛样品、绒膜绒毛样品培养物、羊水、羊水培养物、经宫颈灌洗液或其组合。在某些情况下，样品可以是液体或组织活检。在一些实施方案中，样品包含可存在于诸如血液、血浆、血清或羊水的生物样品中的无细胞核酸(例如，DNA)。

在一些实施方案中，测试步骤包括确定生物标志物中预定位置处的核苷酸和/或氨基酸的身份。在一些实施方案中，通过将预定位置处的核苷酸和/或氨基酸的身份与对照进行比较来确定突变的存在。

在实施方案中，方法可以包括在多个个体中进行测定(例如，核酸测序)以确定关联的统计显著性。

在另一方面，本公开内容提供了用于检测感兴趣的生物标志物的试剂，例如但不限于与生物标志物(例如，DNA序列、mRNA、蛋白质中的突变)特异性结合的核酸探针或包含与生物标志物特异性结合的一种或多种探针的阵列。在一些实施方案中，本公开内容提供了与生物标志物特异性结合的抗体。在一些实施方案中，本公开内容提供了用于包含一种或多种这样的试剂的试剂盒。在一些实施方案中，一种或多种试剂以微阵列的形式提供。在一些实施方案中，试剂盒进一步包含用于引物延伸的试剂。在一些实施方案中，试剂盒还包含指示健康个体的对照。在一些实施方案中，试剂盒进一步包含关于如何基于感兴趣的生物标志物确定个体是否患有感兴趣的综合征或疾病的说明书。

在某些情况下，在某些实施方案中，可以通过以下方法检测一种或多种生物标志物的量：(a)检测由所述一种或多种生物标志物调节的多肽或蛋白质的量；(b)检测调节所述生物标志物的多肽或蛋白质的量；或(c)检测生物标志物的代谢物的量。

在另一方面，本文的公开内容提供了编码对应生物标志物的检测的信息的计算机可读介质。

用于诊断HNSCC的方法和组合物

本公开内容的实施方案包括用于诊断HNSCC的存在或发展HNSCC的增加的风险的组合物和方法。本公开内容的方法和组合物可用于从受试者获得或提供遗传信息，以便客观地诊断该受试者或其他受试者的HNSCC的存在或发展HNSCC的增加的风险。该方法和组合物可以以多种方式体现。

在一个实施方案中，公开了一种检测个体中与头颈鳞状细胞癌(HNSCC)相关的生物标志物的方法，该方法包括以下步骤：从所述个体获得样品；以及测量样品中表4和/或表6中的至少一种基因的表达的量。在一个实施方案中，公开了一种检测个体中与HNSCC相关的生物标志物的方法，其包括以下步骤：从所述个体获得样品；并测量样品中的以下基因中的至少一种的表达的量：CAB39L、ADAM12、SH3BGRL2、NRG2、COL13A1、GRIN2D、LOXL2 KRT4、EMP1和HSD17B6。在一个实施方案中，公开了一种检测个体中与HNSCC相关的生物标志物的方法，其包括以下步骤：从所述个体获得样品；以及测量人乳头瘤病毒(HPV)E6或E7基因中的至少一种的表达的量。或者可以评估基因的各种组合。在某些实施方案中，可以将这些基因中任何一个的测量的表达与对照值进行比较。在各种实施方案中，个体中的基因表达与对照值之间的差异表明该个体可能具有(即诊断出HNSCC的存在)或易于发展(即患HNSCC的风险增加)HNSCC。对照值可以来自正常(非癌组织)的一个或多个样品，也可以来自正常(非癌)人群。另外和/或可替代地，该方法可以包括测量至少一种标准化基因(例如管家基因)。在一个实施方案中，标准化基因可以是KHDRBS1。在其他实施方案中，可以使用RPL30或其他标准化基因。

另外和/或可替代地，公开了一种检测个体中对头颈鳞状细胞癌(HNSCC)的易感性的方法，包括：从所述个体获得样品；以及测量样品中来自包含表4和/或表6中的基因的至少一种的基因的表达产物的量；并将样品中表4和/或表6中的至少一种基因的表达与表达的对照值进行比较。在各种实施方案中，个体中的基因表达与对照值之间的差异表明该个体可能具有(即诊断出HNSCC的存在)或易于发展(即患HNSCC的风险增加)HNSCC。对照值可以来自正常(非癌组织)的一个或多个样品，也可以来自正常(非癌)人群。另外和/或可替代地，该方法可以包括测量至少一种标准化基因(例如管家基因)。在一个实施方案中，标准化基因可以是KHDRBS1。在其他实施方案中，可以使用RPL30或其他标准化基因。

另外和/或可替代地，公开了一种检测个体中对HNSCC的易感性的方法，该方法包括：从所述个体获得样品；测量样品中来自包含CAB39L、ADAM12、SH3BGRL2、NRG2、COL13A1、GRIN2D、LOXL2、KRT4、EMP1或HSD17B6中的至少一种的至少一种基因的至少一种表达产物的量；并将样品中CAB39L、ADAM12、SH3BGRL2、NRG2、COL13A1、GRIN2D、LOXL2、KRT4、EMP1或HSD17B6中的至少一种的表达与CAB39L、ADAM12、SH3BGRL2、NRG2、COL13A1、GRIN2D、LOXL2、KRT4、EMP1或HSD17B6各自的表达的对照值进行比较。另外和/或可替代地，公开了一种检测个体中对HNSCC的易感性的方法，该方法包括：从所述个体获得样品；测量样品中来自包含HPV E6和/或HPV E7中的至少一种的基因的至少一种表达产物的量；并将样品中的至少一种HPV E6和/或HPV E7表达产物的表达与HPV E6和/或HPV E7各自的表达的对照值进行比较。在各种实施方案中，个体中的基因表达与对照值之间的差异表明该个体可能具有(即诊断出HNSCC的存在)或易于发展(即患HNSCC的风险增加)HNSCC。对照值可以来自正常(非癌组织)的一个或多个样品，也可以来自正常(非癌)人群。另外和/或可替代地，该方法可以包括测量至少一种标准化基因(例如管家基因)。在一个实施方案中，标准化基因可以是KHDRBS1。在其他实施方案中，可以使用RPL30或其他标准化基因。

在某些实施方案中，所述测量包括测量RNA(例如，mRNA)。或者，该测量可以包括免疫测定。

在某些情况下，增加生物标志物的数量可以提高该方法的统计能力。例如，在某些实施方案中，该方法可以包括测量至少两个、三个、四个、五个或更多个生物标志物的表达。在某些情况下，至少测量四个生物标志物。

可以分析多种样品。在某些实施方案中，样品包括血清、血浆、唾液或组织(例如FFPE组织)。

所公开的方法还包括在个体中鉴定与头颈鳞状细胞癌(HNSCC)相关的标志物的方法，该方法包括：鉴定与正常对照相比在HNSCC中而非在HNSCC疾病中表达增加或减少的至少一种标志物。如本文所公开的，这样的方法可以包括对标志物的统计评估，所述标志物与正常组织相比在HNSCC中显示差异表达。或者，所述方法可以包括基于其他生物学标准(例如，突变的基因、拷贝数差异和易位、DNA甲基化和/或微RNA)与正常人相比区分HNSCC的生物标志物。或者可以评估生物标志物的其他生物学方面。

如本文所公开的，可以使用各种方法来测量感兴趣的生物标志物。在一个实施方案中，所述测量包括mRNA的测量。在一个实施方案中，所述测量包括测量肽或多肽生物标志物。例如，在一个实施方案中，所述测量包括免疫测定。或者，该测量可以包括流式细胞术。或者，如本文详细讨论的，可以使用核酸方法。

在其他实施方案中，公开了治疗HNSCC的方法。该治疗方法可以包括：从个体获得样品；以及测量样品中来自包含表4和/或表6中的至少一种基因的基因的表达产物的量；比较样品中表4和/或表6中的至少一种基因的表达与表达的对照值；当个体中的基因表达与对照值之间的差异表明该个体可能具有(即诊断HNSCC的存在)或易于发展(即患HNSCC的风险增加)HNSCC时，对该个体进行HNSCC的治疗。对照值可以来自正常(非癌组织)的一个或多个样品，也可以来自正常(非癌)人群。另外和/或可替代地，该方法可以包括测量至少一种标准化基因(例如管家基因)。在一个实施方案中，标准化基因可以是KHDRBS1。在其他实施方案中，可以使用RPL30或其他标准化基因。

例如，在某些实施方案中，治疗方法可包括：从个体获得样品；测量样品中来自包含CAB39L、ADAM12、SH3BGRL2、NRG2、COL13A1、GRIN2D、LOXL2、KRT4、EMP1或HSD17B6中的至少一种的至少一种基因的至少一种表达产物的量；将样品中CAB39L、ADAM12、SH3BGRL2、NRG2、COL13A1、GRIN2D、LOXL2、KRT4、EMP1或HSD17B6中的至少一种的表达CAB39L、ADAM12、SH3BGRL2、NRG2、COL13A1、GRIN2D、LOXL2、KRT4、EMP1或HSD17B6各自的表达的对照值进行比较；当个体中的基因表达与对照值之间的差异表明该个体可能具有(即诊断出HNSCC的存在)或易于发展(即患HNSCC的风险增加)HNSCC时，对该个体进行HNSCC的治疗。

该治疗方法可以进一步包括测量样品中来自包含HPV E6和/或HPV E7中的至少一种的基因的至少一种表达产物的量；和将样品中的至少一种HPV E6和/或HPV E7表达产物的表达与HPV E6和/或HPV E7各自的表达的对照值进行比较；当个体中的基因表达与对照值之间的差异表明该个体可能具有(即诊断出HNSCC的存在)或易于发展(即患HNSCC的风险增加)HNSCC时，对该个体进行HNSCC的治疗。

在治疗方法的各种实施方案中，对照值可以来自正常(非癌组织)的一个或多个样品或来源于正常(非癌)群体。另外和/或可替代地，该方法可以包括测量至少一种标准化基因(例如管家基因)。在一个实施方案中，标准化基因可以是KHDRBS1。在其他实施方案中，可以使用RPL30或其他标准化基因。

如上所述，其他实施方案包括用于检测个体中与HNSCC相关的生物标志物的组合物。在某些实施方案中，组合物包含定量生物样品中的至少一种公开的生物标志物水平的试剂。例如，如本文详细描述的，所述组合物可以包含用于测量mRNA的试剂。或者该组合物可以包含用于测量肽或多肽生物标志物的试剂。在一个实施方案中，该组合物包含进行免疫测定的试剂。或者，该组合物可以包含进行流式细胞术的试剂。或者，如本文中详细讨论的，所述组合物可以包含用于确定特定序列的存在和/或核酸的表达水平的试剂。如本文详细描述的，试剂可以用可检测的部分标记。

因此，本公开内容的其他方面包括用于检测个体中与HNSCC相关的生物标志物的组合物，所述组合物包含定量表4和/或表6的基因中的至少一种的表达水平的试剂。本公开内容的方面包括用于检测个体中与HNSCC相关的生物标志物的组合物，所述组合物包含定量CAB39L、ADAM12、SH3BGRL2、NRG2、COL13A1、GRIN2D、LOXL2、KRT4、EMP1或HSD17B6中的至少一种的表达水平的试剂。另外和/或可替代地，本公开内容的方面包括用于检测个体中与HNSCC相关的生物标志物的组合物，该组合物包括定量HPV E6和/或HPV E7中的至少一种的表达水平的试剂。另外和/或可替代地，该组合物可以包含用于检测至少一种标准化基因(例如管家基因)的试剂。在一个实施方案中，标准化基因可以是KHDRBS1。在其他实施方案中，可以使用RPL30或其他标准化基因。例如，在一些实施方案中，试剂检测mRNA。或者，试剂可以检测蛋白质。

因此，在某些实施方案中，组合物可以包含用于这些基因中的任何一种的引物(例如，引物对)和/或探针，其中所述引物和/或探针用本文所述的可检测的部分标记。另外和/或可替代地，引物和/或探针还可以包含其中引物和/或探针固定在表面上的阵列。在其他实施方案中，试剂可以包括用于测量从公开的基因表达的肽和/或蛋白质的试剂。例如，组合物可以包含进行免疫测定的试剂。在一些实施方案中，这些试剂可包含如本文详细描述的阵列。如本文详细描述的，试剂可以用可检测的部分标记。

其他实施方案包括用于执行本文公开的方法和/或使用本文所述的组合物的系统。例如，本公开内容的其他方面包括含有本公开内容的组合物或用于执行本公开内容的方法的试剂盒。例如，其他实施方案包括包含至少一些本文公开的组合物和/或用于执行本文公开的方法的试剂的系统，例如试剂盒。这样的系统或试剂盒可以包括计算机可读介质，该计算机可读介质包含用于执行本公开内容的方法和/或使用本公开内容的组合物的说明书和/或其他信息。

多种样品类型可用于本文公开的任何方法、组合物或系统。在某些实施方案中，样品包括血清、血浆、唾液或组织(例如FFPE组织)。或者可以使用其他样品类型。

肽、多肽和蛋白质测定

在某些实施方案中，在蛋白质水平(或肽或多肽水平)上检测感兴趣的生物标志物，即分析基因产物。例如，可以通过氨基酸测序方法或使用一种或多种特异性识别感兴趣的生物标志物上存在的一种或多种表位或在某些情况下对感兴趣的突变具有特异性的抗体的免疫测定来对蛋白质或其片段进行分析。还可以通过蛋白酶消化(例如，胰蛋白酶消化)来分析蛋白质，并且在一些实施方案中，可以通过2D凝胶电泳来进一步分析消化的蛋白质产物。

基于抗体的检测方法

可以在本领域已知的多种方法中的任何一种中使用识别感兴趣的生物标志物的特异性抗体。可以使用本领域中多种已知方法中的任何一种来产生针对特定表位、多肽和/或蛋白质的抗体。例如，可以产生所需抗体的表位、多肽或蛋白质，并将其注射入动物，通常是哺乳动物(例如驴、小鼠、兔、马、鸡等)，并且可以从动物收集由动物产生的抗体。单克隆抗体也可以通过产生表达感兴趣的抗体的与永生细胞系的杂交瘤来产生。

在一些实施方案中，抗体用本文所述的可检测的部分标记。

抗体检测方法是本领域众所周知的，包括但不限于酶联免疫吸附测定(ELISA)和蛋白质印迹。一些这样的方法适合于以阵列形式执行。

例如，在一些实施方案中，使用特异性识别生物标志物的第一抗体(或抗体片段)来检测感兴趣的生物标志物。抗体可以用可检测的部分(例如化学发光分子)、酶或第二结合剂(例如链霉抗生物素蛋白)标记。或者，如本领域中已知的，可以使用第二抗体来检测第一抗体。

在某些实施方案中，该方法可以进一步包括添加捕获支持物，该捕获支持物包含至少一种识别并结合生物标志物以将生物标志物固定在捕获支持物上的捕获支持物结合剂。在某些实施方案中，该方法可以进一步包括添加第二结合剂，其可以特异性地识别并结合捕获支持物上的多种结合剂分子和/或生物标志物中的至少一些。在一个实施方案中，可以特异性识别并结合多种结合剂分子和/或捕获支持物上的生物标志物中的至少一些的结合剂是可溶性结合剂(例如，第二抗体)。第二结合剂可以被标记(例如，用酶)，从而通过添加酶的底物并定量形成的产物的量来测量感兴趣的生物标志物的结合。

在一个实施方案中，捕获固体支持物可以是测定孔(即例如微量滴定板)。或者，捕获固体支持物可以是阵列上的位置，或可移动的支持物，例如珠。或者捕获支持物可以是过滤器。

在某些情况下，可以使生物标志物与第一结合剂(例如，对生物标志物具有特异性并用可检测的部分标记的第一抗体)和第二结合剂(例如，识别第一抗体或第二种第一抗体的第二抗体)复合，其中第二结合剂与第三结合剂(例如生物素)复合，第三结合剂然后可以与具有连接到捕获支持物的识别第三结合剂的试剂(例如链霉抗生物素蛋白)的捕获支持物(例如磁珠)相互作用。然后可以使用磁体(例如，磁性探针)捕获复合物(标记的第一抗体：生物标志物：第二种第一抗体-生物素：链霉抗生物素蛋白-珠)以测量复合物的量。

在本公开内容的方法中可以使用各种结合剂。例如，附着于捕获支持物的结合剂或第二抗体可以是识别生物标志物的抗体或抗体片段。或者，结合剂可包含结合非蛋白质靶的蛋白质(即诸如特异性结合小分子生物标志物的蛋白质或结合蛋白质的受体)。

在某些实施方案中，固体支持物可以用钝化剂处理。例如，在某些实施方案中，感兴趣的生物标志物可以被捕获在钝化的表面(即已经被处理以减少非特异性结合的表面)上。一种这样的钝化剂是BSA。另外和/或可替代地，在使用的结合剂是抗体的情况下，固体支持物可以用蛋白A、蛋白G、蛋白A/G、蛋白L或与结合剂(例如，抗体)以高亲和力结合的另一种试剂包被。这些蛋白质结合抗体的Fc结构域，因此可以定向识别感兴趣的一种或多种蛋白质的抗体的结合。

核酸测定

在某些实施方案中，在核酸水平上检测本文公开的生物标志物。在一个实施方案中，本公开内容包括用于诊断受试者中感兴趣的综合征或疾病(例如，HNSCC)的存在或发展感兴趣的综合征或疾病(例如，HNSCC)的增加的风险的方法。

该方法可以包括以下步骤：从受试者的组织或体液样品中获得核酸，并进行测定以鉴定是否存在感兴趣的基因的过表达。例如，某些基因产物的过表达可以使用逆转录酶PCR(RT-PCR)来定量。或者，可以使用液滴数字PCR(ddPCR)。

或者，该方法可以包括以下步骤：从受试者的组织或体液样品中获得核酸，并进行测定以鉴定受试者的核酸中是否存在变异序列(即突变)。在某些实施方案中，该方法可以包括将变异与已知与感兴趣的综合征或疾病相关的变异进行比较，并确定该变异是否是先前已被鉴定为与感兴趣的综合征或疾病相关的变异。或者，该方法可以包括将变异鉴定为新的先前未表征的变异。如果变异是新的变异，则该方法可以进一步包括进行分析以确定突变是否预期对基因的表达和/或该基因编码的蛋白质的功能有害。该方法可以进一步包括使用变异概况(即在受试者中鉴定的突变的汇编)来诊断感兴趣的综合征或疾病的存在或发展感兴趣的综合征或疾病的增加的风险。

可以对基因组DNA、信使RNA和/或cDNA进行核酸分析。同样，在各种实施方案中，核酸包括基因、RNA、外显子、内含子、基因调节元件、表达的RNA、siRNA或表观遗传元件。此外，可以评估调节元件包括剪接位点、转录因子结合、A-I编辑位点、微RNA结合位点和功能性RNA结构位点的突变(即变体)。因此，对于本公开内容的每种方法和组合物，变体可包含涵盖以下中的至少一种的核酸序列：(1)A至I编辑位点；(2)剪接位点；(3)保守的功能性RNA结构；(4)经验证的转录因子结合位点(TFBS)；(5)微RNA(miRNA)结合位点；(6)聚腺苷酸化位点；(7)已知的调节元件；(8)miRNA基因；(9)在ROI中编码的小核仁RNA基因；和/或(10)在胎盘哺乳动物中超保守的元件。

在许多实施方案中，核酸是从生物样品中提取的。在一些实施方案中，在没有扩增的情况下分析核酸。在一些实施方案中，使用本领域已知的技术扩增核酸(例如产生使用聚合酶链反应(PCR)扩增的cDNA)，并且扩增的核酸用于随后的分析。可以使用多重PCR，其中使用多组引物对一次扩增几个扩增子(例如，来自不同基因组区域)。例如，可以通过测序、杂交、PCR扩增、限制酶消化、引物延伸(例如单碱基引物延伸或多重等位基因特异性引物延伸(ASPE))或DNA测序来分析核酸。在一些实施方案中，以使得野生型等位基因的扩增产物在大小上与突变等位基因的扩增产物不同的方式扩增核酸。因此，可以通过例如在电泳凝胶上检测扩增产物的大小差异来确定是否存在特定突变等位基因。例如，基因区域的缺失或插入可能特别适合于使用基于大小的方法。

某些示例性核酸分析方法在下面详细描述。

mRNA分析

在某些实施方案中，使用本领域已知的方法和/或市售试剂和/或试剂盒，使用实时和/或逆转录酶PCR分析mRNA。“实时PCR”或rPCR是一种用于检测和测量在PCR的每个循环中生成的产物的方法，这些产物与PCR开始之前的模板核酸的数量成比例。所获得的信息例如扩增曲线可以用于确定靶核酸的存在和/或定量靶核酸序列的初始量。术语“实时PCR”用于表示PCR技术的一个子集，其允许在PCR反应的整个过程中或实时地检测PCR产物。

在一些实例中，rPCR是实时逆转录酶(RT)PCR(rRT-PCR)。或者可以使用液滴数字PCR。当起始材料是RNA和/或mRNA时，使用逆转录酶PCR。RNA首先通过逆转录酶转录为互补DNA(cDNA)。在rRT-PCR中，然后将cDNA用作qPCR反应的模板。rRT-PCR可以以一步法进行，其将逆转录和PCR结合在一个试管和缓冲液中，同时使用逆转录酶和DNA聚合酶。在一步rRT-PCR中，使用序列特异性靶标扩增RNA和DNA靶标。术语“定量PCR”涵盖允许对最初存在的靶核酸序列进行定量或半定量测定的所有基于PCR的技术。

实时PCR(rPCR)的原理通常在例如Held等人.“Real Time Quantitative PCR”Genome Research 6:986-994(1996)中描述。通常，rPCR在每个扩增循环中测量一个信号。一些rPCR技术依赖于在每个扩增循环完成时发出信号的荧光团。这样的荧光团的例子是在与双链DNA结合时在限定的波长发射荧光的荧光染料如SYBR绿。因此，由于每个PCR产物的积累，双链DNA的增加导致荧光强度的增加。用于rPCR检测的荧光团的另一个例子是序列特异性的荧光报告探针，其在本文其他地方描述。这样的探针的例子是

探针。序列特异性报告探针的使用提供了以高特异性检测靶序列，并且即使在存在非特异性DNA扩增的情况下也能够进行定量。基于带有不同颜色标记的特定探针，荧光探针还可用于多重测定(用于在同一反应中检测多个基因)。例如，多重测定可以使用在同一PCR反应混合物中的标记有多种荧光团(包括但不限于FAM、JA270、CY5.5和HEX)的几种序列特异性探针。

rPCR依赖于在PCR反应过程中对可测量参数(例如荧光)的检测。可测量参数的数量与PCR产物的数量成正比，这使得可以“实时”观察PCR产物的增加。一些rPCR方法允许基于PCR反应的可观察的进程对输入的DNA模板进行定量。下面讨论数据的分析和处理。在核酸扩增测定法中，“生长曲线”或“扩增曲线”是函数的图，其中自变量是扩增循环的数目，因变量是在每个扩增循环测量的扩增依赖性的可测量参数，例如由荧光团发出的荧光。如上所述，可以使用荧光团标记的探针检测扩增的靶核酸的量。通常，扩增依赖性的可测量参数是探针在杂交时或在探针被核酸聚合酶的核酸酶活性水解后发射的荧光量。荧光发射的增加是实时测量的，并且与靶核酸扩增的增加直接相关。在一些实例中，使用等式dR_n＝R_n+-R_n-来计算荧光的变化(dR_n)，其中R_n+是产物在每个时间点的荧光发射，而R_n-是基线的荧光发射。将dR_n值针对循环数作图，得出扩增图。在典型的聚合酶链式反应中，生长曲线包含一段指数增长，然后是平稳期，当使用线性标度时会产生S形扩增曲线。生长曲线的特征是“交叉点”值或“C_p”值，也可以称为“阈值”或“循环阈值”(C_t)，这是实现预定量级的可测量参数时的循环数。例如，当使用荧光团标记的探针时，阈值(C_t)是荧光发射(dR_n)超过所选阈值(其通常是基线的标准偏差的10倍)(但是，此阈值水平可以根据需要更改))的PCR循环数。较低的C_t值表示扩增的较快完成，而较高的C_t值表示扩增的较慢完成。在扩增效率相似的情况下，较低的C_t值反映了靶核酸的较高起始量，而较高的C_t值反映了靶核酸的较低起始量。如果使用已知浓度的对照核酸来生成“标准曲线”或对照核酸的各种已知浓度下的一组“对照”C_t值，则可以通过比较靶核酸和对照核酸的C_t值来确定样品中靶核酸的绝对量。

等位基因特异性扩增

在一些实施方案中，例如，在针对感兴趣的疾病和/或综合征的生物标志物是突变的情况下，使用等位基因特异性扩增测定法检测生物标志物。该方法被不同地称为特异性等位基因的PCR扩增(PASA)(Sarkar等人,1990Anal.Biochem.186:64-68)，等位基因特异性扩增(ASA)(Okayama等人,1989J.Lab.Clin.Med.114:105-113)，等位基因特异性PCR(ASPCR)(Wu等人1989Proc.Natl.Acad.Sci.USA.86:2757-2760)和扩增阻滞突变系统(ARMS)(Newton等人,1989Nucleic Acids Res.17:2503-2516)。这些参考文献中每一个的全部内容都并入本文。该方法适用于单碱基取代以及微缺失/插入。

例如，对于基于PCR的扩增方法，可以设计扩增引物，使得它们可以区分不同的等位基因(例如，在野生型等位基因和突变等位基因之间)。因此，扩增产物的存在或不存在可用于确定给定核酸样品中是否存在基因突变。在一些实施方案中，可以设计等位基因特异性引物，使得扩增产物的存在指示基因突变。在一些实施方案中，可以设计等位基因特异性引物，使得扩增产物的不存在指示基因突变。

在一些实施方案中，使用两个互补反应。一个反应采用对野生型等位基因具有特异性的引物(“野生型特异性反应”)，另一反应使用对突变型等位基因具有特异性的引物(“突变体特异性反应”)。这两个反应可以使用共同的第二引物。对特定等位基因(例如野生型等位基因或突变型等位基因)具有特异性的PCR引物通常完全匹配靶标的一个等位基因变体，但与其他等位基因变体(例如突变型等位基因或野生型等位基因)错配。错配可能位于引物的3'末端/附近，从而导致完美匹配的等位基因的优先扩增。是否可以从一个或两个反应中检测到扩增产物表明突变等位基因的存在或不存在。仅从野生型特异性反应中检测到扩增产物表明仅存在野生型等位基因(例如，野生型等位基因的纯合性)。仅在突变体特异性反应中检测到扩增产物表明仅存在突变体等位基因(例如，突变体等位基因的纯合性)。来自两个反应的扩增产物的检测表明(例如，杂合子)。如本文所用，该方法将被称为“等位基因特异性扩增(ASA)”。

通过使用在连接处部分杂交的引物，等位基因特异性扩增还可用于检测重复、插入或倒位。连接重叠的程度可以改变以允许特异性扩增。

扩增产物可以通过本领域已知的方法来检查，包括通过可视化(例如，用一种或多种染料)已经迁移通过凝胶(例如，通过电泳)的核酸条带以按大小分离核酸。

等位基因特异性引物延伸

在一些实施方案中，等位基因特异性引物延伸(ASPE)方法用于检测基因突变。ASPE使用可以在延伸反应中区分等位基因(例如，突变等位基因和野生型等位基因)的等位基因特异性引物，使得仅在特定等位基因(例如，突变等位基因或野生型等位基因)的存在下获得延伸产物。延伸产物可以是可检测的或例如可通过在延伸反应中使用标记的脱氧核苷酸来变得可检测。各种标记中的任何一种可用于这些方法，包括但不限于放射性标记、荧光标记、化学发光标记、酶标记等。在一些实施方案中，核苷酸用随后可以被可检测的标记结合(直接或间接)的实体(例如，可以被链霉抗生物素蛋白缀合的荧光染料结合的生物素分子)标记。在一些实施方案中，反应以多重方式进行，例如在同一延伸反应中使用许多等位基因特异性引物。

在一些实施方案中，延伸产物与固体或半固体支持物例如珠、基质、凝胶等杂交。例如，延伸产物可以用特定的核酸序列(例如，作为等位基因特异性引物的一部分包括在内)标记，并且固体支持物可以附着于“抗标签”(例如，与延伸产物中的标签互补的核酸序列)。延伸产物可以在固体支持物上捕获和检测。例如，珠可以被分类和检测。

单核苷酸引物延伸

在一些实施方案中，使用单核苷酸引物延伸(SNuPE)测定，其中将引物设计为仅延伸一个核苷酸。在这种方法中，紧接在引物3'末端的下游的核苷酸的身份是已知的，并且与野生型等位基因相比在突变等位基因中不同。SNuPE可以使用其中只有一种特殊类型的脱氧核苷酸被标记(例如标记的dATP、标记的dCTP、标记的dGTP或标记的dTTP)的延伸反应来进行。因此，可检测的延伸产物的存在可以用作在感兴趣的位置(例如，紧接在引物的3'末端的下游的位置)处核苷酸的身份的指示，并且因此可以作为在该位置处的突变的存在或不存在的指示。SNuPE可以如美国专利号5,888,819；美国专利号5,846,710；美国专利号6,280,947；美国专利号6,482,595；美国专利号6,503,718；美国专利号6,919,174；Piggee,C.等人.Journal of Chromatography A 781(1997),p.367-375(“CapillaryElectrophoresis for the Detection of Known Point Mutations by Single-Nucleotide Primer Extension and Laser-Induced Fluorescence Detection”)；Hoogendoorn,B.等人,Human Genetics(1999)104:89-93,(“Genotyping SingleNucleotide Polymorphism by Primer Extension and High Performance LiquidChromatography”)中所述，其各自的全部内容通过引用并入本文。

在一些实施方案中，引物延伸可以与质谱法结合以准确和快速地检测突变的存在或不存在。参见Haff等人的美国专利号5,885,775(analysis of single nucleotidepolymorphism analysis by mass spectrometry)；Koster的美国专利号7,501,251(DNAdiagnosis based on mass spectrometry)；两者的教导内容均通过引用并入本文。合适的质谱形式包括但不限于基质辅助激光解吸/电离、飞行时间(MALDI-TOF)、电喷雾(ES)、IR-MALDI、离子回旋共振(ICR)、傅里叶变换及其组合。

寡核苷酸连接测定

在一些实施方案中，使用寡核苷酸连接测定(“OLA”或“OL”)。OLA使用了两种寡核苷酸，其被设计成能够与靶分子的单链的邻接序列杂交。通常，寡核苷酸之一被生物素化，而另一寡核苷酸被可检测地标记，例如，使用链霉抗生物素蛋白缀合的荧光部分。如果在靶分子中找到精确的互补序列，则寡核苷酸将杂交，使得其末端邻接，并产生可被捕获和检测的连接底物。参见例如，Nickerson等人.(1990)Proc.Natl.Acad.Sci.U.S.A.87:8923-8927,Landegren,U.等人.(1988)Science 241:1077-1080和美国专利号4,998,617，其全部内容通过引用整体并入本文。

杂交方法

在一些实施方案中，通过使用对感兴趣的生物标志物具有特异性的一种或多种寡核苷酸探针并在足够严格以不允许单核苷酸错配的条件下进行杂交来分析核酸。在某些实施方案中，合适的核酸探针可以区分正常基因和突变基因。因此，例如，本领域普通技术人员可以使用本发明的探针来确定个体对于特定等位基因是纯合的还是杂合的。

核酸杂交技术是本领域众所周知的。本领域技术人员理解如何估计和调节杂交条件的严格性，使得具有至少所需水平的互补性的序列将稳定地杂交，而具有较低互补性的序列则不会。关于杂交条件和参数的例子，参见例如，Sambrook等人,1989,MolecularCloning:A Laboratory Manual,Second Edition,Cold Spring Harbor Press,Plainview,N.Y.；Ausubel,F.M.等人.1994,Current Protocols in MolecularBiology.John Wiley&Sons,Secaucus,N.J.。

在一些实施方案中，与突变或野生型序列杂交的探针分子可用于通过溶液相或更优选地固相杂交检测扩增产物中的此类序列。固相杂交可以例如通过将探针连接至微芯片来实现。

核酸探针可以包含核糖核酸和/或脱氧核糖核酸。在一些实施方案中，提供的核酸探针是寡核苷酸(即“寡核苷酸探针”)。一般而言，寡核苷酸探针足够长以与感兴趣的基因的同源区域特异性结合，但是足够短以使得探针和被测试的核酸样品之间一个核苷酸的差异破坏杂交。通常，寡核苷酸探针的大小为约10至100个核苷酸。在一些实施方案中，寡核苷酸探针的长度为15至90、15至80、15至70、15至60、15至50、15至40、15至35、15至30、18至30或18至26个核苷酸。如本领域普通技术人员所理解的，寡核苷酸探针的最佳长度可以取决于可以使用寡核苷酸探针的特定方法和/或条件。

在一些实施方案中，核酸探针可用作引物，例如用于核酸扩增和/或延伸反应。例如，在某些实施方案中，就变异进行评估的基因序列包含外显子序列。在某些实施方案中，在测定中分析外显子序列和另外的侧翼序列(例如，UTR和/或内含子序列的约5、10、15、20、25、30、35、40、45、50、55个或更多个核苷酸)。或者，可以评估内含子序列或其他非编码区的潜在有害突变。或者，可以使用这些序列的一部分。此类变体基因序列可包括具有至少一种如本文所述的突变的序列。

本公开内容的其他实施方案提供了分离的基因序列，其包含与感兴趣的综合征和/或疾病相关的突变。这样的基因序列可以用于客观地诊断受试者的HNSCC的存在或发展HNSCC的增加的风险。在某些实施方案中，分离的核酸可以包含任何一种的非变异序列或变异序列或其组合。例如，在某些实施方案中，基因序列包含外显子序列。在某些实施方案中，在测定中分析外显子序列和另外的侧翼序列(例如，UTR和/或内含子序列的约5、10、15、20、25、30、35、40、45、50、55个或更多个核苷酸)。或者，可以使用内含子序列或其他非编码区。或者，可以使用这些序列的一部分。在某些实施方案中，基因序列包含来自本文公开的至少一种生物标志物基因的外显子序列。

在一些实施方案中，核酸探针用本文所述的可检测的部分标记。

阵列

本文提及的各种方法可以适于用作允许在单个实验中分析和/或检测生物标志物的集合的阵列。例如，可以同时分析包含生物标志物的多个突变。特别地，涉及使用核酸试剂(例如，探针、引物、寡核苷酸等)的方法特别适合于适应于基于阵列的平台(例如，微阵列)。在一些实施方案中，阵列包含特异性用于检测感兴趣的生物标志物中的突变的一种或多种探针。

在一个实施方案中，使用多个公开的生物标志物的组。在一个实施方案中，本公开内容包括检测个体中与头颈鳞状细胞癌(HNSCC)相关的生物标志物的组合物，所述组合物包含对表4和/或表6中的至少一种基因和/或CAB39L、ADAM12、SH3BGRL2、NRG2、COL13A1、GRIN2D、LOXL2、KRT4、EMP1或HSD17B6中的至少一种和/或HPV E6和E7基因中的至少一种的表达水平进行定量的试剂。另外和/或可替代地，该组合物可以包括至少一种标准化基因(例如管家基因)。在一个实施方案中，标准化基因可以是KHDRBS1和/或RPL30或其他标准化基因。在某些实施方案中，组合物可以包含针对这些基因中任一种的引物和/或探针，其中所述引物和/或探针用本文所述的可检测的部分标记。

DNA测序

在某些实施方案中，通过核酸测序检测核酸或一组核酸的序列、基因组位置或排列和/或基因组拷贝数的变异来进行感兴趣的生物标志物的诊断。

在一些实施方案中，该方法可以包括从受试者的组织或体液样品中获得核酸，并对至少一部分核酸进行测序，以获得至少一种基因的样品核酸序列。在某些实施方案中，该方法可以包括将变异与已知与HNSCC相关的变异进行比较，并确定该变异是否是先前已被鉴定为与HNSCC相关的变异。或者，该方法可以包括将变异鉴定为新的先前未表征的变异。如果变异是新的变异，或者在某些情况下是先前表征的(即已鉴定的)变异，则该方法可以进一步包括进行分析以确定突变是否预期对基因的表达和/或该基因编码的蛋白质的功能有害。该方法可以进一步包括使用变异概况(即在受试者中鉴定的突变的汇编)来诊断HNSCC的存在或发展HNSCC的增加的风险。

例如，在某些实施方案中，可以使用下一代(大规模并行排序)。或者，可以使用Sanger测序。或者，可以结合使用下一代(大规模并行测序)和Sanger测序。另外和/或可替代地，测序包括单分子合成测序中的至少一种。因此，在某些实施方案中，分析库中的多个DNA样品以鉴定显示出变异的样品。另外或可替代地，在某些实施方案中，分析多个库中的多个DNA样品，以鉴定在至少两个库中显示相同变异的个体样品。

一种进行测序的常规方法是通过链终止和凝胶分离，如Sanger等人,1977,ProcNatl Acad Sci U S A,74:5463-67所述。另一种常规测序方法涉及核酸片段的化学降解。参见Maxam等人,1977,Proc.Natl.Acad.Sci.,74:560-564。另外，已经基于杂交测序开发了方法。参见例如Harris等人,美国专利申请公开号20090156412。这些参考文献各自通过引用整体并入本文。

在其他实施方案中，核酸的测序通过单分子或通过诸如PCR的方法扩增衍生自单个分子的大体上相同的分子组的大规模平行测序(也称为“下一代测序”)来完成。大规模平行测序显示于例如Lapidus等人,美国专利号7,169,560,Quake等人,美国专利号6,818,395,Harris美国专利号7,282,337和Braslavsky等人,PNAS(USA),100:3960-3964(2003)，其各自的内容通过引用并如本文。

在下一代测序中，可以对核酸进行PCR或全基因组扩增，以获得足够量的核酸用于分析。在下一代测序的某些形式中，不需要扩增，因为该方法能够从未扩增的DNA评估DNA序列。经确定后，将来自测试样品的核酸的序列和/或基因组排列和/或基因组拷贝数与来源于在获取其样品时未知患有HNSCC的一个或多个个体的标准参考进行比较。来自测试样品的核酸的序列和/或基因组排列和/或基因组排列和/或拷贝数与标准参考之间的所有差异均视为变异。

在下一代(大规模并行测序)中，所有感兴趣的区域被一起测序，并且通过与参考序列进行比较(比对)来确定每个序列测序片段的来源。感兴趣的区域可以一起富集在一个反应中，或者它们可以分别富集，然后在测序前合并。在某些实施方案中，并且如本文实施例中更详细地描述，通过随机片段化的基因组DNA与特定RNA探针的大量杂交来富集来源于测定中所包括的基因的编码外显子的DNA序列。相同的衔接子序列附接到所有片段的末端，从而允许通过PCR在一个反应中使用一对引物富集所有杂交捕获的片段。用特异性引物通过PCR扩增通过杂交捕获效率较低的区域。另外，使用特异性引物的PCR可用于扩增在基因组中其他地方存在相似序列的外显子(“伪外显子”)。

在使用大规模平行测序的某些实施方案中，将PCR产物串联以形成长的DNA区段，将其剪切成短片段(例如，通过声能)。该步骤确保片段末端分布在整个感兴趣区域中。随后，将一段dA核苷酸添加到每个片段的3'末端，这使这些片段能够结合到包被有寡聚(dT)引物的平坦表面(“流动池”)上。然后可以通过用荧光标记的核苷酸延伸寡聚(dT)引物来对每个片段进行测序。在每个测序循环中，仅添加一种类型的核苷酸(A、G、T或C)，并且通过使用链终止核苷酸仅允许掺入一个核苷酸。例如，在第一个测序循环中，可以添加荧光标记的dCTP。该核苷酸将仅掺入需要C作为下一个核苷酸的那些正在生长的互补DNA链中。在每个测序循环后，获取流动池的图像以确定哪个片段被延伸。已掺入C的DNA链会发光，而未掺入C的DNA链会显得暗。使链终止逆转以使生长中的DNA链再次可延伸，并且重复该过程共120个循环。

图像被转换为通常称为“测序片段”的碱基串，它们概括了每个片段的3'末端的25至60个碱基。然后将测序片段与所分析DNA的参考序列进行比较。由于任何给定的25个碱基的碱基串通常在人类基因组中仅出现一次，因此大多数测序片段可与人类基因组中的一个特定位置“对齐”。最后，可以从可获得的测序片段建立每个基因组区域的共有序列，并将其与该位置上的确切参考序列进行比较。共有序列和参考之间的任何差异称为序列变体。

可检测的部分

在某些实施方案中，根据本发明和/或由本发明提供的某些分子(例如，核酸探针、抗体等)包含一个或多个可检测的实体或部分，即这样的分子被此类实体或部分“标记”。

在本公开内容的实践中可以使用多种可检测试剂中的任何一种。合适的可检测试剂包括但不限于：各种配体，放射性核苷酸；荧光染料；化学发光剂(例如吖啶酯、稳定的二氧杂环丁烷等)；生物发光剂；光谱可分辨的无机荧光半导体纳米晶体(即量子点)；微粒；金属纳米颗粒(例如金、银、铜、铂等)；纳米团簇；顺磁性金属离子；酶；比色标签(例如染料、胶体金等)；生物素；地高辛；半抗原；以及可获得针对其的抗血清或单克隆抗体的蛋白质。

在一些实施方案中，可检测的部分是生物素。生物素可与抗生物素蛋白(例如链霉抗生物素蛋白)结合，抗生物素蛋白通常(直接或间接)缀合至自身可检测的其他部分(例如，荧光部分)。

下面描述了可以使用的一些可检测的部分的一些非限制性实例。

荧光染料

在某些实施方案中，可检测的部分是荧光染料。具有广泛多样的化学结构和物理特性的多种已知荧光染料适用于本公开内容的实践。荧光可检测的部分可被激光激发，发射的光由检测器捕获。检测器可以是电荷耦合设备(CCD)或共焦显微镜，其记录其强度。

合适的荧光染料包括但不限于荧光素和荧光素染料(例如，荧光素异硫氰酸或FITC、萘荧光素、4',5'-二氯-2',7'-二甲氧基荧光素、6-羧基荧光素或FAM等)、六氯荧光素(HEX)、碳花青、部花青、苯乙烯基染料、氧喏染料、藻红蛋白、赤藓红、曙红、若丹明染料(例如，羧基四甲基若丹明或TAMRA、羧基若丹明6G、羧基-X-若丹明胺(ROX)、丽丝胺若丹明B、若丹明6G、若丹明绿、若丹明红、四甲基若丹明(TMR)等)、香豆素和香豆素染料(例如甲氧基香豆素、二烷基氨基香豆素、羟基香豆素、氨基甲基香豆素(AMCA)等)、Q-DOTS、Oregon绿色染料(例如，Oregon绿色488、Oregon绿色500、Oregon绿色514等)、Texas红、Texas红-X、SPECTRUM RED、SPECTRUM GREEN、花青染料(例如CY-3、CY-5、CY-3.5、CY-5.5等)、ALEXAFLUOR染料(例如ALEXA FLUOR 350、ALEXA FLUOR 488、ALEXA FLUOR 532、ALEXA FLUOR546、ALEXA FLUOR 568、ALEXA FLUOR 594、ALEXA FLUOR 633、ALEXA FLUOR 660、ALEXAFLUOR 680等)、BODIPY染料(例如BODIPY FL、BODIPY R6G、BODIPY TMR、BODIPY TR、BODIPY530/550、BODIPIP 558/568、BODIPY 564/570、BODIPY576/589、BODIPY 581/591、BODIPY630/650、BODIPY 650/665等)、IRDyes(例如IRD40、IRD 700、IRD 800等)等。对于合适的荧光染料和将荧光染料偶联至其他化学实体(例如蛋白质和肽)的方法的更多实例，参见例如，“The Handbook of Fluorescent Probes and Research Products”,9th Ed.,Molecular Probes,Inc.,Eugene,OR.。荧光标记剂的有利性质包括高摩尔吸收系数，高荧光量子产率和光稳定性。在一些实施方案中，标记荧光团显示在光谱的可见光(即400至750nm)而不是在光谱的紫外光范围(即低于400nm)中的吸收和发射波长。

可检测的部分可以包括多于一种化学实体，例如在荧光共振能量转移(FRET)中。共振转移导致发射强度的整体增强。例如，参见Ju等人(1995)Proc.Nat'l Acad.Sci.(USA)92:4347，其全部内容通过引用并入本文。为了实现共振能量转移，第一荧光分子(“供体”荧光)吸收光，并通过激发电子的共振将其转移到第二荧光分子(“受体”荧光)。在一种方法中，供体和受体染料可以连接在一起并附接至寡核苷酸引物。将供体和受体染料连接至核酸的方法已在例如Lee等人的美国专利号5,945,526中描述，其全部内容通过引用并入本文。可以使用的染料的供体/受体对包括例如荧光素/四甲基若丹明、IAEDANS/荧光素、EDANS/DABCYL、荧光素/荧光素、BODIPY FL/BODIPY FL和荧光素/QSY 7染料。参见例如，Lee等人的美国专利号5,945,526。这些染料中的许多也可以从例如Molecular Probes Inc.(Eugene,Oreg.)商购获得。合适的供体荧光团包括6-羧基荧光素(FAM)、四氯-6-羧基荧光素(TET)、2’-氯-7’-苯基-1,4-二氯-6-羧基荧光素(VIC)等。

酶

在某些实施方案中，可检测的部分是酶。合适的酶的实例包括但不限于ELISA中使用的那些酶，例如辣根过氧化物酶、β-半乳糖苷酶、荧光素酶、碱性磷酸酶等。其他实例包括β-葡糖醛酸酶、β-D-葡糖苷酶、脲酶、葡萄糖氧化酶等。可以使用诸如碳二亚胺、二异氰酸酯、戊二醛等的连接基团将酶缀合到分子上。

放射性同位素

在某些实施方案中，可检测的部分是放射性同位素。例如，分子可以是同位素标记的(即可以包含已被具有不同于自然界通常发现的原子质量或质量数的原子质量或质量数的原子取代的一个或多个原子)或同位素可以附着至分子。可掺入分子中的同位素的非限制性实例包括氢、碳、氟、磷、铜、镓、钇、锝、铟、碘、铼、铊、铋、砹、钐和镥的同位素(即3H、13C、14C、18F、19F、32P、35S、64Cu、67Cu、67Ga、90Y、99mTc、111In、125I、123I、129I、131I、135I、186Re、187Re、201T1、212Bi、213Bi、21lAt、153Sm、177Lu)。

树枝状大分子

在一些实施方案中，使用标记的树枝状大分子作为可检测的部分来实现信号放大(参见例如，Physiol Genomics 3：93-99，2000)，其全部内容通过引用整体并入本文。荧光标记的树枝状大分子可从Genisphere(Montvale,N.J.)商购获得。这些可以通过本领域已知的方法化学偶联至寡核苷酸引物。

系统

在某些实施方案中，本公开内容提供了用于执行本文公开的方法和/或使用本文所述的组合物的系统。在某些实施方案中，系统可以包括试剂盒。或者，该系统可以包括用于执行本文公开的方法的计算机化指令和/或试剂。

试剂盒

在某些实施方案中，本公开内容提供了根据本文公开的方法和组合物使用的试剂盒。通常，试剂盒包含检测感兴趣的生物标志物的一种或多种试剂。合适的试剂可以包括核酸探针和/或抗体或其片段。在一些实施方案中，以阵列例如微阵列或突变组的形式提供合适的试剂。试剂盒可进一步包含用作感兴趣的生物标志物(即基因)的阳性对照的试剂。

在一个实施方案中，使用公开的多个生物标志物的组。在一个实施方案中，本公开内容包括用于检测个体中与头颈鳞状细胞癌(HNSCC)相关的生物标志物的试剂盒，所述试剂盒包含定量表4和/或表6中的至少一种基因和/或CAB39L、ADAM12、SH3BGRL2、NRG2、COL13A1、GRIN2D、LOXL2、KRT4、EMP1或HSD17B6中的至少一种和/或HPV E6和E7基因中的至少一种的表达水平的试剂。另外和/或可替代地，试剂盒可以包含至少一种标准化(例如，管家)基因和/或检测这种管家基因的试剂。在一个实施方案中，标准化基因可以是KHDRBS1和/或RPL30或其他标准化基因。在一些实施方案中，试剂盒可以包含用于任何公开的生物标志物和/或标准化基因的阳性对照。

在一些实施方案中，提供的试剂盒进一步包含用于实施本文所述的各种检测方法(例如，RT-PCR、测序、杂交、引物延伸、多重ASPE、免疫测定法等)的试剂。例如，试剂盒可任选地包含用于本文所述方法(例如，用于通过RT-PCR扩增核酸、引物导向的扩增、用于进行ELISA实验等)的缓冲液、酶和/或试剂。在某些实施方案中，试剂盒可包含用于这些基因中任一种的引物和/或探针，其中所述引物和/或探针用本文所述的可检测的部分标记。

在一些实施方案中，提供的试剂盒进一步包含指示健康个体的对照，例如，来自不具有感兴趣的疾病和/或综合征的个体的核酸和/或蛋白质样品。或者，试剂盒可包含阳性对照，所述阳性对照包含已知量的一种或多种被测量的生物标志物基因。试剂盒还可能包含关于如何确定个体是否患有感兴趣的疾病和/或综合征或处于发展感兴趣的疾病和/或综合征的风险中的说明书。

在一些实施方案中，提供了一种计算机可读介质，其编码与感兴趣的生物标志物相对应的信息。这样的计算机可读介质可以被包括在本发明的试剂盒中。

鉴定HNSCC标志物的方法

数据挖掘

在本公开内容的某些实施方案中，使用数据挖掘方法来鉴定生物标志物。例如，在某些情况下，可以在公共数据库(例如PubMed，The Cancer Genome Atlas(TCGA))中搜索已显示出与某种疾病相关(直接或间接)和/或与正常组织相比在癌症中差异表达的基因。然后可以将此类基因评估为生物标志物。

分子

在某些实施方案中，本公开内容包括鉴定感兴趣的综合征或疾病的生物标志物(即以统计学上显著的方式与HNSCC相关的核酸序列中的变体)的方法。例如，可通过使用随机森林分析法评估从患有头颈癌的患者中分离的组织样品中的基因表达来鉴定感兴趣的基因和潜在的标准化基因(参见例如L.Breiman,“Random Forests”Machine Learning,2001,45:5-32)并在此详细讨论。在这种方法中，随机森林是树预测器的组合，因此每棵树都取决于独立采样的随机向量的值，并且对森林中的所有树都具有相同的分布。

或者，针对新标志物测定的基因和/或基因组区域可以基于其在显示与感兴趣的综合征和/或疾病的遗传联系和/或生物学因果关系的生化途径中的重要性来进行选择。或者，可以基于与DNA区域的遗传联系来选择针对标志物测定的基因和/或基因组区域，所述DNA区域与家庭中的HNSCC的遗传相关。或者，可以系统地评估针对标志物测定的基因和/或基因组区域，以覆盖尚未评估的染色体的某些区域。

在其他实施方案中，针对新标志物评估的基因或基因组区域可以是与感兴趣的综合征和/或疾病(例如，HNSCC)的发展相关的生化途径的一部分。可以基于以下方法中的一种或多种评估变异和/或变异组合的临床意义。如果报道或已知变异或变异组合在患有感兴趣的综合征和/或疾病的受试者中比在没有感兴趣综合征和/或疾病的受试者中的核酸中更频繁地发生，则认为其至少潜在地易患该感兴趣的综合征和/或疾病。如果报道或已知变异或变异组合被排他地或优先地传播给患有感兴趣的综合征和/或疾病的个体，则认为其至少潜在地易患该感兴趣的综合征和/或疾病。相反，如果在两个体群中以相似的频率发现变异，则该变异不太可能与相关综合征和/或疾病的发展相关。

如果报道或已知某个变体或变体组合在适用于测量蛋白质或生物系统功能的实验模型系统中对该蛋白质或该生物系统的功能具有总体有害的作用，并且如果该变体或变体组合影响已知与感兴趣的综合征和/或疾病相关的一个或多个基因，则认为其至少潜在地易患感兴趣的综合征和/或疾病。例如，如果基于对蛋白质或核酸的序列和/或结构的预测的作用预测变体或变体组合对蛋白质或基因表达具有总体有害的作用(即导致无义突变、移码突变或剪接位点突变，甚至错义突变)，并且如果该变体或变体组合影响已知与感兴趣的综合征和/或疾病相关的一个或多个基因，则认为其至少潜在地易患感兴趣的综合征和/或疾病。

同样，在某些实施方案中，变体的总数可能很重要。如果在测试样品中检测到一个或几个变体，其被单独或组合地评估为至少可能与感兴趣的综合征和/或疾病相关，那么在其遗传物质中检测到该变体或这些变体的个体可以被诊断为患有感兴趣的综合征和/或疾病或处于发展感兴趣的综合征和/或疾病的高风险中。

例如，本文的公开内容提供了用于诊断受试者中HNSCC的存在或发展HNSCC的增加的风险的方法。这样的方法可以包括从组织或体液的样品中获得核酸。该方法可以包括确定正常组织和癌组织中的至少一种基因的表达，以鉴定潜在的感兴趣的生物标志物。该方法可以进一步包括对核酸测序或确定核酸的基因组排列或拷贝数，以检测核酸序列或基因组排列或拷贝数中是否存在一种或多种变体。该方法可以进一步包括评估一种或多种变体的临床意义的步骤。此类分析可包括评估受影响的群体(即患有该疾病的受试者)中变体序列的关联程度。这样的分析还可以包括分析突变可能对基因表达和/或蛋白质功能的影响的程度的分析。该方法还可以包括基于评估诊断HNSCC的存在或发展HNSCC的增加的风险。

实施例

以下实施例用于举例说明本公开内容的某些方面。这些实施例决不是限制性的。

实施例1–潜在的HNSCC标志物的基于文献的鉴定

进行了初步的文献检索，以鉴定与HNSCC相关的标志物。表1显示了标志物的类型和发现的标志物的数量，表2显示了已鉴定的潜在生物标志物。

表1

HNSCC标志物	编号
		突变基因	9
拷贝数和易位	14
		甲基化	71
基因表达	29
		微RNA	46
标准化基因	15
		总计	184

表2

基于该初步搜索，决定寻求与差异基因表达相关的标志物

实施例2–使用TCGA数据库鉴定生物标志物

挖掘来自Cancer Genome Atlas(TCGA)数据库的数据以鉴定在HNSCC中显示差异表达的标志物。TCGA数据库(RNASeqV2)包含关于可用于差异表达的18,379个基因的数据。数据包括相关以下方面的信息：临床信息(例如年龄、吸烟、分期、治疗和存活)；拷贝数；甲基化；基因表达；突变，微RNA表达。

HNSCC数据包含来自4个肿瘤部位的530个样品：口腔(n＝320；60.4％)、口咽(n＝82；15.5％)、喉(n＝117；22.1％)和下咽(n＝10；1.5％)。另外44个样品来自相邻的正常组织。在530个样品中，有70个是人乳头瘤病毒(HPV)阳性，有279个是HPV阴性，还有181个未知或不确定的HPV状态。

进行了随机森林分析，以鉴定从正常样品中可以强烈预测HNSCC分类的基因。在该分析中，丢弃了50％的样品具有可报告的数据并且表达变化小于2倍(Wilcox测试，调整后的p值<0.001)的基因。对于每一轮分析，将75％的样品用作训练集，将25％的样品用作测试集。数据针对κ进行了优化，并进行了10倍交叉验证(重复10次并平均性能)。鉴定了最强预测的20个，然后将整个过程重复4次。每次运行所得的基因列表显示在表3中，并且组合的36个独特基因显示在表4中。表3中的数据以最高等级(20)至最低等级(1)的顺序显示。

表3

表4

然后选择来自4次分析各自的最高的4个基因，以提供表5中列出的8个独特基因的初始候选列表。

表5

基因名称	基因产物
		CAB39L	钙结合蛋白
ADAM12	参与EGFR配体HBEGF的脱落的金属蛋白酶
		SH3BGRL2	SH3结构域结合性富含谷氨酸的蛋白质样2
NRG2	神经调节蛋白2(HER3受体的配体)
		COL13A1	XIII型胶原α1链
GRIN2D	谷氨酸受体亚基2D
		LOXL2	赖氨酰氧化酶同源物2
HSD17B6	羟基类固醇17-β脱氢酶6

图1中还显示了几个个体基因的统计分析结果(即准确性、κ、灵敏度和特异性)，按特异性顺序列出。

实施例3–基因小组

进行分析以确定基因小组的使用是否预期改善测定性能。如图2所示，使用4或5基因小组可以显著提高基因性能。小组构建是通过将信息量最大的标志物(CAB39L)添加到信息量第二大的标志物(ADAM12)以形成2标志物小组，然后添加下一信息量最大的标志物(NRG2)以形成3标志物小组。然后添加其他六个标志物中的每个标志物，并评估预测的性能(图2，顶部表格)。结果表明，CAB39L、ADAM12、NRG2和GRIN2D的四标志物小组提供了最高水平的准确性、κ值、灵敏度和特异性。下表中显示了5基因小组的结果(图2)。发现(例如图2)在添加超过4-5个基因时只有最小程度的改善。如果被鉴定为最高的4-5个标志物之一的标志物中的一种在技术上存在挑战，则此类小组仍然有用。

实施例4–肿瘤部位的基因表达

大多数HNSCC在口腔(口)或口咽(喉)中发现。进行分析以确定使用整个HNSCC数据集开发的相同基因小组是否也可用于区分口腔或口咽的HNSCC与正常组织。对于八个标志物的结果示于图3和4中：CAB39L、ADAM12、SH3BGRL2、NRG2(图3)；以及COL13A1、GRIN2D、LOXL2和HSD17B6(图4)；使用以口腔和口咽为大多数TCGA样品的TCGA数据集，其中总计530个样品中的HNSCC口腔(320)和正常口咽(82)＝402(402/530＝76％)和总计44个样品中的正常口腔(30)和口咽(3)＝33(33/44＝75％)。

发现对于该两个部位以及喉部，标志物在正常组织相对癌组织中具有非常不同的表达水平。在图3和图4中，x轴上最左边的3个数据集(喉、口腔和口咽)是正常组织表达水平，x轴上最右边的4个数据集(下咽、喉、口腔和口咽)是癌组织的表达水平；下咽的数据被合并。可以看出，在正常和HNSCC部位上有相似的分布(即正常中的水平是相似的而与组织无关，并且HNSCC中的水平是相似的而与组织无关)。例如，可以看出，对于喉、口腔和口咽CAB39L在HNSCC中的表达水平分别显著低于正常组织，而ADAM12在HNSCC中的表达水平显著高于正常组织。在图5中显示了数据的统计汇编，其显示了与来自口腔和口咽的样品相比所有HNSCC样品的标志物的结果。将所有样品与口腔和口咽相比，准确性、灵敏度和特异性只有最小程度的变化。对于所有8个标志物，样品集减少约25％；中位基因表达水平只有最小程度的变化；并且分布存在显著差异(HNSCC相对正常)。在两个集合中，Mann-Whitney p值均小于0.0001。

实施例5-针对中位数表达倍数相对表达重叠百分比的TCGA基因集的差异表达的分析。

图6A的上图显示了与标志物的中位数等级(区分能力)相比，从四个随机森林分析重复中鉴定出最初通过随机森林分析选择的来自表4的36个基因的标志物的次数。可以看出，随着从随机森林分析反复鉴定出标志物的次数增加，中位数等级有增加的趋势。图下方的四个表格列出了根据从随机森林分析反复鉴定出标志物的次数进行分组标志物和中位数等级。图和表格一起提供了一种量度，其可以允许对从随机森林分析鉴定出的表4的36个基因进行优先排序；首先通过重复的次数，然后通过中位数等级。

图6B的左图显示了与整个TCGA HNSCC基因集相比，本公开内容的某些选定的HNSCC标志物的差异表达的分析。x轴显示作为基因表达的增加(数据指向0的右边)或基因表达的减少(数据指向0的左边)的表达的中位数倍数变化。y轴显示了HNSCC相对正常组织中基因表达的重叠百分比。可以看出，表4中公开的标志物(N＝36)显示出基因表达的大幅增加或减少，与数据库中的其他基因相比具有非常低的重叠百分比。整个TCGA HNSCC基因集是RNASeq数据，使用了代表超过80％的样品的基因(即对于HNSCC和正常样品可报告18,379个基因中的16,161个(88％))。x轴显示中位数倍数变化(＝HNSCC/正常)。发现与正常相比，HNSCC中8,352个基因(52％)增加，而7,809个基因(48％)减少，其中1,387个基因(8.6％)增加>2倍，而1,701个基因(10.5％)减少>2倍。对于HNSCC中基因表达的增加，截断值是HNSCC的第5个百分位数和正常的第95个百分位数(例如，图6B，GRIN2D插图)。

图6B中的图上的虚线显示了从随机森林分析重复四次的九个标志物在表达上具有小于20％的重叠(0至19％的范围)(即这些标志物在虚线下方)。另外，图6B中的图上的虚线显示表4的36个独特标志物中的23个，或23/36＝64％，在表达上具有小于20％的重叠，因为它们聚集在虚线下方。表6列出了随机森林分析未鉴定的另外45个基因，其表达具有≤20％的重叠。在表达上具有≤20％的重叠的基因，例如图6B中鉴定的GLT25D1，可以被认为是帮助从正常样品中分类HNSCC的额外生物标志物。

表6

可以将图6B中的数据与图7和图8中的数据进行比较。图7显示了来自TCGA HNSCCRNASeq数据的中位数表达倍数相对表达重叠百分比的类似分析，并且此实施例显示了通过在图上突出显示的文献检索鉴定的组织和唾液标志物。上图和下图显示了在组织(上图)和唾液(下图)中均鉴定出的标志物的结果。虽然图7中的某些文献标志物显示了差异表达的一些证据，但是只有少数标志物显示出具有低的重叠百分比的高水平差异表达。基于此分析，标志物MAL、MMP1、CEP55、CENPA、AURKA和FOXM1似乎是最有用的额外生物标志物，并且可以包括在公开的方法和组合物中。

图8显示了来自TCGA HNSCC RNASeq数据的中位数表达倍数相对表达重叠百分比的分析的类似分析，并且此实施例显示了通过文献检索鉴定的组织(上图)和唾液(下图)中使用的标准化标志物。可以看出，这些标志物在表达上几乎没有变化，并且在正常相对HNSCC中具有显著的重叠。理想的标准化标志物应具有最小程度的变异，并且表达水平与感兴趣的基因小组相似。

实施例6–潜在的标准化或管家基因的鉴定

使用三个标准对TGCA数据库进行分析，以鉴定潜在的标准化基因：(1)HNSCC与正常组织之间表达的最小中位数变化；(2)HNSCC和正常中的最小四分位间距(IQR)，其中IQR定义为第75个四分位数中的基因表达/第25个四分位数中的基因表达；和(3)接近感兴趣的基因小组的中位数表达水平，以促进潜在候选基因表达与标准化基因之间的实验比较。

分析总结在图9A中。左图显示了HNSCC相对正常(x轴)中的基因表达中位数倍数变化相对于正常和癌细胞中平均IQR(＝[HNSCC I.Q.R.+正常I.Q.R]/2)(Y轴)的曲线图。在该图中，x轴上的正数对应于与正常相比癌细胞中基因表达的增加，负数对应于与正常相比癌细胞中基因表达的减少。分析了来自总共16,161个基因的数据(左图)。这对应于TCGA数据库中具有对于正常和HNSCC的数据的所有基因，因此对应于TCGA数据库中基因总数的88％(16,151/18,379)。再次发现，与正常相比，HNSCC中8,352个基因(52％)增加，而7,809个基因(48％)减少，并且1,387个基因(8.6％)增加>2倍，而1,701个基因(10.5％)减少>2倍。

最感兴趣的潜在标准化基因是那些倍数变化(x轴)为0且平均IQR为1(在图中圈出的区域)的基因。中间图显示了中位数倍数变化小于2且平均IQR小于2的那些基因的数据(n＝7,949个基因)。右图显示了7949个候选标准化基因的基因表达数据。具有中位数表达的那些基因被认为是最感兴趣的。基于此分析，将KHDRBS1(含KH结构域、RNA结合、信号转导相关蛋白1)鉴定为感兴趣的标准化基因。在中间图上鉴定了一些其他更常见的标准化基因，例如RPLPO、RPL10、RPL30和GAPDH。下表6中显示了对于KHDRBS1的来自TCGA数据库的数据。图9B显示，在许多癌症类型中，KHDRBS1表现出相似的特征(低的表达倍数变化和低的IQR)。

11.60至11.90的表达平均水平高于提出的小组标志物，其范围为1.52(HNSCC中为NRG2)至11.44(正常中为SH3BGRL2)。这仍然在癌症特异性标志物的范围内，因此应该是良好的标准化基因。它指出，对于可能包含大量降解RNA的FFPE样品，<100bp的扩增子长度是优选的。

表7

可以将这些数据与众所周知的管家基因(标准化基因)GAPDH的数据进行比较(表7)。16.3-16.50的中位数表达比上述候选小组中显示最高表达水平的基因(SH3BGRL2)高约30倍。因此，GAPDH作为上述公开的HNSCC小组的标志物可能不太有用。

实施例7–表达测定的评估

进行实验以比较从TCGA数据库中的数据确定的表达水平(基因表达的RNASeq评估)与使用液滴数字PCR(ddPCR)测量的表达水平。结果示于图10，其呈现了显示通过ddPCR在舌鳞状细胞癌(SCC)和正常组织(颊粘膜)中对ADAM12和SH3BGRL2进行ddPCR分析的可重复性(图10的上表)的数据。还显示了与正常组织相比癌症中ADAM12和SH3BGRL2的基因表达水平的ddPCR数据(下表)相对TCGA RNASeq数据(中表)的比较。可以看出，如通过两种方法测量的，与正常相比癌症中ADAM12表达显著增加，而与正常相比癌症中SH3BGRL2表达则显著下降。在这些实验中，分析了来自同一样品的两个等分试样。对于颊样品，其中一个样品的表达水平太低而无法准确测量。尽管ddPCR值通常低于TCGA RNASeq数据，但两种标志物的趋势相同(参见图10)。在低至1个拷贝/μL的情况下，重现性很好。

图11显示了三个福尔马林固定的石蜡包埋的患者样品(DA1081983；DR1041686；DA0063595)和一个来自细胞培养的癌组织的URNA对照样品的其他数字PCR数据。URNA是通用的人类参考RNA，可从Agilent(目录号740000)获得。它包含10个体类癌细胞系，可用作标准数据集比较的一致对照。根据本公开内容的实施例，执行重复或三次采样。再次，发现与正常相比，癌症中SH3BGRL2表达显著降低。可以看出，与来自FFPE样品的交联且可能片段化的RNA相比，来自URNA对照的每uL拷贝数要大得多，这很可能是由于分离的RNA的完整性质所致。

图12显示了使用ddPCR和标志物SH3BGRL2(用FAM标记)和KHDRBS1(用HEX标记)的RNA滴定实验。在该实验中，从FFPE样品中分离了RNA(或将URNA用作阳性对照)，并稀释2倍或10倍。使用标准技术生成cDNA，并使用ddPCR检测生物标志物SH3BGRL2(用FAM标记的扩增序列)或管家基因KHDRBS1(用HEX标记)的存在。显示了三个样品(#1、#3或#5)的结果。可以看出，除了非常稀的样品(即接近或低于每μL一个拷贝)以外，在不同浓度下标志物和管家基因的比率之间存在良好的相关性，这表明使用这种测定方法可以测量良好范围的样品浓度。

图13显示了与阳性对照URNA相比，FFPE样品中生物标志物SH3BGRL2和管家RNAKHDRBS1的相对丰度(左图)；与正常细胞和URNA相比，癌细胞中生物标志物SH3BGRL2与KHDRBS1的比率(中图)；如使用RNASeq测量的，在癌细胞和正常细胞中SH3BGRL2与KHDRBS1的相对丰度(右图)。同样，无论如何测量，对于生物标志物都可以看到一致的模式(尽管绝对值可能会变化)。

图14显示了通过单重测定法测量的SH3BGRL2的测量结果(即通过PCR产生的仅SH3BGRL2-FAM，与在正常或癌症来源的样品中测量SH3BGRL2和KHDRBS1两者的双重反应相比)。结果通常非常相似。

实施例8–通过ddPCR测量的在FFPE组织样品中的差异表达

图15显示了从22个良性和8个头颈癌FFPE样品中测量5种生物标志物和管家基因KHDRBS1的测量结果。基本上根据制造商的方案，使用Roche High Pure FFPET RNA分离试剂盒从FFPE组织中提取RNA。5个图显示了来自22个良性和8个头颈癌FFPE样品中5个生物标志物(SH3BGRL2、KRT4、EMP1、LOXL2和ADAM12)与管家基因KHDRBS1的双重ddPCR的拷贝数/μL。KHDRBS1在所有样品和所有测定中表现出非常相似的分布模式和拷贝数/μL。相比之下，生物标志物表现出>3-log₁₀拷贝/μL的不同分布。所有测定中的一个HNSCC样品对于生物标志物和KHDRBS1均导致“无应答”。

图16的左图显示了标准化至KHDRBS1的五个生物标志物的表达。用双重ddPCR反应中的管家基因KHDRBS1拷贝数/uL除生物标志物拷贝数/uL得到每个样品的生物标志物标准化或比率。图16右图是来自HNSCC TCGA数据集的相同生物标志物的RNASeq表达数据。该表显示了与TCGA数据相比来自ddPCR实验的每种生物标志物的表达的中位数倍数变化。这两个数据集都显示出在癌症中被下调的相同基因(SH3BGRL2、KRT4和EMP1)，以及在癌症中被上调的相同基因(LOXL2和ADAM12)。ddPCR结果与TCGA数据集一致，但是变化的幅度确实有所变化。

在图17中，通过确定(上调基因的总log)–(下调基因的总log)的差，开发了ddPCR评分以将癌症与正常样品分开，在添加生物标志物后，等式变为(logLOXL2+logADAM12)–(logSH3BGRL2+logEMP1+logKRT4)。左侧图显示癌症样品的ddPCR评分，旁边是正常样品的ddPCR评分。在ddPCR截断评分>0.24时，测定特异性为95.4％，灵敏度为85.7％。右图显示了接收者操作特征(ROC)分析，AUC为0.961，p＝0.0003。ddPCR的特异性与TCGA数据集相似(见图2)，而ddPCR的灵敏度<TCGA，可能是由于样品大小和/或基因选择的差异。

实施例9–FFPE HNSCC组织样品中的HPV16 E6和E7表达

图18显示了来自FFPE HNSCC组织样品的E6和E7 HPV16表达与p16之间的相关性。上面的表格显示了从4个p16阳性样品中获得的HPV16 E6、E7和管家基因KHDRBS1 ddPCR拷贝数/uL。底部表格显示了来自10个p16阴性样品的结果，以及HPV16 E6、E7和管家基因KHDRBS1 ddPCR拷贝数/uL。右图显示了4个p16阳性样品的生物标志物除以管家基因KHDRBS1的标准化ddPCR比。HPV16 E6和E7可报告拷贝数/uL均大于无应答(No Call)的两个样品显示，E7的标准化ddPCR表达是E6的大约5倍。此外，在制备物和重复中，所有p16阴性样品对于通过ddPCR测量的E6和E7表达均为阴性(无应答)。在通过IHC测量的p16与通过ddPCR测量的E6或E7表达之间有很好的总体一致性(Cohen’sκ＝0.81)。

实施例10–唾液样品中RNA的分离和基因表达

在某些情况下，唾液可用作生物样品。图19显示了唾液中RNA的产率。使用DNAGenotek CP-190人RNA采集设备收集唾液样品。样品收集后，将每个样品充分混合并在50摄氏度下孵育2小时，然后将样品储存在-20摄氏度下直至进行处理。对于每个待处理的唾液等分试样，添加1/10样品体积的DNA Genotek中和溶液(目录号RELONN-5)。使用Roche HighPure RNA Paraffin试剂盒(目录号03270289001)纯化RNA。左侧的表格显示了15个唾液RNA样品，以及从250μL唾液样品制备液计算出的μg RNA/2mL唾液和每个唾液样品的A260/A280比。分离出的中位数μg RNA为5.8μg，中位A260/A280比为2.05。右侧的散点图以盒须图形式显示了相同的数据，其中须在最大和最小处，盒在第75个和第25个百分位数附近并且一条线穿过中位数。

图20显示了来自图19的15个唾液RNA样品中5种生物标志物和管家(HK)基因RPL30的测量结果。左图显示了15个唾液样品中的5种生物标志物(LOXL2、SH3BGRL2、CRISP3、EMP1和KRT4)以及管家基因RPL30的双重ddPCR的拷贝数/μL。生物标志物分布范围为0.38至650个拷贝/μL。右图应该是每个双重ddPCR中的管家基因。在5个双重ddPCR反应中，管家基因(RPL30)平均为8至170个拷贝/μL，％CV为6至27％。一个样品平均为1.3个拷贝/μL，％CV为57％。

图21显示了与TCGA RNASeq相比，来自唾液的标准化ddPCR。左图显示了标准化至管家基因RPL30的生物标志物的表达。用双重ddPCR反应中的管家基因RPL30拷贝数/μL除生物标志物拷贝数/微升，得出每个样品的生物标志物标准化或比率。排除了HK基因平均值为1.3拷贝/uL的一个样品和生物标志物为“无应答”或<1拷贝/uL的样品。标准化的ddPCR表达范围为0.018至9.7＝540倍。图21的右图是HNSCC数据集中来自“正常”的相同生物标志物的RNASeq表达数据。该表显示了来自ddPCR实验的每种生物标志物相对于LOXL2的表达与TCGA数据相比的中位数倍数增加。ddPCR测量的来自唾液的表达的中位数倍数增加倾向于与TCGA(组织)数据集相似，但变化幅度不同。

实施例11–实施方案

本公开内容包括但不限于以下实施方案。

A.1一种检测个体中与头颈鳞状细胞癌(HNSCC)相关生物标志物的方法，包括以下步骤：

从个体获得样品；和

测量来自包含表4和/或表6中的至少一种基因的基因的表达产物的量。

A.2前述段落中任一项的方法，其中所述基因包含CAB39L、ADAM12、SH3BGRL2、NRG2、COL13A1、GRIN2D、LOXL2、KRT4、EMP1或HSD17B6中的至少一种。

A.3前述段落中任一项的方法，其中所述基因包含CAB39L、ADAM12、SH3BGRL2、NRG2、COL13A1、GRIN2D、LOXL2、KRT4、EMP1和HSD17B6中的至少四种。

A.4前述段落中任一项的方法，还包括测量来自HPV E6和/或HPV E7基因中的至少一种的表达产物的量。

A.5前述段落中任一项的方法，其中所述基因由CAB39L、ADAM12、SH3BGRL2、NRG2、COL13A1、GRIN2D、LOXL2、KRT4、EMP1和HSD17B6中的至少四种以及来自HPV E6和/或HPV E7基因中的至少一种的表达产物组成。

A.6前述段落中任一项的方法，还包括测量标准化基因如KHDRBS1或RPL30或另一种标准化基因的量。

A.7前述段落中任一项的方法，其中所述测量包括测量mRNA。

A.8前述段落中任一项的方法，其中所述测量包括免疫测定。

A.9前述段落中任一项的方法，包括测量至少四种基因的表达。

A.10前述段落中任一项的方法，其中样品包括血清、组织、FFPE、唾液或血浆。

A.11前述段落中任一项的方法，包括将表达水平与正常群体的对照值进行比较。

A.12前述段落中任一项的方法，其中所述个体中的基因表达与所述对照值之间的差异表明所述个体可能患有(即诊断出)HNSCC或易于发展HNSCC(即处于发展HNSCC的风险)。

B.1鉴定个体中与头颈鳞状细胞癌(HNSCC)相关的标志物的方法，其包括：鉴定与正常对照相比在HNSCC而非在HNSCC疾病中表达增加或减少的至少一种标志物。

B.2 B.1的方法，其中所述基因包含表4和/或表6的基因之一的至少一种，和/或CAB39L、ADAM12、SH3BGRL2、NRG2、COL13A1、GRIN2D、LOXL2、KRT4、EMP1或HSD17B6的中的至少一种。

B.3 B.1-B.2中任一项所述的方法，其中所述基因包含CAB39L、ADAM12、SH3BGRL2、NRG2、COL13A1、GRIN2D、LOXL2、KRT4、EMP1和HSD17B6中的至少四种。

B.4 B.1-B.3中任一项的方法，其进一步包括测量来自HPV E6和/或HPV E7基因中的至少一种的表达产物的量。

B.5 B.1-B.4中任一项所述的方法，其中所述基因由CAB39L、ADAM12、SH3BGRL2、NRG2、COL13A1、GRIN2D、LOXL2、KRT4、EMP1和HSD17B6中的至少四种以及来自HPV E6和/或HPV E7基因中的至少一种的表达产物组成。

B.6 B.1-B.5中任一项的方法，其进一步包括测量标准化基因如KHDRBS1或RPL30或另一种标准化基因的量。

B.7 B.1-B.6中任一项的方法，其中所述测量包括测量mRNA。

B.8 B.1-B.7中任一项的方法，其中所述测量包括免疫测定。

B.9 B.1-B.8中任一项的方法，包括测量至少四种基因的表达。

B.10 B.1-B.9中任一项的方法，其中所述样品包含血清、组织、FFPE、唾液或血浆。

B.11 B.1-B.10中任一项的方法，其中所述个体中的基因表达与所述对照值之间的差异表明所述个体可能患有(即诊断出)HNSCC或易于发展HNSCC(即处于发展HNSCC的风险)。

C.1一种检测个体对头颈鳞状细胞癌(HNSCC)的易感性的方法，包括：

从个体获得样品；和

测量来自表4和/或表6的至少一种基因的至少一种表达产物的量；和

比较样品中表4和/或表6中的至少一种基因的表达与该基因表达产物的对照值。

C.2 C.1的方法，其中所述基因包含CAB39L、ADAM12、SH3BGRL2、NRG2、COL13A1、GRIN2D、LOXL2、KRT4、EMP1或HSD17B6中的至少一种。

C.3 C.1-C.2中任一项的方法，其中所述基因包含CAB39L、ADAM12、SH3BGRL2、NRG2、COL13A1、GRIN2D、LOXL2、KRT4、EMP1和HSD17B6中的至少四种。

C.4 C.1-C.3中任一项的方法，其进一步包括测量来自HPV E6和/或HPV E7基因中的至少一种的表达产物的量。

C.5 C.1-C.4中任一项的方法，其中所述基因由CAB39L、ADAM12、SH3BGRL2、NRG2、COL13A1、GRIN2D、LOXL2、KRT4、EMP1和HSD17B6中的至少四种以及来自HPV E6和/或HPV E7基因中的至少一种的表达产物组成。

C.6 C.1-C.5中任一项的方法，其进一步包括测量标准化基因如KHDRBS1或RPL30或另一种标准化基因的量。

C.7 C.1-C.6中任一项的方法，其中所述测量包括测量mRNA。

C.8 C.1-C.7中任一项的方法，其中所述测量包括免疫测定。

C.9 C.1-C.8中任一项的方法，包括测量至少四种基因的表达。

C.10 C.1-C.9中任一项的方法，其中所述样品包含血清、组织、FFPE、唾液或血浆。

C.11 C.1-C.10中任一项的方法，其中所述个体中的基因表达与所述对照值之间的差异表明所述个体可能患有(即诊断出)HNSCC或易于发展HNSCC(即处于发展HNSCC的风险)。

D.1一种用于检测个体中与头颈鳞状细胞癌(HNSCC)相关的生物标志物的组合物，该组合物包含对表4和/或表6中的至少一种基因的表达水平进行定量的试剂。

D.2任何D.1所述的组合物，其中所述至少一种基因包含CAB39L、ADAM12、SH3BGRL2、NRG2、COL13A1、GRIN2D、LOXL2、KRT4、EMP1或HSD17B6中的至少一种。

D.3 D.1-D.2的组合物，其中的至少一种基因包含CAB39L、ADAM12、SH3BGRL2、NRG2、COL13A1、GRIN2D、LOXL2、KRT4、EMP1或HSD17B6中的至少四种。

D.4 D.1-D.3中任一项的组合物，其进一步包含定量HPV E6和/或E7中的至少一种的表达水平的至少一种试剂。

D.5 D.1-D.4中任一项的组合物，其中所述至少一种基因由CAB39L、ADAM12、SH3BGRL2、NRG2、COL13A1、GRIN2D、LOXL2、KRT4、EMP1和HSD17B6中的至少四种以及HPV E6和/或HPV E7基因中的至少一种的组成。

D.6 D.1-D.5中任一项的组合物，其进一步包含至少一种用于测量至少一种标准化基因例如KHDRBS1或RPL30或另一种标准化基因的试剂。

D.7 D.1-D.6中任一项的组合物，其中所述试剂检测mRNA。

D.8 D.1-D.7中任一项的组合物，其中所述试剂检测蛋白质。

D.9 D.1-D.8中任一项的组合物，其中所述试剂包含用于这些基因中的任何一种的至少一种引物和/或探针，其中所述至少一种引物和/或探针用可检测的部分标记。

D.10 D.1-D.9中任一项的组合物，其中所述个体中的基因表达与所述对照值之间的差异表明所述个体可能患有(即诊断出)HNSCC或易于发展HNSCC(即处于发展HNSCC的风险)。

E.1一种试剂盒，包含前述各段的组成物。

E.2 E.1的试剂盒，进一步包含用于测量至少一种基因和/或确定该值是否与对照值不同的说明书。

E.3 E.1-E.2中任一项的试剂盒，其包含用于至少一种标准化基因例如KHDRBS1或RPL30或另一种标准化基因的阳性对照中的至少一种。

E.4 E.1-E.3中任一项的试剂盒，其还包含用于表4和/或表6中任一个基因的阳性对照中的至少一种。

E.5 E.1-E.4中任一项所述的试剂盒，其中，所述至少一种基因包括CAB39L、ADAM12、SH3BGRL2、NRG2、COL13A1、GRIN2D、LOXL2、KRT4、EMP1或HSD17B6中的至少一种。

E.6 E.1-E.5中任一项所述的试剂盒，其中所述至少一种基因包含CAB39L、ADAM12、SH3BGRL2、NRG2、COL13A1、GRIN2D、LOXL2、KRT4、EMP1或HSD17B6中的至少四种。

E.7 E.1-E.6中任一项的试剂盒，其中所述至少一种基因包含HPV E6和/或E7中的至少一种。

E.8 E.1-E.7中任一项所述的试剂盒，其中所述至少一种基因由CAB39L、ADAM12、SH3BGRL2、NRG2、COL13A1、GRIN2D、LOXL2、KRT4、EMP1和HSD17B6中的至少四种以及HPV E6和/或HPV E7中的至少一种的组成。

E.9 E.1-E.8中任一项的试剂盒，其中所述试剂包含用于这些基因中的任何一种的至少一种引物和/或探针，其中所述至少一种引物和/或探针用可检测的部分标记。

E.10 E.1-E.9中任一项所述的试剂盒，其中所述个体中的基因表达与所述对照值之间的差异表明所述个体可能患有(即诊断出)HNSCC或易于发展HNSCC(即处于发展HNSCC的风险)。

F.1一种治疗HNSCC的方法，包括：

从个体获得样品；

测量样品中来自包含表4和/或表6中的至少一种基因的基因的表达产物的量；

比较样品中表4和/或表6中的至少一种基因的表达与表达的对照值；和

当个体中的基因表达与所述对照值之间的差异表明所述个体可能患有(即诊断出)HNSCC或易于发展HNSCC(即处于发展HNSCC的风险)时，针对HNSCC对个体进行治疗。

F.2 F.1的方法，其中所述基因包含CAB39L、ADAM12、SH3BGRL2、NRG2、COL13A1、GRIN2D、LOXL2、KRT4、EMP1或HSD17B6中的至少一种。

F.3 F.1-F.2的方法，其中所述基因包含CAB39L、ADAM12、SH3BGRL2、NRG2、COL13A1、GRIN2D、LOXL2、KRT4、EMP1和HSD17B6中的至少四种。

F.4 F.1-F.3中任一项的方法，其进一步包括测量来自HPV E6和/或HPV E7基因中至少一种的表达产物的量。

F.5 F.1-F.4中任一项的方法，其中所述基因由CAB39L、ADAM12、SH3BGRL2、NRG2、COL13A1、GRIN2D、LOXL2、KRT4、EMP1和HSD17B6中的至少四种以及来自HPV E6和/或HPV E7基因中的至少一种的表达产物组成。

F.6 F.1-F.5中任一项的方法，进一步包括测量标准化基因如KHDRBS1或RPL30或另一种标准化基因的量。

F.7 F.1-F.6中任一项的方法，其中所述测量包括测量mRNA。

F.8 F.1-F.7中任一项的方法，其中所述测量包括免疫测定。

F.9 F.1-F.8中任一项的方法，包括测量至少四个基因的表达。

F.10 F.1-F.9中任一项的方法，其中所述样品包含血清、组织、FFPE、唾液或血浆。

F.11 F.1-F.10中任一项的方法，包括将表达水平与正常群体的对照值进行比较。

在整个本公开内容中，已经参考和引用了其他文件，例如专利、专利申请、专利出版物、期刊、书籍、论文、网页内容。出于所有目的，所有这些文件通过引用整体并入本文。根据本文的全部内容，包括本文引用的科学和专利文献，对本文描述的那些的各种修改和等同物对于本领域技术人员将变得明显。本文的主题包含可以经调整以适用于在其各种实施方案及其等同形式中实践本公开内容的信息、示例和指导。

Claims

1.一种检测个体中与头颈鳞状细胞癌(HNSCC)相关的生物标志物的方法，包括以下步骤：

从个体获得样品；和

2.根据权利要求1所述的方法，其中所述基因包含CAB39L、ADAM12、SH3BGRL2、NRG2、COL13A1、GRIN2D、LOXL2、KRT4、EMP1或HSD17B6中的至少一种。

3.根据权利要求1所述的方法，其进一步包括测量来自HPV E6和/或HPV E7基因中的至少一种的表达产物的量。

4.根据权利要求1所述的方法，其进一步包括测量标准化基因的量。

5.根据权利要求1所述的方法，其中所述测量包括测量mRNA。

6.根据权利要求1所述的方法，其中所述测量包括免疫测定。

7.根据权利要求1所述的方法，其包括测量所述基因中的至少四种的表达。

8.根据权利要求1所述的方法，其中所述样品包括血清、组织、FFPE、唾液或血浆。

9.一种检测个体对头颈鳞状细胞癌(HNSCC)的易感性的方法，包括：

从个体获得样品；和

将样品中表4和/或表6中的至少一种基因的表达与该基因的表达产物的对照值进行比较，其中个体中的基因表达与对照值之间的差异表明个体可能患有或易患HNSCC(即患HNSCC的风险增加)。

10.根据权利要求9所述的方法，其中所述基因包含CAB39L、ADAM12、SH3BGRL2、NRG2、COL13A1、GRIN2D、LOXL2、KRT4、EMP1或HSD17B6中的至少一种。

11.根据权利要求9所述的方法，其进一步包括测量HPV E6和/或E7基因中的至少一种的至少一种表达产物的量；和将样品中HPV E6和/或E7基因中的至少一种的表达与表达的对照值进行比较。

12.根据权利要求9所述的方法，其进一步包括测量标准化基因的量。

13.根据权利要求9所述的方法，其中所述测量包括mRNA的测量。

14.根据权利要求9所述的方法，其中所述测量包括蛋白质的测量。

15.根据权利要求9所述的方法，包括测量所述基因中的至少四种的表达。

16.根据权利要求9所述的方法，其中所述样品包括血清、组织、FFPE、唾液或血浆。

17.一种用于检测个体中与头颈鳞状细胞癌(HNSCC)相关的生物标志物的组合物，其包含定量表4和/或表6中的至少一种基因的表达水平的试剂。

18.根据权利要求17所述的组合物，其中所述至少一种基因包含CAB39L、ADAM12、SH3BGRL2、NRG2、COL13A1、GRIN2D、LOXL2、KRT4、EMP1或HSD17B6中的至少一种。

19.根据权利要求17所述的组合物，其还包含定量HPV E6和/或E7中的至少一种的表达水平的至少一种试剂。

20.根据权利要求17所述的组合物，其进一步包含至少一种标准化基因。

21.根据权利要求17所述的组合物，其中所述试剂检测mRNA。

22.根据权利要求17所述的组合物，其中所述试剂包含用于这些基因中的任何一种的至少一种引物和/或探针，其中所述至少一种引物和/或探针用可检测的部分标记。

23.根据权利要求17所述的组合物，其中所述试剂检测蛋白质。

24.一种试剂盒，其包含定量表4和/或表6的至少一种基因的表达水平的试剂。