CN107109470B

CN107109470B - 用于诊断胃癌的miRNA生物标志物

Info

Publication number: CN107109470B
Application number: CN201580054452.0A
Authority: CN
Inventors: 朱兴奋; 周砺寒; 邹瑞阳; 杨启源; 苏博欣; 朱峰; 杨维平
Original assignee: NAT UNIVERSITY HOSPITAL SINGAP; Agency for Science Technology and Research Singapore; National University of Singapore
Current assignee: NAT UNIVERSITY HOSPITAL SINGAP; Agency for Science Technology and Research Singapore; National University of Singapore
Priority date: 2014-08-07
Filing date: 2015-08-11
Publication date: 2020-09-15
Anticipated expiration: 2035-08-11
Also published as: KR20170035932A; EP3744859A2; KR102237960B1; KR102604163B1; EP3177739A4; EP4137586A1; JP6702935B2; JP2022188053A; JP2017525350A; JP2020141684A; EP3177739A1; SG11201700944RA; EP3744859A3; CN107109470A; WO2016022076A1; KR20210057079A; EP3177739B1; SG10202011339RA; US10767230B2; US20170233822A1

Abstract

本发明公开了确定受试者患有胃癌或发展胃癌的可能性的方法。所述方法包括测定从所述受试者获得的非细胞生物流体样品中与如本文所述的miRNA具有至少90％序列同一性的至少一种miRNA的表达水平，其中与对照相比，从所述受试者获得的样品中miRNA表达的差异表达可以指示所述受试者患有胃癌并且其中所述miRNA可以是被列为“上调”的miRNA或被列为“下调”的miRNA。还公开了一种确定受试者患有一定阶段的胃癌或发展一定阶段的胃癌的可能性的方法。

Description

用于诊断胃癌的miRNA生物标志物

对相关申请的交叉引用

本申请要求2014年8月7日提交的新加坡专利申请号10201404742W的优先权，该新加坡专利申请的内容在此出于所有目的以引用的方式整体并入本文。

技术领域

本发明涉及生物化学，特别是生物标志物。具体来说，本发明涉及与癌症相关的生物标志物以及使用所述生物标志物确定患者患有癌症，如胃癌的可能性的方法。

背景技术

胃癌在世界范围内是第四大最常见的癌症(>每年100万例)以及第二大最常见的癌症死亡原因。胃癌的预后是不佳的，5年存活率小于10％，这主要是因为通常在所述疾病的晚期状态表现出病况。因此，为了改善临床结果，对所述疾病进行早期检测和准确监测是必要的。目前，内窥镜检查法是用于早期诊断的唯一可靠的方法，但是它由于高成本和高风险而被限制为一种筛查测试。一种用于胃癌的具有更低侵入性的筛查测试是非常理想的并且应当减少不必要的内窥镜检查。

因此，本发明提供了一种检测胃癌的替代方法。

发明内容

在一个方面，提供了一种检测或诊断受试者的胃癌或确定受试者发展胃癌的可能性的方法，所述方法包括：确定从所述受试者获得的非细胞生物流体样品中与以下miRNA具有至少90％序列同一性的至少一种miRNA的表达水平，其中与对照相比，所述miRNA表达的差异表达指示所述受试者患有胃癌，并且其中所述miRNA是选自由以下各项组成的组的“上调”的miRNA：hsa-miR-142-5p、hsa-miR-29c-3p、hsa-miR-93-5p、hsa-miR-140-5p、hsa-miR-148a-3p、hsa-miR-183-5p、hsa-miR-29b-3p、hsa-miR-424-5p、hsa-miR-101-3p、hsa-miR-106b-3p、hsa-miR-128、hsa-miR-1280、hsa-miR-140-3p、hsa-miR-15b-3p、hsa-miR-186-5p、hsa-miR-18b-5p、hsa-miR-197-3p、hsa-miR-19a-3p、hsa-miR-19b-3p、hsa-miR-20b-5p、hsa-miR-21-3p、hsa-miR-23a-5p、hsa-miR-25-3p、hsa-miR-27a-5p、hsa-miR-29a-3p、hsa-miR-29b-2-5p、hsa-miR-29c-5p、hsa-miR-338-5p、hsa-miR-425-3p、hsa-miR-4306、hsa-miR-450a-5p、hsa-miR-486-5p、hsa-miR-500a-3p、hsa-miR-501-5p、hsa-miR-532-3p、hsa-miR-550a-5p、hsa-miR-579、hsa-miR-589-5p、hsa-miR-590-5p、hsa-miR-598、hsa-miR-616-5p、hsa-miR-627、hsa-miR-629-3p、hsa-miR-629-5p、hsa-miR-93-3p、hsa-miR-195-5p、hsa-miR-18a-3p、hsa-miR-363-3p、hsa-miR-181a-2-3p、hsa-miR-16-5p、hsa-miR-501-3p、hsa-miR-23a-3p、hsa-miR-339-3p、hsa-miR-15a-5p、hsa-miR-320b、hsa-miR-374b-5p、hsa-miR-650、hsa-miR-1290、hsa-miR-22-3p、hsa-miR-320c、hsa-miR-130a-3p、hsa-miR-320e、hsa-miR-378a-3p、hsa-miR-9-5p、hsa-miR-200b-3p、hsa-miR-141-3p、hsa-miR-191-5p、hsa-miR-628-5p、hsa-miR-484、hsa-miR-425-5p；或选自由以下各项组成的组的“下调”的miRNA：hsa-miR-103a-3p、hsa-miR-30a-5p、hsa-miR-181a-5p、hsa-miR-107、hsa-miR-26a-5p、hsa-miR-126-3p、hsa-miR-99b-5p、hsa-miR-339-5p、hsa-miR-122-5p、hsa-miR-136-5p、hsa-miR-139-5p、hsa-miR-146a-5p、hsa-miR-154-5p、hsa-miR-193b-3p、hsa-miR-23c、hsa-miR-30b-5p、hsa-miR-337-5p、hsa-miR-382-5p、hsa-miR-409-3p、hsa-miR-411-5p、hsa-miR-485-3p、hsa-miR-487b、hsa-miR-495、hsa-miR-885-5p、hsa-miR-99a-5p、hsa-miR-362-5p、hsa-miR-671-3p、hsa-miR-454-3p、hsa-miR-328、hsa-miR-320a、hsa-miR-126-5p、hsa-miR-27a-3p、hsa-miR-30d-5p、hsa-miR-10a-5p、hsa-miR-10b-5p、hsa-miR-497-5p、hsa-miR-134、以及hsa-miR-150-5p。

在另一个方面，提供了一种检测或诊断受试者的胃癌阶段或确定受试者患有一定阶段的胃癌的可能性的方法，所述方法包括：确定从所述受试者获得的非细胞生物流体样品中与如选自由以下各项组成的组的表中的至少一个表中所列的miRNA具有至少90％序列同一性的至少一种miRNA(miRNA)的表达水平：表8、表15、表16、以及表17；并且其中与对照相比，所述样品中miRNA表达的差异表达诊断所述受试者患有1期、2期、3期或4期胃癌中的任一种。

在又另一个方面，提供了一种检测或诊断受试者的胃癌的方法，所述方法包括以下步骤：(a)测定非细胞生物流体样品中至少一种miRNA的表达水平，其中所述miRNA与选自由以下各项组成的组的miRNA具有至少90％序列同一性：hsa-miR-103a-3p、hsa-miR-142-5p、hsa-miR-29c-3p、hsa-miR-30a-5p、hsa-miR-107、hsa-miR-26a-5p、hsa-miR-140-5p、hsa-miR-148a-3p、hsa-miR-29b-3p、hsa-miR-126-3p、hsa-miR-181a-5p、hsa-miR-27a-5p、hsa-miR-616-5p、hsa-miR-484、hsa-miR-4306、hsa-miR-590-5p、hsa-miR-362-5p、hsa-miR-106b-3p、hsa-miR-497-5p、hsa-miR-18b-5p、hsa-miR-122-5p、hsa-miR-200b-3p、hsa-miR-197-3p、hsa-miR-486-5p、hsa-miR-99a-5p、hsa-miR-885-5p、hsa-miR-598、hsa-miR-454-3p、hsa-miR-130a-3p、hsa-miR-150-5p、hsa-miR-30d-5p、hsa-miR-10b-5p、hsa-miR-532-3p、hsa-miR-23a-5p、hsa-miR-21-3p、hsa-miR-136-5p、hsa-miR-1280、以及hsa-miR-16-5p；(b)基于步骤(a)中所测定的所述miRNA的表达水平产生分数；以及(c)使用所述分数预测所述受试者患有胃癌的可能性，其中所述分数是通过比较所述受试者的表达水平与阳性对照(来自胃癌受试者的样品)或阴性对照(来自未患胃癌的受试者的样品)的表达水平相的分类算法来计算的，并且其中所述分数鉴定所述受试者发生以下事件的可能性：i.患有胃癌，所述分数将落入所述阳性对照的分数内；或ii.没有患胃癌(未患胃癌)，所述分数将落入所述阴性对照的分数内。

附图说明

在结合非限制性实施例和附图考虑时，通过参考详细说明将更好地理解本发明，其中：

图1示出了在患有胃癌的患者中所检测的miRNA的划分的示意图。

图2示出了在临床样品中所检测的miRNA的高通量miRNA RT-qPCT测定的工作流程图的一个实例。图2示出了在从临床样品中分离总miRNA到最后的数据处理和统计分析的过程中发生的步骤。如图2中所示，首先对临床样品进行“分离”步骤，这指的是从样品，如患者的血清中分离和纯化miRNA。随后，向样品中添加追踪miRNA，这些miRNA是非天然的合成miRNA模拟物(即具有22个至24个碱基范围的长度的小单链RNA)。将这些追踪miRNA添加到样品中以监测包括分离、逆转录、扩增以及qPCR的各种步骤的效率。随后，将miRNA分成多个多重组。这一步骤被称为“多重设计”，其中miRNA测定在计算机中被有意分成多个多重组(每组45个至65个miRNA)以使RT和扩增过程期间的非特异性扩增和引物-引物相互作用减到最低限度。随后，样品经历“多重逆转录”过程，其中将各种逆转录引物池组合并且添加到不同的多重组中以产生cDNA。在产生cDNA时，将PCR引物池与每一个所产生的cDNA池(来自某个多重组)组合并且进行优化的降落PCR以同时提高组中总cDNA的量。这一提高总(全部)cDNA的量的步骤被称为“扩增”步骤。在扩增之后并且在数据处理和统计分析之前，扩增的cDNA经单重qPCR，这指的是将扩增的cDNA池分布在384孔板中的各个孔中，然后进行单重qPCR反应的步骤。在测定临床样品中的miRNA的同时，一起测定合成的miRNA标准曲线以获得所有测定中的绝对拷贝数的内插。因此，图2提供了在以下实验部分中发生的miRNA样品处理的详细的逐步工作流程。

图3示出了在从受试者获得的样品中一致检测到的miRNA的热图。图3示出了所有可靠检测到的miRNA(如表4中所列)的热图表示；miRNA的表达水平(拷贝数/毫升)以log2标度呈现并且相对于零平均值标准化。点的颜色表示浓度。基于欧几里德距离针对两个维度(miRNA和样品)进行分层聚类。对于水平维度：黑色表示胃癌受试者并且白色表示正常/对照受试者。

图4示出了调节的miRNA的热图。具体来说，如图4中所示的热图表示胃癌中所有调节的miRNA，它们列于表6中。miRNA的表达水平(拷贝数/毫升)是以log2标度呈现的并且相对于零平均值标准化。灰度表示miRNA的浓度。基于欧几里德距离针对两个维度(miRNA和样品)进行分层聚类。对于水平维度：黑色表示胃癌受试者并且白色表示正常/对照受试者。

图5示出了箱形图，这些图代表与正常/对照受试者相比，所有的胃癌受试者(不考虑亚型和阶段)中排序最高的上调miRNA(hsa-miR-142-5p)和下调miRNA(hsa-miR-99b-5p)的表达水平。表达水平(拷贝数/毫升)是以log2标度呈现的。箱形图呈现了落入表达水平分布的第25个、第50个、以及第75个百分位数内的受试者的miRNA表达水平。AUC指的是接受者操作特征曲线下面积。

图6示出了点图，该图示出了所有可靠检测到的miRNA之间的相关性分析的结果。基于log2标度表达水平(拷贝数/毫升)，在所有191种可靠检测到的miRNA靶标之间计算皮尔森氏线性相关效率，这些靶标列于表4中。每一个点表示一对miRNA，其中相关效率高于0.5(左侧图表，正相关)或低于-0.5(右侧图表，负相关)并且其中具有不等于零的相关性的p值低于0.01。

图7示出了点图，该点图示出了胃癌生物标志物的相关性分析的结果。基于log2标度表达水平(拷贝数/毫升)，在胃癌受试者中发生改变的所有75种miRNA之间计算皮尔森氏线性相关效率，这些miRNA列于表6中。每一个点表示一对miRNA，其中相关效率高于0.5(左图，正相关)或低于-0.5(右图，负相关)并且具有不等于零的相关性的p值低于0.01。因此，总之，图6和图7显示发现大量的癌症相关miRNA和非相关miRNA呈正相关，这使得选择最好的miRNA组合来进行胃癌诊断具有挑战性。

图8示出了图表，这些图表绘制了与正常/对照相比，在胃癌的各个阶段中各种排序最高的miRNA的灵敏度和特异性。更确切地说，图8示出了与正常/对照受试者的miRNA相比，各个阶段的胃癌受试者中最高(基于AUC，这是接受者操作特征曲线下面积)上调miRNA(第1行)和下调miRNA(第2行)的接受者操作特征曲线。

图9示出了维恩图，这些图说明了胃癌的各个阶段的生物标志物之间的重叠。这些维恩图是基于表8、表9、表10以及表11产生的。因此，图9显示除了在3期和4期这两者中所观测到的大的重叠之外，用于确定胃癌的各个阶段的miRNA似乎对与它们具有相关性的阶段具有特异性，该预期是因为这两个阶段在临床上是密切相关的。

图10示出了在计算机四重交叉验证期间的发现和验证阶段中多变量生物标志物组(miRNA的数目是3个至10个)的诊断能力(AUC)的箱形图。使用线性支持向量机作为模型，基于样品的发现集，使用序列前向浮动搜索来鉴定具有3个至10个miRNA的生物标志物组，并且在样品的另一个独立集中验证。进行多次四重交叉验证。箱形图呈现了用于正常/对照受试者和胃癌受试者的分类的AUC中miRNA集合的第25个、第50个、以及第75个百分位数。图10示出了从各种多变量生物标志物组获得的数据的稳健性。

图11示出了条形图，该条形图示出了在交叉验证过程期间在发现集(黑色条柱)和验证集(灰色条柱)中各种多变量生物标志物组的AUC的平均值。误差棒表示AUC的标准偏差。为了测试当将更多的miRNA包括在组中时验证集中AUC提高的显著性，进行右尾t检验来比较所有相邻的灰色条柱。*：p值<0.05；**：p值<0.01；***：p值<0.001。因此，图11示出了多变量生物标志物组集合中各种数目的miRNA之间AUC的差异。

图12示出了汇总如本文所述的用于确定受试者患有胃癌的可能性时方法的步骤的示意图。

图13示出了汇总如本文所述的用于确定受试者患有一个阶段的胃癌的可能性时的方法的步骤的示意图。

图14示出了汇总如本文所述的确定受试者患有胃癌的可能性中的多变量方法的步骤的示意图。

图15示出了(A)在这一研究中对照受试者和胃癌受试者的癌症风险分数的箱形图表示；(B)在这一研究中对照受试者的与逻辑分布拟合的癌症风险分数的概率分布和胃癌受试者的与逻辑分布拟合的癌症风险分数的概率分布；(C)未知的受试者(属于高风险群体)患有胃癌的概率取决于癌症风险分数的值(基于来自国立大学医院(NationalUniversity Hospital)的数据，高风险群体中胃癌的患病率是0.0067)；(D)与高风险群体中胃癌的患病率相比，未知的受试者在各种癌症风险分数水平下患有胃癌的概率(风险)的倍数增加。虚线限定了将受试者分到高癌症风险组(H)、中癌症风险组(M)或低癌症风险组(L)中的阈值分数。

表的简要说明

在结合非限制性实施例和附表考虑时，通过参考详细说明将更好地理解本发明，其中：

表1示出了用于胃癌的血清/血浆微小RNA生物标志物研究的汇总。表1汇总了测定无细胞血清/血浆样品中miRNA的水平的各种研究。只有用RT-qPCR验证的结果列于该表中。“GC”指的是胃癌受试者并且“C”指的是对照受试者。

表2示出了在本公开的实验部分中分析的胃癌受试者的临床信息。在任何治疗之前从236名胃癌受试者采集所有血清并且在使用之前储存在-80℃。幽门螺杆菌(H.Pylori)感染的状态也在标记为“幽门螺杆菌(H Pylori)”的列中指示，这指的是幽门螺杆菌(Helicobacter pylori)。

表3示出了正常受试者(对照)的临床信息。在采集样品时，通过内窥镜检查法确认所有的正常/对照受试者(237名受试者)未患胃癌。对受试者进行随访3年-5年，其中每2年进行内窥镜检查筛查以确保所述受试者在这段时间内没有发展胃癌。所有血清在使用之前储存在-80℃。幽门螺杆菌感染的状态也在标记为“幽门螺杆菌(H Pylori)”的列中指示，这指的是幽门螺杆菌(Helicobacter pylori)。

表4示出了在胃癌受试者和正常受试者(对照)这两者的血清样品中可靠检测到的191种miRNA的序列。当至少90％的血清样品具有高于每毫升500个拷贝的浓度时，miRNA被认为是“可靠检测到的”。miRNA是根据miRBase V18版本命名的。

表5示出了胃癌受试者和健康对照(正常受试者/对照)这两者的特征的汇总。

表6列出了在正常受试者(对照)和胃癌受试者中差异表达的miRNA。对于正常/对照与所有胃癌受试者(不考虑亚型和阶段)之间的比较，在错误发现率校正(邦费罗尼法(Bonferroni method))之后，75种miRNA具有低于0.01的p值。AUC：接受者操作特征曲线下面积；倍数变化：用癌症群体中miRNA的平均表达水平(拷贝数/毫升)除以正常/对照群体中miRNA的平均表达水平。

表7示出了当前研究与其它文献报道之间的比较。表4中没有列出的miRNA(即具有≥500个拷贝/毫升的表达水平的miRNA)被认为是低于所述研究的检测限度(N.D.)。因此，表7显示，本领域中大部分所声称的差异调节的miRNA不同于本公开的示例性miRNA。

表8列出了在正常受试者(对照)与1期胃癌受试者之间差异表达的miRNA。对于正常/对照与1期胃癌受试者之间的比较，在错误发现率校正(邦费罗尼法)之后，20种miRNA具有低于0.01的p值。AUC：接受者操作特征曲线下面积；倍数变化：用癌症群体中miRNA的平均表达水平(拷贝数/毫升)除以正常/对照群体中miRNA的平均表达水平。

表9列出了在正常受试者(对照)与2期胃癌受试者之间差异表达的miRNA。对于正常/对照与2期胃癌受试者之间的比较，在错误发现率校正(邦费罗尼法)之后，62种miRNA具有低于0.01的p值。AUC：接受者操作特征曲线下面积；倍数变化：用癌症群体中miRNA的平均表达水平(拷贝数/毫升)除以正常/对照群体中miRNA的平均表达水平。

表10列出了在正常受试者(对照)与3期胃癌受试者之间差异表达的miRNA。对于正常/对照与3期胃癌受试者之间的比较，在错误发现率校正(邦费罗尼法)之后，43种miRNA具有低于0.01的p值。AUC：接受者操作特征曲线下面积；倍数变化：用癌症群体中miRNA的平均表达水平(拷贝数/毫升)除以正常/对照群体中miRNA的平均表达水平。

表11列出了在正常受试者(对照)与4期胃癌受试者之间差异表达的miRNA。对于正常/对照与4期胃癌受试者之间的比较，在错误发现率校正(邦费罗尼法)之后，74种miRNA具有低于0.01的p值。AUC：接受者操作特征曲线下面积；倍数变化：用癌症群体中miRNA的平均表达水平(拷贝数/毫升)除以正常/对照群体中miRNA的平均表达水平。

表12列出了在多变量生物标志物组鉴定过程中所鉴定的miRNA。汇总了所选用于具有6个、7个、8个、9个、以及10个miRNA的生物标志物组的集合的miRNA的身份。出现率是通过所有组中miRNA的计数除以组的总数来定义的。具有前10％AUC和后10％AUC的组被排除以避免由于来自由交叉验证分析中的随机化过程所产生的亚群的不准确数据的拟合而对错误发现的生物标志物进行计数。仅列出其中具有4个或更多计数的miRNA。胃癌的各个阶段中miRNA的变化是基于表6、8-11来限定的。

表13示出了在多变量生物标志物组选择过程中被频繁选择的miRNA的出现率的统计值。使用来自以下两个miRNA组的不同数目的miRNA的miRNA组的百分比：hsa-miR-134、hsa-miR-1280、hsa-miR-27a-5p组；以及hsa-miR-425-5p、hsa-660-5p组。验证集中由AUC限定的具有6个、7个、8个、9个、10个miRNA的生物标志物组的前10％和后10％(图10)被排除在计数之外。

表14列出了在本领域先前没有报道的在正常/对照与胃癌(不考虑阶段)之间差异表达的miRNA(其列于表1中)。

表15列出了在本领域先前没有报道的在正常/对照与2期胃癌之间差异表达的miRNA。

表16列出了在本领域先前没有报道的在正常/对照与3期胃癌之间差异表达的miRNA。

表17列出了在本领域先前没有报道的在正常/对照与4期胃癌之间差异表达的miRNA。

表18列出了在本领域先前没有报道的在正常/对照与胃癌的1期、2期、3期、4期或所有阶段之间差异表达的miRNA。表18是表14、表8、表15、表16以及表17的组合。

表19列出了被频繁地选择用于多变量生物标志物组中的miRNA，其中所述miRNA的表达水平在胃癌受试者中发生改变(即来自表12的显著组)，它们在本领域先前没有被报道。

表20列出了被频繁地选择用于多变量生物标志物组中的miRNA，其中所述miRNA的表达水平在胃癌受试者中没有发生改变(即来自表12的不显著组)，它们在本领域先前没有被报道。

表21列出了在多变量生物标志物组鉴定过程中被频繁地选择的具有>20％的出现率的12种miRNA(和它们的Ki系数值)，它们被组合以计算图15中的癌症风险分数(式1)。

具体实施方式

微小RNA(miRNA)是已知在基因表达调节中起作用的小的非编码RNA，并且异常的表达牵涉到包括胃癌在内的多种癌症的发病。已知miRNA可以用于确定受试者发展癌症的可能性。

因此，在一个方面，提供了一种用于确定受试者发展或患有胃癌的可能性的方法。在一个实施例中，图12汇总了用于确定受试者发展或患有胃癌的可能性的方法的步骤。在一个实施例中，所述方法还可以用于检测或诊断受试者的胃癌。在一个实施例中，所述方法是体外方法。在一个实施例中，如本文所述的方法可以包括测定或确定从所述受试者获得的非细胞生物流体样品中与表18中所列的miRNA具有至少90％序列同一性的至少一种微小RNA(miRNA)的表达水平，其中与对照相比，miRNA表达的差异表达指示了所述受试者患有胃癌并且其中所述miRNA是表18中被列为“上调”的miRNA或者表18中被列为“下调”的miRNA。

表18列出了可以用于确定患者发展或患有胃癌的可能性的miRNA，如下：

如本文所用的术语“miRNA”或“微小RNA”或“miR”指的是包含内源性非编码基因的产物的RNA(或RNA类似物)，所述基因的前体RNA转录物可以形成小的茎-环，核酸内切酶切丁酶(Dicer)从所述茎-环切割成熟“miRNA”。miRNA是在如下基因中编码的，所述基因不同于表达受它们控制的mRNA。在一个实施例中，术语“miRNA”或“微小RNA”指的是具有共价连接在一起的至少10个核苷酸而不超过35个核苷酸的单链RNA分子。在一个实施例中，多核苷酸具有10个至33个核苷酸或15个至30个核苷酸的长度或具有17个至27个核苷酸或18个至26个核苷酸的长度的分子，即具有10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、或35个核苷酸的长度，不包括任选的标记和/或延伸序列(例如生物素段)在内。如本文所述的miRNA的序列提供于本文提供的表4中，该表4包括miRNA序列SEQ ID NO:1至SEQ IDNO:191。如本领域技术人员所将了解的那样，miRNA是具有包含诸如“ATGC”的字母的序列的一种类型的多核苷酸。应当了解的是，除非另作说明，否则核苷酸从左到右是按照5'→3'顺序，并且“A”表示脱氧腺苷，“C”表示脱氧胞苷，“G”表示脱氧鸟苷，并且“T”表示脱氧胸苷。字母A、C、G、以及T可以用于指碱基本身、包含碱基的核苷或核苷酸，这在本领域中是标准的。这个术语包括由天然存在的核碱基、糖以及核苷酸间(骨架)键构成的寡核苷酸以及发挥类似功能或具有特定提高的功能的具有非天然存在的部分的寡核苷酸。在天然存在的多核苷酸中，核苷间键通常是磷酸二酯键，并且亚单位被称为“核苷酸”。术语“寡核苷酸”还可以包括完全或部分修饰或取代的寡核苷酸，如在碱基和/或糖中修饰或取代。

如本公开的领域中所了解的那样，在如本文所述的方法中的任一种中，miRNA可以不与如表4中所列的miRNA的序列具有100％序列同一性。因此，在一个实施例中，所测定的miRNA可以与如表8、表15、表16、表17、表18、表19或表20中任一个表中所列的miRNA(参考表4)具有至少75％、或至少80％、或至少85％、或至少90％、或至少95％、或至少97.5％、或至少98％、或至少99％、或至少99.9％序列同一性。在一个实施例中，所测定的miRNA可以具有一个、两个、三个或四个核苷酸取代。因此，可以使用如下试剂来检测如本文所述的方法中所用的miRNA，所述试剂可能能够与如表8、表15、表16、表17、表18、表19或表20中所列的序列(参考表4中所提供的序列)特异性杂交或结合。如本文所用的术语“与……杂交”和“杂交”可与术语“对……具有特异性”和“特异性结合”互换使用并且指的是与互补核酸的序列特异性非共价结合相互作用，例如靶核酸序列与靶特异性核酸引物或探针之间的相互作用。在一个实施例中，杂交的核酸探针是以大于70％、大于80％、大于90％或100％的选择性杂交的核酸探针(即与如本文所述的miRNA之一的交叉杂交可以小于30％、小于20％、小于10％发生)。如本领域技术人员所将了解的那样，与如本文所述的miRNA“杂交”的核酸探针可以考虑长度和组成来确定。在一个实施例中，与如本文所述的miRNA中的任一种杂交的核酸探针可以具有一个、或两个、或三个错配碱基配对。在一个实施例中，如本文所述的术语“miRNA”可以包括如下的miRNA，在产生期间，所述miRNA的3'末端和/或5'末端可以被修饰和/或消化。在一个实施例中，已经在产生期间在3'末端和/或5'末端处被修饰和/或消化的miRNA由本发明的测定所挑选。在一个实施例中，如本文所公开的miRNA可以包括可以与如表4中所列的序列有3个、或4个、或5个核苷酸不同的miRNA。

如本文所用的术语“癌症”指的是具有致癌细胞典型的特征，如不受控制的增殖、永生、转移潜能、快速生长和增殖速率、以及本领域已知的某些特征性形态特征的细胞的存在。在一个实施例中，“癌症”可以是胃癌或胃部癌症。在一个实施例中，“癌症”可以包括恶变前癌症以及恶性癌症。因此，术语“胃癌”涵盖了如由国家卫生研究院的国家癌症研究所所描述的胃癌的所有阶段。

在一个实施例中，如由本领域技术人员所了解的那样，如本文所述的方法不涉及由医生/医师执行的步骤。因此，在可以向受试者提供由医师进行的最后诊断之前，由如本文所述的方法所获得的结果需要结合临床数据和其它临床表现。关于受试者是否患有胃癌的最后诊断是医师的范围并且不被认为是本公开的一部分。因此，如本文所用的术语“确定”、“检测”以及“诊断”指的是鉴定受试者患有处在任何发展阶段的疾病(如胃癌)的几率或可能性或确定受试者对发展所述疾病的易感性。在一个实施例中，在表现症状之前进行“诊断”、“确定”、“检测”。在一个实施例中，“诊断”、“确定”、“检测”允许临床医生/医师(结合其它临床表现)在疑似患有胃癌的受试者中确认胃癌。

如本文所用的术语“差异表达”指的是一种样品中一种或多种miRNA的表达水平(如通过miRNA的量所测定的)与第二样品中相同的一种或多种miRNA的表达水平相比较或相对于预定参考值或对照的差异。差异表达可以通过本领域已知的方法来确定，如通过阵列杂交、下一代测序、RT-PCR以及如本领域技术人员所将了解的其它方法。

根据如本文所述的方法的目的，用于确定是否观测到差异表达的对照组可以是不同的。然而，作为一般规则，在如本文所述的任何给定方法中，对照组可以容易地由本领域技术人员来确定。除非另外确切提到，否则在一个实施例中，对照组可以是没患任何胃癌相关疾病的受试者。在一个实施例中，对照组可以是没患任何现有疾病的健康受试者。在一个实施例中，对照组可以是已知患有非胃癌相关疾病的受试者，诸如但不限于胃炎、肠上皮化生、肠萎缩等。在一个实施例中，对照可以根据样品的性质以及其它因素而变化，所述因素诸如作为获得训练数据集的基础的受试者的性别、年龄、种族。在一个实施例中，对照受试者可以是亚洲种族或血统，例如华裔或华裔血统。

在一个实施例中，当发现在与对照相比时如表18中被列为“上调”的miRNA在从疑似患有胃癌的受试者获得的样品中上调时，观测到差异表达。因此，在一个实施例中，与对照相比，如表18中被列为“上调”的miRNA的上调可以指示所述受试者患有胃癌或诊断所述受试者患有胃癌。

如本文所用，在如本文所述的任何实施例或方法中，术语“上调”指的是与对照相比miRNA表达水平的增加或检测到更多的miRNA拷贝。在一个实施例中，如果表达水平相对于对照有至少约1.01倍的变化或更多，那么miRNA可以被认为是“上调的”。在一个实施例中，对于所述变化的统计检验中的p值可以低于0.05。在一个实施例中，p值可以使用本领域已知的统计检验，如t检验(p值<0.01)来计算。在另一个实施例中，所述统计检验是t检验(p值<0.01)，所述t检验是使用如本领域已知的邦费罗尼型多重比较程序针对错误发现率(FDR)估计校正的。这示例性地用于以下实施例中。在一个实施例中，如果表达水平相对于对照有至少约1.02倍的变化至约2.5倍的变化，那么miRNA可以被认为是“上调的”。在一个实施例中，如表6中所举例说明，如果表达水平相对于对照有至少约1.05倍的变化至约1.53倍的变化，那么miRNA可以被认为是“上调的”。在一个实施例中，如果表达水平相对于对照可以有约1.10倍、或约1.15倍、或约1.20倍、或约1.25倍、或约1.30倍、或约1.35倍、或约1.40倍、或约1.45倍、或约1.50倍的变化，那么miRNA可以被认为是“上调的”。如本文所用，对照可以是未患胃癌的受试者。

在一个实施例中，当发现在与对照相比时如表18中被列为“下调”的miRNA在从疑似患有胃癌的受试者获得的样品中下调时，观测到差异表达。因此，在一个实施例中，与对照相比，如表18中被列为“下调”的miRNA的下调可以指示所述受试者患有胃癌或可以诊断所述受试者患有胃癌。

如本文所用，在如本文所述的任何实施例或方法中，术语“下调”指的是与对照相比miRNA表达水平的降低或检测到更少的miRNA拷贝。在一个实施例中，如果表达水平显示相对于对照有至少约0.99倍的变化或更低，那么miRNA可以被认为是“下调的”。在一个实施例中，对于所述变化的统计检验中的p值可以低于0.05。在一个实施例中，p值可以使用本领域已知的统计检验，如t检验(p值<0.01)来计算。在另一个实施例中，所述统计检验是t检验(p值<0.01)，所述t检验是使用如本领域已知的邦费罗尼型多重比较程序针对错误发现率(FDR)估计校正的。这示例性地用于以下实施例中。在一个实施例中，如果表达水平相对于对照有至少约0.98倍的变化至约0.3倍的变化，那么miRNA可以被认为是“下调的”。在一个实施例中，如表6中所举例说明，如果表达水平显示相对于对照有至少约0.5倍的变化至约0.92倍的变化，那么miRNA可以被认为是“下调的”。在一个实施例中，如果表达水平相对于对照可以有约0.95倍、或约0.90倍、或约0.85倍、或约0.80倍、或约0.75倍、或约0.70倍、或约0.65倍、或约0.60倍、或约0.55倍的变化，那么miRNA表达可以被认为是“下调的”。如本文所用，对照可以是未患胃癌的受试者。

术语“约”在本文用于表示值包括可能因用于测定所述值的装置、方法的使用而出现的如本领域已知的固有误差变异或研究受试者间存在的变异。因此，在一个实施例中，如在整个如本文所述的本公开中所用的术语“约”在表达的倍数变化的背景下可以意指指定值+/-5％、或指定值+/-4％、或指定值+/-3％、或指定值+/-2％、或指定值+/-1％、或指定值+/-0.5％。

在一个实施例中，如本文所述的方法可以测定如表18中所列的一种或多种miRNA的差异表达。因此，在一个实施例中，所述方法可以测定如表18中所列的miRNA中的至少2种、或至少3种、或至少4种、或至少5种、或至少6种、或至少7种、或至少8种、或至少9种、或至少10种、或至少11种、或至少12种、或至少13种、或至少14种、或至少15种、或至少20种、或至少25种、或至少30种、或至少35种、或至少40种、或至少45种、或至少50种、或至少55种、或至少60种、或至少65种、或至少70种、或至少75种、或至少80种、或至少85种、或至少90种、或至少95种、或至少100种、或至少105种、或至少107种或全部的差异表达。在一个实施例中，所述方法可以测定表18中所列的1种至108种miRNA、或如表18中所列的2种至10种、或11种至30种、或31种至50种、或50种至70种、或71种至90种、或91种至108种miRNA。在一个实施例中，所述方法可以测定表18中所列的所有miRNA的差异表达。

在一个实施例中，如本文所述的方法可以测定如表18中被列为“上调”的至少一种miRNA和如表18中被列为“下调”的至少一种miRNA的差异表达。在一个实施例中，所述方法可以测定以下各项的差异表达：如表18中被列为“上调”的miRNA中的至少2种、或至少3种、或至少4种、或至少5种、或至少6种、或至少7种、或至少8种、或至少9种、或至少10种、或至少11种、或至少12种、或至少13种、或至少14种、或至少15种、或至少20种、或至少25种、或至少30种、或至少35种、或至少40种、或至少45种、或至少50种、或至少55种、或至少60种、或至少65种、或70种；以及如表18中被列为“下调”的miRNA中的至少2种、或至少3种、或至少4种、或至少5种、或至少6种、或至少7种、或至少8种、或至少9种、或至少10种、或至少11种、或至少12种、或至少13种、或至少14种、或至少15种、或至少20种、或至少25种、或至少30种、或至少35种、或38种。

在一个实施例中，如本文所述的方法可以包括测定从所述受试者获得的非细胞生物流体样品中如表14中所列的至少一种微小RNA(miRNA)的表达水平。

表14列出了可以用于确定患者发展或患有胃癌的可能性的miRNA，并且如下：

如本领域已知的那样，当增殖性疾病进展(在进行或没有进行治疗的情况下)时，所述疾病的临床表现在进展的阶段之间将不同。因此，为了帮助本领域技术人员确定胃癌/胃部癌症如何进展，国家卫生研究院的国家癌症研究所已经公布了在胃癌/胃部癌症中所观测到的阶段的一般临床表现。胃癌的阶段在它的定义内包括但不严格限于如下所述的下列阶段：

I期：在I期中，在胃壁粘膜(最内层)的内层中已经形成癌症。I期根据癌症已经扩散的位置被分成IA期和IB期。

IA期：癌症可能已经扩散到胃壁的粘膜下层(紧挨着粘膜的组织层)中。

IB期：癌症可能已经扩散到胃壁的粘膜下层(紧挨着粘膜的组织层)并且在接近肿瘤的1个或2个淋巴结中被发现；或已经扩散到胃壁的肌肉层。

II期：II期胃癌根据癌症已经扩散的位置被分成IIA期和IIB期。

IIA期：癌症已经扩散到胃壁的浆膜下层(紧挨着浆膜的组织层)；或已经扩散到胃壁的肌肉层并且在接近肿瘤的1个或2个淋巴结中被发现；或可能已经扩散到胃壁的粘膜下层(紧挨着粘膜的组织层)并且在接近肿瘤的3个至6个淋巴结中被发现。

IIB期：癌症已经扩散到胃壁的浆膜(最外层)；或已经扩散到胃壁的浆膜下层(紧挨着浆膜的组织层)并且在接近肿瘤的1个或2个淋巴结中被发现；或已经扩散到胃壁的肌肉层并且在接近肿瘤的3个至6个淋巴结中被发现；或可能已经扩散到胃壁的粘膜下层(紧挨着粘膜的组织层)并且在接近肿瘤的7个或更多个淋巴结中被发现。

III期：III期胃癌根据癌症已经扩散的位置被分成IIIA期、IIIB期、以及IIIC期。

IIIA期：癌症已经扩散到胃壁的浆膜层(最外层)并且在接近肿瘤的1个或2个淋巴结中被发现；或已经扩散到胃壁的浆膜下层(紧挨着浆膜的组织层)并且在接近肿瘤的3个至6个淋巴结中被发现；或已经扩散到胃壁的肌肉层并且在接近肿瘤的7个或更多个淋巴结中被发现。

IIIB期：癌症已经扩散到邻近器官，如脾、横结肠、肝脏、横隔膜、胰腺、肾脏、肾上腺、或小肠，并且可以在接近肿瘤的1个或2个淋巴结中被发现；或已经扩散到胃壁的浆膜(最外层)并且在接近肿瘤的3个至6个淋巴结中被发现；或扩散到胃壁的浆膜下层(紧挨着浆膜的组织层)并且在接近肿瘤的7个或更多个淋巴结中被发现。

IIIC期：癌症已经扩散到邻近器官，如脾、横结肠、肝脏、横隔膜、胰腺、肾脏、肾上腺、或小肠，并且可以在接近肿瘤的3个或更多个淋巴结中被发现；或已经扩散到胃壁的浆膜(最外层)并且在接近肿瘤的7个或更多个淋巴结中被发现。

IV期：在IV期中，癌症已经扩散到身体的远处部位。

如本领域技术人员所将了解的那样，确定受试者是否处于特定阶段将可用于为临床医生提供关于如何最好地着手任何治疗或姑息性护理的明确准则。因此，在一个方面，本公开提供了一种检测或诊断受试者的胃癌阶段的方法。在一个实施例中，所述方法确定受试者患有一定阶段的胃癌的可能性。在这方面，所述方法包括测定从所述受试者获得的非细胞生物流体样品中与如选自由以下各项组成的组的表中至少一个表中所列的miRNA具有至少90％序列同一性的至少一种miRNA(miRNA)的表达水平：表8；表9或表15；表10或表16；以及表11或表17，其中与对照相比，从所述受试者获得的样品中miRNA表达的差异表达可以指示受试者患有1期、2期、3期或4期胃癌中的任一种的可能性，或可以诊断所述受试者患有1期、2期、3期或4期胃癌中的任一种。如本文所用，对照可以是未患胃癌的受试者。在一个实施例中，图13汇总了用于确定受试者发展或患有所述阶段之一的胃癌的可能性的方法的步骤。

在一个实施例中，当与对照相比，如表8中被列为“上调”的miRNA可以指示所述受试者患有1期胃癌或可以诊断所述受试者患有1期胃癌时，观测到差异表达，并且其中所述miRNA可以包括如表8中被列为“上调”的miRNA中的至少一种。表8进一步详述于实验部分中。在一个实施例中，如果表达水平相对于对照有至少约1.01倍的变化至约2.5倍的变化，那么miRNA可以被认为是“上调的”。在一个实施例中，对于所述变化的统计检验中的p值可以低于0.05。在一个实施例中，p值可以使用本领域已知的统计检验，如t检验(p值<0.01)来计算。在另一个实施例中，所述统计检验是t检验(p值<0.01)，所述t检验是使用如本领域已知的邦费罗尼型多重比较程序针对错误发现率(FDR)估计校正的。这示例性地用于以下实施例中。在一个实施例中，如果表达水平相对于对照可以有约1.10倍、或约1.15倍、或约1.20倍、或约1.25倍、或约1.30倍、或约1.35倍、或约1.40倍、或约1.45倍、或约1.50倍的变化，那么miRNA可以被认为是“上调的”。在一个实施例中，如表8中所举例说明，如果表达水平相对于对照有至少约1.11倍的变化至约1.57倍的变化，那么miRNA可以被认为是“上调的”。

在一个实施例中，如本文所述的方法可以测定如表8中被列为“上调”的一种或多种miRNA的差异表达。因此，在一个实施例中，所述方法可以测定如表8中被列为“上调”的至少2种、或至少3种、或至少4种、或至少5种、或至少6种、或至少7种、或8种miRNA的差异表达。

在一个实施例中，当与对照相比，如表8中被列为“下调”的miRNA可以指示所述受试者患有1期胃癌或可以诊断所述受试者患有1期胃癌时，观测到差异表达。在一个实施例中，所述miRNA可以包括如表8中被列为“下调”的miRNA中的至少一种。在一个实施例中，如果表达水平相对于对照有至少约0.9倍的变化或更低，那么miRNA可以被认为是“下调的”。在一个实施例中，对于所述变化的统计检验中的p值可以低于0.05。在一个实施例中，p值可以使用本领域已知的统计检验，如t检验(p值<0.01)来计算。在另一个实施例中，所述统计检验是t检验(p值<0.01)，所述t检验是使用如本领域已知的邦费罗尼型多重比较程序针对错误发现率(FDR)估计校正的。这示例性地用于以下实施例中。在一个实施例中，如果表达水平相对于对照可以有约0.95倍、或约0.90倍、或约0.85倍、或约0.80倍、或约0.75倍、或约0.70倍、或约0.65倍、或约0.60倍、或约0.55倍的变化，那么miRNA表达可以被认为是“下调的”。在一个实施例中，如表8中所举例说明，如果表达水平相对于对照有至少约0.68倍的变化至约0.84倍的变化，那么miRNA可以被认为是“下调的”。

在一个实施例中，如本文所述的方法可以测定如表8中被列为“下调”的一种或多种miRNA的差异表达。因此，在一个实施例中，所述方法可以测定如表8中被列为“下调”的至少2种、或至少3种、或至少4种、或至少5种、或至少6种、或至少7种、或至少8种、或至少9种、或至少10种、或至少11种、或12种miRNA的差异表达。

在一个实施例中，如本文所述的方法可以测定如表8中被列为“上调”的至少一种miRNA和如表8中被列为“下调”的至少一种miRNA的差异表达。在一个实施例中，所述方法可以测定以下各项的差异表达：如表8中被列为“上调”的miRNA中的至少2种、或至少3种、或至少4种、或至少5种、或至少6种、或至少7种、或8种；以及如表8中被列为“下调”的miRNA中的至少2种、或至少3种、或至少4种、或至少5种、或至少6种、或至少7种、或至少8种、或至少9种、或至少10种、或至少11种、或12种。

在一个实施例中，当与对照相比，如表9或表15中被列为“上调”的miRNA可以指示所述受试者患有2期胃癌或可以诊断所述受试者患有2期胃癌时，观测到差异表达。表9进一步详述于实验部分中。在一个实施例中，所述miRNA可以包括如表15中被列为“上调”的miRNA中的至少一种。

表15列出了可以用于确定患者发展(或患有)或患有2期胃癌的可能性的miRNA，并且如下：

在一个实施例中，如果表达水平相对于对照有至少约1.01倍的变化至约2.5倍的变化，那么miRNA可以被认为是“上调的”。在一个实施例中，对于所述变化的统计检验中的p值可以低于0.05。在一个实施例中，p值可以使用本领域已知的统计检验，如t检验(p值<0.01)来计算。在另一个实施例中，所述统计检验是t检验(p值<0.01)，所述t检验是使用如本领域已知的邦费罗尼型多重比较程序针对错误发现率(FDR)估计校正的。这示例性地用于以下实施例中。在一个实施例中，如果表达水平相对于对照可以有约1.10倍、或约1.15倍、或约1.20倍、或约1.25倍、或约1.30倍、或约1.35倍、或约1.40倍、或约1.45倍、或约1.50倍的变化，那么miRNA可以被认为是“上调的”。在一个实施例中，如表9中所举例说明，如果表达水平相对于对照有至少约1.13倍的变化至约2.13倍的变化，那么miRNA可以被认为是“上调的”。

在一个实施例中，如本文所述的方法可以测定如表9或表15中被列为“上调”的一种或多种miRNA的差异表达。因此，在一个实施例中，所述方法可以测定如表9或表15中被列为“上调”的至少2种、或至少3种、或至少4种、或至少5种、或至少6种、或至少7种、或至少8种、或至少9种、或至少10种、或至少11种、或至少12种、或至少13种、或至少14种、或至少15种、或至少20种、或至少25种、或至少30种、或至少35种、或至少40种、或至少45种、或至少50种、或54种miRNA的差异表达。

在一个实施例中，当与对照相比，如表9或表15中被列为“下调”的miRNA可以指示所述受试者患有2期胃癌或可以诊断所述受试者患有2期胃癌时，观测到差异表达。在一个实施例中，所述miRNA可以包括如表15中被列为“下调”的miRNA中的至少一种。在一个实施例中，如果表达水平相对于对照有至少约0.9倍的变化或更低，那么miRNA可以被认为是“下调的”。在一个实施例中，对于所述变化的统计检验中的p值可以低于0.05。在一个实施例中，p值可以使用本领域已知的统计检验，如t检验(p值<0.01)来计算。在另一个实施例中，所述统计检验是t检验(p值<0.01)，所述t检验是使用如本领域已知的邦费罗尼型多重比较程序针对错误发现率(FDR)估计校正的。这示例性地用于以下实施例中。在一个实施例中，如果表达水平相对于对照可以有约0.95倍、或约0.90倍、或约0.85倍、或约0.80倍、或约0.75倍、或约0.70倍、或约0.65倍、或约0.60倍、或约0.55倍的变化，那么miRNA表达可以被认为是“下调的”。在一个实施例中，如表9中所举例说明，如果表达水平相对于对照有至少约0.56倍的变化至约0.87倍的变化，那么miRNA可以被认为是“下调的”。

在一个实施例中，如本文所述的方法可以测定如表9或表15中被列为“下调”的一种或多种miRNA的差异表达。因此，在一个实施例中，所述方法可以测定如表9或表15中被列为“下调”的至少2种、或至少3种、或至少4种、或至少5种、或至少6种、或至少7种、或8种miRNA的差异表达。

在一个实施例中，如本文所述的方法可以测定如表9或表15中被列为“上调”的至少一种miRNA和如表9或表15中被列为“下调”的至少一种miRNA的差异表达。在一个实施例中，所述方法可以测定以下各项的差异表达：如表9或表15中被列为“上调”的至少2种、或至少3种、或至少4种、或至少5种、或至少6种、或至少7种、或至少8种、或至少9种、或至少10种、或至少11种、或至少12种、或至少13种、或至少14种、或至少15种、或至少20种、或至少25种、或至少30种、或至少35种、或至少40种、或至少45种、或至少50种、或54种miRNA；以及如表9或表15中被列为“下调”的miRNA中的至少2种、或至少3种、或至少4种、或至少5种、或至少6种、或至少7种、或8种。

在一个实施例中，当如本文所述的可以提供关于受试者是否可能患有2期胃癌的诊断或指示的方法使用表15时，所述方法可以进一步包括比较包括但不限于以下各项的miRNA中的任何一种或多种miRNA的表达水平：miR-20a-5p、miR-223-3p、miR-17-5p、miR-106b-5p、miR-423-5p、以及miR-21-5p。

在一个实施例中，当与对照相比，如表10或表16中被列为“上调”的miRNA可以指示所述受试者患有3期胃癌或可以诊断所述受试者患有3期胃癌时，观测到差异表达。表10进一步详述于实验部分中。在一个实施例中，所述miRNA可以包括如表16中被列为“上调”的miRNA中的至少一种。

表16列出了可以用于确定患者发展(或患有)或患有3期胃癌的可能性的miRNA，并且如下：

在一个实施例中，如果表达水平相对于对照有至少约1.01倍的变化至约2.5倍的变化，那么miRNA可以被认为是“上调的”。在一个实施例中，对于所述变化的统计检验中的p值可以低于0.05。在一个实施例中，p值可以使用本领域已知的统计检验，如t检验(p值<0.01)来计算。在另一个实施例中，所述统计检验是t检验(p值<0.01)，所述t检验是使用如本领域已知的邦费罗尼型多重比较程序针对错误发现率(FDR)估计校正的。这示例性地用于以下实施例中。在一个实施例中，如果表达水平相对于对照可以有约1.10倍、或约1.15倍、或约1.20倍、或约1.25倍、或约1.30倍、或约1.35倍、或约1.40倍、或约1.45倍、或约1.50倍的变化，那么miRNA可以被认为是“上调的”。在一个实施例中，如表10中所举例说明，如果表达水平相对于对照有至少约1.20倍的变化至约1.93倍的变化，那么miRNA可以被认为是“上调的”。

在一个实施例中，如本文所述的方法可以测定如表10或表16中被列为“上调”的一种或多种miRNA的差异表达。因此，在一个实施例中，所述方法可以测定如表10或表16中被列为“上调”的至少2种、或至少3种、或至少4种、或至少5种、或至少6种、或至少7种、或至少8种、或至少9种、或至少10种、或至少11种、或至少12种、或至少13种、或至少14种、或至少15种、或至少20种、或至少25种、或至少30种、或至少35种、或37种miRNA的差异表达。

在一个实施例中，当与对照相比，如表10或表16中被列为“下调”的miRNA可以指示所述受试者患有3期胃癌或可以诊断所述受试者患有3期胃癌时，观测到差异表达。在一个实施例中，所述miRNA可以包括如表16中被列为“下调”的miRNA中的至少一种。在一个实施例中，如果表达水平相对于对照有至少约0.9倍的变化或更低，那么miRNA可以被认为是“下调的”。在一个实施例中，对于所述变化的统计检验中的p值可以低于0.05。在一个实施例中，p值可以使用本领域已知的统计检验，如t检验(p值<0.01)来计算。在另一个实施例中，所述统计检验是t检验(p值<0.01)，所述t检验是使用如本领域已知的邦费罗尼型多重比较程序针对错误发现率(FDR)估计校正的。这示例性地用于以下实施例中。在一个实施例中，如果表达水平相对于对照可以有约0.95倍、或约0.90倍、或约0.85倍、或约0.80倍、或约0.75倍、或约0.70倍、或约0.65倍、或约0.60倍、或约0.55倍的变化，那么miRNA表达可以被认为是“下调的”。在一个实施例中，如表10中所举例说明，如果表达水平相对于对照有至少约0.72倍的变化至约0.88倍的变化，那么miRNA可以被认为是“下调的”。

在一个实施例中，如本文所述的方法可以测定如表10或表16中被列为“下调”的一种或多种miRNA的差异表达。因此，在一个实施例中，所述方法可以测定如表10或表16中被列为“下调”的至少2种、或至少3种、或至少4种、或至少5种、或6种miRNA的差异表达。

在一个实施例中，如本文所述的方法可以测定如表10或表16中被列为“上调”的至少一种miRNA和如表10或表16中被列为“下调”的至少一种miRNA的差异表达。在一个实施例中，所述方法可以测定以下各项的差异表达：如表10或表16中被列为“上调”的至少2种、或至少3种、或至少4种、或至少5种、或至少6种、或至少7种、或至少8种、或至少9种、或至少10种、或至少11种、或至少12种、或至少13种、或至少14种、或至少15种、或至少20种、或至少25种、或至少30种、或至少35种、或37种miRNA；以及如表10或表16中被列为“下调”的miRNA中的至少2种、或至少3种、或至少4种、或至少5种、或6种。

在一个实施例中，如本文所述的可以提供关于受试者是否可能患有3期胃癌的诊断或指示的方法使用表16，所述方法可以进一步包括比较包括但不限于以下各项的miRNA中的任何一种或多种miRNA的表达水平：miR-21-5pm、miR-223-3p以及miR-423-5p。

在一个实施例中，当与对照相比，如表11或表17中被列为“上调”的miRNA可以指示所述受试者患有4期胃癌或可以诊断所述受试者患有4期胃癌时，观测到差异表达。表10进一步详述于实验部分中。在一个实施例中，所述miRNA可以包括如表17中被列为“上调”的miRNA中的至少一种。

表17列出了可以用于确定患者发展(或患有)4期胃癌的可能性的miRNA，并且如下：

在一个实施例中，如果表达水平相对于对照有至少约1.01倍的变化至约2.5倍的变化，那么miRNA可以被认为是“上调的”。在一个实施例中，对于所述变化的统计检验中的p值可以低于0.05。在一个实施例中，p值可以使用本领域已知的统计检验，如t检验(p值<0.01)来计算。在另一个实施例中，所述统计检验是t检验(p值<0.01)，所述t检验是使用如本领域已知的邦费罗尼型多重比较程序针对错误发现率(FDR)估计校正的。这示例性地用于以下实施例中。在一个实施例中，如果表达水平相对于对照可以有约1.10倍、或约1.15倍、或约1.20倍、或约1.25倍、或约1.30倍、或约1.35倍、或约1.40倍、或约1.45倍、或约1.50倍的变化，那么miRNA可以被认为是“上调的”。在一个实施例中，如表11中所举例说明，如果表达水平相对于对照有至少约1.12倍的变化至约1.86倍的变化，那么miRNA可以被认为是“上调的”。

在一个实施例中，如本文所述的方法可以测定如表11或表17中被列为“上调”的一种或多种miRNA的差异表达。因此，在一个实施例中，所述方法可以测定如表11或表17中被列为“上调”的至少2种、或至少3种、或至少4种、或至少5种、或至少6种、或至少7种、或至少8种、或至少9种、或至少10种、或至少11种、或至少12种、或至少13种、或至少14种、或至少15种、或至少20种、或至少25种、或至少30种、或至少35种、或至少40种、或至少45种或46种miRNA的差异表达。

在一个实施例中，当与对照相比，如表11或表17中被列为“下调”的miRNA可以指示所述受试者患有4期胃癌或可以诊断所述受试者患有4期胃癌时，观测到差异表达。在一个实施例中，所述miRNA可以包括如表17中被列为“下调”的miRNA中的至少一种。在一个实施例中，如果表达水平相对于对照有至少约0.9倍的变化或更低，那么miRNA可以被认为是“下调的”。在一个实施例中，对于所述变化的统计检验中的p值可以低于0.05。在一个实施例中，p值可以使用本领域已知的统计检验，如t检验(p值<0.01)来计算。在另一个实施例中，所述统计检验是t检验(p值<0.01)，所述t检验是使用如本领域已知的邦费罗尼型多重比较程序针对错误发现率(FDR)估计校正的。这示例性地用于以下实施例中。在一个实施例中，如果表达水平相对于对照可以有约0.95倍、或约0.90倍、或约0.85倍、或约0.80倍、或约0.75倍、或约0.70倍、或约0.65倍、或约0.60倍、或约0.55倍的变化，那么miRNA表达可以被认为是“下调的”。在一个实施例中，如表11中所举例说明，如果表达水平相对于对照有至少约0.48倍的变化至约0.90倍的变化，那么miRNA可以被认为是“下调的”。

在一个实施例中，如本文所述的方法可以测定如表11或表17中被列为“下调”的一种或多种miRNA的差异表达。因此，在一个实施例中，所述方法可以测定如表11或表17中被列为“下调”的至少2种、或至少3种、或至少4种、或至少5种、或至少6种、或至少7种、或至少8种、或至少9种、或至少10种、或至少11种、或至少12种、或至少13种、或至少14种、或至少15种、或至少20种、或至少25种、或28种miRNA的差异表达。

在一个实施例中，如本文所述的方法可以测定如表11或表17中被列为“上调”的至少一种miRNA和如表11或表17中被列为“下调”的至少一种miRNA的差异表达。在一个实施例中，所述方法可以测定以下各项的差异表达：如表11或表17中被列为“上调”的至少2种、或至少3种、或至少4种、或至少5种、或至少6种、或至少7种、或至少8种、或至少9种、或至少10种、或至少11种、或至少12种、或至少13种、或至少14种、或至少15种、或至少20种、或至少25种、或至少30种、或至少35种、或至少40种、或至少45种或46种miRNA；以及如表11或表17中被列为“下调”的miRNA中的至少2种、或至少3种、或至少4种、或至少5种、或至少6种、或至少7种、或至少8种、或至少9种、或至少10种、或至少11种、或至少12种、或至少13种、或至少14种、或至少15种、或至少20种、或至少25种、或28种。

在一个实施例中，如本文所述的可以提供关于受试者是否可能患有4期胃癌的诊断或指示的方法使用表17，所述方法可以进一步包括比较包括但不限于以下各项的miRNA中的任何一种或多种miRNA的表达水平：miR-21-5pm、miR-223-3pm、miR-20a-5pm、miR-106b-5p、以及miR-17-5p。

在又另一个方面，提供了一种检测或诊断受试者的胃癌或确定受试者患有胃癌的可能性的方法，所述方法包括以下步骤：(a)测定非细胞生物流体样品中与如表12或表19中所列的miRNA具有至少90％序列同一性的至少一种miRNA的表达水平；(b)基于步骤(a)中所测定的所述miRNA的表达水平产生分数；以及(c)使用所述分数预测所述受试者患有胃癌的可能性，其中所述分数是通过将所述受试者的表达水平与阳性对照(来自胃癌受试者的样品)或阴性对照(来自未患胃癌的受试者的样品)的表达水平相比较的分类算法来计算的，并且所述分数鉴定所述受试者发生以下事件的可能性：(i)患有胃癌，所述分数将落入所述阳性对照的分数内，或(ii)没有患胃癌(即未患胃癌)，所述分数将落入所述阴性对照的分数内。在一个实施例中，所述miRNA可以包括如表19中所列的miRNA中的至少一种。在一个实施例中，这种检测或诊断受试者的胃癌或确定受试者患有胃癌的可能性的方法可以被称为多变量方法。在一个实施例中，所述多变量方法可以使用已经由临床数据确定为代表亚群或组的miRNA。在一个实施例中，多变量生物标志物组可以包含如表12中所列的生物标志物，该表12包含被发现与胃癌相关的miRNA和被发现与胃癌无关的miRNA这两者。在一个实施例中，可以用于所述多变量方法中的与胃癌有关的miRNA可以包含在表19中。表12进一步详述于实验部分中。在一个实施例中，图14汇总了用于确定受试者发展(或患有)胃癌的可能性的多变量方法的步骤。

表19列出了被频繁地选择用于多变量生物标志物组中的miRNA(其中所述miRNA的表达水平在胃癌受试者中发生改变)并且如下：

如上所述，所述多变量方法可以包括测定如表12中所列的生物标志物，该表12包含被发现与胃癌相关的miRNA和被发现与胃癌无关的miRNA这两者。因此，如果在一个实施例中，所述多变量方法使用如表19中所列的miRNA，那么所述方法将进一步包括测定至少一种在与阴性对照相比时表达水平在所述受试者中没有发生改变的miRNA的表达水平。在一个实施例中，在与阴性对照相比时表达水平在所述受试者中没有发生改变的miRNA可以是如表20中所列的miRNA中的任一种。

表20列出了被频繁地选择用于多变量生物标志物组中的miRNA(其中所述miRNA的表达水平与胃癌受试者无关)并且如下：

在一个实施例中，在如本文所述的多变量方法中，如本领域已知的那样，所述分数可以使用分类算法来计算。在一个实施例中，所述分类算法可以包括但不限于支持向量机算法、逻辑回归算法、多项逻辑回归算法、费舍尔氏线性判别算法、二次分类器算法、感知器算法、k-最近邻算法、人工神经网络算法、随机森林算法、决策树算法、朴素贝叶斯算法、自适应贝叶斯网络算法、以及组合了多种学习算法的集成学习方法。如本领域技术人员所将了解的那样，分类算法可以使用阳性对照和阴性对照的表达水平来预训练。

在如本文所述的多变量方法的具体方面，阳性对照可以是从患有胃癌的受试者获得的样品并且阴性对照是从未患胃癌的对照获得的样品。在一个实施例中，所述未患胃癌的对照可以如上文所述。也就是说，在一个实施例中，未患胃癌的对照可以是没患任何胃癌相关疾病的受试者。在一个实施例中，未患胃癌的对照可以是没患任何现有疾病的健康受试者。在一个实施例中，未患胃癌的对照可以是已知患有非胃癌相关疾病的受试者，诸如但不限于胃炎、肠上皮化生、肠萎缩等。在一个实施例中，对照可以根据样品的性质以及其它因素而变化，所述因素诸如作为获得训练数据集的基础的受试者的性别、年龄、种族。在一个实施例中，对照受试者可以是华裔或华裔血统。

如本领域技术人员所将了解的那样，miRNA的表达水平可以是浓度、log(浓度)、Ct/Cq数、2的Ct/Cq数次方等中的任一种。

在一个实施例中，如本文所述的方法可以使用可能能够确定受试者患有胃癌的可能性的数据训练式。在一个实施例中，所述算法组合了多种miRNA的测定以给出用于预测受试者患有胃癌的风险的分数。它可以组合多个遗传靶标的信息并且给出比使用单一miRNA生物标志物更好的预测准确度。在一个实施例中，构建有用组的miRNA生物标志物的最小数目是4个。举例来说，在图11中显示具有4个miRNA的生物标志物组在验证集中具有平均AUC>0.8，这被认为是有用的生物标志物组。在miRNA多于7个时，生物标志物组的性能的提高(就AUC值来说)不显著增加。因此，在一个实施例中，构建具有达到最大限度的性能的最佳组的miRNA的最小数目是7个miRNA。在一个实施例中，可以用于计算用于确定受试者患有胃癌的可能性的分数的公式可以如下：

A×miRNA1+B×miRNA2+C×miRNA3+D，

其中miRNA1、miRNA2、miRNA3是与miRNA的表达水平相关的值，所述值可以是拷贝数、log(拷贝数)、Ct/Cq数或其它数值；并且A、B、C、D是可以是正的或负的系数。举例来说，用于确定受试者患有胃癌的可能性的分数(即癌症风险分数)可以通过组合在多变量生物标志物组鉴定过程中被频繁选择的具有出现率>20％的12种miRNA(表21)来计算，如以下实施例和图15中所述。在一个实施例中，当由所述公式获得分数时，分数越高/越低，则受试者患有胃癌的几率越高。在一个实施例中，范围可能不是明确限定的，这是因为系数可以按比例缩放。举例来说，所有系数(即A、B、或C)可以是量的一半或D的值可以根据训练数据集的训练而变化。在一个实施例中，所述分数的值可以与患有胃癌的风险呈正相关或呈负相关。实际的相关性将取决于训练数据集并且本领域技术人员将熟悉在建立训练数据集时所需的必要调整。

在一个实施例中，范围可能不是明确限定的，这是因为系数可以按比例缩放。举例来说，所有系数(即A、B、或C)可以是量的两倍或D的值可以根据训练数据集的训练而变化。在一个实施例中，所述分数的值可以与患有胃癌的风险呈正相关或呈负相关。实际的相关性将取决于训练数据集并且本领域技术人员将熟悉在建立训练数据集时所需的必要调整。

在一个实施例中，所有系数(即A、B、或C)可以被有意调整到量的一半和/或D的值可以被有意改变以按比例缩放大部分受试者基于所述公式的0至100的计算值范围。在一个实施例中，所述分数的值可以与患有胃癌的风险呈正相关或呈负相关。实际的相关性将取决于训练数据集并且本领域技术人员将熟悉在建立训练数据集时所需的必要调整。

在一个实施例中，如本文所述的方法可以测定如表12中被列为“显著”或如表19中所列的至少一种miRNA和如表12中被列为“不显著”或如表20中所列的至少一种miRNA的表达水平。在一个实施例中，所述方法可以测定以下各项的差异表达：如表12中被列为“显著”的至少2种、或至少3种、或至少4种、或至少5种、或至少6种、或至少7种、或至少8种、或至少9种、或至少10种、或至少11种、或至少12种、或至少13种、或至少14种、或至少15种、或至少20种、或至少25种、或至少30种、或至少35种、或42种miRNA，或如表19中所列的miRNA中的至少2种、或至少3种、或至少4种、或至少5种、或至少6种、或至少7种、或至少8种、或至少9种、或至少10种、或至少11种、或至少12种、或至少13种、或至少14种、或至少15种、或至少20种、或至少25种、或至少30种、或至少35种、或38种；以及如表12中被列为“不显著”的miRNA中的至少2种、或至少3种、或至少4种、或至少5种、或至少6种、或至少7种、或至少8种、或至少9种、或12种，或如表20中所列的miRNA中的至少2种、或至少3种、或至少4种、或至少5种、或至少6种、或至少7种、或至少8种、或至少9种、或10种。

在一个实施例中，当如本文所述的多变量方法使用如表19中所列的与胃癌相关的miRNA时，所述方法可以进一步包括测定选自由以下各项组成的组的miRNA中的任何一种或多种miRNA的表达水平：miR-21-5p、miR-20a-5pm、miR-17-5p、miR-423-5p以及miR-223-3p。

在一个实施例中，在如本文所述的多变量方法使用如表20中所列的无关miRNA的情况下，如本文所述的方法可以进一步包括测定选自由miR-34a-5p和miR-27b-3p组成的组的miRNA中的任何一种或多种miRNA的表达水平。

得出与胃癌相关的miRNA集合的示例性方法汇总于下文中。此外，一般工作流程示于图1、图2以及图14中。

步骤1：使用合适的试剂盒和/或纯化方法从一个或多个患有胃癌的受试者的样品(如血浆、血清、或其它血液级分)中提取总RNA(或其亚级分)。

步骤2：从对应的样品中，使用实验技术测定选自由SEQ ID NO:1至SEQ ID NO:191组成的组的一种miRNA或至少一种miRNA的集合的量(表达水平)。在一个实施例中，所述至少一种miRNA可以选自如表12、表19以及表20中所列的组。这些技术是本领域已知的技术，它们可以包括但不限于基于阵列的方法、扩增方法(PCR、RT-PCR、或qPCR)、测序、下一代测序、和/或质谱分析。

步骤3：为了收集有关每一种单一miRNA生物标志物的诊断价值和冗余度的信息，应用数学方法。这些方法是本领域已知的方法并且可以包括但不限于基本数学方法(例如倍数商、信噪比、相关性)、统计方法，如假设检验(例如t检验、魏氏-曼-惠特尼检验)；接收器操作特征曲线下面积、信息论方法(例如交互信息、交叉熵)、概率论(例如联合和条件概率)或先前所提到的方法的组合和改动方案。

步骤4：使用步骤3)中所收集的信息来估计每一种miRNA生物标志物的诊断内容或价值。然而，通常，这一诊断价值太小而无法得到具有超过80％障碍的准确率、特异性以及灵敏度的高度准确的诊断。适用于诊断胃癌的miRNA的诊断内容列于图1中。该图包括如表12、表19、以及表20中所列的miRNA。

步骤5：为了提高诊断患有胃癌的个体的性能，可以使用多于一种miRNA生物标志物。因此，应用统计学习/机器学习/生物信息学/计算方法来进行集合选择以选择/限定适用于检测胃癌的miRNA生物标志物的集合(可以包含如表12或表19和表20中所列的miRNA)。这些技术包括但不限于封装器子集选择技术(例如向前逐步、向后逐步、组合方法、优化方法)、过滤器子集选择法(例如步骤3中所提到的方法)、主成分分析、或这些方法的组合和改动方案(例如混合方法)。

步骤6：然后使用步骤5中所选择/限定的子集来对胃癌进行诊断，所述子集可以在只有少数miRNA(用于所述集合的至少一种、或至少两种、或更多种)至所有所测定的miRNA的范围。为此，应用统计学习/机器学习/生物信息学/计算方法，它们包括但不限于任何类型的监督分析或无监督分析：分类技术(例如朴素贝叶斯、线性判别分析、二次判别分析、神经网络、基于树的方法、支持向量机、最近邻方法)、回归技术(例如线性回归、多重回归、逻辑回归、概率回归、有序逻辑回归、有序概率回归、泊松回归、负二项回归、多项逻辑回归、截断回归)、聚类技术(例如k-均值聚类、分层聚类、PCA)、自适应、扩展、以及先前所提到的方法的组合。

步骤7：通过子集选择(步骤5)和机器学习方法(步骤6)的组合，获得用于诊断胃癌的算法或数学函数。将这一算法或数学函数应用于待针对胃癌接受诊断的个体(受试者)的miRNA表达谱(miRNA表达谱数据)。

在如本文所述的方法中的任一种中，所述非细胞生物流体可以包括任何体液，它不包括流体的任何细胞组分。因此，在一个实施例中，在从受试者提取时，生物流体或体液可能包含一般存在于受试者的体液或生物流体中的细胞组分。然而，可以使用本领域已知的方法来处理这一生物流体或体液以去除所述生物流体或体液内所含的任何细胞组分。举例来说，在可以进行本公开的方法之前，可以进行离心或纯化过程以去除体液或生物流体的细胞组分。因此，在一个实施例中，体液或非细胞生物流体可以包括但不限于羊水、乳汁、支气管灌洗液、脑脊髓液、初乳、间质液、腹膜液、胸膜液、唾液、精液、尿液、泪液、全血，包括血浆、血红细胞、白细胞以及血清的非细胞组分。在一个实施例中，所述非细胞生物流体可以是血清或血浆。

如本文所用，在如本文所述的方法中的任一种中，术语“受试者”和“患者”可互换用于指动物(例如哺乳动物、鱼类、两栖动物、爬行动物、禽类以及昆虫)。在一个实施例中，所述受试者可以是哺乳动物(例如非人类哺乳动物(如狗、猫、或灵长类动物)以及人类)。在一个实施例中，所述受试者可以是灵长类动物(例如黑猩猩和人类)。在一个实施例中，所述受试者可以是人类。在一个实施例中，所述受试者可以是患有或未患胃癌(或胃部癌症)的人类。在本公开的实验部分中，训练数据集是从华裔或中国血统的受试者获得的。因此，在一个实施例中，所述受试者可以是亚洲血统。在一个实施例中，受试者可以是华裔或华裔血统。

在一个实施例中，如本文所述的方法可以作为试剂盒被提供。所述试剂盒可以包括检测如本文所述的miRNA所必需的组成部分。组成部分可以包括可以与如本文所述的miRNA杂交的引物/探针、被配置成检测如本文所述的miRNA和引物/探针的试剂、容器和/或设备。在一个实施例中，试剂盒内的容器可以容纳在使用之前放射性标记的可以检测或测定如本文所述的miRNA水平的引物/探针组。所述试剂盒可以包括用于逆转录和扩增一种或多种miRNA的物质的容器，如包括dNTP(四种脱氧核苷酸dATP、dCTP、dGTP、以及dTTP中的每一种)、缓冲液、逆转录酶以及DNA聚合酶的容器。所述试剂盒还可以包括用于阳性对照和/或阴性对照反应的一种或多种核酸模板。所述试剂盒可以进一步包括从获自受试者的样品中分离miRNA所必需的任何反应组分或缓冲液。

本文说明性描述的发明可以在不存在本文没有具体公开的任何一个或多个要素、一个或多个限制条件的情况下被适当地实施。因此，举例来说，术语“包含”、“包括”、“含有”等应当被宽泛地并且不加限制地解读。此外，本文所用的术语和措辞已经被用作描述性术语而非限制性术语，并且并不意图在使用这些术语和措辞时排除所示的以及所述的特征或其部分的任何等同方案，但应当认识到的是，各种改动方案在要求保护的本发明的范围内是可能的。因此，应当了解的是，尽管已经通过优选的实施方案和任选的特征明确地公开了本发明，但是本文所公开的其中所体现的发明的改动方案和变化方案可以由本领域技术人员所采取，并且这些改动方案和变化方案被认为落入本发明的范围内。

本发明已经在本文中被广泛地并且一般地描述。落入一般性公开内的较缩小内容和亚类分组中的每一个也形成本发明的一部分。这包括以从所述类中去除任何主题的附带条件或负面限制条件来一般性地说明本发明，不论所排除的内容是否在本文被具体地叙述。

其它实施方案落入下列权利要求书和非限制性实施例内。此外，在本发明的特征或方面以马库什组来描述的情况下，本领域技术人员将认识到的是，本发明也因此以马库什组的任何单个成员或成员的子组来描述。

实验部分

方法

分析前(样品收集和miRNA提取)：由新加坡胃癌联盟集中收集来自正常(即未患胃癌的对照)和胃癌受试者的血清样品，对所述样品进行处理并且在-80℃冷冻储存。在半自动化的QiaCube系统上，使用公认的基于柱的miRNeasy试剂盒(Qiagen,Hilden,Germany))来分离来自200μl血清的总RNA。血清含有微量的RNA。为了减少RNA的损失以及监测提取效率，在分离之前将合理设计的分离增强子(MS2)和追踪对照RNA(MiRXES)添加到标本中。

RT-qPCR：在优化的多重逆转录反应中将分离的总RNA和合成RNA标准品转化成cDNA，所述反应使用第二组追踪对照RNA来检测抑制剂的存在以及监测RT-qPCR效率。遵循制造商的说明书，使用Impron II

逆转录酶进行逆转录。然后对合成的cDNA进行多重扩增步骤并且使用基于Sybr Green的单重qPCR测定(符合MIQE)

来定量。使用

ViiA-7 384机器进行qPCR反应。miRNA RT-qPCR测定工作流程的概述和细节汇总于图2中。

数据处理：处理原始的达到阈值时的循环数(Ct)值并且经由合成miRNA标准曲线的内插来确定每一个样品中靶miRNA的绝对拷贝数。通过追踪对照RNA将在RNA分离和RT-qPCR过程期间所引入的技术变异归一化。对于单一miRNA的分析，进一步通过在所有对照和疾病样品间稳定表达的一组验证的内源性参考miRNA来将生物变异归一化。

研究设计

进行良好设计的临床研究(病例对照研究)以确保准确鉴定用于诊断胃癌的生物标志物。在这一研究中使用了总共237名具有68.0岁±10.9岁的平均年龄的中国胃癌患者(1期至4期)并且与用作对照组的另外236名年龄和性别匹配的正常(健康/未患胃癌的)中国受试者进行比较。通过内窥镜检查法以及活检确认了所有的癌症受试者并且在任何治疗之前收集血清样品。在收集样品时通过内窥镜检查法确认所有正常(健康)受试者是未患胃癌的，并且对他们进行随访3年-5年，其中每2年进行内窥镜检查法筛查以确保所述受试者在这段时间内没有发展胃癌。所述受试者的详细临床信息列于表2和表3中。在使用之前将所有血清样品储存在-80℃。所研究的受试者的特征汇总于表5中。许多对照受试者(正常/健康/未患胃癌的受试者)患有胃病，如胃炎、肠上皮化生以及萎缩。因此，对照组代表了胃癌的高风险群体。尽管有幽门螺杆菌的胃癌患者的百分比(78.8％)大于对照组中的百分比(55.7％)，但是所述微小差异不足以支持使用幽门螺杆菌作为胃癌的生物标志物。

表2：胃癌受试者的临床信息

表3：对照受试者的临床信息

表5：所研究的受试者的特征

已知血液中循环的无细胞miRNA可能源自于不同的组织来源。因此，由实体胃肿瘤的存在所引起的miRNA水平的变化可能由于来自其它来源的相同miRNA的存在而变得复杂。因此，确定在癌症和对照组中所发现的miRNA表达水平的差异将是有挑战性的并且预计不太明显。此外，由于大体积血液(在成年人中是5L)的稀释效应，因此已知大部分无细胞miRNA在血液中有非常低的丰度。因此，从有限体积的血清/血浆样品中准确测定多种miRNA靶标是关键的并且提出了非常显著的挑战。为了最好地促进对显著改变的miRNA表达的发现以及对用于诊断胃癌的多变量miRNA生物标志物组的鉴定，本实验研究选择使用如图2中所汇总的工作流程进行基于qPCR的测定，而不是使用低灵敏度或半定量筛选方法(微阵列、测序)。

在本实验部分中所用的工作流程中，对于miRNA靶所有的反应以单重方式进行至少两次并且对于合成RNA‘追踪’对照进行至少四次。为了确保这些高通量qPCR研究中的结果的准确性，设计了本研究并且在多次迭代之后建立了用于发现循环生物标志物的稳健的工作流程(参见“方法”部分和图2)。在这一工作流程中，使用各种人工设计的‘最终’对照来监测和校正分离、逆转录、扩增以及qPCR过程中的技术变异。所有的追踪对照均是非天然的合成miRNA模拟物(具有22个-24个碱基范围的长度的小单链RNA)，它们在计算机中被设计成在序列上与所有已知的人类miRNA具有非常低的相似性，从而使与所述测定中所用的引物的交叉杂交减到最低限度。此外，miRNA测定在计算机中被有意分成多个多重组以使非特异性扩增和引物-引物相互作用减到最低限度。使用合成miRNA来构建标准曲线以用于所有测定中绝对拷贝数的内插，从而进一步校正技术变异。可预见的是，使用这一具有多个水平的对照的工作流程，可以可靠地和可再现地检测循环中miRNA的低表达水平。

miRNA生物标志物

用于鉴定生物标志物的步骤是比较正常状态(对照)和疾病状态下每一种miRNA的表达水平。使用稳健的工作流程和高灵敏度qPCR测定(MiRXES,Singapore)来定量测定所有472个血清样品(胃癌和正常/对照)中578种(miRBase 10版)人类miRNA的表达水平。

在本实验设计中，对200μL的血清进行提取并且将总RNA逆转录并且通过降落扩增来扩增以增加cDNA的量，但是却不改变miRNA表达水平的表示(图2)。然后稀释扩增的cDNA以进行qPCR测定。基于稀释效应的简单计算揭示在血清中以≤500个拷贝/毫升的水平表达的miRNA将以接近单重qPCR测定的检测限度的水平(≤10个拷贝/孔)被定量。在这样的浓度下，由于技术限制(吸移和qPCR中的误差)，因此测定将是一个显著的挑战。因此，以≤500个拷贝/毫升的浓度表达的miRNA被排除在分析之外并且被认为在本研究中是不可检出的。

发现所测定的总miRNA(所测定的总共578种miRNA)中有约33％是高表达的。这191种miRNA在超过90％的血清样品中被可靠地检测到(表达水平≥500个拷贝/毫升；表4)并且这比先前使用其它技术所报道的要多得多，突出了使用稳健的实验设计和良好控制的工作流程的重要性。

表4：191种可靠检测的成熟miRNA的序列

然后构建热图以表示所有所检测的血清miRNA(191种所检测的miRNA，图3)的表达水平。尽管将miRNA的各个子组聚类在一起，但是通过无监督分层聚类，基于所检测的miRNA的总数，在癌症组与对照组之间似乎没有明显的区别。因此，在没有任何特征选择的情况下，这两组的整体miRNA谱似乎是相似的。

然后在以下各项之间比较191种血清miRNA的表达

A]在正常/对照与胃癌之间(不考虑阶段或亚型)，

B]在疾病的各个阶段(1期-4期)之间，以及

C]在正常/对照与疾病的各个阶段之间。

基于t检验(p值<0.01)计算两组之间差异表达的显著性，所述t检验是使用如本领域已知的邦费罗尼型多重比较程序针对错误发现率(FDR)估计校正的。

A]鉴定在正常/对照和胃癌(不考虑阶段或亚型)中差异表达的miRNA

将来自在临床上被确认患有弥漫型、肠型或混合型胃癌的患者的样品集中在一起并且与来自正常/对照供体的样品相比。鉴定出75种miRNA的池，它们在对照组与癌症组之间显示出显著的差异表达(p值<0.01；表6)。不同于发现大多数推定的生物标志物的表达在胃癌受试者中更高的其它报道(表1)，本研究证实了51种miRNA在癌症受试者中是上调的，而24种是下调的(表6)。因此，本实验设计鉴定出更多受调节的生物标志物。

表1：本领域已知的与胃癌相关的血清/血浆miRNA生物标志物的汇总

表6：在正常/对照与胃癌之间差异表达的miRNA

将本研究的结果(表6)与由其它报道鉴定为在血液中差异表达的30种miRNA(表1)相比较，发现只有六种miRNA(hsa-miR-106b-5p、hsa-miR-17-5p、hsa-miR-20a-5p、hsa-miR-21-5p、hsa-miR-223-3p以及hsa-miR-423-5p)通常是上调的(表7)。因此，文献中声称的差异调节的miRNA中的大部分在本研究中没有得到确认。有趣的是，作为胃癌的潜在生物标志物的69种新型miRNA在此被鉴定。

表7：当前研究与其它文献报道之间的比较

使用这组75种生物标志物，在miRNA谱的热图中观测到胃癌受试者与正常/对照受试者之间更明显的聚类(图4)。水平维度上观察，大部分的胃癌受试者(黑色)被聚类到离开大部分正常/对照受试者朝向图中其余空间的集中区域中。排序最高的上调(hsa-miR-142-5p)和下调(hsa-miR-99b-5p)miRNA的AUC值分别仅是0.71和0.67(图5)。75种有差异的miRNA中的每一种或几种的组合可以用作生物标志物或生物标志物的组(多变量指数测定)以用于诊断胃癌。

发现miRNA的表达聚类成如热图中所示的子组(图3、图4)。每一个集群具有约10种-20种miRNA(图3、图4虚线)。所有可检测的miRNA的分析揭示这些中有许多呈正相关(皮尔森相关效率>0.5)(图6)。使用胃癌特异性miRNA也发现相同的观测结果(图7)。结果证实某些miRNA组在所有受试者中被相似地调节。因此，可以通过将一种或多种不同的miRNA用另外的miRNA替代来组合一组miRNA以提高诊断性能并且所有75种显著改变的miRNA对于用于胃癌的多变量指数诊断测定的开发来说都是关键的。

B]鉴定在正常/对照与胃癌的各个阶段之间差异表达的miRNA

然后比较疾病的各个阶段之间miRNA的表达。使用考虑到阶段和亚型的双因素方差分析检验，发现36种miRNA(来自191种血清miRNA的池)在各个阶段的胃癌受试者之间差异表达(在错误发现率校正之后方差分析检验的p值<0.01，数据未示)。

在已知各个阶段之间的差异的情况下，随后试图鉴定在癌症的每一个阶段与正常/对照之间差异表达的miRNA。在这一新的搜索过程中所发现的不同miRNA的总数是113种(表8-表11，其中谱重叠)。在这些当中，20种(8种上调和12种下调)、62种(54种上调和8种下调)、43种(37种上调和6种下调)或74种(28种上调和46种下调)miRNA的池分别在正常/对照与相应的1期、2期、3期以及4期之间显示出差异表达(在FDR校正之后p值<0.01，表8-表11)。

表8：正常/对照与1期胃癌之间差异表达的miRNA

表9：正常/对照与2期胃癌之间差异表达的miRNA

表10：正常/对照与3期胃癌之间差异表达的miRNA

表11：正常/对照与4期胃癌之间差异表达的miRNA

除三种miRNA(hsa-miR-486-5p、hsa-miR-19b-3p、hsa-miR-411-5p)外，由共同使用癌症的所有阶段的分析所发现的75种miRNA(表6)的其余部分被发现是在独立地分析癌症的每一个阶段时所鉴定出的这113种miRNA的子集。被发现在胃癌的各个阶段之间差异调节的36种miRNA中的大多数(除了一种之外)在比较正常/对照(N)与胃癌的每一个阶段(S1-S4)时也被发现差异表达(表8-11)。阶段之间的差异产生了可用于检测胃癌的不同的miRNA池。因此，通过相对于正常/对照比较不同阶段中的表达水平所获得的结果产生了更大的信息miRNA池。

显然，在早期1期中所鉴定的miRNA的数目少于在后期阶段中所鉴定的miRNA的数目。AUC值排序最高的miRNA的身份对于所有阶段来说并不总是相同的(图8)。大量miRNA受到调节(表8-11)并且在阶段间重复发现相似的身份(图10)。只有一种miRNA(hsa-miR-27a-5p)被发现在所有四个阶段之间是共同的。这些不同的miRNA(表8-11)可以被单独使用并且多种miRNA的集体结果可用于在临床环境中诊断胃癌，其中在表现时癌症阶段是未知的。

从上述研究，由来自每一个阶段特异性miRNA列表的至少一种miRNA组成的生物标志物组可以提供一种用于确定受试者患有胃癌的可能性的替代方法。

III.搜索多变量生物标志物组

集合多变量组的一个重要的标准是包括来自癌症的每一个阶段的特异性列表的至少一种miRNA以确保所有的癌症子组被覆盖。然而，限定癌症的这四个阶段的miRNA并不是完全不同的，虽然在它们之间类似地发现相同的miRNA(图9)。同时，大量的癌症相关或无关miRNA被发现呈正相关(图6、图7)，这使得对用于胃癌诊断的最佳miRNA组合的选择具有挑战性。

鉴于任务的复杂性，决定本研究必须使用序列前向浮动搜索算法来鉴定具有最高AUC的miRNA的组。现有技术线性支持向量机是一种用于构建变量组的良好利用和公认的建模工具，它也已知在本领域被用于帮助选择miRNA的组合。所述模型基于说明了每一个成员的表达水平和它们的权重的线性公式得出分数。这些线性模型在临床实践中是容易被接受和应用的。

这种过程成功的关键要求是高质量数据的可用性。在大量明确限定的临床样品中所有所检测的miRNA的定量数据不仅提高了结果的准确性以及精确性，而且还确保了用于使用qPCR的进一步临床应用的所鉴定的生物标志物组的一致性。

使用大量的临床样品(500+)，在建模中数据过度拟合的问题被减到最低限度，这是因为只有191个候选特征要被选出。此外，为了确保结果的真实性，进行多次四重交叉验证以将基于发现集(每重样品的3/4)的所鉴定的生物标志物组的性能在验证样品的独立集(每重样品的剩余1/4)中测试。在交叉验证过程期间，将样品针对性别、亚型以及阶段相匹配。

代表结果(在发现阶段和验证阶段这两者中生物标志物组的AUC)的箱形图示于图10中。如所预测，对于每一次搜索，验证集的AUC值降低(0.04-0.06)。尽管验证阶段中数据的箱的尺寸更大，这指示了值的扩展，但是差值≤0.1AUC值。当分析中所包括的生物标志物的数目高于6时，值的这一扩展甚至更紧密(<0.05)。这一观测结果表明用6种或更多种miRNA获得更稳健的结果。

结果的更多的定量表示示于图11中，其中在分析中所包括的生物标志物的数目大于七时没有观测到AUC值提高。尽管在具有六个miRNA的生物标志物组与具有七个miRNA的生物标志物组之间的差异具有统计显著性，但是AUC值的提高仅是0.02。因此，在使用具有6个miRNA的组的情况下0.855的AUC值对于临床使用是足够的。

IV多变量miRNA生物标志物组的组成

为了研究多变量生物标志物组的组成，对所有含有6个-10个miRNA的组中miRNA的出现率进行计数，其中排除具有前10％和后10％AUC的组。对前10％和后10％AUC进行排除以避免由于来自由交叉验证分析中的随机化过程所产生的亚群的不准确数据的拟合而对错误发现的生物标志物进行计数。排除具有少于四个计数的这些miRNA，在发现过程中选择了总共55种miRNA(表12)，其中还发现这些中的43种的表达在癌症中显著改变。发现尽管12种其它miRNA在癌症中没有改变，但是包括它们显著提高了AUC值。在没有直接和定量测定所有miRNA靶的情况下，这些miRNA决不会在高通量筛选方法(微阵列、测序)中被选择并且将被排除在qPCR验证之外。这些miRNA不是随机选择的，这是因为在57.8％和48.4％的组中一致地发现了前两种miRNA(hsa-miR-532-5p、hsa-miR-30e-5p)。

表12：在多变量生物标志物组鉴定过程中所鉴定的miRNA

被选择以形成多变量组的miRNA(表12)在检测各个阶段的癌症方面显示出可变性(表8-11)。对于列表中具有高于20％的出现率的前10种频繁选择的miRNA，它们中只有三种被发现在癌症的超过两个不同阶段中被共同调节(hsa-miR-21-5p、hsa-miR-27a-5p、hsa-miR-142-5p)，而对于其余部分，hsa-miR-103a-3p只对于1期是显著的，hsa-miR-181a-5p只对于4期是显著的，hsa-miR-26a-5p对于1期和4期是显著的，hsa-miR-20a-5p和hsa-miR-17-5p对于2期和4期是显著的，并且hsa-miR-616-5p和hsa-miR-30a-5p对于3期和4期是显著的。排除4期，其中大量miRNA与用于其它3个阶段的列表重叠(图9)，用于1期-3期中的每一期的两种特异性miRNA被频繁选择。

在比较用于多变量组的所选择的miRNA和作为诊断标志物的单一miRNA的身份时，它们不一定相同。举例来说，对所有癌症来说最高上调(hsa-miR-532-5p)和最高下调(hsa-miR-30e-5p)miRNA这两者(图5)均没有被包括在列表中。因此，不可能仅将对于各个阶段所鉴定的最佳生物标志物组合以形成最佳的生物标志物组，而是提供给出最佳结果的互补信息的一组标志物。

有趣的是，五种miRNA被频繁选用于多变量组(具有>48％出现率，参见表12)。这些中的三种具有癌症特异性(hsa-miR-21-5p、hsa-miR-103a-3p以及hsa-miR-20a-5p)并且两种来自另一组(不显著组；hsa-miR-532-5p和hsa-miR-30e-5p)。分析这5种miRNA在所有多变量组中的共同出现率(表13)并且发现85.9％的组具有hsa-miR-532-5p或hsa-miR-30e-5p。因此，使用这两种miRNA中的任何一种miRNA可足够用于提高多变量指数组中的AUC值。

总之，93.8％的miRNA生物标志物组具有来自每一组的至少一种miRNA。因此，在一个实施例中，用于确定受试者患有胃癌的可能性的多变量方法可以包括来自这两个被频繁选择的miRNA组中的每一个组的至少一种miRNA。

表13：被频繁选择的miRNA的出现率

癌症风险分数的计算

可以将miRNA组合以形成生物标志物组来计算癌症风险分数(式1)。举例来说，可以将在多变量生物标志物组鉴定过程中被频繁选择的具有出现率>20％的12种miRNA(表21)组合以形成生物标志物组来计算癌症风险分数。此处的公式表明了胃癌风险预测的线性模型的使用，其中癌症风险分数(对于每一个受试者来说是独特的)指示了受试者患有胃癌的可能性。这是通过对12种miRNA的加权测定值与常数50求和来计算的。

式1：

log₂拷贝数_miRNA_i：12种单个miRNA的对数变换的拷贝数(每毫升血清的拷贝数)。K_i：可以见于表21中的用于对多个miRNA靶加权的系数。K_i的值是使用支持向量机法优化的并且按比例缩放到0至100的范围。具有低于0的癌症风险分数的受试者将被认为是0并且具有高于100的癌症风险分数的受试者将被认为是100。

表21：在多变量生物标志物组鉴定过程中被频繁选择的具有出现率>20％的12种miRNA

在这一研究中对照受试者和癌症受试者具有基于所述公式计算的不同的癌症风险分数值(图15A)。对照受试者和癌症受试者的癌症风险分数的拟合概率分布可以见于图15B中，其中可以发现两组之间的明显分离。在这一研究中，对照受试者是选自患有胃癌的概率为0.0067的高风险群体的非癌症受试者。基于这一先验概率和图15B中的拟合概率分布，未知的受试者患有癌症的概率(风险)可以基于他们的癌症风险分数值来计算(图15C)。分数越高，所述受试者患有胃癌的风险越高。此外，癌症风险分数可以告知与高风险群体中的癌症发病率相比，未知的受试者患有胃癌的概率(风险)的倍数变化(图15D)。举例来说，癌症风险分数为70的未知高风险受试者将有14.6％的概率患有胃癌，这是高风险群体的平均风险的约22倍。

进一步应用40和70的两个阈值，受试者可以基于癌症风险分数被限定为三个类别(图15C、图15D)。具有0-40的癌症风险分数范围的受试者属于低癌症风险组，患有胃癌的几率为0.052％，这是高风险群体中的平均癌症发病率的1/13。具有40-70的癌症风险分数范围的受试者属于中癌症风险组，患有胃癌的几率为1.4％，这是高风险群体中的平均癌症发病率的2倍。具有70-100的癌症风险分数范围的受试者属于高癌症风险组，患有胃癌的几率为12.2％，这是高风险群体中的平均癌症发病率的18倍。

序列表

<110> 新加坡科技研究局

<120> 用于诊断胃癌的miRNA生物标志物

<130> 9869SG3334

<160> 191

<170> PatentIn 3.5版

<210> 1

<211> 22

<212> RNA

<213> 智人

<400> 1

cacccguaga accgaccuug cg 22

<210> 2

<211> 22

<212> RNA

<213> 智人

<400> 2

uccuguacug agcugccccg ag 22

<210> 3

<211> 21

<212> RNA

<213> 智人

<400> 3

aucacauugc cagggauuac c 21

<210> 4

<211> 21

<212> RNA

<213> 智人

<400> 4

uaccacaggg uagaaccacg g 21

<210> 5

<211> 21

<212> RNA

<213> 智人

<400> 5

uacaguacug ugauaacuga a 21

<210> 6

<211> 23

<212> RNA

<213> 智人

<400> 6

agcagcauug uacagggcua uca 23

<210> 7

<211> 22

<212> RNA

<213> 智人

<400> 7

cagugcaaug augaaagggc au 22

<210> 8

<211> 21

<212> RNA

<213> 智人

<400> 8

aauaauacau gguugaucuu u 21

<210> 9

<211> 22

<212> RNA

<213> 智人

<400> 9

uuuggucccc uucaaccagc ug 22

<210> 10

<211> 21

<212> RNA

<213> 智人

<400> 10

agcuacaucu ggcuacuggg u 21

<210> 11

<211> 19

<212> RNA

<213> 智人

<400> 11

aaaagcuggg uugagagga 19

<210> 12

<211> 22

<212> RNA

<213> 智人

<400> 12

uguaaacauc cucgacugga ag 22

<210> 13

<211> 23

<212> RNA

<213> 智人

<400> 13

aacauucaac gcugucggug agu 23

<210> 14

<211> 22

<212> RNA

<213> 智人

<400> 14

cagugguuuu acccuauggu ag 22

<210> 15

<211> 22

<212> RNA

<213> 智人

<400> 15

aucgggaaug ucguguccgc cc 22

<210> 16

<211> 22

<212> RNA

<213> 智人

<400> 16

ccgcacugug gguacuugcu gc 22

<210> 17

<211> 21

<212> RNA

<213> 智人

<400> 17

cugaccuaug aauugacagc c 21

<210> 18

<211> 22

<212> RNA

<213> 智人

<400> 18

caaauucgua ucuaggggaa ua 22

<210> 19

<211> 23

<212> RNA

<213> 智人

<400> 19

caaagugcuu acagugcagg uag 23

<210> 20

<211> 22

<212> RNA

<213> 智人

<400> 20

gagcuuauuc auaaaagugc ag 22

<210> 21

<211> 22

<212> RNA

<213> 智人

<400> 21

uucuggaauu cugugugagg ga 22

<210> 22

<211> 22

<212> RNA

<213> 智人

<400> 22

uaaugccccu aaaaauccuu au 22

<210> 23

<211> 23

<212> RNA

<213> 智人

<400> 23

uaauccuugc uaccugggug aga 23

<210> 24

<211> 22

<212> RNA

<213> 智人

<400> 24

uauugcacau uacuaaguug ca 22

<210> 25

<211> 22

<212> RNA

<213> 智人

<400> 25

uuauaaagca augagacuga uu 22

<210> 26

<211> 22

<212> RNA

<213> 智人

<400> 26

auauaauaca accugcuaag ug 22

<210> 27

<211> 21

<212> RNA

<213> 智人

<400> 27

uucacagugg cuaaguuccg c 21

<210> 28

<211> 22

<212> RNA

<213> 智人

<400> 28

gugagucucu aagaaaagag ga 22

<210> 29

<211> 22

<212> RNA

<213> 智人

<400> 29

ggagaaauua uccuuggugu gu 22

<210> 30

<211> 21

<212> RNA

<213> 智人

<400> 30

aggggugcua ucugugauug a 21

<210> 31

<211> 22

<212> RNA

<213> 智人

<400> 31

ucaggcucag uccccucccg au 22

<210> 32

<211> 22

<212> RNA

<213> 智人

<400> 32

uaacagucua cagccauggu cg 22

<210> 33

<211> 21

<212> RNA

<213> 智人

<400> 33

ugguagacua uggaacguag g 21

<210> 34

<211> 22

<212> RNA

<213> 智人

<400> 34

acaggugagg uucuugggag cc 22

<210> 35

<211> 22

<212> RNA

<213> 智人

<400> 35

uagcaccauc ugaaaucggu ua 22

<210> 36

<211> 22

<212> RNA

<213> 智人

<400> 36

aauugcacgg uauccaucug ua 22

<210> 37

<211> 22

<212> RNA

<213> 智人

<400> 37

aucauagagg aaaauccaug uu 22

<210> 38

<211> 22

<212> RNA

<213> 智人

<400> 38

ugagaaccac gucugcucug ag 22

<210> 39

<211> 23

<212> RNA

<213> 智人

<400> 39

ucuuggagua ggucauuggg ugg 23

<210> 40

<211> 17

<212> RNA

<213> 智人

<400> 40

ucccaccgcu gccaccc 17

<210> 41

<211> 23

<212> RNA

<213> 智人

<400> 41

agcagcauug uacagggcua uga 23

<210> 42

<211> 22

<212> RNA

<213> 智人

<400> 42

uggaguguga caaugguguu ug 22

<210> 43

<211> 23

<212> RNA

<213> 智人

<400> 43

caaagugcug uucgugcagg uag 23

<210> 44

<211> 22

<212> RNA

<213> 智人

<400> 44

cauugcacuu gucucggucu ga 22

<210> 45

<211> 23

<212> RNA

<213> 智人

<400> 45

ucuuugguua ucuagcugua uga 23

<210> 46

<211> 23

<212> RNA

<213> 智人

<400> 46

uucauuuggu auaaaccgcg auu 23

<210> 47

<211> 22

<212> RNA

<213> 智人

<400> 47

caucaucguc ucaaaugagu cu 22

<210> 48

<211> 22

<212> RNA

<213> 智人

<400> 48

ugagaacuga auuccauggg uu 22

<210> 49

<211> 22

<212> RNA

<213> 智人

<400> 49

ggauaucauc auauacugua ag 22

<210> 50

<211> 22

<212> RNA

<213> 智人

<400> 50

uagcagcaca uaaugguuug ug 22

<210> 51

<211> 22

<212> RNA

<213> 智人

<400> 51

ucucccaacc cuuguaccag ug 22

<210> 52

<211> 21

<212> RNA

<213> 智人

<400> 52

ucagugcaug acagaacuug g 21

<210> 53

<211> 22

<212> RNA

<213> 智人

<400> 53

ugaccgauuu cuccuggugu uc 22

<210> 54

<211> 20

<212> RNA

<213> 智人

<400> 54

aaaagcuggg uugagagggu 20

<210> 55

<211> 22

<212> RNA

<213> 智人

<400> 55

ucggauccgu cugagcuugg cu 22

<210> 56

<211> 22

<212> RNA

<213> 智人

<400> 56

cuagguaugg ucccagggau cc 22

<210> 57

<211> 21

<212> RNA

<213> 智人

<400> 57

acuggacuug gagucagaag g 21

<210> 58

<211> 22

<212> RNA

<213> 智人

<400> 58

uuauaauaca accugauaag ug 22

<210> 59

<211> 22

<212> RNA

<213> 智人

<400> 59

gaauguugcu cggugaaccc cu 22

<210> 60

<211> 22

<212> RNA

<213> 智人

<400> 60

uauguaacac gguccacuaa cc 22

<210> 61

<211> 22

<212> RNA

<213> 智人

<400> 61

cgucaacacu ugcugguuuc cu 22

<210> 62

<211> 22

<212> RNA

<213> 智人

<400> 62

augcugacau auuuacuaga gg 22

<210> 63

<211> 22

<212> RNA

<213> 智人

<400> 63

guucucccaa cguaagccca gc 22

<210> 64

<211> 21

<212> RNA

<213> 智人

<400> 64

gcccugaccu guccuguucu g 21

<210> 65

<211> 22

<212> RNA

<213> 智人

<400> 65

aauccuuugu cccuggguga ga 22

<210> 66

<211> 22

<212> RNA

<213> 智人

<400> 66

acucaaaacc cuucagugac uu 22

<210> 67

<211> 23

<212> RNA

<213> 智人

<400> 67

uagugcaaua uugcuuauag ggu 23

<210> 68

<211> 22

<212> RNA

<213> 智人

<400> 68

gucauacacg gcucuccucu cu 22

<210> 69

<211> 22

<212> RNA

<213> 智人

<400> 69

uuuggucccc uucaaccagc ua 22

<210> 70

<211> 22

<212> RNA

<213> 智人

<400> 70

caaagaauuc uccuuuuggg cu 22

<210> 71

<211> 23

<212> RNA

<213> 智人

<400> 71

caaagugcuc auagugcagg uag 23

<210> 72

<211> 22

<212> RNA

<213> 智人

<400> 72

uguaaacauc cccgacugga ag 22

<210> 73

<211> 22

<212> RNA

<213> 智人

<400> 73

uuuguucguu cggcucgcgu ga 22

<210> 74

<211> 22

<212> RNA

<213> 智人

<400> 74

uagcagcacg uaaauauugg cg 22

<210> 75

<211> 21

<212> RNA

<213> 智人

<400> 75

uaaagugcug acagugcaga u 21

<210> 76

<211> 22

<212> RNA

<213> 智人

<400> 76

ucuacagugc acgugucucc ag 22

<210> 77

<211> 22

<212> RNA

<213> 智人

<400> 77

uaacacuguc ugguaaagau gg 22

<210> 78

<211> 22

<212> RNA

<213> 智人

<400> 78

uggagagaaa ggcaguuccu ga 22

<210> 79

<211> 23

<212> RNA

<213> 智人

<400> 79

aacauucauu gcugucggug ggu 23

<210> 80

<211> 22

<212> RNA

<213> 智人

<400> 80

acaguagucu gcacauuggu ua 22

<210> 81

<211> 23

<212> RNA

<213> 智人

<400> 81

ugugcaaauc caugcaaaac uga 23

<210> 82

<211> 22

<212> RNA

<213> 智人

<400> 82

ucagugcauc acagaacuuu gu 22

<210> 83

<211> 23

<212> RNA

<213> 智人

<400> 83

uagcaccauu ugaaaucagu guu 23

<210> 84

<211> 22

<212> RNA

<213> 智人

<400> 84

aacaauaucc uggugcugag ug 22

<210> 85

<211> 22

<212> RNA

<213> 智人

<400> 85

uuaugguuug ccugggacug ag 22

<210> 86

<211> 22

<212> RNA

<213> 智人

<400> 86

gaaguuguuc gugguggauu cg 22

<210> 87

<211> 21

<212> RNA

<213> 智人

<400> 87

cuagacugaa gcuccuugag g 21

<210> 88

<211> 19

<212> RNA

<213> 智人

<400> 88

uggauuuuug gaucaggga 19

<210> 89

<211> 22

<212> RNA

<213> 智人

<400> 89

uaauacugcc ugguaaugau ga 22

<210> 90

<211> 21

<212> RNA

<213> 智人

<400> 90

uaguagaccg uauagcguac g 21

<210> 91

<211> 21

<212> RNA

<213> 智人

<400> 91

cauuauuacu uuugguacgc g 21

<210> 92

<211> 22

<212> RNA

<213> 智人

<400> 92

caguuaucac agugcugaug cu 22

<210> 93

<211> 22

<212> RNA

<213> 智人

<400> 93

ucccugagac ccuaacuugu ga 22

<210> 94

<211> 24

<212> RNA

<213> 智人

<400> 94

aauccuugga accuaggugu gagu 24

<210> 95

<211> 22

<212> RNA

<213> 智人

<400> 95

uucaccaccu ucuccaccca gc 22

<210> 96

<211> 23

<212> RNA

<213> 智人

<400> 96

agcuacauug ucugcugggu uuc 23

<210> 97

<211> 22

<212> RNA

<213> 智人

<400> 97

aaugcacccg ggcaaggauu cu 22

<210> 98

<211> 21

<212> RNA

<213> 智人

<400> 98

uccgguucuc agggcuccac c 21

<210> 99

<211> 22

<212> RNA

<213> 智人

<400> 99

accacugacc guugacugua cc 22

<210> 100

<211> 22

<212> RNA

<213> 智人

<400> 100

auaaagcuag auaaccgaaa gu 22

<210> 101

<211> 22

<212> RNA

<213> 智人

<400> 101

aacuguuugc agaggaaacu ga 22

<210> 102

<211> 22

<212> RNA

<213> 智人

<400> 102

uacgucaucg uugucaucgu ca 22

<210> 103

<211> 22

<212> RNA

<213> 智人

<400> 103

aaaagcuggg uugagagggc aa 22

<210> 104

<211> 22

<212> RNA

<213> 智人

<400> 104

cuggcccucu cugcccuucc gu 22

<210> 105

<211> 21

<212> RNA

<213> 智人

<400> 105

aggaggcagc gcucucagga c 21

<210> 106

<211> 22

<212> RNA

<213> 智人

<400> 106

ugugacuggu ugaccagagg gg 22

<210> 107

<211> 22

<212> RNA

<213> 智人

<400> 107

cagugcaaug uuaaaagggc au 22

<210> 108

<211> 22

<212> RNA

<213> 智人

<400> 108

uagcuuauca gacugauguu ga 22

<210> 109

<211> 22

<212> RNA

<213> 智人

<400> 109

cagcagcaau ucauguuuug aa 22

<210> 110

<211> 22

<212> RNA

<213> 智人

<400> 110

aacccguaga uccgaucuug ug 22

<210> 111

<211> 23

<212> RNA

<213> 智人

<400> 111

acugcccuaa gugcuccuuc ugg 23

<210> 112

<211> 21

<212> RNA

<213> 智人

<400> 112

uagcagcaca gaaauauugg c 21

<210> 113

<211> 22

<212> RNA

<213> 智人

<400> 113

uccuucauuc caccggaguc ug 22

<210> 114

<211> 22

<212> RNA

<213> 智人

<400> 114

uggaauguaa ggaagugugu gg 22

<210> 115

<211> 22

<212> RNA

<213> 智人

<400> 115

augcaccugg gcaaggauuc ug 22

<210> 116

<211> 23

<212> RNA

<213> 智人

<400> 116

uaaggugcau cuagugcagu uag 23

<210> 117

<211> 23

<212> RNA

<213> 智人

<400> 117

aacauucauu guugucggug ggu 23

<210> 118

<211> 23

<212> RNA

<213> 智人

<400> 118

ugagcgccuc gacgacagag ccg 23

<210> 119

<211> 22

<212> RNA

<213> 智人

<400> 119

acugcugagc uagcacuucc cg 22

<210> 120

<211> 23

<212> RNA

<213> 智人

<400> 120

uacccuguag aaccgaauuu gug 23

<210> 121

<211> 21

<212> RNA

<213> 智人

<400> 121

cagcagcaca cugugguuug u 21

<210> 122

<211> 21

<212> RNA

<213> 智人

<400> 122

uucacagugg cuaaguucug c 21

<210> 123

<211> 21

<212> RNA

<213> 智人

<400> 123

ucacagugaa ccggucucuu u 21

<210> 124

<211> 22

<212> RNA

<213> 智人

<400> 124

uauggcacug guagaauuca cu 22

<210> 125

<211> 22

<212> RNA

<213> 智人

<400> 125

aagcugccag uugaagaacu gu 22

<210> 126

<211> 22

<212> RNA

<213> 智人

<400> 126

uucaaguaau ccaggauagg cu 22

<210> 127

<211> 22

<212> RNA

<213> 智人

<400> 127

ugucaguuug ucaaauaccc ca 22

<210> 128

<211> 21

<212> RNA

<213> 智人

<400> 128

uggguuuacg uugggagaac u 21

<210> 129

<211> 22

<212> RNA

<213> 智人

<400> 129

uauugcacuu gucccggccu gu 22

<210> 130

<211> 22

<212> RNA

<213> 智人

<400> 130

cugguuucac augguggcuu ag 22

<210> 131

<211> 21

<212> RNA

<213> 智人

<400> 131

caacaccagu cgaugggcug u 21

<210> 132

<211> 23

<212> RNA

<213> 智人

<400> 132

cccaguguuc agacuaccug uuc 23

<210> 133

<211> 22

<212> RNA

<213> 智人

<400> 133

ucagugcacu acagaacuuu gu 22

<210> 134

<211> 22

<212> RNA

<213> 智人

<400> 134

ugggucuuug cgggcgagau ga 22

<210> 135

<211> 22

<212> RNA

<213> 智人

<400> 135

agggcuuagc ugcuugugag ca 22

<210> 136

<211> 23

<212> RNA

<213> 智人

<400> 136

uaauacugcc ggguaaugau gga 23

<210> 137

<211> 23

<212> RNA

<213> 智人

<400> 137

uaaagugcuu auagugcagg uag 23

<210> 138

<211> 22

<212> RNA

<213> 智人

<400> 138

uguaacagca acuccaugug ga 22

<210> 139

<211> 22

<212> RNA

<213> 智人

<400> 139

ccucccacac ccaaggcuug ca 22

<210> 140

<211> 23

<212> RNA

<213> 智人

<400> 140

ugugcaaauc uaugcaaaac uga 23

<210> 141

<211> 21

<212> RNA

<213> 智人

<400> 141

cauaaaguag aaagcacuac u 21

<210> 142

<211> 20

<212> RNA

<213> 智人

<400> 142

uacaguauag augauguacu 20

<210> 143

<211> 23

<212> RNA

<213> 智人

<400> 143

guccaguuuu cccaggaauc ccu 23

<210> 144

<211> 23

<212> RNA

<213> 智人

<400> 144

uacccuguag auccgaauuu gug 23

<210> 145

<211> 21

<212> RNA

<213> 智人

<400> 145

aucacauugc cagggauuuc c 21

<210> 146

<211> 22

<212> RNA

<213> 智人

<400> 146

gggguuccug gggaugggau uu 22

<210> 147

<211> 22

<212> RNA

<213> 智人

<400> 147

cgaaucauua uuugcugcuc ua 22

<210> 148

<211> 23

<212> RNA

<213> 智人

<400> 148

cagugcaaua guauugucaa agc 23

<210> 149

<211> 22

<212> RNA

<213> 智人

<400> 149

uacccauugc auaucggagu ug 22

<210> 150

<211> 22

<212> RNA

<213> 智人

<400> 150

uguaaacauc cuacacucag cu 22

<210> 151

<211> 22

<212> RNA

<213> 智人

<400> 151

uguaaacauc cuugacugga ag 22

<210> 152

<211> 23

<212> RNA

<213> 智人

<400> 152

agugccugag ggaguaagag ccc 23

<210> 153

<211> 23

<212> RNA

<213> 智人

<400> 153

aaugacacga ucacucccgu uga 23

<210> 154

<211> 17

<212> RNA

<213> 智人

<400> 154

uggagagaaa ggcagua 17

<210> 155

<211> 22

<212> RNA

<213> 智人

<400> 155

caugccuuga guguaggacc gu 22

<210> 156

<211> 23

<212> RNA

<213> 智人

<400> 156

ucaagagcaa uaacgaaaaa ugu 23

<210> 157

<211> 22

<212> RNA

<213> 智人

<400> 157

aagacgggag gaaagaaggg ag 22

<210> 158

<211> 22

<212> RNA

<213> 智人

<400> 158

ucaccagccc uguguucccu ag 22

<210> 159

<211> 21

<212> RNA

<213> 智人

<400> 159

ugucuugcag gccgucaugc a 21

<210> 160

<211> 23

<212> RNA

<213> 智人

<400> 160

cgcauccccu agggcauugg ugu 23

<210> 161

<211> 22

<212> RNA

<213> 智人

<400> 161

aaucguacag ggucauccac uu 22

<210> 162

<211> 22

<212> RNA

<213> 智人

<400> 162

aaaccguuac cauuacugag uu 22

<210> 163

<211> 22

<212> RNA

<213> 智人

<400> 163

uuguacaugg uaggcuuuca uu 22

<210> 164

<211> 23

<212> RNA

<213> 智人

<400> 164

acuccauuug uuuugaugau gga 23

<210> 165

<211> 22

<212> RNA

<213> 智人

<400> 165

aucacauugc cagugauuac cc 22

<210> 166

<211> 22

<212> RNA

<213> 智人

<400> 166

uucaacgggu auuuauugag ca 22

<210> 167

<211> 23

<212> RNA

<213> 智人

<400> 167

ugaggggcag agagcgagac uuu 23

<210> 168

<211> 18

<212> RNA

<213> 智人

<400> 168

aaagcugggu ugagaagg 18

<210> 169

<211> 21

<212> RNA

<213> 智人

<400> 169

caagucacua gugguuccgu u 21

<210> 170

<211> 22

<212> RNA

<213> 智人

<400> 170

cacuagauug ugagcuccug ga 22

<210> 171

<211> 22

<212> RNA

<213> 智人

<400> 171

uagcaccauu ugaaaucggu ua 22

<210> 172

<211> 20

<212> RNA

<213> 智人

<400> 172

ccucugggcc cuuccuccag 20

<210> 173

<211> 21

<212> RNA

<213> 智人

<400> 173

aagccugccc ggcuccucgg g 21

<210> 174

<211> 22

<212> RNA

<213> 智人

<400> 174

uccauuacac uacccugccu cu 22

<210> 175

<211> 22

<212> RNA

<213> 智人

<400> 175

ugagaacuga auuccauagg cu 22

<210> 176

<211> 22

<212> RNA

<213> 智人

<400> 176

uggcaguguc uuagcugguu gu 22

<210> 177

<211> 23

<212> RNA

<213> 智人

<400> 177

gcaaagcaca cggccugcag aga 23

<210> 178

<211> 22

<212> RNA

<213> 智人

<400> 178

uagguuaucc guguugccuu cg 22

<210> 179

<211> 23

<212> RNA

<213> 智人

<400> 179

caacggaauc ccaaaagcag cug 23

<210> 180

<211> 22

<212> RNA

<213> 智人

<400> 180

aacuggcccu caaagucccg cu 22

<210> 181

<211> 23

<212> RNA

<213> 智人

<400> 181

cagugcaaug auauugucaa agc 23

<210> 182

<211> 22

<212> RNA

<213> 智人

<400> 182

cuuucagucg gauguuuaca gc 22

<210> 183

<211> 22

<212> RNA

<213> 智人

<400> 183

aaaagcuggg uugagagggc ga 22

<210> 184

<211> 22

<212> RNA

<213> 智人

<400> 184

acaguagucu gcacauuggu ua 22

<210> 185

<211> 22

<212> RNA

<213> 智人

<400> 185

aaugcaccug ggcaaggauu ca 22

<210> 186

<211> 22

<212> RNA

<213> 智人

<400> 186

uuuugcgaug uguuccuaau au 22

<210> 187

<211> 22

<212> RNA

<213> 智人

<400> 187

aaacaaacau ggugcacuuc uu 22

<210> 188

<211> 22

<212> RNA

<213> 智人

<400> 188

ucguaccgug aguaauaaug cg 22

<210> 189

<211> 22

<212> RNA

<213> 智人

<400> 189

uagcagcaca ucaugguuua ca 22

<210> 190

<211> 23

<212> RNA

<213> 智人

<400> 190

ucccuguccu ccaggagcuc acg 23

<210> 191

<211> 21

<212> RNA

<213> 智人

<400> 191

gaacggcuuc auacaggagu u 21

Claims

1.至少一种试剂在制造用于检测或诊断受试者的胃癌或确定受试者患有胃癌的可能性的诊断试剂中的用途，所述至少一种试剂为用于确定从所述受试者获得的非细胞生物流体样品中选自由hsa-miR-21-5p，hsa-miR-103a-3p，hsa-miR-20a-5p，hsa-miR-181a-5p，hsa-miR-142-5p，hsa-miR-27a-5p，hsa-miR-26a-5p，hsa-miR-17-5p，hsa-miR-616-5p，hsa-miR-30a-5p，hsa-miR-532-5p和hsa-miR-30e-5p的至少六种微小RNA(miRNA)的表达水平；以及

其中与对照相比，所述样品中miRNA表达的差异表达诊断所述受试者患有胃癌。

2.根据权利要求1所述的用途，其中所述对照是未患胃癌的受试者。

3.根据权利要求1或2所述的用途，其中所述miRNA是以下所有：hsa-miR-21-5p，hsa-miR-103a-3p，hsa-miR-20a-5p，hsa-miR-181a-5p，hsa-miR-142-5p，hsa-miR-27a-5p，hsa-miR-26a-5p，hsa-miR-17-5p，hsa-miR-616-5p，hsa-miR-30a-5p，hsa-miR-532-5p和hsa-miR-30e-5p。