CN114606319A - 用于检测肺癌的标志物、试剂盒及系统 - Google Patents
用于检测肺癌的标志物、试剂盒及系统 Download PDFInfo
- Publication number
- CN114606319A CN114606319A CN202210339016.XA CN202210339016A CN114606319A CN 114606319 A CN114606319 A CN 114606319A CN 202210339016 A CN202210339016 A CN 202210339016A CN 114606319 A CN114606319 A CN 114606319A
- Authority
- CN
- China
- Prior art keywords
- mir
- hsa
- lung cancer
- expression level
- subject
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
- G16B25/10—Gene or protein expression profiling; Expression-ratio estimation or normalisation
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/118—Prognosis of disease development
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/158—Expression markers
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/178—Oligonucleotides characterized by their use miRNA, siRNA or ncRNA
Landscapes
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Medical Informatics (AREA)
- Chemical & Material Sciences (AREA)
- Public Health (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Pathology (AREA)
- Databases & Information Systems (AREA)
- Organic Chemistry (AREA)
- Epidemiology (AREA)
- Data Mining & Analysis (AREA)
- Biophysics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Wood Science & Technology (AREA)
- Theoretical Computer Science (AREA)
- Zoology (AREA)
- Immunology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Analytical Chemistry (AREA)
- Molecular Biology (AREA)
- Primary Health Care (AREA)
- Microbiology (AREA)
- Oncology (AREA)
- Hospice & Palliative Care (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Bioethics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本申请公开了一种用于检测肺癌的系统、标志物及试剂盒。其中,所述标志物包括以下miRNA中的一种或两种以上:hsa‑miR‑31‑5p、hsa‑miR‑210‑3p、hsa‑miR‑223‑3p、hsa‑miR‑192‑3p、hsa‑miR‑193a‑5p、hsa‑miR‑671‑5p、hsa‑miR‑6754‑3p和hsa‑miR‑125a。本申请的标志物包含多个miRNA标志物,且可以通过非侵入性的方式进行检测,适用于大规模无症状人群的早期筛选和预后检测,本申请的系统对于分类早期肺癌具有更高的准确性。
Description
技术领域
本申请涉及生物技术领域,尤其涉及一种用于检测肺癌的标志物、试剂盒及系统。
背景技术
据2020年癌症统计,肺癌死亡率排全球首位,新发病例数仅次于女性乳腺癌,排第二位。而在中国,肺癌发病率和死亡率均居首位。以往研究统计,吸烟是诱发肺癌发生的重要暴露因素之一,尤其是非小细胞肺癌(NSCLC,约占总肺癌人数的80%)。随着公众健康意识的提高,全国范围的禁烟运动已经取得了显著的成果,然而肺癌新增和死亡病例统计数据依然在增长,而且15%的男性肺癌与53%的女性肺癌都无吸烟暴露。目前,肺癌依然是严重威胁人类生命健康的重要社会负担之一。
早期肺癌患者的5年存活率约50%(包含I和II期),然而晚期肺癌却不足4%。可见开展肺癌早筛早诊对于降低肺癌发病率提高生存质量是必要的。利用低剂量螺旋CT(LDCT)进行肺癌筛查可以提示早期肺癌的发生,进而改善早期肺癌患者的治疗效果。研究显示LDCT的假阳性率高达96%。由于LDCT特异性低而产生临床上大量的过度诊疗,增加患者恐慌心理,以及医疗负担和社会经济压力。尤其是针对现在更多的非吸烟人群的筛查更容易产生高假阳性结果。此外,LDCT的辐射暴露也是癌症的风险因素之一。因此,亟需新的更可行且有效的肺癌早期筛查策略来满足临床的迫切需要。
发明内容
本申请的目的在于提供了用于检测肺癌的标志物、试剂盒及系统。
本申请具体技术方案如下:
1.一种用于检测肺癌的标志物,其特征在于,所述标志物包括以下 miRNA中的一种或两种以上:hsa-miR-31-5p、hsa-miR-210-3p、 hsa-miR-223-3p、hsa-miR-192-3p、hsa-miR-193a-5p、hsa-miR-671-5p、 hsa-miR-6754-3p和hsa-miR-125a。
2.根据项1所述的标志物,其特征在于,
所述标志物包括:hsa-miR-31-5p、hsa-miR-210-3p、hsa-miR-223-3p、 hsa-miR-192-3p、hsa-miR-193a-5p、hsa-miR-671-5p、hsa-miR-6754-3p和 hsa-miR-125a。
3.项1或2所述的标志物在制备用于检测肺癌的试剂盒中的用途。
4.一种试剂盒,其特征在于,所述试剂盒包括用于检测项1或2所述的标志物的表达水平的试剂。
5.一种用于检测肺癌的系统,其特征在于,所述系统包括:
样品采集模块,其用于采集受试者的样品;
数据采集模块,其用于获取所述样品中的miRNA表达水平;
计算患肺癌概率的模块,其用于根据所述样品的miRNA表达水平计算受试者患肺癌的概率(p)。
6.根据项5所述的系统,其特征在于,
所述miRNA包括以下的一种或两种以上:hsa-miR-31-5p、 hsa-miR-210-3p、hsa-miR-223-3p、hsa-miR-192-3p、hsa-miR-193a-5p、 hsa-miR-671-5p、hsa-miR-6754-3p和hsa-miR-125a。
7.根据项6所述的系统,其特征在于,
所述miRNA包括:hsa-miR-31-5p、hsa-miR-210-3p、hsa-miR-223-3p、 hsa-miR-192-3p、hsa-miR-193a-5p、hsa-miR-671-5p、hsa-miR-6754-3p和 hsa-miR-125a。
8.根据项5所述的系统,其特征在于,
在计算患肺癌概率的模块中,预先存储有基于现有数据库中基于 hsa-miR-31-5p、hsa-miR-210-3p、hsa-miR-223-3p、hsa-miR-192-3p、 hsa-miR-193a-5p、hsa-miR-671-5p、hsa-miR-6754-3p和hsa-miR-125a的表达水平拟合的用于计算受试者患肺癌的概率(p)的公式,
优选所述公式是基于hsa-miR-31-5p、hsa-miR-210-3p、hsa-miR-223-3p、hsa-miR-192-3p、hsa-miR-193a-5p、hsa-miR-671-5p、hsa-miR-6754-3p和 hsa-miR-125a的表达水平通过逻辑逐步回归方法得到的公式。
9.根据项8所述的系统,其特征在于,
所述公式为如下公式一:
ln(p/(1-p))=a+b*miR-31-5的表达水平+c*miR-210-3p的表达水平 +d*miR-223-3p的表达水平+e*miR-192-3p的表达水平+f*miR-193a-5p的表达水平+g*miR-671-5p的表达水平+h*miR-6754-3p的表达水平+i*miR-125b-1-3p的表达水平(公式一)
其中,p为计算出的受试者患有肺癌的概率,a、b、c、d、e、f、g、h、 i为无单位参数;
a为选自-13.3到-9.8的任意数值,优选为-10.718;
b为选自0.05到0.37的任意数值,优选为0.089;
c为选自0.25到0.45的任意数值,优选为0.273;
d为选自0.16到0.5的任意数值,优选为0.403;
e为选自0.12到0.41的任意数值,优选为0.136;
f为选自0.33到1.35的任意数值,优选为0.382;
g为选自0.2到1.57的任意数值,优选为1.407;
h为选自-0.36到-0.2的任意数值,优选为-0.247;
i为选自-0.52到-0.3的任意数值,优选为-0.354。
10.根据项5所述的系统,其特征在于,
所述系统还包括判定模块,其用于根据计算患肺癌概率的模块所计算出的受试者患肺癌的概率(p)来判定受试者是否患有肺癌。
11.根据项10所述的系统,其特征在于,
在判定模块中,当受试者患肺癌的概率(p)大于0.349时,则判定受试者患有肺癌,
当受试者患肺癌的概率(p)小于等于0.349时,则判定受试者不患有肺癌。
12.一种用于检测肺癌的方法,其特征在于,所述方法包括:
样品采集步骤,其采集受试者的样品;
数据采集步骤,其获取所述样品中的miRNA表达水平;
计算患肺癌概率的步骤,其根据所述样品的miRNA表达水平计算受试者患肺癌的概率(p)。
13.根据项12所述的方法,其特征在于,
所述miRNA包括以下的一种或两种以上:hsa-miR-31-5p、 hsa-miR-210-3p、hsa-miR-223-3p、hsa-miR-192-3p、hsa-miR-193a-5p、 hsa-miR-671-5p、hsa-miR-6754-3p和hsa-miR-125a。
14.根据项13所述的方法,其特征在于,
所述miRNA包括:hsa-miR-31-5p、hsa-miR-210-3p、hsa-miR-223-3p、 hsa-miR-192-3p、hsa-miR-193a-5p、hsa-miR-671-5p、hsa-miR-6754-3p和 hsa-miR-125a。
15.根据项12所述的方法,其特征在于,
在计算患肺癌概率的步骤中,预先存储有基于现有数据库中基于 hsa-miR-31-5p、hsa-miR-210-3p、hsa-miR-223-3p、hsa-miR-192-3p、hsa-miR-193a-5p、hsa-miR-671-5p、hsa-miR-6754-3p和hsa-miR-125a的表达水平拟合的用于计算受试者患肺癌的概率(p)的公式,
优选所述公式是基于hsa-miR-31-5p、hsa-miR-210-3p、hsa-miR-223-3p、 hsa-miR-192-3p、hsa-miR-193a-5p、hsa-miR-671-5p、hsa-miR-6754-3p和 hsa-miR-125a的表达水平通过逻辑逐步回归方法得到的公式。
16.根据项15所述的方法,其特征在于,
所述公式为如下公式一:
ln(p/(1-p))=a+b*miR-31-5的表达水平+c*miR-210-3p的表达水平 +d*miR-223-3p的表达水平+e*miR-192-3p的表达水平+f*miR-193a-5p的表达水平+g*miR-671-5p的表达水平+h*miR-6754-3p的表达水平 +i*miR-125b-1-3p的表达水平(公式一)
其中,p为计算出的受试者患有肺癌的概率,a、b、c、d、e、f、g、h、 i为无单位参数;
a为选自-13.3到-9.8的任意数值,优选为-10.718;
b为选自0.05到0.37的任意数值,优选为0.089;
c为选自0.25到0.45的任意数值,优选为0.273;
d为选自0.16到0.5的任意数值,优选为0.403;
e为选自0.12到0.41的任意数值,优选为0.136;
f为选自0.33到1.35的任意数值,优选为0.382;
g为选自0.2到1.57的任意数值,优选为1.407;
h为选自-0.36到-0.2的任意数值,优选为-0.247;
i为选自-0.52到-0.3的任意数值,优选为-0.354。
17.根据项12所述的方法,其特征在于,
所述方法还包括判定步骤,其根据计算患肺癌概率的步骤所计算出的受试者患肺癌的概率(p)来判定受试者是否患有肺癌。
18.根据项17所述的方法,其特征在于,
在判定步骤中,当受试者患肺癌的概率(p)大于0.349时,则判定受试者患有肺癌,
当受试者患肺癌的概率(p)小于等于0.349时,则判定受试者不患有肺癌。
19.用于检测项1所述的标志物的试剂在制备用于检测肺癌的试剂盒中的用途。
20.项1所述的标志物用于检测肺癌的用途。
鉴于目前临床面临的巨大需求以及现有技术存在的问题,本申请利用生物信息学方法和机器学习方法,在转录后水平,通过分析肺癌血清样本的 miRNA表达数据,寻找到了一组与早期肺癌相关的miRNA组合物。并利用该miRNA组学数据构建了一套基于血浆miRNA表达数据的早期肺癌判别模型。本申请的标志物包含多个miRNA标志物,且可以通过非侵入性的方式进行检测,降低了侵入性检测造成的危害,适用于大规模无症状人群的早期筛选和预后检测,本申请的系统是基于肺癌血清miRNA数据建立的,系统中所采用的miRNA标志物均代表血清中游离肿瘤miRNA的表达信号,对于分类早期肺癌具有更高的准确性。
具体实施方式
下面对本申请做以详细说明。虽然显示了本申请的具体实施例,然而应当理解,可以以各种形式实现本申请而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本申请,并且能够将本申请的范围完整的传达给本领域的技术人员。
需要说明的是,在说明书及权利要求当中使用了某些词汇来指称特定组件。本领域技术人员应可以理解,技术人员可能会用不同名词来称呼同一个组件。本说明书及权利要求并不以名词的差异作为区分组件的方式,而是以组件在功能上的差异作为区分的准则。如在通篇说明书及权利要求当中所提及的“包含”或“包括”为开放式用语,故应解释成“包含但不限定于”。说明书后续描述为实施本申请的较佳实施方式,然而所述描述乃以说明书的一般原则为目的,并非用以限定本申请的范围。本申请的保护范围当视所附权利要求所界定者为准。
定义
除非在本文的其他地方具体限定,否则本文使用的所有其他技术和科学术语具有本申请所属领域的普通技术人员通常理解的含义。
在本文中,ROC曲线一定程度上可以反映分类器的分类效果。AUC实际上就是ROC曲线下的面积。AUC直观地反映了ROC曲线表达的分类能力。
特异性
特异性是指没有特定临床疾病的患者的样本,其检测结果呈阴性的比率。
灵敏度
灵敏度是指患有明确临床疾病的患者的样本,其检测结果呈阳性的比率。
差异表达
差异表达是指miRNA在肺癌血浆中的表达水平与在非癌对照血浆中的表达水平不相同。
CPM(Counts Per Million)
CPM(Counts Per Million)是一种高通量测序数据的标准化方法。其考虑了不同样本之间因测序量不同对基因定量的影响。
计算公式为:CPM=比对到某基因上的读段数/总读段数*10^6)
LASSO算法
LASSO是由1996年Robert Tibshirani首次提出,是一种压缩估计。它通过构造一个惩罚函数得到一个较为精炼的模型,使得它压缩一些系数,同时设定一些系数为零。因此保留了子集收缩的优点,是一种处理具有复共线性数据的有偏估计。
逐步回归方法
逐步回归方法是线性回归分析中通过依次引入变量进行回归分析,同时检验回归模型中所有自变量的相关性及其对因变量的统计学意义,删除不显著的变量。重复上述分析过程,直至模型中包含可以最大程度解释因变量的最优组合,遵循AIC最小化原则。
十倍交叉验证法
或称十折交叉验证,是常用的测试方法,用来测试算法准确性。在验证时将数据集分成十份,轮流将其中9份作为训练数据,1份作为测试数据,进行试验。每次试验都会得出相应的正确率(或差错率)。10次的结果的正确率(或差错率)的平均值作为对算法精度的估计,一般还需要进行多次10折交叉验证(例如10次10折交叉验证),再求其均值,作为对算法准确性的估计。十折交叉验证之所以选择将数据集分为10份,是因为通过利用大量数据集、使用不同学习技术进行的大量试验,表明10折是获得最好误差估计的恰当选择,而且也有一些理论根据可以证明这一点。
Youden指数
Youden指数即约登指数,也称正确指数,是评价筛查试验真实性的方法,假设其假阴性(漏诊率)和假阳性(误诊率)的危害性同等意义时,即可应用约登指数。约登指数是灵敏度与特异度之和减去1。表示筛检方法发现真正的患者与非患者的总能力。指数越大说明筛查实验的效果越好,真实性越大。
本申请提供了一种用于检测肺癌的标志物,所述标志物包括以下miRNA 中的一种或两种以上:hsa-miR-31-5p、hsa-miR-210-3p、hsa-miR-223-3p、 hsa-miR-192-3p、hsa-miR-193a-5p、hsa-miR-671-5p、hsa-miR-6754-3p和 hsa-miR-125a。
其中,miRNA是一类非编码小RNA,其成熟体的长度约22nt。miRNA 主要在转录后通过调节基因表达行使其功能。许多研究已发现miRNA参与到各种癌症的发病和进展过程中,包含细胞内的miRNA和血液中的游离状 miRNA。它们作为肿瘤抑制因子或致癌基因,具有癌症诊断和治疗检测标志物的潜能。miRNA具有明显的时空特异性,利用血液中游离miRNA的表达水平可用于癌症的早期检测,同时根据miRNA的组织特异性可追溯到癌症的原发部位。
在一个具体的实施方式中,所述标志物包括以下miRNA中的一种: hsa-miR-31-5p、hsa-miR-210-3p、hsa-miR-223-3p、hsa-miR-192-3p、 hsa-miR-193a-5p、hsa-miR-671-5p、hsa-miR-6754-3p和hsa-miR-125a。
在一个具体的实施方式中,所述标志物包括以下miRNA中的两种:hsa-miR-31-5p、hsa-miR-210-3p、hsa-miR-223-3p、hsa-miR-192-3p、 hsa-miR-193a-5p、hsa-miR-671-5p、hsa-miR-6754-3p和hsa-miR-125a。
在一个具体的实施方式中,所述标志物包括以下miRNA中的三种: hsa-miR-31-5p、hsa-miR-210-3p、hsa-miR-223-3p、hsa-miR-192-3p、 hsa-miR-193a-5p、hsa-miR-671-5p、hsa-miR-6754-3p和hsa-miR-125a。
在一个具体的实施方式中,所述标志物包括以下miRNA中的四种: hsa-miR-31-5p、hsa-miR-210-3p、hsa-miR-223-3p、hsa-miR-192-3p、 hsa-miR-193a-5p、hsa-miR-671-5p、hsa-miR-6754-3p和hsa-miR-125a。
在一个具体的实施方式中,所述标志物包括以下miRNA中的五种: hsa-miR-31-5p、hsa-miR-210-3p、hsa-miR-223-3p、hsa-miR-192-3p、 hsa-miR-193a-5p、hsa-miR-671-5p、hsa-miR-6754-3p和hsa-miR-125a。
在一个具体的实施方式中,所述标志物包括以下miRNA中的六种: hsa-miR-31-5p、hsa-miR-210-3p、hsa-miR-223-3p、hsa-miR-192-3p、 hsa-miR-193a-5p、hsa-miR-671-5p、hsa-miR-6754-3p和hsa-miR-125a。
在一个具体的实施方式中,所述标志物包括以下miRNA中的七种: hsa-miR-31-5p、hsa-miR-210-3p、hsa-miR-223-3p、hsa-miR-192-3p、 hsa-miR-193a-5p、hsa-miR-671-5p、hsa-miR-6754-3p和hsa-miR-125a。
在一个具体的实施方式中,所述标志物包括:hsa-miR-31-5p、 hsa-miR-210-3p、hsa-miR-223-3p、hsa-miR-192-3p、hsa-miR-193a-5p、 hsa-miR-671-5p、hsa-miR-6754-3p和hsa-miR-125a。
本申请还提供用于检测上述标志物的试剂在制备用于检测肺癌的试剂盒中的用途。进一步地,所述试剂盒包括用于检测上述标志物的表达水平的试剂。
本申请还提供上述标志物用于检测肺癌的用途。
本申请还提供一种用于检测肺癌的系统,所述系统包括:
样品采集模块,其用于采集受试者的样品;
数据采集模块,其用于获取所述样品中的miRNA表达水平;
计算患肺癌概率的模块,其用于根据所述样品的miRNA表达水平计算受试者患肺癌的概率(p)。
其中,所述样品为血液或血浆。
所述miRNA包括以下的一种或两种以上:hsa-miR-31-5p、hsa-miR-210-3p、hsa-miR-223-3p、hsa-miR-192-3p、hsa-miR-193a-5p、 hsa-miR-671-5p、hsa-miR-6754-3p和hsa-miR-125a。即数据采集模块用于获取上述miRNA的表达水平。
在一个具体的实施方式中,所述miRNA包括:hsa-miR-31-5p、 hsa-miR-210-3p、hsa-miR-223-3p、hsa-miR-192-3p、hsa-miR-193a-5p、 hsa-miR-671-5p、hsa-miR-6754-3p和hsa-miR-125a。即数据采集模块用于获取上述8种miRNA的表达水平。
获取miRNA表达水平可以根据现有技术已知的方法获取,例如可以通过市售芯片检测miRNA表达水平,或者可以通过高通量测序技术获取 miRNA的表达水平。
在一个具体的实施方式中,通过芯片检测miRNA表达水平包括以下步骤:采集受试者外周血,分离血清或血浆样品;提取纯化所述样品中的miRNA;针对纯化的miRNA样品用于探针杂交,利用Scanner进行质控和表达定量。
在一个具体的实施方式中,通过高通量测序技术检测miRNA的表达水平包括以下步骤:集受试者外周血,分离血清或血浆样品;提取纯化所述样品中的miRNA;针对纯化的miRNA样品构建用于测序的miRNA文库;预 PCR扩增上述miRNA文库;利用PCR扩增产物;对PCR扩增后的产物进行高通量二代测序;对测序数据进行生物信息学分析,确定样本的miRNA 表达水平。
在计算患肺癌概率的模块中,预先存储有基于现有数据库中基于 hsa-miR-31-5p、hsa-miR-210-3p、hsa-miR-223-3p、hsa-miR-192-3p、 hsa-miR-193a-5p、hsa-miR-671-5p、hsa-miR-6754-3p和hsa-miR-125a的表达水平拟合的用于计算受试者患肺癌的概率(p)的公式。
在一个具体的实施方式中,
所述公式为如下公式一:
ln(p/(1-p))=-a+b*miR-31-5的表达水平+c*miR-210-3p的表达水平 +d*miR-223-3p的表达水平+e*miR-192-3p的表达水平+f*miR-193a-5p的表达水平+g*miR-671-5p的表达水平+h*miR-6754-3p的表达水平 +i*miR-125b-1-3p的表达水平(公式一)
其中,p为计算出的受试者患有肺癌的概率,a、b、c、d、e、f、g、h、 i为无单位参数;
a为选自-13.3到-9.8的任意数值,优选为-10.718;
b为选自0.05到0.37的任意数值,优选为0.089;
c为选自0.25到0.45的任意数值,优选为0.273;
d为选自0.16到0.5的任意数值,优选为0.403;
e为选自0.12到0.41的任意数值,优选为0.136;
f为选自0.33到1.35的任意数值,优选为0.382;
g为选自0.2到1.57的任意数值,优选为1.407;
h为选自-0.36到-0.2的任意数值,优选为-0.247;
i为选自-0.52到-0.3的任意数值,优选为-0.354。
在一个具体的实施方式中,公式一为:
ln(p/(1-p))=-10.718+0.089*miR-31-5的表达水平+0.273*miR-210-3p的表达水平+0.403*miR-223-3p的表达水平+0.136*miR-192-3p的表达水平 +0.382*miR-193a-5p的表达水平+1.407*miR-671-5p的表达水平-0.247*miR-6754-3p的表达水平-0.354*miR-125b-1-3p的表达水平。
进一步地,所述系统还可以包括判定模块,其用于根据计算患肺癌概率的模块所计算出的受试者患肺癌的概率(p)来判定受试者是否患有肺癌。
在一个具体的实施方式中,在判定模块中,当受试者患肺癌的概率(p) 大于0.349时,则判定受试者患有肺癌,
当受试者患肺癌的概率(p)小于等于0.349时,则判定受试者不患有肺癌。
本申请还提供一种用于检测肺癌的方法,所述方法包括:
样品采集步骤,其采集受试者的样品;
数据采集步骤,其获取所述样品中的miRNA表达水平;
计算患肺癌概率的步骤,其根据所述样品的miRNA表达水平计算受试者患肺癌的概率(p)。
在计算患肺癌概率的步骤中,预先存储有基于现有数据库中基于 hsa-miR-31-5p、hsa-miR-210-3p、hsa-miR-223-3p、hsa-miR-192-3p、 hsa-miR-193a-5p、hsa-miR-671-5p、hsa-miR-6754-3p和hsa-miR-125a的表达水平拟合的用于计算受试者患肺癌的概率(p)的公式,
优选所述公式是基于hsa-miR-31-5p、hsa-miR-210-3p、hsa-miR-223-3p、 hsa-miR-192-3p、hsa-miR-193a-5p、hsa-miR-671-5p、hsa-miR-6754-3p和 hsa-miR-125a的表达水平通过逻辑逐步回归方法得到的公式。
进一步地,所述方法还可以包括判定步骤,其用于根据计算患肺癌概率的步骤所计算出的受试者患肺癌的概率(p)来判定受试者是否患有肺癌。
在用于检测肺癌的方法中,有关所述miRNA、公式的描述如上针对用于检测肺癌的系统部分的描述。
实施例
本申请对试验中所用到的材料以及试验方法进行一般性和/或具体的描述,在下面的实施例中,如果无其他特别的说明,%表示wt%,即重量百分数。所用试剂或仪器未注明生产厂商者,均为可以通过市购获得的常规试剂产品。
实施例1模型构建
1)数据采集:
下载GEO数据库(GeneExpressionOmnibus, https://www.ncbi.nlm.nih.gov/geo/)中肺癌血浆/血清miRNA表达芯片(日本东丽公司的3D-芯片)数据(GSE137140,GSE113486)。下载的芯片数据中共包含1566个肺癌样本和2178个非癌对照样本。从芯片数据中随机抽取1097个肺癌和1525个非癌对照样本作为训练集,测试集包含469个肺癌和653个非癌对照数据。
2)候选标志物筛选:
针对1566例肺癌和2178例非癌对照样本的血浆miRNA芯片数据,选择至少在80%的肺癌或非癌对照样本中表达的miRNA用于分析,共得到 1133个miRNA(记为:Set1),然后采用limma包计算肺癌和非癌对照样本间显著差异表达miRNA,筛选条件设置为|log(foldchange)|>1和BH校正后 p值<0.05,共获得496个显著差异miRNA集合(记为:Set2)。
3)标志物选择:
采用LASSO算法筛选候选标志物集合Set2得到44个差异miRNA。 miRNA通过其靶基因行使功能。利用TargetScan方法分析差异miRNA的靶基因,筛选得到10个功能性miRNA。在十倍交叉验证中以AUC值选择最优模型。针对二分类问题,利用R语言的逐步回归算法,以AIC进一步筛选对于肺癌分类8个贡献最大的miRNA的标志物集合(Set3),包含: hsa-miR-31-5p,hsa-miR-210-3p,hsa-miR-223-3p,hsa-miR-192-3p, hsa-miR-193a-5p,hsa-miR-671-5p,hsa-miR-6754-3p和hsa-miR-125a。
4)分类模型构建:
使用训练集数据,采用R语言的逻辑回归方法建立肺癌分类模型:以 Set3的8个miRNA的表达水平作为输入,通过模型计算预测得分,用以判断受试者是否为肺癌。其中模型为:ln(p/(1-p)) =-10.718+0.089*miR-31-5p+0.273*miR-210-3p+0.403*miR-223-3p+0.136*miR -192-3p+0.382*miR-193a-5p+1.407*miR-671-5p-0.247*miR-6754-3p-0.354*mi R-125b-1-3p。其中p为受试者患肺癌的概率,即得到计算受试者患肺癌的概率的公式一。
基于Youden指数,在训练集中选择真正率与假正率差异最大的值作为阈值,得到的阈值为0.349。当p大于0.349时,受试者判别为肺癌。训练集样本的灵敏度为94.5%,特异性为89.6%,ROC曲线下面积(AUC)为:0.962。
5)模型验证:
将测试数据集的上述8个miRNA标志物的表达水平引入4)步骤得到的分类模型中,计算测试样本的受试者患肺癌的概率,根据受试者患肺癌的概率的判别结果与测试样本的疾病状态一致性,统计模型预测准确性。模型判别的混淆矩阵如表1所示:
表1
针对训练集样本,模型的准确率为91.0%。
实施例2
以测试集中,上述包括hsa-miR-31-5p,hsa-miR-210-3p,hsa-miR-223-3p,hsa-miR-192-3p,hsa-miR-193a-5p,hsa-miR-671-5p,hsa-miR-6754-3p和 hsa-miR-125a Set3的8个标志物的表达水平为输入,计算单个标志物在测试集中用于预测肺癌的阈值和AUC值,结果如表2所示。
表2
miRNA | 阈值 | AUC |
hsa-miR-31-5p | 0.573 | 0.713 |
hsa-miR-210-3p | 0.49 | 0.803 |
hsa-miR-223-3p | 0.43 | 0.831 |
hsa-miR-192-3p | 0.539 | 0.728 |
hsa-miR-193a-5p | 0.886 | 0.816 |
hsa-miR-671-5p | 0.406 | 0.905 |
hsa-miR-6754-3p | 0.421 | 0.664 |
hsa-miR-125a | 0.387 | 0.805 |
实施例3
将实施例1中从GEO数据库中获取的数据中的剩余的40例肺癌血浆样本和100例非癌对照样本数据作为验证集,来验证实施例1中获得的分类模型,即公式一。
基于实施例1中构建的分类模型(公式一),计算得到的受试者患肺癌的概率结果如表3所示:
表3
上表中模型分类0代表判别为非癌,1代表模型判别为肺癌。
混淆矩阵如表4所示:
表4
针对验证集的预测准确度为92.9%。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种用于检测肺癌的标志物,其特征在于,所述标志物包括以下miRNA中的一种或两种以上:hsa-miR-31-5p、hsa-miR-210-3p、hsa-miR-223-3p、hsa-miR-192-3p、hsa-miR-193a-5p、hsa-miR-671-5p、hsa-miR-6754-3p和hsa-miR-125a,
优选地,所述标志物包括:hsa-miR-31-5p、hsa-miR-210-3p、hsa-miR-223-3p、hsa-miR-192-3p、hsa-miR-193a-5p、hsa-miR-671-5p、hsa-miR-6754-3p和hsa-miR-125a。
2.用于检测权利要求1所述的标志物的试剂在制备用于检测肺癌的试剂盒中的用途。
3.权利要求1所述的标志物用于检测肺癌的用途。
4.一种试剂盒,其特征在于,所述试剂盒包括用于检测权利要求1或2所述的标志物的表达水平的试剂。
5.一种用于检测肺癌的系统,其特征在于,所述系统包括:
样品采集模块,其用于采集受试者的样品;
数据采集模块,其用于获取所述样品中的miRNA表达水平;
计算患肺癌概率的模块,其用于根据所述样品的miRNA表达水平计算受试者患肺癌的概率(p)。
6.根据权利要求5所述的系统,其特征在于,
所述miRNA包括以下的一种或两种以上:hsa-miR-31-5p、hsa-miR-210-3p、hsa-miR-223-3p、hsa-miR-192-3p、hsa-miR-193a-5p、hsa-miR-671-5p、hsa-miR-6754-3p和hsa-miR-125a。
7.根据权利要求6所述的系统,其特征在于,
所述miRNA包括:hsa-miR-31-5p、hsa-miR-210-3p、hsa-miR-223-3p、hsa-miR-192-3p、hsa-miR-193a-5p、hsa-miR-671-5p、hsa-miR-6754-3p和hsa-miR-125a。
8.根据权利要求5所述的系统,其特征在于,
在计算患肺癌概率的模块中,预先存储有基于现有数据库中基于hsa-miR-31-5p、hsa-miR-210-3p、hsa-miR-223-3p、hsa-miR-192-3p、hsa-miR-193a-5p、hsa-miR-671-5p、hsa-miR-6754-3p和hsa-miR-125a的表达水平拟合的用于计算受试者患肺癌的概率(p)的公式,
优选地,所述公式是基于hsa-miR-31-5p、hsa-miR-210-3p、hsa-miR-223-3p、hsa-miR-192-3p、hsa-miR-193a-5p、hsa-miR-671-5p、hsa-miR-6754-3p和hsa-miR-125a的表达水平通过逻辑逐步回归方法得到的公式。
9.根据权利要求8所述的系统,其特征在于,
所述公式为如下公式一:
ln(p/(1-p))=a+b*miR-31-5的表达水平+c*miR-210-3p的表达水平+d*miR-223-3p的表达水平+e*miR-192-3p的表达水平+f*miR-193a-5p的表达水平+g*miR-671-5p的表达水平+h*miR-6754-3p的表达水平+i*miR-125b-1-3p的表达水平(公式一)
其中,p为计算出的受试者患有肺癌的概率,a、b、c、d、e、f、g、h、i为无单位参数;
a为选自-13.3到-9.8的任意数值,优选为-10.718;
b为选自0.05到0.37的任意数值,优选为0.089;
c为选自0.25到0.45的任意数值,优选为0.273;
d为选自0.16到0.5的任意数值,优选为0.403;
e为选自0.12到0.41的任意数值,优选为0.136;
f为选自0.33到1.35的任意数值,优选为0.382;
g为选自0.2到1.57的任意数值,优选为1.407;
h为选自-0.36到-0.2的任意数值,优选为-0.247;
i为选自-0.52到-0.3的任意数值,优选为-0.354。
10.根据权利要求5所述的系统,其特征在于,
所述系统还包括判定模块,其用于根据计算患肺癌概率的模块所计算出的受试者患肺癌的概率(p)来判定受试者是否患有肺癌,
优选地,在判定模块中,当受试者患肺癌的概率(p)大于0.349时,则判定受试者患有肺癌,
当受试者患肺癌的概率(p)小于等于0.349时,则判定受试者不患有肺癌。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110411155 | 2021-04-16 | ||
CN2021104111554 | 2021-04-16 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114606319A true CN114606319A (zh) | 2022-06-10 |
Family
ID=81866831
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210339016.XA Pending CN114606319A (zh) | 2021-04-16 | 2022-04-01 | 用于检测肺癌的标志物、试剂盒及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114606319A (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103484550A (zh) * | 2013-09-30 | 2014-01-01 | 中国科学院上海微系统与信息技术研究所 | 一组肺癌早期诊断用microRNA生物标志物及其应用 |
WO2020098607A1 (en) * | 2018-11-12 | 2020-05-22 | Mirxes(Hangzhou) Biotechnology Co., Ltd | A peripheral blood miRNA marker for diagnosis of non-small cell lung cancer |
CN111676291A (zh) * | 2020-07-14 | 2020-09-18 | 徐州医科大学 | 一种用于肺癌患病风险评估的miRNA标志物 |
CN112301130A (zh) * | 2020-11-12 | 2021-02-02 | 苏州京脉生物科技有限公司 | 一种肺癌早期检测的标志物、试剂盒及方法 |
-
2022
- 2022-04-01 CN CN202210339016.XA patent/CN114606319A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103484550A (zh) * | 2013-09-30 | 2014-01-01 | 中国科学院上海微系统与信息技术研究所 | 一组肺癌早期诊断用microRNA生物标志物及其应用 |
WO2020098607A1 (en) * | 2018-11-12 | 2020-05-22 | Mirxes(Hangzhou) Biotechnology Co., Ltd | A peripheral blood miRNA marker for diagnosis of non-small cell lung cancer |
CN111676291A (zh) * | 2020-07-14 | 2020-09-18 | 徐州医科大学 | 一种用于肺癌患病风险评估的miRNA标志物 |
CN112301130A (zh) * | 2020-11-12 | 2021-02-02 | 苏州京脉生物科技有限公司 | 一种肺癌早期检测的标志物、试剂盒及方法 |
Non-Patent Citations (2)
Title |
---|
WANG QI Z等: "Potential Uses of MicroRNA in Lung Cancer Diagnosis, Prognosis, and Therapy", 《CURRENT CANCER DRUG TARGETS》, vol. 9, no. 4, pages 572 - 594, XP008151479, DOI: 10.2174/156800909788486731 * |
吉丛等: "肿瘤诊治和预后判断分子标志物miRNA", 《中国肿瘤临床》, vol. 41, no. 20, pages 1333 - 1336 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105219844A (zh) | 一种谱筛查十一种疾病的基因标志物组合、试剂盒以及疾病风险预测模型 | |
CN111676291B (zh) | 一种用于肺癌患病风险评估的miRNA标志物 | |
CN114277139B (zh) | 外泌体arpc5、snhg5等在肺癌诊断中的应用 | |
CN111833963A (zh) | 一种cfDNA分类方法、装置和用途 | |
CN113436673A (zh) | 一种用于肝癌预后预测的分子标志物及其应用 | |
CN113470813A (zh) | 肝癌患者生存率预后模型 | |
CN105671179B (zh) | 血清microRNA在肝癌诊断中的应用及诊断试剂盒 | |
CN114606319A (zh) | 用于检测肺癌的标志物、试剂盒及系统 | |
CN116189904A (zh) | 一种分化型甲状腺癌的基因甲基化诊断模型及其构建方法 | |
CN113436721B (zh) | 原发性中枢神经系统淋巴瘤预后模型的建立方法及应用 | |
CN115261454A (zh) | 一种新的let-7d-5p和miR-140-5p的生物标志物面板诊断方法 | |
TWI758670B (zh) | 健康風險評估方法 | |
CN113470754A (zh) | 一种用于肿瘤预后评估的基因标志物、评估产品及应用 | |
CN113450917A (zh) | 生物标志物在预测肝癌预后中的应用 | |
CN113241181A (zh) | 一种用于肝癌患者的预后风险评估模型及评估装置 | |
WO2016049927A1 (en) | Biomarkers for obesity related diseases | |
CN112708686A (zh) | 肠道菌群在神经损伤检测中的应用 | |
CN113393901B (zh) | 一种基于单核细胞采集肿瘤核酸的胶质瘤分检装置 | |
CN109182520B (zh) | 一种宫颈癌及其癌前病变检测试剂盒及其应用 | |
CN116287252B (zh) | 长链非编码rna apcdd1l-dt在制备检测胰腺癌的产品中的应用 | |
CN115678998A (zh) | 一种检测肺腺癌EGFR突变的miRNA标志物、试剂盒及方法 | |
CN115820857A (zh) | 一种鉴别胃癌前病变和胃癌及诊断胃癌的试剂盒 | |
CN113450909A (zh) | 一种肝癌预后预测模型及其应用 | |
CN118006817A (zh) | 成年女性高原适应性肠道细菌组合标志物及其应用 | |
JP2024043823A (ja) | 対象のがん罹患の可能性を分析する方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |