CN111676291A - 一种用于肺癌患病风险评估的miRNA标志物 - Google Patents

一种用于肺癌患病风险评估的miRNA标志物 Download PDF

Info

Publication number
CN111676291A
CN111676291A CN202010677019.5A CN202010677019A CN111676291A CN 111676291 A CN111676291 A CN 111676291A CN 202010677019 A CN202010677019 A CN 202010677019A CN 111676291 A CN111676291 A CN 111676291A
Authority
CN
China
Prior art keywords
mir
hsa
risk
lung cancer
mirna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010677019.5A
Other languages
English (en)
Other versions
CN111676291B (zh
Inventor
陈艺尹
吴佳伟
朱鹏霖
林媛媛
范宏伟
赵丹丹
李淇
张素芳
常乐
耿晟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xuzhou Medical University
Original Assignee
Xuzhou Medical University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xuzhou Medical University filed Critical Xuzhou Medical University
Priority to CN202010677019.5A priority Critical patent/CN111676291B/zh
Publication of CN111676291A publication Critical patent/CN111676291A/zh
Application granted granted Critical
Publication of CN111676291B publication Critical patent/CN111676291B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/178Oligonucleotides characterized by their use miRNA, siRNA or ncRNA

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Computational Linguistics (AREA)
  • Immunology (AREA)
  • Genetics & Genomics (AREA)
  • Pathology (AREA)
  • Oncology (AREA)
  • Hospice & Palliative Care (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Medical Informatics (AREA)
  • Microbiology (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Physiology (AREA)
  • Biochemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了一种用于肺癌患病风险评估的miRNA标志物,所述miRNA标志物包括hsa‑miR‑4730、hsa‑miR‑125a、hsa‑miR‑3615、hsa‑miR‑575中的至少一个。本发明的miRNA标志物诊断肺癌患病风险AUC值均为0.90以上,研究结果对于肺癌患病风险评估具有重要意义。

Description

一种用于肺癌患病风险评估的miRNA标志物
技术领域
本发明属于生物医学领域,涉及一种用于肺癌患病风险评估的miRNA标志物。
背景技术
肺癌是世界范围内发病率和死亡率最高的恶性肿瘤。肺癌早期病情隐匿,通常无任何症状,但大部分患者在初诊时已处于中晚期,失去了手术切除的机会。晚期肺癌患者的五年生存率不足5%,而早期肺癌患者的五年生存率可达90%以上。因此,早期诊断是肺癌患者获得良好预后的一个重要机会。
目前,肺癌的早期诊断方法有胸部影像学、支气管镜检技术以及痰脱落细胞学检测等,但这些方法的检测效果均不理想。痰检诊断中央型肺癌的敏感性约为50%,而对周围型肺癌则不足20%。支气管镜检技术对中央型肺癌的诊断率约为90%,但对周围型肺癌,尤其对癌前病变的诊断率只有不到30%。胸部影像学检查方法包括X线胸片(CxR)、低剂量螺旋CT(LDCT)和PET-CT等。CxR检查的误漏诊率很高达50-90%,LDCT和PET-CT检测肺内结节的特异性差。据报道,在肺癌早期筛查和诊断中广泛应用的LDCT技术,其检测产生的假阳性可高达21%以上。因此,单独利用影像学方法很难准确诊断早期肺癌,尚缺乏有效的生物标志物结合影像学技术(LDCT)来提高早期肺癌诊断的特异性。
现有技术预测肺癌患病风险的有效分子知之甚少。此外,许多已经公开的研究只集中在单个指标上来诊断肺癌的患病风险。然而,作为生物标志物的单个分子对于诊断肺癌患病风险不够灵敏和准确。
目前,作为生物标志物的多个分子对于肺癌的患病风险判定没有参考标准,也没有特异性的指标,远远不能适应对肺癌患者进行风险判定的需求。因此,寻找作为生物标志物的多个分子联合对于肺癌风险判定,以便在疾病早期选择最佳治疗方案,显著提高患者生存率,成为胸外科领域亟待解决的重要课题。
发明内容
鉴于现有技术存在的问题,本发明的目的在于提供一种含有miRNA作为生物标志物判断肺癌患病风险的模型。本发明提供多个分子作为生物标记物,提高了对于判断肺癌患病风险的灵敏度和准确性,从而降低肺癌患者的死亡率。
根据本发明一个方面,本发明提供了一种用于肺癌患病风险评估的miRNA标志物,所述miRNA标志物包括hsa-miR-4730、hsa-miR-125a、hsa-miR-3615、hsa-miR-575中的一个或多个;
优选地,所述miRNA标志物是hsa-miR-4730、hsa-miR-125a、hsa-miR-3615、hsa-miR-575中的任意一个;
优选地,所述miRNA标志物是hsa-miR-4730、hsa-miR-125a、hsa-miR-3615、hsa-miR-575中的任意二个;
优选地,所述miRNA标志物是hsa-miR-4730、hsa-miR-125a、hsa-miR-3615、hsa-miR-575中的任意三个;
优选地,所述miRNA标志物是hsa-miR-4730、hsa-miR-125a、hsa-miR-3615、hsa-miR-575的组合。
进一步,hsa-miR-125a包括hsa-miR-125a-3p。
根据本发明的另一个方面,本发明提供了前面所述的miRNA标志物的检测试剂。
根据本发明的又一个方面,本发明提供了一种用于肺癌患病风险评估的试剂盒,所述试剂盒包括前面所述的检测试剂。
根据本发明的又一个方面,本发明提供了一种含有前面所述的miRNA标志物诊断肺癌患病风险评分模型的建立方法,所述方法包括如下步骤:
1)数据采集
从GEO数据库总共获得10475例正常人和1801例肺癌患者的血清循环miRNA表达谱数据;从10475例正常人中随机抽取300例数据作为训练集、余下的数据作为测试集;从1801例肺癌患者中随机抽取300例数据作为训练集、余下的数据作为测试集;
2)数据归一化处理
对测试集数据和训练集数据归一化处理;a)把数据归一化至(0,1)区间或者(-1,1)区间;b)把有量纲表达式变成无量纲表达式;
3)筛选差异表达分子
针对测试集数据使用edgeR包筛选出差异表达miRNA;筛选标准为p-value≤0.05,logFC≥2或≤-2,FDR≤0.05;
4)模型构建
利用神经网络模型建立风险评分模型;利用神经网络模型对输入的microRNA表达量分类以判断是否为肺癌;所述风险评分模型为:风险评分=model(hsa-miR-4730、hsa-miR-125a、hsa-miR-3615、hsa-miR-575中至少一个的表达水平);当风险评分大于0.5时,受试者患有肺癌的风险高;当风险评分小于0.5时,受试者患有肺癌的风险低;
5)模型验证
使用测试集数据对风险评分模型进行验证,检验所建模型的预测准确度。
进一步,所述神经网络模型的主体依次包括初始卷积层(init_conv)、八个残差卷积模块(res_block)、一个全局池化层(GlobalAveragePooling),一个全连接层(Dense)以及一个激活输出层(Sigmoid);其中,conv为一维卷积操作,k代表卷积核的大小,filters代表卷积核的个数;BatchNorm为批标准化层,其作用为将上一层的输出张量规范化至均值为0、方差为1的标准正态分布,以缓解网络训练中的梯度弥散和梯度爆炸,加快模型的训练速度;ReLU为线性整流函数(Rectified Linear Unit),又称修正线性单元,是一种神经网络中常用的激活函数;初始卷积层由conv(k=2,filters=64)、BatchNorm、ReLU组成;卷积模块由BatchNorm、ReLU、conv(k,filters)组成;残差卷积模块由conv_block(k=1,filters1),conv_block(k=2,filters2),conv_block(k=1,filters3)三者组成,其中filters1、filters2、filters3,代表选取三种数量的卷积核。
进一步,风险评分=model(hsa-miR-4730的表达水平、hsa-miR-125a的表达水平、hsa-miR-3615的表达水平、或hsa-miR-575的表达水平);当风险评分大于0.5时,受试者患有肺癌的风险高;当风险评分小于0.5时,受试者患有肺癌的风险低。
根据本发明的又一个方面,本发明提供了根据前面所述的方法构建的风险评分模型。
根据本发明的又一个方面,本发明提供了一种肺癌患病风险评估系统,所述系统包括诊断模块,所述诊断模块利用前面构建的风险评分模型对受试者患有肺癌的风险作出判断。
进一步,所述系统还可以包括数据输入模块、数据预处理模块、模型训练模块、模型测试模块。
数据预处理模块的工作原理是:将数据输入模块采集好的miRNA数据进行数据化归一化处理至0-1区间。
模型训练模块的工作原理是:将归一化处理后的数据利用神经网络方法构建风险评分模型。
模型测试模块的工作原理是:待检测的miRNA数据代入模型训练模块训练好的风险评分模型中,前向传播,输出结果。
根据本发明的又一个方面,本发明提供了前面所述的miRNA标志物的应用,所述应用包括以下任一项所述的应用:
1)在制备前面所述的检测试剂中的应用;
2)在制备前面所述的检测试剂盒中的应用;
3)在制备前面所述的系统中的应用。
本发明所用的术语“microRNA”(或″miRNA″)具有其在本领域中的普通含义(Bartel,D.P.(2004)Cell 23,281-292;He,L.and Hannon,G.J.(2004)Nat Rev Genet 5,522-531)。因此,“microRNA”表示来自遗传基因位点的RNA分子,其从可以形成局部RNA前体miRNA结构的转录物加工而来。成熟miRNA通常长度为20、21、22、23、24或25个核苷酸,尽管其它数目的核苷酸也可存在,例如18、19、26或27个核苷酸。
miRNA编码序列具有与侧翼基因组序列配对的潜力,使成熟miRNA放置在非完全配对的RNA双链体之内(本文也称作茎-环或发夹结构或pre-miRNA),所述双链体作为从更长的前体转录物进行miRNA加工的中间体。这一加工典型地通过分别称为Drosha和Dicer的两种特定的内切核酸酶的连续作用而发生。Drosha从初级转录物(本文也称作“pri-miRNA”)产生典型地折叠成发夹或茎-环结构的miRNA前体(本文也称作“pre-miRNA”)。采用Dicer方法切割这个miRNA前体可以得到miRNA双链体,其发夹或茎-环结构的一条臂包含成熟miRNA,另一条臂包含类似大小的节段(通常称为miRNA*)。
所述的miRNA随后被引导到其靶mRNA以发挥其功能,而miRNA*被降解。另外,miRNA典型地衍生自与预测的蛋白质编码区不同的基因组节段。
本发明所用的术语“miRNA前体”(或“前体miRNA”或“pre-miRNA”)是指miRNA初级转录物的一部分,成熟miRNA从该miRNA初级转录物加工得到。典型地,pre-miRNA折叠成稳定的发夹(即双链体)或茎-环结构。发夹结构典型地长度为50-80个核苷酸,优选60-70个核苷酸(将miRNA残基,与miRNA配对的残基,及任何间插节段都算在内,但排除更远端的序列)。
本发明所用的术语“差异表达”是指特定miRNA在靶血清中的表达水平与在对照血清中相比是改变的,所述对照血清可以是健康个体的血清或其它类型疾病患者的血清,其可以是上调(即在靶血清中miRNA浓度增加)或下调(即在靶血清中miRNA浓度降低或消失)。换句话说,核酸分子在靶血清中被激活至比在对照血清中更高或更低的水平。
本发明所用的术语“表达水平”是指特定的miRNA序列从其基因组基因座被转录的程度,即miRNA在一个或多个被分析血清中的浓度。
如上所述,术语“对照血清”典型地指从不具有肺癌表型特征的个体采集的血清。
表达水平的测定典型地遵循本领域熟知的已建立的标准程序(Sambrook,J.etal.(1989)Molecular Cloning:A Laboratory Manual.2nd Ed.,Cold Spring HarborLaboratory Press,Cold Spring Harbor,NY;Ausubel,F.M.et al.(2001)CurrentProtocols in Molecular Biology.Wiley&Sons,Hoboken,NJ)。所述的测定可以在RNA水平进行,例如使用miRNA特异性探针进行Northern印迹分析,或者在RNA逆转录(及克隆)后的DNA水平进行,例如通过定量PCR或实时PCR技术。本发明所用的术语“测定”包括编码miRNA序列的任何核酸分子的分析。但是,由于pri-miRNA及re-mRNA半寿期短,仅典型地测量成熟miRNA的浓度。
本发明公开的所有miRNA序列均已经储存在miRBase数据库中(http://microrna.sanger.ac.uk/;也参见Griffiths-Jones S.et al.(2008)Nucl.Acids Res.36,D154-D158)。
与现有技术相比,本发明具有以下有益效果。
本发明主要强调收集生物标志物来评估肺癌患病风险,通过R分析获得训练集中风险判断相关基因,然后利用神经网络方法最终确定模型。根据风险评分的中位数将受试者分为高风险和低风险。
本发明提出一种含有1个或多个miRNA作为生物标志物诊断肺癌患病风险的模型。并且在实施例中进一步验证了该模型的可行性,本发明为分析受试者肺癌患病风险提供了可靠的方法。
附图说明
图1显示训练集中hsa-miR-125a-3p诊断肺癌患病风险的ROC曲线;
图2显示训练集中hsa-miR-3615诊断肺癌患病风险的ROC曲线;
图3显示训练集中hsa-miR-4730诊断肺癌患病风险的ROC曲线;
图4显示训练集中hsa-miR-575诊断肺癌患病风险的ROC曲线;
图5显示训练集中hsa-miR-125a-3p+hsa-miR-3615诊断肺癌患病风险的ROC曲线;
图6显示训练集中hsa-miR-125a-3p+hsa-miR-4730诊断肺癌患病风险的ROC曲线;
图7显示训练集中hsa-miR-125a-3p+hsa-miR-575诊断肺癌患病风险的ROC曲线;
图8显示训练集中hsa-miR-3615+hsa-miR-4730诊断肺癌患病风险的ROC曲线;
图9显示训练集中hsa-miR-3615+hsa-miR-575诊断肺癌患病风险的ROC曲线;
图10显示训练集中hsa-miR-4730+hsa-miR-575诊断肺癌患病风险的ROC曲线;
图11显示训练集中hsa-miR-125a-3p+hsa-miR-3615+hsa-miR-4730诊断肺癌患病风险的ROC曲线;
图12显示训练集中hsa-miR-125a-3p+hsa-miR-3615+hsa-miR-575诊断肺癌患病风险的ROC曲线;
图13显示训练集中hsa-miR-125a-3p+hsa-miR-4730+hsa-miR-575诊断肺癌患病风险的ROC曲线;
图14显示训练集中hsa-miR-3615+hsa-miR-4730+hsa-miR-575诊断肺癌患病风险的ROC曲线;
图15显示训练集中hsa-miR-125a-3p+hsa-miR-3615+hsa-miR-4730+hsa-miR-575诊断肺癌患病风险的ROC曲线;
图16显示测试集中hsa-miR-125a-3p诊断肺癌患病风险的ROC曲线;
图17显示测试集中hsa-miR-3615诊断肺癌患病风险的ROC曲线;
图18显示测试集中hsa-miR-4730诊断肺癌患病风险的ROC曲线;
图19显示测试集中hsa-miR-575诊断肺癌患病风险的ROC曲线;
图20显示测试集中hsa-miR-125a-3p+hsa-miR-3615诊断肺癌患病风险的ROC曲线;
图21显示测试集中hsa-miR-125a-3p+hsa-miR-4730诊断肺癌患病风险的ROC曲线;
图22显示测试集中hsa-miR-125a-3p+hsa-miR-575诊断肺癌患病风险的ROC曲线;
图23显示测试集中hsa-miR-3615+hsa-miR-4730诊断肺癌患病风险的ROC曲线;
图24显示测试集中hsa-miR-3615+hsa-miR-575诊断肺癌患病风险的ROC曲线;
图25显示测试集中hsa-miR-4730+hsa-miR-575诊断肺癌患病风险的ROC曲线;
图26显示测试集中hsa-miR-125a-3p+hsa-miR-3615+hsa-miR-4730诊断肺癌患病风险的ROC曲线;
图27显示测试集中hsa-miR-125a-3p+hsa-miR-3615+hsa-miR-575诊断肺癌患病风险的ROC曲线;
图28显示测试集中hsa-miR-125a-3p+hsa-miR-4730+hsa-miR-575诊断肺癌患病风险的ROC曲线;
图29显示测试集中hsa-miR-3615+hsa-miR-4730+hsa-miR-575诊断肺癌患病风险的ROC曲线;
图30显示测试集中hsa-miR-125a-3p+hsa-miR-3615+hsa-miR-4730+hsa-miR-575诊断肺癌患病风险的ROC曲线。
具体实施方式
下面结合附图和实施例详细描述本发明,以下所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员,在不脱离本发明方法的前提下,还可以做出若干改进和补充,这些改进和补充也应视为本发明的保护范围。
实施例1筛选与肺癌相关的miRNA
1、样本
从GEO数据库中选择GSE106817、GSE112264、GSE113486、GSE122497、GSE124158、GSE137140、GSE139031中的样本作为研究对象,共有10475例正常人和1801例肺癌患者的血清循环miRNA表达谱数据。
从10475例正常人中随机抽取300例数据作为测试集、余下的数据作为训练集;从1801例肺癌患者中随机抽取300例数据作为测试集、余下的数据作为训练集;
2、数据归一化处理
对测试集数据和训练集数据归一化处理;a)把数据归一化至(0,1)区间或者(1,1)区间;b)把有量纲表达式变成无量纲表达式;
3)筛选差异表达分子
针对测试集数据和训练集数据使用edgeR包筛选出差异表达miRNA;筛选标准为p-value≤0.05,logFC≥2或≤-2,FDR≤0.05;
4)结果
结果显示,经分析筛选得到4个与肺癌患病风险相关的miRNA,它们是:hsa-miR-125a-3p、hsa-miR-3615、hsa-miR-4730、hsa-miR-575。
实施例2风险评分模型构建
利用1维卷积神经网络模型构建风险评分模型。
1维卷积神经网络模型的输入张量维度为(length,1),其中length代表选取特征miRNA的数量。模型主体依次包括初始卷积层(init_conv)、八个残差卷积模块(res_block)、一个全局池化层(GlobalAveragePooling),一个全连接层(Dense)以及一个激活输出层(Sigmoid)。其中,conv为一维卷积操作,k代表卷积核的大小,filters代表卷积核的个数。BatchNorm为批标准化层,其作用为将上一层的输出张量规范化至均值为0、方差为1的标准正态分布,以缓解网络训练中的梯度弥散和梯度爆炸,加快模型的训练速度。ReLU为线性整流函数(Rectified Linear Unit),又称修正线性单元,是一种神经网络中常用的激活函数。初始卷积层由conv(k=2,filters=64)、BatchNorm、ReLU组成。卷积模块由BatchNorm、ReLU、conv(k,filters)组成。残差卷积模块由conv_block(k=1,filters1),conv_block(k=2,filters2),conv_block(k=1,filters3)三者组成,其中filters1、filters2、filters3,代表选取三种数量的卷积核。实验表明,利用上述设计的CNN分类模型,可以精确判断输入的miRNA的表达量是否为肺癌。
根据1维卷积神经网络模型代入前面所述的四种差异表达miRNA构建的风险评分模型为:风险评分=model(hsa-miR-125a-3p的表达水平,hsa-miR-3615的表达水平,hsa-miR-4730的表达水平,hsa-miR-575的表达水平)。当风险评分大于0.5时,受试者患有肺癌风险高;当风险评分小于0.5时,受试者患有肺癌风险低。
实施例3风险评分模型的诊断效能检测
在训练集中,使用本发明的风险评分模型诊断受试者肺癌患病风险的结果显示,单个miRNA或几个miRNA联合后可作为诊断肺癌患病风险的独立预后因子,3或4个miRNA联合后形成的曲线下面积(AUC)是最高的,如表1和图1-15所示。
表1不同miRNA标志物形成的曲线下面积
miRNA AUC
hsa-miR-125a-3p 0.77
hsa-miR-3615 0.80
hsa-miR-4730 0.54
hsa-miR-575 0.90
hsa-miR-125a-3p+hsa-miR-3615 0.96
hsa-miR-125a-3p+hsa-miR-4730 0.98
hsa-miR-125a-3p+hsa-miR-575 0.97
hsa-miR-3615+hsa-miR-4730 0.98
hsa-miR-3615+hsa-miR-575 0.97
hsa-miR-4730+hsa-miR-575 0.98
hsa-miR-125a-3p+hsa-miR-3615+hsa-miR-4730 0.99
hsa-miR-125a-3p+hsa-miR-3615+hsa-miR-575 0.98
hsa-miR-125a-3p+hsa-miR-4730+hsa-miR-575 1
hsa-miR-3615+hsa-miR-4730+hsa-miR-575 1
hsa-miR-125a-3p+hsa-miR-3615+hsa-miR-4730+hsa-miR-575 1
在测试集中,使用本发明的风险评分模型诊断受试者肺癌患病风险的结果显示,单个miRNA或几个miRNA联合后可作为诊断肺癌患病风险的独立预后因子,4个miRNA联合后形成的曲线下面积(AUC)是最高的,如表2和图15-30所示。
表2不同miRNA标志物形成的曲线下面积
Figure BDA0002584422010000101
Figure BDA0002584422010000111
上述实施例的说明只是用于理解本发明的方法及其核心思想。应当指出,对于本领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也将落入本发明权利要求的保护范围内。

Claims (10)

1.一种用于肺癌患病风险评估的miRNA标志物,其特征在于,所述miRNA标志物包括hsa-miR-4730、hsa-miR-125a、hsa-miR-3615、hsa-miR-575中的一个或多个;
优选地,所述miRNA标志物是hsa-miR-4730、hsa-miR-125a、hsa-miR-3615、hsa-miR-575中的任意一个;
优选地,所述miRNA标志物是hsa-miR-4730、hsa-miR-125a、hsa-miR-3615、hsa-miR-575中的任意二个;
优选地,所述miRNA标志物是hsa-miR-4730、hsa-miR-125a、hsa-miR-3615、hsa-miR-575中的任意三个;
优选地,所述miRNA标志物是hsa-miR-4730、hsa-miR-125a、hsa-miR-3615、hsa-miR-575的组合。
2.根据权利要求1所述的miRNA标志物,其特征在于,hsa-miR-125a包括hsa-miR-125a-3p。
3.权利要求1或2所述的miRNA标志物的检测试剂。
4.一种用于肺癌患病风险评估的试剂盒,其特征在于,所述试剂盒包括权利要求3所述的检测试剂。
5.一种含有权利要求1或2所述的miRNA标志物诊断肺癌患病风险评分模型的建立方法,其特征在于,所述方法包括如下步骤:
1)数据采集
从GEO数据库总共获得10475例正常人和1801例肺癌患者的血清循环miRNA表达谱数据;从10475例正常人中随机抽取300例数据作为测试集、余下的数据作为训练集;从1801例肺癌患者中随机抽取300例数据作为测试集、余下的数据作为训练集;
2)数据归一化处理
对测试集数据和训练集数据归一化处理;a)把数据归一化至(0,1)区间或者(-1,1)区间;b)把有量纲表达式变成无量纲表达式;
3)筛选差异表达分子
针对测试集数据使用edgeR包筛选出差异表达miRNA;筛选标准为p-value≤0.05,logFC≥2或≤-2,FDR≤0.05;
4)模型构建
利用神经网络模型建立风险评分模型;利用神经网络模型对输入的miRNA表达量分类以判断是否为肺癌;所述风险评分模型为:风险评分=model(hsa-miR-4730、hsa-miR-125a、hsa-miR-3615、hsa-miR-575中至少一个的表达水平);当风险评分大于0.5时,受试者患有肺癌的风险高;当风险评分小于0.5时,受试者患有肺癌的风险低;
5)模型验证
使用测试集数据对风险评分模型进行验证,检验所建风险评分模型的预测准确度。
6.根据权利要求5所述的方法,其特征在于,风险评分=model(hsa-miR-4730的表达水平、hsa-miR-125a的表达水平、hsa-miR-3615的表达水平、或hsa-miR-575的表达水平);当风险评分大于0.5时,受试者患有肺癌的风险高;当风险评分小于0.5时,受试者患有肺癌的风险低。
7.根据权利要求5所述的方法,其特征在于,所述神经网络模型的主体依次包括初始卷积层、八个残差卷积模块、一个全局池化层,一个全连接层以及一个激活输出层;其中,conv为一维卷积操作,k代表卷积核的大小,filters代表卷积核的个数;BatchNorm为批标准化层,其作用为将上一层的输出张量规范化至均值为0、方差为1的标准正态分布,以缓解网络训练中的梯度弥散和梯度爆炸,加快模型的训练速度;ReLU为线性整流函数,又称修正线性单元,是一种神经网络中常用的激活函数;初始卷积层由conv(k=2,filters=64)、BatchNorm、ReLU组成;卷积模块由BatchNorm、ReLU、conv(k,filters)组成;残差卷积模块由conv_block(k=1,filters1),conv_block(k=2,filters2),conv_block(k=1,filters3)三者组成,其中filters1、filters2、filters3,代表选取三种数量的卷积核。
8.根据权利要求5-7中任一项所述的方法构建的风险评分模型。
9.一种肺癌患病风险评估系统,其特征在于,所述系统包括诊断模块,所述诊断模块利用权利要求8所述的风险评分模型对受试者患有肺癌的风险作出判断。
10.权利要求1或2所述的miRNA标志物的应用,其特征在于,所述应用包括以下任一项所述的应用:
1)在制备权利要求3所述的检测试剂中的应用;
2)在制备权利要求4所述的检测试剂盒中的应用;
3)在制备权利要求9所述的系统中的应用。
CN202010677019.5A 2020-07-14 2020-07-14 一种用于肺癌患病风险评估的miRNA标志物 Active CN111676291B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010677019.5A CN111676291B (zh) 2020-07-14 2020-07-14 一种用于肺癌患病风险评估的miRNA标志物

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010677019.5A CN111676291B (zh) 2020-07-14 2020-07-14 一种用于肺癌患病风险评估的miRNA标志物

Publications (2)

Publication Number Publication Date
CN111676291A true CN111676291A (zh) 2020-09-18
CN111676291B CN111676291B (zh) 2021-04-13

Family

ID=72457634

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010677019.5A Active CN111676291B (zh) 2020-07-14 2020-07-14 一种用于肺癌患病风险评估的miRNA标志物

Country Status (1)

Country Link
CN (1) CN111676291B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111455057A (zh) * 2020-03-30 2020-07-28 中国医学科学院肿瘤医院 用于肺癌诊断的试剂盒、装置及方法
CN112094910A (zh) * 2020-09-25 2020-12-18 无锡市中医医院 一种用于前列腺癌患病风险评估的miRNA标志物
CN114606319A (zh) * 2021-04-16 2022-06-10 博尔诚(北京)科技有限公司 用于检测肺癌的标志物、试剂盒及系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102892897A (zh) * 2009-12-24 2013-01-23 复旦大学 用于肺癌的微rna表达谱分析的组合物和方法
CN104818322A (zh) * 2015-04-02 2015-08-05 中国医学科学院肿瘤医院 miRNA和Cyfra21-1联合在检测非小细胞肺癌中的应用
CN105308189A (zh) * 2013-04-15 2016-02-03 瑞泽恩制药公司 响应于抗癌疗法的肿瘤细胞标志物
CN106471132A (zh) * 2014-06-18 2017-03-01 东丽株式会社 肺癌的检测试剂盒或装置以及检测方法
CN106636450A (zh) * 2017-03-10 2017-05-10 南京九寿堂医药科技有限公司 一种用于诊断非吸烟或轻度吸烟人群中肺鳞癌患者的非侵入性标记物及试剂盒
CN110799648A (zh) * 2017-06-29 2020-02-14 东丽株式会社 用于检测肺癌的试剂盒、装置和方法
CN111218513A (zh) * 2020-04-24 2020-06-02 上海思路迪医学检验所有限公司 一种用于肺癌早期诊断的外周血胞外囊泡microRNA生物标志物及其用途

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102892897A (zh) * 2009-12-24 2013-01-23 复旦大学 用于肺癌的微rna表达谱分析的组合物和方法
CN105308189A (zh) * 2013-04-15 2016-02-03 瑞泽恩制药公司 响应于抗癌疗法的肿瘤细胞标志物
CN106471132A (zh) * 2014-06-18 2017-03-01 东丽株式会社 肺癌的检测试剂盒或装置以及检测方法
CN104818322A (zh) * 2015-04-02 2015-08-05 中国医学科学院肿瘤医院 miRNA和Cyfra21-1联合在检测非小细胞肺癌中的应用
CN106636450A (zh) * 2017-03-10 2017-05-10 南京九寿堂医药科技有限公司 一种用于诊断非吸烟或轻度吸烟人群中肺鳞癌患者的非侵入性标记物及试剂盒
CN110799648A (zh) * 2017-06-29 2020-02-14 东丽株式会社 用于检测肺癌的试剂盒、装置和方法
CN111218513A (zh) * 2020-04-24 2020-06-02 上海思路迪医学检验所有限公司 一种用于肺癌早期诊断的外周血胞外囊泡microRNA生物标志物及其用途

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
SAM GRIFFITHS-JONES等: "miRBase: tools for microRNA genomics", 《NUCLEIC ACIDS RES》 *
余浩: "促进rAAV在肺癌细胞中高表达的miRNA筛选及机制初探", 《中国优秀硕士学位论文全文数据库(电子期刊)医药卫生科技辑》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111455057A (zh) * 2020-03-30 2020-07-28 中国医学科学院肿瘤医院 用于肺癌诊断的试剂盒、装置及方法
CN112094910A (zh) * 2020-09-25 2020-12-18 无锡市中医医院 一种用于前列腺癌患病风险评估的miRNA标志物
CN112094910B (zh) * 2020-09-25 2023-03-24 无锡市中医医院 一种用于前列腺癌患病风险评估的miRNA标志物
CN114606319A (zh) * 2021-04-16 2022-06-10 博尔诚(北京)科技有限公司 用于检测肺癌的标志物、试剂盒及系统

Also Published As

Publication number Publication date
CN111676291B (zh) 2021-04-13

Similar Documents

Publication Publication Date Title
CN111676291B (zh) 一种用于肺癌患病风险评估的miRNA标志物
CN105219844A (zh) 一种谱筛查十一种疾病的基因标志物组合、试剂盒以及疾病风险预测模型
CN114277143B (zh) 外泌体arpc5、cda等在肺癌诊断中的应用
CN107435062B (zh) 甄别肺部微小结节良恶性的外周血基因标志物及其用途
CN112481380A (zh) 一种评估晚期膀胱癌抗肿瘤免疫治疗反应性和预后生存的标志物及其应用
WO2016049927A1 (en) Biomarkers for obesity related diseases
CN111172285A (zh) 用于胰腺癌早期诊断和/或预后监测的miRNA组及其应用
WO2020117620A1 (en) Method, system and kit to detect metastatic hepatic cancer stemming from colorectal tumors and to determine a proposed treatment regime
CN109182520B (zh) 一种宫颈癌及其癌前病变检测试剂盒及其应用
CN116287252B (zh) 长链非编码rna apcdd1l-dt在制备检测胰腺癌的产品中的应用
CN111187836B (zh) 泌尿上皮癌的检测套组及微型核糖核酸组合物在制备用于预测泌尿上皮癌检测套组中的应用
US11427870B2 (en) Method for treating encapsulating peritoneal sclerosis
CN102766678B (zh) 通过基因记数方法对大肠癌术后无复发生存预测的检测方法、探针组和诊断试剂盒
CN114606319A (zh) 用于检测肺癌的标志物、试剂盒及系统
CN113801928A (zh) 评估个体罹患腹膜硬化症风险的方法、其分析器及其套组
CN116121378A (zh) 基因标志物在肺癌脑转移中的应用、检测模型的构建方法和检测装置
CN102766679B (zh) 通过二基因表达情况预测大肠癌术后无复发生存的检测方法、探针组和诊断试剂盒
CN115595369A (zh) 基于食管癌前病变或食管癌miRNAs液体活检预测模型、诊断试剂盒与应用
CN113801936A (zh) 用于肺癌诊断的试剂盒、装置及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant