CN111793692A - 一种特征miRNA表达谱组合及肺鳞癌早期预测方法 - Google Patents

一种特征miRNA表达谱组合及肺鳞癌早期预测方法 Download PDF

Info

Publication number
CN111793692A
CN111793692A CN202010770157.8A CN202010770157A CN111793692A CN 111793692 A CN111793692 A CN 111793692A CN 202010770157 A CN202010770157 A CN 202010770157A CN 111793692 A CN111793692 A CN 111793692A
Authority
CN
China
Prior art keywords
hsa
mirna
mir
prediction
expression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010770157.8A
Other languages
English (en)
Inventor
高跃东
李文兴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kunming Institute of Zoology of CAS
Original Assignee
Kunming Institute of Zoology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kunming Institute of Zoology of CAS filed Critical Kunming Institute of Zoology of CAS
Priority to CN202010770157.8A priority Critical patent/CN111793692A/zh
Publication of CN111793692A publication Critical patent/CN111793692A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B35/00ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/112Disease subtyping, staging or classification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/178Oligonucleotides characterized by their use miRNA, siRNA or ncRNA

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Chemical & Material Sciences (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • Public Health (AREA)
  • Pathology (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biomedical Technology (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • Analytical Chemistry (AREA)
  • Epidemiology (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Library & Information Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Oncology (AREA)
  • Microbiology (AREA)
  • Physiology (AREA)
  • Hospice & Palliative Care (AREA)
  • Primary Health Care (AREA)
  • Artificial Intelligence (AREA)
  • Bioethics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)

Abstract

本发明公开了一种特征miRNA表达谱组合及肺鳞癌早期预测方法,所述特征miRNA表达谱组合的核苷酸序列如SEQ ID NO.1‑30所示。所述方法包括以下步骤:获取肺鳞癌早期患者稳定差异表达的miRNA;选取特征miRNA表达数据,对每个样本进行数据标准化;使用支持向量机对标准化后的数据构建早期预测模型;根据患者特征miRNA的表达水平进行早期预测。本发明的特征miRNA表达谱组合评估肺鳞癌早期风险具有很高的精确度和准确率(ROC曲线下面积AUC=0.994)。只需要获取上述30种miRNA的相对表达量,通过支持向量机模型计算给出肺鳞癌早期患病概率,可作为肺鳞癌早期预测的参考依据。

Description

一种特征miRNA表达谱组合及肺鳞癌早期预测方法
技术领域
本发明属于生物技术和医学技术领域,具体地说,涉及一种特征miRNA表达谱组合及肺鳞癌早期预测方法。
背景技术
肺鳞癌又称肺鳞状细胞癌(lung squamous cell carcinoma),占原发性肺癌的40%-51%。肺鳞癌多见于老年男性,与吸烟有密切关系。肺鳞癌以中央型肺癌多见,并有胸管腔内生长的倾向,肺鳞癌早期常引发支气管狭窄,或阻塞性肺炎。全球疾病负担(GlobalBurden of Disease,GBD)数据显示,2017年全球患有气管、支气管或肺癌的人数超过330万,其中中国患病人数高达127万。2016年全球患有上述癌症的死亡人数为188万,占总死亡人数的3.37%。中国2016年死亡患者数为69万,占总死亡人数的6.62%。统计结果显示,从1990年到2017年全球气管、支气管和肺癌患病率和死亡率持续增长。近十年来中国患病率和死亡率逐年增加且增长率高于全球平均水平。
支持向量机(Support Vector Machine,SVM)是一类按监督学习方式对数据进行二元分类的广义线性分类器,其决策边界是对学习样本求解的最大边距超平面。SVM模型是将实例表示为空间中的点,这样映射就使得单独类别的实例被尽可能宽的明显的间隔分开。然后,将新的实例映射到同一空间,并基于它们落在间隔的哪一侧来预测所属类别。当训练数据是线性可分时,SVM通过硬间隔最大化学习进行分类。当训练数据线性不可分时,SVM通过使用核技巧以及软间隔最大化学习进行分类。SVM对于特征含义相似的中等大小的数据集很强大,也适用于小型数据集。通常情况下,对样本量小于1万的数据集SVM都有很好的预测效果。SVM在疾病诊断、肿瘤分类、肿瘤基因识别等有着广泛的应用。
肿瘤早期诊断一直是医学界的难题。现有的早期诊断方法多是观测某一个或一类标志物的表达水平,难以达到理想的诊断效果。由于这些标志物在肿瘤患者和正常人群中的表达分布有部分重叠,难以界定标志物的临界值将肿瘤患者和正常人群较好地分开。因此,利用多个标志物表达特征组合可能是肿瘤早期诊断的一种有效方法。MicroRNA(miRNA)是一类由内源基因编码的长度约为21-25个核苷酸的非编码单链RNA分子,主要以多种方式调节基因表达。miRNA在人体内表达相对稳定且容易检测。由于单个miRNA在肿瘤和正常人群中表达分布有重叠,难以界定早期诊断的临界值。
因此,有必要提供一种更稳定的多个差异miRNA表达特征组合的诊断模型将有助于肺鳞癌的早期预测。
发明内容
有鉴于此,本发明提供了一种特征miRNA表达谱组合及肺鳞癌早期预测方法,能够准确地进行肺鳞癌I/II期预测。
为了解决上述技术问题,本发明公开了一种用于预测早期肺鳞癌的特征miRNA表达谱组合,包括hsa-let-7a-1,hsa-let-7a-2,hsa-let-7a-3,hsa-let-7b,hsa-let-7i,hsa-mir-101-1,hsa-mir-101-2,hsa-mir-103a-1,hsa-mir-103a-2,hsa-mir-10a,hsa-mir-126,hsa-mir-143,hsa-mir-146b,hsa-mir-181a-2,hsa-mir-182,hsa-mir-183,hsa-mir-22,hsa-mir-23a,hsa-mir-23b,hsa-mir-26a-1,hsa-mir-26a-2,hsa-mir-26b,hsa-mir-27a,hsa-mir-27b,hsa-mir-29a,hsa-mir-30a,hsa-mir-30d,hsa-mir-30e,hsa-mir-374a,hsa-mir-99b,其核苷酸序列如SEQ ID NO.1-30所示。
本发明还公开了一种基于miRNA表达谱组合特征的肺鳞癌早期预测方法,包括以下步骤:
步骤1、获取肺鳞癌早期患者稳定差异表达的miRNA;
步骤2、选取特征miRNA表达数据,对每个样本进行数据标准化;
步骤3、使用支持向量机对标准化后的数据构建早期预测模型;
步骤4、根据患者特征miRNA的表达水平进行早期预测。
可选地,所述步骤1中的获取肺鳞癌早期患者稳定差异表达的miRNA具体为:
步骤1.1、从Genomic Data Commons Data Portal数据库中下载肺鳞癌患者肿瘤组织和癌旁组织转录组数据以及临床数据,获得肺鳞癌患者肿瘤组织基因表达谱readcounts数值,即为测序读段数值,进行对数转换;
步骤1.2、选取在所有样本中miRNA的read counts大于等于10的miRNA,再对所有miRNA的read counts取对数,设样本总数为n,筛选后miRNA总数为m,v为miRNA的readcounts,u为取对数之后的表达值,则有;
uij=log2 vij,i∈(1,n),j∈(1,m) (1)
其中,i为样本编号,j为miRNA编号,uij为第i个样本、第j个miRNA编号取对数之后的表达值,vij为第i个样本、第j个miRNA编号的read counts;
步骤1.3、选取疾病分期为I期和II期的肺鳞癌患者,将这些患者记为肺鳞癌早期患者,肺鳞癌早期患者总数记为n′;
步骤1.4、选取在肿瘤和正常样本中变异系数均小于0.1的miRNA,设μ为所有样本中miRNA的表达均值,σ为标准差,变异系数的计算公式为:
Figure BDA0002617450540000031
其中,j为miRNA编号,cv为变异系数,cvj为第j个样本的变异系数,σj为第j个miRNA编号的标准差,μj为第j个miRNA编号的miRNA的表达均值,设m1为稳定表达的miRNA总数,则有:
Figure BDA0002617450540000032
步骤1.5、选取肿瘤和正常样本中差异表达的miRNA,使用取对数后的表达值计算肿瘤和正常样本miRNA取对数后的倍数变化f,公式为:
Figure BDA0002617450540000041
其中j为miRNA编号,fj为第j个miRNA编号的倍数变化,μ1j为第j个miRNA编号的肿瘤样本的表达均值,μ2j为第j个miRNA编号的正常样本的表达均值;
然后使用独立样本t检验比较肿瘤和正常样本中miRNA的表达差异,独立样本t检验公式为:
Figure BDA0002617450540000042
其中n1为肿瘤样本数,n2为正常样本数,μ1为肿瘤样本miRNA表达均值,μ2为正常样本miRNA表达均值,
Figure BDA0002617450540000043
为肿瘤样本miRNA方差,
Figure BDA0002617450540000044
为正常样本miRNA方差;
对所有t检验得出的p值进行错误发现率(false discovery rate,FDR)校正,定义q为FDR校正后的数值,r为p值在m1个miRNA中排序后的位置,则有:
Figure BDA0002617450540000045
其中,j为miRNA编号,qj代表第j个miRNA编号的FDR校正后的数值,pj代表第j个miRNA编号的t检验得出的p值,rj代表第j个miRNA编号的p值在m1个miRNA中排序后的位置;
最后选取倍数变化f的绝对值大于1且FDR校正后q值小于等于0.05的miRNA,记为特征miRNA,设特征miRNA总数为m2,则有:
m2=m1{|fj|≥1,qj≤0.05},j∈(1,m1) (7)。
可选地,所述miRNA分别为:hsa-let-7a-1、hsa-let-7a-2、hsa-let-7a-3、hsa-let-7b、hsa-let-7i、hsa-mir-101-1、hsa-mir-101-2、hsa-mir-103a-1、hsa-mir-103a-2、hsa-mir-10a、hsa-mir-126、hsa-mir-143、hsa-mir-146b、hsa-mir-181a-2、hsa-mir-182、hsa-mir-183、hsa-mir-22、hsa-mir-23a、hsa-mir-23b、hsa-mir-26a-1、hsa-mir-26a-2、hsa-mir-26b、hsa-mir-27a、hsa-mir-27b、hsa-mir-29a、hsa-mir-30a、hsa-mir-30d、hsa-mir-30e、hsa-mir-374a和hsa-mir-99b,其核苷酸序列分别如SEQ ID NO.1-SEQ ID NO.30所示。
可选地,所述步骤2中的选取特征miRNA表达数据,对每个样本进行数据标准化具体为:
Figure BDA0002617450540000051
其中,i为样本编号,j为特征miRNA编号,μi为第i个样本所有特征miRNA表达均值,σi为第i个样本所有特征miRNA标准差,uij为取对数后的特征miRNA表达值,uij′为标准化后的miRNA数值。
可选地,所述步骤3中的使用支持向量机对标准化后的数据构建早期预测模型具体为:
步骤3.1、先对所有样本进行分组,将全部样本中80%划分为训练集+验证集,余下20%划分为测试集;训练集+验证集用于5折交叉验证,即将训练集+验证集分为相等的5组,按顺序将其中一组作为验证集,其余4组作为训练集;给定参数,训练集用于构建模型,验证集用于检验模型精确度;
步骤3.2、最优参数筛选,SVM中参数gamma控制高斯核的宽度,C是正则化参数,限制每个点的重要性,参数网格设置为:
gamma=[0.001,0.01,0.1,1,10,100] (9)
C=[0.001,0.01,0.1,1,10,100] (10)
在交叉验证中,依次使用每两个参数gamma和C的组合构建模型,然后用验证集检验模型精确度,对每个参数组合,5折交叉验证的每次验证产生1个精确度,共进行5次验证即产生5个精确度;选取5次验证的平均精确度最高的参数组合作为最优参数;
步骤3.3、使用最优参数和训练集+验证集的数据构建模型,最后用测试集对模型进行评估,评估指标包括精确度(accuracy)、准确率(precision)、召回率(recall)、特异性(specificity)、F1分数(F1 score)、马修斯相关系数(Matthews correlationcoefficient,MCC)和受试者工作曲线(receiver operating curve,ROC)下面积(areaunder the curve,AUC),在测试集中,定义实际为肿瘤且预测为肿瘤计数为true positive(TP),实际为正常但预测为肿瘤计数为false positive(FP),实际为肿瘤但预测为正常为false negative(FN),实际为正常且预测为正常为true negative(TN),以上评估指标计算公式为:
Figure BDA0002617450540000061
Figure BDA0002617450540000062
Figure BDA0002617450540000063
Figure BDA0002617450540000064
Figure BDA0002617450540000065
Figure BDA0002617450540000066
Figure BDA0002617450540000071
以上评估指标中精确度、准确率、召回率、特异性、F1分数和AUC返回介于(0,1)之间的值,精确度越高表示模型总体预测效率越高;准确率越高说明犯I类错误越小;召回率越高说明犯II类错误越小;特异性高说明在预测为正例的样本中很少有负例混入;F1分数是一个综合指标,为准确率和召回率的调和平均;MCC是观察到的和预测的二元分类之间的相关系数,返回介于(-1,1)之间的值,其中1表示完美预测,0表示不比随机预测好,-1表示预测和观察之间的完全不一致;AUC越高表明分类器预测的正实例概率越高,因此,以上指标越接近1表明模型整体的预测效果越好;
步骤3.4、若以上评估指标都大于0.9,说明模型具有较好的预测效果;则使用所有数据,用最优参数组合构建最终预测模型。
可选地,所述的步骤4中的根据患者特征miRNA的表达水平进行早期预测具体为:
步骤4.1、对预测样本的特征miRNA表达数据进行标准化,设u为预测样本特征miRNA表达值,μ为预测样本特征miRNA表达均值,σ为预测样本特征miRNA标准差,公式为:
Figure BDA0002617450540000072
其中j为特征miRNA编号,uj′为标准化后的miRNA数值;
步骤4.2、将预测样本标准化后的miRNA数值代入最终预测进行预测;预测结果为1表示患有肺鳞癌,预测结果为0表示正常。
与现有技术相比,本发明可以获得包括以下技术效果:
1)本发明预测速度快:使用本发明构建的预测模型可以对大规模样本进行快速预测,100个样本的预测时间只需要几秒钟。
2)本发明准确度高:本发明构建的预测模型预测精确度和准确率较高,ROC曲线下面积AUC可以达到0.994。
3)本发明平台异质性影响较小:由于不同分析平台测定的miRNA表达值有较大差异,本发明预测使用标准化后的特征miRNA表达值,因此受平台异质性的影响较小。
当然,实施本发明的任一产品并不一定需要同时达到以上所述的所有技术效果。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是本发明数据筛选和模型构建的流程;
图2是本发明支持向量机模型交叉验证参数优化过程;
图3是本发明支持向量机模型测试集评估指标;
图4是本发明支持向量机模型测试集ROC曲线。
具体实施方式
以下将配合实施例来详细说明本发明的实施方式,藉此对本发明如何应用技术手段来解决技术问题并达成技术功效的实现过程能充分理解并据以实施。
本发明公开了一种基于miRNA表达谱组合特征的肺鳞癌早期预测方法,包括以下步骤:
步骤1、获取肺鳞癌早期患者稳定差异表达的miRNA(特征miRNA),详细流程见图1,具体按照以下步骤实施:
步骤1.1、从Genomic Data Commons Data Portal数据库中下载肺鳞癌患者肿瘤组织和癌旁组织转录组数据以及临床数据,获得肺鳞癌患者肿瘤组织基因表达谱测序读段(read counts)数值,进行对数转换;
步骤1.2、选取具有一定表达丰度的miRNA,即在所有样本中miRNA的read counts大于等于10。再对所有miRNA的read counts取对数,设样本总数为n,筛选后miRNA总数为m,v为miRNA的read counts,u为取对数之后的表达值,则有;
uij=log2 vij,i∈(1,n),j(1,m) (1)
其中,i为样本编号,j为miRNA编号,uij为第i个样本、第j个miRNA编号取对数之后的表达值,vij为第i个样本、第j个miRNA编号的read counts。
步骤1.3、选取疾病分期为I期和II期的肺鳞癌患者,将这些患者记为肺鳞癌早期患者,肺鳞癌早期患者总数记为n′;
步骤1.4、选取肿瘤和正常样本中稳定表达的miRNA,即在肿瘤和正常样本中变异系数均小于0.1的miRNA,设μ为所有样本中任一个miRNA的表达均值,σ为标准差,变异系数的计算公式为:
Figure BDA0002617450540000091
其中,j为miRNA编号,cv为变异系数,cvj为第j个样本的变异系数,σj为第j个miRNA编号的标准差,μj为第j个miRNA编号的miRNA的表达均值;
设m1为稳定表达的miRNA总数,则有:
Figure BDA0002617450540000092
步骤1.5、选取肿瘤和正常样本中差异表达的miRNA。使用取对数后的表达值计算肿瘤和正常样本miRNA取对数后的倍数变化f,公式为:
Figure BDA0002617450540000093
其中j为miRNA编号,fj为第j个miRNA编号的倍数变化,μ1j为第j个miRNA编号的肿瘤样本的表达均值,μ2j为第j个miRNA编号的正常样本的表达均值。
然后使用独立样本t检验比较肿瘤和正常样本中miRNA的表达差异,独立样本t检验公式为:
Figure BDA0002617450540000101
其中n1为肿瘤样本数,n2为正常样本数,μ1为肿瘤样本miRNA表达均值,μ2为正常样本miRNA表达均值,
Figure BDA0002617450540000102
为肿瘤样本miRNA方差,
Figure BDA0002617450540000103
为正常样本miRNA方差。
对所有t检验得出的p值进行错误发现率(false discovery rate,FDR)校正,定义q为FDR校正后的数值,r为p值在m1个miRNA中排序后的位置,则有:
Figure BDA0002617450540000104
其中,j为miRNA编号,qj代表第j个miRNA编号的FDR校正后的数值,pj代表第j个miRNA编号的t检验得出的p值,rj代表第j个miRNA编号的p值在m1个miRNA中排序后的位置。
最后选取倍数变化f的绝对值大于1且FDR校正后q值小于等于0.05的miRNA,记为特征miRNA,设特征miRNA总数为m2,则有:
m2=m1{|fj|≥1,qj≤0.05},j∈(1,m1) (7)
经过以上筛选,最终获得30个肺鳞癌特征miRNA,见表1。30个肺鳞癌特征miRNA的核苷酸探针序列见表2。
表1.肺鳞癌特征miRNA
Figure BDA0002617450540000111
表2.肺鳞癌特征miRNA的核苷酸探针序列
Figure BDA0002617450540000112
Figure BDA0002617450540000121
步骤2、选取特征miRNA表达数据,对每个样本进行数据标准化,具体为:
Figure BDA0002617450540000122
其中i为样本编号,j为特征miRNA编号。μi为第i个样本所有特征miRNA表达均值,σi为第i个样本所有特征miRNA标准差,uij为取对数后的特征miRNA表达值,uij′为标准化后的miRNA数值。
步骤3、使用支持向量机对标准化后的数据构建早期预测模型,具体为:
步骤3.1、先对所有样本进行分组。将全部样本中80%划分为训练集+验证集,余下20%划分为测试集。训练集+验证集用于5折交叉验证,即将训练集+验证集分为相等的5组,按顺序将其中一组作为验证集,其余4组作为训练集。给定参数,训练集用于构建模型,验证集用于检验模型精确度,详见图1。
步骤3.2、最优参数筛选。SVM中参数gamma控制高斯核的宽度,C是正则化参数,限制每个点的重要性。参数网格设置为:
gamma=[0.001,0.01,0.1,1,10,100] (9)
C=[0.001,0.01,0.1,1,10,100] (10)
在交叉验证中,依次使用每两个参数gamma和C的组合构建模型,然后用验证集检验模型精确度。对每个参数组合,5折交叉验证的每次验证产生1个精确度,共进行5次验证即产生5个精确度。选取5次验证的平均精确度最高的参数组合作为最优参数。图2所示为交叉验证参数优化过程,当参数gamma=1,参数C=1时模型交叉验证精确度最高:0.988。因此该模型的最优参数为:gamma=1,C=1。
步骤3.3、使用最优参数和训练集+验证集的数据构建模型,最后用测试集对模型进行评估。评估指标包括精确度(accuracy)、准确率(precision)、召回率(recall)、特异性(specificity)、F1分数(F1 score)、马修斯相关系数(Matthews correlationcoefficient,MCC)和受试者工作曲线(receiver operating curve,ROC)下面积(areaunder the curve,AUC)。在测试集中,定义实际为肿瘤且预测为肿瘤计数为true positive(TP),实际为正常但预测为肿瘤计数为false positive(FP),实际为肿瘤但预测为正常为false negative(FN),实际为正常且预测为正常为true negative(TN);以上评估指标计算公式为:
Figure BDA0002617450540000141
Figure BDA0002617450540000142
Figure BDA0002617450540000143
Figure BDA0002617450540000144
Figure BDA0002617450540000145
Figure BDA0002617450540000146
Figure BDA0002617450540000147
以上评估指标中精确度、准确率、召回率、特异性、F1分数和AUC返回介于(0,1)之间的值;精确度越高表示模型总体预测效率越高;准确率越高说明犯I类错误越小;召回率越高说明犯II类错误越小;特异性高说明在预测为正例的样本中很少有负例混入;F1分数是一个综合指标,为准确率和召回率的调和平均;MCC是观察到的和预测的二元分类之间的相关系数,返回介于(-1,1)之间的值,其中1表示完美预测,0表示不比随机预测好,-1表示预测和观察之间的完全不一致;AUC越高表明分类器预测的正实例概率越高;因此,以上指标越接近1表明模型整体的预测效果越好。
步骤3.4、若以上评估指标都大于0.9,说明模型具有较好的预测效果。则使用所有数据,用最优参数组合构建最终预测模型。
图3所示为以上评估指标中的精确度、准确率、召回率、特异性、F1分数和MCC,这6个指标均大于0.94;图4所示为ROC曲线和AUC,测试集中AUC为0.994。说明以上评估指标说明该模型有很好的预测效果。因此使用所有数据,用最优参数组合构建最终预测模型。
步骤4、根据患者特征miRNA的表达水平进行早期预测,具体为:
步骤4.1、对预测样本的特征miRNA表达数据进行标准化,设u为预测样本特征miRNA取对数之后的表达值,μ为预测样本特征miRNA表达均值,σ为预测样本特征miRNA的标准差,公式为:
Figure BDA0002617450540000151
其中j为特征miRNA编号,uj′为第j个特征miRNA编号的标准化后的miRNA表达值。
本发明随机选取10例样本进行预测,并在构建最终预测模型时将这10例样本剔除。所选取的10例样本编号和标准化后特征miRNA数值见表3。
表3. 10例样本编号和特征miRNA标准化后的数值
Figure BDA0002617450540000152
Figure BDA0002617450540000161
步骤4.2、将预测样本标准化后的miRNA数值代入最终预测进行预测。预测结果为1表示患有肺鳞癌,预测结果为0表示正常。
10例样本编号,对应的TCGA编号,实际状态和预测结果见表4。10例样本预测结果与实际状态完全符合,说明本发明可以对肺鳞癌进行精确的早期预测。
表4. 10例样本编号,对应的TCGA编号,实际和预测的状态
Figure BDA0002617450540000162
综上所述,本发明的特征miRNA表达谱组合具有很高的预测准确性,能够有效地进行肺鳞癌的早期诊断。此外,本发明没有平台依赖性,能够对多种来源的数据进行预测。
上述说明示出并描述了发明的若干优选实施例,但如前所述,应当理解发明并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文所述发明构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离发明的精神和范围,则都应在发明所附权利要求的保护范围内。
SEQUENCE LISTING
<110> 中国科学院昆明动物研究所
<120> 一种特征miRNA表达谱组合及肺鳞癌早期预测方法
<130> 2019
<160> 30
<170> PatentIn version 3.3
<210> 1
<211> 16
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 1
tgggatgagg tagtag 16
<210> 2
<211> 15
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 2
aggttgaggt agtag 15
<210> 3
<211> 17
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 3
gggtgaggta gtaggtt 17
<210> 4
<211> 16
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 4
gggaaggcag taggtt 16
<210> 5
<211> 17
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 5
agcaaggcag tagcttg 17
<210> 6
<211> 15
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 6
tgccctggct cagtt 15
<210> 7
<211> 16
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 7
actgtccttt ttcggt 16
<210> 8
<211> 17
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 8
tactgccctc ggcttct 17
<210> 9
<211> 16
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 9
caaggcagca ctgtaa 16
<210> 10
<211> 18
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 10
tattccccta gatacgaa 18
<210> 11
<211> 18
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 11
cgcattatta ctcacggt 18
<210> 12
<211> 15
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 12
gagctacagt gcttc 15
<210> 13
<211> 16
<212> DNA
<213> 人工序列(artificial sequence)
<400> 13
ccagaactga gtccac 16
<210> 14
<211> 17
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 14
ggtacagtca acggtca 17
<210> 15
<211> 20
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 15
tagttggcaa gtctagaacc 20
<210> 16
<211> 15
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 16
ttatggccct tcggt 15
<210> 17
<211> 19
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 17
acagttcttc aactggcag 19
<210> 18
<211> 18
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 18
ggaaatccct ggcaatgt 18
<210> 19
<211> 17
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 19
ggtaatccct ggcaatg 17
<210> 20
<211> 21
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 20
cgtgcaagta accaagaata g 21
<210> 21
<211> 22
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 21
gaaacaagta atcaagaata gg 22
<210> 22
<211> 20
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 22
gagccaagta atggagaaca 20
<210> 23
<211> 17
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 23
gcggaactta gccactg 17
<210> 24
<211> 18
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 24
gcagaactta gccactgt 18
<210> 25
<211> 20
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 25
taaccgattt cagatggtgc 20
<210> 26
<211> 17
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 26
gctgcaaaca tccgact 17
<210> 27
<211> 19
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 27
gcagcaaaca tctgactga 19
<210> 28
<211> 18
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 28
gctgtaaaca tccgactg 18
<210> 29
<211> 22
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 29
aattacaata caatctgata ag 22
<210> 30
<211> 13
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 30
cggacccaca gac 13

Claims (7)

1.一种用于预测早期肺鳞癌的特征miRNA表达谱组合,其特征在于,包括hsa-let-7a-1,hsa-let-7a-2,hsa-let-7a-3,hsa-let-7b,hsa-let-7i,hsa-mir-101-1,hsa-mir-101-2,hsa-mir-103a-1,hsa-mir-103a-2,hsa-mir-10a,hsa-mir-126,hsa-mir-143,hsa-mir-146b,hsa-mir-181a-2,hsa-mir-182,hsa-mir-183,hsa-mir-22,hsa-mir-23a,hsa-mir-23b,hsa-mir-26a-1,hsa-mir-26a-2,hsa-mir-26b,hsa-mir-27a,hsa-mir-27b,hsa-mir-29a,hsa-mir-30a,hsa-mir-30d,hsa-mir-30e,hsa-mir-374a,hsa-mir-99b,其核苷酸序列如SEQ ID NO.1-30所示。
2.一种基于miRNA表达谱组合特征的肺鳞癌早期预测方法,其特征在于,包括以下步骤:
步骤1、获取肺鳞癌早期患者稳定差异表达的miRNA;
步骤2、选取特征miRNA表达数据,对每个样本进行数据标准化;
步骤3、使用支持向量机对标准化后的数据构建早期预测模型;
步骤4、根据患者特征miRNA的表达水平进行早期预测;
该方法用于非疾病的诊断和治疗目的。
3.根据权利要求2所述的预测方法,其特征在于,所述步骤1中的获取肺鳞癌早期患者稳定差异表达的miRNA具体为:
步骤1.1、从Genomic Data Commons Data Portal数据库中下载肺鳞癌患者肿瘤组织和癌旁组织转录组数据以及临床数据,获得肺鳞癌患者肿瘤组织基因表达谱read counts数值,即为测序读段数值,进行对数转换;
步骤1.2、选取在所有样本中miRNA的read counts大于等于10的miRNA,再对所有miRNA的read counts取对数,设样本总数为n,筛选后miRNA总数为m,v为miRNA的read counts,u为取对数之后的表达值,则有;
uij=log2vij,i∈(1,n),j∈(1,m) (1)
其中,i为样本编号,j为miRNA编号,uij为第i个样本、第j个miRNA编号取对数之后的表达值,vij为第i个样本、第j个miRNA编号的read counts数值;
步骤1.3、选取疾病分期为I期和II期的肺鳞癌患者,将这些患者记为肺鳞癌早期患者,肺鳞癌早期患者总数记为n′;
步骤1.4、选取在肿瘤和正常样本中变异系数均小于0.1的miRNA,设μ为所有样本中miRNA的表达均值,σ为标准差,变异系数的计算公式为:
Figure FDA0002617450530000021
其中,j为miRNA编号,cv为变异系数,cvj为第j个样本的变异系数,σj为第j个miRNA编号的标准差,μj为第j个miRNA编号的miRNA的表达均值,设m1为稳定表达的miRNA总数,则有:
m1=m{cvj≥10},j∈(1,m) (3)
步骤1.5、选取肿瘤和正常样本中差异表达的miRNA,使用取对数后的表达值计算肿瘤和正常样本miRNA取对数后的倍数变化f,公式为:
fj=μ1j2j,j∈(1,m1) (4)
其中j为miRNA编号,fj为第j个miRNA编号的倍数变化,μ1j为第j个miRNA编号的肿瘤样本的表达均值,μ2j为第j个miRNA编号的正常样本的表达均值;
然后使用独立样本t检验比较肿瘤和正常样本中miRNA的表达差异,独立样本t检验公式为:
Figure FDA0002617450530000022
其中n1为肿瘤样本数,n2为正常样本数,μ1为肿瘤样本miRNA表达均值,μ2为正常样本miRNA表达均值,
Figure FDA0002617450530000031
为肿瘤样本miRNA方差,
Figure FDA0002617450530000032
为正常样本miRNA方差;
对所有t检验得出的p值进行错误发现率(false discovery rate,FDR)校正,定义q为FDR校正后的数值,r为p值在m1个miRNA中排序后的位置,则有:
Figure FDA0002617450530000033
其中,j为miRNA编号,qj代表第j个miRNA编号的FDR校正后的数值,pj代表第j个miRNA编号的t检验得出的p值,rj代表第j个miRNA编号的p值在m1个miRNA中排序后的位置;
最后选取倍数变化f的绝对值大于1且FDR校正后q值小于等于0.05的miRNA,记为特征miRNA,设特征miRNA总数为m2,则有:
m2=m1{|fj|≥1,qj≤0.05},j∈(1,m1) (7)。
4.根据权利要求2所述的预测方法,其特征在于,所述miRNA分别为:hsa-let-7a-1、hsa-let-7a-2、hsa-let-7a-3、hsa-let-7b、hsa-let-7i、hsa-mir-101-1、hsa-mir-101-2、hsa-mir-103a-1、hsa-mir-103a-2、hsa-mir-10a、hsa-mir-126、hsa-mir-143、hsa-mir-146b、hsa-mir-181a-2、hsa-mir-182、hsa-mir-183、hsa-mir-22、hsa-mir-23a、hsa-mir-23b、hsa-mir-26a-1、hsa-mir-26a-2、hsa-mir-26b、hsa-mir-27a、hsa-mir-27b、hsa-mir-29a、hsa-mir-30a、hsa-mir-30d、hsa-mir-30e、hsa-mir-374a和hsa-mir-99b,其核苷酸序列分别如SEQ ID NO.1-SEQ ID NO.30所示。
5.根据权利要求2所述的预测方法,其特征在于,所述步骤2中的选取特征miRNA表达数据,对每个样本进行数据标准化具体为:
Figure FDA0002617450530000041
其中,i为样本编号,j为特征miRNA编号,μi为第i个样本所有特征miRNA表达均值,σi为第i个样本所有特征miRNA标准差,uij为取对数后的特征miRNA表达值,uij′为标准化后的miRNA数值。
6.根据权利要求2所述的预测方法,其特征在于,所述步骤3中的使用支持向量机对标准化后的数据构建早期预测模型具体为:
步骤3.1、先对所有样本进行分组,将全部样本中80%划分为训练集+验证集,余下20%划分为测试集;训练集+验证集用于5折交叉验证,即将训练集+验证集分为相等的5组,按顺序将其中一组作为验证集,其余4组作为训练集;给定参数,训练集用于构建模型,验证集用于检验模型精确度;
步骤3.2、最优参数筛选,SVM中参数gamma控制高斯核的宽度,C是正则化参数,限制每个点的重要性,参数网格设置为:
gamma=[0.001,0.01,0.1,1,10,100] (9)
C=[0.001,0.01,0.1,1,10,100] (10)
在交叉验证中,依次使用每两个参数gamma和C的组合构建模型,然后用验证集检验模型精确度,对每个参数组合,5折交叉验证的每次验证产生1个精确度,共进行5次验证即产生5个精确度;选取5次验证的平均精确度最高的参数组合作为最优参数;
步骤3.3、使用最优参数和训练集+验证集的数据构建模型,最后用测试集对模型进行评估,评估指标包括精确度(accuracy)、准确率(precision)、召回率(recall)、特异性(specificity)、F1分数(F1 score)、马修斯相关系数(Matthews correlationcoefficient,MCC)和受试者工作曲线(receiver operating curve,ROC)下面积(areaunder the curve,AUC),在测试集中,定义实际为肿瘤且预测为肿瘤计数为true positive(TP),实际为正常但预测为肿瘤计数为false positive(FP),实际为肿瘤但预测为正常为false negative(FN),实际为正常且预测为正常为true negative(TN),以上评估指标计算公式为:
Figure FDA0002617450530000051
Figure FDA0002617450530000052
Figure FDA0002617450530000053
Figure FDA0002617450530000054
Figure FDA0002617450530000055
Figure FDA0002617450530000056
Figure FDA0002617450530000057
以上评估指标中精确度、准确率、召回率、特异性、F1分数和AUC返回介于(0,1)之间的值,精确度越高表示模型总体预测效率越高;准确率越高说明犯I类错误越小;召回率越高说明犯II类错误越小;特异性高说明在预测为正例的样本中很少有负例混入;F1分数是一个综合指标,为准确率和召回率的调和平均;MCC是观察到的和预测的二元分类之间的相关系数,返回介于(-1,1)之间的值,其中1表示完美预测,0表示不比随机预测好,-1表示预测和观察之间的完全不一致;AUC越高表明分类器预测的正实例概率越高,因此,以上指标越接近1表明模型整体的预测效果越好;
步骤3.4、若以上评估指标都大于0.9,说明模型具有较好的预测效果;则使用所有数据,用最优参数组合构建最终预测模型。
7.根据权利要求2所述的预测方法,其特征在于,所述的步骤4中的根据患者特征miRNA的表达水平进行早期预测具体为:
步骤4.1、对预测样本的特征miRNA表达数据进行标准化,设u为预测样本特征miRNA表达值,μ为预测样本特征miRNA表达均值,σ为预测样本特征miRNA标准差,公式为:
Figure FDA0002617450530000061
其中j为特征miRNA编号,uj′为标准化后的miRNA数值;
步骤4.2、将预测样本标准化后的miRNA数值代入最终预测进行预测;预测结果为1表示患有肺鳞癌,预测结果为0表示正常。
CN202010770157.8A 2020-08-04 2020-08-04 一种特征miRNA表达谱组合及肺鳞癌早期预测方法 Pending CN111793692A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010770157.8A CN111793692A (zh) 2020-08-04 2020-08-04 一种特征miRNA表达谱组合及肺鳞癌早期预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010770157.8A CN111793692A (zh) 2020-08-04 2020-08-04 一种特征miRNA表达谱组合及肺鳞癌早期预测方法

Publications (1)

Publication Number Publication Date
CN111793692A true CN111793692A (zh) 2020-10-20

Family

ID=72828389

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010770157.8A Pending CN111793692A (zh) 2020-08-04 2020-08-04 一种特征miRNA表达谱组合及肺鳞癌早期预测方法

Country Status (1)

Country Link
CN (1) CN111793692A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022121960A1 (zh) * 2020-12-08 2022-06-16 信标生医股份有限公司 泛癌症早筛预测方法
WO2024174260A1 (zh) * 2023-02-24 2024-08-29 信标生医股份有限公司 基于液态活检的癌症早期筛检方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120108462A1 (en) * 2009-06-05 2012-05-03 Febit Holding Gmbh Mirna fingerprint in the diagnosis of lung cancer
US20150080243A1 (en) * 2011-09-01 2015-03-19 Allegro Diagnostics Corp. Methods and compositions for detecting cancer based on mirna expression profiles
CN108363907A (zh) * 2018-05-09 2018-08-03 中国科学院昆明动物研究所 一种基于多基因表达特征谱的肺腺癌个性化预后评估方法
CN108611416A (zh) * 2018-05-09 2018-10-02 中国科学院昆明动物研究所 一种基于多基因表达特征谱的宫颈癌个性化预后评估方法
US20180327853A1 (en) * 2015-11-05 2018-11-15 Arphion Diagnostics Process for the indentification of patients at risk for oscc

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120108462A1 (en) * 2009-06-05 2012-05-03 Febit Holding Gmbh Mirna fingerprint in the diagnosis of lung cancer
US20150080243A1 (en) * 2011-09-01 2015-03-19 Allegro Diagnostics Corp. Methods and compositions for detecting cancer based on mirna expression profiles
US20180327853A1 (en) * 2015-11-05 2018-11-15 Arphion Diagnostics Process for the indentification of patients at risk for oscc
CN108363907A (zh) * 2018-05-09 2018-08-03 中国科学院昆明动物研究所 一种基于多基因表达特征谱的肺腺癌个性化预后评估方法
CN108611416A (zh) * 2018-05-09 2018-10-02 中国科学院昆明动物研究所 一种基于多基因表达特征谱的宫颈癌个性化预后评估方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022121960A1 (zh) * 2020-12-08 2022-06-16 信标生医股份有限公司 泛癌症早筛预测方法
WO2024174260A1 (zh) * 2023-02-24 2024-08-29 信标生医股份有限公司 基于液态活检的癌症早期筛检方法

Similar Documents

Publication Publication Date Title
US10000810B2 (en) MiRNA fingerprint in the diagnosis of multiple sclerosis
CN111748633A (zh) 一种特征miRNA表达谱组合及头颈鳞状细胞癌早期预测方法
CN111748632A (zh) 一种特征lincRNA表达谱组合及肝癌早期预测方法
CN109801680B (zh) 基于tcga数据库的肿瘤转移复发预测方法及系统
CN109830264B (zh) 肿瘤患者基于甲基化位点进行分类的方法
CN110305964A (zh) 一种前列腺癌患者预后复发风险预测标志工具及其风险评估模型的建立
CN115295074B (zh) 基因标志物在恶性肺结节筛查中的应用、筛查模型的构建方法和检测装置
CN111793692A (zh) 一种特征miRNA表达谱组合及肺鳞癌早期预测方法
CN113517073B (zh) 肺癌手术后生存率预测模型构建方法和预测模型系统
CN113862351B (zh) 体液样本中鉴定胞外rna生物标志物的试剂盒及方法
CN111733251A (zh) 一种特征miRNA表达谱组合及肾透明细胞癌早期预测方法
CN111748634A (zh) 一种特征lincRNA表达谱组合及结肠癌的早期预测方法
CN111944902A (zh) 一种基于lincRNA表达谱组合特征的肾乳头状细胞癌早期预测方法
CN111944900A (zh) 一种特征lincRNA表达谱组合及子宫内膜癌早期预测方法
CN111763738A (zh) 一种特征mRNA表达谱组合及肝癌早期预测方法
CN111850124A (zh) 一种特征lincRNA表达谱组合及肺鳞癌早期预测方法
CN111733252A (zh) 一种特征miRNA表达谱组合及胃癌早期预测方法
CN111808965A (zh) 一种特征lincRNA表达谱组合及肾透明细胞癌早期预测方法
CN111944899A (zh) 一种特征miRNA表达谱组合及肾乳头状细胞癌早期预测方法
CN111748631A (zh) 一种特征miRNA表达谱组合及肝癌早期预测方法
CN112760375A (zh) 一种特征miRNA表达谱组合及子宫内膜癌早期预测方法
CN111718996A (zh) 一种特征lincRNA表达谱组合及胃癌早期预测方法
CN111793691A (zh) 一种特征mRNA表达谱组合及肺鳞癌早期预测方法
CN111718997A (zh) 一种特征mRNA表达谱组合及胃癌早期预测方法
CN111172285A (zh) 用于胰腺癌早期诊断和/或预后监测的miRNA组及其应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20201020