CN111793692A - 一种特征miRNA表达谱组合及肺鳞癌早期预测方法 - Google Patents
一种特征miRNA表达谱组合及肺鳞癌早期预测方法 Download PDFInfo
- Publication number
- CN111793692A CN111793692A CN202010770157.8A CN202010770157A CN111793692A CN 111793692 A CN111793692 A CN 111793692A CN 202010770157 A CN202010770157 A CN 202010770157A CN 111793692 A CN111793692 A CN 111793692A
- Authority
- CN
- China
- Prior art keywords
- hsa
- mirna
- mir
- prediction
- expression
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000014509 gene expression Effects 0.000 title claims abstract description 85
- 108091070501 miRNA Proteins 0.000 title claims abstract description 71
- 239000002679 microRNA Substances 0.000 title claims abstract description 71
- 238000000034 method Methods 0.000 title claims abstract description 26
- 210000004072 lung Anatomy 0.000 title claims abstract description 18
- 206010041823 squamous cell carcinoma Diseases 0.000 title claims abstract description 18
- 201000005243 lung squamous cell carcinoma Diseases 0.000 claims abstract description 32
- 238000012706 support-vector machine Methods 0.000 claims abstract description 21
- 206010028980 Neoplasm Diseases 0.000 claims description 55
- 238000012795 verification Methods 0.000 claims description 21
- 238000012549 training Methods 0.000 claims description 20
- 238000011156 evaluation Methods 0.000 claims description 14
- 230000000694 effects Effects 0.000 claims description 12
- 238000012360 testing method Methods 0.000 claims description 12
- 238000010200 validation analysis Methods 0.000 claims description 11
- 238000002790 cross-validation Methods 0.000 claims description 10
- 206010058467 Lung neoplasm malignant Diseases 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 6
- 201000010099 disease Diseases 0.000 claims description 6
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 6
- 238000010832 independent-sample T-test Methods 0.000 claims description 6
- 238000012353 t test Methods 0.000 claims description 6
- 238000012216 screening Methods 0.000 claims description 5
- 108091070521 Homo sapiens let-7a-1 stem-loop Proteins 0.000 claims description 4
- 108091070522 Homo sapiens let-7a-2 stem-loop Proteins 0.000 claims description 4
- 108091070513 Homo sapiens let-7a-3 stem-loop Proteins 0.000 claims description 4
- 108091070514 Homo sapiens let-7b stem-loop Proteins 0.000 claims description 4
- 108091069047 Homo sapiens let-7i stem-loop Proteins 0.000 claims description 4
- 108091068840 Homo sapiens miR-101-1 stem-loop Proteins 0.000 claims description 4
- 108091065458 Homo sapiens miR-101-2 stem-loop Proteins 0.000 claims description 4
- 108091068855 Homo sapiens miR-103a-1 stem-loop Proteins 0.000 claims description 4
- 108091068838 Homo sapiens miR-103a-2 stem-loop Proteins 0.000 claims description 4
- 108091067628 Homo sapiens miR-10a stem-loop Proteins 0.000 claims description 4
- 108091069085 Homo sapiens miR-126 stem-loop Proteins 0.000 claims description 4
- 108091068992 Homo sapiens miR-143 stem-loop Proteins 0.000 claims description 4
- 108091092238 Homo sapiens miR-146b stem-loop Proteins 0.000 claims description 4
- 108091067618 Homo sapiens miR-181a-2 stem-loop Proteins 0.000 claims description 4
- 108091067627 Homo sapiens miR-182 stem-loop Proteins 0.000 claims description 4
- 108091067605 Homo sapiens miR-183 stem-loop Proteins 0.000 claims description 4
- 108091070494 Homo sapiens miR-22 stem-loop Proteins 0.000 claims description 4
- 108091070492 Homo sapiens miR-23a stem-loop Proteins 0.000 claims description 4
- 108091069063 Homo sapiens miR-23b stem-loop Proteins 0.000 claims description 4
- 108091070372 Homo sapiens miR-26a-1 stem-loop Proteins 0.000 claims description 4
- 108091065428 Homo sapiens miR-26a-2 stem-loop Proteins 0.000 claims description 4
- 108091070399 Homo sapiens miR-26b stem-loop Proteins 0.000 claims description 4
- 108091069018 Homo sapiens miR-27b stem-loop Proteins 0.000 claims description 4
- 108091070398 Homo sapiens miR-29a stem-loop Proteins 0.000 claims description 4
- 108091067650 Homo sapiens miR-30d stem-loop Proteins 0.000 claims description 4
- 108091065436 Homo sapiens miR-30e stem-loop Proteins 0.000 claims description 4
- 108091067566 Homo sapiens miR-374a stem-loop Proteins 0.000 claims description 4
- 108091065457 Homo sapiens miR-99b stem-loop Proteins 0.000 claims description 4
- 108091007776 MIR103A1 Proteins 0.000 claims description 4
- 108091008051 MIR27A Proteins 0.000 claims description 4
- 108091007424 MIR27B Proteins 0.000 claims description 4
- 108091007771 MIRLET7A1 Proteins 0.000 claims description 4
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 4
- 201000009030 Carcinoma Diseases 0.000 claims description 3
- 238000000692 Student's t-test Methods 0.000 claims description 3
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 201000005296 lung carcinoma Diseases 0.000 claims description 3
- 238000012163 sequencing technique Methods 0.000 claims description 3
- 108091070365 Homo sapiens miR-30a stem-loop Proteins 0.000 claims description 2
- 230000001225 therapeutic effect Effects 0.000 claims 1
- 239000002773 nucleotide Substances 0.000 abstract description 4
- 125000003729 nucleotide group Chemical group 0.000 abstract description 4
- 108700011259 MicroRNAs Proteins 0.000 description 109
- 239000000523 sample Substances 0.000 description 52
- 108020004414 DNA Proteins 0.000 description 30
- 238000013399 early diagnosis Methods 0.000 description 5
- 201000005202 lung cancer Diseases 0.000 description 5
- 208000020816 lung neoplasm Diseases 0.000 description 5
- 230000034994 death Effects 0.000 description 4
- 231100000517 death Toxicity 0.000 description 4
- 238000003745 diagnosis Methods 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 108090000623 proteins and genes Proteins 0.000 description 2
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- 206010006482 Bronchospasm Diseases 0.000 description 1
- 206010025122 Lung squamous cell carcinoma stage I Diseases 0.000 description 1
- 206010025123 Lung squamous cell carcinoma stage II Diseases 0.000 description 1
- 206010035664 Pneumonia Diseases 0.000 description 1
- 210000000621 bronchi Anatomy 0.000 description 1
- 230000007885 bronchoconstriction Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000000414 obstructive effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000000391 smoking effect Effects 0.000 description 1
- 210000000115 thoracic cavity Anatomy 0.000 description 1
- 210000003437 trachea Anatomy 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
- G16B25/10—Gene or protein expression profiling; Expression-ratio estimation or normalisation
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B35/00—ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B5/00—ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/112—Disease subtyping, staging or classification
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/158—Expression markers
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/178—Oligonucleotides characterized by their use miRNA, siRNA or ncRNA
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Chemical & Material Sciences (AREA)
- Biophysics (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Molecular Biology (AREA)
- Genetics & Genomics (AREA)
- Public Health (AREA)
- Pathology (AREA)
- Organic Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Biomedical Technology (AREA)
- Biochemistry (AREA)
- Immunology (AREA)
- Analytical Chemistry (AREA)
- Epidemiology (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Library & Information Science (AREA)
- General Engineering & Computer Science (AREA)
- Oncology (AREA)
- Microbiology (AREA)
- Physiology (AREA)
- Hospice & Palliative Care (AREA)
- Primary Health Care (AREA)
- Artificial Intelligence (AREA)
- Bioethics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
Abstract
本发明公开了一种特征miRNA表达谱组合及肺鳞癌早期预测方法,所述特征miRNA表达谱组合的核苷酸序列如SEQ ID NO.1‑30所示。所述方法包括以下步骤:获取肺鳞癌早期患者稳定差异表达的miRNA;选取特征miRNA表达数据,对每个样本进行数据标准化;使用支持向量机对标准化后的数据构建早期预测模型;根据患者特征miRNA的表达水平进行早期预测。本发明的特征miRNA表达谱组合评估肺鳞癌早期风险具有很高的精确度和准确率(ROC曲线下面积AUC=0.994)。只需要获取上述30种miRNA的相对表达量,通过支持向量机模型计算给出肺鳞癌早期患病概率,可作为肺鳞癌早期预测的参考依据。
Description
技术领域
本发明属于生物技术和医学技术领域,具体地说,涉及一种特征miRNA表达谱组合及肺鳞癌早期预测方法。
背景技术
肺鳞癌又称肺鳞状细胞癌(lung squamous cell carcinoma),占原发性肺癌的40%-51%。肺鳞癌多见于老年男性,与吸烟有密切关系。肺鳞癌以中央型肺癌多见,并有胸管腔内生长的倾向,肺鳞癌早期常引发支气管狭窄,或阻塞性肺炎。全球疾病负担(GlobalBurden of Disease,GBD)数据显示,2017年全球患有气管、支气管或肺癌的人数超过330万,其中中国患病人数高达127万。2016年全球患有上述癌症的死亡人数为188万,占总死亡人数的3.37%。中国2016年死亡患者数为69万,占总死亡人数的6.62%。统计结果显示,从1990年到2017年全球气管、支气管和肺癌患病率和死亡率持续增长。近十年来中国患病率和死亡率逐年增加且增长率高于全球平均水平。
支持向量机(Support Vector Machine,SVM)是一类按监督学习方式对数据进行二元分类的广义线性分类器,其决策边界是对学习样本求解的最大边距超平面。SVM模型是将实例表示为空间中的点,这样映射就使得单独类别的实例被尽可能宽的明显的间隔分开。然后,将新的实例映射到同一空间,并基于它们落在间隔的哪一侧来预测所属类别。当训练数据是线性可分时,SVM通过硬间隔最大化学习进行分类。当训练数据线性不可分时,SVM通过使用核技巧以及软间隔最大化学习进行分类。SVM对于特征含义相似的中等大小的数据集很强大,也适用于小型数据集。通常情况下,对样本量小于1万的数据集SVM都有很好的预测效果。SVM在疾病诊断、肿瘤分类、肿瘤基因识别等有着广泛的应用。
肿瘤早期诊断一直是医学界的难题。现有的早期诊断方法多是观测某一个或一类标志物的表达水平,难以达到理想的诊断效果。由于这些标志物在肿瘤患者和正常人群中的表达分布有部分重叠,难以界定标志物的临界值将肿瘤患者和正常人群较好地分开。因此,利用多个标志物表达特征组合可能是肿瘤早期诊断的一种有效方法。MicroRNA(miRNA)是一类由内源基因编码的长度约为21-25个核苷酸的非编码单链RNA分子,主要以多种方式调节基因表达。miRNA在人体内表达相对稳定且容易检测。由于单个miRNA在肿瘤和正常人群中表达分布有重叠,难以界定早期诊断的临界值。
因此,有必要提供一种更稳定的多个差异miRNA表达特征组合的诊断模型将有助于肺鳞癌的早期预测。
发明内容
有鉴于此,本发明提供了一种特征miRNA表达谱组合及肺鳞癌早期预测方法,能够准确地进行肺鳞癌I/II期预测。
为了解决上述技术问题,本发明公开了一种用于预测早期肺鳞癌的特征miRNA表达谱组合,包括hsa-let-7a-1,hsa-let-7a-2,hsa-let-7a-3,hsa-let-7b,hsa-let-7i,hsa-mir-101-1,hsa-mir-101-2,hsa-mir-103a-1,hsa-mir-103a-2,hsa-mir-10a,hsa-mir-126,hsa-mir-143,hsa-mir-146b,hsa-mir-181a-2,hsa-mir-182,hsa-mir-183,hsa-mir-22,hsa-mir-23a,hsa-mir-23b,hsa-mir-26a-1,hsa-mir-26a-2,hsa-mir-26b,hsa-mir-27a,hsa-mir-27b,hsa-mir-29a,hsa-mir-30a,hsa-mir-30d,hsa-mir-30e,hsa-mir-374a,hsa-mir-99b,其核苷酸序列如SEQ ID NO.1-30所示。
本发明还公开了一种基于miRNA表达谱组合特征的肺鳞癌早期预测方法,包括以下步骤:
步骤1、获取肺鳞癌早期患者稳定差异表达的miRNA;
步骤2、选取特征miRNA表达数据,对每个样本进行数据标准化;
步骤3、使用支持向量机对标准化后的数据构建早期预测模型;
步骤4、根据患者特征miRNA的表达水平进行早期预测。
可选地,所述步骤1中的获取肺鳞癌早期患者稳定差异表达的miRNA具体为:
步骤1.1、从Genomic Data Commons Data Portal数据库中下载肺鳞癌患者肿瘤组织和癌旁组织转录组数据以及临床数据,获得肺鳞癌患者肿瘤组织基因表达谱readcounts数值,即为测序读段数值,进行对数转换;
步骤1.2、选取在所有样本中miRNA的read counts大于等于10的miRNA,再对所有miRNA的read counts取对数,设样本总数为n,筛选后miRNA总数为m,v为miRNA的readcounts,u为取对数之后的表达值,则有;
uij=log2 vij,i∈(1,n),j∈(1,m) (1)
其中,i为样本编号,j为miRNA编号,uij为第i个样本、第j个miRNA编号取对数之后的表达值,vij为第i个样本、第j个miRNA编号的read counts;
步骤1.3、选取疾病分期为I期和II期的肺鳞癌患者,将这些患者记为肺鳞癌早期患者,肺鳞癌早期患者总数记为n′;
步骤1.4、选取在肿瘤和正常样本中变异系数均小于0.1的miRNA,设μ为所有样本中miRNA的表达均值,σ为标准差,变异系数的计算公式为:
其中,j为miRNA编号,cv为变异系数,cvj为第j个样本的变异系数,σj为第j个miRNA编号的标准差,μj为第j个miRNA编号的miRNA的表达均值,设m1为稳定表达的miRNA总数,则有:
步骤1.5、选取肿瘤和正常样本中差异表达的miRNA,使用取对数后的表达值计算肿瘤和正常样本miRNA取对数后的倍数变化f,公式为:
其中j为miRNA编号,fj为第j个miRNA编号的倍数变化,μ1j为第j个miRNA编号的肿瘤样本的表达均值,μ2j为第j个miRNA编号的正常样本的表达均值;
然后使用独立样本t检验比较肿瘤和正常样本中miRNA的表达差异,独立样本t检验公式为:
对所有t检验得出的p值进行错误发现率(false discovery rate,FDR)校正,定义q为FDR校正后的数值,r为p值在m1个miRNA中排序后的位置,则有:
其中,j为miRNA编号,qj代表第j个miRNA编号的FDR校正后的数值,pj代表第j个miRNA编号的t检验得出的p值,rj代表第j个miRNA编号的p值在m1个miRNA中排序后的位置;
最后选取倍数变化f的绝对值大于1且FDR校正后q值小于等于0.05的miRNA,记为特征miRNA,设特征miRNA总数为m2,则有:
m2=m1{|fj|≥1,qj≤0.05},j∈(1,m1) (7)。
可选地,所述miRNA分别为:hsa-let-7a-1、hsa-let-7a-2、hsa-let-7a-3、hsa-let-7b、hsa-let-7i、hsa-mir-101-1、hsa-mir-101-2、hsa-mir-103a-1、hsa-mir-103a-2、hsa-mir-10a、hsa-mir-126、hsa-mir-143、hsa-mir-146b、hsa-mir-181a-2、hsa-mir-182、hsa-mir-183、hsa-mir-22、hsa-mir-23a、hsa-mir-23b、hsa-mir-26a-1、hsa-mir-26a-2、hsa-mir-26b、hsa-mir-27a、hsa-mir-27b、hsa-mir-29a、hsa-mir-30a、hsa-mir-30d、hsa-mir-30e、hsa-mir-374a和hsa-mir-99b,其核苷酸序列分别如SEQ ID NO.1-SEQ ID NO.30所示。
可选地,所述步骤2中的选取特征miRNA表达数据,对每个样本进行数据标准化具体为:
其中,i为样本编号,j为特征miRNA编号,μi为第i个样本所有特征miRNA表达均值,σi为第i个样本所有特征miRNA标准差,uij为取对数后的特征miRNA表达值,uij′为标准化后的miRNA数值。
可选地,所述步骤3中的使用支持向量机对标准化后的数据构建早期预测模型具体为:
步骤3.1、先对所有样本进行分组,将全部样本中80%划分为训练集+验证集,余下20%划分为测试集;训练集+验证集用于5折交叉验证,即将训练集+验证集分为相等的5组,按顺序将其中一组作为验证集,其余4组作为训练集;给定参数,训练集用于构建模型,验证集用于检验模型精确度;
步骤3.2、最优参数筛选,SVM中参数gamma控制高斯核的宽度,C是正则化参数,限制每个点的重要性,参数网格设置为:
gamma=[0.001,0.01,0.1,1,10,100] (9)
C=[0.001,0.01,0.1,1,10,100] (10)
在交叉验证中,依次使用每两个参数gamma和C的组合构建模型,然后用验证集检验模型精确度,对每个参数组合,5折交叉验证的每次验证产生1个精确度,共进行5次验证即产生5个精确度;选取5次验证的平均精确度最高的参数组合作为最优参数;
步骤3.3、使用最优参数和训练集+验证集的数据构建模型,最后用测试集对模型进行评估,评估指标包括精确度(accuracy)、准确率(precision)、召回率(recall)、特异性(specificity)、F1分数(F1 score)、马修斯相关系数(Matthews correlationcoefficient,MCC)和受试者工作曲线(receiver operating curve,ROC)下面积(areaunder the curve,AUC),在测试集中,定义实际为肿瘤且预测为肿瘤计数为true positive(TP),实际为正常但预测为肿瘤计数为false positive(FP),实际为肿瘤但预测为正常为false negative(FN),实际为正常且预测为正常为true negative(TN),以上评估指标计算公式为:
以上评估指标中精确度、准确率、召回率、特异性、F1分数和AUC返回介于(0,1)之间的值,精确度越高表示模型总体预测效率越高;准确率越高说明犯I类错误越小;召回率越高说明犯II类错误越小;特异性高说明在预测为正例的样本中很少有负例混入;F1分数是一个综合指标,为准确率和召回率的调和平均;MCC是观察到的和预测的二元分类之间的相关系数,返回介于(-1,1)之间的值,其中1表示完美预测,0表示不比随机预测好,-1表示预测和观察之间的完全不一致;AUC越高表明分类器预测的正实例概率越高,因此,以上指标越接近1表明模型整体的预测效果越好;
步骤3.4、若以上评估指标都大于0.9,说明模型具有较好的预测效果;则使用所有数据,用最优参数组合构建最终预测模型。
可选地,所述的步骤4中的根据患者特征miRNA的表达水平进行早期预测具体为:
步骤4.1、对预测样本的特征miRNA表达数据进行标准化,设u为预测样本特征miRNA表达值,μ为预测样本特征miRNA表达均值,σ为预测样本特征miRNA标准差,公式为:
其中j为特征miRNA编号,uj′为标准化后的miRNA数值;
步骤4.2、将预测样本标准化后的miRNA数值代入最终预测进行预测;预测结果为1表示患有肺鳞癌,预测结果为0表示正常。
与现有技术相比,本发明可以获得包括以下技术效果:
1)本发明预测速度快:使用本发明构建的预测模型可以对大规模样本进行快速预测,100个样本的预测时间只需要几秒钟。
2)本发明准确度高:本发明构建的预测模型预测精确度和准确率较高,ROC曲线下面积AUC可以达到0.994。
3)本发明平台异质性影响较小:由于不同分析平台测定的miRNA表达值有较大差异,本发明预测使用标准化后的特征miRNA表达值,因此受平台异质性的影响较小。
当然,实施本发明的任一产品并不一定需要同时达到以上所述的所有技术效果。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是本发明数据筛选和模型构建的流程;
图2是本发明支持向量机模型交叉验证参数优化过程;
图3是本发明支持向量机模型测试集评估指标;
图4是本发明支持向量机模型测试集ROC曲线。
具体实施方式
以下将配合实施例来详细说明本发明的实施方式,藉此对本发明如何应用技术手段来解决技术问题并达成技术功效的实现过程能充分理解并据以实施。
本发明公开了一种基于miRNA表达谱组合特征的肺鳞癌早期预测方法,包括以下步骤:
步骤1、获取肺鳞癌早期患者稳定差异表达的miRNA(特征miRNA),详细流程见图1,具体按照以下步骤实施:
步骤1.1、从Genomic Data Commons Data Portal数据库中下载肺鳞癌患者肿瘤组织和癌旁组织转录组数据以及临床数据,获得肺鳞癌患者肿瘤组织基因表达谱测序读段(read counts)数值,进行对数转换;
步骤1.2、选取具有一定表达丰度的miRNA,即在所有样本中miRNA的read counts大于等于10。再对所有miRNA的read counts取对数,设样本总数为n,筛选后miRNA总数为m,v为miRNA的read counts,u为取对数之后的表达值,则有;
uij=log2 vij,i∈(1,n),j(1,m) (1)
其中,i为样本编号,j为miRNA编号,uij为第i个样本、第j个miRNA编号取对数之后的表达值,vij为第i个样本、第j个miRNA编号的read counts。
步骤1.3、选取疾病分期为I期和II期的肺鳞癌患者,将这些患者记为肺鳞癌早期患者,肺鳞癌早期患者总数记为n′;
步骤1.4、选取肿瘤和正常样本中稳定表达的miRNA,即在肿瘤和正常样本中变异系数均小于0.1的miRNA,设μ为所有样本中任一个miRNA的表达均值,σ为标准差,变异系数的计算公式为:
其中,j为miRNA编号,cv为变异系数,cvj为第j个样本的变异系数,σj为第j个miRNA编号的标准差,μj为第j个miRNA编号的miRNA的表达均值;
设m1为稳定表达的miRNA总数,则有:
步骤1.5、选取肿瘤和正常样本中差异表达的miRNA。使用取对数后的表达值计算肿瘤和正常样本miRNA取对数后的倍数变化f,公式为:
其中j为miRNA编号,fj为第j个miRNA编号的倍数变化,μ1j为第j个miRNA编号的肿瘤样本的表达均值,μ2j为第j个miRNA编号的正常样本的表达均值。
然后使用独立样本t检验比较肿瘤和正常样本中miRNA的表达差异,独立样本t检验公式为:
对所有t检验得出的p值进行错误发现率(false discovery rate,FDR)校正,定义q为FDR校正后的数值,r为p值在m1个miRNA中排序后的位置,则有:
其中,j为miRNA编号,qj代表第j个miRNA编号的FDR校正后的数值,pj代表第j个miRNA编号的t检验得出的p值,rj代表第j个miRNA编号的p值在m1个miRNA中排序后的位置。
最后选取倍数变化f的绝对值大于1且FDR校正后q值小于等于0.05的miRNA,记为特征miRNA,设特征miRNA总数为m2,则有:
m2=m1{|fj|≥1,qj≤0.05},j∈(1,m1) (7)
经过以上筛选,最终获得30个肺鳞癌特征miRNA,见表1。30个肺鳞癌特征miRNA的核苷酸探针序列见表2。
表1.肺鳞癌特征miRNA
表2.肺鳞癌特征miRNA的核苷酸探针序列
步骤2、选取特征miRNA表达数据,对每个样本进行数据标准化,具体为:
其中i为样本编号,j为特征miRNA编号。μi为第i个样本所有特征miRNA表达均值,σi为第i个样本所有特征miRNA标准差,uij为取对数后的特征miRNA表达值,uij′为标准化后的miRNA数值。
步骤3、使用支持向量机对标准化后的数据构建早期预测模型,具体为:
步骤3.1、先对所有样本进行分组。将全部样本中80%划分为训练集+验证集,余下20%划分为测试集。训练集+验证集用于5折交叉验证,即将训练集+验证集分为相等的5组,按顺序将其中一组作为验证集,其余4组作为训练集。给定参数,训练集用于构建模型,验证集用于检验模型精确度,详见图1。
步骤3.2、最优参数筛选。SVM中参数gamma控制高斯核的宽度,C是正则化参数,限制每个点的重要性。参数网格设置为:
gamma=[0.001,0.01,0.1,1,10,100] (9)
C=[0.001,0.01,0.1,1,10,100] (10)
在交叉验证中,依次使用每两个参数gamma和C的组合构建模型,然后用验证集检验模型精确度。对每个参数组合,5折交叉验证的每次验证产生1个精确度,共进行5次验证即产生5个精确度。选取5次验证的平均精确度最高的参数组合作为最优参数。图2所示为交叉验证参数优化过程,当参数gamma=1,参数C=1时模型交叉验证精确度最高:0.988。因此该模型的最优参数为:gamma=1,C=1。
步骤3.3、使用最优参数和训练集+验证集的数据构建模型,最后用测试集对模型进行评估。评估指标包括精确度(accuracy)、准确率(precision)、召回率(recall)、特异性(specificity)、F1分数(F1 score)、马修斯相关系数(Matthews correlationcoefficient,MCC)和受试者工作曲线(receiver operating curve,ROC)下面积(areaunder the curve,AUC)。在测试集中,定义实际为肿瘤且预测为肿瘤计数为true positive(TP),实际为正常但预测为肿瘤计数为false positive(FP),实际为肿瘤但预测为正常为false negative(FN),实际为正常且预测为正常为true negative(TN);以上评估指标计算公式为:
以上评估指标中精确度、准确率、召回率、特异性、F1分数和AUC返回介于(0,1)之间的值;精确度越高表示模型总体预测效率越高;准确率越高说明犯I类错误越小;召回率越高说明犯II类错误越小;特异性高说明在预测为正例的样本中很少有负例混入;F1分数是一个综合指标,为准确率和召回率的调和平均;MCC是观察到的和预测的二元分类之间的相关系数,返回介于(-1,1)之间的值,其中1表示完美预测,0表示不比随机预测好,-1表示预测和观察之间的完全不一致;AUC越高表明分类器预测的正实例概率越高;因此,以上指标越接近1表明模型整体的预测效果越好。
步骤3.4、若以上评估指标都大于0.9,说明模型具有较好的预测效果。则使用所有数据,用最优参数组合构建最终预测模型。
图3所示为以上评估指标中的精确度、准确率、召回率、特异性、F1分数和MCC,这6个指标均大于0.94;图4所示为ROC曲线和AUC,测试集中AUC为0.994。说明以上评估指标说明该模型有很好的预测效果。因此使用所有数据,用最优参数组合构建最终预测模型。
步骤4、根据患者特征miRNA的表达水平进行早期预测,具体为:
步骤4.1、对预测样本的特征miRNA表达数据进行标准化,设u为预测样本特征miRNA取对数之后的表达值,μ为预测样本特征miRNA表达均值,σ为预测样本特征miRNA的标准差,公式为:
其中j为特征miRNA编号,uj′为第j个特征miRNA编号的标准化后的miRNA表达值。
本发明随机选取10例样本进行预测,并在构建最终预测模型时将这10例样本剔除。所选取的10例样本编号和标准化后特征miRNA数值见表3。
表3. 10例样本编号和特征miRNA标准化后的数值
步骤4.2、将预测样本标准化后的miRNA数值代入最终预测进行预测。预测结果为1表示患有肺鳞癌,预测结果为0表示正常。
10例样本编号,对应的TCGA编号,实际状态和预测结果见表4。10例样本预测结果与实际状态完全符合,说明本发明可以对肺鳞癌进行精确的早期预测。
表4. 10例样本编号,对应的TCGA编号,实际和预测的状态
综上所述,本发明的特征miRNA表达谱组合具有很高的预测准确性,能够有效地进行肺鳞癌的早期诊断。此外,本发明没有平台依赖性,能够对多种来源的数据进行预测。
上述说明示出并描述了发明的若干优选实施例,但如前所述,应当理解发明并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文所述发明构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离发明的精神和范围,则都应在发明所附权利要求的保护范围内。
SEQUENCE LISTING
<110> 中国科学院昆明动物研究所
<120> 一种特征miRNA表达谱组合及肺鳞癌早期预测方法
<130> 2019
<160> 30
<170> PatentIn version 3.3
<210> 1
<211> 16
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 1
tgggatgagg tagtag 16
<210> 2
<211> 15
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 2
aggttgaggt agtag 15
<210> 3
<211> 17
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 3
gggtgaggta gtaggtt 17
<210> 4
<211> 16
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 4
gggaaggcag taggtt 16
<210> 5
<211> 17
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 5
agcaaggcag tagcttg 17
<210> 6
<211> 15
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 6
tgccctggct cagtt 15
<210> 7
<211> 16
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 7
actgtccttt ttcggt 16
<210> 8
<211> 17
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 8
tactgccctc ggcttct 17
<210> 9
<211> 16
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 9
caaggcagca ctgtaa 16
<210> 10
<211> 18
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 10
tattccccta gatacgaa 18
<210> 11
<211> 18
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 11
cgcattatta ctcacggt 18
<210> 12
<211> 15
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 12
gagctacagt gcttc 15
<210> 13
<211> 16
<212> DNA
<213> 人工序列(artificial sequence)
<400> 13
ccagaactga gtccac 16
<210> 14
<211> 17
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 14
ggtacagtca acggtca 17
<210> 15
<211> 20
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 15
tagttggcaa gtctagaacc 20
<210> 16
<211> 15
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 16
ttatggccct tcggt 15
<210> 17
<211> 19
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 17
acagttcttc aactggcag 19
<210> 18
<211> 18
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 18
ggaaatccct ggcaatgt 18
<210> 19
<211> 17
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 19
ggtaatccct ggcaatg 17
<210> 20
<211> 21
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 20
cgtgcaagta accaagaata g 21
<210> 21
<211> 22
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 21
gaaacaagta atcaagaata gg 22
<210> 22
<211> 20
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 22
gagccaagta atggagaaca 20
<210> 23
<211> 17
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 23
gcggaactta gccactg 17
<210> 24
<211> 18
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 24
gcagaactta gccactgt 18
<210> 25
<211> 20
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 25
taaccgattt cagatggtgc 20
<210> 26
<211> 17
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 26
gctgcaaaca tccgact 17
<210> 27
<211> 19
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 27
gcagcaaaca tctgactga 19
<210> 28
<211> 18
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 28
gctgtaaaca tccgactg 18
<210> 29
<211> 22
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 29
aattacaata caatctgata ag 22
<210> 30
<211> 13
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 30
cggacccaca gac 13
Claims (7)
1.一种用于预测早期肺鳞癌的特征miRNA表达谱组合,其特征在于,包括hsa-let-7a-1,hsa-let-7a-2,hsa-let-7a-3,hsa-let-7b,hsa-let-7i,hsa-mir-101-1,hsa-mir-101-2,hsa-mir-103a-1,hsa-mir-103a-2,hsa-mir-10a,hsa-mir-126,hsa-mir-143,hsa-mir-146b,hsa-mir-181a-2,hsa-mir-182,hsa-mir-183,hsa-mir-22,hsa-mir-23a,hsa-mir-23b,hsa-mir-26a-1,hsa-mir-26a-2,hsa-mir-26b,hsa-mir-27a,hsa-mir-27b,hsa-mir-29a,hsa-mir-30a,hsa-mir-30d,hsa-mir-30e,hsa-mir-374a,hsa-mir-99b,其核苷酸序列如SEQ ID NO.1-30所示。
2.一种基于miRNA表达谱组合特征的肺鳞癌早期预测方法,其特征在于,包括以下步骤:
步骤1、获取肺鳞癌早期患者稳定差异表达的miRNA;
步骤2、选取特征miRNA表达数据,对每个样本进行数据标准化;
步骤3、使用支持向量机对标准化后的数据构建早期预测模型;
步骤4、根据患者特征miRNA的表达水平进行早期预测;
该方法用于非疾病的诊断和治疗目的。
3.根据权利要求2所述的预测方法,其特征在于,所述步骤1中的获取肺鳞癌早期患者稳定差异表达的miRNA具体为:
步骤1.1、从Genomic Data Commons Data Portal数据库中下载肺鳞癌患者肿瘤组织和癌旁组织转录组数据以及临床数据,获得肺鳞癌患者肿瘤组织基因表达谱read counts数值,即为测序读段数值,进行对数转换;
步骤1.2、选取在所有样本中miRNA的read counts大于等于10的miRNA,再对所有miRNA的read counts取对数,设样本总数为n,筛选后miRNA总数为m,v为miRNA的read counts,u为取对数之后的表达值,则有;
uij=log2vij,i∈(1,n),j∈(1,m) (1)
其中,i为样本编号,j为miRNA编号,uij为第i个样本、第j个miRNA编号取对数之后的表达值,vij为第i个样本、第j个miRNA编号的read counts数值;
步骤1.3、选取疾病分期为I期和II期的肺鳞癌患者,将这些患者记为肺鳞癌早期患者,肺鳞癌早期患者总数记为n′;
步骤1.4、选取在肿瘤和正常样本中变异系数均小于0.1的miRNA,设μ为所有样本中miRNA的表达均值,σ为标准差,变异系数的计算公式为:
其中,j为miRNA编号,cv为变异系数,cvj为第j个样本的变异系数,σj为第j个miRNA编号的标准差,μj为第j个miRNA编号的miRNA的表达均值,设m1为稳定表达的miRNA总数,则有:
m1=m{cvj≥10},j∈(1,m) (3)
步骤1.5、选取肿瘤和正常样本中差异表达的miRNA,使用取对数后的表达值计算肿瘤和正常样本miRNA取对数后的倍数变化f,公式为:
fj=μ1j-μ2j,j∈(1,m1) (4)
其中j为miRNA编号,fj为第j个miRNA编号的倍数变化,μ1j为第j个miRNA编号的肿瘤样本的表达均值,μ2j为第j个miRNA编号的正常样本的表达均值;
然后使用独立样本t检验比较肿瘤和正常样本中miRNA的表达差异,独立样本t检验公式为:
对所有t检验得出的p值进行错误发现率(false discovery rate,FDR)校正,定义q为FDR校正后的数值,r为p值在m1个miRNA中排序后的位置,则有:
其中,j为miRNA编号,qj代表第j个miRNA编号的FDR校正后的数值,pj代表第j个miRNA编号的t检验得出的p值,rj代表第j个miRNA编号的p值在m1个miRNA中排序后的位置;
最后选取倍数变化f的绝对值大于1且FDR校正后q值小于等于0.05的miRNA,记为特征miRNA,设特征miRNA总数为m2,则有:
m2=m1{|fj|≥1,qj≤0.05},j∈(1,m1) (7)。
4.根据权利要求2所述的预测方法,其特征在于,所述miRNA分别为:hsa-let-7a-1、hsa-let-7a-2、hsa-let-7a-3、hsa-let-7b、hsa-let-7i、hsa-mir-101-1、hsa-mir-101-2、hsa-mir-103a-1、hsa-mir-103a-2、hsa-mir-10a、hsa-mir-126、hsa-mir-143、hsa-mir-146b、hsa-mir-181a-2、hsa-mir-182、hsa-mir-183、hsa-mir-22、hsa-mir-23a、hsa-mir-23b、hsa-mir-26a-1、hsa-mir-26a-2、hsa-mir-26b、hsa-mir-27a、hsa-mir-27b、hsa-mir-29a、hsa-mir-30a、hsa-mir-30d、hsa-mir-30e、hsa-mir-374a和hsa-mir-99b,其核苷酸序列分别如SEQ ID NO.1-SEQ ID NO.30所示。
6.根据权利要求2所述的预测方法,其特征在于,所述步骤3中的使用支持向量机对标准化后的数据构建早期预测模型具体为:
步骤3.1、先对所有样本进行分组,将全部样本中80%划分为训练集+验证集,余下20%划分为测试集;训练集+验证集用于5折交叉验证,即将训练集+验证集分为相等的5组,按顺序将其中一组作为验证集,其余4组作为训练集;给定参数,训练集用于构建模型,验证集用于检验模型精确度;
步骤3.2、最优参数筛选,SVM中参数gamma控制高斯核的宽度,C是正则化参数,限制每个点的重要性,参数网格设置为:
gamma=[0.001,0.01,0.1,1,10,100] (9)
C=[0.001,0.01,0.1,1,10,100] (10)
在交叉验证中,依次使用每两个参数gamma和C的组合构建模型,然后用验证集检验模型精确度,对每个参数组合,5折交叉验证的每次验证产生1个精确度,共进行5次验证即产生5个精确度;选取5次验证的平均精确度最高的参数组合作为最优参数;
步骤3.3、使用最优参数和训练集+验证集的数据构建模型,最后用测试集对模型进行评估,评估指标包括精确度(accuracy)、准确率(precision)、召回率(recall)、特异性(specificity)、F1分数(F1 score)、马修斯相关系数(Matthews correlationcoefficient,MCC)和受试者工作曲线(receiver operating curve,ROC)下面积(areaunder the curve,AUC),在测试集中,定义实际为肿瘤且预测为肿瘤计数为true positive(TP),实际为正常但预测为肿瘤计数为false positive(FP),实际为肿瘤但预测为正常为false negative(FN),实际为正常且预测为正常为true negative(TN),以上评估指标计算公式为:
以上评估指标中精确度、准确率、召回率、特异性、F1分数和AUC返回介于(0,1)之间的值,精确度越高表示模型总体预测效率越高;准确率越高说明犯I类错误越小;召回率越高说明犯II类错误越小;特异性高说明在预测为正例的样本中很少有负例混入;F1分数是一个综合指标,为准确率和召回率的调和平均;MCC是观察到的和预测的二元分类之间的相关系数,返回介于(-1,1)之间的值,其中1表示完美预测,0表示不比随机预测好,-1表示预测和观察之间的完全不一致;AUC越高表明分类器预测的正实例概率越高,因此,以上指标越接近1表明模型整体的预测效果越好;
步骤3.4、若以上评估指标都大于0.9,说明模型具有较好的预测效果;则使用所有数据,用最优参数组合构建最终预测模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010770157.8A CN111793692A (zh) | 2020-08-04 | 2020-08-04 | 一种特征miRNA表达谱组合及肺鳞癌早期预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010770157.8A CN111793692A (zh) | 2020-08-04 | 2020-08-04 | 一种特征miRNA表达谱组合及肺鳞癌早期预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111793692A true CN111793692A (zh) | 2020-10-20 |
Family
ID=72828389
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010770157.8A Pending CN111793692A (zh) | 2020-08-04 | 2020-08-04 | 一种特征miRNA表达谱组合及肺鳞癌早期预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111793692A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022121960A1 (zh) * | 2020-12-08 | 2022-06-16 | 信标生医股份有限公司 | 泛癌症早筛预测方法 |
WO2024174260A1 (zh) * | 2023-02-24 | 2024-08-29 | 信标生医股份有限公司 | 基于液态活检的癌症早期筛检方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120108462A1 (en) * | 2009-06-05 | 2012-05-03 | Febit Holding Gmbh | Mirna fingerprint in the diagnosis of lung cancer |
US20150080243A1 (en) * | 2011-09-01 | 2015-03-19 | Allegro Diagnostics Corp. | Methods and compositions for detecting cancer based on mirna expression profiles |
CN108363907A (zh) * | 2018-05-09 | 2018-08-03 | 中国科学院昆明动物研究所 | 一种基于多基因表达特征谱的肺腺癌个性化预后评估方法 |
CN108611416A (zh) * | 2018-05-09 | 2018-10-02 | 中国科学院昆明动物研究所 | 一种基于多基因表达特征谱的宫颈癌个性化预后评估方法 |
US20180327853A1 (en) * | 2015-11-05 | 2018-11-15 | Arphion Diagnostics | Process for the indentification of patients at risk for oscc |
-
2020
- 2020-08-04 CN CN202010770157.8A patent/CN111793692A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120108462A1 (en) * | 2009-06-05 | 2012-05-03 | Febit Holding Gmbh | Mirna fingerprint in the diagnosis of lung cancer |
US20150080243A1 (en) * | 2011-09-01 | 2015-03-19 | Allegro Diagnostics Corp. | Methods and compositions for detecting cancer based on mirna expression profiles |
US20180327853A1 (en) * | 2015-11-05 | 2018-11-15 | Arphion Diagnostics | Process for the indentification of patients at risk for oscc |
CN108363907A (zh) * | 2018-05-09 | 2018-08-03 | 中国科学院昆明动物研究所 | 一种基于多基因表达特征谱的肺腺癌个性化预后评估方法 |
CN108611416A (zh) * | 2018-05-09 | 2018-10-02 | 中国科学院昆明动物研究所 | 一种基于多基因表达特征谱的宫颈癌个性化预后评估方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022121960A1 (zh) * | 2020-12-08 | 2022-06-16 | 信标生医股份有限公司 | 泛癌症早筛预测方法 |
WO2024174260A1 (zh) * | 2023-02-24 | 2024-08-29 | 信标生医股份有限公司 | 基于液态活检的癌症早期筛检方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10000810B2 (en) | MiRNA fingerprint in the diagnosis of multiple sclerosis | |
CN111748633A (zh) | 一种特征miRNA表达谱组合及头颈鳞状细胞癌早期预测方法 | |
CN111748632A (zh) | 一种特征lincRNA表达谱组合及肝癌早期预测方法 | |
CN109801680B (zh) | 基于tcga数据库的肿瘤转移复发预测方法及系统 | |
CN109830264B (zh) | 肿瘤患者基于甲基化位点进行分类的方法 | |
CN110305964A (zh) | 一种前列腺癌患者预后复发风险预测标志工具及其风险评估模型的建立 | |
CN115295074B (zh) | 基因标志物在恶性肺结节筛查中的应用、筛查模型的构建方法和检测装置 | |
CN111793692A (zh) | 一种特征miRNA表达谱组合及肺鳞癌早期预测方法 | |
CN113517073B (zh) | 肺癌手术后生存率预测模型构建方法和预测模型系统 | |
CN113862351B (zh) | 体液样本中鉴定胞外rna生物标志物的试剂盒及方法 | |
CN111733251A (zh) | 一种特征miRNA表达谱组合及肾透明细胞癌早期预测方法 | |
CN111748634A (zh) | 一种特征lincRNA表达谱组合及结肠癌的早期预测方法 | |
CN111944902A (zh) | 一种基于lincRNA表达谱组合特征的肾乳头状细胞癌早期预测方法 | |
CN111944900A (zh) | 一种特征lincRNA表达谱组合及子宫内膜癌早期预测方法 | |
CN111763738A (zh) | 一种特征mRNA表达谱组合及肝癌早期预测方法 | |
CN111850124A (zh) | 一种特征lincRNA表达谱组合及肺鳞癌早期预测方法 | |
CN111733252A (zh) | 一种特征miRNA表达谱组合及胃癌早期预测方法 | |
CN111808965A (zh) | 一种特征lincRNA表达谱组合及肾透明细胞癌早期预测方法 | |
CN111944899A (zh) | 一种特征miRNA表达谱组合及肾乳头状细胞癌早期预测方法 | |
CN111748631A (zh) | 一种特征miRNA表达谱组合及肝癌早期预测方法 | |
CN112760375A (zh) | 一种特征miRNA表达谱组合及子宫内膜癌早期预测方法 | |
CN111718996A (zh) | 一种特征lincRNA表达谱组合及胃癌早期预测方法 | |
CN111793691A (zh) | 一种特征mRNA表达谱组合及肺鳞癌早期预测方法 | |
CN111718997A (zh) | 一种特征mRNA表达谱组合及胃癌早期预测方法 | |
CN111172285A (zh) | 用于胰腺癌早期诊断和/或预后监测的miRNA组及其应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20201020 |