CN108559777B - 一种新型分子标记及其在制备用于肾透明细胞癌诊断和预后的试剂盒中的应用 - Google Patents
一种新型分子标记及其在制备用于肾透明细胞癌诊断和预后的试剂盒中的应用 Download PDFInfo
- Publication number
- CN108559777B CN108559777B CN201810388509.6A CN201810388509A CN108559777B CN 108559777 B CN108559777 B CN 108559777B CN 201810388509 A CN201810388509 A CN 201810388509A CN 108559777 B CN108559777 B CN 108559777B
- Authority
- CN
- China
- Prior art keywords
- cell carcinoma
- clear cell
- renal clear
- trna
- trfs
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 208000030808 Clear cell renal carcinoma Diseases 0.000 title claims abstract description 54
- 206010073251 clear cell renal cell carcinoma Diseases 0.000 title claims abstract description 52
- 239000003147 molecular marker Substances 0.000 title claims abstract description 19
- 238000004393 prognosis Methods 0.000 title claims abstract description 19
- 238000003745 diagnosis Methods 0.000 title claims abstract description 16
- 238000002360 preparation method Methods 0.000 title claims description 5
- 239000012634 fragment Substances 0.000 claims abstract description 35
- 206010028980 Neoplasm Diseases 0.000 claims abstract description 28
- 230000014509 gene expression Effects 0.000 claims abstract description 24
- 238000012360 testing method Methods 0.000 claims abstract description 7
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 63
- 108020004566 Transfer RNA Proteins 0.000 claims description 25
- 238000000034 method Methods 0.000 claims description 10
- 108091029536 tRNA precursor Proteins 0.000 claims description 9
- 108090000623 proteins and genes Proteins 0.000 claims description 5
- 238000012179 MicroRNA sequencing Methods 0.000 claims description 3
- 150000001413 amino acids Chemical class 0.000 claims description 3
- 238000007405 data analysis Methods 0.000 claims description 3
- 239000002243 precursor Substances 0.000 claims description 3
- 238000000528 statistical test Methods 0.000 claims description 2
- 230000009466 transformation Effects 0.000 claims description 2
- 239000003153 chemical reaction reagent Substances 0.000 claims 1
- 230000004083 survival effect Effects 0.000 abstract description 11
- 230000000694 effects Effects 0.000 abstract description 9
- 238000013178 mathematical model Methods 0.000 abstract description 5
- 230000035945 sensitivity Effects 0.000 abstract description 4
- 108091028043 Nucleic acid sequence Proteins 0.000 abstract description 2
- 239000003550 marker Substances 0.000 abstract description 2
- 238000013211 curve analysis Methods 0.000 abstract 1
- 238000007637 random forest analysis Methods 0.000 description 6
- 238000012706 support-vector machine Methods 0.000 description 6
- 208000008839 Kidney Neoplasms Diseases 0.000 description 4
- 206010038389 Renal cancer Diseases 0.000 description 4
- 201000010982 kidney cancer Diseases 0.000 description 4
- 239000000090 biomarker Substances 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 201000010099 disease Diseases 0.000 description 3
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 3
- 208000006265 Renal cell carcinoma Diseases 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000013399 early diagnosis Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- CCEKAJIANROZEO-UHFFFAOYSA-N sulfluramid Chemical group CCNS(=O)(=O)C(F)(F)C(F)(F)C(F)(F)C(F)(F)C(F)(F)C(F)(F)C(F)(F)C(F)(F)F CCEKAJIANROZEO-UHFFFAOYSA-N 0.000 description 2
- 241001463143 Auca Species 0.000 description 1
- 108091032955 Bacterial small RNA Proteins 0.000 description 1
- 108020004414 DNA Proteins 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 206010027476 Metastases Diseases 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000003766 bioinformatics method Methods 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 238000002512 chemotherapy Methods 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000002405 diagnostic procedure Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- -1 i.e. Proteins 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 231100000518 lethal Toxicity 0.000 description 1
- 230000001665 lethal effect Effects 0.000 description 1
- 230000009401 metastasis Effects 0.000 description 1
- 108091070501 miRNA Proteins 0.000 description 1
- 239000002679 microRNA Substances 0.000 description 1
- 108091027963 non-coding RNA Proteins 0.000 description 1
- 102000042567 non-coding RNA Human genes 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000001575 pathological effect Effects 0.000 description 1
- 230000035479 physiological effects, processes and functions Effects 0.000 description 1
- 230000002980 postoperative effect Effects 0.000 description 1
- 238000001243 protein synthesis Methods 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 238000001959 radiotherapy Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000002271 resection Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000014616 translation Effects 0.000 description 1
- 210000005239 tubule Anatomy 0.000 description 1
- 210000004881 tumor cell Anatomy 0.000 description 1
- 230000002485 urinary effect Effects 0.000 description 1
- 208000029584 urinary system neoplasm Diseases 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/118—Prognosis of disease development
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/158—Expression markers
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/178—Oligonucleotides characterized by their use miRNA, siRNA or ncRNA
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Analytical Chemistry (AREA)
- Genetics & Genomics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Physics & Mathematics (AREA)
- Organic Chemistry (AREA)
- Pathology (AREA)
- Zoology (AREA)
- Biophysics (AREA)
- Immunology (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Wood Science & Technology (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- Oncology (AREA)
- General Engineering & Computer Science (AREA)
- Hospice & Palliative Care (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Medical Informatics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了一种新型分子标记及其在制备用于肾透明细胞癌诊断和预后的试剂盒中的应用,所述新型分子标记的RNA序列如SEQ ID NO:1~SEQ ID NO:57所示。以本发明标记物为基础,构建肾透明细胞癌诊断的数学模型;该模型灵敏度高,特异性好,AUC可高达0.997,诊断效果良好。此外,这57个tRF片段也可以作为肾透明细胞癌分型及预测病人生存期的分子标记物;在测试数据中,根据tRFs表达,肾透明细胞癌肿瘤样本被聚类成3个亚型,通过生存曲线分析显示这些亚型的生存期存在显著差异;本发明公开的新型的tRF分子标记物具有良好的诊断指标的特性,可以有效用于肾透明细胞癌诊断、分型和预后,具有较高的临床使用和推广价值。
Description
技术领域
本发明涉及生物检测技术领域,具体涉及一种新型分子标记及其在制备用于肾透明细胞癌诊断和预后的试剂盒中的应用。
背景技术
肾癌(肾细胞癌)是泌尿系统肿瘤中致死率最高的一种,是起源于肾实质泌尿小管上皮系统的恶性肿瘤,又称肾腺癌,是最常见的肿瘤之一,其发病率和死亡率约占全部肿瘤的2-3%。根据组织学结构,肾癌可以被分为多个亚型,其中,肾透明细胞癌(kidney clearcell renal carcinoma,KIRC)是肾癌中最常见的一种亚型,约占70-80%,每年全世界大约会有102,000例患者因此而死亡。肾透明细胞癌是一种发展相对较慢的肿瘤,其早期症状常缺乏特异性,很多肾透明细胞癌发现时多已属中晚期,且出现了远处转移。因此对于肾透明细胞癌的治疗还是应注重早期发现早期诊断早期治疗。此外,肾透明细胞癌对化疗及放疗均不敏感,行手术切除是惟一治愈的方法。然而,肾透明细胞癌组织学行为多变,预后有不确定性,近30%的患者术后肿瘤复发。因此,寻找敏感的肾透明细胞癌标记物用以早期发现肿瘤,并能判断患者预后,早期发现复发,指导个体化治疗具有更重要的临床意义。近来,随着各组学技术和生物信息学分析技术的飞速发展,能够检测和分析数以百计不同的生物分子表达包括DNA,RNA和蛋白质,使筛选出对肾透明细胞癌诊断和预后判断准确的生物分子标记物成为可能。
生物标记物是指能将机体的生理和疾病状态区分开来的生物分子,筛选到可用于疾病早期发现、早期诊断的生物标志物可大大提高患者的临床治疗效果。tRNA是一类生物体中非常重要的非编码RNA,主要功能是转运氨基酸、参与蛋白合成。最近研究发现tRNA在各种逆境下会发生降解,产生20-40bp的小RNA片段,称为tRNA-derived RNA fragments,简称tRF。本研究团队最新数据显示肿瘤组织普遍具有特征性的tRF表达谱,即指肿瘤细胞中某些tRF的表达水平异常,而这种异常的特征性tRF可以成为用于肿瘤或疾病的诊断,病理分级,临床分期,治疗与预后的生物标志物,显示了较好的临床应用前景。我们分析了TCGA数据库中544例肾透明细胞癌测序数据,首次发现了肾透明细胞癌肿瘤组织中存在大量这种tRF片段,该种新型的分子标记物将有望成为肾透明细胞癌诊断筛查及分型预后效果预测的重要手段。
发明内容
本发明的目的在于针对现有技术的不足,提供一种新型分子标记及其在制备用于肾透明细胞癌诊断和预后的试剂盒中的应用。
本发明的目的是通过以下技术方案来实现的,一种新型分子标记,它的RNA序列如SEQ ID NO:1~SEQ ID NO:57所示。
进一步地,它通过以下方法获取:
(1)从GtRNAdb数据库中下载620个tRNA基因注释信息及其序列,在tRNA序列3′端添加“CCA”来获得新组成的CCA-tRNAs的注释和序列信息,然后以CCA-tRNAs序列的5′或者3′端作为起点,得到所有在15~30nt范围内的片段序列,进一步合并相同的序列后,得到8681个来自CCA-tRNAs 5′端的片段序列和9285个来自CCA-tRNAs 3′端的片段序列;利用bedtools工具获得这620个tRNA基因下游50nt的注释和序列信息,即tRNA前体注释和序列信息,然后以tRNA前体序列的5′端为起点,得到所有在15~30nt范围内的片段序列,进一步合并相同的序列后,最终得到15909个来自tRNA前体的片段序列;合计得到由33875个候选的tRNA来源的短片段注释和序列信息构建成的数据库。
(2)在TCGA数据库中下载肾透明细胞癌肿瘤组织和相应的正常组织的miRNA-seq数据,利用bwa把TCGA样本中的读长比对到步骤1所构建的CCA-tRNAs和tRNA前体的注释中,然后计算每个候选的tRNA来源的小片段所对应的读长数目;采用RPM来量化每个候选的tRNA来源的小片段的表达丰度,要求tRFs的表达量必须在10%的样本中大于1RPM;在数据分析前,对所有tRFs的表达值(即RPM值)数据进行log2转换以及上四分位数方法正规化。
(3)对肾透明细胞癌肿瘤组织及其相邻正常组织中tRFs进行t统计检验,运用Benjamini-Hochberg方法控制多重检验的假阳性;结果显示57个tRFs在肿瘤组织中异常表达,这57个tRFs的RNA序列如SEQ ID NO:1~SEQ ID NO:57所示。
本发明还提供了一种上述分子标记在制备用于肾透明细胞癌诊断和预后的试剂盒中的应用。
本发明的有益效果是:以本发明标记物为基础,构建肾透明细胞癌诊断的数学模型;该模型灵敏度高,特异性好,AUC可高达0.997,诊断效果良好。此外,这57个tRF片段也可以作为肾透明细胞癌分型及预测病人生存期的分子标记物;在测试数据中,根据tRFs表达,肾透明细胞癌肿瘤样本被聚类成3个亚型,这些亚型分别有自己本身特异的tRFs表达模式,通过生存曲线分析显示这些亚型的生存期存在显著差异(P<0.001)。综上所述,本发明公开的新型的tRF分子标记物具有良好的诊断指标的特性,可以有效用于肾透明细胞癌诊断、分型和预后,具有较高的临床使用和推广价值。
附图说明
图1是本发明一个tRF片段在肾透明细胞癌肿瘤组织和正常组织差异表达图,其中,(a)为正常样本和肿瘤样本中显著差异表达的tRF的火山图,(b)为一个tRF,即M5-tRNA-Arg-TCT-5-1,在10对独立的肾透明细胞癌组织样本中的验证结果图(P=2.0×10-3)。
图2是本发明一个评估tRF片段作为肾透明细胞癌诊断的分子标记物的具体实施流程图和诊断效果图,其中,(a)为用于评价本发明鉴别的57个tRF分子标记在肾透明细胞癌诊断效果的诊断流程图,(b)为本发明鉴别的57个tRF分子标记分别在4个构建的数学模型(随机森林(RF)、支持向量机(SVM)、广义线性模型(GLM)和局部最小二乘(PLS))里的受试者工作特征曲线图(简称ROC曲线);
图3是本发明一个评估tRF片段作为肾透明细胞癌预后的分子标记物的肿瘤分型图和生存曲线图。
具体实施方式
下面通过具体实施例对本发明作进一步阐述,应该说明的是,下述说明仅是为了解释本发明,并不对其内容进行限定。
本发明分子标记的获取方法如下:
1、从GtRNAdb(http://gtrnadb.ucsc.edu/genomes/eukaryota/Hsapi19)数据库中下载620个tRNA基因注释信息及其序列。通过在成熟tRNA序列3′端添加“CCA”来获得新组成的CCA-tRNAs的注释和序列信息。然后以CCA-tRNAs序列的5′或者3′端作为起点,得到所有在15~30nt范围内的片段序列,进一步合并相同的序列后,最终得到8681个来自CCA-tRNAs 5′端的片段序列和9285个来自CCA-tRNAs 3′端的片段序列。此外,我们利用bedtools工具获得这620个tRNA基因下游50nt的注释和序列信息,即tRNA前体注释和序列信息。然后以tRNA前体序列的5′端为起点,得到所有在15~30nt范围内的片段序列,进一步合并相同的序列后,最终得到15909个来自tRNA前体的片段序列。这样我们总共得到由33875个候选的tRNA来源的短片段注释和序列信息构建成的数据库。
2、在TCGA数据库(https://cancergenome.nih.gov/)中下载544例肾透明细胞癌肿瘤组织和相应的71例正常组织的miRNA-seq数据。首先,我们利用bwa再次把TCGA样本中的读长比对到我们前面所构建的CCA-tRNAs和tRNA前体的注释中,不允许有错配的碱基。然后计算每个候选的tRNA来源的小片段所对应的读长数目。在miRNA的表达分析中,研究者常使用RPM(Reads Per Million total mapped reads,公式为:单个miRNA读长数×106/比对到参考基因组的总读长数)来校准miRNA的表达量。我们也采用RPM来量化每个候选的tRNA来源的小片段的表达丰度。此外,为了得到可靠的tRNA来源的短片段,我门要求tRFs的表达量必须在10%的样本中大于1RPM。在数据分析前,对所有tRFs的表达值(即RPM值)数据进行log2转换以及上四分位数方法正规化(upper quartile normalization)。
3、为鉴定肿瘤组织中异常表达的tRFs,我们对肾透明细胞癌肿瘤组织及其相邻正常组织中tRFs进行t统计检验。我们并且运用Benjamini-Hochberg方法控制多重检验的假阳性(FDR,false discovery rate)。结果显示57个tRFs在肿瘤组织中异常表达,这57个tRFs的RNA序列如SEQ ID NO:1~SEQ ID NO:57所示;利用浙江大学附属第二医院肾透明细胞癌组织库,我们实验验证了其中一个在肾透明细胞癌异常高表达的tRF5-1(P=2.0×10-3)。
图1是本发明一个tRF片段在肾透明细胞癌肿瘤组织和正常组织差异表达图,其中,(a)为正常样本和肿瘤样本中显著差异表达的tRF的火山图。从图中可以看出,17个tRF在肿瘤中显著表达上升(图1(b)右侧),40个tRF显著表达降低(图1(b)左侧)。(b)为一个tRF,即M5-tRNA-Arg-TCT-5-1,在10对独立的肾透明细胞癌组织样本中的验证结果(P=2.0×10-3)。
4、随机将TCGA中544例肾透明细胞癌肿瘤样本分成训练组(80%)和检验组(20%),采用随机森林(RF)、支持向量机(SVM)、广义线性模型(GLM)和局部最小二乘(PLS)四种方法构建肾透明细胞癌诊断的数学模型,构建的模型的诊断肾透明细胞癌的敏感性和特异性高达98.4-99.7%。
图2是本发明一个评估tRF片段作为肾透明细胞癌诊断的分子标记物的具体实施流程图和诊断效果图,其中,(a)为用于评价我们鉴别的57个tRF分子标记在肾透明细胞癌诊断效果的诊断流程图,(b)为我们鉴别的57个tRF分子标记分别在4个构建的数学模型(随机森林(RF)、支持向量机(SVM)、广义线性模型(GLM)和局部最小二乘(PLS)里的受试者工作特征曲线图(简称ROC曲线),用于评价他们对肾透明细胞癌诊断效果的敏感性和特异性。
5、为研究肾透明细胞癌组织中tRFs表达的不同模式以及鉴定不同的亚型,我们对发现的tRFs进行聚类分析。我们采用了非负矩阵分解聚类(Nonnegative matrixfactorization clustering)进行样本聚类分析,得到3个肾透明细胞癌肿瘤亚型,这些亚型分别有自己本身特异的tRFs表达模式。当tRFs亚型选定后,采用Kaplan—Meier方法计算不同亚型的生存曲线,并采用对数序(log rank)检验不同亚型中病人的生存期差异的显著性,结果显示这3个肾透明细胞癌肿瘤亚型的生存期存在显著差异(P<0.001)。
图3是本发明一个评估tRF片段作为肾透明细胞癌预后的分子标记物的肿瘤分型图和生存曲线图,从图中可以看出,3类亚型预后差异明显,其中2类亚型预后最好,其次是3类亚型,1类亚型预后最差。
序列表
<110> 浙江大学
<120> 一种新型分子标记及其在制备用于肾透明细胞癌诊断和预后的试剂盒中的应用
<160> 57
<170> SIPOSequenceListing 1.0
<210> 1
<211> 19
<212> RNA
<213> 人工序列(Unknown)
<400> 1
gaccgcgugg ccuaaugga 19
<210> 2
<211> 20
<212> RNA
<213> 人工序列(Unknown)
<400> 2
gucucugugg cgcaauggac 20
<210> 3
<211> 30
<212> RNA
<213> 人工序列(Unknown)
<400> 3
gcaugggugg uucaguggua gaauucucgc 30
<210> 4
<211> 19
<212> RNA
<213> 人工序列(Unknown)
<400> 4
gggccagugg cgcaaugga 19
<210> 5
<211> 18
<212> RNA
<213> 人工序列(Unknown)
<400> 5
gaccucgugg cgcaaugg 18
<210> 6
<211> 18
<212> RNA
<213> 人工序列(Unknown)
<400> 6
ggcucguugg ucuagggg 18
<210> 7
<211> 18
<212> RNA
<213> 人工序列(Unknown)
<400> 7
ggggauguag cucagugg 18
<210> 8
<211> 19
<212> RNA
<213> 人工序列(Unknown)
<400> 8
ggcuccgugg cgcaaugga 19
<210> 9
<211> 20
<212> RNA
<213> 人工序列(Unknown)
<400> 9
ggccgguuag cucagucggc 20
<210> 10
<211> 18
<212> RNA
<213> 人工序列(Unknown)
<400> 10
ggggguguag cucagugg 18
<210> 11
<211> 19
<212> RNA
<213> 人工序列(Unknown)
<400> 11
gccccagugg ccuaaugga 19
<210> 12
<211> 19
<212> RNA
<213> 人工序列(Unknown)
<400> 12
ggucccaugg uguaauggu 19
<210> 13
<211> 30
<212> RNA
<213> 人工序列(Unknown)
<400> 13
gguagugugg ccgagcgguc uaaggcgcug 30
<210> 14
<211> 19
<212> RNA
<213> 人工序列(Unknown)
<400> 14
gucucugugg cgcaaucgg 19
<210> 15
<211> 19
<212> RNA
<213> 人工序列(Unknown)
<400> 15
gcccggauag cucagucgg 19
<210> 16
<211> 19
<212> RNA
<213> 人工序列(Unknown)
<400> 16
ggcucugugg cgcaaugga 19
<210> 17
<211> 19
<212> RNA
<213> 人工序列(Unknown)
<400> 17
gacccagugg ccuaaugga 19
<210> 18
<211> 23
<212> RNA
<213> 人工序列(Unknown)
<400> 18
guuuccguag uguagugguc auc 23
<210> 19
<211> 19
<212> RNA
<213> 人工序列(Unknown)
<400> 19
guuaagaugg cagagcccg 19
<210> 20
<211> 23
<212> RNA
<213> 人工序列(Unknown)
<400> 20
gcguuggugg uauagugguu agc 23
<210> 21
<211> 16
<212> RNA
<213> 人工序列(Unknown)
<400> 21
gcguuggugg uauagu 16
<210> 22
<211> 25
<212> RNA
<213> 人工序列(Unknown)
<400> 22
guuuccguag uguagugguc aucac 25
<210> 23
<211> 16
<212> RNA
<213> 人工序列(Unknown)
<400> 23
guuuccguag uguagc 16
<210> 24
<211> 20
<212> RNA
<213> 人工序列(Unknown)
<400> 24
guuuccguag uguagugguc 20
<210> 25
<211> 16
<212> RNA
<213> 人工序列(Unknown)
<400> 25
guuuccguag uguagu 16
<210> 26
<211> 23
<212> RNA
<213> 人工序列(Unknown)
<400> 26
gguuccauag uguagugguu auc 23
<210> 27
<211> 28
<212> RNA
<213> 人工序列(Unknown)
<400> 27
gguuccauag uguagugguu aucacguc 28
<210> 28
<211> 16
<212> RNA
<213> 人工序列(Unknown)
<400> 28
guuaagaugg cagagc 16
<210> 29
<211> 25
<212> RNA
<213> 人工序列(Unknown)
<400> 29
ggggguauag cucaguggua gagca 25
<210> 30
<211> 23
<212> RNA
<213> 人工序列(Unknown)
<400> 30
guuuccguag uguagugguu auc 23
<210> 31
<211> 18
<212> RNA
<213> 人工序列(Unknown)
<400> 31
guuaagaugg cagagccc 18
<210> 32
<211> 24
<212> RNA
<213> 人工序列(Unknown)
<400> 32
ggggguauag cucaguggua gagc 24
<210> 33
<211> 20
<212> RNA
<213> 人工序列(Unknown)
<400> 33
gguuccauag uguagugguu 20
<210> 34
<211> 24
<212> RNA
<213> 人工序列(Unknown)
<400> 34
guuuccguag uguagugguu auca 24
<210> 35
<211> 22
<212> RNA
<213> 人工序列(Unknown)
<400> 35
gguaaaaugg cugagugaag ca 22
<210> 36
<211> 16
<212> RNA
<213> 人工序列(Unknown)
<400> 36
gcgccgcugg uguagu 16
<210> 37
<211> 30
<212> RNA
<213> 人工序列(Unknown)
<400> 37
gguaaaaugg cugagugaag cauuggacug 30
<210> 38
<211> 26
<212> RNA
<213> 人工序列(Unknown)
<400> 38
gcgccgcugg uguaguggua ucaugc 26
<210> 39
<211> 26
<212> RNA
<213> 人工序列(Unknown)
<400> 39
gguuccauag uguagugguu aucacg 26
<210> 40
<211> 27
<212> RNA
<213> 人工序列(Unknown)
<400> 40
gcgccgcugg uguaguggua ucaugca 27
<210> 41
<211> 20
<212> RNA
<213> 人工序列(Unknown)
<400> 41
guuuccguag uguagugguu 20
<210> 42
<211> 25
<212> RNA
<213> 人工序列(Unknown)
<400> 42
guuuccguag uguagugguu aucac 25
<210> 43
<211> 26
<212> RNA
<213> 人工序列(Unknown)
<400> 43
guuuccguag uguagugguc aucacg 26
<210> 44
<211> 22
<212> RNA
<213> 人工序列(Unknown)
<400> 44
guuuccguag uguagugguu au 22
<210> 45
<211> 26
<212> RNA
<213> 人工序列(Unknown)
<400> 45
gcguuggugg uauagugguu agcaua 26
<210> 46
<211> 24
<212> RNA
<213> 人工序列(Unknown)
<400> 46
gguaaaaugg cugagugaag cauu 24
<210> 47
<211> 23
<212> RNA
<213> 人工序列(Unknown)
<400> 47
gcauuggugg uucaguggua gaa 23
<210> 48
<211> 26
<212> RNA
<213> 人工序列(Unknown)
<400> 48
guuuccguag uguagugguu aucacg 26
<210> 49
<211> 25
<212> RNA
<213> 人工序列(Unknown)
<400> 49
ggccgcgugg ccuaauggau aaggc 25
<210> 50
<211> 20
<212> RNA
<213> 人工序列(Unknown)
<400> 50
guuaagaugg cagagcccgg 20
<210> 51
<211> 26
<212> RNA
<213> 人工序列(Unknown)
<400> 51
gucaggaugg ccgagcgguc uaaggc 26
<210> 52
<211> 22
<212> RNA
<213> 人工序列(Unknown)
<400> 52
gcauuggugg uucaguggua ga 22
<210> 53
<211> 23
<212> RNA
<213> 人工序列(Unknown)
<400> 53
gcguuggugg uauaguggug agc 23
<210> 54
<211> 29
<212> RNA
<213> 人工序列(Unknown)
<400> 54
gguaaaaugg cugagugaag cauuggacu 29
<210> 55
<211> 21
<212> RNA
<213> 人工序列(Unknown)
<400> 55
gguaaaaugg cugagugaag c 21
<210> 56
<211> 15
<212> RNA
<213> 人工序列(Unknown)
<400> 56
guuaagaugg cagag 15
<210> 57
<211> 17
<212> RNA
<213> 人工序列(Unknown)
<400> 57
guuaagaugg cagagcc 17
Claims (3)
1.一种新型分子标记,其特征在于,用于标记肾透明细胞癌组织,根据tRFs表达,肾透明细胞癌肿瘤样本被聚类成3个亚型,这些亚型分别有自己本身特异的tRFs表达模式,它的RNA序列如SEQ ID NO:1~SEQ ID NO:57所示。
2.一种权利要求1所述新型分子标记,其特征在于,它通过以下方法获取:
(1)从GtRNAdb数据库中下载620个tRNA基因注释信息及其序列,在tRNA序列3′端添加“CCA”来获得新组成的CCA-tRNAs的注释和序列信息,然后以CCA-tRNAs序列的5′或者3′端作为起点,得到所有在15~30nt范围内的片段序列,进一步合并相同的序列后,得到8681个来自CCA-tRNAs 5′端的片段序列和9285个来自CCA-tRNAs 3′端的片段序列;利用bedtools工具获得这620个tRNA基因下游50nt的注释和序列信息,即tRNA前体注释和序列信息,然后以tRNA前体序列的5′端为起点,得到所有在15~30nt范围内的片段序列,进一步合并相同的序列后,最终得到15909个来自tRNA前体的片段序列;合计得到由33875个候选的tRNA来源的短片段注释和序列信息构建成的数据库;
(2)在TCGA数据库中下载肾透明细胞癌组织和相应的正常组织的miRNA-seq数据,利用bwa把TCGA样本中的读长比对到步骤(1)所构建的CCA-tRNAs和tRNA前体的注释中,然后计算每个候选的tRNA来源的小片段所对应的读长数目;采用RPM来量化每个候选的tRNA来源的小片段的表达丰度,要求tRFs的表达量必须在10%的样本中大于1RPM;在数据分析前,对所有tRFs的表达值(即RPM值)数据进行log2转换以及上四分位数方法正规化。
(3)对肾透明细胞癌组织及其相邻正常组织中tRFs进行t统计检验,运用Benjamini-Hochberg方法控制多重检验的假阳性;结果显示57个tRFs在肿瘤组织中异常高表达,这57个tRFs的RNA序列如SEQ ID NO:1~SEQ ID NO:57所示。
3.一种检测权利要求1所述分子标记的试剂在制备用于肾透明细胞癌诊断和预后的试剂盒中的应用。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810388509.6A CN108559777B (zh) | 2018-04-26 | 2018-04-26 | 一种新型分子标记及其在制备用于肾透明细胞癌诊断和预后的试剂盒中的应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810388509.6A CN108559777B (zh) | 2018-04-26 | 2018-04-26 | 一种新型分子标记及其在制备用于肾透明细胞癌诊断和预后的试剂盒中的应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108559777A CN108559777A (zh) | 2018-09-21 |
CN108559777B true CN108559777B (zh) | 2020-07-14 |
Family
ID=63537035
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810388509.6A Active CN108559777B (zh) | 2018-04-26 | 2018-04-26 | 一种新型分子标记及其在制备用于肾透明细胞癌诊断和预后的试剂盒中的应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108559777B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109055539A (zh) * | 2018-09-25 | 2018-12-21 | 深圳市人民医院 | 一种分子标记及试剂盒和在IgA肾病中的应用 |
CN110286219A (zh) * | 2019-04-16 | 2019-09-27 | 福建师范大学 | 死亡相关蛋白激酶1在制备肾透明细胞癌术后预后评估试剂盒中的应用 |
CN111944898A (zh) * | 2020-08-04 | 2020-11-17 | 佛山科学技术学院 | 一种特征mRNA表达谱组合及肾透明细胞癌早期预测方法 |
CN113444794B (zh) * | 2021-06-25 | 2023-01-06 | 复旦大学附属肿瘤医院 | 联合基因组在制备肾透明细胞癌预后评估系统中的应用 |
CN118207337B (zh) * | 2024-05-20 | 2024-08-02 | 山东大学齐鲁医院 | 一种与肾癌相关的tRF及其应用 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2544003A1 (en) * | 2011-07-07 | 2013-01-09 | CNIC, Fundacion Centro Nacional de Investigaciones Cardiovasculares Carlos III | Caveolin-1 in tumor-associated fibroblasts as biomarker for tumor progression |
US20150025004A1 (en) * | 2013-02-27 | 2015-01-22 | Meso Scale Technologies, Llc | Kidney function biomarkers |
CN107385083A (zh) * | 2017-08-31 | 2017-11-24 | 北京泱深生物信息技术有限公司 | 一种肾透明细胞癌的诊断标志物及其治疗靶标 |
CN107435074A (zh) * | 2017-08-31 | 2017-12-05 | 北京泱深生物信息技术有限公司 | Ces8基因在肾透明细胞癌诊疗中的应用 |
-
2018
- 2018-04-26 CN CN201810388509.6A patent/CN108559777B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN108559777A (zh) | 2018-09-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108559777B (zh) | 一种新型分子标记及其在制备用于肾透明细胞癌诊断和预后的试剂盒中的应用 | |
ES2882104T3 (es) | Método para determinar el riesgo de desarrollar cáncer de mama mediante detección de los niveles de expresión de microARN (miARN) | |
CN109897899B (zh) | 一种用于局部晚期食管鳞癌预后判断的标志物及其应用 | |
JP2022521492A (ja) | 相同組換え欠損を推定するための統合された機械学習フレームワーク | |
CN105087568B (zh) | 一组用于肿瘤分子分型的基因及其应用 | |
Xu et al. | Development and clinical validation of a novel 9-gene prognostic model based on multi-omics in pancreatic adenocarcinoma | |
CN108021788B (zh) | 基于细胞游离dna的深度测序数据提取生物标记物的方法和装置 | |
CN111128299A (zh) | 一种结直肠癌预后显著相关ceRNA调控网络的构建方法 | |
CN105067822B (zh) | 用于食管癌诊断的标志物 | |
WO2020048518A1 (zh) | 一组用于髓母细胞瘤分子分型的基因及其应用 | |
CN111575376A (zh) | 一组用于评估肾透明细胞癌预后的联合基因组及其应用 | |
CN108048460B (zh) | 一种新型分子标记及其在制备用于头颈癌诊断和预后的试剂盒中的应用 | |
CN115807089B (zh) | 肝细胞肝癌预后生物标志物及应用 | |
JP2023524016A (ja) | 結腸細胞増殖性障害を特定するためのrnaマーカと方法 | |
CN116083584A (zh) | 一组用于评估非小细胞肺癌风险的血浆miRNA标志物及其筛选方法和应用 | |
CN113517073A (zh) | 肺癌手术后生存率预测方法和系统 | |
CN115820860A (zh) | 基于增强子甲基化差异的非小细胞肺癌标志物筛选方法及其标志物和应用 | |
CN107075586B (zh) | 用于鉴定多种癌症类型和亚型的糖基转移酶基因表达谱 | |
CN111028888B (zh) | 一种全基因组拷贝数变异的检测方法及其应用 | |
CN113811621A (zh) | 确定rcc亚型的方法 | |
CN116312800A (zh) | 一种基于血浆中循环rna全转录组测序的肺癌特征识别方法、装置和存储介质 | |
CN110408706A (zh) | 一种评估鼻咽癌复发的生物标志物及其应用 | |
CN116153387A (zh) | 一种肺鳞癌患者总体生存率预后模型及应用 | |
CN116092674A (zh) | 外泌体介导的胃癌总体生存率预后模型及构建方法和应用 | |
Li et al. | Tmem158 may serve as a diagnostic biomarker for anaplastic thyroid carcinoma: an integrated bioinformatic analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |