CN108048460A - 一种新型分子标记及其在制备用于头颈癌诊断和预后的试剂盒中的应用 - Google Patents

一种新型分子标记及其在制备用于头颈癌诊断和预后的试剂盒中的应用 Download PDF

Info

Publication number
CN108048460A
CN108048460A CN201810102540.9A CN201810102540A CN108048460A CN 108048460 A CN108048460 A CN 108048460A CN 201810102540 A CN201810102540 A CN 201810102540A CN 108048460 A CN108048460 A CN 108048460A
Authority
CN
China
Prior art keywords
head
neck cancer
trna
trfs
seq
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810102540.9A
Other languages
English (en)
Other versions
CN108048460B (zh
Inventor
刘鹏渊
孙喜伟
陆燕
周莉媛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN201810102540.9A priority Critical patent/CN108048460B/zh
Publication of CN108048460A publication Critical patent/CN108048460A/zh
Application granted granted Critical
Publication of CN108048460B publication Critical patent/CN108048460B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/112Disease subtyping, staging or classification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Analytical Chemistry (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Physics & Mathematics (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Hospice & Palliative Care (AREA)
  • Biophysics (AREA)
  • Oncology (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了一种新型分子标记及其在制备用于头颈癌诊断和预后的试剂盒中的应用,所述新型分子标记的RNA序列如SEQ ID NO:1~SEQ ID NO:48所示。以本发明标记物为基础,构建头颈癌诊断的数学模型;该模型灵敏度高,特异性好,AUC可高达0.981,诊断效果良好。此外,这48个tRF片段也可以作为头颈癌分型及预测病人生存期的分子标记物;在测试数据中,根据tRFs表达,头颈癌肿瘤样本被聚类成4个亚型,通过生存曲线分析显示这些亚型的生存期存在显著差异;本发明公开的新型的tRF分子标记物具有良好的诊断指标的特性,可以有效用于头颈癌诊断、分型和预后,具有较高的临床使用和推广价值。

Description

一种新型分子标记及其在制备用于头颈癌诊断和预后的试剂 盒中的应用
技术领域
本发明涉及生物检测技术领域,具体涉及一种新型分子标记及其在制备用于头颈癌诊断和预后的试剂盒中的应用。
背景技术
头颈癌包括源于除眼、脑、耳、甲状腺和食道外头颈部任何组织或器官的肿瘤,包括颈部肿瘤、耳鼻喉科肿瘤以及口腔颌面部肿瘤(口腔癌)三大部分。由于超过90%的头颈部肿瘤为鳞状细胞癌,因此头颈癌也被称为是头颈部鳞状细胞癌(head and necksquamous cell carcinomas,HNSC)。头颈癌是中国乃至全球癌症谱高发恶性肿瘤,在常见肿瘤中位于第6位,恶性程度高,平均5年生存率不足50%,是影响人们生命健康和生活质量最严重的癌症之一。经过过去几十年的发展,手术、放疗及化疗并没有显著提高头颈癌患者的5年存活率,并且由于解剖部位特殊,头颈癌手术治疗切除范围严重受限,治疗后患者的生活质量普遍下降,常造成毁容或残障。近来,随着各组学技术和生物信息学分析技术的飞速发展,结合前期研究结果,头颈癌成为国际公认的实施精准医疗指导的分子分型研究的最理想疾病模型之一。筛选验证有效的头颈癌分析分型标志物和分子谱型将有助于推动将头颈癌的疾病分类从宏观形态学转向以分子特征为基础的新的分类体系,该种分类方法对临床治疗有明确指导意义,最终实现对于患者的个体化“精准治疗”,大幅度提高患者生存率和生存质量。
生物标记物是指能将机体的生理和疾病状态区分开来的生物分子,筛选到可用于疾病早期发现、早期诊断的生物标志物可大大提高患者的临床治疗效果。tRNA是一类生物体中非常重要的非编码RNA,主要功能是转运氨基酸、参与蛋白合成。最近研究发现tRNA在各种逆境下会发生降解,产生20-40bp的小RNA片段,称为tRNA-derived RNA fragments,简称tRF。本研究团队最新数据显示肿瘤组织普遍具有特征性的tRF表达谱,即指肿瘤细胞中某些tRF的表达水平异常,而这种异常的特征性tRF可以成为用于肿瘤或疾病的诊断,病理分级,临床分期,治疗与预后的生物标志物,显示了较好的临床应用前景。我们分析了TCGA数据库中525例头颈癌测序数据,首次发现了头颈癌肿瘤组织中存在大量这种tRF片段,该种新型的分子标记物将有望成为头颈癌诊断筛查及分型预后效果预测的重要手段。
发明内容
本发明的目的在于针对现有技术的不足,提供一种新型分子标记及其在制备用于头颈癌诊断和预后的试剂盒中的应用。
本发明的目的是通过以下技术方案来实现的,一种新型分子标记,它的RNA序列如SEQ ID NO:1~SEQ ID NO:48所示。
进一步地,它通过以下方法获取:
(1)从GtRNAdb数据库中下载620个tRNA基因注释信息及其序列,在tRNA序列3′端添加“CCA”来获得新组成的CCA-tRNAs的注释和序列信息,然后以CCA-tRNAs序列的5′或者3′端作为起点,得到所有在15~30nt范围内的片段序列,进一步合并相同的序列后,得到8681个来自CCA-tRNAs 5′端的片段序列和9285个来自CCA-tRNAs 3′端的片段序列;利用bedtools工具获得这620个tRNA基因下游50nt的注释和序列信息,即tRNA前体注释和序列信息,然后以tRNA前体序列的5′端为起点,得到所有在15~30nt范围内的片段序列,进一步合并相同的序列后,最终得到15909个来自tRNA前体的片段序列;合计得到由33875个候选的tRNA来源的短片段注释和序列信息构建成的数据库。
(2)在TCGA数据库中下载头颈癌肿瘤组织和相应的正常组织的miRNA-seq数据,利用bwa把TCGA样本中的读长比对到步骤1所构建的CCA-tRNAs和tRNA前体的注释中,然后计算每个候选的tRNA来源的小片段所对应的读长数目;采用RPM来量化每个候选的tRNA来源的小片段的表达丰度,要求tRFs的表达量必须在10%的样本中大于1RPM;在数据分析前,对所有tRFs的表达值(即RPM值)数据进行log2转换以及上四分位数方法正规化。
(3)对头颈癌肿瘤组织及其相邻正常组织中tRFs进行t统计检验,运用Benjamini-Hochberg方法控制多重检验的假阳性;结果显示48个tRFs在肿瘤组织中异常高表达,这48个tRFs的RNA序列如SEQ ID NO:1~SEQ ID NO:48所示。
本发明还提供了一种上述分子标记在制备用于头颈癌诊断和预后的试剂盒中的应用。
本发明的有益效果是:以本发明标记物为基础,构建头颈癌诊断的数学模型;该模型灵敏度高,特异性好,AUC可高达0.981,诊断效果良好。此外,这48个tRF片段也可以作为头颈癌分型及预测病人生存期的分子标记物;在测试数据中,根据tRFs表达,头颈癌肿瘤样本被聚类成4个亚型,这些亚型分别有自己本身特异的tRFs表达模式,通过生存曲线分析显示这些亚型的生存期存在显著差异(P<0.001)。综上所述,本发明公开的新型的tRF分子标记物具有良好的诊断指标的特性,可以有效用于头颈癌诊断、分型和预后,具有较高的临床使用和推广价值。
附图说明
图1是本发明一个tRF片段在头颈癌肿瘤组织和正常组织差异表达图,其中,(a)为正常样本和肿瘤样本中总tRF表达丰度的累积密度分布图,(b)为显著差异表达的tRF的火山图,(c)为一个tRF,即M5-tRNA-Arg-TCT-5-1,在10对独立的头颈癌组织样本中的验证结果图,(d)为一个在口腔癌异常高表达的tRF5-1(P=7.59×10-5)的实验验证图。
图2是本发明一个评估tRF片段作为头颈癌诊断的分子标记物的具体实施流程图和诊断效果图,其中,(a)为用于评价本发明鉴别的48个tRF分子标记在头颈癌诊断效果的诊断流程图,(b)为本发明鉴别的48个tRF分子标记分别在4个构建的数学模型(随机森林(RF)、支持向量机(SVM)、广义线性模型(GLM)和局部最小二乘(PLS))里的受试者工作特征曲线图(简称ROC曲线);
图3是本发明一个评估tRF片段作为头颈癌预后的分子标记物的肿瘤分型图和生存曲线图。
具体实施方式
下面通过具体实施例对本发明作进一步阐述,应该说明的是,下述说明仅是为了解释本发明,并不对其内容进行限定。
本发明分子标记的获取方法如下:
1、从GtRNAdb(http://gtrnadb.ucsc.edu/genomes/eukaryota/Hsapi19)数据库中下载620个tRNA基因注释信息及其序列。通过在成熟tRNA序列3′端添加“CCA”来获得新组成的CCA-tRNAs的注释和序列信息。然后以CCA-tRNAs序列的5′或者3′端作为起点,得到所有在15~30nt范围内的片段序列,进一步合并相同的序列后,最终得到8681个来自CCA-tRNAs 5′端的片段序列和9285个来自CCA-tRNAs 3′端的片段序列。此外,我们利用bedtools工具获得这620个tRNA基因下游50nt的注释和序列信息,即tRNA前体注释和序列信息。然后以tRNA前体序列的5′端为起点,得到所有在15~30nt范围内的片段序列,进一步合并相同的序列后,最终得到15909个来自tRNA前体的片段序列。这样我们总共得到由33875个候选的tRNA来源的短片段注释和序列信息构建成的数据库。
2、在TCGA数据库(https://cancergenome.nih.gov/)中下载525例头颈癌肿瘤组织和相应的44例正常组织的miRNA-seq数据。首先,我们利用bwa再次把TCGA样本中的读长比对到我们前面所构建的CCA-tRNAs和tRNA前体的注释中,不允许有错配的碱基。然后计算每个候选的tRNA来源的小片段所对应的读长数目。在miRNA的表达分析中,研究者常使用RPM(Reads Per Million total mapped reads,公式为:单个miRNA读长数×106/比对到参考基因组的总读长数)来校准miRNA的表达量。我们也采用RPM来量化每个候选的tRNA来源的小片段的表达丰度。此外,为了得到可靠的tRNA来源的短片段,我门要求tRFs的表达量必须在10%的样本中大于1RPM。在数据分析前,对所有tRFs的表达值(即RPM值)数据进行log2转换以及上四分位数方法正规化(upper quartile normalization)。
3、为鉴定肿瘤组织中异常表达的tRFs,我们对头颈癌肿瘤组织及其相邻正常组织中tRFs进行t统计检验。我们并且运用Benjamini-Hochberg方法控制多重检验的假阳性(FDR,false discovery rate)。结果显示48个tRFs在肿瘤组织中异常高表达,这48个tRFs的RNA序列如SEQ ID NO:1~SEQ ID NO:48所示;利用上海交通大学附属第九人民医院口腔癌组织库,我们实验验证了其中一个在口腔癌异常高表达的tRF5-1(P=7.59×10-5)。
图1是本发明一个tRF片段在头颈癌肿瘤组织和正常组织差异表达图,其中,(a)为正常样本和肿瘤样本中总tRF表达丰度的累积密度分布图。从图中可以看出,与正常样本相比较,肿瘤样本中总tRF丰度显著富集。(b)为显著差异表达的tRF的火山图。从图中可以看出,48个tRF在肿瘤中显著表达上升(图1(b)右侧),10个tRF显著表达降低(图1(b)左侧)。(c)为一个tRF,即M5-tRNA-Arg-TCT-5-1,在10对独立的头颈癌组织样本中的验证结果,纵轴表示与正常样本比较,tRF在肿瘤样本中表达改变量。(d)为我们实验验证的其中一个在口腔癌异常高表达的tRF5-1(P=7.59×10-5)。
4、随机将TCGA中525例头颈癌肿瘤样本分成训练组(80%)和检验组(20%),采用随机森林(RF)、支持向量机(SVM)、广义线性模型(GLM)和局部最小二乘(PLS)四种方法构建头颈癌诊断的数学模型,构建的模型的诊断头颈癌的敏感性和特异性高达93.4-98.1%。
图2是本发明一个评估tRF片段作为头颈癌诊断的分子标记物的具体实施流程图和诊断效果图,其中,(a)为用于评价我们鉴别的48个tRF分子标记在头颈癌诊断效果的诊断流程图,(b)为我们鉴别的48个tRF分子标记分别在4个构建的数学模型(随机森林(RF)、支持向量机(SVM)、广义线性模型(GLM)和局部最小二乘(PLS)里的受试者工作特征曲线图(简称ROC曲线),用于评价他们对头颈癌诊断效果的敏感性和特异性。
5、为研究头颈癌组织中tRFs表达的不同模式以及鉴定不同的亚型,我们对发现的tRFs进行聚类分析。我们采用了非负矩阵分解聚类(Nonnegative matrix factorizationclustering)进行样本聚类分析,得到4个头颈癌肿瘤亚型,这些亚型分别有自己本身特异的tRFs表达模式。当tRFs亚型选定后,采用Kaplan—Meier方法计算不同亚型的生存曲线,并采用对数序(log rank)检验不同亚型中病人的生存期差异的显著性,结果显示这4个头颈癌肿瘤亚型的生存期存在显著差异(P<0.001)。
图3是本发明一个评估tRF片段作为头颈癌预后的分子标记物的肿瘤分型图和生存曲线图,从图中可以看出,4类亚型预后差异明显,其中3类亚型预后最好,其次是4和1类亚型,2类亚型预后最差。
序列表
<110> 浙江大学
<120> 一种新型分子标记及其在制备用于头颈癌诊断和预后的试剂盒中的应用
<160> 48
<170> SIPOSequenceListing 1.0
<210> 1
<211> 19
<212> RNA
<213> 人工序列(Unknown)
<400> 1
ggccgcgugg ccuaaugga 19
<210> 2
<211> 25
<212> RNA
<213> 人工序列(Unknown)
<400> 2
ggccgcgugg ccuaauggau aaggc 25
<210> 3
<211> 19
<212> RNA
<213> 人工序列(Unknown)
<400> 3
ggcucugugg cgcaaugga 19
<210> 4
<211> 24
<212> RNA
<213> 人工序列(Unknown)
<400> 4
ggggguauag cucaguggua gagc 24
<210> 5
<211> 29
<212> RNA
<213> 人工序列(Unknown)
<400> 5
ggggguauag cucaguggua gagcauuug 29
<210> 6
<211> 29
<212> RNA
<213> 人工序列(Unknown)
<400> 6
ggggguauag cucaggggua gagcauuug 29
<210> 7
<211> 23
<212> RNA
<213> 人工序列(Unknown)
<400> 7
gguuccaugg uguaaugguu agc 23
<210> 8
<211> 29
<212> RNA
<213> 人工序列(Unknown)
<400> 8
gguuccaugg uguaaugguu agcacucug 29
<210> 9
<211> 30
<212> RNA
<213> 人工序列(Unknown)
<400> 9
ggucccaugg uguaaugguu agcacucugg 30
<210> 10
<211> 23
<212> RNA
<213> 人工序列(Unknown)
<400> 10
ucccuggugg ucuagugguu agg 23
<210> 11
<211> 26
<212> RNA
<213> 人工序列(Unknown)
<400> 11
ucccuggugg ucuagugguu aggauu 26
<210> 12
<211> 26
<212> RNA
<213> 人工序列(Unknown)
<400> 12
ucccacaugg ucuagcgguu aggauu 26
<210> 13
<211> 23
<212> RNA
<213> 人工序列(Unknown)
<400> 13
gcaugggugg uucaguggua gaa 23
<210> 14
<211> 29
<212> RNA
<213> 人工序列(Unknown)
<400> 14
gcaugggugg uucaguggua gaauucucg 29
<210> 15
<211> 30
<212> RNA
<213> 人工序列(Unknown)
<400> 15
gcaugggugg uucaguggua gaauucucgc 30
<210> 16
<211> 23
<212> RNA
<213> 人工序列(Unknown)
<400> 16
gcguuggugg uauaguggug agc 23
<210> 17
<211> 26
<212> RNA
<213> 人工序列(Unknown)
<400> 17
gucaggaugg ccgagcgguc uaaggc 26
<210> 18
<211> 20
<212> RNA
<213> 人工序列(Unknown)
<400> 18
gguagcgugg ccgagcgguc 20
<210> 19
<211> 21
<212> RNA
<213> 人工序列(Unknown)
<400> 19
gguagcgugg ccgagcgguc u 21
<210> 20
<211> 22
<212> RNA
<213> 人工序列(Unknown)
<400> 20
gguagcgugg ccgagcgguc ua 22
<210> 21
<211> 24
<212> RNA
<213> 人工序列(Unknown)
<400> 21
gguagcgugg ccgagcgguc uaag 24
<210> 22
<211> 25
<212> RNA
<213> 人工序列(Unknown)
<400> 22
gguagcgugg ccgagcgguc uaagg 25
<210> 23
<211> 26
<212> RNA
<213> 人工序列(Unknown)
<400> 23
gguagcgugg ccgagcgguc uaaggc 26
<210> 24
<211> 29
<212> RNA
<213> 人工序列(Unknown)
<400> 24
gguagcgugg ccgagcgguc uaaggcgcu 29
<210> 25
<211> 30
<212> RNA
<213> 人工序列(Unknown)
<400> 25
gcccggauag cucagucggu agagcaucag 30
<210> 26
<211> 25
<212> RNA
<213> 人工序列(Unknown)
<400> 26
ggcucguugg ucuaggggua ugauu 25
<210> 27
<211> 30
<212> RNA
<213> 人工序列(Unknown)
<400> 27
ggcucguugg ucuaggggua ugauucucgc 30
<210> 28
<211> 24
<212> RNA
<213> 人工序列(Unknown)
<400> 28
guagucgugg ccgagugguu aagg 24
<210> 29
<211> 25
<212> RNA
<213> 人工序列(Unknown)
<400> 29
guagucgugg ccgagugguu aaggc 25
<210> 30
<211> 24
<212> RNA
<213> 人工序列(Unknown)
<400> 30
ggcgcggugg ccaaguggua aggc 24
<210> 31
<211> 25
<212> RNA
<213> 人工序列(Unknown)
<400> 31
ccuucgauag cucaguuggu agagc 25
<210> 32
<211> 23
<212> RNA
<213> 人工序列(Unknown)
<400> 32
ccuucgauag cucagcuggu aga 23
<210> 33
<211> 25
<212> RNA
<213> 人工序列(Unknown)
<400> 33
ccuucgauag cucagcuggu agagc 25
<210> 34
<211> 23
<212> RNA
<213> 人工序列(Unknown)
<400> 34
guuuccguag uguagugguu auc 23
<210> 35
<211> 30
<212> RNA
<213> 人工序列(Unknown)
<400> 35
guuuccguag uguagugguu aucacguucg 30
<210> 36
<211> 20
<212> RNA
<213> 人工序列(Unknown)
<400> 36
guuuccguag uguagugguu 20
<210> 37
<211> 30
<212> RNA
<213> 人工序列(Unknown)
<400> 37
gguuccauag uguagugguu aucacgucug 30
<210> 38
<211> 20
<212> RNA
<213> 人工序列(Unknown)
<400> 38
gguuccauag uguagugguu 20
<210> 39
<211> 19
<212> RNA
<213> 人工序列(Unknown)
<400> 39
ggcuccgugg cgcaaugga 19
<210> 40
<211> 19
<212> RNA
<213> 人工序列(Unknown)
<400> 40
gucucugugg cgcaaugga 19
<210> 41
<211> 20
<212> RNA
<213> 人工序列(Unknown)
<400> 41
gucucugugg cgcaauggac 20
<210> 42
<211> 30
<212> RNA
<213> 人工序列(Unknown)
<400> 42
ggggguauag cucagugggu agagcauuug 30
<210> 43
<211> 26
<212> RNA
<213> 人工序列(Unknown)
<400> 43
gguagcgugg ccgagugguc uaaggc 26
<210> 44
<211> 20
<212> RNA
<213> 人工序列(Unknown)
<400> 44
guuuccguag uguagugguc 20
<210> 45
<211> 23
<212> RNA
<213> 人工序列(Unknown)
<400> 45
guuuccguag uguagugguc auc 23
<210> 46
<211> 20
<212> RNA
<213> 人工序列(Unknown)
<400> 46
gcuucuguag uguagugguu 20
<210> 47
<211> 20
<212> RNA
<213> 人工序列(Unknown)
<400> 47
gguuccauag uguagcgguu 20
<210> 48
<211> 30
<212> RNA
<213> 人工序列(Unknown)
<400> 48
gguuccauag uguagcgguu aucacgucug 30

Claims (5)

1.一种新型分子标记,其特征在于,它的RNA序列如SEQ ID NO:1~SEQ ID NO:48所示。
2.一种权利要求1所述新型分子标记,其特征在于,它通过以下方法获取:
(1)从GtRNAdb数据库中下载620个tRNA基因注释信息及其序列,在tRNA序列3′端添加“CCA”来获得新组成的CCA-tRNAs的注释和序列信息,然后以CCA-tRNAs序列的5′或者3′端作为起点,得到所有在15~30nt范围内的片段序列,进一步合并相同的序列后,得到8681个来自CCA-tRNAs 5′端的片段序列和9285个来自CCA-tRNAs 3′端的片段序列;利用bedtools工具获得这620个tRNA基因下游50nt的注释和序列信息,即tRNA前体注释和序列信息,然后以tRNA前体序列的5′端为起点,得到所有在15~30nt范围内的片段序列,进一步合并相同的序列后,最终得到15909个来自tRNA前体的片段序列;合计得到由33875个候选的tRNA来源的短片段注释和序列信息构建成的数据库。
(2)在TCGA数据库中下载头颈癌肿瘤组织和相应的正常组织的miRNA-seq数据,利用bwa把TCGA样本中的读长比对到步骤1所构建的CCA-tRNAs和tRNA前体的注释中,然后计算每个候选的tRNA来源的小片段所对应的读长数目;采用RPM来量化每个候选的tRNA来源的小片段的表达丰度,要求tRFs的表达量必须在10%的样本中大于1RPM;在数据分析前,对所有tRFs的表达值(即RPM值)数据进行log2转换以及上四分位数方法正规化。
(3)对头颈癌肿瘤组织及其相邻正常组织中tRFs进行t统计检验,运用Benjamini-Hochberg方法控制多重检验的假阳性;结果显示48个tRFs在肿瘤组织中异常高表达,这48个tRFs的RNA序列如SEQ ID NO:1~SEQ ID NO:48所示。
3.一种权利要求1所述分子标记在制备用于头颈癌诊断和预后的试剂盒中的应用。
4.根据权利要求3所述的应用,其特征在于,采用非负矩阵分解聚类对这48个tRFs的RNA序列进行样本聚类分析,得到4个头颈癌肿瘤亚型,这些亚型分别有自己本身特异的tRFs表达模式;当tRFs亚型选定后,采用Kaplan—Meier方法计算不同亚型的生存曲线,并采用对数序检验不同亚型中病人的生存期差异的显著性,结果显示这4个头颈癌肿瘤亚型的生存期存在显著差异。
5.根据权利要求3所述的应用,其特征在于,以SEQ ID NO:1~SEQ ID NO:48所示的48个tRFs为基础,构建头颈癌诊断的数学模型;该模型灵敏度高,特异性好,AUC可高达0.981,诊断效果良好。
CN201810102540.9A 2018-02-01 2018-02-01 一种新型分子标记及其在制备用于头颈癌诊断和预后的试剂盒中的应用 Active CN108048460B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810102540.9A CN108048460B (zh) 2018-02-01 2018-02-01 一种新型分子标记及其在制备用于头颈癌诊断和预后的试剂盒中的应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810102540.9A CN108048460B (zh) 2018-02-01 2018-02-01 一种新型分子标记及其在制备用于头颈癌诊断和预后的试剂盒中的应用

Publications (2)

Publication Number Publication Date
CN108048460A true CN108048460A (zh) 2018-05-18
CN108048460B CN108048460B (zh) 2021-04-09

Family

ID=62125635

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810102540.9A Active CN108048460B (zh) 2018-02-01 2018-02-01 一种新型分子标记及其在制备用于头颈癌诊断和预后的试剂盒中的应用

Country Status (1)

Country Link
CN (1) CN108048460B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109055539A (zh) * 2018-09-25 2018-12-21 深圳市人民医院 一种分子标记及试剂盒和在IgA肾病中的应用
CN109207581A (zh) * 2018-09-25 2019-01-15 深圳市人民医院 一种自身免疫性疾病诊断试剂盒和应用
CN111778335A (zh) * 2020-07-17 2020-10-16 王延博 用于检测胰腺癌的癌组织和癌旁组织的tsRNA标志物、探针及其应用
CN111826444A (zh) * 2020-07-17 2020-10-27 南京大学 一种与胰腺癌相关的血清/血浆tsRNA标志物、探针及其应用

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014031631A1 (en) * 2012-08-20 2014-02-27 University Of Virginia Patent Foundation Compositions and methods for using transfer rna fragments as biomarkers for cancer
CN103874770A (zh) * 2011-08-08 2014-06-18 卡里斯生命科学卢森堡控股有限责任公司 生物标志物组合物和方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103874770A (zh) * 2011-08-08 2014-06-18 卡里斯生命科学卢森堡控股有限责任公司 生物标志物组合物和方法
WO2014031631A1 (en) * 2012-08-20 2014-02-27 University Of Virginia Patent Foundation Compositions and methods for using transfer rna fragments as biomarkers for cancer

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
MICHAEL OLVEDY: "A comprehensive repertoire of tRNA-derived fragments in prostate cancer", 《ONCOTARGET》 *
YUKA HIROSE等: "Precise mapping and dynamics of tRNA-derived fragments (tRFs) in the development of Triops cancriformis (tadpole shrimp)", 《BMC GENET》 *
朱林文等: "tRNA衍生片段和tRNA半分子的生物学功能及其在疾病发生中的作用", 《生物化学与生物物理进展》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109055539A (zh) * 2018-09-25 2018-12-21 深圳市人民医院 一种分子标记及试剂盒和在IgA肾病中的应用
CN109207581A (zh) * 2018-09-25 2019-01-15 深圳市人民医院 一种自身免疫性疾病诊断试剂盒和应用
CN111778335A (zh) * 2020-07-17 2020-10-16 王延博 用于检测胰腺癌的癌组织和癌旁组织的tsRNA标志物、探针及其应用
CN111826444A (zh) * 2020-07-17 2020-10-27 南京大学 一种与胰腺癌相关的血清/血浆tsRNA标志物、探针及其应用

Also Published As

Publication number Publication date
CN108048460B (zh) 2021-04-09

Similar Documents

Publication Publication Date Title
CN108048460A (zh) 一种新型分子标记及其在制备用于头颈癌诊断和预后的试剂盒中的应用
CN110706749B (zh) 一种基于组织器官分化层次关系的癌症类型预测系统和方法
Shan et al. Machine learning predicts lymph node metastasis in early-stage oral tongue squamous cell carcinoma
CN109830264B (zh) 肿瘤患者基于甲基化位点进行分类的方法
Aghamaleki et al. Application of an artificial neural network in the diagnosis of chronic lymphocytic leukemia
CN114891887A (zh) 一种三阴性乳腺癌预后基因标志物筛选的方法
CN108559777B (zh) 一种新型分子标记及其在制备用于肾透明细胞癌诊断和预后的试剂盒中的应用
JP2023524016A (ja) 結腸細胞増殖性障害を特定するためのrnaマーカと方法
CN114203256B (zh) 基于微生物丰度的mibc分型及预后预测模型构建方法
Ni et al. Development and evaluation of nomograms to predict the cancer-specific mortality and overall mortality of patients with hepatocellular carcinoma
CN111748633A (zh) 一种特征miRNA表达谱组合及头颈鳞状细胞癌早期预测方法
CN116083584A (zh) 一组用于评估非小细胞肺癌风险的血浆miRNA标志物及其筛选方法和应用
CN107075586B (zh) 用于鉴定多种癌症类型和亚型的糖基转移酶基因表达谱
CN108546761B (zh) 一种用于口腔鳞癌淋巴结转移预测的检测试剂盒
Hasenleithner et al. How to detect cancer early using cell-free DNA
US20220042106A1 (en) Systems and methods of using cell-free nucleic acids to tailor cancer treatment
CN114107515B (zh) 早期胃癌预后差异基因与复发预测模型
CN115820860A (zh) 基于增强子甲基化差异的非小细胞肺癌标志物筛选方法及其标志物和应用
CN111961716B (zh) 一种急性胰腺炎预后标志物、急性胰腺炎预后预测模型及其应用
CN108588218A (zh) 一种血清miRNA组合的微创检测试剂盒
CN114171200A (zh) Ptc预后标志物及其应用、ptc的预后评估模型的构建方法
CN111733252A (zh) 一种特征miRNA表达谱组合及胃癌早期预测方法
MXPA06005404A (es) Prediccion de cancer en el tracto aerodigestivo superior.
Xi et al. Four potential prognostic markers for breast cancer identified by hybrid gene and module expression analysis
CN117373541A (zh) 基于cfDNA甲基化的癌症组织溯源的系统和方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant