CN108707663A - 用于癌症样本miRNA测序定量结果评价的试剂、制备方法和应用 - Google Patents

用于癌症样本miRNA测序定量结果评价的试剂、制备方法和应用 Download PDF

Info

Publication number
CN108707663A
CN108707663A CN201810356012.6A CN201810356012A CN108707663A CN 108707663 A CN108707663 A CN 108707663A CN 201810356012 A CN201810356012 A CN 201810356012A CN 108707663 A CN108707663 A CN 108707663A
Authority
CN
China
Prior art keywords
rna
mirna
seq
sample
short
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810356012.6A
Other languages
English (en)
Other versions
CN108707663B (zh
Inventor
宗亮
丁芬
姚秋林
田志坚
唐美芳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BGI Shenzhen Co Ltd
BGI Genomics Co Ltd
Original Assignee
BGI Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BGI Shenzhen Co Ltd filed Critical BGI Shenzhen Co Ltd
Priority to CN201810356012.6A priority Critical patent/CN108707663B/zh
Publication of CN108707663A publication Critical patent/CN108707663A/zh
Application granted granted Critical
Publication of CN108707663B publication Critical patent/CN108707663B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/178Oligonucleotides characterized by their use miRNA, siRNA or ncRNA

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Analytical Chemistry (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Physics & Mathematics (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Hospice & Palliative Care (AREA)
  • Biophysics (AREA)
  • Oncology (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本申请公开了一种用于癌症样本miRNA测序定量结果评价的试剂及其制备方法和应用。本申请的试剂包括SEQ ID NO.1至SEQ ID NO.8所示序列的RNA中的至少一种。本申请的试剂,将其定量的加入待测RNA样品中,并通过测序定量分析所加入的试剂的量,将定量分析结果与实际加入量进行比较,以此评价整个miRNA测序定量结果的准确性和可靠性;该方法简便、易用,能够有效的评价miRNA测序定量结果的可信度。本申请的试剂各方面特性都与真实的miRNA十分接近,因此,采用本申请的试剂能够更真实、准确、可靠的反映人源miRNA测序定量结果的实际情况,从而对癌症样本miRNA测序定量结果作出更准确、可靠的评价。

Description

用于癌症样本miRNA测序定量结果评价的试剂、制备方法和 应用
技术领域
本申请涉及miRNA测序定量检测领域,特别是涉及一种用于癌症样本miRNA测序定量结果评价的试剂及其制备方法应用。
背景技术
Small RNA是生物体内一类重要的功能分子,通过各种序列特异性的基因沉默作用,调控诸如细胞生长发育、应激反应、沉默转座子等各种各样的细胞生理过程。
Small RNA测序则是借助新一代高通量测序技术,对某物种某组织在特定状态下的18-30nt的small RNA进行高通量测序。继而通过数据库比对,对获得的small RNA序列进行分析、鉴定,将数百万条small RNA序列分类成rRNA、tRNA、snRNA、snoRNA和miRNA等。
成熟的miRNA通过翻译抑制或增强mRNA降解来调控基因表达。许多miRNA都位于不同类型癌症中删除或扩增的基因组区域,在大部分癌症类型中都观察到miRNA表达水平的整体下降。癌症研究中miRNA的研究大致可分为两大类:第一类是发现癌症发展中起作用的miRNA并注释功能;第二类是miRNA作为癌症检测和分期标志物的潜在应用研究,以此改善癌症的诊断和治疗。
容易测定、相对稳定、对mRNA具有调控作用,这些特点让miRNA有潜力成为癌症的标志物,但任何新发现的候选miRNA想要成为合格的生物标志物,都还有很长的路要走。迄今为止,miRNA作为生物标志物的研究仍处于生物标志物发现的极早期阶段,因此,评价miRNA测序数据的真实性和准确性就显得尤为重要。
随着高通量测序技术的普及和发展,small RNA文库的制备和测序已成为常规实验方法。但值得注意的是,其定量结果的可靠性一直广受质疑。从获得生物学样本到RNA的提取、建库和测序,miRNA经历了复杂的处理过程,这些处理过程都有可能为最终的测序结果引入相应偏差,直接影响分析结果的准确性。
2014年,Pieter Mestdagh等研究人员曾撰文讨论,认为miRNA测序结果可重复性较差,且不同的建库方法有可能导致分析结果出现显著差异。因此,亟需引入一种实验方法对miRNA测序结果进行客观评估,从而指导实验人员确认分析结果的准确性和可靠性。
现阶段,没有任何成熟的技术对miRNA测序结果给出快速、客观的评价。在癌症相关研究中,一般要求实验应当包含足够数量的样品,以建立统计学可信度;即通过测序分析获得差异表达的miRNA后,通常需要大量患者样本来检验此结果,以此建立统计学可信度。现有的评估方案在应用中存在多种局限。无法对测序数据提供实时的评价,且需要耗费大量实验资源和时间。目前对于在测序研究中建立统计学可信度和多重检验纠正,还没有公认的方法。
发明内容
本申请的目的是提供一种新的用于癌症样本miRNA测序定量结果评价的试剂,该试剂的制备方法,以及该试剂的应用。
本申请具体采用了以下技术方案:
本申请一方面公开了一种用于癌症样本miRNA测序定量结果评价的试剂,该试剂包括SEQ ID NO.1至SEQ ID NO.8所示序列的RNA中的至少一种;
SEQ ID NO.1:5’-GAGCCAUGCAUUAUAUGCCAG-3’
SEQ ID NO.2:5’-UAUGCCAGAAGUCUCACGGCC-3’
SEQ ID NO.3:5’-CCUAACGUGCCUAUGCGCAGAA-3’
SEQ ID NO.4:5’-UGCGCAGACAUAAAAGCGAU-3’
SEQ ID NO.5:5’-AAGCGAUUACGACAUUAGGAU-3’
SEQ ID NO.6:5’-AUGUGAAUGACCGGUACCCA-3’
SEQ ID NO.7:5’-GUACCCAUGUGAAGAUCGCGCU-3’
SEQ ID NO.8:5’-UAUUGAUCGCGCUGAGCCAUG-3’。
需要说明的是,本申请的试剂在使用时,将其作为外源的已知序列的small RNA(Small RNA Spike-in mix,缩写SRS)定量的加入待测RNA样品中,与待测RNA样品一起进行建库和测序,通过测序定量检测所添加的SRS量,与实际加入的SRS量进行比较,从而分析判断miRNA测序定量检测结果与实际含量之间的差距,以此评价癌症样本miRNA测序定量结果。
还需要说明的是,本申请的试剂中,SEQ ID NO.1至SEQ ID NO.8所示序列的RNA都是经过严格筛选和设计的RNA短序列,这些序列的特性,例如长度、GC%分布、最低自由能MFE以及首位及末位碱基分布等,都与真实miRNA十分接近,因此,基于外源SRS的测序定量结果评价能够真实、准确、可靠的反映人源miRNA测序定量结果的实际情况,从而对癌症样本miRNA测序定量结果作出准确的评价。
本申请的另一面公开了本申请的试剂的制备方法,包括以下步骤,
(1)从miRNA公共数据库中导出人源miRNA的所有序列,统计其长度分布和GC%分布;
(2)随机生成一系列设定长度的RNA短序列,并从随机生成的RNA短序列中筛选出长度分布和GC%分布分别落在步骤(1)统计的长度分布和GC%分布统计值上下四分位数间的RNA序列,作为第一短序列集合;
(3)将第一短序列集合中的所有RNA序列分别与人类基因组和miRNA公共数据库进行比对,将能够比对匹配上的RNA序列删除,剩余的RNA序列作为第二短序列集合;需要说明的是,该步骤的目的是删除随机RNA短序列与人类基因组或者miRNA公共数据库中重合的RNA序列,确保随机RNA短序列的唯一性,以保障其作为外源RNA引入待测RNA样品的理论含量,即保障加入的外源RNA的量的准确性;
(4)计算步骤(1)导出的人源miRNA所有序列的最低自由能MFE,并统计MFE分布;
(5)计算步骤(3)获得的第二短序列集合中所有RNA序列的MFE,并筛选出RNA序列的MFE落在步骤(4)统计的人源miRNA的MFE统计值上下四分位数间的RNA序列,作为第三短序列集合;
(6)统计步骤(1)导出的人源miRNA所有序列的首位及末位碱基分布,统计第三短序列集合中所有RNA序列的首位及末位碱基分布,并筛选出RNA序列的首位及末位碱基分布与人源miRNA的首位及末位碱基分布一致的RNA序列,即获得SEQ ID NO.1至SEQ ID NO.8所示序列的RNA,合成筛选获得的随机RNA即得到本申请的试剂。
需要说明的是,本申请的试剂主要是用于评价癌症样本miRNA测序定量结果,因此,在设计时尽可能使试剂中各随机RNA短序列尽量的与真实的miRNA相近似,例如长度、GC%分布、最低自由能MFE以及首位及末位碱基分布等,这样才能使随机RNA短序列尽可能真实的模拟并反映人源miRNA的实际情况。
还需要说明的是,研究证实,首位及末位碱基分布会影响small RNA文库构建时,接头连接的效率,从而对测序数据产生偏向。因此,本申请的制备方法中,对作为SRS的随机合成RNA序列的首位及末位碱基分布进行了筛选,即步骤(6),使其尽量符合人源miRNA的首位及末位碱基分布。实际上,本申请的制备方法中,所有步骤的筛选,其目的都是一致的,即使得最终获得的作为SRS的随机合成RNA序列能够更真实的模拟人源miRNA,从而使得SRS的整个建库、测序过程与真实的人源miRNA更接近,进而达到准确评价癌症样本miRNA测序定量结果的目的。
优选的,本申请的试剂的制备方法中,其步骤(2)中,设定长度为20-22nt。
需要说明的是,设定长度一般是能够涵盖大部分人源miRNA的长度范围,但是,设定长度范围越大,随机生成的RNA量越大,后续筛选的计算量也越大,因此,为方便后续的筛选,本申请的一种优选方案中设定长度为20-22nt。
优选的,本申请的试剂的制备方法中,其步骤(1)中,miRNA公共数据库为miRBase数据库。
需要说明的是,miRBase数据库是目前比较完善的miRNA公共数据库,不排除还可以采用其它数据库,又或者在这些数据库的基础上进一步添加一些本地数据,使得最终筛选获得的随机RNA与实际样本的miRNA的特性更接近。
优选的,本申请的试剂的制备方法中,其步骤(4)和步骤(5)中,MFE采用RNAfold计算。
需要说明的是,RNAfold是已经存在的软件,经常用于预测miRNA与靶基因的互相作用;本申请用于预测人源miRNA的二级结构,并计算人源miRNA的MFE值,同时对随机RNA短序列的二级结构和MFE值进行预测和计算,筛选MFE值落在人源miRNA的MFE统计值上下四分位数间的随机RNA序列,作为本申请的SRS,用于癌症样本miRNA测序定量结果评价。本申请创造性的采用RNAfold进行MFE值计算,并以此进行筛选,使得筛选获得的SRS的特征更贴近真实的miRNA。
需要补充说明的是,理论上来说,二级结构的形成会影响RNA的建库效率,如果筛选获得的SRS其二级结构和MFE值能够更贴近真实的miRNA,则SRS能更准确和真实的模拟真实miRNA的建库过程,进而使得基于SRS的测序定量结果评价能够更真实、准确、可靠的反映人源miRNA测序定量结果的实际情况。当然,不排除还可以采用其它软件进行MFE计算,但是,RNAfold作为一款比较成熟和常规使用的软件,其MFE计算具有更广泛的适应性和可靠性。
本申请的再一面公开了本申请的试剂在癌症样本miRNA测序定量结果评价、癌症样本miRNA测序质量分析或靶标miRNA定量检测中的应用。
需要说明的是,本申请的试剂不仅可以用于癌症样本miRNA测序定量结果评价;可以理解,通过比较测序定量检测所添加的SRS量,与实际加入的SRS量,还可以判断整个癌症样本miRNA测序质量,例如测序定量检测的SRS量与实际加入的SRS量相符或者差别很小,则可以认为测序质量高,相应的测序定量结果也可以认为更准确、可靠。至于靶标miRNA定量检测,可以通过添加浓度梯度的SRS制作标准曲线来实现,其定量的思路类似于实时荧光定量PCR通过标准曲线进行定量。
本申请的再一面公开了一种评价癌症样本miRNA测序定量结果的方法,包括在待测RNA样品中定量加入合成的已知序列的small RNA作为参考样品,将待测RNA样品和参考样品的混合样品用于建库和测序,通过测序定量分析混合样品中已知序列的small RNA的含量,并将该测序定量分析结果与实际加入待测RNA样品中的已知序列的small RNA的量进行比较,以此评价癌症样本miRNA测序定量结果的准确性。
需要说明的是,本申请评价癌症样本miRNA测序定量结果的方法,在待测RNA样品中加入确定含量的已知序列small RNA作为参考样品,在本申请的一种优选实现方式中,所添加的已知序列small RNA就是本申请的试剂,最后,通过测序定量分析所加入的已知small RNA,比较测序定量结果分析的已知small RNA的量,与实际加入的量,则可以判断整个癌症样本miRNA测序定量结果的准确性。本申请的方法不仅可以定量分析癌症样本miRNA测序定量结果的准确性,而且,还可以通过添加浓度梯度的已知small RNA制作标准曲线,以此对靶标miRNA进行绝对定量,进一步提高组内、组间分析的准确度;又或者,结合mRNA-Seq的数据,则提供了一种高效的数据均一化工具,对于在分子水平上理解miRNA与其靶向RNA的相互作用机制提供重要依据。
优选的,本申请评价癌症样本miRNA测序定量结果的方法中,参考样品的smallRNA采用以下方法获得,
(1)从miRNA公共数据库中导出人源miRNA的所有序列,统计其长度分布和GC%分布;
(2)随机生成一系列设定长度的RNA短序列,并从随机生成的RNA短序列中筛选出长度分布和GC%分布分别落在步骤(1)统计的长度分布和GC%分布统计值上下四分位数间的RNA序列,作为第一短序列集合;其中,设定长度一般是能够涵盖大部分人源miRNA的长度范围,以方便后续的筛选,本申请的一种优选方案中设定长度为20-22nt;
(3)将第一短序列集合中的所有RNA序列分别与人类基因组和miRNA公共数据库进行比对,将能够比对匹配上的RNA序列删除,剩余的RNA序列作为第二短序列集合;需要说明的是,该步骤的目的是删除随机RNA短序列与人类基因组或者miRNA公共数据库中重合的RNA序列,确保随机RNA短序列的唯一性,以保障其作为外源RNA引入待测RNA样品的理论含量,即保障加入的外源RNA的量的准确性;
(4)计算步骤(1)导出的人源miRNA所有序列的最低自由能MFE,并统计MFE分布;
(5)计算步骤(3)获得的第二短序列集合中所有RNA序列的MFE,并筛选出RNA序列的MFE落在步骤(4)统计的人源miRNA的MFE统计值上下四分位数间的RNA序列,作为第三短序列集合;
(6)统计步骤(1)导出的人源miRNA所有序列的首位及末位碱基分布,统计第三短序列集合中所有RNA序列的首位及末位碱基分布,并筛选出RNA序列的首位及末位碱基分布与人源miRNA的首位及末位碱基分布一致的RNA序列,作为参考样品的small RNA。
需要说明的是,作为外源RNA加入到待测RNA样品中的已知small RNA参考样品,虽然原则上只要这些已知small RNA不与人源miRNA重叠即可;但是,为了进一步确保测序定量结果评价的准确性和可靠性,本申请优选的方案中,对作为参考样品的已知small RNA进行了特别设计,例如从长度、GC%分布、最低自由能MFE以及首位及末位碱基分布等各方面对人源miRNA进行模拟,使得随机生成的外源small RNA尽可能与真实的人源miRNA相接近,从而使得基于外源small RNA的测序定量结果评价能够更真实、准确、可靠的反映人源miRNA的实际情况。
优选的,本申请评价癌症样本miRNA测序定量结果的方法,在获得参考样品的small RNA的步骤中,其步骤(2)中,设定长度为20-22nt。
优选的,在获得参考样品的small RNA的步骤中,其步骤(1)中,miRNA公共数据库为miRBase数据库。
优选的,在获得参考样品的small RNA的步骤中,其步骤(4)和步骤(5)中,MFE采用RNAfold计算。
优选的,本申请评价癌症样本miRNA测序定量结果的方法中,参考样品的smallRNA为SEQ ID NO.1至SEQ ID NO.8所示序列的RNA中的至少一种;
SEQ ID NO.1:5’-GAGCCAUGCAUUAUAUGCCAG-3’
SEQ ID NO.2:5’-UAUGCCAGAAGUCUCACGGCC-3’
SEQ ID NO.3:5’-CCUAACGUGCCUAUGCGCAGAA-3’
SEQ ID NO.4:5’-UGCGCAGACAUAAAAGCGAU-3’
SEQ ID NO.5:5’-AAGCGAUUACGACAUUAGGAU-3’
SEQ ID NO.6:5’-AUGUGAAUGACCGGUACCCA-3’
SEQ ID NO.7:5’-GUACCCAUGUGAAGAUCGCGCU-3’
SEQ ID NO.8:5’-UAUUGAUCGCGCUGAGCCAUG-3’。
本申请的有益效果在于:
本申请用于癌症样本miRNA测序定量结果评价的试剂,将其定量的加入待测RNA样品中,并通过测序定量分析所加入的试剂的量,将定量分析结果与实际加入量进行比较,以此评价整个miRNA测序定量结果的准确性和可靠性;该方法简便、易用,能够有效的评价miRNA测序定量结果的可信度。本申请的试剂各方面特性都与真实的miRNA十分接近,因此,采用本申请的试剂能够更真实、准确、可靠的反映人源miRNA测序定量结果的实际情况,从而对癌症样本miRNA测序定量结果作出更真实、准确、可靠的评价。
附图说明
图1是本申请实施例中评价癌症样本miRNA测序定量结果的方法和应用流程图;
图2是本申请实施例中人源miRNA与SRS mix的长度分布统计的比较结果图;
图3是本申请实施例中人源miRNA与SRS mix的GC%分布统计的比较结果图;
图4是本申请实施例中人源miRNA与SRS mix的MFE分布统计的比较结果图;
图5是本申请实施例中人源miRNA与SRS mix的首位、末位碱基分布统计的比较结果图;
图6是本申请实施例中在进行测序定量结果评价之前miRNA测序定量结果与QPCR定量检测结果之间的相关性分析结果;
图7是本申请实施例中采用评价癌症样本miRNA测序定量结果的方法对一个测序样品中的测序定量分析的SRS mix含量与实际加入的SRS mix含量的相关性分析结果;
图8是本申请实施例中采用评价癌症样本miRNA测序定量结果的方法对另一个测序样品中的测序定量分析的SRS mix含量与实际加入的SRS mix含量的相关性分析结果;
图9是本申请实施例中采用评价癌症样本miRNA测序定量结果的方法对另一个测序样品中的测序定量分析的SRS mix含量与实际加入的SRS mix含量的相关性分析结果;
图10是本申请实施例中采用评价癌症样本miRNA测序定量结果的方法进行评价并纠正后的miRNA测序定量结果与QPCR定量检测结果之间的相关性分析结果。
具体实施方式
目前尚没有任何比较成熟的对miRNA测序定量结果进行快速、客观评价的方法;虽然在癌症研究中,可以采用足够数量的样品来建立统计学可信度;但是,一方面,这需要大量的患者样品,另一方面,需要耗费大量的人力、物力和时间;并且,更为重要的是,通过大量样品建立统计学可信度的方法,并不能对miRNA测序本身进行评价。
基于以上问题,本申请创造性的提出了一种新的评价癌症样本miRNA测序定量结果的方法和试剂。本申请的试剂中,SEQ ID NO.1至SEQ ID NO.8所示序列的RNA,其特性,例如长度、GC%分布、最低自由能MFE以及首位及末位碱基分布等,都与真实miRNA十分接近,因此,能够真实的模拟真实miRNA的建库、测序和测序定量分析,使得采用本申请的试剂进行的癌症样本miRNA测序定量结果评价能够更真实、准确、可靠的反映人源miRNA测序定量结果的实际情况,从而能够对癌症样本miRNA测序定量结果作出更真实、准确、可靠的评价。
本申请评价癌症样本miRNA测序定量结果的方法,在待测RNA样品中加入设定含量的已知small RNA,在本申请的一种优选实现方式中,所添加的已知序列small RNA就是本申请的试剂,已知small RNA混合在待测RNA样品中,与之一起进行建库、测序,通过测序定量分析已知small RNA的量,将该测序定量获得的已知small RNA含量,与实际加入的已知small RNA量进行比较,以此评价测序定量结果的准确性和可靠性。在实际应用中,本申请添加的已知small RNA仅占用低于1%的测序数据,可以评价miRNA测序定量结果的可信度。
并且,还可以做进一步的延伸利用,例如通过外源已知small RNA浓度梯度制作标准曲线,对靶标miRNA进行绝对定量,进一步提高组内、组间分析的准确度;又或者,结合mRNA-Seq的数据,则提供了一种高效的数据均一化工具,对于在分子水平上理解miRNA与其靶向RNA的相互作用机制提供重要依据。
下面通过具体实施例对本申请作进一步详细说明。以下实施例仅对本申请进行进一步说明,不应理解为对本申请的限制。
实施例
本例首先设计并合成了评价癌症样本miRNA测序定量结果的方法中所使用的作为参考样品的已知序列的small RNA,即本例的用于癌症样本miRNA测序定量结果评价的试剂,然后在待测RNA样品中添加外源的已知small RNA(Small RNA Spike-in mix,缩写SRS),并通过SRS的测序结果分析,判断miRNA测序定量结果的可靠性。具体如下:
一、SRS的设计
(1)导出miRNA公共数据库miRBase中人源miRNA的所有序列,统计其长度分布、GC%分布;其中,miRBase网址为http://www.mirbase.org/。
(2)根据步骤一的统计结果,随机生成一系列20-22nt的RNA短序列,并筛选出长度分布与GC%落在步骤(1)统计的长度分布和GC%分布统计值上下四分位数间的随机RNA序列,作为第一短序列集合。
(3)将第一短序列集合中的所有RNA序列分别比对到人基因组和miRBase,并将能比对到人基因组或miRBase的随机RNA短序列删除,得到第二短序列集合。
(4)采用工具RNAfold计算步骤(1)导出的人源miRNA所有序列的最低自由能MFE,并统计MFE分布;
RNAfold网址http://rna.tbi.univie.ac.at/cgi-bin/RNAWebSuite/RNAfold.cgi。
(5)计算步骤(3)获得的第二短序列集合中所有RNA序列的MFE,并筛选出RNA序列的MFE落在步骤(4)统计的人源miRNA的MFE统计值上下四分位数间的RNA序列,作为第三短序列集合。
(6)统计步骤(1)导出的人源miRNA所有序列的首位及末位碱基分布,统计第三短序列集合中所有RNA序列的首位及末位碱基分布,并筛选出RNA序列的首位及末位碱基分布与人源miRNA的首位及末位碱基分布一致的RNA序列,作为参考样品的small RNA。
本例作为参考样品的small RNA结果如表1所示。
表1外源small RNA及其配比
按照表1所示结果合成外源small RNA,并按照表1的比例进行稀释,混合得到SRSmix待用,即本例的用于癌症样本miRNA测序定量结果评价的试剂。
对步骤(6)获得的参考样品的small RNA即SRS mix的序列进行长度分布统计、GC%分布统计、MFE分布统计,以及首位及末位碱基分布统计,将统计结果与人源miRNA的统计结果相比较,结果如图2至图5所示。图2是人源miRNA与SRS mix的长度分布统计的比较结果图,其中,纵坐标是RNA长度。图3是人源miRNA与SRS mix的GC%分布统计的比较结果图,其中,纵坐标是RNA的GC%含量。图4是人源miRNA与SRS mix的MFE分布统计的比较结果图,其中,纵坐标是RNAfold计算的MFE值。图5是人源miRNA与SRS mix的首位、末位碱基分布统计的比较结果图,其中,miRBase_first是指人源miRNA中首位碱基的分布统计结果柱图,柱图中由下到上依序为首位碱基为A的百分比、首位碱基为C的百分比、首位碱基为G的百分比、首位碱基为U的百分比;SRS_first是指SRS mix中首位碱基的分布统计结果柱图,柱图中由下到上依序为首位碱基为A的百分比、首位碱基为C的百分比、首位碱基为G的百分比、首位碱基为U的百分比;miRBase_last是指人源miRNA中末位碱基的分布统计结果柱图,柱图中由下到上依序为末位碱基为A的百分比、末位碱基为C的百分比、末位碱基为G的百分比、末位碱基为U的百分比;SRS_last是指SRS mix中末位碱基的分布统计结果柱图,柱图中由下到上依序为末位碱基为A的百分比、末位碱基为C的百分比、末位碱基为G的百分比、末位碱基为U的百分比。
图2至图5的结果显示,本例的SRS mix中各随机RNA短序列,其长度分布、GC%分布、MFE分布,以及首位及末位碱基分布,都与人源miRNA极其相似,作为参考样品时能够真实有效的反映miRNA的实际情况。
试验例
深圳华大基因股份有限公司通过small RNA测序的方法展开前列腺癌发生机制的研究,但样品鉴定到的miRNA测序定量结果与QPCR定量检测结果一致性较低,R2仅为0.428,如图6所示。其中,miRNA测序定量采用BGISEQ-500测序平台进行;QPCR使用MicroRNA Assays(Thermofisher Scientific,part No.4440888),QPCR检测按照试剂盒标准操作规程进行。
QPCR定量检测是目前认为比较成熟,且稳定的定量检测方法,miRNA测序定量结果与QPCR定量检测结果一致性低,说明miRNA测序定量结果,或者说miRNA测序检测存在问题。
经分析认为,small RNA建库过程中所使用的RNA连接酶部分失活,是造成实验结果显著偏向的原因,但使用现有数据和技术方法无法证实这种猜测。因此采用本例的SRSmix,将其加入实验材料total RNA中,分别采用前列腺癌发生机制研究中使用的三个RNA连接酶进行建库,然后分别进行测序定量分析,在其它试剂和条件都相同的情况下,通过SRSmix对待测small RNA样本的测序定量结果进行评价,以检测RNA连接酶是否会对实验数据及分析结果产生影响。
整个检测方法如图1所示,具体包括以下步骤:
(1)取实验材料total RNA 1μg,并掺入SRS mix;
(2)对混合后的RNA进行small RNA文库构建。主要步骤包括:使用PAGE凝胶电泳回收18-30nt small RNA片段、分别连接3’接头和5’接头、反转录并扩增得到small RNA文库;其中,3’接头和5’接头为BGISEQ-500测序平台常规使用的接头,PAGE凝胶电泳回收和反转录参考常规试验方法,文库构建参考BGISEQ-500测序平台的文库构建,在此不累述;
(3)采用BGISEQ-500测序平台进行测序,并基于cPAS技术读取序列碱基信息;
(4)对测序数据进行常规的过滤后,将测序结果与SRS mix的各随机RNA短序列进行比对,获得SRS mix的测序结果,即SRS tags;
(5)统计SRS tags数目,并计算测序定量结果与各随机RNA短序列添加的实际浓度的相关性;得到RNA连接酶三个批次所对应的数据相关性R2分别为0.985、0.863、0.986,如图7至图9所示。
SRS的测序定量结果与实际加入的SRS量的相关性分析可以用于判断或评价miRNA测序定量结果的准确性,具体的,相关性R2数值越大,说明miRNA测序定量结果与实际的理论含量值越相符,说明miRNA测序定量结果越准确,可信度高。通过比较RNA连接酶三个批次的实验结果,发现批次二存在较明显的异常,批次三结果最优。
基于以上分析,后续实验只启用批次三的RNA连接酶,并在建库过程中掺入SRSmix,对small RNA测序实验做到实时检测,取得了满意的实验结果。
将采用批次三的RNA连接酶的前列腺癌发生机制small RNA测序定量结果,与QPCR定量检测结果进行相关性分析,结果如图10所示,结果显示,鉴定到的miRNA与QPCR结果相关性R2达到0.836。
以上内容是结合具体的实施方式对本申请所作的进一步详细说明,不能认定本申请的具体实施只局限于这些说明。对于本申请所属技术领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本申请的保护范围。
SEQUENCE LISTING
<110> 深圳华大基因股份有限公司
<120> 用于癌症样本miRNA测序定量结果评价的试剂、制备方法和应用
<130> 18I26040
<160> 8
<170> PatentIn version 3.3
<210> 1
<211> 21
<212> RNA
<213> 人工序列
<400> 1
gagccaugca uuauaugcca g 21
<210> 2
<211> 21
<212> RNA
<213> 人工序列
<400> 2
uaugccagaa gucucacggc c 21
<210> 3
<211> 22
<212> RNA
<213> 人工序列
<400> 3
ccuaacgugc cuaugcgcag aa 22
<210> 4
<211> 20
<212> RNA
<213> 人工序列
<400> 4
ugcgcagaca uaaaagcgau 20
<210> 5
<211> 21
<212> RNA
<213> 人工序列
<400> 5
aagcgauuac gacauuagga u 21
<210> 6
<211> 20
<212> RNA
<213> 人工序列
<400> 6
augugaauga ccgguaccca 20
<210> 7
<211> 22
<212> RNA
<213> 人工序列
<400> 7
guacccaugu gaagaucgcg cu 22
<210> 8
<211> 21
<212> RNA
<213> 人工序列
<400> 8
uauugaucgc gcugagccau g 21

Claims (10)

1.一种用于癌症样本miRNA测序定量结果评价的试剂,其特征在于:所述试剂包括SEQID NO.1至SEQ ID NO.8所示序列的RNA中的至少一种;
SEQ ID NO.1:5’-GAGCCAUGCAUUAUAUGCCAG-3’
SEQ ID NO.2:5’-UAUGCCAGAAGUCUCACGGCC-3’
SEQ ID NO.3:5’-CCUAACGUGCCUAUGCGCAGAA-3’
SEQ ID NO.4:5’-UGCGCAGACAUAAAAGCGAU-3’
SEQ ID NO.5:5’-AAGCGAUUACGACAUUAGGAU-3’
SEQ ID NO.6:5’-AUGUGAAUGACCGGUACCCA-3’
SEQ ID NO.7:5’-GUACCCAUGUGAAGAUCGCGCU-3’
SEQ ID NO.8:5’-UAUUGAUCGCGCUGAGCCAUG-3’。
2.根据权利要求1所述的试剂的制备方法,其特征在于:包括以下步骤,
(1)从miRNA公共数据库中导出人源miRNA的所有序列,统计其长度分布和GC%分布;
(2)随机生成一系列设定长度的RNA短序列,并从随机生成的RNA短序列中筛选出长度分布和GC%分布分别落在步骤(1)统计的长度分布和GC%分布统计值上下四分位数间的RNA序列,作为第一短序列集合;
(3)将所述第一短序列集合中的所有RNA序列分别与人类基因组和miRNA公共数据库进行比对,将能够比对匹配上的RNA序列删除,剩余的RNA序列作为第二短序列集合;
(4)计算步骤(1)导出的人源miRNA所有序列的最低自由能MFE,并统计MFE分布;
(5)计算步骤(3)获得的所述第二短序列集合中所有RNA序列的MFE,并筛选出RNA序列的MFE落在步骤(4)统计的人源miRNA的MFE统计值上下四分位数间的RNA序列,作为第三短序列集合;
(6)统计步骤(1)导出的人源miRNA所有序列的首位及末位碱基分布,统计所述第三短序列集合中所有RNA序列的首位及末位碱基分布,并筛选出RNA序列的首位及末位碱基分布与人源miRNA的首位及末位碱基分布一致的RNA序列,即获得SEQ ID NO.1至SEQ ID NO.8所示序列的RNA。
3.根据权利要求2所述的制备方法,其特征在于:所述步骤(2)中,设定长度为20-22nt。
4.根据权利要求2所述的制备方法,其特征在于:所述步骤(1)中,所述miRNA公共数据库为miRBase数据库。
5.根据权利要求2-4任一项所述的制备方法,其特征在于:所述步骤(4)和步骤(5)中,MFE采用RNAfold计算。
6.根据权利要求1所述的试剂在癌症样本miRNA测序定量结果评价、癌症样本miRNA测序质量分析或靶标miRNA定量检测中的应用。
7.一种评价癌症样本miRNA测序定量结果的方法,其特征在于:包括在待测RNA样品中定量加入合成的已知序列的small RNA作为参考样品,将待测RNA样品和参考样品的混合样品用于建库和测序,通过测序定量分析混合样品中已知序列的small RNA的含量,并将该测序定量分析结果与实际加入待测RNA样品中的已知序列的small RNA的量进行比较,以此评价癌症样本miRNA测序定量结果的准确性。
8.根据权利要求7所述的方法,其特征在于:所述参考样品的small RNA采用以下方法获得,
(1)从miRNA公共数据库中导出人源miRNA的所有序列,统计其长度分布和GC%分布;
(2)随机生成一系列设定长度的RNA短序列,并从随机生成的RNA短序列中筛选出长度分布和GC%分布分别落在步骤(1)统计的长度分布和GC%分布统计值上下四分位数间的RNA序列,作为第一短序列集合;
(3)将所述第一短序列集合中的所有RNA序列分别与人类基因组和miRNA公共数据库进行比对,将能够比对匹配上的RNA序列删除,剩余的RNA序列作为第二短序列集合;
(4)计算步骤(1)导出的人源miRNA所有序列的最低自由能MFE,并统计MFE分布;
(5)计算步骤(3)获得的所述第二短序列集合中所有RNA序列的MFE,并筛选出RNA序列的MFE落在步骤(4)统计的人源miRNA的MFE统计值上下四分位数间的RNA序列,作为第三短序列集合;
(6)统计步骤(1)导出的人源miRNA所有序列的首位及末位碱基分布,统计所述第三短序列集合中所有RNA序列的首位及末位碱基分布,并筛选出RNA序列的首位及末位碱基分布与人源miRNA的首位及末位碱基分布一致的RNA序列,作为所述参考样品的small RNA。
9.根据权利要求8所述的方法,其特征在于:所述步骤(2)中,设定长度为20-22nt;优选的,所述步骤(1)中,所述miRNA公共数据库为miRBase数据库;优选的,所述步骤(4)和步骤(5)中,MFE采用RNAfold计算。
10.根据权利要求7-9任一项所述的方法,其特征在于:所述参考样品的smallRNA为SEQID NO.1至SEQ ID NO.8所示序列的RNA中的至少一种;
SEQ ID NO.1:5’-GAGCCAUGCAUUAUAUGCCAG-3’
SEQ ID NO.2:5’-UAUGCCAGAAGUCUCACGGCC-3’
SEQ ID NO.3:5’-CCUAACGUGCCUAUGCGCAGAA-3’
SEQ ID NO.4:5’-UGCGCAGACAUAAAAGCGAU-3’
SEQ ID NO.5:5’-AAGCGAUUACGACAUUAGGAU-3’
SEQ ID NO.6:5’-AUGUGAAUGACCGGUACCCA-3’
SEQ ID NO.7:5’-GUACCCAUGUGAAGAUCGCGCU-3’
SEQ ID NO.8:5’-UAUUGAUCGCGCUGAGCCAUG-3’。
CN201810356012.6A 2018-04-19 2018-04-19 用于癌症样本miRNA测序定量结果评价的试剂、制备方法和应用 Active CN108707663B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810356012.6A CN108707663B (zh) 2018-04-19 2018-04-19 用于癌症样本miRNA测序定量结果评价的试剂、制备方法和应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810356012.6A CN108707663B (zh) 2018-04-19 2018-04-19 用于癌症样本miRNA测序定量结果评价的试剂、制备方法和应用

Publications (2)

Publication Number Publication Date
CN108707663A true CN108707663A (zh) 2018-10-26
CN108707663B CN108707663B (zh) 2022-03-08

Family

ID=63867321

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810356012.6A Active CN108707663B (zh) 2018-04-19 2018-04-19 用于癌症样本miRNA测序定量结果评价的试剂、制备方法和应用

Country Status (1)

Country Link
CN (1) CN108707663B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113862351A (zh) * 2020-06-30 2021-12-31 清华大学 体液样本中鉴定胞外rna生物标志物的试剂盒及方法

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006132970A2 (en) * 2005-06-03 2006-12-14 Kohne David E Method for producing improved gene expression analysis and gene expression analysis comparison assay results
CN101818202A (zh) * 2010-04-26 2010-09-01 浙江大学医学院附属妇产科医院 一种适用于宫颈组织micro RNA实时荧光定量PCR研究的新内参分子的筛选方法
CN102301002A (zh) * 2008-11-12 2011-12-28 卡里斯生命科学卢森堡控股有限责任公司 使用外来体来确定表现型的方法和系统
CN104046679A (zh) * 2013-03-11 2014-09-17 戴勇 原发性IgA肾病肾脏组织差异表达miRNA的分析方法和应用
CN104120184A (zh) * 2014-07-28 2014-10-29 成都诺恩生物科技有限公司 一种利用扩增dna片段长度多态性测定短链rna的方法
CN105063209A (zh) * 2015-08-10 2015-11-18 北京吉因加科技有限公司 一种外泌体miRNA的定量检测方法
CN105331695A (zh) * 2015-11-04 2016-02-17 成都诺恩生物科技有限公司 一种直接对miRNA进行绝对定量检测的方法
CN105349617A (zh) * 2014-08-19 2016-02-24 复旦大学 一种对高通量rna测序数据的质量控制方法及装置
CN106599615A (zh) * 2016-11-30 2017-04-26 广东顺德中山大学卡内基梅隆大学国际联合研究院 一种预测miRNA靶基因的序列特征分析方法
CN104328112B (zh) * 2014-10-31 2017-12-01 江汉大学 一种用于非疾病诊断目的的定量检测内源环状rna的方法
CN112126986A (zh) * 2020-04-30 2020-12-25 苏州京脉生物科技有限公司 一种定量miRNA的测序文库制备和分析方法

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006132970A2 (en) * 2005-06-03 2006-12-14 Kohne David E Method for producing improved gene expression analysis and gene expression analysis comparison assay results
CN102301002A (zh) * 2008-11-12 2011-12-28 卡里斯生命科学卢森堡控股有限责任公司 使用外来体来确定表现型的方法和系统
CN101818202A (zh) * 2010-04-26 2010-09-01 浙江大学医学院附属妇产科医院 一种适用于宫颈组织micro RNA实时荧光定量PCR研究的新内参分子的筛选方法
CN104046679A (zh) * 2013-03-11 2014-09-17 戴勇 原发性IgA肾病肾脏组织差异表达miRNA的分析方法和应用
CN104120184A (zh) * 2014-07-28 2014-10-29 成都诺恩生物科技有限公司 一种利用扩增dna片段长度多态性测定短链rna的方法
CN105349617A (zh) * 2014-08-19 2016-02-24 复旦大学 一种对高通量rna测序数据的质量控制方法及装置
CN104328112B (zh) * 2014-10-31 2017-12-01 江汉大学 一种用于非疾病诊断目的的定量检测内源环状rna的方法
CN105063209A (zh) * 2015-08-10 2015-11-18 北京吉因加科技有限公司 一种外泌体miRNA的定量检测方法
CN105331695A (zh) * 2015-11-04 2016-02-17 成都诺恩生物科技有限公司 一种直接对miRNA进行绝对定量检测的方法
CN106599615A (zh) * 2016-11-30 2017-04-26 广东顺德中山大学卡内基梅隆大学国际联合研究院 一种预测miRNA靶基因的序列特征分析方法
CN112126986A (zh) * 2020-04-30 2020-12-25 苏州京脉生物科技有限公司 一种定量miRNA的测序文库制备和分析方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
MAURO D. LOCATI 等: "Improving small RNA-seq by using a synthetic spike-in set for size-range quality control together with a set for data normalization", 《NUCLEIC ACIDS RES》 *
THORARINN BLONDAL 等: "Assessing sample and miRNA profile quality in serum and plasma or other biofluids", 《METHODS》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113862351A (zh) * 2020-06-30 2021-12-31 清华大学 体液样本中鉴定胞外rna生物标志物的试剂盒及方法
CN113862351B (zh) * 2020-06-30 2023-04-07 清华大学 体液样本中鉴定胞外rna生物标志物的试剂盒及方法

Also Published As

Publication number Publication date
CN108707663B (zh) 2022-03-08

Similar Documents

Publication Publication Date Title
Zhao et al. Misuse of RPKM or TPM normalization when comparing across samples and sequencing protocols
CN108319813A (zh) 循环肿瘤dna拷贝数变异的检测方法和装置
EP3461916A1 (en) Assessment of jak-stat3 cellular signaling pathway activity using mathematical modelling of target gene expression
Zhuang et al. Identification of hub subnetwork based on topological features of genes in breast cancer
Zimmerman et al. Spatially resolved whole transcriptome profiling in human and mouse tissue using Digital Spatial Profiling
CN111304303A (zh) 微卫星不稳定的预测方法及其应用
CN111653314B (zh) 一种分析识别淋巴管浸润的方法
CN112289376B (zh) 一种检测体细胞突变的方法及装置
CN101194166A (zh) 有关乳癌分类的材料和方法
CN105132407A (zh) 一种脱落细胞dna低频突变富集测序方法
CN109337978B (zh) miRNA在制备高级浆液性上皮性卵巢癌化疗耐药性评价试剂盒中的应用
JP2016518822A (ja) アセンブルされていない配列情報、確率論的方法、及び形質固有(trait−specific)のデータベースカタログを用いた生物材料の特性解析
CN105567681A (zh) 一种基于高通量基因测序无创活检病毒的方法及标签接头
Raza et al. A novel anticlustering filtering algorithm for the prediction of genes as a drug target
CN113674803A (zh) 一种拷贝数变异的检测方法及其应用
CN109593832A (zh) 一种ARMS-ddPCR基因点突变的检测方法
Meyer et al. ReadZS detects cell type-specific and developmentally regulated RNA processing programs in single-cell RNA-seq
CN108707663A (zh) 用于癌症样本miRNA测序定量结果评价的试剂、制备方法和应用
US20140019062A1 (en) Nucleic Acid Information Processing Device and Processing Method Thereof
CN113260710A (zh) 用于通过多个定制掺合混合物验证微生物组序列处理和差异丰度分析的组合物、系统、设备和方法
Wilmott et al. Tumour procurement, DNA extraction, coverage analysis and optimisation of mutation-detection algorithms for human melanoma genomes
BR102014003033A2 (pt) processo, aparato ou sistema e kit de classificação de amostras tumorais de origem desconhecida e/ou incerta e uso dos genes do grupo de biomarcadores
Gevaert et al. Prediction of cancer outcome using DNA microarray technology: past, present and future
CN110684830A (zh) 一种石蜡切片组织rna分析方法
Jiang et al. Assessing inequality in transcriptomic data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant