CN113066532B - 基于高通量测序技术的宿主中病毒来源sRNA数据分析方法 - Google Patents

基于高通量测序技术的宿主中病毒来源sRNA数据分析方法 Download PDF

Info

Publication number
CN113066532B
CN113066532B CN202110354949.1A CN202110354949A CN113066532B CN 113066532 B CN113066532 B CN 113066532B CN 202110354949 A CN202110354949 A CN 202110354949A CN 113066532 B CN113066532 B CN 113066532B
Authority
CN
China
Prior art keywords
srna
virus
sequence
analysis
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110354949.1A
Other languages
English (en)
Other versions
CN113066532A (zh
Inventor
肖云平
徐天生
杨雨晴
刘钰钏
史贤俊
林博
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Oe Biotech Co ltd
Original Assignee
Shanghai Oe Biotech Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Oe Biotech Co ltd filed Critical Shanghai Oe Biotech Co ltd
Priority to CN202110354949.1A priority Critical patent/CN113066532B/zh
Publication of CN113066532A publication Critical patent/CN113066532A/zh
Application granted granted Critical
Publication of CN113066532B publication Critical patent/CN113066532B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/30Detection of binding sites or motifs
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B45/00ICT specially adapted for bioinformatics-related data visualisation, e.g. displaying of maps or networks
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Biophysics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Chemical & Material Sciences (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • Data Mining & Analysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提出了一种基于高通量测序技术的宿主中病毒来源sRNA数据分析方法,包括文件准备步骤、下机数据质控步骤、病毒参考基因组比对以及病毒sRNA注释步骤、病毒sRNA定量步骤、差异病毒sRNA分析步骤、宿主靶基因预测步骤、富集分析步骤、网页版报告整理步骤。本发明结果全面,包含涉及到的病毒sRNA分析内容以及其宿主靶基因预测,GO、KEGG富集分析以及对应的可视化展示;自动整理所有分析结果,每一步分析完成之后自动对结果进行汇总统计、可视化以及逻辑化归类整理,结果文件可直接用于生成网页版报告,所有操作步骤可以溯源,方便错误查询,如果分析有报错,会生成对应的报错日志信息。

Description

基于高通量测序技术的宿主中病毒来源sRNA数据分析方法
技术领域
本发明属于高通量转录组测序技术领域,具体涉及一种基于高通量测序技术的宿主中病毒来源sRNA数据分析方法。
背景技术
Small RNA(sRNA)是一类长度小于200nt的非编码短链RNA分子,sRNA通常具备的功能是沉默靶基因,抑制靶基因行使功能。
宿主感染病毒之后,病毒sRNA作为外源sRNA会参与宿主的生物学过程,比如行使类似于miRNA的生物学功能,沉默宿主的靶基因,进而参与影响宿主的生物学过程。单独病毒sRNA的研究和鉴定已经有相关的工具。目前还没有针对宿主中病毒来源sRNA的数据分析工具,特别是没有自动化的分析实现病毒sRNA和宿主靶基因的交互作用,以及测序结果的流程化分析工具,包括病毒sRNA的注释,表达量分析和差异分析,宿主靶基因位点分析,GO、KEGG功能富集分析等各个步骤的自动化整合。
现有的病毒sRNA高通量分析方法存在如下缺陷:
(1)适用性不强:缺少考虑病毒和宿主之间转录层面的联系;
(2)结果展示不完整:分析结果过于简单,数据挖掘的不深入,缺少数据对应的可视化展示内容。
发明内容
为了克服现有技术所存在的上述缺陷,本发明的目的在于提供一种基于高通量测序技术的宿主中病毒来源sRNA数据分析方法。
为了实现本发明的目的,所采用的技术方案是:
本发明提供了一种基于高通量测序技术的宿主中病毒来源sRNA数据分析方法,包括如下步骤:
(1)文件准备步骤:
准备config文件,读取后用于进行数据自动化质控以及后续数据分析;
在本发明的一个优选实施方式中,所述文件准备步骤当中config文件包括:下机数据位置以及对应的样本分析名和分组名、用于差异分析的分组信息、差异倍数参数、生物学重复参数、参考基因组信息等。
(2)下机数据质控步骤:
将下机得到的原始数据,通过Cutadapt、FastQC、Fastx-Toolkit、NGS_QC_Toolkit软件去除接头序列处理,保留15-41nt长度的序列,然后过滤低质量序列,即:以5个碱基长度为窗口对原始序列进行搜索,当窗口中碱基的平均测序质量低于20时,将从窗口最前端开始的部分截断并舍弃。将过滤后的数据进行去重,获得无重复的序列,并标记所有序列的数量。同时对原始数据和过滤数据量进行统计,并以柱状图展示各个样本不同长度序列的数量分布特征。
过滤序列用于后续分析;
在本发明的另一个优选实施方式中,所述下机数据质控步骤中,使用FastQC软件对去除接头的序列做质控,汇总包括序列的测序质量统计、GC含量统计等质控信息;然后使用NGS_QC_Toolkit软件对上述去除低质量碱基的序列做N碱基检测,序列中含有一个及以上的N碱基则将该条序列剔除;然后使用Fastx-Toolkit软件将剔除含N碱基的序列转成fasta格式的序列文件。
(3)病毒参考基因组比对以及病毒sRNA注释步骤:
使用bowtie软件对参考基因组序列构建索引,将上述去重质控后的序列与病毒参考基因组序列做比对,筛选出碱基错配数小于2的序列,得到比对上参考基因组的序列和没比对上参考基因组的序列,比对上的序列认为是潜在的病毒来源sRNA;
在本发明的另一个优选实施方式中,所述病毒sRNA比对注释步骤当中,一个碱基错配比对上病毒参考基因组的序列认为是潜在的病毒来源sRNA,并展示序列在基因组上的分布情况。
(4)病毒sRNA定量步骤:
将上述比对上参考基因组的结果做统计汇总序列和比对序列数等信息,并绘制各样本比对上参考基因组的序列在基因组上的分布情况,整理病毒sRNA的counts数,再基于counts数计算每个病毒sRNA的TPM,并生成病毒sRNA注释文件。
(5)差异病毒sRNA分析步骤:
根据所述注释到的病毒sRNA信息以及表达量结果,使用DESeq或DESeq2进行差异表达分析,筛选同时满足差异倍数(差异倍数>2)和显著性(P值<0.05)的差异表达病毒sRNA,统计并展示可视化结果;
在本发明的又一个优选实施方式中,所述病毒sRNA差异分析步骤中,所述可视化的绘制图像包括采用R语言的ggplot2软件包绘制差异表达病毒sRNA上下调统计柱状图、火山图;采用Pheatmap包对差异表达病毒sRNA的表达量绘制热图。
(6)宿主靶基因预测、富集分析步骤:
根据序列相似性及碱基互补配对,将所述差异病毒sRNA与所述宿主mRNA序列使用miRanda或TargetFinder软件进行靶标预测,统计靶标结合位点信息,绘制结合位点示意图;
在本发明的又一个优选实施方式中,所述靶基因预测、富集分析步骤中,使用python对靶标结合分值前10的关系对绘制结合位点示例图。
对上一步预测到的差异病毒sRNA宿主靶基因,利用宿主的GO、KEGG背景文件使用超几何分布检验计算方法进行GO功能和KEGG通路的富集分析,计算GO、KEGG条目在差异病毒sRNA的宿主靶基因中是否显著富集的P值,再对P值经Benjamini&Hochberg多重检验纠正后得到FDR;针对富集结果做柱状图和气泡图统计,获得差异病毒sRNA可能参与影响宿主的功能和代谢通路。
(7)网页版报告整理步骤:
最终整理所有的分析结果,所有分析内容按类别排放在不同目录下。质控统计结果,序列长度分布图形放在质控目录;将病毒sRNA的比对注释结果放在病毒sRNA比对注释目录;将病毒sRNA表达量以及PCA、样本聚类结果放在病毒sRNA表达目录;将病毒sRNA的差异表达相关的分析放在病毒sRNA差异目录;将差异表达的病毒sRNA对应的宿主靶基因预测结果放在病毒sRNA宿主靶基因预测目录;将宿主靶基因的GO富集分析结果放在GO富集目录;将宿主靶基因的KEGG通路富集分析结果放在KEGG富集目录。
根据所述结果使用python脚本一键化生成病毒sRNA分析的网页版报告,网页版报告对整个分析结果做了汇总,并对每个分析步骤做了描述和对应的图表展示以及弹窗式帮助文档,网页报告设置了内部快捷链接和分析方法介绍/外部网站的链接,方便网页版内部快速跳转以及快速查阅网上资料。
本发明中,第(2)部分是数据自动化质控,(3)-(7)是后续数据分析。
本发明的主要创新点及其有益效果在于:
1.针对宿主中病毒来源sRNA的分析方法,同时考虑病毒sRNA和宿主转录本的交互作用。
2.结果全面,包含涉及到的病毒sRNA分析内容以及其和宿主的靶基因预测,GO、KEGG富集分析以及对应的可视化展示。
3.自动整理所有分析结果,每一步分析完成之后自动对结果进行汇总统计,可视化,以及逻辑化归类整理,结果文件可直接用于生成网页版报告。
4.所有操作步骤可以溯源,方便错误查询,如果分析报错,会有对应的报错日志信息。
为了达到上述技术效果,本发明克服了病毒sRNA分析结果单一的情况下,考虑病毒sRNA和宿主转录本的交互作用,分析高通量测序宿主中潜在病毒sRNA的注释、表达及差异表达情况,预测病毒sRNA的宿主靶基因,对预测到的宿主靶基因做GO、KEGG富集分析,进而了解病毒sRNA可能参与影响的生物学功能。
本发明在分析病毒sRNA可能影响的宿主生物学过程,充分考虑了病毒sRNA行使类似于miRNA的生物学功能,通过靶向集合宿主的靶基因,沉默宿主的基因,从而参与影响宿主的生物学过程;这个技术特征对于实现上文所述的技术效果是至关重要的。
附图说明
图1为本发明的流程示意图。
图2为准备文件示意图。
图3为本发明的序列比对上病毒参考基因组分布示意图。
图4为本发明的差异病毒sRNA汇总示意图。
图5为本发明的火山图示意图。
图6为本发明的热图示意图。
图7为本发明的靶标结合位点示例图。
图8为本发明的GO富集分析柱状图。
图9为本发明的KEGG富集分析气泡图。
具体实施方式
结合以下具体实施例和附图,对发明作进一步的详细说明。实施本发明的过程、条件、实验方法等,除以下专门提及的内容之外,均为本领域的普遍知识和公知常识,本发明没有特别限制内容。
在具体实施方式中,该方法如图1所示包括以下步骤:
步骤1:
对于具体项目,如图2所示将样本、分组信息以及参考基因组信息汇总在config文件中,用于进行数据自动化质控以及后续数据分析时提供上述信息;
步骤2:
对于Illumina平台原始fastq测序数据,根据实验阶段的接头序列使用Cutadapt软件对原始数据做去除接头序列处理,对R1端原始测序数据,接头到3’末端的序列都剔除,同时剔除长度大于41nt、小于15nt的序列;使用FastQC软件对去除接头的序列做质控,汇总包括序列的测序质量统计、GC含量统计等质控信息;使用Fastx-Toolkit软件对去除接头的序列做去除低质量碱基处理;然后使用NGS_QC_Toolkit软件对上述去除低质量碱基的序列做N碱基检测,序列中含有一个及以上的N碱基则将该条序列剔除;然后使用Fastx-Toolkit软件将剔除N碱基的序列转成fasta格式的序列文件,并将得到的fasta序列去重获得无重复的序列;最后汇总上述每一步得到的序列数,并可视化展示每个样本质控后序列的长度分布。
步骤3:
使用bowtie软件对参考基因组序列构建索引,然后将上述步骤2的各样本去重后序列与参考基因组做序列比对,碱基错配数设置为1,得到比对上参考基因组的序列和没比对上参考基因组的序列,比对上的序列认为是潜在的病毒来源sRNA。
步骤4:
将上述比对上参考基因组的结果作统计汇总序列和比对序列数等信息,并绘制各样本比对上参考基因组的序列在基因组上的分布情况,参见图3。依据所述比对上参考基因组的序列数统计为counts数,再基于counts数计算每个病毒sRNA的TPM,并生成病毒sRNA注释文件。
步骤5:
根据所述病毒sRNA的表达量结果,使用DESeq或DESeq2进行差异表达分析,筛选同时满足差异倍数(FoldChange>2)和显著性(Pvalue<0.05)的差异表达病毒sRNA,使用R语言的ggplot2软件包绘制差异表达病毒sRNA的统计柱状图(直观了解各个差异比较组的差异病毒sRNA数量)、火山图(直观了解差异病毒sRNA的分布),采用R语言的Pheatmap包对差异表达病毒sRNA的表达量绘制热图(直观了解差异病毒sRNA的表达高低),参见图4、5、6。
步骤6:
根据序列相似性及碱基互补配对,对筛选到的显著差异表达的病毒sRNA进行宿主靶基因预测。以宿主的mRNA序列为目标序列,使用miRanda软件对差异表达的病毒sRNA进行宿主靶基因预测,使用python对靶标结合分值前10的关系对绘制结合位点示例图,参见图7。
使用超几何检验计算差异病毒sRNA的宿主靶基因富集到哪些GO功能和KEGG通路上,同时绘制宿主靶基因的pathway通路图,了解差异病毒sRNA可能参与影响宿主的功能,参见图8、9。
步骤7:
最终整理所有的分析结果,所有分析内容按类别排放在不同目录下。质控统计结果,序列长度分布图形放在质控目录;将病毒sRNA的比对注释结果放在病毒sRNA比对注释目录;将病毒sRNA表达量以及PCA、样本聚类结果放在病毒sRNA表达目录;将病毒sRNA的差异表达相关的分析放在病毒sRNA差异目录;将差异表达的病毒sRNA对应的宿主靶基因预测结果放在病毒sRNA宿主靶基因预测目录;将宿主靶基因的GO富集分析结果放在GO富集目录;将宿主靶基因的KEGG通路富集分析结果放在KEGG富集目录。
根据上述目录使用python脚本一键化生成对应的网页化分析报告。
本发明的保护内容不局限于以上具体实施方式。在不背离发明构思的精神和范围下,本领域技术人员能够想到的变化和优点都被包括在本发明中,并且以所附的权利要求书为保护范围。

Claims (10)

1.一种基于高通量测序技术的宿主中病毒来源sRNA数据分析方法,其特征在于,包括如下步骤:
(1)文件准备步骤:
准备config文件,读取后用于进行数据自动化质控以及后续数据分析;
(2)下机数据质控步骤:
将下机得到的原始数据去除接头,保留15-41nt长度的序列,然后过滤低质量序列;对去除接头的序列做质控,汇总包括序列的测序质量统计、GC含量统计的质控信息;对去除接头的序列做去除低质量碱基处理,然后对上述去除低质量碱基的序列做N碱基检测,若序列中含有一个及以上的N碱基则将这条序列剔除;然后将剔除含N碱基的序列转成fasta格式的序列文件,将过滤后的数据进行去重,获得无重复的序列,并标记所有序列的数量;同时对原始数据和过滤数据量进行统计,并以柱状图展示各个样本不同长度序列的数量分布特征;过滤序列用于后续分析;
(3)病毒参考基因组比对以及病毒sRNA注释步骤:
对参考基因组序列构建索引,将步骤(1)中去重后的序列与病毒参考基因组序列做比对,筛选出碱基错配数小于2的结果,比对上的序列认为是潜在的病毒来源sRNA,统计汇总序列和比对序列数信息;
(4)病毒sRNA定量步骤:
将步骤(3)中比对上参考基因组的序列数做统计,汇总序列和比对序列数信息,并绘制各样本比对上参考基因组的序列在基因组上的分布情况,整理病毒sRNA的counts数,再基于counts数计算每个病毒sRNA的TPM,并生成病毒sRNA注释文件;
(5)差异病毒sRNA分析步骤:
根据步骤(4)中注释到的病毒sRNA信息以及表达量结果进行差异表达分析,筛选同时满足差异倍数和显著性的差异表达病毒sRNA,统计并展示可视化结果;
(6)宿主靶基因预测、富集分析步骤:
将步骤(5)中所述差异病毒sRNA与宿主mRNA序列进行宿主靶标预测,统计靶标结合位点信息,绘制结合位点示意图;
对步骤(6)中预测到的差异病毒sRNA宿主靶基因,基于宿主的GO、KEGG背景文件使用超几何分布检验计算方法进行GO功能和KEGG通路的富集分析,计算GO、KEGG条目在差异病毒sRNA的宿主靶基因中是否显著富集的P值,再对P值经Benjamini&Hochberg多重检验纠正后得到FDR;针对富集结果做柱状图和气泡图统计,获得差异病毒sRNA可能参与影响的功能和代谢通路;
(7)网页版报告整理步骤:
根据结果一键化生成病毒sRNA分析的网页版报告,网页版报告对整个分析结果做汇总,并对每个分析步骤做描述和对应的图表展示以及弹窗式帮助文档。
2.如权利要求1所述的基于高通量测序技术的宿主中病毒来源sRNA数据分析方法,其特征在于,所述文件准备步骤当中config文件包括:下机数据位置以及对应的样本分析名和分组名、用于差异分析的分组信息、差异倍数参数、生物学重复参数、参考基因组信息。
3.如权利要求1所述的基于高通量测序技术的宿主中病毒来源sRNA数据分析方法,其特征在于,一个碱基错配比对上病毒参考基因组的序列认为是潜在的病毒来源sRNA,并展示序列在基因组上的分布情况。
4.如权利要求1所述的基于高通量测序技术的宿主中病毒来源sRNA数据分析方法,其特征在于,所述过滤低质量序列为以5个碱基长度为窗口对原始序列进行搜索,当窗口中碱基的平均测序质量低于20时,将从窗口最前端开始的部分截断并舍弃。
5.如权利要求1所述的基于高通量测序技术的宿主中病毒来源sRNA数据分析方法,其特征在于,使用Fastx-Toolkit软件将剔除含N碱基的序列转成fasta格式的序列文件。
6.如权利要求1所述的基于高通量测序技术的宿主中病毒来源sRNA数据分析方法,其特征在于,使用DESeq或DESeq2软件进行差异表达分析。
7.如权利要求1所述的基于高通量测序技术的宿主中病毒来源sRNA数据分析方法,其特征在于,所述差异病毒sRNA分析步骤中,所述可视化结果绘制图像包括采用R语言的ggplot2软件包绘制差异表达病毒sRNA上下调统计柱状图、火山图;采用Pheatmap包对差异表达病毒sRNA的表达量绘制热图。
8.如权利要求1所述的基于高通量测序技术的宿主中病毒来源sRNA数据分析方法,其特征在于,所述靶基因预测、富集分析步骤中,使用python对靶标结合分值前10的关系对绘制结合位点示例图。
9.如权利要求1所述的基于高通量测序技术的宿主中病毒来源sRNA数据分析方法,其特征在于,所述差异病毒sRNA分析步骤中,差异倍数>2,显著性P值<0.05。
10.如权利要求1所述的基于高通量测序技术的宿主中病毒来源sRNA数据分析方法,其特征在于,所述网页版报告设置内部快捷链接和分析方法介绍和外部网站的链接,实现网页版内部快速跳转以及快速查阅网上资料。
CN202110354949.1A 2021-04-01 2021-04-01 基于高通量测序技术的宿主中病毒来源sRNA数据分析方法 Active CN113066532B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110354949.1A CN113066532B (zh) 2021-04-01 2021-04-01 基于高通量测序技术的宿主中病毒来源sRNA数据分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110354949.1A CN113066532B (zh) 2021-04-01 2021-04-01 基于高通量测序技术的宿主中病毒来源sRNA数据分析方法

Publications (2)

Publication Number Publication Date
CN113066532A CN113066532A (zh) 2021-07-02
CN113066532B true CN113066532B (zh) 2022-08-26

Family

ID=76565384

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110354949.1A Active CN113066532B (zh) 2021-04-01 2021-04-01 基于高通量测序技术的宿主中病毒来源sRNA数据分析方法

Country Status (1)

Country Link
CN (1) CN113066532B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116189897B (zh) * 2023-04-24 2023-07-25 四川省医学科学院·四川省人民医院 一种基于时序变化关系的病毒癌症风险预测方法和系统
CN117690485B (zh) * 2024-02-04 2024-05-28 北京诺禾致源科技股份有限公司 用于寄生虫鉴定的基因组的处理方法和处理装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109859797A (zh) * 2018-12-29 2019-06-07 南京派森诺基因科技有限公司 一种基于miRBase数据库的无参的miRNA数据分析方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050037362A1 (en) * 2003-08-11 2005-02-17 Eppendorf Array Technologies, S.A. Detection and quantification of siRNA on microarrays
EP2985353A1 (en) * 2006-10-12 2016-02-17 Monsanto Technology LLC Plant micrornas and methods of use thereof
WO2011100569A1 (en) * 2010-02-12 2011-08-18 Genisphere, Llc Whole transcriptome sequencing

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109859797A (zh) * 2018-12-29 2019-06-07 南京派森诺基因科技有限公司 一种基于miRBase数据库的无参的miRNA数据分析方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
sRNA Target Prediction Organizing Tool (SPOT) Integrates Computational and Experimental Data To Facilitate Functional Characterization of Bacterial Small RNAs;Alisa M. King;《asm》;20190214;第1-27页 *
短小芽孢杆菌sRNA Bpsr112的鉴定及功能研究;覃佳;《四川大学学报》;20210128;第993-1001页 *

Also Published As

Publication number Publication date
CN113066532A (zh) 2021-07-02

Similar Documents

Publication Publication Date Title
CN111354418B (zh) 基于参考基因组注释文件的高通量测序技术动物tRFs数据分析方法
CN108197434B (zh) 去除宏基因组测序数据中人源基因序列的方法
CN113066532B (zh) 基于高通量测序技术的宿主中病毒来源sRNA数据分析方法
Nelson et al. Whole-genome validation of high-information-content fingerprinting
Dündar et al. Introduction to differential gene expression analysis using RNA-seq
CN110021352B (zh) 一种基于miRBase数据库的植物有参的miRNA数据分析方法
AU2011352786B2 (en) Data analysis of DNA sequences
CN109859797B (zh) 一种基于miRBase数据库的无参的miRNA数据分析方法
CN110033826B (zh) 一种应用于宏病毒组高通量测序数据的分析方法
CN113744807A (zh) 一种基于宏基因组学的病原微生物检测方法及装置
CN114121160B (zh) 一种检测样本中宏病毒组的方法和系统
CN107506614B (zh) 一种细菌ncRNA预测方法
CN115101128A (zh) 一种杂交捕获探针脱靶危险性评估的方法
CN111243665A (zh) 一种核糖体印记测序数据分析方法及系统
CN107862177B (zh) 一种区分鲤群体的单核苷酸多态性分子标记集的构建方法
CN111292806B (zh) 一种利用纳米孔测序的转录组分析方法
US20130345095A1 (en) Method and device for assembling genome sequence
CN114530200B (zh) 基于计算snp熵值的混合样本鉴定方法
WO2019132010A1 (ja) 塩基配列における塩基種を推定する方法、装置及びプログラム
CN112750501B (zh) 一种宏病毒组流程的优化分析方法
CN112967756B (zh) 基于snakemake语言快速批量可自动邮件反馈结果的高通量测序质控分析方法
CN115346607A (zh) Dna样本查重方法及装置
CN111429967A (zh) Pacbio三代测序数据的处理方法
CN110684830A (zh) 一种石蜡切片组织rna分析方法
CN114171121B (zh) 一种mRNA 5’3’末端差异的快速检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20210702

Assignee: Shanghai deer Biotechnology Co.,Ltd.

Assignor: SHANGHAI OE BIOTECH CO.,LTD.

Contract record no.: X2023980034388

Denomination of invention: Analysis method of viral sRNA data in host based on high-throughput sequencing technology

Granted publication date: 20220826

License type: Common License

Record date: 20230403