CN113066532A - 基于高通量测序技术的宿主中病毒来源sRNA数据分析方法 - Google Patents
基于高通量测序技术的宿主中病毒来源sRNA数据分析方法 Download PDFInfo
- Publication number
- CN113066532A CN113066532A CN202110354949.1A CN202110354949A CN113066532A CN 113066532 A CN113066532 A CN 113066532A CN 202110354949 A CN202110354949 A CN 202110354949A CN 113066532 A CN113066532 A CN 113066532A
- Authority
- CN
- China
- Prior art keywords
- srna
- analysis
- sequence
- virus
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/30—Detection of binding sites or motifs
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/10—Sequence alignment; Homology search
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B45/00—ICT specially adapted for bioinformatics-related data visualisation, e.g. displaying of maps or networks
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Biology (AREA)
- Biophysics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Analytical Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Chemical & Material Sciences (AREA)
- Molecular Biology (AREA)
- Genetics & Genomics (AREA)
- Data Mining & Analysis (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明提出了一种基于高通量测序技术的宿主中病毒来源sRNA数据分析方法,包括文件准备步骤、下机数据质控步骤、病毒参考基因组比对以及病毒sRNA注释步骤、病毒sRNA定量步骤、差异病毒sRNA分析步骤、宿主靶基因预测步骤、富集分析步骤、网页版报告整理步骤。本发明结果全面,包含涉及到的病毒sRNA分析内容以及其宿主靶基因预测,GO、KEGG富集分析以及对应的可视化展示;自动整理所有分析结果,每一步分析完成之后自动对结果进行汇总统计、可视化以及逻辑化归类整理,结果文件可直接用于生成网页版报告,所有操作步骤可以溯源,方便错误查询,如果分析有报错,会生成对应的报错日志信息。
Description
技术领域
本发明属于高通量转录组测序技术领域,具体涉及一种基于高通量测序技术的宿主中病毒来源sRNA数据分析方法。
背景技术
Small RNA(sRNA)是一类长度小于200nt的非编码短链RNA分子,sRNA通常具备的功能是沉默靶基因,抑制靶基因行使功能。
宿主感染病毒之后,病毒sRNA作为外源sRNA会参与宿主的生物学过程,比如行使类似于miRNA的生物学功能,沉默宿主的靶基因,进而参与影响宿主的生物学过程。单独病毒sRNA的研究和鉴定已经有相关的工具。目前还没有针对宿主中病毒来源sRNA的数据分析工具,特别是没有自动化的分析实现病毒sRNA和宿主靶基因的交互作用,以及测序结果的流程化分析工具,包括病毒sRNA的注释,表达量分析和差异分析,宿主靶基因位点分析,GO、KEGG功能富集分析等各个步骤的自动化整合。
现有的病毒sRNA高通量分析方法存在如下缺陷:
(1)适用性不强:缺少考虑病毒和宿主之间转录层面的联系;
(2)结果展示不完整:分析结果过于简单,数据挖掘的不深入,缺少数据对应的可视化展示内容。
发明内容
为了克服现有技术所存在的上述缺陷,本发明的目的在于提供一种基于高通量测序技术的宿主中病毒来源sRNA数据分析方法。
为了实现本发明的目的,所采用的技术方案是:
本发明提供了一种基于高通量测序技术的宿主中病毒来源sRNA数据分析方法,包括如下步骤:
(1)文件准备步骤:
准备config文件,读取后用于进行数据自动化质控以及后续数据分析;
在本发明的一个优选实施方式中,所述文件准备步骤当中config文件包括:下机数据位置以及对应的样本分析名和分组名、用于差异分析的分组信息、差异倍数参数、生物学重复参数、参考基因组信息等。
(2)下机数据质控步骤:
将下机得到的原始数据,通过Cutadapt、FastQC、Fastx-Toolkit、NGS_QC_Toolkit软件去除接头序列处理,保留15-41nt长度的序列,然后过滤低质量序列,即:以5个碱基长度为窗口对原始序列进行搜索,当窗口中碱基的平均测序质量低于20时,将从窗口最前端开始的部分截断并舍弃。将过滤后的数据进行去重,获得无重复的序列,并标记所有序列的数量。同时对原始数据和过滤数据量进行统计,并以柱状图展示各个样本不同长度序列的数量分布特征。
过滤序列用于后续分析;
在本发明的另一个优选实施方式中,所述下机数据质控步骤中,使用FastQC软件对去除接头的序列做质控,汇总包括序列的测序质量统计、GC含量统计等质控信息;然后使用NGS_QC_Toolkit软件对上述去除低质量碱基的序列做N碱基检测,序列中含有一个及以上的N碱基则将该条序列剔除;然后使用Fastx-Toolkit软件将剔除含N碱基的序列转成fasta格式的序列文件。
(3)病毒参考基因组比对以及病毒sRNA注释步骤:
使用bowtie软件对参考基因组序列构建索引,将上述去重质控后的序列与病毒参考基因组序列做比对,筛选出碱基错配数小于2的序列,得到比对上参考基因组的序列和没比对上参考基因组的序列,比对上的序列认为是潜在的病毒来源sRNA;
在本发明的另一个优选实施方式中,所述病毒sRNA比对注释步骤当中,一个碱基错配比对上病毒参考基因组的序列认为是潜在的病毒来源sRNA,并展示序列在基因组上的分布情况。
(4)病毒sRNA定量步骤:
将上述比对上参考基因组的结果做统计汇总序列和比对序列数等信息,并绘制各样本比对上参考基因组的序列在基因组上的分布情况,整理病毒sRNA的counts数,再基于counts数计算每个病毒sRNA的TPM,并生成病毒sRNA注释文件。
(5)差异病毒sRNA分析步骤:
根据所述注释到的病毒sRNA信息以及表达量结果,使用DESeq或DESeq2进行差异表达分析,筛选同时满足差异倍数(差异倍数>2)和显著性(P值<0.05)的差异表达病毒sRNA,统计并展示可视化结果;
在本发明的又一个优选实施方式中,所述病毒sRNA差异分析步骤中,所述可视化的绘制图像包括采用R语言的ggplot2软件包绘制差异表达病毒sRNA上下调统计柱状图、火山图;采用Pheatmap包对差异表达病毒sRNA的表达量绘制热图。
(6)宿主靶基因预测、富集分析步骤:
根据序列相似性及碱基互补配对,将所述差异病毒sRNA与所述宿主mRNA序列使用miRanda或TargetFinder软件进行靶标预测,统计靶标结合位点信息,绘制结合位点示意图;
在本发明的又一个优选实施方式中,所述靶基因预测、富集分析步骤中,使用python对靶标结合分值前10的关系对绘制结合位点示例图。
对上一步预测到的差异病毒sRNA宿主靶基因,利用宿主的GO、KEGG背景文件使用超几何分布检验计算方法进行GO功能和KEGG通路的富集分析,计算GO、KEGG条目在差异病毒sRNA的宿主靶基因中是否显著富集的P值,再对P值经Benjamini&Hochberg多重检验纠正后得到FDR;针对富集结果做柱状图和气泡图统计,获得差异病毒sRNA可能参与影响宿主的功能和代谢通路。
(7)网页版报告整理步骤:
最终整理所有的分析结果,所有分析内容按类别排放在不同目录下。质控统计结果,序列长度分布图形放在质控目录;将病毒sRNA的比对注释结果放在病毒sRNA比对注释目录;将病毒sRNA表达量以及PCA、样本聚类结果放在病毒sRNA表达目录;将病毒sRNA的差异表达相关的分析放在病毒sRNA差异目录;将差异表达的病毒sRNA对应的宿主靶基因预测结果放在病毒sRNA宿主靶基因预测目录;将宿主靶基因的GO富集分析结果放在GO富集目录;将宿主靶基因的KEGG通路富集分析结果放在KEGG富集目录。
根据所述结果使用python脚本一键化生成病毒sRNA分析的网页版报告,网页版报告对整个分析结果做了汇总,并对每个分析步骤做了描述和对应的图表展示以及弹窗式帮助文档,网页报告设置了内部快捷链接和分析方法介绍/外部网站的链接,方便网页版内部快速跳转以及快速查阅网上资料。
本发明中,第(2)部分是数据自动化质控,(3)-(7)是后续数据分析。
本发明的主要创新点及其有益效果在于:
1.针对宿主中病毒来源sRNA的分析方法,同时考虑病毒sRNA和宿主转录本的交互作用。
2.结果全面,包含涉及到的病毒sRNA分析内容以及其和宿主的靶基因预测,GO、KEGG富集分析以及对应的可视化展示。
3.自动整理所有分析结果,每一步分析完成之后自动对结果进行汇总统计,可视化,以及逻辑化归类整理,结果文件可直接用于生成网页版报告。
4.所有操作步骤可以溯源,方便错误查询,如果分析报错,会有对应的报错日志信息。
为了达到上述技术效果,本发明克服了病毒sRNA分析结果单一的情况下,考虑病毒sRNA和宿主转录本的交互作用,分析高通量测序宿主中潜在病毒sRNA的注释、表达及差异表达情况,预测病毒sRNA的宿主靶基因,对预测到的宿主靶基因做GO、KEGG富集分析,进而了解病毒sRNA可能参与影响的生物学功能。
本发明在分析病毒sRNA可能影响的宿主生物学过程,充分考虑了病毒sRNA行使类似于miRNA的生物学功能,通过靶向集合宿主的靶基因,沉默宿主的基因,从而参与影响宿主的生物学过程;这个技术特征对于实现上文所述的技术效果是至关重要的。
附图说明
图1为本发明的流程示意图。
图2为准备文件示意图。
图3为本发明的序列比对上病毒参考基因组分布示意图。
图4为本发明的差异病毒sRNA汇总示意图。
图5为本发明的火山图示意图。
图6为本发明的热图示意图。
图7为本发明的靶标结合位点示例图。
图8为本发明的GO富集分析柱状图。
图9为本发明的KEGG富集分析气泡图。
具体实施方式
结合以下具体实施例和附图,对发明作进一步的详细说明。实施本发明的过程、条件、实验方法等,除以下专门提及的内容之外,均为本领域的普遍知识和公知常识,本发明没有特别限制内容。
在具体实施方式中,该方法如图1所示包括以下步骤:
步骤1:
对于具体项目,如图2所示将样本、分组信息以及参考基因组信息汇总在config文件中,用于进行数据自动化质控以及后续数据分析时提供上述信息;
步骤2:
对于Illumina平台原始fastq测序数据,根据实验阶段的接头序列使用Cutadapt软件对原始数据做去除接头序列处理,对R1端原始测序数据,接头到3’末端的序列都剔除,同时剔除长度大于41nt、小于15nt的序列;使用FastQC软件对去除接头的序列做质控,汇总包括序列的测序质量统计、GC含量统计等质控信息;使用Fastx-Toolkit软件对去除接头的序列做去除低质量碱基处理;然后使用NGS_QC_Toolkit软件对上述去除低质量碱基的序列做N碱基检测,序列中含有一个及以上的N碱基则将该条序列剔除;然后使用Fastx-Toolkit软件将剔除N碱基的序列转成fasta格式的序列文件,并将得到的fasta序列去重获得无重复的序列;最后汇总上述每一步得到的序列数,并可视化展示每个样本质控后序列的长度分布。
步骤3:
使用bowtie软件对参考基因组序列构建索引,然后将上述步骤2的各样本去重后序列与参考基因组做序列比对,碱基错配数设置为1,得到比对上参考基因组的序列和没比对上参考基因组的序列,比对上的序列认为是潜在的病毒来源sRNA。
步骤4:
将上述比对上参考基因组的结果作统计汇总序列和比对序列数等信息,并绘制各样本比对上参考基因组的序列在基因组上的分布情况,参见图3。依据所述比对上参考基因组的序列数统计为counts数,再基于counts数计算每个病毒sRNA的TPM,并生成病毒sRNA注释文件。
步骤5:
根据所述病毒sRNA的表达量结果,使用DESeq或DESeq2进行差异表达分析,筛选同时满足差异倍数(FoldChange>2)和显著性(Pvalue<0.05)的差异表达病毒sRNA,使用R语言的ggplot2软件包绘制差异表达病毒sRNA的统计柱状图(直观了解各个差异比较组的差异病毒sRNA数量)、火山图(直观了解差异病毒sRNA的分布),采用R语言的Pheatmap包对差异表达病毒sRNA的表达量绘制热图(直观了解差异病毒sRNA的表达高低),参见图4、5、6。
步骤6:
根据序列相似性及碱基互补配对,对筛选到的显著差异表达的病毒sRNA进行宿主靶基因预测。以宿主的mRNA序列为目标序列,使用miRanda软件对差异表达的病毒sRNA进行宿主靶基因预测,使用python对靶标结合分值前10的关系对绘制结合位点示例图,参见图7。
使用超几何检验计算差异病毒sRNA的宿主靶基因富集到哪些GO功能和KEGG通路上,同时绘制宿主靶基因的pathway通路图,了解差异病毒sRNA可能参与影响宿主的功能,参见图8、9。
步骤7:
最终整理所有的分析结果,所有分析内容按类别排放在不同目录下。质控统计结果,序列长度分布图形放在质控目录;将病毒sRNA的比对注释结果放在病毒sRNA比对注释目录;将病毒sRNA表达量以及PCA、样本聚类结果放在病毒sRNA表达目录;将病毒sRNA的差异表达相关的分析放在病毒sRNA差异目录;将差异表达的病毒sRNA对应的宿主靶基因预测结果放在病毒sRNA宿主靶基因预测目录;将宿主靶基因的GO富集分析结果放在GO富集目录;将宿主靶基因的KEGG通路富集分析结果放在KEGG富集目录。
根据上述目录使用python脚本一键化生成对应的网页化分析报告。
本发明的保护内容不局限于以上具体实施方式。在不背离发明构思的精神和范围下,本领域技术人员能够想到的变化和优点都被包括在本发明中,并且以所附的权利要求书为保护范围。
Claims (10)
1.一种基于高通量测序技术的宿主中病毒来源sRNA数据分析方法,其特征在于,包括如下步骤:
(1)文件准备步骤:
准备config文件,读取后用于进行数据自动化质控以及后续数据分析;
(2)下机数据质控步骤:
将下机得到的原始数据去除接头,保留15-41nt长度的序列,然后过滤低质量序列;对去除接头的序列做质控,汇总包括序列的测序质量统计、GC含量统计的质控信息;对去除接头的序列做去除低质量碱基处理,然后对上述去除低质量碱基的序列做N碱基检测,序列中含有一个及以上的N碱基则将该条序列剔除;然后将剔除含N碱基的序列转成fasta格式的序列文件,将过滤后的数据进行去重,获得无重复的序列,并标记所有序列的数量;同时对原始数据和过滤数据量进行统计,并以柱状图展示各个样本不同长度序列的数量分布特征;过滤序列用于后续分析;
(3)病毒参考基因组比对以及病毒sRNA注释步骤:
对参考基因组序列构建索引,将步骤(1)中所述去重后的序列与病毒参考基因组序列做比对,筛选出碱基错配数小于2的结果,比对上的序列认为是潜在的病毒来源sRNA,统计汇总序列和比对序列数信息;
(4)病毒sRNA定量步骤:
将步骤(3)中所述比对上参考基因组的序列数做统计,汇总序列和比对序列数信息,并绘制各样本比对上参考基因组的序列在基因组上的分布情况,整理病毒sRNA的counts数,再基于counts数计算每个病毒sRNA的TPM,并生成病毒sRNA注释文件;
(5)差异病毒sRNA分析步骤:
根据步骤(4)中所述注释到的病毒sRNA信息以及表达量结果进行差异表达分析,筛选同时满足差异倍数和显著性的差异表达病毒sRNA,统计并展示可视化结果;
(6)宿主靶基因预测、富集分析步骤:
将步骤(5)中所述差异病毒sRNA与宿主mRNA序列进行宿主靶标预测,统计靶标结合位点信息,绘制结合位点示意图;
对步骤(6)中预测到的差异病毒sRNA宿主靶基因,基于宿主的GO、KEGG背景文件使用超几何分布检验计算方法进行GO功能和KEGG通路的富集分析,计算GO、KEGG条目在差异病毒sRNA的宿主靶基因中是否显著富集的P值,再对P值经Benjamini&Hochberg多重检验纠正后得到FDR;针对富集结果做柱状图和气泡图统计,获得差异病毒sRNA可能参与影响的功能和代谢通路;
(7)网页版报告整理步骤:
根据结果一键化生成病毒sRNA分析的网页版报告,网页版报告对整个分析结果做汇总,并对每个分析步骤做描述和对应的图表展示以及弹窗式帮助文档。
2.如权利要求1所述的基于高通量测序技术的宿主中病毒来源sRNA数据分析方法,其特征在于,所述文件准备步骤当中config文件包括:下机数据位置以及对应的样本分析名和分组名、用于差异分析的分组信息、差异倍数参数、生物学重复参数、参考基因组信息。
3.如权利要求1所述的基于高通量测序技术的宿主中病毒来源sRNA数据分析方法,其特征在于,一个碱基错配比对上病毒参考基因组的序列认为是潜在的病毒来源sRNA,并展示序列在基因组上的分布情况。
4.如权利要求1所述的基于高通量测序技术的宿主中病毒来源sRNA数据分析方法,其特征在于,所述过滤低质量序列为以5个碱基长度为窗口对原始序列进行搜索,当窗口中碱基的平均测序质量低于20时,将从窗口最前端开始的部分截断并舍弃。
5.如权利要求1所述的基于高通量测序技术的宿主中病毒来源sRNA数据分析方法,其特征在于,使用Fastx-Toolkit软件将剔除含N碱基的序列转成fasta格式的序列文件。
6.如权利要求1所述的基于高通量测序技术的宿主中病毒来源sRNA数据分析方法,其特征在于,使用DESeq或DESeq2软件进行差异表达分析。
7.如权利要求1所述的基于高通量测序技术的宿主中病毒来源sRNA数据分析方法,其特征在于,所述差异病毒sRNA分析步骤中,所述可视化结果绘制图像包括采用R语言的ggplot2软件包绘制差异表达病毒sRNA上下调统计柱状图、火山图;采用Pheatmap包对差异表达病毒sRNA的表达量绘制热图。
8.如权利要求1所述的基于高通量测序技术的宿主中病毒来源sRNA数据分析方法,其特征在于,所述靶基因预测、富集分析步骤中,使用python对靶标结合分值前10的关系对绘制结合位点示例图。
9.如权利要求1所述的基于高通量测序技术的宿主中病毒来源sRNA数据分析方法,其特征在于,所述差异病毒sRNA分析步骤中,差异倍数>2,显著性P值<0.05。
10.如权利要求1所述的基于高通量测序技术的宿主中病毒来源sRNA数据分析方法,其特征在于,所述网页报告设置内部快捷链接和分析方法介绍和外部网站的链接,实现网页版内部快速跳转以及快速查阅网上资料。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110354949.1A CN113066532B (zh) | 2021-04-01 | 2021-04-01 | 基于高通量测序技术的宿主中病毒来源sRNA数据分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110354949.1A CN113066532B (zh) | 2021-04-01 | 2021-04-01 | 基于高通量测序技术的宿主中病毒来源sRNA数据分析方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113066532A true CN113066532A (zh) | 2021-07-02 |
CN113066532B CN113066532B (zh) | 2022-08-26 |
Family
ID=76565384
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110354949.1A Active CN113066532B (zh) | 2021-04-01 | 2021-04-01 | 基于高通量测序技术的宿主中病毒来源sRNA数据分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113066532B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114283892A (zh) * | 2021-12-24 | 2022-04-05 | 上海生物芯片有限公司 | KEGG Pathway map组学维度信息的交互式展示方法、系统、终端、介质 |
CN116189897A (zh) * | 2023-04-24 | 2023-05-30 | 四川省医学科学院·四川省人民医院 | 一种基于时序变化关系的病毒癌症风险预测方法和系统 |
CN117690485A (zh) * | 2024-02-04 | 2024-03-12 | 北京诺禾致源科技股份有限公司 | 用于寄生虫鉴定的基因组的处理方法和处理装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060099619A1 (en) * | 2003-08-11 | 2006-05-11 | Eppenddorf Array Technologies, S.A. | Detection and quantification of miRNA on microarrays |
CN101802215A (zh) * | 2006-10-12 | 2010-08-11 | 孟山都技术有限公司 | 植物微rna及其使用方法 |
US20110201058A1 (en) * | 2010-02-12 | 2011-08-18 | Genisphere, Llc | Whole Transciptome Sequencing |
CN109859797A (zh) * | 2018-12-29 | 2019-06-07 | 南京派森诺基因科技有限公司 | 一种基于miRBase数据库的无参的miRNA数据分析方法 |
-
2021
- 2021-04-01 CN CN202110354949.1A patent/CN113066532B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060099619A1 (en) * | 2003-08-11 | 2006-05-11 | Eppenddorf Array Technologies, S.A. | Detection and quantification of miRNA on microarrays |
CN101802215A (zh) * | 2006-10-12 | 2010-08-11 | 孟山都技术有限公司 | 植物微rna及其使用方法 |
US20110201058A1 (en) * | 2010-02-12 | 2011-08-18 | Genisphere, Llc | Whole Transciptome Sequencing |
CN109859797A (zh) * | 2018-12-29 | 2019-06-07 | 南京派森诺基因科技有限公司 | 一种基于miRBase数据库的无参的miRNA数据分析方法 |
Non-Patent Citations (2)
Title |
---|
ALISA M. KING: "sRNA Target Prediction Organizing Tool (SPOT) Integrates Computational and Experimental Data To Facilitate Functional Characterization of Bacterial Small RNAs", 《ASM》 * |
覃佳: "短小芽孢杆菌sRNA Bpsr112的鉴定及功能研究", 《四川大学学报》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114283892A (zh) * | 2021-12-24 | 2022-04-05 | 上海生物芯片有限公司 | KEGG Pathway map组学维度信息的交互式展示方法、系统、终端、介质 |
CN116189897A (zh) * | 2023-04-24 | 2023-05-30 | 四川省医学科学院·四川省人民医院 | 一种基于时序变化关系的病毒癌症风险预测方法和系统 |
CN116189897B (zh) * | 2023-04-24 | 2023-07-25 | 四川省医学科学院·四川省人民医院 | 一种基于时序变化关系的病毒癌症风险预测方法和系统 |
CN117690485A (zh) * | 2024-02-04 | 2024-03-12 | 北京诺禾致源科技股份有限公司 | 用于寄生虫鉴定的基因组的处理方法和处理装置 |
CN117690485B (zh) * | 2024-02-04 | 2024-05-28 | 北京诺禾致源科技股份有限公司 | 用于寄生虫鉴定的基因组的处理方法和处理装置 |
Also Published As
Publication number | Publication date |
---|---|
CN113066532B (zh) | 2022-08-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113066532B (zh) | 基于高通量测序技术的宿主中病毒来源sRNA数据分析方法 | |
CN111354418B (zh) | 基于参考基因组注释文件的高通量测序技术动物tRFs数据分析方法 | |
Nelson et al. | Whole-genome validation of high-information-content fingerprinting | |
CN108197434B (zh) | 去除宏基因组测序数据中人源基因序列的方法 | |
CN111445955B (zh) | 新型冠状病毒变异分析方法及应用 | |
Wang et al. | Computational resources for ribosome profiling: from database to Web server and software | |
CN110021352B (zh) | 一种基于miRBase数据库的植物有参的miRNA数据分析方法 | |
Dündar et al. | Introduction to differential gene expression analysis using RNA-seq | |
Thody et al. | PAREsnip2: a tool for high-throughput prediction of small RNA targets from degradome sequencing data using configurable targeting rules | |
CN113744807A (zh) | 一种基于宏基因组学的病原微生物检测方法及装置 | |
AU2011352786B2 (en) | Data analysis of DNA sequences | |
CN110544509B (zh) | 一种单细胞ATAC-seq数据分析方法 | |
CN109859797B (zh) | 一种基于miRBase数据库的无参的miRNA数据分析方法 | |
CN114121160B (zh) | 一种检测样本中宏病毒组的方法和系统 | |
CN107506614B (zh) | 一种细菌ncRNA预测方法 | |
CN115101128A (zh) | 一种杂交捕获探针脱靶危险性评估的方法 | |
CN111243665A (zh) | 一种核糖体印记测序数据分析方法及系统 | |
CN112750501A (zh) | 一种宏病毒组流程的优化分析方法 | |
CN107862177B (zh) | 一种区分鲤群体的单核苷酸多态性分子标记集的构建方法 | |
CN111292806B (zh) | 一种利用纳米孔测序的转录组分析方法 | |
CN112489724A (zh) | 一种基于二代测序的转录组数据自动化分析方法 | |
CN111429967A (zh) | Pacbio三代测序数据的处理方法 | |
Irigoyen et al. | Genomic approaches to analyze alternative splicing, a key regulator of transcriptome and proteome diversity in Brachypodium distachyon | |
CN114171121B (zh) | 一种mRNA 5’3’末端差异的快速检测方法 | |
CN115198036B (zh) | 一种基于纳米孔和高通量测序数据的噬菌体鉴定和宿主预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
EE01 | Entry into force of recordation of patent licensing contract | ||
EE01 | Entry into force of recordation of patent licensing contract |
Application publication date: 20210702 Assignee: Shanghai deer Biotechnology Co.,Ltd. Assignor: SHANGHAI OE BIOTECH CO.,LTD. Contract record no.: X2023980034388 Denomination of invention: Analysis method of viral sRNA data in host based on high-throughput sequencing technology Granted publication date: 20220826 License type: Common License Record date: 20230403 |