CN106778064A - 无参转录组自动化分析方法 - Google Patents

无参转录组自动化分析方法 Download PDF

Info

Publication number
CN106778064A
CN106778064A CN201611187563.1A CN201611187563A CN106778064A CN 106778064 A CN106778064 A CN 106778064A CN 201611187563 A CN201611187563 A CN 201611187563A CN 106778064 A CN106778064 A CN 106778064A
Authority
CN
China
Prior art keywords
analysis
project
transcript profile
analyzed
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201611187563.1A
Other languages
English (en)
Inventor
沈立
王智健
姜丽荣
孙子奎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHANGHAI PERSONAL BIOTECHNOLOGY CO Ltd
Original Assignee
SHANGHAI PERSONAL BIOTECHNOLOGY CO Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHANGHAI PERSONAL BIOTECHNOLOGY CO Ltd filed Critical SHANGHAI PERSONAL BIOTECHNOLOGY CO Ltd
Priority to CN201611187563.1A priority Critical patent/CN106778064A/zh
Publication of CN106778064A publication Critical patent/CN106778064A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations

Landscapes

  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Chemical & Material Sciences (AREA)
  • Molecular Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Analytical Chemistry (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开的一种无参转录组自动化分析方法,包括如下步骤:1)输入要进行分析的项目信息步骤;2)开始标准分析步骤;3)查看程序输出和运行日志步骤。本发明的有益效果在于:基于Perl语言和PBS集群管理软件的自动化分析流程,可进行批量项目分析,自动衔接分析项目,提高服务器使用效率,减少分析人员的分析压力,便于控制分析内容。

Description

无参转录组自动化分析方法
技术领域
本发明涉及生物信息分析技术领域,尤其涉及无参转录组分析系统及方法,特别涉及无参转录组自动化分析方法。
背景技术
随着第二代测序技术的迅猛发展,其高通量、快速、低成本的特点成为越来越多的生物学研究者在解决生物学问题时的首选,尤其在转录组测序方面更显示出极大的潜力。转录组(transcriptome)即特定生物体在某种状态下所有基因转录产物的总和,也是连接基因组遗传信息与生物功能(蛋白质组)的必然纽带。
转录组研究是功能基因组研究的一项重要内容。相对于真核生物全基因组测序来说,转录组测序得到的序列不含有内含子及其它非编码序列,因此转录组测序有着无可比拟的高性价比优势。研究基因组结构的复杂性及遗传语言的根本规律,需要对测序所得的海量数据进行精准且全面的揭示和分析。
目前转录组测序及分析技术可以解决新基因的深度发掘、低丰度转录本的发现、转录图谱绘制、可变剪接的调控、代谢途径确定、基因家族鉴定及进化分析等各方面的问题。转录组研究是基因功能及结构研究的基础和出发点,已经被广泛应用于医学、农学等各个领域。
目前现存的转录组分析方式存在以下缺陷:每项分析内容可选软件很多,不同生物信息分析人员使用的软件不统一,分析人员的技术水平也有高有低,给出的分析结果存在差异,导致后期项目交接困难,高级分析难以开展,容易导致分析项目的错漏。同时,各项分析需要单独运行,不能自动分配计算节点,也不能自动衔接后续分析,增加了分析等待时间,影响测序数据的处理效率。
发明创造内容
本发明的目的在于针对现有技术所存在的缺陷而提供一种无参转录组自动化分析方法,该无参转录组自动化分析方法基于Perl语言的自动化分析流程,可进行批量项目分析,提高服务器使用效率,减少分析人员的分析压力,便于控制分析内容。
为了实现上述目的,本发明所采用的技术方案如下:
一种无参转录组自动化分析方法,包括如下步骤:
1)输入要进行分析的项目信息步骤
将项目开题单号、物种类型、email、KAAS注释参考物种、样品过滤数据、样品分组以及需要分析的项目以一行表示一个信息进行输入;
2)开始标准分析步骤
根据步骤1)所设定的需要分析的项目,进行后续分析,该步骤默认的标准流程包括转录本拼接、Unigene聚类、Unigene功能注释、表达定量、表达差异富集分析以及结构分析;
3)查看程序输出和运行日志步骤
在分析进行过程中,如果程序出现问题,会将错误信息保存到对应的分析项目的目录下,同时分析流程使用的命令也会写入日志文件;通过检查日志文件和错误信息,保证分析结果的正确性。
本发明的有益效果在于:
基于Perl语言和PBS集群管理软件的自动化分析流程,可进行批量项目分析,自动衔接分析项目,提高服务器使用效率,减少分析人员的分析压力,便于控制分析内容。
附图说明
图1为本发明的无参考转录组自动化流程的方法流程图。
具体实施方式
为了能够更清楚地理解本发明的技术内容,特举以下实施例详细说明。
请参阅图1所示,为本发明的无参考转录组测序数据处理方法的步骤流程图。
在具体实施方式中,该方法如图1所示包括以下步骤:
(1)输入的需要分析的项目的信息文件;
(2)检测信息的是否满足条件(格式是否正确),;
(3)格式正确后,会生成对应的分析项目列表,按照项目分析的前后顺序进行分析;
(4)查找项目需要的数据,判断是否存在,如果存在,进行分析,如果不存在,写入日志,该项目不分析;
(5)按照程序设定的目录结构,输出结果文件。
在实际应用中,本发明的方法所利用的工具包共包含1个Perl编写主程序代码和47个Perl、R或shell编写的子程序代码。主程序名为:RNASeq_Denovo_Main.pl。
流程所使用的每个子程序脚本既能够独立执行,也可以嵌入到已有的数据分析流程中,使用非常灵活。
程序基于的Perl、R和shell语言,可以在Linux、MacOS等多种类unix系统平台下使用,能够在任意安装上述系统的服务器上进行使用。
在应用过程中,上述脚本会返回一系列详细的参数设置和对应的参数说明,指导数据分析人员正确使用这些方法。其中,参数分为两种类型:必要参数和可选参数。必要参数要求由数据分析人员提供输入值,无默认值。可选参数的默认值有预设值,分析人员也可以结合实际需求进行调整,具有灵活性。
在此说明书中,本发明已参照其特定的实施例作了描述。但是,很显然仍可以作出各种修改和变换而不背离本发明的精神和范围。因此,说明书和附图应被认为是说明性的而非限制性的。

Claims (1)

1.一种无参转录组自动化分析方法,其特征在于,包括如下步骤:
1)输入要进行分析的项目信息步骤
将项目开题单号、物种类型、email、KAAS注释参考物种、样品过滤数据、样品分组以及需要分析的项目以一行表示一个信息进行输入;
2)开始标准分析步骤
根据步骤1)所设定的需要分析的项目,进行后续分析,该步骤默认的标准流程包括转录本拼接、Unigene聚类、Unigene功能注释、表达定量、表达差异富集分析以及结构分析;
3)查看程序输出和运行日志步骤
在分析进行过程中,如果程序出现问题,会将错误信息保存到对应的分析项目的目录下,同时分析流程使用的命令也会写入日志文件;通过检查日志文件和错误信息,保证分析结果的正确性。
CN201611187563.1A 2016-12-20 2016-12-20 无参转录组自动化分析方法 Pending CN106778064A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611187563.1A CN106778064A (zh) 2016-12-20 2016-12-20 无参转录组自动化分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611187563.1A CN106778064A (zh) 2016-12-20 2016-12-20 无参转录组自动化分析方法

Publications (1)

Publication Number Publication Date
CN106778064A true CN106778064A (zh) 2017-05-31

Family

ID=58896310

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611187563.1A Pending CN106778064A (zh) 2016-12-20 2016-12-20 无参转录组自动化分析方法

Country Status (1)

Country Link
CN (1) CN106778064A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040096917A1 (en) * 2002-11-12 2004-05-20 Becton, Dickinson And Company Diagnosis of sepsis or SIRS using biomarker profiles
WO2011035249A3 (en) * 2009-09-18 2011-08-18 Bahou Wadie F Methods for detecting thrombocytosis using biomarkers
CN103324866A (zh) * 2013-03-26 2013-09-25 张弘 Ripple系统
CN104484581A (zh) * 2014-12-08 2015-04-01 深圳华大基因科技服务有限公司 生物信息项目的自动化分析方法及系统
CN105653900A (zh) * 2015-12-25 2016-06-08 北京百迈客生物科技有限公司 无参转录组分析系统及方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040096917A1 (en) * 2002-11-12 2004-05-20 Becton, Dickinson And Company Diagnosis of sepsis or SIRS using biomarker profiles
WO2011035249A3 (en) * 2009-09-18 2011-08-18 Bahou Wadie F Methods for detecting thrombocytosis using biomarkers
CN103324866A (zh) * 2013-03-26 2013-09-25 张弘 Ripple系统
CN104484581A (zh) * 2014-12-08 2015-04-01 深圳华大基因科技服务有限公司 生物信息项目的自动化分析方法及系统
CN105653900A (zh) * 2015-12-25 2016-06-08 北京百迈客生物科技有限公司 无参转录组分析系统及方法

Similar Documents

Publication Publication Date Title
Wyman et al. A technology-agnostic long-read analysis pipeline for transcriptome discovery and quantification
Tyanova et al. Perseus: a bioinformatics platform for integrative analysis of proteomics data in cancer research
Chou et al. Biological sequence motif discovery using motif‐x
Chen et al. ncPRO-seq: a tool for annotation and profiling of ncRNAs in sRNA-seq data
CN108197434B (zh) 去除宏基因组测序数据中人源基因序列的方法
Sachsenberg et al. MetaProSIP: automated inference of stable isotope incorporation rates in proteins for functional metaproteomics
CN105653900A (zh) 无参转录组分析系统及方法
CN106201643B (zh) 数据解析方法及装置
Meyer Qualitative and quantitative shotgun proteomics data analysis from data-dependent acquisition mass spectrometry
Gouveia et al. Quick microbial molecular phenotyping by differential shotgun proteomics
CN103714180A (zh) 一种生物信息学数据库系统和数据处理方法
Melsted et al. Fusion detection and quantification by pseudoalignment
CN111192630A (zh) 一种宏基因组数据挖掘方法
Jakobi et al. Deep computational circular RNA analytics from RNA-seq data
CN107122626A (zh) 二代测序dna突变检测的生物信息学分析的方法及系统
Perrin et al. Aozan: an automated post-sequencing data-processing pipeline
Burmeister Does the concept of genetic ancestry reinforce racism? A commentary on the discourse practice of archaeogenetics
Gallardo et al. A collection of open source applications for mass spectrometry data mining
CN106778064A (zh) 无参转录组自动化分析方法
CN110176276B (zh) 生物信息分析流程化管理方法及系统
Misra Updates on resources, software tools, and databases for plant proteomics in 2016–2017
Grassmann Conduct and quality control of differential gene expression analysis using high-throughput transcriptome sequencing (RNASeq)
Burks et al. RNA-Seq Data Analysis Pipeline for Plants: Transcriptome Assembly, Alignment, and Differential Expression Analysis
Li et al. Evaluation of bottom-up and top-down mass spectrum identifications with different customized protein sequences databases
CN105573965A (zh) 一种基于软件的电子表格比较方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170531

RJ01 Rejection of invention patent application after publication