CN109378038A - 一种基于bsa基因定位的自动化分析方法 - Google Patents
一种基于bsa基因定位的自动化分析方法 Download PDFInfo
- Publication number
- CN109378038A CN109378038A CN201811083678.5A CN201811083678A CN109378038A CN 109378038 A CN109378038 A CN 109378038A CN 201811083678 A CN201811083678 A CN 201811083678A CN 109378038 A CN109378038 A CN 109378038A
- Authority
- CN
- China
- Prior art keywords
- data
- bsa
- result
- assignment
- analysis method
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开的一种基于BSA基因定位的自动化分析方法,具体包括如下步骤:1)原始数据准备步骤;2)准备数据的校验及导入步骤;3)数据处理步骤;4)结果整理步骤。本发明是基于Linux shell语言的BSA基因定位自动化分析方法,可对下机数据全自动分析,提高数据处理效率和服务器使用效率,最终得到与特定性状关联的基因区域,并提供丰富的定位结果展示图表。
Description
技术领域
本发明涉及生物检测技术领域,特别涉及Illumina测序数据分析技术领域,具体是指一种基于BSA基因定位的自动化分析方法。
背景技术
高通量测序技术为人们利用分子生物学手段研究自然界的规律提供了更多可行性方案。目前众多高通量测序技术都有相关的分析方法或分析流程作为参考帮助科研人员进行高通量数据处理。
混合分组分析(BSA)是一种将多个相同遗传背景个体的DNA混合后测序,然后通过计算混合DNA池中变异位点(通常为SNP)的变异频率,以定位与特定性状相关的基因区域的方法。BSA法克服了很多作物难以得到近等基因系的限制,比近等基因系法省时省力,并且有测序费用较低的优势,目前已在基因定位研究上被大量应用。
但是,目前现有BSA分析方法具有测序结果不够可靠,流程复杂,测序样本单一等缺陷。现有流程中变异检测程序所应用的不是主流基因测序软件,变异检测结果与主流软件有一定差异性,且现有流程中需经过数轮变异检测过程,耗费时间。另外,其受测序材料的限制,原有流程只能处理单一亲本的项目。
发明内容
为了解决现有技术所存在的上述问题,本发明所提供的一种基于BSA基因定位的自动化分析方法。
本发明所要解决的技术问题可以通过以下技术方案来实现:
一种基于BSA基因定位的自动化分析方法,包括如下步骤:
1)原始数据准备步骤
包括准备fasta格式的参考基因组序列,以及遗传群体各样本的测序原始下机数据;
2)准备数据的校验及导入步骤
进入Linux环境,检测准备文件是否齐全,后从存储数据的服务器调取参考基因组序列及测序的下机数据;
3)数据处理步骤
包括对下机数据质控过滤、比对参考基因组、变异检测、SNP-index计算、候选区域定位及绘图;
4)结果整理步骤
对得到的结果进行分类整理,包括参考基因组信息、测序数据质量及数据量信息、比对结果统计、SNP-index统计结果、定位结果图表进行分析。
由于采用了如上的技术方案,本发明具有如下几点主要创新点:
将变异检测步骤改用主流软件来操作,提高了该步骤的结果可靠性。
简化方法流程,且只需检测一次,节约分析时间,减少人工操作压力,提高服务器使用效率。
应用新的变异频率计算思路,丰富了结果的图形展示部分,使结果便于发表。基于Linux shell的BSA基因定位自动化分析方法,可对下机数据全自动分析,提高数据处理效率和服务器使用效率,并对结果展示进行了优化。
本流程弃用原流程的比对思路,基于非亲本的参考基因组直接检测双亲和双子代混池的群体变异信息,解决原流程只能处理单一亲本的问题,丰富了流程的使用范围,并简化了流程。
附图说明
图1为本发明的BSA基因定位自动化分析方法流程图。
具体实施方式
参见图1,图中所示的一种基于BSA基因定位的自动化分析方法,包括如下步骤:
(1)准备要进行分析的原始数据;
(2)检测准备文件是否满足条件(文件名及文件数),判断是否满足,如果满足,传送数据到对应的工作目录进行下一步流程,如果不满足,相应提示信息会输出在屏幕上,该项目对应的任务退出;
(3)如果上述判断未出现问题,开始进行主体流程分析,如果流程中局部出现问题,也会输出相应提示信息,以便纠错。
在实际应用中,本发明的方法所利用的工具包共包含1个Shell脚本代码,脚本名称如下:
(a)BSA_Pipelines.sh
这个脚本的代码编写基于shell语言,可以在Linux、MacOS等多种类Unix系统平台下使用。能够在工作站和或服务器上进行使用。
BSA_Pipelines.sh主程序,以特定格式文件(包括参考基因组序列:0_Reference/reference.fa,1_RawData/*.fq.gz)作为输入数据,通过调用其他的perl脚本以及自身的判断,进行流程图所示的过程。
在应用过程中,上述脚本会返回一系列详细的参数设置和对应的参数说明,指导数据分析人员正确使用这些方法。其中,参数分为两种类型:必要参数和可选参数。必要参数要求由数据分析人员提供输入值,无默认值。可选参数的默认值有预设值,分析人员也可以结合实际需求进行调整,具有灵活性。
(4)程序运行完毕,会自动生成2_HQData(包含高质量数据及统计信息)、3_Mapping(包含比对结果及统计信息)、4_SNP(包含群体SNP结果和注释信息)、5_INDEL(包含群体INDEL结果和注释信息)、6_SNPindex(包含两混池SNP等位基因频率结果及各种图形展示)、7_Target(包含定位区间及候选SNP注释信息),至此,流程结束,得到定位结果。
在此说明书中,本发明已参照其特定的实施例作了描述。但是,很显然仍可以作出各种修改和变换而不背离本发明的精神和范围。因此,说明书和附图应被认为是说明性的而非限制性的。
Claims (1)
1.一种基于BSA基因定位的自动化分析方法,其特征在于,具体包括如下步骤:
1)原始数据准备步骤
包括fasta格式的参考基因组序列,以及遗传群体各样本的测序原始下机数据;
2)准备数据的校验及导入步骤
进入Linux环境,检测准备文件是否齐全,后从存储数据的服务器调取参考基因组序列及测序的下机数据;
3)数据处理步骤
包括对下机数据质控过滤、比对参考基因组、变异检测、SNP-index计算、候选区域定位及绘图;
4)结果整理步骤
对得到的结果进行分类整理,包括参考基因组信息、测序数据质量及数据量信息、比对结果统计、SNP-index统计结果、定位结果图表进行分析。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811083678.5A CN109378038A (zh) | 2018-09-17 | 2018-09-17 | 一种基于bsa基因定位的自动化分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811083678.5A CN109378038A (zh) | 2018-09-17 | 2018-09-17 | 一种基于bsa基因定位的自动化分析方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109378038A true CN109378038A (zh) | 2019-02-22 |
Family
ID=65404906
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811083678.5A Pending CN109378038A (zh) | 2018-09-17 | 2018-09-17 | 一种基于bsa基因定位的自动化分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109378038A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110504006A (zh) * | 2019-07-15 | 2019-11-26 | 广州奇辉生物科技有限公司 | 一种处理扩增子数据的方法、系统、平台及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1660674A2 (en) * | 2003-09-10 | 2006-05-31 | Althea Technologies, Inc. | Expression profiling using microarrays |
CN101760537A (zh) * | 2008-12-19 | 2010-06-30 | 李祥 | Ssr和est-ssr标记在小麦中的应用 |
CN105930690A (zh) * | 2016-05-13 | 2016-09-07 | 万康源(天津)基因科技有限公司 | 一种全外显子组测序数据分析方法 |
CN107609347A (zh) * | 2017-08-21 | 2018-01-19 | 上海派森诺生物科技股份有限公司 | 一种基于高通量测序技术的宏转录组数据分析方法 |
-
2018
- 2018-09-17 CN CN201811083678.5A patent/CN109378038A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1660674A2 (en) * | 2003-09-10 | 2006-05-31 | Althea Technologies, Inc. | Expression profiling using microarrays |
CN101760537A (zh) * | 2008-12-19 | 2010-06-30 | 李祥 | Ssr和est-ssr标记在小麦中的应用 |
CN105930690A (zh) * | 2016-05-13 | 2016-09-07 | 万康源(天津)基因科技有限公司 | 一种全外显子组测序数据分析方法 |
CN107609347A (zh) * | 2017-08-21 | 2018-01-19 | 上海派森诺生物科技股份有限公司 | 一种基于高通量测序技术的宏转录组数据分析方法 |
Non-Patent Citations (5)
Title |
---|
曹务强: "使用MutMap快速定位突变基因:原理篇", 《HTTP://BLOG.SCIENCENET.CN/BLOG-505988-1105693.HTML》 * |
曹务强: "使用MutMap快速定位突变基因:原理篇", 《HTTPS://ZHUANLAN.ZHIHU.COM/P/34932199》 * |
曹务强: "使用MutMap快速定位突变基因:实战篇", 《HTTP://BLOG.SCIENCENET.CN/BLOG-505988-1105955.HTML》 * |
曹务强: "使用MutMap快速定位突变基因:实战篇", 《HTTPS://WWW.JIANSHU.COM/P/64D6117B3449》 * |
曹务强: "使用MutMap快速定位突变基因:实战篇", 《HTTPS://ZHUANLAN.ZHIHU.COM/P/35003028》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110504006A (zh) * | 2019-07-15 | 2019-11-26 | 广州奇辉生物科技有限公司 | 一种处理扩增子数据的方法、系统、平台及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106503969A (zh) | 业务流程审批方法及装置 | |
Yue et al. | Long-read sequencing data analysis for yeasts | |
CN108829815B (zh) | 一种医学影像图像筛选方法 | |
CN104484558B (zh) | 生物信息项目的分析报告自动生成方法及系统 | |
EP3841442B1 (en) | Monitoring system and method for biopharmaceutical products | |
EP3122892B1 (en) | Bioprocess method and system | |
CN111009289B (zh) | 一种基于云计算的RNA-seq在线报告流程分析方法及系统 | |
CN110140179A (zh) | 实验室仪器的远程监测 | |
CN110910081A (zh) | 基于实验室信息管理系统的工作流配置实现方法和系统 | |
CN109378038A (zh) | 一种基于bsa基因定位的自动化分析方法 | |
CN109409093A (zh) | 一种系统漏洞扫描调度方法 | |
CN105653897B (zh) | 基于生物云平台的lncRNA分析系统及方法 | |
CN104797993A (zh) | 系统构建辅助装置 | |
CN109885390A (zh) | 分子对接云计算流程控制方法 | |
US20130196330A1 (en) | Identifying Microparticles in a Plurality of Images to Perform Polynucleotide Sequencing | |
CN109741813A (zh) | 一种智能排班方法、系统、计算机设备及可读存储介质 | |
JP2004178059A (ja) | 故障対応支援保守db装置 | |
Ieong et al. | Progress towards automated Kepler scientific workflows for computer-aided drug discovery and molecular simulations | |
EP1706800B1 (en) | Method and apparatus for the development of a control process for an instrument | |
CN112597751A (zh) | 一种生物信息数据分析流程管控方法及装置 | |
CN112489753A (zh) | 病原微生物检测本地化分析与交互式报告系统及实现方法 | |
CN106960135B (zh) | 靶向基因二代测序数据自动化分析系统及方法 | |
CN109087026A (zh) | 科研实验的供应商匹配系统和方法 | |
CN109326330A (zh) | 生物信息分析工具的制作方法、装置及可存储介质 | |
EP4099304A1 (en) | Customized laboratory training based on user role and laboratory configuration |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190222 |