CN115565609B - 一种针对dna测序数据的自动分析方法 - Google Patents

一种针对dna测序数据的自动分析方法 Download PDF

Info

Publication number
CN115565609B
CN115565609B CN202211194840.7A CN202211194840A CN115565609B CN 115565609 B CN115565609 B CN 115565609B CN 202211194840 A CN202211194840 A CN 202211194840A CN 115565609 B CN115565609 B CN 115565609B
Authority
CN
China
Prior art keywords
data
analysis
automatic
automatic analysis
dna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211194840.7A
Other languages
English (en)
Other versions
CN115565609A (zh
Inventor
秦叶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Boanzhilian Technology Co ltd
Original Assignee
Beijing Boanzhilian Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Boanzhilian Technology Co ltd filed Critical Beijing Boanzhilian Technology Co ltd
Priority to CN202211194840.7A priority Critical patent/CN115565609B/zh
Publication of CN115565609A publication Critical patent/CN115565609A/zh
Application granted granted Critical
Publication of CN115565609B publication Critical patent/CN115565609B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids

Landscapes

  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

本发明提供一种针对DNA测序数据的自动分析方法,涉及基因数据自动分析方法及数据储存应用技术领域。该DNA测序数据的自动分析方法,包括以下步骤:步骤一:创建DNA测序数据自动分析任务;步骤二:配置基因数据分析文件与任务调度程序,根据DNA测序所用的试剂盒进行自动匹配参数设定;步骤三:将基因数据输出的文件进行调取,通过自动匹配参数对数据进行分析加载,通过预定义分析软件执行数据分析时所需要的分析方法、内标等参数,实现自动分析。

Description

一种针对DNA测序数据的自动分析方法
技术领域
本发明涉及数据储存与基因数据分析技术领域,具体为一种针对DNA测序数据的自动分析方法。
背景技术
随着人类基因组计划的顺利实施和测序技术的快速发展,测序的成本显著降低,而测序速度得到了显著提高,人类全基因组测序的测序成本已经下降,DNA序列的数据量呈指数增长。如何快速的利用、表达这些数据,进而分析与解释基因序列里的潜在问题,从海量数据里发掘出对人类有利的信息,成为一个迫切需要解决的问题。应用越来越广泛的人类全基因组测序(WGS)产生的序列数据、以及对海量序列数据进行快速分析处理的持续需求,使数据分析形成了一个新的技术瓶颈,对二代测序技术的临床应用成为制约。
对于现有技术中基因测序仪设备的运行状态不能实时监控,需要人工进行巡视、排查,缺少有效的监测预警手段;同时基因测序数据的分析、应用与流转需要依靠U盘、光盘等移动存储介质进行拷贝、导入,存在数据丢失、损坏、传播病毒等巨大风险。
发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提供了一种针对DNA测序数据的自动分析方法,节省大量的人工、时间成本的问题。
(二)技术方案
为实现以上目的,本发明通过以下技术方案予以实现:一种针对DNA测序数据的自动分析方法,包括以下步骤:
步骤一:创建DNA测序数据自动分析任务;
步骤二:配置基因数据分析文件与任务调度程序,根据DNA测序所用的试剂盒进行自动匹配参数设定;
步骤三:将基因数据输出的文件进行调取,通过自动匹配参数对数据进行分析加载;
步骤四:在自动分析组件中,配置服务端所使用的初始项;
步骤五:在服务端的自动分析调度程序中,配置自动分析组件的启动方式和启动程序路径;
步骤六:启动服务端的自动分析调度程序,实现数据监控;当检测到有新的输出原始数据文件时,会根据输出数据所在位置,从已约定配置的分析方法中加载对应的分析方法相关参数,并智能唤起自动分析调度程序;
步骤七:自动分析调度程序监测数据监测并加载分析参数,对原始数据文件进行分析,并将分析后数据自动写入DNA数据库中;为DNA实验室信息管理系统或DNA数据库系统提供通用标准接口,用于DNA实验室信息管理系或DNA数据库系统获取已分析完成的数据结果;
步骤八:修改自动分析组件中的配置文件,启动运行程序;
步骤九:自动分析组件启动,包括Server端和Client端,组件根据配置项对数据文件执行自动分析过程;
步骤十:启动自动分析组件的执行进度检测,调用DNA实验室信息管理系统或DNA数据库应用服务接口进行数据完成分析结果存储,审核校验结果数据质量、标注问题数据以及入库比对等;
步骤十一:执行一键启动分析软件命令程序,实现结果数据再次分析和同步;提供实验管理模块,实施监测测序仪运行状态和实验进度;支持实验室全流程数据追溯。
优选的,步骤二所述自动分析参数,包括:Analysis Method、Panel、SizeStandard。
工作原理:针对DNA测序数据分析的现有工作模式,1、实验人员将实验样本放入测序仪,配置相关运行参数后开启实验;2、人工巡查和监测测序仪工作进展,确保运行正常;3、实验完成后,实验结果对应的原始数据文件输出到测序仪本地磁盘;4、实验人员将原始数据文件拷贝到U盘、移动硬盘或刻录到光盘中;5、在已安装分析软件的电脑上,将拷贝的原始数据文件导入到分析软件中进行分析;6、分析软件完成原始数据分析后,需要将分析结果导出为通用Codis文件格式,并再次拷贝到U盘、移动硬盘或刻录到光盘中;7、将拷贝的Codis文件导入到DNA Lims或数据库系统中,校验Codis格式并验证数据有效性确认无误后,存入数据库并参与比对。
(三)有益效果
本发明提供了一种针对DNA测序数据的自动分析方法。具备以下有益效果:
1、本发明中预定义分析软件执行数据分析时所需要的分析方法、内标等参数,后台通过已定义的参数自动启动分析软件并加载2位置中的原始数据,实现自动分析。
2、本发明通过分析软件与DNA Lims和DNA数据库之间的应用接口,实现分析结果自动同步到DNA Lims和DNA数据库,并自动审核分析结果质量,对不满足入库比对条件的样本数据进行高亮标识。
3、本发明支持对测序实验、数据分析、审核入库的全过程追溯,能够快速定位和排除问题,极大提升工作效率,节省大量的人工、时间成本。
4、本发明通过实现测序仪的入网监控,实时监控测序仪运行状态、出现故障实时预警。
5、本发明依托于网络连接,利用文件监视与采集模块实时收集并传输测序仪原始数据文件,并根据预定义的规则传输到指定位置。
附图说明
图1为本发明的Network Driver网络驱动流程示意图;
图2为本发明的自动分析任务调度流程示意图;
图3为本发明的DNA Lims和DNA数据库对接应用流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实例仅仅是本发明一部分实例,而不是全部的实例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例:
如图1-3所示,本发明实施例提供一种针对DNA测序数据的自动分析方法,步骤一:创建DNA测序数据自动分析任务,在测序仪配套主机上需要创建本组件的映射,并将测序实验输出结果的路径配置为该映射路径,在Network Driver下分别创建原始数据和RunFolder文件夹,并根据实验室当前使用的试剂盒名称,在以上两个文件夹下创建与试剂盒同名的子文件夹,用于存放测序仪电脑输出的原始数据文件,所有组件均在同一网络环境下,且各组件之间开放通信端口;
步骤二:配置基因数据分析文件与任务调度程序,根据DNA测序所用的试剂盒进行自动匹配参数设定;本组件提供命令行程序,用于一键启动分析软件,实现结果数据再次分析和同步;提供实验管理模块,实时监测测序仪运行状态和实验进度;支持实验室全流程数据追溯,校验Codis格式并验证数据有效性无误后,存入数据库并参与比对,步骤二所述自动分析参数,包括:Analysis Method、Panel、Size Standard;
步骤三:将基因数据输出的文件进行调取,通过自动匹配参数对数据进行分析加载;
步骤四:在自动分析组件中,配置服务端所使用的初始项,在GMIDX-Connector组件中,配置服务端GMIDX的安装路径、本组件服务的端口、数据库连接、用户名、密码等初始项,本组件用于执行数据分析,通过自动分析任务调度器传入的分析参数,对原始数据文件进行分析,并将分析后的数据自动写入数据库中;为DNA Lims或数据库系统提供通用标准接口,用于DNA Lims或数据库系统获取已完成分析的结果数据;
步骤五:在服务端的自动分析调度程序中,配置自动分析组件的启动方式和启动程序路径,本组件做为后台运行程序部署,对Network Driver中的原始数据进行监视,每当检测到有新的输出原始数据文件时,本组件根据输出数据所在的文件夹,从已约定配置的分析方法中加载对应的分析方法相关参数,并唤起自动分析程序GMIDX-Connector,对当前输出的原始数据文件执行分析;
步骤六:启动服务端的自动分析调度程序,实现数据监控;当检测到有新的输出原始数据文件时,会根据输出数据所在位置,从已约定配置的分析方法中加载对应的分析方法相关参数,并智能唤起自动分析调度程序;
步骤七:自动分析调度程序监测数据监测并加载分析参数,对原始数据文件进行分析,并将分析后数据自动写入DNA数据库中;为DNA实验室信息管理系统或DNA数据库系统提供通用标准接口,用于DNA实验室信息管理系或DNA数据库系统获取已分析完成的数据结果;
步骤八:修改自动分析组件中的配置文件,启动运行程序,本组件是分析软件程序,包括Server端和Client端。用于原始数据的分析,分析方法、内标等参数的配置管理、分析数据的数据库存储;为GMIDX-Connector提供数据读写接口;
步骤九:自动分析组件启动,包括Server端和Client端,组件根据配置项对数据文件执行自动分析过程;
步骤十:启动自动分析组件的执行进度检测,调用DNA实验室信息管理系统或DNA数据库应用服务接口进行数据完成分析结果存储,审核校验结果数据质量、标注问题数据以及入库比对等;
步骤十一:执行一键启动分析软件命令程序,实现结果数据再次分析和同步;提供实验管理模块,实施监测测序仪运行状态和实验进度;支持实验室全流程数据追溯。
尽管已经出示和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (2)

1.一种针对DNA测序数据的自动分析方法,其特征在于,包括以下步骤:
步骤一:创建DNA测序数据自动分析任务;
步骤二:配置基因数据分析文件与任务调度程序,根据DNA测序所用的试剂盒进行自动匹配参数设定;
步骤三:将基因数据输出的文件进行调取,通过自动匹配参数对数据进行分析加载;
步骤四:在自动分析组件中,配置服务端所使用的初始项;
步骤五:在服务端的自动分析调度程序中,配置自动分析组件的启动方式和启动程序路径;
步骤六:启动服务端的自动分析调度程序,实现数据监控;当检测到有新的输出原始数据文件时,会根据输出数据所在位置,从已约定配置的分析方法中加载对应的分析方法相关参数,并智能唤起自动分析调度程序;
步骤七:自动分析调度程序监测数据监测并加载分析参数,对原始数据文件进行分析,并将分析后数据自动写入DNA数据库中;为DNA实验室信息管理系统或DNA数据库系统提供通用标准接口,用于DNA实验室信息管理系或DNA数据库系统获取已分析完成的数据结果;
步骤八:修改自动分析组件中的配置文件,启动运行程序;
步骤九:自动分析组件启动,包括Server端和Client端,组件根据配置项对数据文件执行自动分析过程;
步骤十:启动自动分析组件的执行进度检测,调用DNA实验室信息管理系统或DNA数据库应用服务接口进行数据完成分析结果存储,审核校验结果数据质量、标注问题数据以及入库比对;
步骤十一:执行一键启动分析软件命令程序,实现结果数据再次分析和同步;提供实验管理模块,实施监测测序仪运行状态和实验进度;支持实验室全流程数据追溯。
2.根据权利要求1所述的一种针对DNA测序数据的自动分析方法,其特征在于:步骤二所述自动匹配参数,包括:AnalysisMethod、Panel、SizeStandard。
CN202211194840.7A 2022-09-28 2022-09-28 一种针对dna测序数据的自动分析方法 Active CN115565609B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211194840.7A CN115565609B (zh) 2022-09-28 2022-09-28 一种针对dna测序数据的自动分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211194840.7A CN115565609B (zh) 2022-09-28 2022-09-28 一种针对dna测序数据的自动分析方法

Publications (2)

Publication Number Publication Date
CN115565609A CN115565609A (zh) 2023-01-03
CN115565609B true CN115565609B (zh) 2023-07-07

Family

ID=84742839

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211194840.7A Active CN115565609B (zh) 2022-09-28 2022-09-28 一种针对dna测序数据的自动分析方法

Country Status (1)

Country Link
CN (1) CN115565609B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109584958A (zh) * 2018-11-29 2019-04-05 江苏医联生物科技有限公司 一种基于云计算基因序列数据质控管理方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10847251B2 (en) * 2013-01-17 2020-11-24 Illumina, Inc. Genomic infrastructure for on-site or cloud-based DNA and RNA processing and analysis
CN106599614B (zh) * 2016-11-07 2020-05-19 为朔医学数据科技(北京)有限公司 一种高通量测序数据处理及分析流程控制方法及系统
CN108315240A (zh) * 2018-01-19 2018-07-24 武汉永瑞康华医学检验所有限公司 一种可以用于基因测序的流程质控标准技术
WO2021002306A1 (ja) * 2019-07-03 2021-01-07 国立研究開発法人国立がん研究センター がん遺伝子の判定方法
CN112967756B (zh) * 2021-03-30 2022-07-26 上海欧易生物医学科技有限公司 基于snakemake语言快速批量可自动邮件反馈结果的高通量测序质控分析方法
CN112992270A (zh) * 2021-04-01 2021-06-18 山东英信计算机技术有限公司 一种基因测序方法和装置
CN113535326B (zh) * 2021-07-09 2024-04-12 粤港澳大湾区精准医学研究院(广州) 一种基于高通量测序数据的计算流程调度系统

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109584958A (zh) * 2018-11-29 2019-04-05 江苏医联生物科技有限公司 一种基于云计算基因序列数据质控管理方法

Also Published As

Publication number Publication date
CN115565609A (zh) 2023-01-03

Similar Documents

Publication Publication Date Title
CN103678110B (zh) 提供修改相关信息的方法和装置
US20100161561A1 (en) Method and system for data archiving
US7506211B2 (en) Automated atomic system testing
WO2019227641A1 (zh) 一种应用程序测试方法、装置、终端设备及介质
CN106649014A (zh) 一种支持多gpu的计算型服务器的自动测试方法
CN103136471A (zh) 一种恶意Android应用程序检测方法和系统
CN104182335A (zh) 软件测试方法和装置
KR101976629B1 (ko) 커미트 민감도 테스트들
CN104903865B (zh) 将虚拟机vm映像应用于计算机系统的方法和系统
US8381185B2 (en) Apparatus, system, and method for dynamic module flow analysis
KR101968539B1 (ko) 타임 라인 기반의 라이브 포렌식 시각화 시스템 및 방법
CN113609008A (zh) 测试结果分析方法、装置和电子设备
KR101228902B1 (ko) 클라우드 컴퓨팅 기반 악성코드 분석 지원 시스템
CN110990282A (zh) 一种自动化单元测试方法
CN114242173A (zh) 一种mNGS鉴定微生物的数据处理方法、装置及存储介质
CN115565609B (zh) 一种针对dna测序数据的自动分析方法
CN102999504A (zh) 硬盘测试数据分析方法
JP2016018227A (ja) 作業ログ編集方法、情報処理装置、およびプログラム
CN115168124A (zh) 硬盘并发执行多个文件的稳定性测试方法、装置、计算机设备及介质
CN102999719B (zh) 一种基于硬件模拟器的恶意代码在线分析方法及系统
CN112365928B (zh) 生物信息数据分析和结果质控自动化方法和系统
CN114064510A (zh) 功能测试方法、装置、电子设备和存储介质
CN112612702A (zh) 一种基于web的自动测试方法及装置
CN114090650A (zh) 一种样本数据识别方法、装置、电子设备及存储介质
CN113342632A (zh) 仿真数据自动化处理方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant