CN108804877B - 一种生物学基因dna序列比对方法 - Google Patents

一种生物学基因dna序列比对方法 Download PDF

Info

Publication number
CN108804877B
CN108804877B CN201810586206.5A CN201810586206A CN108804877B CN 108804877 B CN108804877 B CN 108804877B CN 201810586206 A CN201810586206 A CN 201810586206A CN 108804877 B CN108804877 B CN 108804877B
Authority
CN
China
Prior art keywords
user
sequence
module
dna
record
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810586206.5A
Other languages
English (en)
Other versions
CN108804877A (zh
Inventor
黄娅琳
吴思
郭海涛
蒋敬
马艳君
陈云霞
李文骞
徐燕红
刘昌景
刘大伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Forest Police College
Original Assignee
Nanjing Forest Police College
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Forest Police College filed Critical Nanjing Forest Police College
Priority to CN201810586206.5A priority Critical patent/CN108804877B/zh
Publication of CN108804877A publication Critical patent/CN108804877A/zh
Application granted granted Critical
Publication of CN108804877B publication Critical patent/CN108804877B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明公开了一种生物学基因DNA序列比对系统,系统包括序列检索比对模块、检索历史模块、序列提交模块、提交ID查询模块和提交历史查询模块,其中检索历史模块从序列检索比对模块中读取用户的查询记录,检索历史模块分为读取用户未登录状态和用户登录状态,如果是未登录状态则输出需要登陆的信息,如果是用户登录状态则读取相关用户的查询记录,提交ID查询模块从序列提交模块中读取特定ID的记录详细信息,提交历史查询模块从序列提交模块中读取对应用户的提交记录。另外,还公开了一种获取生物学基因DNA序列的方法,包括三个步骤:提取样本DNA,PCR扩增和PCR扩增片段测序。本发明解决了基因序列数据库的垄断问题和国内对现有比对系统使用的局限问题。

Description

一种生物学基因DNA序列比对方法
技术领域
本发明属于微生物的测定和检验技术领域,具体涉及一种生物学基因DNA序列比对系统以及获取DNA序列的方法。
背景技术
核苷酸序列(nucleotide sequence)是生物体遗传信息的载体,是现代生物学和生态学研究的基础数据。随着DNA提取和测序技术的进步,大量核苷酸序列被提取并存储在公共数据平台中。快速积累的基因数据极大地促进分子生物学、分子生态学、宏观生态学等相关学科的发展,使当前的生物学与生态学研究进入了基因时代。
随着野生动植物案件的增多,实验室提取到大量不确定物种的DNA片段,为了能够确定片段所属物种、为案件提供证据支持,各个组织对公共数据平台中已知物种的DNA序列进行整理分类,以自己的基因序列库为基础建立基因序列比对系统。在各个提供序列比对服务的组织中,美国国家生物技术信息中心(National Center for BiotechnologyInformation,NCBI)建立了目前世界上最大的核苷酸序列数据平台GenBank,自GenBank开放序列上传的功能之后,各个实验室纷纷将自己实验室获取的序列进行上传,希望与其他生物学工作者共同建成一个最具权威的基因序列比对平台。
GenBank收录了海量的基因序列数据,截至2015年2月,GenBank收录的基因序列总数已超过1.8亿条,序列长度总和已超过1012个碱基对,覆盖全球30多万个物种。它可以说是目前世界上增长最快、信息量最大的文献记录数据库。数据多自然导致数据的准确性下降,一方面原因是序列本身的特殊性,非原始实验室很难进行后期验证,另一方面是GenBank组织没有足够的人力与众多提交序列的实验室进行沟通确认序列情况,进而导致Genbank上出现了类似存储的奶牛和绵羊的基因组草图中发现了淋球菌这种低级错误。任何系统搭建与后期维护都需要资金,而GenBank数据库平台以十亿为数量级单位,维护成本比较高。最后,GenBank的开放性难以得到保证,因此,这些缺陷需要应用新的技术来弥补。
发明内容
针对GenBank平台存在的缺陷,本发明提出一种生物学基因DNA序列比对系统以及获取DNA序列的方法,可以有效解决GenBank数据库平台维护成本高、开放性差的不足。
为实现上述目的,本发明采用的技术方案为一种生物学基因DNA序列比对系统,该系统包括序列检索比对模块、检索历史模块、序列提交模块、提交ID查询模块和提交历史查询模块,其中,所述检索历史模块从所述序列检索比对模块中读取用户的查询记录,检索历史模块分为读取用户未登录状态和用户登录状态,如果是未登录状态则输出需要登陆的信息,如果是用户登录状态则读取相关用户的查询记录,所述提交ID查询模块从所述序列提交模块中读取特定ID的记录详细信息,所述提交历史查询模块从所述序列提交模块中读取对应用户的提交记录。
序列检索比对模块在用户进行查询操作时,根据用户登录状态会把用户信息存入数据表中,如果是未登录用户会,则将数据存入一个未登录用户表中,每一条记录表示一次查询;如果是登录用户,其查询历史会存入特定的登录用户表中,一条记录代表一位用户的所有查询历史;在存储查询历史的时候会遍历存储全体遗传信息载体的表格进行序列比对,并将比对结果或者错误信息输出到前台页面。
作为优选,上述用户信息包含ip地址、mac地址、操作系统类型、浏览器类型、查询序列、时间戳、ip对应地理位置。
序列提交模块读取用户登录状态时,将序列id与用户名存入保存特定用户提交序列信息的表中,一条记录代表一个用户的所有提交历史,将序列的详细情况存入保存提交序列的表格中。
提交ID查询模块读取所述保存提交序列的表格中特定id的序列情况,如果不存在则输出错误信息,如果存在则输出特定id的记录详细信息。
提交历史查询模块读取用户登录状态,如果用户登录,则从保存特定用户提交序列信息的表中读取对应用户的提交记录,并分割为数组进行输出;如果用户未登录,则提示用户登录。
本发明还进一步提出一种获取上述生物学基因DNA序列比对系统的DNA序列的方法,具体包括以下步骤:
(1)提取样本DNA;
(2)PCR扩增,增线粒体DNA上12S rRNA基因片段采用通用引物,扩增线粒体DNA上Cyt b基因片段采用自设计引物,12S rRNA基因片段和Cyt b基因片段均采用相同反应体系,反应体积为25μL,其中含2.5pmol/μL引物各2μL,2.5mM dNTPs 2μL,1.25U Ex Taq酶0.25μL,10×buffer 2.5μL,25mM MgCl2 1.5μL,10~20ng/μL模板1~2μL,其他为灭菌蒸馏水;93℃或94℃预变性3min;93℃或94℃变性30s,54℃—57℃之间任意温度退火30s,72℃延伸40s—1min,30—40个循环;72℃延伸7min—10min;4℃—8℃低温保温。扩增产物经1%—1.5%琼脂糖凝胶电泳,在凝胶成像系统上检测、成像。
(3)PCR扩增片段测序,PCR产物用PCR产物纯化,以纯化产物为模板DNA,用测序试剂盒进行测序,操作按试剂盒说明PCR扩增,扩增产物经甲酰胺变性后,用测序仪测序,所得序列即样本线粒体基因片段DNA序列。
提取样本DNA时,固体样本可直接剪取适量于离心管中,液体样本采用DNA提取试剂盒提取,然后采用分光光度法检测样本DNA的纯度和浓度,将样品总DNA置于-20℃—-70℃保存。
与现有技术相比,本发明具有以下有益的技术效果:
1,本发明对来自野生动物的各类检材的取样、DNA提取、种属特异的DNA分子标记的PCR扩增方法进行了系统的归纳总结,建立了一套适合与不同动物物种鉴定的分子标记技术。
2,本发明基于国家林业局森林公安司法鉴定中心历年案件鉴定中涉及的野生动物物种DNA序列,在国内首次构建了基于大量实验数据的野生动物基因比对数据库。该数据库克服了国外数据库(如美国国家生物技术信息中心(National Center forBiotechnology Information,NCBI)的核苷酸序列数据平台GenBank)数据信息来自全世界许多实验室,基因序列信息及物种名未经过专门机构通过试验进行验证,存在许多错误的弊端。
3,本发明构建的基因数据比对平台收录了大量国内常见的涉案野生动物及海关进出口常涉案的野生动物基因数据信息,可为后续的相关野生动物的种属鉴定提供可靠的数据比对平台,避免目前使用国外数据库导致的物种鉴定不准确、无国内特有物种、受国际形势影响数据库可能关闭的风险。
附图说明
图1是本发明序列检索比对模块流程图。
图2是本发明检索历史模块流程图。
图3是本发明序列提交模块流程图。
图4是本发明提交ID查询模块流程图。
图5是本发明提交历史查询模块流程图。
图6是内部检索前台页面。
图7是内部检索结果。
图8是序列详情。
图9是普通序列提交表单。
图10是提交结果页面。
图11是鉴定书序列提交页面。
图12是序列id查询页面。
图13是提交历史页面
具体实施方式
现结合说明书附图对本发明作进一步详细的说明。
依据本发明的一方面,为解决基因序列数据库的垄断问题和国内对现有比对系统使用的局限问题,本发明提供一种生物学基因序列比对系统,包括,
(1)序列检索比对模块,用户进行查询操作时,根据用户登录状态会把ip地址mac地址、操作系统类型、浏览器类型、查询序列、时间戳、ip对应地理位置存入数据表中,未登录用户会将数据存入seq_his_notlogin表中,每一条记录表示一次查询。登录用户的查询历史会存入seq_his_user表中,一条记录代表一位用户的所有查询历史。在存储查询历史的时候会遍历seq_ns表进行序列比对,将比对结果或者错误信息输出到前台页面,序列检索比对模块流程图见说明书附图1所示。
(2)检索历史模块,读取用户登录状态,如果用户未登录则输出需要登陆的信息,如果用户已经登陆,读取seq_his_user表中相关用户的查询记录。如果记录不存在或者读取失败则调试输出相关错误信息,记录存在则进行字符串的分割,分割为数组输出到前台。检索历史模块流程图见说明书附图2所示。
(3)序列提交模块,读取用户登录状态,如果用户登录则将序列id与用户名存入upload_his表中,一条记录代表一个用户的所有提交历史。将序列详细情况存入seq_upload中。序列提交模块流程图见说明书附图3所示。
(4)提交ID查询模块,读取seq_upload表中特定id的序列情况,如果不存在则输出错误信息,存在则输出特定id的记录详细信息,提交ID查询模块见说明书附图4所示。
(5)提交历史查询模块,读取用户登录状态,如果用户登录则去upload_his表中读取对应用户的提交记录,分割为数组进行输出,如果用户未登录则提示登录,提交ID查询模块见说明书附图5所示。
依据本发明的另一方面,本发明提供一种获取生物学基因序列的方法,包括,以下步骤:
(1)样本DNA的提取,固体样本可直接剪取适量于离心管中,液体样本采用DNA提取试剂盒提取,然后采用分光光度法检测样本DNA的纯度和浓度,将样品总DNA置于-20℃保存;
(2)PCR扩增,增线粒体DNA上12S rRNA基因片段采用通用引物,扩增线粒体DNA上Cyt b基因片段采用自设计引物,12S rRNA基因片段和Cyt b基因片段均采用相同反应体系,反应体积为25μL,其中含2.5pmol/μL引物各2μL,2.5mM dNTPs 2μL,1.25U Ex Taq酶0.25μL,10×buffer 2.5μL,25mM MgCl2 1.5μL,10~20ng/μL模板1~2μL,其他为灭菌蒸馏水。
(3)PCR扩增片段测序
PCR产物用PCR产物纯化。以纯化产物为模板DNA,用测序试剂盒进行测序,操作按试剂盒说明PCR扩增,扩增产物经甲酰胺变性后,用测序仪测序,所得序列即样本线粒体基因片段DNA序列。
1.序列检索
(1)内部检索
内部检索前台页面设计较为简单,只有一个序列输入框与检索按钮如说明书附图6,输入框会对用户输入字符进行过滤,只保留ATCG四种字符,点击序列检索按钮就会开始检索。系统会将seq_ns表中所有序列与用户输入序列进行比对,将序列相似度超过80%的序列排序后显示到前台如说明书附图7,点击查看详情,可以看到匹配成功序列的详细信息如说明书附图8。
(2)NCBI外链
NCBI外链使用的是iframe嵌入ncbi的blast检索系统,方便用户直接在genebank上检索基因序列。在系统建设初期,后台存储的序列数据库是远远不够的,ncbi的外部检索接口是必要的。
2.检索历史
点击检索历史选项卡之后会根据当前登录用户返回检索历史,包括ip地址、mac地址、操作系统、所用浏览器、查询时间、ip所在地、查询序列。
3.序列提交
(1)普通序列提交
提交页面如图9,提交表单包括序列所有者、物种中文名、物种拉丁名、保护等级、提交的序列、电话/手机、邮箱、、补充留言。该功能主要用于其它组织或者个人有意愿提交序列时开放的接口,序列提交到后台保存默认是未审核状态,需要后期人工审核通过才会加入检索数据库中。在序列提交成功后会将提交的那些信息输出给用户浏览,并且会生成一个与数据库中所有序列不同的唯一序列id输出到前台给用户,页面如图10。后期用户想查询审核情况时,就可以根据序列id进行检索。
(2)鉴定书序列提交
提交页面如图11,提交表单包括送检日期、送检方、案件名称、鉴定意见、物种中文名、物种拉丁名、保护等级、提交的序列。主要用于类似国家林业局森林司法鉴定中心鉴定书式的序列提交,对鉴定书内容进行收录是为了后期可能会开发的鉴定书管理功能。
4.提交id查询
当用户查询以前提交的序列审核情况时,可以根据序列id查询对应序列详情与审核情况,如图12。
5.提交历史
点击提交历史选项卡之后会根据当前登录用户自动返回提交历史如图13,表内数据包括序列ID、提交时间、序列详情页面链接。
需要说明的是,以上具体实施方式的描述并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (1)

1.一种生物学基因DNA序列比对方法,其特征在于,包括以下步骤:
(1)提取样本DNA;
(2)PCR扩增,增线粒体DNA上12S rRNA基因片段采用通用引物,扩增线粒体DNA上Cyt b基因片段采用自设计引物,12S rRNA基因片段和Cyt b基因片段均采用相同反应体系,反应体积为25μL,其中含2.5pmol/μL引物各2μL,2.5mM dNTPs 2μL,1.25U Ex Taq酶0.25μL,10×buffer 2.5μL,25mM MgCl2 1.5μL,10~20ng/μL模板1~2μL,其他为灭菌蒸馏水;93℃或94℃预变性3min;93℃或94℃变性30s,54℃—57℃之间任意温度退火30s,72℃延伸40s—1min,30—40个循环;72℃延伸7min—10min;4℃—8℃低温保温;扩增产物经1%—1.5%琼脂糖凝胶电泳,在凝胶成像系统上检测、成像;
(3)PCR扩增片段测序,PCR产物用PCR产物纯化,以纯化产物为模板DNA,用测序试剂盒进行测序,操作按试剂盒说明PCR扩增,扩增产物经甲酰胺变性后,用测序仪测序,所得序列即样本线粒体基因片段DNA序列;
固体样本能直接剪取适量于离心管中,液体样本采用DNA提取试剂盒提取,然后采用分光光度法检测样本DNA的纯度和浓度,将样品总DNA置于-20℃保存;
上述方法使用的系统包括序列检索比对模块、检索历史模块、序列提交模块、提交ID查询模块和提交历史查询模块,其中,所述检索历史模块从所述序列检索比对模块中读取用户的查询记录,检索历史模块分为读取用户未登录状态和用户登录状态,如果是未登录状态则输出需要登陆的信息,如果是用户登录状态则读取相关用户的查询记录,所述提交ID查询模块从所述序列提交模块中读取特定ID的记录详细信息,所述提交历史查询模块从所述序列提交模块中读取对应用户的提交记录,具体包括:
序列检索比对模块:用户进行查询操作时,根据用户登录状态会把ip地址mac地址、操作系统类型、浏览器类型、查询序列、时间戳、ip对应地理位置存入数据表中,未登录用户会将数据存入seq_his_notlogin表中,每一条记录表示一次查询,登录用户的查询历史会存入seq_his_user表中,一条记录代表一位用户的所有查询历史,在存储查询历史的时候会遍历seq_ns表进行序列比对,将比对结果或者错误信息输出到前台页面;
检索历史模块:读取用户登录状态,如果用户未登录则输出需要登陆的信息,如果用户已经登陆,读取seq_his_user表中相关用户的查询记录,如果记录不存在或者读取失败则调试输出相关错误信息,记录存在则进行字符串的分割,分割为数组输出到前台;
序列提交模块:读取用户登录状态,如果用户登录则将序列id与用户名存入upload_his表中,一条记录代表一个用户的所有提交历史,将序列详细情况存入seq_upload中;
提交ID查询模块:读取seq_upload表中特定id的序列情况,如果不存在则输出错误信息,存在则输出特定id的记录详细信息;
提交历史查询模块:读取用户登录状态,如果用户登录则去upload_his表中读取对应用户的提交记录,分割为数组进行输出,如果用户未登录则提示登录。
CN201810586206.5A 2018-06-08 2018-06-08 一种生物学基因dna序列比对方法 Active CN108804877B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810586206.5A CN108804877B (zh) 2018-06-08 2018-06-08 一种生物学基因dna序列比对方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810586206.5A CN108804877B (zh) 2018-06-08 2018-06-08 一种生物学基因dna序列比对方法

Publications (2)

Publication Number Publication Date
CN108804877A CN108804877A (zh) 2018-11-13
CN108804877B true CN108804877B (zh) 2019-07-05

Family

ID=64087939

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810586206.5A Active CN108804877B (zh) 2018-06-08 2018-06-08 一种生物学基因dna序列比对方法

Country Status (1)

Country Link
CN (1) CN108804877B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112614545B (zh) * 2020-12-29 2022-11-01 暨南大学 一种支持多属性匿名认证的基因序列安全比对方法及系统
CN113012755B (zh) * 2021-04-12 2023-10-27 聊城大学 基因组atcg的检索方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103744880A (zh) * 2013-12-20 2014-04-23 浪潮(北京)电子信息产业有限公司 一种基于云计算的dna数据管理方法及系统
CN106021979A (zh) * 2016-05-12 2016-10-12 北京百迈客云科技有限公司 人基因组重测序数据分析系统及方法
CN107358056A (zh) * 2017-07-24 2017-11-17 扬州医联生物科技有限公司 一种自动在线全面分析基因组序列的方法
CN107748839A (zh) * 2017-09-15 2018-03-02 广州视源电子科技股份有限公司 白板信息读取方法、装置、可读存储介质和电子白板

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103744880A (zh) * 2013-12-20 2014-04-23 浪潮(北京)电子信息产业有限公司 一种基于云计算的dna数据管理方法及系统
CN106021979A (zh) * 2016-05-12 2016-10-12 北京百迈客云科技有限公司 人基因组重测序数据分析系统及方法
CN107358056A (zh) * 2017-07-24 2017-11-17 扬州医联生物科技有限公司 一种自动在线全面分析基因组序列的方法
CN107748839A (zh) * 2017-09-15 2018-03-02 广州视源电子科技股份有限公司 白板信息读取方法、装置、可读存储介质和电子白板

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
三种鹿科动物线粒体全基因组序列的测定及分析;查代明等;《首届中国鹿业发展大会暨中国畜牧业协会鹿业分会成立大会》;20150731;232-241
梅花鹿线粒体全基因组的测序及分析;邵元臣等;《第四届(2013)中国鹿业发展大会论文集》;20140820;156-168
鹿源类中药材DNA序列分析及马鹿和梅花鹿的PCR鉴定;白根本等;《中草药》;20061031;第37卷(第10期);1566-1568

Also Published As

Publication number Publication date
CN108804877A (zh) 2018-11-13

Similar Documents

Publication Publication Date Title
McCormack et al. Sequence capture of ultraconserved elements from bird museum specimens
Carpenter et al. Access to RNA-sequencing data from 1,173 plant species: The 1000 Plant transcriptomes initiative (1KP)
Zhang et al. Phylogenomics from low‐coverage whole‐genome sequencing
Murray et al. Scrapheap challenge: a novel bulk-bone metabarcoding method to investigate ancient DNA in faunal assemblages
Jones et al. Barcode UK: A complete DNA barcoding resource for the flowering plants and conifers of the United Kingdom
Tice et al. PhyloFisher: a phylogenomic package for resolving eukaryotic relationships
Doro et al. Phylogeny and patterns of diversity of goat mtDNA haplogroup A revealed by resequencing complete mitogenomes
CN108804877B (zh) 一种生物学基因dna序列比对方法
Nugent et al. coil: an R package for cytochrome c oxidase I (COI) DNA barcode data cleaning, translation, and error evaluation
Jiao et al. DNA barcoding for wood identification: Global review of the last decade and future perspective
CN108866171A (zh) 一种基于新一代测序的古生物物种鉴定方法
Churcheward et al. MAGNETO: an automated workflow for genome-resolved metagenomics
CN111554349B (zh) 一种基于高通量测序的物种鉴定系统和方法
CN106636319A (zh) 快速鉴别东白眉长臂猿和北白颊长臂猿的分子生物学方法
CN109943644A (zh) 鼠种的分子鉴定方法
van den Burg et al. Bird genetic databases need improved curation and error reporting to NCBI
CN104726577B (zh) 一种与二花脸母猪产仔性状相关的snp标记及其检测方法
Cappelli et al. Size Matters:: Analyses of Benthic Foraminiferal Assemblages Across Differing Size Fractions
Wei et al. Chromosome-level genome assembly and annotation of the Yunling cattle with PacBio and Hi-C sequencing data
Pietersen et al. Multi‐locus phylogeny of African pipits and longclaws (Aves: Motacillidae) highlights taxonomic inconsistencies
Jin et al. A DNA barcode library for woody plants in tropical and subtropical China
CN117954040A (zh) 一种基于大模型的高精度dna分析报告生成方法
Falk et al. The genome sequence of Tenthredo notha Klug, 1814, a sawfly
CN117051115B (zh) 用于进出境牛和猪种属和种系鉴定的引物组及应用
Falk et al. The genome sequence of the small spotty-eyed dronefly, Eristalinus sepulchralis (Linnaeus, 1758)

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant