CN102243697A - 群体突发病毒性疫情快速pcr检测引物文库及筛查系统 - Google Patents

群体突发病毒性疫情快速pcr检测引物文库及筛查系统 Download PDF

Info

Publication number
CN102243697A
CN102243697A CN 201010171235 CN201010171235A CN102243697A CN 102243697 A CN102243697 A CN 102243697A CN 201010171235 CN201010171235 CN 201010171235 CN 201010171235 A CN201010171235 A CN 201010171235A CN 102243697 A CN102243697 A CN 102243697A
Authority
CN
China
Prior art keywords
sequence
virus
primer
module
viral
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 201010171235
Other languages
English (en)
Inventor
程云
李林
李伯安
戚杨
迟淑萍
韩晋
苏峰
张永强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHANGHAI GENMINIX INFORMATICS CO Ltd
302th Hospital of PLA
Original Assignee
SHANGHAI GENMINIX INFORMATICS CO Ltd
302th Hospital of PLA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHANGHAI GENMINIX INFORMATICS CO Ltd, 302th Hospital of PLA filed Critical SHANGHAI GENMINIX INFORMATICS CO Ltd
Priority to CN 201010171235 priority Critical patent/CN102243697A/zh
Publication of CN102243697A publication Critical patent/CN102243697A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及一种群体突发病毒性疫情快速PCR检测引物文库及筛查系统。本发明是一种病毒引物设计及评测系统,它属于生物学和计算机数据库技术相结合的领域。主要由临床病毒学数据库模块、病毒序列数据库模块、病毒序列自动提取模块、病毒变异序列的功能预测、病毒种属特异性序列和病毒亚型特异性序列的筛选、引物生成和评价模块以及扩增产物注释模块七个部分组成。旨在能够实现:第一,根据目标基因序列设计最佳PCR扩增的病毒引物序列;第二,保证引物的特异性和准确性;第三,预测扩增片断在未经测序的状况下,与目标病毒的匹配程度;第四,根据PCR引物的扩增序列预测病毒的临床背景资料和参考治疗方案。

Description

群体突发病毒性疫情快速PCR检测引物文库及筛查系统
技术领域
本发明是一种病毒引物设计及评测系统,它属于生物学和计算机数据库技术相结合的领域。 
背景技术
聚合酶链式反应(Polymerase Chain Reaction,PCR)是一种体外快速扩增DNA的方法,用于放大特定的DNA片段,数小时内可使目的基因片段扩增到数百万个拷贝的分子生物学技术。PCR技术的基本原理类似于DNA的天然复制过程,其特异性依赖于与靶序列两端互补的寡核苷酸引物。PCR由变性--退火--延伸三个基本反应步骤构成:①模板DNA的变性:模板DNA经加热至93℃左右一定时间后,使模板DNA双链或经PCR扩增形成的双链DNA解离,使之成为单链,以便它与引物结合,为下轮反应作准备;②模板DNA与引物的退火(复性):模板DNA经加热变性成单链后,温度降至55℃左右,引物与模板DNA单链的互补序列配对结合;③引物的延伸:DNA模板--引物结合物在TaqDNA聚合酶的作用下,以dNTP为反应原料,靶序列为模板,按碱基互补配对与半保留复制原理,合成一条新的与模板DNA链互补的半保留复制链,重复循环变性--退火--延伸三过程就可获得更多的“半保留复制链”,而且这种新链又可成为下次循环的模板。每完成一个循环需2~4分钟,2~3小时就能将待扩目的基因扩增放大几百万倍。PCR技术作为常用的分子生物学技术之一在生命科学研究、医学科研及临床医学诊断、环境保护、农业等各个领域有着广泛的应用。 
引物设计是PCR反应中至关重要的一步,无法设计出合理的引物就不能扩增出目标序列。引物设计需要注意的地方很多,在大多数情况下,我们都是在知道已知模板序列时进行PCR扩增的。在某些情况比如构建文库的时候也会在不知道模板序列的情况下进行设计。这个时候随机核苷酸序列就与模板不是完全匹配。我们通常指的设计引物都是在已知模板序列的情况下进行。引物设计除了要考虑与模板正确匹配外,还要考虑到引物的特异性及热动力学参数等。 
在实际中,病毒的引物设计与其他物种的引物设计相比具有其自身的复杂性。病毒的变异速率极快,其自身的编码DNA或RNA的突变速率要远远高于其他生物,因此不断地有新的亚型产生,引物设计者要不断查找并更新当前病毒序列数据库的信息。此外对于某一种疾病来说,可能会有多个病毒共同作用导致发病,因此在知道具体的病毒种类之前也无法设计出合适的引物来扩增病毒序列,故常规的引物设计方法无法很好地满足病毒引物设计的需要。我们开发了一种全新的引物设计及评测系统,它能够快捷简便地自动更新病毒数据库信息及针对病种设计出适用的引物来用于病毒的临床检测。 
发明内容
本发明主要由临床病毒学数据库模块、病毒序列数据库模块、病毒序列自动提取模块、病毒变异序列的功能预测、病毒种属特异性序列和病毒亚型特异性序列的筛选、引物生成和评价模块以及扩增产物注释模块七个部分组成。旨在能够实现:第一,根据目标基因序列设计最佳PCR扩增的病毒引物序列;第二,保证引物的特异性和准确性;第三,预测扩增片断在未经测序的状况下,与目标病毒的匹配程度;第四,根据PCR引物的扩增序列预测病毒的临床背景资料和参考治疗方案。 
附图说明
图1是软件整体结构图。 
图2是临床病毒学数据库结构图。 
图3是批量化自动提取基因组序列,软件左侧为序列数据库。 
图4是批量化序列搜索与比对模块。界面右侧为序列数据库,界面上方为Blast搜索方法。 
具体实施方式
一、临床病毒学数据库模块 
临床病毒数据库包含了常见病毒性疾病的临床信息、治疗信息和病毒基本信息。利用该数据库,通过临床信息,可获取所有可能的病毒源,为下一步调取病毒基因组信息提供数据源。此外,对于新病毒种属或已知病毒新亚型导致的疾病,也将在疾病发布同时,将最全面的临床信息数据整合入本数据库。 
二、病毒序列数据库模块 
下载测序完成并公布的客户指定的病毒基因组序列,并构建序列数据库,序列数据库主要来源于GenBank、EMBL。序列数据库存储格式为Fasta格式。通过对已经公开报道的来源2235个病毒基因组的3309条参考序列和来源于类病毒的39条参考序列的整合,构建客户指定的与腹泻,非细菌性胃肠炎,呼吸道症状,肺炎,夏季感冒,手足口病,神经症状,脑炎,心肌炎,出血,肾病,视网膜炎,肝炎,皮肤、粘膜损害,禽类15种49个病毒基因组。所有物种的序列均需与GenBank、EMBL同步更新。此外,非常重要的是,对于新病毒种属和已知病毒种属的未知亚型,在已有测序结果的情况下,所有序列信息也将在公布同时装载入病毒序列数据库。 
三、病毒序列自动提取模块 
客户只需输入病毒序列的GenBank Accession Number和GI编号,通过本模块(嵌套其明公司自主开发的BlastDesk系统)即可批量化获得病毒基因组序列。序列为Fasta格式,供引 物生成和评价模块设计备选引物。 
四、病毒变异序列的功能预测 
1、密码子偏好数据库 
遗传密码有64种,但是绝大多数生物倾向于利用这些密码子中的一部分。那些被最频繁利用的称为最佳密码子(optimal codons),那些不被经常利用的称为稀有或利用率低的密码子(rare or low-usage codons)。利用偏爱密码子(preferred codons)并避免利用率低的或稀有的密码子,可以在不知道目的基因的编码序列的状况下,预测目的基因的氨基酸序列,为病毒基因功能以及特定宿主系统的选择提供参考。为此,我们应用密码子偏好数据库对新病毒种属或已知病毒新亚型的核酸序列进行翻译,此数据库根据GenBank35779个物种的3027973个完整蛋白编码区(自起始密码子至终止密码子)进行的密码子使用频率的统计而成。所以这个数据库中的结果基本可以反应各物种对密码子使用的偏向性。 
2、病毒变异的功能变化预测 
通过密码子分析,获得新病毒种属或病毒新亚型的氨基酸序列。通过分析氨基酸序列的结构域,预测氨基酸序列的功能组成;或利用blastp与蛋白结构数据库进行比对,确定结构相似的已知蛋白,从而确定病毒变异序列的功能。 
3、校正临床病毒数据库的校正 
若病毒变异造成功能变化(病毒发生有义突变),导致临床病毒数据库中相应指标变化以及药物作用效果变化,则病毒变异的新病毒种属或病毒新亚型对于的临床特征作用新特点增加如临床病毒数据库。 
五、病毒种属特异性序列和病毒亚型特异性序列的筛选 
1、筛选病毒种属特异性序列 
同一种疾病可能伴有多种不同属病毒感染,在病毒特异性引物设计时,必须获取病毒种属特异性序列作为引物设计的依据。通过49×49次病毒基因组多序列分析,并经过交叉验证,获得发现每个种属病毒特异性的基因组序列。 
2、筛选病毒亚型特异性序列 
同种属病毒包括多种亚型,在特定病毒性疾病中,可能由多种属病毒的特定亚型致病,因此,为了精确定位病毒亚型,必须对获取各种属病毒亚型特异性序列作为引物设计的依据。 
六、引物生成和评价模块 
根据病毒基因特异性序列,使用引物设计模块获取目标序列多条备选引物,而后使用热力学参数评价引物的质量:引物Tm值、GC比、简并性碱基、3’端稳定性、引物的稳定性、重复序列、二聚体/发卡结构和与模板之间的错配情况。所有参数基本状态为默认参数,若客 户需要修改,可进入参数配置页面修改。软件首先根据热力学参数从极高严谨性到极低严谨性设计多条备选引物,而后对备选引物自动搜索,筛选符合设定引物长度的寡核苷酸都被视为进一步候选引物。最终,用于PCR检测的是候选引物中检测病毒特异性、严谨度最高的前3对特异性引物。 
七、扩增产物注释模块 
经过引物生成和评价模块后生成的若干条单对引物,尽管在热力学参数上已经获得了优化,但其中仍有一些不能扩增目标片段的引物,理论上可以不用实验操作,筛除不能扩增目标片段的引物而选出能够扩增目标片段的引物。扩增产物注释模块可把单引物对检验设置成为多重引物组合,然后将这些组合与前期已构建的病毒基因组序列数据库进行blastn比对,批量化搜索所有引物扩增产物中最佳匹配的目标基因序列及其病毒种属。 

Claims (7)

1.一种病毒引物设计及评测系统,包括临床病毒学数据库模块、病毒序列数据库模块、病毒序列自动提取模块、病毒变异序列的功能预测、病毒种属特异性序列和病毒亚型特异性序列的筛选、引物生成和评价模块以及扩增产物注释模块七个部分。其特征在于根据目标基因序列设计最佳PCR扩增的病毒引物序列,保证引物的特异性和准确性。
2.根据权利要求1所述的临床病毒学数据库模块,其特征在于包含了常见病毒性疾病的临床信息、治疗信息和病毒基本信息,为下一步调取病毒基因组信息提供数据源。
3.根据权利要求1所述的病毒序列数据库模块,其特征在于下载测序完成并公布的客户指定的病毒基因组序列,并构建序列数据库。对于新病毒种属和已知病毒种属的未知亚型,在已有测序结果的情况下,所有序列信息也将在公布同时装载入病毒序列数据库。
4.根据权利要求1所述的病毒序列自动提取模块,其特征在于只需输入病毒序列的GenBankAccession Number和GI编号,通过本模块即可批量化获得病毒基因组序列。序列为Fasta格式,供引物生成和评价模块设计备选引物。
5.根据权利要求1所述的病毒变异序列的功能预测,其特征在于通过密码子分析,获得新病毒种属或病毒新亚型的氨基酸序列。通过分析氨基酸序列的结构域,预测氨基酸序列的功能组成;或利用blastp与蛋白结构数据库进行比对,确定结构相似的已知蛋白,从而确定病毒变异序列的功能。
6.根据权利要求1所述的引物生成和评价模块,其特征在于根据病毒基因特异性序列,使用引物设计模块获取目标序列多条备选引物,而后使用热力学参数评价引物的质量。
7.根据权利要求1所述的扩增产物注释模块,其特征在于可把单引物对检验设置成为多重引物组合,然后将这些组合与前期已构建的病毒基因组序列数据库进行blastn比对,批量化搜索所有引物扩增产物中最佳匹配的目标基因序列及其病毒种属。
CN 201010171235 2010-05-11 2010-05-11 群体突发病毒性疫情快速pcr检测引物文库及筛查系统 Pending CN102243697A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201010171235 CN102243697A (zh) 2010-05-11 2010-05-11 群体突发病毒性疫情快速pcr检测引物文库及筛查系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201010171235 CN102243697A (zh) 2010-05-11 2010-05-11 群体突发病毒性疫情快速pcr检测引物文库及筛查系统

Publications (1)

Publication Number Publication Date
CN102243697A true CN102243697A (zh) 2011-11-16

Family

ID=44961749

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201010171235 Pending CN102243697A (zh) 2010-05-11 2010-05-11 群体突发病毒性疫情快速pcr检测引物文库及筛查系统

Country Status (1)

Country Link
CN (1) CN102243697A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105590038A (zh) * 2014-10-22 2016-05-18 中国人民解放军军事医学科学院放射与辐射医学研究所 一种推断寡核苷酸在基因组上结合位点的方法和系统
CN110970093A (zh) * 2018-09-30 2020-04-07 深圳华大因源医药科技有限公司 一种筛选引物设计模板的方法、装置及应用
CN113161007A (zh) * 2021-03-29 2021-07-23 淄博市妇幼保健院(淄博市第三人民医院、淄博市妇女儿童医院) 一种妇产科临床卫生防护方法和系统
CN115101126A (zh) * 2022-02-22 2022-09-23 中国医学科学院北京协和医院 基于ce平台的呼吸道病毒和/或细菌亚型引物设计方法及系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105590038A (zh) * 2014-10-22 2016-05-18 中国人民解放军军事医学科学院放射与辐射医学研究所 一种推断寡核苷酸在基因组上结合位点的方法和系统
CN110970093A (zh) * 2018-09-30 2020-04-07 深圳华大因源医药科技有限公司 一种筛选引物设计模板的方法、装置及应用
CN113161007A (zh) * 2021-03-29 2021-07-23 淄博市妇幼保健院(淄博市第三人民医院、淄博市妇女儿童医院) 一种妇产科临床卫生防护方法和系统
CN115101126A (zh) * 2022-02-22 2022-09-23 中国医学科学院北京协和医院 基于ce平台的呼吸道病毒和/或细菌亚型引物设计方法及系统

Similar Documents

Publication Publication Date Title
Tjhung et al. An RNA polymerase ribozyme that synthesizes its own ancestor
Nawrocki Structural RNA homology search and alignment using covariance models
Linhart et al. The degenerate primer design problem: theory and applications
Linhart et al. The degenerate primer design problem
Gardner et al. A microbial detection array (MDA) for viral and bacterial detection
US7853408B2 (en) Method for the design of oligonucleotides for molecular biology techniques
Xie et al. Molecular variability and distribution of Sugarcane mosaic virus in Shanxi, China
Rampersad ITS1, 5.8 S and ITS2 secondary structure modelling for intra-specific differentiation among species of the Colletotrichum gloeosporioides sensu lato species complex
WO2004048511A2 (en) Bioinformatically detectable group of novel viral regulatory genes and uses thereof
US20090105092A1 (en) Viral database methods
Pasternak et al. The stability of the duplex between sense and antisense transcription-regulating sequences is a crucial factor in arterivirus subgenomic mRNA synthesis
US11062790B2 (en) Method for thoroughly designing valid and ranked primers for genome-scale DNA sequence database
CN102243697A (zh) 群体突发病毒性疫情快速pcr检测引物文库及筛查系统
Wang et al. High-throughput primer and probe design
Myrmel et al. Single primer isothermal amplification (SPIA) combined with next generation sequencing provides complete bovine coronavirus genome coverage and higher sequence depth compared to sequence-independent single primer amplification (SISPA)
Mann et al. PrimedSherlock: A tool for rapid design of highly specific CRISPR-Cas12 crRNAs
Han et al. Structural alignment of pseudoknotted RNA
Moss RNA2DMut: a web tool for the design and analysis of RNA structure mutations
Moss Computational prediction of RNA secondary structure
Tahi et al. In silico prediction of RNA secondary structure
Benders et al. Transcriptional analysis of the conserved ftsZ gene cluster in Mycoplasma genitalium and Mycoplasma pneumoniae
US20220243267A1 (en) Compositions and methods related to quantitative reduced representation sequencing
Dost et al. Structural alignment of pseudoknotted RNA
Yang et al. The complete mitogenome of Falco amurensis (Falconiformes, Falconidae), and a comparative analysis of genus Falco
Salari et al. smyRNA: a novel Ab initio ncRNA gene finder

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20111116