CN115101126B - 基于ce平台的呼吸道病毒和/或细菌亚型引物设计方法及系统 - Google Patents

基于ce平台的呼吸道病毒和/或细菌亚型引物设计方法及系统 Download PDF

Info

Publication number
CN115101126B
CN115101126B CN202210164390.0A CN202210164390A CN115101126B CN 115101126 B CN115101126 B CN 115101126B CN 202210164390 A CN202210164390 A CN 202210164390A CN 115101126 B CN115101126 B CN 115101126B
Authority
CN
China
Prior art keywords
primer
primers
designing
virus
screening
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210164390.0A
Other languages
English (en)
Other versions
CN115101126A (zh
Inventor
杨启文
李梦
张奇
黄舒
徐利娟
胡欢
陈初光
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Yuewei Gene Technology Co ltd
Peking Union Medical College Hospital Chinese Academy of Medical Sciences
Original Assignee
Beijing Yuewei Gene Technology Co ltd
Peking Union Medical College Hospital Chinese Academy of Medical Sciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Yuewei Gene Technology Co ltd, Peking Union Medical College Hospital Chinese Academy of Medical Sciences filed Critical Beijing Yuewei Gene Technology Co ltd
Priority to CN202210164390.0A priority Critical patent/CN115101126B/zh
Publication of CN115101126A publication Critical patent/CN115101126A/zh
Application granted granted Critical
Publication of CN115101126B publication Critical patent/CN115101126B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/20Polymerase chain reaction [PCR]; Primer or probe design; Probe optimisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioethics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Epidemiology (AREA)
  • Analytical Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Public Health (AREA)

Abstract

本发明涉及生物信息学分析领域,具体公开一种基于CE平台的针对呼吸道病毒和/或细菌亚型的引物设计方法和流程,该方法能够有效对选定的病毒和/或细菌进行引物设计,可识别大多数亚型,相较于传统方法具有显著的特异性和准确性优势。

Description

基于CE平台的呼吸道病毒和/或细菌亚型引物设计方法及系统
技术领域
本发明涉及生信分析技术领域,具体涉及一种基于CE平台的呼吸道病毒和/或细菌亚型引物设计方法及系统。
技术背景
快速可靠的病毒亚型(或者病毒株和/或细菌的亚型,这里统称为亚型)鉴定对于准确诊断感染、有效应对疫情爆发以及对高致病性病毒亚型(如禽流感H5N1)的全球监测是至关重要。
聚合酶链反应(PCR)已成为病毒亚型鉴定的首选方法。然而,设计亚型特异性PCR引物对是非常具有挑战性的任务:一方面,选择的引物对必须在亚型内存在显著程度的序列异质性的情况下产生稳健的扩增,另一方面,它们必须区分感兴趣的亚型和密切相关的亚型。
现有的引物设计工具并不适合设计用于亚型鉴定的PCR引物。诸如Primer3等常用包寻求扩增单个已知靶核酸序列,并且在亚型内存在高度序列异质性的情况下不能保证扩增敏感性。一种广泛使用的病毒识别引物设计方法依赖于首先从目标病毒序列的多重比对构建“多重序列比对”。在掩蔽了相关病毒基因组中也出现的区域后,剩余的“独特”区域将使用标准工具(如Primer3)进行引物挖掘。这种方法可以非常成功地找到物种特异性引物,因为病毒基因组通常包括高度保守的基因和在复制、转录和包装中起关键作用的非编码区。基于这一原理,本发明开发了一套自动设计毛细管电泳平台CE平台引物的生物信息学流程,用来区分病毒和其它物种,并且能够识别大多数的亚型。鉴于此,提出本发明。
发明内容
本发明要解决的核心技术问题是寻求一种适于CE平台的、能够快速可靠的鉴定病毒和/或细菌亚型的PCR引物设计方法。
为解决上述技术问题,本发明经研究探索,结合多个数据库,使用并组合多个生物信息学方法(包括多重序列比对算法abpoa和musgy,序列比对算法NCBI blast和bowtie来实现一个自动在CE平台内设计引物的生物新学流程),经多轮筛选最终实现在病毒和/或细菌中自动设计针对CE平台的亚型区分引物。
具体的,本发明提出如下技术方案:
本发明首先提供一种基于CE平台的病毒和/或细菌的引物设计方法,所述方法包括:
1)数据集下载:分别对病毒和/或细菌的数据集进行下载;
2)多重序列比对:分别对病毒和/或细菌序列进行多重比对;
3)候选引物集设计:通过多重比对选取平均保守分值高的区域作为候选区域进行引物设计,分别从正、负链中挑选引物;
4)引物过滤初筛;通过引物长度、TM值和/或二聚体进行过滤,并使用支持向量机的方式进一步筛选扩增效率高的引物,获得初筛引物;
5)引物特异性复筛:将所有初筛引物在NR数据库中进行特异性复筛;
6)CE引物终筛确认:CE平台同一通道内所有引物的扩增长度不相近或不重叠。
进一步的,所述1)中病毒数据集下载自NCBI virus数据库,所述细菌数据集下载自ENSEMBL细菌数据库。
进一步的,所述2)中的多重比对采用abpoa对病毒序列进行多重比对;采用mugsy对细菌序列进行多重比对。
进一步的,所述3)中所述平均保守分值>=8),所述保守区域长度大于1000bp。
进一步的,所述3)中的过滤具体为:
设置如下任一或多个过引物滤条件,对引物进行过滤获得初筛引物:
引物长度:18~32;
引物TM值:53~62;
引物自身不形成二级结构;
引物间不形成二聚体;
进一步的,所述4)中的使用支持向量机方式进一步的筛选扩增效率高的引物,具体为:利用积累的数千个的已知扩增效率的引物,计算引物在3’和5’端不同距离内的GC含量、TM值信息,构建特征集合,使用支持向量机进行训练和预测,选取高效率的引物作为下一步的输入。
进一步的,所述5)中所述特异性复筛为使用bowite将初筛引物比对到NR数据库,舍弃够比对到其它物种的引物。
进一步的,所述6)中所述引物的扩增长度为100-500bp;
优选的,所述引物针对不同病毒和/或细菌的扩增长度相差50-100bp;
更优选的,所述引物针对不同病毒和/或细菌的扩增长度分为100-200,200-300,300-400和400-500四个长度区域,且针对一种病毒或细菌,只选取一个长度区域内的引物对。
进一步的,所述病毒和/或细菌为呼吸道病毒和/或细菌。
进一步的,所述病毒为H5N1病毒,所述H5N1的最终引物序列为:
fluH5-F1-primer3 TGAGTTCCTGAATGTACCGGA;fluH5-R1-primer3TGGACCAAGAGCTCCTAGGA。
本发明还提供一种计算机可读介质,其存储有计算机程序,所述计算机程序被处理器执行时,实现上述任一所述方法。
本发明还提供一种电子设备,包括处理器以及存储器,所述存储器上存储一条或多条可读指令,所述一条或多条可读指令被所述处理器执行时,实现上述任一所述方法。
本发明有益技术效果:
1)本发明针对病毒和/或细菌,通过自主设计的多重比对、初筛、复筛和确认等步骤,实现了基于CE平台的引物自动化设计。
2)本发明基于多重比对方法设计的引物能够检测区分目标物种(病毒或细菌)中更多的亚型。
3)本发明首次提出专门适于CE平台的引物设计方法,本方法步骤中不仅涉及软件的探索,还引入机器学习等,在特异性和准确性方面,显著优于传统引物设计软件。
附图说明
图1、本发明生信流程图;
图2、病毒H5N1、肺炎链球菌和百日咳杆菌多重序列比对的示意图;
图3、H5N1引物设计多层滤图;
图4、实施例1中使用本发明开发的生物信息学流程针对A型流感病毒在CE平台上扩增的结果图;
图5、实施例1中使用本发明开发的生物信息学流程针对H5流感病毒在CE平台上扩增的结果图;
图6、实施例3中针对呼吸道感染相关的病原菌的混合检测结果图;
图7、实施例3中针对呼吸道感染相关的病原菌的特异检测结果图。
具体实施方式
下面将结合实施例对本发明的实施方案进行详细描述,但是本领域技术人员将会理解,下列实施例仅用于说明本发明,而不应视为限制本发明的范围。实施例中未注明具体条件者,按照常规条件或制造商建议的条件进行。所用试剂或仪器未注明生产厂商者,均为可以通过市场购买获得的常规产品。
部分术语定义
除非在下文中另有定义,本发明具体实施方式中所用的所有技术术语和科学术语的含义意图与本领域技术人员通常所理解的相同。虽然相信以下术语对于本领域技术人员很好理解,但仍然阐述以下定义以更好地解释本发明。
如本发明中所使用,在提及单数形式名词时使用的不定冠词或定冠词例如“一个”或“一种”,“所述”,包括该名词的复数形式。
如本发明中所使用,术语“包括”、“包含”、“具有”、“含有”或“涉及”为包含性的(inclusive)或开放式的,且不排除其它未列举的元素或方法步骤。术语“由…组成”被认为是术语“包含”的优选实施方案。如果在下文中某一组被定义为包含至少一定数目的实施方案,这也应被理解为揭示了一个优选地仅由这些实施方案组成的组。
本发明中的术语“大约”表示本领域技术人员能够理解的仍可保证论及特征的技术效果的准确度区间。该术语通常表示偏离指示数值的±10%,优选±5%。
此外,说明书和权利要求书中的术语第一、第二、第三、(a)、(b)、(c)以及诸如此类,是用于区分相似的元素,不是描述顺序或时间次序必须的。应理解,如此应用的术语在适当的环境下可互换,并且本发明描述的实施方案能以不同于本发明描述或举例说明的其它顺序实施。
以上术语或定义仅仅是为了帮助理解本发明而提供。这些定义不应被理解为具有小于本领域技术人员所理解的范围。
本发明所述的亚型引物设计方法,大体步骤如图1所示,包括:1)数据集下载:分别对病毒和/或细菌的数据集进行下载;2)多重序列比对:分别对病毒和/或细菌序列进行多重比对;3)候选引物集设计:通过多重比对得到MAF文件,选取平均保守分值高的区域作为候选区域进行引物设计,分别从正、负链中挑选引物;4)引物过滤初筛;通过引物长度、TM值和/或二聚体过滤,对引物进行过滤获得初筛引物;5)引物特异性复筛:将所有初筛引物在NR数据库中进行特异性复筛;6)CE引物终筛确认:CE平台同一通道内所有引物的扩增长度不相近或不重叠。
本发明所述的“亚型”指表型相似的同一物种的种群的集群,其包括了病毒亚型、病毒株(病毒亚型的进一步细分)或细菌的亚型。
在一些实施方式中,所述1)中病毒数据集下载自NCBI virus数据库,所述细菌数据集下载自ENSEMBL细菌数据库。
在一些实施方式中,所述2)中的多重比对优选采用abpoa对病毒序列进行多重比对,采用mugsy对细菌序列进行多重比对。
在一些实施方式中,所述3)中所述平均保守分值>=80%),所述保守区域长度大于1000bp。
在一些实施方式中,所述3)中的过滤具体为:设置如下任一或多个过引物滤条件,对引物进行过滤获得初筛引物:引物长度:18~32;引物TM值:53~62;引物自身不形成二级结构;引物间不形成二聚体;优选的,包括所有条件。
在一些实施方式中,所述4)中所述特异性复筛为使用bowite将初筛引物比对到NR数据库,舍弃够比对到其它物种的引物。
在一些实施方式中,所述5)中所述引物的扩增长度为100-500bp;在一些优选的实施方式中,所述引物针对不同病毒和/或细菌的扩增长度相差50-100bp;在一些更优选的实施方式中,所述引物针对不同病毒和/或细菌的扩增长度分为100-200,200-300,300-400和400-500四个长度区域,且针对一种病毒或细菌,只选取一个长度区域内的引物对。
不做限制,本发明方法可以针对各种细菌或病毒的亚型引物设计,在一些优选的实施方式中,所述病毒或细菌为呼吸道病毒或细菌;在一些示例性实施方式中,所述病毒具体为fluH5或InfA,所述引物具体序列为:fluH5-F1-primer3 TGAGTTCCTGAATGTACCGGA;fluH5-R1-primer3 TGGACCAAGAGCTCCTAGGA;或InfA-F1:CTTCTRACMGAGGTCGATTCG;InfA-R1:CTGCAGTCCYCGYTGTCTG。
下面结合具体实施例来阐述本发明。
试验例本发明方法构建
1)数据下载
病毒数据集合下载自NCBI virus数据库。细菌数据集合下载自ENSEMBL细菌数据库。NR数据库直接从NCBI的blast数据库集合中下载。
2)多重序列比对
对于病毒序列,由于其序列长度较短而且亚型数据较多,通过对比试验筛选(如下表和图2),本发明确定其多重序列比对使用abpoa,abpoa原理是使用比对图的方式来找到最优的多重比对,尤其适合这种个数多但是长度短的比对,可以在几分钟内完成数千个序列的比对。
下表为比对6000个H5N1的基因组时采用不同软件用时:
软件 abpoa Mugsy kalign Muscel
使用时长 10分钟 >一天 >一天 >一天
对于细菌的多重序列比对,由于其基因组相对较大(通常远远大于细菌和病毒),本发明经试验确立,使用mugsy进行多重序列比对,mugsy特别适合比对大的基因组,例如脊椎动物和人类(如图2)。
3)候选引物集设计
通过多重比对得到MAF文件,MAF文件分段的记录了多个物种比对的情况并且给出了保守度的分值,选取分值最高的几个区域作为候选区域进行引物设计(平均保守分值>=80%)。因为CE平台主要依靠长度区分不同的引物对,因此要求整段区域的保守性。本发明保守区域的长度必须大于1000bp,因为CE的长度通常小于1000bp,这样可以有丰富的引物候选空间。然后分别从正、负两个链中挑选引物。
4)引物过滤初筛
设置如下过引物滤条件,对引物进行过滤获得初筛引物:
引物长度:18~32;
引物TM值:53~62;
引物自身不形成二级结构;
引物间不形成二聚体。
进一步基于机器学习,使用支持向量机筛选扩增效率高的引物:
利用积累的多达数千个的已知扩增效率的引物,计算引物在3’和5’端不同距离内的GC含量、TM值等信息构建了~200个特征集合,例如GC_3_3表示的是距离3’端3bp内的GC的含量,GC_3_5表示的是距离3端5bp内的GC的含量,使用支持向量机的方法进行训练和预测。最终选取高效率的引物作为下一步的输入。
5)引物特异性复筛
将所有初筛引物在NR数据库中进行特异性检测,优选使用blast(或者bowite)比对到NR数据库,如能够比对到其它的物种,则认为这对引物的特异性不够,舍弃。在比对到NR数据库时要排除掉当前正在设计的物种。由于是多重体系,非特异的另一个来源是不同位点的引物混合,例如位点1的引物和位点2的引物扩增了其它的位置,本发明使用bowtie比对这些引物到NR数据库并且移除产生非特异扩增的引物。相比于其它软件,bowite具有比对时间段,灵敏度高的特点,下表列出了使用不同软件对10,000对引物的特异性的查询结果。一个筛选引物的例子如图3所示。
Figure BDA0003515120880000071
6)引物确认:包含通道筛选+长度筛选
具体的,在CE的引物设计中,同一通道内的引物扩增的长度不能过于相近或者重叠。因此需避免同一通道内引物扩增长度的重叠。另一方面,CE的线性扩增区域一般是100-500之间,探索发现在这个区域内,荧光强度和产物量成正比。因此,本发明将100-500的区域划分为100-200,200-300,300-400,400-500四个区域,然后把合格的引物配对,标记扩增长度,假设引物两端各有n个引物,则配对后的空间复杂度由O(2n)变成O(n2)。针对不同病毒的引物对选择不同的候选扩增长度区间(例如病毒1的引物选择在100-200的区间,则病毒2的引物就应该避开100-200的区间,而选择在200-500的区间),这样能够让扩增的片段不重合。在填满了一通道后,后续病毒引物重复使用上述的方法继续填满其它的通道。
实施例1针对病毒亚型的引物设计
针对A型和H5流感病毒设计引物其中的一个。首先从NCBI virus上找到流感A型病毒的所有的亚型,然后运行如上描述的生信流程,得到最终的引物。挑选其中的一对进行合成测试,引物如下表和CE结果如图4-5。更进一步,本发明把两者混合在一起进行扩增,在10次实验中(每次都是用不同的病毒株混合),发现特异性为100%,每次都只能够检测到设计病毒的DNA。
实验过程及试剂:
质粒DNA转录成RNA以及RNA纯化用到的试剂盒采用T7 High EfficiencyTranscription Kit、
Figure BDA0003515120880000072
RNA Purification Kit,购自北京全式金生物技术股份有限公司;一步法试剂为HiScript II U+One Step qRT-PCR Probe Kit,购自南京诺唯赞生物科技股份有限公司。引物mix中引物比例为1:1:1:1;模板:均为假病毒(103拷贝)。
序号 模板
1 Influenza A
2 H5N1
3 H3N2
4 H1N1
5 H7N9
6 肺炎支原体
7 肺炎衣原体
①反应体系
成分10ul 单反应量
2×One Step U+Mix 10
One Step U+Enzyme Mix 0.5
10×引物mix 2
RNase-free ddH2O 6.5
模板 1
合计 20ul
②扩增程序
Figure BDA0003515120880000081
③检测体系
通过本发明的设计方法的设计的引物序列如下:
上机混合液组分 单反应量(ul)
内标QD550(购自苏州阅微) 0.2
产物 1
Hidi(购自ABI) 8.8
合计 10ul
Figure BDA0003515120880000091
基于上述引物在CE平台上进行扩增检测,具体检测结果如图4-5所示,交叉实验结果如下表:
Figure BDA0003515120880000092
上述结果表明:本发明针对各亚型病毒的检测均能够正常检出相应的病毒,并且交叉反应结果显示了各引物具有很好的特异性,且无非特异检测。
实施例2针对细菌亚型的引物设计
按照本发明生信流程,进一步针对呼吸道感染相关的病原菌进行引物设计,挑选其中的部分引物进行合成,进行扩增测试,引物的序列见下表,测试包括两个方面:一是单引物测试(靶标检测和交叉检测),二是混合检测,结果分别如图6-7。
实验过程及试剂如下:
病原菌DNA提取用到的试剂盒为病原微生物基因组DNA提取试剂盒、厂家康为世纪生物科技有限公司;2×Buffer A购自苏州阅微,Taq酶购自罗氏。
设计的检测引物如下
Figure BDA0003515120880000093
Figure BDA0003515120880000101
引物mix(10×)配比1:1:1:1:1:1:1:1。
①反应体系
成分10ul 单反应量(ul)
2×Buffer A(含dUTP) 10
Taq酶 0.5
6.5
引物mix(10×) 2
模板 1
合计 20
②反应程序
Figure BDA0003515120880000102
③检测体系
上机混合液组分 单反应量(ul)
内标QD550(购自苏州阅微) 0.2
产物 1
Hidi(购自ABI) 8.8
合计 10ul
模板:
Figure BDA0003515120880000103
Figure BDA0003515120880000111
混合检测结果如图6所示,特异性检测结果如图7所示;交叉模板测试结果如下表统计:
Figure BDA0003515120880000112
结论:通过本发明设计的引物,针对各细菌检测均能够正常检出相应的细菌,交叉反应结果显示了各引物特异性极佳,检测范围内无明显非特异情况。
实施例3与Primer3引物设计软件的比较
目前设计引物最常用的软件是Primer3,为了和本发明进行特异性和准确度比较,本实施例比较primer3和本发明方法,对比结果表明本发明的方法能够有效的减少非特异的引物,并且能够检测到大多数的病毒株(亚型)。样本来源和实验步骤同实例1,如下针对H5N1为例,设计的引物和得到的结果如下:
Figure BDA0003515120880000121
上述结果表明,相比于Primer3,本发明引物设计方法能够准确的找到全部10种亚型,并且不会检测到其它非H5N1的病毒株,因此本发明的特异性和准确性优于传统引物设计软件。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (10)

1.一种基于CE平台的针对病毒和/或细菌亚型的引物设计方法,其特征在于,所述方法包括:
1)数据集下载:分别对病毒和/或细菌的数据集进行下载;
2)多重序列比对:分别对病毒和/或细菌序列进行多重比对;
3)候选引物集设计:通过多重比对选取平均保守分值高的区域作为候选区域进行引物设计,分别从正、负链中挑选引物;所述平均保守分值高为>=80%,所述区域的长度大于1000bp;
4)引物过滤初筛:通过引物长度、TM值和/或二聚体进行过滤;并使用支持向量机方式筛选扩增效率高的引物,获得初筛引物;
5)引物特异性复筛:将所有初筛引物在NR数据库中进行特异性复筛;
6)CE引物终筛:CE平台同一通道内所有引物的扩增长度不相近或不重叠。
2.权利要求1所述的引物设计方法,其特征在于,所述1)中病毒数据集下载自NCBIvirus数据库,所述细菌数据集下载自ENSEMBL细菌数据库。
3.权利要求1-2任一所述的引物设计方法,其特征在于,所述2)中的所述多重比对采用abpoa对病毒序列进行多重比对;所述多重比对采用mugsy对细菌序列进行多重比对。
4.权利要求1-2任一所述的引物设计方法,其特征在于,所述4)中的过滤具体为:
设置如下任一或多个过引物滤条件,对引物进行过滤获得初筛引物:
引物长度:18~32;
引物TM值:53~62;
引物自身不形成二级结构;
引物间不形成二聚体。
5.权利要求1-2任一所述的引物设计方法,其特征在于,所述4)中使用支持向量机方式筛选扩增效率高的引物,具体为:利用积累的数千个已知扩增效率的引物,计算引物在3’和5’端不同距离内的GC含量、TM值信息,构建特征集合,使用支持向量机进行训练和预测,选取高扩增效率的引物。
6.权利要求1-2任一所述的引物设计方法,其特征在于,所述5)中所述特异性复筛为使用bowite将初筛引物比对到NR数据库,舍弃够比对到其它物种的引物。
7.权利要求1-2任一所述的引物设计方法,其特征在于,所述6)中所述引物的扩增长度为100-500bp。
8.权利要求1-2任一所述的引物设计方法,其特征在于,所述病毒和/或细菌为呼吸道的病毒和/或细菌。
9.一种计算机可读介质,其存储有计算机程序,所述计算机程序被处理器执行时,实现权利要求1-8任一所述方法。
10.一种电子设备,包括处理器以及存储器,所述存储器上存储一条或多条可读指令,所述一条或多条可读指令被所述处理器执行时,实现权利要求1-8任一所述方法。
CN202210164390.0A 2022-02-22 2022-02-22 基于ce平台的呼吸道病毒和/或细菌亚型引物设计方法及系统 Active CN115101126B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210164390.0A CN115101126B (zh) 2022-02-22 2022-02-22 基于ce平台的呼吸道病毒和/或细菌亚型引物设计方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210164390.0A CN115101126B (zh) 2022-02-22 2022-02-22 基于ce平台的呼吸道病毒和/或细菌亚型引物设计方法及系统

Publications (2)

Publication Number Publication Date
CN115101126A CN115101126A (zh) 2022-09-23
CN115101126B true CN115101126B (zh) 2023-04-18

Family

ID=83287402

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210164390.0A Active CN115101126B (zh) 2022-02-22 2022-02-22 基于ce平台的呼吸道病毒和/或细菌亚型引物设计方法及系统

Country Status (1)

Country Link
CN (1) CN115101126B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108179224A (zh) * 2018-01-29 2018-06-19 上海伯杰医疗科技有限公司 B型流感病毒分型鉴定用引物探针和鉴定方法
CN108300803A (zh) * 2017-12-29 2018-07-20 博迪泰(厦门)生物科技有限公司 一种呼吸道感染病原检测用引物组、快速诊断试剂盒及检测方法
CN112322790A (zh) * 2020-11-26 2021-02-05 广州医科大学 同时检测9种呼吸道病毒的引物组合、质粒和检测试剂盒
CN113005228A (zh) * 2021-04-06 2021-06-22 上海君远生物科技有限公司 一种同步检测多项呼吸道病原体的检测试剂盒及其检测方法

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070259337A1 (en) * 2005-11-29 2007-11-08 Intelligent Medical Devices, Inc. Methods and systems for designing primers and probes
CN101899531B (zh) * 2009-05-25 2012-09-26 上海人类基因组研究中心 检测人甲型流感病毒h1和/或h3亚型的引物
CN102243697A (zh) * 2010-05-11 2011-11-16 解放军第三○二医院 群体突发病毒性疫情快速pcr检测引物文库及筛查系统
CN103205509B (zh) * 2013-04-23 2014-11-19 中国检验检疫科学研究院 基于新型悬浮芯片技术的13种呼吸道病毒高通量非诊断性检测方法
CN103740836B (zh) * 2014-01-15 2015-05-06 首都医科大学附属北京朝阳医院 用于检测肺炎支原体的荧光定量pcr引物及其应用
CN105255864A (zh) * 2015-10-15 2016-01-20 山东出入境检验检疫局检验检疫技术中心 Dna条形码结合二代高通量测序快速鉴别a型流感病毒亚型的引物组和方法
CN107937497A (zh) * 2017-11-29 2018-04-20 拓普基因科技(广州)有限责任公司 一种基于Primer3的多重PCR引物设计方法
CN111662958B (zh) * 2020-02-18 2022-12-06 武汉臻熙医学检验实验室有限公司 基于纳米孔测序平台的文库的构建方法、鉴定微生物的方法及应用
WO2021201675A1 (en) * 2020-03-28 2021-10-07 Inbiome B.V. Respiratory infectious disease triage
CN111681711B (zh) * 2020-06-28 2021-03-16 江苏先声医学诊断有限公司 一种兼并引物的设计筛选方法
CN112687337B (zh) * 2020-12-31 2023-08-08 广州市金圻睿生物科技有限责任公司 超多重引物设计方法
CN113337639B (zh) * 2021-05-28 2022-01-25 天津金匙医学科技有限公司 一种基于mNGS检测COVID-19的方法及其应用

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108300803A (zh) * 2017-12-29 2018-07-20 博迪泰(厦门)生物科技有限公司 一种呼吸道感染病原检测用引物组、快速诊断试剂盒及检测方法
CN108179224A (zh) * 2018-01-29 2018-06-19 上海伯杰医疗科技有限公司 B型流感病毒分型鉴定用引物探针和鉴定方法
CN112322790A (zh) * 2020-11-26 2021-02-05 广州医科大学 同时检测9种呼吸道病毒的引物组合、质粒和检测试剂盒
CN113005228A (zh) * 2021-04-06 2021-06-22 上海君远生物科技有限公司 一种同步检测多项呼吸道病原体的检测试剂盒及其检测方法

Also Published As

Publication number Publication date
CN115101126A (zh) 2022-09-23

Similar Documents

Publication Publication Date Title
CN111662958B (zh) 基于纳米孔测序平台的文库的构建方法、鉴定微生物的方法及应用
CN111394520B (zh) 一种基于rt-lamp技术检测新冠病毒用引物组及检测试剂盒
CN104153004A (zh) 一种用于扩增子测序的建库方法
CA2906725C (en) Characterization of biological material using unassembled sequence information, probabilistic methods and trait-specific database catalogs
CN110358815B (zh) 一种同时检测多个靶标核酸的方法及其试剂盒
Matsumura et al. SuperSAGE: a modern platform for genome-wide quantitative transcript profiling
CN110317861B (zh) 一种检测病原体的试剂盒
WO2017129110A1 (zh) 一种人体微生物定性与定量的检测方法
CN107475449A (zh) 一种适用于矮缩病毒科和双生病毒科病毒基因组拼接的转录组测序方法
CN115101126B (zh) 基于ce平台的呼吸道病毒和/或细菌亚型引物设计方法及系统
CN116219040A (zh) 用于检测植物乳杆菌s58的分子标记、引物探针组和检测方法
CN114875118A (zh) 确定细胞谱系的方法、试剂盒和装置
CN115418394A (zh) 用于检测cho细胞基因组dna的组合物、试剂盒及方法
WO2011145614A1 (ja) 核酸標準物質検出用プローブの設計方法、核酸標準物質検出用プローブ及び当該核酸標準物質検出用プローブを有する核酸検出系
CN108330213B (zh) 一种同时进行hbv dna定量、基因分型及rt区突变检测方法
CN114627966A (zh) 一种评估用于检测病原体的试剂或试剂组合的有效性的方法及装置
CN112634990A (zh) 一种pcr引物设计模板筛选的方法及应用
CN114277184B (zh) 一种人冠状病毒HCoV-HKU1的MNP标记组合、引物对组合、试剂盒及其应用
CN108841919A (zh) 一种嵌合式sda法制备探针
CN1244880C (zh) Dna标记分布图数据分析
CN115044704B (zh) 一种人冠状病毒HCoV-229E的MNP标记位点、引物组合物、试剂盒及其应用
CN114574606B (zh) 检测宏基因组中结核分枝杆菌的引物组及高通量测序方法
CN115044703B (zh) 一种人冠状病毒HCoV-OC43的MNP标记位点、引物组合物、试剂盒及其应用
TWI604057B (zh) Methods for screening for molecular markers of changes associated with a virus-associated mutation
CN116356054A (zh) 检测常见病原微生物及耐药基因的试剂盒及检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant