CN107429302A - 用于病毒感染的鉴定和区分的系统和方法 - Google Patents
用于病毒感染的鉴定和区分的系统和方法 Download PDFInfo
- Publication number
- CN107429302A CN107429302A CN201580068630.5A CN201580068630A CN107429302A CN 107429302 A CN107429302 A CN 107429302A CN 201580068630 A CN201580068630 A CN 201580068630A CN 107429302 A CN107429302 A CN 107429302A
- Authority
- CN
- China
- Prior art keywords
- sequence
- method described
- lowest threshold
- pathogen
- primer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/70—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving virus or bacteriophage
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
- C12Q1/686—Polymerase chain reaction [PCR]
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
- G16B25/20—Polymerase chain reaction [PCR]; Primer or probe design; Probe optimisation
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/10—Sequence alignment; Homology search
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B99/00—Subject matter not provided for in other groups of this subclass
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Biophysics (AREA)
- Organic Chemistry (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Medical Informatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Biology (AREA)
- Analytical Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Molecular Biology (AREA)
- Genetics & Genomics (AREA)
- Immunology (AREA)
- General Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Virology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明提供了测定用于区分至少2种非特定的病原体的引物的系统和方法,其中所述的病原体属于不同的病原体(例如病毒)科,该病原体科包含多种不同的病原体物种和/或品种。
Description
本申请要求2014年11月21日递交的美国临时专利申请No.US62/083125的的权益,该申请以引用方式并入本文。
技术领域
本发明的领域涉及用于病毒感染的鉴定和区分的诊断系统和方法,特别地,本发明涉及埃博拉病毒的感染,以及与症状相似的流感病毒感染的区分。
背景技术
背景描述包括可以用于理解本发明的信息。并非承认本发明提供的任何信息为现有技术,或与要求专利权的本发明有关,或者并非承认具体或含蓄引用的任何公开文献为现有技术。
在美国,据信季节性流感A(“flu”)每年感染5-20%的人口,使得大约200000入院,并且导致大约39000流感相关的死亡。在大流行期,例如最近的2009-2010年“猪流感”,这些数字额外升高43-89000000例(导致8870至18300额外估计的流感相关的死亡)。除了流感A以外,埃博拉病毒也展示了大流行的潜力,并且与流感A感染共有早期的临床症状,包括发烧、肌肉/肌体疼痛、头痛和严重的疲劳。这种相似性提出了特别的挑战,其中流感疫情与埃博拉感染的存在或疑似吻合。由于流感患者的临床护理和流行病学的遏制(例如使用抗病毒药品的家庭护理)与埃博拉患者护理(例如很大程度上取决于使用姑息支持的隔离期)所需的方法显著不同。
埃博拉感染的诊断可以以多种方式实施,并且在大多数情况下使用病毒核酸检测方法。例如已经报告使用病毒核蛋白质基因特异性的引物集通过逆转录聚合酶链式反应检测多种线状病毒物种能够快速地回收种类繁多的病毒物种,包括埃博拉病毒和埃博拉相关病毒(J Virol Methods.2011Jan;171(1):310-3)。此类方法可以有利地快速分析,但是不幸的是不能提供针对其他非线状病毒的区分诊断值。在病毒诊断的另一种方法中,使得自患者血清的总RNA经过PCR扩增,然后进行下一代的测序(Virology2012Jan 5;422(1):1-5)。尽管此类技术有效地且潜在地适用于区分埃博拉与流感病毒,但是其往往需要大量的样品处理,并且通常关系到大量的成本。在鉴定样品中的病毒的另一种已知的方法中,PCR扩增用于生产产物,该产物随后与已知的系统发育树比对(J Clin Microbiol 2007Jan;45(1):224-6)。然而,该方法通常不适用于具有较大系统发育距离的病毒的鉴定。
用于流感或埃博拉病毒鉴定的其他已知的PCR方案通常使用多重PCR,其具有多个引物集,其有助于鉴定针对面板中多种病毒链的存在情况(例如参见Clinical InfectiousDiseases 1998;26:1397–1402;J Clin Microbiol 1999Jan;37(1):1-7;J ClinMicrobiol 1999Jan;37(5):1352-1355;J Clin Microbiol 2007Feb;45(2):584-589)。尽管此类检验面板可以有利地用于高度特异性的区分诊断,但是需要病毒和血清型特异性的引物。不幸的是,尽管引物对特定的病毒具有极大的特异性,但是该引物对其他的病毒变体可能不具有特异性,特别是新的变体或具有高度多样性的变体。此外,在需要鉴定相同种类的多种病毒的情况下,引物的复杂性快速地超过了人类理性设计的引物集的能力。
为了适应此类复杂的任务,已经研发了多种软件工具。例如Greene SCPrimer为软件套件(例如参见Nucleic Acid Res.2006,Vol 34,No.22p:6605-6611),其第一步生成了用于病毒科的所有序列的系统发育树,以鉴定候选引物,然后运行贪心集合覆盖问题(SCP)算法,这样得到最少的引物集,然后将该引物集进一步精简,从而匹配正义引物和反义引物的熔点。尽管此类分析有利于选择引物对,但是其是计算复杂的,并且仍不可能覆盖病毒科或物种中的所有病毒。此外,此类方法仍需要使用兼并引物,其增加了非特异性结合的风险。此外,此类方法在病毒靶物集极其多样的情况下往往是成问题的。
为了克服多样靶物集所具有的困难,同时避免多重序列比对,研发了多重引物预测(MPP)工具(例如参见Nucleic Acid Res.2009,Vol 37,No.19,p:6291-6304),其也使用贪婪算法在科水平上鉴定共有引物。尽管MPP工具在概念上类似于上述方法,但是其通常不需要兼并引物序列,但是会产生相当短的引物(10个核苷酸),这额增加了非特异性结合的可能性以及人类或人类宿主的非人类序列(例如由于感染得到的细菌或病毒)。
因此,尽管用于检测埃博拉或流感病毒的多种方法是本领域已知的,但是所有的方法或几乎所有的方法都具有一个或多个缺点。因此,仍需要提供改善的检测系统,特别是在需要区分诊断以区别埃博拉病毒或流感病毒的病毒感染。在所述的诊断覆盖单一样品中的多株埃博拉病毒和流感病毒的情况下,所述的需要进一步复杂。因此,由于病毒序列的相对大的多样性,所以还迫切地需要快速地鉴定合适的寡核苷酸序列的系统和方法,其中所述的寡核苷酸序列对病原体具有高度的特异性,并且在测试条件下与人类DNA是不杂交的。
发明概述
本发明人发现可以使用得自不同种类的成员的共有序列来测定用于不同种类的病原体的引物。最通常的是,通过多种病原体序列的连续比对和处理、针对人类序列进行校正、以及用于不同种类的各种引物之间的差集运算(set difference operation)而获得共有序列。
在本发明的主题的一个方面中,本发明人考虑了获得用于区分2种非特定的病原体的引物集的方法。在所考虑的方法中,各种非特定的病原体属于不同的系统发育病原体(例如病毒)科,并且各种病原体科包含多种不同的病原体物种和/或血清型。最优选的是,所考虑的方法包括通过比对装置,针对大量的病原体物种的数字表示的基因组以及各个不同的病原体科的血清型进行各个多个序列比对、从而产生各种不同病原体科的比对结果的步骤。该方法还将包括在各种比对结果中鉴定各个共有序列的步骤,其中所述的共有序列具有(i)高于最低阈值的同源性,(ii)高于最低阈值的长度,以及(iii)高于最低阈值的熔融温度。在另一个步骤中,将鉴定的共有序列收集至用于不同病原体科的各个调节的比对结果中,并且在另一个步骤中,由各个调节的比对结果序列中除去多个序列(所消除的序列与人类和人类宿主序列具有最低的同源性),由此形成各个病毒特异性比对结果。然后,对病毒特异性比对结果进行差集分析,从而获得用于非特定的病原体的各个共有序列集,并且随后由各个共有序列集选择引物序列。
最优选的是,使用Clustal X,Clustal W或Clustal Omega进行多个序列比对。进一步考虑了同源性的最低阈值为至少97%(在一些情况下,同源性为100%),长度的最低阈值为至少15、并且更通常的是至少20、并且最通常的是至少25个碱基,而熔融温度的最低阈值为至少60℃,更通常为至少65℃。
在其他所考虑的方面中,分析仪被程序化/构造用于处理得自Clustal X,ClustalW或Clustal Omega的格式化结果,其包含病原体科或目的多种不同成员(例如流感A和流感B)的比对。通过比较每个病毒成员的核碱基的比对,可以发现保守区域。然后收集这些保守区域用于独特鉴定一类病原体的所有成员的引物序列的研发。在其中未发现保守区域或者该保守序列未产生满足熔融温度需要的寡聚体,所述的算法可以得到最低错配的碱基从而达到所需的熔点。比对内的各个碱基位置都被指定一个保守得分,这样在加入错配碱基时,最代表病毒种类的碱基位置用于得到最大程度的相容性。然后,使用BlastN过滤引物序列,从而除去映射人类序列的任何可能性,由此降低假阳性率。随后的分析除去重叠的序列。通常,进一步优选的是使用BlastN进行消除步骤,其中与人类和人类宿主序列的最低同源性(例如已知或疑似存在于人类中的病毒序列)为至少90%,更通常的是至少95%。尽管不限于本发明的主题,但是使用Set Difference and Set Union运算来进行差集分析,和/或选择引物序列从而产生长度为100至800个碱基的扩增子。还考虑了非特定的病原体属于2种不同的系统发育级别。最后,考虑了多种方法可以进一步包括测定引物序列从而产生得自病毒RNA的cDNA的步骤,和/或引物集包含用于各种非特定的病原体的1至5个引物对。
附图简述
图1为根据本发明的主题的计算机建立的引物鉴定方法的示例性流程简图。
发明详述
本发明人目前发现用于多重差分检测单一样品中多种或多种病原体株(例如埃博拉病毒)与一种或多种另外的病原体株(例如流感病毒)的系统和方法,其中未知的是存在哪一种推断的病原体(多种)和/或毒株。最通常的是,所述的检测基于靶向多种症状相似的病毒的寡核苷酸集,特别是生物学样品中的埃博拉病毒(Zaire)和流感A,其中生物学样品最通常的是全血或血清、或者血浆。在本发明的主题的特别优选的方面中,所有的寡核苷酸靶物都是高度保守的区域(在一些情况下,在每个毒株中是100%保守的),并且熔点为Tm≥65℃。
应该特别注意的是与其他的多重测试相反,所考虑的测试并非用于区分和鉴定多种选择中的单一的血清型,而是在覆盖各个种类的大部分或所有血清型的同时,区分未知(非特定的)种类的病原体。此外,还对所考虑的引物加以选择,从而排除非靶物特异性结合,特别是预计或者已知在宿主基因组中存在的与宿主基因组或核酸的结合。最后,选择引物,从而避免引物二聚体和交叉杂交(即,设计用于第一类病原体的引物与第二类病原体结合)。
如下文中更详细示出的那样,本发明人使用概念简单且有效的计算机执行的算法来鉴定独特的靶物序列,针对该靶物序列设计引物面板(以互补的或反向互补的取向)从而能够快速地鉴定包含流感A和/或埃博拉病毒的样品。当然,应该理解的是尽管以下实例证明埃博拉病毒和流感病毒检测的效用,但是由于本发明的主题独立于特定的序列信息,所以所考虑的系统和方法适用于任何病原体。此外,应该注意的是本发明所述的系统和方法适用于快速鉴定大量的靶位点(并且具有个体和多重的可能性),从而使终端用户能够选择用于他们的特定扩增平台的最佳引物对(多个)。
图1示例性地示出根据本发明的主题的典型的计算机执行的工作流程。然而,应该注意的是本发明所述的所有方法都可以以任何合适的顺序实施,除非本发明中另外指出或者内容中另外明确地反驳。针对本发明某些实施方案提供的任何和所有实例、或示例性语言(例如“如”)的使用仅是为了更好地说明本发明,并且并非限定本发明的范围(另外要求)。说明书中的所有语言都不能解释为表明实施本发明所必需的任何未要求专利权的要素。
在此,在第一步110中,用于一类病原体(例如病原体属或物种血清型的所有成员)的所有可利用的核酸序列得自一种或多种来源,通常得自数字FASTA形式的序列数据库。由多种本领域已知的这种数据库,并且所有的数据库都视为适用于本发明所述的用途。此外,应该注意的是数据形式并非必须局限于FASTA形式,还考虑了多种备选形式,包括FASTQ,BAM,SAM,EMBL,GCG,GenBank,RAW,IG等。然而,FASTA形式通常是优选的,并且应该意识到在需要的情况下,其他形式可以再格式化成FASTA形式。
类似地,应该理解的是数据库可以提供数据在线,或者数据库可以为CD-ROM,EPROM存储器等上的物理文件。无论设备的方式如何,序列数据优选通过分析仪获得,所述的分析仪被构造成可以用于多个序列的快速比对,如步骤120中所示。最优选的是此类比对为多序列比对,并且特别优选的比对仪(aligner)包括使用种子向导树(seeded guidetree)和HMM谱对谱技术(HMM profile-profile technique)来生成比对(例如ClustalO)、从而产生Clustal形式130的相应比对的那些。备选地,比对还可以以多种备选方式实施,并且可以使用基于局部区域(例如Kalign),基于快速傅里叶转换(例如MAFFT),或者基于系统发育意识的方法(例如WebPRANK)的比对。
不管特定的方法如何,由此考虑的是对于单一种类的病原体而言,所有的序列都进行处理,从而产生多个序列的比对,其随后在步骤140中进一步处理,而生成合适的序列150的集合,其中所有的成员均满足预定的参数。处理步骤140在方法中优选地使用完整的多个序列比对,在所述的方法中,对于鉴定完整比对的共有序列,该序列具有(i)高于最低阈值的同源性,(ii)高于最低阈值的长度,以及(iii)高于最低阈值的熔融温度。
最通常的是,对于一些区域而言,共有序列被逐渐识别,其中对于预定的最低或最大长度(通常为至少15个碱基、至少20个碱基、至少25个碱基、至少30个碱基、至少40个碱基、至少50个碱基等,并且低于100个碱基、低于90个碱基、低于70个碱基等)而言,同源性为或高于预定的阈值(例如至少90%,至少95%,至少97%,至少99%或100%)。如容易理解的那样,长度确定还为所需的熔点的函数。最通常的是,熔融温度为至少60℃、或至少65℃、或至少68℃。因此,在本发明的主题的至少一些方面中,所鉴定的共有序列具有长度为至少20个碱基的最低阈值,同源性为至少97%的最低阈值,以及熔融温度为至少60℃的最低阈值。
对于预定的同源性而言,考虑的是用户提供所需的最低阈值,在大多数情况下,最低阈值高于90%同源性。例如合适的最低同源性阈值包括95%,96%,97%,98%,99%和100%。如容易理解的那样,最低同源性的程度为病原体多样性和种类成员的数量的函数,并且通常优选的是对于更多样的种类而言,最低阈值较低(例如至少95%),而相对保守的种类可以具有较高的最低阈值(例如至少98%)。
相似地,对于预定的长度而言,考虑的是用户提供必需的最低长度,并且合适的最低长度为至少15个碱基、至少20个碱基、至少25个碱基、至少30个碱基、至少40个碱基、至少50个碱基等。另一方面,应该注意实际长度可以使用最低长度、所需的最低同源性和所需的最低熔融温度(对于各个序列而言)通过分析仪来测定。根据共有序列的所选长度,熔点确定可以使用式(I)(对于寡核苷酸而言,长度为低于13个碱基)并根据式(II)(对于寡核苷酸,长度等于或高于13个碱基)进行。
Tm≈4*(G+C)+2*(A+T)-5 (I)
Tm=64.9+41*(G+C-16.4)/(A+T+G+C) (II)
引物的长度通常被保持/选择,使得寡核苷酸满足或超过预定的熔点(例如65℃)。然后将如此鉴定的共有序列收集至用于不同病原体科的各个调节的比对结果中。由不同的方面来看,各个病原体都具有其自身调节的比对结果,并且所有的序列都匹配同源性、长度和熔融温度的最低阈值。当然,应该意识到在所述的测试为多重单罐测试(multiplexsingle-pot assay)的情况下,对于第一和第二不同的病原体种类的预定熔融温度相差不超过5℃,更通常的是熔融温度相差不超过4℃,甚至更通常的是熔融温度相差不超过3℃,并且最通常的是熔融温度相差不超过2℃(例如相同的温度)。
步骤140中的分析仪收入得自Clustal X,ClustalW或Clustal Omega的结果文件,包含不同病原体物种的比对,其中所述的物种通常术语一个病原体目、科或属。考虑到这些比对文件,分析仪在跨越所有成员中检索保守区域,优选的是鉴定其中碱基为100%保守的区域。在未发现100%保守的区域的情况下,分析仪将报告最保守的区域。由这些区域,分析仪将生成大小变化的潜在的寡聚体:合适的最低长度为至少15个碱基、至少20个碱基、至少25个碱基、至少30个碱基、至少40个碱基、至少50个碱基等。
在另一个步骤中,如步骤160所示,在各个调节的比对结果中如此鉴定并表征的共有序列随后在分析仪中进一步处理,从而除去序列,该序列在序列中与人类序列和/或其他序列(其可以合理地预计至少潜在地存在于人类中)匹配(或者在PCR条件下杂交)。序列匹配可以以多种方式进行,并且所有已知的方式都被视为适用于本发明的用途。然而,特别合适的匹配算法包括BlastN,从而鉴定匹配序列。如所理解的那样,任何匹配的序列(例如同源性≥70%、更通常地≥80%并且最通常地≥90%的序列;或者与人类或其他病毒靶物的Tm差异低于7℃、更通常地低于5℃并且最通常地低于3℃)随后都由各个调节的比对结果序列中消除,由此达到各个相应的病原体特异性(例如病毒特异性)比对结果。因此,进一步的处理将有助于消除假阳性测试结果,所述的假阳性测试结果可能是由于引物与宿主(例如人类)基因组的结合。
最后,本发明人则对病原体特异性比对结果162和164进行差集分析,从而获得病原体的各个共有序列集。最通常的是,差集分析170是以差集和并集运算运行的(通常使用FASTA格式化文件),其随后产生在诊断PCR反应中针对两种病原体种类适于用作引物的独特的序列172。应该注意的是术语“集”为核碱基的集合,其中所述的核碱基代表了在之前的步骤中发现的序列,而术语“差集”定义为一个集B的要素,其在另一个集A中不存在。在本实例中,这些差异为寡聚体。并集定义为集A中的要素,其也存在于集B中。考虑到这两个运算,对称差集将产生不与集A和集B重叠的所有寡聚体。
考虑到多重FASTA格式化文件(其包含衍生自病毒序列的寡聚体),步骤170中的分析仪将各个文件作为寡聚体(其独特地鉴定病原体科)的集来处理。一旦这些集被创建,便进行差集和并集运算,从而发现属于病原体科的多个集的寡聚体。然后消除这些寡聚体,因为它们不能独特地鉴定一个病原体科与另一个病原体科。接着,将剩余的寡聚体作为寡聚体的集再次返回,其中所述的寡聚体独特地鉴定1病毒科,并且随后可以与其他的寡聚体混合,该寡聚体在相同的测试(例如DNA芯片)中独特地鉴定不同的病原体科。
当然,应该理解的是本发明提出的合适的序列可以是合成的寡核苷酸和寡核苷酸类似物,并且熔融温度的所有计算均考虑了温度由于不同的化学性质而产生的变化。例如所述的序列可以包括肽的核酸主链,糖-磷酸酯,或者糖膦酸酯/磺酸酯主链。相似地,所考虑的序列中的碱基可以为天然形成的核碱基(例如腺嘌呤、胸腺嘧啶、胞嘧啶、鸟嘌呤、尿嘧啶),还可以是非天然形成的碱基,从而与天然形成的碱基形成稳定的或不稳定的氢键(例如次黄嘌呤核苷,iso-C,iso-G,PICS,3MN,3FB,MICS等)。此外,应该注意合适的寡核苷酸在一个或多个位置处可以具有兼并碱基,或者具有允许错配的碱基。当然,应该注意所有的核碱基将可任选地包含放射性同位素或其他同位素(例如NMR活性标记)。类似地,尽管不是优选的是,但是还考虑了所述的主链可以包含一个或多个标记的部分。
还进一步考虑了所述的寡核苷酸为单一类型的寡核苷酸,通常为DNA寡聚体。然而,RNA寡聚体或混合类型的寡聚体也考虑适用于本发明的用途。此外,应该注意的是合适的寡聚体包括具有用于直接(例如荧光团、放射性同位素)或间接鉴定和/或定量的亲和性标志物(例如生物素)或其他标记的那些。
在典型的实例中,在需要多重检测的情况下,试剂盒包含至少一对寡核苷酸,其适用于通过PCR或LCR反应产生扩增或连接产物。如容易理解的那样,选择这种寡核苷酸对,其对特定的毒株或病毒血清型具有特异性,或者覆盖多重毒株或血清型。在使用多对寡核苷酸的情况下,通常考虑的是选择这种寡核苷酸对,其在病毒靶物和/或扩增产物之间具有最低的或不具有交叉反应性,并且此类多核苷酸对可以在多重反应中同时使用。就此而言,多重PCR或LCR特别使用寡核苷酸对来实施,其中所述的寡核苷酸对靶向不同病毒(例如埃博拉病毒和流感A病毒)的特定序列。
为了覆盖多重毒株,特别优选的是寡核苷酸靶向病毒基因组的高度保守区域(例如RNA依赖的RNA聚合酶起始结构),并且具有相似的或者甚至一致的熔点。因此,本发明人考虑选择可以在定制的组装试剂盒中容易鉴定所选病毒的寡核苷酸。示例性的序列和组合物在下文中更详细地示出。上述实例提供了本发明的主题的许多示例性实施方案。尽管各个实施方案代表了发明要素的单一的组合,但是本发明的主题考虑将包括所公开的要素的所有可能的组合。因此如果一个实施方案包含要素A、B和C,而第二个实施方案包含要素B和D,则本发明的主题还考虑包含A、B、C或D的其他剩余的组合,即使未明确地公开。
应该注意的是与计算机有关的任何语言都应该读成包含计算装置的任何合适的组合,包括服务器、界面、系统、数据库、代理、对等网络、主机、控制器或者单独或共同操作的其他类型的计算装置。人们应该理解的是计算装置包含处理器,其被构造成执行储存在有形的非暂时且计算机可读的存储媒介(例如硬盘驱动器、固态硬盘、RAM、闪盘、ROM等)上的软件指令。软件指令优选地将计算装置构造成能够提供下文中针对所公开的仪器所讨论的作用、责任或其他功能性。此外,所公开的技术可以体现为计算机程序产物,其包含储存软件指令的非暂时且计算机可读的存储媒介,其中所述的指令使处理器执行与计算机基算法、过程、方法或其他指令的实施有关的公开步骤。在一些实施方案中,多种服务器、系统、数据库或界面使用标准的方法或算法来交换数据(可能基于HTTP,HTTPS,AES,公私密钥交换,web服务API,已知的金融交易协议或其他电子信息交换方法)。装置中的数据交换可以在封包交换网络,互联网,LAN,WAN,VPN或其他类型的封包交换网络;电路交换网络;信元交换网络;或其他类型的网络上实施。
对于本领域那些技术人员而言显而易见的是,除了已经描述的那些以外,更多的修改在不脱离本发明所述的发明概念的情况下也是可行的。因此,除了所附的权利要求书的精神以外,本发明的主题没有被限定。此外,在解释说明书和权利要求书的过程中,所有的术语均应该以其最广泛可行的方式与内容保持一致进行解释。具体而言,术语动词形式的“包含”和分词形式的“包含”应该解释为非独占地指要素、成分或步骤,表明所参照的要素、成分或步骤可以存在、或者使用、或者与其他的未明确参照的要素、成分或步骤组合。此外,如本说明书及其后的权利要求书所用,“a”、“an”和“the”的含义包括复数参照物,除非内容中另外清楚地指明。而且,如本说明书所用,“在……中”的含义包括“在……中”和“在……上”,除非内容中另外清楚地指明。最后,在说明书的权利要求书涉及选自A,B,C……和N中的至少一种时,该内容应该解释为仅需要得自所述的组的一种要素,并非A加N、或者B加N等。
Claims (20)
1.一种获得用于区分2种非特定的病原体的引物集的方法,所述的非特定的病原体的每一种均属于不同的病毒科,并且其中各个病毒科包含多种不同的病毒物种和血清型,所述的方法包括:
对于多种病毒物种的基因组和各个不同的病毒科的血清型而言,进行各个多重序列比对,从而产生对于各个所述的不同的病毒科的比对结果;
在各个比对结合中鉴定各个共有序列,该共有序列具有:
(i)高于最低阈值的同源性,
(ii)高于最低阈值的长度,以及
(iii)高于最低阈值的熔融温度;
对于所述的不同的病毒科,将所鉴定的共有序列收集至各个调节的比对结果中;
对于所述的各个调节的比对结果,消除与人类和人类宿主序列具有最低同源性的序列,由此形成各个病毒特异性比对结果;
对所述的病毒特异性比对结果进行差集分析,由此获得所述的非特定病原体的共有序列的各个集;以及
由所述的共有序列的各个集选择引物序列。
2.权利要求1所述的方法,其中所述的多重序列比对是使用Clustal X、Clustal W或Clustal Omega实施的。
3.权利要求1所述的方法,其中所述的同源性的最低阈值为至少97%。
4.权利要求1所述的方法,其中所述的同源性的最低阈值为100%。
5.权利要求1所述的方法,其中所述的长度的最低阈值为至少15个碱基。
6.权利要求1所述的方法,其中所述的长度的最低阈值为至少25个碱基。
7.权利要求1所述的方法,其中所述的熔融温度的最低阈值为至少60℃。
8.权利要求1所述的方法,其中所述的熔融温度的最低阈值为至少65℃。
9.权利要求1所述的方法,其中所述的长度的最低阈值为至少20个碱基,所述的同源性的最低阈值为至少97%,并且所述的熔融温度的最低阈值为至少60℃。
10.权利要求1所述的方法,其中在所述的共有序列中,所述的同源性是通过碱基-识别增加来测定的。
11.权利要求1所述的方法,其中所述的共有序列的长度是可变的,并且在所述的最低阈值之上选择,从而得到所述的所需的熔融温度。
12.权利要求1所述的方法,其中实施所述的选择引物序列的步骤,使得用于所述的不同科的扩增子的长度差异为至少100个碱基。
13.权利要求1所述的方法,其中所述的消除步骤是使用BlastN实施的。
14.权利要求1所述的方法,其中所述的与人类和人类宿主序列的最低同源性为至少90%。
15.权利要求1所述的方法,其中所述的人类宿主序列为已知或疑似存在于所述的人类中的病毒序列。
16.权利要求1所述的方法,其中所述的差集分析是使用Set Difference和Set Union运算实施的。
17.权利要求1所述的方法,其中选择所述的引物序列,从而产生长度为100至800个碱基的扩增子。
18.权利要求1所述的方法,其中所述的非特定的病毒属于2种不同的系统发育级别。
19.权利要求1所述的方法,其进一步包括测定引物序列的步骤,从而由病毒RNA产生cDNA。
20.权利要求1所述的方法,其种所述的引物集包含用于各个所述的非特定的病原体的1至5个引物对。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201462083125P | 2014-11-21 | 2014-11-21 | |
US62/083,125 | 2014-11-21 | ||
PCT/US2015/061970 WO2016081892A1 (en) | 2014-11-21 | 2015-11-20 | Systems and methods for identification and differentiation of viral infection |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107429302A true CN107429302A (zh) | 2017-12-01 |
Family
ID=56014615
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201580068630.5A Withdrawn CN107429302A (zh) | 2014-11-21 | 2015-11-20 | 用于病毒感染的鉴定和区分的系统和方法 |
Country Status (9)
Country | Link |
---|---|
US (1) | US20180258501A1 (zh) |
EP (1) | EP3221472A4 (zh) |
JP (2) | JP2017535270A (zh) |
KR (1) | KR20180008374A (zh) |
CN (1) | CN107429302A (zh) |
AU (1) | AU2015349661B2 (zh) |
CA (1) | CA2968527C (zh) |
IL (1) | IL252393A0 (zh) |
WO (1) | WO2016081892A1 (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2002099130A2 (en) * | 2001-06-07 | 2002-12-12 | University College London | Virus detection using degenerate pcr primers |
US20090081675A1 (en) * | 2007-08-24 | 2009-03-26 | Colston Jr Bill W | Methods, compounds and systems for detecting a microorganism in a sample |
US20090105092A1 (en) * | 2006-11-28 | 2009-04-23 | The Trustees Of Columbia University In The City Of New York | Viral database methods |
US20110152109A1 (en) * | 2009-12-21 | 2011-06-23 | Gardner Shea N | Biological sample target classification, detection and selection methods, and related arrays and oligonucleotide probes |
US20130267429A1 (en) * | 2009-12-21 | 2013-10-10 | Lawrence Livermore National Security, Llc | Biological sample target classification, detection and selection methods, and related arrays and oligonucleotide probes |
CN103646193A (zh) * | 2013-12-24 | 2014-03-19 | 辽宁大学 | 一种用于近缘物种鉴别的pcr引物设计方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8032310B2 (en) * | 2004-07-02 | 2011-10-04 | The United States Of America As Represented By The Secretary Of The Navy | Computer-implemented method, computer readable storage medium, and apparatus for identification of a biological sequence |
KR101138864B1 (ko) * | 2005-03-08 | 2012-05-14 | 삼성전자주식회사 | 프라이머 및 프로브 세트를 설계하는 방법, 그에 의하여 설계된 프라이머 및 프로브 세트, 상기 세트를 포함하는 키트, 상기 방법을 컴퓨터가 수행할 수 있도록 하는 프로그램을기록한 컴퓨터 판독가능한 매체 및 상기 세트를 이용한 표적 서열의 동정 방법 |
EP1895989A2 (en) * | 2005-06-03 | 2008-03-12 | Egalet A/S | A solid pharmaceutical composition with a first fraction of a dispersion medium and a second fraction of a matrix, the latter being at least partially first exposed to gastrointestinal fluids |
WO2007064758A2 (en) * | 2005-11-29 | 2007-06-07 | Intelligent Medical Devices, Inc. | Methods and systems for designing primers and probes |
CA2833912C (en) * | 2010-04-23 | 2021-09-21 | University Of Massachusetts | Aav-based treatment of cholesterol-related disorders |
JP5936829B2 (ja) * | 2011-07-11 | 2016-06-22 | 東洋製罐グループホールディングス株式会社 | プライマーの作製方法、プライマーの使用方法、プライマーセット、pcr用反応液、及びプライマーの設計方法 |
-
2015
- 2015-11-20 EP EP15860469.4A patent/EP3221472A4/en not_active Withdrawn
- 2015-11-20 WO PCT/US2015/061970 patent/WO2016081892A1/en active Application Filing
- 2015-11-20 CN CN201580068630.5A patent/CN107429302A/zh not_active Withdrawn
- 2015-11-20 AU AU2015349661A patent/AU2015349661B2/en active Active
- 2015-11-20 JP JP2017527213A patent/JP2017535270A/ja active Pending
- 2015-11-20 KR KR1020177016784A patent/KR20180008374A/ko not_active Application Discontinuation
- 2015-11-20 US US15/527,930 patent/US20180258501A1/en not_active Abandoned
- 2015-11-20 CA CA2968527A patent/CA2968527C/en active Active
-
2017
- 2017-05-19 IL IL252393A patent/IL252393A0/en unknown
-
2018
- 2018-11-14 JP JP2018213591A patent/JP2019058175A/ja active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2002099130A2 (en) * | 2001-06-07 | 2002-12-12 | University College London | Virus detection using degenerate pcr primers |
US20090105092A1 (en) * | 2006-11-28 | 2009-04-23 | The Trustees Of Columbia University In The City Of New York | Viral database methods |
US20090081675A1 (en) * | 2007-08-24 | 2009-03-26 | Colston Jr Bill W | Methods, compounds and systems for detecting a microorganism in a sample |
US20110152109A1 (en) * | 2009-12-21 | 2011-06-23 | Gardner Shea N | Biological sample target classification, detection and selection methods, and related arrays and oligonucleotide probes |
US20130267429A1 (en) * | 2009-12-21 | 2013-10-10 | Lawrence Livermore National Security, Llc | Biological sample target classification, detection and selection methods, and related arrays and oligonucleotide probes |
CN103646193A (zh) * | 2013-12-24 | 2014-03-19 | 辽宁大学 | 一种用于近缘物种鉴别的pcr引物设计方法 |
Non-Patent Citations (3)
Title |
---|
OMAR J. JABADO等: "Greene SCPrimer: a rapid comprehensive tool for designing degenerate primers from multiple sequence alignments", 《NUCLEIC ACIDS RESEARCH》 * |
ROBIN BOUTROS 等: "UniPrime2: a web service providing easier Universal Primer design", 《NUCLEIC ACIDS RESEARCH》 * |
SHEA N. GARDNER 等: "Multiplex primer prediction software for divergent targets", 《NUCLEIC ACIDS RESEARCH,》 * |
Also Published As
Publication number | Publication date |
---|---|
WO2016081892A1 (en) | 2016-05-26 |
US20180258501A1 (en) | 2018-09-13 |
AU2015349661A1 (en) | 2017-06-15 |
CA2968527C (en) | 2019-01-29 |
IL252393A0 (en) | 2017-07-31 |
EP3221472A4 (en) | 2017-11-22 |
CA2968527A1 (en) | 2016-05-26 |
AU2015349661B2 (en) | 2019-05-16 |
JP2017535270A (ja) | 2017-11-30 |
JP2019058175A (ja) | 2019-04-18 |
EP3221472A1 (en) | 2017-09-27 |
KR20180008374A (ko) | 2018-01-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Massart et al. | Virus detection by high-throughput sequencing of small RNAs: Large-scale performance testing of sequence analysis strategies | |
Quiñones-Mateu et al. | Deep sequencing: becoming a critical tool in clinical virology | |
Archer et al. | Analysis of high-depth sequence data for studying viral diversity: a comparison of next generation sequencing platforms using Segminator II | |
González-Candelas et al. | Molecular evolution in court: analysis of a large hepatitis C virus outbreak from an evolving source | |
Park et al. | Analysis of intrapatient heterogeneity uncovers the microevolution of Middle East respiratory syndrome coronavirus | |
Faye et al. | Development and validation of sensitive real-time RT-PCR assay for broad detection of rabies virus | |
Butt et al. | Rapid virulence prediction and identification of Newcastle disease virus genotypes using third-generation sequencing | |
Petronella et al. | Genetic characterization of norovirus GII. 4 variants circulating in Canada using a metagenomic technique | |
No et al. | Comparison of targeted next-generation sequencing for whole-genome sequencing of Hantaan orthohantavirus in Apodemus agrarius lung tissues | |
Montoya et al. | Deep sequencing increases hepatitis C virus phylogenetic cluster detection compared to Sanger sequencing | |
Ramamurthy et al. | Application of viromics: a new approach to the understanding of viral infections in humans | |
Beris et al. | Association of citrus virus A to citrus impietratura disease symptoms | |
Popa et al. | Mutational dynamics and transmission properties of SARS-CoV-2 superspreading events in Austria | |
Gaiarsa et al. | Comparative analysis of SARS-CoV-2 quasispecies in the upper and lower respiratory tract shows an ongoing evolution in the spike cleavage site | |
Zhou et al. | Unique molecular identifiers and multiplexing amplicons maximize the utility of deep sequencing to critically assess population diversity in RNA viruses | |
Carpenter et al. | SARS-CoV-2 Next Generation Sequencing (NGS) data from clinical isolates from the East Texas Region of the United States | |
Oguzie et al. | Metagenomic surveillance uncovers diverse and novel viral taxa in febrile patients from Nigeria | |
Rincon et al. | Design of specific primer sets for sars-cov-2 variants using evolutionary algorithms | |
Zrelovs et al. | First report on the Latvian SARS-CoV-2 isolate genetic diversity | |
Xiao et al. | Deep sequencing of 2009 influenza A/H1N1 virus isolated from volunteer human challenge study participants and natural infections | |
Messali et al. | Traceability of SARS‐CoV‐2 transmission through quasispecies analysis | |
Sauvage et al. | High prevalence of cyclovirus Vietnam (CyCV-VN) in plasma samples from Madagascan healthy blood donors | |
CN107429302A (zh) | 用于病毒感染的鉴定和区分的系统和方法 | |
de Sa-Filho et al. | HIV type 1 diversity from newly diagnosed patients in Santos metropolitan area/Brazil | |
Pais da Cunha et al. | High throughput sequencing from Angolan citrus accessions discloses the presence of emerging CTV strains |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20171201 |