CN101405400A - 作为当前新出现的流感病毒株诊断的dna阵列分析 - Google Patents

作为当前新出现的流感病毒株诊断的dna阵列分析 Download PDF

Info

Publication number
CN101405400A
CN101405400A CNA2007800097077A CN200780009707A CN101405400A CN 101405400 A CN101405400 A CN 101405400A CN A2007800097077 A CNA2007800097077 A CN A2007800097077A CN 200780009707 A CN200780009707 A CN 200780009707A CN 101405400 A CN101405400 A CN 101405400A
Authority
CN
China
Prior art keywords
influenza
virus
sequence
array
probe
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2007800097077A
Other languages
English (en)
Inventor
K·L·劳伦
R·库奇塔
M·汤森
J·斯马加拉
C·L·穆尔
E·道森
M·梅尔曼
N·科克斯
C·B·史密斯
D·梅尔曼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Colorado
Original Assignee
University of Colorado
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Colorado filed Critical University of Colorado
Publication of CN101405400A publication Critical patent/CN101405400A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

本发明的实施方案提供了用于检测和/或诊断病毒的型、亚型和/或毒株的方法、组合物和装置。在具体实施方案中,所述病毒是流感病毒。所述装置包括附着有捕获探针的微阵列,该被设计为能够结合寡核苷酸的微阵列能够结合大范围的流感病毒的型、亚型或毒株中的一个或多个靶基因的至少部分核酸序列。所述组合物可包括用于诊断和/或检测流感病毒的作为捕获探针、靶序列和/或加标记的标记探针的分离的核酸。

Description

作为当前新出现的流感病毒株诊断的DNA阵列分析
[0001]根据35U.S.C.§119(e),本申请要求2006年1月18日申请的序号为60/759,670的美国临时专利申请和2006年3月21日申请的序号为60/784,751的美国临时专利申请的优先权,这两件美国临时专利申请均通过全文引用结合到本文中。
技术领域
[0002]本文中的实施方案涉及用于流感病毒检测和鉴别诊断的组合物、方法和装置。在一些实施方案中,可以将甲(A)、乙(B)和丙(C)型等各型流感病毒彼此区分开。在某些实施方案中,可以将甲型流感病毒各亚型彼此区分开。在一个具体的实施方案中,可以将甲型流感病毒各种不同毒株彼此区分开。
技术背景
[0003]流感病毒是正粘病毒,有甲(A)、乙(B)和丙(C)三个型。各型别均可通过核蛋白抗原性区分开。甲型和乙型是临床上最重要的,引起轻微到严重的呼吸性疾病。乙型流感病毒是人病毒,似乎动物宿主中并不存在。甲型病毒既存在于人群中也存在于动物群体中,特别是禽和猪宿主中。甲型和乙型流感病毒各含有8个负义ssRNA片段。根据两种病毒表面糖蛋白--血凝素(hemagglutinin,HA)和神经氨酸酶(neuraminidase,NA),还能够将甲型病毒分成不同的抗原亚型。目前有15种已确定的HA亚型(称为H1到H15)和9种NA亚型(N1到N9),它们全都可以在野生水禽中找到。自1933年首次分离出该病毒以来,在HA和NA的135种可能的组合当中,仅有四种(H1N1、H1N2、H2N2和H3N2)在人群中广泛传播。目前在人群中传播的甲型流感当中,最常见的两种亚型是H3N2和H1N1。
[0004]新的甲型流感病毒株因遗传漂变导致病毒表面抗原位点的微小改变而出现。因此,人群中每年都可能发生流感病毒感染的流行。更剧烈的遗传改变能够导致抗原性转变(HA和/或NA亚型的改变),从而导致出现能在易感人群中快速传播的新亚型。1918年的甲型流感病毒是H1N1亚型,并取代了先前在人群中一直占主导地位的甲型病毒亚型(据血清考古学推断,可能是H3N8)。当两种不同亚型感染同一细胞时,抗原性转变最可能起因于基因重排。由于病毒遗传信息存储在八个单独的片段中,故在复制两种不同病毒(例如禽甲型和人甲型)的细胞内,新病毒体的包装可导致出现含有来自各亲代病毒的混合基因的病毒。推测这就是1957年(H2N2)和1968年(H3N2)大流行的病毒中之所以存在禽类表面糖蛋白(和一些内在的非糖蛋白基因)的机制。同最近H1N2重配株在全世界的出现所表明的一样,表面抗原的这种重排可能一直在进行中。
[0005]就抗原行为而论,亚型的不同足以使其无交叉反应;感染过一种亚型(如H1N1)能够导致对另一亚型(如H3N2)无免疫性。正是这种交叉反应性的缺乏使新的亚型随其通过免疫原始群体的传播而流行。在群体密切接触的情况下,传播尤其迅速。因此,新亚型的出现或先前已确定的流行毒株能够对于一般的公众卫生和特殊的防疫准备都具有重大的影响。
[0006]非人甲型流感毒株有可能从其“天然”宿主转移到人类,尽管这并不常见。其中一个例子是,1997年,香港爆发的高致病性禽流感在人群中传播就是由于甲型流感H5N1病毒引起的,当时局部地区发生了H5N1病毒在家禽中的流行。该病毒致使被感染的18个患者当中有6个死亡。
[0007]每年的甲型流感病毒感染对人类的生命和经济方面都具有重大影响,全世界每年有500,000到1,000,000人死亡,在感染期间由于生产力的直接和间接损失而造成对经济的冲击。甲型流感病毒所经历的自然和改造的基因改变可导致能够在群体中迅速且致命地传播的病毒的出现,这是非常令人担忧的。
[0008]在流感史中最严重事件之一是所谓的1918年到1919年的“西班牙流感”大流行。在不到一年的时间里,大约有2千万到4千万人死于流感,估计约占全世界感染人数的五分之一。造成西班牙流感的病毒有好多种原因都是独一无二的,这不仅仅是它杀死先前健康的年轻人的能力。事实上,在第一次世界大战末期,该病毒曾摧毁了美国军队,在1918年到1919年间,美国军队80%的死亡是由于流感病毒感染。由于甲型流感病毒是易于传播的、主要基于空气传播的病原体,也由于该病毒基因改造成新型的可能性的存在,甲型流感是严重的生物防御忧患。
[0009]目前对于可能会出现的流感病毒或其它致病性病毒或非致病性病毒的流行毒株的公共关注和科学关注,都需要针对这些病毒的快速检测和鉴定方法,例如病毒的型和亚型。还需要改进的流感病毒的遗传学诊断方法,以便在美国和世界范围内控制和监测该病毒对人类、禽类和动物健康的影响。
发明内容
[00010]本文的实施方案提供用于检测和/或诊断病毒存在的方法、组合物和装置。在某些实施方案中,提供了用于检测和/或诊断流感病毒存在的方法、组合物和装置。在其它实施方案中,所述检测和/或诊断可扩展到鉴定样品中存在的流感病毒的型、亚型和/或毒株。
[00011]在某些实施方案中涉及的样品可包括任何来自疑似携带流感病毒的受试者的样品,包括但不限于鼻咽冲洗液、咳吐物、呼吸道拭子、咽喉拭子、气管吸出物、支气管肺泡灌洗液、粘液、唾液或其组合。本文涉及的其它样品可包括但不限于空气样品、空气过滤器样品、表面相关样品及其组合。本文涉及的受试者能够包括但不限于人、禽类、马、狗、猫、啮齿动物和猪。
[00012]一个实施方案涉及阵列,该阵列包括多个与固体基质(例如FluChipTM和MChip)表面结合或者悬浮于溶液中的捕获探针。根据这些实施方案,所述捕获探针能够结合寡核苷酸,该寡核苷酸包括一种或多种流感病毒的靶基因的至少部分核酸序列或互补核酸序列。在一个示例性方法中,阵列能够包括多个捕获探针,该探针与固体基质表面结合或者悬浮于溶液中,其中捕获探针能够结合寡核苷酸,该寡核苷酸包括一种或多种流感病毒的单个靶基因片段的至少部分核酸序列或互补核酸序列。所述至少部分核酸序列能够包括单个靶基因或多个靶基因的保守区。在某些实例中,捕获探针能够结合和固定流感病毒的型、亚型或毒株的RNA分子。另外,阵列还可包括与固体基质表面结合的阳性和/或阴性对照。这些对照可用于确定结合特定病毒的阵列的条件。该阵列可是微阵列或多通道微阵列。
[00013]其它实施方案可涉及用于流感病毒检测和/或诊断的装置(例如“FluChipTM”装置)。FluChipTM装置可包括阵列,该阵列具有一个或多个附加的能够结合寡核苷酸的捕获探针,该寡核苷酸包括多于一个靶基因的至少部分核酸序列或互补核酸序列。在一个优选的实施方案中,FluChipTM装置可包含55个以上的这样的序列。该附加于FluChipTM装置的捕获探针可设计与来自流感病毒的一种或多种型、亚型和/或毒株的核酸序列杂交。
[00014]在某些实施方案中,流感病毒选自甲型流感病毒H3N2、甲型流感病毒H1N1和禽甲型流感病毒H5N1。
[00015]一些实施方案可包括寡核苷酸,该寡核苷酸包括但不限于一种或多种乙型流感病毒毒株的靶基因的至少部分核酸序列或互补核酸序列。根据这些实施方案,可以将流感病毒的型、亚型或毒株彼此区分开。另外,任何本文涉及的阵列能够包括从表3、表4、表5中所列出的序列或其组合中选出的捕获探针。另外,本文所述的捕获探针和标记探针是可互换的,因此捕获、标记或其组合所列的序列可用于创建阵列。在某些实施方案中,所述阵列包含100个以下与固体基质表面结合的捕获探针(和/或标记序列)。
[00016]在一些实施方案中,阵列能够与固体基质结合。根据这些实施方案,固体表面能够包括但不限于玻璃、塑料、硅涂敷基质、大分子涂敷基质、颗粒、珠、微粒、微珠、浸渍片(dipstick)、磁珠、顺磁珠及其组合。在一个具体的实施方案中,每个与固体基质结合的捕获探针各自的长度可以为约5个到约200个核苷酸(nt)、约10个到约150个核苷酸、约25个到约100个核苷酸或约10个到约75个核苷酸。
[00017]一个实施方案涉及用于将多个捕获探针与固体基质表面连接以形成阵列的方法,其中所述捕获探针能够结合寡核苷酸,所述寡核苷酸包括流感病毒的一种或多种型、亚型或毒株的靶基因的至少部分核酸序列或互补核酸序列。所述寡核苷酸能够包括靶基因(选自血凝素(HA基因节段)、神经氨酸酶(NA基因节段)、基质蛋白(M基因节段)及其组合)的至少部分核酸序列或互补核酸序列。在一个具体的实施方案中,所述寡核苷酸能够包括HA基因的至少部分核酸序列。在另一个具体的实施方案中,所述寡核苷酸能够包括M基因的至少部分核酸序列。
[00018]另外,本文实施方案涉及检测样品中流感病毒的方法,所述方法包括:a)使样品与阵列中的多个捕获探针接触以产生检测阵列,其中所述检测阵列包含捕获探针-样品复合物,此时所述样品含有寡核苷酸,该寡核苷酸包括一种或多种流感病毒的靶基因的至少部分核酸序列或互补核酸序列;和b)使所述检测阵列与一个或多个检测探针接触以产生被标记的阵列,其中所述被标记的阵列包含靶-探针复合物,此时所述检测阵列包含所述捕获-探针复合物,和其中所述靶-探针复合物的存在表明样品中存在流感病毒。根据这些方法,所述阵列能够包括多个捕获探针,该捕获探针包括一种或多种流感病毒的靶基因的至少部分核酸序列或互补核酸序列。在某些实施方案中,样品中存在的流感病毒通过检测由靶-探针复合物中的探针所产生的信号来确定。在其它实施方案中,所述由靶-探针复合物所产生的信号根据存在于样品中流感病毒的型、亚型或毒株而产生不同的式样(pattern)。在某些实例中,所述捕获探针能够结合流感病毒的一种或多种型和/或甲型流感病毒的一种或多种亚型或毒株。在某些实例中,所述靶基因能够包括但不限于血凝素(HA基因节段)、神经氨酸酶(NA基因节段)、基质蛋白(M基因节段)及其组合。
[00019]在某些实施方案中,方法涉及在48小时以内、36小时以内、24小时以内、或更特别是12小时以内,检测样品中的流感病毒。
[00020]另一个实施方案涉及标记探针,其能够包括流感病毒的一种或多种型或毒株的靶基因的至少部分核酸序列。在某些实例中,所述标记探针能够结合流感病毒的一种或多种型、亚型或毒株的靶基因的至少部分核酸序列。
[00021]本文的一个示例性方法涉及使用本文所公开装置诊断受试者的流感(病毒)。根据本方法,本文也涉及诊断受试者的流感病毒感染的严重程度。在一个实例中,从受试者获取样品,将该样品暴露于本文所公开的装置,可评价流感病毒的存在和水平。在某些实施方案中,涉及评价流感病毒的毒株,根据该评价对受试者进行治疗。还涉及能够在小群体或大群体中使用本文所公开的任何装置,用于评价感染以决定当在群体中爆发流感时最佳的方案,例如对感染群体的检疫或隔离。
[00022]其它的实施方案能够包括用于实施本文公开实施方案的试剂盒。一个示例性的试剂盒能够包括但不限于:(a)与固体基质表面结合的多个捕获探针的阵列,其中所述捕获探针能够结合寡核苷酸,该寡核苷酸包括流感病毒的一种或多种型或毒株的靶基因的至少部分核酸序列;和(b)一种或多种加标记的标记探针,其中所述加标记的标记探针能够产生信号,和其中所述标记探针能够结合寡核苷酸,该寡核苷酸包括一种或多种流感病毒的靶基因的至少部分核酸序列或互补核酸序列。在一个具体的试剂盒中,阵列可包括阳性和/或阴性对照,其中所述对照能够指示阵列的结合情况。
[00023]本领域技术人员将了解,尽管所述方法和装置是通过用于鉴别特定流感病毒的型、亚型和/或毒株的应用的具体实施方案而说明的,但是它们也可用于其它病毒类型的检测和/或诊断。
附图说明
[00024]下面的附图说明构成了本发明说明书的组成部分,用于进一步证明本发明的某些实施方案。参照附图中的一幅或多幅并结合本文所给出的具体实施方案的详细描述,可以更好地理解本发明的实施方案。
[00025]图1表示对于流感病毒分析-设计的示例图解,包括用于阳性对照的直接杂交(左侧)和用于检测病毒RNA的双捕获/标记杂交过程(右侧)。
[00026]图2表示概括对于寻找流感病毒基因组保守区的整个过程的流程图。
[00027]图3表示从单个保留区中筛选出适当的捕获-标记对的过程的流程图。
[00028]图4表示对于499个甲型流感病毒NA(N1)基因节段序列的邻接法系统进化树(neighbor-joining phylogenetic tree)。其中右侧括号表示进化树以及对于每个特定子集保守区的初始号码的初始分类。
[00029]图5表示FluChip-55TM装置布置图。捕获序列点样在“阳性对照”(PC)列的旁边,一式三份。样品基于基质基因(M)按亚型(HA和NA)或型(A或B)进行分组。
[00030]图6表示典型的微阵列结果,该结果表明a)A/H1N1、b)A/H3N2、和c)A/H5N1的型和亚型的正确分类。其中黑斑点代表强荧光信号。最上边和靠左边的黑斑点是阳性对照。方框区表示命中特定亚型并附上名称,便于观察。通常一式三份的斑点信号相对误差为10%。该微阵列的检出限为~0.7ng RNA。
[00031]图7A-7D表示使用所述分析(仅甲型流感引物)并结合使用FluChip-55TM装置的72个未知样品的分析概要的柱状图。该性能概述了初始盲试研究(blind study)(A)和重复(一式两份)研究(B)。微阵列性能(对于缺少亚型和缺少RNA扩增的已被更正)中对于盲试研究和重复研究分别见(C)和(D)。
[00032]图8表示溴化乙锭染色的1%琼脂糖凝胶,显示几种流感样品的PCR产物。所扩增的基因标在右侧,片段大小标在左侧。
[00033]图9表示显示患者样品获取的甲型流感H3N2病毒的正确分型和分亚型的图像。
[00034]图10A-10D表示7M片段序列(表明阳性对照序列(实心符号)和按一式三份点样的捕获序列(空心圆))的一般微阵列(A)的示例布置图。荧光图像显示了(B)H3N3(26个样品)、(C)H1N1(18个样品)和(D)H5N1(8个样品)病毒的典型图案。
[00035]图11A-11D表示15M基因捕获序列(具有阳性对照序列(实心符号)和按一式三份点样的捕获序列(空心圆))的微阵列的示例布置图,见(A)。荧光图像显示了H3N3(B)、H1N1(C)和H5N1(D)病毒亚型的典型图案。
[00036]图12A-12C表示对于显示式样而不是在图2中表示的病毒的加亮微阵列式样的荧光图像的示例性方法。(A)是实验室重配病毒,包含来自H3N3病毒的HA和NA以及来自H1N1病毒的内基因,(B)是感染人的猪H3N2病毒,(C)来自禽H9N2病毒。
[00037]图13A和13B表示使用15M片段探针序列(A)的58个微阵列结果的分层聚类分析(具体见方法部分)的示例性方法。相似的聚类分析见(B),以及来自24个未知患者样品的结果,而后揭示为N3N2和H1N1病毒(全都是甲型流感病毒)。
具体实施方式
定义
[00038]本文未定义的术语,根据其通常和普通的意义而使用。
[00039]本说明书和所附权利要求书中所用的术语前未加数词修饰时包括复数形式。
[00040]“序列变异体”是指核酸序列的任何变化,例如在流感病毒的不同的毒株、型或亚型之间在给定基因序列中观测到的变化。序列变异体可包括但不限于插入、缺失、取代、突变和单核苷酸多态性。
[00041]“捕获”探针或序列是能够与寡核苷酸形成复合物的核酸序列,该寡核苷酸包括靶基因的至少部分核酸序列或互补核酸序列。复合体的形成能够包括与寡核苷酸杂交、结合或缔合,该寡核苷酸包括靶基因的至少部分核酸序列或互补核酸序列。在某些实例中,核酸序列可以是任何核酸分子,例如RNA、DNA或其组合。注意:某些实施方案中的捕获探针和标记探针或者捕获序列和标记序列都是可互换的。
[00042]“标记”探针或序列是能够与寡核苷酸形成复合物的核酸序列,该寡核苷酸包括靶基因的至少部分核酸序列或互补核酸序列。复合体的形成能够包括与寡核苷酸杂交、结合或缔合,该寡核苷酸包括靶基因的至少部分核酸序列或互补核酸序列。另外,“标记”探针能够产生信号。在某些实施方案中,“标记”探针或序列可以进行可检测标记,例如通过连接荧光部分、磷光部分、酶部分、放射性部分或其它标记部分。或者,标记探针或序列可包含一个或多个官能团,设计用来结合可检测的标记部分。注意:某些实施方案中的捕获序列和标记序列是可互换的。
流感诊断
[00043]目前用于表征甲型流感病毒的方法依赖于表型(例如抗原)信息,尽管致病性和传播性的实际遗传基础可能与HA和NA的血清反应性几乎无关(如果有的话)。尽管有证据表明造成1997年香港在家禽中爆发的H5N1病毒的高致病性很大程度上是由于H5HA的可裂性提高了,由于先前具有相似的H5HA可裂性的病毒爆发没有引起人类疾病,H5HA单独无法解释其感染人类的能力。1997年H5N1病毒能够感染人类的原因仍在研究之中。先前使用从1997年爆发中分离出的人H5N1在小鼠中的研究,揭示了在四个基因中有五个氨基酸不同,这些基因可能影响这些病毒的宿主范围和/或致病性。因此,表型分析不能为精确定量新毒株的潜在致病性提供足够的信息。
[00044]流感病毒的传统特征包括血凝素抑制的血清学检验,病毒培养对更详细的表征通常是重要的。这些方法既费力又耗时。另外,全部现有的快速流感检测法相对不太灵敏,至少常常造成一些假阴性结果。
功能基因组学和微芯片平台
[00045]随着快速基因组测序和大基因组数据库的出现,以各种方式利用基因信息现已成为可能。最有希望的技术之一是寡核苷酸阵列。寡核苷酸阵列(更通常称为DNA微阵列或DNA芯片)的一般结构,是在光学平面表面上的点样的明确定义的阵列,其中每一个都包含一层相对短的DNA链(例如Schena编著,“DNA Microarrays A PracticalApproach”,Oxoford University Press;Marshall等,(1998)Nat.Biotechnol.16:27-31;每篇文献都通过引用结合到本文中)。对于产生阵列最常用的两种技术,一种基于照相平板印刷术(例如昂飞公司(Affymetrix)),另外一种是基于机控喷墨(spotbot)技术(例如Arrayit.com)。已知其它用于产生微阵列的方法,任何已知的类似的方法可在此应用。一般而言,选择位于阵列中给定点内的寡核苷酸(捕获探针)使之结合靶基因的至少部分核酸或互补核酸。在适当的杂交条件下,放置含水样品使之与阵列接触。随后充分清洗阵列以去除所有非特异性吸附物质。为确定靶序列是否被捕获,通过加入例如带有荧光标记的、与靶序列未占据部分互补的寡核苷酸序列,使阵列“显色”。然后,用微阵列阅读器或扫描仪“读取”微阵列,输出阵列图像。具有强烈荧光的斑点对特定靶序列而言就是阳性的。
[00046]DNA芯片技术已广泛应用于基因表达分析,在诊断领域现存在一些DNA芯片的实例。
用于甲型流感病毒株的鉴别检测的DNA微阵列
[00047]在一个实例中,“FluChipTM”装置能够提供个体是否被病毒(例如流感病毒)感染的信息,以及提供该病毒的型和亚型特征。用“FluChipTM”装置来分析流感病毒的存在大约需要11小时,相比之下用现有技术方法则大约需要4天。该装置只需要针对若干基因的约55个序列。FluChipTM分析的一个具体实施方案采用扩增不止一个基因,也就是M片段、HA片段和NA片段。该申请于2006年1月18日提交,发明名称为“DNA Microarray Analysis as a Diagnostic forCurrent and Emerging Strains of Influenza A”,其全部内容通过引用结合到本文中用于所有目的。
[00048]某些实施方案相对于目前鉴别流感病毒的型、亚型和毒株的病毒测定方法有若干优点。在一个实施方案中,本文所公开的芯片分析能够以病毒的很多个基因或单个基因为靶点。用于FluChipTM装置的多重PCR以多个基因为靶点。在其它实施方案中,本文公开的阵列能够以单个基因节段例如MChipTM装置为靶点。本文公开的阵列具有快速的分析回转时间。例如,对于样品中病毒靶存在与否的分析回转时间可以为11小时或更短时间。在一个具体的实施方案中,对于样品中病毒靶存在与否的分析回转时间可以为7小时或更短时间。在一个更具体的实施方案中,对于样品中病毒靶存在与否的分析回转时间可以为5小时或更短时间。另外,对于本文公开的致病性或非致病性病毒检测的芯片分析可以为100个以下的序列,优选地为15-60个序列,更优选地为15-30个序列,甚至更优选地为少于15个序列,以便鉴别病毒具体的型、亚型或毒株的靶基因(例如甲型流感H1N1的M片段)的存在与否。根据这些实施方案,对于检测指示病毒的靶基因,样品中病毒具体的型、亚型或毒株存在与否的鉴别可能需要约100个以下的核苷酸。在一个具体的实施方案中,对于检测指示病毒的靶基因,样品中病毒具体的型、亚型或毒株存在与否的鉴别可能需要约50个以下的核苷酸。例如,对于鉴别样品中病毒的基因片段的存在与否,长度约为10-30个核苷酸的5-15个序列可用于生产芯片。根据这些实施方案,技术人员理解,很多对于检测指示病毒有机体的单个基因而产生的序列可具有重叠。
[00049]对于采用DNA微阵列来分析流感病毒株要考虑的一个重要的因素,是鉴别以病毒基因组(例如流感病毒基因组)的什么基因为靶标。例如流感病毒各型(甲型(A)、乙型(B)和丙型(C))以多个亚型为特征。亚型是指由HA(血凝素)和NA(神经氨酸酶)基因中存在的序列表达的蛋白质。每个病毒通过型与亚型(例如A/H1N1)进行鉴别。另外,病毒能够被鉴定为具体的毒株。位于微阵列上的序列必须更好地将流感病毒不同的型、亚型或毒株区分开。另外,流感病毒突变得非常快。因此,位于微阵列的序列必须更好地重视快速的流感突变速率。
[00050]本文开发了一组程序,允许对于单个基因获得大量的流感序列(>1000)和鉴别每个基因内的区域,这将能够鉴别出流感病毒的型和亚型。所用序列由两个公开的数据组成(例如位于洛斯阿拉莫斯的国家实验室(Los Alamos National Laboratory)的流感序列数据库(ISD)www.flu.lanl.gov),以及未公开的私人所有的序列数据库(CDC流感序列数据库)。该方法包括使用两个原有的程序以及专门为本项任务开发的程序,其中最著名的程序是“ConFind”(Smagala等,“ConFind:arobust tool for conserved sequence identification,”BioinformaticsAdvance Access,发表于2005年10月20日,通过引用结合到本文中)。按照具体工作流程使用这些程序,可以快速有效地鉴别H和N基因区,这些可用于甲型流感亚型的分类。如从前所发现的,对M(基质)基因各区的鉴别提供了确定的流感病毒分型(是甲型还是乙型)。
[00051]在一个实施方案中,指示病毒的单个靶基因可用于设计阵列装置。根据该实施方案,阵列装置能够通过生成特定的寡核苷酸而产生,所述寡核苷酸能够结合所述靶基因的至少部分核酸序列或互补核酸。本文详述的一个实例表明单个基因(例如甲型流感病毒M片段)可用于鉴别样品中存在的甲型流感病毒。预料不到的是,高度保守的内基因,即M基因,可用于区别病毒的型、亚型或毒株。例如,单个靶基因片段例如甲型流感病毒的M片段可用于鉴别该病毒的具体亚型的存在与否。本文所述的一个示例性方法发现,包含源自M片段基因的寡核苷酸的阵列能鉴别样品中甲型流感病毒的亚型H1N1、H3N2和H5N1。
[00052]在一个实施方案中,通过检查基质基因的作用和基质蛋白与表面糖蛋白的相互作用,M片段可用于提供抗原亚型信息。甲型流感病毒的M片段编码M1和M2蛋白。M1是病毒颗粒中含量最丰富的蛋白质并构成病毒包膜的内膜。M1作为在HA、NA和M2和病毒核之间的桥梁。M1参与病毒生活史中的多个步骤,包括核糖核蛋白的转运、病毒装配和出芽。M2是病毒包膜(作为质子选择性离子通道)的次要成分。在病毒和内体膜融合后,在酸性内体中,M2离子通道开启并促进核糖核蛋白脱壳所需的低pH环境。
[00053]一方面,根据寡核苷酸产生和在DNA微阵列上的配置选择靶基因和靶基因的特定序列。例如,为分析甲型流感病毒的M基因设计阵列。在该实例中,15个不同的M片段序列被放置在微阵列中。适当的探针序列(捕获和标记)根据保守区而设计(参见方法部分)。寡核苷酸根据所选序列而设计,以产生具有所有病毒亚型的广泛的反应性或对于给定的病毒亚型或宿主物种的高度特异反应性。通过评价在可能的探针序列和用于设计其的数据库中所有序列之间的错配数来计算确定预期的反应性。设计这些寡核苷酸来具体地确定甲型流感病毒M基因和区别甲型流感病毒各亚型。尽管M片段并不在选择压力下来逃避免疫系统,文献充分记载了在表面糖蛋白和M片段之间的功能相互作用,而且近期的证据也清楚地提示了它们的共同进化。
[00054]在一个示例性的方法中,下列步骤可用于鉴别流感病毒的型和亚型。
(1)用逆转录酶-PCR扩增病毒RNA。
(2)用T7RNA聚合酶将cDNA转化为大量RNA。
(3)用碱催化的水解使RNA断裂。
(4)向所述断裂RNA中加入特异性标记-寡核苷酸混合物。仅有一种标记寡核苷酸将结合到每个微阵列设计要捕获的区域中。
(5)将所述断裂的流感RNA和标记-寡核苷酸的混合物点样在微阵列上,让其杂交。
(6)洗掉任何未结合的RNA/DNA。
(7)用扫描激光荧光计进行分析。
[00055]以下实施例部分介绍了详细过程。在一个示例性研究中,测定了已知亚型的病毒分离株。本文所公开的方法可用于鉴定各样品的亚型。在实施例中,本文所公开的装置在比现有方法所花时间少得多的时间内准确提供了流感病毒的型和亚型(例如参见表7和表8)。
[00056]在其它实施方案中,其它病毒被认为具有类似于定向的甲型流感病毒的M片段的内化非免疫原性蛋白,可产生捕获和标记序列。从这些捕获和标记序列,微阵列芯片可为鉴别样品中病毒的型、亚型或毒株而创建。根据这些实施方案,其它病毒可包括负义、单链、分节段的RNA病毒。在一个具体的实施方案中,负义、单链、分节段的RNA病毒可包括正粘病毒科(Orthomyxovyridae)的病毒。正粘病毒科病毒包括但不限于甲型流感病毒、乙型流感病毒、丙型流感病毒、索戈托病毒(Thogotovirus)和传染性鲑鱼贫血病毒(Isayirus)。
[00057]在另一个实施方案中,在微阵列上M片段序列中观测到的独特的式样可作为诊断试验用于鉴定未知的甲型流感病毒。根据本实施方案,采用简单分层聚类分析或更先进的方法例如神经网络,可以针对验证”组或对照组来评价得自未知病毒的微阵列结果(例如参见Filmore,D.Gene expression learned.Mod.Drug.Disc.7,47-49(2004);Hanai,T.& Honda,H.Application of knowledge information processingmethods to biochemical engineering,biomedical and bioinformatics fields.Adv.Biochem.Eng.Biotech.91,51-73(2004)通过引用结合到本文中)。人工神经网络
[00058]人工神经网络(ANN)通常就称为神经网络(NN),是一组互相连接的人造神经元,采用数学模型或计算机模型,根据与计算机的连接方法进行信息处理。在大多数情况下,ANN是自适应系统,可根据流过网络的内外信息改变其结构。在某些实施方案中,ANN可用于选择靶基因和靶基因内的序列,产生本文所公开的阵列。对于使用ANN的详细实例,参见实施例部分。在一个示例性实施方案中,ANN用于分析和获取制作芯片阵列即MChipTM阵列中的序列。在其它实施方案中,ANN可用于替代或结合使用分层聚类分析方法(参见已有的技术和本文实施例部分)。
[00059]在某些其它的实施方案中,用于检测能指示病毒某毒株、型和亚型的病毒相关序列的装置,可以包括但不限于微阵列系统、生物传感器系统、凝胶系统、浸渍装置系统、快速检测试条系统、手提式扫描系统或基于微珠的系统。依据这些实施方案,可鉴别和合成能够与靶蛋白区域(例如多个靶基因片段、本文所公开的M片段序列)的部分核酸或互补核酸序列结合的捕获探针和/或标记探针寡核苷酸。然后,这些寡核苷酸可用于产生阵列系统,适用于分析样品中存在的靶序列。根据这些实施方案,浸渍片、固体表面、凝胶或珠系统,例如具有与浸渍片、固体表面、凝胶或珠系统缔合的捕获探针序列,可用于检测指示分析样品中存在的所怀疑病毒的毒株、型或亚型的特定病毒蛋白质序列。
[00060]认为本发明的任何实施方案中所公开的阵列可包括与固体表面结合或者悬浮于溶液中的阵列。简单地说,在一个实例中,可通过本领域已知方法将阵列与珠子(例如微珠)连接起来。例如,微珠阵列可通过将捕获探针配对的微球(例如直径3μm)加载到化学蚀刻的成像纤维束上来制作。在某些实施方案中,目标样品能够暴露于光导纤维阵列,然后可用第二探针例如标记探针来检测与所述光导纤维阵列的结合(例如参见www.illumina.com)。另外,流感病毒的单个基因靶可用于产生这些阵列,或者多种微阵列的多基因靶可用于针对流感病毒的基因靶。另一个样品阵列可包括本领域已知的毛细珠阵列(例如参见Kohara等,Nucleic Acids Research,2002,Vol.30,No.16e870)。其它实例可包括分子信标。分子信标(molecular beacon)是双标记探针,通常用于实时PCR分析。在一个实例中,流体阵列系统被认为是对于特定的、溶液中未标记的多种检测使用微球体结合的分子信标和流式细胞计数器。在该示例系统中,分子信标可以使用键(例如生物素-链霉抗生物素键)与微球体结合。在某些实例中,采用来源于本文公开的一种或多种靶基因的至少部分核酸或互补核酸的寡核苷酸,不同大小的珠和在一种或多种荧光团颜色、合成对照序列中的分子信标可用于检测样品中存在的流感病毒(例如参见Horejsh等,Nucleic Acids Res.2005;33(2):e13)。
试剂盒
[00061]在又一些实施方案中,提出上述方法的试剂盒。在一个实施方案中,试剂盒具有健康应用的点,例如,试剂盒可具有在疑似病毒爆发的地点使用的便携式。在另一个实施方案中,提出病毒(例如致病性或非致病性病毒)检测试剂盒。在另一个实施方案中,提出用于分析来自患有或疑似发生病毒引起的感染的受试者的样品的试剂盒。在一个更具体的实施方案中,提出用于分析来自患有或疑似发生流感病毒引起的感染的受试者的样品的试剂盒。根据该实施方案,所述试剂盒可用于评价病毒的型、亚型或毒株。
[00062]所述试剂盒可包括阵列系统,例如用于便携式检测分析的放在合适容器中的芯片阵列系统。另外,所述试剂盒可包括检测试条或特殊的纸,例如在卫生保健提供者的卫生保健机构内能够快速分析样品的浸渍棒(dipping stick)或浸渍纸(dipping paper)。在另一个实施方案中,所述试剂盒可是用于用于卫生保健机构之外的指定场所的便携式试剂盒。
[00063]任何试剂盒的容器装置一般包括至少一个小瓶(管)、试管、烧瓶、瓶、注射器或其它容器装置,其中检测试剂可优选地和/或适合地进行等分。本文的试剂盒也可包括用于比较结果的试剂,例如对照样品,例如阳性和/或阴性对照样品。合适的阳性对照可包括含已知的病毒的型、亚型或毒株的样品。
氨基酸
[00064]在不同的实施方案中,分离的核酸可用于分析检测和/或诊断受试者的流感病毒的型、亚型乃至毒株。分离的核酸可来源于基因组RNA或互补DNA(cDNA)。在其它的实施方案中,分离的核酸例如化学或酶合成的DNA可用于捕获探针、引物和/或标记检测寡核苷酸。
[00065]“核酸”包括单链和双链分子以及DNA、RNA、化学修饰核酸和核酸类似物。认为核酸的长度可以为3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、约110、约120、约130、约140、约150、约160、约170、约180、约190、约200、约210、约220、约230、约240、约250、约275、约300、约325、约350、约375、约400、约425、约450、约475、约500、约525、约550、约575、约600、约625、约650、约675、约700、约725、约750、约775、约800、约825、约850、约875、约900、约925、约950、约975、约1000、约1100、约1200、约1300、约1400、约1500、约1750、约2000以上核苷酸残基,乃至全长蛋白质编码元件或遗传调节元件。
核酸的构建
[00066]分离的核酸可用本领域中的任何方法制得,例如使用标准重组方法、合成技术或其组合。在一些实施方案中,核酸可克隆、扩增或构建。
[00067]所述核酸可适宜地包含除型、亚型或毒株相关病毒序列以外的序列。例如,可加入含一个或多个核酸内切酶位点的克隆位点。核酸可以与用于核酸克隆的载体、衔接子或接头相连接。另外的序列可加到这种克隆和序列中以优化其功能、促进核酸的分离或改善将核酸导入细胞内。克隆载体、表达载体、衔接子和接头的应用为本领域所熟知。
用于构建核酸的重组方法
[00068]使用本领域已知的多种克隆方法,可以从细菌、病毒或其它来源获得分离的核酸。在一些实施方案中,在严格条件下,与所述核酸选择性杂交的寡核苷酸探针用于鉴定病毒的序列。对于核酸文库的构建方法是已知的,并且可使用该已知的方法。[例如参见CurrentProtocols in Molecular Biology,Ausubel等编著,Greene Publishing andWiley-Interscience,New York(1995);Sambrook等,Molecular Cloning:A Laboratory Manual,第2版,Cold Spring Harbor Laboratory,第1-3卷(1989);Methods in Enzymology,第152卷,Guide to Molecular CloningTechniques,Berger和Kimmel编著,San Diego:Academic Press,Inc.(1987)]。
核酸筛选与分离
[00069]可使用基于一个或多个序列(例如参见表1中所公开的序列)的探针,根据已鉴别的目标遗传元件的存在对病毒RNA或cDNA进行筛选。在测定中可以使用不同程度的杂交严格性。因为杂交条件越严格,形成双链体的探针与靶之间的互补程度必定会越高。可以通过温度、离子强度、pH和/或存在的部分变性溶剂例如甲酰胺来控制严格性程度。例如,通过改变甲酰胺的浓度(在至多和大约50%的范围内),简便地改变杂交的严格性。可检测结合所需的互补性程度(序列同一性)可根据杂交介质和/或洗涤介质的严格性而变化。在某些实施方案中,互补性程度最佳可以大约为百分之百(100%);但在其它实施方案中,根据条件的不同,流感病毒RNA中的序列改变可导致<100%互补性、<90%互补性探针、<80%互补性探针、<70%互补性探针或更低。在某些实例中,认为引物可通过降低杂交和/或洗涤介质的严格性来补偿。
[00070]对于核酸杂交的高严格性条件为本领域所熟知。例如,条件可包括低盐和/或高温等条件,例如约0.02M到约0.15M NaCl,温度约50℃到约70℃。其它示例条件在下列实施例中公开。应该理解的是,所需严格性的温度和离子强度是根据下述条件部分确定的:特定核酸的长度、靶序列的长度和核苷酸含量、核酸的电荷组成以及杂交混合物中的甲酰胺、氯化四甲基铵或其它溶剂的存在或浓度。核酸可与靶序列完全互补,或者可具有一个或多个错配。
核酸扩增
[00071]目标核酸也可用许多种已知扩增技术进行扩增。例如,聚合酶链式反应(PCR)技术可用于扩增直接来自病毒RNA或cDNA的靶序列。PCR和其它体外扩增方法也可是有用的,例如用于克隆核酸序列、使核酸用作探针,用于检测样品中存在的靶核酸、用于核酸测序或者用于其它目的。对于核酸扩增应用的技术的实例参见Berger,Sambrook和Ausubel,以及Mullis等,美国专利第4,683,202号(1987);和PCR Protocols A Guide to Methods and Applications,Innis等编著,Academic Press Inc.,San Diego,Calif.(1990)。基于PCR的筛选方法已被披露[参见例如Wilfinger等,BioTechniques,22(3):481-486(1997)]。
用于构建核酸的合成方法
[00072]分离的核酸可由直接的化学合成来制备,例如磷酸三酯方法:Narang等,Meth.Enzymol.68:90-99(1979);磷酸二酯方法:Brown等,Meth.Enzymol.68:109-151(1979);磷酰亚胺酸二乙酯法方法:Beaucage等,Tetra.Lett.22:859-1862(1981);固相磷酰亚胺酸三酯方法:Beaucage和Caruthers,Tetra.Letts.22(20):1859-1862(1981),使用自动合成仪,例如Needham-VanDevanter等,Nucleic Acids Res.,12:6159-6168(1984);或通过固相载体方法:美国专利第4,458,066号。化学合成一般产生单链寡核苷酸,通过与互补序列的杂交,或者用该单链作为模板并通过DNA聚合酶的聚合,可以将单链DNA转化为双链DNA。尽管化学合成DNA最好用于约100个碱基之内的序列,但是通过将短序列连接起来也可以得到较长序列。
核酸的共价修饰
[00073]许多交联剂、烷化剂和自由基生成剂都可用于结合、标记、检测和/或裂解核酸。另外,使用与单链靶核苷酸序列互补的烷化剂,可以实现与靶核苷酸的共价交联。可以使用由补骨脂素介导的与单链寡核苷酸的光敏化交联。也公开了N4,N4-桥亚乙基胞嘧啶作为烷化剂来与单链寡核苷酸的交联。结合、检测、标记和/或裂解核酸的各种化合物是本领域已知的。
核酸标记
[00074]在不同的实施方案中,标记核酸可以用一种或多种可检测标记进行标记,以促进鉴定出与微芯片表面的捕获探针结合的靶核酸序列。可使用多种不同的标记,例如荧光团、生色团、放射性同位素、酶标记、抗体、化学发光标记、电致发光标记、亲和标记等。本领域的技术人员知道,可以使用这些标记部分和本文未提及的其它标记部分。酶标记的实例包括尿素酶、碱性磷酸酶或过氧化物酶。可以使用显色指示剂底物和这样的酶,以提供肉眼可见或分光光度计可辩的检测方法。化学发光标记的熟知例子是萤光素/萤光素酶组合。
[00075]在优选的实施方案中,标记可是荧光标记、磷光标记或化学发光标记。示例性的光可检测标记可选自爱力生350(Alexa 350)、爱力生430(Alexa 430)、AMCA、氨吖啶、BODIPY 630/650、BODIPY650/665、BODIPY-FL、BODIPY-R6G、BODIPY-TMR、BODIPY-TRX、5-羧基-4′,5′-二氯-2′,7′-二甲氧基荧光素、5-羧基-2′,4′,5′,7′-四氯荧光素、5-羧基荧光素、5-羧基罗丹明、6-羧基罗丹明、6-羧基四甲基铵、CascadeBlue、Cy2、Cy3、Cy5,6-FAM、丹磺酰氯、荧光素、HEX、6-JOE、NBD(7-硝基苯并-2-氧杂-1,3-二唑)、奥勒冈绿488(Oregon Green 488)、奥勒冈绿500、奥勒冈绿514、太平洋蓝(Pacific Blue)、酞酸、对苯二酸、异酞酸、滂酰快紫(cresyl fast violet)、滂酰蓝紫(cresyl blue violet)、亮甲酚蓝、对氨基苯甲酸、赤藓红、酞菁、偶氮甲碱、青色素、黄嘌呤、琥珀酰荧光素、稀土金属穴状化合物、铕三(二吡啶)二胺(europiumtrisbipyridine diamine)、铕穴状化合物或螯合物、二胺、双花青苷、LaJolla蓝色染料、别藻蓝蛋白(allopycocyanin)、别藻蓝蛋白B(allococyanin B)、藻蓝蛋白C、藻蓝蛋白R、硫胺、藻红蓝蛋白(phycoerythrocyanin)、藻红蛋白R、REG、罗丹明绿、异硫氰酸罗丹明、罗丹明红、ROX、TAMRA、TET、TRIT(四甲基罗丹明异硫醇)、四甲基罗丹明和德克萨斯红(Texas Red)。这些标记和其它标记均可通过商业途径获得,例如分子探针公司(Molecular Probes,Eugene,OR)。
实施例
[00076]下文所包括的实施例用来说明各个实施方案。本领域技术人员应当理解,下述实施例中公开的技术代表在实施要求保护的方法、组合物和装置中作用良好的技术。但是,本领域技术人员还应当理解,根据本说明书,在不偏离本发明的精神和范围的前提下,可对所公开的具体实施方案做出许多改动并仍可获得相同或相似的结果。
材料与方法
[00077]仪器/程序。在某些实施方案中,BioEdit软件包(v.7.0.4.1)可用于显示序列[Hall,1999]。如果可能的话,可以运行其它程序作为BioEdit界面内的辅助应用。运用Clustal W(v.1.4)进行多序列比对[Thompson等,1994]。用DNADIST(v.3.5c in PHYLIP v.3.6)来创建系统进化树。用Tree View(Win32,v.1.6.6)[Page,1996]和MEGA3(v.3.0)[Kumar等,20004]来显示和操作系统进化树。除了这些现有程序以外,还编写并执行了许多Python脚本。根据GNU普通公开许可(GNUGeneral Public  License),这些软件可以得自www.colorado.edu/chemistry/RGHP/software/。
·label_tree用唯一整数标记.dnd文件(系统进化树)中的每个节点以便于呈现和细分系统进化树。
·Dnd2fa.将.dnd(或Newick.nwk)文件中的信息转回到含有序列信息的FASTA文件。
·Fa2fa.允许一个FASTA文件的内容减去另一个文件中的内容,输出含有剩余序列的文件。
·ConFind.识别特定数据组中的保守区域[Smagala等,2005]。
·find_oligos.选择所有合适的捕获序列和标记序列,即通过沿保守区反复步查直到满足最小GC含量、解链温度和香农熵(Shannon entropy)的要求。
·pick_oligos.根据长度、Shannon熵和解链温度,从‘find_oligos’列出潜在的捕获和标记探针输出;选择具有最低罚分、而不让寡聚物的核苷酸位置与其它捕获-标记对重叠的寡聚物对。
[00078]数据库。可以从例如公共可得的洛斯阿拉莫斯国家实验室(Los Alamos National Laboratories)的数据库(www.flu.lanl.gov/)[Macken等,2001]和Atlanta,GA的疾病控制和预防中心(Centers forDiseases Control and Prevention,CDC)的数据库中,找到大量流感病毒的序列信息。创建用于BLAST(Basic Local Alignment Search Tool)已鉴定序列的一个数据库,其含有得自EST(Expressed Sequence Tags)数据库的人类基因组序列信息和引起流感样疾病的若干生物体的序列信息。生物体的实例包括但不限于乙型流感病毒、丙型流感病毒、副粘病毒、鼻病毒、呼吸道合胞病毒、炭疽杆菌(Bacillus anthracis)、冠状病毒、腺病毒、军团菌(Legionella spp.)、肺炎衣原体(Chlamydiapneumoniae)、肺炎支原体(Mycoplasma pneumoniae)和肺炎链球菌(Streptococcus pneumoniae),它们均来自NCBI非冗余数据库(ftp.ncbi.nlm.nih.gov/blast/db/)。各捕获和标记探针中仅上链(top strand)针对该数据库进行了BLAST。就默认而言,BLAST使用上链和下链(bottom strand),即序列及其反向互补序列,以在数据库中搜索序列相似性。认为E值低于10000的各个序列是“命中”的,例如能够与非流感序列结合或杂交。
一种实验方法
[00079]一种示例性方法涉及用于在微阵列上产生扩增RNA的捕获探针和标记探针的实验方法,此实验方法用于实施例1。简而言之,捕获探针固定在固体基质上并在杂交过程中结合靶RNA。在这个实施例中,捕获的靶能够结合捕获探针,并使用额外的荧光团缀合的寡核苷酸(例如标记探针)检测靶标。在杂交和严格洗涤之后,在基于激光(532nm激发)的荧光扫描器中以5μm分辨率扫描微阵列。
[00080]序列选择和FluChip-55TM微阵列设计。使用实施例1中描述的方法来选择流感特异性的捕获和标记序列。总共选出103个捕获/标记对,用于在FluChipTM装置上进行分析。通过在任何其它核酸不存在的情况下,在室温中在标准杂交缓冲液中,将标记保温2小时,测出因标记序列与捕获序列直接杂交所致的假阳性信号的概率。将显示出与标记探针具有交叉反应性的捕获探针,连同相应的标记探针一起从阵列布置图中移出,然后重新打印阵列。重复该过程,直到微阵列在没有病毒RNA的情况下不显示出假阳性。
[00081]所得阵列包含55个捕获探针和相应的标记探针(见表3)。最后版含有的捕获/标记探针对分别是:针对流感A/HA基因,20个;针对A/NA基因,19个;针对A/MP基因,7个、针对流感B/MP基因,2个;针对B/NP基因,4个;和针对B/HA基因,3个。由CDC提供的来自分离物的病毒RNA盲试所使用的阵列布置图见图5。将各捕获探针按一式三份点样。在每个阵列中,溶液中具有互补荧光-标记的序列的单一捕获探针用作阳性对照。阳性对照的作用是直接指示杂交条件是否适合,但也可作为便于观察的空间标记。
[00082]微阵列载玻片准备。在这个实施例中,本文报告的所有研究所用的基质都是醛改性的显微镜载玻片(Cel Accociates Inc.,Pearland,TX)。关于寡核苷酸斑点技术的其它细节已有报道。在另一个实施例中,5′-氨基酸-C6-修饰捕获序列(Operon Biotechnologies,Inc.,Huntsville,AL)点在玻片上,浓度为10μM/点样缓冲液(含有3x SSC(1xSSC:150mM NaCl、15mM柠檬酸钠,pH7.0)、50mM磷酸钠和0.005%肌氨酸(sarcosyl))。使用具有固定中心针(solid core pin)的GenetixOmniGrid(Genetix,Boston,MA)微阵列点样器(spotter),各点间有550μm的距离。在同样条件下将额外玻片印到MicroGrid II Compactarrayer(基因组Solutions Inc.,AnnArbor,MI)上,用于预试验研究。点样后,将玻片于100%相对湿度中保存过夜,再放入-20℃密封容器中保存备用。
[00083]样品。CDC提供了用于FluChip-55微阵列盲试研究的72种样品。随后揭示样品组包括三种阴性对照:两种水样品和一种含有牛血清白蛋白的样品。为了对照目的,样品组中添加了独立的阴性(水)对照。所提供病毒分离物表示来自人、禽、马、犬和猪的样品。通过多项技术获取原始样品,包括咽喉拭子、鼻咽拭子、气管吸出物或支气管灌洗液。病毒或在含胚蛋或在MDCK细胞中增殖。
[00084]在一个实施例中,用RNeasy试剂盒(Qiagen,Valencia,CA),从尿囊液或细胞培养物上清液中直接提取基因组RNA。通过血凝素和神经氨酸酶基因的测序,在CDC预先确定病毒的型和亚型。在96孔板中有未知样品,以后根据该板中的孔号进行识别(例如样品A1来自A行第1列)。以盲试进行第一论研究,样品的型或亚型是未知的。结果作了初步分析后,再独立处理完整的样品组,用于评价重现性。
[00085]RNA扩增。依次用逆转录(RT)、PCR和失控(run-off)转录,并使用PCR产物作为模板,扩增来自每个分离物的病毒RNA。用SuperScript II逆转录酶(例如Invitrogen Corp.,Carlsbad,CA),用先前所述的SZA+或SZB+‘通用’流感引物,进行逆转录。用先前公开的引物最佳浓度进行甲型流感病毒的PCR,扩增MP、HA和NA基因(参见表3)。在该实施例中,PCR条件是:94℃2分钟,然后两次循环的94℃30秒、50℃30秒和72℃2分钟,接着35次循环的94℃30秒、60℃30秒和72℃90秒,每次循环增加5秒,最后是72℃10分钟。PCR产物用1%溴化乙锭染色的琼脂糖凝胶显现,以评价扩增。在琼脂糖凝胶中没有或几乎没有可见产物的样品,随后再用乙型流感病毒特异性引物进行扩增。
[00086]用两种新的引物来扩增乙型流感病毒的HA基因(表3)。用于乙型流感病毒扩增的PCR条件是:94℃2分钟,30次循环的94℃1分钟、50℃2分钟和72℃3分钟,最后72℃l0分钟。RT-PCR过程中所使用的5′PCR引物包括启动子位点,该位点允许用T7RNA聚合酶(Invitrogen Corp.,Carlsbad,CA)进行失控转录。将粗制转录RNA贮存在-20℃备用。
[00087]RNA定量。已知浓度的RNA溶液用于检测在用QiagenRNeasy小型试剂盒(Qiagen,Valencia,CA)纯化过程中样品的损失量。使用RNeasy试剂盒纯化经转录的病毒RNA,通过测定260nm处的吸光度(A260)进行定量。再推算粗制转录产物中RNA的浓度。转录反应产生的平均浓度为300μg/ml RNA。
[00088]RNA断裂与杂交。使转录的RNA断裂,然后在如上所述的微阵列上进行杂交。(Mehlmann,M等。“Optimization offragmentation conditions for microarray analysis of viral RNA,”AnalBiochem.2005年12月15日15;347(2):316-23.Epub 2005年10月17日,通过引用全部结合到本文中)。简而言之,将1μl 5x裂解缓冲液(200mM Tris-乙酸、500mM乙酸钾、150mM乙酸镁,pH8.4)和4μl转录RNA在75℃一起保温25分钟。再将样品放在冰上,加入15μl猝灭/杂交缓冲液,终浓度为4x SSPE(1xSSPE:150mM NaCl、10mMNaH2PO4、1mM EDTA,pH7.0)、30mM EDTA、2.5x Denhardt溶液、30%去离子甲酰胺和200nM各种合适5’修饰的
Figure A20078000970700311
570‘标记’序列(Biosearch Technologies,Novato,CA)。
[00089]用于杂交的玻片在0.1%SDS/4x SSC、4x SSC、ddH2O、最后在接近沸腾的水中依次各预洗涤5分钟,然后甩干直至使用。在室温下杂交2小时。杂交后,玻片在0.1%SDS/2x SSC、0.1%SDS/0.2xSSC、0.2x SSC中各洗涤5分钟,再在ddH2O漂清,最后甩干。
[00090]微阵列成像与分析。用Bio-Rad VersArray扫描仪(Bio-Rad Laboratories,Hercules,CA)对杂交样品进行扫描,用532nm检测,激光能量和PMT灵敏度分别为60%和700V,分辨率为5μm。用Photoshop(Adobe,San Jose,CA)优化图像反差。尽管对图像亚组进行了定量评价,但是假定图像清晰的话可通过目测进行分析。控制条件:分别给5个志愿者提供微阵列布置图(如图5)并要求他们将型和亚型与各图像对应。对于最初一轮实验和一轮重复实验,都以盲试研究进行分析步骤。正如结果部分详述,将志愿者的结果综合起来考虑,得出了对总体检测和FluChipTM装置用于病毒鉴定的统计学评价。
[00091]微阵列的检出限(LOD)。LOD定义为荧光信号(减去背景)与背景噪声之比大于3,在MP RNA杂交后测定LOD,用于定量评价图像。简而言之,采用上述条件,用MP特异性引物,通过RT-PCR和T7-转录扩增样品D2。配制MP RNA系列稀释液,断裂并杂交。图像按如上所述方法进行扫描并用VersArray分析仪的软件(BioRadLaboratories,Hercules,CA/Media Cybernetics,Silver Spring,MD)处理。
实施例1:
选择流感病毒靶序列用于检测和鉴定流感病毒的型、亚型和/或毒株
[00092]一种示例性的方法公开了分析大数据库的有效方法,以便鉴别流感病毒基因组中的保守区。根据这些保守区,选择能够区别不同病毒型和亚型的捕获序列和标记序列。该方法的特点包括使用系统进化树用于数据还原并选择相对少量的捕获探针和标记探针以代表广谱流感病毒。所选序列的详细实验评价见下文。
[00093]图1表示用于直接捕获和检测病毒RNA的一种方法,该方法使用两步杂交法。一方面,对于获取大量所需序列信息以设计本文所涵盖阵列而言,存在一些障碍。最好使用数量有限的、能够结合属于特定亚型的许多病毒靶标的捕获探针。这是与基因表达研究中所遇到的情况不相同的情况,在该基因表达研究中,捕获探针来自于序列未知的单独、特定的基因。
[00094]其次,流感是具有高突变率的RNA病毒。在同一时间测定的保守区域很可能由于病毒突变而改变。高突变率需要快速、可靠的方法来将当前可用的相关数据组还原为一组寡核苷酸,该组寡核苷酸能够结合至少部分核酸序列,该核酸序列包括简单的功能序列。
[00095]于是,存在许多公众可用的带有序列信息的数据库,事实上,美国国立卫生研究院(National Institutes of Health)目前用基金资助美国国立过敏和感染性疾病研究院(National Institute for Allergic andInfectious Disease)的流感基因组测序计划,目的在于数千流感病毒的完整序列的快速可利用性(参见例如www.niaid.nih.gov/dmid/genomes/mscs/default.htm#influenza),随着这样的数据库不断增加,需要从中获取所需信息的系统方法。
[00096]设计用于寡核苷酸微阵列的探针已经成为近来评论的主题[Russell,2003;Tomiuk和Hofmann,2001],已经开发设计微阵列探针的若干软件工具。例如,OligoWiz[Wernersson和Nielsen,2005;Nielsen等,2003]就是搜索潜在探针的程序,即通过考虑5个不同参数:特异性、解链温度、转录物中的位置、复杂性和自我退火的能力。使用者将权重赋予这些参数的每一个并计算总分。程序返回具有最佳得分的寡核苷酸。另外,有其它程序可使用,它们并非特别设计用于微阵列寡聚物选择的,而是用于发现和优化引物,尤其用于大规模测序的目的。
[00097]目前大多数可用的序列选择工具(如上所述)的目的在于找到靶向单个生物体内的单个基因的引物或探针。通常,用于实验的序列根据以下参数来选择:该序列对于靶的特异性、杂交条件的相似性、不进行交叉杂交的能力和序列组“覆盖”目标基因。
[00098]对于流感病毒的型和亚型,目标要求更高,因为捕获探针和标记探针不应当仅靶向特定病毒毒株的单个基因,而是应当靶向相同亚型的许多病毒。为了设计这样的捕获和标记序列,检查了来自一组病毒毒株的序列,以便鉴别能够靶向多个病毒的区域。
[00099]使用PROFILES,Rodrigues等(1992),通过共有序列来计算来自口蹄疫病毒的比对序列的‘同一性特征’,并记录表现出与该共有序列不同的核苷酸的序列数。这些特征用于显示序列间的相似性或差异,然后通过简单检查‘同一性特征’来手工选择引物对。
[000100]Primer Premier(PREMIER Biosoft International,Palo Alto,CA)是现有市售程序的实例,用于针对给定的一系列序列来设计引物和微阵列序列。对于常含有不完整和不重叠区域的高度易突变的病毒(例如流感病毒)的大数据库的而言,其应用的有限要求是组内所有序列都必须含有覆盖特定核苷酸范围的数据。相比之下,本文所提出的方法更好,因为它允许鉴别保守区,甚至当组内仅有一个片段包含不完整区域时。
[000101]PRIME[Gibbs等,1998]对检查一组序列而言是非常类似的现有程序。GPRIME一开始是比对一组序列,用‘ambiguityconsensus’在数据组中寻找特定长度的同源区。在Gibbs等(1998)所述的应用中,通过检查冗余值、解链温度(Tm)、空位和可能的二级结构,手工选择同源区。将所选序列与EMBL数据库比较,使用FASTA搜索,检查其对靶基因组的特异性。也概述了鉴别序列区的工具,其中通过计算来自两个数据库的共有序列之间的差异,PCR引物可区分两个亚组的数据。使用从表现出病毒症状的兰花叶片中提取的RNA,测定所选序列启动单独的RT-PCR反应的能力。尽管用于非常有限的数据组、而不用于微阵列应用,但是这些程序带来了选择捕获寡核苷酸用于诊断用途的更系统的方法理念。
[000102]本文所述的用于有效鉴别捕获和标记对的方法是从一组比对序列开始的。然而,与GPRIME所用的有限数据组不同,该项研究的单个基因特异性数据库含有多达1000个序列以上。用‘majorityconsensus.’,发现了满足某些Shannon熵需求的最小长度保守区。本文所述的方法可用于设计阵列探针以及PCR实验的引物。
[000103]该项研究开发了一种算法,用于使用大数据库来寻找能够对微阵列上各种不同流感病毒进行分型和分亚型的潜在捕获序列和标记序列。如以下实施例2所讨论的,微阵列检测由以下组成:将短(~25聚体)“捕获”DNA寡核苷酸固定在微阵列表面,使流感RNA与捕获序列杂交,通过荧光团缀合的“标记”DNA寡核苷酸(~25聚体)与靶RNA第二区杂交而进行检测。另外,微阵列中还包含捕获探针直接退火到互补标记探针的若干阳性对照斑点,这是为了便于观察而设计的(图1)。
[000104]捕获和标记序列被设计为满足一组所定义的标准:
-所述序列对于靶基因片段是特异性的,并且显示与其它捕获和标记序列没有交叉反应性。
-所述序列对于各种流感病毒是保守的,以便允许尽可能多地对不同流感病毒进行分型和分亚型。
-各种捕获探针和标记探针的长度在16nt和25nt之间(这样的长度导致足够高的解链温度和足够的特异性)。对于Chandler等(2003)所陈述的原因,捕获探针和标记探针彼此接近,仅被一个核苷酸间隔开。长度至少为45nt的保守区允许捕获序列和标记序列在其限制之内。
[000105]方法的开发-寻找保守区。图2中所示的流程图描述了在特定的目标数据库中寻找保守区的整个方法。根据所有可用的序列,创建了只含特定基因和亚型(例如甲型流感、HA基因、H1亚型)序列的基因特异性数据库,并转化成FASTA(序列比对包)格式(图2步骤1)。在某些情况下,所创建的基因特异性数据库受限于最初年份的规模,尤其是高度循环的病毒亚型,其结果就是频繁测序。一旦创建了基因特异性数据库,就能用ClustalW(步骤2)v.1.4[Thompson等,1994]在数据组上进行多序列比对。用FAST算法,bootstraps=1000和ktuple=4,进行多重比对。另外,创建了邻接系统进化树。然而,用最大似然法或简约(parsimony)方法可创建更严格的系统进化树,选择邻接算法是因为数据库规模大,使用更严格方法所需要的计算时间长。人为地对系统进化树的节点编号,有助于后来将系统进化树分开。
[000106]内部编写了保守区FINDer(称为‘ConFind’,图2步骤4)并按BioEdit中的‘Find Conserved Regions’选项来建模。在别处可找到对这一可得软件的充分描述[Smagala等,2005]。BioEdit中的‘FindConserved Regions’需要所有序列都含有涵盖特定核苷酸范围的数据。简而言之,编写‘ConFind’,使保守区可以被找到,甚至当所包括的序列一部分在某些位置上含有序列信息时。
[000107]该程序在BioEdit界面中运行,可以针对以下数据进行设定:保守区最小长度、每个碱基的Shannon熵的最大允许比特(bit)、对该Shannon熵需要的允许例外值(allowed exception)以及在某个位置上的序列最小数量(为了考虑该位置的保守性)。将缺省值设定在最小长度45nt,0.2Shannon熵的允许比特/碱基(2个允许例外值)和最少10个序列。这些要求的严格性(步骤3)经常变化,以便根据特定情况来选择或多或少的保守区。
[000108]‘ConFind’适用于到基因特异性数据库,用缺省严格性要求,见图2步骤4。如果发现保守区域,关于原始序列信息的信息,保守区位置和位置Shannon熵输出到文件,见图2步骤6。如果没有找到保守区,放松严格性,重复该过程。通常,甚至当采用非常松的严格性要求时,流感病毒的遗传变异性仍阻碍了对完整的基因特异性数据库(有时包括1000个以上的序列)中保守区的鉴别。然后要检查系统进化树,并细分为更小的子树(subtree),如步骤10和11所示,努力寻找额外的保守区。该过程不是自动化的,因为预先建立了各种不同标准,来检查序列“差异”或“相似性”,例如病毒年份、地理区域、宿主生物等。
[000109]此分析的功效在于此方法是目标特异性的事实,以及不同期望的结果目标能够导致种系发生树的不同故障。子树(不含有序列信息的Newick树格式)从主树中提取并转换返回的FASTA格式(步骤12)以用作随后步骤3中的输入。当必要时,种系发生树被原始地断裂为尽可能少的亚组,因为目的之一是捕获最大数量的具有有限组的捕获和标记序列的“不同”流感病毒。一旦发现了在所检查的基因特异性数据库中充分表现序列的保守区,就选择捕获和标记序列。
[000110]开发方法-从保守区中选出捕获和标记序列。然而,大量流感病毒内的‘保守’序列是重要的标准,建立了若干其它标准以便优化捕获-标记对的选择,包括二级结构、解链温度、G/C含量和长度。起初,代表流感A HA亚型1、3、A/H亚型1和2,以及A/MP的28个捕获/标记序列根据“分数”(下文描述)而手动选择,该分数反应了所有特定标准。然后,自动进行选择程序,选出大得多的配对组。
[000111]为了自动进行序列选择,编写了额外程序(‘find_oligos’),允许鉴别一个保守区内的所有可能的捕获-标记对。如图3所概述,该算法反复步查,从位置1开始,沿保守区搜索被一个核苷酸间隔开的序列对。额外的要求是每个序列的长度都在大约16-25nt之间,标记序列和捕获序列在50℃退火到反向互补序列的最低解链温度(匹配Tm),最可能的二级结构的35℃的最高解链温度(按照MFOLD[Zuker等,1999]来测定),以及介于30-70%的GC含量。因为每个序列的长度范围为16-25nt,所以针对各开始点可以找到不同长度的若干配对。如果发现若干配对的话,则选择最高保守性的配对(即具有最低的最大Shannon熵分值的配对)。如果若干潜在的捕获-标记对仍留在其开始位置,则选择最长的一个(图3步骤2)。编写额外程序‘pick_oligos’,按照以下原则将已鉴别的可能的捕获-标记对分类(图3步骤3)。
[000112]“好的”捕获和标记对应当是高度保守的(例如低Shannon熵),并且任何高度变异性位置的存在应当位于分离的寡核苷酸上。为了改善杂交稳定性,带有更高解链温度的更长的寡核苷酸是优选的。通过定义一组罚分(penalty)来执行分级,如表1中概述的。凭经验选择罚分值,使得根据‘pick_oligos’程序对试验数据所做的分类结果与技术人员手工分类结果相匹配。‘pick_oligo’程序选择具有最低罚分的捕获-标记对,并移出与所选配对具有连续重叠的捕获-标记对(图3步骤4+5)。重复该过程,直到不存在潜在捕获-标记对。
表1:指定到捕获-标记对的经验缺失用于最终的序列选择
Figure A20078000970700381
*E1和E2是在所检验的捕获-标记序列内的两个最高的Shannon熵
[000113]对于稳定性,优选的是在不同的序列上具有两个潜在的错配,而不是在一个序列上具有两个潜在的错配。
[000114]方法实施。总共4917个流感病毒被分为15个不同的较小的基因特异性数据库,见表2,这些基因特异性数据库代表不同的基因特异性亚型(例如H1、N1、N3)。通常,通过只研究相对新近的病毒,简化含有非常大数量的序列(>1000)的数据库,这合理地考虑到了流感的快速进化特性。使用基因特异性数据库,‘ConFind’用于寻找保守区,如果没有找到,则按照下文的讨论,将数据库分为更小的子集。各基因特异性数据库的保守区总数见表2。
[000115]本方法寻找捕获和标记对的独特方面是将原始基因特异性数据库‘分解’为若干较小的子集。此‘分解’是一项特别困难的任务。根据搜索目标,可以根据许多不同的标准进行分解,诸如种系发生谱系、病毒年份、起源的地理区域、宿主物种或样品预处理。
[000116]对于流感微阵列,根据种系发生信息,每个基因特异性数据库在再细分,因为在种系发生信息和抗原性之间存在联系。作为一个例子,甲型流感病毒的NA基因的N1亚型的进化树的分解见图4。在这个例子中,使用寻找保守序列部分中描述的参数,对于完整的499个N1序列组而言,未找到保守区域。目测系统树表明,合理分解成4个较小亚组,再分别分析它们。亚组A由16个序列组成,它们全都是H1N1亚型,大多数是在1950年之前在人群中传播的毒株。
表2:原始流感序列数据库和来自使用所述保守区域和序列选择方法的结果的描述
Figure A20078000970700391
1年份表示所包括的最早年份,其中“所有”表示分析中包括所有可用年份的序列
[000117]该亚组总共找到6个保守区。亚组B(156个序列)含有(只有少数例外)来自最近流行的感染人类的H1N1亚型病毒(在最近10年内)的序列。亚组7找到了保守区。亚组C(51个序列)含有来自1970年代后期至1990年代的在动物中传播的流感病毒H1N1亚型的大多数序列。认为亚组C在来自亚组D的动物N1序列与来自亚组B的人N1序列之间传播。因为动物毒株和人毒株间具有大的遗传差异,所以亚组C中最初没有找到保守区。亚组D含有最近8年的276个序列,其大多数是H5N1亚型。尽管这些H5N1株主要在禽类传播,但是亚组D也含有能感染人类的31种禽类毒株。亚组D共找到6个保守区。因为亚组B和D都含有来自近期感染人类的病毒的序列信息,所以按照类似于先前分解所述的方式进一步评价这些亚组。
[000118]由于亚组C最初没有发现保守区域,因此它还需要作进一步分析。在特定数据库内测定足够保守区的方法只是序列选择步骤的第一步,得到不同长度的保守区(表2,第5栏)。然而,微阵列检测需要固定的捕获寡核苷酸和单独的荧光团-标记的寡核苷酸,两者的长度都为~16-25nt,这样可以以1nt的空位退火到靶分子上。因此,下一步涉及在保守区内找到所有合适捕获和标记对。通过使用‘find_oligos’和‘pick_oligos’找到合适的捕获和标记对。‘find_oligos’程序用于在保守区内寻找所有潜在捕获和标记对,而‘pick_oligos ’程序则是按照如上所述的Shannon熵、解链温度和长度,将找到的序列分类。另外,‘pick_oligo’程序也选择具有最佳(最低)分值的捕获-标记对。
[000119]潜在干扰的评价。对于产生靶基因寡核苷酸用于鉴定流感而言,选择捕获序列和标记序列的最后步骤就是使用BLAST来搜索潜在杂交(cross-hybridization)。在该实施例中,需要含有来自潜在干扰物种的序列的额外数据库,所述序列可能存在于靶RNA杂交混合物中,也可能与已鉴定的捕获和标记对杂交,产生假阳性信号。因为用BLAST针对所有可用的基因组是不切实际的,所以创建更小的数据库,其包括人mRNA和来自引起流感样疾病的其它微生物的基因组,以及乙型流感和丙型流感的基因组(按照材料与方法部分所述)。因为两步杂交,所以在微阵列上仅可观察到来自非靶生物体的假阳性信号,如果捕获序列之一与任一标记序列杂交在杂交到同一基因。因此,如果发现捕获探针“命中”或结合数据库中的至少部分基因,就进行第二级比较,以检查标记探针是否也结合。如果发现捕获序列和标记序列都命中同一基因,则排除所述序列,因为可能是微阵列上的假阳性信号来源。
[000120]在应用‘find_oligos’和‘pick_oligos’程序之后,从所有已评价的流感数据库中鉴定出的629个保守区中,共选出447个潜在捕获-标记对(表1)。从这些447个捕获-标记对中,选出代表甲型流感HA亚型1、3和5、A/NA亚型1和2、A/MP、B/MP、B/NP和B/HA的具有最佳分值的75对,进行初步实验评价。连同28个手工选择的序列一起,共对103个捕获/标记对进行实验评价。用该方法鉴别和准确实验的序列见表3。表3中粗体靶序列(栏目标题是“保守区”)代表经选择用于某些优选实施方案的靶序列。
实施例2
用于诊断流感病毒的型、亚型和毒株的微阵列分析
[000121]流感的全球监测对于改善疾病管理是至关重要的,而且对降低流感大流行的影响尤为重要。提高监测需要能够提供详细的流感病毒株分析的快速有力而便宜的分析技术。对流感具有高度多元“识别标志”的低密度寡核苷酸微阵列,具有许多有利特征。然而,流感病毒的高度突变型对于设计而言是个挑战。
[000122]在一个示例性的方法中,流感微阵列“FluChip-55TM”装置的设计和特征在此处描述,该微阵列用于流感A H1N1、H3N2和H5N1病毒的相对快速的鉴别。在此实施例中,选择一小组寡核苷酸,表现出对目前在人群中传播的甲型流感病毒和乙型流感病毒以及在东南亚家禽中持续传播的甲型禽流感H5N1病毒都具有广泛的覆盖性。开发并试验了完整的检测方法,包括病毒RNA的提取和扩增。
[000123]在一个示例性的72个流感分离物的盲试研究中,将来自各种甲型流感病毒和乙型流感病毒的RNA扩增、杂交、荧光标记并成像。全部分析时间不到12小时。从两次检测的综合结果看,其中平均71%的分离物得到了分型和分亚型,13%得到了正确的型和部分亚型信息,仅有10%得到正确的型,5%假阴性和1%假阳性。对于~95%的分离物而言的总体检测提供了正确的型和/或亚型信息。在绝大多数情况下,当观察到不完全亚型时,失败是因为RNA扩增步骤,而不是微阵列的限制。用于扩增模板RNA的引物序列和条件的优化是本领域众所周知的,是本领域技术人员的常规实验。
[000124]目前鉴别流感病毒株的技术通常需要进行病毒分离、培养和免疫测定表征。认为这样的培养病毒的免疫细胞学方法是病毒检测的“金标准”,并且还产生了大量病毒用于进一步表征。遗憾的是,该方法需要3-7天培养病毒,然后进行抗原性试验,并且只能同时检测少量样品。利用多引物对来扩增流感基因组的多重聚合酶链式反应(PCR)检测,提高了病毒鉴定的灵敏度和速度。在该方法中,将流感RNA逆转录(RT)为互补DNA(cDNA),然后经PCR扩增成为具有流感特异性引物的双链DNA(dsDNA)产物。然而,用于多元反应的相容引物的数量限制,限制了一次检测中的可扩增基因的数量。许多新近开发的流感检测仍然限制了对具有最少病毒特异性信息的大范围病毒的鉴别,也限制了对较小一组的病毒的筛选,以便得到额外的信息。
[000125]在某些方法中,多元就是DNA微阵列技术能够提供同时筛选上千个不同核酸序列的方法。DNA微阵列使用固体表面固定化的、能与靶基因片段结合的寡核苷酸(捕获探针)。使用更长的捕获探针能够检测大范围的遗传多样性序列,因为长序列具有更高的错配容许量。已经提出,基于更短的捕获序列的寡核苷酸阵列是获取更大特异性并区分类似遗传序列的方法。
[000126]使用之前开发的并在实施例1中描述的用于序列选择的算法[Mehlmann,2005],设计出低密度微阵列,以便使用小的一组捕获序列和标记序列(55,“FluChip-55TM”装置),用于3种重要的甲型流感病毒和某些乙型流感病毒的亚型分析。本文描述了完全盲试的微阵列结果。该项工作的独特方面包括微阵列设计,使用靶RNA而不是DNA,以及用于测试微阵列的大范围的病毒。用CDC提供的72个未知样品进行盲试。样品含有来自若干物种的近期流感病毒分离物的RNA,包括人、禽、马、犬和猪。另外,在微阵列中测定了先前表现出流感阳性、但没有提供亚型信息的9个患者样品。
盲试研究结果
[000127]A/H1N1、A/H3N2和禽A/H5N1亚型的代表性结果见图6。值得注意的是,对于给定的型和亚型,并非所有可能序列都以相同概率结合。结合可以定义为对应于特定捕获序列的所有3斑点都是阳性荧光信号。为了比较完整信号和背景的数值,规定目测容易区分的信号/背景比率大于2。目测的优点有二:快速评价完整图像以及在对结合测定做出决定的过程中容易考虑所需的空间图像配准(spatialregistry)。
[000128]如之前详细描述的,使用简单固定的信号/背景比率来测定针对给定点的结合并不合适,因为不容易说明背景差异、杂交效率和模式(例如在指定行中的3个阳性),这对于结合而言必定存在,这样的结合被认为是病毒存在的指示。最终,模式识别软件可用于自动赋值(assignment)。
[000129]对于目测鉴别结合的序列而言,相关荧光信号强度的变化反映了病毒RNA被捕获和标记的程度。也观察到了与给定亚型结合的寡核苷酸的模式差异。例如,比较H1N1病毒(图6A)和H5N1病毒(图6C)的N1捕获序列的结合,显示出单个亚型的模式可变性。在N1方框区,序列1、6和7结合H1N1,而5、7和9结合H5N1病毒。对此寄予希望,因为设计微阵列序列选择算法,以选择与系统树给定“分枝”匹配的捕获/标记探针对。通常,对于特定基因特异性亚型(例如N1)而言,系统树的分叉,产生对宿主物种或病毒亚型(例如禽H5N1以及通常来自人H1N1病毒的单独分枝中存在的N1序列)具有特异性的分枝。因此,正的赋值只需要一次命中或结合设计用于特定基因(例如MP、H或N)的指定组的序列。任何错误赋值(例如如果命中或结合赋予N1和N2两者)都列为假阳性,即使可得到某种程度的正确信息。
[000130]大部分所测样品都产生图像,提供清晰而明确的流感型和亚型鉴别。两轮实验的微阵列图像用于由5个人进行目测鉴定。用甲型流感引物处理的样品的赋值汇总见图7。条形代表给定种类的样品赋值百分率的平均值,错误条形是±一个标准差(来自5个赋值)。只用甲型流感引物进行RNA扩增的赋值种类为:完全和正确(A或阴性,和H和N),正确的型和部分亚型(即A或阴性,或H或N而非两者),仅有正确的型(A或阴性,无H也无N),假阴性(无信息)和假阳性(任何错误赋值)。重要的是,注意图7A-7B归纳的结果反映了全部检测,包括病毒RNA的扩增和断裂,接着是在微阵列上杂交,标记和洗涤。对于表现出较低信号/背景值的原始盲试,一般而言,对64±2%样品而言,赋值是完全而正确的。17±2%样品得到正确的分型和部分亚型信息。对于12±2%样品仅得到正确分型信息,而没有亚型信息。观察到5±1%和2±1%样品分别是假阴性和假阳性。
[000131]对于重复(一式两份)研究,其中通常得到较高的信号/背景图像,其结果反映出较高程度的完全赋值。78±4%样品是完全而正确的赋值。对于12±2%的样品得到正确分型和部分亚型信息。对于6±2%的样品仅得到正确分型信息,而没有亚型信息。3±0%和0.3±0.5%样品分别是假阴性和假阳性。
[000132]不完全赋值的分析。通过将盲试研究和重复研究的结果结合在一起,平均71%样品得到了正确和完全的鉴别。然而,剩余29%样品是不完全赋值,或者(很罕见的)是错误赋值。在这两项研究后,对失败进行仔细分析,对微阵列的表现有所理解。在72个未知样品中,有些含有FluChip-55TM微阵列未涵盖的病毒RNA。例如,12个样品含有基因特异性甲型流感亚型H6、H7、H9、N3、N7和N8的RNA,约占未鉴别样品的1/3。FluChipTM装置的未来形式将会包括覆盖面更完整的额外亚型。
[000133]为了评价扩增步骤,在琼脂糖凝胶上分析各样品的PCR产物。多道凝胶的一个代表性实例见图8。最先两个样品(C8和F8)是阳性对照,证明成功扩增的MP、NA和HA产物,这随后允许完全正确地鉴别病毒。剩下的样品(A2至H8)明显表现出缺少一种或多种基因产物。重要的是,要注意在该情况下的“缺少”是指PCR产物浓度低于凝胶检出限(~2ng)。认为样品A2是具有“N1”亚型的“甲型流感”,没有进行HA亚型的测定。分析样品A2的PCR产物表明MP和NA基因扩增,但没有观察到HA基因扩增。
[000134]另一个例子是样品E1,其中对HA亚型进行了正确鉴别,但NA亚型却“缺失(missed)”。大量扩增了MP基因,可以看到对应于HA基因的模糊条带,但是没有看到NA的可辨识产物。这一趋势的一个例外就是样品C9(A/H3N8病毒),其中显示出HA产物,但没有从微阵列图像分析中进行H亚型鉴别。在这种情况下,明显扩增了HA,但没有成功地与微阵列杂交。杂交失败的可能原因如下所讨论。通过统计缺失的捕获/标记探针(如上详述)和缺失的RNA,评价了微阵列结果(独立于扩增步骤)。矫正的微阵列结果的汇总见图7C和图7D。在这种情况下,显然,微阵列本身给高达98%的样品提供完全和准确的信息。
[000135]假阳性分析。如图7所示,根据盲试研究和重复研究,平均约1%的样品得到假阳性赋值。就绝对项看,仅有8次反应是假阳性。这仅是超过720个(72个样品*5个志愿者*2项研究)甲型流感引物扩增的样品图像的一小部分。具体地讲,在盲试研究中,5个志愿者中有4个认为样品E8是“A/H1”,尽管它是阴性对照。然而,在重复研究中,所有5个志愿者都能准确鉴别样品E8为阴性。对原始E8样品相关图像进行仔细评价,表明微阵列人为(artifacts)的潜在干扰(例如H1区中小的和异常斑点形态以及序列的MP区中阳性对照的空间混合)。按照类似方式,在盲试研究中,两个志愿者鉴别样品E9为“H1”和“A/H1”,但是在重复研究中,所有5个志愿者都准确鉴别为阴性。另外,有一次将样品G9错误鉴别为“A/N1”,还有一次错误鉴别为“A/H1”,尽管G9是A/H7N3病毒。异常斑点形态和阳性对照点的空间混合也会导致这样的假阳性。
[000136]总的来说,假阳性率约为1%,与本领域已知的许多其它诊断用流感试验的表现相近或小于后者。设计寡核苷酸阵列的问题是尽管较短寡聚物因降低错配容许量而增加特异性,但是捕获溶液中的类似寡核苷酸的概率却增加了。然而,通过将流感RNA与结合在表面的捕获探针和溶液中的标记杂交,得到额外水平的选择性。因此,与先前类似的寡核苷酸阵列相比,使用两步杂交流程可有助于减少假阳性命中数量。
[000137]假阴性分析。从72个未知样品的两项研究中,完整的检测得到的平均假阴性信号为4.0%。假阴性之所以产生是因为捕获和/或标记探针与靶RNA间的序列互补性差或者非理想的RNA的易接近性。假定单链RNA高度结构特性,与微阵列捕获序列和标记序列杂交差,可导致缺乏易接近性或非理想性断裂。已有记录表明,RNA二级结构可导致不均匀断裂,当使用化学断裂试剂时。所用的碱催化的RNA断裂方法可能在这样的位置上优先切割病毒RNA:所述位置在某些基因组区将会阻碍捕获探针和标记探针的相互作用,因此阻碍了微阵列上的捕获和/或检测。尽管进行断裂是为了简化RNA的结构特点[Small等,2001],但是长度为38-150nt的RNA仍然具有重要结构[Mehlmann等,2005]。
[000138]为了评价这种可能性,一个示例性方法用于用计算机预测断裂RNA的可能结构(数据未显示,MFold参见Mathews等,1999;Zuker,2003)。将对应于捕获/标记杂交位点的病毒RNA区(平均长度为37-50nt)连续延长10个核苷酸的增量,两端各加5nt,直到最大长度为100个核苷酸。自我缔合片段的Tm当作微阵列上的命中和阴性。预期分子内Tm高的自我缔合片段更少与捕获/标记探针杂交,因此产生更弱的命中,而分子内Tm低的片段更多杂交,产生更强的命中。然而,没有观察到直接关系,表明序列错配,而且没有RNA易接近性在假阴性结果中是主要因素。尽管假阴性的总体比例低(~4%),但是在序列选择和覆盖方面的改善应当会进一步增加正确赋值。
[000139]乙型流感分析。在初步研究中,在RNA扩增期间,当使用甲型流感特异性引物时,如果在琼脂糖凝胶内未见到产物,就要用乙型流感HA引物来扩增样品。在盲试研究中,86%±3%的乙型流感样品是正确赋值(乙型流感或阴性),14%±3%为假阴性,没有假阳性。在重复研究中,85%±3%是正确赋值,13%±0%为假阴性,1%±3%为假阳性。就绝对项看,5个志愿者鉴别的21个为假阴性。这21个中,三个样品(D5、E9和G6)占满所有假阴性。这些样品各自的PCR产物都是可见的,当在琼脂糖凝胶上染色和观察时。因此,假设这些病毒含有突变,在我们的检测中限制它们被捕获或标记的能力。乙型流感HA基因的捕获探针的扩增应当消除该问题。仅有一个赋值(1/75)是乙型流感假阳性。
[000140]患者样品分析。为了进一步评价FluChip-55TM微阵列,获取患者样品。在该项研究中,用甲型流感引物,将先前经检测为甲型流感阳性的9个样品和3个未知样品的RNA扩增,并与阵列杂交。一个实例图像见图9。从质量上比较所得微阵列图像与得自分离样品的图像。12个样品中,对4个进行了正确而完整的分型和分亚型(A/H3N2),对1个样品进行了正确分型(A)和部分分亚型(N2),对4个正确进行分型(A),但是没有亚型信息,3个未知样品正确鉴别为流感阴性。在一天内而不是通常的5-10天时间内得到这些结果。
[000141]另外的实施方案。使用本文所公开的方法,将FluChipTM装置拓展到涵盖更大量的重要流感病毒株,例如禽H7N3、H7N7和H9N2。也包括新的物种间传播的病毒(例如马流感H3N8,目前在犬中发现)。具体地讲,FluChipTM装置的下一个形式将包括捕获/标记序列,用于H1、H2、H3、H5、H7、H9、N1、N2、N3、N4、N7和N8,除了更广泛的MP、潜在的NP范围之外。其它计划包括简化或消除RNA扩增步骤,改进杂交动力学和开发模式识别软件,用于快速图像解释。
[000142]使用FluChipTM微阵列,与已建立的RNA扩增方法相结合,对包括流感A/H1N1、A/H3N2和A/H5N1和乙型流感在内的目标病毒中提取的RNA,在约11小时内进行分型和分亚型。在该项研究中,对包括来自大量物种的目前的流感病毒分离物在内的72个样品进行完全或部分鉴别,平均准确率超过95%。各种病毒的成功鉴别进一步证实了用于微阵列序列选择的方法,并建立了低密度容量(即低成本)微阵列,以提供对病毒的正确鉴别。
[000143]尽管设计了捕获序列的点样模式,以便进行流感亚型的鉴别,但是技术人员知道捕获探针的任何点样模式都可以使用。可以手工阅读或由软件测定靶序列与捕获探针和标记探针的结合。同样,可通过手工或由软件自动进行鉴别流感型、亚型或毒株的靶结合模式的分析。
单个靶基因策略
方法
[000144]序列选择。捕获探针和标记探针选择是根据以下文献的改进方法:Mehlmann等(Mehlmann,M.等,FluChipTM:robust sequenceselection method for a diagnostic microarray.J.Clin.Microbiol.提交(2006),通过引用全部结合到本文中)。在该实施例中:使用公众可得的来自LANL(www.flu.lanl.gov)的网上序列和其它信息,编辑各种甲型流感亚型的M基因序列。创建了H1N1、H1N2、H3N2、H5N1、H3N8和H9N2的亚型特异性数据库。这些亚数据库还可进一步按照宿主物种来细分,并用ConFind算法来寻找保守区。鉴别的保守区再用于设计合适的“捕获”和“标记”序列对,其各自的长度介于16-25nt。鉴别了约60个可能的序列对。测定了设计序列与原始数据库中的序列之间的错配数,选择预期与所有流感亚型或特定宿主物种的病毒或亚型(例如所有禽病毒,仅H3N2病毒)具有广泛反应性的序列。另外,在最初研究中也包括选择用于先前实验的18个捕获和标记对,以确定它们是否适用于微阵列。
交叉反应性实验
[000145]进行仅有荧光团缀合的标记序列的6次重复的杂交(在目标流感不存在时),检查所有捕获和标记对的交叉反应性。在其它条件都相同的条件下进行实验。当微阵列信号发生(信号在本文定义为在大部分杂交玻片上平均S/N>3)时,移去捕获探针和相应标记探针并不再使用。该序列选择过程产生15个有用的捕获和标记对。
[000146]样品。提供从58个甲型流感病毒分离物提取的RNA,代表了人、禽、马、犬和猪宿主。此外,提供9个甲型流感病毒的盲试的患者样品阳性(咽喉拭子和鼻咽拭子)。从患者样品提取的病毒如之前所述。
[000147]RNA扩增:见上文。
[000148]微阵列载玻片制备:见上文。
[000149]RNA断裂和杂交。如上所述,转录的RNA在微阵列上进行杂交之前被断裂(Mehlmann等,Optimization of fragmentationconditions for microarray analysis of viral RNA.Anal.Biochem.347,316-323(2005),通过引用全部结合到本文中)。如前所述,杂交在室温下进行2小时(Townsend等,提交(2006))。
[000150]微阵列成像和分析。使用VersArray ChipReader扫描仪(Bio-Rad Laboratories,Hercules,CA)来扫描杂交载玻片,在532nm下检测,激光功率为60%,PMT灵敏度700V和5μm的分辨率。使用VersArray分析仪软件4.5版(Bio-Rad Laboratories,Hercules,CA)分析荧光图像。平均原始强度数值被计算为在单个图像中的每个捕获探针,最高强度的捕获探针随后被标准化为100,且将此对每个获得的微阵列图像进行重复。每个图像的标准化强度数据随后进行分层聚类分析(Number Cruncher Statistical Systems(NCSS)2004,Kaysville,Utah),使用Euclidean距离函数和无权重的对-组的平均方法。
[000151]尽管设计了捕获序列的点样模式,以便进行流感亚型的鉴别,但是技术人员知道捕获探针的任何点样模式都可以使用。可以手工阅读或由软件测定靶序列与捕获探针和标记探针的结合。同样,可通过手工或由软件自动进行鉴别流感型、亚型或毒株的靶结合模式的分析。
单个靶基因策略
实施例3
[000152]选择流感病毒M片段靶序列,用于检测和鉴别流感病毒的型、亚型和/或毒株
[000153]在一个示例性的实验中,对于不同的流感病毒亚型,观察到来自设计靶向M片段的捕获序列的不同信号模式。图10表示H3N2(A)、H1N1(B)和H5N1(C)甲型流感亚型中的M基因序列的这些模式。经检测呈甲型流感阳性的58个样品(都在2003年之前)中,18个病毒是H1N1亚型,26个是H3N2亚型,8个是H5N1病毒。同一亚型的所有病毒(几乎没有例外)在它们的7个序列中都表现出同样的视觉模式。可以观察到,序列1和4对所有3亚型都产生相对强度高的信号。序列3和7也表现出广泛的反应性,但是相对强度要低得多。还注意到序列6对H5N1病毒(以及其它禽亚型,数据未显示)具有选择性,对人H1N1和H3N2病毒不产生信号。
[000154]在另一个实施例中,在盲试研究期间简单目测图像显示,少数病毒分离物产生M片段微阵列识别标志,明显偏离图10所示的典型模式。这表明,一个“odd”识别标志源自已经感染人的猪H3N2病毒。观察到实验室重配病毒的另一个非典型性识别标志。7个M片段序列的微阵列识别标志指示H1N1病毒,而HA和NA序列指示H3N2病毒。这表明,病毒含有来自H3N2病毒的HA和NA基因以及来自A/Puerto Rico/8/1934(H1N1)的内在基因。在这些实施例中,仅用设计靶向高度保守基因片段的7个序列,出乎意料地进行了亚型鉴别。这些结果促使更充分地检查M片段鉴别和流感的亚型鉴别。选择大量额外M片段探针序列,来扩大模式识别能力(Mehlmann,M.等,FluChipTM:robust sequence selection method for a diagnosticmicroarray.J.Clin.Microbiol.(2006),通过引用全部结合到本文中用于所有目的)。在另一个示例性方法中,所用的序列选择方法是独特的,因为它识别类似流感病毒大家族内的保守区。然后根据保守区来设计合适的探针序列(捕获和标记)(参见方法部分)。选择探针序列,得到对所有病毒亚型都具有的广泛反应性或者对指定病毒亚型或宿主物种具有的高度特异的反应性。通过评价可能的探针序列与用于设计它们的数据库中所有序列之间的错配数,用计算机来测定预期反应性。
[000155]在一个实施例中,从甲型流感M片段中选出15个寡核苷酸探针序列,用作MChipTM的基础(参见表4的序列表)。得自CDC的58个甲型流感病毒分离物用于测定微阵列的表现,因为分离物代表各种亚型,包括:H1N1(18)、H3N2(26)和H5N1(8),其中圆括号中的数字就是用于测定给定亚型的分离物数目。对所有58个测试样品,成功扩增M基因片段,所有这些样品在微阵列上都产生阳性荧光信号(图像见图10,相对强度值见表6)。用多重PCR进行的先前研究表明,未能扩增的一个或多个基因在阵列上产生假阴性,这表明扩增过程失败、而非反映出微阵列的表现(Townsend,M.B.等,FluChip(TM):experimental evaluation of a diagnostic influenza microarray.J.Clin.Microbiol.提交(2006),通过引用全部结合到本文中用于所有目的)。使用单个基因扩增看来消除了所有这些假阴性结果。
实施例4
[000156]在一个实施例中,对于某些甲型流感亚型之间的共同序列,检查微阵列模式。图11代表H1N1、H3N2和H5N1病毒的典型微阵列模式。另外,图11表示对所有3种亚型表现出广泛反应性的探针序列1,4,5,6和15,尽管它们表现出不同的相对强度模式。序列9和14对H5N1病毒具有特异性(参见图11C),对H1N1和H3N2病毒无反应性。实验观察到的探针反应性通常与预测结果有关(参见表5)。在病毒亚型中通常也保持模式的相对强度。
[000157]在另一个实施例中,图12公开了并非H1N1、H3N2和H5N1亚型的病毒的M片段模式实例,见图11。首先,比较图12,可以见到所有3个模式都不同。另外,将图12与图11的模式比较,说明它们与典型的H1N1、H3N2和H5N1模式截然不同。图12A表示如前所述的实验室重配病毒的模式,其含有来自H3N2病毒的HA和NA基因,但内在基因来自H1N1病毒。先前用更少序列进行的研究得到指示H1N1病毒的M模式。有趣的是,对于大量探针序列,模式是独特的,并不一定匹配H3N2病毒(图11B)或H1N1病毒(图11C)。同样,感染人的猪H3N2病毒模式(见图12B)不匹配人H3N2模式(见图11)。在禽H9N2病毒的模式中观察到最终实例,见图12C。尽管它是禽病毒,同H5N1实例一样,见图11D,它不表现出同样模式。在大多数情况下,模式的差异不仅来自某探针的信号是否存在,而且经常来自信号相对强度的差异。
[000158]在另一个示例性方法中,采用简单分层聚类分析,显示微阵列信号模式间的相似性和差异。分层聚类广泛用于分析基因表达数据(Blalock,E.M.& Editor.A Beginner′s Guide to Microarrays(2003),通过引用结合到本文中)。在此,系统树图表明一组独立测定的“相关”程度。目前已使用分层聚类来评价经设计用于鉴定密切相关细菌的诊断用微阵列的模式(Francois,P.等,Rapid bacterial identification usingevanescent-waveguide oligonucleotide microarray classification.J.Microbiol.Methods In Press,Corrected Proof,2005年10月10日在线可用,通过引用结合到本文中)。在该项分析中,连接两个节点的水平长度表示相似性程度。当数据组更相似时,在连接它们的节点间会有更短的水平长度。
[000159]在另一个实施例中,图13A表示用于所测定的58个甲型流感患者分离物中每一个的微阵列实验的分层聚类分析(参见表6,用于聚类分析的相对强度)。概述了图4A的聚类系统树,表明不同的病毒亚型。用黑灰色线表示,所有被测宿主物种的H5N1病毒都属于同一聚类。所测的其它4个禽亚型也合并为一组,通常与人H1N1和H3N2病毒不同。对于图12C,禽H9N2病毒(黑线)表示视觉模式不同于禽H5N1病毒。通过聚类分析证实这一差异,见图13A。有趣的是,与其它禽流感病毒不同,H9N2病毒独自出现在聚类中,该聚类是不同的,其含有所测8个H5N1病毒。
[000160]在一个实施例中,图13说明了除了一个人H1N1病毒之外的所有(浅灰色)都存在于同一聚类中,它们也类似于H1N1疫苗株。另外,人H3N2(浅灰色线)病毒在系统树图中看来关系密切。所测的两个马H3N8(黑线)病毒出现在人H3N2病毒中成为一对。它们与H3N2病毒的相似性可能象征相似的病毒来源,但是在所测的有限数量的H3N8病毒中难以充分评价这一点。图12A和12B所讨论的H3N2/H1N1实验室重配株和猪H3N2病毒也与其它H3N2病毒构成松散的聚类,但是看来组外(out-grouped)作为一对,与主要人H3N2分枝很不同。如图12所示,仅使用7个探针序列的原始分析表明重配病毒的信号模式落入含有H1N1病毒的聚类中。在此,使用额外探针序列提供额外模式区别,重配病毒含有来自1934年的病毒的H1N1M片段明显在组外。
神经网络
[000161]在某些实施方案中,使用人工神经网络(ANN)以便选择用于本文所涵盖的阵列的靶基因序列。ANN是常见模式识别工具,用于微阵列数据分析,先前已用于诊断和预测癌症的类型。在一个示例性的方法中,用甲型流感病毒已知亚型的样品训练MChip ANN,以识别各亚型相关的阵列模式。如前所述,对于一组已知样品(称为“训练组”)提供标准化输入数据。通过提供训练组(例如病毒亚型)的已知输出,ANN软件学习将相对荧光强度的阵列模式与特异性输出(例如病毒亚型)联系起来。一旦建立起训练组的模式,就提供未知样品的数据作为输入。然后ANN就提供未知样品属于各输出种类的赋值(范围从0至1)。
[000162]根据此实施例,ANN利用16个输入,4个输出(H3N2、H1N1、H5N1和阴性),用前馈加权后扩增方法(feed-forward weightedback-propagation method)进行训练。随后使用留出一个(1eave-one-out)交叉确认来验证此方法。选择58个病毒分离物(所有H3N2、H1N1和H5N1样品)和10个已知甲型流感呈阴性的样品的微阵列结果,作为“训练组”。受训神经网络在盲试研究中用于测定53个未知样品的亚型。所有H3N2和H1N1未知样品都是从鼻腔拭子或冲洗液中得到的患者样品。表7显示53个未知样品的ANN输出赋值,显示了大于0.75的赋值。完成ANN分析之后,样品也就不是盲样了。使用赋值>0.75作为正确鉴别的最小值,对53个样品中的50个进行了正确分型和分亚型(对于甲型流感)。有一个假阳性结果和两个假阴性结果。所得灵敏度为95%,特异性为92%。
[000163]如本文所述,M片段在核苷酸水平上表现出高度保守,M1和M2的进化率分别为0.83x10-3和1.36x10-3核苷酸取代/年。在氨基酸水平,自1930年代M1一直表现出相当少的进化(每个残基为0.08x10-3氨基酸变化/年)。因为M1是病毒生命周期许多方面的重要组分,所以毫不奇怪的是,该蛋白质是高度保守的。在研究的一方面,观察到5个探针序列中有4个对微阵列上所有被测病毒亚型具有广泛反应性,这4个是靶向M1编码区内RNA部分的序列。
[000164]本文涵盖的病毒包膜中的M1基因的位置表明,它与其它病毒包膜蛋白(HA、NA和M2)的相互作用,当选择基因用于鉴别病毒(例如流感病毒)亚型时,这可能是关键因素。目前通过原型(proteotyping)进行的系统发生分析可鉴别相关序列之间细微但很重要的差异。通过在单个进化枝(clade)内鉴别独特氨基酸识别标志,发现HA与M基因原型配对的具体实例。该结果表明,一个基因内的变化需要在其它基因内选择补偿性突变。经常一起存在的若干基因的原型在重配期间表现出功能上重要的共分离(co-segregation)。另外,其它研究也已注意到在人流感的大规模测序工作中HA与M1之间的相关突变。这样的HA和M基因片段共同进化的证据很可能能解释在该研究中所观察到的亚型特异性结合模式。因此,类似于HA和M1而共同进化的其它基因,对分析病毒的亚型特异性微阵列模式而言也是重要的。
[000165]MH5N1病毒的MChip验证。为了进一步研究MChip正确识别快速新出现的亚型的潜力,对从大量的A/H5N1病毒提取的RNA进行额外的分析。检测了34个不同的A/H5N1样品,它们代表2003-2006年间的人、猫和各种鸟感染的病毒,以及来自不同的地理位置,包括越南、印度尼西亚、尼日利亚和哈萨克斯坦。来自87个独立的微阵列测试的结果代表流感、4个流感样疾病(ILI),和若干阴性对照的结果归纳在表8。微阵列和试验的灵敏度为95%,特异性为100%。
表3.用于流感病毒鉴定的捕获、标记和靶序列
Figure A20078000970700561
表3.用于流感病毒鉴定的捕获、标记和靶序列
Figure A20078000970700571
表3.用于流感病毒鉴定的捕获、标记和靶序列
Figure A20078000970700581
表4:用于本研究的M基因片段探针序列
Figure A20078000970700582
表5:15个MChip捕获和标记探针对与用于序列选择的M基因序列数据库的反应性(sw=猪,eq=马,h=人,av=禽)
Figure A20078000970700591
宿主物种用下列缩写词表示:h=人,av=禽,sw=猪,eq=马,can=犬
表6:58个患者分离物和9个未知样品的微阵列信号的相对强度
表7.使用人工神经网络(ANN)对53个样品进行甲型流感亚型的测定。每个ANN输出指定分值在0-1的范围之内。样品按顺序编号,大于0.75的任何指定赋值突出显示。检查标志表示正确的病毒型、亚型或阴性,X表示不正确的指定。
Figure A20078000970700611
科罗拉多公共卫生和环境部(Colorado Department of Public Health andEnvironment,CDPHE)通过免疫荧光测定鉴别HA部分亚型;完整的抗原性表征由疾病控制中心(CDC)提供;样品47-53是流感样疾病,包括阴性对照:SARS(严重急性呼吸综合征,severe acute respiratory syndrome),hMPV(人间质肺炎病毒,human metapneunovirus)、RSV(呼吸道合胞病毒),hPIV3(人类副流感病毒3型)
表8.使用人工神经网络(ANN)对87个微阵列试验(34种不同的A/H5N1病毒)进行甲型流感病毒的亚型测定。每个ANN输出指定分值在0-1的范围之内。样品按顺序编号,大于0.93的任何指定赋值突出显示。检查标志表示正确的病毒亚型的鉴别,X表示不正确的指定。病毒RNA由CDC提供。
Figure A20078000970700621
样品47-53是流感样疾病,包括阴性对照:SARS(严重急性呼吸综合征),hMPV(人间质肺炎病毒)、RSV(呼吸道合胞病毒),hPIV3(人类副流感病毒3型)
*  *  *  *  *
根据本公开,本文所公开和要求保护的所有组合物、方法和装置无需过多的实验就可以做出和实施。尽管通过优选的实施方案对所述组合物、方法和装置作了说明,但是,对于本领域技术人员来说显而易见的是,在不偏离本发明的构思、精神和范围的前提下,可以对所述组合物、方法和装置以及本文所述方法的步骤或步骤的顺序进行修改。更具体地讲,某些化学和生理相关的试剂可以替换本文所述的试剂,而得到相同或相似的结果,是显而易见的。所有这样的的类似替换和修改,只要对本领域技术人员来说是显而易见的,都视为落入所附权利要求书所限定的本发明的精神、范围和构思之内。

Claims (37)

1.一种阵列,其包括:多个含有寡核苷酸的捕获探针,其中所述捕获探针能够结合包括一种或多种流感病毒的靶基因的至少部分核酸序列或互补核酸序列的寡核苷酸。
2.如权利要求1所述的阵列,其中所述捕获探针能够结合一种或多种型的流感病毒。
3.如权利要求1所述的阵列,其中所述捕获探针能够结合一种或多种甲型流感病毒的亚型或毒株。
4.如权利要求1所述的阵列,其中所述多个捕获探针与固体基质的表面结合。
5.如权利要求4所述的阵列,其中所述阵列含有100个以下的能与固体基质表面结合的捕获探针。
6.如权利要求4所述的阵列,其中所述固体基质选自玻璃、塑料、硅涂敷基质、大分子涂敷基质、颗粒、珠、微粒、微珠、浸渍片、磁珠、顺磁珠及其组合。
7.如权利要求4所述的阵列,还包括与固体基质表面结合的阳性对照探针,其中所述阳性对照探针能够指示足以使捕获探针与寡核苷酸结合形成复合物的条件,所述寡核苷酸包括靶基因的至少部分核酸序列或互补核酸序列。
8.如权利要求1所述的阵列,其中所述阵列是微阵列。
9.如权利要求8所述的阵列,其中所述微阵列是来源于不止一个靶基因的多种特征性阵列。
10.如权利要求1所述的阵列,其中所述捕获探针能够结合流感病毒株,该流感病毒株选自甲型流感病毒H3N2、甲型流感病毒H1N1、甲型流感病毒H5N1、甲型流感病毒H7N7、甲型流感病毒H9N2、甲型流感病毒H3N8、甲型流感病毒H1N2、甲型流感病毒H3N3、甲型流感病毒H3及其组合。
11.如权利要求1所述的阵列,其中所述包括至少部分核酸序列或互补核酸序列的寡核苷酸来源于单个靶基因片段。
12.如权利要求1所述的阵列,其中所述捕获探针选自表3、表4中所列出的序列或其组合。
13.如权利要求1所述的阵列,其中每个捕获探针的长度独立地是约10个至约100个核苷酸。
14.一种制作用于检测流感病毒存在的阵列的方法,其包括:
将多个捕获探针与固体基质表面连接以形成阵列,其中所述捕获探针能够结合包括一种或多种流感病毒的靶基因的至少部分核酸序列或互补核酸序列的寡核苷酸。
15.如权利要求14所述的方法,其中所述捕获探针能够结合一种或多种型的流感病毒。
16.如权利要求14所示的方法,其中所述捕获探针能够结合一种或多种甲型流感病毒的亚型或毒株。
17.如权利要求14所述的方法,还包括阳性对照探针与固体基质表面的结合,其中所述阳性对照探针能够指示足以使捕获探针与寡核苷酸结合形成复合物的条件,所述寡核苷酸包括靶基因的至少部分核酸序列或互补核酸序列。
18.如权利要求14所述的方法,其中所述捕获探针能够结合包括靶基因的至少部分核酸序列或互补核酸序列的寡核苷酸,所述靶基因选自血凝素(HA基因片段)、神经氨酸酶(NA基因片段)、基质蛋白(M基因片段)及其组合。
19.如权利要求14所述的方法,其中所述捕获探针能够结合包括M基因片段的至少部分核酸序列或互补核酸序列的寡核苷酸。
20.一种检测样品中流感病毒的方法,该方法包括:
a)使样品与阵列中的多个捕获探针接触以产生测试阵列,其中当所述样品含有寡核苷酸且所述寡核苷酸包括一种或多种流感病毒的靶基因的至少部分核酸序列或互补核酸序列时,所述测试阵列包括捕获探针-样品复合物;和
b)使所述测试阵列与一个或多个检测探针接触以产生被标记的阵列,其中当所述测试阵列包括捕获探针-样品复合物时,所述被标记的阵列包括靶-探针复合物,且其中所述靶-探针复合物的存在表明样品中存在流感病毒。
21.如权利要求20所述的方法,其中所述阵列包括多个捕获探针,该捕获探针包括流感病毒的至少一种型、亚型或毒株的一个或多个靶基因的至少部分核酸序列或互补核酸序列。
22.如权利要求20所述的方法,其中通过检测由靶-探针复合物中的探针产生的信号来确定样品中流感病毒的存在。
23.如权利要求22所述的方法,其中由所述靶-探针复合物产生的信号根据样品中存在的流感病毒的型、亚型或毒株而形成不同的样式。
24.如权利要求20所述的方法,其中所述捕获探针能够结合一种或多种型的流感病毒。
25.如权利要求20所述的方法,其中所述捕获探针能够结合一种或多种甲型流感病毒的亚型或毒株。
26.如权利要求20所述的方法,还包括与固体基质表面结合的阳性对照探针,其中所述阳性对照探针能够指示足以使捕获探针与寡核苷酸结合形成复合物的条件,所述寡核苷酸包括靶基因的至少部分核酸序列或互补核酸序列。
27.如权利要求20所述的方法,还包括与固体基质表面结合的阴性对照探针,其中所述阴性对照探针能够指示足以显示捕获标记探针与流感病毒结合而不与阴性对照探针结合的特异性的条件。
28.如权利要求20所述的方法,其中所述靶基因选自血凝素(HA基因片段)、神经氨酸酶(NA基因片段)、基质蛋白(M基因片段)及其组合。
29.如权利要求20所述的方法,其中所述样品选自鼻咽冲洗液、咳吐物、眼拭子、呼吸道拭子、咽喉拭子、鼻拭子、鼻粘液、气管吸出物、支气管肺泡灌洗液、粘液、血液、尿液、组织、唾液、空气样品、空气过滤器样品、表面相关样品及其组合。
30.如权利要求20所述的方法,还包括在12小时以内鉴定样品中流感病毒的存在。
31.一种阵列,其包括:多个含有寡核苷酸的捕获探针,其中所述捕获探针能够结合包括一种或多种流感病毒的单个靶基因片段的至少部分核酸序列或互补核酸序列的寡核苷酸。
32.如权利要求31所述的阵列,其中所述捕获探针能够结合一种或多种型的流感病毒。
33.如权利要求31所述的阵列,其中所述捕获探针能够结合一种或多种甲型流感病毒的亚型或毒株。
34.如权利要求31所述的阵列,其中所述捕获探针能够结合包括M基因的至少部分核酸序列或互补核酸序列的寡核苷酸。
35.如权利要求31所述的方法,其中所述单个靶基因片段的所述部分核酸序列或互补核酸序列包括流感病毒的型、亚型或毒株的保守序列区域。
36.一种试剂盒,其包括:
(a)与固体基质表面结合的多个捕获探针的阵列,其中所述捕获探针能够结合包括一种或多种流感病毒的靶基因的至少部分核酸序列或互补核酸序列的寡核苷酸;和
(b)一个或多个加标记的标记探针,其中所述加标记的标记探针能够产生信号,且其中所述标记探针能够结合包括一种或多种流感病毒的靶基因的至少部分核酸序列或互补核酸序列的寡核苷酸。
37.如权利要求36所述的试剂盒,还包括与所述固体基质表面结合的阳性对照探针,其中所述阳性对照探针能够指示足以使捕获探针与寡核苷酸结合形成复合物的条件,所述寡核苷酸包括靶基因的至少部分核酸序列或互补核酸序列。
CNA2007800097077A 2006-01-18 2007-01-18 作为当前新出现的流感病毒株诊断的dna阵列分析 Pending CN101405400A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US75967006P 2006-01-18 2006-01-18
US60/759,670 2006-01-18
US60/784,751 2006-03-21

Publications (1)

Publication Number Publication Date
CN101405400A true CN101405400A (zh) 2009-04-08

Family

ID=40538777

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2007800097077A Pending CN101405400A (zh) 2006-01-18 2007-01-18 作为当前新出现的流感病毒株诊断的dna阵列分析

Country Status (1)

Country Link
CN (1) CN101405400A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106636475A (zh) * 2017-03-01 2017-05-10 中国农业大学 一种检测北美h3n8亚型犬流感病毒的引物组及其应用
CN109790565A (zh) * 2016-06-15 2019-05-21 基因捕获公司 包含茎-环捕获分子的组合物、方法和装置
CN111455105A (zh) * 2020-04-10 2020-07-28 山东端泉健康科技有限公司 预测rna病毒感染重症的基因芯片及其使用方法与应用
CN111766383A (zh) * 2020-07-09 2020-10-13 温州医科大学 一种用于检测致病性病毒及其相关蛋白和预判新型未知病毒的方法
CN115910377A (zh) * 2022-12-06 2023-04-04 中国人民解放军军事科学院军事医学研究院 一种非进化树依赖的分节段rna病毒重配的方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109790565A (zh) * 2016-06-15 2019-05-21 基因捕获公司 包含茎-环捕获分子的组合物、方法和装置
CN106636475A (zh) * 2017-03-01 2017-05-10 中国农业大学 一种检测北美h3n8亚型犬流感病毒的引物组及其应用
CN106636475B (zh) * 2017-03-01 2020-05-22 中国农业大学 一种检测北美h3n8亚型犬流感病毒的引物组及其应用
CN111455105A (zh) * 2020-04-10 2020-07-28 山东端泉健康科技有限公司 预测rna病毒感染重症的基因芯片及其使用方法与应用
CN111766383A (zh) * 2020-07-09 2020-10-13 温州医科大学 一种用于检测致病性病毒及其相关蛋白和预判新型未知病毒的方法
CN115910377A (zh) * 2022-12-06 2023-04-04 中国人民解放军军事科学院军事医学研究院 一种非进化树依赖的分节段rna病毒重配的方法
CN115910377B (zh) * 2022-12-06 2023-09-26 中国人民解放军军事科学院军事医学研究院 一种非进化树依赖的分节段rna病毒重配的方法

Similar Documents

Publication Publication Date Title
Augustine et al. Loop-mediated isothermal amplification (LAMP): a rapid, sensitive, specific, and cost-effective point-of-care test for coronaviruses in the context of COVID-19 pandemic
John et al. Next-generation sequencing (NGS) in COVID-19: a tool for SARS-CoV-2 diagnosis, monitoring new strains and phylodynamic modeling in molecular epidemiology
Vemula et al. Current approaches for diagnosis of influenza virus infections in humans
Townsend et al. Experimental evaluation of the FluChip diagnostic microarray for influenza virus surveillance
JP2009523451A (ja) 既存のおよび新興のインフルエンザ株の診断法としてのdnaアレイ解析の方法
US20180330056A1 (en) Methods of Processing and Classifying Microarray Data for the Detection and Characterization of Pathogens
CN101133164B (zh) 再测序病原菌微阵列
Dietze et al. From low to high pathogenicity—Characterization of H7N7 avian influenza viruses in two epidemiologically linked outbreaks
Lodes et al. Use of semiconductor-based oligonucleotide microarrays for influenza a virus subtype identification and sequencing
Sakurai et al. Updated values for molecular diagnosis for highly pathogenic avian influenza virus
Gall et al. Design and validation of a microarray for detection, hemagglutinin subtyping, and pathotyping of avian influenza viruses
Isoda et al. Detection of new H5N1 high pathogenicity avian influenza viruses in winter 2021–2022 in the far east, which are genetically close to those in Europe
CN101405400A (zh) 作为当前新出现的流感病毒株诊断的dna阵列分析
WO2018103684A1 (zh) 预测siRNA针对某类细胞的毒性的机器学习模型的建立方法及其应用
Laamiri et al. Accurate detection of avian respiratory viruses by use of multiplex PCR-based luminex suspension microarray assay
Huang et al. Neuraminidase subtyping of avian influenza viruses with PrimerHunter-designed primers and quadruplicate primer pools
Ganti et al. Avian influenza A viruses reassort and diversify differently in mallards and mammals
Courtney et al. Nucleic acid-based sensing techniques for diagnostics and surveillance of influenza
Halecker et al. A new molecular detection system for canine distemper virus based on a double-check strategy
Spackman et al. Avian influenza diagnostics and surveillance methods
Busch et al. Seroprevalence of infection with feline morbilliviruses is associated with FLUTD and increased blood creatinine concentrations in domestic cats
Thieulent et al. Multiplex one-step RT-qPCR assays for simultaneous detection of SARS-CoV-2 and other enteric viruses of dogs and cats
Tivane et al. Antigenic and genetic characterization of influenza viruses isolated in Mozambique during the 2015 season
Fesenko et al. Oligonucleotide microchip for subtyping of influenza A virus
CN107447054A (zh) 禽流感与新城疫双重微滴数字pcr绝对定量检测试剂盒

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication