CN1333831A - 区分大肠杆菌0157∶h7和其它菌株的多态性位点 - Google Patents

区分大肠杆菌0157∶h7和其它菌株的多态性位点 Download PDF

Info

Publication number
CN1333831A
CN1333831A CN99815683A CN99815683A CN1333831A CN 1333831 A CN1333831 A CN 1333831A CN 99815683 A CN99815683 A CN 99815683A CN 99815683 A CN99815683 A CN 99815683A CN 1333831 A CN1333831 A CN 1333831A
Authority
CN
China
Prior art keywords
gnd
sequence
escherichia coli
nucleic acid
polymorphism
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN99815683A
Other languages
English (en)
Inventor
菲利普·I·塔尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seattle Childrens Hospital
Original Assignee
Seattle Childrens Hospital
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seattle Childrens Hospital filed Critical Seattle Childrens Hospital
Publication of CN1333831A publication Critical patent/CN1333831A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0006Oxidoreductases (1.) acting on CH-OH groups as donors (1.1)

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Organic Chemistry (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本发明总的来说涉及微生物学和食品科学领域。具体地说,发明人从14个大肠杆菌(Escherichia Coli)菌株及其多态性序列中发现了gnd基因和相应的6-磷酸葡萄糖酸脱氢酶(6-PGD)蛋白,并发明了一套新的生物技术工具、诊断方法和食物检测技术。

Description

区分大肠杆菌O157:H7和其它菌株的 多态性位点
发明领域
本发明总的来说涉及微生物学和食品科学领域。具体地说,发明人从14个大肠杆菌(Escherichia Coli)菌株及其多态性序列中发现了gnd基因和相应的6-磷酸葡萄糖酸脱氢酶(6-PGD)蛋白,并发明了一套新的生物技术工具、诊断方法和食物检测技术。
发明背景
大肠杆菌O157:H7是一种食物传播的强毒性人类病原菌。它可以引起一系列疾病(包括无症状和有症状的阶段),如轻度腹泻,便血/出血性肠炎,以及发生在肠炎后的具有潜在致命可能的溶血性尿毒综合症(HUS)。(Wilson等,传染病杂志,174:1021-1027,(1996);Karch等,临床微生物学杂志,33:1602-1605,(1995);Rodrigue等,传染病杂志,172:1122-1125,(1995);Riley等,新英格兰医学杂志,308:681-685,(1983);Kaarmali等,Lancet,1:619-620,(1983);Neill等,Arch Intem Med,145:2215-2217,(1985);Neill等,小儿医学,80:37-40,(1987);Tarr等,传染病杂志,162:553-556,(1990))。虽然某些情况下其它大肠杆菌菌株也被认为是致病菌,但大肠杆菌0157:H7强烈的致病能力是其区别于其他品系的显著特征。
HUS定义为下列三种病的综合症:非免疫性微血管溶血性贫血症,血小板减少症和急性肾衰竭。HUS主要是10岁以下儿童的疾病。然而,老年人也容易由于肠胃感染大肠杆菌O157:H7而引发严重的并发症。(Martin等,新英格兰医学杂志,323:1161-1167(1990);Siegler等,小儿医学,94:35-40(1994);Tarr和Hickman,小儿医学,80:4145(1987);Tarr等,美国传染病杂志,129:582-586(1989);Tarr等,传染病杂志,162:553-556(1990);Carter等,新英格兰医学杂志,317:1496-1500(1987);以及Ryan等,传染病杂志,154:631-638(1986))
在肠胃感染大肠杆菌O157:H7的儿科病例中,约有10%-15%会发生HUS。(Bell等,JAMA,272:1349-1353(1994)和Bell等,小儿医学,100:E12(1997))。患HUS的儿童中大约有3/4需要输血,大约有1/2需要透析治疗。(Tarr等,美国传染病杂志,129:582-586(1989);(Brandt等,小儿医学杂志,125:519-526(1994);以及Tarr等,美国传染病杂志,129:582-586(1989))。尽管我们可以诊断出O157:H7的感染,而且还采用了现代的儿科特别护理,仍然有大约5-10%的感染者会死亡。(Brandt等,小儿医学杂志,125:519-526(1994)和Tarr等,美国传染病杂志,129:582-586(1989))。对O157:H7爆发的调查证明这个病菌的感染剂量是很低的。例如,在Portland的Oregon的一个湖中,它的O157:H7含量低得无法检测出,可是游客们只要少量接触它就足以染病。(Keene等,新英格兰医学杂志,331:579-584(1994))。又如1994年在西北太平洋地区一次与意大利腊肠有关的O157:H7爆发中,调查人员得出结论认为那些染病的人仅仅摄入了2-45个大肠杆菌O157:H7活菌体。(Tilden等,美国公共健康杂志,86:1142-1145(1996))。
大肠杆菌O157:H7常见于各种未经有效灭菌处理的食物和环境载体中。受污染的土地上出产的熟牛肉的跨地区流散(Bell等,JAMA,272:1349-1353(1994)和Riley等,新英格兰医学杂志,308:681-685(1983));盐腌的、经过发酵但没有煮过的意大利腊肠(Tilden等,美国公共健康杂志,66:1142-1145(1996));地方供水(Swerdlow等,国际医学年报,117:812-819(1992))和游泳池水(Keene等,新英格兰医学杂志,331:579-584(1994));未经巴斯德消毒的苹果汁(匿名作者,Morb Mortal Wkly Rep,45:975(1996));未经巴斯德消毒的牛奶(Keene等,传染病杂志,176:815-818(1997))以及生菜(Ackers等,传染病杂志,177:1588-1593(1998))曾导致过大规模O157:H7感染。有报道说,不当的食物处理方法是导致人类感染的一个重要因素。(Mead等,Arch Intern Med,157:204-208(1997))。
大肠杆菌O157:H7没有荚膜多糖,但它表达一种名为157的由不同长度之重复的四糖单位构成的O侧链抗原。这些四糖单位构成了抗原性的O157脂多糖(LPS)。和其它大肠杆菌菌株不同,在MacConkey琼脂培养基上(其中用山梨醇代替乳糖作为碳源)过夜培养的O157:H7不能发酵山梨醇(Wells等,临床微生物学杂志,18:512-520(1983);March等,临床微生物学杂志,23:869-872(1986))。大肠杆菌O157:H7不能合成β-葡萄糖苷酶,这是另一个代谢上的重要区别。(Ratnam等,临床微生物学杂志,26:2006-2012(1988))。不能发酵山梨醇的大肠杆菌O157:H7几乎总会表达一种H7鞭毛抗原,但是在美国发现的不能发酵山梨醇的大肠杆菌O157:H7有时也不表达H7抗原。(Slutsker等,国际医学年报,126:505-513(1997))。在德国和捷克共和国境内发现了另一种能表达O157抗原的大肠杆菌O157:H7变种,它是能发酵山梨醇但不能运动的病原菌。(Bielaszewska等,临床微生物学杂志,36:2135-2137(1998);Gunzer等,临床微生物学杂志,30:1807-1810(1992))。这类不能发酵山梨醇的变种很难用山梨醇-MacConkey琼脂筛选技术来进行鉴定。
目前的诊断方法包括检测大肠杆菌在MacConkey琼脂培养基上的生长特征(如上所述),以及利用一种O157LPS的特异性血清试剂。具体地说,如果一种微生物在山梨醇-MacConkey琼脂培养基上外形象是典型的大肠杆菌,不能发酵山梨醇,可以和一种O157LPS侧链的特异性血清试剂反应但不能与对照(阴性)试剂反应,我们就认为它能产生志贺毒素,并推测它是致病性大肠杆菌O157:H7。在临床上不需要检测H7抗原和产生毒素的表型,因为那些不能发酵山梨醇、非黏液状的、能和一种特异性O157抗原鉴定试剂反应而不和负对照试剂反应的大肠杆菌,几乎总是可以产生毒素的。(Strockbine等,“检测和亚种鉴定方法概要”,Escherichia coil O157:H7和其它产生Shiqa毒素的大肠杆菌,第33章,Kaper和O′Brien编著,Washington,DC:ASM出版社,1998:331-356;和Tarr,“产生志贺毒素的大肠杆菌感染:挑战和机遇”,大肠杆菌O157:H7和其它产生志贺毒素的大肠杆菌,第39章,Kaper and O′Brien编著,Washington,DC:ASM出版社,1998:393-402)。
最近人们建立了一些替代诊断方法。其中一种包括检测释放出来的志贺毒素。这些检测方法要么利用志贺毒素和鞘脂糖配体结合(globotriaosylceramide)的能力(Basta等,临床微生物学杂志,27:1617-1622(1989))(Biocarb,Gaithersburg,MO),要么利用酶免疫分析法(Meridian Diagnostics,Cincinnati,Ohio)(Kohl等,临床微生物学杂志1,35:2051-2054(1997));Park等,微生物感染疾病诊断,26:69-72(1996))。这些检测方法的优点在于它们除了检测大肠杆菌O157:H7以外还能检测其他产生志贺毒素的大肠杆菌。有些诊断方法也包括:使用探针或者引物,通过杂交、酶切、聚合酶链式反应(PCR)来检测O157:H7序列。(参见:美国专利5,738,995;5,747,257和5,756,293)。
各种鉴定食物中的强致病性大肠杆菌的方法也已建立。(Bennett等,应用微生物学通讯22:237-243(1996);Bennett等,应用微生物学通讯,20:375-379(1995);Blanco等,微生物学,12:385-394(1996);Bolton等,应用微生物学通讯,23:317-321(1996);Doyle和Schoeni,应用与环境微生物,53:2394-2396(1987);Feldsine等,J AOAC Int,80:517-529(1997);Feldsine等,J AOAC Int,80:530-543(1997);Feldsine等,J AOAC Int,80:43-48(1997);Feldsine等,J AOAC Int,80:37-42(1997);Jinneman等,食品保护杂志,58:722-726(1995);Johnson等,应用与环境微生物,61:386-388(1995);Kim和Doyle,应用与环境微生物,58:1764-1767(1992);Notermans等,国际食品微生物学杂志,13:31-40(1991);Okrend等,食品保护杂志,53:936-940(1990);Padhye和Doyle,应用与环境微生物,57:2693-2698(1991);Pawelzik,Acta Microbiol Hung,38:315-320(1991);Ratnam和March,加拿大医学协会杂志,134:43-46(1986);Read等,Epidemiol lnfec,105:11-20(1990);Sequel,加拿大医学协会杂志,143:519-521(1990);Tortorello和Stewart,应用与环境微生物,60:3553-3559(1994);Vernozy-Rozand等,Revue de Medecine Veterinaire,149:239-244(1998);Vernozy-Rozand等,Revue de Medecine Veterinaire,148:879-882(1997);Vernozy-Rozand等,应用微生物学通讯,25:442-446(1997);Willshaw等,应用微生物学杂志,75:420-428(1993);Yu和Bruno,应用与环境微生物,62:587-592(1996))。这些技术中许多包括疏水性载网膜过滤法(Doyle和Schoeni,应用与环境微生物,53:2394-2395(1987)),计量棒免疫测定法(Padhye和Doyle,应用与环境微生物,57:2693-2698(1991)),多元聚合酶链式反应检测法(Jinneman等,食品保护杂志,58:722-728(1995)),标准微生物学技术,免疫磁珠分离法(Bennett等,应用微生物学通讯,22:237-243(1996);Blanco等,微生物学,12:385-394(1996);Karch等,临床微生物学杂志,34:516-519(1996);Vernozy-Rozand等,应用微生物通讯,25:442-446(1997);Willshaw等,应用微生物杂志,75:420-426(1993);Yu和Bruno,应用与环境微生物,62:587-592(1996))或者它们的组合。不过对大肠杆菌致病菌株,特别是O157:H7的起源仍需要更好的了解,也需要新方法来快速检测在受感染个体和传染媒介中是否存在这些致病菌。这些传染媒介包括,但不仅限于食物和水源。
发明概述
在本发明中,发明人发现了14个大肠杆菌菌株的gnd基因和相应的6-磷酸葡萄糖酸脱氢酶(6-PGD)蛋白。发明人还在这些基因和蛋白中发现了一些多态现象,这些多态现象可以用于鉴定某一特定的大肠杆菌菌株和/或区分不同的大肠杆菌菌株。特别是其中一个涉及发生在第218位氨基酸的异亮氨酸替代苏氨酸的多态现象,可以用于将有强致病力的O157:H7以及O55:H7菌株与致病力弱的O157:H7菌株区分开。因为O55:H7和O157:H7只有大约82%的同源性,强致病力的O157:H7菌株和O55:H7可以从好几个不同的位点进行区分。通过检测第218位是否存在多态性和鉴定O157:H7与O55:H7的非同源区域是否存在,技术人员可以快速地检验来自病人、食物或者液体的样品中是否含有强致病力的大肠杆菌菌株。另外,通过鉴定gnd位点是否存在其它多态现象,技术人员可以有效地区分特定的大肠杆菌菌株,使诊断和鉴定更加精确。
本发明的实施方案包括编码gnd基因的分离的多核苷酸序列,其中所述多核苷酸序列含有序列表中所公开的大肠杆菌序列之一。这些序列的含有至少9个连续碱基的片断和表1中描述的多态性也是本发明的实施方案。其它实施方案还包括编码一种与序列表中公开的大肠杆菌核苷酸序列相应的多肽的分离的核苷酸;和至少含有9个碱基的核酸片断,它能在如下条件下和序列表中的核苷酸序列杂交:7%SDS,0.5M NaPO4(pH7.0),1mM EDTA,50℃,并在42℃下用1%SDS洗。另外一个实施方案涉及一种检测大肠杆菌O157:H7是否存在的核酸探针,它包含一个至少长7个核苷酸的分离的核酸分子,其中所述核酸分子可以和大肠杆菌O157:H7的gnd基因序列杂交而不和非-H7大肠杆菌O157菌株的gnd基因杂交。本发明另一方面涉及可以用来检测大肠杆菌O157:H7是否存在的核酸引物,它包含一个至少含有7个核苷酸的分离的核酸分子,其中所述分离的核酸分子可以作为大肠杆菌O157:H7的gnd基因的引物而不能作为非H7大肠杆菌O157菌株的gnd基因的引物。本发明中的核酸探针可以通过基质或芯片中的微型点阵来提供。
含有序列表中的一段序列的重组构建体和载体也是本发明的实施方案。此外,本发明的一个实施方案还包括携有本发明的一个载体的培养细胞系。本发明中的蛋白质包括一个包含序列表中的一段序列的分离的蛋白质,以及一个含有序列表中一段序列的至少3个连续氨基酸的分离的多肽,其中所述多肽含有至少一个可从表1中推演出来的多态性位点。其他有关蛋白质的实施方案还涉及一种能够和含有序列表中一段序列的蛋白质特异结合的分离的抗体,其中所述抗原决定簇与可从表1中推演出来的多态性位点对应。此外,还有一项实施方案包括一种能够和含有序列表中至少9个连续氨基酸残基的一段序列的多肽结合的分离的抗体,其中的抗原决定簇对应于至少一个可从表1中推演出来的多态性位点。在某些实施方案中,抗体是单克隆抗体。
检测多态性以及检测或诊断是否存在强致病力的大肠杆菌的方法也是本发明的实施方案。在一个方法中,通过获得含有多核苷酸的生物样品并分析其中是否存在诊断性多核苷酸,该多核苷酸含有至少一个表1中描述的多态性,就可以检测出编码6-PGD的基因的多态性。有些情况下,我们还要分析是否存在C653T或者G653C的多态性和/或对该生物样品的分析进一步包含DNA扩增步骤。另一种方法涉及鉴定致病和非致病大肠杆菌。这种方法的实施是通过,获得含有多核苷酸的生物样品,然后分析该样品中是否存在可用来诊断的多核苷酸,该多核苷酸含有至少一个表1中描述的多态性,并且在是否存在至少一个表1中描述的多态性的基础上判断该大肠杆菌是致病性还是非致病性菌株。在这种实施方案的某些情况中,需要分析是否存在C653T或G653C的多态性,和/或所述生物样品的分析还包括DNA扩增步骤。
本发明的其他方法包括,一种制备6-PGD蛋白的方法,它有下列步骤:获得含有序列表中的一个序列的cDNA;然后将该cDNA插入到一个表达载体中,从而使cDNA可操纵地与一个启动子连接;将该表达载体导入宿主细胞,以便宿主细胞产生该cDNA所编码的蛋白。这种方法可以和该蛋白的分离步骤联合起来使用。另外一种方法涉及构建能表达序列表中的一个序列的转化宿主细胞。这种方法包括在宿主细胞中转入适合基因表达的重组DNA载体。另外,我们还提供了一种检测样品中是否存在大肠杆菌O157:H7的方法,它包括如下步骤:(a)在杂交条件下,使上述样品和一种核酸探针进行接触以便形成杂交复合体,该探针能选择性地和来自大肠杆菌O157:H7的gnd的核酸序列杂交,而不和来自非H7的大肠杆菌O157菌株的gnd的核酸序列杂交,和(b)检测上述杂交复合体是否产生,从而指示样品中是否含有大肠杆菌O157:H7。
附图简述
图1    图解显示了存在于几个大肠杆菌菌株的gnd基因位点中的多态性。横条表示长1407 bp的gnd等位基因,竖线表示通过与一段共有序列比较得出的多态性位点。
图2    显示了大肠杆菌O55:H7和大肠杆菌O157:H7染色体在大肠杆菌O55:H7的gnd 3′端下游3916个核苷酸和大肠杆菌O157:H7的gnd基因3′端下游52个核苷酸之间的同源性。大肠杆菌O55:H7的其余DNA中我们感兴趣的元件包括一段与S.enterica Typhimurium的tnpA基因同源的片段,与大肠杆菌O157的rfb簇、wbdJ和wbdk的非编码区有同源性的H-重复蛋白质基因。开放阅读框被注明是同源蛋白。位点按照染色体的情况定位。
图3显示一段带有gnd位点及其旁侧区域的染色体。
发明详述
本文中,发明人叙述了14个大肠杆菌菌株中gnd基因和相应的6-磷酸葡萄糖酸脱氢酶(6-PGD)蛋白的发现过程。发明人还在这些基因和蛋白质中找到了几个可以用来确定存在某特定大肠杆菌菌株和/或将一个大肠杆菌菌株与其他菌株相区别的遗传差异或“多态性”。其中一个具体的多态性是第218位氨基酸由苏氨酸替代异亮氨酸,该多态性用“T218I”或“Thr218Iso”表示。在某些情况下,这种形式的6-PGD或编码这种6-PGD的多核苷酸(即218位为异亮氨酸或编码218位异亮氨酸的多核苷酸)用“Thr218”表示。在其他的情况下,“Iso218”表示的是编码6-PGD的一个片段的多核苷酸上的多态性(在这种情况下,多态性与编码6-PGD片段的多核苷酸的第218位密码子有关)或表示6-PGD蛋白本身的一个片段(在此情况下,多态性与序列表提供的6-PGD多肽序列上第218位氨基酸有关)。这种多态性也可以通过编码Iso218多态性的核苷酸差异来表示。也就是说,Thr218多态性来自于核苷酸位点653和654分别存在胞嘧啶和鸟嘌呤;然而,Iso218多态性在653和654位分别是胸腺嘧啶和胞嘧啶。这样,其他表示第218号氨基酸残基多态性的方法有,“第653位核苷酸的CT突变”和/或“第654位核苷酸的GC突变”或“C653T”和/或“G654C”。
在以下公开文本中,发明人描述了来自不同大肠杆菌菌株的14个gnd基因及其相应蛋白质的克隆、测序和鉴定。同时证明了在gnd-rfb区域内存在一个或多个可移动的DNA元件,这些元件能在大肠杆菌中共转移,引起抗原的变化,从而导致出现表达O55和O157抗原的致病大肠杆菌。生物学工具、诊断学和前述方法的使用也在以下部分阐述。这些实施方案对于快速鉴定是否存在特定的大肠杆菌菌株以及将一个菌株与其他菌株相区别,例如将强致病菌株O157:H7与非致病的菌株区别开很有帮助。在以下部分,发明人描述了来自不同大肠杆菌菌株的14个gnd基因及其相应蛋白质的克隆、测序和鉴定。
来自不同大肠杆菌菌株的14个gnd基因及相应蛋白质的克隆、测序和鉴定
最近,研究主要集中在利用大肠杆菌O157:H7的rfb区(编码产生大肠杆菌O157的O侧链抗原所必需的酶的一簇基因)作为基于DNA的检测系统的潜在目标上,这种检测系统用于食物、水源和人临床样品。(Desmarchelier等,临床微生物学杂志,36:1801-1804(1996);(Feng等,临床微生物学杂志,36:2339-2341(1998);(Paton和Paton,临床微生物学杂志,36:598-602(1998))。虽然O157抗原的表达和在这一区域编码的rfb区的存在是致病性大肠杆菌O157的必要组分,但也存在不同的非产毒性的、表达H抗原3、16、43和45的大肠杆菌O157,它含有与大肠杆菌O157:H7的rfb区同源的序列。(Bilge等,传染与免疫,64:4795-4801(1996))。这些微生物会妨碍以检测rfb区的基因差异为基础的诊断策略的实行。(Wang等,传染与免疫,66:3545-3551(1998))。
rbf基因簇在大肠杆菌染色体大约44分钟(minutes)的位置。这些基因簇长度通常为8-14kb,含有约8-12个产生O侧链脂多糖的连续基因。(Reeves,New Compr Biochem,27:281-314(1994);Reeves等,微生物学进展,4:495-503(1996))。紧挨着rfb基因簇的是gnd等位基因,它编码戊糖磷酸途径的第3个酶——6-磷酸葡萄糖酸酶(6-PDG)(EC1.1.1.44)。尽管,gnd编码一个与细菌的功能致关重要的“管家”基因,但与其他位于大肠杆菌染色体上的“管家”基因相比,这个等位基因却是高度多态化的。(Whittam和Ake,“分子进化机理”,Sinunir,Takahata和Clark编著,Sunderland,MA:1993:223-245)。一些人认为gnd位点的多态性是由于与沙门氏菌的菌株间和种间的转移及随之的重组造成的。(Barcak和Wolf,微生物学杂志,170:372-379(1988);Beltran等,美国科学院院报,85:7753-7757(1988);Bisercic等,微生物学杂志,173:3894-3900(1991);Boyd等,普通微生物学杂志,139:1125-1132(1993);Oykhuizen和Green,微生物杂志,173:7257-7288(1991);以及Selander等,传染与免疫,58:2262-2275(1990))。
在其中一种被称为“搭乘假说”的模型中,认为大肠杆菌的rfb区是借助同源序列和低G+C含量通过水平转移从其他种获得的。也就是说gnd被认为是与rfb共转移的或与rfb“搭乘”的。(Nelson and Selander,美国科学院院报91:10227-10231(1994))。大肠杆菌O157:H7的6-PGD和与之最接近的非O157:H7大肠杆菌的6-PGD的相异电泳外观支持这个假说。据推测,在其他的进化事件,包括获得编码噬菌体志贺毒素的基因、大肠杆菌O157:H7的大质粒和失去发酵山梨醇的能力等,大肠杆菌O55:H7的rfb区域与大肠杆菌O157:H7的rfb区域发生过交换。(Feng等,临床微生物学杂志。36:2339-2341(1998))。
目前的范例将已观察到的多态性gnd结构解释为对gnd本身的选择压力的结果,发明人则着手证明gnd基因的遗传多样性是由于gnd基因和rfb基因簇具有相似性及rfb基因编码能成为免疫系统有效目标的细菌表面分子引起的。发明人详细论述gnd基因和其他位于rfb基因簇内的基因一起与免疫系统共进化,这样,存在于这些基因中的多态性就能够用来将大肠杆菌O157:H7与其他大肠杆菌菌株(包括表达非致病形式抗原的O157)鉴定并分离开。因此,发明人对强致病性的大肠杆菌O157:H7、大肠杆菌O55:H7和表达O157抗原但并不象大肠杆菌O157:H7那样引起人类疾病的大肠杆菌的gnd基因进行了克隆和测序,确定了存在于rfb基因簇,特别是gnd基因中的多态性和致病性之间的关系。
从纯化的细菌DNA中克隆大肠杆菌O157:H7和其他大肠杆菌菌株的gnd基因。为获得基因组或质粒DNA,细菌分别于37℃,在无抗生素或加入200mg/ml.氨苄西林的LB培养基(Maniatis等,分子克隆实验室手册,Cold Spring Harbor Laboratory,(1982))中培养过夜。为提取基因组DNA,取3ml细菌离心沉淀,用50毫摩尔(mM)Tris-HCl(pH8.0)和50mM乙二胺四乙酸(EDTA)悬浮。再向该混合物中加入10μl20%SDS,同时加入18μ1蛋白酶K(20mg/ml)。以上化学试剂得自Sigma公司(St.Louis,MO)。菌体在65℃保温2-24小时,用苯-氯仿-异戊醇(25∶24∶1)抽提一次或多次,再用氯仿-异戊醇(24∶1)反抽提。然后于室温通过加入10M醋酸铵至终浓度为2.5M,再加入2.5倍体积的100%乙醇来沉淀所得水相中的DNA。将沉淀物离心,用100%乙醇洗一次,风干,溶于含有1mM EDTA的10mM Tris-Hcl(pH8.0)中。按厂家说明用Qiaprep Spin Miniprep试剂盒(Qiagen Inc.,Valencia,CA)获得并制备质粒。
为了从表达O157抗原的大肠杆菌中扩增gnd基因,发明人首先使用了引物对(1):5’CACGGATCCGATCACACCTGACAGGAGTA3’(SEQ.ID.No.1)(rfb端)和5’CCGGAATTCCGGGCAAAAAAAAGCCCGGTGCAA3’(SEQ.ID.No.2)(his端)。引物对(1)来自公开序列(Bisercic等,微生物学杂志,173:3894-3900(1991)),并经修改使之具有BamHl和EcoRI位点以便于克隆。但是,这些引物没有能够从大肠杆菌O55:H7的DNA中得到扩增子。因此,用引物对(2)----5’CGGAATTCCGCGCTCAACATCGANAGCCGTGG3’(SEQ-ID.No.3)和5’CGGAATTCCGCCTGGATCAGGTTAGCCGG3’(SEQ-ID.No.4)(来自计算机化的大肠杆菌gnd序列数据库,并且具有5′EcoRI位点)的共有多核苷酸作为引物从TB 182A菌株(一种大肠杆菌O55:H7菌株)(Bokete等,J Infect Dis,175:1382-1389(1997))中引导合成DNA。这些引物扩增得到了长度约为1.3kb的PCR产物,其中包含gnd基因内的部分序列。对这些扩增子进行序列分析确定了下列引物对能分别从这个等位基因接近3’和5’端引导合成DNA:(3)5’CGGGGTACCCCGTAAGGGACCAGTTTCTTACCTGGG3’(SEQ.ID.No.5)和5′GCCCTATCTAGATAAAGG3′(SEQ.ID.No.6);(4)5′AGTTAAAGCCTTCCGCGG3′(SEQ.ID.No.7)和5TGCCCGCTACATCTCCTC3′(SEQ-ID.No.8);(5)5′GTTGTACTCTTCAGACGC3′(SEQ ID.No.9)和5TCGTCGCTTATGCGGTACAGAGCG3′(SEQ.ID.No.10).
然后用SacII(购自Promega.Madison,WI,按厂家说明使用)消化大肠杆菌O55:H7的全基因组DNA。通过加入连接酶和连接缓冲液(购自New England Biolabs,按厂家说明使用)使所得DNA片段环化。引物对(6)-5′CGGGGTACCCCGTAAGGGACCAGTITCTTACCTGGG3′(SEQ-ID.No.5)和5′GCCCTATCTAGATAAAGG3′(SEQ-ID.No.6)和引物对(7)-5′AGTTAAAGCCTTCCGCGG3′(SEQ-ID.No.7)和5TGCCCGCTACATCTCCTC3′(SEQ-ID.No.8)分别被用来扩增大肠杆菌O55:H7的gnd基因的5′和3′端外的序列。由此得到的序列数据促成了设计和利用引物对(8)-5′CCATCAGTAATAATGAAAAGGAATT3′(SEQ-ID.No.11)和5′ATCATTAGCTCCTCTTAAGATCGC3′(SEQ-ID.No.12)来扩增大肠杆菌O55的gnd等位基因。引物对(9)-5’TCGTCGCTTATGCGGTACAGAGCG3′)(SEQ-ID.No.10)或5′GCGTTCTTAAAGAGTCCTGC3′(SEQ-ID.No.13)和5TGCCCGCTACATCTCCTC3′(SEQ.ID.No.8)扩增跨越大肠杆菌O157:H7、大肠杆菌O55:H7和大肠杆菌O55:H6菌株的gnd基因3’端的DNA(DEC谱系1和2)。
PCR过程使用ExpandTM长模板PCR系统(Boehringer Mannheim,Indianapolis,Indiana)(″扩展系统″)或Taq DNA聚合酶(Promega,Madison,WI)。Taq DNA聚合酶(Promega)用于全gnd基因的扩增的起始。对于使用扩展系统的扩增,反应在厂家提供的50μl BMB缓冲液1中进行。所用DNA聚合酶为Promega公司提供的Taq DNA聚合酶,货号M1865(50U/μl)(A)或者Boehringer-Mannheim公司提供的Taq和Pwo DNA聚合酶(3.5U/μl)(B)。所用缓冲液是:Promega无MgCl2的Taq DNA聚合酶10×反应缓冲液(10×反应缓冲液:500mM KCl,100mM Tris-HCl,(25C下,pH9.0),1.0%Triton X-100)(与聚合酶一起由厂家提供);Promega公司的含MgCl2的Taq DNA多聚酶10×反应缓冲液(厂家提供)(10×反应缓冲液:500mM KCl,15mM MgCl2,100mM Tris-HCl,(25C下,pH9.0),1.0%Triton X-100)或者Boehringer-Mannheim Expand 10X缓冲液1(厂家提供)。热循环条件:94℃(1分钟),37℃(1分钟),和72℃(1分钟)循环35次,再在72℃下温育7分钟;94℃(1分钟),37℃(1分钟)和72℃(1分钟)循环30次,再在72℃下温育7分钟;起始循环在95℃(3分钟),55℃(1分钟)和74℃(1分钟)条件下进行,接着在95℃(1分钟),55℃(1分钟)和72℃(1分钟)条件下进行35次循环,最后于72℃温育5分钟;或先在92℃下温育2分钟,接着在92℃(10秒)、52℃(30秒)和68℃(1分钟)条件下循环10次,再于92℃(10秒)、52℃(30秒)和68℃(1分钟,每次循环加10秒)循环10次。所有PCR反应在PTCTM-100程控热循环仪上进行(MJ Research,Inc.,Watertown,MA)。所得扩增产物在溴乙啶染色的琼脂糖凝胶中显示。
首先,将Taq酶合成的大肠杆菌O157的gnd等位基因的扩增产物用BamHI和EcoRI消化后,克隆进pSK+(stratagene),大肠杆菌O157 gnd等位基因的基因内部分的扩增子克隆至pSK+的EcoRI位点。接着,用pGEM T Easy载体(Promega,Madison,WI)对PCR产物进行克隆和测序。在含氨苄西林(200mg/mL)的LB培养基上生长的白色菌落说明DNA已经插入克隆载体,用Qiaprep Spin Miniprep试剂盒(Qiagen Inc.,Valencia,CA),按厂家说明获得并制备其质粒。插入片段经EcoRI消化和琼脂糖凝胶电泳证实。所克隆的插入片段用载体特异的(SP6和T7)和适当的间插引物,使用Perkins Elmer Applied Biosystems Dye Terminator CycleSequencing Ready反应试剂盒(Part no 402079,Perkins Elmer,Foster City,CA)或Perkins Elmer Applied Systems BigDyeTM Terminator CycleSequencing Ready Reaction试剂盒(Part number 43031521.Perkins Elmer,Foster City,CA)进行测序。测序在Fred Hutchinson癌症研究中心用ABI373测序仪或在华盛顿大学生物化学系用ABI 377自动测序仪(AppliedBiosystems)完成。
对于那些来源于利用没有纠错系统的Taq聚合酶由gnd扩增得到的被隆扩增子的序列,得到了明确的双向序列。给这些序列中的每一个,利用Expand System制备并克隆其亚序列扩增子,并且通过序列分析对每个核苷酸至少确定一次。对于只利用Expand System获得的扩增子,得到了明确的双向双链序列。用GCG程序(University of Wisconsin)对序列进行比对。利用NCBI Blast服务器进行BLAST检索(Gish和States,自然遗传学3:266-272(1993))。
以下给出了几种产生毒素的O157大肠杆菌菌株的gnd及其相应蛋白质的序列(gnd SEQ ID No/6-PGD SEQ ID No):(1)157:H7,菌株86-24(SEQ ID No.22和23);(2)157:H7,菌株2433(来自哥伦比亚,又称为H8)(SEQ ID No.16和17);(3)157:H7,菌株ADLL 1541(来自澳大利亚的菌株)(SEQ ID No.18和19);(4)157:H7,菌株85-07(SEQ ID No.24和25);(5)157:H7,菌株87-16(SEQ ID No.26和27);(6)157:NM,菌株2755(来自德国的非运动型山梨醇发酵菌)(SEQ IDNo.20和21);
比较这些菌株的gnd序列时,菌株85-07和87-16中分别只有2个和3个核苷酸与来自大肠杆菌O517:H7,菌株86-24的序列不同。此外,非运动型O157病原菌也具有与大肠杆菌O157:H7的gnd几乎相同的gnd,尽管它与大肠杆菌O157:H7的进化距离更远。这些发现确定了高度产毒素的大肠杆菌O157:H7具有gnd,后者只发生了微小的基因漂移,并且提供了证据表明可以确定与致病性相关联的稳定序列。
以下给出了几个非志贺毒素产生性、非致病型大肠杆菌菌株的gnd及其相应蛋白质的序列(gnd SEQ ID No/6-PGD SEQ ID No):(1)55:H7,菌株TB182A(SEQ ID No42和43);(2)157:H3,菌株3004-89(SEQ ID No28和29);(3)157:H12,菌株5933(SEQID No30和31);(4)157:H16,菌株13A80(SEQ ID No40和41);(5)157:H16,菌株13A81(SEQ ID No32和33);(6)157:H38,菌株3005-89(SEQ ID No36和37);(7)157:H43,菌株7E(SEQ ID No38和39);以及(8)157:H45,菌株13A83(SEQ ID No34和35)。
将毒性高的菌株与毒性低的菌株的序列进行比较时,发明人发现有几个多态性可以用来鉴定高度产毒的大肠杆菌O157菌株。表1列出所发现的许多多态性,即大肠杆菌O157:H7菌株86-24(参照菌株)的gnd与其他已经测序的gnd基因不同的位点。图1也图示了这些多态性。值得注意的是,非致病型菌株的gnd与致病型大肠杆菌O157:H7的gnd的不同位点发生在多个位点,这样截然不同的样式是可辨别的。例如,在菌株13A83和13A83(分别表达H抗原16和45的大肠杆菌O157分离物);菌株13A80、7E、3005-89和G5933(分别表达H抗原16、43、38、3和12大肠杆菌O157);以及所有非H7大肠杆菌O157菌株中都发现了单核苷酸多态性。本领域技术人员很容易想到,通过将核苷酸多态性位点与序列表中的蛋白质序列进行匹配可以迅速地确定表1描述的多态性(即表达为氨基酸的多态性)所对应的氨基酸序列。
令人惊讶的是,在病原性O157:H7菌株和O55:H7菌株TB182A中发现了一个特异的多态现象-T218I,而非致病性O157:H7菌株中都没有。序列数据揭示了除了O55:H7的病原性菌株,在653和654位核苷酸上分别为胞嘧啶和鸟嘌呤;而病原性菌株在653和654位上分别为胸腺嘧啶和胞嘧啶。因此,一种区分病原性O157:H7菌株和非病原性O157:H7菌株的简便方法是鉴定gnd的653位核苷酸上的“CT”突变和/或654位核苷酸上的“GC”突变或者在218位氨基酸上是否存在异亮氨酸残基。由于大肠杆菌O55:H7的gnd与大肠杆菌O157:H7(例如,菌株86-24)的gnd仅有约82%的同源性,这些菌株在几个不同基因座可以容易地鉴别出来,如下面将要更详细描述。表1
 Pos.  86-24  13A81  13A83  13A80  7E  3005  3004  5933
 24  A  C  C
 36  A  T  T
 45  G  A  A
 51  C  T  T
 54  T  A  A  A  A  A
 102  T  C  C  C  C  C
 103  T  C
 111  A  G  G  G  G  G
 114  G  A  A
 177  A  G  G  G  G  G  G  G
 204  T  C  C
 211  T  C  C  C  C  C  C  C
 261  T  C  C  C  C  C  C  C
 263  A  G
 267  A  T  T  G  G  G  G  G
 291  C  T
 306  T  C  C  C  C  C  C  C
 317  A  T  T
 351  A  C  C  C  C  C
 369  C  T  T
 387  T  C  C  C  C  C  C  C
 390  T  A  A  A  A  A
 393  G  A  A  A  A  A  A  A
 395  A  G
 396  G  A  A  A  A  A
 399  C  G  G
 402  A  G  G  G  G  G  G  G
 405  A  G  G  G  G  G  G  G
 411  T  G  G
 420  T  C  C
 453  A  G  G  G  G  G  G  G
 459  G  T  T
 466  C  T  T
 483  A  C  C
 486  G  T  T
 498  T  C  C
 501  G  A  A
 504  A  G  G
 Pos. 86·24  13A81  13A83  13A80  7E  3005  3004  5933
 507  C  T  T
 534  A  G  G
 547  A  G
 5G1  C  T  T
 576  C  T  T  A  A  A  A  A
 585  G  A  A  A  A  A  A  A
 618  T  C  C
 621  T  C  C  C  C  C  C  C
 627  C  T  T
 631  A  T  T
 633  C  T  T
 648  G  A  A
 653  T  C  C  C  C  C  C  C
 654  C  G  G  G  G  G
 702  T  C  C  C  C  C  C  C
 711  C  T  T  T  T  T  T  T
 720  T  C  C  C  C  C  C  C
 759  C  T T
 768  A  G
 780  A  G  G
 786  G  C  C  C  C  C  C  C
 789  C  T  T  T  T  T  T  T
 810  A  G  G
 834  G  A  A
 861  A  T T  T  T  T  T  T
 864  C  T  T  T  T  T  T  T
 888  C  T  T  T  T  T
 894  T  C  C  C  C  C  C  C
 897  G  A  A  A  A  A
 910  T  A  A
918  A  G  G  G  G  G  G  G
 919  C  A  A
 924  G  A  A  A  A  A
 933  T  A  A  A  A  A  A  A
 939  C  T  T
 951  C  T  T
 957  A  G  G
 966  C  T  T
 972  A  G  G  G  G  G  G  G
 1002  T  C  C  C  C  C
 1008  G  C  C  C  C  C  C  C
 1017  A  G  G  G  G  G  G  G
 1026  G  T  T  T  T  T
 1040  A  T
 1098  C  T  T  T  T  T
 1122  C  T  T  T  T  T
 1131  T  A  A
 1173  T  G  G  G  G  G  G  G
 1197  C  T  T  T  T  T
 1215  C  T  T  T  T  T  T  T
 Pos. 86·24  13A81  13A83  13A80  7E  3005  3004  5933
 1224  C  T  T  T  T  T  T  T
 1233  G  A  A
 1266  C  G  G
 1284  T  C  C  C  C  C
 1287  C  T  T  T  T  T
 1296  C  T  T  T  T  T
 1302  T  A  A
 1314  G  A  A
 1350  G  A  A  A  A  A
 1392  C  T  T  T T  T  T  T
该发现的序列用GCG程序(Wisconsin大学)和几种Blast排列,用大肠杆菌O157:H7,菌株86-24的核苷酸序列作为查询序列在NCBIBlast服务器上进行检索。(Gish和States,Nat.Genet.,3:266-272(1993))。来自应用的大肠杆菌菌株的高分对在表2中列出。
表2高分片段对:                   分数P(N)                                             Ngb |U14423|ECU14423         Escherichia coli  A8190 6-phosphogl... 6675 0.0       1gb |M63829|ECOR56           Escherichia coli  6-phosphogluconat... 6585 0.0       1gb |M63827|ECOR25           Escherichia coli  6-phosphogluconat... 6549 0.0       1gb |M64331|ECONDGN          E. coli (strain ECOR65) 6-phosphogl... 6540 0.0       1gb |M63823|ECOR18           Escherichia coli  6-phosphogluconat... 6513 0.0       1gb |M64328|ECONDGK          E. coli (strain ECOR69) 6-phosphogl... 6495 0.0       1gb |M64329|ECONDGL          E. coli (strain ECOR70) 6-phosphogl... 6468 0.0       1gb |M64330|ECONDGM          E. coli (strain ECOR68) 6.phosphogl... 6441 0.0       1gh |M63825|ECOR21           Escherichia coli  6.phosphogluconat... 6432 0.0       1gb |M63824|ECOR20           Escherichia coli  6-phosphogluconat... 6423 0.0       1gb |AEO00294|ECAEO00294     Escherichia coli  K-12 MG1655 secti... 6414 0.0       1dbj|Dg0841|D90841           E. coli genomic DNA, Kohara clone#... 6414 0.0       1gb |M63821|ECOR1O           Escherichia coli  6-phosphogluconat... 6405 0.0       1gb |K02072|ECOGND           E. coli gnd gene coding for 6-phosp... 6405 0.0       1gb |M63826|ECOR23           Escherichia coli  6-phosphogluconat... 6369 0.0       1gb |M63822|ECOR11           Escherichia coli  6-phosphogluconat... 6315 0.0       1gb |U14469|SBU14469         Shigella boydii  ATCC 8700 6-phosph... 6306 0.0       1gb |M63828|ECOR47           Escherichia coli  6-phosphogluconat... 6297 0.0       1gb |U14456|ECU14456         Escherichia coli EC63  6-phosphoglu... 6288 0.0       1emb|X71970|SFRFBAJ          S.flexneri bB,galF,rfbA-J,rfbX,... 6270 0.0       1 gb|U14442|ECU14442         Escherichia coli EC40 6-phosphoglu... 6270 0.0       1gb|U14436|ECU14436         Escherichia coli EC15 6-phosphoglu... 6261 0.0       1gb|U14467|SDU14467         Shigella dysenteriae ATCC 133136-...  6252 0.0       1gb|U14445|ECU14445         Escherichia coli EC43 6-phosphoglu... 6234 0.0       1gb|U14433|ECU14433         Escherichia coli E851819 6-phospho... 6225 0.0       1gb|U14448|ECU14448         Escherichia coli EC46 6-phosphoglu... 6216 0.0       1gb|U14438|ECU14438         Escherichia coli EC25 6-phosphoglu... 6216 0.0       1gb|U14441|ECU14441         Escherichia coli EC35 6-phosphoglu... 6189 0.0       1gb|U14455|ECU14455         Escherichia coli EC6 6-phosphogluc... 6180 0.0       1gb|U14435|ECU14435         Escherichia coli EC14 6-phosphoglu... 6180 0.0       1gb|U14460|ECU14460         Escherichia coli EC69 6-phosphoglu... 6153 0.0       1gb|U14462|EFU14462         Escherichia fergusonii ATCC 35469 ... 6148 0.0       1gb|U14459|ECU14459         Escherichia coil EC70 6-phosphoglu... 6144 0.0       1gb|U14450|ECU14450         Escherichia coli EC5 6-phosphogluc... 6135 0.0       1gb|U14439|ECU14439         Escherichia coli EC52 6-phosphoglu... 6126 0.0       1gb|U14431|ECU14431         Escherichia coli E2666-74 6-phosph... 6126 0.0       1gb|U14458|ECU14458         Escherichia coli EC68 6-phosphoglu... 6117 0.0       1gb|U14440|ECU14440         Escherichia coli EC32 6-phosphoglu... 6081 0.0       1gb|U14434|ECU14434         Escherichia coli EC10 6-phosphoglu... 6081 0.0       1gb|U14470|SSU14470         Shigella sonnei ATCC 29930 6-phosp..  6027 0.0        1gb|U14457|ECU14457         Escherichia coli EC64 6-phosphoglu... 6000 0.0       1gb|U14446|ECU14446         Escherichia coli EC44 6-phosphoglu... 6000 0.0       1gb|U14468|SFU14468         Shigella flexneri ATCC 26903 6-pho... 5919 0.0       1gb|U14451|ECU14451         Escherichia coli EC50 6-phosphoglu... 5622 0.0       1gb|U14449|ECU14449         Escherichia coli EC49 6-phosphoglu... 5613 0.0       1gb|M64324|ECOGNDG          E.coli (strain ECOR4) 6-phosphoglu... 5199 0.0       1emb|X15651|SEGNDB          S. enterica gnd gene for 6-phospho... 5082 0.0       1gb|M64332|STYGNDA          S.typhimurium (strain LT2) 6-phosp... 5082 0.0       1dbj|D21242|KPNCPS          Klebsieila pneumoniae cps gene clu... 5001 0.0       1gb|M64325|ECONDGH          E. coli(strain ECOR16) 6.phosphogl... 5001 0.0       1dbj|ABO10150|ABO10150      Escherichia coli 08 wb gene cluste... 4965 0.0       1gb|U14424|CDU14424         Citrobacter diversus CT19 6-phosph... 4938 0.0       1gb|U14427|CDU14427         Citrobacter diversus CT4 6-phospho... 4929 0.0       1gb|U14425|COU14425         Citrobacter diversus CT27 6-phosph... 4929 0.0       1gb|U14428|CDU14428         Citrobacter diversus CT42 6-phosph... 4920 0.0       1 gb|U14429| CDU14429         Citrobacter diversus CT45 6-phosph...4911  0.0       1gb|U14432| CDU14432         Citrobacter diversus CT9 6-phospho...4893  0.0       1gb|L27646| ECOGNDH          E.coli phosphogluconate dehydroge... 4884  0.0       1gb|U14353| SEU14353         Salmonella enterica V serovar Broo...4858  0.0       1gb|U14495| SEU14495         Salmonella enterica Illa isolate S...4848  0.0       1gb|U14481| SEU14481         Salmonella enterica V 6-phosphoglu...4839  0.0       1gb|U14508| SEU14508         Salmonella enterica V isolate S304...4830  0.0       1gb|U14466| CFU14466         Citrobacter freundii ATCC 8090 6-p...4829  0.0       1gb|U14509| SEU14509         Salmonella enterica V isolate S304...4821  0.0       1gb|U14360| SEU14360         Salmonella enterica I serovar Glos...4804  0.0       1gb|U14500| SEU14500         Salmonella enterica II isolate S30...4803  0.0       1gb|U14496| SEU14496         Salmonella enterica Illa isolate S...4803  0.0       1gb|U14485| SEU14485         Salmonella enterica I ParatyphiB 6...4794  0.0       1gb|U14476| SEU14476         Salmonella enterica I Saintpaul 6....4794  0.0       1gb|U14368| SEU14368         Salmonella enterica I serovar Para...4786  0.0       1gb|U14479| SEU14479         Salmonella enterica I Typhimurium ...4785  0.0       1gb|U14346| SEU14346         Salmonella enterica Illa serovar A...4777  0.0       1gb|U14340| SEU14340         Salmonella enterica II serovar Spr...4777  0.0       1gb|U14498| SEU14498         Salmonella enterica II isolate S29...4776  0.0       1gb|U14465| EVU14465         Escherichia vulneris ATCC 33821 6-...4776  0.0       1gb|U14367| SEU14367         Salmonella enterica I serovar Senf...4768  0.0       1gb|U14363| SEU14363         Salmonella enterica II serovar 1,9...4768 0.0       1gb|U14361| SEU14361         Salmonella enterica II serovar Sof... 4768 0.0       1gb|U14338| SEU14338         Salmonella enterica II serovar 9,1...4768 0.0       1gb|U14497| SEU14497         Salmonella enterica II isolate S29... 4767 0.0       1gb|U14493| SEU14493         Salmonella enterica IIIb isolate S... 4767 0.0       1gb|U14480| SEU14480         Salmonella enterica Illb 6-phosph...  4767 0.0       1gb|U14477| SEU14477         Salmonella enterica I Javiana 6-ph... 4767 0.0       1gb|U14475| SEU14475         Salmonella enterica I Dublin 6-pho... 4767 0.0       1gb|U14474| SEU14474         Salmonella enterica I Choleraesuis... 4767 0.0       1gb|U14505| SEU14505         Salmonella enterica IV isolate S30... 4758 0.0       1gb|U14491| SEU14491         Salmonella enterica I Enteritidis...  4758 0.0       1gb|U14357| SEU14357         Salmonella enterica I serovar Cano... 4750 0.0       1gb|U14351| SEU14351         Salmonella enterica IV serovar 43:...4750 0.0       1gb|U14349| SEU14349         Salmonella enterica IV serovar Ar ... 4750 0.0       1gb|U14503|SEU14503         Salmonella enterica VII isolate S3... 4749 0.0        1gb|U14494|SEU14494         Salmonella enterica Illb isolate S... 4749 0.0        1gb|U14483|SEU14483         Salmonella enterica VI iolate S30...  4749 0.0         1gb|U14478|SEU14478         Salmonella enterica I Derby 6-phos... 4749 0.0        1gb|U14437|ECU14437         Escherichia coli EC16 6-phosphonlu... 4749 0.0        1gb|U14352|SEU14352         Salmonella enterica V serovar Balb... 4741 0.0        1gb|U14350|SEU14350         Salmonella enterica IV serovar Hou... 4741 0.0        1gb|U14490|SEU14490         Salmonella enterica I ParatyphiA 6... 4740 0.0        1gb|U14487|SEU14487         Salmonella enterica I Typhi 6.phos... 4740 0.0        1gb|U14484|SEU14484         Salmonella enterica VI isolate S30... 4740 0.0        1gb|U14484|SEU14484         Salmonella enterica VI isolate S30... 4740 0.0        1
在大肠杆菌O157中发现三个不同的等位基因组(参见表3)。这些等位基因彼此之间约5%核苷酸残基不同。“gnd等位基因A”由产毒素大肠杆菌O157:H7和大肠杆菌O157:NM菌株的gnd组成。菌株85-07和87-16的gnd序列仅在它们的1407位核苷酸上与菌株86-24不同;其余三个相同。“gnd等位基因B”在表达鞭毛抗原H3、H12、H16、和H38的大肠杆菌O157菌株和菌株DEC 7E(一种具有等同于大肠杆菌O157:H43的MLEE模式的不可动O157)中发现,其核苷酸中约4%与gnd等位基因A不同。“gnd等位基因C”在大肠杆菌O157:H45和O157:H16菌株中发现,其1407个核苷酸中约6%与gnd等位基因A不同。
表3
应用的野生型大肠杆菌:
菌株名称 表面抗原     来源(参考文献) gnd等位基因     Genbank编号
O  H     gnd     rfbE
    大肠杆菌O157/O55H7(DEC5)品系
 86-24  157     7  WA州患者(39)     A  AF176356  AF163327
 85-07  157     7  WA州患者(39)     A  AF176359  AF163328
 87-16  157     7  WA州患者(39)     A  AF176360  AF163329
    H8  157     7     Colombia(S.Mattar)     A  AF176357
 ADAL233     157     7     Australia*     A  AF176358
  2755     157     NM     Germany(L.Beutin)     A  AF176361  AF163330
 TB156A     55     7     WA州(40)
 TB182A     55     7     WA州(40) AF176369
 DEC5A-5E     55     7     Penn州(16)
    非H7品系中的大肠杆菌O157和大肠杆菌O55
 3004-89   157     3     CDC(N.Strockbine)     B  AF176362  AF163326
 G5933   157     12  CDC(T.Barrett)     B  AF176363  AF163331
 13A81   157     16     FDA(S.Weagant)     C  AF176364  AF163332
 13A83   157    45**     CDC(N.strockbine)     C  AF176365  AF163333
 3005-89   157     38     CDC(N.Strockbine)     B  AF176366  AF163334
 DEC7E   157   43***     Penn州(16)     B  AF176367  AF163335
 13A80   157     16     CDC(N.Strockbine)     B  AF176368  AF163336
 DEC1A     55     6     Penn州(16)  AF176370
 DEC1B     55     6     Penn州(16)  AF176371
 DEC2A     55     6     Penn州(16)  AF176372
 DEC2B     55     6     Penn州(16)  AF176373
NM-不可动的*澳大利亚政府分析实验室**菌株3584-91是不可动的,但具有等同于大肠杆菌O157:H45的MLEE模式***菌株DEC 7E是不可动的,但具有等同于大肠杆菌O157:H43的MLEE模式
虽然大肠杆菌O55:H7与大肠杆菌O157:H7密切相关,但它们的gnd序列显著不同。大肠杆菌O157:H7,菌株86-24的gnd序列与大肠杆菌O55:H7,菌株TB182A的gnd序列仅具有约82%的同源性,看来这两个等位基因之间无直接明显的保守区。
经分析大肠杆菌O55:H7的gnd序列下游,本发明人还发现在gnd-rfb基因簇中存在一种或多种可动元件(图2)。发现相对于大肠杆菌O55:H7gnd的3’+3915位之外(即从大肠杆菌O55:H7 gnd的3’端之外的3916位核苷酸开始向his延伸的片段)的1934个核苷酸中大约96%与相对于大肠杆菌O157:H7 gnd的3’+52和3’+1984位之间的核苷酸相同。大肠杆菌O55:H7和大肠杆菌O157:H7的共有区域包含编码UDP葡萄糖-6-脱氢酶和O-抗原链长决定蛋白的开放读码框(orf)。分别相对于大肠杆菌O55:H7和大肠杆菌O157:H7 gnd的3’+1到3’+51位和3’+1到3’+3915位之间的序列没有发现同源性。
发现相对于大肠杆菌O55:H7 gnd的3’+52到3’+3922位之间的DNA具有大量与DNA可动性有关的特征。发现相对于大肠杆菌O55:H7 gnd等位基因的3’+2680到3’+3809位之间的核苷酸中约97%与编码大肠杆菌Rhs-相关H-重复(H-rpt)蛋白的DNA(Genbank号L02370)同源,包括3’+3799和3’+3809位之间的11个核苷酸(AGCTFGCCCTG)(SEQID NO:14)与大肠杆菌中H-rpt单元(Genbank号L02370)旁侧的11个反向重复核苷酸相同。(Zhao等,细菌学杂志(J.Bacteriol.)175:2799-2808(1993))。该11-聚体的一个几乎相同片段(CAGGGAAGAT)(SEQ ID NO:15)还与所述H-rpt基因同源片段的相反末端,即3’+2655到3’+2665位之间的核苷酸相同。
另外,本发明人发现在3’+2817到3’+3422位之间有一个编码201个氨基酸的蛋白质的orf,该蛋白质的氨基酸与由orf-H(Genbank号L02370)编码的RhsB中的H-重复蛋白的氨基酸存在约98%的同源性。(Zhao等,细菌学杂志175:2799-2808(1993))。本发明人还发现相对于大肠杆菌O55:H7 gnd的3’+3809到3’+3922位之间的114个核苷酸(包括与大肠杆菌O157:H7序列相同的7个核苷酸)中约92%与编码IS200转座酶A的鼠伤寒沙门氏菌LT2的tnpA(GenBank号AF093749)的3’末端相邻的核苷酸相同。还发现相对于大肠杆菌O55:H7 gnd的3’+478到3’+1942位之间的DNA与大肠杆菌0111 wbdJ和wbdK(GenBank号U13629)约75%相同。相对于gnd的3’+112到3’+1035位,和3’+1032到3’+2198位之间核苷酸的两个orf分别与wbdJ和wbdK 67%和80%相同。(Bastin和Reeves,Gene,164:17-23(1995))。相对于大肠杆菌O55:H7gnd等位基因的3’+2788到3’+3806位核苷酸之间的三个片段与大肠杆菌O157:H7 rfb基因簇(GenBank号AF061251和AB008676)的非编码区具有83-96%的同源性。
接下来,用引物:5’GCGTFCTIAAAGAGTCCTGC3’(SEQ ID NO:13)和5’TGCCCGCTACATCTCCTC3’(SEQ ID NO:8)(它们对应gnd的3’端和下游区)进行PCR,从而得到来源于11大肠杆菌O55菌株DNA的6.5kb复制子。当用来源于大肠杆菌O157:H7 DNA上的这些引物进行PCR没有得到该复制子。
而且,本发明人发现该复制子可以用作杂交探针,以有效地检测来源于不同品系的大肠杆菌O55菌株的存在。应用引物:5’GCGTTCTTAAAGAGTCCTGC3’(SEQ.ID.No.13)和来源于5’TGCCCGCTACATCTCCTC3’(SEQ.ID.No.8)制备了来源于大肠杆菌HB101、大肠杆菌O157:H7菌株86-24、大肠杆菌O55:H7菌株TB156A、TB182A、和5 A-E、以及大肠杆菌O55:H6菌株1A、1B、2A、和2B的基因组DNA或复制子。然后用Sacl消化这些DNA,并在1%琼脂糖上在tris-硼酸盐-EDTA中分离(Maniatis等,分子克隆:实验室指南(ColdSpring Harbor Laboratory)(1982)),然后转移到尼龙膜(Micron Separations)上。然后用通过引物:5’GCGTTCTTAAAGAGTCCTGC3’(SEQ.ID.No.13)和5’TGCCCGCTACATCTCCTC3’(SEQ.ID.No.8)和应用大肠杆菌O55:H7模版DNA产生的克隆复制子作为探针检测迁移的DNA。用Megaprime DNA系统(Amersham)和[-α32P]dATP(New England NuclearResearch Products)标记复制子探针。该实验显示在装载来自O55菌株的DNA的泳道中出现强烈信号,而装载来自O157菌株或HB101对照的DNA的泳道没有信号。上述研究不仅提供明确证据证明大肠杆菌O55菌株中gnd的3’区含有一个具有涉及DNA可动性的序列的保守元件,而且指示了一种区分大肠杆菌O55:H7和O157:H7的快速方法。
上述数据还清楚地显示了大肠杆菌中gnd多样性的来源,以及rfb区的可动性。不同品系中大肠杆菌O55的gnd的相同结构证明了gnd和O55 rfb基因簇在天然大肠杆菌菌株之间已经转化成一个完整单元。另外,忽视无性繁殖系的结构,几乎相同的大肠杆菌O55 gnd支持这样的结果,即O55 gnd-rfb基因簇已经散布到天然种群中。在大肠杆菌DEC5品系中表达O55和O157 LPS抗原的大肠杆菌的gnd之间存在的泛-等位基因不调和也与该大肠杆菌品系中完整gnd-rfb区的共转移相一致。
序列分析证明大肠杆菌O55菌株中gnd-rfb区的重组利用了转座作用。可以鉴定插入染色体的一个短AT-富含区邻近tnpA(IS200的)的3’残迹,其利用AT-富含目标整合区。然后一个具有完整orf的H-重复蛋白基因也是重要的。不是意图将本发明的范围限制到任何特定作用机制,仅为了解释的目的而提供,本发明人相信H-rpt蛋白基因确实编码一种转座酶,该基因的完整性提供证据证明大肠杆菌O55 gnd-rfb基因簇也就在最近才在研究的三个不同品系中由大肠杆菌O55获得。有趣的是,转座作用看起来是V cholerae 0139 rfb区的插入机制(Stroeher等,Proc.Natl.Acad.Sci.USA,92:10374-10378(1995);Bik等,Embo J.,14:209-216(1995);Stroeher等,细菌学杂志,179:2740-2747(1997);Comstock等,分子微生物学,19:815-826(1996)),推测H-rpt蛋白同源物在沙门氏菌和弧菌的rfb转移中发挥作用(Xiang等,细菌学杂志,176:4357-4365(1994);Hill等,分子微生物学,12:865-871(1994))。而且,两个H-rpt同源物,杀鲑气单胞菌的ISAS1元件(Gustafson等,分子生物学杂志,237:452-463(1994))和IS1358构建物(最初在V.cholerae 0139 rfb区中发现)(Dumontier等细菌学杂志,180:6101-6106(1998))已经证明发生转换。
还发现了已鉴定可动元件的其它成分。大肠杆菌O55和0111 O-侧链均含有可立糖(Keene等,碳水化合物研究(Carbohydr.Res.),111:289-296(1983)),一种已知细菌LPS糖中的不常见残基。指定这两个血清组的rfb区具有编码WbdK和WbdJ同源物的基因,虽然在gnd不同侧。WbdK与假结核耶尔森氏菌的RfbH同源,一种CDP-阿比可糖途径中的CDB-4-酮-6-脱氧-D-葡萄糖-3-脱水酶。WbdK是合成0111抗原的相应步骤上的一种推测的吡哆胺5-磷酸-依赖性脱水酶。(Bastin和Reeves,基因,164:17-23(1995))。WbdJ与由大肠杆菌荚膜多糖基因簇编码的Orf1.9同源,据信在大肠杆菌0111 LPS抗原的合成中行使相关功能。
这些结果有助于理解大肠杆菌染色体的这一区域的进化。首先,在两个不同十年间从四个大陆收集的大肠杆菌O157:H7中gnd结构的几乎一致性与目前的结论即该病原体高突变且进化迅速不一致。(LeClerc等,科学274:1208-1211(1996))。其次,指定O157抗原的rfb基因仅与有限数目的不同gnd等位基因相关。第三,不同品系中完整gnd等位基因B、和C的存在提供证据证明非-H7大肠杆菌O157最近已经获得一种推测的O157可动元件。在下面公开的内容中,本发明人描述了几个本发明涉及软件和硬件的其它方面。软件和硬件实施方式
本领域技术人员将理解含有gnd序列和/或SEQ ID Nos.16-43对应蛋白质的计算机可读媒体对于确定同源序列、探针和引物的设计、表位分析、结构和功能域的阐述、以及用于合理药物设计的蛋白质模型的构建是有用的。gnd序列和/或SEQ ID Nos.16-43对应蛋白质可以在能够由计算机读取和存储的任何媒体上保存、记录、和操作。
本文使用的词汇“记录”和“保存”指在计算机可读媒体上保存信息的过程。技术人员可以容易地调整任何目前已知的在计算机可读媒体上记录信息的方法,以生产包括本发明该实施方式的核苷酸或多肽序列信息的产品。技术人员可以得到大量数据存贮结构,用于创建一种具有记录于其上的核苷酸或多肽序列的计算机可读媒体。数据存储结构的选择通常基于选择用于读取保存信息的成分。计算机可读媒体包括磁性可读媒体、光可读媒体、或电子可读媒体。例如,计算机可读媒体可以是一个硬盘、软盘、磁带、CD-ROM、RAM、或ROM,以及本领域技术人员已知的其它类型的媒体。序列信息存储于其上的计算机可读媒体可以在个人电脑、网络、服务器或本领域技术人员已知的其它计算机系统中。
本发明的实施方式包括系统,尤其是含有本发明描述的序列信息的基于计算机的系统。本文使用的“基于计算机的系统”指用于分析gnd序列和/或SEQ ID Nos.16-43对应蛋白质或它们片段的硬件、软件、和数据库。基于计算机的系统优选包括上述储存媒体,和用于存取和操作序列数据的处理器。该实施方式的基于计算机的系统的硬件包括一个中央处理单元(CPU)和一个或多个数据库。有经验的技术人员能够容易地理解目前提供的任何一种基于计算机的系统都是合适的。
在一个具体实施方式中,计算机系统包括一个与总线连接的处理器,该总线连接于一个主存储器(优选作为RAM执行),和大量二级存储设备,例如硬驱动器和可移动媒体存储设备。可移动媒体存储设备可以是,例如,软盘驱动器、光盘驱动器、磁带驱动器等。含有控制逻辑和/或记录于其中的数据(例如,gnd序列和/或SEQ ID Nos.16-43对应蛋白质)的可移动存储媒体,例如软盘、光盘、磁带等可以插入可移动存储设备。计算机系统包括合适的软件,用于当存储媒体插入可移动媒体存储设备后,读取控制逻辑和/或来自可移动媒体存贮设备的数据。gnd序列和/或SEQ ID Nos.16-43对应蛋白质可以以公知方式保存于主存储器,任何二级存储设备,和/或可移动存储媒体。读取和处理gnd序列和/或SEQ ID Nos.16-43对应蛋白质的软件(例如检索工具、比较工具、和模拟工具等)在执行中保留在主存储器中。
本文使用的“数据库”指能够保存核苷酸或多肽序列信息、以及蛋白质模型信息的存储器。另外,“数据库”指能够存取含有记录于其上的核苷酸或多肽序列信息,和/或蛋白质模型信息的产品的存储器存取成分。在另一个实施方式中,数据库保存了一种含有核苷酸和/或多肽序列信息,和/或gnd基因和6-PGD蛋白上的蛋白质模型信息及其多态性的“大肠杆菌病原体图谱”。有利地是,大肠杆菌病原体图谱在一个数据库中记录或保存了大量与高病原性和/或低病原性大肠杆菌菌株有关的多态性,它将使研究者和临床医生能够快速鉴定生物样品或食品或水源或其它生物材料中特定大肠杆菌菌株的存在。理想的是,该多态性以有利于鉴定细菌菌株身份的方法的模式记录,例如,病原体图谱可以这样保存,例如使对应特定生物体中的序列完全可以通过序列、生物体、和/或限制性图谱检索,并可以确定查询序列的同源性、相同性和匹配。一种优选的数据库结构由NCBI提供,其允许BLAST-型检索,蛋白质模块检索、关键词检索、并提供Medline界面。本领域技术人员还知道一些其它类型的数据库和结构,下面将讨论其中的一部分。
gnd序列和/或SEQ ID NO:16-43对应的蛋白质可以在很多数据处理程序中以多种格式保存和操作。例如,序列数据可以在字处理文件例如MicrosoftWORD或WORDPERFECT中作为文本保存,或者在本领域技术人员熟悉的多种数据库程序例如DB2、SYBASE、或ORACLE中以ASCII文件保存。“检索程序”指一种或多种用于在基于计算机的系统上比较一种核酸或多肽序列与储藏于数据库中的其它核酸或多肽序列的程序。检索程序还指一种或多种比较一种或多种蛋白质模块与数据库中存在的其它蛋白质模块的程序。检索程序被用于,例如,比较gnd序列区和/或SEQ ID NO:16-43对应的蛋白质,在核酸和/或蛋白质数据库中比较序列从而鉴定同源性和结构或功能基元。另外,检索程序用于比较大肠杆菌病原体图谱(profile)与查询序列,从而鉴定查询序列中是否存在一种或多种多态性,从而确定查询序列来源的细菌菌株。
一种“补救程序”指一种或多种用于在基于计算机的系统上执行鉴定同源核酸序列、同源蛋白质序列、或同源蛋白质模块的程序。而且,补救程序可以用于鉴定大肠杆菌病原体图谱,其可比较查询序列、关键词、疾病特征、或限制图谱。优选地,补救程序以能够被迅速区分开来的形式与提供大肠杆菌病原体图谱数据的显示模式分界。例如,图1中显示的“棒状代码”是一种能够通过补救程序获得的格式,其在多态性位置上提供信息,这可以用于鉴定或区别特殊大肠杆菌菌株。
在几个实施方式中,SEQ ID NO:16-43中公开的一种新序列与一种查询序列比较,然后确定序列相同性百分数。普遍使用的比较两种多肽的相似性和氨基酸位置的标准方法可以用于进行这种比较。应用计算机程序,例如BLAST或FASTA,例如,可以排列两种多肽,进行各自氨基酸的最佳比对(可以沿着一种或两种序列的全长,或者沿着一种或两种序列的预先确定的局部)。这种程序提供“缺陷”开放罚分和“缺陷”空位罚分,可以结合计算机程序使用一种打分矩阵例如PAM250(一种标准打分矩阵;参见Dayhoff等,Atlas of Protein Sequence and Structure,Vol.5,Supp.3(1978))。然后如下计算相同性百分数:
Figure A9981568300331
至少70%相同性的多肽通常具有一个或多个氨基酸取代、缺失和/或插入。通常,取代是保守的,从而很小或不影响蛋白质的整体静电荷、极性、或疏水性,但任选可以增加6-PGD的活性。
在NCBI数据库中(http://www.ncbi.nlm.nih.gov/blast)进行了几次Blast检索(BlastP 2.0.10,参见Altschul等,核酸研究(Nucleic.Acids.Res.)25:3389(1997),作为参考插入本文),鉴定新的6-PGD分子、这些分子的片段、和gnd/rfb基因簇中的区域,尤其是6-PGD的3’区的特征。一些原始Blast检索的结果在表2中显示。广泛检索了T2171多态性附近的多肽片段。在该特殊检索中,矩阵是BLOSUM62,开放空位罚分为11,空位拓展为1。其它检索包括NCBI数据库中的Blast 2(BlastP 2.0.9)检索,应用BLOSUM矩阵,开放罚分为11,空位拓展为1,x衰退(dropoff)为50。后面的这些检索参数用于比较由O157:H7,菌株86-24、H8、ADAL233、和2755编码的6-PGD:
(1)由O157:H7编码的6-PGD,菌株87-16;
(2)由O157:H7编码的6-PGD,菌株TB182A;
(3)由O157:H3编码的6-PGD,菌株3004-89(一种“等位基因B”基因产物);
(4)由O157:H12编码的6-PGD,菌株G5933(一种“等位基因B”基因产物);
(5)由O157:H16编码的6-PGD,菌株13A81(一种“等位基因C”基因产物);
(6)由O157:H45编码的6-PGD,菌株3584-91(一种“等位基因C”基因产物);
(7)由O157:H38编码的6-PGD,菌株3005-89(一种“等位基因C”基因产物);
(8)由O157:H43编码的6-PGD,菌株7E(一种“等位基因C”基因产物);
(9)由O157:H45编码的6-PGD,菌株3260-92(一种“等位基因C”基因产物);
(10)由O157:H7编码的6-PGD,菌株8507
还将gnd序列编码的ORF和/或SEQ.ID.No.16-43和gnd/rfb基因簇区对应的蛋白质与Swissprot中发现的已知氨基酸序列进行比对。本发明的实施方式可以应用一些计算机程序和数据库。下面列出的名单不在于限制本发明,而是为本发明的核酸和蛋白质序列实施方式可应用的程序和数据库提供指导。可以应用的程序和数据库包括但不限于:MacPattern(EMBL),DiscoveryBase(Molecular Applications Group),GeneMine(Molecular Applications Group),Look(Molecular Applications Group),MacLook(Molecular Applications Group),BLAST和BLAST2(NCBI),BLASTN和BLASTX (Altschul等,分子生物学杂志(J.Mol.Biol)215:403(1990)),FASTA(Pearson和Lipman,Proc.Natl.Acad.Sci.USA,85:2444(1988)),Catalyst(Molecular Simulations Inc.),Catalyst/SHAPE(Molecular Simulations Inc.),Cerius2.DBAccess(Molecular Simulations Inc.),HypoGen(Molecular Simulations Inc.),Insight II,(Molecular SimulationsInc.),Discover(Molecular Simulations Inc.),CHARMm(MolecularSimulations Inc.),Felix(Molecular Simulations Inc.),DelPhi,(MolecularSimulations Inc.),QuanteMM,(Molecular Simulations Inc.),Homology(Molecular Simulations Inc.),Modeler(Molecular Simulations Inc.),Modeller4(Sali和Blundell,分子生物学杂志234:217-241(1997)),ISIS(MolecularSimulations Inc.),Quanta/Protein Design(Molecular Simulations Inc.),WebLab(Molecular Simulations Inc.),WebLab Diversity Explorer(MolecularSimulations Inc.),Gene Explorer(Molecular Simulations Inc.),SeqFold(Molecular Simulations Inc.),EMBL/Swissprotein数据库,MDL提供的化学药品目录数据库(MDL Available Chemicals Directory database),MDL药物数据文献数据库(MDL Drug Data Report database),全面的药物化学数据库(Comprehensive Medicinal Chemistry database),Derwents’s世界药物索引数据库(Derwents’s World Drug Index database),和BioByteMasterFile数据库。其它一些程序和数据库对于本发明涉及领域的技术人员是显而易见的。
另外,本发明的其它方面包括含gnd序列和/或SEQ.ID.No.16-43对应蛋白质和它们片段的重组载体、探针、和引物,尤其是那些含有一种表1描述的多态性的gnd序列或对应蛋白质部分。下面讨论本发明的这些方面。核酸实施方式
本发明的几种实施方式包括含SEQ ID Nos.22,16,18,24,26,20,42,28,30,40,32,36,38,和34和其片段的gnd序列的重组载体、探针、和引物。除了SEQ.ID.Nos.22,16,18,24,26,20,42,28,30,40,32,36,38,和34描述的全长gnd基因,优选核酸实施方式包括具有一种表1描述的多态性的任何gnd基因片段。术语“全长”根据上下文既可指基因组gnd的全长序列,也可指cDNA gnd的全长序列。进一步实施方式包括互补于SEQ.ID.Nos.22,16,18,24,26,20,42,28,30,40,32,36.38,和34描述的全长gnd的核酸,和互补于具有至少一种表1描述的多态性的gnd片段的核酸。理想的实施方式包括具有gnd的至少9个连续碱基和至少一种表1描述的多态性或一种与它们互补的序列。在这点上,本发明的核酸实施方式可以具有SEQ.ID.Nos.:22,16,18,24,26,20,42,28,30,40,32,36,38,和34的从9到约1406的连续核苷酸,或这些序列的实际上任何长度的互补序列,只要这些核酸包括至少一种表1描述的多态性。本发明技术人员将容易理解本发明的gnd核酸可以整合入一种外源核酸,从而产生一种在本发明范围内的、实际上任意长度的融合产物。因此,一种具有SEQ.ID.Nos.:22,16,18,24,26,20,42,28,30,40,32,36,38,和34或这些序列的互补序列或本发明的全长gnd(基因组或cDNA)的一部分(即约9到约1406的连续核苷酸)的核酸即为本发明的实施方式。也就是说,本发明的实施方式包括一种具有至少一种表1描述的多态性和少于等于9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,40,41,42,43,44,45,46,47.48,49,50,51,52,53,54,55,56,57,58,59,60,61,62,63,64,65,66,67,68,69.70,71,72,73,74,75,76,77,78,79,80,81,82,83,84,85,86,87,88,89,90,91,92,93,94,95,96,97,98,99,100,125,150.175,200,225,250,275,300,325,350,375,400,425,450,475,500,525,550,575,600,625,650,675,700,725.750,775,800,825,850,875,900,925,950,975,1000,1100,1200,1300,和1406个核苷酸的核酸。然而,核酸实施例优选包括SEQ.ID.Nos.:22,16,18,24,26,5 20,42,28,30,40,32,36,38,和34或这些序列的互补序列的至少12,13,14,15,16,17,18,或19个连续核苷酸,条件是只要所述片段具有至少一种表1描述的多态性。更优选的是,核酸实施方式包括至少20-30个连续核苷酸。这些核酸低聚物具有生物技术和诊断用途,例如,在核苷酸杂交分析、Southern和Northern印迹分析等中,以及诊断大肠杆菌感染。一些实施方式包括具有SEQ.ID.Nos.22,10 16,18,24,26,20,42,28,30,40,32,36,38,和34或其互补序列公开的全部或部分gnd基因的重组构建体。重组构建体能够在宿主细胞中自主复制。或者,重组构建体可以被整合到宿主细胞的染色体DNA中。这种重组多核苷酸包括通过人工操纵得到的半合成或合成来源的基因组多核苷酸或cDNA多核苷酸。因此,本发明的实施方式还提供包括不同于天然序列的重组核酸。
本发明的核酸实施方式还可以通过突变例如取代、添加、或删除修饰,这些突变提供编码功能等同分子的序列。由于核苷酸编码序列的简并性,编码与SEQ.ID.Nos.:23,17,19,25,27,21,43,29,31,41,33,37,39,和35所述序列基本上相同的6-PGD氨基酸序列的其它DNA序列也可用于本发明的某些实施方式。这些包括但不限于,含SEQ.ID.Nos.:22,16,18,24,26,20.42,28,30,40,32,36,38,和34或其互补序列描述的全部或部分gnd的核酸序列,这些序列已经通过编码序列中一种功能等同氨基酸残基的不同密码子取代而改变,由此产生一种沉默突变。
另外,可以对重组gnd-编码核酸序列和它们的互补序列进行人工操作,从而改变加工或表达。例如但不限于,SEQ.ID.Nos.:22,16,18,24,26,20.42,28,30,40,32,36,38,和34描述的gnd基因可以与启动子序列和/或核糖体结合位点结合,或者可以在6-PGD-编码序列的上游插入一种信号序列,使6-PGD能够分泌,从而有利于收获或生物利用。另外,一种特定gnd核酸可以在体外或体内突变,以促进和/或破坏翻译、起始、和/或中止序列,或者在编码区产生变异体和/或形成新的限制位点或破坏已经存在的限制位点,或者促进进一步的体外修饰。可以使用本领域已知的任何诱变技术,包括但不限于,体外定点诱变。(Hutchinson等,生物化学杂志(J.Biol.Chem.)253:6551(1978))。编码其它蛋白质或其它蛋白质结构域的核酸可以整合入编码6-PGD的核酸,从而产生一种融合蛋白质。得到的融合蛋白质可以用作生物技术工具,来研究gnd/rfb基因簇区的活动性,例如,研发株系特异性抗体。
核酸实施方式还可以用作分离程序和诊断分析的生物技术工具。应用SEQ.ID.Nos.:22,16,18,24,26,20,42,28,30,40,32,36,38,和34公开的gnd序列,可以通过寡核苷酸合成设计和生产互补于这些序列的探针。优选的杂交探针包括至少一种表1描述的多态性。这些探针可以用于筛选cDNA或基因组文库,从而分离本发明的核酸实施方式的天然资源,或者用于鉴定特定菌株或分类大肠杆菌菌株。另外,互补于SEQ.ID.Nos.:22,16,18,24,26,20,42,28,30,40,32,36,38,和34中公开的gnd序列的核酸序列可以用于通过扩增方法例如PCR中使用的常规寡核苷酸合成技术制备寡核苷酸引物。这些寡核苷酸引物可以用于,例如,通过应用PCR或其它酶-介导的核酸扩增技术扩增基因组DNA或生物样品中的序列残留物,而分离本发明的核酸实施方式。下面将更详细地讨论这种诊断技术和食品或水的筛选技术。
或者,应用分子生物学的常规技术对编码SEQ.ID.Nos.:22,16,18,24,26,20,42,28,30,40,32,36,38,和34公开的gnd序列或其片段的核酸进行操作,产生表达6-PGD或6-PGD片段的重组构建体。下面的部分将描述这些表达构建体和蛋白质实施方式的一部分。
蛋白质实施方式
6-PGD多肽实施方式或其衍生物,包括但不限于,那些具有基本上如SEQ.ID.Nos.:23,17,19,25,27,21,43,29,31,41,33,37,39,和35所述的全长氨基酸序列和这些序列的至少三个氨基酸长度的片段作为一级氨基酸序列的分子,它们包括改变的序列,其中功能等同氨基酸残基被取代为产生沉默突变的序列中的残基。优选片段包括至少一种可以由表1推断出来的多态性,如前面的描述。应当理解,在这部分下面的讨论中,针对6-PGD的参考文献一般意义上来说在于涵盖SEQ.ID.Nos.23,17,19,25,27,21,43,29,31,41,33,37,39,和35描述的蛋白质和其片段。
因此,SEQ.ID.Nos.:23,17,19,25,27,21,43,29,31,41,33,37,39,和35的6-PGD多肽或其片段中的一种或多种氨基酸残基可以取代为极性相似的另一种氨基酸,其作为一种功能等同物,产生沉默突变。对序列中的一种氨基酸的取代可以选自该氨基酸所属类型中的其它成员。例如,非极性(疏水)氨基酸包括丙氨酸、亮氨酸、异亮氨酸、缬氨酸、脯氨酸、苯丙氨酸、色氨酸、和蛋氨酸。极性中性氨基酸包括甘氨酸、丝氨酸、苏氨酸、半胱氨酸、酪氨酸、天冬酰胺、和谷氨酰胺。正电荷(碱性)氨基酸包括精氨酸、赖氨酸、和组氨酸。负电荷(酸性)氨基酸包括天冬氨酸和谷氨酸。芳香氨基酸包括苯丙氨酸、色氨酸、和酪氨酸。
本发明的6-PGD片段可以少于或等于3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,40,41,42,43,44,45,46,47,48,49,50,51,52,53,54,55,56,57,58,59,60,61,62,63,64,65,66,67,68,69,70,71,72,73,74,75,76,77,78,79,80,81,82,83,84,85,86,87,88,89,90,91,92,93,94,95,96,97,98,99,100,125,150,175,200,225,250,275,300,325,350,375,400,425,450,和468个氨基酸长度。在本发明的其它方面,SEQ.ID.Nos.:23,17,19,25,27,21,43,29,31,41,33,37,39,和35的6-PGD多肽或其片段或其衍生物在翻译过程中或翻译后进行不同地修饰,例如,磷酸化,糖苷化,交联,酰化,蛋白水解切割,与抗体分子、膜分子、或其它配体连接。(Ferguson等,生物化学年度综述(Ann.Rev.Biochem.)57:285-320(1988))。
在几个实施方式中,SEQ.ID.Nos.:23,17,19,25,27,21,43,29,31,41,33,37,39,和35的6-PGD多肽或其片段在细胞系中表达。这些包括本发明的序列、构建体、载体、克隆、和其它材料可以方便地成为富集型或分离型。本发明使用的“富集”指材料的浓度至少约为其天然浓度的2,5,10,100,或1000倍,(例如),方便地为0.01%重量、优选至少约0.1%重量。重量约0.5%,1%,5%,10%,和20%的富集制品也是预期的。术语“分离”需要材料从其来源环境(例如如果是天然的即为天然环境)分离出来。例如,存在于活动物体内的天然多核苷酸或多肽是未分离的,但从天然系统中的部分或全部共存材料中分离出来的同样多核苷酸或多肽是分离的。纯化形式的序列也是有利的。术语“纯化”不需要绝对纯化;而是一个相对概念。起始材料或天然材料的纯化至少一个数量级,优选两到三个数量级,更优选四到五个数量级是特别期望的。
为了表达gnd编码的蛋白质或其部分,得到含6-PGD或6-PGD片段的编码序列的核酸,然后克隆到适当的表达载体中,从而使编码区可操纵地连接于异源启动子。编码待表达蛋白质或多肽的核酸用常规克隆技术可操纵地连接于表达载体中的启动子。表达载体可以是本领域已知的任何哺乳动物、酵母、两栖动物、昆虫、寄生虫、或细菌表达系统。很多供应商提供商业可得到的载体和表达系统,包括Genetics Institute(Cambridge,MA),Stratagene(La Jolla,California),Promega(Madison,Wisconsin),和Invitrogen(San Diego,California)。为了增强表达和有助于适当的蛋白质折叠,如果需要,可以为表达载体导入的特定表达生物体优化密码子环境和序列的密码子配对,如Hatfield等的US5082767中解释的那样,作为参考插入本文。而且,可以整合分泌性引导序列,从而有助于蛋白质的纯化。
下面提供了一个表达上述核酸编码的蛋白质的方法实施例。首先,鉴定基因的蛋氨酸起始密码子和基因的poly A信号。如果编码待表达多肽的核酸缺乏作为起始位点的蛋氨酸,可以用常规技术在核酸的第一密码子旁边导入一个起始蛋氨酸。同样,如果核酸缺乏poly A信号,可以通过,例如,用Bgll和Sall限制性核酸内切酶从pSG5(Stratagene)中切出poly A信号,然后将它整合到哺乳动物表达载体pXT1(Stratagene)中。载体pXT1含有来自莫洛尼氏鼠白血病病毒的LTR和部分gag基因。构建体中LTR的位置允许有效稳定转染。载体包括单纯疱疹胸苷激酶启动子和可用于筛选的新霉素基因。可以通过PCR从细菌载体得到编码待表达多肽的核酸,应用互补于所述核酸并包含适应整合到5’引物中的PstI和相应cDNA 3’引物的5’末断的BgIII的限制性核酸内切酶序列的寡核苷酸引物,注意确保所述核酸定位在具有poly A信号的读码框中。从发生的PCR反应得到的纯化片段用PstI消化,用核酸外切酶产生平端,用BgIII消化,纯化并连接于pXT1,现在即包含了一个poly A信号,然后用BgIII消化。用Lipofectin(Life Technologies,Inc.,Grand Island,New York),按照产品说明书注明的条件,将连接产物转染到一个适当的细胞系中,例如小鼠NIH3T3细胞。转染细胞在600g/ml G418(Sigma,St.Louis,Missouri)中生长后,筛选阳性转染体。优选地,表达蛋白质释放到培养基中,因此有助于纯化。
另一个实施方式应用“用于表达和纯化的Xpress系统”(lnvitrogen,San Diego,CA)。Xpress系统被设计为从细菌、哺乳动物、和昆虫细胞中高水平生产和纯化重组蛋白质。Xpress载体产生与一种短N-末端引导肽融合的重组蛋白质,所述引导肽对二价阳离子具有高亲和力。应用镍-螯合树脂(lnvitrogen),可以一步纯化重组蛋白质,然后用肠激酶酶切除去引导肽。
一种表达6-PGD和6-PGD片段的优选载体是pBlueBacHis2 Xpress。pBlueBacHis2 Xpress载体是一种含有多个克隆位点、一个氨苄西林抗性基因、和一个lac z基因的杆状病毒表达载体。按照一个研究,gnd核酸或其部分被克隆pBlueBacHis2 Xpress载体中,然后感染SF9细胞。然后按照生产商的说明分离或纯化表达出来的蛋白质。其它几种具有含gnd或其片段的重组构建体或载体的培养细胞系也是本发明的实施方式,它们的生产在本发明中将是常规的。
还可以通过凝胶电泳分离培养基中的蛋白质。然后用例如考马斯或银染色法,或者用抗蛋白质的抗体检测分离的蛋白质。蛋白质的考马斯、银染色、和免疫标记是本领域技术人员熟悉的技术。如果需要,还可以在电泳之前,根据蛋白质的大小或电荷对蛋白质进行硫酸铵沉淀或分离。
由gnd或其部分编码的蛋白质还可以用标准免疫色谱技术纯化。在该程序中,将含蛋白质的溶液,例如培养基或细胞提取物应用于具有附着于色谱基质的抗蛋白质抗体的柱子。使蛋白质与免疫色谱柱结合。然后,冲洗柱子,除去非特异性结合蛋白。然后从柱子上释放特异性结合蛋白,用标准技术回收。
而且,gnd或其片段可以整合到设计用于嵌合多肽纯化方案的表达载体中。在该方案中,gnd编码序列或其片段被插入编码另一半嵌合体的基因的读码框中。另一半嵌合体可以是-球蛋白或镍结合多肽的编码序列。然后用具有抗-球蛋白抗体或附着镍的色谱基质纯化嵌合蛋白。可以在-球蛋白基因或镍结合多肽与gnd cDNA之间人工插入蛋白酶例如肠激酶切割位点。因此,嵌合体的两种肽可以通过蛋白酶消化彼此分开。
一种有用的产生-球蛋白嵌合体的表达载体是pSG5(Stratagene),其编码兔-球蛋白。兔-球蛋白基因的Intron II有助于表达的转录体的剪接,插入构建体的多腺苷信号提高了表达水平。描述的这些技术对分子生物学领域的技术人员是众所周知的。一些方法教科书例如Davis等(分子生物学的基础方法(Basic Methods in Molecular Biology)L.G.Davis,M.D.Dibner,和J.f.Battey,编,Elsevier Press,NY,1986)中公开了标准方法,Stratagene,Life Technologies,Inc.或Promega提供了一些方法。另外可以应用体外翻译系统,例如体外ExpressTM翻译试剂盒(Stratagene)从构建体生产多肽。
除了应用重组DNA技术分离或纯化6-PGD和6-PGD片段,还可以应用本领域已知的方法例如Merrifield等,美国化学协会(J.Am.Chem.Soc.)85:2149(1964),Houghten等,Proc.Natl.Acad.Sci.USA,82:51:32(1985),和Stewart和Young,固相肽合成(solid phase peptide synthesis),Pierce Chem Co.,Rockford,IL(1984)描述方法,通过化学合成法(例如固相肽合成)制备这些分子。合成的这些多肽的氨基末端可以有也可以没有蛋氨酸。化学合成的6-PGD和6-PGD片段可以用这些参考文献中描述的方法氧化,以形成二硫键。6-PGD和6-PGD片段可以用作天然的、纯化6-PGD和6-PGD片段的生物活性或免疫替代物。6-PGD和6-PGD片段的类似物包括模拟肽的小分子。这些小分子是也公知为肽模拟物(peptidomimetics)。肽模拟物是一种具有与肽同样效果的分子,通常因为它具有同样的关键“形状”,但自身不是肽,因子不会被蛋白酶破坏,并且生产成本低。因此,可以制备结构和/或功能类似6-PGD或6-PGD片段的肽模拟物,然后评价它们与6-PGD或6-PGD片段特征分析的相互作用能力(例如,抑制天然6-PGD或其片段的功能)或在受体中诱导一种免疫应答。本领域报道了几种制备类似肽的肽模拟物的研究。例如US5288707;US5552534;US5811515;US5817626;US5817879;US5821231;和US5874529中公开了多种方法,其全文作为参考插入本发明。
合成或表达和分离或纯化gnd或其部分编码的蛋白质后,分离或纯化的蛋白质可以用于生产抗体和与6-PGD或6-PGD片段相互作用的鉴定试剂的工具。识别6-PGD或6-PGD片段的抗体具有以下用途,包括但不限于,多克隆、单克隆、嵌合、单链、Fab片段和由Fab表达文库生产的片段。
对于抗体的生产,各种宿主包括山羊、兔、大鼠、小鼠等可以用6-PGD或其保留免疫原性的任意部分、片段或小肽注射免疫。根据宿主的种类不同,可以应用各种佐剂增强免疫应答。这些佐剂包括但不限于Freund’s、矿物胶例如氢氧化铝、和表面活性剂例如溶血卵磷脂、pluronic多元醇、多聚阴离子、肽、油性乳剂、匙孔帽贝血蓝蛋白、和二硝基酚。BCG(结核菌素)和小棒杆菌是潜在有用的佐剂。
用于诱导特异性抗体的肽可以具有至少由三个氨基酸构成的氨基酸序列,优选包括可由表1推断出的一种多态性的至少10或15个氨基酸。优选的抗体,例如,包括与具有T2181多态性的多肽或具有C653T或G654C但无6-PGD或gnd的核酸(即其在核酸653位和654位分别具有Thr218或胸腺嘧啶或胞嘧啶多态性)特异性结合的抗体。也就是说,优选抗体识别专一鉴定Iso218多态性而非Thr218多态性的表位,或反之亦然,或者抗体识别专一鉴定核酸653位胞嘧啶和/或核酸654位鸟嘌呤或653位胸腺嘧啶和/或核酸654位胞嘧啶的表位。理想的是,编码6-PGD片段的短氨基酸片段与另一种蛋白质的氨基酸片段融合,例如匙孔帽贝血蓝蛋白,产生抗这种嵌合分子的抗体。而能够特异性识别6-PGD的抗体可以通过将相应6-PGD蛋白质序列的合成3-聚体、10-聚体、和15-聚体肽注射到小鼠中产生。可以应用重组或纯化6-PGD和6-PGD片段产生更多种抗体。
为了生产抗6-PGD和6-PGD片段的抗体,从转染或转化细胞中分离基本上纯的6-PGD和6-PGD片段。对最后产品中多肽的浓度进行调整,例如,利用Amicon过滤装置浓缩,以达到几个微生物/ml的水平。然后可以如下制备抗目标多肽的单克隆或多克隆抗体:
可以用提供用于通过培养中的连续细胞系生产抗体分子的任何技术制备6-PGD和6-PGD片段的单克隆抗体。它们包括但不限于,最早由Koehler和Milstein(自然256:495497(1975))描述的杂交瘤技术,人B-细胞杂交瘤技术(Kosbor等,今日免疫学(lmmunol Today)4:72(1983);Cote等Proc Natl Acad Sci 80:2026-2030(1983)),和EBV-杂交瘤技术(Cole等,单克隆抗体和癌症治疗(Monoclonal Antibodies and Cancer Therapy),AlanR.Liss Inc.New York N.Y,pp 77-96(1985))。另外,可以应用研究用于制各“嵌合抗体”的技术,小鼠抗体基因与人抗体基因接合得到具有合适抗原特异性和生物活性的分子的技术。(Morrison等,Proc Natl Acad Sci81:6851.6855(1984);Neuberger等,自然312:604-608(1984);Takeda等,自然314:452-454(1985))。或者,可以调整描述用于生产单链抗体的方法(US4946778),生产6-PGD-特异性单链抗体。还可以在淋巴细胞群中诱导体内生产或筛选重组免疫球蛋白文库或高特异性结合试剂面板(如Orlandi等,Proc Natl Acad Sci 86:3833-3837(1989),和Winter G.和Milstein C;自然,349:293-299(1991)的报道),来生产抗体。
还可以产生含6-PGD特异性结合位点的抗体片段。例如,这种片段包括但不限于,能够通过胃蛋白酶消化抗体分子而产生的F(ab’)2片段,以及能够通过减少F(ab’)2片段的二硫键而产生的Fab片段。或者,可以构建Fab表达文库,从而得以快速简便地鉴定具有所需特异性的单克隆Fab片段。(Huse W.D.等,科学256:1275-1281(1989)。
在一个研究中,如下制备抗6-PGD或其片段的单克隆抗体。简单地说,用几微克上述来源的选择蛋白质或多肽反复接种小鼠几周时间。然后处死小鼠,分离脾的抗体生产细胞。在存在聚乙二醇条件下,将脾细胞与小鼠骨髓瘤细胞融合,将系统在含氨喋呤的选择性培养基(HAT培养基)上生长,以破坏过量的未融合细胞。稀释成功融合的细胞,等分量的稀释液置于微滴平板的孔中,在其中培养物继续生长。通过免疫分析程序例如ELISA(最早由Engvall,E.,酶学方法(Meth.Eazymo)70:419(1980))和它的衍生方法检测各孔上清液中的抗体,以鉴定抗体生产克隆。选择出的阳性克隆可以进行扩大,收获它们的单克隆抗体产物以备应用。生产单克隆抗体的详细方法在Davis,L等的《分子生物学的基本方法》(Basic Methods in Molecular Biolooy,Elsevier,New York.Section 21-2)中描述。
可以用上述来源的表达的蛋白质或肽(它们可以是未修饰的,也可以是为增强免疫原性而修饰的)免疫适当的动物,制备含抗一种蛋白质异源表位的抗体的多克隆抗血清。通过调整一些与抗原和宿主种类有关的因素有效地进行多克隆抗体的生产。例如,小分子比大分子倾向于产生较小的免疫原性,并可能需要应用载体和佐剂。而且,宿主动物随接种部位和剂量而改变,抗原剂量不足或过量都会产生较低滴度的抗血清。小剂量抗原(ng水平)在多个真皮内部位给药看起来是最可靠的。在Vaitukaitis,J.等的《临床内分泌代谢杂志》((J.Clin.Endocrinol.Metab.)33:988-991(1971))中描述了兔的有效免疫方案。
可以以有规律的间隔进行增强注射,当通过,例如在琼脂中抗已知浓度抗原的双免疫扩散,半定量确定其抗体滴度开始下降时,收获抗血清。参见,例如,Ouchterlony,O.等,实验免疫学指南(Handbook ofExperimental Immunology)第19章,D.Wier(编)Blackwell(1973)。抗体的高峰浓度通常在0.1-0.2mg/ml血清范围内(约12M)。通过制备竞争性结合曲线(如,例如,Fisher,D.,临床免疫学手册(Manual of ClinicalImmunology)第42章,第2版(Rose和Friedman,编)Amer.Soc.ForMicrobial.,Washington,D.C.(1980)所述),确定抗血清对抗原的亲和力。按照任一种方案制备的抗体制剂在确定微生物样品中的抗原携带物质的浓度的定量免疫分析中都是有用的;它们也用语半定量或定量(例如,在鉴定生物样品中是否存在6-PGD的诊断实施方式中)。
诊断和筛选实施方式
通常,可以按照实施方式是基于核酸还是基于蛋白质的分析,对本发明的诊断和筛选方法进行分类。这些分析优选通过检测gnd基因座中是否存在一种或多种多态性来鉴定和区分存在于生物样品(例如,来自患者、食物源、或液体源的样品)中的大肠杆菌的病原性菌株和程度。也就是说,几种诊断和筛选实施方式致力于检测核酸或蛋白质样品中是否存在表1提供的或者可以从表1推断出的一种或多种多态性。另外,组合了下面实施方式中描述的试剂和方法,从而允许快速检测和鉴定高病原性O157:H7大肠杆菌的试剂盒的生产也是预期的。诊断试剂盒可以包括一种核酸探针或一种抗体或它们的组合,它可以特异性地检测表1描述的或可由表1推断出的一种或多种多态性。这些试剂盒的检测成分通常为一种或多种下面试剂的组合。通常提供能够吸附或结合DNA、RNA、或蛋白质的载体。可利用的载体包括具有负载正电荷取代物阵列特征的硝酸纤维素膜、尼龙或衍生尼龙。这些试剂盒中可以提供一种或多种限制性酶,控制试剂、缓冲液、扩增酶、和非人多核苷酸(例如小牛胸腺或鲑鱼精子DNA)。
有用的基于核酸的诊断方法包括但不限于,直接DNA测序、Southern印迹分析、单链确认分析(sing-stranded confirmation analysis,SSCA)、RNase保护分析、斑点印迹分析、核酸扩增、和这些方法的组合。这些分析的出发点是分离或纯化来自生物样品的DNA。更简单地说,从待测受试者得到粪便材料,或获得食物或水样。可以培养细菌以得到足量待测DNA,在某些实施方式中,从样品中提取细菌DNA,通过DNA扩增技术例如PCR,用对应gnd基因座区和/或gnd/rfb基因簇区优选具有一种表1所列多态性的区域的引物,扩增细菌DNA。
可以用几种方法检测生物样品中的多态性。直接DNA测序(人工测序或自动荧光测序)可以检测这种序列变异。另一种方法是单链确认多态性分析(SSCA)(Orita等,Proc.Natl.Acad.Sci USA(1989),作为参考并入本发明)。然而这种方法不能检测所有的序列改变,尤其是如果DNA片段大小超过200个碱基对,但该方法能够被优化而检测最多的DNA序列变异。检测灵敏度的降低是不利的,但SSCA的提高检测量的可能性使它成为一种对检测突变的直接测序法的有吸引力的可行的替代方法。然后对在SSCA凝胶上迁移率改变的片段进行测序,确定DNA序列变异的准确性质。其它基于检测两个互补DNA链之间错配的方法包括连锁变性凝胶电泳(clamped denaturing gel electrophoresis,CDGE)(Sheffield等,美国人类遗传学杂志(Am.J.Hum.Genet.)49:699-706(1991))、异源双链体分析(HA)(White等,基因组(Genomics)12:30 1-306(1992))、和化学错配剪切(CMC)(Grompe等,Proc.Natl.Acad.Sci.USA 86:5855-5892(1989))。Grompe(天然遗传学(Nature Genetics)5:111-117(1993))提供了目前应用的检测DNA序列变异法的综述。
可以通过观察一系列用一种或多种限制性酶优选用多种限制性酶进行酶切的DNA的Souther印迹进行一种检测多态性和DNA序列的快速初步分析。每块板都含有来自未感染个体的DNA和待测DNA的泳道。当用对应表1描述的一种或多种多态性的序列作为探针检测,显示为杂交片段的Southern印迹表明存在特定大肠杆菌菌株。可以用对应表1描述的一种或多种多态性旁侧区的引物,应用标准PCR方法直接从样品扩增DNA,或者如下面将更详细讨论的扩增子的测序,来检测点突变。
下面提供了七种确定存在一种或多种表1描述的多态性的公知的基于核酸的方法。为实施例目的提供,不在于限制本发明的任何方面,这些方法包括:
(1)单链确认分析(SSCA)(Orita等);
(2)变性梯度凝胶电泳(DGGE)(Wartell等,核酸研究(Nucl.AcidsRes.)18:2699-2705(1990)和Sheffield等,Proc.Natl.Acad.Sci.USA 86:232-236(1989),均作为参考并入本发明);
(3)RNase保护分析(Finkelstein等,基因组7:167-172(1990)和Kinszler等,科学251:1366-1370(1991),均作为参考并入本发明);
(4)识别核酸错配的蛋白质的应用,例如大肠杆菌mutS蛋白(Modrich,遗传学年度综述(Ann.Rev.Genet.)25:229-253(1991),作为参考并入本发明);
(5)等位基因特异性PCR(Rana和Kidd,核酸研究17:8392(1989),作为参考并入本发明),其中涉及应用3’末端与一种多态性杂交的引物,如果该多态性不存在,即观察不到扩增产物;和
(6)扩增难容突变系统(Ampification Refractory Mutation System,ARMS),如EP 0332435和Newton等(核酸研究17:2503-2516(1989))的报道,均作为参考并入本发明;和
(7)瞬时温度梯度凝胶电泳(TTGE),如Bio-Rad在U.S./E.G.公报2103中所述,作为参考并入本发明。
在SSCA,DGGE,TTGE,和RNase保护分析中,当存在多态性时,出现新的电泳带。SSCA和TTGE检测迁移变化的色带,因为序列改变导致单链、分子间碱基配对方面出现可由电泳检测到的差异。RNase保护涉及突变多核苷酸剪切成两种或多种小片段。DGGE用变性梯度凝胶检测序列与病原性较低菌株的gnd序列之间迁移率的差异。在等位基因-特异性寡核苷酸分析(ASO)(Conner等,Proc.Natl.Acad.Sci.USA 80:278-282(1983))中,设计了一种检测特定序列的寡核苷酸,通过检测是否存在杂交信号进行分析。在mutS分析中,蛋白质仅结合由多态性序列和非多态性序列形成的异源双链体中含一个核苷酸错配的序列。错配,该词的意思指两条链不是100%互补的杂交的核酸双链体。由于从生物样品,例如,已经与非多态性链杂交的生物样品中得到的扩增子中存在一种或多种多态性,导致缺乏总体同源性。错配检测可以用于检测gnd基因或其mRNA产物中的点突变。而这些方法比测序灵敏度低,但它们容易处理多个生物样品,并且适应阵列法。
在优选实施方式中,本发明的核酸实施方式附着于有序阵列中的支持物上,其中多种核酸探针附着于支持物的不同区域,它们不会彼此重叠。优选,这种有序阵列设计为“可设定地址的”,其中探针的各自位置被记录下来,并可作为分析程序的一部分存取。在一些实施方式种,可设定地址的核酸阵列包括多种互补于表1列出的多种多态性的核酸探针。将这些探针加入不同已知位置中的支持物上。对各核酸探针的准确位置的明晰时这些“可设定地址”的阵列在结合分析中特别有用。之后用常规方法(例如放射性或荧光)标记来自几种生物样品制成品中的核酸,在杂交得以进行的条件下将标记的样品加到阵列中。如果样品中的核酸与阵列上的探针杂交,那么在对应杂交体位置的支持物上将检测到信号。因为各标记应品的来源是已知的,标记样品加到的支持物区也是已知的,故可以迅速确定是否存在多态性变异体(即,大肠杆菌菌株)。还可以结合DNA扩增的常规方法,如下面将要讨论的,以便检测少与10个细菌细胞的存在。用本高通量诊断或检测分析领域中的技术人员已知的方法可以容易地使这些方法自动化。
另外,可以应用与上述方法相反的方法。将生物样品中存在的核酸置于支持物上,制备一种可设定地址的阵列。优选地,将样品置于不重叠的已知位置的支持物上。应用互补于编码多态性的核酸的标记的核酸探针,然后检测阵列上对应生物样品放置位置的信号的存在,确定各样品中具有所需多态性的核酸的存在。因为生物样品的身份已知,其在阵列上的位置已知,因此可以快速确定多型性变异体的身份。对于上述方法,可以组合常规DNA扩增法,以便检测极少量细菌细胞的存在。应用高通量诊断分析领域技术人员已知的方法也可以容易地是这些方法自动化。
任何本领域已知的可设定地址的阵列技术都可以用于本发明的这一方面。一种已知的多核苷酸阵列的具体实施方式是GenechipsTM,US5143854;PCTS申请WO 90/15070和WO 92/10092中对其有一般性描述。这些阵列通常用机械合成法或光引导合成法制备,这些方法结合了照相平版印刷法和固相寡核苷酸合成的组合。(Fodor等,科学,251:767-777,(1991))。随着一般称之为“极大规模固定的聚合物合成”(Very Large ScaleImmobilized Polymer Synthesis,VLSIPSTM)技术的进展而使固体支持物上寡核苷酸阵列的固定化成为可能,在VLSIPS技术中,探针通过固定在芯片固体表面的高密度阵列中。US 5143854和US 5412087和PCT申请WO90/15070,WO 92/10092和WO 95/11995中提供了VLSIPSTM方法的实施例,它们描述了通过例如光-引导合成技术等方法制备寡核苷酸阵列的方法。在旨在于提供固定于固体支持物的核苷酸阵列的设计策略中,发展了进一步介绍策略,即指定和显示芯片上的寡核苷酸阵列,试图使杂交模式和诊断信息最大化。这些介绍策略的实施例公开于PCT申请WO94/12305,WO 94/11530,WO 97/29212,和WO 97/31256。
本领域技术人员已知多种标记和结合技术,它们可以用于各种核酸分析法。有几种制备用于杂交或PCR的标记核酸的方法,包括但不限于,低聚物标记、缺口翻译、末端标记、或应用标记核苷酸的PCR扩增。或者,编码6-PGD或其任何部分的核酸可以克隆到载体中,用于制备mRNA探针。这类载体是本领域已知的,可从商业得到,并可以通过加入一种合适的RNA聚合酶例如T7、T3SP6和标记的核苷酸体外合成RNA探针。很多公司例如Pharmacia Biotech(Piscataway N.J.),Promega(Madison Wis.),和U.S.Biochemical Corp(Cleveland Ohio)提供用于这些程序的商业试剂盒和方案。适当的报告分子或标记物包括那些放射性核素、酶、荧光物质、化学发光物质、或色原物质,以及底物、辅因子、抑制物、磁性颗粒等。
适应阵列技术的错配剪切技术的实施例是RNase保护法。实践中,该方法涉及应用互补于具有多态性(例如,使高病原性O157:H7和O55:H7与其它较低病原性的大肠杆菌菌株区分开来的C653T和G654C多态性)的gnd序列的标记的核探针(riboprobe)。核探针与从生物样品中分离并扩增得到的mRNA或DNA退火(杂交),随后用酶RNase A消化,该酶能够探测到双链RNase结构中的错配。如果RNase探测到错配,样品中就不会存在多型性变异,酶在错配位点酶切,并破坏核探针。因此,当在电泳凝胶基质上分离退火的RNA时,如果已经探测出错配并已由RNase A酶切,将看到比核探针和mRNA或DNA的全长双链RNA更小的RNA产物。或者,可以将核探针的互补序列分散于阵列,然后与来自任何保留杂交体变性后的RNase A消化产物严紧杂交。在这种情况下,如果探测到错配,探针被RNase A破坏,那么阵列上的互补序列将不与降解的RNA在严紧条件下杂交。在这种方式中可以应用多种核探针筛选多种多态性,只需留意探针和互补序列不发生交叉杂交。如上述具有这种筛选几种基因座的阵列的面板对于研究大肠杆菌病原谱尤其有用。在一种类似模式中,可以用DNA探针探测错配,通过酶或化学剪切。参见,例如,Cotton,等Proc.Natl.Acad.Sci.USA 85:4397(1988);Shenk等,Proc.Natl.Acad.Sci.USA 72:989(1975);和Novack等,Proc.Natl.Acad.Sci.USA 83:586(1986)。
或者,可以通过错配双链相对于匹配双链电泳能力的移位,探测错配。(参见,例如,Cariello,人类遗传学42:726(1988),作为参考并入本发明)。用核探针或DNA探针,可以在杂交之前通过PCR扩增对应于含多态性的gnd区的细胞mRNA或DNA。然后可以应用等位基因-特异性探针筛选从生物样品中分离出来的经PCR扩增的DNA序列。这些探针是核酸低聚物,它们均含有一个包括表1所列的一种或多种多态性的区域。例如,一种低聚物长度可以约为30个核苷酸,对应C653T和G654C多态性。通过应用一套这种等位基因-特异性探针,可以筛选PCR扩增产物,以鉴定是否存在特定多态性。当然,确定样品中是否存在高病原性大肠杆菌的最权威性实验是直接比较从生物样品中分离出来的核苷酸或蛋白质序列与一种或多种表1列出的多态性。
大量PCR方法对于本领域技术人员是熟知的。对于PCR方法的综述,参见基因工程的分子克隆(Molecular Cloning to Genetic Engineering)White,B.A.编《分子生物学方法(Methods in Molecular Biology)》67:Humana Press,Totowa(1997),参考其全文并入本发明,以及名称为“PCR发法和应用”的公开文献(1991,Cold Spring Harbor Laboratory Press),参考其全文并入本发明。对于mRNA的扩增,逆转录mRNA成为cDNA,然后进行PCR(RT-PCR);或者应用如US5322770(参考其全文并入本发明)所述两个步骤使用一种酶;或者使用如Marshall R.L等(PCR方法和应用4:80-84,1994,参考其全文并入本发明)所述的逆转录酶不对称缺口连接酶链式反应(Reverse Transcriptase Asymmetric Gap Ligase Chain Reaction,RT-AGLCR),均在本发明范围内。
在每一个上述扩增程序中,将待扩增序列两侧的引物与dNTP和热稳定性聚合酶例如Taq聚合酶、Pfu聚合酶、或者Vent聚合酶一起加到适当制备的核酸样品中。使样品中的核酸变性,引物特异性地与样品中的互补核酸序列杂交。使杂交的引物延伸。之后,开始另一轮变性、杂交、和延伸。重复循环多次,以制备含引物区之间的核酸序列的扩增片段。PCR还在几个专利中有描述,包括US4683195、US4683202、和US4965188,通过参考其全文并入本发明。
选择的引物基本上互补于gnd DNA或mRNA序列的一部分,以及基本上为互补于gnd DNA或mRNA序列的序列的一部分,因此允许引物之间的序列得以扩增。应用于本发明这一方面的引物的长度等于前面提供的核酸实施方式的大多数长度。即,引物长度可以小于或等于9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,40,41,42,43,44,45,46,47,48,49,50,51,52,53,54,55,56,57,58,59,60,61,62,63,64,65,66,67,68,69,70,71,72,73,74,75,76,77,78,79,80,81,82,83,84,85,86,87,88,89,90,91,92,93,94,95,96,97,98,99,100,125,150,175,200,225,250,275,300,325,350,375,400,425,450,475,500,525,550,575,600,625,650,675,700,725,750,775,800,825,850,875,900,925,950,975,1000,1100,1200,1300,和1406个核苷酸。然而优选引物长度为16,17,18,19,20,21,22,23,24,25,26,27,28,29和30个核苷酸。较短引物倾向于对目标核酸序列缺乏特异性,通常需要较低温度以便与模板形成足够稳定的杂交复合物。较长引物制备昂贵,有时能够自身-杂交形成发夹结构。稳定杂交体的形成依赖于DNA的熔融温度(Tm)。Tm依赖于引物长度、溶液离子强度合G+C含量。引物G+C含量越高,熔融温度越高,因为G∶C对由三个H键结合,而A∶T对仅由两个H键结合。本发明的扩增引物的G+C含量优选范围在10-75%之间,更优选在35-60%之间,最优选在40-55%之间。在具体分析条件下引物的合适长度可以由本领域技术人员通过经验确定。
引物之间的间隔决定了待扩增片段的长度。在本发明的情况下,携带编码6-PGD片段的核酸序列的扩增片段长度可以从至少越25bp到35kb。25-1407bp的扩增片段是普遍的,50-1000bp的片段是优选的,100-600bp的片段是高度优选的。将理解用于本发明gnd基因的扩增引物可以是允许SEQ.ID.Nos.22,16,18,24,26,20,42,28,30,40,32,36,38,和34中公开的gnd基因区特异性扩增的任何序列,并能够,例如,包括修饰例如有助于克隆的限制性位点。
在一个优选实施方式中,通过应用使用两套引物的PCR扩增鉴定了高病原性O157:H7大肠杆菌,并使之与较低病原性的大肠杆菌区别开来。第一套引物被设计为产生一个至少含C653T和G654C多态性的扩增子,其能将高病原性O157:H7和O55:H7大肠杆菌与低病原性菌株区分开来。第二套引物设计为产生一个O55:H7寄生虫独特的扩增子,例如,引物对:5’GCGTTCTTAAAGAGTCCTGC3’(SEQ.ID.No.13)和5’TGCCCGCTACATCTCCTC3’(SEQ.ID.No.8),其对应于gnd的3’末端,下游区产生一个来自11大肠杆菌O55菌株而不是大肠杆菌O157:H7DNA的6.5kb扩增子。通过应用SSCP或TTGE和简易凝胶电泳,本领域技术人员可以快速鉴定C653T和G654C多态性的存在,并确定检测到的多型性变异是O157:H7还是O55:H7。在类似模式中,可以应用专属地鉴定表1所述的其它多态性的引物和引物的组合,以鉴定和区分大肠杆菌菌株。
还可以应用常规分析法检测本发明的6-PGD蛋白的存在。例如,与特定6-PGD序列中发现的多态性具有免疫反应性的单克隆抗体可以用于筛选生物样品是否存在特定大肠杆菌菌株,并可以用于使一种菌株从其它菌株中区分出来。由于T2181多态性可以使高病原性O157:H7和O55:H7与低病原性O157:H7区分开来,因此包括涉及检测是否存在T2181多态性的试剂和方法的诊断和筛选分析是优选实施方式。这些诊断分析也可以包括特异性区分O55:H7和O157:H7寄生虫的试剂,例如,针对来自O157:H7寄生虫的、与6-PGD蛋白非同源的、O55:H7 6-PGD蛋白区中存在的表位的抗体。这些免疫分析可以在一些方便的模式下操作。
在一个实施方式中,用抗体从溶液中免疫沉淀本发明的6-PGD,在另一个实施方式中,用抗体与聚丙烯酰胺凝胶的Western或免疫印迹上的6-PGD反应。检测6-PGD的优选实施方式包括酶联免疫吸附分析(ELISA),放射性免疫分析法(RIA)、免疫辐射测量法(IRMA)和免疫酶学分析法(IEMA),包括应用单克隆和/或多克隆抗体的夹层分析法。David等,在US 4376110和US4486530(作为参考并入本发明)中描述了举例说明的夹层分析法。其它实施方式应用了多方面免疫色带技术,如US 5290678;US 5604105;US 5710008;US 5744358;和US 5747274的公开,作为参考并入本发明,这些方法允许快速、可见地鉴定样品中多种分析物的存在。这些方法可以方便地调整,从而得以快速检测可由表1推测出的6-PGD多态性。
在优选的基于蛋白质的诊断和/或检测实施方式中,本发明的抗体附着于有序阵列的支持物上,其中大量抗体附着于不会彼此重叠的支持物的不同区域。象基于核酸的阵列一样,基于蛋白的阵列是被设计为“可设定地址”的有序阵列,从而可以记录不同位置,并且它们可以被存取为分析程序的一部分。
在某些实施方式中,可设定地址的抗体阵列包括大量识别可由表1推断出的6-PGD多态性的抗体。将这些探针加到不同已知位置的支持物上。各探针的精确位置的明晰使这些“可设定地址”的阵列在结合分析中特别有用。例如,一种可设定地址的阵列可以包括一种支持物,其具有加入了多个识别可由表1推断出的6-PGD多态性的抗体探针的若干区域。从生物样品得到的蛋白质用常规方法标记(例如,放射性、比色法、或荧光法),在允许结合的条件下将标记样品加到阵列中。如果样品中的蛋白质结合阵列上的抗体探针,那么将在对应抗体-蛋白质复合物位置的支持物位置上检测到信号。因为各标记样品的身份是已知的,标记样品加到的支持物区域是已知的,因此可迅速确定存在、浓度、和/或表达水平。也就是说,通过应用已知浓度6-PGD的标记标准品,研究者可以准确地确定样品中的6-PGD蛋白质浓度,并能够从该信息评价6-PGD的表达水平。测量密度的常规方法也能够用于更准确地确定6-PGD的浓度或表达水平。应用高通量诊断分析领域技术人员已知的技术可以容易地使这些方法自动化。
在另一个实施方式中,可以应用于前面提供方法相反的方法。可以将生物样品中存在的蛋白质置于支持物上,以形成一种可设定地址的阵列。优选地,蛋白质样品置于不重叠的已知位置的支持物上。应用识别对应可由表1推断出的多态性的6-PGD表位的标记抗体探针,并检测对应生物样品放置位置的阵列上位置的信号,即可确定各样品中编码特定6-PGD形式的蛋白质的存在。由于生物样品的身份是已知的,其在阵列中的位置是已知的,因此可以迅速确定特定6-PGD的存在、浓度、和/或表达水平。也就是说,通过应用已知浓度6-PGD的标记标准品,研究者可以准确地确定样品中的6-PGD蛋白质浓度,并能够从该信息评价6-PGD的表达水平。测量密度的常规方法也能够用于更准确地确定6-PGD的浓度或表达水平。应用高通量诊断分析领域技术人员已知的技术可以容易地使这些方法自动化。如前面详细讨论的,本领域已知的任何可设定地址的阵列技术都可以应用于本发明的这一方面,在芯片展示的蛋白质阵列试图使抗体结合模式和诊断信息最大化。
如前面所讨论的,6-PGD中存在或检测到一种或多种多态性可以诊断受试者疾病或显示食物或水源污染。其它实施方式包括制备诊断试剂盒,其中包括检测成分例如特异于一种或多种6-PGD多态性的抗体。提供的检测成分通常将与一种或多种下列试剂组合。通常将提供能够吸附或结合RNA或蛋白质的支持物。可用于这一目的的支持物包括但不限于,硝酸纤维素膜、具有能够负载正电荷取代物阵列功能的尼龙或衍生化尼龙,和GenechipsTM或它们的等价物。试剂盒中可以装入一种或多种酶,例如逆转录酶和/或Taq聚合酶,也可以装入dNTP、缓冲液、或非人多核苷酸例如小牛胸腺或鲑鱼精子DNA。试剂盒分析出的结果可以由卫生保健人员或诊断实验室分析。或者,生产诊断试剂盒,然后出售给私人个体用于自我诊断。
下文实施例1描述了一种方法,该方法可用于鉴定rfb/gnd基因簇中具有多态性的其它区域,这些多态性可用于鉴别和区分大肠杆菌菌株。
实施例1
参考图3,应用限制图谱和PCR克隆技术可以发现gnd基因座旁侧的判别序列。如图3所示,限制性位点“A”在“B-G”片段中(即“A1、A2、和A3”),定义如下。“B”对应病原性或抗原性岛的左手边界,“G”对应该该元件的右手边界。“A1”是A位点到B左侧的第一个限制性位点,“A2”是A位点到G右侧的第一个限制性位点。如果B-G片段的序列是已知的,例如gnd,该序列旁侧的BG岛可以应用反向PCR确定。引物“C”、“D”、“E”、和“F”来源于独特的病原性/抗原性岛的序列。实际序列来源于原始数据,按照5’到3’方向描述,如图3中下划线部分所示。引物是同向的(引物D、引物F)或者反向的(引物C和引物E)。
接下来,用酶A彻底消化大肠杆菌DNA。然后加入连接酶,使得到的片段重新环化。在含有热稳定聚合酶和PCR的不同试管中加入引物,进行PCR得到扩增子。克隆和测序扩增子。该方法鉴定了已知病原性/抗原性岛的5’和3’端之外的序列,用来源于这些序列的引物扩增各种病原体和非-病原体的该区,如对gnd等位基因进行的操作那样。然后对得到的扩增子测序,以鉴定分化的多态性。
虽然参考实施方式和实施例描述了本发明,应当理解在不偏离本发明实质的情况下可以进行各种修改。因此,本发明仅通过所附的权利要求来限定。本发明引证的所有参考文献作为参考特别地插入。

Claims (28)

1.一种编码gnd的分离的多核苷酸,其中该多核苷酸包括SEQ IDNos:22、16、18、24、26、20、42、28、30、40、32、36、38、和34之一的序列。
2.权利要求1的分离的多核苷酸,其中该多核苷酸包括SEQ ID Nos:22、16、18、24、26、20、42、28、30、40、32、36、38、和34之一序列的至少9个连续碱基,并含有一种表1中描述的多态性。
3.权利要求1的分离的多核苷酸,其中多核苷酸编码一种由SEQ IDNos:22、16、18、24、26、20、42、28、30、40、32、36、38、和34之一序列推断出的多肽。
4.权利要求1的分离的多核苷酸,其中该多核苷酸包括与SEQ IDNos:22、16、18、24、26、20、42、28、30、40、32、36、38、和34之一序列或它们的一个互补序列的核苷酸序列在下列条件下杂交的至少9个碱基,杂交条件为:7%十二烷基磺酸钠(SDS),0.5M NaPO4 pH7.0,0.1mM EDTA,50℃;并用1%SDS在42℃清洗。
5.一种重组构建体,它含有可操纵地连接于一种异源启动子的SEQID Nos:22、16、18、24、26、20、42、28、30、40、32、36、38、和34之一的序列。
6.一种含有权利要求1的分离的DNA的载体。
7.一种含有权利要求2的分离的DNA的载体。
8.一种检测编码6-PGD的基因中的多态性的方法,包括:
取得含多核苷酸的生物样品;和
分析该生物样品是否存在具有至少一种表1描述的多态性的诊断性多核苷酸。
9.权利要求8的方法,其中该多态性是C653T或G653C。
10.权利要求8的方法,其中对生物样品的分析进一步包括DNA扩增步骤。
11.一种鉴定病原性或非-病原性大肠杆菌的方法,包括:
取得含多核苷酸的生物样品;
分析该生物样品是否存在具有至少一种表1描述的多态性的诊断性多核苷酸;和
基于至少一种表1描述的多态性是否存在,鉴定大肠杆菌为病原性或非-病原性菌株。
12.权利要求11的方法,其中多态性是C653T或G653C。
13.权利要求11的方法,其中对生物样品的分析进一步包括DNA扩增步骤。
14.一种分离的蛋白质,包括SEQ ID Nos:23、17、19、25、27、21、43、29、31、41、33、37、39、和35的序列。
15.一种分离的多肽,包括SEQID Nos:23、17、19、25、27、21、43、29、31、41、33、37、39、和35之一序列的至少3个连续的氨基酸,其中所述多肽含有至少一种可由表1推断出的多态性。
16.一种制各6-PGD蛋白的方法,包括:
获得含有SEQ ID Nos:22、16、18、24、26、20、42、28、30、40、32、36、38、和34之一序列的cDNA;
将所述cDNA插入表达载体,使cDNA可操纵地连接于启动子;和
将所述表达载体导入宿主细胞,由此宿主细胞产生由所述cDNA编码的蛋白质。
17.权利要求16的方法,进一步包括分离蛋白质。
18.一种构建转化的宿主细胞的方法,该宿主细胞表达SEQ IDNos:23、17、19、25、27、21、43、29、31、41、33、37、39、和35之一的序列,包括用适合基因表达的重组DNA载体转化宿主细胞。
19.一种含有权利要求6的载体的培养细胞系。
20.一种含有权利要求7的载体的培养细胞系。
21.一种分离的抗体,它能够特异性结合具有SEQ ID Nos:23、17、19、25、27、21、43、29、31、41、33、37、39、和35之一序列的蛋白质,其中表位对应于至少一种可由表1推断出的多态性。
22.一种分离的抗体,它能够结合包括SEQ ID Nos:23、17、19、25、27、21、43、29、31、41、33、37、39、和35序列的至少9个连续氨基酸的多肽,其中表位对应于至少一种可由表1推断出的多态性。
23.权利要求21或22的抗体,其中所述抗体是单克隆抗体。
24.一种用于检测是否存在大肠杆菌O157:H7的核酸探针,其由一种长度至少7个核苷酸的分离的核酸分子构成,所述分离的核酸分子与大肠杆菌O157:H7的gnd的DNA杂交,而不与非H7大肠杆菌O157菌株的gnd的DNA杂交。
25.一种用于检测是否存在大肠杆菌O157:H7的核酸引物,其由一种长度至少7个核苷酸的分离的核酸分子构成,所述分离的核酸分子引导大肠杆菌O157:H7的gnd的DNA,但不引导非H7大肠杆菌O157菌株的gnd的DNA。
26.一种检测样品中是否存在大肠杆菌O157:H7的方法,包括以下步骤:
(a)在杂交条件下,用可选择性地与来自大肠杆菌O157:H7的gnd的核酸序列杂交,而不与来自非H7大肠杆菌O157菌株的gnd的核酸序列杂交的核酸探针,接触所述样品,形成杂交复合物;和
(b)检测形成的所述杂交复合物,作为样品中是否存在大肠杆菌O157:H7的指示。
27.在一种基质上的多个权利要求24的核酸探针。
28.在一种芯片的微阵列中的多个权利要求24的核酸探针。
CN99815683A 1998-12-08 1999-12-08 区分大肠杆菌0157∶h7和其它菌株的多态性位点 Pending CN1333831A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11149398P 1998-12-08 1998-12-08
US60/111,493 1998-12-08

Publications (1)

Publication Number Publication Date
CN1333831A true CN1333831A (zh) 2002-01-30

Family

ID=22338866

Family Applications (1)

Application Number Title Priority Date Filing Date
CN99815683A Pending CN1333831A (zh) 1998-12-08 1999-12-08 区分大肠杆菌0157∶h7和其它菌株的多态性位点

Country Status (10)

Country Link
US (2) US20020150902A1 (zh)
EP (1) EP1147196A4 (zh)
JP (1) JP2002531130A (zh)
KR (1) KR20010090879A (zh)
CN (1) CN1333831A (zh)
AU (1) AU3115300A (zh)
CA (1) CA2352534A1 (zh)
MX (1) MXPA01005728A (zh)
NZ (1) NZ512088A (zh)
WO (1) WO2000034484A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1313477C (zh) * 2004-12-30 2007-05-02 天津生物芯片技术有限责任公司 对大肠杆菌o25型的o-抗原特异的核苷酸
CN102520167A (zh) * 2011-11-15 2012-06-27 吉林出入境检验检疫局检验检疫技术中心 液相芯片检测大肠杆菌o157的方法
CN103468605A (zh) * 2013-08-05 2013-12-25 浙江大学 分离自冷浸田土壤的肠杆菌cj-22及其应用
CN108362629A (zh) * 2018-02-09 2018-08-03 中国计量科学研究院 大肠杆菌o157:h7单个活菌的快速检测方法及试剂盒

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2002349753A1 (en) * 2001-12-03 2003-06-17 Kyowa Hakko Kogyo Co., Ltd. Mutated 6-phosphogluconate dehydrogenase
ATE557090T1 (de) * 2004-05-20 2012-05-15 Aes Chemunex S A Polynukleotide zum nachweis von escherichia coli o157:h7- und escherichia coli o157:nm- verotoxinproduzenten
AR076356A1 (es) * 2009-04-10 2011-06-08 Univ Texas Metodo para identificar los genes fimbria largos polares de las cepas patogenas escherichia coli
WO2011082325A2 (en) 2009-12-31 2011-07-07 Life Technologies Corporation Sequences of e.coli 055:h7 genome
KR101109565B1 (ko) * 2010-06-11 2012-01-31 서울대학교산학협력단 대장균 o157:h7 검출을 위한 배지 조성물
US20140005061A1 (en) * 2012-06-29 2014-01-02 Life Technologies Corporation Compositions and methods for detection of multiple microorganisms

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DK6488D0 (da) 1988-01-07 1988-01-07 Novo Industri As Enzymer
IE61148B1 (en) 1988-03-10 1994-10-05 Ici Plc Method of detecting nucleotide sequences
US5082767A (en) 1989-02-27 1992-01-21 Hatfield G Wesley Codon pair utilization
US5126239A (en) 1990-03-14 1992-06-30 E. I. Du Pont De Nemours And Company Process for detecting polymorphisms on the basis of nucleotide differences
US5288707A (en) 1990-08-13 1994-02-22 Sandoz Ltd. Borolysine peptidomimetics
US5552534A (en) 1991-08-22 1996-09-03 The Trustees Of The University Of Pennsylvania Non-Peptide peptidomimetics
US5474796A (en) * 1991-09-04 1995-12-12 Protogene Laboratories, Inc. Method and apparatus for conducting an array of chemical reactions on a support surface
US5550251A (en) 1991-12-12 1996-08-27 The Trustees Of The University Of Pennsylvania Alicyclic peptidomimetics
JP2534597B2 (ja) 1991-12-27 1996-09-18 財団法人癌研究会 プロ―ブ
GB9214857D0 (en) 1992-07-13 1992-08-26 Medical Res Council Human nucleic acid fragments and their use
CA2106260A1 (en) * 1992-09-17 1994-03-18 Robert M. Kotin Human adeno-associated virus integration site dna and uses thereof
HU219016B (hu) 1992-11-05 2001-01-29 Xyrofin Oy Rekombináns eljárás és gazdasejt xilitol előállítására
US5855885A (en) * 1993-01-22 1999-01-05 Smith; Rodger Isolation and production of catalytic antibodies using phage technology
AU7050994A (en) 1993-06-01 1994-12-20 Scripps Research Institute, The Human mutant tissue factor compositions useful as tissue factor antagonists
US5821231A (en) 1993-12-06 1998-10-13 Cytel Corporation CS-1 peptidomimetics, compositions and methods of using same
IL109943A (en) 1994-06-08 2006-08-01 Develogen Israel Ltd Conformationally constrained backbone cyclized peptide analogs
US5792833A (en) * 1994-12-22 1998-08-11 New England Medical Center Hospitals, Inc. E2 binding proteins
US5817626A (en) 1995-03-14 1998-10-06 Praecis Pharmaceuticals Incorporated Modulators of beta-amyloid peptide aggregation
US5654417A (en) * 1995-04-14 1997-08-05 Children's Hospital And Medical Center Nucleic acid probes for detecting E. coli O157:H7
US5811515A (en) 1995-06-12 1998-09-22 California Institute Of Technology Synthesis of conformationally restricted amino acids, peptides, and peptidomimetics by catalytic ring closing metathesis
US5612473A (en) 1996-01-16 1997-03-18 Gull Laboratories Methods, kits and solutions for preparing sample material for nucleic acid amplification
US5747257A (en) 1996-02-29 1998-05-05 E. I. Du Pont De Nemours And Company Genetic markers and methods for the detection of escherichia coli serotype-0157:H7
US5758293A (en) 1996-03-06 1998-05-26 Motorola Inc. Subscriber unit and delivery system for wireless information retrieval

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1313477C (zh) * 2004-12-30 2007-05-02 天津生物芯片技术有限责任公司 对大肠杆菌o25型的o-抗原特异的核苷酸
CN102520167A (zh) * 2011-11-15 2012-06-27 吉林出入境检验检疫局检验检疫技术中心 液相芯片检测大肠杆菌o157的方法
CN102520167B (zh) * 2011-11-15 2013-12-04 吉林出入境检验检疫局检验检疫技术中心 液相芯片检测大肠杆菌o157的方法
CN103468605A (zh) * 2013-08-05 2013-12-25 浙江大学 分离自冷浸田土壤的肠杆菌cj-22及其应用
CN103468605B (zh) * 2013-08-05 2015-04-22 浙江大学 分离自冷浸田土壤的肠杆菌cj-22及其应用
CN108362629A (zh) * 2018-02-09 2018-08-03 中国计量科学研究院 大肠杆菌o157:h7单个活菌的快速检测方法及试剂盒
CN108362629B (zh) * 2018-02-09 2021-02-05 中国计量科学研究院 大肠杆菌o157:h7单个活菌的快速检测方法及试剂盒

Also Published As

Publication number Publication date
US20080102458A1 (en) 2008-05-01
KR20010090879A (ko) 2001-10-19
NZ512088A (en) 2004-01-30
EP1147196A4 (en) 2002-10-16
CA2352534A1 (en) 2000-06-15
US8597877B2 (en) 2013-12-03
US20020150902A1 (en) 2002-10-17
AU3115300A (en) 2000-06-26
JP2002531130A (ja) 2002-09-24
WO2000034484A1 (en) 2000-06-15
MXPA01005728A (es) 2003-07-14
EP1147196A1 (en) 2001-10-24

Similar Documents

Publication Publication Date Title
Sillanpää et al. Characterization of the collagen-binding S-layer protein CbsA of Lactobacillus crispatus
US8597877B2 (en) Polymorphic loci that differentiate Escherichia coli O157:H7 from other strains
Herzer et al. Phylogenetic distribution of branched RNA-linked multicopy single-stranded DNA among natural isolates of Escherichia coli
CA2391621A1 (en) Novel variants of the human cyp2d6 gene
JPH03503837A (ja) 公衆衛生、医学、および獣医学の実施におけるマイコバクテリアのための診断法およびワクチン
KR20100053564A (ko) 면역원성 폴리펩타이드 및 단일클론 항체
TW201247701A (en) Novel polypeptides and bacteriophages specific to Klebsiella pneumoniae capsular type strains and their applications
JP2010068810A (ja) 単球由来核酸および関連する組成物ならびに方法
JP2004073185A (ja) マイコプラズマ・ジェニタリウムゲノムまたはその断片のヌクレオチド配列およびその使用
KR20130027448A (ko) 갈리박테리움 아나티스로부터의 세포용해 rtx-독소
US9011878B2 (en) Vaccine strains of Brachyspira hyodysenteriae
AU2016377391A1 (en) Triage biomarkers and uses therefor
IL137449A (en) An isolated brucella dna fragment, a recombinant dna construct containing the same and a method for producing brucella peptide
US20040062769A1 (en) Identification of the domain of Plasmodium falciparum erythrocyte membrane protein 1 (PfEMP1) that mediates adhesion to chondroitin sulfate A
CA2718214A1 (en) Detection of bacteria belonging to the genus campylobacter by targeting cytolethal distending toxin
NO346439B1 (en) New reovirus infecting rainbow trout
CN109313182A (zh) 鱼变态反应的抗原
WO2007067803A2 (en) Diagnostic targets against johne's disease
RU2813731C2 (ru) Новый коронавирус рыб
WO1998030699A1 (fr) Polynucleotide codant pour un polypeptide de 27 kd de mycobacteries appartenant au complexe de mycobacterium tuberculosis, application au diagnostic et a la prevention de la tuberculose
CN111440783B (zh) 一种caii的突变体及其应用
Bisma et al. RFLP analysis of flagellin (Fla) gene of Campylobacter jejuni from ovines of Kashmir, India
Samantaray et al. Cloning and cDNA synthesis of PE & PPE gene of Mycobacterium strain H37rv5
RU2397251C1 (ru) Набор для детекции возбудителя легионеллеза в биологическом материале и объектах окружающей среды
Jesenská et al. Mycobacterial haloalkane dehalogenases: cloning, biochemical properties and distribution

Legal Events

Date Code Title Description
C06 Publication
C10 Entry into substantive examination
PB01 Publication
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication