CN1544462A - 奈瑟球菌蛋白质的异源表达 - Google Patents

奈瑟球菌蛋白质的异源表达 Download PDF

Info

Publication number
CN1544462A
CN1544462A CNA2003101028453A CN200310102845A CN1544462A CN 1544462 A CN1544462 A CN 1544462A CN A2003101028453 A CNA2003101028453 A CN A2003101028453A CN 200310102845 A CN200310102845 A CN 200310102845A CN 1544462 A CN1544462 A CN 1544462A
Authority
CN
China
Prior art keywords
protein
present
expression
structural domain
leading peptide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2003101028453A
Other languages
English (en)
Other versions
CN100473663C (zh
Inventor
Mb
M·B·阿科
M·科曼杜西
C·加莱蒂
V·马斯格阿尼
M·M·朱利亚尼
M·皮扎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
GlaxoSmithKline Biologicals SA
GSK Vaccines SRL
Original Assignee
Chrion S P A
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from GB0004695A external-priority patent/GB0004695D0/en
Priority claimed from GB0027675A external-priority patent/GB0027675D0/en
Application filed by Chrion S P A filed Critical Chrion S P A
Publication of CN1544462A publication Critical patent/CN1544462A/zh
Application granted granted Critical
Publication of CN100473663C publication Critical patent/CN100473663C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/02Bacterial antigens
    • A61K39/095Neisseria
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/04Antibacterial agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P37/00Drugs for immunological or allergic disorders
    • A61P37/02Immunomodulators
    • A61P37/04Immunostimulants
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/22Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Neisseriaceae (F)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/689Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for bacteria
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/545Medicinal preparations containing antigens or antibodies characterised by the dose, timing or administration schedule
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/555Medicinal preparations containing antigens or antibodies characterised by a specific combination antigen/adjuvant
    • A61K2039/55505Inorganic adjuvants
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/57Medicinal preparations containing antigens or antibodies characterised by the type of response, e.g. Th1, Th2
    • A61K2039/572Medicinal preparations containing antigens or antibodies characterised by the type of response, e.g. Th1, Th2 cytotoxic response
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/57Medicinal preparations containing antigens or antibodies characterised by the type of response, e.g. Th1, Th2
    • A61K2039/575Medicinal preparations containing antigens or antibodies characterised by the type of response, e.g. Th1, Th2 humoral response
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Immunology (AREA)
  • Analytical Chemistry (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Biophysics (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • Animal Behavior & Ethology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Physics & Mathematics (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Mycology (AREA)
  • Epidemiology (AREA)
  • Oncology (AREA)
  • Communicable Diseases (AREA)
  • Peptides Or Proteins (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

异源表达脑膜炎奈瑟球菌和淋病奈瑟球菌蛋白质的其它和改进的方法。这些方法通常影响表达的水平、纯化的简易性、细胞的定位和/或所表达的蛋白质的免疫特性。

Description

奈瑟球菌蛋白质的异源表达
本申请是题为《奈瑟球菌蛋白质的异源表达》的原中国专利申请01808750.7的分案申请。
                         技术领域
本发明涉及蛋白质表达的领域。具体说,本发明涉及奈瑟球菌(如淋病奈瑟球菌或较佳地为脑膜炎奈瑟球菌)的蛋白质的异源表达。
                         背景技术
国际专利申请WO99/24578、WO99/36544、WO99/57280和WO00/22430公开了脑膜炎奈瑟球菌(Neisseria meningitidis)和淋病奈瑟球菌(Neisseriagonorrhoeae)的蛋白质。这些蛋白质一般是以N-未端GST-融合体或C-未端His-标记融合体在大肠杆菌中表达的(即异源表达),虽然也公开了其它表达系统(包括在天然的奈瑟球菌中的表达)。
本发明的目的是提供这些蛋白质的异源表达的其它或改进方法。这些方法通常影响表达的水平、纯化的简易程度、表达在细胞内定位和/或表达的蛋白质的免疫学特性。
                         发明内容
本文的命名
本文参考在WO99/24578、WO99/36544和WO99/57280中公开的2166个蛋白质序列,并将它们编号为如下的SEQ#:
申请 蛋白质序列  本文的SEQ#
WO99/24578 偶SEQ ID 2-892  SEQ#1-446
WO99/36544 偶SEQ ID 2-90  SEQ#447-491
WO99/57280 偶SEQ ID 2-3020  SEQ#492-2001
偶SEQ ID 3040-3114SEQ ID 3115-3241  SEQ#2002-2039SEQ#2040-2166
除了这种的SEQ#编号外,本文还使用了WO99/24578、WO99/36544和WO99/27280中的命名约定(如WO99/24578和WO99/36544中用的‘ORF4’、‘ORF40’、‘OFR40-1’等;WO99/57280中用的‘m919’、‘g919’和‘a919’等)。
在本文中将Tettelin等[Science(2000)287:1809-1815]中的从NMB0001到NMB2160的2160个蛋白质称为SEQ#2167-4326[参见WO00/66791]。
本文采用的术语“本发明的蛋白质”指包含以下的蛋白质:
(a)SEQ#1-4326中的一个序列;或
(b)与SEQ#1-4326中的一个序列相同的序列;或
(c)SEQ#1-4326中的一个序列的片段。
(b)中的“序列相同性”的程度最好大于50%(如60%、70%、80%、90%、95%、99%或更大)。其包括突变体和等位基因变体[如,参见WO00/66741]。相同性宜用Smith-Waterman同源性搜寻算法确定,如在MPSRCH程序(OxfordMolecular)中执行的,采用参数“缺口罚分(gap open penalty)”为12,“缺口延伸罚分(gap extension penalty)”为1进行缺口仿射搜索。通常,将两种蛋白质之间50%或更高的相同性视为功能等效的指示。
(c)中的“片段”应包含SEQ#1-4326中一个序列的至少n个连续的氨基酸,且根据具体的序列n为7或更高(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100或更高)。较佳地,片段包含SEQ#1-4326中一个序列的表位。优选的片段是在WO00/71574和WO01/04316中公开的那些。
本发明优选的蛋白质是在脑膜炎奈瑟球菌血清群B中发现的。
根据本发明使用的优选蛋白质是血清群B脑膜炎奈瑟球菌菌株2996或菌株394/98(新西兰菌株)。除非特别指出,本文所述的蛋白质是脑膜炎奈瑟球菌菌株2996的蛋白质。但是,应该理解通常本发明并不受菌株的限制。参考具体的蛋白质(如‘287’、‘919’等)可以包括任何菌株的该蛋白质。
非融合表达
在异源表达的第一步骤中,没有使用融合配体,而是使用了天然前导肽(如果存在)。这通常防止了来自融合配体的任何“干扰”,并可能改变异源宿主中的细胞定位和/或翻译后的修饰和/或折叠。
因此,本发明提供了一种异源表达本发明蛋白质的方法,在该方法中(a)没有使用融合配体,并(b)使用了蛋白质的天然前导肽(如果存在)。
该方法通常包括制备表达本发明蛋白质的载体的步骤,这样第一个表达的氨基酸是该蛋白质的第一个氨基酸(甲硫氨酸),且最后一个表达的氨基酸是该蛋白质的最后一个氨基酸(即,在天然STOP密码子前的密码子)。
最好将该方法用于表达使用天然前导肽的如下蛋白质:111、149、206、225-1、235、247-1、274、283、286、292、401、406、502-1、503、519-1、525-1、552、556、557、570、576-1、580、583、664、759、907、913、920-1、936-1、953、961、983、989、Orf4、Orf7-1、Orf9-1、Orf23、Orf25、Orf37、Orf38、Orf40、Orf40.1、Orf40.2、Orf72-1、Orf76-1、Orf85-2、Orf91、Orf97-1、Orf119、Orf143.1、NMB0109和NMB2050。本文蛋白质命名中所用的后缀“L”指用天然前导肽按这种方式的表达。
最好用该方法(不使用融合配体,且不含天然前导肽)表达的蛋白质包括:008、105、117-1、121-1、122-1、128-1、148、216、243、308、593、652、726、926、982、Orf83-1和Orf143-1。
有利地,用这种方法来表达ORF25或ORF40,形成的蛋白质诱导的抗细菌抗体比GST-或His融合体诱导得更好。
这种方法特别适用于表达脂蛋白。
前导肽的替代
在异源表达的第二步骤中,用不同蛋白质的天然前导肽替代本发明蛋白质的天然前导肽。另外,最好不使用融合配体。在异源宿主中使用蛋白质自身的前导肽通常会将蛋白质定位于其‘天然’细胞位置,有时异源宿主不能有效地识别该前导序列。在这种情况下,则可改为使用已知能有效地驱动蛋白质靶向的前导肽。
因此,本发明提供了一种异源表达本发明蛋白质的方法,其中(a)用不同蛋白质的前导肽替代该蛋白质的前导肽,和任选地(b)不使用融合配体。
该方法通常包括如下步骤:获得编码本发明蛋白质的核酸;操作该核酸以除去编码所述蛋白质前导肽的核苷酸,并引入编码不同蛋白质的前导肽的核苷酸。可以将得到的核酸插入表达载体中,或作为表达载体的一部分。表达的蛋白质包含N-未端的替代前导肽,其后为本发明减去前导肽的蛋白质。
前导肽最好为本发明另一蛋白质(如SEQ#1-4326中的一种)的,但也可以是大肠杆菌的蛋白质(如,OmpA前导肽)或胡萝卜软腐欧文氏菌(Erwiniacarotovora)的蛋白质(如PelB前导肽)。
特别有用的置换前导肽是ORF4的前导肽。该前导肽能指导大肠杆菌中的脂质化(lipidation)、改善细胞定位,且其特别适用于表达蛋白质287,919和ΔG287。961的前导肽和N-未端区域也特别有用。
另一种可用的置换前导肽是大肠杆菌OmpA的。该前导肽能指导在大肠杆菌中的膜定位。其特别有利于ORF1的表达,形成的蛋白质比从其自身前导肽融合和表达的蛋白质能诱导更好的抗细菌抗体。
另一种可用的置换前导肽是MKKYLFSAA。它能直接分泌到培养基中,是非常短和有活性。这种前导肽的使用不限于奈瑟球菌蛋白质的表达-可用它来指导任何蛋白质(尤其是细菌蛋白质)的表达。
前导肽的缺失
在异源表达的第三步骤中,删除本发明蛋白质的天然前导肽。另外,不宜使用任何融合配体。
因此,本发明提供了一种异源表达本发明蛋白的方法,其中(a)删除蛋白质的前导肽,和任选地(b)不使用任何融合配体。
该方法通常还包括如下步骤:获得编码本发明蛋白质的核酸;操作该核酸以除去编码所述蛋白质前导肽的核苷酸。可以将得到的核酸插入表达载体中,或作为表达载体的一部分。表达的蛋白质的第一氨基酸是成熟的天然蛋白质的第一氨基酸。
该方法可以提高表达的水平。例如,对蛋白质919而言,删除前导肽时,大肠杆菌中的表达水平高许多。没有前导肽时,表达的提高是由于定位的改变。
该方法还优先用于919、ORF46、961、050-1、760和287的表达。
基于区域的表达
在异源表达的第四步骤中,该蛋白质以结构域表达。这可以与融合系统(如GST或His-标记的融合)联合使用。
因此,本发明提供了一种异源表达本发明蛋白质的方法,其中(a)删除蛋白质的至少一个结构域,和任选地(b)不使用融合配体。
该方法通常还包括如下步骤:获得编码本发明蛋白质的核酸;操作该核酸以除去蛋白质中的至少一个结构域。可以将得到的核酸插入表达载体中,或作为表达载体的一部分。不使用融合配体,表达的蛋白质的第一氨基酸是该蛋白质结构域的第一氨基酸。
通常,用数据库中已知的序列将蛋白质排序,然后确定该蛋白质中显示彼此不同的排序模式的区域,从而将该蛋白质分成概念上的结构域。
最好将该方法用于表达蛋白质287。概念上可以将该蛋白质分成3个结构域,称为A、B和C(见图5)。结构域B与IgA蛋白酶排序很接近,结构域C与运铁蛋白结合的蛋白质排序很接近,而结构域A显示与数据库列不接近。WO00/66741公开了287的多聚体形式的排序。
一旦将蛋白质分区成结构域,就可将它们(a)单独表达(b)以蛋白质的缺失形式表达(如蛋白质ABCD→ABD、ACD、BCD等)、或(c)重排表达(如蛋白质ABC→ACB、CAB等)。这三种策略可与所需的融合配体联合。
还将ORF46分为2个结构域-第一结构域(氨基酸1-433)(在品种和血清群之间很好保守的)和第二结构域(氨基酸433-608)(非很好保守的)。最好删除第二结构域。WO00/66741公开了ORF46的多聚体形式的排序。
还将蛋白质564分成结构域(图8)如具有蛋白质961(图12)和蛋白质502(MC58蛋白质的氨基酸28-167)。
杂交蛋白质
在异源表达的第五步骤中,将本发明的2种或多种(如3、4、5、6或更多)蛋白质表达为单杂交蛋白质。不宜使用非奈瑟球菌融合配体(如GST或聚-His)。
这能提供2个优点。其一,该蛋白质自身可能不稳定或表达很弱,而加入合适的能克服该问题的杂交配体就可协助该蛋白质。其二,简化工业生产-产生两种分开的-有用的蛋白质只需要一次表达和纯化。
因此,本发明提供了同时异源表达两种或多种本发明蛋白质的方法,其中所述的两种或多种本发明的蛋白质是融合的(即,它们是以单多肽链翻译的)。
该方法通常还包括如下步骤:获得编码本发明第一种蛋白质的第一种核酸;制得编码本发明第二种蛋白质的第二种核酸;连接第一和第二核酸。将得到的核酸插入表达载体中,或作为表达载体的一部分。
较佳地,本发明在杂交蛋白质中构成的蛋白质是来源于同一菌株的。
可直接连接杂交体中的融合蛋白;或通过接头肽连接,如通过聚-甘氨酸接头(即,Gn,其中n=3、4、5、6、7、8、9、10或更高);或通过协助克隆的短肽序列连接。显然,不宜将ΔG蛋白质连接于聚-甘氨酸接头的C-未端。
融合的蛋白质可能缺少天然前导肽,或可能包含N-未端融合配体的前导肽序列。
这种方法适用于表达蛋白质orf1,orf25,orf40,Orf46/46.1,orf83,233,287,564,687,741,907,919,953,961和983。
由式NH2-A-B-COOH在下表中以‘X’表示的42个杂交体是优选的:
↓A    B→   ORF46.1     287     741     919     953     961     983
ORF46.1     X     X     X     X     X     X
287     X     X     X     X     X     X
741     X     X     X     X     X     X
919     X     X     X     X     X     X
953     X     X     X     X     X     X
961     X     X     X     X     X     X
983     X     X     X     X     X     X
因此,优选的以杂交体表达的蛋白质是ORF46.1,287,741,919,961和983。它们可以全长形式或聚-甘氨酸缺失(ΔG)形式使用(如ΔG-287、ΔGTbp2、ΔG741、ΔG983等),或以截短形式使用(如Δ1-287、Δ2-287等),或以结构域缺失的形式使用(如287B、287C、287BC、ORF461-433、ORF46433-608、ORF46、961c等)。
特别优选的是:(a)含919和287的杂交蛋白;(b)含953和287的杂交蛋白;(c)含287和ORF46.1的杂交蛋白;(d)含ORF1和ORF46.1的杂交蛋白;(e)含919和ORF46.1的杂交蛋白;(f)含ORF46.1和919的杂交蛋白;(g)含ORF46.1、287和919的杂交蛋白;(h)含919和519的杂交蛋白;和(i)含ORF97和225的杂交蛋白。图14显示了其它实施例。
当使用287时,其优先位于杂交体的C-未端;如果在N-未端使用它,则优先使用287的ΔG形式(如与ORF46.1、919、953或961杂交的杂交体的N-未端)。
当使用287时,其优先为菌株2996或菌株394/98的。
当使用961时,其宜在N-端。可使用961的结构域形式。
WO99/66741公开了ORF46、287、919和953的多聚体形式排序。本发明可以使用这些多聚体形式中的任一形式。
温度
在异源表达的第六个步骤中,低温表达本发明的蛋白质。
表达的奈瑟球菌蛋白(如919)可能对大肠杆菌有毒性,这可以通过在不显现蛋白质毒性的温度时表达该蛋白来避免。
因此,本发明提供了异源表达本发明蛋白质的方法,其中在不显现该蛋白质毒性的温度时进行本发明蛋白质的表达。
优选的温度为约30℃。这特别适用于919的表达。
突变
如上所述,表达的奈瑟球菌蛋白质对大肠杆菌可能有毒性的。通过突变该蛋白以降低或消除毒性来避免这种毒性。特别是,可以使用降低或消除毒性酶活性的突变,较佳地使用定位诱变。
因此在异源表达的第七个步骤中,表达的蛋白质是突变的,以减少或消除毒性。
因此,本发明提供了异源表达本发明蛋白质的方法,其中蛋白质是突变的以降低或消除毒性。
较佳地,该方法适用于蛋白质907、919或922的表达。在907中的优选突变是在Glu-117(如Glu→Gly);在919中的优选突变是在Glu-255(如Glu→Gly)和/或在Glu-323(如Glu→Gly);在922中的优选突变是在Glu-164(如Glu→Gly)、Ser-213(如Ser→Gly)和/或Asn-348(如Asn→Gly)。
其它载体
在异源表达的第八个步骤中,用其它载体表达蛋白质。这可以改进表达收率,例如,或使用已验证用于GMP的质粒。
因此,本发明提供了一种异源表达本发明蛋白质的方法,其中使用其它载体。所述的其它载体最好为pSM214,其无融合配体。可以包含或不包含无前导肽。
这种方法特别适用于蛋白质953。用从pSM214表达的953天然前导肽对953的表达和定位比从pET载体的好得多。
也可将pSM214与以下一起使用:ΔG287、Δ2-287,Δ3-287,Δ4-287,Orf46.1,961L,961,961(MC58),961c-L,919,953和ΔG287-Orf46.1。
其它适合的载体是pET-24b(Novagen;用卡那霉素抗性),而且也不使用融合配体。pET-24b宜与以下一起使用:ΔG287K,Δ2-287K,Δ3-287K,Δ4-287K,Orf46.1,Orf46A-K,961-K(MC58),961a-K,961b-K,961c-K,961c-L-K,961d-K,ΔG287-919-K,ΔG287-Orf46.1-K和ΔG287-961-K。
多聚体形式
在异源表达的第九步中,表达或纯化蛋白质使其接受一种特定的多聚体形式。
这种方法尤其适用于蛋白质953。953的一种特定的多聚体形式(单体形式)的纯化使蛋白质比其它形式(二体形式)具有更大的杀菌活性。
可将蛋白质287和919以二体的形式纯化。
可将蛋白质961以180kDa寡聚形式(如四体)纯化。
脂质化
在异源表达的第十步中,将蛋白质以脂质化的蛋白质表达。
因此,本发明提供了一种异源表达本发明蛋白质的方法,其中蛋白质是以脂化的蛋白质表达的。
这尤其适用于919、287、ORF4、406、576-1和ORF25的表达。WO00/66741公开了919、287和ORF4的多聚体形式。
该方法通常包括使用合适的前导肽而不用N-未端融合配体。
C-未端缺失
在异源表达的第十一步中,使本发明蛋白质的C-未端突变。另外,不宜使用融合配体。
因此,本发明提供了异源表达本发明蛋白质的方法,其中(a)使该蛋白质的C-未端区域突变,并任选地(b)不使用融合配体。
这种方法通常包括如下步骤:获得编码本发明蛋白质的核酸;操作所述的核酸从而使编码蛋白质C-未端部分的核苷酸突变。将得到的核酸插入表达载体中,或作为表达载体的一部分。表达的蛋白质的第一氨基酸为成熟天然蛋白质的第一氨基酸。
这种突变可以是取代、插入或较佳地为缺失。
这种方法能增加表达水平,尤其是蛋白质730、ORF29和ORF46的表达水平。对蛋白质730而言,可以删除约65-214氨基酸的C-未端区域;对ORF46而言,可以删除约175氨基酸的C-未端区域;对ORF29而言,可以删除C-未端以留下约230-370N-未端氨基酸。
前导肽突变
在异源表达的第十二步中,使蛋白质的前导肽突变。这尤其适用于蛋白质919的表达。
因此,本发明提供了一种异源表达本发明蛋白质的方法,其中使蛋白质前导肽突变。
这种方法通常包括如下步骤:获得编码本发明蛋白质的核酸;并操作所述的核酸使前导肽中的核苷酸突变。可将得到的核酸插入表达载体中,或作为表达载体的一部分。
聚-甘氨酸缺失
在异源表达的第十三步中,使野生型序列的聚-甘氨酸段突变。以此提高蛋白质的表达。
聚-甘氨酸段包括序列(Gly)n,其中n≥4(如5、6、7、8、9或更多)。让该段突变以破坏或除去(Gly)n。这可以通过删除(如,CGGGGS→CGGGS、CGGS、CGS或CS),通过替代(如CGGGGS→CGXGGS、CGXXGS→CGXGXS等),和/或缺失(如CGGGGS→CGGXGGS、CGXGGGS等)。
这种方法不局限于奈瑟球菌蛋白-其可用于任何蛋白质(尤其是细菌蛋白)以提高异源表达。然而,对奈瑟球菌蛋白质而言,它特别适用于表达287、741、983和Tbp2。WO00/66741公开了287的多聚体形式的排序。
因此,本发明提供了一种异源表达本发明蛋白质的方法,其中(a)使蛋白质中的聚-甘氨酸段突变。
这种方法通常包括如下步骤:获得编码本发明蛋白质的核酸;和操作所述的核酸使编码蛋白质序列中的聚-甘氨酸段的核苷酸突变。可将得到的核酸插入表达载体中,或作为表达载体的一部分。
相反,可用相反的方法(即引入聚-甘氨酸段)抑制或减少特定异源蛋白质的表达。
异源宿主
虽然本发明蛋白质的表达可以在天然宿主(即天然表达蛋白质的生物)中发生,但本发明用异源宿主。异源宿主可以是原核细胞或真核细胞。最好是大肠杆菌,其它合适的宿主包括枯草杆菌、霍乱弧菌、伤寒沙门氏菌(Salmonella typhi)、鼠伤寒沙门氏菌(Salmonenna typhimurium)、脑膜炎奈瑟球菌、淋病奈瑟球菌、乳糖奈瑟球菌(Neisseria lactamica)、灰色奈瑟球菌(Neisseria cinerea)、分枝杆菌(如结核分枝杆菌(M.tuberculosis)、酵母等。
载体等
如上所述的方法,本发明提供了(a)用于这些方法的核酸和载体;(b)含所述载体的宿主细胞;(c)可用这些方法表达的或可表达的蛋白质;(d)包含这些蛋白质的组合物,其可能适用于疫苗、或例如诊断剂或免疫原性组合物;(e)用作药物(如疫苗)或诊断剂的组合物;(f)这些组合物用于生产(1)治疗或预防奈瑟球菌引起的感染的药物(2)检测奈瑟球菌或由奈瑟球菌引起的抗体存在与否的诊断剂,和/或(3)能产生抗奈瑟球菌抗体的药物;和(g)治疗患者的方法,其包括对该患者施用治疗有效量的这些组合物。
序列
本发明还提供了具有以下实施例中所列出的任何序列的蛋白质或核酸。本发明还提供了具有与这些序列是序列相同性的的蛋白质和核酸。如上所述,“序列相同性”的程度最好大于50%(如60%、70%、80%、90%、95%、99%或更高)。
另外,本发明还提供了能与实施例中公开的核酸杂交的核酸,较佳地在“高度严谨”条件下(如在65℃,0.1×SSC,0.5%SDS溶液中)。
本发明还提供了编码本发明蛋白质的核酸。
还应理解,本发明提供了核酸,所述核酸含有与上述序列互补的序列(例如用于反义或探测目的)。
当然,本发明的核酸可以用多种方法制备(例如,化学合成、从基因组或cDNA文库、或从生物体本身制得等),并可以是各种形式(例如单链、双链、载体、探针等)。
此外,术语“核酸”包括DNA和RNA,以及它们的类似物,如含有修饰骨架的那些类似物,还包括肽核酸(PNA)等。
                             附图说明
图1和2显示用于以异源前导肽表达蛋白质的构建物。
图3显示ORF1的表达数据,图4显示蛋白质961的类似数据。
图5显示蛋白质287的结构域,图6和7显示结构域A中的缺失。
图8显示蛋白质564的结构域。
图9显示由919前导肽驱动的PhoC报道基因,图10显示用前导肽的突变体得到的结果。
图11显示蛋白质730的插入突变体(A:730-C1;B:730-C2)。
图12显示蛋白质961的结构域。
图13显示ΔG蛋白质的SDS-PAGE。点显示主要重组产物。
图14显示本发明的26杂交蛋白。
                             具体实施方式
实施例1-919及其前导肽
脑膜炎奈瑟球菌(血清群B,菌株2996)的蛋白质919具有如下序列:
  1 MKKYLFRAAL  YGIAAAILAA CQSKSIQTFP QPDTSVINGP DRPVGIPDPA
 51 GTTVGGGGAV   YTVVPHLSLP  WHAAQDFAKS LQSFRLGCAN LKNRQGWQDV
101 CAQAFQTPVH   SFQAKQFFER  YFTPWQVAGN GSLAGTVTGY YKPVLKGDDR
151 RTAQARFPIY   GIPDDFISVP  LPAGLRSGKA LVRIRQTGKN SGTIDNTGGT
201 HTADLSRFPI   TARTTAIKGR  FEGSRFLPYH TRNQINGGAL DGKAPILGYA
251 EDPVELFFMH   IQGSGRLKTP  SGKYIRIGYA DKNEHPYVSI GRYMADKGYL
301 KLGQTSMQGI   KAYMRQNPQR  LAEVLGQNPS YIFFRELAGS SNDGPVGALG
351 TPLMGKYAGA   VDRHYITLGA  PLFVATAHPV TRKALNRLIM AQDTGSAIKG
401 AVRVDYFWGY   GDEAGELAGK  QKTTGYVWQL LPNGMKPEYR P*
在前导肽下加下划线。
可以在WO00/66741的图7和18中发现其它菌株的919序列。
WO99/57280的实施例2公开了在大肠杆菌中作为His-融合体的蛋白质919的表达。该蛋白质是优良的外露表面免疫原。
将另三种表达方法用于919:
1)919没有其前导肽(且没有成熟的N-未端半胱氨酸)且无任何融合配体(′919未标记的):
  1  QSKSIQTFP QPDTSVINGP DRPVGIPDPA GTTVGGGGAV YTVVPHLSLP
 50 HWAAQDFAKS LQSFRLGCAN LKNRQGWQDV CAQAFQTPVH SFQAKQFFER
100 YFTPWQVAGN GSLAGTVTGY YEPVLKGDDR RTAQARFPIY GIPDDFISVP
150 LPAGLRSGKA LVRIRQTGKN SGTIDNTGGT HTAKLSRFPI TARTTAIKGR
200 FEGSRFLPYH TRNQINGGAL DGKAPILGYA EDPVELFFMH IQGSGRLKTP
250 SGKYIRIGYA DKNEHPYVSI GRYMADKGYL KLGQTSMQGI KAYMRQNPQR
300 LAEVLGQNPS YIFFRELAGS SNDGPVGALG TPLMGEYAGA VDRHYITLGA
350 PLFVATAHPV TRKALNRLIM AQDTGSAIKG AVRVDYFWGY GDEAGELAGK
400 QKTTGYVWQL LPNGMKPEYR P*
通过设计从预定的前导序列的5′-端扩增引物下游除去前导肽和半胱氨酸。
2)包含其前导肽但无任何融合配体的919(‘919L′);和
3)包含ORF4的前导肽(MKTFFKTLSAAALALILAA)的919(‘919Orf4′)。
  1  MKTFFKTLS  AAALALILAA CQSKSIQTFP QPDTSVINGP DRPVGIPDPA
 50 GTTVGGGGAV   YTVVPELSLP  HWAAQDFAKS LQSFRLGCAN LKNRQGWQDV
100 CAQAFQTPVH   SFQAKQFFER  YFTPWQVAGN GSLAGTVTGY YEPVLKGDDR
150 RTAQARFPIY   GIPDDFISVP  LPAGLRSGKA LVRIRQTGKN SGTIDNTGGT
200 HTADLSRFPI   TARTTAIKGR  FEGSRFLPYH TRNQINGGAL DGKAPILGYA
250 EDPVKLFFMH   IQGSGRLKTP  SGKYIRIGYA DKNEHPYVSI GRYNADKGYL
300 KLGQTSMQGI   KSYMRQNPQR  LAEVLGQNPS YIFFRELAGS SNDGPVGALG
350 TPLMGEYAGA   VDRHYITLGA  PLFVATAHPV TRKALNRLIM AQDTGSAIKG
400 ARRVDYFWGY   GDEAGELAGK  QKTTGYVWQL LPNGMKPEYR P*
为了制备此构建物,编码ORF4前导肽的整个序列作为尾部包括于5′-引物(引物919L或f4For)。用编码ORF4前导序列的序列中的双核苷酸改变产生NheI限制酶切位点(无氨基酸改变),使不同的基因融合于ORF4前导肽序列。在所有的3′-端引物序列中包括终止密码子。
蛋白质的所有三种形式都被表达且可以纯化。
如所示的[3H]-棕榈酸标记的掺入,将‘919L′和‘919Orf4′表达产物脂化。919未标记的不掺入3H标记,且是在细胞内定位的。
与919L相比,919Lorf4更易纯化。将其纯化并用于免疫接种小鼠。得到的血清在FACS和ELISA测试以及杀菌试验中产生极佳的结果。该脂蛋白显示位于外膜。
919未标记的具有极佳的ELISA滴定度和高血清杀菌活性。FACS证明了其细胞表明的定位。
实施例2-919和表达温度
于37℃,表达919LOrf4蛋白质的大肠杆菌的生长导致细菌裂解。为了克服这个问题,重组细菌在30℃生长。防止了裂解,而不会制止表达。
实施例3-907、919和922的突变
假设蛋白质907、919和922是胞壁质水解酶和具体说是裂解性转糖基酶。胞壁质裂解酶位于外膜,且参与肽聚糖的降解。
因此测试纯化的蛋白质919未标记的、919Lorf4、919-His(即,包含C-未端His-标记)和922His的胞壁质水解酶活性[Ursinus & Holtje(1994)J.Bact.176:338-343]。使用两种不同的试验,一种用于确定不难溶性胞壁质小囊降解为可溶性胞壁肽的,另一种则是测定聚(MurNAc-GlcNAc)n>30聚糖链的断裂。
第一种试验使用由内消旋-2,6-二氨基-3,4,5-[3H]庚二酸放射标记的胞壁质小囊作为底物。于37℃,在总体积为100μl(包括10mM Tris-马来酸盐(pH5.5)、10mM MgCl2、0.2%v/v Triton X-100和[3H]A2pm标记的胞壁质小囊(约10000cpm))中培养酶(总共3-10μg)45分钟。将试验混合物置于冰上15分钟,在100μl 1%w/v N-乙酰基-N,N,N-三甲铵上15分钟,从10000g离心15分钟沉淀物质。用液体闪烁计数测定上清液中的放射活性。用大肠杆菌可溶性裂解性转糖基酶Slt70作为试验的阳性对照;阴性对照包括不含酶的上述试验溶液。
在第一个试验中,除919-His以外所有蛋白质都产生阳性结果。
第二种试验监测聚(MurNAc-GlcNAc)聚糖链的水解。于37℃,在10mMTris-马来酸盐(pH5.5)、10mM MgCl2和0.2%v/v Triton X-100中,将N-乙酰基-D-1-[3H]葡糖胺标记的纯化的链聚(MurNAc-GlcNAc)n>30与3μg 919L一起培育。煮沸5分钟终止反应,加入10μl 20%v/v磷酸将样品的pH调节至约3.5。如Harz等[Anal.Biochem.(1990)190:120-128]所述,在Nucleosil 300 C18柱上通过反相HPLC将底物与产物分开。在本试验中将大肠杆菌裂解性转糖基酶Mlt A作为阳性对照。无酶进行的试验作为阴性对照。
当用HPLC将无水双糖亚基从寡糖中分开时,用这种试验证明了919LOrf4水解分离的聚糖链的能力。
选择蛋白质919Lorf4用于动力学分析。在试验缓冲液中添加的0.2%v/vTriton X-100使919Lorf4的活性提高3.7倍。Triton X-100的存在对919未标记的活性没有影响。在范围为5.0-8.0的Tris-马来酸盐缓冲液中测定了pH对酶活性的影响。反应的最适pH为5.5。在18℃到42℃的温度范围中,在37℃观察到最大活性。在终浓度为10mM的各种离子的存在下进行反应,以测定各种离子对胞壁质水解酶活性的影响。发现存在Mg2+时活性最高,其刺激活性2.1倍。Mn2+和Ca2+还刺激酶活性至类似程度,而添加Ni2+和EDTA没有明显作用。相反,Fe2+和Zn2+显著抑制酶活性。
如Glauner[Anal.Biochem.(1988)172:451-464]所述,用反相HPLC分析由消化未标记的大肠杆菌胞壁质小囊得到的反应产物的结构。用由溶菌酶Cellosyl消化的胞壁质小囊来校准和标定Hypersil ODS柱。主要的反应产物是1,6-脱水双糖四和三肽,表明1,6-无水胞壁质酸(muraminic)分子内键的形成。
这些结果从实验角度表明,919是胞壁质水解酶,尤其是裂解性转糖基酶家族的成员。另外,922-His裂解胞壁质小囊的能力表明该蛋白质也是裂解性转糖基酶。
这种活性可有助于解释919在大肠杆菌内表达时的毒性作用。
为了消除酶促活性,使用合理的诱变。907、919和922显示对大肠杆菌的三种膜-结合的、脂化的胞壁质裂解性转糖基酶的相当低的同源性:
919(441aa)与大肠杆菌MLTA(P46885)为27.3%相同,超过440aa重叠;
922(369aa)与大肠杆菌MLTB(P41052)为38.7%相同,超过310aa重叠;和
907-2(207aa)与大肠杆菌MLTC(P52066)为26.8%相同,超过149aa重叠。
907-2还与大肠杆菌MLTD(P23913)和Slt70(P03810)具有同源性,它是一种位于周质间隙中的可溶性裂解性转糖基酶。在919、922和907-2之间没有测出明显的序列同源性,且在相应的MLTA、MLTB和MLTC蛋白质之间的情况也同样如此。
Slt70([1QTEA;1QTEB;Thunnissen等(1995)Biochemistry 34:12729-12737]和Slt35[1LTM;1QUS;1QUT;van Asselt等(1999)Structure Fold Des 7:1167-80](40kDa MLTB的可溶形式)可有晶体结构。
已鉴定了Slt70和MLTB的催化残基一种(谷氨酸)。
对Slt70而言,诱变研究表明即使用谷氨酰胺保守性地替代催化Glu505也会导致酶活性的完全丧失。虽然Slt35与Slt70没有明显的序列相似性,但它们的催化区域却显示出令人惊讶的相似性。MLTB中相应的催化残基是Glu162。
另一个被认为在酶裂缝的正确折叠中起重要作用的残基是谷氨酸的保守良好的甘氨酸(Gly)下游。最近,Terrak等[Mol.Microbiol.(1999)34:350-64]提出存在另一种重要的残基,它是位于催化性谷氨酸约70-75残基下游的芳族氨基酸。
进行Slt70与907-2的序列对比和MLTB与922的序列对比,以鉴定MenB抗原中相应的催化性残基。
催化区域的两个序列对比报道如下:
907-2/Slt70:
922/MLTB
从这些对比得出907-2中相应的催化谷氨酸盐是Glu117,而922中为Glu164。这两种抗原都有下游甘氨酸(在酶裂缝(粗体)折叠中起结构作用),922在约70aa下游(粗体)具有保守的芳族残基。
对蛋白质919而言,对大肠杆菌的同源MLTA没有3D结构,且对可能的催化性残基的了解为零。然而,通过与MLTA的序列对比,预计919中的三个氨基酸为催化残基:
919/MLTA
Figure A20031010284500221
用符号显示三个可能的催化残基:
1)Glu225(MLTA中的Asp),其后为三个保守性甘氨酸(Gly263、Gly265和Gly272)和三个保守性芳族残基(位于约75-77残基下游)。这些下游残基以□显示。
2)Glu323(在MLTA中保守的),其后为2个保守的甘氨酸(Gly347和Gly355)和两个保守的芳族氨基酸(位于84-85残基下游)(Tyr406或Phe407)。用◇显示这些下游残基。
3)Asp362(替代预计的Glu),其后为一个甘氨酸(Gly369)和一个保守的芳族残基(Trp428)。用o显示这些下游残基。
WO00/66741中公开了919的多聚体形式的排序。
基于对催化残基的预测,已产生了919的三种突变体和907的一种突变体,各包含单个氨基取代。用基于PCR的SDM,以甘氨酸残基替代919蛋白质的255位和323位的谷氨酸、362位的天冬氨酸和907蛋白质的117位的谷氨酸。为了达到该目的,设计了包含从Glu或Asp变为Gly密码子的内部引物:
引物 序列 密码子变化
919-E255 for919-E255 rev CGAAGACCCCGTC GgtCTTTTTTTTATGGTGCATAAAAAAAAGacCGACGGGGTCT GAA→Ggt
919-E323 for919-E323 rev AACGCCTCGCC GgtGTTTTGGGTCATTTGACCCAAAACacCGGCGAGGCG GAA→Ggt
919-D362 for919-D362 rev TGCCGGCGCAGTC GgtCGGCACTACATAATGTAGTGCCGacCGACTGCGCCG GAC→Ggt
907-E117 for907-E117 rev TGATTGAGGTG GgtAGCGCGTTCCGGGCGGAACGCGCTacCCACCTCAAT GAA→Ggt
有下划线的核苷酸密码是甘氨酸的,突变的核苷酸为小写字母。
为了产生919-E255、919-E323和919-E362突变体,用20ng pET-LOrf4 DNA作为模板和以下的引物对进行PCR:
1)Orf4L正向/919-E255反向
2)919-E255正向/919L反向
3)Orf4L正向/919-E323反向
4)919-E323正向/919L反向
5)Orf4L正向/919-D362反向
6)919-D362正向/919L反向
用PCR1-2、3-4或5-6的产物作为模板和正向引物以及反向引物(“Orf4L正向”和“919L反向”),进行第二轮PCR。
对于突变体907-E117,用200ng 2996菌株的染色体DNA作为模板和以下的引物对进行PCR:
7)907L正向/907-E117反向
8)907-E117正向/907L反向
用PCR7和8的产物作为模板和寡“907L正向”和“907L反向”作为引物,进行第二轮PCR。
用以下的标准方法加工包含各突变的PCR片段,用NdeI和XhoI限制酶消化并克隆入pET-21b+载体中。用序列分析验证各突变的存在情况。
类似地进行907中的Glu117向Gly的突变,以及922中的残基Glu164、Ser213和Asn348的突变。
919的E255G的突变体显示活性低降50%;E323G突变体显示活性降低70%;E362G突变体显示活性没有降低。
实施例4-多聚体形式
将287-GST、919未标记的和953-His进行凝胶过滤以分析四级结构或制备性目的。用FPLC Superose 12(H/R 10/30)或Superdex 75凝胶过滤柱(Pharmacia)计算天然蛋白质的分子量。用于287、919和953层析的缓冲液分别是50mMTris-HCl(pH8.0)、20mM Bicine(pH8.5)和50mM Bicine(pH8.0)。
另外,各缓冲液包含150-200mM NaCl和10%v/v甘油。用适合的缓冲液透析蛋白质并以200μl体积施用。以0.5-2.0ml/分钟的流速进行凝胶过滤,在280nm监测洗脱物。收集组分,用SDS-PAGE分析。用蓝色葡聚糖2000和分子量标准核糖核酸酶A、胰凝乳蛋白酶A卵清蛋白、白蛋白(Pharmacia)校准柱。由标准的Kav与log Mr的校准曲线计算样品的分子量。凝胶过滤之前,用凝血酶消化287-GST以切割GST组成成分。
287、919和953-His的估计分子量分别为73kDa、47kDa和43kDa。这些结果表明919是单体而287和953主要是天然二聚的。对953-His而言,在凝胶过滤的过程中观察到两个高峰。主峰(80%)代表953的二聚形式,而次峰(20%)则为单体预计的大小。发现953单体形式比二聚形式具有更大的杀菌活性。
实施例5-pSM214和pET-24b载体
由pET载体和pSM214表达了包含天然前导肽而无融合配体的953蛋白质[Velati Bellini等,(1991)J.Biotechnol.18,177-192]。
用大肠杆菌MM294-1菌株作为宿主,以全长基因将953序列克隆入pSM214中。为了实现此目的,用如下引物通过PCR扩增953基因的整个DNA序列(从ATG到终止密码子):
953L for/2 CCG GAATTCTTATGAAAAAAATCATCTTCGCCGC      EcoRI
953L rev/2 GCCC AAGCTTTTATTGTTTGGCTGCCTCGATT        HindIII其分别包含EcoRI和HindIII限制酶切位点。用EcoRI和HindIII消化扩增的片段,并将其与用这两种酶消化的pSM214载体接连。将连接的质粒转化入大肠杆菌MM294-1细胞中(通过37℃,在冰上培育65分钟),并将细菌细胞涂布于包含20μg/ml氯霉素的LB琼脂上。
于37℃,在包含20μg/ml氯霉素的4ml LB肉汤中使重组菌落生长过夜;将细菌细胞离心,提取质粒DNA,并用EcoRI和HindIII限制进行分析。为了分析重组集落表达蛋白质的能力,将它们在包含20μg/ml氯霉素的LB肉汤中培育,并使它们在37℃生长16小时。离心细菌细胞,悬浮于PBS中。用SDS-PAGE和考马斯蓝染色分析蛋白质的表达。
pSM214质粒的表达水平出人意料的高。
用于将序列克隆入pSM-214载体中的寡(核苷酸)如下:
ΔG287(pSM-214) Fwd CCG GAATTCTTATG-TCGCCCGATGTTAAATCGGCGGA EcoRI
Rev GCCC AAGCTT-TCAATCCTGCTCTTTTTTGCCG HindIII
Δ2 287(pSM-214) Fwd CCG GAATTCTTCATG-AGCCAAGATATGGCGGCAGT EcoRI
Rev GCCC AAGCTT-TCAATCCTGCTCTTTTTTGCCG HindIII
Δ3 287(pSM-214) Fwd CCG GAATTCTTATG-TCCGCCGAATCCGCAAATCA EcoRI
Rev GCCC AAGCTT-TCAATCCTGCTCTTTTTTGCCG HindIII
Δ4 287(pSM-214) Fwd CCG GAATTCTTATG-GGAAGGGTTGATTTGGCTAATG EcoRI
Rev GCCC AAGCTT-TCAATCCTGCTCTTTTTTGCCG HindIII
Orf46.1(pSM-214) Fwd CCG GAATTCTTATG-TCAGATTTGGCAAACGATTCTT EcoRI
Rev GCCC AAGCTT-TTACGTATCATATTTCACGTGCTTC HindIII
ΔG287-Orf46.1(pSM-214) Fwd CCG GAATTCTTATG-TCGCCCGATGTTAAATCGGCGGA EcoRI
Rev GCCC AAGCTT-TTACGTATCATATTTCACGTGCTTC HindIII
919(pSM-214) Fwd CCG GAATTCTTATG-CAAAGCAAGAGCATCCAAACCT EcoRI
Rev GCCC AAGCTT-TTACGGGCGGTATTCGGGCT HindIII
961L(pSM-214) Fwd CCG GAATTCATATG-AAACACTTTCCATCC EcoRI
Rev GCCC AAGCTT-TTACCACTCGTAATTGAC HindIII
961(pSM-214) Fwd CCG GAATTCATATG-GCCACAAGCGACGAC EcoRI
Rev GCCC AAGCTT-TTACCACTCGTAATTGAC HindIII
961cLpSM-214 Fwd CCG GAATTCTTATG-AAACACTTTCCATCC EcoRI
Rev GCCC AAGCTT-TCAACCCACGTTGTAAGGTTG HindIII
961cpSM-214 Fwd CCG GAATTCTTATG-GCCACAAACGACGACG EcoRI
Rev GCCC AAGCTT-TCAACCCACGTTGTAAGGTTG HindIII
953(pSM-214) Fwd CCG GAATTCTTATG-GCCACCTACAAAGTGGACGA EcoRI
Rev GCCC AAGCTT-TTATTGTTTGGCTGCCTCGATT HindIII
如对953L所述,操作、克隆和表达这些序列。
对pET-24载体而言,如以下对pET21所述,克隆这些序列并在pET-24中表达这些蛋白质。pET2具有与pET-21相同的序列,但其具有卡那霉素抗性盒替代氨苄青霉素盒。
用于将序列克隆入pET-24b中的寡核苷酸是:
ΔG287K  Fwd CGCGGATCC GCTAGC-CCCGATGTTAAATCGGC§ NheI
 Rev CCCG CTCGAG-TCAATCCTGCTCTTTTTTGCC* XhoI
Δ2 287K  Fwd CGCGGATCC GCTAGC-CAAGATATGGCGGCAGT§ NheI
Δ3 287K  Fwd CGCGGATCC GCTAGC-GCCAATCCGCAAATCA§ NheI
Δ4 287K  Fwd CGC GCTAGC-GGAAGGGTTGATTTGGCTAATGG§ NheI
Orf46.1K  Fwd GGGAATTC CATATG-GGCATTTCCCGCAAAATATC NdeI
 Rev CCCG CTCGAG-TTACGTATCATATTTCACGTGC XhoI
Orf46AK  Fwd GGGAATTC CATATG-GGCATTTCCCGCAAAATATC NdeI
 Rev CCCG CTCGAG-TTATTCTATGCCTTGTGCGGCAT XhoI
961K(MC58)  Fwd CGCGGATCC CATATG-GCCACAAGCGACGACGA NdeI
 Rev CCCG CTCGAG-TTACCACTCGTAATTGAC XhoI
961aK  Fwd CGCGGATCC CATATG-GCCACAAACGACG NdeI
 Rev CCCG CTCGAG-TCATTTAGCAATATTATCTTTGTTC XhoI
961bK  Fwd CGCGGATCC CATATG-AAAGCAAACAGTGCCGAC NdeI
Rev CCCG CTCGAG-TTACCACTCGTAATTGAC XhoI
961cK  Fwd CGCGGATCC CATATG-GCCACAAACGACG NdeI
 Rev CCCG CTCGAG-TTAACCCACGTTGTAAGGT XhoI
961cLK  Fwd CGCGGATCC CATATG-ATGAAACACTTTCCATCC NdeI
 Rev CCCG CTCGAG-TTAACCCACGTTGTAAGGT XhoI
961dK  Fwd CGCGGATCC CATATG-GCCACAAACGACG NdeI
 Rev CCCG CTCGAG-TCAGTCTGACACTGTTTTATCC XhoI
ΔG287-919K  Fwd CGCGGATCC GCTAGC-CCCGATGTTAAATCGGC NheI
 Rev CCCG CTCGAG-TTACGGGCGGTATTCGG XhoI
ΔG 287-Orf46.1K  Fwd CGCGGATCC GCTAGC-CCCGATGTTAAATCGGC NheI
 Rev CCCG CTCGAG-TTACGTATCATATTTCACGTGC XhoI
ΔG287-961K  Fwd CGCGGATCC GCTAGC-CCCGATGTTAAATCGGC NheI
 Rev CCCG CTCGAG-TTACCACTCGTAATTGAC XhoI
*将该引物用作所有287形式的反向引物。
§与ΔG278K反向引物联用的正向引物。
实施例6-ORF1及其前导肽
预计脑膜炎奈瑟球菌(血清群B,菌株MC58)的ORF1是用作外膜或分泌的蛋白质。其具有如下序列:
   1  MKTTDKRTTE  THRKAPKTGR IRFSPAYLAI  CLSFGILPQA  WAGHTYFGIN
  51 YQYYRDFAEN KGKFAVGAKD IEVYNKKGEL VGKSMTKAPM IDFSVVSRNG
 101 VAALVGDGYI VSVAHNGGYN NVDFGAEGRN PDQHRFTYKI VKRNNYKAGT
 151 KGHPYGGDYH MPRLHKFVTD AEPVEMTSYM DGRKYIDQNN YPDRVRIGAG
 201 RQYWRSDEDE PNNRESSYHI ASAYSWLVGG NTFAQNGSGG GTVNLGSEKI
 251 KHSPYGFLPT GGSFGDSGSP MFIYDAQKQK WLINGVLQTG NPYIGKSNGF
 301 QLVRKDWFYD EIFAGDTHSV FYEPRQNGKY SFNDDNNGTG KINAKHEHNS
 351 LPNRLKTRTV QLFNVSLSET AREPVYHAAG GVNSYRPRLN NGENISFIDE
 401 GKGELILTSN INQGAGGLYF QGDFTVSPEN NETWQGAGVH ISEDSTVTWK
 451 VNGVANDRLS KIGKGTLHVQ AKGENQGSIS VGDGTVILDQ QADDKGKKQA
 501 FSEIGLVSGR GTVQLNADNQ FNPDKLYFGF RGGRLDLNGH SLSFHRIQNT
 551 DEGAMIVNHN QDKESTVTIT GNKDIATTGN NNSLDSKKEI AYNGWFGEKD
 601 TTKTNGRLNL VYQPAAEDRT LLLSGGTNLN GNITQTNGKL FFSGRPTPHA
 651 YNHLNDHWSQ KEGIPRGEIV WDNDWINRTF KAENFQIKGG QAVVSRNVAK
 701 VKGDWHLSNH AQAVFGVAPH QSHTICTRSD WTGLTNCVEK TITDDKVIAS
 751 LTKTDISGNV DLADHAHLNL TGLATLNGNL SANGDTRYTV SHNATQNGNL
 801 SLVGNAQATF NQATLNGNTS ASGNASFNLS DHAVQNGSLT LSGNAKANVS
 851 HSALNGNVSL ADKAVFHFES SRFTGQISGG KDTALHLKDS KWTLPSGTEL
 901 GNLNLDNATI TLNSAYRHDA AGAQTGSATD APRRRSRRSR RSLLSVTPPT
 951 SVESRFNTLT VNGKLNGQGT FRFMSELFGY RSDKLKLAES SEGTYTLAVN
1001 NTGNEPASLE QLTVVEGKDN KPLSENLNFT LQNEHVDAGA WRYQLIRKDG
1051 EFRLHNPVKE QELSDKLGKA EAKKQAEKDN AQSLDALIAA GRDAVEKTES
1101 VAEPARQAGG ENVGIMQAEE EKKRVQADKD TALAKQREAE TRPATTAFPR
1151 ARRARRDLPQ LQPQPQPQPQ RDLISRYANS GLSEFSATLN SVFAVQDELD
1201 RVFAEDRRNA VWTSGIRDTK HYRSQDFRAY RQQTDLRQIG MQKNLGSGRV
1251 GILFSHNRTE NTFDDGIGNS ARLAHGAVFG QYGIDRFYIG ISAGAGFSSG
1301 SLSDGIGGKI RRRVLHYGIQ ARYRAGFGGF GIEPHIGATR YFVQKADYRY
1351 ENVNIATPGL AFNRYRAGIK ADYSFKPAQH ISITPYLSLS YTDAASGKVR
1401 TRVNTAVLAQ DFGKTRSAEW GVNAEIKGFT LSLHAAAAKG PQLEAQHSAG
1451 IKLGYRW*
前导肽是加下划线的。
WO99/55873公开了ORF1的多聚体形式。
已将三种表达策略用于ORF1:
1)使用His标记的ORF1,按照WO99/24578(ORF1-His);
2)包含自身前导肽但无任何融合配体的ORF1(‘ORF1L′);和
3)包含大肠杆菌OmpA的前导肽(MKKTAIAIAVALAGFATVAQA)的ORF1(‘Orf1LOmpA′):
MKKTAIAIAVALAGFATVAQAASAGHTYFGINYQYYRDFAENKGKFAVGAKDIEVYNKKGELVGKSMTKAPMIDFSV
VSRNGVAALVGDQYIVSVAHNGGYNNVDFGAEGRNPDQHRFTYKIVKRNNYKAGTKGHPYGGDYHMPRLHKFVTDAE
PVEMTSYMDGRKYIDQNNYTDRVRIGAGRQYWRSDEDEPNNRESSYHIASAYSWLVGGNTFAQNGSGGGTVNLGSEK
IKHSPYGFLPTGGSFGDSGSPMFIYDAQKQKWLINGVLQTGNPYIGKSNGFQLVRKDWFYDEIFAGDTHSVFYEPRQ
NGKYSFNDDNNGTGKINAKHEHNSLPNRLKTRTVQLFNVSLSETAREPVYHAAGGVNSYRPRLNNGENISFIDEGKG
ELILTSNINQGAGGLYFQGDFTVSPENNETWQGAGVHISEDSTVTWKVNGVANDRLSKIGKGTLHVQAKGENQGSIS
VGDGTVILDQQADDKGKKQAFSEIGLVSGRGTVQLNADNQFNPDKLYFGFRGGRLDLNGHSLSFHRIQNTDEGAMIV
NHNQDKESTVTIIGNKDIATTGNNNSLDSKKEIAYNGWFGEKDTTKTNGRLNLVYQPAAEDRTLLLSGGTNLNGNIT
QTNGKLFFSGRPTPHAYNHLNDHWSQKEGIPRGEIVWDNDWINRTFKAENFQIKGGQAVVSRNVAKVKGDWHLSNHA
QAVFGVAPHQSHTICTRSDWTGLTNCVEKTITDDKVIASLTKTKISGNVDLADHAHLNLTGLATLNGNLSANGDTRY
TVSHNATQNGNLSLVGNAQATFNQATLNGNTSASGNASFNLSDHAVQNGSLTLSGNAKANVSHSALNGNVSLADKAV
FHFESSRFTGQISGGKDTALHLKDSEWTLPSGTELGNLNLDNATITLNSAYRHDAAGAQTGSATDAPRRRSRRSRRS
LLSVTPPTSVESRFNTLTVNGKLNGQGTFRFMSELFGYRSDKLKLAESSEGTYTLAVNNTGNEPASLEQLTVVEGKD
NKPLSENLNFTLQNEHVDAGAWRYQLIRKDGEFRLHNPVKEQELSDKLGKAEAKKQAEKDNAQSLDALIAAGRDAVE
ETESVAEPARQAGGENVGDMQAEEEKKRVQADKDTALAKQREAETRPATTAFPRARRARRDLPQLQPQPQPQPQRDL
ISRYANSGLSEFSSTLNSVFAVQDELDRVFAEDRRNAVWTSGIRDTKHYRSQDFRAYRQQTDLRQIGMQKNLGSGRV
GILFSHNRTENTFDDGIGNSARLAHGAVFGQYGIDRFYIGISAGAGFSSGSLSDGIGGKIRRRVLHYGIQARYRAGF
GGFGIEPHIGATRYFVQKADYRYENVNIATPGLAFNRYRAGIKADYSFKPAQHISITPYLSLSYTDAASGKVRTRVN
TAVLAQDFGKTRSAEWGVNAEIKGFTLSLHAAAAKGPQLEAQHSAGIKLGYRW*
为了制备此构建物,用NheI和XhoI限制酶消化克隆pET911LOmpA(见如下),并纯化相应于携带OmpA前导序列的载体的片段(pETLOmpA)。用寡核苷酸ORF1-正向和ORF1-反向(分别包括NheI和XhoI限制性酶切位点)扩增编码成熟蛋白质的ORF1基因,用NheI和XhoI消化并连接到纯化的pETOmpA片段(参见图1)。由NheI位点引入另一AS二肽。
该蛋白质的所有三种形式都被表达。可纯化His-标记的蛋白质,并确证其为表面外露的且可能分泌的(参见图3)。用这种蛋白质免疫接种小鼠,得到的血清在杀菌试验中有极佳的结果。
将ORF1LOmpA作为完整膜纯化,并固定于内膜和外膜。出人意料地,针对ORF1LOmpA产生的血清比那些针对His-标记的蛋白质产生的血清显示更好的ELISA和抗杀菌特性。
在其定位的地方将ORFI1作为外膜纯化。
实施例7-蛋白质911及其前导肽
脑膜炎奈瑟球菌(血清群B,菌株MC58)的蛋白质911具有如下序列:
  1 MKKNILEFWV GLFVLIGAAA VAFLAFRVAG GAAFGGSDKT YAVYADFGDI
 51 GGLKVNAPVK SAGVLBGRVG AIGLDPKSYQ ARVRLDLDGK YQFSSDVSAQ
101 ILTSGLLGEQ YIGLQQGGDT ENLAAGDTIS VTSSAMVLEN LIGKFMTSFA
151 EKNADGGNAE KAAE*
前导肽是加下划线的。
将三种表达策略用于911:
1)包含其自身前导肽但无任何融合配体的911(‘911L′);
2)包含大肠杆菌OmpA的前导肽的911(‘911LOmpA′)。
为了制备该构建物,在5′-引物中包括编码OmpA前导肽的完整序列作为尾(引物911OmpA正向)。在编码OmpA前导肽的序列和编码预计的成熟蛋白质的911基因之间插入NheI限制酶切位点(插入一个氨基酸,一个丝氨酸),使该构建物用于克隆不同的基因下游OmpA前导肽序列。
3)包含胡萝卜软腐欧文氏菌(Erwinia carotovora)PelB的前导肽(MKYLLPTAAAGLLLAAQPAMA)的911(‘911LpelB)。
为了制备该构建物,将5′-端PCR引物设计为前导序列的下游,并包括NcoI限制酶切位点,从而使911直接融合于PelB前导序列;3’-端引物包括终止密码子。所用的表达载体是pET22b+(Novagen),其携带编码PelB前导肽的序列。NcoI位点在PelB序列后引入另一甲硫氨酸。
表达该蛋白质的所有三种形式。用911L的ELISA滴定度最高,919LOmpA也有良好的结果。
实施例8-ORF46
脑膜炎奈瑟球菌(血清群B,菌株2996)的完整ORF46蛋白质具有如下序列:
  1  LGISRKISLI  LSILAVCLPM  HAHASDLAND SFIRQVLDRQ HFEPDGKYHL
 51  FGSRGELAER   SGHIGLGKIQ   SHQLGNLMIQ  QAAIKGNIGY IVRFSDHGHE
101  VHSPFDNHAS   HSDSDEAGSP   VDGFSLYRIH  WDGYEHHPAD GYDGPQGGGY
151  PAPKGARDIY   SYDIKGVAQN   IRLNLTDNRS  TGQRLADRFH NAGSMLTQGV
201  GDGFKRATRY   SPELDRSGNA   AEAFNGTADI  VKNIIGAAGE IVGAGDAVQG
251  ISEGSNIAVM   HGLGLLSTEN   KMARINDLAD  MAQLKDYAAA AIRDWAVQNP
301  NAAQGIEAVS   NIFMAAIPIK   GIGAVRGKYG  LGGITAHPIK RSQMGAIALP
351  KGKSAVSDNF   ADAAYAKYPS   PYHSRNIRSN  LBQRYGKHNI TSSTVPPSNG
401  KNVKLADQRH   PKTGVPFDGK   GFPNFEKHVK  YDTKLDIQEL SGGGIPKAKP
451  VSDAKPRHEV   DRKLNKLTTR   EQVEKNVQEI  RNGNKNSNFS QHAQLEREIN
501  KLKSADEINF   ADGMGKFTDS   MNDKAFSRLV  KSVKENGFTN PVVEYVEING
551  KAYIVRGNNR   VFAAEYLGRI   HELKFKKVDF  PVPNTSWKNP TDVLNESGNV
601  KRPRYRSK*
前导肽是加下划线的。
在WO00/66741中发现有其它菌株的ORF46序列。
已将三种表达策略用于ORF46:
1)包含自身前导肽但无任何融合配体的ORF46(‘ORF46-2L′);
2)不含自身前导肽且无任何融合配体的ORF46(‘ORF46-2′),通过从预计的前导序列设计5′-端扩增引物下游除去前导肽:
  1 SDLANDSFIR QVLDRQHFEP DGKYHLFGSR GELAERSGHI GLGKIQSHQL
 51 GNLMIQQAAI KGNIGYIVRF SDHGHEVHSP FDNHASHSDS DEAGSPVDGF
101 SLYRIHWDGY EHHPADGYDG PQGGGYPAPK GARDIYSYDI KGVAQNIRLN
151 LTDNRSTGQR LADRFENAGS NLTQGVGDGF KRATRYSPEL DRSGNAAEAF
201 NGTADIVKNI IGAAGEIVGA GDAVQGISKG SNIAVMBGLG LLSTKNKMAR
251 INDLADMAQL KDYAAAAIRD WAVQNPNAAQ GIEAVSNIFM AAIPIKGIGA
301 VRGKYGLGGI TAHPIKRSQM GAIALPKGKS AVSDNFADAA YAKYPSPYHS
351 RNIRSNLEQR YGKENITSST VPPSNGKNVK LADQRHPKTG VPFDGKGFPN
401 FEKHVKYDTK LDIQELSGGG IPKAKPVSDA KPRMEVDRKL NKLTTREQVE
451 KNVQEIRNGN KNSNFSQHAQ LKREINKLKS ADEINFADGN GKFTDSMNDK
501 AFSRLVKSVK KNGFTNPVVE YVEINGKAYI VRGNNRVFAA EYLGRIHELK
551 FKKVDFPVPN TSWKNPTKVL NESGNVKRPR YRSK*
3)作为一种截短的蛋白质的ORF46,由前433氨基酸构成(‘ORF46.1L′),通过设计PCR引物以扩增相应于aa1-433的部分序列构建。
在3′-端引物序列中包括终止密码子。
对大肠杆菌,ORF46-2L以很低的水平表达。除去它的前导肽(ORF46-2)也不能解决这个问题。然而,截短的ORF46.1L形式(前433个氨基酸,在血清群和品种中很好保守的)能很好地表达,且在ELISA和杀菌试验中得到极佳的结果。
也将ORF46.1用作杂交蛋白的基础。将其与287、919和ORF1融合。通常杂交蛋白是不溶的,但能得到一些良好的ELISA和杀菌(针对同源2996菌株)结果。
       蛋白质    ELISA   杀菌Ab
Orf1-Orf46.1-His     850     256
919-Orf46.1-His     12900     512
919-287-Orf46-His     n.d.     n.d.
Orf46.1-287His     150     8192
Orf46.1-919His     2800     2048
Orf46.1-287-919His     3200     16384
为了比较,构建ORF46.1、287(作为GST融合或以ΔG287形式)的‘三′杂交体,针对各种菌株(包括同源2996菌株)与三种抗原的简单混合物测试。FCA用作佐剂:
2996  BZ232  MC58  NGH38 F6124 BZ133
       混合物 8192  256  512  1024 >2048 >2048
ORF46.1-287-919his 16384  256  4096  8192 8192 8192
ΔG287-919-ORf46.1his 8192  64  4096  8192 8192 16384
ΔG287-ORF46.1-919his 4096  128  256  8192 512 1024
另外,杂交体显示相等的或更佳的免疫活性。
针对各种异源菌株,将两种蛋白质(菌株2996)的杂交体与单种蛋白质进行比较:
1000  MC58 F6124(MenA)
ORF46.1-His <4  4096 <4
ORF1-His 8  256 128
ORF1-ORF46.1-His 1024  512 1024
杂交体再一次显示相等的或更佳的免疫活性。
实施例9-蛋白质961
脑膜炎奈瑟球菌(血清群B,菌株MC58)的完整961蛋白质具有如下序列:
  1 MSMKHFPAKV LTTAILATFC SGALAATSDD DVKKAATVAI VAAYNNGQEI
 51 NGFKAGETIY DIGEDGTITQ KDATAADVEA  DDFKGLGLKK VVTNLTKTVN
101 ENKQNVDAKV KAAESEIEKL TTKLADTDAA  LADTDAALDE TTNALNKLGE
151 NITTFAEETK TNIVKIDEKL EAVADTVDKH  AEAFNDIADS LDETNTKADE
201 AVKTANEAKQ TAEETKQNVD AKVKAAETAA  GKAEAAAGTA NTAADKAEAV
251 AAKVTDIKAD IATNKADIAK NSARIDSLDK  NVANLRKETR QGLAEQAALS
301 GLFQPYNVGR FNVTAAVGGY KSESAVAIGT  GFRFTENFAA KAGVAVGTSS
351 GSSAAYHVGV NYEW*
前导肽是加下划线的。
对961的表达采用如下三种方法:
1)使用GST融合体的961,按照WO99/57280(‘GST961′);
2)包含其自身前导肽但无融合配体的961(‘961L′);和
3)无自身前导肽且不含任何融合配体的961(‘961未标记的′),通过设计从预计的前导序列的5′-端PCR引物下游除去前导肽。
该蛋白质的所有三种形式都被表达。可以纯化GST-融合蛋白,其抗体表明961是表面外露的(图4)。用该蛋白质免疫接种小鼠,得到的血清在杀菌试验中有极佳的结果。也可纯化961L,它产生非常高的ELISA滴定度。
蛋白质961似乎是为相变量。另外,在脑膜炎奈瑟球菌的所有菌株中都没有它。
实施例10-蛋白质287
脑膜炎奈瑟球菌(血清群B,菌株2996)的蛋白质287具有如下序列:
  1 MFERSVIAMA  CIFALSACGG GGGGSPDVKS ADTLSKPAAP VVAEKETEVK
 51 EDAPQAGSQG   QGAPSTQGSQ  DMAAVSAENT GNGGAATTDK PKNEDEGPQN
101 DMPQNSAESA   NQTGNNQPAD  SSDSAPASNP APANGGSNFG RVDLANGVLI
151 DGPSQNITLT   HCKGDSCNGD  NLLDEEAPSK SEFENLNESE RIEKYKKDGK
201 SDKFTNLVAT   AVQANGTNKY  VIIYKDKSAS SSSARFRRSA RSRRSLPAEM
251 PLIPVNQADT   LIVDGEAVSL  TGHSGNIFAP EGNYRYLTYG AEKLPGGSYA
301 LRVQGEPAKG   EMLAGTAVYN  GEVLHFHTEN GRPYPTRGRF AAKVDFGSKS
351 VDGIIDSGDD   LHMGTQKFKA  AIDGNGFKGT WTENGGGDVS GRFYGPAGEE
401 VAGKYSYRPT   DAEKGGFGVF  AGKKEQD*
前导肽是加下划线显示的。
在WO00/66741的图5和15中可以发现其它菌株的287序列。
WO99/57280的实施例9公开了在大肠杆菌中作为GST-融合蛋白的287的表达。
已使用许多其它方法在大肠杆菌中表达287,包括:
1)作为His-标记的融合蛋白的287(‘287-His′);
2)包含其自身前导肽但无任何融合配体的287(‘287L′);
3)包含ORF4前导肽且无任何融合配体的287(‘287LOrf4′);和
4)不含其自身前导肽且无任何融合配体的287(‘287未标记的′):
  1 CGGGGGGSPD VKSADTLSKP AAPVVAEKET EVKEDAPQAG SQGQGAPSTQ
 51 GSQDMAAVSA ENTGNGGAAT TDKPKNEDEG PQNDMPQNSA ESANQTGNNQ
101 PADSSDSAPA SNPAPANGGS NFGRVDLANG VLIDGPSQNI TLTHCKGDSC
151 NGDNLLDEEA PSKSEFENLN ESERIEKYKK DGKSDKFTNL VATAVQANGT
201 NKYVIIYKDK SASSSSARFR RSAFSRRSLP AEMPLIPVNQ QDTLIVDGEA
251 VSLTGHSGNI FAPEGNYRYL TYGAEKLPGG SYALRVQGEP AKGEMLAGTA
301 VYNGEVLHFH TENGPPYPPR GRFAAKVDFG SKSVDGIIDS GDDLHMGTQK
351 FKAAIDGNGF KGTWTENGGG DVSGRFYGPA GEEVAGKYSY RPTDAEKGGF
401 GVFAGKKEQD *
所有这些蛋白质都被表达和纯化。
证明‘287L′和‘287LOrf4′是脂蛋白。
如图2所示,通过用NheI和XhoI消化919LOrf4构建‘287LOrf4′。在5′-端引物(287LOrf正向)(融合于287编码序列)添加编码遗漏氨基酸的DNA序列(作为尾),恢复完整的ORF4前导肽。用寡核苷酸287LOrf4正向和反向(分别包含NheI和XhoI位点)扩增编码成熟蛋白质的287基因,用NheI和XhoI消化并连接于纯化的pETOrf4片段。
实施例11-包含/不含天然前导肽的其它非融合蛋白质
一种类似的方法适用于大肠杆菌表达WO99/24578、WO99/36544和WO99/57280的其它蛋白质。
以下是未用融合配体表达的:008、105、117-1、121-1、122-1、128-1、148、216、243、308、593、652、726、982和Orf143-1。FACS表明蛋白质117-1是表面外露的,且产生高ELISA滴定度。
以下是由天然前导肽但无融合配体表达的:111、149、206、225-1、235、247-1、274、283、286、292、401、406、502-1、503、519-1、525-1、552、556、557、570、576-1、580、583、664、759、907、913、920-1、926、936-1、953、961、983、989、Orf4、Orf7-1、Orf9-1、Orf23、Orf25、Orf37、Orf38、Orf40、Orf40.1、Orf40.2、Orf72-1、Orf76-1、Orf85-2、Orf91、Orf97-1、Orf119、Orf143.1。这些蛋白质都有后缀‘L′。
用或不用其前导肽表达His标记的蛋白质760。信号肽的缺失大大地增加了表达水平。使用2M尿素(用于增溶)最易纯化该蛋白质。
用其自身的信号肽能很好地表达His-标记的蛋白质264,且30kDa蛋白质得到阳性Western印迹结果。
所有蛋白质都成功地表达。
验证了593、121-1、128-1、593、726和982在细胞质中的定位。
验证了920-1L、953L、ORF9-1L、ORF85-2L、ORF97-1L、570L、580L和664L在周质中的定位。
验证了ORF40L在外膜中的定位,和008和519-1L在内膜中的定位。验证了ORF25L、ORF4L、406L、576-1L都是在膜中定位的。
发现蛋白质206不是脂蛋白。
用其天然前导肽但无融合配体表达的ORF25和ORF40,以及未用其天然前导肽和融合配体表达的蛋白质593,都产生良好的抗杀菌血清。令人惊讶地,未用融合配体而使用其前导肽(即‘ORF25L′和‘ORF40L′)表达的ORF25和ORF40形式比融合蛋白在杀菌试验中产生更好的结果。
将蛋白质920L和953L进行N-未端测序,结果分别为HRVWVETAH和ATYKVDEYHANARFAF。此测序结果表明切除了预计的前导肽,且当与周质定位联合时表明:当由它们的天然前导肽表达时,大肠杆菌正确地加工和定位这些蛋白质。
定位于内膜的蛋白质519.1L的N-未端序列是MEFFIILLA,表明未切除前导序列。因此,它可作为未切割的前导序列和跨膜锚(以与淋病奈瑟球菌的PBP1的前导肽类似的方式)[Ropp & Nicholas(1997)J.Bact.179:2783-2787.]。事实上,N-未端区域表现出强疏水性,且由Tmpred.程序预计为跨膜的。
实施例12-脂蛋白
用Kraft等[J.Bact.(1998)180:3441-3447.]的方法验证重组脂蛋白中棕榈酸盐的掺入。于37℃,在20ml LB/Amp(100μg/ml)的液体培养基中使携带感兴趣质粒的单集落生长过夜。在5.0ml含有5μC/ml[3H]棕榈酸盐(Amersham)的新鲜培养基LB/Amp培养基中,将培养物稀释至OD550为0.1。当培养物的OD550达到0.4-0.8时,用IPTG(终浓度为1.0mM)诱导重组脂蛋白1小时。用台式离心机以2700g离心15分钟收获细菌,用1.0ml冷PBS洗涤2次。将细胞悬浮于120μl 20mMTris-HCl(pH8.0)、1mM EDTA、1.0%w/v SDS中,并煮沸10分钟裂解。以13000g离心10分钟后,收集上清液,加入1.2ml冷丙酮沉淀蛋白质,在-20℃静置1小时。以13000g离心10分钟沉淀蛋白质,重悬浮于20-50μl(以培养物终O.D值校准负载量计算的)1.0%w/v SDS。将15μl等份与5μlSDS-PAGE样品缓冲液煮沸,用SDS-PAGE分析。电泳凝胶在10%v/v乙酸中固定1小时后,在扩增溶液(Amersham)中浸泡30分钟。加热真空干燥凝胶,-80℃暴露在Hyperfilm(Kodak)中过夜。
在以下蛋白质中发现[3H]棕榈酸盐标记的掺入(表明脂化):Orf4L、Orf25L、287L、287LOrf4、406L、576L、926L、919L和919LOrf4。
实施例13-287中的结构域
根据287中不同的结构域与隶属不同功能类别的蛋白质的同源性,如图5所示将其分为3个“结构域”。第二个结构显示与IgA蛋白酶同源,第三结构域显示与结合转铁蛋白的蛋白质同源。
在脑膜炎奈瑟球菌之间这三个“结构域”各表现出不同程度的序列保守性-结构域C为98%相同,结构域A为83%相同,而结构域B仅为71%相同。注意到菌株MC58中的蛋白质287比菌株2996的长61个氨基酸。图7显示了这两个序列的序列对比,WO00/66741(图5和15)公开了各种菌株的序列对比。
将这三个结构域分别表达成C-未端His-标记的蛋白质。用以下构建物对MC58和2996菌株进行处理:
287a-MC58(aa1-202),287b-MC58(aa203-288),287c-MC58(aa311-488)。
287a-2996(aa1-139),287b-2996(aa140-225),287c-2996(aa250-427)。
为了制备这些构建物,除去3′-端引物序列中的终止密码子序列。5′引物包括NheI限制酶切位点,3′引物包括作为尾部的XhoI,从而用NdeI-XhoI、NheI-XhoI或NdeI-HindIII限制酶切位点指导将各扩增片段克隆入表达载体pET21b+中。
所有六种构建物都可以表达,但287b-MC8需要变性和重折叠以增溶。
以下描述了结构域A的缺失(‘Δ4 287-His′)。
用菌株2996的各种结构域还获得了针对同源和异源MenB菌株以及MenA(F6124菌株)和MenC(BZ133菌株)的免疫学数据(血清杀菌试验):
2996 BZ232 MC58 NGH38 394/98 MenA MenC
  287-His 32000 16 4096 4096 512 8000 16000
  287(B)-His 256 - - - - 16 -
  287(C)-His 256 - 32 512 32 2048 >2048
  287(B-C)His 64000 128 4096 64000 1024 64000 32000
用菌株MC58的结构域获得以下结果:
MC58 2996 BZ232 NGH38 394/98 MenA MenC
287-His 4096 32000 16 4096 512 8000 16000
287(B)-His 128 128 - - - - 128
287(C)-His - 16 - 1024 - 512 -
287(B-C)-His 16000 64000 128 64000 512 64000 >8000
实施例14-287中的缺失
与表达单一结构域一样,通过在第一结构域中的渐进缺失还表达了287(以C-未端His-标记的蛋白质)。使用菌株2996的蛋白质287的四缺失突变体(图6):
1)‘287-His′,由氨基酸18-427构成(即缺失前导肽);
2)‘Δ1 287-His′,由氨基酸26-427构成;
3)‘Δ2 287-His′,由氨基酸70-427构成;
4)‘Δ3 287-His′,由氨基酸107-427构成;和
5)‘Δ4 287-His′,由氨基酸140-427构成(=287-bc)。
还为菌株MC58制备了‘Δ4′蛋白质(‘Δ4 287MC58-His′,aa203-488)。
如上所述,用与287a/b/c相同的方法制备这些构建物。
可以表达所有六种构建物,并可纯化蛋白质。然而287-His的表达很差。
当除去C-未端His-标记物时,表达也很高。
用缺失突变体也获得了针对同源(2996)和异源MenB菌株以及MenA(F6124菌株)和MenC(BZ133菌株)的免疫学数据(血清杀菌试验):
 2996  BZ232  MC58 NGH38  394/98  MenA MenC
     287-his  32000  16  4096 4096  512  8000 16000
  Δ1 287-His  16000  128  4096 4096  1024  8000 16000
  Δ2 287-His  16000  128  4096 >2048  512  16000 >8000
  Δ3 287-His  16000  128  4096 >2048  512  16000 >8000
  Δ4 287-His  64000  128  4096 64000  1024  64000 32000
用菌株MC58的序列观察到Δ4缺失的相同高的活性。同样显示极佳的表达特性,因此突变体是免疫学相等的或更佳的。
实施例15-聚甘氨酸缺失
前实施例的‘Δ1 287-His′构建物与287-His和′287未标记的′的不同仅在于短的N-未端缺失(GGGGGGS)。然而使用一种以Nhe克隆位点中存在的密码子替代缺失的丝氨酸的表达载体,缺失仅为(Gly)6。因此,该(Gly)6序列的缺失显示对蛋白质表达有明显影响。
将缺失多达GGGGGG的N-未端氨基酸的蛋白质称为‘ΔG287′。在菌株MC58中,其序列(前导序列加下划线)为:
                              
Figure A20031010284500361
ΔG287
  1 MFKRSVIAMA CIFALSACGG GGGGSPDVKS ADTLSKPAAP VVSEKETEAK
 51 EDAPQAGSQG QGAPSAQGSQ  DMAAVSEENT GNGGAVTADN PKNEDEVAQN
101 DMPQNAAGTD SSTPNHTPDP  NMLAGNMENQ ATDAGESSQP ANQPDMANAA
151 DGMQGDDPSA GGQNAGNTAA  QGANQAGNNQ AAGSSDPIPA SNPAPANGGS
201 NFGRVDLANG VLIDGPSQNI  TLTHCKGDSC SGNNFLDEEV QLKSEFERLS
251 DADKISNYKK DGKNDKFVGL  VADSVQMKGI NQYIIFYKPK PTSFARFRRS
301 ARSRRSLPAE MPLIPVNQAD  TLIVDGEAVS LTGHSGNIFA PEGNYRYLTY
351 GAEKLPGGSY ALRVQGEPAK  GEMLAGAAVY NGEVLHFHTE NGRPYPTRGR
401 FAAKVDFGSK SVDGIIDSGD  DLHMGTQKFK AAIDGNGFKG TWTENGSGDV
451 SGKFYGPAGE EVAGKYSYRP  TDAEKGGFGV FAGKKEQD*
与′287-His′或‘287未标记的′相比,有或无His-标记的ΔG287(分别为‘Δ287-His′和′ΔG287K′)以非常好的水平表达。
以基因变异性数据为基础,许多MenB菌株(尤其是菌株2996、MC58、1000和BZ232)的ΔG287-His的变体在大肠杆菌中表达。结果也非常好。
假设聚-Gly缺失可能是一种改进表达的常规策略。因此鉴定了含有类似(Gly)n基序(接近N-未端,丝氨酸的下游)的其它MenB脂蛋白,称为Tbp2(NMB0460)、741(NMB1870)和983(NMB1969):
TEP2                            
Figure A20031010284500371
ΔGTbp2
  1 MNNPLVNQAA MVLPVFLLSA CLGGGGSFDL DSVDTEAPRP APKYQDVFSE
 51 KPQAQKDQGG YGFAMRLKRR  NWYPQAKEDE VKLDESDWEA TGLPDERKKL
101 PKRQKSVIEK VETDSDNNIY  SSPYLKPSNH QNGNTGNGIN QPKNQAKDYE
151 NFKYVYSGWF YKHAKREFNL  KVEPKSAKNG DDGYIFYHGK EPSRQLPASG
201 KITYKGVWHF ATDTKKGQKF  REIIQPSKSQ GDRYSGFSGD DGEEYSNKNK
251 STLTDGQEGY GFTSNLEVDF  HNKKLTGKLI RNNANTDNNQ ATTTQYYSLR
301 AQVTGNRFNG KATATDKPQQ  NSETKEHPFV SDSSSLSGGF FGPQGEELGF
351 RFLSDDQKVA VVGSAKTKDK  PANGNTAAAS GGTDAAASNG AAGTSSENGK
401 LTTVLDAVEL KLGDKEVQKL  DNFSNAAQLV VDGIMIPLLP EASESGNNQA
451 NQGTNGGTAF TRKFDHTPES  DKKDAQAGTQ TNGAQTASNT AGDTNGKTKT
501 YEVEVCCSNL NYLKYGMLTR  KNSKSAMQAG ESSSQADAKT EQVEQSMFLQ
551 GERTKEKEIP SEQNIVYRGS  WYGYIANDKS TSWSGNASNA TSGNRAEFTV
601 NFADKKITGT LTADNRQEAT  FTIDGNIKDN GFRGTAKTAE SGFDLDQSNT
651 TRTPKAYITD AKVQGGFYGP  KAEELGGWFA YPGDKQTKNA TNASGNSSAT
701 VVFGAKRQQP VR*
741                              ΔG741
  1 VNRTAFCCLS LTTALILTAC SSGGGGVAAD IGAGLADALT APLDEKDKGL
 51 QSLTLDQSVR KNRKLKLAAQ  GARKTYGNGD SLNTGKLKND KVSRFDFIRQ
101 IEVDGQLITL ESGEFQVYKQ  SHSALTAFQT EQIQDSEESG KMVAKRQFRI
151 GDIAGEHTSF DKLPEGGRAT  YRGTAFGSDD AGGKLTYTID FAAKQGNGKI
201 EHLKSPKLNV DLAAADIKPD  GKRHAVISGS VLYNQAEKGS YSLGIFGGKA
251 QEVAGSAEVK TVNGIRHIGL  AAKQ*
983                                          ΔG983
   1 MRTTPTFPTK TFKPTAMALA VATTLSACLG GGGGGTSAPD FNAGGTGIGS
  51 NSRATTAKSA AVSYAGIKNE MCKDRSMLCA  GRDDVAVTDR DAKINAPPPN
 101 LHTGDFPNPN DAYKNLLNLK PAIEAGYTGR  GVEVGIVDTG KSVGSISFPE
 151 LYGRKKHGYN ENYKNYTAYM RKKAPEDGGG  KDIEASFDDE AVIETEAKPT
 201 DIRHVKEIGH IDLVSHIIGG RSVDGRPAGG  IAPDATLHIM NTNDETKNEM
 251 MVAAIRNAWV KLGERGVRIV NNSFGTTSRA  GTADLFQIAN SEEQYRQALL
 301 DYSGGDKTDE GIRLMQQSDY GNLSYHIRNK  NMLFIFSTGN DAQAQPNTYA
 351 LLPFYEKDAQ KGIITVAGVD RSGEKFKREM  YGEPGTKPLE YGSNHCGITA
 401 MWCLSAPYEA SVRFTRTNPI QIAGTSFSAP  IVTGTAALLL QKYPWMSNDN
 451 LRTTLLTTAQ DIGAVGVDSK FGWGLLDAGK  AMNGPASFPF GDFTADTKGT
 501 SDIAYSFRND ISGTGGLIKK GGSQLQLHGN  NTYTGKTIIE GGSLVLYGNN
 551 KSDMRVETKG ALIYNGAASG GSLNSDGIVY  LADTDQSGAN ETVHIKGSLQ
 601 LDGKGTLYTR LGKLLKVDGT AIIGGKLYMS  ARGKGAGYLN STGRRVPFLS
 651 AAKIGQDYSF FTNIETDGGL LASLDSVEKT  AGSEGDTLSY YVRRGNAART
 701 ASAAAHSAPA GLKHAVEQGG SNLENLMVEL  DASESSATPE TVETAAADRT
 751 DMPGIRPYGA TFRAAAAVQH ANAADGVRIF  NSLAATVYAD STAAHADMQG
 801 RRLKAVSDGL DENGTGLRVI AQTQQDGGTM  EQGGVEGKMR GSTQTVGIAA
 851 KTGENTTAAA TLGMGRSTWS ENSANAKTDS  ISLFAGIRHD AGDIGYLKGL
 901 FSYGRYKNSI SRSTGADKHA EGSVNGTLMQ  LGALGGVNVP FAATGDLTVE
 951 GGLRYDLLKQ DAFAEKGSAL GWSGNSLTEG  TLVGLAGLKL SQPLSDKAVL
1001 FATAGVERDL NGRDYTVTGG FTGATAATGK  TGARNMPHTR LVAGLGADVE
1051 FGNGWNGLAR YSYAGSKQYG NGSGRVGVGY  RF*
Tbp2和741基因本源于菌株MC58;983和287基因来源于菌株2996。将它们克隆入pET载体中,并在大肠杆菌中表达而无编码它们前导肽的序列或以‘ΔG形式′(都融合于C-端His-标记)。在这每种情况中,发现相同的作用-在携带聚-甘氨酸段缺失的克隆中很好表达,如果在表达的蛋白质中存在甘氨酸则表达很差或不表达:
ORF                        表达        纯化           细菌活性
287-His(2996)              +/-         +              +
‘287未标记的’2996)        +/-         nd             nd
ΔG287-His(2996)           +           +              +
ΔG287K(2996)              +           +              +
ΔG287-His(MC58)           +           +              +
ΔG287-His(1000)           +           +              +
ΔG287-His(BZ232)          +           +              +
Tbp2-His(MC58)             +/-         nd             nd
ΔGTbp2-His(MC58)          +           +
741-His(MC58)              +/-         nd             nd
ΔG741-His(MC58)           +           +
983-His(2996)
ΔG983-His(2996)           +           +
图13显示了蛋白质的SDS-PAGE。
ΔG287和杂交体
制备和纯化菌株MC58、1000和BZ232的ΔG287蛋白质。它们都产生高ELISA滴定度,且血清杀菌滴定度>8192。由pET-24b表达的ΔG287K在ELISA和血清杀菌试验中的滴定度极佳。也可在pET-24b中表达ΔG287-ORF46.1K。
还将ΔG287直接融合于919、953、961和ORF46.1的符合读框的上游(如下显示的序列):
Δg287-919
   1 ATGGCTAGCC CCGATGTTAA ATCGGCGGAC ACGCTGTCAA AACCGGCCGC
  51 TCCTGTTGTT GCTGAAAAAG AGACAGAGGT AAAAGAAGAT GCGCCACAGG
 101 CAGGTTCTCA AGGAACAGGC GCGCCATCCA CACAAGGCAG CCAAGATATG
 151 GCGGCAGTTT CGGCAGAAAA TACAGGCAAT GGCGGTGCGG CAACAACGGA
 201 CAAACCCAAA AATGAAGACG AGGGACCGCA AAATGATATG CCGCAAAATT
 251 CCGCCGAATC CGCAAATCAA ACAGGGAACA ACCAACCCGC CGATTCTTCA
 301 GATTCCGCCC CCGCGTCAAA CCCTGCACCT GCGAATGGCG GTAGCAATTT
 351 TGGAAGGGTT GATTTGGCTA ATGGCGTTTT GATTGATGGG CCGTCGCAAA
 401 ATATAACGTT GACCCACTGT AAAGGCGATT CTTGTAATGG TGATAATTTA
 451 TTGGATGAAG AAGCACCGTC AAAATCAGAA TTTGAAAATT TAAATGAGTC
 501 TGAACGAATT GAGAAATATA AGAAAGATGG GAAAAGCGAT AAATTTACTA
 551 ATTTGGTTGC GACAGCAGTT CAAGCTAATG GAACTAACAA ATATGTCATC
 601 ATTTATAAAG ACAAGTCCGC TTCATCTTCA TCTGCGCGAT TCAGGCGTTC
 651 TGCACGGTCG AGGAGGTCGC TTCCTGCCGA GATGCCGCTA ATCCCCGTCA
 701 ATCAGGCGGA TACGCTGATT GTCGATGGGG AAGCGGTCAG CCTGACGGGG
 751 CATTCCGGCA ATATCTTCGC GCCCGAAGGG AATTACCGGT ATCTGACTTA
 801 CGGGGCGGAA AAATTGCCCG GCGGATCGTA TGCCCTCCGT GTGCAAGGCG
 851 AACCGGCAAA AGGCGAAATG CTTGCTGGCA CGGCCGTGTA CAACGGCGAA
 901 GTGCTGCATT TTCATACGGA AAACGGCCGT CCGTACCCGA CTAGAGGCAG
 951 GTTTGCCGCA AAAGTCGATT TCGGCAGCAA ATCTGTGGAC GGCATTATCG
1001 ACAGCGGCGA TGATTTGCAT ATGGGTACGC AAAAATTCAA AGCCGCCATC
1051 GATGGAAACG GCTTTAAGGG GACTTGGACG GAAAATGGCG GCGGGGATGT
1101 TTCCGGAAGG TTGGACGGCC CGGCCGGCGA GGAAGTGGCG GGAAAATACA
1151 GCTATCGCCC GACAGATGCG GAAAAGGGCG GATTCGGCGT GTTTGCCGGC
1201 AAAAAAGAGC AGGATGGATC CGGAGGAGGA GGATGCCAAA GCAAGAGCAT
1251 CCAAACCTTT CCGCAACCCG ACACATCCGT CATCAACGGC CCGGACCGGC
1301 CGGTCGGCAT CCCCGACCCC GCCGGAACGA CGGTCGGCGG CGGCGGGGCC
1351 GTCTATACCG TTGTACCGCA CCTGTCCCTG CCCCACTGGG CGGCGCAGGA
1401 TTTCGCCAAA AGCCTGCAAT CCTTCCGCCT CGGCTGCGCC AATTTGAAAA
1451 ACCGCCAAGG CTGGCAGGAT GTGTGCGCCC AAGCCTTTCA AACCCCCGTC
1501 CATTCCTTTC AGGCAAAACA GTTTTTTGAA CGCTATTTCA CGCCGTGGCA
1551 GGTTGCAGGC AACGGAAGCC TTGCCGGTAC GGTTACCGGC TATTACGAGC
1601 CGGTGCTGAA GGGCGACGAC AGGCGGACGG CACAAGCCCG CTTCCCGATT
1651 TACGGTATTC CCGACGATTT TATCTCCGTC CCCCTGCCTG CCGGTTTGCG
1701 GAGCGGAAAA GCCCTTGTCC GCATCCAGGA GACGGGAAAA AACAGCGGCA
1751 CAATCGACAA TACCGGCGGC ACACATACCG CCGACCTCTC CCGATTCCCC
1801 ATCACCGCGC GCACAACGGC AATCAAAGGC AGGTTTGAAG GAAGCCGCTT
1851 CCTCCCCTAC CACACGCGCA ACCAAATCAA CGGCGGCGCG CTTGACGGCA
1901 AAGCCCCGAT ACTCGGTTAC GCCGAAGACC CCGTCGAACT TTTTTTTATG
1951 CACATCCAAG GCTCGGGCCG TCTGAAAACC CCGTCCGGCA AATACATCCG
2001 CATCGGCTAT GCCGACAAAA ACGAACATCC CTACGTTTCC ATCGGACGCT
2051 ATATGGCGGA CAAAGGCTAC CTCAAGCTCG GGCAGACCTC GATGCAGGGC
2101 ATCAAAGCCT ATATGCGGCA AAATCCGCAA CGCCTCGCCG AAGTTTTGGG
2151 TCAAAACCCC AGCTATATCT TTTTCCGCGA GCTTGCCGGA AGCAGCAATG
2201 ACGGTCCCGT CGGCGCACTG GGCACGCCGT TGATGGGGAA ATATGCCGGC
2251 GCAGTCGACC GGCACTACAT TACCTTGGGC GCGCCCTTAT TTGTCGCCAC
2301 CGCCCATCCG GTTACCCGCA AAGCCCTCAA CCGCCTGATT ATGGCGCAGG
2351 ATACCGGCAG CGCGATTAAA GGCGCGGTGC GCGTGGATTA TTTTTGGGGA
2401 TACGGCGACG AAGCCGGCGA ACTTGCCGGC AAACAGAAAA CCACGGGTTA
2451 CGTCTGGCAG CTCCTACCCA ACGGTATGAA GCCCGAATAC CGCCCGTAAC
2501 TCGAG
   1 MASPDVKSAD TLSKPAAPVV AEKETEVKED APQAGSQGQG APSTQGSQDM
  51 AAVSAENTGN GGAATTDKPK NEDEGPQNDM PQNSAESANQ TGNNQPADSS
 101 DSAPASNPAP ANGGSNFGRV DLANGVLIDG PSQNITLTHC KGDSCNGDNL
 151 LDEEAPSKSE FKNLNESERI EKYKKDGKSD KFTNLVATAV QANGTNKYVI
 201 IYKDKSASSS SARFRRSARS RRSLPAEMPL IPVNQADTLI VDGEAVSLTG
 251 HSGNIFAPEG NYRYLTYGAE KLPGGSYALR VQGEPAKGEM LAGTAVYNGE
 301 VLHFHTENGR PYPTRGRFAA KVDFGSKSVD GIIDSGDDLH MGTQKFKAAI
 351 DGNQFKGTWT ENGGGDVSGR FYGPAGEEVA GKYSYRPTDA EKGGFGVFAG
 401 KKEQDGSGGG GCQSKSIQTF PQPDTSVING PDRPVGIPDP AGTTVGGGGA
 451 VYTVVPHLSL PHWAAQDFAK SLQSFRLGCA NLKNRQGWQD VCAQAFQTPV
 501 HSFQAKQFFE RYFTPWQVAG NGSLAGTVTG YYEPVLKGDD RRTAQARFPI
 551 YGIPDDFISV PLPAGLRSGK ALVRIRQTGK NSGTIDNTGG THTADLSRFP
 601 ITARTTAIKG RFEGSRFLPY HTRNQINGGA LDGKAPILGY AEDPVELFFM
 651 HIQGSGRLKT PSGKYIRIGY ADKNEHPYVS IGRYMADKGY LKLGQTSMQG
 701 IKAYMRQNPQ RLAEVLGQNP SYIFFRELAG SSNDGPVGAL GTPLMGEYAG
 751 AVDRHYITLG APLFVATAHP VTRKALNRLI MAQDTGSAIK GAVRVDYFWG
 801 YGDEAGELAG KQKTTGYVWQ LLPNGMKPEY RP*
ΔG287-953
   1 ATGGCTAGCC CCGATGTTAA ATCGGCGGAC ACGCTGTCAA AACCGGCCGC
  51 TCCTGTTGTT GCTGAAAAAG AGACAGAGGT AAAAGAAGAT GCGCCACAGG
 101 CAGGTTCTCA AGGACAGGGC GCGCCATCCA CACAAGGCAG CCAAGATATG
 151 GCGGCAGTTT CGGCAGAAAA TACAGGCAAT GGCGGTGCGG CAACAACGGA
 201 CAAACCCAAA AATGAAGACG AGGGACCGCA AAATGATATG CCGCAAAATT
 251 CCGCCGAATC CGCAAATCAA ACAGGGAACA ACCAACCCGC CGATTCTTCA
 301 GATTCCGCCC CCGCGTCAAA CCCTGCACCT GCGAATGGCG GTAGCAATTT
 351 TGGAAGGGTT GATTTGGCTA ATGGCGTTTT GATTGATGGG CCGTCGCAAA
 401 ATATAACGTT GACCCACTGT AAAGGCGATT CTTGTAATGG TGATAATTTA
 451 TTGGATGAAG AAGCACCGTC AAAATCAGAA TTTGAAAATT TAAATGAGTC
 501 TGAACGAATT GAGAAATATA AGAAAGATGG GAAAAGCGAT AAATTTACTA
 551 ATTTGGTTGC GACAGCAGTT CAAGCTAATG GAACTAACAA ATATGTCATC
 601 ATTTATAAAG ACAAGTCCGC TTCATCTTCA TCTGCGCGAT TCAGGCGTTC
 651 TGCACGGTCG AGGAGGTCGC TTCCTGCCGA GATGCCGCTA ATCCCCGTCA
 701 ATCAGGCGGA TACGCTGATT GTCGATGGGG AAGCGGTCAG CCTGACGGGG
 751 CATTCCGGCA ATATCTTCGC GCCCGAAGGG AATTACCGGT ATCTGACTTA
 801 CGGGGCGGAA AAATTGCCCG GCGGATCGTA TGCCCTCCGT GTGCAAGGCG
 851 AACCGGCAAA AGGCGAAATG CTTGCTGGCA CGGCCGTGTA CAACGGCGAA
 901 GTGCTGCATT TTCATACGGA AAACGGCCGT CCGTACCCGA CTAGAGGCAG
 951 GTTTGCCGCA AAAGTCGATT TCGGCAGCAA ATCTGTGGAC GGCATTATCG
1001 ACAGCGGCGA TGATTTGCAT ATGGGTACGC AAAAATTCAA AGCCGCCATC
1051 GATGGAAACG GCTTTAAGGG GACTTGGACG GAAAATGGCG GCGGGGATGT
1101 TTCCGGAAGG TTTTACGGCC CGGCCGGCGA GGAAGTGGCG GGAAAATACA
1151 GCTATCGCCC GACAGATGCG GAAAAGGGCG GATTCGGCGT GTTTGCCGGC
1201 AAAAAAGAGC AGGATGGATC CGGAGGAGGA GGAGCCACCT ACAAAGTGGA
1251 CGAATATCAC GCCAACGCCC GTTTCGCCAT CGACCATTTC AACACCAGCA
1301 CCAACGTCGG CGGTTTTTAC GGTCTGACCG CTTCCGTCGA GTTCGACCAA
1351 GCAAAACGCG ACGGTAAAAT CCGCATCACC ATCCCCGTTG CCAACCTGCA
1401 AAGCGGTTCG CAACACTTTA CCGACCACCT GAAATCAGCC GACATCTTCG
1451 ATGCCGCCCA ATATCCGGAC ATCCGCTTTG TTTCCACCAA ATTCAACTTC
1501 AACGGCAAAA AACTGGTTTC CGTTGACGGC AACCTGACCA TGCACGGCAA
1551 AACCGCCCCC GTCAAACTCA AAGCCGAAAA ATTCAACTGC TACCAAAGCC
1601 CGATGGCGAA AACCGAAGTT TGCGGCGGCG ACTTCAGCAC CACCATCGAC
1651 CGCACCAAAT GGGGCGTGGA CTACCTCGTT AACGTTGGTA TGACCAAAAG
1701 CGTCCGCATC GACATCCAAA TCGAGGCAGC CAAACAATAA CTCGAG
   1 MASPDVKSAD TLSKPAAPVV AEKETEVKED APQAGSQGQG APSTQGSQDM
  51 AAVSAENTGN GGAATTDJPK NEDEGPQNDM PQNSAESANQ TGNNQPADSS
 101 DSAPASNPAP ANGGSNFGRV DLANGVLIDG PSQNITLTHC KGDSCNGDNL
 151 LDEEAPSKSE FENLNESERI EKYKKDGKSD KFTNLVATAV QANGTNKYVI
 201 IYKDKSASSS SARFRRSARS RRSLPAEMPL IPVNQADTLI VDGEAVSLTG
 251 HSGNIFAPEG NYRYLTYGAE KLPGGSYALR VQGEPAKGEM LAGTAVYNGE
 301 VLHFHTENGR PYPTRGRFAA KVDFGSKSVD GIIDSGDDLH MGTQKFKAAI
 351 DGNGFKGTWT ENGGGDVSGR FYGPAGEEVA GKYSYRPTDA EKGGFGVFAG
 401 KKEQDGSGGG GATYKVDEYH ANARFAIDSF NTSTNVGGFY GLTGSVEFDQ
 451 AKRDGKIDIT IPVANLQSGS QHFTDHLKSA DIFDAAQYPD IRFVSTKFNF
 501 NGKKLVSVDG NLTMHGKTAP VKLKAEKFNC YQSPMAKTEV CGGDFSTTID
 551 RTKWGVDYLV NVGMTKSVRI DIQIEAAKQ*
ΔG287-961
   1 ATGGCTAGCC CCGATCTTAA ATCGGCGGAC ACGCTGTCAA AACCGGCCGC
  51 TCCTGTTGTT GCTGAAAAAG AGACAGAGGT AAAAGAAGAT GCGCCACAGG
 101 CAGGTTCTCA AGGACAGGGC GCGCCATCCA CACAAGGCAG CCAAGATATG
 151 GCGGCAGTTT CGGCAGAAAA TACAGGCAAT GGCGGTGCGG CAACAACGGA
 201 CAAACCCAAA AATGAAGACG AGGGACCGCA AAATGATATG CCGCAAAATT
 251 CCGCCGAATC CGCAAATCAA ACAGGGAACA ACCAACCCGC CGATTCTTCA
 301 GATTCCGCCC CCGCGTCAAA CCCTGCACCT GCGAATGGCG GTAGCAATTT
 351 TGGAAGGGTT GATTTGGCTA ATGGCGTTTT GATTGATGGG CCGTCGCAAA
 401 ATATAACGTT GACCCACTGT AAAGGCGATT CTTGTAATGG TGATAATTTA
 451 TTGGATGAAG AAGCACCGTC AAAATCAGAA TTTGAAAATT TAAATGAGTC
 501 TGAACGAATT GAGAAATATA AGAAAGATGG GAAAAGCGAT AAATTTACTA
 551 ATTTGGTTGC GACAGCAGTT CAAGCTAATG GAACTAACAA ATATGTCATC
 601 ATTTATAAAG ACAAGTCCGC TTCATCTTCA TCTGCGCGAT TCAGGCGTTC
 651 TGCACGGTCG AGGAGGTCGC TTCCTGCCGA GATGCCGCTA ATCCCCGTCA
 701 ATCAGGCGGA TACGCTGATT GTCGATGGGG AAGCGGTCAG CCTGACGGGG
 751 CATTCCGGCA ATATCTTCGC GCCCGAAGGG AATTACCGGT ATCTGACTTA
 801 CGGGGCGGAA AAATTGCCCG GCGGATCGTA TGCCCTCCGT GTGCAAGGCG
 851 AACCGGCAAA AGGCGAAATG CTTGCTGGCA CGGCCGTGTA CAACGGCGAA
 901 GTGCTGCATT TTCATACGGA AAACGGCCGT CCGTACCCGA CTAGAGGCAG
 951 GTTTGCCGCA AAAGTCGATT TCGGCAGCAA ATCTGTGGAC GGCATTATCG
1001 ACAGCGGCGA TGATTTGCAT ATGGGTACGC AAAAATTCAA AGCCGCCATC
1051 GATGGAAACG GCTTTAAGGG GACTTGGACG GAAAATGGCG GCGGGGATGT
1101 TTCCGGAAGG TTTTACGGCC CGGCCGGCGA GGAAATGGCG GGAAAATACA
1151 GCTATCGCCC GACAGATGCG GAAAAGAACG GATTCGGCGT GTTTGCCGGC
1201 AAAAAAGAGC AGGATGGATC CGGAGGAGGA GGAGCCACAA ACGACGACGA
1251 TGTTAAAAAA GCTGCCACTG TGGCCATTGC TGCTGCCTAC AACAATGGCC
1301 AAGAAATCAA CGGTTTCAAA GCTGGAGAGA CCATCTACGA CATTGATGAA
1351 GACGGCACAA TTACCAAAAA AGACGCAACT GCAGCCGATG TTGAAGCCGA
1401 CGACTTTAAA GGTCTGGGTC TGAAAAAAGT CGTGACTAAC CTGACCAAAA
1451 CCGTCAATGA AAACAAACAA AACGTCGATG CCAAAGTAAA AGCTGCAGAA
1501 TCTGAAATAG AAAAGTTAAC AACCAAGTTA GCAGACACTG ATGCCGCTTT
1551 AGCAGATACT GATGCCGCTC TGGATGCAAC CACCAACGCC TTGAATAAAT
1601 TGGGAGAAAA TATAACGACA TTTGCTGAAG AGACTAAGAC AAATATCGTA
1651 AAAATTGATG AAAAATTAGA AGCCGTGGCT GATACCGTCG ACAAGCATGC
1701 CGAAGCATTC AACGATATCG CCGATTCATT GGATGAAACC AACACTAAGG
1751 CAGACGAAGC CGTCAAAACC GCCAATGAAG CCAAACAGAC GGCCGAAGAA
1801 ACCAAACAAA ACGTCGATGC CAAAGTAAAA GCTGCAGAAA CTGCAGCAGG
1851 CAAAGCCGAA GCTGCCGCTG GCACAGCTAA TACTGCAGCC GACAAGGCCG
1901 AAGCTGTCGC TGCAAAAGTT ACCGACATCA AAGCTGATAT CGCTACGAAC
1951 AAAGATAATA TTGCTAAAAA AGCAAACAGT GCCGACGTGT ACACCAGAGA
2001 AGAGTCTGAC AGCAAATTTG TCAGAATTGA TGGTCTGAAC GCTACTACCG
2051 AAAAATTGGA CACACGCTTG GCTTCTGCTG AAAAATCCAT TGCCGATCAC
2101 GATACTCGCC TGAACGGTTT GGATAAAACA GTGTCAGACC TGCGCAAAGA
2151 AACCCGCCAA GGCCTTGCAG AACAAGCCGC GCTCTCCGGT CTGTTCCAAC
2201 CTTACAACGT GGGTCGGTTC AATGTAACGG CTGCAGTCGG CGGCTACAAA
2251 TCCGAATCGG CAGTCGCCAT CGGTACCGGC TTCCGCTTTA CCGAAAACTT
2301 TGCCGCCAAA GCAGGCGTGG CAGTCGGCAC TTCGTCCGGT TCTTCCGCAG
2351 CCTACCATGT CGGCGTCAAT TACGAGTGGT AACTCGAG
   1 MASPDVKSAD TLSKPAAPVV AEKETEVKED APQAGSQGQG APSTQGSQDM
  51 AAVSAENTGN GGAATTDKPK NEDEGPQNDM PQNSAESANQ TGNNQPADSS
 101 DSAPASNPAP ANGGSNFGRV DLANGVLIDG PSQNITLTHC KGDSCNGDNL
 151 LDEEAPSKSE FENLNESERI EKYKKDGKSD KFTNLVATAV QANGTNKYVI
 201 IYKDKSASSS SARFRRSARS RRSLPAEMPL IPVNQADTLI VDGEAVSLTG
 251 HSGNIFAPEG NYRYLTYGAE KLPGGSYALR VQGEPAKGEM LAGTAVYNGE
 301 VLHFHTENGR PYPTRGRFAA KVDFGSKSVD GIIDSGDDLH MGTQKFKAAI
 351 DGNGFKGTWT KNGGGDVSGR FYGPAGEEVA GKYSYRPTDA KKGGFGVFAG
 401 KKEQDGSGGG GATNDDDVKK AATVAIAAAY NNGQEINGFK AGETIYDIDE
 451 DGTITKKDAT AADVEADDFK GLGLKKVVTN LTKTVNENKQ NVDAKVKAAE
 501 SEIEKLTTKL ADTDAALADT DAALDATTNA LNKLGENITT FAEETKTNIV
 551 KIDEKLEAVA DTVDKHAEAF NDIADSLDET NTKADEAVKT ANEAKQTAEE
 601 TKQNVDAKVK AAETAAGKAE AAAGTANTAA DKAEAVAAKV TDIKADIATN
 651 KDNIAKKANS ADVYTREESD SKFVRIDGLN ATTEKLDTRL ASAEKSIADH
 701 DTRLNGLDKT VSDLRKETRQ GLAEQAALSG LFQPYNVGRF NVTAAVGGYK
 751 SESAVAIGTG FRFTENFAAK AGVAVGTSSG SSAAYHVGVN YEW*
    ELISA     杀菌
ΔG287-953-His     3834     65536
ΔG287-961-His     108627     65536
将抗体针对杂交蛋白产生的杀菌效力(同源菌株)与针对919和ORF46.1的组分抗原(使用287-GST)的简单化合物产生的抗体相比:
与287的混合物  与ΔG287的杂交体
    919     32000     128000
    ORF46.1     128     16000
还获得了针对异源MenB菌株和血清型A和C的杀菌活性的数据:
        919       ORF46.1
菌株 混合物 杂交体 混合物 杂交体
NGH38 1024 32000 - 16384
MC58 512 8192 - 512
BZ232 512 512 - -
MenA(F6124) 512 32000 - 8192
MenC(C11) >2048 >2048 - -
MenC(BZ133) >4096 64000 - 8192
因此,在与ΔG287(在N-未端)的杂交蛋白质比简单的与ΔG287-ORF46.1的混合物在免疫学上更优良,针对异源菌株尤其有效。也可在pET-24b中表达ΔG287-ORF46.1。
用新西兰菌株394/98而非2996制备相同的杂交蛋白:
ΔG287NZ-919
  1  ATGGCTAGCC CCGATGTCAA GTCGGCGGAC ACGCTGTCAA AACCTGCCGC
  51 CCCTGTTGTT TCTGAAAAAG AGACAGAGGC AAAGGAAGAT GCGCCACAGG
 101 CAGGTTCTCA AGGACAGGGC GCGCCATCCG GACAAGGCGG TCAAGATATG
 151 GCGGCGGTTT CGGAAGAAAA TACAGGCAAT GGCGGTGCGG CAGCAACGGA
 201 CAAACCCAAA AATGAAGACG AGGGGGCGCA AAATGATATG CCGCAAAATG
 251 CCGCCGATAC AGATAGTTTG ACACCGAATC ACACCCCGGC TTCGAATATG
 301 CCGGCCGGAA ATATGGAAAA CCAAGCACCG GATGCCGGGG AATCGGAGCA
 351 GCCGGCAAAC CAACCGGATA TGGCAAATAC GCGGACGGAA ATGCAGGGTG
 401 ACGATCCGTC GGCAGGCGGG GAAAATGCCG GCAATACGGC TGCCCAAGGT
 451 ACAAATCAAG CCGAAAACAA TCAAACCGCC GGTTCTCAAA ATCCTGCCTC
 501 TTCAACCAAT CCTAGCGCCA CGAATAGCGG TGGTGATTTT GGAAGGACGA
 551 ACGTGGGCAA TTCTGTTGTG ATTGACGGGC CGTCGCAAAA TATAACGTTG
 601 ACCCACTGTA AAGGCGATTC TTCTAGTGGC AATAATTTCT TGGATGAAGA
 651 AGTACAGCTA AAATCAGAAT TTGAAAAATT AAGTGATGCA GACAAAATAA
 701 GTAATTACAA GAAAGATGGG AAGAATGACG GGAAGAATGA TAAATTTGTC
 751 GGTTTGGTTG CCGATAGTGT GCAGATGAAG GGAATCAATC AATATATTAT
 801 CTTTTATAAA CCTAAACCCA CTTCATTTGC GCGATTTAGG CGTTCTGCAC
 851 GGTCGAGGCG GTCGCTTCCG GCCGAGATGC CGCTGATTCC CGTCAATCAG
 901 GCGGATACGC TGATTCTCGA TGGGGAAGCG GTCAGCCTGA CGGGGCATTC
 951 CGGCAATATC TTCGCGCCCG AAGGGAATTA CCGGTATCTG ACTTACGGGG
1001 CGGAAAAATT GCCCGGCGGA TCGTATGCCC TCCGTGTTCA AGGCGAACCT
1051 TCAAAAGGCG AAATGCTCGC GGGCACGGCA GTGTACAACG GCGAAGTGCT
1101 GCATTTTCAT ACGGAAAACG GCCGTCCGTC CCCGTCCAGA GGCAGGGTTG
1151 CCGCAAAAGT CGATTTCGGC AGCAAATCTG TGGACGGCAT TATCGACAGC
1201 GGCGATGGTT TGCATATGGG TACGCAAAAA TTCAAAGCCG CCATCGATGG
1251 AAACGGCTTT AAGGGGACTT GGACGGAAAA TGGCGGCGGG GATGTTTCCG
1301 GAAAGTTTTA CGGCCCGGCC GGCGAGGAAG TGGCGGGAAA ATACAGCTAT
1351 CGCCCAACAG ATGCGGAAAA GGGCGGATTC GGCGTGTTTG CCGGCAAAAA
1401 AGAGCAGGAT GGATCCGGAG GAGGAGGATG CCAAAGCAAG AGCATCCAAA
1451 CCTTTCCGCA ACCCGACACA TCCGTCATCA ACGGCCCGGA CCGGCCGGTC
1501 GGCATCCCCG ACCCCGCCGG AACGACGGTC GGCGGCGGCG GGGCCGTCTA
1551 TACCGTTGTA CCGCACCTGT CCGCTGCCCA CTGGGCGGCG CAGGATTTCG
1601 CCAAAAGCCT GCAATCCTTC CGCCTCGGCT GCGCCAATTT GAAAAACCGC
1651 CAAGGCTGGC AGGATGTGTG CGCCCAAGCC TTTCAAACCC CCGTCCATTC
1701 CTTTCAGGCA AAACAGTTTT TTGAACGCTA TTTCACGCCG TGGCAGGTTG
1751 CAGGCAACGG AAGCCTTGCC GGTACGGTTA CCGGCTATTA CGAGCCGGTG
1801 CTGAAGGGCG ACGACAGGCG GACGGCACAA GCCCGCTTCC CGATTTACGG
1851 TATTCCCGAC GATTTTATCT CCGTCCCCCT GCCTGCCGGT TTGCGGAGCG
1901 GAAAAGCCCT TGTCCGCATC AGGCAGACGG GAAAAAACAG CGGCACAATC
1951 GACAATACCG GCGGCACACA TACCGCCGAC CTCTCCCGAT TCCCCATCAC
2001 CGCGCGCACA ACGGCAATCA AAGGCAGGTT TGAAGGAAGC CGCTTCCTCC
2051 CCTACCACAC GCGCAACCAA ATCAACGGCG GCGCGCTTGA CGGCAAAGCC
2101 CCGATACTCG GTTACGCCGA AGACCCCGTC GAACTTTTTT TTATGCACAT
2151 CCAAGGCTCG GGCCGTCTGA AAACCCCGTC CGGCAAATAC ATCCGCATCG
2201 GCTATGCCGA CAAAAACGAA CATCCCTACG TTTCCATCGG ACGCTATATG
2251 GCGGACAAAG GCTACCTCAA GCTCGGGCAG ACCTCGATGC AGGGCATCAA
2301 AGCCTATAYG CGGCAAAATC CGCAACGCCT CGCCGAAGTT TTGGGTCAAA
2351 ACCCCAGCTA TATCTTTTTC CGCGAGCTTG CCGGAAGCAG CAATGACGGT
2401 CCCGTCGGCG CACTGGGCAC GCCGTTGATG GGGGAATATG CCGGCGCAGT
2451 CGACCGGCAC TACATTACCT TGGGCGCGCC CTTATTTGTC GCCACCGCCC
2501 ATCCGGTTAC CCGCAAAGCC CTCAACCGCC TGATTATGGC GCAGGATACC
2551 GGCAGCGCGA TTAAAGGCGC GGTGCGCGTG GATTATTTTT GGGGATACGG
2601 CGACGAAGCC GGCGAACTTG CCGGCAAACA GAAAACCACG GGTTACGTCT
2651 GGCAGCTCCT ACCCAACGGT ATGAAGCCCG AATACCGCCC GTAAAAGCTT
   1 MASPDVKSAD TLSKPAAPVV SEKETETAKD APQAGSQGQG APSAQGGQDM
  51 AAVSEENTGN GGAAATDKPK NEDEGAQNDM PQNAADTDSL TPNHTPASNM
 101 PAGNMENQSP DAGESEQPAN QPIMANTADG MQGDDPSAGG ENAGNTAAQG
 151 TNQAENNQTA GSQNPASSTN PSATNSGGDF GRTNVGNSVV IDGPSQNITL
 201 THCKGDSCSG NNFLDEEVQL KSEFEKLSDA DKISNYKKDG KNDGKNDKFV
 251 GLVADSVQMK GINQYIIFYK PKPTSFARFR RSARSRRSLP AEMPLIPVNQ
 301 ADTLIVDGEA VSLTGHSGNI FAPEGNYRYL TYGAEKLPGG SYALRVQGEP
 351 SKGEMLAGTA VYNGBVLHFH TENGRPSPSR GRFAAKVDFG SKSVDGIIDS
 401 GDGLHMGTQK FKAAIDGNGF KGTWTENGGG DVSGKFYGPA GEEVAGKYSY
 451 RPTDAEKGGF GVFAGKKEQD GSGGGGCQSK SIQTFPQPDT SVINGPDRPV
 501 GIPDPAGTTV GGGGAVYTVV PHLSLPHWAA QDFAKSSQSF RLGCANLKNR
 551 QGWQDVCAQA FQTPVHSFQA KQFFERYFTP WQVAGNGSLA GTVIGYYEPV
 601 LKGDDRRTAQ ARFPIYGIPD DFISVPLPAD LRSGKALVRI RQTGKNSGTI
 651 DNTGGTHTAD LSRFPITART TAIKGRFEGS RFLPYHTRNQ INGGALDGKA
 701 PILGYAEDPV ELFFMHIQGS GRLKTPSGKY IRIGYADKNE HPYVSIGRYM
 751 ADKGYLKLGQ TSMQGIKAYM RQNPQRLAEV LGQNPSYIFF RELAGSSNDG
 801 PVGALGTPLM GEYAGAVDRH YITLGAPLFV ATAHPVTRKA LNRLIMAQDT
 851 GSAIKGAVRV DYFWGYGDEA GELAGKQKTT GYVWQLLPNG MKPEYRP*
ΔG287NZ-953
   1 ATGGCTAGCC CCGATGTCAA GTCGGCGGAC ACGCTGTCAA AACCTGCCGC
  51 CCCTGTTGTT TCTGAAAAAG AGACAGAGGC AAAGGAAGAT GCGCCACAGG
 101 CAGGTTCTCA AGGACAGGGC GCGCCATCCG CACAAGGCGG TCAAGATATG
 151 GCGGCGGTTT CGGAAGAAAA TACAGGCAAT GGCGGTGCGG CAGCAACGGA
 201 CAAACCCAAA AATGAAGACG AGGGGGCGCA AAATGATATG CCGCAAAATG
 251 CCGCCGATAC AGATAGTTTG ACACCGAATC ACACCCCGGC TTCGAATATG
 301 CCGGCCGGAA ATATGGAAAA CCAAGCACCG GATGCCGGGG AATCGGAGCA
 351 GCCGGCAAAC CAACCGGATA TGGCAAATAC GGCGGACGGA ATGCAGGGTG
 401 ACGATCCGTC GGCAGGCGGG GAAAATGCCG GCAATACGGC TGCCCAAGGT
 451 ACAAATCAAG CCGAAAACAA TCAAACCGCC GGTTCTCAAA ATCCTGCCTC
 501 TTCAACCAAT CCTAGCGCCA CGAATAGCGG TGGTGATTTT GGAAGGACGA
 551 ACGTGGGCAA TTCTGTTGTG ATTGACGGGC CGTCGCAAAA TATAACGTTG
 601 ACCCACTGTA AAGGCGATTC TTGTAGTGGC AATAATTTCT TGGATGAAGA
 651 AGTACAGCTA AAATCAGAAT TTGAAAAATT AAGTGATGCA GACAAAATAA
 701 GTAATTACAA GAAAGATGGG AAGAATGACG GGAAGAATGA TAAATTTGTC
 751 GGTTTGGTTG CCGATAGTGT GCAGTGAAGG GGAATCAATC AATATATTAT
 801 CTTTTATAAA CCTAAACCCA CTTCATTTGC GCGATTTAGG CGTTCTGCAC
 851 GGTCGAGGCG GTCGCTTCCG GCCGAGATGC CGCTGATTCC CGTCAATCAG
 901 GCGGATACGC TGATTGTCGA TGGGGAAGCG GTCAGCCTGA CGGGGGATTC
 951 CGGCAATATC TTCGCGCCCG AAGGGAATTA CCGGTATCTG ACTTACGGGG
1001 CGGAAAAATT GCCCGGCGGA TCGTATGCCC TCCGTGTTCA AGGCGAACCT
1051 TCAAAAGGCG AAATGCTCGC GGGCACGGCA GTGTACAACG GCGAAGTGCT
1101 GCATTTTCAT ACGGAAAACG GCCGTCCGTC CCCGGTCAGA GGCAGGTTTG
1151 CCGCAAAAGT CGATTTCGGC AGCAAATCTG TGGACGGCAT TATCGACAGC
1201 GGCGATGGTT TGCATATGGG TACGCAAAAA TTCAAAGCCG CCATCGATGG
1251 AAACGGCTTT AAGGGGACTT GGACGGAAAA TGGCGGCGGG GATGTTTCCG
1301 GAAAGTTTTA CGGCCCGGCC GGCGAGGAAG TGGCGGGAAA ATACAGCTAT
1351 CGCCCAACAG ATGCGGAAAA GGGCGGATTC GGCGTGTTTG CCGGCAAAAA
1401 AGAGCAGGAT GGATCCGGAG GAGGAGGAGC CACCTACAAA GTGGACGAAT
1451 ATCACGCCAA CGCCCGTTTC GCCATCGACC ATTTCAACAC CAGCACCAAC
1501 GTCGGCGGTT TTTACGGTCT GACCGGTTCC GTCGAGTTCG ACCAAGCAAA
1551 ACGCGACGGT AAAATCGACA TCACCATCCC CGTTGCCAAC CTGCAAAGCG
1601 GTTCGCAACA CTTTACCGAC CACCTGAAAT CAGCCGACAT CTTCGATGCC
1651 GCCCAATATC CGGACATCCG CTTTGTTTCC ACCAAATTCA ACTTCAACGG
1701 CAAAAAACTG GTTTCCGTTG ACGGCAACCT GACCATGCAC GGCAAAACCG
1751 CCCCCGTCAA ACTCAAAGCC GAAAAATTCA ACTGCTACCA AAGCCCGATG
1801 GCGAAAACCG AAGTTTGCGG CGGCGACTTC AGCACCACCA TCGACCGCAC
1851 CAAATGGGGC GTGGACTACC TCGTTAACGT TGGTATGACC AAAGCGGTCC
1901 GCATCGACAT CCAAATCGAG GCAGCCAAAC AATAAAAGCT T
   1 MASPDVKSAD TLSKPAAPVV SEKETEAKED APQAGSQGQG APSAQGGQDM
  51 AAVSEENTGN GGAAATDKPK NEDEGAQNDM PQNAADTDSL TPNHTPASNM
 101 PAGNMENQAP DAGESEQPAN QPDMANTADG MQGDDPSAGG ENAGNTAAQG
 151 TNQAENNQTA GSQNPASSTN PSATNSGGDF GRTNVGNSVV IDGPSQNITL
 201 THCKGDSCSG NNFLDEEVQL KSEFEKLSDA DKISNYKKDG KNDGKNDKFV
 251 GLVADSVQMK GINQYIIFYK PKPTSFARFR RSARSRRSLP AEMPLIPVNQ
 301 ADTLIVDGEA VSLTGHSGNI FAPEGNYRYL TYGAEKLPGG SYALRVQGEP
 351 SKGEMLAGTA VYNGEVLHFH TENGRPSPSR GRFAAKVDFG SKSVDGIIDS
 401 GDGLHMGTQK FKAAIDGNGF KGTWTENGGG DVSGKFYGPA GKEVAGKYSY
 451 RPTDAEKGGF GVFAGKKEQD GSGGGGATYK VDEYHANARF AIDHFNTSTN
 501 VGGFYGLTGS VEFDQAKRDG KIDITIPVAN LQSGSQHFTD HLKSADIFDA
 551 AQYPDIRFVS TKFNFNGKKL VSVDGNLTMH GKTAPVKLKA EKFNCYQSPM
 601 AKTEVCGGDF STTIDRTKWG VDYLVNVGMT KSVRIDIQIE AAKQ*
ΔG287NZ-961
   1 ATGGCTAGCC CCGATGTCAA GTCGGCGGAC ACGCTGTCAA AACCTGCCGC
  51 CCCTGTTGTT TCTGAAAAAG AGACAGAGGC AAAGGAAGAT GCGCCACAGG
 101 CAGGTTCTCA AGGACAGGGC GCGCCATCCG CACAAGGCGG TCAAGATATG
 151 GCGGCGGTTT CGGAAGAAAA TACAGGCAAT GGCGGTGCGG CAGCAACGGA
 201 CAAACCCAAA AATGAAGACG AGGGGGCGCA AAATGATATG CCGCAAAATG
 251 CCGCCGATAC AGATAGTTTG ACACCGAATC ACACCCCGGC TTCGAATATG
 301 CCGGCCGGAA ATATGGAAAA CCAAGCACCG GATGCCGGGG AATCGGAGCA
 351 GCCGGCAAAC CAACCGGATA TGGCAAATAC GGCGGACGGA ATGCAGGGTG
 401 ACGATCCGTC GGCAGGCGGG GAAAATGCCG GCAATACGGC TGCCCAAGGT
 451 ACAAATCAAG CCGAAAACAA TCAAACCGCC GGTTCTCAAA ATCCTGCCTC
 501 TTCAACCAAT CCTAGCGCCA CGAATAGCGG TGGTGATTTT GGAAGGACGA
 551 ACGTGGGCAA TTCTGTTGTG ATTGACGGGC CGTCGCAAAA TATAACGTTG
 601 ACCCACTGTA AAGGCGATTC TTGTAGTGGC AATAATTTCT TGGATGAAGA
 651 AGTACAGCTA AAATCAGAAT TTGAAAAATT AAGTGATGCA GACAAAATAA
 701 GTAATTACAA GAAAGATGGG AAGAATGACG GGAAGAATGA TAAATTTGTC
 751 GGTTTGGTTG CCGATAGTGT GCAGATGAAG GGAATCAATC AATATATTAT
 801 CTTTTATAAA CCTAAACCCA CTTCATTTGC GCGATTTAGG CGTTCTGCAC
 851 GGTCGAGGCG GTCGCTTCCG GCCGAGATGC CGCTGATTCC CGTCAATCAG
 901 GCGGATACGC TGATTGTCGA TGGGGAAGCG GTCAGCCTGA CGGGGCATTC
 951 CGGCAATATC TTCGCGCCCG AAGGGAATTA CCGGTATCTG ACTTACGGGG
1001 CGGAAAAATT GCCCGGCGGA TCGTATGCCC TCCGTGTTCA AGGCGAACCT
1051 TCAAAAGGCG AAATCGTCGC GGGCACGGCA GTGTACAACG GCGAAGTGCT
1101 GCATTTTCAT ACGGAAAACG GCCGTCCGTC CCCGTCCAGA GGCAGGTTTG
1151 CCGCAAAAGT CGATTTCGGC AGCAAATCTG TGGACGGCAT TATCGACAGC
1201 GGCGATGGTT TGCATATGGG TACGCAAAAA TTCAAAGCCG CCATCGATGG
1251 AAACGGCTTT AAGGGGACTT GGACGGAAAA TGGCGGCGGG GATGTTTCCG
1301 GAAAGTTTTA CGGCCCGGCC GGCGAGGAAG TGGCGGGAAA ATACAGCTAT
1351 CGCCCAACAG ATGCGGAAAA GGGCGGATTC GGCGTGTTTG CCGGCAAAAA
1401 AGAGCAGGAT GGATCCGGAG GAGGAGGAGC CACAAACGAC GACGATGTTA
1451 AAAAAGCTGC CACTGTGGCC ATTGCTGCTG CCTACAACAA TGGCCAAGAA
1501 ATCAACGGTT TCAAAGCTGG AGAGACCATC TACGACATTG ATGAAGACGG
1551 CACAATTACC AAAAAAGACG CAACTGCAGC CGATGTTGAA GCCGACGACT
1601 TTAAAGGTCT GGGTCTGAAA AAAGTCGTGA CTAACCTGAC CAAAACCGTC
1651 AATGAAAACA AACAAAACGT CGATGCCAAA GTAAAAGCTG CAGAATCTGA
1701 AATAGAAAAG TTAACAACCA AGTTAGCAGA CACTGATGCC GCTTTAGCAG
1751 ATACTGATGC CGCTCTGGAT GCAACCACCA ACGCCTTGAA TAAATTGGGA
1801 GAAAATATAA CGACATTTGC TGAAGAGACT AAGACAAATA TCGTAAAAAT
1851 TGATGAAAAA TTAGAAGCCG TGGCTGATAC CGTCGACAAG CATGCCGAAG
1901 CATTCAACGA TATCGCCGAT TCATTGGATG AAACCAACAC TAAGGCAGAC
1951 GAAGCCGTCA AAACCGCCAA TGAAGCCAAA CAGACGGCCG AAGAAACCAA
2001 ACAAAACGTC GATGCCAAAG TAAAAGCTGC AGAAACTGCA GCAGGCAAAA
2051 CCGAAGCTGC CGCTGGCACA GCTAATACTG CAGCCGACAA GGCCGAAGCT
2101 GTCGCTGCAA AAGTTACCGA CATCAAAGCT GATATCGCTA CGAACAAAGA
2151 TAATATTGCT AAAAAAGCAA ACAGTGCCGA CGTGTACACC AGAGAAGAGT
2201 CTGACAGCAA ATTTGTCAGA ATTGATGGTC TGAACGCTAC TACCGAAAAA
2251 TTGGACACAC GCTTGGCTTC TGCTGAAAAA TCCATTGCCG ATCACGATAC
2301 TCGCCTGAAC GGTTTGGATA AAACAGTGTC AGACCTGCGC AAAGAAACCC
2351 GCCAAGGCCT TGCAGAACAA GCCGCGCTCT CCGGTCTGTT CCAACCTTAC
2401 AACGTGGGTC GGTTCAATGT AACGGCTGCA GTCGGCGGCT ACAAATCCGA
2451 ATCGGCAGTC GCCATCGGTA CCGGCTTCCG CTTTACCGAA AACTTTGCCG
2501 CCAAAGCAGG CGTGGCAGTC GGCACTTCGT CCGGTTCTTC CGCAGCCTAC
2551 CATGTCGGCG TCAATTACGA GTGGTAAAAC CTT
   1 MASPDVKSAD TLSKPAAPVV SEKETEAKED APQAGSQGQG APSAQGGQDM
  51 AAVSEENTGN GGAAATDKPK NEKEGAQNDM PQNAADTDSL TOBGTOASNM
 101 PAGNMENQAP DAGESEQPAN QODMANTADG MQGDDPSAGG KNAGNTAAQG
 151 TNQAKNNQTA GSQNPASSTN PSATNSGGDF GRTNVGNSVV IDGPSQNITL
 201 THCKGDSCSG NNFLDEEVQL KSEFEKLSDA DKISNYKKDG KNDGKNDKFV
 251 GLVADSVQMK GINQYIIFYK PKPTSFARFR RSARSRRSLP AEMPLIPVNQ
 301 ADTLIVDGEA VBLTGHSGNI FAPEGNYRYL TYGAEKLPGG SYALRVQGEP
 351 SKGEMLAGTA VYNGEVLHFH TENGRPSPSR GRFAAKVDFG SKSVDGIIDS
 401 GDGLHMGTQK FKAAIDGNGF KGTWTENGGG DVSGKFYGPA GEEVAGKYSY
 451 RPTDAEKGGF GVFAGKKEQD GSGGGGATND DDVKKAATVA IAAAYNNGQE
 501 INGFKAGETI YDIDEDGTIT KKDATAADVE ADDFKGLGLK KVVTNLTKTV
 551 NENKQNVDAK VKAAESEIEK LTTKLADTDA ALADTDAALD ATTNALNKLG
 601 ENITTFAEET KTNIVKIDEK LEAVADTVDK HAEAFNDIAD SLDETNTKAD
 651 EAVKTANEAK QTAEETKQNV DAKVKAAETA AGKAEAAAGT ANTAADKAEA
 701 VAAKVTDIKA DIATNKDNIA KKANSADVYT REESDSKFVR IDGLNATTEK
 751 LDTRLASAEK SIADHDTRLN GLDKTVSDLR KETRQGLAEQ AALSGLFQPY
 801 NVGRFNVTAA VGGYKSESAV AIGTGFRFTE NFAAKAGVAV GTSSGSSAAY
 851 HVGVNYEW*
ΔG983和杂交体
测定了针对各种菌株(包括同源2996菌株)应答ΔG983(His-融合体)产生的杀菌滴定度:
2996 NGH38 BZ133
ΔG983 512 128 128
ΔG983还可以与ORF46.1、741、961或961c(在其C-未端)杂交的杂交体表达:
ΔG983-ORF46.1
   1 ATGACTTCTG CGCCDGACTT CAATGCAGGC GGTACCGGTA TCGGCAGCAA
  51 CAGCAGAGCA ACAACAGCGA AATCAGCAGC AGTATCTTAC GCCGGTATCA
 101 AGAACGAAAT GTGCAAACAC AGAAGCATGC TCTGTGCCGG TCGGGATGAC
 151 GTTGCGGTTA CAGACAGGGA TGCCAAAATC AATGCCCCCC CCCCGAATCT
 201 GCATACCGGA GACTTTCCAA ACCCAAATGA CGCATACAAG AATTTGATCA
 251 ACCTCAAACC TGCAATTGAA GCAGGCTATA CAGGACGCGG GGTAGAGGTA
 301 GGTATCGTCG ACACAGGCGA ATCCGTCGGC AGCATATCCT TTCCCGAACT
 351 GTATGGCAGA AAAGAACACG GCTATAACGA AAATTACAAA AACTATACGG
 401 CGTATATGCG GAAGGAAGCG CCTGAAGACG GAGGCGGTAA AGACATTGAA
 451 GCTTCTTTCG ACGATGAGGC CGTTATAGAG ACTGAAGCAA AGCCGACGGA
 501 TATCCGCCAC GTAAAAGAAA TCGGACACAT CGATTTGGTC TCCCATATTA
 551 TTGGCGGGCG TTCCGTGGAC GGCAGACCTG CAGGCGGTAT TGCGCCCGAT
 601 GCGACGCTAC ACATAATGAA TACGAATGAT GAAACCAAGA ACGAAATGAT
 651 GGTTGCAGCC ATCCGCAATG CATGGGTCAA GCTGGGCGAA CGTGGCGTGC
 701 GCATCGTCAA TAACAGTTTT GGAACAACAT CGAGGGCAGG CACTGCCGAC
 751 CTTTTCCAAA TAGCCAATTC GGAGGAGCAG TACCGCCAAG CGTTGCTCGA
 801 CTATTCCGGC GGTGATAAAA CAGACGAGGG TATCCGCCTG ATGCAACAGA
 851 GCGATTACGG CAACCTGTCC TACCACATCC GTAATAAAAA CATGCTTTTC
 901 ATCTTTTCGA CAGGCAATGA CGCACAAGCT CAGCCCAACA CATATGCCCT
 951 ATTGCCATTT TATGAAAAAG ACGCTCAAAA AGGCATTATC ACAGTCGCAG
1001 GCGTAGACCG CAGTGGAGAA AAGTTCAAAC GGGAAATGTA TGGAGAACCG
1051 GGTACAGAAC CGCTTGAGTA TGGCTCCAAC CATTGCGGAA TTACTGCCAT
1101 GTGGTGCCTG TCGGCACCCT ATGAAGCAAG CGTCCGTTTC ACCCGTACAA
1151 ACCCGATTCA AATTGCCGGA ACATCCTTTT CCGCACCCAT CGTAACCGGC
1201 ACGGCGGCTC TGCTGCTGCA GAAATACCCG TGGATGAGCA ACGACAACCT
1251 GCGTACCACG TTGCTGACGA CGGCTCAGGA CATCGGTGCA GTCGGCGTGG
1301 ACAGCAAGTT CGGCTGGGGA CTGCTGGATG CGGGTAAGGC CATGAACGGA
1351 CCCGCGTCCT TTCCGTTCGG CGACTTTACC GCCGATACGA AAGGTACATC
1401 CGATATTGCC TACTCCTTCC GTAACGACAT TTCAGGCACG GGCGGCCTGA
1451 TCAAAAAAGG CGGCAGCCAA CTGCAACTGC ACGGCAACAA CACCTATACG
1501 GGCAAAACCA TTATCGAAGG CGGTTCGCTG GTGTTGTACG GCAACAACAA
1551 ATCGGATATG CGCGTCGAAA CCAAAGGTGC GCTGATTTAT AACGGGGCGG
1601 CATCCGGCGG CAGCCTGAAC AGCGACGGCA TTGTCTATCT GGCAGATACC
1651 GACCAATCCG GCGCAAACGA AACCGTACAC ATCAAAGGCA GTCTGCAGCT
1701 GGACGGCAAA GGTACGCTGT ACACACGTTT GGGCAAACTG CTGAAAGTGG
1751 ACGGTACGGC GATTATCGGC GGCAAGCTGT ACATGTCGGC ACGCGGCAAG
1801 GGGGCAGGCT ATCTCAACAG TACCGGACGA CGTGTTCCCT TCCTGAGTGC
1851 CGCCAAAATC GGGCAGGATT ATTCTTTCTT CACAAACATC GAAACCGACG
1901 GCGGCCTGCT GGCTTCCCTC GACAGCGTCG AAAAAACAGC GGGCAGTGAA
1951 GGCGACACGC TGTCCTATTA TGTCCGTCGC GGCAATGCGG CACGGACTGC
2001 TTCGGCAGCG GCACATTCCG CGCCCGCCGG TCTGAAACAC GCCGTAGAAC
2051 AGGGCGGCAG CAATCTGGAA AACCTGATGG TCGAACTGGA TGCCTCCGAA
2101 TCATCCGCAA CACCCGAGAC GGTTGAAACT GCGGCAGCCG ACCGCACAGA
2151 TATGCCGGGC ATCCGCCCCT ACGGCGCAAC TTTCCGCGCA GCGGCAGCCG
2201 TACAGCATGC GAATGCCGCC GACGGTGTAC GCATCTTCAA CAGTCTCGCC
2251 GCTACCGTCT ATGCCGACAG TACCGCCGCC CATGCCGATA TGCAGGGACG
2301 CCGCCTGAAA GCCGTATCGG ACGGGTTGGA CCACAACGGC ACGGGTCTGC
2351 GCGTCATCGC GCAAACCCAA CAGGACGGTG GAACGTGGGA ACAGGGCGGT
2401 GTTGAAGGCA AAATGCGCGG CAGTACCCAA ACCGTCGGCA TTGCCGCGAA
2451 AACCGGCGAA AATACGACAG CAGCCGCCAC ACTGGGCATG GGACGCAGCA
2501 CATGGAGCGA AAACAGTGCA AATGCAAAAA CCGACAGCAT TAGTCTGTTT
2551 GCAGGCATAC GGCACGATGC GGGCGATATC GGCTATCTCA AAGGCCTGTT
2601 CTCCTACGGA CGCTACAAAA ACAGCATCAG CCGCAGCACC GGTGCGGACG
2651 AACATGCGGA AGGCAGCGTC AACGGCACGC TGATGCAGCT GGGCGCACTG
2701 GGCGGTGTCA ACGTTCCGTT TGCCGCAACG GGAGATTTGA CGGTCGAAGG
2751 CGGTCTGCGC TACGACCTGC TCAAACAGGA TGCATTCGCC GAAAAAGGCA
2801 GTGCTTTGGG CTGGAGCGGC AACAGCCTCA CTGAAGGCAC GCTGGTCGGA
2851 CTCGCGGGTC TGAAGCTGTC GCAACCCTTG AGCGATAAAG CCGTCCTGTT
2901 TGCAACGGCG GGCGTGGAAC GCGACCTGAA CGGACGCGAC TACACGGTAA
2951 CGGGCGGCTT TACCGGCGCG ACTGCAGCAA CCGGCAAGAC GGGGGCACGC
3001 AATATGCCGC ACACCCGTCT GGTTGCCGGC CTGGGCGCGG ATGTCGAATT
3051 CGGCAACGGC TGGAACGGCT TGGCACGTTA CAGCTAACCC GGTTCCAAAC
3101 AGTACGGCAA CCACAGCGGA CGAGTCGGCG TAGGCTACCG GTTCCTCGAC
3151 GGTGGCGGAG GCACTGGATC CTCAGATTTG GCAAACGATT CTTTTATCCG
3201 GCAGGTTCTC GACCGTCAGC ATTTCGAACC CGACGGGAAA TACCACCTAT
3251 TCGGCAGCAG GGGGGAACTT GCCGAGCGCA GCGGCCATAT CGGATTGGGA
3301 AAAATACAAA GCCATCAGTT GGGCAACCTG ATGATTCAAC AGGCGGCCAT
3351 TAAAGGAAAT ATCGGCTACA TTGTCCGCTT TTCCGATCAC GGGCACGAAG
3401 TCCATTCCCC CTTCGACAAC CATGCCTCAC ATTCCGATTC TGATGAAGCC
3451 GGTAGTCCCG TTGACGGATT TAGCCTTTAC CGCATCCATT GGGACGGATA
3501 CGAACACCAT CCCGCCGACG GCTATGACGG GCCACAGGGC GGCGGCTATC
3551 CCGCTCCCAA AGGCGCGAGG GATATATACA GCTACGACAT AAAAGGCGTT
3601 GCCCAAAATA TCCGCCTCAA CCTGACCGAC AACCGCAGCA CCGGACAACG
3651 GCTTGCCGAC CGTTTCCACA ATGCCGGTAG TATGCTGACG CAAGGATAAG
3701 GCGACGGATT CAAACGCGCC ACCCGATACA GCCCCGAGCT GGACAGATCG
3751 GGCAATGCCG CCGAAGCCTT CAACGGCACT GCAGATATCG TTAAAAACAT
3801 CATCGGCGCG GCAGGAGAAA TTGTCGGCGC AGGCGATGCC GTGCAGGGCA
3851 TAAGCGAAGG CTCAAACATT GCTGTCATGC ACGGCTTGGG TCTGCTTTCC
3901 ACCGAAAACA AGATGGCGCG CATCACGGAT TTGGCAGATA TGGCGCAACT
3951 CAAAGACTAT GCCGCAGCAG CCATCCGCGA TTGGGCAGTC CAAAACCCCA
4001 ATGCCGCACA AGGCATAGAA GCCGTCAGCA ATATCTTTAT GGCAGCCATC
4051 CCCATCAAAG GGATTGGAGC TGTTCGGGGA AAATACGGCT TGGGCGGCAT
4101 CACGGCACAT CCTATCAAGC GGTCGCAGAT GGGCGCGATC GCATTGCCGA
4151 AAGGGAAATC CGCCGTCAGC CGACAATTTG CCGATGCGGC ATACGCCAAA
4201 TACCCGTCCC CTTACCATTC CCGAAATATC CGTTCAAACT TGGAGCAGCG
4251 TTACGGCAAA GAAAACATCA CCTCCTCAAC GGTGCCGCCG TCAAACGGCA
4301 AAAATGTCAA ACTGGCAGAC CAACGCCACC CGAAGACAGG CGTACCGTTT
4351 GACGGTAAAG GGTTTCCGAA TTTTGAGAAG CACGTGAAAT ATGATACGCT
4401 CGAGCACCAC CACCACCACC ACTGA
   1 MTSAPDFNAG GTGIGSNSRA TTAKSAAVSY AGIKNEMCKD RSMLCAGRDD
  51 VAVTDRDAKI NAPPPNLHTG DFPNPNDAYK NLINLKPAIE AGYTGRGVEV
 101 GIVDTGESVG SISFPELYGR KEHGYNENYK NYTAYMRKEA PEDGGGKDIE
 151 ASFDDEAVIE TEAKPTDIRH VKEIGHIDLV SHIIGGRSVD GRPAGGIAPD
 201 ATLHIMNTND ETKNEMMVAA IRNAWVKLGB RGVRIVNNSF GTTSRAGTAD
 251 LFQIANSEHQ YRQALLDYSG GDKTDEGIRL MQQSDYGNLS YHIRNKNMLF
 301 IFSTGNDAQA QPNTYALLPF YEKDAQKGII TVAGVDRSGE KFKREMYGEP
 351 GTEPLEYGSN HCGITAMWCL SAPYEASVRF TRTNPIQIAG TSFSAPIVTG
 401 TAALLLQKYP WMSNDNLRTT LLTTAQDIGA VGVDSKFGWG LLDAGKAMNG
 451 PASFPFGDFT ADTKGTSDIA YSFRNDISGT GGLIKKGGSQ LQLHGNNTYT
 501 GKTIIEGGSL VLYGNNKSDM RVETKGALIY NGAASGGSLN SDGIVYLADT
 551 DQSGANETVH IKGSLQLDGK GTLYTRLGKL LKVDGTAIIG GKLYMSARGK
 601 GAGYLNSTGR RVPFLSAAKI GQDYSFFTNI ETDGGLLASL DSVEKTAGSE
 651 GDTLSYYVRR GNAARTASAA AHSAPAGLKH AVEQGGSNLE NLMVELDASS
 701 SSATPETVET AAADRTDMPG IRPYGATFRA AAAVQHANAA DGVRIFNSLA
 751 ATVYADSTAA HADMQGRRLK AVSDGLDHNG TGLRVIAQTQ QDGGTWEQGG
 801 VEGKMRGSTQ TVGIAAKTGE NTTAAATLGM GRSTWSENSA NAKTDSISLF
 851 AGIRHDAGDI GYLKGLFSYG RYKNSISRST GADEHAEGSV NGTLMQLGAL
 901 GGVNVPFAAT GDLTVEGGLR YDLLKQDAFA EKGSALGWSG NSLTEGTLVG
 951 LAGLKLSQPL SDKAVLFATA GVERDLNGRD YTVTGGFTGA TAATGKTGAR
1001 NMPHTRLVAG LGADVEFGNG WNGLARYSYA GSKQYGNHSG RVGVGYRFLD
1051 GGGGTGSSDL ANDSFIRQVL DRQHFEPDGK YHLFGSRGEL AERSGHIGLG
1101 KIQSHQLGNL MIQQAAIKGN IGYIVRFSDH GHEVHSPFDN HASHSDSDEA
1151 GSPVDGFSLY RIHWDGYEHH PADGYDGPQG GGYPAPKGAR DIYSYDIKGV
1201 AQNIRLNLTD NRSTGQRLAD RFHNAGSMLT QGVGDGFKRA TRYSPELDRS
1251 GNAAEAFNGT ADIVKNIIGA AGEIVGAGDA VQGISEQSNI AVMHGLGLLS
1301 TENKMARIND LADMAQLKDY AAAAIRDMAV QNPNAAQGIE AVSNIFMAAI
1351 PIKGIGAVRG KYGLGGITAH PIKRSQMGAI ALPKEKSAVS DNFADAAYAK
1401 YPSPYHSRNI RSNLEQRYGK ENITSSTVPP SNGKNVKLAD QRHPKTGVPF
1451 DGKGFPNFEK HVKYDTLEHH HHHH*
ΔG983-741
   1 ATGACTTCTG CGCCCGACTT CAATGCAGGC GGTACCGGTA TCGGCAGCAA
  51 CAGCAGAGCA ACAACAGCGA AATCAGCAGC AGTATCTTAC GCCGGTATCA
 101 AGAACGAAAT GTGCAAAGAC AGAAGCATGC TCTGTGCCGG TCGGGATGAC
 151 GTTGCGGTTA CAGACAGGGA TGCCAAAATC AATGCCCCCC CCCCGAATCT
 201 GCATACCGGA GACTTTCCAA ACCCCAATGA CGCATACAAG AATTTGATCA
 251 ACCTCAAACC TGCAATTGAA GCAGGCTATA CAGGACGCGG GGTAGAGGTA
 301 GGTATCGTCG ACACAGGCGA ATCCGTCGGC AGCATATCCT TTCCCGAACT
 351 GTATGGCAGA AAAGAACACG GCTATAACGA AAATTACAAA AACTATACGG
 401 CGTATATGCG GAAGGAAGCG CCTGAAGACG GAGGCGGTAA AGACATTGAA
 451 GCTTCTTTCG ACGATGAGGC CGTTATAGAG ACTGAAGCAA AGCCGACGGA
 501 TATCCGCCAC GTAAAAGAAA TCGGACACAT CGATTTGGTC TCCCATATTA
 551 TTGGCGGGCG TTCCGTGGAC GGCAGACCTG CAGGCGGTAT TGCGCCCGAT
 601 GCGACGCTAC ACATAATGAA TACGAATGAT GAAACCAAGA ACGAAATGAT
 651 GGTTGCAGCA ATCCGCAATG CATGGGTCAA GCTGGGCGAA CGTGGCGTGC
 701 GCATCGTCAA TAACAGTTTT GGAACAACAT CGAGGGCAGG CACTGCCGAC
 751 CTTTTCCAAA TAGCCAATTC GGAGGAGCAG TACCGCCAAG CGTTGCTCGA
 801 CTATTCCGGC GGTGATAAAA CGGACGAGGG TATCCGCCTG ATGCAACAGA
 851 GCGATTACGG CAACCTGTCC TACCACATCC GTAATAAAAA CATGCTTTTC
 901 ATCTTTTCGA CAGGCAATGA CGCACAAGCT CAGCCCAACA CATATGCCCT
 951 ATTGCCATTT TATGAAAAAA ACGCTCAAAA AGGCATTATC ACAGTCGCAG
1001 GCGTAGACCG CAGTGGAGAA AAGTTCAAAC GGGAAAGTAT TGGAGAACCG
1051 GGTACAGAAC CGCTTGAGTA TGGCTCCAAC CATTGCGGAA TTACTGCCAT
1101 GTGGTGCCGT TCGGCACCCT ATGAAGCAAG CGTCCGTTTC ACCCGTACAA
1151 ACCCGATTCA AATTGCCGGA ACATCCTTTT CCGCACCCAT CGTAACCGGC
1201 ACGGCGGCTC TGCTGCTGCA GAAATACCCG TGGATGAGCA ACGACAACCT
1251 GCGTACCACG TTGCTGACGA CGGCTCAGGA CATCGGTGCA GTCGGCGTGG
1301 ACAGCAAGTT CGGCTGGGGA CTGCTGGATG CGGGTAAGGC CATGAACGGA
1351 CCCGCGTCCT TTCCGTTCGG CGACTTTACC GCCGATACGA AAGGTACATC
1401 CGATATTGCC TACTCCTTCC GTAACGACAT TTCAGGCACG GGCGGCCTGA
1451 TCAAAAAAGG CGGCAGCCAA CTGCAACTGC ACGGCAACAA CACCTATACG
1501 GGCAAAACCA TTATCGAAGG CGGTTCGCTG GTGTTGTACG GCAACAACAA
1551 ATCGGATATG CGCGTCGAAA CCAAAGGTGC GCTGATTTAT AACGGGGCGG
1601 CATCCGGCGG CAGCCTGAAC AGCGACGGCA TTGTCTATCT GGCAGATACC
1651 GACCAATCCG GCGCAAACGA AACCGTACAC ATCAAAGGCA GTCTGCAGCT
1701 GGACGGCAAA GGTACGCTGT ACACACGTTT GGGCAAACTG CTGAAAGTGG
1751 ACGGTACGGC GATTATCGGC GGCAAGCTGT ACATGTCGGC ACGCGGCAAG
1801 GGGGCAGGCT ATCTCAACAG TACCGGACGA CGTGTTCCCT TCCTGAGTGC
1851 CGCCAAAATC GGGCAGGATT ATTCTTTCTT CACAAACATC GAAACCGACG
1901 GCGGCCTGCT GGCTTCCCTC GACAGCGTCG AAAAAACAGC GGGCAGTGAA
1951 GGCGACACGC TGTCCTATTA TGTCCGTCGC GGCAATGCGG CACGGACTGC
2001 TTCGGCAGCG GCACATTCCG CGCCCGCCGG TCTGAAACAC GCCGTAGAAC
2051 AGGGCGGCAG CAATCTGGAA AACCTGATGG TCGAACTGGA TGCCTCCGAA
2101 TCATCCGCAA CACCCGAGAC GGTTGAAACT GCGGCAGCCG ACCGCACAGA
2151 TATGCCGGGC ATCCGCCCCT ACGGCGCAAC TTTCCGCGCA GCGGCAGCCG
2201 TACAGCATGC GAATGCCGCC GACGGTGTAC GCATCTTCAA CAGTCTCGCC
2251 GCTACCGTCT ATGCCGACAG TACCGCCGCC CATGCCGATA TGCAGGGACG
2301 CCGCCTGAAA GCCGTATCGG ACGGGTTGGA CCACAACGGC ACGGGTCTGC
2351 GCGTCATCGC GCAAACCCAA CAGGACGGTG GAACGTGGGA ACAGGGCGGT
2401 GTTGAAGGCA AAATGCGCGG CAGTACCCAA ACCGTCGGCA TTGCCGCGAA
2451 AACCGGCGAA AATACGACAG CAGCCGCCAC ACTGGGCATG GGACGCAGCA
2501 CATGGAGCGA AAACAGTGCA AATGCAAAAA CCGACAGCAT TAGTCTGTTT
2551 GCAGGCATAC GGCACGATGC GGGCGATATC GGCTATCTCA AAGGCCTGTT
2601 CTCCTACGGA CGCTACAAAA ACAGCATCAG CCGCAGCACC GGTGCGGACG
2651 AACATGCGGA AGGCAGCGTC AACGGCACGC TGATGCAGCT GGGCGCACTG
2701 GGCGGTGTCA ACGTTCCGTT TGCCGCAACG GGAGATTTGA CGGTCGAAGG
2751 CGGTCTGCGC TACGACCTGC TCAAACAGGA TGCATTCGCC GAAAAAGGCA
2801 GTGCTTTGGG CTGGAGCGGC AACAGCCTCA CTGAAGGCAC GCTGGTCGGA
2851 CTCGCGGGTC TGAAGCTGTC GCAACCCTTG AGCGATAAAG CCGTCCTGTT
2901 TGCAACGGCG GGCGTGGAAC GCGACCTGAA CGGACGCGAC TACACGGTAA
2951 CGGGCGGCTT TACCGGCGCG ACTGCAGCAA CCGGCAAGAC GGGGGCACGC
3001 AATATGCCGC ACACCCGTCT GGTTGCCGGC CTGGGCGCGG ATGTCGAATT
3051 CGGCAACGGC TGGAACGGCT TGGCACGTTA CAGCTACGCC GGTTCCAAAC
3101 AGTACGGCAA CCACAGCGGA CGAGTCGGCG TAGGCTACCG GTTCCTCGAG
3151 GGATCCGGGA GGGGTGGTGT CGCCGCCGAC ATCGGTGCGG GGCTTGCCGA
3201 TGCACTAACC GCACCGCTCG ACCATAAAGA CAAAGGTTTG CAGTCTTTGA
3251 CGCTGGATCA GTCCGTCAGG AAAAACGAGA AACTGAAGCT GGCGGCACAA
3301 GGTGCGGAAA AAACTTATGG AAACGGTGAC AGCCTCAATA CGGGCAAATT
3351 GAAGAACGAC AAGGTCAGCC GTTTCGACTT TATCCGCCAA ATCGAAGTGG
3401 ACGGGCAGCT CATTACCTTG GAGAGTGGAG AGTTCCAACT ATACAAACAA
3451 AGCCATTCCG CCTTAACCGC CTTTCAGACC GAGCAAATAC AAGATTCGGA
3501 GCATTCCGGG AAGATGGTTG CGAAACGCCA GTTCAGAATC GGCGACATAG
3551 CGGGCGAACA TACATCTTTT GACAAGCTTC CCGAAGGCGG CAGGGCGACA
3601 TATCGCGGGA CGGCGTTCGG TTCAGACGAT GCCGGCGGAA AACTGACCTA
3651 CACCATAGAT TTCGCCGCCA AGCAGGGAAA CGGCAAAATC GAACATTTGA
3701 AATCGCCAGA ACTCAATGTC GACCTGGCCG CCGCCGATAT CAAGCCGGAT
3751 GGAAAACGCC ATGCCGTCAT CAGCGGTTCC GTCCTTTACA ACCAAGCCGA
3801 GAAAGGCAGT TACTCCCTCG GTATCTTTGG CGGAAAAGCC CAGGAAGTTG
3851 CCGGCAGCGC GGAAGTGAAA ACCGTAAACG GCATACGCCA TATCGGCCTT
3901 GCCGCCAAGC AACTCGAGCA CCACCACCAC CACCACTGA
   1 MTSAPDFNAG GTGIGSNSRA TTAKSAAVSY AGIKNEMCKD RSMLCAGRDD
  51 VAVTDRDAKI NAPPPNLHTG DFPNPNDAYK NLINLKPAIE AGYTGRGVEV
 101 GIVDTGESVG SISFPELYGR KEHGYNENYK NYTAYMRKEA PEDGGGKDIE
 151 ASFDDEAVIE TEAKPTDIRH VKEIGHIDLV SHIIGGRSVD GRPAGGIAPD
 201 ATLHINNTND ETKNEMMVAA IRNAWVKLGE RGVRIVNNSF GTTSRAGTAD
 251 LFQIANSEEQ YRQALLDYSG GDKTDEGIRL MQQSDYGNLS YHIRNKNMLF
 301 IFSTGNDAQA QPNTYALLPF YEKDAQKGII TVAGVDRSGE KFKREMYGEP
 351 GTEPLEYGSN HCGITAMWCL SAPYEASVRF TRTNPIQIAG TSFSAPIVTG
 401 TAALLLQKYP WMSNDNLRTT LLTTAQDIGA VGVDSKFGWG LLDAGKAMNG
 451 PASFPFGDFT ADTKGTSDIA YSFRNDISGT GGLIKKGGSQ LQLHGNNTYT
 501 GKTIIEGGSL VLYGNNKSDM RVETKGALIY NGAASGGSLN SDGIVYLADT
 551 DQSGANETVH IKGSLQLDGK GTLYTRLGKL LKVDGTAIIG GKLYMSARGK
 601 GAGYLNSTGR RVPFLSAAKI GQDYSFFTNI ETDGGLLASL DSVEKTAGSE
 651 GDTLSYYVRR GNAARTASAA AHSAPAGLKH AVEQGGSNLE NLNVELDASE
 701 SSATPETVET AAADRTDMPG IRPYGATFRA AAAVQHANAA DGVRIFNSLA
 751 ATVYADSTAA HADMQGRRLK AVSDGLDHNG TGLRVIAQTQ QDGGTWEQGG
 801 VEGKMRGSTQ TVGIAAKTGE NTTAAATLGM GRSTWSENSA NAKTDSISLF
 851 AGIRHDAGDI GYLKGLFSYG RYKNSISRST GADEHAEGSV NGTLMQLGAL
 901 GGVNVPFAAT GDLTVEGGLR YDLLKQDAFA KKGSALGWSG NSLTEGTLVG
 951 LAGLKLSQPL SDKAVLFATA GVERDLNGRD YTVTGGFTGA TAATGKTGAR
1001 NMPHTRLVAG LGADVEFGNG WNGLARYSYA GSKQYGNHSG RVGVGYRFLE
1051 GSGGGGVAAD IGAGLADALT APLDHKDKGL QSLTLDQSVR KNEKLKLAAQ
1101 GAEKTYGNGD SLNTGKLKND KVSRFDFIRQ IEVDGQLITL ESGEFQVYKQ
1151 SHSALTAFQT EQIQDSEHSG KMVAKRQFRI GDIAGEHTSF DKLPEGGRAT
1201 YRGTAFGSDD AGGKLTYTID FAAKQGNGKI EHLKSPELNV DLAAADIKPD
1251 GKRHAVISGS VLYNQAEKGS YSLGIFGGKA QEVAGSAEVK TVNGIRHIGL
1301 AAKQLEHHHH HH*
ΔG983-961
   1 ATGACTTCTG CGCCCGACTT CAATGCAGGC GGTACCGGTA TCGGCAGCAA
  51 CAGCAGAGCA ACAACAGCGA AATAAGCAGC AGTATCTTAC GCCGGTATCA
 101 AGAACGAAAT GTGCAAAGAC AGAAGCATGC TCTGTGCCGG TCGGGATGAC
 151 GTTGCGGTTA CAGACAGGGA TGCCAAAATC AATGCCCCCC CCCCGAATCT
 201 GCATACCGGA GACTTTCCAA ACCCAAATGA CGCATACAAG AATTTGATCA
 251 ACCTCAAACC TGCAATTGAA GCAGGCTATA CAGGACGCGG GGTAGAGGTA
 301 GGTATCGTCG ACACAGGCGA ATCCGTCGGC AGCATATCCT TTCCCGAACT
 351 GTATGGCAGA AAAGAACACG GCTATAACGA AAATTACAAA AACTATACGG
 401 CGTATATGCG GAAGGAAGCG CCTGAAGACG GAGGCGGTAA AGACATTGAA
 451 GCTTCTTTCG ACGATGAGGC CGTTATAGAG ACTGAAGCAA AGCCGACGGA
 501 TATCCGCCAC GTAAAAGAAA TCGGACACAT CGATTTGGTC TCCCATATTA
 551 TTGGCGGGCG TTCCGTGGAC GGCAGACCTG CAGGCGGTAT TGCGCCCGAT
 601 GCGACGCTAC ATATAATGAA TACGAATGAT GAAACCAAGA ACGAAATGAT
 651 GGTTGCAGCC ATCCGCAATG CATGGGTCAA GCTGGGCGAA CGTGGCGTGC
 701 GCATCGTCAA TAACAGTTTT GGAACAACAT CGAGGGCAGG CACTGCCGAC
 751 CTTTTCCAAA TAGCCAATTC GGAGGAGCAG TACCGCCAAG CGTTGCTCGA
 801 CTATTCCGGC GGTGATAAAA CAGACGAGGG TATCCGCCTG ATGCAACAGA
 851 GCGATTACGG CAACCTGTCC TACCACATCC GTAATAAAAA CATGCTTTTC
 901 ATCTTTTCGA CAGGCAATGA CGCACAAGCT CAGCCCAACA CATATGCCCT
 951 ATTGCCATTT TATGAAAAAG ACGCTCAAAA AGGCATTATC ACAGTCGCAG
1001 GCGTAGACCG CAGTGGAGAA AAGTTCAAAC GGGAAATGTA TGGAGAACCG
1051 GGTACAGAAC CGCTTGAGTA TGGCTCCAAC CATTGCGGAA TTACTGCCAT
1101 GTGGTGCCTG TCGGCACCCT ATGAAGCAAG CGTCCGTTTC ACCCGTACAA
1151 ACCCGATTCA AATTGCCGGA ACATCCTTTT CCGCACCCAT CGTAACCGGC
1201 ACGGCGGCTC TGCTGCTGCA GAAATACCCG TGGATGAGCA ACGACAACCT
1251 GCGTACCACG TTGCTGACGA CGGCTCAGGA CATCGGTGCA GTCGGCGTGG
1301 ACAGCAAGTT CGGCTGGGGA CTGCTGGATG CGGGTAAGGC CATGAACGGA
1351 CCCGCGTCCT TTCCGTTCGG CGACTTTACC GCCGATACGA AAGGTACATC
1401 CGATATTGCC TACTCCTTCC GTAACGACAT TTCAGGCACG GGCGGCCTGA
1451 TCAAAAAAGG CGGCAGCCAA CTGCAACTGC ACGGCAACAA CACCTATACG
1501 GGCAAAACCA TTATCGAAGG CGGTTCGCTG GTGTTGTACG GCAACAACAA
1551 ATCGGATATG CGCGTCGAAA CCAAAGGTGC GCTGATTTAT AACGGGGCGG
1601 CATCCGGCGG CAGCCTGAAC AGCGACGGCA TTGTCTATCT GGCAGATACC
1651 GACCAATCCG GCGCAAACGA AACCGTACAC ATCAAAGGCA GTCTGCAGCT
1701 GGACGGCAAA GGTACGCTGT ACACACGTTT GGGCAAACTG CTGAAAGTGG
1751 ACGGTACGGC GATTATCGGC GGCAAGCTGT ACATGTCGGC ACGCGGCAAG
1801 GGGGCAGGCT ATCTCAACAG TACCGGACGA CGTGTTCCCT TCCTGAGTGC
1851 CGCCAAAATC GGGCAGGATT ATTCTTTCTT CACAAACATC GAAACCGACG
1901 GCGGCCTGCT GGCTTCCCTC GACAGCGTCG AAAAAACAGC GGGCAGTGAA
1951 GGCGACACGC TGTCCTATTA TGTCCGTCGC GGCAATGCGG CACGGACTGC
2001 TTCGGCAGCG GCACATTCCG CGCCCGCCGG TCTGAAACAC GCCGTAGAAC
2051 AGGGCGGCAG CAATCTGGAA AACCTGATGG TCGAACTGGA TGCCTCCGAA
2101 TCATCCGCAA CACCCGAGAC GGTTGAAACT GCGGCAGCCG ACCGCACAGA
2151 TATGCCGGGC ATCCGCCCCT ACGGCGCAAC TTTCCGCGCA GCGGCAGCCG
2201 TACAGCATGC GAATGCCGCC GACGGTGTAC GCATCTTCAA CAGTCTCGCC
2251 GCTACCGTCT ATGCCGACAG TACCGCCGCC CATGCCGATA TGCAGGGACG
2301 CCGCCTGAAA GCCGTATCGG ACGGGTTGGA CCACAACGGC ACGGGTCTGC
2351 GCGTCATCGC GCAAACCCAA CAGGACGGTG GAACGTGGGA ACAGGGCGGT
2401 GTTGAAGGCA AAATGCGCGG CAGTACCCAA ACCGTCGGCA TTGCCGCGAA
2451 AACCGGCGAA AATACGACAG CAGCCGCCAC ACTGGGCATG GGACGCAGCA
2501 CATGGAGCGA AAACAGTGCA AATGCAAAAA CCGACAGCAT TAGTCTGTTT
2551 GCAGGCATAC GGCACGATGC GGGCGATATC GGCTATCTCA AAGGCCTGTT
2601 CTCCTACGGA CGCTACAAAA ACAGCATCAG CCGCAGCACC GGTGCGGACG
2651 AACATGCGGA AGGCAGCGTC AACGGCACGC TGATGCAGCT GGGCGCACTG
2701 GGCGGTGTCA ACGTTCCGTT TGCCGCAACG GGAGATTTGA CGGTCGAAGG
2751 CGGTCTGCGC TACGACCTGC TCAAACAGGA TGCATTCGCC GAAAAAGGCA
2801 GTGCTTTGGG CTGGAGCGGC AACAGCCTCA CTGAAGGCAC GCTGGTCGGA
2851 CTCGCGGGTC TGAAGCTGTC GCAACCCTTG AGCGATAAAG CCGTCCTGTT
2901 TGCAACGGCG GGCGTGGAAC GCGACCTGAA CGGACGCGAC TACACGGTAA
2951 CGGGCGGCTT TACCGGCGCG ACTGCAGCAA CCGGCAAGAC GGGGGCACGC
3001 AATATGCCGC ACACCCGTCT GGTTGCCGGC CTGGGCGCGG ATGTCGAATT
3051 CGGCAACGGC TGGAACGGCT TGGCACGTTA CAGCTACGCC GGTTCCAAAC
3101 AGTACGGCAA CCACAGCGGA CGAGTCGGCG TAGGCTACCG GTTCCTCGAG
3151 GGTGGCGGAG GCACTGGATC CGCCACAAAC GACGACGATG TTAAAAAAGC
3201 TGCCACTGTG GCCATTGCTG CTGCCTACAA CAATGGCCAA GAAATCAACG
3251 GTTTCAAAGC TGGAGAGACC ATCTACGACA TTGATGAACG CGGCACAATT
3301 ACCAAAAAAG ACGCAACTGC AGCCGATGTT GAAGCCGACG ACTTTAAAGG
3351 TCTGGGTCTG AAAAAAGTCG TGACTAACCT GACCAAAACC GTCAATGAAA
3401 ACAAACAAAA CGTCGATGCC AAAGTAAAAG CTGCAGAACT TGAAATAGAA
3451 AAGTTAACAA CCAAGTTAGC AGACACTGAT GCCGCTTTAG CAGATACTGA
3501 TGCCGCTCTG GATGCAACCA CCAACGCCTT GAATAAATTG GGAGAAAATA
3551 TAACGACATT TGCTGAAGAG ACTAAGACAA ATATCGTAAA AATTGATGAA
3601 AAATTAGAAG CCGTGGCTGA TACCGTCGAC AAGCATGCCG AAGCATTCAA
3651 CGATATCGCC GATTCATTGG ATGAAACCAA CACTAAGGCA GACGAAGCCG
3701 TCAAAACCGC CAATGAAGCC AAACAGACGG CCGAAGAAAC CAAACAAAAC
3751 GTCGATGCCA AAGTAAAAGC TGCAGAAACT GCAGCAGGCA AAGCCGAAGC
3801 TGCCGCTGGC ACAGCTAATA CTGCAGCCGA CAAGGCCGAA GCTGTCGCTG
3851 CAAAAGTTAC CGACATCAAA GCTGATATCG CTACGAACAA AGATAATATT
3901 GCTAAAAAAG CAAACAGTGC CGACGTGTAC ACCAGAGAAG AGTCTGACAG
3951 CAAATTTGTC AGAATTGATG GTCTGAACGC TACTACCGAA AAATTGGACA
4001 CACGCTTGGC TTCTGCTGAA AAATCCATTG CCGATCACGA TACTCGCCGT
4051 AACGGTTTGG ATAAAACAGT GTCAGACCTG CGCAAAGAAA CCCGCCAAGG
4101 CCTTGCAGAA CAAGCCGCGC TCTCCGGTCT GTTCCAACCT TACAACGTGG
4151 GTCGGTTCAA TGTAACGGCT GCAGTCGGCG GCTACAAATC CGAATCGGCA
4201 GTCGCCATCG GTACCGGCTT CCGCTTTACC GAAAACTTTG CCGCCAAAGC
4251 AGGCGTGGCA TGCGGCACTT CGTCCGGTTC TTCCGCAGCC TACCATGTCG
4301 GCGTCAATTA CGAGTGGCTC GAGCACCACC ACCACCACCA CTGA
   1 MTSAPDFNAG GTGIGSNSRA TTAKSAAVSY AGIKNEMCKD RSMLCAGRDD
  51 VAVTDRDAKI NAPPPNLHTG DFPNPNDAYK NLINLKPAIE AGYTGRGVEV
 101 GIVDTGESVG SISFPELYGR KEHGYNENYK NYTAYMRKEA PEDGGGKDIE
 151 ASFDDEAVIE TEAKPTDIRH VKEIGHIDLV SHIIGGRSVD GRPAGGIAPD
 201 ATLHIMNTND ETKNEMMVAA IRNAWVKLGE RGVRIVNNSF GTTSRAGTAD
 251 LFQIANSEEQ YRQALLDYSG GDKTDEGIRL MQQSDYGNLS YHIRNKNMLF
 301 IFSTGNDAQA QPNTYALLPF YEKDAQKGII TVAGVDRSGE KFKREMYGEP
 351 GTEPLEYGSN HCGITAMWCL SAPYEASVRF TRTNPIQIAG TSFSAPIVTG
 401 TAALLLQKYP WNSNDNLRTT LLTTAQDIGA VGVDSKFGWG LLDAGKAMNG
 451 PASFPFGDFT ADTKGTSDIA YSFRNDISGT GGLIKKGGSQ LQLHGNNTYT
 501 GKTIIEGGSL VLYGNNKSDM RVETKGALIY NGAASGGSLN SDGIVYLADT
 551 DQSGANETVH IKGSLQLDGK GTLYTRLGKL LKVDGTAIIG GKLYNSARGK
 601 GAGYLNSTGR RVPFLSAAKI GQDYSFFTNI ETDGGLLASL DSVEKTAGSE
 651 GDTLSYYVRR GNAARTASAA AHSAPAGLKH AVEQGGSNLE NLMVELDASE
 701 SSATPETVET AAADRTDMPG IRPYGATFRA AAAVQHANAA DGVRIFNSLA
 751 ATVYADSTAA HADMQGRRLK AVSDGLDHNG TGLRVIAQTQ QDGGTWEQGG
 801 VEGKMRGSTQ TVGIAAKTGE NTTAAATLGM GRSTWSENSA NAKTDSISLF
 851 AGIRHDAGDI GYLKGLFSYG RYKNSISRST GADEHAEGSV NGTLMQLGAL
 901 GGVNVPFAAT GDLTVEGGLR YDLLKQDAFA EKGSALGWSG NSLTEGTLVG
 951 LAGLKLSQPL SDKAVLFATA GVERDLNGRD YTVTGGFTGA TAATGKTGAR
1001 NMPHTRLVAG LGADVEFGNG WNGLARYSYA GSKQYGNHSG RVGVGYRFLE
1051 GGGGTGSATN DDDVKKAATV AIAAAYNNGQ EINGFKAGET IYDIDEDGTI
1101 TKKDATAADV EADDFKGLGL KKVVTNLTKT VNENKQNVDA KVKAAESEIE
1151 KLTTKLADTD AALADTDAAL DATTNALNKL GENITTFAEE TKTNIVKIDE
1201 KLEAVADTVD KHAEAFNDIA DSLDETNTKA DEAVKTANEA KQTAEETKQN
1251 VDAKVKAAET AAGKAEAAAG TANTAADKAE AVAAKVTDIK ADIATNKDNI
1301 AKKANSADVY TREESDSKFV RIDGLNATTE KLDTRLASAE KSIADHDTRL
1351 NGLDKTVSDL RKETRQGLAE QAALSGLFQP YNVGRFNVTA AVGGYKSESA
1401 VAIGTGFRFT ENFAAKAGVA VGTSSGSSAA YHVGVNYEWL EHHHHHH*
ΔG983-961c
   1 ATGACTTCTG CGCCCGACTT CAATGCAGGC GGTACCGGTA TCGGCAGCAA
  51 CAGCAGAGCA ACAACAGCGA AATCAGCAGC AGTATCTTAC GCCGGTATCA
 101 AGAACGAAAT GTGCAAAGAC AGAAGCATGC TCTGTGCCGG TCGGGATGAC
 151 GTTGCGGTTA CAGACAGGGA TGCCAAAATC AATGCCCCCC CCCCGAATCT
 201 GCATACCGGA GACTTTCCAA ACCCAAATGA CGCATACAAG AATTTGATCA
 251 ACCTCAAACC TGCAATTGAA GCAGGCTATA CAGGACGCGG GGTAGAGGTA
 301 GGTATCGTCG ACACAGGCGA ATCCGTCGGC AGCATATCCT TTCCCGAACT
 351 GTATGGCAGA AAAGAACACG GCTATAACGA AAATTACAAA AACTATACGG
 401 CGTATATGCG GAAGGAAGCG CCTGAAGACG GAGGCGGTAA AGACATTGAA
 451 GCTTCTTTCG ACGATGAGGC CGTTATAGAG ACTGAAGCAA AGCCGACGGA
 501 TATCCGCCAC GTAAAAGAAA TCGGACACAT CGATTTGGTC TCCCATATTA
 551 TTGGCGGGCG TTCCGTGGAC GGCAGACCTG CAGGCGGTAT TGCGCCCGAT
 601 GCGACGCTAC ACATAATGAA TACGAATGAT GAAACCAAGA ACGAAATGAT
 651 GGTTGCAGCC ATCCGCAATG CATGGGTCAA GCTGGGCGAA CGTGGCGTGC
 701 GCATCGTCAA TAACAGTTTT GGAACAACAT CGAGGGCAGG CACTGCCGAC
 751 CTTTTCCAAA TAGCCAATTC GGAGGAGCAG TACCGCCAAG CGTTGCTCGA
 801 CTATTCCGGC GGTGATAAAA CAGACGAGGG TATCCGCCTG ATGCAACAGA
 851 GCGATTACGG CAACCTGTCC TACCACATCC GTAATAAAAA CATGCTTTTC
 901 ATCTTTTCGA CAGGCAATGA CGCACAAGCT CAGCCCAACA CATATGCCCT
 951 ATTGCCATTT TATGAAAAAG ACGCTCAAAA AGGCATTATC ACAGTCGCAG
1001 GCGTGAACCG CAGTGGAGAA AAGTTCAAAC GGGAAATGTA TGGAGAACCG
1051 GGTACAGAAC CGCTTGAGTA TGGCTCCAAC CATTGCGGAA TTACTGCCAT
1101 GTGGTGCCTG TCGGCACCCT ATGAAGCAAG CGTCCGTTTC ACCCGTACAA
1151 ACCCGATTCA AATTGCCGGA ACATCCTTTT CCGCACCCAT CGTAACCGGC
1201 ACGGCGGCTC TGCTGCTGCA GAAATACCCG TGGATGAXCA ACGACAACCT
1251 GCGTACCACG TTGCTGACGA CGGCTCAGGA CATCGGTGCA GTCGGCGTGG
1301 ACAGCAAGTT CGGCTGGGGA CTGCTGGATG CGGGTAAGGC CATGAACGGA
1351 CCCGCGTCCT TTCCGTTCGG CGACTTTACC GCCGATACGA AAGGTACATC
1401 CGATATTGCC TACTCCTTCC GTAACGACAT TTCAGGCACG GGCGGCCTGA
1451 TCAAAAAAGG CGGCAGCCAA CTGCAACTGC ACGGCAACAA CACCTATACG
1501 GGCAAAACCA TTATCGAAGG CGGTTCGCTG GTGTTGTACG GCAACAACAA
1551 ATCGGATATG CGCGTCGAAA CCAAAGGTGC GCTGATTTAT AACGGGGCGG
1601 CATCCGGCGG CAGCCTGAAC AGCGACGGCA TTGTCTATCT GGCAGATACC
1651 GACCAATCCG GCGCAAACGA AACCGTACAC ATCAAAGGCA GTCTGCAGCT
1701 GGACGGCAAA GGTACGCTGT ACACACGTTT GGGCAAACTG CTGAAAGTGG
1751 ACGGTACGGC GATTATCGGC GGCAAGCTGT ACATGTCGGC ACGCGGCAAG
1801 GGGGCAGGCT ATCTCAACAG TACCGGACGA CGTGTTCCCT TCCTGAGTGC
1851 CGCCAAAATC GGGCAGGATT ATTCTTTCTT CACAAACATC GAAACCGACG
1901 GCGGCCTGCT GGCTTCCCTC GACAGCGTCG AAAAAACAGC GGGCAGTGAA
1951 GGCGACACGC TGTCCTATTA TGTCCGTCGC GGCAATGCGG CACGGACTGC
2001 TTCGGCAGCG GCACATTCCG CGCCCGCCGG TCTGAAACAC GCCGTAGAAC
2051 AGGGCGGCAG CAATCTGGAA AACCTGATGG TCGAACTGGA TGCCTCCGAA
2101 TCATCCGCAA CACCCGAGAC GGTTGAAACT GCGGCAGCCG ACCGCACAGA
2151 TATGCCGGGC ATCCGCCCCT ACGGCGCAAC TTTCCGCGCA GCGGCAGCCG
2201 TACAGCATGC GAATGCCGCC GACGGTGTAC GCATCTTCAA CAGTCTCGCC
2251 GCTACCGTCT ATGCCGACAG TACCGCCGCC CATGCCGATA TGCAGGGACG
2301 CCGCCTGAAA GCCGTATCGG ACGGGTTGGA CCACAACGGC ACGGTCTTGC
2351 GCGTCATCGC GCAAACCCAA CAGGACGGTG GAACGTGGGA ACAGGGCGGT
2401 GTTGAAGGCA AAATGCGCGG CAGTACCCAA ACCGTCGGCA TTGCCGCGAA
2451 AACCGGCCAA AATACGACAG CAGCCGCCAC ACTGGGCATG GGACGCAGCA
2501 CATGGAGCGA AAACTGTGCA AATGCAAAAA CCGACAGCAT TAGTCTGTTT
2551 GCAGGCATAC GGCACGATGC GGGCGATATC GGCTATCTCA AAGGCCTGTT
2601 CTCCTACGGA CGCTACAAAA ACAGCATCAG CCGCAGCACC GGTGCGGACG
2651 AACATGCGGA AGGCAGCGTC AACGGCACGC TGATGCAGCT GGGCGCACTG
2701 GGCGGTGTCA ACGTTCCGTT TGCCGCAACG GGAGATTTGA CGGTCGAAGG
2751 CGGTCTGCGC TACGACCTGC TCAAACAGGA TGCATTCGCC GAAAAAGGCA
2801 GTGCTTTGGG CTGGAGCGGC AACAGCCTCA CTGAAGGCAC GCTGGTCGGA
2851 CTCGCGGGTC TGAACCTGTC GCAACCCTTG AGCGATAAAG CCGTCCTGTT
2901 TGCAACGGCG GGCGTGGAAC GCGACCTGAA CGGACGCGAC TACACGGTAA
2951 CGGGCGGCTT TACCGGCGCG ACTGCAGCAA CCGGCAAGAC GGGGGCACGC
3001 AATATGCCGC ACACCCGTCT GGTTGCCGGC CTGGGCGCGG ATGTCGAATT
3051 CGGCAACGGC TGGAACGGCT TGGCACGTTA CAGCTACGCC GGTTCCAAAC
3101 AGTACGGCAA CCACAGCGGA CGAGTCGGCG TAGGCTACCG GTTCCTCGAG
3151 GGTGGCGGAG GCACTGGATC GCCCACAAAC GACGACGATG TTAAAAAAGC
3201 TGCCACTGTG GCCATTGCTG CTGCCTACAA CAATGGCCAA GAAATCAACG
3251 GTTTCAAAGC TGGAGAGACC ATCTACGACA TTGATGAAGA CGGCACAATT
3301 ACCAAAAAAG ACGCAACTGC AGCCGATGTT GAAGCCGACG ACTTTAAAGG
3351 TCTGGGTCTG AAAAAAGTCG TGACTAACCT GACCAAAACC GTCAATGAAA
3401 ACAAACAAAA CGTCGATGCC AAAGTAAAAG CTGCAGAATC TGAAATAGAA
3451 AAGTTAACAA CCAAGTTAGC AGACACTGAT GCCGCTTTAG CAGATACTGA
3501 TGCCGCTCTG GATGCAACCA CCAACGCCTT GAATAAATTG GGAGAAAATA
3551 TAACGACATT TGCTGAAGAG ACTAAGACAA ATATCGTAAA AATTGATGAA
3601 AAATTAGAAG CCGTGGCTGA TACCGTCGAC AAGCATGCCG AAGCATTCAA
3651 CGATATCGCC GATTCATTGG ATGAAACCAA CACTAAGGCA GACGAAGCCG
3701 TCAAAACCGC CAATGAAGCC AAACAGACGG CCGAAGAAAC CAAACAAAAC
3751 GTCGATGCCA AAGTAAAAGC TGCAGAAACT GCAGCAGGCA AAGCCGAAGC
3801 TGCCGCTGGC ACAGCTAATA CTGCAGCCGA CAAGGCCGAA GCTGTCGCTG
3851 CAAAAGTTAC CGACATCAAA GCTGATATCG CTACGCACAA AGATAATATT
3901 GCTAAAAAAG CAAACAGTGC CGACGTGTAC ACCAGAGAAG AGTCTGACAG
3951 CAAATTTGTC AGAATTGATG GTCTGAACGC TACTACCGAA AAATTGGACA
4001 CACGCTTGGC TTCTGCTGAA AAATCCATTG CCGATCACGA TACTCGCCTG
4051 AACGGTTTGG ATAAAACAGT GTCAGACCTG CGCAAAGAAA CCCGCCAAGG
4101 CCTTGCAGAA CAAGCCGCGC TCTCCGGTCT GTTCCAACCT TACAACGTGG
4151 GTCTCCGAGCA CCACCACCAC CACCACTGA
   1 MTASPDFNAG GTGOGSMSRA TTALSAAVSY AGIKNEMCKD RSMLCAGRDD
  51 VAVTDRDAKI NAPPPNLHTG DFPNPNDAYK NLINLKPAIE AGYTGRGVEV
 101 GIVDTGESVG SISFPELYGR KKHGYNENYK NYTAYMRKEA PEDGGGKDIE
 151 ASFDDEAVIE TEAKPTDIRH VKEIGHIDLV SHIIGGRSVD GRPAGGIAPD
 201 ATLHIMNTND ETKNEMMVAA IRNAWVKLGB RGVRIVNNSF GTTSRAGTAD
 251 LFQIANSEEQ YRQALLDYSG GDKTDEGIRL MQQSDYGNLS YHIRNKNMLF
 301 IFSTGNDAQA QPNTYALLPF YEKDAQKGII TVAGVDRSGE KFKREMYGEP
 351 GTEPLETGSN ECGITAMWCL SAPYEASVRF TRTNPIQIAG TSFSAPIVTG
 401 TAALLLQKYP WMSNDNLRTT LLTTAQDIGA VGVDSKFGWG LLDAGKAMNG
 451 PASFPFGDFT ADTKGTSDIA YSFRNDISGT GGLIKKGGSQ LQLHGNNTYT
 501 GKTIIRGGSL VLYGNNKSDM RVETKGALIY NGAASGGSLN SDGIVYLADT
 551 DQSGANETVH IKGSLQLDGK GTLYTRLGKL LKVDGTAIIG GKLYMSARGK
 601 GAGYLNSTGR RVPFLSAAKI GQDYSFFTNI ETDGGLLASL DSVEKTAGSE
 651 GDTLSYYVRR GNAARTASAA AHSAPAGLKH AVEQGGSNLE NLMVKLDASE
 701 SSATOETVET AAADRTDMPG IRPYGATFRA AAAVQHANAA DGVRIFNSLA
 751 ATVYADSTAA HADMQGRRLK AVSDGLDHNG TGLRVIAQTQ QDGGTWEQGG
 801 VEGKMRGSTQ TVGIAAKTGE NTTAAATLGM GRSTWSKNSA NAKTDSISLF
 851 AGIRKDAGDI GYLKGLFSYG RYKNSISRST GADEEAEGSV NGTLMQLGAL
 901 GGVNVPFAAT GDLTVRGGLR YDLLKQDAFA EKGSALGWSG NSLTEGTLVG
 951 LAGLKLSQPL SDKAVLAATA GVERDLNGRD YTVTGGFTGA TAATGKTGAR
1001 NMPHTRLVAG LGADVEFGNG WNGLARYSYA GSKQYGNHSG RVGVGYRFLE
1051 GGGGTGSATM DDDVKKAATV AIAAAYNNGQ EINGFKAGET IYDIDEDGTI
1101 TKKDATAADV EADDFKGLGL KKVVTNLTKT VNENKQNVDA KVKAAESRIE
1151 KLTTKLADTD AALADTDAAL DATTNALNKL GENITTFAEE TKTNIVKIDE
1201 KLEAVADTVD KHAEAFNDIA DSLDETNTKA DEAVKTANEA KQTAEETKQN
1251 VDAKVKTTET AAGKAEAAAG TANTAADKAE AVAAKVTDIK ADIATNKINI
1301 AKKANSADVY TREESDSKFV RIDGLNATTE KLDTRLASAE KSIADHDTRL
1351 NGLDKTVSDL RKETRQGLAE QAALSGLFQP YNVGLEHHHH HH*
ΔG741和杂交体
针对各种菌株(包括同源2996菌株),测定由应答ΔG741(His-融合)产生的杀菌滴定度:
 2996  MC58  NGH38  F6124  BZ133
ΔG741  512  131072  >2048  16384  >2048
可以看出,针对异源菌株MC58,由ΔG741引发的抗-杀菌滴定度特别高。
还将ΔG741直接融合于蛋白质961、961c、983和ORF46.1的符合读框的上游:
ΔG741-961
   1 ATGGTCGCCC CCGACATCGG TGCGGGGCTT GCCGATGCAC TAACCGCACC
  51 GCTCGACCAT AAAGACAAAG GTTTGCAGTC TTTGACGCTG GATCAGTCCG
 101 TCAGGAAAAA CGAGAAACTG AAGCTGGCGG CACAAGGTGC GGAAAAAACT
 151 TATGGAAACG GTGACAGCCT CAATACGGGC AAATTGAAGA ACGACAAGGT
 201 CAGCCGTTTC GACTTTATCC GCCAAATCGA AGTGGACGGG CAGCTCATTA
 251 CCTTGGAGAG TGGAGAGTTC CAAGTATACA AACAAAGCCA TTCCGCCTTA
 301 ACCGCCTTTC AGACCGAGCA AATACAAGAT TCGGAGCATT CCGGGAAGAT
 351 GGTTGCGAAA CGCCAGTTCA GAATCGGCGA CATAGCGGGC GAACATACAT
 401 CTTTTGACAA GCTTCCCGAA GGCGGCAGGG CGACATATCG CGGGACGGCG
 451 TTCGGTTCAG ACGATGCCGG CGGAAAACTG ACCTACACCA TAGATTTCGC
 501 CGCCAAGCAG GGAAACGGCA AAATCGAACA TTTGAAATCD CCAGAACTCA
 551 ATGTCGACCT GGCCGCCGCC GATATCAAGC CGGATGGAAA ACGCCATGCC
 601 GTCATCAGCG GTTCCGTCCT TTACAACCAA GCCGAGAAAG GCAGTTACTC
 651 CCTCGGTATC TTTGGCGGAA AAGCCCAGGA AGTTGCCGGC AGCGCGGAAG
 701 TGAAAACCGT AAACGGCATA CGCCATATCG GCCTTGCCGC CAAGCAACTC
 751 GAGGGTGGCG GAGGCACTGG ATCCGCCACA AACGACGACG ATGTTAAAAA
 801 AGCTGCCACT GTGGCCATTG CTGCTGCCTA CAACAATGGC CAAGAAATCA
 851 ACGGTTTCAA AGCTGGAGAG ACCATCTACG ACATTGATGA AGACGGCACA
 901 ATTACCAAAA AAGACGCAAC TGCAGCCGAT GTTGAAGCCG ACGACTTTAA
 951 AGGTCTGGGT CTGAAAAAAG TCGTGACTAA CCTGACCAAA ACCGTCAATG
1001 AAAACAAACA AAACGTCGAT GCCAAAGTAA AAGCTGCAGA ATCTGAAATA
1051 GAAAAGTTAA CAACCAAGTT AGCAGACACT GATGCCGCTT TAGCAGATAC
1101 TGATGCCGCT CTGGATGCAA CCACCAACGC CTTGAATAAA TTGGGAGAAA
1151 ATATAACGAC ATTTGCTGAA GAGACTAAGA CAAATATCGT AAAAATTGAT
1201 GAAAAATTAG AAGCCGTGGC TGATACCGTC GACAAGCATG CCGAAGCATT
1251 CAACGATATC GCCGATTCAT TGGATGAAAC CAACACTAAG GCAGACGAAG
1301 CCGTCAAAAC CGCCAATGAA GCCAAACAGA CGGCCGAAGA AACCAAACAA
1351 AACGTCGATG CCAAAGTAAA AGCTGCAGAA ACTGCAGCAG GCAAAGCCGA
1401 AGCTGCCGCT GGCACAGCTA ATACTGCAGC CGACAAGGCC GAACCTGTCG
1451 CTGCAAAAGT TACCGACATC AAAGCTGATA TCGCTACGAA CAAAGATAAT
1501 ATTGCTAAAA AAGCAAACAG TGCCGACGTG TACACCAGAG AAGAGTCTGA
1551 CAGCAAATTT GTCAGAATTG ATGGTCTGAA CGCTACTACC GAAAAATTGG
1601 ACACACGCTT GGCTTCTGCT GAAAAATCCA TTGCCGATCA CGATACTCGC
1651 CTGAACGGTT TGGATAAAAC AGTGTCAGAC CTGDGCAAAG AAACCCGCCA
1701 AGGCCTTGCA GAACAAGCCG CGCTCTCCGG TCTGTTCCAA ACCTACAACG
1751 TGGGTCGGTT CAATGTAACG GCTGCAGTCG GCGGCTACAA ATCCGAATCG
1801 GCAGTCGCCA TCGGTACCGG CTTCCGCTTT ACCGAAAACT TTGCCGCCAA
1851 AGCAGGCGTG GCAGTCGGCA CTTCGTCCGG TTCTTCCGCA AGCCTACCATG
1901 TCGGCGTCAA TTACGAGTGG CTCGAGCACC ACCACCACCA CCACTGA
   1 MVAADIGAGL ADALTAPLDH KDKGLQSLTL DQSVRKNEKL KLAAQGAEKT
  51 YGNGDSLNTG KLKNDKVSRF DFIRQIEVDG QLITLESGEF QVYKQSHSAL
 101 TAFQTEQIQD SEHSGKMVAK RQFRIGKIAG EHTSFDKLPE GGRATYRGTA
 151 FGSDDAGGKL TYTIDFAAKQ GNGKIEHLKS PELNVDLAAA DIKPDGKPHA
 201 VISGSVLYNQ AEKGSYSLGI FGGKAQEVAG SSEVETVNGI RHIGLAAKQL
 251 EGGGGTGSAT NDDDVKKAAT VAIAAAYNNG QEINGFKAGE TIYDIDEDGT
 301 ITKKDATAAD VEADDFKGLG LKKVVTNLTK TVNENKQNVD AKVKAAESEI
 351 EKLTTKLADT DAALADTDAA LDATTNALNK LGENITTFAE ETKTNIVKID
 401 EKLEAVADTV DKHAEAFNDI ADSLDETNTK ADEAVKTANE AKQTAEETKQ
 451 NVDAKVKAAE TAAGKAEAAA GTANTAADKA EAVAAKVTDI KADIATNKDN
 501 IAKKANSADV YTREESDSKF VRIDGLNATT EKLDTRLASA EKTIADHDTR
 551 LNGLDKTVSD LRKETRQGLA EQAALSGLFQ PYNVGRFNVT AAVGGYKSES
 601 AVAIGTGFRF TENFAAKAGV AVGTSSGSSA AYHVGVNYEW LEHHHHHH*
ΔG741-961c
   1 ATGGTCGCCG CCGACATCGG TGCGGGGCTT GCCGATGCAC TAACCGCACC
  51 GCTCGACCAT AAAGACAAAG GTTTGCAGTC TTTGACGCTG GATCAGTCCG
 101 TCAGGAAAAA CGAGAAACTG AAGCTGGCGG CACAAGGTGC GGAAAAAACT
 151 TATGGAAACG GTGACAGCCT CAATACGGGC AAATTGAAGA ACGACAAGGT
 201 CAGCCGTTTC GACTTTATCC GCCAAATCGA AGTGGACGGG CAGCTCATTA
 251 CCTTGGAGAG TGGAGAGTTC CAAGTATACA AACAAAGCCA TTCCGCCTTA
 301 ACCGCCTTTC AGACCGAGCA AATACAAGAT TCGGAGCATT CCGGGAAGAT
 351 GGTTGCGAAA CGCCAGTTCA GAATCGGCGA CATAGCGGGC GAACATACAT
 401 CTTTTGACAA GCTTCCCGAA GGCGGCAGGG CGACATATCG CGGGACGGCG
 451 TTCGGTTCAG ACGATGCCGG CGGAAAACTG ACCTACACCA TAGATTTCGC
 501 CGCCAAGCAG GGAAACGGCA AAATCGAACA TTTGAAATCG CCAGAACTCA
 551 ATGTCGACCT GGCCGCCGCC GATATCAAGC CGGATGGAAA ACGCCATGCC
 601 GTCATCAGCG GTTCCGTCCT TTACACCCAA GCCGAGAAAG GCAGTTACTC
 651 CCTCGGTATC TTTGGCGGAA AAGCCCAGGA AGTTGCCGGC AGCGCGGAAG
 701 TGAAAACCGT AAACGGCATA CGCCATATCG GCCTTGCCGC CAAGCAACTC
 751 GAGGGTGGCG GAGGCACTGG ATCCGCCACA AACGACGACG ATGTTAAAAA
 801 AGCTGCCACT GTGGCCATTG CTGCTGCCTA CAACAATGGC CAAGAAATCA
 851 ACGGTTTCAA AGCTGGAGAG ACCATCTACG ACATTGATGA AGACGGCACA
 901 ATTACCAAAA AAGACGCAAC TGCAGCCGAT GTTGAAGCCG ACGACTTTAA
 951 AGGTCTGGGT CTGAAAAAAG TCGTGACTAA CCTGACCAAA ACCGTCAATG
1001 AAAACAAACA AAACGTCGAT GCCAAAGTAA AAGCTGCAGA ATCTGAAATA
1051 GAAAAGTTAA CAACCAAGTT AGCAGACACT GATGCCGCTT TAGCAGATAC
1101 TGATGCCGCT CTGGATGCAA CCACCAACGC CTTGAATAAA TTGGGAGAAA
1151 ATATAACGAC ATTTGCTGAA GAGACTAAGA CAAATATCGT AAAAATTGAT
1201 GAAAAATTAG AAGCCGTGGC TGATACCGTC GACAAGCATG CCGAAGCATT
1251 CAACGATATC GCCGATTCAT TGGATGAAAC CAACACTAAG GCAGACGAAG
1301 CCGTCAAAAC CGCCAATGAA GCCAAACAGA CGGCCGAAGA AACCAAACAA
1351 AACGTCGATG CCAAAGTAAA AGCTGCAGAA ACTGCAGCAG GCAAAGCCGA
1401 AGCTGCCGCT GGCACAGCTA ATACTGCAGC CGACAAGGCC GAAGCTGTCG
1451 CTGCAAAAGT TACCGACATC AAAGCTGATA TCGCTACGAA CAAAGATAAT
1501 ATTGCTAAAA AAGCAAACAG TGCCGACGTG TACACCAGAG AAGAGTCTGA
1551 CAGCAAATTT GTCAGAATTG ATGGTCTGAA CGCTACTACC GAAAAATTGG
1601 ACACACGCTT GGCTTCTGCT GAAAAATCCA TTGCCGATCA CGATACTCGC
1651 CTGAACGGTT TGGATAAAAC AGTGTCAGAC CTGCGCAAAG AAACCCGCCA
1701 AGGCCTTGCA GAACAAGCCG CGCTCTCCGG TCTGTTCCAA CCTTACAACG
1751 TGGGTCTCGA GCACCACCAC CACCACCACT GA
   1 MVAADIGAGL ADALTAPLDH KDKGLQSLTL DQSVRKNEEL KLAAQGAEKT
  51 YGNGDSLNTG KLKNDKVSRF DFIRQIEVDG QLITLESGEF QVYKQSHSAL
 101 TAFQTEQIQD SEHSGKMVAK FQFRIGDIAG KHTSFDKLPE GGRATYRGTA
 151 FGSDDAGGKL TYTIDFAAKQ GNGKIEHLKS PELNVDLAAA DIKPDGKPHA
 201 VISGSVLYNQ AEKGSYSLGI FGGKAQEVAG SAEVKTVNGI RHIGLAAKQL
 251 EGGGGTGSAT NDDDVKKAAT VAIAAAYNNG QEINGFKAGE TIYDIDEDGT
 301 ITKKDATAAD VEADDFKGLG LKKVVTNLTK TVNENEQNVD AKVKAAESEI
 351 EKLTTKLADT DAALADTDAA LDATTNALNK LGENITTFAE ETKTNIVKID
 401 EKLEAVADTV DKHAEAFNDI ADSLDETNTK ADEAVKTANE AKQTAEETKQ
 451 NVDAKVKAAE TAAGKAEAAA GTANTAADKA EAVAAKVTDI KADIATNKDN
 501 IAKKANSADV YTREESDSKF VRIDGLNATT EKLDTRLASA EKSIADHDTR
 551 LNGLDKTVSD LRKETRQGLA EQAALSGLFQ PYNVGLEHHH HHH*
ΔG741-983
   1 ATGGTCGCCG CCGACATCGG TGCGGGGCTT GCCGATGCAC TAACCGCACC
  51 GCTCGACCAT AAAGACAAAG GTTTGCAGTC TTTGACGCTG GATCAGTCCG
 101 TCAGGAAAAA CGAGAAACTG AAGCTGGCGG CACAAGGTGC GGAAAAAACT
 151 TATGGAAACG GTGACAGCCT CAATACGGGC AAATTGAAGA ACGACAAGGT
 201 CAGCCGTTTC GACTTTATCC GCCAAATCGA AGTGGACGGG CAGCTCATTA
 251 CCTTGGAGAG TGGAGAGTTC CAAGTATACA AACAAAGCCA TTCCGCCTTA
 301 ACCGCCTTTC AGACCGAGCA AATACAAGAT TCGGAGCATT CCGGGAAGAT
 351 GGTTGCGAAA CGCCAGTTCA GAATCGGCGA CATAGCGGGC GAACATACAT
 401 CTTTTGACAA GCTTCCCGAA GGCGGCAGGG CGACATATCG CGGGACGGCG
 451 TTCGGTTCAG ACGATGCCGG CGGAAAACTG ACCTACACCA TAGATTTCGC
 501 CGCCAAGCAG GGAAACGGCA AAATCGAACA TTTGAAATCG CCAGAACTCA
 551 ATGTCGACCT GGCCGCCGCC GATATCAAGC CGGATGGAAA ACGCCATGCC
 601 GTCATCAGCG GTTCCGTCCT TTACAACCAA GCCGAGAAAG GCAGTTACTC
 651 CCTCGGTATC TTTGGCGGAA AAGCCCAGGA AGTTGCCGGC AGCGCGGAAG
 701 TGAAAACCGT AAACGGCATA CGCCATATCG GCCTTGCCGC CAAGCAACTC
 751 GAGGGATCCG GCGGAGGCGG CACTTCTGCG CCCGACTTCA ATGCAGGCGG
 801 TACCGGTATC GGCAGCAACA GCAGAGCAAC AACAGCGAAA TCAGCAGCAG
 851 TATCTTACGC CGGTATCAAG AACGAAATGT GCAAAGACAG AAGCATGCTC
 901 TGTGCCGGTC GGGATGACGT TGCGGTTACA GACAGGGATG CCAAAATCAA
 951 TGCCCCCCCC CCGAATCTGC ATACCGGAGA CTTTCCAAAC CCAAATGACG
1001 CATACAAGAA TTTGATCAAC CTCAAACCTG CAATTGAAGC AGGCTATACA
1051 GGACGCGGGG TAGAGGTAGG TATCGTCGAC ACAGGCGAAT CCGTCGGCAG
1101 CATATCCTTT CCCGAACTGT ATGGCAGAAA AGAACACGGC TATAACGAAA
1151 ATTACAAAAA CTATACGGCG TATATGCGGA AGGAAGCGCC TGAAGACGGA
1201 GGCGGTAAAG ACATTGAAGC TTCTTTCGAC GATGAGGCCG TTATAGAGAC
1251 TGAAGCAAAG CCGACGGATA TCCGCCACGT AAAAGAAATC GGACACATCG
1301 ATTTGGTCTC CCATATTATT GGCGGGCGTT CCGTGGACGG CAGACCTGCA
1351 GGCGGTATTG CGCCCGATGC GACGCTACAC ATAATGAATA CGAATGATGA
1401 AACCAAGAAC GAAATGATGG TTGCAGCCAT CCGCAATGCA TGGGTCAAGC
1451 TGGGCGAACG TGGCGTGCGC ATCGTCAATA ACAGTTTTGG AACAACATCG
1501 AGGGCAGGCA CTGCCGACCT TTTCCAAATA GCCAATTCGG AGGAGCAGTA
1551 CCGCCAAGCG TTGCTCGACT ATTCCGGCGG TGATAAAACA GACGAGGGTA
1601 TCCGCCTGAT GCAACAGAGC GATTACGGCA ACCTGTCCTA CCACATCCGT
1651 AATAAAAACA TGCTTTTCAT CTTTTCGACA GGCAATGACG CACAAGCTCA
1701 GCCCAACACA TATGCCCTAT TGCCATTTTA TGAAAAAGAC GCTCAAAAAG
1751 GCATTATCAC AGTCGCAGGC GTAGACCGCA GTGGAGAAAA GTTCAAACGG
1801 GAAATGTATG GAGAACCGGG TACAGAACCG CTTGAGTATG GCTCCAACCA
1851 TTGCGGAATT ACTGCCATGT GGTGCCTGTC GGCACCCTAT GAAGCAAGCG
1901 TCCGTTTCAC CCGTACAAAC CCGATTCAAA TTGCCGGAAC ATCCTTTTCC
1951 GCACCCATCG TAACCGGCAC GGCGGCTCTG CTGCTGCAGA AATACCCGTG
2001 GATGAGCAAC GACAACCTGC GTACCACGTT GCTGACGACG GCTCAGGACA
2051 TCGGTGCAGT CGGCGTGGAC AGCAAGTTCG GCTGGGGACT GCTGGATGCG
2101 GGTAAGGCCA TGAACGGACC CGCGTCCTTT CCGTTCGGCG ACTTTACCGC
2151 CGATACGAAA GGTACATCCG ATATTGCCTA CTCCTTCCGT AACGACATTT
2201 CAGGCACGGG CGGCCTGATC AAAAAAGGCG GCAGCCAACT GCAACTGCAC
2251 GGCAACAACA CCTATACGGG CAAAACCATT ATCGAAGGCG GTTCGCTGGT
2301 GTTGTACGGC AACAACAAAT CGGATATGCG CGTCGAAACC AAAGGTGCGC
2351 TGATTTATAA CGGGGCGGCA TCCGGCGGCA GCCTGAACAG CGACGGCATT
2401 GTCTATCTGG CAGATACCGA CCAATCCGGC GCAAACGAAA CCGTACACAT
2451 CAAAGGCAGT CTGCAGCTGG ACGGCAAAGG TACGCTGTAC ACACGTTTGG
2501 GCAAACTGCT GAAAGTGGAC GGTACGGCGA TTATCGGCGG CAAGCTGTAC
2551 ATGTCGGCAC GCGGCAAGGG GGCAGGCTAT CTCAACAGTA CCGGACGACG
2601 TGTTCCCTTC CTGAGTGCCG CCAAAATCGG GCAGGATTAT TCTTTCTTCA
2651 CAAACATCGA AACCGACGGC GGCCTGCTGG CTTCCCTCGA CAGCGTCGAA
2701 AAAACAGCGG GCAGTGAAGG CGACACGCTG TCCTATTATG TCCGTCGCGG
2751 CAATGCGGCA CGGACTGCTT CGGCAGCGGC ACATTCCGCG CCCGCCGGTC
2801 TGAAACACGC CGTAGAACAG GGCGGCAGCA ATCTGGAAAA CCTGATGGTC
2851 GAACTGGATG CCTCCGAATC ATCCGCAACA CCCGAGACGG TTGAAACTGC
2901 GGCAGCCGAC CGCACAGATA TGCCGGGCAT CCCGCCCTAC GGCGCAACTT
2951 TCCGCGCAGC GGCAGCCGTA CAGCATGCGA ATGCCGCCGA CGGTGTACGC
3001 ATCTTCAACA GTCTCGCCGC TACCGTCTAT GCCGACAGTA CCGCCGCCCA
3051 TGCCGATATG CAGGGACGCC GCCTGAAAGC CGTATCGGAC GGGTTGGACC
3101 ACAACGGCAC GGGGTCGCGC GTCATCGCGC AAACCCAACA GGACGGTGGA
3151 ACGTGGGAAC AGGGCGGTGT TGAAGGCAAA ATGCGCGGCA GTACCCAAAC
3201 CGTCGGCATT GCCGCGAAAA CCGGCGAAAA TACGACAGCA GCCGCCACAC
3251 TGGGCATGGG ACGCAGCACA TGGAGCGAAA ACAGTGCAAA TGCAAAAACC
3301 GACAGCATTA GTCTGTTTGC AGGCATACGG CACGATGCGG GCGATATCGG
3351 CTATCTCAAA GGCCTGTTCT CCTACGGACG CTACAAAAAC AGCATCAGCC
3401 GCAGCACCGG TGCGGACGAA CATGCGGAAG GCAGCGTCAA CGGCACGCTG
3451 ATGCAGCTGG GCGCACTGGG CGGTGTCAAC GTTCCGTTTG CCGCAACGGG
3501 AGATTTGACG GTCGAAGGCG GTCTGCGCTA CGACCTGCTC AAACAGGATG
3551 CATTCGCCGA AAAAGGCAGT GCTTTGGGCT GGAGCGGCAA CAGCCTCACT
3601 GAAGGCACGC TGGTCGGACT CGCGGGTCTG AAGCTGTCGC AACCCTTGAG
3651 CGATAAAGCC GTCCTGTTTG CAACGGCGGG CGTGGAACGC GACCTGAACG
3701 GACGCGACTA CACGGTAACG GGCGGCTTTA CCGGCGCGAC TGCAGCAACC
3751 GGCAAGACGG GGGCACGCAA TATGCCGCAC ACCCGTCTGG TTGCCGGCCT
3801 GGGCGCGGAT GTCGAATTCG GCAACGGCTG GAACGGCTTG GCACGTTACA
3851 GCTACGCCGG TTCCAAACAG TACGGCAACC ACAGCGGACG AGTCGGCGTA
3901 GGCTACCGGT TCCTCGAGCA CCACCACCAC CACCACTGA
   1 MVAADIGAGL ADALTAPLDH KDKGLQSLTL DQSVRKNEKL KLAAQGAEKT
  51 YGNGDSLNTG KLKNDKVSRF DFIRQIEVDG QLITLESGEF QVYKQSHSAL
 101 TAFQTEQIQD SEHSGKMVAK RQFRIGDIAG EHTSFDKLPE GGRATYRGTA
 151 FGSDDAGGKL TYTIDFAAKQ GNGKIEHLKS PELNVDLAAA DIKPDGKRHA
 201 VISGSVLYNQ AEKGSYSLGI FGGKAQEVAG SAEVKTVNGI RHIGLAAKQL
 251 EGSGGGGTSA PDFNAGGTGI GSNSRATTAK SAAVSYAGIK NEMCKDRSML
 301 CAGRDDVAVT DRDAKINAPP PNLHTGDFPN PNDAYKNLIN LKPAIEAGYT
 351 GRGVEVGIVD TGESVGSISF PELYGRKEHG YNENYKNYTA YMRKEAPEDG
 401 GGKDIEASFD DEAVIETEAK PTDIRHVKEI GHIDLVSHII GGRSVDGRPA
 451 GGIAPDATLH IMNTNDETKN EMMVAAIRNA WVKLGERGVR IVNNSFGTTS
 501 RAGTADLFQI ANSEEQYRQA LLDYSGGDKT DEGIRLMQQS DYGNLSYHIR
 551 NKNMLFIFST GNDAQAQPNT YALLPFYEKD AQKGIITVAG VDRSGEKFKR
 601 EMYGEPGTEP LEYGSNHCGI TANWCLSAPY EASVRFTRTN PIQIAGTSFS
 651 APIVTGTAAL LLQKYPWMSN DNLRTTLLTT AQDIGAVGVD SKFGWGLLDA
 701 GKAMNGPASF PFGDFTADTK GTSDIAYSFR NDISGTGGLI KKGGSQLQLH
 751 GNNTYTGKTI IEGGSLVLYG NNKSDMRVET KGALIYNGAA SGGSLNSDGI
 801 VYLADTDQSG ANETVHIKGS LQLDGKGTLY TRLGKLLKVD GTAIIGGKLY
 851 MSARGKGAGY LNSTGRRVPF LSAAKIGQDY SFFTNIETDG GLLASLDSVE
 901    KTAGSEGDTL SYYVRRGNAA RTASAAAHSA PAGLKHAVEQ GGSNLENLMV
 951    ELDASESSAT PETVETAAAD RTDMPGIRPY GATFRAAAAV QHANAADGVR
1001    IFNSLAATVY ADSTAAHADM QGRRLKAVSD GLDHNGTGLR VIAQTQQDGG
1051    TWEQGGVEGK MRGSTQTVGI AAKTGENTTA AATLGMGRST WSENSANAKT
1101    DSISLFAGIR HDAGDIGYLK GLFSYGRYKN SISRSTGADE HAEGSVNGTL
1151    MQLGALGGVN VPFAATGDLT VEGGLRYDLL KQDAFAEKGS ALGWSGNSLT
1201    EGTLVGLAGL KLSQPLSDKA VLFATAGVER DLNGRDYTVT GGFTGATAAT
1251    GKTGARNMPH TRLVAGLGAD VEFGNGWNGL ARYSYAGSKQ YGNHSGRVGV
1301    GYRFLEHHHH HH*
ΔG741-ORF46.1
   1    ATGGTCGCCG CCGACATCGG TGCGGGGCTT GCCGATGCAC TAACCGCACC
  51    GCTCGACCAT AAAGACAAAG GTTTGCAGTC TTTGACGCTG GATCAGTCCG
 101    TCAGGAAAAA CGAGAAACTG AAGCTGGCGG CACAAGGTGC GGAAAAAACT
 151    TATGGAAACG GTGACAGCCT CAATACGGGC AAATTGAAGA ACGACAAGGT
 201    CAGCCGTTTC GACTTTATCC GCCAAATCGA AGTGGACGGG CAGCTCATTA
 251    CCTTGGAGAG TGGAGAGTTC CAAGTATACA AACAAAGCCA TTCCGCCTTA
 301    ACCGCCTTTC AGACCGAGCA AATACAAGAT TCGGAGCATT CCGGGAAGAT
 351    GGTTGCGAAA CGCCAGTTCA GAATCGGCGA CATAGCGGGC GAACATACAT
 401    CTTTTGACAA GCTTCCCGAA GGCGGCAGGG CGACATATCG CGGGACGGCG
 451    TTCGGTTCAG ACGATGCCGG CGGAAAACTG ACCTACACCA TAGATTTCGC
 501    CGCCAAGCAG GGAAACGGCA AAATCGAACA TTTGAAATCG CCAGAACTCA
 551    ATGTCGACCT GGCCGCCGCC GATATCAAGC CGGATGGAAA ACGCCATGCC
 601    GTCATCAGCG GTTCCGTCCT TTACAACCAA GCCGAGAAAG GCAGTTACTC
 651    CCTCGGTATC TTTGGCGGAA AAGCCCAGGA AGTTGCCGGC AGCGCGGAAG
 701    TGAAAACCGT AAACGGCATA CGCCATATCG GCCTTGCCGC CAAGCAACTC
 751    GACGGTGGCG GAGGCACTGG ATCCTCAGAT TTGGCAAACG ATTCTTTTAT
 801    CCGGCAGGTT CTCGACCGTC AGCATTTCGA ACCCGACGGG AAATACCACC
 851    TATTCGGCAG CAGGGGGGAA CTTGCCGAGC GCAGCGGCCA TATCGGATTG
 901    GGAAAAATAC AAAGCCATCA GTTGGGCAAC CTGATGATTC AACAGGCGGC
 951    CATTAAAGGA AATATCGGCT ACATTGTCCG CTTTTCCGAT CACGGGCACG
1001    AAGTCCATTC CCCCTTCGAC AACCATGCCT CACATTCCGA TTCTGATGAA
1051    GCCGGTAGTC CCGTTGACGG ATTTAGCCTT TACCGCATCC ATTGGGACGG
1101    ATACGAACAC CATCCCGCCG ACGGCTATGA CGGGCCACAG GGCGGCGGCT
1151    ATCCCGCTCC CAAAGGCGCG AGGGATATAT ACAGCTACGA CATUAAAGGC
1201    GTTGCCCAAA ATATCCGCCT CAACCTGACC GACAACCGCA GCACCGGACA
1251    ACGGCTTGCC GACCGTTTCC ACAATGCCGG TAGTATGCTG ACGCAAGGAG
1301    TAGGCGACGG ATTCAAACGC GCCACCCGAT ACAGCCCCGA GCTGGACAGA
1351    TCGGGCAATG CCGCCGAAGC CTTCAACGGC ACTGCAGATA TCGTTAAAAA
1401    CATCATCGGC GCGGCAGGAG AAATTGTCGG CGCAGGCGCT GCCGTGCAGG
1451    GCATAAGCGA AGGCTCAAAC ATTGCTGTCA TGCACGGCTT GGGTCTGCTT
1501    TCCACCGAAA ACAAGATGGC GCGCATCAAC GATTTGGCAG ATATGGCGCA
1551    ACTCAAAGAC TATGCCGCAG CAGCCATCCG CGATTGGGCA GTCCAAAACC
1601    CCAATGCCGC ACAAGGCATA GAAGCCGTCA GCAATATCTT TATGGCAGCC
1651    ATCCCCATCA AAGGGATTGG AGCTGTTCGG GGAAAATACG GCTTGGGCGG
1701    CATCACGGCA CATCCTATCA AGCGGTCGCA GATGGGCGCG ATCGCATTGC
1751    CGAAAGGGAA ATCCGCCGTC AGCGACAATT TTGCCGATGC GGCATACGCC
1801    AAATACCCGT CCCCTTACCA TTCCCGAAAT ATCCGTTCAA ACTTGGAGCA
1851    GCGTTACGGC AAAGAAAACA TCACCTCCTC AACCGTGCCG CCGTCAAACG
1901    GCAAAAATGT CAAACTGGCA GACCAACGCC ACCCGAAGAC AGGCGTACCG
1951    TTTGACGGTA AAGGGTTTCC GAATTTTGAG AAGCACGTGA AATATGATAC
2001    GCTCGAGCAC CACCACCACC ACCACTGA
   1    MVAADIGAGL ADALTAPLDH KDKGLQSLTL DQSVRKNKKL KLAAQGAELT
  51    YGNGDSLNTG KLKNDKVSRF DFIRQIEVDG QLITLESGEF QVYKQSHSAL
 101    TAFQTEQIQD SEHSGKMVAK RQFRIGDIAG EHTSFDKLPE GGRATYRGTA
 151    FGSDDAGGKL TYTIDFAAKQ GNGKIEHLKS PELNVDLAAA DIKPDGKRHA
 201    VISGSVLYNQ AEKGSYSLGI FGGKAQEVAG SAEVKTVNGI RHIGLAAKQL
 251    DGGGGTGSSD LANDSFIRQV LDRQHFEPDG KYHLFGSRGE LAERSGHIGL
 301    GKIQSHQLGN LMIQQAAIKG NIGYIVRFSD HGHEVHSPFD NHASHSDSDE
 351    AGSPVDGFSL YRIHWDGYEH HPADGYDGPQ GGGYPAPKGA RDIYSYDIKG
 401    VAQNIRLNLT DNRSTGQRLA DRFHNAGSML TQGVGDGFKR ATRYSPELDR
 451    SGNAAEAFNG TADIVKNIIG AAGEIVGAGD AVQGISEGSN IAVMHGLGLL
 501    STENKNARIN DLADMAQLKD YAAAAIRDWA VQNPNAAQGI EAVSNIFMAA
 551    IPIKGIGAVR GKYGLGGITA HPIKRSQMGA IALPKGKSAV SDNFADAAYA
 601    KYPSPYHSRN IRSNLEQRYG KENITSSTVP PSNGKNVKLA DQRHPKTGVP
 651    FDGKGFPNFE KHVKYDTLEH HHHHH*
实施例16-与287/ΔG287的C-未端融合(‘杂交体′)
按照本发明,两种蛋白质A和B的杂交体可能是NH2-A-B-COOH或NH2-B-A-COOH。用在919、953和ORF46.1的C-端(以‘287-His′形式)或N-未端(以ΔG287形式-如上所示的序列)的蛋白质287研究了这种差异的影响。使用一组菌株,包括同源菌株2996。用FCA作为佐剂:
       287&919          287&953           287&ORF46.1
菌株 ΔG287-919 919-287 ΔG287-953 953-287 ΔG287-46.1 46.1-287
2996 128000 16000 65536 8192 16384 8192
BZ232 256 128 128 <4 <4 <4
1000 2048 <4 <4 <4 <4 <4
MC58 8192 1024 16384 1024 512 128
NGH38 32000 2048 >2048 4096 16384 4096
394/98 4096 32 256 128 128 16
MenA(F6124) 32000 2048 >2048 32 8192 1024
MenC(BZ133) 64000 >8192 >8192 <16 8192 2048
通常用N-未端的297(以ΔG的形式)观察到较好的杀菌滴定度。
当融合于蛋白质961[NH2-ΔG287-961-COOH-上述可示序列]时,得到的的蛋白质是不溶的且必须变性和复性以用于纯化。复性后,发现50%蛋白质仍不溶解。比较可溶性和不溶性蛋白质,用可溶性蛋白质获得的杀菌滴定度好得多(FCA作为佐剂):
2996 BZ232 MC58 NGH38 F6124 BZ133
可溶性 65536 128 4096 >2048 >2048 4096
难溶性 8192 <4 <4 16 n.d. n.d.
然而,用明矾佐剂替代可以改善难溶形式蛋白质的滴定度:
难溶性 32768  128  4096 >2048 >2048  2048
实施例17-N-未端融合(′杂交体′)于287
将蛋白质287以全长、含C-未端His-标记、或无其前导肽但而包含C-未端His-标记表达的水平相当低。用N-未端GST-融合实现较好的表达。
或者将GST用作N-未端融合配体,将287置于蛋白质919的C-未端(‘919-287′)、蛋白质953的C-未端(‘953-287′)和蛋白质ORF46.1的C-未端(‘ORF46.1-287′)。在这两种情况中,除去前导肽,且杂交体是直接的符合读框的融合。
为了产生953-287杂交体,设计各序列的前导肽的正向引物下游以除去这两种蛋白质的前导肽;除去953反向引物中的终止密码子序列,但包含在287反向引物中。对953基因而言,用于扩增的5′和3′引物分别包括NdeI和BamHI限制酶切位点,而对287基因的扩增而言,5′和3′引物分别包括BamHI和XhoI限制酶切位点。在这种方法中,使用NdeI-BamHI(用于克隆第一个基因)和随后的BamHI-XhoI(用于克隆第二基因)可以实现pET21b+中两个基因的顺序定向克隆。
通过将编码287的成熟部分的序列克隆入pET21b+中的919-His克隆的3′端的XhoI位点中,获得919-287杂交体。设计用于扩增287基因的引物,从而在PCR片段的5′端引入SalI限制酶切位点,并在3′端引入XhoI位点。由于由SalI和XhoI限制酶产生的粘性末端是相容的,可以将用SalI-XhoI消化的287PCR扩增产物插入由XhoI切割的pET21b-919克隆中。
类似地获得ORF46.1-287杂交体。
将针对杂交蛋白产生的抗体的杀菌效力(同源菌株)与针对组分抗原的简单混合物产生的抗体的杀菌效力相比较:
与287的混合物  与287的杂交体
919 32000  16000
953 8192  8192
ORF46.1 128  8192
还获得了919-287和953-287针对异源MenB菌株和血清型A和C的杀菌活性数据:
         919         953      ORF46.1
菌株 混合物 杂交体 混合物 杂交体 混合物 杂交体
MC58 512 1024 512 1024 - 1024
NGH38 1024 2048 2048 4096 - 4096
BZ232 512 128 1024 16 - -
MemA(F6124) 512 2048 2048 32 - 1024
MenC(C11) >2048 n.d. >2048 n.d. - n.d.
MenC(BZ133) >4096 >8192 >4096 <16 - 2048
还构建了ORF46.1和919的杂交体。最佳的结果(高四倍的滴定度)是用在N-未端的919实现的。
还测试了杂交体919-519His、ORF97-225His和225-ORF97His。它们得到中等ELISA滴定度和杀菌的抗体应答。
实施例18-ORF4的前导肽
如上所示,可以将ORF4的前导肽融合于其它蛋白质(如蛋白质287和919)的成熟序列。其可以指导大肠杆菌中的脂质化。
实施例19-564中的结构域
蛋白质′564′非常大(2073aa),且其难以克隆并以完整形式表达。为了便于表达,如图8所示(按MC58序列)将该蛋白质分为四个结构域:
结构域 A B C D
氨基酸 79-360 361-731 732-2044 2045-2073
这些结构域显示出如下同源性:
·结构域A显示与其它细菌毒素同源:
gb|AAG03431.1|AE004443-9       可能血凝素[绿脓假单胞菌](38%)
gb|AAC31981.1|(139897)         HecA[菊果胶杆菌](45%)
emb|CAA36409.1|(X52156)        丝状血凝素[百日咳博德特氏菌](31%)
gb|AAC79757.1|(AF057695)       大量上清液蛋白质1[杜氏嗜血菌](26%)
gb|AAA25657.1|(M30186)         HpmA前体[奇异变形菌](29%)
·结构域B显示为非同源的,且是对564特异性的。
·结构域C显示为与以下同源:
gb|AAF84995.1|AE004032         HA-样分泌的蛋白质[苛养木杆菌](33%)
gb|AAG05850.1|AE004673         假说蛋白质[铜绿假单胞菌](27%)
gb|AAF68414.1AF237928          推定的FHA[多杀巴斯德氏菌](23%)
gb|AAC79757.1|(AF057695)       大量上清液蛋白质1[杜氏嗜血菌](23%)
pir||S21010                    FHAB前体[百日咳博德特氏菌](20%)
·结构域D显示与前体细菌毒素同源:
gb|AAF84995.1|AE004032_14   HA-样分泌的蛋白质[苛养木杆菌](29%)
用MC58菌株序列,以GST-融合(未纯化)和his-标记的蛋白质形式获得564ab良好的细胞内表达;该结构域-对还以脂蛋白形式表达,其表现出在外膜/上清液组分中有中等表达。
当以his-标记的产物(未纯化)表达时,b结构域显示中等细胞内表达,而以GST-融合则表达良好。
以GST-融合表达时c,结构域显示良好的细胞内表达,但是不溶的。以his标记的产物(未纯化)表达时,d结构域显示中等细胞内表达。以GST-融合体表达时,cd蛋白质结构域对表现中等细胞内表达(未纯化)。
用c结构域和bc对观察到良好的杀菌试验滴定度。
实施例20-919前导肽
在以上的实施例1中讨论了919的20mer前导肽:
                 MKKYLFRAAL YGIAAAILAA
如实施例1所示,该前导肽的缺失改进了异源表达(如用ORF4前导肽替代该前导肽一样)。通过将编码序列融合于摩氏摩根氏菌(Morganella morganii)的PhoC报道基因研究了919前导肽对表达的影响[Thaller等,(1994)Microbiology 140:1341-1350]。将该构建物克隆入NdeI和XhoI位点间的pET21-b质粒中(图9):
  1 MKKYLFRAAL YGIAAAILAA AIPAGNDATT KPDLYYLKNE QAIDSLKLLP
 51 PPPEVGSIQF LNDQAMYEKG  RMLRNTERGK QAQADADLAA GGVATAFSGA
101 FGYPITRKDS PELYKLLTNM  IEDAGDLATR SAKEHYMRIR PFAFYGTETC
151 NTKDQKKLST NGSYPSGHTS  IGWATALVLA EVNPANQDAI LERGYQLGSS
201 RVICGYHWQS DVDAARIVGS  AAVATLHSDP AFQAQLAKAK QEFAQKSQK*
该质粒的PhoC的表达水平比相同的但包含天然PhoC信号肽的构建物中发现的低>200倍。即使用大肠杆菌Plac启动子替代T7启动子后也得到相同的结果。这表明919前导序列对表达的影响并非取决于所用的启动子。
为了研究这些结果是否是由于919信号肽核苷酸序列(二级结构形式,对RNA酶等敏感)的某些特性或存在该信号肽引起的蛋白质不稳定性导致的,产生了许多突变体。所用的方法是通过克隆含简并密码子的合成接头替代919信号肽序列的核苷酸。用这种方法获得含核苷酸和/或氨基酸取代的变体。
使用两种不同的接头,设计919信号肽序列的两个不同区域中产生突变,即在第一19碱基对(L1)中和碱基20-36之间(S1)。
L1:5′T ATG AAa/g TAc/t c/tTN TTt/c a/cGC GCC GCC CTG TAC GGC ATC GCC GCC
GCC ATC CTC GCC GCC GCG ATC CC 3′
S1:5′T ATG AAA AAA TAC CTA TTC CGa/g GCN GCN c/tTa/g TAc/t GGc/g ATC GCC
GCC GCC ATC CTC GCC GCC GCG ATC CC 3′
获得的一些突变体的序列排序如下。
L1变体:
9L1-a   ATGAAGAAGTACCTTTTCAGCGCCGCC~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
9L1-e   ATGAAAAAATACTTTTTCCGCGCCGCC~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
9L1-d   ATGAAAAAATACTTTTTCCGCGCCGCC~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
9L1-f   ATGAAAAAATATCTCTTTAGCGCCGCCCTGTACGGCATCGCCGCCGCCATCCTCGCCGCC
919sp   ATGAAAAAATACCTATTCCGCGCCGCCCTGTACGGCATCGCCGCCGCCATCCTCGCCGCC
9L1a    MKKYLFSAA~~~~~~~~~~~
9L1e    MKKYFFRAA~~~~~~~~~~~
9L1d    MKKYFFRAA~~~~~~~~~~~
9L1f    MKKYLFSAALYGIAAAILAA
919sp   MKKYLFRAALYGIAAAILAA    (即,天然信号肽)
S1突变体:
9S1-e   ATGAAAAAATACCTATTC..................ATCGCCGCCGCCATCCTCGCCGCC
9S1-c   ATGAAAAAATACCTATTCCGAGCTGCCCAATACGGCATCGCCGCCGCCATCCTCGCCGCC
9S1-b   ATGAAAAAATACCTATTCCGGGCCGCCCAATACGGCATCGCCGCCGCCATCCTCGCCGCC
9S1-i   ATGAAAAAATACCTATTCCGGGCGGCTTTGTACGGGATCGCCGCCGCCATCCTCGCCGCC
919sp   ATGAAAAAATACCTATTCCGCGCCGCCCTGTACGGCATCGCCGCCGCCATCCTCGCCGCC
9S1e    MKKYLF......IAAAILAA
9S1c    MKKYLFRAAQYGIAAAILAA
9S1b    MKKYLPRAAQYGIAAAILAA
9S1i    MKKYLRFAALYGIAAAILAA
919sp   MKKYLFRAALYGIAAAILAA
如序列排序中所示,分析的的大部分突变体包含由宿主细胞出人意料地产生的符合读框的缺失。
通过用从L1和S1突变的克隆制备的DNA转化大肠杆菌BL21(DE3)细胞进行突变体的筛选。通过在包含100μg/ml氨苄青霉素、50μg/ml甲基绿、1mg/mlPDP(酚酞二磷酸)的LB平板上划线,筛选高PhoC活性的单转化体。在该培养基上产生PhoC的细胞变成绿色(图10)。
用pNPP作为PhoC活性的底物,在液体培养基中对这些突变体产生的PhoC进行的定量分析。测定在液体培养基中生长0、30、90、180分钟的实变体的细胞提取物和上清液的比活性为:
细胞提取物
     0       30       90       180
c对照   0,00      0,00      0,00       0,001,11      1,11      3,33       4,44102,12    111,00    149,85     172,05206,46    111,00     94,35      83,255,11      4,77      4,00       3,1127,75     94,35     82,14      36,63156,51    111,00     72,15      28,8672,15     33,30     21,09      14,43156,51     83,25     55,50      26,64194,25    180,93    149,85     142,08
9phoC
9S1e
9L1a
9L1d
9L1f
9S1b
9S1c
9S1i
phoCwt
上清液
    0       30       90      180
对照   0,00      0,00      0,00      0,000,33      0,00      0,00      0,000,11      0,22      0,44      0,894,88      5,99      5,99      7,220,11      0,11      0,11      0,110,11      0,22      0,11      0,111,44      1,44      1,44      1,670,44      0,78      0,56      0,670,22      0,44      0,22      0,7834,41    43,29     87,69    177,60
9phoC
9S1e
9L1a
9L1d
9L1f
9S1b
9S1c
9S1l
phoCwt
一些突变体产生大量PhoC,尤其是突变体9L1a可以在培养基中分泌PhoC。这是值得关注的,因为该变体的信号肽序列的长度仅为9个氨基酸。这是至今最短的信号肽。
实施例21-Maf-相关蛋白质的C-端缺失
MafB-相关蛋白质包括703、ORF46和ORF29。
MC58的730蛋白质具有如下序列:
   1 VKPLRRLTNL LAACAVAAAA LIQPALAADL AQDPFITDNA QRQHYEPGGK
  51 YHLFGDPRGS VSDRTGKINV IQDYTHQMGN  LLIQQANING TIGYHTRFSG
 101 HGHEEHAPFD NHAADSASEE KGNVDEGFTV  YRLNWEGHEH HPADSYDGPK
 151 GGNYPKPTGA RDEYTYHVNG TARSIKLNPT  DTRSIRQRIS DNYSNLGSNF
 201 SDRADEANRK MFEHNAKLDR WGNSMEFING  VAAGALNPFI SAGEALGIGD
 251 ILYGTRYAID KAAMRNLAPL PAEGKFAVIG  GLGSVAGFEK NTREAVDRWI
 301 QENPNAAETV EAVFNVAAAA KVAKLAKAAK  PGKAAVSGDF ADSYKKKLAL
 351 SDSARQLYQN AKYREALDIH YEDLIRRKTD  GSSKFINGRE IDAVTNDALI
 401 QAKRTISAID KPKNFLNQKN RKQIKATIEA  ANQQGKRAEF WFKYGVHSQV
 451 KSYIESKGGI VKTGLGD*
前导肽是加下划线的。
730显示与ORF46类似的特性(见以上实施例8):
-与Orf46一样,730序列在MenB、MenA和淋球菌之间的保守性仅对N-未端部分高(>80%)。C-未端(自~340)是高度趋异的。
-其预计的二级结构包含跨越分子中心区域(aa.227-247)的疏水片段。
-大肠杆菌中全长基因的表达产生产量很低的蛋白质。从标记的或未标记的构建物(除去信号肽序列)的表达对宿主细胞有毒性影响。换言之,细胞质中全长成熟蛋白质的存在对宿主细胞是非常毒的,而当其转位至周质(由信号肽介导)对细胞生存力没有可检测的影响。730的这种“细胞内毒性”特别高,因为只可用recA遗传背景(大肠杆菌菌株:用于克隆的HB101;用于表达的HMS174(DE3))以很低的频率得到用于表达无前导肽的730的克隆。
为了克服这种毒性,将实施例8中用于ORF46的类似方法用于730。得到四种C-未端截短的形式,每种都被很好地表达。它们都是从His-标记的无前导肽730的细胞内表达得到的。
形式A由成熟蛋白质的N-未端疏水区域(aa.28-226)构成。将其纯化性作为可溶性His标记的产物,其具有比预计更高的分子量(MW)。
形式B延伸至血清群之间保守的区域(aa.28-340)的未端。将其纯化为不溶性His标记的产物。
在筛选能在菌株HMS174(DE3)中高水平表达730-His克隆的克隆后,获得命名为C1和C2的C-未端截短的形式。简言之,用含有编码全长成熟730蛋白质的His标记的序列的pET21b质粒转化recA菌株HMS174(DE3)。低频率得到转化体,其显示出两种表型:大集落和非常小的集落。分析了若干大集落和小集落对730-His克隆的表达。只有大集落的细胞超量表达抗730A抗体识别的蛋白质。但是,不同集落中超量表达的蛋白质的分子量各不相同。对其中的两个克隆进行测序表明:这两种情况中,在编码730的C未端区域的序列中发生了大肠杆菌IS序列的整合。这两个整合在C1中产生了与另一个密码子的符合读框的融合,在C2中产生了与另外12个密码子的符合读框的融合(图11)。产生的730“突变体”形式具有如下的序列:
730-C1(IS1插入引起的-图11A)
  1 MADLAQDPFI TDNAQRQHYE PGGKYHLFGD PRGSVSDRTG KINVIQDYTH
 51 QMGNLLIQQA NINGTIGYHT RFSGHGHEEH APFDNHAADS ASEEKGNVDE
101 GFTVYRLNWE GHEHHPADAY DGPKGGNYPK PTGARDEYTY HVNGTARSIK
151 LNPTDTRSIR QRISDNYSNL GSNFSDRADE ANRKMFEHNA KLDRWGNSME
201 FINGVAAGAL NPFISAGEAL GIGDILYGTR YAIDKAAMRN IAPLPAEGKF
251 AVIGGLGSVA GFEKNTREAV DRWIQENPNA AETVEAVFNV AAAAKVAKLA
301 KAAKPGKAAV SGDFADSYKK KLALSDSARQ LYQNAKYREA LDIHYEDLIR
351 RKTDGSSKFI NGREIDAVTN DALIQA R *
由插入产生的其它氨基酸下加下划线。
730-C2(IS5插入引起的-图11B)
  1 MADLAQDPEI TDNAQRQHYE PGGKYHLFGD PRGSVSDRGK KINVIQDYTH
 51 QMGNLLIQQA NINGTIGYHT RFSGHGHEEH APFDNHAADS ASEEKGNVDE
101 GFTVYRLNWE GHEHHPADAY DGPKGGNYPK PTGARDEYTY HVNGTARSIK
151 LNPTDTRSIR QRISDNYSNL GSNFSDRADE ANRKMFEHNA KLDRWGNSME
201 FINGVAAGAL NPFISAGEAL GIGDILYGTR YAIDKAAMRN IAPLPAEGKF
251 AVIGGLGSVA GFEKNTREAV DRWIQENPNA AETVEAVFNV AAAAKVAKLA
301 KAAKPGKAAV SGDFADSYKK KLALSDSARQ LYQNAKYREA L GKVRISGEI
351 LLG *
由插入产生的其它氨基酸下加下划线。
总之,730-C1形式的细胞内表达产生大很高水平的量蛋白质,且对宿主细胞无毒,而天然C-未端的存在则是有毒的。这些数据表明730的“细胞内毒性”与蛋白质的C-未端65氨基酸相关。
用有或无前导肽(氨基酸1-26;缺失得到胞质表达)和有或无His-标记的表达,已进行了ORF29到前231或368氨基酸的相等的截短。
实施例22-961中的结构域
如上实施例9所述,在大肠杆菌中最佳地表达961的GSt融合。为了改进表达,将蛋白质分成结构域(图12)。
以YadA(由耶尔森氏菌产生的粘附素,已证明其是位于细胞表面上的粘附素,其形成产生表面凸起的低聚物[Hoiczyk等(2000)EMBO J 19:5989-99])为基础,设计了916的结构域,它们为:前导肽、头部结构域、卷曲-螺旋区域(茎部)和膜锚着点结构域。
有或无前导肽表达这些结构域,且任选地融合于C-未端His-标记或N-未端GST。用SDS-PAGE和Western印迹,从过夜(o/n)培育或用IPTG诱导3小时后,分析表达961不同结构域的大肠杆菌克隆用于表达的蛋白质的产生和定位。结果如下:
    总裂解物(Western印迹)      周质(Western印迹)      上清液(Western印迹)     OMVSDS-PAGE
961(o/n)961(IPTG)     -+/-     --       --
961-L(o/n)961-L(IPTG)     ++     --       --     ++
961c-L(o/n)961c-L(IPTG)     -+     -+       -+
961Δ1-L(o/n)961Δ1-L(IPTG)     -+     --       -- +
这些结果在大肠杆菌中显示:
·961-L是高度表达的且位于外膜上。用Western印迹分析已检测到2个特异性条带:一条为~45kDa(预计的分子量),另一条为~180kDa,表明961-L可以形成低聚物。另外,这些聚集体在过夜培养物(无IPTG诱导)中表达得更多。用该克隆的OMV制备物免疫接种小鼠,并获得血清。用过夜培养物(主要为寡聚物形式)的血清是杀菌的;IPTG-诱导的培养物(主要为单体)不是杀菌的。
·961Δ1-L(在锚区域中部分缺失)是高度表达的,且位于外膜,但不形成低聚物;
·961c-L(无锚区域)以可溶的形式产生,并被在上清液中输出。
使用His-融合的ELISA和血清杀菌试验中的滴定度如下:
  ELISA     杀菌
 961a(aa24-268)   24397     4096
961b(aa269-405)     7763     64
961c-L     29770     8192
961c(2996)     30774     >65536
961c(MC58)     33437     16384
961d     26069     >65536
用表达不同形式961(961、961-L、961Δ1-L和961c-L)的大肠杆菌克隆研究了961是否是粘附素(参见YadA)。用(a)人上皮细胞和(b)大肠杆菌克隆(过夜培育或IPTG诱导3小时后),进行粘附试验。过夜培育的961-L(961Δ1-L)和IPTG诱导的961c-L(在表面上表达蛋白质的克隆)粘附于人上皮细胞。
也将961c用于杂交蛋白(见上)。由于961和其结构域变体指导高效表达,它们理想地适用于杂交蛋白的N-未端部分。
实施例23-其它杂交体
以下显示了本发明的其它杂交蛋白(同样参见图14)。当与单独蛋白质相比时,它们是有利的:
ORF46.1-741
   1 ATGTCAGATT TGGCAAACGA TTCTTTTATC CGGCAGGTTC TCGACCGTCA
  51 GCATTTCGAA CCCGACGGGA AATACCACCT ATTCGGCAGC AGGGGGGAAC
 101 TTGCCGAGCG CAGCGGCCAT ATCGGATTGG GAAAAATACA AAGCCATCAG
 151 TTGGGCAACC TGATGATTCA ACAGGCGGCC ATTAAAGGAA ATATCGGCTA
 201 CATTGTCCGC TTTTCCGATC ACGGGCACGA AGTCCATTCC CCCTTCGACA
 251 ACCATGCCTC ACATTCCGAT TCTGATGAAG CCGGTAGTCC CGTTGACGGA
 301 TTTAGCCTTT ACCGCATCCA TTGGGACGGA TACGAACACC ATCCCGCCGA
 351 CGGCTATGAC GGGCCACAGG GCGGCGGCTA TCCCGCTCCC AAAGGCGCGA
 401 GGGATATATA CAGCTACGAC ATAAAAGGCG TTGCCCAAAA TATCCGCCTC
 451 AACCTGACCG ACAACCGCAG CACCGGACAA CGGCTTGCCG ACCGTTTCCA
 501 CAATGCCGGT AGTATGCTGA CGCAAGGAGT AGGCGACGGA TTCAAACGCG
 551 CCACCCGATA CAGCCCCGAG CTGGACAGAT CGGGCAATGC CGCCGAAGCC
 601 TTCAACGGCA CTGCAGATAT CGTTAAAAAC ATCATCGGCG CGGCAGGAGA
 651 AATTGTCGGC GCAGGCGATG CCGTGCAGGG CATAAGCGAA GGCTCAAACA
 701 TTGCTGTCAT GCACGGCTTG GGTCTGCTTT CCACCGAAAA CAAGATGGCG
 751 CGCATCAACG ATTTGGCAGA TATGGCGCAA CTCAAAGACT ATGCCGCAGC
 801 AGCCATCCGC GATTGGGCAG TCCAAAACCC CAATGCCGCA CAAGGCATAG
 851 AAGCCGTCAG CAATATCTTT ATGGCAGCCA TCCCCATCAA AGGGATTGGA
 901 GCTGTTCGGG GAAAATACGG CTTGGGCGGC ATCACGGCAC ATCCTATCAA
 951 GCGGTCGCAG ATGGGCGCGA TCGCATTGCC GAAAGGGAAA TCCGCCGTCA
1001 GCGACAATTT TGCCGATGCG GCATACGCCA AATACCCGTC CCCTTACCAT
1051 TCCCGAAATA TCCGTTCAAA CTTGGAGCAG CGTTACGGCA AAGAAAACAT
1101 CACCTCCTCA ACCGTGCCGC CGTCAAACGG CAAAAATGTC AAACTGGCAG
1151 ACCAACGCCA CCCGAAGACA GGCGTACCGT TTGACGGTAA AGGGTTTCCG
1201 AATTTTGAGA AGCACGTGAA ATATGATACG GGATCCGGAG GGGGTGGTGT
1251 CGCCGCCGAC ATCGGTGCGG GGCTTGCCGA TGCACTAACC GCACCGCTCG
1301 ACCATAAAGA CAAAGGTTTG CAGTCTTTGA CGCTGGATCA GTCCGTCAGG
1351 AAAAACGAGA AACTGAAGCT GGCGGCACAA GGTGCGGAAA AAACTTATGG
1401 AAACGGTGAC AGCCTCAATA CGGGCAAATT GAAGAACGAC AAGGTCAGCC
1451 GTTTCGACTT TATCCGCCAA ATCGAAGTGG ACGGGCAGCT CATTACCTTG
1501 GAGAGTGGAG AGTTCCAAGT ATACAAACAA AGCCATTCCG CCTTAACCGC
1551 CTTTCAGACC GAGCAAATAC AAGATTCGGA GCATTCCGGG AAGATGGTTG
1601 CGAAACGCCA GTTCAGAATC GGCGACATAG CGGGCGAACA TACATCTTTT
1651 GACAAGCTTC CCGAAGGCGG CAGGGCGACA TATCGCGGGA CGGCGTTCGG
1701 TTCAGACGAT GCCGGCGGAA AACTGACCTA CACCATAGAT TTCGCCGCCA
1751 AGCAGGGAAA CGGCAAAATC GAACATTTGA AATCGCCAGA ACTCAATGTC
1801 GACCTGGCCG CCGCCGATAT CAAGCCGGAT GGAAAACGCC ATGCCGTCAT
1851 CAGCGGTTCC GTCCTTTACA ACCAAGCCGA GAAAGGCAGT TACTCCCTCG
1901 GTATCTTTGG CGGAAAAGCC CAGGAAGTTG CCGGCAGCGC GGAAGTGAAA
1951 ACCGTAAACG GCATACGCCA TATCGGCCTT GCCGCCAAGC AACTCGAGCA
2001 CCACCACCAC CACCACTGA
   1 MSDLANDSFI RQVLDRQHFE PDGKYHLFGS RGELAERSGH IGLGKIQSHQ
  51 LGNLMIQQAA IKGNIGYIVR FSDHGHEVHS PFDNHASHSD SDEAGSPVDG
 101 FSLYRIHWDG YEHHPADGYD GPQGGGYPAP KGARDIYSYD IKGVAQNIRL
 151 NLTDNRSTGQ RLADRFHNAG SMLTQGVGDG FKRATRYSPE LDRSGMAAEA
 201 FNGTADIVKN IIGAAGEIVG AGDAVQGISE GSNIAVMHGL GLLSTENKMA
 251 RINDLADMAQ LKDYAAAAIR DWAVQNPNAA QGIEAVSNIF MAAIPIKGIG
 301 AVRGKYGLGG ITAHPIKPSQ MGAIALPKGK SAVSDNFADA AYAKYPSPYH
 351 SRNIRSNLEQ RYGKENITSS TVPPSNGKNV KLADQRHPKT GVPFDGKGFP
 401 NFEKHVKYDT GSGGGGVAAD IGAGLADALT APLDHKDKGL QSLTLDQSVR
 451 KNEKLKLAAQ GAEKTYGNGD SLNTGKLKND KVSRFDFIRQ IEVDGQLITL
 501 ESGEFQVYKQ SHSALTAFQT EQIQDSEHSG KMVAKRQFRI GDIAGEHTSF
 551 DKLPEGGRAT YRGTAFGSDD AGGKLTYTID FAAKQGNGKI EHLKSPELNV
 601 DLAAADIKPD GKRHAVISGS VLYNQAEKGS YSLGIFGGKA QEVAGSAEVK
 651 TVNGIRHIGL AAKQLEHHHH HH*
ORF46.1-961
   1 ATGTCAGATT TGGCAAACGA TTCTTTTATC CGGCAGGTTC TCGACCGTCA
  51 GCATTTCGAA CCCGACGGGA AATACCACCT ATTCGGCAGC AGGGGGGAAC
 101 TTGCCGAGCG CAGCGGCCAT ATCGGATTGG GAAAAATACA AAGCCATCAG
 151 TTGGGCAACC TGATGATTCA ACAGGCGGCC ATTAAAGGAA ATATCGGCTA
 201 CATTGTCCGC TTTTCCGATC ACGGGCACGA AGTCCATTCC CCCTTCGACA
 251 ACCATGCCTC ACATTCCGAT TCTGATGAAG CCGGTAGTCC CGTTGACGGA
 301 TTTAGCCTTT ACCGCATCCA TTGGGACGGA TACGAACACC ATCCCGCCGA
 351 CGGCTATGAC GGGCCACAGG GCGGCGGCTA TCCCGCTCCC AAAGGCGCGA
 401 GGGATATATA CAGCTACGAC ATAAAAGGCG TTGCCCAAAA TATCCGCCTC
 451 AACCTGACCG ACAACCGCAG CACCGGACAA CGGCTTGCCG ACCGTTTCCA
 501 CAATGCCGGT AGTATGCTGA CGCAAGGAGT AGGCGACGGA TTCAAACGCG
 551 CCACCCGATA CAGCCCCGAG CTGGACAGAT CGGGCAATGC CGCCGAAGCC
 601 TTCAACGGCA CTGCAGATAT CGTTAAAAAC ATCATCGGCG CGGCAGGAGA
 651 AATTGTCGGC GCAGGCGATG CCGTGCAGGG CATAAGCGAA GGCTCAAACA
 701 TTGCTGTCAT GCACGGCTTG GGTCTGCTTT CCACCGAAAA CAAGATGGCG
 751 CGCATCAACG ATTTGGCAGA TATGGCGCAA CTCAAAGACT ATGCCGCAGC
 801 AGCCATCCGC GATTGGGCAG TCCAAAACCC CAATGCCGCA CAAGGCATAG
 851 AAGCCGTCAG CAATATCTTT ATGGCAGCCA TCCCCATCAA AGGGATTGGA
 901 GCTGTTCGGG GAAAATACGG CTTGGGCGGC ATCACGGCAC ATCCTATCAA
 951 GCGGTCGCAG ATGGGCGCGA TCGCATTGCC GAAAGGGAAA TCCGCCGTCA
1001 GCGACAATTT TGCCGATGCG GCATACGCCA AATACCCGTC CCCTTACCAT
1051 TCCCGAAATA TCCGTTCAAA CTTGGAGCAG CGTTACGGCA AAGAAAACAT
1101 CACCTCCTCA ACCGTGCCGC CGTCAAACGG CAAAAATGTC AAACTGGCAG
1151 ACCAACGCCA CCCGAAGACA GGCGTACCGT TTGACGGTAA AGGGTTTCCG
1201 AATTTTGAGA AGCACGTGAA ATATGATACG GGATCCGGAG GAGGAGGAGC
1251 CACAAACGAC GACGATGTTA AAAAAGCTGC CACTGTGGCC ATTGCTGCTG
1301 CCTACAACAA TGGCCAAGAA ATCAACGGTT TCAAAGCTGG AGAGACCATC
1351 TACGACATTG ATGAAGACGG CACAATTACC AAAAAAGACG CAACTGCAGC
1401 CGATGTTGAA GCCGACGACT TTAAAGGTCT GGGTCTGAAA AAAGTCGTGA
1451 CTAACCTGAC CAAAACCGTC AATGAAAACA AACAAAACGT CGATGCCAAA
1501 GTAAAAGCTG CAGAATCTGA AATAGAAAAG TTAACAACCA AGTTAGCAGA
1551 CACTGATGCC GCTTTAGCAG ATACTGATGC CGCTCTGGAT GCAACCACCA
1601 ACGCCTTGAA TAAATTGGGA GAAAATATAA CGACATTTGC TGAAGAGACT
1651 AAGACAAATA TCGTAAAAAT TGATGAAAAA TTAGAAGCCG TGGCTGATAC
1701 CGTCGACAAG CATGCCGAAG CATTCAACGA TATCGCCGAT TCATTGGATG
1751 AAACCAACAC TAAGGCAGAC GAAGCCGTCA AAACCGCCAA TGAAGCCAAA
1801 CAGACGGCCG AAGAAACCAA ACAAAACGTC GATGCCAAAG TAAAAGCTGC
1851 AGAAACTGCA GCAGGCAAAG CCGAAGCTGC CGCTGGCACA GCTAATACTG
1901 CAGCCGACAA GGCCGAAGCT GTCGCTGCAA AAGTTACCGA CATCAAAGCT
1951 GATATCGCTA CGAACAAAGA TAATATTGCT AAAAAAGCAA ACAGTGCCGA
2001 CGTGTACACC AGAGAAGAGT CTGACAGCAA ATTTGTCAGA ATTGATGGTC
2051 TGAACGCTAC TACCGAAAAA TTGGACACAC GCTTGGCTTC TGCTGAAAAA
2101 TCCATTGCCG ATCACGATAC TCGCCTGAAC GGTTTGGATA AAACAGTGTC
2151 AGACCTGCGC AAAGAAACCC GCCAAGGCCT TGCAGAACAA GCCGCGCTCT
2201 CCGGTCTGTT CCAACCTTAC AACGTGGGTC GGTTCAATGT AACGGCTGCA
2251 GTCGGCGGCT ACAAATCCGA ATCGGCAGTC GCCATCGGTA CCGGCTTCCG
2301 CTTTACCGAA AACTTTGCCG CCAAAGCAGG CGTGGCAGTC GGCACTTCGT
2351 CCGGTTCTTC CGCAGCCTAC CATGTCGGCG TCAATTACGA GTGGCTCGAG
2401 CACCACCACC ACCACCACTG A
   1 MSDLANDSFI RQVLDRQHFE PDGKYHLFGS RGELAERSGH IGLGKIQSHQ
  51 LGNLMIQQAA IKGNIGYIVR FSDHGHEVHS PFDNHASHSD SDEAGSPVDG
 101 FSLYRIHWDG YEHHPADGYD GPQGGGYPAP KGARDIYSYD IKGVAQNIRL
 151 NLTDNRSTGQ RLADRFHNAG SMLTQGVGDG FKRATRYSPE LDRSGNAAEA
 201 FNGTADIVKN IIGAAGEIVG AGDAVQGISE GSNIAVMHGL GLLSTENKMA
 251 RINDLADMAQ LKDYAAAAIR DWAVQNPNAA QGIEAVSNIF MAAIPIKGIG
 301 AVRGKYGLGG ITAHPIKRSQ MGAIALPKGK SAVSDNFADA AYAKYPSPYH
 351 SRNIRSNLEQ RYGKENITSS TVPPSNGKNV KLADQRHPKT GVPFDGKGFP
 401 NFEKHVKYDT GSGGGGATND DDVKKAATVA IAAAYNNGQE INGFKAGETI
 451 YDIDEDGTTT KKDATAADVE ADDFKGLGLK KVVTNLTKTV NENKQNVDAK
 501 VKAAESEIEK LTTKLADTDA ALADTDAALD ATTNALNKLG ENITTFAEET
 551 KTNIVKIDEK LEAVADTVDK HAEAFNDIAD SLDETNTKAD EAVKTANEAK
 601 QTAEETKQNV DAKVKAAETA AGKAEAAAGT ANTAADKAEA VAAKVTDIKA
 651 DIATNKDNIA KKANSADVYT REESDSKFVR IDGLNATTEK LDTRLASAEK
 701 SIADHDTRLN GLDKTVSDLR KETRQGLAEQ AALSGLFQPY NVGRFNVYAA
 751 VGGYKSESAV AIGTGFRFTE NFAAKAGVAV GTSSGSSAAY HVGVNYEWLE
 801 HHHHHH*
ORF46.1-961c
   1 ATGTCAGATT TGGCAAACGA TTCTTTTATC CGGCAGGTTC TCGACCGTCA
  51 GCATTTCGAA CCCGACGGGA AATACCACCT ATTCGGCAGC AGGGGGGAAC
 101 TTGCCGAGCG CAGCGGCCAT ATCGGATTGG GAAAAATACA AAGCCATCAG
 151 TTGGGCAACC TGATGATTCA ACAGGCGGCC ATTAAAGGAA ATATCGGCTA
 201 CATTGTCCGC TTTTCCGATC ACGGGCACGA AGTCCATTCC CCCTTCGACA
 251 ACCATGCCTC ACATTCCGAT TCTGATGAAG CCGGTAGTCC CGTTGACGGA
 301 TTTAGCCTTT ACCGCATCCA TTGGGACGGA TACGAACACC ATCCCGCCGA
 351 CGGCTATGAC GGGCCACAGG GCGGCGGCTA TCCCGCTCCC AAAGGCGCGA
 401 GGGATATATA CAGCTACGAC ATAAAAGGCG TTGCCCAAAA TATCCGCCTC
 451 AACCTGACCG ACAACCGCAG CACCGGACAA CGGCTTGCCG ACCGTTTCCA
 501 CAATGCCGGT AGTATGCTGA CGCAAGGAGT AGGCGACGGA TTCAAACGCG
 551 CCACCCGATA CAGCCCCGAG CTGGACAGAT CGGGCAATGC CGCCGAAGCC
 601 TTCAACGGCA CTGCAGATAT CGTTAAAAAC ATCATCGGCG CGGCAGGAGA
 651 AATTGTCGGC GCAGGCGATG CCGTGCAGGG CATAAGCGAA GGCTCAAACA
 701 TTGCTGTCAT GCACGGCTTG GGTCTGCTTT CCACCGAAAA CAAGATGGCG
 751 CGCATCAACG ATTTGGCAGA TATGGCGCAA CTCAAAGACT ATGCCGCAGC
 801 AGCCATCCGC GATTGGGCAG TCCAAAACCC CAATGCCGCA CAAGGCATAG
 851 AAGCCGTCAG CAATATCTTT ATGGCAGCCA TCCCCATCAA AGGGATTGGA
 901 GCTGTTCGGG GAAAATACGG CTTGGGCGGC ATCACGGCAC ATCCTATCAA
 951 GCGGTCGCAG ATGGGCGCGA TCGCATTGCC GAAAGGGAAA TCCGCCGTCA
1001 GCGACAATTT TGCCGATGCG GCATACGCCA AATACCCGTC CCCTTACCAT
1051 TCCCGAAATA TCCGTTCAAA CTTGGAGCAG CGTTACGGCA AAGAAAACAT
1101 CACCTCCTCA ACCGTGCCGC CGTCAAACGG CAAAAATGTC AAACTGGCAG
1151 ACCAACGCCA CCCGAAGACA GGCGTACCGT TTGACGGTAA AGGGTTTCCG
1201 AATTTTGAGA AGCACGTGAA ATATGATACG GGATCCGGAG GAGGAGGAGC
1251 CACAAACGAC GACGATGTTA AAAAAGCTGC CACTGTGGCC ATTGCTGCTG
1301 CCTACAACAA TGGCCAAGAA ATCAACGGTT TCAAAGCTGG AGAGACCATC
1351 TACGACATTG ATGAAGACGG CACAATTACC AAAAAAGACG CAACTGCAGC
1401 CGATGTTGAA GCCGACGACT TTAAAGGTCT GGGTCTGAAA AAAGTCGTGA
1451 CTAACCTGAC CAAAACCGTC AATGAAAACA AACAAAACGT CGATGCCAAA
1501 GTAAAAGCTG CAGAATCTGA AATAGAAAAG TTAACAACCA AGTTAGCAGA
1551 CACTGATGCC GCTTTAGCAG ATACTGATGC CGCTCTGGAT GCAACCACCA
1601 ACGCCTTGAA TAAATTGGGA GAAAATATAA CGACATTTGC TGAAGAGACT
1651 AAGACAAATA TCGTAAAAAT TGATGAAAAA TTAGAAGCCG TGGCTGATAC
1701 CGTCGACAAG CATGCCGAAG CATTCAACGA TATCGCCGAT TCATTGGATG
1751 AAACCAACAC TAAGGCAGAC GAAGCCGTCA AAACCGCCAA TGAAGCCAAA
1801 CAGACGGCCG AAGAAACCAA ACAAAACGTC GATGCCAAAG TAAAAGCTGC
1851 AGAAACTGCA GCAGGCAAAG CCGAAGCTGC CGCTGGCACA GCTAATACTG
1901  CAGCCGACAA GGCCGAAGCT GTCGCTGCAA AAGTTACCGA CATCAAAGCT
1951  GATATCGCTA CGAACAAAGA TAATATTGCT AAAAAAGCAA ACAGTGCCGA
2001  CGTGTACACC AGAGAAGAGT CTGACAGCAA ATTTGTCAGA ATTGATGFTC
2051  TGAACGCTAC TACCGAAAAA TTGGACACAC GCTTGGCTTC TGCTGAAAAA
2101  TCCATTGCCG ATCACGATAC TCGCCTGAAC GGTTTGGATA AAACAGTGTC
2151  AGACCTGCGC AAAGAAACCC GCCAAGGCCT TGCAGAACAA GCCGCGCTCT
2201  CCGGTCTGTT CCAACCTTAC AACGTGGGTC TCGAGCACCA CCACCACCAC
2251  CACTGA
   1  MSDLANDSFI RQVLDRQHFE PDGKYHLFGS RGELAERSGH IGLGKIQSHQ
  51  LGNLMIQQAA IKGNIGYIVR FSDHGHEVHS PFDNHASHSD SDEAGSPVDG
 101  FSLYRIHWDG YEHHPADGYD GPQGGGYPAT KGARDIYSYD IKGVAQNIRL
 151  NLTDNRSTGQ RLADRFHNAG SMLTQGVGDG FKRATRYSPE LDRSGNAAEA
 201  FNGTADIVKN IIGAAGEIVG AGDAVQGISE GSNIAVMHGL GLLSTENKMA
 251  RINDLADMAQ LKDYAAAAIR DWAVQNPNAA QGIEAVSNIF MAAIPIKGIG
 301  AVRGKYGLGG ITAHPIKRSQ MGAIALPKGK SAVSDNFADA AYAKYPSPYH
 351  SRNIRSNLEQ RYGKENITSS TVPPSNGKNV KLADQRHPKT GVPFDGKGFP
 401  NFEKHVKYDT GSGGGGATND DDVKKAATVA IAAAYNNGQE INGFKAGETI
 451  YDIDEDGTIT KKDATAADVE ADDFKGLGLK KVVTNLTKTV NENKQNVDAK
 501  VKAAESEIEK LTTKLADTDA ALADTDAALD ATTNALNKLG ENITTFAEET
 551  KTNIVKIDEK LEAVADTVDK HAEAFNDIAD SLDETNTKAD EAVKTANEAK
 601  QTAEETKQNV DAKVKAAETA AGKAEAAAGT ANTAADKAEA VAAKVTDIKA
 651  DIATNKDNIA KKANSADVYT REESDSKFVR IDGLNATTEK LDTRLASAEK
 701  SIADHDTRLN GLDKTVSDLR KETRQGLAEQ AALSGLFQPY NVGLEHHHHH
 751  H*
961-ORF46.1
   1  ATGGCCACAA ACGACGACGA TGTTAAAAAA GCTGCCACTG TGGCCATTGC
  51  TGCTGCCTAC AACAATGGCC AAGAAATCAA CGGTTTCAAA GCTGGAGAGA
 101  CCATCTACGA CATTGATGAA GACGGCACAA TTACCAAAAA AGACGCAACT
 151  GCAGCCGATG TTGAAGCCGA CGACTTTAAA GGTCTGGGTC TGAAAAAAGT
 201  CGTGACTAAC CTGACCAAAA CCGTCAATGA AAACAAACAA AACGTCGATG
 251  CCAAAGTAAA AGCTGCAGAA TCTGAAATAG AAAAGTTAAC AACCAAGTTA
 301  GCAGACACTG ATGCCGCTTT AGCAGATACT GATGCCGCTC TGGATGCAAC
 351  CACCAACGCC TTGAATAAAT TGGGAGAAAA TATAACGACA TTTGCTGAAG
 401  AGACTAAGAC AAATATCGTA AAAATTGATG AAAAATTAGA AGCCGTGGCT
 451  GATACCGTCG ACAAGCATGC CGAAGCATTC AACGATATCG CCGATTCATT
 501  GGATGAAACC AACACTAAGG CAGACGAAGC CGTCAAAACC GCCAATGAAG
 551  CCAAACAGAC GGCCGAAGAA ACCAAACAAA ACGTCGATGC CAAAGTAAAA
 601  GCTGCAGAAA CTGCAGCAGG CAAAGCCGAA GCTGCCGCTG GCACAGCTAA
 651  TACTGCAGCC GACAAGGCCG AAGCTGTCGC TGCAAAAGTT ACCGACATCA
 701  AAGCTGATAT CGCTACGAAC AAAGATAATA TTGCTAAAAA AGCAAACAGT
 751  GCCGACGTGT ACACCAGAGA AGAGTCTGAC AGCAAATTTG TCAGAATTGA
 801  TGGTCTGAAC GCTACTACCG AAAAATTGGA CACACGCTTG GCTTCTGCTG
 851  AAAAATCCAT TGCCGATCAC GATACTCGCC TGAACGGTTT GGATAAAACA
 901  GTGTCAGACC TGCGCAAAGA AACCCGCCAA GGCCTTGCAG AACAAGCCGC
 951  GCTCTCCGGT CTGTTCCAAC CTTACAACGT GGGTCGGTTC AATGTAACGG
1001  CTGCAGTCGG CGGCTACAAA TCCGAATCGG CAGTCGCCAT CGGTACCGGC
1051  TTCCGCTTTA CCGAAAACTT TGCCGCCAAA GCAGGCGTGG CAGTCGGCAC
1101  TTCGTCCGGT TCTTCCGCAG CCTACCATGT CGGCGTCAAT TACGAGTGGG
1151  GATCCGGAGG AGGAGGATCA GATTTGGCAA ACGATTCTTT TATCCGGCAG
1201  GTTCTCGACC GTCAGCATTT CGAACCCGAC GGGAAATACC ACCTATTCGG
1251  CAGCAGGGGG GAACTTGCCG AGCGCAGCGG CCATATCGGA TTGGGAAAAA
1301  TACAAAGCCA TCAGTTGGGC AACCTGATGA TTCAACAGGC GGCCATTAAA
1351  GGAAATATCG GCTACATTGT CCGCTTTTCC GATCACGGGC ACGAAGTCCA
1401  TTCCCCCTTC GACAACCATG CCTCACATTC CGATTCTGAT GAAGCCGGTA
1451  GTCCCGTTGA CGGATTTAGC CTTTACCGCA TCCATTGGGA CGGATACGAA
1501  CACCATCCCG CCGACGGCTA TGACGGGCCA CAGGGCGGCG GCTATCCCGC
1551  TCCCAAAGGC GCGAGGGATA TATACAGCTA CGACATAAAA GGCGTTGCCC
1601  AAAATATCCG CCTCAACCTG ACCGACAACC GCAGCACCGG ACAACGGCTT
1651  GCCGACCGTT TCCACAATGC CGGTAGTATG CTGACGCAAG GAGTAGGCGA
1701  CGGATTCAAA CGCGCCACCC GATACAGCCC CGAGCTGGAC AGATCGGGCA
1751  ATGCCGCCGA AGCCTTCAAC GGCACTGCAG ATATCGTTAA AAACATCATC
1801  GGCGCGGCAG GAGAAATTGT CGGCGCAGGC GATGCCGTGC AGGGCATAAG
1851  CGAAGGCTCA AACATTGCTG TCATGCACGG CTTGGGTCTG CTTTCCACCG
1901  AAAACAAGAT GGCGCGCATC AACGATTTGG CAGATATGGC GCAACTCAAA
1951 GACTATGCCG CAGCAGCCAT CCGCGATTGG GCAGTCCAAA ACCCCAATGC
2001 CGCACAAGGC ATAGAAGCCG TCAGCAATAT CTTTATGGCA GCCATCCCCA
2051 TCAAAGGGAT TGGAGCTGTT CGGGGAAAAT ACGGCTTGGG CGGCATCACG
2101 GCACATCCTA TCAAGCGGTC GCAGATGGGC GCGATCGCAT TGCCGAAAGG
2151 GAAATCCGCC GTCAGCGACA ATTTTGCCGA TGCGGCATAC GCCAAATACC
2201 CGTCCCCTTA CCATTCCCGA AATATCCGTT CAAACTTGGA GCAGCGTTAC
2251 GGCAAAGAAA ACATCACCTC CTCAACCGTG CCGCCGTCAA ACGGCAAAAA
2301 TGTCAAACTG GCAGACCAAC GCCACCCGAA GACAGGCGTA CCGTTTGACG
2351 GTAAAGGGTT TCCGAATTTT GAGAAGCACG TGAAATATGA TGCGCTCGAG
2401 CACCACCACC ACCACCACTG A
   1 MATNDDDVKK AATVAIAAAY NNGQEINGFK AGETIYDIDE DGTITKKDAT
  51 AADVEADDFK GLGLKKVVTN LTKTVNENKQ NVDAKVKAAE SEIEKLTTKL
 101 ADTDAALADT DAALDATTNA LNKLGENITT FAEETKTNIV KIDEKLEAVA
 151 DTVDKHAEAF NDIADSLDET NTKADEAVKT ANEAKQTAEE TKQNVDAKVK
 201 AAETAAGKAE AAAGTANTAA DKAEAVAAKV TDIKADIATN KDNIAKKANS
 251 ADVYTREESD SKFVRIDGLN ATTEKLDTRL ASAEKSIADH DTRLNGLDKT
 301 VSDLRKETRQ GLAEQAALSG LFQPYNVGRF NVTAAVGGYK SESAVAIGTG
 351 FRFTENFAAK AGVAVGTSSG SSAAYHVGVN YEWGSGGGGS DLANDSFIRQ
 401 VLDRQHFEPD GKYHLFGSRG ELAERSGHIG LGKIQSHQLG NLMIQQAAIK
 451 GNIGYIVRFS DHGHEVHSPF DNHASHSDSD EAGSPVDGFS LYRIHWDGYE
 501 HHPADGYDGP QGGGYPAPKG ARDIYSYDIK GVAQNIRLNL TDNRSTGQRL
 551 ADRFHNAGSM LTQGVGDGFK RATRYSPELD RSGNAAEAFN GTADIVKNII
 601 GAAGEIVGAG DAVQGISEGS NIAVMHGLGL LSTENKMARI NDLADMAQLK
 651 DYAAAAIRDW AVQNPNAAQG IEAVSNIFMA AIPIKGIGAV RGKYGLGGIT
 701 AHPIKRSQMG AIALPKGKSA VSDNFADAAY AKYPSPYHSR NIRSNLEQRY
 751 GKENITSSTV PPSNGKNVKL ADQRHPKTGV PFDGKGFPNF EKHVKYDTLE
 801 HHHHHH*
961-741
   1 ATGGCCACAA ACGACGACGA TGTTAAAAAA GCTGCCACTG TGGCCATTGC
  51 TGCTGCCTAC AACAATGGCC AAGAAATCAA CGGTTTCAAA GCTGGAGAGA
 101 CCATCTACGA CATTGATGAA GACGGCACAA TTACCAAAAA AGACGCAACT
 151 GCAGCCGATG TTGAAGCCGA CGACTTTAAA GGTCTGGGTC TGAAAAAAGT
 201 CGTGACTAAC CTGACCAAAA CCGTCAATGA AAACAAACAA AACGTCGATG
 251 CCAAAGTAAA AGCTGCAGAA TCTGAAATAG AAAAGTTAAC AACCAAGTTA
 301 GCAGACACTG ATGCCGCTTT AGCAGATACT GATGCCGCTC TGGATGCAAC
 351 CACCAACGCC TTGAATAAAT TGGGAGAAAA TATAACGACA TTTGCTGAAG
 401 AGACTAAGAC AAATATCGTA AAAATTGATG AAAAATTAGA AGCCGTGGCT
 451 GATACCGTCG ACAAGCATGC CGAAGCATTC AACGATATCG CCGATTCATT
 501 GGATGAAACC AACACTAAGG CAGACGAAGC CGTCAAAACC GCCAATGAAG
 551 CCAAACAGAC GGCCGAAGAA ACCAAACAAA ACGTCGATGC CAAAGTAAAA
 601 GCTGCAGAAA CTGCAGCAGG CAAAGCCGAA GCTGCCGCTG GCACAGCTAA
 651 TACTGCAGCC GACAAGGCCG AAGCTGTCGC TGCAAAAGTT ACCGACATCA
 701 AAGCTGATAT CGCTACGAAC AAAGATAATA TTGCTAAAAA AGCAAACAGT
 751 GCCGACGTGT ACACCAGAGA AGAGTCTGAC AGCAAATTTG TCAGAATTGA
 801 TGGTCTGAAC GCTACTACCG AAAAATTGGA CACACGCTTG GCTTCTGCTG
 851 AAAAATCCAT TGCCGATCAC GATACTCGCC TGAACGGTTT GGATAAAACA
 901 GTGTCAGACC TGCGCAAAGA AACCCGCCAA GGCCTTGCAG AACAAGCCGC
 951 GCTCTCCGGT CTGTTCCAAC CTTACAACGT GGGTCGGTTC AATGTAACGG
1001 CTGCAGTCGG CGGCTACAAA TCCGAATCGG CAGTCGCCAT CGGTACCGGC
1051 TTCCGCTTTA CCGAAAACTT TGCCGCCAAA GCAGGCGTGG CAGTCGGCAC
1101 TTCGTCCGGT TCTTCCGCAG CCTACCATGT CGGCGTCAAT TACGAGTGGG
1151 GATCCGGAGG GGGTGGTGTC GCCGCCGACA TCGGTGCGGG GCTTGCCGAT
1201 GCACTAACCG CACCGCTCGA CCATAAAGAC AAAGGTTTGC AGTCTTTGAC
1251 GCTGGATCAG TCCGTCAGGA AAAACGAGAA ACTGAAGCTG GCGGCACAAG
1301 GTGCGGAAAA AACTTATGGA AACGGTGACA GCCTCAATAC GGGCAAATTG
1351 AAGAACGACA AGGTCAGCCG TTTCGACTTT ATCCGCCAAA TCGAAGTGGA
1401 CGGGCAGCTC ATTACCTTGG AGAGTGGAGA GTTCCAAGTA TACAAACAAA
1451 GCCATTCCGC CTTAACCGCC TTTCAGACCG AGCAAATACA AGATTCGGAG
1501 CATTCCGGGA AGATGGTTGC GAAACGCCAG TTCAGAATCG GCGACATAGC
1551 GGGCGAACAT ACATCTTTTG ACAAGCTTCC CGAAGGCGGC AGGGCGACAT
1601 ATCGCGGGAC GGCGTTCGGT TCAGACGATG CCGGCGGAAA ACTGACCTAC
1651 ACCATAGATT TCGCCGCCAA GCAGGGAAAC GGCAAAATCG AACATTTGAA
1701 ATCGCCAGAA CTCAATGTCG ACCTGGCCGC CGCCGATATC AAGCCGGATG
1751 GAAAACGCCA TGCCGTCATC AGCGGTTCCG TCCTTTACAA CCAAGCCGAG
1801 AAAGGCAGTT ACTCCCTCGG TATCTTTGGC GGAAAAGCCC AGGAAGTTGC
1851 CGGCAGCGCG GAAGTGAAAA CCGTAAACGG CATACGCCAT ATCGGCCTTG
1901 CCGCCAAGCA ACTCGAGCAC CACCACCACC ACCACTGA
   1 MATNDDDVKK AATVAIAAAY NNGQEINGFK AGETIYDIDE DGTITKKDAT
  51 AADVEADDFK GLGLKKVVTN LTKTVNENKQ NVDAKVKAAE SEIEKLTTKL
 101 ADTDAALADT DAALDATTNA LNKLGENITT FAEETKTNIV KIDEKLEAVA
 151 DTVDKHAEAF NDIADSLDET NTKADEAVKT ANEAKQTAEE TKQNVDAKVK
 201 AAETAAGKAE AAAGTANTAA DKAEAVAAKV TDIKADIATN KDNIAKKANS
 251 ADVYTREESD SKFVRIDGLN ATTEKLDTRL ASAEKSIADH DTRLNGLDKT
 301 VSDLRKETRQ GLAEQAALSG LFQPYNVGRF NVTAAVGGYK SESAVAIGTG
 351 FRFTENFAAK AGVAVGTSSG SSAAYHVGVN YEWGSGGGGV AADIGAGLAD
 401 ALTAPLDHKD KGLQSLTLDQ SVRKNEKLKL AAQGAEKTYG NGDSLNTGKL
 451 KNDKVSRFDF IRQIEVDGQL ITLESGEFQV YKQSHSALTA FQTEQIQDSE
 501 HSGKMVAKRQ FRIGDIAGEH TSFDKLPEGG RATYRGTAFG SDDAGGKLTY
 551 TIDFAAKQGN GKIEHLKSPE LNVDLAAADI KPDGKRHAVI SGSVLYNQAE
 601 KGSYSLGIFG GKAQEVAGSA EVKTVNGIRH IGLAAKQLEH HHHHH*
961-983
   1 ATGGCCACAA ACGACGACGA TGTTAAAAAA GCTGCCACTG TGGCCATTGC
  51 TGCTGCCTAC AACAATGGCC AAGAAATCAA CGGTTTCAAA GCTGGAGAGA
 101 CCATCTACGA CATTGATGAA GACGGCACAA TTACCAAAAA AGACGCAACT
 151 GCAGCCGATG TTGAAGCCGA CGACTTTAAA GGTCTGGGTC TGAAAAAAGT
 201 CGTGACTAAC CTGACCAAAA CCGTCAATGA AAACAAACAA AACGTCGATG
 251 CCAAAGTAAA AGCTGCAGAA TCTGAAATAG AAAAGTTAAC AACCAAGTTA
 301 GCAGACACTG ATGCCGCTTT AGCAGATACT GATGCCGCTC TGGATGCAAC
 351 CACCAACGCC TTGAATAAAT TGGGAGAAAA TATAACGACA TTTGCTGAAG
 401 AGACTAAGAC AAATATCGTA AAAATTGATG AAAAATTAGA AGCCGTGGCT
 451 GATACCGTCG ACAAGCATGC CGAAGCATTC AACGATATCG CCGATTCATT
 501 GGATGAAACC AACACTAAGG CAGACGAAGC CGTCAAAACC GCCAATGAAG
 551 CCAAACAGAC GGCCGGAAGA ACCAAACAAA ACGTCGATGC CAAAGTAAAA
 601 GCTGCAGAAA CTGCAGCAGG CAAAGCCGAA GCTGCCGCTG GCACAGCTAA
 651 TACTGCAGCC GACAAGGCCG AAGCTGTCGC TGCAAAAGTT ACCGACATCA
 701 AAGCTGATAT CGCTACGAAC AAAGATAATA TTGCTAAAAA AGCAAACAGT
 751 GCCGACGTGT ACACCAGAGA AGAGTCTGAC AGCAAATTTG TCAGAATTGA
 801 TGGTCTGAAC GCTACTACCG AAAAATTGGA CACACGCTTG GCTTCTGCTG
 851 AAAAATCCAT TGCCGATCAC GATACTCGCC TGAACQQTTT GGATAAAACA
 901 GTGTCAGACC TGCGCAAAGA AACCCGCCAA GGCCTTGCAG AACAAGCCGC
 951 GCTCTCCGGT CTGTTCCAAC CTTACAACGT GGGTCGGTTC AATGTAACGG
1001 CTGCAGTCGG CGGCTACAAA TCCQAATCGG CAGTCGCCAT CGGTACCGGC
1051 TTCCGCTTTA CCGAAAACTT TGCCGCAAAA GCAGGCGTGG CAGTCGGCAC
1101 TTCGTCCGGT TCTTCCQCAG CCTACCATGT CGGCGTCAAT TACGAGTGGG
1151 GATCCGGCGG AGGCGGCACT TCTGCGCCCG ACTTCAATGC AGGCGGTACC
1201 GGTATCGGCA GCAACAGCAG AGCAACAACA GCGAAATCAG CAGCAGTATC
1251 TTACGCCGGT ATCAAGAACG AAATGTGCAA AGACAGAAGC ATGCTCTGTG
1301 CCGGTCGGGA TGACGTTGCG GTTACAGACA GGGATGCCAA AATCAATGCC
1351 CCCCCCCCGA ATCTGCATAC CGGAGACTTT CCAAACCCAA ATGACGCATA
1401 CAAGAATTTG ATCAACCTCA AACCTGCAAT TGAAGCAGGC TATACAGGAC
1451 GCGGGGTAGA GGTAGGTATC GTCGACACAG GCGAATCCGT CGGCAGCATA
1501 TCCTTTCCCG AACTGTATGG CAGAAAAGAA CACGGCTATA ACGAAAATTA
1551 CAAAAACTAT ACGGCGTATA TGCGGAAGGA AGCGCCTGAA GACGGAGGCG
1601 GTAAAGACAT TGAAGCTTCT TTCGACGATG AGGCCGTTAT AGAGACTGAA
1651 GCAAAGCCGA CGGATATCCG CCACGTAAAA GAAATCGGAC ACATCGATTT
1701 GGTCTCCCAT ATTATTGGCG GGCGTTCCGT GGACGGCAGA CCTGCAGGCG
1751 GTATTGCGCC CGATGCGACG CTACACATAA TGAATACGAA TGATGAAACC
1801 AAGAACGAAA TGATGGTTGC AGCCATCCGC AATGCATGGG TCAAGCTGGG
1851 CGAACGTGGC GTGCGCATCG TCAATAACAG TTTTGGAACA ACATCGAGGG
1901 CAGGCACTGC CGACCTTTTC CAAATAGCCA ATTCGGAGGA GCAGTACCGC
1951 CAAGCGTTGC TCGACTATTC CGGCGGTGAT AAAACAGACG AGGGTATCCG
2001 CCTGATGCAA CAGAGCGATT ACGGCAACCT GTCCTACCAC ATCCGTAATA
2051 AAAACATGCT TTTCATCTTT TCGACAGGCA ATGACGCACA AGCTCAGCCC
2101 AACACATATG CCCTATTGCC ATTTTATGAA AAAGACGCTC AAAAAGGCAT
2151 TATCACAGTC GCAGGCGTAG ACCGCAGTGG AGAAAAGTTC AAACGGGAAA
2201 TGTATGGAGA ACCGGGTACA GAACCGCTTG AGTATGGCTC CAACCATTGC
2251 GGAATTACTG CCATGTGGTG CCTGTCGGCA CCCTATGAAG CAAGCGTCCG
2301 TTTCACCCGT ACAAACCCGA TTCAAATTGC CGGAACATCC TTTTCCGCAC
2351 CCATCGTAAC CGGCACGGCG GCTCTGCTGC TGCAGAAATA CCCGTGGATG
2401 AGCAACGACA ACCTGCGTAC CACGTTGCTG ACGACGGCTC AGGACATCGG
2451 TGCAGTCGGC GTGGACAGCA AGTTCGGCTG GGGACTGCTG GATGCGGGTA
2501 AGGCGATGAA CGGACCCGCG TCCTTTCCGT TCGGCGACTT TACCGCCGAT
2551 ACGAAAGGTA CATCCGATAT TGCCTACTCC TTCCGTAACG ACATTTCAGG
2601 CACGGGCGGC CTGATCAAAA AAGGCGGCAG CCAACTGCAA CTGCACGGCA
2651 ACAACACCTA TACGGGCAAA ACCATTATCG AAGGCGGTTC GCTGGTGTTG
2701 TACGGCAACA ACAAATCGGA TATGCGCGTC GAAACCAAAG GTGCGCTGAT
2751 TTATAACGGG GCGGCATCCG GCGGCAGCCT GAACAGCGAC GGCATTGTCT
2801 ATCTGGCAGA TACCGACCAA TCCGGCGCAA ACGAAACCGT ACACATCAAA
2851 GGCAGTCTGC AGCTGGACGG CAAAGGTACG CTGTACACAC GTTTGGGCAA
2901 ACTGCTGAAA GTGGACGGTA CGGCGATTAT CGGCGGCAAG CTGTACATGT
2951 CGGCACGCGG CAAGGGGGCA GGCTATCTCA ACAGTACCGG ACGACGTGTT
3001 CCCTTCCTGA GTGCCGCCAA AATCGGGCAG GATTATTCTT TCTTCACAAA
3051 CATCGAAACC GACGGCGGCC TGCTGGCTTC CCTCGACAGC GTCGGAAAAA
3101 CAGCGGGCAG TGAAGGCGAC ACGCTGTCCT ATTATGTCCG TCGCGGCAAT
3151 GCGGCACGGA CTGCTTCGGC AGCGGCACAT TCCGCGCQCG CCGGTCTGAA
3201 ACACGCCGTA GAACAGGGCG GCAGCAATCT GGAAAACCTG ATGGTCGAAC
3251 TGGATGCCTC CGAATCATCC GCAACACCCG AGACGGTTGA AACTGCGGCA
3301 GCCGACCGCA CAGATATGCC GGGCATCCGC CCCTACGGCG CAACTTTCCG
3351 CGCAGCGGCA GCCGTACAGC ATGCGAATGC CGCCGACGGT GTACGCATCT
3401 TCAACAGTCT CGCCGCTACC GTCTATGCCG ACAGTACCGC CGCCCATGCC
3451 GATATGCAGG GACGCCGCCT GAAAGCCGTA TCGGACGGGT TGGACCACAA
3501 CGGCACGGGT CTGCGCGTCA TCGCGCAAAC CCAACAGGAC GGTGGAACGT
3551 GGGAACAGGG CGGTGTTGAA GGCAAAATGC GCGGCAGTAC CCAAACCGTC
3601 GGCATTGCCG CGAAAACCGG CGAAAATACG ACAGCAGCCG CCACACTGGG
3651 CATGGGACGC AGCACATGGA GCGAAAACAG TGCAAATGCA AAAACCGACA
3701 GCATTAGTCT GTTTGCAGGC ATACGGCACG ATGCGGGCGA TATCGGCTAT
3751 CTCAAAGGCC TGTTCTCCTA CGGACGCTAC AAAAACAGCA TCAGCCGCAG
3801 CACCGGTGCG GACGAACATG CGGAAGGCAG CGTCAACGGC ACGCTGATGC
3851 AGCTGGGCGC ACTGGGCGGT GTCAACGTTC CGTTTGCCGC AACGGGAGAT
3901 TTGACGGTCG AAGGCGTTCT GCGCTACGAC CTGCTCAAAC AGGATGCATT
3951 CGCCGAAAAA GGCAGTGCTT TGGGCTGGAG CGGCAACAGC CTCACTGAAG
4001 GCACGCTGGT CGGACTCGCG GGTCTGAAGC TGTCGCAACC CTTGAGCGAT
4051 AAAGCCGTCC TGTTTGCAAC GGCGGGCGTG GAACGCGACC TGAACGGACG
4101 CGACTACACG GTAACGGGCG GCTTTACCGG CGCGACTGCA GCAACCGGCA
4151 AGACGGGGGC ACGCAATATG CCGCACACCC GTCTGGTTGC CGGCCTGGGC
4201 GCGGATGTCG AATTCGGCAA CGGCTGGAAC GGCTTGGCAC GTTACAGCTA
4251 CGCCGGTTCC AAACAGTACG GCAACCACAG CGGACGAGTC GGCGTAGGCT
4301 ACCGGTTCCT CGAGCACCAC CACCACCACC ACTGA
   1 MATNDDDVKK AATVAIAAAY NNGQEINGFK AGETIYDIDE DGTITKKDAT
  51 AADVEADDFK GLGLKKVVTN LTKTVNENKQ NVDAKVKAAE SEIKKLTTKL
 101 ADTDAALADT DAALDATTNA LNKLGENITT FAEETKTNIV KIDEKLEAVA
 151 DTVDKHAEAF NDIADSLDET NTKADEAVKT ANEAKQTAEE TKQNVDAKVK
 201 AAETAAGKAE AAAGTANTAA DKAEAVAAKV TDIKADIATN KDNIAKKANS
 251 ADVYTREESD SKFVRIDGLN ATTEKLDTRL ASAEKSIADH DTRLNGLDKT
 301 VSDLRKETRQ GLAEQAALSG LFQPYNVGRF NVTAAVGGYK SESAVAIGTG
 351 FRFTENFAAK AGVAVGTSSG SSAAYHVGVN YEWGSGGGGT SAPDFNAGGT
 401 GIGSNSRATT AKSAAVSYAG IKNEMCKDRS MLCAGRDDVA VTDRDAKINA
 451 PPPNLHTGDF PNPMDAYKNL INLKPAIEAG YTGRGVEVGI VDTGESVGSI
 501 SFPELYGRKE HGYNENYKNY TAYMRKEAPE DGGGKDIEAS FDDEAVIETE
 551 AKPTDIRHVK EIGHIDLVSH IIGGRSVDGR PAGGIAPDAT LHIMNTNDET
 601 KNEMMVAAIR NAWVKLGERG VRIVNNSFGT TSRAGTADLF QIANSEEQYR
 651 QALLDYSGGD KTDEGIRLMQ QSDYGNLSYH IRNKNMLFIF STGNDAQAQP
 701 NTYALLPFYE KDAQKGIITV AGVDRSGEKF KREMYGEPGT EPLEYGSNHC
 751 GITAMWCLSA PYEASVRFTR TNPIQIAGTS FSAPIVTGTA ALLLQKYPWM
 801 SNDNLRTTLL TTAQDIGAVG VDSKFGWGLL DAGKAMNGPA SFPFGDFTAD
 851 TKGTSDIAYS FRNDISGTGG LIKKGGSQLQ LHGNNTYTGK TIIEGGSLVL
 901 YGNNKSDMRV ETKGALIYNG AASGGSLNSD GIVYLADTDQ SGANETVHIK
 951 GSLQLDGKGT LYTRLGKLLK VDGTAIIGGK LYMSARGKGA GYLNSTGRRV
1001 PFLSAAKIGQ DYSFFTNIET DGGLLASLDS VEKTAGSEGD TLSYYVRRGN
1051 AARTASAAAH SAPAGLKHAV EQGGSNLENL MVELDASESS ATPETVETAA
1101 ADRTDMPGIR PYGATFRAAA AVQHANAADG VRIFNSLAAT VYADSTAAHA
1151 DMQGRRLKAV SDGLDHNGTG LRVIAQTQQD GGTWEQGGVE GKMRGSTQTV
1201 GIAAKTGENT TAAATLGMGR STWSENSANA KTDSISLFAG IRHDAGDIGY
1251 LKGLFSYGRY KNSISRSTGA DEHAEGSVNG TLMQLGALGG VNVPFAATGD
1301 LTVEGGLRYD LLKQDAFAEK GSALGWSGNS LTEGTLVGLA GLKLSQPLSD
1351 KAVLFATAGV ERDLNGRDYT VTGGFTGATA ATGKTGARNM PHTRLVAGLG
1401 ADVEFGNGWN GLARYSYAGS KQYGNHSGRV GVGYRFLEHH HHHH*
961c-ORF46.1
   1 ATGGCCACAA ACGACCACGA TGTTAAAAAA GCTGCCACTG TGGCCATTGC
  51 TGCTGCCTAC AACAATGGCC AAGAAATCAA CGGTTTCAAA GCTGGAGAGA
 101 CCATCTACGA CATTGATGAA GACGGCACAA TTACCAAAAA AGACGCAACT
 151 GCAGCCGATG TTGAAGCCGA CGACTTTAAA GGTCTGGGTC TGAAAAAAGT
 201 CGTGACTAAC CTGACCAAAA CCGTCAATGA AAACAAACAA AACGTCGATG
 251 CCAAAGTAAA AGCTGCAGAA TCTGAAATAG AAAAGTTAAC AACCAAGTTA
 301 GCAGACACTG ATGCCGCTTT AGCAGATACT GATGCCGCTC TGGATGCAAC
 351 CACCAACGCC TTGAATAAAT TGGGAGAAAA TATAACGACA TTTGCTGAAG
 401 AGACTAAGAC AAATATCGTA AAAATTGATG AAAAATTAGA AGCCGTGGCT
 451 GATACCGTCG ACAAGCATGC CGAAGCATTC AACGATATCG CCGATTCATT
 501 GGATGAAACC AACACTAAGG CAGACGAAGC CGTCAAAACC GCCAATGAAG
 551 CCAAACAGAC GGCCGAAGAA ACCAAACAAA ACGTCGATGC CAAAGTAAAA
 601 GCTGCAGAAA CTGCAGCAGG CAAAGCCGAA GCTGCCGCTG GCACAGCTAA
 651 TACTGCAGCC GACAAGGCCG AAGCTGTCGC TGCAAAAGTT ACCGACATCA
 701 AAGCTGATAT CGCTACGAAC AAAGATAATA TTGCTAAAAA AGCAAACAGT
 751 GCCGACGTGT ACACCAGAGA AGAGTCTGAC AGCAAATTTG TCAGAATTGA
 801 TGGTCTGAAC GCTACTACCG AAAAAATGGA CACACGCTTG GCTTCTGCTG
 851 AAAAATCCAT TGCCGATCAC GATACTCGCC TGAACGGTTT GGATAAAACA
 901 GTGTCAGACC TGCGCAAAGA AACCCGCCAA GGCCTTGCAG AACAAGCCGC
 951 GCTCTCCGGT CTGTTCCAAC CTTACAACGT GGGTGGATCC GGAGGAGGAG
1001 GATCAGATTT GGCAAACGAT TCTTTTATCC GGCAGGTTCT CGACCGTCAG
1051 CATTTCGAAC CCGACGGGAA ATACCACCTA TTCGGCAGCA GGGGGGAACT
1101 TGCCGAGCGC AGCGGCCATA TCGGATTGGG AAAAATACAA AGCCATCAGT
1151 TGGGCAACCT GATGATTCAA CAGGCGGCCA TTAAAGGAAA TATCGGCTAC
1201 ATTGTCCGCT TTTCCGATCA CGGGCACGAA GTCCATTCCC CCTTCGACAA
1251 CCATGCCTCA CATTCCGATT CTGATGAAGC CGCTAGTCCC GTTGACGGAT
1301 TTAGCCTTTA CCGCATCCAT TGGGACGGAT ACGAACACCA TCCCGCCGAC
1351 GGCTATGACG GGCCACAGGG CGGCGGCTAT CCCGCTCCCA AAGGCGCGAG
1401 GGATATATAC AGCTACGACA TAAAAGGCGT TGCCCAAAAT ATCCGCCTCA
1451 ACCTGACCGA CAACCGCAGC ACCGGACAAC GGCTTGCCGA CCGTTTCCAC
1501 AATGCCGGTA GTATGCTGAC GCAAGGAGTA GGCGACGGAT TCAAACGCGC
1551 CACCCGATAC AGCCCCGAGC TGGACAGATC GGGCAATGCC GCCGAAGCCT
1601 TCAACGGCAC TGCAGATATC GTTAAAAACA TCATCGGCGC GGCAGGAGAA
1651 ATTGTCGGCG CAGGCGATGC CGTGCAGGGC ATAAGCGAAG GCTCAAACAT
1701 TGCTGTCATG CACGGCTTGG GTCTGCTTTC CACCGAAAAC AAGATGGCGC
1751 GCATCAACGA TTTGGCAGAT ATGGCGCAAC TCAAAGACTA TGCCGCAGCA
1801 GCCATCCGCG ATTGGGCAGT CCAAAACCCC AATGCCGCAC AAGGCATAGA
1851 AGCCGTCAGC AATATCTTTA TGGCAGCCAT CCCCATCAAA GGGATTGGAG
1901 CTGTTCGGGG AAAATACGGC TTGGGCGGCA TCACGGCACA TCCTATCAAG
1951 CGGTCGCAGA TGGGCGCGAT CGCATTGCCG AAAGGGAAAT CCGCCGTCAG
2001 CGACAATTTT GCCGATGCGG CATACGCCAA ATACCCGTCC CCTTACCATT
2051 CCCGAAATAT CCGTTCAAAC TTGGAGCAGC GTTACGGCAA AGAAAACATC
2101 ACCTCCTCAA CCGTGCCGCC GTCAAACGGC AAAAATGTCA AACTGGCAGA
2151 CCAACGCCAC CCGAAGACAG GCGTACCGTT TGACGGTAAA GGGTTTCCGA
2201 ATTTTGAGAA GCACGTGAAA TATGATACGC TCGAGCACCA CCACCACCAC
2251 CACTGA
   1 MATNGGGVKK AATVAIAAAY NNGQEINGFK AGETIYDIDE DGTITKKDAT
  51 AADVEADDFK GLGLKKVVTN LTKTVNENKQ NVDAKVKAAE SEIEELTTKL
 101 ADTDAALADT DAALDATTNA LNKLGENITT FAEETKTNIV KIDEKLEAVA
 151 DTVDKHAEAF NDIADSLDET NTKADEAVKT ANEAKQTAEE TKQNVDAKVK
 201 AAETAAGKAE AAAGTANTAA DKAEAVAAKV TDIKADIATN KDNIAKKANS
 251 ADVYTREESD SKFVRIDGLN ATTEKLDTRL ASAEKSIADH DTRLNGLDKT
 301 VSDLRKETRQ GLAEQAALSG LFQPYNVGGS GGGGSDLAAN SFIRQVLDRQ
 351 HFEPDGKYHL FGSRGELAER SGHIGLGKIQ SHQLGNLMIQ QAAIKGNIGY
 401 IVRFSDHGHE VHSPFDNHAS HSDSDEAGSP VDGFSLYRIH WDGYEHHPAD
 451 GYDGPQGGGY PAPKGARDIY SYDIKGVAQN IRLNLTDNRS TGQRLADRFH
 501 NAGSMLTQGV GDGFKRATRY SPELDRSGNA AEAFNGTADI VKNIIGAAGE
 551 IVGAGDAVQG ISEGSNIAVM HGLGLLSTEN KMARINDLAD MAQLKDYAAA
 601 AIRDWAVQNP NAAQGIEAVS NIFMAAIPIK GIGAVRGKYG LGGITAHPIK
 651 RSQMGAIALP KGKSAVSDNF ADAAYAKYPS PYHSRNIRSN LEQRYGKENI
 701 TSSTVPPSNG KNVKLADQRH PKTGVPFDGK GFPNFEKHVK YDTLEHHHHH
 751 H*
961c-741
   1 ATGGCCACAA ACGACGACGA TGTTAAAAAA GCTGCCACTG TGGCCATTGC
  51 TGCTGCCTAC AACAATGGCC AAGAAATCAA CGGTTTCAAA GCTGGAGAGA
 101 CCATCTACGA CATTGATGAA GACGGCACAA TTACCAAAAA AGACGCAACT
 151 GCAGCCGATG TTGAAGCCGA CGACTTTAAA GGTCTGGGTC TGAAAAAAGT
 201 CGTGACTAAC CTGACCAAAA CCGTCAATGA AAACAAACAA AACGTCGATG
 251 CCAAAGTAAA AGCTGCAGAA TCTGAAATAG AAAAGTTAAC AACCAAGTTA
 301 GCAGACACTG ATGCCGCTTT AGCAGATACT GATGCCGCTC TGGATGCAAC
 351 CACCAACGCC TTGAATAAAT TGGGAGAAAA TATAACGACA TTTGCTGAAG
 401 AGACTAAGAC AAATATCGTA AAAATTGATG AAAAATTAGA AGCCGTGGCT
 451 GATACCGTCG ACAAGCATGC CGAAGCATTC AACGATATCG CCGATTCATT
 501 GGATGAAACC AACACTAAGG CAGACGAAGC CGTCAAAACC GCCAATGAAG
 551 CCAAACAGAC GGCCGAAGAA ACCAACAAAA ACGTCGATGC CAAAGTAAAA
 601 GCTGCAGAAA CTGCAGCAGG CAAAGCCGAA GCTGCCGCTG GCACAGCTAA
 651 TACTGCAGCC GACAAGGCCG AAGCTGTCGC TGCAAAAGTT ACCGACATCA
 701 AAGCTGATAT CGCTACGAAC AAAGATAATA TTGCTAAAAA AGCAAACAGT
 751 GCCGACGTGT ACACCAGAGA AGAGTCTGAC AGCAAATTTG TCAGAATTGA
 801 TGGTCTGAAC GCTACTACCG AAAAATTGGA CACACGCTTG GCTTCTGCTG
 851 AAAAATCCAT TGCCGATCAC GATACTCGCC TGAACGGTTT GGATAAAACA
 901 GTGTCAGACC TGCGCAAAGA AACCCGCCAA GGCCTTGCAG AACAAGCCGC
 951 GCTCTCCGGT CTGTTCCAAC CTTACAACGT GGGTGGATCC GGAGGGGGTG
1001 GTGTCGCCGC CGACATCGGT GCGGGGCTTG CCGATGCACT AACCGCACCG
1051 CTCGACCATA AAGACAAAGG TTTGCAGTCT TTGACGCTGG ATCAGTCCGT
1101 CAGGAAAAAC GAGAAACTGA AGCTGGCGGC ACAAGGTGCG GAAAAAACTT
1151 ATGGAAACGG TGACAGCCTC AATACGGGCA AATTGAAGAA CGACAAGGTC
1201 AGCCGTTTCG ACTTTATCCG CCAAATCGAA GTGGACGGGC AGCTCATTAC
1251 CTTGGAGAGT GGAGAGTTCC AAGTATACAA ACAAAGCCAT TCCGCCTTAA
1301 CCGCCTTTCA GACCGAGCAA ATACAAGATT CGGAGCATTC CGGGAAGATG
1351 GTTGCGAAAC GCCAGTTCAG AATCGGCGAC ATAGCGGGCG AACATACATC
1401 TTTTGACAAG CTTCCCGAAG GCGGCAGGGC GACATATCGC GGGACGGCGT
1451 TCGGTTCAGA CGATGCCGGC GGAAAACTGA CCTACACCAT AGATTTCGCC
1501 GCCAAGCAGG GAAACGGCAA AATCGAACAT TTGAAATCGC CAGAACTCAA
1551 TGTCGACCTG GCCGCCGCCG ATATCAAGCC GGATGGAAAA CGCCATGCCG
1601 TCATCAGCGG TTCCGTCCTT TACAACCAAG CCGAGAAAGG CAGTTACTCC
1651 CTCGGTATCT TTGGCGGAAA AGCCCAGGAA GTTGCCGGCA GCGCGGAAGT
1701 GAAAACCGTA AACGGCATAC GCCATATCGG CCTTGCCGCC AAGCAACTCG
1751 AGCACCACCA CCACCACCAC TGA
   1 MATNDDDVKK AATVAIAAAY NNGQEINGFK AGETIYDIDE DGTITKKDAT
  51 AADVEADDFK GLGLKKVVTN LTKTVNENKQ NVDAKVKAAE SEIEKLTTKL
 101 ADTDAALADT DAALDATTNA LNKLGENITT FAEETKTNIV KIDEKLEAVA
 151 DTVDKHAEAF NDIADSLDET NTKADEAVKT ANEAKQTAEE TKQNVDAKVK
 201 AAETAAGKAE AAAGTANTAA DKAEAVAAKV TDIKADIATN KDNIAKKANS
 251 ADVYTREESD SKFVRIDGLN ATTEKLDTRL ASAEKSIADH DTRLNGLDKT
 301 VSDLRKETRQ GLAEQAALSG LFQPYNVGGS GGGGVAADIG AGLADALTAP
 351 LDHKDKGLQS LTLDQSVRKN EKLKLAAQGA EKTYGNGDSL NTGKLKNDKV
 401 SRFDFIRQIE VDGQLITLES GEFQVYKQSH SALTAFQTEQ IQDSEHSGKN
 451 VAKRQFRIGD IAGEHTSFDK LPEGGRATYR GTAFGSDDAG GKLTYTIDFA
 501 AKQGNGKIEH LKSPELNVDL AAADIKPDGK PHAVISGSVL YNQAEKGSYS
 551 LGIFGGKAQE VAGSAEVKTV NGIRHIGLAA KQLEHHHHHH *
961c-983
   1 ATGGCCACAA ACGACGACGA TGTTAAAAAA GCTGCCACTG TGGCCATTGC
  51 TGCTGCCTAC AACAATGGCC AAGAAATCAA CGGTTTCAAA GCTGGAGAGA
 101 CCATCTACGA CATTGATGAA GACGGCACAA TTACCAAAAA AGACGCAACT
 151 GCAGCCGATG TTGAAGCCGA CGACTTTAAA GGTCTGGGTC TGAAAAAAGT
 201 CGTGACTAAC CTGACCAAAA CCGTCAATGA AAACAAACAA AACGTCGATG
 251 CCAAAGTAAA AGCTGCAGAA TCTGAAATAG AAAAGTTAAC AACCAAGTTA
 301 GCAGACACTG ATGCCGCTTT AGCAGATACT GATGCCGCTC TGGATGCAAC
 351 CACCAACGCC TTGAATAAAT TGGGAGAAAA TATAACGACA TTTGCTGAAG
 401 AGACTAAGAC AAATATCGTA AAAATTGATG AAAAATTAGA AGCCGTGGCT
 451 GATACCGTCG ACAAGCATGC CGAAGCATTC AACGATATCG CCGATTCATT
 501 GGATGAAACC AACACTAAGG CAGACGAAGC CGTCAAAACC GCCAATGAAC
 551 CCAAACAGAC GGCCGAAGAA ACCAAACAAA ACGTCGATGC CAAAGTAAAA
 601 GCTGCAGAAA CTGCAGCAGG CAAAGCCGAA GCTGCCGCTG GCACAGCTAA
 651 TACTGCAGCC GACAAGGCCG AAGCTGTCGC TGCAAAAGTT ACCGACATCA
 701 AAGCTGATAT CGCTACGAAC AAAGATAATA TTGCTAAAAA AGCAAACAGT
 751 GCCGACGTGT ACACCAGAGA AGAGTCTGAC AGCAAATTTG TCAGAATTGA
 801 TGGTCTGAAC GCTACTACCG AAAAATTGGA CACACGCTTG GCTTCTGCTG
 851 AAAAATCCAT TGCCGATCAC GATACTCGCC TGAACGGTTT GGATAAAACA
 901 GTGTCAGACC TGCGCAAAGA AACCCGCCAA GGCCTTGCAG AACAAGCCGC
 951 GCTCTCCGGT CTGTTCCAAC CTTACAACGT GGGTGGATCC GGCGGAGGCG
1001 GCACTTCTGC GCCCGACTTC AATGCAGGCG GTACCGGTAT CGGCAGCAAC
1051 AGCAGAGCAA CAACAGCGAA ATCAGCAGCA GTATCTTACG CCGGTATCAA
1101 GAACGAAATG TGCAAAGACA GAAGCATGCT CTGTGCCGGT CGGGATGACG
1151 TTGCGGTTAC AGACAGGGAT GCCAAAATCA ATGCCCCCCC CCCGAATCTG
1201 CATACCGGAG ACTTTCCAAA CCCAAATGAC GCATACAAGA ATTTGATCAA
1251 CCTCAAACCT GCAATTGAAG CAGGCTATAC AGGACGCGGG GTAGAGGTAG
1301 GTATCGTCGA CACAGGCGAA TCCGTCGGCA GCATATCCTT TCCCGAACTG
1351 TATGGCAGAA AAGAACACGG CTAATAAGAA AATTACAAAA ACTATACGGC
1401 GTATATGCGG AAGGAAGCGC CTGAAGACGG AGGCGGTAAA GACATTGAAG
1451 CTTCTTTCGA CGATGAGGCC GTTATAGAGA CTGAAGCAAA GCCGACGGAT
1501 ATCCGCCACG TAAAAGAAAT CGGACACATC GATTTGGTCT CCCATATTAT
1551 TGGCGGGCGT TCCGTGGACG GCAGACCTGC AGGCGGTATT GCGCCCGATG
1601 CGACGCTACA CATAATGAAT ACGAATGATG AAACCAAGAA CGAAATGATG
1651 GTTGCAGCCA TCCGCAATGC ATGGGTCAAG CTGGGCGAAC GTGGCGTGCG
1701 CATCGTCAAT AACAGTTTTG GAACAACATC GAGGGCAGGC ACTGCCGACC
1751 TTTTCCAAAT AGCCAATTCG GAGGAGCAGT ACCGCCAAGC GTTGCTCGAC
1801 TATTCCGGCG GTGATAAAAC AGACGAGGGT ATCCGCCTGA TGCAACAGAG
1851 CGATTACGGC AACCTGTCCT ACCACATCCG TAATAAAAAC ATGCAAAACA
1901 TCTTTTCGAC AGGCAATGAC GCACAAGCTC AGCCCAACAC ATATGCCCTA
1951 TTGCCATTTT ATGAAAAAGA CGCTCAAAAA GGCATTATCA CAGTCGCAGG
2001 CGTAGACCGC AGTGGAGAAA AGTTCAAACG GGAAATGTAT GGAGAACCGG
2051 GTACAGAACC GCTTGAGTAT GGCTCCAACC ATTGCGGAAT TACTGCCATG
2101 TGGTGCCTGT CGGCACCCTA TGAAGCAAGC GTCCGTTTCA CCCGTACAAA
2151 CCCGATTCAA ATTGCCGGAA CATCCTTTTC CGCACCCATC GTAACCGGCA
2201 CGGCGGCTCT GCTGCTGCAG AAATTACCGT GGATGAGCAA CGACAACCTG
2251 CGTACCACGT TGCTGACGAC GGCTCAGGAC ATCGGTGCAG TCGGCGTGGA
2301 CAGCAAGTTC GGCTGGGGAC TGCTGGATGC GGGTAAGGCC ATGAACGGAC
2351 CCGCGTCCTT TCCGTTCGGC GACTTTACCG CCGATACGAA AGGTACATCC
2401 GATATTGCCT ACTCCTTCCG TAACGACATT TCAGGCACGG GCGGCCTGAT
2451 CAAAAAAGGC GGCAGCCAAC TGCAACTGCA CGGCAACAAC ACCTATACGG
2501 GCAAAACCAT TATCGAAGGC GGTTCGCTGG TGTTGTACGG CAACAACAAA
2551 TCGGATATGC GCGTCGAAAC CAAAGGTGCG CTGATTTATA ACGGGGCGGC
2601 ATCCGGCGGC AGCCTGAACA GCGACGGCAT TGTCTATCTG GCAGATACCG
2651 ACCAATCCGG CGCAAACGAA ACCGTACACA TCAAAGGCAG TCTGCAGCTG
2701 GACGGCAAAG GTACGCTGTA CACACGTTTG GGCAAACTGC TGAAAGTGGA
2751 CGGTACGGCG ATTATCGGCG GCAAGCTGTA CATGTCGGCA CGCGGCAAGG
2801 GGGCAGGCTA TCTCAACAGT ACCGGACGAC GTGTTCCCTT CCTGAGTGCC
2851 GCCAAAATCG GGCAGGATTA TTCTTTCTTC ACAAACATCG AAACCGACGG
2901 CGGCCTGCTG GCTTTCCTCG ACAGCGTCGA AAAAACAGCG GGCAGTGAAG
2951 GCGACACGCT GTCCTATTAT GTCCGTCGCG GCAATGCGGC ACGGACTGCT
3001 TCGGCAGCGG CACATTCCGC GCCCGCCGGT CTGAAACACG CCGTAGAACA
3051 GGGCGGCAGC AATCTGGAAA ACCTGATGGT CGAACTGGAT GCCTCCGAAT
3101 CATCCGCAAC ACCCGAGACG GTTGAAACTG CGGCAGCCGA CCGCACAGAT
3151 ATGCCGGGCA TCCGCCCCTA CGGCGCAACT TTCCGCGCAG CGGCAGCCGT
3201 ACAGCATGCG AATGCCGCCG ACGGTGTACG CATCTTCAAC AGTCTCGCCG
3251 CTACCGTCTA TGCCGACAGT ACCGCCGCCC ATGCCGATAT GCAGGGACGC
3301 CGCCTGAAAG CCGTATCGGA CGGGTTGGAC CACAACGGCA CGGGTCTGCG
3351 CGTCATCGCG CAAACCCAAC AGGACGGTGG AACGTGGGAA CAGGGCGGTG
3401 TTGAAGGCAA AATGCGCGGC AGTACCCAAA CCGTCGGCAT TGCCGCGAAA
3451 ACCGGCGAAA ATACGACAGC AGCCGCCACA CTGGGCATGG GACGCAGCAC
3501 ATGGAGCGAA AACAGTGCAA ATGCAAAAAC CGACAGCATT AGTCTGTTTG
3551 CAGGCATACG GCACGATGCG GGCGATATCG GCTATCTCAA AGGCCTGTTC
3601 TCCTACGGAC GCTACAAAAA CAGCATCAGC CGCAGCACCG GTGCGGACGA
3651 ACATGCGGAA GGCAGCGTCA ACGGCACGCT GATGCAGCTG GGCGCACTGG
3701 GCGGTGTCAA CGTTCCGTTT GCCGCAACGG GAGATTTGAC GGTCGAAGGC
3751 GGTCTGCGCT ACGACCTGCT CAAACAGGAT GCATTCGCCG AAAAAGGCAG
3801 TGCTTTGGGC TGGAGCGGCA ACAGCCTCAC TGAAGGCACG CTGGTCGGAC
3851 TCGCGGGTCT GAAGCTGTCG CAACCCTTGA GCGATAAAGC CGTCCTGTTT
3901 GCAACGGCGG GCGTGGAACG CGACCTGAAC GGACGCGACT ACACGGTAAC
3951 GGGCGGCTTT ACCGGCGCGA CTGCAGCAAC CGGCAAGACG GGGGCACGCA
4001 ATATGCCGCA CACCCGTCTG GTTGCCGGCC TGGGCGCGGA TGTCGAATTC
4051 GGCAACGGCT GGAACGGCTT GGCACGTTAC AGCTACGCCG GTTCCAAACA
4101 GTACGGCAAC CACAGCGGAC GAGTCGGCGT AGGCTACCGG TTCCTCGAGC
4151 ACCACCACCA CCACCACTGA
   1 MATNDDDVKK AATVAIAAAY NNGQEINGFK AGETIYDIDE DGTITKKDAT
  51 AADVEADDFK GLGLKKVVTN LTKTVNENKQ NVDAKVKAAE SEIEKLTTKL
 101 ADTDAALADT DAALDATTNA LNKLGENITT FAEETKTNIV KIDEKLEAVA
 151 DTVDKHAEAF NDIADSLDET NTKADEAVKT ANEAKQTAEE TKQNVDAKVK
 201 AAETAAGKAE AAAGTANTAA DKAEAVAAKV TDIKADIATN KDNIAKKANS
 251 ADVYTREESD SKFVRIDGLN ATTEKLDTRL ASAEKSIADH DTRLNGLDKT
 301 VSDLRKETRQ GLAEQAALSG LFQPYNVGGS GGGGTSAPDF NAGGTGIGSN
 351 SRATTAKSAA VSYAGIKNEM CKDRSMLCAG RDDVAVTDRD AKIMAPPPNL
 401 HTGDFPNPND AYKNLINLKP AIEAGYTGRG VEVGIVDTGE SVGSISFPEL
 451 YGRKEHGYNE NYKNYTAYMR KEAPEDGGGK DIEASFDDEA VIETEAKPTD
 501 IRHVKEIGHI DLVSHIIGGR SVDGRPAGGI APDATLHIMN TNDETKNEMM
 551 VAAIRNAWVK LGERGVRIVN NSFGTTSRAG TADLFQIANS EEQYRQALLD
 601 YSGGDKTDEG IRLMQQSDYG NLSYHIRNKN MLFIFSTGND AQAQPNTYAL
 651 LPFYEKDAQK GIITVAGVDR SGEKFKREMY GEPGTEPLEY GSNHCGITAM
 701 WCLSAPYEAS VRFTRTNPIQ IAGTSFSAPI VTGTAALLLQ KYPWMSNDNL
 751 RTTLLTTAQD IGAVGVDSKF GWGLLDAGKA MNGPASFPFG DFTADTKGTS
 801 DIAYSFRNDI SGTGGLIKKG GSQLQLHGNN TYTGKTIIEG GSLVLYGNNK
 851 SDMRVETKGA LIYNGAASGG SLNSDGIVYL ADTDQSGANE TVHIKGSLQL
 901 DGKGTLYTRL GKLLKVDGTA IIGGKLYMSA RGKGAGYLNS TGRRVPFLSA
 951 AKIGQDYSFF TNIETDGGLL ASLDSVEKTA GSEGDTLSYY VRRGNAARTA
1001 SAAAHSAPAG LKHAVEQGGS NLENLMVELD ASESSATPET VETAAADRTD
1051 MPGIRPYGAT FRAAAAVQHA NAADGVRIFN SLAATVYADS TAAHADMQGR
1101 RLKAVSDGLD HNGTGLRVIA QTQQDGGTWE QGGVEGKMRG STQTVGIAAK
1151 TGENTTAAAT LGMGRSTWSE NSANAKTDSI SLFAGIRHDA GDIGYLKGLF
1201 SYGRYKNSIS RSTGADEHAE GSVNGTLMQL GALGGVNVPF AATGDLTVEG
1251 GLRYDLLKQD AFAEKGSALG WSGNSLTEGT LVGLAGLKLS QPLSDKAVLF
1301 ATAGVERDLN GRDYTVTGGF TGATAATGKT GARNMPHTRL VAGLGADVEF
1351 GNGWNGLARY SYAGSKQYGN HSGRVGVGYR FLEHHHHHH*
961cL-ORF46.1
   1 ATGAAACACT TTCCATCCAA AGTACTGACC ACAGCCATCC TTGCCACTTT
  51 CTGTAGCGGC GCACTGGCAG CCACAAACGA CGACGATGTT AAAAAAGCTG
 101 CCACTGTGGC CATTGCTGCT GCCTACAACA ATGGCCAAGA AATCAACGGT
 151 TTCAAAGCTG GAGAGACCAT CTACGACATT GATGAAGACG GCACAATTAC
 201 CAAAAAAGAC GCAACTGCAG CCGATGTTGA AGCCGACGAC TTTAAAGGTC
 251 TGGGTCTGAA AAAAGTCGTG ACTAACCTGA CCAAAACCGT CAATGAAAAC
 301 AAACAAAACG TCGATGCCAA AGTAAAAGCT GCAGAATCTG AAATAGAAAA
 351 GTTAACAACC AAGTTAGCAG ACACTGATGC CGCTTTAGCA GATACTGATG
 401 CCGCTCTGGA TGCAACCACC AACGCCTTGA ATAAATTGGG AGAAAATATA
 451 ACGACATTTG CTGAAGAGAC TAAGACAAAT ATCGTAAAAA TTGATGAAAA
 501 ATTAGAAGCC GTGGCTGATA CCGTCGACAA GCATGCCGAA GCATTCAACG
 551 ATATCGCCGA TTCATTGGAT GAAACCAACA CTAAGGCAGA CGAAGCCGTC
 601 AAAACCGCCA ATGAAGCCAA ACAGACGGCC GAAGAAACCA AACAAAACGT
 651 CGATGCCAAA GTAAAAGCTG CAGAAACTGC AGCAGGCAAA GCCGAAGCTG
 701 CCGCTGGCAC AGCTAATACT GCAGCCGACA AGGCCGAAGC TGTCGCTGCA
 751 AAAGTTACCG ACATCAAAGC TGATATCGCT ACGAACAAAG ATAATATTGC
 801 TAAAAAAGCA AACAGTGCCG ACGTGTACAC CAGAGAAGAG TCTGACAGCA
 851 AATTTGTCAG AATTGATGGT CTGAACGCTA CTACCGAAAA ATTGGACACA
 901 CGCTTGGCTT CTGCTGAAAA ATCCATTGCC GATCACGATA CTCGCCTGAA
 951 CGGTTTGGAT AAAACAGTGT CAGACCTGCG CAAAGAAACC CGCCAAGGCC
1001 TTGCAGAACA AGCCGCGCTC TCCGGTCTGT TCCAACCTTA CAACGTGGGT
1051 GGATCCGGAG GAGGAGGATC AGATTTGGCA AACGATTCTT TTATCCGGCA
1101 GGTTCTCGAC CGTCAGCATT TCGAACCCGA CGGGAAATAC CACCTATTCG
1151 GCAGCAGGGG GGAACTTGCC GAGCGCAGCG GCCATATCGG ATTGGGAAAA
1201 ATACAAAGCC ATCAGTTGGG CAACCTGATG ATTCAACAGG CGGCCATTAA
1251 AGGAAATATC GGCTACATTG TCCGCTTTTC CGATCACGGG CACGAAGTCC
1301 ATTCCCCCTT CGACAACCAT GCCTCACATT CCGATTCTGA TGAAGCCGGT
1351 AGTCCCGTTG ACGGATTTAG CCTTTACCGC ATCCATTGGG ACGGATACGA
1401 ACACCATCCC GCCGACGGCT ATGACGGGCC ACAGGGCGGC GGCTATCCCG
1451 CTCCCAAAGG CGCGAGGGAT ATATACAGCT ACGACATAAA AGGCGTTGCC
1501 CAAAATATCC GCCTCAACCT GACCGACAAC CGCAGCACCG GACAACGGCT
1551 TGCCGACCGT TTCCACAATG CCGGTAGTAT GCTGACGCAA GGAGTAGGCG
1601 ACGGATTCAA ACGCGCCACC CGATACAGCC CCGAGCTGGA CAGATCGGGC
1651 AATGCCGCCG AAGCCTTCAA CGGCACTGCA GATATCGTTA AAAACATCAT
1701 CGGCGCGGCA GGAGAAATTG TCGGCGCAGG CGATGCCGTG CAGGGCATAA
1751 GCGAAGGCTC AAACATTGCT GTCATGCACG GCTTGGGTCT GCTTTCCACC
1801 GAAAACAAGA TGGCGCGCAT CAACGATTTG GCAGATATGG CGCAACTCAA
1851 AGACTATGCC GCAGCAGCCA TCCGCGATTG GGCAGTCCAA AACCCCAATG
1901 CCGCACAAGG CATAGAAGCC GTCAGCAATA TCTTTATGGC AGCCATCCCC
1951 ATCAAAGGGA TTGGAGCTGT TCGGGGAAAA TACGGCTTGG GCGGCATCAC
2001 GGCACATCCT ATCAAGCGGT CGCAGATGGG CGCGATCGCA TTGCCGAAAG
2051 GGAAATCCGC CGTCAGCGAC AATTTTGCCG ATGCGGCATA CGCCAAATAC
2101 CCGTCCCCTT ACCATTCCCG AAATATCCGT TCAAACTTGG AGCAGCGTTA
2151 CGGCAAAGAA AACATCACCT CCTCAACCGT GCCGCCGTCA AACGGCAAAA
2201 ATGTCAAACT GGCAGACCAA CGCCACCCGA AGACAGGCGT ACCGTTTGAC
2251 GGTAAAGGGT TTCCGAATTT TGAGAAGCAC TGAGAAGCAC ATACGTAACT
2301 CGAG
   1 MKHFPSKVLT TAILATFCSG ALAATNDDDV KKAATVAIAA AYNNGQEING
  51 FKAGETIYDI DEDGTITKKD ATAADVEADD FKGLGLKKVV TNLTKTVNEN
 101 KQNVDAKVKA AESEIEKLTT KLADTDAALA DTDAALDATT NALNKLGENI
 151 TTFAEETKTN IVKIDEKLEA VADTVDKHAE AFNDIADSLD ETNTKADEAV
 201 KTANEAKQTA EETKQNVDAK VKAAETAAGK AEAAAGTANT AADKAEAVAA
 251 KVTDIKADIA TNKDNIAKKA NSADVYTREE SDSKFVRIDG LNATTEKLDT
 301 RLASAEKSIA DHDTRLNGLD KTVSDLRKET RQGLAEQAAL SGLFQPYNVG
 351 GSGGGGSDLA NDSFIRQVLD RQHFEPDGKY HLFGSRGELA ERSGHIGLGK
 401 IQSHQLGNLM IQQAAIKGNI GYIVRFSDHG HEVHSPFDNH ASHSDSDEAG
 451 SPVDGFSLYR IHWDGYEHHP ADGYDGPQGG GYPAPKGARD IYSYDIKGVA
 501 QNIRLNLTDN RSTGQRLADR FHNAGSMLTQ GVGDGFKRAT RYSPELDRSG
 551 NAAEAFNGTA DIVKNIIGAA GEIVGAGDAV QGISEGSNIA VMSGLGLLST
 601 ENKMARINDL ADMAQLKDYA AAAIRDWAVQ NPNAAQGIKA VSNIFMAAIP
 651 IKGIGAVRGK YGLGGITAHP IKPSQMGAIA LPKGKSAVSD NFADAAYAKY
 701 PSPYHSRNIR SNLEQRYGKE NITSSTVPPS NGKNVKLADQ RHPKTGVPFD
 751 GKGFPNFEKH VKYDT*
961cL-741
   1 ATGAAACACT TTCCATCCAA AGTACTGACC ACAGCCATCC TTGCCACTTT
  51 CTGTAGCGGC GCACTGGCAG CCACAAACGA CGACGATGTT AAAAAAGCTG
 101 CCACTGTGGC CATTGCTGCT GCCTACAACA ATGGCCAAGA AATCAACGGT
 151 TTCAAAGCTG GAGAGACCAT CTACGACATT GATGAAGACG GCACAATTAC
 201 CAAAAAAGAC GCAACTGCAG CCGATGTTGA AGCCGACGAC TTTAAAGGTC
 251 TGGGTCTGAA AAAAGTCGTG ACTAACCTGA CCAAAACCGT CAATGAAAAC
 301 AAACAAAACG TCGATGCCAA AGTAAAAGCT GCAGAATCTG AAATAGAAAA
 351 GTTAACAACC AAGTTAGCAG ACACTGATGC CGCTTTAGCA GATACTGATG
 401 CCGCTCTGGA TGCAACCACC AACGCCTTGA ATAAATTGGG AGAAAATATA
 451 ACGACATTTG CTGAAGAGAC TAAGACAAAT ATCGTAAAAA TTGATGAAAA
 501 ATTAGAAGCC GTGGCTGATA CCGTCGACAA GCATGCCGAA GCATTCAACG
 551 ATATCGCCGA TTCATTGGAT GAAACCAACA CTAAGGCAGA CGAAGCCGTC
 601 AAAACCGCCA ATGAAGCCAA ACAGACGGCC GAAGAAACCA AACAAAACGT
 651 CGATGCCAAA GTAAAAGCTG CAGAAACTGC AGCAGGCAAA GCCGAAGCTG
 701 CCGCTGGCAC AGCTAATACT GCAGCCGACA AGGCCGAAGC TGTCGCTGCA
 751 AAAGTTACCG ACATCAAAGC TGATATCGCT ACGAACAAAG ATAATATTGC
 801 TAAAAAAGCA AACAGTGCCG ACGTGTACAC CAGAGAAGAG TCTGACAGCA
 851 AATTTGTCAG AATTGATGGT CTGAACGCTA CTACCGAAAA ATTGGACACA
 901 CGCTTGGCTT CTGCTGAAAA ATCCATTGCC GATCACGATA CTCGCCTGAA
 951 CGGTTTGGAT AAAACAGTGT CAGACCTGCG CAAAGAAACC CGCCAAGGCC
1001 TTGCAGAACA AGCCGCGCTC TCCGGTCTGT TCCAACCTTA CAACGTGGGT
1051 GGATCCGGAG GGGGTGGTGT CGCCGCCGAC ATCGGTGCGG GGCTTGCCGA
1101 TGCACTAACC GCACCGCTCG ACCATAAAGA CAAAGGTTTG CAGTCTTTGA
1151 CGCTGGATCA GTCCGTCAGG AAAAACGAGA AACTGAAGCT GGCGGCACAA
1201 GGTGCGGAAA AAACTTATGG AAACGGTGAC AGCCTCAATA CGGGCAAATT
1251 GAAGAACGAC AAGGTCAGCC GTTTCGACTT TATCCGCCAA ATCGAAGTGG
1301 ACGGGCAGCT CATTACCTTG GAGAGTGGAG AGTTCCAAGT ATACAAACAA
1351 AGCCATTCCG CCTTAACCGC CTTTCAGACC GAGCAAATAC AAGATTCGGA
1401 GCATTCCGGG AAGATGGTTG CGAAACGCCA GTTCAGAATC GGCGACATAG
1451 CGGGCGAACA TACATCTTTT GACAAGCTTC CCGAAGGCGG CAGGGCGACA
1501 TATCGCGGGA CGGCGTTCGG TTCAGACGAT GCCGGCGGAA AACTGACCTA
1551 CACCATAGAT TTCGCCGCCA AGCAGGGAAA CGGCAAAATC CAACATTTGA
1601 AATCGCCAGA ACTCAATGTC GACCTGGCCG CCGCCGATAT CAAGCCGGAT
1651 GGAAAACGCC ATGCCGTCAT CAGCGGTTCC GTCCTTTACA ACCAAGCCGA
1701 GAAAGGCAGT TACTCCCTCG GTATCTTTGG CGGAAAAGCC CAGGAAGTTG
1751 CCGGCAGCGC GGAAGTGAAA ACCGTAAACG GCATACGCCA TATCGGCCTT
1801 GCCGCCAAGC AACTCGAGCA CCACCACCAC CACCACTGA
   1 MKHFPSKVLT TAILATFCSG ALAATNDDDV KKAATVAIAA AYNNGQEING
  51 FKAGETIYDI DKDGTITKKD ATAADVEADD FKGLGLKKVV TNLTKTVNEN
 101 KQNVDAKVKA AESEIEKLTT KLADTDAALA DTDAALDATT NALNKLGENI
 151 TTFAEETKTN IVKIDEKLEA VADTVDKHAE AFDNIADSLD ETNTKADEAV
 201 KTANEAKQTA EETKQNVDAK VKAAETAAGK AEAAAGTANT AADKAEAVAA
 251 KVTDIKADIA TNKDNIAKKA NSADVYTREE SDSKFVRIDG LNATTEKLDT
 301 RLASAEKSIA DHDTRLNGLD KTVSDLRKET RQGLAEQAAL SGLFQPYNVG
 351 GSGGGGVAAD IGAGLADALT APLDHKDKGL QSLTLDQSVR KNEKLKLAAQ
 401 GAEKTYGNGD SLNTGKLKND KVSRFDFIRQ IEVDGQLITL ESGEFQVYKQ
 451 SHSALTAFQT EQIQDSEHSG KMVAKRQFRI GDIAGEHTSF DKLPEGGRAT
 501 YRGTAFGSDD AGGKLTYTID FAAKQGNGKI EHLKSPELNV DLAAADIKPD
 551 GKRHAVISGS VLYNQAEKGS YSLGIFGGKA QEVAGSAEVK TVNGIRHIGL
 601 AAKQLEHHHH HH*
961cL-983
   1 ATGAAACACT TTCCATCCAA AGTACTGACC ACAGCCATCC TTGCCACTTT
  51 CTGTAGCGGC CGACTGGCAG CCACAAACGA CGACGATGTT AAAAAAGCTG
 101 CCACTGTGGC CATTGCTGCT GCCTACAACA ATGGCCAAGA AATCAACGGT
 151 TTCAAAGCTG GAGAGACCAT CTACGACATT GATGAAGACG GCACAATTAC
 201 CAAAAAAGAC GCAACTGCAG CCGATGTTGA AGCCGACGAC TTTAAAGGTC
 251 TGGGTCTGAA AAAAGTCGTG ACTAACCTGA CCAAAACCGT CAATGAAAAC
 301 AAACAAAACG TCGATGCCAA AGTAAAAGCT GCAGAATCTG AAATAGAAAA
 351 GTTAACAACC AAGTTAGCAG ACACTGATGC CGCTTTAGCA GATACTGATG
 401 CCGCTCTGGA TGCAACCACC AACGCCTTGA ATAAATTGGG AGAAAATATA
 451 ACGACATTTG CTGAAGAGAC TAAGACAAAT ATCGTAAAAA TTGATGAAAA
 501 ATTAGAAGCC GTGGCTGATA CCGTCGACAA GCATGCCGAA GCATTCAACG
 551 ATATCGCCGA TTCATTGGAT GAAACCAACA CTAAGGCAGA CGAAGCCGTC
 601 AAAACCGCCA ATGAAGCCAA ACAGACGGCC GAAGAAACCA AACAAAACGT
 651 CGATGCCAAA GTAAAAGCTG CAGAAACTGC AGCAGGCAAA GCCGAAGCTG
 701 CCGCTGGCAC AGCTAATACT GCAGCCGACA AGGCCGAAGC TGTCGCTGCA
 751 AAAGTTACCG ACATCAAAGC TGATATCGCT ACGAACAAAG ATAATATTGC
 801 TAAAAAAGCA AACAGTGCCG ACGTGTACAC CAGAGAAGAG TCTGACAGCA
 851 AATTTGTCAG AATTGATGGT CTGAACGCTA CTACCGAAAA ATTGGACACA
 901 CGCTTGGCTT CTGCTGAAAA ATCCATTGCC GATCACGATA CTCGCCTGAA
 951 CGGTTTGGAT AAAACAGTGT CAGACCTGCG CAAAGAAACC CGCCAAGGCC
1001 TTGCAGAACA AGCCGCGCTC TCCGGTCTGT TCCAACCTTA CAACGTGGGT
1051 GGATCCGGCG GAGGCGGCAC TTCTGCGCCC GACTTCAATG CAGGCGGTAC
1101 CGGTATCGGC AGCAACAGCA GAGCAACAAC AGCGAAATCA GCAGCAGTAT
1151 CTTACGCCGG TATCAAGAAC GAAATGTGCA AAGACAGAAG CATGCTCTGT
1201 GCCGGTCGGG ATGACGTTGC GGTTACAGAC AGGGATGCCA AAATCAATGC
1251 CCCCCCCCCG AATCTGCATA CCGGAGACTT TCCAAACCCA AATGACGCAT
1301 ACAAGAATTT GATCAACCTC AAACCTGCAA TTGAAGCAGG CTATACAGGA
1351 CGCGGGGTAG AGGTAGGTAT CGTCGACACA GGCGAATCCG TCGGCAGCAT
1401 ATCCTTTCCC GAACTGTATG GCAGAAAAGA ACACGGCTAT AACGAAAATT
1451 ACAAAAACTA TACGGCGTAT ATGCGGAAGG AAGCGCCTGA AGACGGAGGC
1501 GGTAAAGACA TTGAAGCTTC TTTCGACGAT GAGGCCGTTA TAGAGACTGA
1551 AGCAAAGCCG ACGGATATCC GCCACGTAAA AGAAATCGGA CACATCGATT
1601 TGGTCTCCCA TATTATTGGC GGGCGTTCCG TGGACGGCAG ACCTGCAGGC
1651 GGTATTGCGC CCGATGCGAC GCTACACATA ATGAATACGA ATGATGAAAC
1701 CAAGAACGAA ATGATGGTTG CAGCCATCCG CAATGCATGG GTCAAGCTGG
1751 GCGAACGTGG CGTGCGCATC GTCAATAACA GTTTTGGAAC AACATCGAGG
1801 GCAGGCACTG CCGACCTTTT CCAAATAGCC AATTCGGAGG AGCAGTACCG
1851 CCAAGCGTTG CTCGACTATT CCGGCGGTGA TAAAACAGAC GAGGGTATCC
1901 GCCTGATGCA ACAGAGCGAT TACGGCAACC TGTCCTACCA CATCCGTAAT
1951 AAAAACATGC TTTTCATCTT TTCGACAGGC AATGACGCAC AAGCTCAGCC
2001 CAACACATAT GCCCTATTGC CATTTTATGA AAAAGACGCT CAAAAAGGCA
2051 TTATCACAGT CGCAGGCGTA GACCGCAGTG GAGAAAAGTT CAAACGGGAA
2101 ATGTATGGAG AACCGGGTAC AGAACCGCTT GAGTATGGCT CCAACCATTG
2151 CGGAATTACT GCCATGTGGT GCCTGTCGGC ACCCTATGAA GCAAGCGTCC
2201 GTTTCACCCG TACAAACCCG ATTCAAATTG CCGGAACATC CTTTTCCGCA
2251 CCCATCGTAA CCGGCACGGC GGCTCTGCTG CTGCAGAAAT ACCCGTGGAT
2301 GAGCAACGAC AACCTGCGTA CCACGTTGCT GACGACGGCT CAGGACATCG
2351 GTGCAGTCGG CGTGGACAGC AAGTTCGGCT GGGGACTGCT GGATGCGGGT
2401 AAGGCCATGA ACGGACCCGC GTCCTTTCCG TTCGGCGACT TTACCGCCGA
2451 TACGAAAGGT ACATCCGATA TTGCCTACTC CTTCCGTAAC GACATTTCAG
2501 GCACGGGCGG CCTGATCAAA AAAGGCGGCA GCCAACTGCA ACTGCACGGC
2551 AACAACACCT ATACGGGCAA AACCATTATC GAAGGCGGTT CGCTGGTGTT
2601 GTACGGCAAC AACAAATCGG ATATGCGCGT CGAAACCAAA GGTGCGCTGA
2651 TTTATAACGG GGCGGCATCC GGCGGCAGCC TGAACAGCGA CGGCATTGTC
2701 TATCTGGCAG ATACCGACCA ATCCGGCGCA AACGAAACCG TACACATCAA
2751 AGGCAGTCTG CAGCTGGACG GCAAAGGTAC GCTGTACACA CGTTTGGGCA
2801 AACTGCTGAA AGTGGACGGT ACGGCGATTA TCGGCGGCAA GCTGTACATG
2851 TCGGCACGCG GCAAGGGGGC AGGCTATCTC AACAGTACCG GACGACGTGT
2901 TCCCTTCCTG AGTGCCGCCA AAATCGGGCA GGATTATTCT TTCTTCACAA
2951 ACATCGAAAC CGACGGCGGC CTGCTGGCTT CCCTCGACAG CGTCGAAAAA
3001 ACAGCGGGCA GTGAAGGCGA CACGCTGTCC TATTATGTCC GTCGCGGCAA
3051 TGCGGCACGG ACTGCTTCGG CAGCGGCACA TTCCGCGCCC GCCGGTCTGA
3101 AACACGCCGT AGAACAGGGC GGCAGCAATC TGGAAAACCT GATGGTCGAA
3151 CTGGATGCCT CCGAATCATC CGCAACACCC GAGACGGTTG AAACTGCGGC
3201 AGCCGACCGC ACAGATATGC CGGGCATCCG CCCCTACGGC GCAACTTTCC
3251 GCGCAGCGGC AGCCGTACAG CATGCGAATG CCGCCGACGG TGTACGCATC
3301 TTCAACAGTC TCGCCGCTAC CGTCTATGCC GACAGTACCG CCGCCCATGC
3351 CGATATGCAG GGACGCCGCC TGAAAGCCGT ATCGGACGGG TTGGACCACA
3401 ACGGCACGGG TCTGCGCGTC ATCGCGCAAA CCCAACAGGA CGGTGGAACG
3451 TGGGAACAGG GCGGTGTTGA AGGCAAAATG CGCGGCAGTA CCCAAACCGT
3501 CGGCATTGCC GCGAAAACCG GCGAAAATAC GACAGCAGCC GCCACACTGG
3551 GCATGGGACG CAGCACATGG AGCGAAAACA GTGCAAATGC AAAAACCGAC
3601 AGCATTAGTC TGTTTGCAGG CATACGGCAC GATGCGGGCG ATATCGGCTA
3651 TCTCAAAGGC CTGTTCTCCT ACGGACGCTA CAAAAACAGC ATCAGCCGCA
3701 GCACCGGTGC GGACGAACAT GCGGAAGGCA GCGTCAACGG CACGCTGATG
3751 CAGCTGGGCG CACTGGGCGG TGTCAACGTT CCGTTTGCCG CAACGGGAGA
3801 TTTGACGGTC GAAGGCGGTC TGCGCTACGA CCTGCTCAAA CAGGATGCAT
3851 TCGCCGAAAA AGGCAGTGCT TTGGGCTGGA GCGGCAACAG CCTCACTGAA
3901 GGCACGCTGG TCGGACTCGC GGGTCTGAAG CTGTCGCAAC CCTTGAGCGA
3951 TAAAGCCGTC CTGTTTGCAA CGGCGGGCGT GGAACGCGAC CTGAACGGAC
4001 GCGACTACAC GGTAACGGGC GGCTTTACCG GCGCGACTGC AGCAACCGGC
4051 AAGACGGGGG CACGCAATAT GCCGCACACC CGTCTGGTTG CCGGCCTGGG
4101 CGCGGATGTC GAATTCGGCA ACGGCTGGAA CGGCTTGGCA CGTTACAGCT
4151 ACGCCGGTTC CAAACAGTAC GGCAACCACA GCGGACGAGT CGGCGTAGGC
4201 TACCGGTTCT GACTCGAG
   1 MKHFPSKVLT TAILATFCSG ALAATNDDDV KKAATVAIAA AYNNGQEING
  51 FKAGETIYDI DEDGTITKKD ATAADVEADD FKGLGLKKVV TNLTKTVNEN
 101 KQNVDAKVKA AESEIEKLTT KLADTDAALA DTDAALDATT NALNKLGENI
 151 TTFAEETKTN IVKIDEKLEA VADTVDKHAE AFNDIADSLD ETNTKADEAV
 201 KTANEAKQTA EETKQNVDAK VKAAETAAGK AEAAAGTANT AADKAEAVAA
 251 KVTDIKADIA TNKDNIAKKA NSADVYTREE SDSKFVRIDG LAATTEKLDT
 301 RLASAEKSIA DHDTRLNGLD KTVSDLRKET RQGLAEQAAL SGLFQPYNVG
 351 GSGGGGTSAP DFNAGGTGIG SNSRATTAKS AAVSYAGIKN EMCKDRSMLC
 401 AGRDDVAVTD RDAKINAPPP NLHTGDFPNP NDAYKNLINL KPAIEAGYTG
 451 RGVEVGIVDT GESVGSISFP ELYGRKEHGY NENYKNYTAY MRKEAPEDGG
 501 GKDIEASFDD EAVIETEAKP TDIRHVKEIG HIDLVSHIIG GRSVDGRPAG
 551 GIAPDATLHI MNTNDETKNE MMVAAIRNAW VKLGERGVRI VNNSFGTTSR
 601 AGTADLFQIA NSEEQYRQAL LDYSGGDKTD EGIRLMQQSD YGNLSYHIRN
 651 KNMLFIFSTG NDAQAQPNTY ALLPFYEKDA QKGIITVAGV DRSGEKFKRE
 701 MYGEPGTEPL EYGSNHCGIT AMWCLSAPYE ASVRFTRTNP IQIAGTSFSA
 751 PIVTGTAALL LQKYPWMSND NLRTTLLTTA QDIGAVGVDS KFGWGLLDAG
 801 KAMNGPASFP FGDFTADTKG TSDIAYSFRN DISGTGGLIK KGGSQLQLHG
 851 NNTYTGKTII EGGSLVLYGN NKSDMRVETK GALIYNGAAS GGSLNSDGIV
 901 YLADTDQSGA NETVHIKGSL QLDGKGTLYT RLGKLLKVDG TAIIGGKLYM
 951 SARGKGAGYL NSTGRRVPFL SAAKIGQDYS FFTNIETDGG LLASLDSVEK
1001 TAGSEGDTLS YYVRRGNAAR TASAAAHSAP AGLKHAVEQG GSNLENLMVE
1051 LDASESSATP ETVETAAADR TDMPGIRPYG ATFRAAAAVQ HANAADGVRI
1101 FNSLAATVYA DSTAAHADMQ GRRLKAVSDG LDHNGTGLRV IAQTQQDGGT
1151 WEQGGVEGKM RGSTQTVGIA AKTGENTTAA ATLGMGRSTW SENSANAKTD
1201 SISLFAGIRH DAGDIGYLKG LFSYGRYKNS ISRSTGADEH AEGSVNGTLM
1251 QLGALGGVNV PFAATGDLTV EGGLRYDLLK QDAFAEKGSA LGWSGNSLTE
1301 GTLVGLAGLK LSQPLSDKAV LFATAGVERD LNGRDYTVTG GFTGATAATG
1351 KTGARNMPHT RLVAGLGADV EFGNGWNGLA RYSYAGSKQY GNHSGRVGVG
1401 YRF*
可以理解本发明仅以例子的方式进行描述,在本发明的范围和精神内还可进行改变。例如,设想可以使用其它菌株的蛋白质[如,参见WO00/66741,ORF4、ORF40、ORF46、225、235、287、519、726、919和953的多聚体序列]。
实验详述
FPLC蛋白质纯化
下表总结了所用的FPLC蛋白质纯化:
蛋白质 PI  缓冲液 pH   方法
121.1未标记的 6.23 单Q  Tris 8.0   A
128.1未标记的 5.04 单Q  Bis-Tris丙烷 6.5   A
406.1L 7.75 单Q  二乙醇胺 9.0   B
576.1L 5.63 单Q  Tris 7.5   B
593未标记的 8.79 单S  Hepes 7.4   A
726未标记的 4.95 Hi-trap S  Bis-Tris 6.0   A
919未标记的 10.5(-前导区) 单S  Bicine 8.5   C
919Lorf4 10.4(-前导区) 单S  Tris 8.0   B
920L 6.92(-前导区) 单Q  二乙醇胺 8.5   A
953L 7.56(-前导区) 单S  MES 6.6   D
982未标记的 4.73 单Q  Bis-Tris丙烷 6.5   A
919-287 6.58 Hi-trap Q  Tris 8.0   A
953-287 4.92 单Q  Bis-Tris丙烷 6.2   A
缓冲液包括20-120mM NaCl、5.0mg/ml CHAPS和10%v/v甘油。将透析液以13000g离心20分钟,加样到单Q或单S FPLC离子交换树脂上。按照感兴趣蛋白质的pI和FPLC方法手册[pharmacia:FPLC离子交换和层析聚焦;理论和方法。Pharmacia Publication]选择缓冲液和离子交换树脂。用分步NaCl梯度法脱蛋白质。用SDS-PAGE分析纯化,并用Bradford方法测定蛋白质浓度。
‘方法′栏中的字母为以下含义:
FPLC-A:破碎细胞后从大肠杆菌可溶性组分中纯化克隆121.1、128.1、593、726、982、周质蛋白质920L和杂交蛋白919-287、953-287。于37℃,在20ml LB/Amp(100μg/ml)液体培养基中,使携带感兴趣质粒的单集落生长过夜。用1.0L新鲜培养基以1∶30稀释细菌,并在30℃或37℃生长直到OD550到达0.6-0.8。以终浓度1.0mM的IPTG诱导重组蛋白质的表达。培育3小时后,于4℃以8000离心15分钟收获细菌。必要时将细胞存储于-20℃。随后的所有步骤都是在冰上或4℃进行的。对胞质蛋白质(121.1、128.1、593、726和982)和周质蛋白质920L而言,将细菌重悬浮于25ml含完整蛋白酶抑制剂(Boehringer-Mannheim)的PBS中。用Branson Sonifier 450通过超声处理裂解细胞。以8000g离心破碎的细胞30分钟,以沉淀未破碎的细胞和包含体,并加入3.9M(NH4)2SO4使上清液达到35%v/v饱和。以8000g沉积沉淀物30分钟。添加3.9M(NH4)2SO4使上清液达到70%v/v饱和,如上所述收集沉淀物。用SDS-PAGE鉴定含感兴趣蛋白质的沉淀物,并用适合的离子交换缓冲液(见以下)透析6小时或过夜。按Evans等[Infect.Immun.(1974)10:1010-1017]的方法制备表达953L大肠杆菌的周质组分,并用适合的离子交换缓冲液透析。根据感兴趣蛋白的pI和FPLC方法手册[Pharmacia]的推荐选择缓冲液和离子交换树脂。缓冲液包括20mM NaCl和10%(v/v)甘油。以13000g离心透析液20分钟,并加到单Q或单S FPLC离子交换树脂上。根据感兴趣蛋白的pI和FPLC方法手册[Pharmacia]的推荐选择缓冲液和离子交换树脂。用分步或连续NaCl梯度从离子交换树脂洗脱蛋白质。用SDS-PAGE分析纯化,并用Bradford方法测定蛋白质浓度。通过NH2-未端测序(见以下)验证周质蛋白质的前导肽的切割。
FPLC-B:从大肠杆菌的膜组分纯化这些蛋白质。37℃,在20ml LB/Amp(100μg/ml)液液培养基中使携带感兴趣质粒的单集落生长过夜。用1.0L新鲜培养基以1∶30稀释细菌。克隆406.1L和919LOrf4在30℃生长,Orf25L和576.1L在37℃生长,直到OD550达到0.6-0.8。对919LOrf4而言,生长必须在30℃,因为重组蛋白质在37℃的表达导致细胞的裂解。以终浓度为1.0mM的IPTG诱导重组蛋白质的表达。培育3小时后,于4℃以8000g离心15分钟收获细菌。必要时,将细胞存储于-20℃。随后的所有步骤都是在冰上或4℃进行的。将细菌重悬浮于25ml含完整蛋白酶抑制剂(Boehringer-Mannheim)的PBS中,并通过French Press以渗透性冲击2-3代裂解细菌。以5000g离心15分钟除去未破碎的细胞,以100000g(Beckman Ti50,38000rpm)离心45分钟沉淀膜。用Dounce匀浆器将膜沉淀物重悬浮于7.5ml 20mM Tris-HCl(pH8.0)、1.0M NaCl和完整的蛋白酶抑制剂中。混合悬浮液2-4小时,以100000g离心45分钟,并将沉淀物重悬浮于7.5ml 20mM Tris-HCl(pH8.0)、1.0M NaCl、5.0mg/mlCHAPS、10%(v/v)甘油和完整的蛋白酶抑制剂中。将此溶液混合过夜,以100000g离心45分钟,用适当选择的缓冲液透析上清液6小时。对Orf25.L而言,发现在CHAPS提取后得到的沉淀物包含重组蛋白质。无需进一步纯化,可将该组分用于免疫接种小鼠。
FPLC-C:与FPLC-A相同,但从用多粘菌素B渗透大肠杆菌后得到的可溶性组分进行纯化,而不是在细胞破碎后进行的。
FPLC-D:于37℃,使携带感兴趣质粒的单集落在20ml LB/Amp(100μg/ml)液态培养基中生长过夜。用1.0L新鲜培养基以1∶30稀释细菌,并在30℃生长直到OD550到达0.6-0.8。以终浓度1.0mM的IPTG诱导重组蛋白质的表达。培育3小时后,于4℃以8000离心15分钟收获细菌。必要时将细胞存储于-20℃。随后的所有步骤都是在冰上或4℃进行的。将细胞重悬浮于20mM Bicine(pH8.0)、20mM NaCl、10%(v/v)甘油和完整蛋白酶抑制剂(Boehringer-Mannheim)中,并用Branson Sonifier 450破碎细胞。以8000g离心超声处理液30分钟,以沉积未破碎的细胞和包含体。通过添加3.9M(NH4)2SO4,从饱和度为35%v/v到70%v/v之间的溶液中沉淀重组蛋白。以8000g沉积沉淀物30分钟,将其重悬浮于20mM Bicine(pH8.5)、20mM NaCl、10%(v/v)甘油,并用该缓冲液透析6小时或过夜。以13000g离心透析液20分钟,并加到FPLC树脂上。用分步NaCl梯度从该柱洗脱下蛋白质。用SDS-PAGE分析纯化,并用Bradford方法测定蛋白质浓度。
克隆策略和寡核苷酸设计
用以脑膜炎奈瑟球菌B MC58的基因组序列为基础设计的寡核苷酸,通过PCR扩增编码感兴趣抗原的基因。除非特别指出,通常将菌株2996的基因组DNA用作PCR反应的模板,将扩增的片段克隆入表达载体pET21b+(Novagen),从而以C-末端His标记的产物形式表达该蛋白质,或将其克隆入pET-24b+(Novagen)以‘未标记的′形式(如ΔG287K)表达该蛋白质。
当蛋白质不用融合配体和用其自身前导肽(如果存在时)表达时,进行开放读框(ATG到终止密码子)的扩增。
当蛋白质以‘未标记的′的形式表达时,通过从预计的前导序列设计5′-端扩增引物下游除去前导肽。
用于PCR的引物的解链温度取决于整个引物中杂交核苷酸的数量和类型,并用以下公式确定:
Tm1=4(G+C)+2(A+T)                  (除去尾部的)
Tm2=64.9+0.41(%GC)-600/N          (完整的引物)
对整个寡聚物而言,所选寡核苷酸的解链温度通常为65-70℃,仅针对杂交区域,解链温度为50-60℃。
用Perkin Elmer 394 DNA/RNA合成仪合成寡核苷酸,将其从柱上洗脱到2.0ml NH4OH中,在56℃培育5小时以去保护。加入0.3M乙酸钠和2体积的乙醇沉淀寡聚物。将样品离心,将沉淀物重悬浮于水中。
                       序列 限制酶切位点
  Orf1L  Fwd  CGCGGATCC GCTAGC-AAAACAACCGACAAACGG NheI
 Rev  CCCG CTCGAG-TTACCAGCGGTAGCCTA XhoI
  Orf1  Fwd  CTA GCTAGC-GGACACACTTATTTCGGCATC NheI
 Rev  CCCG CTCGAG-TTACCAGCGGTAGCCTAATTTG XhoI
  Orf1LOmpA  Fwd NdeI-(NheI)
 Rev  CCCG CTCGAG XhoI
  Orf4L  Fwd  CGCGGATCC CATATG-AAAACCTTCTTCAAAACC NdeI
 Rev  CCCG CTCGAG-TTATTTGGCTGCGCCTTC XhoI
  Orf7-1L  FwdRev  GCGGC ATTAAT-ATGTTGAGAAAATTGTTGAAATGGGCGGC CTCGAG-TTATTTTTTCAAAATATATTTGC AseIXhoI
  Orf9-1L  FwdRev  GCGGC CATATG-TTACCTAACCGTTTCAAAATGTGCGGC CTCGAG-TTATTTCCGAGGTTTTCGGG NdeIXhoI
  Orf23L  Fwd  CGCGGATCC CATATG-ACACGCTTCAAATATTC NdeI
 Rev  CCCG CTCGAG-TTATTTAAACCGATAGGTAAACGCGGATCC CATATG-GGCAGGGAAGAACCGC XhoINdeI
  Orf25-1His  Fwd
 Rev  GCCC AAGCTT-ATCGATGGAATAGCCGCG HindIII
  Orf29-1b-His(MC58)  Fwd  CGCGGATCC GCTAGC-AACGGTTTGGATGCCCG NheI
 Rev  CCCG CTCGAG-TTTGTCTAAGTTCCTGATAT XhoI
  Orf29-1b-L(MC58)  Fwd  CGCGGATCC GCTAGC-ATGAATTTGCCTATTCAAAAAT NheI
 Rev  CCCG CTCGAG-TTAATTCCCACCTGCCATC XhoI
  Orf29-1c-His(MC58)  Fwd  CGCGGATCC GCTAGC-ATGAATTTGCCTATTCAAAAAT NheI
 Rev  CCCG CTCGAG-TTGGACGATGCCCGCGAA XhoI
  Orf29-1c-L(MC58)Orf25LOrf37L  Fwd  CGCGGATCC GCTAGC-ATGAATTTGCCTATTCAAAAAT NheI
 Rev  CCCG CTCGAG-TTATTGGACGATGCCCGC XhoI
 Fwd  CGCGGATCC CATATG-TATCGCAAACTGATTGC NdeI
 Rev  CCCG CTCGAG-CTAATCGATGGAATAGCC XhoI
 Fwd  CGCGGATCC CATATG-AAACAGACAGTCAAATG NdeI
 Rev  CCCG CTCGAG-TCAATAACCCGCCTTCAG XhoI
  Orf38L  Fwd  CGCGGATCC CATATG-TTACGTTTGACTGCTTTAGCCGTATGCACC NdeI
 Rev  CCCG CTCGAG-TTATTTTGCCGCGTTAAAAGCGTCGGCAAC XhoI
  Orf40L  Fwd  CGCGGATCC CATATG-AACAAAATATACCGCAT NdeI
 Rev  CCCG CTCGAG-TTACCACTGATAACCGAC XhoI
  Orf40.2-His  Fwd  CGCGGATCC CATATG-ACCGATGACGACGATTTAT NdeI
 Rev  GCCC AAGCTT-CCACTGATAACCGACAGA HindIII
  Orf40.2L  Fwd  CGCGGATCC CATATG-AACAAAATATACCGCAT NdeI
 Rev  GCCC AAGCTT-TTACCACTGATAACCGAC HindIII
  Orf46-2L  Fwd  GGGAATTC CATATG-GGCATTTCCCGCAAAATATC NdeI
 Rev  CCCG CTCGAG-TTATTTACTCCTATAACGAGGTCTCTTAAC XhoI
  Orf46-2  Fwd  GGGAATTC CATATG-TCAGATTTGGCAAACGATTCTT NdeI
 Rev  CCCG CTCGAG-TTATTTACTCCTATAACGAGGTCTCTTAAC XhoI
  Orf46.1L  Fwd  GGGAATTC CATATG-GGCATTTCCCGCAAAATATC NdeI
 Rev  CCCG CTCGAG-TTACGTATCATATTTCACGTGC XhoI
  orf46.(His-GST)  Fwd  GGGAATTC CATATGCACGTGAAATATGATACGAAG BamHI-NdeI
 Rev  CCCG CTCGAGTTTACTCCTATAACGAGGTCTCTTAAC XhoI
  orf46.1-His  Fwd  GGGAATTC CATATGTCAGATTTGGCAAACGATTCTT NdeI
 Rev  CCCG CTCGAGCGTATCATATTTCACGTGC XhoI
  orf46.2-His  Fwd  GGGAATTC CATATGTCAGATTTGGCAAACGATTCTT NdeI
 Rev  CCCG CTCGAGTTTACTCCTATAACGAGGTCTCTTAAC XhoI
  Orf65-1-(His/GST)(MC58)Orf72-1L  Fwd  CGC GGATCCCATATG-CAAAATGCGTTCAAAATCCC BamHI-NdeI
 Rev  CGCGGATCC CATATG-AACAAAATATACCGCATCCCG CTCGAG-TTTGCTTTCGATAGAACGG XhoI
 Fwd  GCGGC CATATG-GTCATAAAATATACAAATTTGAA NdeI
 Rev  GCGGC CTCGAG-TTAGCCTGAGACCTTTGCAAATT XhoI
  Orf76-1L  Fwd  GCGGC CATATG-AAACAGAAAAAAAACCGCTG NdeI
 Rev  GCGGC CTCGAG-TTACGGTTTGACACCGTTTTC XhoI
  Orf83.1LOrf85-2L  Fwd  CGCGGATCC CATATG-AAAACCCTGCTCCTC NdeI
 Rev  CCCG CTCGAG-TTATCCTCCTTTGCGGC XhoI
 Fwd  GCGGC CATATG-GCAAAAATGATGAAATGGG NdeI
 Rev  GCGGC CTCGAG-TTATCGGCGCGGCGGGCC XhoI
  Orf91L(MC58)  FwdRev  GCGGCCATATGAAAAAATCCTCCCTCATCAGCGGCCTCGAGTTATTTGCCGCCGTTTTTGGC NdeIXhoI
  Orf91-His(MC58)  FwdRev  GCGGCCATATGGCCCCTGCCGACGCGGTAAGGCGGCCTCGAGTTTGCCGCCGTTTTTGGCTTTC NdeIXhoI
  Orf97-1L  FwdRev  GCGGC CATATG-AAACACATACTCCCCCTGAGCGGC CTCGAG-TTATTCGCCTACGGTTTTTTG NdeIXhoI
  Orf119L(MC58)  FwdRev  GCGGCCATATGATTTACATCGTACTGTTTCGCGGCCTCGAGTTAGGAGAACAGGCGCAATGC NdeIXhoI
  Orf119-His(MC58)  FwdRev  GCGGCCATATGTACAACATGTATCAGGAAAACGCGGCCTCGAGGGAGAACAGGCGCAATGCGG NdeIXhoI
  Orf137.1(His-GST)(MC58)  Fwd  CGC GGATCCGCTAGCTGCGGCACGGCGGG BamHI-NheI
 Rec  CCCG CTCGAGATAACGGTATGCCGCCAG XhoI
  Orf143-1L  FwdRev  CGCGGATCC CATATG-GAATCAACACTTTCACCCCG CTCGAG-TTACACGCGGTTGCTGT NdeIXhoI
  008  Fwd  CGCGGATCC CATATG-AACAACAGACATTTTG NdeI
 Rev  CCCG CTCGAG-TTACCTGTCCGGTAAAAG XhoI
  050-1(48)  Fwd  CGCGGATCC GCTAGC-ACCGTCATCAAACAGGAA NdeI
 Rev  CCCG CTCGAG-TCAAGATTCGACGGGGA XhoI
  105  Fwd  CGCGGATCC CATATG-TCCGCAAACGAATACG NdeI
 Rev  CCCG CTCGAG-TCAGTGTTCTGCCAGTTT XhoI
  111L  Fwd  CGCGGATCC CATATG-CCGTCTGAAACACG NdeI
 Rev  CCCG CTCGAG-TTAGCGGAGCAGTTTTTC XhoI
  117-1  Fwd  CGCGGATCC CATATG-ACCGCCATCAGCC NdeI
 Rev  CCCG CTCGAG-TTAAAGCCGGGTAACGC XhoI
  121-1  Fwd  GCGGC CATATG-GAAACACAGCTTTACATCGG NdeI
 Rev  GCGGC CTCGAG-TCAATAATAATATCCCGCG XhoI
  122-1  FwdRev  GCGGGC CATATG-ATTAAAATCCGCAATATCC NdeI
 GCGGC CTCGAG-TTAAATCTTGGTAGATTGGATTTGG XhoI
  128-1  FwdRev  GCGGC CATATG-ACTGACAACGCACTGCTCC NdeI
 GCGGC CTCGAG-TCAGACCGCGGTTGTCGAAAC XhoI
  148  Fwd  CGCGGATCC CATATG-GCGGTTAAAAACATCAAA NdeI
 RevFwdRev  CCCG CTCGAG-TCAGCCCTTCATACAGCGCGGCATTAATGGCACAAACTACACTCAAACCGCGGCCTCGAGTTAAAACTTCACGTTCACGCCG XhoIAseIXhoI
  149.1L(MC58)
  149.1-His(MC58)  FwdRev  GCGGCATTAATGCATGAAACTGAGCAATCGGTGGGCGGCCTCGAGAAACTTCACGTTCACGCCGCCGGTAAA AseIXhoI
  205(His-GST)(MC58)  Fwd  CGC GGATCCCATATGGGCAAATCCGAAAATACG BamHI-NdeI
 Rev  CCCG CTCGAGATAATGGCGGCGGCGG XhoI
  206L  Fwd  CGCGGATCC CATATG-TTTCCCCCCGACAA NdeI
 Rev  CCCG CTCGAG-TCATTCTGTAAAAAAAGTATG XhoI
  214(His-GST)(MC58)  Fwd  CGC GGATCCCATATGCTTCAAAGCGACAGCAG BamHI-NdeI
 Rev  CCCG CTCGAGTTCGGATTTTTGCGTACTC XhoI
  216  Fwd  CGCGGATCC CATATG-GCAATGGCAGAAAACG NdeI
 Rev  CCCG CTCGAG-CTATACAATCCGTGCCG XhoI
  225-1L  Fwd  CGCGGATCC CATATG-GATTCTTTTTTCAAACC NdeI
 Rev  CCCG CTCGAG-TCAGTTCAGAAAGCGGG XhoI
  235L  Fwd  CGCGGATCC CATATG-AAACCTTTGATTTTAGG NdeI
 Rev  CCCG CTCGAG-TTATTTGGGCTGCTCTTC XhoI
  243  Fwd  CGCGGATCC CATATG-GTAATCGTCTGGTTG NdeI
 Rev  CCCG CTCGAG-CTACGACTTGGTTACCG XhoI
  247-1L  Fwd  GCGGC CATATG-AGACGTAAAATGCTAAAGCTAC NdeI
 Rev  GCGGC CTCGAG-TCAAAGTGTTCTGTTTGCGC XhoI
  264-His  Fwd  GCCGC CATATG-TTGACTTTAACCCGAAAAA NdeI
 Rev  GCCGC CTCGAG-GCCGGCGGTCAATACCGCCCGAA XhoI
  270(His-GST)(MC58)  Fwd  CGC GGATCCCATATGGCGCAATGCGATTTGAC BamHI-NdeI
 Rev  CCCG CTCGAGTTCGGCGGTAAATGCCG XhoI
  274L  Fwd  GCGGC CATATG-GCGGGGCCGATTTTTGT NdeI
 Rev  GCGGC CTCGAG-TTATTTGCTTTCAGTATTATTG XhoI
  283L  Fwd  GCGGC CATATG-AACTTTGCTTTATCCGTCA NdeI
 Rev  GCGGC CTCGAG-TTAACGGCAGTATTTGTTTAC XhoI
  285-His  Fwd  CGC GGATCCCATATGGGTTTGCGCTTCGGGC BamHI
 Rev  GCCC AAGCTTTTTTCCTTTGCCGTTTCCG HindIII
  286-His(MC58)  Fwd  CGCGGATCC CATATG-GCCGACCTTTCCGAAAA NdeI
 Rev  CCCG CTCGAG-GAAGCGCGTTCCCAAGC XhoI
  286L(MC58)  Fwd  CGCGGATCC CATATG-CACGACACCCGTACCCCG CTCGAG-TTAGAAGCGCGTTCCCAA NdeIXhoI
 Rev
  287L  Fwd  CTA GCTAGC-TTTAAACGCAGCGTAATCGCAATGG NheI
 Rev  CCCG CTCGAG-TCAATCCTGCTCTTTTTTGCC XhoI
  287  Fwd  CTA GCTAGC-GGGGGCGGCGGTGGCG NheI
 Rev  CCCG CTCGAG-TCAATCCTGCTCTTTTTTGCC XhoI
  287LOrf4  Fwd  CTA GCTAGCGCTCATCCTCGCCGCC-TGCGGGGGCGGCGGT NheI
 Rev  CCCG CTCGAG-TCAATCCTGCTCTTTTTTGCC XhoI
  287-fu  Fwd  CGG GGATCC-GGGGGCGGCGGTGGCG BamHI
 Rev  CCCG CTCGAG-TCAATCCTGCTCTTTTTTGCC XhoI
  287-His  Fwd  CTA GCTAGC-GGGGGCGGCGGTGGCG NheI
 Rev  CCCG CTCGA-ATCCTGCTCTTTTTTGCC* XhoI
  287-His(2996)  Fwd  CTA GCTAGC-TGCGGGGGCGGCGGTGGCG NheI
 Rev  CCCG CTCGAG-ATCCTGCTCTTTTTTGCC XhoI
  Δ1 287-His  Fwd  CGCGGATCC GCTAGC-CCCGATGTTAAATCGGC§ NheI
  Δ2 287-His  Fwd  CGCGGATCC GCTAGC-CAAGATATGGCGGCAGT§ NheI
  Δ3 287-His  Fwd  CGCGGATCC GCTAGC-GCCGAATCCGCAAATCA§ NheI
  Δ4 287-His  Fwd  CGC GCTAGC-GGAAGGGTTGATTTGGCTAATGG§ NheI
  Δ4 287-MC58-His  Fwd  CGC GCTAGC-GGAAGGGTTGATTTGGCTAATGG§ NheI
  287a-His  Fwd  CGC CATATG-TTTAAACGCAGCGTAATCGC NdeI
 Rev  CCCG CTCGAG-AAAATTGCTACCGCCATTCGCAGG XhoI
  287b-His  Fwd  CGC CATATG-GGAAGGGTTGATTTGGCTAATGG NdeI
  287b-2996-His  Rev  CCCG CTCGAG-CTTGTCTTTATAAATGATGACATATTTG XhoI
  287b-MC58-His  Rev  CCCG CTCGAG-TTTATAAAAGATAATATATTGATTGATTCC XhoI
  287c-2996-His  Fwd  CGC GCTAGC-ATGCCGCTGATTCCCGTCAATC§ NheI
  ‘287未标记的’(2996)  Fwd  CTA GCTAGC-GGGGGCGGCGGTGGCG NheI
Rev CCCG CTCGAG-TCAATCCTGCTCTTTTTTGCCC XhoI
  ΔG287-His*  Fwd  CGCGGATCC GCTAGC-CCCGATGTTAAATCGGC NheI
 Rev  CCCG CTCGAG-ATCCTGCTCTTTTTTGCC XhoI
  ΔG287K(2996)  Fwd  CGCGGATCC GCTAGC-CCGATGTTAAATCGGC NheI
 Rev  CCCG CTCGAG-TCAATCCTGCTCTTTTTTGCC XhoI
  ΔG287-L  Fwd  CGCGGATCC GCTAGC-TTTGAACGCAGTGTGATTGCAATGGCTTGTATTTTGCCCTTTCAGCCTGT TCGCCCGATGTTAAATCGGCG NheI
 Rev  CCCG CTCGAG-TAATCCTGCTCTTTTTTGCC XhoI
  ΔG287-Orf4L  Fwd  CGCGGATCC GCTAGC-CTCATCCTCGCCGCCTGC TCGCCCGATGTTAAATCG NheI
 Rev  CCCG CTCGAG-TCAATCCTGCTCTTTTTTGCC XhoI
  292L  Fwd  CGCGGATCC CATATG-AAAACCAAGTTAATCAAA NdeI
 Rev  CCCG CTCGAG-TTATGATTTTTGGGATGA XhoI
  308-1  Fwd  CGCGGGATCC CATATG-TTAAATCGGGTATTTTATC NdeI
 Rev  CCCG CTCGAG-TTAATCCGCCATTCCCTG XhoI
  401L  Fwd  GCGGC CATATG-AAATTACAACAATTGGCTG NdeI
 Rev  GCGGC CTCGAG-TTACCTTACGTTTTTCAAAG XhoI
  406L  Fwd  CGCGGATCC CATATG-CAAGCACGGCTGCT NdeI
 Rev  CCCG CTCGAG-TCAAGGTTGTCCTTGTCA XhoI
  502-1L  Fwd  CGCGGATC CATATG-ATGAAACCGCAACAAC NdeI
 Rev  CCCCG CTCGAG-TCAGTTGCTCAACACGTC XhoI
  502-A(His-GST)  Fwd  CGC GGATCCCATATGGTAGACGCGCTTAAGCA BamHI-NdeI
 Rev  CCCG CTCGAGAGCTGCATGGCGGCG XhoI
  503-1L  Fwd  CGCGGATCC CATATG-GCACGGGTCGTTATAC NdeI
 Rev  CCCG CTCGAG-CTACCGCGCATTCCTG XhoI
  519-1L  Fwd  GCGGC CATATG-GAATTTTTCATTATCTTGTT NdeI
 Rev  GCGGC CTCGAG-TTATTTGGCGGTTTTGCTGC XhoI
  525-1L  Fwd  GCGGC CATATG-AAGTATGTCCGGTTATTTTTC NdeI
 Rev  GCGGC CTCGAG-TTATCGGCTTGTGCAACGG XhoI
  529-(His/GST)(MC58)  Fwd  CGC GGATCCGCTAGCGC-TCCGGCAGCAAAACCGA BamHI-NheI
 Rev  GCCC AAGCTT-ACGCAGTTCGGAATGGAG HindIII
  552L  Fwd  GCCGCCATATGTTGAATATTAAACTGAAAACCTTG NdeI
 Rev  GCCGCCTCGAGTTATTTCTGATGCCTTTTCCC XhoI
  556L  Fwd  GCCGCCATATGGACAATAAGACCAAACTG NdeI
 Rev  GCCGCCTCGAGTTAACGGTGCGGACGTTTC XhoI
  557L  Fwd  CGCGGATCC CATATG-AACAAACTGTTTCTTAC NdeI
 Rev  CCCG CTCGAG-TCATTCCGCCTTCAGAAA XhoI
  564ab-(His/GST)(MC58)  Fwd  CGC GGATCCCATATG-CAAGGTATCGTTGCCGACAAATCCGCACCT BamHI-NdeI
 Rev  CCCG CTCGAG-AGCTAATTGTGCTTGGTTTGCAGATAGGAGTT XhoI
  564abL(MC58)  Fwd  CGCGGATCC CATATG-AACCGCACCCTGTACAAAGTTGTATTTAACAAACATC NdeI
 Rev  CCCG CTCGAG-TTAAGCTAATTGTGCTTGGTTTGCAGATAGGAGTT XhoI
  564b-(His/GST)(MC58)  Fwd  CGC GGATCCCATATG-ACGGGAGAAAATCATGGCGGTTTCACTTCATG BamHI-NdeI
 Rev  CCCG CTCGAG- XhoI
  564c-(His/GST)(MC58)  Fwd  CGC GGATCCCATATG-GTTTCAGACGGCCTATACAACCAACATGGTGAAATT BamHI-NdeI
 Rev  CCCG CTCGAG-GCGGTAACTGCCGCTTGCACTGAATCCGTAA XhoI
  564bc-(His/GST)(MC58)  Fwd  CGC GGATCCCATATG-ACGGGAGAAAATCATGCGGTTTCACTTCATG BamHI-NdeI
 Rev  CCCG CTCGAG-GCGGTAACTGCCGCTTGCACTGAATCCGTAA XhoI
  564d-(His/GST)(MC58)  Fwd  CGC GGATCCCATATG-CAAAGCAAAGTCAAAGCAGACCATGCCTCCGTAA BamHI-NdeI
 Rev  CCCG CTGGAG-TCTTTTCCTTTCAATTATAACTTTAGTAGGTTCAATTTTGGTCCCC XhoI
  564cd-(His/GST)(MC58)  Fwd  CGC GGATCCCATATG-GTTTCAGACGGCCTATACAACCAACATGGTGGAAATT BamHI-NdeI
 Rev  CCCG CTCGAG-TCTTTTCCTTTCAATTATAACTTTAGTAGGTTCAATTTTGGTCCCC XhoI
  570L  Fwd  GCGGC CATATG-ACCCGTTTGACCCGCG NdeI
 Rev  GCGGC CTCGAG-TCAGGCGGGCGTTCATTTCTT XhoI
  576-1L  Fwd  CGCGGATCC CATATG-AACACCATTTTCAAAATC NdeI
 Rev  CCCG CTCGAG-TTAATTTACTTTTTTGATGTCG XhoI
  580L  Fwd GCGGC CATATG-GATTCGCCCAAGGTCGG   NdeI
 Rev GCGGC CTCGAG-CTACACTTCCCCCGAAGTGG   XhoI
  583L  Fwd CGCGGATCC CATATG-ATAGTTGACCAAAGCC   NdeI
 Rev CCCG CTCGAG-TTATTTTTCCGATTTTTCGG   XhoI
  593  Fwd GCGGC CATATG-CTTGAACTGAACGGACT   NdeI
 Rev GCGGC CTCGAG-TCAGCGGAAGCGGACGATT   XhoI
  650(His-GST)(MC58)  Fwd CGC GGATCCCATATGTCCAAACTCAAAACCATCG   BamHI-NdeI
 Rev CCCG CTCGAGGCTTCCAATCAGTTTGACC   XhoI
  652  Fwd GCGGC CATATG-AGCGCAATCGTTGATATTTC   NdeI
 Rev GCGGC CTCGAG-TTATTTGCCCAGTTGGTAGAATG   XhoI
  664L  Fwd GCGGC CATATG-GTGATACATCCGCACTACTTC   NdeI
 Rev GCGGC CTCGAG-TCAAAATCGAGTTTTACACCA   XhoI
  726  Fwd GCGGC CATATG-ACCATCTATTTCAAAAACGG   NdeI
 Rev GCGGC CTCGAG-TCAGCCGATGTTTAGCGTCCATT   XhpI
  741-His(MC58)  Fwd CGCGGATCC CATATG-AGCAGCGGAGGGGGTG   NdeI
 Rev CCCG CTCGAG-TTGCTTGGCGGCAAGGC   XhoI
  ΔG741-His(MC58)  Fwd CGCGGATCC CATATG-GTCGCCGCCGACATCG   NdeI
 Rev CCCG CTCGAG-TTGCTTGGCGGCAAGGC   XhoI
  686-2-(His/GST)(MC58)  Fwd CGCGGATCC CATATG-GGCGGTTCGGAAGGCG   BamHI-NdeI
 Rev CCCG CTCGAG-TTGAACACTGATGTCTTTTCCGA   XhoI
  719-(His/GST)(MC58)  Fwd CGC GGATCCGCTAGC-AAACTGTCGTTGGTGTTAAC   BamHI-NheI
 Rev CCCG CTCGAG-TTGACCCGCTCCACGG   XhoI
  730-His(MC58)  Fwd GCCGCCATATGGCGGACTTGGCGCAAGACCC   NdeI
 Rev GCCGCCTCGAGATCTCCTAAACCTGTTTTAACAATGCCG   XhoI
  730A-His(MC58)  Fwd GCCGCCATATGGCGGACTTGGCGCAAGACCC   NdeI
 Rev GCGGCCTCGAGCTCCATGCTGTTGCCCCAGC   XhoI
  730B-His(MC58)  Fwd GCCGCCATATGGCGGACTTGGCGCAAGACCC   NdeI
 Rev GCGGCCTCGAGAAAATCCCCGCTAACCGCAG   XhoI
  741-His(MC58)  Fwd CGCGGATCC CATATG-AGCAGCGGAGGGGGTG   NdeI
 Rev CCCG CTCGAG-TTTGCTTGGCGGCAAGGC   XhoI
  ΔG741-His(MC58)  Fwd CGCGGATCC CATATG-GTCGCCGCCGACATCG   NdeI
 Rev CCCG CTCGAG-TTGCTTGGCGGCAAGGC   XhoI
  743(His-GST)  Fwd CGC GGATCCCATATGGACGGTGTTGTGCCTGTT   BamHI-NdeI
 Rev CCCG CTCGAGCTTACGGATCAAATTGACG   XhoI
  757(His-GST)(MC58)  Fwd CGC GGATCCCATATGGGCAGCCAATCTGAAGAA   BamHI-NdeI
 Rev CCCG CTCGAGCTCAGCTTTTGCCGTCAA   XhoI
  759-His/GST(MC58)  Fwd CGC GGATCCGCTAGC-TACTCATCCATTGTCCGC   BamHI-NheI
 Rev CCCG CTCGAG-CCAGTTGTAGCCTATTTTG   XhoI
  759L(MC58)  Fwd CGCGGATCC GCTAGC-ATGCGCTTCACACACAC   NheI
 Rev CCCG CTCGAG-TTACCAGTTGTAGCCTATTT   XhoI
  760-His  FwdRevFwd GCCGCCATATGGCACAAACGGAAGGTTTGGAAGCCGCCTCGAGAAAACTGTAACGCAGGTTTCCGTCGCGGCCATATGGAAGAAACACCGCGCGAACCG   NdeIXhoINdeI
  769-His(NC58)
Rev GCGGCCTCGAGGAACGTTTTATTAAACTCGAC XhoI
  907L Fwd GCGGC CATATG-AGAAAACCGACCGATACCCTA NdeI
Rev GCGGC CTCGAG-TCAACGCCACTGCCAGCGGTTG XhoI
  911L Fwd CGCGGATCC CATATG-AAGAAGAACATATTGGAATTTTGGGTCGGACTG NdeI
Rev CCCG CTCGAG-TTATTCGGCGGCTTTTCCCGCATTGCCG XhoI
  911LOmpA Fwd GGGAATTC CATATGAAAAAGACAGCTATCGCGATTGCAGTGGCACTGGCTGGTTTCGCTACCGTAGCGCAGGCC GC TAGC-GCTTTCCGCGTGGCCGGCGGTGC NdeI-(NheI)
Rev CCCG CTCGAG-TTATTCGGCGGCTTTTTCCGCATTGCCG XhoI
  911LPelB Fwd CATG CCATGG-CTTTCCGCGTGGCCGGCGGTGC NcoI
Rev CCCCG CTCGAG-TTATTCGGCGGCTTTTTCCGCATTGCCG XhoI
  913-His/GST(MC58) FwdRev CGC GGATCCCATATG-TTTGCCGAAACCCGCCCCCGC CTCGAG-AGGTTGTGTTCCAGGTTG BamHI-NdeIXhoI
  913L(MC58) Fwd CGCGGATCC CATATG-AAAAAAACGCCTATG NdeI
Rev CCCCG CTCGAG-TTAAGGTTGTGTTCCAGG XhoI
  919L Fwd CGCGGATCC CATATG-AAAAAATACCTATTCCGC NdeI
Rev CCCG CTCGAG-TTACGGGCGGTATTCGG XhoI
  919 Fwd CGCGGATCC CATATG-CAAAGCAAGAGCATCCAAA NdeI
Rev CCCG CTCGAG-TTACGGGCGTATTCGG XhoI
  919LOrf4 Fwd GGGAATTC CATATGAAAACCTTCTTCAAAACCCTTTCCGCCGCCGC GCTAGCGCTCATCCTCGCCGCC-TGCCAAAGCAAGAGCATC NdeI-(NheI)
Rev CCCG CTCGAG-TTACGGGCGGTATTCGGGCTTCATACCG XhoI
  (919)-287fusion Fwd CGCGGATCC GTCGAC-TGTGGGGGCGGCGGTGGC SalI
Rev CCCG CTCGAG-TCAATCCTGCTCTTTTTTGCC XhoI
  920-1L Fwd GCGGC CATATG-AAGAAAACATTGACACTGC NdeI
Rev GCGGC CTCGAG-TTAATGGTGCGAATGACCGAT XhoI
  925-His/GST(MC58)GATE FwdRev ggggacaagtttgtacaaaaaagcaggctTGCGGCAAGGATGCCGGggggaccactttgtacaagaaagctgggtCTAAAGCAACAATGCCGG attB1attB2
  926L Fwd CGCGGATCC CATATG-AAACACACCGTATCC NdeI
Rev CCCG CTCGAG-TTATCTCGTGCGCGCC XhoI
  927-2-(His/GST)(MC58) Fwd CGCGGATCC CATATG-AGCCCCGCGCCGATT BamHI-NdeI
Rev CCCG CTCGAG-TTTTTGTGCGGTCAGGCG XhoI
  932-His/GST(MC58)GATE Fwd ggggacaagtttgtacaaaagcaggctTGTTCGTTTGGGGGATTTAAACCAAACCAAATC attBI
  935(His-GST)(MC58) For CGC GGATCCCATATGGCGGATGCGCCCGCG BamHI-NdeI
Rev CCCG CTCGAGAAACCGCCAATCCGCC XhoI
    936-1L Rev ggggaccactttgtacaagaaagcggggtTCATTTTGTTTTTCCTTCTTCTCGAGGCCATT attB2
Fwd CGCGGATCC CATATG-AAACCCAAACCGCAC NdeI
Rev CCCG CTCGAG-TCAGCGTTGGACGTAGT XhoI
    953L Fwd GGGAATTC CATATG-AAAAAAATCATCTTCGCCG NdeI
Rev CCCG CTCGAG-TTATTGTTTGGCTGCCTCGAT XhoI
    953-fu Fwd GGGAATTC CATATG-GCCACCTACAAAGTGGACG NdeI
Rev CGG GGATCC-TTGTTTGGCTGCCTCGATTTG BamHI
  954(His-GST)(MC58) Fwd CGC GGATCCCATATGCAAGAACAATCGCAGAAAG BamHI-NdeI
Rev CCCG CTCGAGTTTTTTCGGCAAATTGGCTT XhoI
  958-His/GST(MC58)GATE FwdRev ggggacaagtttgtacaaaaaagcaggctGCCGATGCCGTTGCGGggggaccactttgtacaagaaagctgggtTCAGGGTCGTTTGTTGCG attB1attB2
961L
Fwd CGCGGATCC CATATG-AAACACTTTCCATCC NdeI
Rev CCCG CTCGAG-TTACCACTCGTAATTGAC XhoI
  961 Fwd CCCG CTCGAG-TTACCACTCGTAATTGAC NdeI
Rev CCCG CTCGAG-TTACCACTCGTAATTGAC XhoI
  961c(His/GST) Fwd CGC GGATCCCATATG-GCCACAAACGACG BamHI-NdeI
Rev CCCG CTCGAG-ACCCACGTTGTAAGGTTG XhoI
  961c-(His/GST)(MC58) Fwd CGC GGATCCCATATG-GCCACAAGCGACGACGA BamHI-NdeI
Rev CCCG CTCGAG-ACCCACGTTGTAAGGTTG XhoI
  961c-L Fwd CGCGGATCC CATATG-ATGAAACACTTTCCATCC NdeI
Rev CCG CTCGAG-TTAACCCACGTTGTAAGGT XhoI
  961c-L(MC58) Fwd CGCGGATCC CATATG-ATGAAACACTTTCCATCC NdeI
Rev CCCG CTCGAG-TTAACCCACGTTGTAAGGT XhoI
  961d(His/GST) Fwd CGC GGATCCCATATG-GCCACAAACGACG BamHI-NdeI
Rev CCCG CTCGAG-GTCTGACACTGTTTTATCC XhoI
  961Δ1-L Fwd CGCGGATCC CATATG-ATGAAACACTTTCCATCC NdeI
Rev CCCG CTCGAG-TTATGCTTTGGCGGCAAAG XhoI
  fu961-... Fwd CGCGGATCC CATATG-GCCACAAACGACGAC NdeI
Rev CGC GGATCC-CCACTCGTAATTGACGCC BamHI
  fu961-...(MC58) Fwd CGCGGATCC CATATG-GCCACAAGCGACGAC NdeI
Rev CGC GGATCC-CCACTCGTAATTGACGCC BamHI
  fu961c-... Fwd CGCGGATCC CATATG-GCCACAAACGACGAC NdeI
Rev CGC GGATCC-ACCCACGTTGTAAGGTTG BamHI
  fu961c-L-... Fwd CGCGGATCC CATATG-ATGAAACACTTTCCATCC NdeI
Rev CGC GGATCC-ACCCACGTTGTAAGGTTG BamHI
  fu(961)-741(MC58)-His Fwd CGC GGATCC-GGAGGGGGTGGTGTCG BamHI
Rev CCC GCTCGAG-TTGCTTGGCGGCAAGGC XhoI
  fu(961)-983-His Fwd CGC GGATCC-GGCGGAGGCGGCACCTT BamHI
Rev CCCG CTCGAG-GAACCGGTAGCCTACG XhoI
  fu(961)-Orf46.1-His Fwd CGC GGATCCGGTGGTGGTGGT-TCAGATTTGGCAAACGATTC BamHI
Rev CCCG CTCGAG-CGTATCATATTTCACGTGC XhoI
  fu(961c-L)-741(MC58) Fwd CGC GGATCC-GGAGGGGGTGGTGTCG BamHI
Rev CCCG CTCGAG-TTATTGCTTGGCGGCAAG XhoI
  fu(961c-L)-983 Fwd CGC GGATCC-GGCGGAGGCGGCACTT BamHI
Rev CCCG CTGGAG-TCAGAACCGGTAGCCTAC XhoI
  fu(961c-L)-Orf46.1 Fwd CGC GGATCCGGTGGTGGTGGT-TCAGATTTGGCAAACGATTC BamHI
Rev CCCG CTCGAG-TTACGTATCATATTTCACGTGC XhoI
  961-(His/GST) Fwd CGC GGATCCCATATG-GCCAACAAGCGACGACG BamHI-NdeI
(MC58) Rev CCCG CTCGAG-CCACTCGTAATTGACGCC XhoI
961Δ1-His961a-(His/GST) Fwd CGCGGATCC CATATG-GCCACAAACGACGAC NdeI
Rev CCCG CTCGAG-TGCTTTGGCGGCAAAGTT XhoI
FwdRev CGCGGATCC CATATG-GCCACAAACGACGACCCCG CTCGAG-TTTAGCAATATTATCTTTGTTCGTAGC BamHI-NdeIXhoI
961b-(His/GST) Fwd CGCGGATCC CATATGG-AAAGCAAACCGTGCCGA BamHI-NdeI
Rev CCCG CTCGAG-CCACTCGTAATTGACGCC XhoI
961-His/GSTGATE FwdRev ggggacaagtttgtacaaaaaagcaggctGCAGCCACAAACGACGACGATGTTAAAAAAGCggggaccactttgtacaagaaagctgggtTTACCACTCGTAATTGACGCCGACATGGTAGG attB1attB2
982 Fwd GCGGC CATATG-GCAGCAAAAGACGTACAGTT NdeI
Rev GCGGC CTCGAG-TTACATCATGCCGCCCATACCA XhoI
983-His(2996) Fwd CGCGGATCC GCTAGC-TTAGGCGGCGGCGGAG NheI
Rev CCCG CTCGAG-GAACCGGTAGCCTACG XhoI
ΔG983-His(2996) Fwd CCCCTA GCTAGC-ACTTCTGCGCCCGACTT NheI
Rev CCCG CTCGAG-GAACCGGTAGCCTACG XhoI
983-His Fwd CGCGGATCC GCTAGC-TTAGGCGGCGGCGGAG NheI
Rev CCCG CTCGAG-GAACCGGTAGCCTACG XhoI
ΔG983-His Fwd CGCGGATCC GCTAGC-ACTTCTGCGCCCGACTT NheI
Rev CCCG CTCGAG-GAACCGGTAGCCTACG XhoI
983L Fwd CGCGGATCC GCTAGC-CGAACGACCCCAACCTTCCCTACAAAAACTTTCAA NheI
RevFwdRev CCCG CTCGAG-TCAGAACCGACGTGCCAAGCCGTTCGCCGCCATATGCCCCCACTGGAAGAACGGACGGCCGCCTCGAGTAATAAACCTTCTATGGGCAGCAG XhoINdeIXhoI
987-His(MC58)
989-(His/GST)(MC58) Fwd CGC GGATCCCATATG-TCCGTCCACGCATCCG BamHI-NdeI
Rev CCCG CTCGAG-TTTGAATTTGTAGGTGTATTGCGCGGATCC CATATG-ACCCCTTCCGCACT XhoINdeI
989L(MC58) Fwd
Rev CCCG CTCGAG-TTATTTGAATTTGTAGGTGTAT XhoI
CrgA-His(MC58) Fwd CGCGGATCC CATATG-AAAACCAATTCAGAAGAA NdeI
RevFwd CCCG CTCGAG-TCCACAGAGATTGTTTCCGATGCCCGAAGGGCGGG XhoI
PilC1-ES(MC58)
Rev GCCC AAGCTT-TCAGAAGAAGACTTCACGC
PilC1-His(MC58) Fwd CGCGGATCC CATATG-CAAACCCATAAATACGCTATT NdeI
Rev GCCC AAGCTT-GAAGAAGACTTCACGCCAG HindIII
Δ1PilC1-His(MC58) Fwd CGCGGATCC CATATG-GTCTTTTTCGACAATACCGA NdeI
Rev GCCC AAGCTT- HindIII
PilC1L(MC58) FwdRev CGCGGATCC CATATG-AATAAAACTTTAAAAAGGCGGGCCC AAGCTT-TCAGAAGAAAGACTTCACGC NdeIHindIII
ΔGTbp2-His(MC58) Fwd CGCGAATCC CATATG-TTCGATCTTGATTCTGTCGA NdeI
Rev CCCG CTCGAG-TCGCACAGGCTGTTGGCG XhoI
Tbp2-His(MC58) Fwd CGCGAATCC CATATG-TTGGGCGGAGGCGGCAG NdeI
Rev CCCG CTCGAG-TCGCACAGGCTGTTGGCG XhoI
Tbp2-His(MC58) Fwd CGCGAATCC CATATG-TTGGGCGGAGGCGGCAG NdeI
Rev CCCG CTCGAG-TCGCACAGGCTGTTGGCG XhoI
NMB0109-(His/GST)(MC58) Fwd CGC GGATCCCATATG-GCAAATTTGGAGGTGCGC BamHI-NdeI
Rev CCCG CTCGAG-TTCGGAGCGGTTGAAGC XhoI
NMB0109L(MC58) Fwd CGCGGATCC CATATG-CAACGTCGTATTATAACCC NdeI
Rev CCCG CTCGAG-TTATTCGGAGCGGTTGAAG XhoI
NMB0207-(His/GST)(MC58) Fwd CGC GGATCCCATATG-GGCATCAAAGTCGCCATCAACGGCTAC BamHI-NdeI
Rev CCCG CTCGAG-TTTGAGCGGGCGCACTTCAAGTCCG XhoI
NMB0462-(His/GST)(MC58) Fwd CGC GGATCCCATATG-GGCGGCAGCGAAAAAAAC BamHI-NdeI
Rev CCCG CTCGAG-GTTGGTGCCGACTTTGAT XhoI
NMB0623-(His/GST)(MC58) Fwd CGC GGATCCCATATG-GGCGGCGGAAGCGATA BamHI-NdeI
Rev CCCG CTCGAG-TTTGCCCGCTTTGAGCC XhoI
NMB0625(His-GST)(MC58) Fwd CGC GGATCCCATATGGGCAAATCCGAAAATACG BamHI-NdeI
Rev CCCG CTCGAGCATCCCGTACTGTTTCG XhoI
NMB0634(His/GST)(MC58) Fwd ggggacaagtttgtacaaaaaagcaggctCCGACATTACCGTGTACAACGGCCAACAAAGAA attB1
Rev ggggaccactttgtacaagaaagctgggtCTTATTTCATACCGGCTTGCTCAAGCAGCCGG attB2
NMB0776-His/GST(MC58)GATE FwdRev ggggacaagtttgtacaaaaaagcaggctGATACGGTGTTTTCCTGTAAAACGGACAACAAggggaccactttgtacaagaaagctgggtCTAGGAAAAATCGTCATCGTTGAAATTCGCC attB1attB2
NMB1115-His/GST(MC58)GATE FwdRev ggggacaagtttgtacaaaaaagcaggctATGCACCCCATCGAAACCggggaccactttgtacaagaaagctgggtCTAGTCTTGCAGTGCCTC attB1attB2
NMB1343-(His/GST)(MC58) Fwd CGC GGATCCCATATG-GGAAATTTCTTATATAGAGGCATTAG BamHI-NdeI
Rev CCCG CTCGAG-GTTAATTTCTATCAACTCTTTAGCAATAAT XhoI
NMB1369(His-GST(MC58) Fwd CGC GGATCCCATATGGCCTGCCAAGACGACA BamHI-NdeI
Rev CCCG CTCGAGCCGCCTCCTGCCGAAA XhoI
NMB1551(His-GST)(MC58) Fwd CGC GGATCCCATATGGCAGAGATCTGTTTGATAA BamHI-Ndei
Rev CCCG CTCGAGCGGTTTTCCGCCCAATG XhoI
NMB1899(His-GST)(MC58) Fwd CGC GGATCCCATATGCAGCCGGATACGGTC BamHI-NdeI
Rev CCCG CTCGAGAATCACTTCCAACACAAAAT XhoI
NMB2050-(His/GST)(MC58) Fwd CGC GGATCCCATATG-TGGTTGCTGATGAAGGGC BamHI-NdeI
Rev CCCG CTCGAG-GACTGCTTCATCTTCTGC XhoI
NMB2050L(MC58) Fwd CGCGGATCC CATATG-GAACTGATGACTGTTTTGC NdeI
Rev CCCG CTCGAG-TCAGACTGCTTCATCTTCT XhoI
NMB2159-(His/GST)(MC58)fu-ΔG287...-His Fwd CGC GGATCCCATATG-AGCATTAAAGTAGCGATTAACGGTTTCGGC BamHI-NdeI
Rev CCCG CTCGAG-GATTTTGCCTGCGAAGTATTCCAAAGTGCG XhoI
Fwd CGCGGATCC GCTAGC-CCCGATGTTAAATCGGC NheI
Rev  CGG GGATCC-ATCCTGCTCTTTTTTGCCGG BamHI
fu-(ΔG287)-919-His Fwd  CGC GGATCCGGTGGTGGTGGT-CAAAGCAAGAGCATCCAAACC BamHI
Rev  CCC AAGCTT-TTCGGGCGGTATTCGGGCTTC GindIII
fu-(ΔG287)-953-His Fwd  CGC GGATCCGGTGGTGGTGGT-GCCACCTACAAAGTGGAC BamHI
Rev  GCCC AAGCTT-TTGTTTGGCTGCCTCGAT HindIII
fu-(ΔG287)-961-His Fwd  CGC GGATCCGGTGGTGGTGGT-ACAAGCGACGACG BamHI
Rev  GCCC AAGCTT-CCACTCGTAATTGACGCC HindIII
fu-(ΔG287)-Orf46.1-His Fwd  CGC GGATCCGGTGGTGGTGGT-TCAGATTTGGCAAACGATTC BamHI
Rev  CCC AAGCTT-CGTATCATATTTCACGTGC HindIII
fu-(ΔG287-919)-Orf46.1-His Fwd  CCCC AAGCTTGGTGGTGGTGGTGGT-TCAGATTTGGCAAACGATTC HindIII
Rev  CCCG CTCGAG-CGTATCATATTTCACGTGC XhoI
fu-(ΔG287-Orf46.1)-919-His Fwd  CCC AAGCTTGGTGGTGGTGGTGGT-CAAAGCAAGAGCATCCAAACC HindIII
Rev  CCCG CTCGAG-CGGGCGGTATTCGGGCTT XhoI
fuΔG287(394.98)-... Fwd  CGCGGATCC GCTAGC-CCCGATGTTAAATCGGC NheI
Rev  CGG GGATCC-ATCCTGCTCTTTTTTGCCGG BamHI
fuOrf1-(Orf46.1)-His Fwd  CGCGGATCC GCTAGC-GGACACACTTATTTCGGCATC NheI
Rev  CGC GGATCC-CCAGCGGTAGCCTAATTTGAT
fu(Orf1)-Orf46.1-His Fwd  CGC GGATCCGGTGGTGGTGGT-TCAGATTTGGCAAACGATTC BamHI
Rev  CCC AAGCTT-CGTATCATATTTCACGTGC HindIII
fu(919)-Orf46.1-His Fwd1  GCGGC GTCGACGGTGGCGGAGGCACTGGATCCTCAG SalI
Fwd2  GGAGGCACTGGATCCTCAGATTTGGCAAACGATTC
Rev  CCCG CTCGAG-CGTATCATATTTCACGTGC XhoI
Fuorf46-.... Fwd  GGAATTC CATATGTCAGATTTGGCAAACGATTC NdeI
Rev  CGC GGATCCCGTATCATATTTCACGTGC BamHI
Fu(orf46)-287-His Fwd  CGG GGATCCGGGGGCGGCGGTGGCG BamHI
Rev  CCC AAGCTTATCCTGCTCTTTTTTGCCGGC HindIII
Fu(orf46)-919-His Fwd  CGC GGATCCGGTGGTGGTGGTCAAAGCAAGAGCATCCAAACC BamHI
Rev  CCC AAGCTTCGGGCGGTATTCGGGCTTC HindIII
Fu(orf46-919)-287-His Fwd  CCCC AAGCTTGGGGGCGGCGGTGGCG HindIII
Rev  CCCG CTCGAGATCCTGCTCTTTTTTGCCGGC XhoI
Fu(orf46-287)-919-His Fwd  CCC AAGCTTGGTGGTGGTGGTGGTCAAAGCAAGAGCATCCAAACC HindIII
Rev  CCCG CTCGAGCGGGCGGTATTCGGGCTT XhoI
(ΔG741)-961c-His Fwd1Fwd2  GGAGGCACTGGATCCGCAGCCACAAACGACGACGAGCGGC CTCGAG-GGTGGCGGAGGCACTGGATCCGCAG XhoI
Rev  CCCG CTCGAG-ACCCAGCTTGTAAGGTTG XhoI
(ΔG741)-961-His Fwd1Fwd2  GGAGGCACTGGATCCGCAGCCACAAACGACGACGAGCGGC CTCGAG-GGTGGCGGAGGCACTGGATCCGCAG XhoI
Rev  CCCG CTCGAG-CCACTCGTAATTGACGCC XhoI
(ΔG741)-983-His Fwd  GCGGC CTCGAG-GGATCCGGCGGAGGCGGCACTTCTGCG XhoI
Rev  CCCG CTCGAG-GAACCGGTAGCCTACG XhoI
(ΔG741)-orf46.1-His Fwd1Fwd2  GGAGGCACTGGATCCTCAGATTTGGCAAACGATTCGCGGC GTCGACGGTGGCGGAGGCACTGGATCCTCAGA SalI
Rev  CCCG CTCGAG-CGTATCATATTTCACGTGC XhoI
(ΔG983)-741(MC58)-His Fwd  GCGGC CTCGAG-GGATCCGGAGGGGGTGGTGTCGCC XhoI
Rev  CCCG CTCGAG-TTGCTTGGCCGGCAAG XhoI
(ΔG983)-961c-His Fwd1Fwd2  GGAGGCACTGGATCCGCAGCCACAAACGACGACGAGCGGC CTCGAG-GGTGGCGGAGGCACTGGATCCGCAG XhoI
Rev  CCCG CTCGAG-ACCCAGCTTGTAAGGTTG XhoI
(ΔG983)-961-His Fwd1Fwd2  GGAGGCACTGGATCCGCAGCCACAAACGACGACGAGCGGC CTCGAG-GGTGGCGGAGGCACTGGATCCGCAG XhoI
Rev  CCCG CTCGAG-CCACTCGTAATTGACGCC XhoI
(ΔG983)-Orf46.1-His Fwd1Fwd2  GGAGGCACTGGATCCTCAGATTTGGCAAACGATTCGCGGC GTCGACGGTGGCGGAGGCACTGGATCCTCAGA SalI
Rev  CCCG CTCGAG-CGTATCATATTTCACGTGC XhoI
*将该引物用作反向引物,将所有287的C未端融合于His-标记。
§与287-His反向引物联用的正向引物。
NB-所有PCR反应使用菌株2996,除非特别指出(如菌株MC58)。
在所有以ATG起始不跟随唯一NheI位点的构建物中,ATG密码子是用于克隆的NdeI位点的一部分。在5′端用NheI作为克隆位点制备的构建物(如所有那些在N-未端包含287的)另有两个融合于抗原的编码序列的密码子(GCTAGC)。
染色体DNA模板的制备
在100ml GC培养基中使脑膜炎奈瑟球菌菌株2996、MC58、394.98、1000和BZ232(及其它)生长至指数期,离心收获,并重悬浮于5ml缓冲液(20%w/v蔗糖、50mM Tris-HCl、50mM EDTA、pH8)中。在冰上培育10分钟后,加入10ml裂解液(50mM NaCl、1%十二烷基肌氨酸钠(Na-Sarkosyl)、50μg/ml蛋白酶K)裂解细菌,悬浮液在37℃培育2小时。进行2次苯酚提取(平衡至pH8)和一次CHCl3/异戊醇(24∶1)提取。加入0.3M乙酸钠和2体积乙醇沉降DNA,并离心收集。用70%(v/v)乙醇洗涤沉淀物1次,并重溶解于4.0ml TE缓冲液(10mM Tris-HCl、1mM EDTA、pH8.0)。读取OD260测定DNA浓度。
PCR扩增
标准的PCR过程进行如下:在40μM各寡核苷酸引物、400-800μM dNTP溶液、1×PCR缓冲液(包含1.5mM MgCl2)、2.5单位TaqI DNA聚合酶(用Perkin-Elmer AmpliTaQ,Boerhingher Mannheim ExpandTM长模板)存在时,将200ng 2996、MC581000、或BZ232菌株的基因组DNA或10ng重组克隆的质粒DNA制备物用作模板。
将整个混合物在95℃初步培育3分钟后,每份样品进行2-步的扩增:用除去引物(Tm1)的限制酶尾部的杂交温度进行前5轮。然后以按全长?聚物(Tm2)计算的杂交温度进行30轮。根据要扩增的Orf的长度,在68℃或72℃进行的延伸时间各不相同。对Orf1而言,自3分钟开始的延伸时间每轮递增15秒。以在72℃10分钟延伸步骤完成循环。
将扩增的DNA直接加到1%琼脂糖凝胶上。按制造商说明,用Qiagen凝胶提取试剂盒纯化相应于正确大小条带的DNA片段。
PCR片段和克隆载体的消化
用适合的限制酶消化相应于扩增片段的纯化DNA,从而克隆入pET-21b+、pET22b+、或pET-24b+。用QIAquick PCR纯化试剂盒(按制造商的说明)纯化消化的片段,用H2O或10mM Tris(pH8.5)洗脱。用适合的限制酶消化质粒载体,加到1.0%琼脂糖凝胶上,用Qiagen AIQquick凝胶提取试剂盒纯化相应于消化的载体的条带。
克隆
将预先消化和纯化的、相应于各基因的片段连接到pET21b+、pET22b+或pET-24b+中。将在连接缓冲液(由制造商提供)中的T4 DNA连接酶用于摩尔比为3∶1的片段/载体。
通过在冰上培育连接酶反应溶液和细菌40分钟,然后在37℃培育3分钟,将重组质粒转化入感受态大肠杆菌DH5或HB101中。
然后添加800μl LB肉汤,并在37℃培育20分钟。在Eppendorf微型离心机中以最高速度离心这些细胞,并重悬浮于约200μl的上清液中,并涂布在到LB氨苄青霉素(100mg/ml)琼脂上。
在4.0ml LB肉汤+100μg/ml氨苄青霉素中培育随机选择的集落过夜,进行重组集落的筛选。使细胞沉淀,并按制造商的说明用Qiagen QIAprep SpinMiniprep试剂盒提取质粒DNA。用适合的限制酶消化约1μg的各微型制备物,将消化物加到1-1.5%琼脂糖凝胶(取决于预计的插入大小)与分子量标记(1kbDNA Ladder,GIBCO)平行。根据插入的大小选择阳性克隆。
表达
各基因克隆入表达载体后,将重组质粒转化入适合表达重组蛋白的大肠杆菌菌株中。如上所述,用1μl各构建物转化大肠杆菌BL21-DE3。将单重组集落接种入2ml LB+Amp(100μg/ml)中,在37℃培育过夜,然后在100ml烧瓶中用20ml LB+Amp(100μg/ml)以1∶30稀释,使OD600在0.1-0.2之间。将烧瓶置于旋转式水浴摇床中于30℃或37℃培育,直到OD600显示适合诱导表达的指数生长期(0.4-0.8OD)。加入1.0mM IPTG诱导蛋白质表达。在30℃或37℃培育3小时后,测定OD600并检测表达。用微型离心机离心1.0ml各样品,将沉淀物重悬浮于PBS中,用SDS-PAGE和考马斯蓝染色分析。
Gateway克隆和表达
克隆GATE标记的序列,并用GATEWAY克隆方法(GIBCO-BRL)表达。重组克隆(CR)是根据介节噬菌体整合入大肠杆菌基因组和从大肠杆菌基因组切除噬菌体的重组反应。整合包括在位于细菌基因组attB位点中的噬菌体DNA的attP位点的重组(BP反应)和产生侧翼于attL和attR位点的整合的噬菌体基因组。切除将attL和attR位点重组回attP和attB位点(LR反应)。整合反应需要两种酶[噬菌体蛋白融合酶(Int)和细菌蛋白整合宿主因子(IHF)](BP克隆酶)。切除反应需要Iht、IHF和其它噬菌体酶切除酶(Xis)(LR克隆酶)。将25-bp细菌attB重组位点的人工衍生物(涉及B1和B2)加到用于PCR反应的引物的5′端,以扩增奈瑟球菌的ORF。用BP克隆酶,将得到的产物BP克隆入包含噬菌体attP重组位点的互补衍生物的“供体载体”中。得到的“进入克隆”包含侧翼于attL位点的衍生物(L1和L2)的ORF,用LR克隆酶将其亚克隆入包含attL-相容的attR位点的衍生物的表达“目的载体”中。得到“表达克隆”,其中ORF侧翼于B1和B2,且在读框内融合于GST或His N未端标记。
用于GATEWAY表达的大肠杆菌菌株是BL21-SI。通过在含有盐(0.3MNaCl)的培养基中培育,诱导该菌株的细胞表达T7 RNA聚合酶。
要注意的是该系统产生N-未端His标记。
膜蛋白的制备
分离主要由内膜、外膜或全膜构成的组分,以获得由膜定位的前导序列表达的重组蛋白。制备膜组分(富含重组蛋白)的方法是采用Filip等[J.Bact.(1973)115:717-722]和Davies等人[J.Innunol.Meth.(1990)143:215-225]的方法。于37℃,在20ml LB/Amp(100μg/ml)液体培养基中使携带感兴趣质粒中的单集落生长过夜。用1.0L新鲜培养基以1∶30稀释细菌,让其在30℃或37℃生长直到OD550达到0.6-0.8。用终浓度为1.0mM的IPTG诱导重组蛋白的表达。培育3小时后,在4℃以8000g离心15分钟收获细菌,并重悬浮于20ml 20mM Tris-HCl(pH7.5)和完整的蛋白酶抑制剂(Boehringer-Mannheim)中。随后的所有步骤都是在4℃或冰上进行的。
用Branson Sonifier 450进行超声处理破碎细胞,并以5000g离心20分钟以沉积未破碎的细胞和包含体。以50000g(Beckman Ti50,29000rpm)离心包含膜和细胞碎片的上清液75分钟,用20mM Bis-Tris丙烷(pH6.5)、1.0M NaCl、10%(v/v)甘油洗涤,并以50000g再次离心75分钟。将沉淀物重悬浮于20mMTris-HCl(pH7.5)、2.0%(v/v)十二烷基肌氨酸钠、完整的蛋白酶抑制剂(1.0mMEDTA终浓度),并培育20分钟以溶解内膜。以5000g离心沉淀的细胞碎片10分钟,以75000g离心上清液75分钟(Beckman Ti50,33000rpm)。在上清液中发现蛋白质008L和519L,表明内膜的定位。对这些蛋白质,用内膜和全膜组分(如上所述用NaCl洗涤)免疫接种小鼠。用20mM Tris-HCl(pH7.5)洗涤从75000g沉淀物得到的外膜小泡,并以75000g离心75分钟或过夜。最后将OMV重悬浮于500μl 20mM Tris-HCl(pH7.5)、10%v/v甘油中。Orf1L和Orf40L都定位于且在外膜组分中富含,将其用于免疫接种小鼠。用标准Bradford试验(Bio-Rad)计算蛋白质浓度,用DC蛋白质试验(Bio-Rad)确定内膜组分的蛋白质浓度。用SDS-PAGE分析分离步骤中的各种组分。
His-标记的蛋白质的纯化
从菌株2996和MC58中克隆了287的各种形式。用C-未端His标记的融合体进行构建,其包括成熟形式(aa18-427)、含缺失(Δ1、Δ2、Δ3和Δ4)的构建物和由B或C结构域组成的克隆。对以His-融合体纯化的各克隆而言,划线接种单集落,并且在37℃ LB/Amp(100μg/ml)琼脂板上培育过夜。将从该平板上分离的集落接种到20ml LB/Amp(100μg/ml)的液体培养基中,并在37℃振荡生长过夜。以1∶30将过夜培养物稀释到1.0L LB/Amp(100μg/ml)液体培养基中,让其在最佳温度(30或37℃)生长,直到OD550达到0.6-0.8。添加IPTG(终浓度为1.0mM)诱导重组蛋白的表达,再培育培养物3小时。于4℃,以8000g离心15分钟收获细菌。将细菌沉淀重物悬浮于7.5ml(i)冷缓冲液A(300mMNaCl、50mM磷酸盐缓冲液、10mM咪唑、pH8.0),用于可溶性蛋白质;或(ii)缓冲液B(10mM Tirs-HCl、100mM磷酸盐缓冲液,pH8.8和任选地8M尿素),用于不溶性蛋白质。以可溶形式纯化的蛋白质包括287-His、Δ1、Δ2、Δ3和Δ4287-His、Δ4287MC58-His、287c-His和287cMC58-His。蛋白质287bMC58-His是不溶的并相应地纯化。用Branson Sonifier 450,在冰上以40W、30秒超声处理破坏细胞4次,并于4℃以13000×g离心30分钟。对于不溶蛋白质,将沉淀物重悬浮于2.0ml缓冲液C(6M盐酸胍、100mM磷酸盐缓冲液、10mM Tris-HCl、pH7.5),并用Dounce匀浆器处理10次。以13000g离心匀浆30分钟并保留上清液。将可溶的和不溶制备物的上清液与150μl Ni2+-树脂(预先用缓冲液A或缓冲液B平衡)混合,并在室温温和振荡培育30分钟。树脂是按制造商说明制备的Chelating Sepharose Fast Flow(Pharmcia)。于4℃,以700g离心分批制备物5分钟,弃去上清液。用10ml缓冲液A或B洗涤树脂2次(分批)10分钟,重悬浮于1.0ml缓冲液A或B中,加到一次性柱上。用(i)缓冲液A(4℃)或(ii)缓冲液B(室温)持续洗涤树脂,直到流出物的OD280达到0.02-0.01。再用(i)冷缓冲液C(300mM NaCl、50mM磷酸盐缓冲液、20mM咪唑、pH8.0)或(ii)缓冲液D(10mM Tris-HCl、100mM磷酸盐缓冲液、pH6.3和任选地8M尿素)进一步洗涤树脂,直到流出物的OD280达到0.02-0.01。加入700μl(i)冷洗脱缓冲液A(300mM NaCl、50mM磷酸盐缓冲液、250mM咪唑、pH8.0)或(ii)洗脱缓冲液B(10mM Tris-HCl、100mM磷酸盐缓冲液、pH4.5和任选地8M尿素)洗脱His-融合蛋白,收集组分直到OD280显示获得了所有重组蛋白。用SDS-PAGE分析20μl量的各洗脱组分。用Bradford试验计算蛋白质浓度。
变性的His-融合蛋白的复性
需要变性以稳定287bMC8,因此在免疫接种前需要进行复性步骤。将甘油加到上述得到的变性组分中,使终浓度为10%v/v。用透析缓冲液I(10%v/v甘油,0.5M精氨酸、50mM磷酸盐缓冲液、5.0mM还原的谷胱甘肽、0.5mM氧化的谷胱甘肽、2.0M尿素,pH8.8)将蛋白质稀释至200μg/ml,用相同的缓冲液在4℃透析12-14小时。于4℃,用缓冲液II(10%v/v甘油,0.5M精氨酸、50mM磷酸盐缓冲液、5.0mM还原的谷胱甘肽、0.5mM氧化的谷胱甘肽、pH8.8)再进行透析12-14小时。用以下公式计算蛋白质的浓度:
           蛋白质(mg/ml)=(1.55×OD280)-(0.76×OD260)
氨基酸序列分析
根据制造商的推荐,用配备在线乙内酰苯硫脲-氨基酸分析仪(System Gold)的Beckman测序仪(LF 3000)进行蛋白质NH2-末端的自动测序分析。
免疫接种
在第0、21和35天,用抗原免疫接种Balb/C小鼠,在第49天分析血清。
血清分析-ELISA
将不包囊的MenB M7和包囊的菌株置于巧克力琼脂板上,在37℃、5%CO2中培育过夜。用无菌Dracon刷从琼脂板上收集细菌菌落,并接种到含有0.25%葡萄糖的Mueller-Hinton肉汤(Difco)中。每30分钟监测一次细菌的生长,随后测定OD620。让细菌生长直到OD达到0.4-0.5。将培养物以4000rpm离心10分钟。弃去上清液,用PBS洗涤细菌2次,重悬浮于含有0.025%甲醛的PBS中,并在37℃培育1小时,然后在4℃搅拌培育过夜。在96孔Greiner板的各孔中添加100μl细菌细胞,并在4℃培育过夜。然后用PBT洗涤缓冲液(0.1%Tween-20的PBS溶液)冲洗这些孔3次。在各孔中加入200μl饱和缓冲液(2.7%聚乙烯吡咯烷酮10的水溶液),将这些平板在37℃培育2小时。用PBT冲洗这些孔3次。在各孔中加入200μl稀释的血清(稀释缓冲液:1%BSA、0.1%Tween-20、0.1%NaN3的PBS溶液),将这些平板在37℃培育2小时。用PBT冲洗这些孔3次。在各孔中加入100μl HRP-缀合的兔抗-小鼠(Dako)血清(用稀释缓冲液以1∶2000稀释),将这些平板置于37℃培育90分钟。用PBT缓冲液洗涤这些孔3次。在各孔中加入100μl HRP的底物缓冲液(25ml柠檬酸缓冲液pH5,10mg邻-苯二胺(phenildiamine)和10μl H2O2),并将平板在室温中静置20分钟。在各孔中加入100μl 12.5%H2SO4,随后测定OD490。计算ELISA滴定度,即高于预先免疫血清稀释度的、OD490值为0.4的血清稀释度。当OD490值为0.4的血清稀释度高于1∶400时,将ELISA视为阳性。
血清分析-FACS扫描细菌结合分析
将不包囊的MenB M7菌株置于巧克力琼脂板上,在37℃、5%CO2中培育过夜。用无菌Dracon刷从琼脂板上收集菌落,并接种到4支装有0.25%葡萄糖的8ml Mueller-Hinton肉汤(Difco)试管中。每30分钟监测细菌的生长,然后测定OD620。让细菌生长直到OD达到0.35-0.5。将培养物以4000rpm离心10分钟。弃去上清液,用封阻缓冲液(1%BSA的PBS溶液,0.4%NaN3)重悬浮沉淀物,并以4000rpm离心5分钟。将细胞重悬浮于封阻缓冲液,使OD620达到0.05。在96孔Costar板的各孔中添加100μl细菌细胞。在各孔中加入100μl稀释的(1∶100、1∶200、1∶400)血清(以封阻缓冲液配制),并将这些平板在4℃培育2小时。以4000rpm离心细胞5分钟,吸出上清液,在各孔中加入200μl/孔封阻缓冲液洗涤细胞。在各孔中加入100μl R-Phicoerytrin缀合的F(ab)2山羊抗-小鼠(以1∶100稀释),将平板置于4℃培育1小时。以4000rpm离心5分钟以沉淀细胞,加入200μl/孔封阻缓冲液洗涤细胞。吸出上清液,细胞重悬浮于200μl/孔PBS、0.25%甲醛。将样品转移到FACScan管中并读数。FACScan(Laser Power 15mW)的条件设为:FL2开;FSC-H阈值:92;FSC PMT电压:E01;SSC PMT:474;Amp.Gains 6.1;FL-2 PMT:586;补偿值:0。
血清分析-杀菌试验
于37℃、在5%CO2、在巧克力琼脂板(以冷冻原液起始)上培育脑膜炎奈瑟球菌2996过夜。收集菌落,并将其接种到7ml含有0.25%葡萄糖的Mueller-Hinton肉汤中,使OD620达到0.05-0.08。在37℃振荡培育约1.5小时,直到OD620达到0.23-0.24。用50mM磷酸盐缓冲液(pH7.2,含10mM MgCl2、10mM CaCl2和0.5%(w/v)BSA(分析缓冲液))以105CFU/ml工作稀释度稀释细菌。最终反应混合物的总体积为50μl,其中25μl连续2倍稀释的测试血清,12.5μl工作稀释度的细菌,12.5μl幼兔补体(终浓度25%)。
对照包括:用补体血清培育的细菌、用细菌培育并在56℃加热30分钟补充灭活的免疫血清。在加入幼兔补体后,用斜置方法立即将10μl对照置于Mueller-Hinton琼脂板上(0时间)。37℃旋转培育96孔板1小时。将每份样品的7μl涂布在Mueller-Hinton琼脂板上作为斑点,而用斜置方法将10μl对照涂布在Mueller-Hinton琼脂板上(1时间)。37℃培育琼脂板18小时,计算相应于0时间和1时间的菌落数量。
血清分析-Western印迹法
将纯化的蛋白质(500ng/泳道)、外膜小泡(5μg)和MenB菌株2996衍生的全细胞提取物(25μg)加到12%SDS-聚丙烯酰胺凝胶上,并转移到硝基纤维素膜上。用转化缓冲液(0.3%Tris碱,1.14%甘氨酸、20%(v/v)甲醇)在4℃、150mA进行转化2小时。于4℃在饱和缓冲液(10%脱脂乳、0.1%Triton X100的PBS溶液)中培育过夜使膜饱和。用冲洗缓冲液(3%脱脂乳、0.1%Triton X100的PBS溶液)冲洗膜2次,并在37℃与用洗涤缓冲液以1∶200稀释的小鼠血清一起培育2小时。冲洗膜2次,与1∶2000稀释的辣根过氧化物酶标记的抗-小鼠Ig一起培育90分钟。用0.1%Triton X100的PBS溶液冲洗膜2次,用Opti-4CN底物试剂盒(Bio-Rad)显色。加入水终止反应。
如下制备OMV:37℃、5%CO2,在5个GC板上让脑膜炎奈瑟球菌2996生长过夜,用接种环收获,并重悬浮于10ml 20mM Tris-HCl pH7.5、2mM EDTA中。在56℃热灭活45分钟,在冰上超声处理破碎细胞5分钟(50%负载循环(dutycycle)、50%输出,Branson超声仪3mm微型针头)。以5000g离心10分钟除去未破碎的细胞,回收含有完整细胞包膜组分的上清液,于4℃以50000g进一步离心过夜。将含有膜的沉淀物重悬浮于2%二烷基肌氨酸、20mM Tris-HClpH7.5、2mM EDTA中,在室温培育20分钟以溶解内膜。以10000g离心上清液10分钟除去聚集体,以50000g进一步离心上清液3小时。用PBS冲洗含有外膜的沉积物,并重悬浮于相同的缓冲液中。用BSA作为标准,由D.C.Bio-Rad蛋白分析(改进的Lowry方法)测定蛋白质的浓度。
如下制备全细胞提取物:使脑膜炎奈瑟球菌在GC板上培育过夜,用接种环收获,并重悬浮于1ml 20mM Tris-HCl中。在56℃热灭活30分钟。
961结构域的研究
细胞组分的制备 用过夜培养物或在IPTG培育3小时后的细菌制备表达961不同结构域的大肠杆菌克隆的全裂解物、周质、上清液和OMV。简单地说,获得周质,细菌悬浮于蔗糖25%和Tris 50mM(pH8)(含有polimixine100μg/ml)。1小时后,室温以13000rpm离心细菌15分钟,收集上清液。用0.2μm过滤培养物上清液,在冰中用TCA 50%沉淀2小时。离心(13000rp,30分钟)后,用乙醇70%漂洗沉淀物2次,并悬浮于PBS中。如上所述,进行OMV制备。用针对GST-961的多克隆抗血清,在SDS-PAGE或Western印迹中分析各细胞组分。
粘附分析 在补充有10%热灭活的PCS、15mM L-谷氨酰胺和抗生素的DMEM(Gibco)中维持张氏(Chang)上皮细胞(Wong-Kilbourne衍生物,克隆1-5c-4,人结膜)。
为了进行粘附分析,用PBS漂洗张氏上皮细胞的亚融合培养物,并用胰蛋白酶-EDTA(Giboc)处理,从而从塑性支持体上释放它们。然后将细胞悬浮于PBS中,计数并在PBS中稀释至5×105细胞/ml。
沉淀过夜培育的或用IPTG诱导后的细菌,并用PBS通过以13000离心5分钟洗涤2次。在室温、暗处,在1ml缓冲液(含有50mM NaHCO3和100mM NaClpH8)中将约2-3×108(cfu)与0.5mg/ml FITC(Sigma)一起培育30分钟。洗涤FITC标记的细菌2-3次,并以1-1.5×109/ml悬浮于PBS中。于37℃,将200μl此悬浮液(2-3×108)与200μl(1×105)上皮细胞一起培育30分钟。然后以2000rpm离心细胞5分钟,除去未粘附的细胞,悬浮液200μl PBS中,转移到FACScan管中并读数。

Claims (45)

1.一种异源表达本发明蛋白质的方法,其特征在于,所述的方法中(a)除去蛋白质中的至少一个结构域,和任选地(b)未使用融合配体。
2.如权利要求1所述的方法,其特征在于,所述的本发明的蛋白质是ORF46。
3.如权利要求2所述的方法,其特征在于,将所述的ORF46分成第一结构域(氨基酸1-433)和第二结构域(氨基酸433-608)。
4.如权利要求2所述的方法,其特征在于,所述的本发明的蛋白质是564。
5.如权利要求4所述的方法,其特征在于,将所述的蛋白质564分成如图8所示的结构域。
6.如权利要求1所述的方法,其特征在于,所述的本发明的蛋白质是961。
7.如权利要求6所述的方法,其特征在于,将所述的蛋白质961分成如图12所示的结构域。
8.如权利要求1所述的方法,其特征在于,所述的本发明的蛋白质是502,且所述的结构域是氨基酸28-167(按MC58序列编号)。
9.如权利要求1所述的方法,其特征在于,所述的本发明的蛋白质是287。
10.一种异源表达本发明蛋白质的方法,其特征在于,在所述的方法中(a)除去蛋白质N-未端区域的一部分。
11.如权利要求9或10所述的方法,其特征在于,将所述的蛋白质287如图5所示分成结构域A、B和C。
12.如权利要求11所述的方法,其特征在于,除去(i)所述的结构域A;(ii)所述的结构域A和B;或(iii)所述的结构域A和C。
13.如权利要求11所述的方法,其特征在于,除去所述的结构域A的(i)氨基酸1-17;(ii)氨基酸1-25;(iii)氨基酸1-69;或(iv)氨基酸1-106。
14.一种异源表达本发明蛋白质的方法,其特征在于,所述的方法(a)未使用融合配体,和(b)使用蛋白质的天然前导肽(如果存在)。
15.如权利要求14所述的方法,其特征在于,所述的本发明的蛋白质选自:111、149、206、225-1、235、247-1、274、283、286、292、401、406、502-1、503、519-1、525-1、552、556、557、570、576-1、580、583、664、759、907、913、920-1、936-1、953、961、983、989、Orf4、Orf7-1、Orf9-1、Orf23、Orf25、Orf37、Orf38、Orf40、Orf40.1、Orf40.2、Orf72-1、Orf76-1、Orf85-2、Orf91、Orf97-1、Orf119、Orf143.1、NMB0109、NMB2050、008、105、117-1、121-1、122-1、128-1、148、216、243、308、593、652、726、926、982、Orf83-1和Orf143-1。
16.一种异源表达本发明蛋白质的方法,其特征在于,在所述的方法中(a)用不同蛋白质的前导肽替代该蛋白质的前导肽,和任选地(b)未使用融合配体。
17.如权利要求16所述的方法,其特征在于,所述的不同蛋白质是961、ORF4、大肠杆菌OmpA或胡萝卜软腐欧文氏菌PelB,或所述的前导肽是MKKYLFSAA。
18.如权利要求17所述的方法,其特征在于,所述的不同蛋白质是大肠杆菌OmpA,且本发明的蛋白质是ORF1。
19.权利要求17所述的方法,其特征在于,所述的本发明蛋白质是911,所述的不同蛋白质是胡萝卜软腐欧文氏菌PelB或大肠杆菌OmpA。
20.如权利要求17所述的方法,其特征在于,所述的不同蛋白质是ORF4,所述的本发明的蛋白质是287。
21.一种异源表达本发明蛋白质的方法,其特征在于,在所述的方法中(a)除去所述的蛋白质的前导肽,和任选地(b)未使用融合配体。
22.如权利要求21所述的方法,其特征在于,所述的本发明蛋白质是919。
23.一种异源表达本发明蛋白质的方法,其特征在于,在不显现所述的蛋白质毒性的温度表达本发明的蛋白质。
24.如权利要求23所述的方法,其特征在于,在30℃表达所述的蛋白质919。
25.一种异源表达本发明蛋白质的方法,其特征在于,突变所述的蛋白质以降低或除去毒性。
26.如权利要求25所述的方法,其特征在于,所述的本发明蛋白质是907、919或922。
27.如权利要求26所述的方法,其特征在于,在Glu-117突变907(如Glu→Gly)。
28.如权利要求26所述的方法,其特征在于,在Glu-255(如Glu→Gly)和/或Glu-323(如Glu→Gly)突变919。
29.如权利要求26所述的方法,其特征在于,在Glu-164(如Glu-→Gly)、Ser-213(如Ser→Gly)和/或Asn-348(如Asn-Gly)突变922。
30.一种异源表达本发明蛋白质的方法,其特征在于,在所述的方法中使用载体pSM214或载体pET-24b。
31.如权利要求30所述的方法,其特征在于,所述的本发明蛋白质是953,载体是pSM214。
32.一种异源表达本发明蛋白质的方法,其特征在于,表达或纯化所述的蛋白质使其为特定的多聚体形式。
33.如权利要求32所述的方法,其特征在于,以单体形式表达和/或纯化蛋白质953。
34.如权利要求32所述的方法,其特征在于,以四聚体形式表达和/或纯化蛋白质961。
35.如权利要求32所述的方法,其特征在于,以二聚体形式表达和/或纯化蛋白质287。
36.如权利要求32所述的方法,其特征在于,以单体形式表达和/或纯化蛋白质919。
37.一种异源表达本发明蛋白质的方法,其特征在于,在所述的方法中将蛋白质以脂质化的蛋白质表达。
38.如权利要求37所述的方法,其特征在于,所述的本发明蛋白质是919、287、ORF4、406、576或ORF25。
39.一种异源表达本发明蛋白质的方法,其特征在于,在所述的方法中(a)突变蛋白质的C-未端区域,和任选地(b)未使用融合配体。
40.如权利要求39所述的方法,其特征在于,所述的突变是替代、插入或缺失。
41.如权利要求40所述的方法,其特征在于,所述的本发明的蛋白质是730、ORF29或ORF46。
42.一种异源表达本发明蛋白质的方法,其特征在于,在所述的方法中突变所述的蛋白质的前导肽。
43.如权利要求42所述的方法,其特征在于,所述的本发明蛋白质是919。
44.由上述任一方法表达的蛋白质。
45.包含N-未端氨基酸序列MKKYLFSAA的异源蛋白质。
CNB2003101028453A 2000-02-28 2001-02-28 奈瑟球菌蛋白质的异源表达 Expired - Fee Related CN100473663C (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
GB0004695.3 2000-02-28
GB0004695A GB0004695D0 (en) 2000-02-28 2000-02-28 Protein expression
GB0027675.8 2000-11-13
GB0027675A GB0027675D0 (en) 2000-11-13 2000-11-13 Protein Expression

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CNB018087507A Division CN1201011C (zh) 2000-02-28 2001-02-28 奈瑟球菌蛋白质的异源表达

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN200510116305XA Division CN1800385B (zh) 2000-02-28 2001-02-28 奈瑟球菌蛋白质的异源表达

Publications (2)

Publication Number Publication Date
CN1544462A true CN1544462A (zh) 2004-11-10
CN100473663C CN100473663C (zh) 2009-04-01

Family

ID=26243750

Family Applications (7)

Application Number Title Priority Date Filing Date
CNB2003101028453A Expired - Fee Related CN100473663C (zh) 2000-02-28 2001-02-28 奈瑟球菌蛋白质的异源表达
CNB018087507A Expired - Fee Related CN1201011C (zh) 2000-02-28 2001-02-28 奈瑟球菌蛋白质的异源表达
CN2007101391568A Expired - Fee Related CN101139590B (zh) 2000-02-28 2001-02-28 奈瑟球菌蛋白质的杂交表达
CNB2003101036036A Expired - Fee Related CN100334214C (zh) 2000-02-28 2001-02-28 奈瑟球菌蛋白质的杂交表达
CN2010101656630A Pending CN101906413A (zh) 2000-02-28 2001-02-28 奈瑟球菌蛋白质的异源表达
CN200510116305XA Expired - Fee Related CN1800385B (zh) 2000-02-28 2001-02-28 奈瑟球菌蛋白质的异源表达
CNB018087388A Expired - Fee Related CN100339482C (zh) 2000-02-28 2001-02-28 奈瑟球菌蛋白质的杂交表达

Family Applications After (6)

Application Number Title Priority Date Filing Date
CNB018087507A Expired - Fee Related CN1201011C (zh) 2000-02-28 2001-02-28 奈瑟球菌蛋白质的异源表达
CN2007101391568A Expired - Fee Related CN101139590B (zh) 2000-02-28 2001-02-28 奈瑟球菌蛋白质的杂交表达
CNB2003101036036A Expired - Fee Related CN100334214C (zh) 2000-02-28 2001-02-28 奈瑟球菌蛋白质的杂交表达
CN2010101656630A Pending CN101906413A (zh) 2000-02-28 2001-02-28 奈瑟球菌蛋白质的异源表达
CN200510116305XA Expired - Fee Related CN1800385B (zh) 2000-02-28 2001-02-28 奈瑟球菌蛋白质的异源表达
CNB018087388A Expired - Fee Related CN100339482C (zh) 2000-02-28 2001-02-28 奈瑟球菌蛋白质的杂交表达

Country Status (20)

Country Link
US (9) US7803387B2 (zh)
EP (6) EP1947187B9 (zh)
JP (8) JP4846160B2 (zh)
CN (7) CN100473663C (zh)
AT (3) ATE387502T1 (zh)
AU (4) AU3947801A (zh)
BR (2) BR0108711A (zh)
CA (5) CA2400570C (zh)
CY (6) CY1106532T1 (zh)
DE (3) DE60126249T2 (zh)
DK (4) DK2270030T3 (zh)
ES (5) ES2281409T3 (zh)
HK (4) HK1055993A1 (zh)
LU (1) LU92240I2 (zh)
MX (2) MXPA02008313A (zh)
NL (1) NL300605I2 (zh)
NZ (2) NZ521396A (zh)
PT (4) PT1947187E (zh)
RU (2) RU2299906C2 (zh)
WO (2) WO2001064920A2 (zh)

Families Citing this family (86)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998012332A1 (en) 1996-09-17 1998-03-26 Chiron Corporation Compositions and methods for treating intracellular diseases
SG152917A1 (en) * 1998-01-14 2009-06-29 Chiron Srl Neisseria meningitidis antigens
EP2261347A3 (en) 1998-05-01 2012-01-11 Novartis Vaccines and Diagnostics, Inc. Neisseria meningitidis antigens and compositions
US20070026021A1 (en) * 1998-05-01 2007-02-01 Chiron S.R.I. Neisseria meningitidis antigens and compositions
CA2371994C (en) * 1999-02-26 2010-09-28 Guido Grandi Enhancement of bactericidal activity of neisseria antigens with oligonucleotides containing cg motifs
NZ581940A (en) 1999-04-30 2011-07-29 Novartis Vaccines & Diagnostic Conserved neisserial antigens
GB9911683D0 (en) * 1999-05-19 1999-07-21 Chiron Spa Antigenic peptides
EP1179072A2 (en) * 1999-05-19 2002-02-13 Chiron S.P.A. Combination neisserial compositions
CN1433470A (zh) 1999-10-29 2003-07-30 启龙股份公司 奈瑟球菌的抗原性肽
GB9928196D0 (en) 1999-11-29 2000-01-26 Chiron Spa Combinations of B, C and other antigens
DK1248647T3 (da) * 2000-01-17 2010-09-27 Novartis Vaccines & Diagnostic Ydre membranvesikel (OMV) vaccine omfattende N. meningitidis serogruppe B ydre membranproteiner
PT1947187E (pt) 2000-02-28 2011-07-04 Novartis Vaccines & Diagnostic Expressões híbridas de proteínas de neisseria
WO2002083711A2 (en) * 2001-04-17 2002-10-24 Chiron Corporation Molecular mimetics of meningococcal b epitopes which elicit functionally active antibodies
GB0115176D0 (en) 2001-06-20 2001-08-15 Chiron Spa Capular polysaccharide solubilisation and combination vaccines
US6928463B1 (en) * 2001-07-06 2005-08-09 Nortel Networks Limited Broadband content delivery via personal content tunnel
GB0118249D0 (en) 2001-07-26 2001-09-19 Chiron Spa Histidine vaccines
AU2002355197A1 (en) * 2001-07-27 2003-02-17 Chiron Srl Meningococcus adhesins nada, app and orf 40
GB0121591D0 (en) 2001-09-06 2001-10-24 Chiron Spa Hybrid and tandem expression of neisserial proteins
AU2014201962B2 (en) * 2001-09-06 2016-06-09 Novartis Vaccines And Diagnostics S.R.L. Hybrid and tandem expression of Neisserial proteins
WO2003028661A2 (en) * 2001-10-03 2003-04-10 Chiron Corporation Adjuvanted meningococcus compositions
US7838015B2 (en) 2001-10-03 2010-11-23 Novartis Vaccines And Diagnostics, Inc. Adjuvanted meningococcus compositions
AR045702A1 (es) 2001-10-03 2005-11-09 Chiron Corp Composiciones de adyuvantes.
MX339524B (es) * 2001-10-11 2016-05-30 Wyeth Corp Composiciones inmunogenicas novedosas para la prevencion y tratamiento de enfermedad meningococica.
JP2006506467A (ja) * 2002-08-02 2006-02-23 グラクソスミスクライン バイオロジカルズ ソシエテ アノニム ワクチン組成物
US7785608B2 (en) 2002-08-30 2010-08-31 Wyeth Holdings Corporation Immunogenic compositions for the prevention and treatment of meningococcal disease
SI2351579T1 (sl) * 2002-10-11 2017-05-31 Glaxosmithkline Biologicals Sa Polipeptidna cepiva za široko zaščito proti hipervirulentnim meningokoknim linijam
KR101130948B1 (ko) 2002-11-01 2012-03-30 글락소스미스클라인 바이오로지칼즈 에스.에이. 건조 공정
US20070059329A1 (en) 2002-11-15 2007-03-15 Nathalie Norais Unexpected surface proteins in meningococcus
GB0227346D0 (en) * 2002-11-22 2002-12-31 Chiron Spa 741
CN101926988B (zh) * 2003-01-30 2014-06-04 诺华疫苗和诊断有限公司 抗多种脑膜炎球菌血清组的可注射性疫苗
CA2535562A1 (en) 2003-08-13 2005-03-03 Chiron Corporation Improved method of purifying tfpi and tfpi analogs
ATE506963T1 (de) 2003-10-02 2011-05-15 Novartis Vaccines & Diagnostic Kombinationsimpfstoffe gegen meningitis
GB0323103D0 (en) 2003-10-02 2003-11-05 Chiron Srl De-acetylated saccharides
GB0408977D0 (en) 2004-04-22 2004-05-26 Chiron Srl Immunising against meningococcal serogroup Y using proteins
GB0409748D0 (en) * 2004-04-30 2004-06-09 Chiron Srl Lactoferrin cleavage
GB0419408D0 (en) * 2004-09-01 2004-10-06 Chiron Srl 741 chimeric polypeptides
GB0424092D0 (en) 2004-10-29 2004-12-01 Chiron Srl Immunogenic bacterial vesicles with outer membrane proteins
HUE030881T2 (en) 2005-02-18 2017-06-28 Glaxosmithkline Biologicals Sa Meningitis / sepsis-associated escherichia coli proteins and nucleic acids
NZ580974A (en) 2005-02-18 2011-05-27 Novartis Vaccines & Diagnostic Immunogens from uropathogenic escherichia coli
CN100475965C (zh) * 2005-07-22 2009-04-08 上海高科联合生物技术研发有限公司 一种大肠杆菌高效外分泌表达溶葡萄球菌酶的方法
GB0524066D0 (en) 2005-11-25 2006-01-04 Chiron Srl 741 ii
EP1962902A2 (en) * 2005-12-06 2008-09-03 Universita Degli Studi di Padova Methods and compositions relating to adhesins as adjuvants
AU2007285484B2 (en) 2006-08-16 2013-05-02 Novartis Ag Immunogens from uropathogenic Escherichia coli
AR064642A1 (es) 2006-12-22 2009-04-15 Wyeth Corp Polinucleotido vector que lo comprende celula recombinante que comprende el vector polipeptido , anticuerpo , composicion que comprende el polinucleotido , vector , celula recombinante polipeptido o anticuerpo , uso de la composicion y metodo para preparar la composicion misma y preparar una composi
GB0700562D0 (en) 2007-01-11 2007-02-21 Novartis Vaccines & Diagnostic Modified Saccharides
GB0713880D0 (en) 2007-07-17 2007-08-29 Novartis Ag Conjugate purification
SI2200642T1 (sl) 2007-10-19 2012-06-29 Novartis Ag Formulacije meningokoknega cepiva
EP2886551A3 (en) 2008-02-21 2015-09-23 Novartis AG Meningococcal fhbp polypeptides
AU2009222105B2 (en) 2008-03-03 2012-05-17 Novartis Ag Compounds and compositions as TLR activity modulators
EP2294085A1 (en) * 2008-06-09 2011-03-16 Novartis AG Antibodies against neisserial factor h binding protein
JP5487463B2 (ja) 2008-08-08 2014-05-07 独立行政法人産業技術総合研究所 非拡散植物ウイルスベクター
EP2411048B1 (en) 2009-03-24 2020-05-06 GlaxoSmithKline Biologicals SA Adjuvanting meningococcal factor h binding protein
US9517263B2 (en) 2009-06-10 2016-12-13 Glaxosmithkline Biologicals Sa Benzonaphthyridine-containing vaccines
EP2443250B8 (en) 2009-06-16 2016-09-21 GlaxoSmithKline Biologicals SA High-throughput complement-mediated antibody-dependent and opsonic bactericidal assays
EP2470204B1 (en) 2009-08-27 2015-12-16 GlaxoSmithKline Biologicals SA Hybrid polypeptides including meningococcal fhbp sequences
JO3257B1 (ar) 2009-09-02 2018-09-16 Novartis Ag مركبات وتركيبات كمعدلات لفاعلية tlr
CN102844047B (zh) 2009-09-02 2017-04-05 诺华股份有限公司 含tlr活性调节剂的免疫原性组合物
WO2011039631A2 (en) 2009-09-30 2011-04-07 Novartis Ag Expression of meningococcal fhbp polypeptides
BR112012010531A2 (pt) 2009-10-27 2019-09-24 Novartis Ag "polipeptídeos de modificação meningocócica fhbp"
WO2011057148A1 (en) 2009-11-05 2011-05-12 Irm Llc Compounds and compositions as tlr-7 activity modulators
JP5814933B2 (ja) 2009-12-15 2015-11-17 ノバルティス アーゲー 免疫増強化合物の均質な懸濁物およびその使用
KR101853513B1 (ko) 2010-03-23 2018-04-30 노파르티스 아게 감염, 염증, 호흡기 질환 등의 치료를 위해 사용되는 tlr2 효능제로서의 화합물 (시스테인 기재 리포펩티드) 및 조성물
WO2011161653A1 (en) 2010-06-25 2011-12-29 Novartis Ag Combinations of meningococcal factor h binding proteins
EP3831406B1 (en) 2010-08-23 2024-06-05 Wyeth LLC Stable formulations of neisseria meningitidis rlp2086 antigens
BR112013005626B1 (pt) 2010-09-10 2022-07-26 Glaxosmithkline Biologicals Sa Meningococo, processo para a preparação de uma cepa meningocócica, vesículas de membrana externa, composição farmacêutica imunogênica, e, uso de uma composição
AU2011300409B2 (en) 2010-09-10 2015-03-26 Wyeth Llc Non-lipidated variants of Neisseria meningitidis ORF2086 antigens
GB201102090D0 (en) * 2011-02-08 2011-03-23 Univ Sheffield Antigenic polypeptide
AU2012301812A1 (en) 2011-08-31 2014-03-06 Children's Hospital & Research Center Oakland Engineered sequences to facilitate expression of antigens in neisseria and methods of use
MX351993B (es) 2012-03-09 2017-11-03 Pfizer Composiciones de neisseria meningitidis y metodos de las mismas.
SA115360586B1 (ar) 2012-03-09 2017-04-12 فايزر انك تركيبات لعلاج الالتهاب السحائي البكتيري وطرق لتحضيرها
NZ630133A (en) 2012-06-14 2016-10-28 Novartis Ag Vaccines for serogroup x meningococcus
US10000545B2 (en) 2012-07-27 2018-06-19 Institut National De La Sante Et De La Recherche Medicale CD147 as receptor for pilus-mediated adhesion of Meningococci to vascular endothelia
WO2014084432A1 (ko) * 2012-11-30 2014-06-05 경상대학교 산학협력단 헬리코박터 파일로리 발현 벡터
CA2903716C (en) 2013-03-08 2019-04-09 Pfizer Inc. Immunogenic fusion polypeptides
MX369534B (es) 2013-09-08 2019-11-11 Pfizer Composiciones de neisseria meningitidis y sus metodos.
HUE052293T2 (hu) 2014-02-28 2021-04-28 Glaxosmithkline Biologicals Sa Módosított fHbp meningococcus-polipeptidek
RU2723045C2 (ru) 2015-02-19 2020-06-08 Пфайзер Инк. Композиции neisseria meningitidis и способы их получения
GB201522153D0 (en) 2015-12-15 2016-01-27 Univ Southampton Meningococcal infection and modified neisseria lactamica
US20190282684A1 (en) 2016-09-02 2019-09-19 Glaxosmithkline Biologicals, S.A. Vaccines for neisseria gonorrhoeae
EP3312192B1 (en) * 2016-10-24 2023-02-22 BiOMVis Srl Immunogenic compositions containing bacterial outer membrane vesicles
JP7010961B2 (ja) 2017-01-31 2022-02-10 ファイザー・インク 髄膜炎菌組成物およびその方法
CN110516550B (zh) * 2019-07-26 2022-07-05 电子科技大学 一种基于fpga的车道线实时检测方法
MX2023009728A (es) 2021-02-19 2023-08-30 Sanofi Pasteur Inc Vacuna recombinante meningococica b.
GB202208089D0 (en) 2022-06-01 2022-07-13 Glaxosmithkline Biologicals Sa Immunogenic composition
GB202208093D0 (en) 2022-06-01 2022-07-13 Glaxosmithkline Biologicals Sa Immunogenic composition
WO2024030931A1 (en) 2022-08-03 2024-02-08 Sanofi Pasteur Inc. Adjuvanted immunogenic composition against neisseria meningitidis b

Family Cites Families (131)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4239749A (en) * 1979-09-27 1980-12-16 United States Of America Neisseria gonorrhoeae vaccine
US5288641A (en) * 1984-06-04 1994-02-22 Arch Development Corporation Herpes Simplex virus as a vector
CA1282721C (en) 1984-06-04 1991-04-09 Bernard Roizman Herpes simplex virus as a vector
EP0273116A3 (en) 1986-10-09 1990-05-02 Max-Planck-Gesellschaft zur Förderung der Wissenschaften e.V. Gonococcal and meningococcal polypeptides, vaccines and diagnostics
GB8702816D0 (en) 1987-02-07 1987-03-11 Al Sumidaie A M K Obtaining retrovirus-containing fraction
US5270176A (en) * 1987-11-20 1993-12-14 Hoechst Aktiengesellschaft Method for the selective cleavage of fusion proteins with lysostaphin
CA1340506C (en) * 1987-11-24 1999-04-20 Nicholas H. Carbonetti Production of gonorrheal pi proteins and vaccines
WO1989009271A1 (en) 1988-03-21 1989-10-05 Viagene, Inc. Recombinant retroviruses
US5591624A (en) * 1988-03-21 1997-01-07 Chiron Viagene, Inc. Retroviral packaging cell lines
US5422120A (en) * 1988-05-30 1995-06-06 Depotech Corporation Heterovesicular liposomes
AP129A (en) 1988-06-03 1991-04-17 Smithkline Biologicals S A Expression of retrovirus gag protein eukaryotic cells
EP0449958B9 (en) 1988-12-19 2003-05-28 American Cyanamid Company Meningococcal class 1 outer-membrane protein vaccine
NL8803111A (nl) 1988-12-19 1990-07-16 Nederlanden Staat Multivalent meningococcen klasse i buitenmembraaneiwit vaccin.
DK0465529T3 (da) 1989-03-21 1998-10-05 Vical Inc Ekspression af exogene polynukleotidsekvenser i et hvirveldyr
US5703055A (en) * 1989-03-21 1997-12-30 Wisconsin Alumni Research Foundation Generation of antibodies through lipid mediated DNA delivery
GB8919607D0 (en) 1989-08-30 1989-10-11 Wellcome Found Novel entities for cancer therapy
CU22302A1 (es) * 1990-09-07 1995-01-31 Cigb Secuencia nucleotidica codificante para una proteina de la membrana externa de neisseria meningitidis y uso de dicha proteina en preparados vacunales
EP0467714A1 (en) 1990-07-19 1992-01-22 Merck & Co. Inc. The class II protein of the outer membrane of neisseria meningitidis
JPH06500923A (ja) 1990-09-21 1994-01-27 カイロン コーポレイション パッケージング細胞
US5965424A (en) * 1991-01-11 1999-10-12 Boehringer Mannheim Gmbh Methods for making neisseria or hemophilus IgA protease and DNA encoding the proteases
WO1992016643A1 (en) * 1991-03-14 1992-10-01 Imclone Systems Incorporated Recombinant hybrid porin epitopes
FR2681786A1 (fr) 1991-09-27 1993-04-02 Centre Nat Rech Scient Vecteurs recombinants d'origine virale, leur procede d'obtention et leur utilisation pour l'expression de polypeptides dans des cellules musculaires.
NZ244306A (en) 1991-09-30 1995-07-26 Boehringer Ingelheim Int Composition for introducing nucleic acid complexes into eucaryotic cells, complex containing nucleic acid and endosomolytic agent, peptide with endosomolytic domain and nucleic acid binding domain and preparation
IL103059A0 (en) 1991-09-30 1993-02-21 Boehringer Ingelheim Int Conjugates for introducing nucleic acid into higher eucaryotic cells
US6100380A (en) * 1991-10-28 2000-08-08 Cytran, Inc. Immunomodulating peptides and methods of use
JPH07503372A (ja) 1992-01-23 1995-04-13 バイカル・インコーポレイテッド 生体外遺伝子導入
FR2692592B1 (fr) * 1992-06-19 1995-03-31 Pasteur Merieux Serums Vacc Fragments d'ADN codant pour les sous-unités du récepteur de la transferrine de Neisseria meningitidis et procédés les exprimant.
EP1167544B1 (en) * 1992-07-07 2005-09-14 Fuso Pharmaceutical Industries Ltd. Probe for diagnosing infectious disease arising from Escherichia coli, Klebsiella pneumoniae or Enterobacter cloacae
US6592873B1 (en) 1992-10-30 2003-07-15 Iowa State University Research Foundation, Inc. Polynucleic acids isolated from a porcine reproductive and respiratory syndrome virus (PRRSV) and proteins encoded by the polynucleic acids
US5785974A (en) * 1993-01-23 1998-07-28 Immunologia Y Genetica Aplicada, S.A. Synthetic peptides and vaccines against parvovirus
US5439808A (en) 1993-07-23 1995-08-08 North American Vaccine, Inc. Method for the high level expression, purification and refolding of the outer membrane group B porin proteins from Neisseria meningitidis
JPH11501203A (ja) * 1993-07-30 1999-02-02 ザ ユニバーシティー オブ ノースカロライナ アット チャペル ヒル 大腸菌およびサルモネラ菌中における淋菌piタンパクおよびワクチンの製造
US5914254A (en) * 1993-08-02 1999-06-22 Celtrix Pharmaceuticals, Inc. Expression of fusion polypeptides transported out of the cytoplasm without leader sequences
US5510264A (en) 1993-09-28 1996-04-23 Insight Biotech Inc. Antibodies which bind meningitis related homologous antigenic sequences
CA2176712C (en) 1993-11-16 2000-05-23 Mantripragada Sankaram Synthetic membrane vesicles with controlled release of encapsulated biologically active substances
EP0772689B1 (en) 1994-05-09 2007-12-19 Oxford Biomedica (UK) Limited Retroviral vectors having a reduced recombination rate
FR2720408B1 (fr) * 1994-05-31 1996-08-14 Pasteur Merieux Serums Vacc Fragments Tbp2 de Neisseria meningitidis.
US6245337B1 (en) 1994-08-25 2001-06-12 Washington University Haemophilus adherence and penetration proteins
IL117483A (en) 1995-03-17 2008-03-20 Bernard Brodeur MENINGITIDIS NEISSERIA shell protein is resistant to proteinase K.
US5646259A (en) 1995-03-24 1997-07-08 St. Louis University DNA encoding haemophilus adhesion proteins
US6265567B1 (en) 1995-04-07 2001-07-24 University Of North Carolina At Chapel Hill Isolated FrpB nucleic acid molecule
ES2271954T3 (es) * 1995-06-07 2007-04-16 Sanofi Pasteur Inc. Expresion de lipoproteinas.
PL325604A1 (en) 1995-09-18 1998-08-03 Us Army Med Res Mat Command Improved methods of obtaining non-covalently complexed and multvalent proteosomal subunitary vaccines
DE19534579C2 (de) 1995-09-18 2000-06-08 Max Planck Gesellschaft Nucleinsäure-Moleküle codierend Proteine, die die Adhäsion von Neisseria-Zellen an humane Zellen vermitteln
FR2739624B1 (fr) * 1995-10-10 1997-12-05 Pasteur Merieux Serums Vacc Nouvelle sous-unite tbp2 de neisseria meningitidis
ZA9610456B (en) * 1995-12-20 1997-06-20 Novo Nordisk As N-terminally extended proteins expressed in yeast
AU2115897A (en) 1996-02-01 1997-08-22 North American Vaccine, Inc. Expression of group b neisseria meningitidis outer membrane (mb3) protein from yeast and vaccines
US6083499A (en) * 1996-04-19 2000-07-04 Mycogen Corporation Pesticidal toxins
US6472518B1 (en) 1996-10-24 2002-10-29 Centers For Disease Control And Prevention, As Represented By The Secretary, Department Of Health And Human Services Invasion associated genes from Neisseria meningitidis serogroup B
US5980898A (en) 1996-11-14 1999-11-09 The United States Of America As Represented By The U.S. Army Medical Research & Material Command Adjuvant for transcutaneous immunization
BR9714160A (pt) 1996-12-20 2000-05-02 Univ Texas Antìgenos uspa1 e uspa2 de moraxella catarrhalis
US6017531A (en) 1997-06-02 2000-01-25 W. R. Grace & Co. Hydrophilic composition containing protease produced by Vibrio
US6583275B1 (en) * 1997-07-02 2003-06-24 Genome Therapeutics Corporation Nucleic acid sequences and expression system relating to Enterococcus faecium for diagnostics and therapeutics
US6914131B1 (en) * 1998-10-09 2005-07-05 Chiron S.R.L. Neisserial antigens
AU9363798A (en) 1997-11-06 1999-05-31 Chiron S.P.A. Neisserial antigens
GB9726398D0 (en) 1997-12-12 1998-02-11 Isis Innovation Polypeptide and coding sequences
SG152917A1 (en) 1998-01-14 2009-06-29 Chiron Srl Neisseria meningitidis antigens
US7635486B1 (en) * 1998-02-03 2009-12-22 The United States Of America As Represented By The Department Of Health And Human Services Recombinant lipidated PsaA protein, methods of preparation and use
US6426417B1 (en) * 1998-02-11 2002-07-30 Eli Lilly And Company Processes and intermediates useful to make antifolates
GB9808734D0 (en) 1998-04-23 1998-06-24 Smithkline Beecham Biolog Novel compounds
GB9808866D0 (en) 1998-04-24 1998-06-24 Smithkline Beecham Biolog Novel compounds
US6150502A (en) * 1998-04-29 2000-11-21 Genesis Research & Development Corporation Limited Polypeptides expressed in skin cells
EP2261347A3 (en) 1998-05-01 2012-01-11 Novartis Vaccines and Diagnostics, Inc. Neisseria meningitidis antigens and compositions
US6615024B1 (en) * 1998-05-01 2003-09-02 Arraycomm, Inc. Method and apparatus for determining signatures for calibrating a communication station having an antenna array
US20070026021A1 (en) * 1998-05-01 2007-02-01 Chiron S.R.I. Neisseria meningitidis antigens and compositions
US5990085A (en) * 1998-05-04 1999-11-23 Michigan State University Inhibin-HBc fusion protein
GB9810276D0 (en) 1998-05-13 1998-07-15 Smithkline Beecham Biolog Novel compounds
US6248329B1 (en) * 1998-06-01 2001-06-19 Ramaswamy Chandrashekar Parasitic helminth cuticlin nucleic acid molecules and uses thereof
EP1144998A3 (en) * 1998-10-09 2002-08-07 Chiron Corporation Neisseria genomic sequences and methods of their use
AU2289000A (en) 1999-01-15 2000-08-01 Smithkline Beecham Biologicals (Sa) (neisseria meningitidis) polypeptide basb052
EP1147194A1 (en) 1999-01-22 2001-10-24 SMITHKLINE BEECHAM BIOLOGICALS s.a. Neisseria meningitidis antigenic polypeptides, corresponding polynucleotides and protective antibodies
GB9902084D0 (en) 1999-01-29 1999-03-24 Smithkline Beecham Biolog Novel compounds
CA2371994C (en) * 1999-02-26 2010-09-28 Guido Grandi Enhancement of bactericidal activity of neisseria antigens with oligonucleotides containing cg motifs
NZ581940A (en) * 1999-04-30 2011-07-29 Novartis Vaccines & Diagnostic Conserved neisserial antigens
AU780308B2 (en) 1999-04-30 2005-03-17 J. Craig Venter Institute, Inc. Neisseria genomic sequences and methods of their use
EP1179072A2 (en) 1999-05-19 2002-02-13 Chiron S.P.A. Combination neisserial compositions
GB9911683D0 (en) * 1999-05-19 1999-07-21 Chiron Spa Antigenic peptides
GB9916529D0 (en) 1999-07-14 1999-09-15 Chiron Spa Antigenic peptides
CN1433470A (zh) * 1999-10-29 2003-07-30 启龙股份公司 奈瑟球菌的抗原性肽
JP4840956B2 (ja) * 1999-11-29 2011-12-21 ノバルティス ヴァクシンズ アンド ダイアグノスティクス エスアールエル 85kDaのナイセリア抗原
GB9928676D0 (en) 1999-12-03 2000-02-02 Provalis Uk Ltd Pseudomonas aeruginosa antigens
US20010031268A1 (en) * 1999-12-17 2001-10-18 Baldwin Thomas John Antigen preparations
DK1248647T3 (da) * 2000-01-17 2010-09-27 Novartis Vaccines & Diagnostic Ydre membranvesikel (OMV) vaccine omfattende N. meningitidis serogruppe B ydre membranproteiner
NZ520445A (en) * 2000-01-25 2004-02-27 Univ Queensland Proteins comprising conserved regions of neisseria meningitidis surface antigen NhhA
PT1947187E (pt) * 2000-02-28 2011-07-04 Novartis Vaccines & Diagnostic Expressões híbridas de proteínas de neisseria
CA2407352A1 (en) 2000-04-21 2001-11-01 Corixa Corporation Compositions and methods for the therapy and diagnosis of acne vulgaris
CA2414884A1 (en) 2000-07-03 2002-01-10 Chiron S.P.A. Immunisation against chlamydia pneumoniae
GB0017149D0 (en) 2000-07-12 2000-08-30 Chiron Spa Helicobacter pylori mutants
GB0103170D0 (en) 2001-02-08 2001-03-28 Smithkline Beecham Biolog Vaccine composition
US20040073294A1 (en) * 2002-09-20 2004-04-15 Conor Medsystems, Inc. Method and apparatus for loading a beneficial agent into an expandable medical device
GB0103424D0 (en) * 2001-02-12 2001-03-28 Chiron Spa Gonococcus proteins
GB0118249D0 (en) * 2001-07-26 2001-09-19 Chiron Spa Histidine vaccines
EP1409013B1 (en) 2001-07-26 2009-11-18 Novartis Vaccines and Diagnostics S.r.l. Vaccines comprising aluminium adjuvants and histidine
GB0121591D0 (en) * 2001-09-06 2001-10-24 Chiron Spa Hybrid and tandem expression of neisserial proteins
AU2002355197A1 (en) 2001-07-27 2003-02-17 Chiron Srl Meningococcus adhesins nada, app and orf 40
MX339524B (es) 2001-10-11 2016-05-30 Wyeth Corp Composiciones inmunogenicas novedosas para la prevencion y tratamiento de enfermedad meningococica.
GB0129007D0 (en) * 2001-12-04 2002-01-23 Chiron Spa Adjuvanted antigenic meningococcal compositions
JP2006506467A (ja) * 2002-08-02 2006-02-23 グラクソスミスクライン バイオロジカルズ ソシエテ アノニム ワクチン組成物
US7785608B2 (en) * 2002-08-30 2010-08-31 Wyeth Holdings Corporation Immunogenic compositions for the prevention and treatment of meningococcal disease
SI2351579T1 (sl) * 2002-10-11 2017-05-31 Glaxosmithkline Biologicals Sa Polipeptidna cepiva za široko zaščito proti hipervirulentnim meningokoknim linijam
GB0227346D0 (en) * 2002-11-22 2002-12-31 Chiron Spa 741
US20070148729A1 (en) 2003-01-15 2007-06-28 Farley John E Methods for increasing neisseria protein expression and compositions thereof
CN101926988B (zh) * 2003-01-30 2014-06-04 诺华疫苗和诊断有限公司 抗多种脑膜炎球菌血清组的可注射性疫苗
WO2004094596A2 (en) 2003-04-16 2004-11-04 Wyeth Holdings Corporation Novel immunogenic compositions for the prevention and treatment of meningococcal disease
GB0315021D0 (en) * 2003-06-26 2003-07-30 Chiron Srl Immunogenic gonococcal compositions
GB0323103D0 (en) * 2003-10-02 2003-11-05 Chiron Srl De-acetylated saccharides
ATE506963T1 (de) * 2003-10-02 2011-05-15 Novartis Vaccines & Diagnostic Kombinationsimpfstoffe gegen meningitis
GB0408977D0 (en) * 2004-04-22 2004-05-26 Chiron Srl Immunising against meningococcal serogroup Y using proteins
GB0409748D0 (en) * 2004-04-30 2004-06-09 Chiron Srl Lactoferrin cleavage
GB0410866D0 (en) * 2004-05-14 2004-06-16 Chiron Srl Haemophilius influenzae
GB0419408D0 (en) 2004-09-01 2004-10-06 Chiron Srl 741 chimeric polypeptides
PT2682126T (pt) 2005-01-27 2017-02-28 Children`S Hospital & Res Center At Oakland Vacinas de vesícula com base em agn1870 para proteção de amplo espetro contra doenças causadas por neisseria meningitidis
GB0524066D0 (en) * 2005-11-25 2006-01-04 Chiron Srl 741 ii
ES2670231T3 (es) 2006-03-22 2018-05-29 Glaxosmithkline Biologicals S.A. Regímenes para inmunización con conjugados meningocócicos
TW200806315A (en) 2006-04-26 2008-02-01 Wyeth Corp Novel formulations which stabilize and inhibit precipitation of immunogenic compositions
EP2044104A2 (en) * 2006-06-29 2009-04-08 Novartis AG Polypeptides from neisseria meningitidis
AR064642A1 (es) * 2006-12-22 2009-04-15 Wyeth Corp Polinucleotido vector que lo comprende celula recombinante que comprende el vector polipeptido , anticuerpo , composicion que comprende el polinucleotido , vector , celula recombinante polipeptido o anticuerpo , uso de la composicion y metodo para preparar la composicion misma y preparar una composi
WO2008125985A2 (en) 2007-04-11 2008-10-23 Novartis Ag Blocking interaction between pathogen factors and factor h to inhibit hemorrhagic syndromes
CA2688268A1 (en) 2007-06-04 2008-12-11 Novartis Ag Formulation of meningitis vaccines
EP2886551A3 (en) 2008-02-21 2015-09-23 Novartis AG Meningococcal fhbp polypeptides
AU2009222105B2 (en) * 2008-03-03 2012-05-17 Novartis Ag Compounds and compositions as TLR activity modulators
US9511131B2 (en) 2008-03-10 2016-12-06 Children's Hospital & Research Center Oakland Chimeric factor H binding proteins (fHBP) containing a heterologous B domain and methods of use
WO2010028096A2 (en) 2008-09-03 2010-03-11 Children's Hospital & Research Center At Oakland Peptides presenting an epitope of an a domain of factor h binding protein and methods of use
IT1394288B1 (it) 2008-09-12 2012-06-06 Novartis Vaccines & Diagnostic Immunogeni di proteine che legano il fattore h.
GB0819633D0 (en) 2008-10-25 2008-12-03 Isis Innovation Composition
EP2411048B1 (en) 2009-03-24 2020-05-06 GlaxoSmithKline Biologicals SA Adjuvanting meningococcal factor h binding protein
US20120177681A1 (en) * 2010-09-01 2012-07-12 Manmohan Singh Formulation of immunopotentiators
US9057716B2 (en) * 2010-09-04 2015-06-16 Novartis Ag Bactericidal antibody assays to assess immunogenicity and potency of meningococcal capsular saccharide vaccines
BR112013005626B1 (pt) * 2010-09-10 2022-07-26 Glaxosmithkline Biologicals Sa Meningococo, processo para a preparação de uma cepa meningocócica, vesículas de membrana externa, composição farmacêutica imunogênica, e, uso de uma composição
RU2632651C2 (ru) * 2011-05-11 2017-10-06 Чилдрен'С Медикал Сентер Корпорейшн Модифицированный биотин-связывающий белок, слитые белки на его основе и их применение
US9184727B2 (en) * 2012-06-11 2015-11-10 Phonon Corporation SAW device and method for post-seal frequency trimming

Also Published As

Publication number Publication date
ES2391153T3 (es) 2012-11-22
DE60132978D1 (de) 2008-04-10
PT1790660E (pt) 2012-09-17
CN101906413A (zh) 2010-12-08
DE60126249D1 (de) 2007-03-15
AU3947801A (en) 2001-09-12
CA2400570A1 (en) 2001-09-07
EP2270031A3 (en) 2011-02-16
US8114960B2 (en) 2012-02-14
WO2001064922A3 (en) 2001-12-06
BR0108713A (pt) 2004-06-22
EP1259627A2 (en) 2002-11-27
ES2299476T3 (es) 2008-06-01
AU2001239478B2 (en) 2007-05-17
RU2002125882A (ru) 2004-03-10
CN100334214C (zh) 2007-08-29
JP4846160B2 (ja) 2011-12-28
CN100473663C (zh) 2009-04-01
PT2270030E (pt) 2012-07-24
RU2002125880A (ru) 2004-03-10
MXPA02008313A (es) 2002-12-09
CN1508253A (zh) 2004-06-30
EP1947187A1 (en) 2008-07-23
US9267163B2 (en) 2016-02-23
CY2013025I2 (el) 2015-11-04
LU92240I2 (fr) 2013-09-04
CY1113032T1 (el) 2016-04-13
DK1947187T3 (da) 2011-05-09
JP2013005816A (ja) 2013-01-10
EP1261723A2 (en) 2002-12-04
CN1426471A (zh) 2003-06-25
EP1790660B1 (en) 2012-06-20
DE60132978T2 (de) 2009-02-26
DK1790660T3 (da) 2012-09-17
ES2386534T3 (es) 2012-08-22
BR0108711A (pt) 2004-06-22
JP2011083287A (ja) 2011-04-28
CN101139590A (zh) 2008-03-12
HK1071147A1 (en) 2005-07-08
EP2270030A2 (en) 2011-01-05
US20170080076A1 (en) 2017-03-23
CA2689666A1 (en) 2001-09-07
JP2016128520A (ja) 2016-07-14
JP4763210B2 (ja) 2011-08-31
CN100339482C (zh) 2007-09-26
CN1201011C (zh) 2005-05-11
CA2400570C (en) 2010-04-27
RU2299906C2 (ru) 2007-05-27
EP1261723B1 (en) 2008-02-27
US20140294885A1 (en) 2014-10-02
US7803387B2 (en) 2010-09-28
WO2001064920A2 (en) 2001-09-07
CY2013025I1 (el) 2015-11-04
EP1259627B1 (en) 2007-01-24
JP2003525049A (ja) 2003-08-26
CA2400562A1 (en) 2001-09-07
MXPA02008314A (es) 2002-12-09
ES2281409T3 (es) 2007-10-01
ES2360746T9 (es) 2012-02-13
CN1426473A (zh) 2003-06-25
EP1947187B9 (en) 2011-09-21
CY1113477T1 (el) 2016-06-22
CN1800385B (zh) 2010-06-02
HK1055993A1 (en) 2004-01-30
ATE387502T1 (de) 2008-03-15
ATE352631T1 (de) 2007-02-15
AU3948801A (en) 2001-09-12
CA2744921A1 (en) 2001-09-07
HK1064120A1 (en) 2005-01-21
JP2011101657A (ja) 2011-05-26
US20060051840A1 (en) 2006-03-09
CA2400562C (en) 2011-09-20
PT1947187E (pt) 2011-07-04
US20040092711A1 (en) 2004-05-13
US20170080077A1 (en) 2017-03-23
DK1947187T5 (da) 2011-10-24
CA2744921C (en) 2014-05-13
JP5346004B2 (ja) 2013-11-20
JP2014121333A (ja) 2014-07-03
JP2014000092A (ja) 2014-01-09
CN101139590B (zh) 2012-07-18
JP5941027B2 (ja) 2016-06-29
AU2001239488B2 (en) 2006-01-19
US20140363462A1 (en) 2014-12-11
US9150898B2 (en) 2015-10-06
JP2003525050A (ja) 2003-08-26
EP2270030B1 (en) 2012-05-23
EP1790660A3 (en) 2007-10-31
US20040110670A1 (en) 2004-06-10
US20100267931A1 (en) 2010-10-21
EP1947187B1 (en) 2011-03-30
US20130005667A1 (en) 2013-01-03
US8703914B2 (en) 2014-04-22
ES2360746T3 (es) 2011-06-08
DE60126249T2 (de) 2008-05-29
EP2270031A2 (en) 2011-01-05
DK1261723T3 (da) 2008-06-23
NL300605I2 (zh) 2016-09-22
ATE503837T1 (de) 2011-04-15
CA2875231A1 (en) 2001-09-07
WO2001064922A2 (en) 2001-09-07
WO2001064920A3 (en) 2002-03-14
CY1111591T1 (el) 2015-10-07
NZ521396A (en) 2004-06-25
CY1106532T1 (el) 2012-01-25
DE60144353D1 (de) 2011-05-12
CA2689666C (en) 2015-02-24
CY1107447T1 (el) 2012-12-19
DK2270030T3 (da) 2012-08-13
CN1800385A (zh) 2006-07-12
RU2304617C2 (ru) 2007-08-20
EP1790660A2 (en) 2007-05-30
NZ521531A (en) 2005-12-23
PT1261723E (pt) 2008-06-05
EP2270030A3 (en) 2011-02-02
HK1056197A1 (en) 2004-02-06

Similar Documents

Publication Publication Date Title
CN1201011C (zh) 奈瑟球菌蛋白质的异源表达
AU2001239488A1 (en) Heterologous expression of neisserial proteins
CN1338005A (zh) 奈瑟球菌基因组序列及其用途
CN101033467A (zh) 奈瑟球菌基因组序列及其用法
EP3423574A1 (en) Polymerase-template complexes for nanopore sequencing
CN1176663A (zh) 用特定序列组合体检测核酸的方法
CN105378109B (zh) 使用尿嘧啶-dna-n-糖基化酶使错误最小化
US9121053B2 (en) Method of detecting single nucleotide polymorphisms
CN1678741A (zh) 用于检测基因多态性的方法
CN1911959A (zh) 奈瑟球菌基因组序列及其用途
CN1311820A (zh) 得自粘膜炎莫拉氏菌的basb027蛋白和basb027基因、抗原、抗体及应用
CN1685062A (zh) 预测免疫抑制治疗期间胆固醇升高的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1071147

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1071147

Country of ref document: HK

CP01 Change in the name or title of a patent holder

Address after: Italy Siena

Patentee after: NOVARTIS VACCINES AND DIAGNOSTICS S.R.L.

Address before: Italy Siena

Patentee before: CHIRON S.R.L.

Address after: Italy Siena

Patentee after: CHIRON S.R.L.

Address before: Italy Siena

Patentee before: CHIRON S.P.A.

CP03 Change of name, title or address
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20170728

Address after: Belgium Sutter Rixon

Patentee after: GLAXOSMITHKLINE BIOLOGICALS S.A.

Address before: Italy Siena

Patentee before: NOVARTIS VACCINES AND DIAGNOSTICS S.R.L.

CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20090401

Termination date: 20180228

CF01 Termination of patent right due to non-payment of annual fee