CN100540564C - 一种冠状病毒基因工程蛋白质及应用 - Google Patents
一种冠状病毒基因工程蛋白质及应用 Download PDFInfo
- Publication number
- CN100540564C CN100540564C CNB2005101205300A CN200510120530A CN100540564C CN 100540564 C CN100540564 C CN 100540564C CN B2005101205300 A CNB2005101205300 A CN B2005101205300A CN 200510120530 A CN200510120530 A CN 200510120530A CN 100540564 C CN100540564 C CN 100540564C
- Authority
- CN
- China
- Prior art keywords
- leu
- thr
- ser
- val
- ala
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Peptides Or Proteins (AREA)
Abstract
本发明公开了一种冠状病毒基因工程蛋白质及应用。与冠状病毒SARS-CoV的S蛋白相关的基因工程蛋白质FSPA以及编码该FSPA的核苷酸序列和氨基酸序列。一种含SARS-CoV Spike基因的重组昆虫病毒株——重组苜蓿银纹夜蛾核型多角体病毒毒株AcNPV-FSPA,CCTCC NO.V200513,该重组病毒株插入了SARS-CoV Spike表达盒。基因工程蛋白质FSPA在检测严重的急性呼吸综合征的病原——冠状病毒SARS-CoV中的应用。
Description
技术领域
本发明涉及冠状病毒SARS-CoV相关的重组基因工程蛋白质FSPA,同时还涉及基因工程蛋白质FSPA在检测急性呼吸综合征(Severe acute respiratory syndrome,SARS,又称传染性非典型肺炎Atypical pneumonia,AP)的病原--SARS-CoV中的应用。
背景技术
严重急性呼吸综合征(Severe acute respiratorysyndrome,SARS),又称传染性非典型肺炎(Atypicalpneumonia,AP)。可以引起感染者出现发热、干咳和呼吸困难等症状,感染严重可导致患者死亡[Marra M A,Jones S J,Astell C Ret al.The genome sequence of the SARS-associatedcoronavirus[J].Science,2003;300:1399.][Lew T W,KwekT K,Tai D et al.Acute respiratory distress syndrome incriticallyill patients with severe acute respiratory syndrome[J].JAMA,2003;290:374.][Holmes KV.SARS2associatedcoronavirus[J].New Engl J Med,2003;348:1948.]。SARS首发病例于2002年11月出现在我国广东地区,并迅速向周边地区蔓延[Nie Q H,Luo X D,Zhang JZ,et al.Current status ofsevere acute respiratory syndrome in China.World JGastroenterol[J],2003,9(8):1635-1645.]。从2002年底到2003年,SARS已经播散到全世界33个国家和地区,造成8千多人感染,800多人死亡的严重后果[Cumulative Number ofReported Probable Cases of Severe Acute Respiratory Syndrome(SARS)2Worldwide[DB].11.July.2003.WHO.http://www.who.int/csr/sars/country/2003-07-11/en/]。其中疫情以中国大陆,中国香港为重。其传染性强,感染率高,严重威胁人类的健康,影响着社会发展和经济建设的正常进行。
严重急性呼吸综合征(SARS)是一种由冠状病毒引起的急性传染病。[Lew TW,Kwek TK,Tai D,et al.Acute respiratorydistress syndrome in criticallyill patients with severe acuterespiratory syndrome[J].J AMA,2003,290:374.]。4月,香港的研究人员宣布,一种未知的新型冠状病毒(SARS-CoV)可能是SARS的病因[Peiris J SM,Lai ST,Poon LLM,et al.Coronavirus as a possible cause of severe acute respiratorysyndrome[J].L ancet,2003,361(9366):1319-1325.],随后,加拿大[Marra MA,Jones SJM,Astell CR,et al.TheGenome Sequence of the SARS2Associated Coronavirus[J].Science,2003,300(5624):1399-1404.]、美国[Rota PA,Oberste MS,Monroe SS,et al.Characterization of a novelcoronavirus associated with severe acute respiratory syndrome[J].Science,2003,300(5624):1394-1399.]和中国[QinED,Zhu QY,Wang J,et al.Acomplete sequence and comparativeanalysis of a SARS-associated virus(Isolate BJ01)[J].ChinSci Bull,2003,48(10):941-948.]的科研人员相继公布了SARS-CoV的全基因组序列。
SARS-CoV属巢状病毒目(Order:Nidovirus),冠状病毒科(Family:Coronaviridae),冠状病毒属(Genus:Coronavirus)。根据其基因组结构分类,它属于单链正义RNA病毒,即(+)sense,ssRNA virus。在电镜下,病毒颗粒呈不规则形,直径约为60~220nm。颗粒中心负染在电镜下呈不定形态,核壳体呈疏松状态[Konrad Stadler,Vega Masignani,Markus Eickmann,et al.SARS-beginning to understand a new virus[J].Nature reviewsmicrobiology,2003,1(3):209-218.]。病毒体为六角形状。组成病毒体衣壳的结构蛋白总共有4~5种。包括S蛋白(Spikeprotein),M蛋白(Membrane protein),E蛋白(small membraneprotein),N蛋白(nucleoprotein),在某些冠状病毒中还有HE蛋白(hemagglutinin-esterase)(图1)。SARS-CoV中的S、E、M和N蛋白在病毒颗粒进入宿主细胞、形态发生及释放过程中起到重要作用。
SARS-CoV基因组有27~31kb、11个开放阅读框(openingreading f rames,ORF)组成[H.Garoff,R Hewson,D2J.E.Opstelten,et al.Virus maturation by budding[J].Micro MolBiol,Rev,1998,62(4):1171-1190.]:SARS-CoV RNA聚合酶的编码区占用了5′端21.2kb,约全基因组的三分之二[WeiRui,Qi peng Zhang,Lei Shi,et al.The preliminary analysisof SARS coronavirus proteins′sequences.May 1,2003.http://cmbi.bjmu.edu.cn/cmbidata/sars/sars-polymerase/sars-polymerase.html];后三分之一的区域,编码病毒结构蛋白,按基因组上的排列顺序依次为S蛋白、E蛋白、M蛋白、N蛋白;未发现HE蛋白编码序列[Paul A.Rota,M.Steven Oberste,Stephan S.Monroe,et al.Characterization of a novelcoronavirus associated with Severe Acute Respiratory Syndrome.http://www.sciencexpress.org,1 May 2003.][Marco A.Marra,Steven J.M.Jones,CarolineR.Astell,et al.Thegenome sequence of the SARS2associated coronavirus.http://www.sciencexpress.org,1May 2003.][QINE’de,ZHU Qingyu,WANG Jian,et al.A complete sequence and comparative analysisof a SARS-associated virus(Isolate BJ01)[J].ChineseScience Bulletin,2003,48(10):10941-10948.]。
通过SARS病毒与其它已知的冠状病毒基因组的序列比对,发现一个和其它冠状病毒的S蛋白同源的CDS,很可能就是SARS病毒的S蛋白的CDS。在对SARS病毒14个分离株的S蛋白的氨基酸序列比对后,结果显示,这些氨基酸序列较保守,变异不大根据对SARS病毒的基因组测序和以往关于冠状病毒的研究表明,SARS病毒的衣壳蛋白S极有可能是理想的靶抗原,在阻止病毒入侵、中和病毒方面起到关键性作用[Hawkey P M,Bhagani S,Gillespie S H.Severe acute respiratory syndrome(SARS):breath2takingprogress[J].J Med Microbiol,2003,52(Pt 8):609-613.]。
S蛋白即棘突蛋白,由SARS-CoV基因组21492225259 bp编码,共1255个氨基酸,是最大的结构蛋白,外观呈“棒棒糖”状。除N端1~13氨基酸为信号肽外,SARS-Cov由两个domain组成。靠近N端的部分形成一个球状的domain,靠近C端的部分形成一个穿膜的棒状结构[Lei Shi,Qipeng Zhang,Ming Lu,et al.Preliminaryanalyze the structure and function of the putative spikeprotein of SARS virus.http://cmbi.bjmu.edu.cn/cmbidata/SARS/sars-secstructure/spike.htm],冠状病毒S蛋白可以分为S1和S2两部分,其中S1组成了S蛋白的顶端球状结构,是参与冠状病毒识别细胞受体的主要部分[Taguchi F.The S2 subunitof the murine coronavirus spike protein is not involved inreceptor binding[J].JVirol,1995;69:7260.]。利用公布的SARS病毒的基因组序列和生物信息学分析[Marra M A,Jones S J,Astell C R et al.The genomesequence of theSARS2associated coronavirus[J].Science,2003;300:1399.],确定SARS病毒S基因编码的前668个氨基酸残基是SARS病毒S1蛋白。
棘突蛋白前体在宿主的细胞质中合成以后会被切成S1和S2两个部分[Holmes KV.SARS associated coronavirus[J].N EnglJ Med,2003,348(20):1948-1951.][Krueger DK,Kelly SM,Lewicki DN,et al.Variations in disparate regions of themurine coronavirus spike glycoglycoprotein impact theinitiation of membrane fusion[J].J Virol,2001,75(6):2792-2802.],其中S1形成成熟蛋白的球状部分[http://cmbi.bjmu.edu.cn/cmbidata/SARS/sars-secstructure/Detailpage/Prof828851.html],为受体结合亚基[Krueger DK,Kelly SM,LewickiDN,et al.Variations in disparate regions of the murinecoronavirus spike glycoglycoprotein impact the initiation ofmembrane fusion[J].J Virol,2001,75(6):2792-2802.]。
S蛋白是冠状病毒的一个结构蛋白,与冠状病毒侵入细胞的过程密切相关,是冠状病毒主要的抗原蛋白,能诱导细胞免疫和体液免疫[Bergmann C C,Yao Q,Lin M,et al.The JHM strain of mousehepatitis virus induces a spike protein2specificDb2restricted cytotoxic T cell response[J].J Gen Virol.1996,77(Pt 2):315-325.][Collins A R,Knobler R L,PowellH,et al.Monoclonal antibodies to murine hepatitis virus24(strain JHM)define the viral glycoprotein responsible forattachment and cell2cell fusion[J].Virology,1982,119(2):358-371.]。S蛋白上有重要的病毒抗原决定簇,基因突变会影响病毒的致病性[Marra MA,Jones SJM,Astell CR,et al.The Genome Sequence of the SARS2Associated Coronavirus[J].Science,2003,300(5624):1399-1404.]。
SARS病毒在与已知冠状病毒存在同源性的同时也具有很大的变异,特别是由病毒编码的蛋白中有5个可能的未知蛋白与目前已知的所有蛋白无一相似。这些特有的蛋白质既可能为病毒的诊断提供标志性途径,也可能在决定病毒毒力方面发挥重要作用,还可能为药物治疗和疫苗研究提供特异性的靶点,势必成为下一阶段实验研究的重点。对其快速、有效、灵敏的诊断技术的开发,针对该病毒的特异性抗体、疫苗、化学药物或生物制剂等防治工具的研制,都是目前迫在眉睫.亟待解决的问题。
SARS是一种对人类危害大,传播速度快且致死率较高的传染性疾病,目前尚无有效的预防和治疗药物。因此,对非典型性肺炎的早期诊断尤为重要。早发现非典型性肺炎病情不但可以进行早隔离,及时切断传染源,而且可以对非典型性肺炎病人早诊断、早治疗,从而降低死亡率。控制疫情的关键环节之一是对SARS冠状病毒的有效检测,目前检测SARS冠状病毒的方法主要包括病毒分离、核酸RT-PCR检测和SARS病毒抗体血清学检测等方法。[Drosten C,Gunther S,Preiser W,et al.Identification of a novelcoronavirus in patients with severe acute respiratory syndrome.N Engl J Med,2003,348(20):1967~1976]。病毒分离方法需要较长的时间才能获得结果,而且操作复杂,分离率较低。而RT-PCR检测方法虽然节省时间,只需几个小时,有较高的敏感性和特异性,但容易出现假阳性结果。以上两种检测方法都需要含有病毒的临床标本,这就大大增加了获得标本的难度和实验室感染的危险。
通过基于病毒抗原-抗体反应的免疫学方法,检测抗体,可以了解病毒感染以及疾病发生发展进程。ELISA IgG检测方法虽然不能达到早期诊断的目的(发病10天内),但它有较高的敏感性和特异性,而且临床标本采集容易,安全度高,可和其它方法联合作为实验室诊断SARS病人的主要方法之一,ELISA IgG法还可广泛用于开展人群血清流行病学研究。目前,国内外应用培养的SARS-CoV裂解液研制了ELISA试剂盒和间接免疫荧光试剂盒测定SARS-CoV特异性抗体,为SARS病原学诊断和SARS-CoV与机体相互作用规律的研究提供了可靠的手段。
发明内容
本发明的目的是在于提供一种重组基因工程蛋白质FSPA,其氨基酸序列与SEQ ID NO.1的氨基酸序列至少有70%的同源性,其分子量为约144千道尔顿。
本发明的目的是在于提供一种编码基因工程蛋白质FSPA的核苷酸序列,其核苷酸序列与SEQ ID NO.2的核苷酸序列至少有50%的同源性,可用于表达重组基因工程蛋白质FSPA。
本发明的目的是在于提供一种含冠状病毒SARS-CoV Spike基因的重组昆虫病毒毒株,其特征在于重组苜蓿银纹夜蛾核型多角体病毒毒株AcNPV-FSPA,该毒株于2005年11月30日保藏于中国典型培养物保藏中心,保藏编号CCTCC NO.V200513,该毒株插入了SARS-CoVSpike表达盒。利用该病毒毒株AcNPV-FSPA,可在昆虫细胞或昆虫中表达FSPA蛋白质。
本发明的目的是在于提供一种蛋白质FSPA在昆虫细胞中的表达,其特征在于利用重组苜蓿银纹夜蛾核型多角体病毒毒株AcNPV-FSPA毒株感染昆虫细胞,表达和纯化FSPA蛋白。
本发明还涉及基因工程蛋白质FSPA,在检测严重急性呼吸综合征(Severe acute respiratory syndrome,SARS,又称传染性非典型肺炎Atypical pneumonia,AP)的病原--SARS-CoV中的应用。
为了实现上述任务,本发明采用以下技术措施:
(1)拼接FSPA开放阅读框架:将分别含有SARS Spike基因的片断C、M和N的重组子用合适的限制性内切酶消化,回收相应的片断,按正确的阅读框(ORF)构建全长SARS-CoV Spike基因,构建好的全长Spike基因通过序列测定验证结果正确。
(2)构建一种含冠状病毒SARS-CoV Spike基因的重组昆虫病毒毒株:将拼接好的全长SARS CoV Spike基因开放阅读框架通过酶切、连接,按正确的阅读框插入转移载体中,构建重组质粒。将该重组质粒和野生型病毒线性化DNA转染昆虫细胞,获得一种含冠状病毒SARS-CoV Spike基因的重组昆虫病毒毒株。转化方法包括但不仅限于电转化法,脂质体转化法等。在本发明的一个实施例中提供了一种脂质体转化方法,使用的转移载体是pBlueBacHis2A,宿主细胞是昆虫细胞sf9。
(3)利用重组苜蓿银纹夜蛾核型多角体病毒毒株AcNPV-FSPA感染昆虫细胞sf9,在昆虫细胞中的表达FSPA蛋白质。
(4)收集重组苜蓿银纹夜蛾核型多角体病毒毒株AcNPV-FSPA感染的昆虫细胞sf9,采用Ni2+-NTA柱,纯化FSPA蛋白质。
以上分子生物学的操作方法为本领域技术人员所熟悉,可以参考Joe Sambrook,David Russell等编写的Molecular Cloning:ALaboratry Manual,Cold Spring Harbor Lab(CSHL)Press,2002。
本发明使用的表达系统是昆虫细胞-杆状病毒表达系统。与其它基因工程表达系统相比,如大肠杆菌、酵母、CHO等表达系统相比,该系统均有下列优有点,(1)表达量高;(2)基因组允许插入外源基因的容量较大;(3)杆状病毒有严格的宿主专一性,十分安全;(4)杆状病毒在昆虫细胞中既能表达原核基因也能表达真核基因,表达产物与天然蛋白质十分相似。
在本发明的一个实施方案中、利用基因工程蛋白质FSPA为核心成分检测急性呼吸综合征(Severe acute respiratorysyndrome,SARS,又称传染性非典型肺炎Atypical pneumonia,AP)病原——SARS-CoV,应用ELISA技术检测SARS-CoV抗体,可以对样品进行快速准确诊断。
本发明优选实施方案描述如下。
在本发明的一个实施方案中,申请人发现的令人惊奇的是,本发明所提供的一种基因工程蛋白质FSPA,其氨基酸序列与SEQ IDNO.1所示氨基酸序列至少有70%同源性的序列,其分子量为约144千道尔顿。
本发明提供一种编码基因工程蛋白质FSPA的核苷酸序列,其核苷酸序列与SEQ ID NO.2所示核苷酸序列至少50%同源性的序列。
在本发明的一个实施方案中,本发明所述的基因工程蛋白质FSPA具有的核苷酸序列已经被测序,如SEQ ID NO.2所示,其中1-120位核苷酸为载体的核苷酸序列,其它为SARS-CoV Spike基因的核苷酸序列。
在本发明的一个实施方案中,本发明所述的基因工程蛋白质FSPA具有的氨基酸序列如SEQ ID NO.1所示,其中1-40位氨基酸为载体的氨基酸序列,其它为SARS-CoV Spike基因对应的氨基酸序列。
本发明所述的基因工程蛋白质FSPA的氨基酸序列可以在一定范围内进行修饰、改变,所获得的修饰后的蛋白质或蛋白质的片段与基因工程蛋白质FSPA有相同的生物学功能。对蛋白质进行修饰和改变的方法为常规的方法,为本专业技术人员所熟悉。按照现代生命科学的理论,氨基酸序列同源性70%以上的蛋白质在生物学中常被诠释为是具有相同生物学功能的蛋白质。在此范围内对蛋白质氨基酸序列进行的修饰和突变均被认为并未改变蛋白质的生物学特性,这些改变和修饰包括:
A)对个别氨基酸进行突变,特别是非功能决定位点的氨基酸。这些氨基酸的变化往往是中性的,事实上,即使在自然条件下,这种改变都是广泛存在的。比如从不同地区分离的SARS毒株的序列都有差异。现在对SARS的功能位点和抗原决定簇位点还不清楚,但理论上讲,同性氨基酸(结构相似、等电点相近)的改变一般不影响蛋白质的功能。
B)缺失或插入个别氨基酸,特别是非功能决定位点的氨基酸。这样的改变如果没有改变蛋白的空间构象,就不会影响蛋白质的生物学功能,也不会改变蛋白质的免疫原性。
C)插入特殊的氨基酸残基。为了增加或改变蛋白质的可溶性,增加稳定性,在基因工程生产过程中,往往会在蛋白质的N、C端加入一些特殊的氨基酸功能位点以利于蛋白质的表达和纯化。比如可以在N端或C端加入6个连续的组氨酸以便于用Ni亲和层析进行蛋白质的纯化;或者在N端加入肠激酶位点,这样的蛋白质经过肠激酶的切割即可获得与天然蛋白质完全一样的基因工程蛋白;或者加入血球凝集素因子Xa,可以特异性识别并切断4肽序列Ile-Glu-Gly-Arg。
以上对蛋白质进行修饰和改变的方法为常规的方法,为本专业技术人员所熟悉。通过上述方法获得的与本发明所述的基因工程蛋白质有70%同源性的蛋白质或免疫性片段都具有与本发明所述基因工程蛋白FSPA相同的生物学功能,即基因工程蛋白FSPA具有抗原性,都能够用于实现本发明的一个或多个目的。
根据蛋白质的氨基酸组成,结合SDS-PAGE的分析结果,本发明所涉及的基因工程蛋白FSPA的分子量为约144千道尔顿。如果蛋白质的氨基酸序列发生部分或局部的改变,蛋白质的分子量会发生变化。选用不同的表达系统,由于翻译后修饰的原因,蛋白质的分子量也会发生变化。选用不同的检测方法,蛋白质的分子量也会有一些差异,但这些变化和差异在原则上不会超过蛋白质分子量的10%。
本申请人还对SARS-CoV S基因三个片断N、M、C进行了拼接,得到全长SARS-CoV S基因。
在本发明的一个实施例中提供了一种融合蛋白FSPA的制备方式,融合蛋白FSPA的所含SARS Spike基因的氨基酸序列见SEQ IDNO.1。
在本发明的一个实施方案中,提供了一种基因工程蛋白质FSPA,该蛋白为基因工程融合蛋白,其N端的氨基酸是载体编码的,N端是MPRGSHHHHHHGMASMTGGQQMGRDLYDDDDKDRWGSELE。
本发明选用昆虫杆状病毒系统表达、制备基因工程蛋白质FSPA。昆虫表达系统(BEVS)是一类应用广泛的真核表达系统,它具有与大多数高等真核生物相似的翻译后修饰、加工及转运外源蛋白的能力。现已成功表达了近千种高价值蛋白。目前常用于表达载体构建的杆状病毒为苜蓿银纹夜蛾核型多角体病毒(Autographa californicanucleopolyhedrovirus,AcNPV),家蚕核型多角体病毒(Bmbyxmorinucleopolyhedrovirus,BmNPV),及粉纹夜蛾核型多角体病毒(Trichoplusiani nucleopolyhedrovirus,TnNPV)。以杆状病毒为载体的昆虫表达系统具有明显的优点[Liu D l,Sun x J,QiY P,et al.Cloning and exp ression of the V P39 gene of Bombyxmori nuclear polyhedro sis virus in E.coli[J].Wuhan Univ J of Natural Sciences,1998,3(1):108~112.Hu Z H,A rif B M,J in F,et al.Distinct gene ar rangement in theBuzura supp ressaria single nucleocapsid nucleo po lyhedrovirus genome[J].J Gen Virol,1998,79:2841~2851.]:
本发明提供一种编码基因工程蛋白质FSPA的核苷酸序列,一种分离的蛋白质,其具有与SEQ ID NO.2所示核苷酸序列至少80%同源性的序列。
基因工程蛋白质氨基酸序列的任何改变归根结底都是其核苷酸序列的改变。生物由各种各样的蛋白质组成,而组成蛋白质的氨基酸只有22种左右,编码蛋白质的核苷酸序列却是由4中单核苷酸(A、T、G、C)按照不同的顺序排列组合构成的。
因此,从理论上讲,任何核苷酸序列的改变都有可能改变其编码的氨基酸,进而改变其编码蛋白质的结构和功能。但生物的氨基酸密码子存在兼并性,即不同的密码子可以编码相同的氨基酸,比如,GCA、GCC、GCG、GCT都编码Ala(丙氨酸)。这种兼并性的生物学意义在于,在DNA的复制过程中,遗传物质可以因为内部的或者外部的条件或因素发生改变,这些改变如果立即造成氨基酸的变化,就会直接影响蛋白质特别是功能蛋白质的结构和功能。大部分核苷酸序列的变化是不利于生物体的突变,而密码子的兼并性就大大减少了核苷酸的突变对蛋白质功能的影响。此外,密码子的兼并性也是氨基酸的变异率远远低于核苷酸变异率的原因。因此,本发明所述的基因工程蛋白质FSPA的核苷酸序列可以进行突变,但其编码的蛋白质或片段与基因工程蛋白质FSPA有相同的生物学功能,即蛋白质抗原性未发生变化,都能够产生相似的抗原反应。这些突变包括:
A)同义突变:个别核苷酸的突变,但是其编码的氨基酸未发生改变,因此其编码的蛋白质的所有生物学特征与原来相同。
B)错义突变:个别核苷酸的改变,其编码的氨基酸也发生改变,但这些氨基酸的改变往往是非功能决定位点的氨基酸,这些氨基酸的变化往往是中性的。事实上,即使在自然条件下,这种改变都是广泛存在的,比如从不同地区分离的SARS-CoV毒株的序列都有差异。现在对SARS-CoV的功能位点和抗原决定簇位点还不清楚,但理论上讲,结构相似的氨基酸之间的替换一般不影响蛋白质的功能。
C)移码突变:个别核苷酸的增加或缺失,进而导致缺失或插入个别氨基酸,这样的改变如果没有改变蛋白的空间构象,就不会改变蛋白质的生物学功能。事实上,在基因工程蛋白的研究过程中,为了增加或改变蛋白质的可溶性,增加稳定性,往往会在蛋白质的N、C端加入一些氨基酸残基,或者在N、C端加入一些功能位点以利于蛋白质表达和纯化。比如加入6个连续的组氨酸以便于用Ni亲和层析进行蛋白质的纯化,或者加入肠激酶位点,这样的蛋白质经过肠激酶的切割即可获得与天然蛋白质完全一样的基因工程蛋白。或者加入血球凝集素因子Xa,可以特异性识别并切断4肽序列Ile-Glu-Gly-Arg。
以上对核苷酸进行修饰和改变的方法为常规的方法,比如可以通过PCR的方法实现,这些方法为本专业技术人员所熟悉,不需进行创造性劳动即可获得。通过该方法获得的与本发明所述的核苷酸序列有50%同源性的核苷酸序列都具有与本发明所述核苷酸序列相同的生物学功能,即都能编码SARS-CoV S蛋白,都能够用于实现本发明的一个或多个目的。
在本发明的一个实施方案中,提供了一种编码基因工程蛋白质FSPA的核苷酸序列,一种分离的蛋白质,其具有与SEQ ID NO.2所示核苷酸序列至少70%同源性的序列。
在本发明的另一个实施方案中,提供了一种编码基因工程蛋白质FSPA的核苷酸序列,一种分离的蛋白质,其具有与SEQ ID NO.2所示核苷酸序列优选地至少80%同源性的序列。
本发明所述的编码基因工程蛋白质FSPA的核苷酸序列可以在一定范围内进行改变,所获得的核苷酸序列与编码基因工程蛋白质FSPA的核苷酸序列具有相同的生物学功能,特别是编码蛋白质的抗原性未发生变化。
按照现代生物学的概念,尤其是生物信息学的理论,同源性在70%以上的核苷酸序列可以判定为具有显著的相似性,同源性在80%以上的核苷酸序列可以判定为具有相同的生物学功能。
以上对核苷酸进行修饰和改变的方法为常规的方法,比如可以通过PCR的方法实现,这些方法为本专业技术人员所熟悉,不需进行创造性劳动即可获得。获得的与本发明所述的核苷酸序列有70%同源性、优选有80%同源性的核苷酸序列都具有与本发明所述核苷酸序列有相同的生物学功能,即都能编码SARS-CoV S融合蛋白,具有抗原性,能够用于实现本发明的一个或多个目的。
在本发明的一个实施方案中,提供了一种编码基因工程蛋白质FSPA的核苷酸序列,该序列的上游包括载体的序列:atgccgcggggttctcatcatcatcatcatcatggtatggctagcatgactggtggacagcaaatgggtcgggatctgtacgacgatgacgataaggatcgatggggatccgagctcgag
在本发明的一个实施方案中,提供了一种DNA片段及其制备方法。该片段包含本发明所述的编码基因工程蛋白质FSPA的核苷酸序列。
发明所涉及的DNA片断可以通过以下方式获得:
人工合成,可直接用DNA合成仪人工合成本发明所述的DNA片段,或者分段合成本发明所述的DNA片段,这些合成产物具有与本发明所述的DNA片段相同的生物学功能,可以实现本发明所述的一个或多个目的。
PCR扩增,以本发明所述的DNA片段为模板,或者以含有本发明所述的DNA片段的质粒、载体、宿主细胞为模板,通过PCR扩增得到DNA片段,这些PCR产物具有与本发明所述的DNA片段相同的生物学功能,可以实现本发明所述的一个或多个目的。
以上方法为分子生物学中常用的方法,为本领域技术人员所熟悉,不需通过创造性劳动即可获得,所获得的DNA片段被视为与本发明所涉及的核苷酸序列有相同的生物学功能,能够进一步通过基因工程的方法实现本发明的一个或多个发明目的。
本发明所涉及的DNA片段可以通过化学的或生物的方法转入宿主细胞中,如转化、转导、转座、基因枪注射等,这些宿主细胞包括但不仅限于大肠杆菌、酵母、昆虫细胞、哺乳动物细胞,其基因定位可以在染色体上,也可以单独或依附与其他遗传物质存在于染色体之外。这些宿主细胞一方面利于基因的保藏和扩增,另一方面可以直接或间接的实现本发明所涉及的一个或多个发明目的。
宿主细胞的制备方法为分子生物学中常用的方法,为本领域技术人员所熟悉,不需通过创造性劳动即可获得,所获得的宿主细胞能够进一步通过基因工程的方法实现本发明的所有发明目的。
在本发明的一个实施方案中,提供了一种含冠状病毒SARS-CoVSpike基因的重组昆虫病毒毒株,命名为重组苜蓿银纹夜蛾核型多角体病毒毒株AcNPV-FSPA,该毒株插入了SARS-CoV Spike表达盒,在中国典型培养物保藏中心的编号为CCTCC V200513。
在本发明的一个实施方案中,提供了一种重组苜蓿银纹夜蛾核型多角体病毒AcNPV-FSPA的构建方法,该宿主细胞包含本发明所述的基因工程蛋白FSPA的核苷酸序列。
本发明与现有技术相比,具有以下优点和效果:
(1)由于强启动子,昆虫杆状病毒表达系统具有很高的表达效率。在重组核型多角体病毒感染细胞中,外源基因表达水平可达1mg/m L(含2×106培养细胞),这种高效表达能力往往使其它系统相形见绌。
(2)昆虫杆状病毒的基因组允许插入外源基因的容量较大,并可以容纳一个或多个外源基因,可同时表达两种以上外源性蛋白,不影响病毒的复制与装配。
(3)昆虫杆状病毒有严格的宿主专一性,对脊椎动物和植物均无致病性,也不能在非宿主细胞中繁殖或发生整合,因此,十分安全。
(4)与细菌、酵母表达系统相比较,昆虫杆状病毒在昆虫细胞中既能表达原核基因也能表达真核基因。昆虫杆状病毒表达系统对表达的真核基因产物能更好地进行糖基化、磷酸化、脂肪酶化、酰胺化、切割信号肽以及形成三级或四级结构等。其表达产物的抗原性,酶活力等生物活性与天然蛋白质十分相似。
附图说明
本发明的上述和其它目的,特点和优势可显而易见地从下面对本发明优选实施例的详细描述和附图示出的内容得到,不同视图中相同的参考符号代表相同的部分。附图并不一定是按比例示出,其重点在于说明本发明的实施和效果。
图1全长SARS-CoV Spike基因的结构图。
图2全长SARS-CoV Spike基因的构建过程图。
图3重组质粒pUCm-T-S的酶切验证图。
图4含全长SARS-CoV S基因重组昆虫杆状病毒的构建图。
具体实施方式
实施例1全长SARS-CoV Spike基因的制备
全长SARS-CoV Spike基因的结构见图1。
1.含有SARS-CoV Spike基因N片断的重组质粒pUCm-T-S(n)的构建
从冰箱取出用甘油保藏的含有质粒pSn(含有编码Spike蛋白的基因序列1-1469bp)的E.coli菌株,在含有卡那霉素(100μg/mL)的LB平板上划线,37℃培养过夜。用无菌的牙签挑取单菌落,接种到3mL含有卡那霉素(100μg/mL)的LB液体培养基中,37℃,220rpm培养过夜,用碱裂解法提取质粒pSn。用Xba I和Kpn I双酶切pSn,回收1521bp长的片断,然后与经过相同双酶切的质粒pUCm-T(上海生工)连接,连接产物转化大肠杆菌JM109,得到含有重组质粒pUCm-T-S(n)的阳性克隆,限制性内切酶分析验证。
2.含有SARS CoV Spike基因N+M片断的重组质粒pUCm-T-S(N+M)的构建
从冰箱取出用甘油保藏的含有质粒pSm(含有编码Spike蛋白的基因序列1248-2920)的E.coli菌株,在含有氨苄青霉素(100μg/mL)的LB平板上划线,37℃培养过夜。用无菌的牙签挑取单菌落,接种到3mL含有氨苄青霉素(100μg/mL)的LB液体培养基中,37℃,220rpm培养过夜,用碱裂解法提取质粒pSm。用Bal I和Kpn I双酶切含有Spike基因m片断的质粒pSm,回收1450bp长的片断,然后与经过相同双酶切的质粒pUCm-T-S(n)连接,连接产物转化大肠杆菌JM109,得到含有重组质粒pUCm-T-S(n+m)的阳性克隆,限制性内切酶分析验证。
3.含有Spike全长基因的重组质粒pUCm-T-S的构建
从冰箱取出用甘油保藏的含有质粒pSc(含有编码Spike蛋白的基因序列2650-3768)的E.coli菌株,在含有卡那霉素(100μg/mL)的LB平板上划线,37℃培养过夜。用无菌的牙签挑取单菌落,接种到3mL含有卡那霉素(100μg/mL)的LB液体培养基中,37℃,220rpm培养过,用碱裂解法提取质粒pSc。用EcoR V和Kpn I双酶切含有Spike基因c片断的质粒pSc,回收900bp长的小片断,然后与经过相同双酶切的质粒pUCm-T-S(M+M)连接,连接产物转化大肠杆菌JM109,得到含有重组质粒pUCm-T-S的阳性克隆,限制性内切酶分析验证(图3)。
全长SARS-CoV Spike基因的制备过程如图2所示。
实施例2含全长SARS-CoV Spike基因重组杆状病毒转移载体的构建
扩增引物合成:上游引物:TTCTCgAgATgTTTATTTTCTTATTATTTCTTACTCTCACTAg(下化线为Xho I酶切位点),下游引物gCgAATTCTTATgTgTAATgTAATTTgACACCCTTg(下化线为EcoRI酶切位点)。以pUCm-T-S为模版,采用常规的PCR方法扩增目的基因SARS-CoV S,PCR产物通过凝胶电泳检测其大小是否与预期相符。回收PCR产物并将其克隆入pUCm-T载体中,并转化大肠杆菌E.coli JM109,挑取菌落快速提取质粒进行酶切鉴定,所得到的阳性克隆子命名为pUCm-TFS。
提取重组质粒pUCm-TFS DNA双脱氧法测定核苷酸序列,测序引物为M13和T7启动子引物,序列测定结果正确。
EcoR I和Xho I分别双酶切pUCm-TFS和杆状病毒转移载体pBlueBacHis2A充分酶切后,0.7%琼脂糖凝胶电泳检测,割胶回收目的条带,用胶回收试剂盒回收目的DNA。。
连接体系:T4 DNA连接酶缓冲液5μl,pUCm-TFS片段DNA 25μl,pBlueBacHis2A DNA 5μl,T4DNA连接酶4μl,无菌双蒸水11μl),16℃连接15hr。
连接产物转化大肠杆菌E.coliJM109感受态细胞,EcoR I和XhoI双酶切筛选鉴定出重组子(记作E.coli(pFS))重组子。
实施例3含全长SARS-CoV Spike基因的重组昆虫杆状病毒的构建
1.昆虫细胞培养物的制备
将4mL含10%胎牛血清的完全昆虫细胞培养基加入一个25cm2培养瓶。取出一支冻存sf9细胞的安瓿,迅速置于37℃水浴。打碎安瓿颈部,将内容物转移至25cm2培养瓶。用手轻轻摇动培养瓶,使细胞分散均匀,于27℃温育2-3h直到细胞贴壁。除去旧培养液,换5mL含10%胎牛血清的新鲜完全培养液。继续温育,每3天换液一次(除去旧培养液,以新鲜的代替),直到细胞生长汇片。准备一个新的25cm2培养瓶,加入4mL含10%胎牛血清的完全培养液。当sf9细胞已生长汇片时,弃去培养瓶中的培养液。加入新鲜的完全培养液,用移液管轻柔吹打或用手掌轻拍培养瓶,重悬细胞。用血细胞计数器计数细胞。在25cm2培养瓶中接种1×106~2×106个细胞,摇动培养瓶使细胞均匀分布。于27℃温育,每3天用含10%FBS的完全培养基换液,直到培养瓶中的细胞生长汇片(形成拥挤的单层培养物)。弃去汇片的单层培养细胞中的培养液,并重悬细胞。用血细胞计数器计数细胞。以约4×105~5×105细胞/mL的密度将细胞接种于一个旋转培养瓶中。于27℃温育,以60~80r/min的速度恒速搅拌。每隔2~3天进行细胞计数。当细胞密度达到2×106~2.5×106细胞/mL时进行传代,将适量细胞移至一个含有新鲜完全培养液(含10%胎牛血清)的新培养瓶中,使终密度达到4×105~5×105细胞/mL。加入0.1mL的0.4%台盼蓝于1mL对数生长的细胞中,确定细胞活力。在低倍显微镜下检查细胞,计数被台盼蓝染色的细胞(死细胞),并计算总细胞数。将细胞传代至1份完全培养液/10%胎牛血清和1份无血清培养液(sf-900 II或ExCel1401)混合的液体中。让细胞长至汇片(单层培养),或达到2×106-3×106细胞/mL的密度(悬浮培养)。将细胞传代至含胎牛血清完全培养液与无血清培养液比例为1∶4的混合液中,让细胞生长。用无血清培养液传代细胞。计数呈指数生长的待冻存细胞。于室温以1000g离心10min,弃去上清液。用含10%胎牛血清的完全培养液以1×107~2×107细胞/mL的密度重悬细胞团块。加入等体积含10%胎牛血清和20%DMSO的完全培养液,将细胞置于冰浴。吸出1mL细胞移入带螺口盖的冻存管中,于-20℃保存2h,然后于-70℃过夜。如果细胞已适应了无血清培养液就用无血清培养液(含和不含DMSO)来传代和冻存。将冻结的细胞移至液氮罐中以便长期保存。
2.杆状病毒毒种贮液的制备
从单层培养中制备。以每瓶1.8×107sf9细胞的密度,将细胞接种于两个150cm2培养瓶,在含10%胎牛血清的完全培养液中培养于27℃让细胞贴壁3h,然后移去完全培养液。以感染复数(MOI)为0.1的病毒量,加入5mL含野生型或重组病毒的无血清完全培养液。于27℃温育1h。感染给定数目细胞的病毒接种物的体积=MOI(pfu/细胞)×[细胞数/毒种贮液的滴度(pfu/mL)]。去掉病毒接种物,代之以20mL含10%胎牛血清的完全培养液。于27℃温育1h。每天在光学显微镜下检查细胞有无包涵体出现(指示野生型病毒)或细胞病变效应(指示重组病毒感染)。当大多数细胞含有包涵体或显示出细胞病变效应时(通常在感染后4至5天),收获病毒。将感染的培养物移入灭菌试管中,于4℃以1000g离心10min,将上清移至一新的灭菌试管。分别吸取1mL的小份上清移至几个螺口冻存管中,置液氮罐长期保存。将剩余的病毒毒种保存于4℃暗处。得到约40mL 108-109pfu/mL的病毒毒种贮液。
如果待扩增的病毒源自单个蚀斑,则用1mL无血清完全培养液重悬琼脂糖块。再按步骤1感染sf9细胞,所用细胞为25cm2培养瓶中的2×106细胞,于27℃温育1h。加入3mL含10%胎牛血清的完全培养液,于27℃温育4天。按步骤1收获病毒。确定滴度,重复步骤,扩增病毒以获得大量的毒种贮液。
3.病毒贮液的滴度的测定
用蚀斑试验测定病毒贮液的滴度。用含10%胎牛血清的完全培养液稀释处于指数生长期的sf9细胞至约5×106细胞/mL。在蚀斑试验之前几小时,以两个不同的密度(2×106和1.5×106细胞/mL)将细胞种于60mm组织培养皿中。病毒毒种贮液的每一稀释度均设复孔。于27℃培养。用无血清完全培养液制成5mL的病毒贮液的系列稀释液。吸去培养液。每一稀释度的病毒均加1mL至各复孔中,于室温或27℃温育1h,间断摇动以保证病毒和覆盖在细胞上的培养液均匀分布。温育30min后。吸去病毒上清液,加入4mL琼脂糖覆盖物。于27℃培养4-8天。蚀斑持续形成至2周。在蚀斑形成较好而且裸眼容易看出的培养皿上,计数系列中的每一稀释度形成的蚀斑数。计算病毒滴度(pfu/mL)。
4.重组杆状病毒的产生
用Bac-N-BlueTM DNA(Invitrogen公司产品)和重组质粒pFSDNA共转染sf9细胞,产生重组杆状病毒。转染程序按Invitrogen公司转染试剂盒说明书进行。X-gal作为指示剂,进行三轮蚀斑纯化后,获得了重组杆状病毒。
接种2×106个sf9细胞于60mm培养皿,在含10%胎牛血清的完全培养液或无血清培养液中培养,于27℃培养30~60min,让细胞贴壁。相应于每一待转染的培养皿,吸取40μL无菌水,加入一支无菌聚苯乙烯管中,加入5μL线性化的Bac-N-BlueTM DNA和5μL 100ng/μL的质粒pFS DNA。往DNA溶液中加入50μ LLipofectin。轻柔混匀,于室温温育15min。往培养皿中加入Lipofectin-DNA复合物,同时轻柔旋转平皿加以混匀。于27℃温育4-5h。往每个培养皿中加入1.5mL含10%胎牛血清的完全培养液在27℃加湿培养箱中温育60~72h。从每个培养皿中将转染上清转移至无菌的离心管中。4℃ 1000g离心10min。将病毒上清转移至新的灭菌试管,4℃避光保存备用。
5.重组杆状病毒的纯化
制备病毒上清的系列稀释液,该病毒上清获得自在无血清完全培养液中转染pFS DNA的细胞。在含150μg/mL X-gal的琼脂糖顶层覆盖物下病毒形成蚀斑。当蚀斑形成后,挑取一个分离较好的蓝色蚀斑,并将琼脂糖块移入含有1mL无血清完全培养液的无菌试管中。在旋涡混合器上剧烈震荡,并用无血清完全培养液制备10-1,10-2,和10-3的系列稀释液。用含150μg/mL X-gal的琼脂糖顶层覆盖物蚀斑测定病毒。重复蚀斑试验,直到获得纯的重组病毒贮液。用无菌吸管挑取一个纯的重组蚀斑,将琼脂糖块移入一含2.5×106Sf9细胞和5mL完全培养液(含10%胎牛血清)的25cm2培养瓶中。于27℃温育4~5天直到大多数细胞被感染。确定病毒滴度(应在5×107~1×108pfu/mL之间)。加入1mL该毒种贮液于一支1.5mL螺口冻存管中,于一80℃保存。含全长SARS-CoV S基因重组昆虫杆状病毒命名为Ac NPV-FSPA。
含全长SARS-CoV S基因重组昆虫杆状病毒的构建过程如图4所示。
6.含全长SARS-CoV S基因重组昆虫杆状病毒AcNPV-FSPA的PCR鉴定
以提取的病毒DNA为模板,用P1、P2引物扩增得到了1条约3.7kb的片段,进一步证明获得了插入全长SARS-CoV Spike基因的重组杆状病毒。
7.重组病毒的SARS-CoV蛋白质FSPA分析
接种2.5×106sf9细胞于含5mL完全培养液/10%胎牛血清的25cm2培养瓶中。27℃温育≥2h。从含无血清完全培养液和重组蚀斑的1mL病毒贮液中取0.5mL,分别加入各个培养瓶。4℃保存剩余的0.5mL重组病毒,待以后用于蚀斑试验。培养瓶置27℃温育4~5天,每天检查感染迹象。4-5天后,将培养液转移至15mL离心管中,收获病毒。于4℃,1000g离心10min。将含有扩增病毒的上清转移至一支无菌15mL聚丙烯离心管中。接种2.5×106sf9细胞于含5mL完全培养液/10%胎牛血清的25cm2培养瓶中。为每一待测病毒贮液准备一个培养瓶,另准备一个作为非感染对照。27℃温育≥2h,使细胞贴壁。弃去细胞培养液并向培养瓶中加入1.5mL扩增的病毒贮液,27℃温育2天。从培养瓶中轻轻移去细胞以收获之,并将细胞和培养液转移至15mL聚丙烯离心管中。于4℃,1000g离心10min。弃上清,用PBS轻轻将细胞团块重悬洗涤,重复离心并弃上清。直接加入500μL 1×SDS样品缓冲液,在沸水浴中煮沸3min。
银染色:在单向SDS-聚丙烯酰胺凝胶上,每一泳道加入20~40μL细胞总蛋白。鉴定出哪一个假定的重组蚀斑是产生所需蛋白的重组子。将其进行蚀斑纯化,以使其免受任何野生型病毒污染。制备大量病毒毒种贮液,并测定重组病毒的滴度。
实施例4重组蛋白质FSPA的生产和纯化
在悬浮培养液中培养sf9细胞,并使之适应无血清培养液。准备旋转培养瓶,用于按比例扩增sf9细胞。将适应了无血清培养液的s f9细胞接种于经高压灭菌的培养瓶中。将培养瓶装至半满至全满之间(例如,在3L瓶中装L 5~3L),加入足够的无血清培养液以使细胞终密度达到5×105-6×105细胞/mL至1.5×106细胞/mL。将培养瓶放在27℃培养箱中的磁力搅拌器上。将搅拌速度设置在80r/min。细胞生长至密度约1.5×106细胞/mL。在层流室中将感染复数(MOI)为1~2的病毒直接加到培养瓶中。于27℃将培养瓶置于磁力振荡器上并通气,培养96h。
收集重组病毒感染的昆虫细胞sf9,用裂解缓冲液(50mmol/LTris2HCl,5mmol/L-2巯基乙醇,100mmol/L KCl,1mmol/LPMSF,1%NP-40,pH 8.5)悬浮后,超声波裂解细胞,10000g,4C离心10min,取上清直接上预先平衡的Ni2+-NTA柱,先以10倍柱体积的结合缓冲液洗脱,再以6倍柱体积的洗涤缓冲液洗脱杂蛋白,最后以6倍柱体积的洗脱缓冲液洗脱目的蛋白。纯化的FSPA蛋白经SDS-PAGE分析发现有144kDa一条带。Ni柱纯化后的FSPA蛋白经反复透析、浓缩,然后采用Bradford法测定蛋白质浓度,冷冻干燥,-20℃保存。取少量样品SDS-PAGE电泳检测,在分子量为144kDa处有一明显表达条带,纯化的FSPA蛋白纯度达85%以上,分子量为114kDa。
实施例5利用基因工程蛋白质FSPA检测人血清中SARS-CoV抗体
用PBSN配制抗原溶液,用一个多道移液器往Immulon微量滴定板的每孔中加入50μL的重组基因工程蛋白质FSPA抗原溶液。
标本:来自医院临床诊断为SARS的患者恢复期血清10份,献血员血清10份。
方法:与吉比爱公司SARS抗体检测试剂比较,严格按照试剂盒说明书操作。采用酶标仪检测,使用492nm滤光器。
结果:采用2种试剂检测SARS的患者恢复期血清10份和献血员血清10份,检测结果见表1。
表1:3种试剂盒检测SARS的患者恢复期血清和献血员血清结果比较
结论:以吉比爱公司SARS抗体检测试剂为对照,采用ELISA(间接法)。结果表明,用FSPA蛋白质检测SARS-CoV抗体,具有高的敏感性和特异性,敏感性为100%,特异性为100%。
SEQUENCE LISTING
<110>武汉大学
<120>一种冠状病毒基因工程蛋白质及应用
<130>一种冠状病毒基因工程蛋白质及应用
<160>2
<170>PatentIn version 3.1
<210>1
<211>3888
<212>DNA
<213>SARS coronavirus
<220>
<221>CDS
<222>(1)..(3888)
<223>
<400>1
atg ccg cgg ggt tct cat cat cat cat cat cat ggt atg gct agc atg 48
Met Pro Arg Gly Ser His His His His His His Gly Met Ala Ser Met
1 5 10 15
act ggt gga cag caa atg ggt cgg gat ctg tac gac gat gac gat aag 96
Thr Gly Gly Gln Gln Met Gly Arg Asp Leu Tyr Asp Asp Asp Asp Lys
20 25 30
gat cga tgg gga tcc gag ctc gag atg ttt att ttc tta tta ttt ctt 144
Asp Arg Trp Gly Ser Glu Leu Glu Met Phe Ile Phe Leu Leu Phe Leu
35 40 45
act ctc act agt ggt agt gac ctt gac cgg tgc acc act ttt gat gat 192
Thr Leu Thr Ser Gly Ser Asp Leu Asp Arg Cys Thr Thr Phe Asp Asp
50 55 60
gtt caa gct cct aat tac act caa cat act tca tct atg agg ggg gtt 240
Val Gln Ala Pro Asn Tyr Thr Gln His Thr Ser Ser Met Arg Gly Val
65 70 75 80
tac tat cct gat gaa att ttt aga tca gac act ctt tat tta act cag 288
Tyr Tyr Pro Asp Glu Ile Phe Arg Ser Asp Thr Leu Tyr Leu Thr Gln
85 90 95
gat tta ttt ctt cca ttt tat tct aat gtt aca ggg ttt cat act att 336
Asp Leu Phe Leu Pro Phe Tyr Ser Asn Val Thr Gly Phe His Thr Ile
100 105 110
aat cat acg ttt ggc aac cct gtc ata cct ttt aag gat ggt att tat 384
Asn His Thr Phe Gly Asn Pro Val Ile Pro Phe Lys Asp Gly Ile Tyr
115 120 125
ttt gct gcc aca gag aaa tca aat gtt gtc cgt ggt tgg gtt ttt ggt 432
Phe Ala Ala Thr Glu Lys Ser Asn Val Val Arg Gly Trp Val Phe Gly
130 135 140
tct acc atg aac aac aag tca cag tcg gtg att att att aac aat tct 480
Ser Thr Met Asn Asn Lys Ser Gln Ser Val Ile Ile Ile Asn Asn Ser
145 150 155 160
act aat gtt gtt ata cga gca tgt aac ttt gaa ttg tgt gac aac cct 528
Thr Asn Val Val Ile Arg Ala Cys Asn Phe Glu Leu Cys Asp Asn Pro
165 170 175
ttc ttt gct gtt tct aaa ccc atg ggt aca cag aca cat act atg ata 576
Phe Phe Ala Val Ser Lys Pro Met Gly Thr Gln Thr His Thr Met Ile
180 185 190
ttc gat aat gca ttt aat tgc act ttc gag tac ata tct gat gcc ttt 624
Phe Asp Asn Ala Phe Asn Cys Thr Phe Glu Tyr Ile Ser Asp Ala Phe
195 200 205
tcg ctt gat gtt tca gaa aag tca ggt aat ttt aaa cac tta cga gag 672
Ser Leu Asp Val Ser Glu Lys Ser Gly Asn Phe Lys His Leu Arg Glu
210 215 220
ttt gtg ttt aaa aat aaa gat ggg ttt ctc tat gtt tat aag ggc tat 720
Phe Val Phe Lys Asn Lys Asp Gly Phe Leu Tyr Val Tyr Lys Gly Tyr
225 230 235 240
caa cct ata gat gta gtt cgt gat cta cct tct ggt ttt aac act ttg 768
Gln Pro Ile Asp Val Val Arg Asp Leu Pro Ser Gly Phe Asn Thr Leu
245 250 255
aaa cct att ttt aag ttg cct ctt ggt att aac att aca aat ttt aga 816
Lys Pro Ile Phe Lys Leu Pro Leu Gly Ile Asn Ile Thr Asn Phe Arg
260 265 270
gcc att ctt aca gcc ttt tca cct gct caa gac att tgg ggc acg tca 864
Ala Ile Leu Thr Ala Phe Ser Pro Ala Gln Asp Ile Trp Gly Thr Ser
275 280 285
gct gca gcc tat ttt gtt ggc tat tta aag cca act aca ttt atg ctc 912
Ala Ala Ala Tyr Phe Val Gly Tyr Leu Lys Pro Thr Thr Phe Met Leu
290 295 300
aag tat gat gaa aat ggt aca atc aca gat gct gtt gat tgt tct caa 960
Lys Tyr Asp Glu Asn Gly Thr Ile Thr Asp Ala Val Asp Cys Ser Gln
305 310 315 320
aat cca ctt gct gaa ctc aaa tgc tct gtt aag agc ttt gag att gac 1008
Asn Pro Leu Ala Glu Leu Lys Cys Ser Val Lys Ser Phe Glu Ile Asp
325 330 335
aaa gga att tac cag acc tct aat ttc agg gtt gtt ccc tca gga gat 1056
Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val Val Pro Ser Gly Asp
340 345 350
gtt gtg aga ttc cct aat att aca aac ttg tgt cct ttt gga gag gtt 1104
Val Val Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val
355 360 365
ttt aat gct act aaa ttc cct tct gtc tat gca tgg gag aga aaa aaa 1152
Phe Asn Ala Thr Lys Phe Pro Ser Val Tyr Ala Trp Glu Arg Lys Lys
370 375 380
att tct aat tgt gtt gct gat tac tct gtg ctc tac aac tca aca ttt 1200
Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser Thr Phe
385 390 395 400
ttt tca acc ttt aag tgc tat ggc gtt tct gcc act aag ttg aat gat 1248
Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Ala Thr Lys Leu Asn Asp
405 410 415
ctt tgc ttc tcc aat gtc tat gca gat tct ttt gta gtc aag gga gat 1296
Leu Cys Phe Ser Asn Val Tyr Ala Asp Ser Phe Val Val Lys Gly Asp
420 425 430
gat gta aga caa ata gcg cca gga caa act ggt gtt att gct gat tat 1344
Asp Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Val Ile Ala Asp Tyr
435 440 445
aat tat aaa ttg cca gat gat ttc atg ggt tgt gtc ctt gct tgg aat 1392
Asn Tyr Lys Leu Pro Asp Asp Phe Met Gly Cys Val Leu Ala Trp Asn
450 455 460
act agg aac att gat gct act tca act ggt aat tat aat tat aaa tat 1440
Thr Arg Asn Ile Asp Ala Thr Ser Thr Gly Asn Tyr Asn Tyr Lys Tyr
465 470 475 480
agg tat ctt aga cat ggc aag ctt agg ccc ttt gag aga gac ata tct 1488
Arg Tyr Leu Arg His Gly Lys Leu Arg Pro Phe Glu Arg Asp Ile Ser
485 490 495
aat gtg cct ttc tcc cct gat ggc aaa cct tgc acc cca cct gct ctt 1536
Asn Val Pro Phe Ser Pro Asp Gly Lys Pro Cys Thr Pro Pro Ala Leu
500 505 510
aat tgt tat tgg cca tta aat gat tat ggt ttt tac acc act act ggc 1584
Asn Cys Tyr Trp Pro Leu Asn Asp Tyr Gly Phe Tyr Thr Thr Thr Gly
515 520 525
att ggc tac caa cct tac aga gtt gta gta ctt tct ttt gaa ctt tta 1632
Ile Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu
530 535 540
aat gca ccg gcc acg gtt tgt gga cca aaa tta tcc act gac ctt att 1680
Asn Ala Pro Ala Thr Val Cys Gly Pro Lys Leu Ser Thr Asp Leu Ile
545 550 555 560
aag aac cag tgt gtc aat ttt aat ttt aat gga ctc act ggt act ggt 1728
Lys Asn Gln Cys Val Asn Phe Asn Phe Asn Gly Leu Thr Gly Thr Gly
565 570 575
gtg tta act cct tct tca aag aga ttt caa cca ttt caa caa ttt ggc 1776
Val Leu Thr Pro Ser Ser Lys Arg Phe Gln Pro Phe Gln Gln Phe Gly
580 585 590
cgt gat gtt tct gat ttc act gat tcc gtt cga gat cct aaa aca tct 1824
Arg Asp Val Ser Asp Phe Thr Asp Ser Val Arg Asp Pro Lys Thr Ser
595 600 605
gaa ata tta gac att tca cct tgc gct ttt ggg ggt gta agt gta att 1872
Glu Ile Leu Asp Ile Ser Pro Cys Ala Phe Gly Gly Val Ser Val Ile
610 615 620
aca cct gga aca aat gct tca tct gaa gtt gct gtt cta tat caa gat 1920
Thr Pro Gly Thr Asn Ala Ser Ser Glu Val Ala Val Leu Tyr Gln Asp
625 630 635 640
gtt aac tgc act gat gtt tct aca gca att cat gca gat caa ctc aca 1968
Val Asn Cys Thr Asp Val Ser Thr Ala Ile His Ala Asp Gln Leu Thr
645 650 655
cca gct tgg cgc ata tat tct act gga aac aat gta ttc cag act caa 2016
Pro Ala Trp Arg Ile Tyr Ser Thr Gly Asn Asn Val Phe Gln Thr Gln
660 665 670
gca ggc tgt ctt ata gga gct gag cat gtc gac act tct tat gag tgc 2064
Ala Gly Cys Leu Ile Gly Ala Glu His Val Asp Thr Ser Tyr Glu Cys
675 680 685
gac att cct att gga gct ggc att tgt gct agt tac cat aca gtt tct 2112
Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala Ser Tyr His Thr Val Ser
690 695 700
tta tta cgt agt act agc caa aaa tct att gtg gct tat act atg tct 2160
Leu Leu Arg Ser Thr Ser Gln Lys Ser Ile Val Ala Tyr Thr Met Ser
705 710 715 720
tta ggt gct gat agt tca att gct tac tct aat aac acc att gct ata 2208
Leu Gly Ala Asp Ser Ser Ile Ala Tyr Ser Asn Asn Thr Ile Ala Ile
725 730 735
cct act aac ttt tca att agc att act aca gaa gta atg cct gtt tct 2256
Pro Thr Asn Phe Ser Ile Ser Ile Thr Thr Glu Val Met Pro Val Ser
740 745 750
atg gct aaa acc tcc gta gat tgt aat atg tac atc tgc gga gat tct 2304
Met Ala Lys Thr Ser Val Asp Cys Asn Met Tyr Ile Cys Gly Asp Ser
755 760 765
act gaa tgt gct aat ttg ctt ctc caa tat ggt agc ttt tgc aca caa 2352
Thr Glu Cys Ala Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln
770 775 780
cta aat cgt gca ctc tca ggt att gct gct gaa cag gat cgc aac aca 2400
Leu Asn Arg Ala Leu Ser Gly Ile Ala Ala Glu Gln Asp Arg Asn Thr
785 790 795 800
cgt gaa gtg ttc gct caa gtc aaa caa atg tac aaa acc cca act ttg 2448
Arg Glu Val Phe Ala Gln Val Lys Gln Met Tyr Lys Thr Pro Thr Leu
805 810 815
aaa tat ttt ggt ggt ttt aat ttt tca caa ata tta cct gac cct cta 2496
Lys Tyr Phe Gly Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Leu
820 825 830
aag cca act aag agg tct ttt att gag gac ttg ctc ttt aat aag gtg 2544
Lys Pro Thr Lys Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val
835 840 845
aca ctc gct gat gct ggc ttc atg aag caa tat ggc gaa tgc cta ggt 2592
Thr Leu Ala Asp Ala Gly Phe Met Lys Gln Tyr Gly Glu Cys Leu Gly
850 855 860
gat att aat gct aga gat ctc att tgt gcg cag aag ttc aat gga ctt 2640
Asp Ile Asn Ala Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu
865 870 875 880
aca gtg ttg cca cct ctg ctc act gat gat atg att gct gcc tac act 2688
Thr Val Leu Pro Pro Leu Leu Thr Asp Asp Met Ile Ala Ala Tyr Thr
885 890 895
gct gct cta gtt agt ggt act gcc act gct gga tgg aca ttt ggt gct 2736
Ala Ala Leu Val Ser Gly Thr Ala Thr Ala Gly Trp Thr Phe Gly Ala
900 905 910
ggc gct gct ctt caa ata cct ttt gct atg caa atg gca tat agg ttc 2784
Gly Ala Ala Leu Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe
915 920 925
aat ggc att gga gtt acc caa aat gtt ctc tat gag aac caa aaa caa 2832
Asn Gly Ile Gly Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Gln
930 935 940
atc gcc aac caa ttt aac aag gcg att agt caa att caa gaa tca ctt 2880
Ile Ala Asn Gln Phe Asn Lys Ala Ile Ser Gln Ile Gln Glu Ser Leu
945 950 955 960
aca aca aca tca act gca ttg ggc aag ctg caa gac gtt gtt aac cag 2928
Thr Thr Thr Ser Thr Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln
965 970 975
aat gct caa gca tta aac aca ctt gtt aaa caa ctt agc tct aat ttt 2976
Asn Ala Gln Ala Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe
980 985 990
ggt gca att tca agt gtg cta aat gat atc ctt tcg cga ctt gat aaa 3024
Gly Ala Ile Ser Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys
995 1000 1005
gtc gag gcg gag gta caa att gac agg tta att aca ggc aga ctt 3069
Val Glu Ala Glu Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu
1010 1015 1020
caa agc ctt caa acc tat gta aca caa caa cta atc agg gct gct 3114
Gln Ser Leu Gln Thr Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala
1025 1030 1035
gaa atc agg gct tct gct aat ctt gct gct act aaa atg tct gag 3159
Glu Ile Arg Ala Ser Ala Asn Leu Ala Ala Thr Lys Met Ser Glu
1040 1045 1050
tgt gtt ctt gga caa tca aaa aga gtt gac ttt tgt gga aag ggc 3204
Cys Val Leu Gly Gln Ser Lys Arg Val Asp Phe Cys Gly Lys Gly
1055 1060 1065
tac cac ctt atg tcc ttc cca caa gca gcc ccg cat ggt gtt gtc 3249
Tyr His Leu Met Ser Phe Pro Gln Ala Ala Pro His Gly Val Val
1070 1075 1080
ttc cta cat gtc acg tat gtg cca tcc cag gag agg aac ttc acc 3294
Phe Leu His Val Thr Tyr Val Pro Ser Gln Glu Arg Asn Phe Thr
1085 1090 1095
aca gcg cca gca att tgt cat gaa ggc aaa gca tac ttc cct cgt 3339
Thr Ala Pro Ala Ile Cys His Glu Gly Lys Ala Tyr Phe Pro Arg
1100 1105 1110
gaa ggt gtt ttt gtg ttt aat ggc act tct tgg ttt att aca cag 3384
Glu Gly Val Phe Val Phe Asn Gly Thr Ser Trp Phe Ile Thr Gln
1115 1120 1125
agg aac ttc ttt tct cca caa ata att act aca gac aat aca ttt 3429
Arg Asn Phe Phe Ser Pro Gln Ile Ile Thr Thr Asp Asn Thr Phe
1130 1135 1140
gtc tca gga aat tgt gat gtc gtt att ggc atc att aac aac aca 3474
Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Ile Asn Asn Thr
1145 1150 1155
gtt tat gat cct ctg caa cct gag ctt gac tca ttc aaa gaa gag 3519
Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu
1160 1165 1170
ctg gac aag tac ttc aaa aat cat aca tca cca gat gtt gat ctt 3564
Leu Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu
1175 1180 1185
ggc gac att tca ggc att aac gct tct gtc gtc aac att caa aaa 3609
Gly Asp Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys
1190 1195 1200
gaa att gac cgc ctc aat gag gtc gct aaa aat tta aat gaa tca 3654
Glu Ile Asp Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser
1205 1210 1215
ctc att gac ctt caa gaa ttg gga aaa tat gag caa tat att aaa 3699
Leu Ile Asp Leu Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys
1220 1225 1230
tgg cct tgg tat gtt tgg ctc ggc ttc att gct gga cta att gcc 3744
Trp Pro Trp Tyr Val Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala
1235 1240 1245
atc gtc atg gtt aca atc ttg ctt tgt tgc atg act agt tgt tgc 3789
Ile Val Met Val Thr Ile Leu Leu Cys Cys Met Thr Ser Cys Cys
1250 1255 1260
agt tgc ctc aag ggt gca tgc tct tgt ggt tct tgc tgc aag ttt 3834
Ser Cys Leu Lys Gly Ala Cys Ser Cys Gly Ser Cys Cys Lys Phe
1265 1270 1275
gat gag gat gac tct gag cca gtt ctc aag ggt gtc aaa tta cat 3879
Asp Glu Asp Asp Ser Glu Pro Val Leu Lys Gly Val Lys Leu His
1280 1285 1290
tac aca taa
3888
Tyr Thr
1295
<210>2
<211>1295
<212>PRT
<213>SARS coronavirus
<400>2
Met Pro Arg Gly Ser His His His His His His Gly Met Ala Ser Met
1 5 10 15
Thr Gly Gly Gln Gln Met Gly Arg Asp Leu Tyr Asp Asp Asp Asp Lys
20 25 30
Asp Arg Trp Gly Ser Glu Leu Glu Met Phe Ile Phe Leu Leu Phe Leu
35 40 45
Thr Leu Thr Ser Gly Ser Asp Leu Asp Arg Cys Thr Thr Phe Asp Asp
50 55 60
Val Gln Ala Pro Asn Tyr Thr Gln His Thr Ser Ser Met Arg Gly Val
65 70 75 80
Tyr Tyr Pro Asp Glu Ile Phe Arg Ser Asp Thr Leu Tyr Leu Thr Gln
85 90 95
Asp Leu Phe Leu Pro Phe Tyr Ser Asn Val Thr Gly Phe His Thr Ile
100 105 110
Asn His Thr Phe Gly Asn Pro Val Ile Pro Phe Lys Asp Gly Ile Tyr
115 120 125
Phe Ala Ala Thr Glu Lys Ser Asn Val Val Arg Gly Trp Val Phe Gly
130 135 140
Ser Thr Met Asn Asn Lys Ser Gln Ser Val Ile Ile Ile Asn Asn Ser
145 150 155 160
Thr Asn Val Val Ile Arg Ala Cys Asn Phe Glu Leu Cys Asp Asn Pro
165 170 175
Phe Phe Ala Val Ser Lys Pro Met Gly Thr Gln Thr His Thr Met Ile
180 185 190
Phe Asp Asn Ala Phe Asn Cys Thr Phe Glu Tyr Ile Ser Asp Ala Phe
195 200 205
Ser Leu Asp Val Ser Glu Lys Ser Gly Asn Phe Lys His Leu Arg Glu
210 215 220
Phe Val Phe Lys Asn Lys Asp Gly Phe Leu Tyr Val Tyr Lys Gly Tyr
225 230 235 240
Gln Pro Ile Asp Val Val Arg Asp Leu Pro Ser Gly Phe Asn Thr Leu
245 250 255
Lys Pro Ile Phe Lys Leu Pro Leu Gly Ile Asn Ile Thr Asn Phe Arg
260 265 270
Ala Ile Leu Thr Ala Phe Ser Pro Ala Gln Asp Ile Trp Gly Thr Ser
275 280 285
Ala Ala Ala Tyr Phe Val Gly Tyr Leu Lys Pro Thr Thr Phe Met Leu
290 295 300
Lys Tyr Asp Glu Asn Gly Thr Ile Thr Asp Ala Val Asp Cys Ser Gln
305 310 315 320
Asn Pro Leu Ala Glu Leu Lys Cys Ser Val Lys Ser Phe Glu Ile Asp
325 330 335
Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val Val Pro Ser Gly Asp
340 345 350
Val Val Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val
355 360 365
Phe Asn Ala Thr Lys Phe Pro Ser Val Tyr Ala Trp Glu Arg Lys Lys
370 375 380
Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser Thr Phe
385 390 395 400
Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Ala Thr Lys Leu Asn Asp
405 410 415
Leu Cys Phe Ser Asn Val Tyr Ala Asp Ser Phe Val Val Lys Gly Asp
420 425 430
Asp Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Val Ile Ala Asp Tyr
435 440 445
Asn Tyr Lys Leu Pro Asp Asp Phe Met Gly Cys Val Leu Ala Trp Asn
450 455 460
Thr Arg Asn Ile Asp Ala Thr Ser Thr Gly Asn Tyr Asn Tyr Lys Tyr
465 470 475 480
Arg Tyr Leu Arg His Gly Lys Leu Arg Pro Phe Glu Arg Asp Ile Ser
485 490 495
Asn Val Pro Phe Ser Pro Asp Gly Lys Pro Cys Thr Pro Pro Ala Leu
500 505 510
Asn Cys Tyr Trp Pro Leu Asn Asp Tyr Gly Phe Tyr Thr Thr Thr Gly
515 520 525
Ile Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu
530 535 540
Asn Ala Pro Ala Thr Val Cys Gly Pro Lys Leu Ser Thr Asp Leu Ile
545 550 555 560
Lys Asn Gln Cys Val Asn Phe Asn Phe Asn Gly Leu Thr Gly Thr Gly
565 570 575
Val Leu Thr Pro Ser Ser Lys Arg Phe Gln Pro Phe Gln Gln Phe Gly
580 585 590
Arg Asp Val Ser Asp Phe Thr Asp Ser Val Arg Asp Pro Lys Thr Ser
595 600 605
Glu Ile Leu Asp Ile Ser Pro Cys Ala Phe Gly Gly Val Ser Val Ile
610 615 620
Thr Pro Gly Thr Asn Ala Ser Ser Glu Val Ala Val Leu Tyr Gln Asp
625 630 635 640
Val Asn Cys Thr Asp Val Ser Thr Ala Ile His Ala Asp Gln Leu Thr
645 650 655
Pro Ala Trp Arg Ile Tyr Ser Thr Gly Asn Asn Val Phe Gln Thr Gln
660 665 670
Ala Gly Cys Leu Ile Gly Ala Glu His Val Asp Thr Ser Tyr Glu Cys
675 680 685
Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala Ser Tyr His Thr Val Ser
690 695 700
Leu Leu Arg Ser Thr Ser Gln Lys Ser Ile Val Ala Tyr Thr Met Ser
705 710 715 720
Leu Gly Ala Asp Ser Ser Ile Ala Tyr Ser Asn Asn Thr Ile Ala Ile
725 730 735
Pro Thr Asn Phe Ser Ile Ser Ile Thr Thr Glu Val Met Pro Val Ser
740 745 750
Met Ala Lys Thr Ser Val Asp Cys Asn Met Tyr Ile Cys Gly Asp Ser
755 760 765
Thr Glu Cys Ala Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln
770 775 780
Leu Asn Arg Ala Leu Ser Gly Ile Ala Ala Glu Gln Asp Arg Asn Thr
785 790 795 800
Arg Glu Val Phe Ala Gln Va1 Lys Gln Met Tyr Lys Thr Pro Thr Leu
805 810 815
Lys Tyr Phe Gly Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Leu
820 825 830
Lys Pro Thr Lys Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val
835 840 845
Thr Leu Ala Asp Ala Gly Phe Met Lys Gln Tyr Gly Glu Cys Leu Gly
850 855 860
Asp Ile Asn Ala Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu
865 870 875 880
Thr Val Leu Pro Pro Leu Leu Thr Asp Asp Met Ile Ala Ala Tyr Thr
885 890 895
Ala Ala Leu Val Ser Gly Thr Ala Thr Ala Gly Trp Thr Phe Gly Ala
900 905 910
Gly Ala Ala Leu Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe
915 920 925
Asn Gly Ile Gly Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Gln
930 935 940
Ile Ala Asn Gln Phe Asn Lys Ala Ile Ser Gln Ile Gln Glu Ser Leu
945 950 955 960
Thr Thr Thr Ser Thr Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln
965 970 975
Asn Ala Gln Ala Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe
980 985 990
Gly Ala Ile Ser Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys
995 1000 1005
Val Glu Ala Glu Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu
1010 1015 1020
Gln Ser Leu Gln Thr Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala
1025 1030 1035
Glu Ile Arg Ala Ser Ala Asn Leu Ala Ala Thr Lys Met Ser Glu
1040 1045 1050
Cys Val Leu Gly Gln Ser Lys Arg Va1 Asp Phe Cys Gly Lys Gly
1055 1060 1065
Tyr His Leu Met Ser Phe Pro Gln Ala Ala Pro His Gly Val Val
1070 1075 1080
Phe Leu His Val Thr Tyr Val Pro Ser Gln Glu Arg Asn Phe Thr
1085 1090 1095
Thr Ala Pro Ala Ile Cys His Glu Gly Lys Ala Tyr Phe Pro Arg
1100 1105 1110
Glu Gly Val Phe Val Phe Asn Gly Thr Ser Trp Phe Ile Thr Gln
1115 1120 1125
Arg Asn Phe Phe Ser Pro Gln Ile Ile Thr Thr Asp Asn Thr Phe
1130 1135 1140
Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Ile Asn Asn Thr
1145 1150 1155
Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu
1160 1165 1170
Leu Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu
1175 1180 1185
Gly Asp Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys
1190 1195 1200
Glu Ile Asp Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser
1205 1210 1215
Leu Ile Asp Leu Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys
1220 1225 1230
Trp Pro Trp Tyr Val Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala
1235 1240 1245
Ile Val Met Val Thr Ile Leu Leu Cys Cys Met Thr Ser Cys Cys
1250 1255 1260
Ser Cys Leu Lys Gly Ala Cys Ser Cys Gly Ser Cys Cys Lys Phe
1265 1270 1275
Asp Glu Asp Asp Ser Glu Pro Val Leu Lys Gly Val Lys Leu His
1280 1285 1290
Tyr Thr
1295
Claims (4)
1、一种基因工程表达、分离和纯化的蛋白质,其序列为SEQ IDNO.2所示氨基酸序列。
2、一种基因工程表达、分离和纯化的蛋白质对应的核酸,其序列为SEQ ID NO.1所示核酸序列。
3、一种含冠状病毒SARS-CoV的Spike基因的重组昆虫病毒株,其特征在于:重组苜蓿银纹夜蛾核型多角体病毒毒株AcNPV-FSPA,CCTCC NO.V200513,其插入了SARS-CoV Spike表达盒。
4、权利要求1所述的一种基因工程蛋白质FSPA在检测急性呼吸综合征的病原SARS-CoV药物中的应用。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB2005101205300A CN100540564C (zh) | 2005-12-27 | 2005-12-27 | 一种冠状病毒基因工程蛋白质及应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB2005101205300A CN100540564C (zh) | 2005-12-27 | 2005-12-27 | 一种冠状病毒基因工程蛋白质及应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1990502A CN1990502A (zh) | 2007-07-04 |
CN100540564C true CN100540564C (zh) | 2009-09-16 |
Family
ID=38213059
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB2005101205300A Expired - Fee Related CN100540564C (zh) | 2005-12-27 | 2005-12-27 | 一种冠状病毒基因工程蛋白质及应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN100540564C (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113248575B (zh) * | 2020-02-12 | 2022-11-01 | 北京科兴中维生物技术有限公司 | 一种针对SARS-CoV-2的重组蛋白疫苗及其制备方法 |
CN112362717B (zh) * | 2020-11-25 | 2021-09-24 | 武汉生物制品研究所有限责任公司 | 一种SARS-CoV-2的灭活疫苗纯度分析方法 |
CN113897373B (zh) * | 2021-10-18 | 2024-10-15 | 江苏省中国科学院植物研究所 | 珠眉海棠MzASMT 1基因在调控杨树根系发育中的应用 |
-
2005
- 2005-12-27 CN CNB2005101205300A patent/CN100540564C/zh not_active Expired - Fee Related
Non-Patent Citations (2)
Title |
---|
AAP41037. Genebank. 2004 |
AAP41037. Genebank. 2004 * |
Also Published As
Publication number | Publication date |
---|---|
CN1990502A (zh) | 2007-07-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Sosnovtsev et al. | Cleavage map and proteolytic processing of the murine norovirus nonstructural polyprotein in infected cells | |
Katayama et al. | Phylogenetic analysis of the complete genome of 18 Norwalk-like viruses | |
Farkas et al. | Characterization of a rhesus monkey calicivirus representing a new genus of Caliciviridae | |
Simmonds et al. | A proposed system for the nomenclature of hepatitis C viral genotypes | |
GB2239245A (en) | Post-transfusional non-A non-B hepatitis viral polypeptides | |
Yin et al. | A new Chinese isolate of hepatitis E virus: comparison with strains recovered from different geographical regions | |
Kurita et al. | Complete genome sequencing of red sea bream iridovirus (RSIV) | |
Hirowatari et al. | Two proteinase activities in HCV polypeptide expressed in insect cells using baculovirus vector | |
CN110157737A (zh) | 一种在sf9细胞中表达非洲猪瘟cd2v蛋白的重组杆状病毒 | |
CN107056898A (zh) | 鲤疱疹病毒3型1301株orf136基因重组表达蛋白、抗体及其应用 | |
CN110157681A (zh) | 一种猪瘟e2蛋白亚单位疫苗 | |
CN100540564C (zh) | 一种冠状病毒基因工程蛋白质及应用 | |
CN109810179A (zh) | 一种分离的核酸分子以及制备猪圆环病毒2型Cap蛋白的方法 | |
CN108794583A (zh) | 貉细小病毒病毒样颗粒、其制备方法与应用以及该病毒样颗粒制备的疫苗 | |
CN113817753B (zh) | 表达SARS-CoV-2纤突蛋白或其变异体SΔ21的假型化VSV病毒构建和应用 | |
CN113896773B (zh) | 重组fcv抗原及猫嵌杯病毒基因工程亚单位疫苗 | |
WO1994005700A2 (en) | Methods and reagents to detect and characterize norwalk and related viruses | |
Kobayashi et al. | Expression of recombinant capsid proteins of chitta virus, a genogroup II Norwalk virus, and development of an ELISA to detect the viral antigen | |
CN109212230B (zh) | 用于检测犬细小病毒结构蛋白vp2抗体的致敏聚苯乙烯纳米微球及其制备方法和应用 | |
Yun et al. | Complete genome sequence and phylogenetic analysis of a recombinant Korean norovirus, CBNU1, recovered from a 2006 outbreak | |
CN118531067A (zh) | 一种新型黑猩猩腺病毒载体及其构建方法和应用 | |
CN105886531B (zh) | 分子标记猪瘟病毒弱毒疫苗的构建方法 | |
Wada et al. | Cytomegalovirus glycoprotein B sequence variation among Japanese bone marrow transplant recipients | |
CN102174091B (zh) | 截短表达鸭瘟病毒重组囊膜gI蛋白及其制备方法与应用 | |
Rinehart-Kim et al. | Complete nucleotide sequence and genomic organization of a primate calicivirus, Pan-1 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20090916 Termination date: 20171227 |
|
CF01 | Termination of patent right due to non-payment of annual fee |