CN101688236A - 确定包含Replikin Peak基因的病原体和恶性肿瘤的致死性的方法 - Google Patents

确定包含Replikin Peak基因的病原体和恶性肿瘤的致死性的方法 Download PDF

Info

Publication number
CN101688236A
CN101688236A CN200880002494A CN200880002494A CN101688236A CN 101688236 A CN101688236 A CN 101688236A CN 200880002494 A CN200880002494 A CN 200880002494A CN 200880002494 A CN200880002494 A CN 200880002494A CN 101688236 A CN101688236 A CN 101688236A
Authority
CN
China
Prior art keywords
virus
replikin
seq
gene
organism
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN200880002494A
Other languages
English (en)
Inventor
塞缪尔·博戈奇
埃伦诺尔·S·博戈奇
塞缪尔·温斯顿·博戈奇
安妮·埃琳诺尔·博桑伊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US11/755,597 external-priority patent/US20080260764A1/en
Priority claimed from US11/923,559 external-priority patent/US8050871B2/en
Application filed by Individual filed Critical Individual
Priority claimed from PCT/US2008/000645 external-priority patent/WO2008143717A2/en
Publication of CN101688236A publication Critical patent/CN101688236A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明提供了鉴定致死、毒性和快速复制的病毒、生物体和恶性肿瘤的方法,该方法包括比较不同病毒、生物体或恶性肿瘤之间的Replikin浓度。本发明进一步为了诊断、治疗和预测目的提供与致死性、毒力和快速复制增加相关的分离的Replikin Peak基因。

Description

确定包含Replikin Peak基因的病原体和恶性肿瘤的致死性的方法
本申请包含“长的”序列表,其已经通过CD-R提交并代替打印的纸件拷贝,以其整体在此通过引用并入。所述CD-R于2008年1月17日记录,分别标为CRF“拷贝1”、“拷贝2”和“拷贝3”,各自仅包含一个相同的1.36Mb文件(27129302.txt)。
[0001]本申请要求递交于2007年11月30日的美国临时申请序列第60/991,676号、递交于2007年10月24日的美国申请序列第11/923,559号、递交于2007年10月24日的美国临时申请序列第60/982,336号、递交于2007年10月24日的美国临时申请序列第60/982,333号、递交于2007年10月24日的美国临时申请序列第60/982,338号、递交于2007年8月31日的美国临时申请序列第60/935,816号、递交于2007年8月16日的美国临时申请序列第60/935,499号、递交于2007年8月8日的美国临时申请序列第60/954,743号、递交于2007年5月30的美国申请序列第11/755,597号、递交于2007年1月30日的美国临时申请序列第60/898,097号和递交于2007年1月18的美国临时申请序列第60/880,966号的优先权,其各自以其整体在此通过引用并入。本申请还在此通过引用并入:递交于2006年10月24日的美国临时申请序列第60/853,744号、递交于2006年2月16日的美国申请序列第11/355,120号、递交于2005年4月28日的美国申请序列第11/116,203号、递交于2004年6月4日的美国申请序列第10/860,050号、递交于2002年7月8日的美国申请序列第10/189,437号、递交于2002年3月26日的美国申请序列第10/105,232号(现为美国专利第7,189,800号)、递交于2001年10月26日的美国申请序列第09/984,057号和递交于2001年10月26日的美国申请序列第09/984,056号(现为美国专利第7,176,275号),其各自以其整体并入。
发明的技术领域
[0002]本发明一般涉及通过鉴定称为Replikins的小肽类的浓度而鉴定病原性病毒、病原性生物体和恶性肿瘤的毒性和致死的株,并涉及诊断、预防和治疗这种毒性和致死的病原体和恶性肿瘤造成的疾病。
发明背景
[0003]快速复制是一些细菌、病毒和恶性肿瘤等等的毒力的特征。发明人已经描述了不同生物体、病毒和恶性肿瘤快速复制共有的定量化学。发明人描述的快速复制的化学存在于与快速复制相关的一族保守小蛋白序列,称为Replikins。在大量病毒和生物体中已观察到Replikin序列浓度增加与复制和毒力增加之间的关联。因此Replikin序列为开发有效的预测和治疗病毒暴发的方法提供了新的靶。
恶性肿瘤以及病毒和细菌病原体中的Replikin序列
[0004]Replikin序列是包括Replikin基序的7至约50个氨基酸的氨基酸序列。Replikin基序包括:(1)位于基序第一末端的至少一个赖氨酸残基和位于基序第二末端的至少一个赖氨酸残基或至少一个组氨酸残基;(2)位于距离第二赖氨酸残基六至十残基处的第一赖氨酸残基;(3)至少一个组氨酸残基;和(4)至少6%的赖氨酸残基。Replikin序列可包括末端赖氨酸并可进一步包括末端赖氨酸或末端组氨酸。Replikin肽或Replikin蛋白是由Replikin序列组成的肽或蛋白。
[0005]发明人已在致癌细胞和病毒以及生物体蛋白中鉴定了与快速复制和毒力相关的Replikin序列。此外,已经将基因组密码中更高浓度的Replikin序列与多种传染性和病原性因子(包括人类癌症、HIV、植物病毒和一些病原性动物和人类病毒)相关联。进一步地,病毒或生物体蛋白中Replikin序列浓度与疾病大暴发之间的关联和恶性肿瘤中Replikin序列浓度与预测差之间的关联都是显著的。
[0006]基于追溯至1917-18流感大流行的数据,在长达90年,Replikin序列已被观察到一般在人类癌症和在许多病原性生物体和病毒中是保守的,包括株内和株间流感病毒的保守。病毒基因组中Replikin序列浓度已显示出在株特异性暴发前增加,并增加SARS、流感、H5N1禽流感和现在的很多其它病毒和非病毒病原体的死亡率。随着复制增加,还已经显示出癌症中包含Replikin序列的蛋白的产生浓度增加。
[0007]上世纪有过三次流感大流行,每次都是株特异性的:1918年的H1N1;1957年的H2N2;和1968年的H3N2。发明人已经确立:每次大流行之前,株内Replikin序列浓度存在株-特异性的增加。Replikin浓度的株-特异性的增加随后是Replikin浓度的减少和若干年后Replikin浓度的反弹增加,其伴随株-特异性反弹流行。Replikin算法提供了与流感流行和大流行关联的第一化学。
[0008]已经证实了1997年和2007年之间H5N1(禽流感)暴发与病毒蛋白中Replikin序列浓度之间的类似关联。类似地,已确立了2003年SARS冠状病毒的全球暴发和冠状病毒蛋白中Replikin序列浓度的增加之间的关联性。另一研究中,人类HIV-1病毒的两株中的Replikins证实快速复制株中的Replikin浓度是慢速复制株的六倍。其中Replikin浓度与休眠状态的Replikin浓度相比未显著增加的检查的所有病毒和生物体中未观察到快速复制的实例。
[0009]Replikin算法最初发现于糖蛋白10B,糖蛋白10B是分离自脑多形性成胶质细胞瘤、淋巴瘤和乳腺癌细胞的膜糖蛋白(美国专利第6,242,578B1号)。观察到Aglyco 10B的组成肽毒曲菌素在厌氧复制期间在细胞膜中富集十倍,而观察到细胞数目增加仅五倍。神经胶质瘤细胞快速复制中毒曲菌素蛋白膜浓度的增加暗示毒曲菌素中Replikin与多形性成胶质细胞瘤的复制的内在关系。
[00010]水解和质谱分析毒曲菌素得到包括Replikin序列kagvaflhkk(SEQ ID NO:3658)的16聚体肽。该肽不存在于正常人类基因组,推测为获得的。Replikin序列的同系物见于所有肿瘤病毒(即导致癌症的病毒)和藻类、植物真菌、病毒和细菌的复制蛋白。
[00011]当体外合成神经胶质瘤Replikin并将其作为合成疫苗施用于兔时,产生高丰度的抗毒曲菌素抗体。高丰度抗毒曲菌素抗体的产生确立该肽单独是表位,即,它是天然产生抗毒曲菌素抗体的癌症患者中观察到的免疫响应的充分基础。包含神经胶质瘤Replikin的16聚体肽产生IgM和IgG两种形式的抗体。
[00012]对癌症患者和对照的8,090份血清样本的研究证实,抗毒曲菌素抗体的浓度随健康个体年龄增加,随着群体中癌症发生率增加而增加,并在早期恶性肿瘤中进一步增加二至三倍而不论细胞类型。观察到体外该抗体在皮克(飞摩尔)每癌细胞对癌症细胞有细胞毒性,且体内抗毒曲菌素抗体的浓度与癌症患者的存活数量上相关。如在神经胶质瘤细胞中所示,现在可将其中细胞仅转化为永生的恶性状态但保持静止或休眠的癌症状态区别于更具威胁生命活性的复制状态,后者特征为Replikin的浓度增加。
[00013]使用神经胶质瘤Replikin肽的序列(kagvaflhkk)(SEQ ID NO:3658)作为模板,并构建“3-点-识别”方法以视觉扫描数种不同生物体的蛋白序列,在不同生物体如藻类、酵母和病毒中揭示一类新肽Replikins。令人惊讶地,发现这些肽集中在更大的“复制”和“转化”蛋白。
[00014]在整体“病毒肽”(1.5%),以及在未指定为与恶性转化或复制相关的其它肽诸如“脑肽”和“神经肽”(共8.5%)中观察到同系物的不频繁存在。在肿瘤病毒、转化蛋白和癌细胞蛋白中鉴定了令人惊讶的高频率的同系物存在。例如,100%的已鉴定肿瘤病毒包含Replikin序列。85%的转化蛋白包含Replikin序列且97%的癌症蛋白包含Replikin序列。
[00015]进一步地,Replikin鉴定于如下蛋白:酿酒酵母(Saccharomycescerevisiae)复制结合蛋白;玉米条纹病毒的复制相关蛋白;金黄色葡萄球菌(Staphylococcus aureus)的复制相关蛋白;牛疱疹病毒4的DNA复制蛋白;和mealigrid疱疹病毒1复制结合蛋白。包含Replikin的蛋白还经常与氧化还原功能和蛋白合成或延伸以及细胞复制相关。
[00016]已经分析并报道的生物体或病毒中最高Replikin序列浓度是特别快速复制的寄生原生动物恶性疟原虫(Plasmodium falciparum)(报道造成人类疟疾死亡的90%)(本文有时表示为疟疾)中111个Replikin序列每100氨基酸。已观察到恶性疟原虫在寄生虫从宿主肝脏到血液传代过程中在48小时内复制11,000次。
[00017]恶性疟原虫中观察到的Replikin序列的显著特征是遍布疟疾蛋白的Replikin结构的明显重叠。例如,在39氨基酸的序列SEQ ID NO:3667中有九个重叠Replikin(Replikin浓度=23.1/100氨基酸);在41氨基酸的SEQ ID NO:3668中有15个重叠Replikin(Replikin浓度=36.6/100氨基酸)。这两种重叠Replikin结构存在于血液阶段的营养体和裂殖体。这种赖氨酸多倍性的机制还见于癌症蛋白的Replikin,诸如胃癌转化蛋白ktkkgnrvsptmkvth(SEQ ID NO:3669)和肺的转化蛋白P21B(K-RAS 2B)khkekmskdgkkkkkks(SEQ ID NO:3670)。
Replikin骨架
[00018]监测流感病毒中的Replikin序列时,发明人另外鉴定了保守Replikin序列的一个亚族,称为Replikin骨架或Replikin骨架序列。Replikin骨架最初鉴定于保守结构,尤其是毒性流感病毒。这些株中包括造成1918、1957、1968大流行的病毒和流感病毒的H5N1“禽流感”株的毒性株。Replikin骨架序列的类似物后来已经鉴定于毒性和快速复制SARS冠状病毒。见美国公布申请第2007/0026009号。
[00019]还已经在恶性疟原虫中鉴定了与鉴定的Replikin骨架的算法同源但不相同的Replikin序列的骨架化(scaffolding)。Replikin骨架化总体上已经与其被鉴定处的病原性基因组中Replikin浓度增加相关。恶性疟原虫中,骨架化显著地有助于在该原生动物的蛋白中注意到的非常高的Replikin浓度。
流感
[00020]流感的毒性和致死暴发一直是世界健康的威胁,医师越来越认识到毒性和致死流感大流行的持续威胁,需要预测毒力和致死性的新方法,并需要用于治疗的新方法和化合物。流感是一种具有全球重要性的急性呼吸道疾病。尽管国际上尝试通过接种疫苗来控制流感病毒暴发,但流感的传染仍然是发病和致死的一个重要原因。全世界范围的流感大流行在整个历史过程中于不定期的和以前不可预期的间隔期发生,并且预计流感大流行在将来将会继续发生。大流行性流感的影响从发病率、致死率和经济损失方面看是重大的。
[00021]流感疫苗一直是对流感病毒最有效的防御,但是由于病毒突变的能力以及可利用非人类宿主库,预计流感将会一直是新出现的或重新出现的感染。全球性的流感监测显示流感病毒可能在一个流感季期间在一个国家内以及在国家之间和大陆之间发生变化。病毒学监测在监控抗原性转变和漂移方面是重要的。疾病监测在评估流行病的影响中也是重要的。两类信息提供了疫苗组合物和抗病毒剂使用的基础。但是传统上,到目前为止仅在每年之后有数量不断增多的新出现流感病毒株的血液学分类,而没有鉴定出这些病毒的特异性的化学结构以作为迫近的流感流行和大流行的指示物。直到最近,在特定年份将流行性感冒病毒分为活性的、无活性的和流行性的年度分类唯一的基础是病毒血细胞凝集素和神经酰胺酶蛋白质的活性。
[00022]本领域需要在暴发前预测流感的毒力和致死性的增加的方法。本领域类似地需要预防和治疗流感毒性株造成的暴发的方法。由于每年施用流感疫苗和可施用疫苗的短时期,旨在改进疫苗覆盖性的策略是至关重要的。
马流感病毒
[00023]马流感是马的常见上呼吸道疾病,目前由马流感病毒(EIV)的H3N8株导致。马流感的典型症状包括干频咳、鼻涕和发热。该病毒性疾病被认为是欧洲、美国和亚洲部分地区的地方性动物病。还已在南美洲、中国和印度观察到显著暴发。
[00024]最近报道了马流感在日本自从1972年以来的第一次暴发和2007年马流感在澳大利亚第一次报道。迄今为止还没有报道致命性。然而马流感有时对幼仔是致命的。
[00025]隔离已被认为是针对马流感扩散的最好预防。南非、澳大利亚和日本已经对进口马匹使用隔离来停止马流感和其它疾病的扩散。隔离实践显然未能完全成功,说明所述疾病可能通过马的人类操控者而偶然转移。
[00026]流感病毒是高度可突变的,因此发展长期疗法是困难的。由于产生病毒的毒性突变体,疫苗通常需要更新。对所述病毒的世界性暴发的年度综述提供了针对最相关病毒株的疫苗的推荐生产数据。在鉴定最相关株和商品化疫苗之间流逝了很多时间。
[00027]本领域中需要在暴发前鉴定马流感病毒的出现的方法从而可针对所出现的病毒采取预防措施。本领域中同样需要预防和治疗包括疫苗的EIV毒性株造成的暴发的方法。
口蹄疫
[00028]口蹄疫是口蹄疫病毒(FMDV)造成的牛、猪和包括具有偶蹄的牛科的其它动物的高度传染性并且有时致命的病毒性疾病。FMDV是小核糖核酸病毒科(Picornaviridae)的单链RNA口蹄病毒。据说有七种不同FMDV血清型:O、A、C、SAT-1、SAT-2、SAT-3和亚洲-1。
[00029]本领域中需要在口蹄疫暴发前预测FMDV毒力增加的方法。本领域中同样需要预防和治疗FMDV的毒性株造成的口蹄疫暴发的方法。
西尼罗病毒
[00030]西尼罗病毒(WNV)在小百分比的被感染的人类中造成脑炎和其它严重神经侵染疾病。在约百分之四的WNV感染报道病例中,造成的神经侵染疾病导致死亡。WNV是黄病毒科病毒,首先于1999年在北美洲观察到,现在被认为是美国的地方性病毒。该病毒经由蚊子(和相关昆虫)叮咬传播到人类。WNV感染在少于约百分之一的被感染的人类中造成疾病诸如脑炎、脑膜炎和脑膜脑炎。在约20%的被感染的人类中,可发生较不严重的疾病,特征为发热、头痛、疲倦、疼痛和有时的疹。在报道WNV感染的美国病例的总数中,约百分之四导致死亡。
[00031]WNV是单链有义RNA病毒并是日本脑炎病毒抗原复合体的成员,该复合体包括与人类脑炎相关的数种医学上重要的病毒:日本脑炎、圣路易脑炎、墨累山谷脑炎和Kunjin脑炎(WNV的澳大利亚亚型)。
[00032]自从1999年该疾病传入美国,报道人类有多于16,000病例的WNV和报道多于650人死亡。此外,已报道马有多于21,000病例。目前,在抗击人类WNV中仅有的可用的认可策略是全国范围的积极监视结合控制蚊子的行动和以驱虫剂保护个体。因此本领域中需要在流行前预测WNV毒力增加的方法。本领域中同样需要预防和治疗WNV毒性株造成的暴发的方法。
猪的病毒病
[00033]现在为许多国家的猪的地方性病且目前导致世界范围巨大经济损失的两种严重病毒性疾病是猪生殖和呼吸综合征(PRRS)和猪圆环病毒相关疾病(PCVAD),分别由猪生殖和呼吸综合征病毒(PRRSV)和猪圆环病毒(PCV)造成。每种疾病都对养猪产业有严重影响,且对这两种疾病目前的控制措施证明是不充分的。
[00034]PRRS是猪中较为近期确认的疾病。该传染性病毒分类为动脉炎病毒科(Arteriviridae)和Nidovirales目,过去没有标准化的名称,但现在称为猪生殖和呼吸综合征病毒(PRRSV)。该疾病特征为生殖缺陷、幼猪死亡和轻微的呼吸疾病。
[00035]猪是PRRSV的唯一已知宿主,但有证据显示在1987年于美国和1990年于欧洲鉴定PRRS之前可能已经存在另一宿主或另外的复数种宿主。PRRS现在在美国和许多欧洲国家是地方性的。感染的证据(血清学或病毒学或两者)已发现于日本、韩国、菲律宾、越南、南美洲和加勒比地区。
[00036]该疾病与母猪生殖缺陷和猪发育的所有阶段的呼吸疾病相关。该疾病的临床体征包括:发热、厌食、抑郁、受孕率减少、流产、小猪虚弱(week piglets)、呼吸性窘迫和增加比例的其它地方性疾病。
[00037]PRRSV是正义单链小包膜RNA病毒,其基因组中具有至少九个开放读码框(ORFs),编码约20种推定蛋白:ORF 1a和1b编码复制蛋白;ORF 2a和2b编码未知结构蛋白;ORF 3、4和5编码包膜蛋白;ORF 6编码膜蛋白和ORF 7编码核壳体蛋白。
[00038]已鉴定了两种类型的PRRSV:欧洲型(I型)和北美洲型(II型)。这两种类型共有约60%的序列同一性。已知PRRSV株在病原性上差异显著。2006年,在中国和墨西哥发生了PRRSV的高病原性暴发。已估计每年PRRSV感染对美国养猪产业的代价在5.6亿美元和7.61亿美元之间。PRRSV感染已与每窝断奶猪的数目下降、出生率下降、死亡率增加、饲料转化(feed conversion)下降和平均每天的体重增加减少相关。
[00039]猪圆环病毒相关疾病(PCVAD)也是最近才在猪中识别(1996)。PCVAD是用于定义完整范围的与猪圆环病毒(PCV)感染相关的疾病的术语。猪疾病的范围包括:断奶后多系统衰竭综合征(PMWS);呼吸疾病;肺炎;腹泻;生殖疾病和高死亡率。PCVAD症状可包括在生长猪上形成的伤口中检测到PCV,在例如脾脏、胸腺、肠、淋巴结、肺、肾脏、肝脏和扁桃体中的炎症,和淋巴样细胞耗尽。认为PCV感染对人类健康不造成明显危害。PCVAD目前严重影响加拿大养猪产业。
[00040]已鉴定了两种抗原上不同型的PCV。猪圆环病毒1(PCV1)可为非病原性的,猪圆环病毒2(PCV2)看来是造成PCVAD的株。PCV1和PCV2的病毒基因组的开放读码框2共有约65%的氨基酸同一性。
[00041]PCV感染相关的疾病的发生率在加拿大在2000年和2006年之间已增加4%,且新暴发已在加拿大西部观察到。在一些研究中,在屠宰时发现多于80%的加拿大猪已被PCV2感染。在被感染的兽群中,还已观察到死亡率增加。随着PCV感染的发生率已增加,由于猪死亡和生殖率减少,猪肉生产已减少。由于PCV-造成的疾病,预期2006年加拿大的生产比2005年生产减少1.5%。
[00042]本领域中需要在暴发前预测PRRSV和PCV毒力增加的方法。本领域中同样需要预防和治疗PRRSV和PCV的毒性株造成的暴发的方法。
WSSV和TSV虾病原体
[00043]白斑综合征病毒(WSSV)(还称为白斑杆状(baculoform)病毒)和桃拉综合征病毒(taura syndrome virus,TSV)是虾的全球性致死病原体。
[00044]桃拉综合征是世界范围显著影响养虾产业的虾的病毒性疾病。桃拉综合征由桃拉综合征病毒(TSV)造成,该病毒是双顺反子病毒科(Discistroviridae),蟋蟀麻痹病毒属(Cripavirus)的成员,具有约10,000核苷酸的单正链基因组。该基因组包含两个开放读码框(ORF)。报道ORF1包含解旋酶、蛋白酶和RNA-依赖性RNA聚合酶的编码。报道ORF2包含三种衣壳蛋白的编码。
[00045]现在认为桃拉综合征是美洲地方性的并已在亚洲观察到暴发。被感染的虾通常具有红色尾、厌食和行为游走、尾肌肉可变得不透明和角质层可变得柔软。在疾病的急性阶段已观察到5%和95%之间的死亡率。TSV暴发存活的虾似乎对再次感染难以治疗并保持传染性。
[00046]白斑综合征(WSS)是虾的高传染性和致死的病毒感染,通常在第一次观察到症状后几天内破坏全部养殖场群体。第一次报道该疾病流行是1992年在台湾,现在知道该疾病存在于全球除澳大利亚以外的所有虾生长地区。该病毒有广泛的宿主范围,包括大多数培养的对虾类虾包括印度明对虾(Fenneropenaeus indicus)、斑节对虾(Penaeus monodon)、凡纳滨对虾(Litopenaeus vannamei)和日本囊对虾(Marsupenaeus japonicas),其它非对虾类虾,蟹,大螯虾及其它。
[00047]WSSV是杆形双链DNA病毒。已报道WSSV基因组的完整DNA序列组装为292,967碱基对的环状序列。WSSV感染的临床病征包括甲壳上的白斑、通常变红、和食物消耗减少和失去能量。本领域中需要通过操纵Replikin序列的复制功能而预防和治疗虾的病毒感染诸如TSV和WSSV的方法,和鉴定与Replikin序列的复制功能有关的分子靶以治疗毒性病毒的方法。
发明概述
[00048]本发明提供了一种鉴定具有比至少一种与第一病毒相同物种的第二病毒、与第一生物体相同物种的第二生物体、与第一恶性肿瘤相同种类的第二恶性肿瘤更高致死性的第一病毒、第一生物体或第一恶性肿瘤的方法,该方法包括比较所述第一病毒、第一生物体或第一恶性肿瘤的Replikin Peak基因(Replikin Peak Gene)的Replikin计数与至少一种第二病毒、第二生物体或第二恶性肿瘤的Replikin Peak基因的Replikin计数,以确定具有更高Replikin计数的病毒、生物体或恶性肿瘤具有更高致死性。
[00049]在一实施方式中,所述第一恶性肿瘤是肺恶性肿瘤、脑恶性肿瘤、乳腺恶性肿瘤、卵巢恶性肿瘤或淋巴恶性肿瘤。在一具体实施方式中,所述第一恶性肿瘤是非小细胞肺癌。
[00050]在另一实施方式中,所述第一生物体是结核分枝杆菌(Mycobacterium tuberculosis)、产粘液分枝杆菌(Mycobateriummucogenicum)、金黄色葡萄球菌或恶性疟原虫。
[00051]在进一步的实施方式中,所述病毒是流感病毒、口蹄疫病毒、西尼罗病毒、猪呼吸和生殖综合征病毒、猪圆环病毒、白斑综合征病毒、桃拉综合征病毒、冠状病毒、埃博拉病毒、双生曲叶病毒(gemini leaf curlvirus)、出血性败血病病毒或烟草花叶病毒。
[00052]在一具体实施方式中,所述第一病毒是H1N1、H2N2、H3N2、H5N1或H3N8甲型流感病毒株。
[00053]在进一步的实施方式中,所鉴定的Replikin Peak基因的蛋白或蛋白片段中的所述至少一个Replikin序列分离自甲型流感株H5N1并选自SEQ ID NO:1685-1691、SEQ ID NO:1702-1717。在进一步的实施方式中,所鉴定的Replikin Peak基因的蛋白或蛋白片段中的所述至少一个Replikin序列分离自马流感病毒(H3N8)并选自SEQ ID NO:547-562。
[00054]本发明进一步提供了一种病毒、生物体或恶性肿瘤的分离的或合成的Replikin Peak基因,其中所述Replikin Peak基因鉴定为与所述病毒的毒粒、所述生物体的细胞或所述恶性肿瘤的恶性细胞的基因组、蛋白或蛋白片段的其它部分相比,由每100氨基酸最高数目的连续Replikin序列组成的所述病毒的毒粒、所述生物体的细胞或所述恶性肿瘤的恶性细胞的基因组、蛋白或蛋白片段的部分。
[00055]在一实施方式中,所述的分离的或合成的Replikin Peak基因是与所述病毒的毒粒、所述生物体的细胞或所述恶性肿瘤的恶性细胞中所有其它蛋白或蛋白片段相比,由每100氨基酸最高数目的连续Replikin序列组成的蛋白或蛋白片段的部分。
[00056]在一具体实施方式中,所述分离的或合成的Replikin Peak基因分离自肺恶性肿瘤、脑恶性肿瘤、乳腺恶性肿瘤、卵巢恶性肿瘤或淋巴恶性肿瘤。在另一具体实施方式中,所述分离的或合成的Replikin Peak基因分离自非小细胞肺癌或多形性成胶质细胞瘤。
[00057]在又一实施方式中,所述分离的或合成的Replikin Peak基因分离自结核分枝杆菌(Mycobacterium tuberculosis)、产粘液分枝杆菌(Mycobacterium mucogenicum)、金黄色葡萄球菌或恶性疟原虫。
[00058]根据进一步的实施方式,所述分离的或合成的Replikin Peak基因分离自流感病毒、口蹄疫病毒、西尼罗病毒、猪生殖和呼吸综合征病毒、猪圆环病毒、白斑综合征病毒、桃拉综合征病毒、冠状病毒、埃博拉病毒、双生曲叶病毒、出血性败血病病毒或烟草花叶病毒。
[00059]在一实施方式中,所述分离的或合成的Replikin Peak基因来自流感病毒,尤其是甲型流感病毒。在一具体实施方式中,所述甲型流感病毒是株H1N1、H2N2、H3N2、H5N1或H3N8。在另一具体实施方式中,所述Replikin Peak基因分离自流感病毒的pB1基因区。
[00060]根据另一实施方式,所述分离的或合成的Replikin Peak基因来自口蹄疫病毒。在一具体实施方式中,所述分离的或合成的Replikin Peak基因鉴定于口蹄疫病毒的VP1基因内。
[00061]在又一实施方式中,所述分离的或合成的Replikin Peak基因来自西尼罗病毒。在一具体实施方式中,所述分离的或合成的Replikin Peak基因分离自西尼罗病毒的包膜蛋白。
[00062]在进一步的实施方式中,所述分离的或合成的Replikin Peak基因来自猪呼吸和生殖综合征病毒。在一具体实施方式中,所述分离的或合成的Replikin Peak基因分离自猪呼吸和生殖综合征病毒的核壳体蛋白。
[00063]在又一实施方式中,所述分离的或合成的Replikin Peak基因来自猪圆环病毒。在一具体实施方式中,所述分离的或合成的Replikin Peak基因分离自猪圆环病毒的复制酶蛋白。
[00064]在又进一步的实施方式中,所述分离的或合成的Replikin Peak基因来自白斑综合征病毒。在一具体实施方式中,所述分离的或合成的Replikin Peak基因分离自白斑综合征病毒的核糖核苷酸还原酶蛋白。
[00065]在又一实施方式中,所述分离的或合成的Replikin Peak基因来自烟草花叶病毒。
[00066]在进一步的实施方式中,所述分离的或合成的Replikin Peak基因来自鱼的出血性败血病病毒。在一具体实施方式中,所述分离的或合成的Replikin Peak基因分离自出血性败血病病毒的糖蛋白。
[00067]在另一具体实施方式中,所述分离的或合成的Replikin Peak基因包括如下序列:SEQ ID NO:1741、SEQ ID NO:3664、SEQ ID NO:3660、SEQ ID NO:3665、SEQ ID NO:1996、SEQ ID NO:1665、SEQ IDNO:1684、SEQ ID NO:1701、SEQ ID NO:546、SEQ ID NO:124、SEQID NO:130、SEQ ID NO:311、SEQ ID NO:341-344、SEQ ID NO:286、SEQ ID NO:287、SEQ ID NO:288、SEQ ID NO:289、SEQ ID NO:290、SEQ ID NO:233-238、SEQ ID NO:415、SEQ ID NO:421、SEQ ID NO:438、SEQ ID NO:451、SEQ ID NO:462、SEQ ID NO:498、SEQ ID NO:669、SEQ ID NO:1168、SEQ ID NO:1531、SEQ ID NO:1548或SEQ IDNO:1939。
[00068]本发明进一步提供了一种免疫原性组合物,其包括分离的或合成的Replikin Peak基因。在一具体实施方式中,所述免疫原性组合物包括Replikin序列,所述Replikin序列是SEQ ID NO:2902-2925、SEQ ID NO:2312-2544、SEQ ID NO:2701-2711、SEQ ID NO:2713-2718、SEQ ID NO:3282-3285、3287-3291、3293、3295、3297、3299、3300、3302、3304、3306和3308、SEQ ID NO:1685-1691、SEQ ID NO:1702-1717、SEQ IDNO:106、SEQ ID NO:112、SEQ ID NO:113、SEQ ID NO:125-129、SEQ ID NO:131-156、SEQ ID NO:233-244、SEQ ID NO:286-290、SEQID NO:312-323、SEQ ID NO:354-366、SEQ ID NO:368-380、SEQ ID NO:383-393、SEQ ID NO:395-401、SEQ ID NO:403-414、SEQ ID NO:291-307、SEQ ID NO:308-310、SEQ ID NO:324-327、SEQ ID NO:328-340、SEQID NO:416-419、SEQ ID NO:422-437、SEQ ID NO:440-445、SEQ ID NO:452-457、SEQ ID NO:464-476、SEQ ID NO:482-484和SEQ ID NO:487-492、SEQ ID NO:547-562、SEQ ID NO:663-667、SEQ ID NO:670-1166、SEQ ID NO:1169-1529、SEQ ID NO:1532-1542、SEQ ID NO:1548、SEQID NO:3788-3823)或SEQ ID NO1637-1663。
[00069]本发明的一种非限制性实施方式提供了其中存储了指令的计算机可读介质,所述指令当执行时促使处理器进行鉴定病毒、生物体或恶性肿瘤的Replikin Peak基因的方法,该方法包括在所述病毒、生物体或恶性肿瘤的氨基酸序列或编码氨基酸序列的核酸序列中鉴定,与所述恶性肿瘤、生物体或病毒的基因组、或蛋白或蛋白片段的其它部分相比,由每100氨基酸最高数目的连续Replikin序列组成的所述病毒、所述生物体或所述恶性肿瘤的基因组、蛋白或蛋白片段的部分。
[00070]在一实施方式中,所述计算机可读介质包括当执行时促使处理器进行预测包含所述鉴定的Replikin Peak基因的所述病毒、生物体或恶性肿瘤的致死性或毒力的增加或包含所述鉴定的Replikin Peak基因的所述病毒或生物体的暴发的方法的指令,所述方法通过下列步骤进行:(1)确定所述Replikin Peak基因的Replikin计数或包括所述Replikin Peak基因的蛋白或基因区的Replikin计数高于在与所述病毒相同物种的至少一种其它病毒、与所述生物体相同物种的至少一种其它生物体或与所述恶性肿瘤相同类型的至少一种其它恶性肿瘤的基因组中或者蛋白或蛋白片段中鉴定的另一Replikin Peak基因或包括所述其它Replikin Peak基因的蛋白或基因区,其中所述其它病毒、所述其它生物体或所述其它恶性肿瘤在比所述病毒、所述生物体或所述恶性肿瘤更早的时间点分离,和(2)预测所述病毒、生物体或恶性肿瘤的致死性或毒力的增加或预测所述病毒或生物体(organsism)的暴发。
[00071]本发明还提供了一种预测病毒或生物体的暴发或致死性或毒力的增加的株、宿主或地理区域的方法,该方法通过以下步骤进行:(1)在第一株、来自第一宿主或分离自第一地理区域的第一病毒或生物体的基因组中或在第一病毒或生物体的蛋白或蛋白片段中鉴定具有比在与所述第一病毒相同物种的至少一种第二病毒或与所述第一生物体相同物种的至少一种第二生物体的基因组或蛋白或蛋白片段中鉴定的Replikin Peak基因或包括Replikin Peak基因的蛋白或基因区更高的Replikin计数的Replikin Peak基因或包括Replikin Peak基因的蛋白或基因区,其中所述第一病毒或所述第一生物体在比所述第一病毒或所述第一生物体更晚的时间点分离并与所述第一病毒或第一生物体是相同株、来自与所述第一病毒或第一生物体相同或另一宿主、或分离自与所述第一病毒或第一生物体相同或另一地理区域,和(2)预测所述第一病毒或生物体的所述第一株、在所述第一宿主或在所述第一地理区域中的暴发或致死性或毒力的增加。
[00072]在一实施方式中,包括第一病毒或生物体的基因组中的所述Replikin Peak基因的所述蛋白或基因区鉴定为具有比包括所述至少一种第二病毒或生物体的基因组或蛋白或蛋白片段中鉴定的Replikin Peak基因的所述蛋白或基因区更高的Replikin计数。
[00073]在另一实施方式中,所述第一病毒或所述第一生物体比所述第二生物体或所述第二病毒晚分离至少六个月至三年。在一具体实施方式中,所述第一生物体或第一病毒是结核分枝杆菌、产粘液分枝杆菌、金黄色葡萄球菌、和恶性疟原虫、流感病毒、口蹄疫病毒、西尼罗病毒、猪生殖和呼吸综合征病毒、猪圆环病毒、白斑综合征病毒、桃拉综合征病毒、冠状病毒、埃博拉病毒、番茄植物中的双生曲叶病毒、出血性败血病病毒或烟草花叶病毒。在另一实施方式中,所述金黄色葡萄球菌是耐受甲氧苯青霉素的。
[00074]在进一步的实施方式中,所述流感病毒是甲型流感病毒株。在一具体实施方式中,所述第一病毒是株H1N1、H2N2、H3N2、H5N1或H3N8的流感病毒。
[00075]在本发明的进一步实施方式中,包括所述Replikin Peak基因的所述蛋白或基因区是流感病毒的pB1基因区。
[00076]在又一实施方式中,所述蛋白或基因区是猪呼吸和生殖综合征病毒的核壳体蛋白。
[00077]在进一步的实施方式中,所述蛋白或基因区是西尼罗病毒的包膜蛋白。
[00078]在进一步的实施方式中,所述蛋白或基因区是口蹄疫病毒的VP1蛋白。
[00079]在又一实施方式中,所述蛋白或基因区是恶性疟原虫的腺苷三磷酸酶。
[00080]在又进一步的实施方式中,所述蛋白或基因区是猪圆环病毒的复制酶蛋白。
[00081]在另一实施方式中,所述蛋白或基因区是所述白斑综合征病毒的核糖核苷酸酶(ribonucleotidease)。
[00082]本发明进一步提供了一种鉴定伴有比与第一病毒相同物种的第二病毒、与第一生物体相同物种的第二生物体或与第一恶性肿瘤相同类型的第二恶性肿瘤更高致死性、更高毒力或更快速复制的第一病毒、生物体或恶性肿瘤的方法,该方法包括鉴定比第二病毒的至少一种毒粒、或第二生物体的至少一种细胞、或第二恶性肿瘤的至少一种恶性细胞的基因组中或第二病毒的至少一种毒粒、或第二生物体的至少一种细胞、或第二恶性肿瘤的至少一种恶性细胞的蛋白或蛋白片段中编码的已鉴定的ReplikinPeak基因具有更高Replikin计数的第一病毒的至少一种毒粒、或第一生物体的至少一种细胞、或第一恶性肿瘤的至少一种恶性细胞的基因组中或第一病毒的至少一种毒粒、或第一生物体的至少一种细胞、或第一恶性肿瘤的至少一种恶性细胞的蛋白或蛋白片段中编码的Replikin Peak基因,其中所述第一病毒、第一生物体或第一恶性肿瘤比所述第二病毒、第二生物体或第二恶性肿瘤具有更高致死性、更高毒力、或更快速复制,且其中所述Replikin Peak基因定义为与相同的病毒毒粒、相同的生物体细胞、或相同恶性细胞的其余蛋白或蛋白片段相比具有每100氨基酸最高浓度的连续Replikin序列的蛋白或蛋白片段,或编码所述蛋白或蛋白片段的基因组部分。
[00083]进一步提供了一种鉴定具有比至少一种与第一病毒相同物种的第二病毒、与第一生物体相同物种的第二生物体或与第一恶性肿瘤相同种类的第二恶性肿瘤更高致死性的第一病毒、第一生物体或第一恶性肿瘤的方法,该方法包括比较病毒、生物体或恶性肿瘤的全基因组的Replikin计数与至少一种第二病毒、第二生物体或第二恶性肿瘤的全基因组的Replikin计数以确定具有更高Replikin计数的病毒、生物体或恶性肿瘤具有更高致死性。
[00084]根据一具体实施方式,所述第一病毒是冠状病毒、口蹄疫病毒、白斑综合征病毒、桃拉综合征病毒、猪圆环病毒或流感病毒。
[00085]在一具体实施方式中,所述第一病毒是流感病毒的H5N1株。
[00086]在另一具体实施方式中,所述流感病毒是甲型流感病毒。在一进一步的具体实施方式中,所述甲型流感病毒是H1N1、H2N2、H3N2、H5N1或H3N8。
[00087]根据另一实施方式,所述Replikin Peak基因分离自流感病毒的pB1基因区。
[00088]本发明还提供了一种获得病毒、生物体或恶性肿瘤的分离的或合成的Replikin Peak基因的方法,所述病毒、生物体或恶性肿瘤的分离的或合成的Replikin Peak基因用于诊断、预防或治疗所述病毒或所述生物体感染或诊断、预防或治疗所述恶性肿瘤,所述方法包括:(1)获得相同物种的复数种病毒分离株、相同物种的复数种生物体、或相同类型的复数种恶性肿瘤;(2)分析所述复数种病毒分离株的每种单独分离株、所述复数种生物体的每种单独生物体的细胞、或所述复数种恶性肿瘤的每种单独恶性肿瘤的恶性细胞的蛋白序列或蛋白序列片段中Replikin序列的存在和浓度;(3)鉴定每种单独恶性肿瘤的恶性细胞、每种单独生物体的细胞或每种单独病毒分离株中具有最高浓度的连续Replikin序列的蛋白序列或蛋白序列片段;(4)在所述复数种病毒分离株、所述复数种生物体或所述复数种恶性肿瘤中选择具有最高浓度的连续Replikin序列的蛋白序列或蛋白序列片段;(5)鉴定所选的蛋白序列或蛋白序列片段的氨基酸序列为所述复数种病毒分离株、生物体或恶性肿瘤的Replikin Peak基因;和(6)分离或合成至少一种所述复数种病毒分离株、生物体或恶性肿瘤的鉴定的Replikin Peak基因,其中所分离的或合成的鉴定的Replikin Peak基因用于诊断、预防或治疗所述病毒或所述生物体的所述感染或所述恶性肿瘤。
[00089]进一步提供了一种免疫原性组合物,其包括至少一种根据上述方法分离的分离或合成的Replikin Peak基因。在一具体实施方式中,所述免疫原性组合物分离自病毒或生物体的新出现株,且任选地进一步包括药学上可接受的载体。
[00090]本发明还提供了一种疫苗,其包括至少一种分离的或合成的Replikin Peak基因。在一具体实施方式中,所述疫苗包括分离自病毒或生物体的新出现株的Replikin Peak基因。在另一具体实施方式中,所述疫苗包括SEQ ID NO:1741、SEQ ID NO:3664、SEQ ID NO:3660、SEQ IDNO:3665、SEQ ID NO:1996、SEQ ID NO:1665、SEQ ID NO:1684、SEQ ID NO:1701、SEQ ID NO:546、SEQ ID NO:124、SEQ ID NO:130、SEQ ID NO:311、SEQ ID NO:341-344、SEQ ID NO:286、SEQ IDNO:287、SEQ ID NO:288、SEQ ID NO:289、SEQ ID NO:290、SEQID NO:233-238、SEQ ID NO:415、SEQ ID NO:421、SEQ ID NO:438、SEQ ID NO:451、SEQ ID NO:462、SEQ ID NO:498、SEQ ID NO:669、SEQ ID NO:1168、SEQ ID NO:1531、SEQ ID NO:1548、SEQ ID NO:3787的第81-204位或SEQ ID NO:1939。
[00091]在又进一步的实施方式中,所述疫苗包括分离自病毒的Replikin Peak基因。
[00092]在一具体实施方式中,所述病毒是流感病毒、口蹄疫病毒、西尼罗病毒、猪生殖和呼吸综合征病毒、猪圆环病毒、白斑综合征病毒、桃拉综合征病毒、冠状病毒、埃博拉病毒、双生曲叶病毒、出血性败血病病毒或烟草花叶病毒。
[00093]在一实施方式中,所述疫苗中的Replikin Peak基因分离自甲型流感,或具体地分离自株H1N1、H2N2、H3N2、H5N1或H3N8。
[00094]在另一实施方式中,所述疫苗包括分离自生物体的ReplikinPeak基因。
[00095]在进一步的实施方式中,Replikin Peak基因分离自结核分枝杆菌、产粘液分枝杆菌、金黄色葡萄球菌或恶性疟原虫。在一具体实施方式中,所述金黄色葡萄球菌是耐受甲氧苯青霉素的。
[00096]在又一实施方式中,所述Replikin Peak基因分离自恶性肿瘤。
[00097]在一具体实施方式中,所述Replikin Peak基因分离自肺恶性肿瘤、脑恶性肿瘤、乳腺恶性肿瘤或淋巴恶性肿瘤。在另一实施方式中,所述Replikin Peak基因分离自非小细胞肺癌。在进一步的实施方式中,所述Replikin Peak基因分离自多形性成胶质细胞瘤。
[00098]本发明进一步提供了一种免疫原性组合物,其包括ReplikinPeak基因,任选地联合药学上可接受的载体。在一实施方式中,所述免疫原性组合物包括SEQ ID NO:1741、SEQ ID NO:3664、SEQ ID NO:3660、SEQ ID NO:3665、SEQ ID NO:1996、SEQ ID NO:1665、SEQ ID NO:1684、SEQ ID NO:1701、SEQ ID NO:546、SEQ ID NO:124、SEQ ID NO:130、SEQ ID NO:311、SEQ ID NO:341-344、SEQ ID NO:286、SEQ IDNO:287、SEQ ID NO:288、SEQ ID NO:289、SEQ ID NO:290、SEQID NO:233-238、SEQ ID NO:415、SEQ ID NO:421、SEQ ID NO:438、SEQ ID NO:451、SEQ ID NO:462、SEQ ID NO:498、SEQ ID NO:669、SEQ ID NO:1168、SEQ ID NO:1531、SEQ ID NO:1548或SEQ ID NO:1939。
[00099]本发明进一步提供了一种分离的或合成的Replikin序列,其分离自Replikin Peak基因的蛋白或蛋白片段或分离自包括Replikin Peak基因的蛋白。
[000100]在一实施方式中,所述Replikin序列来自分离自结核分枝杆菌、产粘液分枝杆菌、金黄色葡萄球菌或恶性疟原虫的Replikin Peak基因。在一具体实施方式中,所述Replikin序列来自分离自产粘液分枝杆菌的Replikin Peak基因。在进一步的实施方式中,所述Replikin Peak基因是SEQ ID NO:2902-2925。在另一具体实施方式中,所述Replikin序列来自分离自恶性疟原虫的Replikin Peak基因。在进一步的实施方式中,所述Replikin Peak基因是SEQ ID NO:2312-2544、SEQ ID NO:2701-2711、SEQ ID NO:2713-2718、SEQ ID NO:3282-3285、3287-3291、3293、3295、3297、3299、3300、3302、3304、3306或SEQ ID NO:3308之一。
[000101]在另一实施方式中,所述Replikin序列来自分离自流感病毒、口蹄疫病毒、西尼罗病毒、猪生殖和呼吸综合征病毒、猪圆环病毒、白斑综合征病毒、桃拉综合征病毒、冠状病毒、埃博拉病毒、双生曲叶病毒、出血性败血病病毒或烟草花叶病毒的Replikin Peak基因。
[000102]在一具体实施方式中,所述流感病毒是甲型流感病毒。在另一具体实施方式中,所述甲型流感病毒是H1N1、H2N2、H3N2、H5N1或H3N8。在一进一步的具体实施方式中,所述甲型流感病毒是H5N1且所述Replikin序列是SEQ ID NO:1685-1691、SEQ ID NO:1702-1716或SEQ IDNO:1717之一。在一进一步的具体实施方式中,所述甲型流感病毒是H3N8且所述Replikin序列是SEQ ID NO:547-561或SEQ ID NO:562之一。
[000103]在另一实施方式中,所述Replikin序列来自分离自口蹄疫病毒的Replikin Peak基因。在一具体实施方式中,来自口蹄疫病毒的Replikin序列是SEQ ID NO:106、SEQ ID NO:112、SEQ ID NO:113、SEQ ID NO:125-129、SEQ ID NO:131-155或SEQ ID NO:156之一。
[000104]在又一实施方式中,所述Replikin序列来自分离自西尼罗病毒的Replikin Peak基因。在一具体实施方式中,来自西尼罗病毒的Replikin序列是SEQ ID NO:233-243或SEQ ID NO:244之一。
[000105]在进一步的实施方式中,所述Replikin序列来自分离自猪生殖和呼吸病毒的Replikin Peak基因。在一具体实施方式中,来自猪生殖和呼吸病毒的Replikin序列是SEQ ID NO:286-290、SEQ ID NO:312-323、SEQ ID NO:354-366、SEQ ID NO:368-380、SEQ ID NO:383-393、SEQID NO:395-401、SEQ ID NO:403-413或SEQ ID NO:414之一。
[000106]在另一实施方式中,所述Replikin序列来自分离自猪圆环病毒的Replikin Peak基因。在一具体实施方式,来自猪圆环病毒的Replikin序列是SEQ ID NO:291-307、SEQ ID NO:308-310、SEQ ID NO:324-327、SEQ ID NO:328-340、SEQ ID NO:416-419、SEQ ID NO:422-437、SEQID NO:440-445、SEQ ID NO:452-457、SEQ ID NO:464-476、SEQ ID NO:482-484、SEQ ID NO:487-491或SEQ ID NO:492之一。
[000107]在又进一步的实施方式中,所述Replikin序列来自分离自白斑综合征病毒的Replikin Peak基因。在一具体实施方式中,来自白斑综合征病毒的Replikin序列是SEQ ID NO:663-667、SEQ ID NO:670-1166、SEQ ID NO:1169-1529、SEQ ID NO:1532-1542和SEQ ID NO:1548之一。
[000108]根据本发明提供了一种用于预防和/或治疗病毒或生物体感染或恶性肿瘤的疫苗,其中所述疫苗包括于Replikin Peak基因的蛋白或蛋白片段中或于包含Replikin Peak基因的蛋白中的至少一种分离的或合成的Replikin序列,所述Replikin Peak基因在所述病毒、生物体或恶性肿瘤中鉴定。
[000109]在进一步的实施方式中,所述疫苗中所述至少一种分离的或合成的Replikin序列是SEQ ID NO:2902-2925、SEQ ID NO:2312-2544、SEQ ID NO:2701-2711、2713-2718、SEQ ID NO:3282-3285、3287-3291、3293、3295、3297、3299、3300、3302、3304、3306、3308、SEQ ID NO:1685-1691、SEQ ID NO:1702-1717、SEQ ID NO:547-562、SEQ ID NO:106、SEQ ID NO:112、SEQ ID NO:113、SEQ ID NO:125-129、和SEQID NO:131-156、SEQ ID NO:233-244、SEQ ID NO:286-290、SEQ ID NO:312-323、SEQ ID NO:354-366、SEQ ID NO:368-380、SEQ ID NO:383-393、SEQ ID NO:395-401、SEQ ID NO:403-414、SEQ ID NO:291-307、SEQID NO:308-310、SEQ ID NO:324-327、SEQ ID NO:328-340、SEQ ID NO:416-419、SEQ ID NO:422-437、SEQ ID NO:440-445、SEQ ID NO:452-457、SEQ ID NO:464-476、SEQ ID NO:482-484、SEQ ID NO:487-492、SEQID NO:663-667、SEQ ID NO:670-1166、SEQ ID NO:1169-1529、SEQ IDNO:1532-1542、SEQ ID NO:1548、SEQ ID NO:1637-1662或SEQ ID NO:1663之一。
[000110]在一实施方式中,所述疫苗用于预防和/或治疗病毒感染。在一具体实施方式中,所述疫苗用于由流感病毒、口蹄疫病毒、西尼罗病毒、猪生殖和呼吸综合征病毒、猪圆环病毒、白斑综合征病毒、桃拉综合征病毒、冠状病毒、埃博拉病毒、双生曲叶病毒、出血性败血病病毒或烟草花叶病毒引起的病毒感染。
[000111]在另一具体实施方式中,所述流感病毒是甲型流感病毒。在一进一步的具体实施方式中,所述甲型流感病毒是H1N1、H2N2、H3N2、H5N1或H3N8甲型流感病毒。
[000112]在另一具体实施方式中,所述病毒是出血性败血病病毒。
[000113]在另一实施方式中,所述疫苗用于预防和/或治疗生物体感染。
[000114]在一具体实施方式中,所述生物体感染是由产粘液分枝杆菌、结核分枝杆菌、金黄色葡萄球菌或恶性疟原虫引起的。在一进一步的具体实施方式中,所述金黄色葡萄球菌是耐受甲氧苯青霉素的。
[000115]在另一实施方式中,所述疫苗用于预防恶性肿瘤。
[000116]在一具体实施方式中,所述恶性肿瘤是肺恶性肿瘤、脑恶性肿瘤、乳腺恶性肿瘤、卵巢恶性肿瘤或淋巴恶性肿瘤。在一进一步的具体实施方式中,所述恶性肿瘤是非小细胞肺癌或多形性成胶质细胞瘤。
[000117]本发明还提供了一种免疫原性化合物,其包括于ReplikinPeak基因的蛋白或蛋白片段中的或于包括Replikin Peak基因的蛋白中的至少一种分离的或合成的Replikin序列,任选地进一步包括药学上可接受的载体,其中所述Replikin Peak基因在病毒、生物体或恶性肿瘤中鉴定。
[000118]另一方面,本发明提供了一种刺激免疫系统的方法,该方法包括向动物施用在Replikin Peak基因的蛋白或蛋白片段中或在包括Replikin Peak基因的蛋白或基因区中鉴定的至少一种分离的或合成的Replikin序列,所述Replikin Peak基因是在病毒、生物体或恶性肿瘤中鉴定的。在一具体实施方式中,所述动物是人类。
[000119]本发明进一步提供了一种抗体,其针对Replikin Peak基因的蛋白或蛋白片段中或包括Replikin Peak基因的蛋白或基因区中的至少一种分离的或合成的Replikin序列。
[000120]本发明还提供了一种鉴定恶性肿瘤、生物体或病毒的致死株的方法,该方法包括:(1)获得所述恶性肿瘤、生物体或病毒的复数个分离株;(2)鉴定所述恶性肿瘤、生物体或病毒的所述复数个分离株的每个分离株的Replikin Peak基因;(3)分析所述复数个分离株的每个分离株的Replikin Peak基因的蛋白或蛋白片段的氨基酸序列中Replikin序列的存在和浓度;(4)比较所述复数个分离株的每个分离株的Replikin Peak基因的每个蛋白或蛋白片段中Replikin序列的浓度与所述复数个分离株的每个其它分离株的Replikin Peak基因的每个蛋白或蛋白片段中Replikin序列的浓度;和(5)鉴定在Replikin Peak基因的蛋白或蛋白片段中具有最高浓度的连续Replikin序列的分离株为所述恶性肿瘤、生物体或病毒的毒性或致死株。
[000121]进一步提供了一种从恶性肿瘤、生物体或病毒选择用于包含于针对恶性肿瘤、生物体或病毒的预防性或治疗性疫苗或免疫原性化合物中的肽的方法,该方法包括鉴定所述恶性肿瘤、生物体或病毒的至少两个分离株之间其他方面保守的Replikin序列或Replikin Peak基因的至少一个氨基酸序列差异,将所鉴定的至少一个氨基酸序列差异与所述至少两个分离株的最高毒力、发病率或宿主死亡率相关联,和选择具有所鉴定的至少一个氨基酸序列差异的其他方面保守的Replikin序列、Replikin Peak基因或Replikin Peak基因中的Replikin序列作为用于包含于预防性或治疗性疫苗或免疫原性化合物中的肽。
[000122]在一实施方式中,该方法进一步包括预测包含具有所述至少一种氨基酸序列差异的所选的保守Replikin序列或Replikin Peak基因的分离株为所述恶性肿瘤、生物体或病毒的致死分离株。
[000123]在一具体实施方式中,所述恶性肿瘤、生物体或病毒是恶性肿瘤。
[000124]在另一具体实施方式中,所述恶性肿瘤是肺恶性肿瘤、脑恶性肿瘤、乳腺恶性肿瘤或淋巴恶性肿瘤。在一进一步的具体实施方式中,所述恶性肿瘤是非小细胞肺癌或多形性成胶质细胞瘤。
[000125]在另一方面,所述恶性肿瘤、生物体或病毒是生物体。
[000126]在第一具体实施方式中,所述生物体是结核分枝杆菌、产粘液分枝杆菌、金黄色葡萄球菌或恶性疟原虫。在另一具体实施方式中,所述金黄色葡萄球菌是耐受甲氧苯青霉素的。
[000127]在另一方面,所述恶性肿瘤、生物体或病毒是病毒。
[000128]在一具体实施方式中,所述病毒是流感病毒、口蹄疫病毒、西尼罗病毒、猪生殖和呼吸综合征病毒、猪圆环病毒、白斑综合征病毒、桃拉综合征病毒、冠状病毒、埃博拉病毒、双生曲叶病毒、出血性败血病病毒或烟草花叶病毒。
[00129]本发明进一步提供了一种确定肺恶性肿瘤病例的来源的方法,该方法包括鉴定肺癌细胞的Replikin Peak基因中还存在于烟草花叶病毒的分离株的Replikin Peak基因中的至少一种肽,其中所述肽与所述肺恶性肿瘤的来源有关联。
[000130]在一实施方式中,复数种肽鉴定于肺癌细胞的Replikin Peak基因中,其中所述复数种肽的每一个还鉴定于烟草花叶病毒的分离株的Replikin Peak基因中。
[000131]在另一实施方式中,肺癌细胞的Replikin Peak基因中的所述至少一种肽和烟草花叶病毒的分离株的Replikin Peak基因中的所述至少一种肽是包含至少两个赖氨酸和至少一个组氨酸的约10个或更少氨基酸的肽。
[000132]在进一步的实施方式中,肺癌细胞的Replikin Peak基因中的所述至少一种肽和烟草花叶病毒的分离株的Replikin Peak基因中的所述至少一种肽是包含至少三个赖氨酸和至少一个组氨酸的约10个或更少氨基酸的肽。
[000133]在又一实施方式中,肺癌细胞的Replikin Peak基因中的所述至少一种肽和烟草花叶病毒的分离株的Replikin Peak基因中的所述至少一种肽是包含至少三个赖氨酸和至少一个组氨酸的约7个或更少的氨基酸。
[000134]在进一步的实施方式中,肺癌细胞的Replikin Peak基因中的所述至少一种肽和烟草花叶病毒的分离株的Replikin Peak基因中的所述至少一种肽是包含三个赖氨酸和一个组氨酸的约4个氨基酸。
[000135]在一具体实施方式中,肺癌细胞的Replikin Peak基因中的和烟草花叶病毒的分离株的Replikin Peak基因中的所述至少一种肽是KHKK(SEQ ID NO:1584)。
[000136]在另一实施方式中,多于一个KHKK(SEQ ID NO:1584)肽鉴定于肺癌细胞的Replikin Peak基因中和烟草花叶病毒的分离株的Replikin Peak基因中。
[000137]在一具体实施方式中,至少10个KHKK(SEQ ID NO:1584)肽鉴定于肺癌细胞的Replikin Peak基因中且至少10个KHKK(SEQ IDNO:1584)肽鉴定于烟草花叶病毒的分离株的Replikin Peak基因中。
[000138]在另一具体实施方式中,至少20个KHKK(SEQ ID NO:1584)肽鉴定于肺癌细胞的Replikin Peak基因中且至少20个KHKK(SEQ IDNO:1584)肽鉴定于烟草花叶病毒的分离株的Replikin Peak基因中。
[000139]在第三具体实施方式中,至少30个KHKK(SEQ ID NO:1584)肽鉴定于肺癌细胞的Replikin Peak基因中且至少30个KHKK(SEQ IDNO:1584)肽鉴定于烟草花叶病毒的分离株的Replikin Peak基因中。
[000140]在第四具体实施方式中,至少50个KHKK(SEQ ID NO:1584)肽鉴定于肺癌细胞的Replikin Peak基因中且至少50个KHKK(SEQ IDNO:1584)肽鉴定于烟草花叶病毒的分离株的Replikin Peak基因中。
[000141]本发明进一步提供了一种鉴定与第二例肺恶性肿瘤相比具有更高的复制速率、侵袭性生长模式或致死性的第一例肺恶性肿瘤的方法,该方法包括鉴定Replikin Peak基因中Replikin计数高于第二例肺恶性肿瘤的恶性细胞中鉴定的Replikin Peak基因的第一例肺恶性肿瘤的恶性细胞的Replikin Peak基因。
[000142]在一实施方式中,所述第一例和第二例肺恶性肿瘤是非小细胞肺恶性肿瘤。
[000143]进一步提供了一种用于诊断、预防或治疗肺癌的肺恶性肿瘤中的分离的或合成的Replikin Peak基因,通过包括下列步骤的方法提供:(1)从肺恶性肿瘤获得至少一种恶性细胞;(2)分析所述至少一种恶性细胞的蛋白序列或蛋白序列片段中Replikin序列的存在和浓度;(3)鉴定所述至少一种恶性细胞中具有最高浓度的连续Replikin序列的蛋白序列或蛋白序列片段;(4)选择具有最高浓度的连续Replikin序列的蛋白序列或蛋白序列片段;(5)鉴定所选的蛋白序列或蛋白序列片段的氨基酸序列为Replikin Peak基因;和(6)分离或合成所述至少一种恶性细胞的已鉴定的Replikin Peak基因,其中所分离的或合成的已鉴定的Replikin Peak基因用于诊断、预防或治疗肺癌。在一方面,所述肺恶性肿瘤是非小细胞肺恶性肿瘤。
[000144]在另一方面,已鉴定的Replikin Peak基因的蛋白或蛋白片段中的至少一种分离的或合成的Replikin序列用于诊断、预防或治疗肺癌。
[000145]在一具体实施方式中,已鉴定的Replikin Peak基因的蛋白或蛋白片段中的所述至少一种分离的或合成的Replikin序列是SEQ IDNO:1636的SEQ ID NO:1585-1635之一。
[000146]本发明还提供了一种用于预防和治疗肺癌的免疫原性组合物,其中所述免疫原性组合物包括已鉴定的Replikin Peak基因的蛋白或蛋白片段中的至少一种分离的或合成的Replikin序列。
[000147]还提供了一种刺激免疫系统的方法,该方法包括向动物施用用于预防、治疗或诊断动物肺癌的肺恶性肿瘤的Replikin Peak基因中鉴定的至少一种分离的或合成的Replikin序列。在一具体实施方式中,所述动物是人类。
[000148]在另一实施方式中,本发明提供了一种鉴定致死性肺癌形式的方法,该方法包括:(1)从复数种肺肿瘤获得至少一种恶性细胞;(2)在所述复数种肺肿瘤的每一种的至少一种恶性细胞中鉴定Replikin Peak基因;(3)分析所述复数种肺肿瘤的每一种的至少一种恶性细胞中的ReplikinPeak基因的蛋白或蛋白片段的氨基酸序列中Replikin序列的存在和浓度;(4)比较所述复数种肺肿瘤的每一种的至少一种恶性细胞中的ReplikinPeak基因的每种蛋白或蛋白片段中Replikin序列的浓度;和(5)鉴定在Replikin Peak基因的蛋白或蛋白片段中具有最高浓度的连续Replikin序列的肺肿瘤为致死性肺癌形式。
[000149]在进一步的实施方式中,本发明提供了一种鉴定至少两种肺癌中更具致死性的肺癌形式的方法,该方法包括:(1)从至少两种肺癌的每种获得至少一种恶性细胞;(2)在所述至少两种肺癌的每一种的至少一种恶性细胞中鉴定Replikin Peak基因;(3)分析所述至少两种肺癌的每一种的至少一种恶性细胞中的Replikin Peak基因的蛋白或蛋白片段的氨基酸序列中Replikin序列的存在和浓度;(4)比较所述至少两种肺癌的每一种的至少一种恶性细胞中的Replikin Peak基因的每种蛋白或蛋白片段中Replikin序列的浓度;和(5)鉴定在Replikin Peak基因的蛋白或蛋白片段中具有最高浓度的连续Replikin序列的肺癌为更具致死性的肺癌形式。
[000150]本发明还提供了一种确定病毒或生物体的致死性或毒力的预期增加的方法,该方法包括:(1)获得所述病毒或生物体的复数个分离株,其中每个分离株在已知时间段内分离,且其中至少两个所述分离株比至少两个其它所述分离株晚分离约六个月至约5年;(2)鉴定所述复数个分离株的每个分离株中的Replikin Peak基因;(3)分析所述复数个分离株的每个分离株的所鉴定的Replikin Peak基因以确定所述复数个分离株的每个分离株中的每个Replikin Peak基因的Replikin计数,或分析所述复数个分离株的每个分离株的包含所鉴定的Replikin Peak基因的蛋白、蛋白片段或基因区以确定所述复数个分离株的蛋白、蛋白片段或基因区的Replikin计数;(4)确定每个已知时间段Replikin Peak基因内或包含所述鉴定的Replikin Peak基因的蛋白、蛋白片段或基因区内的平均Replikin计数;(5)相互比较每个已知时间段Replikin Peak基因内或所述蛋白、蛋白片段或基因区内的平均Replikin计数;(6)鉴定至少两个已知时间段之间平均Replikin计数的增加;和(7)根据所述鉴定的平均Replikin计数的增加鉴定所述病毒或生物体的致死性或毒力在约六个月至约三年内的预期增加。
[000151]在一具体实施方式中,所述已知时间段是约1年。在另一具体实施方式中,平均Replikin计数的所述增加在一年内发生。在一进一步的具体实施方式中,平均Replikin计数的所述增加在三年内发生。在另一实施方式中,平均Replikin计数的所述增加在至少两个已知时间段之间是显著的。在进一步的实施方式中,平均Replikin计数的所述增加的显著性为p=<0.001。
附图简述
[00152]图1说明pB1基因区作为流感病毒H5N1株基因组中ReplikinPeak基因的定位。Replikin Peak基因是基因组中Replikin序列连续和最集中的位置。pB1基因区包括H5N1基因组中的Replikin Peak基因且pB1基因区的Replikin计数与毒力和死亡率增加关联。深灰色条柱代表在指定年份分离的H5N1病毒分离株中指定基因区的平均Replikin计数。浅灰色条柱代表指定年份的分离株群体中平均值的标准差。平均值的标准差显示为平均值上方的浅灰色条柱,而不是常用的‘T’符号。这种方式用于强调关于Replikin计数的不同扩大病毒群体。通过分析指定年份的分离株的人类H5N1流感病毒的八个基因组区的每一个中观察到的Replikin序列数目,分别确定具有在pubmed.com公众可得的遗传信息的2003至2006年分离的H5N1病毒分离株的Replikin计数。已经鉴定的八个基因组区是核壳体、基质、pB2、神经氨酸酶、pA、NS、血凝素和pB1基因区。
[000153]图2说明自从1918年以来每次甲型流感大流行和暴发之前和相伴的Replikin计数增加,和甲型流感感染的静止期和持续地在非致死乙型流感期间低Replikin计数。该图提供从1917-2007年具有在PubMed公众可得的氨基酸或核酸序列的流感株pB1基因区中计算机分离的所有Replikin Peak基因的每年Replikin计数。提供对于如下的数据:(1)1940至2007年非致死人类乙型流感(粗虚的中度灰色线)和(2)1917至2007年人类甲型流感病毒的致死和非致死期。人类甲型流感株是(1)H1N1(粗中度灰色线)、(2)H2N2(细浅灰色线)、(3)H3N2(细中度灰色线)和(4)H5N1(细深灰色线)。分离自鸡的H5N1株以粗中度灰色线表示。分析数据的序列总数目(N)是14,227。列出的大流行、流行和暴发是1918年H1N1大流行、1930年代的H1N1流行、1957年H2N2大流行、1968年H3N1大流行、1977-78年H3N2暴发和1997、2001-2004和2007年H5N1暴发。在九十年期间,大流行、流行和暴发与流感株的RPG中四或更高的Replikin计数相关。经过同样时期,甲型流感感染的静止非致死期期间可观察到少于四的不变的低Replikin计数和在非致死乙型流感可观察到少于四的低Replikin计数。
[000154]图3说明1930至2007年流感病毒的连续“新出现的”株。提供每年分离的不同流感株的聚合酶区(标为圆圈)、pB1区(标为三角)和pB1-F2区(标为方块)的平均Replikin计数。H1N1和H3N2的数据持续至2007年。缺口代表PubMed上对这些基因组区无可得数据的年份。就在开始于1930年代的H1N1反弹流行暴发前、分别发生在1957和1968年的H2N2和H2N3大流行暴发前、和1997至2007年的H5N1暴发前可观察到Replikin计数的明显增加。Replikin计数的最大增加可在基因组的pB1-F2区观察到,该区包含在基因组的pB1区内。Replikin计数的次最大增加可在基因组的pB1区观察到,该区包含在基因组的聚合酶区内。Replikin计数的最小增加可在基因组的聚合酶区观察到。因此可观察到,pB1区内测量的与聚合酶区相比和pB1-F2区内测量的与pB1区相比,Replikin计数变得放大。
[000155]图4说明在2003至2007年在人类H5N1感染病例人类H5N1中的Replikin Peak基因pB1基因区的Replikin计数与人类死亡率百分比之间的关系。观察到H5N1的pB1基因区中的Replikin计数增加与宿主中较高死亡率数量上相关。该图中,(1)浅灰色代表在指定年份全病毒分离株的平均Replikin计数,(2)中度灰色代表在指定年份人类H5N1的分离株的公众可得的序列中pB1区的平均Replikin计数,(3)无色条代表在指定年份Replikin计数平均值的标准差,和(4)黑色代表在指定年份鉴定的H5N1感染人类病例的死亡率百分比的十倍。
[000156]图5说明在2005至2007年与鹅、鸭和鸡中的H5N1相比人类中人类H5N1的上调。深灰色代表来自2001至2006年的分离株中来自鹅、鸭、鸡和人类的H5N1分离株的Replikin Peak基因pB1基因区的平均Replikin计数,其中数据可在www.pubmed.com公开获得。浅灰色代表平均值的标准差。
[000157]对各宿主组即鹅、鸭、鸡和人类的H5N1 Replikin Peak基因分别进行Replikin分析。在各宿主组观察到低于4的低水平Replikin计数直到2005-2006年。在2005-2006年,在亚洲国家流行开始增加。尽管在2006年鸭H5N1计数减少,但是在2006年鸡的H5N1计数持续增加。人类RPG活性在2005-2006年上调并超过鸡的RPG活性。Replikin计数增加从鸭到鸡再到人类的这种转变与流行病学关于病毒在宿主之间转移的顺序的证据一致。图5的H5N1分离株的Replikin Peak基因中的Replikin计数变化允许鉴定其中流感病毒株比其它宿主更具毒性的宿主。
[000158]图6说明通过测量在指定年份从不同地理区域分离的人类H5N1分离株中的平均Replikin计数,定位具有最高致死性的人类H5N1分离株。图6是条状图,描绘在2003至2006年在日本、俄罗斯、埃及、中国、越南、泰国和印度尼西亚的人类中每年鉴定的H5N1流感病毒株的pB1基因区(Replikin Peak基因)中每100氨基酸的Replikin数目(带有标准差)。
[000159]对各国的人类H5N1RPGs分别进行Replikin分析。结果显示为从2003-2006年每年在PubMed可得的所有数据的Replikin计数。在各宿主组观察到低于4的低水平Replikin计数直到2005-2006年,此时亚洲国家人类H5N1增加。人类RPG活性在2005-2006年在印度尼西亚最显著地上调。预测在2006年最可能第一个经历人类死亡率增加的国家是印度尼西亚。该预测在2007年被证明是正确的,其中印度尼西亚暴发中的人类发病和死亡的发生率异常高,并观察到人类向人类传播的可能证据。诸如图6的H5N1分离株的Replikin Peak基因中的Replikin计数变化允许鉴定其中流感病毒株比其它地理区域更具毒性的地理区域。
[000160]图7说明1977-2007年马流感的pB1、pB2和pA基因组区中鉴定的Replikin Peak基因的Replikin计数与由H3N8马流感造成的马脑炎流行之间的关系。系列1反映基因组pB1区的Replikin Peak基因中鉴定的平均Replikin计数。系列2反映pB1基因区中平均Replikin计数的标准差。系列3反映基因组中pB 1基因区相邻的pA基因区的Replikin Peak基因中鉴定的Replikin计数。系列4反映基因组中也与pB1基因区相邻的pB2基因区的Replikin Peak基因中鉴定的Replikin计数。在流行暴发前一至三年观察到pB1基因区中Replikin计数增加,而在pB2和pA基因区未观察到Replikin计数增加。
[000161]图8说明先于1997至2004年的三次“禽流感”流行的流感病毒H5N1株中全血凝素蛋白的Replikin浓度增加。对于H5N1流感,1995至1997年Replikin浓度(Replikin计数,平均值+/-SD)的株特异性增加先于香港1997年H5N1流行(E1);1999至2001年的增加先于2001年的流行(E2);和2002至2004年的增加先于2004年的流行(E3)。随着响应于香港的E1流行而大规模宰杀家禽,1999年发生下降。图8证实,尽管RPGs中的Replikin计数增加发生的范围是全蛋白或基因组中可观察到的增加的四至八倍(见例如,图1和图2),但是全蛋白或基因组Replikin计数的改变具有完全性的优点并可足够大以被检测,并是统计上显著的。
[000162]图9说明先于2003年SARS冠状病毒流行,刺突和核壳体冠状病毒蛋白中的Replikin计数增加。x-轴表示年份,y-轴表示Replikin计数。SARS暴发的出现和牵涉在暴发中的八个国家以圆锥形阴影区表示。实心黑色符号代表刺突冠状病毒蛋白的平均Replikin浓度,竖直黑色条代表平均值的标准差。
[000163]尽管在2003年第一次鉴定到SARS,但申请人想知道冠状病毒SARS株的出现是否已经由整组冠状病毒的活性预示。大流行前核壳体和刺突冠状病毒蛋白的增加与冠状病毒造成2003年第一次SARS出现的发现一致并可能作为其警示。可看出Replikin计数在1995和2002之间上升,与SARS冠状病毒暴发一致,该暴发出现在2002年末并持续到2003年。Replikin计数的下降正确地标志着SARS暴发的结束并已经开始回到其暴发出现时的暴发前水平。甲型流感流行和大流行结束时发生类似下降(图2)。然而还如图2所示,在2006和2007年的H5N1情形未发生该下降,因此可推测正在进行的H5N1暴发未结束。
[000164]图10说明恶性疟原虫导致的人类死亡率与恶性疟原虫腺苷三磷酸酶中的Replikin计数相关联。1990年代后期发生高的疟疾发病率和死亡率并被认为是由于微生物体的适应和抗疟疾药效力的降低。腺苷三磷酸酶是arteminisin治疗疟疾的主要靶。随着arteminisin使用增加和公共卫生措施的改进,从1998至2006年的发病率和死亡率降低。1997至1998年恶性疟原虫腺苷三磷酸酶的Replikin计数增加伴随着每250疟疾病例死亡数目的增加。恶性疟原虫腺苷三磷酸酶的Replikin计数减少伴随着1998至2006年死亡率的减少。1997至2006年每250病例的死亡率如下:1997年的死亡率是7.7;1998年的死亡率是6.6;1999年的死亡率是9.1;2000年的死亡率是10.5;2001年的死亡率是8.1;2002年的死亡率是9.9;2003年的死亡率是2.5;2004年的死亡率是4;2005年的死亡率是3.9;2006年的死亡率是2.6。死亡率是世界卫生组织公布的,见www.who.int。
[000165]图11说明在1969和2006之间的公众可得的口蹄疫病毒血清型-O的分离株的VP1蛋白(Replikin Peak基因)中观察到的Replikin计数与一些观察到的口蹄疫暴发之间的关系。标准差以平均Replikin计数之上的竖直浅灰色加帽的线(capped line)表示。注意到在欧洲和英国观察到的口蹄疫暴发包括1967、1981、2001和2007年在英国的暴发、1991和1993至1996年在波罗的海国家的暴发、和2000年在日本、韩国和希腊的暴发。1969至1978年Replikin计数从基线值的增加先于1979年以来的Replikin计数反复增加,这又先于1981至2007年口蹄疫暴发。
[000166]图12说明西尼罗病毒分离株的包膜蛋白中观察到的Replikin计数与人类总发病率和死亡率的关系。图12的数据包含在表10中。证实了包膜蛋白(病毒的包含RPG的蛋白)中的Replikin计数与发病率和死亡率之间的关联性。图12是比较以下的图:(1)1982年至2007年西尼罗病毒分离株的包膜蛋白的公众可得的序列的Replikin浓度(Replikin计数)(对各数据点带有标准差条),(2)疾病控制中心1999年至2007以每年为基础报道的美国总发病率(美国总发病率是y轴表示的值乘以100)、和(3)疾病控制中心1999年至2007年以每年为基础报道的美国WNV感染造成的总死亡率。
[000167]图13说明2004年至2007年的分离株中猪呼吸和生殖综合征病毒(PRRSV)的核壳体蛋白中的Replikin计数。平均Replikin计数显示为灰色柱体。平均值的标准差显示为无色柱体。在2004年至2007年观察到PRRSV核壳体蛋白的Replikin计数增加。该增加与PRRSV在中国的大暴发相关联。2005年平均值的标准差显著大于其它年份,证明在2005年发生Replikin计数的明显增加并测量为2006年平均Replikin计数的增加。2005年观察到的大标准差表示该类的更多成员具有Replikin计数增加。2005年的标准差是2006年和2007年平均值增加之前的早期警告。在图7可观察到类似现象。
[000168]图14说明用四种不同桃拉综合征病毒分离株攻击持续15天(除非第15天前发生100%死亡)凡纳滨对虾(Litopenaeus vannamei)的累计存活率与每个分离株的开放读码框1(ORF1)的Replikin浓度之间的关联性。分析来自伯利兹、泰国、夏威夷和委内瑞拉的TSV各分离株的基因组的ORF1翻译的氨基酸序列的Replikin计数。确定伯利兹分离株的Replikin计数为3.5,泰国分离株的为3.4,夏威夷分离株的为3.3和委内瑞拉分离株的为3.0。图A说明TSV的伯利兹分离株攻击的虾在三次试验中观察到的存活率百分比。一个试验中,第6天观察到全部死亡。在其它试验中,第11天观察到全部死亡。图B、C和D分别说明以泰国分离株、夏威夷分离株和委内瑞拉分离株攻击的虾观察到的存活率百分比,每个的三次试验都持续15天。在泰国分离株中,第15天观察到平均80%的死亡率。在夏威夷分离株中,第15天观察到平均78.3%的死亡率。在委内瑞拉分离株中,第15天观察到平均58.3%的死亡率。
[000169]图15A说明分别从伯利兹、泰国、夏威夷和委内瑞拉收集的桃拉综合征病毒(TSV)分离株中的Replikin计数与第一天至第三天开始的各TSV分离株攻击凡纳滨对虾达到50%死亡率的平均天数之间的直接连续关联性。每个分离株的Replikin浓度之间的统计差异是显著的,在p<0.001的水平。
[000170]图15B说明分别从伯利兹、泰国、夏威夷和委内瑞拉收集的桃拉综合征病毒(TSV)分离株中的Replikin计数与各TSV分离株攻击凡纳滨对虾15天后平均累计存活率之间的直接关联性。每个分离株的Replikin浓度之间的统计差异是显著的,在p<0.001的水平。
[000171]图16说明当观察pB1基因区(包含RPG)中Replikin浓度与H5N1病毒的聚合酶基因或全基因组比较时,Replikin计数增加对人类感染H5N1的死亡作用的放大。图16中,确立了人类死亡率与H5N1流感株的(1)全基因组中的平均Replikin序列浓度、(2)聚合酶基因中的平均Replikin序列浓度和(3)Replikin Peak基因(pB1基因区)中的平均Replikin序列浓度之间的关联性。与全基因组和聚合酶基因中的Replikin计数相比,观察到H5N1基因组的Replikin Peak基因(pB1基因区)中的Replikin浓度最显著地与人类死亡率相关联。
[000172]图17说明从2003至2007年第一季度的H5N1分离株的pB1基因区(Replikin Peak基因)中的Replikin浓度的显著的八倍增加(与人类宿主死亡率增加相关联),而pB1基因区的相邻基因区即pA基因区和pB2基因区中未观察到显著增加。图17图示地分别比较2005年至2007年第一季度H5N1感染的人类死亡率百分比与2003年至2007年第一季度分离的H5N1流感株的(1)pB1基因区、(2)pB2基因区和(3)pA基因区中的平均Replikin序列浓度。
[000173]图18说明在1995年和2007年之间分离的白斑综合征病毒(WSSV)的公众可得的氨基酸序列中观察到的Replikin序列的平均Replikin计数和标准差与2001年WSSV显著暴发之间的关联性。2000年非常高的Replikin浓度97.6预示2001年的暴发。而且,在2000年WSSV分离株的核糖核苷酸还原酶蛋白序列中观察到甚至更显著的Replikin浓度103.8,其中Replikin Peak基因鉴定为具有甚至更高的Replikin浓度110.7。
[000174]图19说明桃拉综合征病毒基因组中Replikin计数增加与虾的2000和2007年所述病毒暴发的关联性。发明人分析了在www.pubmed.com可得的桃拉综合征病毒肽序列的公众可得的序列中平均Replikin浓度。图19是比较在2000和2005之间公众可得的肽序列的每年平均Replikin浓度(带有标准差)和桃拉综合征病毒显著暴发的日期的图。在2000年和2007年注意到所述疾病的显著暴发。从图可观察到,病毒暴发发生在Replikin浓度增加之后。在2000年,TSV的Replikin计数为2.7。在2001和2004之间,TSV有低至0.7的较低平均Replikin计数,并且鉴定的Replikin骨架消失。在2005年Replikin骨架再次出现,赖氨酸和组氨酸增加,Replikin浓度相称的增加至1.8,随后是2006-2007年TSV暴发的增加。
[000175]图20说明上世纪三次流感大流行中的总血凝素Replikin计数。株特异性的高Replikin计数伴随着上世纪三次流感大流行中的每次:1918、1957和1968。在每种情形中,该峰后都是下降(可能由于宿主中的免疫力),随后是恢复和“反弹”流行。该概率很低,这些关联性是由于偶然性,因为它们对每种株是特异性的,对该世纪的三次大流行年的每次是特异性的,对每次大流行后的下降是特异性的,和对每次反弹流行是特异性的。实施例13提供在1918和2007年之间的公众可得的序列中分析血凝素Replikin计数的实例。
[000176]图21说明在1997和2007之间基于每年的基础在具有公众可得的登记号的猪圆环病毒(PCV)分离株中观察到的每年平均Replikin计数(对每个Replikin计数数据点带有标准差条),并证实从2000至2007年Replikin计数增加与报道的2000和2006年之间在加拿大发病率和死亡率增加和2007年在中国暴发之间的关联性。
发明详述
定义
[000177]本文所用的Replikin Peak基因(RPG)(或有时Replikin Peak基因区(Replikin Peak Gene Area)-RPGA)是指基因组区段、蛋白、蛋白区段或蛋白片段,其中表达的基因或基因区段当与基因组的其它区段或指名的(named)基因相比时具有最高浓度的连续、不中断和重叠Replikin序列(每100氨基酸的Replikin序列数目)。通常,包含具有最高浓度的连续Replikin序列的氨基酸部分的全蛋白或基因或基因区段还称为Replikin Peak基因。可在基因、基因区段、蛋白或蛋白片段中鉴定多于一种RPG。RPG可具有末端赖氨酸或末端组氨酸,双末端赖氨酸,或末端赖氨酸和末端组氨酸。为了诊断、治疗和预防目的,RPG可具有末端赖氨酸或末端组氨酸,双末端赖氨酸,或末端赖氨酸和末端组氨酸,或可同样地既不具有末端赖氨酸也不具有末端组氨酸,只要RPG的末端部分包含由Replikin序列的定义所定义的一个或复数个Replikin序列,即,具有约7至约50氨基酸的氨基酸序列,其包括:
(1)位于距离第二赖氨酸残基六到十个氨基酸残基处的至少一个赖氨酸残基;
(2)至少一个组氨酸残基;和
(3)至少6%赖氨酸残基。
进一步地,为了诊断、治疗、预防和预测目的,RPG可包括包含鉴定的RPG的蛋白或蛋白片段。例如,本文中RPG在H5N1的pB1基因区中鉴定。为了预测目的,RPG中的Replikin计数可用于追踪毒力和致死性的变化。同样地RPG可用作免疫原性化合物或疫苗。然而,此外,如本文描述的,包含但不限于具有最高浓度的连续、不中断和重叠Replikin序列的鉴定的RPG的流感株(如,例如,H5N1、H1N1和H3N8)的pB1基因区中的Replikin计数尤其可用于预测致死性和毒力变化。其中已经鉴定RPGs的蛋白中的Replikin计数的预测用途的其它实例是口蹄疫病毒的VP1蛋白、西尼罗病毒的包膜蛋白、和猪呼吸和生殖综合征病毒的核壳体蛋白,以及许多其它病毒和生物体。包含RPGs的全蛋白或蛋白片段同样地可用于诊断、治疗和预防目的,诸如例如,以包括在免疫原性化合物、疫苗中和用于生产治疗性或诊断性抗体。
[000178]本文所用的Replikin序列是具有约7至约50氨基酸的氨基酸序列,其包括:
(1)位于距离第二赖氨酸残基六到十个氨基酸残基处的至少一个赖氨酸残基;
(2)至少一个组氨酸残基;和
(3)至少6%赖氨酸残基。
[000179]Replikin序列可包括末端赖氨酸并可进一步包括末端赖氨酸或末端组氨酸。Replikin肽或Replikin蛋白是由Replikin序列组成的肽或蛋白。Replikin序列还可描述为约7至约50氨基酸的Replikin序列,其包括Replikin基序或由Replikin基序组成,其中所述Replikin基序包括:
(1)位于所述分离的流感病毒肽第一末端的至少一个赖氨酸残基和位于所述分离流感病毒肽的第二末端的至少一个赖氨酸残基或至少一个组氨酸残基;
(2)位于距离第二赖氨酸残基六到十个残基处的第一赖氨酸残基;
(3)至少一个组氨酸残基;和
(4)至少6%赖氨酸残基。
为了确定Replikin浓度的目的,Replikin序列必须在一末端具有赖氨酸残基并在另一末端具有赖氨酸或组氨酸残基。
[000180]术语“Replikin序列”还可指编码具有约7至约50氨基酸的氨基酸序列的核酸序列,所述氨基酸序列包括:
(1)位于距离第二赖氨酸残基六到十个氨基酸残基处的至少一个赖氨酸残基;
(2)至少一个组氨酸残基;和
(3)至少6%赖氨酸残基,
其中该氨基酸序列可包括末端赖氨酸并可进一步包括末端赖氨酸或末端组氨酸。
[000181]本文所用的“动物”包括哺乳动物,诸如人类。
[000182]本文所用的术语“肽”或“蛋白”是指两个或更多个氨基酸的化合物,其中一个氨基酸的羧基经由肽键连接于另一氨基酸的氨基。本文所用的“分离”或“合成”肽或其生物活性部分是指这样的肽:纯化后,基本上无所述肽所来源的细胞或组织源的细胞材料或其它污染蛋白或肽,或者当通过任何方法化学合成时基本上无化学前体或其它化学物质,或者当通过重组基因技术合成时基本上无污染肽,或已经计算机分离自公共或私人数据库或序列集合可得的核酸或氨基酸序列的蛋白或肽。“编码的”或“表达的”蛋白、蛋白序列、蛋白片段序列或肽序列是核酸序列编码的序列,该核酸序列以本领域普通技术人员现在或此后已知的任何密码子编码蛋白或肽序列的氨基酸。应注意的是,本领域熟知由于遗传密码的冗余,单独核苷酸可易于交换密码子并依然产生相同的氨基酸序列。如本领域技术人员将理解的,鉴定Replikin氨基酸序列的方法还包括鉴定编码Replikin氨基酸序列的核酸序列的方法,其中Replikin氨基酸序列由鉴定的核酸序列编码。
[000183]本文所用的“储库”是可与病毒、生物体或恶性肿瘤分享的Replikin序列的任何来源,包括病毒、生物体或恶性肿瘤的任何宿主,病毒、生物体或恶性肿瘤的宿主的任何食物来源,病毒、生物体或恶性肿瘤的任何载体,或其中病毒、生物体或恶性肿瘤的遗传信息可与储库的Replikin序列分享、混杂、混合、交换,或接近的任何物质。
[000184]本文所用的“不同时间段”或“不同时间点”是互相可区分的任何两个时间段或时间点。例如,2004年分离的病毒分离株与2005年分离的相同病毒的分离株是在不同时间段分离的。同样地,2004年五月分离的病毒分离株与2004年六月分离的相同病毒的分离株是在不同时间段分离的。当比较不同分离株的Replikin浓度时,优选使用可比较的时间段来比较。例如,2004年的分离株优选地与一些其它年份诸如2002或2005年的至少一个其它分离株相比。同样地,2004年五月的分离株优选地与一些年份的一些其它月份的至少一个分离株相比,例如,2003年12月或2004年6月的分离株。分离株是分离自天然来源的任何病毒,其中天然来源包括但不限于病毒储库、病毒载体或病毒宿主。“获得”分离株是藉以获得分离株中氨基酸或核酸序列的任何行为,包括但不限于,分离分离株和对分离株的基因组或蛋白序列的任何部分测序,从任何媒介(包括从数据库诸如PubMed)获得分离株的任何核酸序列或氨基酸序列,其中可分析该核酸序列或氨基酸序列的Replikin浓度,或获得在一时间点分离自天然来源的病毒的Replikin浓度的任何其它方式。
[000185]本文所用的较早出现的病毒或生物体或在较早时间段分离的病毒或生物体是在早于从天然来源收集病毒或生物体的另一样本的日期的日期从病毒或生物体的天然来源收集的病毒或生物体的样本。对于病毒,天然来源包括但不限于病毒储库、病毒载体、或病毒宿主。较晚出现的病毒或生物体或在较晚时间段分离的病毒或生物体是在晚于从天然来源收集病毒或生物体的另一样本的日期的日期从病毒的天然来源(包括但不限于储库、载体或宿主)或从生物体天然来源收集的病毒或生物体的样本。
[000186]本文所用的短语“新出现的株”是指一株病毒株,相对于这种生物体的其它株中的Replikin浓度,它被鉴定为在其一种或更多种蛋白序列中具有已升高或正在升高的Replikin浓度。Replikin浓度的已升高或正在升高发生于优选在至少约六个月、至少约一年或至少约三年的期间里,但对于高度可突变的病毒可为更短的时间阶段。新出现的病毒株表示致死性、毒力或复制的增加。
[000187]本文所用的“禽”是任何鸟类,包括迁徙的禽类和家养禽类,其中所述迁徙的禽类和家养禽类包括例如,鸡、所有种类的鸭、鹅、鸽子、海鸥、海鸟等。
[000188]本文所用的“暴发”是与相同病毒性疾病的较早发生的流行病学感染方式的基线相比,病毒性疾病毒力、发病率或死亡率的增加。本领域普通技术人员将知晓如何确定流行病学的基线。本文所用的“发病率”是超过过去的零病例或超过过去地方性病例的基线的由病毒造成的疾病的病例数目。因此流行病学的术语中地方性病例的基线可例如,与在最接近的过去在地理区域中是没有病例还是有一些病例存在相关。流行病学的术语中过去可意为多于一年并可意为几年或更多,如本领域普通技术人员理解的。过去也可意为少于一年,由本领域普通技术人员确定。在例如每年复发的普通流感的情况中,基线反映普通流感的每年复发。
[000189]本文所用的“突变”是指在病毒或生物体的结构和特性方面由于氨基酸的取代引起的改变。相反,本文所用的术语“保守”是指特定氨基酸由于缺少取代而保守。“点突变”可指单个氨基酸残基的变化或可指小数目氨基酸残基的变化。
[000190]本文所用的基因组、蛋白或蛋白片段的“区段”或“部分”指基因组中任何大小的任何核酸序列或蛋白或蛋白片段中任何大小的任何氨基酸序列,其中所述核酸序列的末端可为基因组中任何两个核酸残基,氨基酸序列的末端可为蛋白或蛋白片段中任何两个氨基酸残基。
[000191]本文所用的“Replikin计数”或“Replikin浓度”指蛋白、蛋白片段、病毒或生物体中每100氨基酸的Replikin数目。已发现,与具有较低Replikin浓度的病毒或生物体的第二、较早出现的或较晚出现的株相比,第一株的病毒或生物体中较高Replikin浓度与第一病毒或生物体的更快速复制关联。
[000192]本专利申请中所用的术语“连续Replikin序列”意为一系列两个或更多重叠或直接共价地连接的Replikin序列。
[000193]本文所用的“Replikin骨架”指一系列保守Replikin肽,其中各个所述Replikin肽序列包括约16至约34氨基酸,和优选地约27至约33氨基酸且进一步包括:(1)末端赖氨酸和紧邻所述末端赖氨酸的任选赖氨酸;(2)末端组氨酸和紧邻所述末端组氨酸的任选组氨酸;(3)距离另一赖氨酸6至10氨基酸残基以内的赖氨酸;和(4)约6%赖氨酸。“Replikin骨架”还指一系列Replikin骨架的单个成员或复数个成员。
[000194]在流感病毒中,Replikin骨架可指包括约16至约34氨基酸残基和在优选实施方式中包括约28至约30氨基酸残基的Replikin肽序列。在白斑综合征病毒中,Replikin骨架可指包括约16至约34氨基酸残基和在更优选实施方式中包括约29至约31氨基酸残基的Replikin肽序列。在桃拉综合征病毒中,Replikin骨架可指包括约16至约34氨基酸残基和在更优选实施方式中包括约29至约33氨基酸残基的Replikin肽序列。
I.Replikin Peak基因中的Replikin计数预测恶性肿瘤、流感和其它病原体的毒力和致死性并与之相关,且Replikin Peak基因和相关Replikin序列可用于诊断、治疗和预测目的
[000195]与致死性和毒力相关的病毒Replikin基因首先由申请人在人类H5N1流感中鉴定并标为Replikin Peak基因。随后在许多其它病毒、细菌和原生动物中计算机分离Replikin Peak基因。现在已将Replikin Peak基因与植物、鱼、甲壳类和脊椎动物宿主中的致死性相关。由于与致死性、毒力和快速复制相关,现在Replikin Peak基因可作为极好的靶用于治疗性和预防性治疗大范围的恶性肿瘤和病原体。
[000196]Replikin是一类与快速复制相关的肽,长7至50氨基酸,包含间隔6至10氨基酸的至少2个赖氨酸基团、至少1个组氨酸基团、和至少6%赖氨酸。Replikin与快速复制和毒力相关的现象已经完全描述于美国专利第7,189,800号、美国专利第7,176,275号、美国申请序列第11/355,120号、美国申请序列第10/860,050号和美国申请序列第10/105,232号。Replikin浓度(每100氨基酸的Replikin数目)和Replikin组成均已与快速复制的功能现象关联。
[000197]使用构建以鉴定、计算、和在历史上追踪Replikin序列的算法,在代表1917至2007年公布和在PubMed上报道的普通流感株和一些其它致死病毒分离株的所有登记号的130,488个蛋白和基因组序列中分析Replikins。分离了具有最高浓度的连续Replikins的基因组区域并称为Replikin Peak基因(RPGs)。
[000198]对包括H5N1的致死甲型流感株的所有公众可得的蛋白和基因组序列的分析揭示10,182个RPGs。发现RPGs存在于1917至2007年致死流感的所有暴发的分离株,且一致地观察到所鉴定的RPGs中每100氨基酸的Replikin序列数目(Replikin计数)高于四并增加到高达29。在对人类非致死的乙型流感病毒显著对照中,发现1940至2006年乙型流感的所有371个RPGs中的Replikin计数从不超过四。乙型流感病毒的RPG中Replikin计数低于四与致死甲型流感株(Replikin计数高达29)形成对比。通常观察到在甲型流感静止(或非致死)期间的RPG Replikin计数为四或低于四。
[000199]非致死流感分离株的Replikin计数低于四可与以下相比:高度致死或毒性病毒诸如埃博拉病毒,已观察到其Replikin计数为32;猪的猪生殖和呼吸病毒(PRRSV),已观察到其Replikin计数为43;番茄植物的双生黄化曲叶病毒,观察到其Replikin计数为56;鱼的出血性败血病病毒,观察到其Replikin计数为59,和虾的白斑综合征病毒,观察到其Replikin计数为106。观察到所有这些病毒在静止期回到低计数。RPGs中Replikin计数增加还见于结核分枝杆菌(28)、耐受甲氧苯青霉素的金黄色葡萄球菌(81)、恶性疟原虫(疟疾)(153)和肺癌(261)。
[000200]仅分析基因组和蛋白质组序列中Replikin计数有希望地正确预测:1)桃拉综合征病毒四个株对虾的致死性顺序(在实验室研究中进行盲预测);2)人类H5N1死亡率百分比的2007年增加;和3)将最显著地发生死亡率百分比增加的国家,即印度尼西亚。
[000201]除了高Replikin计数之外,分析快速复制、毒性和致死病毒已揭示与快速复制、毒力和致死性相关的一系列保守Replikin肽,称为Replikin骨架。在流感病毒株中观察到Replikin骨架,其中,例如,29-氨基酸Replikin骨架已经在连续流感病毒株基因组中保守了90年。所述骨架已存在于1918、1957和1968年的每次致死流感大流行和每次致死H5N1暴发。已在致死恶性肿瘤、病毒和生物体的RPGs内的Replikin序列中观察到重复特征(signature)诸如“KHKK”(SEQ ID NO:1584)特征。已在导致大多数疟疾的原生动物恶性疟原虫的RPG中观察到十一次KHKK(SEQID NO:1584)特征。在诱导辣椒植物中细胞死亡恶化的烟草花叶病毒RPG中观察到20次KHKK(SEQ ID NO:1584)特征。在非小细胞肺癌观察到57次KHKK(SEQ ID NO:1584)特征,其位于在非小细胞肺癌的染色体9中鉴定的18氨基酸RPG中观察到的52个Replikins中。非小细胞肺癌的18氨基酸RPG中存在如此高数目KHKK(SEQ ID NO:1584)特征由特征重叠解释。已将Replikin序列的重叠和重复特征诸如KHKK(SEQ ID NO:1584)与致死性、毒力和快速复制相关。总之,这些数据表示Replikin基因数量上与致死功能相关,并可为株和物种之间致死性转移的流动因子。
[000202]还未确定Replikin是可经由从头合成产生还是从一种生物体或病毒转移至另一生物体或病毒(或两者)。对两者都有一些开始证据。在一实验中,在生长于组织培养的多形性成胶质细胞瘤细胞中于实验室中促进了Replikin合成和/或转移。促进合成和/或转移的事件是诱导的缺氧。还未确定是缺氧刺激增加Replikin合成速率还是膜损伤促进Replikin转移或两者。
[000203]计数恶性肿瘤、病毒、原生动物、植物或动物中的Replikin序列由计算机回顾基因和蛋白序列数据库辅助。当光显微镜允许看到细菌为离散的实体并足够离散以可计数时,细菌被接受为真实的。类似地,当电子显微镜允许看到病毒为离散的实体并足够离散以可计数时,病毒被接受为真实的。同样地,由于“计算机显微镜”允许看到Replikin为离散的实体并足够离散以可计数时,现在Replikin可被接受为真实的。因此,Replikin计数或确定任何指定基因组或蛋白质组序列中100氨基酸的Replikin序列数目由计算机大规模地分析而促进,比较Replikin计数提供了必需证据以将Replikin计数增加(在全基因组和Replikin Peak基因中)与致死性关联。
[000204]在宽范围基因组中可视化和Replikin序列计数现在已揭示Replikin序列不是散布在致死、毒性和快速复制实体的基因组中,而是集中在基因组特定区中。基因组特定区中Replikin序列集中现在已鉴定为Replikin Peak基因(RPG)。RPG中Replikin序列集中提供了Replikin计数放大和发育、生长和疾病与Replikin序列的关联的放大。见例如,图1、3、16和17。这种放大不仅使得鉴定和计数更简单,还促进发现Replikin的结构历史和功能关联,如见于例如,人类H5N1RPG的Replikin计数增加与2003至2007年人类死亡率百分比增加的关联。图4、16和17。
[000205]与基因组或全基因组其它部分的Replikin计数相比,分析Replikin Peak基因的Replikin计数的放大效应在图16和17中证实。图中,人类H5N1感染的死亡率与病毒pB1基因区(RPG)的Replikin计数增加强有力地关联,而与聚合酶基因或病毒全基因组中Replikin计数增加较弱关联。
[000206]通过目视和软件检查,申请人已分析了1917至2007年分离且在PubMed可得的普通流感株和其它致死病毒的130,488个蛋白和基因组序列。这些130,488个序列中的Replikin序列已被鉴定、计数和每年追踪。这种广泛的分析揭示了还未发现在数量上与数种宿主(包括植物、鱼、甲壳类和脊椎动物,诸如人类)致死性相关的Replikin Peak基因。
II.预测病原性暴发和致死恶性肿瘤
[000207]可预测诸如甲型流感(包括H1N1、H2N2、H3N2、H3N8和H5N1)、口蹄疫病毒、西尼罗病毒、猪生殖和呼吸综合征病毒、猪圆环病毒、白斑综合征病毒、桃拉综合征病毒、烟草花叶病毒、冠状病毒和SARS病毒的病毒的流行和未来暴发,例如,通过回顾病毒株的分离株的Replikin浓度并比较特定时间段的Replikin浓度与另一时间段的Replikin浓度。还可预测生物体的暴发或毒力或致死性的增加,例如,通过回顾生物体分离株的Replikin浓度并比较特定时间段的Replikin浓度与另一时间段的Replikin浓度。可预测其暴发或毒力和致死性的增加的生物体包括,例如,恶性疟原虫、产粘液分枝杆菌和金黄色葡萄球菌。
[000208]时间段的差异可为例如,一个月、六个月、一年、三年或更久。优选地,时间段差异是六个月至三年。还优选地,时间段差异是一年。从一年到下一年和优选地经过一、二、三或五年Replikin浓度的显著增加提供可开始暴发的病毒或生物体的新出现株的预测价值。可预测从观察到Replikin浓度显著增加的约六个月至约一至约三年内的病毒或其它病原性暴发。预测该暴发优选地在约一至约两年内。因此可预测1至约2年内病毒或其它病原体暴发,如图2、3、7、11和19证实的,其中流行发生在特定病毒和生物体测量的Replikin计数的每个峰值后约1至约2年。
[000209]可在多于一年,诸如三、四、五或更多年的时间段观察到显著的增加。可同样地预测从显著的增加后最初观察到Replikin浓度可观察到的减少的约六个月至约一年或更久内的暴发。
[000210]本申请中注意到的Replikin浓度与病毒暴发之间的关联性提供了通过监控病毒或其它病原体分离株的RPG中Replikin浓度的增加或减少来预测病毒和其它病原体暴发的方法。同样地,可预测生物体的致死性,通过比较恶性肿瘤的鉴定的RPG中Replikin计数与相同种类的另一恶性肿瘤鉴定的RPG中Replikin计数。
III.用于诊断和治疗的Replikin Peak基因序列
[000211]已显示高Replikin浓度和RPGs与以下的快速复制、病毒暴发、流行、发病率和宿主死亡率相关:例如,包括H5N1的流感病毒株、SARS冠状病毒、虾的桃拉综合征病毒和白斑综合征病毒、口蹄疫病毒、猪生殖和呼吸综合征病毒和猪圆环病毒、和恶性肿瘤诸如非小细胞肺癌,及其它。由于Replikin序列通常(并且尤其是RPGs)是化学定义的,所以所述序列可通过有机化学而不是生物技术合成,并因此比其它用于诊断和治疗的靶更特异、更可重复和更可靠。申请人鉴定的化学定义的Replikin序列同样地潜在地无副反应,而副反应是生物来源的疫苗和抗体特有的。
[000212]除了Replikin技术在这些实例中显示的诊断能力,还清楚第一次识别这类病毒肽和发现其与快速复制、病毒暴发和高发病率和死亡率有关,使得本文说明的Replikins并且尤其是Replikin Peak基因结构成为用于针对这些和其它病毒的治疗和疫苗的新的保守首要靶(prime targets)。
[000213]Replikin Peak基因的存在与各种物种中毒力增加和流感病毒、疟疾和肺癌的人类死亡率和PRRSV和猪圆环病毒的猪死亡率增加关联。由于毒力和死亡率增加可与Replikin Peak基因(RPG)关联,RPG的部分或片段是以疫苗、抗体或其它阻断剂治疗的可用的优选靶。基因中的Replikins是鉴定病毒和其它病原体的毒性株和预测病毒和其它病原体暴发的进一步优选靶。
IV.免疫原性化合物、疫苗、抗体和阻断剂
[000214]对特异性Replikins及其在病毒和有机病原体以及恶性肿瘤的蛋白中的浓度的观察结果提供了暴发的第一种特异性的定量的早期化学关联,并且提供了疫苗的生产和及时给药,该疫苗是为了治疗在世界上特定地区流行的病毒的新出现株或重新出现株而特别定制的。通过分析病毒分离株的蛋白序列中Replikins的存在、浓度和/或保守性,可以预测病毒的暴发和流行并开发疗法。另外,这种暴发的严重性可以通过施用基于本文鉴定的Replikin序列的肽免疫原性化合物或疫苗、或使用本文提供的方法或发现是丰度最高的Replikin序列或显示在一个给定的时期如在大约1到大约3年中于病毒分离株中处于上升阶段的Replikin序列而得以显著减轻。
[000215]针对SARS Replikin序列和H5N1流感病毒Replikin骨架的疫苗产品已由申请人证实。见例如,递交于2006年2月16日的美国申请序列第11/355,120号(实施例6和7),其通过引用并入本文。加到虾饲料源的Replikin序列已经同样地赋予对桃拉综合征病毒攻击的可测量抗性。见实施例19。目前,在兔或鸡检验的所有Replikin序列已经引起免疫响应,且已经在引起免疫响应,并且已经在于人类中诱导免疫响应并与天然抗体响应反应的肽中鉴定和合成了神经胶质瘤Replikin序列(SEQ ID NO:3658)。见美国专利第6,638,505号。
[000216]本发明的免疫原性化合物或肽疫苗可包括单独的Replikin肽序列或可以包括在特定病毒株中观察到的复数个Replikin序列。优选地,该肽疫苗是Replikin Peak基因或Replikin Peak基因中分离的Replikin序列。进一步地,肽疫苗可基于Replikin序列,所述Replikin序列在给定的时间段显示浓度的升高并至少在该时间段是保守的。疫苗还可包括联合新Replikin(s)肽的保守的Replikin肽或可以是基于新的Replikin肽序列。Replikin肽可用任何方法合成,包括化学合成或重组基因技术,并可包含非Replikin序列,尽管优选基于仅含Replikin序列、Replikin Peak基因或Replikin Peak基因中鉴定的Replikin序列的肽的疫苗。优选地,本发明的疫苗组合物也包含药学上可接受的载体和/或佐剂。
[000217]本发明的免疫原性化合物和流感疫苗可以单独给药或与抗病毒药物,如更昔洛韦(gancyclovir);干扰素;白介素;M2抑制剂,如金刚烷胺、金刚乙胺;神经氨酸酶抑制剂,如扎那米韦(zanamivir)和奥司他韦(oseltamivir);等等,以及与抗病毒药物的组合联合给药。
[000218]本发明的疫苗可施用于能够在免疫响应中产生抗体的任何动物。例如,本发明的疫苗可施用于兔、鸡、猪或人类。由于Replikin序列的通用性,本发明的疫苗可针对一定范围的病毒株或特定病毒株。
V.甲型流感株的pB1区的Replikin Peak基因中的Replikin计数增加与大流行和致死暴发关联
[000219]申请人已经鉴定Replikin Peak基因为基因组区段、蛋白、蛋白区段或蛋白片段,其中表达的基因或基因区段与基因组的其它区段或指名的基因相比具有最高浓度的连续、不中断和重叠Replikin序列(每100氨基酸的Replikin序列数目)。发明人已经同样地鉴定包含最高浓度的连续、不中断和重叠Replikin序列(每100氨基酸的Replikin序列数目)的基因区或蛋白或蛋白片段为Replikin Peak基因。
[000220]现在申请人已将甲型流感株pB1基因区中鉴定的ReplikinPeak基因中Replikin计数增加与流感大流行和致死暴发关联。这些结果与申请人的如下发现符合:定量测量蛋白中Replikin肽的浓度允许将每100氨基酸的Replikin肽浓度与恶性肿瘤、和生物体和病毒感染的毒力、发病率、死亡率、流行和大流行关联。申请人已在如下中确立了恶性肿瘤和病原体的RPG中Replikin计数增加的关联性:例如,人类大流行流感病毒、H5N1(“禽流感”)流感病毒、白斑综合征病毒、口蹄疫病毒、西尼罗病毒、猪生殖和呼吸综合征病毒、猪圆环病毒、马流感病毒、烟草花叶病毒、疟疾和非小细胞肺恶性肿瘤、及其它。这些病原体和恶性肿瘤中Replikin计数增加允许预测致死性或毒力增加并预测即将到来的感染暴发。
A.H5N1中的Replikin Peak Gene与致死暴发相关
[000221]申请人最初鉴定流感病毒H5N1株的基因组的pB1基因区中的Replikin Peak基因(例如SEQ ID NO:1684),并观察到H5N1病毒暴发和感染该病毒的致死性与鉴定的Replikin Peak基因中Replikin计数增加关联。图1说明pB1基因区定位为流感病毒H5N1株的基因组中的ReplikinPeak基因。图1的数据包含在表1中。在H5N1基因组中鉴定的八个基因组区是核壳体、基质、pB2、神经氨酸酶、pA、NS、血凝素和pB1基因区。图1的图揭示,发现Replikin序列在H5N1病毒基因组的pB1基因区最集中。当发明人在pB1基因区中鉴定Replikin Peak基因(RPG)时,发现RPG中Replikin计数增加与病毒感染(infectious)的致死性增加关联。如此,由于观察到平均Replikin计数和平均Replikin计数的标准差的显著增加,在2005和2006年观察到H5N1中RPG的“上调”,且此上调与致死性和毒力增加关联。
[000222]表1提供2003至2006年H5N1分离株中八个基因区的每个基因区在PubMed公众可得的序列的平均Replikin计数和平均值的标准差。在指定年份的数据不可得时,该年份在表中不呈现。
表1-H5N1流感
Figure A20088000249400691
Figure A20088000249400701
Figure A20088000249400711
Figure A20088000249400721
Figure A20088000249400731
Figure A20088000249400741
[000223]基因组中与pB1区相邻的区中存在的Replikin序列数目分析揭示,与2003至2006年pB1区中Replikin计数增加八倍(p<0.001)相比,基因组七个其它区中Replikin计数增加不超过二倍。pB1区中上调的RPG的定位特异性由如下事实强调:pB1为其部分的聚合酶基因区的其它部分(即pB2和pA基因区)不具有相同量的Replikin计数增加,尽管这两个基因区紧邻pB1。
[000224]图示中,平均值的标准差以浅灰色条柱显示在平均值上方,而不是常用的‘T’符号,以强调关于Replikin计数的不同的扩大的病毒群体。由于群体中Replikin计数增加,随着病毒的致死性和毒力增加可观察到Replikin计数的多样化。因此,病毒群体中标准差增加本身就是病毒暴发的指数。在图1和随后的图中,观察到平均Replikin计数的小标准差伴随着病毒的静止的暴发间(inter-outbreak)阶段。
[000225]以下提供实施例1-3作为分析在PubMed中以登记号公众可得的序列中Replikin Peak基因的实例。实施例2和3说明鉴定ReplikinPeak基因如何允许放大分离株中Replikin计数增加的效应,其中该增加可与毒力和致死性增加关联并预测毒力和致死性增加。例如,实施例2提供2003年香港H5N1分离株,其全pB1基因区(SEQ ID NO:1683)的Replikin计数为2.0,且RPG Replikin计数为14.6。实施例3提供2006年印度尼西亚分离株,其全pB1基因区的Replikin计数为17.8,且RPG Replikin计数为22.5。印度尼西亚在2007年经历H5N1高度致死暴发,并有人类至人类传播的证据。2006年印度尼西亚分离株中的高Replikin计数使得发明人能有希望地预测致死的印度尼西亚暴发。
[000226]2006年印度尼西亚分离株全基因组的Replikin计数证实与2003年香港分离株相比显著增加。分离Replikin Peak基因(RPG)区即基因组中显示每100氨基酸最高浓度(计数)的连续Replikins的区,放大了该效应。因此,全基因组计数用于首先接近Replikin计数增加,其中更详细的特定基因区或开放读码框数据不可得。然而,当可得时,RPG用于更具决定性的“较高能力”检查。这描绘于图1-4。
B.甲型流感的RPG中Replikin计数增加与大流行和致死性相关
[000227]现在发明人已经将甲型流感病毒RPG中Replikin计数增加与流感大流行、流行和致死暴发关联。图2说明1918年以来在每次甲型流感大流行和暴发之前和伴随每次甲型流感大流行和暴发的Replikin计数增加,和甲型流感感染静止期的低Replikin计数和在非致死乙型流感中的持续地低的Replikin计数。该图提供1917-2007年具有在PubMed公众可得的氨基酸或核酸序列的流感株的pB1基因区中计算机分离的所有Replikin Peak基因的每年Replikin计数。分析数据的序列总数目是14,227。由计算机软件(FluForecast,从Replikin LLC,Boston,MA可得)分别并客观地随时间获得对每种物种每次流感的计算机分离株的Replikin计数。软件在www.pubmed.com查询公众可得的序列。软件仅测量公众可得的序列中每100氨基酸的Replikin数目并提供在指定年份流感指定株中可得的所有分离株的带有平均值的标准差的平均Replikin计数。
[000228]在九十年的时期内,图2的图证实在每次甲型流感大流行和暴发之前和伴随每次甲型流感大流行和暴发的Replikin计数增加,即,1918年H1N1大流行、1930年代H1N1流行、1957年H2N2大流行、1968年H3N1大流行、1977-78年H3N2暴发和1997、2001-2004和2007年H5N1暴发。图2中,p值<0.001一方面支持大流行和流行组之间差异的显著性,另一方面支持临床上静止的时期。
[000229]在同一九十年的时期内,在包括H1N1、H2N2、H3N2的所有3个大流行甲型流感株中可观察到流行暴发之间静止的非致死期的少于四的恒定低Replikin计数,在人类H5N1和鸡H5N1的相对地静止期也可观察到少于四的低Replikin计数。在观察的整个期间在非致死乙型流感中可同样地观察到低的Replikin计数。尤其是,在乙型流感中Replikin计数不存在超过五的增加对应于不存在任何观察到的致死暴发。因此,在观察期间,乙型流感总是非致死的。在非致死乙型流感这种不存在五或更多的Replikin计数提供研究Replikin计数作为致死性关联物的重要对照。在甲型流感中,Replikin计数增加表示致死性增加,Replikin计数减少表示致死性减少。
[000230]对1940至2007年乙型流感病毒分离株的公众可得序列的分析提供于下表2。数据不可得的年份未包括在表中。
表2-乙型流感
  年份   PubMed登记号-Replikin计数   每年分离株的数目   每年平均Replikin计数   S.D.   显著性
  1940   NP_056657 14 ABG85176 14 ABG85165 14 P07832 14 BAA00002  14 AAA43767 14 AAF06886 16 AAF06851 10 NP_056659 16 NP_056658 10   10   1.8   0.3   最低p<.001
  1966   AAF89738 25 P13872 14 P13871 14 Q9IMP4 25   4   2.6   0.8   最低p<.10
  1969   ABQ81851 14   1   1.9   0.0   上年p<.10
  1972   ABF21251 18 ABF21252 18   2   2.4   0.0
  1979   AAF06873 14 AAF06856 10   2   1.6   0.4   最低p<.05,上年p<.10
  1984   AAF06870 14 AAF06888 16 AAF06853 10   3   1.8   0.5   最低p<.02,上年p>.50
  1985   AAF06868 14 AAF06885 16 AAF06850 10   3   1.8   0.5   最低p<.02,上年p>.50
  1987   ABL77253 14 AAF06874 17 AAF06891 14 AAF06857 10   4   1.8   0.4   最低p<.002,上年p>.50
  1988   ABN50611 14 ABL77264 14 AAF06875 14 AAF06860 14 AAF06892 17 AAF06877 14 AAF06858 10 AAF06842 10 P12236 6   9   1.8   0.3   最低p<.001,上年p>.50
  1989   ABL77275 14 P21796 5   2   1.8   0.1   最低p<.01,上年p>.50
  1990   ABN58670 16 ABN50633 14 ABN50622 14 ABL76703 14 AAB72043 14 O36430 14   6   1.9   0.1   最低p<.001,上年p<.20
  1991   ABN50644 27 ABN51204 10 ABN51193 10 ABL77286 14   4   2.0   1.1   最低p<.05,上年p>.50
  1992   ABN50655 14 ABL77308 14 ABL77297 14   3   1.9   0.0   上年p>.50
  1993   CAA05486 40 ABN50666 14 ABL77341 14 ABL77330 14 ABL77319 14 AAF06869 14 AAF06865 14 AAF06861 14 CAG96502 14 AAF06887 17 AAF06882 14 AAF06878 17 AAF06852 10 AAF06846 10 AAF06843 10   15   2.1   1.0   最低p<.001,上年p<.40
  1994   AAU94857 14 AAU94856 14 AAU94855 14 AAU94854 14 AAU94853 14 AAU94852 14 AAU94851 14 AAU94850 14 AAU94849 14 AAU94848 14 AAU94847 14 AAU94846 14 AAU94845 14 AAF89734 14 ABR16004 14 ABN50721 14 ABN50710 14 ABN50699 14 ABN50688 14 ABN50677 14 ABL77363 14 ABL77352 14 ABL77000 14 AAF06866 15 AAF06864 14 AAF06883 17 AAF06881 14 AAF06848 10 AAF06847 10   29   1.8   0.2   最低p<.001,上年p<.40
  1995   ABR16015 14 ABN50732 14 ABL77385 14 ABL77374 14 ABL76945 14   5   1.9   0.0   上年p>.50
  1996   ABL76967 14 ABL76714 14   2   1.9   0.0
  1997   ABN59454 14 ABN50413 14 ABN50402 14 ABN50391 14 ABL76978 14 ABL76285 14 ABL76274 14 ABL76263 14 AAK95906 14 AAF06867 14 AAF06862 14 CAG96500 14 ABI96727 14 ABI96738 13 AAP22114 14 AAP22106 14   20   1.8   0.2   最低p<.001,上年p>.50
  AAF06884 17 AAF06879 17 AAF06849 10 AAF06844 10
  1998   ABN50743 14 ABN50512 14 ABN50457 14 ABL77022 14 ABL77011 14 ABL76989 14 ABL76956 14 ABL76780 14 ABL76769 14 ABL76296 14 AAF06876 14 AAF06872 14 AAF06871 14 AAF06863 14 AAU00993 14 AAF06893 17 AAF06890 17 AAF06889 17 AAF06880 17 AAF06859 10 AAF06855 10 AAF06854 10 AAF06845 10   23   1.8   0.3  最低p<.001,上年p>.50
  1999   ABL77055 14 ABL77044 14 ABL77033 14 ABL76813 14 ABL76802 14 ABL76362 14 ABL76351 14 ABL76340 14 ABL76329 14 ABL76318 14 ABL76307 14 ABO81840 14 CAG96499 14 ABI94772 20   14   1.9   0.2  最低p<.001,上年p<.40
  2000   ABL77110 14 ABL77066 14 ABL76901 14 ABL76890 14 ABL76879 14 ABL76868 14 ABL76857 14 ABL76824 14 ABL76791 14 ABL76395 14 ABL76384 14 ABL76373 14 ABL84349 14 CAG96513 14 AAT69423 14   15   1.9   0.0  最低p<.001,上年p<.30
  2001   ABR15982 14 ABO72385 14 ABN50600 14 ABN50567 14 ABN50534 14 ABN50523 14 ABN50490 14 ABN50479 14 ABN50435 14 ABN50424 14 ABL77187 14 ABL77143 14 ABL77099 14 ABL77088 14 ABL77077 14 ABL76417 14 ABL76406 14 AAT69445 14 CAG96504 14 AAT69434 14 CAG96509 14 ABJ09524 14 ABJ09472 15 ABJ15707 16 ABI96775 20 ABI96695 16   26   2.0   0.3  最低p<.001,上年p<.05
  2002   ABN50754 14 ABN50578 14 ABN50556 14 ABN50545 14 ABL77396 14 ABL77176 14 ABL77165 14 ABL77154 14 ABL77132 14 ABL76483 14 ABL76472 14 ABL76461 14 ABL76450 14 ABL76439 10 ABL76428 14 CAG96515 14 CAG96514 14 CAG96511 14 CAG96510 14 CAG96503 14 CAG96501 14 ABI97312 16 ABJ09504 17 ABJ09486 15 ABI98925 16 ABI96765 15 ABK00110 15 ABI97340 15 ABI97331 21 ABI97322 21 ABI94786 14 ABI94737 11   32   2.0   0.3  最低p<.001,上年p>.50
  2003   ABR15993 14 ABN50589 14 ABL77209 14 ABL77198 14 ABL76835 14 ABL76626 14 ABL76615 14 ABL76604 14 ABL76593 14 ABL76582 14 ABL76571 14 ABL76560 14 ABL76549 14 ABL76538 14 ABL76527 14 ABL76516 14 ABL76505 14 ABL76494 14 CAG96520 14 CAG96519 14 CAG96517 14 CAG96512 14 CAG96508 14 CAG96507 14 CAG96506 14 CAG96505 14 ABJ98940 16 ABJ09534 15 ABJ09509 15 ABJ09482 15 ABI98936 14 ABI98912 15 ABI98908 15 ABK00142 16 ABK00088 8 ABJ80591 8 ABJ52572 8 ABJ52553 16 ABI97342 14   39   1.9   0.2  最低p<.001,上年p<.10
  2004   ABN50468 14 ABL77231 14 ABL77220 14 ABL77121 14 ABL76923 14 ABL76912 14 ABL76846 14 ABL76758 14 ABL76637 14 CAG96518 14 CAG96516 10 AAT70178 14 ABJ16471 15 ABJ09543 14 AAT78590 14 ABK00130 15 ABJ52559 14 ABJ15718 15 ABI97302 13 ABI96707 13   20   1.8   0.1  最低p<.001,上年p<.30
  2005   ABN50501 14 ABN50446 14 ABL77242 14 ABL76934 14 ABL76692 14 ABL76681 14 ABL76670 14 ABL76659 14 ABL76648 14 ABI96712 14   10   1.9   0.1  最低p<.001,上年p<.20
  2006   ABL76747 14 ABL76736 14 ABL76725 14 ABR16026 14   4   1.9   0.0  最低p<.001,上年p<.30
  2007   ZP_01998985 50 EDN71014 50   2   3.1   0.0   上年p<.001
[000231]尽管非致死乙型流感的Replikin计数保持显著的恒定,甲型流感的Replikin计数显示与暴发、流行和大流行关联的显著变化。例如,可观察到图2中在1918年(H1N1)大流行的RPG的平均Replikin计数以与在这三次大流行中观察到的死亡率近似的比例大于1957年(H2N2)和1968年(H3N2)大流行的RPG的平均Replikin计数。认为1918年大流行导致美国675,000例死亡和全球5000万例死亡。在图2可观察到1917年Replikin计数为19。认为1957年大流行导致美国70,000例死亡和全球100-200万例死亡。在图2可观察到1957年Replikin计数为4,标准差为4.9。认为1968年大流行导致美国34,000例死亡和全球700,000例死亡。在图2可观察到1968年Replikin计数为7.2,标准差为8。
[000232]1990至2007年H5N1对其它甲型流感株的优势在图2也是明显的。平均Replikin计数的这种优势反映在该时间段禽类的高全球致死性和导致1997、2001-2004年的人类致死并在2007年持续致死和可能的人类-至-人类传播的暴发。2004至2007年人类H5N1的计数增加并接近1918年H1N1大流行时的平均Replikin计数水平。也观察到鸡H5N1中的RPG的平均Replikin计数在该时间段以较小水平增加并观察到在2007年减少。所有株的平均值的标准差(SD)显示为平均Replikin计数条柱上方的加帽的浅灰色条柱,并强调在扩大的病毒群体的RPG中Replikin计数宽泛分布。Replikin计数的这种宽泛分布说明在与病毒暴发相关的快速复制期间Replikin计数分布的快速变化。在静止期,观察到标准差为平均值的大约10%或更小。相反,当暴发形成时,观察到标准差为平均值的50%或大于平均值(在图7的H3N8马脑炎中观察到相同现象)。2005、2006和2007年人类H5N1的平均Replikin计数数据说明,当前的流行尚未结束。例如,在每次H1N1、H2N2和H3N2大流行中,暴发结束前可观察到Replikin计数下降。2003年SARS暴发时也观察到暴发结束前的这种下降。见图9。因此,由于观察到H5N1的平均Replikin计数还未开始下降,预期当前的流行将持续。
[000233]图3说明1930至2007年连续“新出现的”流感病毒株。提供了每年分离的不同流感株的聚合酶区(标为圆圈)、pB1区(标为三角)、和pB1-F2区(标为方块)的平均Replikin计数。H1N1和H3N2的数据持续至2007。缺口代表在PubMed上这些基因组区的数据不可得的年份。
[000234]就在开始于1930年代的H1N1反弹流行、分别发生在1957和1968年的H2N2和H2N3大流行暴发前,和1997至2007年的H5N1暴发前可观察到Replikin计数的明显增加。Replikin计数的最大增加可在基因组的pB1-F2区观察到,该区包含在基因组的pB1区内并包含鉴定的RPG(例如SEQ ID NO:1723)。Replikin计数的次最大增加可在基因组的pB1区观察到,该区包含在基因组的聚合酶区内。Replikin计数的最小增加可在基因组的聚合酶区观察到。因此可观察到,pB1区内测量的与聚合酶区相比和pB1-F2区内测量的与pB1区相比,Replikin计数变得放大。
[000235]如同图2,图3说明在株静止期Replikin计数恒定,和特定株暴发前一年或同时地Replikin Peak基因的Replikin计数明显增加。图2和图3证实多于一种流感株不会同时发生暴发,也不会同时发生Replikin计数增加。该图进一步证实在1968年H3N2“上升”与H2N2“下降”同时发生。
C.H5N1的RPG中的Replikin计数直接与人类死亡率关联
[000236]发明人现在已经证实H5N1流感病毒的RPG(例如,SEQ IDNO:1684)中的Replikin计数增加可直接与人类死亡率关联。图4说明在2003至2007年在人类H5N1感染病例中人类H5N1中的Replikin Peak基因的Replikin计数与人类死亡率百分比之间的关系。观察到H5N1的Replikin Peak基因中的Replikin计数增加与宿主中高死亡率数量相关。人类H5N1中的Replikin Peak基因是pB1基因区,其在公众可得的H5N1基因组序列中具有最高浓度的连续Replikin序列。
[000237]图4中可观察到,当指定年份的全病毒中平均Replikin计数与pB1基因区(鉴定为病毒的Replikin Peak基因区)中平均Replikin计数比较时,Replikin计数的放大。例如,全基因组中每年平均Replikin计数从2005至2007年增加33%,而Replikin Peak基因(pB1基因区)中的每年平均Replikin计数从2003至2007年增加九倍,和从2005至2007年增加222%,统计p值小于0.001。人类H5N1病例的每年死亡率百分比从2005至2007年增加大约100%。2007年的数据,尽管由于一些国家拒绝提供数据而不幸地少,未表现出全基因组Replikin计数或RPG Replikin计数的减少。Replikin计数的显著减少通常标志着暴发或流行的结束。见例如,图9中SARS冠状病毒数据。还未观察到这样的减少。
[000238]图16和17同样地证实H5N1的RPG中Replikin计数增加比H5N1基因组其它部分中Replikin计数增加更强有力地与指定年份中的致死性关联。图16和17的数据包含在下表3中。
表3-H5N1 Replikin浓度和人类死亡率
  2003   2004   2005   2006   2007
人类H5N1全病毒Replikin计数   2.2+/-1.2   2.4+/-1.4   2.3+/-2.6   3.8+/-4.6   3.7+/-4.5
人类H5N1聚合酶Replikin计数   2.6+/-0.8   2.9+/-0.9   4.8+/-5.0   7.4+/-7.0   7.3+/-6.7
人类H5N1pB1基因区(RPG)Replikin计数 2.0+/-0   2.0+/-0.1 8.0+/7.7   16.1+/-5.7   15.4+/-5.9
人类H5N1pB2基因区Replikin计数 2.4+/-0   2.8+/-0.3 2.4+/0.4   2.4+/-0.1   2.4+/-0.3
人类H5N1pA基因区Rep1ikin计数 3.8+/-0   4.0+/-0.6   3.8+/-0.4   3.8+/-0.3   4.2+/-0.3
  H5N1人类死亡率百分比   45   69   85
[000239]图16中,确立了人类死亡率与H5N1流感株的(1)全基因组中的平均Replikin序列浓度、(2)聚合酶基因中的平均Replikin序列浓度和(3)Replikin Peak基因(pB1基因区)中的平均Replikin序列浓度之间的关联性。随着这三个测量值的Replikin浓度增加,观察到人类死亡率增加。然而,尽管三个测量值都提供与人类死亡率的关联性,H5N1基因组的聚合酶基因中Replikin计数变化更显著地与人类死亡率关联,H5N1基因组的Replikin Peak基因(pB1基因区)中Replikin计数变化还更显著地与人类死亡率关联。因此图16说明,鉴定病毒基因组中的Replikin Peak基因改进了使用Replikin浓度数据的毒力和毒力机理的鉴定和预测。
[000240]图17说明H5N1分离株的pB1基因区(Replikin Peak基因)中的Replikin浓度的显著的八倍增加,而pB1基因区的相邻基因区即pA基因区和pB2基因区中未观察到显著增加。图17说明人类死亡率与H5N1流感病毒分离株的Replikin Peak基因(pB1基因区)之间显著的关联性。在pB1基因区的相邻基因区即pB2基因区和pA基因区中未观察到关联性。除了与百分比死亡率相关的Replikin浓度增加的关联性方面,图17提供对通过监控Replikin浓度变化预测病毒毒力变化和暴发的方法的能力和有效性的强有力证实。
[000241]表3提供从2005至2007年H5N1感染的死亡率数据,不包括更早的死亡率数据。2005年前的死亡率数据未包括在表3中,由于2005年前的数据不一致并且本领域技术人员理解2005年前的数据包含误差,包括由少报造成的误差。由证实的H5N1感染造成的人类死亡的第一次公认场合是1997-1998年在香港。(然而这很可能是不正确的,因为在第一次报道H5N1时的1959年至1997年之间很可能有死亡)。1997年引用的常见数据为:30个人类病例,8例死亡,死亡率为约27%。未报道的病例的数目(发病率)和死亡的数目(死亡率)未知,但怀疑是显著的。在医疗保健较无组织和较不科学且报道不完整的地理区域,这些误差通常高。1998至2002年的媒体报道少、分散且不一致。2005至2007年的死亡率数据显得更一致和具有较高的可靠性水平。因此表3包含这些年份的数据。
D.RPG中的Replikin计数正确地鉴定暴发的宿主致死性和地理位置
[000242]发明人现在已经证实,Replikin Peak基因中的Replikin计数提供了预测和鉴定诸如H5N1流感等病原体经由宿主和地理区域暴发的方法。图5证实鉴定在特定宿主暴发的预测能力,图6证实鉴定在特定地理区域暴发的致死性的预测能力。图5和6的数据包含在下表4中。
表4-宿主和地理预测
(Replikin计数和标准差)
  鹅   鸡   鸭   人类   日本   俄罗斯   埃及   中国   越南   泰国   印度尼西亚
  2003   无数据   2±1.1   2.1±1.1   2.2±1.2   2±0   无数据   无数据   1.9±0.3   无数据   1.9±0.2   无数据
  2003 无数据   3±1.5   3.8±1.8   3.3±1.3   2±0 无数据 无数据   2±0.1   2±0.2   2±0.2   2±0
  2005   2.6±1.2   3.2±2.8   4±5   3.7±4.1   2.1±0.1   2±0.1 无数据   2.7±0.5   3±0.2   4.1±4.7   3.9±3.6
  2006   2.5±1.2   3.2±3.1   2.7±1.6   5±5.7   2±0   2±0   2±0   3±0.2   无数据   6.7±6.7   16.7±4.9
[000243]特定宿主中病原体Replikin计数增加预示病原体暴发的概率增加。例如,图5说明在2005至2007年与鹅、鸭和鸡中的H5N1相比人类中人类H5N1的上调。对各宿主组(即鹅、鸭、鸡和人类)的H5N1 ReplikinPeak基因分别进行Replikin分析。在各宿主组观察到低于4的低水平Replikin计数直到2005-2006年,此时在亚洲国家流行增加。尽管在2006年鸭H5N1计数减少,但是在2006年鸡的H5N1的Replikin计数持续增加。人类RPG活性在2005-2006年上调并超过鸡的RPG活性。Replikin计数增加从鸭到鸡再到人类的这种转变与流行病学关于病毒在宿主之间转移的顺序的证据一致。图5的H5N1分离株的Replikin Peak基因中的Replikin计数变化允许鉴定其中流感病毒株比其它宿主更毒的宿主。
[000244]特定地理区域中病原体Replikin计数增加预示鉴定的地理区域中病原体致死性增加。例如,图6说明通过测量在指定年份从不同地理区域分离的人类H5N1分离株中平均Replikin计数,定位具有最高致死性的人类H5N1分离株。对各国的人类H5N1 RPGs分别进行Replikin分析。结果显示为从2003-2006年每年在PubMed可得的所有数据的Replikin计数。在各宿主组观察到低于4的低水平Replikin计数直到2005-2006年,此时亚洲国家人类H5N1增加。人类RPG活性在2005-2006年在印度尼西亚最显著地上调。使用该数据,申请人预测最可能第一个经历人类死亡率增加的国家是印度尼西亚。该预测在2007年被证明是正确的,当时印度尼西亚暴发中的人类发病率和死亡率的发生率异常高,并观察到人类向人类传播的可能证据。诸如图6的H5N1分离株的Replikin Peak基因中的Replikin计数变化允许鉴定其中流感病毒株比其它地理区域更毒的地理区域。
E.Replikin Peak基因作为暴发预测子
[000245]鉴定pB1 Replikin Peak基因为影响毒力的Replikin浓度变化更显著的基因区,反映马流感中如H5N1的pB1基因区中证实的相同现象。见图7并与图2和3比较。图7还证实Replikin计数经过几年期间变化的循环性。这些循环象以前对1918年以来H1N1观察到的。见图2和3和美国专利第7,189,800号(表3-6)。值得注意的是,毒性流感分离株中Replikin计数增加的通常范围在2至5,即是其它流感分离株的2至3倍。然而已经观察到毒性分离株的Replikin Peak基因中Replikin计数在2至20的范围,即浓度的10倍变化。该放大在Replikin Peak基因中的Replikins浓度方面有意义,而不是在病毒基因组其它部分平均分布。
F.pB1区的Replikin Peak基因中的Replikin浓度与马流感流行关联
[000246]如同其它流感株,马流感病毒(EIV)的Replikin浓度增加已同样地显示预测病毒毒力增加并允许预测即将到来的暴发或发病率增加以及极端情况下的死亡率增加。回顾EIV分离株的证实病毒的基因组或基因组区段、或蛋白或蛋白片段中Replikin计数随时间或在分离株之间增加的公众可得的氨基酸序列用作预测在马、驴、骡和其它受影响动物中暴发和发病率增加的预测子。可手动分析或使用FluForecast
Figure A20088000249400841
搜索工具(REPLIKINS LLC,Boston,MA)分析从PubMed或其它公共或私人来源公众可得的EIV分离株的序列。
[000247]申请人已经确立EIV的pB1基因区(RPG)中Replikin计数与导致流行的病毒毒力增加之间的关联性。申请人已经回顾了在www.pubmed.com具有登记号的EIV分离株的公众可得的氨基酸序列并已经鉴定与暴发增加相关和预测暴发增加的病毒基因组的pB1基因区的Replikin Peak基因中Replikin浓度增加。
[000248]通过分析pB1、pB2和pA蛋白的基因区的公众可得的序列并鉴定各基因区中具有最高浓度的连续Replikin序列的蛋白区段,申请人最初的分析确定了流感病毒H3N8株的pB1、pB2和pA蛋白的公众可得的序列中的Replikin Peak基因。
[000249]随后申请人比较1977至2007年每年具有公众可得的序列信息的分离株的三个基因区中的每个基因区的鉴定的Replikin Peak基因中平均Replikin浓度。申请人进一步分析1977至2007年H3N8的所有公众可得的全基因组序列。
[000250]图7说明1977-2007年马流感病毒的pB1、pB2和pA基因组区中鉴定的Replikin Peak基因的Replikin计数与由H3N8马流感造成的马脑炎流行之间的关系。在流行暴发前一至三年观察到pB1基因区中Replikin计数增加而在pB2和pA基因区未观察到Replikin计数增加。平均值的标准差再次分别显示(为透明条柱)以使人注意到在最大的Replikin计数升高前具有较高Replikin计数的一些单独病毒增加,随后是病毒暴发。
[000251]紧邻H3N8基因组中pB1区的pA和pB2基因组区的RPGs的Replikin计数保持低于5,并且未增加至pB1区的RPG的Replikin计数的程度。观察到的pB1区中的这些增加和pB2和pA区中不存在增加与图1中反映的H5N1流感的数据直接一致。
[000252]可观察到H3N8的RPGs中Replikin计数的范围类似于其它甲型流感物种中Replikin计数的范围。见例如,图2。进一步地,在静止期H3N8中的Replikin计数与在所有观察时间乙型流感中的Replikin计数相当并与其它流感物种在静止期(即致死暴发之间)的Replikin计数相当。此外,流行期间H3N8中的Replikin计数与甲型流感流行前达到的暴发水平相当。见例如,图2。
[000253]图7的数据提供于下表4A,表4A提供pB1基因区的鉴定的Replikin Peak基因(RPG)的公众可得的肽序列的每年平均Replikin浓度(带有标准差)、pA基因区的鉴定的Replikin Peak基因(RPG)的公众可得的肽序列的每年平均Replikin浓度、和pB2基因区的鉴定的Replikin Peak基因(RPG)的公众可得的肽序列的每年平均Replikin浓度。
表4A-马流感
年份   pB1基因的Replikin浓度 SD   pB1中RPG的Replikin浓度 SD   pA中RPG的Replikin浓度   pB2中RPG的Replikin浓度
  1972   1.8   0   2.4
  1977   16.7   0   16.7   0   2.4
  1978   11   12.7   11   12.7   2.4
  1979   22.2   0   22.2   0   2.4
  1980   6.7   8.8   6.7   8.8   2.3
  1982   17.8   0   17.8   0   2.4
  1985   20.6   2.4   20.6   2.4   2.4
  1986   13.3   11.1   13.3   11.1   3.4   2.3
  1987   19.1   2.7   19.1   2.7   2.4
  1991   9.3   10.4   9.3   10.4   4.6   2.4
  1992   15.6   0   15.6   0.2   2.4
  1998   2.2   0   2.2   0   3.8
  1999   2   0   2   0   0.2
  2000   0.6
  2001   9.9   11.2   9.9   11.2   2.2   2.4
  2002   4.6   6.1   4.6   6.1   2.2   2.4
  2003   2   0   2   0.2   3.1   2.4
  2004   2.2   0.2   2.2   0.2   2.2   2.4
  2005   18.5   2.8   18.5   2.8   2.3
  2006   3.5
  2007   2.1
[000254]图7中,系列1反映基因组pB1区的Replikin Peak基因中鉴定的平均Replikin浓度。系列2反映pB1基因区中平均Replikin浓度的标准差。每对的第一条柱中大的标准差是值得注意的,因为标准差随着平均Replikin浓度增加而降低。一旦具有较高Replikin浓度的更毒的病毒株已经存在,Replikin Peak基因pB1区中标准差的这种增加很可能反映病毒群体中的异质性。较高的标准差表示更大差异的病毒群体,其中一些成员相对地休眠而增加数目的成员在快速复制。随着在暴发前“积累”增加,更多成员增加地快速复制,从而提升平均Replikin浓度。相反,如上表4A所见,相邻基因组区诸如pA和pB2中Replikin浓度的稳定性证实定量测量Replikin浓度的可再现性和休眠区中Replikin浓度多年的恒定性,以及pB1区中增加的高水平的特异性。随着更毒的一株或复数株进入流行阶段和较低毒的株(具有较低Replikin浓度)变得较低竞争性和在宿主群体中分离株以更少百分比存在,标准差随后降低。就发明人的了解,还未发现病毒结构中如此高特异性变化与宿主中结果关联。
[000255]具体地,图7中系列3反映基因组中pB1基因区相邻的pA基因区的Replikin Peak基因中鉴定的Replikin浓度。观察到pA基因区中Replikin Peak基因的Replikin浓度在分析年份内显著恒定,从不超过5。这种恒定显然与在pB1基因区中注意到的Replikin浓度广泛变化不同。这些对照数据验证病毒现有分离株的pB1基因区中最显著的Replikin Peak基因的位置。由于pA基因紧邻pB1基因,这些相邻区之间Replikin浓度的变化量级的差异是相当显著的。
[000256]具体地,图7中系列4反映基因组中也与pB1基因区相邻的pB2基因区的Replikin Peak基因中鉴定的Replikin浓度。也观察到pB1基因区中Replikin Peak基因的Replikin浓度在分析年份内显著恒定,不超过4。这种恒定显然也与在pB1基因区中注意到的Replikin浓度广泛变化不同。同样,这些对照数据验证病毒现有分离株的pB1基因区中最显著的Replikin Peak基因的位置。由于pB2基因紧邻pB1基因,这些相邻区之间Replikin浓度的变化差异也是显著的。
VII.使用RPGs和相关Replikin序列预测和治疗口蹄疫病毒(FMDV)暴发的方法
[000257]口蹄疫病毒(FMDV)的VP1蛋白(包含病毒基因组的RPG)中Replikin浓度增加预测病毒毒力和致死性增加并允许预测即将到来的暴发或毒力或致死性增加。申请人已经回顾了在www.pubmed.com具有登记号的1969至2006年的FMDV分离株的所有公众可得的氨基酸序列并已经鉴定了与一些已知的口蹄疫暴发相关和预测一些已知的口蹄疫暴发的FMDV的VP1蛋白(例如SEQ ID NO:157)中Replikin浓度增加。图11说明基于每年的基础口蹄疫病毒分离株的VP1蛋白中观察到的Replikin计数与观察到的暴发之间的关系。
[000258]申请人回顾了提供全血清型-O FMDV VP1多蛋白的氨基酸序列的登记号ABM63320(SEQ ID NO:157),并鉴定了二个RPG。第一RPG开始于氨基酸残基925并持续至氨基酸残基1018,计算机分离为SEQID NO:124。在第一RPG中分离了五个Replikin序列(SEQ ID NO:125-129),对第一RPG提供Replikin计数为6.3。第一RPG代表VP1多蛋白的片段的Replikin Peak基因。
[000259]第二Replikin Peak基因开始于氨基酸残基1300并持续至氨基酸残基1481,计算机分离为SEQ ID NO:130。在第二RPG(SEQ ID NO:131-156)中分离二十六个Replikin。第二Replikin Peak基因区的Replikin计数为14.3并代表报道的全VP1多蛋白的Replikin Peak基因。SEQ IDNO:130的RPG中的保守Replikins还包含在例如,登记号ABA46641、AAG43385、AAP81678和ABG77564报道的序列片段。同样地,SEQ IDNO:124的RPG的部分包含在这些登记号中。
[000260]在SEQ ID NO:157(登记号ABM63320)的氨基末端分离SEQ ID NO:158-160为Replikins。在分子中部,分离SEQ ID NO:161-194为Replikins。在羧基末端,分离SEQ ID NO:195-213为Replikins。这些Replikin序列的各个都是用于免疫原性组合物和疫苗和用于如本文描述的其它诊断、治疗和预测目的的优选序列。
[000261]图11说明在1969和2006年之间基于每年在具有公众可得的登记号的口蹄疫病毒普通血清型-O的分离株的VP1蛋白中观察到的Replikin序列的浓度。注意到在欧洲和英国观察到的口蹄疫暴发,其与在疾病暴发前观察到的Replikin计数增加相关。
[000262]可预测列出的流行以及未来的暴发,例如,通过回顾FMDV分离株的Replikin计数和比较特定年份VP1蛋白的Replikin计数或VP1蛋白中RPG的Replikin计数与其它年份的Replikin计数。从一年到下一年和优选地一、二或三年中Replikin计数的显著增加提供可开始暴发口蹄疫的FMDV的新出现株的预测价值。可预测从观察到Replikin计数显著增加的约六个月至约一年或更久时间内的口蹄疫暴发。
[000263]更优选地,可预测从观察到Replikin计数在二或三年中显著增加的约六个月至约一年内的口蹄疫暴发。可同样地预测从显著增加之后最初观察到Replikin计数减少的约六个月至约一年内的暴发。使用该方法,申请人在暴发前数月预测了英国FMDV在2007年8月3日的暴发。
[000264]图11的数据提供于下表5。注意到1958和1962年的数据是可得的,但未包括在图11中。还注意到1959至1961、1963至1968和2004年数据是不可得的。
表5-FMDV血清型O Replikin计数
  年份   血清型-OFMDV VP1的登记记录   Replikin计数   标准差   显著性(与最低值相比)   显著性(与上年相比)
  1958   1   3.8   0.0
  1962   172   0.8   0.2   最低p<0.001
  1969   1   0.4   0.0   上年p<0.001
  1970   2   0.7   0.4   最低p<0.05   上年p<0.40
  1971   1   3.3   0.0   上年p<0.05
  1972   1   0.5   0.0
  1973   1   0.5   0.0
  1974   7   1.1   0.3   最低p<0.001   上年p<0.001
  1975   6   1.0   0.5   最低p<0.001   上年p>0.50
  1976   4   1.2   0.1   最低p<0.001   上年p<0.40
  1977   4   1.0   0.4   最低p<0.001   上年p<0.20
  1978   8   1.0   0.1   最低p<0.001   上年p>0.50
  1979   47   2.5   1.4   最低p<0.001   上年p<0.001
  1980   5   1.5   0.5   最低p<0.001   上年p<0.001
  1981   2   0.8   0.3   最低p<0.04   上年p<0.10
  1982   21   0.9   0.1   最低p<0.001   上年p>0.50
  1983   6   0.9   0.4   最低p<0.001   上年p>0.50
  1984   1   1.2   0.0   上年p<0.10
  1985   3   1.2   0.7   最低p<0.02   上年p>0.50
  1986   2   0.8   0.5   最低p<0.05   上年p>0.50
  1987   1   3.6   0.0   上年p<0.05
  1988   3   1.2   0.0
  1989   6   1.3   0.8   最低p<0.001   上年p>0.50
  1990   5   2.0   1.3   最低p<0.02   上年p<0.30
  1991   7   3.5   2.4   最低p>0.50   上年p<0.10
  1992   9   2.1   1.0   最低p<0.001   上年p<0.10
  1993   16   2.2   1.4   最低p<0.001   上年p>0.50
  1994   18   2.2   1.1   最低p<0.001   上年p>0.50
  1995   12   2.0   0.8   最低p<0.001   上年p>0.50
  1996   12   1.6   1.1   最低p<0.001   上年p<0.30
  1997   48   2.6   1.1   最低p<0.001   上年p<0.01
  1998   72   1.2   1.1   最低p<0.001   上年p<0.001
  1999   49   2.3   1.3   最低p<0.001   上年p<0.001
  2000   61   1.3   0.8   最低p<0.001   上年p<0.001
  2001   8   1.8   0.9   最低p<0.001   上年p<0.10
  2002   2   1.1   0.2   最低p<0.02   上年p<0.05
  2003   8   1.3   0.5   最低p<0.001   上年p<0.40
  2005   8   1.3   1.0   最低p<0.001   上年p>0.50
  2006   3   3.8   3.1   最低p>0.50   上年p<0.20
A.使用所有血清型的VP1蛋白预测
[000265]除了血清型-O的FMDV VP1蛋白,申请人还从PubMed分析了FMDV VP1蛋白的所有报道血清型的分离株的公众可得的序列。数据提供于下表6。注意到Replikin计数增加与2001年英国(和其它欧洲国家)和2007年英国的两次流行关联。还注意到静止期间的低Replikin计数。Replikin计数从1998年的1.6增加到1999年的2.5、流行年2001年的2.7。然后在流行后,注意到三个更低Replikin计数的年份:2002年1.5、2003年1.5和2005年1.1(2004年无公众可得的序列)。随后Replikin计数上升到2006年的2.8,就在2007年暴发前。注意到相对于上年的Replikin计数的p值小于0.001。
表6-FMDV(所有分离株)
  年份   FMDV VP1蛋白的登记记录   Replikin计数   标准差   显著性(与最低值相比)   显著性(与上年相比)
  1998   92   1.6   ±1.2   最低p<0.001   上年p<0.001
  1999   60   2.5   ±1.3   最低p<0.001   上年p<0.001
  2000   115   1.7   ±1.4   最低p<0.001   上年p<0.001
  2001   32   2.7   ±1.0   最低p<0.001   上年p<0.001
  2002   3   1.5   ±0.8   最低p<0.05   上年p<0.02
  2003   10   1.5   ±0.8   最低p<0.001   上年p>0.50
  2005   43   1.1   ±0.6   最低p<0.001   上年p<0.10
  2006   36   2.8   ±0.9   最低p<0.002   上年p<0.001
B.使用血清型C的VP1蛋白预测
[000266]表7提供1955至2006年之间一些年份的血清型-C FMDV分离株的Replikin计数数据。注意到1998和1999年相对于Replikin计数低值的显著增加(在2001年英国流行之前)和2006年相对于低值的显著增加(在2007年英国暴发之前)。不具有可得数据的年份未反映在该表中。
表7-FMDV血清型C
  年份   血清型C的登记记录   Replikin计数   标准差   显著性(与最低值相比)   显著性(与上年相比)
  1955   1   2.7   0.0
  1957   1   2.8   0.0
  1979   12   1.4   0.5   最低p<0.001   上年p<0.001
  1982   2   2.1   1.6   最低p>0.50   上年p>0.50
  1988   1   1.1   0.0   上年p>0.50
  1989   1   1.1   0.0
  1991   3   0.5   0.0   最低p<0.001   上年p<0.001
  1992   2   0.5   0.0   最低p<0.001   上年p>0.50
  1993   5   0.5   0.0   最低p<0.001   上年p<0.40
  1997   2   1.4   1.3   最低p<0.30   上年p<0.30
  1998   2   2.9   0.0   上年p<0.20
  1999   4   3.1   0.4   最低p<0.10   上年p<0.40
  2006   10   3.0   0.2   最低p<0.001   上年p>0.50
[000267]以上注意到并阐释于图11的Replikin浓度与病毒暴发之间的关联性提供了通过监控所有可得的FMDV分离株的VP1蛋白中的Replikin浓度增加来预测口蹄疫暴发的方法。该方法还可采用病毒的所有可得的血清型-O分离株或血清型-C分离株。
[000268]FMDV的流行病学和病毒学不同于本文讨论的一些其它病毒诸如流感病毒的流行病学和病毒学。然而,FMDV VP1蛋白中Replikin计数增加与病毒暴发之间的关联性提供复合数据,确立与压倒性数目的其它检验的病毒和生物体共有的快速复制和毒力现象。
C.血清型O FMDV RPGs中的保守Replikins
[000269]在FMDV的血清型-O中,包含在Replikin Peak基因中的二个保守Replikin序列是hkqkivapvk(SEQ ID NO:91)和hpsearhkqkivapvk(SEQ ID NO:92)。报道hpsearhkqkivapvk序列点突变为hptearhkqkivapvk(SEQ ID NO:93)(下标处突变)发生在1967年和2007年分离株。Replikin序列hkqkivapvk(SEQ ID NO:91)从1962至2006年保守。Replikin序列hpsearhkqkivapvk(SEQ ID NO:92)从1962至2006年保守,除了点突变hptearhkqkivapvk(SEQ ID NO:93),其存在于报道导致1967年暴发(分离株O1BFS)和现在2007年在英国暴发的分离株中。这些分离的保守Replikin序列是本发明用于预测、诊断和治疗能力的特别优选实施方式。
[000270]表8提供1962至2006年包含保守序列hkqkivapvk(SEQ IDNO:91)的分离株的登记号和VP1蛋白序列中保守Replikin序列开始处的氨基酸位置。
表8-FMDV保守SEQ ID NO:91
  1962   CAC22210  位置202,AAP81678  位置153,AAP81677  位置153,AAP81676  位置153,AAP81675  位置153,AAP81674  位置153,ABA46701  位置201,ABA46700  位置201,ABA46699  位置201,ABA46698  位置201,ABA46697  位置201,ABA46696位置201,ABA46695  位置201,ABA46693  位置201,ABA46692  位置201,ABA46691  位置201,ABA46690  位置201,ABA46689  位置201,ABA46688  位置201,ABA46687  位置201,ABA46686  位置201,ABA46685  位置201,ABA46684位置201,ABA46683  位置201,ABA46682  位置201,ABA46681  位置201,ABA46679  位置201,ABA46678  位置201,ABA46677  位置201,ABA46675  位置201,ABA46674  位置201,ABA46673  位置201,ABA46672  位置201,ABA46671位置201,ABA46670  位置201,ABA46669  位置201,ABA46668  位置201,ABA46666  位置201,ABA46665  位置201,ABA46664  位置201,ABA46663  位置201,ABA46662  位置201,ABA46661 位置201,ABA46660  位置 01,ABA46659位置201,ABA46658  位置201,ABA46657  位置201,ABA46655位置201,ABA46654  位置201,ABA46653  位置201,ABA46652  位置201,ABA46651  位置201,ABA46650  位置201,ABA46649  位置201,ABA46648  位置201,ABA46647位置201,ABA46644  位置201,ABA46643  位置201,ABA46642  位置201,ABA46641  位置201,ABA46640  位置201,ABA46639  位置201,ABA46638  位置201,ABA46637  位置201,ABA46614  位置201,ABA46613  位置201,ABA46612位置201,ABA46611  位置201,ABA46610  位置201,ABA46609  位置201,ABA46606  位置201,ABA46605  位置201,ABA46604  位置201,ABA46603  位置201,ABA46602  位置201,ABA46601  位置201,ABA46600  位置201,ABA46597位置201,ABA46596  位置201,ABA46594  位置201,ABA46591  位置201,ABA46590  位置201,ABA46589  位置201,ABA46588  位置201,ABA46586  位置201,ABA46585  位置201,ABA46583  位置201,ABA46582  位置201,ABA46581位置201,ABA46580  位置201,ABA46579  位置 201,ABA46578  位置201,ABA46576  位置201,ABA46574  位置201,ABA46573  位置201,ABA46571  位置201,ABA46570  位置201,ABA46569  位置201,ABA46568  位置 201,ABA46566位置201,ABA46565  位置201,ABA46563  位置201,ABA46561  位置201,ABA46560  位置201,ABA46542  位置201,ABA46541  位置201,ABA46539  位置201,ABA46538  位置201,ABA46537  位置201,ABA46536  位置201,ABA46535位置201,ABA46534  位置201,ABA46533  位置201,ABA46532  位置201,ABA46531  位置201,ABA46559  位置201,ABA46540  位置201
  1969   CAB62584  位置724
  1972   CAC22304  位置202.
  1974   CAC22211  位置202,AAK69575  位置153,AAR85362  位置153,AAR85361  位置153,AAR22955  位置153,AAR22953  位置153.
  1975   AAK69576  位置153,CAC20174  位置201,AAR85363  位置153,AAG35653  位置724.
  1976   AAR22952  位置153,AAR22933  位置153,AAR22932  位置153.
  1977   AAR22963  位置153,AAR22950  位置153,CAC48179  位置201.
  1978   ABA46745  位置201,ABA46744  位置201,ABA46743  位置201,ABA46742  位置201,ABA46740  位置201,AAR22930  位置153.
  1979   CAC22173  位置43,AAQ88330  位置153,AAQ88328  位置153,AAQ88327  位置153,AAQ88325  位置153,AAQ88324  位置153,AAQ88323  位置153,AAQ88322  位置153,AAQ88321  位置153,AAQ88320  位置153,AAQ88319  位置153,AAQ88318位置153,AAQ88317  位置153,AAQ88316  位置153,AAQ88315  位置153,AAQ88314  位置153,AAQ88313  位置153,AAQ88312  位置153,AAG28368  位置43,AAG28367  位置43,AAG28366  位置43,AAG28362  位置43,AAG28357  位置43,AAG28356  位置43,AAG28355  位置43,AAG28354  位置43,AAG28353  位置43,AAG28352  位置43,AAG28348  位置43.
  1980   AAR22962  位置153,AAR22959  位置153,AAR22941  位置153.
  1981   AAR22951  位置153
  1982   CAC20178  位置201,AAZ31360  位置201,AAZ31359  位置201,AAZ31358  位置
  201,AAZ31357  位置201,AAZ31356  位置201,AAZ31355  位置201,AAZ31354位置201,AAZ31353  位置201,AAZ31352  位置201,AAZ31351位置201,AAZ31350  位置201,AAZ31349  位置201,AAZ31348  位置201,AAZ31347  位置201,AAZ31346  位置201,AAZ31345  位置201,AAZ31344  位置201,AAZ31343位置201,AAZ31342  位置201.
  1983   AAR22960  位置153,AAR22938  位置153,AAR22937  位置153.
  1985   CAC22326  位置90.
  1986   AAR22954  位置153.
  1987   AAK62003  位置43.
  1988   AAK69568  位置153,AAK69567  位置153.
  1989   CAC22174  位置90,AAR22961  位置153,AAK62024  位置69.
  1990   CAC22178  位置43,CAC22327  位置58.
  1991   CAC22175  位置43,CAC22328  位置62.
  1992   CAC22176  位置43,CAC22240  位置85,CAC48182  位置201.
  1993   CAC22179  位置43,CAC40792  位置201,CAC40789  位置201,CAC40796  位置102.
  1994   CAC22180  位置76,CAC22233  位置62,CAC22227  位置60,CAC22215  位置47,CAC22208  位置82,CAC22201  位置43,CAC22167  位置43,AAK62012  位置43,CAC40794  位置102,CAC40790  位置201,CAC40795  位置102,CAC40797  位置201.
  1995   CAC22231  位置152,CAC22216  位置44,CAC22171  位置103,AAK62022  位置69.
  1996   CAC22194  位置127,CAC51235  位置201,AAR22945  位置153,AAR22942  位置153,AAK62005  位置69.
  1997   CAC51273  位置201,CAC51268  位置201,CAC51249  位置201,CAC51236  位置201,AAL05257  位置43,AAL05249  位置43,AAL05248  位置85,AAL05247  位置62,AAL05246  位置76,AAL05245  位置43,AAL05243  位置56,AAL05242  位置43,AAL05236  位置43,AAL05235  位置65,AAL05234  位置43,AAL05233  位置43,AAL05232  位置43,AAL05231  位置43,AAL05230  位置43,AAL05229  位置43,AAL05228  位置43,AAL05227  位置85,AAL05226  位置43,AAL05225  位置76,AAL05223  位置43,AAL05222  位置43,AAL05221  位置43,AAL05220  位置122,AAL05219  位置43,AAL05218  位置52,AAL05217  位置43,AAL05216  位置66,AAL05214  位置43,AAL05213  位置93,AAL05211  位置58,AAL05207  位置43,AAL05206  位置62,AAL05205  位置67,AAL05196  位置64.
  1998   CAC22229  位置201,ABI16250  位置 201,ABI16249  位置201,ABI16248  位置201,ABI16247  位置201,ABI16246  位置 201,ABI16245  位置201,ABI16244  位置201,ABI16242  位置201,ABI16241  位置 201,ABI16240  位置201,ABI16239  位置201,ABI16238  位置201,ABI16237  位置 201,ABI16236  位置201,ABI16235  位置201,ABI16234  位置201,ABI16233  位置 201,ABI16232  位置201,ABI16231  位置201,ABI16230  位置201,ABI16229  位置 201,ABI16228  位置201,ABI16227  位置201,CAC51269  位置201,CAC51239  位置 201,CAC51238  位置201,AAR85364  位置153,AAR22957  位置153,AAL05256  位置43,AAL05255  位置43,AAL05254  位置43,AAL05253  位置43,AAL05250  位置43,AAL05244  位置43,AAL05241  位置43,AAL05240  位置43,AAL05238  位置43,AAL05237  位置45,AAL05212  位置43.
  1999   CAC22228  位置100,CAC22200  位置100,AAG43385  位置43,CAC51332  位置143,CAC51270  位置175,CAC51255  位置201,CAC51318  位置201,CAC5124  7位置201,CAC51246  位置201,CAC51245  位置201,CAD62370  位置925,CAD62369位置925,CAD62208  位置925,CAC20187  位置201,AAR22956  位置153,AAR22940  位置153,AAF06146  位置43,AAD41912  位置81,AAD41131  位置81,AAL05251  位置43,AAL05215  位置43,AAL05210  位置43,AAL05209  位置43,AAL05208  位置43,AAL05204  位置43,AAL05203  位置45,AAL05202  位置43,AAL05201  位置43,AAL05200  位置43,AAL05199  位置43,AAL05198  位置43,AAL05197  位置70,AAL05195  位置59,AAL05194  位置58,AAL05193  位置43,AAL05192  位置43,AAL05191  位置43.
  2000   CAC22209  位置201,AAL09392  位置153,AAL09391  位置153,AAK69397  位置153,ABF18551  位置43,AB F18550  位置43,ABF18549  位置43,ABF18548  位置43,CAC51275  位置201,CAC51271  位置 201,CAC51267  位置201,CAC51264  位置201,CAC51263  位置201,CAC51261  位置201,CAC51258  位置201,CAC51257位置 201,BAC06475  位置925,CAD62372  位置925,CAD62371  位置925,AAG27038  位置153,AAG27037  位置153
  2001   CAD62373  位置925,AAK92375  位置925,CAC35464  位置201,CAC35463  位置201,CAC35462  位置201,CAC35461  位置201,CAG23917  位置925,CAC86575位置 925.
  2002   AAR07959  位置153,AAM62134  位置201.
  2003   AAQ93493  位置925,AAR07963  位置153,AAR07962  位置153,AAR07961  位置153,AAR07960  位置153,AAR07965  位置153,AAR07964  位置153.
  2005   ABD14417  位置201,ABC55721  位置43,CAJ51080  位置201,CAJ51079  位置201,CAJ51078  位置201,CAJ51077  位置201,CAJ51076  位置201,CAJ51075  位置201.
  2006   ABG77563  位置197,ABG77564  位置30
[000271]表9提供1962至2006年包含保守序列hpsearhkqkivapvk(SEQ ID NO:92)或点突变hptearhkqkivapvk(SEQ ID NO:93)的FMDV分离株的登记号和VP1蛋白序列中保守Replikin序列开始处的氨基酸位置。
表9-FMDV SEQ ID NO:92或SEQ ID NO:93
  1962   AAP81678  位置147,AAP81677  位置147,ABA46700  位置195,ABA46699  位置195,ABA46698  位置195,ABA46697  位置195,ABA46696  位置195,ABA46695位置195,ABA46693  位置195,ABA46692  位置195,ABA46691  位置195,ABA46690  位置195,ABA46689  位置195,ABA46688  位置195,ABA46687  位置195,ABA46686  位置195,ABA46685  位置195,ABA46684  位置195,ABA46683位置195,ABA46682  位置195,ABA46681  位置195,ABA46679  位置195,ABA46678  位置195,ABA46677  位置195,ABA46675  位置195,ABA46673  位置195,ABA46672  位置 95,ABA46671  位置195,ABA46670  位置195,ABA46666位置195,ABA46665  位置195,ABA46664  位置195,ABA46663  位置195,ABA46662  位置195,ABA46661  位置195,ABA46659  位置195,ABA46658位置195,ABA46657  位置195,ABA46655  位置195,ABA46654  位置195,ABA46649位置195,ABA46648  位置195,ABA46647  位置195,ABA46644  位置195,ABA46643  位置195,ABA46642  位置195,ABA46640  位置195,ABA46639  位置195,ABA46638  位置195,ABA46637  位置195,ABA46614  位置195,ABA46613位置195,ABA46612  位置195,ABA46611  位置195,ABA46609  位置195,ABA46606  位置195,ABA46605  位置195,ABA46604  位置195,ABA46603 位置195,ABA46602  位置195,ABA46601  位置 195,ABA46600  位置 195,ABA46588位置195,ABA46581  位置195,ABA46574  位置195,ABA46573  位置195,ABA46571  位置195,ABA46570  位置 195,ABA46569  位置195,ABA46568  位置195,ABA46566  位置195,ABA46565  位置195,ABA46563  位置195,ABA46561位置195,ABA46539  位置195,ABA46538  位置195,ABA46537  位置195,ABA46536  位置195,ABA46535  位置195,ABA46531  位置195,ABA46559  位置195.
  1974   AAR85362  位置147,AAR85361  位置147.
  1975   CAC20174  位置195.
  1977   AAR22963  位置147,AAR22950  位置147.
  1978   ABA46743  位置195,ABA46742  位置195,ABA46740  位置195.
  1979   AAQ88330  位置147,AAQ88328  位置147,AAQ88325  位置147,AAQ88324 位置147,AAQ88323  位置147,AAQ88321  位置147,AAQ88319  位置147,AAQ88317位置147,AAQ88316  位置147,AAQ88315  位置147,AAQ88314  位置147,AAQ88313  位置147,AAQ88312  位置147,AAG28362  位置37,AAG28355  位置37
  1985   CAC22326  位置84.
  1987   AAK62003  位置37.
  1989   CAC22174  位置84,AAK62024  位置63.
  1990   CAC22178  位置37.
  1991   CAC22175  位置37,CAC22328  位置56.
  1992   CAC22240 位置79.
  1994   CAC22233 位置56.
  1995   CAC22216  位置38,CAC22171  位置 97.
  1996   CAC22194  位置121,CAC51235  位置 195,AAR22945  位置 147,AAR22942  位置 147,AAK62005  位置63.
  1997   CAC51273  位置195,CAC51268  位置195,CAC51249  位置195,CAC51236  位置195,AAL05249  位置37,AAL05248  位置79,AAL05247  位置56,AAL05246  位置70,AAL05245  位置37,AAL05243  位置50,AAL05242  位置37,AAL05236  位置37,AAL05235  位置59,AAL05234  位置37,AAL05233  位置37,AAL05229  位置37,AAL05228  位置37,AAL05221   位置37,AAL05207  位置37,AAL05196  位置58.
  1998   ABI16250  位置195,ABI16249  位置195,ABI16248  位置195,ABI16247  位置195,ABI16246  位置195,ABI16245  位置195,ABI16244  位置195,ABI16242  位置195,ABI16241  位置195,ABI16240  位置195,ABI16239  位置195,ABI16238  位置195,ABI16237  位置195,ABI16236  位置195,ABI16235  位置195,ABI16234  位置195,ABI16232  位置195,ABI16231  位置195,ABI16229  位置195,ABI16227  位置195,CAC51239  位置195,CAC51238  位置195,AAR22957  位置147,AAL05256  位置37,AAL05255  位置37,AAL05254  位置37,AAL05253  位置37,AAL05250  位置37,AAL05244  位置37,AAL05241  位置37,AAL05240  位置37,AAL05238  位置37,AAL05237  位置39
  1999   CAC22228  位置94,AAG43385  位置37,CAC51332  位置137,CAC51255  位置195,CAC51318  位置195,CAC51247  位置195,CAC51246  位置195,CAC51245  位置195,CAD62370  位置919,CAD62208  位置919,CAC20187  位置195,AAR22956位置147,AAF06146  位置37,AAL05251  位置37,AAL05210  位置37,AAL05209位置37,AAL05208  位置37,AAL05204  位置37,AAL05203  位置39,AAL05202位置37,AAL05201  位置37,AAL05200  位置37,AAL05198  位置37,AAL05195位置53,AAL05194  位置52,AAL05193  位置37.
  2000   CAC22209  位置195,AAL09392  位置147,AAL09391  位置147,AAK69397  位置147,ABF18551  位置37,ABF18550  位置37,ABF18549  位置37,ABF18548  位置37,CAC51275  位置195,CAC51271  位置195,CAC51267  位置195,CAC51264  位置195,CAC51263  位置195,CAC51261  位置195,CAC51258  位置195,CAC51257位置195,BAC06475  位置919,CAD62372  位置919,CAD62371  位置919,AAG27038  位置147,AAG27037  位置147,ABA46733  位置195,ABA46732  位置195,ABA46731  位置195,ABA46730  位置195,ABA46729  位置195,ABA46728位置195,ABA46727  位置195,ABA46726  位置195,ABA46725  位置195,ABA46724  位置195,ABA46722  位置195,ABA46721  位置195,ABA46720  位置195,ABA46719  位置195,ABA46717  位置194,ABA46716  位置195,ABA46715位置195,ABA46714  位置195,ABA46713  位置195,ABA46712  位置195,ABA46711  位置195,ABA46709  位置195,ABA46708  位置195,ABA46706  位置195,ABA46705  位置195,ABA46704  位置195,BAB18050  位置195.
  2001   CAD62373  位置919,AAK92375  位置919,CAC35464  位置195,CAC35463   位置195,CAC35462  位置195,CAC35461  位置195,CAG23917  位置919.
  2002   AAM62134  位置195.
  2003   AAQ93493  位置919.
  2005   ABD14417  位置195,ABC55721  位置37.
  2006   ABG77563  位置191.
[000272]登记号AAG43385(SEQ ID NO:107)报道1999年FMDV血清型O分离株,其部分包含SEQ ID NO:124的RPG并包含保守序列SEQID NO:91。在SEQ ID NO:107中,在氨基末端未鉴定到Replikin序列。在分子中部鉴定到Replikin序列SEQ ID NO:108。在羧基末端鉴定到Replikin序列SEQ ID NO:91。
[000273]登记号AAP81678(SEQ ID NO:111)报道1962年FMDV血清型O分离株,其部分包含SEQ ID NO:124的RPG并包含保守序列SEQID NO:91。登记号ABA46641(SEQ ID NO:114)同样地报道1962年FMDV血清型O分离株,其部分包含SEQ ID NO:124的RPG并包含保守序列SEQ ID NO:91和第199位存在单个未知残基的保守序列SEQ ID NO:92(SEQ ID NO:115)。在SEQ ID NO:114中,在序列的氨基末端或分子中部未鉴定到Replikin序列。在羧基末端分离了SEQ ID NO:115和116。
[000274]登记号ABG77564(SEQ ID NO:118)报道分离自2006年的FMDV血清型O,其部分包含SEQ ID NO:124的RPG并包含保守序列SEQ ID NO:91。在SEQ ID NO:118中,在序列的氨基末端未鉴定到Replikins。在分子中部鉴定SEQ ID NO:119-121和91为Replikins。且在羧基末端未鉴定到Replikins。
[000275]除了Replikin技术在这些实例中显示的诊断能力,还清楚第一次识别这类病毒肽,并发现其与快速复制、病毒暴发和高发病率和死亡率相关,使得本文说明的Replikins、尤其是Replikin Peak基因结构成为用于FMDV和其它病毒的治疗和疫苗的新的保守首要靶。例如,Replikin序列(SEQ ID NO:91-93)提供这种疫苗的不变靶。同样地,SEQ ID NO:124和130的RPGs和登记号序列(SEQ ID NO:108、115-116和119-121)中鉴定的Replikin序列是用于免疫原性组合物和疫苗的优选序列。因此本发明的实施方式是包括SEQ ID NO:91-93或SEQ ID NO:108、115-116和119-121的至少一种序列或其任何组合的疫苗。
VIII.使用RPGs和相关Replikin序列预测和治疗西尼罗病毒暴发的方法
[000276]申请人现在已经证实西尼罗病毒(WNV)的Replikin Peak基因(例如SEQ ID NO:245)中Replikin计数增加与病毒性疾病暴发、发病率和死亡率之间的关联性。见图12。申请人还已经证实全病毒基因组中Replikin计数与发病率和死亡率之间的关联性。见递交于2007年8月16日的美国临时申请序列第60/853,744号。
[000277]回顾1982-2007年WNV分离株的公众可得序列揭示,西尼罗病毒的包膜蛋白中的Replikin Peak基因现在已与毒力和致死性相关。在与1999至2006年美国的发病率和死亡率数据比较时,西尼罗病毒的包膜蛋白中的Replikin计数与发病率和死亡率数据之间的关联是清楚的。见图12。申请人对登记号ABA54585的包膜蛋白序列中的Replikin Peak基因(例如SEQ ID NO:245)的分析提供于以下实施例7。
[000278]图12说明1982至2006年基于每年的在PubMed登记号的包膜蛋白中观察到的Replikins的Replikin计数。基于每年的Replikin计数增加可与报道的美国病毒的发病率和报道的美国病毒感染的死亡率相关。
[000279]图12的数据提供于下表10。数据不可得的年份未包括在该表中。可观察到Replikin计数与1999至2006年美国群体中发病率和死亡率变化关联。数据进一步清楚:2004年Replikin计数相对减少随后是2004和2005年美国西尼罗病毒相对静止的一段时间。此外,开始于2000年,随着Replikin计数增加,发病率和死亡率增加。
表10-WNV包膜蛋白
  年份 PubMed登记号-Replikin计数   分离株   平均RC   S.D.   显著性   发病  死亡
  1982 84028435 111   1   3.2   0.0
  1985 P06935 109 NP_776014 109 NP_041724 109 NP_776013 109 NP_776012 109 AAA48498 109   6   3.2   0.0  最低p<.001
  1988 P14335 95 BAA00176 95   2   2.8   0.0  上年p<.001
  1995 AAW80621 9   1   4.7   0.0
  1996 P51681 8   1   2.3   0.0
  1998 AAW81711 107 AAD28624 41   2   4.2   1.5 最低p>.50,上年p<.30
  1999 AAL10755 6 AAL10754 6 AAL10752 6 AAL10751 6 AAL10750 7 AAL10749 6 AAG49029 3 AAG49028 3 AAG49027 2 AAD31720 32 AAL10753 9 AAF26360 40 AAL10748 6 AAL10747 6 AAL10746 6 AAL10745 6 AAL10744 6 AAL10743 6 AAL10742 6 AAL10741 4 AAL10740 6 AAL10738 6 AAL10737 6 AAL10736 6 AAL10735 6 AAL10734 6 AAL10733 6 AAL10732 6 AAL10731 6 AAL10730 6 AAL10729 6 AAL10728 6 AAL10727 6 AAL10725 10 AAL10724 6 AAL10723 6 id=15919195 6 id=12246899 6 id=12246897 6 id=12246895 6 id=12246893 6 AAG49629 6 AAG49628 6 AAL10739 6 AAL10726 6 AAD28623 40 AAF20092 97 AAG02040 97 AAF18443 97 AAF20205 97 AAF20207 7 AAF20206 7 AAF20204 7   53   3.6   0.9 最低p<.005,上年p>.50   62  7
  2000 AAK06624 97 AAG02039 98 AAG02038 97   3   2.8   0.0 最低p<.001,上年p<.00   21  2
  1
  2001 AAM70028 28 AAL14222 30 AAL14221 30 AAL14220 30 AAL14219 30 AAL14218 30 AAL14217 30 AAL14216 30 AAL14215 30 AAK58104 30 AAK58103 31 AAK58102 30 AAK58101 30 AAK58100 30 AAK58099 31 AAK58098 30 AAK58097 30 AAK58096 30 AAK52303 30 AAK52302 30 AAK52301 30 AAK52300 30 AAK62766 32 AAK62765 32 AAK62764 32 AAK62763 32 AAK62762 32 AAK62761 32 AAK62760 32 AAK62759 32 AAK62758 32 AAK62757 32 AAK62756 32 AAL07765 6 AAL07764 6 AAL07763 6 AAL07762 6 AAL07761 6 AAK91592 20 AAM81753 97 AAM81752 97 AAM81751 97 AAM81750 97 AAM81749 97 AAM21941 32 AAK67141 7 AAK67140 7 AAK67139 7 AAK67138 7 AAK67137 7 AAK67136 7 AAK67135 7 id=14550088 7 id=14550086 7 id=14550084 7 id=14550082 7 id=14550080 7 id=14550078 7 id=14550076 7 id=14550074 7 id=14550072 7 id=14550070 7 AAK67124 3 AAK67123 7 AAK67122 7 AAK67121 7 AAK67120 7 AAK67119 7 AAK67118 7 AAK67117 7 AAK67116 7 AAK67115 7 AAK67114 7 AAK67113 7 AAK67112 7 AAK67111 7 AAK67110 7 AAK67109 7 AAK67108 7 AAK67107 7 AAK67106 7 AAK67105 7 AAK67104 7 AAK67103 7 AAK67102 7 AAK67101 7 AAK67100 7 AAK67099 7 AAK67098 7 AAK67097 7 AAK67096 7 AAK67095 7 AAK67094 7 AAK67093 7 AAK67092 7 AAK67091 7 AAK67090 7 AAK67089 7 AAK67088 7 AAK67087 7 AAK67086 7 AAK67085 7 AAK67084 7 AAK67083 7 AAK67082 7 AAK67081 7 AAK67080 7 AAK67079 7 AAK67078 7 AAK67077 7 AAK67076 7 AAK67075 7 AAK67074 7 AAK67073 7 AAK67072 7 AAK67071 7 AAK67070 5 AAK67069 7 AAK67068 7 AAK67067 7 AAK67066 7 AAK67065 7 AAK67064 7 AAL87748 19 AAL8774 7 18AAL87746 19 AAL87745 18 AAL37596 18 AAM21944 24   129   3.6   2.0  最低p<.02,上年p<.001   66  9
  2002 AAO26579 30 AAO26578 30 AAN77484 3 AAM09856 6 AAM09855 6 AAM09854 6 AAN85090 97 AAO73303 36 AAO73302 36 AAO73301 36 AAO73300 36 AAO73299 36 AAO73298 36 AAO73297 36 AAO73296 36 AAO73295 36 AAL87234 96   17   4.8   1.4  最低p<.001,上年p<.002   4,156  284
  2003 AAP20887 96 AAR17575 32 AAR17574 32 AAR17573 32 AAR17572 32 AAR17571 32 AAR17570 32 AAR17569 32 AAR17568 32 AAR17567 32 AAR17566 32 AAR17565 32 AAR17564 32 AAR17563 32 AAR17562 32 AAR17561 32 AAR17560 32 AAR17559 32 AAR17558 32 AAR17557 32 AAR17556 32 AAR17555 32 AAR17554 32 AAR17553 32 AAR17552 32 AAR17551 32 AAR17550 32 AAR17549 32 AAR17548 32 AAR17547 32 AAR17546 32 AAR17545 32 AAR17544 32 AAR17543 32 AAR17542 32 AAQ87608 16 AAQ87607 16 AAO87606 14 AAR10804 6 AAR10803 6 AAR10802 6 AAR1080 16 AAR10800 6 AAR10799 6 AAR10798 6 AAR10797 6 AAR10796 6 AAR10795 6 AAR10794 6 AAR10793 6 AAR10792 6 AAR10791 6 AAR10790 6 AAR10789 6 AAR10788 6 AAR10787 6 AAR10786 6 AAR10785 6 AAR10784 6 AAR10783 6 AAR10782 6 AAR10781 6 AAR10780 6 AAQ88403 10 AAQ88402 10 id=40288320 36 AAQ55854 97 AAR14153 36 id=92919472 97 AAR84614 95 AAR06948 36 AAR06947 36 id=37993725 36 id=37993723 36 id=37993721 36 id=37993719 36 id=37993717 36 AAR06941 36 AAR06940 36 AAR06939 36 AAR06938 36 AAR06937 36 id=37993705 35 id=37993703 36 id=37993701 36 id=37993699 36 id=37993697 36 AAR06931 36 AAQ00999 100 AAQ00998 97 AAP22087 97 AAP22086 97 AAP22089 97 AAP22088 96 AAP85247 6 AAP85246 6 AAP85245 6 AAP85244 6   107   5.2   1.5  最低p<.001,上年p<.30   9,862  264
  AAP85243 6 AAP85242 6 AAP85241 6 AAP85240 6 AAP85239 6 AAP85238 6 AAP85237 6 AAP78942 95 AAP78941 95
  2004   1S6NA 4 AAT11553 32 AAT11552 32 AAT11551 32 AAT11550 32 AAT11549 32 AAT11548 32 AAT11547 32 AAT11546 32 AAT11545 32 AAT11544 32 AAT11543 32 AAT11542 32 AAT11541 32 AAT11540 32 AAT11539 32 AAT11538 32 AAT11537 32 AAT11536 32 AAT11535 32 AAT11534 32 AAS75296 6 AAS75295 6 AAS75294 6 AAS75293 6 AAS75292 6 AAS75291 6 id=51095222 108 AAU00153 96 id=55669122 97 BAD34490 97 BAD34489 97 BAD34488 97 AAV68177 97 id=73913544 106 id=59876233 97 AAT92099 97 AAT92098 97 AAT02759 111 AAV52690 96 AAV52689 97 AAV52688 97 AAV52687 97 AAV49728 6 AAV49727 6 AAV49726 6 AAV49725 6 AAV49724 6 AAW56064 97 AAW56066 97 AAW56065 97 AAW28871 97   52   4.3   1.8   最低p<.001,上年p<.002   2,539   100
  2005   ABC18309 8 ABC18308 9 ABC02196 3 1ZTXE 5 AAY67877 9 AAY67876 11 AAY67875 11 AAY67874 8 AAY67873 8 AAY67872 8 AAY67871 8 AAY67870 8 AAY67869 8 AAY67868 8 AAY67867 8 AAY67866 8 AAY57985 8 ABB01532 97 AAZ32750 97 AAZ32749 97 AAZ32748 97 AAZ32747 97 AAZ32746 97 AAZ32745 97 AAZ32744 97 AAZ32743 97 AAZ32742 97 AAZ32741 97 AAZ32739 97 AAZ32737 97 AAZ32736 97 AAZ32734 97 AAZ32733 97 id=71483607 97 id=71483605 97 id=71483603 97 id=71483601 97 ABC40712 100 ABB01533 101 AAY55949 97 ABA62343 97 id=63098704 36 id=63098702 36 AAY29684 6 AAY29685 6 AAY29683 6 AAY29682 6 AAY29681 6 AAY29680 6 AAY29679 6 AAY29678 6 AAY29677 7 AAY29676 7 id=84028433 111 id=76446583 37 ABA43045 37 ABA43044 37 ABA43043 37 ABA43042 37 ABA43041 37 ABA43040 37 ABA43039 37 ABA43038 37 ABA43037 37 ABA43036 37 ABA43035 37 ABA43034 37 ABA43033 37 ABA43032 37 ABA43031 37 ABA43030 37 ABA43029 37 ABA43028 37 ABA43027 37 ABA43026 37 ABA43025 37 ABA43024 37 ABA43023 37 ABA43022 37 ABA43021 37 ABA43020 37 ABA43019 37 ABA43017 37 ABA43016 37 id=76446521 37 id=76446519 37 id=76446517 37 id=76446515 37 id=76446513 37 ABA43010 37 ABA43009 37 ABA43008 37 ABA43007 37 ABA43006 37 id=76446501 37 id=76446499 37 id=76446497 37 id=76781572 105 id=76781570 105 ABA54593 105 ABA54592 105 ABA54591 105 ABA54590 105 ABA54589 105 ABA54588 105 ABA54587 105 ABA54586 105 ABA54585 105 ABA54584 105 ABA54583 105 ABA54582 105 ABA54581 105 ABA54580 105 ABA54579 105 id=76781538 105 id=76781536 105 id=76781534 105 id=76781532 105 AAY54162 97   119   4.4   1.9   最低p<.001,上年p>.50   3,000   119
  2006   ABI81406 34 ABI81405 34 ABI81404 34 ABI81403 34 ABI81402 34 ABI81401 34 ABI81400 34 ABI81399 34 ABI81398 34 ABI81397 34 ABI81396 34 ABI81395 34 ABI81394 34 ABI81393 34 ABI81392 34 ABI81391 34 ABI81390 34 ABI81389 34 ABI81388 34 ABI81387 34 ABI81386 34 ABI81385 34 ABI81384 34 ABI81383 34 ABI81382 34 ABI81381 34 ABI81380 34 ABI81379 34 ABI81378 34 ABI81377 34 ABI81376 34 ABI81375 34 ABI81374 34 ABI81373 34 ABI81372 34 ABI81371 34 ABI81370 34 ABI81369 34 ABI81368 34 ABI81367 34 ABI81366 34 ABI81365 34 ABI81364 34 ABI81363 34 ABI81362 34 ABI81361 34 ABI81360 34 ABI81359 34 ABI81358 34 ABI81357 34 ABI81356 34 ABI81355 34 ABI81354 34 ABI81353 34 ABI81352 34 ABI81351 34 ABI81350 34 ABI81349 34 ABI81348 34 ABI81347 34 ABI81346 34 ABI81345 34 ABI81344 34 ABI81343 34 ABI81342 34 ABI81341 34 ABI81340 34 ABI81339   279   6.4   1.4   最低p<.001,上年p<.001   4269   177
  34 ABI81338 34 ABI81337 34 ABI81336 34 ABI81335 34 ABI81334 34 ABI81333 34 ABI81332 34 ABI81331 34 ABI81330 34 ABI81329 34 ABI81328 34 ABI81327 34 ABI81326 34 ABI81325 34 ABI81324 34 ABI81323 34 ABI81322 34 ABI81321 34 ABI81320 34 ABI81319 34 ABI81318 34 ABI81317 34 ABI81316 34 ABI81315 34 ABI81314 34 ABI81313 34 ABI81312 34 ABI81310 34 ABI81308 34 ABI81307 34 ABI81306 34 ABI81305 34 ABI81304 34 ABI81303 34 ABI81302 34 ABI81301 34 ABI81300 34 ABI81299 34 ABI81298 34 ABI81297 34 ABI81296 34 ABI81295 34 ABI81294 34 ABI81293 34 ABI81292 34 ABI81291 34 ABI81290 34 ABI81289 34 ABI81288 34 ABI81287 34 ABI81286 34 ABI81285 34 ABI81284 34 ABI81283 34 ABI81282 34 ABI81281 34 ABI81280 34 ABI81279 34 ABI81278 34 ABI81277 34 ABI81276 34 ABI81275 34 ABI81274 34 ABI81273 34 ABI81272 34 ABI81271 34 ABI81270 34 ABI81269 34 ABI81268 34 ABI81267 34 ABI81266 34 ABI81265 34 ABI81264 34 ABI81263 34 ABI81262 34 ABI81260 34 ABI81259 34 ABI81258 34 ABI81257 34 ABI81256 34 ABI81255 34 ABI81254 34 ABI81253 34 ABI81252 34 ABI81251 34 ABI81250 34 ABI81249 34 ABI81248 34 ABI81247 34 ABI81246 34 ABI81245 34 ABI81244 34 ABI81243 34 ABI81242 34 ABI81241 34 ABI81240 34 ABI81239 34 ABI81238 34 ABI81237 34 ABI81236 34 ABI81235 34 ABI81234 34 ABI81233 34 ABI81232 34 ABI81231 34 ABI81230 34 ABI81229 34 ABI81228 34 ABJ90133 32 ABJ90132 32 ABJ90131 32 ABJ90130 32 ABJ90129 32 ABJ90128 32 ABJ90127 32 ABJ90126 32 ABJ90125 32 ABJ90124 32 ABJ90123 32 ABJ90122 32 ABJ90121 32 ABJ90120 32 ABJ90119 32 ABJ90118 32 ABJ90117 32 ABJ90116 32 ABJ90115 32 ABJ90114 32 ABJ90113 32 ABJ90112 32 ABJ90111 32 ABJ90110 32 ABJ90109 32 ABJ90108 32 ABJ90107 32 ABJ90106 32 ABJ90105 32 ABJ90104 32 ABJ90103 32 ABJ90102 32 ABJ90101 32 ABJ90100 32 ABJ90099 32 ABJ90098 32 ABJ90097 32 ABJ90096 32 ABJ90095 32 ABJ90094 32 ABJ90093 32 ABJ90092 32 ABJ90091 32 ABJ90090 32 ABJ90087 32 ABJ90086 32 ABJ90085 32 ABJ90084 32 ABJ90083 32 ABJ90082 32 ABJ90080 32 ABJ90079 32 ABJ90078 32 ABJ90077 32 ABJ90076 32 ABJ90075 32 ABJ90074 32 ABJ90073 32 ABJ90072 32 ABJ90071 32 ABJ90070 32 ABJ90069 32 ABJ90068 32 ABJ90067 32 ABJ90066 32 ABD85083 99 ABD85082 99 ABD85081 99 ABD85080 99 ABD85079 99 ABD85078 99 ABD85077 99 ABD85076 99 id=90025142 99 id=90025140 99 id=90025138 99 id=90025136 99 id=90025134 99 ABD85070 99 ABD85069 99 ABD85068 99 ABD85067 99 ABD85066 99 ABD85065 99 ABD85064 99 ABG36517 36 ABD19513 97 ABD19512 96 ABD19511 97 ABD19510 97 ABI26622 40 ABI26621 40 id=89340787 97 id=89340785 97 id=89340783 97 ABD67759 97 ABD67758 97 ABD67757 97 ABD67756 97 ABD19642 97 id=87116125 97 id=87116123 97 2I69A 24
  2007   ABQ52692 97 ABO69610 36 ABO69609 36 ABO69608 36 ABO69607 36 ABO69606 36 ABO69605 36 ABO69604 36 ABO69603 36 ABO69602 36 ABO69601 36 ABO69600 36 ABO69599 36 ABO69598 36 id=134285072 36 id=134285070 36 id=134285068 36 id=134285066 36 id=134285064 36 ABO69592 36   20   5.3   0.6   最低p<.001,上年p<.001
[000280]经分析WNV全基因组的公众可得的序列的Replikin计数和与美国疾病控制中心的WNV发病率和死亡率数据比较,申请人观察到WNV的平均Replikin计数分别在2000、2004、2005和2006年之间显著地增加。如表11中可见,发现2000年观察到的平均Replikin计数2.8±0显著不同(p<0.001)于2004年观察到的平均Replikin计数3.8±1.7,发现2004年观察到的平均Replikin计数3.8±1.7显著不同(p<0.01)于2005年观察到的平均Replikin计数4.5±1.8,且最终,发现2005年观察到的平均Replikin计数4.5±1.8显著不同(p<0.001)于2006年观察到的平均Replikin计数6.0±1.1。
表11-WNV全基因组
  年份   WNV的登记记录   Replikin计数   标准差   显著性(与列出的上年相比)   发病   死亡
  2000   2   2.8   ±0.0   CDC 21   CDC 2
  2004   68   3.8   ±1.7   上年p<0.001   CDC 2,539   CDC 100
  2005   137   4.5   ±1.8   上年p<0.01   CDC 3000   CDC 119
  2006   211   6.0   ±1.1   上年p<0.001   CDC 4269   CDC 177
[000281]在2007年夏天,申请人回顾提供于表11的公众可得的序列中全WNV基因组的数据并清楚地预测在分析的各年之间观察到显著的增加之后,WNV感染将很可能增加毒力。就在申请人预测后,加州公共卫生部证实了申请人的预测,报道截止到2007年8月2日加州WNV感染已经是上年观察到感染的三倍并宣布加州三个县的卫生紧急状态。
[000282]WNV的流行病学和病毒学不同于本文讨论的一些其它病毒诸如流感、FMDV、PRRSV和PCV的流行病学和病毒学。然而,WNV包膜蛋白中Replikin计数增加与发病率和死亡率之间的关联性提供复合数据,确立与压倒性数目的其它检验的病毒和生物体共有的快速复制和毒力现象。
[000283]在本文描述的WNV和其它病毒和病原体中,可预测流行和未来暴发,例如,通过(1)回顾WNV分离株的Replikin计数并鉴定例如RPG和包膜蛋白中的RPG(例如SEQ ID NO:245),(2)比较特定年份RPG、包含RPG的蛋白或基因区或全病毒基因组中的Replikin计数与其它年份的Replikin计数。从一年到下一年和优选地一、二或三年中Replikin计数的显著增加提供可开始更高毒性的WNV暴发的WNV的新出现株的预测价值。可预测从观察到Replikin计数显著增加的约六个月至约一年或更久时间内的WNV暴发。
[000284]更优选地,可预测从观察到Replikin计数经过两或三年显著增加的约六个月至约一年内的WNV暴发,或如发明人在2007年预测的,可预测在观察到经过数年非常显著的增加之后的WNV暴发,诸如其中2000、2004和2006年之间Replikin计数具有小于至少0.001和经常小于0.001的p值。因此,可观察到经过多于一年的时间段诸如三、四、五或更多年的显著的增加。可同样地预测在显著的增加后从最初观察到可观察的Replikin计数减少约六个月至约一年内的暴发。使用该方法,申请人有希望地预测2007年WNV暴发的开始。该方法还可采用WNV单独株的分离株或所有WNV株的分离株。
[000285]本发明的实施方式提供WNV的基因组区段或蛋白或蛋白区段,其中表达的基因或表达的基因区段当与基因组其它区段或指名的基因相比时具有最高浓度的Replikins或Replikin计数(每100氨基酸的Replikins数目),即RPG。登记号ABA54585中的RPG(SEQ ID NO:245)报道于以下的实施例7。在RPG的诊断、预防、治疗和预测应用中鉴定了十二个Replikin序列(SEQ ID NO:246-257)。这些Replikin序列是免疫原性组合物和疫苗的优选实施方式。本发明进一步提供鉴定的RPG中的Replikin序列,其在基因组中随时间是保守的,并因此可作为相对不变的优选靶用于经由免疫原性响应和疫苗诊断和操纵WNV中的快速复制和毒力。
IX.使用Replikin序列预测和治疗猪呼吸和生殖综合征病毒(PRRSV)暴发的方法
[000286]PRRSV的Replikin浓度增加预测病毒毒力增加并允许预测即将到来的暴发或死亡率增加。回顾PRRSV分离株的证实病毒基因组或基因组区段、或蛋白或蛋白片段中Replikin浓度随时间增加或在各分离株之间增加的公众可得氨基酸序列用作预测暴发和被PRRSV感染的猪的发病率和死亡率增加的预测子。可手动分析或使用专有的搜索工具软件(来自REPLIKINS LLC,Boston,MA的ReplikinForecastTM)分析从PubMed或其它公共或私人来源公众可得的PRRSV分离株的序列。
[000287]发明人现在已经鉴定猪生殖和呼吸综合征病毒(PRRSV)的核壳体蛋白中的Replikin Peak基因,并已经证实2004至2007年PRRSV的核壳体蛋白中的Replikin计数增加与PRRSV在中国大暴发之间的关联性。实施例8。
[000288]图13说明PRRSV的核壳体蛋白(SEQ ID NO:353)中的Replikin计数。在2004至2007年观察到Replikin计数增加。该增加与猪生殖和呼吸综合征在中国的大暴发关联。进一步地,2005年平均值的标准差显著大于其它年份,证明Replikin计数的明显增加发生在2005年。发生在2005年基于标准差增加的大的增加被证实为2006年平均Replikin计数的增加。在2005年观察到的大的标准差表示该类的更多成员具有增加的Replikin计数。2005年的标准差是在2006和2007年的平均计数增加之前的早期警示。类似现象可在图7观察到。这些数据提供对RPG Replikin计数在病毒暴发中的预测价值的进一步证实并对RPG Replikin计数作为PRRSV和猪中病毒的一般预测工具提供特定支持。
[000289]本发明提供RPGs和鉴定的RPGs中的Replikin序列用于诊断、预防和治疗应用。例如,PRRSV和其它病毒、生物体和恶性肿瘤中鉴定的RPG中鉴定的各Replikin序列可用于诊断和治疗应用,包括疫苗、免疫原性组合物和抗体治疗。全Replikin Peak基因序列或其片段同样地可用于诊断、预防、治疗和预测应用。进一步地,病毒分离株中存在Replikin Peak基因是快速复制的指示。
[000290]如本文讨论的,申请人已经在PRRSV的核壳体蛋白内鉴定可得的PRRSV分离株的RPGs。鉴定这些RPGs不同于例如,申请人以前在H5N1流感的聚合酶区即RNA指导的RNA聚合酶或pB1蛋白中鉴定的Replikin Peak基因。在不同病毒的不同结构中鉴定Replikin Peak基因由申请人定义的Replikin序列的严格标准而成为可能。专有的软件ReplikinForecastTM(可从REPLIKINS LLC,Boston,MA许可)提供有效地调查公众可得的Replikin序列并鉴定和计算机分离Replikin Peak基因。
[000291]Replikin Peak基因在氨基酸数目和Replikin计数两方面的大小将取决于已分离和报道的全基因组、蛋白或其片段的序列大小。本发明进一步提供鉴定的Replikin Peak基因或区中的Replikin序列,其在基因组中随着时间保守,因此可用作相对不变的靶用于诊断和操纵PRRSV的快速复制和毒力。
[000292]进一步,已经在分别报道为登记号AAM 18565、AAP81809和ABL60920的中国PRRSV分离株中鉴定以下RPGs:
(1)k7q8q9k10k11k12k13g14n15g16q17p18v19n20q21l22c23q24m25l26g27k28i29i30a31q32q33n34q35s36r37g38k39g40p41g42k43k44
Figure A20088000249401041
k47k48n49p50e51k52p53h54f55p56l57a58t59e60d61d62v63r64h65h66(中国2000)(SEQ ID NO:341)
(2)k7q8q9k10r11k12k13g14d15g16q17p18v19n20q21l22c23q24m25l26g27k28i29i30a31q32q33n34q35s36r37g38k39g40p41g42k43k44
Figure A20088000249401042
k47k48n49p50e51k52p53h54f55p56l57a58t59e60d61d62v63r64h65h66(中国2003)(SEQ ID NO:342),和
(3)k7q8q9k10k11k12k13g14n15g16q17p18v19n20q21l22c23q24m25l26g27k28i29i30a31q32q33n34q35s36r37g38k39g40p41g42k43k44
Figure A20088000249401043
k47k48n49p50e51k52p53h54f55p56l57a58t59e60d61d62v63r64h65h66(中国2006)(SEQ ID NO:343)
[000293]鉴定的RPG序列在2000、2003和2006年分离株之间是相同的,除了在第45和46位的点突变(标为粗体下划线)。因此,这些序列是用于诊断和操纵PRRSV的快速复制和毒力的相对不变的靶并可用作针对该疾病的疫苗。
[000294]点突变,诸如上列中国分离株中第45和46位的点突变,提供极好的预测能力。在2006年以ABL60920(SEQ ID NO:343)公开的高度毒性和致命的中国变体中,第45和46位的天冬酰胺和精氨酸是与以登记号ABF 19568公众可得的2006年墨西哥PRRSV高度毒性分离株的RPG中残基21和22处的天冬酰胺和精氨酸位于相同相对位置的相同残基(相当的突变残基标为粗体下划线):k14g15p16g17k18k19k20
Figure A20088000249401044
k23r24n25p26e27k28p29h30f31p32133a34t35e36d37d38v39r40h41h42(SEQ ID NO:344)。
[000295]因此这二个RPG序列尤其能预测毒力并是用于免疫原性组合物和疫苗的优选序列。在PRRSV的其它RPG序列中鉴定这些残基提供高可能性的毒力和经由抗体治疗、疫苗和其它治疗攻击病毒的极好的靶。
X.使用Replikin序列预测和治疗猪圆环病毒(PCV)暴发的方法
[000296]PCV的Replikin浓度增加预测病毒毒力增加并允许预测即将到来的暴发或死亡率增加。回顾PCV分离株的证实病毒基因组或基因组区段、或蛋白或蛋白片段中Replikin浓度随时间或在分离株之间增加的公众可得氨基酸序列用作预测暴发和被PCV感染的猪的发病率和死亡率增加的预测子。可手动分析或使用本文描述的软件分析从PubMed或其它公共或私人来源公众可得的PCV分离株的序列。
[000297]申请人现在已经确立PCV中Replikin计数与毒力增加之间的关联性。申请人回顾在www.pubmed.com具有登记号的PCV分离株的公众可得氨基酸序列并鉴定病毒基因组中Replikin计数增加,其预测暴发和被PCV感染的猪的死亡率增加。
[000298]图21的数据提供于以下实施例15中的表25。2000至2007年可观察到Replikin计数的大体增加并可与2000至2006年加拿大报道的该疾病发生率和死亡率增加关联。进一步地,1997年非常大的Replikin计数数目随后是1998至2000年的明显减少,可与2000年开始的暴发增加关联。在其它病毒中,在Replikin计数大的增加后约1至3年已经观察到暴发,接着是显著减少。见例如,图2、3和9。图21的图证实Replikin计数的循环方式,该方式回忆Replikin计数与例如,在图2、3和9中流感和SARS中显示的流行的关联性。
[00299]尤其是,在1997年观察到PCV的Replikin计数为9.4(±10.8)并在2000年快速减少至2.9(±1.2)。随后2002年Replikin计数升高至3.5(±1.4)和再次升高至2007年的3.9(±1.2)。在该时间段期间,观察到加拿大猪群中毒力和死亡率增加(在中美洲有另外报道的发生)。在1997-1999年观察到的大的标准差证明了经历基因组中Replikin序列浓度快速变化的病毒群体并指出毒力、发病率和死亡率的即将到来的变化。
[000300]可预测流行和未来暴发,例如,通过回顾PCV或PRRSV或其它病毒或病原体分离株的RPGs或其它部分的Replikin计数并比较特定年份的Replikin计数与其它年份的Replikin计数。从一年到下一年和优选地经过一、二或三或更多年Replikin计数的显著增加提供可开始更高毒性和/或更高致死性PCV暴发的PCV的新出现株的预测价值。
[000301]可预测从观察到Replikin计数显著增加的约六个月至约一年或更久时间内的PCV暴发。更优选地,可预测从观察到Replikin计数经过二或三年显著增加的约六个月至约一年内,或观察到经过数年强有力的显著增加,诸如其中2000至2002年和2005至2007年PCV的Replikin计数以小于0.001的每年相对于系列中最低平均Replikin计数的p值增加之后,的PCV暴发。
[000302]经过多于一年的时间段诸如三、四或五年或更久可观察到显著的增加。可同样地预测从明显增加后初次观察到可观察到的Replikin计数减少的约六个月至约一年或更久时间内的暴发。例如,1997至2000年PCV Replikin计数的明显减少预测开始于2000年并持续至至少2006年(此时2007年的发病率和死亡率数据还不可得)的病毒感染的发生率和死亡率增加。使用该方法,申请人例如有希望地预测2007年WNV暴发的开始。见图12。
[000303]发明人已经鉴定了猪圆环病毒(PCV)的复制酶蛋白中的Replikin Peak基因。鉴定1997年加拿大马尼托巴(Manitoba)PCV分离株中Replikin Peak基因(RPG)和2007年中国PCV株中RPG的实例提供于实施例9(SEQ ID NO:520和525)。实施例9证实鉴定的RPGs的可比较地高的Replikin计数并提供该病毒的分离株具有高毒力的预测。实施例9进一步提供RPGs和鉴定的RPGs中的Replikin序列作为靶以生产免疫原性组合物和疫苗。
[000304]本发明提供鉴定的Replikin Peak基因或基因区段中的Replikin序列用于诊断、预防和治疗应用。SEQ ID NO:324-328是提供于来自登记号AAC59472的RPG的Replikin序列。见实施例9。SEQ ID NO:329-340提供于来自登记号ABP68657的RPG。见实施例9。例如,上列的各序列作为鉴定的RPG中鉴定的Replikin序列可用于诊断和治疗应用,包括疫苗和抗体治疗。全Replikin Peak基因序列或其片段同样地可用于诊断、预防、治疗和预测应用。进一步地,病毒分离株中存在Replikin Peak基因是快速复制的指示。
[000305]已经在登记号AAC98885、AAL01075和ABP68667(SEQ IDNO:481、438和451)的PCV分离株中鉴定Replikin Peak基因(RPG)。见实施例9。对于每种鉴定的RPG,已经鉴定连续、不中断和重叠Replikin序列用于预测和治疗应用。
[000306]申请人到目前为止已经在可得的PCV分离株的推定复制酶蛋白的开放读码框1中和预测的1.8kD蛋白的开放读码框11中鉴定RPGs。在不同病毒的不同结构中鉴定Replikin Peak基因由申请人定义的Replikin序列的严格标准而成为可能。Replikin Peak基因在氨基酸数目和Replikin计数两方面的大小将取决于已分离和报道的全基因组、蛋白或其片段的序列大小。本发明进一步提供鉴定的Replikin Peak基因中的Replikin序列,其在基因组中随时间保守,因此可用作相对不变的靶以诊断和操纵PCV的快速复制和毒力。
XI.Replikin结构的保守性与毒力和致死性相关
[000307]任何结构的保守性对于该结构是否为攻击和破坏或者刺激提供稳定不变的靶是至关重要的。Replikin序列已经显示通常是保守的。当结构和生物体的基本存活机制以某种方式联系到一起时,所述结构往往是保守的。不断改变的结构提供不恒定的靶,这是一个避开攻击者(例如针对先前结构特异性产生的抗体)的良好策略,因此针对经修饰的形式是无效的。该策略被例如流感病毒所利用,致使以前的疫苗对于当前的毒性病毒可能是完全无效的。
[000308]然而,与存活功能的关系太密切的某些结构明显不能持续变化。Replikin结构的一种必需组分是组氨酸(h),已知组氨酸通常与氧化还原酶中的金属基团结合并且可能是复制所需的能量来源。因为该组氨酸结构保持恒定,所以Replikin序列结构都保持为用于破坏或刺激的更有吸引力的靶。
A.HIV中Replikin保守性
[000309]在HIV分离株的反式激活(Tat)蛋白中观察到Replikin序列保守性。Tat(反式激活蛋白)蛋白是调节慢病毒转录的早期RNA结合蛋白。这些蛋白是所有已知的慢病毒(lentivirases)例如人免疫缺陷病毒(HIV)的生命周期中的必需组分。Tat是一种通过结合反式激活反应序列(TAR)RNA元件而起作用的转录调节蛋白,其激活转录起始和/或从LTR启动子的延伸。如果没有tat,则HIV不能复制,但其化学基础尚不了解。在具有89至102个残基的HIV tat蛋白序列中,我们发现了一种与其它生物体中快速复制相关的Replikin。这种Replikin的氨基酸序列为hclvckqkkglgisygrkk(SEQ ID NO:3666)。事实上,申请人发现在每种HIV tat蛋白中都存在这种Replikin。一些tat氨基酸频繁地被替代氨基酸(以小写字体排列在频率最高的氨基酸之下,占优势Replikin(hclvcfqkkglgisygrkk)(SEQ ID NO:3314)的保守百分率)取代,如表12所示。这些取代显示于大多数个别氨基酸。然而,在所述Replikin序列内限定Replikin结构的关键性的赖氨酸和组氨酸在该序列中是100%保守的;而取代通常在别处的其它的氨基酸(在RePlikin之内和之外的氨基酸)中发生,没有取代发生在这些关键性的组氨酸上。表12中所列的序列是SEQ ID NO:3314和式肽(formula peptide)SEQ ID NO:3315的标示变异。
[000310]所述取代不能认为是随机的,由于除了限定Replikin结构的赖氨酸和组氨酸以外的氨基酸被取代。赖氨酸本身对取代“免疫”是不正确的,因为距离另一赖氨酸不是6至10氨基酸的赖氨酸被自由地取代,而是限定Replikin结构的那些赖氨酸未被取代。
表12-HIV TAT保守性(SEQ ID NO:3314和3671)
PubMed中报道的HIV tat蛋白的前117不同分离株中各组成氨基酸的%Replikin保守性:
38(100)57 86(100)(100)66 76(100)99 57 49(100)94(100)97 98 85 97 99(199)(100)(100)%
相邻氨基酸                    tat Replikin
k(c)s y [(h)(c)l v(c)f q k(k)g  (l)g i s y g (r)(k)(k)]
以下是对以上各氨基酸观察到的氨基酸取代:
h    c f    q i    l  h  t    a    a  l  y  h  q
r    w p    l l       i  h    q    v
y      s      s       l  m    r    s
i             s       m  s
s             r       n
v
a
f
p
q
B.人类和鸡H5N1中Replikin Peak基因的保守性
[000311]申请人在H5N1流感病毒的人类和鸡分离株中计算机分离了一系列保守Replikin序列(SEQ ID NO:1-11和14)。在以下年份以以下登记号在以下氨基酸残基位置鉴定了SEQ ID NO:1:(1997)AAK49342开始于位置134,AAK49340、134,AAF74320、134,AAF74319、134,AAF74318、134,AAF74317、134,AAK49344、134,AAK49343、134,AAK49341、134,AAK49339、134,AAK49338、134;(1998)AAK49345、134;(2003)BAE07200、134;(2004)AAW59551、131,AAW59549、129,ABE97897、123,ABE97896、123,ABE97895、123,ABE97892、123,ABE97891、123,AAV32651、134,AAV32643、134;(2005)ABG78563、109,ABG78562、109,ABF56657、127,ABF56656、127,ABF56655、127;(2006)ABK34973、134,ABL31779、134,ABL31765、134,ABL31754、134,ABL07029、134,ABL07018、119,ABL07007、134,ABI49406、134,ABI36481、134,ABI36470、134,ABI36451、134,和ABI36440、134。
[000312]在以下年份以以下登记号在以下氨基酸残基位置鉴定了SEQ ID NO:11:(2003)BAE07200,开始于位置19;(2004)AAW59551、16,AAW59549、14,ABE97897、8,ABE97896、8,ABE97895、8,ABE97894、8,ABE97893、8,ABE97892、8,ABE97891、8,ABE97890、8,ABE97889、8,ABE97888、8,AAV35115、19,AAV32651、19,AAV32643、19;(2005)ABC72649、19,ABF56657、12,ABF56656、12,ABF56655、12;(2006)ABK34973、19,ABL31779、19,ABL31765、19,ABL31754、19,ABL31743、19,ABI49414、19,ABL07029、19,ABL07018、4,ABL07007、19,ABI49406、19,ABI36481、19,ABI36470、19,ABI36451、19,ABI36440、19,ABI36429、19。
[000313]在2006年以以下登记号在以下氨基酸残基位置鉴定了SEQID NO:14:AB L31777、开始于位置41,ABI49393、41,ABL07016、41,ABL07005、41,ABI49404、41,ABI36472、41,ABI36461、41,ABI36452、41,ABI36441、41,和ABI36430、41。
[000314]从公开于登记号ABI36441(SEQ ID NO:15)的pB1基因区序列计算机分离了SEQ ID NO:14。在氨基末端鉴定了Replikin序列(SEQID NO:16-17)。在分子中部鉴定了Replikin序列(SEQ ID NO:18-32)。在羧基末端未鉴定到Replikin序列。90氨基酸残基中的十六个Replikin序列,提供Replikin计数为17.8。
[000315]还从登记号ABI36430(SEQ ID NO:33)计算机分离了SEQID NO:14。在氨基末端鉴定了Replikin序列(SEQ ID NO:34-35)。在分子中部鉴定了Replikin序列(SEQ ID NO:36-49)。在羧基末端未鉴定到Replikin序列。
[000316]还从登记号ABL07027(SEQ ID NO:50)计算机分离了SEQID NO:14。在氨基末端鉴定了Replikin序列(SEQ ID NO:51-52)。在分子中部鉴定了Replikin序列(SEQ ID NO:53-68)。在羧基末端鉴定了Replikin序列(SEQ ID NO:69-71)。
[000317]在以下年份以以下登记号在以下氨基酸残基位置鉴定了SEQ ID NO:2:(1997)Q9WLS3、184,O89749、184,AAK49358、184,AAF74316、184,AAK49362、184,AAK49357、184,AAK49356、184,CAB95863、184;(2003)BAE07199、184;和(2004)ABL97546、184,ABE97545、184,ABE97544、184,ABE97543、184,ABE97542、184,ABE97540、184,ABE97564、179,ABC72648、184,ABK34974、184。
[000318]在以下年份以以下登记号在以下氨基酸残基位置鉴定了SEQ ID NO:3:(1997)Q9WLS3、184,O89749、184,AAK49358、184,AAF74316、184,AAF74315、184,AAF74314、184,AAK49362、184,AAK493761、184,AAK49359、184,AAK49357、184,AAK49356、184,CAB95863、184;(1998)AAK49363、184;(2003)BAE07199、184;(2004)ABE97546、184,ABE97545、184,AGE97544、184,ABE97543、184,ABE97542、184,ABE97541、184,ABE97540、184,ABE97539、184,ABE97538、184,ABE97537、184,ABE97536、184,AAV35116、184,AAV32644、184;(2005)ABG78564、184,ABC72648、184;和(2006)ABK34974、184。
[000319]在以下年份以以下登记号在以下氨基酸残基位置鉴定了SEQ ID NO:7:(2003)BAE07200、128;(2004)AAW59551、125,AAW59549、123,ABE97897、117,ABE97896、117,ABE97895、117,ABE97894、117,ABE97893、117,ABE97892、117,ABE97891、117,ABE97890、117,ABE97889、117,ABE97888、117,AAV32651m 128,AAV32643、128;(2005)ABG78563、103,ABG78562、103,ABF56657、121,ABF56656、121,ABF56655、121;和(2006)ABL31779、128,AB31765、128,ABL31754、128,ABL31743、128,ABI49414、128,ABI49395、128,ABL07029、128,ABI36470、128,ABI36451、128,ABI36440、128,ABI36429、128。
[000320]在以下年份以以下登记号在以下氨基酸残基位置鉴定了SEQ ID NO:8:(1997)Q9WLS3、184,O89749、184,AAK49360、168,AAK49356、168,AAF74316、168,AAK49362、168,AAK49359、168,AAK49357、168,AAK49356、168,CAB5863、168;(2003)BAE07199、168;(2004)ABE97546、168,ABE97545、168,ABE97544、168,ABE97543、168,ABE97542、168,ABE97541、168,ABE97539、168,ABE97538、168,ABE97537、168,ABE97536、168,AAV35116、168,AAV32644、168;(2005)ABG78564、163,ABC72648、168;和(2006)ABK34974、168。
[000321]以上讨论的保守Replikin序列系列是本发明的优选实施方式并尤其可用作免疫原性化合物和疫苗,且这些序列的存在对H5N1暴发的时机、地理位置和致死性具有特定预测价值。
C.甲型流感株中Replikin骨架的保守性
[000322]下表13提供对Replikin骨架作为Replikin Peak基因在人类和禽类流感致死暴发中的作用的支持。在表13中,追踪了鹅Replikin和其同系物从1917年至现在禽类H5N1病毒暴发的历史。表13证实流感毒性株中鹅Replikin的“骨架”同源保守性。
[000323]表13以年或更短时间段说明鹅Replikin和其它流感Replikins中其同系物的蛋白结构的存在历史。表13进一步说明在那些同系物中氨基酸取代的历史和对限定Replikin和Replikins提供的快速复制功能是必需的Replikin结构的一些氨基酸的保守性。
[000324]表13说明固定的Replikin Peak基因骨架,其在从1917年鹅流感和1918年人类大流行到2007年H5N1‘禽流感’同系物的90年的保守性流感病毒Replikin肽中具有有序的非随机取代。
[000325]鹅Replikin是流感病毒血凝素蛋白中29氨基酸的肽RPG,开始于kk和结束于hh(SEQ ID NO:3672)。Replikins可包含重叠Replikins。仅当Replikin计数上升到高于3时该Replikin骨架才出现于病毒基因组中,并当临床暴发结束并且Replikin计数下降到少于3时再次消失。
表13-鹅Replikin骨架
Figure A20088000249401131
Figure A20088000249401141
Figure A20088000249401151
D.2007年H1N1分离株的Replikin骨架
[000326]现在已经在2007年泰国分离的一个H1N1人类病例中鉴定了Replikin骨架血凝素Replikin Peak基因。该证据说明H1N1正在卷土重来。已经鉴定的H1N1 Replikin骨架是knglypnlsksyannkekevlvlwgvhh(SEQID NO:2011),其与全血凝素Replikin计数为8.1和RPG中Replikin计数为28相关。2007年泰国分离株的RPG中Replikin计数高于1918年大流行H1N1分离株(登记号:IRUZL,RPG中Replikin计数为19)的RPG中的Replikin计数。实施例5提供发明人对2007年泰国分离株的分析。
E.流感、WSSV和TSV中的同源Replikin骨架序列
[000327]发明人已经进一步确立毒性流感病毒与虾病毒WSSV和TSV在病毒的Replikin骨架部分之间的关系,可见于下表14。尽管有广泛取代,证实虾白斑综合征病毒的数个短Replikins与流感病毒Replikin序列有显著的同源性,尤其是关于长度和关键赖氨酸(k)和组氨酸(h)残基。在桃拉综合征病毒观察到类似但较不广泛的同源性。这些同源性说明这些序列来源自共同的储库和/或在两组病毒中使用了类似的Replikin产生机制。
表14-虾白斑和桃拉综合征骨架化
Figure A20088000249401152
[000328]TSV比WSSV毒力低且TSV Replikin骨架的结构与流感病毒的关联不如WSSV Replikin骨架的结构与流感病毒的关联密切。在2000年,TSV的Replikin浓度为2.7。2001至2004年,TSV具有较低的平均Replikin浓度,低至0.7,且其Replikin骨架消失。2005年Replikin骨架重新出现,赖氨酸和组氨酸增加,且Replikin浓度相称地增加到1.8,随后是2006-2007年TSV暴发的增加。见表19。
F.Replikin Peak基因提供增加的预测和治疗能力
[000329]自从鉴定Replikin结构以后,在一定范围的病毒和生物体中已经观察到Replikin序列浓度增加与复制和毒力增加之间的关联性。通过现在计算机分离Replikin Peak基因,使得这些观察更准确。病毒基因组中Replikin序列浓度增加提供了预先警告和用于开发预测和治疗病毒暴发的有效方法的新靶,同时,鉴定基因组或蛋白的Replikin Peak基因中Replikin序列浓度增加提高了Replikin浓度变化的预测能力和新靶的效力。
[000330]例如,经由鉴定流感H5N1株(图1-6)、西尼罗病毒(图12)和口蹄疫病毒(图11)及其它病毒中的Replikin Peak基因,现在可更准确地预测毒力增加。在这些和其它病毒中,全基因组、基因组蛋白、基因组的Replikin Peak基因或包含RPG的蛋白中Replikin序列浓度的增加提供了预先警告和用于开发预测和治疗病毒暴发的有效方法的新靶。
[000331]通过在总体上监控病毒基因组中Replikin序列浓度的变化,可在新出现病毒性疾病在动物或人类宿主中的出现之前在病毒储库和载体中鉴定它们。鉴定新出现的病毒和病毒基因组中的Replikin序列允许适当的、预先的控制努力,包括分离和隔离,并提供足够时间用于合成和检验对新出现病毒的序列特异性的疫苗。
[000332]如以上讨论的,发明人已经鉴定流感病毒H3N8株的pB1基因区(SEQ ID NO:545)为病毒基因组中具有最高Replikin序列浓度的区域。还已在H5N1流感病毒中鉴定Replikin Peak基因并已将其与流行、毒力增加、发病率和人类死亡率关联。(图1-6)同样地,已在口蹄疫病毒的VP1蛋白中鉴定Replikin Peak基因并已将其与病毒暴发关联。图11。又已在口蹄疫病毒的VP1蛋白片段中鉴定第二Replikin Peak基因(或ReplikinPeak基因区),且病毒的Replikin Peak基因区中的二个特定Replikin序列已经与口蹄疫病毒的毒力关联(例如SEQ ID NO:124和130)。还已在西尼罗病毒中鉴定Replikin Peak基因(例如SEQ ID NO:258)。图12。已经在猪生殖和呼吸综合征病毒的核壳体蛋白和猪圆环病毒中进一步鉴定Replikin Peak基因(分别例如SEQ ID NO:341和520)。图13和19。
[000333]本发明提供鉴定的Replikin Peak基因或基因区段(基因区)中的Replikin序列用于诊断、预防和治疗应用。例如,鉴定的RPG中鉴定的各Replikin序列可用于诊断和治疗应用,包括疫苗和抗体治疗。全Replikin Peak基因序列或其片段同样地可用于诊断、预防、治疗和预测应用。进一步地,病毒分离株中存在Replikin Peak基因是快速复制的指示。对于各鉴定的RPG,已经鉴定连续、不中断和重叠的Replikin序列用于预测和治疗应用。Replikin Peak基因或Replikin Peak基因区在氨基酸数目和Replikin计数两方面的大小将取决于已分离和报道的全基因组、蛋白或其片段的序列大小。
[000334]本发明进一步提供鉴定的Replikin Peak基因或ReplikinPeak基因区中的Replikin序列,其在基因组中随时间保守,因此可用作相对不变的靶用于诊断和操纵EIV的快速复制和毒力。
[000335]当RPG中的点突变与高毒力关联时,该点突变提供极好预测能力,并提供极好的靶用于经由抗体治疗、疫苗和其它治疗攻击病毒,以及当这种点突变在新出现病毒株中鉴定时提供极好的预测能力。
[000336]本发明的进一步方面提供应用软件(utilizing software),所述软件搜索Replikin Peak基因并能够发现基因组中具有最高浓度Replikin的一个或复数个点、它们已经发生的年份、它们所发生的一种或复数种株、它们所发生的一种或复数种宿主、它们所发生的地理位置、它们在上述年份、株、宿主和地理位置的增加或减少、和可与毒力关联的点突变或小突变。
[000337]由软件方法计算机检测Replikin Peak基因现在允许在病毒和其它生物体中上调的Replikin基因活性的宿主和地理定位。如本研究中可观察到的,每年RPG Replikin分析通过与诸如流行暴发或致死性增加等功能关联,可第一次实际提供与功能的关联性的证据。
[000338]全基因组或RPG中的Replikin计数使得早于高死亡率感染的流行暴发(诸如由流感病毒造成的高死亡率感染,见于图1-6中的H5N1)的预测成为可能。这种检测和定位允许预先集中公共卫生准备以更好地保护无论动物还是人类宿主,并为生产和试验新疫苗提供时间。现在已经显示RPG的高Replikin计数与宿主中高致死性百分比一致地相关,无论宿主是植物、鱼、虾还是脊椎动物,包括H5N1禽流感人类病例。在暴发是临床上明显的之前一年或更久常常检测到计数增加(图2、3、10、11、19等)。现在疫苗可生产为直接靶向如结构上由全基因组中Replikins代表和集中在Replikin Peak基因的快速复制,而不是像现在那样靶向于功能未知的病毒表位。
[000339]可得出结论,Replikin代表一类的特定的肽,其广泛分布、保守、是致死性的数量标记。尽管不希望束缚于理论,保守Replikin结构在株之间明显转移的证据表示它们可为致死性的流动因子,在载体病毒之间水平地转移以到达多细胞宿主,在宿主中它们可快速复制而导致致死结果。作为新识别的用于预防和治疗的靶,Replikin提供可由此特异性地控制生物体和细胞的快速复制和致死性而不必破坏它们的平台。
G.PCV中用于诊断和治疗的保守Replikin
[000340]回顾猪圆环病毒的公众可得的序列时,申请人已经从登记号ABQ10608鉴定了在从1997或1998至2007年的许多分离株之间保守的三个Replikin序列:kngrsgpqphk(SEQ ID NO:345);hlqgfanfvkkqtfnk(SEQ IDNO:346)和kkqtfnkvkwylgarch(SEQ ID NO:347)。由于这些序列是保守的,它们具有预测价值并提供新的和优选的靶用于诊断和治疗应用,诸如例如,疫苗。而且,这些序列中的二个序列hlqgfanfvkkqtfnk(SEQ ID NO:346)和kkqtfnkvkwylgarch(SEQ ID NO:347)包含在登记号ABQ10608的鉴定的RPG中。因此,当毒性株包含所述序列时,这些序列在预测毒性株方面有优选价值。所述序列还提供优选的靶用于诊断和治疗应用,诸如例如,疫苗。
[000341]表15提供1997至2007年包含保守序列kngrsgpqphk(SEQID NO:345)的PCV分离株的登记号和PCV蛋白序列中保守Replikin序列开始的氨基酸位置。
表15-保守PCV序列
  1997   AAC59462  位置5.
  1998   AAC35330  位置5,AAC35320  位置5,AAC35309  位置5,AAC35298  位置5,CAA11157  位置5,AAC61860  位置5,AAC61741  位置5,AAC61739  位置5,AAC61737  位置5,AAD03086  位置5,AAD03071  位置5,AAD03061  位置5,NP_048061  位置5,AAD11928  位置5.
  1999   BAA88133  位置5,AAD50432  位置5,AAD38398  位置5,AAG41226  位置5,AAD37776  位置5,AAD45580  位置5,AAF35304  位置5,AAF35302  位置5,AAF35300  位置5,AAF35298  位置5,AAF35296  位置5,AAF35294  位置5,AAF35292  位置5,AAD12308  位置5.
  2000   CAC41085  位置5,CAC41084  位置5,CAC41083  位置5,AAL09364  位置5,AAL09363  位置5,AAF87238  位置5,AAF87236  位置5,AAF87234  位置5,AAF87232  位置5,AAF87230  位置5,AAF87228  位置5.
  2001   AAK60462  位置5,AAL58397  位置5,BAB69441  位置5,BAB69437  位置5,BAB69432  位置5,AAK56300  位置5,AAK56298  位置5,AAK56296  位置5,AAL01075  位置5.
  2002   AAM61272  位置5,AAM61262  位置5,AAM61268  位置5,AAM61266  位置5,AAM61270  位置5,AAM61264  位置5,AAO39760  位置5,AAM21847位置5,AAM21846  位置5,AAM21845  位置5,AAM21844  位置5,AAO24128  位置5,AAO24124  位置5,AAO24122  位置5,AAO23147  位置5,AAO23145  位置5,AAN81597  位置5,AAN06826  位置5,AAN62769  位置5,AAN62767  位置5,AAN62765  位置5,AAL69968  位置5,AAM76057  位置5,Q8BB16  位置5.
  2003   AAP51128  位置5,AAS65993  位置5,AAS65991  位置5,AAS65989  位置5,AAS65987  位置5,AAS65985  位置5,AAS65983  位置5,AAS65981  位置5,AAS65979  位置5,AAS65977  位置5,AAS65975  位置5,AAP83635  位置5,AAP83633  位置5,AAP83631  位置5,AAP83629  位置5,AAP83627  位置5,AAP83625  位置5,AAP83623  位置5,AAP83621  位置5,AAP83619  位置5,AAP83617  位置5,AAP83615  位置5,AAP83613  位置5,AAP83611  位置5,AAP83609  位置5,AAP83607  位置5,AAP83605  位置5,AAP83603  位置5,AAP83601  位置5,AAP83599  位置5,AAP83597  位置5,AAP83595  位置5,
  AAP83593  位置5,AAP83591  位置5,AAR03722  位置5,AAR03720  位置5,AAR03718  位置5,AAR03716  位置5,AAQ94098  位置5,AAQ94096  位置5,AAQ94094  位置5,AAQ94092  位置5,AAQ94090  位置5,AAQ94088  位置5,AAP44188  位置5,AAP44182  位置5,AAR97517  位置5,AAQ96327  位置5,AAQ23155  位置5,AAP42468  位置5,AAP42466  位置5,AAO61136  位置5,NP_937956  位置5,AAR03714  位置5.
  2004   AAW78475  位置5,AAW78473  位置5,AAW78471  位置5,AAW78469  位置5,AAW78467  位置5,AAW78465  位置5,AAW78463  位置5,AAV34139位置5,AAU87519  位置5,AAU87515  位置5,AAU87511  位置5,AAU87509位置5,AAU34001  位置5,AAT97650  位置5,AAT97648  位置5,AAT97646位置5,AAT36358  位置5,AAX49397  位置5,AAU01966  位置5,AAT72901位置5,AAT58234  位置5,AAS45844  位置5,AAS45843  位置5,CAJ31064位置5,AAU13780  位置5,AAX52911  位置5,AAU87505  位置5,AAT39479位置5,AAT39460  位置5,AAT37493  位置5,AAS66198  位置5,AAS66196位置5,AAS66194  位置5,AAS66192  位置5,AAS90297  位置5,AAS89260位置5,CAF25171  位置5.
  2005   ABJ98317  位置5,AAZ20800  位置5,AAZ20796  位置5,AAZ20794  位置5,AAW79865  位置5,ABC26025  位置5,ABA40480  位置5,AAZ78351  位置5,AAY40292  位置5,ABB29423  位置5,ABB29419  位置5,ABB29417  位置5,ABB29415  位置5,ABB29413  位置5,ABB29411  位置5,ABB29409  位置5,ABB29407  位置5,ABB29405  位置5,ABB29403  位置5,ABB29401  位置5,ABB29399  位置5,ABA60807  位置5,ABA60805  位置5,ABA40399  位置5,ABA40397  位置5,AAX10150  位置5,AAX62053  位置5,AAX62051  位置5,AAX62049  位置5,AAX62047  位置5,AAX62045  位置5,AAX62043  位置5,AAX62041  位置5,ABC75103  位置5,ABB20934  位置5,ABA26910  位置5,ABA26908  位置5,AAY34249  位置5.
  2006   ABI29887  位置5,ABG21279  位置5,ABG21277  位置5,ABG21275  位置5,ABG21273  位置5,ABG21271  位置5,ABG21269  位置5,ABG21267  位置5,ABJ98319  位置5,ABI93799  位置5,ABI93797  位置5,ABD59347  位置5,ABD42928  位置5,ABM88864  位置5,ABM88862  位置5,ABM88860  位置5,ABI17537  位置5,ABI17535  位置5,ABI17533  位置5,ABI17531  位置5,ABI17529  位置5,ABI17527  位置5,ABI17525  位置5,ABI17523  位置5,ABG37023  位置5,ABF71465  位置5.
  2007   ABQ10608  位置5,ABQ10606  位置5,ABQ10604  位置5,ABQ10603  位置5,ABP68669  位置5,ABP68665  位置5,ABP68661  位置5,ABP68657  位置5,ABP68655  位置5,ABP68651  位置5,ABP68647  位置5,ABP68645  位置5,ABP68643  位置5,ABP68641  位置5,ABP68639  位置5,ABP68635  位置5,ABP68633  位置5,ABP68631  位置5,ABP68629  位置5,ABP68627  位置5,ABP68625  位置5,ABP68623  位置5,ABP68621  位置5,ABP68619  位置5,ABP68617  位置5,ABP68615  位置5,ABO38130  位置5,ABM97550  位置5,ABQ63072  位置5,ABQ63070  位置5,ABQ63068  位置5,ABQ63066  位置5,ABQ63064  位置5,ABQ63062  位置5,ABQ51920  位置5,ABQ51918  位置5,ABR14585  位置5,ABP49176  位置5,ABP48091  位置5,ABP48089  位置5,ABP48087  位置5,ABP48085  位置5,ABP48083  位置5,ABP48081  位置5,ABO09999  位置5,ABO09997  位置5,ABO09995  位置5,ABO09993  位置5,ABO09991  位置5,ABO09989  位置5,ABO09987  位置5,ABP23690  位置5.
[000342]表16提供1997至2007年包含保守序列hlqgfanfvkkqtfnk(SEQ ID NO:346)的PCV分离株的登记号和PCV蛋白序列中保守Replikin序列开始的氨基酸位置。
表16-保守PCV序列
  1997   AAC59462  位置57.
  1998   AAC35330  位置57,AAC35320  位置57,AAC35309  位置57,AAC35298  位置57,CAA11157  位置57,AAC61860  位置57,AAC61741  位置57,AAC61739位置  57,AAC61737位置57,AAD03086  位置57,AAD03071  位置57,AAD03061  位置57,NP_048061  位置57,AAD11928  位置57.
  1999   BAA88133  位置57,AAD50432  位置57,AAD38398  位置57,AAG41226  位置57,AAD37776  位置57,AAD45580  位置57,AAF35304  位置57,AAF35302位置57,AAF35300位置57,AAF35298  位置57,AAF35296  位置57,AAF35294  位置57,AAF35292  位置57,AAD12308  位置57.
  2000   CAC41085  位置57,CAC41084  位置57,AAL09364  位置57,AAL09363  位置57,AAF87238  位置57,AAF87236  位置57,AAF87234  位置57,AAF87232位置57,AAF87230  位置57,AAF87228  位置57.
  2001   AAK60462  位置57,AAL58397  位置57,BAB69441  位置57,BAB69437  位置57,BAB69432  位置57,AAK56300  位置57,AAK56298  位置57,AAK56296位置57,AAL01075  位置57.
  2002   AAM61272  位置57,AAM61262  位置57,AAM61268  位置57,AAM61266位置57,AAM61270  位置57,AAM61264  位置57,AAO39760  位置57,AAM21845  位置57,AAM21844  位置57,AAO24128  位置57,AAO24126位置57,AAO24124  位置57,AAO24122  位置57,AAO23147  位置57,AAO23145  位置57,AAN81597  位置57,AAN06826  位置57,AAN62769  位置57,AAN62767  位置57,AAN62765  位置57,AAN16398  位置57,AAM83186位置57,AAM76057  位置57,Q8BB16  位置57,AAO95302  位置57.
  2003   AAP51128  位置57,AAS65993  位置57,AAS65991  位置57,AAS65989  位置57,AAS65987  位置57,AAS65985  位置57,AAS65983  位置57,AAS65981位置57,AAS65979  位置57,AAS65977  位置57,AAS65975  位置57,AAP83635  位置57,AAP83633  位置57,AAP83631  位置57,AAP83629  位置57,AAP83627  位置57,AAP83625  位置57,AAP83623  位置57,AAP83621位置57,AAP83619  位置57,AAP83617  位置57,AAP83615  位置57,AAP83613  位置57,AAP83611  位置57,AAP83609  位置57,AAP83607  位置57,AAP83605  位置57,AAP83603  位置57,AAP83601  位置57,AAP83599位置57,AAP83597  位置57,AAP83595  位置57,AAP83593  位置57,AAP83591  位置57,AAR03722  位置57,AAR03720  位置57,AAR03718  位置57,AAR03716  位置57,AAQ94098  位置57,AAQ94096  位置57,AAQ94094位置57,AAQ94092  位置57,AAQ94090  位置57,AAQ94088  位置57,AAP44188  位置57,AAP44185  位置57,AAP44182  位置57,AAR97517  位置57,AAQ96327  位置57,AAQ23155  位置57,AAP42468  位置57,AAP42466位置57,AAP42464  位置57,AAO61136  位置57,NP_937956  位置57,AAR03714  位置57.
  2004   AAW78475  位置57,AAW78473  位置57,AAW78471  位置57,AAW78469位置57,AAW78467  位置57,AAW78465  位置57,AAW78463  位置57,AAV34139  位置57,AAU87519  位置57,AAU87517  位置57,AAU87515  位置57,AAU87513  位置57,AAU87511  位置57,AAU87509  位置57,AAU87507位置57,AAU34001  位置57,AAU01913  位置57,AAT97650  位置57,AAT97648  位置57,AAT97646  位置57,AAT97644  位置57,AAT36358  位置57,AAX49397  位置57,AAU01966  位置57,AAT79579  位置57,AAT72901位置57,AAS45844  位置57,AAS45843  位置57,CAJ31064  位置57,AAU13780  位置57,AAX52911  位置57,AAU87505  位置57,AAT39479  位置57,AAT39460  位置57,AAT37493  位置57,AAS66198  位置57,AAS66196位置57,AAS66194  位置57,AAS66192  位置57,AAS66190  位置57,AAS90297  位置57,CAF25171  位置57.
  2005   ABJ98317  位置57,ABA29241  位置57,AAZ20802  位置57,AAZ20800  位置57,AAZ20798  位置57,AAZ20796  位置57,AAZ20794  位置57,AAW79865位置57,ABC26025  位置57,ABA40480  位置57,AAZ78351  位置57,AAX21515  位置57,ABB29423  位置57,ABB29421  位置57,ABB29419  位置57,ABB29417  位置57,ABB29415  位置57,ABB29413  位置57,ABB29411位置57,ABB29409  位置57,ABB29407  位置57,ABB29405  位置57,ABB29403  位置57,ABB29401  位置57,ABB29399  位置57,ABA60807  位置57,ABA60805  位置57,ABA60803  位置57,ABA40399  位置57,ABA40397位置57,AAZ66792  位置57,AAX10150  位置57,AAX62053  位置57,AAX62051  位置57,AAX62049  位置57,AAX62047  位置57,AAX62045  位置57,AAX62043  位置57,AAX62041  位置57,ABC75103  位置57,ABB20934位置57,ABA26910  位置57,ABA26908  位置57,AAY34249  位置57.
  2006   ABI29887  位置57,ABG21279  位置57,ABG21277  位置57,ABG21275  位置57,ABG21273  位置57,ABG21271  位置57,ABG21269  位置57,ABG21267位置57,ABJ98319  位置57,ABI93799  位置57,ABI93797  位置57,ABD59347  位置57,ABD42928  位置57,ABM88864  位置57,ABM88862  位置57,ABM88860  位置57,ABI17537  位置57,ABI17535  位置57,ABI17533位置57,ABI17531  位置57,ABI17529  位置57,ABI17527  位置57,ABI17525位置57,ABI17523  位置57,ABG37023  位置57,ABF71465  位置57.
  2007   ABQ10608  位置57,ABQ10606  位置57,ABQ10604  位置57,ABQ10603  位置57,ABP68669  位置57,ABP68667  位置57,ABP68665  位置57,ABP68663位置57,ABP68661  位置57,ABP68659  位置57,ABP68657  位置57,ABP68655  位置57,ABP68653  位置57,ABP68651  位置57,ABP68649  位置57,ABP68645  位置57,ABP68643  位置57,ABP68641  位置57,ABP68639位置57,ABP68637  位置57,ABP68635  位置57,ABP68633  位置57,ABP68629  位置57,ABP68619  位置57,ABP68617  位置57,ABP68615  位置57,ABO38130  位置57,ABM97550  位置57,ABQ63072  位置57,ABQ63070位置57,ABQ63068  位置57,ABQ63066  位置57,ABQ63064  位置57,ABQ63062  位置57,ABQ51920  位置57,ABQ51918  位置57,ABR14585  位置57,ABP49176  位置57,ABP48091  位置57,ABP48089  位置57,ABP48087位置57,ABP48083  位置57,ABP48081  位置57,ABO09997  位置57,ABO09995  位置57,ABO09993  位置57,ABO09991  位置57,ABO09989  位置57,ABO09987  位置57,ABP23690  位置57.
[000343]表17提供1998至2007年包含保守序列kkqtfnkvkwylgarch(SEQ ID NO:347)的PCV分离株的登记号和PCV蛋白序列中保守Replikin序列开始的氨基酸位置。
表17-保守的(Convserved)PCV序列
  1998   AAC35330  位置66,AAC35320  位置66,AAC35309  位置66,AAC35298位置66,CAA11157  位置66,AAC61860  位置66,AAC61739  位置66,AAC61737  位置66,AAD03086  位置66,AAD03071  位置66,AAD03061位置66,NP_048061  位置66,AAD11928  位置66.
  1999   AAG41226  位置66,AAD37776  位置66,AAD45580  位置66,AAF35304位置66,AAF35302  位置66,AAF35300  位置66,AAF35298  位置66,AAF35296  位置66,AAF35294  位置66,AAF35292  位置66,AAD12308位置66.
  2000   CAC41085  位置66,CAC41084  位置66,AAF87238  位置66,AAF87236位置66,AAF87234  位置66,AAF87232  位置66,AAF87230  位置66,AAF87228位置66.
  2001   AAL58397  位置66,BAB69441  位置66,BAB69437  位置66,BAB69432位置66,AAK56300  位置66,AAK56298  位置66,AAK56296  位置66,
  AAL01075  位置66.
  2002   AAM61272  位置66,AAM61262  位置66,AAM61268  位置66,AAM61266位置66,AAM61270  位置66,AAM61264  位置66,AAO39760  位置66,AAM21845  位置66,AAM21844  位置 66,AAO24128  位置66,AAO24124位置66,AAO24122  位置66,AAN81597  位置66,AAN06826  位置66,AAN16398  位置66,AAM83186  位置66,AAL69968  位置66,AAM76057位置66,Q8BB16    位置66.
  2003   AAP51128  位置66,AAS65993  位置66,AAS65991  位置66,AAS65989位置66,AAS65987  位置66,AAS65985  位置66,AAS65983  位置66,AAS65979  位置66,AAS65977  位置66,AAS65975  位置66,AAP83635位置66,AAP83633  位置66,AAP83631  位置66,AAP83629  位置66,AAP83627  位置66,AAP83625  位置66,AAP83623  位置66,AAP83621位置66,AAP83619  位置66,AAP83617  位置66,AAP83615  位置66,AAP83613  位置66,AAP83611  位置66,AAP83609  位置66,AAP83607位置66,AAP83605  位置66,AAP83603  位置66,AAP83601  位置66,AAP83599  位置66,AAP83597  位置66,AAP83595  位置66,AAP83593位置66,AAP83591  位置66,AAR03722  位置66,AAR03720  位置66,AAQ94098  位置66,AAQ94096  位置66,AAQ94094  位置66,AAQ94092位置66,AAQ94090  位置66,AAQ94088  位置66,AAP44188  位置66,AAP44182  位置66,AAQ96327  位置66,AAQ23155  位置66,AAP42466位置66,AAP42464  位置66,AAO61136  位置66.
  2004   AAW78479  位置63,AAW78475  位置66,AAW78471  位置66,AAW78469位置66,AAW78465  位置66,AAV34139  位置66,AAU87519  位置66,AAU87511  位置66,AAU87509  位置66,AAU34001  位置66,AAU01913位置66,AAT97648  位置66,AAT97644  位置66,AAT36358  位置66,AAX49397  位置66,AAT72901  位置66,AAS45844  位置66,AAS45843位置66,CAJ31064  位置66,AAU87505  位置66,AAT39479  位置66,AAT39460  位置66,AAT37493  位置66,AAS90297  位置66,AAS89260位置66,CAF25171  位置66.
  2005   ABJ98317  位置66,AAZ20802  位置66,AAZ20800  位置66,AAZ20798位置66,AAZ20796  位置66,AAZ20794  位置 66,AAW79865  位置66,AAY40292  位置66,ABB29423  位置66,ABB29421  位置66,ABB29419位置66,ABB29417  位置66,ABB29415  位置 66,ABB29413  位置66,ABB29411  位置66,ABB29409  位置66,ABB29407  位置66,ABB29405位置66,ABB29403  位置66,ABB29401  位置 66,ABB29399  位置66,ABA60807  位置66,ABA60805  位置66,ABA40399  位置66,ABA40397位置66,AAZ66792  位置66,AAX10150  位置 66,AAX62051  位置66,AAX62049  位置66,AAX62047  位置66,AAX62045  位置66,AAX62041位置66,ABB20934  位置66,ABA26908  位置66,AAY34249  位置66.
  2006   ABI29887  位置66,ABG21279  位置66,ABG21277  位置66,ABG21275位置66,ABG21273  位置66,ABG21271  位置66,ABG21269  位置66,ABG21267  位置66,ABJ98319  位置66,ABI93799  位置66,ABD59347位置66,ABD42928  位置66,ABI17537  位置66,ABI17535  位置66,ABI17533  位置66,ABI17531  位置66,ABI17529  位置66,ABI17527  位置66,ABI17525  位置66,ABI17523  位置66,ABG37025  位置63,ABG37023位置66,ABF71465  位置66.
  2007   ABQ10608  位置66,ABQ10606  位置66,ABQ10604  位置66,ABQ10603位置66,ABP68669  位置66,ABP68665  位置66,ABP68661  位置66,ABP68653  位置66,ABP68651  位置66,ABP68643  位置66,ABP68641位置66,ABP68629  位置66,ABP68619  位置66,ABP68617  位置66,ABP68615  位置66,ABO38130  位置66,ABQ63072  位置66,ABQ63070位置66,ABQ63068  位置66,ABQ63066  位置66,ABQ63064  位置66,ABQ63062  位置66,ABQ51920  位置66,ABQ51918  位置66,ABR14585位置66,ABP49176  位置66,ABP48091  位置66,ABP48089  位置66,ABP48087  位置66,ABP48083  位置66,ABO09999  位置66,ABO09991位置66,ABO09989  位置66,ABP23690  位置66.
XII.Replikin Peak基因与烟草花叶病毒和肺恶性肿瘤的致死性的关系
[000344]如以上确立的,Replikin Peak基因与诸如大流行流感、禽流感、西尼罗病毒和禽流感H5N1、以及许多其它病毒的活性关联。现在已经令人惊讶地发现,目前Replikin Peak基因的最高活性发现于肺癌(SEQID NO:1741)。尽管自从上世纪初Rous对肉瘤的研究以来已经充足地证实病毒与数种癌症的原因相关,且病毒是当前抗癌症疫苗的基础,但仍未充分理解病毒如何与癌症相关。血清中抗毒曲菌素抗体(AMAS)检验是FDA-许可的医疗保险批准的用于癌症的早期检测方法,其测量针对包含关键Replikin序列即神经胶质瘤Replikin肽kagvaflhkk(SEQ ID NO:3658)的肽的抗体的产生,但AMAS如何检测癌症而不论细胞类型还未被充分理解。病毒和癌症领域中不同研究的结果现在集中于发明人在病毒和癌症中分离集中在蛋白中的Replikin,其中Replikins的浓度已与快速复制相关联。
[000345]现在已经将RPGs的较高Replikin计数与宿主中较高致死性百分比一致地相关;无论宿主是植物、鱼、虾或脊椎动物,包括H5N1禽流感人类病例。在暴发变得临床上明显的之前一年或更久常常检测到计数增加。除了高计数与毒力和致死性的关联性,发明人已经发现了Replikins特异性的结构。例如,保守了90年的29-氨基酸Replikin骨架(开始于SEQID NO:3672)出现在连续流感病毒株的基因组和每次致死大流行和致死H5N1暴发中。此外,已经鉴定一些病原体和恶性肿瘤的RPGs中的重复特异性Replikin序列特征并将其与致死性关联。例如,在原生动物恶性疟原虫的RPG中发现一种相同特征(SEQ ID NO:1584)重复十一次,在烟草花叶病毒诱导细胞死亡恶化的诱导(incuded)辣椒植株中细胞死亡恶化的烟草花叶病毒RPG中重复20次,在非小细胞肺癌的18氨基酸RPG中的52Replikins中中重复57次(通过重叠)。
[000346]尽管发明人不希望束缚于理论,上述两个研究都支持这样一种印象,即Replikins是致死性的流动因子。病原性病毒可仅为所述致死流动因子的载体。迄今已在高度致死的非小细胞肺癌观察到Replikin Peak基因中的最高Replikin计数。观察到Replikin计数为每100氨基酸289 Replikin序列。已经同样地观察到其它癌症诸如乳腺癌和卵巢癌在其Replikin Peak基因中具有非常高的Replikin计数,计数高于每100氨基酸40 Replikin序列。在成淋巴细胞性白血病登记号EAW84344中鉴定了RPG并观察到Replikin计数为129。在髓细胞性白血病登记号EAX09769中同样地鉴定了RPG并观察到Replikin计数为23。
[000347]实验发现实验室化学合成的Replikins是免疫刺激剂,在鸡和兔中产生强抗体响应。看起来AMAS检验中测量的抗体是针对Replikin的快速复制化学而不是癌症或细胞类型的组织学诊断。因此,例如,“静止”的(超过这类癌症的90%)组织学证实的前列腺癌在AMAS检验中具有低的抗体水平。但当这些细胞快速复制时,AMAS检验测量的抗体水平显著地增加。AMAS警示通常先于检测到前列腺特异性抗原(PSA)的产生,该抗原由于其与前列腺癌的关系而是通常被检验。AMAS很可能先于PSA,由于PSA测量必须由癌症细胞释放到血液中的抗原蛋白片段,而AMAS测量癌细胞中对肽变化的抗体,这是更早的可检测事件。
[000348]因为人类是数以千计的与机体共生生活的病毒和细菌的宿主并被其寄生,所以除非一些事件如快速复制产生了疾病,否则不存在发病。因此,了解如何控制宿主人类和共生的病毒和细菌之间的共生而不必以彻底破坏生物体为目标可为重要的,尤其是当证明破坏很困难时。
[000349]已经发现分离自组织培养中生长的癌细胞的肽包含Replikin序列。由缺氧刺激时,这些组织培养中的细胞数目每周增加五倍。然而令人惊讶地,Replikin序列的浓度每周增加十倍(细胞数目增加的两倍),证明Replikin计数与癌症组织培养中快速复制的关联性。当这些包含Replikin的肽的结构被确定、分别化学合成并施用于兔时,肽产生大量特异性抗毒曲菌素抗体。响应于包含Replikin的肽产生抗毒曲菌素抗体提供证据以结束AMAS测量恶性肿瘤中的Replikins活性的证明循环。
[000350]除了由AMAS检验早期检测对癌症独特的Replikins组的活性,Replikins是广泛分布的致死性标记并很可能是致死性因子。作为新识别的用于预防和治疗的靶,Replikins提供一种平台,从该平台可控制生物体和细胞的快速复制和致死性而不必破坏它们。
XIII.Replikin计数与虾桃拉综合征病毒的毒力和致死性关联
[000351]申请人已经同样地在使用独立实验室检验虾的桃拉综合征病毒(TSV)的盲研究中证实虾中的毒力和死亡率与TSV中Replikin计数关联。发明人分析TSV的夏威夷、伯利兹、泰国和委内瑞拉的四个主要分离株的基因组以提供各分离株的毒力和死亡率的分级预测。独立实验室检验虾中的各分离株并提供对死亡率的盲数据。数据证实Replikin浓度与死亡率之间的数量线性关联性。见实施例18。尽管有流行病学、病毒学和宿主的差异,所有这些数据进一步支持Replikin浓度在预测病原体暴发和病原体和恶性肿瘤的致死性中的价值。
XIV.核糖核苷酸还原酶基因区的Replikin Peak基因中的Replikin浓度与WSSV流行关联
[000352]白斑综合征病毒(WSSV)中Replikin浓度增加预测病毒毒力增加并允许预测即将到来的暴发或发病率增加以及极端病例中的死亡率增加。回顾WSSV分离株的证实病毒的基因组或基因组区段、或蛋白或蛋白片段中Replikin计数随时间或在分离株之间增加的公众可得的氨基酸序列用作预测虾中暴发增加的预测子。可手动分析或使用专有的搜索工具软件(可从美国REPLIKINS LLC,Boston,MA获得的ReplikinForecastTM)分析从PubMed或其它公共或私人来源公众可得的WSSV分离株的序列。
[000353]申请人已经确立WSSV中Replikin浓度与导致流行的病毒毒力增加之间的关联性。申请人回顾在www.pubmed.com具有登记号的WSSV分离株的公众可得的氨基酸序列并已鉴定病毒基因组的核糖核苷酸还原酶基因区的Replikin Peak基因(例如SEQ ID NO:669)中Replikin浓度的显著增加。显著增加就发生在2001年虾中WSSV显著暴发之前。图18说明2000年WSSV基因组中Replikin计数增加与2001年WSSV显著暴发之间的关联性。2000年,在WSSV观察到显著高的Replikin浓度97.6。在2000年分离株的核糖核苷酸还原酶中鉴定的Replikin Peak基因,Replikin浓度跃至高达110.7,对随后2001年WSSV的显著暴发提供明白的预测信号。对以登记号AAL89390(SEQ ID NO:668)公众可得的核糖核苷酸还原酶序列的分析公开于实施例10。
A.分析每年WSSV的Replikin计数
[000354]申请人分析从PubMed公众可得的WSSV分离株的序列。数据包含在表18中并图示于图18。确定在www.pubmed.com上具有公众可得的登记号的WSSV的所有氨基酸序列的平均Replikin浓度。随后确定在特定年份分离和报道的所有病毒的平均Replikin计数。表WSSV提供Replikin计数分析的结果。无数据的年份未包括在该表中。
表18-WSSV Replikin计数
Figure A20088000249401271
Figure A20088000249401291
B.预测和治疗WSSV暴发
[000355]可例如通过回顾WSSV分离株的Replikin计数并比较特定年份的Replikin计数与其它年份的Replikin计数预测流行和未来暴发。从一年到下一年和优选地经过一、二、三或五年或更久Replikin计数的显著增加提供可开始更高毒性WSSV暴发的WSSV的新出现株的预测价值。可预测从观察到Replikin浓度显著增加的约六个月至约一年、至约三年、至约五年或更久时间内的WSSV暴发。优选地预测在约一至约三年和更优选地约一至约二年内的暴发。因此可预测1至约2年内的WSSV暴发,如在图18证实的,其中在Replikin浓度显著增加和尤其是鉴定的Replikin Peak基因中Replikin浓度显著增加后约1年发生流行。
[000356]可观察到经过多于一年的时间段诸如三、四、五或更多年的显著的增加。可同样地预测从显著增加后最初观察到可观察到的Replikin浓度减少的约六个月至约一年或更久时间内的暴发。
[000357]上述的Replikin浓度与病毒暴发之间的关联性提供通过监控WSSV分离株的RPG中Replikin计数的增加或减少预测WSSV暴发的方法。该方法可采用WSSV单个株的分离株或所有株的分离株。
XV.TSV流行中的Replikin计数
[000358]桃拉综合征病毒(TSV)中Replikin浓度增加预测病毒的毒力和致死性增加并允许预测即将到来的暴发或致死性增加。图19说明TSV基因组中Replikin计数增加与2000和2007年该病毒在虾的暴发之间的关联性。该图中反映的Replikin计数数据见于表19。在2000和2007年注意到该疾病显著暴发。从该图可观察到,病毒暴发在Replikin浓度增加之后发生。2000年,TSV的Replikin浓度为2.7。2001至2004年,TSV具有较低的平均Replikin浓度,低至0.7,且鉴定的Replikin骨架消失。2005年Replikin骨架再次出现,赖氨酸和组氨酸增加,且Replikin浓度相称地增加至1.8,随后是2006-2007年TSV暴发增加。
表19-TSV Replikin计数
  年份   PubMed登记号-Replikin计数   每年分离株数目 每年平均Replikin浓度   S.D.  显著性
  2000   NP_149058 70 NP_149057 70 AAK72221 70 AAK72220 70 AAG44834 4   5   2.7   1.3  最低p<0.02
  2001   AAM73766 7   1   0.7   0.0  上年p<0.02
  2002   AAN77089 2 AAN77088 2 AAN77087 2 AAN77086 2 AAW32934 2 AAW32932 2 AAW32930 2 AAW32929 1   8   0.7   0.4  最低p>0.50
  2003   AAR11292 6 AAR11291 6 AAR11290 6   3   0.6   0.0  上年p<0.20
  2004   AAX07125 2 AAX07117 2 AAT81157 75 AAT81158 75 AAX07127 2 AAX07126 2 AAX07124 2 AAX07123 2 AAX07122 2 AAX07121 2 AAX07120 2 AAX07119 2 AAX07118 2 AAX07116 2 AAX07115 2 AAX07114 2 AAX07113 2 AAX07112 2 AAX35819 2 AAX35818 1 AAX35817 2 AAX35816 1 AAX35815 2   23   0.8   0.9  最低p<0.40,上年p<0.20
  2005   AAY56364 71 AAY56363 71 AAY44822 1 AAY44821 1 AAY44820 1 AAY44819 1 AAY44818 1 AAY44817 1 AAY89097 83 AAY89096 83 ABB17263 63 ABB17264 63   12   1.8   1.7  最低p<0.02,上年p<0.05
[000359]TSV比WSSV较低毒性且TSV Replikin骨架的结构与流感病毒的关系不如WSSV Replikin骨架的结构与流感病毒的关系密切。
XVI.软件
[000360]本发明的进一步方面提供应用软件,所述软件搜索ReplikinPeak基因并能够发现基因组中具有最高浓度Replikins的一个或复数个点、它们已经发生的年份、它们所发生的一种或复数种株、它们所发生的一种或复数种宿主、它们所发生的地理位置、它们在上述年份、株、宿主和地理位置的增加或减少、和可与毒力关联的点突变或小突变。
XVII.SARS Replikin浓度与流行关联
[000361]冠状病毒的Replikin浓度增加也与SARS冠状病毒流行关联。尤其是,如可见于图9的,刺突和核壳体冠状病毒蛋白中的Replikin浓度先于2003年SARS冠状病毒流行。图9中,x-轴表示年份,y-轴表示Replikin浓度。SARS暴发的出现显示为图中2003至2004年的阴影区。阴影区的峰代表2003年发生SARS暴发的八个国家的总数。实心黑符号代表刺突冠状病毒蛋白的平均Replikin浓度,竖直黑条代表平均值的标准差。
[000362]图9显示1995至2001年显著恒定的刺突蛋白中低的冠状病毒Replikin浓度,随后是2002年引人注目的增加,这是2003年SARS流行出现的一年前。随后SARS中刺突蛋白的Replikin浓度回到它们2003年前的正常水平,这与SARS消失关联。
XVIII.被动免疫
[000363]在本发明的另一方面,分离的Replikin肽可用于产生抗体,该抗体可用于例如向个体提供被动免疫。可以将本领域公知的各种方法用于抗Replikin序列抗体的生产。这类抗体包括但不限于多克隆的、单克隆的、嵌合的、人源化的、单链的、Fab片段以及由Fab表达文库生产的片段。也可以生产连接到细胞毒性剂上的抗体。也可以将抗体与抗病毒剂组合给药。另外,不同Replikins的抗体的组合可以作为抗体混合物施用。
[000364]抗Replikins的单克隆抗体可以通过使用任何提供抗体分子生产的技术进行制备。这些技术包括但不限于最初由Kohler和Milstein描述的杂交瘤技术(Nature,1975,256:495-497)、人类B细胞杂交瘤技术(Kosbor等,1983,Immunology Today,4:72)和EBV杂交瘤技术(Cole等,Monoclonal Antibodies and Cancer Therapy,Alan R.Liss,Inc.,第77-96页)。另外,可以使用为嵌合抗体的生产而开发的技术(Morrison等,1984,Proc.Nat.Acad.Sci USA,81:6851-6855)或其它技术。可选择性地,可以修改被描述用于单链抗体生产的技术(美国4,946,778)来生产Replikin特异性的单链抗体。
[000365]例如,针对观察到存在于病毒的新出现株或重新出现株中的任何肽(尤其是RPG肽和RPG肽中分离的Replikin序列)的抗体和此类抗体的组合在病毒感染的治疗和/或预防中是有用的。
[000366]可以通过已知的技术来生产包含Replikin结合位点的抗体片段。例如,此类片段包括但不限于可由胃蛋白酶消化抗体分子而产生的F(ab′)2片段以及可由还原所述F(ab′)2片段的二硫键而产生的Fab片段。可选择性地,可以产生Fab的表达文库(Huse等,1989,Science,246:1275-1281)以便快速轻易地鉴定具有所期望特异性的单克隆Fab片段。
[000367]在本发明的另一方面,从接触一种或更多种Replikins的个体中获得的含有抗一种或更多种Replikins的抗体的免疫血清可用于在另一个体或动物体内诱导被动免疫。可将免疫血清通过静脉内施用于需要治疗的受治疗者。被动免疫也可通过给接受者注射抗一种或更多种Replikins的预先形成的抗体来实现。被动免疫可用来给已接触感染性生物体的个体提供即时保护作用。施用免疫血清或预先形成的抗体是常规的,本领域技术人员可容易地确定达到期望效应所需的血清量或抗体量。针对一种疾病引发剂的特定蛋白抗原的疫苗在提供针对这种疾病的保护中(如被开发用来针对VP1蛋白或VP1蛋白的大区段的口蹄疫疫苗)并非完全有效,其原因之一就是没有产生最佳抗体,即很可能没有产生抗Replikins的抗体。
[000368]例如,存在于较大蛋白片段中的除了Replikins之外的任一个抗原表位都可以根据抗原首位(antigenic primacy)现象,和/或由于为了加工产生抗体,较大的蛋白序列水解为较小的序列导致了存在的任何Replikin结构的完整性的丧失,例如,Replikin被切为两部分和/或组氨酸残基在水解加工过程中丢失,而干扰。本研究提示,为了生产更有效的疫苗,应当使用Replikin序列而不用其它表位作为疫苗。例如,可以利用通过3点识别系统鉴定的任一种Replikin肽来生产本发明的疫苗。更优选的疫苗包括RPG中分离的至少一种Replikin序列。另一优选疫苗包括RPG肽。用于病毒疫苗中的优选Replikin肽是在一或更多年不存在于氨基酸序列后观察到“再次出现”的保守Replikins。
[000369]将本发明的Replikin肽单独地或通过各种组合对受试者给药,优选通过静脉内或肌内注射,来刺激受试者的免疫系统以产生针对该肽的抗体。通常肽的剂量在大约0.1μg到大约10mg的范围。在另一实施方式中,肽的剂量在约10μg至约1mg的范围。在优选实施方式中,肽的剂量在约50μg至约500μg的范围。本领域技术人员可易于确定产生有效免疫响应的剂量和给药次数。
XIX.以Replikin计数预测暴发的方法的可靠性的对照检验
[000370]包含上述H5N1数据的表3提供跨八个基因区的Replikin计数数据,且观察到死亡率数据与全病毒、聚合酶基因和pB1基因区(ReplikinPeak基因)之间的关联性增加。还见例如,图4、16和17。除了Replikin计数增加和死亡率百分比的关联性方面,表3的数据和本文以上包含的所有其它数据提供对通过Replikin浓度变化预测病毒毒力变化和暴发的方法的能力和有效性的强有力证实。这些数据代表客观检验在PubMed共大约1200万登记号中独立地选择和检验数千个单个登记号的方法,其中每次选择使用客观软件以不同请求独立地提交于PubMed数据库。如果每次请求不是基于可靠原理和可靠方法,获得随机结果、或无结果、或不以p<0.001彼此追踪的结果的可能性将显著地增加。表3提供其中各组之间相互比较的p小于0.001的结果。
[000371]就申请人的了解,表3中关联了此前还未关联的结构,即,发明人已经检验了一内部病毒结构与另一内部病毒结构或复数个结构的关系(例如,全病毒基因区、聚合酶和Replikin Peak基因区之间的三方面关系),并已检验这二个或更多个内部结构与病毒感染宿主的结果即死亡率百分比的外部关系。
[000372]表3代表重复试验的一致的可重复数据,其是任何方法的可靠性的本质。例如,表3提供(1)全病毒的Replikins浓度、(2)仅聚合酶的Replikins浓度,和(3)仅Replikin Peak基因的Replikins浓度的独立数据。随后将数据与三次即2003、2004和2005年的H5N1死亡率关联。pA和pB2基因区中不存在显著的变化提供了对照。各例中,方法测量三方面的Replikin浓度,其各自独立地正确预测死亡率,从而证实该方法,并进一步阐释在该过程中Replikin Peak基因的放大功能。
实施例
实施例1
计算1968年大流行的H3N2分离株的Replikin Peak基因的Replikin计数
[000373]发明人在www.pubmed.com查询登记号ABB54523。登记号ABB54523公开SEQ ID NO:1664的氨基酸序列,其是从1968年在孟菲斯分离的甲型流感病毒H3N2株的基因组信息推断的。经分析SEQ ID NO:1664,发明人观察到具有开始于残基15(组氨酸)并持续至残基85(赖氨酸)的连续Replikin序列的Replikin Peak基因(SEQ ID NO:1665)。
[000374]发明人计算机分离RPG(SEQ ID NO:1665)。鉴定SEQ IDNO:1665用于例如免疫原性化合物和治疗性疫苗化合物和用作流感致死暴发的预测序列的诊断和治疗用途。在SEQ ID NO:1665的RPG中鉴定十七个Replikin序列(SEQ ID NO:1667-1682)用于如本文描述的诊断、治疗和预测用途。在公开于登记号ABB54523的序列(SEQ ID NO:1664)的氨基末端鉴定了SEQ ID NO:1667-1674,在序列的分子中部鉴定了SEQ IDNO:1675-1682。
[000375]公开于ABB54523的氨基酸序列(SEQ ID NO:1664)的Replikin计数是共90氨基酸中十七个Replikin序列,Replikin计数为18.9。RPG(SEQ ID NO:1665)的Replikin计数为共71氨基酸中十七个Replikin序列,Replikin计数为23.9。
实施例2
计算2003年的人类H5N1分离株的Replikin Peak基因的Replikin计数
[000376]发明人在www.pubmed.com查询登记号BAE07199。登记号BAE07199公开从2003年香港分离的甲型流感病毒H5N1株的RNA聚合酶基因的基因组信息推断的氨基酸序列。发明人分析聚合酶序列的全pB1基因区(SEQ ID NO:1683)。经分析SEQ ID NO:1683,发明人观察到具有开始于残基168(赖氨酸)并持续至残基215(赖氨酸)的连续Replikin序列的Replikin Peak基因。
[000377]发明人计算机分离了RPG(SEQ ID NO:1684)。鉴定SEQ IDNO:1684用于例如免疫原性化合物和治疗性疫苗化合物和用作流感致死暴发的预测序列的诊断和治疗用途。在SEQ ID NO:1684的RPG中鉴定了七个Replikin序列(SEQ ID NO:1685-1691)用于如本文描述的诊断、治疗和预测用途。在公开于登记号BAE07199的序列(SEQ ID NO:1683)的氨基末端鉴定了Replikin序列SEQ ID NO:1685-1691,在序列分子中部鉴定了Replikin序列SEQ ID NO:1692-1694,并在序列的羧基末端鉴定了Replikin序列SEQ ID NO:1695-1699。
[000378]全pB1区序列(SEQ ID NO:1683)的Replikin计数为共757氨基酸中15个Replikin序列,Replikin计数为2.0。RPG(SEQ ID NO:1684)的Replikin计数为共48氨基酸中七个Replikin序列,Replikin计数为14.6。
实施例3
计算2006年印度尼西亚的人类H5N1分离株的pB1基因区和pB1-F2亚基因区的Replikin计数
[000379]发明人在www.pubmed.com查询登记号ABI36257。登记号ABI36257公开从2006年印度尼西亚分离的甲型流感病毒H5N1株的pB1基因区的基因组信息推断的氨基酸序列。发明人分析了pB1-F2基因区(SEQ ID NO:1700)。经分析SEQ ID NO:1700,发明人观察到具有开始于残基15(组氨酸)并持续至残基85(赖氨酸)的连续Replikin序列的Replikin Peak基因(SEQ ID NO:1701)。
[000380]发明人计算机分离RPG(SEQ ID NO:1701)用于例如免疫原性化合物和治疗性疫苗化合物和用作流感致死暴发的预测序列的诊断和治疗用途。在SEQ ID NO:1701的RPG中鉴定了十六个Replikin序列(SEQID NO:1702-1717)用于如本文描述的诊断、治疗和预测用途。在SEQ IDNO:1701的序列氨基末端鉴定了Replikin序列SEQ ID NO:1702-1703,在序列分子中部鉴定了Replikin序列SEQ ID NO:1704-1717,但在羧基末端未鉴定到Replikin序列。
[000381]全pB1-F2基因区序列(SEQ ID NO:1700)的Replikin计数为共90氨基酸中16个Replikin序列,Replikin计数为17.8。RPG pB1-F2亚基因区(SEQ ID NO:1701)的Replikin计数为共71氨基酸中16个Replikin序列,Replikin计数为22.57。
实施例4
计算2007年印度尼西亚人类H5N1分离株的pB1基因区和pB1-F2亚基因区的Replikin计数
[000382]发明人在www.pubmed.com查询登记号ABM90520。登记号ABM90520公开从2007年印度尼西亚分离的甲型流感病毒H5N1株的pB1基因区的基因组信息推断的氨基酸序列。发明人分析了pB1基因区(SEQ IDNO:1722)。经分析SEQ ID NO:1722,发明人在pB1-F2基因区(SEQ IDNO:1723)中观察到具有开始于残基15(组氨酸)并持续至残基85(赖氨酸)的连续Replikin序列的Replikin Peak基因。
[000383]发明人计算机分离了RPG(SEQ ID NO:1723)。鉴定SEQ IDNO:1723用于例如免疫原性化合物和治疗性疫苗化合物和用作流感致死暴发的预测序列的诊断和治疗用途。在SEQ ID NO:1723的RPG(或pB1-F2基因亚区)中鉴定了十六个Replikin序列(SEQ ID NO:1724-1739)用于如本文描述的诊断、治疗和预测用途。在SEQ ID NO:1723的序列氨基末端鉴定了Replikin序列SEQ ID NO:1724-1725,在序列分子中部鉴定了Replikin序列SEQ ID NO:1726-1739,但在羧基末端未鉴定到Replikin序列。
[000384]全pB1-F2区序列(SEQ ID NO:1722)的Replikin计数是共90氨基酸中16个Replikin序列,Replikin计数为17.8。RPG(SEQ ID NO:1723)的Replikin计数为共71氨基酸中16个Replikin序列,Replikin计数为22.5。
实施例5
计算具有Replikin骨架的来自泰国的2007年H1N1分离株的RPG的Replikin计数
[000385]发明人在www.pubmed.com查询登记号ABS71678。登记号ABS71678公开从2007年泰国分离的甲型流感病毒H1N1株的血凝素基因区的基因组信息推断的氨基酸序列。发明人分析了ABS71678(SEQ IDNO:1995)提供的氨基酸序列。经分析SEQ ID NO:1995,发明人观察到具有开始于残基143(组氨酸)并持续至残基235(赖氨酸)的连续Replikin序列的Replikin Peak基因(SEQ ID NO:1996)。在RPG中观察到Replikin骨架knglypnlsksyannkekevlvlwgvhh(SEQ ID NO:2011)。
[000386]发明人计算机分离了RPG(SEQ ID NO:1996)。鉴定SEQ IDNO:1996用于例如免疫原性化合物和治疗性疫苗化合物和用作流感致死暴发的预测序列的诊断和治疗用途。在SEQ ID NO:1996的RPG中鉴定二十六个Replikin序列(SEQ ID NO:1999-2024)用于如本文描述的诊断、治疗和预测用途。在SEQ ID NO:1995的序列氨基末端鉴定了Replikin序列SEQ ID NO:1997-2016,在序列分子中部鉴定了Replikin序列SEQ IDNO:2017-2029,并在羧基末端鉴定了SEQ ID NO:2030-2042。分离Replikin序列用于诊断、治疗和预测用途。
[000387]全血凝素序列(SEQ ID NO:1995)的Replikin计数为共564氨基酸中46个Replikin序列,Replikin计数为8.1。RPG区(SEQ ID NO:1996)的Replikin计数为共93氨基酸中26个Replikin序列,Replikin计数为28。
实施例6
鉴定报道为登记号ABS89395的EIV分离株中的Replikin Peak基因
[000388]申请人回顾了在www.pubmed.com公众可得的Replikin序列以确定可得的分离株的Replikin Peak基因区。在www.pubmed.com登记号ABS89395的病毒的pB1-F2基因区中鉴定了Replikin Peak基因。以下实施例提供H3N8血清型甲型流感病毒马里兰株的2005年分离株中ReplikinPeak基因的确定。
[000389]发明人查询登记号ABS89395和分析提供的氨基酸序列(SEQ ID NO:545)。经分析序列,发明人观察到具有开始于残基15(组氨酸)并持续至残基85(赖氨酸)的连续Replikin序列的Replikin Peak基因(SEQ ID NO:546)。
[000390]发明人计算机分离RPG(SEQ ID NO:546)并鉴定该序列用于例如免疫原性化合物和治疗性疫苗化合物和用作结核致死暴发的预测序列的诊断和治疗用途。在RPG中鉴定十六个Replikin序列(SEQ ID NO:547-562)用于如本文描述的诊断、治疗和预测用途。在序列氨基末端鉴定了Replikin序列SEQ ID NO:547-548,在序列分子中部鉴定Replikin序列SEQ ID NO:549-562,但在羧基末端未鉴定到Replikins。
[000391]全pB1-F2序列(SEQ ID NO:545)的Replikin计数为共90氨基酸中16个Replikin序列,Replikin计数为17.8。RPG区(SEQ ID NO:546)的Replikin计数为共71氨基酸中16个Replikin序列,Replikin计数为22.5。
实施例7
鉴定登记号ABA54585中报道的西尼罗病毒分离株中的ReplikinPeak基因
[000392]申请人回顾了在www.pubmed.com公众可得的Replikin序列以确定可得的西尼罗病毒(WNV)分离株的Replikin Peak基因。WNV的完整包膜蛋白报道为登记号ABA54585。在WNV包膜蛋白的3,433氨基酸的多蛋白序列中鉴定了Replikin Peak基因。Replikin Peak基因鉴定为开始于氨基酸残基2797,延伸至氨基酸残基2836(共40氨基酸残基)。该片段中Replikin序列数目为12。Replikin计数(每100氨基酸的Replikins)为30。WNV的包膜蛋白的Replikin Peak基因(RPG)为SEQ ID NO:258且该RPG包含12个不间断的Replikins(SEQ ID NO:246-257)。
实施例8
计算猪呼吸道综合征病毒中的RPGs
[000393]申请人回顾了在www.pubmed.com公众可得的Replikin序列以确定可得的PRRSV分离株的Replikin Peak基因区。在编码报道的2003年墨西哥的PRRSV分离株的核壳体蛋白的mRNA的登记号AAO43261中鉴定了Replikin Peak基因。发明人分析提供于登记号AAO43261的氨基酸序列,报道其具有在病毒基因组的ORF 7内的123氨基酸。经分析序列,发明人观察到具有开始于残基7(赖氨酸)并持续至残基66(组氨酸)的连续Replikin序列的Replikin Peak基因。
[000394]发明人计算机分离了RPG(SEQ ID NO:394)并鉴定该序列用于例如免疫原性化合物和治疗性疫苗化合物和用作PRRSV暴发的预测序列的诊断和治疗用途。在RPG中鉴定七个Replikin序列(SEQ ID NO:395-401)用于如本文描述的诊断、治疗和预测用途。在序列的氨基末端部分鉴定了SEQ ID NO:395并在序列的分子中部部分鉴定了SEQ ID NO:396-401。
[000395]登记号AAO43261的全核壳体序列的Replikin计数为123氨基酸残基中7 Replikin序列或5.7。RPG区(SEQ ID NO:394)的Replikin计数为共60氨基酸中7 Replikin序列,Replikin计数为11.7。
[000396]与其它报道的核壳体序列诸如以下紧接着讨论的登记号ABF19568相比,发明人鉴定RPG(SEQ ID NO:394)第45和46位的天冬酰胺和甲硫氨酸残基为RPG中的非保守位置。与致死性和/或毒力变化关联的RPG中的非保守位置在预测暴发的本发明方法中尤其有用。其它PRRSV核壳体RPG序列中这些点突变的存在提供更大毒力和/或致死性的证据。
[000397]还在2006年墨西哥PRRSV分离株的核酸序列登记号ABF19568中鉴定了Replikin Peak基因。报道的序列具有99氨基酸残基。计算机分离RPG(SEQ ID NO:402)和鉴定其用于例如免疫原性化合物和治疗性疫苗化合物和用作PRRSV暴发的预测序列的诊断和治疗用途。RPG的总长度是29氨基酸。Replikin计数是41.4。在RPG中鉴定SEQ ID NO:403-414的Replikin序列用于如本文描述的诊断、治疗和预测。在序列的氨基末端鉴定了SEQ ID NO:403-414。在分子中部或羧基末端未鉴定到Replikin序列。
[000398]与其它报道的核壳体序列诸如上述登记号AAO43261相比,鉴定第14至16位的甘氨酸、脯氨酸和甘氨酸残基和第21至25位的天冬酰胺、精氨酸、赖氨酸、精氨酸和天冬酰胺残基为RPG(SEQ ID NO:507)中的非保守位置。进一步地,与上述登记号AAO43261中的RPG相比,证实2006年墨西哥分离株中鉴定的RPG为缩短的RPG和较短RPG中值得注意的Replikin序列集中。结果是2003至2006年Replikin计数的显著增加,相应于2006年墨西哥PRRSV的严重暴发,伴随死亡率增加。
[000399]申请人同样地分别分析具有2000、2003和2006年中国分离株的序列的登记号AAM18565、AAP81809、ABL60920以确定分离株的Replikin Peak基因(SEQ ID NO:341、342和343)。
[000400]在登记号AAM18565的残基7(赖氨酸)至残基66(组氨酸)鉴定了Replikin Peak基因。发明人计算机分离RPG(SEQ ID NO:353)并鉴定该序列用于例如免疫原性化合物和治疗性疫苗化合物和用作PRRSV暴发的预测序列的诊断和治疗用途。在RPG中鉴定十三个Replikin序列(SEQID NO:354-366)用于如本文描述的诊断、治疗和预测用途。在序列的氨基末端部分鉴定了SEQ ID NO:354-357并在序列的分子中部部分鉴定了SEQID NO:358-366。
[000401]登记号AAM18565的全序列的Replikin计数为123氨基酸残基中13个Replikin序列或10.6。RPG区(SEQ ID NO:353)的Replikin计数为共60氨基酸中13个Replikin序列,Replikin计数为21.7。
[000402]在登记号AAP81809的残基7(赖氨酸)至残基66(组氨酸)鉴定了Replikin Peak基因。发明人计算机分离RPG(SEQ ID NO:367)并鉴定该序列用于例如免疫原性化合物和治疗性疫苗化合物和用作PRRSV暴发的预测序列的诊断和治疗用途。在RPG中鉴定十三个Replikin序列(SEQID NO:368-380)用于如本文描述的诊断、治疗和预测用途。在序列的氨基末端部分鉴定了SEQ ID NO:368-371并在序列的分子中部部分鉴定了SEQID NO:372-380。
[000403]登记号AAP81809的全序列的Replikin计数为123氨基酸残基中13个Replikin序列或10.6。RPG区(SEQ ID NO:367)的Replikin计数为共60氨基酸中13个Replikin序列,Replikin计数为21.7。
[000404]在登记号ABL60920的残基7(赖氨酸)至残基66(组氨酸)鉴定了Replikin Peak基因。发明人计算机分离RPG(SEQ ID NO:382)并鉴定该序列用于例如免疫原性化合物和治疗性疫苗化合物和用作PRRSV暴发的预测序列的诊断和治疗用途。在RPG中鉴定十个Replikin序列(SEQ IDNO:384-393)用于如本文描述的诊断、治疗和预测用途。在序列的氨基末端部分鉴定了SEQ ID NO:384-387并在序列的分子中部部分鉴定了SEQID NO:388-393。
[000405]登记号ABL60920的全序列的Replikin计数为123氨基酸残基中10个Replikin序列或8.1。RPG区(SEQ ID NO:367)的Replikin计数为共60氨基酸中10个Replikin序列,Replikin计数为16.7。
实施例9
计算猪圆环病毒中的RPG
[000406]申请人回顾了在www.pubmed.com公众可得的Replikin序列以确定可得的PCV分离株的Replikin Peak基因。发明人鉴定和比较了分离自1997年加拿大马尼托巴被感染的猪的PCV株的登记号AAC59472的蛋白片段的Replikin Peak基因(RPG)和分离自2007年中国被感染的猪的PCV株的登记号ABP68657的推定截短的复制酶蛋白的RPG。从分离株的开放读码框11中编码预测的1.8kDa蛋白的核酸鉴定了AAC59472片段。在分离株的开放读码框1中鉴定了ABP68657推定截短的复制酶蛋白。
[000407]在登记号AAC59472中,发明人鉴定RPG(SEQ ID NO:520)用于如本文描述的诊断、治疗和预测目的。RPG开始于残基2(赖氨酸)并持续至残基12(赖氨酸)。鉴定四个Replikin序列(SEQ ID NO:521-524)用于如本文描述的诊断、治疗和预测用途。RPG的总长度是11氨基酸。Replikin计数是36.4。完整片段的Replikin计数是十四个氨基酸中四个Replikin序列或28.6。
[000408]在登记号ABP68657中,发明人鉴定RPG(SEQ ID NO:525)用于如本文描述的诊断、治疗和预测目的。鉴定十三个Replikin序列(SEQID NO:526-538)用于如本文描述的诊断、治疗和预测用途。RPG的总长度是38氨基酸。Replikin计数是34.2。完整推定截短的蛋白的Replikin计数是6.2。
[000409]登记号AAC59472报道的序列具有仅14氨基酸残基。然而,RPG中高浓度的连续、不中断和重叠的Replikin序列(Replikin计数36.4)是毒力的预测子并提供可用作疫苗的序列。相反,登记号ABP68657报道的截短的复制酶蛋白的RPG具有306氨基酸残基,但鉴定的RPG具有13Replikin序列和可比较的Replikin计数34.2,其同样地为毒力预测子并提供可用作疫苗的序列。同样地,高Replikin计数的RPGs提供制备用于治疗和预防PCV的免疫原性化合物的靶。
[000410]在登记号AAC9885的公众可得的1997年PCV分离株的残基4(赖氨酸)至99(组氨酸)鉴定了Replikin Peak基因。发明人计算机分离RPG(SEQ ID NO:421)并鉴定该序列用于例如免疫原性化合物和治疗性疫苗化合物和用作PCV暴发的预测序列的诊断和治疗用途。在RPG中鉴定十四个Replikin序列(SEQ ID NO:422-435)用于如本文描述的诊断、治疗和预测用途。在公开于该登记号的全序列的氨基末端部分中鉴定了SEQ IDNO:422-435并在该序列的分子中部部分鉴定了SEQ ID NO:436-437。在该序列的羧基部分未鉴定到Replikin序列。
[000411]登记号AAC9885的全序列的Replikin计数为312氨基酸残基中16 Replikin序列或5.1。RPG区(SEQ ID NO:421)的Replikin计数为共96氨基酸残基中14 Replikin序列,Replikin计数为14.6。
[000412]在登记号AAL01075的公众可得的2001年PCV分离株的残基57(组氨酸)至94(赖氨酸)鉴定了Replikin Peak基因。发明人计算机分离RPG(SEQ ID NO:438)并鉴定该序列用于例如免疫原性化合物和治疗性疫苗化合物和用作PCV暴发的预测序列的诊断和治疗用途。在RPG中鉴定十二个Replikin序列(SEQ ID NO:439-450)用于如本文描述的诊断、治疗和预测用途。在公开于该登记号的全序列的氨基末端部分中鉴定了SEQ IDNO:439-445并在该序列的分子中部部分中鉴定了SEQ ID NO:446-450。在该序列的羧基部分未鉴定到Replikin序列。
[000413]登记号AAC9885的全序列的Replikin计数为314氨基酸残基中12 Replikin序列或3.8。RPG区(SEQ ID NO:438)的Replikin计数为共90氨基酸中12 Replikin序列,Replikin计数为13.3。
[000414]在登记号ABP68657公众可得的2007年加拿大的PCV分离株中鉴定了Replikin Peak基因。在残基57(组氨酸)至94(赖氨酸)鉴定了RPG。发明人计算机分离RPG(SEQ ID NO:462)并鉴定该序列用于例如免疫原性化合物和治疗性疫苗化合物和用作PCV暴发的预测序列的诊断和治疗用途。在RPG中鉴定十四个Replikin序列(SEQ ID NO:462-476)用于如本文描述的诊断、治疗和预测用途。在公开于该登记号的全序列的氨基末端部分中鉴定了SEQ ID NO:462-476并在该序列的分子中部部分中鉴定了SEQ ID NO:477-481。在该序列的羧基部分未鉴定到Replikin序列。
[000415]登记号ABP68657的全序列的Replikin计数为306氨基酸残基中19 Replikin序列或6.2。RPG区(SEQ ID NO:462)的Replikin计数为共38氨基酸中14 Replikin序列,Replikin计数为36.8。
[000416]申请人在回顾公众可得的PCV序列中的RPGs时,发明人从登记号ABQ10608鉴定包含上述XI.G.部分讨论的各个高度保守的Replikin序列的RPG,即kngrsgpqphk(SEQ ID NO:345);hlqgfanfvkkqtfnk(SEQ IDNO:346)和kkqtfnkvkwylgarch(SEQ ID NO:347)。
[000417]在残基57(组氨酸)至94(赖氨酸)鉴定了RPG。发明人计算机分离RPG(SEQ ID NO:498)并鉴定该序列用于例如免疫原性化合物和治疗性疫苗化合物和用作PCV暴发的预测序列的诊断和治疗用途。在RPG中鉴定六个Replikin序列(SEQ ID NO:487-492)用于如本文描述的诊断、治疗和预测用途。在公开于该登记号的全序列的氨基末端部分中鉴定了SEQID NO:486-492并在序列的分子中部部分中鉴定了SEQ ID NO:493-497用于治疗、诊断和预测目的。在该序列的羧基部分中未鉴定到Replikin序列。
[000418]登记号ABQ10608的全序列的Replikin计数为314氨基酸残基中12 Replikin序列或3.8。RPG区(SEQ ID NO:498)的Replikin计数为共38氨基酸中六Replikin序列或15.8。
实施例10
计算结核病原体分支杆菌中的RPG
[000419]发明人在www.pubmed.com查询登记号AAS59518。登记号AAS59518公开来自产粘液分枝杆菌株CIP105384的氨基酸序列。发明人分析了AAS59518提供的氨基酸序列(SEQ ID NO:2901)。经分析SEQ IDNO:2901,发明人观察到具有开始于残基3(组氨酸)并持续至残基88(组氨酸)的连续Replikin序列的Replikin Peak基因(SEQ ID NO:3649)。
[000420]发明人计算机分离RPG(SEQ ID NO:3659)用于例如免疫原性化合物和治疗性疫苗化合物和用作结核致死暴发的预测序列的诊断和治疗用途。在SEQ ID NO:3659的RPG中鉴定二十四个Replikin序列(SEQID NO:2902-2925)用于如本文描述的诊断、治疗和预测用途。在SEQ IDNO:2901的序列的氨基末端鉴定了Replikin序列SEQ ID NO:2902-2924,在序列的分子中部鉴定了Replikin序列SEQ ID NO:2925,但在羧基末端未鉴定到Replikins。分离所有这些用于诊断、治疗和预测目的。
[000421]全血凝素序列(SEQ ID NO:2901)的Replikin计数为共147氨基酸中24 Replikin序列,Replikin计数为16.3。RPG区(SEQ ID NO:3659)的Replikin计数为共87氨基酸中24 Replikin序列,Replikin计数为27.6。
实施例10
从登记号AAL89390确定WSSV核糖核苷酸还原酶中非常高的Replikin计数
[000422]确定在登记号AAL89390公众可得的白斑综合征病毒(WSSV)分离株的核糖核苷酸还原酶的Replikin浓度。氨基酸序列翻译自以登记号NC 003225.1公众可得的WSSV 2000分离株的总基因组。蛋白中Replikin浓度异常地高达103.8,且蛋白的Replikin Peak基因的Replikin浓度更高为110.7。
[000423]对以登记号AAL89390公众可得的蛋白的氨基酸序列特别感兴趣,因为其展示导致与恶性疟原虫相当的非常高Replikin浓度的Replikin序列重叠。高浓度Replikin序列提供用于转移到流感病毒的储库。
[000424]在登记号AAL89390中,公开SEQ ID NO:668为白斑综合征病毒的核糖核苷酸还原酶蛋白。在SEQ ID NO:668中,发明人鉴定Replikin Peak基因(SEQ ID NO:669)。观察到Replikin Peak基因占据SEQID NO:668公开的蛋白的大部分。Replikin Peak基因跨该蛋白的大多数氨基酸序列的扩大是高度异常的并产生显著高的Replikin浓度。
[000425]通过将蛋白的氨基酸序列中鉴定的Replikin序列数目(497Replikin序列)除以蛋白的总氨基酸长度(479氨基酸),得每100氨基酸103.8 Replikin序列,确定SEQ ID NO:668的Replikin计数。通过将包含最高浓度连续Replikin序列的蛋白区段中鉴定的Replikin序列数目(497Replikin序列)除以Replikin Peak基因总氨基酸长度(449氨基酸),得110.7,确定SEQ ID NO:669的RPG的Replikin计数,。
[000426]在SEQ ID NO:669的RPG中,鉴定SEQ ID NO:670-1166为Replikin序列。在肽的氨基末端鉴定了SEQ ID NO:669-866,在中间部分鉴定了SEQ ID NO:867-1065,并在羧基末端鉴定了SEQ ID NO:1066-1166。
[000427]进一步观察到SEQ ID NO:669包含显著的Replikin骨架序列。鉴定SEQ ID NO:663-667为Replikin骨架重复序列并分离它们用于诊断、治疗和预测用途。
[000428]确定登记号NP 478030的2000年WSSV分离株的基因组中功能未定义的蛋白(SEQ ID NO:1167)的Replikin计数。该蛋白中的Replikin计数又异常地高达每100氨基酸97.6 Replikin序列,其通过将蛋白的氨基酸序列中鉴定的Replikin序列数目(361 Replikin序列)除以蛋白的总氨基酸长度(370氨基酸)而确定。
[000429]在SEQ ID NO:1167的残基22(组氨酸)至361(赖氨酸)鉴定了RPG(SEQ ID NO:1168),并且其可用于如本文描述的诊断、治疗和预测用途。在RPG中鉴定的总Replikin序列为361,总氨基酸残基为361,RPG中的Replikin计数为100。在RPG的氨基末端鉴定了SEQ ID N0:1169-1330。在RPG的分子中部鉴定了SEQ ID NO:1331-1465,并在RPG的羧基末端了鉴定SEQ ID NO:1466-1529。各Replikin序列可用于如本文描述的诊断、治疗和预测目的。
[000430]对登记号NP 478030的氨基酸序列感兴趣,因为如同登记号AAL89390的蛋白,其证实导致与疟疾的高度复制性恶性疟原虫相当的非常高Replikin浓度的Replikin序列重叠。重叠Replikin序列是用于诸如免疫原性剂和疫苗的治疗的优越的靶并具有极好预测能力。
[000431]在2006和2007年观察到WSSV在虾中是休眠的。在2006-2007年WSSV持续下降到“静止”或“休眠”水平由2005-2007年期间分离的病毒的平均Replikin计数证实,该计数与其中证实病毒有更大毒力的年份诸如2001年相比非常低。2007年WSSV的持续静止可与该时期观察到的桃拉综合征病毒Replikin中Replikin浓度的上升形成对比。
[000432]如可从以下分析观察到的,登记号ABS00973和AAW88445具有低的观察到的Replikin浓度。ABS00973包含完整公开于SEQ ID NO:1547的240残基的氨基酸序列中的单个Replikin序列(SEQ ID NO:1548)。登记号ABS00973的Replikin浓度为非常低的0.5。AAW88445包含261氨基酸残基的白斑综合征病毒蛋白(SEQ ID NO:1530)。鉴定了34-105的RPG(SEQ ID NO:1531)。在该RPG中,鉴定了十一个Replikin序列(SEQID NO:1532-1542)。在SEQ ID NO:1530的氨基末端鉴定了SEQ ID NO:1532-1542,并在SEQ ID NO:1530的羧基末端鉴定了SEQ ID NO:1543-1546。
实施例11
计算桃拉综合征病毒中登记号AAM73766和AAY89096的Replikin计数
[000433]发明人在www.pubmed.com查询登记号AAM73766。登记号AAM73766公开2005年TSV分离株的氨基酸序列(SEQ ID NO:3566)。申请人鉴定SEQ ID NO:3567-3569为序列氨基末端的Replikin序列和SEQID NO:3570-3573为序列羧基末端的Replikin序列。计算机分离各序列用于如本文描述的诊断、治疗和预测目的。在分子中部未鉴定到Replikin序列。SEQ ID NO:3566的Replikin计数为1011氨基酸残基中七Replikin序列或0.7。
[000434]发明人在www.pubmed.com查询登记号AAY89096。登记号AAY89096公开2005年TSV分离株的氨基酸序列(SEQ ID NO:3574)。申请人在序列氨基末端鉴定了SEQ ID NO:3575-3587。在分子中部鉴定SEQID NO:3588-3634为Replikin序列。并在序列羧基末端鉴定SEQ ID NO:3635-3657为Replikin序列。计算机分离各序列用于如本文描述的诊断、治疗和预测目的。SEQ ID NO:3574的Replikin计数为2107氨基酸残基中83 Replikin序列或3.9。
实施例12
分析2002-2007年所有公众可得的甲型流感株的pB1-F2基因区
[000435]发明人以可从Boston,MA的Replikins LLC获得的软件程序FluForecast
Figure A20088000249401471
查询www.pubmed.com,以分析2002至2007年可得的所有甲型流感分离株的pB1-F2基因区的所有氨基酸序列。表20提供查询结果。2005、2006和2007年的平均Replikin计数数据说明当前的流行尚未结束。例如,图9的SARS数据证实,在流行性感染下降之前,预期Replikin计数减少。在表20数据中未观察到这种下降。
[000436]
表20-2002-2007年甲型流感PB1-F2
  年份   PubMed登记号-Replikin计数   每年分离株的数目   每年平均Replikin计数   S.D.   显著性
  2002   ABD59827 15 ABD59825 15 ABD59823 12   3   1.8   0.2 最低p<.05,上年p<.001
  2003   ABD59830 12 ABK40004 12 AAZ79547 12 AAZ79504 15   4   1.7   0.2   最低p<.005,上年p<.30
  2004   ABD59835 12 ABD59833 12   2   1.6   0.0   上年p<.30
  2005   ABI36231 16 ABI36226 16 ABI36221 16 ABI36217 16 ABI36215 15 ABI36210 15 ABI36032 14 ABI36021 14 ABI36010 15 ABI36001 14   10   9.6   8.1   最低p<.02
  2006   BAF37385 16 BAE97585 16 ABL31778 16 ABL31775 21 ABL31764 21 ABL31742 16 ABI49394 16 ABL07028 21 ABL07017 16 ABL07006 16 ABI49405 16 ABI36473 16 ABI36462 16 ABI36453 16 ABI36442 16 ABI36431 16 ABI36421 16 ABI36409 16 ABI36398 16 ABI36387 16 ABI36376 16 ABI36365 16 ABI36354 15 ABI36343 15 ABI36332 15 ABI36321 15 ABI36310 16 ABI36304 16 ABI36293 16 ABI36284 16 ABI36272 16 ABI36269 16 ABI36266 16 ABI36262 16 ABI36258 16 ABI36253 16 ABI36250 16 ABI36245 14 ABI36242 14 ABI36237 14 ABI36233 14 ABI36206 16 ABI36196 16 ABI36185 16 ABI36175 16 ABI36164 16 ABI36153 16 ABI36142 16   48   16.6   4.7   最低p<.001,上年p<.01
  2007   ABM90520 16 ABM90542 16 ABM90531 16 ABM90509 16 ABM90498 16 ABM90487 16 ABM90476 16 ABM90465 16 ABM90454 16 ABM90443 16 ABM90432 16   11   17.8   0.0   最低p<.001
实施例13
每年的H1N1血凝素(全血凝素)Replikin计数
[000437]发明人以可从Boston,MA的Replikins LLC获得的软件程序FluForecast
Figure A20088000249401481
查询www.pubmed.com,以分析1917至2007年可得的所有H1N1甲型流感分离株的所有氨基酸序列。表21提供查询结果。
表21-1918-2007年H1N1甲型流感
  年份   PubMed登记号-Replikin计数   每年分离株的数目   每年平均Replikin计数   S.D.   显著性
  1918   AAO65768 13   1   7.0   0.0
  1919   AAO65769 13   1   7.0   0.0
  1930   Q9WCD9 27 AAD25303 27 AAB52905 16 CAA40729 16 P05779 3   5   4.4   0.7  最低p<.001,上年p<.001
  1931   AAA19935 16 ABD79255 27   2   4.7   0.1  最低p<.01,上年p<.30
  1933   ABD77796 31 ABF47955 31 P03454 31 AAA43209 31 P05780 2P03470 11   6   4.4   1.7  最低p<.01,上年p>.50
  1934   AAA58799 21 ABP64731 38 ABP64721 35 AAA4366 17 ABO21709 38 ABD77675 38 P03452 38 AAA43194 21 AAM75158 38 YP_163736 38 YP_163735 38 NP_040980 38 P03468 11 P06821 6   14   6.1   1.3  最低p<.02,上年p<.04
  1935   ABD62781 38 ABW71481 22 ABO38384 41 ABN59412 38   4   6.1   1.5  最低p<.30,上年p>.50
  1936   ABO38351 39   1   6.9   0.0  上年p<.30
  1937   AAA67181 14   1   4.3   0.0
  1938   AAA67182 18   1   5.5   0.0
  1939   AAA67183 4 BAA00718 19   2   2.3   1.5  最低p<.10,上年p<.20
  1940   ABl20826 38   1   6.7   0.0  上年p<.10
  1941
  1942   ABD62843 28 ABW38010 28   2   4.9   0.0
  1943   AAM76687 14 ABD79101 40 AAM76691 9 AAM76688 9 AAM76686 9 ABO38373 28 ABO38054 28   7   4.1   1.7  最低p<.002,上年p<.20
  1945   ABP49327 28   1   4.9   0.0  上年p<.20
  1946   ABD79112 38   1   6.7   0.0
  1947   AAM76690 10 ABD77807 36 AAM76689 12 AAA67338 36 AAC53844 36 BAA96109 14 AAA67339 8 AAA67340 2 AAA67341 2 AAA67336 3 AAA67337 3 AAB39916 3 AAB39915 3 CAA67497 18 CAA67496 18 CAA67499 11 CAA67498 11 CAA67500 26 P26070 8 Q8JSD9 10 Q82571 11 Q82573 18 P03506 2 Q82570 26 CAB50889 2 CAB50888 2 CAB50887 8 CAB50886 26   28   2.7   1.5  最低p<.001,上年p<.001
  1948   BAA96110 14 ABN59401 37   2   5.3   1.7  最低p<.40,上年p<.05
  1949   ABN59434 37   1   6.5   0.0  上年p<.40
  1950   ABD61735 29 ABP49316 41 P10921 3   3   5.2   2.1  最低p<.20,上年p<.30
  1951   BAA96112 16 BAA96111 10 ABR15808 36 ABQ44471 36 ABQ01311 38 ABP49481 36   6   5.6   1.5  最低p<.05,上年p>.50
  1952   BAA96113 13   1   3.8   0.0  上年p<.02
  1954   ABD60966 34 BAA96114 4 ABO52280 34   3   4.4   2.8  最低p<.20 ,上年p>.50
  1955   BAA96115 6   1   1.7   0.0  上年p<.20
  1956   BAA96116 9 AAF99713 18 AAF99712 16   3   2.9   0.3  最低p<.001,上年p<.02
  1957   ABD15258 24 AAG22555 3 BAA96117 8 ABV82573 36   4   4.3   1.6  最低p<.04,上年p<.10
  1961   Q9WCD8 36 AAD25302 36   2   6.4   0.0   上年p<.05
  1963   CAA40730 18   1   5.0   0.0
  1966   ABV82595 34   1   6.0   0.0
  1967   ABV82584 32   1   5.7   0.0
  1970   ABR28724 36   1   6.4   0.0
  1971   ABR28702 36   1   6.4   0.0
  1972   ABF21276 48 ABF21278 48 ABF21277 48 ABF21274 48 ABF21272 48   5   8.2   0.0
  1974   CAA40728 18   1   5.0   0.0
  1975   ABU80188 41 ABR28680 39 ABR28603 39   3   7.0   0.2   最低p>.50,上年p<.002
  1976   ABS18465 32 AAF99717 24 AAF99716 3 0AAF99715 27 AAF99714 30 ABQ45533 41 ABW36366 42 ABW36322 41 ABV45838 43 ABR28625 41 ABR28614 43 ABR15819 39 ABQ45458 42 ABQ45447 41 ABQ45436 41 ABQ45425 42 ABQ45414 42 ABQ44394 40 P26562 31 P03455 40 AAB52910 16 AAD25304 31 AAB50962 18 AAB50961 16 AAB39851 40 BAA01280 31 Q76WJ1 6 Q9IGQ0 4   28   6.0   1.8   最低p<.005,上年p<.005
  1977   ABD95350 37 ABD60944 37 ABD60933 37 ABW71492 38 ABU80410 41 ABW36410 38 ABW36399 38 ABW36388 38 ABW36377 38 ABV29524 41 ABU80287 38 ABU80254 41 ABU80243 41 ABU80232 41 ABU80221 41 ABU80210 38 ABU80199 41 ABD95712 37 ABS49921 41 ABR28647 41 ABR28581 41 ABR28570 41 ABR28559 41 ABR28548 41 ABR28537 43 ABR15874 41 ABR15863 41 ABR15852 41 ABR15841 41 ABR15830 41 ABO44134 37 ABB19667 31 ABB19529 31 ABB19518 31 P03453 37 AAD25308 30 AAA43240 16 AAA43206 27 AAB52908 15 BAF03627 29 P35938 3 P03469 8   42   6.4   1.2   最低p<.005,上年p<.20
  1978   ABW86585 41 ABW86574 41 ABW71503 41 ABU80265 39 ABR28691 39 ABP49448 37 ABP49338 37 ABO38065 37 ABO32992 37 ABO32981 39 ABN59423 37 ABK79948 37 ABG26813 37 ABF47737 37 ABF47726 37 ABF47715 37 ABF47704 37 ABF47693 37 AAA74287 16 AAA65552 16 AAA65548 16   21   6.4   0.8   最低p<.005,上年p>.50
  1979   ABS18464 32 AAA43172 37 ABW36311 37 ABR28636 45 ABQ01322 38 ABN50756 37 ABB19551 30 ABB19540 31 P18875 37 CAA86563 15 P31348 8   11   5.8   1.6   最低p<.02,上年p<.20
  1980   AAA16879 31 AAA16880 29 ABS18466 41 AAB50965 16 ABU80276 44 ABS49954 44 ABR28757 44 ABR28746 44 ABR28735 44 ABR28713 39 ABO38362 38 ABO33006 37 ABI84478 32 ABF47748 38 Q9WCE3 32 AAB52909 17 AAD25309 35 AAD25307 32 CAA40731 20   19   6.5   1.0   最低p<.05,上年p<.20
  1981   AAB50964 16 BAA02766 5 AAZ15840 15 AAZ15839 15 ABW36355 41 ABW36344 41 ABW36333 41 ABS49932 41 ABR28669 41 ABR28658 41 ABO52258 38 ABI84617 31 ABB21772 31 BAA02767 5 BAA02765 7 O9WCE1 31 AAB52906 22 AAD25301 44 AAD25305 31 CAA86562 14 CAA82950 38 AAK51352 20 AAK51351 20 AAK51350 20 AAK51349 20 AAK51348 20 AAK51347 20 AAK51346 20 AAK51345 20 AAK51344 20 AAK51343 20 AAK51342 20 AAK51341 20   33   5.9   1.0   最低p<.001,上年p<.05
  1982   P26142 3 ABD95339 38 ABD77818 38 AAA16905 3 ABO52797 42 P10757 44 AAA65553 17 CAC86623 11   8   5.2   2.2   最低p<.05,上年p<.30
  1983   ABG66977 17 ABG66976 17 ABG66975 20 ABG66974 20 ABG66973 20 ABO38340 41 ABO37988 41 ABO33025 42 ABN50917 41 ABN50900 38 ABM66886 41 ABM66908 41 ABM66897 41 ABM22235 41 ABM22224 41 ABM22213 41 ABM22202 41 ABM22191 41 ABM22180 41 ABM22169 41   56   6.9   0.9   最低p>.50,上年p<.02
  ABM22158 41 ABL67264 41 ABL67253 41 ABK80047 41 ABK80036 41 ABK80025 41 ABK40601 41 ABK40590 41 ABK40579 41 ABK40568 41 ABK40557 41 ABK40546 41 ABK40534 41 ABK40510 41 ABI92302 38 ABI30378 41 ABI20859 41 ABG88344 38 ABG88333 38 ABF47825 41 ABF47770 41 ABG79952 41 ABF47847 41 ABF47836 41 ABF47759 41 ABF47792 41 ABG26835 41 ABG26824 41 ABF47814 41 ABF47803 41 ABF47781 41 BAF63173 20 ABW91185 41 AAD25311 34 CAA35094 39 P11485 8
  1984   AAA43171 36 AAZ15838 15 ABP49349 39 ABO38406 42 P18876 36 AAB27052 21 AAA65557 21 AAA65556 20 AAA65555 20   9   6.0   1.0   最低p<.02,上年p<.01
  1985   CAA91080 27 AAB50966 13 ABW86596 41 ABR29615 41 ABR29605 41 Q9WCE8 32 AAB52907 15 AAD25306 30 AAD25312 32 P31349 8   10   5.3   1.7   最低p<.01,上年p<.30
  1986   AAA43236 17 BAA00309 18 BAA00308 17 ABP49360 34 ABO44123 37 ABO38395 37 ABM22246 34 AAC57166 36 BAF63172 16 P12590 17 AAA65547 17 BAA00722 17 CAA35097 17   13   5.5   0.7   最低p<.001,上年p>.50
  1987   BAA96118 17 AAZ15842 16 ABU80420 41 ABS50111 41 ABR29575 41 ABV29590 33 ABS49943 33 ABQ44416 34 ABG88212 29 ABN50940 34 ABN50928 34 AAD25310 33 AAA43680 17 AAA65550 17 AAA65549 17 CAA35095 44 P05778 4   17   5.9   1.0   最低p<.001,上年p<.20
  1988   CAA91081 38 AAA43238 17 AAA43233 17 AAA43231 17 AAA43170 16 AAA43169 17 AAA43166 17 AAA43161 18 AAA43157 14 ABU80400 40 ABS50121 40 ABR29595 42 ABR29585 42 ABB19607 30 P26140 39 AAB52904 18 CAA42444 14 ABF71860 39 AAA74300 14 AAA74299 17 AAA74298 14 AAA74285 14 AAA65551 17   23   5.4   1.2   最低p<.001,上年p<.20
  1989   AAA43168 18 AAA43158 14 AAA58800 21 AAA58801 21 BAA06719 14 BAA96119 14 AAZ15841 20 BAA02768 31 BAA02769 33 BAF63171 13 AAA74286 14 ABG57284 2 ABG57283 2 ABG57282 2 ABG57281 2   15   4.0   2.3   最低p<.001,上年p<.02
  1990   AAA43235 14 AAA43234 14 AAA43232 14 AAA43190 14 AAA43173 14 AAA43153 14 AAA91616 27 AAZ15844 16 AAZ15843 8 ABG88201 34 AAB57740 16 AAA16778 14 AAA16779 14 AAA16815 14 AAA16814 14 AAA16813 14 AAA16812 13 AAA16811 14 AAA16810 14 AAA16809 14 AAA16808 15 ABG66980 2 ABG66979 2   23   3.9   1.2   最低p<.001,上年p>.50
  1991   AAA43225 14 CAA91082 38 AAP34322 36 AAA43167 14 AAA43283 42 BAA96120 14 ABW71521 42 ABR29565 42 ABQ10099 16 ABD60955 33 AAA19934 37 S69887 26 S69888 36S69889 42 AAB50963 42 CAA91083 34 CAA86560 39 CAA86567 17 AAA43142 14 AAA74297 14 AAA74296 14 AAA74295 14 AAA74294 14 AAA74293 14 AAA74292 17 AAA74291 14 AAA74290 14 AAA74289 14 AAA74288 14 AAA65546 14 AAA65545 14 AAA65544 14 CAD29945 19 ABG66981 2 ABG66978 2 ABE73717 2   36   4.8   1.8   最低p<.001,上年p<.02
  1992   AAB29091 41 BAA05874 14 BAA96121 14 ABB19618 30 AAU09400 12 AAC57167 38 HMIV17 39 CAA86561 39 AAC14275 14 AAA51481 5 AAA72339 41   11   5.2   2.0   最低p<.01,上年p>.50
  1993   ABM21960 34 ABI92181 30 AAC57169 35 AAC57168 36 ABO52170 39 AAB50960 31 AAB50958 17 AAB50957 17   8   5.9   1.0   最低p<.01,上年p<.30
  1994   ABS70427 30 AAB03292 42 AAB03291 42 AAB50959 31 CAD29938 14   5   6.3   1.5   最低p<.30,上年p>.50
  1995   AAK70450 37 AAK70449 37 AAP34325 38 AAP34323 20 BAC82887 19 BAC82881 19 BAA96122 19 AAZ17358 16 ABQ10100 19 ABP51995 1 ABG88322 36 ABG26791 37   47   6.1   1.7   最低p<.001,上年p>.50
  ABF47638 36 ABJ53438 37 ABI92313 40 ABI30367 36 ABI20870 31 ABI20837 36 ABG88311 36 ABG88300 36 ABF47627 37 ABG47840 36 ABG26780 36 ABF47605 37 ABE26991 36 ABE12032 37 ABE11942 36 ABE11922 36 ABE11900 36 ABE11889 36 ABE11878 36 ABE11867 37 AAL60449 36 AAL60444 36 AAL60443 36 AAK67336 17 AAK67335 17 AAK67332 17 AAK67331 17 AAK67330 17 ABS70438 30 CAC86625 18 CAC86619 14 CAC86617 18 CAD29944 19 CAD29937 1 CAD29936 14
  1996   BAC82896 19 BAC82893 19 BAC82884 19 BAA96124 19 BAA96123 19 AAK73345 16 AAK73344 16 AAK73343 16 AAK73342 16 AAK73341 16 AAK73340 16 AAK73339 16 AAK73338 16 AAK73337 16 AAK73336 16 AAK73335 16 AAK73334 16 AAK73333 16 AAK73332 16 AAK73331 16 AAK73330 16 AAK73329 16 AAK73328 16 AAK73327 16 AAK73326 12 AAK73325 16 AAK73324 16 AAK73323 16 AAK73322 16 AAK73321 16 AAK73320 16 ABO52225 37 ABO38010 37 ABN51066 39 ABN50973 37 ABN50962 37 ABN50951 36 ABF47649 36 ABM22290 36 ABM22279 37 ABM22268 36 ABM22257 36 ABB19571 30 ABJ53504 31 ABJ53493 31 ABI95283 31 ABI95272 31 ABI95261 31 ABI95250 31 ABI93028 31 ABI21574 31 ABI21563 31 ABI21552 31 ABI21541 31 ABI21530 29 ABI21519 31 ABI20848 39 ABG47829 36 ABF47660 37 AAK67328 17 AAK67327 17 AAK67326 17 AAK67325 17 AAK67324 17 AAK67323 22 AAK67322 17 AAP60039 37 AAP60038 39 AAP60037 42 AAP60036 37 AAF06947 16 AAF06946 13 AAF06945 13 CAC86611 17 AAB81463 23 AAB81462 19 AAB81461 19 AAB81460 19 AAB81459 23 AAB81458 19 AAB81457 19 AAB81456 19 CAC86616 38 BAF03629 30 ABD59847 36 CAD29943 18 CAD29933 14   87   7.1   1.9   最低p<.40,上年p<.002
  1997   AAD17229 29 BAA96125 14 ABG26246 19 ABG26245 19 ABG26244 19 ABG26243 19 ABG26242 19 AAQ10369 19 AAO10368 16 AAQ10367 19 AAK67337 12 AAF87281 48 AAF87280 48 AAF87279 42 AAF87278 42 AAF87277 42 AAF87276 42 AAF87275 39 AAF87274 40 AAP79975 1 AAP79973 1 CAC86608 42 CAC86606 33 ABD59848 34 CAD29934 14 CAD29932 14 CAD29928 14 CAC86615 17   28   5.7   2.0   最低p<.001,上年p<.001
  1998   AAK70464 22 AAK70459 7 AAK70458 18 AAK70457 31 AAK70456 31 AAK70455 14 AAK70454 29 AAK70453 29 AAK70452 29 AAK70451 31 AAD17218 21 BAC82898 14 BAC82877 14 BAC82871 17 BAA96131 14 BAA96126 14 AAD17219 21 ABQ10144 13 ABQ10143 18 ABQ10087 16 ABB19574 31 AAK67319 12 AAF87284 45 AAF87283 41 AAF87282 42 AAT00438 23 CAB42465 30 AAT65329 30 AAO88265 20 CAC86609 6 CAC86624 28 CAD29935 17 CAD29931 14 CAD29929 13 CAD29927 14 CAD29922 14 CAC86335 17 CAC86620 32   38   5.1   1.2   最低p<.001,上年p<.10
  1999   AAP34324 31 ABV25643 49 ABV25640 49 ABV25638 49 ABV25637 49 ABV25636 49 ABV25635 49 ABV25634 49 ABQ10137 15 ABL67055 30 ABL67066 30 ABJ53427 30 ABG88256 30 BAC82894 17 BAC82892 14 BAC82885 9 BAC82883 14 BAC82876 17 BAC82875 14 BAC82873 20 BAC82872 14 BAA96128 14 BAA96127 14 ABO21723 19 ABK40006 31 ABJ16609 31 AAQ10385 19 AAQ10380 19 AAQ10373 19 AAQ10372 19 AAK67343 12 AAK67342 12 AAK67341 12 AAK67340 12 AAK67339 12 AAK67334 17 AAK67333 12 AAK67329 12 BAF63169 13 BAF63168 13 BAF63167 13 BAF63166 13 AAF80098 14 AAF80099 14   65   5.3   2.0   最低p<.001,上年p<.40
  CAC86337 51 CAC86336 19 CAC86610 51 CAC86622 31 CAC86605 19 ABD59849 28 CAD29942 19 CAD29921 14 CAD29917 14 CAD29916 14 ABV25653 9 ABV25650 9 ABV25648 9 ABV25647 9 ABV25646 9 ABV25645 9 ABV25644 9 BAF63165 13 CAC86334 17 CAC86626 14 CAC86621 23
  2000   ABC66246 1 ABC66232 13 AAY42122 15 AAY42121 15 AAY42120 15 AAY42119 15 AAY42118 15 AAY42117 15 AAY42116 15 AAY42115 15 AAY42114 15 BAC82897 19 BAC82895 14 BAC82891 13 BAC82890 14 BAC82889 14 BAC82888 13 BAC82886 14 BAC82882 13 BAC82880 14 BAC82879 14 BAC82878 14 BAC82874 19 BAC82870 14 BAC82865 14 AAN83988 20 BAA96130 19 BAA96129 14 AAK40315 14 AAK40318 14 AAK40316 14 AAK40317 14 AAK40314 14 AAK40313 14 ABV45849 31 ABU80309 31 ABU80298 32 ABS49987 31 ABS49976 31 ABR28801 31 ABR28779 31 ABR28768 31 ABR14657 1 ABR14641 1 ABR14640 14 ABR14639 14 ABR15918 31 ABR15907 31 ABR15896 18 ABR15885 31 ABQ10097 20 ABQ10095 13 ABP49382 37 ABP49305 31 ABP49217 31 ABO44046 31 ABO21725 19 ABO21724 21 ABO21716 19 ABM22026 39 ABL67209 37 ABL67187 37 ABK79970 37 ABK40050 37 ABK40039 37 ABK40028 37 AAX56530 41 ABJ53515 37 ABJ53449 31 ABJ16730 37 ABJ16719 37 ABJ16642 37 ABJ09327 18 ABI95294 18 ABI95217 31 ABG88553 31 ABG88542 31 ABG80183 31 ABG80172 31 ABG67477 31 ABG48049 31 ABG37362 31 ABF47891 31 ABF47880 31 ABF47869 31 ABG72870 1 ABG72869 1 ABG47818 31 ABG47807 31 ABE11668 18 ABE11657 31 ABD95031 18 ABD95020 31 ABD95009 31 ABD94998 31 ABD94987 31 ABD94976 18 ABD94965 31 ABD94756 31 ABD78038 31 ABD78027 31 ABD78016 31 ABD78005 31 ABD77994 31 ABD77983 31 ABD77972 31 ABD77961 31 ABD77950 31 ABD77939 31 ABD77928 33 ABD77917 31 ABD77730 31 ABD77719 31 ABD77708 31 ABD63063 31 ABD61540 31 ABD61518 31 ABD60900 31 ABD60889 31 ABD60878 31 ABD60867 31 ABD60856 31 ABA08497 18 ABA08486 18 AAQ10391 2 AAK67344 12 AAK67338 12 AAK67321 12 AAK67320 12 AAL15459 27 CAC86333 28 CAC86607 28 CAC86612 28 CAD29941 19 CAD29940 19 CAD29939 24 CAD29930 1 CAD29926 1 CAD29924 1 CAD29920 16 CAD29919 14 CAD29899 14 CAD57622 6 CAC86618 31 CAC86614 17 CAC86613 17 CAC18525 12   147   5.0   1.6   最低p<.001,上年p<.10
  2001   AAP79964 12 ABC66233 14 BAC82869 1 BAC82868 1 BAC82867 1 BAC82866 1 BAC82864 1 BAC82863 1 BAC82862 14 BAC82861 1 BAC82860 13 BAC82859 14 BAC82858 14 BAC82857 14 BAC82846 1 BAC82843 1 ABI55088 1 AAZ17359 25 AAY56898 32 ABR28845 18 ABR28834 18 ABR14668 14 ABR14667 14 ABR14666 14 ABR14665 14 ABR14664 14 ABR14663 13 ABR14662 14 ABR14661 14 ABR14660 14 ABR14659 14 ABR14658 14 ABR14656 1 ABR14655 1 ABR14654 1 ABR14653 1 ABR14652 1 ABR14651 1 ABR14650 1 ABR14649 14 ABR14648 14 ABR14647 14 ABR14646 14 ABR14645 14 ABR14644 14 ABR14643 14 ABR14642 14 BAF63035 13 BAF63032 13 ABQ10092 1 ABO10091 1 ABQ10090 1 ABQ10089 14 ABO38329 18 ABO38318 18 ABO38043 18 ABO38032 31 ABO38021 31 ABO32959 18 ABO32948 18 ABN51143 18 ABN51077 18 ABM66864 18 ABJ09151 19   193   3.2   1.6   最低p<.001,上年p<.001
  ABG67491 18 ABG37395 18 ABG37384 18 ABG26945 18 ABF82940 18 ABF82929 18 ABF82918 18 ABF82907 18 ABF82896 18 ABF82885 18 ABF82874 18 ABF82863 18 ABF82852 18 ABF82841 18 ABF82830 18 ABF82819 31 ABG72867 1 ABG72866 1 ABF47671 18 ABF47572 18 ABF47561 29 ABG37120 18 ABF82684 18 ABF82673 18 ABF82662 18 ABF47583 18 ABE12248 18 ABE11856 18 ABE11845 18 ABE11834 18 ABE11823 18 ABE11812 18 ABE11734 18 ABE11723 18 ABE11712 18 ABE11701 18 ABE11690 18 ABE11679 26 ABD95328 18 ABD95317 18 ABD95306 18 ABD95295 18 ABD95284 18 ABD95273 18 ABD95262 31 ABD95251 18 ABD95240 18 ABD95229 18 ABD95218 18 ABD95207 31 ABD95196 18 ABD95185 18 ABD95174 18 ABD95163 18 ABD95152 18 ABD95141 18 ABD95130 18 ABD95119 18 ABD95108 18 ABD95097 18 ABD95086 18 ABD95075 18 ABD95064 18 ABD95053 18 ABD95042 18 ABD94811 18 ABD94800 18 ABD94789 18 ABD94778 18 ABD78093 18 ABD78082 18 ABD78071 18 ABD78060 18 ABD62061 31 ABD60911 31 ABC86237 36 ABC40533 18 ABB02814 18 ABA87231 18 ABA87091 18 ABC02277 18 ABB82194 18 ABB80045 18 ABB79990 18 ABB79979 18 ABB53707 18 ABB02936 18 ABB02924 31 ABB02913 18 ABB02825 18 ABA87045 18 ABA43189 18 ABA42575 18 ABA42324 31 ABA42258 18 ABA42236 18 ABA18037 18 ABA12715 18 ABA08519 31 ABA08464 18 AAZ85126 18 AAZ83299 18 AAZ79604 18 AAZ38627 18 AAT85679 18 AAU25871 12 AAU25861 12 AAL47667 14 AAL47668 19 CAD29925 1 CAD29923 1 CAD29918 14 CAD29911 1 CAD29910 1 CAD29909 14 CAD29908 14 CAD29907 1 CAD29906 1 CAD29905 19 CAD29904 1 CAD29903 14 CAD29902 19 CAD29901 14 CAD29900 1 CAD57623 33 CAD57621 6 CAD57620 27 CAD57619 28 CAD57617 1
  2002   AAU25851 29 BAC82856 1 BAC82855 1 BAC82854 1 BAC82853 1 BAC82852 1 BAC82851 1 BAC82850 1 BAC82849 1 BAC82848 1 BAC82847 1 BAC82845 1 BAC82844 1 BAC82842 1 9AAP69688 1 AAP69687 1 AAP69686 1 AAP69685 1 AAP69684 1 AAP69683 1 AAP69682 1 AAP69681 1 AAP69680 12 AAP69679 1 AAP69678 3 AAP69677 1 AAP69676 1 AAP69675 1 AAP69674 1 AAP69673 1 AAP69692 1 AAP69691 1 AAP69690 1 AAP69689 1 ABS76427 18 BAF63057 12 BAF63054 12 BAF63050 12 BAF63046 17 BAF63043 13 BAF63039 13 ABB19628 31 ABG72868 1 ABA87080 31 ABB82216 31 ABB51962 17 AAZ83253 28 AAT12706 29 ABS70411 30 ABS70400 30 ABS70389 30 ABS70378 30 ABS70367 30 ABS70337 30 ABS70326 30 ABS70316 30 ABS70305 30 CAD29958 14 CAD29914 14 CAD57618 28 CAD57616 14 CAD35678 19   62   2.6   2.5  最低p<.001,上年p<.05
  2003   ABB86907 43 ABB86887 37 ABB86877 37 BAF63102 13 BAF63101 13 BAF63097 13 BAF63096 13 BAF63095 13 BAF63091 13 BAF63090 13 BAF63089 13 BAF63085 13 BAF63084 13 BAF63083 13 BAF63082 13 BAF63078 13 BAF63075 13 BAF63072 13 BAF63068 13 BAF63064 13 BAF63061 13 ABQ10105 16 ABQ10104 14 ABQ10103 14 ABQ10102 14 ABO37999 31 ABN51088 31 ABM67051 31 ABI96088 14 ABI96127 14 ABI96126 14 ABI96125 14 ABI96124 11 ABI96123 14 ABI96122 14 ABI96121 14 ABI96120 14 ABI96119 16 ABI96118 17 ABI96117 14   94   4.9   1.1  最低p<.001,上年p<.001
  ABI96116 14 ABI96115 14 ABI96114 14 ABI96113 14 ABI96112 11 ABI96111 14 ABI96110 14 ABI96109 31 ABI96108 30 ABI96107 31 ABI96105 14 ABI96103 31 ABI96100 14 ABI96098 14 ABI96097 14 ABI96096 14 ABI96095 14 ABI96094 14 ABI96093 14 ABI96090 14 ABE12634 57 ABD78104 51 ABD60779 28 ABD15515 28 ABC41714 31 ABB03123 31 ABA87057 31 AAZ83977 31 ABB82205 36 ABB80103 31 ABB53740 31 ABB03145 31 ABB02803 31 ABB02792 28 ABA42247 36 ABA18145 31 ABA12729 28 ABA12707 31 ABA12696 31 ABA08475 36 ABK39995 31 ABB86917 31 1RUZ_M 19 1RUZ_L 19 1RUZ_K 19 1RUZ_J 19 1RUZ_I 19 1RUZ_H 19 1RUY_M 15 1RUY_L 15 1RUY_K 15 1RUY_J 15 1RUY_I 15 1RUY_H 15
  2004   ABB86946 40 ABB86937 44 ABS00326 34 ABQ10005 26 ABQ10004 20 ABQ10003 14 ABQ10002 14 ABQ10001 26 ABQ09988 14 ABQ09838 22 ABQ09837 28 ABQ09784 14 ABQ09783 29 ABQ09782 29 ABQ09780 27 ABQ09779 29 ABI96132 14 ABI96130 14 ABI96129 14 ABI54447 13 ABI54446 13 ABI54445 13 ABI54444 13 ABI54443 13 ABI54442 13 ABI54441 13 ABI54440 13 ABI54439 13 ABI54438 13 ABI54437 13 ABE27153 46 ABC42750 46 ABB86929 31 ABB86899 31 AAV68006 15 AAV67984 13   36   5.3   1.4  最低p<.001,上年p<.10
  2005   ABJ51893 13 ABI51313 13 ABO52104 30 ABC66245 14 ABC66244 14 ABC66243 14 ABC66242 14 ABC66241 14 ABC66240 14 ABC66239 14 ABC66238 14 ABC66237 14 ABC66236 14 ABC66235 14 ABC66234 14 ABW75642 18 ABI19015 41 ABK57093 35 ABR28900 31 ABJ51895 13 ABJ51894 13 ABJ51892 13 ABJ51891 13 ABJ51890 13 BAF63115 13 BAF63111 13 BAF63107 13 BAF63103 13 ABQ09953 14 ABQ09950 27 ABQ09949 14 ABQ09948 13 ABQ09947 14 ABQ09915 14 ABQ09914 14 ABQ09913 14 ABQ09904 14 ABQ09874 14 ABQ09873 14 ABQ09872 14 ABQ09871 16 ABP51970 14 ABP49393 31 ABO32970 31 ABO32678 37 ABO21731 14 ABO21730 14 ABK40689 31 ABJ16686 31 ABJ16675 31 ABJ16664 31 ABJ16653 31 ABJ09184 31 ABI96148 14 ABI96147 32 ABI96146 14 ABI96145 27 ABI96144 13 ABI96143 29 ABI96142 14 ABI96141 14 ABI96140 14 ABI96139 14 ABI96138 14 ABI96137 14 ABI96135 14 ABI96134 14 ABI96128 16 ABI92379 31 ABI30565 31 ABI22109 31 ABI21233 31 ABI21222 31 ABI21211 31 ABI21200 31 ABI21189 31 ABG72865 1 ABG72864 1 ABG72863 1 BAE53730 14 BAE53729 14 ABB84190 14   82   4.9   1.5  最低p<.001,上年p<.10
  2006   BAE96542 25 BAE96541 14 BAE96540 14 BAE96539 25 BAE96538 14 BAE96537 14 BAE96536 25 BAE96535 14 BAE96534 14 BAE96533 14 ABW71294 31 ABW23335 40 ABW23328 31 ABW23327 14 ABW23324 27 ABW23321 14 ABW23320 31 ABW23318 14 ABW23317 27 ABW23314 30 ABW23311 14 ABW23310 14 ABW23308 13 ABW23307 14 ABW23306 14 ABW23303 14 ABW23300 14 ABW23296 31 ABW23295 31 ABW23294 29 ABW23291 14 ABW23290 31 ABW23289 17 ABW23287 14 ABW23286 31 ABW23285 13 ABW23284 14 ABW23283 1 ABW23280 14 ABW23279 14 ABW23275 14 ABV45654 31 ABV29557 31 ABV29546 31 ABV29535 18 ABU99109 44 ABU99069 25 ABU99067 27 ABU50589 44 ABU50588 44 ABU50587 44 ABU50586 42 ABU50574 18 ABU50573 31 ABU50571 31 ABU50570 31 ABU50569 31 ABU50568 31 ABU50567 31 ABU50566 18 ABU50565 31 ABU50556 11 ABU50555 26 ABU50554 14   135   5.2   1.7  最低p<.001,上年p<.20
  ABU50553 14 ABU50552 26 ABU50551 23 ABU50550 23 ABU50549 14 ABU50546 17 ABU50545 28 ABU50544 13 ABU50543 14 ABU50542 1 ABU50541 13 ABU50540 1 ABU50539 14 ABU50538 23 ABU50537 14 ABU50536 1 ABU50535 14 ABU50534 31 ABU50518 27 ABU50517 23ABS00315 31 BAF63135 14 BAF63131 14 BAF63127 25 BAF63123 18 BAF63119 14 ABQ09984 25 ABQ09981 25 ABQ09977 31 ABQ09976 25 ABQ09975 25 ABQ09974 27 ABQ09973 25 ABQ09972 25 ABQ09969 27 ABQ09968 25 ABQ09961 29 ABQ09960 29 ABQ09958 29 ABQ09957 26 ABQ09956 25 ABQ09955 19 ABK79959 31 ABI96174 27 ABI96173 14 ABI96172 14 ABI96171 14 ABI96170 14 ABI96169 14 ABI96168 14 ABI96167 14 ABI96166 25 ABI96165 14 ABI96164 14 ABI96163 14 ABI96162 19 ABI96161 14 ABI96160 14 ABI96159 14 ABI96158 14 ABI96157 14 ABI96156 14 ABI96155 14 ABI96154 14 ABI96153 27 ABI96152 27 ABI96151 14 ABI96150 14 ABI96149 27 ABH07371 29 ABH07372 29
  2007   ABS71673 46 ABS71672 46 ABS71671 46 ABS71670 46 ABS71669 46 ABS71668 46 ABS71667 46 ABS71666 46 ABS71665 46 ABS71664 46 ABQ52695 35 ABW34451 23 ABW86606 31 ABW86552 31 ABW86541 31 ABW86530 31 ABW86519 31 ABW86508 31 ABW86497 18 ABW86486 31 ABW86475 31 ABW86464 31 ABW86453 31 ABW86442 31 ABW86431 31 ABW86420 31 ABW86409 31 ABW86398 18 ABW86387 31 ABW86376 31 ABW86365 31 ABW86354 31 ABW86343 31 ABW86332 30 ABW86321 18 ABW71470 31 ABW71459 31 ABW71448 31 ABW71437 31 ABW71426 31 ABW71415 31 ABW71404 31 ABW71393 31 ABW71382 31 ABW71371 31 ABW71360 18 ABW71338 31 ABW71327 31 ABW71316 31 ABW71305 18 ABW40675 31 ABW40664 18 ABW40642 31 ABW40620 31 ABW40609 31 ABW40598 18 ABW40576 31 ABW40565 31 ABW40554 30 ABW40543 31 ABW40532 31 ABW40521 31 ABW40510 18 ABW40499 31 ABW40488 31 ABW40477 31 ABW40466 31 ABW40455 31 ABW40444 31 ABW40433 18 ABW40422 31 ABW40411 31 ABW40400 31 ABW40389 31 ABW40367 31 ABW40356 31 ABW40345 18 ABW40334 18 ABW40312 30 ABW40301 30 ABW40290 31 ABW40279 31 ABW40257 31 ABW40235 31 ABW40224 31 ABW40213 31 ABW40202 31 ABW40180 31 ABW40158 31 ABW40147 31 ABW40125 31 ABW40114 31 ABW40103 31 ABW40092 33 ABW40070 43 ABW40059 31 ABW40048 33 ABW40037 31 ABW40015 18 ABW40004 31 ABW39993 31 ABW39982 31 ABW39971 42 ABW39960 31 ABW39949 31 ABW39927 31 ABW39916 40 ABW39905 31 ABW39894 31 ABW39883 33 ABW39861 31 ABW39850 40 ABW39839 27 ABW39828 46 ABW39817 30 ABW39806 31 ABW39777 31 ABW36300 30 ABW36289 31 ABW36278 31 ABW36267 31 ABW36256 43 ABW36245 31 ABW36234 31 ABW36223 31 ABW36212 31 ABW36201 31 ABW36190 31 ABW36179 31 ABW23343 33 ABW23342 44 ABW23341 36 ABW23340 31 ABW23339 30 ABW23338 31 ABW23337 31 ABW23336 36 ABW23329 14 ABW23326 14 ABW23325 31 ABW23323 31 ABW23322 27 ABW23319 31 ABW23316 14 ABW23315 40 ABW23313 31 ABW23312 46 ABW23309 14 ABW23305 31 ABW23304 31 ABW23302 31 ABW23301 14 ABW23299 46 ABW23298 13 ABW23297 1 ABW23293 31 ABW23292 18 ABW23288 31 ABW23282 31 ABW23281 31 ABW23278 14 ABW23277 31 ABW23276 38 ABW23274 1   285   5.5   1.2  最低p<.001,上年p<.02
  ABW23273 31 ABV82551 30 ABV45959 31 ABV45948 31 ABV45937 31 ABV45926 30 ABV45915 31 ABV45893 30 ABV45882 31 ABV45871 31 ABV30624 31 ABV30613 32 ABV30602 31 ABV30591 31 ABV30580 31 ABV30569 31 ABV30558 31 ABV30547 30 ABV30536 31 ABV30525 31 ABV30503 31 ABV30492 31 ABV30459 31 ABV30371 31 ABV30360 31 ABV30349 31 ABV30338 31 ABV30327 18 ABV30316 31 ABV30305 31 ABV30294 18 ABV30283 31 ABV30195 31 ABV30184 31 ABV30173 31 ABV30162 31 ABV30151 31 ABV30140 21 ABV30129 31 ABV30107 31 ABV30096 31 ABV30085 31 ABV30052 31 ABV30041 31 ABV30030 31 ABV30019 31 ABV30008 31 ABV29997 31 ABV29986 31 ABV29975 31 ABV29964 31 ABV29953 31 ABV29942 30 ABV29920 31 ABV29887 31 ABV29876 31 ABV29865 31 ABV29854 31 ABV29843 31 ABV29832 31 ABV29799 31 ABV29788 31 ABV29777 30 ABV29766 31 ABV29755 31 ABV29744 31 ABV29733 30 ABV29700 31 ABV29689 31 ABV29678 31 ABV29667 31 ABV29656 31 ABV29645 31 ABV29634 31 ABV29612 31 ABV29601 30 ABV29579 35 ABV29568 31 ABU50572 31 ABS71683 46 ABS71682 46 ABS71681 46 ABS71680 46 ABS71679 46 ABS71678 46 ABS71677 46 ABS71676 46 ABS71675 46 ABS71674 46 ABW91636 31 ABW91625 31 ABW91614 31 ABW91603 18 ABW91592 31 ABW91581 31 ABW91570 30 ABW91559 31 ABW91537 31 ABW91526 30 ABW91515 31 ABW91504 31 ABW91493 35 ABW91482 18 ABW91471 31 ABW91460 18 ABW91449 18 ABW91427 31 ABW91416 31 ABW91405 18 ABW91383 31 ABW91372 31 ABW91361 30 ABW91350 31 ABW91339 31 ABW91328 28 ABW91317 31 ABW91306 31 ABW91295 31 ABW91284 42 ABW91273 31 ABW91218 31
实施例14
分析马流感病毒H3N8中的Replikin计数
[000438]申请人使用专有的搜索工具软件(在美国可从REPLIKINSLLC,Boston,MA获得的ReplikinForecastTM)分析PubMed的EIV分离株的公众可得的序列。该数据包含于下表22和上表4中并图示地描述于图7。
[000439]表22提供1963至2005年流感病毒H3N8株的pB1基因区的公众可得的序列的Replikin浓度的数据。序列在www.pubmed.com以登记号公众可得。伴随每年平均Replikin计数,还提供与上年的平均Replikin计数和数据组中最低平均Replikin计数相比的标准差和显著性。在指定年份的数据不可得时,该年份在表中不呈现。
表22-H3N8pB1
  年份   PubMed登记号-Replikin计数   每年分离株的数目   每年平均Replikin计数   S.D.   显著性
  1963   ABB88376 14   1   1.8   0.0
  1972   ABI84585 14   1   1.8   0.0
  1977   ABB19675 15   1   16.7   0.0
  1978   ABB20350 15 ABB88317 18   2   11.0   2.7   最低p<0.40,上年p>0.50
  1979   ABB87407 20 ABB86793 20   2   22.2   0.0   上年p<0.30
  1980   ABB87797 20 ABB20412 14 BAF32965 14 Q08II5 14 Q08II4 5   5   6.7   8.8   最低p<0.20,上年p<0.01
  1982   ABI84945 16   1   17.8   0.0   上年p<0.04
  1985   ABB19731 20 ABB19720 17   2   20.6   2.4   最低p<0.05,上年p<0.30
  1986   ABQ52134 17 ABJ09104 25 ABP49539 14 P16505 17 AAA43638 17   5   13.3   11.1   最低p<0.05,上年p<0.20
  1987   ABL67228 14 ABL67849 15 ABM66861 20 AB195482 15   4   19.1   2.7   最低p<0.001,上年p<0.30
  1991   ABM21946 15 ABI84419 15   2   9.3   10.4   最低p<0.40,上年p<0.20
  1992   ABB88191 14   1   15.6   0.0   上年p>0.50
  1998   AAT65279 6 AAT65275 6 AAT65264 6 AAT65263 6 AAT65251 6 AAT65249 6   6   2.2   0.0   最低p<0.001,上年p<0.001
  1999   AAZ23576 15   1   2.0   0.0   上年p<0.001
  2001   ABB19766 16 AAN15147 5   2   9.9   1.2   最低p<0.40,上年p>0.50
  2002   AAZ23577 15 ABI47978 14 ABO51892 14 ABO51870 14 AAX23573 15   5   4.6   6.1   最低p<0.30,上年p>0.50
  2003   AAZ23578 15 AAZ23575 15 AAZ23574 15 AAZ23573 15 AAZ23572 15 ABB17181 15   6   2.0   0.0   最低p<0.001,上年p<0.30
  2004   AAZ23571 15 ABJ53167 5 ABD27777 6 ABD27776 6 ABD27775 6   5   2.2   0.2   最低p<0.01,上年p<0.02
  2005   ABS89395 16 ABR37470 16 ABO52651 16 ABO76921 16 ABO52684 16 ABO52640 16 ABL67140 16 ABL67118 16 ABK79945 16 ABJ09126 16 ABI92277 16 ABI92266 16 ABO52101 25   13   18.5   2.8   最低p<0.001,上年p<0.001
[000440]如可从表22看出的,对于H3N8分离株的序列信息是公众可得的42年期间,Replikin浓度变化的周期性变得明显。Replikin浓度达到周期内高点时,在约1至约2年内发生流行。例如,1979年每100氨基酸22.2 Replikin序列的高值降至1998和1999年每100氨基酸2 Replikin序列,1995至2001年未报道流行。随后Replikin浓度表现为再次在2001年升高,随后分别在2002和2003年在英国和德国流行,和随后降至2003和2004年的约2,在2005年明显增加至18.5,接近1979年的高值。紧接着2005年增加的是2007年澳大利亚、意大利和日本的流行。
[000441]表23提供1963至2005年流感病毒H3N8株pB2基因的公众可得的序列的Replikin浓度数据。序列在www.pubmed.com以登记号可得。伴随每年平均Replikin计数,还提供与上年的平均Replikin计数和数据组中最低平均Replikin计数相比的标准差和显著性。
表23-H3N8pB2
  年份   PubMed登记号-Replikin计数   每年分离株的数目   每年平均Replikin计数   S.D.   显著性
  1963   ABB88378 18   1   2.4   0.0
  1972   ABI84587 18   1   2.4   0.0
  1977   ABB19677 18   1   2.4   0.0
  1978   ABB20352 18 ABB88319 18   2   2.4   0.0
  1979   ABB87409 18 ABB86795 18   2   2.4   0.0
  1980   ABI84488 14 ABB87799 19 BAF32964 18 Q08II6 18   4   2.3   0.3   最低p>0.50,上年p>0.50
  1981
  1982   ABI84947 18   1   2.4   0.0   上年p>0.50
  1985   ABB19733 18 ABB19722 18   2   2.4   0.0
  1986   ABO52136 18 ABJ09106 18 ABP49541 17 AAA43133 18 P26105 18   5   2.3   0.1   最低p<0.30,上年p<0.30
  1987   ABL67230 18 ABL67851 18 ABM66863 18 ABI95484 18   4   2.4   0.0   上年p<0.30
  1991   ABM21948 18 ABI84421 18   2   2.4   0.0
  1992   ABB88193 18   1   2.4   0.0
  1998   AAT65244 18 AAT65240 18 AAT65229 18 AAT65228 18 AAT65216 18 AAT65214 18   6   3.8   0.0
  1999   AAZ23564 1   1   0.2   0.0
  2000   AAG10729 1   1   0.6   0.0
  2001   ABB19768 18   1   2.4   0.0
  2002   AAZ23563 18 ABI47980 18 ABO51894 18 ABO51872 18 AAX23572 18   5   2.4   0.1   最低p<0.30,上年p<0.30
  2003   AAZ23567 18 AAZ23566 18 AAZ23565 18 AAZ23562 18 AAZ23561 18 ABB17182 18   6   2.4   0.0   最低p<0.30,上年p>0.50
  2004   AAZ23560 18   1   2.4   0.0   上年p<0.30
  2005   ABS89397 18 ABR37472 18 ABO52653 18 ABO76923 16 ABO52686 18 ABO52642 18 ABL67142 18 ABL67120 18 ABK79947 18 ABJ09128 18 ABI92279 18 ABI92268 16 ABO52103 18   13   2.3   0.1   最低p<0.10,上年p<0.10
[000442]回顾流感病毒H3N8株的pB2基因区的可得序列的Replikin浓度,揭示经过这些年Replikin浓度的可变性小得多。pB2 Replikin浓度可认为是验证pB1基因区中病毒当前分离株的最显著Replikin Peak基因的位置的对照数据。由于pB2基因紧邻着pB1基因,这些相邻区之间Replikin计数的可变性差异是显著的。
[000443]回顾流感病毒H3N8株的pA基因区的可得序列的Replikin计数的数据可见于图7。数据还揭示与pB1基因区相比,经过这些年Replikin浓度的可变性小得多。如同pB2 Replikin浓度,pA Replikin浓度可认为是验证pB1基因区中病毒当前分离株的最显著Replikin Peak基因的位置和唯一性的对照数据。当认识到EIV基因组的三个区域的各个区域的这些定量的每年测量值是由软件扫描和计数www.pubmed.com每年分离和报道的各病毒的病毒蛋白的客观确定值时,这些观察结果的显著性进一步增加。
[000444]申请人分析1942至2007年EIV分离株的公众可得序列并确定在分离株可得的各年份具有基因组序列的所有分离株的平均全基因组Replikin计数。
[000445]FluForecast
Figure A20088000249401601
(REPLIKINS LLC,Boston,MA)分析Replikin序列的存在和浓度的登记号列表提供于下表24。随着各相应年份分离株的登记号列表提供了每年的平均Replikin浓度。伴随每年平均Replikin浓度,还提供与上年的平均Replikin浓度和数据组中最低平均Replikin浓度相比的标准差和显著性。
表24-马流感全基因组
  年份   PubMed登记号-Replikin计数   每年分离株的数目 每年平均Replikin计数   S.D.   显著性
  1942   BAF49412 9   1   1.9   0.0
  1956   ABB20499 4 AAA43411 1 ABB20504 2 ABB20503 2 ABB20502 8 ABB20500 4 ABB20501 16 AAC57418 16 AAA43290 4 AAA43289 4 AAA43140 18 CAA44429 30 AAA43108 3 AAC35566 1 AAA52233 8 AAB51006 2 AAB51005 2 P88838 16 P26101 30 P26107 18 P16980 8   21   2.2   1.3   最低p<0.30
  1957   AAA64363 43 AAA64366 43 AAA64365 43 AAA64364 43 AAA64362 36   5   7.4   0.6   最低p<0.001,上年p<0.001
  1963   AAA43114 7 AAA43105 7 CAA44430 30 AAA43164 7 AAA43106 3 AAA43409 1 AAC31272 3 AAC31273 3 Q07579 1 P15658 7 P17002 7 P26094 30 P16979 3   13   1.6   1.7   最低p<0.40,上年p<0.001
  1964   CAA43815 32 CAA44432 32 AAC35580 2 P26097 32 P26096 32   5   4.7   2.1   最低p<0.04,上年p<0.01
  1966   CAA44433 29 P26098 29   2   5.1   0.0   上年p>0.50
  1969   AAA43429 3 Q07581 3   2   0.6   0.0
  1971   AAA43111 12 P17000 12   2   2.1   0.0
  1972   AAA43100 12 CAA44434 34 AAA43355 1 Q07576 1 P26103 34   6   2.8   2.6   最低p<0.40,
  P16994 12   上年p>0.50
  1973   AAA43174 32 AAA43141 18 CAA44437 32 CAA44435 32 AAA43104 27 AAA43637 17 AAA43457 7 AAB51000 2 AAB50999 2 P26099 32 P26095 32 P26106 18 P16504 17 P13168 27 P15673 7   15   3.4   1.7   最低p<0.005,上年p>0.50
  1974   AAA43093 16 P08327 16   2   3.4   0.0   上年p>0.50
  1976   AAA43107 6 AAA43101 6 CAA44436 32 ABF60576 6 P16995 6 P26102 32 P16997 6   7   2.4   2.2   最低p>0.50,上年p<0.20
  1977   AAC31296 3 CAA44431 32 AAQ90292 32 AAQ90288 7 AAC31297 3 AAC31251 2 AAC31250 2 AAQ90293 16 P26100 32   9   3.0   2.0   最低p<0.10,上年p>0.50
  1978
  1979   AAA43427 3 AAC31274 3 AAC31275 3 AAC31249 2 AAC31248 2   5   1.3   0.4   最低p<0.02,上年p<0.02
  1980   AAA43109 6 P16998 6   2   1.1   0.0   上年p<0.30
  1981   AAB02560 6 AAC31276 3 AAQ55062 7 AAC31277 3 AAA43245 3 P08326 3 Q82559 6   7   1.0   0.3   最低p<0.001,上年p>0.50
  1985   AAQ90291 6 AAQ90289 15 AAQ90290 3 AAA43112 6 AAA43110 4 Q6TXB9 3 P16999 4 Q6TXC0 15   8   1.4   1.0   最低p<0.10,上年p<.40
  1986   AAA43292 3 AAA43288 3 AAA43291 3 AAA43287 3 AAA43133 18 AAA43102 6 AAA43113 32 AAA43638 17 AAA43479 15 AAA43458 15 AAB51002 2 AAB51001 2 AAA43430 3 NMIVEA 16 NMIVEK 3 Q07582 3 P17001 6 P19699 6 P26105 18 P16505 17 P13169 32 P67915 15 P67914 15   23   2.0   1.2   最低p>0.50,上年p<0.10
  1987   CAC84083 3 AAA43103 6 CAD23745 2 P16996 6   4   1.3   0.7   最低p<0.10,上年p<0.05
  1988   AAC31278 3 CAA74382 3 AAC31279 3 AAC31255 2 AAC31254 2 AAC31253 2 AAC31252 2   7   1.4   0.3   最低p<0.005,上年p>0.50
  1989   AAC31280 3 AAA43254 4 AAC31281 3 AAC31257 2 AAC31256 2 AAA52247 3 AAA43253 4 AAA43151 12 AAA43374 3 CAA48482 6 HMIVEE 6 HMIVET 6 HMIVE9 6 HMIVE8 4 HMIVE7 6 HMIVE6 6 HMIVE5 6 HMIVE4 12 HMIVE3 12 HMIVE2 7 HMIVE1 7 Q07578 3 Q08011 6 Q03909 12 P26068 3   25   1.3   0.5   最低p<0.001,上年p<0.30
  1990   AAB36977 9   1   1.6   0.0   上年p<0.002
  1991   ABM21939 3 AAB36980 6 ABM21948 18 ABM21946 15 ABM21945 33 ABM21944 2 ABM21943 2 ABM21942 15 ABM21940 3 ABM21938 6 AAC31284 3 AAC31282 3 ABM21947 15 ABM21941 3 CAA64893 6 CAA64894 6 AAC31285 3 AAC31283 3 AAC31261 2 AAC31260 2 AAC31259 2 AAC31258 2 AAA43354 3 AAC31286 3 AAC31287 3 AAC31263 2 AAC31262 2 Q07575 3   28   1.5   0.8   最低p<0.01,上年p>0.50
  1992   AAB36979 6 AAC31292 3 AAC31293 3 AAC31269 2 AAC31268 2 AAA62470 6 AAC31290 3 AAC31288 3 A45591 30 AAC31291 3 AAC31289 3 AAC31267 2 AAC31266 2 AAC31265 2 AAC31264 2   15   1.6   1.0   最低p<0.20,上年p>0.50
  1993   AAB27733 6 AAB36978 6 AAB36975 6 AAC31294 4 S33703 6 AAC31295 4 AAC31271 2 AAC31270 2   8   1.3   0.3   最低p<0.001,上年p<0.30
  1994   AAB36976 6   1   1.1   0.0   上年p<0.02
  1995   NP_034974 16   1   0.6   0.0
  1996   AAC23906 23   1   3.5   0.0
  1998   AAF22345 3   1   0.9   0.0
  1999   ABA39843 6 AAZ23576 15 AAZ23564 1 ABA39854 3   4   1.0   0.8   最低p<0.05,上年p>0.50
  2000   AAQ18435 3 NP_898880 2 NP_057292 2   3   0.9   0.0   最低p<0.001,上年p>0.50
  2001   CAC69619 13 CAC69618 14 CAC69617 13 CAC69616 13 CAC69615 14 CAC69614 13 CAC69613 14 CAC69612 33 CAC69611 33 CAC69610 29 CAC69609 29 CAC69608 3 CAC69607 4 CAC69606 4 CAC69605 14 CAC69604 15 CAC69603 0 CAC69602 11 CAC69601 11 CAC69600 11 CAC69599 4   37   3.1   2.0   最低p<0.001,上年p<0.001
  CAC69598 3 CAC69597 4 CAC69593 20 CAC69592 18 CAC69589 20 CAC69588 18 ABF69262 3 ABF69265 18 ABF69264 11 ABF69263 27 ABF69261 3 ABF69260 3 ABF69259 2 ABF69258 2 ABF69256 13 ABF69257 6
  2002   AAX23578 3 AAX23579 2 AAX23576 15 AAX23575 6 AAX23574 32 AAX23573 15 AAX23572 18 ABA42430 2 ABA42429 2 ABA39845 6 AAZ23582 15 AAZ23577 15 AAZ23563 18 AAX23577 3 ABA39853 3 AAM88392 4 AAM88391 4 AAN99161 14 AAN99160 15 AAN99159 10 AAN99158 11 AAN99157 11 AAN99156 11 AAN99155 4 AAN99154 4 AAN99153 4 AAN99152 3 AAN99151 4 AAN99147 20 AAN99146 18 AAN99143 20 AAN99142 18 AAN99141 6 AAN99140 6 AAN99139 3 AAN99138 3   36   2.0   1.1   最低p>0.50,上年p<0.002
  2003   AAZ23570 32 ABA42439 3 ABA42437 3 ABA42440 3 ABA42438 3 ABA42432 2 ABA42431 2 ABA42428 2 ABA42427 2 ABA39849 6 ABA39848 6 ABA39847 6 ABA39846 6 AAZ23583 15 AAZ23581 2 AAZ23578 15 AAZ23575 15 AAZ23574 15 AAZ23573 15 AAZ23567 18 AAZ23566 18 AAZ23565 18 AAZ23562 18 ABB17177 3 ABA39858 3 ABA39857 2 ABA39856 3 ABA39855 3 ABB17182 18 ABB17181 15 ABB17180 33 ABB17179 4 ABB17178 4 ABB17176 3 ABB17175 15 ABB17173 6 ABA42435 3 ABB17174 3 ABA42436 3 ABA42426 2 ABA42425 2 ABA39842 6 AAZ23580 15 AAZ23572 15 AAZ23569 32 AAZ23561 18 ABA39852 3 AAQ41575 20 AAQ41574 18 AAQ41573 6 AAQ41572 6 AAQ41571 3 AAQ41570 3   53   1.8   1.1   最低p>0.50,上年p>0.50
  2004   ABA42441 3 ABA42433 3 ABA42442 3 ABA42434 3 ABA42424 2 ABA42423 2 ABA39850 6 ABA39844 6 AAZ23579 15 AAZ23571 15 AAZ23568 32 AAZ23560 18 ABA39851 5 AAW17902 20 AAW17901 18 AAW17900 6 AAW17899 6 AAW17898 3 AAW17897 3 AAS32565 14 AAS32564 15 AAS32563 10 AAS32562 11 AAS32561 11 AAS32560 11 AAS32559 4 AAS32558 4 AAS32557 4 AAS32556 3 AAS32555 4 AAS32551 20 AAS32550 18 AAS32547 20 AAS32546 18 AAS32545 6 AAS32544 6 AAS32543 3 AAS32542 3   38   2.0   1.2   最低p>0.50,上年p<0.40
  2005   ABM47075 6   1   1.1   0.0   上年p<0.001
  2006   ABI00612 2 ABI00611 2 ABI00610 13 ABI00609 14 ABI00608 13 ABI00607 14 ABI00606 13 ABI00605 14 ABI00604 13 ABI00603 14 ABI00602 33 ABI00601 33 ABI00600 29 ABI00599 29 ABI00598 3 ABI00597 4 ABI00596 4 ABI00595 14 ABI00594 15 ABI00593 10 ABI00592 11 ABI00591 11 ABI00590 11 ABI00589 4 ABI00588 3 ABI00587 4 ABI00583 20 ABI00582 18 ABI00579 20 ABI00578 18   30   3.5   2.1   最低p<0.001,上年p<0.001
  2007   BAF49411 30 ABS92756 20 ABS92755 18 ABS92754 6 ABS92753 6 ABS92752 3 ABS92751 3 ABN35533 14 ABN35532 15 ABN35531 10 ABN35530 11 ABN35529 11 ABN35528 11 ABN35527 4 ABN35526 4 ABN35525 4 ABN35524 3 ABN35523 4 ABN35519 20 ABN35518 18 ABN35515 20 ABN35514 18 ABN35513 6 ABN35512 6 ABN35511 3 ABN35510 3   26   2.2   1.4   最低p<0.20,上年p<0.005
实施例15
分析PCV中的Replikin计数以预测PCV发病率和死亡率的增加
[000446]申请人使用专有的搜索工具软件(可从美国REPLIKINS LLC,Boston,MA获得的ReplikinForecastTM)在www.pubmed.com分析1997至2007年PCV分离株的公众可得的序列,并确定1997至2007年每年所有分离株的平均Replikin计数。然后申请人比较每年的平均Replikin计数与加拿大猪的感染率和死亡率的定性变化。
[000447]分析Replikin序列的存在和浓度的登记号列表提供于下表25。随着各相应年份分离株的登记号列表提供了每年的平均Replikin计数。伴随每年平均Replikin计数,还提供与上年的平均Replikin计数和数据组中最低平均Replikin计数相比的标准差和显著性。
表25-PCV
  年份   分析的登记号和鉴定的Replikin序列的总数目;Replikin计数和统计分析
  1997   AAC98885 16 AAC59472 4 AAC59466 3 AAC59464 5 AAC59462 9登记号总数目:5平均Replikin计数:9.4标准差:+/-10.8与最低平均Replikin计数相比的显著性:p<.40
  1998   AAC35336 2 AAC35332 5 AAC35330 12 AAC35326 2 AAC35322 5 AAC35320 12AAC35316 2 AAC35313 3 AAC35311 5 AAC35309 12 AAC35305 2 AAC35302 3 AAC353005 AAC35298 12 NP_065678 16 CAA11157 12 AAC61865 5 AAC61863 3 AAC61861 5AAC61860 18 AAC61741 18 AAC61739 18 AAC61737 18 AAC34819 16 AAF97593 14AAD03091 3 AAD03090 2 AAD03087 5 AAD03086 12 AAD03075 4 AAD03080 2AAD03073 5 AAD03071 12 AAD03069 2 AAD03065 2 AAD03063 5 AAD03061 12 O561245 AAC69862 4 NP_047277 4 AAC69861 21 AAC34818 4 NP_047275 21 NP_0480625NP_048061 12 AAD11930 5 AAD11928 12 AAC69863 1 AAC34816 21登记号总数目:49平均Replikin计数:6.1标准差:+/-3.7与最低平均Replikin计数相比的显著性:p<.05与上年平均Replikin计数相比的显著性p<.40
  1999   BAA88133 12 AAD50432 12 AAD38398 12 AAG41230 2 AAG41228 5 AAG41226 12AAD37776 12 AAD45580 16 AAF35304 12 AAF35302 12 AAF35300 12 AAF35298 12AAF35296 12 AAF35294 12 AAF35292 12 AAD12314 2 AAD12313 2 AAD12309 6AAD12308 12 AAE81207 4登记号总数目:20Replikin计数:5.0标准差:+/-3.3与最低平均Replikin计数相比的显著性:p<0.50与上年平均Replikin计数相比的显著性p>0.20
  2000   CAC41085 12 CAC41084 12 CAC41083 11 AAL09364 12 AAL09363 12 AAF87238 12AAF87236 12 AAF87234 12 AAF87232 12 AAF87230 12 AAF87228 12 NP_059530 2NP_573443 5 NP_150370 4 CAD23544 5 CAC50263 4 AAG30569 3 AAG30566 8 AAG305638 AAG30560 7 AAG30557 4 AAG30554 4 AAG30551 7 AAG30548 7 CAC24649 35AAF74197 2登记号总数目:26Replikin计数:2.9标准差:+/-1.2与最低平均Replikin计数相比的显著性:p<0.001与上年平均Replikin计数相比的显著性p>0.005
  2001   AAK60464 5 AAK60462 12 AAL58397 12 BAB69442 5 BAB69441 12 BAB69439 2BAB69438 5 BAB69437 12 BAB69435 3 BAB69433 5 BAB69432 12 AAK51544 14AAK56300 12 AAK56298 12 AAK56296 12 AAL01081 4 AAL01080 1 AAL01077 5
  AAL01075 12 NP_998971 5 NP_613078 4 AAM00235 4 AAN37998 4 AAN37994 3AAN37990 3 AAN37986 3 AAN37982 4 AAN37978 3 AAN37974 4 AAN37970 3 AAN379664 AAN37962 4 AAN37958 3 AAL13485 3 CAC50253 2 CAC50247 2登记号总数目:36Replikin计数:2.8标准差:+/1.7与最低平均Replikin计数相比的显著性:p<0.001与上年平均Replikin计数相比的显著性p>0.50
  2002   AAM61272 12 AAM61262 12 AAM61274 16 AAM61268 12 AAM61266 12 AAM61270 12AAM61264 12 AAO24127 1 AAO39760 12 AAM21847 1 AAM21846 1 AAM21845 7AAM21844 12 AAO24128 12 AAO24126 11 AAO24124 10 AAO24122 12 AAO23147 12AAO23145 12 AAN81597 12 AAN06826 12 AAN62769 12 AAN62767 12 AAN62765 12AAN16398 14 AAM83186 11 AAL69968 12 AAN77863 4 AAN77862 2 AAN77861 2AAN77860 14 AAN77859 16 AAO39666 16 AAM76057 12 Q8BB16 12 YP_164519 4ABA54889 4 ABA54887 4 ABA54885 4 AAR28043 4 AAO95302 12 AAO95299登记号总数目:42Replikin计数:3.5标准差:+/1.4与最低平均Replikin计数相比的显著性:p<0.001与上年平均Replikin计数相比的显著性p>0.05
  2003   AAP51128 12 AAS65982 1 AAS65993 12 AAS65991 12 AAS65989 12 AAS65987 12AAS65985 12 AAS65983 12 AAS6598 19 AAS65979 12 AAS65977 12 AAS65975 12AAP83635 12 AAP83633 12 AAP83631 12 AAP83629 12 AAP83627 12 AAP83625 12AAP83623 12 AAP83621 12 AAP83619 12 AAP83617 12 AAP83615 12 AAP83613 12AAP83611 12 AAP83609 12 AAP83607 12 AAP83605 12 AAP83603 12 AAP83601 12AAP83599 12 AAP83597 12 AAP83595 12 AAP83593 12 AAP83591 12 AAR97518 1AAR03722 12 AAR03720 12 AAR03718 12 AAR03716 12 AAQ94098 12 AAQ94096 12AAQ94094 12 AAQ94092 12 AAQ94090 12 AAQ94088 12 AAP44190 5 AAP44188 12AAP44187 5 AAP44185 12 AAP44184 5 AAP44182 12 AAO61773 12 AAR97517 12AAQ96327 12 AAQ23156 5 AAQ23155 12 AAP42468 9 AAP42466 10 AAP42464 12AAO61136 12 NP_937956 12 AAR03714 12 Q805H4 16 YP_209622 4 AAQ93492 6AAP69227 4 AAR27947 1 AAT00481 5 AAT00473 4 AAT00471 4 AAT00469 4 AAS16932 6AAS16931 7 AAS16930 6 AAS16929 6 AAS16928 6 AAS16927 6 AAS16926 6 AAS16925 6AAS16924 6登记号总数目:81Replikin计数:3.4标准差:+/1.0与最低平均Replikin计数相比的显著性:p<0.001与上年平均Replikin计数相比的显著性p>0.50
  2004   AAU87520 1 AAT97651 2 AAT97647 1 YP_0771911 6 AAW78483 16 AAW78481 20AAW78479 20 AAW78477 20 AAW78475 12 AAW78473 12 AAW78471 12 AAW78469 12AAW78467 12 AAW78465 12 AAW78463 12 AAV34141 20 AAV34139 12 AAU87519 12AAU87517 12 AAU87515 12 AAU87513 12 AAU87511 12 AAU87509 12 AAU87507 12AAU34001 10 AAU01913 14 AAT97650 12 AAT97648 12 AAT97646 12 AAT97644 12AAT77546 1 AAT72755 16 AAT36358 12 AAU13781 1 AAX49397 12 AAU01966 12AAT79579 12 AAT72901 12 AAT58234 11 AAS66199 1 AAS66197 1 AAS45844 12AAS45843 12 CAJ31064 12 AAU13780 12 AAX52911 12 AAU87505 12 AAT39479 12AAT39460 9 AAT37493 9 AAS66198 12 AAS66196 12 AAS66194 12 AAS66192 12AAS66190 12 AAS90297 12 AAS89260 12 NP_999004 27 YP_271921 7 CAF25171 12AAT51967 3 BAD90990 3 BAD90989 4 BAD90988 4 BAD90987 4 BAD90986 3 BAD909853 AAS86324 4 AAS93283 6 AAS93279 6 AAS93276 5 AAS93272 9 AAS93268 6 AAS898144 AAS89813 6 AAS89812 8 AAS89811 6 AAS89810 6 AAS89809 6 AAS89808 8 AAS898079 AAS89806 8 AAS89805 5 AAS89804 4 AAS89803 4 AAS89802 5 AAS89801 7 AAS898009 AAS89799 6 AAS89798 11 AAS89797 6 AAS89796 6 AAS89795 5 AAS89794 5 AAS897936 AAS89792 11 AAS89791 9 AAS89790 9 AAS89789 9 AAS89788 6 AAS89787 6 AAS897866 AAS89785 6 AAS89784 6 AAS89783 6 AAS89782 6 AAS89781 6登记号总数目:107Replikin计数:3.3标准差:+/1.3
  与最低平均Replikin计数相比的显著性:p<0.001与上年平均Replikin计数相比的显著性p>0.30
  2005   ABJ98317 12 ABA29241 12 AAZ20802 11 AAZ20800 10 AAZ20798 11 AAZ20796 12AAZ20794 12 AAW79865 9 ABC26025 12 ABA40480 12 AAZ78351 12 AAY40292 12AAX21515 12 ABB29423 10 ABB29421 12 ABB29419 12 ABB29417 10 ABB29415 10ABB29413 10 ABB29411 10 ABB29409 10 ABB29407 10 ABB29405 10 ABB29403 8ABB29401 10 ABB29399 10 ABB36791 1 ABA60807 12 ABA60805 12 ABA60803 11ABA40399 12 ABA40397 12 AAZ66792 11 AAX10150 12 AAX62053 16 AAX62051 12AAX62049 12 AAX62047 12 AAX62045 12 AAX62043 16 AAX62041 12 ABC75103 12ABB20934 12 ABA26910 12 ABA26908 10 AAY34249 12 YP_610962 8 AAZ07884 7ABB59615 8 ABA39170 3 ABA39166 3 AAX35672 1 ABA39162 4 ABA39158 3 ABA391544 ABA39150 3 ABA39146 3 ABA39142 3 ABA39138 3 AAZ68049 2 AAZ68045 2登记号总数目:61Replikin计数:3.0标准差:+/1.1与最低平均Replikin计数相比的显著性:p<0.001与上年平均Replikin计数相比的显著性p>0.20
  2006   ABG21191 3 ABI29887 12 ABG21279 10 ABG21277 10 ABG21275 10 ABG21273 10ABG21271 10 ABG21269 12 ABG21267 12 ABJ98319 12 ABI93799 16 ABI93797 12ABD59347 12 ABG48510 14 ABD42928 12 ABM67071 16 ABM88864 12 ABM88862 12ABM88860 12 ABI17537 12 ABI17535 12 ABI17533 12 ABI17531 12 ABI17529 12ABI17527 12 ABI17525 12 ABI17523 12 ABG37025 16 ABG37023 12 ABD52438 16ABG24031 16 ABG24029 16 ABF71465 12 ABF19812 16 ABF19810 14 ABE96824 16ABE96822 16 ABE96820 16 ABE96818 13 ABE96816 16 YP_803548 1 YP_803551 5ABI54258 5 ABI54255 1 ABK79791 2 ABK79788 2 ABK79785 2 ABK79782 3 ABK79779 7ABK79776 9 ABK79773 3 ABI97391 3 ABE03771 4 ABE03767 6登记号总数目:54Replikin计数:3.4标准差:+/1.4与最低平均Replikin计数相比的显著性:p<0.001与上年平均Replikin计数相比的显著性p>0.10
实施例16
肺癌和烟草花叶病毒中的重复序列KHKK(SEQ ID NO:1584)特征
[000448]分别分析非小细胞肺癌(non-smaU lung cancer)和烟草花叶病毒的以登记号:Q9NS56和117607067的公众可得的氨基酸序列的ReplikinPeak基因。发明人在www.pubmed.com查询登记号Q9NS56。登记号Q9NS56公开非小细胞肺癌的人类染色体9的E3泛素-蛋白连接酶Topors的氨基酸序列(SEQ ID NO:1740)。经分析SEQ ID NO:1740,发明人观察到具有开始于残基880(赖氨酸)并持续至残基897(组氨酸)的连续Replikin序列的Replikin Peak基因。
[000449]发明人计算机分离RPG(SEQ ID NO:1741)。鉴定SEQ IDNO:1741用于例如免疫原性化合物和治疗性疫苗化合物和用作致死性的预测序列的诊断和治疗用途。在SEQ ID NO:1741的RPG中鉴定五十二个Replikin序列(SEQ ID NO:1886-1937)用于如本文描述的诊断、治疗和预测用途。在公开于登记号Q9NS56的序列(SEQ ID NO:1741)的氨基末端鉴定了SEQ ID NO:1742-1747,在序列分子中部鉴定了SEQ ID NO:1748-1780,并在序列羧基末端鉴定了SEQ ID NO:1781-1885。
[000450]公开于Q9NS56的氨基酸序列(SEQ ID NO:1740)的Replikin计数为共1045氨基酸中144Replikin序列,Replikin计数为13.8。RPG(SEQID NO:1741)的Replikin计数为共18氨基酸中52Replikin序列,Replikin计数为289,是已观察到的最高计数。
[000451]在RPG(SEQ ID NO:1741)中鉴定的Replikin序列内,在52Replikin序列内观察到57次KHKK特征。此高浓度致死特征对应高致死性的非小细胞肺恶性肿瘤。
[000452]发明人在www.pubmed.com查询登记号117607067。登记号117607067公开烟草花叶病毒诱导的辣椒26S蛋白酶体亚基RPN7的氨基酸序列(SEQ ID NO:1938)。经分析SEQ ID NO:1938,发明人观察到具有开始于残基91(组氨酸)并持续至残基175(赖氨酸)的连续Replikin序列的Replikin Peak基因。
[000453]发明人计算机分离RPG(SEQ ID NO:1939)。鉴定SEQ IDNO:1939用于例如免疫原性化合物和治疗性疫苗化合物和用作烟草花叶病毒致死暴发的预测序列的诊断和治疗用途。在SEQ ID NO:1939的RPG中鉴定五十四个Replikin序列(SEQ ID NO:1941-1994)用于如本文描述的诊断、治疗和预测用途。
[000454]在公开于登记号117607067的序列(SEQ ID NO:1938)的氨基末端鉴定了SEQ ID NO:1941,在序列分子中部鉴定了SEQ ID NO:1942-1986,并在序列羧基末端鉴定了SEQ ID NO:1987-1994。计算机分离各Replikin序列用于如本文描述的诊断、治疗和预测目的,包括用于免疫原性组合物和疫苗。
[000455]公开于登记号117607067的氨基酸序列(SEQ ID NO:1938)的Replikin计数为共179氨基酸中55Replikin序列,Replikin计数为30.7。RPG(SEQ ID NO:1939)的Replikin计数为共89氨基酸中54 Replikin序列,Replikin计数为61。
[000456]在鉴定于117607067(SEQ ID NO:1938)中的Replikin序列内,在61 Replikin序列内观察到二十次KHKK(SEQ ID NO:1584)特征。该高浓度致死特征对应高致死性烟草花叶病毒并经由KHKK(SEQ ID NO:1584)特征将烟草花叶病毒与致死肺癌症联系。
[000457]如上讨论的,已在致死恶性肿瘤、病毒和生物体的RPGs内的Replikin序列中观察到重复特征诸如“KHKK”(SEQ ID NO:1584)特征。已在导致大多数疟疾的原生动物恶性疟原虫的RPG中观察到十一次KHKK(SEQ ID NO:1584)特征,在导致烟草花叶病毒诱导的加剧细胞死亡的烟草花叶病毒RPG中观察到20次,和非小细胞肺癌中在鉴定于非小细胞肺癌的染色体9中的18氨基酸RPG中观察到的52 Replikins中观察到57次。非小细胞肺癌的18氨基酸RPG中存在如此高数目KHKK(SEQID NO:1584)特征由特征重叠解释。现在已将Replikin序列重叠和重复特征诸如KHKK(SEQ ID NO:1584)与致死性、毒力和快速复制相关。总之,这些数据表示Replikin基因数量上与致死功能相关,并可为株和物种之间致死性转移的流动因子。
实施例17
疟疾中的重复序列KHKK(SEQ ID NO:1584)特征
[000458]发明人在www.pubmed.com查询登记号P13817。登记号P13817公开来自恶性疟原虫的氨基酸序列。发明人分析P13817提供的氨基酸序列(SEQ ID NO:2043)。经分析SEQ ID NO:2043,发明人观察到具有开始于残基323(组氨酸)并持续至残基473(赖氨酸)的连续Replikin序列的Replikin Peak基因(SEQ ID NO:3659)。
[000459]发明人计算机分离RPG(SEQ ID NO:3659)。鉴定SEQ IDNO:3659用于例如免疫原性化合物和治疗性疫苗化合物和用作疟疾致死暴发的预测序列的诊断和治疗用途。在SEQ ID NO:3659的RPG中鉴定两百三十一Replikin序列(SEQ ID NO:2312-2315和2317-2544)用于如本文描述的诊断、治疗和预测用途。在SEQ ID NO:2043的序列的氨基末端鉴定了Replikin序列SEQ ID NO:2044-2077,在序列分子中部鉴定了Replikin序列SEQ ID NO:2079-2080,并在羧基末端鉴定了Replikin序列SEQ ID NO:2081-2315。
[000460]全序列(SEQ ID NO:2043)的Replikin计数为共473氨基酸中268 Replikin序列,Replikin计数为56.7。RPG区(SEQ ID NO:3659)的Replikin计数为共151氨基酸中231 Replikin序列,Replikin计数为153。
[000461]发明人在www.pubmed.com查询登记号A44396。登记号A44396公开1993年分离的恶性疟原虫的腺苷三磷酸酶样分子的氨基酸序列。发明人分析A44396提供的氨基酸序列(SEQ ID NO:2926)。经分析SEQ ID NO:2926,发明人观察到具有开始于残基1297(组氨酸)并持续至残基1333(组氨酸)的连续Replikin序列的Replikin Peak基因。
[000462]发明人计算机分离RPG(SEQ ID NO:3661)。鉴定SEQ IDNO:3661用于例如免疫原性化合物和治疗性疫苗化合物和用作疟疾致死暴发的预测序列的诊断和治疗用途。在SEQ ID NO:3661的RPG中鉴定十七个Replikin序列(SEQ ID NO:3282-3285、3287-3291、3293、3295、3299-3300、3302、3304、3306、3308、3310-3313和3663)用于如本文描述的诊断、治疗和预测用途。在SEQ ID NO:2926序列的氨基末端鉴定了Replikin序列SEQ ID NO:2546-2632,在序列的分子中部鉴定了Replikin序列SEQ ID NO:2633-2720,并在羧基末端鉴定了SEQ ID NO:2721-2900。
[000463]全腺苷三磷酸酶序列(SEQ ID NO:2926)的Replikin计数为共1984氨基酸中355 Replikin序列,Replikin计数为17.9。RPG区(SEQ IDNO:3661)的Replikin计数为共37氨基酸中15 Replikin序列,Replikin计数为41。
[000464]在RPG的15 Replikin序列中注意到十一个特征重复序列KHKK(SEQ ID NO:1584)序列。所述十一个特征重复序列即SEQ ID NO:3286、3292、3294、3296、3298、3662、3301、3303、3305、3307和3309分别(respectfully)见于提及的Replikin序列SEQ ID NO:3286、3291、3293、3295、3297、3299、3300、3302、3204和3206中。
[000465]恶性疟原虫的37氨基酸RPG中十五Replikin序列中如此高数目KHKK(SEQ ID NO:1584)特征的存在由特征重叠解释。现在已将Replikin序列重叠和重复特征诸如KHKK(SEQ ID NO:1584)与疟疾致死性、毒力和快速复制相关联,其在其生命周期中有异常高的复制速率。
实施例18
实验室证实Replikin计数与桃拉综合征病毒感染虾的死亡率百分比的关系
[000466]为了进一步检验Replikin与毒力的关系,在控制的情况下检验虾病毒的Replikin计数与虾死亡率的关系。基于如从人类H5N1病毒感染的证据所形成的假设:病毒的Replikin计数与病毒毒力和宿主死亡率百分比相关,申请人检验了是否可能仅从全基因组氨基酸序列的Replikin计数预测病毒的四个株的毒力顺序。选择在感染后数天杀死大多数宿主虾的桃拉综合征虾病毒(TSV)进行研究。以REPLIKINS LLC,Boston,MA的FluForecast
Figure A20088000249401691
软件分析桃拉综合征病毒四个株(伯利兹、泰国、夏威夷和委内瑞拉)的氨基酸序列且将结果保密,直到完成病毒攻击的实验室实验,随后比较各株产生的死亡率百分比。
[000467]在实验室中,在以四种病毒株的每一个攻击的宿主虾死亡率和之前仅由各株的Replikin计数预测的死亡率之间有显著的线性关联性。这些数据支持以下结论:病毒的Replikin肽浓度除了预测病毒暴发,还与观察到的宿主死亡率和随时间的毒力增加数量相关。
A.Replikin分析
[000468]对来自伯利兹、泰国、夏威夷和委内瑞拉的桃拉综合征病毒分离株的序列信息进行目视Replikin分析,其通过应用限定Replikin的算法和计算机获取在PubMed或其它公共数据库可自由获得的蛋白和基因组序列进行。具体限定算法如下:Replikin是蛋白或基因组中的肽序列,其长7至50氨基酸,具有末端赖氨酸和末端赖氨酸或组氨酸,包含间隔6至10氨基酸的至少2个赖氨酸基团、至少1个组氨酸基团、和至少6%的赖氨酸。重叠Replikins是共同的并分别计数。与快速复制和流行和致死性的数量关联性要求算法的所有组成部分适合每个Replikin。因此例如,如果存在长度和赖氨酸要求但不存在组氨酸,该肽就不是Replikin。以Replikins Ltd.,Boston,MA的FluForecast
Figure A20088000249401701
软件服务进行自动化的Replikin分析。
B.鉴定Replikin Peak基因
[000469]Replikin计数用于鉴定基因组中具有最高浓度的Replikin的区,且该区称为Replikin Peak基因(RPG)区。随着暴发发生的RPG中Replikin计数进一步的二至八倍增加进一步用于证实该基因的身份。因此该基因的功能用于鉴定其自身或“计算机”分离其自身。
C.虾病毒的实验室方法
[000470]在AZ图森市亚利桑那大学兽医学和微生物学系的水产病理实验室(Aquaculture Pathology Laboratory,Department of Veterinary Scienceand Microbiology,University ofArizona,Tucson AZ),对每池平均体重1.8g的无特异性病原体的凡纳滨对虾的小幼虾以其体重的5%喂养切碎的TSV-感染组织(分别被来自伯利兹、泰国、委内瑞拉和夏威夷的4个分离株的一种感染)3天。这些虾以颗粒日粮(pelleted ration)(Rangen 35%)维持接下来的12天。以三个重复进行具体分离株的每次攻击生物检验。在生物检验期间,每天检查所有池中死亡或垂死的虾。从池移出所有死亡者并冰冻。对各分离株以Davidson氏AFA固定液保存一至三只垂死的虾并进行常规组织学处理以证实病毒感染。对各分离株,在急性阶段感染期间收集六只垂死的虾并以高纯RNA组织试剂盒(Roche)提取腮组织的总RNA。由实时RT-PCR分析提取的RNA中TSV的存在。所有池配备有驯化了的(acclimated)生物滤器和充气设备,并盖有塑料以包含气雾。水的平均盐分是23ppt,水温度是28℃。15天后终止攻击研究,并将存活的动物计数为存活者。
D.比较毒力
[000471]在所有4个分离株中,接触TSV后第2天观察到第一例死亡。对于伯利兹分离株,截至第4天大多数(83%)虾死亡并在第11天有0%存活率(图14A、表26)。对于泰国分离株,截至第4天发生63%死亡,在15天生物检验结束时有20%存活(图14B、表26)。对于夏威夷分离株,在第2天死亡率开始增加,并在第5天达到峰值;结束时累计存活率为22%(图14C、表26)。对于委内瑞拉分离株,在第2和3天缓慢地发生死亡,在第4天22%的虾显示死亡,且随后死亡率下降;结束时有42%的虾存活(图14D、表26)。对伯利兹、泰国、夏威夷和委内瑞拉分离株,由TSV感染造成的达到50%死亡率的时间段分别为2.8、3.5、4.5和7天(表26)。
[000472]图14提供以TSV分离株经经口攻击凡纳滨对虾的累计存活率数据,桃拉综合征病毒分离株来自a:伯利兹;b:泰国;c:夏威夷;d:委内瑞拉的。图14的数据包含在下表26中。
表26-TSV攻击
  TSV分离株  GenBank号(ORF1)   存活率(%)(平均)   50%死亡的天数
  伯利兹   AAT81157   0   2.8
  泰国   AAY56363   20   3.5
  美国-夏威夷   AAK72220   22   4.5
  委内瑞拉   ABB17263   42   7.0*
*在委内瑞拉分离株的三个重复池中观察到高的变化,因此50%死亡的天数以Statistix 8程序由Kaplan-Meier存活分析确定。
[000473]对各种TSV分离株观察到的毒力与仅由Replikin计数预测的毒力的关联性显示在图15。图15A提供比较四个分离株的Replikin计数与从盲研究收集的50%死亡的平均天数的数据。图15B提供比较四个分离株的Replikin计数与从盲研究收集的平均累计死亡率的数据。预测值与实验值之间的线性数量关系是明显的。
[000474]下表27提供从垂死的虾收集的组织学数据以证实TSV感染。
表27-组织学
  UAZID#  TSV分离株   接触后的天数   TSV损伤1   LOS2
  O6-407J/1   伯利兹   3   G4   G4
  06-407F/1   泰国   3   G4   G2
  06-407D/1   泰国   4   G4   G3
  06-407E/1   泰国   4   G3   G2
  06-407A/1   夏威夷   4   G2   G3
  06-407C/1   夏威夷   4   G2   G4
  06-407H/1   委内瑞拉   4   G4   G2
严重度级别:G1:感染迹象;G2:中度感染迹象;G3:中度至高感染迹象;G4:严重感染。
1.TSV损伤=在腮、口、胃、intecumental角化上皮和附肢存在TSV诊断性病征损伤。
2.LOS=淋巴样器官中存在淋巴样器官球(lymphoid organ spheroid)。
[000475]伯利兹TSV:在一个代表性虾样品(06-407J/1)中发现诊断性TSV感染的急性损伤,严重度级别为G4。在整个体表的角化上皮、附肢、腮、胃和食道观察到核固缩和核破裂。还发现淋巴样器官球的严重度级别为G4。泰国TSV:在3只虾中的2只(06-407D/1、F/1)检测到严重(G4)TSV感染,另一只虾(06-407E/1)显示中度至高级别(G3)的感染。发现淋巴样器官球的严重度为G2和G3。夏威夷TSV:第4天收集的2只虾(06-407A/1、C/1)检测到中度水平(G2)的TSV感染。发现淋巴样器官球的严重度为G3和G4。委内瑞拉TSV:在于第4天取样的一个代表性虾(06-407H/1)中检测到严重(G4)TSV感染。发现淋巴样器官球的严重度为G2。
[000476]特异性地为夏威夷TSV设计实时TSV RT-PCR检验,因此在夏威夷-TSV攻击的虾中检测到高水平(107拷贝/μl RNA)的TSV(表28)。对于引物/TaqMan探针,3个其它分离株中的靶序列具有2个错配核苷酸。因此,在伯利兹和泰国样品检测到数量为1/10的TSV(106拷贝/μl RNA)。检测到委内瑞拉样品的数量为1/100-100,000:102-105拷贝/μl RNA;这可能是由于错配效应和分析的样品中感染水平较低两方面。然而,所有24个样品(每个分离株6个)对于TSV感染都是阳性。这证实,从生物检验观察到的死亡率是来自TSV感染。实时TSV RT-PCR检验数据见于下表28。
表28-PCR
  TSV分离株   平均(范围)TSV拷贝/:1 RNA
  伯利兹   2.7x106(4.8x105-4.4x106)
  泰国   2.7x106(4.3x105-7.5x106)
  夏威夷   5.2x107(2.3x107-7.5x107)
  委内瑞拉   6.5x105(6.5x102-2.0x105)
E.实验室死亡率结果与Replikin计数关联
[000477]经由经口地实验室感染凡纳滨对虾幼虾(Kona stock,OceanicInstitute,夏威夷),比较4个TSV分离株(夏威夷、伯利兹、泰国和委内瑞拉)的毒力。结果显示,伯利兹分离株是最毒的,泰国分离株第二,随后是夏威夷分离株,委内瑞拉分离株是最低毒力的。这是基于分析生物检验结束时累计存活率(p<0.047)和发生50%死亡的时间(p<0.001)。由RT-PCR检测中的阳性反应和组织学分析中观察到出现典型的损伤证实虾的死亡是由TSV感染造成的。
F.实验室死亡率结果与Replikin计数关联
[000478]实验上,仅Replikin计数有希望地正确预测:(1)在实验室的受控实验中盲预测四个桃拉综合征病毒株对虾的致死性顺序(图15A和B);(2)人类H5N1死亡率百分比增加(图4);和(3)宿主(图5);和(4)最近将发生的国家,即印度尼西亚(图6)。对于人类宿主中的H5N1流感和虾宿主中的桃拉综合征病毒感染,该研究中的证据证实病毒Replikin计数与宿主死亡率的数量关系。盲预测能力当然是这种关系的更可靠证明之一;证实定量线性关系更可靠。因此,一类特定病毒肽Replikins的浓度已经与这些病毒在其各自宿主即无脊椎动物甲壳类(虾)和脊椎动物(人类)中产生的死亡率百分比数量关联。就我们的了解,以前尚未报道过病毒结构与宿主致死性之间的数量关联性。
实施例19
通过施用合成的Replikin增加宿主对桃拉综合征病毒的抗性
[000479]第一实验中,将使用上述实施例18中描述的攻击方法培养的虾经口接触与其饲料混合的合成Replikin两周。所述Replikins是对用以攻击虾的TSV夏威夷株分离株中存在的Replikin序列特异性的肽。
[000480]实验中,与对照组相比死亡率减少50%。给予对照组不包含合成Replikin序列的饲料。向第二对照组喂养具有额外氨基酸共价结合到喂养给虾的所述合成Replikins的合成的Replikin序列。共价地“封闭”的Replikins在相同实验中不增加虾对病毒的抗性,证明宿主抗性的增加是Replikin肽结构特异性的。
[000481]由于对虾的免疫系统了解很少(虾看起来不产生抗体),对感染“抗性”的现象看起来是基于可能类似于“toll受体”和相关系统的“原始免疫系统”。因此对观察到的现象使用术语“抗性增加”,对于增加抗性的施用物质使用Replikin饲料而不是“疫苗”。
[000482]第一次攻击后存活的虾随后在新的培养物中重新培养,以包含Replikin序列的饲料再喂养两周,随后以夏威夷株的桃拉综合征病毒再次攻击。保持补充Replikin序列的饲料,并再次用相同病毒以重复的循环反复地攻击存活者,直到100%的虾都在TSV攻击后存活。
实施例20
计算鱼的病毒性出血性疾病中的RPG
[000483]发明人在www.pubmed.com查询登记号ABQ42711。登记号ABQ42711公开出血性败血病病毒中糖蛋白的氨基酸序列。出血性败血病病毒导致鱼的出血性疾病。发明人分析ABQ42711提供的氨基酸序列(SEQID NO:3787)。经分析,发明人观察到具有开始于残基81(组氨酸)并持续至残基204(组氨酸)的连续Replikin序列的Replikin Peak基因。
[000484]发明人计算机分离RPG用于例如免疫原性化合物和治疗性疫苗化合物和用作鱼出血性疾病的致死暴发的预测序列的诊断和治疗用途。在SEQ ID NO:3787鉴定了三十六个Replikin序列(SEQ ID NO:3788-3823)用于如本文描述的诊断、治疗和预测用途。在氨基末端鉴定了Replikin序列SEQ ID NO:3788-3795,在序列的分子中部鉴定了Replikin序列SEQ ID NO:3796-3815,并在羧基末端鉴定了Replikin序列3816-3823。分离所有这些用于诊断、治疗和预测目的。
[000485]全序列(SEQ ID NO:3787)的Replikin计数为共222氨基酸中36Replikin序列,Replikin计数为16。出血性败血病病毒中鉴定的RPG区的最高Replikin计数为共123氨基酸中73Replikin序列,Replikin计数为59。
[000486]发明人查询1990至2007年鱼的出血性病毒性疾病综合征分离株的公众可得的序列。下表提供查询的登记号。出血性败血病病毒中鉴定的RPG区的最高Replikin计数是共123氨基酸中73Replikin序列,Replikin计数为59。
[000487]发明人使用FluForecast
Figure A20088000249401751
(Replikins LLC,Boston,MA)在www.pubmed.com查询1990至2007年公众可得的鱼的出血性病毒性疾病的所有序列,发明人确定1990-2007年每年的平均Replikin计数。数据提供于表29。该表不包括数据不可得的年份。
表29-出血性败血病平均Replikin计数
  年份   PubMed登记号-Replikin计数   每年分离株的数目   每年平均Replikin计数   S.D.   显著性
  1990   BAA00591 3 CAA00881 29 CAA52082 33 CAA52081 33 CAA52080 33 CAA52079 33 CAA52078 33 CAA52077 33 P24378 3   9   5.0   2.4  最低p<.001
  1991   CAA41859 29 CAA41858 29 CAA01751 4 CAA41930 4 P27663 2 P27662 29   6   3.5   2.5  最低p<.001,上年p<.20
  1992   CAA46926 33 P27371 4   2   3.7   3.9  最低p<.10,上年p>.50
  1993   AAB26115 33 AAT01207 48 AAT01206 48 AAT01205 48 AAT01204 48 AAT01203 48 AAT01202 48 AAT01201 48 AAT01200 48 AAT01199 48 AAT01198 48 AAT01197 48 AAT01196 48 AAT01195 48 AAT01194 48 AAT01193 48 AAT01192 48 AAT01191 48 AAT01190 48 AAT01189 48 AAT01188 48 AAT01187 48 AAT01186 48 AAT01185 48 AAT01184 48 AAT01183 48 AAT01182 48 AAT01181 48 AAT01180 48 AAT01179 48 AAT01178 48 AAT01177 48 AAT01176 48 AAT01175 48 AAT01174 48 AAT01173 48 AAT01172 48 AAT01171 48 AAT01170 48 AAT01169 48 AAT01168 48 AAT01167 48 AAT01166 48 AAT01165 48 AAT01164 48 AAT01163 48 AAT01162 48 AAT01161 48 AAT01160 48 AAT01159 48 AAT01158 48 AAT01157 48 AAT01156 48 AAT01155 48 AAT01154 48 AAT01153   64   9.4   0.4  最低p<.001,上年p<.04
 48 AAT01152 48 AAT01151 48 AAT01150 48 AAT01149 48 AAT01148 48 AAT01147 48 AAT01146 48 AAT01145 48
  1994
  1995  AAB88231 33 AAB88230 38 AAB88229 41 AAB88232 30 Q96460 6   5   5.9   2.7  最低p<.001,上年p<.002
  1997  AAC24962 3 CAB59222 53 CAB59221 53 CAB07737 53 CAB59220 53 CAB59219 53 CAB59218 53 CAB59217 52 CAB59216 52 CAB59215 52 CAB59214 52 CAB59213 52 CAB59212 52 AAB88228 52 AAB88227 30 AAB88226 29 AAB88225 30 AAB88224 30 AAB88223 23 AAB88222 30 CAB07754 15 CAB07753 17 CAB07752 14 CAB07751 7 CAB07750 14 CAB07749 14 CAB07748 14 CAB07747 11 CAB07746 14 CAB07745 14 CAB07744 14 CAB07743 15 CAB07742 15 CAB07741 7 CAB07740 15 CAB07739 14 CAB07738 14 CAB07736 11 CAB07734 20 CAB07733 11 CAB07732 14 CAB07731 15 CAB07730 3 CAB07729 14 CAB07728 14 CAB07727 15   46   8.3   4.4  最低p<.001,上年p<.05
  1998  NP_049550 55 NP_049549 55 NP_049548 55 NP_049547 55 NP_049546 55 NP_049545 55 CAB57984 1 CAB44726 55 CAB44725 55 CAB44724 55 CAB44723 55 CAB44722 55 CAB44721 55 CAB40833 66 CAB40832 66 CAB40831 66 CAB40830 66 CAB40829 66 CAB40828 66 CAA08837 58   20   2.9   0.6  最低p<.001,上年p<.001
  1999  AAF04486 57 AAF04485 57 AAF04484 57 AAF04483 57 AAF04482 57 AAF04481 57 AAF04480 53 AAF04479 53 AAF04478 53 AAF04477 53 AAF04476 53 AAF04475 53 BAC29401 14   13   2.9   0.3  最低p<.001,上年p>.50
  2000
  2001  BAB70674 15 BAB70673 16 BAB70672 16 BAB70671 16 AAL83805 32 AAL83804 35 AAL83803 40   7   7.4   0.7  最低p<.001,上年p<.001
  2002  AAN85721 30 CAD31945 13 CAD31944 7 CAD31943 7 CAD31941 7 CAD31924 7 CAD31923 7   7   8.1   2.5  最低p<.001,上年p>.50
  2003  ABF17852 20 ABF17851 20 ABF17850 20 ABF17849 20 ABF17848 20 ABF17847 20 ABF17846 20 ABF17845 20 NP_997523 30 NP_997978 41 NP_997977 21 NP_001013287 33 NP_891987 29   13   8.1   3.6  最低p<.001,上年p>.50
  2004  AAU12246 26 AAU12245 26 AAU12244 26 AAU12243 26 AAU12242 26 AAU12241 26 AAU12240 26 AAU12239 26 AAU12238 26 AAU12237 26 AAU12236 26 AAU12235 26 AAU12234 26 AAU12233 26 AAU12232 26 AAU12231 26 AAU12230 26 AAU12229 26 AAU12228 26 AAU12227 26 AAU12226   34   10.6   3.2  最低p<.001,上年p<.02
  26 AAU12225 26 AAU12224 26 AAU12223 26 AAU12222 26 AAU12221 26 AAU12220 26 AAU12219 26 BAD72126 42 BAD72124 30 BAD72123 8 BAD72122 16 BAD72121 4 NP_998029 8
  2005   CAJ31050 28 CAJ31049 28 CAJ31048 28 CAJ31047 28 CAJ31046 28 CAJ31045 28 CAJ31044 28 CAJ31043 28 CAJ31042 28 CAJ31041 28 CAJ31040 28 CAJ31039 28 CAJ31038 28 CAJ31037 28 CAJ31036 28 CAJ31035 28 CAJ31034 28 CAJ31033 28 CAJ31032 28 CAJ31031 28 CAJ31030 28 CAJ31029 28 CAJ31028 28 CAJ31027 28 CAJ31026 28 CAJ31025 28 CAJ31024 28 CAJ31023 28 CAJ31022 28 CAJ31021 28 CAJ31020 28 CAJ31019 28 CAJ31018 21 CAJ31017 21 CAJ31016 28 CAJ31015 28 CAJ31014 28 CAJ31013 28 CAJ31012 28 CAJ31011 28 CAJ31010 28 CAJ31009 28 CAJ31008 28 CAJ31007 28 CAJ31006 28 CAJ31005 28 CAJ31004 28 CAJ31003 28 CAJ31002 28 CAJ31001 28 CAJ31000 28 CAJ30999 28 CAJ30998 28 CAJ30997 28 CAJ30996 28 CAJ30995 28 CAJ30994 28 CAJ30993 28 CAJ30992 28 CAJ30991 28 BAE78962 17 BAE78961 16   62   5.6   0.7  最低p<.001,上年p<.001
  2006   ABN13930 16 ABN13929 16 ABN13928 16 ABN13927 16 ABN13926 2 ABD96102 4 ABD64588 47 ABD64587 47 ABD64586 47 ABD64585 47 ABD64584 47 ABD64583 47 ABD64582 47 ABD64581 47 ABD64580 47 ABD64579 47   16   7.8   2.8  最低p<.001,上年p<.002
  2007   ABQ42711 36   1   16.2   0.0  上年p<.001

Claims (151)

1.一种鉴定具有比至少一种与第一病毒相同物种的第二病毒、与第一生物体相同物种的第二生物体、与第一恶性肿瘤相同种类的第二恶性肿瘤更高致死性的第一病毒、第一生物体或第一恶性肿瘤的方法,该方法包括比较所述第一病毒、第一生物体或第一恶性肿瘤的Replikin Peak基因的Replikin计数与至少一种第二病毒、第二生物体或第二恶性肿瘤的ReplikinPeak基因的Replikin计数以确定具有更高Replikin计数的病毒、生物体或恶性肿瘤具有更高致死性。
2.根据权利要求1所述的方法,其中所述第一恶性肿瘤是肺恶性肿瘤、脑恶性肿瘤、乳腺恶性肿瘤、卵巢恶性肿瘤或淋巴恶性肿瘤。
3.根据权利要求2所述的方法,其中所述第一恶性肿瘤是非小细胞肺癌。
4.根据权利要求1所述的方法,其中所述第一生物体是结核分枝杆菌、产粘液分枝杆菌、金黄色葡萄球菌或恶性疟原虫。
5.根据权利要求1所述的方法,其中所述第一病毒是流感病毒、口蹄疫病毒、西尼罗病毒、猪呼吸和生殖综合征病毒、猪圆环病毒、白斑综合征病毒、桃拉综合征病毒、冠状病毒、埃博拉病毒、双生曲叶病毒、出血性败血病病毒或烟草花叶病毒。
6.根据权利要求5所述的方法,其中所述第一病毒是甲型流感病毒株H1N1、H2N2、H3N2、H5N1或H3N8。
7.一种病毒、生物体或恶性肿瘤的分离的或合成的Replikin Peak基因,其中所述Replikin Peak基因鉴定为与所述病毒的毒粒、所述生物体的细胞或所述恶性肿瘤的恶性细胞的基因组、蛋白或蛋白片段的其它部分相比,由每100氨基酸最高数目的连续Replikin序列组成的所述病毒的毒粒、所述生物体的细胞或所述恶性肿瘤的恶性细胞的基因组、蛋白或蛋白片段的部分。
8.根据权利要求7所述的分离的或合成的Replikin Peak基因,其中所述Replikin Peak基因是与所述病毒的毒粒、所述生物体的细胞或所述恶性肿瘤的恶性细胞中所有其它蛋白或蛋白片段相比,由每100氨基酸最高数目的连续Replikin序列组成的蛋白或蛋白片段的部分。
9.根据权利要求7所述的分离的或合成的Replikin Peak基因,其中所述Replikin Peak基因分离自肺恶性肿瘤、脑恶性肿瘤、乳腺恶性肿瘤、卵巢恶性肿瘤或淋巴恶性肿瘤。
10.根据权利要求9所述的分离的或合成的Replikin Peak基因,其中所述Replikin Peak基因分离自非小细胞肺癌或多形性成胶质细胞瘤。
11.根据权利要求7所述的分离的或合成的Replikin Peak基因,其中所述Replikin Peak基因分离自结核分枝杆菌、产粘液分枝杆菌、金黄色葡萄球菌或恶性疟原虫。
12.根据权利要求7所述的分离的或合成的Replikin Peak基因,其中所述Replikin Peak基因分离自流感病毒、口蹄疫病毒、西尼罗病毒、猪生殖和呼吸综合征病毒、猪圆环病毒、白斑综合征病毒、桃拉综合征病毒、冠状病毒、埃博拉病毒、双生曲叶病毒、出血性败血病病毒或烟草花叶病毒。
13.根据权利要求12所述的分离的或合成的Replikin Peak基因,其中所述流感病毒是甲型流感病毒。
14.根据权利要求13所述的分离的或合成的Replikin Peak基因,其中所述甲型流感病毒是H1N1、H2N2、H3N2、H5N1或H3N8。
15.根据权利要求13所述的分离的或合成的Replikin Peak基因,其中所述Replikin Peak基因分离自流感病毒的pB1基因区。
16.根据权利要求12所述的分离的或合成的Replikin Peak基因,其中所述病毒是口蹄疫病毒。
17.根据权利要求16所述的分离的或合成的Replikin Peak基因,其中所述Replikin Peak基因鉴定于所述口蹄疫病毒的VP1基因内。
18.根据权利要求12所述的分离的或合成的Replikin Peak基因,其中所述病毒是西尼罗病毒。
19.根据权利要求18所述的分离的或合成的Replikin Peak基因,其中所述Replikin Peak基因分离自所述西尼罗病毒的包膜蛋白。
20.根据权利要求12所述的分离的或合成的Replikin Peak基因,其中所述病毒是猪呼吸和生殖综合征病毒。
21.根据权利要求20所述的分离的或合成的Replikin Peak基因,其中所述Replikin Peak基因分离自猪呼吸和生殖综合征病毒的核壳体蛋白。
22.根据权利要求12所述的分离的或合成的Replikin Peak基因,其中所述病毒是猪圆环病毒。
23.根据权利要求22所述的分离的或合成的Replikin Peak基因,其中所述Replikin Peak基因分离自猪圆环病毒的复制酶蛋白。
24.根据权利要求12所述的分离的或合成的Replikin Peak基因,其中所述病毒是白斑综合征病毒。
25.根据权利要求24所述的分离的或合成的Replikin Peak基因,其中所述Replikin Peak基因分离自白斑综合征病毒的核糖核苷酸还原酶蛋白。
26.根据权利要求12所述的分离的或合成的Replikin Peak基因,其中所述病毒是烟草花叶病毒。
27.根据权利要求12所述的分离的或合成的Replikin Peak基因,其中所述病毒是出血性败血病病毒。
28.根据权利要求27所述的分离的或合成的Replikin Peak基因,其中所述Replikin Peak基因分离自出血性败血病病毒中的糖蛋白。
29.根据权利要求7所述的分离的或合成的Replikin Peak基因,其中所述Replikin Peak基因包括如下序列:SEQ ID NO:1741、SEQ ID NO:3664、SEQ ID NO:3660、SEQ ID NO:3665、SEQ ID NO:1996、SEQ IDNO:1665、SEQ ID NO:1684、SEQ ID NO:1701、SEQ ID NO:546、SEQ ID NO:124、SEQ ID NO:130、SEQ ID NO:311、SEQ ID NO:341-344、SEQ ID NO:286、SEQ ID NO:287、SEQ ID NO:288、SEQ ID NO:289、SEQ ID NO:290、SEQ ID NO:233-238、SEQ ID NO:415、SEQ ID NO:421、SEQ ID NO:438、SEQ ID NO:451、SEQ ID NO:462、SEQ ID NO:498、SEQ ID NO:669、SEQ ID NO:1168、SEQ ID NO:1531、SEQ ID NO:1548、SEQ ID NO:3787的第81-204位或SEQ ID NO:1939。
30.一种免疫原性组合物,其包括权利要求7所述的分离的或合成的Replikin Peak基因。
31.一种免疫原性组合物,其包括分离自权利要求7所述的ReplikinPeak基因的Replikin序列,其中所述Replikin序列是SEQ ID NO:2902-2925、SEQ ID NO:2312-2544、SEQ ID NO:2701-2711、SEQ ID NO:2713-2718、SEQ ID NO:3282-3285、3287-3291、3293、3295、3297、3299、3300、3302、3304、3306和3308、SEQ ID NO:1685-1691、SEQ ID NO:1702-1717、SEQ ID NO:106、SEQ ID NO:112、SEQ ID NO:113、SEQID NO:125-129、SEQ ID NO:131-156、SEQ ID NO:233-244、SEQ ID NO:286-290、SEQ ID NO:312-323、SEQ ID NO:354-366、SEQ ID NO:368-380、SEQ ID NO:383-393、SEQ ID NO:395-401、SEQ ID NO:403-414、SEQID NO:291-307、SEQ ID NO:308-310、SEQ ID NO:324-327、SEQ ID NO:328-340、SEQ ID NO:416-419、SEQ ID NO:422-437、SEQ ID NO:440-445、SEQ ID NO:452-457、SEQ ID NO:464-476、SEQ ID NO:482-484和SEQID NO:487-492、SEQ ID NO:547-562、SEQ ID NO:663-667、SEQ ID NO:670-1166、SEQ ID NO:1169-1529、SEQ ID NO:1532-1542、SEQ ID NO:1548、SEQ ID NO:3787的第81-204位或SEQ ID NO 1637-1663。
32.一种其中存储了指令的计算机可读介质,所述指令当执行时促使处理器进行鉴定病毒、生物体或恶性肿瘤的Replikin Peak基因的方法,该方法包括在所述病毒、生物体或恶性肿瘤的氨基酸序列或编码氨基酸序列的核酸序列中鉴定,与所述病毒、生物体或恶性肿瘤的基因组、或蛋白或蛋白片段的其它部分相比,由每100氨基酸最高数目的连续Replikin序列组成的所述病毒、所述生物体或所述恶性肿瘤的基因组、蛋白或蛋白片段的部分。
33.根据权利要求32所述的计算机可读介质,其进一步包括当执行时促使处理器进行预测包含所述鉴定的Replikin Peak基因的所述病毒、生物体或恶性肿瘤的致死性或毒力的增加,或预测包含所述鉴定的ReplikinPeak基因的所述病毒或生物体的暴发的方法的指令,所述方法包括:
(1)确定权利要求32所述的Replikin Peak基因的Replikin计数或包括权利要求32所述的Replikin Peak基因的蛋白或基因区的Replikin计数高于在与所述病毒相同物种的至少一种其它病毒、与所述生物体相同物种的至少一种其它生物体或与所述恶性肿瘤相同类型的至少一种其它恶性肿瘤的基因组中或者蛋白或蛋白片段中鉴定的另一Replikin Peak基因的Replikin计数或包括所述其它Replikin Peak基因的蛋白或基因区的Replikin计数,其中所述其它病毒、所述其它生物体或所述其它恶性肿瘤在比所述病毒、所述生物体或所述恶性肿瘤更早的时间点分离,和
(2)预测所述病毒、生物体或恶性肿瘤的致死性或毒力的增加或预测所述病毒或生物体的暴发。
34.一种预测病毒或生物体的暴发,或致死性或毒力的增加的株、宿主或地理区域的方法,该方法包括:
(1)在第一株、来自第一宿主或分离自第一地理区域的第一病毒或生物体的基因组中或在所述第一病毒或生物体的蛋白或蛋白片段中鉴定具有比在与所述第一病毒相同物种的至少一种第二病毒或与所述第一生物体相同物种的至少一种第二生物体的基因组中或蛋白或蛋白片段中鉴定的Replikin Peak基因或包括Replikin Peak基因的蛋白或基因区更高的Replikin计数的Replikin Peak基因或包括Replikin Peak基因的蛋白或基因区,其中所述第一病毒或所述第一生物体在比所述第一病毒或所述第一生物体更晚的时间点分离,并与所述第一病毒或第一生物体是相同株、来自与所述第一病毒或第一生物体相同或另一宿主、或分离自与所述第一病毒或第一生物体相同或另一地理区域,和
(2)预测所述第一病毒或生物体的所述第一株、在所述第一宿主中或在所述第一地理区域中的暴发,或致死性或毒力的增加。
35.根据权利要求34所述的方法,其中包括第一病毒或生物体的基因组中的所述Replikin Peak基因的所述蛋白或基因区鉴定为具有比包括在所述至少一种第二病毒或生物体的基因组中或蛋白或蛋白片段中鉴定的Replikin Peak基因的所述蛋白或基因区更高的Replikin计数。
36.根据权利要求34所述的方法,其中所述第一病毒或所述第一生物体比所述第二生物体或所述第二病毒晚分离至少六个月至三年。
37.根据权利要求34所述的方法,其中所述第一生物体或所述第一病毒是结核分枝杆菌、产粘液分枝杆菌、金黄色葡萄球菌和恶性疟原虫、流感病毒、口蹄疫病毒、西尼罗病毒、猪生殖和呼吸综合征病毒、猪圆环病毒、白斑综合征病毒、桃拉综合征病毒、冠状病毒、埃博拉病毒、番茄植物中的双生曲叶病毒、鱼的出血性败血病病毒或烟草花叶病毒。
38.根据权利要求37所述的方法,其中所述金黄色葡萄球菌是耐受甲氧苯青霉素的。
39.根据权利要求37所述的方法,其中所述流感病毒是甲型流感病毒株。
40.根据权利要求39所述的方法,其中所述甲型流感病毒是H1N1、H2N2、H3N2、H5N1或H3N8。
41.根据权利要求39所述的方法,其中包括所述Replikin Peak基因的所述蛋白或基因区是所述流感病毒的pB1基因区。
42.根据权利要求37所述的方法,其中所述蛋白或基因区是所述猪呼吸和生殖综合征病毒的核壳体蛋白。
43.根据权利要求37所述的方法,其中所述蛋白或基因区是所述口蹄疫病毒的VP1蛋白。
44.根据权利要求37所述的方法,其中所述蛋白或基因区是所述西尼罗病毒的包膜蛋白。
45.根据权利要求37所述的方法,其中所述蛋白或基因区是所述猪生殖和呼吸综合征病毒的核壳体蛋白。
46.根据权利要求37所述的方法,其中所述蛋白或基因区是所述恶性疟原虫的腺苷三磷酸酶。
47.根据权利要求37所述的方法,其中所述蛋白或基因区是所述猪圆环病毒的复制酶蛋白。
48.根据权利要求37所述的方法,其中所述蛋白或基因区是所述白斑综合征病毒的核糖核苷酸酶。
49.一种鉴定伴有比与第一病毒相同物种的第二病毒、与第一生物体相同物种的第二生物体或与第一恶性肿瘤相同类型的第二恶性肿瘤更高致死性、更高毒力或更快速复制的第一病毒、生物体或恶性肿瘤的方法,该方法包括鉴定比第二病毒的至少一种毒粒、或第二生物体的至少一种细胞、或第二恶性肿瘤的至少一种恶性细胞的基因组中或第二病毒的至少一种毒粒、或第二生物体的至少一种细胞、或第二恶性肿瘤的至少一种恶性细胞的蛋白或蛋白片段中编码的已鉴定的Replikin Peak基因具有更高Replikin计数的第一病毒的至少一种毒粒、或第一生物体的至少一种细胞、或第一恶性肿瘤的至少一种恶性细胞的基因组中或第一病毒的至少一种毒粒、或第一生物体的至少一种细胞、或第一恶性肿瘤的至少一种恶性细胞的蛋白或蛋白片段中编码的Replikin Peak基因,其中所述第一病毒、第一生物体或第一恶性肿瘤比所述第二病毒、第二生物体或第二恶性肿瘤具有更高致死性、更高毒力、或更快速复制,且其中所述Replikin Peak基因定义为与相同的病毒毒粒、相同的生物体细胞、或相同恶性细胞的其余蛋白或蛋白片段相比具有每100氨基酸最高浓度的连续Replikin序列的蛋白或蛋白片段或编码所述蛋白或蛋白片段的基因组部分。
50.一种鉴定具有比至少一种与第一病毒相同物种的第二病毒、与第一生物体相同物种的第二生物体或与第一恶性肿瘤相同种类的第二恶性肿瘤更高致死性的第一病毒、第一生物体或第一恶性肿瘤的方法,该方法包括比较所述病毒、生物体或恶性肿瘤的全基因组的Replikin计数与所述至少一种第二病毒、第二生物体或第二恶性肿瘤的全基因组的Replikin计数以确定具有更高Replikin计数的病毒、生物体或恶性肿瘤具有更高致死性。
51.根据权利要求50所述的方法,其中所述第一病毒是冠状病毒、口蹄疫病毒、白斑综合征病毒、桃拉综合征病毒、猪圆环病毒或流感病毒。
52.根据权利要求50所述的方法,其中所述第一病毒是流感病毒的H5N1株。
53.一种获得病毒、生物体或恶性肿瘤的分离的或合成的ReplikinPeak基因的方法,所述病毒、生物体或恶性肿瘤的分离的或合成的Replikin Peak基因用于诊断、预防或治疗所述病毒或所述生物体的感染或用于诊断、预防或治疗所述恶性肿瘤,所述方法包括:
(1)获得相同物种的复数种病毒分离株、相同物种的复数种生物体、或相同类型的复数种恶性肿瘤;
(2)分析所述复数种病毒分离株的每种单独分离株、所述复数种生物体的每种单独生物体的细胞、或所述复数种恶性肿瘤的每种单独恶性肿瘤的恶性细胞的蛋白序列或蛋白序列片段中Replikin序列的存在和浓度;
(3)鉴定每种单独恶性肿瘤的恶性细胞、每种单独生物体的细胞或每种单独病毒分离株中具有最高浓度的连续Replikin序列的蛋白序列或蛋白序列片段;
(4)在所述复数种病毒分离株、所述复数种生物体或所述复数种恶性肿瘤中选择具有最高浓度的连续Replikin序列的蛋白序列或蛋白序列片段;
(5)鉴定所选的蛋白序列或蛋白序列片段的氨基酸序列为所述复数种病毒分离株、生物体或恶性肿瘤的Replikin Peak基因;和
(6)分离或合成至少一种所述复数种病毒分离株、生物体或恶性肿瘤的鉴定的Replikin Peak基因,其中所分离的或合成的鉴定的Replikin Peak基因用于诊断、预防或治疗所述病毒或所述生物体的所述感染或所述恶性肿瘤。
54.一种免疫原性组合物,其包括至少一种权利要求53所述的分离的或合成的Replikin Peak基因。
55.根据权利要求54所述的免疫原性组合物,其中所述分离的或合成的Replikin Peak基因分离自病毒或生物体的新出现株。
56.根据权利要求54所述的免疫原性组合物,其进一步包括药学上可接受的载体。
57.一种疫苗,其包括至少一种权利要求7所述的分离的或合成的Replikin Peak基因。
58.根据权利要求57所述的疫苗,其中所述至少一种分离的或合成的Replikin Peak基因分离自病毒或生物体的新出现株。
59.根据权利要求57所述的疫苗,其包括SEQ ID NO:1741、SEQ IDNO:3664、SEQ ID NO:3660、SEQ ID NO:3665、SEQ ID NO:1996、SEQ ID NO:1665、SEQ ID NO:1684、SEQ ID NO:1701、SEQ ID NO:546、SEQ ID NO:124、SEQ ID NO:130、SEQ ID NO:311、SEQ ID NO:341-344、SEQ ID NO:286、SEQ ID NO:287、SEQ ID NO:288、SEQ IDNO:289、SEQ ID NO:290、SEQ ID NO:233-238、SEQ ID NO:415、SEQ ID NO:421、SEQ ID NO:438、SEQ ID NO:451、SEQ ID NO:462、SEQ ID NO:498、SEQ ID NO:669、SEQ ID NO:1168、SEQ ID NO:1531、SEQ ID NO:1548、SEQ ID NO:3787的第81-204位或SEQ ID NO:1939。
60.根据权利要求57所述的疫苗,其中所述分离的或合成的ReplikinPeak基因分离自病毒。
61.根据权利要求60所述的疫苗,其中所述分离的或合成的ReplikinPeak基因分离自流感病毒、口蹄疫病毒、西尼罗病毒、猪生殖和呼吸综合征病毒、猪圆环病毒、白斑综合征病毒、桃拉综合征病毒、冠状病毒、埃博拉病毒、双生曲叶病毒、出血性败血病病毒或烟草花叶病毒。
62.根据权利要求61所述的疫苗,其中所述分离的或合成的ReplikinPeak基因分离自甲型流感。
63.根据权利要求62所述的疫苗,其中所述甲型流感是H1N1、H2N2、H3N2、H5N1或H3N8。
64.根据权利要求57所述的疫苗,其中所述分离的或合成的ReplikinPeak基因分离自生物体。
65.根据权利要求64所述的疫苗,其中所述分离的或合成的ReplikinPeak基因分离自结核分枝杆菌、产粘液分枝杆菌、金黄色葡萄球菌或恶性疟原虫。
66.根据权利要求65所述的疫苗,其中所述金黄色葡萄球菌是耐受甲氧苯青霉素的。
67.根据权利要求57所述的疫苗,其中所述分离的或合成的ReplikinPeak基因分离自恶性肿瘤。
68.根据权利要求67所述的疫苗,其中所述分离的或合成的ReplikinPeak基因分离自肺恶性肿瘤、脑恶性肿瘤、乳腺恶性肿瘤或淋巴恶性肿瘤。
69.根据权利要求68所述的疫苗,其中所述分离的或合成的ReplikinPeak基因分离自非小细胞肺癌。
70.根据权利要求68所述的疫苗,其中所述分离的或合成的ReplikinPeak基因分离自多形性成胶质细胞瘤。
71.一种免疫原性组合物,其包括权利要求29所述的Replikin Peak基因。
72.根据权利要求71所述的免疫原性组合物,其进一步包括药学上可接受的载体。
73.一种分离的或合成的Replikin序列,其分离自权利要求7所述的Replikin Peak基因的蛋白或蛋白片段或分离自包括权利要求7所述的Replikin Peak基因的蛋白。
74.根据权利要求73所述的Replikin序列,其中所述Replikin Peak基因分离自结核分枝杆菌、产粘液分枝杆菌、金黄色葡萄球菌或恶性疟原虫。
75.根据权利要求74所述的Replikin序列,其中所述Replikin Peak基因分离自产粘液分枝杆菌。
76.根据权利要求75所述的Replikin序列,其中所述Replikin序列是SEQ ID NO:2902-2925。
77.根据权利要求74所述的Replikin序列,其中所述Replikin Peak基因分离自恶性疟原虫。
78.根据权利要求77所述的Replikin序列,其中所述Replikin Peak基因是SEQ ID NO:2312-2544、SEQ ID NO:2701-2711、SEQ ID NO:2713-2718、SEQ ID NO:3282-3285、3287-3291、3293、3295、3297、3299、3300、3302、3304、3306或SEQ ID NO:3308之一。
79.根据权利要求73所述的Replikin序列,其中所述Replikin Peak基因分离自流感病毒、口蹄疫病毒、西尼罗病毒、猪生殖和呼吸综合征病毒、猪圆环病毒、白斑综合征病毒、桃拉综合征病毒、冠状病毒、埃博拉病毒、双生曲叶病毒、出血性败血病病毒或烟草花叶病毒。
80.根据权利要求79所述的Replikin序列,其中所述流感病毒是甲型流感病毒。
81.根据权利要求80所述的Replikin序列,其中所述甲型流感病毒是H1N1、H2N2、H3N2、H5N1或H3N8。
82.根据权利要求81所述的Replikin序列,其中所述甲型流感病毒是H5N1且所述Replikin序列是SEQ ID NO:1685-1691、SEQ ID NO:1702-1716或SEQ ID NO:1717之一。
83.根据权利要求81所述的Replikin序列,其中所述甲型流感病毒是H3N8且所述Replikin序列是SEQ ID NO:547-561或SEQ ID NO:562之一。
84.根据权利要求79所述的Replikin序列,其中所述Replikin Peak基因分离自口蹄疫病毒。
85.根据权利要求84所述的Replikin序列,其中所述Replikin序列是SEQ ID NO:106、SEQ ID NO:112、SEQ ID NO:113、SEQ ID NO:125-129、SEQ ID NO:131-155或SEQ ID NO:156之一。
86.根据权利要求79所述的Replikin序列,其中所述Replikin Peak基因分离自西尼罗病毒。
87.根据权利要求86所述的Replikin序列,其中所述Replikin序列是SEQ ID NO:233-243或SEQ ID NO:244之一。
88.根据权利要求79所述的Replikin序列,其中所述Replikin Peak基因分离自PRRSV。
89.根据权利要求88所述的Replikin序列,其中所述Replikin序列是SEQ ID NO:286-290、SEQ ID NO:312-323、SEQ ID NO:354-366、SEQID NO:368-380、SEQ ID NO:383-393、SEQ ID NO:395-401、SEQ ID NO:403-413或SEQ ID NO:414之一。
90.根据权利要求79所述的Replikin序列,其中所述Replikin Peak基因分离自PCV。
91.根据权利要求90所述的Replikin序列,其中所述Replikin序列是SEQ ID NO:291-307、SEQ ID NO:308-310、SEQ ID NO:324-327、SEQID NO:328-340、SEQ ID NO:416-419、SEQ ID NO:422-437、SEQ ID NO:440-445、SEQ ID NO:452-457、SEQ ID NO:464-476、SEQ ID NO:482-484、SEQ ID NO:487-491或SEQ ID NO:492之一。
92.根据权利要求79所述的Replikin序列,其中所述Replikin Peak基因分离自白斑综合征病毒。
93.根据权利要求92所述的Replikin序列,其中所述Replikin序列是SEQ ID NO:663-667、SEQ ID NO:670-1166、SEQ ID NO:1169-1529、SEQ ID NO:1532-1542和SEQ ID NO:1548之一。
94.一种用于预防和/或治疗病毒或生物体感染或恶性肿瘤的疫苗,其中所述疫苗包括于Replikin Peak基因的蛋白或蛋白片段中或于包含Replikin Peak基因的蛋白中的至少一种分离的或合成的Replikin序列,所述Replikin Peak基因在所述病毒、生物体或恶性肿瘤中鉴定。
95.根据权利要求94所述的疫苗,其中所述至少一种分离的或合成的Replikin序列是SEQ ID NO:2902-2925、SEQ ID NO:2312-2544、SEQ IDNO:2701-2711、2713-2718、SEQ ID NO:3282-3285、3287-3291、3293、3295、3297、3299、3300、3302、3304、3306、3308、SEQ ID NO:1685-1691、SEQ ID NO:1702-1717、SEQ ID NO:547-562、SEQ ID NO:106、SEQ IDNO:112、SEQ ID NO:113、SEQ ID NO:125-129、和SEQ ID NO:131-156、SEQ ID NO:233-244、SEQ ID NO:286-290、SEQ ID NO:312-323、SEQID NO:354-366、SEQ ID NO:368-380、SEQ ID NO:383-393、SEQ ID NO:395-401、SEQ ID NO:403-414、SEQ ID NO:291-307、SEQ ID NO:308-310、SEQ ID NO:324-327、SEQ ID NO:328-340、SEQ ID NO:416-419、SEQID NO:422-437、SEQ ID NO:440-445、SEQ ID NO:452-457、SEQ ID NO:464-476、SEQ ID NO:482-484、SEQ ID NO:487-492、SEQ ID NO:663-667、SEQ ID NO:670-1166、SEQ ID NO:1169-1529、SEQ ID NO:1532-1542、SEQ ID NO:1548、SEQ ID NO:1637-1662或SEQ ID NO:1663之一。
96.根据权利要求94所述的疫苗,其用于预防和/或治疗病毒感染。
97.根据权利要求96所述的疫苗,其中所述病毒感染是由流感病毒、口蹄疫病毒、西尼罗病毒、猪生殖和呼吸综合征病毒、猪圆环病毒、白斑综合征病毒、桃拉综合征病毒、冠状病毒、埃博拉病毒、双生曲叶病毒、出血性败血病病毒或烟草花叶病毒引起的。
98.根据权利要求97所述的疫苗,其中所述流感病毒是甲型流感病毒。
99.根据权利要求98所述的疫苗,其中所述甲型流感病毒是H1N1、H2N2、H3N2、H5N1或H3N8。
100.根据权利要求97所述的疫苗,其中所述病毒是出血性败血病病毒。
101.根据权利要求94所述的疫苗,其用于预防和/或治疗生物体感染。
102.根据权利要求101所述的疫苗,其中所述生物体感染是由结核分枝杆菌、产粘液分枝杆菌、金黄色葡萄球菌或恶性疟原虫引起的。
103.根据权利要求102所述的疫苗,其中所述金黄色葡萄球菌是耐受甲氧苯青霉素的。
104.根据权利要求94所述的疫苗,其中所述恶性肿瘤是肺恶性肿瘤、脑恶性肿瘤、乳腺恶性肿瘤、卵巢恶性肿瘤或淋巴恶性肿瘤。
105.根据权利要求104所述的疫苗,其中所述恶性肿瘤是非小细胞肺癌或多形性成胶质细胞瘤。
106.一种免疫原性化合物,其包括于Replikin Peak基因的蛋白或蛋白片段中的或于包括Replikin Peak基因的蛋白中的至少一种分离的或合成的Replikin序列,其中所述Replikin Peak基因在病毒、生物体或恶性肿瘤中鉴定。
107.根据权利要求106所述的免疫原性化合物,其进一步包括药学上可接受的载体。
108.一种刺激免疫系统的方法,该方法包括向动物施用在ReplikinPeak基因的蛋白或蛋白片段或包括Replikin Peak基因的蛋白或基因区中鉴定的至少一种分离的或合成的Replikin序列,所述Replikin Peak基因是在病毒、生物体或恶性肿瘤中鉴定的。
109.根据权利要求108所述的方法,其中所述动物是人类。
110.一种抗体,其针对Replikin Peak基因的蛋白或蛋白片段中或包括Replikin Peak基因的蛋白或基因区中的至少一种分离的或合成的Replikin序列。
111.一种鉴定恶性肿瘤、生物体或病毒的致死株的方法,该方法包括:
(1)获得所述恶性肿瘤、生物体或病毒的复数个分离株;
(2)鉴定所述恶性肿瘤、生物体或病毒的所述复数个分离株的每个分离株的Replikin Peak基因;
(3)分析所述复数个分离株的每个分离株的Replikin Peak基因的蛋白或蛋白片段的氨基酸序列中Replikin序列的存在和浓度;
(4)比较所述复数个分离株的每个分离株的Replikin Peak基因的每个蛋白或蛋白片段中Replikin序列的浓度与所述复数个分离株的每个其它分离株的Replikin Peak基因的每个蛋白或蛋白片段中Replikin序列的浓度;和
(5)鉴定Replikin Peak基因的蛋白或蛋白片段中具有最高浓度的连续Replikin序列的分离株为所述恶性肿瘤、生物体或病毒的毒性或致死株。
112.一种从恶性肿瘤、生物体或病毒选择用于包含于针对恶性肿瘤、生物体或病毒的预防性或治疗性疫苗或免疫原性化合物中的肽的方法,该方法包括鉴定所述恶性肿瘤、生物体或病毒的至少两个分离株之间其他方面保守的Replikin序列或Replikin Peak基因的至少一个氨基酸序列差异,并且将所鉴定的至少一个氨基酸序列差异与所述至少两个分离株的最高毒力、发病率或宿主死亡率相关联,并选择具有所鉴定的至少一个氨基酸序列差异的其他方面保守的Replikin序列、Replikin Peak基因或ReplikinPeak基因中的Replikin序列作为用于包含于预防性或治疗性疫苗或免疫原性化合物中的肽。
113.根据权利要求112所述的方法,其进一步预测包含具有所述至少一个氨基酸序列差异的所选的保守Replikin序列或Replikin Peak基因的分离株为所述恶性肿瘤、生物体或病毒的致死分离株。
114.根据权利要求113所述的方法,其中所述恶性肿瘤、生物体或病毒是恶性肿瘤。
115.根据权利要求114所述的方法,其中所述恶性肿瘤是肺恶性肿瘤、脑恶性肿瘤、乳腺恶性肿瘤或淋巴恶性肿瘤。
116.根据权利要求115所述的方法,其中所述恶性肿瘤是非小细胞肺癌或多形性成胶质细胞瘤。
117.根据权利要求112所述的方法,其中所述恶性肿瘤、生物体或病毒是生物体。
118.根据权利要求117所述的方法,其中所述生物体是结核分枝杆菌、产粘液分枝杆菌、金黄色葡萄球菌或恶性疟原虫。
119.根据权利要求118所述的方法,其中所述金黄色葡萄球菌是耐受甲氧苯青霉素的。
120.根据权利要求112所述的方法,其中所述恶性肿瘤、生物体或病毒是病毒。
121.根据权利要求120所述的方法,其中所述病毒是流感病毒、口蹄疫病毒、西尼罗病毒、猪生殖和呼吸综合征病毒、猪圆环病毒、白斑综合征病毒、桃拉综合征病毒、冠状病毒、埃博拉病毒、双生曲叶病毒、出血性败血病病毒或烟草花叶病毒。
122.一种确定肺恶性肿瘤病例的来源的方法,该方法包括鉴定肺癌细胞的Replikin Peak基因中还存在于烟草花叶病毒的分离株的ReplikinPeak基因中的至少一种肽,其中所述肽与所述肺恶性肿瘤的来源有关联。
123.根据权利要求122所述的方法,其中在所述肺癌细胞的ReplikinPeak基因中鉴定复数种肽,其中所述复数种肽的每一种还鉴定于烟草花叶病毒的分离株的Replikin Peak基因中。
124.根据权利要求122所述的方法,其中肺癌细胞的Replikin Peak基因中的所述至少一种肽和烟草花叶病毒的分离株的Replikin Peak基因中的所述至少一种肽是包含至少两个赖氨酸和至少一个组氨酸的约10个或更少氨基酸的肽。
125.根据权利要求124所述的方法,其中肺癌细胞的Replikin Peak基因中的所述至少一种肽和烟草花叶病毒的分离株的Replikin Peak基因中的所述至少一种肽是包含至少三个赖氨酸和至少一个组氨酸的约10个或更少氨基酸的肽。
126.根据权利要求125所述的方法,其中肺癌细胞的Replikin Peak基因中的所述至少一种肽和烟草花叶病毒的分离株的Replikin Peak基因中的所述至少一种肽是包含至少三个赖氨酸和至少一个组氨酸的约7个或更少的氨基酸。
127.根据权利要求126所述的方法,其中肺癌细胞的Replikin Peak基因中的所述至少一种肽和烟草花叶病毒的分离株的Replikin Peak基因中的所述至少一种肽是包含三个赖氨酸和一个组氨酸的约4个氨基酸。
128.根据权利要求127所述的方法,其中肺癌细胞的Replikin Peak基因中的和烟草花叶病毒的分离株的Replikin Peak基因中的所述至少一种肽是KHKK(SEQ ID NO:1584)。
129.根据权利要求128所述的方法,其中多于一个KHKK(SEQ IDNO:1584)肽鉴定于肺癌细胞的Replikin Peak基因中和烟草花叶病毒的分离株的Replikin Peak基因中。
130.根据权利要求129所述的方法,其中至少10个KHKK(SEQ IDNO:1584)肽鉴定于肺癌细胞的Replikin Peak基因中且至少10个KHKK(SEQ ID NO:1584)肽鉴定于烟草花叶病毒的分离株的Replikin Peak基因中。
131.根据权利要求130所述的方法,其中至少20个KHKK(SEQ IDNO:1584)肽鉴定于肺癌细胞的Replikin Peak基因中且至少20个KHKK(SEQ ID NO:1584)肽鉴定于烟草花叶病毒的分离株的Replikin Peak基因中。
132.根据权利要求131所述的方法,其中至少30个KHKK(SEQ IDNO:1584)肽鉴定于肺癌细胞的Replikin Peak基因中且至少30个KHKK肽鉴定于烟草花叶病毒的分离株的Replikin Peak基因中。
133.根据权利要求132所述的方法,其中至少50个KHKK(SEQ IDNO:1584)肽鉴定于肺癌细胞的Replikin Peak基因中且至少50个KHKK(SEQ ID NO:1584)肽鉴定于烟草花叶病毒的分离株的Replikin Peak基因中。
134.一种鉴定与第二例肺恶性肿瘤相比具有更高的复制速率、侵袭性生长模式或致死性的第一例肺恶性肿瘤的方法,该方法包括鉴定ReplikinPeak基因中Replikin计数高于第二例肺恶性肿瘤的恶性细胞中鉴定的Replikin Peak基因的第一例肺恶性肿瘤的恶性细胞的Replikin Peak基因。
135.根据权利要求134所述的方法,其中所述第一例和第二例肺恶性肿瘤是非小细胞肺恶性肿瘤。
136.一种用于诊断、预防或治疗肺癌的肺恶性肿瘤中的分离的或合成的Replikin Peak基因,其通过包含以下步骤的方法获得:
(1)从肺恶性肿瘤获得至少一种恶性细胞;
(2)分析所述至少一种恶性细胞的蛋白序列或蛋白序列片段中Replikin序列的存在和浓度;
(3)鉴定所述至少一种恶性细胞中具有最高浓度的连续Replikin序列的蛋白序列或蛋白序列片段;
(4)选择具有最高浓度的连续Replikin序列的蛋白序列或蛋白序列片段;
(5)鉴定所选的蛋白序列或蛋白序列片段的氨基酸序列为ReplikinPeak基因;和
(6)分离或合成所述至少一种恶性细胞的已鉴定的Replikin Peak基因,其中所分离的或合成的已鉴定的Replikin Peak基因用于诊断、预防或治疗肺癌。
137.根据权利要求136所述的方法,其中所述肺恶性肿瘤是非小细胞肺恶性肿瘤。
138.根据权利要求137所述的方法,其中所述已鉴定的Replikin Peak基因的蛋白或蛋白片段中的至少一个Replikin序列被分离或合成,以用于诊断、预防或治疗肺癌。
139.根据权利要求138所述的方法,其中所述已鉴定的Replikin Peak基因的蛋白或蛋白片段中的所述至少一个Replikin序列是SEQ ID NO:1636的SEQ ID NO:1585-1635之一。
140.一种用于预防和治疗肺癌的免疫原性组合物,其中所述免疫原性组合物包括已鉴定的Replikin Peak基因的蛋白或蛋白片段中的至少一种分离的或合成的Replikin序列。
141.一种刺激免疫系统的方法,该方法包括向动物施用用于预防、治疗或诊断动物肺癌的肺恶性肿瘤的Replikin Peak基因中鉴定的至少一种分离的或合成的Replikin序列。
142.根据权利要求141所述的方法,其中所述动物是人类。
143.一种抗体,其针对肺恶性肿瘤的Replikin Peak基因序列中至少一种分离的或合成的Replikin序列。
144.一种鉴定致死性肺癌形式的方法,该方法包括:
(1)从复数种肺肿瘤获得至少一种恶性细胞;
(2)在所述复数种肺肿瘤的每一种的至少一种恶性细胞中鉴定Replikin Peak基因;
(3)分析所述复数种肺肿瘤的每一种的至少一种恶性细胞中的Replikin Peak基因的蛋白或蛋白片段的氨基酸序列中Replikin序列的存在和浓度;
(4)比较所述复数种肺肿瘤的每一种的至少一种恶性细胞中的Replikin Peak基因的每种蛋白或蛋白片段中Replikin序列的浓度;和
(5)鉴定在Replikin Peak基因的蛋白或蛋白片段中具有最高浓度的连续Replikin序列的肺肿瘤为致死性肺癌形式。
145.一种鉴定至少两种肺癌中更具致死性的肺癌形式的方法,该方法包括:
(1)从至少两种肺癌的每种获得至少一种恶性细胞;
(2)在所述至少两种肺癌的每种的至少一种恶性细胞中鉴定ReplikinPeak基因;
(3)分析所述至少两种肺癌的每种的至少一种恶性细胞中的ReplikinPeak基因的蛋白或蛋白片段的氨基酸序列中Replikin序列的存在和浓度;
(4)比较所述至少两种肺癌的每种的至少一种恶性细胞中的ReplikinPeak基因的每种蛋白或蛋白片段中Replikin序列的浓度;和
(5)鉴定在Replikin Peak基因的蛋白或蛋白片段中具有最高浓度的连续Replikin序列的肺癌为更具致死性的肺癌形式。
146.一种确定病毒或生物体的致死性或毒力的预期增加的方法,该方法包括:
(1)获得所述病毒或生物体的复数个分离株,其中每个分离株在已知时间段内分离,且其中至少两个所述分离株比至少两个其它所述分离株晚分离约六个月至约5年;
(2)鉴定所述复数个分离株的每个分离株中的Replikin Peak基因;
(3)分析所述复数个分离株的每个分离株的所鉴定的Replikin Peak基因以确定所述复数个分离株的每个分离株中的每个Replikin Peak基因的Replikin计数,或分析所述复数个分离株的每个分离株的包含所鉴定的Replikin Peak基因的蛋白、蛋白片段或基因区以确定所述复数个分离株的蛋白、蛋白片段或基因区的Replikin计数;
(4)确定每个已知时间段Replikin Peak基因内或包含所述鉴定的Replikin Peak基因的蛋白、蛋白片段或基因区内的平均Replikin计数;
(5)相互比较每个已知时间段Replikin Peak基因内或所述蛋白、蛋白片段或基因区内的平均Replikin计数;
(6)鉴定至少两个已知时间段之间平均Replikin计数的增加;和
(7)根据所述鉴定的平均Replikin计数的增加鉴定所述病毒或生物体的致死性或毒力在约六个月至约三年内的预期增加。
147.根据权利要求146所述的方法,其中所述已知时间段是1年。
148.根据权利要求147所述的方法,其中所述平均Replikin计数的增加在一年内发生。
149.根据权利要求147所述的方法,其中所述平均Replikin计数的增加在三年内发生。
150.根据权利要求146所述的方法,其中所述平均Replikin计数的增加在至少两个已知时间段之间是显著的。
151.根据权利要求149所述的方法,其中所述平均Replikin计数的增加的显著性为p=<0.001。
CN200880002494A 2007-01-18 2008-01-18 确定包含Replikin Peak基因的病原体和恶性肿瘤的致死性的方法 Pending CN101688236A (zh)

Applications Claiming Priority (22)

Application Number Priority Date Filing Date Title
US88096607P 2007-01-18 2007-01-18
US60/880,966 2007-01-18
US89809707P 2007-01-30 2007-01-30
US60/898,097 2007-01-30
US11/755,597 US20080260764A1 (en) 2006-05-30 2007-05-30 Replikin peptides and uses thereof
US11/755,597 2007-05-30
US95474307P 2007-08-08 2007-08-08
US60/954,743 2007-08-08
US93549907P 2007-08-16 2007-08-16
US60/935,499 2007-08-16
US93581607P 2007-08-31 2007-08-31
US60/935,816 2007-08-31
US98233307P 2007-10-24 2007-10-24
US98233807P 2007-10-24 2007-10-24
US98233607P 2007-10-24 2007-10-24
US60/982,333 2007-10-24
US11/923,559 US8050871B2 (en) 2006-10-24 2007-10-24 Method of predicting influenza outbreaks by correlating an increase in replikin count in shrimp white spot syndrome virus and/or taura syndrome virus
US60/982,336 2007-10-24
US60/982,338 2007-10-24
US11/923,559 2007-10-24
US60/991,676 2007-11-30
PCT/US2008/000645 WO2008143717A2 (en) 2007-01-18 2008-01-18 Methods of determining lethality of pathogens and malignancies involving replikin peak genes

Publications (1)

Publication Number Publication Date
CN101688236A true CN101688236A (zh) 2010-03-31

Family

ID=42049525

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200880002494A Pending CN101688236A (zh) 2007-01-18 2008-01-18 确定包含Replikin Peak基因的病原体和恶性肿瘤的致死性的方法

Country Status (1)

Country Link
CN (1) CN101688236A (zh)

Similar Documents

Publication Publication Date Title
US20090017052A1 (en) Methods of determining lethality of pathogens and malignancies involving replikin peak genes
US8050871B2 (en) Method of predicting influenza outbreaks by correlating an increase in replikin count in shrimp white spot syndrome virus and/or taura syndrome virus
CN101969993B (zh) 对抗水产养殖中无脊椎动物的病原体感染的合成Replikin肽
Shirafuji et al. Characterization of genome segments 2, 3 and 6 of epizootic hemorrhagic disease virus strains isolated in Japan in 1985–2013: Identification of their serotypes and geographical genetic types
Wolff et al. Influenza B, C and D viruses (orthomyxoviridae)
EP2027146B1 (en) Replikin peptides and uses thereof
El-Shesheny et al. H5 influenza viruses in Egypt
Ghosh et al. Drawing comparisons between SARS-CoV-2 and the animal coronaviruses
Silva-Ramos et al. An updated review and current challenges of Guanarito virus infection, Venezuelan hemorrhagic fever
US20090269367A1 (en) Methods and compounds for mitigating pathogenic outbreaks using replikin count cycles
Ma et al. Avian influenza virus, Streptococcus suis serotype 2, severe acute respiratory syndrome-coronavirus and beyond: molecular epidemiology, ecology and the situation in China
Shimahara et al. Development of an improved RT‐PCR for specific detection of spring viraemia of carp virus
Bourogâa et al. S1 gene sequence analysis of new variant isolates of avian infectious bronchitis virus in Tunisia
Marchenko et al. Characterization of the H5N1 influenza virus isolated during an outbreak among wild birds in Russia (Tuva Republic) in 2010
Jalali et al. Molecular evolution and selection pressure analysis of infectious hematopoietic necrosis virus (IHNV) revealed the origin and phylogenetic relationship of Iranian isolates in recent epidemics in Iran
CN101688236A (zh) 确定包含Replikin Peak基因的病原体和恶性肿瘤的致死性的方法
EP2300493A2 (en) Methods and compounds for mitigating pathogenic outbreaks using replikin count cycles
Omony et al. Immunogenicity and protection efficacy evaluation of avian paramyxovirus serotype-1 (APMV-1) isolates in experimentally infected chickens
CN103937752B (zh) 一种h3n2亚型犬流感病毒灭活疫苗及其制备方法和应用
Kalaycıoğlu et al. Genetic analysis of the partial M RNA segment of Crimean-Congo hemorrhagic fever viruses in Turkey.
KR20090094838A (ko) 레플리킨 피크 유전자와 관련된 병원체 및 악성 종양의 치사율 측정 방법
US20160375125A1 (en) Therapies, vaccines, and predictive methods for infectious salmon anemia virus
EP3693465A1 (en) Novel fish coronavirus
Regan Influenza A virus: A role for the RNA polymerase in viral particle assembly
Szmyd-Potapczuk Molecular Epidemiology of Human Rabies Diagnosed in South Africa Between 1983 and 2007

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20100331