发明内容
在本发明中,除非另有说明,否则本文中使用的科学和技术名词具有本领域技术人员所通常理解的含义。并且,本文中所用的细胞培养、分子遗传学、核酸化学、免疫学实验室操作步骤均为相应领域内广泛使用的常规步骤。同时,为了更好地理解本发明,下面提供相关术语的定义和解释。
如本文中所使用的,术语“重组HSV病毒”是指经改造的HSV病毒,其与野生型HSV病毒相比,包含人工引入的突变。应当理解的是,本发明的重组HSV病毒不受限于其生产方式。例如,本发明的重组HSV病毒可通过同源重组产生,也可通过培养感染了所述重组HSV病毒的宿主细胞而制备。
如本文中所使用的,术语“病毒载体(viral vector)”是指,基于病毒基因组而构建获得的、能够携带外源核苷酸序列的一种核酸运载工具。通常而言,病毒载体能够在合适的宿主细胞中自我复制和/或表达其所包含的基因(内源的和外源的)。病毒载体可包含完整的野生型病毒的基因组,或者经突变或修饰的病毒基因组。然而,出于安全性的考虑,病毒载体一般优选包含经突变或修饰的病毒基因组。由于本发明的病毒载体衍生自HSV的病毒基因组,因此,本发明的病毒载体也可被称为HSV病毒载体。
如本文中所使用的,表述“不表达功能性目的蛋白”是指,当病毒或病毒载体或病毒基因组感染细胞后,所述病毒或病毒载体或病毒基因组不能产生或表达具有生物学功能活性的目的蛋白。例如,所述病毒或病毒载体或病毒基因组可以因基因缺失而完全不产生或表达所述目的蛋白,或者因功能丧失性突变而产生或表达不具有生物学功能活性的目的蛋白。
如本文中所使用的,术语“功能丧失性突变”是指这样的突变,其导致突变基因所编码和表达的蛋白丧失了其生物学功能活性。功能丧失性突变包括但不限于,错义突变,无义突变,移码突变,碱基缺失,碱基置换,碱基添加,以及其任何组合(例如,基因片段的缺失或置换或添加),只要包含该功能丧失性突变的基因不能产生或表达具有生物学功能活性的蛋白即可。
如本文中所使用的,术语“必需基因”是指维持HSV病毒生存和复制所不可或缺的基因。此类必需基因的具体实例包括但不限于,ICP27基因(参见例如GenBankNo.AFE62883.1),ICP4基因(参见例如GenBank No.AFE62888.1),VP5基因(参见例如GenBank No.AFE62846.1),gL基因(参见例如GenBank No.AFE62828.1),gH基因(参见例如GenBank No.AFE62849.1),gD基因(参见例如GenBank No.AFE62894.1),gK基因(参见例如GenBank No.AFE62882.1),gB基因(参见例如GenBank No.AFE62855.1),gN基因(参见例如GenBank No.AFE62878.1),UL5基因(参见例如GenBank No.AFE62832.1),UL6基因(参见例如GenBank No.AFE62833.1),UL8基因(参见例如GenBank No.AFE62835.1),UL9基因(参见例如GenBank No.AFE62836.1),UL12基因(参见例如GenBank No.AFE62839.1),UL25基因(参见例如GenBank No.AFE62852.1),UL26基因(参见例如GenBank No.AFE62853.1),UL28基因(参见例如GenBank No.AFE62856.1),UL29基因(参见例如GenBank No.AFE62857.1),UL30基因(参见例如GenBank No.AFE62858.1),UL33基因(参见例如GenBankNo.AFE62861.1),UL36基因(参见例如GenBank No.AFE62864.1),UL38基因(参见例如GenBank No.AFE62866.1),UL42基因(参见例如GenBank No.AFE62870.1),UL48基因(参见例如GenBank No.AFE62876.1),UL52基因(参见例如GenBank No.AFE62881.1)。有关HSV病毒的必需基因的详细描述,还可参见例如,Roizman B,Knipe DM.Herpes simplex virusesand their replication.In:Knipe D M,Howley P M,editors.Fields Virology.2nded.Vol 2.Philadelphia,PA:Lippincot,Williams and Wilkins,2001:2399-2460;Subak-Sharpe J H,Dargan D J.HSV molecular biology:general aspects of herpes simplexvirus molecular biology.Virus Genes,1998,16(3):239-251。
如本文中所使用的,术语“非必需基因”是指这样的基因,其不是维持HSV病毒生存和复制所必需的。一般情况下,可对HSV病毒基因组中的此类基因进行敲除(缺失)或突变,而不影响HSV病毒的生存和复制能力。此类必需基因的具体实例包括但不限于,UL3基因(参见例如GenBank No.AFE62830.1),UL4基因(参见例如GenBank No.AFE62831.1),UL14基因(参见例如GenBank No.AFE62841.1),UL16基因(参见例如GenBank No.AFE62843.1),UL21基因(参见例如GenBank No.AFE62848.1),UL24基因(参见例如GenBank No.AFE62851.1),UL31基因(参见例如GenBank No.AFE62859.1),UL32基因(参见例如GenBankNo.AFE62860.1),US3基因(参见例如GenBank No.AFE62891.1),UL51基因(参见例如GenBank No.AFE62880.1),UL55基因(参见例如GenBank No.AFE62884.1),UL56基因(参见例如GenBank No.AFE62885.1),US2基因(参见例如GenBank No.AFE62890.1),US12基因(参见例如GenBank No.AFE62901.1;即,ICP47基因),和LAT基因(参见例如GenBankNo.JQ673480.1)。有关HSV病毒的非必需基因的详细描述,还可参见例如,Roizman B,KnipeDM.Herpes simplex viruses and their replication.In:Knipe D M,Howley P M,editors.Fields Virology.2nd ed.Vol 2.Philadelphia,PA:Lippincot,Williams andWilkins,2001:2399-2460;Subak-Sharpe J H,Dargan D J.HSV molecular biology:general aspects of herpes simplex virus molecular biology.Virus Genes,1998,16(3):239-251。
如本文中所使用的,术语“ICP0蛋白”是指HSV病毒的infected cell protein 0,其由RL2基因编码,并且为HSV病毒的立即早期基因产物之一。ICP0蛋白的氨基酸序列是已知的,并可参见例如公共数据库NCBI(AFE62827.1)。
如本文中所使用的,术语“ICP34.5蛋白”是指HSV病毒的infected cell protein34.5,其由RL1基因编码,并且为HSV病毒的立即早期基因产物之一。ICP34.5蛋白的氨基酸序列是已知的,并可参见例如公共数据库NCBI(AFE62826.1)。
如本文中所使用的,术语“ICP27蛋白”是指HSV病毒的infected cell protein27,其由UL54基因编码。ICP27蛋白的氨基酸序列是已知的,并可参见例如公共数据库NCBI(AFE62883.1)。
如本文中所使用的,术语“ICP4蛋白”是指HSV病毒的infected cell protein 4,其由RS1基因编码。ICP4蛋白的氨基酸序列是已知的,并可参见例如公共数据库NCBI(AFE62888.1)。
如本文中所使用的,术语“VP5蛋白”是指HSV病毒的主要衣壳蛋白,其由UL19基因编码。VP5蛋白的氨基酸序列是已知的,并可参见例如公共数据库NCBI(AFE62846.1)。
如本文中所使用的,术语“ICP0基因”是指HSV病毒基因组中编码ICP0蛋白的核苷酸序列。如本文中所使用的,术语“ICP34.5基因”是指HSV病毒基因组中编码ICP34.5蛋白的核苷酸序列。如本文中所使用的,术语“ICP27基因”是指HSV病毒基因组中编码ICP27蛋白的核苷酸序列。如本文中所使用的,术语“ICP4基因”是指HSV病毒基因组中编码ICP4蛋白的核苷酸序列。如本文中所使用的,术语“VP5基因”是指HSV病毒基因组中编码VP5蛋白的核苷酸序列。
如本文中所使用的,术语“外源核苷酸序列”是指,人工引入的核苷酸序列,其相对于原始序列而言是外来的。外源核苷酸序列包括但不限于,未在所述病毒基因组中发现的任何基因。然而,在某些情况下,优选地,外源核苷酸序列编码具有治疗用途的多肽,例如免疫调节多肽、细胞因子、趋化因子、抗体和细胞毒性肽。
如本文中所使用的,术语“免疫调节多肽”是指,能调节免疫细胞功能的多肽,其实例包括但不限于,CD40L、OX40L、可诱导共刺激分子(ICOS)、FTL3L、LIGHT、CD137L、CD70、4-1BB、GITR、和CD28(参见例如,Khalil D N,Smith E L,Brentjens R J,et al.The futureof cancer treatment:immunomodulation,CARs and combination immunotherapy[J].Nat Rev Clin Oncol,2016,13(5):273-290)。
如本文中所使用的,术语“细胞因子”具有本领域技术人员公知的含义。然而,在本发明的方法中,当使用本发明的重组病毒来治疗肿瘤时,特别优选地,所述细胞因子为能够用于肿瘤治疗的细胞因子。“细胞因子”的实例包括但不限于,白介素(例如IL-2、IL-12和IL-15)、干扰素(例如IFNα、IFNβ、IFNγ)、肿瘤坏死因子(例如TNFα)、集落刺激因子(例如GM-CSF),及其任何组合(参见例如,Ardolino M,Hsu J,Raulet D H.Cytokine treatmentin cancer immunotherapy[J].Oncotarget,2015,6(23):19346-19347)。
如本文中所使用的,术语“趋化因子”具有本领域技术人员公知的含义。然而,在本发明的方法中,当使用本发明的重组病毒来治疗肿瘤时,特别优选地,所述细胞因子为能够用于肿瘤治疗的趋化因子。“趋化因子”的实例包括但不限于,CCL2、RANTES、CCL7、CCL9、CCL10、CCL12、CCL15、CCL19、CCL21、CCL20、XCL-1,及其任何组合(Homey B,Muller A,Zlotnik A.CHEMOKINES:AGENTS FOR THE IMMUNOTHERAPY OF CANCER?[J].Nat RevImmunol,2002,2:175-184)。
如本文中所使用的,术语“细胞毒性肽”是指,对细胞具有毒性或可诱导细胞凋亡的多肽,其实例但不限于胸苷激酶TK(TK/GCV)、TRAIL和FasL(参见例如,Candolfi M,KingG D,Muhammad A G,et al.Evaluation of proapototic transgenes to use incombination with Flt3L in an immune-stimulatory gene therapy approach forGlioblastoma multiforme(GBM)[J].FASEB J,2008,22:1077.13)。
如本文中所使用的,术语“抗体”具有本领域技术人员公知的含义。然而,在本发明的方法中,当使用本发明的重组病毒来治疗肿瘤时,特别优选地,所述抗体为能够用于肿瘤治疗的抗体。“抗体”的实例包括但不限于抗PD-1抗体、抗PD-L1抗体、抗TIGIT抗体、抗BTLA抗体、抗CTLA-4抗体、抗Tim-3抗体、抗Lag-3抗体、抗CD137抗体、抗OX40抗体、抗GITR抗体、抗CD73抗体、抗KIR抗体、抗ICOS抗体、抗CSF1R抗体、抗EGFR抗体、抗VEGFR抗体、抗HER2抗体和抗PDGFR抗体(参见例如,Khalil D N,Smith E L,Brentjens R J,et al.The future ofcancer treatment:immunomodulation,CARs and combination immunotherapy[J].NatRev Clin Oncol,2016,13(5):273-290;和Hughes P E,Caenepeel S,Wu L C.TargetedTherapyand Checkpoint Immunotherapy Combinations for the Treatment of Cancer[J].Trends Immunol,2016,37(7):462-476)。
如本文中所使用的,术语“药学可接受的载体和/或赋形剂”是指在药理学和/或生理学上与受试者和活性成分相容的载体和/或赋形剂,其是本领域公知的(参见例如Remington's Pharmaceutical Sciences.Edited by Gennaro AR,19thed.Pennsylvania:Mack Publishing Company,1995),并且包括但不限于:pH调节剂,表面活性剂,佐剂,离子强度增强剂。例如,pH调节剂包括但不限于磷酸盐缓冲液;表面活性剂包括但不限于阳离子,阴离子或者非离子型表面活性剂,例如Tween-80;佐剂包括但不限于铝佐剂(例如氢氧化铝),弗氏佐剂(例如完全弗氏佐剂);离子强度增强剂包括但不限于氯化钠。
如本文中所使用的,术语“有效量”是指足以获得或至少部分获得期望的效果的量。例如,预防疾病有效量是指,足以预防,阻止,或延迟疾病的发生的量;治疗疾病有效量是指,足以治愈或至少部分阻止已患有疾病的患者的疾病和其并发症的量。测定这样的有效量完全在本领域技术人员的能力范围之内。例如,对于治疗用途有效的量将取决于待治疗的疾病的严重度、患者自己的免疫系统的总体状态、患者的一般情况例如年龄,体重和性别,药物的施用方式,以及同时施用的其他治疗等等。
为了克服现有用于肿瘤治疗的重组HSV病毒的安全性及毒副反应问题,本申请的发明人构建了一种新的重组HSV病毒,其不表达功能性ICP0和ICP34.5蛋白(例如缺失了双拷贝ICP0和ICP34.5基因)。本发明的重组HSV病毒在肿瘤细胞中具有高水平的复制能力,并且能够有效杀伤多种肿瘤细胞,但是在正常细胞中却具有显著降低的复制能力和杀伤能力。此外,还已发现,本发明的重组HSV病毒在动物体内具有显著降低的神经毒性,可以以显著提高的剂量施用给动物。因此,与现有的重组HSV病毒相比,本发明的重组HSV病毒不仅维持了高溶瘤能力,而且具有显著提高的安全性,能够以更高的剂量施用,具有广阔的应用前景。
重组HSV病毒
因此,在一个方面,本发明提供了一种重组HSV病毒,其不表达功能性ICP0蛋白和ICP34.5蛋白。
如本领域技术人员所熟知的,可通过对编码目的蛋白(例如ICP0蛋白和/或ICP34.5蛋白)的基因进行改造来阻止所述目的蛋白的功能性表达。例如,可在编码目的蛋白(例如ICP0蛋白和/或ICP34.5蛋白)的基因中引入功能丧失性突变,或者将编码目的蛋白(例如ICP0蛋白和/或ICP34.5蛋白)的基因缺失或置换成外源核苷酸序列(例如,编码外源蛋白的核苷酸序列),从而阻止所述目的蛋白的功能性表达。
本领域技术人员已经知晓,HSV病毒的基因组中包含2个拷贝的ICP0基因和2个拷贝的ICP34.5基因。因此,为了阻止ICP0蛋白和ICP34.5蛋白在重组HSV病毒中的功能性表达,需要对2个拷贝的ICP0基因和2个拷贝的ICP34.5基因同时进行改造。然而,易于理解的是,对所述2个拷贝的ICP0基因和2个拷贝的ICP34.5基因(4个核苷酸区段)的改造是彼此独立的,并且可以是相同的或不同的。
因此,在某些优选的实施方案中,所述重组HSV病毒具有这样的基因组,其中,
2个拷贝的ICP0基因各自独立地包含功能丧失性突变(例如,一个或多个碱基的添加、缺失和/或置换)或者被缺失或者被置换为外源核苷酸序列(例如,编码外源蛋白的核苷酸序列);并且,
2个拷贝的ICP34.5基因各自独立地包含功能丧失性突变(例如,一个或多个碱基的添加、缺失和/或置换)或者被缺失或者被置换为外源核苷酸序列(例如,编码外源蛋白的核苷酸序列)。
在某些优选的实施方案中,所述重组HSV病毒的基因组包含下述修饰:
2个拷贝的ICP0基因各自独立地包含功能丧失性突变(例如,一个或多个碱基的添加、缺失和/或置换)或者被缺失或者被置换为外源核苷酸序列(例如,编码外源蛋白的核苷酸序列);并且,
2个拷贝的ICP34.5基因各自独立地包含功能丧失性突变(例如,一个或多个碱基的添加、缺失和/或置换)或者被缺失或者被置换为外源核苷酸序列(例如,编码外源蛋白的核苷酸序列)。
在某些优选的实施方案中,一个拷贝的ICP0基因包含功能丧失性突变(例如一个或多个碱基的添加、缺失和/或置换),并且另一个拷贝的ICP0基因包含功能丧失性突变(例如,一个或多个碱基的添加、缺失和/或置换)或者被缺失或者被置换为外源核苷酸序列(例如,编码外源蛋白的核苷酸序列)。在某些优选的实施方案中,一个拷贝的ICP0基因被缺失,并且另一个拷贝的ICP0基因包含功能丧失性突变(例如,一个或多个碱基的添加、缺失和/或置换)或者被缺失或者被置换为外源核苷酸序列(例如,编码外源蛋白的核苷酸序列)。在某些优选的实施方案中,一个拷贝的ICP0基因被置换为外源核苷酸序列(例如,编码外源蛋白的核苷酸序列),并且另一个拷贝的ICP0基因包含功能丧失性突变(例如,一个或多个碱基的添加、缺失和/或置换)或者被缺失或者被置换为外源核苷酸序列(例如,编码外源蛋白的核苷酸序列)。
在某些优选的实施方案中,所述2个拷贝的ICP0基因各自独立地包含功能丧失性突变(例如一个或多个碱基的添加、缺失和/或置换)。在某些优选的实施方案中,所述2个拷贝的ICP0基因包含相同的功能丧失性突变。在某些优选的实施方案中,所述2个拷贝的ICP0基因包含不同的功能丧失性突变。例如,在某些优选的实施方案中,第一拷贝的ICP0基因包含第一功能丧失性突变,而第二拷贝的ICP0基因包含第二功能丧失性突变。所述第一功能丧失性突变与第二功能丧失性突变可以相同或者不同。
在某些优选的实施方案中,所述2个拷贝的ICP0基因被缺失。
在某些优选的实施方案中,所述2个拷贝的ICP0基因各自独立地被置换为外源核苷酸序列(例如,编码外源蛋白的核苷酸序列)。在某些优选的实施方案中,所述2个拷贝的ICP0基因被置换为相同的外源核苷酸序列(例如,编码外源蛋白的核苷酸序列)。在某些优选的实施方案中,所述2个拷贝的ICP0基因被置换为不同的外源核苷酸序列(例如,编码外源蛋白的核苷酸序列)。例如,在某些优选的实施方案中,第一拷贝的ICP0基因被置换为第一外源核苷酸序列,而第二拷贝的ICP0基因被置换为第二外源核苷酸序列。所述第一外源核苷酸序列与第二外源核苷酸序列可以相同或者不同。
在某些优选的实施方案中,一个拷贝的ICP34.5基因包含功能丧失性突变(例如一个或多个碱基的添加、缺失和/或置换),并且另一个拷贝的ICP34.5基因包含功能丧失性突变(例如,一个或多个碱基的添加、缺失和/或置换)或者被缺失或者被置换为外源核苷酸序列(例如,编码外源蛋白的核苷酸序列)。在某些优选的实施方案中,一个拷贝的ICP34.5基因被缺失,并且另一个拷贝的ICP34.5基因包含功能丧失性突变(例如,一个或多个碱基的添加、缺失和/或置换)或者被缺失或者被置换为外源核苷酸序列(例如,编码外源蛋白的核苷酸序列)。在某些优选的实施方案中,一个拷贝的ICP34.5基因被置换为外源核苷酸序列(例如,编码外源蛋白的核苷酸序列),并且另一个拷贝的ICP34.5基因包含功能丧失性突变(例如,一个或多个碱基的添加、缺失和/或置换)或者被缺失或者被置换为外源核苷酸序列(例如,编码外源蛋白的核苷酸序列)。
在某些优选的实施方案中,所述2个拷贝的ICP34.5基因各自独立地包含功能丧失性突变(例如一个或多个碱基的添加、缺失和/或置换)。在某些优选的实施方案中,所述2个拷贝的ICP34.5基因包含相同的功能丧失性突变。在某些优选的实施方案中,所述2个拷贝的ICP34.5基因包含不同的功能丧失性突变。例如,在某些优选的实施方案中,第一拷贝的ICP34.5基因包含第三功能丧失性突变,而第二拷贝的ICP34.5基因包含第四功能丧失性突变。所述第三功能丧失性突变与第四功能丧失性突变可以相同或者不同。
在某些优选的实施方案中,所述2个拷贝的ICP34.5基因被缺失。
在某些优选的实施方案中,所述2个拷贝的ICP34.5基因各自独立地被置换为外源核苷酸序列(例如,编码外源蛋白的核苷酸序列)。在某些优选的实施方案中,所述2个拷贝的ICP34.5基因被置换为相同的外源核苷酸序列(例如,编码外源蛋白的核苷酸序列)。在某些优选的实施方案中,所述2个拷贝的ICP34.5基因被置换为不同的外源核苷酸序列(例如,编码外源蛋白的核苷酸序列)。例如,在某些优选的实施方案中,第一拷贝的ICP34.5基因被置换为第三外源核苷酸序列,而第二拷贝的ICP34.5基因被置换为第四外源核苷酸序列。所述第三外源核苷酸序列与第四外源核苷酸序列可以相同或者不同。
在某些优选的实施方案中,所述2个拷贝的ICP0基因各自独立地包含功能丧失性突变(例如一个或多个碱基的添加、缺失和/或置换),并且,所述2个拷贝的ICP34.5基因各自独立地包含功能丧失性突变(例如一个或多个碱基的添加、缺失和/或置换)。例如,在某些优选的实施方案中,第一拷贝的ICP0基因包含第一功能丧失性突变,第二拷贝的ICP0基因包含第二功能丧失性突变;并且,第一拷贝的ICP34.5基因包含第三功能丧失性突变,第二拷贝的ICP34.5基因包含第四功能丧失性突变。所述第一功能丧失性突变、第二功能丧失性突变、第三功能丧失性突变和第四功能丧失性突变可以相同或者不同。
在某些优选的实施方案中,所述2个拷贝的ICP0基因各自独立地包含功能丧失性突变(例如一个或多个碱基的添加、缺失和/或置换),并且,所述2个拷贝的ICP34.5基因被缺失。例如,在某些优选的实施方案中,第一拷贝的ICP0基因包含第一功能丧失性突变,第二拷贝的ICP0基因包含第二功能丧失性突变;并且,所述2个拷贝的ICP34.5基因被缺失。所述第一功能丧失性突变和第二功能丧失性突变可以相同或者不同。
在某些优选的实施方案中,所述2个拷贝的ICP0基因各自独立地包含功能丧失性突变(例如一个或多个碱基的添加、缺失和/或置换),并且,所述2个拷贝的ICP34.5基因各自独立地被置换为外源核苷酸序列(例如,编码外源蛋白的核苷酸序列)。例如,在某些优选的实施方案中,第一拷贝的ICP0基因包含第一功能丧失性突变,第二拷贝的ICP0基因包含第二功能丧失性突变;并且,第一拷贝的ICP34.5基因被置换为第三外源核苷酸序列,第二拷贝的ICP34.5基因被置换为第四外源核苷酸序列。所述第一功能丧失性突变和第二功能丧失性突变可以相同或者不同。所述第三外源核苷酸序列与第四外源核苷酸序列可以相同或者不同。
在某些优选的实施方案中,所述2个拷贝的ICP0基因被缺失;并且,所述2个拷贝的ICP34.5基因各自独立地包含功能丧失性突变(例如一个或多个碱基的添加、缺失和/或置换)。例如,在某些优选的实施方案中,所述2个拷贝的ICP0基因被缺失;并且,第一拷贝的ICP34.5基因包含第三功能丧失性突变,第二拷贝的ICP34.5基因包含第四功能丧失性突变。所述第三功能丧失性突变和第四功能丧失性突变可以相同或者不同。
在某些优选的实施方案中,所述2个拷贝的ICP0基因被缺失;并且,所述2个拷贝的ICP34.5基因被缺失。在此类实施方案中,所述重组HSV病毒不表达ICP0蛋白和ICP34.5蛋白。在某些优选的实施方案中,所述重组HSV病毒的基因组缺失了野生型HSV-1病毒基因组的nt510至nt5439之间的碱基序列以及nt120802至nt125731之间的碱基序列。
在某些优选的实施方案中,所述2个拷贝的ICP0基因被缺失;并且,所述2个拷贝的ICP34.5基因各自独立地被置换为外源核苷酸序列(例如,编码外源蛋白的核苷酸序列)。例如,在某些优选的实施方案中,所述2个拷贝的ICP0基因被缺失;并且,第一拷贝的ICP34.5基因被置换为第三外源核苷酸序列,第二拷贝的ICP34.5基因被置换为第四外源核苷酸序列。所述第三外源核苷酸序列与第四外源核苷酸序列可以相同或者不同。
在某些优选的实施方案中,所述2个拷贝的ICP0基因各自独立地被置换为外源核苷酸序列(例如,编码外源蛋白的核苷酸序列),并且,所述2个拷贝的ICP34.5基因各自独立地包含功能丧失性突变(例如一个或多个碱基的添加、缺失和/或置换)。例如,在某些优选的实施方案中,第一拷贝的ICP0基因被置换为第一外源核苷酸序列,第二拷贝的ICP0基因被置换为第二外源核苷酸序列;并且,第一拷贝的ICP34.5基因包含第三功能丧失性突变,第二拷贝的ICP34.5基因包含第四功能丧失性突变。所述第一外源核苷酸序列与第二外源核苷酸序列可以相同或者不同。所述第三功能丧失性突变和第四功能丧失性突变可以相同或者不同。
在某些优选的实施方案中,所述2个拷贝的ICP0基因各自独立地被置换为外源核苷酸序列(例如,编码外源蛋白的核苷酸序列),并且,所述2个拷贝的ICP34.5基因被缺失。例如,在某些优选的实施方案中,第一拷贝的ICP0基因被置换为第一外源核苷酸序列,而第二拷贝的ICP0基因被置换为第二外源核苷酸序列;并且,所述2个拷贝的ICP34.5基因被缺失。所述第一外源核苷酸序列与第二外源核苷酸序列可以相同或者不同。
在某些优选的实施方案中,所述2个拷贝的ICP0基因各自独立地被置换为外源核苷酸序列(例如,编码外源蛋白的核苷酸序列),并且,所述2个拷贝的ICP34.5基因各自独立地被置换为外源核苷酸序列(例如,编码外源蛋白的核苷酸序列)。例如,在某些优选的实施方案中,第一拷贝的ICP0基因被置换为第一外源核苷酸序列,第二拷贝的ICP0基因被置换为第二外源核苷酸序列;并且,第一拷贝的ICP34.5基因被置换为第三外源核苷酸序列,第二拷贝的ICP34.5基因被置换为第四外源核苷酸序列。所述第一外源核苷酸序列、第二外源核苷酸序列、第三外源核苷酸序列和第四外源核苷酸序列可以相同或者不同。
在某些优选的实施方案中,所述第一功能丧失性突变、第二功能丧失性突变、第三功能丧失性突变和第四功能丧失性突变各自独立地选自错义突变、无义突变、移码突变、碱基缺失、碱基置换、碱基添加、以及其任何组合(例如,基因片段的缺失或置换或添加)。
在某些优选的实施方案中,所述第一外源核苷酸序列、第二外源核苷酸序列、第三外源核苷酸序列和第四外源核苷酸序列各自独立地编码选自下列的外源蛋白:荧光蛋白、免疫调节多肽、细胞因子、趋化因子、抗体和细胞毒性肽。
在某些优选的实施方案中,所述荧光蛋白选自绿色荧光蛋白(例如,具有如SEQ IDNO:7所示氨基酸序列的绿色荧光蛋白),红色荧光蛋白,蓝色荧光蛋白,黄色荧光蛋白,及其任何组合。
在某些优选的实施方案中,所述免疫调节多肽选自CD40L、OX40L、可诱导共刺激分子(ICOS)、FTL3L、LIGHT、CD137L、CD70、4-1BB、GITR、CD28,及其任何组合。
在某些优选的实施方案中,所述细胞因子选自白介素(例如IL-2、IL-12和IL-15)、干扰素(例如IFNα、IFNβ、IFNγ)、肿瘤坏死因子(例如TNFα)、集落刺激因子(例如GM-CSF),及其任何组合。
在某些优选的实施方案中,所述趋化因子选自CCL2、RANTES、CCL7、CCL9、CCL10、CCL12、CCL15、CCL19、CCL21、CCL20、XCL-1,及其任何组合。
在某些优选的实施方案中,所述细胞毒性肽选自胸苷激酶TK(TK/GCV)、TRAIL、FasL,及其任何组合。
在某些优选的实施方案中,所述抗体选自抗PD-1抗体、抗PD-L1抗体、抗TIGIT抗体、抗BTLA抗体、抗CTLA-4抗体、抗Tim-3抗体、抗Lag-3抗体、抗CD137抗体、抗OX40抗体、抗GITR抗体、抗CD73抗体、抗KIR抗体、抗ICOS抗体、抗CSF1R抗体、抗EGFR抗体、抗VEGFR抗体、抗HER2抗体、抗PDGFR抗体,及其任何组合。
近五年来,针对PD-1的抗体药物已经在临床上取得巨大成功,相继被FDA批准用于治疗黑色素瘤、肺癌等实体瘤病人。然而临床研究表明,抗PD-1抗体仅对30%左右的实体瘤病人有效。这可能是因为T细胞难以渗透至实体肿瘤内部,不能与抗PD-1抗体一起作用于实体肿瘤内部的肿瘤细胞。不拘于理论限制,溶瘤型HSV病毒不仅能够直接靶向并杀死肿瘤细胞,而且还能够诱导免疫细胞(例如T细胞)浸润肿瘤。因此,本发明的重组HSV病毒与抗PD-1抗体的组合使用对于提高肿瘤治疗的效果可能是特别有利的,在肿瘤免疫治疗中有着巨大的应用前景。因此,在某些优选的实施方案中,所述外源蛋白为抗PD-L1抗体、抗PD-1抗体或其任何组合。例如,所述外源蛋白为抗PD-1单链抗体。
在某些优选的实施方案中,所述重组HSV病毒为重组HSV-1病毒,重组HSV-2病毒,或HSV-1/HSV-2嵌合病毒(即,其基因组既含有来源于HSV-1的DNA,又含有来源于HSV-2的DNA的重组HSV病毒)。在某些优选的实施方案中,所述重组HSV病毒衍生自HSV-1病毒株KOS。
在某些优选的实施方案中,所述重组HSV病毒能够表达功能性UL43蛋白,功能性UL41蛋白(即,vhs蛋白),功能性UL48蛋白(即,VMW65蛋白),或其任何组合。在某些优选的实施方案中,所述重组HSV病毒能够表达功能性UL43蛋白。在某些优选的实施方案中,所述重组HSV病毒能够表达功能性UL41蛋白。在某些优选的实施方案中,所述重组HSV病毒能够表达功能性UL48蛋白。在某些优选的实施方案中,所述重组HSV病毒能够表达功能性UL43蛋白和功能性UL41蛋白。在某些优选的实施方案中,所述重组HSV病毒能够表达功能性UL43蛋白和功能性UL48蛋白。在某些优选的实施方案中,所述重组HSV病毒能够表达功能性UL41蛋白和功能性UL48蛋白。在某些优选的实施方案中,所述重组HSV病毒能够表达功能性UL43蛋白,功能性UL41蛋白和功能性UL48蛋白。
在某些优选的实施方案中,所述重组HSV病毒的基因组包含能够表达功能性UL43蛋白的UL43基因,能够表达功能性UL41蛋白的UL41基因(即,vhs基因),和/或,能够表达功能性UL48蛋白的UL48基因(即,VMW65基因)。在某些优选的实施方案中,所述重组HSV病毒的基因组包含能够表达功能性UL43蛋白的UL43基因。在某些优选的实施方案中,所述重组HSV病毒的基因组包含能够表达功能性UL41蛋白的UL41基因。在某些优选的实施方案中,所述重组HSV病毒的基因组包含能够表达功能性UL48蛋白的UL48基因。在某些优选的实施方案中,所述重组HSV病毒的基因组包含能够表达功能性UL43蛋白的UL43基因,和能够表达功能性UL41蛋白的UL41基因。在某些优选的实施方案中,所述重组HSV病毒的基因组包含能够表达功能性UL43蛋白的UL43基因,和能够表达功能性UL48蛋白的UL48基因。在某些优选的实施方案中,所述重组HSV病毒的基因组包含能够表达功能性UL41蛋白的UL41基因,和能够表达功能性UL48蛋白的UL48基因。在某些优选的实施方案中,所述重组HSV病毒的基因组包含能够表达功能性UL43蛋白的UL43基因,能够表达功能性UL41蛋白的UL41基因,和能够表达功能性UL48蛋白的UL48基因。
在某些优选的实施方案中,所述重组HSV病毒的基因组含有UL43基因,UL41基因(即,vhs基因),和/或UL48基因(即,VMW65基因),并且所述UL43基因,UL41基因,和/或UL48基因不包含功能丧失性突变。在某些优选的实施方案中,所述重组HSV病毒的基因组含有,不包含功能丧失性突变的UL43基因。在某些优选的实施方案中,所述重组HSV病毒的基因组含有,不包含功能丧失性突变的UL41基因。在某些优选的实施方案中,所述重组HSV病毒的基因组含有,不包含功能丧失性突变的UL48基因。在某些优选的实施方案中,所述重组HSV病毒的基因组含有,不包含功能丧失性突变的UL43基因和UL41基因。在某些优选的实施方案中,所述重组HSV病毒的基因组含有,不包含功能丧失性突变的UL43基因和UL48基因。在某些优选的实施方案中,所述重组HSV病毒的基因组含有,不包含功能丧失性突变的UL41基因和UL48基因。在某些优选的实施方案中,所述重组HSV病毒的基因组含有,不包含功能丧失性突变的UL43基因、UL41基因和UL48基因。
在某些优选的实施方案中,所述重组HSV病毒的基因组还包含下述修饰:一个或多个非必需基因被缺失或突变(例如包含功能丧失性突变,或者被置换为外源核苷酸序列)。在某些优选的实施方案中,所述非必需基因选自UL3基因,UL4基因,UL14基因,UL16基因,UL21基因,UL24基因,UL31基因,UL32基因,US3基因,UL51基因,UL55基因,UL56基因,US2基因,US12基因(即,ICP47基因),LAT基因,对应于JQ673480.1的nt5853-nt7485的核苷酸片段,及其任何组合。在某些优选的实施方案中,在所述重组HSV病毒的基因组中,UL3基因被缺失或突变(例如包含功能丧失性突变,或者被置换为外源核苷酸序列)。在某些优选的实施方案中,在所述重组HSV病毒的基因组中,UL4基因被缺失或突变(例如包含功能丧失性突变,或者被置换为外源核苷酸序列)。在某些优选的实施方案中,在所述重组HSV病毒的基因组中,UL14基因被缺失或突变(例如包含功能丧失性突变,或者被置换为外源核苷酸序列)。在某些优选的实施方案中,在所述重组HSV病毒的基因组中,UL16基因被缺失或突变(例如包含功能丧失性突变,或者被置换为外源核苷酸序列)。在某些优选的实施方案中,在所述重组HSV病毒的基因组中,UL21基因被缺失或突变(例如包含功能丧失性突变,或者被置换为外源核苷酸序列)。在某些优选的实施方案中,在所述重组HSV病毒的基因组中,UL24基因被缺失或突变(例如包含功能丧失性突变,或者被置换为外源核苷酸序列)。在某些优选的实施方案中,在所述重组HSV病毒的基因组中,UL31基因被缺失或突变(例如包含功能丧失性突变,或者被置换为外源核苷酸序列)。在某些优选的实施方案中,在所述重组HSV病毒的基因组中,UL32基因被缺失或突变(例如包含功能丧失性突变,或者被置换为外源核苷酸序列)。在某些优选的实施方案中,在所述重组HSV病毒的基因组中,US3基因被缺失或突变(例如包含功能丧失性突变,或者被置换为外源核苷酸序列)。在某些优选的实施方案中,在所述重组HSV病毒的基因组中,UL51基因被缺失或突变(例如包含功能丧失性突变,或者被置换为外源核苷酸序列)。在某些优选的实施方案中,在所述重组HSV病毒的基因组中,UL55基因被缺失或突变(例如包含功能丧失性突变,或者被置换为外源核苷酸序列)。在某些优选的实施方案中,在所述重组HSV病毒的基因组中,UL56基因被缺失或突变(例如包含功能丧失性突变,或者被置换为外源核苷酸序列)。在某些优选的实施方案中,在所述重组HSV病毒的基因组中,US2基因被缺失或突变(例如包含功能丧失性突变,或者被置换为外源核苷酸序列)。在某些优选的实施方案中,在所述重组HSV病毒的基因组中,US12基因被缺失或突变(例如包含功能丧失性突变,或者被置换为外源核苷酸序列)。在某些优选的实施方案中,在所述重组HSV病毒的基因组中,LAT基因被缺失或突变(例如包含功能丧失性突变,或者被置换为外源核苷酸序列)。在某些优选的实施方案中,在所述重组HSV病毒的基因组中,对应于JQ673480.1的nt5853-nt7485的核苷酸片段被缺失或突变(例如包含功能丧失性突变,或者被置换为外源核苷酸序列)。
在某些优选的实施方案中,所述重组HSV病毒的基因组还包含下述修饰:UL55基因、US2基因、LAT基因和对应于JQ673480.1的nt5853-nt7485的核苷酸片段中的一个或多个被缺失或突变(例如包含功能丧失性突变,或者被置换为外源核苷酸序列)。在某些优选的实施方案中,所述重组HSV病毒的基因组还包含下述修饰:UL55基因、US2基因、LAT基因或对应于JQ673480.1的nt5853-nt7485的核苷酸片段被缺失或突变(例如包含功能丧失性突变,或者被置换为外源核苷酸序列)。
在某些优选的实施方案中,所述重组HSV病毒的必需基因未被缺失,且不包含功能丧失性突变。在某些优选的实施方案中,所述重组HSV病毒的必需基因的编码序列未被缺失或突变。在某些优选的实施方案中,所述重组HSV病毒能够表达所有必需基因。在某些优选的实施方案中,所述重组HSV病毒的基因组含有所有必需基因,并且,所有必需基因均不包含功能丧失性突变。在某些优选的实施方案中,所述重组HSV病毒的基因组含有所有必需基因,并且,所有必需基因的编码序列均不包含突变。必需基因是HSV病毒生存和复制所不可或缺的,因此,通常而言,在重组HSV病毒中,所有必需基因均不包含功能丧失性突变。然而,易于理解的是,可以对此类必需基因的启动子进行改造(例如,将必需基因的原生启动子被替换为肿瘤特异性启动子,例如hTERT的启动子),从而可进一步提高重组HSV病毒的安全性,而不影响本发明的重组HSV病毒的功能/性质。因此,在某些优选的实施方案中,在所述重组HSV病毒的基因组中,一个或多个必需基因的原生启动子被替换为肿瘤特异性启动子,例如hTERT的启动子。在某些优选的实施方案中,所述必需基因选自ICP27基因、ICP4基因、VP5基因、gL基因、gH基因、gD基因、gK基因、gB基因、gN基因、UL5基因、UL6基因、UL8基因、UL9基因、UL12基因、UL25基因、UL26基因、UL28基因、UL29基因、UL30基因、UL33基因、UL36基因、UL38基因、UL42基因、UL48基因、UL52基因,以及其任何组合。
在某些优选的实施方案中,除了如上所述的2个拷贝的ICP0基因和2个拷贝的ICP34.5基因之外,所述重组HSV病毒的基因组含有野生型HSV病毒的所有其他基因,并且所述其他基因均不包含功能丧失性突变。然而,易于理解的是,可以对所述其他基因的启动子进行改造(例如,将原生启动子被替换为肿瘤特异性启动子,例如hTERT的启动子),从而可进一步提高重组HSV病毒的安全性,而不影响本发明的重组HSV病毒的功能/性质。因此,在某些优选的实施方案中,所述重组HSV病毒的基因组还包含下述修饰:一个或多个HSV基因的原生启动子被替换为肿瘤特异性启动子,例如hTERT的启动子。在某些优选的实施方案中,所述HSV基因选自VP5基因、ICP27基因和ICP4基因。
在某些优选的实施方案中,所述重组HSV病毒的基因组还包含有选自下述的一项或多项修饰:
(1)VP5基因的原生启动子被替换为肿瘤特异性启动子,例如hTERT的启动子;
(2)ICP27基因的原生启动子被替换为肿瘤特异性启动子,例如hTERT的启动子;
(3)ICP4基因的原生启动子被替换为肿瘤特异性启动子,如hTERT的启动子;和
(4)UL55基因、US2基因、LAT基因和对应于JQ673480.1的nt5853-nt7485的核苷酸片段中的一个或多个被缺失或突变(例如包含功能丧失性突变,或者被置换为外源核苷酸序列)。
在某些优选的实施方案中,所述hTERT启动子具有如SEQ ID NO:5所示的序列。
此外,还可修饰本发明的重组HSV病毒,以携带一个或多个外源核苷酸序列。例如,在某些优选的实施方案中,所述重组HSV病毒的基因组还包含第五外源核苷酸序列。在某些优选的实施方案中,所述第五外源核苷酸序列编码选自下列的外源蛋白:荧光蛋白、免疫调节多肽、细胞因子、趋化因子、抗体和细胞毒性肽。
在本申请中,可以通过本领域内众所周知的技术,在所提到的各种病毒基因中引入功能丧失性突变。例如,可以通过碱基的缺失、置换或插入,在病毒基因中引入功能丧失性突变,使病毒基因在功能上失活。在某些示例性实施方案中,通过缺失(例如缺失整个基因或其部分),使病毒基因在功能上失活。在此类实施方案中,可缺失目的病毒基因序列的至少25%,至少50%,至少75%,或100%,或者可缺失至少10bp,至少100bp,或至少1000bp的目的病毒基因序列。在某些示例性实施方案中,通过碱基的插入或缺失造成移码突变,从而使病毒基因在功能上失活。在某些示例性实施方案中,通过将整个目的基因或其部分置换为外源核苷酸序列,使病毒基因在功能上失活。
病毒载体
在另一方面,本发明提供了一种病毒载体,其包含根据本发明的重组HSV病毒的基因组或者由根据本发明的重组HSV病毒的基因组组成。
在另一方面,本发明提供了一种病毒载体,其包含或者由不表达功能性功能性ICP0蛋白和ICP34.5蛋白的经突变的HSV基因组组成。
在某些优选的实施方案中,在所述经突变的HSV基因组中,
2个拷贝的ICP0基因各自独立地包含功能丧失性突变(例如,一个或多个碱基的添加、缺失和/或置换)或者被缺失或者被置换为外源核苷酸序列(例如,编码外源蛋白的核苷酸序列);并且,
2个拷贝的ICP34.5基因各自独立地包含功能丧失性突变(例如,一个或多个碱基的添加、缺失和/或置换)或者被缺失或者被置换为外源核苷酸序列(例如,编码外源蛋白的核苷酸序列)。
在某些优选的实施方案中,所述经突变的HSV基因组包含下述修饰:
2个拷贝的ICP0基因各自独立地包含功能丧失性突变(例如,一个或多个碱基的添加、缺失和/或置换)或者被缺失或者被置换为外源核苷酸序列(例如,编码外源蛋白的核苷酸序列);并且,
2个拷贝的ICP34.5基因各自独立地包含功能丧失性突变(例如,一个或多个碱基的添加、缺失和/或置换)或者被缺失或者被置换为外源核苷酸序列(例如,编码外源蛋白的核苷酸序列)。
在某些优选的实施方案中,一个拷贝的ICP0基因包含功能丧失性突变(例如一个或多个碱基的添加、缺失和/或置换),并且另一个拷贝的ICP0基因包含功能丧失性突变(例如,一个或多个碱基的添加、缺失和/或置换)或者被缺失或者被置换为外源核苷酸序列(例如,编码外源蛋白的核苷酸序列)。在某些优选的实施方案中,一个拷贝的ICP0基因被缺失,并且另一个拷贝的ICP0基因包含功能丧失性突变(例如,一个或多个碱基的添加、缺失和/或置换)或者被缺失或者被置换为外源核苷酸序列(例如,编码外源蛋白的核苷酸序列)。在某些优选的实施方案中,一个拷贝的ICP0基因被置换为外源核苷酸序列(例如,编码外源蛋白的核苷酸序列),并且另一个拷贝的ICP0基因包含功能丧失性突变(例如,一个或多个碱基的添加、缺失和/或置换)或者被缺失或者被置换为外源核苷酸序列(例如,编码外源蛋白的核苷酸序列)。
在某些优选的实施方案中,所述2个拷贝的ICP0基因各自独立地包含功能丧失性突变(例如一个或多个碱基的添加、缺失和/或置换)。在某些优选的实施方案中,所述2个拷贝的ICP0基因包含相同的功能丧失性突变。在某些优选的实施方案中,所述2个拷贝的ICP0基因包含不同的功能丧失性突变。例如,在某些优选的实施方案中,第一拷贝的ICP0基因包含第一功能丧失性突变,而第二拷贝的ICP0基因包含第二功能丧失性突变。所述第一功能丧失性突变与第二功能丧失性突变可以相同或者不同。
在某些优选的实施方案中,所述2个拷贝的ICP0基因被缺失。
在某些优选的实施方案中,所述2个拷贝的ICP0基因各自独立地被置换为外源核苷酸序列(例如,编码外源蛋白的核苷酸序列)。在某些优选的实施方案中,所述2个拷贝的ICP0基因被置换为相同的外源核苷酸序列(例如,编码外源蛋白的核苷酸序列)。在某些优选的实施方案中,所述2个拷贝的ICP0基因被置换为不同的外源核苷酸序列(例如,编码外源蛋白的核苷酸序列)。例如,在某些优选的实施方案中,第一拷贝的ICP0基因被置换为第一外源核苷酸序列,而第二拷贝的ICP0基因被置换为第二外源核苷酸序列。所述第一外源核苷酸序列与第二外源核苷酸序列可以相同或者不同。
在某些优选的实施方案中,一个拷贝的ICP34.5基因包含功能丧失性突变(例如一个或多个碱基的添加、缺失和/或置换),并且另一个拷贝的ICP34.5基因包含功能丧失性突变(例如,一个或多个碱基的添加、缺失和/或置换)或者被缺失或者被置换为外源核苷酸序列(例如,编码外源蛋白的核苷酸序列)。在某些优选的实施方案中,一个拷贝的ICP34.5基因被缺失,并且另一个拷贝的ICP34.5基因包含功能丧失性突变(例如,一个或多个碱基的添加、缺失和/或置换)或者被缺失或者被置换为外源核苷酸序列(例如,编码外源蛋白的核苷酸序列)。在某些优选的实施方案中,一个拷贝的ICP34.5基因被置换为外源核苷酸序列(例如,编码外源蛋白的核苷酸序列),并且另一个拷贝的ICP34.5基因包含功能丧失性突变(例如,一个或多个碱基的添加、缺失和/或置换)或者被缺失或者被置换为外源核苷酸序列(例如,编码外源蛋白的核苷酸序列)。
在某些优选的实施方案中,所述2个拷贝的ICP34.5基因各自独立地包含功能丧失性突变(例如一个或多个碱基的添加、缺失和/或置换)。在某些优选的实施方案中,所述2个拷贝的ICP34.5基因包含相同的功能丧失性突变。在某些优选的实施方案中,所述2个拷贝的ICP34.5基因包含不同的功能丧失性突变。例如,在某些优选的实施方案中,第一拷贝的ICP34.5基因包含第三功能丧失性突变,而第二拷贝的ICP34.5基因包含第四功能丧失性突变。所述第三功能丧失性突变与第四功能丧失性突变可以相同或者不同。
在某些优选的实施方案中,所述2个拷贝的ICP34.5基因被缺失。
在某些优选的实施方案中,所述2个拷贝的ICP34.5基因各自独立地被置换为外源核苷酸序列(例如,编码外源蛋白的核苷酸序列)。在某些优选的实施方案中,所述2个拷贝的ICP34.5基因被置换为相同的外源核苷酸序列(例如,编码外源蛋白的核苷酸序列)。在某些优选的实施方案中,所述2个拷贝的ICP34.5基因被置换为不同的外源核苷酸序列(例如,编码外源蛋白的核苷酸序列)。例如,在某些优选的实施方案中,第一拷贝的ICP34.5基因被置换为第三外源核苷酸序列,而第二拷贝的ICP34.5基因被置换为第四外源核苷酸序列。所述第三外源核苷酸序列与第四外源核苷酸序列可以相同或者不同。
在某些优选的实施方案中,所述2个拷贝的ICP0基因各自独立地包含功能丧失性突变(例如一个或多个碱基的添加、缺失和/或置换),并且,所述2个拷贝的ICP34.5基因各自独立地包含功能丧失性突变(例如一个或多个碱基的添加、缺失和/或置换)。例如,在某些优选的实施方案中,第一拷贝的ICP0基因包含第一功能丧失性突变,第二拷贝的ICP0基因包含第二功能丧失性突变;并且,第一拷贝的ICP34.5基因包含第三功能丧失性突变,第二拷贝的ICP34.5基因包含第四功能丧失性突变。所述第一功能丧失性突变、第二功能丧失性突变、第三功能丧失性突变和第四功能丧失性突变可以相同或者不同。
在某些优选的实施方案中,所述2个拷贝的ICP0基因各自独立地包含功能丧失性突变(例如一个或多个碱基的添加、缺失和/或置换),并且,所述2个拷贝的ICP34.5基因被缺失。例如,在某些优选的实施方案中,第一拷贝的ICP0基因包含第一功能丧失性突变,第二拷贝的ICP0基因包含第二功能丧失性突变;并且,所述2个拷贝的ICP34.5基因被缺失。所述第一功能丧失性突变和第二功能丧失性突变可以相同或者不同。
在某些优选的实施方案中,所述2个拷贝的ICP0基因各自独立地包含功能丧失性突变(例如一个或多个碱基的添加、缺失和/或置换),并且,所述2个拷贝的ICP34.5基因各自独立地被置换为外源核苷酸序列(例如,编码外源蛋白的核苷酸序列)。例如,在某些优选的实施方案中,第一拷贝的ICP0基因包含第一功能丧失性突变,第二拷贝的ICP0基因包含第二功能丧失性突变;并且,第一拷贝的ICP34.5基因被置换为第三外源核苷酸序列,第二拷贝的ICP34.5基因被置换为第四外源核苷酸序列。所述第一功能丧失性突变和第二功能丧失性突变可以相同或者不同。所述第三外源核苷酸序列与第四外源核苷酸序列可以相同或者不同。
在某些优选的实施方案中,所述2个拷贝的ICP0基因被缺失;并且,所述2个拷贝的ICP34.5基因各自独立地包含功能丧失性突变(例如一个或多个碱基的添加、缺失和/或置换)。例如,在某些优选的实施方案中,所述2个拷贝的ICP0基因被缺失;并且,第一拷贝的ICP34.5基因包含第三功能丧失性突变,第二拷贝的ICP34.5基因包含第四功能丧失性突变。所述第三功能丧失性突变和第四功能丧失性突变可以相同或者不同。
在某些优选的实施方案中,所述2个拷贝的ICP0基因被缺失;并且,所述2个拷贝的ICP34.5基因被缺失。在此类实施方案中,所述病毒载体不包含编码ICP0蛋白的基因和编码ICP34.5蛋白的基因。在某些优选的实施方案中,所述经突变的HSV基因组缺失了野生型HSV-1病毒基因组的nt510至nt5439之间的碱基序列以及nt120802至nt125731之间的碱基序列。
在某些优选的实施方案中,所述2个拷贝的ICP0基因被缺失;并且,所述2个拷贝的ICP34.5基因各自独立地被置换为外源核苷酸序列(例如,编码外源蛋白的核苷酸序列)。例如,在某些优选的实施方案中,所述2个拷贝的ICP0基因被缺失;并且,第一拷贝的ICP34.5基因被置换为第三外源核苷酸序列,第二拷贝的ICP34.5基因被置换为第四外源核苷酸序列。所述第三外源核苷酸序列与第四外源核苷酸序列可以相同或者不同。
在某些优选的实施方案中,所述2个拷贝的ICP0基因各自独立地被置换为外源核苷酸序列(例如,编码外源蛋白的核苷酸序列),并且,所述2个拷贝的ICP34.5基因各自独立地包含功能丧失性突变(例如一个或多个碱基的添加、缺失和/或置换)。例如,在某些优选的实施方案中,第一拷贝的ICP0基因被置换为第一外源核苷酸序列,第二拷贝的ICP0基因被置换为第二外源核苷酸序列;并且,第一拷贝的ICP34.5基因包含第三功能丧失性突变,第二拷贝的ICP34.5基因包含第四功能丧失性突变。所述第一外源核苷酸序列与第二外源核苷酸序列可以相同或者不同。所述第三功能丧失性突变和第四功能丧失性突变可以相同或者不同。
在某些优选的实施方案中,所述2个拷贝的ICP0基因各自独立地被置换为外源核苷酸序列(例如,编码外源蛋白的核苷酸序列),并且,所述2个拷贝的ICP34.5基因被缺失。例如,在某些优选的实施方案中,第一拷贝的ICP0基因被置换为第一外源核苷酸序列,而第二拷贝的ICP0基因被置换为第二外源核苷酸序列;并且,所述2个拷贝的ICP34.5基因被缺失。所述第一外源核苷酸序列与第二外源核苷酸序列可以相同或者不同。
在某些优选的实施方案中,所述2个拷贝的ICP0基因各自独立地被置换为外源核苷酸序列(例如,编码外源蛋白的核苷酸序列),并且,所述2个拷贝的ICP34.5基因各自独立地被置换为外源核苷酸序列(例如,编码外源蛋白的核苷酸序列)。例如,在某些优选的实施方案中,第一拷贝的ICP0基因被置换为第一外源核苷酸序列,第二拷贝的ICP0基因被置换为第二外源核苷酸序列;并且,第一拷贝的ICP34.5基因被置换为第三外源核苷酸序列,第二拷贝的ICP34.5基因被置换为第四外源核苷酸序列。所述第一外源核苷酸序列、第二外源核苷酸序列、第三外源核苷酸序列和第四外源核苷酸序列可以相同或者不同。
在某些优选的实施方案中,所述第一功能丧失性突变、第二功能丧失性突变、第三功能丧失性突变和第四功能丧失性突变各自独立地选自错义突变、无义突变、移码突变、碱基缺失、碱基置换、碱基添加、以及其任何组合(例如,基因片段的缺失或置换或添加)。
在某些优选的实施方案中,所述第一外源核苷酸序列、第二外源核苷酸序列、第三外源核苷酸序列和第四外源核苷酸序列各自独立地编码选自下列的外源蛋白:荧光蛋白、免疫调节多肽、细胞因子、趋化因子、抗体和细胞毒性肽。
在某些优选的实施方案中,所述荧光蛋白选自绿色荧光蛋白(例如,具有如SEQIDNO:7所示氨基酸序列的绿色荧光蛋白),红色荧光蛋白,蓝色荧光蛋白,黄色荧光蛋白,及其任何组合。
在某些优选的实施方案中,所述免疫调节多肽选自CD40L、OX40L、可诱导共刺激分子(ICOS)、FTL3L、LIGHT、CD137L、CD70、4-1BB、GITR、CD28,及其任何组合。
在某些优选的实施方案中,所述细胞因子选自白介素(例如IL-2、IL-12和IL-15)、干扰素(例如IFNα、IFNβ、IFNγ)、肿瘤坏死因子(例如TNFα)、集落刺激因子(例如GM-CSF),及其任何组合。
在某些优选的实施方案中,所述趋化因子选自CCL2、RANTES、CCL7、CCL9、CCL10、CCL12、CCL15、CCL19、CCL21、CCL20、XCL-1,及其任何组合。
在某些优选的实施方案中,所述细胞毒性肽选自胸苷激酶TK(TK/GCV)、TRAIL、FasL,及其任何组合。
在某些优选的实施方案中,所述抗体选自抗PD-1抗体、抗PD-L1抗体、抗TIGIT抗体、抗BTLA抗体、抗CTLA-4抗体、抗Tim-3抗体、抗Lag-3抗体、抗CD137抗体、抗OX40抗体、抗GITR抗体、抗CD73抗体、抗KIR抗体、抗ICOS抗体、抗CSF1R抗体、抗EGFR抗体、抗VEGFR抗体、抗HER2抗体、抗PDGFR抗体,及其任何组合。
在某些优选的实施方案中,所述外源蛋白为抗PD-L1抗体、抗PD-1抗体或其任何组合。例如,所述外源蛋白为抗PD-1单链抗体。
在某些优选的实施方案中,所述经突变的HSV基因组衍生自HSV-1病毒,HSV-2病毒,或HSV-1/HSV-2嵌合病毒(即,其基因组既含有来源于HSV-1的DNA,又含有来源于HSV-2的DNA的重组HSV病毒)的基因组。在某些优选的实施方案中,所述经突变的HSV基因组衍生自HSV-1病毒株KOS的基因组。在某些优选的实施方案中,所述经突变的HSV基因组衍生自GenBank:JQ673480.1所示的基因组。
在某些优选的实施方案中,所述经突变的HSV基因组能够表达功能性UL43蛋白,功能性UL41蛋白(即,vhs蛋白),功能性UL48蛋白(即,VMW65蛋白),或其任何组合。在某些优选的实施方案中,所述经突变的HSV基因组能够表达功能性UL43蛋白。在某些优选的实施方案中,所述经突变的HSV基因组能够表达功能性UL41蛋白。在某些优选的实施方案中,所述经突变的HSV基因组能够表达功能性UL48蛋白。在某些优选的实施方案中,所述经突变的HSV基因组能够表达功能性UL43蛋白和功能性UL41蛋白。在某些优选的实施方案中,所述经突变的HSV基因组能够表达功能性UL43蛋白和功能性UL48蛋白。在某些优选的实施方案中,所述经突变的HSV基因组能够表达功能性UL41蛋白和功能性UL48蛋白。在某些优选的实施方案中,所述经突变的HSV基因组能够表达功能性UL43蛋白,功能性UL41蛋白和功能性UL48蛋白。
在某些优选的实施方案中,所述经突变的HSV基因组包含能够表达功能性UL43蛋白的UL43基因,能够表达功能性UL41蛋白的UL41基因(即,vhs基因),和/或,能够表达功能性UL48蛋白的UL48基因(即,VMW65基因)。在某些优选的实施方案中,所述经突变的HSV基因组包含能够表达功能性UL43蛋白的UL43基因。在某些优选的实施方案中,所述经突变的HSV基因组包含能够表达功能性UL41蛋白的UL41基因。在某些优选的实施方案中,所述经突变的HSV基因组包含能够表达功能性UL48蛋白的UL48基因。在某些优选的实施方案中,所述经突变的HSV基因组包含能够表达功能性UL43蛋白的UL43基因,和能够表达功能性UL41蛋白的UL41基因。在某些优选的实施方案中,所述经突变的HSV基因组包含能够表达功能性UL43蛋白的UL43基因,和能够表达功能性UL48蛋白的UL48基因。在某些优选的实施方案中,所述经突变的HSV基因组包含能够表达功能性UL41蛋白的UL41基因,和能够表达功能性UL48蛋白的UL48基因。在某些优选的实施方案中,所述经突变的HSV基因组包含能够表达功能性UL43蛋白的UL43基因,能够表达功能性UL41蛋白的UL41基因,和能够表达功能性UL48蛋白的UL48基因。
在某些优选的实施方案中,所述经突变的HSV基因组含有UL43基因,UL41基因(即,vhs基因),和/或UL48基因(即,VMW65基因),并且所述UL43基因,UL41基因,和/或UL48基因不包含功能丧失性突变。在某些优选的实施方案中,所述经突变的HSV基因组含有,不包含功能丧失性突变的UL43基因。在某些优选的实施方案中,所述经突变的HSV基因组含有,不包含功能丧失性突变的UL41基因。在某些优选的实施方案中,所述经突变的HSV基因组含有,不包含功能丧失性突变的UL48基因。在某些优选的实施方案中,所述经突变的HSV基因组含有,不包含功能丧失性突变的UL43基因和UL41基因。在某些优选的实施方案中,所述经突变的HSV基因组含有,不包含功能丧失性突变的UL43基因和UL48基因。在某些优选的实施方案中,所述经突变的HSV基因组含有,不包含功能丧失性突变的UL41基因和UL48基因。在某些优选的实施方案中,所述经突变的HSV基因组含有,不包含功能丧失性突变的UL43基因、UL41基因和UL48基因。
在某些优选的实施方案中,所述经突变的HSV基因组还包含下述修饰:一个或多个非必需基因被缺失或突变(例如包含功能丧失性突变,或者被置换为外源核苷酸序列)。在某些优选的实施方案中,所述非必需基因选自UL3基因,UL4基因,UL14基因,UL16基因,UL21基因,UL24基因,UL31基因,UL32基因,US3基因,UL51基因,UL55基因,UL56基因,US2基因,US12基因(即,ICP47基因),LAT基因,对应于JQ673480.1的nt5853-nt7485的核苷酸片段,及其任何组合。在某些优选的实施方案中,在所述经突变的HSV基因组中,UL3基因被缺失或突变(例如包含功能丧失性突变,或者被置换为外源核苷酸序列)。在某些优选的实施方案中,在所述经突变的HSV基因组中,UL4基因被缺失或突变(例如包含功能丧失性突变,或者被置换为外源核苷酸序列)。在某些优选的实施方案中,在所述经突变的HSV基因组中,UL14基因被缺失或突变(例如包含功能丧失性突变,或者被置换为外源核苷酸序列)。在某些优选的实施方案中,在所述经突变的HSV基因组中,UL16基因被缺失或突变(例如包含功能丧失性突变,或者被置换为外源核苷酸序列)。在某些优选的实施方案中,在所述经突变的HSV基因组中,UL21基因被缺失或突变(例如包含功能丧失性突变,或者被置换为外源核苷酸序列)。在某些优选的实施方案中,在所述经突变的HSV基因组中,UL24基因被缺失或突变(例如包含功能丧失性突变,或者被置换为外源核苷酸序列)。在某些优选的实施方案中,在所述经突变的HSV基因组中,UL31基因被缺失或突变(例如包含功能丧失性突变,或者被置换为外源核苷酸序列)。在某些优选的实施方案中,在所述经突变的HSV基因组中,UL32基因被缺失或突变(例如包含功能丧失性突变,或者被置换为外源核苷酸序列)。在某些优选的实施方案中,在所述经突变的HSV基因组中,US3基因被缺失或突变(例如包含功能丧失性突变,或者被置换为外源核苷酸序列)。在某些优选的实施方案中,在所述经突变的HSV基因组中,UL51基因被缺失或突变(例如包含功能丧失性突变,或者被置换为外源核苷酸序列)。在某些优选的实施方案中,在所述经突变的HSV基因组中,UL55基因被缺失或突变(例如包含功能丧失性突变,或者被置换为外源核苷酸序列)。在某些优选的实施方案中,在所述经突变的HSV基因组中,UL56基因被缺失或突变(例如包含功能丧失性突变,或者被置换为外源核苷酸序列)。在某些优选的实施方案中,在所述经突变的HSV基因组中,US2基因被缺失或突变(例如包含功能丧失性突变,或者被置换为外源核苷酸序列)。在某些优选的实施方案中,在所述经突变的HSV基因组中,US12基因被缺失或突变(例如包含功能丧失性突变,或者被置换为外源核苷酸序列)。在某些优选的实施方案中,在所述经突变的HSV基因组中,LAT基因被缺失或突变(例如包含功能丧失性突变,或者被置换为外源核苷酸序列)。在某些优选的实施方案中,在所述经突变的HSV基因组中,对应于JQ673480.1的nt5853-nt7485的核苷酸片段被缺失或突变(例如包含功能丧失性突变,或者被置换为外源核苷酸序列)。
在某些优选的实施方案中,所述经突变的HSV基因组还包含下述修饰:UL55基因、US2基因、LAT基因和对应于JQ673480.1的nt5853-nt7485的核苷酸片段中的一个或多个被缺失或突变(例如包含功能丧失性突变,或者被置换为外源核苷酸序列)。在某些优选的实施方案中,所述经突变的HSV基因组还包含下述修饰:UL55基因、US2基因、LAT基因或对应于JQ673480.1的nt5853-nt7485的核苷酸片段被缺失或突变(例如包含功能丧失性突变,或者被置换为外源核苷酸序列)。
在某些优选的实施方案中,所述经突变的HSV基因组中的必需基因未被缺失,且不包含功能丧失性突变。在某些优选的实施方案中,所述经突变的HSV基因组中的必需基因的编码序列未被缺失或突变。在某些优选的实施方案中,所述经突变的HSV基因组能够表达所有必需基因。在某些优选的实施方案中,所述经突变的HSV基因组含有所有必需基因,并且,所有必需基因均不包含功能丧失性突变。在某些优选的实施方案中,所述经突变的HSV基因组含有所有必需基因,并且,所有必需基因的编码序列均不包含突变。必需基因是HSV病毒生存和复制所不可或缺的,因此,通常而言,在重组HSV病毒的基因组中,所有必需基因均不包含功能丧失性突变。然而,易于理解的是,可以对此类必需基因的启动子进行改造(例如,将必需基因的原生启动子被替换为肿瘤特异性启动子,例如hTERT的启动子),从而可进一步提高重组HSV病毒的安全性,而不影响本发明的重组HSV病毒的功能/性质。因此,在某些优选的实施方案中,在所述经突变的HSV基因组中,一个或多个必需基因的原生启动子被替换为肿瘤特异性启动子,例如hTERT的启动子。在某些优选的实施方案中,所述必需基因选自ICP27基因和、ICP4基因、VP5基因、gL基因、gH基因、gD基因、gK基因、gB基因、gN基因、UL5基因、UL6基因、UL8基因、UL9基因、UL12基因、UL25基因、UL26基因、UL28基因、UL29基因、UL30基因、UL33基因、UL36基因、UL38基因、UL42基因、UL48基因、UL52基因,以及其任何组合。
在某些优选的实施方案中,除了如上所述的2个拷贝的ICP0基因和2个拷贝的ICP34.5基因之外,所述经突变的HSV基因组含有野生型HSV病毒的所有其他基因,并且所述其他基因均不包含功能丧失性突变。然而,易于理解的是,可以对所述其他基因的启动子进行改造(例如,将原生启动子被替换为肿瘤特异性启动子,例如hTERT的启动子),从而可进一步提高重组HSV病毒的安全性,而不影响本发明的重组HSV病毒的功能/性质。因此,在某些优选的实施方案中,所述经突变的HSV基因组还包含下述修饰:一个或多个HSV基因的原生启动子被替换为肿瘤特异性启动子,例如hTERT的启动子。在某些优选的实施方案中,所述HSV基因选自VP5基因、ICP27基因和ICP4基因。
在某些优选的实施方案中,所述经突变的HSV基因组还包含有选自下述的一项或多项修饰:
(1)VP5基因的原生启动子被替换为肿瘤特异性启动子,例如hTERT的启动子;
(2)ICP27基因的原生启动子被替换为肿瘤特异性启动子,例如hTERT的启动子;
(3)ICP4基因的原生启动子被替换为肿瘤特异性启动子,如hTERT的启动子;和(4)UL55基因、US2基因、LAT基因和对应于JQ673480.1的nt5853-nt7485的核苷酸片段中的一个或多个被缺失或突变(例如包含功能丧失性突变,或者被置换为外源核苷酸序列)。
在某些优选的实施方案中,所述hTERT启动子具有如SEQ ID NO:5所示的序列。
此外,还可修饰所述经突变的HSV基因组,以携带一个或多个外源核苷酸序列。例如,在某些优选的实施方案中,所述经突变的HSV基因组还包含第五外源核苷酸序列。在某些优选的实施方案中,所述第五外源核苷酸序列编码选自下列的外源蛋白:荧光蛋白、免疫调节多肽、细胞因子、趋化因子、抗体和细胞毒性肽。
宿主细胞
在另一方面,本发明提供了一种宿主细胞,其感染了根据本发明的重组HSV病毒,或者包含有根据本发明的重组HSV病毒的基因组,或者转染了根据本发明的病毒载体。此类宿主细胞包括但不限于,原核细胞例如大肠杆菌细胞,以及真核细胞例如酵母细胞,昆虫细胞,植物细胞和动物细胞(如哺乳动物细胞,例如小鼠细胞、人细胞等)。本发明的重组HSV病毒在肿瘤细胞中具有高复制能力,但在正常细胞中仅以低水平复制。因此,在某些特别优选的实施方案中,所述细胞为肿瘤细胞。此类肿瘤细胞包括但不限于,肺癌细胞(例如H1299,H520,H1975,NCI-H358和A549);肝癌细胞(例如Huh7,Hep3B,HepG2,GSG7701,SMMC7721,Hepa1-6,BEL7404,PLC/PRF和QGY7703);乳腺癌细胞(例如MADMB231,MCF7和MADMB468);骨肉瘤细胞(例如U2OS和SAOS2);卵巢癌细胞(例如SKOV3和CAOV3);宫颈癌细胞(例如SiHA和Hela);前列腺癌细胞(例如PC-3);神经胶质瘤细胞(例如U87MG);黑色素瘤细胞(例如A375);结直肠癌细胞(例如HCT116)和胰腺癌细胞(例如Panc-1)。
制备方法
在另一个方面,本发明涉及一种获得本发明的重组HSV病毒的方法,其包括:
(1)培养根据本发明的宿主细胞;
(2)待所述宿主细胞发生病变后,收集和裂解所述宿主细胞,以获得所述宿主细胞的裂解液;和
(3)从所述裂解液中回收本发明的重组HSV病毒。
药物组合物
在另一个方面,本发明涉及一种药物组合物,其包含根据本发明的重组HSV病毒,或者根据本发明的重组HSV病毒的基因组,或者根据本发明的病毒载体,以及药学上可接受的载体或赋形剂。本发明的药物组合物可以用于治疗肿瘤,例如,肺癌,肝癌,乳腺癌,骨肉瘤,卵巢癌,前列腺癌,神经胶质瘤,黑色素瘤,结直肠癌,和胰腺癌。
本发明的药物组合物可通过本领域公知的方法进行施用,例如但不限于通过注射进行施用。在某些优选的实施方案中,本发明的药物组合物通过注射(例如瘤内注射)来进行施用。在某些优选的实施方案中,本发明的药物组合物为注射液或冻干粉剂。
在某些优选的实施方案中,所述重组HSV病毒或重组HSV病毒的基因组或病毒载体以治疗有效量(例如治疗肿瘤有效量)存在。在某些优选的实施方案中,本发明的药物组合物以单位剂量形式存在。例如但不意欲限定本发明,每单位剂量的药物组合物中包含的重组HSV病毒的量可以为102-109pfu,例如102-103pfu,103-104pfu,104-105pfu,105-106pfu,106-107pfu,107-108pfu,或108-109pfu。
用途/使用方法
本发明的重组HSV病毒可以用于治疗各种肿瘤。因此,在另一个方面,本发明涉及一种治疗肿瘤的方法,其包括,给有此需要的受试者施用治疗有效量的本发明的重组HSV病毒或本发明的病毒载体或本发明的药物组合物。在某些优选的实施方案中,所述肿瘤包括但不限于,肺癌,肝癌,乳腺癌,骨肉瘤,卵巢癌,前列腺癌,神经胶质瘤,黑色素瘤,结直肠癌,和胰腺癌。在某些优选的实施方案中,所述受试者是哺乳动物,例如人。在某些优选的实施方案中,通过注射(例如瘤内注射),将本发明的重组HSV病毒或本发明的病毒载体或本发明的药物组合物施用给所述受试者。
在另一个方面,本发明涉及本发明的重组HSV病毒或本发明的病毒载体用于制备药物组合物的用途,所述药物组合物用于治疗受试者的肿瘤。在某些优选的实施方案中,所述肿瘤包括但不限于,肺癌,肝癌,乳腺癌,骨肉瘤,卵巢癌,前列腺癌,神经胶质瘤,黑色素瘤,结直肠癌,和胰腺癌。在某些优选的实施方案中,所述受试者是哺乳动物,例如人。在某些优选的实施方案中,所述药物组合物通过注射(例如瘤内注射)来进行施用。在某些优选的实施方案中,所述药物组合物为注射液或冻干粉剂。
发明的有益效果
与现有技术中的重组单纯疱疹病毒相比,本发明的重组HSV病毒具有下述有益技术效果:本发明的重组HSV病毒在肿瘤细胞中具有高水平的复制能力,并且能够有效杀伤多种肿瘤细胞,但是在正常细胞中却具有显著降低的复制能力和杀伤能力。此外,还已显示,本发明的重组HSV病毒在动物体内具有显著降低的神经毒性,可以以显著提高的剂量施用给动物。因此,与现有的重组HSV病毒相比,本发明的重组HSV病毒不仅维持了高溶瘤能力,而且具有显著提高的安全性,能够以更高的剂量施用,具有广阔的应用前景。
关于序列信息的说明
本发明涉及的序列的信息提供于表1中。
表1:序列信息
SEQ ID NO:1
GCAAAAAAGGCGGGCGGCGGTCCGGGCGGCGTGCGCGCGCGCGGCGGGCGTGGGGGGCGGGGCCGCGGGAGCGGGGGAGGAGCGGGGGAGGAGCGGGGGGAGGAGCGGGGGGAGGAGCGGGGGGAGGAGCGGGGGGAGGAGCGGGGGGAGGAGCGGGGGGAGGAGCGGGGGGAGGAGCGGGGGGAGGAGCGGGGGGAGGAGCGGGGGGAGGAGCGGGGGGAGGAGCGGGGGGAGGAGCGGGGGGAGGAGCGGGGGGAGGAGCGGGGGGAGGAGCGGGGGAGGAGCGGCCAGACCCCGGAAACGGGCCCCCCCCAAAACACACCCCCCGGGGGTCGCGCGCGGCCCTTTAAAGGCGGGCGGCGGGCAGCCCGGGCCCCCCGCGGCCGAGACTAGCGAGTTAGACAGGCAAGCACTACTCGCCTCTGCACGCACATGCTTGCCTGTCAAACTCTACCACCCCGGCACGCTCTCTGTCTCCATGGCCCGCCGCCGCCATCGCGGCCCCCGCCGCCCCCGGCCGCCCGGGCCCACGGGCGCGGTCCCAACCGCACAGTCCCAGGTAACCTCCACGCCCAACTCGGAACCCGTGGTCAGGAGCGCGCCCGCGGCCGCCCCGCCGCCGCCCCCCGCCAGTGGGCCCCCGCCTTCTTGTTCGCTGCTGCTGCGCCAGTGGCTCCACGTTCCCGAGTCCGCGTCCGACGACGACGACGACGACTGGCCGGACAGCCCCCCGCCCGAGCCGGCGCCAGAGGCCCGGCCCACCGCCGCCGCCCCCCGCCCCCGGTCCCCACCGCCCGGCGCGGGCCCGGGGGGCGGGGCTAACCCCTCCCACCCCCCCTCACGCCCCTTCCGCCTTCCGCCGCGCCTCGCCCTCCGCCTGCGCGTCACCGCAGAGCACCTGGCGCGCCTGCGCCTGCGACGCGCGGGCGGGGAGGGGGCGCCGAAGCCCCCCGCGACCCCCGCGACCCCCGCGACCCCCACGCGGGTGCGCTTCTCGCCCCACGTCCGGGTGCGCCACCTGGTGGTCTGGGCCTCGGCCGCCCGCCTGGCGCGCCGCGGCTCGTGGGCCCGCGAGCGGGCCGACCGGGCTCGGTTCCGGCGCCGGGTGGCGGAGGCCGAGGCGGTCATCGGGCCGTGCCTGGGGCCCGAGGCCCGTGCCCGGGCCCTGGCCCGCGGAGCCGGCCCGGCGAACTCGGTCTAACGTTACACCCGAGGCGGCCTGGGTCTTCCGCGGAGCTCCCGGGAGCTCCGCACCAAGCCGCTCTCCGGAGAGACGATGGCAGGAGCCGCGCATATATACGCTTGGAGCCGGCCCGCCCCCGAGGCGGGCCCGCCCTCGGAGGGCGGGACTGGCCAATCGGCGGCCGCCAGCGCGGCGGGGCCCGGCCAACCAGCGTCCGCCGAGTCGTCGGGGCCCGGCCCACTGGGCGGTAACTCCCGCCCAGTGGGCCGGGCCGCCCACTTCCCGGTATGGTAATTAAAAACTTGCAGAGGCCTTGTTCCGCTTCCCGGTATGGTAATTAGAAACTCATTAATGGGCGGCCCCGGCCGCCCTTCCCGCTTCCGGCAATTCCCGCGGCCCTTAATGGGCAACCCCGGTATTCCCCGCCTCCCGCGCCGCGCGTAACCACTCCCCTGGGGTTCCGGGTTATGTTAATTGCTTTTTTGGCGGAACACACGGCCCCTCGCGCATTGGCCCGCGGGTCGCTCAATGAACCCGCATTGGTCCCCTGGGGTTCCGGGTATGGTAATGAGTTTCTTCGGGAAGGCGGGAAGCCCCGGGGCACCGACGCAGGCCAAGCCCCTGTTGCGTCGGCGGGAGGGGCATGCTAATGGGGTTCTTTGGGGGACACCGGGTTGGTCCCCCAAATCGGGGGCCGGGCCGTGCATGCTAATGATATTCTTTGGGGGCGCCGGGTTGGTCCCCGGGGACGGGGCCGCCCCGCGGTGGGCCTGCCTCCCCTGGGACGCGCGGCCATTGGGGGAATCGTCACTGCCGCCCCTTTGGGGAGGGGAAAGGCGTGGGGTATAAGTTAGCCCTGGCCCGACGGTCTGGTCGCATTTGCACCTCGGCACTCGGAGCGAGACGCAGCAGCCAGGCAGACTCGGGCCGCCCCCTCTCCGCATCACCACAGAAGCCCCGCCTACGTTGCGACCCCCAGGGACCCTCCGTCAGCGACCCTCCAGCCGCATACGACCCCCATGGAGCCCCGCCCCGGAGCGAGTACCCGCCGGCCTGAGGGCCGCCCCCAGCGCGAGGTGAGGGGCCGGGCGCCATGTCTGGGGCGCCATGTTGGGGGGCGCCATGTTGGGGGGCGCCATGTTGGGGGACCCCCGACCCTTACACTGGAACCGGCCGCCATGTTGGGGGACCCCCACTCATACACGGGAGCCGGGCGCCATGTTGGGGCGCCATGTTAGGGGGCGTGGAACCCCGTGACACTATATATACAGGGACCGGGGGCGCCATGTTAGGGGGCGCGGAACCCCCTGACCCTATATATACAGGGACCGGGGTCGCCCTGTTAGGGGTCGCCATGTGACCCCCTGACTTTATATATACAGACCCCCAACACCTACACATGGCCCCTTTGACTCAGACGCAGGGCCCGGGGTCGCCGTGGGACCCCCCTGACTCATACACAGAGACACGCCCCCACAACAAACACACAGGGACCGGGGTCGCCGTGTTAGGGGGCGTGGTCCCCACTGACTCATACGCAGGGCCCCCTTACTCACACGCATCTAGGGGGGTGGGGAGGAGCCGCCCGCCATATTTGGGGGACGCCGTGGGACCCCCGACTCCGGTGCGTCTGGAGGGCGGGAGAAGAGGGAAGAAGAGGGGTCGGGATCCAAAGGACGGACCCAGACCACCTTTGGTTGCAGACCCCTTTCTCCCCCCTCTTCCGAGGCCAGCAGGGGGGCAGGACTTTGTGAGGCGGGGGGGGAGGGGGAACTCGTGGGCGCTGATTGACGCGGGAAATCCCCCCATTCTTACCCGCCCCCCCTTTTTTCCCCTCAGCCCGCCCCGGATGTCTGGGTGTTTCCCTGCGACCGAGACCTGCCGGACAGCAGCGACTCGGAGGCGGAGACCGAAGTGGGGGGGCGGGGGGACGCCGACCACCATGACGACGACTCCGCCTCCGAGGCGGACAGCACGGACACGGAACTGTTCGAGACGGGGCTGCTGGGGCCGCAGGGCGTGGATGGGGGGGCGGTCTCGGGGGGGAGCCCCCCCCGCGAGGAAGACCCCGGCAGTTGCGGGGGCGCCCCCCCTCGAGAGGACGGGGGGAGCGACGAGGGCGACGTGTGCGCCGTGTGCACGGATGAGATCGCGCCCCACCTGCGCTGCGACACCTTCCCGTGCATGCACCGCTTCTGCATCCCGTGCATGAAAACCTGGATGCAATTGCGCAACACCTGCCCGCTGTGCAACGCCAAGCTGGTGTACCTGATAGTGGGCGTGACGCCCAGCGGGTCGTTCAGCACCATCCCGATCGTGAACGACCCCCAGACCCGCATGGAGGCCGAGGAGGCCGTCAGGGCGGGCACGGCCGTGGACTTTATCTGGACGGGCAATCAGCGGTTCGCCCCGCGGTACCTGACCCTGGGGGGGCACACGGTGAGGGCCCTGTCGCCCACCCACCCTGAGCCCACCACGGACGAGGATGACGACGACCTGGACGACGGTGAGGCGGGGGGGCGGCGAGGACCCTGGGGGAGGAGGAGGAGGGGGGGGGGAGGGAGGAATAGGCGGGCGGGCGGGCGAGGAAAGGGCGGGCCGGGGAGGGGGCGTAACCTGATCGCGCCCCCCGTTGTCTCTTGCAGCAGACTACGTACCGCCCGCCCCCCGCCGGACGCCCCGCGCCCCCCCACGCAGAGGCGCCGCCGCGCCCCCCGTGACGGGCGGGGCGTCTCACGCAGCCCCCCAGCCGGCCGCGGCTCGGACAGCGCCCCCCTCGGCGCCCATCGGGCCACACGGCAGCAGTAACACTAACACCACCACCAACAGCAGCGGCGGCGGCGGCTCCCGCCAGTCGCGAGCCGCGGTGCCGCGGGGGGCGTCTGGCCCCTCCGGGGGGGTTGGGGTTGTTGAAGCGGAGGCGGGGCGGCCGAGGGGCCGGACGGGCCCCCTTGTCAACAGACCCGCCCCCCTTGCAAACAACAGAGACCCCATAGTGATCAGCGACTCCCCCCCGGCCTCTCCCCACAGGCCCCCCGCGGCGCCCATGCCAGGCTCCGCCCCCCGCCCCGGTCCCCCCGCGTCCGCGGCCGCGTCGGGCCCCGCGCGCCCCCGCGCGGCCGTGGCCCCGTGTGTGCGGGCGCCGCCTCCGGGGCCCGGCCCCCGCGCCCCGGCCCCCGGGGCGGAGCCGGCCGCCCGCCCCGCGGACGCGCGCCGTGTGCCCCAGTCGCACTCGTCCCTGGCTCAGGCCGCGAACCAAGAACAGAGTCTGTGCCGGGCGCGTGCGACGGTGGCGCGCGGCTCGGGGGGGCCGGGCGTGGAGGGTGGACACGGGCCCTCCCGCGGCGCCGCCCCCTCCGGCGCCGCCCCCTCCGGCGCCCCCCCGCTCCCCTCCGCCGCCTCTGTCGAGCAGGAGGCGGCGGTGCGTCCGAGGAAGAGGCGCGGGTCGGGCCAGGAAAACCCCTCCCCCCAGTCCACGCGTCCCCCCCTCGCGCCGGCAGGGGCCAAGAGGGCGGCGACGCACCCCCCCTCCGACTCAGGGCCGGGGGGGCGCGGCCAGGGAGGGCCCGGGACCCCCCTGACGTCCTCGGCGGCCTCCGCCTCTTCCTCCTCCGCCTCTTCCTCCTCGGCCCCGACTCCCGCGGGGGCCACCTCTTCCGCCACCGGGGCCGCGTCCTCCTCCGCTTCCGCCTCCTCGGGCGGGGCCGTCGGTGCCCTGGGAGGGAGACAAGAGGAAACCTCCCTCGGCCCCCGCGCTGCTTCTGGGCCGCGGGGGCCGAGGAAGTGTGCCCGGAAGACGCGCCACGCGGAGACTTCCGGGGCCGTCCCCGCGGGCGGCCTCACGCGCTACCTGCCCATCTCGGGGGTCTCTAGCGTGGTCGCCCTGTCGCCTTACGTGAACAAGACGATCACGGGGGACTGCCTGCCCATCCTGGACATGGAGACGGGGAACATCGGGGCGTACGTGGTCCTGGTGGACCAGACGGGAAACATGGCGACCCGGCTGCGGGCCGCGGTCCCCGGCTGGAGCCGCCGCACCCTGCTCCCCGAGACCGCGGGTAACCACGTGACGCCCCCCGAGTACCCGACGGCCCCCGCGTCGGAGTGGAACAGCCTCTGGATGACCCCCGTGGGGAACATGCTGTTCGACCAGGGCACCCTAGTGGGCGCCCTGGACTTCCGCAGCCTGCGGTCTCGGCACCCGTGGTCCGGGGAGCAGGGGGCGTCGACCCGGGACGAGGGAAAACAATAAGGGACGCCCCCGTGTTTGTGGGGAGGGGGGGGTCGGGCGCTGGGTGGTCTCTGGCCGCGCCCACTACACCAGCCAATCCGTGTCGGGGAGGTGGAAAGTGAAAGACACGGGCACCACACACCAGCGGGTCTTTTGTGTTGGCCCTAATAAAAAAAACTCAGGGGATTTTTGCTGTCTGTTGGGAAATAAAGGTTTACTTTTGTATCTTTTCCCTGTCTGTGTTGGATGTATCGCGGGGGTGCGTGGGAGTGGGGGTGCGTGGGAGTGGGGGTGCGTGGGAGTGGGGGTGCGTGGGAGTGGGGGTGCGTGGGAGTGGGGGTGCGTGGGAGTGGGGGTGCGTGGGAGTGGGGGTGCGTGGGAGTGGGGGTGCGTGGGAGTGGGGGTGCCATGTTGGGCAGGCTCTGGTGTT
SEQ ID NO:2
GTCGTTTTACAACGTCGTGACTGGGAAAACCCTGGCGTTACCCAACTTAATCGCCTTGCAGCACATCCCCCTTTCGCCAGCTGGCGTAATAGCGAAGAGGCCCGCACCGATCGCCCTTCCCAACAGTTGCGCAGCCTGAATGGCGAATGGCGCTTTGCCTGGTTTCCGGCACCAGAAGCGGTGCCGGAAAGCTGGCTGGAGTGCGATCTTCCTGAGGCCGATACTGTCGTCGTCCCCTCAAACTGGCAGATGCACGGTTACGATGCGCCCATCTACACCAACGTGACCTATCCCATTACGGTCAATCCGCCGTTTGTTCCCACGGAGAATCCGACGGGTTGTTACTCGCTCACATTTAATGTTGATGAAAGCTGGCTACAGGAAGGCCAGACGCGAATTATTTTTGATGGCGTTAACTCGGCGTTTCATCTGTGGTGCAACGGGCGCTGGGTCGGTTACGGCCAGGACAGTCGTTTGCCGTCTGAATTTGACCTGAGCGCATTTTTACGCGCCGGAGAAAACCGCCTCGCGGTGATGGTGCTGCGCTGGAGTGACGGCAGTTATCTGGAAGATCAGGATATGTGGCGGATGAGCGGCATTTTCCGTGACGTCTCGTTGCTGCATAAACCGACTACACAAATCAGCGATTTCCATGTTGCCACTCGCTTTAATGATGATTTCAGCCGCGCTGTACTGGAGGCTGAAGTTCAGATGTGCGGCGAGTTGCGTGACTACCTACGGGTAACAGTTTCTTTATGGCAGGGTGAAACGCAGGTCGCCAGCGGCACCGCGCCTTTCGGCGGTGAAATTATCGATGAGCGTGGTGGTTATGCCGATCGCGTCACACTACGTCTGAACGTCGAAAACCCGAAACTGTGGAGCGCCGAAATCCCGAATCTCTATCGTGCGGTGGTTGAACTGCACACCGCCGACGGCACGCTGATTGAAGCAGAAGCCTGCGATGTCGGTTTCCGCGAGGTGCGGATTGAAAATGGTCTGCTGCTGCTGAACGGCAAGCCGTTGCTGATTCGAGGCGTTAACCGTCACGAGCATCATCCTCTGCATGGTCAGGTCATGGATGAGCAGACGATGGTGCAGGATATCCTGCTGATGAAGCAGAACAACTTTAACGCCGTGCGCTGTTCGCATTATCCGAACCATCCGCTGTGGTACACGCTGTGCGACCGCTACGGCCTGTATGTGGTGGATGAAGCCAATATTGAAACCCACGGCATGGTGCCAATGAATCGTCTGACCGATGATCCGCGCTGGCTACCGGCGATGAGCGAACGCGTAACGCGAATGGTGCAGCGCGATCGTAATCACCCGAGTGTGATCATCTGGTCGCTGGGGAATGAATCAGGCCACGGCGCTAATCACGACGCGCTGTATCGCTGGATCAAATCTGTCGATCCTTCCCGCCCGGTGCAGTATGAAGGCGGCGGAGCCGACACCACGGCCACCGATATTATTTGCCCGATGTACGCGCGCGTGGATGAAGACCAGCCCTTCCCGGCTGTGCCGAAATGGTCCATCAAAAAATGGCTTTCGCTACCTGGAGAGACGCGCCCGCTGATCCTTTGCGAATACGCCCACGCGATGGGTAACAGTCTTGGCGGTTTCGCTAAATACTGGCAGGCGTTTCGTCAGTATCCCCGTTTACAGGGCGGCTTCGTCTGGGACTGGGTGGATCAGTCGCTGATTAAATATGATGAAAACGGCAACCCGTGGTCGGCTTACGGCGGTGATTTTGGCGATACGCCGAACGATCGCCAGTTCTGTATGAACGGTCTGGTCTTTGCCGACCGCACGCCGCATCCAGCGCTGACGGAAGCAAAACACCAGCAGCAGTTTTTCCAGTTCCGTTTATCCGGGCAAACCATCGAAGTGACCAGCGAATACCTGTTCCGTCATAGCGATAACGAGCTCCTGCACTGGATGGTGGCGCTGGATGGTAAGCCGCTGGCAAGCGGTGAAGTGCCTCTGGATGTCGCTCCACAAGGTAAACAGTTGATTGAACTGCCTGAACTACCGCAGCCGGAGAGCGCCGGGCAACTCTGGCTCACAGTACGCGTAGTGCAACCGAACGCGACCGCATGGTCAGAAGCCGGGCACATCAGCGCCTGGCAGCAGTGGCGTCTGGCGGAAAACCTCAGTGTGACGCTCCCCGCCGCGTCCCACGCCATCCCGCATCTGACCACCAGCGAAATGGATTTTTGCATCGAGCTGGGTAATAAGCGTTGGCAATTTAACCGCCAGTCAGGCTTTCTTTCACAGATGTGGATTGGCGATAAAAAACAACTGCTGACGCCGCTGCGCGATCAGTTCACCCGTGCACCGCTGGATAACGACATTGGCGTAAGTGAAGCGACCCGCATTGACCCTAACGCCTGGGTCGAACGCTGGAAGGCGGCGGGCCATTACCAGGCCGAAAGCAGCGTTGTTGCAGTGCACGGCAGATACACTTGCTGATGCGGTGCTGATTACGACCGCTCACGCGTGGCAGCATCAGGGGAAAACCTTATTTATCAGCCGGAAAACCTACCGGATTGATGGTAGTGGTCAAATGGCGATTACCGTTGATGTTGAAGTGGCGAGCGATACACCGCATCCGGCGCGGATTGGCCTGAACTGCCAGCTGGCGCAGGTAGCAGAGCGGGTAAACTGGCTCGGATTAGGGCCGCAAGAAAACTATCCCGACCGCCTTACTGCCGCCTGTTTTGACCGCTGGGATCTGCCATTGTCAGACATGTATACCCCGTACGTCTTCCCGAGCGAAAACGGTCTGCGCTGCGGGACGCGCGAATTGAATTATGGCCCACACCAGTGGCGCGGCGACTTCCAGTTCAACATCAGCCGCTACAGTCAACAGCAACTGATGGAAACCAGCCATCGCCATCTGCTGCACGCGGAAGAAGGCACATGGCTGAATATCGACGGTTTCCATATGGGGATTGGTGGCGACGACTCCTGGAGCCCGTCAGTATCGGCGGAATTCCAGCTGAGCGCCGGTCGCTACCATTACCAGTTGGTCTGGTGTCAAAAATAA
SEQ ID NO:3
CCACCTGGTGTTTTGTCTCCACCATCGGCCTGACAGAGCTGTATTGTATTCTGCGGCGGGGCCCGGCCCCCAAGAACGCAGACAAGGCCGCCGCCCCGGGGCGATCCAAGGGGCTGTCGGGCGTCTGCGGGCGCTGTTGTTCCATCATCCTGTCGGGCATCGCAATGCGATTGTGTTATATCGCCGTGGTGGCCGGGGTGGTGCTCGTGGCGCTTCACTACGAGCAGGAGATCCAGAGGCGCCTGTTTGATGTATGACGTCACATCCAGGCCGGCGGAAACCGGAACGGCATATGCAAACTGGAAACTGTCCTGTCTTGGGGCCCACCCACCCGACGCGTCATATGTAAATGAAAATCGTTCCCCCGAGGCCATGTGTAGCCTGGATCCCAACGACCCCGCCCATGGGTCCCAATTGGCCGTCCCGTTACCAAGACCAACCCAGCCAGCGTATCCACCCCCGCCCGGGTCCCCGCGGAAGCGGAACGGTGTATGTGATATGCTAATTAAATACATGCCACGTACTTATGGTGTCTGATTGGTCCTTGTCTGTGCCGGAGGTG
SEQ ID NO:4
ACCGGTGCGCCACCACCAGAGGCCATATCCGACACCCCAGCCCCGACGGCAGCCGACAGCCCGGTCATGGCGACTGACATTGATATGCTAATTGACCTCGGCCTGGACCTCTCCGACAGCGATCTGGACGAGGACCCCCCCGAGCCGGCGGAGAGCCGCCGCGACGACCTGGAATCGGACAGCAACGGGGAGTGTTCCTCGTCGGACGAGGACATGGAAGACCCCCACGGAGAGGACGGACCGGAGCCGATACTCGACGCCGCTCGCCCGGCGGTCCGCCCGTCTCGTCCAGAAGACCCCGGCGTACCCAGCACCCAGACGCCTCGTCCGACGGAGCGGCAGGGCCCCAACGATCCTCAACCAGCGCCCCACAGTGTGTGGTCGCGCCTCGGGGCCCGGCGACCGTCTTGCTCCCCCGAGCGGCACGGGGGCAAGGTGGCCCGCCTCCAACCCCCACCGACCAAAGCCCAGCCTGCCCGCGGCGGACGCCGTGGGCGTCGCAGGGGTCGGGGTCGCGGTGGTCCCGGGGCCGCCGATGGTTTGTCGGACCCCCGCCGGCGTGCCCCCAGAACCAATCGCAACCCGGGGGGACCCCGCCCCGGGGCGGGGTGGACGGACGGCCCCGGCGCCCCCCATGGCGAGGCGTGGCGCGGAAGTGAGCAGCCCGACCCACCCGGAGGCCCGCGGACACGGAGCGTGCGCCAAGCACCCCCCCCGCTAATGACGCTGGCGATTGCCCCCCCGCCCGCGGACCCCCGCGCCCCGGCCCCGGAGCGAAAGGCGCCCGCCGCCGACACCATCGACGCCACCACGCGGTTGGTCCTGCGCTCCATCTCCGAGCGCGCGGCGGTCGACCGCATCAGCGAGAGCTTCGGCCGCAGCGCACAGGTCATGCACGACCCCTTTGGGGGGCAGCCGTTTCCCGCCGCGAATAGCCCCTGGGCCCCGGTGCTGGCGGGCCAAGGAGGGCCCTTTGACGCCGAGACCAGACGGGTCTCCTGGGAAACCTTGGTCGCCCACGGCCCGAGCCTCTATCGCACTTTTGCCGGCAATCCTCGGGCCGCATCGACCGCCAAGGCCATGCGCGACTGCGTGCTGCGCCAAGAAAATTTCATCGAGGCGCTGGCCTCCGCCGACGAGACGCTGGCGTGGTGCAAGATGTGCATCCACCACAACCTGCCGCTGCGCCCCCAGGACCCCATTATCGGGACGGCCGCGGCGGTGCTGGATAACCTCGCCACGCGCCTGCGGCCCTTTCTCCAGTGCTACCTGAAGGCGCGAGGCCTGTGCGGCCTGGACGAACTGTGTTCGCGGCGGCGTCTGGCGGACATTAAGGACATTGCATCCTTCGTGTTTGTCATTCTGGCCAGGCTCGCCAACCGCGTCGAGCGTGGCGTCGCGGAGATCGACTACGCGACCCTTGGTGTCGGGGTCGGAGAGAAGATGCATTTCTACCTCCCCGGGGCCTGCATGGCGGGCCTGATCGAAATCCTAGACACGCACCGCCAGGAGTGTTCGAGTCGTGTCTGCGAGTTGACGGCCAGTCACATCGTCGCCCCCCCGTACGTGCACGGCAAATATTTTTATTGCAACTCCCTGTTTTAG
SEQ ID NO:5
CTGCGCTGTCGGGGCCAGGCCGGGCTCCCAGTGGATTCGCGGGCACAGACGCCCAGGACCGCGCTTCCCACGTGGCGGAGGGACTGGGGACCCGGGCACCCGTCCTGCCCCTTCACCTTCCAGCTCCGCCTCCTCCGCGCGGACCCCGCCCCGTCCCGACCCCTCCCGGGTCCCCGGCCCAGCCCCCTCCGGGCCCTCCCAGCCCCTCCCCTTCCTTTCCGCGGCCCCGCCCTCTCCTCGCGGCGCGAGTTTCAGGCAGC
SEQ ID NO:6
CATGGCCCGCCGCCGCCATCGCGGCCCCCGCCGCCCCCGGCCGCCCGGGCCCACGGGCGCGGTCCCAACCGCACAGTCCCAGGTAACCTCCACGCCCAACTCGGAACCCGTGGTCAGGAGCGCGCCCGCGGCCGCCCCGCCGCCGCCCCCCGCCAGTGGGCCCCCGCCTTCTTGTTCGCTGCTGCTGCGCCAGTGGCTCCACGTTCCCGAGTCCGCGTCCGACGACGACGACGACGACTGGCCGGACAGCCCCCCGCCCGAGCCGGCGCCAGAGGCCCGGCCCACCGCCGCCGCCCCCCGCCCCCGGTCCCCACCGCCCGGCGCGGGCCCGGGGGGCGGGGCTAACCCCTCCCACCCCCCCTCACGCCCCTTCCGCCTTCCGCCGCGCCTCGCCCTCCGCCTGCGCGTCACCGCAGAGCACCTGGCGCGCCTGCGCCTGCGACGCGCGGGCGGGGAGGGGGCGCCGAAGCCCCCCGCGACCCCCGCGACCCCCGCGACCCCCACGCGGGTGCGCTTCTCGCCCCACGTCCGGGTGCGCCACCTGGTGGTCTGGGCCTCGGCCGCCCGCCTGGCGCGCCGCGGCTCGTGGGCCCGCGAGCGGGCCGACCGGGCTCGGTTCCGGCGCCGGGTGGCGGAGGCCGAGGCGGTCATCGGGCCGTGCCTGGGGCCCGAGGCCCGTGCCCGGGCCCTGGCCCGCGGAGCCGGCCCGGCGAACTCGGTCTAACGTTACACCCGAGGCGGCCTGGGTCTTCCGCGGAGCTCCCGGGAGCTCCGCACCAAGCCGCTCTCCGGAGAGACGATGGCAGGAGCCGCGCATATATACGCTTGGAGCCGGCCCGCCCCCGAGGCGGGCCCGCCCTCGGAGGGCGGGACTGGCCAATCGGCGGCCGCCAGCGCGGCGGGGCCCGGCCAACCAGCGTCCGCCGAGTCGTCGGGGCCCGGCCCACTGGGCGGTAACTCCCGCCCAGTGGGCCGGGCCGCCCACTTCCCGGTATGGTAATTAAAAACTTGCAGAGGCCTTGTTCCGCTTCCCGGTATGGTAATTAGAAACTCATTAATGGGCGGCCCCGGCCGCCCTTCCCGCTTCCGGCAATTCCCGCGGCCCTTAATGGGCAACCCCGGTATTCCCCGCCTCCCGCGCCGCGCGTAACCACTCCCCTGGGGTTCCGGGTTATGTTAATTGCTTTTTTGGCGGAACACACGGCCCCTCGCGCATTGGCCCGCGGGTCGCTCAATGAACCCGCATTGGTCCCCTGGGGTTCCGGGTATGGTAATGAGTTTCTTCGGGAAGGCGGGAAGCCCCGGGGCACCGACGCAGGCCAAGCCCCTGTTGCGTCGGCGGGAGGGGCATGCTAATGGGGTTCTTTGGGGGACACCGGGTTGGTCCCCCAAATCGGGGGCCGGGCCGTGCATGCTAATGATATTCTTTGGGGGCGCCGGGTTGGTCCCCGGGGACGGGGCCGCCCCGCGGTGGGCCTGCCTCCCCTGGGACGCGCGGCCATTGGGGGAATCGTCACTGCCGCCCCTTTGGGGAGGGGAAAGGCGTGGGGTATAAGTTAGCCCTGGCCCGACGGTCTGGTCGCATTTGCACCTCGGCACTCGGAGCGAGACGCAGCAGCCAGGCAGACTCGGGCCGCCCCCTCTCCGCATCACCACAGAAGCCCCGCCTACGTTGCGACCCCCAGGGACCCTCCGTCAGCGACCCTCCAGCCGCATACGACCCCCATGGAGCCCCGCCCCGGAGCGAGTACCCGCCGGCCTGAGGGCCGCCCCCAGCGCGAGGTGAGGGGCCGGGCGCCATGTCTGGGGCGCCATGTTGGGGGGCGCCATGTTGGGGGGCGCCATGTTGGGGGACCCCCGACCCTTACACTGGAACCGGCCGCCATGTTGGGGGACCCCCACTCATACACGGGAGCCGGGCGCCATGTTGGGGCGCCATGTTAGGGGGCGTGGAACCCCGTGACACTATATATACAGGGACCGGGGGCGCCATGTTAGGGGGCGCGGAACCCCCTGACCCTATATATACAGGGACCGGGGTCGCCCTGTTAGGGGTCGCCATGTGACCCCCTGACTTTATATATACAGACCCCCAACACCTACACATGGCCCCTTTGACTCAGACGCAGGGCCCGGGGTCGCCGTGGGACCCCCCTGACTCATACACAGAGACACGCCCCCACAACAAACACACAGGGACCGGGGTCGCCGTGTTAGGGGGCGTGGTCCCCACTGACTCATACGCAGGGCCCCCTTACTCACACGCATCTAGGGGGGTGGGGAGGAGCCGCCCGCCATATTTGGGGGACGCCGTGGGACCCCCGACTCCGGTGCGTCTGGAGGGCGGGAGAAGAGGGAAGAAGAGGGGTCGGGATCCAAAGGACGGACCCAGACCACCTTTGGTTGCAGACCCCTTTCTCCCCCCTCTTCCGAGGCCAGCAGGGGGGCAGGACTTTGTGAGGCGGGGGGGGAGGGGGAACTCGTGGGCGCTGATTGACGCGGGAAATCCCCCCATTCTTACCCGCCCCCCCTTTTTTCCCCTCAGCCCGCCCCGGATGTCTGGGTGTTTCCCTGCGACCGAGACCTGCCGGACAGCAGCGACTCGGAGGCGGAGACCGAAGTGGGGGGGCGGGGGGACGCCGACCACCATGACGACGACTCCGCCTCCGAGGCGGACAGCACGGACACGGAACTGTTCGAGACGGGGCTGCTGGGGCCGCAGGGCGTGGATGGGGGGGCGGTCTCGGGGGGGAGCCCCCCCCGCGAGGAAGACCCCGGCAGTTGCGGGGGCGCCCCCCCTCGAGAGGACGGGGGGAGCGACGAGGGCGACGTGTGCGCCGTGTGCACGGATGAGATCGCGCCCCACCTGCGCTGCGACACCTTCCCGTGCATGCACCGCTTCTGCATCCCGTGCATGAAAACCTGGATGCAATTGCGCAACACCTGCCCGCTGTGCAACGCCAAGCTGGTGTACCTGATAGTGGGCGTGACGCCCAGCGGGTCGTTCAGCACCATCCCGATCGTGAACGACCCCCAGACCCGCATGGAGGCCGAGGAGGCCGTCAGGGCGGGCACGGCCGTGGACTTTATCTGGACGGGCAATCAGCGGTTCGCCCCGCGGTACCTGACCCTGGGGGGGCACACGGTGAGGGCCCTGTCGCCCACCCACCCTGAGCCCACCACGGACGAGGATGACGACGACCTGGACGACGGTGAGGCGGGGGGGCGGCGAGGACCCTGGGGGAGGAGGAGGAGGGGGGGGGGAGGGAGGAATAGGCGGGCGGGCGGGCGAGGAAAGGGCGGGCCGGGGAGGGGGCGTAACCTGATCGCGCCCCCCGTTGTCTCTTGCAGCAGACTACGTACCGCCCGCCCCCCGCCGGACGCCCCGCGCCCCCCCACGCAGAGGCGCCGCCGCGCCCCCCGTGACGGGCGGGGCGTCTCACGCAGCCCCCCAGCCGGCCGCGGCTCGGACAGCGCCCCCCTCGGCGCCCATCGGGCCACACGGCAGCAGTAACACTAACACCACCACCAACAGCAGCGGCGGCGGCGGCTCCCGCCAGTCGCGAGCCGCGGTGCCGCGGGGGGCGTCTGGCCCCTCCGGGGGGGTTGGGGTTGTTGAAGCGGAGGCGGGGCGGCCGAGGGGCCGGACGGGCCCCCTTGTCAACAGACCCGCCCCCCTTGCAAACAACAGAGACCCCATAGTGATCAGCGACTCCCCCCCGGCCTCTCCCCACAGGCCCCCCGCGGCGCCCATGCCAGGCTCCGCCCCCCGCCCCGGTCCCCCCGCGTCCGCGGCCGCGTCGGGCCCCGCGCGCCCCCGCGCGGCCGTGGCCCCGTGTGTGCGGGCGCCGCCTCCGGGGCCCGGCCCCCGCGCCCCGGCCCCCGGGGCGGAGCCGGCCGCCCGCCCCGCGGACGCGCGCCGTGTGCCCCAGTCGCACTCGTCCCTGGCTCAGGCCGCGAACCAAGAACAGAGTCTGTGCCGGGCGCGTGCGACGGTGGCGCGCGGCTCGGGGGGGCCGGGCGTGGAGGGTGGACACGGGCCCTCCCGCGGCGCCGCCCCCTCCGGCGCCGCCCCCTCCGGCGCCCCCCCGCTCCCCTCCGCCGCCTCTGTCGAGCAGGAGGCGGCGGTGCGTCCGAGGAAGAGGCGCGGGTCGGGCCAGGAAAACCCCTCCCCCCAGTCCACGCGTCCCCCCCTCGCGCCGGCAGGGGCCAAGAGGGCGGCGACGCACCCCCCCTCCGACTCAGGGCCGGGGGGGCGCGGCCAGGGAGGGCCCGGGACCCCCCTGACGTCCTCGGCGGCCTCCGCCTCTTCCTCCTCCGCCTCTTCCTCCTCGGCCCCGACTCCCGCGGGGGCCACCTCTTCCGCCACCGGGGCCGCGTCCTCCTCCGCTTCCGCCTCCTCGGGCGGGGCCGTCGGTGCCCTGGGAGGGAGACAAGAGGAAACCTCCCTCGGCCCCCGCGCTGCTTCTGGGCCGCGGGGGCCGAGGAAGTGTGCCCGGAAGACGCGCCACGCGGAGACTTCCGGGGCCGTCCCCGCGGGCGGCCTCACGCGCTACCTGCCCATCTCGGGGGTCTCTAGCGTGGTCGCCCTGTCGCCTTACGTGAACAAGACGATCACGGGGGACTGCCTGCCCATCCTGGACATGGAGACGGGGAACATCGGGGCGTACGTGGTCCTGGTGGACCAGACGGGAAACATGGCGACCCGGCTGCGGGCCGCGGTCCCCGGCTGGAGCCGCCGCACCCTGCTCCCCGAGACCGCGGGTAACCACGTGACGCCCCCCGAGTACCCGACGGCCCCCGCGTCGGAGTGGAACAGCCTCTGGATGACCCCCGTGGGGAACATGCTGTTCGACCAGGGCACCCTAGTGGGCGCCCTGGACTTCCGCAGCCTGCGGTCTCGGCACCCGTGGTCCGGGGAGCAGGGGGC
SEQ ID NO:7
MVSKGEELFTGVVPILVELDGDVNGHKFSVSGEGEGDATYGKLTLKFICTTGKLPVPWPTLVTTLTYGVQCFSRYPDHMKQHDFFKSAMPEGYVQERTIFFKDDGNYKTRAEVKFEGDTLVNRIELKGIDFKEDGNILGHKLEYNYNSHNVYIMADKQKNGIKVNFKIRHNIEDGSVQLADHYQQNTPIGDGPVLLPDNHYLSTQSALSKDPNEKRDHMVLLEFVTAAGITLGMDELYK
SEQ ID NO:8
DVLMTQTPLFLPVSLGDQASIFCRSSQNIVHINGNTYLEWYLQKPGQFPKLLMYKVSNRFFGVPDRFSGSGSGTDFTLKISRVEAEDLGVYYCFQGSHVPWTFGGGTKLEIKGGGGSGGGGSGGGGSGGGGSSDVQVQESGPGLVKPSQSLSLTCTVTGSSITSDFAWEWIRQFPGNKLECMGYIGYSGGTIYNPSLKSRISITRDTSKNQFFLQLNSVTTEDTATYYCARWHGSSHWYFDVWGAGTTVTVSS
SEQ ID NO:17
CTACTCGTCCCAGAATTTGGCCAGGACGTCCTTGTAGAACGCGGGTGGGGGGGCCTGGGTCCGCAGCTGCTCCAGAAACCTGTCGGCGATATCAGGGGCCGTGATATGCCGGGTCACAATAGATCGCGCCAGGTTTTCGTCGCGGATGTCCTGGTAGATAGGCAGGCGTTTCAGAAGAGTCCACGGCCCCCGCTCCTTGGGGCCGATAAGCGATATGACGTACTTAATGTAGCGGTGTTCCACCAGCTCGGTGATGGTCATGGGATCGGGGAGCCAGTCCAGGGACTCTGGGGCGTCGTGGATGACGTGGCGTCGCCGGCTGGCCACATAACTGCGGTGCTCTTCCAGCAGCTGCGCGTTCGGGACCTGGACGAGCTCGGGCGGGGTGAGTATCTCCGAGGAGGACGACCTGGGGCCGGGGTGGCCCCCGGTAACGTCCCGGGGATCCAGGGGGAGGTCCTCGTCGTCTTCGTATCCGCCGGCGATCTGTTGGGTTAGAATTTCGGTCCACGAGACGCGCATCTCGGTGCCGCCGGCGGCCGGCGGCAAAGGGGGCCTGGTTTCCGTGGAGCGCGAGCTGGTGTGTTCCCGGCGGATGGCCCGCCGGGTCTGAGAGCGACTCGGGGGGGTCCAGTGACATTCGCGCAGCACATCCTCCACGGAGGCGTAGGTGTTATTGGGATGGAGGTCGGTGTGGCAGCGGACAAAGAGGGCCAGGAACTGGGGGTAGCTCATCTTAAAGTACTTTAGTATATCGCGACAGTTGATCGTGGGAATGTAGCAGGCGCTAATATCCAACACAATATCACAGCCCATCAACAGGAGGTCAGTGTCTGTGGTGTACACGTACGCGACCGTGTTGGTGTGATAGAGGTTGGCGCAGGCATCGTCCGCCTCCAGCTGACCCGAGTTAATGTAGGCGTACCCCAGGGCCCGGAGAACGCGAATACAGAACAGATGCGCCAGACGCAGGGCCGGCTTCGAGGGCGCGGCGGACGGCAGCGCGGCTCCGGACCCGGCCGTCCCCCGGGTCCCCGAGGCCAGAGAGGTGCCGCGCCGGCGCATGTTGGAAAAGGCAGAGCTGGGTCTGGAGTCGGTGATGGGGGAAGGCGGTGGAGAGGCGTCCACGTCACTGGCCTCCTCGTCCGTCCGGCATTGGGCCGTCGTGCGGGCCAGGATGGCCTTGGCTCCAAACACAACCGGCTCCATACAATTGACCCCGCGATCGGTAACGAAGATGGGGAAAAGGGACTTTTGGGTAAACACCTTTAATAAGCGACAGAGGCAGTGTAGCGTAATGGCCTCGCGGTCGTAACTGGGGTATCGGCGCTGATATTTGACCACCAACGTGTACATGACGTTCCACAGGTCCACGGCGATGGGGGTGAAGTACCCGGCCGGGGCCCCAAGGCCCTGGCGCTTGACCAGATGGTGTGTGTGGGCAAACTTCATCATCCCGAACAAACCCAT
SEQ ID NO:18
ATGCTCCGCAACGACAGCCACCGGGCCGCGTCCCCGGAGGACGGCCAGGGACGGGTCGACGACGGACGGCCACACCTCGCGTGCGTGGGGGCCCTGGCGCGGGGGTTCATGCATATCTGGCTTCAGGCCGCCACGCTGGGTTTTGCGGGATCGGTCGTTATGTCGCGCGGGCCGTACGCGAATGCCGCGTCTGGGGCGTTCGCCGTCGGGTGCGCCGTGCTGGGCTTTATGCGCGCACCCCCTCCCCTCGCGCGGCCCACCGCGCGGATATACGCCTGGCTCAAACTGGCGGCCGGTGGAGCGGCCCTTGTTCTGTGGAGTCTCGGGGAGCCCGGAACGCAGCCGGGGGCCCCGGGCCCGGCCACCCAGTGCCTGGCGCTGGGCGCCGCCTATGCGGCGCTCCTGGTGCTCGCCGATGACGTCTATCCGCTCTTTCTCCTCGCCCCGGGGCCCCTGTTCGTCGGCACCCTGGGGATGGTCGTCGGCGGGCTGACGATCGGAGGCAGCGCGCGCTACTGGTGGATCGGTGGGCCCGCCGCGGCCGCCTTGGCCGCGGCGGTGTTGGCGGGCCCGGGGGCGACCACCGCCAGGGACTGCTTCTCCAGGGCGTGCCCCGACCACCGCCGCGTCTGCGTCATCGTCGCAGGCGAGTCTGTTTCCCGCCGCCCCCCGGAGGACCCAGAGCGACCCGGGGACCCCGGGCCACCGTCCCCCCCGACACCCCAACGATCCCAGGGGCCGCCGGCCGATGAGGTCGCACCGGCCGGGGTAGCGCGGCCCGAAAACGTCTGGGTGCCCGTGGTCACCTTTCTGGGGGCGGGCGCGCTCGCCGTCAAGACGGTGCGAGAACATGCCCGGGAAACGCCGGGCCCGGGCCTGCCGCTGTGGCCCCAGGTGTTTCTCGGAGGCCATGTGGCGGTGGCCCTGACGGAGCTGTGTCAGGCGCTTATGCCCTGGGACCTTACGGACCCGCTGCTGTTTGTTCACGCCGGACTGCAGGTCATCAACCTCGGGTTGGTGTTTCGGTTTTCCGAGGTTGTCGTGTATGCGGCGCTAGGGGGTGCCGTGTGGATTTCGTTGGCGCAGGTGCTGGGGCTCCGGCGTCGCCTGCACAGGAAGGACCCCGGGGACGGGGCCCGGTTGGCGGCGACGCTTCGGGGCCTCTTCTTCTCCGTGTACGCGCTGGGGTTTGGGGTGGGGGCGCTGCTGTGCCCTCCGGGGTCAACGGGCGGGTGGTCGGGCGATTGA
SEQ ID NO:19
CTACCCACCGTACTCGTCAATTCCAAGGGCATCGGTAAACATCTGCTCAAACTCGAAGTCGGCCATATCCAGAGCGCCGTAGGGGGCGGAGTCGTGGGGGGTAAATCCCGGACCCGGGGAATCCCCGTCCCCCAACATGTCCAGATCGAAATCGTCTAGCGCGTCGGCATGCGCCATCGCCACGTCCTCGCCGTCTAAGTGGAGCTCGTCCCCCAGGCTGACATCGGTCGGGGGGGCCGTCGACAGTCTGCGCGTGTGTCCCGCGGGGAGAAAGGACAGGCGCGGAGCCGCCAGCCCCGCCTCTTCGGGGGCGTCGTCGTCCGGGAGATCGAGCAGGCCCTCGATGGTAGACCCGTAATTGTTTTTCGTACGCGCGCGGCTGTACGCGTGTTCCCGCATGACCGCCTCGGAGGGCGAGGTCGTGAAGCTGGAATACGAGTCCAACTTCGCCCGAATCAACACCATAAAGTACCCAGAGGCGCGGGCCTGGTTGCCATGCAGGGTGGGAGGGGTCGTCAACGGCGCCCCTGGCTCCTCCGTAGCCGCGCTGCGCACCAGCGGGAGGTTAAGGTGCTCGCGAATGTGGTTTAGCTCCCGCAGCCGGCGGGCCTCGATTGGCACTCCCCGGACGGTGAGCGCTCCGTTGACGAACATGAAGGGCTGGAACAGACCCGCCAACTGACGCCAGCTCTCCAGGTCGCAACAGAGGCAGTCAAACAGGTCGGGCCGCATCATCTGCTCGGCGTACGCGGCCCATAGGATCTCGCGGGTCAAAAATAGATACAAATGCAAAAACAGAACACGCGCCAGACGAGCGGTCTCTCGGTAGTACCTGTCCGCGATCGTGGCGCGCAGCATTTCTCCCAGGTCGCGATCGCGTCCGCGCATGTGCGCCTGGCGGTGCAGCTGCCGGACGCTGGCGCGCAGGTACCGGTACAGGGCCGAGCAGAAGTTGGCCAACACGGTTCGATAGCTCTCCTCCCGCGCCCGTAGCTCGGCGTGGAAGAAACGAGAGAGCGCTTCGTAGTAGAGCCCGAGGCCGTCGCGGGTGGCCGGAAGCGTCGGGAAGGCCACGTCGCCGTGGGCGCGAATGTCGATTTGGGCGCGTTCGGGGACGTACGCGTCCCCCCATTCCACCACATCGCTGGGCAGCGTTGATAGGAATTTACACTCCCGGTACAGGTCGGCGTTGGTCGGTAACGCCGAAAACAAATCCTCGTTCCAGGTATCGAGCATGGTACATAGCGCGGGGCCCGCGCTAAAGCCCAAGTCGTCGAGGAGACGGTTAAAGAGGGCGGCGGGGGGGACGGGCATGGGCGGGGAGGGCATGAGCTGGGCCTGGCTCAGGCGCCCCGTTGCGTACAGCGGAGGGGCCGCCGGGGTGTTTTTGGGACCCCCGGCCGGGCGGGGGGGTGGTGGCGAAGCGCCGTCCGCGTCCATGTCGGCAAACAGCTCGTCGACCAAGAGGTCCAT
SEQ ID NO:20
ATGACAGCGACCCCCCTCACCAACCTGTTCTTACGGGCCCCGGACATAACCCACGTGGCCCCCCCTTACTGCCTCAACGCCACCTGGCAGGCCGAAACGGCCATGCACACCAGCAAAACGGACTCCGCTTGCGTGGCCGTGCGGAGTTACCTGGTCCGCGCCTCCTGTGAGACCAGCGGCACAATCCACTGCTTTTTCTTTGCGGTATACAAGGACACCCACCATACCCCTCCGCTGATTACCGAGCTCCGCAACTTTGCGGACCTGGTTAACCACCCGCCGGTCCTACGCGAACTGGAGGATAAGCGCGGGGTGCGGCTGCGGTGTGCGCGGCCGTTTAGCGTCGGGACGATTAAGGACGTCTCTGGGTCCGGCGCGTCCTCGGCGGGAGAGTACACGATAAACGGGATCGTGTACCACTGCCACTGTCGGTATCCGTTCTCAAAAACATGCTGGATGGGGGCCTCCGCGGCCCTACAGCACCTGCGCTCCATCAGCTCCAGCGGCATGGCCGCCCGCGCGGCAGAGCATCGACGCGTCAAGATTAAAATTAAGGCGTGA
SEQ ID NO:21
CTACAGGGTGGTAACCGGATAGCAGATGTGAGGAAGTCTGGGCCGTTCGCCGCGAACGGCGATCAGAGGGTCCGTTTCTTGCGGACCACGGCCCGGTGATGTGGGTTGCTCGTCTAAAATCTCGGGCATACCCATACACGCACAACACGGACGCCGCACCGAATGGGACGTCGTAAGGGGGTGGGAGGTAGCTGGGTGGGGTTTGTGCAGAGCAATCAGGGACCGCAGCCAGCGCATACAATCGCGCTCCCGTCCGTTGGTCCCGGGCAGGACCACGCCGTACTGGTATTCGTACCGGCTGAGCAGGGTCTCCAGGGGGTGGTTGGGTGCCGCGGGGAACGGGGTCCACGCCACGGTCCACTCGGGCAAAAACCGAGTCGGCACGGCCCACGGTTCTCCCACCCACGCGTCTGGGGTCTTGATGGCGATAAATCTTACCCCGAGCCGGATTTTTTGGGCGTATTCGAGAAACGGCACACACAGATCCGCCGCGCCTACCACCCACAAGTGGTAGAGGCGAGGGGGGCTGGGTTGGTCTCGGTGCAACAGTCGGAAGCACGCCACGGCGTCCACGACCTCGGTGCTCTCCAAGGGGCTGTCCTCCGCAAACAGGCCCGTGGTGGTGTTTGGGGGGCAGCGACAGGACCTAGTGCGCACGATCGGGCGGGTGGGTTTGGGTAAGTCCATCAGCGGCTCGGCCAACCGTCGAAGGTTGGCCGGGCGAACGACGACCGGGGTACCCAGGGGTTCTGATGCCAAAATGCGGCACTGCCTAAGCAGGAAGCTCCACAGGGCCGGGCTTGCGTCGACGGAAGTCCGGGGCAGGGCGTTGTTCTGGTCAAGGAGGGTCATTACGTTGACGACAACAACGCCCAT
SE ID NO:22
CCCGGGACCCCCCTGACGTCCTCGGCGGCCTCCGCCTCTTCCTCCTCCGCCTCTTCCTCCTCGGCCCCGACTCCCGCGGGGGCCACCTCTTCCGCCACCGGGGCCGCGTCCTCCTCCGCTTCCGCCTCCTCGGGCGGGGCCGTCGGTGCCCTGGGAGGGAGACAAGAGGAAACCTCCCTCGGCCCCCGCGCTGCTTCTGGGCCGCGGGGGCCGAGGAAGTGTGCCCGGAAGACGCGCCACGCGGAGACTTCCGGGGCCGTCCCCGCGGGCGGCCTCACGCGCTACCTGCCCATCTCGGGGGTCTCTAGCGTGGTCGCCCTGTCGCCTTACGTGAACAAGACGATCACGGGGGACTGCCTGCCCATCCTGGACATGGAGACGGGGAACATCGGGGCGTACGTGGTCCTGGTGGACCAGACGGGAAACATGGCGACCCGGCTGCGGGCCGCGGTCCCCGGCTGGAGCCGCCGCACCCTGCTCCCCGAGACCGCGGGTAACCACGTGACGCCCCCCGAGTACCCGACGGCCCCCGCGTCGGAGTGGAACAGCCTCTGGATGACCCCCGTGGGGAACATGCTGTTCGACCAGGGCACCCTAGTGGGCGCCCTGGACTTCCGCAGCCTGCGGTCTCGGCACCCGTGGTCCGGGGAGCAGGGGGCGTCGACCCGGGACGAGGGAAAACAATAAGGGACGCCCCCGTGTTTGTGGGGAGGGGGGGGTCGGGCGCTGGGTGGTCTCTGGCCGCGCCCACTACACCAGCCAATCCGTGTCGGGGAGGTGGAAAGTGAAAGACACGGGCACCACACACCAGCGGGTCTTTTGTGTTGGCCCTAATAAAAAAAACTCAGGGGATTTTTGCTGTCTGTTGGGAAATAAAGGTTTACTTTTGTATCTTTTCCCTGTCTGTGTTGGATGTATCGCGGGGGTGCGTGGGAGTGGGGGTGCGTGGGAGTGGGGGTGCGTGGGAGTGGGGGTGCGTGGGAGTGGGGGTGCGTGGGAGTGGGGGTGCGTGGGAGTGGGGGTGCGTGGGAGTGGGGGTGCGTGGGAGTGGGGGTGCGTGGGAGTGGGGGTGCCATGTTGGGCAGGCTCTGGTGTTAACCACAGAGCCGCGGCCCGGGCTGCCTGACCACCGATCCCCGAAAGCATCCTGCCACTGGCATGGAGCCAGAACCACAGTGGGTTGGGTGTGGGTGTTAAGTTTCCGCGAGCGCCTGCCCGCCCGGACTGACCTGGCCTCTGGCCGCCACAAAGGGCGGGGGGGGGGGTTAACTACACTATAGGGCAACAAAGGATGGGAGGGGTAGCGGGGCGGGACGGGGCGCCCAAAAGGGGGTCGGCCACACCACAGACGTGGGTGTTGGGGGGTGGGGCGGAGGGGTGGGGGGGGAGACAGAAACAGGAACATAGTTAGAAAACAAGAATGCGGTGCAGCCAGAGAATCACAGGAGACGAGGGGATGGGCGTGTTGGTTACCAACCCACACCCAGGCATGCTCGGTGGTATGAAGGAGGGGGGGCGGTGTTTCTTAGAGACCGCCGGGGGACGTGGGGTTGGTGTGCAAAGGCACGCGCACCCGCGCCGGCCAGGTGGGCCGGTACCCCATCCCCCCCTCCCCCGACCCTTCCCACCCCCGCGTGCCAGAGATCACCCCGGTCCCCCGGCACCCGCCACTCCTCCATATCCTCGCTTTAGGAACAACTTTAGGGGGGGGTACACACGCGCCGTGCATTTCCTTCCACACCCCCCCCCTCCCCCGCACTCCCCCCCCCCAGGCAGTAAGACCCAAGCATAGAGAGCCAGGCACAAAAACACAGGCGGGGTGGGACACATGCCTTCTTGGAGTACGTGGGTCATTGGCGTGGGGGGTTACAGCGACACCGGCCGACCCCCTGGCGGTCTTCCAGCCGGCCCTTAGATAAGGGGGCAGTTGGTGGTCGGACGGGTAAGTAACAGAGTCTAACTAAGGGTGGGAGGGGGGGAAAATAACGGGCTGGTGTGCTGTAACACGAGCCCACCCGCGAGTGGCGTGGCCGACCTTAGCCTCTGGGGCGCCCCCTGTCGTTTGGGTCCCCCCCCCTCTATTGGGGAGAAGCAGGTGTCTAACCTACCTGGAAACGCGGCGTCTTTGTTGAACGACACCGGGGCGCCCTCGACGAGTGGGATAACGGGGGAGGAAGGGAGGGAGGAGGGTACTGGGGGTGAAGGGGGGGGGGGAGAAGCGAGAACAGGAAAGGCGACGGAGCCCGGCAGAACACCGAGGAAAAAAAAACCACAGCGCATGC
SEQ ID NO:23
CCATGTTGGGCAGGCTCTGGTGTTAACCACAGAGCCGCGGCCCGGGCTGCCTGACCACCGATCCCCGAAAGCATCCTGCCACTGGCATGGAGCCAGAACCACAGTGGGTTGGGTGTGGGTGTTAAGTTTCCGCGAGCGCCTGCCCGCCCGGACTGACCTGGCCTCTGGCCGCCACAAAGGGCGGGGGGGGGGGTTAACTACACTATAGGGCAACAAAGGATGGGAGGGGTAGCGGGGCGGGACGGGGCGCCCAAAAGGGGGTCGGCCACACCACAGACGTGGGTGTTGGGGGGTGGGGCGGAGGGGTGGGGGGGGAGACAGAAACAGGAACATAGTTAGAAAACAAGAATGCGGTGCAGCCAGAGAATCACAGGAGACGAGGGGATGGGCGTGTTGGTTACCAACCCACACCCAGGCATGCTCGGTGGTATGAAGGAGGGGGGGCGGTGTTTCTTAGAGACCGCCGGGGGACGTGGGGTTGGTGTGCAAAGGCACGCGCACCCGCGCCGGCCAGGTGGGCCGGTACCCCATCCCCCCCTCCCCCGACCCTTCCCACCCCCGCGTGCCAGAGATCACCCCGGTCCCCCGGCACCCGCCACTCCTCCATATCCTCGCTTTAGGAACAACTTTAGGGGGGGGTACACACGCGCCGTGCATTTCCTTCCACACCCCCCCCCTCCCCCGCACTCCCCCCCCCCAGGCAGTAAGACCCAAGCATAGAGAGCCAGGCACAAAAACACAGGCGGGGTGGGACACATGCCTTCTTGGAGTACGTGGGTCATTGGCGTGGGGGGTTACAGCGACACCGGCCGACCCCCTGGCGGTCTTCCAGCCGGCCCTTAGATAAGGGGGCAGTTGGTGGTCGGACGGGTAAGTAACAGAGTCTAACTAAGGGTGGGAGGGGGGGAAAATAACGGGCTGGTGTGCTGTAACACGAGCCCACCCGCGAGTGGCGTGGCCGACCTTAGCCTCTGGGGCGCCCCCTGTCGTTTGGGTCCCCCCCCCTCTATTGGGGAGAAGCAGGTGTCTAACCTACCTGGAAACGCGGCGTCTTTGTTGAACGACACCGGGGCGCCCTCGACGAGTGGGATAACGGGGGAGGAAGGGAGGGAGGAGGGTACTGGGGGTGAAGGGGGGGGGGGAGAAGCGAGAACAGGAAAGGCGACGGAGCCCGGCAGAACACCGAGGAAAAAAAAACCACAGCGCATGCGCCGGGCCGTTGTGGGGCCCCGGGCCGGGGCCCCTTGGGTCCGCCGGGGCCCCGGGCCGGGCCGCCACGGGGGCCGGCCGTTGGCGGTAACCCCGAGTGTTCATCTCAGGCCCCGGGCCGGGAACCCGGAAAAGCCTCCGGGGGGCCTTTTTCGCGTCGCGTGCCGGCGAGCGGGTCCGGACGGGGCCCGGACCGCCGCGGTCGGGGGCCCCTCGTCCCGGGCCGTACGCGGCCTTCGCCCCGTGAGGGGACAGACGAACGAAACATTCCGGCGACGGAACGAAAAACACCCCAGACGGGTTAAAGAAACAGAAACCGCAACCCCCACCACCCCCGAAACGGGGAAAACGAAAAAACAGACCAGCGGCCGGCCGGCGCTTAGGGGGAGGATGTCGCCGACGCCCCTTGGCCGCCCCGGCTGCA
下面将结合附图和实施例对本发明的实施方案进行详细描述,但是本领域技术人员将理解,下列附图和实施例仅用于说明本发明,而不是对本发明的范围的限定。根据附图和优选实施方案的下列详细描述,本发明的各种目的和有利方面对于本领域技术人员来说将变得显然。
实施例7.其他重组病毒的构建和表征(2)
在本实施例中,基于重组病毒OVN,构建了一系列衍生的重组病毒。简言之,参照实施例1(特别是1.3.1-1.3.3)中描述的方法,以重组病毒OVN为起始病毒,利用重组质粒将重组病毒OVN基因组中的非必需基因UL41、UL43、UL48、UL55、US2、LAT或NF分别删除,从而构建获得重组病毒OVN-dUL41、OVN-dUL43、OVN-dUL48、OVN-dUL55、OVN-dUS2、OVN-dLAT和OVN-dNF。
经测序验证,与重组病毒OVN相比,重组病毒OVN-dUL41基因组中,UL41(vhs)基因(GenBank:AFE62869.1;对应于野生型HSV-1基因组(GenBank:JQ673480.1)的nt91088-nt92557)已被缺失;重组病毒OVN-dUL43基因组中,UL43基因(GenBank:AFE62871.1;对应于野生型HSV-1基因组(GenBank:JQ673480.1)的nt94721-nt95968)已被缺失;重组病毒OVN-dUL48基因组中,UL48(VMW65)基因(GenBank:AFE62876.1;对应于野生型HSV-1基因组(GenBank:JQ673480.1)的nt103527-nt104999)已被缺失;重组病毒OVN-dUL55基因组中,UL55基因(GenBank:AFE62884.1;对应于野生型HSV-1基因组(GenBank:JQ673480.1)的nt115418-nt115978)已被缺失;重组病毒OVN-dUS2基因组中,US2基因(GenBank:AFE62890.1;对应于野生型HSV-1基因组(GenBank:JQ673480.1)的nt133911-nt134786)已被缺失;重组病毒OVN-dLAT基因组中,LAT基因(对应于野生型HSV-1基因组(GenBank:JQ673480.1)的nt4781-nt7062)已被缺失;并且,重组病毒OVN-dNF基因组中,核苷酸片段(NF)(对应于野生型HSV-1基因组(GenBank:JQ673480.1)的nt5853-nt7485)已被缺失。
另外,也可使用CRISPR技术,例如通过设计特异性sgRNA引物,并使用可商购获得的LentiCRISPR v2载体(Addgene),将重组病毒OVN基因组中的非必需基因UL41、UL43、UL48、UL55、US2、LAT或NF分别删除。
关于非必需基因UL41、UL43、UL48、UL55、US2、LAT和NF的信息,还提供于表4中。
表4.非必需基因的信息
以5-7.5×106个细胞/板的密度,将状态良好、处于对数生长期的肿瘤细胞(U-2OS细胞)接种于6cm培养板中。随后,以MOI=0.01的感染复数,用重组病毒OVN、OVN-dUL41、OVN-dUL43、OVN-dUL48、OVN-dUL55、OVN-dUS2、OVN-dLAT或OVN-dNF分别感染培养的细胞。感染60h后,参照实施例1中描述的方案,测定上述重组病毒的病毒滴度。每组实验均设置3孔重复,实验结果为3次独立实验的平均值。实验结果如图18所示。
图18显示了以MOI=0.01的感染复数用病毒OVN、OVN-dUL41、OVN-dUL43、OVN-dUL48、OVN-dUL55、OVN-dUS2、OVN-dLAT或OVN-dNF分别感染U-2 OS细胞60h后的病毒滴度。图18的结果显示,在感染U-2 OS细胞后,病毒OVN、OVN-dUL55、OVN-dUS2、OVN-dLAT和OVN-dNF均以高水平复制:感染60h后,它们的病毒滴度均在1.01-1.18×108pfu/ml之间,为108pfu/ml量级;而病毒OVN-dUL43、OVN-dUL41和OVN-dUL48均以低水平复制:感染60h后,它们的病毒滴度均低于107pfu/ml,为104至106pfu/ml量级。这些重组病毒的病毒滴度还提供于表5中。
表5:重组病毒感染U-2 OS细胞60h后的病毒滴度
重组病毒 |
病毒滴度(pfu/ml) |
重组病毒 |
病毒滴度(pfu/ml) |
OVN |
1.01×108±8.54×106 |
OVN-dUL55 |
1.05×108±5.00×106 |
OVN-dUL41 |
1.80×105±2.65×104 |
OVN-dUS2 |
1.18×108±2.89×106 |
OVN-dUL43 |
1.83×106±2.89×105 |
OVN-dLAT |
1.07×108±5.77×106 |
OVN-dUL48 |
3.37×104±3.21×103 |
OVN-dNF |
1.02×108±7.64×106 |
这些结果表明,病毒OVN、OVN-dUL55、OVN-dUS2、OVN-dLAT和OVN-dNF能够在肿瘤细胞(例如U-2 OS细胞)中以高水平复制;而病毒OVN-dUL43、OVN-dUL41和OVN-dUL48在肿瘤细胞(例如U-2 OS细胞)中的复制能力则显著下降。例如,在U-2 OS细胞中,与病毒OVN相比,病毒OVN-dUL41、OVN-dUL43和OVN-dUL48的复制能力分别下降约561倍、55倍和3×103倍。
另外,还以MOI=0.5的感染复数,用重组病毒OVN、OVN-dUL41、OVN-dUL43、OVN-dUL48、OVN-dUL55、OVN-dUS2、OVN-dLAT或OVN-dNF分别感染培养的正常细胞(L-O2细胞)或肿瘤细胞(U-2 OS细胞)。感染72h后,测定细胞的存活率。每组实验均设置3孔重复,实验结果为3次独立实验的平均值。实验结果如图19所示。
图19显示了以MOI=0.5的感染复数用病毒OVN、OVN-dUL41、OVN-dUL43、OVN-dUL48、OVN-dUL55、OVN-dUS2、OVN-dLAT或OVN-dNF分别感染正常细胞(L-O2细胞;图19A)或肿瘤细胞(U-2 OS细胞;图19B)72h后的细胞存活率。
图19A的结果显示,在感染72h后,病毒OVN-dUL41和OVH-dUL48对L-O2细胞的杀伤率分别为约17.67%和14.33%;二者对L-O2细胞的杀伤能力强于病毒OVN。病毒OVN-dUL43、OVN-dUL55、OVN-dUS2、OVN-dLAT或OVN-dNF对L-O2细胞的杀伤率均在8.33%-11.00%之间,与病毒OVN无显著差异。
图19B的结果显示,在感染72h后,病毒OVN、OVN-dUL55、OVN-dUS2、OVN-dLAT和OVN-dNF均能100%杀伤U-2 OS细胞(即,对肿瘤细胞均具有极强的杀伤能力)。病毒OVN-dUL41、OVN-dUL43和OVN-dUL48杀伤U-2 OS细胞的能力则显著减弱。
这些重组病毒对L-O2和U-2 OS细胞的杀伤率还提供于表6中。
表6:重组病毒对L-O2细胞和U-2 OS细胞的杀伤率
这些结果表明,与病毒OVN类似,病毒OVN-dUL55、OVN-dUS2、OVN-dLAT和OVN-dNF对正常细胞(例如L-O2细胞)仅具有非常有限的杀伤活性,而对肿瘤细胞(例如U-2 OS细胞)具有极高的杀伤活性;这表明,这四株重组病毒与病毒OVN的效果相当。与病毒OVN相比,病毒OVN-dUL41和OVH-dUL48不仅对正常细胞(例如L-O2细胞)的杀伤能力增强,而且对肿瘤细胞(例如U-2 OS细胞)的杀伤能力显著下降;这表明这两株重组病毒对正常细胞的毒性增大,抑瘤活性降低。与病毒OVN相比,病毒OVN-dUL43对正常细胞(例如L-O2细胞)的杀伤活性虽然没有显著增强,但是对肿瘤细胞(例如U-2 OS细胞)的杀伤活性显著下降。
具体而言,在正常细胞中,与病毒OVN相比,病毒OVN-dUL41、OVN-dUL43和OVH-dUL48的杀伤能力分别提高约7.67%、1.00%和4.33%。在肿瘤细胞中,与病毒OVN相比,病毒OVN-dUL41、OVN-dUL43和OVH-dUL48的杀伤能力分别降低约75.13%、51.80%和67.46%。
以上实验结果表明,在本发明的重组HSV病毒中,可对除了UL41、UL43和UL48之外的非必需基因(例如,UL55、US2、LAT和NF)进行进一步的改造,例如在其中引入功能丧失性突变或将其缺失。
尽管本发明的具体实施方式已经得到详细的描述,但本领域技术人员将理解:根据已经公开的所有教导,可以对细节进行各种修改和变动,并且这些改变均在本发明的保护范围之内。本发明的全部范围由所附权利要求及其任何等同物给出。
序列表
<110> 厦门大学
北京万泰生物药业股份有限公司
<120> 一种重组单纯疱疹病毒及其用途
<130> IDC170048
<150> CN 201710136638.1
<151> 2017-03-09
<160> 23
<170> PatentIn version 3.5
<210> 1
<211> 5844
<212> DNA
<213> herpes simplex virus 1
<400> 1
gcaaaaaagg cgggcggcgg tccgggcggc gtgcgcgcgc gcggcgggcg tggggggcgg 60
ggccgcggga gcgggggagg agcgggggag gagcgggggg aggagcgggg ggaggagcgg 120
ggggaggagc ggggggagga gcggggggag gagcgggggg aggagcgggg ggaggagcgg 180
ggggaggagc ggggggagga gcggggggag gagcgggggg aggagcgggg ggaggagcgg 240
ggggaggagc ggggggagga gcggggggag gagcggggga ggagcggcca gaccccggaa 300
acgggccccc cccaaaacac accccccggg ggtcgcgcgc ggccctttaa aggcgggcgg 360
cgggcagccc gggccccccg cggccgagac tagcgagtta gacaggcaag cactactcgc 420
ctctgcacgc acatgcttgc ctgtcaaact ctaccacccc ggcacgctct ctgtctccat 480
ggcccgccgc cgccatcgcg gcccccgccg cccccggccg cccgggccca cgggcgcggt 540
cccaaccgca cagtcccagg taacctccac gcccaactcg gaacccgtgg tcaggagcgc 600
gcccgcggcc gccccgccgc cgccccccgc cagtgggccc ccgccttctt gttcgctgct 660
gctgcgccag tggctccacg ttcccgagtc cgcgtccgac gacgacgacg acgactggcc 720
ggacagcccc ccgcccgagc cggcgccaga ggcccggccc accgccgccg ccccccgccc 780
ccggtcccca ccgcccggcg cgggcccggg gggcggggct aacccctccc accccccctc 840
acgccccttc cgccttccgc cgcgcctcgc cctccgcctg cgcgtcaccg cagagcacct 900
ggcgcgcctg cgcctgcgac gcgcgggcgg ggagggggcg ccgaagcccc ccgcgacccc 960
cgcgaccccc gcgaccccca cgcgggtgcg cttctcgccc cacgtccggg tgcgccacct 1020
ggtggtctgg gcctcggccg cccgcctggc gcgccgcggc tcgtgggccc gcgagcgggc 1080
cgaccgggct cggttccggc gccgggtggc ggaggccgag gcggtcatcg ggccgtgcct 1140
ggggcccgag gcccgtgccc gggccctggc ccgcggagcc ggcccggcga actcggtcta 1200
acgttacacc cgaggcggcc tgggtcttcc gcggagctcc cgggagctcc gcaccaagcc 1260
gctctccgga gagacgatgg caggagccgc gcatatatac gcttggagcc ggcccgcccc 1320
cgaggcgggc ccgccctcgg agggcgggac tggccaatcg gcggccgcca gcgcggcggg 1380
gcccggccaa ccagcgtccg ccgagtcgtc ggggcccggc ccactgggcg gtaactcccg 1440
cccagtgggc cgggccgccc acttcccggt atggtaatta aaaacttgca gaggccttgt 1500
tccgcttccc ggtatggtaa ttagaaactc attaatgggc ggccccggcc gcccttcccg 1560
cttccggcaa ttcccgcggc ccttaatggg caaccccggt attccccgcc tcccgcgccg 1620
cgcgtaacca ctcccctggg gttccgggtt atgttaattg cttttttggc ggaacacacg 1680
gcccctcgcg cattggcccg cgggtcgctc aatgaacccg cattggtccc ctggggttcc 1740
gggtatggta atgagtttct tcgggaaggc gggaagcccc ggggcaccga cgcaggccaa 1800
gcccctgttg cgtcggcggg aggggcatgc taatggggtt ctttggggga caccgggttg 1860
gtcccccaaa tcgggggccg ggccgtgcat gctaatgata ttctttgggg gcgccgggtt 1920
ggtccccggg gacggggccg ccccgcggtg ggcctgcctc ccctgggacg cgcggccatt 1980
gggggaatcg tcactgccgc ccctttgggg aggggaaagg cgtggggtat aagttagccc 2040
tggcccgacg gtctggtcgc atttgcacct cggcactcgg agcgagacgc agcagccagg 2100
cagactcggg ccgccccctc tccgcatcac cacagaagcc ccgcctacgt tgcgaccccc 2160
agggaccctc cgtcagcgac cctccagccg catacgaccc ccatggagcc ccgccccgga 2220
gcgagtaccc gccggcctga gggccgcccc cagcgcgagg tgaggggccg ggcgccatgt 2280
ctggggcgcc atgttggggg gcgccatgtt ggggggcgcc atgttggggg acccccgacc 2340
cttacactgg aaccggccgc catgttgggg gacccccact catacacggg agccgggcgc 2400
catgttgggg cgccatgtta gggggcgtgg aaccccgtga cactatatat acagggaccg 2460
ggggcgccat gttagggggc gcggaacccc ctgaccctat atatacaggg accggggtcg 2520
ccctgttagg ggtcgccatg tgaccccctg actttatata tacagacccc caacacctac 2580
acatggcccc tttgactcag acgcagggcc cggggtcgcc gtgggacccc cctgactcat 2640
acacagagac acgcccccac aacaaacaca cagggaccgg ggtcgccgtg ttagggggcg 2700
tggtccccac tgactcatac gcagggcccc cttactcaca cgcatctagg ggggtgggga 2760
ggagccgccc gccatatttg ggggacgccg tgggaccccc gactccggtg cgtctggagg 2820
gcgggagaag agggaagaag aggggtcggg atccaaagga cggacccaga ccacctttgg 2880
ttgcagaccc ctttctcccc cctcttccga ggccagcagg ggggcaggac tttgtgaggc 2940
ggggggggag ggggaactcg tgggcgctga ttgacgcggg aaatcccccc attcttaccc 3000
gccccccctt ttttcccctc agcccgcccc ggatgtctgg gtgtttccct gcgaccgaga 3060
cctgccggac agcagcgact cggaggcgga gaccgaagtg ggggggcggg gggacgccga 3120
ccaccatgac gacgactccg cctccgaggc ggacagcacg gacacggaac tgttcgagac 3180
ggggctgctg gggccgcagg gcgtggatgg gggggcggtc tcggggggga gccccccccg 3240
cgaggaagac cccggcagtt gcgggggcgc cccccctcga gaggacgggg ggagcgacga 3300
gggcgacgtg tgcgccgtgt gcacggatga gatcgcgccc cacctgcgct gcgacacctt 3360
cccgtgcatg caccgcttct gcatcccgtg catgaaaacc tggatgcaat tgcgcaacac 3420
ctgcccgctg tgcaacgcca agctggtgta cctgatagtg ggcgtgacgc ccagcgggtc 3480
gttcagcacc atcccgatcg tgaacgaccc ccagacccgc atggaggccg aggaggccgt 3540
cagggcgggc acggccgtgg actttatctg gacgggcaat cagcggttcg ccccgcggta 3600
cctgaccctg ggggggcaca cggtgagggc cctgtcgccc acccaccctg agcccaccac 3660
ggacgaggat gacgacgacc tggacgacgg tgaggcgggg gggcggcgag gaccctgggg 3720
gaggaggagg aggggggggg gagggaggaa taggcgggcg ggcgggcgag gaaagggcgg 3780
gccggggagg gggcgtaacc tgatcgcgcc ccccgttgtc tcttgcagca gactacgtac 3840
cgcccgcccc ccgccggacg ccccgcgccc ccccacgcag aggcgccgcc gcgccccccg 3900
tgacgggcgg ggcgtctcac gcagcccccc agccggccgc ggctcggaca gcgcccccct 3960
cggcgcccat cgggccacac ggcagcagta acactaacac caccaccaac agcagcggcg 4020
gcggcggctc ccgccagtcg cgagccgcgg tgccgcgggg ggcgtctggc ccctccgggg 4080
gggttggggt tgttgaagcg gaggcggggc ggccgagggg ccggacgggc ccccttgtca 4140
acagacccgc cccccttgca aacaacagag accccatagt gatcagcgac tcccccccgg 4200
cctctcccca caggcccccc gcggcgccca tgccaggctc cgccccccgc cccggtcccc 4260
ccgcgtccgc ggccgcgtcg ggccccgcgc gcccccgcgc ggccgtggcc ccgtgtgtgc 4320
gggcgccgcc tccggggccc ggcccccgcg ccccggcccc cggggcggag ccggccgccc 4380
gccccgcgga cgcgcgccgt gtgccccagt cgcactcgtc cctggctcag gccgcgaacc 4440
aagaacagag tctgtgccgg gcgcgtgcga cggtggcgcg cggctcgggg gggccgggcg 4500
tggagggtgg acacgggccc tcccgcggcg ccgccccctc cggcgccgcc ccctccggcg 4560
cccccccgct cccctccgcc gcctctgtcg agcaggaggc ggcggtgcgt ccgaggaaga 4620
ggcgcgggtc gggccaggaa aacccctccc cccagtccac gcgtcccccc ctcgcgccgg 4680
caggggccaa gagggcggcg acgcaccccc cctccgactc agggccgggg gggcgcggcc 4740
agggagggcc cgggaccccc ctgacgtcct cggcggcctc cgcctcttcc tcctccgcct 4800
cttcctcctc ggccccgact cccgcggggg ccacctcttc cgccaccggg gccgcgtcct 4860
cctccgcttc cgcctcctcg ggcggggccg tcggtgccct gggagggaga caagaggaaa 4920
cctccctcgg cccccgcgct gcttctgggc cgcgggggcc gaggaagtgt gcccggaaga 4980
cgcgccacgc ggagacttcc ggggccgtcc ccgcgggcgg cctcacgcgc tacctgccca 5040
tctcgggggt ctctagcgtg gtcgccctgt cgccttacgt gaacaagacg atcacggggg 5100
actgcctgcc catcctggac atggagacgg ggaacatcgg ggcgtacgtg gtcctggtgg 5160
accagacggg aaacatggcg acccggctgc gggccgcggt ccccggctgg agccgccgca 5220
ccctgctccc cgagaccgcg ggtaaccacg tgacgccccc cgagtacccg acggcccccg 5280
cgtcggagtg gaacagcctc tggatgaccc ccgtggggaa catgctgttc gaccagggca 5340
ccctagtggg cgccctggac ttccgcagcc tgcggtctcg gcacccgtgg tccggggagc 5400
agggggcgtc gacccgggac gagggaaaac aataagggac gcccccgtgt ttgtggggag 5460
gggggggtcg ggcgctgggt ggtctctggc cgcgcccact acaccagcca atccgtgtcg 5520
gggaggtgga aagtgaaaga cacgggcacc acacaccagc gggtcttttg tgttggccct 5580
aataaaaaaa actcagggga tttttgctgt ctgttgggaa ataaaggttt acttttgtat 5640
cttttccctg tctgtgttgg atgtatcgcg ggggtgcgtg ggagtggggg tgcgtgggag 5700
tgggggtgcg tgggagtggg ggtgcgtggg agtgggggtg cgtgggagtg ggggtgcgtg 5760
ggagtggggg tgcgtgggag tgggggtgcg tgggagtggg ggtgcgtggg agtgggggtg 5820
ccatgttggg caggctctgg tgtt 5844
<210> 2
<211> 3049
<212> DNA
<213> Artificial Sequence
<220>
<223> LacZ gene
<400> 2
gtcgttttac aacgtcgtga ctgggaaaac cctggcgtta cccaacttaa tcgccttgca 60
gcacatcccc ctttcgccag ctggcgtaat agcgaagagg cccgcaccga tcgcccttcc 120
caacagttgc gcagcctgaa tggcgaatgg cgctttgcct ggtttccggc accagaagcg 180
gtgccggaaa gctggctgga gtgcgatctt cctgaggccg atactgtcgt cgtcccctca 240
aactggcaga tgcacggtta cgatgcgccc atctacacca acgtgaccta tcccattacg 300
gtcaatccgc cgtttgttcc cacggagaat ccgacgggtt gttactcgct cacatttaat 360
gttgatgaaa gctggctaca ggaaggccag acgcgaatta tttttgatgg cgttaactcg 420
gcgtttcatc tgtggtgcaa cgggcgctgg gtcggttacg gccaggacag tcgtttgccg 480
tctgaatttg acctgagcgc atttttacgc gccggagaaa accgcctcgc ggtgatggtg 540
ctgcgctgga gtgacggcag ttatctggaa gatcaggata tgtggcggat gagcggcatt 600
ttccgtgacg tctcgttgct gcataaaccg actacacaaa tcagcgattt ccatgttgcc 660
actcgcttta atgatgattt cagccgcgct gtactggagg ctgaagttca gatgtgcggc 720
gagttgcgtg actacctacg ggtaacagtt tctttatggc agggtgaaac gcaggtcgcc 780
agcggcaccg cgcctttcgg cggtgaaatt atcgatgagc gtggtggtta tgccgatcgc 840
gtcacactac gtctgaacgt cgaaaacccg aaactgtgga gcgccgaaat cccgaatctc 900
tatcgtgcgg tggttgaact gcacaccgcc gacggcacgc tgattgaagc agaagcctgc 960
gatgtcggtt tccgcgaggt gcggattgaa aatggtctgc tgctgctgaa cggcaagccg 1020
ttgctgattc gaggcgttaa ccgtcacgag catcatcctc tgcatggtca ggtcatggat 1080
gagcagacga tggtgcagga tatcctgctg atgaagcaga acaactttaa cgccgtgcgc 1140
tgttcgcatt atccgaacca tccgctgtgg tacacgctgt gcgaccgcta cggcctgtat 1200
gtggtggatg aagccaatat tgaaacccac ggcatggtgc caatgaatcg tctgaccgat 1260
gatccgcgct ggctaccggc gatgagcgaa cgcgtaacgc gaatggtgca gcgcgatcgt 1320
aatcacccga gtgtgatcat ctggtcgctg gggaatgaat caggccacgg cgctaatcac 1380
gacgcgctgt atcgctggat caaatctgtc gatccttccc gcccggtgca gtatgaaggc 1440
ggcggagccg acaccacggc caccgatatt atttgcccga tgtacgcgcg cgtggatgaa 1500
gaccagccct tcccggctgt gccgaaatgg tccatcaaaa aatggctttc gctacctgga 1560
gagacgcgcc cgctgatcct ttgcgaatac gcccacgcga tgggtaacag tcttggcggt 1620
ttcgctaaat actggcaggc gtttcgtcag tatccccgtt tacagggcgg cttcgtctgg 1680
gactgggtgg atcagtcgct gattaaatat gatgaaaacg gcaacccgtg gtcggcttac 1740
ggcggtgatt ttggcgatac gccgaacgat cgccagttct gtatgaacgg tctggtcttt 1800
gccgaccgca cgccgcatcc agcgctgacg gaagcaaaac accagcagca gtttttccag 1860
ttccgtttat ccgggcaaac catcgaagtg accagcgaat acctgttccg tcatagcgat 1920
aacgagctcc tgcactggat ggtggcgctg gatggtaagc cgctggcaag cggtgaagtg 1980
cctctggatg tcgctccaca aggtaaacag ttgattgaac tgcctgaact accgcagccg 2040
gagagcgccg ggcaactctg gctcacagta cgcgtagtgc aaccgaacgc gaccgcatgg 2100
tcagaagccg ggcacatcag cgcctggcag cagtggcgtc tggcggaaaa cctcagtgtg 2160
acgctccccg ccgcgtccca cgccatcccg catctgacca ccagcgaaat ggatttttgc 2220
atcgagctgg gtaataagcg ttggcaattt aaccgccagt caggctttct ttcacagatg 2280
tggattggcg ataaaaaaca actgctgacg ccgctgcgcg atcagttcac ccgtgcaccg 2340
ctggataacg acattggcgt aagtgaagcg acccgcattg accctaacgc ctgggtcgaa 2400
cgctggaagg cggcgggcca ttaccaggcc gaaagcagcg ttgttgcagt gcacggcaga 2460
tacacttgct gatgcggtgc tgattacgac cgctcacgcg tggcagcatc aggggaaaac 2520
cttatttatc agccggaaaa cctaccggat tgatggtagt ggtcaaatgg cgattaccgt 2580
tgatgttgaa gtggcgagcg atacaccgca tccggcgcgg attggcctga actgccagct 2640
ggcgcaggta gcagagcggg taaactggct cggattaggg ccgcaagaaa actatcccga 2700
ccgccttact gccgcctgtt ttgaccgctg ggatctgcca ttgtcagaca tgtatacccc 2760
gtacgtcttc ccgagcgaaa acggtctgcg ctgcgggacg cgcgaattga attatggccc 2820
acaccagtgg cgcggcgact tccagttcaa catcagccgc tacagtcaac agcaactgat 2880
ggaaaccagc catcgccatc tgctgcacgc ggaagaaggc acatggctga atatcgacgg 2940
tttccatatg gggattggtg gcgacgactc ctggagcccg tcagtatcgg cggaattcca 3000
gctgagcgcc ggtcgctacc attaccagtt ggtctggtgt caaaaataa 3049
<210> 3
<211> 562
<212> DNA
<213> herpes simplex virus 1
<400> 3
ccacctggtg ttttgtctcc accatcggcc tgacagagct gtattgtatt ctgcggcggg 60
gcccggcccc caagaacgca gacaaggccg ccgccccggg gcgatccaag gggctgtcgg 120
gcgtctgcgg gcgctgttgt tccatcatcc tgtcgggcat cgcaatgcga ttgtgttata 180
tcgccgtggt ggccggggtg gtgctcgtgg cgcttcacta cgagcaggag atccagaggc 240
gcctgtttga tgtatgacgt cacatccagg ccggcggaaa ccggaacggc atatgcaaac 300
tggaaactgt cctgtcttgg ggcccaccca cccgacgcgt catatgtaaa tgaaaatcgt 360
tcccccgagg ccatgtgtag cctggatccc aacgaccccg cccatgggtc ccaattggcc 420
gtcccgttac caagaccaac ccagccagcg tatccacccc cgcccgggtc cccgcggaag 480
cggaacggtg tatgtgatat gctaattaaa tacatgccac gtacttatgg tgtctgattg 540
gtccttgtct gtgccggagg tg 562
<210> 4
<211> 1605
<212> DNA
<213> herpes simplex virus 1
<400> 4
accggtgcgc caccaccaga ggccatatcc gacaccccag ccccgacggc agccgacagc 60
ccggtcatgg cgactgacat tgatatgcta attgacctcg gcctggacct ctccgacagc 120
gatctggacg aggacccccc cgagccggcg gagagccgcc gcgacgacct ggaatcggac 180
agcaacgggg agtgttcctc gtcggacgag gacatggaag acccccacgg agaggacgga 240
ccggagccga tactcgacgc cgctcgcccg gcggtccgcc cgtctcgtcc agaagacccc 300
ggcgtaccca gcacccagac gcctcgtccg acggagcggc agggccccaa cgatcctcaa 360
ccagcgcccc acagtgtgtg gtcgcgcctc ggggcccggc gaccgtcttg ctcccccgag 420
cggcacgggg gcaaggtggc ccgcctccaa cccccaccga ccaaagccca gcctgcccgc 480
ggcggacgcc gtgggcgtcg caggggtcgg ggtcgcggtg gtcccggggc cgccgatggt 540
ttgtcggacc cccgccggcg tgcccccaga accaatcgca acccgggggg accccgcccc 600
ggggcggggt ggacggacgg ccccggcgcc ccccatggcg aggcgtggcg cggaagtgag 660
cagcccgacc cacccggagg cccgcggaca cggagcgtgc gccaagcacc ccccccgcta 720
atgacgctgg cgattgcccc cccgcccgcg gacccccgcg ccccggcccc ggagcgaaag 780
gcgcccgccg ccgacaccat cgacgccacc acgcggttgg tcctgcgctc catctccgag 840
cgcgcggcgg tcgaccgcat cagcgagagc ttcggccgca gcgcacaggt catgcacgac 900
ccctttgggg ggcagccgtt tcccgccgcg aatagcccct gggccccggt gctggcgggc 960
caaggagggc cctttgacgc cgagaccaga cgggtctcct gggaaacctt ggtcgcccac 1020
ggcccgagcc tctatcgcac ttttgccggc aatcctcggg ccgcatcgac cgccaaggcc 1080
atgcgcgact gcgtgctgcg ccaagaaaat ttcatcgagg cgctggcctc cgccgacgag 1140
acgctggcgt ggtgcaagat gtgcatccac cacaacctgc cgctgcgccc ccaggacccc 1200
attatcggga cggccgcggc ggtgctggat aacctcgcca cgcgcctgcg gccctttctc 1260
cagtgctacc tgaaggcgcg aggcctgtgc ggcctggacg aactgtgttc gcggcggcgt 1320
ctggcggaca ttaaggacat tgcatccttc gtgtttgtca ttctggccag gctcgccaac 1380
cgcgtcgagc gtggcgtcgc ggagatcgac tacgcgaccc ttggtgtcgg ggtcggagag 1440
aagatgcatt tctacctccc cggggcctgc atggcgggcc tgatcgaaat cctagacacg 1500
caccgccagg agtgttcgag tcgtgtctgc gagttgacgg ccagtcacat cgtcgccccc 1560
ccgtacgtgc acggcaaata tttttattgc aactccctgt tttag 1605
<210> 5
<211> 260
<212> DNA
<213> Homo sapiens
<400> 5
ctgcgctgtc ggggccaggc cgggctccca gtggattcgc gggcacagac gcccaggacc 60
gcgcttccca cgtggcggag ggactgggga cccgggcacc cgtcctgccc cttcaccttc 120
cagctccgcc tcctccgcgc ggaccccgcc ccgtcccgac ccctcccggg tccccggccc 180
agccccctcc gggccctccc agcccctccc cttcctttcc gcggccccgc cctctcctcg 240
cggcgcgagt ttcaggcagc 260
<210> 6
<211> 4930
<212> DNA
<213> herpes simplex virus 1
<400> 6
catggcccgc cgccgccatc gcggcccccg ccgcccccgg ccgcccgggc ccacgggcgc 60
ggtcccaacc gcacagtccc aggtaacctc cacgcccaac tcggaacccg tggtcaggag 120
cgcgcccgcg gccgccccgc cgccgccccc cgccagtggg cccccgcctt cttgttcgct 180
gctgctgcgc cagtggctcc acgttcccga gtccgcgtcc gacgacgacg acgacgactg 240
gccggacagc cccccgcccg agccggcgcc agaggcccgg cccaccgccg ccgccccccg 300
cccccggtcc ccaccgcccg gcgcgggccc ggggggcggg gctaacccct cccacccccc 360
ctcacgcccc ttccgccttc cgccgcgcct cgccctccgc ctgcgcgtca ccgcagagca 420
cctggcgcgc ctgcgcctgc gacgcgcggg cggggagggg gcgccgaagc cccccgcgac 480
ccccgcgacc cccgcgaccc ccacgcgggt gcgcttctcg ccccacgtcc gggtgcgcca 540
cctggtggtc tgggcctcgg ccgcccgcct ggcgcgccgc ggctcgtggg cccgcgagcg 600
ggccgaccgg gctcggttcc ggcgccgggt ggcggaggcc gaggcggtca tcgggccgtg 660
cctggggccc gaggcccgtg cccgggccct ggcccgcgga gccggcccgg cgaactcggt 720
ctaacgttac acccgaggcg gcctgggtct tccgcggagc tcccgggagc tccgcaccaa 780
gccgctctcc ggagagacga tggcaggagc cgcgcatata tacgcttgga gccggcccgc 840
ccccgaggcg ggcccgccct cggagggcgg gactggccaa tcggcggccg ccagcgcggc 900
ggggcccggc caaccagcgt ccgccgagtc gtcggggccc ggcccactgg gcggtaactc 960
ccgcccagtg ggccgggccg cccacttccc ggtatggtaa ttaaaaactt gcagaggcct 1020
tgttccgctt cccggtatgg taattagaaa ctcattaatg ggcggccccg gccgcccttc 1080
ccgcttccgg caattcccgc ggcccttaat gggcaacccc ggtattcccc gcctcccgcg 1140
ccgcgcgtaa ccactcccct ggggttccgg gttatgttaa ttgctttttt ggcggaacac 1200
acggcccctc gcgcattggc ccgcgggtcg ctcaatgaac ccgcattggt cccctggggt 1260
tccgggtatg gtaatgagtt tcttcgggaa ggcgggaagc cccggggcac cgacgcaggc 1320
caagcccctg ttgcgtcggc gggaggggca tgctaatggg gttctttggg ggacaccggg 1380
ttggtccccc aaatcggggg ccgggccgtg catgctaatg atattctttg ggggcgccgg 1440
gttggtcccc ggggacgggg ccgccccgcg gtgggcctgc ctcccctggg acgcgcggcc 1500
attgggggaa tcgtcactgc cgcccctttg gggaggggaa aggcgtgggg tataagttag 1560
ccctggcccg acggtctggt cgcatttgca cctcggcact cggagcgaga cgcagcagcc 1620
aggcagactc gggccgcccc ctctccgcat caccacagaa gccccgccta cgttgcgacc 1680
cccagggacc ctccgtcagc gaccctccag ccgcatacga cccccatgga gccccgcccc 1740
ggagcgagta cccgccggcc tgagggccgc ccccagcgcg aggtgagggg ccgggcgcca 1800
tgtctggggc gccatgttgg ggggcgccat gttggggggc gccatgttgg gggacccccg 1860
acccttacac tggaaccggc cgccatgttg ggggaccccc actcatacac gggagccggg 1920
cgccatgttg gggcgccatg ttagggggcg tggaaccccg tgacactata tatacaggga 1980
ccgggggcgc catgttaggg ggcgcggaac cccctgaccc tatatataca gggaccgggg 2040
tcgccctgtt aggggtcgcc atgtgacccc ctgactttat atatacagac ccccaacacc 2100
tacacatggc ccctttgact cagacgcagg gcccggggtc gccgtgggac ccccctgact 2160
catacacaga gacacgcccc cacaacaaac acacagggac cggggtcgcc gtgttagggg 2220
gcgtggtccc cactgactca tacgcagggc ccccttactc acacgcatct aggggggtgg 2280
ggaggagccg cccgccatat ttgggggacg ccgtgggacc cccgactccg gtgcgtctgg 2340
agggcgggag aagagggaag aagaggggtc gggatccaaa ggacggaccc agaccacctt 2400
tggttgcaga cccctttctc ccccctcttc cgaggccagc aggggggcag gactttgtga 2460
ggcggggggg gagggggaac tcgtgggcgc tgattgacgc gggaaatccc cccattctta 2520
cccgcccccc cttttttccc ctcagcccgc cccggatgtc tgggtgtttc cctgcgaccg 2580
agacctgccg gacagcagcg actcggaggc ggagaccgaa gtgggggggc ggggggacgc 2640
cgaccaccat gacgacgact ccgcctccga ggcggacagc acggacacgg aactgttcga 2700
gacggggctg ctggggccgc agggcgtgga tgggggggcg gtctcggggg ggagcccccc 2760
ccgcgaggaa gaccccggca gttgcggggg cgccccccct cgagaggacg gggggagcga 2820
cgagggcgac gtgtgcgccg tgtgcacgga tgagatcgcg ccccacctgc gctgcgacac 2880
cttcccgtgc atgcaccgct tctgcatccc gtgcatgaaa acctggatgc aattgcgcaa 2940
cacctgcccg ctgtgcaacg ccaagctggt gtacctgata gtgggcgtga cgcccagcgg 3000
gtcgttcagc accatcccga tcgtgaacga cccccagacc cgcatggagg ccgaggaggc 3060
cgtcagggcg ggcacggccg tggactttat ctggacgggc aatcagcggt tcgccccgcg 3120
gtacctgacc ctgggggggc acacggtgag ggccctgtcg cccacccacc ctgagcccac 3180
cacggacgag gatgacgacg acctggacga cggtgaggcg ggggggcggc gaggaccctg 3240
ggggaggagg aggagggggg ggggagggag gaataggcgg gcgggcgggc gaggaaaggg 3300
cgggccgggg agggggcgta acctgatcgc gccccccgtt gtctcttgca gcagactacg 3360
taccgcccgc cccccgccgg acgccccgcg cccccccacg cagaggcgcc gccgcgcccc 3420
ccgtgacggg cggggcgtct cacgcagccc cccagccggc cgcggctcgg acagcgcccc 3480
cctcggcgcc catcgggcca cacggcagca gtaacactaa caccaccacc aacagcagcg 3540
gcggcggcgg ctcccgccag tcgcgagccg cggtgccgcg gggggcgtct ggcccctccg 3600
ggggggttgg ggttgttgaa gcggaggcgg ggcggccgag gggccggacg ggcccccttg 3660
tcaacagacc cgcccccctt gcaaacaaca gagaccccat agtgatcagc gactcccccc 3720
cggcctctcc ccacaggccc cccgcggcgc ccatgccagg ctccgccccc cgccccggtc 3780
cccccgcgtc cgcggccgcg tcgggccccg cgcgcccccg cgcggccgtg gccccgtgtg 3840
tgcgggcgcc gcctccgggg cccggccccc gcgccccggc ccccggggcg gagccggccg 3900
cccgccccgc ggacgcgcgc cgtgtgcccc agtcgcactc gtccctggct caggccgcga 3960
accaagaaca gagtctgtgc cgggcgcgtg cgacggtggc gcgcggctcg ggggggccgg 4020
gcgtggaggg tggacacggg ccctcccgcg gcgccgcccc ctccggcgcc gccccctccg 4080
gcgccccccc gctcccctcc gccgcctctg tcgagcagga ggcggcggtg cgtccgagga 4140
agaggcgcgg gtcgggccag gaaaacccct ccccccagtc cacgcgtccc cccctcgcgc 4200
cggcaggggc caagagggcg gcgacgcacc ccccctccga ctcagggccg ggggggcgcg 4260
gccagggagg gcccgggacc cccctgacgt cctcggcggc ctccgcctct tcctcctccg 4320
cctcttcctc ctcggccccg actcccgcgg gggccacctc ttccgccacc ggggccgcgt 4380
cctcctccgc ttccgcctcc tcgggcgggg ccgtcggtgc cctgggaggg agacaagagg 4440
aaacctccct cggcccccgc gctgcttctg ggccgcgggg gccgaggaag tgtgcccgga 4500
agacgcgcca cgcggagact tccggggccg tccccgcggg cggcctcacg cgctacctgc 4560
ccatctcggg ggtctctagc gtggtcgccc tgtcgcctta cgtgaacaag acgatcacgg 4620
gggactgcct gcccatcctg gacatggaga cggggaacat cggggcgtac gtggtcctgg 4680
tggaccagac gggaaacatg gcgacccggc tgcgggccgc ggtccccggc tggagccgcc 4740
gcaccctgct ccccgagacc gcgggtaacc acgtgacgcc ccccgagtac ccgacggccc 4800
ccgcgtcgga gtggaacagc ctctggatga cccccgtggg gaacatgctg ttcgaccagg 4860
gcaccctagt gggcgccctg gacttccgca gcctgcggtc tcggcacccg tggtccgggg 4920
agcagggggc 4930
<210> 7
<211> 239
<212> PRT
<213> artificial
<220>
<223> GFP
<400> 7
Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu
1 5 10 15
Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly
20 25 30
Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile
35 40 45
Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr
50 55 60
Leu Thr Tyr Gly Val Gln Cys Phe Ser Arg Tyr Pro Asp His Met Lys
65 70 75 80
Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu
85 90 95
Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu
100 105 110
Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly
115 120 125
Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr
130 135 140
Asn Tyr Asn Ser His Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn
145 150 155 160
Gly Ile Lys Val Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser
165 170 175
Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly
180 185 190
Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu
195 200 205
Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe
210 215 220
Val Thr Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys
225 230 235
<210> 8
<211> 253
<212> PRT
<213> artificial
<220>
<223> PD-1 scFv
<400> 8
Asp Val Leu Met Thr Gln Thr Pro Leu Phe Leu Pro Val Ser Leu Gly
1 5 10 15
Asp Gln Ala Ser Ile Phe Cys Arg Ser Ser Gln Asn Ile Val His Ile
20 25 30
Asn Gly Asn Thr Tyr Leu Glu Trp Tyr Leu Gln Lys Pro Gly Gln Phe
35 40 45
Pro Lys Leu Leu Met Tyr Lys Val Ser Asn Arg Phe Phe Gly Val Pro
50 55 60
Asp Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Lys Ile
65 70 75 80
Ser Arg Val Glu Ala Glu Asp Leu Gly Val Tyr Tyr Cys Phe Gln Gly
85 90 95
Ser His Val Pro Trp Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Lys
100 105 110
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
115 120 125
Gly Gly Gly Ser Ser Asp Val Gln Val Gln Glu Ser Gly Pro Gly Leu
130 135 140
Val Lys Pro Ser Gln Ser Leu Ser Leu Thr Cys Thr Val Thr Gly Ser
145 150 155 160
Ser Ile Thr Ser Asp Phe Ala Trp Glu Trp Ile Arg Gln Phe Pro Gly
165 170 175
Asn Lys Leu Glu Cys Met Gly Tyr Ile Gly Tyr Ser Gly Gly Thr Ile
180 185 190
Tyr Asn Pro Ser Leu Lys Ser Arg Ile Ser Ile Thr Arg Asp Thr Ser
195 200 205
Lys Asn Gln Phe Phe Leu Gln Leu Asn Ser Val Thr Thr Glu Asp Thr
210 215 220
Ala Thr Tyr Tyr Cys Ala Arg Trp His Gly Ser Ser His Trp Tyr Phe
225 230 235 240
Asp Val Trp Gly Ala Gly Thr Thr Val Thr Val Ser Ser
245 250
<210> 9
<211> 26
<212> DNA
<213> artificial
<220>
<223> primer
<400> 9
gacgtgtgcg ccgtgtgcac ggatga 26
<210> 10
<211> 29
<212> DNA
<213> artificial
<220>
<223> primer
<400> 10
actctgttct tggttcgcgg cctgagcca 29
<210> 11
<211> 21
<212> DNA
<213> artificial
<220>
<223> primer
<400> 11
atggcccgcc gccgccatcg c 21
<210> 12
<211> 20
<212> DNA
<213> artificial
<220>
<223> primer
<400> 12
ttagaccgag ttcgccgggc 20
<210> 13
<211> 29
<212> DNA
<213> artificial
<220>
<223> primer
<400> 13
atggcgactg acattgatat gctaattga 29
<210> 14
<211> 32
<212> DNA
<213> artificial
<220>
<223> primer
<400> 14
ctaaaacagg gagttgcaat aaaaatattt gc 32
<210> 15
<211> 26
<212> DNA
<213> artificial
<220>
<223> primer
<400> 15
ctcccagtgg attcgcgggc acagac 26
<210> 16
<211> 25
<212> DNA
<213> artificial
<220>
<223> primer
<400> 16
ctgcctgaaa ctcgcgccgc gagga 25
<210> 17
<211> 1470
<212> DNA
<213> herpes simplex virus 1
<400> 17
ctactcgtcc cagaatttgg ccaggacgtc cttgtagaac gcgggtgggg gggcctgggt 60
ccgcagctgc tccagaaacc tgtcggcgat atcaggggcc gtgatatgcc gggtcacaat 120
agatcgcgcc aggttttcgt cgcggatgtc ctggtagata ggcaggcgtt tcagaagagt 180
ccacggcccc cgctccttgg ggccgataag cgatatgacg tacttaatgt agcggtgttc 240
caccagctcg gtgatggtca tgggatcggg gagccagtcc agggactctg gggcgtcgtg 300
gatgacgtgg cgtcgccggc tggccacata actgcggtgc tcttccagca gctgcgcgtt 360
cgggacctgg acgagctcgg gcggggtgag tatctccgag gaggacgacc tggggccggg 420
gtggcccccg gtaacgtccc ggggatccag ggggaggtcc tcgtcgtctt cgtatccgcc 480
ggcgatctgt tgggttagaa tttcggtcca cgagacgcgc atctcggtgc cgccggcggc 540
cggcggcaaa gggggcctgg tttccgtgga gcgcgagctg gtgtgttccc ggcggatggc 600
ccgccgggtc tgagagcgac tcgggggggt ccagtgacat tcgcgcagca catcctccac 660
ggaggcgtag gtgttattgg gatggaggtc ggtgtggcag cggacaaaga gggccaggaa 720
ctgggggtag ctcatcttaa agtactttag tatatcgcga cagttgatcg tgggaatgta 780
gcaggcgcta atatccaaca caatatcaca gcccatcaac aggaggtcag tgtctgtggt 840
gtacacgtac gcgaccgtgt tggtgtgata gaggttggcg caggcatcgt ccgcctccag 900
ctgacccgag ttaatgtagg cgtaccccag ggcccggaga acgcgaatac agaacagatg 960
cgccagacgc agggccggct tcgagggcgc ggcggacggc agcgcggctc cggacccggc 1020
cgtcccccgg gtccccgagg ccagagaggt gccgcgccgg cgcatgttgg aaaaggcaga 1080
gctgggtctg gagtcggtga tgggggaagg cggtggagag gcgtccacgt cactggcctc 1140
ctcgtccgtc cggcattggg ccgtcgtgcg ggccaggatg gccttggctc caaacacaac 1200
cggctccata caattgaccc cgcgatcggt aacgaagatg gggaaaaggg acttttgggt 1260
aaacaccttt aataagcgac agaggcagtg tagcgtaatg gcctcgcggt cgtaactggg 1320
gtatcggcgc tgatatttga ccaccaacgt gtacatgacg ttccacaggt ccacggcgat 1380
gggggtgaag tacccggccg gggccccaag gccctggcgc ttgaccagat ggtgtgtgtg 1440
ggcaaacttc atcatcccga acaaacccat 1470
<210> 18
<211> 1248
<212> DNA
<213> herpes simplex virus 1
<400> 18
atgctccgca acgacagcca ccgggccgcg tccccggagg acggccaggg acgggtcgac 60
gacggacggc cacacctcgc gtgcgtgggg gccctggcgc gggggttcat gcatatctgg 120
cttcaggccg ccacgctggg ttttgcggga tcggtcgtta tgtcgcgcgg gccgtacgcg 180
aatgccgcgt ctggggcgtt cgccgtcggg tgcgccgtgc tgggctttat gcgcgcaccc 240
cctcccctcg cgcggcccac cgcgcggata tacgcctggc tcaaactggc ggccggtgga 300
gcggcccttg ttctgtggag tctcggggag cccggaacgc agccgggggc cccgggcccg 360
gccacccagt gcctggcgct gggcgccgcc tatgcggcgc tcctggtgct cgccgatgac 420
gtctatccgc tctttctcct cgccccgggg cccctgttcg tcggcaccct ggggatggtc 480
gtcggcgggc tgacgatcgg aggcagcgcg cgctactggt ggatcggtgg gcccgccgcg 540
gccgccttgg ccgcggcggt gttggcgggc ccgggggcga ccaccgccag ggactgcttc 600
tccagggcgt gccccgacca ccgccgcgtc tgcgtcatcg tcgcaggcga gtctgtttcc 660
cgccgccccc cggaggaccc agagcgaccc ggggaccccg ggccaccgtc ccccccgaca 720
ccccaacgat cccaggggcc gccggccgat gaggtcgcac cggccggggt agcgcggccc 780
gaaaacgtct gggtgcccgt ggtcaccttt ctgggggcgg gcgcgctcgc cgtcaagacg 840
gtgcgagaac atgcccggga aacgccgggc ccgggcctgc cgctgtggcc ccaggtgttt 900
ctcggaggcc atgtggcggt ggccctgacg gagctgtgtc aggcgcttat gccctgggac 960
cttacggacc cgctgctgtt tgttcacgcc ggactgcagg tcatcaacct cgggttggtg 1020
tttcggtttt ccgaggttgt cgtgtatgcg gcgctagggg gtgccgtgtg gatttcgttg 1080
gcgcaggtgc tggggctccg gcgtcgcctg cacaggaagg accccgggga cggggcccgg 1140
ttggcggcga cgcttcgggg cctcttcttc tccgtgtacg cgctggggtt tggggtgggg 1200
gcgctgctgt gccctccggg gtcaacgggc gggtggtcgg gcgattga 1248
<210> 19
<211> 1473
<212> DNA
<213> herpes simplex virus 1
<400> 19
ctacccaccg tactcgtcaa ttccaagggc atcggtaaac atctgctcaa actcgaagtc 60
ggccatatcc agagcgccgt agggggcgga gtcgtggggg gtaaatcccg gacccgggga 120
atccccgtcc cccaacatgt ccagatcgaa atcgtctagc gcgtcggcat gcgccatcgc 180
cacgtcctcg ccgtctaagt ggagctcgtc ccccaggctg acatcggtcg ggggggccgt 240
cgacagtctg cgcgtgtgtc ccgcggggag aaaggacagg cgcggagccg ccagccccgc 300
ctcttcgggg gcgtcgtcgt ccgggagatc gagcaggccc tcgatggtag acccgtaatt 360
gtttttcgta cgcgcgcggc tgtacgcgtg ttcccgcatg accgcctcgg agggcgaggt 420
cgtgaagctg gaatacgagt ccaacttcgc ccgaatcaac accataaagt acccagaggc 480
gcgggcctgg ttgccatgca gggtgggagg ggtcgtcaac ggcgcccctg gctcctccgt 540
agccgcgctg cgcaccagcg ggaggttaag gtgctcgcga atgtggttta gctcccgcag 600
ccggcgggcc tcgattggca ctccccggac ggtgagcgct ccgttgacga acatgaaggg 660
ctggaacaga cccgccaact gacgccagct ctccaggtcg caacagaggc agtcaaacag 720
gtcgggccgc atcatctgct cggcgtacgc ggcccatagg atctcgcggg tcaaaaatag 780
atacaaatgc aaaaacagaa cacgcgccag acgagcggtc tctcggtagt acctgtccgc 840
gatcgtggcg cgcagcattt ctcccaggtc gcgatcgcgt ccgcgcatgt gcgcctggcg 900
gtgcagctgc cggacgctgg cgcgcaggta ccggtacagg gccgagcaga agttggccaa 960
cacggttcga tagctctcct cccgcgcccg tagctcggcg tggaagaaac gagagagcgc 1020
ttcgtagtag agcccgaggc cgtcgcgggt ggccggaagc gtcgggaagg ccacgtcgcc 1080
gtgggcgcga atgtcgattt gggcgcgttc ggggacgtac gcgtcccccc attccaccac 1140
atcgctgggc agcgttgata ggaatttaca ctcccggtac aggtcggcgt tggtcggtaa 1200
cgccgaaaac aaatcctcgt tccaggtatc gagcatggta catagcgcgg ggcccgcgct 1260
aaagcccaag tcgtcgagga gacggttaaa gagggcggcg ggggggacgg gcatgggcgg 1320
ggagggcatg agctgggcct ggctcaggcg ccccgttgcg tacagcggag gggccgccgg 1380
ggtgtttttg ggacccccgg ccgggcgggg gggtggtggc gaagcgccgt ccgcgtccat 1440
gtcggcaaac agctcgtcga ccaagaggtc cat 1473
<210> 20
<211> 561
<212> DNA
<213> herpes simplex virus 1
<400> 20
atgacagcga cccccctcac caacctgttc ttacgggccc cggacataac ccacgtggcc 60
cccccttact gcctcaacgc cacctggcag gccgaaacgg ccatgcacac cagcaaaacg 120
gactccgctt gcgtggccgt gcggagttac ctggtccgcg cctcctgtga gaccagcggc 180
acaatccact gctttttctt tgcggtatac aaggacaccc accatacccc tccgctgatt 240
accgagctcc gcaactttgc ggacctggtt aaccacccgc cggtcctacg cgaactggag 300
gataagcgcg gggtgcggct gcggtgtgcg cggccgttta gcgtcgggac gattaaggac 360
gtctctgggt ccggcgcgtc ctcggcggga gagtacacga taaacgggat cgtgtaccac 420
tgccactgtc ggtatccgtt ctcaaaaaca tgctggatgg gggcctccgc ggccctacag 480
cacctgcgct ccatcagctc cagcggcatg gccgcccgcg cggcagagca tcgacgcgtc 540
aagattaaaa ttaaggcgtg a 561
<210> 21
<211> 876
<212> DNA
<213> herpes simplex virus 1
<400> 21
ctacagggtg gtaaccggat agcagatgtg aggaagtctg ggccgttcgc cgcgaacggc 60
gatcagaggg tccgtttctt gcggaccacg gcccggtgat gtgggttgct cgtctaaaat 120
ctcgggcata cccatacacg cacaacacgg acgccgcacc gaatgggacg tcgtaagggg 180
gtgggaggta gctgggtggg gtttgtgcag agcaatcagg gaccgcagcc agcgcataca 240
atcgcgctcc cgtccgttgg tcccgggcag gaccacgccg tactggtatt cgtaccggct 300
gagcagggtc tccagggggt ggttgggtgc cgcggggaac ggggtccacg ccacggtcca 360
ctcgggcaaa aaccgagtcg gcacggccca cggttctccc acccacgcgt ctggggtctt 420
gatggcgata aatcttaccc cgagccggat tttttgggcg tattcgagaa acggcacaca 480
cagatccgcc gcgcctacca cccacaagtg gtagaggcga ggggggctgg gttggtctcg 540
gtgcaacagt cggaagcacg ccacggcgtc cacgacctcg gtgctctcca aggggctgtc 600
ctccgcaaac aggcccgtgg tggtgtttgg ggggcagcga caggacctag tgcgcacgat 660
cgggcgggtg ggtttgggta agtccatcag cggctcggcc aaccgtcgaa ggttggccgg 720
gcgaacgacg accggggtac ccaggggttc tgatgccaaa atgcggcact gcctaagcag 780
gaagctccac agggccgggc ttgcgtcgac ggaagtccgg ggcagggcgt tgttctggtc 840
aaggagggtc attacgttga cgacaacaac gcccat 876
<210> 22
<211> 2282
<212> DNA
<213> herpes simplex virus 1
<400> 22
cccgggaccc ccctgacgtc ctcggcggcc tccgcctctt cctcctccgc ctcttcctcc 60
tcggccccga ctcccgcggg ggccacctct tccgccaccg gggccgcgtc ctcctccgct 120
tccgcctcct cgggcggggc cgtcggtgcc ctgggaggga gacaagagga aacctccctc 180
ggcccccgcg ctgcttctgg gccgcggggg ccgaggaagt gtgcccggaa gacgcgccac 240
gcggagactt ccggggccgt ccccgcgggc ggcctcacgc gctacctgcc catctcgggg 300
gtctctagcg tggtcgccct gtcgccttac gtgaacaaga cgatcacggg ggactgcctg 360
cccatcctgg acatggagac ggggaacatc ggggcgtacg tggtcctggt ggaccagacg 420
ggaaacatgg cgacccggct gcgggccgcg gtccccggct ggagccgccg caccctgctc 480
cccgagaccg cgggtaacca cgtgacgccc cccgagtacc cgacggcccc cgcgtcggag 540
tggaacagcc tctggatgac ccccgtgggg aacatgctgt tcgaccaggg caccctagtg 600
ggcgccctgg acttccgcag cctgcggtct cggcacccgt ggtccgggga gcagggggcg 660
tcgacccggg acgagggaaa acaataaggg acgcccccgt gtttgtgggg aggggggggt 720
cgggcgctgg gtggtctctg gccgcgccca ctacaccagc caatccgtgt cggggaggtg 780
gaaagtgaaa gacacgggca ccacacacca gcgggtcttt tgtgttggcc ctaataaaaa 840
aaactcaggg gatttttgct gtctgttggg aaataaaggt ttacttttgt atcttttccc 900
tgtctgtgtt ggatgtatcg cgggggtgcg tgggagtggg ggtgcgtggg agtgggggtg 960
cgtgggagtg ggggtgcgtg ggagtggggg tgcgtgggag tgggggtgcg tgggagtggg 1020
ggtgcgtggg agtgggggtg cgtgggagtg ggggtgcgtg ggagtggggg tgccatgttg 1080
ggcaggctct ggtgttaacc acagagccgc ggcccgggct gcctgaccac cgatccccga 1140
aagcatcctg ccactggcat ggagccagaa ccacagtggg ttgggtgtgg gtgttaagtt 1200
tccgcgagcg cctgcccgcc cggactgacc tggcctctgg ccgccacaaa gggcgggggg 1260
gggggttaac tacactatag ggcaacaaag gatgggaggg gtagcggggc gggacggggc 1320
gcccaaaagg gggtcggcca caccacagac gtgggtgttg gggggtgggg cggaggggtg 1380
gggggggaga cagaaacagg aacatagtta gaaaacaaga atgcggtgca gccagagaat 1440
cacaggagac gaggggatgg gcgtgttggt taccaaccca cacccaggca tgctcggtgg 1500
tatgaaggag ggggggcggt gtttcttaga gaccgccggg ggacgtgggg ttggtgtgca 1560
aaggcacgcg cacccgcgcc ggccaggtgg gccggtaccc catccccccc tcccccgacc 1620
cttcccaccc ccgcgtgcca gagatcaccc cggtcccccg gcacccgcca ctcctccata 1680
tcctcgcttt aggaacaact ttaggggggg gtacacacgc gccgtgcatt tccttccaca 1740
ccccccccct cccccgcact cccccccccc aggcagtaag acccaagcat agagagccag 1800
gcacaaaaac acaggcgggg tgggacacat gccttcttgg agtacgtggg tcattggcgt 1860
ggggggttac agcgacaccg gccgaccccc tggcggtctt ccagccggcc cttagataag 1920
ggggcagttg gtggtcggac gggtaagtaa cagagtctaa ctaagggtgg gaggggggga 1980
aaataacggg ctggtgtgct gtaacacgag cccacccgcg agtggcgtgg ccgaccttag 2040
cctctggggc gccccctgtc gtttgggtcc ccccccctct attggggaga agcaggtgtc 2100
taacctacct ggaaacgcgg cgtctttgtt gaacgacacc ggggcgccct cgacgagtgg 2160
gataacgggg gaggaaggga gggaggaggg tactgggggt gaaggggggg ggggagaagc 2220
gagaacagga aaggcgacgg agcccggcag aacaccgagg aaaaaaaaac cacagcgcat 2280
gc 2282
<210> 23
<211> 1633
<212> DNA
<213> herpes simplex virus 1
<400> 23
ccatgttggg caggctctgg tgttaaccac agagccgcgg cccgggctgc ctgaccaccg 60
atccccgaaa gcatcctgcc actggcatgg agccagaacc acagtgggtt gggtgtgggt 120
gttaagtttc cgcgagcgcc tgcccgcccg gactgacctg gcctctggcc gccacaaagg 180
gcgggggggg gggttaacta cactataggg caacaaagga tgggaggggt agcggggcgg 240
gacggggcgc ccaaaagggg gtcggccaca ccacagacgt gggtgttggg gggtggggcg 300
gaggggtggg gggggagaca gaaacaggaa catagttaga aaacaagaat gcggtgcagc 360
cagagaatca caggagacga ggggatgggc gtgttggtta ccaacccaca cccaggcatg 420
ctcggtggta tgaaggaggg ggggcggtgt ttcttagaga ccgccggggg acgtggggtt 480
ggtgtgcaaa ggcacgcgca cccgcgccgg ccaggtgggc cggtacccca tccccccctc 540
ccccgaccct tcccaccccc gcgtgccaga gatcaccccg gtcccccggc acccgccact 600
cctccatatc ctcgctttag gaacaacttt aggggggggt acacacgcgc cgtgcatttc 660
cttccacacc ccccccctcc cccgcactcc ccccccccag gcagtaagac ccaagcatag 720
agagccaggc acaaaaacac aggcggggtg ggacacatgc cttcttggag tacgtgggtc 780
attggcgtgg ggggttacag cgacaccggc cgaccccctg gcggtcttcc agccggccct 840
tagataaggg ggcagttggt ggtcggacgg gtaagtaaca gagtctaact aagggtggga 900
gggggggaaa ataacgggct ggtgtgctgt aacacgagcc cacccgcgag tggcgtggcc 960
gaccttagcc tctggggcgc cccctgtcgt ttgggtcccc ccccctctat tggggagaag 1020
caggtgtcta acctacctgg aaacgcggcg tctttgttga acgacaccgg ggcgccctcg 1080
acgagtggga taacggggga ggaagggagg gaggagggta ctgggggtga aggggggggg 1140
ggagaagcga gaacaggaaa ggcgacggag cccggcagaa caccgaggaa aaaaaaacca 1200
cagcgcatgc gccgggccgt tgtggggccc cgggccgggg ccccttgggt ccgccggggc 1260
cccgggccgg gccgccacgg gggccggccg ttggcggtaa ccccgagtgt tcatctcagg 1320
ccccgggccg ggaacccgga aaagcctccg gggggccttt ttcgcgtcgc gtgccggcga 1380
gcgggtccgg acggggcccg gaccgccgcg gtcgggggcc cctcgtcccg ggccgtacgc 1440
ggccttcgcc ccgtgagggg acagacgaac gaaacattcc ggcgacggaa cgaaaaacac 1500
cccagacggg ttaaagaaac agaaaccgca acccccacca cccccgaaac ggggaaaacg 1560
aaaaaacaga ccagcggccg gccggcgctt agggggagga tgtcgccgac gccccttggc 1620
cgccccggct gca 1633