CN108026567B - 分析病毒来源治疗剂的方法 - Google Patents
分析病毒来源治疗剂的方法 Download PDFInfo
- Publication number
- CN108026567B CN108026567B CN201680045182.1A CN201680045182A CN108026567B CN 108026567 B CN108026567 B CN 108026567B CN 201680045182 A CN201680045182 A CN 201680045182A CN 108026567 B CN108026567 B CN 108026567B
- Authority
- CN
- China
- Prior art keywords
- sequence
- sequencing
- viral
- virus
- dna
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/70—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving virus or bacteriophage
- C12Q1/701—Specific hybridization probes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1096—Processes for the isolation, preparation or purification of DNA or RNA cDNA Synthesis; Subtracted cDNA library construction, e.g. RT, RT-PCR
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/70—Vectors or expression systems specially adapted for E. coli
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6813—Hybridisation assays
- C12Q1/6827—Hybridisation assays for detection of mutation or polymorphism
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B40/00—Libraries per se, e.g. arrays, mixtures
- C40B40/04—Libraries containing only organic compounds
- C40B40/06—Libraries containing nucleotides or polynucleotides, or derivatives thereof
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2521/00—Reaction characterised by the enzymatic activity
- C12Q2521/30—Phosphoric diester hydrolysing, i.e. nuclease
- C12Q2521/301—Endonuclease
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2521/00—Reaction characterised by the enzymatic activity
- C12Q2521/30—Phosphoric diester hydrolysing, i.e. nuclease
- C12Q2521/319—Exonuclease
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2535/00—Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
- C12Q2535/122—Massive parallel sequencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/156—Polymorphic or mutational markers
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Genetics & Genomics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Immunology (AREA)
- Analytical Chemistry (AREA)
- Biomedical Technology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Virology (AREA)
- Plant Pathology (AREA)
- Medicinal Chemistry (AREA)
- General Chemical & Material Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
本文描述了用于病毒来源治疗剂,例如病毒疫苗,包括PVS‑RIPO疫苗的大规模平行测序方法。该方法能够测定低频序列变体的微异质性并对其定量,在PVS‑RIPO的情况下,有望替代目前用于筛选多批RNA病毒来源治疗剂的猴神经毒力安全性试验(MNVT)以及通过PCR和限制性酶切割(MAPREC)法进行的突变体分析。
Description
相关申请的交叉引用
本申请要求2015年7月31日递交的美国临时申请号62/199,663的优先权,其通过引用并入本申请。
领域
本发明涉及基于文库的深度测序方法,用于分析批量的病毒来源治疗剂,例如活的减毒脊髓灰质炎疫苗。
背景
PVS-RIPO是一种嵌合脊髓灰质炎病毒(PV),由携带来自人类鼻病毒2型(HRV2)的外来的内部核糖体进入位点(IRES)的减毒口服1型萨宾(Sabin)疫苗株组成(Brown等,(2014)Cancer 120:3277-86;Goetz等,(2011)Future Virol.9:1045-1058;Goetz&Gromeier(2010)Cytokine&Growth Fact Rev;21:197-203)。脊髓灰质炎病毒是严重的神经退行性疾病脊髓灰质炎的病原体。工程化的PVS-RIPO作为非致病性治疗性病毒用于治疗多形性成胶质细胞瘤(GBM)和其它CD155+癌症(WO2014/081937)。
IRES是微小核糖核酸病毒基因组RNA的5'非翻译区内的关键非编码序列元件,因为其以5'末端、7-甲基-鸟苷('帽')-独立的方式介导翻译起始(Dobrikova等(2003)PNASUSA 100:15125-15130;Dobrikova等,(2003)Virology 311:241-253;Dufresne等,(2002)JVirol 76:8966-8972)。IRES是所有三种PV萨宾疫苗株和PVSRIPO的神经减毒表型的主要决定因素(Campbell等(2005)J Virol 79:6281-6290;Dobrikova等(2006)J Virol 80:3310-3321;Brown和Gromeier(2015)Curr Opinion Virol 13:81-85)。从机制上看,神经减毒是由于形成阻止核糖体募集的神经元特异性(IRES)核糖核蛋白复合物。在萨宾疫苗株中,神经元IRES无能性依赖于映射到茎环结构域5的离散区域的单点突变;而导致神经减毒的这个少见碱基是导致它们臭名昭着的倾向于恢复神经毒力的可能原因。逆向反转可以通过随机基因突变或与野生型序列同源重组而发生,或者在疫苗生产期间,或者在患者施用后(若使用活病毒)。PVSRIPO具有完整的功能性整合的HRV2IRES,一种天然存在的肠道病毒。与萨宾型1/3IRES相比,其在组织培养中的缺陷经过选择,HRV2IRES在本质上比萨宾IRES更大程度上不可用于神经元。HRV2IRES中神经元功能不全的遗传印迹至少跨越茎环结构域5(约40nt)和结构域6(约25nt)的上部(Brown等,(2014)Cancer 120:3277-86;Dobrikova等,(2003)PNAS USA 100:15125-15130;Dobrikova等,(2003)Virology 311:241-253;Dufresne等,(2002)J Virol 76:8966-8972)。由于共同的HRV2IRES序列可能是由于人类进化了数千年而来的,因此它可能代表HRV2靶细胞(呼吸道上皮细胞中的有丝分裂活性细胞)的翻译起始介质的理想化版本。
由于脊髓灰质炎病毒和PVS-RIPO是单链RNA(ssRNA)病毒,因此在病毒复制期间(例如在构建体开发和生产期间)突变的天然频率高于用DNA基因组的dsDNA病毒和生物体所观察到的频率。目前,在临床使用之前,必须通过体内灵长类动物神经毒性安全性测试和体外噬菌斑测序方法对每个临床批次的活的或灭活的脊髓灰质炎病毒进行验证,以证实该批次不包含能够再生神经毒性表型的罕见遗传回复突变而导致脊髓灰质炎。疫苗批次的灵长类神经毒性测试通常需要几个月才能完成,体外噬菌斑测序方法的灵敏度相对较差。
由于它们在PV神经减毒中的突出作用,文献中描述的用于评估潜在脊髓灰质炎疫苗神经毒性的大多数方法集中于IRES中明确定义的位点(Martin等,(2011)WHO工作组关于修订世界卫生组织关于脊髓灰质炎疫苗生产和控制的建议(口头)的讨论:TRS No.904和910.2010年7月20-22日在瑞士日内瓦举行的会议报告,Vaccine;29:6432-6436;Rezapkin等(1998)Virology 245:183-187;Chumakov等,(1994)J Med Virol 42:79-85;Laassri等,(2006)J Infect Diseases 193:1344-1349)。用PVSRIPO中的HRV2IRES完全替代脊髓灰质炎IRES提出了如何表征嵌合病毒毒理学特征的问题。由于脊髓灰质炎疫苗制造商使用的体外方法与HRV2IRES序列(即MAPREC)无关,因此这留下了作为产品安全性判断者的体内测试方法和病毒遗传稳定性的表征。根据WHO指南(Dobrikova等,(2012)J Virol 86:2750-2759),使用食蟹猴(cynomolgus macaques)进行体内灵长类神经毒性测试,包括施用后组织学检查。先前的HTB-15细胞异体移植物(在Balb/c小鼠中)和噬斑测序研究表明,PVSRIPO基因组在体内连续传代和病毒扩增后是稳定的且为非致病的。使用Sanger测序,在HTB-15异种移植研究中仅注意到两个多态性位点为第97和1824位(Dobrikova等人,(2008)MolTher 16:1865-1872;Cello J等人,(2008)J Med Virol 80:352-359。)。有趣的是,在PVSRIPO的依诺米那(Illumina)深度测序中,这两个位点都没有被鉴定为多态性,表明它们是在HTB-15细胞中传代后基因重新突变的结果。综上所述,前两项研究的结果表明PVSRIPO相对于野生型PV没有毒性。这两种通用方法已被用于确定PVSRIPO在灵长类动物中不表现出神经性表型,并且使用直接和基于斑块的Sanger测序方法,PVSRIPO表现出低水平的序列异质性。还使用了对病毒遗传稳定性和均一性进行总体评估的其它较不敏感的方法,例如温度敏感性(即RCT40)和一般安全性测试(例如体内外试剂测试和RT-qPCR)。随着测序技术的进步,Sanger测序固有的灵敏度限制(每个碱基变异约15-20%的LoD)已经用“下一代测序”(NGS)方法克服,其理论上能够对碱基变体<1%敏感(Cabannes等,(2014)PDA J PharmSci and Tech 68:631-638;Liu等,(2012)Comparison of next-generation sequencingsystems.J Biomed Biotech 2012;2012:251364;Neverov&Chumakov)PNAS USA 107:20063-20068。)。大多数NGS深度测序方法的灵敏度仅受限于其内在的错误掺入或误确认错误率,其大于基础检测技术的灵敏度限制。
所需要的是对多批病毒来源治疗剂(如PVS-RIPO)中突变进行检测的改进方法。
概要
本发明提供了测定病毒来源治疗剂的方法,用于检测病毒序列变体的存在。可以用所公开的方法分析的病毒来源治疗剂的例子包括但不限于:病毒、病毒模板质粒或疫苗,例如来源于脊髓灰质炎病毒(如PVS-RIPO)、麻疹病毒、甲型肝炎病毒、乙型肝炎病毒、丙型肝炎病毒、腺病毒、疱疹病毒、腮腺炎病毒、流感病毒、风疹病毒、HIV或HTLV。
所公开的方法包括从病毒种子库、收获物和/或纯化的药物产品批次(例如主病毒库或工作细胞库)中提取(如分离)核酸分子,其中病毒种子库、收获物和/或纯化的药物产品批次(例如主要病毒库或工作细胞库)包括含有病毒来源治疗剂的宿主细胞。由于所得样品中存在不需要的宿主细胞基因组DNA和宿主细胞线粒体DNA,在基本上可消化宿主细胞基因组DNA和宿主细胞线粒体DNA、但基本不消化所需的病毒核酸分子(如病毒基因组RNA或DNA,或病毒模板质粒)的条件下所提取的核酸分子与DNA酶一起孵育(例如进行接触)。这种条件的例子为:37℃下、30分钟。所得的经富集的病毒核酸分子可以是DNA或RNA。如果它们是RNA,则该方法包括从富集的病毒RNA产生双链(ds)DNA(例如dscDNA),例如,利用逆转录并产生第二病毒核酸链。病毒双链DNA(例如,dscDNA)经扩增(如使用PCR)后,对扩增的病毒双链DNA进行定量。然后从至少500pg扩增的病毒dsDNA产生测序文库。测序文库包括与病毒双链DNA相连的5'-衔接子和3'-衔接子(例如,病毒双链DNA片段包括与其相连的5'衔接子以及3'衔接子)。使用下一代测序(例如使用平行单端或双端测序)对得到的测序文库进行测序以产生包含多个序列读序的原始序列数据集。将多个序列读序与病毒来源治疗剂(如非突变序列)的参考序列进行比对,以产生包含多个匹配的序列读序的匹配序列。根据匹配的序列读序,可以确定病毒来源治疗剂的序列,并鉴定是否存在序列变异(例如突变)。
在一些实施例中,在对来自MVB的病毒来源治疗剂进行测序之后,所述方法还包括:将来自MVB的病毒来源治疗剂引入宿主细胞,例如哺乳动物细胞(如Vero细胞)以产生病毒来源治疗剂。然后可以对从第二宿主细胞中产生获得的病毒来源治疗剂进行测序,并将其序列与从MVB获得并测序的病毒来源治疗剂进行比较。例如,该方法还可以包括将病毒来源治疗剂引入(例如转化)到哺乳动物宿主细胞中,并在允许病毒来源治疗剂增殖的条件下培养哺乳动物宿主细胞。提取(如分离)来自哺乳动物宿主细胞的病毒核酸分子。如上所述,所述分离的病毒核酸分子可以是DNA或RNA。如果它们是RNA,则该方法包括从分离的病毒RNA产生双链DNA(例如dscDNA),例如使用逆转录并产生第二病毒核酸链。扩增(如使用PCR)病毒双链DNA(如dscDNA),并对扩增的病毒双链DNA进行定量。然后如上所述,从至少500pg扩增的病毒双链DNA中产生测序文库,进行测序,将得到的多个序列读序与参考序列比对,确定病毒来源治疗剂的序列,若有,鉴定序列变异(如突变)的存在。
该方法还能够同期或同时测定至少两种不同的病毒来源治疗剂(例如2、3、4或5种不同的病毒来源治疗剂),例如通过使用“条码序列”或“标签”使其能够鉴别不同的病毒来源治疗剂。在一些实施例中,不同的病毒来源治疗剂是不同的病毒。在其他实施例中,不同的病毒来源治疗剂是相同的病毒,但是来自不同的来源(例如来自不同的MVB)。在这些实施例中,产生测序文库可以包括为每种病毒来源治疗剂产生一个或多个测序文库,其中一个或多个测序文库包含5'衔接子和3'衔接子,并且其中一个或多个测序文库中的每一个包括独特的识别用条码序列。合并一个或多个测序文库并测序。合并的原始序列数据集可以使用条码序列进行去重(demultiplex),从而为每个测序文库生成一个去重的原始序列数据集。每个去重的原始序列数据集可以与病毒来源治疗剂的适当参考序列比对。在一些实施例中,当将每个去重的原始序列数据集与病毒来源治疗剂的适当参考序列比对时,确定匹配序列读序的平均读取长度、匹配读序的百分比、覆盖度、SNP或其组合。当产生未匹配的序列读序时,可以将未匹配的序列读序添加到未匹配序列读序库中进行识别。根据匹配的序列读序,可以确定所分析的每种病毒来源治疗剂的序列,并且若有,鉴定序列变异(突变)的存在。
在一些实施例中,从双链DNA(例如dscDNA)产生测序文库包括将双链DNA进行随机片段化处理以产生DNA(例如cDNA)片段,将5'衔接子和3'衔接子连接到DNA(例如cDNA)片段以产生衔接子连接的DNA(例如,cDNA)片段。在这样的方法中,将衔接子连接的DNA(例如cDNA)片段进行扩增以产生测序文库。测序文库可以进行克隆扩增,例如使用与5'衔接子和3'衔接子互补的引物(在一些实施例中,所述引物与固体表面或颗粒相连),由此产生克隆扩增的测序文库。对克隆扩增的测序文库进行测序以产生包含多个序列读序的原始序列数据集。例如,可以使用与5'衔接子和3'衔接子互补的引物对克隆扩增测序文库进行测序。
在一些实施例中,当产生匹配的序列读序时,确定匹配序列读序的平均读取长度、匹配读序的百分比、覆盖度、SNP或其组合。
在一些实施例中,当产生未匹配的序列读序时,将未匹配的序列读序添加到未匹配的序列读序库中进行识别。
在一些实施例中,所述方法包括报告病毒来源治疗剂与病毒来源治疗剂的参考序列相比的一致同源性、每个位置每种碱基的覆盖度、大于所确定读序百分比的异源碱基(例如,异源碱基,大于读序的0.1%)、InDel或其组合。
在一些实施例中,在对病毒来源治疗剂进行分析之后,如果所确定的病毒序列变体是非禁忌性的(例如,如果没有检测到会导致毒性表型的突变),所述方法还包括向对象施用经测序的病毒来源治疗剂。
从参照附图进行的以下详细描述中,本申请的前述内容和其他目的和特征将变得更加显著。
附图说明
图1是深度测序数据分析的一个实施例的流程图。
图2显示了PVS-RIPO疫苗批次稀释文库的比对统计。显示参考序列的估计覆盖度。
图3是PVP-RIPO疫苗批次100pg样品的读序长度示例图。
图4是PVP-RIPO疫苗批次(毒理学批号L0603006)100pg样品的覆盖示例图。
图5A-5OO显示了主病毒种子库批次(SEQ ID NO.80)的变种。
图6显示了PVSRIPO主要病毒库批号L0403006的覆盖深度。
图7显示了PVSRIPO最终分装产品批号L0904010的覆盖深度。
图8显示了PVSRIPO参考标准批号L1310001的覆盖深度。
图9显示了PVSRIPO纯化无菌散装批号L1405001的覆盖深度。
图10显示PVSRIPO最终分装产品批号L1402001的覆盖深度。
图11显示了PVSRIPO主要病毒库批号L131100的覆盖深度。
序列表
使用37C.F.R.§1.822中定义的氨基酸的三字母代码和核苷酸碱基的标准字母缩写显示氨基酸和核酸序列。各核酸序列只显示一条链,但通过参考所显示的链,互补链被理解为包括在内。2016年7月29日生成并递交的序列表(24.3kb)作为参考并入文本。
SEQ ID NOS:1-79是用于测序试验的核酸引物序列。
SEQ ID NO.:80是PVS-RIPO主病毒种子批号L0403006病毒同源序列。末端3’端的碱基(29)缺失,而5’大部分碱基(位置#1)不正确,可能是由于引物碱基的错误。
具体实施方式
除非另有说明,否则根据常规用法使用技术术语。分子生物学常用术语的定义可见于:Benjamin Lewin,基因七(Genes VII),牛津大学出版社出版,1999;Kendrew等人(编),分子生物学百科全书(The Encyclopedia of Molecular Biology),布莱克威尔科学公司(Blackwell Science Ltd.)出版,1994;以及Robert A.Meyers(编辑),分子生物学和生物技术:综合案头参考(Molecular Biology and Biotechnology:a ComprehensiveDesk Reference),VCH出版公司出版,1995;和其他类似的参考文献。
如本申请所使用的,除非上下文另有明确指示,否则单数形式“一”、“一个”和“该”是指单数以及复数形式。如本申请所使用的,术语“包含”意思是“包括”。因此,“包含核酸分子”是指“包括核酸分子”而不排除其他元素。应进一步理解的是,除非另有说明,给出的核酸的任何和所有碱基大小都是近似的,并且是为了描述的目的而提供。虽然可以使用与本申请描述的那些类似或等同的许多方法和材料,但是特别合适的方法和材料如下所述。数值范围的叙述仅仅意图作为单独指代落入该范围内的每个单独值的速记方法,除非在此另外指出,并且每个单独的数值被合并到说明书中,就好像其在本文中单独列举一样。所有范围的端点都包含在该范围内并可独立组合。本文所述的所有方法可以以合适的顺序执行,除非在本文中另外指出或与上下文明显矛盾。如有冲突,以本说明书,包括对术语的解释为准。另外,这些材料,方法和实施例仅是说明性的而不是限制性的。包括专利申请和专利在内的所有参考文献以及与列出的登录号(截至2016年7月29日)相关的序列通过引用并入本申请。
为了便于审阅本公开的各种实施方式,提供对特定术语的以下解释:
3'端:核苷酸的末端,其在3'端的残基未结合有核苷酸。
5'端:核苷酸序列的末端,其在5'端位置的残基未结合有核苷酸。
佐剂:当与免疫原性剂(例如使用所公开的方法分析的病毒)组合使用时,增加或以其它方式改变或修饰所得免疫应答的化合物、组合物或物质。在一些实施例中,佐剂增加免疫原性试剂在对象中诱导的抗体滴度。在另一个实施例中,如果抗原剂是多价抗原剂,则佐剂会改变对象中诱导的抗体特异性结合的特定表位序列。
示例性的佐剂包括但不限于弗氏不完全佐剂(Freund's Incomplete Adjuvant,IFA)、弗氏完全佐剂、B30-MDP、LA-15-PH、油佐剂(montanide)、皂苷、铝盐如氢氧化铝(Amphogel,惠氏实验室(Wyeth Laboratories),麦迪逊(Madison),新泽西(NJ))、明矾、脂质、匙孔血蓝蛋白、血蓝蛋白、MF59微乳、分枝杆菌抗原、维生素E、非离子嵌段聚合物、胞壁酰二肽、聚阴离子、两亲物质、ISCOM(免疫刺激复合物,如欧洲专利EP 109942公开的那些)、植物油、卡波姆(Carbopol)、氧化铝、油乳(例如Bayol F或Marcol 52)、大肠杆菌热不稳定毒素(LT)、霍乱毒素(CT)及其组合。
在一个实施例中,佐剂包括刺激免疫激活的DNA基序,例如T细胞、B细胞、单核细胞、树突状细胞和天然杀伤细胞的先天性免疫应答或适应性免疫应答。刺激免疫激活的DNA基序的具体非限制性实施例包括CG寡聚脱氧核苷酸(如美国专利号6,194,388、6,207,646、6,214,806、6,218,371、6,239,116、6,339,068、6,406,705和6,429,199所描述)以及IL-2或其他免疫调节剂。
给药:通过任何有效的途径向对象提供或给予试剂,如使用所公开的方法纯化的病毒。示例性的给药途径包括但不限于注射(例如皮下、肌内、真皮内、腹膜内、瘤内和静脉内)、口服、经皮、鼻内和吸入途径。
扩增核酸分子:为增加核酸分子如病毒RNA或DNA的拷贝数。所得到的产物被称为扩增产物或扩增子。体外扩增的例子是聚合酶链式反应(PCR),其中在可使引物与样品中核酸分子杂交的条件下将样品(如含有病毒核酸分子的样品)与一对寡核苷酸引物接触。所述引物在合适的条件下延伸,与模板解离,然后再退火、延伸和解离以扩增核酸分子的拷贝数。
减毒病原体:在保持刺激如天然病原体免疫应答能力的同时,具有降低或减弱的产生疾病的能力的病原体。在另一个实施例中,通过在某些生长条件下选择无毒变体来减弱病原体(例如参见Sabin和Boulger.J.Biol.Tstand.1:115-8;1973;Sutter等人,2003.Poliovirus vaccine-在SA Plotkin和WA Orenstein(编),Vaccines,Fourth编.WB桑德斯公司,费城(WB Saunders Company,Philadelphia))。减毒病原体的一个例子是萨宾脊髓灰质炎病毒。
接触:直接物理接触方式放置,包括固体或液体形式。接触可以发生在体外或离体,例如通过向样品(如含有表达病毒模板质粒的细菌细胞的样品)中加入试剂,或者向对象体内施用(例如将用所公开方法分析的病毒进行施用)。
有效量:足以实现有益的或期望的结果(例如保护性免疫应答,例如抗癌应答)的药剂(例如使用所公开的方法分析的病毒)的量。
治疗有效量可根据以下一项或多项而变化:正在治疗的对象和疾病状况、对象的体重和年龄、疾病状况的严重程度、施用方式等,其可由本领域普通技术人员容易确定。有益的治疗效果可以包括通过诊断确定;改善疾病、症状、障碍或病理状况;减少或预防疾病、症状、障碍或病症的发作;并且通常减轻疾病、症状、病症或病理状态。在一个实施方式中,(例如使用所公开的方法分析的病毒的)“有效量”是足以降低肿瘤(例如成胶质细胞瘤)的体积/大小、肿瘤重量、转移瘤数目、减少转移瘤的体积/大小、转移瘤的重量或其组合,例如减少至少10%、至少20%、至少25%、至少50%、至少70%、至少75%、至少80%、至少90%、至少95%或至少99%(与未施用治疗剂相比)。在一个实施方式中,(例如使用所公开方法分析的病毒的)“有效量”是足以增加体内免疫应答的量,例如对免疫原特异性抗体的产生增加至少10%、至少20%、至少25%、至少50%、至少70%、至少75%、至少80%、至少90%、至少95%、至少99%、至少100%至少200%、至少300%、至少400%、至少500%或至少600%(与未施用治疗剂相比)。
宿主细胞(HC):可以在其中繁殖载体并表达其核酸的细胞。所述细胞可以是原核或真核的。该术语还包括目标宿主细胞的任何后代。因此,宿主细胞可以是转基因的,因为它们包括已被引入细胞的核酸分子,如病毒模板质粒核酸分子。在一个实施例中,所述宿主细胞是病毒(如PVS-RIPO)增殖的细胞(如哺乳动物细胞)。病毒在宿主细胞中的增殖可以用于生产病毒材料(例如,用于生产PVS-RIPO的Vero细胞),或者在一些情况下用于蛋白质表达。例如,重组杆状病毒可用于昆虫细胞中的重组蛋白表达(“杆状病毒表达系统”)。当病毒宿主细胞是生物体的一部分时,病毒增殖可以在体内或体外发生,例如在细胞培养中。
免疫应答:免疫系统细胞如B细胞、T细胞、巨噬细胞、单核细胞或多形核细胞在对象中对免疫原性试剂(如使用所公开的方法分析的病毒)的反应。免疫应答可以包括涉及宿主防御应答的任何身体细胞,例如分泌干扰素或细胞因子的上皮细胞。所述免疫应答包括但不限于先天性免疫应答或炎症。
应答可以对特定抗原,如脊髓灰质炎病毒是特异性的(“抗原特异性应答”)。在一个特定的例子中,免疫应答是T细胞应答,例如CD4+应答或CD8+应答。在另一个实施例中,应答是B细胞应答,并且导致产生针对免疫原性试剂的特异性抗体。
在一些实施例中,这样的免疫应答为对象提供免疫原性试剂或免疫原性试剂来源的保护。例如,应答可以保护诸如人类或兽医主体的对象免于病原体的感染,或者干扰病原体感染的进展。免疫应答可以是主动的并涉及对对象免疫系统的刺激,或者是由被动获得的免疫力产生的应答。
增加或减少:与对照值(例如代表无治疗剂的值)相比在数量上分别具有统计学显著的正或负变化。增加是正变化,例如与对照值相比增加至少50%、至少100%、至少200%、至少300%、至少400%或至少500%。减少是负变化,例如与对照值相比减少至少20%、至少25%、至少50%、至少75%、至少80%、至少90%、至少95%、至少98%、至少99%、或至少100%。在一些示例中,减小量小于100%,例如减少不超过90%,不超过95%或不超过99%。
分离的:“分离的”生物组分(如使用所公开的方法产生和分析的病毒)已经与含有该组分的细胞或培养基中的其它生物组分如其他核酸分子和蛋白质(例如宿主细胞染色体和染色体外DNA和RNA以及蛋白质)基本分离、从其分离产生或从其纯化。在一些实施例中,使用所公开的方法分析的分离的病毒至少50%纯,例如至少75%、至少80%、至少90%、至少95%、至少98%、至少99%、至少99.9999%或至少100%纯,例如通过残余宿主细胞(HC)DNA测量的。在一些实施例中,使用所公开的方法纯化的分离的病毒或使用所公开的方法扩增的病毒模板质粒在通过残余HC蛋白质(HCP)测量时具有较低的纯度,如至少3%纯,至少4%纯或至少5%纯(例如3-4%纯),例如当需要总PFU增加时。即使在约3%的蛋白质纯度下,HCP的水平在治疗产品的可接受范围内。在一些实施例中,使用所公开的方法分析的分离的病毒当通过残余HCP测量时为至少50%纯,例如至少75%、至少80%、至少90%%、至少95%、至少98%、至少99%或至少99.9999%纯。
主细胞库(MBC):一细胞群,其可通过用于生产材料(如生产疫苗,如脊髓灰质炎病毒)来源的单个克隆而建立。在一些实施例中,MCB的细胞包括质粒或载体,如编码脊髓灰质炎病毒的病毒模板质粒或脊髓灰质炎病毒,或包括病毒(因此可称为主病毒库,MVB)。来自MCB的细胞被扩增以形成工作细胞库(WCB)。MCB和WCB为创建细胞库提供了灵活而实用的方法。例如,在第一阶段,生长、收获、汇集并冷冻少量的细胞以产生MCB,例如含有10至20个小瓶。然后,从这个主库存,解冻并培养一个小瓶(一到两代),直到有足够的细胞产生最初的WCB,例如包含10至20个小瓶。可以使用本文的方法分析MCB和WCB,例如鉴定MCB和WCB不含有突变(例如可能导致不需要的毒性病毒)。
下一代基因测序:也称为大规模平行测序或深度测序,描述了对数百万个小核酸片段(例如DNA)平行进行测序的核酸测序技术。使用生物信息学分析将这些片段拼接在一起,通过将各个读序映射到参考基因组。NGS是非选择性的,因此可以无偏倚地分析基因组。该方法通常包括使用DNA聚合酶,其在DNA合成的连续循环期间催化将荧光标记的dNTP掺入DNA模板链中。在每个循环中,在掺入点,通过荧光激发来鉴定核苷酸。数百万的片段以大规模并行的方式进行测序。这种方法的例子包括但不限于:那些来自于依诺米那(Illumina)(例如,通过合成测序(SBS))、粒子激流公司(Ion Torrent)(例如来自赛默飞世尔(ThermoFisher Scientific))、测序、测序、链终止测序,染料终止测序或焦磷酸测序。在一些实施例中,使用单分子测序。
药学上可接受的载体:用于本发明药学上可接受的载体是常规的。雷明顿药物科学(Remington's Pharmaceutical Sciences),E.W.Martin著,麦克出版公司,伊斯顿,宾夕法尼亚州,第15版(1975)描述了适用于药物递送使用所公开的方法纯化的病毒的组合物和制剂。
通常,载体的性质取决于所采用的特定给药模式。例如,胃肠外制剂通常包含可注射流体,其包括药学上和生理上可接受的流体,例如水,生理盐水,平衡盐溶液,葡萄糖水溶液,甘油等作为媒介物。除生物学中性载体外,待施用的药物组合物可以包含少量的无毒辅助物质,例如润湿剂或乳化剂,防腐剂和pH缓冲剂等,例如乙酸钠或山梨糖醇酐单月桂酸酯。
脊髓灰质炎病毒(PV):小儿麻痹症(脊髓灰质炎)病原体小核糖核酸病毒科的肠道病毒。脊髓灰质炎病毒有三种血清型。示例性的脊髓灰质炎序列提供于Toyoda等,J.Mol.Biol.174:561-85,1984(在此通过引用并入本申请)。
脊髓灰质炎病毒的非天然形式包括重组溶瘤性脊髓灰质炎病毒PVS-RIPO和减毒萨宾口服脊髓灰质炎疫苗(OPV),并且可以使用所公开的方法分析。PVS-RIPO是一种重组的非致病性减毒活溶瘤病毒,含有口服脊髓灰质炎病毒萨宾1型,其中内部核糖体进入位点(IRES)被来自人类鼻病毒2型(HRV2)的IRES取代,具有潜在的抗肿瘤活性(参见例如Brown等,肿瘤“Cancer”120:3277-86,2014和Goetz等,细胞因子生长因子综述“Cytokine GrowthFactor Rev.”201021(2-3):197-20)。OPV包括57个核苷酸替换,其区分减毒Sabin 1毒株和其毒性亲本(马奥尼(Mahoney)血清型),两个核苷酸替换减弱了萨宾2毒株,并且在减毒萨宾3毒株中有10个替换。
所有三种萨宾疫苗常见的主要减毒因子是位于病毒内部核糖体进入位点(IRES)的突变,其改变了茎环结构,并降低了脊髓灰质炎病毒在宿主细胞内翻译其RNA模板的能力。示例萨宾序列提供于基因库登录号E01572.1、E01571.1和E01570.1,以及Nomoto等人,Proc Natl Acad Sci U SA.79(19):5793-5797,1982。
PV的另一种形式是由Jonas Salk博士开发的化学灭活脊髓灰质炎疫苗(IPV)。这基于三个毒株马奥尼(1型脊髓灰质炎病毒),MEF-1(2型脊髓灰质炎病毒)和Saukett(3型脊髓灰质炎病毒)。这些PV毒株可以使用所公开的方法分析。
纯化的:术语纯化的不要求绝对纯度;相反,它只是一个相对的术语。因此,例如,纯化病毒制剂是其中病毒比病毒在宿主细胞或宿主细胞提取物中更富集的制剂。在一个实施例中,纯化制剂使得纯化的病毒占制剂总核酸含量的至少50%。在其它实施例中,在与其它制剂成分如药物载体,赋形剂,缓冲剂,吸收增强剂,稳定剂,防腐剂,助剂或其它联合成分混合之前,病毒被纯化到如下程度:在纯化的制剂中存在至少60%、至少75%、至少80%、至少85%、至少90%、至少95%、至少98%或甚至至少99%的所有大分子物质。在一些实施例中,纯化的制剂基本上是均匀的,其中其它大分子物质不能通过常规技术检测到。这种纯化的制剂可以包括与活性剂共价结合的材料,例如与活性剂混合或偶联的材料,其可以是期望产生活性剂的修饰衍生物或类似物或产生组合的治疗制剂或偶联物。
重组:重组核酸分子是具有非天然存在的序列或具有通过将两个分开的序列片段人工组合成的序列的核酸分子。这种人工组合可以使用常规方法完成,例如通过化学合成或通过人工操作分离核酸片段,例如通过基因工程技术,如Sambrook等人(编辑),分子可控:实验手册“Molecular Cloning:A Laboratory Manual”,第2版,1-3卷,冷泉港实验室出版社,冷泉港,纽约,1989。术语重组包括仅通过添加,取代或缺失部分核酸分子而改变的核酸分子。类似地,重组蛋白质是由重组核酸分子编码的蛋白质。重组病毒包括其基因已被构建和/或置于非天然环境中的基因,例如用于表达,例如使用重组工程技术。
对象:脊椎动物,例如哺乳动物,例如人。哺乳动物包括但不限于鼠类、猿猴、人类、农场动物、运动动物和宠物。在一个实施方式中,对象是非人哺乳动物对象,如猴或其他非人灵长类动物、小鼠、大鼠、兔、猪、山羊、绵羊、狗、猫、马或牛。在一些实施例中,对象患有可使用所公开的方法分析的脊髓灰质炎病毒治疗的肿瘤,例如成胶质细胞瘤。在一些例子中,对象是实验室动物/生物体,如小鼠,兔子或大鼠。
转化或转染:病毒或载体在将核酸转移到宿主细胞中时“转化”或“转导”宿主细胞。当DNA被细胞稳定复制时,通过将核酸掺入到细胞基因组中,或通过游离型复制,通过核酸转导到细胞中细胞被“转化”或“转染”。
许多转染方法是本领域技术人员已知的,例如:化学方法(例如磷酸钙转染),物理方法(例如电穿孔,显微注射,粒子轰击),融合(例如脂质体),受体介导的胞吞作用(例如DNA-蛋白质复合物,病毒包膜/衣壳-DNA复合物)和通过病毒如重组病毒的生物感染(Wolff,JA编,基因治疗“Gene Therapeutics”,Birkhauser,波士顿,美国1994)。在被逆转录病毒感染的情况下,感染的逆转录病毒颗粒被靶细胞吸收,导致逆转录病毒RNA基因组的逆转录,并将所得前病毒整合到细胞DNA中。
转基因:由载体提供的外源基因。在一个实施例中,转基因包括病毒模板序列,例如RNA病毒的病毒DNA模板序列,例如脊髓灰质炎(天然脊髓灰质炎病毒或非天然存在的脊髓灰质炎病毒)。
治疗的,治疗和疗法:减轻或改善损伤、病理或病症的任何成功或成功标志,包括任何客观或主观的参数,如消除、缓解、减轻症状或使病况对患者更可耐受,表现为退化或衰退速度减慢,使退化的最终点弱化,改善对象的身体或精神状况,或延长生存期。治疗可以通过客观或主观的参数来评估,包括体格检查、血液和其他临床检查的结果等。在一些实施例中,用所公开的PV结果治疗导致肿瘤(例如,脑肿瘤)的数量、体积和/或重量和/或转移瘤的减少。
在足以……的情况下:用于描述能够进行所需活动的任何环境的短语。在一个实施例中,期望的活动是通过病毒模板质粒转化宿主细胞,或这种转化的宿主细胞的生长。在一个实施例中,所需活动是例如使用下一代测序对靶病毒核酸分子进行的测序。在一个实施例中,期望的活动是体内治疗肿瘤和/或刺激免疫应答,例如采用使用所公开的方法纯化的病毒。
疫苗:可以施用于动物或人以赋予针对疾病或其他病理状况的免疫力,例如主动免疫力的免疫原性组合物。疫苗可以预防性或治疗性使用。因此,可以使用疫苗来降低感染的可能性或降低疾病或病症症状的严重程度或限制疾病或病症的进展。在一个实施例中,疫苗包括使用所公开的方法纯化的一种或多种病毒(例如,天然脊髓灰质炎病毒或非天然存在的脊髓灰质炎病毒)。
载体:一种核酸分子,引入到宿主细胞中,由此产生转化的宿主细胞。载体可以包括允许其在宿主细胞中复制的核酸序列,例如复制起点。载体还可以包含一种或多种治疗性基因或选择标记基因以及本领域已知的其它遗传元件。载体可以转导、转化或感染细胞,由此使得细胞表达除细胞天然核酸分子或蛋白以外的核酸分子或蛋白。载体任选地包括有助于实现核酸进入细胞的材料,例如病毒颗粒、脂质体、蛋白质涂层等。在一个实施例中,载体是质粒,如细菌质粒。
概况
在病毒来源治疗剂工业中,长期以来需要鉴定方法,以替代目前使用的猴神经毒力安全性试验(MNVT)方法和基于噬菌斑的测序方法(例如通过PCR和限制酶切割的突变分析(MAPREC))。例如,2010年瑞士日内瓦召开的WHO工作组关于修订WHO关于生产和控制脊髓灰质炎疫苗(口服)建议的讨论(见Vaccine 29(2011)6432-6436)指出,动物模型中特定突变的减毒效果可以取决于物种、遗传背景和接种途径,因此对人类进行的外推是不确定的。另外,MAPREC试验是一项非常费力的试验,所需的放射性同位素使用增加了它的技术难度,不同的实验室在试验的各个方面都有问题。目前用于测试或验证病毒来源治疗剂的神经毒力测试方法是昂贵且耗时的。此外,在本领域中,还不清楚目前使用的测定与评估人类神经毒力潜力是否有关。WHO工作组建议开发新的脊髓灰质炎疫苗质量控制技术。本文所述的方法提供了用于RNA病毒来源治疗剂、特别是疫苗的改进的有效/安全性测试方法,并且因此提供了在工业中长期需要的解决方案。所公开的方法目前正在请求US-FDA的批准。一旦获得该批准,则该方法将得到成功商业化。
在疫苗接种者上生长以及在细胞培养物中繁殖期间,高神经毒力突变体的聚积已经导致了对神经毒力测试的需求,特别是病毒种子库的需求。目前,执行的是猴神经毒力安全性测试(MNVT)程序。简而言之,在MNVT程序中,取来自一批疫苗产品的样品,例如,注射到猕猴(Macaca)或长尾猴(Cercopithecus)的中枢神经系统的腰部区域,椎管内接种。一般来说,用11-18只猴子来评价疫苗制剂,还有11-18只猴子作为对照。在17-24天内观察猴子的病毒感染临床症状,例如脊髓灰质炎。所有在观察期存活的猴子都被安乐死,并进行分析处理,包括脑和脊髓组织病毒特异性病变的组织病理学评估。几乎没有证据支持MNVT试验评估人类的神经毒力潜力的相关性,特别是在脊髓灰质炎病毒的情况下(Rubin,“Towardreplacement of the monkey neurovirulence test vaccine safety testing”,Procedure in Vaccinology,5,261-265(2011))。此外,这项检测费时费钱,而且结果也不可靠。例如Rubin认为,通过MNVY检测的腮腺炎疫苗与接种疫苗个体的脑膜炎有因果关系。
除了MNVT程序之外,基于噬菌斑的测序方法也被用于评估多批RNA病毒来源治疗剂。通过PCR和限制性酶切(MAPREC)法进行的突变体分析用于确定病毒RNA中给定位点处的单个碱基突变的比例。如果该位点突变的计算值大于可接受的值,则单价散装疫苗(例如口服脊髓灰质炎疫苗)将不能通过MAPREC试验。在3型脊髓灰质炎病毒疫苗中,病毒RNA 5'NCR中第472位的U到C的突变与猴体内病毒的神经毒性直接相关。在1型和2型口服脊髓灰质炎疫苗中,5'NCR内存在突变,当在人肠道或细胞培养中传代时,突变则迅速恢复。这些包括1型碱基位置480G→A和525U→C和2型碱基位置481A→G。据信,当在病毒群体中高比例存在或通过与病毒基因组内其他突变进行相互作用时,这些突变导致了神经毒性的增加。有趣的是,当这些突变以通常在疫苗批次中发现的水平存在时,已经确定与猴子内的毒力无关。(世界卫生组织,“标准操作程序:用于口服脊髓灰质炎病毒(萨宾)疫苗1,2或3型的PCR和限制性酶切割(MAPREC)的突变分析”,第5版(2012))。因此,开发了用于1型和2型口服脊髓灰质炎疫苗的MAPREC测试来测量疫苗产品的一致性。然而,MAPREC测试仅限于确定已知含有减毒标记的少量基因座(Rubin,“朝向神经毒力测试疫苗安全测试的猴子(Toward for themonkey of neurovirulence test vaccine safety testing)”,Vaccinology Procedia,5,261-265页(2011))。
使用依诺米那深度测序方案对7批单链RNA病毒PVSRIPO进行了分析。这些批次包括2004年生产的原始主病毒库(MVB,批号#L0403006)和来源于2004年MVB的病毒产品批次,包括非临床毒理学批次,自2009年起的临床一阶段批次,2014年制备的临床原料药和药物产品批次以及参考标准批次。依诺米那深度测序还在2013年利用质粒体外转录和转染在第二个MVB批次(MVB,批号#L1311002)上进行。出乎意料的是,所有检查的批次在整个嵌合病毒基因组上具有有限的序列微异质性,平均读取深度超过每个碱基2×105。除了远端5'端(脊髓灰质炎病毒中已知的超可变区域)之外,所观察到的序列变异与标准参考序列相比,显示出的异质性碱基均<1%;在多批PVSRIPO中仅重复观察到5个多态性位置。在所有的测试批次中,观察到这五个异质位置及其相关的碱基变体模式是一致的。这表明,PVSRIPO临床批次中所存在的有限变异来源于最初存在于亲本MVB批次中的变异,或可能代表在病毒复制或cDNA测序期间聚合酶错误掺入的优选模式。用于通过体外转录(IVT)产生MVB的质粒DNA可能是在七个PVSRIPO批次中观察到的碱基变异模式的第三个来源。PVSRIPO的深度测序验证了先前的分析和神经毒性数据,这些数据表明PVSRIPO是个出乎意料的稳定单链RNA病毒。第二MVB批PVSRIPO(批号L1311002)呈现低水平的序列微异质性,并且观察到的序列变异模式与早期2004年的MVB批次及其随后的临床批次一致。
本发明的方法不同于分析病毒来源治疗剂(例如,病毒种子库、收获物和纯化的药物产品批次,例如主病毒种子库批次和工作细胞库批次)的其它方法,以确定整个病毒基因组中几乎所有潜在基因突变的存在和频率。例如,Neverov和Chumakov(PNAS 107:20063-8,2010)提供了测序方法来分析口服脊髓灰质炎病毒疫苗。Chumakov实验室开发了目前用于分析脊髓灰质炎疫苗批次的MAPREC方法。正如该文引言中指出的那样,作者承认MAPREC方法的局限性,比如它有限的能力仅监测少数已知含有减毒标记和其它位点缺失突变的基因座。由于减毒的确定可能是未知的,这限制了MAPREC方法的效用。该Neverov和Chumakov的参考文献提出了大量的平行测序方法来对活病毒疫苗进行测序。然而,该文献未能提供关于病毒制备步骤的细节,可能是因为使用了大量的高滴度培养物(即澄清的上清液)或“纯化的”疫苗批次(病毒RNA从HeLa或Vero细胞的上清液获得)。也就是说,作者在产生病毒RNA提取物时不受样本量的限制。相反,本发明人发现需要DNA酶步骤来从主病毒库或工作细胞库样品中去除过量的宿主细胞核酸(例如dsDNA),以增加病毒核酸与宿主细胞核酸的比例(这提供了更稳定的测序结果)。Neverov和Chumakov使用的PureLink病毒RNA试剂盒不包含DNA酶。
Hall等人(J.Virol.Meth.195:194-204,2014)公开了使用离心、过滤和核酸酶处理来富集肠道病毒序列的方法。Hall等人教导了在提取核酸分子之前使用DNA酶,由于在提取过程中去除了DNA酶,因此在程序上更有效。相反,本发明人发现,通过在核酸与DNA酶接触之前提取核酸,在提取和单独灭活后使用时,DNA酶反应的效率出乎意料地显著提高了。另外,如Hall等人所教导的——在提取之前使用DNA酶,却降低了提取过程的整体效率,并且可以负面影响病毒RNA产量,因为它会结合未包封的“游离”RNA。例如,发明人在RNA提取后观察到使用DNA酶获得的病毒RNA的量增加了约2倍。Hall等人和Djikeng的论文完全依赖于随机六聚体进行RT启动和/或扩增启动,这导致所有病毒序列两端覆盖深度的更大缺失。所公开的方法避免了单独使用的随机六聚体(对比与寡核苷酸(dT)和/或保守序列“全长”引物组合),因为其可能导致基因组内和末端的位置覆盖偏差而掩盖一些SNP。Djikeng等人提供了类似的方法(BMC Genomics 9:5,2008)。
表1提供了将本发明公开方法与用于分析病毒来源治疗剂的其它方法进行比较的总结。
表1:本发明公开方法与其它方法的比较
分析病毒来源治疗剂的方法
本发明描述的是使用下一代测序方法(例如,大规模平行测序),在体外快速并直接筛选病毒来源治疗剂(例如,脊髓灰质炎和其它病毒疫苗产品)批次(例如,病毒种子库、收获物和纯化的药物产品批次,例如主病毒种子库批次和工作细胞库批次)的方法,用于测定整个病毒基因组中几乎所有潜在基因突变的存在及频率。与现有基于噬菌斑的测序方法相比,这种方法通常已经对于序列变体显示出几个数量级(通常≥4log)更高的灵敏度,并且与通常需要几个月才能完成的灵长类神经毒性测试不同,其可以在1-2周内进行。此外,本发明报道的结果不能使用传统的Sanger测序方法获得,因为Sanger方法对所使用的引物序列的特异性有限,并且受限于其对总信号的约10-20%的检测灵敏度。换句话说,使用Sanger测序方法仅可以可靠地检测到整个样品中大于约10-20%构成的基因变体,并且通常只有那些在测序或PCR启动位点不存在的高频变体。
本文所公开的测序方法不需要可能对测序结果造成偏倚的对靶病毒核酸具有特异性的测序或PCR引物。可以使用的测序方案如下:利用预扩增PCR引物和测序引物,其靶向于连接的5'-和3'-衔接子序列而不直接靶向于病毒cDNA序列(如依诺米那方案)。本发明所述方法在测序之前或在此期间减少了引物引起的偏倚(例如,隐藏在PCR起始位点发生的SNP和InDel),同时通过使用准随机cDNA片段保持重叠读取的优点。此外,本文所述的测序方法任选地使用最少量的靶向病毒来源治疗剂的PCR预扩增物,其中预扩增水平在后测序分析过程中容易补偿,其中使用较高的PCR循环同时降低了信噪比,但灵敏度阈值的增加可用于将假阳性结果的报告降到最低。该方法可以检测任何任意水平的序列变异(例如,已经达到了<0.0001%或PPM),并且仅受限于覆盖深度和/或样本中所存在的靶拷贝数。
除了测试纯化的病毒之外,开发这种利用DNA酶方法的一种变化方式用于含有大量宿主细胞核酸的未纯化样品(例如来自MVB的粗制细胞培养物裂解物),对测定灵敏度和序列读取深度仅有很小的影响。一定样品体积中的背景质量和宿主细胞RNA和DNA的拷贝数可能比存在的病毒RNA的数量多几个对数值,由于在Sanger测序之前需要大量的预扩增(PCR循环),使得传统的Sanger测序方法不能实现或可能存在偏差。
本文提供了测定病毒来源治疗剂是否存在病毒序列变体的方法。这些测序和筛选方法可用于分析多批病毒来源治疗剂(例如存在于MVB或WCB中的那些)以确定是否存在不需要的病毒序列变异(例如一个或多个核苷酸缺失、插入或取代)。可以使用所公开的方法分析的示例性病毒来源治疗剂的例子包括但不限于:病毒、病毒模板质粒或疫苗。可以使用本文公开的方法测序的示例性病毒来源治疗剂包括那些基于显示出高突变率的RNA病毒,例如脊髓灰质炎病毒、麻疹病毒、甲型肝炎病毒、丙型肝炎病毒、腮腺炎病毒、流感病毒、风疹病毒、HIV、HTLV等。可以用所公开的方法分析的示例性疫苗包括MMR(麻疹、腮腺炎、风疹)和MMRV(麻疹、腮腺炎、风疹、水痘)。在一个实施例中,RNA病毒来源治疗剂是疫苗,尤其是PVS-RIPO、活的减毒口服(萨宾)血清型1脊髓灰质炎疫苗,含有源于人类鼻病毒2型的异源内部核糖体进入位点。本发明公开的方法还能够一次分析多种病毒来源治疗剂,如通过使用多通道。
所公开的方法包括从病毒种子库、收获物和纯化的药物产品批次(例如主病毒库(MVB)或工作细胞库(WCB))中提取(例如分离)核酸分子。可以使用本领域已知的方法从病毒种子库、收获物和纯化的药物产品批次中分离包含病毒基因组核酸(例如RNA)的核酸分子,例如市售可得的病毒RNA微型试剂盒(来自凯杰(Qiagen))。可以通过分光光度法或通过定量RT-PCR对总RNA进行定量。
病毒种子库(例如MVB和WCB)包括含有病毒来源治疗剂的宿主细胞(例如大肠杆菌或其他细菌细胞及其不需要的宿主细胞基因组DNA和宿主细胞线粒体DNA)以及收获物(例如来自Vero细胞),可能包括不需要的宿主细胞基因组DNA和宿主细胞线粒体DNA。因此,在一些实施例中,待分析的病毒来源治疗剂存在于未经纯化的样品中,例如来自病毒种子库和收获物(例如MVB或WCB)的那些。在一个方面,病毒来源治疗剂的样品是未经纯化的样品,例如含有来自非病毒来源治疗剂来源的至少85%、至少90%或至少95%的总核酸,如宿主细胞基因组和线粒体DNA。在一个实施例中,所述方法包括用DNA酶对来自未纯化样品中分离的病毒基因组RNA进行处理,然后在从分离的病毒基因组RNA产生双链cDNA之前灭活DNA酶。DNA酶处理去除了游离DNA并且能够改进从目标病毒RNA的cDNA合成。在一个实施例中,所述方法包括用DNA酶处理来自未纯化样品中分离的病毒基因组DNA,然后灭活DNA酶并回收病毒基因组DNA。这种DNA酶处理除去了宿主细胞DNA,但能够回收病毒DNA(例如,若在衣壳中)。在一些实施例中,如果病毒来源治疗剂是DNA病毒,则可以在提取后使用合适的结构特异性核酸酶来代替DNA酶。在一些实施例中,如果病毒来源治疗剂是DNA病毒,则在核酸提取之前进行DNA酶处理。在一些实施例中,在提取核酸之前和之后进行DNA酶处理。
在其他实施例中,待分析的病毒来源治疗剂存在于纯化的样品中,例如来自纯化的药物批次的那些。纯化的样品包括例如临床批次的疫苗。纯化样品通常含有来自RNA病毒来源治疗剂的总核酸超过70%,通常超过95%。在一些实施例中,这种纯化的样品不需要DNA酶处理。在一个实施例中,将纯化的样品中存在的病毒来源治疗剂的序列与先前从未经纯化的样品(例如,处理的较早阶段)获得的病毒来源治疗剂的序列进行比较。因此,所公开的方法可以包括使用本发明提供的方法分析未纯化样品中的病毒来源治疗剂,然后使用本发明提供的方法分析纯化样品中的病毒来源治疗剂。这使得人们能够确定在病毒来源治疗剂的制造期间病毒来源治疗剂的序列是否改变。
由于在未纯化的样品中得到的提取样品中存在不需要的宿主细胞基因组DNA和宿主细胞线粒体DNA,提取的(例如分离的)核酸分子在基本上消化宿主细胞基因组DNA和宿主细胞线粒体DNA、但基本不消化所需的病毒核酸分子(如病毒基因组RNA或DNA,或病毒模板质粒)的条件下与DNA酶一起温育(例如接触)。这种条件的例子有:在37℃下至少10分钟(如至少15、至少20或至少30分钟)。在另一个实施例中,所述条件是在2℃至40℃下至少10分钟(如至少15分钟、至少20分钟、至少30分钟、至少60分钟、至少120分钟或至少180分钟)(较低的温度通常需要较长的温育时间)。如果使用热稳定的DNA酶,则样品可以在40℃以上温育。在一些实施例中,将提取的或分离的核酸分子与DNA酶一起孵育少于1小时,如少于45分钟,或不多于30分钟,如10-30分钟。在一些实施例中,将提取的或分离的核酸分子与少量的DNA酶一起温育,例如小于10U(2U/uL)、小于5U(2U/uL)、例如1U至10U(2U/uL)或1U至5U(2U/uL),如4U(2U/uL)。令人惊讶的是,发现DNA酶未显著降解病毒RNA,尽管DNA酶具有一些RNA酶活性。DNA酶的存在增加了所需的病毒来源治疗剂核酸与不需要的宿主细胞核酸的信号:噪声比。在一些实施例中,DNA酶处理后需要的病毒来源治疗剂核酸的纯度为至少75%、至少80%、至少85%、至少90%或至少95%。在一些实施例中,在DNA酶处理期间降解的病毒来源治疗剂核酸的量小于10%、小于5%、小于4%、小于3%、小于2%、小于1%或小于0.5%。在一些实施例中,在DNA酶处理过程中降解的宿主细胞核酸的量为至少50%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%或者至少95%。
所得富集的病毒核酸分子可以是DNA或RNA。如果它们是RNA,则该方法包括从富集的病毒RNA产生双链(ds)DNA(例如dscDNA),例如通过采用逆转录并产生第二病毒核酸链。例如,来自生命技术公司(Life technologies)的ThermoScriptTM系统可以与寡聚(dT)x引物(如寡聚(dT)20引物和dNTP)一起使用来产生cDNA。在另一个实施例中,利用SMARTScribe系统(具有来自克隆技术公司(Clonetech)的SMARTer寡聚IIA和寡聚(dT)x引物)从低病毒拷贝样品产生cDNA。可以添加RNA酶H以去除RNA/DNA杂合体。然后可以定量cDNA,例如分光光度法。第二链DNA的合成可以通过本领域已知的方法进行,例如来自新英格兰生物实验室(New England Biolabs)的第二链合成试剂盒。PCR纯化试剂盒可用于纯化ds cDNA,然后可以对其进行定量,如分光光度法。可以扩增(例如使用PCR)病毒双链DNA(例如,dscDNA)(不管是从宿主细胞中产生还是直接提取),并且可通过例如分光光度法定量扩增的病毒双链DNA。
然后从至少500pg ng(例如至少1ng、至少2ng、至少5ng、或至少10ng)扩增的病毒双链DNA(例如ds cDNA)产生测序文库,例如500pg至1ng、500pg至5ng、500pg至10ng或1ng至5ng扩增的病毒ds DNA。测序文库包括连接到病毒双链DNA上的5'-衔接子和3'-衔接子(例如,病毒双链DNA片段具有与其连接的5'-衔接子和3'衔接子)。测序文库的产生可以通过随机片段化dsDNA(例如,ds cDNA)从而产生DNA(例如,cDNA)片段,将5'衔接子和3'衔接子连接到DNA(例如,cDNA)片段以及扩增(例如,克隆扩增)衔接子连接的DNA(例如cDNA)片段。在这样的方法中,衔接子连接的DNA(例如cDNA)片段得以扩增以产生测序文库。在一个实施例中,使用与5'-衔接子和3'-衔接子互补的寡核苷酸(其中所述引物可以连接至固体表面或颗粒,例如表面结合或颗粒结合)进行扩增以产生克隆扩增的测序文库。测序文库的DNA(例如cDNA)片段通常具有200至400个碱基对的大小。片段化dsDNA(例如,ds cDNA)和连接5'-和3-衔接子可以使用“标签化(tagmentation)”进行。在“标签化”过程中,片段化(例如酶促切割)双链DNA(例如双链cDNA)并用衔接子序列对片段进行标签化在一个步骤中进行。片段化和连接也可以通过不连续的步骤完成。将衔接子连接到ds DNA(例如ds cDNA)后,可以灭活DNA连接酶。因此测序文库是随机片段化的双链DNA分子,其在3'和5'端连接到衔接子序列。使用标签化过程可以更好地控制片段长度,同时提高样品收率。反过来,这可以实现更好的回收率和更大的潜在读取深度和样本覆盖度。标签化方法比动力学碎片化方法还更具有重现性。
5'和3'衔接子的具体设计取决于要使用的NGS平台。衔接子序列提供了已知的序列组合,其能,例如使随后的文库扩增或测序引物退火。作为衔接子,可以使用已知序列的双链或部分双链核酸。衔接子可以具有钝端,具有3'或5'突出端的粘性端,可以由Y形衔接子或通过茎环形衔接子来提供。Y形衔接子如美国专利号7,741,463所述,茎环形衔接子如在US2009/0298075中所述,关于衔接子的具体设计通过引用并入本文。示例性衔接子具有至少7个、至少10个或至少15个碱基,例如10-100个碱基,15-75个碱基或20-60个碱基的长度。片段的3'和5'末端可以使用相同或不同的衔接子。对于两端使用相同类型的衔接子,例如Y形或茎环形衔接子,具有以下优点:由于衔接子错配而在文库制备期间没有片段丢失,这对于使用少量DNA时是有利的。
一旦产生了标记的片段,就执行扩增步骤。使用最小量的目标病毒PCR预扩增可以提高信噪比并提高灵敏度阈值,以使假阳性结果报告最少。在测序后分析的过程中,扩增的变化可以很容易地得到补偿。在一个实施例中,采用10至15个循环,例如12个循环的PCR扩增。任选地,在扩增期间,将条码序列添加到DNA(例如cDNA)片段中。条码序列是可用于鉴定原始样本的特定DNA序列。条码序列可以用来去重或区分来自不同样品的序列读序。条码序列的使用还能够用计算机进行连接分析两批或更多批次并对其进行直接批内比较等。独特的条码序列的使用也可以用来快速识别来自先前或伴随研究的实验室交叉污染。
一旦产生测序文库并任选地对其进行条码序列化,则对测序文库进行克隆扩增,例如使用与5'衔接子和3'衔接子互补的表面结合或颗粒结合的寡核苷酸进行。在方案中,克隆扩增使用了与5'衔接子和3'衔接子互补的寡核苷酸的桥扩增,所述寡核苷酸与流动细胞表面结合(例如附着)。因此模板簇直接在流动细胞上形成。在Ion TorrentPGMTM方法中,文库片段克隆扩增到微珠上。
然后使用NGS技术(例如,使用平行单端或双端测序)对产生的克隆扩增测序文库进行测序以产生包含多个序列读序的原始序列数据集。也就是说,克隆扩增的文库片段或来自多个文库的片段是通过平行合成进行的测序。一方面,使用平行两端测序。在双端测序中,对同一片段的两端进行测序。在协议中,完成第一次读取后,克隆簇被原位修饰以再生模板用于成对读取。成对读取比单读取产生更大的基因组信息(例如,与150bp单一读序相比,2x75bp碱基配对读序)。在一个例子中,平行两端测序是2x75到2x200bp测序。在一个实施例中,使用与5'-衔接子和3'-衔接子互补的引物进行克隆扩增测序文库的测序。
将得到的多个序列读序与病毒来源治疗剂的参考序列(例如相同病毒的非突变序列)比对以产生含有多个匹配序列读序的匹配序列。在一些实施例中,至少80%的序列读序与病毒来源治疗剂的参考序列匹配,比如至少85%、至少90%或至少95%。根据匹配的序列读序,可以确定病毒来源治疗剂的序列,并且鉴定(例如,报道)存在序列变异(例如,突变),如果有的话。在一些实施例中,多个序列读序的平均读取长度为约75至约150个碱基对。
在一些实施例中,报告包括每个位置每种碱基的覆盖度。术语覆盖度是指在测序过程中读取特定核苷酸的次数。因此,覆盖度是在任一方向上匹配序列中代表特定核苷酸的平均读序。在一个实施例中,每个碱基的覆盖度至少是4X。因此,当匹配序列中每个碱基的覆盖度是4X或更大,例如至少4X、至少5X、至少6X、至少7X、至少8X、至少9X或至少10X时,所述方法可以包括确定匹配序列对于筛选批次病毒来源治疗剂是可接受的。平均覆盖度是基于碱基读序的总数除以参照(或观察到的)目标基因组的大小。然而,平均覆盖度因此可能是误导性的,因为当使用单个RT引物测序病毒基因组时,cDNA的3'末端通常比5'末端具有更大的覆盖深度。在一些实施例中,如果确定匹配序列中的每个碱基的覆盖度小于4X,则可对病毒来源治疗剂进行Sanger测序,以在整个匹配的序列上提供4X或更高的覆盖度。例如,在PVS-RIPO序列的5'末端,病毒IRES结构域中的强RNA结构可导致RT衰竭,导致覆盖度降低。例如,如果缺乏适当覆盖度的基因组部分接近基因组的5'末端,则可以仅使用反向引物进行PVS-RIPO cDNA的线性PCR扩增,以产生5'端的最小4X序列覆盖度。可以使用高循环数量的线性(非指数)PCR以防止用引物序列覆盖天然PVS-RIPO病毒序列,尤其是在如PVS-RIPO病毒的低代表(低拷贝dscDNA)和高度可变5'端。使用之前已经证明具有减少的序列变异性的靶位点,针对需要额外覆盖的区域选择或设计引物。最终报告中包括了与PVS-RIPO参考序列和Sanger测序区域任何异源碱基的共有同源性。
在一些实施例中,当将原始序列数据集与病毒来源治疗剂的合适参考序列比对时,可确定匹配序列读序的平均读取长度、匹配读序的百分比、覆盖度、SNP或其组合。因此,可以确定匹配序列读序的SNP。可根据以下标准来定义变体(例如,用于脊髓灰质炎疫苗):如果给定碱基位置的测序深度等于或超过4,096,000,则可能的变化被称为大于0.1%;如果深度小于4,096,000,但大于4,096,则称为超过4096或更大频率的变体;如果给定碱基位置的覆盖深度小于4,096读序,则称为大于1.0%的潜在变体。例如,基于公布的脊髓灰质炎疫苗限制(其中在脊髓灰质炎IRES中关键神经毒性位点处的多态性大约>0.1%可以导致在猴子中观察到致病表型),0.1%阈值是示例性阈值。然而,阈值可以设定为任何值,仅受限于目标拷贝数和RT的保真度、预PCR和所采用的测序反应。
在一些实施例中,所述方法包括报告病毒来源治疗剂对于病毒来源治疗剂的参考序列的共有同源性、每个位置每种碱基的覆盖度、大于确定读序百分比的异源碱基(例如大于读序0.1%的异源碱基)、InDel(插入/缺失)或其组合。病毒来源治疗剂与参考序列的共有同源性可以报告为共有序列和序列数据集的部分或全部的成对匹配、部分或全部共有序列和序列数据集的个体位置变体报告、或任何其他合适的形式。对于脊髓灰质炎病毒,预计到(并观察到)在每个病毒批次的5'末端(碱基位置1-34)多态性水平有所升高;已知脊髓灰质炎基因组的这个区域(VPg结合和Stem a/b)在体内表现出高的序列变异性。报告还可以包括部分或全部共有序列和序列数据集每个位置每种碱基的覆盖度。例如,这样的数据可以以表格或图表的形式呈现。覆盖度还可以包括通过将测序碱基的总数除以基因组大小而估计出的总覆盖度。报告还可以包括大于读序的0.1%的异质碱基,预计其高于信噪比阈值。虽然鉴定有害的标志物如减毒标志物是特别重要的,但是要求在疫苗批次中没有突变的积累将有助于保持疫苗的安全性。因此可以使用本文所述的方法来鉴定遗传不稳定性的区域。量化疫苗批次中的突变对于质量控制也是重要的,以维持病毒疫苗的生产一致性。另一方面,可以检查从源质粒到MVB/WVB(病毒种子)到制造临床批次的突变情况的变化。此外,该结果将提供病毒库遗传稳定性、以及该库是否仍然适合临床批次生产的指示。
在一些实施例中,当产生未匹配的序列读序时,将未匹配的序列读序添加到未匹配的序列读序库以供识别。通常,可以通过NCBI BLASTn分析未匹配的读序序列以确定它们的身份;预计到未匹配的读序,特别是来自未纯化的病毒样本的那些,将来自宿主细胞基因组或线粒体DNA序列,尽管也可观察到人类DNA或其他实验室污染物DNA序列。通过BLASTn分析鉴定未匹配的序列读序能够鉴定宿主细胞(例如Vero)DNA以外的潜在污染物。换句话说,鉴定未匹配的读序可以作为病毒污染物PCR和AVA安全检测的辅助手段,也可以用来鉴定潜在过程或来自人类DNA的实验室污染。可以从未匹配的序列读序确定的信息包括:样本或测试实验室污染;制造污染(之前的产品、细胞系污染(例如,HeLa污染)、人类DNA等);检测和鉴定宿主细胞系中的外来物质(裂解或溶原性病毒、细菌、支原体等);通过mtDNA和/或gDNA序列对宿主细胞库进行唯一识别的潜力;可能鉴定过量的宿主细胞MCB/WCB年龄(传代次数)或由于mtDNA或gDNA序列(甚至mRNA表达水平)的变化引起的应激;未匹配的读序可能对样品制备方法和/或测序中的变化有诊断作用;和未匹配的读序作为样品纯度的量度,类似于残余的宿主细胞DNA测试。
在一些实施例中,在对来自MVB或WCB的病毒来源治疗剂进行测序之后,所述方法进一步包括将得自MVB的病毒来源治疗剂和序列引入宿主细胞,如哺乳动物细胞(例如Vero、HEK293、HeLa或PerC6细胞),用于生产病毒来源治疗剂(例如疫苗)。然后可以使用与在MVB或WCB所用的类似方案对在第二宿主细胞中产生的所得病毒来源治疗剂进行测序,除了通常不需要DNA酶,因为病毒来源治疗剂(例如疫苗)比从MVB或WCB获得的病毒来源治疗剂纯度更高。得到的病毒来源治疗剂序列可以与相应的参考序列和/或从MVB或WCB获得的病毒来源治疗剂序列进行比较。
例如,该方法可以进一步包括将病毒来源治疗剂引入(例如,转化)到哺乳动物或其它宿主细胞中,并在能够使病毒来源治疗剂增殖的条件下培养哺乳动物宿主细胞。提取(例如分离)来自哺乳动物宿主细胞的病毒核酸分子(例如从上清液中)并且纯化。在一些实施例中,经过这样的提取和分离之后,所需的病毒来源治疗剂核酸的纯度为至少50%、至少60%、至少75%、至少80%、90%、至少95%、至少98%、至少99%、至少99.9%或至少99.99%。如上所述,分离的病毒核酸分子可以是DNA或RNA。任选地,可以如上所述用DNA酶处理分离的病毒核酸分子(在一些实施例中,宿主细胞或培养上清液在病毒核酸分离之前或之后用DNA酶处理)。如果它们是RNA,则该方法包括从分离的病毒RNA产生ds DNA(例如dscDNA),例如使用逆转录并产生第二病毒核酸链。扩增病毒双链DNA(例如,dscDNA)(例如使用PCR),并且对扩增的病毒双链DNA进行定量。然后从至少500pg ng(例如至少1ng、至少2ng、至少5ng、或至少10ng)扩增的病毒双链DNA(例如ds cDNA)产生测序文库,例如500pg至1ng、500pg至5ng、500pg至10ng或1ng至5ng扩增的病毒dsDNA,测序、所得到的多个序列读序与参考序列进行比对、确定病毒来源治疗剂的序列,并且如上所述如果有的话,鉴定出序列变异(例如突变)的存在。在一些实施例中,所得病毒来源治疗剂的序列可与来自MVB或WCB的病毒来源治疗剂的序列进行比较。
该方法能够同时或共同测定至少两种不同的病毒来源治疗剂(例如至少3种、至少4种、至少5种、至少10种或至少20种,例如2、3、4或5种不同的病毒来源治疗剂),如通过使用能区分不同的病毒来源治疗剂的“条码序列”或“标签”。在一些实施例中,不同的病毒来源治疗剂是不同的病毒(例如,不同的脊髓灰质炎病毒或不同的RNA病毒)。在其他实施例中,不同的病毒来源治疗剂是相同的病毒(例如PVS-RIPO),但是来自不同的来源(例如来自不同的MVB或WCB)。所述方法可如上所述进行操作,除了产生测序文库可以包括为每个病毒来源治疗剂产生一个或多个测序文库,其中一个或多个测序文库包括5'-衔接子和3'-衔接子,并且其中一个或多个测序文库中的每一个包含用于识别的唯一条码序列。将一个或多个测序文库合并,如本文所述使用NGS进行测序,并如上所述进行分析。合并的原始序列数据集可以使用条码序列进行去重,为每个测序文库生成一个去重的原始序列数据集。每个去重的原始序列数据集可以与病毒来源治疗剂的适当参考序列对比。根据匹配的序列读序,可以确定所分析的每种病毒来源治疗剂的序列,并且如果有,鉴定序列变异(例如,突变)的而存在。例如,基于它们与参考序列的匹配或未匹配,单独的序列读序可以被分类为匹配序列读序和未匹配的序列读序。可以针对平均读取长度、匹配读序的百分比、覆盖度、SNP、插入/删除(InDels)或其组合来评估匹配的序列读序。在一些实施例中,所述方法包括报告病毒来源治疗剂对于病毒来源治疗剂参考序列的共有同源性、每个位置每个碱基的覆盖度、大于确定读序数百分比的异源碱基(例如,大于读序0.1%的异源碱基)、InDel或其组合。
因此,在一些实施例中,一旦已经产生了原始序列数据集,就将该数据集去重。去重是指对多个一起测序的样品进行的分选,通常使用条码序列。例如,可以使用一批RNA病毒来源治疗剂的多个稀释物来形成文库,其中每个文库包含独特的条码序列。或者,可以使用几个单独批次的RNA病毒来源治疗剂来形成文库,其中每个文库包括独特的条码序列。分析不同的样品制备方法时,去重也很有用。可以合并文库,然后可以将合并的文库一起进行克隆扩增和测序。一旦测序完成,条码就被用来去重序列,即将序列分配给特定的库。然后可以进一步分析每个去重的原始序列。去重能够使用滴定(低拷贝)的样品(每个样品具有独特的条码序列)进行计算机连接分析。
在一些实施例中,在对病毒来源治疗剂进行分析之后,如果所确定的病毒序列没有禁忌症(例如,如果没有检测到会导致毒性表型的突变),所述方法还包括将测序的病毒来源治疗剂施用于对象。如果使用所公开的方法检测到会导致无义突变或以其他方式改变病毒ORF/CDS的任何突变(Indel或SNP),则不施用病毒来源治疗剂。例如,如果在脊髓灰质炎病毒中检测到以下突变,则不施用病毒来源治疗剂,但是如果在脊髓灰质炎病毒中未检测到以下突变,则可以施用病毒来源治疗剂:对于3型脊髓灰质炎病毒疫苗,病毒RNA 5'NCR第472位碱基从U到C的突变;对于1型和2型口服脊髓灰质炎疫苗,5’NCR内的突变当在人肠道或细胞培养中传代时其快速恢复(例如1型,第480位碱基G→A和525位U→C,以及2型,第481位碱基茎环结构域5的A→G离散区);以及对于PV Sabin疫苗株和PVSRIPO的IRES区中突变,其将导致神经减毒表型的逆转。然而,对于PVS-RIPO,目前还没有已知的导致致病性或神经毒性表型的HRV-2IRES突变。因此,在一些例子中,如果PVS-RIPO是病毒来源治疗剂,则对整个PVSRIPO基因组进行检查,包括病毒的UTR,IRES和多蛋白CDS区域。
示例性的病毒
使用本发明提供的方法分析以鉴定一种或多种序列变体(例如相对于参考序列的突变,如核苷酸插入、缺失或取代、或其组合)的存在的病毒来源治疗剂可以是病毒、病毒质粒模板(例如是载体的一部分且包含病毒的模板序列)或含有病毒的疫苗。例如,病毒来源治疗剂可以包括含有待测序病毒的模板序列的质粒DNA(例如细菌质粒)。用于病毒的这种质粒DNA模板可以用于在宿主细胞中生产天然或重组病毒。可以使用所公开的方法分析的病毒的例子包括非天然存在的基于RNA的病毒,天然存在的基于RNA的病毒,非天然存在的基于DNA的病毒或天然存在的基于DNA的病毒,以及编码这种病毒的病毒质粒模板或含有这种病毒的疫苗。
在一些实施例中,病毒来源治疗剂是非天然存在的基于RNA的病毒(例如,非天然存在的脊髓灰质炎病毒)。非天然存在的病毒在不同程度上可能与天然存在的病毒不同。非天然存在的病毒可以源自例如通过重组技术人工产生(“工程化”)的天然存在的病毒,在这种情况下,非天然存在的病毒可以被称为“重组的”。非天然存在病毒的一个例子是通过遗传操作或其它方法(例如选择或化学修饰)进行修饰从而降低或破坏它们的致病性的致病性病毒。该方法或者由此产生的修饰的病毒可以被称为“减毒”、“减毒的”或者其他相关的术语。
示例性的非天然存在的病毒包括但不限于用作疫苗的病毒载体、溶瘤病毒和减毒或重组病毒。溶瘤病毒是用于选择性感染和/或破坏癌细胞的病毒。病毒载体是用于在体内或体外(在细胞培养中)将遗传物质递送到细胞中用于各种应用的病毒。例如,病毒载体可用于基因修饰、基因治疗、用于蛋白质表达或用作病毒疫苗。病毒疫苗用于将遗传物质递送到细胞或生物体中,目的是引发保护性或治疗性免疫应答。例如,减毒活病毒可以用作疫苗来触发针对相同病毒(例如脊髓灰质炎病毒、风疹病毒、麻疹病毒等)的天然存在致病性版本的免疫应答。术语溶瘤病毒、病毒载体和病毒疫苗有时在含义上是重叠的,但是所有这些均可以人工制备,例如通过使用重组工程技术对天然存在的病毒进行遗传修饰。溶瘤病毒可以基于但不限于肠道病毒、疱疹病毒(如单纯疱疹病毒)、水泡性口炎病毒、脊髓灰质炎病毒、呼肠孤病毒、塞内卡病毒或牛痘病毒。病毒载体包括但不限于逆转录病毒载体,如慢病毒载体和基于莫洛尼鼠白血病病毒的载体、腺病毒载体和基于腺伴随病毒的载体。病毒疫苗包括但不限于流感疫苗、麻疹疫苗株、腮腺炎疫苗、风疹疫苗、水痘(水痘)疫苗、天花疫苗、人乳头瘤病毒疫苗、HIV和HTLV疫苗、出血热疫苗或任何活的、减毒的或灭活的病毒疫苗。
在一个实施例中,通过所公开方法测序的病毒来源治疗剂是重组的脊髓灰质炎病毒,例如由PVS-RIPO示例的溶瘤减毒重组体脊髓灰质炎病毒。PVS-RIPO是减毒形式的SabinI型脊髓灰质炎病毒,通过将脊髓灰质炎病毒的同源内部核糖体进入位点(IRES)替换为人类鼻病毒2型(HRV 2)的对应部分从而获得在正常神经元细胞中不复制、但对脑肿瘤细胞表现出溶瘤活性的脊髓灰质炎病毒株而产生。在肿瘤内施用重组溶瘤性脊髓灰质炎病毒PVS-RIPO后,脊髓灰质炎病毒被表达CD155(脊髓灰质炎病毒受体,PVR或NECL5)的肿瘤细胞选择性吸收并在其中复制,最终导致肿瘤细胞溶解。CD155,一种癌胚细胞粘附分子和肿瘤抗原,在某些癌症(如多形性胶质母细胞瘤(GMB))中异位表达。由于该重组病毒中的异源HRV2IRES,PVS-RIPO仅在易感的非神经元细胞(例如GBM)中增殖。PVS-RIPO及其性质和应用于如Goetz等人,Cytokine Growth Factor Rev.2010 21(2-3):197-20,Yang等人,J.Virol.Methods.2009(1):44-54,Cello等,J.Med.Chem.2008 80(2):352-9,和Dobrikova等,Molecular Therapy 2008 16(11):1865-1872中描述。
在一个实施例中,通过所公开的方法测序的病毒来源治疗剂是减毒的萨宾脊髓灰质炎病毒(例如具有适当突变的1型、2型和/或3型脊髓灰质炎病毒)。在一个实施例中,通过所公开的方法测序的病毒来源治疗剂是在灭活的脊髓灰质炎疫苗(例如,1型,2型和/或3型脊髓灰质炎病毒)中使用的,其可以在使用所公开方法的分析后通过化学失活(例如用福尔马林)(例如,在施用于受试者之前)。
在一个实施例中,通过所公开的方法测序的病毒来源治疗剂是封装的二十面体RNA病毒(例如,具有基于蛋白质的衣壳的RNA病毒),其中衣壳的存在保护RNA免遭DNA酶(的降解)。这种病毒的例子包括但不限于脊髓灰质炎病毒(如上所述的那些)、风疹病毒、甲病毒、丙型肝炎病毒、细小病毒(例如B19)、其他肠道病毒等。
在一个实施例中,通过所公开的方法测序的病毒来源治疗剂是单链或双链的被包封的DNA病毒(例如,具有基于蛋白质的衣壳的DNA病毒),其中衣壳的存在保护DNA免受DNA酶或其他核酸酶(的降解)。这种病毒的实例包括但不限于腺病毒、乙型肝炎病毒、水痘-带状疱疹病毒,巨细胞病毒,E-B病毒或单纯疱疹病毒(HSV)。
在一个实施例中,通过所公开的方法测序的病毒来源治疗剂是或来源于麻疹病毒、甲型肝炎病毒、丙型肝炎病毒、腮腺炎病毒、流感病毒、风疹病毒、人免疫缺陷病毒(HIV)或人T淋巴细胞白血病病毒(HTLV)。
在一些实施例中,病毒来源治疗剂是病毒模板质粒。在一些实施例中,病毒模板质粒包括RNA病毒的DNA模板,例如脊髓灰质炎病毒(例如,用于PVS-RIPO的模板、灭活的脊髓灰质炎病毒(IPV)、减毒的脊髓灰质炎病毒(即萨宾疫苗)。例如,病毒模板质粒包括用于正链RNA病毒的DNA模板,RNA病毒如小核糖核酸病毒(例如口疮病毒[例如口蹄疫病毒(FMDV)]、甲型肝炎或小儿麻痹症);心脏病病毒科;肠病毒科(例如柯萨奇病毒、埃可病毒、肠道病毒和脊髓灰质炎病毒);鼻病毒科(鼻病毒,如鼻病毒A、B或C));披膜病毒(例如风疹;甲病毒(如西方马脑炎病毒、东方马脑炎病毒和委内瑞拉马脑炎病毒));黄病毒(例如登革热病毒、寨卡病毒、西尼罗河病毒、丙型肝炎病毒和日本脑炎病毒);和冠状病毒(例如,SARS冠状病毒,如厄巴尼菌株)。在一个实施例中,病毒模板质粒包括用于负链RNA病毒的DNA模板,例如正粘病毒(诸如流感,诸如流感A或B),棒状病毒(诸如狂犬病),丝状病毒科(诸如埃博拉病毒)和副粘病毒(如麻疹病毒、呼吸道合胞病毒和副流感病毒)。在一些实施例中,病毒模板质粒包括DNA病毒序列,例如来自疱疹病毒(例如水痘-带状疱疹病毒,例如Oka株;巨细胞病毒;和单纯疱疹病毒(HSV)类型1和2),腺病毒(如1型,14型,5型,40型或41型腺病毒),痘病毒(如牛痘病毒),乙型肝炎病毒和细小病毒(如细小病毒B19)。在一些实施例中,病毒模板质粒包括用于逆转录病毒的RNA或DNA模板,例如1型人免疫缺陷病毒(HIV-1),如亚型C,HIV-2;马传染性贫血病毒;猫免疫缺陷病毒(FIV);猫白血病病毒(FeLV);猿免疫缺陷病毒(SIV);和禽肉瘤病毒。
示例性的NGS方法
几种下一代测序技术是已知的。当前的公开内容不限于特定的NGS方法。一个例子是焦磷酸测序,即通过合成技术进行的测序,其依赖于在核苷酸掺入时检测焦磷酸释放,而不是用双脱氧核苷酸进行链终止。可以使用焦磷酸测序方法,例如市售可得的来自Biotage(用于低通量测序)和生命科学(用于高通量测序)的那些方法。
通过合成技术的测序是基于可逆的染料终止剂。首先将DNA分子连接到表面上的引物并扩增,从而形成局部克隆集落(桥式扩增)。添加四种类型的可逆终止子碱基(RT-碱基),并且洗去未掺入的核苷酸。与焦磷酸测序不同,一次只能延伸DNA一个核苷酸。照相机拍摄荧光标记的核苷酸图像,然后将染料与末端3'阻断剂一起从DNA中进行化学性去除,从而能够进行下一个循环。
Ion Torrent PGMTM系统是一种基于离子的测序系统,通过检测作为核苷酸掺入副产物产生的氢离子对核酸模板进行测序。离子传感器包括耦合到离子敏感检测层的场效应晶体管(FET),其可以感测H+离子的存在或溶液pH的变化。离子传感器提供指示核苷酸掺入的输出信号,其可表示为其量值与相应孔或反应室中的H+离子浓度相关的电压变化。不同的核苷酸类型连续地流入反应室,并且通过聚合酶以按模板序列确定的顺序掺入到延伸的引物(或聚合位点)中。每个核苷酸的掺入伴随着反应孔中H+离子的释放,同时伴随局部pH的变化。H+离子的释放由传感器的FET记录,其产生指示核苷酸掺入发生的信号。未在特定核苷酸流入中掺入的核苷酸将不会产生信号。来自FET的信号幅度还可以与掺入延伸的核酸分子中的特定类型的核苷酸数目相关,从而能够解析均聚物区域。关于Ion Torrent PGMTM测序仪的组成、设计和操作的进一步细节可以在美国专利公开号2009/0026082;2010/0137143;和2010/0282617中可见,所有这些申请通过引用结合在此以用于其下一代测序的公开内容。
ABI SOLiDTM(“通过寡核苷酸连接和检测进行的测序”)方法(生命技术公司;WO06/084132 A2)是基于通过通用衔接子序列将模板核酸的PCR扩增片段连接至磁珠,随后通过将标记的探针连接到与衔接子序列杂交的引物进行片段序列的序列检测。为了读出,使用一组四个荧光标记的双碱基探针。读出后,部分探针被切割,并进行新的连接、检测和切割循环。由于使用双碱基探针,对每个模板序列必须进行两轮测序。
PacBio RS是基于零模波导特性的单分子实时测序(SMRT)平台。一个DNA聚合酶附着在ZMW的底部,一个DNA分子作为模板。ZMW是一种结构,其产生的照明观察体积足够小,可以仅观察到用DNA聚合酶掺入的单个DNA核苷酸。四个DNA核苷酸中的每一个都连接到四种不同荧光染料之一上。当通过DNA聚合酶掺入核苷酸时,切割荧光标签并扩散出ZMW的观察区域,在那里不再能观察到荧光。检测器检测核苷酸掺入的荧光信号,并根据染料的相应荧光进行碱基响应。
在Helicos HeliscopeTM技术中,片段被连接到阵列的polyT寡聚物捕获。在每个测序循环中,加入聚合酶和单荧光标记的核苷酸,并对阵列成像。随后去除荧光标签并重复该循环。
通过以下非限制性实施例进一步对本发明进行说明。
实施例1
纯化病毒样品的测序和分析
RNA提取和逆转录:根据凯杰方案的修改版本,使用来自凯杰的病毒RNA微型试剂盒从所有测试样品中分离基因组RNA。简言之,将560μl不含载体RNA的缓冲液AVL(病毒裂解缓冲液“A”-离液洗涤剂溶液)加入到140μl样品中。将样品进行涡旋并在室温(23℃±2℃)下孵育10分钟。向样品中加入560μl的100%乙醇,涡旋混合,然后将一半样品(约630μl)加入到微型柱中,并以6000×g离心1分钟。样品的其余部分被添加到柱中,重复旋转步骤。然后用两缓冲液洗柱。每个40μl洗脱缓冲液进行双重洗脱,总体积约为80μl。使用NanoDropTM 8000分光光度计以分光光度法定量总RNA。然后使用生命科技公司的ThermoScriptTM RT-PCR系统将RNA用于制备cDNA。简而言之,将9μl RNA、1μl寡聚(dT)20引物和dNTP在65℃温育5分钟。温育后,向样品中加入cDNA合成缓冲液、DTT,RNaseOUTTM和ThermoScriptTM RT,样品在50℃温育45分钟,然后在85℃温育5分钟以终止反应。将RNA酶H加入到样品中,并在37℃温育20分钟。使用NanoDropTM 8000分光光度计以分光光度法定量cDNA。然后使用来自新英格兰生物实验室的NEBNextTM第二链合成试剂盒使用5μl的cDNA产物进行第二链反应。将cDNA与第二链合成缓冲液和第二链合成酶混合物合并,并在16℃温育2.5小时。使用来自凯杰的PCR纯化试剂盒纯化产物,并在30μl无核酸酶的水中洗脱。使用NanoDropTM 8000分光光度计以分光光度法对dscDNA进行定量,并在-20±4℃下储存以进行短期储存。
文库制备:用制备的dscDNA制备文库,以便在2500上测序。从每个原始样本制备一个文库。使用的XT文库制备试剂盒来制备文库。基于先前的研究范围中使用1pg至1ng输入dscDNA的发现结果,dscDNA的起始总输入量为每个文库1ng。按照XT文库制备方案来制备文库。简言之,使用标记化学试剂,将每个样品进行酶促片段化并用衔接子序列同时标记(连接)。该过程将输入DNA片段化,并将衔接子序列添加到片段的末端用于下游处理。然后中和连接酶,并进行简短的12个循环扩增,以在5'-和3'-末端向每个样品添加条码序列。每个库可以分配不同的条码序列以在分析期间识别和标示不同的样品。使用两轮XP珠洗涤清洁PCR反应物,然后在TE缓冲液中洗脱。然后使用高灵敏度DNA芯片在安捷伦生物分析仪上分析每个文库以评估文库的质量和数量。样本文库在-20±4℃下进行短期保存。
DNA测序和分析:对于每个样品,在2500上运行快速流动槽。对于每个流动槽,将文库进行变性和稀释以在仪器上成簇。然后使用SBS测序技术和试剂对每个文库进行两侧2x150bp测序。使用软件对所得数据进行去重,然后进行分析。每个流动槽使用单个样品运行。为所有测序的组分生成FastQ文件。数据分析过程的总体流程如图1所述。Samtools和mpileup软件用于将输出文件从SAM转换为BAM格式和索引输出文件,以便在整合基因浏览器(Integrated GenomeViewer)中查看。Mpileup与标志一起使用来增加每个位置的深度,以便检查病毒的覆盖度并查找潜在的变化。
由于XT文库制备需要12个循环的PCR预扩增,所以在给定位置响应病毒序列变异体的阈值设为212=4096或读序的0.1%,以较大者为准。根据以下标准定义变体:如果给定碱基位置处的测序深度等于或超过4,096,000,则称潜在变化大于0.1%;如果深度小于4,096,000,但大于4096,则确定为超过4096或更大频率的变体;如果给定碱基位置的覆盖深度小于4096个读序,如果大于1.0%,则确定为潜在的变体。在需要额外的测序工作(或)之前,每个碱基位置的最小读取覆盖度设置为4X(最小监管要求)。
对每个样本使用Bowtie(短片段参考比对器)将序列读序与PVS-RIPO参考序列比对。计算每个样品的碱基总数、覆盖度和平均读取长度的值以及与参考匹配的读序的百分比,并将其与预先建立的用于测定有效性的规格进行比较。通过取总序列碱基并除以PVS-RIPO参考序列(7303个碱基对)的大小来发现所估计的覆盖度。制备与每个样品的参考位置相比较的覆盖度曲线,以及每个样品的样品读取长度的图。与参考序列比较时进行分析以检查每个样品中的变体。在每个病毒批次的5'末端(碱基位置1-34)预期到(并观察到)多态性水平的升高;脊髓灰质炎病毒基因组的这个区域(VPg结合和Stem a/b)在体内表现出高的序列变异性。可以通过NCBI BLASTn分析非匹配序列读序序列以确定它们的身份;预期未匹配结合的读序,特别是来自未纯化病毒样品的那些将来自Vero宿主细胞基因组或线粒体DNA序列,尽管也可观察到人类DNA或其他实验室污染物DNA序列。
实施例2
粗制和未纯化的病毒样本的测序和分析
RNA提取和逆转录:使用凯杰病毒RNA微型提取试剂盒从每个测试样品中提取病毒RNA,而不添加载体RNA。将每个样品的等分试样用于提取。由于未纯化病毒样品中的大部分核酸(通过拷贝数和质量)是宿主细胞基因组和线粒体DNA,因此需要额外的纯化步骤来除去这些干扰分子。使用样品中游离DNA的DNA酶消化,使病毒RNA不受影响。随后使用来自生命科技公司的TurboDNase-freeTM试剂盒对来自主病毒库样品的提取RNA等分试样进行DNA酶处理。
将样品用2μl Turbo DNA酶处理,在37℃下孵育30分钟,然后用DNA酶灭活试剂灭活。使用Leidos/BDP-QC“PO1PR”RT-qPCR测定法定量所得的富集的病毒RNA。然后使用来自克隆技术实验室(Clontech Laboratories的UltraTM低输入RNA制备试剂盒,将RNA用作逆转录和第二链合成的输入。使用IIA CDS和寡核苷酸引物在42℃进行90分钟的第一链合成。当与PVSRIPO一起使用时,SMARTer IIA Oligo通过使用SMARTScribeRT的5'末端转移酶活性和SMARTer IIA Oligo来改善全长聚腺苷酸化的PVSRIPO RNA(和污染的Vero mRNA)序列的回收,所述SMARTer IIA Oligo防止由停滞的RT流程事件产生的cDNA的标记。
然后使用在cDNA制备物中引入的寡聚dT和SMART引物通过长距离PCR扩增所得的全长cDNA。然后修饰样品以使用AMPure珠除去引物和dNTP,并在Qubit 2.0荧光计或NanoDrop 8000分光光度计上定量,并使用DNA芯片在安捷伦2100生物分析仪上验证其大小。或者,可以使用靶向HRV-2IRES或脊髓灰质多聚蛋白CDS序列5'端的定量PCR反应在测序前测定靶拷贝数。
文库制备:将来自两种不同制剂的dscDNA用作文库制备的模板;使用来自的XT文库制备试剂盒。每个dscDNA样品取一纳克用于每个文库的制备。试剂盒使用“标签化”技术,在单个孵育步骤中,输入物被片段化并用衔接子进行标记。然后中和连接酶,并通过短的12个循环扩增对每个样品进行条码序列化,然后使用XP珠进行纯化。纯化后,使用安捷伦2100生物分析仪高灵敏度DNA芯片评估每个文库的数量和质量。
测序:然后在2500仪器上将文库用于测序。该仪器在快速运行模式下使用,每个文库在一个快速运行流通池上进行测序。将文库变性并稀释,然后使用仪器的机带集群能力来形成簇。使用2x100bp两端测序对文库进行测序。所产生的序列必须在所有碱基上获得至少4X的覆盖度,或将进行额外的Sanger测序来完成对那些区域的覆盖,预计到这发生在病毒5'端,此处由于病毒IRES域内强RNA结构发生RT枯竭。序列分析程序遵循上文和图1中详述的纯化病毒样品程序。生成报告详细说明与PVSRIPO参考序列的共有同源性、每个碱基位置的覆盖度,以及大于读序0.1%或>4096个读序的异源碱基(如适用)。
实施例3
Sanger测序
如果参考序列的任何碱基对使用方法覆盖了<4个测序读序,则将采用Sanger测序。如果缺乏适当覆盖度的基因组部分靠近基因组的5'末端,则可以使用几种间隙填充技术,包括替代的NGS方法如罗氏/454FLX和/或可选的预扩增方法,如“线性扩增”PVS-RIPO cDNA仅使用反向引物以防止引物掩盖5'序列变异性。采用高循环数量的线性(非指数)PCR来防止引物序列覆盖天然PVS-RIPO病毒序列,特别是在PVS-RIPO病毒的低代表(低拷贝dscDNA)和高变异性5'端。最后,如果这些方法都不能成功覆盖剩余的序列间隙,则可以进行传统的PCR然后进行Sanger荧光测序。从这些间隙填充方法获得的序列数据,包括与PVSRIPO参考序列的共有序列同源性以及观察到的任何异源碱基均包括在最终报告中。
实施例4
有效测试的标准
在实施例1和2中,有效测试的标准包括:
1.提取的RNA必须为每个样本至少5纳克。
2.所得到的cDNA必须是每个样品至少2纳克用于第二链反应。
3.使用安捷伦2100高灵敏度DNA芯片,文库必须是可检测的,并且大小合适用于测序(大约300bp)。
4.如果需要,将利用Sanger测序,从而为来自多个线性扩增(如果在可变的5'端)或来自多个引物组的所需位置提供最小4X覆盖,如果在病毒基因组中的其他位置。
在实施例1和2中,所述序列验收标准包括:
2.与参考匹配的读序百分比应该超过75%。
3.参考病毒序列的平均覆盖度≥18,000X。
实施例5
纯化和粗制病毒样品的RT-PCR和Sanger染料终止子测序
RNA提取和逆转录:按照批准的程序,将250μl测试样品加入到1120μl凯杰缓冲液AVL/载体RNA中,涡旋,并在室温下温育10分钟。将一半的样品+缓冲液AVL(685μl)转移到第二个微量离心管中,向每个管中加入560μl乙醇(96-100%),通过脉冲涡旋混合15秒,并短暂离心。然后将溶液加入QIAamp旋转柱,用合适的洗涤缓冲液洗涤,并在60μL缓冲液AVE中洗脱。按照批准的程序使用分光光度计对病毒RNA进行定量。然后将病毒RNA保存在≤-65℃直至使用。
PCR扩增和测序引物选择:用于测试品PCR扩增和Sanger序列分析的合成寡核苷酸来源于PVSRIPO参考序列(参见表2)。将引物设计成分开退火约250个碱基,具有约50%的GC含量,并且长度在18-24bp。设计引物位点,使得在测序cDNA的两条链时,根据每个引物延伸的预期读取长度,每个碱基对(每条链两)产生四个或更多个读序。
表2:用于PVSRIPO的Sanger测序的代表性寡核苷酸引物。还采用了列出的其他引物序列批次。
提取后,使用SuperScript III RT-PCR试剂盒,在约1200个碱基片段中逆转录(RT)和PCR扩增PVSRIPO RNA。将大约0.1微克提取的病毒RNA与25μl的2X反应混合物和10pmole的各正向和反向引物合并,并用无核酸酶的水使终体积达到50μl。按照批准的程序使用QIAquick PCR净化柱纯化扩增子。为了验证在PCR之后存在预期大小的扩增子,通过琼脂糖凝胶电泳分析每个PCR反应的等分试样,并用溴化乙锭染色进行成像。随后将成功的PCR反应物保存在-18±2℃直到进一步使用。
使用荧光染料终止子化学的Sanger测序:使用ABI BigDye v1.1测序试剂盒按照批准的程序进行测试品样品和pGEM3Z对照质粒的荧光染料终止子DNA循环测序。将2.0μl的5x BigDye测序缓冲液与2.0μlReady反应预混合物、2μl 2μM测序引物、20ng纯化的PCR产物和纯化水合并,使最终反应体积为10μl。对于用作反应和仪器对照的pGEM3Z对照反应,用20ng(约3.2pmol)的M13F-20阳性对照引物(5'GTAAAACGACGGCCAGT-3';SEQ ID NO:79)对200ng的pGEM3Z进行测序。用每个测序装置(即平板)进行对照反应,并按照批准的程序在ABI3130xl上进行分析。按照批准的程序使用PTC-225Peltier热循环仪进行循环测序反应。在分析之前,使用Centriflex凝胶过滤柱从未掺入的染料终止剂、盐和低分子量化合物中纯化测序反应物。按照批准的程序使用ABI3130xl DNA测序仪进行自动化的DNA序列分析。在毛细管电泳和检测过程中,通过测序计算机从3130xl的每个通道收集荧光序列数据并进行分析。对原始序列运行数据进行修整,并按照批准的程序,使用Sequencher软件(GeneCodes,安阿伯市,密歇根州(Ann Arbor,MI))将其匹配成连续排列序列,也称为“重叠群”(contig)。然后将每个样品的重叠群与PVSRIPO参考序列进行比对,在ABI软件、Sequencher、BioEdit、CloneManager和其他序列分析套件的自动协助下,手动进行碱基变化、插入缺失、间隙和多义性(多态)位点的搜索。
基于Sanger方法的测序验收标准:在每个测序板上运行的pGEM3Z阳性对照测序反应必须产生至少500读序碱基长度(LOR)并且对于前500bp序列读序具有≥20的质量值(QV)(由应用生物系统(Applied Biosystems)(ABI 3130xl)分析报告确定)。质粒对照的总体测序质量必须大于90%。
实施例6
对PVS-RIPO批次进行测序
DNA提取和逆转录:使用来自凯杰的病毒RNA微型试剂盒按照AIBSOPMOLBIO00050的修改版本从所有测试样品中分离基因组RNA。简而言之,将560μl不含载体RNA的缓冲液AVL加入到140μl样品中。将样品涡旋混合并在室温(23℃±2℃)下孵育10分钟。将560μl、100%乙醇加入到样品中,涡旋混合,然后将一半样品(约630μl)加入到微型柱中并以6000xg离心1分钟。将其余样品加入到柱中,重复旋转步骤。然后用两缓冲液洗柱。每次进行40μl洗脱缓冲液的双倍洗脱,总终体积为约80μl。按照AIB SOPMOLBIO00077使用NanoDropTM 8000分光光度计以分光光度法对RNA进行定量。然后使用来自生命科技公司的ThermoScriptTM RT-PCR系统取RNA用于制备cDNA。简言之,将7μl中的1μgRNA、1μl寡聚dT引物,dNTP和水在65℃温育5分钟。温育后,将cDNA合成缓冲液、DTT、RNaseOut和ThermoScriptTMRT加入到样品中,并将样品在50℃下温育45分钟,然后在85℃温育5分钟以终止反应。将RNA酶H加入到样品中,并将其在37℃下温育20分钟。按照AIBSOPMOLBIO00077使用NanoDropTM 8000分光光度计以分光光度法定量cDNA。然后使用来自新英格兰生物实验室的NEBNextTM第二链合成试剂盒,使用总共100纳克的cDNA产物进行第二链反应。将cDNA与第二链合成缓冲液和第二链合成酶混合物合并,并在16℃温育2.5小时。使用来自凯杰的PCR纯化试剂盒纯化产物,并在30μl无核酸酶的水中洗脱。按照AIB SOP MOLBIO00077使用NanoDropTM 8000分光光度计以分光光度法定量dscDNA,并储存在-20±4℃以短期储存。
文库制备:使用制备的dscDNA制备用于在2500上进行测序的文库。从每个原始样本总共制备了11个文库。使用来自的XT文库制备试剂盒来制备文库。对于制备的每个文库,dscDNA的起始总输入不同,如下:文库1-1000pg、文库2-750pg、文库3-500pg、文库4-250pg、文库5-100pg、文库6-75pg、文库7-50pg、文库8-25pg、文库9-10pg、文库10-5pg、文库11-1pg。基于来自NanoDropTM 8000分光光度计的定量,将dscDNA稀释至不同的输入量。按照XT文库制备方案制备文库。简而言之,使用标记化学物质同时对每个样品进行标记和酶促片段化。该过程将输入DNA片段化,并将衔接子序列添加到片段的末端以用于下游处理。然后进行简短的12个循环扩增以在每个样品上添加条码序列。在分析过程中,每个稀释物被分配不同的条码序列以分离出不同的样品。使用两轮XP珠洗涤清洁PCR,然后在TE缓冲液中洗脱。然后在安捷伦生物分析仪上分析每个文库以评估文库的质量和数量。这些文库储存于-20±4℃下用于短期保存。
下一代DNA序列分析:对于每个原始样品,在2500上运行两个流动池。第一个流动槽由一个单一的文库组成-最高的输入文库(文库1)。第二个流动槽具有以等摩尔浓度合并的全部11个文库。对于每个流动槽,将文库或文库池变性并稀释以在仪器上成簇。然后使用SBS测序技术和试剂对每个文库进行两端2x150bp测序。适用时,使用软件对结果数据进行去重,然后进行分析。将片段与所提供的参考基因组序列PVS-RIPO(SEQ ID NO.1)进行比对。为所有测序的组分生成FastQ文件,并将在驱动器上提供并邮寄。来自两条通道的FastQ文件合并成一个数据集并作为一个样本进行分析。数据分析过程的总体流程如图1所述。使用Samtools和mpileup将输出文件从SAM转换为BAM格式和索引输出文件,以便在整合基因浏览器中查看。Mpileup与一个标志一起使用来增加每个位置的深度,以便检查病毒的覆盖度并寻找潜在的变化。根据以下标准定义变体:如果给定位置的测序深度等于或超过4,096,000个,则可能的变化大于0.1%;如果深度小于4,096,000且大于4096,则称为超过4096或更大频率的变体;如果覆盖深度小于4096,则称为大于1.0%的潜在变体。最小读取覆盖度设为4倍。如果一个位置的覆盖度低于最小值,那么该位置则没有数据报告。
PVSRIPO毒理学材料的测序结果,批号L0603006,QC-052548-02:稀释系列:使用软件将片段去重。分离条码序列后,使用Bowtie(短读序参考校准器)将读序与参考序列进行比对。比对统计如表3和图2所示。在1000pg输入处,大约87%的读序与参考序列匹配。随着输入量的减少,匹配读序比例下降。使用1000pg样品进行另外的分析以鉴定潜在的污染序列。少量的未匹配读序与非冗余数据库进行比较,许多命中值(hit)返回到宿主细胞绿猴属(Chlorocebus)(Vero)DNA。
表3:每个稀释文库的比对统计
*=条码序列中的错误防止将这些序列分配给特定样本。
分析所有样品以确定最小、最大和平均读取长度(表4)。
表4:每个稀释文库的读取长度统计。
因此,在约500-1000pg ds-cDNA输入,匹配读序(即,含有病毒序列对“垃圾”/随机和宿主细胞DNA序列的读序)出峰,并且在约25pg输入以上就对读取长度没有明显的影响。
样本读取长度图如图3所示。平均读取长度大约为100个碱基对。使用以下等式计算整个病毒的大致覆盖度。
测序核苷酸数量
病毒长度
表5显示了稀释系列中包含的每个部分的估计覆盖度。估计覆盖度不反映下一代测序实验的真实性质,因为一个碱基到另一个的覆盖度是不同的,所以进行额外的分析来描述参考序列的覆盖度。示例性的覆盖图如图4所示。全长覆盖度用1纳克输入实现。病毒的5'末端比其它区域的覆盖度低。
表5:基于读取长度和读序数量的各个稀释文库的PVSRIPO基因组估计覆盖度
单次输入实验使用单个1000pg样品运行第二个流动槽。样品中有171,001,369个读序,其中87.2%与参考序列匹配。估计覆盖度为751,294倍。
实施例7
使用Illumina深度测序分析了七批PVSRIPO,其中三个在之前已经测序,采用的是RT-PCR(病毒基因组的约1200个碱基部分),随后使用ABI终止子化学与ABI3130xl测序仪进行Sanger荧光测序。最初的NGS开发工作的重点是确定哪种方法可提供最大的覆盖深度,同时最大限度地减少由于测序前的逆转录和预扩增引起的内在错误率。一个关键的标准是利用PCR和测序引物,其靶向不是病毒基因组部分的序列。这意味着衔接子被用于在病毒cDNA片段化之后选择的任何NGS方法。
先前的Sanger测序方法使用PCR预扩增和来自理论病毒序列的测序引物,并直接靶向病毒cDNA序列。尽管使用了大量重叠的测序读序,直接PCR和测序启动的使用产生了有利于所使用的引物序列的巨大偏差,有效地防止了在启动位置恢复任何异源碱基。这种偏差效应在病毒cDNA的极限末端尤为突出,其中重叠读序限于单一方向。即使寡核苷酸dT引发用于逆转录(RT),这种效应也导致无法恢复含有聚腺苷酸化信号的病毒序列的极端3'末端。这种不能恢复极端3'序列的原因可能是由于荧光信号水平的降低以及序列同质性(即均聚腺嘌呤)的增加,从而阻碍了该区域精确的碱基响应。
NGS衔接子方法被用来最大限度地减少任何酶的限制,以恢复病毒的极端3'端,但它,但需要计算密集的基因组重新拼接(de novo genome assembly)。依诺米那系统深度测序使用7303核苷酸PVSRIPO MVB参考序列作为指导从而快速比对并产生病毒基因组共有序列和鉴定碱基变体。然而,不使用参考序列产生的重新匹配预计会恢复病毒的极端3'末端,并鉴定出存在于病毒基因组中的任何大(>10nt)插入缺失片段。
自2004年以来的所有批次PVSRIPO都使用了来自主病毒库(种子)批号L0403006的Sanger序列作为参考序列。使用Sanger测序方法确定MVB序列与源质粒序列(批号L0401014)完全同源。用于测序分析的PVSRIPO样品分为四类-纯化质粒、大肠杆菌质粒库、粗制Vero收获物和MVB批次,以及纯化的病毒。四种样品类型所需的提取和制备方法有所不同。表6提供了一个总结。
表6-为PVSRIPO完成的Sanger和NGS(依诺米那)测序总结
*作为依诺米那方法开发处理(非GLP)的一部分进行测序。
实施例8
结果
为了阐明PVSRIPO中碱基异质性的位置和程度,采用了深度测序的方法。先前的PVSRIPO批次,包括质粒和主病毒库材料,通过Sanger测序(2003-2009)进行分析。可选地,在2007-2008年用6个PVSRIPO分离物(Dobrikova等人(2008)Mol Ther 16:1865-1872)进行HTB-15神经胶质瘤细胞传代和噬菌斑Sanger测序方法。这只确定了PVSRIPO基因组中的两个位点(位置97和1824),其通过Sanger测序显示了多态性碱基(即,由总病毒群体约15%以上组成)。通过Sanger测序在PVSRIPO中观察到的有限的病毒序列变异(包括具有传代后斑块测序)表明在Vero(和HTB-15神经胶质瘤细胞)中繁殖期间,PVSRIPO比预期的脊髓灰质炎野生型或疫苗株(Sanjuan等(2010)J Virol 84:9733-48)更稳定。然而,为了清楚地证明PVSRIPO的遗传稳定性,需要能够报告给定批次中的个体(即,低拷贝)病毒体序列的深度测序方法。表7中详细描述了商业深度测序方法的综述(Liu等(2012)J Biomed Biotech2012:251364)。
表7:相对于ssRNA病毒制剂的Sanger和深度测序方法的总结
鉴于纯化的PVSRIPO样品中的短基因组长度(<7400nt)和高病毒滴度(>1×109TCID50/mL),选择经依诺米那测序的衔接子文库制剂作为产生高质量读序的方法,同时伴有来自PVSRIPO样品的高读取深度(Neverov&Chumakov(2010)PNAS USA 107:20063-20068)。
用2004年MVB批次(L0403006)和2006年非临床批次L0603006进行初始方法开发活动,在测试剩余批次之前对上述一般方法进行了若干改进。与MVB批次一起使用的SMARTer超低拷贝方法的优化结果之一是提高RT保真度,并识别常见RT错误基序,后来用于2013MVB批次测试分析。由于这个原因,PVSRIPO批号L0403006和L0603006具有的低频多态性(错误率)碱基位置的量比来源于L0403006MVB的其它批号更大。尽管用于方法开发的两个批次观察到较高的背景,但是它们都表现出与其他五个测试批次一致的多态性模式。
表8显示了核酸提取和Nextera XT文库制备结果的总结。两个MVB库(L0403006和L01311002)均显示低提取质量,与这些样品中存在的较低拷贝数以及更高水平背景宿主细胞来源的核酸一致。观察到的所有七个批次的平均基因组覆盖深度范围在2.2×105和1.5×106之间,比基于回收病毒RNA质量的计算的理论最大覆盖度低大约1-2个对数。
表8:使用PVSRIPO的依诺米那RNA提取、观察和理论最大覆盖度以及文库构建结果的总结
1基于RNA提取回收和随后的cDNA合成和测序步骤的体积比例,假定100%的总RNA输入质量由PVSRIPO病毒RNA组成。
2计算与PVSRIPO参考序列匹配读序的所有碱基的平均覆盖度,假定覆盖整个病毒参考基因组的7303个碱基的深度相同。
3MVB批次未经过柱纯化,并且具有的宿主细胞核酸百分比更大,影响了病毒RNA提取产量。
4依诺米那方法开发研究结果。RNA提取和cDNA合成方法与用于后来的GLP研究使用的那些方法相似但不相同。
如表9所详述的,各批次的平均读取长度在88和108bp之间,每个批次测序超过一个千兆碱基。在所有情况下,与来源于Sanger的MVB参考序列匹配的读序百分比都在85%和93%之间,绝大多数不匹配的读序对应于Vero细胞mtDNA、gDNA和mRNA序列,如采用随机选择的非匹配读序通过nBLAST来确定。一小部分的非匹配读序代表了参考中缺失的极端病毒3'末端序列,并且可能包含更罕见(即迄今为止未观察到的)病毒序列,其可能含有“大”(>10nt)的且不易与PVSRIPO参考序列匹配的插入缺失标记。计算加强的病毒基因组重新拼接被用于鉴定和表征任何大的插入缺失标记(如果存在的话)以及PVSRIPO的3'末端序列异质性。表9还显示了超过“确定的变异阈值”水平的每个批次碱基位置数量-在大多数PVSRIPO基因组中,这个阈值≥0.1%,其中深度超过每个碱基4096个读序。
表9:七批PVSRIPO的依诺米那读取深度、读取长度、参考序列匹配分数和变体位置比例的总结
1包括不与参考序列匹配的读序。
2对于读取深度>4096的位置,多态性“确定”阈值设置为≥0.1%;对于读取深度≤4096,阈值设置为≥1.0%。
3综合碱基多态性+方法错误率的总量度。
4依诺米那方法开发研究结果。RNA提取和cDNA合成方法与用于后来的GLP研究的那些方法相似但不相同,并具有较高的错误率。
对于读取深度较大的批次,特别是对于使用Illumina方法的两个批次,观察到更多数量的多态性碱基位置。不包括两个方法开发批次(L0403006和L0603006),在其余五个测试批次中,所确定的不同碱基位置的数量在27和331之间。PVSRIPO(和脊髓灰质炎)基因组的5'端超可变区位于1至34位;如预期那样,并且尽管(或可能由于)读取深度低,如表10所述,这是病毒基因组中展现出碱基变体和多态性频率最高的区域。表10还分解了在PVSRIPO基因组每个主要区域中多态性和变体碱基位置的数目,大部分发生在脊髓灰质多聚蛋白编码序列-病毒基因组中最大的元件。
表10:使用依诺米那深度测序比较7批次PVSRIPO中的序列变异频率和位置(碱基位置)
1确定的变异碱基读数总数占基因组中读取的匹配碱基总数的百分比。综合碱基多态性+方法错误率的另一个总量度。
2确定的碱基变体频率作为参考基因组长度(不含29个3'UTR末端序列碱基的7303个核苷酸MVB参考标准序列)百分比。
3关键的IRES结构域,用于介导病毒基因组与eIF4G-核糖体复合物之间的相互作用。在基因组该区域中的序列多态性最可能导致对细胞内嗜性和病毒表达的潜在修饰。
4依诺米那方法开发研究结果。RNA提取和cDNA合成方法与用于后来的GLP研究的方法相似但不相同。
细胞内病毒嗜性和致病性变化的最关键区域是介导eIF4G-核糖体复合物的结合和组装的IRES结构域V和VI。在PVSRIPO的这个区域,所分析的七个批次中的四个批次中仅观察到单个多态性(在位置618处)(表11)。由于经典鸟嘌呤占所有读序的>99.9%,因此在618位中没有发现其中三个批次具有多态性;而剩余的四批中,>97%的所有读序在第618位是鸟嘌呤。在618位呈现多态性的四个批次具有相同的替代模式(G>T>A>C)。尽管在来自于MVB的四批中在618位观察到多态性,但在亲本MVB批号(L0403006)或L0904010临床批号中没有观察到第618位的多态性。该转换是在生产中在病毒扩增期间代表位置618处的真实序列突变还是测序过程中聚合酶替代的优选位点不能立即确定,即使频率非常高(高达2.6%)提示了前者。有趣的是,在618位置取代最多(约2.6%)的PVSRIPO批次是非临床毒理学批号L0603006。该批次与以前的体内动物和异种研究一起使用,证明了PVSRIPO的非病原表型和稳定的基因型。如表11中所详述的,在一批以上的PVSRIPO中仅观察到总共5个序列变异位点,而在MVB批次中仅发现其中两个。所有5个位置都位于5'UTR IRES的位置:35、60、80、340和618。5个位点的优选的取代模式也是保守的,最关键的是两个多态性位点(位置35和60)存在于独立生成的主病毒库中。
表11:在一个以上的批次中观察到的所有五种PVSRIPO IRES序列变体,包括存在的多态碱基取代模式的比较。对于各个位置参考序列cDNA碱基示于列标题。
1618位是在关键IRES域V和VI中观察到的唯一碱基多态性。
2N/D-未检出。
3PVSRIPO临床DP批号L0904010在病毒基因组的IRES区(位置35-622)内没有表现出“超过阈值”的碱基多态性。该区域的读取深度在3'方向上增加,并且对于每个批次的深度范围在约2×102到约8×105读长/碱基位置之间变化。请参阅附录以了解每个批次的更多详细信息。
4批号L1405001和L1402001由相同的纯化病毒组成(批量DS与瓶装DP),但批号L1402001仅显示在L1405001中观察到的碱基多态性之一。这两次检测的主要区别在于L1405001的读取深度增加了约2倍。35位的%G差异很大的原因是未知的,但可能与位置34处的显著G>A多态性和变异度高的5'UTR区域的末端相关联。
由于RT耗竭和IRES结构域更强的二级结构,包含IRES的5'半数基因组(位置35-622)的读取深度低于平均值。尽管对RT效率有这些影响,但IRES域中读取深度仍在每个碱基位置103到105读序。有趣的是,2010年HTB-15异体移植研究中鉴定的两个多态性位置(位置97和1824)在PVSRIPO的依诺米那深度测序中未被鉴定为多态性,包括批次L0603006,表明在HTB-15异体移植中它们是传代之后碱基重新突变的结果。位置1824落入易发生突变的内部均聚腺嘌呤延伸范围内,但在依诺米那样品制备期间(见下文),其也可被内部寡聚dT引发部分掩蔽。
当从3'UTR(和polyA第一链起始位点)进展到5'UTR和5'端的超可变区时,PVSRIPO依诺米那读取深度迅速减少(图4和6-11)。覆盖度的下降的发生是由于RT延迟,这可以观察到覆盖深度的周期性尖峰,以及从3'第一链引发位点进行时的RT耗竭。幸运的是,PVSRIPO在第1822-1833位(包含第1831位的单个插入性鸟嘌呤)含有11个碱基内部多腺嘌呤片段,作为用于第一链合成的替代性内部寡聚-dT引发位点;尽管比3'聚腺嘌呤信号的延伸效率低得多。内部多腺嘌呤位点的存在使得在1822位以下(包括关键的IRES结构域)读取深度增加了约3倍。
一个或多个PVSRIPO特异性的第一链引物序列可以用于改善病毒基因组中约4000和约2000位以下的读取深度和序列覆盖度。由于5'末端附近读取深度迅速衰减,特别是在2013年MVB批次中存在高宿主细胞背景的情况下,使用了其它几种方法来验证该区域中的病毒序列(1至约60位)。最初ION Torrent和FLX焦磷酸测序NGS方法在基因组中的位置低于35的情况下进行了最小程度的改善。即使使用3'PCR起始位点进行线性PCR“扩增”,使用NGS方法,最终极端5'末端(位置10以下)也不能恢复到每个碱基>3读长。虽然PVSRIPO的纯化批次观察到5'末端读取深度的快速降低,但是对于较低浓度和更高的宿主细胞背景MVB批次影响最严重。
作为回收2013MVB批号L1311002 5’端的前~20个碱基的后备方法,使用Sanger方法和PVSRIPO特异性几何PCR扩增引物对其进行测序。不幸的是,这种方法回收了PCR引物序列,而不是病毒cDNA样品中存在的真实序列。这种效应的典型特征是碱基位置1作为胸腺嘧啶而不是腺嘌呤。胸腺嘧啶存在于5'PCR引物的第1位,并被错误地鉴定为Sanger来源参考序列中的第一个碱基。腺嘌呤已被无偏倚的依诺米那和其他NGS方法证实为PVSRIPO基因组cDNA第1位的真正碱基。靶向低于约2000碱基位置的PVSRIPO特异性第一链引物的使用能在极端5'末端改善cDNA拷贝数并大大提高读取深度,从而避免需要使用未纯化的低浓度病毒样品(如收获物、种子集和库)来用Sanger测序法进行补充。
表8比较了公开的野生型脊髓灰质炎复制错误率以及用PVSRIPO深度测序的各种聚合酶估计掺入错误率。天然脊髓灰质炎碱基掺入的估计错误率为约9×10-5至约9×10-6,而用依诺米那扩增和测序的两种RT方法的错误率估计为约5×10-4,相当于0.05%。因此,测序方法中碱基掺入错误率预期比感染细胞中的天然病毒复制错误率高出约5至55倍。
表8:脊髓灰质炎病毒、聚合酶和PVSRIPO批次的报告和观察错误率比较。
1参见Sanjuan等(2010)J Virol 84:9733-48获得更多细节。
2参见McInerney等(2014)Mol Biol Intl 2014:287430;Das等人(2001)PhysiolGenomics 6:57-80;和制造商的文献值。
在分析的7批次的PVSRIPO序列中,对于匹配序列观察到的错误率在早期方法开发批次中为0.19%至0.8%,而使用最终测序方法的批次为0.01%至0.03%。在未纯化的MVB批次L1311002和纯化的病毒批次之间没有观察到错误率显著的差异。由于这些比率通常低于测序方法在0.05%时的估计的较差情况错误率,所以不能忽视的是观察到的许多较低频率变体事实上是聚合酶掺入错误的结果并且不代表真正的病毒序列变异。基于所观察到的高频率多态性碱基,在2004MVB和2006年毒理学批次预优化中,这一点似乎尤其确切。一个有趣的观察结果是,随着读取深度的增加而鉴定的多态性碱基也增加(即>0.1%变异);这在病毒基因组的3'末端(包含天然脊髓灰质炎聚合酶CDS和3'UTR区域)尤其明显。该区域的许多碱基变异可能是聚合酶误掺入的结果,而不是真正的病毒多态性。数据的额外分析正在进一步对这些变体进行表征,以努力鉴定在测序方法的体外聚合和扩增步骤期间促进聚合酶错误掺入事件的序列基序。
附图5A-5NN中提供了附加的信息,其显示了PVSRIPO MVB的结果。
讨论
通过依诺米那深度测序检查的7批PVSRIPO病毒在整个嵌合病毒基因组上显示出惊人的序列微异质性限制,平均读取深度超过每个碱基2×105。观察到的序列变异,除了极端的5'末端之外,均显示出相对于经典参考序列<1%的总异质碱基响应,并且在一批以上的PVSRIPO中仅重复观察到仅5个多态性位置。这五个反复出现的异质性位置都位于HRV2IRES(位置35、60、80、340和618)内,并且在所有测试的批次中观察到其相关的碱基置换模式是一致的。这表明PVSRIPO临床批次中存在的有限变异来源于最初存在于亲本MVB批次(即位置35和60)中的变异,或可能代表病毒复制或cDNA测序期间聚合酶错误掺入的优选模式。用于通过体外转录和转染产生MVB的质粒DNA可能是七个PVSRIPO批次中观察到的基础变异模式的第三个来源。
PVSRIPO的NGS验证了先前的分析和神经毒性数据,这些数据表明PVSRIPO是出乎意料稳定的单链RNA病毒。因此,在使用第二MVB批次的PVSRIPO(批号L1311002)之前,考虑到所观察到的低水平微观异质性以及其序列变异模式与2004年制备的来源于第一批MVB的早期PVSRIPO临床批次的一致性,可能无需进行大规模非人灵长类体内神经毒性研究。另外的测序开发工作或者正在进行中(即用于回收3'UTR序列的重组装),或者有必要提高病毒序列关键5'UTR的覆盖深度。由于PVSRIPO相对于野生型脊髓灰质炎病毒的独特特征是由于存在HRV2衍生的IRES,所以使用NHP或患者来源样品的进一步施用后深度测序研究可用于确定突变率和临床相关的体内设置中HRV2IRES重组物的潜力。
本发明提供的结果提供了一个基线,可以比较未来的临床研究。IRES区域缺乏显著的碱基异质性,包括2013MVB批次L1311002和在制造期间在Vero细胞内扩增的5个批次,证实了PVSRIPO在遗传上是稳定的,并且批次间病毒表达、表型和致病性的变化在使用良好表征的MVB时不太可能(发生的)。
鉴于可以应用本发明原理的许多可能的实施例,应当认识到,所示的实施方式仅是本发明的例子,而不应被视为对于本发明范围的限制。相反,本发明的范围由随附权利要求限定。因此我们对属于这些权利要求范围和精神范围内的所有发明要求享有权利。
序列表
<110> 美国政府(由卫生和人类服务部的部长所代表);
美国国际生物技术有限公司
<120> 分析RNA病毒来源治疗剂的方法
<130> 4239-96898-02
<150> US 62/199,663
<151> 2015-07-31
<160> 80
<170> PatentIn version 3.5
<210> 1
<211> 19
<212> DNA
<213> 人工序列(artificial sequence)
<400> 1
caaacaatgg acaaggtgt 19
<210> 2
<211> 18
<212> DNA
<213> 人工序列(artificial sequence)
<400> 2
tcctgataaa aacatccc 18
<210> 3
<211> 19
<212> DNA
<213> 人工序列(artificial sequence)
<400> 3
attcgccgta ccagagatg 19
<210> 4
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 4
tgtgagttca atggattaag 20
<210> 5
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 5
tgttctgtgg atccatgatg 20
<210> 6
<211> 19
<212> DNA
<213> 人工序列(artificial sequence)
<400> 6
ccgtgaaacg gtgggggcg 19
<210> 7
<211> 19
<212> DNA
<213> 人工序列(artificial sequence)
<400> 7
gggcatgcct taaatcaag 19
<210> 8
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 8
gccctggagt ggattacaag 20
<210> 9
<211> 21
<212> DNA
<213> 人工序列(artificial sequence)
<400> 9
caaggtgaca gttggttgaa g 21
<210> 10
<211> 19
<212> DNA
<213> 人工序列(artificial sequence)
<400> 10
caggtaaatc tgtagcaac 19
<210> 11
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 11
tgaaatgtgt aagaactgtc 20
<210> 12
<211> 19
<212> DNA
<213> 人工序列(artificial sequence)
<400> 12
gcagtggctg gagttgtct 19
<210> 13
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 13
ctgagacaaa tgatggagtc 20
<210> 14
<211> 19
<212> DNA
<213> 人工序列(artificial sequence)
<400> 14
aaacgatccc aggcttaag 19
<210> 15
<211> 21
<212> DNA
<213> 人工序列(artificial sequence)
<400> 15
cctacaaggg catagattta g 21
<210> 16
<211> 18
<212> DNA
<213> 人工序列(artificial sequence)
<400> 16
attgctccca gagtactc 18
<210> 17
<211> 21
<212> DNA
<213> 人工序列(artificial sequence)
<400> 17
tggcattact ggatgaataa g 21
<210> 18
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 18
tctccgaatc cgattttctc 20
<210> 19
<211> 18
<212> DNA
<213> 人工序列(artificial sequence)
<400> 19
tcgcttcagg gccgctgc 18
<210> 20
<211> 19
<212> DNA
<213> 人工序列(artificial sequence)
<400> 20
ggtgaagcgt gggttggta 19
<210> 21
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 21
caggaggggg actcgtcttg 20
<210> 22
<211> 19
<212> DNA
<213> 人工序列(artificial sequence)
<400> 22
ctgacattat tgaatagaa 19
<210> 23
<211> 22
<212> DNA
<213> 人工序列(artificial sequence)
<400> 23
tcaagttctt aagtagcttt tc 22
<210> 24
<211> 19
<212> DNA
<213> 人工序列(artificial sequence)
<400> 24
ccctgcgttg caattgcac 19
<210> 25
<211> 19
<212> DNA
<213> 人工序列(artificial sequence)
<400> 25
tagagggagt cacctagtg 19
<210> 26
<211> 19
<212> DNA
<213> 人工序列(artificial sequence)
<400> 26
ctgagttatc cacggttat 19
<210> 27
<211> 19
<212> DNA
<213> 人工序列(artificial sequence)
<400> 27
gacgactatt ctggtttgg 19
<210> 28
<211> 18
<212> DNA
<213> 人工序列(artificial sequence)
<400> 28
agagtatggg atcgtctg 18
<210> 29
<211> 19
<212> DNA
<213> 人工序列(artificial sequence)
<400> 29
taccatacta tctatcgag 19
<210> 30
<211> 19
<212> DNA
<213> 人工序列(artificial sequence)
<400> 30
atgtcccgca gtgcatcag 19
<210> 31
<211> 19
<212> DNA
<213> 人工序列(artificial sequence)
<400> 31
tggtagaacc accatacgc 19
<210> 32
<211> 19
<212> DNA
<213> 人工序列(artificial sequence)
<400> 32
cgaccagcca aacgatttc 19
<210> 33
<211> 18
<212> DNA
<213> 人工序列(artificial sequence)
<400> 33
gagtcccatg tcccgcag 18
<210> 34
<211> 21
<212> DNA
<213> 人工序列(artificial sequence)
<400> 34
ccaacatacg gtaccgagat c 21
<210> 35
<211> 21
<212> DNA
<213> 人工序列(artificial sequence)
<400> 35
tgctttcacc aggtgaagcg t 21
<210> 36
<211> 24
<212> DNA
<213> 人工序列(artificial sequence)
<400> 36
tacccgtgaa agtgcctcct ttct 24
<210> 37
<211> 24
<212> DNA
<213> 人工序列(artificial sequence)
<400> 37
tgcaactacc atttggccac tcag 24
<210> 38
<211> 24
<212> DNA
<213> 人工序列(artificial sequence)
<400> 38
aatgtccatg tcgaacgcaa agcg 24
<210> 39
<211> 27
<212> DNA
<213> 人工序列(artificial sequence)
<400> 39
atttacccct acagcagtat gacccaa 27
<210> 40
<211> 24
<212> DNA
<213> 人工序列(artificial sequence)
<400> 40
tgtatgttcc tgtcggtgct gtga 24
<210> 41
<211> 25
<212> DNA
<213> 人工序列(artificial sequence)
<400> 41
ttaaaacagc tctggggttg taccc 25
<210> 42
<211> 26
<212> DNA
<213> 人工序列(artificial sequence)
<400> 42
tttttatcag gacatccttg atgggc 26
<210> 43
<211> 21
<212> DNA
<213> 人工序列(artificial sequence)
<400> 43
tatattggca ccatgggagc t 21
<210> 44
<211> 21
<212> DNA
<213> 人工序列(artificial sequence)
<400> 44
ggaccaacaa ctgtgctaca c 21
<210> 45
<211> 21
<212> DNA
<213> 人工序列(artificial sequence)
<400> 45
aagtcaaagg gaatcatggt g 21
<210> 46
<211> 21
<212> DNA
<213> 人工序列(artificial sequence)
<400> 46
gctctatatg tgtggtatct c 21
<210> 47
<211> 21
<212> DNA
<213> 人工序列(artificial sequence)
<400> 47
tatgtgtggt atctcgcatc a 21
<210> 48
<211> 21
<212> DNA
<213> 人工序列(artificial sequence)
<400> 48
tggtggagag gggtgtaagc g 21
<210> 49
<211> 21
<212> DNA
<213> 人工序列(artificial sequence)
<400> 49
ggtgaccagt accatcactg a 21
<210> 50
<211> 21
<212> DNA
<213> 人工序列(artificial sequence)
<400> 50
tttcagctat ggctctagca a 21
<210> 51
<211> 21
<212> DNA
<213> 人工序列(artificial sequence)
<400> 51
catctttagt gcctcgaacc a 21
<210> 52
<211> 21
<212> DNA
<213> 人工序列(artificial sequence)
<400> 52
gactatggac taactatgac t 21
<210> 53
<211> 21
<212> DNA
<213> 人工序列(artificial sequence)
<400> 53
ttacattctc ccatgtgact g 21
<210> 54
<211> 21
<212> DNA
<213> 人工序列(artificial sequence)
<400> 54
atcacgttcg ctctctgtgc c 21
<210> 55
<211> 24
<212> DNA
<213> 人工序列(artificial sequence)
<400> 55
tgtgttccca acatcgcctc ctta 24
<210> 56
<211> 21
<212> DNA
<213> 人工序列(artificial sequence)
<400> 56
cagccctgct tggttcgagg c 21
<210> 57
<211> 21
<212> DNA
<213> 人工序列(artificial sequence)
<400> 57
cttctaagtt gaattcctaa g 21
<210> 58
<211> 19
<212> DNA
<213> 人工序列(artificial sequence)
<400> 58
tcttctttcc cattgctac 19
<210> 59
<211> 22
<212> DNA
<213> 人工序列(artificial sequence)
<400> 59
gagcaggaca gtgtggtgga gt 22
<210> 60
<211> 22
<212> DNA
<213> 人工序列(artificial sequence)
<400> 60
gcaagggaga gttcactatg tt 22
<210> 61
<211> 19
<212> DNA
<213> 人工序列(artificial sequence)
<400> 61
tgcggttaac gatcgcagt 19
<210> 62
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 62
tcatctgcca ggtctaccag 20
<210> 63
<211> 21
<212> DNA
<213> 人工序列(artificial sequence)
<400> 63
ctagtactcc ggtattgcgg t 21
<210> 64
<211> 19
<212> DNA
<213> 人工序列(artificial sequence)
<400> 64
catcgcctcc ttacgcttc 19
<210> 65
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 65
gtggccatta taaccgtgga 20
<210> 66
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 66
gtttgccatg tgtagtcgtc 20
<210> 67
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 67
gatctcggta ccgtatgttg 20
<210> 68
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 68
ctctatggtg cagcatctct 20
<210> 69
<211> 19
<212> DNA
<213> 人工序列(artificial sequence)
<400> 69
actcagcaga ttggagaca 19
<210> 70
<211> 19
<212> DNA
<213> 人工序列(artificial sequence)
<400> 70
gatggttatc catccagtc 19
<210> 71
<211> 18
<212> DNA
<213> 人工序列(artificial sequence)
<400> 71
gtcgaagtgt gatggatc 18
<210> 72
<211> 19
<212> DNA
<213> 人工序列(artificial sequence)
<400> 72
catggcatcc ctggaggag 19
<210> 73
<211> 19
<212> DNA
<213> 人工序列(artificial sequence)
<400> 73
agcctccata caattgcca 19
<210> 74
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 74
gtcctttagt gtgtggtaag 20
<210> 75
<211> 18
<212> DNA
<213> 人工序列(artificial sequence)
<400> 75
tggcatccaa gatctcca 18
<210> 76
<211> 19
<212> DNA
<213> 人工序列(artificial sequence)
<400> 76
cactgtcctg ctctggttg 19
<210> 77
<211> 24
<212> DNA
<213> 人工序列(artificial sequence)
<400> 77
tagtaacgcg gcttcgaaac agga 24
<210> 78
<211> 26
<212> DNA
<213> 人工序列(artificial sequence)
<400> 78
tttttatcag gacatccttg atgggc 26
<210> 79
<211> 17
<212> DNA
<213> 人工序列(artificial sequence)
<400> 79
gtaaaacgac ggccagt 17
<210> 80
<211> 7303
<212> DNA
<213> 人工序列(artificial sequence)
<400> 80
ttaaaacagc tctggggttg tacccacccc agaggcccac gtggcggcta gtactccggt 60
attgcggtac ccttgtacgc ctgttttata ctcccttccc gtaacttagg aattcaactt 120
agaagttttt cacaaagacc aatagccggt aatcagccag attactgaag gtcaagcact 180
tctgtttccc cggtcaatgt tgatatgctc caacagggca aaaacaactg cgatcgttaa 240
ccgcaaagcg cctacgcaaa gcttagtagc atctttgaaa tcgtttggct ggtcgatccg 300
ccatttcccc tggtagacct ggcagatgag gctagaaata ccccactggc gacagtgttc 360
tagcctgcgt ggctgcctgc acaccctatg ggtgtgaagc caaacaatgg acaaggtgtg 420
aagagccccg tgtgctcgct ttgagtcctc cggcccctga atgtggctaa ccttaaccct 480
gcagctagag cacgtaaccc aatgtgtatc tagtcgtaat gagcaattgc gggatgggac 540
caactacttt gggtgtccgt gtttcacttt ctcctttata tttgcttatg gtgacaatat 600
atacaatata tatattggca ccatgggagc tcaggtttca tcacagaaag tgggcgcaca 660
tgaaaactca aatagagcgt atggtggttc taccattaat tacaccacca ttaattatta 720
tagagattca gctagtaacg cggcttcgaa acaggacttc tctcaagacc cttccaagtt 780
caccgagccc atcaaggatg tcctgataaa aacatcccca atgctaaact cgccaaacat 840
agaggcttgc gggtatagcg atagagtact gcaattaaca ctgggaaact ccactataac 900
cacacaggag gcggctaatt cagtagtcgc ttatgggcgt tggcctgaat atctgaggga 960
cagcgaagcc aatccagtgg accagccgac agaaccagac gtcgctgcat gcaggtttta 1020
tacgctagac accgtgtctt ggacgaaaga gtcgcgaggg tggtggtgga agttgcctga 1080
tgcactgcgg gacatgggac tctttggcca aaatatgtac taccactacc taggtaggtc 1140
cgggtacacc gtgcatgtac agtgtaacgc ctccaaattc caccaggggg cactaggggt 1200
attcgccgta ccagagatgt gtctggccgg ggatagcaac accactacca tgcacaccag 1260
ctatcaaaat gccaatcctg gcgagaaagg aggcactttc acgggtacgt tcactcctga 1320
cgacaaccag acatcacctg cccgtaggtt ctgcccggtg gattacctct ttggaaatgg 1380
cacgttattg gggaatgcct ttgtgttccc gcaccagata ataaacctac ggaccaacaa 1440
ctgtgctaca ctggtactcc cttacgtgaa ctccctctcg atagatagta tggtaaagca 1500
caataattgg ggaattgcaa tattaccatt ggccccatta aattttgcta gtgagtcctc 1560
cccagagatt ccaatcacct tgaccatagc ccctatgtgc tgtgagttca atggattaag 1620
aaacattacc ctgccacgct tacagggcct gccggtcatg aacacccctg gtagcaatca 1680
atatcttact gcagacaact tccagtcacc gtgtgcgctg cctgaatttg atgtgacccc 1740
acctattgac atacccggtg aagttaagaa catgatggaa ttggcagaaa tcgacaccat 1800
gattcccttt gacttaagtg caaaaaaaaa gaacaccatg gaaatgtata gggttcggtt 1860
aagtgacaaa ccacatacag acgatcccat actctgcctg tcactctctc cagcttcaga 1920
tcctaggttg tcacatacta tgcttggaga aatcctaaat tactacacac actgggcagg 1980
atccctgaag ttcacgtttc tgttctgtgg atccatgatg gcaactggca aactgttggt 2040
gtcatacgcg cctcctggag ccgacccacc aaagaagcgt aaggaggcga tgttgggaac 2100
acatgtgatc tgggacatag gactgcagtc ctcatgtact atggtagtgc catggattag 2160
caacaccacg tatcggcaaa ccatagatga tagtttcacc gaaggcggat acatcagcgt 2220
cttctaccaa accagaatag tcgtccctct ttcgacaccc agagagatgg acatccttgg 2280
ttttgtgtca gcgtgtaatg acttcagcgt gcgcttgatg cgagatacca cacatataga 2340
gcaaaaagcg ctagcacagg ggttaggtca gatgcttgaa agcatgattg acaacacagt 2400
ccgtgaaacg gtgggggcgg caacgtctag agacgctctc ccaaacactg aagccagtgg 2460
accagcacac tccaaggaaa ttccggcact caccgcagtg gaaactgggg ccacaaatcc 2520
actagtccct tctgatacag tgcaaaccag acatgttgta caacataggt caaggtcaga 2580
gtctagcata gagtctttct tcgcgcgggg tgcatgcgtg gccattataa ccgtggataa 2640
ctcagcttcc accaagaata aggataagct atttacagtg tggaagatca cttataaaga 2700
tactgtccag ttacggagga aattggagtt cttcacctat tctagatttg atatggaatt 2760
tacctttgtg gttactgcaa atttcactga gactaacaat gggcatgcct taaatcaagt 2820
gtaccaaatt atgtacgtac caccaggcgc tccagtgccc gagaaatggg acgactacac 2880
atggcaaacc tcatcaaatc catcaatctt ttacacctac ggaacagctc cagcccggat 2940
ctcggtaccg tatgttggta tttcgaacgc ctattcacac ttttacgacg gtttttccaa 3000
agtaccactg aaggaccagt cggcagcact aggtgactcc ctctatggtg cagcatctct 3060
aaatgacttc ggtattttgg ctgttagagt agtcaatgat cacaacccga ccaaggtcac 3120
ctccaaaatc agagtgtatc taaaacccaa acacatcaga gtctggtgcc cgcgtccacc 3180
gagggcagtg gcgtactacg gccctggagt ggattacaag gatggtacgc ttacacccct 3240
ctccaccaag gatctgacca catatggatt cggacaccaa aacaaagcgg tgtacactgc 3300
aggttacaaa atttgcaact accatttggc cactcaggaa gatttgcaaa acgcagtgaa 3360
cgtcatgtgg aatagagacc tcttagtcac agaatcaaga gcccagggca ccgattcaat 3420
cgcaaggtgc aattgcaacg caggggtgta ctactgcgag tctagaagga aatactaccc 3480
agtatccttc gttggcccaa cgttccagta catggaggct aataactatt acccagctag 3540
gtaccagtcc catatgctca ttggccatgg attcgcatct ccaggggatt gtggtggcat 3600
actcagatgt caccacgggg tgatagggat cattactgct ggtggagaag ggttggttgc 3660
atttacagac attagagact tgtatgccta cgaagaagaa gccatggaac aaggcatcac 3720
caattacata gagtcacttg gggccgcatt tggaagtgga tttactcagc agattggaga 3780
caaaataaca gagttgacta atatggtgac cagtaccatc actgaaaagc tacttaagaa 3840
cttgatcaag atcatatcct cactagttat tataactagg aattatgaag acaccacaac 3900
agtgctcgct accctggccc ttcttgggtg tgatgcttca ccatggcagt ggcttagaaa 3960
gaaagcatgc gatgttctgg agatacctta tgtcaccaag caaggtgaca gttggttgaa 4020
gaagtttact gaagcatgca acgcagctaa gggactggag tgggtgtcaa acaaaatctc 4080
aaaattcatt gattggctca aggagaaaat tatcccacaa gctagagata agttggaatt 4140
tgtaacaaaa cttagacaac tagaaatgct ggaaaaccaa atctcaacta tacaccaatc 4200
atgccctagt caggaacacc aggaaattct attcaataat gtcagatggt tatccatcca 4260
gtctaagagg tttgcccctc tttacgcagt ggaagccaaa agaatacaga aactagagca 4320
taccattaac aactacatac agttcaagag caaacaccgt attgaaccag tatgtttgct 4380
agtacatggc agccccggaa caggtaaatc tgtagcaacc aacctgattg ctagagccat 4440
agctgaaaga gaaaacacgt ccacgtactc gctacccccg gatccatcac acttcgacgg 4500
atacaaacaa cagggagtgg tgattatgga cgacctgaat caaaacccag atggtgcgga 4560
catgaagctg ttctgtcaga tggtatcaac agtggagttt ataccaccca tggcatccct 4620
ggaggagaaa ggaatcctgt ttacttcaaa ttacgttcta gcatccacga actcaagcag 4680
aatttccccc cccactgtgg cacacagtga tgcattagcc aggcgctttg cgttcgacat 4740
ggacattcag gtcatgaatg agtattctag agatgggaaa ttgaacatgg ccatggctac 4800
tgaaatgtgt aagaactgtc accaaccagc aaactttaag agatgctgtc ctttagtgtg 4860
tggtaaggca attcaattaa tggataaatc ttccagagtt agatacagta ttgaccagat 4920
cactacaatg attatcaatg agagaaacag aagatccaac attggcaatt gtatggaggc 4980
tttgttccaa ggaccactcc agtataaaga cttgaagatt gacatcaaga cgagtccccc 5040
tcctgaatgt atcaatgact tgctccaagc agttgactcc caggaggtga gagattactg 5100
tgagaagaag ggttggatag tcaacatcac cagccaggtt caaacagaaa ggaacatcaa 5160
cagggcaatg acaattctac aagcggtgac aaccttcgcc gcagtggctg gagttgtcta 5220
tgtcatgtat aaactgtttg ctggacacca gggagcatac actggtttac caaacaaaaa 5280
acccaacgtg cccaccatta ggacagcaaa ggtacaaggg ccagggttcg attacgcagt 5340
ggctatggct aaaagaaaca ttgttacagc aactactagc aagggagagt tcactatgtt 5400
aggagtccac gacaacgtgg ctattttacc aacccacgct tcacctggtg aaagcattgt 5460
gatcgatggc aaagaagtgg agatcttgga tgccaaagcg ctcgaagatc aagcaggaac 5520
caatcttgaa atcactataa tcactctaaa gagaaatgaa aagttcagag acattagacc 5580
acatatacct actcaaatca ctgagacaaa tgatggagtc ttgatcgtga acactagcaa 5640
gtaccccaat atgtatgttc ctgtcggtgc tgtgactgaa cagggatatc taaatctcgg 5700
tgggcgccaa actgctcgta ctctaatgta caactttcca accagagcag gacagtgtgg 5760
tggagtcatc acatgtactg ggaaagtcat cgggatgcat gttggtggga acggttcaca 5820
cgggtttgca gcggccctga agcgatcata cttcactcag agtcaaggtg aaatccagtg 5880
gatgagacct tcgaaggaag tgggatatcc aatcataaat gccccgtcca aaaccaagct 5940
tgaacccagt gctttccact atgtgtttga aggggtgaag gaaccagcag tcctcactaa 6000
aaacgatccc aggcttaaga caaactttga ggaggcaatt ttctccaagt acgtgggtaa 6060
caaaattact gaagtggatg agcacatgaa agaggcagta gaccactatg ctggccagct 6120
catgtcacta gacatcaaca cagaacaaat gtgcttggag gatgccatgt atggcactga 6180
tggtctagaa gcacttgatt tgtccaccag tgctggctac ccttatgtag caatgggaaa 6240
gaagaagaga gatatcttga acaaacaaac cagagacact aaggaaatgc aaaaactgct 6300
cgacacatat ggaatcaacc tcccactggt gacttatgta aaggatgaac ttagatccaa 6360
aacaaaggtt gagcagggga aatccagatt aattgaagct tctagtttga atgactcagt 6420
ggcaatgaga atggcttttg ggaacctata tgctgctttt cacaaaaacc caggagtgat 6480
aacaggttca gcagtagggt gcgatccaga tttgttttgg agcaaaattc cggtattgat 6540
ggaagagaag ctgtttgcct ttgactacac agggtatgat gcatctctca gccctgcttg 6600
gttcgaggca ctaaagatgg tgcttgagaa aatcggattc ggagacagag ttgactacat 6660
cgactaccta aaccactcac accacctgta caagaataaa acatactgtg tcaagggcgg 6720
tatgccatct ggttgctcag gcacttcaat ttttaactca atgattaaca acttgattat 6780
caggacactc ttactgaaaa cctacaaggg catagattta gaccacctaa aaatgattgc 6840
ctatggtgat gatgtaattg cttcctaccc ccatgaagtt gacgctagtc tcctagccca 6900
atcaggaaaa gactatggac taactatgac tccagctgac aaatcagcta tatttgaaac 6960
agtcacatgg gagaatgtaa cattcttgaa gagattcttc agggcagacg agaaataccc 7020
atttcttatt catccagtaa tgccaatgaa ggaaattcat gaatcaatta gatggacaaa 7080
agatcctagg aacactcagg atcacgttcg ctctctgtgc ctattagctt ggcacaatgg 7140
cgaagaagaa tataacaaat tcctagctaa aatcaggagt gtgccaattg gaagagcttt 7200
attgctccca gagtactcaa cattgtaccg ccgttggctt gactcatttt agtaacccta 7260
cctcagtcga attggattgg gtcatactgc tgtaggggta aat 7303
Claims (16)
1.一种测定脊髓灰质炎病毒来源治疗剂中脊髓灰质炎病毒序列变体的方法,包括:
从主病毒库或工作细胞库提取RNA,其中主病毒库或工作细胞库包含含有脊髓灰质炎病毒来源治疗剂的宿主细胞;
将提取的RNA与2U/μl的4U脱氧核糖核酸酶在37℃下,于消化宿主细胞基因组DNA和宿主细胞线粒体DNA、但不消化病毒RNA分子的条件下接触20-40分钟,由此产生富集的病毒RNA;
失活脱氧核糖核酸酶;
从富集的病毒RNA产生双链cDNA,使用寡聚(dT)x引物从而产生病毒双链cDNA;
扩增病毒双链cDNA;
定量病毒双链cDNA;
从500pg到1ng病毒双链cDNA产生测序文库,其中通过随机片段化双链cDNA产生cDNA片段,将5'衔接子和3'衔接子连接到cDNA片段以产生连接有衔接子的cDNA片段,并扩增连接有衔接子的cDNA片段从而产生测序文库;
使用结合于表面的或颗粒结合并与5'衔接子和3'衔接子互补的寡核苷酸,克隆扩增所述测序文库以产生克隆扩增的测序文库;
使用平行的单端或双端测序,对克隆扩增的测序文库进行测序,以产生包含多个序列读序的原始序列数据集;
将所述多个序列读序与脊髓灰质炎病毒来源治疗剂的参照脊髓灰质炎序列进行比对,以产生包含多个匹配的序列读序的匹配序列;和
从所述匹配序列确定脊髓灰质炎病毒序列变体。
2.一种测定脊髓灰质炎病毒来源治疗剂中脊髓灰质炎病毒序列变体的方法,其特征在于,包括:
将脊髓灰质炎病毒来源治疗剂引入Vero宿主细胞;
在允许脊髓灰质炎病毒来源治疗剂增殖的条件下,培养Vero宿主细胞;
从Vero宿主细胞中提取脊髓灰质炎RNA分子;
在消化Vero宿主细胞基因组DNA和Vero宿主细胞线粒体DNA、但不消化脊髓灰质炎RNA的条件下,将提取的脊髓灰质炎RNA与2U/μl的4U DNA酶在37℃接触20-40分钟,从而产生丰富的脊髓灰质炎RNA;
失活DNA酶;
使用寡聚(dT)x引物逆转录所提取的病毒性脊髓灰质炎RNA,从而产生脊髓灰质炎双链cDNA;
扩增脊髓灰质炎双链cDNA;
定量脊髓灰质炎双链cDNA;
从500pg至1ng的脊髓灰质炎双链cDNA产生测序文库,其中通过随机片段化脊髓灰质炎双链cDNA以产生脊髓灰质炎cDNA片段,将5'衔接子和3'衔接子连接到脊髓灰质炎cDNA片段从而产生连接有衔接子的脊髓灰质炎cDNA片段,并扩增连接有衔接子的脊髓灰质炎cDNA片段从而产生测序文库;
使用结合于表面的或颗粒结合且与5'衔接子和3'衔接子互补的寡核苷酸,克隆扩增测序文库以产生克隆扩增的测序文库;
使用平行的单端或双端测序,对克隆扩增的测序文库进行测序,以产生包含多个序列读序的原始序列数据集;
将所述多个序列读序与脊髓灰质炎病毒来源治疗剂的参照脊髓灰质炎序列进行比对,以产生包含多个匹配的序列读序的匹配序列;和
从所述匹配序列确定脊髓灰质炎病毒序列变体。
3.如权利要求1或2所述的方法,其中所述方法进一步包括确定所述多个匹配的序列读序的平均读取长度、匹配读序的百分比、覆盖度、SNP或其组合。
4.如权利要求1或2所述的方法,其中,当产生未匹配的序列读序时,将所述未匹配的序列读序添加到未匹配的序列读序池以供识别。
5.如权利要求1或2所述的方法,其中所述方法进一步包括:报告所述脊髓灰质炎病毒来源治疗剂对所述脊髓灰质炎病毒来源治疗剂参考序列的共有同源性、每个位置的每种碱基覆盖度、大于0.1%读序的异源碱基、或其组合。
6.如权利要求1或3所述的方法,其中所述宿主细胞是大肠杆菌细胞或Vero细胞。
7.如权利要求1至6中任一所述的方法,其中使所述提取的核酸分子与DNA酶接触包括:在37℃下将所述提取的核酸分子与所述DNA酶温育30分钟。
8.如权利要求1至7中任一所述的方法,其中使用与所述5'衔接子和所述3'衔接子互补的引物,对所述测序文库进行克隆扩增。
9.如权利要求8所述的方法,其中克隆扩增所述测序文库还包括:在扩增期间向所述连接有衔接子的cDNA片段添加条码序列。
10.如权利要求6或9所述的方法,其中克隆扩增所述测序文库包括:桥连扩增,并且所述表面包含流动槽的表面。
11.如权利要求1至10中任一所述的方法,其中测序是平行的两端测序。
12.如权利要求5所述的方法,其中报告包括每个位置中每种碱基的覆盖度。
13.如权利要求1至12中任一所述的方法,还包括:当所述匹配的序列中每种碱基的覆盖度是4X或更大时,确定所述匹配的序列对于筛选所述脊髓灰质炎病毒来源治疗剂是可接受的。
14.如权利要求1至12中任一所述的方法,还包括:确定所述匹配序列中的每种碱基的覆盖度小于4X,并且执行Sanger测序以在整个的匹配序列上提供4X或更大的覆盖度。
15.如权利要求1所述的方法,其中所述脊髓灰质炎治疗剂是PVS-RIPO。
16.如权利要求15的方法,其中所述病毒序列变体包括在内部核糖体进入位点中的突变。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111246733.XA CN114107559A (zh) | 2015-07-31 | 2016-07-29 | 分析病毒来源治疗剂的方法 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201562199663P | 2015-07-31 | 2015-07-31 | |
US62/199,663 | 2015-07-31 | ||
PCT/US2016/044788 WO2017023782A1 (en) | 2015-07-31 | 2016-07-29 | Methods of analyzing virus-derived therapeutics |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111246733.XA Division CN114107559A (zh) | 2015-07-31 | 2016-07-29 | 分析病毒来源治疗剂的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108026567A CN108026567A (zh) | 2018-05-11 |
CN108026567B true CN108026567B (zh) | 2021-10-22 |
Family
ID=56682276
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111246733.XA Pending CN114107559A (zh) | 2015-07-31 | 2016-07-29 | 分析病毒来源治疗剂的方法 |
CN201680045182.1A Active CN108026567B (zh) | 2015-07-31 | 2016-07-29 | 分析病毒来源治疗剂的方法 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111246733.XA Pending CN114107559A (zh) | 2015-07-31 | 2016-07-29 | 分析病毒来源治疗剂的方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US10662464B2 (zh) |
EP (1) | EP3329013B1 (zh) |
JP (1) | JP6907202B2 (zh) |
CN (2) | CN114107559A (zh) |
WO (1) | WO2017023782A1 (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016201224A1 (en) | 2015-06-10 | 2016-12-15 | The United States Of America, As Represented By The Secretary, Department Of Health And Human Services | Processes for production and purification of nucleic acid-containing compositions |
CN109280700B (zh) * | 2018-09-17 | 2022-04-12 | 上海海洋大学 | 精确测定中华绒螯蟹线粒体全基因组序列的方法 |
CN110923359A (zh) * | 2019-11-29 | 2020-03-27 | 中国食品药品检定研究院 | 检测ⅰ型脊灰减毒活疫苗核酸突变的质谱检测引物组及其方法 |
WO2021243333A2 (en) * | 2020-05-29 | 2021-12-02 | Biohsv Holdings, Inc. | Mass nucleic acid testing |
CN114067907B (zh) * | 2020-07-31 | 2022-07-08 | 普瑞基准生物医药(苏州)有限公司 | 一种准确鉴定rna病毒基因组变异的方法 |
CN114075596A (zh) * | 2020-08-12 | 2022-02-22 | 深圳华大因源医药科技有限公司 | 一种基于高通量测序技术检测目的微生物基因组rna的方法 |
CN112646859B (zh) * | 2020-12-30 | 2022-04-26 | 中国人民解放军疾病预防控制中心 | 一种基于宏基因组学的呼吸道咽拭子样本的建库方法和病原检测方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014081937A2 (en) * | 2012-11-21 | 2014-05-30 | Duke University | Oncolytic poliovirus for human tumors |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5728519A (en) * | 1990-11-06 | 1998-03-17 | The United States Of America As Represented By The Department Of Health And Human Services | Assay for virulent revertants of attenuated live vaccines and kits therefor |
US6696289B1 (en) * | 1997-08-07 | 2004-02-24 | Creagene Inc. | Replication-competent recombinant Sabin type 1 strain of poliovirus |
WO2009091934A1 (en) * | 2008-01-17 | 2009-07-23 | Sequenom, Inc. | Single molecule nucleic acid sequence analysis processes and compositions |
US8066983B2 (en) * | 2008-03-14 | 2011-11-29 | The Research Foundation Of State University Of New York | Attenuated poliovirus |
GB201213770D0 (en) | 2012-08-02 | 2012-09-12 | Ucl Business Plc | Screening methods |
EP3233132A4 (en) * | 2014-12-19 | 2018-06-27 | Modernatx, Inc. | Terminal modifications of polynucleotides |
WO2016201224A1 (en) | 2015-06-10 | 2016-12-15 | The United States Of America, As Represented By The Secretary, Department Of Health And Human Services | Processes for production and purification of nucleic acid-containing compositions |
-
2016
- 2016-07-29 JP JP2018525528A patent/JP6907202B2/ja active Active
- 2016-07-29 US US15/580,299 patent/US10662464B2/en active Active
- 2016-07-29 CN CN202111246733.XA patent/CN114107559A/zh active Pending
- 2016-07-29 CN CN201680045182.1A patent/CN108026567B/zh active Active
- 2016-07-29 WO PCT/US2016/044788 patent/WO2017023782A1/en active Application Filing
- 2016-07-29 EP EP16750580.9A patent/EP3329013B1/en active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014081937A2 (en) * | 2012-11-21 | 2014-05-30 | Duke University | Oncolytic poliovirus for human tumors |
Non-Patent Citations (2)
Title |
---|
A Metagenomic Analysis of Pandemic Influenza A (2009 H1N1) Infection in Patients from North America;Alexander L. Greninger et,al.;《PLoS ONE》;20101031;第5卷(第10期);第2页左栏最后一段-右栏、第3页右栏最后一段以及第13页 sample analysis、第13页左栏 Microarray screening、Deep sequencing library generation、第14页 右栏Detection of single nucleotide polymorphisms (SNPs)、Paired-end de novo sequence assembly * |
Massively parallel sequencing for monitoring genetic consistency and quality control of live viral vaccines;Alexander Neverov et,al.;《PNAS》;20101116;第107卷(第46期);Materials and Methods、第20067页 左栏Virus Preparations and Growth.、第20064页 左栏 第7-11行、图1A、第20065页 左栏 第4-7行、表2、第20064页 右栏 第14-18行到第20065页左栏第16行和第20067页右栏第48-51行 * |
Also Published As
Publication number | Publication date |
---|---|
EP3329013A1 (en) | 2018-06-06 |
WO2017023782A1 (en) | 2017-02-09 |
CN108026567A (zh) | 2018-05-11 |
US20180237835A1 (en) | 2018-08-23 |
EP3329013B1 (en) | 2020-09-02 |
JP2018527948A (ja) | 2018-09-27 |
US10662464B2 (en) | 2020-05-26 |
JP6907202B2 (ja) | 2021-07-21 |
CN114107559A (zh) | 2022-03-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108026567B (zh) | 分析病毒来源治疗剂的方法 | |
US20240139309A1 (en) | Variant strain-based coronavirus vaccines | |
US20220378904A1 (en) | Hmpv mrna vaccine composition | |
US20240100151A1 (en) | Variant strain-based coronavirus vaccines | |
WO2021222304A1 (en) | Sars-cov-2 rna vaccines | |
JP2024513999A (ja) | インフルエンザ-コロナウイルス組み合わせワクチン | |
JP2024514182A (ja) | 呼吸器ウイルス組み合わせワクチン | |
EP3307878B1 (en) | Processes for production and purification of nucleic acid-containing compositions | |
EP4366768A1 (en) | Pan-human coronavirus vaccines | |
WO2022266010A1 (en) | Mrna vaccines encoding flexible coronavirus spike proteins | |
WO2023283642A2 (en) | Pan-human coronavirus concatemeric vaccines | |
WO2023283645A1 (en) | Pan-human coronavirus domain vaccines | |
US11033617B2 (en) | Duck hepatitis A virus type 3 mutant CH-P60-117C and construction thereof | |
EP4153201A2 (en) | Therapeutic interfering particles for corona virus | |
WO2022245888A1 (en) | Seasonal flu rna vaccines and methods of use | |
KR102373570B1 (ko) | 뎅기 바이러스 약독주를 뱅크화한 생바이러스, 및 그것들을 항원으로 하는 뎅기 백신 | |
CN116144608A (zh) | 病毒培养方法 | |
Rosseel | Genome sequencing by random priming methods for viral identification | |
CZ33796U1 (cs) | Primery pro sekvenaci části genomu viru šarky švestky za účelem stanovení kmenu viru a jeho případných mutací | |
Guirao et al. | Phylogeny of canine coronavirus (CCoV) from Brazilian dogs based on membrane protein partial sequences | |
Grywalski | Towards in silico IBV vaccine design: defining the role of polymorphism in viral attenuation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |