CN116323944B - 用于人类基因组重塑的基于噬菌体的人工病毒设计 - Google Patents

用于人类基因组重塑的基于噬菌体的人工病毒设计 Download PDF

Info

Publication number
CN116323944B
CN116323944B CN202180065944.5A CN202180065944A CN116323944B CN 116323944 B CN116323944 B CN 116323944B CN 202180065944 A CN202180065944 A CN 202180065944A CN 116323944 B CN116323944 B CN 116323944B
Authority
CN
China
Prior art keywords
lys
leu
glu
ala
thr
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202180065944.5A
Other languages
English (en)
Other versions
CN116323944A (zh
Inventor
维尼加拉·B·绕
朱金根
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Catholic University of America
Original Assignee
Catholic University of America
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US17/359,711 external-priority patent/US11401530B2/en
Application filed by Catholic University of America filed Critical Catholic University of America
Publication of CN116323944A publication Critical patent/CN116323944A/zh
Application granted granted Critical
Publication of CN116323944B publication Critical patent/CN116323944B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N7/00Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2795/00Bacteriophages
    • C12N2795/00011Details
    • C12N2795/00041Use of virus, viral particle or viral elements as a vector
    • C12N2795/00043Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2795/00Bacteriophages
    • C12N2795/00011Details
    • C12N2795/00051Methods of production or purification of viral material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2795/00Bacteriophages
    • C12N2795/00011Details
    • C12N2795/10011Details dsDNA Bacteriophages
    • C12N2795/10111Myoviridae
    • C12N2795/10121Viruses as such, e.g. new isolates, mutants or their genomic sequences
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2795/00Bacteriophages
    • C12N2795/00011Details
    • C12N2795/10011Details dsDNA Bacteriophages
    • C12N2795/10111Myoviridae
    • C12N2795/10141Use of virus, viral particle or viral elements as a vector
    • C12N2795/10142Use of virus, viral particle or viral elements as a vector virus or viral particle as vehicle, e.g. encapsulating small organic molecule
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2795/00Bacteriophages
    • C12N2795/00011Details
    • C12N2795/10011Details dsDNA Bacteriophages
    • C12N2795/10111Myoviridae
    • C12N2795/10141Use of virus, viral particle or viral elements as a vector
    • C12N2795/10143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Virology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Plant Pathology (AREA)
  • Immunology (AREA)
  • Medicinal Chemistry (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Abstract

描述了一种用生物分子编程的“人工病毒”(AV),其可以进入人类细胞并进行精确的人类基因组修饰。AV包含:至少一种病毒载体,诸如噬菌体T4;至少一种治疗性分子,诸如DNA、RNA、蛋白质,及它们的复合物;和脂质包衣。还描述了使用这种AV进行人类基因组修饰的方法,以及对这种AV进行编程的方法。

Description

用于人类基因组重塑的基于噬菌体的人工病毒设计
政府利益声明
本发明是在美国国立卫生研究院(NIH)授予的资助号AI111538和AI081726以及美国国立科学基金会(NSF)授予的资助号MCB-0923873的政府支持下完成的。政府拥有本发明的某些权利。
对“序列表”的引用
本申请包括以ASCII文本格式电子提交的序列表。该序列表被命名为109007-23787US01_sequence listing.TXT,创建于2021年6月7日,大小为51445字节,并且通过引用其全部内容并入本文。
技术领域
本公开总体上涉及人类基因组重塑组分、组合物、机制及其方法。
背景技术
设计可以进入人类细胞并进行精确的分子修复且用生物分子编程的“人工病毒”(AV),这在医学上有广泛的应用。然而,配制能够有效且安全地将治疗性基因和蛋白递送到靶细胞中以重塑人类基因组的AV颗粒仍然是重大挑战。本申请克服了这里描述的现有技术的不足。
发明内容
根据第一个主要方面,本公开提供了一种重塑(remodeling)人类基因组的人工病毒(AV),包含:至少一种病毒载体;至少一种治疗性分子;和脂质包衣(lipid coating),其中所述治疗性分子中的至少一种具有基因修饰或基因沉默活性。
根据第二个主要方面,本公开提供了一种重塑人类基因组的人工病毒(AV),包含:T4衣壳;Cas9蛋白;至少一种RNA;至少一种DNA;和脂质包衣,其中,所述DNA被包装在所述T4衣壳内,其中,所述RNA选自由mRNA、siRNA和gRNA组成的组,其中,所述脂质包衣包含至少一种阳离子脂质。
根据第三个主要方面,本公开提供了一种基因组修饰方法,包括:用人工病毒(AV)感染动物细胞,其中,所述AV包含病毒载体、至少一种治疗性分子和脂质包衣,其中,所述至少一种治疗性分子具有基因修饰或基因沉默活性。
根据第四个主要方面,本公开提供了一种基于CRISPR的对具有基因组修饰能力的人工病毒(AV)进行编程(programming)的方法,包括:通过使野生型T4噬菌体中缺失ipI和ipII基因来产生“受体”噬菌体;用含有靶蛋白基因的质粒和表达Cas9或Cpf1的间隔子质粒以及CRISPR RNA来产生宿主细菌细胞,所述CRISPR RNA对应于所述受体噬菌体的缺失区域中的原间隔序列(protospacer);用所述“受体”噬菌体感染所述宿主细菌细胞;从所述宿主细菌细胞回收工程化的“受体”噬菌体;从工程化的“受体”噬菌体获得空的工程化的T4衣壳;将至少一种DNA包装在所述工程化的T4衣壳中,其中,靶蛋白的基因在C-末端侧翼接有衣壳靶向序列(CTS)并且在N-末端侧翼接有核定位序列(NLS),以形成CTS-基因-NLS序列。
附图说明
本专利或申请文件包含至少一幅彩色附图。在请求并且支付必要的费用后,专利局将提供本专利或专利申请出版物的彩色附图的副本。
附图并入本文并构成本说明书一部分,示出了本发明的示例性实施方式,并且与上文给出的一般描述和下文给出的详细描述一起用于解释本发明的特征。
图1是根据本发明的一个示例性实施方式的基于噬菌体T4的人工病毒的示意图。
图2是根据本发明的一个示例性实施方式的生成T4-AV的顺序组装线的示意图。
图3是示出了根据本发明一个实施方式的经脂质包覆的T4-AV的图。
图4是示出了根据本发明的一个示例性实施方式,在不同DNA与T4比例下,对于各种T4-AV,量化经包装的GFP和荧光素酶DNA的图。
图5是示出了根据本发明的一个示例性实施方式,在不同的感染复数(MOI)下,通过T4(GFP)-AV将经包装的DNA递送到293细胞中的图。
图6是示出了根据本发明的一个示例性实施方式,T4和脂质复合体积对DNA递送效力(Efficacy)的影响的图。
图7是示出了根据本发明的一个示例性实施方式,T4和脂质复合时间对DNA递送效力的影响的图。
图8是示出了根据本发明的示例性实施方式,用不同阳离子脂质包覆的AV的转导效率的图。
图9是示出了根据本发明的一个示例性实施方式,T4头部颗粒与LPF2K浓度对递送效力和细胞存活力的最佳比例的图。
图10是示出了根据本发明的一个示例性实施方式,T4头部颗粒与LPF2K浓度对递送效力和细胞存活力的最佳比例的图。
图11是示出了根据本发明的一个示例性实施方式,在不同的DNA与T4比例下,相对T4-AV,量化被包装的VRC01质粒的图。
图12是示出了根据本发明的一个示例性实施方式,量化由转导的细胞分泌的VRCO1抗体的量的图。
图13是示出了根据本发明的一个示例性实施方式,在不同的DNA与T4比例下,相对T4-AV,量化被包装的VRC01和CH58质粒的图。
图14是示出了根据本发明的一个示例性实施方式,量化由转导的细胞分泌的VRCO1和CH58抗体的量的图。
图15是示出了根据本发明的一个示例性实施方式,比较T4-AV和AAV的转导效率的图。
图16是示出了根据本发明的一个示例性实施方式,在存在不同化合物下,比较荧光素酶表达的图。
图17是示出了根据本发明的一个示例性实施方式,存在不同化合物时GFP表达的比较的图。
图18是示出了根据本发明的一个示例性实施方式,用TBA处理增强T4-AV递送的图。
图19是示出了根据本发明的一个示例性实施方式,由T4-AV运载的蛋白和DNA货物的位置的示意图。
图20是示出了根据本发明的一个示例性实施方式,β-Gal-Soc在T4衣壳上展示的图。
图21是示出了根据本发明的一个示例性实施方式,Cre-Hoc在T4衣壳上展示的图。
图22是示出了根据本发明的一个示例性实施方式,各种Soc-和Hoc-融合蛋白在T4衣壳上展示的图。
图23是示出了根据本发明的一个示例性实施方式,在不同的DNA与T4比例下,相对T4-AV,量化被包装的mCherry报告质粒的图。
图24是示出了根据本发明的一个示例性实施方式,GFP蛋白的内化和mCherry DNA的表达的图。
图25是示出了根据本发明的一个示例性实施方式,处理后3小时,GFP蛋白的内化的图。
图26是示出了根据本发明的一个示例性实施方式,mCherry DNA的表达的图。
图27是示出了根据本发明的一个示例性实施方式,β-半乳糖苷酶活性和GFP表达的图。
图28是示出了根据本发明的一个示例性实施方式,比较使用各种展示蛋白的T4-AV递送的图。
图29是示出了根据本发明的一个示例性实施方式,在每个衣壳不同TAT拷贝数且在不同MOI下,展示TAT的T4-AV的转导的图。
图30是示出了根据本发明的一个示例性实施方式,Soc-TAT装饰使T4(GFP)-AV进入293细胞的递送效率增加的图。
图31是示出了根据本发明的一个示例性实施方式,用整合素-结合RGD基序展示的T4-AV使转导增强的图。
图32是示出了根据本发明的一个示例性实施方式,NLS-Cas9和NLS-Cas9-Soc的表达和纯化的示意图。
图33是示出了根据本发明的一个示例性实施方式,量化在T4衣壳上展示的Cas9-Soc(SEQ ID NO:16)的图。
图34是示出了根据本发明的一个示例性实施方式,相对T4-AV,量化被包装的gRNA的图。
图35是示出了根据本发明的一个示例性实施方式,增强的GFP报告基因表达的显微图像。
图36是示出了根据本发明的一个示例性实施方式,形成Cas9-gRNA核糖核蛋白(RNP)复合物的图。
图37是示出了根据本发明的一个示例性实施方式,靶DNA的gRNA定向裂解的图。
图38是示出了根据本发明的一个示例性实施方式,内源AAVS1基因座的断裂的图。
图39是示出了根据本发明的一个示例性实施方式,基因组编辑效率的图。
图40是示出了根据本发明的一个示例性实施方式,基因组编辑AV的示意图。
图41是示出了根据本发明的一个示例性实施方式,修饰衣壳的基因组编辑复合物的存在的EM照片。
图42是示出了根据本发明的一个示例性实施方式,gRNA与T4(GFP)-Soc-Cas9衣壳的结合随着gRNA分子与Soc结合位点比例的增加而增加的图。
图43是示出了根据本发明的一个示例性实施方式,通过增加Cas9-Soc分子与Soc结合位点的比例,增加gRNA与T4(GFP)-Soc-Cas9的结合的图。
图44是示出了根据本发明的一个示例性实施方式,gRNA与T4(GFP)-Soc-Cas9的结合对T4上Cas9-Soc展示的影响的图。
图45是示出了根据本发明的一个示例性实施方式,在增加gRNA结合比例的情况下,比较用T4(Luci)-AV或T4(Luci)-Soc-Cas9-gRNA-AV处理的细胞中荧光素酶活性的图。
图46是示出了根据本发明的一个示例性实施方式,用T4(GFP)-Soc-Cas9-AV和T4(GFP)-Soc-Cas9-gRNA-AV处理的细胞的代表性荧光图像的图。
图47是示出了根据本发明的一个示例性实施方式,在AV纳米颗粒与细胞的不同比例下,通过递送的RNP-AV在AAVS1基因座处的基因组编辑的图。
图48是示出了根据本发明的一个示例性实施方式,在不同配置中使用T4-AV的AAVS1插入缺失效率的比较的图。
图49是示出了根据本发明的一个示例性实施方式,由T4(GFP)-Soc-Cas9-HBBgRNA-AV介导的HBB基因破坏的图。
图50是示出了根据本发明的一个示例性实施方式,通过T4-AV在人类基因组的两个靶位点同时进行基因组编辑的图。
图51是示出了根据本发明的一个示例性实施方式,AV介导的基因组编辑和在AAVS1基因座处的同源重组的设计的示意图。
图52是示出了根据本发明的一个示例性实施方式,相对T4-AV,量化被包装的嘌呤霉素质粒DNA的图。
图53是示出了根据本发明的一个示例性实施方式,在用T4(Puro-供体)-Soc-Cas9-gRNA-AV转导后,PCR测定嘌呤霉素抗性单细胞克隆的图。
图54是示出了根据本发明的一个示例性实施方式,PCR扩增子的DNA测序的图,证实了在每个克隆的靶位点存在嘌呤霉素供体插入。
图55是示出了根据本发明的一个示例性实施方式,用于检测靶向插入的PCR扩增引物组的位置的示意图。
图56是示出了根据本发明的一个示例性实施方式,检测扩增序列的图。
图57是示出了根据本发明的一个示例性实施方式,,通过递送Cre-Hoc-T4(LSL-GFP+mCherry)-Soc-Cas9-gRNA-AV进行位点特异性重组的示意图。
图58是示出了根据本发明的一个示例性实施方式,Cre-Hoc表达盒的示意图。
图59是示出了根据本发明的一个示例性实施方式,Cre-Hoc蛋白的尺寸排阻色谱图的图。
图60是示出了根据本发明的一个示例性实施方式,Cre-Hoc的位点特异性重组活性的图。
图61是示出了根据本发明的一个示例性实施方式,Cas9-Soc和Cre-Hoc的共展示的曲线图。
图62是示出了根据本发明的一个示例性实施方式,Cre-Hoc结合对同一衣壳上Cas9-gRNA RNP结合的影响的图。
图63是示出了根据本发明的一个示例性实施方式,相对T4-AV,量化被包装的LSL-GFP质粒DNA的图。
图64是示出了根据本发明的一个示例性实施方式,LSL-GFP和mCherry DNA的共递送和共表达的图。
图65是示出了根据本发明的一个示例性实施方式,在增加Cre-Hoc展示比例的情况下,用Cre-Hoc-T4(LSL-GFP)-Soc-Cas9-gRNA-AV转导293细胞后的代表性GFP表达图像的图。
图66是示出了根据本发明的一个示例性实施方式,将Cre-Hoc-T4(Luci)-Soc-Cas9-gRNA-AV递送到Cre报告细胞中的示意图。
图67是示出了根据本发明的一个示例性实施方式,在Cre报告细胞中AV介导的有效位点特异性重组的图。
图68是示出了根据本发明的一个示例性实施方式,在增加Cre-Hoc展示比例的情况下,用Cre-Hoc-T4(Luci)-RNP-AV处理的细胞的荧光素酶活性和AAVS1 indel频率的图。
图69是示出了根据本发明的一个示例性实施方式,gRNA/siRNA:Cas9-Soc结合的化学计量的图。
图70是示出了根据本发明的一个示例性实施方式,携带siRNA和mRNA有效载荷的T4-AV的示意图。
图71是示出了根据本发明的一个示例性实施方式,在siRNA分子与Soc结合位点的比例增加的情况下,siRNA与T4(gRNA-GFP)-Soc-Cas9衣壳的结合的图。
图72是示出了根据本发明的一个示例性实施方式,siRNA:T4(Luci)-Soc-Cas9比例对AV递送效率的影响的图。
图73是示出了根据本发明的一个示例性实施方式,用GFPsiRNA-AV处理的293细胞中GFP表达沉默的图。
图74是示出了根据本发明的一个示例性实施方式,在转导后48小时和72小时通过GFPsiRNA-AV来量化GFP蛋白水平的图。
图75是示出了根据本发明的一个示例性实施方式,展示的siRNA的量对GFP基因沉默效率的影响的图。
图76是示出了根据本发明的一个示例性实施方式,通过将两个siRNA整合到同一AV中,在两个位点同时基因沉默的图。
图77是示出了根据本发明的一个示例性实施方式,在mRNA分子与Soc结合位点的比例增加的情况下,GFPmRNA在T4(mCherry)-Soc-Cas9衣壳上的负载的图。
图78是示出了根据本发明的一个示例性实施方式,在Cas9-Soc分子与mRNA的比例增加的情况下,mRNA与Cas9-Soc蛋白的结合的图。
图79是示出了根据本发明的一个示例性实施方式,AV包装的mCherry质粒DNA和AV展示的GFP mRNA的基因表达在同一细胞中的共定位的图。
图80是示出了根据本发明的一个示例性实施方式,作为对照的AV(mCherry)的递送和表达的图。
图81是示出了根据本发明的一个示例性实施方式,展示的mRNA的量对T4(Luci)-Soc-Cas9-mRNA-AV的共递送效率的影响的图。
图82是示出了根据本发明的一个示例性实施方式,相对各种T4-AV,量化被包装的gRNA表达质粒的图。
图83是示出了根据本发明的一个示例性实施方式,gRNA置换Cas9-siRNA复合物中结合的siRNA的图。
图84是示出了根据本发明的一个示例性实施方式,在siRNA分子与soc结合位点的比例增加的情况下,量化用T4(AAVS1gRNA-GFP)-Soc-Cas9-siRNA-AV处理的细胞的AAVS1indel频率的图。
图85是示出了根据本发明的一个示例性实施方式,在mRNA分子与衣壳展示的Cas9的比例增加的情况下,通过T4(AAVS1gRNA-mCherry)-Soc-Cas9-GFPmRNA-AV在AAV S1基因座处的基因组编辑的图。
图86是示出了根据本发明的一个示例性实施方式,使用CRISPR工程化的T4-AV的可编程导向运输系统(GIS)的示意图。
图87是示出了根据本发明的一个示例性实施方式,CRISPR介导的CLN基因插入的示意图。
图88是示出了根据本发明的一个示例性实施方式,CRISPR介导的T4基因组编辑的图。
图89是示出了根据本发明的一个示例性实施方式,尺寸排阻色谱图的图。
图90是示出了根据本发明的一个示例性实施方式,头部包装的CLN蛋白的表达的图。
图91是示出了根据本发明的一个示例性实施方式,CLN蛋白和T4(CLN)头部的功能特征的图。
图92是示出了根据本发明的一个示例性实施方式,在AV与细胞的不同比例下,T4(CLN)-GIS-AV增强的laco-荧光素酶DNA递送的图。
图93是示出了根据本发明的一个示例性实施方式,由T4(CLN)-GIS-AV进行的增强的基因组编辑的图。
图94是示出了根据本发明的一个示例性实施方式,GFP包装的AV的生化特征的图。
图95是示出了根据本发明的一个示例性实施方式,Cre包装的AV的生化特征的图。
图96是示出了根据本发明的一个示例性实施方式,形成功能性β-半乳糖苷酶四聚体的图。
图97是示出了根据本发明的一个示例性实施方式,T4(GFP)衣壳的尺寸排阻色谱图的图。
图98是示出了根据本发明的一个示例性实施方式,“绿色荧光噬菌体”的荧光图像的图。
具体实施方式
定义
当术语的定义偏离该术语的常用含义时,除非特别指出,否则申请人意在使用下面提供的定义。
除非另有定义,否则本文使用的所有技术和科学术语具有与所要求保护的主题所属的通常理解相同的含义。如果本文中的术语有多个定义,则以本节中的定义为准。本文提及的所有专利、专利申请、出版物和公开的核苷酸和氨基酸序列(例如,可在GenBank或其他数据库中获得的序列)均通过引用并入本文。当提及URL或其他这样的标识符或地址时,理解的是,这样的标识符可以改变,并且因特网上的具体信息可能不时改变,但是通过搜索因特网可以找到等同的信息。对其的引用证明了此类信息的可用性和公开传播性。
应当理解的是,前面的一般性描述和下面的详细描述仅仅是示例性和解释性的,并不限制所要求保护的任何主题。在本申请中,除非特别说明,否则单数的使用包括复数。必须注意的是,如说明书和所附权利要求中所使用的,单数形式“一个/种(a)”、“一个/种(an)”和“该/所述(the)”包括复数指代物,除非上下文另有明确规定。在本申请中,除非另有说明,否则“或”的使用表示“和/或”。此外,术语“包括/包含(including)”以及其他形式,诸如“包括/包含(include)”、“包括/包含(includes)”和“被包括/包含(included)”的使用,不是限制性的。
为了本公开的目的,术语“包括”、术语“具有”、术语“包含”以及这些词的变体旨在是开放式的,并且意味着除了所列出的要素之外,还可以有另外的要素。
为了本公开的目的,方向性术语,例如“顶”、“底”、“之上”、“之下”、“之上”、“之下”、“左”、“右”、“水平”、“垂直”、“上”、“下”等的使用仅仅是为了方便描述本公开的各种实施方式。本公开的实施方式可以以各种方式定向。例如,所附附图中示出的图、装置等可以翻转、沿任何方向旋转90°、反转等。
为了本公开的目的,如果值是通过使用该值、性质或其他因素进行数学计算或逻辑决策而得到的,则该值或性质是“基于”特定的值、性质、条件的满足或其他因素的。
为了本公开的目的,应当注意的是,为了提供更简洁的描述,本文给出的一些量化表述没有用术语“约”来限定。应理解的是,无论是否明确使用术语“约”,本文给出的每个量都是指实际给定值,并且也是指基于本领域普通技术可以合理推断的该给定值的近似值,包括由于该给定值的实验和/或测量条件而产生的近似值。
为了本公开的目的,术语“细菌病毒”、“噬菌体(bacteriophage)”和“噬菌体(phage)”可互换使用。这些术语是指能感染细菌的病毒或病毒颗粒。
为了本公开的目的,术语“衣壳”和术语“衣壳壳(capsid shell)”是指包含几种蛋白结构亚单位的病毒蛋白壳。衣壳包裹着病毒的核酸核心。
为了本公开的目的,术语“载体”、“载剂”和“纳米颗粒”可互换使用。这些术语是指可用于递送基因或蛋白的病毒或杂交病毒颗粒。
为了本公开的目的,术语“结合(bind)”、术语“结合(binding)”和术语“结合(bound)”是指任何类型的化学或物理结合,包括但不限于共价结合、氢键结合、静电结合、生物束缚、跨膜附着、细胞表面附着和表达。
为了本公开的目的,术语“核酸”是指任何长度的核苷酸的聚合物,包括DNA和RNA。形成核酸分子的核酸碱基可以是碱基A、C、G、T和U,以及它们的衍生物。这些碱基的衍生物是本领域众所周知的。该术语应被理解为包括作为等同物的由核苷酸类似物制成的DNA或RNA的类似物。该术语还应被理解为包括线状和环状DNA。本文所使用的该术语还涵盖cDNA,即是互补或拷贝,由RNA模板产生的DNA,例如通过逆转录酶的作用来产生。
为了本公开的目的,术语“颈部蛋白(neck protein)”和术语“尾部蛋白(tailprotein)”是指参与病毒颗粒,特别是噬菌体的颈部或尾部的任何部分组装的蛋白。有尾的噬菌体(tailed bacteriophage)属于有尾噬菌体目(order Caudovirales),并且包括以下三个科:长尾噬菌体科(Siphoviridae)具有长且挠性的尾部,构成了大多数有尾病毒。肌尾噬菌体科(Myoviridae)具有长且刚性的尾部,其完全以尾部鞘在噬菌体附着于细菌宿主时收缩为特征。最小的有尾病毒科是短尾噬菌体科(podoviruses)(具有短、腿样尾部的噬菌体)。例如,在T4噬菌体中,gp10与gp11缔合以形成基板的尾钉(tail pin)。尾钉组装是尾部组装的第一步。噬菌体T4的尾部由可收缩的鞘组成,该鞘包围刚性的管并终止于噬菌体的长尾丝和短尾丝都附着其上的多蛋白基板。一旦头部被包装有DNA,蛋白gp13、gp14和gp15便组装成封住被包装头部的颈部,其中gp13蛋白在DNA包装后直接与门户蛋白质gp20相互作用,然后gp14和gp15在gp13平台上组装。T4噬菌体中的颈部蛋白和尾部蛋白可以包括但不限于蛋白gp6、gp25、gp53、gp8、gp10、gp11、gp7、gp29、gp27、gp5、gp28、gp12、gp9、gp48、gp54、gp3、gp18、gp19、gp13、gp14、gp15和gp63。
为了本公开的目的,术语“MOI”和术语“感染复数(multiplicity of infection)”是指试剂(例如噬菌体,或更普遍地说,病毒、细菌)与感染靶(例如细胞)的比例。在本公开中,这些术语是指“人工病毒”(AV)颗粒与被感染的人类细胞的比例。
为了本公开的目的,术语“RNP”和术语“核糖核蛋白”是指核糖核酸和RNA结合蛋白的复合物(例如Cas9蛋白和RNA的复合物)。RNA的示例包括gRNA、mRNA和siRNA。
为了本发明的目的,术语“复合体积(complexation volume)”是指在其中进行反应的混合物的总体积。例如,当评估复合体积对DNA递送效力的影响时,复合体积是T4和脂质混合物的总体积,其范围可为10至400μl,如图6所示。
为了本发明的目的,术语“复合时间(complexation time)”是指进行反应的总反应时间。例如,当评估复合时间对DNA递送效力的影响时,复合时间是混合T4和脂质以使T4被脂质包覆的总时间量,其范围可为5至120分钟,如图7所示。
为了本发明的目的,术语“N.S.”和术语“非显著的”和术语“非显著地”是指两组数据之间进行的学生t-检验的p值小于0.05。
为了本公开的目的,术语“敲低(knock down)”和术语“沉默”是指细胞中基因表达的调节,以阻止特定基因的表达。这种调节可以通过基因修饰或转录或翻译过程中的其他处理发生,并经常用于研究。
描述
虽然本发明可以有各种修改和替代形式,但是其具体实施实施已经通过附图中的示例示出并且将在下面详细描述。然而,应当理解的是,这并不旨在将本发明限制于所公开的具体形式,相反,本发明将涵盖落入本发明的精神和范围内的所有修改、等同物和替代物。
病毒是地球上数量最多、分布最广的生物体。它们也是最有效的生物机器38。大小约为100nm、遗传密码只有10000至30000个核苷酸的单一病毒,诸如HIV、流感病毒或冠状病毒可以伤害或杀死由约37万亿个细胞(其中每个细胞大小为~100μm且携带约30亿个核苷酸的遗传密码)组成的人。这是因为病毒进化出了有效的机制来在快速的时间尺度上复制和组装子代,对于细菌病毒来说,时间尺度约为几分钟11,34。每次感染都会产生成百上千的子代病毒,从单次感染开始,迅速积累数十亿到数万亿的新病毒。这可能导致全球大流行,诸如目前由新型冠状病毒SARS-CoV-259引起的大流行。如果通过在测试管中建立用治疗性分子编程的“人工病毒”(AV)来利用一些有效的病毒机制,这些病毒就可以执行有益的任务来恢复人类健康,而不是在宿主中复制。取决于所编程的生物分子,人工病毒可以用功能性基因替换缺陷基因(基因疗法),制造治疗性分子(免疫疗法),杀死癌细胞(癌症疗法)等29,35,62。然而,尽管多年来进行了许多尝试,人工病毒的概念仍然是一种理论上的可能性。
研究人员采取的另一种方法是对天然人类病毒进行工程化以使它们能够将一段治疗性DNA或RNA作为其基因组的一部分来递送。已经广泛使用了两种类型的病毒,即具有~10Kbp大小的单链RNA基因组的慢病毒和具有~5Kbp大小的单链DNA基因组的腺相关病毒(AAV)14,33。虽然这种方法是成功的,但它也有固有的局限性。这些病毒最多能够递送1或2个治疗性基因,并且难以整合额外的治疗性分子,诸如蛋白或蛋白-核酸复合物,其对于复杂的分子操作(诸如基因组编辑)是必需的。由于对人类细胞的广泛传染性、预先存在的免疫、毒性和对宿主基因组的潜在整合,因此安全型问题引起了深切关注30,61
在本公开中,描述了使用噬菌体T4的新型人工病毒平台。T4属于肌尾噬菌体科,感染大肠杆菌(Escherichia coli)细菌,并且不存在上述任何局限性或安全性问题31。T4具有接近100%的感染效率和~20分钟的复制速度,是已知最有效的病毒之一60。图1示出了基于噬菌体T4的人工病毒的组分。图1中A示出了噬菌体T4头部(衣壳)的结构模型,其中五聚gp24*(124)顶点以深红色示出。图1中B示出了放大的衣壳粒(六聚体),显示了主要衣壳蛋白gp23*(104)(深绿色)、Soc三聚体(108)(浅绿色)和Hoc纤维(106)(青色)的布置。图1中C示出了放大的门户顶点,示出了gp20(116)十二聚体(棕色)和五聚DNA包装马达gp17(118)(黄色)。图1中D示出了在准三折叠轴上组装的870个Soc(108)分子,形成围绕T4衣壳的分子笼(110)。图1中E示出了来自壳粒中心的155根Hoc纤维(112)。图1中F示出了T4衣壳的表面图,描绘了负电荷(114)的分布。每个负电荷为红色示出。
如图1所示,它包含由以下组装的大的120×86nm扁长二十面体衣壳(头部)(122):930个分子或155个六聚壳粒(102)的930个拷贝的主要衣壳蛋白gp23*(104)(“*”代表切割的成熟形式),在12个顶点中的11个顶点处的55个拷贝或11个五聚体gp24*(124),以及在独特的第12个顶点处的12个拷贝的门户蛋白gp20(116)5,16,34
如图1中B所示,每个六聚衣壳粒包含一个拷贝的Hoc蛋白(106)、6个拷贝的gp23*(104)和6个拷贝的Soc蛋白(108),它们与相邻的衣壳粒共享。因此,每个T4头部含有155个拷贝的Hoc蛋白(106),930个拷贝的gp23*(104)和870个拷贝的Soc蛋白(108)。
如图1中C所示,附接至第12个顶点的是DNA包装机(126),其包含12个拷贝的门户蛋白gp20(116),5个拷贝的马达蛋白gp17(118)和约170Kb的DNA通过其运输的一个中心通道(120)。门户顶点是具有中心通道的环状结构,通过该/>中心通道,病毒基因组被附着于其的ATP驱动的五聚分子马达运输到衣壳中15,50。分子马达包含5个拷贝的马达蛋白gp17(118)。在对基因组一次满头包装(headful)后,相当于~170Kbp线性dsDNA(120)被包装4,42,马达分离并且“颈部”蛋白组装,随后尾部和尾部纤维组装以产生感染性病毒26,60
T4衣壳的表面排列着两种非必需的衣壳蛋白,Soc(108)(小外衣壳蛋白)(9.1kDa;每个衣壳870个拷贝)和Hoc(106)(高抗原性外衣壳蛋白)(40.4kDa;每个衣壳155个拷贝)16,21。Soc(108)是蝌蚪形分子,并且以三聚体的形式结合在准三折叠轴上。每个Soc(108)亚单元通过夹住两个相邻的衣壳粒充当“分子夹”。如图1中D所示,870个这样的夹在衣壳周围形成分子笼,由于其紧密包装的DNA接近晶体密度,大大增强了受压的衣壳39。因此,衣壳即使在诸如pH 11的苛刻条件下也非常稳定。另一方面,Hoc(106)是-长的尾丝,含有一串四个Ig样结构域,具有结合到每个gp23*壳粒(102)的中心的C-末端结构域。155条对称放置的Hoc尾丝从T4头部发出17。与Soc不同,Hoc只为衣壳提供边缘稳定性。其主要功能可能是允许噬菌体通过其Ig样结构域附着至宿主表面1
噬菌体T4是建立人工病毒的理想平台的原因有很多。事实上,这个理念是在~40年的遗传、生物化学和结构分析中发展而来的。首先,T4噬菌体的架构具有稳定的衣壳、暴露1025个非必需分子的外表面和可容纳高达~170Kbp DNA的内部体积,提供了大量的货物空间来整合治疗性生物5,54。其次,积累了大量关于允许体外操作来建立人工病毒的头部组装和基因组包装的遗传和生物化学机制的知识9,22,41,47。第三,已经确定了几乎所有衣壳和包装马达组分的原子结构,这为工程化T4纳米颗粒提供了大量信息5,15,17,39,49,50。第四,一系列的研究证明Soc和Hoc作为极好的适配子将外源蛋白拴到T4衣壳表面27,47。两者都具有纳摩尔级的亲和力,并对T4衣壳表现出高度的特异性,这些特性对于体外组装至关重要51,65。第五,已经开发了稳固的体外DNA包装系统,在该系统中,可以使用强大的DNA包装马达用外源DNA重新填充稳定的“空”T4衣壳18,63。最后,最近开发了CRISPR工程化策略,其允许将外源DNA片段容易地插入噬菌体基因组,以产生具有独特表型特性的重组噬菌体44,52,53
这些为利用T4噬菌体设计人工病毒平台提供了非凡的基础。本公开中的人工病毒设计采用组装线方法,从空的衣壳开始,外壳仅含有三种最低限度必需的衣壳蛋白gp23*(104)、gp24*(124)和gp20(116),并且没有DNA和所有其它结构组分,包括Soc、Hoc、颈部、尾部和尾丝。使用这种蛋白外壳作为基本的构成模块,通过连续的过程将多层货物分子整合起来。外壳的内外都填充有这些分子,这些分子包括蛋白、DNA、RNA及其复合物。然后,衣壳被脂质分子包裹,以在这些病毒样纳米颗粒周围形成“包膜”。如此组装的人工病毒模拟天然(人类)病毒,具有脂质外衣(lipid coat)、表面分子、衣壳外壳和被包装的“基因组”。如本公开中的示例性实施方式和实施例所证明的,这些人工病毒似乎使用与天然病毒相似的途径进入细胞并运输至细胞内目的地。
作为这一理念的证据,在本公开中证明了一系列人工病毒的组装,这些病毒被指导进行特定的分子操作以重塑人类基因组。这些包括:基因组编辑、基因重组、基因替换、基因表达和基因沉默。例如,在一种配置中,人工病毒由五种不同的组分编程:Cas9基因组编辑核酸酶、Cre重组酶、两个gRNA、供体和报告质粒。这些AV通过胞吞作用进入人类细胞,并在细胞基质中运送有效载荷分子,当到达适当的细胞内位置时,在人类基因组的不同位点进行基因组编辑和位点特异性重组。这种大容量、多合一、多重、可编程和基于噬菌体的人工病毒代表了新范畴的纳米材料,其有可能改变未来的人类疗法和个性化药物48
噬菌体T4人工病毒的组装
在一个实施方式中,如图2所示,通过顺序整合经纯化的生物材料来组装人工病毒,以产生病毒结构模拟物。开始于从分离被去除颈部和尾部的T4噬菌体突变体感染的大肠杆菌(E.coli)的空衣壳外壳(202)63,通过简单地将(单体)马达蛋白gp17(206)加入到反应混合物中来在门户顶点组装五聚包装马达(208)。然后通过将线性化的质粒DNA和ATP加入至组装反应来用外源DNA填充衣壳内部50(图2中的a、b)。T4包装马达(208)捕获DNA(204),并以渐进模式将DNA从一端转运到另一端。这可以重复许多次,使得一系列DNA分子的连续包装,直到头部被装满(满头包装)25,56。因此,多个质粒的多个拷贝被包装在~170Kbp容量的T4头部63。图2中的步骤b之后示出了包装有DNA的T4头部(210)。由于马达不表现序列特异性,包装的“基因组”的组成将与组装反应中呈现的相同。
然后通过将Soc-融合蛋白(212)和/或Hoc-融合蛋白(216)分子加入到相同的反应混合物中,使衣壳的外部排列有这些蛋白(图2中的c,d)。Soc-融合蛋白(212)可以是Soc-蛋白或Soc-核糖核蛋白(RNP)。Hoc-融合蛋白(216)是Hoc-蛋白组合。当分子与结合位点的比例为~20:1时,可以达到完全占据,即每个衣壳高达870个Soc-融合蛋白(212)和155个Hoc-融合蛋白(216)5,51。图2中在步骤c和步骤d之后分别示出了被Soc-融合蛋白(212)和/或Hoc-融合蛋白(216)分子包覆的颗粒(214和218)。然后用阳离子脂质分子(220)包覆颗粒(图2中的e),产生最终的人工病毒颗粒(222)。
由于T4衣壳具有高密度的负电荷,~8700个/衣壳5,45,如图1中F所示,阳离子脂质将通过静电相互作用自发地组装在T4衣壳上。在一个实施方式中,当阳离子脂质加入T4衣壳时,发生广泛的脂质结合。图3包含示出了围绕T4衣壳(302)的脂质(304)的显微照片。如图3所示,负EM照片(306)示出了T4衣壳(302)周围的扩散染色(304),其为脂质。当用荧光团标记时,这些“被包封”的颗粒(黄色,在结合Alexa Fluor 594荧光团和NBD荧光团之后)(312)示出了T4衣壳标记的Alexa Fluor 594荧光团(红色)(308)和脂质标记的NBD荧光团(绿色)(310)的共定位。如此组装的T4-AV纳米颗粒具有天然包封病毒的基本架构,具有脂质外衣、表面暴露分子、衣壳外壳和被包装的“基因组”。
T4人工病毒将遗传有效载荷有效递送至人类细胞
T4-AV凭借其带正电荷的脂质外衣,将有效地结合到人类细胞的带负电荷的亲脂性表面,并能够有效进入57。一些阳离子脂质和细胞渗透肽已被充分证明具有这种性质19,66。事实上,本公开中的一系列实施方式已经证明了脂质包覆的T4-AV将遗传有效载荷有效递送至人类细胞中。
在一个实施方式中,当两种不同的质粒(分别为GFP报告质粒(5.4Kbp)和荧光素酶质粒(Luci,6.3Kbp))以平均每个衣壳具有~5个分子共包装时,这些AV以接近100%的效率将两种报告质粒转导到人胚肾HEK293T(293)细胞中。
图4示出了本公开中描述的相对于T4-AV,被包装的GFP和荧光素酶DNA的定量。如图4所示,在DNA与衣壳的比例增加的情况下,线性化的DNA与T4一起孵育,如顶侧所示,其中红色箭头表示根据琼脂糖凝胶电泳所分析的被包装的GFP(408)和荧光素酶DNA条带(410)的位置。图4的顶侧(402)示出了被包装的GFP DNA带的琼脂糖凝胶电泳,图4的中间(404)示出了被包装的荧光素酶DNA带的琼脂糖凝胶电泳,图4的底侧(406)示出了被包装的GFP和荧光素酶DNA带的琼脂糖凝胶电泳。在15-20:1的比例下达到最大包装容量。
图5示出了T4(GFP)-AV在103、104和105的MOI下将被包装的DNA有效递送至293细胞。递送的T4(GFP)-AV由GFP表达来确定,如图5的左列(502)所示。细胞核用Hoechst染色并可视化,如图5的中间列(504)所示。图5的右列(506)示出了递送的T4(GFP)-AV与细胞核的共定位,表明了T4(GFP)-AV的有效递送。此外,图5的顶行(508)示出了在MOI为103时,T4(GFP)-AV的递送。图5的中间行(510)示出了在MOI为104时,T4(GFP)-AV的递送。图5的底行(512)示出了在MOI为105时,T4(GFP)-AV的递送。
图6和图7示出了由荧光素酶活性确定的T4和脂质复合体积和时间对DNA递送效力的影响。荧光素酶活性通过相对发光单位来测量。如图6所示,相对发光单位受复合体积的影响,并且在复合体积为100μl时最大化。如图7所示,相对发光单位还受复合时间的影响,在复合时间为10min时最大化。图8示出了用不同阳离子脂质包覆的AV的转导效率,其中阳离子脂质包括LPF2K-AV(808)、LPFRNAiMAX-AV(810)、LPF3K-AV(812)、LPFLTX-AV(814)、LPFStem-AV(816)、EXPI-AV(818)和FECT-AV(820),而细胞对照(802)、“裸”T4(Luci)衣壳(804)和不含脂质的阳离子T4(Luci)衣壳(T4(Luci)-TAT)(806)用作比较。
在最佳条件下(复合体积为100μl,复合时间为10min),具有阳离子脂质外衣的衣壳(808至820)的荧光素酶活性比没有阳离子脂质外衣的“裸”衣壳(804)高~105倍,比有阳离子但没有脂质的衣壳(806)高~102倍。后者衣壳(806)通过展示阳离子细胞穿透肽HIV-TAT(NGYGRKKRRQRRRG)来制备55。如图8所示,尽管LPF2K和LPFRNAiMAX给出了最好的转导效率,但是没有观察到各种阳离子脂质间的主要差异。相对低量的脂质足以包覆衣壳,并且没有观察到显著的细胞毒性。图9示出了T4头部颗粒与LPF2K浓度对递送效力的最佳比例,如发光活性和细胞存活力所指示的。在转导后48小时进行发光活性(直方图)和细胞存活力测定(蓝线)。培养物中活细胞数量的量化是基于确定存在的ATP,这指示代谢活性细胞的存在,如通过发光细胞活力测定所确定的。与未处理的对照相比,计算存活百分比。如图9所示,递送效力随着T4头部颗粒与LPF2K浓度的比例的增加而增加,而在所测试的所有T4头部颗粒与LPF2K浓度的比例下,细胞存活力保持在约100%。图10示出了与2×1010T4(Luci)复合的LPF2K量的优化(直方图)和相对细胞存活力(蓝线)。如图10所示,当LPF2K量不大于2.5μl,复合随着LPF2K量的增加而增加,同时细胞存活力保持在约100%,而当LPF2K量大于2.5μl时,复合随着LPF2K量的增加而降低。
在一个实施方式中,组装了包装有两种治疗性相关表达质粒的AV,两种治疗性相关表达质粒为VRC01抗体(一种有效的针对HIV-1的广泛中和抗体)64的重链(H)和轻链(L)质粒。因此,这些AV可以共递送一个以上的质粒。图11示出了通过琼脂糖凝胶电泳分析,在不同的DNA与T4比例下,相对于T4-AV,被包装的VRC01质粒的定量。在增加DNA与衣壳的比例的情况下,将线性化的DNA与T4一起孵育,如顶侧所示。如图11所示,被包装和分析的DNA是仅VRC01重链、仅VRC01轻链、作为一个分子的VRC01重链和轻链以及作为独立分子但包装在一个T4-Av颗粒中的VRC01重链和轻链。在15-20:1的比例下达到最大包装容量。因此,每个衣壳平均包装10至12个分子的H和L质粒。图12示出了转导细胞分泌的VRCO1抗体量的量化。进行HIV gp120包膜蛋白特异性ELISA来量化T4-AV转导后48小时由293细胞分泌的VRCO1抗体的量。插图(1202)示出了VRCO1重链H(蓝色箭头)、轻链L(红色箭头)、H+L链和H-L单链(绿色箭头)的包装。如图12所示,这些VRC01-AV有效地共转导和共表达H和L链,这从以高水平(~4.5毫克/升)分泌功能性免疫球蛋白(Ig)分子可以明显看出。这些水平比当H和L链由缺乏脂质外衣的仅阳离子(TAT-展示的)AV递送时高约20倍。在图12中,由缺乏脂质外衣的病毒颗粒感染的转导细胞分泌的VRCO1抗体的量在标记为“细胞对照”、“T4(HL)-HocTSocT”和“T4(H+L)-HocTSocT”的列中示出,而由具有脂质外衣的AV转导的细胞分泌的量在标记为“T4(HL)-AV”、“T4(HL)-SocT-AV”、“T4(H+L)-AV”和“T4(H+L)-SocT-AV”的列中示出。缺乏阳离子或亲脂性特征的裸颗粒产生非常低水平的抗体。
在另一实施方式中,将含有属于两种不同HIV-1抗体VRC01和CH58的两条H链和两条L链的四个质粒包装到同一衣壳中。图13示出了通过琼脂糖凝胶电泳分析,在不同的DNA与T4比例下,相对于T4-AV,被包装的VRC01和CH58质粒的定量。在增加DNA与T4的比例的情况下,将线性化的DNA与T4一起孵育,如顶侧所示。根据图13,平均~11个分子,四种不同质粒的混合物被包装在同一衣壳中。图14示出了由转导细胞分泌的VRCO1和CH58抗体的量的定量。确定AV(VRCO1+CH58)转导后由293细胞分泌的VRCO1和CH58抗体产生的ELISA滴度。根据图14,当共转导至293细胞时,这些AV分泌VRC01(~3毫克/升)和CH58(~2毫克/升)抗体。
上述数据组表明,阳离子脂质包覆的T4-AV在人类细胞中有效地共递送和共表达多个重组质粒,并组装功能性Ig复合物。考虑到它是基于噬菌体的平台,AV递送的效率惊人地高。图15示出了在每细胞103、104和105个纳米颗粒的比例下,通过荧光素酶活性确定的T4-AV和AAV的转导效率的面对面的直接比较(head-to-head comparison)。根据图15,与AAV(用于基因疗法的最有效和广泛使用的病毒载体之一)33相比,T4-AV产生高~10至40倍的荧光素酶报告基因的表达。这可能是因为T4-AV可以在单个转导事件中递送遗传有效载荷的多个拷贝,而AAV和其他载体(诸如慢病毒)被限制为一次仅递送一个拷贝。
然而,T4-AV进入、脱壳和胞内运输中涉及的机制还不完全清楚。为了理解T4-AV使用的进入和胞内运输途径,通过用各种抑制剂处理来分析T4(Luci)-AV的细胞摄取。在一个实施方式中,在暴露于T4(Luci)-AV之前,用各种抑制剂预处理细胞30分钟。图16示出了在不同化合物的存在下,荧光素酶表达的比较。化合物,诸如蔗糖和氯丙嗪、网格蛋白介导的内吞作用抑制剂、甲基-β-环糊精(M-β-CD)、降胆固醇剂和dynasore(一种动力蛋白介导的内吞作用抑制剂)可导致AV递送的极大减少。此外,还比较了选择性抑制剂存在时的GFP表达,如图17所示。GFP表达反映了递送效力。根据图17,存在细胞松弛素D时的GFP表达水平与加入药物/抑制剂时大致相同,而氯丙嗪、M-β-CD、蔗糖和dynasore的存在降低了GFP表达水平,这与图16所示的荧光素酶表达数据一致。这一证据表明,T4-AV通过动力蛋白-和网格蛋白-依赖性内吞作用被内化,其中血浆脂质筏(lipid raft)也可能发挥重要作用12。脂质外衣显然促进了T4-AV从晚期胞内体逃逸到细胞质基质中,在细胞质基质中发生脱壳和释放货物。氯喹,一种已知能增强阳离子T4-TAT的胞内体逃逸的化合物65,不能进一步增强阳离子脂质包覆的T4-AV已经非常有效的递送。此外,Tubastatin A(TBA)是一种微管结合剂,使微管稳定并促进DNA从细胞质基质运输至细胞核3,可显著增强AV包装的DNA分子的报告信号。图18示出了与未添加TBA时相比,当添加的TBA的量为4μM(1806)、8μM(1804)和16μM(1808)时,AV包装的DNA分子的报告信号的增强(1802)。
T4人工病毒对基因和蛋白的共递送
在一个实施方式中,T4-AV可以将蛋白和基因一起共递送。通过展示与Soc或Hoc融合的蛋白来组装一系列AV。图19示出了T4-AV携带的Soc-融合蛋白(1902)和Hoc-融合蛋白(1904)和DNA(1906)货物的定位。整合了一系列具有不同尺寸、电荷、寡聚状态和功能的蛋白,其总结在下表中。
在一个实施方式中,通过凝胶电泳来分析T4衣壳上Soc-融合蛋白和Hoc-融合蛋白的展示。
图20和图21示出了不同比例下的结合模式,表明在~15-20:1的比例下,达到了饱和,这与先前报道的使用许多其他蛋白的数据一致(未示出)。图20示出了β-Gal-Soc(2002)和主要衣壳蛋白gp23*(2004)的位置,该主要衣壳蛋白gp23*被用作内部对照来确定每个衣壳颗粒所展示的β-Gal-Soc的拷贝数。图21示出了Cre-Hoc(2102)和主要衣壳蛋白gp23*(2104)的位置,该主要衣壳蛋白gp23*被用作内部对照来确定每个衣壳颗粒所展示的Cre-Hoc的拷贝数。
Soc-TAT、GFP-Soc、Cre-Soc(SEQ ID NO:22)、β-Gal-Soc、Cpf1-Soc、Cas9-Soc(SEQID NO:16)、RGD-Hoc和Cre-Hoc被过表达、被纯化,并在蛋白分子与Soc-或Hoc-结合位点增加的比例下与经纯化的T4头部一起孵育。图22示出了各种展示的蛋白的位置,这些展示的蛋白包括Soc-TAT(2210)、GFP-Soc(2208)、Cre-Soc(2206)、β-Gal-Soc(2204)、Cpf1-Soc(2212)、Cas9-Soc(2214)、RGD-Hoc(2218)和Cre-Hoc(2216)以及主要衣壳蛋白gp23*(2202),其中该主要衣壳蛋白gp23*被用作内部对照来确定每个衣壳颗粒所展示的蛋白的拷贝数。
在一个实施方式中,本公开中的所有AV有效地共递送展示的蛋白以及处于功能状态的被包装质粒。例如,当暴露于293细胞时,GFP展示的AV显示强烈的绿色荧光,最初在细胞表面(~3小时),然后遍及整个细胞(~20小时)。当相同的AV还与mCherry报告质粒包装在一起时,由于所递送的mCherry基因的表达,细胞另外在6小时时开始显示红色荧光,并持续增强直至48小时。图23示出了相对于T4-AV,被包装的mCherry报告质粒(2302)的量化;以及不同DNA与T4比例下,质粒pAAV-mCherry(2304)的被包装骨架的量化。在增加的DNA与衣壳的比例下,线性化的DNA与T4一起孵育,如顶侧所示。在15-20:1的比例下达到最大包装容量。图24示出了通过T4(mCherry)-Soc-GFP-AV递送后细胞中内在化的GFP蛋白(2402)的荧光和mCherryDNA的表达(2406)。图24中还示出了GFP和mCherry的合并视图(2404)以及明视场(BF)视图(2404)。图25示出了用Soc-GFP(2502)、Soc-GFP+LPF2K(简单混合物)(2504)、T4-Soc-GFP(2506)或T4-Soc-GFP-AV(2508)处理后3小时,细胞的代表性荧光图像。右侧(2510)示出了GFP信号和明场(BF)的合并图像,表明在AV转导后3小时,所展示的GFP蛋白有效地附着于细胞表面。图26示出了使用T4(mCherry)-AV的mCherry DNA递送,其中仅观察到mCherry表达。在图26中,示出了GFP表达(对照)(2602)、表达(2604)、GFP和mCherry的合并视图(2606)以及BF视图(2608)。
在一个实施方式中,用展示~516kDa四聚β-半乳糖苷酶(β-Gal)并包装有Luci或GFP报告质粒的AV转导的细胞以剂量依赖性方式表现出β-半乳糖苷酶活性和荧光素酶/GFP活性,如图27和图28所示。图27示出了在所展示的Soc-β-半乳糖苷酶的拷贝数增加的情况下,在通过T4(GFP)-Soc-β-Gal-AV递送后检测到的β-半乳糖苷酶活性和GFP表达。如图27所示,β-半乳糖苷酶酶活性和GFP表达随着β-半乳糖苷酶蛋白或GFP质粒的拷贝数与T4衣壳的比例的增加而增加。
有点出乎意料的是,如图28所示,当与不具有展示蛋白的对照AV(2804)相比时,具有展示蛋白(包括Soc-TAT(2806)、GFP-Soc(2808)、Cre-Soc(2810)、β-Gal-Soc(2812)、Cpf1-Soc(2814)(SEQ ID NO:17)、Cas9-Soc(2816)(SEQ ID NO:16)、RGD-Hoc(2818)(SEQID NO:19)和Cre-Hoc(2820)(SEQ ID NO:18))的AV总体上表现出增强的转导效率,如通过荧光素酶活性所测量的,这可能是因为展示蛋白分子贡献了使更好脂质包衣和/或细胞结合的额外电荷,其中展示蛋白。与这一概念相一致,带更多正电荷的蛋白诸如TAT(2806)、Cas9(2816)和Cpf1(2814)表现出更大的增强,其中TAT-AV具有高拷贝数(520拷贝)并且高正电荷的TAT的表现出最高的增强(~3.5倍)。图29示出了代表性的荧光图像,描绘了在每个衣壳不同的TAT拷贝数和每个细胞不同的T4-AV纳米颗粒比例下,TAT-展示的T4-AV的增强转导。图30示出了Soc-TAT修饰增加了T4(GFP)-AV进入293细胞的递送效率。在增加Soc-TAT分子与Soc结合位点的比例(0:1至20:1)的情况下,Soc-TAT分子在T4(GFP)衣壳上的展示。如图30所示,递送效率随着Soc-TAT分子与Soc结合位点比例的增加而增加。将所得的T4(GFP)-Soc-TAT-AV以每个细胞105个T4-AV的比例转导到细胞中。在转导后20小时观察到GFP荧光。
与对照AV(T4(Luci)-AV)(2804和3102)相比,9-aa二硫化物约束的RGD肽(CDCRGDCFC)(2818和3104)为一种细胞表面结合配体,当融合到Hoc尾丝的尖端时,表现出甚至更大的增强。图28顶部的蓝线(2802)表明用具有各种展示蛋白的T4-AV颗粒处理的细胞的细胞存活力保持在约100%。
这种三肽基序(RGD肽)已被充分证明与人类细胞上丰富存在的整合素分子结合8。此外,Hoc-融合的RGD(RGD-Hoc-T4(Luci)-AV)(3104)的荧光素酶活性比Soc-融合的RGD(RGD-Soc-T4(Luci)-AV)(3106)高~5倍,即使Soc-RGD的拷贝数比RGD-Hoc的高8.3倍,如图31所示。看来,与结合到衣壳壁的Soc-融合的RGD相比,连接到~17nm长的柔性Hoc尾丝的尖端(N-末端)的靶向配体赋予了更大的范围来捕获整合素受体分子。
基因组编辑的人工病毒
基因和蛋白的组合对AV“编程”的能力可用于在人类细胞中执行复杂的分子操作,这将开启大量的治疗应用7,62
在一个实施方式中,通过将所有的编辑分子以不同的构型整合到相同的AV中来组装各种基因组编辑AV,总结在下表中。
在优选实施方式中,组装了包装有质粒的AV,所述质粒携带分别在CMV和U6启动子控制下可表达的Cas9和gRNA基因。Cas9序列是密码子优化的,并在其N-末端与核定位序列(NLS)PKKKRKV融合(NLS-Cas9)。这允许将细胞质基质递送的Cas9运输到细胞核中,以进行基因组编辑。gRNA靶向人类基因组19号染色体上的PPP1R12C基因座,其也被称为AAVS1安全港基因座10。平均每个衣壳包装有7分子的含有两种表达盒的8.3Kbp质粒。
在另一实施方式中,通过整合经纯化的Cas9作为融合到Soc的展示蛋白(NLS-Cas9-Soc)来组装AV,通过提供gRNA作为被包装的质粒。使用尺寸排阻色谱法获得经纯化的NLS-Cas9(图32中A)和NLS-Cas9-Soc(图32中B),并通过SDS-PAGE证实NLS-Cas9和NLS-Cas9-Soc的纯化,如图32所示。
图32示出了Cas9和Cas9-Soc相应的表达盒示意图和尺寸排阻色谱图。Soc融合到Cas9的C端。Cas9和Cas9-Soc都含有N-末端SV40核定位信号(NLS)和C-末端His标签。使用T7启动子在大肠杆菌中过表达蛋白,并通过HisTrap亲和色谱法和尺寸排阻色谱法进行纯化。经纯化的Cas9和Cas9-Soc以单体形式存在,这可通过使用各自的洗脱体积确定的分子大小来明显看出。如插图所示,通过SDS-PAGE来分析经纯化的蛋白质。
当装配混合物以10个分子对一个Soc结合位点的比例含有Cas9(3302)时,在表面上可展示多达约550个Cas9分子,如图33所示,并且~10个拷贝的gRNA质粒(3402)被包装在衣壳内,如图34所示。图33还示出了在增加Cas9-Soc分子与Soc结合位点比例的情况下,Cas9-Soc在T4衣壳上的展示。示出了SDS-凝胶上Cas9-Soc(3302)和gp23*(3304)条带的位置。
在另一实施方式中,将第二GFP报告质粒包装到这两个AV中,以证实AV转导接近100%的效率,这是本公开中所有T4-AV研究的基准,如图35所示。如图35所示,荧光显微图像表明随着展示的Cas9拷贝数的增加,GFP报告基因表达增强。
此外,进行了一系列生物化学测定以确保Cas9和gRNA表现出全部功能,即Cas9-gRNA核糖核蛋白(RNP)复合物的形成和靶DNA的gRNA定向裂解,如图36和图37所示。Cas9和Cas9-Soc与AAVS1 gRNA1或gRNA2的结合测试,通过凝胶阻滞测定来确定。如图37所示,Cas9(3702和3706)和Cas9-Soc(3704和3708)在特异性gRNA靶向位点处表现出相当水平的DNA裂解活性。当转导至293细胞时,这些AV通过在靶向AAVS1基因座引入双链断裂,然后通过非同源末端连接(NHEJ)修复在靶位点创建短的插入和缺失(indel)来进行基因组编辑,如T7核酸内切酶I(T7EI)测定所确定的,如图38所示,并通过DNA测序来证实(未示出)。图38示出了在AV介导的Cas9蛋白和表达gRNA的质粒DNA的递送后内源AAVS1基因座的破坏。在转导三天后,通过T7E1测定来检测插入缺失突变。图39示出了对于Cas9的各种拷贝数,展示的T4-AV的AAVS1插入缺失效率,其中各种拷贝数包括50个拷贝(3902)、180个拷贝(3904)、280个拷贝(3906)和460个拷贝(3908)。当每个T4衣壳的Cas9拷贝数约为280(3906)时,基因组编辑的最佳效率为~12%至15%。
在另一实施方式中,通过将融合到Soc(4006)的Cas9(4002)和gRNA(4004)整合为预先形成的核糖核蛋白(RNP)复合物来组装AV,如图40所示。阴性EM表明装饰衣壳的基因组编辑复合物(4102)的存在,如图41所示。约280个拷贝的~210kDa的Cas9-gRNA RNP复合物通过Soc展示在衣壳上。如图42所示,gRNA(4204)与T4(GFP)-Soc-Cas9衣壳的结合随着gRNA分子与Soc结合位点比例的增加而增加,而GFP(4202)的量在所有比例下保持恒定。如图43所示,gRNA(4304)与T4(GFP)-Soc-Cas9的结合通过增加Cas9-Soc分子与Soc结合位点的比例而增加,而GFP(4302)的量在所有比例下保持恒定。图44示出了gRNA与T4(GFP)-Soc-Cas9的结合不影响Cas9-Soc在T4上的展示,因为相对Cas9-Soc展示在所有gRNA与T4(GFP)-Soc-Cas9比例下未显著(N.S.)变化。
在另一个实施方式中,额外的~7分子的Cas9-gRNA表达质粒被包装至同一AV。
在上述实施方式中,还包装GFP或Luci报告质粒以证实接近100%的转导效率。图45示出了在增加gRNA结合比(0:1至4:1)的情况下,用T4(Luci)-AV或T4(Luci)-Soc-Cas9-gRNA-AV处理的细胞中荧光素酶活性的比较。将T4(Luci)-Soc-Cas9-gRNA-AV递送的荧光素酶活性标准化为T4(Luci)-AV,并表示为倍数变化。如图45所示,与T4(Luci)-AV相比,T4(Luci)-Soc-Cas9-gRNA-AV提高了转导效率。图46示出了用T4(GFP)-Soc-Cas9-AV和T4(GFP)-Soc-Cas9-gRNA-AV处理的细胞的代表性荧光图像,它们都表现出了高转导效率。
在一个实施方式中,如图47和图48所示,具有soc-融合蛋白的AV在AAVS1基因座处给出了最好的编辑效率,~30-35%的破坏和插入缺失,是通过脂质体(lipofectamine)转染获得效率的大约两倍。图47示出了通过AV纳米颗粒与细胞的不同比例递送的RNP-AV在AAVS1基因座处的基因组编辑,如使用T7E1测定所确定的。图48示出了使用不同构型的T4-AV的AAVS1插入缺失效率的比较,这些不同构型包括T4-AV(4802)、T4(Cas9-gRNA)-AV(4804)、T4(gRNA-GFP)-Cas9-AV(4806)、T4(GFP)-Soc-RNP-AV(4808)、T4(Cas9-gRNA)-Soc-RNP-AV(4810)和Cas9-gRNA质粒+Lip(4812)。空T4-AV和Cas9-gRNA质粒的脂质体转染(Lip)分别用作阴性对照和阳性对照。
在一个实施方式中,通过将AV靶向人类基因组第11号染色体上的血红蛋白β基因(HBB),在治疗上重要的位点进行基因组编辑。用Cas9-HBB gRNA RNP复合物组装的AV在该位点进行~20-25%的编辑,如图49所示。在图49中,T7E1分析表明由T4(GFP)-Soc-Cas9-HBBgRNA-AV介导的HBB基因破坏(4902)。
在另一实施方式中,如图50所示,通过在同一AV上展示两个gRNA(一个靶向HBB,且另一个靶向AAVS1),实现在人类基因组的一个以上位点的同时编辑。这些AV还携带~7分子的Cas9和HBB/AAVS1gRNA表达质粒。如图50所示,这些多重AV成功地进行了各自靶位点的基因组编辑,在HBB位点,为~20%(5002),在AAVS1位点,为~30%(5004)。
基因重组人工病毒
在一个实施方式中,T4-AV可在同一细胞中进行基因组编辑以及同源或位点特异性的基因重组。以前,据报道,Cas9产生的DNA断裂促进了裂解位点附近的同源重组6,28。在优选的实施方式中,通过在衣壳上展示AAVS1-靶向的Cas9-gRNA RNP复合物(5102)和包装在内部的含有无启动子嘌呤霉素抗性基因(Puro)的供体质粒(5104)来组装AV,如图51所示。通过递送Cas9-gRNA RNP复合物(展示的)(5108)和供体嘌呤霉素质粒DNA(包装的)(5110)来设计在AAVS1基因座(5106)处AV介导的基因组编辑和同源重组。供体质粒在Cas9裂解位点的侧翼还具有有~800bp的同源臂。图52示出了T4-AV的被包装的嘌呤霉素质粒DNA(5202)的量化。如果在Cas9裂解后发生同源重组,将Puro基因置于上游AAV S1启动子的控制下,将出现嘌呤霉素抗性,如图51所示。事实上,嘌呤霉素抗性克隆在这些AV转导后出现,而缺乏RNP复合物的对照AV没有表现出嘌呤霉素抗性。PCR和DNA测序表明,15个表现出嘌呤霉素抗性的分离的单细胞克隆中有15个包含恰好在Cas9裂解位点的Puro基因(5302)插入,如图53和图54所示(图S5A和S5B)。在PCR测定中,对应于侧翼AAVS1基因的引物用于PCR。三个代表性克隆示出在图53中,都描述了在靶位点的同型重组。图55示出了用于检测靶向插入的PCR扩增引物组(P1和P2,P3和P4)的定位。引物组的序列是:
P1:CTGCCGTCTCTCTCCTGAGT(SEQ ID NO:12)
P2:GTGGGCTTGTACTCGGTCAT(SEQ ID NO:13)
P3:AAAACTGACGCACGGAGGAA(SEQ ID NO:14)
P4:GTGGATTCGGGTCACCTCTC(SEQ ID NO:15)
在图55中,SA是剪接受体位点的缩写;T2A是Thosea asigna病毒衣壳蛋白的2A裂解肽的缩写。使用图55所示的引物示意图,对从T4(Puro-供体)-Soc-Cas9-gRNA-AV处理的细胞的单细胞克隆中分离的DNA进行AAVS1基因的PCR测定。使用每个引物组对10个代表性单细胞嘌呤霉素抗性克隆(I1至I10)进行分析。图56示出了PCR测定的结果,证实了扩增序列的存在,从而证实了Puro基因的存在。
在一个实施方式中,组装了用更复杂组的有效载荷分子编程的AV。衣壳以位点特异性重组酶Cre(在N-末端具有NLS)作为Hoc融合蛋白展示,并且含有GFP报告基因上游的CMV启动子-LoxP-polyASTOP-LoxP盒的质粒(LSL-GFP)被包装在衣壳内,如图57所示。方框中显示的T7E1测定(5702)表明Cas9-gRNARNP复合物在独立的靶位点进行了有效和同时的基因组编辑。34bp LoxP序列为Cre提供了重组位点。LoxP位点之间发生的成功的位点特异性重组剪接出聚A转录终止序列,并将GFP报告基因置于上游CMV启动子的控制之下,如图57所示。图58是Cre-Hoc表达盒的示意图。Hoc融合至带有hexa-His标签的Cre的C-末端,并在T7启动子的控制下在大肠杆菌中过表达。图59示出了Cre-Hoc蛋白的尺寸排阻色谱图。红色箭头表示洗脱的Cre-Hoc四聚体和单体。内部的阴影框示出了Cre-Hoc四聚体和单体的SDS-PAGE分析。四聚体和单体对噬菌体展示和位点特异性重组都有活性。Cre-Hoc重组酶催化含有两个loxP位点的LSL-GFP DNA底物的位点特异性重组。图60中的条带图案与已报道的一致30
在另一实施方式中,这些AV还携带在表面上展示的Cas9-gRNARNP复合物和包装在内部的mCherry报告质粒分子,如图57所示。图61示出了在增加Cre-Hoc分子比例时,Cas9-Soc(5:1,Cas 9-Soc分子与Soc结合位点)和Cre-Hoc的共展示,如SDS-PAGE分析所确定的。图62示出了Cre-Hoc结合对同一衣壳上Cas9-gRNARNP结合的影响。如图62所示,Cas9-gRNARNP和Cre-Hoc均与同一衣壳结合,并且增加Cre-Hoc展示并不影响Cas9-gRNA RNP结合。
图63示出了上述两个实施方式中描述对于T4-AV,被包装的LSL-GFP质粒DNA(6302)和mCherry报告质粒(6304)的量化。在增加DNA与衣壳的比例的情况下,将线性化的DNA与T4一起孵育,如顶侧所示。在15-20:1的比例下达到最大包装容量。
合在一起,这在同一AV中构成了大的有效载荷:50分子的Cre,270分子的RNP复合物,6分子的GFP供体质粒和5分子的mCherry报告质粒。值得注意的是,这些AV完成了它们被编程的所有任务。首先,RNP在AAVS1位点进行基因组编辑,达到~30%的编辑效率。第二,在接近100%的293细胞中观察到强绿色荧光,证明了通过Cre的有效的位点特异性重组,而缺乏Cre的对照AV没有显示出显著的荧光,如图64所示。LSL-GFP和mCherry DNA在每个细胞中共递送和共表达,其中GFP表达发生在共递送的Cre蛋白重组后,这全部在同一AV中发生。图65示出了在增加Cre-Hoc展示比例的情况下,用Cre-Hoc-T4(LSL-GFP)-Soc-Cas9-gRNA-AV转导293细胞后的代表性GFP表达图像。如图65所示,GFP表达随着Cre-Hoc展示比例的增加而增加。第三,绿色荧光的强度和分布与由不需要重组的报告基因直接表达所产生mCherry的荧光的强度和分布相当,如图64中下面一行所示。这意味着,在AV进入和解体后,在接近100%的细胞中Cre依靠其核定位信号重新定位于细胞核,并对共递送和独立重新定位的GFP供体质粒进行LoxP重组,从而使得GFP报告基因从上游CMV启动子有效转录。
T4-AV位点特异性重组的高效率还通过另一种方法得以验证。通过在无启动子的GFP报告基因上游整合LoxP-mCherry-LoxP-polyA-STOP盒构建稳定的293细胞系。然后,将用Cre、Cas9-gRNA RNP和Luci报告质粒编程的AV递送到这些细胞中,引起数个基因组修饰。验证步骤如图66所示,该图是Cre-Hoc-T4(Luci)-Soc-Cas9-gRNA-AV递送入Cre报告细胞的示意图。首先,发生了有效的Cre-介导的位点特异性重组,这可以通过细胞在开始时由于内源性mCherry表达而显示出强红色荧光而没有绿色荧光,然后转变成强绿色荧光而红色荧光消失来明显看出。这意味着转录活性的mCherry基因通过AV递送的Cre在侧翼LoxP位点之间的分子内重组而被剪接,进而激活了GFP报告基因的表达,该报告基因现处于上游启动子的控制之下,如图67所示。第二,AV共递送Luci报告基因,其在所有Cre-Hoc与T4(Luci)-Soc-Cas9-gRNA比例下均高效表达,如图68的左侧所示。第三,这些AV还在人类基因组的另一靶位点进行有效的基因组编辑,这可通过AAVS1基因座处~30%的基因破坏来明显看出,如图68的左侧所示。
递送RNA的人工病毒
在另一实施方式中,鉴于在Cas9和gRNA之间观察到的强相互作用以及T4-AV对所得RNP复合物的有效递送,该系统适用于包括siRNA在内的常见RNA递送,如上述实施方式中所述。siRNA是~20-25bp的双链寡核苷酸,其靶向具有相同序列的mRNA用于降解而不是翻译。这种siRNA-介导的基因沉默机制已被广泛用于治疗各种遗传和感染性疾病13
Cas9有效地与siRNA结合。体外凝胶阻滞实验表明,gRNA可以取代Cas9-siRNA复合物中结合的siRNA。图69示出了电泳迁移率变动测定的结果,确定了gRNA/siRNA:Cas9-Soc的结合化学计量。在电泳迁移率变动测定中,在室温下将恒定量的gRNA或siRNA与各种摩尔比(0:1至5:1)的Cas9-Soc分子混合1小时,然后通过琼脂糖凝胶电泳进行分析。gRNA/siRNA-Cas9-Soc复合物保留在上样孔中。随着Cas9-Soc与gRNA/siRNA比例的增加,保留在上样孔中的gRNA/siRNA-Cas9-Soc复合物的量增加。
在一个实施方式中,T4-AV用Cas9-siRNARNP和/或Cas9-mRNARNP复合物进行装饰。在优选的实施方式中,T4-AV用~280Cas9-siRNARNP复合物进行装饰。下表总结了携带siRNA和mRNA有效载荷的T4-AV的配置。图70是携带siRNA和mRNA有效载荷的T4-AV的示意图,具有包装在T4和RNP复合物中的DNA(7002),含有展示在外部的Cas9(7004)、mRNA(7006)或siRNA(7008)和Soc(7010)。siRNA与T4(gRNA-GFP)-Soc-Cas9衣壳的结合随着siRNA分子与Soc结合位点比例的增加而增加,如图71所示。
在一个实施方式中,当暴露于293细胞时,这些也含有被包装的GFP或Luci报告质粒的AV有效递送siRNA分子并沉默GFP表达,而递送非特异性对照siRNA(NCsiRNA)的对照AV没有效果,如图73所示。图72表明siRNA:T4(Luci)-Soc-Cas9比例对AV递送效率没有影响。将T4(Luci)-Soc-Cas9-siRNA-AV递送的荧光素酶表达与T4(Luci)-Soc-Cas9-AV(缺乏siRNA)的对照转导进行比较,并表示为倍数变化。在图74中,蛋白质印迹量化示出了转导后48和72小时GFPsiRNA-AV对GFP蛋白水平的抑制。值得注意的是,T4-AV在48小时内实现高达~90%的沉默,并且在72小时内实现接近100%的沉默,如图74所示。图75中量化了GFP抑制百分比,其表明GFP抑制百分比随着siRNA与T4(GFP)-Soc-Cas9的比例的增加而增加。同样如图75所示,在siRNA与T4(GFP)-Soc-Cas9的比例为3:1时,GFP抑制百分比达到接近100%。
在一个实施方式中,可以同时递送沉默不同mRNA的两种siRNA。在优选的实施方式中,进入同一AV中的两个siRNA中的一个靶向GFP基因,且另一个靶向管家基因GAPDH。如图76所示,携带GFP-siRNA和GAPDH-siRNA的AV将这两种基因的表达分别敲低~95%和80%。
递送长得多的mRNA分子进一步将RNA-AV的足迹扩展至用于治疗性应用的基因的高水平表达46。在一个实施方式中,通过简单地将体外转录的996-nt GFP mRNA与Cas9-T4衣壳混合,来用mRNA取代上述AV的siRNA。如图77所示,有效形成了Cas9-mRNA复合物,在mRNA与Cas9分子的比例为~8:1时达到饱和,而缺乏Cas9的对照衣壳没有明显的mRNA结合。图77示出了在增加mRNA分子与Soc结合位点比例的情况下,GFPmRNA在T4(mCherry)-Soc-Cas9衣壳上的负载,其在mRNA分子与Soc结合位点的比例达到8:1之后,保持不变。该结果通过电泳迁移率变动测定得以证实,其示出了在增加Cas9-Soc分子与mRNA的比例的情况下(0:1至7:1),mRNA与Cas9-Soc蛋白的结合,如图78所示。每个AV携带~55分子的mRNA的有效载荷。当与siRNA相比时,较低的mRNA拷贝数可能是因为长得多的mRNA滴定了几个Cas9分子。
在一个实施方式中,上述实施方式中描述的GFPmRNA-AV在转导至293细胞后,在细胞中表达强绿色荧光,并且该荧光均匀分布在整个细胞中,并与包装在同一AV中的mCherry报告基因的共递送产生的红色荧光合并,如图79所示。另一方面,缺乏Cas9-mRNA复合物的对照(mCherry)AV仅显示红色荧光,如图80所示。此外,被包装的Luci报告子的表达表明mRNA展示不影响AV的有效转导,如图81所示。将荧光素酶表达与缺乏mRNA展示的对照AV进行比较,并表示为倍数变化。
在另一实施方式中,将另一gRNA表达质粒包装到上述AV中,以进一步增强RNA-AV的效用。图82示出了被包装的gRNA表达质粒(AAVS1 gRNA)(8202)的量化。通过这种配置,在递送时,展示的Cas9可以首先将siRNA或mRNA递送到细胞质基质中,然后,凭借融合的NLS序列,它可以重新定位到细胞核中,并与共递送的质粒所表达的gRNA形成基因组编辑复合物。然后,Cas9可以执行第二个功能,即在靶位点进行基因组编辑。
体外对照实验表明,gRNA可以取代Cas9-siRNA复合物中结合的siRNA,如图83的左侧所示,而相反地,Cas9-gRNA复合物中没有发生gRNA的siRNA取代,如图83的右侧所示。在一个实施方式中,通过利用Cas9对siRNA和gRNA的不同亲和力,用展示的Cas9-siRNA或Cas9-mRNA复合物以及被包装在内的gRNA和mCherry报告质粒内对AV进行编程。在一个实施方式中,在转导至293细胞后,这些AV在相同细胞中执行GFP基因沉默或GFP mRNA表达、AAVS1处的基因组编辑和mCherry表达,如图84和图85所示。图84示出了在增加siRNA分子与soc结合位点的比例的情况下,用T4(AAVS1gRNA-GFP)-Soc-Cas9-siRNA-AV处理的细胞的AAVS1插入缺失频率的量化。右边的方框表明使用T7E1测定的AAVS1基因破坏。图85示出了在增加mRNA分子与衣壳展示的Cas9的比例的情况下T4(AAVS1gRNA-mCherry)-Soc-Cas9-GFPmRNA-AV在AAVS1基因座处的基因组编辑的量化。
最大化T4人工病毒的可编程性
已经开发了CRISPR策略53,其允许用除DNA之外的蛋白填充衣壳内部空间,以进一步增强T4-AV的可编程性。这不仅会增加货物容量,还会赋予T4-AV新的特性,即在纳米衣壳隔室内原位组装DNA-蛋白复合物的能力,其在递送后可引导DNA货物运输至细胞核。这种导向运输系统(GTS)将来可用于将货物引导至合适的细胞内目的地。
在噬菌体T4形态发生67期间,主要衣壳蛋白gp23能够围绕由一簇蛋白形成的支架核心(scaffolding core)组装,该一簇蛋白包括三个非必需的组蛋白样“内部蛋白质”:IPI、IPII和IPIII。组装后,大多数支架蛋白降解为小肽,然后离开衣壳,为基因组衣壳化创建空间。然而,这些IP在紧挨~10个氨基酸的N-末端衣壳靶向序列(CTS)处仅被裂解一次。当CTS离开衣壳时,高度碱性的IP(共计~1000个分子)保留在衣壳内,并在噬菌体感染期间将DNA-蛋白复合物注入宿主大肠杆菌后保护基因组。以前的研究表明,当IP的C-末端部分被外来蛋白取代时,N-末端CTS将外来蛋白靶向核心,其在CTS去除后,保留在衣壳空间中32
在一个实施方式中,开发了CRISPR策略,通过该策略,LacI阻抑蛋白分子被包装在衣壳内,然后其可以与被包装的DNA形成复合物,该被包装的DNA包含反式设计的lac操纵子序列(LacO)。首先通过删除ipI和ipII基因来产生“受体”噬菌体,并用该噬菌体感染含有两种质粒的大肠杆菌;该两种质粒为表达Cas9或Cpf1和CRISPR RNA的间隔质粒,其对应于受体噬菌体缺失区域中的原间隔序列,以及含有LacI阻抑基因的第二供体质粒,该LacI阻抑基因在N-末端与CTS序列融合且在C-末端与NLS序列融合(CTS-LacI-NLS或CLN)(SEQ IDNO:20),侧翼为~200bp同源臂(图S7A)。图86是描绘使用CRISPR工程化的T4-AV的可编程导向运输系统(GIS)的示意图:a.通过CRISPR基因组编辑工程化CTS-LacI-NLS(CLN)突变噬菌体。b.在大肠杆菌中制备CLN包装的T4头部。c.CLN包装的T4头部。d.体外DNA包装后在CLN头部形成的CLN-DNA复合物。e.具有Soc-和/或Hoc-展示的蛋白的GIS-T4。f.递送后,CLN-DNA复合物被NLS信号导向至细胞核。如图87所示,通过Cas9/Cpf1编辑复合物在受体噬菌体基因组的原间隔区序列内裂解,随后在裂解的端部和供体质粒的同源臂之间重组,来通过替换受体噬菌体的ipIII基因,将CLN基因转移到噬菌体基因组中。图87中A是CRISPR-介导的CLN基因插入(ipIII)的示意图;图87中B示出了ipII基因缺失;图87中C示出了ipI基因(部分)缺失。因此,拯救的(rescued)重组噬菌体缺乏所有三种IP,但在它们的位置含有CLN基因。由该CLN突变噬菌体制备的空衣壳(10am.13am.hoc-.soc-.CLN)在外壳内含有~370分子的CLN蛋白,并显示出与野生型衣壳相当的体外DNA包装效率。如图88所示,通过PCR证实了连续几轮CRISPR-介导的T4基因组编辑创建了突变噬菌体。T4(CLN)头部的尺寸排阻色谱图如图89所示。箭头表示有包装能力的T4(CLN)头部的峰级分。SDS-PAGE上的煮沸和未煮沸的T4样品证明了,CLN包装的T4头部被放大,并且表现类似于WT(野生型)T4头部。通过SDS-PAGE(图90中a)和蛋白印迹(图90中b)证实了头部包装的CLN蛋白,并量化其拷贝数。(E)图91中示出了CLN蛋白和T4(CLN)头部的功能表征结果。图91中a示出了CLN蛋白与用于体外DNA包装的含LacO的质粒DNA的结合;图91中b中的体外DNA包装表明,突变CLN头部表现出与WT头部相当的活性。
在一个实施方式中,将LacO序列插入Luci或Cas9-gRNA质粒,并包装入CLN衣壳。被包装的LacI阻抑物和LacO-DNA然后形成DNA-蛋白复合物,如在体外凝胶阻滞实验中所见,如图91所示。如图92所示,这些AV在转导至人类细胞后显示出荧光素酶的表达增加了高达~3.5倍,并且如图93所示,在MOI为104时,Cas9-介导的基因组编辑增加了~2倍,推测是由于LacI阻抑物中存在NLS信号,从而增强了DNA-LacI复合物向细胞核的运输。图93中a示出了T7E1测定结果,图93中b示出了AAVS1插入缺失的频率,表明T4(CLN)-GIS-AV增强了基因组编辑。当T4颗粒与293细胞的比例较低,即~103:1或~104:1,而不是在高的~105:1比例时,荧光素酶或基因破坏增强最显著。这可能是因为以高比例递送更多拷贝的DNA补偿了低拷贝数时增强的CLN-介导的运输。
在一个实施方式中,使用相同的策略将Cre重组酶的基因插入至噬菌体基因组中。在另一实施方式中,插入了GFP和β-半乳糖苷酶包装的报告基因,其通常可用于病毒基因组工程。尽管拷贝数不同,但所有这些蛋白都成功地被包装到T4衣壳中。
蛋白大小和结构的变化可能会影响它们与支架核心的整合。图94示出了GFP包装的AV的生化特征。通过SDS-PAGE(图94中a)和488nm激发(图94中b)证实了GFP蛋白包装。图95示出了Cre-包装的AV的生化特征。通过SDS-PAGE证实了Cre-头部(图95中a)。然而,所有包装的蛋白都保留了它们的生物学功能;例如,包装的β-半乳糖苷酶寡聚成功能性四聚体,并通过显示出葡糖苷水解酶活性而产生“蓝色噬菌体”,如图96所示。图96的左侧示出了T4(β-gal)头部的尺寸排阻色谱图。箭头指向洗脱的放大的T4(β-gal)衣壳的峰级分。在右侧中,对“蓝色噬菌体”的观察表明功能性四聚β-半乳糖苷酶分子的成功包装以及裂解的X-Gal底物的蓝色外观。类似地,用GFP蛋白和mCherry质粒DNA包装的AV表现出绿色和红色荧光,前者来自递送的蛋白(“绿色荧光噬菌体”),后者来自递送的DNA,如图94中c所示。绿色荧光噬菌体成功递送蛋白也通过T4(GFP)衣壳的尺寸排阻色谱图得以证实,如图97所示,并且T4(GFP)和对照T4衣壳在488nm激发下的荧光图像(图98)表明了功能性GFP在T4(GFP)衣壳中的成功包装。图97中的箭头指向洗脱的放大(expanded)的T4(GFP)衣壳的峰部分。最后,含有包装的Cre重组酶的AV在LoxP-mCherry-LoxP-polyA-STOP-GFP盒的LoxP位点之间进行有效重组,效率接近100%,引起mCherry基因的剪接,这又允许从剪接产物的上游启动子表达GFP基因,如图95中b所示。因此,GTS策略可以普遍应用于能够进行其他基因组修饰的DNA结合蛋白。
组装能够被引导以在人类细胞中执行限定分子操作的人工病毒的能力仍然是医学的圣杯20,29,48。本公开描述了这种理念的证明。描述了在试管中建立人工病毒的顺序组装线方法,使用噬菌体T4的经纯化的和充分表征的结构组分,每个组分被工程化以在人类细胞中执行特定的任务。这些任务包括:结合并进入细胞、细胞内转运(intracellulartrafficking)、核定位和基因组重塑2,37。除了创建巨大的工程化空间之外,这种组装线方法允许以期望的组合混合和匹配组分,以产生赋予有特定治疗能力的各种人工病毒。这种可自定制的“即插即用(plug-and-play)”人工病毒平台目前并不存在,并且有几个特征将它与目前可用的其他病毒或合成递送平台区分开来。
T4-AV平台的特征之一是它能够将多种类型的治疗性生物分子,包括蛋白、DNA、RNA及它们的复合物整合到纳米颗粒结构的不同隔室中。这些分子在被输送到人类细胞后,独立地或通过相互作用忠实地执行它们的功能。这已经在广谱分子中得以证明:从27kDaGFP到516kDa四聚β-半乳糖苷酶的蛋白,从大双链质粒DNA到小单链gRNA的核酸,以及本公开中预成型复合物,包括蛋白-蛋白、RNA-蛋白和DNA-蛋白复合物。此外,类似于天然病毒,通过调节货物分子的拷贝数能够调整AV“感染”时在递送的分子之间形成的功能性回路,从而为创建具有治疗能力的AV提供了诸多选择。
在模型细胞系HEK293中,T4-AV以接近100%的效率持续产生信号,如通过报告基因(例如,Luci、GFP、mCherry)的表达或通过递送的蛋白(例如,GFP、β-Gal、Cre)的活性所测量的。AV有助于高效率的关键组分是脂质外衣,其通过利用T4衣壳的高阴离子特性来创建。现成的阳离子脂质自发地与T4衣壳结合,产生亲脂性阳离子表面,与人类细胞的阴离子表面互补19,23,58,66。如上述实施方式所证明的,没有这种外衣,转导效率较差。即使是阳离子的但没有脂质外衣的AV也显示出低100倍的信号。此外,脂质外衣不会损害Soc-和Hoc-融合蛋白分子的展示。另一方面,这些分子,尤其是带正电荷的分子,进一步增强了T4-AV转导效率。
本公开中描述的T4人工病毒突破了目前存在的将生物分子递送到人类细胞中的四个主要障碍。首先,与其他递送平台不同,T4-AV可以在单次转导事件中有效地将多个相对大的DNA分子的多个拷贝递送到细胞中。这已经使用一系列含有报告基因、抗体基因和基因组编辑基因的质粒来充分证明。这是可能的,不仅因为T4的大货物容量,而且因为T4的包装机械表现出没有序列依赖性的混杂性质43,50,56,63。因此,通过荧光素酶活性测量的报告信号是所报告的最高信号之一,甚至高于AAV转导,该AAV转导在每个转导事件中只能递送一个报告分子。
T4-AV突破的第二个障碍是多合一递送。正如我们在整个研究中所证明的,T4-AV有效地递送由DNA、蛋白、RNA及其复合物的组合组成的复杂货物。这对于许多基因组重塑应用是必不可少的,包括基因组编辑和基因重组,它们需要多种生物分子的共递送,这在目前用其他递送平台是不可能的或者是非常困难的36,62。例如,对于基因组编辑,组装不同多合一配置的AV,携带Cas9核酸酶和gRNA,作为展示在外部的功能性RNA-蛋白复合物和/或作为包装在内部的可表达基因。类似地,对于基因重组,组装多种AV,其共递送位点特异性重组酶Cre和供体质粒。
T4-AV突破的第三个障碍是多路递送。通过整合不仅靶向多个位点(例如,多个gRNA和siRNA)而且在人类基因组中执行不同分子操作的货物分子来组装T4-AV。在一个组合中,通过整合Cas9和gRNA作为RNP,GFP或Luci基因作为包装质粒,Cre重组酶和供体质粒作为展示和包装分子来分别进行三种不同的操作,即基因组编辑、基因表达和位点特异性重组。在另一组合中,通过将siRNA、mRNA、Cas9和gRNA整合到同一人工病毒中来进行基因沉默、基因表达和基因组编辑。
T4-AV突破的第四个障碍是可编程性,即执行一组指令并在进入人体细胞后进行修饰功能的能力。上文引用的许多示例证实了每个AV被编程的一组指令的执行。进入时功能行为的修饰通过Cas9功能的再利用得以证明。通过利用体外观察,即Cas9可结合单链gRNA和双链siRNA以及gRNA由于其对Cas9的较高亲和力而可以使结合的siRNA脱落,AV通过展示Cas9-siRNA复合物和包装gRNA表达质粒来组装。一旦进入,这些AV将siRNA递送到细胞质基质中,导致基因沉默,而相同的Cas9则通过与共递送质粒表达的gRNA结合,将功能切换到细胞核中的基因组编辑。
CRISPR工程进一步增强了T4-AV的可编程性,该工程允许在噬菌体衣壳内整合数百种蛋白分子32,53。重要的是,这创建了另一种途径来在被包装的头部内产生额外的功能回路,这将有助于引导细胞内转运和/或更有效的基因组修饰。这些已经利用模型蛋白(诸如LacI和Cre)得以证明。通过将LacI蛋白预包装在衣壳内,它允许在LacI蛋白和含LacO的DNA之间形成DNA-蛋白复合物,并通过体外DNA包装以反式到达衣壳。一旦递送,具有核定位信号的工程化LacI随后将DNA引导至细胞核,这从增强的报告基因表达可以明显看出。类似地,衣壳包装的NLS-Cre重组酶使得人类基因组中位点特异性重组的效率接近100%。
总之,创建了一种新范畴的病毒纳米材料,基于噬菌体的人工病毒,其可以使用组装线方法在试管中定制组装。这些人工病毒具有与天然病毒相似的结构,并通过相似的途径进入、解组装和细胞内转运,尽管确切的机制尚不清楚,需要进一步研究37,48。然而,重要的是,从技术角度来看,使用这种方法可以组装几乎无限种类的AV,其可以忠实地执行被编程的每个功能,并在基因组和细胞代谢中进行精确的改变。因此,本公开中描述的系统研究提供了优化有效载荷和创建用于有效递送到原代人类细胞中的人工病毒的必要基础,其中原代人类细胞将有助于体外细胞疗法(诸如干细胞和CAR T-细胞疗法)以及体内疗法。这些研究正在进行中。这种T4-AV平台具有诸如大货物容量、整合不同货物的能力、可编程性、可定制性和多合一递送等特征,为恢复有缺陷的人类细胞并最终恢复人体健康的潜在未来应用提供了强有力的理念证明。
已经详细描述了本公开的许多实施方式,明显的是,在不脱离所附权利要求中限定的本发明的范围的情况下,修改和变化是可能的。此外,应理解的是,本公开中的所有示例,尽管示出了本发明的许多实施方式,但都是作为非限制性示例提供的,因此不应被视为限制如此示出的各个方面。
实施例
实施例1
重组蛋白表达和纯化
通过热激法在大肠埃希氏杆菌(大肠杆菌)BL21(DE3)RIPL细胞中经转化表达pET28b的质粒来表达重组蛋白(除了Cas9和Cpf1)。使经转化的细胞在37℃下于含有50μg/ml卡那霉素和25μg/ml氯霉素的Moores培养基(溶解在1L水中的20克胰蛋白胨、15克酵母提取物、8克NaCl、2克右旋糖、2克Na2HPO4和1克KH2PO4)中生长至OD600为0.5,在30℃下用1mM异丙基β-d-1-硫代半乳糖苷(IPTG)诱导蛋白表达3小时。诱导后,通过离心收获细胞,并将沉淀物悬浮在含有蛋白酶抑制剂混合物(/>USA)和苯并酶核酸酶(Millipore/>)的结合缓冲液(50mM Tris-HCl,300mM NaCl和20mM咪唑,pH 8.0)中。用法式压滤壶(French press)/>裂解细胞悬浮液,并通过以34000×g离心30分钟从细胞碎片中分离可溶部分。将裂解物通过0.22-微米过滤器(/> )过滤,施加至预平衡(结合缓冲液)的HisTrapHP柱(/>Healthcare)并用结合缓冲液洗涤。然后用20-500mm线性咪唑梯度洗脱His-标签化蛋白质。根据制造商的说明,使用在GF缓冲液(20mM Tris-HCl和100mM NaCl,pH 8.0)中的Hi-Load 16/60Superdex-200(制备级)凝胶过滤柱(/>Healthcare)通过尺寸排阻色谱法进一步纯化峰级分。合并含有所需蛋白的级分,并通过AmiconUltra-4离心过滤(10kDa截留值;/>)来进行浓缩,在液氮中快速冷冻并储存在-80℃下。所有柱的操作均在4℃下进行。在同一柱上对凝胶过滤分子尺寸标准品进行色谱分离,以计算经纯化蛋白的大约尺寸。
对于Cas9-Soc或Cpf1-Soc纯化,本研究中使用的重组SpCas9或LbCpf1在C-末端与Soc融合,在N-末端与核定位信号肽融合。该蛋白还具有C-末端六组氨酸标签。简而言之,在37℃下培养RIPL细胞直到OD600=0.6,并在20℃下孵育40分钟,然后用1mM IPTG诱导。20小时后,收集细胞并使其重新悬浮在50ml含有蛋白酶抑制剂混合物(USA)和苯佐酶核酸酶(Millipore/>)结合缓冲液(50mM Tris-HCl,300mM NaCl,20mM咪唑,和5mM三(2-羧乙基)膦(TCEP;Soltec Ventures),pH 8.0)中。然后如上所述通过HisTrapHP和Superdex-200柱纯化Cas9-Soc或Cpf1-Soc蛋白。
实施例2
T4 CRISPR工程化
根据之前描述的程序进行T4噬菌体工程化53。大肠杆菌菌株P301(sup0)和B40(sup1)用于下述实验。如前所述在大肠杆菌B40上繁殖10-amber 13-amber hoc-del soc-del T4噬菌体63。通过将间隔子序列克隆到链霉素抗性质粒CRISPR-Cas9(No.48645)(SEQ ID No.21)中,构建具有特异性间隔子的CRISPR-Cas9或Cpf1质粒。间隔子序列如下所示:
AVS1-Cas9-gRNA1:GTCCCCTCCACCCCACAGTG(SEQ ID NO:2)
AAVS1-Cas9-gRNA2:GGGGCCACTAGGGACAGGAT(SEQ ID NO:3)
HBB-Cas9-gRNA:AGTCTGCCGTTACTGCCCTG(SEQ ID NO:4)
ipIII-Cas9-gRNA:GGCCTTTACTACAGAAGCTT(SEQ ID NO:5)
ipI-Cpf1-gRNA1:TTCAGCAGGAGAGATAACGATTG(SEQ ID NO:6)
ipI-Cpf1-gRNA2:TACCATTACCGAAGCTACTCTTA(SEQ ID NO:7)
ipII-Cpf1-gRNA1:CTTCTAAGTTCGGCATGTCTATG(SEQ ID NO:8)
ipII-Cpf1-gRNA2:TTACGGTCTTTATCGGGCAA(SEQ ID NO:9)
ipIII-Cpf1-gRNA1:AAGTCGGAAGCCTTTGTAGCTAA(SEQ ID NO:10)
ipIII-Cpf1-gRNA2:TGCTTGGCAAATTCAAGACCTGC(SEQ ID NO:11)
通过将供体DNA克隆到pET28b载体中来构建同源供体质粒。将CRISPR-Cas9/Cpf1和供体质粒共转化到含有大肠杆菌B40(sup1)的抑制子中,然后通过链霉素和卡那霉素抗生素选择阳性克隆。用CRISPR质粒或供体质粒转化的细胞用作对照。用WT或10-amber13-amber hoc-del soc-del T4噬菌体感染细胞。扩增子代噬菌斑的工程化基因组并进行测序以确认插入或缺失。
实施例3
T4头部纯化
根据之前描述的方案,分离10-amber 13-amber hoc-del soc-del T4头部或蛋白包装的GIS-T463。简而言之,将突变噬菌体感染的大肠杆菌P301(sup-)细胞(500ml培养物)裂解在40ml的补充有10μg/ml DNase I的Pi-Mg缓冲液(26mM Na2HPO4、68mM NaCl、22mMKH2PO4和1mM MgSO4,pH 7.5)和1ml氯仿中,随后在37℃下孵育30分钟以消化DNA。经过两轮低速(6000×g,10分钟)和高速(35000×g,45分钟)离心后,将沉淀物重新悬浮在200μlTris Mg缓冲液(10mM Tris-HCl,50mM NaCl和5mM MgCl2,pH 7.5)中,然后进行CsCl密度梯度离心。将提取的T4头部在Tris Mg缓冲液中透析过夜,并通过DEAE-琼脂糖色谱法进一步纯化。浓缩峰衣壳级分,并储存在-80℃。使用SDS-PAGE和激光光密度测定法,通过与已知数量的噬菌体T4相比较量化主要衣壳蛋白gp23*来确定颗粒数量。
实施例4
DNA包装测定
根据之前描述的程序进行体外DNA包装测定24。依次加入经纯化的全长gp17(~3μM)、在包装缓冲液(30mM Tris-HCl、100mM NaCl、3mM MgCl2和1mM ATP,pH 7.5)中的线性化DNA和经纯化的T4头部(~2×1010个颗粒)以构成20μl反应混合物。将混合物在37℃孵育45分钟,然后加入苯并酶核酸酶,并在37℃孵育30分钟,以除去过量的未包装的DNA。通过用0.5μg/μl蛋白酶K50mM乙二胺四乙酸(EDTA)和0.2% SDS在65℃下处理30分钟来释放被包装的核酸酶抗性DNA。使用1%(wt/vol)琼脂糖凝胶电泳来分析被包装的DNA。通过Quantity One软件/>来量化被包装的DNA的量。包装效率被定义为包装在一个T4头部中的DNA分子的平均数。
实施例5
T4头部上的蛋白和RNA展示
根据之前描述的方案进行T4头部上的蛋白展示27。简而言之,在如上包装线性化的DNA后,将Soc-和/或Hoc-融合蛋白以不同的比例加入包装混合物中,并在4℃下孵育1小时。通过在30000×g下离心1小时来沉降混合物,并去除上清液中未结合的蛋白。用PBS洗涤两次后,将沉淀物重新悬浮在PBS中用于SDS-PAGE分析或Opti-MEM中用于细胞转导。考马斯蓝R250染色和脱色后,通过激光光密度测定法(PDSI,/>Healthcare)对SDS-PAGE凝胶上的蛋白条带进行量化。独立量化每个泳道中的Hoc、Soc和gp23*条带的密度,并且使用每个泳道中的gp23*条带作为内部对照(每个T4衣壳930个拷贝)来计算每个T4中结合的Hoc或Soc融合分子的拷贝数。对于gRNA/siRNA/mRNA展示,将展示有Hoc或Soc融合蛋白分子的T4头部重新悬浮在无RNAase的PBS缓冲液中,然后在4℃下与RNA一起孵育1小时。通过以30000×g离心1小时来沉降沉T4-RNP复合物,并去除上清液中未结合的RNA。用PBS洗涤两次后,将沉淀物重新悬浮Opti-MEM中用于转导。为了量化RNA的结合,在65℃下,用0.5μg/μl蛋白酶K/>50mM乙二胺四乙酸(EDTA)和0.2% SDS处理T4-RNP复合物30分钟,以释放被包装的DNA和展示的RNA,然后进行琼脂糖凝胶电泳。
实施例6
T4-AV测定
将如上所述的包装DNA和/或展示蛋白的T4纳米颗粒稀释在50μl Opti-MEM中,并轻轻混合。同时,将50μl Opti-MEM培养基加入到单独的无菌管中,随后加入适量的阳离子脂质,诸如lipofectamine 2000、lipofectamine 3000、lipofectamine RNAiMAX、lipofectamine LTX、lipofectamine stem和293(EXPI)(Thermo)。孵育5分钟后,加入T4颗粒,轻轻混合,在室温下孵育20分钟,不摇动,以形成T4-AV。混合物的总体积为100μl。
实施例7
细胞培养
在补充有10%胎牛血清(FBS,)、1×HEPES/>和1%抗生素的杜氏改良Eagle培养基(DMEM,/>)(完全DMEM)中培养HEK293细胞。使细胞保持在37℃和5% CO2的潮湿环境中,生长至~80-90%汇合。然后使用0.05%胰蛋白酶/EDTA/>从附着表面分离细胞,并以1:5的传代比例进行传代。
实施例8
细胞转导
转导前一天,将HEK293细胞以每孔2×105个细胞来转移到24孔板的完全DMEM中。在转导当天,将细胞与T4-AV在不含抗生素的Opti-MEM中孵育6小时。此后,除去Opti-MEM并用完全DMEM更换。将细胞在37℃下再孵育额外的48小时,用于进一步分析。在转导后48小时,通过荧光显微镜(Carl)观察GFP/mCherry转基因表达,并通过ImageJ软件量化平均荧光强度。细胞核用Hoechst 33342(Thermo/>)在37℃下复染20分钟。
实施例9
荧光素酶活性的量化
根据制造商推荐的方案,用荧光素酶测定系统(USA)测量荧光素酶活性,以分析通过T4-AV递送到细胞中的荧光素酶基因。简而言之,除去生长培养基,用PBS缓冲液冲洗细胞。除去洗涤缓冲液后,向每个孔中加入150μl被动裂解缓冲液,然后在室温下轻轻摇动20分钟。然后将20微升细胞裂解液转移至96孔白色不透明板,并与80μl荧光素酶测定试剂混合,通过Glomax Multi Detection System(Promega)记录发光信号。对每组进行三次测量。
实施例10
β半乳糖苷酶(β-gal)转导
通过使用β-半乳糖苷酶染色试剂盒用X-Gal染色来确定由T4-AV递送至细胞中的Soc-β-gal酶的活性。代表性染色图像由ChemiDoc成像系统/>捕获。
实施例11
内吞抑制剂的作用
将细胞以每孔2×105细胞接种在24孔板的完全DMEM中。24小时后,将细胞与几种抑制剂一起在不含抗生素的Opti-MEM中预孵育30分钟,其中该几种抑制剂诸如为用于网格蛋白-介导的内吞作用的蔗糖/氯丙嗪、用于脂质筏的甲基-β-环糊精(M-β-CD)、用于动力-蛋白介导的内吞作用的dynasore、用于巨胞饮作用的阿米洛利、用于窖蛋白-介导的内吞作用的nystatin和用于肌动蛋白细胞骨架重排的细胞松弛素D。然后在抑制剂的存在下,使细胞暴露于包装有荧光素酶或GFP报告基因的T4-AV再一6小时。此后,除去Opti-MEM,并用完全DMEM更换。将细胞在37℃下再培养额外的48小时,用于荧光素酶或GFP信号分析。
实施例12
细胞增殖测定
按照制造商的方案,在转染48小时后,使用发光细胞存活力测定试剂盒/>测定细胞存活力。简而言之,将等体积的/>试剂加入每个孔的细胞培养物中。将混合物水平摇动2分钟以诱导细胞裂解,然后在室温下孵育10分钟以稳定发光信号,其随后被/>多检测系统/>记录。未处理的细胞组的存活力被标准化为100%,对每个样品进行三次测量。
实施例13
蛋白印迹分析
简而言之,将转导的细胞重新悬浮在上样缓冲液中,煮沸10分钟,用12% SDS-PAGE分离,然后转移到硝酸纤维素膜上。在室温下,在5% BSA/PBS-T缓冲液(含0.05%吐温-20的PBS,pH 7.4)中进行封闭1小时,同时轻轻摇动。然后用PBS-T洗涤印迹三次。向印迹中加入初级抗-GFP、抗-微管蛋白或抗-His6抗体,并在4℃下在含5% BSA的PBS中孵育过夜。在用PBS-T洗涤三次后,在室温下以1:10000的稀释度在5% BSA/PBS-T中施加二抗山羊抗-小鼠HRP-缀合抗体/>1小时,随后用PBS-T冲洗三次。使用Gel Doc XR+系统和Image Lab软件(/>USA)通过增强化学发光底物(USA)可视化信号。
实施例14
用于基因组修饰的基因组DNA提取和T7EI分析用于基因组修饰
如本公开中所述,用各种基因组编辑AV转染HEK293细胞。转导后,细胞在37℃下孵育72小时。按照制造商的说明,使用GeneJETTM基因组DNA纯化试剂盒(Thermo)对基因组DNA进行纯化。简而言之,将细胞重新悬浮在裂解溶液/蛋白酶K中,并在56℃下孵育10分钟,然后在室温下用RNAase A处理10分钟。使用GeneJETTM柱来吸附基因组DNA,并用洗涤缓冲液洗涤。用洗脱缓冲液洗脱基因组DNA,并储存在-20℃。扩增AAVS1或HBB靶位点周围的基因组区域,并按照制造商的方案,使用/>Mini kit/>纯化PCR产物。将总共400ng或200ng的经纯化的PCR产物与2μl 10X/>缓冲液2/>和无核酸酶的水混合至20μl的最终体积,并退火以能够使用以下条件孵育来形成异源双链体:95℃持续10分钟,以-2℃/s速率从95℃至85℃,以-0.1℃/s速率从85℃至25℃,以及保持4℃。然后将T7核酸内切酶I加入经退火的PCR产物中,并在37℃孵育30分钟。在1.5%(wt/vol)琼脂糖凝胶上分析T7EI消化产物。用/>凝胶成像系统/>对凝胶进行成像,并使用ImageJ软件基于相对条带强度进行量化。使用以下公式计算估计的基因修饰:插入缺失(%)=100×(1-(1-被裂解的部分)1/2)36
实施例15
AAVS1 gRNA体外合成
用Phusion High-Fidelity PCR Master Mix(Thermo)通过PCR来扩增Cas9的含有的T7启动子、gRNA靶和gRNA支架序列的DNA模板(SEQ ID NO:1)。T7-gRNAPCR片段经凝胶-纯化并用作使用HiScribe T7 High Yield RNASynthesis Kit/>的体外转录的模板。T7转录进行过夜,然后使用MEGAclear Transcription Clean-Up Kit(Thermo)纯化RNA。gRNA用无RNase的水洗脱,通过琼脂糖凝胶电泳分析,用/>2000(Thermo/>)量化,并储存在-80℃。
实施例16
体外CRISPR RNP结合和裂解测定
为了测试Cas9或Cas9-Soc与gRNA/siRNA/mRNA的结合,将经纯化的蛋白和RNA以不同比例在室温下孵育1小时,然后通过琼脂糖凝胶电泳进行分析。AAVS1靶位点周围的基因组区域用热启动DNA聚合酶(Thermo)通过PCR来扩增,用/>Mini kit来纯化,并用作Cas9裂解测定的底物。在含有/>缓冲液3(100mM NaCl,50mMTris-HCl,10mM MgCl2和1mM DTT,pH 7.9)和PCR产物(300ng)的20μl反应体积中,加入经纯化的Cas9或Cas9-Soc(50nM)和AAVS1gRNA(50nM)。在37℃下孵育1小时后,通过1.5%(wt/vol)琼脂糖凝胶电泳分析DNA。
实施例17
体外Cre-Hoc重组测定
LSL-GFP质粒用作体外测试Cre-Hoc重组的底物。在含有重组缓冲液(33mM NaCl,50mM Tris-HCl和10mM MgCl2,pH 7.5)和LSL-GFP质粒的50μl反应体积中,加入递增量的经纯化的Cre-Hoc蛋白。在37℃下孵育30分钟,然后在70℃下孵育10分钟后,通过0.8%(wt/vol)琼脂糖凝胶电泳分析DNA。
实施例18
用于VRCO1抗体和CH58抗体量化的酶联免疫吸附测定(ELISA)
用包装有表达VRC01和/或CH58的重链和轻链的线性化质粒的AV转导HEK293细胞。培养3天后,收获细胞培养上清液,并通过ELISA分析抗体浓度。ELISA板(Evergreen96孔)在包覆缓冲液(0.05M碳酸钠-碳酸氢钠,pH 9.6)中每孔包覆0.1μg的HIV-1JRFL gp140包膜蛋白,在4℃下过夜。用PBS缓冲液(pH 7.4)洗涤三次后,用PBS-3%BSA缓冲液在37℃下封闭板1小时。将已知量的经纯化的VRCO1或CH58单克隆抗体以五倍连续稀释添加到三个孔中,以生成标准曲线,其中起始浓度为2000ng mL-1。使用在PBS-1%BSA中的5倍稀释系列测定细胞培养基中VRCO1或CH58的浓度。将稀释的样品加入每个孔中,将板在37℃下孵育1小时,并用PBS-T缓冲液(含0.05%吐温20的PBS,pH 7.4)洗涤5次。然后将山羊抗-人IgG-HRP二抗以1:5000的稀释加入每个孔中,并在37℃下孵育1小时,随后用PBS-T缓冲液洗涤5次。接下来,在黑暗中施加TMB(3,3’,5,5’-四甲基联苯胺)MicrowellTM过氧化物酶底物系统(KPL)用于显色。10分钟后,通过加入TMB BlueSTOPTM(KPL)溶液来淬灭酶促反应,使用ELISA读数仪(VERSA MaxTM,Molecular Devices)在650nm下在30分钟内读取该板。
实施例19
统计学
所有量化数据均以平均标准偏差(SD)来表示。统计分析采用双尾学生t检验。当p<0.05时,两组之间的差异被认为具有统计学显著性,当p<0.01时,被认为具有高度显著性。
参考文献上文中提及了以下参考文献,其通过引用并入本文:
1.Barr,J.J.,Auro,R.,Furlan,M.,Whiteson,K.L.,Erb,M.L.,Pogliano,J.,Stotland,A.,Wolkowicz,R.,Cutting,A.S.,Doran,K.S.,et al.(2013).Bacteriophageadhering to mucus provide a non-host-derived immunity.Proceedings of theNational Academy of Sciences of the United States of America 110,10771-10776.
2.Behzadi,S.,Serpooshan,V.,Tao,W.,Hamaly,M.A.,Alkawareek,M.Y.,Dreaden,E.C.,Brown,D.,Alkilany,A.M.,Farokhzad,O.C.,and Mahmoudi,M.(2017).Cellular uptake of nanoparticles:journey inside the cell.Chemical SocietyReviews 46,4218-4244.
3.Butler,K.V.,Kalin,J.,Brochier,C.,Vistoli,G.,Langley,B.,andKozikowski,A.P.(2010).Rational design and simple chemistry yield a superior,neuroprotective HDAC6 inhibitor,tubastatin A.Journal of the American ChemicalSociety 132,10842-10846.
4.Casjens,S.R.(2011).The DNA-packaging nanomotor of tailedbacteriophages.Nature Reviews Microbiology 9,647-657.
5.Chen,Z.,Sun,L.,Zhang,Z.,Fokine,A.,Padilla-Sanchez,V.,Hanein,D.,Jiang,W.,Rossmann,M.G.,and Rao,V.B.(2017).Cryo-EM structure of thebacteriophage T4 isometric head at 3.3-A resolution and its relevance to theassembly of icosahedral viruses.Proceedings of the National Academy ofSciences of the United States of America 114,E8184-E8193.
6.Cong,L.,Ran,F.A.,Cox,D.,Lin,S.,Barretto,R.,Habib,N.,Hsu,P.D.,Wu,X.,Jiang,W.,Marraffini,L.A.,et al.(2013).Multiplex genome engineering usingCRISPR/Cas systems.Science339,819-823.
7.D'Astolfo,D.S.,Pagliero,R.J.,Pras,A.,Karthaus,W.R.,Clevers,H.,Prasad,V.,Lebbink,R.J.,Rehmann,H.,and Geijsen,N.(2015).Efficientintracellular delivery of native proteins.Cell 161,674-690.
8.Danhier,F.,Le Breton,A.,and Preat,V.(2012).RGD-based strategies totarget alpha(v)beta(3)integrin in cancer therapy and diagnosis.MolecularPharmaceutics 9,2961-2973.
9.de Beer,T.,Fang,J.,Ortega,M.,Yang,Q.,Maes,L.,Duffy,C.,Berton,N.,Sippy,J.,Overduin,M.,Feiss,M.,et al.(2002).Insights into specific DNArecognition during the assembly of a viral genome packaging machine.MolecularCell 9,981-991.
10.DeKelver,R.C.,Choi,V.M.,Moehle,E.A.,Paschon,D.E.,Hockemeyer,D.,Meijsing,S.H.,Sancak,Y.,Cui,X.,Steine,E.J.,Miller,J.C.,et al.(2010).Functional genomics,proteomics,and regulatory DNA analysis in isogenicsettings using zinc finger nuclease-driven transgenesis into a safe harborlocus in the human genome.Genome Research 20,1133-1142.
11.Dion,M.B.,Oechslin,F.,and Moineau,S.(2020).Phage diversity,genomics and phylogeny.Nature Reviews Microbiology 18,125-138.
12.Doherty,G.J.,and McMahon,H.T.(2009).Mechanisms ofendocytosis.Annual Review of Biochemistry 78,857-902.
13.Dong,Y.,Siegwart,D.J.,and Anderson,D.G.(2019).Strategies,design,and chemistry in siRNA delivery systems.Advanced Drug Delivery Reviews 144,133-147.
14.Escors,D.,and Breckpot,K.(2010).Lentiviral vectors in genetherapy:their current status and future potential.Archivum Immunologiae EtTherapiae Experimentalis 58,107-119.
15.Fang,Q.,Tang,W.C.,Tao,P.,Mahalingam,M.,Fokine,A.,Rossmann,M.G.,andRao,V.B.(2020).Structural morphing in a symmetry-mismatched viralvertex.Nature Communications 11,1713.
16.Fokine,A.,Chipman,P.R.,Leiman,P.G.,Mesyanzhinov,V.V.,Rao,V.B.,andRossmann,M.G.(2004).Molecular architecture of the prolate head ofbacteriophage T4.Proceedings of the National Academy of Sciences of theUnited States of America 101,6003-6008.
17.Fokine,A.,Islam,M.Z.,Zhang,Z.,Bowman,V.D.,Rao,V.B.,and Rossmann,M.G.(2011).Structure of the three N-terminal immunoglobulin domains of thehighly immunogenic outer capsid protein from a T4-like bacteriophage.Journalof Virology 85,8141-8148.
18.Fuller,D.N.,Rickgauer,J.P.,Jardine,P.J.,Grimes,S.,Anderson,D.L.,and Smith,D.E.(2007).Ionic effects on viral DNA packaging and portal motorfunction in bacteriophage phi 29.Proceedings of the National Academy ofSciences of the United States of America 104,11245-11250.
19.Gao,X.,Tao,Y.,Lamas,V.,Huang,M.,Yeh,W.H.,Pan,B.,Hu,Y.J.,Hu,J.H.,Thompson,D.B.,Shu,Y.,et al.(2018).Treatment of autosomal dominant hearingloss by in vivo delivery of genome editing agents.Nature 553,217-221.
20.Hernandez-Garcia,A.,Kraft,D.J.,Janssen,A.F.,Bomans,P.H.,Sommerdijk,N.A.,Thies-Weesie,D.M.,Favretto,M.E.,Brock,R.,de Wolf,F.A.,Werten,M.W.,et al.(2014).Design and self-assembly of simple coat proteins forartificial viruses.Nature Nanotechnology 9,698-702.
21.Ishii,T.,and Yanagida,M.(1977).The two dispensable structuralproteins(soc and hoc)of the T4phage capsid;their purification and properties,isolation and characterization of the defective mutants,and their bindingwith the defective heads in vitro.Journal of Molecular Biology 109,487-514.
22.Johnson,J.E.,and Chiu,W.(2007).DNA packaging and delivery machinesin tailed bacteriophages.Current Opinion in Structural Biology 17,237-243.
23.Kim,Y.B.,Zhao,K.T.,Thompson,D.B.,and Liu,D.R.(2019).An anionichuman protein mediates cationic liposome delivery of genome editing proteinsinto mammalian cells.Nature Communications 10,2905.
24.Kondabagil,K.R.,Zhang,Z.,and Rao,V.B.(2006).The DNA translocatingATPase of bacteriophage T4 packaging motor.Journal of Molecular Biology 363,786-799.
25.Leffers,G.,and Rao,V.B.(1996).A discontinuous headful packagingmodel for packaging less than headful length DNA molecules by bacteriophageT4.Journal of Molecular Biology 258,839-850.
26.Leiman,P.G.,Chipman,P.R.,Kostyuchenko,V.A.,Mesyanzhinov,V.V.,andRossmann,M.G.(2004).Three-dimensional rearrangement of proteins in the tailof bacteriophage T4 on infection of its host.Cell 118,419-429.
27.Li,Q.,Shivachandra,S.B.,Zhang,Z.,and Rao,V.B.(2007).Assembly ofthe small outer capsid protein,Soc,on bacteriophage T4:a novel system forhigh density display of multiple large anthrax toxins and foreign proteins onphage capsid.Journal of Molecular Biology 370,1006-1019.
28.Mali,P.,Yang,L.,Esvelt,K.M.,Aach,J.,Guell,M.,DiCarlo,J.E.,Norville,J.E.,and Church,G.M.(2013).RNA-guided human genome engineering viaCas9.Science 339,823-826.
29.Mastrobattista,E.,van der Aa,M.A.,Hennink,W.E.,and Crommelin,D.J.(2006).Artificial viruses:a nanotechnological approach to genedelivery.Nature Reviews Drug Discovery 5,115-121.
30.Meinke,G.,Bohm,A.,Hauber,J.,Pisabarro,M.T.,and Buchholz,F.(2016).Cre Recombinase and Other Tyrosine Recombinases.Chemical Reviews 116,12785-12820.
31.Miller,E.S.,Kutter,E.,Mosig,G.,Arisaka,F.,Kunisawa,T.,and Ruger,W.(2003).Bacteriophage T4 genome.Microbiology and Molecular Biology Reviews:MMBR 67,86-156,table of contents.
32.Mullaney,J.M.,and Black,L.W.(1996).Capsid targeting sequencetargets foreign proteins into bacteriophage T4 and permits proteolyticprocessing.Journal of Molecular Biology 261,372-385.
33.Muzyczka,R.J.S.a.N.(2014).AAV-Mediated Gene Therapy for Researchand Therapeutic Purposes.Annual Review of Virology,427-451.
34.Natarajan,P.,Lander,G.C.,Shepherd,C.M.,Reddy,V.S.,Brooks,C.L.,3rd,and Johnson,J.E.(2005).Exploring icosahedral virus structures withVIPER.Nature Reviews Microbiology 3,809-817.
35.Nayerossadat,N.,Maedeh,T.,and Ali,P.A.(2012).Viral and nonviraldelivery systems for gene delivery.Advanced Biomedical Research 1,27.
36.Nelson,C.E.,and Gersbach,C.A.(2016).Engineering Delivery Vehiclesfor Genome Editing.Annual Review of Chemical and Biomolecular Engineering 7,637-662.
37.Ni,R.,Zhou,J.,Hossain,N.,and Chau,Y.(2016).Virus-inspired nucleicacid delivery system:Linking virus and viral mimicry.Advanced Drug DeliveryReviews 106,3-26.
38.Paez-Espino,D.,Eloe-Fadrosh,E.A.,Pavlopoulos,G.A.,Thomas,A.D.,Huntemann,M.,Mikhailova,N.,Rubin,E.,Ivanova,N.N.,and Kyrpides,N.C.(2016).Uncovering Earth's virome.Nature 536,425-430.
39.Qin,L.,Fokine,A.,O'Donnell,E.,Rao,V.B.,and Rossmann,M.G.(2010).Structure of the small outer capsid protein,Soc:a clamp for stabilizingcapsids ofT4-like phages.Journal of Molecular Biology 395,728-741.
40.Ran,F.A.,Hsu,P.D.,Wright,J.,Agarwala,V.,Scott,D.A.,and Zhang,F.(2013).Genome engineering using the CRISPR-Cas9 system.Nature protocols 8,2281-2308.
41.Rao,V.B.,and Feiss,M.(2008).The bacteriophage DNA packagingmotor.Annual Review of Genetics 42,647-681.
42.Rao,V.B.,and Feiss,M.(2015).Mechanisms of DNA Packaging by LargeDouble-Stranded DNA Viruses.Annu Rev Virol 2,351-378.
43.Rao,V.B.,Thaker,V.,and Black,L.W.(1992).A phage T4 in vitropackaging system for cloning long DNA molecules.Gene 113,25-33.
44.Rauch,B.J.,Silvis,M.R.,Hultquist,J.F.,Waters,C.S.,McGregor,M.J.,Krogan,N.J.,and Bondy-Denomy,J.(2017).Inhibition of CRISPR-Cas9 withBacteriophage Proteins.Cell 168,150-158 e110.
45.Robertson,K.,Furukawa,Y.,Underwood,A.,Black,L.,and Liu,J.L.(2012).Deletion of the Hoc and Soc capsid proteins affects the surface and cellularuptake properties of bacteriophage T4derived nanoparticles.Biochemical andBiophysical Research Communications 418,537-540.
46.Sahin,U.,Kariko,K.,and Tureci,O.(2014).mRNA-based therapeutics--developing a new class of drugs.Nature Reviews Drug Discovery 13,759-780.
47.Shivachandra,S.B.,Rao,M.,Janosi,L.,Sathaliyawala,T.,Matyas,G.R.,Alving,C.R.,Leppla,S.H.,and Rao,V.B.(2006).In vitro binding of anthraxprotective antigen on bacteriophage T4capsid surface through Hoc-capsidinteractions:a strategy for efficient display of large full-lengthproteins.Virology 345,190-198.
48.Stewart,M.P.,Sharei,A.,Ding,X.,Sahay,G.,Langer,R.,and Jensen,K.F.(2016).In vitro and ex vivo strategies for intracellular delivery.Nature 538,183-192.
49.Sun,L.,Zhang,X.,Gao,S.,Rao,P.A.,Padilla-Sanchez,V.,Chen,Z.,Sun,S.,Xiang,Y.,Subramaniam,S.,Rao,V.B.,et al.(2015).Cryo-EM structure of thebacteriophage T4 portalprotein assembly at near-atomic resolution.NatureCommunications 6,7548.
50.Sun,S.,Kondabagil,K.,Draper,B.,Alam,T.I.,Bowman,V.D.,Zhang,Z.,Hegde,S.,Fokine,A.,Rossmann,M.G.,and Rao,V.B.(2008).The structure of thephage T4 DNA packaging motor suggests a mechanism dependent on electrostaticforces.Cell 135,1251-1262.
51.Tao,P.,Mahalingam,M.,Marasa,B.S.,Zhang,Z.,Chopra,A.K.,and Rao,V.B.(2013).In vitro and in vivo delivery of genes and proteins using thebacteriophage T4 DNA packaging machine.Proceedings of the National Academy ofSciences of the United States of America 110,5846-5851.
52.Tao,P.,Wu,X.,and Rao,V.(2018a).Unexpected evolutionary benefit tophages imparted by bacterial CRISPR-Cas9.Science Advances 4,eaar4134.
53.Tao,P.,Wu,X.,Tang,W.C.,Zhu,J.,and Rao,V.(2017).Engineering ofBacteriophage T4Genome Using CRISPR-Cas9.ACS Synthetic Biology 6,1952-1961.
54.Tao,P.,Zhu,J.,Mahalingam,M.,Batra,H.,and Rao,V.B.(2018b).Bacteriophage T4nanoparticles for vaccine delivery against infectiousdiseases.Advanced Drug Delivery Reviews.
55.Torchilin,V.P.,Rammohan,R.,Weissig,V.,and Levchenko,T.S.(2001).TATpeptide on the surface of liposomes affords their efficient intracellulardelivery even at low temperature and in the presence of metabolicinhibitors.Proceedings of the National Academy of Sciences of the UnitedStates of America 98,8786-8791.
56.Vafabakhsh,R.,Kondabagil,K.,Earnest,T.,Lee,K.S.,Zhang,Z.,Dai,L.,Dahmen,K.A.,Rao,V.B.,and Ha,T.(2014).Single-molecule packaging initiation inreal time by a viral DNA packaging machine from bacteriophage T4.Proceedingsof the National Academy of Sciences of the United States of America 111,15096-15101.
57.van Meer,G.,Voelker,D.R.,and Feigenson,G.W.(2008).Membrane lipids:where they are and how they behave.Nature Reviews Molecular Cell Biology 9,112-124.
58.Wang,M.,Zuris,J.A.,Meng,F.,Rees,H.,Sun,S.,Deng,P.,Han,Y.,Gao,X.,Pouli,D.,Wu,Q.,et al.(2016).Efficient delivery of genome-editing proteinsusing bioreducible lipid nanoparticles.Proceedings of the National Academy ofSciences of the United States of America.
59.Wu,F.,Zhao,S.,Yu,B.,Chen,Y.M.,Wang,W.,Song,Z.G.,Hu,Y.,Tao,Z.W.,Tian,J.H.,Pei,Y.Y.,et al.(2020).A new coronavirus associated with humanrespiratory disease in China.Nature579,265-269.
60.Yap,M.L.,and Rossmann,M.G.(2014).Structure and function ofbacteriophage T4.Future Microbiology 9,1319-1327.
61.Yin,H.,Kanasty,R.L.,Eltoukhy,A.A.,Vegas,A.J.,Dorkin,J.R.,andAnderson,D.G.(2014).Non-viral vectors for gene-based therapy.Nature ReviewsGenetics 15,541-555.
62.Yin,H.,Kauffman,K.J.,and Anderson,D.G.(2017).Delivery technologiesfor genome editing.Nature Reviews Drug Discovery 16,387-399.
63.Zhang,Z.,Kottadiel,V.I.,Vafabakhsh,R.,Dai,L.,Chemla,Y.R.,Ha,T.,andRao,V.B.(2011).A promiscuous DNA packaging machine from bacteriophage T4.PLoSBiology 9,e1000592.
64.Zhou,T.,Georgiev,I.,Wu,X.,Yang,Z.Y.,Dai,K.,Finzi,A.,Kwon,Y.D.,Scheid,J.F.,Shi,W.,Xu,L.,et al.(2010).Structural basis for broad and potentneutralization of HIV-1by antibody VRC01.Science 329,811-817.
65.Zhu,J.,Tao,P.,Mahalingam,M.,Sha,J.,Kilgore,P.,Chopra,A.K.,and Rao,V.(2019).A prokaryotic-eukaryotic hybrid viral vector for delivery of largecargos of genes and proteins into human cells.Science Advances 5,eaax0064.
66.Zuris,J.A.,Thompson,D.B.,Shu,Y.,Guilinger,J.P.,Bessen,J.L.,Hu,J.H.,Maeder,M.L.,Joung,J.K.,Chen,Z.Y.,and Liu,D.R.(2015).Cationic lipid-mediated delivery of proteins enables efficient protein-based genome editingin vitro and in vivo.Nature Biotechnology 33,73-80.
67.Black LW,Showe MK,Steven AC(1994)Morphogenesis of the T4 head.In:Karam JD(ed)Molecular biology of bacteriophage T4.American Society forMicrobiology Press,Washington,DC,pp 218–258
本申请中引用的所有文件、专利、期刊文章和其他材料均通过引用并入本文。
虽然已经参照某些实施方式对本公开进行了公开,但在不脱离如所附权利要求中所述的本公开的领域和范围的情况下,可对所述实施方式进行多种修改、变更和改变。因此,本公开不意在限于所描述的实施方式,而是其具有由所附权利要求及其等同意义的语言定义的所有范围。
序列表
<110> 美国天主教大学
<120> 用于人类基因组重塑的基于噬菌体的人工病毒设计
<130> 109007-23787US01
<150> US 63/058,012
<151> 2020-07-29
<160> 22
<170> PatentIn version 3.5
<210> 1
<211> 120
<212> DNA
<213> 人工序列
<220>
<223> 合成的: 用于体外合成AAVS1gRNA的DNA模板
<400> 1
aagcaatacg actcactata ggggccacta gggacaggat gttttagagc tagaaatagc 60
aagttaaaat aaggctagtc cgttatcaac ttgaaaaagt ggcaccgagt cggtgctttt 120
<210> 2
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的: AAVS1-Cas9-gRNA1
<400> 2
gtcccctcca ccccacagtg 20
<210> 3
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的: AAVS1-Cas9-gRNA2
<400> 3
ggggccacta gggacaggat 20
<210> 4
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的: HBB-Cas9-gRNA
<400> 4
agtctgccgt tactgccctg 20
<210> 5
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的: ipIII-Cas9-gRNA
<400> 5
ggcctttact acagaagctt 20
<210> 6
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成的: ipI-Cpf1- gRNA1
<400> 6
ttcagcagga gagataacga ttg 23
<210> 7
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成的: ipI-Cpf1-gRNA2
<400> 7
taccattacc gaagctactc tta 23
<210> 8
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成的: ipII-Cpf1-gRNA1
<400> 8
cttctaagtt cggcatgtct atg 23
<210> 9
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的: ipII-Cpf1-gRNA2
<400> 9
ttacggtctt tatcgggcaa 20
<210> 10
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成的: ipIII-Cpf1-gRNA1
<400> 10
aagtcggaag cctttgtagc taa 23
<210> 11
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成的: ipIII-Cpf1-gRNA2
<400> 11
tgcttggcaa attcaagacc tgc 23
<210> 12
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的: P1
<400> 12
ctgccgtctc tctcctgagt 20
<210> 13
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的: P2
<400> 13
gtgggcttgt actcggtcat 20
<210> 14
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的: P3
<400> 14
aaaactgacg cacggaggaa 20
<210> 15
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的: P4
<400> 15
gtggattcgg gtcacctctc 20
<210> 16
<211> 1462
<212> PRT
<213> 人工序列
<220>
<223> 合成的: Cas9-Soc
<400> 16
Pro Lys Lys Lys Arg Lys Val Met Asp Lys Lys Tyr Ser Ile Gly Leu
1 5 10 15
Asp Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr
20 25 30
Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His
35 40 45
Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu
50 55 60
Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr
65 70 75 80
Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu
85 90 95
Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe
100 105 110
Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn
115 120 125
Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile His Leu
130 135 140
Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile
145 150 155 160
Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile
165 170 175
Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile
180 185 190
Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn
195 200 205
Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys
210 215 220
Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys
225 230 235 240
Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro
245 250 255
Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu
260 265 270
Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile
275 280 285
Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp
290 295 300
Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys
305 310 315 320
Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln
325 330 335
Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys
340 345 350
Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr
355 360 365
Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro
370 375 380
Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn
385 390 395 400
Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile
405 410 415
Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln
420 425 430
Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys
435 440 445
Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly
450 455 460
Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr
465 470 475 480
Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser
485 490 495
Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys
500 505 510
Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn
515 520 525
Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala
530 535 540
Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys
545 550 555 560
Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys
565 570 575
Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg
580 585 590
Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys
595 600 605
Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp
610 615 620
Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu
625 630 635 640
Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln
645 650 655
Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu
660 665 670
Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe
675 680 685
Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His
690 695 700
Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser
705 710 715 720
Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser
725 730 735
Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu
740 745 750
Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu
755 760 765
Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg
770 775 780
Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln
785 790 795 800
Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys
805 810 815
Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln
820 825 830
Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile Val
835 840 845
Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr
850 855 860
Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu
865 870 875 880
Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys
885 890 895
Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly
900 905 910
Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val
915 920 925
Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg
930 935 940
Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys
945 950 955 960
Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe
965 970 975
Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp
980 985 990
Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro
995 1000 1005
Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp
1010 1015 1020
Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala
1025 1030 1035
Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys
1040 1045 1050
Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu
1055 1060 1065
Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly
1070 1075 1080
Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val
1085 1090 1095
Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys
1100 1105 1110
Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg
1115 1120 1125
Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro
1130 1135 1140
Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly
1145 1150 1155
Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr
1160 1165 1170
Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu
1175 1180 1185
Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys
1190 1195 1200
Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg
1205 1210 1215
Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala
1220 1225 1230
Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr
1235 1240 1245
Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu
1250 1255 1260
Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln
1265 1270 1275
Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu
1280 1285 1290
Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile
1295 1300 1305
Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn
1310 1315 1320
Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp
1325 1330 1335
Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu
1340 1345 1350
Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Arg Ile Asp Leu Ser
1355 1360 1365
Gln Leu Gly Gly Asp Gly Gly Gly Gly Ser Arg Ser Gly Gly Tyr
1370 1375 1380
Val Asn Ile Lys Thr Phe Thr His Pro Ala Gly Glu Gly Lys Glu
1385 1390 1395
Val Lys Gly Met Glu Val Ser Val Pro Phe Glu Ile Tyr Ser Asn
1400 1405 1410
Glu His Arg Ile Ala Asp Ala His Tyr Gln Thr Phe Pro Ser Glu
1415 1420 1425
Lys Ala Ala Tyr Thr Val Val Thr Asp Ala Ala Asp Trp Arg Thr
1430 1435 1440
Lys Asn Ala Ala Met Phe Thr Pro Thr Pro Val Ser Gly His His
1445 1450 1455
His His His His
1460
<210> 17
<211> 1334
<212> PRT
<213> 人工序列
<220>
<223> 合成的: Cpf1-Soc
<400> 17
Pro Lys Lys Lys Arg Lys Val Met Ser Lys Leu Glu Lys Phe Thr Asn
1 5 10 15
Cys Tyr Ser Leu Ser Lys Thr Leu Arg Phe Lys Ala Ile Pro Val Gly
20 25 30
Lys Thr Gln Glu Asn Ile Asp Asn Lys Arg Leu Leu Val Glu Asp Glu
35 40 45
Lys Arg Ala Glu Asp Tyr Lys Gly Val Lys Lys Leu Leu Asp Arg Tyr
50 55 60
Tyr Leu Ser Phe Ile Asn Asp Val Leu His Ser Ile Lys Leu Lys Asn
65 70 75 80
Leu Asn Asn Tyr Ile Ser Leu Phe Arg Lys Lys Thr Arg Thr Glu Lys
85 90 95
Glu Asn Lys Glu Leu Glu Asn Leu Glu Ile Asn Leu Arg Lys Glu Ile
100 105 110
Ala Lys Ala Phe Lys Gly Asn Glu Gly Tyr Lys Ser Leu Phe Lys Lys
115 120 125
Asp Ile Ile Glu Thr Ile Leu Pro Glu Phe Leu Asp Asp Lys Asp Glu
130 135 140
Ile Ala Leu Val Asn Ser Phe Asn Gly Phe Thr Thr Ala Phe Thr Gly
145 150 155 160
Phe Phe Asp Asn Arg Glu Asn Met Phe Ser Glu Glu Ala Lys Ser Thr
165 170 175
Ser Ile Ala Phe Arg Cys Ile Asn Glu Asn Leu Thr Arg Tyr Ile Ser
180 185 190
Asn Met Asp Ile Phe Glu Lys Val Asp Ala Ile Phe Asp Lys His Glu
195 200 205
Val Gln Glu Ile Lys Glu Lys Ile Leu Asn Ser Asp Tyr Asp Val Glu
210 215 220
Asp Phe Phe Glu Gly Glu Phe Phe Asn Phe Val Leu Thr Gln Glu Gly
225 230 235 240
Ile Asp Val Tyr Asn Ala Ile Ile Gly Gly Phe Val Thr Glu Ser Gly
245 250 255
Glu Lys Ile Lys Gly Leu Asn Glu Tyr Ile Asn Leu Tyr Asn Gln Lys
260 265 270
Thr Lys Gln Lys Leu Pro Lys Phe Lys Pro Leu Tyr Lys Gln Val Leu
275 280 285
Ser Asp Arg Glu Ser Leu Ser Phe Tyr Gly Glu Gly Tyr Thr Ser Asp
290 295 300
Glu Glu Val Glu Val Phe Arg Asn Thr Leu Asn Lys Asn Ser Glu Ile
305 310 315 320
Phe Ser Ser Ile Lys Lys Leu Glu Lys Leu Phe Lys Asn Phe Asp Glu
325 330 335
Tyr Ser Ser Ala Gly Ile Phe Val Lys Asn Gly Pro Ala Ile Ser Thr
340 345 350
Ile Ser Lys Asp Ile Phe Gly Glu Trp Asn Val Ile Arg Asp Lys Trp
355 360 365
Asn Ala Glu Tyr Asp Asp Ile His Leu Lys Lys Lys Ala Val Val Thr
370 375 380
Glu Lys Tyr Glu Asp Asp Arg Arg Lys Ser Phe Lys Lys Ile Gly Ser
385 390 395 400
Phe Ser Leu Glu Gln Leu Gln Glu Tyr Ala Asp Ala Asp Leu Ser Val
405 410 415
Val Glu Lys Leu Lys Glu Ile Ile Ile Gln Lys Val Asp Glu Ile Tyr
420 425 430
Lys Val Tyr Gly Ser Ser Glu Lys Leu Phe Asp Ala Asp Phe Val Leu
435 440 445
Glu Lys Ser Leu Lys Lys Asn Asp Ala Val Val Ala Ile Met Lys Asp
450 455 460
Leu Leu Asp Ser Val Lys Ser Phe Glu Asn Tyr Ile Lys Ala Phe Phe
465 470 475 480
Gly Glu Gly Lys Glu Thr Asn Arg Asp Glu Ser Phe Tyr Gly Asp Phe
485 490 495
Val Leu Ala Tyr Asp Ile Leu Leu Lys Val Asp His Ile Tyr Asp Ala
500 505 510
Ile Arg Asn Tyr Val Thr Gln Lys Pro Tyr Ser Lys Asp Lys Phe Lys
515 520 525
Leu Tyr Phe Gln Asn Pro Gln Phe Met Gly Gly Trp Asp Lys Asp Lys
530 535 540
Glu Thr Asp Tyr Arg Ala Thr Ile Leu Arg Tyr Gly Ser Lys Tyr Tyr
545 550 555 560
Leu Ala Ile Met Asp Lys Lys Tyr Ala Lys Cys Leu Gln Lys Ile Asp
565 570 575
Lys Asp Asp Val Asn Gly Asn Tyr Glu Lys Ile Asn Tyr Lys Leu Leu
580 585 590
Pro Gly Pro Asn Lys Met Leu Pro Lys Val Phe Phe Ser Lys Lys Trp
595 600 605
Met Ala Tyr Tyr Asn Pro Ser Glu Asp Ile Gln Lys Ile Tyr Lys Asn
610 615 620
Gly Thr Phe Lys Lys Gly Asp Met Phe Asn Leu Asn Asp Cys His Lys
625 630 635 640
Leu Ile Asp Phe Phe Lys Asp Ser Ile Ser Arg Tyr Pro Lys Trp Ser
645 650 655
Asn Ala Tyr Asp Phe Asn Phe Ser Glu Thr Glu Lys Tyr Lys Asp Ile
660 665 670
Ala Gly Phe Tyr Arg Glu Val Glu Glu Gln Gly Tyr Lys Val Ser Phe
675 680 685
Glu Ser Ala Ser Lys Lys Glu Val Asp Lys Leu Val Glu Glu Gly Lys
690 695 700
Leu Tyr Met Phe Gln Ile Tyr Asn Lys Asp Phe Ser Asp Lys Ser His
705 710 715 720
Gly Thr Pro Asn Leu His Thr Met Tyr Phe Lys Leu Leu Phe Asp Glu
725 730 735
Asn Asn His Gly Gln Ile Arg Leu Ser Gly Gly Ala Glu Leu Phe Met
740 745 750
Arg Arg Ala Ser Leu Lys Lys Glu Glu Leu Val Val His Pro Ala Asn
755 760 765
Ser Pro Ile Ala Asn Lys Asn Pro Asp Asn Pro Lys Lys Thr Thr Thr
770 775 780
Leu Ser Tyr Asp Val Tyr Lys Asp Lys Arg Phe Ser Glu Asp Gln Tyr
785 790 795 800
Glu Leu His Ile Pro Ile Ala Ile Asn Lys Cys Pro Lys Asn Ile Phe
805 810 815
Lys Ile Asn Thr Glu Val Arg Val Leu Leu Lys His Asp Asp Asn Pro
820 825 830
Tyr Val Ile Gly Ile Asp Arg Gly Glu Arg Asn Leu Leu Tyr Ile Val
835 840 845
Val Val Asp Gly Lys Gly Asn Ile Val Glu Gln Tyr Ser Leu Asn Glu
850 855 860
Ile Ile Asn Asn Phe Asn Gly Ile Arg Ile Lys Thr Asp Tyr His Ser
865 870 875 880
Leu Leu Asp Lys Lys Glu Lys Glu Arg Phe Glu Ala Arg Gln Asn Trp
885 890 895
Thr Ser Ile Glu Asn Ile Lys Glu Leu Lys Ala Gly Tyr Ile Ser Gln
900 905 910
Val Val His Lys Ile Cys Glu Leu Val Glu Lys Tyr Asp Ala Val Ile
915 920 925
Ala Leu Glu Asp Leu Asn Ser Gly Phe Lys Asn Ser Arg Val Lys Val
930 935 940
Glu Lys Gln Val Tyr Gln Lys Phe Glu Lys Met Leu Ile Asp Lys Leu
945 950 955 960
Asn Tyr Met Val Asp Lys Lys Ser Asn Pro Cys Ala Thr Gly Gly Ala
965 970 975
Leu Lys Gly Tyr Gln Ile Thr Asn Lys Phe Glu Ser Phe Lys Ser Met
980 985 990
Ser Thr Gln Asn Gly Phe Ile Phe Tyr Ile Pro Ala Trp Leu Thr Ser
995 1000 1005
Lys Ile Asp Pro Ser Thr Gly Phe Val Asn Leu Leu Lys Thr Lys
1010 1015 1020
Tyr Thr Ser Ile Ala Asp Ser Lys Lys Phe Ile Ser Ser Phe Asp
1025 1030 1035
Arg Ile Met Tyr Val Pro Glu Glu Asp Leu Phe Glu Phe Ala Leu
1040 1045 1050
Asp Tyr Lys Asn Phe Ser Arg Thr Asp Ala Asp Tyr Ile Lys Lys
1055 1060 1065
Trp Lys Leu Tyr Ser Tyr Gly Asn Arg Ile Arg Ile Phe Arg Asn
1070 1075 1080
Pro Lys Lys Asn Asn Val Phe Asp Trp Glu Glu Val Cys Leu Thr
1085 1090 1095
Ser Ala Tyr Lys Glu Leu Phe Asn Lys Tyr Gly Ile Asn Tyr Gln
1100 1105 1110
Gln Gly Asp Ile Arg Ala Leu Leu Cys Glu Gln Ser Asp Lys Ala
1115 1120 1125
Phe Tyr Ser Ser Phe Met Ala Leu Met Ser Leu Met Leu Gln Met
1130 1135 1140
Arg Asn Ser Ile Thr Gly Arg Thr Asp Val Asp Phe Leu Ile Ser
1145 1150 1155
Pro Val Lys Asn Ser Asp Gly Ile Phe Tyr Asp Ser Arg Asn Tyr
1160 1165 1170
Glu Ala Gln Glu Asn Ala Ile Leu Pro Lys Asn Ala Asp Ala Asn
1175 1180 1185
Gly Ala Tyr Asn Ile Ala Arg Lys Val Leu Trp Ala Ile Gly Gln
1190 1195 1200
Phe Lys Lys Ala Glu Asp Glu Lys Leu Asp Lys Val Lys Ile Ala
1205 1210 1215
Ile Ser Asn Lys Glu Trp Leu Glu Tyr Ala Gln Thr Ser Val Lys
1220 1225 1230
His Ala Ala Ala Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Arg
1235 1240 1245
Ser Gly Gly Tyr Val Asn Ile Lys Thr Phe Thr His Pro Ala Gly
1250 1255 1260
Glu Gly Lys Glu Val Lys Gly Met Glu Val Ser Val Pro Phe Glu
1265 1270 1275
Ile Tyr Ser Asn Glu His Arg Ile Ala Asp Ala His Tyr Gln Thr
1280 1285 1290
Phe Pro Ser Glu Lys Ala Ala Tyr Thr Thr Val Val Thr Asp Ala
1295 1300 1305
Ala Asp Trp Arg Thr Lys Asn Ala Ala Met Phe Thr Pro Thr Pro
1310 1315 1320
Val Ser Gly Leu Glu His His His His His His
1325 1330
<210> 18
<211> 742
<212> PRT
<213> 人工序列
<220>
<223> 合成的: Cre-Hoc
<400> 18
Met Ser Asn Leu Leu Thr Val His Gln Asn Leu Pro Ala Leu Pro Val
1 5 10 15
Asp Ala Thr Ser Asp Glu Val Arg Lys Asn Leu Met Asp Met Phe Arg
20 25 30
Asp Arg Gln Ala Phe Ser Glu His Thr Trp Lys Met Leu Leu Ser Val
35 40 45
Cys Arg Ser Trp Ala Ala Trp Cys Lys Leu Asn Asn Arg Lys Trp Phe
50 55 60
Pro Ala Glu Pro Glu Asp Val Arg Asp Tyr Leu Leu Tyr Leu Gln Ala
65 70 75 80
Arg Gly Leu Ala Val Lys Thr Ile Gln Gln His Leu Gly Gln Leu Asn
85 90 95
Met Leu His Arg Arg Ser Gly Leu Pro Arg Pro Ser Asp Ser Asn Ala
100 105 110
Val Ser Leu Val Met Arg Arg Ile Arg Lys Glu Asn Val Asp Ala Gly
115 120 125
Glu Arg Ala Lys Gln Ala Leu Ala Phe Glu Arg Thr Asp Phe Asp Gln
130 135 140
Val Arg Ser Leu Met Glu Asn Ser Asp Arg Cys Gln Asp Ile Arg Asn
145 150 155 160
Leu Ala Phe Leu Gly Ile Ala Tyr Asn Thr Leu Leu Arg Ile Ala Glu
165 170 175
Ile Ala Arg Ile Arg Val Lys Asp Ile Ser Arg Thr Asp Gly Gly Arg
180 185 190
Met Leu Ile His Ile Gly Arg Thr Lys Thr Leu Val Ser Thr Ala Gly
195 200 205
Val Glu Lys Ala Leu Ser Leu Gly Val Thr Lys Leu Val Glu Arg Trp
210 215 220
Ile Ser Val Ser Gly Val Ala Asp Asp Pro Asn Asn Tyr Leu Phe Cys
225 230 235 240
Arg Val Arg Lys Asn Gly Val Ala Ala Pro Ser Ala Thr Ser Gln Leu
245 250 255
Ser Thr Arg Ala Leu Glu Gly Ile Phe Glu Ala Thr His Arg Leu Ile
260 265 270
Tyr Gly Ala Lys Asp Asp Ser Gly Gln Arg Tyr Leu Ala Trp Ser Gly
275 280 285
His Ser Ala Arg Val Gly Ala Ala Arg Asp Met Ala Arg Ala Gly Val
290 295 300
Ser Ile Pro Glu Ile Met Gln Ala Gly Gly Trp Thr Asn Val Asn Ile
305 310 315 320
Val Met Asn Tyr Ile Arg Asn Leu Asp Ser Glu Thr Gly Ala Met Val
325 330 335
Arg Leu Leu Glu Asp Gly Asp Gly Gly Ser Glu Phe Gly Gly Ser Gly
340 345 350
Gly Ser Gly Gly Ser Gly Gly Ser Phe Thr Val Asp Ile Thr Pro Lys
355 360 365
Thr Pro Thr Gly Val Ile Asp Glu Thr Lys Gln Phe Thr Ala Thr Pro
370 375 380
Ser Gly Gln Thr Gly Gly Gly Thr Ile Thr Tyr Ala Trp Ser Val Asp
385 390 395 400
Asn Val Pro Gln Asp Gly Ala Glu Ala Thr Phe Ser Tyr Val Leu Lys
405 410 415
Gly Pro Ala Gly Gln Lys Thr Ile Lys Val Val Ala Thr Asn Thr Leu
420 425 430
Ser Glu Gly Gly Pro Glu Thr Ala Glu Ala Thr Thr Thr Ile Thr Val
435 440 445
Lys Asn Lys Thr Gln Thr Thr Thr Leu Ala Val Thr Pro Ala Ser Pro
450 455 460
Ala Ala Gly Val Ile Gly Thr Pro Val Gln Phe Thr Ala Ala Leu Ala
465 470 475 480
Ser Gln Pro Asp Gly Ala Ser Ala Thr Tyr Gln Trp Tyr Val Asp Asp
485 490 495
Ser Gln Val Gly Gly Glu Thr Asn Ser Thr Phe Ser Tyr Thr Pro Thr
500 505 510
Thr Ser Gly Val Lys Arg Ile Lys Cys Val Ala Gln Val Thr Ala Thr
515 520 525
Asp Tyr Asp Ala Leu Ser Val Thr Ser Asn Glu Val Ser Leu Thr Val
530 535 540
Asn Lys Lys Thr Met Asn Pro Gln Val Thr Leu Thr Pro Pro Ser Ile
545 550 555 560
Asn Val Gln Gln Asp Ala Ser Ala Thr Phe Thr Ala Asn Val Thr Gly
565 570 575
Ala Pro Glu Glu Ala Gln Ile Thr Tyr Ser Trp Lys Lys Asp Ser Ser
580 585 590
Pro Val Glu Gly Ser Thr Asn Val Tyr Thr Val Asp Thr Ser Ser Val
595 600 605
Gly Ser Gln Thr Ile Glu Val Thr Ala Thr Val Thr Ala Ala Asp Tyr
610 615 620
Asn Pro Val Thr Val Thr Lys Thr Gly Asn Val Thr Val Thr Ala Lys
625 630 635 640
Val Ala Pro Glu Pro Glu Gly Glu Leu Pro Tyr Val His Pro Leu Pro
645 650 655
His Arg Ser Ser Ala Tyr Ile Trp Cys Gly Trp Trp Val Met Asp Glu
660 665 670
Ile Gln Lys Met Thr Glu Glu Gly Lys Asp Trp Lys Thr Asp Asp Pro
675 680 685
Asp Ser Lys Tyr Tyr Leu His Arg Tyr Thr Leu Gln Lys Met Met Lys
690 695 700
Asp Tyr Pro Glu Val Asp Val Gln Glu Ser Arg Asn Gly Tyr Ile Ile
705 710 715 720
His Lys Thr Ala Leu Glu Thr Gly Ile Ile Tyr Thr Tyr Pro Gly Ser
725 730 735
His His His His His His
740
<210> 19
<211> 400
<212> PRT
<213> 人工序列
<220>
<223> 合成的: RGD-Hoc
<400> 19
Cys Asp Cys Arg Gly Asp Cys Phe Cys Ser Ala Met Thr Phe Thr Val
1 5 10 15
Asp Ile Thr Pro Lys Thr Pro Thr Gly Val Ile Asp Glu Thr Lys Gln
20 25 30
Phe Thr Ala Thr Pro Ser Gly Gln Thr Gly Gly Gly Thr Ile Thr Tyr
35 40 45
Ala Trp Ser Val Asp Asn Val Pro Gln Asp Gly Ala Glu Ala Thr Phe
50 55 60
Ser Tyr Val Leu Lys Gly Pro Ala Gly Gln Lys Thr Ile Lys Val Val
65 70 75 80
Ala Thr Asn Thr Leu Ser Glu Gly Gly Pro Glu Thr Ala Glu Ala Thr
85 90 95
Thr Thr Ile Thr Val Lys Asn Lys Thr Gln Thr Thr Thr Leu Ala Val
100 105 110
Thr Pro Ala Ser Pro Ala Ala Gly Val Ile Gly Thr Pro Val Gln Phe
115 120 125
Thr Ala Ala Leu Ala Ser Gln Pro Asp Gly Ala Ser Ala Thr Tyr Gln
130 135 140
Trp Tyr Val Asp Asp Ser Gln Val Gly Gly Glu Thr Asn Ser Thr Phe
145 150 155 160
Ser Tyr Thr Pro Thr Thr Ser Gly Val Lys Arg Ile Lys Cys Val Ala
165 170 175
Gln Val Thr Ala Thr Asp Tyr Asp Ala Leu Ser Val Thr Ser Asn Glu
180 185 190
Val Ser Leu Thr Val Asn Lys Lys Thr Met Asn Pro Gln Val Thr Leu
195 200 205
Thr Pro Pro Ser Ile Asn Val Gln Gln Asp Ala Ser Ala Thr Phe Thr
210 215 220
Ala Asn Val Thr Gly Ala Pro Glu Glu Ala Gln Ile Thr Tyr Ser Trp
225 230 235 240
Lys Lys Asp Ser Ser Pro Val Glu Gly Ser Thr Asn Val Tyr Thr Val
245 250 255
Asp Thr Ser Ser Val Gly Ser Gln Thr Ile Glu Val Thr Ala Thr Val
260 265 270
Thr Ala Ala Asp Tyr Asn Pro Val Thr Val Thr Lys Thr Gly Asn Val
275 280 285
Thr Val Thr Ala Lys Val Ala Pro Glu Pro Glu Gly Glu Leu Pro Tyr
290 295 300
Val His Pro Leu Pro His Arg Ser Ser Ala Tyr Ile Trp Cys Gly Trp
305 310 315 320
Trp Val Met Asp Glu Ile Gln Lys Met Thr Glu Glu Gly Lys Asp Trp
325 330 335
Lys Thr Asp Asp Pro Asp Ser Lys Tyr Tyr Leu His Arg Tyr Thr Leu
340 345 350
Gln Lys Met Met Lys Asp Tyr Pro Glu Val Asp Val Gln Glu Ser Arg
355 360 365
Asn Gly Tyr Ile Ile His Lys Thr Ala Leu Glu Thr Gly Ile Ile Tyr
370 375 380
Thr Tyr Pro Lys Leu Ala Ala Ala Leu Glu His His His His His His
385 390 395 400
<210> 20
<211> 90
<212> PRT
<213> 人工序列
<220>
<223> 合成的: CTS-LacI-NLS
<400> 20
Met Lys Thr Tyr Gln Glu Phe Ile Ala Glu Met Lys Tyr Val Thr Leu
1 5 10 15
Tyr Asp Val Ala Glu Tyr Ala Gly Val Ser His Gln Thr Val Ser Arg
20 25 30
Val Val Asn Gln Ala Ser His Val Ser Ala Lys Thr Arg Glu Lys Val
35 40 45
Glu Ala Ala Met Ala Glu Leu Asn Tyr Ile Pro Asn Arg Val Ala Gln
50 55 60
Gln Leu Ala Gly Lys Gln Ser Leu Leu Ile Lys Arg Pro Ala Ala Thr
65 70 75 80
Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
85 90
<210> 21
<211> 6806
<212> DNA
<213> 人工序列
<220>
<223> 合成的: 链霉素抗性质粒DS-SPCas
<400> 21
accaggcacg cctaaccgtc agtgagattg gatgagtgaa cgatattgat cgagaagagc 60
cctgcgcagc cgctgccgtg cctgcaggaa gcaacggccc ggagggtggc gggcaggacg 120
cccgccataa actgccaggc atcaaattaa gcagaaggcc atcctgacgg atggcctttt 180
tgcgtttcta caaactctgc tagcttctag agcacagcta acaccacgtc gtccctatct 240
gctgccctag gtctatgagt ggttgctgga taactttacg ggcatgcata aggctcgtat 300
gatatattca gggagaccac aacggtttcc ctctacaaat aattttgttt aacttttact 360
agaggaggag gcaaaaatgg ataagaaata ctcaataggc ttagatatcg gcacaaatag 420
cgtcggatgg gcggtgatca ctgatgaata taaggttccg tctaaaaagt tcaaggttct 480
gggaaataca gaccgccaca gtatcaaaaa aaatcttata ggggctcttt tatttgacag 540
tggagagaca gcggaagcga ctcgtctcaa acggacagct cgtagaaggt atacacgtcg 600
gaagaatcgt atttgttatc tacaggagat tttttcaaat gagatggcga aagtagatga 660
tagtttcttt catcgacttg aagagtcttt tttggtggaa gaagacaaga agcatgaacg 720
tcatcctatt tttggaaata tagtagatga agttgcttat catgagaaat atccaactat 780
ctatcatctg cgaaaaaaat tggtagattc tactgataaa gcggatttgc gcttaatcta 840
tttggcctta gcgcatatga ttaagtttcg tggtcatttt ttgattgagg gagatttaaa 900
tcctgataat agtgatgtgg acaaactatt tatccagttg gtacaaacct acaatcaatt 960
atttgaagaa aaccctatta acgcaagtgg agtagatgct aaagcgattc tttctgcacg 1020
attgagtaaa tcaagacgat tagaaaatct cattgctcag ctccccggtg agaagaaaaa 1080
tggcttattt gggaatctca ttgctttgtc attgggtttg acccctaatt ttaaatcaaa 1140
ttttgatttg gcagaagatg ctaaattaca gctttcaaaa gatacttacg atgatgattt 1200
agataattta ttggcgcaaa ttggagatca atatgctgat ttgtttttgg cagctaagaa 1260
tttatcagat gctattttac tttcagatat cctaagagta aatactgaaa taactaaggc 1320
tcccctatca gcttcaatga ttaaacgcta cgatgaacat catcaagact tgactctttt 1380
aaaagcttta gttcgacaac aacttccaga aaagtataaa gaaatctttt ttgatcaatc 1440
aaaaaacgga tatgcaggtt atattgatgg gggagctagc caagaagaat tttataaatt 1500
tatcaaacca attttagaaa aaatggatgg tactgaggaa ttattggtga aactaaatcg 1560
tgaagatttg ctgcgcaagc aacggacctt tgacaacggc tctattcccc atcaaattca 1620
cttgggtgag ctgcatgcta ttttgagaag acaagaagac ttttatccat ttttaaaaga 1680
caatcgtgag aagattgaaa aaatcttgac ttttcgaatt ccttattatg ttggtccatt 1740
ggcgcgtggc aatagtcgtt ttgcatggat gactcggaag tctgaagaaa caattacccc 1800
atggaatttt gaagaagttg tcgataaagg tgcttcagct caatcattta ttgaacgcat 1860
gacaaacttt gataaaaatc ttccaaatga aaaagtacta ccaaaacata gtttgcttta 1920
tgagtatttt acggtttata acgaattgac aaaggtcaaa tatgttactg aaggaatgcg 1980
aaaaccagca tttctttcag gtgaacagaa gaaagccatt gttgatttac tcttcaaaac 2040
aaatcgaaaa gtaaccgtta agcaattaaa agaagattat ttcaaaaaaa tagaatgttt 2100
tgatagtgtt gaaatttcag gagttgaaga tagatttaat gcttcattag gtacctacca 2160
tgatttgcta aaaattatta aagataaaga ttttttggat aatgaagaaa atgaagatat 2220
cttagaggat attgttttaa cattgacctt atttgaagat agggagatga ttgaggaaag 2280
acttaaaaca tatgctcacc tctttgatga taaggtgatg aaacagctta aacgtcgccg 2340
ttatactggt tggggacgtt tgtctcgaaa attgattaat ggtattaggg ataagcaatc 2400
tggcaaaaca atattagatt ttttgaaatc agatggtttt gccaatcgca attttatgca 2460
gctgatccat gatgatagtt tgacatttaa agaagacatt caaaaagcac aagtgtctgg 2520
acaaggcgat agtttacatg aacatattgc aaatttagct ggtagccctg ctattaaaaa 2580
aggtatttta cagactgtaa aagttgttga tgaattggtc aaagtaatgg ggcggcataa 2640
gccagaaaat atcgttattg aaatggcacg tgaaaatcag acaactcaaa agggccagaa 2700
aaattcgcga gagcgtatga aacgaatcga agaaggtatc aaagaattag gaagtcagat 2760
tcttaaagag catcctgttg aaaatactca attgcaaaat gaaaagctct atctctatta 2820
tctccaaaat ggaagagaca tgtatgtgga ccaagaatta gatattaatc gtttaagtga 2880
ttatgatgtc gatcacattg ttccacaaag tttccttaaa gacgattcaa tagacaataa 2940
ggtcttaacg cgttctgata aaaatcgtgg taaatcggat aacgttccaa gtgaagaagt 3000
agtcaaaaag atgaaaaact attggagaca acttctaaac gccaagttaa tcactcaacg 3060
taagtttgat aatttaacga aagctgaacg tggaggtttg agtgaacttg ataaagctgg 3120
ttttatcaaa cgccaattgg ttgaaactcg ccaaatcact aagcatgtgg cacaaatttt 3180
ggatagtcgc atgaatacta aatacgatga aaatgataaa cttattcgag aggttaaagt 3240
gattacctta aaatctaaat tagtttctga cttccgaaaa gatttccaat tctataaagt 3300
acgtgagatt aacaattacc atcatgccca tgatgcgtat ctaaatgccg tcgttggaac 3360
tgctttgatt aagaaatatc caaaacttga atcggagttt gtctatggtg attataaagt 3420
ttatgatgtt cgtaaaatga ttgctaagtc tgagcaagaa ataggcaaag caaccgcaaa 3480
atatttcttt tactctaata tcatgaactt cttcaaaaca gaaattacac ttgcaaatgg 3540
agagattcgc aaacgccctc taatcgaaac taatggggaa actggagaaa ttgtctggga 3600
taaagggcga gattttgcca cagtgcgcaa agtattgtcc atgccccaag tcaatattgt 3660
caagaaaaca gaagtacaga caggcggatt ctccaaggag tcaattttac caaaaagaaa 3720
ttcggacaag cttattgctc gtaaaaaaga ctgggatcca aaaaaatatg gtggttttga 3780
tagtccaacg gtagcttatt cagtcctagt ggttgctaag gtggaaaaag ggaaatcgaa 3840
gaagttaaaa tccgttaaag agttactagg gatcacaatt atggaaagaa gttcctttga 3900
aaaaaatccg attgactttt tagaagctaa aggatataag gaagttaaaa aagacttaat 3960
cattaaacta cctaaatata gtctttttga gttagaaaac ggtcgtaaac ggatgctggc 4020
tagtgccgga gaattacaaa aaggaaatga gctggctctg ccaagcaaat atgtgaattt 4080
tttatattta gctagtcatt atgaaaagtt gaagggtagt ccagaagata acgaacaaaa 4140
acaattgttt gtggagcagc ataagcatta tttagatgag attattgagc aaatcagtga 4200
attttctaag cgtgttattt tagcagatgc caatttagat aaagttctta gtgcatataa 4260
caaacataga gacaaaccaa tacgtgaaca agcagaaaat attattcatt tatttacgtt 4320
gacgaatctt ggagctcccg ctgcttttaa atattttgat acaacaattg atcgtaaacg 4380
atatacgtct acaaaagaag ttttagatgc cactcttatc catcaatcca tcactggtct 4440
ttatgaaaca cgcattgatt tgagtcagct aggaggtgac tgaccggctg ataaatttct 4500
ttgaatttct ccttgattat ttgttataaa tgttataaaa taatcttgtt ggaaccattc 4560
aaaacagcat agcaagttaa aataaggcta gtccgttatc aacttgaaaa agtggcaccg 4620
agtcggtgct ttttttgata cttctattct actctgactg caaaccaaaa aaacaagcgc 4680
tttcaaaacg cttgttttat catttttagg gaaattaatc tcttaatcct tttatcattc 4740
tacatttagg cgctgccatc ttgggacaat gaaaacgtta gtcatggcgc gccttgacgg 4800
ctagctcagt cctaggtaca gtgctagctt aattagtcta cgaggtttta gagctatgct 4860
gttttgaatg gtcccaaaac ctgcagacaa gcccggccgg cctaaggcga tgccccctcg 4920
acctcgatca gggaggcgtt caggacgact cacaaagaaa gccgggcaat gcccggcttt 4980
ttccacgcct cctgggctga cttcaggtgc tacatttgaa gagataaatt gcactgaaat 5040
ctagagcggt tcagtagaaa agatcaaagg atcttcttga gatccttttt ttctgcgcgt 5100
aatcttttgc cctgtaaacg aaaaaaccac ctggggaggt ggtttgatcg aaggttaagt 5160
cagttgggga actgcttaac cgtggtaact ggctttcgca gagcacagca accaaatctg 5220
tccttccagt gtagccggac tttggcgcac acttcaagag caaccgcgtg tttagctaaa 5280
caaatcctct gcgaactccc agttaccaat ggctgctgcc agtggcgttt taccgtgctt 5340
ttccgggttg gactcaagtg aacagttacc ggataaggcg cagcagtcgg gctgaacggg 5400
gagttcttgc ttacagccca gcttggagcg aacgacctac accgagccga gataccagtg 5460
tgtgagctat gagaaagcgc cacacttccc gtaagggaga aaggcggaac aggtatccgg 5520
taaacggcag ggtcggaaca ggagagcgca agagggagcg acccgccgga aacggtgggg 5580
atctttaagt cctgtcgggt ttcgcccgta ctgtcagatt catggttgag cctcacggct 5640
cccacagatg caccggaaaa gcgtctgttt atgtgaactc tggcaggagg gcggagccta 5700
tggaaaaacg ccaccggcgc ggccctgctg ttttgcctca catgttagtc ccctgcttat 5760
ccacggaatc tgtgggtaac tttgtatgtg tccgcagcgc ccgccgcagt ctcacgcccg 5820
gagcgtagcg accgagtgag ctagctattt gtttattttt ctaaatacat tcaaatatgt 5880
atccgctcat gagacaataa ccctgataaa tgcttcaata atattgaaaa aggaagagta 5940
tgagggaagc ggtgatcgcc gaagtatcga ctcaactatc agaggtagtt ggcgtcatcg 6000
agcgccatct cgaaccgacg ttgctggccg tacatttgta cggctccgca gtggatggcg 6060
gcctgaagcc acacagtgat attgatttgc tggttacggt gaccgtaagg cttgatgaaa 6120
caacgcggcg agctttgatc aacgaccttt tggaaacttc ggcttcccct ggagagagcg 6180
agattctccg cgctgtagaa gtcaccattg ttgtgcacga cgacatcatt ccgtggcgtt 6240
atccagctaa gcgcgaactg caatttggag aatggcagcg caatgacatt cttgcaggta 6300
tcttcgagcc agccacgatc gacattgatc tggctatctt gctgacaaaa gcaagagaac 6360
atagcgttgc cttggtaggt ccagcggcgg aggaactctt tgatccggtt cctgaacagg 6420
atctatttga ggcgctaaat gaaaccttaa cgctatggaa ctcgccgccc gactgggctg 6480
gcgatgagcg aaatgtagtg cttacgttgt cccgcatttg gtacagcgca gtaaccggca 6540
aaatcgcgcc gaaggatgtc gctgccgact gggcaatgga gcgcctgccg gcccagtatc 6600
agcccgtcat acttgaagct agacaggctt atcttggaca agaagaagat cgcttggcct 6660
cgcgcgcaga tcagttggaa gaatttgtcc actacgtgaa aggcgagatc accaaggtag 6720
tcggcaaata atgtctaaca attcgttcaa gccgaggggc cgcaagatcc ggccacgatg 6780
acccggtcgt cggttcaggg cagggt 6806
<210> 22
<211> 445
<212> PRT
<213> 人工序列
<220>
<223> 合成的: Cre-Soc
<400> 22
Met Ser Asn Leu Leu Thr Val His Gln Asn Leu Pro Ala Leu Pro Val
1 5 10 15
Asp Ala Thr Ser Asp Glu Val Arg Lys Asn Leu Met Asp Met Phe Arg
20 25 30
Asp Arg Gln Ala Phe Ser Glu His Thr Trp Lys Met Leu Leu Ser Val
35 40 45
Cys Arg Ser Trp Ala Ala Trp Cys Lys Leu Asn Asn Arg Lys Trp Phe
50 55 60
Pro Ala Glu Pro Glu Asp Val Arg Asp Tyr Leu Leu Tyr Leu Gln Ala
65 70 75 80
Arg Gly Leu Ala Val Lys Thr Ile Gln Gln His Leu Gly Gln Leu Asn
85 90 95
Met Leu His Arg Arg Ser Gly Leu Pro Arg Pro Ser Asp Ser Asn Ala
100 105 110
Val Ser Leu Val Met Arg Arg Ile Arg Lys Glu Asn Val Asp Ala Gly
115 120 125
Glu Arg Ala Lys Gln Ala Leu Ala Phe Glu Arg Thr Asp Phe Asp Gln
130 135 140
Val Arg Ser Leu Met Glu Asn Ser Asp Arg Cys Gln Asp Ile Arg Asn
145 150 155 160
Leu Ala Phe Leu Gly Ile Ala Tyr Asn Thr Leu Leu Arg Ile Ala Glu
165 170 175
Ile Ala Arg Ile Arg Val Lys Asp Ile Ser Arg Thr Asp Gly Gly Arg
180 185 190
Met Leu Ile His Ile Gly Arg Thr Lys Thr Leu Val Ser Thr Ala Gly
195 200 205
Val Glu Lys Ala Leu Ser Leu Gly Val Thr Lys Leu Val Glu Arg Trp
210 215 220
Ile Ser Val Ser Gly Val Ala Asp Asp Pro Asn Asn Tyr Leu Phe Cys
225 230 235 240
Arg Val Arg Lys Asn Gly Val Ala Ala Pro Ser Ala Thr Ser Gln Leu
245 250 255
Ser Thr Arg Ala Leu Glu Gly Ile Phe Glu Ala Thr His Arg Leu Ile
260 265 270
Tyr Gly Ala Lys Asp Asp Ser Gly Gln Arg Tyr Leu Ala Trp Ser Gly
275 280 285
His Ser Ala Arg Val Gly Ala Ala Arg Asp Met Ala Arg Ala Gly Val
290 295 300
Ser Ile Pro Glu Ile Met Gln Ala Gly Gly Trp Thr Asn Val Asn Ile
305 310 315 320
Val Met Asn Tyr Ile Arg Asn Leu Asp Ser Glu Thr Gly Ala Met Val
325 330 335
Arg Leu Leu Glu Asp Gly Asp Gly Gly Ser Glu Phe Gly Gly Ser Gly
340 345 350
Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Tyr Val Asn Ile Lys Thr
355 360 365
Phe Thr His Pro Ala Gly Glu Gly Lys Glu Val Lys Gly Met Glu Val
370 375 380
Ser Val Pro Phe Glu Ile Tyr Ser Asn Glu His Arg Ile Ala Asp Ala
385 390 395 400
His Tyr Gln Thr Phe Pro Ser Glu Lys Ala Ala Tyr Thr Thr Val Val
405 410 415
Thr Asp Ala Ala Asp Trp Arg Thr Lys Asn Ala Ala Met Phe Thr Pro
420 425 430
Thr Pro Val Ser Gly Gly Ser His His His His His His
435 440 445

Claims (3)

1.一种基于CRISPR的对具有基因组修饰能力的人工病毒(AV)进行编程的方法,所述方法包括:
通过使野生型T4噬菌体中缺失ipI和ipII基因来产生“受体”噬菌体;
用含有靶蛋白的基因的质粒和表达Cas9或Cpf1的间隔子质粒以及CRISPR RNA来产生宿主细菌细胞,所述CRISPR RNA对应于所述受体噬菌体所缺失区域中的原间隔序列;
用所述“受体”噬菌体感染所述宿主细菌细胞;
从所述宿主细菌细胞回收工程化的“受体”噬菌体;
从经工程化的“受体”噬菌体获得空的经工程化的T4衣壳;
将至少一种DNA包装在经工程化的T4衣壳中,
其中,所述靶蛋白的基因在C-末端侧翼接有衣壳靶向序列(CTS)并且在N-末端侧接有核定位序列(NLS),以形成CTS-基因-NLS序列。
2.根据权利要求1所述的方法,包括:
用权利要求1中的人工病毒(AV)感染动物细胞,
其中,所述人工病毒(AV)包括至少一种病毒载体;至少一种治疗性分子;和脂质包衣,
其中,所述治疗性分子的至少一种具有基因修饰或基因沉默活性。
3.根据权利要求1所述的方法,所述方法进一步包括:通过选自由Hoc和Soc组成的组中的至少一种蛋白,在经工程化的T4衣壳外展示至少一种治疗性分子,
其中,所述至少一种治疗性分子选自由蛋白,及蛋白-核酸复合物组成的组。
CN202180065944.5A 2020-07-29 2021-07-21 用于人类基因组重塑的基于噬菌体的人工病毒设计 Active CN116323944B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US202063058012P 2020-07-29 2020-07-29
US63/058,012 2020-07-29
US17/359,711 US11401530B2 (en) 2019-08-19 2021-06-28 Bacteriophage-based artificial viruses for human genome remodeling
US17/359,711 2021-06-28
PCT/IB2021/056248 WO2022023850A1 (en) 2020-07-29 2021-07-21 Design of bacteriophage-based artificial viruses for human genome remodeling

Publications (2)

Publication Number Publication Date
CN116323944A CN116323944A (zh) 2023-06-23
CN116323944B true CN116323944B (zh) 2023-12-05

Family

ID=80004157

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180065944.5A Active CN116323944B (zh) 2020-07-29 2021-07-21 用于人类基因组重塑的基于噬菌体的人工病毒设计

Country Status (7)

Country Link
EP (2) EP4189096A1 (zh)
JP (2) JP2023537296A (zh)
CN (1) CN116323944B (zh)
CA (1) CA3187240A1 (zh)
GB (2) GB202400771D0 (zh)
MX (1) MX2023001164A (zh)
WO (1) WO2022023850A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114934059B (zh) * 2022-03-04 2023-02-21 深圳先进技术研究院 高通量简化噬菌体基因组骨架的方法
US20230355738A1 (en) * 2022-04-26 2023-11-09 The Catholic University Of America Bacteriophage-based, needle and adjuvant-free, mucosal covid-19 vaccine

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014135998A1 (en) * 2013-03-08 2014-09-12 The Catholic University Of America In vitro and in vivo delivery of genes and proteins using the bacteriophage t4 dna packaging machine
WO2018191750A2 (en) * 2017-04-14 2018-10-18 The Broad Institute Inc. Novel delivery of large payloads

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014135998A1 (en) * 2013-03-08 2014-09-12 The Catholic University Of America In vitro and in vivo delivery of genes and proteins using the bacteriophage t4 dna packaging machine
WO2018191750A2 (en) * 2017-04-14 2018-10-18 The Broad Institute Inc. Novel delivery of large payloads

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Lipid nanoparticle-mediated efficient delivery of CRISPR/Cas9 for tumor therapy;Lingmin Zhang等;NPG Asia Materials;第9卷(第10期);全文 *

Also Published As

Publication number Publication date
GB202301200D0 (en) 2023-03-15
EP4189096A1 (en) 2023-06-07
GB2612491A (en) 2023-05-03
JP2024037973A (ja) 2024-03-19
WO2022023850A1 (en) 2022-02-03
JP2023537296A (ja) 2023-08-31
GB202400771D0 (en) 2024-03-06
CN116323944A (zh) 2023-06-23
MX2023001164A (es) 2023-09-15
EP4371564A2 (en) 2024-05-22
CA3187240A1 (en) 2022-02-03

Similar Documents

Publication Publication Date Title
US9523101B2 (en) Protein and nucleic acid delivery vehicles, components and mechanisms thereof
CN116323944B (zh) 用于人类基因组重塑的基于噬菌体的人工病毒设计
US9163262B2 (en) In vitro and in vivo delivery of genes and proteins using the bacteriophage T4 DNA packaging machine
US10799542B2 (en) Tetrafunctional bacteriophage
Zhu et al. Design of bacteriophage T4-based artificial viral vectors for human genome remodeling
US8557744B2 (en) Membrane-translocating peptides
US11401530B2 (en) Bacteriophage-based artificial viruses for human genome remodeling
US11155835B2 (en) Prokaryotic-eukaryotic hybrid viral vector for delivery of large cargos of genes and proteins into human cells
US20220184205A1 (en) Universal bacteriophage t4 nanoparticle platform to design multiplex sars-cov-2 vaccine candidates by crispr engineering
Chang Scaffolding-Mediated Capsid Size Determination In Bacteriophages

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant