TW202346583A - Rna引導核酸酶、其活性片段與變體,及使用方法 - Google Patents

Rna引導核酸酶、其活性片段與變體,及使用方法 Download PDF

Info

Publication number
TW202346583A
TW202346583A TW112103115A TW112103115A TW202346583A TW 202346583 A TW202346583 A TW 202346583A TW 112103115 A TW112103115 A TW 112103115A TW 112103115 A TW112103115 A TW 112103115A TW 202346583 A TW202346583 A TW 202346583A
Authority
TW
Taiwan
Prior art keywords
sequence
seq
sequence identity
rgn
tracrrna
Prior art date
Application number
TW112103115A
Other languages
English (en)
Inventor
貢詹 H 艾莉亞
麥可 柯伊雷
亞歷山卓 布萊勒 克羅雷
泰德 D 艾力奇
何塞 S 派克
Original Assignee
美商生命編輯治療學公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 美商生命編輯治療學公司 filed Critical 美商生命編輯治療學公司
Publication of TW202346583A publication Critical patent/TW202346583A/zh

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P21/00Drugs for disorders of the muscular or neuromuscular system
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P25/00Drugs for disorders of the nervous system
    • A61P25/28Drugs for disorders of the nervous system for treating neurodegenerative disorders of the central nervous system, e.g. nootropic agents, cognition enhancers, drugs for treating Alzheimer's disease or other forms of dementia
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P3/00Drugs for disorders of the metabolism
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P7/00Drugs for disorders of the blood or the extracellular fluid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Organic Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Biomedical Technology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Pharmacology & Pharmacy (AREA)
  • General Chemical & Material Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Veterinary Medicine (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Public Health (AREA)
  • Animal Behavior & Ethology (AREA)
  • Neurology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Diabetes (AREA)
  • Hematology (AREA)
  • Neurosurgery (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Orthopedic Medicine & Surgery (AREA)
  • Physics & Mathematics (AREA)
  • Hospice & Palliative Care (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Psychiatry (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Physical Education & Sports Medicine (AREA)
  • Obesity (AREA)
  • Peptides Or Proteins (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

提供用於與所關注的標的序列結合的組成物及方法。組成物可以用於切割或修飾所關注的標的序列、所關注的標的序列的可視化、以及修飾所關注的標的序列的表現。組成物包括RNA引導的核酸酶(RGN)多肽、CRISPR RNA、轉錄活化的CRISPR RNA、引導 RNA及編碼該RNA引導的核酸酶(RGN)多肽、CRISPR RNA、轉錄活化的CRISPR RNA、引導 RNA的核酸分子。亦提供包含核酸分子的宿主細胞及載體。另提供用於結合所關注的標的序列的RGN系統,其中RGN系統包括RNA引導的核酸酶多肽及一或更多引導RNA。

Description

RNA引導核酸酶、其活性片段與變體,及使用方法
相關申請案之交叉引用
本申請案主張2022年1月24日提出的第63/302,271號美國臨時申請案、及2022年12月5日提出的第63/386,061號美國臨時申請案的優先權,每一個專利申請案藉由引用完全地併入本文中。 對作為 XML 文件以電子方式提交的序列表的引用
本申請包含已經由USPTO專利中心以 xml 格式提交並藉由引用以其整體併入本文的。於2023年1月20日創建的該xml副本命名為L103438-1260TW-Seq_List且大小為908 KB。
本發明與分子生物學及基因編輯領域有關。
靶向的基因體編輯或修飾正迅速成為基礎及應用研究的重要工具。最初的方法涉及例如大範圍核酸酶(meganuclease)、鋅指融合蛋白或TALEN之類的工程核酸酶,需要產生具有對每一種特定標的序列專一的工程化、可編程、序列專一的DNA結合域的嵌合核酸酶。RNA引導的核酸酶(例如叢集且規律間隔的短迴文重複序列(CRISPR)-相關(cas)細菌系統的CRISPR-cas蛋白)藉由將核酸酶與引導RNA(引導RNA與特定標的序列專一性雜交)複合而允許靶向專一性序列。相較於為每一個標的序列產生嵌合核酸酶,產生標的專一性引導RNA的成本更低且更有效。這種RNA引導的核酸酶可用於選擇性地經由序列專一性雙股斷裂的引入來編輯基因體,該斷裂經由易錯的非同源末端連接(NHEJ)修復以在特定基因體位置引入突變。替代地,可以經由同源定向修復(homology-directed repair)將異源DNA引入基因體位點。當與去胺酶融合時,RNA引導的核酸酶(RGN)亦可用於鹼基編輯。
提供了用於結合所關注的標的序列的組成物及方法。組成物可用於切割或修飾所關注的標的序列、檢測所關注的標的序列、以及修飾所關注的序列的表現。組成物包括RNA引導的核酸酶(RGN)多肽、CRISPR RNA (crRNA)、轉錄活化的CRISPR RNA(tracrRNA)、引導RNA(gRNA)、編碼該RGN多肽、crRNA、tracrRNA、gRNA的核酸分子、以及包括核酸分子的宿主細胞及載體。還提供了用於結合所關注的標的序列的RGN系統,其中RGN系統包括RNA引導的核酸酶多肽以及一或更多引導RNA。因此,將本文所揭露的方法描述為結合所關注的標的序列,並且在一些實施方式中,切割或修飾所關注的標的序列。所關注的標的序列可例如由於非同源末端連接、引入的供體序列的同源定向修復或鹼基編輯而被修飾。
在第一態樣中,本揭露內容提供一種核酸分子,其包括編碼RNA引導的核酸酶(RGN)多肽的多核苷酸,其中多核苷酸包括編碼RGN多肽的核苷酸序列,RGN多肽包括與SEQ ID NO:1-12中任一者具有至少90%序列一致性的胺基酸序列;其中,當與能夠與標的DNA序列雜交的引導RNA(gRNA)結合時,RGN多肽能夠以RNA引導的序列專一性方式結合標的DNA序列。在一些實施方式中,RGN多肽包括與SEQ ID NO:6具有至少90%序列一致性的胺基酸序列。在上述態樣的一些實施方式中,RGN多肽包括與SEQ ID NO:1-12中任一者具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的胺基酸序列。在一些實施方式中,RGN多肽包括與SEQ ID NO:6具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的胺基酸序列。
在上述態樣的一些實施方式中,編碼RGN多肽的多核苷酸可操作地連接至與多核苷酸異源的啟動子。
在上述態樣的一些實施方式中,RGN多肽能夠於結合時切割標的DNA序列。
在上述態樣的一些實施方式中,RGN多肽能夠產生雙股斷裂。
在上述態樣的一些實施方式中,RGN多肽能夠產生單股斷裂。
在上述態樣的一些實施方式中,RGN多肽為核酸酶不活化的或為切口酶。
在上述態樣的一些實施方式中,RGN多肽可操作地連接至先導編輯(prime editing)多肽。在一些實施方式中,先導編輯多肽包括DNA聚合酶。在一些實施方式中,先導編輯多肽包括反轉錄酶。在上述態樣的一些實施方式中,RGN多肽可操作地連接至鹼基編輯多肽。在一些實施方式中,鹼基編輯多肽為去胺酶。在一些實施方式中,去胺酶與SEQ ID NO:377-448中任一者的胺基酸序列具有至少90%序列一致性。在上述態樣的一些實施方式中,去胺酶為胞嘧啶去胺酶或腺嘌呤去胺酶。在一些實施方式中,去胺酶與SEQ ID NO:377-448中任一者的胺基酸序列具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
在上述態樣的一些實施方式中,RGN多肽包括一或更多核定位訊號。
在上述態樣的一些實施方式中,RGN多肽針對在真核細胞中的表現而被密碼子最佳化。
在上述態樣的一些實施方式中,標的DNA序列被定位為與前間隔序列鄰近模體(PAM)相鄰。
在另一態樣中,本揭露內容提供一種載體,其包括上文描述的核酸分子。
在上述態樣的一些實施方式中,載體進一步包括編碼能夠與標的DNA序列雜交的gRNA的至少一核苷酸序列。
在上述態樣的一些實施方式中,引導RNA選自由下列所組成的群組:a)包括CRISPR RNA及tracrRNA的引導RNA,CRISPR RNA包括與SEQ ID NO:13具有至少90%序列一致性的CRISPR重複序列,tracrRNA與SEQ ID NO:25具有至少90%序列一致性,其中RGN多肽包括與SEQ ID NO:1具有至少90%序列一致性的胺基酸序列; b) 包括CRISPR RNA及tracrRNA的引導RNA,CRISPR RNA包括與SEQ ID NO:14具有至少90%序列一致性的CRISPR重複序列,tracrRNA與SEQ ID NO:26具有至少90%序列一致性,其中RGN多肽包括與SEQ ID NO:2具有至少90%序列一致性的胺基酸序列;c) 包括CRISPR RNA及tracrRNA的引導RNA,CRISPR RNA包括與SEQ ID NO:15具有至少90%序列一致性的CRISPR重複序列,tracrRNA與SEQ ID NO:27具有至少90%序列一致性,其中RGN多肽包括與SEQ ID NO:3具有至少90%序列一致性的胺基酸序列;d) 包括CRISPR RNA及tracrRNA的引導RNA,CRISPR RNA包括與SEQ ID NO:16具有至少90%序列一致性的CRISPR重複序列,tracrRNA與SEQ ID NO:28具有至少90%序列一致性,其中RGN多肽包括與SEQ ID NO:4具有至少90%序列一致性的胺基酸序列;e) 包括CRISPR RNA及tracrRNA的引導RNA,CRISPR RNA包括與SEQ ID NO:17具有至少90%序列一致性的CRISPR重複序列,tracrRNA與SEQ ID NO:29具有至少90%序列一致性,其中RGN多肽包括與SEQ ID NO:5具有至少90%序列一致性的胺基酸序列;f) 包括CRISPR RNA及tracrRNA的引導RNA,CRISPR RNA包括與SEQ ID NO:18具有至少90%序列一致性的CRISPR重複序列,tracrRNA與SEQ ID NO:30具有至少90%序列一致性,其中RGN多肽包括與SEQ ID NO:6具有至少90%序列一致性的胺基酸序列;g) 包括CRISPR RNA及tracrRNA的引導RNA,CRISPR RNA包括與SEQ ID NO:19具有至少90%序列一致性的CRISPR重複序列,tracrRNA與SEQ ID NO:31具有至少90%序列一致性,其中RGN多肽包括與SEQ ID NO:7具有至少90%序列一致性的胺基酸序列;h) 包括CRISPR RNA及tracrRNA的引導RNA,CRISPR RNA包括與SEQ ID NO:20具有至少90%序列一致性的CRISPR重複序列,tracrRNA與SEQ ID NO:32具有至少90%序列一致性,其中RGN多肽包括與SEQ ID NO:8具有至少90%序列一致性的胺基酸序列;i) 包括CRISPR RNA及tracrRNA的引導RNA,CRISPR RNA包括與SEQ ID NO:21具有至少90%序列一致性的CRISPR重複序列,tracrRNA與SEQ ID NO:33具有至少90%序列一致性,其中RGN多肽包括與SEQ ID NO:9具有至少90%序列一致性的胺基酸序列;j) 包括CRISPR RNA及tracrRNA的引導RNA,CRISPR RNA包括與SEQ ID NO:22具有至少90%序列一致性的CRISPR重複序列,tracrRNA與SEQ ID NO:34具有至少90%序列一致性,其中RGN多肽包括與SEQ ID NO:10具有至少90%序列一致性的胺基酸序列;包括CRISPR RNA及tracrRNA的引導RNA,CRISPR RNA包括與SEQ ID NO:23具有至少90%序列一致性的CRISPR重複序列,tracrRNA與SEQ ID NO:35具有至少90%序列一致性,其中RGN多肽包括與SEQ ID NO:11具有至少90%序列一致性的胺基酸序列;以及l) 包括CRISPR RNA及tracrRNA的引導RNA,CRISPR RNA包括與SEQ ID NO:24具有至少90%序列一致性的CRISPR重複序列,tracrRNA與SEQ ID NO:36具有至少90%序列一致性,其中RGN多肽包括與SEQ ID NO:12具有至少90%序列一致性的胺基酸序列。
在上述態樣的一些實施方式中,引導RNA選自由下列所組成的群組:a)包括CRISPR RNA及tracrRNA的引導RNA,CRISPR RNA包括與SEQ ID NO:13具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的CRISPR重複序列,tracrRNA與SEQ ID NO:25具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性,其中RGN多肽包括與SEQ ID NO:1具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的胺基酸序列; b) 包括CRISPR RNA及tracrRNA的引導RNA,CRISPR RNA包括與SEQ ID NO:14具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的CRISPR重複序列,tracrRNA與SEQ ID NO:26具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性,其中RGN多肽包括與SEQ ID NO:2具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的胺基酸序列;c) 包括CRISPR RNA及tracrRNA的引導RNA,CRISPR RNA包括與SEQ ID NO:15具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的CRISPR重複序列,tracrRNA與SEQ ID NO:27具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性,其中RGN多肽包括與SEQ ID NO:3具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的胺基酸序列;d) 包括CRISPR RNA及tracrRNA的引導RNA,CRISPR RNA包括與SEQ ID NO:16具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的CRISPR重複序列,tracrRNA與SEQ ID NO:28具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性,其中RGN多肽包括與SEQ ID NO:4具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的胺基酸序列;e) 包括CRISPR RNA及tracrRNA的引導RNA,CRISPR RNA包括與SEQ ID NO:17具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的CRISPR重複序列,tracrRNA與SEQ ID NO:29具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性,其中RGN多肽包括與SEQ ID NO:5具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的胺基酸序列;f) 包括CRISPR RNA及tracrRNA的引導RNA,CRISPR RNA包括與SEQ ID NO:18具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的CRISPR重複序列,tracrRNA與SEQ ID NO:30具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性,其中RGN多肽包括與SEQ ID NO:6具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的胺基酸序列;g) 包括CRISPR RNA及tracrRNA的引導RNA,CRISPR RNA包括與SEQ ID NO:19具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的CRISPR重複序列,tracrRNA與SEQ ID NO:31具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性,其中RGN多肽包括與SEQ ID NO:7具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的胺基酸序列;h) 包括CRISPR RNA及tracrRNA的引導RNA,CRISPR RNA包括與SEQ ID NO:20具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的CRISPR重複序列,tracrRNA與SEQ ID NO:32具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性,其中RGN多肽包括與SEQ ID NO:8具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的胺基酸序列;i) 包括CRISPR RNA及tracrRNA的引導RNA,CRISPR RNA包括與SEQ ID NO:21具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的CRISPR重複序列,tracrRNA與SEQ ID NO:33具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性,其中RGN多肽包括與SEQ ID NO:9具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的胺基酸序列;j) 包括CRISPR RNA及tracrRNA的引導RNA,CRISPR RNA包括與SEQ ID NO:22具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的CRISPR重複序列,tracrRNA與SEQ ID NO:34具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性,其中RGN多肽包括與SEQ ID NO:10具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的胺基酸序列;k) 包括CRISPR RNA及tracrRNA的引導RNA,CRISPR RNA包括與SEQ ID NO:23具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的CRISPR重複序列,tracrRNA與SEQ ID NO:35具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性,其中RGN多肽包括與SEQ ID NO:11具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的胺基酸序列;以及l) 包括CRISPR RNA及tracrRNA的引導RNA,CRISPR RNA包括與SEQ ID NO:24具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的CRISPR重複序列,tracrRNA與SEQ ID NO:36具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性,其中RGN多肽包括與SEQ ID NO:12具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的胺基酸序列。
在上述態樣的一些實施方式中,gRNA為單引導RNA。在一些實施方式中,單引導RNA進一步包括延伸,該延伸包括用於先導編輯的編輯模板。
在上述態樣的一些實施方式中,gRNA為雙引導RNA。
在另一態樣中,本揭露內容提供一種細胞,其包括上文描述的核酸分子或上文描述的載體。在又一態樣中,本揭露內容提供一種用於製造RGN多肽的方法,包括:在RGN多肽表現的條件下,培養上文描述的細胞。
在另一態樣中,本揭露內容提供一種用於製造RGN多肽的方法,包括將異源核酸分子引入細胞內,異源核酸分子包括編碼RNA引導的核酸酶(RGN)多肽的核苷酸序列,RGN多肽包括與SEQ ID NO:1-12中任一者具有至少90%序列一致性的胺基酸序列;其中,當與能夠與標的DNA序列雜交的引導RNA(gRNA)結合時,RGN多肽能夠以RNA引導的序列專一性方式結合標的DNA序列;以及在RGN多肽表現的條件下,培養細胞。在一些實施方式中,RGN多肽包括與SEQ ID NO:6具有至少90%序列一致性的胺基酸序列。在一些實施方式中,RGN多肽包括與SEQ ID NO:1-12中任一者具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的胺基酸序列。在一些實施方式中,RGN多肽包括與SEQ ID NO:6具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的胺基酸序列。
在上述態樣的一些實施方式中,該方法進一步包括純化RGN多肽。
在上述態樣的一些實施方式中,細胞進一步表現一或更多引導RNA,該一或更多引導RNA能夠與RGN多肽結合以形成RGN核糖核蛋白錯合物。
在上述態樣的一些實施方式中,該方法進一步包括純化RGN核糖核蛋白錯合物。
在仍是另一態樣中,本揭露內容提供一種RNA引導的核酸酶(RGN)多肽,其中RGN多肽包括與SEQ ID NO:1-12中任一者具有至少90%序列一致性的胺基酸序列,以及其中,當與能夠與DNA分子的標的DNA序列雜交的引導RNA(gRNA)結合時,RGN多肽能夠以RNA引導的序列專一性方式結合標的DNA序列。在一些實施方式中,RGN多肽包括與SEQ ID NO:6具有至少90%序列一致性的胺基酸序列。在一些實施方式中,RGN多肽包括與SEQ ID NO:1-12中任一者具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的胺基酸序列。在一些實施方式中,RGN多肽包括與SEQ ID NO:6具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的胺基酸序列。在上述態樣的一些實施方式中,RGN多肽為分離的RGN多肽。
在上述態樣的一些實施方式中,RGN多肽能夠於結合時切割標的DNA序列。
在上述態樣的一些實施方式中,由RGN多肽的切割產生雙股斷裂。
在上述態樣的一些實施方式中,由RGN多肽的切割產生單股斷裂。
在上述態樣的一些實施方式中,RGN多肽為核酸酶不活化的或為切口酶。
在上述態樣的一些實施方式中,RGN多肽可操作地連接至先導編輯多肽。在一些實施方式中,先導編輯多肽包括DNA聚合酶。在一些實施方式中,先導編輯多肽包括反轉錄酶。
在上述態樣的一些實施方式中,RGN多肽可操作地連接至鹼基編輯多肽。在一些實施方式中,鹼基編輯多肽為去胺酶。在一些實施方式中,去胺酶為胞嘧啶去胺酶或腺嘌呤去胺酶。在一些實施方式中,去胺酶與SEQ ID NO:377-448中任一者的胺基酸序列具有至少90%序列一致性。在一些實施方式中,去胺酶與SEQ ID NO:377-448中任一者的胺基酸序列具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
在上述態樣的一些實施方式中,標的DNA序列被定位為與前間隔序列鄰近模體(PAM)相鄰。
在上述態樣的一些實施方式中,RGN多肽包括一或更多核定位訊號。
在另一態樣中,本揭露內容提供一種核糖核蛋白(RNP)錯合物,其包括上文描述的RGN多肽以及與RGN多肽結合的引導RNA。在一些實施方式中,引導RNA為單引導RNA。在一些實施方式中,單引導RNA包括延伸,該延伸包括用於先導編輯的編輯模板。在又一態樣中,本揭露內容提供一種用於結合DNA分子的標的DNA序列的系統,其中系統包括:a) 能夠與標的DNA序列雜交的一或更多引導RNA、或包括編碼一或更多引導RNA(gRNA)的一或更多核苷酸序列的一或更多多核苷酸;以及b) 包括與SEQ ID NO:1-12中任一者具有至少90%序列一致性的胺基酸序列的RNA引導的核酸酶(RGN)多肽、或包括編碼RGN多肽的核苷酸序列的多核苷酸; 其中一或更多引導RNA能夠與標的DNA序列雜交,以及其中一或更多引導RNA能夠與RGN多肽形成錯合物,以引導RGN多肽與DNA分子的標的DNA序列結合。
在上述態樣的一些實施方式中,RGN多肽包括與SEQ ID NO:6具有至少90%序列一致性的胺基酸序列。
在上述態樣的一些實施方式中,編碼RGN多肽的核苷酸序列、以及編碼一或更多引導RNA的核苷酸序列中的至少一者可操作地連接至與核苷酸序列異源的啟動子。
在上述態樣的一些實施方式中,編碼一或更多引導RNA的核苷酸序列、以及編碼RGN多肽的核苷酸序列位於一個載體上。
在仍是另一態樣中,本揭露內容提供一種用於結合DNA分子的標的DNA序列的系統,其中系統包括:a) 能夠與標的DNA序列雜交的一或更多引導RNA、或包括編碼一或更多引導RNA(gRNA)的一或更多核苷酸序列的一或更多多核苷酸;以及b) 包括與SEQ ID NO:1-12中任一者具有至少90%序列一致性的胺基酸序列的RNA引導的核酸酶(RGN)多肽;其中一或更多引導RNA能夠與標的DNA序列雜交,以及其中一或更多引導RNA能夠與RGN多肽形成錯合物,以引導RGN多肽與DNA分子的標的DNA序列結合。
在上述態樣的一些實施方式中,RGN多肽包括與SEQ ID NO:6具有至少90%序列一致性的胺基酸序列。
在上述態樣的一些實施方式中, RGN多肽包括與SEQ ID NO:1-12中任一者具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的胺基酸序列。在一些實施方式中,RGN多肽包括與SEQ ID NO:6具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的胺基酸序列。
在上述態樣的一些實施方式中,編碼一或更多引導RNA的至少一個核苷酸序列可操作地連接至與核苷酸序列異源的啟動子。
在上述態樣的一些實施方式中,在自然界中未發現RGN多肽與一或更多引導RNA彼此錯合。
在上述態樣的一些實施方式中,標的DNA序列為真核標的DNA序列。
在上述態樣的一些實施方式中,gRNA為單引導RNA(sgRNA)。在一些實施方式中,sgRNA進一步包括延伸,該延伸包括用於先導編輯的編輯模板。
在上述態樣的一些實施方式中,gRNA為雙引導RNA。
在上述態樣的一些實施方式中,gRNA選自由下列所組成的群組:a) 包括與SEQ ID NO:13具有至少90%序列一致性的CRISPR重複序列、以及與SEQ ID NO:25具有至少90%序列一致性的tracrRNA的gRNA,其中RGN多肽包括與SEQ ID NO:1具有至少90%序列一致性的胺基酸序列;b) 包括與SEQ ID NO:14具有至少90%序列一致性的CRISPR重複序列、以及與SEQ ID NO:26具有至少90%序列一致性的tracrRNA的gRNA,其中RGN多肽包括與SEQ ID NO:2具有至少90%序列一致性的胺基酸序列;c) 包括與SEQ ID NO:15具有至少90%序列一致性的CRISPR重複序列、以及與SEQ ID NO:27具有至少90%序列一致性的tracrRNA的gRNA,其中RGN多肽包括與SEQ ID NO:3具有至少90%序列一致性的胺基酸序列;d) 包括與SEQ ID NO:16具有至少90%序列一致性的CRISPR重複序列、以及與SEQ ID NO:28具有至少90%序列一致性的tracrRNA的gRNA,其中RGN多肽包括與SEQ ID NO:4具有至少90%序列一致性的胺基酸序列;e) 包括與SEQ ID NO:17具有至少90%序列一致性的CRISPR重複序列、以及與SEQ ID NO:29具有至少90%序列一致性的tracrRNA的gRNA,其中RGN多肽包括與SEQ ID NO:5具有至少90%序列一致性的胺基酸序列;f) 包括與SEQ ID NO:18具有至少90%序列一致性的CRISPR重複序列、以及與SEQ ID NO:30具有至少90%序列一致性的tracrRNA的gRNA,其中RGN多肽包括與SEQ ID NO:6具有至少90%序列一致性的胺基酸序列;g) 包括與SEQ ID NO:19具有至少90%序列一致性的CRISPR重複序列、以及與SEQ ID NO:31具有至少90%序列一致性的tracrRNA的gRNA,其中RGN多肽包括與SEQ ID NO:7具有至少90%序列一致性的胺基酸序列;h) 包括與SEQ ID NO:20具有至少90%序列一致性的CRISPR重複序列、以及與SEQ ID NO:32具有至少90%序列一致性的tracrRNA的gRNA,其中RGN多肽包括與SEQ ID NO:8具有至少90%序列一致性的胺基酸序列;i) 包括與SEQ ID NO:21具有至少90%序列一致性的CRISPR重複序列、以及與SEQ ID NO:33具有至少90%序列一致性的tracrRNA的gRNA,其中RGN多肽包括與SEQ ID NO:9具有至少90%序列一致性的胺基酸序列;j) 包括與SEQ ID NO:22具有至少90%序列一致性的CRISPR重複序列、以及與SEQ ID NO:34具有至少90%序列一致性的tracrRNA的gRNA,其中RGN多肽包括與SEQ ID NO:10具有至少90%序列一致性的胺基酸序列;k) 包括與SEQ ID NO:23具有至少90%序列一致性的CRISPR重複序列、以及與SEQ ID NO:35具有至少90%序列一致性的tracrRNA的gRNA,其中RGN多肽包括與SEQ ID NO:11具有至少90%序列一致性的胺基酸序列;以及l) 包括與SEQ ID NO:24具有至少90%序列一致性的CRISPR重複序列、以及與SEQ ID NO:36具有至少90%序列一致性的tracrRNA的gRNA,其中RGN多肽包括與SEQ ID NO:12具有至少90%序列一致性的胺基酸序列。在一些實施方式中,gRNA包括與SEQ ID NO:18具有至少90%序列一致性的CRISPR重複序列、以及與SEQ ID NO:30具有至少90%序列一致性的tracrRNA。
在上述態樣的一些實施方式中,gRNA選自由下列所組成的群組:a) 包括與SEQ ID NO:13具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的CRISPR重複序列、以及與SEQ ID NO:25具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的tracrRNA的gRNA,其中RGN多肽包括與SEQ ID NO:1具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的胺基酸序列;b) 包括與SEQ ID NO:14具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的CRISPR重複序列、以及與SEQ ID NO:26具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的tracrRNA的gRNA,其中RGN多肽包括與SEQ ID NO:2具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的胺基酸序列;c) 包括與SEQ ID NO:15具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的CRISPR重複序列、以及與SEQ ID NO:27具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的tracrRNA的gRNA,其中RGN多肽包括與SEQ ID NO:3具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的胺基酸序列;d) 包括與SEQ ID NO:16具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的CRISPR重複序列、以及與SEQ ID NO:28具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的tracrRNA的gRNA,其中RGN多肽包括與SEQ ID NO:4具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的胺基酸序列;e) 包括與SEQ ID NO:17具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的CRISPR重複序列、以及與SEQ ID NO:29具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的tracrRNA的gRNA,其中RGN多肽包括與SEQ ID NO:5具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的胺基酸序列;f) 包括與SEQ ID NO:18具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的CRISPR重複序列、以及與SEQ ID NO:30具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的tracrRNA的gRNA,其中RGN多肽包括與SEQ ID NO:6具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的胺基酸序列;g) 包括與SEQ ID NO:19具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的CRISPR重複序列、以及與SEQ ID NO:31具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的tracrRNA的gRNA,其中RGN多肽包括與SEQ ID NO:7具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的胺基酸序列;h) 包括與SEQ ID NO:20具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的CRISPR重複序列、以及與SEQ ID NO:32具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的tracrRNA的gRNA,其中RGN多肽包括與SEQ ID NO:8具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的胺基酸序列;i) 包括與SEQ ID NO:21具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的CRISPR重複序列、以及與SEQ ID NO:33具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的tracrRNA的gRNA,其中RGN多肽包括與SEQ ID NO:9具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的胺基酸序列;j) 包括與SEQ ID NO:22具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的CRISPR重複序列、以及與SEQ ID NO:34具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的tracrRNA的gRNA,其中RGN多肽包括與SEQ ID NO:10具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的胺基酸序列;k) 包括與SEQ ID NO:23具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的CRISPR重複序列、以及與SEQ ID NO:35具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的tracrRNA的gRNA,其中RGN多肽包括與SEQ ID NO:11具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的胺基酸序列;以及l) 包括與SEQ ID NO:24具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的CRISPR重複序列、以及與SEQ ID NO:36具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的tracrRNA的gRNA,其中RGN多肽包括與SEQ ID NO:12具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的胺基酸序列。在一些實施方式中,gRNA包括與SEQ ID NO:18具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的CRISPR重複序列、以及與SEQ ID NO:30具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的tracrRNA。
在上述態樣的一些實施方式中,標的DNA序列被定位為與前間隔序列鄰近模體(PAM)相鄰。
在上述態樣的一些實施方式中,標的DNA序列在細胞內。
在上述態樣的一些實施方式中,一或更多引導RNA能夠與標的DNA序列雜交,且引導RNA能夠與RGN多肽形成錯合物,以引導標的DNA序列的切割。
在上述態樣的一些實施方式中,切割產生雙股斷裂。
在上述態樣的一些實施方式中,切割產生單股斷裂。
在上述態樣的一些實施方式中,RGN多肽為核酸酶不活化的或為切口酶。
在上述態樣的一些實施方式中,RGN多肽可操作地連接至先導編輯多肽。在一些實施方式中,先導編輯多肽包括DNA聚合酶。在一些實施方式中,先導編輯多肽包括反轉錄酶。
在上述態樣的一些實施方式中,RGN多肽可操作地連接至鹼基編輯多肽。
在上述態樣的一些實施方式中,鹼基編輯多肽為去胺酶。在一些實施方式中,去胺酶為胞嘧啶去胺酶或腺嘌呤去胺酶。在一些實施方式中,去胺酶與SEQ ID NO:377-448中任一者的胺基酸序列具有至少90%序列一致性。在一些實施方式中,去胺酶與SEQ ID NO:377-448中任一者的胺基酸序列具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
在上述態樣的一些實施方式中,RGN多肽包括一或更多核定位訊號。
在上述態樣的一些實施方式中,RGN多肽針對在真核細胞中的表現而被密碼子最佳化。
在上述態樣的一些實施方式中,系統進一步包括一或更多供體多核苷酸。
在另一態樣中,本揭露內容提供一種細胞,其包括上文描述的系統。
在又一態樣中,本揭露內容提供一種醫藥組成物,其包括上文描述的核酸分子、載體、細胞、RGN多肽、RNP錯合物、或系統、以及藥學上可接受的載體。
在仍是另一態樣中,本揭露內容提供一種用於結合DNA分子的標的DNA序列的方法,其包括將上文描述的系統遞送至標的DNA序列或包括標的DNA序列的細胞。
在上述態樣的一些實施方式中,RGN多肽或引導RNA進一步包括可檢測標記,從而允許標的DNA序列的檢測。
在上述態樣的一些實施方式中,引導RNA或RGN多肽進一步包括表現調節子,從而調節標的DNA序列的表現或由標的DNA序列的轉錄控制下的基因的表現。
在另一態樣中,本揭露內容提供一種用於切割及/或修飾DNA分子的標的DNA序列的方法,包括將上文描述的系統遞送至標的DNA序列或包括DNA分子的細胞,其中發生標的DNA序列的切割或修飾。
在上述態樣的一些實施方式中,經修飾的標的DNA序列包括將異源DNA插入標的DNA序列中。
在上述態樣的一些實施方式中,經修飾的標的DNA序列包括標的DNA序列中的至少一核苷酸的缺失。
在上述態樣的一些實施方式中,經修飾的標的DNA序列包括標的DNA序列中的至少一核苷酸的突變。
在另一態樣中,本揭露內容提供一種用於結合DNA分子的標的DNA序列的方法,包括:a) 在適合形成RNA引導的核酸酶(RGN)核糖核苷酸錯合物的條件下,藉由組合能夠與標的DNA序列雜交的一或更多引導RNA以及包括與SEQ ID NO:1-12中任一者具有至少90%序列一致性的胺基酸序列的RGN多肽而組裝RGN核糖核苷酸錯合物;以及b) 使標的DNA序列或包括標的DNA序列的細胞與組裝的RGN核糖核苷酸錯合物接觸;其中一或更多引導RNA與標的DNA序列雜交,從而引導RGN多肽與標的DNA序列結合。在一些實施方式中,RGN多肽與SEQ ID NO:6具有至少90%序列一致性。
在上述態樣的一些實施方式中,RGN多肽包括與SEQ ID NO:1-12中任一者具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的胺基酸序列。在一些實施方式中,RGN多肽與SEQ ID NO:6具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性
在上述態樣的一些實施方式中,該方法在體外、體內或離體進行。
在上述態樣的一些實施方式中,RGN多肽或引導RNA進一步包括可檢測標記,從而允許標的DNA序列的檢測。
在上述態樣的一些實施方式中,引導RNA或RGN多肽進一步包括表現調節子,從而允許標的DNA序列的表現的調節。
在上述態樣的一些實施方式中,RGN多肽可操作地連接至先導編輯多肽,從而允許標的DNA序列的修飾。在一些實施方式中,先導編輯多肽包括DNA聚合酶。在一些實施方式中,先導編輯多肽包括反轉錄酶。
在上述態樣的一些實施方式中,RGN多肽可操作地連接至鹼基編輯多肽,從而允許標的DNA序列的修飾。在一些實施方式中,鹼基編輯多肽包括去胺酶。在一些實施方式中,去胺酶為胞嘧啶去胺酶或腺嘌呤去胺酶。在上述態樣的一些實施方式中,RGN多肽能夠切割標的DNA序列,從而允許切割及/或修飾標的DNA序列。
在另一態樣中,本揭露內容提供一種用於切割及/或修飾DNA分子的標的DNA序列的方法,包括使DNA分子與下列接觸:a) RNA引導的核酸酶(RGN)多肽,其中RGN包括與SEQ ID NO:1-12中任一者具有至少90%序列一致性的胺基酸序列;以及b) 一或更多引導RNA,其能夠將(a)的該RGN靶向標的DNA序列,其中一或更多引導RNA與標的DNA序列雜交,從而引導RGN多肽與標的DNA序列結合,且發生標的DNA序列的切割及/或修飾。在一些實施方式中,RGN多肽與SEQ ID NO:6具有至少90%序列一致性。
在上述態樣的一些實施方式中,RGN多肽包括與SEQ ID NO:1-12中任一者具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的胺基酸序列。在一些實施方式中,RGN多肽與SEQ ID NO:6具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
在上述態樣的一些實施方式中,由RGN多肽的切割產生雙股斷裂。
在上述態樣的一些實施方式中,由RGN多肽的切割產生單股斷裂。
在上述態樣的一些實施方式中,RGN多肽為核酸酶不活化的或為切口酶。
在上述態樣的一些實施方式中,RGN多肽可操作地連接至先導編輯多肽,從而允許標的DNA序列的修飾。在一些實施方式中,先導編輯多肽包括DNA聚合酶。在一些實施方式中,先導編輯多肽包括反轉錄酶。
在上述態樣的一些實施方式中,RGN多肽可操作地連接至鹼基編輯多肽。
在上述態樣的一些實施方式中,鹼基編輯多肽為去胺酶。在一些實施方式中,去胺酶為胞嘧啶去胺酶或腺嘌呤去胺酶。在一些實施方式中,去胺酶與SEQ ID NO:377-448中任一者的胺基酸序列具有至少90%序列一致性。在一些實施方式中,去胺酶與SEQ ID NO:377-448中任一者的胺基酸序列具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
在上述態樣的一些實施方式中,經修飾的標的DNA序列包括將異源DNA插入標的DNA序列中。
在上述態樣的一些實施方式中,經修飾的標的DNA序列包括標的DNA序列中的至少一核苷酸的缺失。
在上述態樣的一些實施方式中,經修飾的標的DNA序列包括標的DNA序列中的至少一核苷酸的突變。
在上述態樣的一些實施方式中,標的DNA序列被定位為與前間隔序列鄰近模體(PAM)相鄰。
在上述態樣的一些實施方式中,標的DNA序列為真核標的DNA序列。
在上述態樣的一些實施方式中,gRNA為單引導RNA(sgRNA)。在一些實施方式中,sgRNA進一步包括延伸,該延伸包括用於先導編輯的編輯模板。
在上述態樣的一些實施方式中,gRNA為雙引導RNA。
在上述態樣的一些實施方式中,RGN、引導RNA及tracrRNA選自由下列所組成的群組:a) 與SEQ ID NO:1具有至少90%序列一致性的RGN、包括與SEQ ID NO:13具有至少90%序列一致性的crRNA重複序列的引導RNA、及與SEQ ID NO:25具有至少90%序列一致性的tracrRNA;b) 與SEQ ID NO:2具有至少90%序列一致性的RGN、包括與SEQ ID NO:14具有至少90%序列一致性的crRNA重複序列的引導RNA、及與SEQ ID NO:26具有至少90%序列一致性的tracrRNA;c) 與SEQ ID NO:3具有至少90%序列一致性的RGN、包括與SEQ ID NO:15具有至少90%序列一致性的crRNA重複序列的引導RNA、及與SEQ ID NO:27具有至少90%序列一致性的tracrRNA;d) 與SEQ ID NO:4具有至少90%序列一致性的RGN、包括與SEQ ID NO:16具有至少90%序列一致性的crRNA重複序列的引導RNA、及與SEQ ID NO:28具有至少90%序列一致性的tracrRNA;e) 與SEQ ID NO:5具有至少90%序列一致性的RGN、包括與SEQ ID NO:17具有至少90%序列一致性的crRNA重複序列的引導RNA、及與SEQ ID NO:29具有至少90%序列一致性的tracrRNA;f) 與SEQ ID NO:6具有至少90%序列一致性的RGN、包括與SEQ ID NO:18具有至少90%序列一致性的crRNA重複序列的引導RNA、及與SEQ ID NO:30具有至少90%序列一致性的tracrRNA;g) 與SEQ ID NO:7具有至少90%序列一致性的RGN、包括與SEQ ID NO:9具有至少90%序列一致性的crRNA重複序列的引導RNA、及與SEQ ID NO:31具有至少90%序列一致性的tracrRNA;h) 與SEQ ID NO:8具有至少90%序列一致性的RGN、包括與SEQ ID NO:20具有至少90%序列一致性的crRNA重複序列的引導RNA、及與SEQ ID NO:32具有至少90%序列一致性的tracrRNA;i) 與SEQ ID NO:9具有至少90%序列一致性的RGN、包括與SEQ ID NO:21具有至少90%序列一致性的crRNA重複序列的引導RNA、及與SEQ ID NO:33具有至少90%序列一致性的tracrRNA;j) 與SEQ ID NO:10具有至少90%序列一致性的RGN、包括與SEQ ID NO:22具有至少90%序列一致性的crRNA重複序列的引導RNA、及與SEQ ID NO:34具有至少90%序列一致性的tracrRNA;k) 與SEQ ID NO:11具有至少90%序列一致性的RGN、包括與SEQ ID NO:23具有至少90%序列一致性的crRNA重複序列的引導RNA、及與SEQ ID NO:35具有至少90%序列一致性的tracrRNA;以及l) 與SEQ ID NO:12具有至少90%序列一致性的RGN、包括與SEQ ID NO:24具有至少90%序列一致性的crRNA重複序列的引導RNA、及與SEQ ID NO:36具有至少90%序列一致性的tracrRNA;在一些實施方式中, RGN 與SEQ ID NO:6具有至少90%序列一致性,引導RNA包括與SEQ ID NO:18具有至少90%序列一致性的crRNA重複序列、及與SEQ ID NO:30具有至少90%序列一致性的tracrRNA。
在上述態樣的一些實施方式中,RGN、引導RNA及tracrRNA選自由下列所組成的群組:a) 與SEQ ID NO:1具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的RGN、包括與SEQ ID NO:13具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的crRNA重複序列的引導RNA、及與SEQ ID NO:25具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的tracrRNA;b) 與SEQ ID NO:2具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的RGN、包括與SEQ ID NO:14具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的crRNA重複序列的引導RNA、及與SEQ ID NO:26具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的tracrRNA;c) 與SEQ ID NO:3具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的RGN、包括與SEQ ID NO:15具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的crRNA重複序列的引導RNA、及與SEQ ID NO:27具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的tracrRNA;d) 與SEQ ID NO:4具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的RGN、包括與SEQ ID NO:16具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的crRNA重複序列的引導RNA、及與SEQ ID NO:28具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的tracrRNA;e) 與SEQ ID NO:5具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的RGN、包括與SEQ ID NO:17具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的crRNA重複序列的引導RNA、及與SEQ ID NO:29具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的tracrRNA;f) 與SEQ ID NO:6具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的RGN、包括與SEQ ID NO:18具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的crRNA重複序列的引導RNA、及與SEQ ID NO:30具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的tracrRNA;g) 與SEQ ID NO:7具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的RGN、包括與SEQ ID NO:9具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的crRNA重複序列的引導RNA、及與SEQ ID NO:31具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的tracrRNA;h) 與SEQ ID NO:8具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的RGN、包括與SEQ ID NO:20具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的crRNA重複序列的引導RNA、及與SEQ ID NO:32具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的tracrRNA;i) 與SEQ ID NO:9具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的RGN、包括與SEQ ID NO:21具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的crRNA重複序列的引導RNA、及與SEQ ID NO:33具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的tracrRNA;j) 與SEQ ID NO:10具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的RGN、包括與SEQ ID NO:22具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的crRNA重複序列的引導RNA、及與SEQ ID NO:34具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的tracrRNA;k) 與SEQ ID NO:11具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的RGN、包括與SEQ ID NO:23具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的crRNA重複序列的引導RNA、及與SEQ ID NO:35具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的tracrRNA;以及l) 與SEQ ID NO:12具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的RGN、包括與SEQ ID NO:24具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的crRNA重複序列的引導RNA、及與SEQ ID NO:36具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的tracrRNA;在一些實施方式中, RGN 與SEQ ID NO:6具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性,引導RNA包括與SEQ ID NO:18具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的crRNA重複序列、及與SEQ ID NO:30具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的tracrRNA。
在上述態樣的一些實施方式中,標的DNA序列在細胞內。
在上述態樣的一些實施方式中,該方法進一步包括:在RGN多肽被表現且切割及修飾標的DNA序列以產生包括經修飾的標的DNA序列的DNA分子的條件下,培養細胞;以及選擇包括經修飾的標的DNA序列的細胞。
在另一態樣中,本揭露內容提供一種細胞,其包括根據上文描述的方法的經修飾的標的DNA序列。
在又一態樣中,本揭露內容提供一種醫藥組成物,其包括上文描述的細胞及藥學上可接受的載體。
在仍是另一態樣中,本揭露內容提供一種治療疾病、病症或症狀的方法,其包括對需要治療的個體投予有效量的上文描述的醫藥組成物。
在上述態樣的一些實施方式中,疾病與因果突變相關聯,且有效量的醫藥組成物校正或刪除因果突變。
在上述態樣的一些實施方式中,個體有罹患疾病、病症或症狀的風險。
在另一態樣中,本揭露內容提供一種核酸分子,其包括CRISPR RNA(crRNA)或編碼crRNA的多核苷酸,其中crRNA包括間隔序列及CRISPR 重複序列,其中CRISPR 重複序列包括與SEQ ID NO:13-24中任一者具有至少90%序列一致性的核苷酸序列;其中,當引導RNA與RNA引導的核酸酶(RGN)多肽結合時,引導RNA(包括crRNA;以及與crRNA的CRISPR 重複序列雜交的轉錄活化的 CRISPR RNA(tracrRNA))能夠以序列專一性方式、經由crRNA的間隔序列而與標的DNA序列雜交。在一些實施方式中,CRISPR 重複序列包括與SEQ ID NO:18具有至少90%序列一致性的核苷酸序列。
在上述態樣的一些實施方式中,編碼crRNA的多核苷酸可操作地連接至與多核苷酸異源的啟動子。
在上述態樣的一些實施方式中,CRISPR 重複序列包括與SEQ ID NO:13-24中任一者具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的核苷酸序列。在一些實施方式中,CRISPR 重複序列包括與SEQ ID NO:18具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的核苷酸序列。
在另一態樣中,本揭露內容提供一種載體,其包括上文描述的包括編碼crRNA的多核苷酸的核酸分子。
在上述態樣的一些實施方式中,載體進一步包括編碼tracrRNA 的多核苷酸。
在上述態樣的一些實施方式中,tracrRNA選自由下列所組成的群組:a) 與SEQ ID NO:25具有至少90%序列一致性的tracrRNA,其中CRISPR重複序列與SEQ ID NO:13具有至少90%序列一致性;b)   與SEQ ID NO:26具有至少90%序列一致性的tracrRNA,其中CRISPR重複序列與SEQ ID NO:14具有至少90%序列一致性;c) 與SEQ ID NO:27具有至少90%序列一致性的tracrRNA,其中CRISPR重複序列與SEQ ID NO:15具有至少90%序列一致性;d) 與SEQ ID NO:28具有至少90%序列一致性的tracrRNA,其中CRISPR重複序列與SEQ ID NO:16具有至少90%序列一致性;e) 與SEQ ID NO:29具有至少90%序列一致性的tracrRNA,其中CRISPR重複序列與SEQ ID NO:17具有至少90%序列一致性;f) 與SEQ ID NO:30具有至少90%序列一致性的tracrRNA,其中CRISPR重複序列與SEQ ID NO:18具有至少90%序列一致性;g) 與SEQ ID NO:31具有至少90%序列一致性的tracrRNA,其中CRISPR重複序列與SEQ ID NO:19具有至少90%序列一致性;h) 與SEQ ID NO:32具有至少90%序列一致性的tracrRNA,其中CRISPR重複序列與SEQ ID NO:20具有至少90%序列一致性;i) 與SEQ ID NO:33具有至少90%序列一致性的tracrRNA,其中CRISPR重複序列與SEQ ID NO:21具有至少90%序列一致性;j) 與SEQ ID NO:34具有至少90%序列一致性的tracrRNA,其中CRISPR重複序列與SEQ ID NO:22具有至少90%序列一致性;k) 與SEQ ID NO:35具有至少90%序列一致性的tracrRNA,其中CRISPR重複序列與SEQ ID NO:23具有至少90%序列一致性;以及l) 與SEQ ID NO:36具有至少90%序列一致性的tracrRNA,其中CRISPR重複序列與SEQ ID NO:24具有至少90%序列一致性。在一些實施方式中,tracrRNA與SEQ ID NO:30具有至少90%序列一致性,且CRISPR重複序列與SEQ ID NO:18具有至少90%序列一致性。
在上述態樣的一些實施方式中,tracrRNA選自由下列所組成的群組:a) 與SEQ ID NO:25具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的tracrRNA,其中CRISPR重複序列與SEQ ID NO:13具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;b) 與SEQ ID NO:26具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的tracrRNA,其中CRISPR重複序列與SEQ ID NO:14具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;c) 與SEQ ID NO:27具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的tracrRNA,其中CRISPR重複序列與SEQ ID NO:15具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;d) 與SEQ ID NO:28具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的tracrRNA,其中CRISPR重複序列與SEQ ID NO:16具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;e) 與SEQ ID NO:29具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的tracrRNA,其中CRISPR重複序列與SEQ ID NO:17具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;f) 與SEQ ID NO:30具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的tracrRNA,其中CRISPR重複序列與SEQ ID NO:18具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;g) 與SEQ ID NO:31具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的tracrRNA,其中CRISPR重複序列與SEQ ID NO:19具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;h) 與SEQ ID NO:32具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的tracrRNA,其中CRISPR重複序列與SEQ ID NO:20具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;i) 與SEQ ID NO:33具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的tracrRNA,其中CRISPR重複序列與SEQ ID NO:21具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;j) 與SEQ ID NO:34具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的tracrRNA,其中CRISPR重複序列與SEQ ID NO:22具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;k) 與SEQ ID NO:35具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的tracrRNA,其中CRISPR重複序列與SEQ ID NO:23具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;以及l) 與SEQ ID NO:36具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的tracrRNA,其中CRISPR重複序列與SEQ ID NO:24具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。在一些實施方式中,tracrRNA與SEQ ID NO:30具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性,且CRISPR重複序列與SEQ ID NO:18具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
在上述態樣的一些實施方式中,載體進一步包括編碼RGN多肽的多核苷酸。
在上述態樣的一些實施方式中,RGN多肽選自由下列所組成的群組:a) 與SEQ ID NO:1具有至少90%序列一致性的RGN多肽,其中CRISPR重複序列與SEQ ID NO:13具有至少90%序列一致性,且tracrRNA與SEQ ID NO:25具有至少90%序列一致性;b) 與SEQ ID NO:2具有至少90%序列一致性的RGN多肽,其中CRISPR重複序列與SEQ ID NO:14具有至少90%序列一致性,且tracrRNA與SEQ ID NO:26具有至少90%序列一致性;c) 與SEQ ID NO:3具有至少90%序列一致性的RGN多肽,其中CRISPR重複序列與SEQ ID NO:15具有至少90%序列一致性,且tracrRNA與SEQ ID NO:27具有至少90%序列一致性;d) 與SEQ ID NO:4具有至少90%序列一致性的RGN多肽,其中CRISPR重複序列與SEQ ID NO:16具有至少90%序列一致性,且tracrRNA與SEQ ID NO:28具有至少90%序列一致性;e) 與SEQ ID NO:5具有至少90%序列一致性的RGN多肽,其中CRISPR重複序列與SEQ ID NO:17具有至少90%序列一致性,且tracrRNA與SEQ ID NO:29具有至少90%序列一致性;f) 與SEQ ID NO:6具有至少90%序列一致性的RGN多肽,其中CRISPR重複序列與SEQ ID NO:18具有至少90%序列一致性,且tracrRNA與SEQ ID NO:30具有至少90%序列一致性;g) 與SEQ ID NO:7具有至少90%序列一致性的RGN多肽,其中CRISPR重複序列與SEQ ID NO:19具有至少90%序列一致性,且tracrRNA與SEQ ID NO:31具有至少90%序列一致性;h) 與SEQ ID NO:8具有至少90%序列一致性的RGN多肽,其中CRISPR重複序列與SEQ ID NO:20具有至少90%序列一致性,且tracrRNA與SEQ ID NO:32具有至少90%序列一致性;i) 與SEQ ID NO:9具有至少90%序列一致性的RGN多肽,其中CRISPR重複序列與SEQ ID NO:21具有至少90%序列一致性,且tracrRNA與SEQ ID NO:33具有至少90%序列一致性;j) 與SEQ ID NO:10具有至少90%序列一致性的RGN多肽,其中CRISPR重複序列與SEQ ID NO:22具有至少90%序列一致性,且tracrRNA與SEQ ID NO:34具有至少90%序列一致性;k) 與SEQ ID NO:11具有至少90%序列一致性的RGN多肽,其中CRISPR重複序列與SEQ ID NO:23具有至少90%序列一致性,且tracrRNA與SEQ ID NO:35具有至少90%序列一致性;以及l) 與SEQ ID NO:12具有至少90%序列一致性的RGN多肽,其中CRISPR重複序列與SEQ ID NO:24具有至少90%序列一致性,且tracrRNA與SEQ ID NO:36具有至少90%序列一致性。在一些實施方式中,RGN多肽與SEQ ID NO:6具有至少90%序列一致性,CRISPR重複序列與SEQ ID NO:18具有至少90%序列一致性,以及tracrRNA與SEQ ID NO:30具有至少90%序列一致性。
在上述態樣的一些實施方式中,RGN多肽選自由下列所組成的群組:a) 與SEQ ID NO:1具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的RGN多肽,其中CRISPR重複序列與SEQ ID NO:13具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性,且tracrRNA與SEQ ID NO:25具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;b) 與SEQ ID NO:2具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的RGN多肽,其中CRISPR重複序列與SEQ ID NO:14具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性,且tracrRNA與SEQ ID NO:26具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;c) 與SEQ ID NO:3具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的RGN多肽,其中CRISPR重複序列與SEQ ID NO:15具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性,且tracrRNA與SEQ ID NO:27具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;d) 與SEQ ID NO:4具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的RGN多肽,其中CRISPR重複序列與SEQ ID NO:16具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性,且tracrRNA與SEQ ID NO:28具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;e) 與SEQ ID NO:5具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的RGN多肽,其中CRISPR重複序列與SEQ ID NO:17具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性,且tracrRNA與SEQ ID NO:29具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;f) 與SEQ ID NO:6具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的RGN多肽,其中CRISPR重複序列與SEQ ID NO:18具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性,且tracrRNA與SEQ ID NO:30具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;g) 與SEQ ID NO:7具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的RGN多肽,其中CRISPR重複序列與SEQ ID NO:19具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性,且tracrRNA與SEQ ID NO:31具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;h) 與SEQ ID NO:8具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的RGN多肽,其中CRISPR重複序列與SEQ ID NO:20具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性,且tracrRNA與SEQ ID NO:32具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;i) 與SEQ ID NO:9具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的RGN多肽,其中CRISPR重複序列與SEQ ID NO:21具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性,且tracrRNA與SEQ ID NO:33具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;j) 與SEQ ID NO:10具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的RGN多肽,其中CRISPR重複序列與SEQ ID NO:22具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性,且tracrRNA與SEQ ID NO:34具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;k) 與SEQ ID NO:11具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的RGN多肽,其中CRISPR重複序列與SEQ ID NO:23具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性,且tracrRNA與SEQ ID NO:35具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;以及l) 與SEQ ID NO:12具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的RGN多肽,其中CRISPR重複序列與SEQ ID NO:24具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性,且tracrRNA與SEQ ID NO:36具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。在一些實施方式中,RGN多肽與SEQ ID NO:6具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性,CRISPR重複序列與SEQ ID NO:18具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性,以及tracrRNA與SEQ ID NO:30具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
在另一態樣中,本揭露內容提供一種核酸分子,其包括轉錄活化的CRISPR RNA(tracrRNA)或編碼tracrRNA的多核苷酸,tracrRNA包括與SEQ ID NO:25-36中任一者具有至少90%序列一致性的核苷酸序列;其中,當引導RNA與RNA引導的核酸酶(RGN)多肽結合時,引導RNA(包括tracrRNA以及crRNA,crRNA包括間隔序列及CRISPR重複序列,其中tracrRNA與crRNA的 CRISPR重複序列雜交)能夠以序列專一性方式、經由該crRNA的該間隔序列而與一標的DNA序列雜交。在一些實施方式中,tracrRNA包括與SEQ ID NO:30具有至少90%序列一致性的核苷酸序列。
在上述態樣的一些實施方式中,編碼tracrRNA的多核苷酸可操作地連接至與多核苷酸異源的啟動子。
在上述態樣的一些實施方式中,tracrRNA包括與SEQ ID NO:25-36中任一者具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的核苷酸序列。在一些實施方式中,tracrRNA包括與SEQ ID NO:30具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的核苷酸序列。
在另一態樣中,本揭露內容提供一種載體,其包括上文描述的包括編碼tracrRNA的多核苷酸的核酸分子。
在又一態樣中,本揭露內容提供一種單引導RNA,其包括上文描述的包括crRNA的核酸分子及上文描述的包括tracrRNA的核酸分子。
在仍是另一態樣中,本揭露內容提供一種雙引導RNA,其包括上文描述的包括crRNA的核酸分子及上文描述的包括tracrRNA的核酸分子。
在另一態樣中,本揭露內容提供一種細胞,其包括上文描述的核酸分子、單引導RNA、雙引導RNA、或載體。
受益於前述描述及相關圖式中呈現的教導,發明所屬領域中具有通常知識者將想到本文中闡述的本發明的許多修飾及其他實施方式。因此,應該理解,本發明不限於所揭露的特定實施方式,並且修飾以及其他實施方式預期被在包括在所附實施方式的範圍內。雖然本文採用了特定術語,但這些術語僅以一般性及描述性意義使用,且並不是出於限制的目的。 I. 概述
RNA引導的核酸酶(RGN)允許對基因體內的(一或多個)特定位點的靶向操作、且在基因靶向的環境下有用於治療及研究應用。在各種生物體(包括哺乳動物)中,例如藉由刺激非同源末端連接及同源重組,RNA引導的核酸酶已被用於基因體工程。本文描述的組成物及方法有用於在多核苷酸中產生單股或雙股斷裂、修飾多核苷酸、偵測多核苷酸內的特定位點、或修飾特定基因的表現。
本文揭露的RNA引導的核酸酶可以藉由修飾標的序列來改變基因表現。在具體實施方式中,RNA引導的核酸酶藉由引導RNA(gRNA)作為叢集的規律間隔的短迴文重複序列(CRISPR)RNA引導的核酸酶系統的一部分而被引導至標的序列。因為引導RNA與RNA引導的核酸酶形成錯合物以引導RNA引導的核酸酶與標的序列結合、並且在一些實施方式中在標的序列處引入單股或雙股斷裂,RGN被認為是「RNA引導的」。在標的序列已被切割後,斷裂可被修復,使得標的序列的DNA序列在修復過程期間被修飾。因此,本文提供了使用RNA引導的核酸酶來修飾宿主細胞的DNA中的標的序列的方法。例如,RNA引導的核酸酶可用於修飾真核細胞或原核細胞的基因體基因座處的標的序列。 II.  RNA 引導的核酸酶
本文提供的是RNA引導的核酸酶。術語「RNA引導的核酸酶(RGN)」指以序列專一性方式而與特定標的核苷酸序列結合、且由與多肽錯合並與標的序列雜交的引導RNA分子而被引導至標的核苷酸序列的多肽。雖然RNA引導的核酸酶能夠在結合時切割標的序列,但術語「RNA引導的核酸酶」還包括能夠與標的序列結合但不切割標的序列的無核酸酶活性的RNA引導的核酸酶。RNA引導的核酸酶對標的序列的切割可以導致單股或雙股斷裂。僅能夠切割雙股核酸分子的單股的RNA引導的核酸酶在本文中被稱為切口酶。
本文揭露的RNA引導的核酸酶包括LPG10134、LPG10136、LPG10138、LPG10139、LPG10141、LPG10145、LPG10146、LPG10147、LPG10150、LPG10155、LPG10159以及LPG10160 RNA引導的核酸酶,其胺基酸序列分別如SEQ ID NO:1-12所示;以及其活性片段或變異體,其保留以RNA引導的序列專一性方式結合至標的核苷酸序列的能力。在這些實施方式的一些實施方式中,LPG10134、LPG10136、LPG10138、LPG10139、LPG10141、LPG10145、LPG10146、LPG10147、LPG10150、LPG10155、LPG10159或LPG10160 RGN的活性片段或變異體能夠切割單股或雙股標的序列。在一些實施方式中,LPG10134、LPG10136、LPG10138、LPG10139、LPG10141、LPG10145、LPG10146、LPG10147、LPG10150、LPG10155、LPG10159或LPG10160 RGN的活性變異體包括與如SEQ ID NO:1-12中任一者所示的胺基酸序列具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列一致性的胺基酸序列。在某些實施方式中,LPG10134、LPG10136、LPG10138、LPG10139、LPG10141、LPG10145、LPG10146、LPG10147、LPG10150、LPG10155、LPG10159或LPG10160 RGN的活性片段包括如SEQ ID NO:1-12中任一者所示的胺基酸序列的至少50、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050個或更多個連續胺基酸殘基。本文提供的RNA引導的核酸酶可以包括至少一核酸酶域(例如,DNase、RNase域)及至少一RNA辨識及/或RNA結合域,以與引導RNA相互作用。可以在本文提供的RNA引導的核酸酶中發現的其他域包括但不限於:DNA結合域、解旋酶域、蛋白質-蛋白質相互作用域及二聚合域。在特定實施方式中,本文提供的RNA引導的核酸酶可包括對DNA結合域、解旋酶域、蛋白質-蛋白質相互作用域及二聚合域中的一或更多者至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列一致性。
標的核苷酸序列與本文提供的RNA引導的核酸酶結合、並和與RNA引導的核酸酶相關聯的引導RNA雜交。然後,如果多肽具有核酸酶活性,則隨後可由RNA引導的核酸酶切割標的序列。術語「切割(cleave)」或「切割(cleavage)」指標的核苷酸序列的骨架內的至少一磷酸二酯鍵的水解,其可導致該標的序列內的單股或雙股斷裂。目前揭露的RGN可以作為核酸內切酶而切割多核苷酸內的核苷酸、或者可以是核酸外切酶以從多核苷酸的末端(5'端及/或3'端)去除連續的核苷酸。在其他實施方式中,所揭露的RGN可以切割在多核苷酸的任何位置內的標的序列的核苷酸、且因此具有核酸內切酶及核酸外切酶二者的作用。目前揭露的RGN對標的多核苷酸的切割可以導致交錯的斷裂或平端。
目前揭露的RNA引導的核酸酶可以是源自細菌或古細菌物種的野生型序列。替代地,RNA引導的核酸酶可以是野生型多肽的變異體或片段。例如,可修飾野生型RGN以改變核酸酶活性或改變PAM專一性。在一些實施方式中,RNA引導的核酸酶不是天然存在的。
在某些實施方式中,RNA引導的核酸酶作為切口酶的作用,僅切割標的核苷酸序列的單股。此種RNA引導的核酸酶具有單一功能性核酸酶域。在特定實施方式中,切口酶能夠切割正股或負股。在這些實施方式的一些實施方式中,另外的核酸酶域已經突變,使得核酸酶活性降低或消除。
在其他實施方式中,RNA引導的核酸酶完全缺少核酸酶活性、且在本文中被稱為無核酸酶活性(nuclease-dead)或核酸酶不活化的。用於將突變引入胺基酸序列的本領域已知的任何方法(例如PCR介導的誘變及定點誘變等)可用於產生無切口酶或無核酸酶活性的RGN。例如,參見美國公開第2014/0068797號以及美國公開第9,790,490號專利;上述專利案中的每一者的全部內容藉由引用而被併入本文。切口酶的非限制性範例為LPG10145 D16A切口酶,其在本文中如SEQ ID NO:551所示。包括RuvC域中的突變且具有功能性HNH域的切口酶可以用於鹼基編輯,其中切口酶與鹼基編輯多肽(例如去胺酶)融合。切口酶的另一個非限制性範例為LPG10145 H611A切口酶,其在本文中如 SEQ ID NO:552 所示。在HNH域中包括突變且具有功能性RuvC域的切口酶可以用於先導編輯,其中切口酶與先導編輯多肽(例如反轉錄酶)融合。無核酸酶活性的RGN的非限制性範例為如SEQ ID NO:553所示的LPG10145 D16A H611A序列。
缺少核酸酶活性的RNA引導的核酸酶可以用於將融合的多肽、多核苷酸或小分子負載遞送至特定基因體位置。在這些實施方式的一些實施方式中,RGN多肽或引導RNA可以與可檢測標記融合,以允許特定序列的檢測。作為非限制性範例,無核酸酶活性的RGN可以與可檢測標記(例如,螢光蛋白)融合且靶向與疾病相關聯的特定序列,以允許疾病相關序列的檢測。
替代地,可以將無核酸酶活性的RGN靶向特定基因體位置,以改變期望序列的表現。在一些實施方式中,藉由干擾所靶向的基因體區域內的RNA聚合酶或轉錄因子的結合,無核酸酶活性的RNA引導的核酸酶與標的序列的結合導致標的序列的表現或由標的序列的轉錄控制下的基因的表現的降低。在其他實施方式中,RGN(例如,無核酸酶活性的RGN)或其錯合的引導RNA進一步包括表現調節子,其在與標的序列結合時用於抑制或活化標的序列或由標的序列轉錄控制的基因的表現。在這些實施方式的一些實施方式中,表現調節子經由表觀遺傳機制來調節標的序列或調節的基因的表現。
在其他實施方式中,可以將無核酸酶活性的RGN或具有切口酶活性的RGN靶向特定基因體位置,以經由與鹼基編輯多肽(例如,去胺酶多肽、或其對核鹼基直接進行化學修飾(例如,去胺基)的活性變異體或片段)的融合來修飾標的多核苷酸的序列,導致從一種核鹼基轉換成另一種核鹼基。鹼基編輯多肽可以在RGN的N端或C端末端處與RGN融合。另外,鹼基編輯多肽可以經由胜肽連接子而與RGN融合。可用於此類組成物及方法的去胺酶多肽的非限制性範例包括胞嘧啶去胺酶或腺嘌呤去胺酶(例如,Gaudelli等人(2017) Nature551:464-471、美國公開第2017/0121693號及第2018/0073012號、以及國際公開第WO/2018/027078號中描述的腺嘌呤去胺酶鹼基編輯器、或者國際公開第WO 2020/139873號、2020年9月11日提出的第63/077,089號、2021年2月8日提出的第63/146,840號以及2021年3月22日提出的第63/164,273號美國臨時申請案、以及2021年9月10日提出的第PCT/US2021049853號國際申請案中揭露的去胺酶中任一者,上述的每一者的全部內容藉由引用被併入本文)。在一個實施方式中,可用於此類組成物及方法的去胺酶多肽為包括選自SEQ ID NO:377-448中任一者的胺基酸序列的胞嘧啶去胺酶或腺嘌呤去胺酶。在一個實施方式中,可用於此類組成物及方法的去胺酶多肽為與SEQ ID NO:377-448中任一者的胺基酸序列具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更大一致性的序列的胞嘧啶去胺酶或腺嘌呤去胺酶。在一些實施方式中,可用於此類目前揭露的組成物及方法的去胺酶多肽為國際公開第WO 2020/139873號(其全部內容藉由引用而被併入本文)的表17中揭露的去胺酶。此外,本領域已知RGN與鹼基編輯酵素(例如,胞嘧啶去胺酶)之間的某些融合蛋白亦可以包括至少一尿嘧啶穩定多肽(uracil stabilizing polypeptide),其藉由去胺酶增加核酸分子中的胞苷、去氧胞苷或胞嘧啶突變成胸苷、去氧胸苷或胸腺嘧啶的突變率。尿嘧啶穩定多肽的非限制性範例包括2020年7月15日提出的第63/052,175號美國臨時申請案、及2021年7月15日提出的第PCT/US2021/041809號國際申請案(上述的每一者的全部內容藉由引用而被併入本文)中揭露的尿嘧啶穩定多肽(包括USP2(SEQ ID NO:325))及尿嘧啶醣苷酶抑制劑(UGI)域(SEQ ID NO:315),其可增加鹼基編輯效率。因此,融合蛋白可以包括本文描述的RGN或其變異體、去胺酶、及可選地至少一尿嘧啶穩定多肽(例如,UGI或USP2)。在某些實施方式中,與鹼基編輯多肽融合的RGN為切割鹼基編輯多肽(例如,去胺酶)不作用的DNA股的切口酶。
在一些實施方式中,RGN可以與先導編輯多肽融合。先導編輯是一種多功能且精確的基因體編輯方法,該方法使用與聚合酶相關聯的核酸可編程的DNA結合蛋白將新的遺傳訊息直接寫入特定的DNA位點。先導編輯系統使用是切口酶的RGN,且系統以先導編輯(PE)引導RNA(“PEgRNA”)而被編程。PEgRNA是一種引導 RNA,引導 RNA指定標的序列及提供用於替換股的聚合的模板,替換股包含經由設計至引導 RNA(例如,在 5'端或 3'端、或在引導 RNA 的內部)上的延伸的編輯。RGN切口酶/先導編輯多肽融合體由PEgRNA引導至標的序列、並對PAM的上游及待編輯序列的上游的標的股產生缺口,從而在標的股上產生3'瓣(3' flap)。pegRNA包括與標的股的3'瓣互補的引子結合位點(PBS)。在一些實施方式中,PBS的長度至少約5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50個核苷酸。在某些實施方式中,pegRNA包括長度為至少5個(例如,至少5、6、7、8、9、10、11、12、13、14、15、16、17、28、19或20)核苷酸的PBS。在一些實施方式中,pegRNA可以包長度為至少8個核苷酸的PBS。PBS及標的股的3'瓣的雜交允許包含使用 PEgRNA 的延伸作為模板的編輯的替換股的聚合。PEgRNA的延伸可以由RNA或DNA形成。在RNA延伸的情況下,先導編輯器的聚合酶可以是RNA依賴的DNA聚合酶(例如,反轉錄酶)。在DNA延伸的情況下,先導編輯器的聚合酶可以是DNA依賴的DNA聚合酶。
包含期望編輯(例如,單核鹼基置換)的替換股共用相同的序列作為待編輯標的序列的標的股( 除了其包括期望編輯)。經由DNA修復及/或複製機制,標的序列的標的股由包含期望編輯的新合成的替換股替換。在一些情況下,因為先導編輯器不僅搜尋及定位待編輯的期望標的序列、而且同時編碼包含期望編輯的替換股(該編輯設置在標的序列的對應標的股的位置),先導編輯可以被認為是一種「搜尋及替換」基因體編輯技術。因此,在一些實施方式中,揭露內容的引導RNA包括延伸,延伸包括用於先導編輯的編輯模板。在一些實施方式中,可以與RGN融合的先導編輯多肽包括DNA聚合酶。在某些實施方式中, DNA聚合酶是反轉錄酶。在某些實施方式中,RGN是切口酶。
與多肽或域融合的RNA引導的核酸酶可藉由連接子而被連接或分開。本文使用的術語「連接子」指連接兩個分子或部分(例如,核酸酶的結合域及切割域)的化學基團或分子。在一些實施方式中,連接子連接RNA引導的核酸酶的gRNA結合域與例如去胺酶之類的鹼基編輯多肽。在一些實施方式中,連接子連接無核酸酶活性的RGN與去胺酶。通常,連接子位於兩個基團、分子或其他部分之間或兩側、並經由共價鍵而連接到每一基團、分子或其他部分,從而連接二者。在一些實施方式中,連接子為一個胺基酸或複數個胺基酸(例如,胜肽或蛋白質)。在一些實施方式中,連接子為有機分子、基團、聚合物或化學部分。在一些實施方式中,連接子的長度為5-100個胺基酸,例如,5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、30-35、35-40、40-45、45-50、50-60、60-70、70-80、80-90、90-100、100-150或150-200個胺基酸。也可考慮更長或更短的連接子。
目前揭露的RNA引導的核酸酶可以包括至少一核定位訊號(NLS),以增強RGN至細胞的核的輸送。核定位訊號為本領域已知的且通常包括一段鹼性胺基酸(例如,參見Lange等人, J. Biol. Chem. (2007) 282:5101-5105)。在一些實施方式中,RGN包括2、3、4、5、6或更多個核定位訊號。(一或多個)核定位訊號可以是異源NLS。用於目前揭露的RGN的核定位訊號的非限制性範例為SV40大T抗原、核質蛋白及c-Myc的核定位訊號(例如,參見Ray等人(2015) Bioconjug Chem26(6):1004-7)。在特定實施方式中,RGN包括如SEQ ID NO:316或317所示的NLS序列。RGN可在其N端、C端、或在N端及C端二者處包括一或更多NLS序列。例如,RGN可以在N端區域處包括二個NLS序列、以及在C端區域處包括四個NLS序列。
將多肽定位於(多個)特定亞細胞位置的本領域已知的其他定位訊號序列亦可用於靶向RGN,包括但不限於質體定位序列、粒線體定位序列、及靶向質體及粒線體二者的雙靶向訊號序列(例如,參見Nassoury及Morse (2005) Biochim Biophys Acta1743:5-19;Kunze及Berger (2015) Front Physioldx.doi.org/10.3389/fphys.2015.00259;Herrmann及Neupert (2003) IUBMB Life55:219-225;Soll (2002) Curr Opin Plant Biol5:529-535;Carrie及Small (2013) Biochim Biophys Acta1833:253-259;Carrie等人(2009) FEBS J276:1187-1195;Silva-Filho (2003) Curr Opin Plant Biol6:589-595;Peeters及Small (2001) Biochim Biophys Acta1541:54-63;Murcha等人(2014) J Exp Bot65:6301-6335;Mackenzie (2005) Trends Cell Biol15:548-554;Glaser等人(1998) Plant Mol Biol38:311-338)。
在某些實施方式中,目前揭露的RNA引導的核酸酶包括促進RGN的細胞攝取的至少一細胞穿透域。細胞穿透域為本領域已知的且通常包括多段帶正電荷的胺基酸殘基(亦即,聚陽離子細胞穿透域)、交替的極性胺基酸殘基及非極性胺基酸殘基(亦即,雙性細胞穿透域)、或疏水性胺基酸殘基(亦即,疏水性細胞穿透域)(例如,參見Milletti F. (2012) Drug Discov Today17:850-860)。細胞穿透域的非限制性範例為來自人免疫不全病毒1的轉錄活化轉錄活化子(TAT)。
可以將核定位訊號、質體定位訊號、粒線體定位訊號、雙靶向定位訊號、及/或細胞穿透域定位於RNA引導的核酸酶的胺基端(N端)、羧基端(C端)、或內部位置處。
目前揭露的RGN可以經由連接子胜肽而直接或間接地與例如切割域、去胺酶域、或表現調節子域之類的效應子域融合。此種域可以定位於RNA引導的核酸酶的N端、C端或內部位置處。在這些實施方式的一些實施方式中,融合蛋白的RGN組成為無核酸酶活性的RGN或切口酶。
在一些實施方式中,RGN融合蛋白包括為能夠切割多核苷酸(亦即,RNA、DNA或RNA/DNA雜交體)的任何域的切割域、且包括但不限於限制性核酸內切酶及歸巢核酸內切酶(homing endonuclease),例如IIS型核酸內切酶(例如, FokI)(例如,參見Belfort等人(1997) Nucleic Acids Res.25:3379-3388;Linn等人(編輯) Nucleases, Cold Spring Harbor Laboratory Press, 1993)。
在其他實施方式中,RGN融合蛋白包括將核鹼基去胺導致從一種核鹼基轉化為另一種核鹼基的去胺酶域、並包括但不限於胞嘧啶去胺酶或腺嘌呤去胺酶(例如,參見Gaudelli等人(2017) Nature551:464-471、美國公開第2017/0121693號及第2018/0073012號專利、美國第9,840,699號專利及國際公開第WO/2018/027078號專利、或者國際公開第WO 2020/139873號專利、2020年9月11日提出的第63/077,089號、2021年2月8日提出的第63/146,840號以及2021年3月22日提出的第63/164,273號的美國臨時申請案、以及2021年9月10日提出的第PCT/US2021049853號國際申請案中揭露的去胺酶中的任一者,上述的每一者的全部內容藉由引用而被併入本文)。
在一些實施方式中,RGN融合蛋白的效應子域可以是表現調節子域,表現調節子域為用來正調節或負調節轉錄的域。表現調節子域可以是表觀遺傳修飾域、轉錄抑制子域或轉錄活化域。
在這些實施方式的一些實施方式中,RGN融合蛋白的表現調節子包括表觀遺傳修飾域,表觀遺傳修飾域共價地修飾DNA或組蛋白以改變組蛋白結構及/或染色體結構,而不改變DNA序列,導致基因表現的變化(亦即,正調節或負調節)。表觀遺傳修飾的非限制性範例包括DNA中離胺酸殘基的乙醯化或甲基化、精胺酸甲基化、絲胺酸及蘇胺酸磷酸化、及組蛋白的離胺酸泛素化及類泛素化(sumoylation)、及胞嘧啶殘基的甲基化及羥甲基化。表觀遺傳修飾域的非限制性範例包括組蛋白乙醯基轉移酶域、組蛋白去乙醯基酶域、組蛋白甲基轉移酶域、組蛋白去甲基酶域、DNA甲基轉移酶域及DNA去甲基酶域。
在其他實施方式中,融合蛋白的表現調節子包括轉錄抑制子域,轉錄抑制子域與例如RNA聚合酶及轉錄因子之類的轉錄控制元素及/或轉錄調節蛋白相互作用,以減少或終止至少一基因的轉錄。轉錄抑制子域為本領域已知的且包括但不限於類Sp1抑制子、IκB及Krüppel相關盒(KRAB)域。
在還是其他實施方式中,融合蛋白的表現調節子包括轉錄活化域,轉錄活化域與例如RNA聚合酶及轉錄因子之類的轉錄控制元素及/或轉錄調節蛋白相互作用,以增加或活化至少一基因的轉錄。轉錄活化域為本領域已知的且包括但不限於單純皰疹病毒VP16活化域及NFAT活化域。
目前揭露的RGN多肽可以包括可檢測標記或純化標籤。可檢測標記或純化標籤可以直接地或經由連接子胜肽間接地定位於RNA引導的核酸酶的N端、C端或內部位置處。在這些實施方式的一些實施方式中,融合蛋白的RGN組成為無核酸酶活性的RGN。在其他實施方式中,融合蛋白的RGN組成為具有切口酶活性的RGN。
可檢測標記為可以看得見的或可以其他方式觀察到的分子。可檢測標記可以與RGN融合作為融合蛋白(例如,螢光蛋白)、或者可以與RGN多肽結合的小分子,其可以視覺上檢測或以其他方式檢測。可以作為融合蛋白而與目前揭露的RGN融合的可檢測標記包括任何可檢測蛋白域,包括但不限於可用專一性抗體檢測的蛋白域或螢光蛋白。螢光蛋白的非限制性範例包括綠色螢光蛋白(例如,GFP、EGFP、ZsGreen1)及黃色螢光蛋白(例如,YFP、EYFP、ZsYellow1)。小分子可檢測標記的非限制性範例包括放射性標記,例如, 3H及 35S。
RGN多肽亦可以包括純化標籤,純化標籤為可以用於從混合物(例如,生物樣品、培養基)中分離蛋白質或融合蛋白的任何分子。純化標籤的非限制性範例包括生物素、myc、麥芽糖結合蛋白(MBP)、麩胱甘肽-S-轉移酶(GST)及3X FLAG標籤。 III. 引導 RNA
本揭露內容提供引導RNA及編碼引導RNA的多核苷酸。術語「引導RNA」是指與標的核苷酸序列具有足夠互補性以與標的序列雜交並引導相關聯的RNA引導的核酸酶與標的核苷酸序列序列專一性結合的核苷酸序列。因此,RGN各自的引導RNA為一或更多RNA分子(通常是一或二個),其可以與RGN結合並引導RGN與特定標的核苷酸序列結合,且在RGN具有切口酶或核酸酶活性的那些實施方式中,也切割標的核苷酸序列。一般來說,引導RNA包括CRISPR RNA(crRNA)及轉錄活化CRISPR RNA(tracrRNA)。包括crRNA及tracrRNA二者的天然引導RNA通常包括二個單獨的RNA分子,這些RNA分子經由crRNA的重複序列及tracrRNA的抗重複序列彼此雜交。
CRISPR陣列內的天然直接重複序列的長度通常在28至37個鹼基對的範圍內,但該長度可在約23 bp至約55 bp之間變化。CRISPR陣列內的間隔序列的長度通常在約32至約38 bp的範圍內,但長度可在約21 bp至約72 bp之間。每一個CRISPR陣列通常包括少於50個單位的CRISPR重複-間隔序列。CRISPR被轉錄為稱為初級CRISPR轉錄本的長轉錄本的一部分,其包括CRISPR陣列的大部分。初級CRISPR轉錄本被Cas蛋白切割以產生crRNA,或者在一些情況中,產生前驅crRNA(pre-crRNA),這些前驅crRNA被其他Cas蛋白進一步處理為成熟的crRNA。成熟的crRNA包括間隔序列及CRISPR重複序列。在前驅crRNA被處理為成熟的(或處理的)crRNA的一些實施方式中,成熟涉及去除約1至約6個或更多個5'、3'、或5'及3'核苷酸。為了基因體編輯或靶向所關注的特定標的核苷酸序列的目的,在前驅crRNA分子成熟期間被去除的這些核苷酸對於產生或設計引導RNA不是必需的。
CRISPR RNA(crRNA)包括間隔序列及CRISPR重複序列。「間隔序列」為與所關注的標的核苷酸序列直接雜交的核苷酸序列。間隔序列被工程化為與所關注的標的序列完全地或部分地互補。在各種實施方式中,間隔序列可以包括約8個核苷酸至約30個核苷酸或更多個核苷酸。例如,間隔序列的長度可是約8、約9、約10、約11、約12、約13、約14、約15、約16、約17、約18、約19、約20、約21、約22、約23、約24、約25、約26、約27、約28、約29、約30或更多個核苷酸。在一些實施方式中,間隔序列的長度為8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30或更多個核苷酸。在一些實施方式中,間隔序列的長度為約10至約26個核苷酸、或長度為約12至約30個核苷酸。在一些實施方式中,間隔序列的長度為19-27個核苷酸。在某些實施方式中,特別是當RGN具有如SEQ ID NO:6所示的胺基酸序列或其活性變異體或片段時,間隔序列的長度為21-24個核苷酸。在特定實施方式中,間隔序列的長度為約30個核苷酸。在一些實施方式中,間隔序列的長度為30個核苷酸。在一些實施方式中,當使用適合的比對演算法進行最佳比對時,間隔序列與其對應的標的序列之間的互補性程度為介於50%與99%之間或更高,包括但不限於包括約或大於約50%、約60%、約70%、約75%、約80%、約81%、約82%、約83%、約84%、約85%、約86%、約87%、約88%、約89%、約90%、約91%、約92%、約93%、約94%、約95%、約96%、約97%、約98%、約99%或更高。在特定實施方式中,當使用適合的比對演算法進行最佳比對時,間隔序列與其對應的標的序列之間的互補性程度為50%、60%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高。在特定實施方式中,間隔序列不含可使用本領域已知的任何適合的多核苷酸折疊演算法預測的二級結構,多核苷酸折疊演算法包括但不限於mFold(例如,參見Zuker及Stiegler (1981) Nucleic Acids Res. 9:133-148)及RNAfold(例如,參見Gruber等人(2008) Cell106(1):23-24)。
CRISPR RNA重複序列包括形成可被RGN分子辨識的結構的核苷酸序列,該結構是核苷酸序列者獨自形成的或者與雜交的tracrRNA一起形成的。在各種實施方式中,CRISPR RNA重複序列可以包括約8個核苷酸至約30個核苷酸或更多個核苷酸。例如,CRISPR重複序列的長度可為約8、約9、約10、約11、約12、約13、約14、約15、約16、約17、約18、約19、約20、約21、約22、約23、約24、約25、約26、約27、約28、約29、約30或更多個核苷酸。在特定實施方式中,CRISPR重複序列的長度為8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30或更多個核苷酸。在一些實施方式中,當使用適合的比對演算法進行最佳比對時,CRISPR重複序列與其對應的tracrRNA序列之間的互補性程度為約或大於約50%、約60%、約70%、約75%、約80%、約81%、約82%、約83%、約84%、約85%、約86%、約87%、約88%、約89%、約90%、約91%、約92%、約93%、約94%、約95%、約96%、約97%、約98%、約99%或更高。在特定實施方式中,當使用適合的比對演算法進行最佳比對時,CRISPR重複序列與其對應的tracrRNA序列之間的互補性程度為50%、60%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高。
在特定實施方式中,CRISPR重複序列包括SEQ ID NO:13-24中任一者的核苷酸序列或其活性變異體或片段,其當被包括於引導RNA內時能夠引導本文所提供的關聯的RNA引導的核酸酶與所關注的標的序列的序列專一性結合。在某些實施方式中,野生型序列的活性CRISPR重複序列變異體包括與如SEQ ID NO:13-24中任一者所示的核苷酸序列具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列一致性的核苷酸序列。在某些實施方式中,野生型序列的活性CRISPR重複序列片段包括如SEQ ID NO:13-24中任一者所示的核苷酸序列的至少5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21或22個連續核苷酸。
在某些實施方式中,crRNA不是天然存在的。在這些實施方式的一些實施方式中,特定的CRISPR重複序列在本質上不與工程化的間隔序列連接,且CRISPR重複序列被認為與間隔序列異源。在某些實施方式中,間隔序列為非天然存在的工程化的序列。
轉錄活化的CRISPR RNA或tracrRNA分子包括核苷酸序列,核苷酸序列包括具有足夠互補性以與crRNA的CRISPR重複序列雜交的的區域,其在本文中被稱為抗重複區。在一些實施方式中,tracrRNA分子進一步包括具有二級結構(例如,莖環)的區域、或在與其對應的crRNA雜交時形成二級結構。在特定實施方式中,與CRISPR重複序列完全地或部分地互補的tracrRNA的區域是在分子的5'端,且該tracrRNA的3'端包括二級結構。此二級結構區域通常包括若干髮夾結構,包括被發現與抗重複序列相鄰的連接(nexus)髮夾。該連接在引導RNA與RGN之間形成相互作用的核心、並處於引導RNA、RGN與標的DNA之間的相交處。連接髮夾通常在髮夾莖的鹼基中具有保留的核苷酸序列,而且模體UNANNC(SEQ ID NO:318)存在於tracrRNA中的許多連接髮夾中。有趣的是,本發明的若干RGN使用在其連接髮夾的髮夾莖的鹼基中包括非典型序列的tracrRNA,其包括UNANNA、UNANNG及CNANNC(分別為SEQ ID NO:319、321及322)。tracrRNA的3'端處常常存在末端髮夾,其結構及數量可有所不同,但通常包括富含GC的Rho獨立轉錄終止子髮夾,其後在3'端處具有一串U。例如,參見Briner等人(2014) Molecular Cell56:333-339、Briner及Barrangou (2016) Cold Spring Harb Protoc; doi: 10.1101/pdb.top090902及美國公開第2017/0275648號,其每一者的全部內容藉由引用併入本文。
在各種實施方式中,與CRISPR重複序列完全地或部分地互補的tracrRNA的抗重複區包括約8個核苷酸至約30個核苷酸或更多個核苷酸。例如,tracrRNA抗重複序列與CRISPR重複序列之間的鹼基配對區域的長度可以是約8、約9、約10、約11、約12、約13、約14、約15、約16、約17、約18、約19、約20、約21、約22、約23、約24、約25、約26、約27、約28、約29、約30或更多個核苷酸。在特定實施方式中,tracrRNA抗重複序列與CRISPR重複序列之間的鹼基配對區域的長度可以是6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30或更多個核苷酸。在一些實施方式中,當使用適合的比對演算法進行最佳比對時,CRISPR重複序列與其對應的tracrRNA抗重複序列之間的互補性程度為約或大於約50%、約60%、約70%、約75%、約80%、約81%、約82%、約83%、約84%、約85%、約86%、約87%、約88%、約89%、約90%、約91%、約92%、約93%、約94%、約95%、約96%、約97%、約98%、約99%或更高。在特定實施方式中,當使用適合的比對演算法進行最佳比對時,CRISPR重複序列與其對應的tracrRNA抗重複序列之間的互補性程度為約或大於50%、60%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高。
在各種實施方式中,整個tracrRNA可以包括約60個核苷酸至多於約210個核苷酸。例如,tracrRNA的長度可以是約60、約65、約70、約75、約80、約85、約90、約95、約100、約105、約110、約115、約120、約125、約130、約135、約140、約150、約160、約170、約180、約190、約200、約210或更多個核苷酸。在特定實施方式中,tracrRNA的長度為60、65、70、75、80、85、90、95、100、105、110、115、120、125、130、135、140、150、160、170、180、190、200、210或更多個核苷酸。在特定實施方式中,tracrRNA的長度為約70至約105個核苷酸,包括約70、約71、約72、約73、約74、約75、約76、約77、約78、約79、約80、約81、約82、約83、約84、約85、約86、約87、約88、約89、約90、約91、約92、約93、約94、約95、約96、約97、約98、約99、約100、約101、約102、約103、約104個及約105個核苷酸。在特定實施方式中,tracrRNA的長度為70至105個核苷酸,包括70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104及105個核苷酸。
在特定實施方式中,tracrRNA包括SEQ ID NO:25-36中任一者的核苷酸序列或其活性變異體或片段,其當被包括於引導RNA內時能夠引導本文提供的相關聯RNA引導的核酸酶與所關注的標的序列的序列專一性結合。在某些實施方式中,野生型序列的活性tracrRNA序列變異體包括與如SEQ ID NO:25-36中任一者所示的核苷酸序列具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列一致性的核苷酸序列。在某些實施方式中,野生型序列的活性tracrRNA序列片段包括如SEQ ID NO:25-36中任一者所示的核苷酸序列的至少5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80或更多個連續核苷酸。
當二個序列在嚴格條件下彼此雜交時,可認為該二個多核苷酸序列實質上互補。同樣地,如果與RGN結合的引導RNA在嚴格條件下與標的序列結合,則認為RGN以序列專一性方式與特定標的序列結合。「嚴格條件」或「嚴格雜交條件」意指在該條件下的二個多核苷酸序列彼此雜交的可檢測程度比與其他序列雜交的可檢測程度大(例如,比背景高至少2倍)。嚴格條件為序列依賴的、且在不同環境下將會不同。典型地,嚴格條件將是其中:在pH 7.0至8.3,鹽類濃度小於約1.5 M Na離子(典型地約0.01至1.0 M Na離子濃度(或其它鹽類)),且對於短序列(例如,10至50個核苷酸),溫度為至少約30°C,而對於長序列(例如,大於50個核苷酸),溫度為至少約60°C的那些條件。藉由添加例如甲醯胺的去穩定劑也可達到嚴格條件。範例性的低嚴格條件包括在37°C下於30至35%甲醯胺、1 M NaCl、1% SDS(十二基硫酸鈉)的緩衝溶液中雜交,並在50至55°C下於1X至2X SSC(20X SSC = 3.0 M NaCl/0.3 M檸檬酸三鈉)中洗滌。範例性的中等嚴格條件包括在37°C下於40至45%甲醯胺、1.0 M NaCl、1% SDS中雜交,並在55至60°C下於0.5X至1X SSC中洗滌。範例性的高嚴格條件包括在37°C下於50%甲醯胺、1 M NaCl、1% SDS中雜交,及在60至65°C下於0.1X SSC中洗滌。可選地,洗滌緩衝液可以包括約0.1%至約1%的SDS。雜交持續時間一般小於約24小時,通常約4至約12小時。洗滌時間的持續時間將至少為足以達到平衡的時間長度。
Tm為50%的互補標的序列與完全匹配的序列雜交的溫度(於限定的離子強度及pH下)。對於DNA-DNA雜交體,Tm可以從Meinkoth及Wahl(1984)Anal. Biochem. 138:267-284的等式:Tm = 81.5°C + 16.6 (log M) + 0.41 (%GC) - 0.61 (% form) - 500/L大致估計;其中M為單價陽離子的莫耳濃度,%GC為DNA中鳥苷及胞嘧啶核苷酸的百分比,%形式為雜交溶液中甲醯胺的百分比,以及L為鹼基對中的雜交體的長度。一般地,嚴格條件被選擇為在限定的離子強度及pH下比專一性序列及其互補序列的熱熔點(Tm)低約5°C。然而,極度嚴格條件可以在比熱熔點(Tm)低1、2、3或4°C下進行雜交及/或洗滌;中等嚴格條件可以在比熱熔點(Tm)低6、7、8、9或10°C下進行雜交及/或洗滌;低嚴格條件可在比熱熔點(Tm)低11、12、13、14、15或20℃下進行雜交及/或洗滌。本領域具有通常知識者將明白,使用該等式、雜交及洗滌組成物以及所需的Tm,雜交及/或洗滌溶液的嚴格性的變化被固有地描述。核酸雜交的廣泛指南可在Tijssen (1993) Laboratory Techniques in Biochemistry and Molecular Biology—Hybridization with Nucleic Acid Probes, 第I部分, 第2章 (Elsevier,紐約);以及Ausubel等人編輯(1995) Current Protocols in Molecular Biology, 第2章(Greene Publishing and Wiley-Interscience,紐約)中得到。參見Sambrook等人(1989) Molecular Cloning: A Laboratory Manual (第二版,Cold Spring Harbor Laboratory Press, Plainview,紐約)。
術語「序列專一性」亦可指,相較於與隨機化背景序列的結合,以更高頻率與標的序列結合。
引導RNA可以是單引導RNA(sgRNA)或雙引導RNA系統。單引導RNA包括單RNA分子上的crRNA及tracrRNA,而雙引導RNA系統包括存在於經由crRNA的CRISPR重複序列的至少一部分及tracrRNA的至少一部分而彼此雜交的二個不同RNA分子上的crRNA及tracrRNA,tracrRNA的至少一部分可以與crRNA的CRISPR重複序列完全地或部分地互補。在其中引導RNA為單引導RNA的那些實施方式中的一些實施方式中,crRNA與tracrRNA被連接子核苷酸序列分開。一般來說,為避免二級結構於連接子核苷酸序列的核苷酸內的形成或避免包括核苷酸的二級結構的形成,連接子核苷酸序列為不包括互補鹼基的核苷酸序列。在一些實施方式中,crRNA與tracrRNA之間的連接子核苷酸序列的長度為至少3、至少4、至少5、至少6、至少7、至少8、至少9、至少10、至少11、至少12個或更多個核苷酸。在特定實施方式中,單引導RNA的連接子核苷酸序列的長度為至少4個核苷酸。在某些實施方式中,連接子核苷酸序列為如SEQ ID NO:323所示的核苷酸序列。
單引導RNA或雙引導RNA可被化學合成或經由體外轉錄合成。用於確定RGN與引導RNA之間的序列專一性結合的測定法為本領域已知的、且包括但不限於表現的RGN與引導RNA之間的體外結合測定法,其可用可檢測的標記物(例如,生物素)標記並用於下拉檢測測定法,其中,引導RNA:RGN錯合物是經由可檢測標記(例如,利用鏈黴親和磁珠)捕獲的。具有與引導RNA無關的序列或結構的對照引導RNA可作為RGN與RNA的非專一性結合的陰性對照。在某些實施方式中,引導RNA為SEQ ID NO:37-48中任一者,其中間隔序列可以是任何序列且以多-N(poly-N)序列表示。
在某些實施方式中,引導RNA可以作為RNA分子而被引入標的細胞、胞器或胚胎中。引導RNA可以在體外轉錄或化學合成。在其他實施方式中,將編碼引導RNA的核苷酸序列引入細胞、胞器或胚胎中。在這些實施方式的一些實施方式中,編碼引導RNA的核苷酸序列可操作地被連接至啟動子(例如,RNA聚合酶III啟動子)。啟動子可以是天然啟動子或與編碼引導RNA的核苷酸序列異源。
在各種實施方式中,如本文所述,可以將引導RNA作為核糖核蛋白錯合物引入標的細胞、胞器或胚胎中,其中引導RNA與RNA引導的核酸酶多肽結合。
經由引導RNA與標的核苷酸序列的雜交,引導RNA將關聯的RNA引導的核酸酶引導至所關注的特定標的核苷酸序列。標的核苷酸序列可以包括DNA、RNA或二者的組合、且可以是單股或雙股的。標的核苷酸序列可以是基因體DNA(即染色體DNA)、質體DNA、或RNA分子(例如,傳訊RNA、核醣體RNA、轉移RNA、微小RNA、短小干擾RNA)。標的核苷酸序列可以在體外或在細胞中被RNA引導的核酸酶結合(而在一些實施方式中被切割)。RGN靶向的染色體序列可以是核、質體或粒線體的染色體序列。在一些實施方式中,標的核苷酸序列於標的基因體中是獨特的。
標的核苷酸序列與前間隔序列鄰近模體(PAM)相鄰。前間隔序列鄰近模體一般在距離標的核苷酸序列約1至約10個核苷酸內,包括距離標的核苷酸序列約1、約2、約3、約4、約5、約6、約7、約8、約9或約10個核苷酸。在特定實施方式中,PAM在距離標的核苷酸序列1至10個核苷酸內,包括距離標的核苷酸序列1、2、3、4、5、6、7、8、9或10個核苷酸。PAM可以是標的序列的5'或3'。在一些實施方式中,PAM為目前揭露的RGN的標的序列的3'。通常,PAM是約3-4個核苷酸的共通序列,但在特定實施方式中,PAM的長度可為2、3、4、5、6、7、8、9或更多個核苷酸。在各種實施方式中,目前揭露的RGN辨識的PAM序列包括如SEQ ID NO:73-84中任一者所示的共通序列。
在特定實施方式中,具有SEQ ID NO:1-12中任一者或其活性變異體或片段的RNA引導的核酸酶結合與如SEQ ID NO:73-84中任一者所示的PAM序列相鄰的標的核苷酸序列。在一些實施方式中,RNG與包括分別如SEQ ID NO:13-24中任一者所示的CRISPR重複序列或其活性變異體或片段、及分別如SEQ ID NO:25-36中任一者所示的tracrRNA序列或其活性變異體或片段的引導序列結合。RGN系統進一步描述於本說明書的範例1-3及表1及表2中。
在一些實施方式中,當與包括如SEQ ID NO:13所示的CRISPR重複序列或其活性變異體或片段、及如SEQ ID NO:25所示的tracrRNA序列或其活性變異體或片段的引導RNA結合時,具有SEQ ID NO:1或其活性變異體或片段的RNA引導的核酸酶結合與如SEQ ID NO:73所示的PAM序列相鄰的標的核苷酸序列。
在一些實施方式中,當與包括如SEQ ID NO:14所示的CRISPR重複序列或其活性變異體或片段、及如SEQ ID NO:26所示的tracrRNA序列或其活性變異體或片段的引導RNA結合時,具有SEQ ID NO:2或其活性變異體或片段的RNA引導的核酸酶結合與如SEQ ID NO:74所示的PAM序列相鄰的標的核苷酸序列。
在一些實施方式中,當與包括如SEQ ID NO:15所示的CRISPR重複序列或其活性變異體或片段、及如SEQ ID NO:27所示的tracrRNA序列或其活性變異體或片段的引導RNA結合時,具有SEQ ID NO:3或其活性變異體或片段的RNA引導的核酸酶結合與如SEQ ID NO:75所示的PAM序列相鄰的標的核苷酸序列。
在一些實施方式中,當與包括如SEQ ID NO:16所示的CRISPR重複序列或其活性變異體或片段、及如SEQ ID NO:28所示的tracrRNA序列或其活性變異體或片段的引導RNA結合時,具有SEQ ID NO:4或其活性變異體或片段的RNA引導的核酸酶結合與如SEQ ID NO:76所示的PAM序列相鄰的標的核苷酸序列。
在一些實施方式中,當與包括如SEQ ID NO:17所示的CRISPR重複序列或其活性變異體或片段、及如SEQ ID NO:29所示的tracrRNA序列或其活性變異體或片段的引導RNA結合時,具有SEQ ID NO:5或其活性變異體或片段的RNA引導的核酸酶結合與如SEQ ID NO:77所示的PAM序列相鄰的標的核苷酸序列。
在一些實施方式中,當與包括如SEQ ID NO:18所示的CRISPR重複序列或其活性變異體或片段、及如SEQ ID NO:30所示的tracrRNA序列或其活性變異體或片段的引導RNA結合時,具有SEQ ID NO:6或其活性變異體或片段的RNA引導的核酸酶結合與如SEQ ID NO:78所示的PAM序列相鄰的標的核苷酸序列。
在一些實施方式中,當與包括如SEQ ID NO:19所示的CRISPR重複序列或其活性變異體或片段、及如SEQ ID NO:31所示的tracrRNA序列或其活性變異體或片段的引導RNA結合時,具有SEQ ID NO:7或其活性變異體或片段的RNA引導的核酸酶結合與如SEQ ID NO:79所示的PAM序列相鄰的標的核苷酸序列。
在一些實施方式中,當與包括如SEQ ID NO:20所示的CRISPR重複序列或其活性變異體或片段、及如SEQ ID NO:32所示的tracrRNA序列或其活性變異體或片段的引導RNA結合時,具有SEQ ID NO:8或其活性變異體或片段的RNA引導的核酸酶結合與如SEQ ID NO:80所示的PAM序列相鄰的標的核苷酸序列。
在一些實施方式中,當與包括如SEQ ID NO:21所示的CRISPR重複序列或其活性變異體或片段、及如SEQ ID NO:33所示的tracrRNA序列或其活性變異體或片段的引導RNA結合時,具有SEQ ID NO:9或其活性變異體或片段的RNA引導的核酸酶結合與如SEQ ID NO:81所示的PAM序列相鄰的標的核苷酸序列。
在一些實施方式中,當與包括如SEQ ID NO:22所示的CRISPR重複序列或其活性變異體或片段、及如SEQ ID NO:34所示的tracrRNA序列或其活性變異體或片段的引導RNA結合時,具有SEQ ID NO:10或其活性變異體或片段的RNA引導的核酸酶結合與如SEQ ID NO:82所示的PAM序列相鄰的標的核苷酸序列。
在一些實施方式中,當與包括如SEQ ID NO:23所示的CRISPR重複序列或其活性變異體或片段、及如SEQ ID NO:35所示的tracrRNA序列或其活性變異體或片段的引導RNA結合時,具有SEQ ID NO:11或其活性變異體或片段的RNA引導的核酸酶結合與如SEQ ID NO:83所示的PAM序列相鄰的標的核苷酸序列。
在一些實施方式中,當與包括如SEQ ID NO:24所示的CRISPR重複序列或其活性變異體或片段、及如SEQ ID NO:36所示的tracrRNA序列或其活性變異體或片段的引導RNA結合時,具有SEQ ID NO:12或其活性變異體或片段的RNA引導的核酸酶結合與如SEQ ID NO:84所示的PAM序列相鄰的標的核苷酸序列。
本領域中眾所周知,對於給定的核酸酶酵素的PAM序列專一性受酵素濃度的影響(例如,參見 Karvelis等人(2015) Genome Biol16:253),其可藉由改變用於表現RGN的啟動子或遞送至細胞、胞器或胚胎的核糖核蛋白錯合物的量而被修飾。
在辨識與其對應的PAM序列時,RGN可以在專一性切割位點切割標的核苷酸序列。如本文所使用的,切割位點是由標的核苷酸序列內的二個特定核苷酸組成,二個特定核苷酸之間的核苷酸序列被RGN切割。該切割位點可以包括從PAM的5'或3'方向上起的第1及第2、第2及第3、第3及第4、第4及第5、第5及第6、第7及第8、或第8及第9個核苷酸。在一些實施方式中,切割位點可以從PAM的5'或3'方向上起的10、11、12、13、14、15、16、17、18、19或20個以上的核苷酸。在一些實施方式中,特別是其中RGN具有如SEQ ID NO:6所示的胺基酸序列或其活性變異體或片段的那些,RGN的切割位點在PAM的5'的第3及第4個核苷酸之間,產生平端。因為RGN可以切割標的核苷酸序列,導致交錯的末端,所以在一些實施方式中,基於多核苷酸的正(+)股上的二個核苷酸與PAM的距離及多核苷酸的負(-)股上的二個核苷酸與PAM的距離來界定切割位點。 IV. 編碼 RNA 引導的核酸酶、 CRISPR RNA / tracrRNA 的核苷酸
本揭露內容提供包括目前揭露的CRISPR RNA、tracrRNA及/或sgRNA的多核苷酸及包括編碼目前揭露的RNA引導的核酸酶、CRISPR RNA、tracrRNA及/或sgRNA的核苷酸序列的多核苷酸。目前揭露的多核苷酸包括那些包括或編碼CRISPR重複序列的多核苷酸,CRISPR重複序列包括如SEQ ID NO:13-24中任一者所示的核苷酸序列或其活性變異體或片段,其當被包括於引導RNA內時能夠引導關聯的RNA引導的核酸酶與所關注的標的序列的序列專一性結合。亦揭露包括或編碼tracrRNA的多核苷酸,tracrRNA包括如SEQ ID NO:25-36中任一者所示的核苷酸序列或其活性變異體或片段,其當被包括於引導RNA內時能夠將關聯RNA引導的核酸酶的序列專一性結合導向所關注的標的序列。還提供編碼RNA引導的核酸酶的多核苷酸,RNA引導的核酸酶包括如SEQ ID NO:1-12中任一者所示的胺基酸序列及其活性片段或變異體,其保留以RNA引導的序列專一性方式與標的核苷酸序列結合的能力。
術語「多核苷酸」或「核酸分子」的使用不旨在將本揭露內容限制於包括DNA的多核苷酸。本領域中具有通常知識者將認識到多核苷酸可以包括核糖核苷酸(RNA)及核糖核苷酸與去氧核糖核苷酸的組合。此種去氧核糖核苷酸及核糖核苷酸包括天然存在的分子及合成類似物二者。這些包括胜肽核酸(PNA)、PNA-DNA嵌合體(chimer)、鎖核酸(LNA)及硫代磷酸酯連接的序列。本文揭露的多核苷酸亦包含所有形式的序列,包括但不限於單股形式、雙股形式、DNA-RNA雜交體、三顯體結構(triplex structure)、莖環結構等等。
在一些實施方式中,編碼目前揭露的RGN的多核苷酸是mRNA(傳訊RNA)分子。mRNA指編碼的所關注的多肽、且能夠被轉譯以在體外、體內、原位或離體產生編碼的所關注的多肽的任何多核苷酸。在實施方式中, mRNA分子的基本組成包括至少一編碼區、5'UTR、3'UTR、5'帽(5' cap)及多A尾(poly-A tail)。在實施方式中,編碼目前揭露的方法及組成物中有用的RGN的mRNA可包括一或更多結構及/或化學修飾或改變,這些修飾或改變賦予多核苷酸有用的特性。例如,mRNA的有用特性包括不實質誘導被引入mRNA的細胞的先天免疫反應。「結構」特徵或修飾是在mRNA中插入、缺失、複製、倒轉或隨機化兩個或更多連接的核苷酸,而沒有對核苷酸本身進行顯著化學修飾。因為化學鍵將必然被打斷且重新形成以產生結構修飾,故結構修飾是化學性質的,且因此是化學修飾。然而,結構修飾將導致不同的核苷酸序列。對mRNA的化學修飾可以涉及包括mRNA中的5-甲基胞嘧啶、N1-甲基-假尿苷、假尿苷、2-硫尿苷、4-硫尿苷、5-甲氧基尿苷、2'氟鳥苷、2'氟尿苷、5-溴尿苷、5-(2-甲氧羰基乙烯基)尿苷、5-[3(1-E-丙烯基氨基)]尿苷、α-硫胞苷、N6-甲基腺苷、5-甲基胞苷、N4-乙醯胞苷、5-甲醯胞苷或其組合。
編碼RGN的核酸分子可以針對於所關注的生物體中的表現而被密碼子最佳化。「密碼子最佳化的」編碼序列是使其密碼子使用頻率設計成模擬較佳密碼子使用頻率或特定宿主細胞的轉錄條件的多核苷酸編碼序列。由於核酸層次上的一或更多密碼子的改變,特定宿主細胞或生物體中的表現被增強,使得轉譯的胺基酸序列未改變。核酸分子可以全部或部分地被密碼子最佳化。提供一大範圍生物體的偏好資訊的其他參考文獻及密碼子表在本領域中是可得的(例如,參見 Campbell及Gowri(1990) Plant Physiol. 92:1-11,有關植物偏好的密碼子使用的討論)。本領域中用於合成植物偏好的基因或哺乳動物(例如,人類)密碼子最佳化的編碼序列的方法是可得的。例如,參見美國第5,380,831號與第5,436,391號專利及Murray等人(1989) Nucleic Acids Res.17:477-498,其藉由引用併入本文。
編碼本文提供的RGN、crRNA、tracrRNA及/或sgRNA的多核苷酸可以在表現匣中提供,以用於在體外表現或在所關注的細胞、胞器、胚胎或生物體中表現。該匣將包括5'及3'調節序列,5'及3'調節序列可操作地連接至編碼本文中提供的允許多核苷酸表現的RGN、crRNA、tracrRNA及/或sgRNA的多核苷酸。該匣可以額外含有至少一額外基因或遺傳元素,以共轉化至生物體內。在包括額外基因或元素的情況下,這些組成是可操作地連接的。術語「可操作地連接」旨在表達二個或更多元素之間的功能性連接。例如,啟動子與所關注的編碼區域(例如,對RGN、crRNA、tracrRNA及/或sgRNA編碼的區域)之間的可操作地連接為允許所關注的編碼區域表現的功能性連接。可操作地連接的元素可以是連續的或非連續的。當用於指二個蛋白質編碼區域的連結時,藉由可操作地連接意指編碼區域在相同的閱讀框(reading frame)中。替代地,可以在多個表現匣上提供(一或多個)額外基因或元素。例如,編碼目前揭露的RGN的核苷酸序列可以存在於一個表現匣上,而編碼crRNA、tracrRNA或完整引導RNA的核苷酸序列可以在分開的表現匣上。提供具有複數個限制性位點及/或重組位點的此種表現匣,以用於多核苷酸的插入受調節區域的轉錄調節。表現匣可以額外含有篩選標記基因。
表現匣於轉錄的5'-3'方向上將包括轉錄(而在一些實施方式中為轉譯)起始區域(亦即,啟動子)、本發明的RGN-、crRNA-、tracrRNA-及/或sgRNA-編碼的多核苷酸、及於所關注的生物體中起作用的轉錄(而在一些實施方式中為轉譯)終止區域(亦即,終止區域)。本發明的啟動子能夠在宿主細胞中引導或驅動編碼序列的表現。調節區域(例如,啟動子、轉錄調節區域及轉譯終止區域)可以與宿主細胞是內源或異源、或彼此是內源的或異源的。如本文所使用的,關於序列的「異源」為源自外來物種的序列,或者,如果來自相同物種,則為藉由蓄意的人為干預從其天然形式在組成及/或基因體位點上實質上被修飾的序列。如本文中所使用的,嵌合基因包括可操作地連接至與編碼序列異源的轉錄起始區域的編碼序列。
合宜的終止區域可以從農桿菌( A. tumefaciens)的Ti質體獲得,例如章魚肉鹼合成酶及胭脂鹼(nopaline)合成酶終止區域。亦參見Guerineau等人(1991) Mol. Gen. Genet.262:141-14;Proudfoot (1991) Cell64:671-674;Sanfacon等人(1991) Genes Dev.5:141-149;Mogen等人(1990) Plant Cell2:1261-1272;Munroe等人(1990) Gene91:151-158;Ballas等人(1989) Nucleic Acids Res.17:7891-7903;以及Joshi等人(1987) Nucleic Acids Res.15:9627-9639。
另外的調節訊號包括但不限於轉錄起始開始位點、操作子、活化子、增強子、其他調節元素、核醣體結合位點、起始密碼子、終止訊號等等。參見例如第5,039,523號和第4,853,331號美國專利;EPO 0480762A2;Sambrook等人 (1992) Molecular Cloning: A Laboratory Manual, ed. Maniatis等人(Cold Spring Harbor Laboratory Press), Cold Spring Harbor, N.Y.,以下稱「Sambrook 11」;Davis等人編輯(1980) Advanced Bacterial Genetics (Cold Spring Harbor Laboratory Press), Cold Spring Harbor, N.Y.以及其中引用的參考文獻。
在製備表現匣時,可操縱各種DNA片段,以便在適宜的方向上及適當的情況下於適宜閱讀框中提供DNA序列。為此,可以運用銜接子或連接子來連接DNA片段,或者可以涉及其他操作以提供合宜的限制位點、移除多餘的DNA、移除限制位點等等。為此目的,可以涉及體外誘變、引子修復、限制、黏合(annealing)、重新取代(例如,轉位(transition)及置換(transversion))。
許多啟動子可用於實施本發明。可以基於期望的結果來選擇啟動子。核酸可以與持續型、誘導型、生長階段特定、細胞類型特定、組織偏好、組織特定的啟動子或其他啟動子結合,以在所關注的生物體中表現。例如,參見如WO 99/43838中及如第8,575,425號;第7,790,846號;第8,147,856號;第8,586832號;第7,772,369號;第7,534,939號;第6,072,050號;第5,659,026號;第5,608,149號;第5,608,144號;第5,604,121號;第5,569,597號;第5,466,785號;第5,399,680號;第5,268,463號;第5,608,142號;以及第6,177,611號美國專利中所示的啟動子;其藉由引用併入本文。
為了在植物中表現,持續型啟動子亦包括CaMV 35S啟動子(Odell等人(1985) Nature313:810-812);水稻肌動蛋白(McElroy等人(1990) Plant Cell2:163-171);泛素(Christensen等人(1989) Plant Mol. Biol.12:619-632及Christensen等人(1992) Plant Mol. Biol.18:675-689);pEMU(Last等人(1991) Theor. Appl. Genet.81:581-588);以及MAS(Velten等人(1984) EMBO J.3:2723-2730)。
誘導型啟動子的範例為可以藉由缺氧或冷逆境誘導的Adh1啟動子、可以藉由熱逆境誘導的Hsp70啟動子、可以由光誘導的PPDK啟動子及磷酸稀醇丙酮酸羧化酶(pepcarboxylase)啟動子。化學誘導的啟動子也是有用的,例如保護劑誘導的In2-2啟動子(美國第5,364,780號專利)、生長素誘導的且是絨氈層特定但在癒傷組織中亦有活性的Axig1啟動子(PCT US01/22169)、類固醇反應性啟動子(例如,參見Schena等人(1991) Proc. Natl. Acad. Sci. USA88:10421-10425及McNellis等人(1998) Plant J. 14(2):247-257中的雌激素誘導的ERE啟動子及糖皮質激素誘導型啟動子)、及四環素誘導型和四環素抑制型啟動子(例如,參見Gatz等人(1991) Mol. Gen. Genet. 227:229-237及美國第5,814,618號及第5,789,156號專利),其藉由引用併入本文。
組織特定或組織偏好的啟動子可以用於靶向特定組織內的表現構築體的表現。在某些實施方式中,組織特定或組織偏好的啟動子在植物組織中是有活性的。在植物中受發育控制的啟動子的範例包括在例如葉、根、果實、種子或花之類的某些組織中優先地起始轉錄的啟動子。「組織特定」啟動子為僅在某些組織中起始轉錄的啟動子。與基因的持續型表現不同,組織特定的表現是基因調節的幾個相互作用水平的結果。這樣,來自同源或密切相關的植物物種的啟動子可以偏好地用於在特定組織中以實現轉基因的有效且可靠的表現。在一些實施方式中,表現包括組織偏好的啟動子。「組織偏好的」啟動子是偏好地在某些組織中、但不一定完全在或僅在某些組織中起始轉錄的啟動子。
在一些實施方式中,編碼RGN、crRNA及/或tracrRNA的核酸分子包括細胞類型特定啟動子。「細胞類型特定」啟動子為主要在一或更多器官中的某些細胞類型中驅動表現的啟動子。在植物中起作用的細胞類型特定啟動子可以是主要具有活性的植物細胞的一些範例包括例如BETL細胞、根、葉中的維管束細胞、柄細胞及莖細胞。核酸分子還可包括細胞類型偏好的啟動子。「細胞類型偏好的」啟動子為主要驅動大部分在、但不一定完全在或僅在一或更多器官中的某些細胞類型中的表現的啟動子。其中在植物中起作用的細胞類型偏好的啟動子可優先具有活性的植物細胞的一些範例包括例如BETL細胞、根、葉中的維管束細胞、柄細胞及莖細胞。
編碼RGN、crRNA、tracrRNA及/或sgRNA的核酸序列可以與啟動子序列可操作地連接,啟動子序列由例如用於用於體外mRNA合成的噬菌體RNA聚合酶辨識。在此類實施方式中,可以純化體外轉錄的RNA以用於本文描述的方法。例如,啟動子序列可以是T7、T3或SP6啟動子序列、或T7、T3或SP6啟動子序列的變異。在此類實施方式中,可以純化表現的蛋白及/或RNA,以用於本文描述的基因體修飾的方法。
在某些實施方式中,編碼RGN、crRNA、tracrRNA及/或sgRNA的多核苷酸亦可以與聚腺苷酸化訊號(例如,SV40 polyA訊號及植物中起作用的其他訊號)及/或至少一轉錄終止序列連接。另外,編碼RGN的序列亦可以與編碼至少一核定位訊號、至少一細胞穿透域及/或能夠將蛋白質運輸至特定次細胞位置的至少一訊號胜肽的(一或多個)序列連接,如本文中別處所描述。
編碼RGN、crRNA、tracrRNA及/或sgRNA的多核苷酸可以存在於一個載體或多個載體中。「載體」指用於將核酸轉移、遞送或引入至宿主細胞的多核苷酸組成物。適合的載體包括質體載體、噬菌粒、黏質體、人造/微小染色體、轉位子及病毒載體(例如,慢病毒載體、腺相關病毒載體、桿狀病毒載體)。載體可以包括額外的表現控制序列(例如,增強子序列、Kozak序列、聚腺苷酸化序列、轉錄終止序列)、篩選標記序列(例如,抗生素抗性基因)、複製起點等等。其他資訊可在"Current Protocols in Molecular Biology" Ausubel等人, John Wiley & Sons,紐約, 2003或"Molecular Cloning: A Laboratory Manual" Sambrook & Russell, Cold Spring Harbor Press, Cold Spring Harbor, N.Y., 3rd edition, 2001中找到。
載體亦可以包括用於選擇轉化細胞的選擇性標記基因。篩選標記基因用於轉化的細胞或組織的選擇。標記基因包括:編碼抗生素抗性的基因,例如,編碼新黴素磷酸轉移酶II(NEO)及潮黴素磷酸轉移酶(HPT)的基因;以及對例如草銨膦、溴苯腈、咪唑啉酮及2,4-二氯苯氧乙酸鹽(2,4-D)之類的除草化合物賦予抗性的基因。
在一些實施方式中,包括編碼RGN多肽的序列的表現匣或載體可以進一步包括編碼crRNA及/或tracrRNA、或組合以產生sgRNA的crRNA及tracrRNA的序列。編碼crRNA及/或tracrRNA的(一或多個)序列可以與至少一轉錄控制序列可操作地連接,用於在所關注的生物體或宿主細胞中表現crRNA及/或tracrRNA。例如,編碼crRNA及/或tracrRNA的多核苷酸可以與由RNA聚合酶III(Pol III)辨識的啟動子序列可操作地連接。適合的Pol III啟動子的範例包括但不限於哺乳動物U6、U3、H1及7SL RNA啟動子及水稻U6及U3啟動子,例如,如SEQ ID NO:329所示的人類U6啟動子、以及2021年6月11日提出的第63/209,660號美國臨時申請案中揭露的啟動子(其全部內容藉由引用而被併入本文),其包括本文中如SEQ ID NO:449-458所示的那些。
如所指出的,包括編碼RGN、crRNA、tracrRNA及/或sgRNA的核苷酸序列的表現構築體可以用於轉化所關注的生物體。用於轉化的方法涉及將核苷酸構築體引入所關注的生物體中。「引入」旨在以構築體能夠進入宿主細胞內部這樣的方式將核苷酸構築體引至宿主細胞。本發明的方法不需要將核苷酸構築體引至宿主生物體的特定方法,僅在於核苷酸構築體能夠進入宿主生物體的至少一細胞內部。宿主細胞可以是真核細胞或原核細胞。在特定實施方式中,真核宿主細胞為植物細胞、哺乳動物細胞、鳥類細胞或昆蟲細胞。在一些實施方式中,包括或表現目前揭露的RGN或已由目前揭露的RGN修飾的真核細胞為人類細胞。在一些實施方式中,包括或表現目前揭露的RGN或已由目前揭露的RGN修飾的真核細胞為造血源的細胞,例如免疫細胞(亦即,先天或適應性免疫系統的細胞),其包括但不限於B細胞、T細胞、自然殺手(NK)細胞、富潛能幹細胞、誘導性富潛能幹細胞、嵌合抗原受體T(CAR-T)細胞、單核球、巨噬細胞及樹突細胞。在一些實施方式中,包括或表現目前揭露的RGN或已藉由目前揭露的RGN修飾的真核細胞為眼細胞、肌肉細胞(例如,骨骼肌細胞)、上皮細胞(例如,肺上皮細胞)、病變細胞(例如,腫瘤細胞)。
用於將核苷酸構築體引入植物及其他宿主細胞內的方法為本領域已知的,其包括但不限於穩定轉化方法、短暫轉化方法及病毒介導方法。
該方法得到轉化的生物體,例如植物,包括整株植物以及植物器官(例如,葉、莖、根等)、種子、植物細胞、繁殖體、胚胎及其後代。植物細胞可以是分化的或未分化的(例如,癒傷組織、懸浮培養細胞、原生質體、葉細胞、根細胞、韌皮部細胞、花粉)。
「轉基因生物」或「轉化生物」或「穩定轉化的」生物或細胞或組織指已併入或整合編碼本發明的RGN、crRNA及/或tracrRNA的多核苷酸的生物。應當認識到,其他外源或內源核酸序列或DNA片段亦可以被併入宿主細胞內。農桿菌及基因槍介導的轉化仍然是用於植物細胞轉化的兩種主要採用的方法。然而,宿主細胞的轉化可以藉由感染、轉染、顯微注射、電穿孔、微噴射、基因槍或粒子轟擊、電穿孔、二氧化矽/碳纖維、超音波介導、PEG介導、磷酸鈣共沉澱、聚陽離子DMSO技術、DEAE葡聚醣程序、及病毒介導、脂質體介導等等來進行。編碼RGN、crRNA及/或tracrRNA的多核苷酸的病毒介導的引入包括反轉錄病毒、慢病毒、腺病毒及腺相關病毒介導的引入及表現、以及花椰菜嵌紋病毒、雙生病毒及RNA植物病毒的使用。
轉化操作流程以及用於將多肽或多核苷酸序列引入植物中的操作流程可以根據針對轉化所靶向的宿主細胞的類型(例如,單子葉或雙子葉植物細胞)而不同。用於轉化的方法為本領域已知的、且包括美國第8,575,425號、第7,692,068號、第8,802,934號、第7,541,517號專利中闡述的那些方法,這些專利中的每一者都藉由引用併入本文。亦參見Rakoczy-Trojanowska, M. (2002) Cell Mol Biol Lett.7:849-858;Jones等人 (2005) Plant Methods1:5;Rivera等人(2012) Physics of Life Reviews9:308-345;Bartlett等人(2008) Plant Methods4:1-12;Bates, G.W. (1999) Methods in Molecular Biology111:359-366;Binns及Thomashow (1988) Annual Reviews in Microbiology42:575-606;Christou, P. (1992) The Plant Journal2:275-281;Christou, P. (1995) Euphytica85:13-27;Tzfira等人(2004) TRENDS in Genetics20:375-383;Yao等人(2006) Journal of Experimental Botany57:3737-3746;Zupan及Zambryski (1995) Plant Physiology107:1041-1047;Jones等人(2005) Plant Methods1:5。
轉化可以導致核酸穩定或短暫併入細胞中。「穩定轉化」意指引入宿主細胞的核苷酸構築體整合至宿主細胞的基因體中、且能夠被其子代遺傳。「短暫轉化」意指將多核苷酸引入宿主細胞中,並且不整合至宿主細胞的基因體中。
用於葉綠體轉化的方法為本領域已知的,例如,參見Svab等人(1990) Proc. Nail. Acad. Sci. USA87:8526-8530;Svab及Maliga (1993) Proc. Natl. Acad. Sci. USA90:913-917;Svab及Maliga (1993) EMBO J.12:601-606。該方法取決於含有篩選標記的DNA的粒子槍遞送及經由同源重組將DNA靶向質體基因體。另外,質體轉化可以藉由核編碼及質體導向的RNA聚合酶的組織偏好表現來轉錄活化沉默的質體攜帶轉基因來實現。McBride等人(1994)在 Proc. Natl. Acad. Sci. USA91:7301-7305已報導這樣的系統。
根據傳統方式,已轉化的細胞可以生長成轉基因生物,例如,植物。例如,參見McCormick等人(1986) Plant Cell Reports5:81-84。然後,可以使這些植物生長,並用相同轉化株或不同株進行授粉,並鑑定出具有期望表現型特徵的持續型表現的所得雜交體。可生長二代或更多代,以確保穩定維持並遺傳期望表現型特徵的表現,然後收穫種子,以確保已經達成期望表現型特徵的表現。以此方式,本發明提供具有穩定地併入其基因體內的本發明的核苷酸構築體(例如,本發明的表現匣)的轉化種子(亦稱為「轉基因種子」)。
替代地,可以將已轉化的細胞引入生物內。這些細胞可以源自該生物,其中細胞以離體方法被轉化。
本文提供的序列可以用於轉化任何植物物種,包括但不限於單子葉植物及雙子葉植物。所關注的植物的範例包括但不限於玉蜀黍(玉米)、高粱、小麥、向日葵、番茄、十字花科植物、胡椒、馬鈴薯、棉花、水稻、大豆、甜菜、甘蔗、煙草、大麥及油菜、甘藍型油菜(Brassica sp.)、苜蓿、黑麥、小米、紅花、花生、甘藷、木薯、咖啡、椰子、鳳梨、柑橘、可可、茶、香蕉、鱷梨、無花果、番石榴、芒果、橄欖、木瓜、腰果、澳洲胡桃、杏仁、燕麥、蔬菜、觀賞植物以及針葉樹。
蔬菜包括但不限於番茄、萵苣、綠豆、皇帝豆、豌豆、及例如黃瓜、哈密瓜及洋香瓜之類的甜瓜(Curcumis)屬的成員。觀賞植物包括但不限於杜鵑花、繡球花、芙蓉、玫瑰、鬱金香、水仙、矮牽牛、康乃馨、耶誕紅及菊花。較佳地,本發明的植物為農作物(例如,玉米、高粱、小麥、向日葵、番茄、十字花科植物、胡椒、馬鈴薯、棉花、水稻、大豆、甜菜、甘蔗、煙草、大麥、油菜等)。
如本文所使用的,術語「植物」包括植物細胞、植物原生質體、可從其再生植物的植物細胞組織培養物、植物癒傷組織、植物叢、及在植物或植物的部分中完整的植物細胞(例如,胚胎、花粉、胚珠、種子、葉子、花、枝、果實、仁、穗、穗軸、殼、莖、根、根尖、花藥等)。穀物意指由商業種植者出於生長或繁殖物種以外的目的而生產的成熟種子。再生植物的子代、變異體及突變體亦包括於本發明的範圍內,條件是這些部分包括所引入的多核苷酸。還提供保留本文揭露的序列的經加工的植物產品或副產物,包括例如豆粕。
編碼RGN、crRNA及/或tracrRNA、或包括crRNA及/或tracrRNA的多核苷酸亦可以用於轉化任何原核物種,包括但不限於古菌及細菌(例如,芽孢桿菌、克留氏菌屬、鏈黴菌、根瘤菌、埃希氏菌( Escherichiasp.)、假單胞菌、沙門氏菌、志賀氏桿菌、弧菌、耶爾森氏菌、黴漿菌、農桿菌、乳酸桿菌)。
編碼RGN、crRNA及/或tracrRNA、或包括crRNA及/或tracrRNA的多核苷酸可以用於轉化任何真核物種,其包括但不限於動物(例如,哺乳動物、昆蟲、魚類、鳥類及爬蟲類物)、真菌、變形蟲、藻類及酵母。
傳統基於病毒及非病毒的基因轉移方法可以用於將核酸引入哺乳動物、昆蟲或鳥類細胞或標的組織中。此種方法可以用於將編碼RGN系統組成的核酸投予培養物中的細胞或宿主生物中的細胞。非病毒載體遞送系統包括DNA質體、RNA(例如,本文描述的載體的轉錄本)、裸核酸、及與例如脂質體的遞送載體錯合的核酸。病毒載體遞送系統包括DNA及RNA病毒,其在遞送至細胞後具有附加型或整合的基因體。有關基因治療程序的綜述,參見Anderson, Science 256: 808- 813 (1992) ;Nabel & Feigner, TIBTECH 11:211-217 (1993) ;Mitani & Caskey, TIBTECH 11:162-166 (1993) ;Dillon, TIBTECH 11:167-175 (1993) ;Miller, Nature 357:455-460 (1992) ;Van Brunt, Biotechnology 6(10): 1149-1154 (1988) ;Vigne, Restorative Neurology and Neuroscience 8:35-36 (1995) ;Kremer & Perricaudet, British Medical Bulletin 51(1):31-44 (1995) ;Haddada等人, in Current Topics in Microbiology and Immunology, Doerfler及Bohm (編輯) (1995) ;以及Yu等人, Gene Therapy 1:13-26 (1994)。
核酸的非病毒遞送方法包括脂質體轉染、核轉染、顯微注射、基因槍、病毒體、脂質體、免疫脂質體、聚陽離子或脂質:核酸共軛物、裸DNA、人工病毒粒子及DNA的藥劑增強攝取。例如,美國第5,049,386號、第4,946,787號及第4,897,355號專利中描述了脂質體轉染,且脂質體轉染試劑是市售的(例如,Transfectam ™及Lipofectin™)。適用於多核苷酸的有效受體辨識脂質體轉染的陽離子及中性脂質包括Feigner的WO 91/17424;WO 91/16024中的那些。遞送可以是至細胞(例如,體外或離體投予)或標的組織(例如,體內投予)。脂質:核酸錯合物(包括靶向的脂質體,例如免疫脂質錯合物)的製備為本領域中具有通常知識者所熟知(例如,參見Crystal, Science 270:404-410 (1995);Blaese等人, Cancer Gene Ther.  2:291- 297 (1995);Behr等人, Bioconjugate Chem. 5:382-389 (1994);Remy等人, Bioconjugate Chem.  5:647-654 (1994);Gao等人, Gene Therapy 2:710-722 (1995) ;Ahmad等人, Cancer Res.  52:4817-4820 (1992);美國第4,186,183號、第4,217,344號、第4,235,871號、第4,261,975號、第4,485,054號、第4,501,728號、第4,774,085號、第4,837,028號及第4,946,787號專利)。
使用基於RNA或DNA病毒的系統來遞送核酸利用高度進化的過程將病毒靶向體內的特定細胞且將病毒負載運輸至細胞核。病毒載體可以直接投予患者(體內)或可以用於體外處理細胞,且可以可選地將經修飾的細胞投予患者(離體)。傳統基於病毒的系統可以包括用於基因轉移的反轉錄病毒、慢病毒、腺病毒、腺相關及單純皰疹病毒載體。用反轉錄病毒、慢病毒及腺相關病毒基因轉移方法在宿主基因體中的整合是可能的,常常導致所插入的轉基因的長期表現。另外,在許多不同細胞類型及標的組織中已經觀察到高轉導效率。
反轉錄病毒的向性(tropism)可藉由併入外來套膜蛋白而被改變,從而擴大標的細胞的潛在標的族群。慢病毒載體為能夠轉導或感染非分裂細胞且在通常情況下產生高病毒力價的反轉錄病毒載體。因此,反轉錄病毒基因轉移系統的選擇將取決於標的組織。反轉錄病毒載體由順式作用長端重複序列構成,順式作用長端重複序列具有達到6-10 kb的外來序列的包裝能力。最小順式作用LTR足以複製及包裝載體,然後,將其用於將治療性基因整合至標的細胞內,以提供永久性轉基因表現。廣泛使用的反轉錄病毒載體包括基於小鼠白血病病毒(MuLV)、長臂猿白血病病毒(GaLV)、猿猴免疫不全病毒(SIV)、人免疫不全病毒(HIV)及其組合的那些反轉錄病毒載體(例如,參見Buchscher等人, J.  Viral.  66:2731-2739 (1992);Johann等人, J.  Viral.  66:1635-1640 (1992);Sommnerfelt等人, Viral.  176:58-59 (1990);Wilson等人, J.  Viral.  63:2374-2378 (1989);Miller等人, 1.Viral.  65:2220-2224 (1991);PCT/US94/05700)。
在偏好短暫表現的應用中,可以使用基於腺病毒的系統。基於腺病毒的載體在許多細胞類型中能夠有非常高的轉導效率,且不需要細胞分裂。使用這樣的載體,已經獲得了高力價及高表現水準。此載體可以在相對簡單的系統中大量產生。腺相關病毒(“AAV”)載體亦可以用於轉導具有標的核酸的細胞,例如在核酸及胜肽的體外生產中,以及用於體內及離體基因治療程序(例如,參見West等人, Virology 160:38-47 (1987); 美國第4,797,368號專利;WO 93/24641;Katin, Human Gene Therapy 5:793-801 (1994);Muzyczka, 1.Clin.  Invest.  94:1351 (1994))。重組AAV載體的構築在很多出版物中描述,包括美國第5,173,414號專利;Tratschin等人, Mol.  Cell.  Biol.  5:3251-3260 (1985);Tratschin,等人, Mol.  Cell.  Biol.  4:2072-2081 (1984);Hermonat & Muzyczka, PNAS 81:6466-6470 (1984);以及Samulski等人, 1.Viral.  63:03822-3828 (1989)。包裝細胞通常用於形成能夠感染宿主細胞的病毒顆粒。此種細胞包括包裝腺病毒的293細胞及包裝反轉錄病毒的ψJ2細胞或PA317細胞。
基因療法中使用的病毒載體通常藉由產生將核酸載體包裝於病毒顆粒中的細胞株而被產生。載體通常含有用於包裝且隨後整合至宿主中所需的最小病毒序列、被用於將要表現的多核苷酸的表現匣替代的其他病毒序列。缺失的病毒功能通常由包裝細胞株以反式提供。例如,基因治療中使用的AAV載體通常僅具有來自包裝及整合至宿主基因體中所需的AAV基因體的ITR序列。病毒DNA被包裝於細胞株中,細胞株含有編碼其他AAV基因(即rep及cap)但缺少ITR序列的輔助質體。
亦可以用腺病毒作為輔助體(helper)來感染細胞株。輔助病毒促進AAV載體的複製及來自輔助質體中的AAV基因的表現。由於缺少ITR序列,輔助質體沒有被大量的包裝。可以藉由例如熱處理來降低腺病毒的汙染,腺病毒比AAV對熱處理更敏感。用於將核酸遞送至細胞的其他方法為本領域中具有通常知識者已知的。例如參見 US20030087817,其藉由引用併入本文。
在一些實施方式中,用本文描述的一或更多載體短暫地或非短暫地轉染宿主細胞。在一些實施方式中,細胞在其天然存在於個體中時被轉染。在一些實施方式中,被轉染的細胞取自個體。在一些實施方式中,細胞取得自取自個體的細胞,例如細胞株。在一些實施方式中,細胞株可以是哺乳動物、昆蟲或鳥類細胞。用於組織培養的多種細胞株為本領域已知的。細胞株的範例包括但不限於:C8161、CCRF-CEM、MOLT、mIMCD-3、NHDF、HeLaS3、Huhl、Huh4、Huh7、HUVEC、HASMC、HEKn、HEKa、MiaPaCell、Panel、PC-3、TFl、CTLL-2、CIR、Rat6、CVI、RPTE、AlO、T24、182、A375、ARH-77、Calul、SW480、SW620、SKOV3、SK-UT、CaCo2、P388Dl、SEM-K2、WEHI-231、HB56、TIB55、lurkat、 145.01、 LRMB、Bcl-1、BC-3、IC21、DLD2、Raw264.7、NRK、NRK-52E、MRC5、MEF、Hep G2、HeLa B、HeLa T4、COS、COS-1、COS-6、COS-M6A、BS-C-1猴腎上皮細胞、BALB/3T3小鼠胚胎纖維母細胞、3T3 Swiss、3T3-Ll、132-d5人胎兒纖維母細胞;10.1小鼠纖維母細胞、293-T、3T3、721、9L、A2780、A2780ADR、A2780cis、A172、A20、A253、A431、A-549、ALC、B16、B35、BCP-I 細胞、BEAS-2B、bEnd.3、BHK-21、BR 293、BxPC3、C3H-10Tl/2、C6/36、Cal-27、CHO、CHO-7、CHO-IR、CHO-Kl、CHO-K2、CHO-T、CHO Dhfr-/-、COR-L23、COR-L23/CPR、COR-L235010、CORL23/ R23、COS-7、COV-434、CML Tl、CMT、CT26、D17、DH82、DU145、DuCaP、EL4、EM2、EM3、EMT6/AR1、EMT6/AR10.0、FM3、H1299、H69、HB54、HB55、HCA2、HEK-293、HeLa、Hepalclc7、HL-60、HMEC、HT-29、lurkat、 lY細胞、K562細胞、Ku812、KCL22、KGl、KYOl、LNCap、Ma-Mel 1-48、MC-38、MCF-7、MCF-l0A、MDA-MB-231、MDA-MB-468、MDA-MB-435、MDCKII、MDCKII、MOR/0.2R、MONO-MAC 6、MTD-lA、MyEnd、NCI-H69/CPR、NCI-H69/LX10、NCI-H69/LX20、NCI-H69/LX4、NIH-3T3、NALM-1、NW-145、OPCN/OPCT細胞株、Peer、PNT-lA/PNT2、RenCa、RIN-5F、RMA/RMAS、Saos-2細胞、Sf-9、SkBr3、T2、T-47D、T84、THPl細胞株、U373、U87、U937、VCaP、Vero細胞、WM39、WT-49、X63、YAC-1、YAR及其轉基因變異體。細胞株可從本領域中具有通常知識者已知的多種來源獲得(例如,參見美國標準生物品收藏中心(ATCC)(馬納沙斯,維吉尼亞州))。
在一些實施方式中,以本文描述的一或更多載體轉染的細胞用於建立包括一或更多載體衍生序列的新細胞株。在一些實施方式中,以本文描述的RGN系統的組成短暫轉染的(例如,藉由一或更多載體的短暫轉染,或以RNA轉染)並經由RGN系統的活性修飾的細胞用於建立包括含有修飾但缺少任何其他外源序列的細胞的新細胞株。在一些實施方式中,以本文描述的一或更多載體短暫或非短暫轉染的細胞或自此類細胞取得的細胞株用於評估一或更多測試化合物。
在一些實施方式中,本文描述的一或更多載體用於產生非人的轉基因動物或轉基因植物。在一些實施方式中,轉基因動物為哺乳動物,例如,小鼠、大鼠、倉鼠、兔子、母牛或豬。在一些實施方式中,轉基因動物為鳥,例如,雞或鴨。在一些實施方式中,轉基因動物為昆蟲,例如,蚊子或蜱。 V. 多肽及多核苷酸的變異體及片段
本揭露內容提供天然存在的(即,野生型)RNA引導的核酸酶的活性變異體及片段,其胺基酸序列如SEQ ID NO:1-12中任一者所示;以及天然存在的CRISPR重複序列的活性變異體及片段,例如,如SEQ ID NO:12-34中任一者所示的序列;以及天然存在的tracrRNA的活性變異體及片段,例如,如SEQ ID NO:25-36中任一者所示的序列;以及編碼該些序列的多核苷酸。
儘管變異體或片段的活性相較於所關注的多核苷酸或多肽是可以改變的,但變異體及片段應保留所關注的多核苷酸或多肽的功能性。例如,當與所關注的多核苷酸或多肽相較時,變異體或片段可以具有增加的活性、降低的活性、不同的活性譜或活性的任何其他改變。
天然存在的RGN多肽的片段及變異體(例如本文揭露的那些)將保留序列專一性的RNA引導的DNA結合活性。在特定實施方式中,天然存在的RGN多肽的片段及變異體(例如本文揭露的那些)將保留核酸酶活性(單股或雙股)。
當天然存在的CRISPR重複序列的片段及變異體(例如本文揭露的那些)作為引導RNA(包括tracrRNA)的一部分時,將保留以序列專一性方式結合至並將RNA引導的核酸酶(與引導RNA錯合)引導至標的核苷酸序列的能力。
當天然存在的tracrRNA的片段及變異體(例如本文揭露的那些)作為引導RNA(包括CRISPR RNA)的一部分時,將保留以序列專一性方式將RNA引導的核酸酶(與引導RNA錯合)引導至標的核苷酸序列的能力。
術語「片段」指本發明的多核苷酸或多肽序列的一部分。「片段」或「生物活性部分」包括多核苷酸,多核苷酸包括足夠數量的連續核苷酸,以保留生物活性(即,當被包括於引導RNA中時,以序列專一性方式將RNA結合至並將RGN引導至標的核苷酸序列)。「片段」或「生物活性部分」包括多肽,多肽包括足夠數量的連續胺基酸殘基,以保留生物活性(即,當與引導RNA錯合時以序列專一性方式與標的核苷酸序列結合)。RGN蛋白的片段包括由於使用替代的下游開始位點而比全長序列短的那些片段。RGN蛋白的生物活性部分可以是包括SEQ ID NO:1-12中任一者的例如10、25、50、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、1550、1600、1650、1700或更多個連續胺基酸殘基的多肽。此類生物活性部分可藉由重組技術而製備、並針對序列專一性、RNA引導的DNA結合活性而被評估。CRISPR重複序列的生物活性片段可以包括SEQ ID NO:13-24中任一者的至少8個連續胺基酸。CRISPR重複序列的生物活性部分可以是包括SEQ ID NO:13-24中任一者的例如8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23或24個連續核苷酸的多核苷酸。tracrRNA的生物活性部分可以是包括SEQ ID NO:25-36中任一者的例如8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100或更多個連續核苷酸的多核苷酸。
一般來說,「變異體」旨在意指實質上相似的序列。對於多核苷酸,變異體包括天然多核苷酸中的一或更多內部位點處的一或更多核苷酸的缺失及/或添加、及/或於天然多核苷酸中的一或更多位點處的一或更多核苷酸的取代。如本文所使用的,「天然」或「野生型」多核苷酸或多肽分別包括天然存在的核苷酸序列或胺基酸序列。對於多核苷酸,保留(conservative)變異體包括因為遺傳密碼的簡併(degeneracy)而編碼所關注基因的天然胺基酸序列的那些序列。例如可使用眾所周知的分子生物學技術鑑定(例如,利用如以下概述的聚合酶連鎖反應(PCR)及雜交技術)的天然存在的對偶變異體。變異體多核苷酸亦包括合成衍生的多核苷酸,例如那些例如藉由使用定點誘變產生的但其仍然編碼所關注的多肽或多核苷酸。一般來說,本文所揭露的特定多核苷酸的變異體將與藉由本文別處描述的序列比對程式及參數所確定的那個特定多核苷酸具有至少約40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列一致性。
亦可以藉由比較由變異體多核苷酸所編碼的多肽與由參考多核苷酸所編碼的多肽之間的序列一致性百分比來評估本文所揭露的特定多核苷酸的變異體(即,參考多核苷酸)。可使用本文別處描述的序列比對程式及參數來計算任何二個多肽之間的序列一致性百分比。當藉由比較本文揭露的任何給定的多核苷酸對所編碼的兩個多肽共用的序列一致性百分比來評估本文揭露的任何給定的多核苷酸對時,該兩個編碼的多肽之間的序列一致性百分比為至少約40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的一致性。
在特定實施方式中,本發明揭露的多核苷酸編碼RNA引導的核酸酶多肽,RNA引導的核酸酶多肽包括與如SEQ ID NO:1-12中任一者所示的胺基酸序列具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高一致性的胺基酸序列。
本發明的RGN多肽的生物活性變異體可以相差少至約1-15個胺基酸殘基、少至約1-10個(例如,約6-10個)、少至5個、少至4個、少至3個、少至2個、或少至1個胺基酸殘基。在具體實施方式中,多肽可以包括N端或C端截斷(truncation),N端或C端截斷可以包括從多肽的N端或C端的至少10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、1550、1600、1650、1700個或更多個胺基酸的缺失。
在某些實施方式中,本發明揭露的多核苷酸包括或編碼CRISPR重複序列,CRISPR重複序列包括與如SEQ ID NO:13-24中任一者所示的核苷酸序列具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的一致性的核苷酸序列。
本發明揭露的多核苷酸包括或編碼tracrRNA,tracrRNA包括與如SEQ ID NO:25-36中任一者所示的核苷酸序列具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的一致性的核苷酸序列。
本發明的CRISPR重複序列或tracrRNA的生物活性變異體可以相差少至約1-15個核苷酸、少至約1-10個(例如,約6-10個)、少至5個、少至4個、少至3個、少至2個、或少至1個核苷酸。在具體實施方式中,多核苷酸可以包括5'或3'截斷,其可以包括從多核苷酸的5'或3'端的至少10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、90、95、100、105、110個或更多個核苷酸的缺失。
認識到,可對本文提供的RGN多肽、CRISPR重複序列及tracrRNA進行修飾,以產生變異體蛋白及多核苷酸。人為設計的改變可以經由定點誘變技術的應用而被引入。替代地,與本文揭露的序列在結構上及/或功能上有關的天然的、未知的或尚未鑑定的多核苷酸及/或多肽亦可視為落入本發明的範圍內。可以在不改變RGN蛋白功能的非保留區域中進行保留式胺基酸取代。替代地,可以進行改善RGN活性的修飾。
變異體多核苷酸及蛋白亦包括源自例如誘變及重組程序(例如DNA混排(shuffling))的序列及蛋白。用這種程序,操縱本文揭露的一或更多不同的RGN蛋白(例如,SEQ ID NO:1-12),以產生具有期望特性的新RGN蛋白。以這種方式,重組多核苷酸庫是從包括序列區域的相關序列多核苷酸的群體產生的,序列區域具有實質序列一致性且可以在體外或體內同源地重組。例如,使用這種方法,可以在本文提供的RGN序列與其他已知RGN基因之間混排編碼所關注域的序列模體,以獲得對具有改善的所關注性質(例如在酵素的情況下,增加的K m)的蛋白質編碼的新基因。此種DNA混排的策略為本領域已知的。例如,參見Stemmer (1994) Proc. Natl. Acad. Sci. USA91:10747-10751;Stemmer (1994) Nature370:389-391;Crameri等人(1997) Nature Biotech.15:436-438;Moore等人(1997) J. Mol. Biol.272:336-347;Zhang等人 (1997) Proc. Natl. Acad. Sci. USA94:4504-4509;Crameri等人(1998) Nature391:288-291;以及美國第5,605,793號及第5,837,458號專利。「混排的」核酸為藉由混排程序(例如本文闡述的任何混排程序)產生的核酸。混排的核酸是藉由例如以人工的及可選地遞迴的方式(物理地或虛擬地)重組二個或更多個核酸(或字符串)而產生的。一般來說,混排過程中使用一或更多篩選步驟來鑑定所關注的核酸;此篩選步驟可以在任何重組步驟之前或之後進行。在一些(但不是全部)混排實施方式中,期望在選擇之前執行多輪重組,以增加要篩選的池的多樣性。重組及選擇的整個過程可選地遞迴地重複。根據上下文,混排可以指重組及選擇的整個過程,或者可替代地,可以僅指整個過程的重組部分。
如本文使用的,在二個多核苷酸或多肽序列的上下文中使用的「序列一致性」或「一致性」涉及到當在指定的比較窗上比對以獲得最大對應性時為相同的二個序列中的殘基。當使用與蛋白質有關的序列一致性百分比時,應當認識到,不同的殘基位置通常因保留胺基酸取代而不同,其中胺基酸殘基被具有類似化學性質(例如,帶電或疏水性)的其他胺基酸殘基取代,且因此不會改變分子的功能特性。當序列在保留取代方面不同時,可以向上調整序列一致性百分比,以校正取代的保留性質。藉由這種保留取代而不同的序列被稱為具有「序列相似性」或「相似性」。用於進行此種調整的手段為本領域中具有通常知識者熟知的。通常,此涉及將保留取代計為部分誤配而非全部誤配,從而增加序列一致性百分比。因此,例如,在相同胺基酸的評分為1,且非保留取代的評分為0的情況下,保留取代的評分為0與1之間的分數。例如,以在程式PC/GENE(Intelligenetics,Mountain View,California)中實施的那樣,計算保留取代的分數。
如本文所使用的,「序列一致性百分比」是指藉由在比較窗上比較二個最佳比對的序列所確定的值,其中比較窗中的多核苷酸序列的部分可以包括相較於用於二個序列的最佳比對的參考序列(不包括添加或缺失)的添加或缺失(亦即,缺口)。藉由確定在二個序列中出現相同核酸鹼基或胺基酸殘基的位置數以求得匹配位置數、將匹配位置數除以比較窗中的位置總數、以及將結果乘以100以求得序列一致性百分比,來計算百分比。
除非另有說明,否則本文提供的序列一致性/相似性值指使用利用以下參數的GAP版本10獲得的值:使用GAP權重50及長度權重3以及nwsgapdna.cmp計分矩陣的核苷酸序列的一致性%及相似性%;使用GAP權重8及長度權重2以及BLOSUM62計分矩陣的胺基酸序列 的一致性%及相似性%;或其任何等效程式。「等效程式」是指任何序列比較程式,當與GAP版本10產生的對應比對進行比較時,針對所涉及的任何二個序列,該序列比較程式產生具有相同核苷酸或胺基酸殘基匹配及相同序列一致性百分比的比對。
當使用所界定的胺基酸取代矩陣(例如,BLOSUM62)、缺口存在罰分(gap existence penalty)及缺口延伸罰分(gap extension penalty)比對二個序列的相似性計分時,二個序列被「最佳比對」,以達到該對序列可能的最高分數。胺基酸取代矩陣及其在量化二個序列之間的相似性中的使用為在本領域所熟知的、並且被描述於例如Dayhoff等人(1978) "A model of evolutionary change in proteins" 中的"Atlas of Protein Sequence and Structure"卷5補充3 (M. O. Dayhoff編輯),第345-352頁;Natl. Biomed. Res. Found., Washington, D.C.;以及Henikoff等人(1992) Proc. Natl. Acad. Sci. USA 89:10915-10919中。BLOSUM62矩陣通常用作序列比對操作流程中的預設計分替換矩陣。缺口存在罰分針對其中一個比對序列中引入單個胺基酸缺口而實施,而缺口延伸罰分針對插入至已經打開的缺口中的每一個另外的空胺基酸位置而實施。藉由比對開始及結束處的每一個序列的胺基酸位置、以及可選地藉由在一個或二個序列中插入一個或多個缺口來定義比對,以達到最高可能計分。儘管可以手動完成最佳比對及計分,但是該過程可以藉由使用電腦實施的比對演算法(例如,Altschul等人(1997) Nucleic Acids Res. 25:3389-3402中所述的、且在美國國家生物技術資訊中心(National Center for Biotechnology Information)網站(www.ncbi.nlm.nih.gov)上向公眾開放的gapped BLAST 2.0)來促進。可以使用例如經由www.ncbi.nlm.nih.gov可得的、且Altschul等人(1997) Nucleic Acids Res. 25:3389-3402中描述的PSI-BLAST來準備包括多重比對的最佳比對。
關於與參考序列最佳比對的胺基酸序列,胺基酸殘基「對應於」在比對中的參考序列中殘基與其配對的位置。「位置」由數字表示,數字基於其相對於N端的位置依序識別參考序列中的每一個胺基酸。由於在確定最佳比對時必須考慮的缺失、插入、截斷、融合等,通常藉由簡單地從N端計數即可確定的測試序列中的胺基酸殘基數目,不必與在參考序列中其對應位置的數目相同。例如,在比對的測試序列中存在缺失的情況中,將不存在與參考序列中缺失位點處的位置對應的胺基酸。在比對的參考序列中有插入的情況下,插入將不對應於參考序列中的任何胺基酸位置。在截斷或融合的情況下,參考序列或所比對的序列中可以存在不對應於對應序列中的任何胺基酸的胺基酸段(stretch)。 VI. 抗體
亦包含針對本發明的RGN多肽或包括RGN多肽的核糖核蛋白的抗體,RGN多肽包括具有如SEQ ID NO:1-12中任一者所示的胺基酸序列或其活性變異體或片段的那些。產生抗體的方法為本領域所熟知的(例如,參見 Harlow及Lane (1988) 抗體:實驗室手冊,紐約冷泉港冷泉港實驗室( Antibodies: A Laboratory Manual, Cold Spring Harbor Laboratory, Cold Spring Harbor, N.Y.);及美國第4,196,265號專利)。這些抗體可以用於套組中,以用於RGN多肽或核糖核蛋白的檢測及分離。因此,本揭露內容提供包括與本文描述的多肽或核糖核蛋白(包括例如具有如SEQ ID NO:1-12中任一者所示的胺基酸序列的多肽)專一性結合的抗體的套組。 VII. 用於結合所關注的標的序列的系統與核糖核蛋白錯合物及其製造方法
本揭露內容提供一種用於結合所關注的標的序列的系統,其中系統包括至少一引導RNA或編碼至少一引導RNA的核苷酸序列、以及至少一RNA引導的核酸酶或編碼至少一RNA引導的核酸酶的核苷酸序列。引導RNA與所關注的標的序列雜交並且還與RGN多肽形成錯合物,從而引導RGN多肽與標的序列結合。在這些實施方式中的一些實施方式中,RGN包括如SEQ ID NO:1-12中任一者所示的胺基酸序列或其活性變異體或片段。在各種實施方式中,引導RNA包括CRISPR重複序列,CRISPR重複序列包括如SEQ ID NO:13-24中任一者所示的核苷酸序列或其活性變異體或片段。在特定實施方式中,引導RNA包括tracrRNA,tracrRNA包括如SEQ ID NO:25-36中任一者所示的核苷酸序列或其活性變異體或片段。系統的引導RNA可以是單引導RNA或雙引導RNA。在特定實施方式中,系統包括與引導RNA異源的RNA引導的核酸酶,其中RGN與引導RNA在自然界中不是彼此錯合(即,彼此結合)。
本文提供的用於結合所關注的標的序列的系統可以是核糖核蛋白錯合物,其是與至少一蛋白質結合的RNA的至少一分子。本文提供的核糖核蛋白錯合物包括作為RNA組成的至少一引導RNA及作為蛋白質組成的RNA引導的核酸酶。可以從天然表現RGN多肽的細胞或生物體中純化此類核糖核蛋白錯合物,且此類核糖核蛋白錯合物已經被工程化,以表現對所關注的標的序列專一的特定引導RNA。替代地,可以從已用對RGN多肽及引導RNA進行編碼的多核苷酸轉化且在允許RGN多肽及引導RNA表現的條件下培養的細胞或生物體中純化核糖核蛋白錯合物。因此,提供用於製造RGN多肽或RGN核糖核蛋白錯合物的方法。此類方法包括:在RGN多肽(而在一些實施方式中,引導RNA)被表現的條件下,培養包括編碼RGN多肽的核苷酸序列的細胞,而且在一些實施方式中,培養包括對引導RNA進行編碼的核苷酸序列的細胞。然後,可以從所培養的細胞的裂解物中純化RGN多肽或RGN核糖核蛋白。在實施方式中,編碼RGN多肽的核苷酸序列包括mRNA(傳訊RNA)。在一些實施方式中,用於組裝RNP錯合物的方法包括:在適合形成RNP錯合物的情況下,結合一或更多本發明揭露的引導RNA及一或更多本發明揭露的RGN多肽。
用於從生物樣本的裂解物中純化RGN多肽或RGN核糖核蛋白錯合物的方法是本領域已知的(例如,粒徑篩析及/或親和層析法、2D-PAGE、HPLC、逆相層析法、免疫沉澱法)。在特定方法中,RGN多肽是重組產生的且包括有助於其純化的純化標籤,包括但不限於:麩胱甘肽-S-轉移酶(GST)、幾丁質結合蛋白(CBP)、麥芽糖結合蛋白、硫氧還蛋白(TRX)、聚(NANP)、串接親和純化(TAP)標籤、myc、AcV5、AU1、AU5、E、ECS、E2、FLAG(例如,3X FLAG標籤)、HA、nus、Softag 1、Softag 3、Strep、SBP、Glu- Glu、HSV、KT3、S、S1、T7、V5、VSV-G、6xHis、10xHis、生物素羧基載體蛋白(BCCP)及鈣調蛋白。一般來說,標記的RGN多肽或RGN核糖核蛋白錯合物是使用固定化金屬親和層析法純化的。應當理解,可以單獨地或組合地使用本領域已知的其他類似方法,包括其他形式的層析法或例如免疫沉澱法。
「分離的」或「純化的」多肽或其生物活性部分實質上或本質上不含在其天然存在的環境中發現的、通常與多肽相伴或交互作用的組成。因此,當藉由重組技術被產生時,分離的或純化的多肽實質上不含其他細胞物質或培養基,或當被化學合成時,分離的或純化的多肽實質上不含化學前驅物或其他化學物質。實質上不含細胞物質的蛋白質包括具有少於約30%、20%、10%、5%或1%(以乾重計)的汙染蛋白質的蛋白質製劑。當重組產生本發明的蛋白質或其生物活性部分時,最佳培養基呈現少於約30%、20%、10%、5%或1%(以乾重計)的化學前驅物或所關注的非蛋白質化學品。相似地,「分離的」多核苷酸或核酸分子從其天然存在的環境中移除。分離的多核苷酸在化學合成時實質上不含化學前驅物或其他化學品、或者已經經由磷酸二酯鍵的斷裂從基因體的基因座中去除。分離的多核苷酸可以是載體的一部分、物質的組成物、或可以包含在細胞內(只要細胞不是多核苷酸的原始環境)。
本文所提供的用於結合及/或切割所關注的標的序列的特定方法涉及使用體外組裝的RGN核糖核蛋白錯合物。RGN核糖核蛋白錯合物的體外組裝可以使用本領域已知的任何方法進行,其中在允許RGN多肽與引導RNA結合的條件下,RGN多肽與引導RNA接觸。如本文中所使用的,「接觸(contact、contacting)」、「接觸的(contacted)」指在適合進行期望反應的條件下,將期望反應的組成放在一起。RGN多肽可以從生物樣本、細胞裂解物或培養基中純化、經由體外轉譯產生、或被化學合成。引導RNA可從生物樣本、細胞裂解物或培養基中純化、在體外被轉錄、或被化學合成。可以使RGN多肽及引導RNA在溶液(例如,緩衝鹽溶液)中接觸以允許RGN核糖核蛋白錯合物的體外組裝。 VIII. 結合、切割或修飾標的序列的方法
本揭露內容提供用於結合、切割及/或修飾所關注的標的核苷酸序列的方法。方法包括將系統遞送至標的序列或包括標的序列的細胞、胞器或胚胎,系統包括至少一引導RNA或編碼至少一引導RNA的多核苷酸、以及至少一RGN多肽或編碼至少一RGN多肽的多核苷酸。在這些實施方式中的一些實施方式中,RGN包括如SEQ ID NO:1-12中任一者所示的胺基酸序列或其活性變異體或片段。在各種實施方式中,引導RNA包括CRISPR重複序列,CRISPR重複序列包括如SEQ ID NO:13-24中任一者所示的核苷酸序列或其活性變異體或片段。在特定實施方式中,引導RNA包括tracrRNA,tracrRNA包括如SEQ ID NO: 25-36中任一者所示的核苷酸序列或其活性變異體或片段。系統的引導RNA可為單引導RNA或雙引導RNA。
系統的RGN可以是無核酸酶活性的RGN、具有切口酶活性、或者可以是融合多肽。在一些實施方式中,融合多肽包括鹼基編輯多肽,例如,胞嘧啶去胺酶或腺嘌呤去胺酶。在其他實施方式中,RGN融合蛋白包括反轉錄酶。在其他實施方式中,RGN融合蛋白包括多肽,多肽招募功能性核酸修復錯合物的成員,例如,核苷酸切除修復(NER)或轉錄耦合的-核苷酸切除修復(TC-NER)途徑的成員(Wei等人, 2015, PNAS USA112(27):E3495-504;Troelstra等人, 1992, Cell71:939-953;Marnef等人, 2017, J Mol Biol429(9):1277-1288),如2020年1月27日申請的美國第62/966,203號臨時專利申請案中所描述的,且其全部內容藉由引用併入本文。在一些實施方式中,RGN融合蛋白包括CSB(van den Boom等人, 2004, J Cell Biol166(1):27-36;van Gool等人, 1997, EMBO J16(19):5955-65;其範例如SEQ ID NO:324所示),CSB為TC-NER(核苷酸切除修復)途徑的成員且在其他成員的招募中產生功用。在近一步的實施方式中,RGN融合蛋白包括CSB的活性域,例如,包括SEQ ID NO:324的胺基酸殘基356-394的CSB的酸性域(Teng等人, 2018, Nat Commun9(1):4115)。
在特定實施方式中,RGN及/或引導RNA對於引入RGN及/或引導RNA(或編碼RGN及引導RNA中的至少一者的多核苷酸)的細胞、胞器或胚胎是異源的。
在方法包括遞送編碼引導RNA及/或RGN多肽的多核苷酸的那些實施方式中,接著可以在引導RNA及/或RGN多肽被表現的條件下培養細胞或胚胎。在各種實施方式中,方法包括使標的序列與RGN核糖核蛋白錯合物接觸。RGN核糖核蛋白錯合物可以包括無核酸酶活性或具有切口酶活性的RGN。在一些實施方式中,核糖核蛋白錯合物的RGN為包括鹼基編輯多肽的融合多肽。在某些實施方式中,方法包括將RGN核糖核蛋白錯合物引入包括標的序列的細胞、胞器或胚胎中。RGN核糖核蛋白錯合物可以是如本文所述已從生物樣本中純化、重組產生並隨後純化、或體外組裝的錯合物。在其中與標的序列或細胞胞器或胚胎接觸的RGN核糖核蛋白錯合物已經在體外被組裝的那些實施方式中,方法可以進一步包括在與標的序列、細胞、胞器或胚胎接觸之前,體外組裝錯合物。
可以使用本領域已知的任何方法(包括但不限於電穿孔)將純化的或體外組裝的RGN核糖核蛋白錯合物引入細胞、胞器或胚胎內。替代地,可以使用本領域已知的任何方法(例如,電穿孔)將編碼或包括引導RNA的多核苷酸及/或RGN多肽引入細胞、胞器或胚胎內。
在遞送至或接觸標的序列或包括標的序列的細胞、胞器或胚胎時,引導RNA引導RGN以序列專一性方式與標的序列結合。在其中RGN具有核酸酶活性的那些實施方式中,RGN多肽在結合時切割所關注的標的序列。隨後,標的序列可以經由例如非同源末端連接或用所提供的供體多核苷酸進行同源介導修復之類的內源修復機制而被修飾。
測量RGN多肽與標的序列的結合的方法是本領域已知的、且包括染色質免疫沉澱測定法、凝膠遷移位移測定、DNA下拉測定、報導子測定(reporter assay)、微量盤捕獲及檢測測定。同樣地,測量標的序列的切割或修飾的方法是本領域已知的、且包括體外或體內切割測定法,其中在有或沒有適當標記(例如,放射性同位素、螢光物質)附接至標的序列以方便檢測降解產物的情況下,使用PCR、定序或凝膠電泳來確認切割。替代地,可以使用切口觸發的指數擴增反應(NTEXPAR)測定法(例如,參見Zhang等人(2016) Chem. Sci.7:4951-4957)。可以使用Surveyor測定法來評估體內切割(Guschin等人(2010) Methods Mol Biol649:247-256)。
在一些實施方式中,方法涉及使用與一個以上的引導RNA錯合的單一類型RGN。一個以上的引導RNA可以靶向單一基因的不同區域、或者可靶向多個基因。
在其中未提供供體多核苷酸的那些實施方式中,可以藉由非同源末端連接(NHEJ)修復過程來修復由RGN多肽引入的雙股斷裂。由於NHEJ的易錯性質,雙股斷裂的修復可以導致對標的序列的修飾。如本文所使用的,關於核酸分子的「修飾」是指核酸分子的核苷酸序列中的變化,其可以是一或更多核苷酸的缺失、插入或取代或其組合。標的序列的修飾可以導致改變的蛋白質產物的表現或編碼序列的不活化。
在其中存在供體多核苷酸的那些實施方式中,在修復所引入的雙股斷裂的過程中,供體多核苷酸中的供體序列可以被整合至標的核苷酸序列中或與標的核苷酸序列交換,導致外源供體序列的引入。因此,供體多核苷酸包括期望被引入所關注的標的序列中的供體序列。在一些實施方式中,供體序列改變原始標的核苷酸序列,使得新整合的供體序列將不被RGN識別及切割。供體序列的整合可以藉由在供體多核苷酸中包括毗鄰序列來增強,毗鄰序列在本文中被稱為「同源臂」,其與標的核苷酸序列毗鄰的序列具有實質的序列一致性,以允許同源引導的修復過程。在一些實施方式中,同源臂具有至少50個鹼基對、至少100個鹼基對及多達2000個鹼基對或更多個鹼基對的長度、且與其在標的核苷酸序列內的對應序列具有至少90%、至少95%或更高序列同源性。
在其中RGN多肽引入雙股交錯斷裂的那些實施方式中,供體多核苷酸可以包括與相容突出部毗鄰的供體序列,以在雙股斷裂的修復期間允許藉由非同源修復過程將供體序列直接連接至包括突出部的切割的標的核苷酸序列。
在其中方法涉及使用為切口酶(即,僅能夠切割雙股多核苷酸的單股)的RGN的那些實施方式中,方法可以包括引入靶向相同或重疊的標的序列並切割多核苷酸的不同股的二個RGN切口酶。例如,可以將僅切割雙股多核苷酸的正(+)股的RGN切口酶與僅切割雙股多核苷酸的負(-)股的第二RGN切口酶一起引入。
在各種實施方式中,提供一種用於結合標的核苷酸序列並檢測標的序列的方法,其中該方法包括將至少一引導RNA或編碼至少一引導RNA的多核苷酸、以及至少一RGN多肽或編碼至少一RGN多肽的多核苷酸引入細胞、胞器或胚胎中;表現引導RNA及/或RGN多肽(如果編碼序列被引入),其中RGN多肽為無核酸酶活性的RGN且進一步包括可檢測標記,且該方法進一步包括檢測該可檢測標記。可檢測標記可以與RGN融合為融合蛋白(例如,螢光蛋白)、或者可以是與RGN多肽接合或被併入RGN多肽中、可以用視覺或藉由其他方式檢測的小分子。
本文亦提供用於在標的序列的調控下調節所關注的標的序列或基因的表現的方法。該方法包括將至少一引導RNA或編碼至少一引導RNA的多核苷酸、以及至少一RGN多肽或編碼至少一RGN多肽的多核苷酸引入細胞、胞器或胚胎中;表現引導RNA及/或RGN多肽(如果編碼序列被引入),其中RGN多肽為無核酸酶活性的RGN。在這些實施方式中的一些實施方式中,無核酸酶活性的RGN為包括如本文描述的表現調節子域(即,表觀遺傳修飾域、轉錄活化域、或轉錄抑制子域)的融合蛋白。
本揭露內容還提供用於結合及/或修飾所關注的標的核苷酸序列的方法。該方法包括遞送系統至標的序列或包括標的序列的細胞、胞器或胚胎,系統包括至少一引導RNA或編碼至少一引導RNA的多核苷酸、以及至少一融合多肽,至少一融合多肽包括本發明的RGN及鹼基編輯多肽(例如,胞嘧啶去胺酶或腺嘌呤去胺酶)或編碼融合多肽的多核苷酸。
本領域中具有通常知識者將理解,本發明揭露的任何方法可以用於靶向單一標的序列或多個標的序列。因此,這些方法包括將單一RGN多肽與多個不同的引導RNA組合地使用,引導RNA可以靶向單一基因及/或多個基因內的多個不同序列。本文亦包括其中多個不同的引導RNA與多個不同的RGN多肽組合地引入的方法。這些引導RNA及引導RNA/RGN多肽系統可以靶向單一基因及/或多個基因內的多個不同序列。
在一個態樣中,本發明提供包含上述方法及組成物中所揭露的任何一或更多元素的套組。在一些實施方式中,套組包括載體系統及使用套組的說明。在一些實施方式中,載體系統包括(a)第一調控元素,第一調控元素與編碼crRNA序列的DNA序列及用於在編碼的crRNA序列的上游插入引導序列的一或更多插入位點可操作地連接,其中,當被表現時,引導序列引導RGN錯合物與真核細胞中的標的序列的序列專一性結合,其中RGN錯合物包括與引導RNA多核苷酸錯合的RGN酵素;及/或(b)第二調控元素,第二調控元素與酵素編碼序列可操作地連接,酵素編碼序列編碼包括核定位序列的該RGN酵素。元素可以個別地或組合地被提供、且可以被提供在任何適合的容器中,例如,小瓶、瓶子或管子。
在一些實施方式中,套組包括一或更多語言的說明。在一些實施方式中,套組包括在利用本文所述的一或更多元素的方法中使用的一或更多試劑。試劑可以被提供於任何適合的容器中。例如,套組可以提供一或更多反應或儲存緩衝液。試劑可以是以可用於特別測定的形式、或以在使用前需要添加一或更多其他組成的形式(例如,以濃縮或冷凍乾燥形式)被提供。緩衝液可以是任何緩衝液,包括但不限於碳酸鈉緩衝液、碳酸氫鈉緩衝液、硼酸鹽緩衝液、Tris緩衝液、MOPS緩衝液、HEPES緩衝液及其組合。在一些實施方式中,緩衝液是鹼性的。在一些實施方式中,緩衝液具有約7至約10的pH。
在一些實施方式中,套組包括與用於插入載體的引導序列對應的一或更多寡核苷酸,以便可操作地連接引導序列與調控元素。在一些實施方式中,套組包括同源重組模板多核苷酸。在一個態樣中,本發明提供用於使用RGN系統的一或更多元素的方法。本發明的RGN系統提供用於修飾標的多核苷酸的有效手段。本發明的RGN系統具有各式各樣的用途,包括修飾(例如,缺失、插入、移位、不活化、活化、鹼基編輯)多種細胞類型中標的多核苷酸。這樣,本發明的RGN系統在例如基因治療、藥物篩選、疾病診斷以及預後中具有廣泛的應用。範例性的RGN系統或RGN錯合物包括與引導序列錯合的RGN酵素,引導序列與標的多核苷酸內的標的序列雜交。 IX. 標的多核苷酸
在一個態樣中,本發明提供修飾真核細胞中的標的多核苷酸的方法,其可以是體內、離體或體外。在一些實施方式中,該方法包括從人類或非人類動物或植物(包括微藻類)中取樣細胞或細胞群、以及修飾細胞或多個細胞。培養可以在離體的任何階段發生。甚至可以將細胞或多個細胞重新引入非類人動物或植物(包括微藻類)中。
使用自然變異性,植物育種者結合了大多數有用的基因以獲得所需的品質,例如產量、品質、一致性、耐性以及對害蟲的抗性。這些所需的品質亦包括生長、日長偏好、溫度要求、花或生殖發育的起始日期、脂肪酸含量、抗蟲性、抗病性、線蟲抗性、真菌抗性、除草劑抗性、對各種環境因素(包括乾旱、熱、濕、冷、風及包括高鹽度的不利土壤條件)的耐受性。這些有用基因的來源包括天然或外來品種、原生種(heirloom variety)、野生植物近緣種、及例如以誘變劑處理植物材料的誘導突變。使用本發明,為植物育種者提供誘導突變的新工具。因此,本領域中具有通常知識者可以分析基因體以尋找有用基因的來源、且在具有所需特徵或性狀的品種中採用本發明以比先前的誘變劑更精確來誘導有用基因的增加,且因此加速並改良植物育種計劃。
RGN系統的標的多核苷酸可以是對真核細胞是內源或外源的任何多核苷酸。例如,標的多核苷酸可以是存在於真核細胞的細胞核中的多核苷酸。標的多核苷酸可以是編碼基因產物(例如,蛋白質)的序列或非編碼序列(例如,調節性多核苷酸或垃圾DNA(junk DNA))。不希望受理論的束縛,標的序列應該與PAM(前間隔序列鄰近模體)相關聯;亦即,由RGN系統辨識的短序列。PAM的精確序列和長度要求取決於所使用的RGN而不同,但PAM通常是與前間隔序列(即,標的序列)相鄰的2-7個鹼基對序列。
RGN系統的標的多核苷酸可以包括許多疾病關聯基因及多核苷酸以及與傳訊生化途徑關聯的基因及多核苷酸。標的多核苷酸的範例包括與傳訊生化途徑關聯的序列,例如,與傳訊生化途徑關聯的基因或多核苷酸。標的多核苷酸的範例包括與疾病關聯的基因或多核苷酸。「與疾病關聯的」基因或多核苷酸指:與非疾病控制的組織或細胞相較下,在從患病組織取得的細胞中以異常水準或以異常形式產生轉錄或轉譯產物的任何基因或多核苷酸。其可以是一種變得以異常高水準表現的基因;其可以是一種變得以異常低水準表現的基因,其中改變的表現與疾病的發生及/或進展相關。與疾病關聯的基因亦指具有突變或基因變異的基因,具有突變或基因變異的基因為直接造成疾病病因(例如,因果突變)、或為與造成疾病病因(例如,因果突變)的基因呈連鎖不平衡。因果突變可以是擴展的重複(比正常個體的數量更多),導致轉錄的 mRNA 不穩定、改變的剪接、或轉譯產物不穩定或轉譯產物活性降低。轉錄或轉譯的產物可以是已知的或未知的、且還可以處於正常或異常水準。在一些實施方式中,疾病可以是動物疾病。在一些實施方式中,疾病可以是鳥類疾病。在其他實施方式中,疾病可以是哺乳動物疾病。在進一步實施方式中,疾病可以是人類疾病。人類的疾病關聯基因及多核苷酸的範例在表6中提供、且亦可從全球資訊網上可取得的約翰霍普金斯大學(馬裡蘭州巴爾的摩)麥考斯克–納森斯遺傳醫學研究所(McKusick-Nathans Institute of Genetic Medicine)以及國家醫學圖書館(馬里蘭州貝塞斯達)(National Library of Medicine(Bethesda, Md.))國家生物技術資訊中心取得。
雖然RGN系統因其相對容易靶向所關注的基因體序列方面特別有用,但仍然存在RGN可以做什麼以解決因果突變的問題。一種方法為在RGN(較佳地,RGN的無活性或切口酶變異體)與鹼基編輯酵素或鹼基編輯酵素(例如,胞嘧啶去胺酶或腺嘌呤去胺酶鹼基編輯器)的活性域之間產生融合蛋白(美國第9,840,699號專利,藉由引用併入本文)。在一些實施方式中,該方法包括使DNA分子與(a)包括本發明的RGN或其切口酶變異體及例如去胺酶的鹼基編輯多肽的融合蛋白接觸;以及與(b)將(a)的融合蛋白靶向DNA股的標的核苷酸序列的gRNA接觸;其中DNA分子以有效量且在適於核鹼基的去胺作用的條件下與融合蛋白及gRNA接觸。在一些實施方式中,標的DNA序列包括與疾病或病症相關聯的序列,且其中核鹼基的去胺作用導致與疾病或病症無關聯的序列。在一些實施方式中,標的DNA序列位於農作物的對偶基因中,其中所關注的性狀的特定對偶基因導致農藝價值較低的植物。核鹼基的去胺作用導致改善植物的性狀並增加植物的農藝價值的對偶基因。
在一些實施方式中,DNA序列包括與疾病或病症相關聯的TàC或AàG點突變,且其中突變體C或G鹼基的去胺作用導致與疾病或病症無關聯的序列。在一些實施方式中,去胺作用校正與疾病或病症相關聯的序列中的點突變。
在一些實施方式中,與疾病或病症相關聯的序列編碼蛋白質,且其中去胺作用將終止密碼子引入與疾病或病症相關聯的序列中,導致編碼的蛋白質被截斷。在一些實施方式中,接觸是在易患有、患有或被診斷患有疾病或病症的個體體內進行。在一些實施方式中,疾病或病症為與基因體中的點突變或單鹼基突變相關聯的疾病。在一些實施方式中,疾病為遺傳性疾病、癌症、代謝疾病或溶體儲積症。 X. 醫藥組成物及治療方法
提供醫藥組成物,醫藥組成物包括本發明揭露的RGN多肽及其活性變異體及片段以及編碼RGN多肽及其活性變異體及片段的多核苷酸、本發明揭露的gRNA或編碼gRNA的多核苷酸、本發明揭露的系統或包括RGN多肽或RGN編碼的多核苷酸、gRNA或gRNA編碼的多核苷酸、或RGN系統中任一者的細胞及藥學上可接受的載體。
醫藥組成物為被使用於防止、降低強度、治癒或治療標的病症或疾病的組成物,組成物包括活性成分(即,RGN多肽、RGN編碼的多核苷酸、gRNA、gRNA編碼的多核苷酸、RGN系統、或包括這些中任一者的細胞)及藥學上可接受的載體。
如本文中使用的,「藥學上可接受的載體」指不對生物體引起明顯刺激且不消除活性成分(即,RGN多肽、RGN編碼的多核苷酸、gRNA、gRNA編碼的多核苷酸、RGN系統、或包括這些中任一者的細胞)的活性及特性的材料。載體必須具有足夠高的純度及足夠低的毒性,以使其適合投予正被治療的個體。載體可以是惰性的,或其可以具有醫藥效益。在一些實施方式中,藥學上可接受的載體包括適合對人或其他脊椎動物投予的一或更多相容固體或液體填充劑、稀釋劑或封裝物質。在一些實施方式中,藥學上可接受的載體不是天然存在的。在一些實施方式中,在自然界中未發現藥學上可接受的載體與活性成分在一起。
本發明揭露的方法中使用的醫藥組成物可以與提供適合的轉移、遞送、耐受性等等的適合的載體、賦形劑及其他藥劑一起配製。眾多適當的調配物為本領域中的通常知識者所知。例如,參見Remington, The Science and Practice of Pharmacy (第21版, 2005)。例如,適合的調配物包括粉劑、糊劑、膏劑、膠凍、蠟、油類、脂質、含脂質(陽離子或陰離子)的囊泡(例如,LIPOFECTIN囊泡)、脂質奈米粒子、DNA共軛物、無水吸收糊劑、水油乳及水油乳、乳液卡波蠟(emulsions carbowax)(各種分子量的聚乙二醇)、半固體凝膠及含有卡波蠟的半固體混合物。口服或非口服使用的醫藥組成物可以被製備為適於適應活性成分劑量的單位劑量的劑型。例如,這些單位劑量的劑型包括錠劑、丸劑、膠囊、注射劑(安瓿)、栓劑等。
在其中包括或以本發明揭露的RGN、gRNA、RGN系統或編碼RGN、gRNA、RGN系統的多核苷酸的細胞被投予個體的一些實施方式中,這些細胞與藥學上可接受的載體一起作為懸浮劑被投予。本領域中具有通常知識者將認識到用於細胞組成物中的藥學上可接受的載體將不包括實質上干擾將被遞送至個體的細胞的生存力的量的緩衝液、化合物、冷凍保存劑、保存劑、或其他製劑。包括細胞的調配物可以包括例如允許細胞膜保持完整性的滲透壓緩衝液、以及可選地包括在投予時保持細胞生存力或增強植入的營養素。這樣的調配物及懸浮劑為本領域中具有通常知識者所知、及/或使用例行實驗可被調適成與本文揭露的細胞一起使用。
細胞組成物亦可乳化為或呈現為核糖體組成物,前提條件為乳化程序不會不利地影響細胞生存力。細胞及任何其他活性成分可以與藥學上可接受且與活性成分相容的賦形劑、且以適合在本文揭露的治療方法中使用的量混合。
細胞組成物中包括的添加劑可以包括其內的組成的藥學上可接受的鹽。例如,藥學上可接受的鹽包括與例如鹽酸或磷酸的無機酸、或與例如醋酸、酒石酸、苯乙醇酸等等的有機酸形成的酸加成鹽(與多肽的自由胺基基團形成)。例如,與自由羧基基團形成的鹽亦可以衍生自例如鈉、鉀、銨、鈣或鐵的氫氧化物的無機鹼、及例如異丙胺、三甲胺、2-乙胺乙醇、組胺酸、普魯卡因等等的有機鹼。
生理學上可耐受且藥學上可接受的載體為本領域已知的。範例性液體載體為無菌水溶液,其除了活性成分及水之外不含有其他材料、或含有例如在生理pH值的磷酸鈉、生理食鹽水或二者的緩衝液(例如,磷酸鹽緩衝食鹽水)。又此外,水性載體可以含有一種以上的緩衝鹽以及例如氯化鈉及氯化鉀、葡萄糖、聚乙二醇及其他溶質之類的鹽。液體組成物亦可以含有除了水及排除水的液相。此類添加液相的範例為甘油、例如棉花籽油之類的植物油及水油乳液。在特定失調或病症的治療中有效的細胞組成物中使用的活性化合物的量可以取決於失調或病症的本質、且可由標準臨床技術確定。
本發明揭露的RGN多肽、引導RNA、RGN系統、或編碼RGN多肽、引導RNA、RGN系統的多核苷酸可以取決於投予的特定方式及劑型而以例如載體、溶劑、穩定劑、佐劑、稀釋劑等的藥學上可接受的賦形劑調配。在一些實施方式中,這些醫藥組成物被調配以達到生理學上相容的pH,且取決於調配物及投予途徑,範圍為約3的pH至約11的pH、約pH 3至約pH 7。在一些實施方式中,可以將pH調整至約pH 5.0至約pH 8的範圍。在一些實施方式中,組成物可以包括本文描述的治療有效量的至少一化合物、連同一或更多藥學上可接受的賦形劑。在一些實施方式中,組成物包括本文描述的化合物的組合、或包括治療或防止細菌生長中有用的第二活性成分(例如而不限於,抗菌或抗微生物劑)、或包括本揭露內容的試劑的組合。
例如,適合的賦形劑包括載體分子,載體分子包括大型、緩慢代謝的巨分子,例如,蛋白質、多醣、聚乳酸、聚乙醇酸、聚合的胺基酸、胺基酸共聚物及非活性的病毒粒子。其他範例性賦形劑可以包括抗氧化劑(例如而不限於,抗壞血酸)、螯合劑(例如而不限於,EDTA)、碳水化合物(例如而不限於,糊精、羥烷基纖維素及羥烷基甲基纖維素)、硬脂酸、液體(例如而不限於,油、水、食鹽水、甘油及乙醇)、潤濕或乳化劑、pH緩衝物質等等。
在一些實施方式中,調配物是以單位劑量或多劑量容器(例如,密封的安瓿及小瓶(vial))提供、且可儲存於冷凍乾燥(冷凍乾燥)條件下,需要在立即使用之前添加無菌液體載體(例如,食鹽水、注射用水、半液體泡沫或凝膠)。即時注射溶液及懸浮劑可以由前述類型的無菌粉劑、顆粒及錠劑製備。在一些實施方式中,活性成分溶解於緩衝液體溶液中,其以單位劑量或多劑量容器中被冷凍、且之後解凍用於注射或冷藏保存/穩定直到使用。
受控的釋放系統中可以包含一或多個治療劑。為了延長藥物的作用,常常期望從皮下、鞘內腔、或肌肉內注射以減緩藥物的吸收。這可藉由使用具有水難溶性的結晶或非結晶材料的液體懸浮劑來完成。然後,藥物的吸收速率取決於其溶解速率,而其溶解速率又可取決於結晶大小及結晶形式。替代地,非口服藥物形式的延遲吸收是藉由藥物溶解或懸浮於油媒介中完成。在一些實施方式中,長期持續釋放的植入劑的使用特別適合用於慢性病症的治療。長期持續釋放的植入劑為本領域中具有通常知識者所知。
本文提供在有需要的個體中治療疾病的方法。方法包括向有需要的個體投予有效量的本發明揭露的RGN多肽或其活性變異體或片段或編碼RGN多肽或其活性變異體或片段的多核苷酸、本發明揭露的gRNA或編碼gRNA的多核苷酸、本發明揭露的RGN系統、或由這些組成物中任一者修飾的或包括這些組成物中任一者的細胞。
在一些實施方式中,治療包括藉由投予本發明揭露的RGN多肽、gRNA、或RGN系統、或編碼RGN多肽、gRNA、或RGN系統的(一或多個)多核苷酸的體內基因編輯。在一些實施方式中,治療包括體外基因編輯,其中細胞是以本發明揭露的RGN多肽、gRNA、或RGN系統、或編碼RGN多肽、gRNA、或RGN系統的(一或多個)多核苷酸體外基因修飾、以及然後將經修飾的細胞投予至個體。在一些實施方式中,經基因修飾的細胞源自之後被投予修飾細胞的個體,且所移植細胞在本文中被稱為自體的。在一些實施方式中,經基因修飾的細胞源自與被投予經修飾的細胞的個體(亦即,接受者)同種內的不同個體(即,供體),且所移植細胞在本文中被稱為異體的。在本文描述的一些範例中,在投予有需要的個體之前,細胞可以在培養物中擴增。
在一些實施方式中,要以本發明揭露的組成物治療的疾病為可以用免疫療法(例如,用嵌合抗原受體(CAR)T細胞)治療的疾病。此類疾病包括但不限於癌症。在一些實施方式中,要以本發明揭露的組成物治療的疾病與因果突變相關聯。如本文中使用的,「因果突變」指對個體中的疾病或失調的嚴重程度或存在有貢獻的基因體中的特定核苷酸、多個核苷酸或核苷酸序列。因果突變的校正導致由疾病或失調引起的至少一個症狀改善。在一些實施方式中,因果突變與本文揭露的RGN所辨識的PAM位點相鄰。因果突變可以用本發明揭露的RGN或包括本發明揭露的RGN及鹼基編輯的多肽(即,鹼基編輯器)的融合多肽來校正。與因果突變相關聯的疾病的非限制性範例包括囊腫纖維化、賀勒氏症(Hurler syndrome)、弗里德里希運動失調(Friedreich’s Ataxia)、亨汀頓氏舞蹈症(Huntington’s Disease)及鐮形細胞疾病。在一些實施方式中,要以本揭露的RGN治療的疾病為列於表6中的疾病。疾病相關基因及突變的額外非限制性範例可以從在全球資訊網上取得的約翰霍普金斯大學(馬裡蘭州巴爾的摩)麥考斯克–納森斯遺傳醫學研究所及國家醫學圖書館(馬里蘭州貝賽斯達)國家生物技術資訊中心取得。
如本文中使用的,「治療」或「處理」、或「緩和」或「改善」可以互換地使用。這些術語指用於獲得有益或期望結果的方法,有益或期望結果包括但不限於治療效益及/或預防效益。治療效益意味著對治療中的一或更多疾病、病症或症狀中的任何治療相關改善或對治療中的一或更多疾病、病症或症狀上的效果。對於預防效益,組成物可以投予至處於特定疾病、病症或症狀的發展風險中的個體、或投予至報告疾病的一或更多生理症狀的個體中,即使疾病、病症或症狀可能尚未呈現徵兆。在一些實施方式中,可以在出現一或更多症狀及/或診斷出疾病後進行治療。在特定實施方式中,可以在沒有症狀的情況下進行治療,例如,以預防或延遲症狀的出現或抑制疾病的出現或進展。例如,可以在症狀出現之前對易患個體進行治療(例如,根據症狀史及/或根據遺傳或其他敏感因素)。例如,治療也可以在症狀解決消退後繼續進行,以預防或延遲其預防或復發。
術語「有效量」或「治療有效量」指足以達到有益或期望結果的藥劑量。治療有效量可以取決於下列中的一或更多者而變化:被治療的個體及疾病病症、個體的重量及年齡、疾病病症的嚴重性、投予方式等等,本領域中具有通常知識者可容易地對此做出確定。特定劑量可以取決於下列中的一或更多者而變化:所選的特定藥劑、要遵循的給藥方案、是否與其他化合物組合地投予、投予時間及其被攜帶的遞送系統。
術語「投予」指藉由導致所引入的活性成分至少部分地定位於期望位點(例如,受傷或修復的位點)處的方法或途徑以將活性成分置於個體內,使得產生(一或多個)期望效用。在一些實施方式中,揭露內容提供包括遞送本文揭露的RGN多肽、核酸分子、核糖核蛋白錯合物、載體、醫藥組成物及/或gRNA中任一者的方法。在一些實施方式中,揭露內容進一步提供由此類方法產生的細胞、以及包括或由此類細胞產生的生物體(例如,動物或植物)。在一些實施方式中,如本文描述的與引導序列組合(且可選地錯合)的RGN多肽及/或核酸分子被遞送至細胞。
在其中投予細胞的那些實施方式中,細胞可以藉由導致遞送至個體中的期望位置的任何適當的途徑進行投予,在該處至少一部分植入的細胞或細胞的組成保持存活。投予至個體後的細胞的存活期可以短至幾小時(例如,二十四小時)、至幾天、至長達數年、或甚至是患者的生命期,即,長期植入。例如,在本文描述的一些態樣中,光受體細胞或視網膜前驅細胞的有效量是經由系統投予途徑(例如腹膜內或靜脈內途徑)投予。
在一些實施方式中,投予包括藉由病毒遞送進行投予。包括本文揭露的編碼RGN多肽的核酸、核糖核蛋白錯合物或載體的病毒載體可以直接投予至患者(即,體內)或可以用於體外處理細胞、且可以可選地將經修飾的細胞投予患者(即,離體)。傳統基於病毒的系統可以包括但不限於用於基因轉移的反轉錄病毒、慢病毒、腺病毒、腺相關及單純皰疹病毒載體。用反轉錄病毒、慢病毒及腺相關病毒基因轉移方法在宿主基因體中的整合是可能的,常常導致所插入的轉基因的長期表現。慢病毒載體為能夠轉導或感染非分裂細胞且在通常情況下產生高病毒力價的反轉錄病毒載體。在偏好短暫表現的應用中,可以使用基於腺病毒的系統。基於腺病毒的載體在許多細胞類型中能夠有非常高的轉導效率、且不需要細胞分裂。
在一些實施方式中,投予包括藉由核酸的其他非病毒遞送進行投予。在無限定的狀況下,範例性的非病毒遞送方法包括RNP錯合物、脂質體轉染、核轉染、顯微注射、基因槍、病毒體、脂質體、免疫脂質體、聚陽離子或脂質核酸共軛物、裸DNA、人工病毒粒子及DNA的藥劑增強攝取。例如,美國第5,049,386號、第4,946,787號及第4,897,355號專利中描述了脂質體轉染,且脂質體轉染試劑是市售的(例如,Transfectam ™及Lipofectin™)。適合用於多核苷酸的有效受體辨識脂質體轉染的陽離子及中性脂質包括Feigner的WO1991/17424;WO 1991/16024中的那些。遞送可以是至細胞(例如,體外或離體投予)或標的組織(例如,體內投予)。
在一些實施方式中,投予包括藉由選自由下列所組成的群組的方法進行投予:靜脈內地、皮下地、肌肉內地、口服地、經直腸地、藉由氣溶膠、非口服地、經眼地、經肺地、經皮地、經陰道地、經耳地、經鼻地及藉由外部投予、或其任何組合。在一些實施方式中,對於細胞的遞送,使用藉由注射或灌注的投予。
如本文中使用的,術語「個體」指期望對其進行診斷、治療或療法的任何個體。在一些實施方式中,個體為動物。在一些實施方式中,個體為哺乳動物。在一些實施方式中,個體為人類。
治療效力可由熟練的臨床醫師確定。然而,如果疾病或失調的症候或症狀的任何一個或全部徵兆或症狀是以有益方式被改變(例如,至少減少10%)、或其他臨床上接受的疾病的症狀或標記被改良或改善,則治療被認為「有效治療」。亦可以藉由個體未發生如藉由住院評估的惡化、或不需要醫學介入(例如,疾病的進展被停止或至少減慢)來測量效力。測量這些指標的方法為本領域中具有通常知識者所知。治療包括:(1)抑制疾病,例如,遏止或減慢症狀的進展;或(2)減緩疾病,例如,引起症狀消退;以及(3)預防或降低症狀發展的可能性。
提供醫藥組成物,該醫藥組成物包括本發明揭露的RGN多肽或編碼RGN多肽的多核苷酸、本發明揭露的gRNA或編碼gRNA的多核苷酸、本發明揭露的系統、本發明揭露的包括RGN多肽或RGN編碼的多核苷酸、gRNA或gRNA編碼的多核苷酸或系統中任一者的核糖核蛋白錯合物或細胞、以及藥學上可接受的載體。
如本文中使用的,「藥學上可接受的載體」指不對生物體引起明顯刺激且不消除活性成分(例如,RGN多肽或編碼RGN多肽的核酸分子)的活性及特性的材料。載體必須具有足夠高的純度及足夠低的毒性,以使其適合投予正被治療的個體。載體可以是惰性的,或可以具有醫藥效益。在一些實施方式中,藥學上可接受的載體包括適合對人或其他脊椎動物投予的一或更多相容固體或液體填充劑、稀釋劑或封裝物質。在一些實施方式中,醫藥組成物包括不是天然存在的藥學上可接受的載體。在一些實施方式中,在自然界中未發現藥學上可接受的載體與活性成分在一起,且因此是異源的。
本發明揭露的方法中使用的醫藥組成物可以與提供適合的轉移、遞送、耐受性等等的適合的載體、賦形劑及其他藥劑一起配製。眾多適當的調配物為本領域中的通常知識者所知。例如,參見Remington, The Science and Practice of Pharmacy (21st ed. 2005)。非限制性範例包括無菌稀釋劑,例如注射用水、鹽水溶液、非揮發性油、聚乙二醇、甘油、丙二醇或其他合成溶劑;抗菌劑,例如苯甲醇或對羥基苯甲酸甲酯;抗氧化劑,例如抗壞血酸或亞硫酸氫鈉;螯合劑,例如乙二胺四乙酸;緩衝液,例如醋酸鹽、檸檬酸鹽或磷酸鹽,以及用於調節張力的試劑,例如氯化鈉或葡萄糖。靜脈內投予的特定載體是生理鹽水或磷酸鹽緩衝液(PBS)。口服或非口服使用的醫藥組成物可以被製備為適於適應活性成分劑量的單位劑量的劑型。例如,這些單位劑量的劑型包括錠劑、丸劑、膠囊、注射劑(安瓿)、栓劑等。這些組成物亦可以包含佐劑,佐劑包括保存劑、潤濕劑、乳化劑及分散劑。可以藉由各種抗菌劑及抗真菌劑(例如對羥苯甲酸酯、氯丁醇、酚、山梨酸等等)確保防止微生物的作用。亦可以希望包括等滲壓劑,例如糖、氯化鈉等等。可以藉由使用延遲吸收劑(例如單硬脂酸鋁及明膠)來延長可注射藥物形式的吸收。
在包括或以本發明揭露的RGN、gRNA、系統或編碼RGN、gRNA、系統的多核苷酸的細胞被投予個體的一些實施方式中,這些細胞與藥學上可接受的載體一起作為懸浮劑被投予。本領域中具有通常知識者將認識到用於細胞組成物中的藥學上可接受的載體將不包括實質上干擾將被遞送至個體的細胞的生存力的量的緩衝液、化合物、冷凍保存劑、保存劑、或其他製劑。包括細胞的調配物可以包括例如允許細胞膜保持完整性的滲透壓緩衝液,以及可選地包括在投予時保持細胞生存力或增強植入的營養素。這樣的調配物及懸浮劑為本領域中具有通常知識者所知、及/或使用例行實驗可被調適成與本文揭露的細胞一起使用。
細胞組成物亦可乳化為或呈現為核糖體組成物,前提條件為乳化程序不會不利地影響細胞生存力。細胞及任何其他活性成分可以與藥學上可接受且與活性成分相容的賦形劑、且以適合在本文揭露的治療方法中使用的量混合。
細胞組成物中包括的添加劑可以包括其內的組成的藥學上可接受的鹽。例如,藥學上可接受的鹽包括與例如鹽酸或磷酸的無機酸、或與例如醋酸、酒石酸、苯乙醇酸等等的有機酸形成的酸加成鹽(與多肽的自由胺基基團形成)。例如,與自由羧基基團形成的鹽亦可以衍生自例如鈉、鉀、銨、鈣或鐵的氫氧化物的無機鹼、及例如異丙胺、三甲胺、2-乙胺乙醇、組胺酸、普魯卡因等等的有機鹼。
投予本文描述的醫藥組成物的適合的途徑包括但不限於:外部、皮下、經皮、皮內、病灶內、關節內、腹膜內、膀胱內、經粘膜、牙齦、牙內、耳蝸內、經鼓膜、器官內、硬膜外、鞘內腔、肌肉內、靜脈內、血管內、骨內、眼周、瘤內、腦內及腦室內投予。
在一些實施方式中,本文描述的醫藥組成物局部地投予至患病部位(例如,肺)。在一些實施方式中,本文描述的醫藥組成物藉由注射、吸入(例如,氣溶膠)、藉由導管手段、藉由栓劑手段或藉由植入物手段投予至個體,植入物是包括膜(例如,矽橡膠膜或纖維)的多孔、非多孔或凝膠狀材料。在一些實施方式中,醫藥組成物被配製用於遞送至個體,例如用於基因編輯。
在一些實施方式中,醫藥組成物根據常規程序配製為適於靜脈內或皮下投予至個體(例如人)的組成物。在一些實施方式中,用於注射投予的醫藥組成物是無菌等滲壓水性緩衝液中的溶液。在必要的情況下,藥物亦可以包括助溶劑及局部麻醉劑(例如,利多卡因(lignocaine))以減輕注射部位的疼痛。一般來說,例如,組成在表明活性劑的量的密封容器(例如,安瓿或小袋)中作為乾冷凍粉或無水濃縮物單獨或混合在一起提供。在藥物將藉由灌注投予的情況下,其可以用含有無菌醫藥級水或鹽水的灌注瓶進行分配。在醫藥組成物藉由注射投予的情況下,可以提供含有無菌注射用水或鹽水的安瓿,以使在投予前混合組成。
在一些實施方式中,醫藥組成物可以包含在脂質顆粒或囊泡中,例如脂質體或微晶,其也適用於腸胃外投予。
雖然本文提供的醫藥組成物的描述主要針對適合投予至人類的醫藥組成物,但技術人員將理解此類組成物一般適合投予至所有種類的動物或生物體。 A. 使用鹼基編輯修飾因果突變
可以使用取決於本發明的RGN鹼基編輯器融合蛋白的方法來校正的遺傳性疾病的範例是賀勒氏症。賀勒氏症(亦稱為MPS-1)為α-L-艾杜糖醛酸酶(IDUA)缺乏的結果,導致在分子層次上由溶體中硫酸乙醯肝素及硫酸皮膚素的累積表徵的溶體儲積症。此疾病通常是由編碼α-L-艾杜糖醛酸酶的IDUA基因中的突變引起的遺傳性基因病症。常見的IDUA突變是W402X及Q70X,兩者都是導致轉譯過早終止的無意義突變。藉由精確的基因體編輯(PGE)方法很好地解決了這種突變,由於單一核苷酸的回復(例如,藉由鹼基編輯方法)將恢復野生型編碼序列並導致受遺傳基因座的內源性調控機制控制的蛋白質表現。另外,由於已知異型合子是無症狀的,所以靶向這些突變中的一者的PGE療法對於大部分患有此疾病的患者是有用的,因為僅需要校正其中一個突變的對偶基因(Bunge等人(1994) Hum. Mol. Genet. 3(6): 861-866,藉由引用併入本文)。
對賀勒氏症候群的目前治療包括酵素替代療法及骨髓移植(Vellodi等人(1997) Arch. Dis. Child. 76(2): 92-99; Peters等人(1998) Blood 91(7): 2601-2608,藉由引用併入本文)。儘管酵素替代療法對賀勒氏症候群患者的存活及生活品質產生了顯著影響,但這種方法需要每週進行昂貴且耗時的灌注。另外的方法包括遞送表現載體上的IDUA基因或將該基因插入高度表現的基因座中,例如,血清白蛋白的基因座中(美國第9,956,247號專利,藉由引用併入本文)。然而,這些方法不能將原始IDUA基因座恢復至正確的編碼序列。基因體編輯策略可以具有很多優點,最顯著的是基因表現的調控將受健康個體中存在的天然機制的控制。另外,使用鹼基編輯不一定引起雙股DNA斷裂,這可能由腫瘤抑制機制的破壞引致大規模染色體重排、細胞死亡或致癌。一般策略可以指向為使用本發明的RGN鹼基編輯器融合蛋白(例如,包括LPG10136、LPG10139、LPG10134或LPG10145的那些RGN鹼基編輯器融合蛋白)來靶向並校正人類基因體中的某些致病的突變。應理解,亦可尋求類似方法來靶向可由鹼基編輯校正的疾病。亦應進一步理解,亦可以使用本發明的RGN採用類似的方法來靶向其他物種(特別是一般的家庭寵物或家畜)中致病突變。一般的家庭寵物及家畜包括狗、貓、馬、豬、牛、羊、雞、驢、蛇、雪貂、魚(包括鮭魚)及蝦。 B. 藉由靶向缺失修飾因果突變
本發明的RGN在因果突變更複雜的人類治療方法中也有用。例如,例如弗里德里希共濟失調及亨汀頓氏舞蹈症的一些疾病是在基因特定區域的三個核苷酸模體的重複顯著增加的結果,這會影響表現的蛋白起作用或被表現的能力。弗里德里希共濟失調(FRDA)是一種導致脊髓神經組織進行性退化的體染色體隱性疾病。粒線體中的共濟蛋白(frataxin,FXN)蛋白質的降低程度引起細胞層次的氧化損傷及鐵缺乏。降低的FXN表現已與體細胞及生殖細胞系FXN基因的內含子1內的GAA三聯體擴增有關。在FRDA患者中,GAA重複通常由超過70個,有時甚至超過1000個(最常見的是600-900個)三聯體組成,而未受影響的個體具有約40個或更少的重複(Pandolfo等人(2012) Handbook of Clinical Neurology 103: 275-294;Campuzano等人(1996) Science 271: 1423-1427;Pandolfo (2002) Adv. Exp. Med. Biol. 516: 99-118;全部藉由引用併入本文)。
引起弗里德里希共濟失調(FRDA)的三核苷酸重複序列的擴增發生在FXN基因內界定的基因基因座中,被稱為FRDA不穩定性區域。RNA引導的核酸酶(RGN)可以用於切除FRDA患者細胞中的不穩定性區域。此方法需要:1)可被編程以靶向人類基因體中的對偶基因的引導RNA序列以及RGN;以及2)用於RGN及引導序列的遞送方法。特別是,當除了功能性表現匣所需的其他遺傳元素之外,還要考慮到SpCas9基因及引導RNA的長度時,用於基因體編輯的許多核酸酶(例如,來自化膿性鏈球菌的常用Cas9核酸酶(SpyCas9))太大而無法包裝到腺相關病毒(AAV)載體內。這使得使用SpCas9的方法更加困難。
本發明的某些RNA引導的核酸酶(例如,LPG10134、LPG10145、LPG10136及LPG10139)極適合隨引導RNA一起被包裝至AAV載體內。本發明包含使用本發明的RGN的策略,其中去除了基因體不穩定性的區域。這種策略適用於具有類似遺傳基礎的其他疾病及病症,例如亨汀頓氏舞蹈症。使用本發明的RGN的類似策略亦可以適用於具有農藝或經濟重要性的非人類動物(包括狗、貓、馬、豬、牛、羊、雞、驢、蛇、雪貂、以及包括鮭魚的魚及蝦)的類似疾病及病症。 C. 藉由靶向誘變修飾因果突變
本發明的RGN也可以引入可以導致有益效果的破壞性突變。編碼血紅素的基因(特別是β球蛋白鏈(HBB基因))中的基因缺陷可能是許多稱為血紅素病變的疾病(包括鐮狀紅血球貧血及地中海貧血)的原因。
在成年人中,血紅素是包括二條α類球蛋白鏈及二條β類球蛋白鏈及4個血基質基團的異四聚體。在成人中,α2β2四聚體被稱為血紅素A(HbA)或成人血紅素。通常情況下,α及β球蛋白鏈以大約1:1的比例合成,且此比例就血紅素及紅血球(RBC)穩定性而言似乎是至關重要的。在發育中的胎兒中,產生不同形式的血紅素(胎兒血紅素(HbF)),其對氧的結合親和力高於血紅素A,使得氧可經由母親的血流遞送至嬰兒的系統。胎兒血紅素亦含有二條α球蛋白鏈,但是代替成人β-球蛋白鏈,其具有二條胎兒γ-球蛋白鏈(即,胎兒血紅素為α2γ2)。從產生γ-球蛋白轉換為產生β-球蛋白的調控相當複雜、且主要涉及γ球蛋白轉錄的調降與β球蛋白轉錄的同時調升。在妊娠約30週時,胎兒中γ球蛋白的合成開始下降,而β球蛋白的產量增加。到約10個月齡時,新生兒的血紅素幾乎都是α2β2,雖然一些HbF持續到成年(約為總血紅素的1-3%)。在大多數具有血紅素病變的患者中,編碼γ球蛋白的基因仍然存在,但由於如上所述在臨近分娩時發生正常的基因抑制,表現相對較低。
鐮狀紅血球疾病是由β球蛋白基因(HBB)中的V6E突變(DNA層次的GAG至GTG)引起的,其中產生的血紅素被稱為「血紅素S」或「HbS」。在低氧條件下,HbS分子聚集並形成纖維狀沉澱。這些聚集體引起RBC異常或「鐮狀化」,導致細胞失去柔韌性。鐮狀化的RBC不再能夠擠入微血管床、且可能導致鐮狀紅血球患者發生血管閉塞危機。此外,鐮狀的RBC比正常RBC更脆弱、且傾向溶血,最終導致患者貧血。
鐮狀紅血球患者的治療及管理是終生的課題,其涉及抗生素治療、疼痛管理及急性發作期間的輸液。一種方法為使用羥基脲,其藉由增加γ球蛋白的產生來部分地發揮其效應。然而,慢性羥基脲療法的長期副作用仍然是未知的,而且治療會產生不良副作用且可能在患者之間具有不同的效果。儘管鐮狀紅血球治療的功效有所提高,但患者的預期壽命仍然僅在50歲中期至晚期,並且疾病的相關發病率對患者的生活品質具有深遠的影響。
地中海貧血(α地中海貧血及β地中海貧血)也是與血紅素有關的疾病、且通常涉及球蛋白鏈表現降低。這可以經由基因調控區域中的突變或從球蛋白編碼序列中的突變發生,導致表現降低或水平減少或功能性球蛋白。地中海貧血的治療通常涉及輸血及鐵螯合療法。如果可以找到合適的捐贈者,則骨髓移植也可以用於治療重度地中海貧血的人,但這種方法可能有重大風險。
已經提出用於治療鐮狀紅血球疾病(SCD)及β地中海貧血的一種方法為增加γ球蛋白的表現,使得HbF在功能上取代異常的成人血紅素。如上所述,用羥基脲治療SCD患者由於其在增加γ球蛋白表現上的效果而被認為是部分成功的(DeSimone (1982) Proc Nat'l Acad Sci USA 79(14):4428-31;Ley,等人, (1982) N. Engl. J. Medicine, 307: 1469-1475;Ley,等人, (1983) Blood 62: 370-380;Constantoulakis等人, (1988) Blood 72(6):1961-1967,全部藉由引用併入本文)。增加HbF的表現涉及鑑定其產物在γ球蛋白表現的調控中起作用的基因。一種這樣的基因為BCL11A。BCL11A編碼在成人類紅血球前驅細胞中表現的鋅指蛋白,且其表現的調降導致γ球蛋白表現增加(Sankaran等人(2008) Science 322: 1839,藉由引用併入本文)。已經提出使用靶向BCL11A基因的抑制性RNA(例如,美國專利公開號2011/0182867,藉由引用併入本文),但此技術具有若干潛在的缺點,包括可能無法實現完全減量(knock down)、這種RNA的遞送可能是有問題的、且RNA必須連續存在且終生需要多次治療。
本發明的RGN(例如,LPG10134、LPG10145、LPG10136或LPG10139)可以用於靶向BCL11A增強子區域以破壞BCL11A的表現,從而增加γ球蛋白表現。這種靶向的破壞可以藉由非同源末端連接(NHEJ)來實現,藉此,本發明的RGN靶向BCL11A增強子區域內的特定序列,使雙股斷裂,且細胞的機械修復斷裂通常同時引入有害突變。類似於針對其他疾病標的所描述的,本發明的RGN由於其相對小的尺寸,使得能夠將RGN及其引導RNA的表現匣包裝至單一AAV載體中以用於體內遞送,從而具有優於其他已知RGN的優點。使用本發明的RGN的類似策略亦可以應用於人類及具有農藝或經濟重要性的非人類動物中的類似疾病及病症。 XI. 包括基因 修飾的細胞
本文提供包括已使用如本文描述的RGN、crRNA及/或tracrRNA介導的過程修飾的所關注的標的序列的細胞及生物體。在這些實施方式中的一些實施方式中,RGN包括如SEQ ID NO:1-12中任一者所述的胺基酸序列、或其活性變異體或片段。在各種實施方式中,引導RNA包括CRISPR重複序列,CRISPR重複序列包括如SEQ ID NO:13-24中任一者所述的核苷酸序列、或其活性變異體或片段。在特殊實施方式中,引導RNA包括tracrRNA,tracrRNA包括如SEQ ID NO:25-36中任一者所述的核苷酸序列、或其活性變異體或片段。系統的引導RNA可以是單引導RNA或雙引導RNA。
經修飾的細胞可以是真核的(例如,哺乳動物、植物、昆蟲、鳥類細胞)或原核的。亦提供包括至少一核苷酸序列的胞器及胚胎,核苷酸序列已藉由利用如本文描述的RGN、crRNA及/或tracrRNA的方法進行修飾。經基因修飾的細胞、生物體、胞器及胚胎對於經修飾的核苷酸序列可以是異型接合的或同型接合的。
細胞、生物體、胞器或胚胎的染色體修飾可以導致表現改變(調升或調降)、不活化、或改變的蛋白質產物或整合序列的表現。在其中染色體修飾導致基因不活化或非功能性蛋白質產物表現的那些實施方式中,經基因修飾的細胞、生物體、胞器或胚胎被稱為「剔除(knock out)」。剔除表現型可以是缺失突變(即,至少一核苷酸的缺失)、插入突變(即,至少一核苷酸的插入)、或無意義突變(即,至少一核苷酸的取代,使得終止密碼子被引入)的結果。
替代地,細胞、生物體、胞器或胚胎的染色體修飾可以產生「嵌入(knock in)」,這是由編碼蛋白質的核苷酸序列的染色體整合導致的。在這些實施方式中的一些實施方式中,編碼序列被整合至染色體中,使得編碼野生型蛋白質的染色體序列失去活性,但表現出外源引入的蛋白質。
在一些實施方式中,染色體修飾導致變異體蛋白質產物的產生。表現的變異體蛋白質產物可以具有至少一胺基酸取代及/或至少一胺基酸的添加或缺失。當與野生型蛋白質比較時,由改變的染色體序列所編碼的變異體蛋白質產物可呈現出經修飾的特徵或活性,包括但不限於改變的酵素活性或受質專一性。
在又一些其他實施方式中,染色體修飾可導致改變的蛋白質表現模式。作為非限制性範例,控制蛋白質產物表現的調控區域中的染色體改變可導致蛋白質產物過度表現或調降或改變的組織或暫時表現模式。
已經被修飾的細胞可以根據傳統方式生長成生物體,例如植物。例如,參見McCormick等人(1986) Plant Cell Reports5:81-84。然後,可使這些植物生長,且用相同修飾株或不同株授粉,且所得雜交體具有基因修飾。本發明提供基因修飾的種子。再生植物的子代、變異體及突變體亦包括於本發明的範圍內,前提條件是這些部分包括基因修飾。進一步提供保持了基因修飾的經加工的植物產物或副產物,例如,包括豆粕。
本文提供的方法可以用於修飾任何植物物種,包括但不限於單子葉植物及雙子葉植物。所關注的植物的範例包括但不限於玉米(玉蜀黍)、高粱、小麥、向日葵、番茄、十字花科植物、胡椒、馬鈴薯、棉花、水稻、大豆、甜菜、甘蔗、煙草、大麥及油菜、甘藍型油菜、苜蓿、黑麥、小米、紅花、花生、甘藷、木薯、咖啡、椰子、鳳梨、柑橘、可可、茶、香蕉、鱷梨、無花果、番石榴、芒果、橄欖、木瓜、腰果、澳洲胡桃、杏仁、燕麥、蔬菜、觀賞植物以及針葉樹。
蔬菜包括但不限於番茄、萵苣、綠豆、皇帝豆、豌豆、及例如黃瓜、哈密瓜及洋香瓜之類的甜瓜屬的成員。觀賞植物包括但不限於杜鵑花、繡球花、芙蓉、玫瑰、鬱金香、水仙、矮牽牛、康乃馨、耶誕紅及菊花。較佳地,本發明的植物為農作物(例如,玉米、高粱、小麥、向日葵、番茄、十字花科植物、胡椒、馬鈴薯、棉花、水稻、大豆、甜菜、甘蔗、煙草、大麥、油菜等)。
本文提供的方法亦可用於基因修飾任何原核物種,包括但不限於古菌及細菌(例如,芽孢桿菌、克留氏菌、鏈黴菌、根瘤菌、埃希氏菌、假單胞菌、沙門氏菌、志賀氏桿菌、弧菌、耶爾森氏菌、黴漿菌、農桿菌、乳酸桿菌)。
本文提供的方法可以用於基因修飾任何真核物種或來自於其的細胞,包括但不限於動物(例如,哺乳動物、昆蟲、魚類、鳥類及爬蟲類物)、真菌、變形蟲、藻類及酵母。在一些實施方式中,由本發明揭露的方法修飾的細胞包括造血源的細胞(例如,免疫系統的細胞)包括但不限於B細胞、T細胞、自然殺手(NK)細胞、富潛能幹細胞、經誘導的富潛能幹細胞、嵌合抗原受體T(CAR-T)細胞、單核球、巨噬細胞及樹突細胞。
已修飾的細胞可以被引入生物體內。在自體細胞移植的情況下,這些細胞可以已源自相同生物體(例如,人),其中細胞以離體方法被修飾。替代地,在異體細胞移植的情況下,細胞源自相同物種中的另一生物體(例如,另一個人)。 XII. 套組
本揭露內容的一些態樣提供包括本發明的RGN多肽的套組。此外,在一些實施方式中,套組包括適合的試劑、緩衝液及/或使用RGN多肽的用法說明,例如用於體外或體內DNA或RNA編輯。在一些實施方式中,套組包括關於設計及使用適合的 gRNA 以用於核酸序列的靶向編輯的用法說明。
在一些實施方式中,醫藥組成物可以被提供作為醫藥套組,醫藥套組包括(a)含有冷凍乾燥形式的本揭露內容的組成物的容器以及(b)含有用於注射的藥學上可接受的稀釋劑(例如,無菌水)的第二容器。藥學上可接受的稀釋劑可以用於回溶或稀釋本揭露內容的冷凍乾燥化合物。可選地,與此類容器相關聯的可以是規範藥物或生物產品的製造、使用或銷售的政府機構規定的形式的通知,通知反映了由製造、使用或銷售機構批准用於人類投予。
冠詞「一(a)」和「一(an)」在本文中用於指冠詞的一或一個以上(即,至少一)的語法對象。作為範例,「多肽」意指一或更多多肽。
說明書中提及的所有出版物及專利申請案表示本揭露內容所屬領域中具有通常知識者的層次。所有出版物及專利申請案藉由引用併入本文,如同每一個單獨出版物或專利申請案被具體且單獨地指出藉由引用而被併入本文。
雖然為了清楚理解的目的已經以說明及範例頗詳細地描述了前述發明,但顯然可在所附實施方式的範圍內實施某些改變及修飾。 非限制性實施方式包括:
1. 一種核酸分子,包括編碼RNA引導的核酸酶(RGN)多肽的多核苷酸,其中多核苷酸包括編碼RGN多肽的核苷酸序列,RGN多肽包括與SEQ ID NO:1-12中任一者具有至少90%序列一致性的胺基酸序列; 其中,當與能夠與標的DNA序列雜交的引導RNA(gRNA)結合時,RGN多肽能夠以RNA引導的序列專一性方式結合標的DNA序列。
2. 如實施方式1所述的核酸分子,其中編碼RGN多肽的多核苷酸可操作地連接至與多核苷酸異源的啟動子。
3. 如實施方式1或2所述的核酸分子,其中RGN多肽包括與SEQ ID NO:1-12中任一者具有至少95%序列一致性的胺基酸序列。
4. 如實施方式1或2所述的核酸分子,其中RGN多肽包括與SEQ ID NO:1-12中任一者具有100%序列一致性的胺基酸序列。
5. 如實施方式1至4中任一者所述的核酸分子,其中RGN多肽能夠於結合時切割標的DNA序列。
6. 如實施方式5所述的核酸分子,其中RGN多肽能夠產生雙股斷裂。
7. 如實施方式5所述的核酸分子,其中RGN多肽能夠產生單股斷裂。
8. 如實施方式1至4中任一者所述的核酸分子,其中RGN多肽為核酸酶不活化的或為切口酶。
9. 如實施方式1至5、7及8中任一者所述的核酸分子,其中RGN多肽可操作地連接至先導編輯多肽。
10. 如實施方式9所述的核酸分子,其中先導編輯多肽包括DNA聚合酶。
11. 如實施方式9所述的核酸分子,其中先導編輯多肽包括反轉錄酶。
12. 如實施方式1至8中任一者所述的核酸分子,其中RGN多肽可操作地連接至鹼基編輯多肽。
13. 如實施方式12所述的核酸分子,其中鹼基編輯多肽為去胺酶。
14. 如實施方式13所述的核酸分子,其中去胺酶為胞嘧啶去胺酶或腺嘌呤去胺酶。
15. 如實施方式13所述的核酸分子,其中去胺酶與SEQ ID NO:377-448中任一者的胺基酸序列具有至少90%序列一致性。
16. 如實施方式13所述的核酸分子,其中去胺酶與SEQ ID NO:377-448中任一者的胺基酸序列具有至少100%序列一致性。
17. 如實施方式1至16中任一者所述的核酸分子,其中RGN多肽包括一或更多核定位訊號。
18. 如實施方式1至17中任一者所述的核酸分子,其中RGN多肽針對在真核細胞中的表現而被密碼子最佳化。
19. 如實施方式1至18中任一者所述的核酸分子, 其中標的DNA序列被定位為與前間隔序列鄰近模體(PAM)相鄰。
20. 一種載體,包括如實施方式1至19中任一者所述的核酸分子。
21. 如實施方式20所述的載體,進一步包括編碼能夠與標的DNA序列雜交的gRNA的至少一核苷酸序列。
22. 如實施方式21所述的載體,其中引導RNA選自由下列所組成的群組: a) 引導RNA,包括: i) CRISPR RNA,包括與SEQ ID NO:13具有至少90%序列一致性的CRISPR重複序列;以及 ii) tracrRNA,與SEQ ID NO:25具有至少90%序列一致性; 其中RGN多肽包括與SEQ ID NO:1具有至少90%序列一致性的胺基酸序列; b) 引導RNA,包括: i) CRISPR RNA,包括與SEQ ID NO:14具有至少90%序列一致性的CRISPR重複序列;以及 ii) tracrRNA,與SEQ ID NO:26具有至少90%序列一致性; 其中RGN多肽包括與SEQ ID NO:2具有至少90%序列一致性的胺基酸序列; c) 引導RNA,包括: i) CRISPR RNA,包括與SEQ ID NO:15具有至少90%序列一致性的CRISPR重複序列;以及 ii) tracrRNA,與SEQ ID NO:27具有至少90%序列一致性; 其中RGN多肽包括與SEQ ID NO:3具有至少90%序列一致性的胺基酸序列; d) 引導RNA,包括: i) CRISPR RNA,包括與SEQ ID NO:16具有至少90%序列一致性的CRISPR重複序列;以及 ii) tracrRNA,與SEQ ID NO:28具有至少90%序列一致性; 其中RGN多肽包括與SEQ ID NO:4具有至少90%序列一致性的胺基酸序列; e) 引導RNA,包括: i) CRISPR RNA,包括與SEQ ID NO:17具有至少90%序列一致性的CRISPR重複序列;以及 ii) tracrRNA,與SEQ ID NO:29具有至少90%序列一致性; 其中RGN多肽包括與SEQ ID NO:5具有至少90%序列一致性的胺基酸序列; f) 引導RNA,包括: i) CRISPR RNA,包括與SEQ ID NO:18具有至少90%序列一致性的CRISPR重複序列;以及 ii) tracrRNA,與SEQ ID NO:30具有至少90%序列一致性; 其中RGN多肽包括與SEQ ID NO:6具有至少90%序列一致性的胺基酸序列; g) 引導RNA,包括: i) CRISPR RNA,包括與SEQ ID NO:19具有至少90%序列一致性的CRISPR重複序列;以及 ii) tracrRNA,與SEQ ID NO:31具有至少90%序列一致性; 其中RGN多肽包括與SEQ ID NO:7具有至少90%序列一致性的胺基酸序列; h) 引導RNA,包括: i) CRISPR RNA,包括與SEQ ID NO:20具有至少90%序列一致性的CRISPR重複序列;以及 ii) tracrRNA,與SEQ ID NO:32具有至少90%序列一致性; 其中RGN多肽包括與SEQ ID NO:8具有至少90%序列一致性的胺基酸序列; i) 引導RNA,包括: i) CRISPR RNA,包括與SEQ ID NO:21具有至少90%序列一致性的CRISPR重複序列;以及 ii) tracrRNA,與SEQ ID NO:33具有至少90%序列一致性; 其中RGN多肽包括與SEQ ID NO:9具有至少90%序列一致性的胺基酸序列; j) 引導RNA,包括: i) CRISPR RNA,包括與SEQ ID NO:22具有至少90%序列一致性的CRISPR重複序列;以及 ii) tracrRNA,與SEQ ID NO:34具有至少90%序列一致性; 其中RGN多肽包括與SEQ ID NO:10具有至少90%序列一致性的胺基酸序列; k) 引導RNA,包括: i) CRISPR RNA,包括與SEQ ID NO:23具有至少90%序列一致性的CRISPR重複序列;以及 ii) tracrRNA,與SEQ ID NO:35具有至少90%序列一致性; 其中RGN多肽包括與SEQ ID NO:11具有至少90%序列一致性的胺基酸序列;以及 l) 引導RNA,包括: i) CRISPR RNA,包括與SEQ ID NO:24具有至少90%序列一致性的CRISPR重複序列;以及 ii) tracrRNA,與SEQ ID NO:36具有至少90%序列一致性; 其中RGN多肽包括與SEQ ID NO:12具有至少90%序列一致性的胺基酸序列。
23. 如實施方式21所述的載體,其中引導RNA選自由下列所組成的群組: a) 引導RNA,包括: i) CRISPR RNA,包括與SEQ ID NO:13具有至少95%序列一致性的CRISPR重複序列;以及 ii) tracrRNA,與SEQ ID NO:25具有至少95%序列一致性; 其中RGN多肽包括與SEQ ID NO:1具有至少95%序列一致性的胺基酸序列; b) 引導RNA,包括: i) CRISPR RNA,包括與SEQ ID NO:14具有至少95%序列一致性的CRISPR重複序列;以及 ii) tracrRNA,與SEQ ID NO:26具有至少95%序列一致性; 其中RGN多肽包括與SEQ ID NO:2具有至少95%序列一致性的胺基酸序列; c) 引導RNA,包括: i) CRISPR RNA,包括與SEQ ID NO:15具有至少95%序列一致性的CRISPR重複序列;以及 ii) tracrRNA,與SEQ ID NO:27具有至少95%序列一致性; 其中RGN多肽包括與SEQ ID NO:3具有至少95%序列一致性的胺基酸序列; d) 引導RNA,包括: i) CRISPR RNA,包括與SEQ ID NO:16具有至少95%序列一致性的CRISPR重複序列;以及 ii) tracrRNA,與SEQ ID NO:28具有至少95%序列一致性; 其中RGN多肽包括與SEQ ID NO:4具有至少95%序列一致性的胺基酸序列; e) 引導RNA,包括: i) CRISPR RNA,包括與SEQ ID NO:17具有至少95%序列一致性的CRISPR重複序列;以及 ii) tracrRNA,與SEQ ID NO:29具有至少95%序列一致性; 其中RGN多肽包括與SEQ ID NO:5具有至少95%序列一致性的胺基酸序列; f) 引導RNA,包括: i) CRISPR RNA,包括與SEQ ID NO:18具有至少95%序列一致性的CRISPR重複序列;以及 ii) tracrRNA,與SEQ ID NO:30具有至少95%序列一致性; 其中RGN多肽包括與SEQ ID NO:6具有至少95%序列一致性的胺基酸序列; g) 引導RNA,包括: i) CRISPR RNA,包括與SEQ ID NO:19具有至少95%序列一致性的CRISPR重複序列;以及 ii) tracrRNA,與SEQ ID NO:31具有至少95%序列一致性; 其中RGN多肽包括與SEQ ID NO:7具有至少95%序列一致性的胺基酸序列; h) 引導RNA,包括: i) CRISPR RNA,包括與SEQ ID NO:20具有至少95%序列一致性的CRISPR重複序列;以及 ii) tracrRNA,與SEQ ID NO:32具有至少95%序列一致性; 其中RGN多肽包括與SEQ ID NO:8具有至少95%序列一致性的胺基酸序列; i) 引導RNA,包括: i) CRISPR RNA,包括與SEQ ID NO:21具有至少95%序列一致性的CRISPR重複序列;以及 ii) tracrRNA,與SEQ ID NO:33具有至少95%序列一致性; 其中RGN多肽包括與SEQ ID NO:9具有至少95%序列一致性的胺基酸序列; j) 引導RNA,包括: i) CRISPR RNA,包括與SEQ ID NO:22具有至少95%序列一致性的CRISPR重複序列;以及 ii) tracrRNA,與SEQ ID NO:34具有至少95%序列一致性; 其中RGN多肽包括與SEQ ID NO:10具有至少95%序列一致性的胺基酸序列; k) 引導RNA,包括: i) CRISPR RNA,包括與SEQ ID NO:23具有至少95%序列一致性的CRISPR重複序列;以及 ii) tracrRNA,與SEQ ID NO:35具有至少95%序列一致性; 其中RGN多肽包括與SEQ ID NO:11具有至少95%序列一致性的胺基酸序列;以及 l) 引導RNA,包括: i) CRISPR RNA,包括與SEQ ID NO:24具有至少95%序列一致性的CRISPR重複序列;以及 ii) tracrRNA,與SEQ ID NO:36具有至少95%序列一致性; 其中RGN多肽包括與SEQ ID NO:12具有至少95%序列一致性的胺基酸序列。
24. 如實施方式21所述的載體,其中引導RNA選自由下列所組成的群組: a) 引導RNA,包括: i) CRISPR RNA,包括與SEQ ID NO:13具有100%序列一致性的CRISPR重複序列;以及 ii) tracrRNA,與SEQ ID NO:25具有100%序列一致性; 其中RGN多肽包括與SEQ ID NO:1具有100%序列一致性的胺基酸序列; b) 引導RNA,包括: i) CRISPR RNA,包括與SEQ ID NO:14具有100%序列一致性的CRISPR重複序列;以及 ii) tracrRNA,與SEQ ID NO:26具有100%序列一致性; 其中RGN多肽包括與SEQ ID NO:2具有100%序列一致性的胺基酸序列; c) 引導RNA,包括: i) CRISPR RNA,包括與SEQ ID NO:15具有100%序列一致性的CRISPR重複序列;以及 ii) tracrRNA,與SEQ ID NO:27具有100%序列一致性; 其中RGN多肽包括與SEQ ID NO:3具有100%序列一致性的胺基酸序列; d) 引導RNA,包括: i) CRISPR RNA,包括與SEQ ID NO:16具有100%序列一致性的CRISPR重複序列;以及 ii) tracrRNA,與SEQ ID NO:28具有100%序列一致性; 其中RGN多肽包括與SEQ ID NO:4具有100%序列一致性的胺基酸序列; e) 引導RNA,包括: i) CRISPR RNA,包括與SEQ ID NO:17具有100%序列一致性的CRISPR重複序列;以及 ii) tracrRNA,與SEQ ID NO:29具有100%序列一致性; 其中RGN多肽包括與SEQ ID NO:5具有100%序列一致性的胺基酸序列; f) 引導RNA,包括: i) CRISPR RNA,包括與SEQ ID NO:18具有100%序列一致性的CRISPR重複序列;以及 ii) tracrRNA,與SEQ ID NO:30具有100%序列一致性; 其中RGN多肽包括與SEQ ID NO:6具有100%序列一致性的胺基酸序列; g) 引導RNA,包括: i) CRISPR RNA,包括與SEQ ID NO:19具有100%序列一致性的CRISPR重複序列;以及 ii) tracrRNA,與SEQ ID NO:31具有100%序列一致性; 其中RGN多肽包括與SEQ ID NO:7具有100%序列一致性的胺基酸序列; h) 引導RNA,包括: i) CRISPR RNA,包括與SEQ ID NO:20具有100%序列一致性的CRISPR重複序列;以及 ii) tracrRNA,與SEQ ID NO:32具有100%序列一致性; 其中RGN多肽包括與SEQ ID NO:8具有100%序列一致性的胺基酸序列; i) 引導RNA,包括: i) CRISPR RNA,包括與SEQ ID NO:21具有100%序列一致性的CRISPR重複序列;以及 ii) tracrRNA,與SEQ ID NO:33具有100%序列一致性; 其中RGN多肽包括與SEQ ID NO:9具有100%序列一致性的胺基酸序列; j) 引導RNA,包括: i) CRISPR RNA,包括與SEQ ID NO:22具有100%序列一致性的CRISPR重複序列;以及 ii) tracrRNA,與SEQ ID NO:34具有100%序列一致性; 其中RGN多肽包括與SEQ ID NO:10具有100%序列一致性的胺基酸序列; k) 引導RNA,包括: i) CRISPR RNA,包括與SEQ ID NO:23具有100%序列一致性的CRISPR重複序列;以及 ii) tracrRNA,與SEQ ID NO:35具有100%序列一致性; 其中RGN多肽包括與SEQ ID NO:11具有100%序列一致性的胺基酸序列;以及 l) 引導RNA,包括: i) CRISPR RNA,包括與SEQ ID NO:24具有100%序列一致性的CRISPR重複序列;以及 ii) tracrRNA,與SEQ ID NO:36具有100%序列一致性; 其中RGN多肽包括與SEQ ID NO:12具有100%序列一致性的胺基酸序列。
25. 如實施方式21至24中任一者所述的載體,其中gRNA為單引導RNA(sgRNA)。
26. 如實施方式25所述的載體,其中sgRNA進一步包括延伸,延伸包括用於先導編輯的編輯模板。
27. 如實施方式21至24中任一者所述的載體,其中gRNA為雙引導RNA。
28. 一種細胞,包括如實施方式1至19中任一者所述的核酸分子或如實施方式20至27中任一者所述的載體。
29. 如實施方式28所述的細胞,其中細胞為原核細胞。
30. 如實施方式28所述的細胞,其中細胞為真核細胞。
31. 如實施方式30所述的細胞,其中真核細胞為哺乳動物細胞。
32. 如實施方式31所述的細胞,其中哺乳動物細胞為人類細胞。
33. 如實施方式32所述的細胞,其中人類細胞為免疫細胞。
34. 如實施方式33所述的細胞,其中免疫細胞為幹細胞。
35. 如實施方式34所述的細胞,其中幹細胞為經誘導的富潛能幹細胞。
36. 如實施方式30所述的細胞,其中真核細胞為昆蟲或鳥類細胞。
37. 如實施方式30所述的細胞,其中真核細胞為真菌細胞。
38. 如實施方式30所述的細胞,其中真核細胞為植物細胞。
39. 一種植物,包括如實施方式38所述的細胞。
40. 一種種子,包括如實施方式38所述的細胞。
41. 一種用於製造RGN多肽的方法,包括:在RGN多肽表現的條件下,培養如實施方式28至38中任一者所述的細胞。
42. 一種用於製造RGN多肽的方法,包括將異源核酸分子引入細胞內,異源核酸分子包括編碼RNA引導的核酸酶(RGN)多肽的核苷酸序列,RGN多肽包括與SEQ ID NO:1-12中任一者具有至少90%序列一致性的胺基酸序列; 其中,當與能夠與標的DNA序列雜交的引導RNA(gRNA)結合時,RGN多肽能夠以RNA引導的序列專一性方式結合標的DNA序列; 以及在RGN多肽表現的條件下,培養細胞。
43. 如實施方式42所述的方法,其中RGN多肽包括與SEQ ID NO:1-12中任一者具有至少95%序列一致性的胺基酸序列。
44. 如實施方式42所述的方法,其中RGN多肽包括與SEQ ID NO:1-12中任一者具有100%序列一致性的胺基酸序列。
45. 如實施方式41至44中任一者所述的方法,進一步包括純化RGN多肽。
46. 如實施方式41至44中任一者所述的方法,其中細胞進一步表現一或更多引導RNA,該一或更多引導RNA能夠與RGN多肽結合以形成RGN核糖核蛋白錯合物。
47. 如實施方式46所述的方法,進一步包括純化RGN核糖核蛋白錯合物。
48. 一種RNA引導的核酸酶(RGN)多肽,其中RGN多肽包括與SEQ ID NO:1-12中任一者具有至少90%序列一致性的胺基酸序列;以及 其中,當與能夠與DNA分子的標的DNA序列雜交的引導RNA(gRNA)結合時,RGN多肽能夠以RNA引導的序列專一性方式結合標的DNA序列。
49. 如實施方式48所述的RGN多肽,其中RGN多肽包括與SEQ ID NO:1-12中任一者具有至少95%序列一致性的胺基酸序列。
50. 如實施方式48所述的RGN多肽,其中RGN多肽包括與SEQ ID NO:1-12中任一者具有100%序列一致性的胺基酸序列。
51. 如實施方式48至50中任一者所述的RGN多肽,其中RGN多肽為分離的RGN多肽。
52. 如實施方式48至51中任一者所述的RGN多肽,其中RGN多肽能夠於結合時切割標的DNA序列。
53. 如實施方式52所述的RGN多肽,其中由RGN多肽的切割產生雙股斷裂。
54. 如實施方式52所述的RGN多肽,其中由RGN多肽的切割產生單股斷裂。
55. 如實施方式48至51中任一者所述的RGN多肽,其中RGN多肽為核酸酶不活化的或為切口酶。
56. 如實施方式48至50、54及55中任一者所述的RGN多肽,其中RGN多肽可操作地連接至先導編輯多肽。
57. 如實施方式56所述的RGN多肽,其中先導編輯多肽包括DNA聚合酶。
58. 如實施方式56所述的RGN多肽,其中先導編輯多肽包括反轉錄酶。
59. 如實施方式48至55中任一者所述的RGN多肽,其中RGN多肽可操作地連接至鹼基編輯多肽。
60. 如實施方式59所述的RGN多肽,其中鹼基編輯多肽為去胺酶。
61. 如實施方式60所述的RGN多肽,其中去胺酶為胞嘧啶去胺酶或腺嘌呤去胺酶。
62. 如實施方式60所述的RGN多肽,其中去胺酶與SEQ ID NO:377-448中任一者的胺基酸序列具有至少90%序列一致性。
63. 如實施方式60所述的RGN多肽,其中去胺酶與SEQ ID NO:377-448中任一者的胺基酸序列具有100%序列一致性。
64. 如實施方式48至63中任一者所述的RGN多肽,其中標的DNA序列被定位為與前間隔序列鄰近模體(PAM)相鄰。
65. 如實施方式48至64中任一者所述的RGN多肽,其中RGN多肽包括一或更多核定位訊號。
66. 一種核糖核蛋白(RNP)錯合物,包括如實施方式48至65中任一者所述的RGN多肽、以及與RGN多肽結合的引導RNA(gRNA)。
67. 如實施方式66所述的RNP錯合物,其中gRNA為單引導RNA(sgRNA)。
68. 如實施方式67所述的RNP錯合物,其中gRNA包括延伸,延伸包括用於先導編輯的編輯模板。
69. 一種核酸分子,包括CRISPR RNA(crRNA)或編碼crRNA的多核苷酸,其中crRNA包括間隔序列及CRISPR 重複序列,其中CRISPR 重複序列包括與SEQ ID NO:13-24中任一者具有至少90%序列一致性的核苷酸序列; 其中,當引導RNA與RNA引導的核酸酶(RGN)多肽結合時,引導RNA能夠以序列專一性方式、經由crRNA的間隔序列而與標的DNA序列雜交,引導RNA包括: a)             crRNA;以及 b)            與crRNA的CRISPR 重複序列雜交的轉錄活化的 CRISPR RNA(tracrRNA)。
70. 如實施方式69所述的核酸分子,其中編碼crRNA的多核苷酸可操作地連接至與多核苷酸異源的啟動子。
71. 如實施方式69或70所述的核酸分子,其中CRISPR 重複序列包括與SEQ ID NO:13-24中任一者具有至少95%序列一致性的核苷酸序列。
72. 如實施方式69或70所述的核酸分子,其中CRISPR 重複序列包括與SEQ ID NO:13-24中任一者具有100%序列一致性的核苷酸序列。
73. 一種載體,包括如實施方式69至72中任一者所述的包括編碼crRNA的多核苷酸的核酸分子。
74. 如實施方式73所述的載體,其中載體進一步包括編碼tracrRNA 的多核苷酸。
75. 如實施方式74所述的載體,其中tracrRNA選自由下列所組成的群組: a) 與SEQ ID NO:25具有至少90%序列一致性的tracrRNA,其中CRISPR重複序列與SEQ ID NO:13具有至少90%序列一致性; b) 與SEQ ID NO:26具有至少90%序列一致性的tracrRNA,其中CRISPR重複序列與SEQ ID NO:14具有至少90%序列一致性; c) 與SEQ ID NO:27具有至少90%序列一致性的tracrRNA,其中CRISPR重複序列與SEQ ID NO:15具有至少90%序列一致性; d) 與SEQ ID NO:28具有至少90%序列一致性的tracrRNA,其中CRISPR重複序列與SEQ ID NO:16具有至少90%序列一致性; e) 與SEQ ID NO:29具有至少90%序列一致性的tracrRNA,其中CRISPR重複序列與SEQ ID NO:17具有至少90%序列一致性; f) 與SEQ ID NO:30具有至少90%序列一致性的tracrRNA,其中CRISPR重複序列與SEQ ID NO:18具有至少90%序列一致性; g) 與SEQ ID NO:31具有至少90%序列一致性的tracrRNA,其中CRISPR重複序列與SEQ ID NO:19具有至少90%序列一致性; h) 與SEQ ID NO:32具有至少90%序列一致性的tracrRNA,其中CRISPR重複序列與SEQ ID NO:20具有至少90%序列一致性; i) 與SEQ ID NO:33具有至少90%序列一致性的tracrRNA,其中CRISPR重複序列與SEQ ID NO:21具有至少90%序列一致性; j) 與SEQ ID NO:34具有至少90%序列一致性的tracrRNA,其中CRISPR重複序列與SEQ ID NO:22具有至少90%序列一致性; k) 與SEQ ID NO:35具有至少90%序列一致性的tracrRNA,其中CRISPR重複序列與SEQ ID NO:23具有至少90%序列一致性;以及 l) 與SEQ ID NO:36具有至少90%序列一致性的tracrRNA,其中CRISPR重複序列與SEQ ID NO:24具有至少90%序列一致性。
76. 如實施方式74所述的載體,其中tracrRNA選自由下列所組成的群組: a) 與SEQ ID NO:25具有至少95%序列一致性的tracrRNA,其中CRISPR重複序列與SEQ ID NO:13具有至少95%序列一致性; b) 與SEQ ID NO:26具有至少95%序列一致性的tracrRNA,其中CRISPR重複序列與SEQ ID NO:14具有至少95%序列一致性; c) 與SEQ ID NO:27具有至少95%序列一致性的tracrRNA,其中CRISPR重複序列與SEQ ID NO:15具有至少95%序列一致性; d) 與SEQ ID NO:28具有至少95%序列一致性的tracrRNA,其中CRISPR重複序列與SEQ ID NO:16具有至少95%序列一致性; e) 與SEQ ID NO:29具有至少95%序列一致性的tracrRNA,其中CRISPR重複序列與SEQ ID NO:17具有至少95%序列一致性; f) 與SEQ ID NO:30具有至少95%序列一致性的tracrRNA,其中CRISPR重複序列與SEQ ID NO:18具有至少95%序列一致性; g) 與SEQ ID NO:31具有至少95%序列一致性的tracrRNA,其中CRISPR重複序列與SEQ ID NO:19具有至少95%序列一致性; h) 與SEQ ID NO:32具有至少95%序列一致性的tracrRNA,其中CRISPR重複序列與SEQ ID NO:20具有至少95%序列一致性; i) 與SEQ ID NO:33具有至少95%序列一致性的tracrRNA,其中CRISPR重複序列與SEQ ID NO:21具有至少95%序列一致性; j) 與SEQ ID NO:34具有至少95%序列一致性的tracrRNA,其中CRISPR重複序列與SEQ ID NO:22具有至少95%序列一致性; k) 與SEQ ID NO:35具有至少95%序列一致性的tracrRNA,其中CRISPR重複序列與SEQ ID NO:23具有至少95%序列一致性;以及 l) 與SEQ ID NO:36具有至少95%序列一致性的tracrRNA,其中CRISPR重複序列與SEQ ID NO:24具有至少95%序列一致性。
77. 如實施方式74所述的載體,其中tracrRNA選自由下列所組成的群組: a) 與SEQ ID NO:25具有100%序列一致性的tracrRNA,其中CRISPR重複序列與SEQ ID NO:13具有100%序列一致性; b) 與SEQ ID NO:26具有100%序列一致性的tracrRNA,其中CRISPR重複序列與SEQ ID NO:14具有100%序列一致性; c) 與SEQ ID NO:27具有100%序列一致性的tracrRNA,其中CRISPR重複序列與SEQ ID NO:15具有100%序列一致性; d) 與SEQ ID NO:28具有100%序列一致性的tracrRNA,其中CRISPR重複序列與SEQ ID NO:16具有100%序列一致性; e) 與SEQ ID NO:29具有100%序列一致性的tracrRNA,其中CRISPR重複序列與SEQ ID NO:17具有100%序列一致性; f) 與SEQ ID NO:30具有100%序列一致性的tracrRNA,其中CRISPR重複序列與SEQ ID NO:18具有100%序列一致性; g) 與SEQ ID NO:31具有100%序列一致性的tracrRNA,其中CRISPR重複序列與SEQ ID NO:19具有100%序列一致性; h) 與SEQ ID NO:32具有100%序列一致性的tracrRNA,其中CRISPR重複序列與SEQ ID NO:20具有100%序列一致性; i) 與SEQ ID NO:33具有100%序列一致性的tracrRNA,其中CRISPR重複序列與SEQ ID NO:21具有100%序列一致性; j) 與SEQ ID NO:34具有100%序列一致性的tracrRNA,其中CRISPR重複序列與SEQ ID NO:22具有100%序列一致性; k) 與SEQ ID NO:35具有100%序列一致性的tracrRNA,其中CRISPR重複序列與SEQ ID NO:23具有100%序列一致性;以及 l) 與SEQ ID NO:36具有100%序列一致性的tracrRNA,其中CRISPR重複序列與SEQ ID NO:24具有100%序列一致性。
78. 如實施方式74至77中任一者所述的載體,其中編碼crRNA的多核苷酸及編碼tracrRNA的多核苷酸可操作地連接至相同的啟動子、且被編碼為單引導RNA(sgRNA)。
79. 如實施方式78所述的載體,其中sgRNA包括延伸,延伸包括用於先導編輯的編輯模板。
80. 如實施方式74至77中任一者所述的載體,其中編碼crRNA的多核苷酸及編碼tracrRNA的多核苷酸可操作地連接至個別的啟動子。
81. 如實施方式74至80中任一者所述的載體,其中載體進一步包括編碼RGN多肽的多核苷酸。
82. 如實施方式81所述的載體,其中RGN多肽選自由下列所組成的群組: a) 與SEQ ID NO:1具有至少90%序列一致性的RGN多肽,其中CRISPR重複序列與SEQ ID NO:13具有至少90%序列一致性且tracrRNA與SEQ ID NO:25具有至少90%序列一致性; b) 與SEQ ID NO:2具有至少90%序列一致性的RGN多肽,其中CRISPR重複序列與SEQ ID NO:14具有至少90%序列一致性且tracrRNA與SEQ ID NO:26具有至少90%序列一致性; c) 與SEQ ID NO:3具有至少90%序列一致性的RGN多肽,其中CRISPR重複序列與SEQ ID NO:15具有至少90%序列一致性且tracrRNA與SEQ ID NO:27具有至少90%序列一致性; d) 與SEQ ID NO:4具有至少90%序列一致性的RGN多肽,其中CRISPR重複序列與SEQ ID NO:16具有至少90%序列一致性且tracrRNA與SEQ ID NO:28具有至少90%序列一致性; e) 與SEQ ID NO:5具有至少90%序列一致性的RGN多肽,其中CRISPR重複序列與SEQ ID NO:17具有至少90%序列一致性且tracrRNA與SEQ ID NO:29具有至少90%序列一致性; f) 與SEQ ID NO:6具有至少90%序列一致性的RGN多肽,其中CRISPR重複序列與SEQ ID NO:18具有至少90%序列一致性且tracrRNA與SEQ ID NO:30具有至少90%序列一致性; g) 與SEQ ID NO:7具有至少90%序列一致性的RGN多肽,其中CRISPR重複序列與SEQ ID NO:19具有至少90%序列一致性且tracrRNA與SEQ ID NO:31具有至少90%序列一致性; h) 與SEQ ID NO:8具有至少90%序列一致性的RGN多肽,其中CRISPR重複序列與SEQ ID NO:20具有至少90%序列一致性且tracrRNA與SEQ ID NO:32具有至少90%序列一致性; i) 與SEQ ID NO:9具有至少90%序列一致性的RGN多肽,其中CRISPR重複序列與SEQ ID NO:21具有至少90%序列一致性且tracrRNA與SEQ ID NO:33具有至少90%序列一致性; j) 與SEQ ID NO:10具有至少90%序列一致性的RGN多肽,其中CRISPR重複序列與SEQ ID NO:22具有至少90%序列一致性且tracrRNA與SEQ ID NO:34具有至少90%序列一致性; k) 與SEQ ID NO:11具有至少90%序列一致性的RGN多肽,其中CRISPR重複序列與SEQ ID NO:23具有至少90%序列一致性且tracrRNA與SEQ ID NO:35具有至少90%序列一致性;以及 l) 與SEQ ID NO:12具有至少90%序列一致性的RGN多肽,其中CRISPR重複序列與SEQ ID NO:24具有至少90%序列一致性且tracrRNA與SEQ ID NO:36具有至少90%序列一致性。
83. 如實施方式81所述的載體,其中RGN多肽選自由下列所組成的群組: a) 與SEQ ID NO:1具有至少95%序列一致性的RGN多肽,其中CRISPR重複序列與SEQ ID NO:13具有至少95%序列一致性且tracrRNA與SEQ ID NO:25具有至少95%序列一致性; b) 與SEQ ID NO:2具有至少95%序列一致性的RGN多肽,其中CRISPR重複序列與SEQ ID NO:14具有至少95%序列一致性且tracrRNA與SEQ ID NO:26具有至少95%序列一致性; c) 與SEQ ID NO:3具有至少95%序列一致性的RGN多肽,其中CRISPR重複序列與SEQ ID NO:15具有至少95%序列一致性且tracrRNA與SEQ ID NO:27具有至少95%序列一致性; d) 與SEQ ID NO:4具有至少95%序列一致性的RGN多肽,其中CRISPR重複序列與SEQ ID NO:16具有至少95%序列一致性且tracrRNA與SEQ ID NO:28具有至少95%序列一致性; e) 與SEQ ID NO:5具有至少95%序列一致性的RGN多肽,其中CRISPR重複序列與SEQ ID NO:17具有至少95%序列一致性且tracrRNA與SEQ ID NO:29具有至少95%序列一致性; f) 與SEQ ID NO:6具有至少95%序列一致性的RGN多肽,其中CRISPR重複序列與SEQ ID NO:18具有至少95%序列一致性且tracrRNA與SEQ ID NO:30具有至少95%序列一致性; g) 與SEQ ID NO:7具有至少95%序列一致性的RGN多肽,其中CRISPR重複序列與SEQ ID NO:19具有至少95%序列一致性且tracrRNA與SEQ ID NO:31具有至少95%序列一致性; h) 與SEQ ID NO:8具有至少95%序列一致性的RGN多肽,其中CRISPR重複序列與SEQ ID NO:20具有至少95%序列一致性且tracrRNA與SEQ ID NO:32具有至少95%序列一致性; i) 與SEQ ID NO:9具有至少95%序列一致性的RGN多肽,其中CRISPR重複序列與SEQ ID NO:21具有至少95%序列一致性且tracrRNA與SEQ ID NO:33具有至少95%序列一致性; j) 與SEQ ID NO:10具有至少95%序列一致性的RGN多肽,其中CRISPR重複序列與SEQ ID NO:22具有至少95%序列一致性且tracrRNA與SEQ ID NO:34具有至少95%序列一致性; k) 與SEQ ID NO:11具有至少95%序列一致性的RGN多肽,其中CRISPR重複序列與SEQ ID NO:23具有至少95%序列一致性且tracrRNA與SEQ ID NO:35具有至少95%序列一致性;以及 l) 與SEQ ID NO:12具有至少95%序列一致性的RGN多肽,其中CRISPR重複序列與SEQ ID NO:24具有至少95%序列一致性且tracrRNA與SEQ ID NO:36具有至少95%序列一致性。
84.如實施方式81所述的載體,其中RGN多肽選自由下列所組成的群組: a) 與SEQ ID NO:1具有100%序列一致性的RGN多肽,其中CRISPR重複序列與SEQ ID NO:13具有100%序列一致性且tracrRNA與SEQ ID NO:25具有100%序列一致性; b) 與SEQ ID NO:2具有100%序列一致性的RGN多肽,其中CRISPR重複序列與SEQ ID NO:14具有100%序列一致性且tracrRNA與SEQ ID NO:26具有100%序列一致性; c) 與SEQ ID NO:3具有100%序列一致性的RGN多肽,其中CRISPR重複序列與SEQ ID NO:15具有100%序列一致性且tracrRNA與SEQ ID NO:27具有100%序列一致性; d) 與SEQ ID NO:4具有100%序列一致性的RGN多肽,其中CRISPR重複序列與SEQ ID NO:16具有100%序列一致性且tracrRNA與SEQ ID NO:28具有100%序列一致性; e) 與SEQ ID NO:5具有100%序列一致性的RGN多肽,其中CRISPR重複序列與SEQ ID NO:17具有100%序列一致性且tracrRNA與SEQ ID NO:29具有100%序列一致性; f) 與SEQ ID NO:6具有100%序列一致性的RGN多肽,其中CRISPR重複序列與SEQ ID NO:18具有100%序列一致性且tracrRNA與SEQ ID NO:30具有100%序列一致性; g) 與SEQ ID NO:7具有100%序列一致性的RGN多肽,其中CRISPR重複序列與SEQ ID NO:19具有100%序列一致性且tracrRNA與SEQ ID NO:31具有100%序列一致性; h) 與SEQ ID NO:8具有100%序列一致性的RGN多肽,其中CRISPR重複序列與SEQ ID NO:20具有100%序列一致性且tracrRNA與SEQ ID NO:32具有100%序列一致性; i) 與SEQ ID NO:9具有100%序列一致性的RGN多肽,其中CRISPR重複序列與SEQ ID NO:21具有100%序列一致性且tracrRNA與SEQ ID NO:33具有100%序列一致性; j) 與SEQ ID NO:10具有100%序列一致性的RGN多肽,其中CRISPR重複序列與SEQ ID NO:22具有100%序列一致性且tracrRNA與SEQ ID NO:34具有100%序列一致性; k) 與SEQ ID NO:11具有100%序列一致性的RGN多肽,其中CRISPR重複序列與SEQ ID NO:23具有100%序列一致性且tracrRNA與SEQ ID NO:35具有100%序列一致性;以及 l) 與SEQ ID NO:12具有100%序列一致性的RGN多肽,其中CRISPR重複序列與SEQ ID NO:24具有100%序列一致性且tracrRNA與SEQ ID NO:36具有100%序列一致性。
85. 一種核酸分子,包括轉錄活化的CRISPR RNA(tracrRNA)或編碼tracrRNA的多核苷酸,tracrRNA包括與SEQ ID NO:25-36中任一者具有至少90%序列一致性的核苷酸序列; 其中,當引導RNA與RNA引導的核酸酶(RGN)多肽結合時,引導RNA能夠以序列專一性方式、經由crRNA的間隔序列而與標的DNA序列雜交,引導RNA包括: a)             tracrRNA;以及 b)            crRNA,包括間隔序列及CRISPR重複序列,其中tracrRNA與crRNA的 CRISPR重複序列雜交。
86. 如實施方式85所述的核酸分子,其中編碼tracrRNA的多核苷酸可操作地連接至與多核苷酸異源的啟動子。
87. 如實施方式85實施方式86或所述的核酸分子,其中tracrRNA包括與SEQ ID NO:25-36中任一者具有至少95%序列一致性的核苷酸序列。
88. 如實施方式85實施方式86或所述的核酸分子,其中tracrRNA包括與SEQ ID NO:25-36中任一者具有100%序列一致性的核苷酸序列。
89. 一種載體,包括如實施方式85至88中任一者所述的包括編碼tracrRNA的多核苷酸的核酸分子。
90. 如實施方式89所述的載體,其中載體進一步包括編碼crRNA的多核苷酸。
91. 如實施方式90所述的載體,其中crRNA包括選自由下列群組所組成的CRISPR重複序列: a) 與SEQ ID NO:13具有至少90%序列一致性的CRISPR重複序列,其中tracrRNA與SEQ ID NO:25具有至少90%序列一致性; b) 與SEQ ID NO:14具有至少90%序列一致性的CRISPR重複序列,其中tracrRNA與SEQ ID NO:26具有至少90%序列一致性; c) 與SEQ ID NO:15具有至少90%序列一致性的CRISPR重複序列,其中tracrRNA與SEQ ID NO:27具有至少90%序列一致性; d) 與SEQ ID NO:16具有至少90%序列一致性的CRISPR重複序列,其中tracrRNA與SEQ ID NO:28具有至少90%序列一致性; e) 與SEQ ID NO:17具有至少90%序列一致性的CRISPR重複序列,其中tracrRNA與SEQ ID NO:29具有至少90%序列一致性; f) 與SEQ ID NO:18具有至少90%序列一致性的CRISPR重複序列,其中tracrRNA與SEQ ID NO:30具有至少90%序列一致性; g) 與SEQ ID NO:19具有至少90%序列一致性的CRISPR重複序列,其中tracrRNA與SEQ ID NO:31具有至少90%序列一致性; h) 與SEQ ID NO:20具有至少90%序列一致性的CRISPR重複序列,其中tracrRNA與SEQ ID NO:32具有至少90%序列一致性; i) 與SEQ ID NO:21具有至少90%序列一致性的CRISPR重複序列,其中tracrRNA與SEQ ID NO:33具有至少90%序列一致性; j) 與SEQ ID NO:22具有至少90%序列一致性的CRISPR重複序列,其中tracrRNA與SEQ ID NO:34具有至少90%序列一致性; k) 與SEQ ID NO:23具有至少90%序列一致性的CRISPR重複序列,其中tracrRNA與SEQ ID NO:35具有至少90%序列一致性;以及 l) 與SEQ ID NO:24具有至少90%序列一致性的CRISPR重複序列,其中tracrRNA與SEQ ID NO:36具有至少90%序列一致性。
92. 如實施方式90所述的載體,其中crRNA包括選自由下列群組所組成的CRISPR重複序列: a) 與SEQ ID NO:13具有至少95%序列一致性的CRISPR重複序列,其中tracrRNA與SEQ ID NO:25具有至少95%序列一致性; b) 與SEQ ID NO:14具有至少95%序列一致性的CRISPR重複序列,其中tracrRNA與SEQ ID NO:26具有至少95%序列一致性; c) 與SEQ ID NO:15具有至少95%序列一致性的CRISPR重複序列,其中tracrRNA與SEQ ID NO:27具有至少95%序列一致性; d) 與SEQ ID NO:16具有至少95%序列一致性的CRISPR重複序列,其中tracrRNA與SEQ ID NO:28具有至少95%序列一致性; e) 與SEQ ID NO:17具有至少95%序列一致性的CRISPR重複序列,其中tracrRNA與SEQ ID NO:29具有至少95%序列一致性; f) 與SEQ ID NO:18具有至少95%序列一致性的CRISPR重複序列,其中tracrRNA與SEQ ID NO:30具有至少95%序列一致性; g) 與SEQ ID NO:19具有至少95%序列一致性的CRISPR重複序列,其中tracrRNA與SEQ ID NO:31具有至少95%序列一致性; h) 與SEQ ID NO:20具有至少95%序列一致性的CRISPR重複序列,其中tracrRNA與SEQ ID NO:32具有至少95%序列一致性; i) 與SEQ ID NO:21具有至少95%序列一致性的CRISPR重複序列,其中tracrRNA與SEQ ID NO:33具有至少95%序列一致性; j) 與SEQ ID NO:22具有至少95%序列一致性的CRISPR重複序列,其中tracrRNA與SEQ ID NO:34具有至少95%序列一致性; k) 與SEQ ID NO:23具有至少95%序列一致性的CRISPR重複序列,其中tracrRNA與SEQ ID NO:35具有至少95%序列一致性;以及 l) 與SEQ ID NO:24具有至少95%序列一致性的CRISPR重複序列,其中tracrRNA與SEQ ID NO:36具有至少95%序列一致性。
93. 如實施方式90所述的載體,其中crRNA包括選自由下列群組所組成的CRISPR重複序列: a) 與SEQ ID NO:13具有100%序列一致性的CRISPR重複序列,其中tracrRNA與SEQ ID NO:25具有100%序列一致性; b) 與SEQ ID NO:14具有100%序列一致性的CRISPR重複序列,其中tracrRNA與SEQ ID NO:26具有100%序列一致性; c) 與SEQ ID NO:15具有100%序列一致性的CRISPR重複序列,其中tracrRNA與SEQ ID NO:27具有100%序列一致性; d) 與SEQ ID NO:16具有100%序列一致性的CRISPR重複序列,其中tracrRNA與SEQ ID NO:28具有100%序列一致性; e) 與SEQ ID NO:17具有100%序列一致性的CRISPR重複序列,其中tracrRNA與SEQ ID NO:29具有100%序列一致性; f) 與SEQ ID NO:18具有100%序列一致性的CRISPR重複序列,其中tracrRNA與SEQ ID NO:30具有100%序列一致性; g) 與SEQ ID NO:19具有100%序列一致性的CRISPR重複序列,其中tracrRNA與SEQ ID NO:31具有100%序列一致性; h) 與SEQ ID NO:20具有100%序列一致性的CRISPR重複序列,其中tracrRNA與SEQ ID NO:32具有100%序列一致性; i) 與SEQ ID NO:21具有100%序列一致性的CRISPR重複序列,其中tracrRNA與SEQ ID NO:33具有100%序列一致性; j) 與SEQ ID NO:22具有100%序列一致性的CRISPR重複序列,其中tracrRNA與SEQ ID NO:34具有100%序列一致性; k) 與SEQ ID NO:23具有100%序列一致性的CRISPR重複序列,其中tracrRNA與SEQ ID NO:35具有100%序列一致性;以及 l) 與SEQ ID NO:24具有100%序列一致性的CRISPR重複序列,其中tracrRNA與SEQ ID NO:36具有100%序列一致性。
94. 如實施方式90至93中任一者所述的載體,其中編碼crRNA的多核苷酸及編碼tracrRNA的多核苷酸可操作地連接至相同的啟動子、且被編碼為單引導RNA(sgRNA)。
95. 如實施方式94所述的載體,其中sgRNA包括延伸,延伸包括用於先導編輯的編輯模板。
96. 如實施方式90至93中任一者所述的載體,其中編碼crRNA的多核苷酸及編碼tracrRNA的多核苷酸可操作地連接至個別的啟動子。
97. 如實施方式90至96中任一者所述的載體,其中載體進一步包括編碼RGN多肽的多核苷酸。
98. 如實施方式97所述的載體,其中RGN多肽選自由下列所組成的群組: a) 與SEQ ID NO:1具有至少90%序列一致性的RGN多肽,其中crRNA包括與SEQ ID NO:13具有至少90%序列一致性的CRISPR重複序列,且tracrRNA與SEQ ID NO:25具有至少90%序列一致性; b) 與SEQ ID NO:2具有至少90%序列一致性的RGN多肽,其中crRNA包括與SEQ ID NO:14具有至少90%序列一致性的CRISPR重複序列,且tracrRNA與SEQ ID NO:26具有至少90%序列一致性; c) 與SEQ ID NO:3具有至少90%序列一致性的RGN多肽,其中crRNA包括與SEQ ID NO:15具有至少90%序列一致性的CRISPR重複序列,且tracrRNA與SEQ ID NO:27具有至少90%序列一致性; d) 與SEQ ID NO:4具有至少90%序列一致性的RGN多肽,其中crRNA包括與SEQ ID NO:16具有至少90%序列一致性的CRISPR重複序列,且tracrRNA與SEQ ID NO:28具有至少90%序列一致性; e) 與SEQ ID NO:5具有至少90%序列一致性的RGN多肽,其中crRNA包括與SEQ ID NO:17具有至少90%序列一致性的CRISPR重複序列,且tracrRNA與SEQ ID NO:29具有至少90%序列一致性; f) 與SEQ ID NO:6具有至少90%序列一致性的RGN多肽,其中crRNA包括與SEQ ID NO:18具有至少90%序列一致性的CRISPR重複序列,且tracrRNA與SEQ ID NO:30具有至少90%序列一致性; g) 與SEQ ID NO:7具有至少90%序列一致性的RGN多肽,其中crRNA包括與SEQ ID NO:19具有至少90%序列一致性的CRISPR重複序列,且tracrRNA與SEQ ID NO:31具有至少90%序列一致性; h) 與SEQ ID NO:8具有至少90%序列一致性的RGN多肽,其中crRNA包括與SEQ ID NO:20具有至少90%序列一致性的CRISPR重複序列,且tracrRNA與SEQ ID NO:32具有至少90%序列一致性; i) 與SEQ ID NO:9具有至少90%序列一致性的RGN多肽,其中crRNA包括與SEQ ID NO:21具有至少90%序列一致性的CRISPR重複序列,且tracrRNA與SEQ ID NO:33具有至少90%序列一致性; j) 與SEQ ID NO:10具有至少90%序列一致性的RGN多肽,其中crRNA包括與SEQ ID NO:22具有至少90%序列一致性的CRISPR重複序列,且tracrRNA與SEQ ID NO:34具有至少90%序列一致性; k) 與SEQ ID NO:11具有至少90%序列一致性的RGN多肽,其中crRNA包括與SEQ ID NO:23具有至少90%序列一致性的CRISPR重複序列,且tracrRNA與SEQ ID NO:35具有至少90%序列一致性;以及 l) 與SEQ ID NO:12具有至少90%序列一致性的RGN多肽,其中crRNA包括與SEQ ID NO:24具有至少90%序列一致性的CRISPR重複序列,且tracrRNA與SEQ ID NO:36具有至少90%序列一致性。
99. 如實施方式97所述的載體,其中RGN多肽選自由下列所組成的群組: a) 與SEQ ID NO:1具有至少95%序列一致性的RGN多肽,其中crRNA包括與SEQ ID NO:13具有至少95%序列一致性的CRISPR重複序列,且tracrRNA與SEQ ID NO:25具有至少95%序列一致性; b) 與SEQ ID NO:2具有至少95%序列一致性的RGN多肽,其中crRNA包括與SEQ ID NO:14具有至少95%序列一致性的CRISPR重複序列,且tracrRNA與SEQ ID NO:26具有至少95%序列一致性; c) 與SEQ ID NO:3具有至少95%序列一致性的RGN多肽,其中crRNA包括與SEQ ID NO:15具有至少95%序列一致性的CRISPR重複序列,且tracrRNA與SEQ ID NO:27具有至少95%序列一致性; d) 與SEQ ID NO:4具有至少95%序列一致性的RGN多肽,其中crRNA包括與SEQ ID NO:16具有至少95%序列一致性的CRISPR重複序列,且tracrRNA與SEQ ID NO:28具有至少95%序列一致性; e) 與SEQ ID NO:5具有至少95%序列一致性的RGN多肽,其中crRNA包括與SEQ ID NO:17具有至少95%序列一致性的CRISPR重複序列,且tracrRNA與SEQ ID NO:29具有至少95%序列一致性; f) 與SEQ ID NO:6具有至少95%序列一致性的RGN多肽,其中crRNA包括與SEQ ID NO:18具有至少95%序列一致性的CRISPR重複序列,且tracrRNA與SEQ ID NO:30具有至少95%序列一致性; g) 與SEQ ID NO:7具有至少95%序列一致性的RGN多肽,其中crRNA包括與SEQ ID NO:19具有至少95%序列一致性的CRISPR重複序列,且tracrRNA與SEQ ID NO:31具有至少95%序列一致性; h) 與SEQ ID NO:8具有至少95%序列一致性的RGN多肽,其中crRNA包括與SEQ ID NO:20具有至少95%序列一致性的CRISPR重複序列,且tracrRNA與SEQ ID NO:32具有至少95%序列一致性; i) 與SEQ ID NO:9具有至少95%序列一致性的RGN多肽,其中crRNA包括與SEQ ID NO:21具有至少95%序列一致性的CRISPR重複序列,且tracrRNA與SEQ ID NO:33具有至少95%序列一致性; j) 與SEQ ID NO:10具有至少95%序列一致性的RGN多肽,其中crRNA包括與SEQ ID NO:22具有至少95%序列一致性的CRISPR重複序列,且tracrRNA與SEQ ID NO:34具有至少95%序列一致性; k) 與SEQ ID NO:11具有至少95%序列一致性的RGN多肽,其中crRNA包括與SEQ ID NO:23具有至少95%序列一致性的CRISPR重複序列,且tracrRNA與SEQ ID NO:35具有至少95%序列一致性;以及 l) 與SEQ ID NO:12具有至少95%序列一致性的RGN多肽,其中crRNA包括與SEQ ID NO:24具有至少95%序列一致性的CRISPR重複序列,且tracrRNA與SEQ ID NO:36具有至少95%序列一致性。
100. 如實施方式97所述的載體,其中RGN多肽選自由下列所組成的群組: a) 與SEQ ID NO:1具有100%序列一致性的RGN多肽,其中crRNA包括與SEQ ID NO:13具有100%序列一致性的CRISPR重複序列,且tracrRNA與SEQ ID NO:25具有100%序列一致性; b) 與SEQ ID NO:2具有100%序列一致性的RGN多肽,其中crRNA包括與SEQ ID NO:14具有100%序列一致性的CRISPR重複序列,且tracrRNA與SEQ ID NO:26具有100%序列一致性; c) 與SEQ ID NO:3具有100%序列一致性的RGN多肽,其中crRNA包括與SEQ ID NO:15具有100%序列一致性的CRISPR重複序列,且tracrRNA與SEQ ID NO:27具有100%序列一致性; d) 與SEQ ID NO:4具有100%序列一致性的RGN多肽,其中crRNA包括與SEQ ID NO:16具有100%序列一致性的CRISPR重複序列,且tracrRNA與SEQ ID NO:28具有100%序列一致性; e) 與SEQ ID NO:5具有100%序列一致性的RGN多肽,其中crRNA包括與SEQ ID NO:17具有100%序列一致性的CRISPR重複序列,且tracrRNA與SEQ ID NO:29具有100%序列一致性; f) 與SEQ ID NO:6具有100%序列一致性的RGN多肽,其中crRNA包括與SEQ ID NO:18具有100%序列一致性的CRISPR重複序列,且tracrRNA與SEQ ID NO:30具有100%序列一致性; g) 與SEQ ID NO:7具有100%序列一致性的RGN多肽,其中crRNA包括與SEQ ID NO:19具有100%序列一致性的CRISPR重複序列,且tracrRNA與SEQ ID NO:31具有100%序列一致性; h) 與SEQ ID NO:8具有100%序列一致性的RGN多肽,其中crRNA包括與SEQ ID NO:20具有100%序列一致性的CRISPR重複序列,且tracrRNA與SEQ ID NO:32具有100%序列一致性; i) 與SEQ ID NO:9具有100%序列一致性的RGN多肽,其中crRNA包括與SEQ ID NO:21具有100%序列一致性的CRISPR重複序列,且tracrRNA與SEQ ID NO:33具有100%序列一致性; j) 與SEQ ID NO:10具有100%序列一致性的RGN多肽,其中crRNA包括與SEQ ID NO:22具有100%序列一致性的CRISPR重複序列,且tracrRNA與SEQ ID NO:34具有100%序列一致性; k) 與SEQ ID NO:11具有100%序列一致性的RGN多肽,其中crRNA包括與SEQ ID NO:23具有100%序列一致性的CRISPR重複序列,且tracrRNA與SEQ ID NO:35具有100%序列一致性;以及 l) 與SEQ ID NO:12具有100%序列一致性的RGN多肽,其中crRNA包括與SEQ ID NO:24具有100%序列一致性的CRISPR重複序列,且tracrRNA與SEQ ID NO:36具有100%序列一致性。
101. 一種細胞,包括如實施方式69至72及85至88中任一者所述的核酸分子、或如實施方式73至84及89至100中任一者所述的載體、如實施方式274或275所述的單引導RNA、或如實施方式276所述的雙引導RNA。
102. 如實施方式101所述的細胞,其中細胞為原核細胞。
103. 如實施方式101所述的細胞,其中細胞為真核細胞。
104. 如實施方式103所述的細胞,其中真核細胞為哺乳動物細胞。
105. 如實施方式104所述的細胞,其中哺乳動物細胞為人類細胞。
106. 如實施方式105所述的細胞,其中人類細胞為免疫細胞。
107. 如實施方式106所述的細胞,其中免疫細胞為幹細胞。
108. 如實施方式107所述的細胞,其中幹細胞為經誘導的富潛能幹細胞。
109. 如實施方式103所述的細胞,其中真核細胞為昆蟲或鳥類細胞。
110. 如實施方式103所述的細胞,其中真核細胞為真菌細胞。
111. 如實施方式103所述的細胞,其中真核細胞為植物細胞。
112. 一種植物,包括如實施方式111所述的細胞。
113. 一種種子,包括如實施方式111所述的細胞。
114. 一種用於結合DNA分子的標的DNA序列的系統,系統包括: a) 能夠與標的DNA序列雜交的一或更多引導RNA、或包括編碼一或更多引導RNA(gRNA)的一或更多核苷酸序列的一或更多多核苷酸;以及 b) 包括與SEQ ID NO:1-12中任一者具有至少90%序列一致性的胺基酸序列的RNA引導的核酸酶(RGN)多肽、或包括編碼RGN多肽的核苷酸序列的多核苷酸; 其中一或更多引導RNA能夠與標的DNA序列雜交,以及 其中一或更多引導RNA能夠與RGN多肽形成錯合物,以引導RGN多肽與DNA分子的標的DNA序列結合。
115. 如實施方式114所述的系統,其中編碼RGN多肽的核苷酸序列、以及編碼一或更多引導RNA的核苷酸序列中的至少一者可操作地連接至與核苷酸序列異源的啟動子。
116. 一種用於結合DNA分子的標的DNA序列的系統,系統包括: a) 能夠與標的DNA序列雜交的一或更多引導RNA、或包括編碼一或更多引導RNA(gRNA)的一或更多核苷酸序列的一或更多多核苷酸;以及 b) 包括與SEQ ID NO:1-12中任一者具有至少90%序列一致性的胺基酸序列的RNA引導的核酸酶(RGN)多肽; 其中一或更多引導RNA能夠與標的DNA序列雜交,以及 其中一或更多引導RNA能夠與RGN多肽形成錯合物,以引導RGN多肽與DNA分子的標的DNA序列結合。
117. 如實施方式114至116中任一者所述的系統,其中編碼一或更多引導RNA的該核苷酸序列中的至少一者可操作地連接至與核苷酸序列異源的啟動子。
118. 如實施方式114至117中任一者所述的系統,其中RGN多肽包括與SEQ ID NO:1-12中任一者具有至少95%序列一致性的胺基酸序列。
119. 如實施方式114至117中任一者所述的系統,其中RGN多肽包括與SEQ ID NO:1-12中任一者具有100%序列一致性的胺基酸序列。
120. 如實施方式114至119中任一者所述的系統,其中在自然界中未發現RGN多肽與一或更多引導RNA彼此錯合。
121. 如實施方式114至120中任一者所述的系統,其中標的DNA序列為真核標的DNA序列。
122. 如實施方式114至121中任一者所述的系統,其中gRNA為單引導RNA(sgRNA)。
123. 如實施方式122所述的系統,其中sgRNA包括延伸,延伸包括用於先導編輯的編輯模板。
124. 如實施方式114至121中任一者所述的系統,其中gRNA為雙引導RNA。
125. 如實施方式114至124中任一者所述的系統,其中gRNA選自由下列所組成的群組: a) 包括與SEQ ID NO:13具有至少90%序列一致性的CRISPR重複序列、以及與SEQ ID NO:25具有至少90%序列一致性的tracrRNA的gRNA,其中RGN多肽包括與SEQ ID NO:1具有至少90%序列一致性的胺基酸序列; b) 包括與SEQ ID NO:14具有至少90%序列一致性的CRISPR重複序列、以及與SEQ ID NO:26具有至少90%序列一致性的tracrRNA的gRNA,其中RGN多肽包括與SEQ ID NO:2具有至少90%序列一致性的胺基酸序列; c) 包括與SEQ ID NO:15具有至少90%序列一致性的CRISPR重複序列、以及與SEQ ID NO:27具有至少90%序列一致性的tracrRNA的gRNA,其中RGN多肽包括與SEQ ID NO:3具有至少90%序列一致性的胺基酸序列; d) 包括與SEQ ID NO:16具有至少90%序列一致性的CRISPR重複序列、以及與SEQ ID NO:28具有至少90%序列一致性的tracrRNA的gRNA,其中RGN多肽包括與SEQ ID NO:4具有至少90%序列一致性的胺基酸序列; e) 包括與SEQ ID NO:17具有至少90%序列一致性的CRISPR重複序列、以及與SEQ ID NO:29具有至少90%序列一致性的tracrRNA的gRNA,其中RGN多肽包括與SEQ ID NO:5具有至少90%序列一致性的胺基酸序列; f) 包括與SEQ ID NO:18具有至少90%序列一致性的CRISPR重複序列、以及與SEQ ID NO:30具有至少90%序列一致性的tracrRNA的gRNA,其中RGN多肽包括與SEQ ID NO:6具有至少90%序列一致性的胺基酸序列; g) 包括與SEQ ID NO:19具有至少90%序列一致性的CRISPR重複序列、以及與SEQ ID NO:31具有至少90%序列一致性的tracrRNA的gRNA,其中RGN多肽包括與SEQ ID NO:7具有至少90%序列一致性的胺基酸序列; h) 包括與SEQ ID NO:20具有至少90%序列一致性的CRISPR重複序列、以及與SEQ ID NO:32具有至少90%序列一致性的tracrRNA的gRNA,其中RGN多肽包括與SEQ ID NO:8具有至少90%序列一致性的胺基酸序列; i) 包括與SEQ ID NO:21具有至少90%序列一致性的CRISPR重複序列、以及與SEQ ID NO:33具有至少90%序列一致性的tracrRNA的gRNA,其中RGN多肽包括與SEQ ID NO:9具有至少90%序列一致性的胺基酸序列; j) 包括與SEQ ID NO:22具有至少90%序列一致性的CRISPR重複序列、以及與SEQ ID NO:34具有至少90%序列一致性的tracrRNA的gRNA,其中RGN多肽包括與SEQ ID NO:10具有至少90%序列一致性的胺基酸序列; k) 包括與SEQ ID NO:23具有至少90%序列一致性的CRISPR重複序列、以及與SEQ ID NO:35具有至少90%序列一致性的tracrRNA的gRNA,其中RGN多肽包括與SEQ ID NO:11具有至少90%序列一致性的胺基酸序列;以及 l) 包括與SEQ ID NO:24具有至少90%序列一致性的CRISPR重複序列、以及與SEQ ID NO:36具有至少90%序列一致性的tracrRNA的gRNA,其中RGN多肽包括與SEQ ID NO:12具有至少90%序列一致性的胺基酸序列。
126. 如實施方式114至124中任一者所述的系統,其中gRNA選自由下列所組成的群組: a) 包括與SEQ ID NO:13具有至少95%序列一致性的CRISPR重複序列、以及與SEQ ID NO:25具有至少95%序列一致性的tracrRNA的gRNA,其中RGN多肽包括與SEQ ID NO:1具有至少95%序列一致性的胺基酸序列; b) 包括與SEQ ID NO:14具有至少95%序列一致性的CRISPR重複序列、以及與SEQ ID NO:26具有至少95%序列一致性的tracrRNA的gRNA,其中RGN多肽包括與SEQ ID NO:2具有至少95%序列一致性的胺基酸序列; c) 包括與SEQ ID NO:15具有至少95%序列一致性的CRISPR重複序列、以及與SEQ ID NO:27具有至少95%序列一致性的tracrRNA的gRNA,其中RGN多肽包括與SEQ ID NO:3具有至少95%序列一致性的胺基酸序列; d) 包括與SEQ ID NO:16具有至少95%序列一致性的CRISPR重複序列、以及與SEQ ID NO:28具有至少95%序列一致性的tracrRNA的gRNA,其中RGN多肽包括與SEQ ID NO:4具有至少95%序列一致性的胺基酸序列; e) 包括與SEQ ID NO:17具有至少95%序列一致性的CRISPR重複序列、以及與SEQ ID NO:29具有至少95%序列一致性的tracrRNA的gRNA,其中RGN多肽包括與SEQ ID NO:5具有至少95%序列一致性的胺基酸序列; f) 包括與SEQ ID NO:18具有至少95%序列一致性的CRISPR重複序列、以及與SEQ ID NO:30具有至少95%序列一致性的tracrRNA的gRNA,其中RGN多肽包括與SEQ ID NO:6具有至少95%序列一致性的胺基酸序列; g) 包括與SEQ ID NO:19具有至少95%序列一致性的CRISPR重複序列、以及與SEQ ID NO:31具有至少95%序列一致性的tracrRNA的gRNA,其中RGN多肽包括與SEQ ID NO:7具有至少95%序列一致性的胺基酸序列; h) 包括與SEQ ID NO:20具有至少95%序列一致性的CRISPR重複序列、以及與SEQ ID NO:32具有至少95%序列一致性的tracrRNA的gRNA,其中RGN多肽包括與SEQ ID NO:8具有至少95%序列一致性的胺基酸序列; i) 包括與SEQ ID NO:21具有至少95%序列一致性的CRISPR重複序列、以及與SEQ ID NO:33具有至少95%序列一致性的tracrRNA的gRNA,其中RGN多肽包括與SEQ ID NO:9具有至少95%序列一致性的胺基酸序列; j) 包括與SEQ ID NO:22具有至少95%序列一致性的CRISPR重複序列、以及與SEQ ID NO:34具有至少95%序列一致性的tracrRNA的gRNA,其中RGN多肽包括與SEQ ID NO:10具有至少95%序列一致性的胺基酸序列; k) 包括與SEQ ID NO:23具有至少95%序列一致性的CRISPR重複序列、以及與SEQ ID NO:35具有至少95%序列一致性的tracrRNA的gRNA,其中RGN多肽包括與SEQ ID NO:11具有至少95%序列一致性的胺基酸序列;以及 l) 包括與SEQ ID NO:24具有至少95%序列一致性的CRISPR重複序列、以及與SEQ ID NO:36具有至少95%序列一致性的tracrRNA的gRNA,其中RGN多肽包括與SEQ ID NO:12具有至少95%序列一致性的胺基酸序列。
127. 如實施方式114至124中任一者所述的系統,其中gRNA選自由下列所組成的群組: a) 包括與SEQ ID NO:13具有100%序列一致性的CRISPR重複序列、以及與SEQ ID NO:25具有100%序列一致性的tracrRNA的gRNA,其中RGN多肽包括與SEQ ID NO:1具有100%序列一致性的胺基酸序列; b) 包括與SEQ ID NO:14具有100%序列一致性的CRISPR重複序列、以及與SEQ ID NO:26具有100%序列一致性的tracrRNA的gRNA,其中RGN多肽包括與SEQ ID NO:2具有100%序列一致性的胺基酸序列; c) 包括與SEQ ID NO:15具有100%序列一致性的CRISPR重複序列、以及與SEQ ID NO:27具有100%序列一致性的tracrRNA的gRNA,其中RGN多肽包括與SEQ ID NO:3具有100%序列一致性的胺基酸序列; d) 包括與SEQ ID NO:16具有100%序列一致性的CRISPR重複序列、以及與SEQ ID NO:28具有100%序列一致性的tracrRNA的gRNA,其中RGN多肽包括與SEQ ID NO:4具有100%序列一致性的胺基酸序列; e) 包括與SEQ ID NO:17具有100%序列一致性的CRISPR重複序列、以及與SEQ ID NO:29具有100%序列一致性的tracrRNA的gRNA,其中RGN多肽包括與SEQ ID NO:5具有100%序列一致性的胺基酸序列; f) 包括與SEQ ID NO:18具有100%序列一致性的CRISPR重複序列、以及與SEQ ID NO:30具有100%序列一致性的tracrRNA的gRNA,其中RGN多肽包括與SEQ ID NO:6具有100%序列一致性的胺基酸序列; g) 包括與SEQ ID NO:19具有100%序列一致性的CRISPR重複序列、以及與SEQ ID NO:31具有100%序列一致性的tracrRNA的gRNA,其中RGN多肽包括與SEQ ID NO:7具有100%序列一致性的胺基酸序列; h) 包括與SEQ ID NO:20具有100%序列一致性的CRISPR重複序列、以及與SEQ ID NO:32具有100%序列一致性的tracrRNA的gRNA,其中RGN多肽包括與SEQ ID NO:8具有100%序列一致性的胺基酸序列; i) 包括與SEQ ID NO:21具有100%序列一致性的CRISPR重複序列、以及與SEQ ID NO:33具有100%序列一致性的tracrRNA的gRNA,其中RGN多肽包括與SEQ ID NO:9具有100%序列一致性的胺基酸序列; j) 包括與SEQ ID NO:22具有100%序列一致性的CRISPR重複序列、以及與SEQ ID NO:34具有100%序列一致性的tracrRNA的gRNA,其中RGN多肽包括與SEQ ID NO:10具有100%序列一致性的胺基酸序列; k) 包括與SEQ ID NO:23具有100%序列一致性的CRISPR重複序列、以及與SEQ ID NO:35具有100%序列一致性的tracrRNA的gRNA,其中RGN多肽包括與SEQ ID NO:11具有100%序列一致性的胺基酸序列;以及 l) 包括與SEQ ID NO:24具有100%序列一致性的CRISPR重複序列、以及與SEQ ID NO:36具有100%序列一致性的tracrRNA的gRNA,其中RGN多肽包括與SEQ ID NO:12具有100%序列一致性的胺基酸序列。
128. 如實施方式114至127中任一者所述的系統,其中標的DNA序列被定位為與前間隔序列鄰近模體(PAM)相鄰。
129. 如實施方式114至127中任一者所述的系統,其中標的DNA序列在細胞內。
130. 如實施方式114至129中任一者所述的系統, 其中一或更多引導RNA能夠與標的DNA序列雜交,且引導RNA能夠與RGN多肽形成錯合物,以引導標的DNA序列的切割。
131. 如實施方式130所述的系統,其中切割產生雙股斷裂。
132. 如實施方式130所述的系統,其中切割產生單股斷裂。
133. 如實施方式114至129中任一者所述的系統,其中RGN多肽為核酸酶不活化的或為切口酶。
134. 如實施方式114至130、132及133中任一者所述的系統,其中RGN多肽可操作地連接至先導編輯多肽。
135. 如實施方式134所述的系統,其中先導編輯多肽包括DNA聚合酶。
136. 如實施方式134所述的系統,其中先導編輯多肽包括反轉錄酶。
137. 如實施方式114至133中任一者所述的系統,其中RGN多肽可操作地連接至鹼基編輯多肽。
138. 如實施方式137所述的系統,其中鹼基編輯多肽為去胺酶。
139. 如實施方式138所述的系統,其中去胺酶為胞嘧啶去胺酶或腺嘌呤去胺酶。
140. 如實施方式138所述的系統,其中去胺酶與SEQ ID NO:377-448中任一者的胺基酸序列具有至少90%序列一致性。
141. 如實施方式138所述的系統,其中去胺酶與SEQ ID NO:377-448中任一者的胺基酸序列具有100%序列一致性。
142. 如實施方式114至141中任一者所述的系統,其中RGN多肽包括一或更多核定位訊號。
143. 如實施方式114至142中任一者所述的系統,其中RGN多肽針對在真核細胞中的表現而被密碼子最佳化。
144. 如實施方式114至143中任一者所述的系統,其中編碼一或更多引導RNA的核苷酸序列、以及編碼RGN多肽的核苷酸序列位於一個載體上。
145. 如實施方式114至144中任一者所述的系統,其中系統進一步包括一或更多供體多核苷酸。
146. 一種細胞,包括如實施方式114至145中任一者所述的系統。
147. 如實施方式146所述的細胞,其中細胞為原核細胞。
148. 如實施方式146所述的細胞,其中細胞為真核細胞。
149. 如實施方式148所述的細胞,其中真核細胞為哺乳動物細胞。
150. 如實施方式149所述的細胞,其中哺乳動物細胞為人類細胞。
151. 如實施方式150所述的細胞,其中人類細胞為免疫細胞。
152. 如實施方式151所述的細胞,其中免疫細胞為幹細胞。
153. 如實施方式152所述的細胞,其中幹細胞為經誘導的富潛能幹細胞。
154. 如實施方式148所述的細胞,其中真核細胞為昆蟲或鳥類細胞。
155. 如實施方式148所述的細胞,其中真核細胞為真菌細胞。
156. 如實施方式148所述的細胞,其中真核細胞為植物細胞。
157. 一種植物,包括如實施方式156所述的細胞。
158. 一種種子,包括如實施方式156所述的細胞。
159. 一種醫藥組成物,包括如實施方式1至19、69至72及85至88中任一者所述的核酸分子、如實施方式20至27、73至84及89至100中任一者所述的載體、如實施方式30至35、103至108及148至153中任一者所述的細胞、如實施方式48至65中任一者所述的RGN多肽、如實施方式66至68中任一者所述的RNP錯合物、或如實施方式114至145中任一者所述的系統;以及藥學上可接受的載體。
160. 如實施方式159所述的醫藥組成物,其中藥學上可接受的載體與核酸分子、載體、細胞、RGN多肽或系統異源。
161. 如實施方式159或160所述的醫藥組成物,其中藥學上可接受的載體不是天然存在的。
162. 一種用於結合DNA分子的標的DNA序列的方法,其包括將如實施方式114至145中任一者所述的系統遞送至標的DNA序列或包括標的DNA序列的細胞。
163. 如實施方式162所述的方法,其中RGN多肽或引導RNA進一步包括可檢測標記,從而允許標的DNA序列的檢測。
164. 如實施方式162所述的方法,其中引導RNA或RGN多肽進一步包括表現調節子,從而調節標的DNA序列的表現或由標的DNA序列的轉錄控制下的基因的表現。
165. 一種用於切割及/或修飾DNA分子的標的DNA序列的方法,包括將如實施方式114至145中任一者所述的系統遞送至標的DNA序列或包括DNA分子的細胞,其中發生標的DNA序列的切割或修飾。
166. 如實施方式165所述的方法,其中經修飾的標的DNA序列包括將異源DNA插入標的DNA序列中。
167. 如實施方式165所述的方法,其中經修飾的標的DNA序列包括標的DNA序列中的至少一核苷酸的缺失。
168. 如實施方式165所述的方法,其中經修飾的標的DNA序列包括標的DNA序列中的至少一核苷酸的突變。
169. 一種用於結合DNA分子的標的DNA序列的方法,包括: a) 在適合形成RNA引導的核酸酶(RGN)核糖核苷酸錯合物的條件下,藉由組合下列而組裝RGN核糖核苷酸錯合物: i) 能夠與標的DNA序列雜交的一或更多引導RNA;以及 ii) 包括與SEQ ID NO:1-12中任一者具有至少90%序列一致性的胺基酸序列的RGN多肽;以及 b) 使標的DNA序列或包括標的DNA序列的細胞與組裝的RGN核糖核苷酸錯合物接觸; 其中一或更多引導RNA與標的DNA序列雜交,從而引導RGN多肽與標的DNA序列結合。
170. 如實施方式169所述的方法,其中該方法在體外、體內或離體進行。
171. 如實施方式169或170所述的方法,其中RGN多肽或引導RNA進一步包括可檢測標記,從而允許標的DNA序列的檢測。
172. 如實施方式169或170所述的方法,其中引導RNA或RGN多肽進一步包括表現調節子,從而允許標的DNA序列的表現的調節。
173. 如實施方式169或170所述的方法,其中RGN多肽可操作地連接至先導編輯多肽,從而允許標的DNA序列的修飾。
174. 如實施方式173所述的方法,其中先導編輯多肽包括DNA聚合酶。
175. 如實施方式173所述的方法,其中先導編輯多肽包括反轉錄酶。
176. 如實施方式169或170所述的方法,其中RGN多肽可操作地連接至鹼基編輯多肽,從而允許標的DNA序列的修飾。
177. 如實施方式176所述的方法,其中鹼基編輯多肽包括去胺酶。
178. 如實施方式177所述的方法,其中去胺酶為胞嘧啶去胺酶或腺嘌呤去胺酶。
179. 如實施方式177所述的方法,其中去胺酶與SEQ ID NO:377-448中任一者的胺基酸序列具有至少90%序列一致性。
180. 如實施方式178所述的方法,其中去胺酶與SEQ ID NO:377-448中任一者的胺基酸序列具有100%序列一致性。
181. 如實施方式169或170所述的方法,其中RGN多肽能夠切割標的DNA序列,從而允許切割及/或修飾標的DNA序列。
182. 一種用於切割及/或修飾DNA分子的標的DNA序列的方法,包括使DNA分子與下列接觸: a) RNA引導的核酸酶(RGN)多肽,其中RGN包括與SEQ ID NO:1-12中任一者具有至少90%序列一致性的胺基酸序列;以及 b) 一或更多引導RNA,其能夠將(a)的RGN靶向標的DNA序列; 其中一或更多引導RNA與標的DNA序列雜交,從而引導RGN多肽與標的DNA序列結合,且發生標的DNA序列的切割及/或修飾。
183. 如實施方式182所述的方法,其中由RGN多肽的切割產生雙股斷裂。
184. 如實施方式182所述的方法,其中由RGN多肽的切割產生單股斷裂。
185. 如實施方式182所述的方法,其中RGN多肽為核酸酶不活化的或為切口酶。
186. 如實施方式182、184及185中任一者所述的方法,其中RGN可操作地連接至先導編輯多肽,從而允許標的DNA序列的修飾。
187. 如實施方式186所述的方法,其中先導編輯多肽包括DNA聚合酶。
188. 如實施方式186所述的方法,其中先導編輯多肽包括反轉錄酶。
189. 如實施方式182至185中任一者所述的方法,其中RGN多肽可操作地連接至鹼基編輯多肽。
190. 如實施方式189所述的方法,其中鹼基編輯多肽為去胺酶。
191. 如實施方式189所述的方法,其中去胺酶為胞嘧啶去胺酶或腺嘌呤去胺酶。
192. 如實施方式190所述的方法,其中去胺酶與SEQ ID NO:377-448中任一者的胺基酸序列具有至少90%序列一致性。
193. 如實施方式190所述的方法,其中去胺酶與SEQ ID NO:377-448中任一者的胺基酸序列具有100%序列一致性。
194. 如實施方式182所述的方法,其中經修飾的標的DNA序列包括將異源DNA插入標的DNA序列中。
195. 如實施方式182所述的方法,其中該經修飾的標的DNA序列包括標的DNA序列中的至少一核苷酸的缺失。
196. 如實施方式182所述的方法,其中該經修飾的標的DNA序列包括標的DNA序列中的至少一核苷酸的突變。
197. 如實施方式169至196中任一者所述的方法,其中標的DNA序列被定位為與前間隔序列鄰近模體(PAM)相鄰。
198. 如實施方式169至197中任一者所述的方法, 其中標的DNA序列為真核標的DNA序列。
199. 如實施方式169至198中任一者所述的方法,其中gRNA為單引導RNA(sgRNA)。
200. 如實施方式199所述的方法,其中sgRNA包括延伸,延伸包括用於先導編輯的編輯模板。
201. 如實施方式169至198中任一者所述的方法,其中gRNA為雙引導RNA。
202. 如實施方式169至201中任一者所述的方法,其中RGN包括與SEQ ID NO:1-12中任一者具有至少95%序列一致性的胺基酸序列。
203. 如實施方式169至201中任一者所述的方法,其中RGN包括與SEQ ID NO:1-12中任一者具有100%序列一致性的胺基酸序列。
204. 如實施方式169至201中任一者所述的方法,其中: a) RGN與SEQ ID NO:1具有至少90%序列一致性,引導RNA包括與SEQ ID NO:13具有至少90%序列一致性的crRNA重複序列、及與SEQ ID NO:25具有至少90%序列一致性的tracrRNA; b) RGN與SEQ ID NO:2具有至少90%序列一致性,引導RNA包括與SEQ ID NO:14具有至少90%序列一致性的crRNA重複序列、及與SEQ ID NO:26具有至少90%序列一致性的tracrRNA; c) RGN與SEQ ID NO:3具有至少90%序列一致性,引導RNA包括與SEQ ID NO:15具有至少90%序列一致性的crRNA重複序列、及與SEQ ID NO:27具有至少90%序列一致性的tracrRNA; d) RGN與SEQ ID NO:4具有至少90%序列一致性,引導RNA包括與SEQ ID NO:16具有至少90%序列一致性的crRNA重複序列、及與SEQ ID NO:28具有至少90%序列一致性的tracrRNA; e) RGN與SEQ ID NO:5具有至少90%序列一致性,引導RNA包括與SEQ ID NO:17具有至少90%序列一致性的crRNA重複序列、及與SEQ ID NO:29具有至少90%序列一致性的tracrRNA; f) RGN與SEQ ID NO:6具有至少90%序列一致性,引導RNA包括與SEQ ID NO:18具有至少90%序列一致性的crRNA重複序列、及與SEQ ID NO:30具有至少90%序列一致性的tracrRNA; g) RGN與SEQ ID NO:7具有至少90%序列一致性,引導RNA包括與SEQ ID NO:19具有至少90%序列一致性的crRNA重複序列、及與SEQ ID NO:31具有至少90%序列一致性的tracrRNA; h) RGN與SEQ ID NO:8具有至少90%序列一致性,引導RNA包括與SEQ ID NO:20具有至少90%序列一致性的crRNA重複序列、及與SEQ ID NO:32具有至少90%序列一致性的tracrRNA; i) RGN與SEQ ID NO:9具有至少90%序列一致性,引導RNA包括與SEQ ID NO:21具有至少90%序列一致性的crRNA重複序列、及與SEQ ID NO:33具有至少90%序列一致性的tracrRNA; j) RGN與SEQ ID NO:10具有至少90%序列一致性,引導RNA包括與SEQ ID NO:22具有至少90%序列一致性的crRNA重複序列、及與SEQ ID NO:34具有至少90%序列一致性的tracrRNA; k) RGN與SEQ ID NO:11具有至少90%序列一致性,引導RNA包括與SEQ ID NO:23具有至少90%序列一致性的crRNA重複序列、及與SEQ ID NO:35具有至少90%序列一致性的tracrRNA;或 l) RGN與SEQ ID NO:12具有至少90%序列一致性,引導RNA包括與SEQ ID NO:24具有至少90%序列一致性的crRNA重複序列、及與SEQ ID NO:36具有至少90%序列一致性的tracrRNA。
205. 如實施方式169至201中任一者所述的方法,其中: a) RGN與SEQ ID NO:1具有至少95%序列一致性,引導RNA包括與SEQ ID NO:13具有至少95%序列一致性的crRNA重複序列、及與SEQ ID NO:25具有至少95%序列一致性的tracrRNA; b) RGN與SEQ ID NO:2具有至少95%序列一致性,引導RNA包括與SEQ ID NO:14具有至少95%序列一致性的crRNA重複序列、及與SEQ ID NO:26具有至少95%序列一致性的tracrRNA; c) RGN與SEQ ID NO:3具有至少95%序列一致性,引導RNA包括與SEQ ID NO:15具有至少95%序列一致性的crRNA重複序列、及與SEQ ID NO:27具有至少95%序列一致性的tracrRNA; d) RGN與SEQ ID NO:4具有至少95%序列一致性,引導RNA包括與SEQ ID NO:16具有至少95%序列一致性的crRNA重複序列、及與SEQ ID NO:28具有至少95%序列一致性的tracrRNA; e) RGN與SEQ ID NO:5具有至少95%序列一致性,引導RNA包括與SEQ ID NO:17具有至少95%序列一致性的crRNA重複序列、及與SEQ ID NO:29具有至少95%序列一致性的tracrRNA; f) RGN與SEQ ID NO:6具有至少95%序列一致性,引導RNA包括與SEQ ID NO:18具有至少95%序列一致性的crRNA重複序列、及與SEQ ID NO:30具有至少95%序列一致性的tracrRNA; g) RGN與SEQ ID NO:7具有至少95%序列一致性,引導RNA包括與SEQ ID NO:19具有至少95%序列一致性的crRNA重複序列、及與SEQ ID NO:31具有至少95%序列一致性的tracrRNA; h) RGN與SEQ ID NO:8具有至少95%序列一致性,引導RNA包括與SEQ ID NO:20具有至少95%序列一致性的crRNA重複序列、及與SEQ ID NO:32具有至少95%序列一致性的tracrRNA; i) RGN與SEQ ID NO:9具有至少95%序列一致性,引導RNA包括與SEQ ID NO:21具有至少95%序列一致性的crRNA重複序列、及與SEQ ID NO:33具有至少95%序列一致性的tracrRNA; j) RGN與SEQ ID NO:10具有至少95%序列一致性,引導RNA包括與SEQ ID NO:22具有至少95%序列一致性的crRNA重複序列、及與SEQ ID NO:34具有至少95%序列一致性的tracrRNA; k) RGN與SEQ ID NO:11具有至少95%序列一致性,引導RNA包括與SEQ ID NO:23具有至少95%序列一致性的crRNA重複序列、及與SEQ ID NO:35具有至少95%序列一致性的tracrRNA;或 l) RGN與SEQ ID NO:12具有至少95%序列一致性,引導RNA包括與SEQ ID NO:24具有至少95%序列一致性的crRNA重複序列、及與SEQ ID NO:36具有至少95%序列一致性的tracrRNA。
206. 如實施方式169至201中任一者所述的方法,其中: a) RGN與SEQ ID NO:1具有100%序列一致性,引導RNA包括與SEQ ID NO:13具有100%序列一致性的crRNA重複序列、及與SEQ ID NO:25具有100%序列一致性的tracrRNA; b) RGN與SEQ ID NO:2具有100%序列一致性,引導RNA包括與SEQ ID NO:14具有100%序列一致性的crRNA重複序列、及與SEQ ID NO:26具有100%序列一致性的tracrRNA; c) RGN與SEQ ID NO:3具有100%序列一致性,引導RNA包括與SEQ ID NO:15具有100%序列一致性的crRNA重複序列、及與SEQ ID NO:27具有100%序列一致性的tracrRNA; d) RGN與SEQ ID NO:4具有100%序列一致性,引導RNA包括與SEQ ID NO:16具有100%序列一致性的crRNA重複序列、及與SEQ ID NO:28具有100%序列一致性的tracrRNA; e) RGN與SEQ ID NO:5具有100%序列一致性,引導RNA包括與SEQ ID NO:17具有100%序列一致性的crRNA重複序列、及與SEQ ID NO:29具有100%序列一致性的tracrRNA; f) RGN與SEQ ID NO:6具有100%序列一致性,引導RNA包括與SEQ ID NO:18具有100%序列一致性的crRNA重複序列、及與SEQ ID NO:30具有100%序列一致性的tracrRNA; g) RGN與SEQ ID NO:7具有100%序列一致性,引導RNA包括與SEQ ID NO:19具有100%序列一致性的crRNA重複序列、及與SEQ ID NO:31具有100%序列一致性的tracrRNA; h) RGN與SEQ ID NO:8具有100%序列一致性,引導RNA包括與SEQ ID NO:20具有100%序列一致性的crRNA重複序列、及與SEQ ID NO:32具有100%序列一致性的tracrRNA; i) RGN與SEQ ID NO:9具有100%序列一致性,引導RNA包括與SEQ ID NO:21具有100%序列一致性的crRNA重複序列、及與SEQ ID NO:33具有100%序列一致性的tracrRNA; j) RGN與SEQ ID NO:10具有100%序列一致性,引導RNA包括與SEQ ID NO:22具有100%序列一致性的crRNA重複序列、及與SEQ ID NO:34具有100%序列一致性的tracrRNA; k) RGN與SEQ ID NO:11具有100%序列一致性,引導RNA包括與SEQ ID NO:23具有100%序列一致性的crRNA重複序列、及與SEQ ID NO:35具有100%序列一致性的tracrRNA;或 l) RGN與SEQ ID NO:12具有100%序列一致性,引導RNA包括與SEQ ID NO:24具有100%序列一致性的crRNA重複序列、及與SEQ ID NO:36具有100%序列一致性的tracrRNA。
207. 如實施方式169至206中任一者所述的方法,其中標的DNA序列在細胞內。
208. 如實施方式207所述的方法,其中細胞為真核細胞。。
209. 如實施方式208所述的方法,其中真核細胞為哺乳動物細胞。
210. 如實施方式209所述的方法,其中哺乳動物細胞為人類細胞。
211. 如實施方式210所述的方法,其中人類細胞為免疫細胞。
212. 如實施方式211所述的方法,其中免疫細胞為幹細胞。
213. 如實施方式212所述的方法,其中幹細胞為經誘導的富潛能幹細胞。
214. 如實施方式208所述的方法,其中真核細胞為昆蟲或鳥類細胞。
215. 如實施方式207所述的方法,其中細胞為原核細胞。
216. 如實施方式208所述的方法,其中真核細胞為真菌細胞。
217. 如實施方式208所述的方法,其中真核細胞為植物細胞。
218. 如實施方式207至217中任一者所述的方法,進一步包括:在RGN多肽被表現且切割及修飾標的DNA序列以產生包括經修飾的標的DNA序列的DNA分子的條件下,培養細胞;以及選擇包括經修飾的標的DNA序列的細胞。
219. 一種細胞,其包括如實施方式218所述的方法的經修飾的標的DNA序列。
220. 如實施方式219所述的細胞,其中細胞為真核細胞。
221. 如實施方式220所述的細胞,其中真核細胞為哺乳動物細胞。
222. 如實施方式221所述的細胞,其中哺乳動物細胞為人類細胞。
223. 如實施方式222所述的細胞,其中人類細胞為免疫細胞。
224. 如實施方式223所述的細胞,其中免疫細胞為幹細胞。
225. 如實施方式224所述的細胞,其中幹細胞為經誘導的富潛能幹細胞。
226. 如實施方式220所述的細胞,其中真核細胞為昆蟲或鳥類細胞。
227. 如實施方式219所述的細胞,其中細胞為原核細胞。
228. 如實施方式220所述的細胞,其中真核細胞為真菌細胞。
229. 如實施方式220所述的細胞,其中真核細胞為植物細胞。
230. 一種植物,包括如實施方式229所述的細胞。
231. 一種種子,包括如實施方式229所述的細胞。
232. 一種醫藥組成物,包括如實施方式220至225中任一者所述的細胞及藥學上可接受的載體。
233. 一種用於產生具有校正遺傳性疾病的因果突變的經基因修飾的細胞的方法,該方法包括:將下列引入細胞內: a) RNA引導的核酸酶(RGN)多肽,其中RGN多肽包括與SEQ ID NO:1-12中任一者具有至少90%序列一致性的胺基酸序列、或編碼RGN多肽的多核苷酸,其中編碼RGN多肽的多核苷酸可操作地連接至啟動子,以使RGN多肽能夠在細胞中表現;以及 b) 引導RNA(gRNA)或編碼gRNA的多核苷酸,其中編碼gRNA的多核苷酸可操作地連接至啟動子,以使gRNA能夠在細胞中表現 藉此,RGN及gRNA靶向因果突變的基因體位置並修飾基因體序列,以去除因果突變。
234. 如實施方式233所述的方法,其中RGN為核酸酶不活化的或為切口酶。
235. 如實施方式233或234所述的方法,其中RGN可操作地連接至先導編輯多肽。
236. 如實施方式235所述的方法,其中先導編輯多肽包括DNA聚合酶。
237. 如實施方式235所述的方法,其中先導編輯多肽包括反轉錄酶。
238. 如實施方式235至237中任一者所述的方法,其中gRNA為單引導RNA、且包括延伸,延伸包括用於先導編輯的編輯模板。
239. 如實施方式233或234所述的方法,其中RGN可操作地連接至具有鹼基編輯活性的多肽。
240. 如實施方式239所述的方法,其中鹼基編輯多肽為去胺酶。
241. 如實施方式240所述的方法,其中具有鹼基編輯活性的多肽為胞嘧啶去胺酶或腺嘌呤去胺酶。
242. 如實施方式240所述的方法,其中去胺酶與SEQ ID NO:377-448中任一者的胺基酸序列具有至少90%序列一致性。
243. 如實施方式240所述的方法,其中去胺酶與SEQ ID NO:377-448中任一者的胺基酸序列具有100%序列一致性。
244. 如實施方式240至243中任一者所述的方法,其中遺傳性疾病是由單核苷酸多型性引起。
245. 如實施方式240至243中任一者所述的方法,其中遺傳性疾病為賀勒氏症。
246. 如實施方式244所述的方法,其中gRNA進一步包括靶向接近因果單核苷酸多型性的區域的間隔序列。
247. 一種用於產生具有因果突變中的缺失的經基因修飾的細胞的方法,該方法包括:將下列引入細胞內: a) RNA引導的核酸酶(RGN)多肽,其中RGN多肽包括與SEQ ID NO:1-12中任一者具有至少90%序列一致性的胺基酸序列、或編碼RGN多肽的多核苷酸,其中編碼RGN多肽的多核苷酸可操作地連接至啟動子,以使RGN多肽能夠在細胞中表現;以及 b) 第一引導RNA(gRNA)或編碼gRNA的多核苷酸,其中編碼gRNA的多核苷酸可操作地連接至啟動子,以使gRNA能夠在細胞中表現,且進一步其中gRNA包括靶向因果突變的5'側的間隔序列;以及 c) 第二引導RNA(gRNA)或編碼gRNA的多核苷酸,其中編碼gRNA的多核苷酸可操作地連接至啟動子,以使gRNA能夠在細胞中表現,且進一步其中第二gRNA包括靶向因果突變的3’側的間隔序列; 藉此,RGN及二gRNA靶向因果突變,且因果突變的至少一部分被去除。
248. 如實施方式247所述的方法,其中遺傳性疾病為弗里德里希運動失調或亨汀頓氏舞蹈症。
249. 如實施方式247所述的方法,其中第一gRNA進一步包括靶向因果突變內或接近因果突變的區域的間隔序列。
250. 如實施方式249所述的方法,其中第二gRNA進一步包括靶向因果突變內或接近因果突變的區域的間隔序列。
251. 如實施方式233至250中任一者所述的方法,其中RGN多肽與SEQ ID NO:1-12中任一者具有至少95%序列一致性。
252. 如實施方式233至250中任一者所述的方法,其中RGN多肽與SEQ ID NO:1-12中任一者具有100%序列一致性。
253. 如實施方式233至250中任一者所述的方法,其中gRNA、第一gRNA、第二gRNA、或第一gRNA及第二gRNA選自從由以下所組成的群組選出的gRNA: a) 包括與SEQ ID NO:13具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:25具有至少90%序列一致性的tracrRNA的gRNA,其中RGN多肽具有與SEQ ID NO:1具有至少90%序列一致性的胺基酸序列; b) 包括與SEQ ID NO:14具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:26具有至少90%序列一致性的tracrRNA的gRNA,其中RGN多肽具有與SEQ ID NO:2具有至少90%序列一致性的胺基酸序列; c) 包括與SEQ ID NO:15具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:27具有至少90%序列一致性的tracrRNA的gRNA,其中RGN多肽具有與SEQ ID NO:3具有至少90%序列一致性的胺基酸序列; d) 包括與SEQ ID NO:16具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:28具有至少90%序列一致性的tracrRNA的gRNA,其中RGN多肽具有與SEQ ID NO:4具有至少90%序列一致性的胺基酸序列; e) 包括與SEQ ID NO:17具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:29具有至少90%序列一致性的tracrRNA的gRNA,其中RGN多肽具有與SEQ ID NO:5具有至少90%序列一致性的胺基酸序列; f) 包括與SEQ ID NO:18具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:30具有至少90%序列一致性的tracrRNA的gRNA,其中RGN多肽具有與SEQ ID NO:6具有至少90%序列一致性的胺基酸序列; g) 包括與SEQ ID NO:19具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:31具有至少90%序列一致性的tracrRNA的gRNA,其中RGN多肽具有與SEQ ID NO:7具有至少90%序列一致性的胺基酸序列; h) 包括與SEQ ID NO:20具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:32具有至少90%序列一致性的tracrRNA的gRNA,其中RGN多肽具有與SEQ ID NO:8具有至少90%序列一致性的胺基酸序列; i) 包括與SEQ ID NO:21具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:33具有至少90%序列一致性的tracrRNA的gRNA,其中RGN多肽具有與SEQ ID NO:9具有至少90%序列一致性的胺基酸序列; j) 包括與SEQ ID NO:22具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:34具有至少90%序列一致性的tracrRNA的gRNA,其中RGN多肽具有與SEQ ID NO:10具有至少90%序列一致性的胺基酸序列; k) 包括與SEQ ID NO:23具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:35具有至少90%序列一致性的tracrRNA的gRNA,其中RGN多肽具有與SEQ ID NO:11具有至少90%序列一致性的胺基酸序列;以及 l) 包括與SEQ ID NO:24具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:36具有至少90%序列一致性的tracrRNA的gRNA,其中RGN多肽具有與SEQ ID NO:12具有至少90%序列一致性的胺基酸序列。
254. 如實施方式233至250中任一者所述的方法,其中gRNA、第一gRNA、第二gRNA、或第一gRNA及第二gRNA選自從由以下所組成的群組選出的gRNA: a) 包括與SEQ ID NO:13具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:25具有至少95%序列一致性的tracrRNA的gRNA,其中RGN多肽具有與SEQ ID NO:1具有至少95%序列一致性的胺基酸序列; b) 包括與SEQ ID NO:14具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:26具有至少95%序列一致性的tracrRNA的gRNA,其中RGN多肽具有與SEQ ID NO:2具有至少95%序列一致性的胺基酸序列; c) 包括與SEQ ID NO:15具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:27具有至少95%序列一致性的tracrRNA的gRNA,其中RGN多肽具有與SEQ ID NO:3具有至少95%序列一致性的胺基酸序列; d) 包括與SEQ ID NO:16具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:28具有至少95%序列一致性的tracrRNA的gRNA,其中RGN多肽具有與SEQ ID NO:4具有至少95%序列一致性的胺基酸序列; e) 包括與SEQ ID NO:17具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:29具有至少95%序列一致性的tracrRNA的gRNA,其中RGN多肽具有與SEQ ID NO:5具有至少95%序列一致性的胺基酸序列; f) 包括與SEQ ID NO:18具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:30具有至少95%序列一致性的tracrRNA的gRNA,其中RGN多肽具有與SEQ ID NO:6具有至少95%序列一致性的胺基酸序列; g) 包括與SEQ ID NO:19具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:31具有至少95%序列一致性的tracrRNA的gRNA,其中RGN多肽具有與SEQ ID NO:7具有至少95%序列一致性的胺基酸序列; h) 包括與SEQ ID NO:20具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:32具有至少95%序列一致性的tracrRNA的gRNA,其中RGN多肽具有與SEQ ID NO:8具有至少95%序列一致性的胺基酸序列; i) 包括與SEQ ID NO:21具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:33具有至少95%序列一致性的tracrRNA的gRNA,其中RGN多肽具有與SEQ ID NO:9具有至少95%序列一致性的胺基酸序列; j) 包括與SEQ ID NO:22具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:34具有至少95%序列一致性的tracrRNA的gRNA,其中RGN多肽具有與SEQ ID NO:10具有至少95%序列一致性的胺基酸序列; k) 包括與SEQ ID NO:23具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:35具有至少95%序列一致性的tracrRNA的gRNA,其中RGN多肽具有與SEQ ID NO:11具有至少95%序列一致性的胺基酸序列;以及 l) 包括與SEQ ID NO:24具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:36具有至少95%序列一致性的tracrRNA的gRNA,其中RGN多肽具有與SEQ ID NO:12具有至少95%序列一致性的胺基酸序列。
255. 如實施方式233至250中任一者所述的方法,其中gRNA、第一gRNA、第二gRNA、或第一gRNA及第二gRNA選自從由以下所組成的群組選出的gRNA: a) 包括與SEQ ID NO:13具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:25具有100%序列一致性的tracrRNA的gRNA,其中RGN多肽具有與SEQ ID NO:1具有100%序列一致性的胺基酸序列; b) 包括與SEQ ID NO:14具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:26具有100%序列一致性的tracrRNA的gRNA,其中RGN多肽具有與SEQ ID NO:2具有100%序列一致性的胺基酸序列; c) 包括與SEQ ID NO:15具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:27具有100%序列一致性的tracrRNA的gRNA,其中RGN多肽具有與SEQ ID NO:3具有100%序列一致性的胺基酸序列; d) 包括與SEQ ID NO:16具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:28具有100%序列一致性的tracrRNA的gRNA,其中RGN多肽具有與SEQ ID NO:4具有100%序列一致性的胺基酸序列; e) 包括與SEQ ID NO:17具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:29具有100%序列一致性的tracrRNA的gRNA,其中RGN多肽具有與SEQ ID NO:5具有100%序列一致性的胺基酸序列; f) 包括與SEQ ID NO:18具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:30具有100%序列一致性的tracrRNA的gRNA,其中RGN多肽具有與SEQ ID NO:6具有100%序列一致性的胺基酸序列; g) 包括與SEQ ID NO:19具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:31具有100%序列一致性的tracrRNA的gRNA,其中RGN多肽具有與SEQ ID NO:7具有100%序列一致性的胺基酸序列; h) 包括與SEQ ID NO:20具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:32具有100%序列一致性的tracrRNA的gRNA,其中RGN多肽具有與SEQ ID NO:8具有100%序列一致性的胺基酸序列; i) 包括與SEQ ID NO:21具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:33具有100%序列一致性的tracrRNA的gRNA,其中RGN多肽具有與SEQ ID NO:9具有100%序列一致性的胺基酸序列; j) 包括與SEQ ID NO:22具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:34具有100%序列一致性的tracrRNA的gRNA,其中RGN多肽具有與SEQ ID NO:10具有100%序列一致性的胺基酸序列; k) 包括與SEQ ID NO:23具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:35具有100%序列一致性的tracrRNA的gRNA,其中RGN多肽具有與SEQ ID NO:11具有100%序列一致性的胺基酸序列;以及 l) 包括與SEQ ID NO:24具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:36具有100%序列一致性的tracrRNA的gRNA,其中RGN多肽具有與SEQ ID NO:12具有100%序列一致性的胺基酸序列。
256. 如實施方式233至255中任一者所述的方法,其中細胞為動物細胞。
257. 如實施方式256所述的方法,其中動物細胞為哺乳動物細胞。
258. 如實施方式256所述的方法,其中細胞源於狗、貓、小鼠、大鼠、兔、馬、牛、豬或人。
259. 一種用於產生具有減少的BCL11A mRNA及蛋白表質現的經基因修飾的哺乳動物造血前驅細胞的方法,該方法包括:將下列引入分離的人類造血前驅細胞內: a) RNA引導的核酸酶(RGN)多肽,其中RGN多肽包括與SEQ ID NO:1-12中任一者具有至少90%序列一致性的胺基酸序列、或編碼RGN多肽的多核苷酸,其中編碼RGN多肽的多核苷酸可操作地連接至啟動子,以使RGN多肽能夠在細胞中表現;以及 b) 引導RNA(gRNA)或編碼gRNA的多核苷酸,其中編碼gRNA的多核苷酸可操作地連接至啟動子,以使gRNA能夠在細胞中表現, 藉此,RGN及gRNA在細胞中表現並在BCL11A增強子區域進行切割,導致人類造血前驅細胞的基因修飾並降低BCL11A的mRNA及/或蛋白質表現。
260. 如實施方式259所述的方法,其中RGN多肽與SEQ ID NO:1-12中任一者具有至少95%序列一致性。
261. 如實施方式259所述的方法,其中RGN多肽與SEQ ID NO:1-12中任一者具有100%序列一致性。
262. 如實施方式259所述的方法,其中gRNA選自由以下所組成的群組: a) 包括與SEQ ID NO:13具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:25具有至少90%序列一致性的tracrRNA的gRNA,其中RGN多肽具有與SEQ ID NO:1具有至少90%序列一致性的胺基酸序列; b) 包括與SEQ ID NO:14具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:26具有至少90%序列一致性的tracrRNA的gRNA,其中RGN多肽具有與SEQ ID NO:2具有至少90%序列一致性的胺基酸序列; c) 包括與SEQ ID NO:15具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:27具有至少90%序列一致性的tracrRNA的gRNA,其中RGN多肽具有與SEQ ID NO:3具有至少90%序列一致性的胺基酸序列; d) 包括與SEQ ID NO:16具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:28具有至少90%序列一致性的tracrRNA的gRNA,其中RGN多肽具有與SEQ ID NO:4具有至少90%序列一致性的胺基酸序列; e) 包括與SEQ ID NO:17具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:29具有至少90%序列一致性的tracrRNA的gRNA,其中RGN多肽具有與SEQ ID NO:5具有至少90%序列一致性的胺基酸序列; f) 包括與SEQ ID NO:18具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:30具有至少90%序列一致性的tracrRNA的gRNA,其中RGN多肽具有與SEQ ID NO:6具有至少90%序列一致性的胺基酸序列; g) 包括與SEQ ID NO:19具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:31具有至少90%序列一致性的tracrRNA的gRNA,其中RGN多肽具有與SEQ ID NO:7具有至少90%序列一致性的胺基酸序列; h) 包括與SEQ ID NO:20具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:32具有至少90%序列一致性的tracrRNA的gRNA,其中RGN多肽具有與SEQ ID NO:8具有至少90%序列一致性的胺基酸序列; i) 包括與SEQ ID NO:21具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:33具有至少90%序列一致性的tracrRNA的gRNA,其中RGN多肽具有與SEQ ID NO:9具有至少90%序列一致性的胺基酸序列; j) 包括與SEQ ID NO:22具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:34具有至少90%序列一致性的tracrRNA的gRNA,其中RGN多肽具有與SEQ ID NO:10具有至少90%序列一致性的胺基酸序列; k) 包括與SEQ ID NO:23具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:35具有至少90%序列一致性的tracrRNA的gRNA,其中RGN多肽具有與SEQ ID NO:11具有至少90%序列一致性的胺基酸序列;以及 l) 包括與SEQ ID NO:24具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:36具有至少90%序列一致性的tracrRNA的gRNA,其中RGN多肽具有與SEQ ID NO:12具有至少90%序列一致性的胺基酸序列。
263. 如實施方式259所述的方法,其中gRNA選自由以下所組成的群組: a) 包括與SEQ ID NO:13具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:25具有至少95%序列一致性的tracrRNA的gRNA,其中RGN多肽具有與SEQ ID NO:1具有至少95%序列一致性的胺基酸序列; b) 包括與SEQ ID NO:14具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:26具有至少95%序列一致性的tracrRNA的gRNA,其中RGN多肽具有與SEQ ID NO:2具有至少95%序列一致性的胺基酸序列; c) 包括與SEQ ID NO:15具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:27具有至少95%序列一致性的tracrRNA的gRNA,其中RGN多肽具有與SEQ ID NO:3具有至少95%序列一致性的胺基酸序列; d) 包括與SEQ ID NO:16具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:28具有至少95%序列一致性的tracrRNA的gRNA,其中RGN多肽具有與SEQ ID NO:4具有至少95%序列一致性的胺基酸序列; e) 包括與SEQ ID NO:17具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:29具有至少95%序列一致性的tracrRNA的gRNA,其中RGN多肽具有與SEQ ID NO:5具有至少95%序列一致性的胺基酸序列; f) 包括與SEQ ID NO:18具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:30具有至少95%序列一致性的tracrRNA的gRNA,其中RGN多肽具有與SEQ ID NO:6具有至少95%序列一致性的胺基酸序列; g) 包括與SEQ ID NO:19具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:31具有至少95%序列一致性的tracrRNA的gRNA,其中RGN多肽具有與SEQ ID NO:7具有至少95%序列一致性的胺基酸序列; h) 包括與SEQ ID NO:20具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:32具有至少95%序列一致性的tracrRNA的gRNA,其中RGN多肽具有與SEQ ID NO:8具有至少95%序列一致性的胺基酸序列; i) 包括與SEQ ID NO:21具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:33具有至少95%序列一致性的tracrRNA的gRNA,其中RGN多肽具有與SEQ ID NO:9具有至少95%序列一致性的胺基酸序列; j) 包括與SEQ ID NO:22具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:34具有至少95%序列一致性的tracrRNA的gRNA,其中RGN多肽具有與SEQ ID NO:10具有至少95%序列一致性的胺基酸序列; k) 包括與SEQ ID NO:23具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:35具有至少95%序列一致性的tracrRNA的gRNA,其中RGN多肽具有與SEQ ID NO:11具有至少95%序列一致性的胺基酸序列;以及 l) 包括與SEQ ID NO:24具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:36具有至少95%序列一致性的tracrRNA的gRNA,其中RGN多肽具有與SEQ ID NO:12具有至少95%序列一致性的胺基酸序列。
264. 如實施方式259所述的方法,其中gRNA選自由以下所組成的群組: a) 包括與SEQ ID NO:13具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:25具有100%序列一致性的tracrRNA的gRNA,其中RGN多肽具有與SEQ ID NO:1具有100%序列一致性的胺基酸序列; b) 包括與SEQ ID NO:14具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:26具有100%序列一致性的tracrRNA的gRNA,其中RGN多肽具有與SEQ ID NO:2具有100%序列一致性的胺基酸序列; c) 包括與SEQ ID NO:15具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:27具有100%序列一致性的tracrRNA的gRNA,其中RGN多肽具有與SEQ ID NO:3具有100%序列一致性的胺基酸序列; d) 包括與SEQ ID NO:16具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:28具有100%序列一致性的tracrRNA的gRNA,其中RGN多肽具有與SEQ ID NO:4具有100%序列一致性的胺基酸序列; e) 包括與SEQ ID NO:17具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:29具有100%序列一致性的tracrRNA的gRNA,其中RGN多肽具有與SEQ ID NO:5具有100%序列一致性的胺基酸序列; f) 包括與SEQ ID NO:18具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:30具有100%序列一致性的tracrRNA的gRNA,其中RGN多肽具有與SEQ ID NO:6具有100%序列一致性的胺基酸序列; g) 包括與SEQ ID NO:19具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:31具有100%序列一致性的tracrRNA的gRNA,其中RGN多肽具有與SEQ ID NO:7具有100%序列一致性的胺基酸序列; h) 包括與SEQ ID NO:20具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:32具有100%序列一致性的tracrRNA的gRNA,其中RGN多肽具有與SEQ ID NO:8具有100%序列一致性的胺基酸序列; i) 包括與SEQ ID NO:21具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:33具有100%序列一致性的tracrRNA的gRNA,其中RGN多肽具有與SEQ ID NO:9具有100%序列一致性的胺基酸序列; j) 包括與SEQ ID NO:22具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:34具有100%序列一致性的tracrRNA的gRNA,其中RGN多肽具有與SEQ ID NO:10具有100%序列一致性的胺基酸序列; k) 包括與SEQ ID NO:23具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:35具有100%序列一致性的tracrRNA的gRNA,其中RGN多肽具有與SEQ ID NO:11具有100%序列一致性的胺基酸序列;以及 l) 包括與SEQ ID NO:24具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:36具有100%序列一致性的tracrRNA的gRNA,其中RGN多肽具有與SEQ ID NO:12具有100%序列一致性的胺基酸序列。
265. 如實施方式259至264中任一者所述的方法,其中gRNA進一步包括靶向BCL11A 增強子區域內或接近BCL11A 增強子區域的區域的間隔序列。
266. 一種治療疾病、病症或症狀的方法,該方法包括對需要治療的個體投予有效量的如實施方式159至161及232中任一者所述的醫藥組成物。
267. 如實施方式266所述的方法,其中疾病、病症或症狀與因果突變相關聯,且有效量的醫藥組成物校正因果突變。
268. 如實施方式266或267所述的方法,其中個體有罹患疾病、病症或病症的風險。
269.一種如實施方式1至19、69至72及85至88中任一者所述的核酸分子、如實施方式20至27、73至84及89至100中任一者所述的載體、如實施方式30至35、103至108、148至153及220至225中任一者所述的細胞、如實施方式48至65中任一者所述的RGN多肽、如實施方式66至68中任一者所述的RNP錯合物、或如實施方式114至145中任一者所述的系統用於對需要的個體治療疾病、病症或症狀的用途。
270. 如實施方式269所述的用途,其中疾病、病症或症狀與因果突變相關聯,且治療包括校正因果突變。
271. 如實施方式269或270所述的用途,其中個體有罹患疾病、病症或病症的風險。
272. 一種如實施方式1至19、69至72及85至88中任一者所述的核酸分子、如實施方式20至27、73至84及89至100中任一者所述的載體、如實施方式30至35、103至108、148至153及220至225中任一者所述的細胞、如實施方式48至65中任一者所述的RGN多肽、如實施方式66至68中任一者所述的RNP錯合物、或如實施方式114至145中任一者所述的系統用於製備有用於治療疾病、病症或症狀的藥物的用途。
273. 如實施方式272所述的用途,其中疾病與因果突變相關聯,且有效量的藥物校正因果突變。
274. 一種單引導RNA,包括如實施方式69至72中任一者所述的包括crRNA的核酸分子、及如實施方式85至88中任一者所述的包括tracrRNA的核酸分子。
275. 如實施方式274所述的單引導RNA,其中單引導RNA進一步包括延伸,延伸包括用於先導編輯的編輯模板。
276. 一種雙引導RNA,包括如實施方式69至72中任一者所述的包括crRNA的核酸分子、及如實施方式85至88中任一者所述的包括tracrRNA的核酸分子。
277. 一種核酸分子,包括編碼RNA引導的核酸酶(RGN)多肽的多核苷酸,其中多核苷酸包括編碼RGN多肽的核苷酸序列,RGN多肽包括與SEQ ID NO:6具有至少90%序列一致性的胺基酸序列; 其中,當與能夠與標的DNA序列雜交的引導RNA(gRNA)結合時,RGN多肽能夠以RNA引導的序列專一性方式結合標的DNA序列。
278. 如實施方式277所述的核酸分子,其中編碼RGN多肽的多核苷酸可操作地連接至與多核苷酸異源的啟動子。
279. 如實施方式277或278所述的核酸分子,其中RGN多肽包括與SEQ ID NO:6具有至少95%序列一致性的胺基酸序列。
280. 如實施方式277或278所述的核酸分子,其中RGN多肽包括與SEQ ID NO:6具有100%序列一致性的胺基酸序列。
281. 如實施方式277至280中任一者所述的核酸分子,其中RGN多肽能夠於結合時切割標的DNA序列。
282. 如實施方式281所述的核酸分子,其中RGN多肽能夠產生雙股斷裂。
283. 如實施方式281所述的核酸分子,其中RGN多肽能夠產生單股斷裂。
284. 如實施方式277至280中任一者所述的核酸分子,其中RGN多肽為核酸酶不活化的或為切口酶。
285. 如實施方式277至280、283及284中任一者所述的核酸分子,其中RGN多肽可操作地連接至先導編輯多肽。
286. 如實施方式285所述的核酸分子,其中該導編輯多肽包括DNA聚合酶。
287. 如實施方式285所述的核酸分子,其中先導編輯多肽包括反轉錄酶。
288. 如實施方式277至284中任一者所述的核酸分子,其中RGN多肽可操作地連接至鹼基編輯多肽。
289. 如實施方式288所述的核酸分子,其中鹼基編輯多肽為去胺酶。
290. 如實施方式289所述的核酸分子,其中去胺酶為胞嘧啶去胺酶或腺嘌呤去胺酶。
291. 如實施方式289所述的核酸分子,其中去胺酶與SEQ ID NO:377-448中任一者的胺基酸序列具有至少90%序列一致性。
292. 如實施方式289所述的核酸分子,其中去胺酶與SEQ ID NO:377-448中任一者的胺基酸序列具有100%序列一致性。
293. 如實施方式277至292中任一者所述的核酸分子,其中RGN多肽包括一或更多核定位訊號。
294. 如實施方式277至293中任一者所述的核酸分子,其中RGN多肽針對在真核細胞中的表現而被密碼子最佳化。
295. 如實施方式277至294中任一者所述的核酸分子,其中標的DNA序列被定位為與前間隔序列鄰近模體(PAM)相鄰。
296. 如實施方式295所述的核酸分子,其中PAM具有如 SEQ ID NO:78或SEQ ID NO:465所示的序列。
297. 一種載體,包括如實施方式277至296中任一者所述的核酸分子。
298. 如實施方式297所述的載體,進一步包括編碼能夠與標的DNA序列雜交的gRNA的至少一核苷酸序列。
299. 如實施方式298所述的載體,其中引導RNA包括: a) CRISPR RNA,包括與SEQ ID NO:18具有至少90%序列一致性的CRISPR重複序列;以及 b) tracrRNA,與SEQ ID NO:30具有至少90%序列一致性。
300. 如實施方式298所述的載體,其中引導RNA包括: a) CRISPR RNA,包括與SEQ ID NO:18具有至少95%序列一致性的CRISPR重複序列;以及 b) tracrRNA,與SEQ ID NO:30具有至少95%序列一致性。
301. 如實施方式298所述的載體,其中引導RNA包括: a) CRISPR重複序列,其與SEQ ID NO:18具有100%序列一致性;以及 b) tracrRNA,與SEQ ID NO:30具有100%序列一致性。
302. 如實施方式298至301中任一者所述的載體,其中gRNA為單引導RNA(sgRNA)。
303. 如實施方式302所述的載體,其中sgRNA進一步包括延伸,延伸包括用於先導編輯的編輯模板。
304. 如實施方式298至301中任一者所述的載體,其中gRNA為雙引導RNA。
305. 一種細胞,包括如實施方式277至296中任一者所述的核酸分子、或如實施方式297至304中任一者所述的載體。
306. 一種RNA引導的核酸酶(RGN)多肽,其中RGN多肽包括與SEQ ID NO:6具有至少90%序列一致性的胺基酸序列;以及 其中,當與能夠與標的DNA序列雜交的引導RNA(gRNA)結合時,RGN多肽能夠以RNA引導的序列專一性方式結合DNA分子的標的DNA序列。
307. 如實施方式306所述的RGN多肽,其中RGN多肽包括與SEQ ID NO:6具有至少95%序列一致性的胺基酸序列。
308. 如實施方式306所述的RGN多肽,其中RGN多肽包括與SEQ ID NO:6具有100%序列一致性的胺基酸序列。
309. 如實施方式306至308中任一者所述的RGN多肽,其中RGN多肽為分離的RGN多肽。
310. 如實施方式306至309中任一者所述的RGN多肽,其中RGN多肽能夠於結合時切割標的DNA序列。
311. 如實施方式310所述的RGN多肽,其中由RGN多肽的切割產生雙股斷裂。
312. 如實施方式310所述的RGN多肽,其中由RGN多肽的切割產生單股斷裂。
313. 如實施方式306至309中任一者所述的RGN多肽,其中RGN多肽為核酸酶不活化的或為切口酶。
314. 如實施方式306至310、312及313中任一者所述的RGN多肽,其中RGN多肽可操作地連接至先導編輯多肽。
315. 如實施方式314所述的RGN多肽,其中先導編輯多肽包括DNA聚合酶。
316. 如實施方式314所述的RGN多肽,其中先導編輯多肽包括反轉錄酶。
317. 如實施方式306至316中任一者所述的RGN多肽,其中RGN多肽可操作地連接至鹼基編輯多肽。
318. 如實施方式317所述的RGN多肽,其中鹼基編輯多肽為去胺酶。
319. 如實施方式318所述的RGN多肽,其中去胺酶為胞嘧啶去胺酶或腺嘌呤去胺酶。
320. 如實施方式318所述的RGN多肽,其中去胺酶與SEQ ID NO:377-448中任一者的胺基酸序列具有至少90%序列一致性。
321. 如實施方式318所述的RGN多肽,其中去胺酶與SEQ ID NO:377-448中任一者的胺基酸序列具有100%序列一致性。
322. 如實施方式306至321中任一者所述的RGN多肽,其中標的DNA序列被定位為與前間隔序列鄰近模體(PAM)相鄰。
323. 如實施方式322所述的RGN多肽,其中PAM具有如 SEQ ID NO:78或SEQ ID NO:465所示的序列。
324. 如實施方式306至322中任一者所述的RGN多肽,其中RGN多肽包括一或更多核定位訊號。
325. 一種核糖核蛋白(RNP)錯合物,包括如實施方式306至324中任一者所述的RGN多肽、以及與RGN多肽結合的引導RNA(gRNA)。
326. 如實施方式325所述的RNP錯合物,其中gRNA為單引導RNA(sgRNA)。
327. 如實施方式326所述的RNP錯合物,其中gRNA包括延伸,延伸包括用於先導編輯的編輯模板。
328. 一種用於結合DNA分子的標的DNA序列的系統,系統包括: a) 能夠與標的DNA序列雜交的一或更多引導RNA、或包括編碼一或更多引導RNA(gRNA)的一或更多核苷酸序列的一或更多多核苷酸;以及 b) 包括與SEQ ID NO:6具有至少90%序列一致性的胺基酸序列的RNA引導的核酸酶(RGN)多肽、或包括編碼RGN多肽的核苷酸序列的多核苷酸; 其中一或更多引導RNA能夠與標的DNA序列雜交,以及 其中一或更多引導RNA能夠與RGN多肽形成錯合物,以引導RGN多肽與DNA分子的標的DNA序列結合。
329. 如實施方式328所述的系統,其中編碼RGN多肽的核苷酸序列、以及編碼一或更多引導RNA的核苷酸序列中的至少一者可操作地連接至與核苷酸序列異源的啟動子。
330. 一種用於結合DNA分子的標的DNA序列的系統,系統包括: a) 能夠與標的DNA序列雜交的一或更多引導RNA、或包括編碼一或更多引導RNA(gRNA)的一或更多核苷酸序列的一或更多多核苷酸;以及 b) 包括與SEQ ID NO:6具有至少90%序列一致性的胺基酸序列的RNA引導的核酸酶(RGN)多肽; 其中一或更多引導RNA能夠與標的DNA序列雜交,以及 其中一或更多引導RNA能夠與RGN多肽形成錯合物,以引導RGN多肽與DNA分子的標的DNA序列結合。
331. 如實施方式328至330中任一者所述的系統,其中編碼一或更多引導RNA的該核苷酸序列中的至少一者可操作地連接至與核苷酸序列異源的啟動子。
332. 如實施方式328至331中任一者所述的系統,其中RGN多肽包括與SEQ ID NO:6具有至少95%序列一致性的胺基酸序列。
333. 如實施方式328至331中任一者所述的系統,其中RGN多肽包括與SEQ ID NO:6具有100%序列一致性的胺基酸序列。
334. 如實施方式328至333中任一者所述的系統,其中在自然界中未發現RGN多肽與一或更多引導RNA彼此錯合。
335. 如實施方式328至334中任一者所述的系統,其中標的DNA序列為真核標的DNA序列。
336. 如實施方式328至335中任一者所述的系統,其中gRNA為單引導RNA(sgRNA)。
337. 如實施方式336所述的系統,其中sgRNA包括延伸,延伸包括用於先導編輯的編輯模板。
338. 如實施方式328至336中任一者所述的系統,其中gRNA為雙引導RNA。
339. 如實施方式328至338中任一者所述的系統,其中gRNA包括與SEQ ID NO:18具有至少90%序列一致性的CRISPR重複序列以及與SEQ ID NO:30具有至少90%序列一致性的tracrRNA。
340. 如實施方式328至338中任一者所述的系統,其中gRNA包括與SEQ ID NO:18具有至少95%序列一致性的CRISPR重複序列以及與SEQ ID NO:30具有至少95%序列一致性的tracrRNA。
341. 如實施方式328至338中任一者所述的系統,其中gRNA包括與SEQ ID NO:18具有100%序列一致性的CRISPR重複序列以及與SEQ ID NO:30具有100%序列一致性的tracrRNA。
342. 如實施方式328至341中任一者所述的系統,其中標的DNA序列被定位為與前間隔序列鄰近模體(PAM)相鄰。
343. 如實施方式342所述的系統,其中PAM具有如 SEQ ID NO:78或SEQ ID NO:465所示的序列。
344. 如實施方式328至341中任一者所述的系統,其中標的DNA序列在細胞內。
345. 如實施方式328至344中任一者所述的系統, 其中一或更多引導RNA能夠與標的DNA序列雜交,且引導RNA能夠與RGN多肽形成錯合物,以引導標的DNA序列的切割。
346. 如實施方式345所述的系統,其中切割產生雙股斷裂。
347. 如實施方式345所述的系統,其中切割產生單股斷裂。
348. 如實施方式328至344中任一者所述的系統,其中RGN多肽為核酸酶不活化的或為切口酶。
349. 如實施方式328至344、347及348中任一者所述的系統,其中RGN多肽可操作地連接至先導編輯多肽。
350. 如實施方式349所述的系統,其中先導編輯多肽包括DNA聚合酶。
351. 如實施方式349所述的系統,其中先導編輯多肽包括反轉錄酶。
352. 如實施方式328至348中任一者所述的系統,其中RGN多肽可操作地連接至鹼基編輯多肽。
353. 如實施方式352所述的系統,其中鹼基編輯多肽為去胺酶。
354. 如實施方式353所述的系統,其中去胺酶為胞嘧啶去胺酶或腺嘌呤去胺酶。
355. 如實施方式353所述的系統,其中去胺酶與SEQ ID NO:377-448中任一者的胺基酸序列具有至少90%序列一致性。
356. 如實施方式353所述的系統,其中去胺酶與SEQ ID NO:377-448中任一者的胺基酸序列具有100%序列一致性。
357. 如實施方式328至355中任一者所述的系統,其中RGN多肽包括一或更多核定位訊號。
358. 如實施方式328至357中任一者所述的系統,其中RGN多肽針對在真核細胞中的表現而被密碼子最佳化。
359. 如實施方式328至358中任一者所述的系統,其中編碼一或更多引導RNA的核苷酸序列、以及編碼RGN多肽的核苷酸序列位於一個載體上。
360. 如實施方式328至359中任一者所述的系統,其中系統進一步包括一或更多供體多核苷酸。
361. 一種細胞,包括如實施方式328至360中任一者所述的系統。
362. 一種醫藥組成物,包括如實施方式277至296中任一者所述的核酸分子、如實施方式297至304中任一者所述的載體、如實施方式305或361所述的細胞、如實施方式306至324中任一者所述的RGN多肽、如實施方式325至327中任一者所述的RNP錯合物、或如實施方式328至360中任一者所述的系統;以及藥學上可接受的載體。
363. 如實施方式362所述的醫藥組成物,其中藥學上可接受的載體與核酸分子、載體、細胞、RGN多肽或系統異源。
364. 如實施方式362或363所述的醫藥組成物,其中藥學上可接受的載體不是天然存在的。
365. 一種用於結合DNA分子的標的DNA序列的方法,包括將如實施方式328至360中任一者所述的系統遞送至標的DNA序列或包括標的DNA序列的細胞。
366. 如實施方式365所述的方法,其中RGN多肽或引導RNA進一步包括可檢測標記,從而允許標的DNA序列的檢測。
367. 如實施方式365所述的方法,其中引導RNA或RGN多肽進一步包括表現調節子,從而調節標的DNA序列的表現或由標的DNA序列的轉錄控制下的基因的表現。
368. 一種用於切割及/或修飾DNA分子的標的DNA序列的方法,包括將如實施方式328至360中任一者所述的系統遞送至標的DNA序列或包括DNA分子的細胞,其中發生標的DNA序列的切割或修飾。
369. 如實施方式368所述的方法,其中經修飾的標的DNA序列包括將異源DNA插入標的DNA序列中。
370. 如實施方式368所述的方法,其中經修飾的標的DNA序列包括標的DNA序列中的至少一核苷酸的缺失。
371. 如實施方式368所述的方法,其中經修飾的標的DNA序列包括標的DNA序列中的至少一核苷酸的突變。
372. 一種用於結合DNA分子的標的DNA序列的方法,包括: a) 在適合形成RNA引導的核酸酶(RGN)核糖核苷酸錯合物的條件下,藉由組合下列而組裝RGN核糖核苷酸錯合物: i) 能夠與標的DNA序列雜交的一或更多引導RNA;以及 ii) 包括與SEQ ID NO:6具有至少90%序列一致性的胺基酸序列的RGN多肽;以及 b) 使標的DNA序列、或包括標的DNA序列的細胞與組裝的RGN核糖核苷酸錯合物接觸; 其中一或更多引導RNA與標的DNA序列雜交,從而引導RGN多肽與標的DNA序列結合。
373. 如實施方式372所述的方法,其中該方法在體外、體內或離體進行。
374. 如實施方式372或373所述的方法,其中RGN多肽或引導RNA進一步包括可檢測標記,從而允許標的DNA序列的檢測。
375. 如實施方式372或373所述的方法,其中引導RNA或RGN多肽進一步包括表現調節子,從而允許標的DNA序列的表現的調節。
376. 如實施方式372或373所述的方法,其中RGN多肽可操作地連接至先導編輯多肽,從而允許標的DNA序列的修飾。
377. 如實施方式376所述的方法,其中先導編輯多肽包括DNA聚合酶。
378. 如實施方式376所述的方法,其中先導編輯多肽包括反轉錄酶。
379. 如實施方式372或373所述的方法,其中RGN多肽可操作地連接至鹼基編輯多肽,從而允許標的DNA序列的修飾。
380. 如實施方式379所述的方法,其中鹼基編輯多肽包括去胺酶。
381. 如實施方式380所述的方法,其中去胺酶為胞嘧啶去胺酶或腺嘌呤去胺酶。
382. 如實施方式380所述的方法,其中去胺酶與SEQ ID NO:377-448中任一者的胺基酸序列具有至少90%序列一致性。
383. 如實施方式380所述的方法,其中去胺酶與SEQ ID NO:377-448中任一者的胺基酸序列具有100%序列一致性。
384. 如實施方式372或373所述的方法,其中RGN多肽能夠切割標的DNA序列,從而允許切割及/或修飾標的DNA序列。
385. 一種用於切割及/或修飾DNA分子的標的DNA序列的方法,包括使DNA分子與下列接觸: a) RNA引導的核酸酶(RGN)多肽,其中RGN包括與SEQ ID NO:6具有至少90%序列一致性的胺基酸序列;以及 b) 一或更多引導RNA,其能夠將(a)的RGN靶向標的DNA序列; 其中一或更多引導RNA與標的DNA序列雜交,從而引導RGN多肽與標的DNA序列結合,且發生標的DNA序列的切割及/或修飾。
386. 如實施方式385所述的方法,其中由RGN多肽的切割產生雙股斷裂。
387. 如實施方式385所述的方法,其中由RGN多肽的切割產生單股斷裂。
388. 如實施方式385所述的方法,其中RGN多肽為核酸酶不活化的或為切口酶。
389. 如實施方式385、387及388中任一者所述的方法,其中RGN可操作地連接至先導編輯多肽,從而允許標的DNA序列的修飾。
390. 如實施方式389所述的方法,其中先導編輯多肽包括DNA聚合酶。
391. 如實施方式389所述的方法,其中先導編輯多肽包括反轉錄酶。
392. 如實施方式385至388中任一者所述的方法,其中RGN多肽可操作地連接至鹼基編輯多肽。
393. 如實施方式392所述的方法,其中鹼基編輯多肽為去胺酶。
394. 如實施方式392所述的方法,其中去胺酶為胞嘧啶去胺酶或腺嘌呤去胺酶。
395. 如實施方式393所述的方法,其中去胺酶與SEQ ID NO:377-448中任一者的胺基酸序列具有至少90%序列一致性。
396. 如實施方式393所述的方法,其中去胺酶與SEQ ID NO:377-448中任一者的胺基酸序列具有100%序列一致性。
397. 如實施方式385所述的方法,其中經修飾的標的DNA序列包括將異源DNA插入標的DNA序列中。
398. 如實施方式385所述的方法,其中該經修飾的標的DNA序列包括標的DNA序列中的至少一核苷酸的缺失。
399. 如實施方式385所述的方法,其中該經修飾的標的DNA序列包括標的DNA序列中的至少一核苷酸的突變。
400. 如實施方式372至399中任一者所述的方法,其中標的DNA序列被定位為與前間隔序列鄰近模體(PAM)相鄰。
401. 如實施方式400所述的方法,其中PAM具有如 SEQ ID NO:78或SEQ ID NO:465所示的序列。
402. 如實施方式372至401中任一者所述的方法, 其中標的DNA序列為真核標的DNA序列。
403. 如實施方式372至402中任一者所述的方法,其中gRNA為單引導RNA(sgRNA)。
404. 如實施方式403所述的方法,其中sgRNA包括延伸,延伸包括用於先導編輯的編輯模板。
405. 如實施方式372至403中任一者所述的方法,其中gRNA為雙引導RNA。
406. 如實施方式372至405中任一者所述的方法,其中RGN包括與SEQ ID NO:6具有至少95%序列一致性的胺基酸序列。
407. 如實施方式372至405中任一者所述的方法,其中RGN包括與SEQ ID NO:6具有100%序列一致性的胺基酸序列。
408. 如實施方式372至405中任一者所述的方法,其中RGN與SEQ ID NO:6具有至少90%序列一致性,引導RNA包括與SEQ ID NO:18具有至少90%序列一致性的CrRNA重複序列以及與SEQ ID NO:30具有至少90%序列一致性的tracrRNA。
409. 如實施方式372至405中任一者所述的方法,其中RGN與SEQ ID NO:6具有至少95%序列一致性,引導RNA包括與SEQ ID NO:18具有至少95%序列一致性的CrRNA重複序列以及與SEQ ID NO:30具有至少95%序列一致性的tracrRNA。
410. 如實施方式372至405中任一者所述的方法,其中RGN與SEQ ID NO:6具有100%序列一致性,引導RNA包括與SEQ ID NO:18具有100%序列一致性的CrRNA重複序列以及與SEQ ID NO:30具有100%序列一致性的tracrRNA。
411. 如實施方式365至183中任一者所述的方法,其中標的DNA序列在細胞內。
412. 如實施方式411所述的方法,進一步包括:在RGN多肽被表現且切割及修飾標的DNA序列以產生包括經修飾的標的DNA序列的DNA分子的條件下,培養細胞;以及選擇包括經修飾的標的DNA序列的細胞。
413. 一種細胞,其包括如實施方式412所述的方法的經修飾的標的DNA序列。
414. 一種醫藥組成物,其包括如實施方式413所述的細胞及藥學上可接受的載體。
415. 一種用於產生具有因果突變中的校正的經基因修飾的細胞以用於遺傳性疾病的方法,該方法包括:將下列引入細胞內: a) RNA引導的核酸酶(RGN)多肽,其中RGN多肽包括與SEQ ID NO:6具有至少90%序列一致性的胺基酸序列、或編碼RGN多肽的多核苷酸,其中編碼RGN多肽的多核苷酸可操作地連接至啟動子,以使RGN多肽能夠在細胞中表現;以及 b) 引導RNA(gRNA)或編碼gRNA的多核苷酸,其中編碼gRNA的多核苷酸可操作地連接至啟動子,以使gRNA能夠在細胞中表現 藉此,RGN及gRNA靶向因果突變的基因體位置並修飾基因體序列,以去除因果突變。
416. 如實施方式415所述的方法,其中RGN為核酸酶不活化的或為切口酶。
417. 如實施方式415或416所述的方法,其中RGN可操作地連接至先導編輯多肽。
418. 如實施方式417所述的方法,其中先導編輯多肽包括DNA聚合酶。
419.      如實施方式417所述的方法,其中先導編輯多肽包括反轉錄酶。
420. 如實施方式417至419中任一者所述的方法,其中gRNA包括延伸,延伸包括用於先導編輯的編輯模板。
421. 如實施方式415或416所述的方法,其中RGN可操作地連接至具有鹼基編輯活性的多肽。
422. 如實施方式421所述的方法,其中鹼基編輯多肽為去胺酶。
423. 如實施方式422所述的方法,其中具有鹼基編輯活性的多肽為胞嘧啶去胺酶或腺嘌呤去胺酶。
424. 如實施方式422所述的方法,其中去胺酶與SEQ ID NO:377-448中任一者的胺基酸序列具有至少90%序列一致性。
425. 如實施方式422所述的方法,其中去胺酶與SEQ ID NO:377-448中任一者的胺基酸序列具有100%序列一致性。
426. 如實施方式415至425中任一者所述的方法,其中遺傳性疾病是由單核苷酸多型性引起的。
427. 如實施方式426所述的方法,其中gRNA進一步包括靶向接近因果單核苷酸多型性的區域的間隔序列。
428. 一種用於產生具有因果突變中的缺失的經基因修飾的細胞的方法,該方法包括:將下列引入細胞內: a) RNA引導的核酸酶(RGN)多肽,其中RGN多肽包括與SEQ ID NO:6具有至少90%序列一致性的胺基酸序列或編碼RGN多肽的多核苷酸,其中編碼RGN多肽的多核苷酸可操作地連接至啟動子,以使RGN多肽能夠在細胞中表現; b) 第一引導RNA(gRNA)或編碼gRNA的多核苷酸,其中編碼gRNA的多核苷酸可操作地連接至啟動子,以使gRNA能夠在細胞中表現,且進一步其中gRNA包括靶向因果突變的5'側的間隔序列;以及 c) 第二引導RNA(gRNA)或編碼gRNA的多核苷酸,其中編碼gRNA的多核苷酸可操作地連接至啟動子,以使gRNA能夠在細胞中表現,且進一步其中第二gRNA包括靶向因果突變的3’側的間隔序列; 藉此,RGN及二gRNA靶向因果突變,且因果突變的至少一部分被去除。
429. 如實施方式428所述的方法,其中第一gRNA進一步包括靶向因果突變內或接近因果突變的區域的間隔序列。
430. 如實施方式429所述的方法,其中第二gRNA進一步包括靶向因果突變內或接近因果突變的區域的間隔序列。
431. 如實施方式415至430中任一者所述的方法,其中RGN多肽與SEQ ID NO:6具有至少95%序列一致性。
432. 如實施方式415至430中任一者所述的方法,其中RGN多肽與SEQ ID NO:6具有100%序列一致性。
433. 如實施方式415至430中任一者所述的方法,其中gRNA、第一gRNA、第二gRNA、或第一gRNA及第二gRNA包括與SEQ ID NO:18具有至少90%序列一致性的CRISPR重複序列及與SEQ ID NO:30具有至少90%序列一致性的tracrRNA,其中RGN多肽具有與SEQ ID NO:6具有至少90%序列一致性的胺基酸序列。
434. 如實施方式415至430中任一者所述的方法,其中gRNA、第一gRNA、第二gRNA、或第一gRNA及第二gRNA包括與SEQ ID NO:18具有至少95%序列一致性的CRISPR重複序列及與SEQ ID NO:30具有至少95%序列一致性的tracrRNA,其中RGN多肽具有與SEQ ID NO:6具有至少95%序列一致性的胺基酸序列。
435. 如實施方式415至430中任一者所述的方法,其中gRNA、第一gRNA、第二gRNA、或第一gRNA及第二gRNA包括與SEQ ID NO:18具有100%序列一致性的CRISPR重複序列及與SEQ ID NO:30具有100%序列一致性的tracrRNA,其中RGN多肽具有與SEQ ID NO:6具有100%序列一致性的胺基酸序列。
436. 一種治療疾病、病症或症狀的方法,該方法包括對需要治療的個體投予有效量的如實施方式362至364及414中任一者所述的醫藥組成物。
437. 如實施方式436所述的方法,其中疾病、病症或症狀與因果突變相關聯,且有效量的醫藥組成物校正因果突變。
438. 如實施方式436或437所述的方法,其中個體有罹患疾病、病症或病症的風險。
439. 一種如實施方式277至296中任一者所述的核酸分子、如實施方式297至304中任一者所述的載體、如實施方式305至361中任一者所述的細胞、如實施方式306至324中任一者所述的RGN多肽、如實施方式325至327中任一者所述的RNP錯合物、或如實施方式328至360中任一者所述的系統用於對需要的個體治療疾病、病症或症狀的用途。
440. 如實施方式439所述的用途,其中疾病、病症或症狀與     因果突變相關聯,且治療包括校正因果突變。
441. 如實施方式439或440所述的用途,其中個體有罹患疾病、病症或病症的風險。
442. 一種如實施方式277至296中任一者所述的核酸分子、如實施方式297至304中任一者所述的載體、如實施方式305至361中任一者所述的細胞、如實施方式306至324中任一者所述的RGN多肽、如實施方式325至327中任一者所述的RNP錯合物、或如實施方式328至360中任一者所述的系統用於製備有用於治療疾病、病症或症狀的藥物的用途。
443. 如實施方式442所述的用途,其中疾病與因果突變相關聯,且有效量的藥物校正因果突變。
以下範例以說明方式而非限制方式提供。 範例 範例 1. RNA 引導的核酸酶的鑑定
鑑定出12種不同的CRISPR相關的RNA引導的核酸酶(RGN)並描述於下表1中。表1提供每一個RGN的名稱、其胺基酸序列、其取得來源、及經處理的crRNA及tracrRNA序列(見範例2的鑑定方法)。表1還提供通用單引導RNA(sgRNA)序列,其中poly-N指出確定sgRNA的核酸標的序列的間隔序列的位置。對於RGN系統LPG10134及LPG10141,tracrRNA的髮夾莖的鹼基中的保留序列為CNANNA(SEQ ID NO:322)。對於LPG10136、LPG10138、及LPG10139,相同位置中的序列為UNANNG(SEQ ID NO:321)。對於RGN系統LPG10145,tracrRNA的髮夾莖的鹼基中的保留序列為UNANNC(SEQ ID NO:318)。對於LPG10146、LPG10147、LPG10150、LPG10155、LPG10159及LPG10160,相同位置中的序列為UNANNA(SEQ ID NO:319)。 1 SEQ ID CRISPR 相關系統的彙總
RGN ID SEQ ID NO. 來源 crRNA 重複序列( SEQ ID NO. tracrRNA SEQ ID NO. sgRNA 骨架( SEQ ID NO
LPG10134 1 泡囊短波單胞菌( Brevundimonas vesicularis 13 25 37
LPG10136 2 内生芽胞杆菌_I( Bacillus_I endophyticus 14 26 38
LPG10138 3 巨大芽胞杆菌_C( Bacillus_C megaterium 15 27 39
LPG10139 4 巨大芽胞杆菌_C 16 28 40
LPG10141 5 硫氧化博斯氏菌( Bosea thiooxidans 17 29 41
LPG10145 6 未確定 18 30 42
LPG10146 7 嗜熱酸雙歧桿菌( Bifidobacterium thermacidophilum 19 31 43
LPG10147 8 未確定 20 32 44
LPG10150 9 未確定 21 33 45
LPG10155 10 金黃桿菌( Chryseobacterium geocarposphaerae 22 34 46
LPG10159 11 汙染/多種 23 35 47
LPG10160 12 解脲金黃桿菌( Chryseobacterium ureilyticum 24 36 48
範例 2 :引導 RNA 鑑定及 sgRNA 構築
經由鑑定基因體 CRISPR 基因座中編碼的tracrRNA及crRNA來確定引導 RNA。使用經確認及預測的 tracrRNA 的內部資料庫來確定推定的 RNA。當無法鑑定基於同源的 tracrRNA 時,遵循Briner, Cold Spring Harb Protoc 7: pbd. prot086785 (2016)中確定的指南的採用使用共通CRISPR重複序列的容許BLASTn參數來鑑定 tracrRNA的反重複部分。使用RNAfold(RNA折疊軟體)的二級結構預測來進行RNA的手動整理(manual curation)。sgRNA匣是藉由DNA合成而製備、且一般設計如下(5'->3'):20-30 bp間隔序列,在其3’端可操作地連接至crRNA的經處理的重複部分、可操作地連接至4 bp非互補連接子(AAAG;SEQ ID NO:323)、在其3’端可操作地連接至經處理的tracrRNA。也可以使用其他4 bp非互補連接子。
對於體外測定,藉由用GeneArt™精確gRNA合成套組(GeneArt™ Precision gRNA Synthesis Kit)(ThermoFisher)的sgRNA匣的體外轉錄來合成sgRNA。每一個RGN多肽的經處理的crRNA及tracrRNA序列被鑑定且列於表1中。關於對PAM庫1及2構築的sgRNA參見範例3。 範例 3 :每一個 RGN PAM 要求的確定
使用基本上改編自Karvelis等人 (2015) Genome Biol 253的體外轉譯PAM確定測定法,確定每一個RGN的PAM要求。簡言之,在pUC18 (ampR)中產生二個質體庫(L1及L2),每一個質體庫含有毗鄰8個隨機核苷酸(即,PAM區域)的不同的30bp前間隔序列(標的)序列。每一個RGN的庫1及庫2的標的序列及毗鄰PAM區域列於表2中。
簡言之,使用PURExpress體外蛋白質合成套組(PURExpress In Vitro Protein Synthesis kit)(New England Biolabs)從 T7 啟動子驅動的細菌表現質體開始,在體外轉譯蛋白質。
在適當的sgRNA存在下,含有由RGN辨識的PAM的質體將被切割。使用NEBNext Ultra II DNA庫製備套組(NEBNext Ultra II DNA Library Prep Kit)(New England Biolabs)將銜接子連接至切割的 DNA 上,並在清理後,使用與連接的銜接子及質體骨架序列互補的引子對產物進行 PCR 擴增,使富集的 PAM 序列包含在擴增子中。由服務提供者(MoGene,St.Louis,MO)的MiSeq (Illumina)上進行深度定序(75 bp單端讀數)。通常,每個擴增子獲得500,000讀數。對於每一個樣本, PAM區域被萃取、計數及標準化至總讀數。導致質體切割的PAM是藉由被富集(當與對照組比較時(即,庫中的PAM的開始頻率))來鑑定。為了呈現新的RGN的PAM要求,利用以2為底的負對數-轉換將涉及的區域中的全部序列的缺乏率(樣本中的頻率/對照組中的頻率)轉換為富集值。富集值>3.5的那些PAM定義為足夠的PAM。二個庫中大於此臨界值的PAM被收集、且被用於產生網站標誌(web logo),例如,在網際網路上使用被稱為「網站標誌」的基於網路的服務,可產生網站標誌。當最富集的PAM中存在一致的模式時,PAM序列被鑑定及報告。每一個RGN的共有PAM(具有富集因子(EF)>3.5)被提供於表2中。PAM方向亦在表2中表明。 2 PAM 或類 PAM 確定
RGN ID sgRNA L1 SEQ ID NO. sgRNA L2 SEQ ID NO. PAM SEQ ID NO. PAM 方向
LPG10134 49 61 73 5'-標的-PAM-3'
LPG10136 50 62 74 5'-標的-PAM-3'
LPG10138 51 63 75 5'-標的-PAM-3'
LPG10139 52 64 76 5'-標的-PAM-3'
LPG10141 53 65 77 5'-標的-PAM-3'
LPG10145 54 66 78 5'-標的-PAM-3'
LPG10146 55 67 79 5'-標的-PAM-3'
LPG10147 56 68 80 5'-標的-PAM-3'
LPG10150 57 69 81 5'-標的-PAM-3'
LPG10155 58 70 82 5'-標的-PAM-3'
LPG10159 59 71 83 5'-標的-PAM-3'
LPG10160 60 72 84 5'-標的-PAM-3'
範例 4 :哺乳動物細胞中的基因編輯活性的證明
產生RGN表現匣並將其引入載體中以進行哺乳動物表現。每一個RGN都針對人類表現而被密碼子最佳化、且在5'端處與SV40核定位序列(NLS;SEQ ID NO:316)及3xFLAG標籤(SEQ ID NO:326)可操作地融合、以及在3’端處與核質素NLS序列(SEQ ID NO:317)可操作地融合。每一個表現匣都在巨細胞病毒(CMV)啟動子(SEQ ID NO:327)的控制下。本領域中已知CMV轉錄增強子(SEQ ID NO:328)亦可以被包括在包括CMV啟動子的構築體中。每一個都在人類RNA聚合酶III U6啟動子(SEQ ID NO:329)控制下產生編碼單一gRNA的引導RNA表現構築體且其被引入pTwist高拷貝擴增(pTwist High Copy Amp)載體中。針對每一個引導的標的序列的序列被提供於表3中。
將上述的若干構築體引入哺乳動物細胞中。轉染前一天,將1x10 5個HEK293T細胞(Sigma)塗抹在Dulbecco的改良Eagle培養基(DMEM)加10%(vol/vol)胎牛血清(Gibco)及1%青黴素-鏈黴素(Gibco)的24孔盤中。第二天,當細胞達到50-60%融合度(confluency)時,按照製造商的使用說明,使用每孔1.5 μL的Lipofectamine 3000(Thermo Scientific)共轉染500 ng RGN表現質體加500 ng 單一gRNA表現質體。生長48小時後,根據製造商的使用說明,使用基因體DNA分離套組(Machery-Nagel)來收穫總基因體DNA。
然後,對總基因體DNA進行分析,以確定每一個RGN對每一個基因體標的的編輯率。首先,產生寡核苷酸以用於PCR擴增及經擴增的基因體標的位點的後續分析。
全部PCR反應都是在20 μL反應(包括每一引子0.5 μM)中使用10 μL的2X Master Mix Phusion 高保真DNA聚合酶(Thermo Scientific)進行。首先,使用PCR#1引子並使用以下程序擴增包含每一個標的基因的大基因體區域:98°C,1分鐘;30次循環的[98°C,10秒;62°C,15秒;72°C,5分鐘];72°C,5分鐘;12°C,永遠。然後,使用對每一個導引專一的引子(PCR#2引子)並使用以下程序進一步擴增1微升的此PCR反應:98 °C,1分鐘; 35個循環的[98°C,10秒;67°C,15秒;72°C,30秒];72°C,5分鐘;12°C,永遠。PCR#2的引子包括用於Illumina定序的Nextera讀數1及讀數2轉位酶轉接子突出序列。
人類基因體中許多不同的基因被靶向以進行RNA引導的切割。這些基因座被包括在下面的表3中。 3 :用於測試哺乳動物細胞中的基因編輯活性的引導 RNA 的標的序列及 sgRNA 序列
RGN ID 基因 引導 ID 標的序列( SEQ ID NO
LPG10134 B2M SGN002644 554
LPG10134 B2M SGN002645 555
LPG10134 B2M SGN002646 556
LPG10134 B2M SGN002647 557
LPG10134 B2M SGN002648 558
LPG10134 TRAC SGN002649 559
LPG10134 TRAC SGN002650 560
LPG10134 TRAC SGN002651 561
LPG10134 TRAC SGN002652 562
LPG10134 TRAC SGN002653 563
LPG10136 B2M SGN002654 564
LPG10136 B2M SGN002655 565
LPG10136 B2M SGN002656 566
LPG10136 B2M SGN002657 567
LPG10136 B2M SGN002658 568
LPG10136 TRAC SGN002659 569
LPG10136 TRAC SGN002660 570
LPG10136 TRAC SGN002661 571
LPG10136 TRAC SGN002662 572
LPG10136 TRAC SGN002663 573
LPG10138 B2M SGN002664 574
LPG10138 B2M SGN002665 575
LPG10138 B2M SGN002666 576
LPG10138 B2M SGN002667 577
LPG10138 B2M SGN002668 578
LPG10138 TRAC SGN002669 579
LPG10138 TRAC SGN002670 580
LPG10138 TRAC SGN002671 581
LPG10138 TRAC SGN002672 582
LPG10138 TRAC SGN002673 583
LPG10139 B2M SGN002674 584
LPG10139 B2M SGN002675 585
LPG10139 B2M SGN002676 586
LPG10139 B2M SGN002677 587
LPG10139 B2M SGN002678 588
LPG10139 TRAC SGN002679 589
LPG10139 TRAC SGN002680 590
LPG10139 TRAC SGN002681 591
LPG10139 TRAC SGN002682 592
LPG10139 TRAC SGN002683 593
LPG10141 B2M SGN002684 594
LPG10141 B2M SGN002685 595
LPG10141 B2M SGN002686 596
LPG10141 B2M SGN002687 597
LPG10141 B2M SGN002688 598
LPG10141 TRAC SGN002689 599
LPG10141 TRAC SGN002690 600
LPG10141 TRAC SGN002691 601
LPG10141 TRAC SGN002692 602
LPG10141 TRAC SGN002693 603
LPG10145 B2M SGN002698 604
LPG10145 B2M SGN002699 605
LPG10145 B2M SGN002700 606
LPG10145 B2M SGN002701 607
LPG10145 B2M SGN002702 608
LPG10145 TRAC SGN002703 609
LPG10145 TRAC SGN002704 610
LPG10145 TRAC SGN002705 611
LPG10145 TRAC SGN002706 612
LPG10145 TRAC SGN002707 613
LPG10146 B2M SGN002708 614
LPG10146 B2M SGN002709 615
LPG10146 B2M SGN002710 616
LPG10146 B2M SGN002711 617
LPG10146 B2M SGN002712 618
LPG10146 TRAC SGN002713 619
LPG10146 TRAC SGN002714 620
LPG10146 TRAC SGN002715 621
LPG10146 TRAC SGN002716 622
LPG10146 TRAC SGN002717 623
LPG10147 B2M SGN002718 624
LPG10147 B2M SGN002719 625
LPG10147 TRAC SGN002720 626
LPG10147 TRAC SGN002721 627
LPG10147 TRAC SGN002722 628
LPG10147 TRAC SGN002723 629
LPG10150 B2M SGN002724 630
LPG10150 B2M SGN002725 631
LPG10150 B2M SGN002726 632
LPG10150 B2M SGN002727 633
LPG10150 B2M SGN002728 634
LPG10150 TRAC SGN002729 635
LPG10150 TRAC SGN002730 636
LPG10150 TRAC SGN002731 637
LPG10150 TRAC SGN002732 638
LPG10150 TRAC SGN002733 639
LPG10155 B2M SGN002734 640
LPG10155 B2M SGN002735 641
LPG10155 TRAC SGN002736 642
LPG10155 TRAC SGN002737 643
LPG10155 TRAC SGN002738 644
LPG10155 TRAC SGN002739 645
LPG10159 B2M SGN002740 646
LPG10159 B2M SGN002741 647
LPG10159 B2M SGN002742 648
LPG10159 B2M SGN002743 649
LPG10159 B2M SGN002744 650
LPG10159 TRAC SGN002745 651
LPG10159 TRAC SGN002746 652
LPG10159 TRAC SGN002747 653
LPG10159 TRAC SGN002748 654
LPG10159 TRAC SGN002749 655
LPG10160 B2M SGN002750 656
LPG10160 B2M SGN002751 657
LPG10160 B2M SGN002752 658
LPG10160 B2M SGN002753 659
LPG10160 B2M SGN002754 660
LPG10160 TRAC SGN002755 661
LPG10160 TRAC SGN002756 662
LPG10160 TRAC SGN002757 663
LPG10160 TRAC SGN002758 664
LPG10160 TRAC SGN002759 665
對經純化的基因體DNA根據如上的PCR#1及PCR#2進行擴增。在第二次PCR擴增後,根據製造商的使用說明,使用PCR淨化套組(Zymo)清洗DNA,並在水中洗滌。將200-500 ng純化的PCR#2產物與2 μL的10X NEB緩衝液2及水在20 μL反應中合併、並使用以下程序進行貼合:95°C,5分鐘;95-85°C,以2°C/秒的速率冷卻;85-25°C,以0.1°C/秒的速率冷卻;12°C,永遠,以形成異源雙股DNA。貼合後,移除5 μL的DNA,以作為無酵素對照,且加入1 μL的T7核酸內切酶I(NEB),並使反應在37°C下培養1小時。培養後,加入5x FlashGel裝載染料(Lonza),並使用凝膠電泳以藉由2.2%瓊脂糖FlashGel(Lonza)分析5 μL的每一個反應及對照。在凝膠可視化之後,使用以下公式來確定非同源末端連接(NHEJ)的百分比:%NHEJ事件= 100 x [1-(1-所切割的分率(fraction))(½)],其中(所切割的分率)被定義為:(分解產物的密度)/(分解產物的密度+未分解的親代的密度)。
對於一些樣本,使用SURVEYOR®分析在哺乳動物細胞中表現後的結果。在基因體DNA萃取前,將細胞在37° C下培養,以進行72小時的後轉染。按照製造商的操作流程,使用QuickExtract DNA萃取溶液(Epicentre)來萃取基因體DNA。對RGN標的位點毗鄰的基因體區域進行PCR擴增,並按照製造商的操作流程,使用QiaQuick Spin Column(Qiagen)來純化產物。總計200-500 ng的純化PCR產物與1 μl 10×Taq DNA聚合酶PCR緩衝液(Enzymatics)及超純水混合至10 μl的最終體積,並進行重貼合過程,以使異源雙股形成:95° C 10分鐘;以-2° C/s從 95° C降至85° C;以-0.25° C/s從 85° C降至25° C;並在25° C下保持1分鐘。
載重貼合後,按照製造商建議的操作流程,用SURVEYOR®核酸酶及SURVEYOR®增強劑S(集成DNA技術)處理產物、並在4-20%的Novex TBE聚丙烯醯胺凝膠(Life Technologies)上進行分析。用SYBR Gold DNA染色劑(Life Technologies)將凝膠染色10分鐘,並用Gel Doc凝膠成像系統(Bio-rad)將凝膠成像。定量是基於相對譜帶強度。插入缺失(Indel)百分比由公式100×(1−(1−(b+c)/(a+b+c))½)確定,其中a是未分解的PCR產物的累積強度,且b及c是每個切割產物的累積強度。
另外,按照Illumina 16S總體基因體定序庫(Metagenomic Sequencing Library)操作流程,對含有Illumina突出序列的PCR#2的產物進行庫製備。深度定序由服務提供者(MOGene)在Illumina Mi-Seq平臺上進行。通常,每個擴增子產生200,000個250bp的配對末端讀數(2 x 100,000個讀數)。使用CRISPResso(Pinello,等人 2016 Nature Biotech, 34:695-697)分析讀數,以計算編輯率。手動整理輸出比對,以確認插入及缺失位點並鑑定重組位點處的微同源位點。編輯率顯示於表4中。所有實驗皆在人類細胞中實行。「標的序列」是基因標的內的靶向序列。對於每一個標的序列,根據所使用的RGN,引導RNA包括互補RNA標的序列以及適當的sgRNA。藉由引導RNA選擇的實驗分析顯示於表5.1及5.2且描述於圖1中。 4 :藉由質體遞送的編輯率
RGN SGN 重複 1 重複 2 重複 3
LPG10134 SGN002644 0 0.06 1.76
LPG10134 SGN002645 0 0 1.43
LPG10134 SGN002646 0 0 0.04
LPG10134 SGN002647 0 0 0
LPG10134 SGN002648 0 0 2.15
LPG10134 SGN002649 0 0 0
LPG10134 SGN002650 0 0 0
LPG10134 SGN002651 0 0 0
LPG10134 SGN002652 0 0 0
LPG10134 SGN002653 0 0 0
LPG10136 SGN002654 5.74 3.57 8
LPG10136 SGN002655 5.18 5.36 6.86
LPG10136 SGN002656 3.4 2.06 5.7
LPG10136 SGN002657 4.14 3.01 6.77
LPG10136 SGN002658 0.05 0 0
LPG10136 SGN002659 0.33 0.15 0.87
LPG10136 SGN002660 1.89 0.82 4.38
LPG10136 SGN002661 3.56 3.81 4.82
LPG10136 SGN002662 2.53 1.9 3.99
LPG10136 SGN002663 0.51 0.33 0.67
LPG10138 SGN002664 0.47 0.46 2.75
LPG10138 SGN002665 0.92 3.79 4.84
LPG10138 SGN002666 0.12 0.22 0.88
LPG10138 SGN002667 0.91 3.13 3.18
LPG10138 SGN002668 0 0 0
LPG10138 SGN002669 0.14 0.42 1.92
LPG10138 SGN002670 0 0 0.14
LPG10138 SGN002671 2.54 2.56 3.21
LPG10138 SGN002672 0.1 1.11 0.79
LPG10138 SGN002673 0 0 0.87
LPG10139 SGN002674 0.27 0.56 2.97
LPG10139 SGN002675 3.95 3.92 5.99
LPG10139 SGN002676 0 0.12 1.36
LPG10139 SGN002677 0.88 0.24 3.27
LPG10139 SGN002678 0 0 0
LPG10139 SGN002679 1.68 0.47 3.26
LPG10139 SGN002680 0 0 0.16
LPG10139 SGN002681 3.53 4.09 7.03
LPG10139 SGN002682 0.94 0.51 3.32
LPG10139 SGN002683 0.35 0.44 0.93
LPG10141 SGN002684 0 0 0.3
LPG10141 SGN002685 0 0 0.43
LPG10141 SGN002686 0 0 0.14
LPG10141 SGN002687 0 0 2.1
LPG10141 SGN002688 0 0 0
LPG10141 SGN002689 0 0 0
LPG10141 SGN002690 0 0 0
LPG10141 SGN002691 0 0 0
LPG10141 SGN002692 0 0 0
LPG10141 SGN002693 0 0 0
LPG10145 SGN002698 9.25 9.03 13.74
LPG10145 SGN002699 3.19 4.3 6.29
LPG10145 SGN002700 1.43 0.31 4.26
LPG10145 SGN002701 3.9 5.07 6.85
LPG10145 SGN002702 9.87 4.92 11.76
LPG10145 SGN002703 0.08 0.07 0.61
LPG10145 SGN002704 3.04 1.09 4.83
LPG10145 SGN002705 0 0 0
LPG10145 SGN002706 4.36 1.96 4.7
LPG10145 SGN002707 8.54 8.09 7.36
LPG10146 SGN002708 0.85 0 1.09
LPG10146 SGN002709 0 0 0.19
LPG10146 SGN002710 0.29 1.08 1.09
LPG10146 SGN002711 0 0 0.71
LPG10146 SGN002712 2.42 1.57 3.01
LPG10146 SGN002713 0 0 0
LPG10146 SGN002714 0 0 0
LPG10146 SGN002715 0 0 0
LPG10146 SGN002716 0 0 0
LPG10146 SGN002717 0 0 0
LPG10147 SGN002718 0 0 0
LPG10147 SGN002719 0 0 0
LPG10147 SGN002720 0 0 0
LPG10147 SGN002721 0 0 0
LPG10147 SGN002722 0 0 0
LPG10147 SGN002723 0 0 0
LPG10150 SGN002724 2.15 3.12 1.25
LPG10150 SGN002725 1.29 1.1 0.28
LPG10150 SGN002726 0.05 0 0
LPG10150 SGN002727 0.03 0 0
LPG10150 SGN002728 0.06 0.1 0
LPG10150 SGN002729 0 0 0
LPG10150 SGN002730 0 0 0
LPG10150 SGN002731 0.08 0.2 0
LPG10150 SGN002732 0 0 0
LPG10150 SGN002733 0.72 0.17 0.09
LPG10155 SGN002734 0 0 0
LPG10155 SGN002735 0 0.15 0
LPG10155 SGN002735 0.42 0 0
LPG10155 SGN002736 0 0 0
LPG10155 SGN002737 0 0 0
LPG10155 SGN002738 0 0 0
LPG10159 SGN002738 0 0 0
LPG10159 SGN002739 0 0 0
LPG10159 SGN002740 0 0 0
LPG10159 SGN002741 0 0 0
LPG10159 SGN002742 0 0 0
LPG10159 SGN002744 0 0 0
LPG10159 SGN002745 0 0 0
LPG10159 SGN002747 0 0
LPG10159 SGN002748 0 0 0
LPG10159 SGN002749 0 0 0
LPG10160 SGN002750 0 0 0
LPG10160 SGN002751 0 0 0
LPG10160 SGN002752 0 0 0
LPG10160 SGN002753 0 0 0
LPG10160 SGN002754 0 0 0
LPG10160 SGN002755 0 0 0
LPG10160 SGN002756 0 0 0
LPG10160 SGN002757 0 0 0
LPG10160 SGN002758 0 0 0
LPG10160 SGN002759 0 0 0
LPG10136在三個獨立實驗中顯示10個引導的平均編輯率約為3.01%。LPG10145在三個獨立的編輯實驗中顯示10個引導的平均編輯率約為4.63%,三個引導的編輯率約為10%。LPG10138、LPG10139、LPG10141、LPG10146及LPG10150藉由具有至少一引導RNA證明這些核酸酶在哺乳動物細胞中具有活性的擴增子定序亦顯示插入缺失形成。 5.1 LPG10136 的插入缺失形成範例
# 讀數 編輯序列 類型 大小 插入缺失 位置 讀數 % 插入缺失 %
261890 CTCAGGTACTCCAAAGATTCAGG TTTACTCACGTCATCCAGCAGAGA WT 0 0 92.82 0
1935 CTCAGGTACTCCAAAGATTCAGGT TT----ACGTCATCCAGCAGAGA 缺失 4 3 0.69 9.55
1806 CTCAGGTACTCCAAAGATTCAGGT TTAC-----TCATCCAGCAGAGA 缺失 5 0 0.64 8.92
929 CTCAGGTACTCCAAAGAT----------T CACGTCATCCAGCAGAGA 缺失 10 5 0.33 4.59
828 CTCAGGTACTCCAAAGATTCAGGT TTACT-ACGTCATCCAGCAGAGA 缺失 1 3 0.29 4.09
803 CTCAGGTACTCCAAAGATTCAGGT TTACTCAACGTCATCCAGCAGAG 插入 1 3 0.28 3.96
802 CTCAGGTACTCCAAAGATTCAGGT TTAC--------TCCAGCAGAGA 缺失 8 -3 0.28 3.96
622 CTCAGGTACTCCAAAGATTCAGGT TTACT—CGTCATCCAGCAGAGA 缺失 2 2 0.22 3.07
409 CTCAGGTACTCCAAAG--------------A CGTCATCCAGCAGAGA 缺失 14 3 0.14 2.02
380 CTCAGGTACTCCAAAGATTCAGGT TTACTCCACGTCATCCAGCAGAG 插入 1 4 0.13 1.88
373 CTCAGGTACTCCAAAGATTCAGGT TTACT---------CAGCAGAGA 缺失 9 -5 0.13 1.84
342 CTCAGGTACTCCAAAGATTCA----- ----ACGTCATCCAGCAGAGA 缺失 9 3 0.12 1.69
340 CTCAGGTACTCCAAAG--------------- ------------------------------------------------ -------A 缺失 133 -116 0.12 1.68
335 CTCAGGTACTCCAAAGAT------------ ---TCATCCAGCAGAGA 缺失 15 0 0.12 1.65
302 CTCAGGTACTCCAAAGATTCAGGT TTA—CACGTCATCCAGCAGAGA 缺失 2 4 0.11 1.49
302 CTCAGGTACTCCAAAGAT------------ ACGTCATCCAGCAGAGA 缺失 12 3 0.11 1.49
293 CTCAGGTACTCCAAAGATTCAG---- ------GTCATCCAGCAGAGA 缺失 10 1 0.1 1.45
289 CTCAGGTACTCCAAAGATTCAGGT TTACTC-CGTCATCCAGCAGAGA 缺失 1 2 0.1 1.43
287 CTCAGGTACTCCAAAGATTCAGGT T-----ACGTCATCCAGCAGAGA 缺失 5 3 0.1 1.42
277 CTCAGGTACTCCAAAGATTCAGGT T---------------------------------------------- ------------------------------------------------ ----------T 缺失 168 -160 0.1 1.37
271 CTCAGGTACTCCAAAGATTCAGGT TTA---ACGTCATCCAGCAGAGA 缺失 3 3 0.1 1.34
佔整體編輯結果>0.1%的經編輯的對偶基因如上所示。缺失以破折號表示。此引導最常見的編輯結果是小的缺失及插入。 5.2 LPG10145 的插入缺失形成範例
# 讀數 編輯序列 類型 大小 插入缺失位置 讀數 % 插入缺失 %
270438 ATGTCTCGCTCCGTGGCCTTAGCTGT GCTCGCGCTACTCTCTCTTTC WT 0 0 85.84 0
8329 ATGTCTCGCTCCGTGG-CTTAGCTGT GCTCGCGCTACTCTCTCTTTC 缺失 1 2 2.64 18.68
3531 ATGTCTCGCTCCGTGGC—TAGCTGT GCTCGCGCTACTCTCTCTTTC 缺失 2 3 1.12 7.92
2595 ATGTCTCGCTCCGTG------GCTGTGC TCGCGCTACTCTCTCTTTC 缺失 6 1 0.82 5.82
2201 ATGTCTCGCTCCGTGGC----------CTC GCGCTACTCTCTCTTTC 缺失 10 3 0.7 4.94
1902 ATGTCTCGCTCCGTGGCACTTAGC TGTGCTCGCGCTACTCTCTCTTT 插入 1 3 0.6 4.27
1262 ATGTCTCGCTCCGTG-----------GCTC GCGCTACTCTCTCTTTC 缺失 11 1 0.4 2.83
1047 ATGTCTCG---------CTTAGCTGTGCT CGCGCTACTCTCTCTTTC 缺失 9 -6 0.33 2.35
759 ATGTCTC-------------------GCTCGCGC TACTCTCTCTTTC 缺失 19 -7 0.24 1.7
730 ATGTCTCGCTCCGTGGC----GCTGT GCTCGCGCTACTCTCTCTTTC 缺失 4 3 0.23 1.64
654 ATGTCTCGCTCCGTGGC-----CTGTG CTCGCGCTACTCTCTCTTTC 缺失 5 3 0.21 1.47
639 ATGTCTCGCTCCGTGGC---AGCTGT GCTCGCGCTACTCTCTCTTTC 缺失 3 3 0.2 1.43
548 ATGTCTCGCTCCGTG---------------GC GCTACTCTCTCTTTC 缺失 15 1 0.17 1.23
530 ATGTCTCGCTCCGTGGC--------TGC TCGCGCTACTCTCTCTTTC 缺失 8 3 0.17 1.19
528 ATGT-----------------------CTCGCGCT ACTCTCTCTTTC 缺失 23 -10 0.17 1.18
519 ATGTCTCGCTCCGTGGC---------GC TCGCGCTACTCTCTCTTTC 缺失 9 3 0.16 1.16
470 ATGTCTCGCTCCGTGGCTTCTTAG CTGTGCTCGCGCTACTCTCTCTT 插入 2 3 0.15 1.05
456 ATGTCTCGCTCCGTGGC-------GTG CTCGCGCTACTCTCTCTTTC 缺失 7 3 0.14 1.02
431 ATGTCTC--------------GCTGTGCTCG CGCTACTCTCTCTTTC 缺失 14 -7 0.14 0.97
410 ATGTCTCGCTCCGTGGC—GAGCT GTGCTCGCGCTACTCTCTCTTTC 缺失 2 3 0.13 0.92
391 ATGTCTCGCTCCGTGGCCGTTT CCCCCTGGAAGCTCCCTCGTGC GCT 插入 41 3 0.12 0.88
368 ATGTCTCGCTCCG------TAGCTGTGCTCGCGCTACTCTC TCTTTC 缺失 6 -1 0.12 0.83
329 ATG-------------------------------------- -------------------------------------------- -------------------------------------------- -----------T 缺失 137 -11 0.1 0.74
328 ATGTCTCGCTCCGTG-----------------GCTACTCTCTCTTTC 缺失 17 1 0.1 0.74
310 ATGTCTCGCTCCGTGGC------------CGCGCTACTCTCTCTTTC 缺失 12 3 0.1 0.7
301 ATGTCTCGCTC-----CCTTAGCTGTGCTCGCGCTACTC TCTCTTTC 缺失 5 -3 0.1 0.67
佔整體編輯結果>0.1%的經編輯的對偶基因如上所示。缺失以破折號表示。此引導最常見的編輯結果是小的缺失及插入。 範例 5 測試不同遞送形式
為了確定RGN是否能夠以不同形式遞送,用初代T細胞測試mRNA及RNP核轉染遞送。 將純化的CD3+ T細胞或周邊血液單核細胞(PBMC)解凍,使用CD3/CD28珠(ThermoFisher)活化3天、然後使用Lonza 4D-Nucleofector X單元及Nucleocuvette條(strip)被核轉染。P3初代細胞套組用於mRNA及RNP二者的遞送。使用EO-115及EH-115程式以分別針對mRNA及RNP遞送轉染細胞。細胞在含有IL-2、IL-7及IL-15(Miltenyi Biotec)的 CTS OpTimizer T 細胞擴增培養基(ThermoFisher)中培養 4 天,以在使用 Nucleospin Tissue 基因體DNA分離套組(Macery Nagel)收獲前。
編輯位點周圍的擴增子是使用引子藉由PCR而產生、並依照範例4中的方法使用Illumina Nextera平臺並使用2x250bp配對末端定序進行NGS定序。 範例 6 疾病標的的鑑定
從經由在NCBI ClinVar網站的全球資訊網可得的NCBI ClinVar資料庫獲得臨床變異體的資料庫。從此列表鑑定出致病性單一核苷酸多型性(SNP)。使用基因體基因座資訊,鑑定在與每一個SNP重疊及在每一個SNP周圍的區域中的CRISPR標的。表6中列出為靶向因果突變(「Casl Mut.」)可使用鹼基編輯、結合本發明的RGN來校正的SNP的選擇。在表6中,僅列出每一種疾病的一個別名。「RS#」對應於經由NCBI網站的SNP資料庫獲得的RS登錄號。對偶基因ID對應於因果對偶基因登錄號。表6亦提供適合於針對每一種疾病所列的RGN的基因體標的序列資訊。標的序列資訊亦提供用於產生本發明的對應RGN所需的sgRNA的前間隔序列。 6 RGN 的疾病標的
疾病 RS# RGN 因果突變 對偶基因 ID 基因符號 標的( SEQ ID NO.
斯特格氏症1型(Stargardt disease 1) 1800553 LPG10134 G>A 22927 ABCA4 85
斯特格氏症1型 1800553 LPG10136 G>A 22927 ABCA4 86
斯特格氏症1型 1800553 LPG10138,LPG10139 G>A 22927 ABCA4 87
斯特格氏症1型 1800553 LPG10145 G>A 22927 ABCA4 88
斯特格氏症1型 1800553 LPG10141 G>A 22927 ABCA4 89
斯特格氏症1型 1800728 LPG10134 T>C 98777 ABCA4 90
斯特格氏症1型 1800728 LPG10138,LPG10139 T>C 98777 ABCA4 91
斯特格氏症1型 1800728 LPG10145 T>C 98777 ABCA4 92
斯特格氏症1型 1800728 LPG10146 T>C 98777 ABCA4 93
斯特格氏症1型 1800728 LPG10150 T>C 98777 ABCA4 94
斯特格氏症1型 1800728 LPG10159 T>C 98777 ABCA4 95
斯特格氏症1型 1800728 LPG10141 T>C 98777 ABCA4 96
中鏈醯基輔酶A去氫酶缺乏症(Medium-chain acyl-coenzyme A dehydrogenase deficiency) 121434274 LPG10138,LPG10139 G>A 18627 ACADM 97
中鏈醯基輔酶A去氫酶缺乏症 121434274 LPG10160 G>A 18627 ACADM 98
超長鏈醯基-CoA去氫酶缺乏症(Very long chain acyl-CoA dehydrogenase deficiency) 113994167 LPG10134 T>C 33877 ACADVL 99
超長鏈醯基-CoA去氫酶缺乏症 113994167 LPG10138,LPG10139 T>C 33877 ACADVL 100
超長鏈醯基-CoA去氫酶缺乏症 113994167 LPG10145 T>C 33877 ACADVL 101
超長鏈醯基-CoA去氫酶缺乏症 113994167 LPG10146 T>C 33877 ACADVL 102
超長鏈醯基-CoA去氫酶缺乏症 113994167 LPG10141 T>C 33877 ACADVL 103
腺苷酸琥珀酸裂解酶缺乏症(Adenylosuccinate lyase deficiency) 119450941 LPG10138,LPG10139 G>A 17501 ADSL 104
原發性高草酸尿症I型(Primary hyperoxaluria, type I) 121908529 LPG10134 G>A 38436 AGXT 105
原發性高草酸鹽尿症第1型 121908529 LPG10136 G>A 38436 AGXT 106
原發性高草酸鹽尿症第1型 121908529 LPG10138,LPG10139 G>A 38436 AGXT 107
原發性高草酸鹽尿症第1型 121908529 LPG10145 G>A 38436 AGXT 108
原發性高草酸鹽尿症第1型 121908529 LPG10141 G>A 38436 AGXT 109
低磷酸酶症(Hypophosphatasia) 121918007 LPG10134 G>A 28709 ALPL 110
低磷酸酶症 121918007 LPG10136 G>A 28709 ALPL 111
低磷酸酶症 121918007 LPG10138,LPG10139 G>A 28709 ALPL 112
低磷酸酶症 121918007 LPG10145 G>A 28709 ALPL 113
異染性白質失養症(Metachromatic leukodystrophy) 80338815 LPG10134 G>A 18090 ARSA 114
異染性白質失養症 80338815 LPG10136 G>A 18090 ARSA 115
異染性白質失養症 80338815 LPG10138,LPG10139 G>A 18090 ARSA 116
異染性白質失養症 80338815 LPG10145 G>A 18090 ARSA 117
異染性白質失養症 80338815 LPG10146 G>A 18090 ARSA 118
異染性白質失養症 80338815 LPG10141 G>A 18090 ARSA 119
乳癌及/或卵巢癌 80356962 LPG10134 G>A 70247 BRCA1 120
乳癌及/或卵巢癌 80356962 LPG10134 G>A 70247 BRCA1 121
乳癌及/或卵巢癌 80356962 LPG10136 G>A 70247 BRCA1 122
乳癌及/或卵巢癌 80356962 LPG10138,LPG10139 G>A 70247 BRCA1 123
乳癌及/或卵巢癌 80356962 LPG10145 G>A 70247 BRCA1 124
乳癌及/或卵巢癌 80356962 LPG10146 G>A 70247 BRCA1 125
乳癌及/或卵巢癌 80359003 LPG10134 G>A 67069 BRCA2 126
乳癌及/或卵巢癌 80359003 LPG10145 G>A 67069 BRCA2 127
乳癌及/或卵巢癌 80359003 LPG10146 G>A 67069 BRCA2 128
乳癌及/或卵巢癌 80359003 LPG10159 G>A 67069 BRCA2 129
乳癌及/或卵巢癌 80359003 LPG10160 G>A 67069 BRCA2 130
乳癌及/或卵巢癌 80359003 LPG10141 G>A 67069 BRCA2 131
乳癌及/或卵巢癌 80359071 LPG10134 G>A 67203 BRCA2 132
乳癌及/或卵巢癌 80359071 LPG10138,LPG10139 G>A 67203 BRCA2 133
高胱胺酸尿症 5742905 LPG10134 T>C 15159 CBS 134
高胱胺酸尿症 5742905 LPG10136 T>C 15159 CBS 135
高胱胺酸尿症 5742905 LPG10138,LPG10139 T>C 15159 CBS 136
高胱胺酸尿症 5742905 LPG10145 T>C 15159 CBS 137
高胱胺酸尿症 5742905 LPG10145 T>C 15159 CBS 138
高胱胺酸尿症 5742905 LPG10150 T>C 15159 CBS 139
高胱胺酸尿症 5742905 LPG10159 T>C 15159 CBS 140
高胱胺酸尿症 5742905 LPG10141 T>C 15159 CBS 141
高胱胺酸尿症 121964962 LPG10134 G>A 15156 CBS 142
高胱胺酸尿症 121964962 LPG10136 G>A 15156 CBS 143
高胱胺酸尿症 121964962 LPG10138,LPG10139 G>A 15156 CBS 144
高胱胺酸尿症 121964962 LPG10145 G>A 15156 CBS 145
高胱胺酸尿症 121964962 LPG10141 G>A 15156 CBS 146
囊腫纖化症 75527207 LPG10138,LPG10139 G>A 22159 CFTR 147
囊腫纖化症 75527207 LPG10160 G>A 22159 CFTR 148
囊腫纖化症 78655421 LPG10134 G>A 22148 CFTR 149
囊腫纖化症 78655421 LPG10138,LPG10139 G>A 22148 CFTR 150
囊腫纖化症 78655421 LPG10145 G>A 22148 CFTR 151
囊腫纖化症 78655421 LPG10141 G>A 22148 CFTR 152
家族性自主神經障礙 111033171 LPG10136 T>C 21124 ELP1 153
家族性自主神經障礙 111033171 LPG10138,LPG10139 T>C 21124 ELP1 154
家族性自主神經障礙 111033171 LPG10146 T>C 21124 ELP1 155
酪胺酸血症I型 80338901 LPG10134 G>A 26909 FAH 156
酪胺酸血症I型 80338901 LPG10136 G>A 26909 FAH 157
酪胺酸血症I型 80338901 LPG10138,LPG10139 G>A 26909 FAH 158
酪胺酸血症I型 80338901 LPG10145 G>A 26909 FAH 159
耳聾 80338945 LPG10134 T>C 32055 GJB2 160
聾症 80338945 LPG10136 T>C 32055 GJB2 161
聾症 80338945 LPG10138,LPG10139 T>C 32055 GJB2 162
聾症 80338945 LPG10145 T>C 32055 GJB2 163
聾症 80338945 LPG10146 T>C 32055 GJB2 164
聾症 80338945 LPG10150 T>C 32055 GJB2 165
聾症 80338945 LPG10159 T>C 32055 GJB2 166
聾症 104894396 LPG10138,LPG10139 G>A 32041 GJB2 167
聾症 104894396 LPG10145 G>A 32041 GJB2 168
聾症 104894396 LPG10160 G>A 32041 GJB2 169
聾症 104894396 LPG10141 G>A 32041 GJB2 170
包涵體肌病 28937594 LPG10134 T>C 21064 GNE 171
包涵體肌病 28937594 LPG10138,LPG10139 T>C 21064 GNE 172
包涵體肌病 28937594 LPG10145 T>C 21064 GNE 173
包涵體肌病 28937594 LPG10146 T>C 21064 GNE 174
包涵體肌病 28937594 LPG10141 T>C 21064 GNE 175
黏多糖病I型 121965019 LPG10134 G>A 26947 IDUA 176
黏多糖病I型 121965019 LPG10136 G>A 26947 IDUA 177
黏多糖病I型 121965019 LPG10138,LPG10139 G>A 26947 IDUA 178
黏多糖病I型 121965019 LPG10145 G>A 26947 IDUA 179
黏多糖病I型 121965019 LPG10150 G>A 26947 IDUA 180
黏多糖病I型 121965019 LPG10141 G>A 26947 IDUA 181
家族性高膽固醇血症 137929307 LPG10134 G>A 171217 LDLR 182
家族性高膽固醇血症 137929307 LPG10138,LPG10139 G>A 171217 LDLR 183
家族性高膽固醇血症 137929307 LPG10145 G>A 171217 LDLR 184
家族性高膽固醇血症 137929307 LPG10146 G>A 171217 LDLR 185
家族性高膽固醇血症 137929307 LPG10141 G>A 171217 LDLR 186
家族性地中海型發熱病 28940579 LPG10136 T>C 17579 MEFV 187
家族性地中海型發熱病 28940579 LPG10138,LPG10139 T>C 17579 MEFV 188
家族性地中海型發熱病 28940579 LPG10146 T>C 17579 MEFV 189
家族性地中海型發熱病 28940579 LPG10159 T>C 17579 MEFV 190
家族性地中海型發熱病 28940579 LPG10160 T>C 17579 MEFV 191
家族性地中海型發熱病 104895097 LPG10136 G>A 17588 MEFV 192
家族性地中海型發熱病 104895097 LPG10138,LPG10139 G>A 17588 MEFV 193
家族性地中海型發熱病 104895097 LPG10145 G>A 17588 MEFV 194
家族性地中海型發熱病 104895097 LPG10146 G>A 17588 MEFV 195
家族性地中海型發熱病 104895097 LPG10150 G>A 17588 MEFV 196
家族性地中海型發熱病 104895097 LPG10159 G>A 17588 MEFV 197
甲二羥戊酸尿症(Mevalonic aciduria) 28934897 LPG10136 G>A 26968 MVK 198
甲二羥戊酸尿症 28934897 LPG10138,LPG10139 G>A 26968 MVK 199
甲二羥戊酸尿症 28934897 LPG10146 G>A 26968 MVK 200
肥厚性心肌症 200411226 LPG10134 G>A 174776 MYBPC3 201
肥厚性心肌症 200411226 LPG10136 G>A 174776 MYBPC3 202
肥厚性心肌症 200411226 LPG10138,LPG10139 G>A 174776 MYBPC3 203
肥厚性心肌症 200411226 LPG10145 G>A 174776 MYBPC3 204
肥厚性心肌症 200411226 LPG10146 G>A 174776 MYBPC3 205
肥厚性心肌症 200411226 LPG10147 G>A 174776 MYBPC3 206
肥厚性心肌症 200411226 LPG10155 G>A 174776 MYBPC3 207
肥厚性心肌症 200411226 LPG10160 G>A 174776 MYBPC3 208
肥厚性心肌症 397516074 LPG10134 G>A 51962 MYBPC3 209
肥厚性心肌症 397516074 LPG10136 G>A 51962 MYBPC3 210
肥厚性心肌症 397516074 LPG10138,LPG10139 G>A 51962 MYBPC3 211
肥厚性心肌症 397516074 LPG10145 G>A 51962 MYBPC3 212
肥厚性心肌症 397516074 LPG10159 G>A 51962 MYBPC3 213
肥厚性心肌症 397516074 LPG10141 G>A 51962 MYBPC3 214
MYH7相關病症 3218716 LPG10134 G>A 52071 MYH7 215
MYH7相關病症 3218716 LPG10136 G>A 52071 MYH7 216
MYH7相關病症 3218716 LPG10138,LPG10139 G>A 52071 MYH7 217
MYH7相關病症 3218716 LPG10145 G>A 52071 MYH7 218
MYH7相關病症 3218716 LPG10150 G>A 52071 MYH7 219
MYH7相關病症 3218716 LPG10159 G>A 52071 MYH7 220
MYH7相關病症 3218716 LPG10141 G>A 52071 MYH7 221
MYH7相關病症 371898076 LPG10138,LPG10139 G>A 52045 MYH7 222
肥厚性心肌症 104894368 LPG10134 G>A 29104 MYL2 223
肥厚性心肌症 104894368 LPG10138,LPG10139 G>A 29104 MYL2 224
肥厚性心肌症 104894368 LPG10145 G>A 29104 MYL2 225
肥厚性心肌症 104894368 LPG10145 G>A 29104 MYL2 226
肥厚性心肌症 104894368 LPG10160 G>A 29104 MYL2 227
肥厚性心肌症 104894368 LPG10141 G>A 29104 MYL2 228
尼曼匹克症C1型 80358259 LPG10136 T>C 18006 NPC1 229
尼曼匹克症C1型 80358259 LPG10138,LPG10139 T>C 18006 NPC1 230
尼曼匹克症C1型 80358259 LPG10146 T>C 18006 NPC1 231
尼曼匹克症C1型 80358259 LPG10150 T>C 18006 NPC1 232
尼曼匹克症C1型 80358259 LPG10159 T>C 18006 NPC1 233
苯丙酮尿症 5030855 LPG10138,LPG10139 G>A 15646 PAH 234
苯丙酮尿症 5030855 LPG10146 G>A 15646 PAH 235
苯丙酮尿症 62508698 LPG10134 G>A 15619 PAH 236
苯丙酮尿症 62508698 LPG10136 G>A 15619 PAH 237
苯丙酮尿症 62508698 LPG10138,LPG10139 G>A 15619 PAH 238
苯丙酮尿症 62508698 LPG10145 G>A 15619 PAH 239
苯丙酮尿症 62508698 LPG10146 G>A 15619 PAH 240
苯丙酮尿症 62508698 LPG10150 G>A 15619 PAH 241
苯丙酮尿症 62516152 LPG10134 G>A 108520 PAH 242
苯丙酮尿症 62516152 LPG10138,LPG10139 G>A 108520 PAH 243
苯丙酮尿症 62516152 LPG10145 G>A 108520 PAH 244
苯丙酮尿症 62516152 LPG10146 G>A 108520 PAH 245
苯丙酮尿症 62516152 LPG10160 G>A 108520 PAH 246
苯丙酮尿症 62516152 LPG10141 G>A 108520 PAH 247
苯丙酮尿症 62644499 LPG10134 G>A 15656 PAH 248
苯丙酮尿症 62644499 LPG10136 G>A 15656 PAH 249
苯丙酮尿症 62644499 LPG10138,LPG10139 G>A 15656 PAH 250
苯丙酮尿症 62644499 LPG10145 G>A 15656 PAH 251
苯丙酮尿症 62644499 LPG10159 G>A 15656 PAH 252
齊威格氏症候群 61750420 LPG10134 G>A 22555 PEX1 253
齊威格氏症候群 61750420 LPG10136 G>A 22555 PEX1 254
齊威格氏症候群 61750420 LPG10138,LPG10139 G>A 22555 PEX1 255
齊威格氏症候群 61750420 LPG10145 G>A 22555 PEX1 256
齊威格氏症候群 61750420 LPG10146 G>A 22555 PEX1 257
齊威格氏症候群 61750420 LPG10150 G>A 22555 PEX1 258
齊威格氏症候群 61750420 LPG10141 G>A 22555 PEX1 259
免疫缺乏症14型 397518423 LPG10134 G>A 94255 PIK3CD 260
免疫缺乏症14型 397518423 LPG10136 G>A 94255 PIK3CD 261
免疫缺乏症14型 397518423 LPG10138,LPG10139 G>A 94255 PIK3CD 262
免疫缺乏症14型 397518423 LPG10145 G>A 94255 PIK3CD 263
免疫缺乏症14型 397518423 LPG10146 G>A 94255 PIK3CD 264
免疫缺乏症14型 397518423 LPG10150 G>A 94255 PIK3CD 265
免疫缺乏症14型 397518423 LPG10159 G>A 94255 PIK3CD 266
免疫缺乏症14型 397518423 LPG10141 G>A 94255 PIK3CD 267
POLG相關症 113994095 LPG10138,LPG10139 G>A 28535 POLG 268
POLG相關症 113994095 LPG10146 G>A 28535 POLG 269
POLG相關症 113994098 LPG10134 G>A 28541 POLG 270
POLG相關症 113994098 LPG10138,LPG10139 G>A 28541 POLG 271
POLG相關症 113994098 LPG10145 G>A 28541 POLG 272
POLG相關症 113994098 LPG10141 G>A 28541 POLG 273
心肌病 121908987 LPG10134 G>A 21885 PRKAG2 274
心肌病 121908987 LPG10136 G>A 21885 PRKAG2 275
心肌病 121908987 LPG10138,LPG10139 G>A 21885 PRKAG2 276
心肌病 121908987 LPG10145 G>A 21885 PRKAG2 277
心肌病 121908987 LPG10146 G>A 21885 PRKAG2 278
心肌病 121908987 LPG10159 G>A 21885 PRKAG2 279
心肌病 121908987 LPG10141 G>A 21885 PRKAG2 280
舒氏症候群(Shwachman syndrome) 113993993 LPG10136 T>C 18235 SBDS 281
舒氏症候群 113993993 LPG10138,LPG10139 T>C 18235 SBDS 282
布魯格達氏症候群(Brugada syndrome) 137854601 LPG10134 G>A 24416 SCN5A 283
布魯格達氏症候群 137854601 LPG10136 G>A 24416 SCN5A 284
布魯格達氏症候群 137854601 LPG10138,LPG10139 G>A 24416 SCN5A 285
布魯格達氏症候群 137854601 LPG10145 G>A 24416 SCN5A 286
布魯格達氏症候群 137854601 LPG10146 G>A 24416 SCN5A 287
布魯格達氏症候群 137854601 LPG10150 G>A 24416 SCN5A 288
α1-抗胰蛋白酶缺乏症 28929474 LPG10134 G>A 33006 SERPINA1 289
α1-抗胰蛋白酶缺乏症 28929474 LPG10136 G>A 33006 SERPINA1 290
α1-抗胰蛋白酶缺乏症 28929474 LPG10138,LPG10139 G>A 33006 SERPINA1 291
α1-抗胰蛋白酶缺乏症 28929474 LPG10138,LPG10139 G>A 33006 SERPINA1 292
α1-抗胰蛋白酶缺乏症 28929474 LPG10145 G>A 33006 SERPINA1 293
α1-抗胰蛋白酶缺乏症 28929474 LPG10141 G>A 33006 SERPINA1 294
黏多醣病,MPS-III-A 型(Mucopolysaccharidosis, MPS-III-A) 104894635 LPG10134 G>A 20146 SGSH 295
黏多醣症,MPS-III-A 型 104894635 LPG10138,LPG10139 G>A 20146 SGSH 296
黏多醣症,MPS-III-A 型 104894635 LPG10145 G>A 20146 SGSH 297
黏多醣症,MPS-III-A 型 104894635 LPG10141 G>A 20146 SGSH 298
結節性硬化症候群 28934872 LPG10134 G>A 27436 TSC2 299
結節性硬化症候群 28934872 LPG10138,LPG10139 G>A 27436 TSC2 300
結節性硬化症候群 28934872 LPG10145 G>A 27436 TSC2 301
結節性硬化症候群 28934872 LPG10141 G>A 27436 TSC2 302
澱粉生成性轉甲狀腺素蛋白澱粉樣變(Amyloidogenic transthyretin amyloidosis) 76992529 LPG10134 G>A 28465 TTR 303
澱粉生成性轉甲狀腺素蛋白澱粉樣變 76992529 LPG10138,LPG10139 G>A 28465 TTR 304
澱粉生成性轉甲狀腺素蛋白澱粉樣變 76992529 LPG10145 G>A 28465 TTR 305
澱粉生成性轉甲狀腺素蛋白澱粉樣變 76992529 LPG10150 G>A 28465 TTR 306
澱粉生成性轉甲狀腺素蛋白澱粉樣變 76992529 LPG10160 G>A 28465 TTR 307
澱粉生成性轉甲狀腺素蛋白澱粉樣變 76992529 LPG10141 G>A 28465 TTR 308
馮威裡氏病(Von Willebrand disease) 41276738 LPG10134 G>A 15335 VWF 309
馮威裡氏病 41276738 LPG10136 G>A 15335 VWF 310
馮威裡氏病 41276738 LPG10138,LPG10139 G>A 15335 VWF 311
馮威裡氏病 41276738 LPG10145 G>A 15335 VWF 312
馮威裡氏病 41276738 LPG10146 G>A 15335 VWF 313
馮威裡氏病 41276738 LPG10150 G>A 15335 VWF 314
馮威裡氏病 41276738 LPG10141 G>A 15335 VWF 330
範例 7 :賀勒氏症候群起因的 靶向突變
下面描述使用RNA引導的鹼基編輯系統對賀勒氏症候群(亦稱為MPS-1)的可能治療,RNA引導的鹼基編輯系統校正在患有賀勒氏症候群的大部分患者中造成賀勒氏症候群的突變。此方法採用RNA引導的且可以被包裝於單一AAV載體中以遞送至大範圍組織類型的鹼基編輯融合蛋白。根據確切的調控元素及所使用的鹼基編輯器域,亦可能設計出對鹼基編輯融合蛋白及單引導RNA二者編碼以靶向患病基因座的單一載體。 範例 7.1 :用理想的 PAM 鑑定 RGN
遺傳性疾病MPS-1為在分子層次上由溶體中硫酸乙醯肝素及硫酸皮膚素的累積表徵的溶體儲積症。此疾病通常是由編碼α-L-艾杜糖醛酸酶的IDUA基因(NCBI參考序列NG_008103.1)中的突變引起的遺傳性基因病症。該疾病是α-L-艾杜糖醛酸酶缺乏的結果。在北歐背景個體的研究中發現的最常見的IDUA突變為W402X及Q70X,每一個無意義突變導致轉譯的過早終止(Bunge等人 (1994), Hum. Mol. Genet, 3(6): 861-866,藉由引用併入本文)。單一核苷酸的反轉將恢復野生型編碼序列並導致由遺傳基因座的內源性調控機制控制的蛋白質表現。
人類Idua基因的W402X突變是大多數MPS-1H病例的原因。相對於引導RNA的前間隔序列組成的結合位點,鹼基編輯器可以靶向窄序列視窗,且因此PAM序列距標的基因座特定距離的存在對於策略的成功是必要的。假若存在在鹼基編輯蛋白質的相互作用期間標的突變必須位於暴露的非標的股(NTS)上且RGN域的足跡將阻擋進入PAM附近區域的限制,則認為可進入的基因座距PAM是10-30 bp。為了避免在此視窗中的其他鄰近腺苷鹼基的編輯及誘變,應篩選不同的連接子。理想視窗為距PAM 12-16 bp。
與LPG10134、LPG10136、LPG10139及LPG10145相容的PAM序列在遺傳基因座中是明顯的。這些核酸酶分別具有5’-nGG-3’ 的PAM序列(SEQ ID NO:73)、5’-nnnnCC-3’的PAM序列(SEQ ID NO:74)、5’-nnnnC-3’的PAM序列(SEQ ID NO:76)及5’-nnGG-3’的PAM序列(SEQ ID NO:78),且大小緻密-可能允許經由單一AAV載體遞送。相對於例如進入大範圍組織(肝臟、肌肉、CNS)的其他遞送方法,此遞送方法給予多種優勢及完善的安全性與製造技術。
來自化膿性鏈球菌的Cas9(SpyCas9)需要W402X基因座附近出現的NGG的PAM序列(SEQ ID NO:331),但SpyCas9的大小防止包裝至單一AAV載體中,且因此放棄此方法的上述優點。儘管可以採用雙遞送策略(例如,Ryu et al, (2018), Nat. Biotechnol., 36(6): 536-539,藉由引用併入本文),但這將顯著增加製造複雜性及成本。另外,由於給定細胞中的成功編輯需要與二個載體的感染以及在細胞中組裝融合蛋白,所以雙病毒載體遞送顯著降低基因校正的效率。
相對於SpyCas9,來自金黃色葡萄球菌的常用Cas9e異種同源物(SauCas9)的大小要小的多,但具有更複雜的PAM要求- NGRRT(SEQ ID NO:332)。此序列不在預期對致病基因座的鹼基編輯有用的範圍內。 範例 7.2 RGN 融合構築體及 sgRNA 序列
使用標準的分子生物學技術產生編碼具有以下域的融合蛋白的DNA序列:1)具有使DNA切割活性不活化(「無活性」或「切口酶」)的突變的RGN域;2)有用於鹼基編輯的腺嘌呤去胺酶。表7中描述的全部構築體都包括具有鹼基編輯活性域的融合蛋白,在此範例中為與無活性的RGN LPG10134、LPG10136、LPG10139或LPG10145的N端末端可操作地融合的LPG50148(SEQ ID NO:333)。亦可以使用有用於鹼基編輯DNA的其他腺嘌呤去胺酶(例如,參見國際公開號WO 2020/139873、2020年9月11日提出的第63/077,089號、2021年2月8日提出的第63/146,840號以及2021年3月22日提出的第63/164,273號的美國臨時申請案、以及2021年9月10日提出的第PCT/US2021049853號國際申請案,每一者以其整體藉由引用而被併入本文)。本領域中已知融合蛋白也可用RGN的C端末端處的鹼基編輯酵素製成。另外,融合蛋白的鹼基編輯器與RGN通常被連接子胺基酸序列分開。本領域中已知標準連接子的長度的範圍是15-30個胺基酸。 7 :用於 RNA 靶向的鹼基編輯的構築體
SEQ ID NO. 構築體 RGN 無活性( D )或切口酶( N 鹼基編輯器
334 SV40-LPG50148-連接子-d LPG10134 -連接子-Nuc LPG10134 D ADAT
335 SV40-LPG50148-連接子-d LPG10145 -連接子-Nuc LPG10145 D ADAT
336 SV40-LPG50148-連接子-d LPG10136 -連接子-Nuc LPG10136 D ADAT
337 SV40-LPG50148-連接子-d LPG10139 -連接子-Nuc LPG10139 D ADAT
RGN的可及編輯位點是由PAM序列確定。當RGN與鹼基編輯域結合時,由於NTS是單股的而RGN與基因座相關聯,所以用於編輯的標的殘基必須位於非標的股(NTS)上。評估若干核酸酶及對應引導RNA能夠為此特定基因座選擇最適當的基因編輯工具。可以被人類 Idua基因中的上述構築體靶向的幾個可能的PAM序列位於造成W402X突變的突變核苷酸附近。亦產生編碼引導RNA轉錄本的序列,引導RNA轉錄本包含1)與疾病基因座處的非編碼DNA股互補的「間隔體」;以及2)引導RNA與RGN關聯所需的RNA序列。例如,這樣的sgRNA可以分別是LPG10134、LPG10145、LPG10136及LPG10139的SEQ ID NO:338-341。可以對這些sgRNA分子及本領域中的通常知識者可想到的類似sgRNA就其在將上述鹼基編輯器導向所關注的基因座的效能進行評估。 範例 7.3 :針對來自賀勒氏病( Hurler disease )患者的細胞的活性的測定
為了驗證基因型策略及評估上述構築體,使用來自賀勒氏病患者的纖維母細胞。與範例4中描述的那些載體類似,設計了在融合蛋白編碼序列及sgRNA編碼序列的上游含有適當的啟動子的載體,用於在人類細胞中的表現這些序列。認識到,亦可以使用已知在人類細胞中有高量表現或在纖維母細胞中可以很好地專一性地表現的啟動子及其他DNA元素(例如,增強子或終止子)。使用標準技術,例如,與範例4中描述的轉染類似的轉染,將載體轉染至纖維母細胞中。替代地,可以使用電穿孔。將細胞培養1-3天。使用標準技術分離基因體DNA(gDNA)。如下進一步所述,藉由對經純化的gDNA進行qPCR基因分型測定及/或次世代定序以確定編輯效能。
Taqman™ qPCR分析採用對野生型及突變體對偶基因專一的探針。這些探針攜帶螢光體,使用qPCR儀器、藉由這些螢光體的光譜激發及/或發射特性來解析這些螢光體。含有PCR引子及探針的基因分型套組可以在市場上獲得(即,SNP ID rs121965019的Thermo Fisher Taqman™ SNP基因分型測定ID C__27862753_10)或設計。表8顯示所設計的引子及探針組的範例。 8 RT-PCR 引子及探針
描述 序列 SEQ ID NO.
正向擴增引子 5’-GACTCCTTCACCAAG-3’ 342
反向擴增引子 5’-GTAGATCAGCACCG-3’ 343
野生型探針 5’-CTCT G GGCCGAAGT-3’ 344
W402X探針 5’-CTCT A GGCCGAAGT-3’ 345
編輯實驗之後,使用標準方法及上面描述的引子及探針對gDNA進行qPCR分析。表9顯示預期結果。可以使用此體外系統方便地評估構築體以及選取具有高編輯效率的構築體用於進一步研究。與具有或不具有W402X突變的細胞及較佳地與對突變為異型接合的一些細胞進行比較來評估系統。使用例如Sybr綠色之類的染料,將Ct值與基因座的總擴增或參考基因進行比較。 9 :預期的 qPCR 結果
基因型 用鹼基編輯器轉染 預期的 PCR 結果
Idua WT/WT 同型接合的WT
Idua WT/W402X 異型接合的:50% WT、50% W402X
Idua W402X/W402X 同型接合的W402X
Idua W402X/W402X 可變
亦可以藉由次世代定序來分析組織。可以使用例如下面(表10)顯示的引子結合位點或可以由本領域中具有通常知識者鑑定的其他適合的引子結合位點。PCR擴增之後,按照Illumina 16S總基因體定序庫操作流程對含有Illumina Nextera XT突出序列的產物進行庫製備。深度定序在Illumina Mi-Seq平臺上進行。通常,每擴增子產生200,000個250 bp的配對末端讀數(2×100,000個讀數)。使用CRISPResso(Pinello等人, 2016)分析讀數以計算編輯率。手工整理輸出比對,以確認插入及缺失位點以及鑑定重組位點處的微同源位點。 10 NGS 引子結合位點
方向 序列 SEQ ID NO.
正向 5’-ACTTCCTCCAGCC-3’ 346
反向 5’-GAACCCCGGCTTA-3’ 347
使用抗IDUA抗體對被轉染細胞及對照組細胞的細胞裂解物進行西方墨點法,以驗證全長蛋白質的表現,並使用受質4-甲基傘形酮基α-L-艾杜糖醛酸苷(4-methylumbelliferyl a-L-iduronide)對細胞裂解物進行的酵素活性測定以驗證酵素是否有催化活性(Hopwood等人, Clin.Chim. Acta (1979), 92(2): 257-265,藉由引用併入本文)。這些實驗是與原始的Idua W402X/W402X細胞株(未轉染)、用鹼基編輯構築體及隨機的引導序列轉染的Idua W402X/W402X細胞株、以及表現野生型IDUA的細胞株比較而進行。 範例 7.4 :鼠類模型中的疾病治療確效
為了驗證此治療方法的功效,使用在同功胺基酸中具有無意義突變的小鼠模型。小鼠品系在其Idua基因(基因ID: 15932)中帶有W392X突變,W392X突變對應於賀勒氏症候群患者中的同源突變(Bunge等人, (1994), Hum. Mol. Genet. 3(6): 861-866,藉由引用併入本文)。此基因座包括相對於人類核苷酸序列的獨特核苷酸序列,該核苷酸序列缺少用前面的範例中描述的鹼基編輯器進行校正所需的PAM序列,且因此需要設計獨特的融合蛋白來進行核苷酸校正。此動物中的疾病的改善可以確認校正基因遞送載體可進入的組織中的突變的治療方法有效。
此突變同型接合的小鼠顯示出與賀勒氏症候群患者類似的多種表現型特徵。如上述的鹼基編輯RGN融合蛋白(表7)與RNG引導序列一起併入表現載體,表現載體允許在小鼠中的蛋白質表現及RNA轉錄。下表11顯示研究設計。研究包括用高劑量的包括鹼基編輯融合蛋白及RNA引導序列的表現載體治療的組、用低劑量的相同表現載體治療的組、以不包括鹼基編輯融合蛋白或引導RNA的表現載體治療的模型小鼠的對照組、以及以相同空載體治療的野生型小鼠的第二對照組。 11 :鼠類模型中的基因體編輯實驗
組別 小鼠品系 N 治療
1 Idua-W392X ≥ 5 低劑量載體
2 Idua-W392X ≥ 5 高劑量載體
3 Idua-W392X ≥ 5 載具
4 129/Sv(WT) 5 載具
評估的指標(endpoint)包括體重、尿液GAG排泄、血清IDUA酵素活性、所關注的組織中的IDUA活性、組織病理、為了驗證SNP的校正而對所關注組織的基因分型、以及行為及神經評估。由於一些指標是最終的,所以在研究結束之前,可以增加額外群組以用於評估例如組織病理及組織IDUA活性。指標的其他範例可以在建立賀勒氏症候群動物模型的已發表論文(Shull等人 (1994), Proc. Natl. Acad. Sci. U.S.A., 91(26): 12937-12941;Wang等人 (2010), Mol. Genet. Metab., 99(1): 62-71;Hartung等人 (2004), Mol. Ther., 9(6): 866-875;Liu等人 (2005), Mol. Ther., 11(1): 35-47;Clarke等人 (1997), Hum. Mol. Genet. 6(4): 503-511;全部藉由引用併入本文)中找到。
一種可能的遞送載體採用腺相關病毒(AAV)。產生載體以包括鹼基編輯器dRGN融合蛋白編碼序列(例如,Nuc-ADAT-連接子-dAPG19748-連接子-SV40,如上所述),其前面為CMV增強子(SEQ ID NO:328)及啟動子(SEQ ID NO:327)或其他適合的增強子及啟動子組合、可選地Kozak序列,且其於3’端處與終止子序列及聚腺苷酸化序列(例如Levitt, N.; Briggs, D.; Gil, A.; Proudfoot, N. J. Definition of an Efficient Synthetic Poly(A) Site. Genes Dev. 1989, 3 (7), 1019–1025中描述的最小序列)可操作地融合。載體可以進一步包括表現匣,表現匣對其5’端處可操作地連接至人類U6啟動子(SEQ ID NO:329)或適合產生小非編碼RNA的另一個啟動子的單一引導RNA進行編碼,且表現匣進一步包括包裝至AAV殻體中所必需以及本領域中眾所周知的反向末端重複(ITR)序列。藉由標準方法(例如,美國第9,587,250號專利中描述的那些方法,藉由引用併入本文)進行產生及病毒包裝。
其他可能的病毒載體包括腺病毒及慢病毒載體,它們是常用的且會含有類似元素、且具有不同的包裝能力及要求。也可使用非病毒遞送方法,例如,脂質奈米粒子包裹的mRNA及sgRNA(Cullis, P. R. and Allen, T. M. (2013), Adv. Drug Deliv. Rev. 65(1): 36-48;Finn等人 (2018), Cell Rep. 22(9): 2227-2235,二者均藉由引用併入)、流體動力注射的質體DNA(Suda T及Liu D, (2007) Mol. Ther. 15(12): 2063-2069,藉由引用併入本文)、或與金奈米粒子關聯的sgRNA的核糖核蛋白錯合物(Lee, K.; Conboy, M.; Park, H. M.; Jiang, F.; Kim, H. J.; Dewitt, M. A.; Mackley, V. A.; Chang, K.; Rao, A.; Skinner, C.;等人 Nanoparticle Delivery of Cas9 Ribonucleoprotein and Donor DNA in Vivo Induces Homology-Directed DNA Repair. Nat. Biomed. Eng. 2017, 1 (11), 889–90)。 範例 7.5 :具有人源化基因座的鼠類模型中的疾病校正
為了評估與用於人類治療的相同鹼基編輯器構築體的功效,需要一種小鼠模型,其中W392附近的核苷酸被改變以與人類的W402附近的序列匹配。這可以藉由各種技術實現,包括使用RGN及HDR模板切斷及取代小鼠胚胎中的基因座。
由於胺基酸的高度保留性,小鼠基因座中的大多數核苷酸可被改變至具有如表12所顯示的緘默突變的人類序列的核苷酸。導致所得的工程化小鼠基因體中編碼序列改變的唯一鹼基變化發生在引入的終止密碼子之後。 12 :產生人源化小鼠基因座的核苷酸突變
人類( W402X 小鼠( W392X 人源化小鼠
特徵 核苷酸( SEQ ID NO 548 編碼的 AA 核苷酸( SEQ ID NO 549 編碼的 AA 核苷酸( SEQ ID NO 550 編碼的 AA
前間隔序列 G E A G G G
G E G E G E
A A A
G A G
C Q C Q C Q
A A A
G A G
C L C L C L
T T T
C C C
T 終止 T 終止 T 終止
A A A
G G G
G A G A G A
C C C
C A C
G E G E G E
A A A
A G A
G V G V G V
T T T
G C G
T S T S T S
C C C
G A G
PAM ,非關鍵性 C Q A K C Q
A A A
G G G
G A G A G A
PAM ,非關鍵性 C C C
C T C
在工程化此小鼠品系後,將進行如範例7.4中描述的類似實驗。 範例 8 :靶向造成弗里德里希運動失調的突變
引起弗里德里希運動失調(FRDA)的三核苷酸重複序列的擴增發生在FXN基因內、被稱為FRDA不穩定性區域的確定的遺傳基因座中。RNA引導的核酸酶(RGN)可以用於切除FRDA患者細胞中的不穩定性區域。此方法需要1)RGN及引導RNA序列,其可被編程以靶向人類基因體中的對偶基因;以及2)RGN及引導序列的遞送方法。特別是當除了功能性表現匣所需的其他遺傳元素外還要考慮到引導RNA及SpCas9基因的長度時,用於基因體編輯的許多核酸酶(例如來自化膿性鏈球菌的常用Cas9核酸酶(SpyCas9))太大而無法被包裝於腺相關病毒(AAV)載體內。這使得不太可能存在使用SpCas9的可行方法。
本發明的緻密RNA(compact RNA)引導的核酸酶(例如,LPG10134、LPG10145、LPG10136及LPG10139)特別適合用於FRDA不穩定性區域的切除。LPG10134、LPG10145、LPG10136及LPG10139具有在FRDA不穩定性區域附近的PAM需求。另外,LPG10134、LPG10145、LPG10136及LPG10139可以與引導RNA一起包裝在AAV載體內。
表13顯示適合用於將LPG10134、LPG10145、LPG10136及LPG10139靶向FRDA不穩定性區域的5'及3'側的基因體標的序列的位置。一旦到達基因座,RGN將切除FA不穩定性區域。可以用基因座的Illumina定序來驗證區域的切除。 13 :用於 RGN 系統的基因體標的序列
RGN 相對於 FRDA 不穩定性區域的位置 基因體標的序列( SEQ ID NO.
LPG10134 5' 348
LPG10134 5' 349
LPG10134 3' 350
LPG10134 3' 351
LPG10145 5' 352
LPG10145 5' 353
LPG10145 3' 354
LPG10145 3' 355
LPG10136 5' 356
LPG10136 5' 357
LPG10136 3' 358
LPG10136 3' 359
LPG10139 5' 360
LPG10139 5' 361
LPG10139 3' 362
LPG10139 3' 363
範例 9 靶向造成鐮狀細胞疾病的突變
靶向BCL11A增強子區域內的序列(SEQ ID NO:364)可以提供用於增加胎兒血紅素(HbF)以治癒或減輕鐮狀細胞疾病的症狀的機制。例如,基因體廣泛關聯研究已經確認了與增加的HbF程度相關聯的BCL11A處的一組基因變異。這些變異是在BCL11A的非編碼區域中發現的SNP集合,這些非編碼區域用作階段專一性、譜系限制的增強子區域。進一步的研究顯示,在類紅血球中,此BCL11A增強子是BCL11A表現所必需的(Bauer等人, (2013) Science 343:253-257,藉由引用併入本文)。在BCL11A基因的內含子2內發現增強子區域、且識別在內含子2中的DNAseI高敏性的三個區域(通常表示與調節潛能相關聯的染色質狀態)。根據自BCL11A的轉錄起始位點的距離(以千鹼基為單位),將這三個區域確定為「+62」、「+58」以及「+55」。這些增強子區域的長度大約為350(+55);550(+58);以及350(+62)個核苷酸(Bauer等人,2013)。 範例 9.1 :確定較佳的 RGN 系統
在此描述使用RGN系統對β-血紅素病變的可能治療,RGN系統破壞BCL11A與其在HBB基因座內的結合位點的結合,HBB基因座是負責製造成人血紅素中的β-球蛋白的基因。此方法使用在哺乳動物細胞中更有效的NHEJ。此外,此方法使用可以被包裝於單一AAV載體中以用於體內遞送的足夠小尺寸的核酸酶。
人類BCL11A增強子區域(SEQ ID NO:364)中的GATA1增強子模體是用於使用RNA引導的核酸酶(RGN)的破壞以降低BCL11A表現且同時重新表現成人紅血球中的HbF的理想標的(Wu等人 (2019) Nat Med 387:2554)。與LPG10134、LPG10145、LPG10136及LPG10139相容的數個PAM序列在此GATA1位點周圍的遺傳基因座處是非常明顯的。這些核酸酶分別具有5’-nGG-3’(SEQ ID NO:73)、5’-nnGG-3(SEQ ID NO:78)’、5’-nnnnCC-3’(SEQ ID NO:74)及5’-nnnnC-3’(SEQ ID NO:76)的PAM序列、且大小緻密,可能地允許這些核酸酶在單一AAV或腺病毒載體中與適當的引導RNA一起遞送。相對於其他方法,這種遞送方法具有多種優勢,例如,進入造血幹細胞以及完善的安全性及製造技術。
來自化膿性鏈球菌的常用Cas9核酸酶(SpyCas9)需要5’-NGG-3’的PAM序列(SEQ ID NO:331),其中的一些存在於GATA1模體附近。然而,SpyCas9的大小妨礙包裝至單一AAV或腺病毒載體中、並因此放棄此方法的上述優點。儘管可以採用雙遞送策略,但這樣會增加顯著的製造複雜性及成本。另外,由於給定細胞中的成功編輯需要用二個載體來感染,雙病毒載體遞送明顯降低基因校正的效率。
產生編碼人類密碼子最佳化的LPG10134、LPG10145、LPG10136或LPG10139的表現匣,類似於範例4中描述的那些。亦產生針對RGN LPG10134、LPG10145、LPG10136及LPG10139的表現引導RNA的表現匣。這些引導RNA包括:1)前間隔序列,其與BCL11A增強子基因座(標的序列)內的非編碼DNA股或編碼DNA股互補;以及2)引導RNA與RGN相關聯所需的RNA序列。因為用於藉由LPG10134、LPG10145、LPG10136及LPG10139靶向的數個可能的PAM序列圍繞BCL11A GATA1增強子模體,所以產生了數個可能的引導RNA構築體,以確定產生BCL11A GATA1增強子序列的NHEJ介導的破壞以及強健切割的最佳前間隔序列。評估表14中的標的基因體序列以將RGN引導至此基因座。 14 :使用 LPG10134 LPG10145 LPG10136 LPG10139 BCL11A GATA1 增強子基因座的標的序列
引導 RGN 標的基因體序列( SEQ ID NO.
1 LPG10134 365
2 LPG10134 366
3 LPG10134 367
4 LPG10145 368
5 LPG10145 369
6 LPG10145 370
7 LPG10136 371
8 LPG10136 372
9 LPG10136 373
10 LPG10139 374
11 LPG10139 375
12 LPG10139 376
為了評估LPG10134、LPG10145、LPG10136或LPG10139產生破壞BCL11A增強子區域的插入或缺失的效率,使用人類細胞株,例如,人類胚胎腎細胞(HEK細胞)。產生包括RGN表現匣的DNA載體(例如,如範例4中所描述的)。亦產生包括表現匣的單獨載體,表現匣包括引導RNA序列的編碼序列。如範例4中所描述的,這種表現匣可以進一步包括人類RNA聚合酶III U6啟動子(SEQ ID NO:329)。替代的,可以使用包括RGN及引導RNA二者的表現匣的單一載體。使用標準技術(例如,範例4中所描述的那些技術)將載體引入HEK細胞中,並將細胞培養1-3天。在此培養期後,分離基因體DNA,並使用T7核酸內切酶I分解及/或直接DNA定序來確定插入或缺失頻率,如範例4中所描述的。
用含有Illumina Nextera XT突出序列的引子,藉由PCR來擴增包含標的BCL11A區域的DNA的區域。使用T7核酸內切酶I分解以針對NHEJ形成來檢查這些PCR擴增子,或這些PCR擴增子按照Illumina 16S總基因體定序庫操作流程或類似的次世代定序(NGS)庫製備進行庫製備。在深度定序後,藉由CRISPResso分析產生的讀數以計算編輯率。手工整理輸出比對,以確認插入及缺失位點。此分析鑑定出較佳RGN及對應的較佳引導RNA(sgRNA)。分析可以得出的結果是LPG10134、LPG10145、LPG10136及LPG10139中的任一者是同樣較佳的。另外,分析可以確定有一個以上的較佳引導RNA,或者表14中的所有標的基因體序列是同樣較佳的。 範例 9.2 :胎 兒血紅素表現的測定
在此範例中,針對胎兒血紅素的表現,測定破壞BCL11A增強子區域的、LPG10134、LPG10145、LPG10136或LPG10139產生的插入或缺失。使用健康人類供體CD34 +造血幹細胞(HSC)。培養這些HSC,並使用與範例8.1中描述的方法類似的方法,引入包括表現匣的一或多個載體,表現匣包括較佳RGN及較佳sgRNA的編碼區域。在電穿孔後,使用已建立的操作流程(例如,Giarratana等人 (2004) Nat Biotechnology 23:69-74,藉由引用併入本文中)將這些細胞在體外分化為紅血球。然後,使用西方墨點法以抗人類HbF抗體來測量HbF的表現,或經由高效液相層析法(HPLC)定量HbF的表現。當與用僅有RGN但沒有引導進行電穿孔的HSC相較時,預期BCL11A增強子基因座的成功破壞將引起HbF產量增加。 範例 9.3 :鐮狀細胞形成減少的測定
在此範例中,為了降低的鐮狀細胞形成,測定LPG10134、LPG10145、LPG10136或LPG10139產生的插入或缺失,其破壞BCL11A增強子區域。使用來自患有鐮狀細胞疾病的患者的供體CD34 +造血幹細胞(HSC)。培養這些HSC,並使用與範例8.1中描述的方法類似的方法引入包括表現匣的一個或多個載體,表現匣包括較佳RGN及較佳sgRNA的編碼區域。在電穿孔後,使用已建立的操作流程(Giarratana等人 (2004) Nat Biotechnology 23:69-74)將這些細胞在體外分化成紅血球。然後,使用西方墨點法以抗人類HbF抗體來測量HbF的表現,或經由高效液相層析法(HPLC)定量HbF的表現。當與用僅有RGN但沒有引導進行電穿孔的HSC相較時,預期BCL11A增強子基因座的成功破壞將引起HbF產量增加。
藉由加入焦亞硫酸鹽(metabisulfite),在這些分化的紅血球中誘導鐮狀細胞形成。使用顯微鏡對鐮狀紅血球與正常紅血球的數量進行計數。預期用LPG10134、LPG10145、LPG10136或LPG10139加sgRNA處理的細胞中的鐮狀細胞的數量少於在未經處理或僅用RGN處理的細胞的數量。 範例 9.4 :鼠類模型中的疾病治療確認
為了評估使用LPG10134、LPG10145、LPG10136或LPG10139破壞BCL11A基因座的功效,使用適合的鐮狀細胞貧血的人源化小鼠模型。將對較佳RGN及較佳sgRNA編碼的表現匣包裝於AAV載體或腺病毒載體中。尤其是,腺病毒Ad5/35型是有效靶向HSC。選擇含有具有鐮狀細胞對偶基因的人源化HBB基因座的適合的小鼠模型,例如,B6;FVB-Tg(LCR-HBA2、LCR-HBB*E26K)53Hhb/J或B6.Cg- Hbatm1Paz Hbbtm1TowTg(HBA-HBBs)41Paz/HhbJ。單獨用顆粒性白血球聚落刺激因子(granulocyte colony-stimulating factor)或與普樂沙福(plerixafor)組合處理這些小鼠,以使HSC進入循環。然後,靜脈注射攜帶RGN及引導質體的AAV或腺病毒,並使小鼠恢復一週。在體外鐮狀化測定(sickling assay)中使用焦亞硫酸鹽測試從這些小鼠獲得的血液,並縱向追蹤小鼠,以監測死亡率及造血功能。當與用缺少二者表現匣的病毒或用僅攜帶RGN表現匣的病毒處理的小鼠相較時,預期用攜帶RGN及引導RNA的AAV或腺病毒的處理將降低鐮狀化、死亡率且改善造血功能。 範例 10 :蛋白質純化及生化測試
目前揭露的RGN針對標的序列的體外切割而進行表現、純化及測試。隨後針對LPG10145使用體外切割測定確定切割位點。 範例 10.1 RNA 引導的核酸酶的重組表現與純化、及生化切割測定
合成含有細菌密碼子最佳化的、HIS標記的RGN編碼序列的質體,並將其選殖至pET-29b(+)載體骨架中。使用熱休克以用One Shot™ BL21 Star™ (DE3)化學感受態大腸桿菌(One Shot™ BL21 Star™ (DE3) Chemically Competent E. coli)細胞進行RGN細菌表現質體的轉化。使用補充有50 µg/mL康黴素的MagicMedia™大腸桿菌表現培養基(Invitrogen)以 0.5 L 規模表現 RGN。以菌酛(starter culture)接種後,將表現培養物在30°C下以300 rpm振盪培養5小時,然後降至18°C再培養24小時。然後藉由離心收穫細胞並冷凍於-80°C。將來自表現培養物的細胞沉澱在室溫下解凍、再懸浮於裂解緩衝液中、均質化,然後用EmulsiFlex-C3細胞破壞劑(Avestin)裂解。然後使用高速離心使粗裂解物溶液澄清。然後使用ÄKTA Pure25快速蛋白質液相層析系統(Cytiva)使用固定化金屬親和層析法(IMAC)純化澄清的裂解物。使用陽離子交換層析法進一步純化LPG10136、LPG10138及LPG10139。然後將純化的RGN蛋白質濃縮並交換至含有20 mM磷酸鈉、300 mM氯化鈉、1 mM DTT、pH 7.4及20%甘油的製劑緩衝液中、然後使用液態氮快速冷凍。使用十二烷基硫酸鈉聚丙烯醯胺凝膠電泳(SDS-PAGE)確定純化的RGN的純度。
核糖核蛋白錯合物(包含核酸酶及sgRNA)是藉由在室溫下將核酸酶及 RNA 在緩衝溶液中培養20分鐘而形成的。將錯合物轉移至含有消化緩衝液及PCR擴增標的的試管,其3'端直接連接至每一個RGN的對應PAM序列。將作為核糖核蛋白錯合物的每一個RGN與其各自的標的(庫1或庫2;分別為 SEQ ID NO:459及460)多核苷酸在37°C下培養120分鐘。使用乙烯二胺四乙酸(EDTA)淬滅消化反應、並使用片段分析來分析以定量切割產物。
目前揭露的十二個RGN中的十個是從大腸桿菌中可溶地表現及分離的。重組表現及後續純化的產量根據RGN的特性有很大差異,範圍從幾毫克到超過一百毫克。當針對兩個不同的標的序列及幾個相容的PAM上下序列進行測試時,在成功表現及純化的十個RGN蛋白質中的八個在生化DNA切割測定中具有活性。在這些使用純化蛋白進行的體外檢測中的不活動性可能是由於這些特定表現、純化及/或切割條件特有的幾個因素造成的、且非必需地反映RGN在其他條件下或體內環境中的活性。 15 dsDNA 的純化純度及體外切割
RGN​ 分離的產量 mg/L 菌種 純度 % 觀察到的最大標的股 切割( %
LPG10134​ 15​ 78​ 0​
LPG10136​ 34 (14) 66​ 31​
LPG10138​ 67 (6) 75​ 18​
LPG10139​ 79 (36) 75​ 7​
LPG10141​ 0​ n/a​ n/a​
LPG10145​ 148​ 90​ 100​
LPG10146​ 127​ 87​ 58​
LPG10147​ 0​ n/a​ n/a​
LPG10150​ 148​ 70​ 32​
LPG10155​ 15​ 77​ 33​
LPG10159​ 62​ 83​ 2.6​
LPG10160​ 3​ 35​ 0​
來自IMAC 純化的分離的產量 (來自 CEX 的分離的產量) 16 :體外切割及完美標的切割的序列
RGN ID 標的序列 PAM 上下序列 PAM SEQ ID NO 標的股的切割( % 非標的股的切割( %
LPG10134 庫1 AGGACCTC 461 0 0
LPG10134 庫1 AGGAATTC 462 0 0
LPG10134 庫1 AGGAAAGC 463 0 0
LPG10134 庫2 AGGACCTC 461 0 0
LPG10134 庫2 AGGAATTC 462 0 0
LPG10134 庫2 AGGAAAGC 463 0 0
LPG10136 庫1 AGGACCTC 461 5.0 3.3
LPG10136 庫1 AGGACTTC 464 0 0
LPG10136 庫2 AGGACCTC 461 30.9 19.7
LPG10136 庫2 AGGACTTC 464 11.3 7.5
LPG10138 庫1 AGGACCTC 461 1.4 0.5
LPG10138 庫1 AGGAATTC 462 0 0
LPG10138 庫1 AGGACTTC 464 5.5 3.7
LPG10138 庫2 AGGACCTC 461 4.7 1.5
LPG10138 庫2 AGGAATTC 462 0 0
LPG10138 庫2 AGGACTTC 464 18.0 9.4
LPG10139 庫1 AGGACCTC 461 4.4 2.4
LPG10139 庫2 AGGACCTC 461 7.3 4.5
LPG10145 庫1 ACGGATTC 465 92.9 95.3
LPG10145 庫2 ACGGATTC 465 100 100
LPG10146 庫1 AGGAAACC 466 3.9 2.8
LPG10146 庫1 GGATAACC 467 0 0
LPG10146 庫1 GAGTAACC 468 1.5 1.0
LPG10146 庫1 CAATAACC 469 0 0
LPG10146 庫2 AGGAAACC 466 48.9 48.6
LPG10146 庫2 GGATAACC 467 39.7 27.2
LPG10146 庫2 GAGTAACC 468 57.7 48.2
LPG10146 庫2 CAATAACC 469 32.7 25.9
LPG10150 庫1 AGGACCTC 461 1.4 0.9
LPG10150 庫1 AGGACTTC 464 2.3 1.7
LPG10150 庫2 AGGACCTC 461 25.1 16.5
LPG10150 庫2 AGGACTTC 464 31.8 26.1
LPG10155 庫1 AGAAATTC 470 32.7 20.1
LPG10155 庫2 AGAAATTC 470 7.6 3.5
LPG10159 庫2 AGAAATTC 470 2.5 1.2
LPG10160 庫1 AAATATTC 471 0 0
LPG10160 庫2 AAATATTC 471 0 0
範例 10.2 體外切割位點確定
使用 RNP(核糖核蛋白)及適當的質體受質確定切割位點。編碼融合至His10 N端標籤的RGN的大腸桿菌表現質體被構築並轉化至BL21 (DE3) Star大腸桿菌(Invitrogen)中以用於蛋白質表現。RGN表現是使用自動感應MagicMedia(Thermo)進行的。裂解及澄清後,以包括固定化金屬親和層析法、陽離子交換層析法及陰離子交換層析法的三步純化法純化蛋白質。藉由將RGN及其RNA引導(庫1的SEQ ID NO:473及庫2的SEQ ID NO:474)在緩衝溶液中在室溫下培養15分鐘以形成RNP錯合物。
切割反應包括RNP、消化緩衝液及質體標的。質體標的(SEQ ID NO:472)序列包含兩個標的核苷酸序列,兩個標的核苷酸序列被描述為庫1及庫2(分別為 SEQ ID NO:459及SEQ ID NO:460),位於RGN PAM序列的-5'。切割反應在37°C下培養90分鐘,產生切割產物。經由瓊脂糖凝膠電泳顯現切割產物。使用不選擇大小的磁珠DNA純化方法清理總切割反應,且在每次酵素反應後重複此清理。清理後的DNA用T4 DNA聚合酶(NEB)進行末端修復、並使用克列諾夫片段(Klenow fragment)(3'-5' exo-)(NEB)進行A尾處理。藉由以等莫耳量混合、加熱至95 °C及緩慢冷卻至室溫來黏合銜接子寡核苷酸(SEQ ID NO:475及476)。使用T4 DNA接合酶結合T4多核苷酸激酶將銜接子黏合至A尾切割產物。將最後清洗的接合產物作為PCR模板。
使用與銜接子序列及預期切割位點上游及下游的質體骨架互補的適當的引子對進行PCR以擴增銜接子接合的切割產物。具體而言,PCR反應包括2x Ultra II Q5 Master Mix(NEB),其具有50-100 ng模板DNA及每個引子0.5 µM。PCR循環條件如下:98°C進行1分鐘、接著30個循環的98°C進行10秒、62°C進行10秒、72°C進行10秒、接著最後一步是72°C進行1分鐘、永遠保持在 10°C。PCR產物藉由瓊脂糖凝膠電泳顯現,且序列藉由桑格定序(Sanger sequencing)驗證。
如果桑格序列中沒有序列缺少或重複,則切割位點確定為平端。 如果切割位點有5'-突出,則突出序列會存在於兩個定序的PCR產物中。相對於未切割的質體受質,3'-突出會產生兩個PCR產物中消失的序列。
確定LPG10145在相對於PAM的+3位置具有切割位點,即,在PAM序列上游(5')的第三個及第四個核苷酸之間引入平端切割。 範例 11 RNP mRNA 遞送至 PBMC
為了確定RGN是否能夠以不同形式遞送,用外周血單核細胞(PBMC)測試RNP核轉染遞送。解凍PBMC,使用CD3/CD28磁珠(ThermoFisher)活化PBMC 3天,然後使用Lonza 4D-Nucleofector X單元及Nucleocuvette條核轉染PBMC。P3初代細胞套組用於mRNA及RNP遞送。分別使用EO-115及EH-115程式轉染細胞以進行mRNA及RNP遞送。細胞在核轉染後在含有IL-2、IL-7及IL-15(Miltenyi Biotec)的CTS OpTimizer T細胞擴增培養基(ThermoFisher)中培養 4 天,然後使用Nucleospin Tissue基因體DNA分離套組(Macery Nagel)收穫細胞。
為了確定編輯效率,將核轉染的PBMC與適當的螢光體接合的抗體一起培養,接著進行流式細胞分析技術或NGS。流式細胞分析技術的編輯效率以所關注的基因的剔除百分比進行報告。包括未經編輯的對照以確保染色效率是完整的。藉由PCR產生編輯位點周圍的擴增子,並按照範例4中的方法使用Illumina Nextera平臺且使用2x250bp雙側定序進行NGS定序。
使用LPG10136的RNP遞送,形成RNP以測試10種不同的引導(參見圖2及表17)。經由流式細胞分析技術藉由蛋白質剔除測量,在測試的 9 個引導中,只有一個引導SGN002661顯示高量的編輯。藉由流式細胞分析技術測量,SGN002661顯示超過75%蛋白質剔除。 17 :用於 LPG10136 RNP 遞送的 sgRNA
sgRNA 名稱 sgRNA 標的序列 SEQ ID NO
SGN002654 505
SGN002655 506
SGN002656 507
SGN002657 508
SGN002658 509
SGN002659 510
SGN002660 511
SGN002661 512
SGN002662 513
SGN002663 514
範例 11.1 標的長度的最佳化
為了在PBMC中遞送LPG10145作為核糖核蛋白(RNP:RNA 引導的核酸酶與單引導RNA錯合),使用核轉染,這是基於電穿孔的方法,使DNA、RNA及/或蛋白質轉移進入細胞核。由於TRAC及B2M基因的臨床相關性且因為這些基因控制細胞表面蛋白(其提供利用基於高通量流式細胞分析技術的分析的便利),TRAC及B2M基因成為標的。對於這個實驗,間隔序列的長度從25個核苷酸縮短至20個核苷酸,以確定間隔子長度對兩個所關注的標的的編輯效率的影響。將分離的外周血單核細胞(PBMC)解凍、以CD3/CD28磁珠活化、並在 37°C及5% CO 2下培養。3天後,將磁珠從細胞中移除。然後經由離心濃縮細胞並再懸浮於核轉染緩衝液(P3 Solution Lonza)中,使每個反應可使用 1x10^6 個細胞。在添加PBMC之前,RNP(60 pmol RGN及120 pmol引導)在室溫下培養至少10分鐘。根據製造商的用法說明,使用程式EH-115(Lonza)對細胞+LPG10145+sgRNA反應進行核轉染。核轉染後,細胞靜置10分鐘,接著在培養基中培養1-4天。為了確定編輯效率,將核轉染的細胞與適當的螢光體接合的抗體一起培養,接著進行流式細胞分析技術。依照所關注的基因的剔除百分比報告編輯效率。包括未經編輯的對照以確保染色效率是完整的。
此外,藉由LPG10145的mRNA遞送確認間隔子長度最佳化,同時使用靶向TRAC及B2M的相同引導將間隔子的長度從27個核苷酸擴展至17個核苷酸。為了以mRNA形式遞送LPG10145,將2 µg LPG10145 mRNA及4 µg sgRNA與每個反應3.0x10^4個細胞一起再懸浮於核轉染緩衝液(P3 溶液)中。將細胞添加至反應中、並根據製造商的使用說明使用程式EO-115(Lonza)進行核轉染。核轉染後,將細胞轉移至培養容器中並在培養基中培養4天。如上述藉由流式細胞分析技術評估編輯效率。 18 LPG10145 RNP 遞送至細胞測試標的長度對編輯的影響
核酸酶 SGN​ 間隔序列 標的 SEQ ID NO 藉由流式細胞分析技術的編輯率 (重複 #1 藉由流式細胞分析技術的編輯率 (重複 #2 藉由流式細胞分析技術的編輯率 (重複 #3
​​無 未經編輯的對照       10.3 18.1   
LPG10145​​ SGN002702 25 516 77.1 68.8 80.7
SGN005121 24 491 90.01 89.3 76.2
SGN005122 23 492 88.9 90 87.4
SGN005123 22 493 90.1 91.38 85.2
SGN005124 21 494 92.61 91.26 85.5
SGN003018​​ 20 481 83.2 83.6 55.2
LPG10145​​ SGN002707​​ 25 517 50.4 53 20.6
SGN005117 24 487 50.1 52.5 19.9
SGN005118 23 488 50.5 58 22.8
SGN005119 22 489 NT NT 21.7
SGN005120 21 490 NT NT 19.2
SGN003023 20 486 57.3 51.5 15.7
NT:未測試 19 LPG10145 RNP 遞送至細胞測試標的長度對編輯的影響
核酸酶 SGN 間隔序列 標的 SEQ ID NO 藉由流式細胞分析技術的編輯率 (重複 #1 藉由流式細胞分析技術的編輯率 (重複 #2
未經編輯的       1.1 .8
LPG10145 SGN007076 17 495 1.1 1.3
SGN007077 18 496 1.1 1.3
SGN007078 19 497 18.1 22.8
SGN003018 20 481 84.8 91.0
SGN005124 21 494 94.1 89.5
SGN005123 22 493 93.58 94.72
SGN005122 23 492 93.61 92.61
SGN005121 24 491 91.85 95.83
SGN002702 25 557 93.40 94.81
SGN007079 26 498 86.8 89.7
SGN007080 27 499 82.3 87.2
未經編輯的       1.4 .8
LPG10145 SGN007081 17 500 1.3 1.6
SGN007082 18 501 1.3 1.9
SGN007083 19 502 23.7 27.7
SGN003023 20 486 51.4 56.8
SGN005120 21 490 55.0 58.4
SGN005119 22 489 56.7 61.6
SGN005118 23 488 69.8 73.7
SGN005117 24 487 69.7 58.9
SGN002707 25 558 55.1 56.9
SGN007084 26 503 56.1 63.8
SGN007085 27 504 49.1 57.7
分析
使用 RNP 遞送並測試20至25個核苷酸的間隔子長度,所有間隔子長度都證明對每個標的的相似量的編輯。雖然很小,但最好的編輯是在間隔子長度為21-24個核苷酸的情況下看到的。因為20-25個核苷酸之間的編輯存在微小差異,因此針對每個標的測試的間隔子長度被擴展並以mRNA進行測試。這些資料證實RNP資料,並幫助確定最高編輯是在使用21-24個核苷酸之間的間隔子長度時。 範例 11.2 RNP 劑量依賴性
為了了解增加RGN濃度是否可以有效地改善編輯,在PBMC細胞編輯實驗中提供不同濃度的RNP。測試的RNP濃度為60 pmole、90 pmole及120 pmole,蛋白質:RNA比例為 1:2。結果顯示,使用工作gRNA,可以用更高量的RGN提高所需標的的編輯率(參見表20及圖3A與圖3B)。 20 :用於 RNP 劑量依賴性實驗的 sgRNA
SGN 名稱 SGN 標的序列 SEQ ID NO
SGN002699 515
SGN003014 477
SGN003015 478
SGN003016 479
SGN003017 480
SGN003018 481
SGN002707 517
SGN003019 482
SGN003020 483
SGN003021 484
SGN003022 485
SGN003023 486
範例 12 :脫靶分析
為了評估核酸酶的專一性,在經由生物資訊學鑑定的可能位點處確定脫靶編輯。藉由具有標的序列中的少於五個錯誤配對及PAM序列中的至少一個殘基匹配的標的來鑑定LPG10145的可能脫靶位點。
使用與範例11.1中描述的將RNP遞送至哺乳動物細胞及擴增子定序相同的那些方法來測試LPG10145的專一性及脫靶編輯。在對SGN003017及SGN003023具有高編輯率的樣本中,測定表21中的可能的脫靶位置以進行可能的編輯。表 22 中的引子用於擴增與在標的位點具有序列相似性的可能脫靶位點以尋找脫靶編輯。 21 :測定脫靶序列
SGN 脫靶號碼 脫靶序列 SEQ ID
SGN003017 3017-1 TGTCCACGGAGCGAGACAGGGAGG 518
SGN003023 3023-1 ATAGGCAGACAAACTTGTATAGG 519
SGN003023 3023-2 ATAGGCAGACAGACTTGCAGAGG 520
SGN003023 3023-3 ACAGGCAGACAGATTTGTCAGAGG 521
SGN003023 3023-4 AAAGGCAGACAGACATGTCAGTGG 522
SGN003023 3023-5 CTAGGCAGACAGACTTCCTTCCTAGG 523
SGN003023 3023-6 ATGGGGCAGACAGACTTGTCACAGG 524
SGN003023 3023-7 ACAGGCAGACAGACTTGCATTTGG 525
SGN003023 3023-8 ATAGGCAGACAGACTTGTTAGAAG 526
SGN003023 3023-9 ATAGGTAGACAGACTTGTCAGTGA 527
22 用於擴增脫靶區域的引子
敘述 引子序列 SEQ ID
3017-1 FWD TCTTCGCCTGTGATCTCTGA 528
3023-1 FWD GCTAGTTCCAGCTGCCTAGG 530
3023-2 FWD TGAGCCCTTCTTCTGTGCTG 532
3023-3 FWD AGTGCTAGAGTGATGTGGGA 534
3023-4 FWD ATCTCCCTCAGTCCAGTCCC 536
3023-5 FWD CCAGAACATCAGCAGCAAGC 538
3023-6 FWD AAGGTGGGACTCACTCTGAA 540
3023-7 FWD CCCTCAGCTCTGACTCCTCT 542
3023-8 FWD CCTGTCAAGGGAGTGTTTCT 544
3023-9 FWD ATGCTCCGCTCCTTGATCTG 546
3017-1 REV TTGGATGGGATGTCCTGAGG 529
3023-1 REV CAGTGCGTTTCTCTGGTCCT 531
3023-2 REV CCTCCAGATCCCCACTACCA 533
3023-3 REV AGGTCACCTTTGTTGCCATC 535
3023-4 REV CCATCTCATCCAGTGCCCTC 537
3023-5 REV CCTGGGTCACTTCCTGTCAC 539
3023-6 REV ATTTTACTCAAGGCCCAGGC 541
3023-7 REV TGAACTCAGGACCACATGGC 543
3023-8 REV ATCCTTGCAATCCTCTGAAA 545
3023-9 REV TCATTCCCTCCCCACTTTCTC 547
使用RNP遞送,在所測試的二個引導處不存在可檢測的脫靶編輯。二個脫靶位點顯示低量的背景插入缺失,這也出現在來自未經編輯的對照細胞的擴增子中。這些脫靶位置為3023-5及3023-9;在表23中以星號表示。 23 SGN003017 SGN003023 的脫靶編輯
遞送 引導 在靶( On-Target )效率 脫靶位點 脫靶編輯
RNP​ SGN003017 - B2M​ 59%​ 1​ 0%​
RNP​ SGN003023 - TRAC​ 54%​ 1​ 0%​
2​ 0%​
3​ 0%​
4​ 0.11%​
5​ 0.07%*​
6​ 0.49%​
7​ 0%​
8​ 0%​
9​ 0.14*​
範例 13 LPG10145 的甘胺酸掃描 甘胺酸突變及插入的確定
LPG10145的蛋白質序列經由DynaMine網路伺服器運行,其為每一個殘基提供S2預測分數,估計殘基骨架的僵硬性及柔韌性。分數範圍從 1(僵硬的)到0(高度動態的)。除非附近的殘基是富含甘胺酸的區域(定義為彼此相鄰的兩個甘胺酸),分數< 0.72的殘基突變為甘胺酸。甘胺酸的插入位點被選為分數高於0.72但低於0.75的柔韌區域,且與甘胺酸相鄰。這些插入位點亦被映射至LPG10145同源模型上,以檢查它們是否被預測位於柔韌區域中。 ​ 篩選哺乳動物細胞中 LPG10145 甘胺酸突變體的活性
使用兩種不同的引導(SGN003014及SGN003018),比較甘胺酸突變體與親代LPG10145在編輯HEK293T細胞中β-2-微球蛋白(B2M)的外顯子1的能力。選擇這些引導是因為它們用親代LPG10145進行中至低量的編輯,且這些引導是在飽和(最佳的)編輯條件及非飽和(次佳的)條件下進行測試。使用前一天以10,000個細胞接種的細胞的Lipofectamine 3000、及使用編碼LPG10145或LPG10145變異體的質體160 ng與引導編碼的質體40 ng,以質體脂質體轉染進行最佳編輯條件。使用編碼LPG10145或LPG10145變異體的質體DNA 40 ng與引導編碼的質體40 ng,以前一天以10,000個細胞接種的細胞的質體脂質體轉染進行次佳編輯條件。細胞在 37°C及5% CO 2下培養2天,萃取基因體DNA,藉由PCR擴增標的區域並進行NGS定序。 24 LPG10145 甘胺酸突變體的活性
標準化至 WT 的編輯( WT = 1 編輯 %
LPG10145 構築體 SGN003014 SGN003018 SGN003014 SGN003018
pLEM145v3.1 1 1 48.1* 47.99*
S44G 0.417464 0.760913 20.08 36.52
S46G 0.533056 0.715908 25.64 34.36
A47G 0.582952 0.86384 28.04 41.46
S48G 0.470686 0.784665 22.64 37.66
R49G 0.427651 0.663611 20.57 31.85
N50G 0.486071 0.823627 23.38 39.53
E51G 0.437006 0.816543 21.02 39.19
E52G 0.497089 0.779039 23.91 37.39
F82G 0.356133 0.97531 17.13 46.81
P83G 0.588773 0.879675 28.32 42.22
F84G 0.363825 0.711741 17.5 34.16
P85G 0.530977 0.590895 25.54 28.36
N87G 0.512266 0.661527 24.64 31.75
T88G 0.848233 1.050526 40.8 50.42
A90G 0.809979 1.05636 38.96 50.7
N91G 0.613929 0.94864 29.53 45.53
S133G 0.728067 0.943223 35.02 45.27
N138G 0.59106 0.89926 28.43 43.16
L176G 0.735759 0.831128 35.39 39.89
E178G 0.681289 0.979685 32.77 47.02
P234G 0.499376 1.005521 24.02 48.26
S236G 0.641372 0.921763 30.85 44.24
E237G 0.66736 0.874883 32.1 41.99
K238G 0.449688 0.653401 21.63 31.36
S239G 0.434719 0.699865 20.91 33.59
S334G 0.642204 0.965934 30.89 46.36
P335G 0.571102 0.891134 27.47 42.77
A336G 0.567775 0.996562 27.31 47.83
P349G 0.81684 1.158871 39.29 55.62
V428G 0.892931 1.282217 42.95 61.54
K544G 0.645946 0.936973 31.07 44.97
Q623G 0.72578 1.020106 34.91 48.96
N624G 0.645114 0.765496 31.03 36.74
S647G 0.707069 0.950099 34.01 45.6
N740G 0.798753 0.892385 38.42 42.83
K741G 0.124116 0.379623 5.97 18.22
S742G 0.57131 0.806126 27.48 38.69
R743G 0.44657 0.729243 21.48 35
E744G 0.975468 1.079487 46.92 51.81
T745G 0.66736 0.931972 32.1 44.73
H746G 0.646778 0.87905 31.11 42.19
M827G 0.804366 1.009063 38.69 48.43
N828G 0.573181 0.736118 27.57 35.33
V844G 0.811019 1.010314 39.01 48.49
P910G 0.778794 1.091572 37.46 52.39
N911G 0.862162 1.035733 41.47 49.71
N939G 0.69605 0.981561 33.48 47.11
N940G 0.478378 0.624857 23.01 29.99
P942G 0.418295 0.652985 20.12 31.34
N1044G 0.632848 1.013647 30.44 48.65
N1058G 0.980873 0.905928 47.18 43.48
P1059G 0.597713 0.925721 28.75 44.43
A1060G 0.755094 1.068236 36.32 51.27
G429 0.822661 1.020523 39.57 48.98
G473 0.707692 1.057819 34.04 50.77
G592 0.729314 0.777164 35.08 37.3
G845 0.834096 0.945515 40.12 45.38
G930 0.797089 1.009689 38.34 48.46
*親代WT對照的編輯是二重複的平均值 範例 14 LPG10145 的強健性( robustness )測試 範例 14.1 :藉由質體遞送篩選哺乳動物細胞中多個標的位點處的 LPG10145 編輯
靶向幾個基因的引導被設計用於藉由質體遞送在HEK293T細胞中的強健性測試。在96孔盤中於針對HEK293T細胞的最佳編輯條件下,測試這些引導,這些條件包括在第1天接種10,000個細胞,在第2天使用Lipofectamine 3000進行脂質體轉染,且在第4天萃取基因體DNA。藉由混合160 ng LPG10145編碼的質體及40 ng引導編碼的質體、以及Opti-MEM中的0.4 µl p3000進行脂質體轉染。然後,將於Opti-MEM中稀釋的Lipofectamine 3000 0.3 µl添加至質體混合物中,並培養 15 分鐘,然後添加至細胞中。每一個引導的編輯位點周圍的區域從萃取的基因體DNA中擴增,且藉由NGS定序,如範例4中所描述。與每一個引導的LPG10145的編輯效率以編輯百分比(標的位點的插入缺失百分比)進行報告。在測試的32個引導中,LPG10145顯示出與43.7%的測試的引導(14/32個引導)超過20%的編輯、且對53%的測試的引導(17/32個引導)有超過 10%的編輯。 25 LPG10145 藉由質體遞送在 HEK293T 細胞中進行強健編輯
引導 基因名稱 編輯 % 每引導的重複
SGN006164 Gene A 0.6 1
SGN006165 Gene A 1.07 1
SGN006166 Gene A 17.83 1
SGN006167 Gene A 4.86 1
SGN006168 Gene A 0.78 1
SGN006169 Gene A 6.315 2
SGN006170 Gene A 40.59 2
SGN002707 TRAC 34.87 2
SGN002703 TRAC 6.555 2
SGN006172 TRAC 29.745 2
SGN006173 TRAC 31.86 2
SGN006174 TRAC 26.595 2
SGN006175 TRAC 20.83 2
SGN006176 B2M 9.61 2
SGN002700 B2M 10.615 2
SGN006178 B2M 23.975 2
SGN006179 B2M 45.445 2
SGN006180 B2M 0.895 2
SGN006181 B2M 4.465 2
SGN006182 B2M 32.365 2
SGN006183 Gene B 5.595 2
SGN006184 Gene B 11.065 2
SGN006185 Gene B 9.09 2
SGN006186 Gene B 22.7 2
SGN006187 Gene C 31.87 2
SGN006188 Gene C 0.065 2
SGN006189 Gene C 35.725 2
SGN006190 Gene C 4.325 2
SGN006192 Gene C 3.4 2
SGN006193 Gene C 2.24 1
SGN003014 B2M 34.41 2
SGN003018 B2M 56.51 2
範例 15 LPG10145 再現性篩選
為了評估LPG10145編輯再現性,將LPG10145作為核糖核蛋白錯合物經由核轉染遞送至T細胞中。如範例11中所描述,進行用於RNP遞送及經由擴增子定序的實驗讀出的方法。在此,利用靶向不同基因的多個sgRNA來顯示具有所有引導回復變異係數(CV)值小於50%的LPG10145編輯的重現性(圖4)。
圖1提供LPG10134、LPG10136、LPG10138、LPG10139、LPG10141、LPG10145、LPG10146、LPG10147、LPG10150、LPG10155、LPG10159、以及 LPG10160對多基因的編輯率。包括用於RGN與引導RNA的表現匣的質體共轉染至HEK293T細胞中。 圖2顯示:當RGN及sgRNA作為核糖核蛋白(RNP)錯合物在活化的人外周血單核細胞(PBMC)中遞送,單引導RNA(sgRNA)SGN002661與LPG10136 RNA-引導的核酸酶(RGN)一起提供超過75%的T細胞受體α(TRAC)基因 的編輯(由流式細胞分析技術測量)。B2M:β2-微球蛋白。 圖3A及圖3B說明增加 RNP 濃度改善編輯。圖顯示經由流式細胞分析技術測量β2-微球蛋白(B2M)或T細胞受體α(TRAC)在活化的人PBMC中的水平,包括蛋白質:RNA 比例為 1:2的LPG10145及各種sgRNA的RNP濃度增加的編輯效率。圖3B說明:隨著包括具有兩個不同間隔子長度(20或25核苷酸)的sgRNA的RNP量的增加,編輯活性增加的劑量依賴性。 圖4顯示LPG10145可編輯多基因中的標的。LPG10145作為RNP經由核轉染遞送至T細胞。所有引導顯示小於50%的變異係數(CV)。
TW202346583A_112103115_SEQL.xml

Claims (147)

  1. 一種核酸分子,包括編碼一RNA引導的核酸酶(RGN)多肽的一多核苷酸,其中該多核苷酸包括編碼一RGN多肽的一核苷酸序列,該RGN多肽包括與SEQ ID NO:1-12中任一者具有至少90%序列一致性的一胺基酸序列; 其中,當與能夠與一標的DNA序列雜交的一引導RNA(gRNA)結合時,該RGN多肽能夠以一RNA引導的序列專一性方式結合該標的DNA序列。
  2. 如請求項1所述的核酸分子,其中該RGN多肽包括與SEQ ID NO:1-12中任一者具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一胺基酸序列。
  3. 如請求項1或請求項2所述的核酸分子,其中編碼一RGN多肽的該多核苷酸可操作地連接至與該多核苷酸異源的一啟動子。
  4. 如請求項1至請求項3中任一項所述的核酸分子,其中該RGN多肽能夠於結合時切割該標的DNA序列。
  5. 如請求項4所述的核酸分子,其中該RGN多肽能夠產生一雙股斷裂。
  6. 如請求項4所述的核酸分子,其中該RGN多肽能夠產生一單股斷裂。
  7. 如請求項1至請求項3中任一項所述的核酸分子,其中該RGN多肽為核酸酶不活化的或為一切口酶。
  8. 如請求項1至請求項7中任一項所述的核酸分子,其中該RGN多肽可操作地連接至一先導編輯多肽。
  9. 如請求項8所述的核酸分子,其中該先導編輯多肽包括一DNA聚合酶。
  10. 如請求項8所述的核酸分子,其中該先導編輯多肽包括一反轉錄酶。
  11. 如請求項1至請求項7中任一項所述的核酸分子,其中該RGN多肽可操作地連接至一鹼基編輯多肽。
  12. 如請求項11所述的核酸分子,其中該鹼基編輯多肽為一去胺酶。
  13. 如請求項12所述的核酸分子,其中該去胺酶為一胞嘧啶去胺酶或一腺嘌呤去胺酶。
  14. 如請求項12所述的核酸分子,其中該去胺酶與SEQ ID NO:377-448中任一者的一胺基酸序列具有至少90%序列一致性。
  15. 如請求項12所述的核酸分子,其中該去胺酶與SEQ ID NO:377-448中任一者的一胺基酸序列具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
  16. 如請求項1至請求項15中任一項所述的核酸分子,其中該RGN多肽包括一或更多核定位訊號。
  17. 如請求項1至請求項16中任一項所述的核酸分子,其中該RGN多肽針對在一真核細胞中的表現而被密碼子最佳化。
  18. 如請求項1至請求項17中任一項所述的核酸分子,其中該標的DNA序列被定位為與一前間隔序列鄰近模體(PAM)相鄰。
  19. 一種載體,包括如請求項1至請求項18中任一項所述的核酸分子。
  20. 如請求項19所述的載體,進一步包括編碼能夠與該標的DNA序列雜交的該gRNA的至少一核苷酸序列。
  21. 如請求項20所述的載體,其中該引導RNA選自由下列所組成的群組: a) 一引導RNA,包括: i) 一CRISPR RNA,包括與SEQ ID NO:13具有至少90%序列一致性的一CRISPR重複序列;以及 ii) 一tracrRNA,與SEQ ID NO:25具有至少90%序列一致性; 其中該RGN多肽包括與SEQ ID NO:1具有至少90%序列一致性的一胺基酸序列; b) 一引導RNA,包括: i) 一CRISPR RNA,包括與SEQ ID NO:14具有至少90%序列一致性的一CRISPR重複序列;以及 ii) 一tracrRNA,與SEQ ID NO:26具有至少90%序列一致性; 其中該RGN多肽包括與SEQ ID NO:2具有至少90%序列一致性的一胺基酸序列; c) 一引導RNA,包括: i) 一CRISPR RNA,包括與SEQ ID NO:15具有至少90%序列一致性的一CRISPR重複序列;以及 ii) 一tracrRNA,與SEQ ID NO:27具有至少90%序列一致性; 其中該RGN多肽包括與SEQ ID NO:3具有至少90%序列一致性的一胺基酸序列; d) 一引導RNA,包括: i) 一CRISPR RNA,包括與SEQ ID NO:16具有至少90%序列一致性的一CRISPR重複序列;以及 ii) 一tracrRNA,與SEQ ID NO:28具有至少90%序列一致性; 其中該RGN多肽包括與SEQ ID NO:4具有至少90%序列一致性的一胺基酸序列; e) 一引導RNA,包括: i) 一CRISPR RNA,包括與SEQ ID NO:17具有至少90%序列一致性的一CRISPR重複序列;以及 ii) 一tracrRNA,與SEQ ID NO:29具有至少90%序列一致性; 其中該RGN多肽包括與SEQ ID NO:5具有至少90%序列一致性的一胺基酸序列; f) 一引導RNA,包括: i) 一CRISPR RNA,包括與SEQ ID NO:18具有至少90%序列一致性的一CRISPR重複序列;以及 ii) 一tracrRNA,與SEQ ID NO:30具有至少90%序列一致性; 其中該RGN多肽包括與SEQ ID NO:6具有至少90%序列一致性的一胺基酸序列; g) 一引導RNA,包括: i) 一CRISPR RNA,包括與SEQ ID NO:19具有至少90%序列一致性的一CRISPR重複序列;以及 ii) 一tracrRNA,與SEQ ID NO:31具有至少90%序列一致性; 其中該RGN多肽包括與SEQ ID NO:7具有至少90%序列一致性的一胺基酸序列; h) 一引導RNA,包括: i) 一CRISPR RNA,包括與SEQ ID NO:20具有至少90%序列一致性的一CRISPR重複序列;以及 ii) 一tracrRNA,與SEQ ID NO:32具有至少90%序列一致性; 其中該RGN多肽包括與SEQ ID NO:8具有至少90%序列一致性的一胺基酸序列; i) 一引導RNA,包括: i) 一CRISPR RNA,包括與SEQ ID NO:21具有至少90%序列一致性的一CRISPR重複序列;以及 ii) 一tracrRNA,與SEQ ID NO:33具有至少90%序列一致性; 其中該RGN多肽包括與SEQ ID NO:9具有至少90%序列一致性的一胺基酸序列; j) 一引導RNA,包括: i) 一CRISPR RNA,包括與SEQ ID NO:22具有至少90%序列一致性的一CRISPR重複序列;以及 ii) 一tracrRNA,與SEQ ID NO:34具有至少90%序列一致性; 其中該RGN多肽包括與SEQ ID NO:10具有至少90%序列一致性的一胺基酸序列; k) 一引導RNA,包括: i) 一CRISPR RNA,包括與SEQ ID NO:23具有至少90%序列一致性的一CRISPR重複序列;以及 ii) 一tracrRNA,與SEQ ID NO:35具有至少90%序列一致性; 其中該RGN多肽包括與SEQ ID NO:11具有至少90%序列一致性的一胺基酸序列;以及 l) 一引導RNA,包括: i) 一CRISPR RNA,包括與SEQ ID NO:24具有至少90%序列一致性的一CRISPR重複序列;以及 ii) 一tracrRNA,與SEQ ID NO:36具有至少90%序列一致性; 其中該RGN多肽包括與SEQ ID NO:12具有至少90%序列一致性的一胺基酸序列。
  22. 如請求項20所述的載體,其中該引導RNA選自由下列所組成的群組: a) 一引導RNA,包括: i) 一CRISPR RNA,包括與SEQ ID NO:13具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一CRISPR重複序列;以及 ii) 一tracrRNA,與SEQ ID NO:25具有100%序列一致性; 其中該RGN多肽包括與SEQ ID NO:1具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一胺基酸序列; b) 一引導RNA,包括: i) 一CRISPR RNA,包括與SEQ ID NO:14具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一CRISPR重複序列;以及 ii) 一tracrRNA,與SEQ ID NO:26具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性; 其中該RGN多肽包括與SEQ ID NO:2具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一胺基酸序列; c) 一引導RNA,包括: i) 一CRISPR RNA,包括與SEQ ID NO:15具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一CRISPR重複序列;以及 ii) 一tracrRNA,與SEQ ID NO:27具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性; 其中該RGN多肽包括與SEQ ID NO:3具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一胺基酸序列; d) 一引導RNA,包括: i) 一CRISPR RNA,包括與SEQ ID NO:16具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一CRISPR重複序列;以及 ii) 一tracrRNA,與SEQ ID NO:28具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性; 其中該RGN多肽包括與SEQ ID NO:4具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一胺基酸序列; e) 一引導RNA,包括: i) 一CRISPR RNA,包括與SEQ ID NO:17具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一CRISPR重複序列;以及 ii) 一tracrRNA,與SEQ ID NO:29具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性; 其中該RGN多肽包括與SEQ ID NO:5具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一胺基酸序列; f) 一引導RNA,包括: i) 一CRISPR RNA,包括與SEQ ID NO:18具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一CRISPR重複序列;以及 ii) 一tracrRNA,與SEQ ID NO:30具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性; 其中該RGN多肽包括與SEQ ID NO:6具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一胺基酸序列; g) 一引導RNA,包括: i) 一CRISPR RNA,包括與SEQ ID NO:19具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一CRISPR重複序列;以及 ii) 一tracrRNA,與SEQ ID NO:31具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性; 其中該RGN多肽包括與SEQ ID NO:7具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一胺基酸序列; h) 一引導RNA,包括: i) 一CRISPR RNA,包括與SEQ ID NO:20具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一CRISPR重複序列;以及 ii) 一tracrRNA,與SEQ ID NO:32具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性; 其中該RGN多肽包括與SEQ ID NO:8具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一胺基酸序列; i) 一引導RNA,包括: i) 一CRISPR RNA,包括與SEQ ID NO:21具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一CRISPR重複序列;以及 ii) 一tracrRNA,與SEQ ID NO:33具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性; 其中該RGN多肽包括與SEQ ID NO:9具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一胺基酸序列; j) 一引導RNA,包括: i) 一CRISPR RNA,包括與SEQ ID NO:22具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一CRISPR重複序列;以及 ii) 一tracrRNA,與SEQ ID NO:34具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性; 其中該RGN多肽包括與SEQ ID NO:10具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一胺基酸序列; k) 一引導RNA,包括: i) 一CRISPR RNA,包括與SEQ ID NO:23具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一CRISPR重複序列;以及 ii) 一tracrRNA,與SEQ ID NO:35具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性; 其中該RGN多肽包括與SEQ ID NO:11具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一胺基酸序列;以及 l) 一引導RNA,包括: i) 一CRISPR RNA,包括與SEQ ID NO:24具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一CRISPR重複序列;以及 ii) 一tracrRNA,與SEQ ID NO:36具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性; 其中該RGN多肽包括與SEQ ID NO:12具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一胺基酸序列。
  23. 如請求項20或請求項21所述的載體,其中該gRNA為一單引導RNA。
  24. 如請求項23所述的載體,其中該sgRNA進一步包括一延伸,該延伸包括用於先導編輯的一編輯模板。
  25. 如請求項20或請求項21所述的載體,其中該gRNA為一雙引導RNA。
  26. 一種細胞,包括如請求項1至請求項18中任一項所述的核酸分子或如請求項19至請求項25中任一項所述的載體。
  27. 一種用於製造一RGN多肽的方法,包括:在該RGN多肽表現的條件下,培養如請求項26所述的細胞。
  28. 一種用於製造一RGN多肽的方法,包括將一異源核酸分子引入一細胞內,該異源核酸分子包括編碼一RNA引導的核酸酶(RGN)多肽的一核苷酸序列,該RGN多肽包括與SEQ ID NO:1-12中任一者具有至少90%序列一致性的一胺基酸序列; 其中,當與能夠與一標的DNA序列雜交的一引導RNA(gRNA)結合時,該RGN多肽能夠以一RNA引導的序列專一性方式結合該標的DNA序列; 以及在該RGN多肽表現的條件下,培養該細胞。
  29. 如請求項28所述的方法,其中該RGN多肽包括與SEQ ID NO:1-12中任一者具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一胺基酸序列。
  30. 如請求項27至請求項29中任一項所述的方法,進一步包括純化該RGN多肽。
  31. 如請求項27至請求項29中任一項所述的方法,其中該細胞進一步表現一或更多引導RNA,該一或更多引導RNA能夠與該RGN多肽結合以形成一RGN核糖核蛋白錯合物。
  32. 如請求項31所述的方法,進一步包括純化該RGN核糖核蛋白錯合物。
  33. 一種RNA引導的核酸酶(RGN)多肽,其中該RGN多肽包括與SEQ ID NO:1-12中任一者具有至少90%序列一致性的一胺基酸序列;以及 其中,當與能夠與一DNA分子的一標的DNA序列雜交的一引導RNA(gRNA)結合時,該RGN多肽能夠以一RNA引導的序列專一性方式結合該標的DNA序列。
  34. 如請求項33所述的RGN多肽,其中該RGN多肽包括與SEQ ID NO:1-12中任一者具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一胺基酸序列。
  35. 如請求項33或請求項34所述的RGN多肽,其中該RGN多肽為一分離的RGN多肽。
  36. 如請求項33至請求項35中任一項所述的RGN多肽,其中該RGN多肽能夠於結合時切割該標的DNA序列。
  37. 如請求項36所述的RGN多肽,其中由該RGN多肽的切割產生一雙股斷裂。
  38. 如請求項36所述的RGN多肽,其中由該RGN多肽的切割產生一單股斷裂。
  39. 如請求項33至請求項35中任一項所述的RGN多肽,其中該RGN多肽為核酸酶不活化的或為一切口酶。
  40. 如請求項33至請求項39中任一項所述的RGN多肽,其中該RGN多肽可操作地連接至一先導編輯多肽。
  41. 如請求項40所述的RGN多肽,其中該先導編輯多肽包括一DNA聚合酶。
  42. 如請求項40所述的RGN多肽,其中該先導編輯多肽包括一反轉錄酶。
  43. 如請求項33至請求項39中任一項所述的RGN多肽,其中該RGN多肽可操作地連接至一鹼基編輯多肽。
  44. 如請求項43所述的RGN多肽,其中該鹼基編輯多肽為一去胺酶。
  45. 如請求項44所述的RGN多肽,其中該去胺酶為一胞嘧啶去胺酶或一腺嘌呤去胺酶。
  46. 如請求項44所述的RGN多肽,其中該去胺酶與SEQ ID NO:377-448中任一者的一胺基酸序列具有至少90%序列一致性。
  47. 如請求項44所述的RGN多肽,其中該去胺酶與SEQ ID NO:377-448中任一者的一胺基酸序列具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
  48. 如請求項33至請求項47中任一項所述的RGN多肽,其中該標的DNA序列被定位為與一前間隔序列鄰近模體(PAM)相鄰。
  49. 如請求項33至請求項48中任一項所述的RGN多肽,其中該RGN多肽包括一或更多核定位訊號。
  50. 一種核糖核蛋白(RNP)錯合物,包括如請求項33至請求項49中任一項所述的RGN多肽、以及與該RGN多肽結合的該引導RNA。
  51. 一種用於結合一DNA分子的一標的DNA序列的系統,該系統包括: a) 能夠與該標的DNA序列雜交的一或更多引導RNA、或包括編碼該一或更多引導RNA(gRNA)的一或更多核苷酸序列的一或更多多核苷酸;以及 b) 包括與SEQ ID NO:1-12中任一者具有至少90%序列一致性的一胺基酸序列的一RNA引導的核酸酶(RGN)多肽、或包括編碼該RGN多肽的一核苷酸序列的一多核苷酸; 其中該一或更多引導RNA能夠與該標的DNA序列雜交,以及 其中該一或更多引導RNA能夠與該RGN多肽形成一錯合物,以引導該RGN多肽與該DNA分子的該標的DNA序列結合。
  52. 如請求項51所述的系統,其中編碼該RGN多肽的該核苷酸序列、以及編碼該一或更多引導RNA的該核苷酸序列中的至少一者可操作地連接至與該核苷酸序列異源的一啟動子。
  53. 如請求項51或請求項52所述的系統,其中編碼該一或更多引導RNA的該核苷酸序列、以及編碼該RGN多肽的該核苷酸序列位於一個載體上。
  54. 一種用於結合一DNA分子的一標的DNA序列的系統,該系統包括: a) 能夠與該標的DNA序列雜交的一或更多引導RNA、或包括編碼該一或更多引導RNA(gRNA)的一或更多核苷酸序列的一或更多多核苷酸;以及 b) 包括與SEQ ID NO:1-12中任一者具有至少90%序列一致性的一胺基酸序列的一RNA引導的核酸酶(RGN)多肽; 其中該一或更多引導RNA能夠與該標的DNA序列雜交,以及 其中該一或更多引導RNA能夠與該RGN多肽形成一錯合物,以引導該RGN多肽與該DNA分子的該標的DNA序列結合。
  55. 如請求項51至請求項54中任一項所述的系統,其中該RGN多肽包括與SEQ ID NO:1-12中任一者具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一胺基酸序列。
  56. 如請求項51至請求項55中任一項所述的系統,其中編碼該一或更多引導RNA的該核苷酸序列中的至少一者可操作地連接至與該核苷酸序列異源的一啟動子。
  57. 如請求項51至請求項56中任一項所述的系統,其中在自然界中未發現該RGN多肽與該一或更多引導RNA彼此錯合。
  58. 如請求項51至請求項57中任一項所述的系統,其中該標的DNA序列為一真核標的DNA序列。
  59. 如請求項51至請求項58中任一項所述的系統,其中該gRNA為一單引導RNA(sgRNA)。
  60. 如請求項59所述的系統,其中該sgRNA進一步包括一延伸,該延伸包括用於先導編輯的一編輯模板。
  61. 如請求項51至請求項58中任一項所述的系統,其中該gRNA為一雙引導RNA。
  62. 如請求項51至請求項61中任一項所述的系統,其中該gRNA選自由下列所組成的群組: a) 包括與SEQ ID NO:13具有至少90%序列一致性的一CRISPR重複序列、以及與SEQ ID NO:25具有至少90%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:1具有至少90%序列一致性的一胺基酸序列; b) 包括與SEQ ID NO:14具有至少90%序列一致性的一CRISPR重複序列、以及與SEQ ID NO:26具有至少90%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:2具有至少90%序列一致性的一胺基酸序列; c) 包括與SEQ ID NO:15具有至少90%序列一致性的一CRISPR重複序列、以及與SEQ ID NO:27具有至少90%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:3具有至少90%序列一致性的一胺基酸序列; d) 包括與SEQ ID NO:16具有至少90%序列一致性的一CRISPR重複序列、以及與SEQ ID NO:28具有至少90%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:4具有至少90%序列一致性的一胺基酸序列; e) 包括與SEQ ID NO:17具有至少90%序列一致性的一CRISPR重複序列、以及與SEQ ID NO:29具有至少90%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:5具有至少90%序列一致性的一胺基酸序列; f) 包括與SEQ ID NO:18具有至少90%序列一致性的一CRISPR重複序列、以及與SEQ ID NO:30具有至少90%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:6具有至少90%序列一致性的一胺基酸序列; g) 包括與SEQ ID NO:19具有至少90%序列一致性的一CRISPR重複序列、以及與SEQ ID NO:31具有至少90%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:7具有至少90%序列一致性的一胺基酸序列; h) 包括與SEQ ID NO:20具有至少90%序列一致性的一CRISPR重複序列、以及與SEQ ID NO:32具有至少90%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:8具有至少90%序列一致性的一胺基酸序列; i) 包括與SEQ ID NO:21具有至少90%序列一致性的一CRISPR重複序列、以及與SEQ ID NO:33具有至少90%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:9具有至少90%序列一致性的一胺基酸序列; j) 包括與SEQ ID NO:22具有至少90%序列一致性的一CRISPR重複序列、以及與SEQ ID NO:34具有至少90%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:10具有至少90%序列一致性的一胺基酸序列; k) 包括與SEQ ID NO:23具有至少90%序列一致性的一CRISPR重複序列、以及與SEQ ID NO:35具有至少90%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:11具有至少90%序列一致性的一胺基酸序列;以及 l) 包括與SEQ ID NO:24具有至少90%序列一致性的一CRISPR重複序列、以及與SEQ ID NO:36具有至少90%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:12具有至少90%序列一致性的一胺基酸序列。
  63. 如請求項51至請求項61中任一項所述的系統,其中該gRNA選自由下列所組成的群組: a) 包括與SEQ ID NO:13具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一CRISPR重複序列、以及與SEQ ID NO:25具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:1具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一胺基酸序列; b) 包括與SEQ ID NO:14具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一CRISPR重複序列、以及與SEQ ID NO:26具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:2具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一胺基酸序列; c) 包括與SEQ ID NO:15具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一CRISPR重複序列、以及與SEQ ID NO:27具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:3具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一胺基酸序列; d) 包括與SEQ ID NO:16具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一CRISPR重複序列、以及與SEQ ID NO:28具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:4具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一胺基酸序列; e) 包括與SEQ ID NO:17具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一CRISPR重複序列、以及與SEQ ID NO:29具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:5具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一胺基酸序列; f) 包括與SEQ ID NO:18具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一CRISPR重複序列、以及與SEQ ID NO:30具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:6具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一胺基酸序列; g) 包括與SEQ ID NO:19具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一CRISPR重複序列、以及與SEQ ID NO:31具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:7具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一胺基酸序列; h) 包括與SEQ ID NO:20具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一CRISPR重複序列、以及與SEQ ID NO:32具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:8具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一胺基酸序列; i) 包括與SEQ ID NO:21具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一CRISPR重複序列、以及與SEQ ID NO:33具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:9具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一胺基酸序列; j) 包括與SEQ ID NO:22具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一CRISPR重複序列、以及與SEQ ID NO:34具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:10具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一胺基酸序列; k) 包括與SEQ ID NO:23具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一CRISPR重複序列、以及與SEQ ID NO:35具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:11具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一胺基酸序列;以及 l) 包括與SEQ ID NO:24具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一CRISPR重複序列、以及與SEQ ID NO:36具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一tracrRNA的一gRNA,其中該RGN多肽包括與SEQ ID NO:12具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一胺基酸序列。
  64. 如請求項51至請求項63中任一項所述的系統,其中該標的DNA序列被定位為與一前間隔序列鄰近模體(PAM)相鄰。
  65. 如請求項51至請求項64中任一項所述的系統,其中該標的DNA序列在一細胞內。
  66. 如請求項51至請求項65中任一項所述的系統,其中該一或更多引導RNA能夠與該標的DNA序列雜交,且該引導RNA能夠與該RGN多肽形成一錯合物,以引導該標的DNA序列的切割。
  67. 如請求項66所述的系統,其中該切割產生一雙股斷裂。
  68. 如請求項66所述的系統,其中該切割產生一單股斷裂。
  69. 如請求項51至請求項65中任一項所述的系統,其中該RGN多肽為核酸酶不活化的或為一切口酶。
  70. 如請求項51至請求項69中任一項所述的系統,其中該RGN多肽可操作地連接至一先導編輯多肽。
  71. 如請求項70所述的系統,其中該先導編輯多肽包括一DNA聚合酶。
  72. 如請求項70所述的系統,其中該先導編輯多肽包括一反轉錄酶。
  73. 如請求項51至請求項69中任一項所述的系統,其中該RGN多肽可操作地連接至一鹼基編輯多肽。
  74. 如請求項73所述的系統,其中該鹼基編輯多肽為一去胺酶。
  75. 如請求項74所述的系統,其中該去胺酶為一胞嘧啶去胺酶或一腺嘌呤去胺酶。
  76. 如請求項74所述的系統,其中該去胺酶與SEQ ID NO:377-448中任一者的一胺基酸序列具有至少90%序列一致性。
  77. 如請求項74所述的系統,其中該去胺酶與SEQ ID NO:377-448中任一者的一胺基酸序列具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
  78. 如請求項51至請求項77中任一項所述的系統,其中該RGN多肽包括一或更多核定位訊號。
  79. 如請求項51至請求項78中任一項所述的系統,其中該RGN多肽針對在一真核細胞中的表現而被密碼子最佳化。
  80. 如請求項51至請求項79中任一項所述的系統,其中該系統進一步包括一或更多供體多核苷酸。
  81. 一種細胞,包括如請求項51至請求項80中任一項所述的系統。
  82. 一種醫藥組成物,包括如請求項1至請求項18中任一項所述的核酸分子、如請求項19至請求項25中任一項所述的載體、如請求項26或請求項81所述的細胞、如請求項33至請求項49中任一項所述的RGN多肽、如請求項50所述的RNP錯合物、或如請求項51至請求項80中任一項所述的系統;以及一藥學上可接受的載體。
  83. 一種用於結合一DNA分子的一標的DNA序列的方法,包括將如請求項51至請求項80中任一項所述的一系統遞送至該標的DNA序列或包括該標的DNA序列的一細胞。
  84. 如請求項83所述的方法,其中該RGN多肽或該引導RNA進一步包括一可檢測標記,從而允許該標的DNA序列的檢測。
  85. 如請求項83所述的方法,其中該引導RNA或該RGN多肽進一步包括一表現調節子,從而調節該標的DNA序列的表現或由該標的DNA序列的轉錄控制下的一基因的表現。
  86. 一種用於切割及/或修飾一DNA分子的一標的DNA序列的方法,包括將如請求項36至請求項57中任一項所述的一系統遞送至該標的DNA序列或包括該DNA分子的一細胞,其中發生該標的DNA序列的切割或修飾。
  87. 如請求項86所述的方法,其中該經修飾的標的DNA序列包括將異源DNA插入該標的DNA序列中。
  88. 如請求項86所述的方法,其中該經修飾的標的DNA序列包括該標的DNA序列中的至少一核苷酸的缺失。
  89. 如請求項86所述的方法,其中該經修飾的標的DNA序列包括該標的DNA序列中的至少一核苷酸的突變。
  90. 一種用於結合一DNA分子的一標的DNA序列的方法,包括: a) 在適合形成一RNA引導的核酸酶(RGN)核糖核苷酸錯合物的條件下,藉由組合下列而組裝該RGN核糖核苷酸錯合物: i) 能夠與該標的DNA序列雜交的一或更多引導RNA;以及 ii) 包括與SEQ ID NO:1-12中任一者具有至少90%序列一致性的一胺基酸序列的一RGN多肽;以及 b) 使該標的DNA序列或包括該標的DNA序列的一細胞與該組裝的RGN核糖核苷酸錯合物接觸; 其中該一或更多引導RNA與該標的DNA序列雜交,從而引導該RGN多肽與該標的DNA序列結合。
  91. 如請求項90所述的方法,其中該RGN多肽包括與SEQ ID NO:1-12中任一者具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一胺基酸序列。
  92. 如請求項90或請求項91所述的方法,其中該方法在體外、體內或離體進行。
  93. 如請求項90至請求項92中任一項所述的方法,其中該RGN多肽或該引導RNA進一步包括一可檢測標記,從而允許該標的DNA序列的檢測。
  94. 如請求項90至請求項92中任一項所述的方法,其中該引導RNA或該RGN多肽進一步包括一表現調節子,從而允許該標的DNA序列的表現的調節。
  95. 如請求項90至請求項92中任一項所述的方法,其中該RGN多肽進一步包括一先導編輯多肽,從而允許該標的DNA序列的修飾。
  96. 如請求項95所述的方法,其中該先導編輯多肽包括一DNA聚合酶。
  97. 如請求項95所述的方法,其中該先導編輯多肽包括一反轉錄酶。
  98. 如請求項90至請求項92中任一項所述的方法,其中該RGN多肽進一步包括一鹼基編輯多肽,從而允許該標的DNA序列的修飾。
  99. 如請求項98所述的方法,其中該鹼基編輯多肽包括一去胺酶。
  100. 如請求項99所述的方法,其中該去胺酶為一胞嘧啶去胺酶或一腺嘌呤去胺酶。
  101. 如請求項90至請求項92中任一項所述的方法,其中該RGN多肽能夠切割該標的DNA序列,從而允許切割及/或修飾該標的DNA序列。
  102. 一種用於切割及/或修飾一DNA分子的一標的DNA序列的方法,包括使該DNA分子與下列接觸: a) 一RNA引導的核酸酶(RGN)多肽,其中該RGN包括與SEQ ID NO:1-12中任一者具有至少90%序列一致性的一胺基酸序列;以及 b) 一或更多引導RNA,其能夠將(a)的該RGN靶向該標的DNA序列; 其中該一或更多引導RNA與該標的DNA序列雜交,從而引導該RGN多肽與該標的DNA序列結合,且發生該標的DNA序列的切割及/或修飾。
  103. 如請求項102所述的方法,其中該RGN多肽包括與SEQ ID NO:1-12中任一者具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一胺基酸序列。
  104. 如請求項102或請求項103所述的方法,其中由該RGN多肽的切割產生一雙股斷裂。
  105. 如請求項102或請求項103所述的方法,其中由該RGN多肽的切割產生一單股斷裂。
  106. 如請求項102或請求項103所述的方法,其中該RGN多肽為一切口酶、且可操作地連接至一先導編輯多肽。
  107. 如請求項106所述的方法,其中該先導編輯多肽包括一DNA聚合酶。
  108. 如請求項106所述的方法,其中該先導編輯多肽包括一反轉錄酶。
  109. 如請求項102或請求項103所述的方法,其中該RGN多肽為核酸酶不活化的或為一切口酶、且可操作地連接至一鹼基編輯多肽。
  110. 如請求項109所述的方法,其中該鹼基編輯多肽為一去胺酶。
  111. 如請求項110所述的方法,其中該去胺酶為一胞嘧啶去胺酶或一腺嘌呤去胺酶。
  112. 如請求項110所述的方法,其中該去胺酶與SEQ ID NO:377-448中任一者的一胺基酸序列具有至少90%序列一致性。
  113. 如請求項110所述的方法,其中該去胺酶與SEQ ID NO:377-448中任一者的一胺基酸序列具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
  114. 如請求項102或請求項103所述的方法,其中該經修飾的標的DNA序列包括將異源DNA插入該標的DNA序列中。
  115. 如請求項102或請求項103所述的方法,其中該經修飾的標的DNA序列包括該標的DNA序列中的至少一核苷酸的缺失。
  116. 如請求項102或請求項103所述的方法,其中該經修飾的標的DNA序列包括該標的DNA序列中的至少一核苷酸的突變。
  117. 如請求項83至請求項116中任一項所述的方法,其中該標的DNA序列被定位為與一前間隔序列鄰近模體(PAM)相鄰。
  118. 如請求項83至請求項117中任一項所述的方法,其中該標的DNA序列為一真核標的DNA序列。
  119. 如請求項83至請求項118中任一項所述的方法,其中該gRNA為一單引導RNA(sgRNA)。
  120. 如請求項119所述的方法,其中該sgRNA進一步包括一延伸,該延伸包括用於先導編輯的一編輯模板。
  121. 如請求項83至請求項118中任一項所述的方法,其中該gRNA為一雙引導RNA。
  122. 如請求項83至請求項121中任一項所述的方法,其中: a) 該RGN與SEQ ID NO:1具有至少90%序列一致性,該引導RNA包括與SEQ ID NO:13具有至少90%序列一致性的一crRNA重複序列、及與SEQ ID NO:25具有至少90%序列一致性的一tracrRNA; b) 該RGN與SEQ ID NO:2具有至少90%序列一致性,該引導RNA包括與SEQ ID NO:14具有至少90%序列一致性的一crRNA重複序列、及與SEQ ID NO:26具有至少90%序列一致性的一tracrRNA; c) 該RGN與SEQ ID NO:3具有至少90%序列一致性,該引導RNA包括與SEQ ID NO:15具有至少90%序列一致性的一crRNA重複序列、及與SEQ ID NO:27具有至少90%序列一致性的一tracrRNA; d) 該RGN與SEQ ID NO:4具有至少90%序列一致性,該引導RNA包括與SEQ ID NO:16具有至少90%序列一致性的一crRNA重複序列、及與SEQ ID NO:28具有至少90%序列一致性的一tracrRNA; e) 該RGN與SEQ ID NO:5具有至少90%序列一致性,該引導RNA包括與SEQ ID NO:17具有至少90%序列一致性的一crRNA重複序列、及與SEQ ID NO:29具有至少90%序列一致性的一tracrRNA; f) 該RGN與SEQ ID NO:6具有至少90%序列一致性,該引導RNA包括與SEQ ID NO:18具有至少90%序列一致性的一crRNA重複序列、及與SEQ ID NO:30具有至少90%序列一致性的一tracrRNA; g) 該RGN與SEQ ID NO:7具有至少90%序列一致性,該引導RNA包括與SEQ ID NO:19具有至少90%序列一致性的一crRNA重複序列、及與SEQ ID NO:31具有至少90%序列一致性的一tracrRNA; h) 該RGN與SEQ ID NO:8具有至少90%序列一致性,該引導RNA包括與SEQ ID NO:20具有至少90%序列一致性的一crRNA重複序列、及與SEQ ID NO:32具有至少90%序列一致性的一tracrRNA; i) 該RGN與SEQ ID NO:9具有至少90%序列一致性,該引導RNA包括與SEQ ID NO:21具有至少90%序列一致性的一crRNA重複序列、及與SEQ ID NO:33具有至少90%序列一致性的一tracrRNA; j) 該RGN與SEQ ID NO:10具有至少90%序列一致性,該引導RNA包括與SEQ ID NO:22具有至少90%序列一致性的一crRNA重複序列、及與SEQ ID NO:34具有至少90%序列一致性的一tracrRNA; k) 該RGN與SEQ ID NO:11具有至少90%序列一致性,該引導RNA包括與SEQ ID NO:23具有至少90%序列一致性的一crRNA重複序列、及與SEQ ID NO:35具有至少90%序列一致性的一tracrRNA;或 l) 該RGN與SEQ ID NO:12具有至少90%序列一致性,該引導RNA包括與SEQ ID NO:24具有至少90%序列一致性的一crRNA重複序列、及與SEQ ID NO:36具有至少90%序列一致性的一tracrRNA。
  123. 如請求項83至請求項121中任一項所述的方法,其中: a) 該RGN與SEQ ID NO:1具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性,該引導RNA包括與SEQ ID NO:13具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一crRNA重複序列、及與SEQ ID NO:25具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一tracrRNA; b) 該RGN與SEQ ID NO:2具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性,該引導RNA包括與SEQ ID NO:14具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一crRNA重複序列、及與SEQ ID NO:26具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一tracrRNA; c) 該RGN與SEQ ID NO:3具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性,該引導RNA包括與SEQ ID NO:15具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一crRNA重複序列、及與SEQ ID NO:27具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一tracrRNA; d) 該RGN與SEQ ID NO:4具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性,該引導RNA包括與SEQ ID NO:16具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一crRNA重複序列、及與SEQ ID NO:28具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一tracrRNA; e) 該RGN與SEQ ID NO:5具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性,該引導RNA包括與SEQ ID NO:17具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一crRNA重複序列、及與SEQ ID NO:29具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一tracrRNA; f) 該RGN與SEQ ID NO:6具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性,該引導RNA包括與SEQ ID NO:18具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一crRNA重複序列、及與SEQ ID NO:30具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一tracrRNA; g) 該RGN與SEQ ID NO:7具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性,該引導RNA包括與SEQ ID NO:19具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一crRNA重複序列、及與SEQ ID NO:31具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一tracrRNA; h) 該RGN與SEQ ID NO:8具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性,該引導RNA包括與SEQ ID NO:20具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一crRNA重複序列、及與SEQ ID NO:32具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一tracrRNA; i) 該RGN與SEQ ID NO:9具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性,該引導RNA包括與SEQ ID NO:21具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一crRNA重複序列、及與SEQ ID NO:33具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一tracrRNA; j) 該RGN與SEQ ID NO:10具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性,該引導RNA包括與SEQ ID NO:22具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一crRNA重複序列、及與SEQ ID NO:34具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一tracrRNA; k) 該RGN與SEQ ID NO:11具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性,該引導RNA包括與SEQ ID NO:23具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一crRNA重複序列、及與SEQ ID NO:35具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一tracrRNA;或 l) 該RGN與SEQ ID NO:12具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性,該引導RNA包括與SEQ ID NO:24具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一crRNA重複序列、及與SEQ ID NO:36具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一tracrRNA。
  124. 如請求項83至請求項123中任一項所述的方法,其中該標的DNA序列在一細胞內。
  125. 如請求項124所述的方法,進一步包括:在該RGN多肽被表現且切割及修飾該標的DNA序列以產生包括一經修飾的標的DNA序列的一DNA分子的條件下,培養該細胞;以及選擇包括該經修飾的標的DNA序列的一細胞。
  126. 一種細胞,包括如請求項125所述的方法的一經修飾的標的DNA序列。
  127. 一種醫藥組成物,包括如請求項26、請求項81及請求項126中任一項所述的細胞及一藥學上可接受的載體。
  128. 一種治療一疾病、一病症或一症狀的方法,該方法包括對需要治療的一個體投予一有效量的如請求項82或請求項127所述的醫藥組成物。
  129. 如請求項128所述的方法,其中該疾病與一因果突變相關聯,且該有效量的該醫藥組成物校正該因果突變。
  130. 如請求項128或請求項129所述的方法,其中該個體有罹患該疾病、該病症或該症狀的風險。
  131. 一種核酸分子,包括一CRISPR RNA(crRNA)或編碼一crRNA的一多核苷酸,其中該crRNA包括一間隔序列及一CRISPR 重複序列,其中該CRISPR 重複序列包括與SEQ ID NO:13-24中任一者具有至少90%序列一致性的一核苷酸序列; 其中,當一引導RNA與一RNA引導的核酸酶(RGN)多肽結合時,該引導RNA能夠以一序列專一性方式、經由該crRNA的該間隔序列而與一標的DNA序列雜交,該引導RNA包括: a)     該crRNA;以及 b)    與該crRNA的該CRISPR 重複序列雜交的一轉錄活化的 CRISPR RNA(tracrRNA)。
  132. 如請求項131所述的核酸分子,其中編碼一crRNA的該多核苷酸可操作地連接至與該多核苷酸異源的一啟動子。
  133. 如請求項131或請求項132所述的核酸分子,其中該CRISPR 重複序列包括與SEQ ID NO:13-24中任一者具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一核苷酸序列。
  134. 一種載體,包括如請求項131至請求項133中任一項所述的包括編碼該crRNA的該多核苷酸的核酸分子。
  135. 如請求項134所述的載體,其中該載體進一步包括編碼該tracrRNA 的一多核苷酸。
  136. 如請求項135所述的載體,其中該tracrRNA選自由下列所組成的群組: a) 與SEQ ID NO:25具有至少90%序列一致性的一tracrRNA,其中該CRISPR重複序列與SEQ ID NO:13具有至少90%序列一致性; b)  與SEQ ID NO:26具有至少90%序列一致性的一tracrRNA,其中該CRISPR重複序列與SEQ ID NO:14具有至少90%序列一致性; c)  與SEQ ID NO:27具有至少90%序列一致性的一tracrRNA,其中該CRISPR重複序列與SEQ ID NO:15具有至少90%序列一致性; d)  與SEQ ID NO:28具有至少90%序列一致性的一tracrRNA,其中該CRISPR重複序列與SEQ ID NO:16具有至少90%序列一致性; e)  與SEQ ID NO:29具有至少90%序列一致性的一tracrRNA,其中該CRISPR重複序列與SEQ ID NO:17具有至少90%序列一致性; f)   與SEQ ID NO:30具有至少90%序列一致性的一tracrRNA,其中該CRISPR重複序列與SEQ ID NO:18具有至少90%序列一致性; g)  與SEQ ID NO:31具有至少90%序列一致性的一tracrRNA,其中該CRISPR重複序列與SEQ ID NO:19具有至少90%序列一致性; h)  與SEQ ID NO:32具有至少90%序列一致性的一tracrRNA,其中該CRISPR重複序列與SEQ ID NO:20具有至少90%序列一致性; i)   與SEQ ID NO:33具有至少90%序列一致性的一tracrRNA,其中該CRISPR重複序列與SEQ ID NO:21具有至少90%序列一致性; j)   與SEQ ID NO:34具有至少90%序列一致性的一tracrRNA,其中該CRISPR重複序列與SEQ ID NO:22具有至少90%序列一致性; k)  與SEQ ID NO:35具有至少90%序列一致性的一tracrRNA,其中該CRISPR重複序列與SEQ ID NO:23具有至少90%序列一致性;以及 l)   與SEQ ID NO:36具有至少90%序列一致性的一tracrRNA,其中該CRISPR重複序列與SEQ ID NO:24具有至少90%序列一致性。
  137. 如請求項135所述的載體,其中該tracrRNA選自由下列所組成的群組: a) 與SEQ ID NO:25具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一tracrRNA,其中該CRISPR重複序列與SEQ ID NO:13具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性; b)  與SEQ ID NO:26具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一tracrRNA,其中該CRISPR重複序列與SEQ ID NO:14具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性; c)  與SEQ ID NO:27具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一tracrRNA,其中該CRISPR重複序列與SEQ ID NO:15具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性; d)  與SEQ ID NO:28具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一tracrRNA,其中該CRISPR重複序列與SEQ ID NO:16具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性; e)  與SEQ ID NO:29具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一tracrRNA,其中該CRISPR重複序列與SEQ ID NO:17具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性; f)   與SEQ ID NO:30具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一tracrRNA,其中該CRISPR重複序列與SEQ ID NO:18具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性; g)  與SEQ ID NO:31具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一tracrRNA,其中該CRISPR重複序列與SEQ ID NO:19具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性; h)  與SEQ ID NO:32具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一tracrRNA,其中該CRISPR重複序列與SEQ ID NO:20具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性; i)   與SEQ ID NO:33具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一tracrRNA,其中該CRISPR重複序列與SEQ ID NO:21具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性; j)   與SEQ ID NO:34具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一tracrRNA,其中該CRISPR重複序列與SEQ ID NO:22具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性; k)  與SEQ ID NO:35具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一tracrRNA,其中該CRISPR重複序列與SEQ ID NO:23具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;以及 l)   與SEQ ID NO:36具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一tracrRNA,其中該CRISPR重複序列與SEQ ID NO:24具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
  138. 如請求項134至請求項137中任一項所述的載體,其中該載體進一步包括編碼該RGN多肽的一多核苷酸。
  139. 如請求項138所述的載體,其中該RGN多肽選自由下列所組成的群組: a)  與SEQ ID NO:1具有至少90%序列一致性的一RGN多肽,其中該CRISPR重複序列與SEQ ID NO:13具有至少90%序列一致性,且該tracrRNA與SEQ ID NO:25具有至少90%序列一致性; b)  與SEQ ID NO:2具有至少90%序列一致性的一RGN多肽,其中該CRISPR重複序列與SEQ ID NO:14具有至少90%序列一致性,且該tracrRNA與SEQ ID NO:26具有至少90%序列一致性; c)  與SEQ ID NO:3具有至少90%序列一致性的一RGN多肽,其中該CRISPR重複序列與SEQ ID NO:15具有至少90%序列一致性,且該tracrRNA與SEQ ID NO:27具有至少90%序列一致性; d)  與SEQ ID NO:4具有至少90%序列一致性的一RGN多肽,其中該CRISPR重複序列與SEQ ID NO:16具有至少90%序列一致性,且該tracrRNA與SEQ ID NO:28具有至少90%序列一致性; e)  與SEQ ID NO:5具有至少90%序列一致性的一RGN多肽,其中該CRISPR重複序列與SEQ ID NO:17具有至少90%序列一致性,且該tracrRNA與SEQ ID NO:29具有至少90%序列一致性; f)   與SEQ ID NO:6具有至少90%序列一致性的一RGN多肽,其中該CRISPR重複序列與SEQ ID NO:18具有至少90%序列一致性,且該tracrRNA與SEQ ID NO:30具有至少90%序列一致性; g)  與SEQ ID NO:7具有至少90%序列一致性的一RGN多肽,其中該CRISPR重複序列與SEQ ID NO:19具有至少90%序列一致性,且該tracrRNA與SEQ ID NO:31具有至少90%序列一致性; h)  與SEQ ID NO:8具有至少90%序列一致性的一RGN多肽,其中該CRISPR重複序列與SEQ ID NO:20具有至少90%序列一致性,且該tracrRNA與SEQ ID NO:32具有至少90%序列一致性; i)   與SEQ ID NO:9具有至少90%序列一致性的一RGN多肽,其中該CRISPR重複序列與SEQ ID NO:21具有至少90%序列一致性,且該tracrRNA與SEQ ID NO:33具有至少90%序列一致性; j)   與SEQ ID NO:10具有至少90%序列一致性的一RGN多肽,其中該CRISPR重複序列與SEQ ID NO:22具有至少90%序列一致性,且該tracrRNA與SEQ ID NO:34具有至少90%序列一致性; k)  與SEQ ID NO:11具有至少90%序列一致性的一RGN多肽,其中該CRISPR重複序列與SEQ ID NO:23具有至少90%序列一致性,且該tracrRNA與SEQ ID NO:35具有至少90%序列一致性;以及 l)   與SEQ ID NO:12具有至少90%序列一致性的一RGN多肽,其中該CRISPR重複序列與SEQ ID NO:24具有至少90%序列一致性,且該tracrRNA與SEQ ID NO:36具有至少90%序列一致性。
  140. 如請求項138所述的載體,其中該RGN多肽選自由下列所組成的群組: a)  與SEQ ID NO:1具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一RGN多肽,其中該CRISPR重複序列與SEQ ID NO:13具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性,且該tracrRNA與SEQ ID NO:25具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性; b)  與SEQ ID NO:2具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一RGN多肽,其中該CRISPR重複序列與SEQ ID NO:14具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性,且該tracrRNA與SEQ ID NO:26具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性; c)  與SEQ ID NO:3具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一RGN多肽,其中該CRISPR重複序列與SEQ ID NO:15具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性,且該tracrRNA與SEQ ID NO:27具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性; d)  與SEQ ID NO:4具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一RGN多肽,其中該CRISPR重複序列與SEQ ID NO:16具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性,且該tracrRNA與SEQ ID NO:28具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性; e)  與SEQ ID NO:5具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一RGN多肽,其中該CRISPR重複序列與SEQ ID NO:17具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性,且該tracrRNA與SEQ ID NO:29具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性; f)   與SEQ ID NO:6具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一RGN多肽,其中該CRISPR重複序列與SEQ ID NO:18具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性,且該tracrRNA與SEQ ID NO:30具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性; g)  與SEQ ID NO:7具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一RGN多肽,其中該CRISPR重複序列與SEQ ID NO:19具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性,且該tracrRNA與SEQ ID NO:31具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性; h)  與SEQ ID NO:8具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一RGN多肽,其中該CRISPR重複序列與SEQ ID NO:20具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性,且該tracrRNA與SEQ ID NO:32具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性; i)   與SEQ ID NO:9具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一RGN多肽,其中該CRISPR重複序列與SEQ ID NO:21具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性,且該tracrRNA與SEQ ID NO:33具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性; j)   與SEQ ID NO:10具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一RGN多肽,其中該CRISPR重複序列與SEQ ID NO:22具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性,且該tracrRNA與SEQ ID NO:34具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性; k)  與SEQ ID NO:11具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一RGN多肽,其中該CRISPR重複序列與SEQ ID NO:23具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性,且該tracrRNA與SEQ ID NO:35具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;以及 l)   與SEQ ID NO:12具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一RGN多肽,其中該CRISPR重複序列與SEQ ID NO:24具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性,且該tracrRNA與SEQ ID NO:36具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
  141. 一種核酸分子,包括一轉錄活化的CRISPR RNA(tracrRNA)或編碼一tracrRNA的一多核苷酸,其中該tracrRNA包括與SEQ ID NO:25-36中任一者具有至少90%序列一致性的一核苷酸序列; 其中,當一引導RNA與一RNA引導的核酸酶(RGN)多肽結合時,該引導RNA能夠以一序列專一性方式、經由該crRNA的該間隔序列而與一標的DNA序列雜交,該引導RNA包括: a)     該tracrRNA;以及 b)    一crRNA,其包括一間隔序列及一CRISPR重複序列,其中該tracrRNA與該crRNA的該 CRISPR重複序列雜交。
  142. 如請求項141所述的核酸分子,其中編碼一tracrRNA的該多核苷酸可操作地連接至與該多核苷酸異源的一啟動子。
  143. 如請求項141或請求項142所述的核酸分子,其中該tracrRNA包括與SEQ ID NO:25-36中任一者具有至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的一核苷酸序列。
  144. 一種載體,包括如請求項141至請求項143中任一項所述的包括編碼該tracrRNA的該多核苷酸的核酸分子。
  145. 一種單引導RNA,包括如請求項131至請求項133中任一項所述的包括該crRNA的核酸分子及如請求項141至請求項143中任一項所述的包括該tracrRNA的核酸分子。
  146. 一種雙引導RNA,包括如請求項131至請求項133中任一項所述的包括該crRNA的核酸分子及如請求項141至請求項143中任一項所述的包括該tracrRNA的核酸分子。
  147. 一種細胞,包括如請求項131至請求項133及請求項141至請求項143中任一項所述的核酸分子、如請求項134至請求項140及請求項144中任一項所述的載體、如請求項145所述的單引導RNA、或如請求項145所述的雙引導RNA。
TW112103115A 2022-01-24 2023-01-30 Rna引導核酸酶、其活性片段與變體,及使用方法 TW202346583A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US202263302271P 2022-01-24 2022-01-24
US63/302,271 2022-01-24
US202263386061P 2022-12-05 2022-12-05
US63/386,061 2022-12-05

Publications (1)

Publication Number Publication Date
TW202346583A true TW202346583A (zh) 2023-12-01

Family

ID=85108841

Family Applications (1)

Application Number Title Priority Date Filing Date
TW112103115A TW202346583A (zh) 2022-01-24 2023-01-30 Rna引導核酸酶、其活性片段與變體,及使用方法

Country Status (2)

Country Link
TW (1) TW202346583A (zh)
WO (1) WO2023139557A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024095245A2 (en) 2022-11-04 2024-05-10 LifeEDIT Therapeutics, Inc. Evolved adenine deaminases and rna-guided nuclease fusion proteins with internal insertion sites and methods of use

Family Cites Families (61)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4217344A (en) 1976-06-23 1980-08-12 L'oreal Compositions containing aqueous dispersions of lipid spheres
US4196265A (en) 1977-06-15 1980-04-01 The Wistar Institute Method of producing antibodies
US4235871A (en) 1978-02-24 1980-11-25 Papahadjopoulos Demetrios P Method of encapsulating biologically active materials in lipid vesicles
US4186183A (en) 1978-03-29 1980-01-29 The United States Of America As Represented By The Secretary Of The Army Liposome carriers in chemotherapy of leishmaniasis
US4261975A (en) 1979-09-19 1981-04-14 Merck & Co., Inc. Viral liposome particle
US4485054A (en) 1982-10-04 1984-11-27 Lipoderm Pharmaceuticals Limited Method of encapsulating biologically active materials in multilamellar lipid vesicles (MLV)
US4501728A (en) 1983-01-06 1985-02-26 Technology Unlimited, Inc. Masking of liposomes from RES recognition
US5380831A (en) 1986-04-04 1995-01-10 Mycogen Plant Science, Inc. Synthetic insecticidal crystal protein gene
US4897355A (en) 1985-01-07 1990-01-30 Syntex (U.S.A.) Inc. N[ω,(ω-1)-dialkyloxy]- and N-[ω,(ω-1)-dialkenyloxy]-alk-1-yl-N,N,N-tetrasubstituted ammonium lipids and uses therefor
US4946787A (en) 1985-01-07 1990-08-07 Syntex (U.S.A.) Inc. N-(ω,(ω-1)-dialkyloxy)- and N-(ω,(ω-1)-dialkenyloxy)-alk-1-yl-N,N,N-tetrasubstituted ammonium lipids and uses therefor
US5049386A (en) 1985-01-07 1991-09-17 Syntex (U.S.A.) Inc. N-ω,(ω-1)-dialkyloxy)- and N-(ω,(ω-1)-dialkenyloxy)Alk-1-YL-N,N,N-tetrasubstituted ammonium lipids and uses therefor
US4797368A (en) 1985-03-15 1989-01-10 The United States Of America As Represented By The Department Of Health And Human Services Adeno-associated virus as eukaryotic expression vector
US5569597A (en) 1985-05-13 1996-10-29 Ciba Geigy Corp. Methods of inserting viral DNA into plant material
US4774085A (en) 1985-07-09 1988-09-27 501 Board of Regents, Univ. of Texas Pharmaceutical administration systems containing a mixture of immunomodulators
US4853331A (en) 1985-08-16 1989-08-01 Mycogen Corporation Cloning and expression of Bacillus thuringiensis toxin gene toxic to beetles of the order Coleoptera
US5268463A (en) 1986-11-11 1993-12-07 Jefferson Richard A Plant promoter α-glucuronidase gene construct
US5608142A (en) 1986-12-03 1997-03-04 Agracetus, Inc. Insecticidal cotton plants
US4837028A (en) 1986-12-24 1989-06-06 Liposome Technology, Inc. Liposomes with enhanced circulation time
US5039523A (en) 1988-10-27 1991-08-13 Mycogen Corporation Novel Bacillus thuringiensis isolate denoted B.t. PS81F, active against lepidopteran pests, and a gene encoding a lepidopteran-active toxin
WO1990011361A1 (en) 1989-03-17 1990-10-04 E.I. Du Pont De Nemours And Company External regulation of gene expression
EP0452269B1 (en) 1990-04-12 2002-10-09 Syngenta Participations AG Tissue-preferential promoters
US5264618A (en) 1990-04-19 1993-11-23 Vical, Inc. Cationic lipids for intracellular delivery of biologically active molecules
AU7979491A (en) 1990-05-03 1991-11-27 Vical, Inc. Intracellular delivery of biologically active substances by means of self-assembling lipid complexes
US5498830A (en) 1990-06-18 1996-03-12 Monsanto Company Decreased oil content in plant seeds
CA2051562C (en) 1990-10-12 2003-12-02 Jewel M. Payne Bacillus thuringiensis isolates active against dipteran pests
US5173414A (en) 1990-10-30 1992-12-22 Applied Immune Sciences, Inc. Production of recombinant adeno-associated virus vectors
US5399680A (en) 1991-05-22 1995-03-21 The Salk Institute For Biological Studies Rice chitinase promoter
EP0600993B1 (en) 1991-08-27 1999-11-10 Novartis AG Proteins with insecticidal properties against homopteran insects and their use in plant protection
TW261517B (zh) 1991-11-29 1995-11-01 Mitsubishi Shozi Kk
US5587308A (en) 1992-06-02 1996-12-24 The United States Of America As Represented By The Department Of Health & Human Services Modified adeno-associated virus vector capable of expression from a novel promoter
US5789156A (en) 1993-06-14 1998-08-04 Basf Ag Tetracycline-regulated transcriptional inhibitors
US5814618A (en) 1993-06-14 1998-09-29 Basf Aktiengesellschaft Methods for regulating gene expression
US5837458A (en) 1994-02-17 1998-11-17 Maxygen, Inc. Methods and compositions for cellular and metabolic engineering
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
US5608144A (en) 1994-08-12 1997-03-04 Dna Plant Technology Corp. Plant group 2 promoters and uses thereof
US5659026A (en) 1995-03-24 1997-08-19 Pioneer Hi-Bred International ALS3 promoter
US6072050A (en) 1996-06-11 2000-06-06 Pioneer Hi-Bred International, Inc. Synthetic promoters
ATE336580T1 (de) 1998-02-26 2006-09-15 Pioneer Hi Bred Int Mais met-1 promoter
US6534261B1 (en) 1999-01-12 2003-03-18 Sangamo Biosciences, Inc. Regulation of endogenous gene expression in cells using zinc finger proteins
CA2371442A1 (en) 1999-05-04 2000-11-09 Monsanto Technology Llc Coleopteran-toxic polypeptide compositions and insect-resistant transgenic plants
AU7491600A (en) 1999-09-15 2001-04-17 Monsanto Technology Llc Lepidopteran-active bacillus thuringiensis delta-endotoxin compositions and methods of use
DK1453547T3 (en) 2001-12-17 2016-12-05 Univ Pennsylvania ADENOASSOCATED VIRUS (AAV) SEROTYPE 8 SEQUENCES, VECTORS CONTAINING THESE AND APPLICATIONS THEREOF
US20050183161A1 (en) 2003-10-14 2005-08-18 Athenix Corporation AXMI-010, a delta-endotoxin gene and methods for its use
US7629504B2 (en) 2003-12-22 2009-12-08 Pioneer Hi-Bred International, Inc. Bacillus thuringiensis cry9 nucleic acids
WO2007147029A2 (en) 2006-06-14 2007-12-21 Athenix Corporation Axmi-031, axmi-039, axmi-040 and axmi-049, a family of delta-endotoxin genes and methods for their use
ES2738980T3 (es) 2008-09-15 2020-01-28 Childrens Medical Ct Corp Modulación de BCL11A para el tratamiento de hemoglobinopatías
US9392788B2 (en) * 2008-11-07 2016-07-19 North Carolina State University Mosquito attractant compositions and methods
WO2011002992A1 (en) 2009-07-02 2011-01-06 Athenix Corp. Axmi-205 pesticidal gene and methods for its use
WO2011084324A2 (en) 2009-12-21 2011-07-14 Pioneer Hi-Bred International, Inc. Novel bacillus thuringiensis gene with lepidopteran activity
CA2807375A1 (en) 2010-08-19 2012-02-23 Pioneer Hi-Bred International, Inc. Novel bacillus thuringiensis gene with lepidopteran activity
US9405700B2 (en) 2010-11-04 2016-08-02 Sonics, Inc. Methods and apparatus for virtualization in an integrated circuit
DE202013012242U1 (de) 2012-05-25 2016-02-02 Emmanuelle Charpentier Zusammensetzungen für die durch RNA gesteuerte Modifikation einer Ziel-DNA und für die durch RNA gesteuerte Modulation der Transkription
WO2014011237A1 (en) 2012-07-11 2014-01-16 Sangamo Biosciences, Inc. Methods and compositions for the treatment of lysosomal storage diseases
US11053481B2 (en) 2013-12-12 2021-07-06 President And Fellows Of Harvard College Fusions of Cas9 domains and nucleic acid-editing domains
WO2016033298A1 (en) 2014-08-28 2016-03-03 North Carolina State University Novel cas9 proteins and guiding features for dna targeting and genome editing
US9790490B2 (en) 2015-06-18 2017-10-17 The Broad Institute Inc. CRISPR enzymes and systems
IL310721A (en) 2015-10-23 2024-04-01 Harvard College Nucleobase editors and their uses
CA3032699A1 (en) 2016-08-03 2018-02-08 President And Fellows Of Harvard College Adenosine nucleobase editors and uses thereof
CN110914433A (zh) * 2017-03-24 2020-03-24 库尔维科公司 编码crispr相关蛋白质的核酸及其用途
US20220096543A1 (en) 2018-12-24 2022-03-31 Virgina Tech Intellectual Properties, Inc. Tollip deficient neutrophils and uses thereof
KR20230056630A (ko) * 2020-06-04 2023-04-27 에멘도바이오 인코포레이티드 신규의 omni-59, 61, 67, 76, 79, 80, 81 및 82 crispr 뉴클레아제

Also Published As

Publication number Publication date
WO2023139557A1 (en) 2023-07-27

Similar Documents

Publication Publication Date Title
US11926843B2 (en) RNA-guided nucleases and active fragments and variants thereof and methods of use
EP3902911B1 (en) Polypeptides useful for gene editing and methods of use
US11859181B2 (en) RNA-guided nucleases and active fragments and variants thereof and methods of use
CA3147783A1 (en) Rna-guided nucleases and active fragments and variants thereof and methods of use
US20230203463A1 (en) Rna-guided nucleases and active fragments and variants thereof and methods of use
TW202346583A (zh) Rna引導核酸酶、其活性片段與變體,及使用方法
WO2023139557A9 (en) Rna-guided nucleases and active fragments and variants thereof and methods of use
CA3125175A1 (en) Polypeptides useful for gene editing and methods of use
WO2021231437A1 (en) Rna-guided nucleic acid binding proteins and active fragments and variants thereof and methods of use
WO2024033901A1 (en) Rna-guided nucleases and active fragments and variants thereof and methods of use