TW202400626A - 降低脫靶效應的crispr酶突變 - Google Patents

降低脫靶效應的crispr酶突變 Download PDF

Info

Publication number
TW202400626A
TW202400626A TW112128864A TW112128864A TW202400626A TW 202400626 A TW202400626 A TW 202400626A TW 112128864 A TW112128864 A TW 112128864A TW 112128864 A TW112128864 A TW 112128864A TW 202400626 A TW202400626 A TW 202400626A
Authority
TW
Taiwan
Prior art keywords
crispr
sequence
target
cas9
guide
Prior art date
Application number
TW112128864A
Other languages
English (en)
Inventor
方 任恩
立伊 高
彼爾德 任史奇
伊恩 史拉馬可爾
Original Assignee
美商博得學院股份有限公司
麻省理工學院
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 美商博得學院股份有限公司, 麻省理工學院 filed Critical 美商博得學院股份有限公司
Publication of TW202400626A publication Critical patent/TW202400626A/zh

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/20Bacteria; Culture media therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/36Adaptation or attenuation of cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/111General methods applicable to biologically active non-coding nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y301/00Hydrolases acting on ester bonds (3.1)
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B23/00Models for scientific, medical, or mathematical purposes, e.g. full-sized devices for demonstration purposes
    • G09B23/28Models for scientific, medical, or mathematical purposes, e.g. full-sized devices for demonstration purposes for medicine
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/09Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Virology (AREA)
  • General Physics & Mathematics (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Mycology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Pure & Applied Mathematics (AREA)
  • Educational Technology (AREA)
  • Algebra (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Physics (AREA)
  • Medical Informatics (AREA)
  • Business, Economics & Management (AREA)
  • Educational Administration (AREA)
  • Computational Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Cell Biology (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Bakery Products And Manufacturing Methods Therefor (AREA)

Abstract

在此揭露並且要求保護CRISPR酶、例如Cas酶比如Cas9的一個或多個突變或一種或多種修飾,該等突變或修飾就含有或包括這樣一種經突變或修飾的Cas或CRISPR酶或Cas9的CRISPR-Cas或CRISPR酶或者CRISPR-Cas9系統或複合物的脫靶效應而言獲得改進,例如降低脫靶效應。還揭露並且要求保護用於製備和使用這樣的含有該等突變或修飾的經突變或修飾的Cas或CRISPR酶或Cas9和系統或複合物的方法和這樣的含有該等突變或修飾的經突變或修飾的Cas或CRISPR酶或Cas9和系統或複合物的用途以及來自這樣的方法和用途的產物。

Description

降低脫靶效應的CRISPR酶突變 [交叉引用/藉由引用併入]
參考提交於2015年6月18日的美國臨時申請案序號62/181,453,提交於2015年8月19日的美國臨時申請案序號62/207,312,提交於2015年10月5日的美國臨時申請案序號62/237,360,提交於2015年11月13日的美國臨時申請案序號62/255,256以及提交於2015年12月18日的美國臨時申請案序號62/269,876。
前述一個或多個申請以及在本文中引用或參考的所有文獻(“本文引用的文獻”)、以及在本文中引用的文獻中引用或參考的所有文獻,連同針對在本文中提及或藉由引用結合在本文中的任何文獻中的任何產品的任何製造商的說明書、說明、產品規格、和產品表,特此藉由引用併入本文,並且可以在本發明的實踐中採用。更具體地說,所有參考的文獻均藉由引用併入本文,其程度如同每個單獨的文獻被確切地並單獨地指明藉由引用而併入本文。
[關於聯邦資助研究的聲明]
本發明係根據由美國國立衛生研究院(National Institutes of Health)授予的授權號MH100706和MH110049在美國政府支持下完成的。美國政府享有本發明的某些權利。
本發明總體上涉及規律間隔成簇短迴文重複(CRISPR)、CRISPR酶(例如,Cas或Cas9)、CRISPR-Cas或CRISPR系統或CRISPR-Cas複合物、其組分、核酸分子(例如,包括它的載體)以及前述所有項的用途等方面。
如何在真核細胞中製備和使用CRISPR-Cas系統的授權揭露的首發公開係叢(Cong)等人,《科學》(Science)2013;339:819-823(線上公開於2013年1月3日)。如何在真核細胞中製備和使用CRISPR-Cas系統的授權揭露的首發專利申請係提交於2012年12月12日的張(Zhang)等人的美國臨時申請案序號61/736,527,許多專利申請要求該臨時申請的優先權,包括已經發展成為對未來有影響的美國專利案號8,999,641、8,993,233、8,945,839、8,932,814、8,906,616、8,895,308、8,889,418、8,889,356、8,871,445、8,865,406、8,795,965、8,771,945和8,697,359的那些。
與提供了使得能夠在真核細胞中使用CRISPR-Cas系統的突破性進展一致,博多研究所(Broad Institute)的張(Zhang)等人的實驗室意識到仍需要改進的CRISPR酶,該酶用於在實現對靶座位的修飾中 使用但是降低或消除朝向脫靶的活性。迫切需要用於降低CRISPR酶當與指導RNA複合時的脫靶活性的替代且穩健的系統和技術。還迫切需要用於增加CRISPR酶當與指導RNA複合時的活性的替代且穩健的系統和技術。
已經開發了若干增強Cas9特異性的策略,包括減少細胞中的Cas9量、使用Cas9切口酶突變體產生一對並列的單股DNA切口、截短5'端的指導序列、以及使用一對各自融合至FokI核酸酶結構域的無催化活性的Cas9核酸酶。
諸位發明人已經出人意料地確定,可以對CRISPR酶做出修飾,該等經修飾的CRISPR酶相比於未修飾的CRISPR酶賦予降低的脫靶活性和/或相比於未修飾的CRISPR酶賦予增加的靶標活性。因此,本文提供了可以在範圍廣泛的基因修飾應用中具有效用的改進的CRISPR酶。本文還提供了CRISPR複合物、組成物和系統,連同方法和用途,全部都包含本文揭露的修飾的CRISPR酶。CRISPR-Cas9係較佳的,包括但不限於SaCas9、SpCas9和異種同源物。
在一個方面,提供了工程化的CRISPR蛋白,其中該蛋白與包含RNA的核酸分子複合以形成CRISPR複合物,其中當在該CRISPR複合物中時,該核酸分子靶向一個或多個靶多核苷酸座位,該蛋白相比於未修飾的CRISPR包括至少一種修飾,並且其中包含經修飾蛋白的CRISPR複合物相比於包含未修飾的CRISPR蛋白的複合物具有改變的活性。CRISPR-Cas9係較佳的,包括但不限於SaCas9、SpCas9和異種同源物。CRISPR蛋白包括具有酶活性(例如核酸酶活性)的那些。
在一方面,該工程化的CRISPR蛋白的改變的活性包括就包含RNA的核酸分子或靶多核苷酸座位而言的改變的結合特性、就包含RNA的核酸分子或靶多核苷酸座位而言的改變的結合動力學、或就包含RNA的核酸分子或靶多核苷酸座位(相比於脫靶多核苷酸座位)而言的改變的結合特異性。
在某些實施方式中,該工程化的CRISPR蛋白的改變的活性包括增加的靶向效率或減少的脫靶結合。在某些實施方式中,該工程化的CRISPR蛋白的改變的活性包括修飾的切割活性。
在某些實施方式中,改變的活性包括就靶多核苷酸座位而言的增加的切割活性。在某些實施方式中,改變的活性包括就靶多核苷酸座位而言的降低的切割活性。在某些實施方式中,改變的活性包括就脫靶多核苷酸座位而言的降低的切割活性。在某些實施方式中,改變的活性包括就脫靶多核苷酸座位而言的增加的切割活性。因此,在某些實施方式中,與脫靶多核苷酸座位相比,對靶多核苷酸座位有增加的特異性。在其他實施方式中,與脫靶多核苷酸座位相比,對靶多核苷酸座位有降低的特異性。
在本發明的一方面,該工程化的CRISPR蛋白的改變的活性包括改變的解旋酶動力學。
在本發明的一方面,該工程化的CRISPR蛋白包含修飾,該修飾改變該蛋白與包含RNA的核酸分子、或靶多核苷酸座位的股、或脫靶多核苷酸座位的股的關聯。在本發明的一個方面,該工程化的CRISPR蛋白包含改變CRISPR複合物形成的修飾。
本發明提供了:
非天然存在的CRISPR酶,其中
該酶與指導RNA複合以形成CRISPR複合物,
當在該CRISPR複合物中時,該指導RNA靶向一個或多個靶多核苷酸座位並且該酶改變該等多核苷酸座位,並且
該酶包括至少一種修飾,
由此與未修飾的酶相比該CRISPR複合物中的酶具有降低的修飾一個或多個脫靶座位的能力,和/或由此與未修飾的酶相比該CRISPR複合物中的酶具有增加的修飾一個或多個靶座位的能力。
在任何這樣的非天然存在的CRISPR酶中,修飾可以包括該酶的一個或多個胺基酸殘基的修飾。
在任何這樣的非天然存在的CRISPR酶中,修飾可以包括位於區域中的一個或多個胺基酸殘基的修飾,該區域包含在未修飾的酶中帶正電的殘基。
在任何這樣的非天然存在的CRISPR酶中,修飾可以包括一個或多個胺基酸殘基的修飾,該等胺基酸殘基在未修飾的酶中是帶正電的。
在任何這樣的非天然存在的CRISPR酶中,修飾可以包括一個或多個胺基酸殘基的修飾,該等胺基酸殘基在未修飾的酶中是不帶正電的。
修飾可以包括一個或多個胺基酸殘基的修飾,該等胺基酸 殘基在未修飾的酶中是不帶電的。
修飾可以包括一個或多個胺基酸殘基的修飾,該等胺基酸殘基在未修飾的酶中是帶負電的。
修飾可以包括一個或多個胺基酸殘基的修飾,該等胺基酸殘基在未修飾的酶中是疏水的。
修飾可以包括一個或多個胺基酸殘基的修飾,該等胺基酸殘基在未修飾的酶中是極性的。
在任何以上描述的非天然存在的CRISPR酶中,該酶可以包括II型CRISPR酶。該酶可以包括Cas9酶。
在某些以上描述的非天然存在的CRISPR酶中,修飾可以包括位於區域中的一個或多個殘基的修飾,該區域在RuvC結構域與HNH結構域之間。RuvC結構域可以包括RuvCII結構域或RuvCIII結構域。修飾可以包括位於溝槽中的一個或多個殘基的修飾。
在某些以上描述的非天然存在的CRISPR酶中,修飾可以包括位於RuvC結構域與HNH結構域之間的區域外、或溝槽外的一個或多個殘基的修飾。
在某些以上描述的非天然存在的CRISPR酶中,修飾可以包括區域中的一個或多個殘基的修飾,該區域包含:
釀膿鏈球菌Cas9(SpCas9)的殘基R63至K1325或K775至K1325或另一Cas9異種同源物中的相應區域;或者
金黃色葡萄球菌Cas9(SaCas9)的殘基K37至K736或另一Cas9異 種同源物中的相應區域。
在某些以上描述的非天然存在的CRISPR酶中,修飾包括一個或多個殘基的修飾,其中這一個或多個殘基包括精胺酸、組胺酸或賴胺酸。
在任何以上描述的非天然存在的CRISPR酶中,可以藉由突變所述一個或多個殘基來修飾該酶。
在某些以上描述的非天然存在的CRISPR酶中,藉由突變所述一個或多個殘基來修飾該酶,並且其中該突變包括用丙胺酸殘基取代未修飾的酶中的殘基。
在某些以上描述的非天然存在的CRISPR酶中,藉由突變所述一個或多個殘基來修飾該酶,並且其中該突變包括用天冬胺酸或穀胺酸取代未修飾的酶中的殘基。
在某些以上描述的非天然存在的CRISPR酶中,藉由突變所述一個或多個殘基來修飾該酶,並且其中該突變包括用絲胺酸、蘇胺酸、天冬醯胺或穀胺醯胺取代未修飾的酶中的殘基。
在某些以上描述的非天然存在的CRISPR酶中,藉由突變所述一個或多個殘基來修飾該酶,並且其中該突變包括用丙胺酸、甘胺酸、異亮胺酸、亮胺酸、甲硫胺酸、苯丙胺酸、色胺酸、酪胺酸或纈胺酸取代未修飾的酶中的殘基。
在某些以上描述的非天然存在的CRISPR酶中,藉由突變所述一個或多個殘基來修飾該酶,並且其中該突變包括用極性胺基酸殘 基取代未修飾的酶中的殘基。
在某些以上描述的非天然存在的CRISPR酶中,藉由突變所述一個或多個殘基來修飾該酶,並且其中該突變包括用不是極性胺基酸殘基的胺基酸殘基取代未修飾的酶中的殘基。
在某些以上描述的非天然存在的CRISPR酶中,藉由突變所述一個或多個殘基來修飾該酶,並且其中該突變包括用帶負電的胺基酸殘基取代未修飾的酶中的殘基。
在某些以上描述的非天然存在的CRISPR酶中,藉由突變所述一個或多個殘基來修飾該酶,並且其中該突變包括用不是帶負電的胺基酸殘基的胺基酸殘基取代未修飾的酶中的殘基。
在某些以上描述的非天然存在的CRISPR酶中,藉由突變所述一個或多個殘基來修飾該酶,並且其中該突變包括用不帶電的胺基酸殘基取代未修飾的酶中的殘基。
在某些以上描述的非天然存在的CRISPR酶中,藉由突變所述一個或多個殘基來修飾該酶,並且其中該突變包括用不是不帶電的胺基酸殘基的胺基酸殘基取代未修飾的酶中的殘基。
在某些以上描述的非天然存在的CRISPR酶中,藉由突變所述一個或多個殘基來修飾該酶,並且其中該突變包括用疏水胺基酸殘基取代未修飾的酶中的殘基。
在某些以上描述的非天然存在的CRISPR酶中,藉由突變所述一個或多個殘基來修飾該酶,並且其中該突變包括用不是疏水胺基 酸殘基的胺基酸殘基取代未修飾的酶中的殘基。
該非天然存在的CRISPR酶可以是SpCas9或SpCas9的異種同源物,並且其中:
藉由突變列於表1-7的任一項中的SpCas9或SaCas9殘基中的任一項或Cas9異種同源物中的相應殘基來修飾該酶,或者該酶包括修飾,例如包括藉由突變列於表1-7的任一項中的SpCas9或SaCas9殘基中的任一項或Cas9異種同源物中的相應殘基進行的修飾、基本上由其組成或由其組成;或者
該酶包括根據貫穿本申請的揭露(包括但不限於在概述中和/或在附圖簡要說明中和/或在詳細說明中和/或在任何實例中和/或在任何圖中)的任何一個(單)、兩個(雙)、三個(三)、四個(四)或更多個位置、或Cas9異種同源物中的相應殘基或位置中的修飾、基本上由其組成或由其組成,例如,包括敘述於任何概述中和/或附圖簡要說明中和/或詳細說明中和/或任何實例中和/或任何圖中或本文的其他地方的Cas9殘基中的任一項、或Cas9異種同源物中的相應殘基或位置中的修飾、基本上由其組成或由其組成的酶。在這樣一種酶中,可以藉由用丙胺酸殘基取代來修飾每個殘基。
在某些以上描述的非天然存在的CRISPR酶中,藉由突變一個或多個殘基(包括但不限於位置12、13、63、415、610、775、779、780、810、832、848、855、861、862、866、961、968、974、976、982、983、1000、1003、1014、1047、1060、1107、1108、1109、1114、1129、1240、1289、1296、1297、1300、1311和1325,參考SpCas9的胺基酸位 置編號)來修飾該酶。
在某些以上描述的非天然存在的CRISPR酶中,藉由突變修飾該酶並且該酶在殘基(包括但不限於位置63、415、775、779、780、810、832、848、855、861、862、866、961、968、974、976、982、983、1000、1003、1014、1047、1060、1107、1108、1109、1114、1129、1240、1289、1296、1297、1300、1311或1325,參考SpCas9的胺基酸位置編號)處包括一個或多個丙胺酸取代。
在某些以上描述的非天然存在的CRISPR酶中,藉由突變修飾該酶並且該酶包括K775A、E779L、Q807A、R780A、K810A、R832A、K848A、K855A、K862A、K866A、K961A、K968A、K974A、R976A、H982A、H983A、K1000A、K1014A、K1047A、K1060A、K1003A、K1107A、S1109A、H1240A、K1289A、K1296A、H1297A、K1300A、H1311A或K1325A的一個或多個取代。
在某些以上描述的非天然存在的CRISPR酶中,藉由突變修飾該酶並且該酶包括兩個或更多個取代,其中這兩個或更多個取代包括但不限於R783A和A1322T、或R780A和K810A、或ER780A和K855A、或R780A和R976A、或K848A和R976A、或K855A和R976A,和R780A和K848A、或K810A和K848A、或K848A和K855A、或K810A和K855A、或H982A和R1060A、或H982A和R1003A、或K1003A和R1060A、或R780A和H982A、或K810A和H982A、或K848A和H982A、或K855A和H982A、或R780A和K1003A、或K810A和R1003A、或K848A和K1003A、或K848A和K1007A、或R780A和R1060A、或K810A和R1060A、或K848A和 R1060A、或R780A和R1114A、或K848A和R1114A、或R63A和K855A、或R63A和H982A、或H415A和R780A、或H415A和K848A、或K848A和E1108A、或K810A和K1003A、或R780A和R1060A、K810A和R1060A、或K848A和R1060A。
在某些以上描述的非天然存在的CRISPR酶中,藉由突變修飾該酶並且該酶包括三個或更多個取代,其中這三個或更多個取代包括但不限於H982A、K1003A和K1129E,或R780A、K1003A和R1060A,或K810A、K1003A和R1060A,或K848A、K1003A和R1060A,或K855A、K1003A和R1060A,或H982A、K1003A和R1060A,或R63A、K848A和R1060A,或T13I、R63A和K810A,或G12D、R63A和R1060A。
在某些以上描述的非天然存在的CRISPR酶中,藉由突變修飾該酶並且該酶包括四個或更多個取代,其中這四個或更多個取代包括但不限於R63A、E610G、K855A和R1060A,或R63A、K855A、R1060A和E610G。
在一個較佳的實施方式中,該非天然存在的CRISPR酶中的突變不是列於表B中的突變。在進一步較佳的實施方式中,該非天然存在的CRISPR酶中的突變不是R63A、K866A、H982A、H983A、K1107A、K1107A、KES1107-1109AG或KES1107-1109GG(參考SpCas9的胺基酸位置編號)。在進一步較佳的實施方式中,該非天然存在的CRISPR酶不是藉由選自R63A、K866A、H982A、H983A、K1107A和K1107A的單突變修飾的酶或藉由選自KES1107-1109AG和KES1107-1109GG的突變修飾的 酶(參考SpCas9的胺基酸位置編號)。
在較佳的實施方式中,藉由突變一個或多個殘基(包括但不限於位置12、13、415、610、775、779、780、810、832、848、855、861、862、961、968、974、976、1000、1003、1014、1047、1060、1114、1129、1240、1289、1296、1297、1300、1311和1325,參考SpCas9的胺基酸位置編號)來修飾以上描述的非天然存在的CRISPR酶。
在進一步較佳的實施方式中,藉由突變修飾以上描述的非天然存在的CRISPR酶並且該酶在殘基(包括但不限於位置415、775、779、780、810、832、848、855、861、862、961、968、974、976、1000、1003、1014、1047、1060、1114、1129、1240、1289、1296、1297、1300、1311或1325,參考SpCas9的胺基酸位置編號)處包括一個或多個丙胺酸取代。
在進一步較佳的實施方式中,藉由突變修飾以上描述的非天然存在的CRISPR酶並且該酶包括K775A、E779L、Q807A、R780A、K810A、R832A、K848A、K855A、K862A、K961A、K968A、K974A、R976A、K1000A、K1014A、K1047A、K1060A、K1003A、S1109A、H1240A、K1289A、K1296A、H1297A、K1300A、H1311A或K1325A的一個或多個取代。
在任何非天然存在的CRISPR酶中:
可以在靶標與一個或多個脫靶座位的對應序列之間存在單個錯配;和/或
可以在靶標與一個或多個脫靶座位的對應序列之間存在兩個、三個或四個或更多個錯配,和/或
其中在(ii)中,所述兩個、三個或四個或更多個錯配係連續的。
在任何非天然存在的CRISPR酶中,與未修飾的酶相比該CRISPR複合物中的酶可以具有降低的修飾一個或多個脫靶座位的能力,並且其中與未修飾的酶相比該CRISPR複合物中的酶具有增加的修飾所述靶座位的能力。
在任何非天然存在的CRISPR酶中,當在該CRISPR複合物中時,與未修飾的酶的相對差異相比,該酶在靶標與至少一個脫靶座位之間的修飾能力的相對差異可以是增加的。
在任何非天然存在的CRISPR酶中,該CRISPR酶可以包括一個或多個另外的突變,其中這一個或多個另外的突變在一個或多個催化活性結構域之中。
在此類非天然存在的CRISPR酶中,與缺乏所述一個或多個另外的突變的酶相比,該CRISPR酶可以具有降低的或消除的核酸酶活性。
在一些這樣的非天然存在的CRISPR酶中,該CRISPR酶並不指導一條或另一條DNA股在靶序列位置處的切割。
在一些這樣的非天然存在的CRISPR酶中,這一個或多個另外的突變包括SpCas9的D10、SpCas9的E762、SpCas9的H840、SpCas9的N854、SpCas9的N863和/或SpCas9的D986或者其他Cas9異種同源物的 相應殘基的突變。
在一些這樣的非天然存在的CRISPR酶中,這一個或多個另外的突變包括SpCas9的D10A、E762A、H840A、N854A、N863A和/或D986A或者其他Cas9異種同源物的相應殘基。
在一些這樣的非天然存在的CRISPR酶中,這一個或多個另外的突變包括兩個另外的突變。這兩個另外的突變可以包括D10A SpCas9和H840A SpCas9,或另一Cas9異種同源物的相應殘基。在一些這樣的非天然存在的CRISPR酶中,該CRISPR酶可以不指導任一條DNA股在靶序列位置處的切割。
在該CRISPR酶在一個或多個催化活性結構域中包括一個或多個另外的突變的情況下,這一個或多個另外的突變可以在CRISPR酶的包括RuvCI、RuvCII或RuvCIII的催化活性結構域之中。
不受理論所束縛,在本發明的一個方面,所描述的方法和突變提供了增強Cas9結構域向導致中靶位點處的切割並且避免脫靶位點處的那些構象狀態的位置的構象重排。Cas9藉由一系列協調的步驟切割靶DNA。首先,PAM相互作用結構域識別靶DNA的5’的PAM序列。PAM結合之後,針對sgRNA:DNA互補性對靶序列的前10-12個核苷酸(種子序列)取樣,一個依賴於DNA雙股體(duplex)分離的過程。如果種子序列核苷酸與sgRNA互補,則將DNA的其餘部分解旋並且使全長的sgRNA與靶DNA股雜交。RuvC與HNH結構域之間的nt-溝槽使非靶向的DNA股穩定化並且藉由與DNA磷酸骨架的正電荷的非特異性相互作用有助於解旋。RNA:cDNA和Cas9:ncDNA相互作用驅動DNA解旋與cDNA:ncDNA再 雜交的競爭。其他Cas9結構域也影響核酸酶結構域的構象,例如連接HNH與RuvCII和RuvCIII的接頭。因此,所提供的方法和突變涵蓋但不限於RuvCI、RuvCIII、RuvCIII和HNH結構域以及接頭。藉由靶DNA結合(包括種子序列相互作用)導致Cas9的構象變化,並且與靶DNA股和非靶DNA股的相互作用決定了該等結構域是否被定位以觸發核酸酶活性。因此,本文提供的突變和方法證實並且允許超出PAM識別和RNA-DNA鹼基配對的修飾。
在一方面,本發明提供了Cas9核酸酶,該等核酸酶當牽涉在中靶相互作用中時包括朝向與切割活性相關的構象的改進的平衡和/或當牽涉在脫靶相互作用中時包括遠離與切割活性相關的構象的改進的平衡。在一個方面,本發明提供了具有改進的校對功能的Cas9核酸酶,即採取在中靶位點處包括核酸酶活性的構象的Cas9核酸酶,並且該構象在脫靶位點處具有增加的不利性。斯騰伯格(Sternberg)等人(《自然》(Nature)527(7576):110-3,doi:10.1038/nature15544,線上公開於2015年10月28日,電子版2015年10月28日)使用螢光共振能量轉移(FRET)實驗檢測當與中靶和脫靶DNA關聯時Cas9催化結構域的相對方向。
本發明進一步提供了用於使用修飾的指導RNA調節核酸酶活性和/或特異性的方法和突變。如所討論的,可以增加或降低中靶核酸酶活性。同樣地,可以增加或降低脫靶核酸酶活性。此外,就中靶活性與脫靶活性而言的特異性可以增加或降低。修飾的指導RNA包括但不限於截短的指導RNA、失活的指導RNA、經化學修飾的指導RNA、與功能結構域相關的指導RNA、包含功能結構域的修飾的指導RNA、包含適 配體的修飾的指導RNA、包含轉接蛋白的修飾的指導RNA、以及包含添加的或修飾的環的指導RNA。
在一方面,本發明還提供了用於調節Cas9結合活性和/或結合特異性的方法和突變。在某些實施方式中,使用缺乏核酸酶活性的Cas9蛋白。在某些實施方式中,採用促進Cas9核酸酶的結合活性但不促進其核酸酶活性的修飾的指導RNA。在此類實施方式中,可以增加或減少中靶結合。同樣地,在此類實施方式中,可以增加或減少脫靶結合。此外,就中靶結合與脫靶結合而言的特異性可以增加或降低。
可以按不同組合採用以便增加或降低中靶與脫靶活性的活性和/或特異性或者增加或降低中靶與脫靶結合的結合和/或特異性的方法和突變可以用來補償或增強用以促進其他效應的突變或修飾。用以促進其他效應的此類突變或修飾包括對Cas9的突變或修飾和或對指導RNA做出的突變或修飾。在某些實施方式中,將該等方法和突變與經化學修飾的指導RNA一起使用。指導RNA化學修飾的實例包括但不限於在一個或多個末端核苷酸處摻入2'-O-甲基(M)、2'-O-甲基3'硫代磷酸酯(phosphorothioate)(MS)、或2'-O-甲基3'硫代PACE(MSP)。與未修飾的指導RNA相比,此類經化學修飾的指導RNA可以包括增加的穩定性和增加的活性,但是中靶與脫靶特異性係不可預測的。(參見,亨德爾(Hendel),2015,《自然生物技術》(Nat Biotechnol.)33(9):985-9,doi:10.1038/nbt.3290,線上公開於2015年6月29日)。經化學修飾的指導RNA進一步包括但不限於具有硫代磷酸酯鍵的RNA和在核糖環的2'和4'碳之間包含亞甲橋的鎖核酸(LNA)核苷酸。使用本發明的方法和突變調節 Cas9核酸酶活性和/或與經化學修飾的指導RNA的結合。
在一方面,本發明提供了用於調節Cas9蛋白的結合和/或結合特異性的方法和突變,該等蛋白包含功能結構域,如核酸酶、轉錄活化蛋白、轉錄抑制蛋白等。例如,可以藉由在核酸酶結構域RuvC和HNH中引入突變(如D10A、D839A、H840A和N863A)使得Cas9蛋白的核酸酶無效。核酸酶缺陷型Cas9蛋白可用於功能結構域的RNA指導的靶序列依賴性遞送。本發明提供了用於調節Cas9蛋白的結合的方法和突變。在一個實施方式中,功能結構域包括VP64,從而提供RNA指導的轉錄因子。在另一個實施方式中,功能結構域包括Fok I,從而提供RNA指導的核酸酶活性。提及的是美國專利公開2014/0356959、美國專利公開2014/0342456、美國專利公開2015/0031132、以及線上公開於2013年1月3日的瑪麗,P(Mali,P.)等人,2013,《科學》(Science)339(6121):823-6,doi:10.1126/science.1232033,並且藉由本文的傳授,本發明包括與本文的傳授結合應用的該等文獻的方法和材料。在某些實施方式中,中靶結合係增加的。在某些實施方式中,脫靶結合係降低的。在某些實施方式中,中靶結合係降低的。在某些實施方式中,脫靶結合係增加的。因此,本發明還提供了增加或降低功能化Cas9結合蛋白的中靶結合與脫靶結合的特異性。
將Cas9用作RNA指導的結合蛋白並不限於核酸酶無效的Cas9。當與某些指導RNA一起使用時,包括核酸酶活性的Cas9酶還可以充當RNA指導的結合蛋白。例如,短指導RNA和包含與靶標錯配的核苷酸的指導RNA可以促進與靶序列的RNA引導的Cas9結合,並且靶標有很 少或沒有切割。(參見例如,達爾曼(Dahlman),2015,《自然生物技術》(Nat Biotechnol.)33(11):1159-1161,doi:10.1038/nbt.3390,線上公開於2015年10月05日)。在一方面,本發明提供了用於調節Cas9蛋白的結合的方法和突變,該等蛋白包括核酸酶活性。在某些實施方式中,中靶結合係增加的。在某些實施方式中,脫靶結合係降低的。在某些實施方式中,中靶結合係降低的。在某些實施方式中,脫靶結合係增加的。在某些實施方式中,中靶結合與脫靶結合的特異性係增加的或降低的。在某些實施方式中,還調節指導RNA-Cas9酶的核酸酶活性。
RNA-DNA異源雙股體形成對於整個靶區域的切割活性和特異性而言是重要的,不僅僅是最靠近PAM的種子區序列。因此,截短的指導RNA顯示出降低的切割活性和特異性。在一方面,本發明提供了用於使用改變的指導RNA增加切割活性和特異性的方法和突變。
本發明還證實了Cas9核酸酶特異性的修飾可以與靶向範圍的修飾配合進行。可以設計具有增加的靶標特異性並且在PAM識別中適應修飾的Cas9突變體,例如藉由選擇改變PAM特異性的突變並且將那些突變與增加(或如果希望的話,降低)對中靶序列與脫靶序列的特異性的nt-溝槽突變組合。在一個這樣的實施方式中,將PI結構域殘基突變以適應所希望的PAM序列的識別,同時將一個或多個nt-溝槽胺基酸突變以改變靶標特異性。克萊因史迪維爾(Kleinstiver)涉及SpCas9和SaCas9核酸酶,其中某些PI結構域殘基被突變並且識別替代性PAM序列(參見,克萊因史迪維爾等人,《自然》(Nature)523(7561):481-5doi:10.1038/nature14592,線上公開於2015年6月22日;克萊因史迪維爾等人, 《自然生物技術》(Nature Biotechnology),doi:10.1038/nbt.3404,線上公開於2015年11月2日)。本文描述的Cas9方法和修飾可以用於對抗由PAM識別改變導致的特異性損失、增強由PAM識別改變導致的特異性增益、對抗由PAM識別改變導致的特異性增益、或增強由PAM識別改變導致的特異性損失。
該等方法和突變可以與具有改變的PAM識別的任何Cas9酶一起使用。PAM的非限制性實例包括NGG、NNGRRT、NN[A/C/T]RRT、NGAN、NGCG、NGAG、NGNG、NGC、以及NGA。
在另外的實施方式中,該等方法和突變使用經修飾的蛋白。
在任何非天然存在的CRISPR酶中,該CRISPR酶可以包括一個或多個異源功能結構域。
這一個或多個異源功能結構域可以包括一個或多個核定位信號(NLS)結構域。這一個或多個異源功能結構域可以包括至少兩個或更多個NLS。
在本發明的某些實施方式中,至少一個核定位信號(NLS)附接到編碼Cas9效應蛋白的核酸序列。在較佳的實施方式中,至少一個或多個C-末端或N-末端NLS被附接(並且因此編碼Cas9效應蛋白的一個或多個核酸分子可以包括對一個或多個NLS的編碼,這樣使得表現產物的一個或多個NLS被附接或連接)。在較佳的實施方式中,C-末端NLS被附接,用於在真核細胞(較佳的是人類細胞)中進行最佳表現和核靶向。在較佳的實施方式中,密碼子優化的效應蛋白係SpCas9或SaCas9並且指 導RNA的間隔子長度係從15至35nt。在某些實施方式中,指導RNA的間隔子長度係至少16個核苷酸,如至少17個核苷酸。在某些實施方式中,間隔子長度係從15至17nt、從17至20nt、從20至24nt(例如20、21、22、23或24nt)、從23至25nt(例如23、24或25nt)、從24至27nt、從27-30nt、從30-35nt、或35nt或更長。在本發明的某些實施方式中,密碼子優化的效應蛋白係SpCas9或SaCas9並且指導RNA的同向(direct)重複長度係至少16個核苷酸。在某些實施方式中,密碼子優化的效應蛋白係FnCpflp並且指導RNA的同向重複長度係從16至20nt,例如16、17、18、19、或20個核苷酸。在某些較佳的實施方式中,指導RNA的同向重複長度係19個核苷酸。
這一個或多個異源功能結構域包括一個或多個轉錄活化結構域。轉錄活化結構域可以包括VP64。
這一個或多個異源功能結構域包括一個或多個轉錄抑制結構域。轉錄抑制結構域可以包括KRAB結構域或SID結構域。
這一個或多個異源功能結構域可以包括一個或多個核酸酶結構域。這一個或多個核酸酶結構域可以包括Fok1。
這一個或多個異源功能結構域可以具有一種或多種以下活性:修飾烷酶活性、去甲酶活性、轉錄活化活性、轉錄抑制活性、轉錄釋放因子活性、組蛋白修飾活性、核酸酶活性、單股RNA切割活性、雙股RNA切割活性、單股DNA切割活性、雙股DNA切割活性以及核酸結合活性。
這至少一個或多個異源功能結構域可以在該酶的胺基-末 端處或附近和/或在該酶的羧基-末端處或附近。
這一個或多個異源功能結構域可以融合至該CRISPR酶,或系栓至該CRISPR酶,或藉由接頭部分連接至該CRISPR酶。
在任何非天然存在的CRISPR酶中,該CRISPR酶可以包括來自以下屬的生物的CRISPR酶,包括鏈球菌屬、彎曲桿菌屬、Nitratifractor、葡萄球菌屬、細小棒菌屬(Parvibaculum)、羅氏菌屬(Roseburia)、奈瑟氏菌屬、葡糖醋桿菌屬(Gluconacetobacter)、固氮螺菌屬、Sphaerochaeta、乳桿菌屬、真桿菌屬或棒狀桿菌屬。
在任何非天然存在的CRISPR酶中,該CRISPR酶可以包括嵌合Cas9酶,該嵌合Cas9酶包含來自第一Cas9異種同源物的第一片段和來自第二Cas9異種同源物的第二片段,並且該第一和第二Cas9異種同源物係不同的。該第一和第二Cas9異種同源物中至少一者可以包括來自以下生物的Cas9,包括鏈球菌屬、彎曲桿菌屬、Nitratifractor、葡萄球菌屬、細小棒菌屬、羅氏菌屬、奈瑟氏菌屬、葡糖醋桿菌屬、固氮螺菌屬、Sphaerochaeta、乳桿菌屬、真桿菌屬或棒狀桿菌屬。
在任何非天然存在的CRISPR酶中,編碼該CRISPR酶的核苷酸序列經密碼子優化以便在真核生物中表現。
在任何非天然存在的CRISPR酶中,該細胞可以是真核細胞或原核細胞;其中該CRISPR複合物在該細胞中是可操作的,並且由此與未修飾的酶相比該CRISPR複合物的酶具有降低的修飾該細胞的一個或多個脫靶座位的能力,和/或由此與未修飾的酶相比該CRISPR複合物中的酶具有增加的修飾一個或多個靶座位的能力。
本發明還提供了非天然存在的、工程化的組成物,該組成物包含CRISPR-Cas複合物,該複合物包含以上描述的任何非天然存在的CRISPR酶。
本發明還提供了非天然存在的、工程化的組成物,該組成物包含:
遞送系統,該遞送系統被可操作地配置為將CRISPR-Cas複合物組分或者包含或編碼所述組分的一個或多個多核苷酸序列遞送到細胞中,並且其中所述CRISPR-Cas複合物在該細胞中是可操作的,
CRISPR-Cas複合物組分或編碼該等CRISPR-Cas複合物組分在細胞中的轉錄和/或翻譯的一個或多個多核苷酸序列,該等複合物組分或多核苷酸序列包含:
(I)根據以上申請專利範圍項中任一項所述之非天然存在的CRISPR酶;
(II)CRISPR-Cas複合物RNA,其包含:
指導序列,
tracr配對序列,和
tracr序列,
其中:
在該細胞中:
該tracr配對序列雜交到該tracr序列上;
形成CRISPR複合物;
該指導RNA靶向靶多核苷酸座位並且該酶改變該等多核苷酸座位,並且
與未修飾的酶相比該CRISPR複合物中的酶具有降低的修飾一個或多個脫靶座位的能力,和/或由此與未修飾的酶相比該CRISPR複合物中的酶具有增加的修飾一個或多個靶座位的能力。
在任何這樣的組成物中,該遞送系統可以包括酵母系統、脂轉染系統、顯微注射系統、基因槍系統、病毒體、脂質體、免疫脂質體、聚陽離子、脂質:核酸綴合物或人工病毒粒子。
在任何這樣的組成物中,該遞送系統可以包括載體系統,該載體系統包含一種或多種載體,並且其中組分(II)包括可操作地連接至多核苷酸序列的第一調節元件,該多核苷酸序列包含指導序列、tracr配對序列和tracr序列,並且其中組分(I)包括可操作地連接至編碼CRISPR酶的多核苷酸序列的第二調節元件。在此類組成物中,該指導RNA或CRISPR-Cas複合物RNA可以包括嵌合RNA。
在任何這樣的組成物中,該遞送系統可以包括載體系統,該載體系統包含一種或多種載體,並且其中組分(II)包括可操作地連接至指導序列和tracr配對序列的第一調節元件、和可操作地連接至tracr序列的第三調節元件,並且其中組分(I)包括可操作地連接至編碼CRISPR酶的多核苷酸序列的第二調節元件。
在任何這樣的組成物中,該組成物可以包含多於一種指導 RNA,並且每種指導RNA具有不同靶標,由此存在多元性。
在任何這樣的組成物中,一個或多個多核苷酸序列可以在一個載體上。
本發明還提供了工程化的、非天然存在的規律間隔成簇短迴文重複(CRISPR)-CRISPR相關(Cas)(CRISPR-Cas)載體系統,該載體系統包含一種或多種載體,這一種或多種載體包含:
a)第一調節元件,該第一調節元件可操作地連接至核苷酸序列,該核苷酸序列編碼在此發明的構建體的任一項的非天然存在的CRISPR酶;和
b)第二調節元件,該第二調節元件可操作地連接至一個或多個編碼指導RNA中的一個或多個的核苷酸序列,該指導RNA包含指導序列、tracr序列、和tracr配對序列,
其中:
組分(a)和(b)位於相同或不同載體上,
該tracr配對序列雜交到該tracr序列上;
形成CRISPR複合物;
該指導RNA靶向靶多核苷酸座位並且該酶改變該等多核苷酸座位,並且
與未修飾的酶相比該CRISPR複合物中的酶具有降低的修飾一個或多個脫靶座位的能力,和/或由此與未修飾的酶相比該CRISPR複合物中的酶具有增加的修飾一個或多個靶座位的能力。
在這樣一種系統中,組分(II)可以包括可操作地連接至多核苷酸序列的第一調節元件,該多核苷酸序列包含指導序列、tracr配對序列和tracr序列,並且其中組分(II)可以包括可操作地連接至編碼CRISPR酶的多核苷酸序列的第二調節元件。在這樣一種系統中,該指導RNA可以包括嵌合RNA。
在這樣一種系統中,組分(I)可以包括可操作地連接至指導序列和tracr配對序列的第一調節元件、和可操作地連接至tracr序列的第三調節元件,並且其中組分(II)可以包括可操作地連接至編碼CRISPR酶的多核苷酸序列的第二調節元件。這樣一種系統可以包含多於一種指導RNA,並且每種指導RNA具有不同靶標,由此存在多元性。組分(a)和(b)可以在同一載體上。
在任何這樣的包含載體的系統中,這一種或多種載體可以包括一種或多種病毒載體,如一種或多種逆轉錄病毒、慢病毒、腺病毒、腺相關病毒或單純皰疹病毒。
在任何這樣的包含調節元件的系統中,所述調節元件中至少一者可以包括組織特異性啟動子。組織特異性啟動子可以指導在哺乳動物血細胞中的、在哺乳動物肝細胞中的或在哺乳動物眼中的表現。
在任何以上描述的組成物或系統中,該tracr序列可以包括一個或多個蛋白質相互作用RNA適配體。這一個或多個適配體可以位於tracr序列的四核苷酸環(tetraloop)和/或莖環2中。這一個或多個適配體可以能夠結合MS2噬菌體外殼蛋白。
在任何以上描述的組成物或系統中,該tracr序列在長度上 可以是30或更多個核苷酸。
在任何以上描述的組成物或系統中,該細胞可以是真核細胞或原核細胞;其中該CRISPR複合物在該細胞中是可操作的,並且由此與未修飾的酶相比該CRISPR複合物的酶具有降低的修飾該細胞的一個或多個脫靶座位的能力,和/或由此與未修飾的酶相比該CRISPR複合物中的酶具有增加的修飾一個或多個靶座位的能力。
本發明還提供了任何以上描述的組成物的或來自任何以上描述的系統的CRISPR複合物。
本發明還提供了用於在治療中使用的根據本發明的工程化的CRISPR蛋白、複合物、組成物、系統、載體、細胞或細胞系。
本發明還提供了修飾細胞中的感興趣的座位之方法,該方法包括使該細胞與任何以上描述的組成物或任何以上描述的系統接觸,或者其中該細胞包含存在於該細胞內的任何以上描述的CRISPR複合物。在這樣的方法中,該細胞可以是真核細胞。在這樣的方法中,生物可以包含該細胞。在這樣的方法中,該生物可以不是人或其他動物。本發明還提供了用於在修飾細胞中的感興趣的座位中使用的根據本發明的工程化的CRISPR蛋白、複合物、組成物、系統、載體、細胞或細胞系。所述修飾較佳的是包括使該細胞與任何以上描述的組成物或任何以上描述的系統接觸。本發明還提供了根據本發明的工程化的CRISPR蛋白、複合物、組成物、系統、載體、細胞或細胞系在製備用於修飾細胞中的感興趣的座位的藥劑中之用途。
任何這樣的方法可以是離體的或在體外。
在任何這樣的方法中,所述修飾可以包括調節基因表現。所述調節基因表現可以包括活化基因表現和/或抑制基因表現。
本發明還提供了用於在修飾細胞中的感興趣的座位中使用的根據本發明的工程化的CRISPR蛋白、複合物、組成物、系統、載體、細胞或細胞系。本發明還提供了根據本發明的工程化的CRISPR蛋白、複合物、組成物、系統、載體、細胞或細胞系在製備用於修飾細胞中的感興趣的座位的藥劑中之用途。所述修飾較佳的是包括使該細胞與以上描述的任何組成物或以上描述的任何系統接觸。本發明還提供了治療對其有需要的個體的疾病、障礙或感染之方法,該方法包括給予有效量的以上描述的任何組成物、系統或CRISPR複合物。該疾病、障礙或感染可以包括病毒感染。該病毒感染可以是HBV。
本發明還提供了用於在治療對其有需要的個體的疾病、障礙或感染中使用的根據本發明的工程化的CRISPR蛋白、複合物、組成物、系統、載體、細胞或細胞系。該疾病、障礙或感染可以包括病毒感染。該病毒感染可以是HBV。本發明還提供了根據本發明的工程化的CRISPR蛋白、複合物、組成物、系統、載體、細胞或細胞系在製備用於治療對其有需要的個體的疾病、障礙或感染的藥劑中之用途。該疾病、障礙或感染可以包括病毒感染。
本發明還提供了以上描述的任何組成物、系統或CRISPR複合物用於基因或基因組編輯的用途。
本發明還提供了用於用作治療劑的以上描述的任何組成物、系統或CRISPR複合物。該治療劑可以用於基因或基因組編輯、或基 因治療。
在一個方面,本發明提供了藉由操縱HSC的感興趣的基因組座位中的靶序列來修飾生物或非人類生物之方法,例如其中該感興趣的基因組座位與和異常蛋白質表現或和疾病狀況或狀態相關聯的突變相關,該方法包括:
向HSC遞送非天然存在的或工程化的組成物,例如經由使HSC與含有非天然存在的或工程化的組成物的粒子接觸,該組成物包含:
I. CRISPR-Cas系統嵌合RNA(chiRNA)多核苷酸序列,該多核苷酸序列包含:
(a)指導序列,該指導序列能夠雜交到HSC中的靶序列上,
(b)tracr配對序列,和
(c)tracr序列,以及
II. CRISPR酶,該CRISPR酶視情況包含至少一個或多個核定位序列,
其中該tracr配對序列雜交到該tracr序列上,並且該指導序列引導CRISPR複合物與該靶序列的序列特異性結合,並且
其中該CRISPR複合物包含與(1)雜交到該靶序列上的指導序列、和(2)雜交到該tracr序列上的tracr配對序列複合的CRISPR酶;並且
該方法還可以視情況包括遞送HDR模板,例如經由使該粒子與含有該HDR模板的HSC接觸或使該HSC與另一種含有該HDR模板的粒子接 觸,其中該HDR模板提供該蛋白的正常或較不異常形式的表現;其中“正常”係就野生型而論,並且“異常”係引起病症或疾病狀態的蛋白質表現;並且
視情況該方法可以包括從該生物或非人類生物分離或獲得HSC,視情況擴增該HSC群,使一種或多種粒子與該HSC進行接觸以獲得修飾的HSC群,視情況擴增修飾的HSC群,並且視情況向該生物或非人類生物給予修飾的HSC。
本發明還提供了用於在藉由操縱HSC的感興趣的基因組座位中的靶序列來修飾生物或非人類生物中使用的根據本發明的工程化的CRISPR蛋白、複合物、組成物、系統、載體、細胞或細胞系。所述修飾較佳的是包括
向HSC遞送非天然存在的或工程化的組成物,例如經由使HSC與含有非天然存在的或工程化的組成物的粒子接觸,該組成物包含:
I. CRISPR-Cas系統嵌合RNA(chiRNA)多核苷酸序列,該多核苷酸序列包含:
(a)指導序列,該指導序列能夠雜交到HSC中的靶序列上,
(b)tracr配對序列,和
(c)tracr序列,以及
II. CRISPR酶,該CRISPR酶視情況包含至少一個或多個核定位序列,
其中該tracr配對序列雜交到該tracr序列上,並且該指導序列引導CRISPR複合物與該靶序列的序列特異性結合,並且
其中該CRISPR複合物包含與(1)雜交到該靶序列上的指導序列、和(2)雜交到該tracr序列上的tracr配對序列複合的CRISPR酶。所述修飾進一步視情況包括遞送HDR模板,例如經由使該粒子與含有該HDR模板的HSC接觸或使該HSC與另一種含有該HDR模板的粒子接觸,其中該HDR模板提供該蛋白的正常或較不異常形式的表現;其中“正常”係就野生型而論,並且“異常”係引起病症或疾病狀態的蛋白質表現。所述修飾進一步視情況包括從該生物或非人類生物分離或獲得HSC,視情況擴增該HSC群,使一種或多種粒子與該HSC進行接觸以獲得修飾的HSC群,視情況擴增修飾的HSC群,並且視情況向該生物或非人類生物給予修飾的HSC。
在一個方面,本發明提供了藉由操縱HSC的感興趣的基因組座位中的靶序列來修飾生物或非人類生物之方法,例如其中該感興趣的基因組座位與和異常蛋白質表現或和疾病狀況或狀態相關聯的突變相關,該方法包括:向HSC遞送非天然存在的或工程化的組成物,例如經由使HSC與含有非天然存在的或工程化的組成物的粒子接觸,該組成物包含:I.(a)能夠雜交到HSC中的靶序列上的指導序列、和(b)至少一種或多種tracr配對序列,II.視情況具有一個或多個NLS的CRISPR酶,以及III.包含tracr序列的多核苷酸序列,其中該tracr配對序列雜交到該tracr序列上並且該指導序列引導CRISPR複合物與該靶序列的序列特異性結合,並且其中該CRISPR複合物包含與(1)雜交到該靶序列上的指導序 列、和(2)雜交到該tracr序列上的tracr配對序列複合的CRISPR酶;並且
該方法還可以視情況包括遞送HDR模板,例如經由使該粒子與含有該HDR模板的HSC接觸或使該HSC與另一種含有該HDR模板的粒子接觸,其中該HDR模板提供該蛋白的正常或較不異常形式的表現;其中“正常”係就野生型而論,並且“異常”係引起病症或疾病狀態的蛋白質表現;並且
視情況該方法可以包括從該生物或非人類生物分離或獲得HSC,視情況擴增該HSC群,使一種或多種粒子與該HSC進行接觸以獲得修飾的HSC群,視情況擴增修飾的HSC群,並且視情況向該生物或非人類生物給予修飾的HSC。本發明還提供了用於在藉由操縱HSC的感興趣的基因組座位中的靶序列來這樣修飾生物或非人類生物中使用的根據本發明的工程化的CRISPR蛋白、複合物、組成物、系統、載體、細胞或細胞系,例如其中該感興趣的基因組座位與和異常蛋白質表現或和疾病狀況或狀態相關聯的突變相關。
可以遞送編碼任何一種或多種或所有CRISPR-複合物的一種或多種多核苷酸,這一種或多種多核苷酸有利地連接至一種或多種調節元件用於例如經由一種或多種粒子在體內表現,這一種或多種粒子包含含有可操作地連接至這一種或多種調節元件的一種或多種多核苷酸的載體。編碼CRISPR酶的多核苷酸序列、指導序列、tracr配對序列或tracr序列的任一者或全部可以是RNA。應當理解的是,在提及作為RNA並且被認為‘包含’這樣tracr配對序列的特徵的多核苷酸的情況下,該RNA序列包括該特徵。在該多核苷酸係DNA並且被認為包含這樣tracr配對序 列的特徵的情況下,該DNA序列被或者可以被轉錄成包括該討論中的特徵的RNA。在該特徵係蛋白質的情況下,如CRISPR酶,所提及的該DNA或RNA序列被或者可以被翻譯(以及在DNA首先被轉錄的情況下)。
在某些實施方式中,本發明提供了藉由操縱HSC的感興趣的基因組座位中的靶序列來修飾生物(例如,哺乳動物,包括人類或非人類哺乳動物或生物)之方法,例如其中該感興趣的基因組座位與和異常蛋白質表現或和疾病狀況或狀態相關聯的突變相關,該方法包括遞送非天然存在的或工程化的組成物,例如經由使非天然存在的或工程化的組成物與該HSC接觸,其中該組成物包含一種或多種粒子,這一種或多種粒子包含一種或多種可操作地編碼組成物用於其表現的病毒、質粒或核酸分子載體(例如RNA),其中該組成物包含:(A)I.第一調節元件,該第一調節元件可操作地連接到CRISPR-Cas系統嵌合RNA(chiRNA)多核苷酸序列上,其中該多核苷酸序列包含(a)能夠雜交到真核細胞中的靶序列上的指導序列、(b)tracr配對序列、和(c)tracr序列,以及II.第二調節元件,該第二調節元件可操作地連接到編碼CRISPR酶的酶編碼序列上,該CRISPR酶包含至少一個或多個核定位序列(或者視情況至少一個或多個核定位序列,因為在一些實施方式中可能不涉及NLS),其中(a)、(b)和(c)以5’到3’方向排列,其中組分I和II位於該系統的相同或不同載體上,其中在轉錄時,該tracr配對序列雜交到該tracr序列上,並且該指導序列引導CRISPR複合物與該靶序列的序列特異性結合,並且其中該CRISPR複合物包含與(1)雜交到該靶序列上的指導序列、和(2)雜交到該tracr序列上的tracr配對序列複合的CRISPR酶,或者(B)非天然 存在的或工程化的組成物,該組成物包含載體系統,該載體系統包含一種或多種載體,這一種或多種載體包含I.第一調節元件,該第一調節元件可操作地連接到(a)能夠雜交到真核細胞中的靶序列上的指導序列、和(b)至少一種或多種tracr配對序列,II.第二調節元件,該第二調節元件可操作地連接到編碼CRISPR酶的酶編碼序列上,以及III.第三調節元件,該第三調節元件可操作地連接到tracr序列上,其中組分I、II和III位於該系統的相同或不同載體上,其中在轉錄時,該tracr配對序列雜交到該tracr序列上,並且該指導序列引導CRISPR複合物與該靶序列的序列特異性結合,並且其中該CRISPR複合物包含與(1)雜交到該靶序列上的指導序列、和(2)雜交到該tracr序列上的tracr配對序列複合的CRISPR酶;該方法還可以視情況包括遞送HDR模板,例如經由使該粒子與含有該HDR模板的HSC接觸或使該HSC與另一種含有該HDR模板的粒子接觸,其中該HDR模板提供該蛋白的正常或較不異常形式的表現;其中“正常”係就野生型而論,並且“異常”係引起病症或疾病狀態的蛋白質表現;並且視情況該方法可以包括從該生物或非人類生物分離或獲得HSC,視情況擴增該HSC群,使一種或多種粒子與該HSC進行接觸以獲得修飾的HSC群,視情況擴增修飾的HSC群,並且視情況向該生物或非人類生物給予修飾的HSC。在一些實施方式中,組分I、II和III位於相同載體上。在其他實施方式中,組分I和II位於相同載體上,而組分III位於另一種載體上。在其他實施方式中,組分I和III位於相同載體上,而組分II位於另一種載體上。在其他實施方式中,組分II和III位於相同載體上,而組分I位於另一種載體上。在其他實施方式中,組分I、II和III各自位於不同的載體上。本發明還提供了如本文所述的病毒或質粒載體系統。本發 明還提供了用於在藉由操縱HSC的感興趣的基因組座位中的靶序列來這樣修飾生物(例如,哺乳動物,包括人類或非人類哺乳動物或生物)中使用的根據本發明的工程化的CRISPR蛋白、複合物、組成物、系統、載體、細胞或細胞系,例如其中該感興趣的基因組座位與和異常蛋白質表現或和疾病狀況或狀態相關聯的突變相關,包括遞送非天然存在的或工程化的組成物,例如經由使非天然存在的或工程化的組成物與該HSC接觸。
藉由操縱靶序列,申請人還打算靶序列的表觀遺傳操縱。這可以是靶序列的染色質狀態的操縱,如借助於修飾靶序列的甲基化狀態(即,甲基化或甲基化模式或CpG島的添加或去除)、組蛋白修飾,從而增加或降低靶序列的可及性,或者借助於3D折疊。應當理解的是,在提及藉由操縱在感興趣的基因組座位中的靶序列來修飾生物或哺乳動物(包括人類或非人類哺乳動物或生物)的方法的情況下,這可適用於作為整體的生物(或哺乳動物)或者僅僅是來自這種生物的單個細胞或細胞群(如果該生物係多細胞的話)。在人類的情況下,例如,申請人特別地設想到單個細胞或細胞群,並且該等細胞可以較佳的是進行離體修飾,進而重新引入。在這種情況下,活組織檢查或其他組織或生物流體樣品可以必要的。在這方面,幹細胞也是特別較佳的。但是,當然還設想了體內實施方式。並且本發明就HSC而言是尤其有利的。
在一些實施方式中,本發明包括藉由操縱HSC中的感興趣的基因組座位中的DNA雙股體的相對股上的第一靶序列和第二靶序列來修飾生物或非人類生物之方法,例如其中該感興趣的基因組座位與和異 常蛋白質表現或和疾病狀況或狀態相關聯的突變相關,該方法包括例如藉由使HSC與一種或多種包含非天然存在的或工程化的組成物的粒子接觸來遞送,該組成物包含:
I. 第一CRISPR-Cas系統嵌合RNA(chiRNA)多核苷酸序列,其中該第一多核苷酸序列包含:
(a)第一指導序列,該第一指導序列能夠雜交到該第一靶序列上,
(b)第一tracr配對序列,和
(c)第一tracr序列,
II. 第二CRISPR-Cas系統chiRNA多核苷酸序列,其中該第二多核苷酸序列包含:
(a)第二指導序列,該第二指導序列能夠雜交到該第二靶序列上,
(b)第二tracr配對序列,和
(c)第二tracr序列,並且
III. 編碼CRISPR酶的多核苷酸序列,該CRISPR酶包含至少一個或多個核定位序列並且包含一個或多個突變,其中(a)、(b)和(c)以5’到3’方向排列;或者
IV. I.至III.中的一者或多者(例如,該第一tracr配對序列和該第二tracr配對序列)的一種或多種表現產物,該CRISPR酶;
其中當轉錄時,該第一tracr配對序列和該第二tracr配對序列分別雜交到該第一tracr序列和第二tracr序列上並且該第一指導序列和該第二指導序列分別指導第一CRISPR複合物和第二CRISPR複合物與該第一靶序列和第二靶序列的序列特異性結合,其中該第一CRISPR複合物包含與(1)雜交到該第一靶序列上的第一指導序列、和(2)雜交到該第一tracr序列上的第一tracr配對序列複合的CRISPR酶,其中該第二CRISPR複合物包含與(1)雜交到該第二靶序列上的第二指導序列、和(2)雜交到該第二tracr序列上的第二tracr配對序列複合的CRISPR酶,其中編碼CRISPR酶的多核苷酸序列係DNA或RNA,並且其中該第一指導序列指導鄰近該第一靶序列的DNA雙股體的一條股的切割並且該第二指導序列指導鄰近該第二靶序列的另一條股的切割,從而誘導雙股斷裂,由此修飾該生物或該非人類生物;並且該方法還可以視情況包括遞送HDR模板,例如經由使該粒子與含有該HDR模板的HSC接觸或使該HSC與另一種含有該HDR模板的粒子接觸,其中該HDR模板提供該蛋白的正常或較不異常形式的表現;其中“正常”係就野生型而論,並且“異常”係引起病症或疾病狀態的蛋白質表現;並且視情況該方法可以包括從該生物或非人類生物分離或獲得HSC,視情況擴增該HSC群,使一種或多種粒子與該HSC進行接觸以獲得修飾的HSC群,視情況擴增修飾的HSC群,並且視情況向該生物或非人類生物給予修飾的HSC。在本發明的一些方法中,編碼CRISPR酶的多核苷酸序列、該第一和第二指導序列、該第一和第二tracr配對序列或該第一和第二tracr序列中的任一者或全部係RNA。在本發明另外的實施方式中,編碼CRISPR酶的編碼序列的多核苷酸、該第一和第二指導序列、該第一和第二tracr配對序列或該第一和第二tracr序列係 RNA,並且是經由脂質體、奈米粒子、外排體、微囊泡、或基因槍遞送的;但是,有利的是經由粒子遞送。在本發明的某些實施方式中,該第一和第二tracr配對序列共用100%的一致性和/或該第一和第二tracr序列共用100%的一致性。在一些實施方式中,該等多核苷酸可以被包含在含有一種或多種載體的載體系統中。在本發明的較佳的實施方式中,該CRISPR酶係Cas9酶,例如SpCas9。在本發明的一個方面,該CRISPR酶在催化結構域中包含一個或多個突變,其中關於SpCas9,這一個或多個突變選自由以下各項組成之群組:D10A、E762A、H840A、N854A、N863A和D986A,例如D10A突變。在較佳的實施方式中,該第一CRISPR酶具有一個或多個突變,使得該酶係互補股切口酶,並且該第二CRISPR酶具有一個或多個突變,使得該酶係非互補股切口酶。可替代地,該第一酶可以是非互補股切口酶,而該第二酶可以是互補股切口酶。在本發明的較佳的方法中,該第一指導序列引導鄰近該第一靶序列的DNA雙股體的一條股的切割並且該第二指導序列引導鄰近該第二靶序列的另一條股的切割從而產生5’突出端。在本發明的實施方式中,該5’突出端具有至多200個鹼基對、較佳的是至多100個鹼基對、或更較佳的是至多50個鹼基對。在本發明的實施方式中,該5’突出端具有至少26個鹼基對、較佳的是至少30個鹼基對、或更較佳的是34-50個鹼基對。本發明還提供了用於在藉由操縱HSC中的感興趣的基因組座位中的DNA雙股體的相對股上的第一靶序列和第二靶序列來這樣修飾生物或非人類生物中使用的根據本發明的工程化的CRISPR蛋白、複合物、組成物、系統、載體、細胞或細胞系,例如其中該感興趣的基因組座位與和異常蛋白質表現或和疾病狀況或狀態相關聯的突變相關,包括例如藉由使HSC與一種或多種包含非天然存 在的或工程化的組成物的粒子接觸來遞送。
在一些實施方式中,本發明包括藉由操縱HSC中的感興趣的基因組座位中的DNA雙股體的相對股上的第一靶序列和第二靶序列來修飾生物或非人類生物之方法,例如其中該感興趣的基因組座位與和異常蛋白質表現或和疾病狀況或狀態相關聯的突變相關,該方法包括例如藉由使HSC與一種或多種包含非天然存在的或工程化的組成物的粒子接觸來遞送,該組成物包含:
I. 第一調節元件,該第一調節元件可操作地連接至
(a)第一指導序列,該第一指導序列能夠雜交到該第一靶序列上,和
(b)至少一種或多種tracr配對序列,
II. 第二調節元件,該第二調節元件可操作地連接至
(a)第二指導序列,該第二指導序列能夠雜交到該第二靶序列上,和
(b)至少一種或多種tracr配對序列,
III. 第三調節元件,該第三調節元件可操作地連接至編碼CRISPR酶的酶編碼序列,以及
IV. 第四調節元件,該第四調節元件可操作地連接至tracr序列,
V. I.至IV.中的一者或多者(例如,該第一tracr配對序列和該第二tracr配對序列)的一種或多種表現產物,該CRISPR酶;
其中組分I、II、III和IV位於該系統的相同或不同載體上,在轉錄時,該tracr配對序列雜交到該tracr序列上,並且該第一和第二指導序列分別指導第一和第二CRISPR複合物與該第一和第二靶序列的序列特異性結合,其中該第一CRISPR複合物包含與(1)雜交到該第一靶序列上的第一指導序列、和(2)雜交到該tracr序列上的該tracr配對序列複合的CRISPR酶,其中該第二CRISPR複合物包含與(1)雜交到該第二靶序列上的第二指導序列、和(2)雜交到該tracr序列上的該tracr配對序列複合的CRISPR酶,其中編碼CRISPR酶的多核苷酸序列係DNA或RNA,並且其中該第一指導序列指導鄰近該第一靶序列的DNA雙股體的一條股的切割,並且該第二指導序列指導鄰近該第二靶序列的另一條股的切割,從而誘導雙股的斷裂,由此修飾該生物或非人類生物;並且該方法還可以視情況包括遞送HDR模板,例如經由使該粒子與含有該HDR模板的HSC接觸或使該HSC與另一種含有該HDR模板的粒子接觸,其中該HDR模板提供該蛋白的正常或較不異常形式的表現;其中“正常”係就野生型而論,並且“異常”係引起病症或疾病狀態的蛋白質表現;並且視情況該方法可以包括從該生物或非人類生物分離或獲得HSC,視情況擴增該HSC群,使一種或多種粒子與該HSC進行接觸以獲得修飾的HSC群,視情況擴增修飾的HSC群,並且視情況向該生物或非人類生物給予修飾的HSC。本發明還提供了用於在藉由操縱HSC中的感興趣的基因組座位中的DNA雙股體的相對股上的第一靶序列和第二靶序列來這樣修飾生物或非人類生物中使用的根據本發明的工程化的CRISPR蛋白、複合物、組成物、系統、載體、細胞或細胞系,例如其中該感興趣的基因組座位與和異常蛋白質表現或和疾病狀況或狀態相關聯的突變相關,包括例如藉由使HSC與一種或多 種包含非天然存在的或工程化的組成物的粒子接觸來遞送。
本發明還提供了如本文所述的載體系統。該系統可以包含一種、二種、三種或四種不同的載體。組分I、II、III和IV因此可以被定位在一種、兩種、三種或四種不同的載體上,並且在此設想了針對該等組分的可能位置的所有組合,例如:組分I、II、III和IV可以位於相同載體上;組分I、II、III和IV可以各自位於不同的載體上;組分I、II、III和IV可以位於總計兩種或三種不同載體上,其中設想了位置的所有組合,等。在本發明的一些方法中,編碼CRISPR酶的多核苷酸序列、該第一指導序列和該第二指導序列、該第一tracr配對序列和該第二tracr配對序列或該第一tracr序列和該第二tracr序列中的任一者或全部係RNA。在本發明另外的實施方式中,該第一和第二tracr配對序列共用100%的一致性和/或該第一和第二tracr序列共用100%的一致性。在本發明的較佳的實施方式中,該CRISPR酶係Cas9酶,例如SpCas9。在本發明的一個方面,該CRISPR酶在催化結構域中包含一個或多個突變,其中關於SpCas9,這一個或多個突變選自由以下各項組成之群組:D10A、E762A、H840A、N854A、N863A和D986A;例如,D10A突變。在較佳的實施方式中,該第一CRISPR酶具有一個或多個突變,使得該酶係互補股切口酶,並且該第二CRISPR酶具有一個或多個突變,使得該酶係非互補股切口酶。可替代地,該第一酶可以是非互補股切口酶,而該第二酶可以是互補股切口酶。在本發明的一個另外的實施方式中,該等病毒載體的一種或多種可以經由脂質體、奈米粒子、外排體(exosome)、微囊泡、或基因槍進行遞送;但是,粒子遞送係有利的。
在本發明的較佳的方法中,第一指導序列引導鄰近該第一靶序列的DNA雙股體的一條股的切割並且第二指導序列引導鄰近該第二靶序列的另一條股的切割從而產生5’突出端。在本發明的實施方式中,該5’突出端具有至多200個鹼基對、較佳的是至多100個鹼基對、或更較佳的是至多50個鹼基對。在本發明的實施方式中,該5’突出端具有至少26個鹼基對、較佳的是至少30個鹼基對、或更較佳的是34-50個鹼基對。
在一些實施方式中,本發明包括修飾HSC中的感興趣的基因組座位之方法,例如其中該感興趣的基因組座位與和異常蛋白質表現或和疾病狀況或狀態相關聯的突變相關,藉由引入該HSC中,例如藉由使HSC與一種或多種粒子接觸,這一種或多種粒子包含具有一個或多個突變和兩種指導RNA的Cas蛋白,這兩種指導RNA分別靶向該HSC中的DNA分子的第一股和第二股,由此該等指導RNA靶向該DNA分子並且該Cas蛋白使該DNA分子的第一股和第二股的每一者產生切口,由此改變該HSC中的靶標;並且,其中該Cas蛋白和這兩種指導RNA並不天然地一起存在,並且該方法還可以視情況包括遞送HDR模板,例如經由使該粒子與含有該HDR模板的HSC接觸或使該HSC與另一種含有該HDR模板的粒子接觸,其中該HDR模板提供該蛋白的正常或較不異常形式的表現;其中“正常”係就野生型而論,並且“異常”係引起病症或疾病狀態的蛋白質表現;並且視情況該方法可以包括從該生物或非人類生物分離或獲得HSC,視情況擴增該HSC群,使一種或多種粒子與該HSC進行接觸以獲得修飾的HSC群,視情況擴增修飾的HSC群,並且視情況向該生物或非人類生物給予修飾的HSC。在本發明的較佳的方法中,該Cas蛋白使該 DNA分子的第一股和第二股的每一者產生切口導致5’突出端。在本發明的實施方式中,該5’突出端具有至多200個鹼基對、較佳的是至多100個鹼基對、或更較佳的是至多50個鹼基對。在本發明的實施方式中,該5’突出端具有至少26個鹼基對、較佳的是至少30個鹼基對、或更較佳的是34-50個鹼基對。本發明的實施方式還包括包含融合到tracr配對序列和tracr序列上的指導序列的指導RNA。在本發明的一方面,該Cas蛋白經密碼子優化以便在真核細胞,較佳的是哺乳動物細胞或人類細胞中表現。在本發明另外的實施方式中,該Cas蛋白係II型CRISPR-Cas蛋白,例如Cas9蛋白。在一高度較佳的實施方式中,該Cas蛋白係Cas9蛋白,例如SpCas9或SaCas9。在本發明的方面中,就SpCas9而言,該Cas蛋白具有一個或多個選自下組的突變,該組由以下各項組成:D10A、E762A、H840A、N854A、N863A和D986A;例如,D10A突變。本發明的方面涉及被減少的基因產物或被進一步引入到編碼基因產物的DNA分子中的模板多核苷酸或藉由允許兩個5’突出端重新退火並連接而被精確切斷的間插序列的表現、或被改變的基因產物的活性或功能、或被增加的基因產物的表現。在本發明的一實施方式中,該基因產物係蛋白質。
在一些實施方式中,本發明包括修飾HSC中的感興趣的基因組座位之方法,例如其中該感興趣的基因組座位與和異常蛋白質表現或和疾病狀況或狀態相關聯的突變相關,藉由引入該HSC中,例如藉由使HSC與一種或多種粒子接觸,這一種或多種粒子包含,
a)第一調節元件,該第一調節元件可操作地連接到兩種CRISPR-Cas系統指導RNA的每一者,這兩種指導RNA分別靶向該HSC的 雙股DNA分子的第一股和第二股,和
b)第二調節元件,該第二調節元件可操作地連接至Cas蛋白,或
c)a)或b)的一種或多種表現產物,
其中組分(a)和(b)位於該系統的相同或不同載體上,由此該等指導RNA靶向該HSC的DNA分子,並且該Cas蛋白使該HSC的DNA分子的第一股和第二股的每一者產生切口;並且,其中該Cas蛋白和這兩個指導RNA並不天然地一起存在;並且該方法還可以視情況包括遞送HDR模板,例如經由使該粒子與含有該HDR模板的HSC接觸或使該HSC與另一種含有該HDR模板的粒子接觸,其中該HDR模板提供該蛋白的正常或較不異常形式的表現;其中“正常”係就野生型而論,並且“異常”係引起病症或疾病狀態的蛋白質表現;並且視情況該方法可以包括從該生物或非人類生物分離或獲得HSC,視情況擴增該HSC群,使一種或多種粒子與該HSC進行接觸以獲得修飾的HSC群,視情況擴增修飾的HSC群,並且視情況向該生物或非人類生物給予修飾的HSC。在本發明的方面中,該等指導RNA可包含融合到tracr配對序列和tracr序列上的指導序列。在本發明的一實施方式中,該Cas蛋白係II型CRISPR-Cas蛋白。在本發明的一方面,該Cas蛋白經密碼子優化以便在真核細胞,較佳的是哺乳動物細胞或人類細胞中表現。在本發明另外的實施方式中,該Cas蛋白係II型CRISPR-Cas蛋白,例如Cas 9蛋白。在一個高度較佳的實施方式中,該Cas蛋白係Cas9蛋白,例如SpCas9或SaCas9。在本發明的方面中,關於SpCas9,該Cas蛋白具有一個或多個選自下組的突變,該組由以下各項組成:D10A、E762A、H840A、N854A、N863A和D986A;例如,D10A突 變。本發明的方面涉及被減少的基因產物或被進一步引入到編碼基因產物的DNA分子中的模板多核苷酸或藉由允許兩個5’突出端重新退火並連接而被精確切斷的間插序列的表現、或被改變的基因產物的活性或功能、或被增加的基因產物的表現。在本發明的一個實施方式中,該基因產物係蛋白質。在本發明的較佳的實施方式中,該系統的該等載體係病毒載體。在一個另外的實施方式中,該系統的該等載體經由脂質體、奈米粒子、外排體、微囊泡、或基因槍進行遞送;並且粒子係較佳的。在一個方面,本發明提供了修飾HSC中的靶多核苷酸之方法。在一些實施方式中,該方法包括允許CRISPR複合物結合到該靶多核苷酸上以實施所述靶多核苷酸的切割,由此修飾該靶多核苷酸,其中該CRISPR複合物包括與雜交到在所述靶多核苷酸內的靶序列上的指導序列複合的CRISPR酶,其中所述指導序列連接到tracr配對序列上,該tracr配對序列進而雜交到tracr序列上。在一些實施方式中,所述切割包括藉由所述CRISPR酶切割在該靶序列位置的一條或兩條股。在一些實施方式中,所述切割導致靶基因的轉錄降低。在一些實施方式中,該方法進一步包括藉由與外源模板多核苷酸同源重組修復所述切割的靶多核苷酸,其中所述修復導致突變,包括所述靶多核苷酸的一個或多個核苷酸的插入、缺失、或取代。在一些實施方式中,所述突變導致在從包含該靶序列的基因表現的蛋白質中的一個或多個胺基酸改變。在一些實施方式中,該方法進一步包括將一種或多種載體或其一種或多種表現產物例如經由一種或多種粒子遞送到所述HSC中,其中這一種或多種載體驅動下列一者或多者的表現:該CRISPR酶、連接到該tracr配對序列上的指導序列、和該tracr序列。在一些實施方式中,所述載體被遞送到受試者體內的HSC中。在一些實施 方式中,所述修飾發生在細胞培養物中的所述HSC中。在一些實施方式中,該方法進一步包括在所述修飾之前從受試者體內分離所述HSC。在一些實施方式中,該方法進一步包括使所述HSC和/或從中衍生的細胞返回到所述受試者體內。
在一個方面,本發明提供了產生包含突變的疾病基因的HSC之方法。在一些實施方式中,疾病基因係與患有或產生疾病的風險的增加相關聯的任何基因。在一些實施方式中,該方法包括(a)將一種或多種載體或其一種或多種表現產物例如經由一種或多種粒子引入HSC中,其中這一種或多種載體驅動下列一者或多者的表現:CRISPR酶、連接到tracr配對序列上的指導序列、和tracr序列;並且(b)允許CRISPR複合物結合到靶多核苷酸上以實施在所述疾病基因內的該靶多核苷酸的切割,其中該CRISPR複合物包含與(1)雜交到該靶多核苷酸內的靶序列上的指導序列、和(2)雜交到該tracr上的tracr配對序列複合的CRISPR酶,由此產生包含突變的疾病基因的HSC。在一些實施方式中,所述切割包括藉由所述CRISPR酶切割在該靶序列位置的一條或兩條股。在一些實施方式中,所述切割導致靶基因的轉錄降低。在一些實施方式中,該方法進一步包括藉由與外源模板多核苷酸同源重組修復所述切割的靶多核苷酸,其中所述修復導致突變,包括所述靶多核苷酸的一個或多個核苷酸的插入、缺失、或取代。在一些實施方式中,所述突變導致在從包含該靶序列的基因表現的蛋白質中的一個或多個胺基酸改變。在一些實施方式中,向動物給予該修飾的HSC,以由此產生動物模型。
在一個方面,本發明提供了修飾HSC中的靶多核苷酸之方 法。還提供了用於在修飾HSC中的靶多核苷酸中使用的根據本發明的工程化的CRISPR蛋白、複合物、組成物、系統、載體、細胞或細胞系。在一些實施方式中,該方法包括允許CRISPR複合物結合到該靶多核苷酸上以實施所述靶多核苷酸的切割,由此修飾該靶多核苷酸,其中該CRISPR複合物包括與雜交到在所述靶多核苷酸內的靶序列上的指導序列複合的CRISPR酶,其中所述指導序列連接到tracr配對序列上,該tracr配對序列進而雜交到tracr序列上。在其他實施方式中,本發明提供了修飾多核苷酸在真核細胞中的表現之方法,該真核細胞產生自HSC。該方法包括藉由使用結合到多核苷酸上的CRISPR複合物增加或降低靶多核苷酸在該HSC中的表現;有利地,該CRISPR複合物經由一種或多種粒子遞送。
在一些方法中,可以使靶多核苷酸失活以實施HSC中的表現的修飾。例如,當CRISPR複合物結合到細胞中的靶序列上時,該靶多核苷酸失活,這樣使得該序列不被轉錄,該編碼蛋白不被產生,或者該序列不會像野生型序列一樣起作用。
在一些實施方式中,可以修飾該CRISPR-Cas系統的RNA,例如指導或sgRNA;例如以包括適配體或功能結構域。適配體係結合至特定靶分子的合成寡核苷酸;例如已經藉由重複循環的體外選擇或SELEX(指數富集配位基系統進化法)被工程化為結合至不同分子靶標(如小分子、蛋白質、核酸)以及甚至細胞、組織和生物的核酸分子。適配體係有用的,因為它們提供與抗體的分子識別競爭的分子識別特性。除了其有差別的識別之外,適配體提供優於抗體的優點,包括它們在治療性應用中引起很少或不引起免疫原性。因此,在本發明的實踐中, 該酶或該RNA中的任一者或二者可以包括功能結構域。
在一些實施方式中,該功能結構域係轉錄活化結構域,較佳的是VP64。在一些實施方式中,該功能結構域係轉錄抑制結構域,較佳的是KRAB。在一些實施方式中,該轉錄抑制結構域係SID、或SID的多聯體(例如SID4X)。在一些實施方式中,該功能結構域係表觀遺傳修飾結構域,從而提供了表觀遺傳修飾酶。在一些實施方式中,該功能結構域係活化結構域,其可以是P65活化結構域。在一些實施方式中,該功能結構域包括核酸酶活性。在一個這樣的實施方式中,該功能結構域包括Fok1。
本發明還提供了體外或離體細胞,該細胞包含以上描述的任何經修飾的CRISPR酶、組成物、系統或複合物,或來自以上描述的任何方法。該細胞可以是真核細胞或原核細胞。本發明還提供了此類細胞的子代。本發明還提供了任何這樣的細胞或任何這樣的子代的產物,其中該產物係如藉由CRISPR複合物的經修飾的CRISPR酶修飾的所述一個或多個靶座位的產物。該產物可以是肽、多肽或蛋白質。可以藉由該CRISPR複合物的經修飾的CRISPR酶來修飾一些這樣的產物。在一些這樣的經修飾的產物中,靶座位的產物與所述靶座位的產物在物理性質上不同,所述靶座位尚未藉由所述經修飾的CRISPR酶進行修飾。
本發明還提供了包含編碼以上描述的任何非天然存在的CRISPR酶的多核苷酸序列的多核苷酸分子。
任何這樣的多核苷酸都可以進一步包含一種或多種調節元件,這一種或多種調節元件可操作地連接至編碼該非天然存在的 CRISPR酶的多核苷酸序列。
在包含一種或多種調節元件的任何這樣的多核苷酸中,這一種或多種調節元件可以被可操作地配置用於在真核細胞中表現該非天然存在的CRISPR酶。該真核細胞可以是人類細胞。該真核細胞可以是齧齒動物細胞,視情況是小鼠細胞。該真核細胞可以是酵母細胞。該真核細胞可以是中國倉鼠卵巢(CHO)細胞。該真核細胞可以是昆蟲細胞。
在包含一種或多種調節元件的任何這樣的多核苷酸中,這一種或多種調節元件可以被可操作地配置用於在原核細胞中表現該非天然存在的CRISPR酶。
在包含一種或多種調節元件的任何這樣的多核苷酸中,這一種或多種調節元件可以被可操作地配置用於在體外系統中表現該非天然存在的CRISPR酶。
本發明還提供了包含以上描述的任何多核苷酸分子的表現載體。本發明還提供了一種或多種這樣的多核苷酸分子(例如被可操作地配置成表現蛋白的這樣的多核苷酸分子)和/或一種或多種核酸組分,以及一種或多種這樣的載體。
本發明進一步提供了對Cas9或作為SaCas9和/或SpCas9的異種同源物的突變的或修飾的Cas9作出突變之方法,該方法包括確定該異種同源物中的可能很靠近或可能觸碰核酸分子(例如,DNA、RNA、sgRNA等)的一個或多個胺基酸、和/或供修飾和/或突變的類似於或對應於本文鑒定的SaCas9和/或SpCas9中的一個或多個胺基酸的一個或多個胺基酸,並且合成或製備或表現該異種同源物,該異種同源物包括如本文 討論的一種或多種修飾和/或一個或多個突變、由其組成或基本上由其組成,例如將中性胺基酸修飾(例如,改變或突變)為帶電的(例如,帶正電的)胺基酸,例如從丙胺酸到例如賴胺酸。如此修飾的異種同源物可以用在CRISPR-Cas系統中;並且表現它的一種或多種核酸分子可以用在遞送分子或編碼如本文討論的CRISPR-Cas系統組分的載體或其他遞送系統中。
本發明還提供了用於在對Cas9或作為SaCas9和/或SpCas9的異種同源物的突變的或修飾的Cas9作出突變中使用的根據本發明的工程化的CRISPR蛋白、複合物、組成物、系統、載體、細胞或細胞系,包括確定該異種同源物中的可能很靠近或可能觸碰核酸分子(例如,DNA、RNA、sgRNA)的一個或多個胺基酸、和/或供修飾和/或突變的類似於或對應於本文鑒定的SaCas9和/或SpCas9中的一個或多個胺基酸的一個或多個胺基酸,並且合成或製備或表現該異種同源物,該異種同源物包括如本文討論的一種或多種修飾和/或一個或多個突變、由其組成或基本上由其組成,例如將中性胺基酸修飾(例如,改變或突變)為帶電的(例如,帶正電的)胺基酸,例如從丙胺酸到例如賴胺酸。
在一個方面,本發明提供了有效的中靶活性並且最小化了脫靶活性。在一個方面,本發明提供了由CRISPR蛋白進行的有效的中靶切割並且最小化了由該CRISPR蛋白進行的脫靶切割。在一方面,本發明提供了CRISPR蛋白在基因座位處的指導特異性結合而沒有DNA切割。在一個方面,本發明提供了CRISPR蛋白在基因座位處的有效的指導引導的中靶結合並且最小化了該CRISPR蛋白的脫靶結合。因此,在個方面,本 發明提供了靶標特異性基因調節。在一方面,本發明提供了CRISPR酶在基因座位處的指導特異性結合而沒有DNA切割。因此,在一方面,本發明使用單一CRISPR酶提供了一個基因座位處的切割和不同基因座位處的基因調節。在一方面,本發明使用一種或多種CRISPR蛋白和/或酶提供了多個靶標的正交活化和/或抑制和/或切割。
在另一個方面,本發明提供了離體地或在體內對細胞池的基因組中的基因進行功能篩選之方法,該方法包括給予或表現包含多種CRISPR-Cas系統指導RNA(sgRNA)的文庫(library),並且其中該篩選進一步包括使用CRISPR酶,其中該CRISPR複合物被修飾成包括異源功能結構域。在一個方面,本發明提供了用於篩選基因組之方法,該方法包括向宿主給予文庫或在宿主的體內表現文庫。在一方面,本發明提供了如本文討論之方法,該方法進一步包括給予該宿主的或在該宿主中表現的活化蛋白。在一方面,本發明提供了如本文討論之方法,其中該活化蛋白附接至CRISPR蛋白。在一方面,本發明提供了如本文討論之方法,其中該活化蛋白附接至該CRISPR蛋白的N末端或C末端。在一方面,本發明提供了如本文討論之方法,其中該活化蛋白附接至sgRNA環。在一方面,本發明提供了如本文討論之方法,該方法進一步包括給予該宿主的或在該宿主中表現的抑制蛋白。在一方面,本發明提供了如本文討論之方法,其中該篩選包括在該座位中影響並檢測基因活化、基因抑制、或切割。
在一方面,本發明提供了如本文討論之方法,其中該宿主係真核細胞。在一方面,本發明提供了如本文討論的方法或用途,其中 該宿主係哺乳動物細胞。在一方面,本發明提供了如本文討論之方法,其中該宿主係非人類真核生物細胞。在一方面,本發明提供了如本文討論之方法,其中該非人類真核生物細胞係非人類哺乳動物細胞。在一方面,本發明提供了如本文討論之方法,其中該非人類哺乳動物細胞可以是包括但不限於靈長類動物的、牛的、綿羊的、豬的、犬的、齧齒動物的、兔科的,如猴、奶牛、綿羊、豬、狗、兔、大鼠或小鼠細胞。在一個方面,本發明提供了如本文討論的方法或用途,該細胞可以是非哺乳動物真核細胞,如家禽(例如,雞)、脊椎魚類(例如,鮭魚)或貝類(例如,牡蠣、蛤蜊、龍蝦、蝦)細胞。在一方面,本發明提供了如本文討論的方法或用途,該非人類真核生物細胞係植物細胞。該植物細胞可以屬於單子葉植物或雙子葉植物或者屬於作物或穀物植物,如木薯、玉米、高粱、大豆、小麥、燕麥或水稻。該植物細胞還可以屬於藻類、樹木或生產植物、水果或蔬菜(例如,樹木,如柑橘樹,例如橙樹、葡萄柚樹或檸檬樹;桃樹或油桃樹;蘋果樹或梨樹;堅果樹,如杏仁樹或胡桃樹或阿月渾子樹;茄屬植物;芸薹屬的植物;萵苣屬的植物;菠菜屬的植物;辣椒屬的植物;棉花、煙草、蘆筍、胡蘿蔔、捲心菜、青花菜、花椰菜、番茄、茄子、胡椒、萵苣、菠菜、草莓、藍莓、覆盆子、黑莓、葡萄、咖啡、可可等)。
在一方面,本發明提供了如本文討論之方法,該方法包括遞送CRISPR-Cas複合物或其一種或多種組分或對其進行編碼的一種或多種核酸分子,其中所述一種或多種核酸分子被操作性地連接至一個或多個調節序列並且在體內進行表現。在一方面,本發明提供了如本文討論 之方法,其中該體內表現係經由慢病毒、腺病毒、或AAV。在一方面,本發明提供了如本文討論之方法,其中該遞送係經由粒子、奈米粒子、脂質或細胞穿透肽(CPP)。
在一方面,本發明提供了一對CRISPR-Cas複合物,各自包含指導RNA(sgRNA),該sgRNA包含能夠雜交到細胞中的感興趣的基因組座位中的靶序列上的指導序列,其中每個sgRNA的至少一個環藉由插入一個或多個不同的RNA序列而被修飾,這一個或多個RNA序列結合至一種或多種轉接蛋白,並且其中該轉接蛋白與一個或多個功能結構域關聯,其中每個CRISPR-Cas的每個sgRNA都包含具有DNA切割活性的功能結構域。在一方面,本發明提供了如本文討論的成對的CRISPR-Cas複合物,其中DNA切割活性係由於Fok1核酸酶。
在一方面,本發明提供了用於切割感興趣的基因組座位中的靶序列之方法,該方法包括向細胞遞送CRISPR-Cas複合物或其一種或多種組分或對其進行編碼的一種或多種核酸分子,其中所述一種或多種核酸分子被操作性地連接至一個或多個調節序列並且在體內進行表現。在一方面,本發明提供了如本文討論之方法,其中該遞送係經由慢病毒、腺病毒、或AAV。在一方面,本發明提供了如本文討論的方法或如本文討論的成對的CRISPR-Cas複合物,其中該對複合物的第一複合物的靶序列在雙股DNA的第一股上,並且該對複合物的第二複合物的靶序列在雙股DNA的第二股上。在一方面,本發明提供了如本文討論的方法或如本文討論的成對的CRISPR-Cas複合物,其中該第一和第二複合物的靶序列彼此鄰近,這樣使得以有助於同源定向修復的方式切割該DNA。在一方 面,本文的方法可以進一步包括向該細胞中引入模板DNA。在一方面,可以涉及本文的方法或本文的成對的CRISPR-Cas複合物,其中每個CRISPR-Cas複合物都具有突變的CRISPR酶,這樣使得它具有不超過約5%的未被突變的CRISPR酶的核酸酶活性。
在一方面,本發明提供了如本文討論的文庫、方法或複合物,其中該sgRNA被修飾成具有至少一個非編碼功能環,例如其中這至少一個非編碼功能環係抑制性的;例如,其中這至少一個非編碼功能環包含Alu。
在一方面,本發明提供了用於改變或修飾基因產物表現之方法。所述方法可以包括向含有並表現編碼該基因產物的DNA分子的細胞中引入工程化的、非天然存在的CRISPR-Cas系統,該系統包含Cas蛋白和靶向該DNA分子的指導RNA,由此該指導RNA靶向編碼該基因產物的DNA分子,並且該Cas蛋白切割編碼該基因產物的DNA分子,由此改變該基因產物的表現;並且,其中該Cas蛋白和該指導RNA並不天然地一起存在。本發明包括含有融合到tracr序列上的指導序列的指導RNA。本發明進一步包括經密碼子優化以便在真核細胞中表現的Cas蛋白。在一較佳的實施方式中,該真核細胞係哺乳動物細胞,並且在一更較佳的實施方式中,該哺乳動物細胞係人類細胞。在本發明的一另外的實施方式中,該基因產物的表現被降低。
本發明還提供了用於在改變哺乳動物細胞中的感興趣的基因組座位的表現中使用的如本文定義的工程化的CRISPR蛋白、複合物、組成物、系統、載體、細胞或細胞系。本發明還提供了工程化的CRISPR 蛋白、複合物、組成物、系統、載體、細胞或細胞系用於製備改變哺乳動物細胞中的感興趣的基因組座位的表現的藥劑之用途。所述改變較佳的是包括使該細胞與本發明的工程化的CRISPR蛋白、複合物、組成物、系統、載體、細胞或細胞系接觸並且由此遞送載體並且允許形成CRISPR-Cas複合物並結合至靶標。所述改變進一步較佳的是包括確定該基因組座位的表現是否已發生改變。
在一方面,本發明提供了經改變的細胞和那些細胞的子代,以及由該等細胞製成的產品。使用本發明的CRISPR-Cas9蛋白和系統來產生包含經修飾的靶座位的細胞。在一些實施方式中,該方法可以包括允許靶向核酸的複合物結合到靶DNA或RNA以實現所述靶DNA或RNA的切割,由此修飾該靶DNA或RNA,其中靶向核酸的該複合物包含與指導RNA複合的靶向核酸的效應蛋白,該指導RNA雜交到所述靶DNA或RNA內的靶序列上。在一個方面,本發明提供了修復細胞中的基因座位之方法。在另一個方面,本發明提供了修飾DNA或RNA在真核細胞中的表現之方法。在一些實施方式中,該方法包括允許靶向核酸的複合物結合至該DNA或RNA,這樣使得所述結合導致所述DNA或RNA的表現增加或降低;其中靶向核酸的該複合物包含與指導RNA複合的靶向核酸的效應蛋白。類似的考慮因素和條件適用如上文針對修飾靶DNA或RNA之方法。事實上,該等取樣、培養和重新引入選擇跨本發明的多個方面而適用。在一方面,本發明提供了修飾真核細胞中的靶DNA或RNA之方法,該等方法可以在體內、離體地或在體外。在一些實施方式中,該方法包括對來自人或非人動物的細胞或細胞群進行取樣,並且修飾該細胞或該 等細胞。培養可以發生在離體的任何階段。此類細胞可以是但不限於植物細胞,動物細胞,任何生物的特定細胞類型,包括幹細胞、免疫細胞、T細胞、B細胞、樹突細胞、心血管細胞、上皮細胞、幹細胞等。該等細胞可以根據本發明進行修飾,以產生例如受控量的基因產物,取決於用途,該等量可以是增加的或減少的,和/或進行突變。在某些實施方式中,修復該細胞的基因座位。該細胞或該等細胞甚至可以被重新引入該非人動物或植物中。對於重新引入的細胞,可以較佳的是該等細胞係幹細胞。
在一方面,本發明提供了暫時包含CRISPR系統或組分的細胞。例如,為細胞暫時提供CRISPR蛋白或酶和核酸並且改變基因座位,隨後該CRISPR系統的一種或多種組分的量係下降的。隨後,已經獲得了CRISPR介導的遺傳改變的細胞、細胞的子代和包含該等細胞的生物包括減少的量的一種或多種CRISPR系統組分,或不再含有這一種或多種CRISPR系統組分。一個非限制性實例係自行失活性CRISPR-Cas系統,如本文進一步描述的。因此,本發明提供了以下細胞、和生物、以及該等細胞和生物的子代,它們包括一個或多個經CRISPR-Cas系統改變的基因座位,但是實質上缺乏一種或多種CRISPR系統組分。在某些實施方式中,基本上不含該等CRISPR系統組分。此類細胞、組織和生物有利地包括希望的或選擇的遺傳改變,但是已經丟失CRISPR-Cas組分或其殘餘物,該等組分或其殘餘物可能潛在地非特異性地起作用、導致安全性問題、或阻礙監管部門批准。同樣地,本發明提供了由該等細胞、生物、和該等細胞和生物的子代製成的產品。
本發明進一步提供了藉由提供根據本發明的工程化的 CRISPR蛋白來改進CRISPR系統的特異性之方法。較佳的是,工程化的CRISPR蛋白,其中
該蛋白與包含RNA的核酸分子複合,以形成CRISPR複合物,
其中當在該CRISPR複合物中時,該核酸分子靶向一個或多個靶多核苷酸座位,
該蛋白與未修飾的蛋白相比包括至少一種修飾,
其中與包含未修飾的蛋白的複合物相比,包含經修飾的蛋白的CRISPR複合物具有改變的活性。所述至少一種修飾較佳的是在如本文描述的RuvC和/或HNH結構域中或在HNH與RuvC結構域之間的結合溝槽中。較佳的修飾係如本文描述的突變。
本發明進一步提供了根據本發明的工程化的CRISPR蛋白改進CRISPR系統的特異性之用途。較佳的是,工程化的CRISPR蛋白
其中該蛋白與包含RNA的核酸分子複合,以形成CRISPR複合物,
其中當在該CRISPR複合物中時,該核酸分子靶向一個或多個靶多核苷酸座位,
其中該蛋白與未修飾的蛋白相比被修飾成包括至少一種修飾,
其中與包含未修飾的蛋白的複合物相比,包含經修飾的蛋白的CRISPR複合物具有改變的活性。所述至少一種修飾較佳的是在如本文描述的RuvC和/或HNH結構域中或在HNH與RuvC結構域之間的結合溝槽中。較佳的修飾係如本文描述的突變。
【本發明的詳細說明】
在描述本發明的方法之前,應理解的是本發明不限於描述的具體方法、組分、產品或組合,因為該等方法、組分、產品和組合當然可以改變。還應理解的是,本文使用的術語並不旨在係限制性的,因為本發明的範圍將僅由所附申請專利範圍限制。
如本文使用的,單數形式“一/一個/種(a,an)”和“該 (the)”包括單數和複數指示物兩者,除非上下文另外明確地指明。
如本文使用的術語“包括了(comprising)”、“包括(comprises)”和“由......構成(comprised of)”與“包含了(including)”、“包含(includes)”或“含有(containing)”、“含有(contains)”同義,並且是包容性或開放式的並且不排除另外的、未列舉的成員、元素或方法步驟。應當理解的是,如本文使用的術語“包括了(comprising)”、“包括(comprises)”和“由......構成(comprised of)”包括術語“由......組成(consisting of)”、“組成為(consists)”和“由......組成(consists of)”,以及術語“基本上由......組成(consisting essentially of)”、“組成基本上為(consists essentially)”和“基本上由......組成(consists essentially of)”。應注意,在本揭露並且特別是在申請專利範圍和/或段落中,術語如“包括(comprise)”、“包括的(comprised)”、“包括了(comprising)”等等可具有在美國專利法中屬於它的含義;例如,它們可以表示“包含(includes)”、“包含的(included)”、“包含了(including)”等等;並且該等術語如“基本上由......組成(consisting essentially of)”和“基本上由......組成(consists essentially of)”具有在美國專利法中歸於它們的含義,例如,它們允許未被明確敘述的要素,但是排除在先前技術中發現或者影響本發明的基本或新穎特徵的要素。可以有利的是,在本發明的實踐中符合條款53(c)EPC以及條例28(b)和(c)EPC。此處旨在沒有任何承諾。
藉由端點對數值範圍的陳述包括所有數位和包含在對應的範圍內的分數,以及所列舉的端點。
當涉及可測量的值(如參數、量、短暫的持續時間等)時,如本文使用的術語“約(about)”或“大約(approximately)”意在包括指定值的和遠離指定值的+/-20%或更少,較佳的是+/-10%或更少,更較佳的是+/-5%或更少,並且仍更較佳的是+/-1%或更少的變化,在該等變化適於在所揭露的發明中執行的情況下。應理解的是,還確切地且較佳的是揭露了修飾語“約”或“大約”所涉及的值本身。
鑒於術語“一個/種或多個/種(one or more)”或“至少一個/種(at least one)”(如一組成員的一個或多個或至少一個成員)本身是清楚的,藉由進一步示例的方式,該術語尤其包括對所述成員中的任一者、或對所述成員中的任兩者或更多者的提及,例如像所述成員的任何
Figure 112128864-A0101-12-0069-4
3、
Figure 112128864-A0101-12-0069-5
4、
Figure 112128864-A0101-12-0069-6
5、
Figure 112128864-A0101-12-0069-7
6或
Figure 112128864-A0101-12-0069-8
7者等,並且直到所有所述成員。
在本說明書中引用的所有參考文獻都藉由引用以其全部內容而特此結合。具體而言,在本文中具體提及的所有參考文獻的傳授都藉由引用而結合。
除非另外定義,在揭露本發明中使用的所有術語(包括技術術語和科學術語)具有如本發明所屬領域內的普通技術人員通常所理解的含義。藉由進一步指導的方式,包括術語定義以便更好地理解本發明的傳授。
在下面的段落中,更加詳細地定義本發明的不同方面。除非明確地指出相反,如此定義的每個方面都可以與任何其他一個或多個方面組合。具體而言,被指示為較佳的是或有利的任何特徵都可以與被指示為較佳的是或有利的任何其他一個或多個特徵組合。
闡述重組DNA技術總則的標準參考著作包括《分子選殖:實驗室手冊》(Molecular Cloning:A Laboratory Manual),第2版,第1-3卷,編輯薩姆布魯克(Sambrook)等人,冷泉港實驗室出版社(Cold Spring Harbor Laboratory Press),冷泉港,紐約,1989;《分子生物學實驗指南》(Current Protocols in Molecular Biology),編輯奧蘇貝爾(Ausubel)等人,格林出版和威利國際科學(Greene Publishing and Wiley-Interscience),紐約,1992(連同週期性更新)(“奧蘇貝爾等人1992”);《酶學方法》(Methods in Enzymology)系列(學術出版社公司(Academic Press,Inc.));因尼斯(Innis)等人,《PCR方案:方法與應用指南》(PCR Protocols:A Guide to Methods and Applications),學術出版社(Academic Press):聖地牙哥,1990;《PCR 2:實用方法》(PCR 2:A Practical Approach)(M.J.麥克弗森(MacPherson)、B.D.哈梅斯(Hames)和G.R.泰勒(Taylor)編輯(1995);哈洛(Harlow)和拉內(Lane)編輯(1988)《抗體:實驗室手冊》(Antibodies,a Laboratory Manual);以及《動物細胞培養》(Animal Cell Culture)(R.I.福瑞施尼(Freshney)編輯(1987)。微生物學總則闡述於例如大衛斯(Davis),B.D.等人,《微生物學》(Microbiology),第3版,哈珀 & 羅出版商(Harper & Row,publishers),費城,賓夕法尼亞州(1980)。
貫穿本說明書對“一個實施方式”或“實施方式”的提及意指結合該實施方式所描述的具體特徵、結構或特性被包括在本發明的至少一個實施方式中。因此,貫穿本說明書短語“在一個實施方式中”或“在實施方式中”在各處的出現並不必然全部係指同一實施方式,但 可以是指同一實施方式。此外,在一個或多個實施方式中,具體特徵、結構或特性可以按任何合適的方式組合,這對於熟習該項技術者而言根據本揭露係顯而易見的。此外,如熟習該項技術者應理解的,雖然本文所描述的一些實施方式包括一些特徵但不包括其他實施方式中所包括的其他特徵,但是不同實施方式的特徵的組合意在落入本發明的範圍內,並且構成不同實施方式。例如,在所附申請專利範圍中,任何所要求的實施方式都可以按任何組合來使用。
在本發明的說明書中參考了附圖,該等附圖構成本說明書的一部分,並且在附圖中僅以說明方式示出了能夠實踐本發明的特定實施方式。應理解的是,在不背離本發明範圍的情況下,可以利用其他實施方式並且可以進行結構或邏輯變化。因此,本說明書不應以限制性意義來理解,並且本發明的範圍僅由所附申請專利範圍限定。
本發明的目的在於,在本發明中不涵蓋任何先前已知的產品、製造該產品的過程、或使用該產品之方法,使得申請人保留和特此公開放棄任何先前已知的產品、過程、或方法的權利。進一步指出的是,在本發明的範圍之內,本發明並不旨在涵蓋任何產品、過程、或該產品的製造或使用該產品之方法,其不符合USPTO(35 U.S.C.§112,第一段)或EPO(EPC的第83條)的書面說明和可實施性要求,使得申請人保留和特此公開放棄任何先前描述的產品、製造該產品的過程、或使用該產品的方法的權利。
在下文設定了本發明的較佳的陳述(特徵)和實施方式。除非明確地指出相反,如此定義的本發明的每個陳述和實施方式都可以 與任何其他陳述和/或實施方式組合。具體而言,被指示為較佳的或有利的任何特徵都可以與被指示為較佳的或有利的任何其他一個或多個特徵或陳述組合。
如本文使用的,術語“非人類生物”或“非人類細胞”係指不同於智人或不是源自智人的生物或細胞。如本文使用的,術語“非人類真核生物”或“非人類真核細胞”係指不同於智人或不是源於智人的真核生物或細胞。在較佳的實施方式中,這樣的真核生物(細胞)係非人類動物(細胞),如非人類哺乳動物、非人類靈長類動物、有蹄動物、齧齒動物(較佳的是小鼠或大鼠)、兔、犬、狗、奶牛、牛、綿羊(sheep,ovine)、山羊、豬、家禽(fowl,poultry)、雞、魚、昆蟲、或節肢動物,較佳的是哺乳動物,如齧齒動物,特別是小鼠(的細胞或細胞群)。在本發明的一些實施方式中,該生物或受試者或細胞可以是節肢動物,例如,昆蟲或線蟲(源於它的細胞或細胞群)。在本發明的一些方法中,該生物或受試者或細胞係植物(細胞)。在本發明的一些方法中,該生物或受試者或細胞係(源於)藻類(包括微藻)、或真菌。熟習該項技術者應當理解的是,可以根據如本文提及的方法被移植或引入非人類真核生物中的真核細胞較佳的是源於或源自與它們移植至其中的真核生物相同的物種。例如,在某個實施方式中,根據如本文描述的本發明之方法,將小鼠細胞植入小鼠體內。在某些實施方式中,該真核生物係免疫受損的真核生物,即免疫系統部分或完全關閉的真核生物。例如,可以將免疫受損的小鼠用於根據如本文描述的本發明的方法中。免疫受損的小鼠的實例包括但不限於裸鼠、RAG-/-小鼠、SCID(嚴重受損免疫缺陷)小鼠、 SCID-Beige小鼠、NOD(非肥胖性糖尿病)-SCID小鼠、NOG或NSG小鼠等。
應理解的是,如本文描述的CRISPR-Cas系統在所述細胞中是非天然存在的,即對於所述細胞而言是工程化的或外源的。如本文提及的CRISPR-Cas系統已經被引入所述細胞中。用於將CRISPR-Cas系統引入細胞的方法在本領域係已知的,並且在本文的其他地方進一步描述。根據本發明的包含CRISPR-Cas系統或引入了CRISPR-Cas系統的細胞包含或能夠表現用於建立功能性CRISPR複合物的CRISPR-Cas系統的單獨組分,該複合物能夠修飾(如切割)靶DNA序列。因此,如本文提及的,包含CRISPR-Cas系統的細胞可以是包含用於建立功能性CRISPR複合物的CRISPR-Cas系統的單獨組分的細胞,該複合物能夠修飾(如切割)靶DNA序列。可替代地,如本文提及的,並且較佳的是,包含CRISPR-Cas系統的細胞可以是包含編碼該CRISPR-Cas系統的單獨組分的一種或多種核酸分子的細胞,該等組分可以在該細胞中表現以建立能夠修飾(如切割)靶DNA序列的功能性CRISPR複合物。
如本文使用的,術語V型或VI型CRISPR-Cas座位效應蛋白的“crRNA”或“指導RNA”或“單個指導RNA”或“sgRNA”或“一種或多種核酸組分”包括與靶核酸序列具有足夠互補性以與該靶核酸序列雜交並且引導靶向核酸的複合物與該靶核酸序列的序列特異性結合的任何多核苷酸序列。在一些實施方式中,當使用適合的比對演算法進行最佳比對時,互補程度係約或多於約50%、60%、75%、80%、85%、90%、95%、97.5%、99%、或更多。可以使用用於比對序列的任何適合 的演算法來確定最佳比對,其非限制性實例包括史密斯-沃特曼(Smith-Waterman)演算法、尼德曼-翁施(Needleman-Wunsch)演算法、基於伯羅斯-惠勒變換(Burrows-Wheeler Transform)的演算法(例如,伯羅斯-惠勒比對工具(Burrows Wheeler Aligner))、ClustalW、Clustal X、BLAT、Novoalign(Novocraft技術公司;在www.novocraft.com可獲得)、ELAND(億明達公司(Illumina),聖地牙哥,加利福尼亞州)、SOAP(在soap.genomics.org.cn可獲得)、以及Maq(在maq.sourceforge.net可獲得)。可以藉由任何適合的測定來評估指導序列(在靶向核酸的指導RNA內)引導靶向核酸的複合物與靶核酸序列的序列特異性結合的能力。例如,足以形成靶向核酸的複合物的靶向核酸的CRISPR系統的組分(包括有待測試的指導序列)可以如藉由用編碼靶向核酸的該複合物的組分的載體進行轉染而被提供到具有相應靶核酸序列的宿主細胞中,隨後如藉由如本文描述的Surveyor測定來評估在該靶核酸序列內的優先靶向(例如,切割)。類似地,藉由提供靶核酸序列、靶向核酸的複合物的組分(包括有待測試的指導序列)和不同於該測試指導序列的對照指導序列,並且比較在該測試指導序列與對照指導序列反應之間的靶序列處的結合或切割率,可以在試管中評估該靶核酸序列的切割。其他測定法係可能的,並且將由熟習該項技術者想到。指導序列可以被選擇為靶向任何靶核酸序列,並且因此靶向核酸的指導RNA也可以。該靶序列可以是DNA。該靶序列可以是任何RNA序列。在一些實施方式中,該靶序列可以是選自下組的RNA分子內的序列,該組由以下各項組成:信使RNA(mRNA)、pre-mRNA、核糖體RNA(rRNA)、轉移RNA(tRNA)、微小RNA(miRNA)、小干擾RNA(siRNA)、核小RNA(snRNA)、核仁小RNA(snoRNA)、 雙股RNA(dsRNA)、非編碼RNA(ncRNA)、長鏈非編碼RNA(lncRNA)、以及胞質小RNA(scRNA)。在一些較佳的實施方式中,該靶序列可以是選自下組的RNA分子內的序列,該組由以下各項組成:mRNA、pre-mRNA、和rRNA。在一些較佳的實施方式中,該靶序列可以是選自下組的RNA分子內的序列,該組由以下各項組成:ncRNA、和lncRNA。在一些更較佳的實施方式中,該靶序列可以是mRNA分子或pre-mRNA分子內的序列。
在一些實施方式中,靶向核酸的指導RNA被選擇為降低在靶向RNA的該指導RNA內的二級結構水平。在一些實施方式中,在最佳地折疊時,靶向核酸的該指導RNA的約或少於約75%、50%、40%、30%、25%、20%、15%、10%、5%、1%、或更少的核苷酸參與自我互補鹼基配對。可以藉由任何適合的多核苷酸折疊演算法來確定最佳折疊。一些演算法係基於計算最小吉布斯(Gibbs)自由能。一種這樣的演算法的實例係mFold,正如祖克(Zuker)和施蒂格勒(Stiegler)所描述的(《核酸研究》(Nucleic Acids Res.)9(1981),133-148)。折疊演算法的另一個實例係使用質心結構預測演算法的由維也納大學(University of Vienna)的理論化學研究所(Institute for Theoretical Chemistry)研發的線上網路服務器RNAfold(參見例如,A.R.格魯伯(Gruber)等人,2008,《細胞》(Cell)106(1):23-24;以及PA卡爾(Carr)和GM丘奇(Church),2009,《自然生物技術》(Nature Biotechnology)27(12):1151-62)。
在某些實施方式中,指導RNA或crRNA可以包括同向重複(DR)序列和指導序列或間隔子序列、基本上由其組成、或由其組成。 在某些實施方式中,該指導RNA或crRNA可以包括融合至或連接至指導序列或間隔子序列的同向重複序列、基本上由其組成、或由其組成。在某些實施方式中,該同向重複序列可以位於該指導序列或間隔子序列的上游(即,5')。在其他實施方式中,該同向重複序列可以位於該指導序列或間隔子序列的下游(即,3')。
在某些實施方式中,該crRNA包括莖環,較佳的是單個莖環。在某些實施方式中,該同向重複序列形成莖環,較佳的是單個莖環。
在某些實施方式中,該指導RNA的間隔子長度係從15至35nt。在某些實施方式中,該指導RNA的間隔子長度係至少15個核苷酸。在某些實施方式中,間隔子長度係從15至17nt(例如,15、16或17nt)、從17至20nt(例如,17、18、19或20nt)、從20至24nt(例如,20、21、22、23或24nt)、從23至25nt(例如,23、24或25nt)、從24至27nt(例如,24、25、26或27nt)、從27-30nt(例如,27、28、29或30nt)、從30-35nt(例如,30、31、32、33、34或35nt、或35nt)或更長。
“tracrRNA”序列或類似術語包括與crRNA序列具有足夠互補性以便雜交的任何多核苷酸序列。在一些實施方式中,在進行最佳比對時,在tracrRNA序列與crRNA序列之間沿著這兩者的較短者的長度的互補程度係約或多於約25%、30%、40%、50%、60%、70%、80%、90%、95%、97.5%、99%、或更高。在一些實施方式中,該tracr序列在長度上為約或多於約5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、40、50個、或更多個核苷酸。在一些實施方式中,該tracr序列和crRNA序列被包含在單個轉錄物中,使得在這兩者之間的雜交產 生具有二級結構(如髮夾)的轉錄物。在本發明的一實施方式中,該轉錄物或轉錄的多核苷酸序列具有至少兩個或更多個髮夾。在較佳的實施方式中,該轉錄物具有兩個、三個、四個或五個髮夾。在本發明的一另外的實施方式中,該轉錄物具有至多五個髮夾。在一髮夾結構中,在該環的最終“N”和上游的序列5’的部分相應於該tracr配對序列,並且該環的序列3’的部分相應於該tracr序列。
一般而言,該CRISPR-Cas、CRISPR-Cas9或CRISPR系統可以是如在前述文獻(如WO 2014/093622(PCT/US 2013/074667))中所使用的並且總共係指轉錄物和涉及CRISPR相關(“Cas”)基因的表現或引導其活性的其他元件,包括編碼Cas基因(特別地,在CRISPR-Cas9的情況下是Cas9基因)的序列、tracr(反式活化CRISPR)序列(例如tracrRNA或活性部分tracrRNA)、tracr配對序列(涵蓋“同向重複”和在內源CRISPR系統背景下的tracrRNA加工的部分同向重複)、指導序列(在內源CRISPR系統背景下也稱為“間隔子(spacer)”)、或如本文使用的術語“RNA”(例如,指導Cas9的RNA,例如,CRISPR RNA和反式活化(tracr)RNA或單一指導RNA(sgRNA)(嵌合RNA))或來自CRISPR座位的其他序列和轉錄物。一般而言,CRISPR系統的特徵為促進在靶序列的位點處的CRISPR複合物(在內源CRISPR系統的背景下也稱為原型間隔子)的形成的元件。在CRISPR複合物形成的背景下,“靶序列”係指指導序列被設計為對其具有互補性的序列,其中在靶序列與指導序列之間的雜交促進CRISPR複合物的形成。藉由其與靶序列的互補性對於切割活性而言重要的指導序列區段在本文被稱為種子序列。靶序列可以包 含任何多核苷酸,如DNA或RNA多核苷酸。在一些實施方式中,靶序列位於細胞的細胞核或細胞質中,並且可以包括存在於該細胞中的線粒體、細胞器、囊泡、脂質體或粒子中的或來自其中的核酸。在一些實施方式中,尤其是對於非核用途,NLS不是較佳的。在一些實施方式中,可以藉由電腦搜索重複模體來鑒定同向重複,其滿足下列標準的任一項或全部:1.發現在II型CRISPR座位側翼的基因組序列的2Kb視窗;2.跨從20到50bp;以及3.以20到50bp間隔開。在一些實施方式中,可以使用該等標準中的2條,例如1和2、2和3、或1和3。在一些實施方式中,可以使用所有這3條標準。
在本發明的實施方式中,術語指導序列和指導RNA(即能夠將Cas導向靶基因組座位的RNA)可互換地使用,如在前述引用文獻(如WO 2014/093622(PCT/US 2013/074667))中。一般而言,指導序列係與靶多核苷酸序列具有足夠互補性以便與該靶序列雜交並且引導CRISPR複合物與該靶序列的序列特異性結合的任何多核苷酸序列。在一些實施方式中,當使用適合的比對演算法進行最佳比對係,在指導序列與其相應的靶序列之間的互補程度係約或多於約50%、60%、75%、80%、85%、90%、95%、97.5%、99%、或更多。可以使用用於比對序列的任何適合的演算法來確定最佳比對,其非限制性實例包括史密斯-沃特曼演算法、尼德曼-翁施演算法、基於伯羅斯-惠勒變換的演算法(例如伯羅斯-惠勒比對工具)、ClustalW、Clustal X、BLAT、Novoalign(Novocraft技術公司;在www.novocraft.com可獲得)、ELAND(億明達公司,聖地牙哥,加利福尼亞州)、SOAP(在soap.genomics.org.cn可獲得)、以及Maq (在maq.sourceforge.net可獲得)。在一些實施方式中,指導序列在長度上為約或多於約5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、75個、或更多個核苷酸。在一些實施方式中,指導序列在長度上為少於約75、50、45、40、35、30、25、20、15、12個、或更少的核苷酸。較佳的是,該指導序列係10-30個核苷酸長。可以藉由任何適合的測定法來評估指導序列引導CRISPR複合物與靶序列的序列特異性結合的能力。例如,足以形成CRISPR複合物的CRISPR系統的組分,包括有待測試的指導序列在內,可以例如藉由用編碼該CRISPR序列的組分的載體進行轉染而被提供到具有相應靶序列的宿主細胞中,隨後藉由如本文所述的Surveyor測定來評估在該靶序列之內的優先切割。類似地,藉由提供該靶序列、包括有待測試的指導序列在內的CRISPR複合物的組分、和不同於該測試指導序列的對照指導序列,並且比較在該測試指導序列與該對照指導序列反應之間的靶序列處的結合或切割率,可以在試管中評估靶多核苷酸序列的切割。其他測定法係可能的,並且將由熟習該項技術者想到。
在CRISPR-Cas系統的一些實施方式中,在指導序列與其相應的靶序列之間的互補程度可以是約或多於約50%、60%、75%、80%、85%、90%、95%、97.5%、99%、或100%;指導或RNA或sgRNA在長度上可以為約或多於約5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、75個、或更多個核苷酸;或者指導物或RNA或sgRNA在長度上可以為少於約75、50、45、40、35、30、25、20、15、12個、或更少的核苷酸;並且 有利地,tracrRNA在長度上為30或50個核苷酸。然而,本發明的一方面在於減少脫靶相互作用,例如減少與具有低互補性的靶序列的相互作用的指導。的確,在該等實例中,顯示本發明涉及突變,該等突變產生能夠將具有大於80%至約95%互補性(例如,83%-84%或88%-89%或94%-95%互補性)的靶序列與脫靶序列區分開(例如,將具有18個核苷酸的靶標與具有1、2或3個錯配的18個核苷酸的脫靶區分開)的CRISPR-Cas系統。因此,在本發明的背景下,在指導序列與其相應的靶序列之間的互補程度大於94.5%或95%或95.5%或96%或96.5%或97%或97.5%或98%或98.5%或99%或99.5%或99.9%,或係100%。脫靶小於100%或99.9%或99.5%或99%或99%或98.5%或98%或97.5%或97%或96.5%或96%或95.5%或95%或94.5%或94%或93%或92%或91%或90%或89%或88%或87%或86%或85%或84%或83%或82%或81%或80%的該序列與該指導物之間的互補性,其中有利的是脫靶係100%或99.9%或99.5%或99%或99%或98.5%或98%或97.5%或97%或96.5%或96%或95.5%或95%或94.5%的該序列與該指導物之間的互補性。
在根據本發明的特別較佳的實施方式中,該指導RNA(能夠將Cas導向靶座位)可以包含(1)能夠雜交到真核細胞中的基因組靶座位上的指導序列;(2)tracr序列;以及(3)tracr配對序列。所有(1)至(3)可以位於單個RNA(即sgRNA)中(以5’到3’方向排列),或者tracrRNA可以是不同於含有指導序列和tracr序列的RNA的RNA。該tracr雜交到tracr配對序列上並且將CRISPR/Cas複合物引導至靶序列。
如本文描述的根據本發明的方法包括在真核細胞中(在體 外,即在分離的真核細胞中)誘導一個或多個如本文討論的突變,包括向細胞遞送如本文討論的載體。這一個或多個突變可以包括經由一種或多種指導、一種或多種RNA或一種或多種sgRNA在一個或多個細胞的每個靶序列處引入、缺失、或取代一個或多個核苷酸。該等突變可以包括經由一種或多種指導、一種或多種RNA或一種或多種sgRNA在所述一個或多個細胞的每個靶序列處引入、缺失、或取代1-75個核苷酸。該等突變可以包括經由一種或多種指導、一種或多種RNA或一種或多種sgRNA在所述一個或多個細胞的每個靶序列處引入、缺失、或取代1、5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、或75個核苷酸。該等突變可以包括經由一種或多種指導、一種或多種RNA或一種或多種sgRNA在所述一個或多個細胞的每個靶序列處引入、缺失、或取代5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、或75個核苷酸。該等突變包括經由一種或多種指導、一種或多種RNA或一種或多種sgRNA在所述一個或多個細胞的每個靶序列處引入、缺失、或取代10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、或75個核苷酸。該等突變可以包括經由一種或多種指導、一種或多種RNA或一種或多種sgRNA在所述一個或多個細胞的每個靶序列處引入、缺失、或取代20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、或75個核苷酸。該等突變可以包括經由一種或多種指導、一種或多種RNA或一種或多種sgRNA在所述一個或多個細胞的每個靶序列處引入、缺失、或取代40、45、50、75、100、200、300、400或500個核苷酸。
為了將毒性和脫靶效應最小化,考慮了控制所遞送的Cas mRNA和指導RNA的濃度。Cas mRNA和指導RNA的最佳濃度可以藉由在細胞或非人類真核生物動物模型中測試不同的濃度並且使用深度定序分析在潛在的脫靶基因組座位處的修飾的範圍而確定。可替代地,為了將毒性水平和脫靶效應最小化,可以用一對靶向感興趣位點的指導RNA來遞送Cas切口酶mRNA(例如,具有D10A突變的釀膿鏈球菌Cas9)。將毒性和脫靶效應最小化的指導序列和策略可以是如在WO 2014/093622(PCT/US 2013/074667)中的;或者,經由如本文的突變。
典型地,在內源CRISPR系統的背景下,CRISPR複合物(包含雜交到靶序列上並且與一種或多種Cas蛋白複合的指導序列)的形成導致在該靶序列中或其附近(例如在1、2、3、4、5、6、7、8、9、10、20、50、或更多個鹼基對之內)的一條股或兩條股的切割。不希望受到理論的束縛,該tracr序列(其可以包含或其組成為野生型tracr序列的全部或部分(例如野生型tracr序列的約或多於約20、26、32、45、48、54、63、67、85個、或更多個核苷酸))也可以形成CRISPR複合物的一部分,如藉由沿著該tracr序列的至少一部分雜交到與該指導序列可操作地連接的tracr配對序列的全部或部分上。
RuvCI、RuvCII、RuvCIII和HNH結構域的位置示於圖22A-C中。如本文使用的,術語“RuvCI結構域”較佳的是指包含釀膿鏈球菌Cas9(SpCas9)的胺基酸1-60或另一Cas9異種同源物或不同於Cas9的CRISPR核酸酶中的相應區域的結構域。如本文使用的,術語“RuvCII結構域”較佳的是指包含釀膿鏈球菌Cas9(SpCas9)的胺基酸718-775或 另一Cas9異種同源物或不同於Cas9的CRISPR核酸酶中的相應區域的結構域。如本文使用的,術語“RuvCIII結構域”較佳的是指包含釀膿鏈球菌Cas9(SpCas9)的胺基酸909-1099或另一Cas9異種同源物或不同於Cas9的CRISPR核酸酶中的相應區域的結構域。如本文使用的,術語“HNH結構域”較佳的是指包含釀膿鏈球菌Cas9(SpCas9)的胺基酸776-908或另一Cas9異種同源物或不同於Cas9的CRISPR核酸酶中的相應區域的結構域。RuvC與HNH結構域之間的溝槽係指在如本文描述的非天然存在的CRISPR酶的三維結構中的該等結構域之間的溝槽。圖25D示出了SaCas9的晶體結構,其中示出了在SaCas9的三維結構中的HNH與RuvC結構域之間的溝槽。
適配體
一種具有第一適配體/RNA結合蛋白對的指導物可以連接至或融合至活化蛋白,同時具有第二適配體/RNA結合蛋白對的第二指導可以連接至或融合至抑制蛋白。該等指導物係針對不同的靶標(座位),所以這允許一個基因被活化而一個基因被抑制。例如,以下示意圖示出了這樣一種方法:
指導物1-MS2適配體-------MS2 RNA結合蛋白-------VP64活化蛋白;和
指導物2-PP7適配體-------PP7 RNA結合蛋白-------SID4x抑制蛋白。
本發明還涉及正交PP7/MS2基因靶向。在這個實例中,用不同RNA環修飾靶向不同座位的sgRNA,以便募集MS2-VP64或PP7-SID4X,它們分別活化和抑制其靶座位。PP7係噬菌體假單胞菌屬的 RNA結合外殼蛋白。像MS2一樣,它結合特定的RNA序列和二級結構。PP7的RNA識別模體不同於MS2的RNA識別模體。因此,PP7和MS2可以被多元化,以同時在不同基因組座位處介導不同效應。例如,可以用MS2環修飾靶向座位A的sgRNA,從而募集MS2-VP64活化蛋白,同時可以用PP7環修飾靶向座位B的另一sgRNA,從而募集PP7-SID4X抑制結構域。在同一細胞中,dCas9因此可以介導正交的、座位特異性修飾。這個原理可以擴展到摻入其他正交RNA結合蛋白,如Q-β。
正交抑制的替代選擇包括向指導中摻入具有反向活化抑制功能的非編碼RNA環(在被摻入該指導物中的MS2/PP7環的類似位置處或在該指導物的3'末端處)。例如,用非編碼(但已知係抑制性的)RNA環設計指導物(例如,使用干擾哺乳動物細胞中的RNA聚合酶II的Alu阻抑因子(在RNA中))。將Alu RNA序列定位:代替如本文使用的MS2 RNA位置(例如在四核苷酸環和/或莖環2處);和/或在該指導物的3'末端處。這給出了MS2、PP7或Alu在四核苷酸環和/或莖環2位置處的可能的組合,以及視情況,Alu在該指導物的3'端處的添加(用或不用接頭)。
兩種不同適配體(不同的RNA)的使用允許使用活化蛋白-轉接蛋白融合和抑制蛋白-轉接蛋白融合與不同指導物,以活化一個基因的表現,同時阻抑另一個基因的表現。可以在多元方法中一起或基本上一起給予它們連同其不同指導物。可以同時使用大量的這樣的經修飾的指導物,例如10種或20種或30種等,同時待遞送僅一種(或至少最小數目的)Cas9,因為相對較小數目的Cas9可以與大量的經修飾的指導物一起使用。轉接蛋白可以與一種或多種活化蛋白或一種或多種抑制蛋白 相關聯(較佳的是連接至或融合至它們)。例如,轉接蛋白可以與第一活化蛋白和第二活化蛋白相關聯。該第一和第二活化蛋白可以是相同的,但是較佳的是它們係不同的活化蛋白。例如,一者可能是VP64,同時另一者可能是p65,但是該等僅是實例並且設想了其他轉錄活化蛋白。可以使用三種或更多種或甚至四種或更多種活化蛋白(或抑制蛋白),但是包裝尺寸可以將數目限制高於5個不同的功能結構域。在直接融合至轉接蛋白中較佳的是使用接頭,其中兩個或更多個功能結構域與該轉接蛋白相關。適合的接頭可以包括GlySer接頭。
還可以設想的是,該酶-指導複合物整體上可以與兩個或更多個功能結構域相關聯。例如,可以存在兩個或更多個與該酶相關的功能結構域,或者可以存在兩個或更多個與該指導相關的功能結構域(經由一種或多種轉接蛋白),或者可以存在一個或多個與該酶相關的功能結構域和一個或多個與該指導相關的功能結構域(經由一種或多種轉接蛋白)。
轉接蛋白與活化蛋白或抑制蛋白之間的融合可以包括接頭。例如,可以使用GlySer接頭GGGS。根據需要,它們可以按3個((GGGGS)3)或6、9或甚至12個或更多個的重複使用,以提供適合的長度。接頭可以用在RNA結合蛋白與功能結構域(活化蛋白或阻抑因子)之間,或CRISPR酶(Cas9)與功能結構域(活化蛋白或阻抑因子)之間。使用該等接頭來工程化適當量的“機械柔性”。
失活的指導物:包含失活的指導序列的指導RNA可以用在本發明中
在一個方面,本發明提供了按以下方式修飾的指導序列, 該方式允許形成CRISPR複合物並且成功地結合至靶標,但同時不允許成功的核酸酶活性(即沒有核酸酶活性/沒有indel活性)。出於解釋的原因,這樣的經修飾的指導序列被稱為“失活的指導物”或“失活的指導序列”。就核酸酶活性而言,該等失活的指導物或失活的指導序列可以被認為是無催化活性的或無構象活性的。核酸酶活性可以使用如本領域通常使用的surveyor分析或深度定序(較佳的是surveyor分析)來測量。類似地,就促進催化活性的能力或區分中靶和脫靶結合活性的能力而言,失活的指導序列並不可以足夠地參與富有成效的鹼基配對。簡單地說,surveyor測定涉及純化和擴增基因的CRISPR靶位點並且與擴增該CRISPR靶位點的引物形成異源雙股體。重退火之後,遵循製造商的推薦方案,將產物用SURVEYOR核酸酶和SURVEYOR增強子S(轉基因組學公司(Transgenomics))處理,在凝膠上進行分析,並且基於相對帶強度進行量化。
因此,在一相關方面,本發明提供了非天然存在的或工程化的組成物Cas9 CRISPR-Cas系統,該系統包含如本文描述的功能性Cas9、和指導RNA(gRNA),其中該gRNA包含失活的指導序列,由此該gRNA能夠雜交到靶序列上,這樣使得該Cas9 CRISPR-Cas系統被引導至細胞中的感興趣基因組座位,而沒有由該系統的非突變型Cas9酶的核酸酶活性得到的可檢測的indel活性,如藉由SURVEYOR測定所檢測的。出於簡寫的目的,包含失活的指導序列的gRNA(由此該gRNA能夠雜交到靶序列上,這樣使得該Cas9 CRISPR-Cas系統被引導至細胞中的感興趣基因組座位,而沒有由該系統的非突變型Cas9酶的核酸酶活性得到的可檢 測的indel活性,如藉由SURVEYOR測定所檢測的)在本文被稱為“失活的gRNA”。應理解的是,如在本文的其他地方描述的根據本發明的任何gRNA都可以用作失活的gRNA/包含如在下文描述的失活的指導序列的gRNA。如在本文的其他地方描述的任何方法、產品、組成物和用途都同樣地適用於如下文進一步詳述的失活的gRNA/包含如在下文描述的失活的指導序列的gRNA。藉由進一步指導的方式,提供了以下具體方面和實施方式。
可以藉由任何適合的測定法來評估失活的指導序列引導CRISPR複合物與靶序列的序列特異性結合的能力。例如,足以形成CRISPR複合物的CRISPR系統的組分(包括有待測試的失活的指導序列)可以例如藉由用編碼該CRISPR序列的組分的載體進行轉染而被提供到具有相應靶序列的宿主細胞中,隨後藉由如本文所述的Surveyor測定來評估在該靶序列之內的優先切割。類似地,藉由提供靶序列、CRISPR複合物的組分(包括有待測試的失活的指導序列)和不同於該測試失活的指導序列的對照指導序列,並且比較在該測試指導序列與對照指導序列反應之間的靶序列處的結合或切割率,可以在試管中評估靶多核苷酸序列的切割。其他測定法係可能的,並且將由熟習該項技術者想到。失活的指導序列可以被選擇為靶向任何靶序列。在一些實施方式中,該靶序列係在細胞的基因組內的序列。
如本文進一步解釋的,若干結構參數允許適當的框架到達這樣的失活的指導物處。失活的指導序列短於對應的指導序列,這導致活躍的Cas9特異性indel形成。失活的指導物比被引導至相同Cas9的對應 的指導物短5%、10%、20%、30%、40%、50%,從而引起活躍的Cas9特異性indel形成。
如下文解釋的並且本領域已知的,gRNA-Cas9特異性的一個方面係同向重複序列,它有待被適當地連接至這樣的指導物。具體而言,這意味著該同向重複序列的設計取決於Cas9的來源。因此,可用於經驗證的失活的指導序列的結構數據可以用於設計Cas9特異性等效物。例如兩種或更多種Cas9效應蛋白的直向同源核酸酶結構域RuvC之間的結構相似性可以用於遷移設計等效失活的指導物。因此,可以在長度和序列上對本文的失活的指導物進行適當修飾,以反映這樣的Cas9特異性等效物,從而允許形成CRISPR複合物並且成功地結合至靶標,而同時不允許成功的核酸酶活性。
失活的指導物在本文以及先前技術背景下的使用為體外、離體和體內應用兩者中的網路生物學和/或系統生物學提供了令人驚訝且出乎意料的平臺,從而允許多元基因靶向,並且特別是雙向多元基因靶向。在失活的指導物的使用之前,處理多個靶標(例如用於基因活性的活化、抑制和/或沈默)一直具有挑戰性並且在一些情況下是不可能的。藉由使用失活的指導物,可以例如在同一細胞中、在同一動物體內、或在同一患者體內處理多個靶標,並且因此處理多種活性。這種多元化可以同時發生或交錯發生持續希望的時間段。
例如,失活的指導物現在允許初次使用gRNA作為基因靶向工具,而不是核酸酶活性的結果,並且同時提供活化或抑制的引導工具。包含失活的指導物的指導RNA可以按一定方式被修飾為進一步包括 以下元件,該等元件允許活化或抑制基因活性,特別是如在本文的其他地方描述的允許功能性放置基因效應子(例如基因活性的活化蛋白或抑制蛋白)的蛋白銜接子(例如適配體)。一個實例係摻入適配體,如在本文和在先前技術中所解釋的。藉由工程化包含失活的指導物的gRNA以摻入蛋白相互作用適配體(庫娜曼妮(Konermann)等人,“藉由CRISPR-Cas9複合物進行的基因組範圍內的轉錄活化(Genome-scale transcription activation by an engineered CRISPR-Cas9 complex)”,doi:10.1038/nature14136,藉由引用併入本文),可以組裝由多個不同的效應結構域組成的合成轉錄活化複合物。在天然轉錄活化過程之後可以將其模式化。例如,選擇性地結合效應子(例如活化蛋白或抑制蛋白;作為與活化蛋白或抑制蛋白的融合蛋白的二聚化的MS2噬菌體外殼蛋白)的適體、或自身結合效應子(例如活化蛋白或抑制蛋白)的蛋白質可以被附於失活的gRNA四核苷酸環和/或莖環2。在MS2的情況下,融合蛋白MS2-VP64結合至四核苷酸環和/或莖環2並且轉而介導例如Neurog2的轉錄上調。其他轉錄活化蛋白係例如VP64、P65、HSF1、以及MyoD1。藉由僅僅示例這個概念,PP7相互作用莖環對MS2莖環的替換可以用來募集抑制性元件。
因此,一個方面係本發明的gRNA,該gRNA包含失活的指導物,其中該gRNA進一步包括修飾,該等修飾提供基因活化或抑制,如本文所描述的。該失活的gRNA可以包含一種或多種適配體。該等適配體對於基因效應子、基因活化蛋白或基因抑制蛋白而言可以是特異性的。可替代地,該等適配體對於蛋白質而言可以是特異性的,該蛋白質 轉而對特異性基因效應子、基因活化蛋白或基因抑制蛋白而言是特異性的並且募集/結合特異性基因效應子、基因活化蛋白或基因抑制蛋白。如果存在多個活化蛋白或抑制蛋白募集位點,較佳的是該等位點對於活化蛋白或抑制蛋白而言是特異性的。如果存在多個活化蛋白或抑制蛋白結合位點,該等位點對於相同的活化蛋白或相同的抑制蛋白而言可以是特異性的。該等位點對於不同活化蛋白或不同抑制蛋白而言也可以是特異性的。基因效應子、基因活化蛋白、基因抑制蛋白可以按融合蛋白的形式存在。
在一實施方式中,如本文描述的失活的gRNA或如本文描述的Cas9 CRISPR-Cas複合物包括非天然存在的或工程化的組成物,該組成物包含兩種或更多種轉接蛋白,其中每種蛋白都與一個或多個功能性結構域相關聯並且其中該轉接蛋白結合至被插入該失活的gRNA的至少一個環中的一個或多個不同的RNA序列。
因此,一個方面提供了非天然存在的或工程化的組成物,該組成物包含指導RNA(gRNA),其包含能夠雜交到細胞中的感興趣的基因組座位中的靶序列上的失活的指導序列,其中該失活的指導序列係如本文所定義的;Cas9,其包含至少一個或多個核定位序列,其中該Cas9視情況包括至少一個突變,其中該失活的gRNA的至少一個環藉由插入結合至一種或多種轉接蛋白的一個或多個不同的RNA序列而被修飾,並且其中該轉接蛋白與一個或多個功能結構域相關聯;或者,其中該失活的gRNA被修飾成具有至少一個非編碼功能環,並且其中該組成物包含兩種或更多種轉接蛋白,其中每種蛋白都與一個或多個功能結構域相關聯。
在某些實施方式中,該轉接蛋白係包含功能結構域的融合蛋白,該融合蛋白在轉接蛋白與功能結構域之間視情況包含接頭,該接頭視情況包括GlySer接頭。
在某些實施方式中,該失活的gRNA的至少一個環未藉由插入結合至兩種或更多種轉接蛋白的一個或多個不同的RNA序列而被修飾。
在某些實施方式中,與轉接蛋白相關聯的這一個或多個功能結構域係轉錄活化結構域。
在某些實施方式中,與轉接蛋白相關聯的這一個或多個功能結構域係轉錄活化結構域,包括VP64、p65、MyoD1、HSF1、RTA或SET7/9。
在某些實施方式中,與轉接蛋白相關聯的這一個或多個功能結構域係轉錄阻抑結構域。
在某些實施方式中,該轉錄阻抑結構域係KRAB結構域。
在某些實施方式中,該轉錄阻抑物結構域係NuE結構域、NcoR結構域、SID結構域或SID4X結構域。
在某些實施方式中,與轉接蛋白相關聯的這一個或多個功能結構域中的至少一者具有一種或多種活性,包括修飾烷酶活性、去甲酶活性、轉錄活化活性、轉錄抑制活性、轉錄釋放因子活性、組蛋白修飾活性、DNA整合活性、RNA切割活性、DNA切割活性或核酸結合活性。
在某些實施方式中,該DNA切割活性係由於Fok1核酸酶。
在某些實施方式中,修飾該失活的gRNA,使得失活的gRNA結合轉接蛋白並且進一步結合至Cas9和靶標之後,功能結構域處於允許該功能結構域以其屬性化功能發揮作用的空間取向。
在某些實施方式中,該失活的gRNA的至少一個環係四元環和/或環2。在某些實施方式中,藉由插入一個或多個不同的RNA序列來修飾該失活的gRNA的四元環和環2。
在某些實施方式中,結合至一種或多種轉接蛋白的一個或多個不同的RNA序列的插入物係適配體序列。在某些實施方式中,該適配體序列係對同一轉接蛋白具有特異性的兩個或更多個適配體序列。在某些實施方式中,該適配體序列係對不同轉接蛋白具有特異性的兩個或更多個適配體序列。
在某些實施方式中,該轉接蛋白包括MS2、PP7、Qβ、F2、GA、fr、JP501、M12、R17、BZ13、JP34、JP500、KU1、M11、MX1、TW18、VK、SP、FI、ID2、NL95、TW19、AP205、ΦCb5、ΦCb8r、ΦCb12r、ΦCb23r、7s、PRR1。
在某些實施方式中,該細胞係真核細胞。在某些實施方式中,該真核細胞係哺乳動物細胞,視情況是小鼠細胞。在某些實施方式中,該哺乳動物細胞係人類細胞。
在某些實施方式中,第一轉接蛋白與p65結構域相關聯並且第二轉接蛋白與HSF1結構域相關聯。
在某些實施方式中,該組成物包含Cas9 CRISPR-Cas複合 物,該複合物具有至少三個功能結構域,其中的至少一個與Cas9相關聯並且其中的至少兩個與失活的gRNA相關聯。
在某些實施方式中,該組成物進一步包含第二gRNA,其中該第二gRNA係能夠雜交到第二靶序列上的活gRNA,這樣使得第二Cas9 CRISPR-Cas系統被引導至細胞中的第二感興趣的基因組座位,其中在該第二基因組座位處的由該系統的Cas9酶的核酸酶活性得到的indel活性係可檢測的。
在某些實施方式中,該組成物進一步包含多種失活的gRNA和/或多種活gRNA。
本發明的一個方面係利用gRNA支架的模組性和可定制性來建立一系列具有不同結合位點(特別是適配體)的用於以正交方式募集不同類型的效應子的gRNA支架。再次,出於示例和說明較為寬泛的概念的原因,PP7相互作用莖環對MS2莖環的替換可以用來結合/募集抑制性元件,從而使得能夠進行多元雙向轉錄控制。因此,通常,包含失活的指導物的gRNA可以用於提供多元轉錄控制和較佳的雙向轉錄控制。這種轉錄控制最較佳的是係基因的。例如,包含一種或多種失活的指導物的一種或多種gRNA可以用於靶向一個或多個靶基因的活化。同時,包含一種或多種失活的指導物的一種或多種gRNA可以用於靶向一個或多個靶基因的抑制。這樣一種序列可以按多種不同的組合應用,例如該等靶基因首先被抑制,並且然後在適當的時間,其他靶標被活化,或者所選基因被抑制同時所選基因被活化,隨後進行進一步活化和/或抑制。其結果係,一種或多種生物系統的多種組分可以有利地被一起處理。
在一個方面,本發明提供了編碼如本文描述的失活的gRNA或Cas9 CRISPR-Cas複合物或組成物的一種或多種核酸分子。
在一個方面,本發明提供了載體系統,該載體系統包含:編碼如本文定義的失活的指導RNA的核酸分子。在某些實施方式中,該載體系統進一步包含編碼Cas9的一種或多種核酸分子。在某些實施方式中,該載體系統進一步包含編碼(活)gRNA的一種或多種核酸分子。在某些實施方式中,該核酸分子或該載體進一步包含在真核細胞中可操作的一種或多種調節元件,該等調節元件可操作地連接至編碼該指導序列(gRNA)的核酸分子和/或編碼Cas9的核酸分子和/或一個或多個視情況核定位序列。
在另一個方面,結構分析還可以用於研究失活的指導物與使得能夠進行DNA結合、但是不能進行DNA切割的活性Cas9核酸酶之間的相互作用。以此方式,確定對於Cas9的核酸酶活性而言重要的胺基酸。此類胺基酸的修飾允許用於基因編輯的改進的Cas9酶。
一個另外的方面係將如本文解釋的失活的指導物的使用與如本文解釋的並且本領域已知的CRISPR的其他應用組合。例如,包含一種或多種失活的指導物的用於靶向的多元基因活化或抑制或靶向的多元雙向基因活化/抑制的gRNA可以與包含維持核酸酶活性的指導物的gRNA組合,如本文所解釋的。包含維持核酸酶活性的指導物的這樣的gRNA可以或可以不進一步包括允許抑制基因活性的修飾(例如適配體)。包含維持核酸酶活性的指導物的這樣的gRNA可以或可以不進一步包括允許活化基因活性的修飾(例如適配體)。以這樣一種方式,介紹了 另一種多元基因控制手段(例如可以與具有核酸酶活性的基因靶向的抑制同時地或組合地提供沒有核酸酶活性/沒有indel活性的多元基因靶向的活化)。
例如,1)使用一種或多種gRNA(例如,1-50、1-40、1-30、1-20種,較佳的是1-10種,更較佳的是1-5種),其包含一種或多種失活的指導物、被靶向一個或多個基因並且用適當的適配體進一步修飾用於募集基因活化蛋白;2)可以與一種或多種gRNA(例如,1-50、1-40、1-30、1-20種,較佳的是1-10種,更較佳的是1-5種)組合,該等gRNA包含一種或多種失活的指導物、被靶向一個或多個基因並且用適當的適配體進一步修飾用於募集基因抑制蛋白。1)和/或2)然後可以與3)被靶向一個或多個基因的一種或多種gRNA(例如,1-50、1-40、1-30、1-20種,較佳的是1-10種,更較佳的是1-5種)組合。然後可以用1)+2)+3)與4)一種或多種gRNA(例如,1-50、1-40、1-30、1-20種,較佳的是1-10種,更較佳的是1-5種)按次序進行這種組合,該等gRNA被靶向一個或多個基因並且用適當的適配體進一步修飾用於募集基因活化蛋白。然後可以用1)+2)+3)+4)與5)一種或多種gRNA(例如,1-50、1-40、1-30、1-20種,較佳的是1-10種,更較佳的是1-5種)按次序進行這種組合,該等gRNA被靶向一個或多個基因並且用適當的適配體進一步修飾用於募集基因抑制蛋白。其結果係,多種用途和組合被包括在本發明之中。例如,組合1)+2);組合1)+3);組合2)+3);組合1)+2)+3);組合1)+2)+3)+4);組合1)+3)+4);組合2)+3)+4);組合1)+2)+4);組合1)+2)+3)+4)+5);組合1)+3)+4)+5);組合2)+3) +4)+5);組合1)+2)+4)+5);組合1)+2)+3)+5);組合1)+3)+5);組合2)+3)+5);組合1)+2)+5)。
在一方面,本發明提供了用於設計、評價或選擇失活的指導RNA靶向序列(失活的指導序列)之演算法,該序列用於將Cas9 CRISPR-Cas系統引導至靶基因座位。具體而言,已經確定失活的指導RNA特異性與i)GC含量和ii)靶向序列長度有關並且可以藉由改變i)GC含量和ii)靶向序列長度進行優化。在一方面,本發明提供了用於設計或評價失活的指導RNA靶向序列的演算法,該序列使該失活的指導RNA的脫靶結合或相互作用最小化。在本發明的一實施方式中,用於選擇將CRISPR系統引導至生物體內的基因座位的失活的指導RNA靶向序列的演算法包括a)在該基因座位中定位一個或多個CRISPR模體,分析每個CRISPR模體下游的20nt序列,藉由i)確定該序列的GC含量;並且ii)確定在該生物的基因組中是否存在離該CRISPR模體最近的15個下游核苷酸的脫靶匹配,並且c)如果該序列的GC含量係70%或更低並且沒有鑒定到脫靶匹配,則選擇該15核苷酸序列用於在失活的指導RNA中使用。在一個實施方式中,如果GC含量係60%或更低,則該序列被選擇為靶向序列。在某些實施方式中,如果GC含量係55%或更低、50%或更低、45%或更低、40%或更低、35%或更低或30%或更低,則該序列被選擇為靶向序列。在一個實施方式中,對該基因座位的兩個或更多個序列加以分析,並且選擇具有最低GC含量、或次最低GC含量、或次最低GC含量的序列。在一個實施方式中,如果在該生物的基因組中沒有鑒定到脫靶匹配,則該序列被選擇為靶向序列。在一實施方式中,如果在基因組的調節序列 中沒有鑒定到脫靶匹配,則選擇該靶向序列。
在一方面,本發明提供了選擇用於將功能化的CRISPR系統引導至生物體內的基因座位的失活的指導RNA靶向序列之方法,該方法包括:a)在該基因座位中定位一個或多個CRISPR模體;b)分析每個CRISPR模體下游的20nt序列,藉由:i)確定該序列的GC含量;並且ii)確定在該生物的基因組中是否存在該序列的前15nt的脫靶匹配;c)如果該序列的GC含量係70%或更低並且沒有鑒定到脫靶匹配,則選擇該序列用於在指導RNA中使用。在一實施方式中,如果GC含量係50%或更低,則選擇該序列。在一實施方式中,如果GC含量係40%或更低,則選擇該序列。在一實施方式中,如果GC含量係30%或更低,則選擇該序列。在一實施方式中,對兩個或更多個序列加以分析,並且選擇具有最低GC含量的序列。在一實施方式中,在該生物的調節序列中確定脫靶匹配。在一個實施方式中,該基因座位係調節區。一方面提供了失活的指導RNA,其包含根據上述方法所選擇的靶向序列。
在一方面,本發明提供了用於將功能化的CRISPR系統靶向生物體內的基因座位的失活的指導RNA。在本發明的一實施方式中,該失活的指導RNA包含靶向序列,其中該靶序列的CG含量係70%或更低,並且該靶向序列的前15nt與該生物體內的另一個基因座位的調節序列中的CRISPR模體下游的脫靶序列不匹配。在某些實施方式中,該靶向序列的GC含量係60%或更低、55%或更低、50%或更低、45%或更低、40%或更低、35%或更低或30%或更低。在某些實施方式中,該靶向序列的GC含量係從70%至60%或從60%至50%或從50%至40%或從40%至30%。 在一個實施方式中,該靶向序列在該座位的潛在靶向序列之中具有最低的CG含量。
在本發明的一實施方式中,該失活的指導物的前15nt與該靶序列匹配。在另一個實施方式中,該失活的指導物的前14nt與該靶序列匹配。在另一個實施方式中,該失活的指導物的前13nt與該靶序列匹配。在另一個實施方式中,該失活的指導物的前12nt與該靶序列匹配。在另一個實施方式中,該失活的指導物的前11nt與該靶序列匹配。在另一個實施方式中,該失活的指導物的前10nt與該靶序列匹配。在本發明的一個實施方式中,該失活的指導物的前15nt與另一個基因座位的調節區中的CRISPR模體下游的脫靶序列不匹配。在其他實施方式中,該失活的指導物的前14nt或前13nt、或該指導物的前12nt、或該失活的指導物的前11nt、或該失活的指導物的前10nt與另一個基因座位的調節區中的CRISPR模體下游的脫靶序列不匹配。在其他實施方式中,該失活的指導物的前15nt、或14nt、或13nt、或12nt、或11nt與該基因組中的CRISPR模體下游的脫靶序列不匹配。
在某些實施方式中,該失活的指導RNA在3'-端包括與靶序列不匹配的另外的核苷酸。因此,包括CRISPR模體下游的前15nt、或14nt、或13nt、或12nt、或11nt的失活的指導RNA在3'端的長度可以延長至12nt、13nt、14nt、15nt、16nt、17nt、18nt、19nt、20nt、或更長。
本發明提供了用於將Cas9 CRISPR-Cas系統(包括但不限於失活Cas9(dCas9)或功能化的Cas9系統(其可以包含功能化的Cas9或功能化的指導))引導至基因座位之方法。在一方面,本發明提供了用於 選擇失活的指導RNA靶向序列並且將功能化的CRISPR系統引導至生物體內的基因座位之方法。在一方面,本發明提供了用於選擇失活的指導RNA靶向序列並且藉由功能化的Cas9 CRISPR-Cas系統實現靶基因座位的基因調節之方法。在某些實施方式中,該方法用於實現靶基因調節同時最小化脫靶效應。在一方面,本發明提供了用於選擇兩個或更多個失活的指導RNA靶向序列並且藉由功能化的Cas9 CRISPR-Cas系統實現兩個或更多個靶基因座位的基因調節之方法。在某些實施方式中,該方法用於實現兩個或更多個靶基因座位的調節同時最小化脫靶效應。
在一方面,本發明提供了選擇用於將功能化的Cas9引導至生物體內的基因座位的失活的指導RNA靶向序列之方法,該方法包括:a)在該基因座位中定位一個或多個CRISPR模體;b)分析每個CRISPR模體下游的序列,藉由:i)選擇鄰近於該CRISPR模體的10至15nt,ii)確定該序列的GC含量;並且c)如果該序列的GC含量係40%或更高,則選擇該10至15nt序列作為用於在指導RNA中使用的靶向序列。在一實施方式中,如果GC含量係50%或更高,則選擇該序列。在一實施方式中,如果GC含量係60%或更高,則選擇該序列。在一實施方式中,如果GC含量係70%或更高,則選擇該序列。在一實施方式中,對兩個或更多個序列加以分析,並且選擇具有最高GC含量的序列。在一實施方式中,該方法進一步包括向該序列的3'端添加核苷酸,該等核苷酸與該CRISPR模體下游的序列不匹配。一方面提供了失活的指導RNA,其包含根據上述方法所選擇的靶向序列。
在一方面,本發明提供了用於將功能化的CRISPR系統引 導至生物體內的基因座位的失活的指導RNA,其中該失活的指導RNA的靶向序列由鄰近於該基因座位的CRISPR模體的10至15個核苷酸組成,其中該靶序列的CG含量係50%或更高。在某些實施方式中,該失活的指導RNA進一步包含添加至該靶向序列的3'端的核苷酸,該等核苷酸與該基因座位的CRISPR模體下游的序列不匹配。
在一方面,本發明提供了有待被引導至一個或多個、或兩個或更多個基因座位的單個效應子。在某些實施方式中,該效應子與Cas9相關聯,並且一種或多種、或兩種或更多種失活的指導RNA被用來將Cas9相關效應子引導至一個或多個、或兩個或更多個所選的靶基因座位。在某些實施方式中,該效應子與一種或多種、或兩種或更多種所選的失活的指導RNA相關聯,當與Cas9酶複合時,每種所選的失活的指導RNA都導致其相關聯的效應子定位至該失活的指導RNA靶標。這樣的CRISPR系統的一個非限制性實例調節一個或多個、或兩個或更多個易受同一轉錄調節因子調節的基因座位的活性。
在一方面,本發明提供了有待被引導至一個或多個基因座位的兩種或更多種效應子。在某些實施方式中,採用兩種或更多種失活的指導RNA,這兩種或更多種效應子中的每者都與所選的失活的指導RNA相關聯,其中這兩種或更多種效應子中的每者都被定位至其失活的指導RNA的所選靶標。這樣的CRISPR系統的一個非限制性實例調節一個或多個、或兩個或更多個易受不同轉錄調節因子調節的基因座位的活性。因此,在一個非限制性實施方式中,兩種或更多種轉錄因子被定位至單個基因的不同調節序列。在另一個非限制性實施方式中,兩種或更 多種轉錄因子被定位至不同基因的不同調節序列。在某些實施方式中,一種轉錄因子係活化蛋白。在某些實施方式中,一種轉錄因子係抑制蛋白。在某些實施方式中,一種轉錄因子係活化蛋白並且另一種轉錄因子係抑制蛋白。在某些實施方式中,調節表現同一調節途徑的不同組分的基因座位。在某些實施方式中,調節表現不同調節途徑的組分的基因座位。
在一個方面,本發明還提供了用於設計和選擇失活的指導RNA的方法和演算法,該等指導RNA對由活性Cas9 CRISPR-Cas系統介導的靶DNA切割或靶標結合和基因調節具有特異性。在某些實施方式中,該Cas9 CRISPR-Cas系統使用活性Cas9提供了正交基因控制,該活性Cas9在一個基因座位處切割靶DNA同時結合至另一基因座位並且促進其調節。
在一個方面,本發明提供了選擇用於在不進行切割的情況下將功能化的Cas9引導至生物體內的基因座位的失活的指導RNA靶向序列之方法,該方法包括:a)在該基因座位中定位一個或多個CRISPR模體;b)分析每個CRISPR模體下游的序列,藉由i)選擇鄰近於該CRISPR模體的10至15nt,ii)確定該序列的GC含量;並且c)如果該序列的GC含量係30%或更高、40%或更高,則選擇該10至15nt序列作為用於在失活的指導RNA中使用的靶向序列。在某些實施方式中,該靶向序列的GC含量係35%或更高、40%或更高、45%或更高、50%或更高、55%或更高、60%或更高、65%或更高、或70%或更高。在某些實施方式中,該靶向序列的GC含量係從30%至40%或從40%至50%或從50%至60%或從60%至 70%。在本發明的一實施方式中,對基因座位中的兩個或更多個序列加以分析,並且選擇具有最高GC含量的序列。
在本發明的一實施方式中,評價了其GC含量的該靶向序列的部分係離PAM最近的15個靶核苷酸中的10至15個連續核苷酸。在本發明的一實施方式中,評價了其GC含量的該指導物的部分係離PAM最近的15個核苷酸中的10至11個核苷酸或11至12個核苷酸或12至13個核苷酸或13、或14、或15個連續核苷酸。
在一方面,本發明進一步提供了用於鑒定失活的指導RNA之演算法,該等指導RNA促進CRISPR系統基因座位切割同時避免功能活化或抑制。觀察到16至20個核苷酸的失活的指導RNA中的增加的GC含量與增加的DNA切割和減少的功能活化相一致。
本文還證實到,可以藉由向指導RNA的3'端增加核苷酸來增加功能化的Cas9的效率,該等核苷酸與CRISPR模體下游的靶序列不匹配。例如,關於在長度上為11至15nt的失活的指導RNA,較短的指導物可能不太可能促進靶標切割,但是在促進CRISPR系統結合和功能控制方面的效率也是較低的。在某些實施方式中,向失活的指導RNA的3'端添加與靶序列不匹配的核苷酸提高活化效率而不增加不希望的靶標切割。在一方面,本發明還提供了用於鑒定改進的失活的指導RNA的方法和演算法,該等指導RNA有效地促進DNA結合和基因調節中的CRISPRP系統功能而不促進DNA切割。因此,在某些實施方式中,本發明提供了包括CRISPR模體下游的前15nt、或14nt、或13nt、或12nt、或11nt並且藉由與靶標錯配的核苷酸將3'端的長度延長至12nt、13nt、14nt、15nt、16nt、 17nt、18nt、19nt、20nt、或更長的失活的指導RNA。
在一方面,本發明提供了用於實現選擇性正交基因控制之方法。如將從本文的揭露所理解的,根據本發明的失活的指導物選擇(考慮了指導長度和GC含量)提供了由功能性Cas9 CRISPR-Cas系統進行的有效的且具選擇性的轉錄控制,例如藉由活化或抑制來調節基因座位的轉錄並且使脫靶效應最小化。因此,藉由提供單獨靶座位的有效調節,本發明還提供了兩個或更多個靶座位的有效正交調節。
在某些實施方式中,正交基因控制係藉由活化或抑制兩個或更多個靶座位。在某些實施方式中,正交基因控制係藉由活化或抑制一個或多個靶座位並且切割一個或多個靶座位。
在一個方面,本發明提供了包含非天然存在的Cas9 CRISPR-Cas系統的細胞,該系統包含所揭露的或根據本文描述的方法或演算法製備的一種或多種失活的指導RNA,其中一種或多種基因產物的表現已經被改變。在本發明的一個實施方式中,兩種或更多種基因產物在該細胞中的表現已發生改變。本發明還提供了來自這樣一種細胞的細胞系。
在一個方面,本發明提供了包含一種或多種細胞的多細胞生物,這一種或多種細胞包含非天然存在的Cas9 CRISPR-Cas系統,該系統包含所揭露的或根據本文描述的方法或演算法製備的一種或多種失活的指導RNA。在一個方面,本發明提供了來自包含非天然存在的Cas9 CRISPR-Cas系統的細胞、細胞系、或多細胞生物的產品,該系統包含所揭露的或根據本文描述的方法或演算法製備的一種或多種失活的指導 RNA。
本發明的一個另外的方面係使用包含如本文描述的一種或多種失活的指導物的gRNA,視情況與包含如本文描述的或先前技術中的一種或多種指導物的gRNA組合,與被工程化用於過表現Cas9或較佳的是敲入Cas9中的系統(例如細胞、轉基因動物、轉基因小鼠、誘導型轉基因動物,誘導型轉基因小鼠)組合。其結果係,單系統(例如轉基因動物、細胞)可以作為系統/網路生物學中的多元基因修飾的基礎。由於該等失活的指導物,現在這在體外、離體和在體內均係可能的。
例如,一旦提供了Cas9,則可以提供一種或多種失活的gRNA,以引導多元基因調節,並且較佳的是多元雙向基因調節。如果必要或希望的話,可以按在空間和時間上適當的方式提供這一種或多種失活的gRNA(例如Cas9表現的組織特異性誘導)。由於在感興趣的細胞、組織、動物中提供(例如表現)轉基因/誘導型Cas9,包含失活的指導物的gRNA或包含指導物的gRNA兩者係同樣有效的。同樣地,本發明的一個另外的方面係使用包含如本文描述的一種或多種失活的指導物的gRNA,視情況與包含如本文描述的或先前技術中的一種或多種指導物的gRNA組合,與被工程化用於敲除Cas9 CRISPR-Cas的系統(例如細胞、轉基因動物、轉基因小鼠、誘導型轉基因動物,誘導型轉基因小鼠)組合。
其結果係,如本文描述的失活的指導物與如本文描述的CRISPR應用和本領域已知的CRISPR應用的組合產生了高效且精確的系統(例如網路生物學)多元篩選工具。這樣的篩選允許例如鑒定基因活 性的特定組合,用於鑒定負責疾病(特別是基因相關疾病)的基因(例如開/關組合)。這樣的篩選的較佳的應用係癌症。同樣地,用於治療此類疾病的篩選被包括在本發明之中。細胞或動物可暴露於導致疾病或疾病樣效應的異常條件。可以提供候選組成物並且針對在所希望的多元環境中的效果對其進行篩選。例如,可以針對哪些基因組合將使得患者的癌細胞死亡對其進行篩選,並且然後使用這個資訊來建立適當的療法。
在一方面,本發明提供了套組(kit),該套組包括在此所述的組分中的一種或多種。該套組可以包括如本文描述的失活的指導物,與或不與如本文描述的指導物一起。
本文提供的結構資訊允許探詢失活的gRNA與靶DNA和Cas9的相互作用,從而允許工程化或改變失活的gRNA的結構,以便優化整個Cas9 CRISPR-Cas系統的功能性。例如,可以在不與Cas9蛋白衝突的情況下藉由插入可以結合至RNA的轉接蛋白來擴展失活的gRNA的環。該等轉接蛋白可以進一步募集效應蛋白或融合,該等效應蛋白或融合包括一個或多個功能結構域。
在一些較佳的實施方式中,該功能結構域係轉錄活化結構域,較佳的是VP64。在一些實施方式中,該功能結構域係轉錄抑制結構域,較佳的是KRAB。在一些實施方式中,該轉錄抑制結構域係SID、或SID的多聯體(例如SID4X)。在一些實施方式中,該功能結構域係表觀遺傳修飾結構域,從而提供了表觀遺傳修飾酶。在一些實施方式中,該功能結構域係活化結構域,其可以是P65活化結構域。
本發明的一方面係上述元件被包含在單個組成物中或被 包含在單獨的組成物中。該等組成物可以有利地被應用於宿主,以在基因組水平上引出功能效應。
一般而言,按以下方式修飾失活的gRNA,該方式為轉接蛋白提供了結合用的特異性結合位點(例如適配體),該等轉接蛋白包括一個或多個功能結構域(例如經由融合蛋白)。修飾經修飾的失活的gRNA,使得一旦該失活的gRNA形成CRISPR複合物(即結合至失活的gRNA和靶標的Cas9),則該等轉接蛋白結合,並且轉接蛋白上的功能結構域被定位為有利於屬性化功能有效的空間取向。例如,如果該功能結構域係轉錄活化蛋白(例如VP64或p65),則該轉錄活化蛋白被放置為允許它影響靶標轉錄的空間取向。同樣地,轉錄抑制蛋白將被有利地定位為影響靶標的轉錄,並且核酸酶(例如Fok1)將被有利地定位為切割或部分裂解該靶標。
熟習該項技術者應理解,對失活的gRNA的允許銜接子+功能結構域的結合但不允許銜接子+功能結構域的正確定位(例如由於CRISPR複合物的三維結構內的位阻)的修飾係並非預期的修飾。可以在如本文描述的四元環、莖環1、莖環2、或莖環3處,較佳的是在四元環或莖環2處,並且最較佳的是在四元環和莖環2兩者處對這一種或多種經修飾的失活的gRNA進行修飾。
如本文所解釋的,該等功能結構域可以是例如來自下組的一個或多個結構域,該組由以下各項組成:修飾烷酶活性、去甲酶活性、轉錄活化活性、轉錄抑制活性、轉錄釋放因子活性、組蛋白修飾活性、RNA切割活性、DNA切割活性、核酸結合活性、以及分子開關(例如光 誘導型)。在一些情況下,有利的是另外提供至少一個NLS。在一些情況下,有利的是將該NLS定位在N末端。當包括超過一個功能結構域時,該等功能結構域可以是相同的或不同的。
該失活的gRNA可以被設計成包括多個對相同或不同轉接蛋白具有特異性的結合識別位點(例如適配體)。該失活的gRNA可以被設計成結合至轉錄起始位點(即TSS)上游的啟動區-1000-+1個核酸,較佳的是-200個核酸。這種定位改進了影響基因活化(例如轉錄活化蛋白)或基因抑制(例如轉錄抑制蛋白)的功能結構域。該經修飾的失活的gRNA可以是被靶向一個或多個靶座位、包含在組成物中的一種或多種修飾的失活的gRNA(例如至少1種gRNA、至少2種gRNA、至少5種gRNA、至少10種gRNA、至少20種gRNA、至少30種gRNA、至少50種gRNA)。
該轉接蛋白可以是任何數目的蛋白質,其結合至被引入經修飾的失活的gRNA中的適配體或識別位點並且一旦該失活的gRNA已經被摻入CRISPR複合物中,則允許一個或多個功能結構域的正確定位,以便影響具有屬性化功能的靶標。如在本申請中所詳細解釋的,該等可以是外殼蛋白,較佳的是噬菌體外殼蛋白。與這樣的轉接蛋白(例如呈融合蛋白的形式)相關聯的功能結構域可以包括例如來自下組的一個或多個結構域,該組由以下各項組成:修飾烷酶活性、去甲酶活性、轉錄活化活性、轉錄抑制活性、轉錄釋放因子活性、組蛋白修飾活性、RNA切割活性、DNA切割活性、核酸結合活性、以及分子開關(例如光誘導型)。較佳的結構域係Fok1、VP64、P65、HSF1、MyoD1。在該功能結構域係轉錄活化蛋白或轉錄阻抑因子的情況下,有利的是另外提供至少一個 NLS並且較佳的是在N末端處。當包括超過一個功能結構域時,該等功能結構域可以是相同的或不同的。該轉接蛋白可以利用已知接頭來附接這樣的功能結構域。
因此,該經修飾的失活的gRNA、該(失活的)Cas9(具有或不具有功能結構域)、以及具有一個或多個功能結構域的結合蛋白可以各自獨立地被包含在組成物中並且被單獨地或共同地給予至宿主。可替代地,該等組分可以被提供在用於給予至宿主的單個組成物中。可以經由熟習該項技術者已知的或本文描述的用於遞送到宿主的病毒載體(例如慢病毒載體、腺病毒載體、AAV載體)進行向宿主的給予。如本文所解釋的,使用不同的選擇標記(例如用於慢病毒gRNA選擇)和gRNA濃度(例如取決於是否使用多種gRNA)對於引出改進的效果而言可以是有利的。
在這個概念的基礎上,若干變化適於引出基因組座位事件,包括DNA切割、基因活化、或基因失活。使用所提供的組成物,熟習該項技術者可以有利地且特異性地靶向具有相同或不同功能結構域的單個或多個座位,以引出一個或多個基因組座位事件。該等組成物可以按多種多樣的方法應用,用於在細胞中篩選文庫和在體內進行功能建模(例如lincRNA的基因活化和功能鑒定;功能獲得建模;功能缺失建模;使用本發明的組成物建立用於優化和篩選目的的細胞系和轉基因動物)。
本發明包括本發明的組成物用於建立和利用條件型或誘導型CRISPR轉基因細胞/動物之用途,這在本發明或本申請之前係不可信的。例如,該靶細胞條件性地或誘導性地包含Cas9(例如呈Cre依賴性構 建體的形式)和/或條件性地或誘導性地包含轉接蛋白,並且在表現被引入該靶細胞中的載體之後,該載體表現該Cas9和/或轉接蛋白,這在該靶細胞中誘導或產生Cas9表現和/或銜接子表現的條件。藉由應用本發明的傳授和組成物與產生CRISPR複合物的已知方法,受功能結構域影響的誘導型基因組事件也是本發明的一方面。一個實例係產生CRISPR敲入/條件型轉基因動物(例如包含例如Lox-Stop-polyA-Lox(LSL)盒的小鼠)並且隨後遞送一種或多種組成物,這一種或多種組成物提供如本文描述的一種或多種經修飾的失活的gRNA(例如感興趣的靶基因的TSS的-200個核苷酸,用於基因活化目的)(例如具有一種或多種由外殼蛋白例如MS2識別的適配體的經修飾的失活的gRNA)、一種或多種如本文描述的轉接蛋白(連接至一個或多個VP64的MS2結合蛋白)以及用於誘導條件型動物的工具(例如用於使得Cas9表現可誘導的Cre重組酶)。可替代地,該轉接蛋白可以被提供為具有條件型或誘導型Cas9的條件型或誘導型元件,以便提供用於篩選目的的有效模型,這有利地僅需要最少的設計和給予特異性失活的gRNA用於廣泛的應用。
在另一個方面,該等失活的指導物被進一步修飾為改進特異性。可以合成受保護的失活的指導物,由此將二級結構引入該失活的指導物的3'端,以改進其特異性。受保護的指導RNA(pgRNA)包含能夠雜交到細胞中的感興趣的基因組座位中的靶序列上的指導序列和保護性股,其中該保護性股視情況與該指導序列互補並且其中該指導序列可以與該保護性股係部分可雜交的。該pgRNA視情況包括延伸序列。pgRNA-靶DNA雜交的熱力學係由指導RNA與靶DNA之間的互補鹼基的 數目決定的。藉由採用‘熱力學保護’,可以藉由添加保護性序列來改進失活的gRNA的特異性。例如,一種方法向失活的gRNA內的指導序列的3'端添加不同長度的互補保護性股。其結果係,該保護性股被結合到該失活的gRNA的至少一部分並且提供受保護的gRNA(pgRNA)。進而,本文的失活的gRNA參考物可以使用所描述的實施方式容易地進行保護,從而產生pgRNA。該保護性股可以是單獨的RNA轉錄物或股或者連接到失活的gRNA指導序列的3'端的嵌合形式。
串聯指導物和在多元(串聯)靶向方法中之用途
諸位發明人已經表明如本文定義的CRISPR酶可以採用多於一種RNA指導物而不會失去活性。這使得能夠使用如本文定義的CRISPR酶、系統或複合物靶向多個DNA靶標、基因或基因座位,用如本文定義的單個酶、系統或複合物。該等指導RNA可以串聯地排列,視情況由核苷酸序列(如本文定義的同向重複)隔開。串聯的不同指導RNA的位置不影響活性。應注意,術語“CRISPR-Cas系統”、“CRISP-Cas複合物”、“CRISPR複合物”和“CRISPR系統”係可互換使用的。同樣地,術語“CRISPR酶”、“Cas酶”或“CRISPR-Cas酶”可以是可互換使用的。在較佳的實施方式中,所述CRISPR酶、CRISP-Cas酶或Cas酶係Cas9、或如在本文的其他地方描述的經修飾的或經突變的其變體中的任一種。
在一個方面,本發明提供了用於串聯或多元靶向的非天然存在的或工程化的CRISPR酶,較佳的是2類CRISPR酶,較佳的是如本文描述的V型或VI型CRISPR酶,如但不限於如在本文的其他地方描述的 Cas9。應理解的是,如在本文的其他地方描述的根據本發明的任何CRISPR(或CRISPR-Cas或Cas)酶、複合物、或系統都可以用於這樣一種方法中。如在本文的其他地方描述的任何方法、產品、組成物和用途都同樣適用於下文進一步詳述的多元或串聯靶向方法。藉由進一步指導的方式,提供了以下具體方面和實施方式。
在一個方面,本發明提供了如本文定義的Cas9酶、複合物或系統用於靶向多個基因座位的用途。在一個實施方式中,這可以藉由使用多個(串聯或多元)指導RNA(gRNA)序列建立。
在一個方面,本發明提供了使用如本文定義的Cas9酶、複合物或系統的一種或多種元件用於串聯或多元靶向之方法,其中所述CRISP系統包含多個指導RNA序列。較佳的是,所述gRNA序列由核苷酸序列(像如在本文的其他地方定義的同向重複)隔開。
如本文定義的Cas9酶、系統或複合物為修飾多個靶多核苷酸提供了有效工具。如本文定義的Cas9酶、系統或複合物具有多種多樣的實用性,包括修飾(例如,缺失、插入、轉位、失活、活化)多種細胞類型中的一個或多個靶多核苷酸。因此,如本文定義的本發明的Cas9酶、系統或複合物在例如基因治療、藥物篩選、疾病診斷、和預後中具有廣譜應用,包括靶向單個CRISPR系統內的多個基因座位。
在一個方面,本發明提供了如本文定義的Cas9酶、系統或複合物,即具有以下項的Cas9 CRISPR-Cas複合物:具有至少一個與其相關的去穩定結構域的Cas9蛋白、和靶向多個核酸分子(例如DNA分子)的多種指導RNA,由此所述多種指導RNA中每者都特異性地靶向其相應 的核酸分子(例如DNA分子)。每個核酸分子靶標(例如,DNA分子)都可以編碼基因產物或包括基因座位。因此使用多種指導RNA使得能夠靶向多個基因座位或多個基因。在一些實施方式中,該Cas9酶可以切割編碼該基因產物的DNA分子。在一些實施方式中,改變該基因產物的表現。該Cas9蛋白和該等指導RNA並不天然地一起存在。本發明包括包含串聯排列的指導序列的指導RNA。本發明進一步包括經密碼子優化以便在真核細胞中表現的Cas9蛋白的編碼序列。在一個較佳的實施方式中,該真核細胞係哺乳動物細胞、植物細胞或酵母細胞,並且在一更較佳的實施方式中,該哺乳動物細胞係人類細胞。該基因產物的表現可以被降低。該Cas9酶可以構成CRISPR系統或複合物的一部分,該系統或複合物進一步包含串聯排列的指導RNA(gRNA),該等指導RNA包含一連串的2、3、4、5、6、7、8、9、10、15、25、25、30個、或超過30個指導序列,每個指導序列都能夠特異性地雜交到細胞中的感興趣的基因組座位中的靶序列上。在一些實施方式中,該功能性Cas9 CRISPR系統或複合物結合至這多個靶序列。在一些實施方式中,該功能性CRISPR系統或複合物可以編輯這多個靶序列,例如該等靶序列可以包括基因組座位,並且在一些實施方式中,可以存在基因表現的改變。在一些實施方式中,該功能性CRISPR系統或複合物可以進一步包括功能結構域。在一些實施方式中,本發明提供了用於改變或修飾多種基因產物表現之方法。該方法可以包括引入含有所述靶核酸(例如,DNA分子)、或含有和表現靶核酸(例如,DNA分子)的細胞中;例如,該等靶核酸可以編碼基因產物或提供基因產物(例如,調節序列)的表現。
在較佳的實施方式中,用於多元靶向的CRISPR酶係Cas9,或者該CRISPR系統或複合物包含Cas9。在一些實施方式中,用於多元靶向的CRISPR酶係AsCas9,或者用於多元靶向的CRISPR系統或複合物包含AsCas9。在一些實施方式中,該CRISPR酶係LbCas9,或者該CRISPR系統或複合物包含LbCas9。在一些實施方式中,用於多元靶向的Cas9酶切割DNA的兩條股,以產生雙股斷裂(DSB)。在一些實施方式中,用於多元靶向的CRISPR酶係切口酶。在一些實施方式中,用於多元靶向的Cas9酶係雙切口酶。在一些實施方式中,用於多元靶向的Cas9酶係Cas9酶,像如在本文的其他地方定義的DD Cas9酶。
在實施方式中,該Cas9可以配對,例如作為一對切口酶,例如SaCas9切口酶(eSaCas9切口酶)。此外,該Cas9可以用一種或兩種或更多種指導物在AAV載體上進行包裝。這可以如在弗裡德蘭(Friedland)AE等人,金黃色葡萄球Cas9的表徵:用於一體化腺相關病毒遞送和配對切口酶應用的較小的Cas9(Characterization of Staphylococcus aureus Cas9:a smaller Cas9 for all-in-one adeno-associated virus delivery and paired nickase applications),基因組生物學(Genome Biol.)2015年11月24日;16:257.doi:10.1186/s13059-015-0817-8中描述的進行,將其揭露藉由引用而特此結合。
在一些普通實施方式中,用於多元靶向的Cas9酶與一個或多個功能結構域相關聯。在一些更具體的實施方式中,用於多元靶向的CRISPR酶係如在本文的其他地方定義的失活的Cas9。
在一方面,本發明提供了遞送用於在多靶向中使用的如本 文定義的Cas9酶、系統或複合物或者本文定義的多核苷酸的工具。此類遞送工具的非限制性實例係例如遞送該複合物的一種或多種組分的一種或多種粒子、包含本文討論的一種或多種多核苷酸的一種或多種載體(例如,編碼該CRISPR酶、提供編碼該CRISPR複合物的核苷酸)。在一些實施方式中,該載體可以是質粒或病毒載體(如AAV或慢病毒)。用質粒暫態轉染進例如HEK細胞中可以是有利的,尤其是考慮到AAV的尺寸限制,並且在將Cas9裝配進AAV中時用另外的指導RNA的情況下AAV可以達到上限。
還提供了模型,該模型組成性地表現用於在多元靶向中使用的如本文使用的Cas9酶、複合物或系統。該生物可以是轉基因的,並且可以已經用本發明載體轉染或者可以是這樣轉染的生物的後代。在一另外的方面,本發明提供了組成物,該等組成物包含如本文定義的CRISPR酶、系統和複合物或本文描述的多核苷酸或載體。還提供了包含多種指導RNA(較佳的是處於串聯排列形式)的Cas9 CRISPR系統或複合物。所述不同的指導RNA可以由核苷酸序列(如同向重複)隔開。
還提供了治療受試者(例如,對其有需要的受試者)之方法,該方法包括藉由用編碼該Cas9 CRISPR系統或複合物的多核苷酸或本文描述的任何多核苷酸或載體轉化該受試者而誘導基因編輯並且向該受試者給予它們。還可以提供適合的修復模板,例如藉由包含所述修復模板的載體遞送該修復模板。還提供了治療受試者(例如,對其有需要的受試者)之方法,該方法包括藉由用本文描述的多核苷酸或載體轉化該受試者而誘導多個靶基因座位的轉錄活化或抑制,其中所述多核苷酸或 載體編碼或包含該Cas9酶、複合物或系統,其包含較佳的是串聯排列的多種指導RNA。在任何處理離體地(例如在細胞培養物中)發生的情況下,則應當理解的是,術語‘受試者’可以由短語“細胞或細胞培養物”替換。
還提供了包含Cas9酶、複合物或系統(其包含較佳的是串聯排列的多種指導RNA)的組成物,或編碼或包含所述Cas9酶、複合物或系統(其包含較佳的是串聯排列的多種指導RNA)的多核苷酸或載體,用於在如在本文的其他地方定義的處理方法中使用。可以提供包括這樣的組成物的藥盒。還提供了所述組成物在用於這樣的治療方法的藥劑的製造中之用途。本發明還提供了Cas9 CRISPR系統在篩選(例如,功能獲得篩選)中之用途。人為地強行過表現基因的細胞能夠例如藉由負反饋回路隨時間下調該基因(重建平衡)。到篩選開始的時候,未經調節的基因可能再次被減少。使用誘導型Cas9活化蛋白允許正好在篩選之前誘導轉錄並且因此使假陰性命中的機會最小化。因此,藉由在篩選(例如,功能獲得篩選)中使用本發明,可以使假陰性結果的機會最小化。
在一個方面,本發明提供了工程化的、非天然存在的CRISPR系統,該系統包含Cas9蛋白和各自特異性地靶向在細胞中編碼基因產物的DNA分子的多種指導RNA,由此這多種指導RNA各自靶向編碼該基因產物的其特異性DNA分子,並且該Cas9蛋白切割編碼該基因產物的靶DNA分子,由此改變該基因產物的表現;並且,其中該CRISPR蛋白和該等指導RNA並不天然地一起存在。本發明包括包含多個指導序列的多種指導RNA,該等指導序列較佳的是由核苷酸序列(如同向重複)隔 開並且視情況融合至tracr序列。在本發明的一實施方式中,該CRISPR蛋白係V型或VI型CRISPR-Cas蛋白,並且在一更較佳的實施方式中,該CRISPR蛋白係Cas9蛋白。本發明進一步包括經密碼子優化以便在真核細胞中表現的Cas9蛋白。在一較佳的實施方式中,該真核細胞係哺乳動物細胞,並且在一更較佳的實施方式中,該哺乳動物細胞係人類細胞。在本發明的一另外的實施方式中,該基因產物的表現被降低。
在另一個方面,本發明提供了工程化的、非天然存在的載體系統,該載體系統包含一種或多種載體,這一種或多種載體包含第一調節元件和第二調節元件,該第一調節元件可操作地連接至多種Cas9 CRISPR系統指導RNA,該等指導RNA各自特異性地靶向編碼基因產物的DNA分子,該第二調節元件可操作地連接、編碼CRISPR蛋白。兩種調節元件可以位於該系統的相同載體上或位於不同載體上。這多種指導RNA靶向在細胞中編碼多種基因產物的多個DNA分子,並且該CRISPR蛋白可以切割編碼該等基因產物的多個DNA分子(它可以切割一條股或兩條股或者基本上沒有核酸酶活性),由此改變這多種基因產物的表現;並且,其中該CRISPR蛋白和這多種指導RNA並不天然地一起存在。在一較佳的實施方式中,該CRISPR蛋白係Cas9蛋白,視情況經密碼子優化以便在真核細胞中表現。在一較佳的實施方式中,該真核細胞係哺乳動物細胞、植物細胞或酵母細胞,並且在一更較佳的實施方式中,該哺乳動物細胞係人類細胞。在本發明的一另外的實施方式中,這多種基因產物各自的表現被改變,較佳的是被降低。
在一個方面,本發明提供了包含一種或多種載體的載體系 統。在一些實施方式中,該系統包含:(a)第一調節元件,該第一調節元件可操作地連接到同向重複序列和一個或多個插入位點,這一個或多個插入位點用於在該同向重複序列的上游或下游(以適用者為准)插入一個或多個指導序列,其中在表現時,這一個或多個指導序列引導該CRISPR複合物與真核細胞中的一個或多個靶序列的序列特異性結合,其中該CRISPR複合物包含Cas9酶,該酶與雜交到這一個或多個靶序列上的一個或多個指導序列複合;和(b)第二調節元件,該第二調節元件可操作地連接至編碼所述Cas9酶的酶編碼序列,該Cas9酶較佳的是包括至少一個核定位序列和/或至少一個NES;其中組分(a)和(b)位於該系統的相同或不同載體上。在適用的情況下,還可以提供tracr序列。在一些實施方式中,組分(a)進一步包括可操作地連接到該第一調節元件的兩個或更多個指導序列,其中當表現時,這兩個或更多個指導序列中的每者都引導Cas9 CRISPR複合物與真核細胞中的不同靶序列的序列特異性結合。在一些實施方式中,該CRISPR複合物包括一個或多個核定位序列和/或一個或多個NES,其具有足夠強度來在真核細胞的細胞核中或細胞核外驅動所述Cas9 CRISPR複合物以可檢測的量積聚。在一些實施方式中,該第一調節元件係聚合酶III啟動子。在一些實施方式中,該第二調節元件係聚合酶II啟動子。在一些實施方式中,該等指導序列中的每者在長度上是至少16、17、18、19、20、25個核苷酸,或16-30個之間、或16-25個之間、或16-20個之間的核苷酸。
重組表現載體可以包含處於適合於在宿主細胞中表現核酸的形式的編碼用於在多靶向中使用的如本文定義的Cas9酶、系統或複 合物的多核苷酸,這意味著該等重組表現載體包括基於待用於表現的宿主細胞而選擇的一種或多種調節元件,所述調節元件可操作地連接至待表現的核酸序列。在重組表現載體內,“可操作地連接”旨在表示感興趣的核苷酸序列以允許該核苷酸序列的表現的方式被連接至這一種或多種調節元件(例如,處於體外轉錄/翻譯系統中或當該載體被引入宿主細胞中時,處於該宿主細胞中)。
在一些實施方式中,用一種或多種載體暫態或非暫態轉染宿主細胞,這一種或多種載體包含編碼用於在多靶向中使用的如本文定義的Cas9酶、系統或複合物的多核苷酸。在一些實施方式中,當細胞天然地出現在受試者體內時將其轉染。在一些實施方式中,被轉染的細胞取自受試者。在一些實施方式中,該細胞來源於取自受試者的細胞,如細胞系。用於組織培養的多種多樣的細胞系在本領域係已知的並且在本文的其他地方示例。細胞系可獲得自熟習該項技術者已知的多種來源(參見例如,美國典型培養物保藏中心(American Type Culture Collection)(ATCC)(馬納薩斯(Manassus),維吉尼亞州))。在一些實施方式中,使用用一種或多種載體轉染的細胞建立包括一個或多個載體來源的序列的新細胞系,這一種或多種載體包含編碼用於在多靶向中使用的如本文定義的Cas9酶、系統或複合物的多核苷酸。在一些實施方式中,使用用如本文描述的用於在多靶向中使用的Cas9 CRISPR系統或複合物的組分轉染(如藉由用一種或多種載體進行暫態轉染、或用RNA進行轉染)並且藉由Cas9 CRISPR系統或複合物的活性修飾的細胞建立新細胞系,該新細胞系包含以下細胞,該等細胞含有修飾但是缺少任何其他外源序列。 在一些實施方式中,在評估一種或多種測試化合物中使用用一種或多種載體暫態或非暫態轉染的細胞,這一種或多種載體包含編碼用於在多靶向中使用的如本文定義的Cas9酶、系統或複合物的多核苷酸。
術語“調節元件”係如在本文的其他地方所定義的。
有利的載體包括慢病毒以及腺相關病毒,並且也可選擇此類型的載體以靶向具體類型的細胞。
在一個方面,本發明提供了真核宿主細胞,該真核宿主細胞包含(a)第一調節元件,該第一調節元件可操作地連接到同向重複序列和一個或多個插入位點,這一個或多個插入位點用於在該同向重複序列的上游或下游(以適用者為准)插入一個或多個指導RNA序列,其中在表現時,這一個或多個指導序列引導該Cas9 CRISPR複合物與真核細胞中的一個或多個對應靶序列的序列特異性結合,其中該Cas9 CRISPR複合物包含Cas9酶,該酶與雜交到這一個或多個對應靶序列上的一個或多個指導序列複合;和/或(b)第二調節元件,該第二調節元件可操作地連接至編碼所述Cas9酶的酶編碼序列,該Cas9酶較佳的是包括至少一個核定位序列和/或NES。在一些實施方式中,該宿主細胞包括組分(a)以及(b)。在適用的情況下,還可以提供tracr序列。在一些實施方式中,組分(a)、組分(b)、或組分(a)和(b)穩定地整合到該宿主真核細胞的基因組中。在一些實施方式中,組分(a)進一步包括可操作地連接到該第一調節元件並且視情況由同向重複隔開的兩個或更多個指導序列,其中當表現時,這兩個或更多個指導序列中的每者都引導Cas9 CRISPR複合物與真核細胞中的不同靶序列的序列特異性結合。在一些實施方式中,該Cas9 酶包括一個或多個核定位序列和/或核輸出序列或NES,其具有足夠強度來在真核細胞的細胞核中和/或細胞核外驅動所述CRISPR酶以可檢測的量積聚。
在一些實施方式中,該Cas9酶係V型或VI型CRISPR系統酶。在一些實施方式中,該Cas9酶係Cas9酶。在一些實施方式中,該Cas9酶衍生自土拉熱弗朗西絲菌1、土拉熱弗朗西絲菌新兇手亞種(Francisella tularensis subsp.novicida)、易北河普氏菌(Prevotella albensis)、毛螺菌科細菌MC2017 1、分解蛋白丁酸弧菌(Butyrivibrio proteoclasticus)、Peregrinibacteria細菌GW2011_GWA2_33_10、Parcubacteria細菌GW2011_GWC2_44_17、密斯氏菌屬(Smithella sp.)SCADC、胺基酸球菌屬BV3L6、毛螺菌科細菌MA2020、Candidatus Methanoplasma termitum、挑剔真桿菌(Eubacterium eligens)、牛莫拉氏菌(Moraxella bovoculi)237、稻田鉤端螺旋體(Leptospira inadai)、毛螺菌科細菌ND2006、狗口腔卟啉單胞菌(Porphyromonas crevioricanis)3、狄氏普氏菌(Prevotella disiens)、或獼猴卟啉單胞菌(Porphyromonas macacae)Cas9,並且可以進一步包括如在本文的其他地方定義的該Cas9的改變或突變,並且可以是嵌合Cas9。在一些實施方式中,該Cas9酶經密碼子優化以便在真核細胞中表現。在一些實施方式中,該CRISPR酶引導在該靶序列位置處的一條或兩條股的切割。在一些實施方式中,該第一調節元件係聚合酶III啟動子。在一些實施方式中,該第二調節元件係聚合酶II啟動子。在一些實施方式中,這一個或多個指導序列在長度上是(各自係)至少16、17、18、19、20、25個核苷酸,或16-30個之間、或16-25 個之間、或16-20個之間的核苷酸。當使用多種指導RNA時,它們較佳的是由同向重複序列隔開。在一個方面,本發明提供了非人類真核生物;較佳的是多細胞真核生物,包含根據所描述的實施方式中任一項的真核宿主細胞。在其他方面,本發明提供了真核生物;較佳的是多細胞真核生物,包含根據所描述的實施方式中任一項的真核宿主細胞。在該等方面的一些實施方式中,該生物可以是動物;例如哺乳動物。另外,該生物可以是節肢動物,如昆蟲。該生物也可以是植物。另外,該生物可以是真菌。
在一個方面,本發明提供了套組,該套組包括在此所述的組分中的一種或多種。在一些實施方式中,該套組包括載體系統以及用於使用該套組的說明書。在一些實施方式中,該載體系統包含(a)第一調節元件,該第一調節元件可操作地連接到同向重複序列和一個或多個插入位點,這一個或多個插入位點用於在該同向重複序列的上游或下游(以適用者為准)插入一個或多個指導序列,其中在表現時,該指導序列引導Cas9 CRISPR複合物與真核細胞中的靶序列的序列特異性結合,其中該Cas9 CRISPR複合物包含Cas9酶,該酶與雜交到該靶序列上的指導序列複合;和/或(b)第二調節元件,該第二調節元件可操作地連接至編碼所述Cas9酶的酶編碼序列,該Cas9酶包含核定位序列。在適用的情況下,還可以提供tracr序列。在一些實施方式中,該套組包括位於該系統的相同或不同載體上的組分(a)和(b)。在一些實施方式中,組分(a)進一步包括可操作地連接到該第一調節元件的兩個或更多個指導序列,其中當表現時,該兩個或更多個指導序列中的每個引導CRISPR複合物在真核 細胞中與不同靶序列的序列特異性結合。在一些實施方式中,該Cas9酶包括一個或多個核定位序列,其具有足夠強度來在真核細胞的細胞核中驅動所述CRISPR酶以可檢測的量積聚。在一些實施方式中,該CRISPR酶係V型或VI型CRISPR系統酶。在一些實施方式中,該CRISPR酶係Cas9酶。在一些實施方式中,該Cas9酶衍生自土拉熱弗朗西絲菌1、土拉熱弗朗西絲菌新兇手亞種、易北河普氏菌、毛螺菌科細菌MC2017 1、分解蛋白丁酸弧菌、Peregrinibacteria細菌GW2011_GWA2_33_10、Parcubacteria細菌GW2011_GWC2_44_17、密斯氏菌屬(Smithella sp.)SCADC、胺基酸球菌屬BV3L6、毛螺菌科細菌MA2020、Candidatus Methanoplasma termitum、挑剔真桿菌、牛莫拉氏菌237、稻田鉤端螺旋體、毛螺菌科細菌ND2006、狗口腔卟啉單胞菌3、狄氏普氏菌、或獼猴卟啉單胞菌Cas9(例如,被修飾成具有至少一個DD或與其相關聯),並且可以進一步包括該Cas9的改變或突變,並且可以是嵌合Cas9。在一些實施方式中,該DD-CRISPR酶經密碼子優化以便在真核細胞中表現。在一些實施方式中,該DD-CRISPR引導在該靶序列位置處的一條或兩條股的切割。在一些實施方式中,該DD-CRISPR酶缺少或基本上缺少DNA股切割活性(例如,與野生型酶或沒有降低核酸酶活性的突變或改變的酶相比,不超過5%核酸酶活性)。在一些實施方式中,該第一調節元件係聚合酶III啟動子。在一些實施方式中,該第二調節元件係聚合酶II啟動子。在一些實施方式中,該指導序列在長度上是至少16、17、18、19、20、25個核苷酸,或16-30個之間、或16-25個之間、或16-20個之間的核苷酸。
在一個方面,本發明提供了修飾宿主細胞(如真核細胞) 中的多個靶多核苷酸之方法。在一些實施方式中,該方法包括允許Cas9 CRISPR複合物結合到多個靶多核苷酸上,例如以實施所述多個靶多核苷酸的切割,由此修飾多個靶多核苷酸,其中該Cas9 CRISPR複合物包含Cas9酶,該酶與各自雜交到所述靶多核苷酸內的特定靶序列上的多個指導序列複合,其中所述多個指導序列連接到同向重複序列。在適用的情況下,還可以提供tracr序列(例如以提供單個指導RNA,sgRNA)。在一些實施方式中,所述切割包括藉由所述Cas9酶切割在每個靶序列位置處的一條或兩條股。在一些實施方式中,所述切割導致這多個靶基因的轉錄降低。在一些實施方式中,該方法進一步包括藉由與外源模板多核苷酸同源重組修復所述經切割的靶多核苷酸中的一者或多者,其中所述修復導致突變,包括所述靶多核苷酸中的一者或多者的一個或多個核苷酸的插入、缺失、或取代。在一些實施方式中,所述突變導致在從包含這一個或多個靶序列中的一者或多者的基因表現的蛋白質中的一個或多個胺基酸改變。在一些實施方式中,該方法進一步包括將一種或多種載體遞送到所述真核細胞,其中這一種或多種載體驅動下列一者或多者的表現:該Cas9酶和連接到同向重複序列的這多個指導RNA序列。在適用的情況下,還可以提供tracr序列。在一些實施方式中,所述載體被遞送到受試者內的真核細胞中。在一些實施方式中,所述修飾發生在細胞培養物中的所述真核細胞中。在一些實施方式中,該方法進一步包括在所述修飾之前從受試者中分離所述真核細胞。在一些實施方式中,該方法進一步包括使所述真核細胞和/或從中衍生的細胞返回到所述受試者中。
在一個方面,本發明提供了修飾多個多核苷酸在真核細胞 中的表現之方法。在一些實施方式中,該方法包括允許Cas9 CRISPR複合物結合到多個多核苷酸上,這樣使得所述結合導致所述多核苷酸的表現增加或降低;其中該Cas9 CRISPR複合物包含Cas9酶,該酶與各自特異性地雜交到所述多核苷酸內的其自身靶序列上的多個指導序列複合,其中所述指導序列連接到同向重複序列。在適用的情況下,還可以提供tracr序列。在一些實施方式中,該方法進一步包括將一種或多種載體遞送到所述真核細胞,其中這一種或多種載體驅動下列一者或多者的表現:該Cas9酶和連接到同向重複序列的這多個指導序列。在適用的情況下,還可以提供tracr序列。
在一個方面,本發明提供了重組多核苷酸,該重組多核苷酸包含同向重複序列上游或下游(以適用者為准)的多個指導RNA序列,其中當表現時該等指導序列中的每者都引導Cas9 CRISPRR複合物與存在於真核細胞中的其對應的靶序列的序列特異性結合。在一些實施方式中,該靶序列係存在於真核細胞中的病毒序列。在適用的情況下,還可以提供tracr序列。在一些實施方式中,該靶序列係原癌基因或癌基因。
本發明的方面包括非天然存在的或工程化的組成物,該組成物可以包含指導RNA(gRNA),該指導RNA包含能夠雜交到細胞中的感興趣的基因組座位中的靶序列上的指導序列,以及如本文定義的Cas9酶,該酶可以包括至少一個或多個核定位序列。
本發明的一方面包括藉由向細胞中引入本文描述的任何組成物來修飾感興趣的基因組座位以改變該細胞中的基因表現之方法。
本發明的一方面係上述元件被包含在單個組成物中或被 包含在單獨的組成物中。該等組成物可以有利地被應用於宿主,以在基因組水平上引出功能效應。
如本文使用的,術語“指導RNA”或“gRNA”具有如在本文的其他地方使用的含義,並且包括與靶核酸序列具有足夠互補性以與該靶核酸序列雜交並且引導靶向核酸的複合物與該靶核酸序列的序列特異性結合的任何多核苷酸序列。每種gRNA都可以被設計成包括多個對相同或不同轉接蛋白具有特異性的結合識別位點(例如,適配體)。每種gRNA都可以被設計成結合至轉錄起始位點(即TSS)上游的啟動區-1000-+1個核酸,較佳的是-200個核酸。這種定位改進了影響基因活化(例如,轉錄活化蛋白)或基因抑制(例如,轉錄抑制蛋白)的功能結構域。該經修飾的gRNA可以是被靶向一個或多個靶座位、包含在組成物中的一種或多種修飾的gRNA(例如,至少1種gRNA、至少2種gRNA、至少5種gRNA、至少10種gRNA、至少20種gRNA、至少30種gRNA、至少50種gRNA)。所述多個gRNA序列可以是串聯排列的並且較佳的是由同向重複隔開。
因此,如本文定義的gRNA、CRISPR酶可以各自獨立地被包含在組成物中並且被單獨地或共同地給予至宿主。可替代地,該等組分可以被提供在用於給予至宿主的單個組成物中。可以經由熟習該項技術者已知的或本文描述的用於遞送到宿主的病毒載體(例如,慢病毒載體、腺病毒載體、AAV載體)進行向宿主的給予。如本文所解釋的,使用不同的選擇標記(例如,用於慢病毒sgRNA選擇)和gRNA濃度(例如,取決於是否使用多種gRNA)對於引出改進的效果而言可以是有利 的。在這個概念的基礎上,若干變化適於引出基因組座位事件,包括DNA切割、基因活化、或基因失活。使用所提供的組成物,熟習該項技術者可以有利地且特異性地靶向具有相同或不同功能結構域的單個或多個座位,以引出一個或多個基因組座位事件。該等組成物可以按多種多樣的方法應用,用於在細胞中篩選文庫和在體內進行功能建模(例如,lincRNA的基因活化和功能鑒定;功能獲得建模;功能缺失建模;使用本發明的組成物建立用於優化和篩選目的的細胞系和轉基因動物)。
本發明包括本發明的組成物用於建立和利用條件型或誘導型CRISPR轉基因細胞/動物之用途;參見例如,普萊特(Platt)等人,《細胞》(Cell)(2014),159(2):440-455,或者本文引用的PCT專利出版物,如WO 2014/093622(PCT/US 2013/074667)。例如,細胞或動物(如非人類動物,例如脊椎動物或哺乳動物,如齧齒動物例如小鼠、大鼠,或其他實驗室或田間動物例如貓、狗、綿羊等)可以是‘敲入的’,由此類似於普萊特(Platt)等人,該動物條件性地或誘導性地表現Cas9。該靶細胞或動物因此條件性地或誘導性地包含CRISPR酶(例如,Cas9)(例如,呈Cre依賴性構建體的形式),在表現被引入該靶細胞中的載體之後,該載體表現該CRISPR酶(例如,Cas9),這在該靶細胞中誘導或產生該CRISPR酶(例如,Cas9)表現的條件。藉由應用如本文定義的傳授和組成物與產生CRISPR複合物的已知方法,誘導型基因組事件也是本發明的一個方面。這樣的誘導型事件的實例已經在本文的其他地方進行了描述。
在一些實施方式中,當靶向遺傳疾病時,尤其是在治療方法中,並且較佳的是在提供修復模板以校正或改變表型的情況下,表型 改變較佳的是基因組修飾的結果。
在一些實施方式中,可以被靶向的疾病包括與引起疾病的剪接缺陷有關的那些。
在一些實施方式中,細胞靶標包括造血幹細胞/祖細胞(CD34+);人類T細胞;以及眼(視網膜細胞)-例如光感受器先質細胞。
在一些實施方式中,基因靶標包括:人類β珠蛋白-HBB(用於治療鐮狀細胞貧血,包括藉由刺激基因轉換(使用密切相關的HBD基因作為內源模板));CD3(T細胞);以及CEP920-視網膜(眼)。
在一些實施方式中,疾病靶標還包括:癌症;鐮狀細胞貧血(基於點突變);HBV、HIV;β-地中海貧血;以及眼科或眼部疾病-例如引起萊伯(Leber)先天性黑朦(LCA)的剪接缺陷。
在一些實施方式中,遞送方法包括:酶-指導複合物(核糖核蛋白)的陽離子脂質介導的“直接”遞送和質粒DNA的電穿孔。
在此描述的方法、產物和用途可以用於非治療目的。此外,在此描述的方法中的任一項可以體外或離體應用。
在一方面,提供了非天然存在的或工程化的組成物,該組成物包含:
I.兩個或更多個CRISPR-Cas系統多核苷酸序列,其包含
(a)第一指導序列,該第一指導序列能夠雜交到多核苷酸座位中的第一靶序列上,
(b)第二指導序列,該第二指導序列能夠雜交到多核苷酸座位 中的第二靶序列上,
(c)同向重複序列,
以及
II. Cas9酶或編碼它的第二多核苷酸序列,
其中在轉錄時,該第一指導序列和該第二指導序列分別引導第一Cas9 CRISPR複合物和第二Cas9 CRISPR複合物與該第一靶序列和第二靶序列的序列特異性結合,
其中該第一CRISPR複合物包含與可雜交到該第一靶序列上的第一指導序列複合的Cas9酶,
其中該第二CRISPR複合物包含與可雜交到該第二靶序列上的第二指導序列複合的Cas9酶,並且
其中該第一指導序列引導鄰近該第一靶序列的DNA雙股體的一條股的切割,並且該第二指導序列引導鄰近該第二靶序列的另一條股的切割,從而誘導雙股斷裂,由此修飾該生物或該非人類或非動物生物。類似地,可以設想包含多於兩種指導RNA的組成物,例如該等指導RNA各自對一種靶標具有特異性,並且被串聯地排列在如本文描述的組成物或CRISPR系統或複合物中。
在另一個實施方式中,該Cas9作為蛋白質遞送到該細胞中。在另一個並且特別較佳的實施方式中,該Cas9作為蛋白質或作為編碼它的核苷酸序列遞送到該細胞中。作為蛋白質遞送至細胞可以包括核糖核蛋白(RNP)複合物的遞送,在該複合物中該蛋白質與這多種指導 物複合。
在一個方面,提供了藉由本發明的組成物、系統或經修飾的酶修飾的或包含本發明的組成物、系統或經修飾的酶的宿主細胞和細胞系,包括幹細胞及其子代。
在一個方面,提供了細胞治療方法,在該等方法中,例如對單個細胞或細胞群進行取樣或培養,其中該細胞或該等細胞如本文描述地進行離體修飾或已經如本文描述地進行離體修飾,並且然後被重新引入(取樣的細胞)或引入(培養的細胞)該生物體內。幹細胞(無論係胚胎幹細胞還是誘導型多能或全能幹細胞)在這一點上也是特別較佳的。但是,當然還設想了體內實施方式。
本發明方法可以進一步包括遞送模板,如修復模板,它們可以是dsODN或ssODN,參見下文。模板的遞送可以經由與任何或所有CRISPR酶或指導RNA的遞送同時的或分開的遞送並且經由相同或不同的遞送機制。在一些實施方式中,較佳的是一起遞送該模板與該等指導RNA,並且較佳的是還有該CRISPR酶。實例可以是AAV載體,其中該CRISPR酶係AsCas9或LbCas9。
本發明方法可以進一步包括:(a)向該細胞遞送雙股寡去氧核苷酸(dsODN),該雙股寡去氧核苷酸包含與藉由所述雙股斷裂產生的突出端互補的突出端,其中所述dsODN被整合進該感興趣的座位中;或-(b)向該細胞遞送單股寡去氧核苷酸(ssODN),其中所述ssODN充當所述雙股斷裂的同源定向修復的模板。本發明的方法可以用於預防或治療個體的疾病,視情況其中所述疾病係由所述感興趣座位中的缺陷引 起。本發明的方法可以是在該個體的體內進行或針對取自該個體的細胞離體地進行,視情況其中將所述細胞返回到該個體。
本發明還包括藉由使用如本文定義的用於在串聯或多靶向中使用的CRISPR酶或Cas酶或Cas9酶或CRISPR-CRISPR酶或CRISPR-Cas系統或CRISPR-Cas9系統獲得的產品。
根據本發明的、Cas9 CRISPR-Cas系統的受護航的指導物
在一個方面,本發明提供了受護航的Cas9 CRISPR-Cas系統或複合物,尤其是涉及受護航的Cas9 CRISPR-Cas系統指導物的這樣一種系統。所謂“受護航的”意指該Cas9 CRISPR-Cas系統或複合物或指導物被遞送到細胞內的所選時間和地點,這樣使得在空間上或在時間上控制該Cas9 CRISPR-Cas系統或複合物或指導物的活性。例如,可以藉由護航性RNA適配體序列控制該Cas9 CRISPR-Cas系統或複合物或指導物的活性和目的地,該護航性RNA適配體序列對適配體配位基(如,細胞表面蛋白或其他局部化細胞組分)具有結合親和力。可替代地,該護航性適配體可以例如響應於該細胞上或該細胞中的適配體效應子,如瞬態效應子,如在特定時間施加到該細胞的外部能源。
該等受護航的Cas9 CRISPR-Cas系統或複合物具有功能結構被設計成改進gRNA結構、架構、穩定性、遺傳表現、或其任何組合的gRNA。這樣一種結構可以包括適配體。
適配體係可以被設計或選擇為緊密地結合至其他配位基的生物分子,例如使用稱為指數富集配位基系統進化法(SELEX;蒂爾克(Tuerk)C、戈爾德(Gold)L:“指數富集配位基系統進化法:噬菌 體T4 DNA聚合酶的RNA配位基(Systematic evolution of ligands by exponential enrichment:RNA ligands to bacteriophage T4 DNA polymerase)”.《科學》(Science)1990,249:505-510)的技術。核酸適配體可以例如選自對範圍廣泛的生物醫學相關靶標具有高結合親和力和特異性的隨機序列寡核苷酸池,從而暗示了適配體的範圍廣泛的治療實用性(基夫,安東尼(Keefe,Anthony)D.、塞博利亞 帕伊(Supriya Pai)、和安德魯 艾靈頓(Andrew Ellington).“作為治療劑的適配體(Aptamers as therapeutics)”.《自然評論 藥物發現》(Nature Reviews Drug Discovery)9.7(2010):537-550)。該等特徵還暗示了適配體作為藥物遞送運載體的範圍廣泛的用途(列維-尼森鮑姆,艾加(Levy-Nissenbaum,Etgar)等人,“奈米技術與適配體:在藥物遞送中的應用(Nanotechnology and aptamers:applications in drug delivery)”.《生物技術趨勢》(Trends in biotechnology)26.8(2008):442-449;以及黑科(Hicke)BJ、史蒂芬斯(Stephens)AW.“護航性適配體:診斷和治療用的遞送服務(Escort aptamers:a delivery service for diagnosis and therapy)”.《臨床研究雜誌》(J Clin Invest)2000,106:923-928)。還可以藉由改變特性來構建充當響應於que的分子開關的適配體,如結合螢光團以模擬綠色螢光蛋白的活性的RNA適配體(佩奇,傑瑞米(Paige,Jeremy)S.、凱倫Y.吳(Karen Y.Wu)、和薩米R.賈弗裡(Samie R.Jaffrey).“綠色螢光蛋白的RNA模擬物(RNA mimics of green fluorescent protein)”.《科學》(Science)333.6042(2011):642-646)。還已經表明,適配體可以用作靶向的siRNA治療性遞送系統的組分,例如靶向細胞表面蛋白(周傑華(Zhou,Jiehua)和約翰J.羅西(John J.Rossi).“適配體靶向的細胞特異性RNA干擾 (Aptamer-targeted cell-specific RNA interference)”.《沈默》(Silence)1.1(2010):4)。
因此,本文提供了例如藉由一種或多種適配體修飾的gRNA,這一種或多種適配體被設計成改進gRNA遞送,包括跨細胞膜到胞內區室的遞送、或細胞核的遞送。除了這一種或多種適配體之外或沒有這樣的一種或多種適配體,這樣的一種結構可以包括一種或多種部分,以便使得該指導可遞送、可誘導或響應於所選效應子。本發明因此包括響應於正常或病理生理條件的gRNA,包括但不限於pH、低氧、O2濃度、溫度、蛋白質濃度、酶濃度、脂質結構、光暴露、機械破壞(例如超音波)、磁場、電場、或電磁輻射。
本發明的一個方面提供了非天然存在的或工程化的組成物,該組成物包含受護航的指導RNA(egRNA),該受護航的指導RNA包含:
RNA指導序列,該RNA指導序列能夠雜交到細胞中的感興趣的基因組座位中的靶序列上;以及,
護航性RNA適配體序列,其中該護航性適配體對該細胞上或該細胞中的適配體配位基具有結合親和力,或者該護航性適配體響應於該細胞上或該細胞中的局部化適配體效應子,其中該適配體配位基或效應子在該細胞上或該細胞中的存在在空間上或在時間上是受限的。
該護航性適配體可以例如響應於與該細胞中的適配體配位基或效應子的相互作用而改變構象。
該護航性適配體可以對該適配體配位基具有特異性結合親和力。
該適配體配位基可以位於該細胞中的位置或區室,例如在該細胞的細胞膜上或細胞膜中。該護航性適配體與該適配體配位基的結合可以因此將該egRNA引導至該細胞中的感興趣的位置,如藉由結合至作為細胞表面配位基的適配體配位基的方式而到該細胞的內部。以此方式,可以靶向該細胞內的多個空間上受限的位置,如細胞核或線粒體。
一旦已經引入預期的改變,如藉由在細胞基因組中編輯預期的基因拷貝,便不再需要在該細胞中繼續CRISPR/Cas9表現。的確,持續表現在非預期基因組位點處存在脫靶效應的某些酪蛋白情況下等係不希望的。因此,限時表現係有用的。誘導型表現提供了一種方法,但是此外申請人已經工程化自行失活性Cas9 CRISPR-Cas系統,該系統依賴於在該CRISPR載體本身內使用非編碼指導靶序列。因此,表現開始後,該CRISPR系統將導致其自身的破壞,但是在破壞完成之前,它將有時間編輯靶基因的基因組拷貝(在二倍體細胞中具有正常點突變的情況下,需要至多兩個編輯)。簡單地,該自行失活性Cas9 CRISPR-Cas系統包括另外的RNA(即,指導RNA),其靶向CRISPR酶自身的編碼序列或靶向與存在於下列一項或多項中的獨特序列互補的非編碼指導靶序列:(a)在驅動非編碼RNA元件的表現的啟動子內,(b)在驅動Cas9基因的表現的啟動子內,(c)在Cas9編碼序列中的100bp的ATG翻譯起始密碼子內,(d)在病毒遞送載體的反向末端重複(iTR)內(例如,在AAV基因組中)。
該egRNA可以包括RNA適配體連接序列,其可操作地將 護航RNA序列連接至RNA指導序列。
在實施方式中,該egRNA可以包括一個或多個光不穩定的鍵或非天然存在的殘基。
在一個方面,該護航性RNA適配體序列可以與靶miRNA互補,該靶miRNA可以或可以不存在於細胞內,這樣使得僅當存在該靶miRNA時,才存在該護航性RNA適配體序列與該靶miRNA的結合,這使得該egRNA被該細胞內的RNA誘導沈默複合體(RISC)切割。
在實施方式中,該護航性RNA適配體序列在長度上可以例如係從10至200個核苷酸,並且該egRNA可以包括多於一個護航性RNA適配體序列。
應理解的是,如在本文的其他地方描述的任何RNA指導序列都可以用在本文描述的egRNA中。在本發明的某些實施方式中,該指導RNA或成熟crRNA包括同向重複序列和指導序列或間隔子序列、基本上由其組成、或由其組成。在某些實施方式中,該指導RNA或成熟crRNA包括連接至指導序列或間隔子序列的同向重複序列、基本上由其組成、或由其組成。在某些實施方式中,該指導RNA或成熟crRNA包括19nt的部分同向重複,之後是23-25nt的指導序列或間隔子序列。在某些實施方式中,該效應蛋白係FnCas9效應蛋白並且需要至少16nt的指導序列來實現可檢測的DNA切割以及最少17nt的指導序列來實現有效的體外DNA切割。在某些實施方式中,該同向重複序列位於該指導序列或間隔子序列的上游(即,5')。在一較佳的實施方式中,該FnCas9指導RNA的種子序列(即,對於識別和/或雜交到靶座位處的序列而言必需、關鍵的 序列)大約在該指導序列或間隔子序列的5'端上的前5nt內。
該egRNA可以與Cas9一起被包括在非天然存在的或工程化的Cas9 CRISPR-Cas複合物組成物中,該Cas9可以包括至少一個突變,例如使得該Cas9具有不超過5%的沒有這至少一個突變的Cas9的核酸酶活性的突變,例如與沒有這至少一個突變的Cas9相比,具有減弱至少97%、或100%的核酸酶活性。該Cas9還可以包括一個或多個核定位序列。在本文的其他地方描述了具有經調節的活性(如減弱的核酸酶活性)的經突變的Cas9酶。
該工程化的Cas9 CRISPR-Cas組成物可以被提供在細胞(如真核細胞、哺乳動物細胞、或人類細胞)中。
在實施方式中,本文描述的組成物包含Cas9 CRISPR-Cas複合物,該複合物具有至少三個功能結構域,其中的至少一個與Cas9相關聯並且其中的至少兩個與egRNA相關聯。
本文描述的組成物可以用於將基因組座位事件引入宿主細胞(如真核細胞,特別是哺乳動物細胞)中、或非人類真核生物(特別是非人類哺乳動物,如小鼠)體內。該基因組座位事件可以包括影響座位中的基因活化、基因抑制、或切割。本文描述的組成物還可以用於修飾感興趣的基因組座位,以改變細胞中的基因表現。在本文的其他地方詳細描述了使用本文提供的Cas9酶在宿主細胞中引入基因組座位事件之方法。該組成物的遞送可以例如藉由以下方式:遞送編碼該組成物的一種或多種核酸分子,這一種或多種核酸分子操作性地連接到一個或多個調節序列,並且體內地表現這一種或多種核酸分子,例如藉由慢病毒、 腺病毒,或AAV的方式。
本發明提供了藉由其可以調整gRNA介導的基因編輯活性的組成物和方法。本發明提供了gRNA二級結構,該等結構藉由增加gRNA和/或增加遞送到該細胞中的RNA的量而改進切割效率。該gRNA可以包括光不穩定型或誘導型核苷酸。
為了增加gRNA(例如藉由病毒或非病毒技術遞送的gRNA)的有效性,申請人將二級結構添加進該gRNA中,該等結構增強其穩定性並且改進基因編輯。分開地,為了克服有效遞送的缺乏,申請人用細胞滲透RNA適配體修飾了gRNA;該等適配體結合至細胞表面受體並且促進該gRNA進入細胞中。值得注意地,該等細胞滲透適配體可以被設計成靶向特定細胞受體,以便介導細胞特異性遞送。申請人還已經創造了可誘導的指導物。
可以經由隱花色素-2和CIB1的活化和結合來實現誘導型系統的光反應性。藍光刺激在隱花色素-2中誘導活化性構象變化,從而導致募集其結合配偶體CIB1。這種結合係快速且可逆的,從而在脈衝刺激後<15sec內實現飽和並且在刺激結束後<15min內返回基線。該等快速結合動力學產生這樣一種系統,其僅暫時受轉錄/翻譯和轉錄物/蛋白質降解的速度的約束,而不受誘導劑的攝取和清除的約束。隱花色素(Crytochrome)-2活化也是高度敏感的,從而允許使用低的光強度刺激並且緩解光毒性的風險。另外,在如完整的哺乳動物腦的背景下,可以使用可變的光強度來控制刺激區域的尺寸,從而允許比單獨的載體遞送可以提供的大的精度。
本發明考慮了用於誘導該指導物的能源,如電磁輻射、聲能或熱能。有利地,電磁輻射係可見光的成分。在一較佳的實施方式中,光係波長為約450至約495nm的藍光。在一尤其較佳的實施方式中,波長係約488nm。在另一個較佳的實施方式中,光刺激係經由脈衝。光功率的範圍可以是從約0-9mW/cm2。在一較佳的實施方式中,低至0.25sec/15sec的刺激範例應該引起最大活化。
本發明的實踐中所涉及的細胞可以是原核細胞或真核細胞,有利地是動物細胞、植物細胞或酵母細胞,更有利地是哺乳動物細胞。
該化學或能量敏感型指導可以在藉由結合化學源或藉由允許它充當指導並且具有Cas9 CRISPR-Cas系統或複合物功能的能源誘導之後經歷構象變化。本發明可以涉及應用該化學源或能量,以便具有該指導功能和該Cas9 CRISPR-Cas系統或複合物功能;並且視情況進一步確定該基因組座位的表現被改變。
這種化學誘導型系統存在若干不同設計:1.可藉由脫落酸(ABA)誘導的基於ABI-PYL的系統(參見例如,http://stke.sciencemag.org/cgi/content/abstract/sigtrans;4/164/rs2),2.可藉由雷帕黴素(Rapamycin)(或基於雷帕黴素的相關化學品)誘導的基於FKBP-FRB的系統(參見例如,http://www.nature.com/nmeth/journal/v2/n6/full/nmeth763.html),3.可藉由赤黴素(GA)誘導的基於GID1-GAI的系統(參見例如,http://www.nature.com/nchembio/journal/v8/n5/full/nchembio.922.html)。
由本發明所考慮的另一種系統係基於亞細胞定位變化的化學誘導型系統。申請人還開發了這樣一種系統,在該系統中該多肽包括DNA結合結構域,該結構域包括至少五個或更多個轉錄活化蛋白樣效應子(TALE)單體,並且至少一半或多於一半的被特異性地要求對連接到至少一個或多個效應子結構域上的感興趣基因組座位進行靶向的單體被進一步連接到化學或能量敏感型蛋白。當化學或能量傳遞物與該化學或能量敏感型蛋白結合時,這種蛋白將導致整個多肽的亞細胞定位變化(即將整個多肽從細胞質運輸到細胞的細胞核)。整個多肽從一個亞細胞區室或細胞器(在其中由於缺乏效應子結構域的底物,其活性被封存)向另一個亞細胞區室或細胞器(在其中存在該底物)的這種運輸將允許整個多肽與其希望的底物(即哺乳動物細胞核中的基因組DNA)相接觸並且導致靶基因表現的活化或抑制。
當該效應子結構域係核酸酶時,這種類型的系統還可以用於誘導細胞中的感興趣的基因組座位的切割。
化學誘導型系統可以是可藉由4-羥基他莫昔芬(4OHT)誘導的基於雌激素受體(ER)的系統(參見例如,http://www.pnas.org/content/104/3/1027.abstract)。當結合4-羥基他莫昔芬時,稱為ERT2的雌激素受體的經突變的配位基結合結構域易位到細胞的細胞核中。在本發明的另外的實施方式中,任何核受體、甲狀腺激素受體、視黃酸受體、雌激素受體、雌激素相關受體、糖皮質激素受體、孕酮受體、雄激素受體的任何天然存在的或工程化的衍生物都可以用在與基於ER的誘導型系統類似的誘導型系統中。
另一種誘導型系統係基於使用可藉由能量、熱或無線電波誘導的基於暫態受體電勢(TRP)離子通道的系統的設計(參見例如,http://www.sciencemag.org/content/336/6081/604)。該等TRP家族蛋白響應於不同刺激,包括光和熱。當這種蛋白被光或熱活化時,該離子通道將打開並且允許離子如鈣進入質膜中。這種離子流入將結合至連接到多肽上的細胞內離子相互作用配偶體,該多肽包括該Cas9 CRISPR-Cas複合物或系統的指導和其他組分,並且該結合將誘導該多肽的亞細胞定位的變化,從而使得整個多肽進入細胞的細胞核。一旦在細胞核內,該Cas9 CRISPR-Cas複合物的指導蛋白和其他組分將是具活性的並且調節細胞中的靶基因表現。
這種類型的系統還可以用於誘導細胞中的感興趣的基因組座位的切割;並且在此方面,應指出的是該Cas9酶係核酸酶。光可以藉由雷射或其他形式的能源產生。熱可以藉由提高溫度來產生,溫度的提高係由能源造成的、或由在從以無線電波形式遞送的能源吸收能量之後釋放熱的奈米粒子造成的。
雖然光活化可以是一有利的實施方式,但是有時它可能是不利的,尤其是對於光可以不穿透皮膚或其他器官的體內應用而言。在這種情況下,考慮了能量活化的其他方法,特別是具有類似作用的電場能和/或超音波。
電場能較佳的是基本上如本領域所描述地給予,在體內條件下使用從約1伏特/cm至約10千伏特/cm的一個或多個電脈衝。代替脈衝或除脈衝之外,電場可以按連續方式遞送。電脈衝可以施加1μs與500毫 秒之間,較佳的是1μs與100毫秒之間。電場可以連續地或按脈衝方式施加約5分鐘。
如本文使用的,‘電場能’係細胞所暴露的電能。較佳的是,在體內條件下,電場具有從約1伏特/cm至約10千伏特/cm或更高的強度(參見WO 97/49450)。
如本文使用的,術語“電場”包括電容和電壓可變的一個或多個脈衝,並且包括指數波和/或方波和/或調製波和/或調製方波形式。對電場和電的提及應被視為包括在細胞環境中電勢差的存在的提及。這樣一種環境可以藉由靜電、交流電(AC)、直流電(DC)等的方式來建立,如本領域已知的。電場可以是均勻的、不均勻的或其他方式的,並且可以按時間依賴性方式在強度和/或方向上變化。
按任何順序並且按任何組合單次或多次施加電場、以及單次或多次施加超音波也是可能的。超音波和/或電場可以作為單次或多次連續施加、或作為脈衝(脈衝式遞送)進行遞送。
電穿孔已經用在體外和體內兩種程序中,以便向活細胞中引入外來材料。對於體外應用,將活細胞樣品首先與感興趣的試劑混合並且放置在電極(如平行板)之間。然後,該等電極向該細胞/植入物混合物施加電場。執行體外電穿孔的系統的實例包括Electro Cell Manipulator ECM600產品、和Electro Square Porator T820,兩者均由BTX Division of Genetronics公司製造(參見美國專利案號5,869,326)。
已知的電穿孔技術(體外和體內兩者)藉由向定位在處理區域周圍的電極施加短暫的高壓脈衝起作用。電極之間產生的電場導致 細胞膜暫時變為多孔的,此時感興趣試劑的分子進入細胞。在已知的電穿孔應用中,這個電場包括大約1000V/cm、大約約100.mu.s持續時間的單脈衝方波。這樣一個脈衝可以例如在Electro Square Porator T820的已知應用中產生。
較佳的是,在體外條件下,電場具有從約1V/cm至約10kV/cm的強度。因此,電場可以具有1V/cm、2V/cm、3V/cm、4V/cm、5V/cm、6V/cm、7V/cm、8V/cm、9V/cm、10V/cm、20V/cm、50V/cm、100V/cm、200V/cm、300V/cm、400V/cm、500V/cm、600V/cm、700V/cm、800V/cm、900V/cm、1kV/cm、2kV/cm、5kV/cm、10kV/cm、20kV/cm、50kV/cm或更高的強度。更較佳的是,在體外條件下從約0.5kV/cm至約4.0kV/cm。較佳的是,在體內條件下,電場具有從約1V/cm至約10kV/cm的強度。然而,在增加遞送到靶位點的脈衝數的情況下,可以降低電場強度。因此,設想了較低場強的電場的脈衝式遞送。
較佳的是,電場的施加係以多脈衝的形式,如強度和電容相同的雙脈衝或強度和/或電容變化的順序脈衝。如本文使用的,術語“脈衝”包括電容和電壓可變的一個或多個電脈衝,並且包括指數波和/或方波和/或調製波/方波形式。
較佳的是,電脈衝作為選自以下各項的波形進行遞送:指數波形、方波形、調製波形以及調製方波形。
一較佳的實施方式採用低電壓下的直流電。因此,申請人揭露了以1V/cm與20V/cm之間的場強使用施加至細胞、組織或組織塊的電場,持續100毫秒或更長,較佳的是15分鐘或更長的時間。
超音波有利地以從約0.05W/cm2至約100W/cm2的功率級給予。可以使用診斷超音波或治療超音波、或其組合。
如本文使用的,術語“超音波”係指由機械振動組成的能量形式,機械振動的頻率非常高,它們在人類聽覺範圍之上。超音波頻譜的下限頻率通常可以被認為是約20kHz。超音波的大多數診斷應用採用範圍1和15MHz的頻率(來自臨床診斷中的超音波學(Ultrasonics in Clinical Diagnosis),P.N.T.威爾斯(Wells)編輯,第2版,邱吉爾 利文斯頓出版社(Publ.Churchill Livingstone)[愛丁堡、倫敦 & 紐約,1977])。
超音波已經被用於診斷和治療應用兩者中。當被用作診斷工具(“診斷超音波”)時,典型地以高達約100mW/cm2(FDA推薦)的能量密度範圍使用超音波,但是已經使用了高達750mW/cm2的能量密度。在物理療法中,超音波典型地被以高達約3至4W/cm2的範圍(WHO推薦)用作能源。在其他治療應用中,可以採用更高的超音波強度,例如,100W/cm直到1kW/cm2(或甚至更高)、持續短時間內的HIFU。如在本說明書中使用的術語“超音波”旨在包括診斷超音波、治療超音波和聚焦超音波。
聚焦超音波(FUS)允許在沒有侵入性探針的情況下遞送熱能(參見摩洛克孜(Morocz)等人1998《磁共振成像雜誌》(Journal of Magnetic Resonance Imaging)第8卷,第1期,第136-142頁)。另一種形式的聚焦超音波係高強度聚焦超音波(HIFU),它由慕斯薩多(Moussatov)等人在《超音波學》(Ultrasonics)(1998)第36卷,第8期,第893-900頁以及德蘭胡華(TranHuuHue)等人在《聲學》(Acustica)(1997)第83卷, 第6期,第1103-1106頁進行了綜述。
較佳的是,採用診斷超音波和治療超音波的組合。這種組合並不旨在係限制性的,然而,並且本領域的讀者應當理解的是可以使用超音波的任何多種組合。此外,超音波的能量密度、頻率以及暴露時間可以變化。
較佳的是,對超音波能源的暴露係在從約0.05至約100Wcm-2的功率密度下。甚至更較佳的是,對超音波能源的暴露係在從約1至約15Wcm-2的功率密度下。
較佳的是,對超音波能源的暴露係在從約0.015至約10.0MHz的頻率下。更較佳的是,對超音波能源的暴露係在從約0.02至約5.0MHz或約6.0MHz的頻率下。最較佳的是,以3MHz的頻率施加超音波。
較佳的是,暴露持續從約10毫秒至約60分鐘的時間。較佳的是,暴露持續從約1秒至約5分鐘的時間。更較佳的是,施加超音波持續約2分鐘。然而,取決於有待破壞的具體靶細胞,暴露可以持續更長的持續時間,例如持續15分鐘。
有利地,靶組織被暴露於聲功率密度從約0.05Wcm-2至約10Wcm-2的、頻率範圍從約0.015至約10MHz的超音波能源(參見WO 98/52609)。然而,替代方案也是可能的,例如暴露於聲功率密度高於100Wcm-2的超音波能源,但是持續減少的時間段,例如1000Wcm-2持續毫秒範圍或更短的時間。
較佳的是,超音波的施加係以多脈衝的形式;因此,連續 波和脈衝波(超音波的脈衝式遞送)兩者都可以按任何組合來採用。例如,可以施加連續波超音波,隨後施加脈衝波超音波,反之亦然。可以按任何順序和組合將其重複任何次數。可以在連續波超音波的背景下施加脈衝波超音波,並且可以按任何組數使用任何數目的脈衝。
較佳的是,超音波可以包括脈衝波超音波。在一高度較佳的實施方式中,以0.7Wcm-2或1.25Wcm-2的功率密度作為連續波施加超音波。如果使用脈衝波超音波,則可以採用更高的功率密度。
使用超音波係有利的,因為像光一樣,它可以被準確地聚焦在靶標上。此外,超音波係有利的,因為與光不同,它可以被更深地聚焦進組織。因此它更好地適合於全組織滲透(如但不限於肝葉)或全器官(如但不限於整個肝或整個肌肉,如心臟)治療。另一個重要的優勢在於超音波係非侵入性刺激,它被用於多種多樣的診斷和治療應用中。藉由舉例,超音波在醫學成像技術中,並且另外在整形治療中是熟知的。此外,適於向受試者脊椎動物施加超音波的儀器係廣泛可用的並且其使用在本領域係眾所周知的。
本發明的快速轉錄應答和內源靶向導致了用於研究轉錄動力學的理想系統。例如,本發明可以用於研究在靶基因的誘導表現時變體產生的動力學。在轉錄循環的另一端,mRNA降解研究通常響應於強細胞外刺激來進行,強細胞外刺激導致種類繁多的基因的表現水平發生變化。本發明可以用於可逆地誘導內源靶標的轉錄,在此之後可以停止刺激,並且可以追蹤獨特靶標的降解動力學。
本發明的時間精度可以為時間遺傳調節提供與實驗干預 一致的動力。例如,在長時程增強(LTP)中具有可疑牽涉的靶標可以在器官型或解剖的神經元培養物中調節,但僅在刺激期間以誘導LTP,以便避免干擾該等細胞的正常發育。類似地,在展現出疾病表型的細胞模型中,懷疑牽涉在特定療法的有效性中的靶標可以僅在治療期間調節。相反,遺傳靶標可以僅在病理刺激期間調節。其中遺傳線索對外部實驗刺激的定時具有相關性的任何數目的實驗都可以潛在地從本發明的實用性中受益。
體內背景為本發明控制基因表現提供了同樣豐富的機會。光誘導性提供了空間精度的潛力。利用光極技術的發展,可以將刺激光纖導線置於精確的腦區中。然後可以藉由光強度調諧刺激區域尺寸。這可以與本發明的Cas9 CRISPR-Cas系統或複合物的遞送結合完成,或者在轉基因Cas9動物的情況下,可以遞送本發明的指導RNA,並且光極技術可以允許調節精確腦區中的基因表現。可以向透明的表現Cas9的生物給予本發明的指導RNA,並且然後可以存在極其精確的雷射誘導的局部基因表現變化。
用於培養宿主細胞的培養基包括通常用於組織培養的培養基,如M199-earle base、Eagle MEM(E-MEM)、Dulbecco MEM(DMEM)、SC-UCM102、UP-SFM(GIBCO BRL)、EX-CELL302(日冷公司(Nichirei))、EX-CELL293-S(日冷公司)、TFBM-01(日冷公司)、ASF104等。用於特定細胞類型的適合的培養基可以發現於美國典型培養物保藏中心(ATCC)或歐洲細胞培養物保藏中心(ECACC)。培養基可以補充有胺基酸(如L-穀胺醯胺)、鹽、抗真菌劑或抗細菌劑(如 Fungizone®)、青黴素-鏈黴素、動物血清等。細胞培養基可以視情況是無血清的。
本發明還可以提供在體內有價值的時間精度。本發明可以用於改變特定發育階段期間的基因表現。本發明可以用於將遺傳線索定時至特定實驗窗。例如,牽連在學習中的基因可以僅在完整的齧齒動物或靈長類動物腦的精確區域中在學習刺激期間過表現或抑制。另外,本發明可以用於僅在疾病發展的特定階段期間誘導基因表現變化。例如,癌基因可以僅在腫瘤達到特定尺寸或轉移階段後才過表現。相反,在阿茲海默症發展中可疑的蛋白質可以僅在動物生命的限定時間點且在特定腦區內敲低。儘管該等實例並未窮盡性地列出本發明的潛在應用,但是它們突出顯示了本發明在其中可以是有力技術的一些領域。
受保護的指導物:根據本發明的酶可以與受保護的指導RNA組合使用
在一個方面,本發明的一目的在於藉由熱力學調諧指導RNA至靶DNA的結合特異性來進一步增強Cas9給定的單獨指導RNA的特異性。這係引入指導序列的錯配、延伸或截短的通用方法,以增加/減少在基因組靶標與其潛在脫靶座位之間共用的互補鹼基與錯配鹼基的數目,以便向靶向的基因組座位給出優於基因組脫靶的熱力學優勢。
在一個方面,本發明提供了藉由二級結構修飾的指導序列,以增加該Cas9 CRISPR-Cas系統的特異性,並且由此該二級結構可以保護免受外切核酸酶活性影響並且允許將3’添加到該指導序列。
在一個方面,本發明提供使“保護性RNA”雜交到指導 序列,其中該“保護性RNA”係與該指導RNA(gRNA)的5'端互補的RNA股,以由此產生部分雙股的gRNA。在本發明的一實施方式中,用完全互補的保護性序列保護錯配鹼基降低了靶DNA結合至3'端處的錯配鹼基對的可能性。在本發明的實施方式中,還可以存在包含伸長長度的另外的序列。
與基因組靶標匹配的指導RNA(gRNA)延伸提供gRNA保護並且增強特異性。設想了用在間隔子種子端的遠端的針對單獨基因組靶標的匹配序列延伸gRNA,以提供增強的特異性。已經在沒有截短的情況下在細胞中觀察到增強特異性的匹配gRNA延伸。伴隨該等穩定的長度延伸的gRNA結構的預測已經顯示,穩定形式產生自保護狀態,在該等保護狀態中由於間隔子延伸和間隔子種子中的互補序列,延伸與gRNA種子形成閉環。該等結果證實,受保護的指導物概念還包括與20mer間隔子結合區遠端的基因組靶序列匹配的序列。可以使用熱力學預測來預測產生受保護的gRNA狀態的完全匹配或部分匹配指導延伸。這將受保護的gRNA的概念擴展至X與Z之間的相互作用,其中X的長度通常是17-20nt並且Z的長度係1-30nt。可以使用熱力學預測來確定Z的最佳延伸狀態,從而潛在地在Z中引入小數目的錯配,以促進在X與Z之間形成受保護的構象。貫穿本申請,術語“X”和種子長度(SL)與術語外露長度(EpL)(其表示可為靶DNA結合所用的核苷酸的數目)可互換地使用;術語“Y”和保護長度(PL)可互換地使用,代表保護子的長度;並且術語“Z”、“E”、“E’”和EL可互換地使用,對應於術語伸長長度(ExL),其代表靶序列延伸所靠的核苷酸的數目。
對應於伸長長度(ExL)的延伸序列可以視情況被直接附接至受保護的指導序列的3'端處的指導序列。該延伸序列在長度上可以是2至12個核苷酸。較佳的是,ExL在長度上可以被表示為0、2、4、6、8、10或12個核苷酸。在一較佳的實施方式中,ExL在長度上被表示為0或4個核苷酸。在一更較佳的實施方式中,ExL在長度上為4個核苷酸。該延伸序列可以或可以不與靶序列互補。
延伸序列可以進一步視情況被直接附接至受保護的指導序列的5'端處的指導序列並且附接至保護性序列的3'端。其結果係,該延伸序列充當受保護的序列與保護性序列之間的連接序列。不希望受到理論的束縛,這樣一種連接可以將保護性序列定位在受保護的序列附近,用於改進保護性序列與受保護的序列的結合。
向gRNA的遠端添加gRNA錯配可以展示增強的特異性。在Y中引入未受保護的遠端錯配或用遠側錯配(Z)延伸gRNA可以展示增強的特異性。所提及的這個概念限於受保護的gRNA中所用的X、Y、和Z組分。未受保護的錯配概念可以被進一步推廣到針對受保護的指導RNA描述的X、Y、和Z的概念。
Cas9Cas9在一個方面,本發明提供了增強的Cas9Cas9特異性,其中受保護的指導RNA(pgRNA)的雙股3'端允許兩種可能的結果:(1)將發生指導RNA-保護性RNA至指導RNA-靶DNA的股交換並且該指導將完全結合該靶標,或(2)該指導RNA將不能完全結合該靶標並且因為Cas9靶標切割係需要指導RNA:靶DNA結合以活化Cas9催化的DSB的多步驟動力學反應,其中如果該指導RNA不適當地結合,則不會發生Cas9 切割。根據具體實施方式,與天然存在的CRISPR-Cas系統相比,受保護的指導RNA改進靶標結合特異性。根據具體實施方式,與天然存在的CRISPR-Cas相比,受保護的經修飾的指導RNA改進穩定性。根據具體實施方式,該保護性序列具有3與120個核苷酸之間的長度並且包括3個或更多個與指導或保護子的另一序列互補的連續核苷酸。根據具體實施方式,該保護性序列形成髮夾。根據具體實施方式,該指導RNA進一步包括受保護的序列和外露序列。根據具體實施方式,該外露序列係1至19個核苷酸。更具體地說,該外露序列至少75%、至少90%或約100%與該靶序列互補。根據具體實施方式,該指導序列至少90%或約100%與保護性股互補。根據具體實施方式,該指導序列至少75%、至少90%或約100%與該靶序列互補。根據具體實施方式,該指導RNA進一步包括延伸序列。更具體地說,該延伸序列可操作地連接到受保護的指導序列的3'端,並且視情況直接連接到受保護的指導序列的3'端。根據具體實施方式,該延伸序列係1-12個核苷酸。根據具體實施方式,該延伸序列可操作地連接到受保護的指導序列的3'端處的指導序列和保護性股的5'端,並且視情況直接連接到受保護的指導序列的3'端和保護性股的3'端,其中該延伸序列係受保護的序列與保護性股之間的連接序列。根據具體實施方式,該延伸序列100%不與保護性股互補,視情況至少95%、至少90%、至少80%、至少70%、至少60%、或至少50%不與保護性股互補。根據具體實施方式,該指導序列進一步包括附於指導序列端的錯配,其中該等錯配在熱力學上優化特異性。
在一個方面,本發明提供了工程化的、非天然存在的 CRISPR-Cas系統,該系統包含Cas9蛋白和靶向在細胞中編碼基因產物的DNA分子的受保護的指導RNA,由此該受保護的指導RNA靶向編碼該基因產物的DNA分子,並且該Cas9蛋白切割編碼該基因產物的DNA分子,由此改變該基因產物的表現;並且,其中該Cas9蛋白和該受保護的指導RNA並不天然地一起存在。本發明包括包含融合3’到同向重複序列上的指導序列的受保護的指導RNA。本發明進一步包括經密碼子優化以便在真核細胞中表現的Cas9蛋白。在一較佳的實施方式中,該真核細胞係哺乳動物細胞、植物細胞或酵母細胞,並且在一更較佳的實施方式中,該哺乳動物細胞係人類細胞。在本發明的一另外的實施方式中,該基因產物的表現被降低。在一些實施方式中,該Cas9酶係胺基酸球菌屬BV3L6、毛螺菌科細菌或新兇手弗朗西絲菌Cas9,並且可以包括來源於該等生物的經突變的Cas9。該酶可以是另外的Cas9同系物或異種同源物。在一些實施方式中,編碼Cfp1酶的核苷酸序列經密碼子優化以便在真核細胞中表現。在一些實施方式中,該Cas9酶引導在該靶序列位置處的一條或兩條股的切割。在一些實施方式中,該第一調節元件係聚合酶III啟動子。在一些實施方式中,該第二調節元件係聚合酶II啟動子。通常,並且貫穿本說明書,術語“載體”係指一種核酸分子,它能夠運送與其連接的另一種核酸分子。載體包括但不限於,單股、雙股、或部分雙股的核酸分子;包括一個或多個自由端、無自由端(例如,環狀的)的核酸分子;包括DNA、RNA、或兩者的核酸分子;以及本領域已知的其他多種多樣的多核苷酸。一種類型的載體係“質粒”,其係指其中可以例如藉由標準分子選殖技術插入另外的DNA片段的環狀雙股DNA環。另一種類型的載體係病毒載體,其中病毒衍生的DNA或RNA序列存在於用於包裝進病 毒(例如,逆轉錄病毒、複製缺陷型逆轉錄病毒、腺病毒、複製缺陷型腺病毒、以及腺相關病毒)的載體中。病毒載體還包含由用於轉染到宿主細胞中的病毒攜帶的多核苷酸。某些載體(例如,具有細菌複製起點的細菌載體和附加型哺乳動物載體)能夠在它們被導入的宿主細胞中自主複製。其他載體(例如,非附加型哺乳動物載體)在引入宿主細胞後整合到該宿主細胞的基因組中,並且由此與該宿主基因組一起複製。而且,某些載體能夠指導它們可操作連接的基因的表現。這樣的載體在此被稱為“表現載體”。在重組DNA技術中使用的普通表現栽體通常是質粒形式。
重組表現載體可包含處於適合於在宿主細胞中的核酸表現的形式的本發明的核酸,這意味著該等重組表現載體包含基於待用於表現的宿主細胞而選擇的一種或多種調節元件,所述調節元件可操作地連接至待表現的核酸序列。在重組表現載體內,“可操作地連接”旨在表示感興趣的核苷酸序列以允許該核苷酸序列的表現的方式被連接至這一種或多種調節元件(例如,處於體外轉錄/翻譯系統中或當該載體被引入宿主細胞中時,處於該宿主細胞中)。
有利的載體包括慢病毒以及腺相關病毒,並且也可選擇此類型的載體以靶向具體類型的細胞。
在一個方面,本發明提供了真核宿主細胞,該真核宿主細胞包含(a)第一調節元件,該第一調節元件可操作地連接到同向重複序列和一個或多個插入位點,這一個或多個插入位點用於在該同向重複序列的下游插入一個或多個指導序列,其中當表現時,該指導序列引導 CRISPR複合物與真核細胞中的靶序列的序列特異性結合,其中該CRISPR複合物包含與包含雜交到該靶序列上的指導序列的指導RNA複合的CRISPR酶,和/或(b)第二調節元件,該第二調節元件可操作地連接到編碼所述Cas9酶的酶編碼序列,該酶包括核定位序列。在一些實施方式中,該宿主細胞包括組分(a)以及(b)。在一些實施方式中,組分(a)、組分(b)、或組分(a)和(b)穩定地整合到該宿主真核細胞的基因組中。在一些實施方式中,組分(a)進一步包括可操作地連接到該第一調節元件的兩個或更多個指導序列,其中當表現時,該兩個或更多個指導序列中的每個引導CRISPR複合物在真核細胞中與不同靶序列的序列特異性結合。在一些實施方式中,該Cas9酶引導在該靶序列位置處的一條或兩條股的切割。在一些實施方式中,該Cas9酶缺少DNA股切割活性。在一些實施方式中,該第一調節元件係聚合酶III啟動子。在一些實施方式中,該第二調節元件係聚合酶II啟動子。
在一方面,本發明提供了非人類真核生物;較佳的是多細胞真核生物,包含根據所描述的實施方式中任一項的真核宿主細胞。在其他方面,本發明提供了真核生物;較佳的是多細胞真核生物,包含根據所描述的實施方式中任一項的真核宿主細胞。在該等方面的一些實施方式中,該生物可以是動物;例如哺乳動物。另外,該生物可以是節肢動物,如昆蟲。該生物也可以是植物或酵母。另外,該生物可以是真菌。
在一個方面,本發明提供了套組,該套組包括在上文描述的組分中的一種或多種。在一些實施方式中,該套組包括載體系統以及用於使用該套組的說明書。在一些實施方式中,該載體系統包含(a)第 一調節元件,該第一調節元件可操作地連接到同向重複序列和一個或多個插入位點,這一個或多個插入位點用於在該同向重複序列的下游插入一個或多個指導序列,其中當表現時,該指導序列引導Cas9 CRISPR複合物與真核細胞中的靶序列的序列特異性結合,其中該CRISPR複合物包含與包含雜交到該靶序列上的指導序列的受保護的指導RNA複合的Cas9酶,和/或(b)第二調節元件,該第二調節元件可操作地連接到編碼所述Cas9酶的酶編碼序列,該酶包括核定位序列。在一些實施方式中,該套組包括位於該系統的相同或不同載體上的組分(a)和(b)。在一些實施方式中,組分(a)進一步包括可操作地連接到該第一調節元件的兩個或更多個指導序列,其中當表現時,該兩個或更多個指導序列中的每個引導CRISPR複合物在真核細胞中與不同靶序列的序列特異性結合。在一些實施方式中,該Cas9酶包括一個或多個核定位序列,其具有足夠強度來在真核細胞的細胞核中驅動所述Cas9酶以可檢測的量積聚。在一些實施方式中,該Cas9酶係胺基酸球菌屬BV3L6、毛螺菌科細菌MA2020或土拉熱弗朗西絲菌1新兇手(Francisella tularensis 1 Novicida)Cas9,並且可以包括來源於該等生物的經突變的Cas9。該酶可以是Cas9同系物或異種同源物。在一些實施方式中,該CRISPR酶係密碼子優化的以便在真核細胞中表現。在一些實施方式中,該CRISPR酶引導在該靶序列位置處的一條或兩條股的切割。在一些實施方式中,該CRISPR酶缺少DNA股切割活性。在一些實施方式中,該第一調節元件係聚合酶III啟動子。在一些實施方式中,該第二調節元件係聚合酶II啟動子。
在一個方面,本發明提供了修飾在真核細胞中的靶多核苷 酸之方法。在一些實施方式中,該方法包括允許CRISPR複合物結合到該靶多核苷酸上以實施所述靶多核苷酸的切割,由此修飾該靶多核苷酸,其中該CRISPR複合物包含與受保護的指導RNA複合的Cas9酶,該受保護的指導RNA包含雜交到所述靶多核苷酸內的靶序列上的指導序列。在一些實施方式中,所述切割包括藉由所述Cas9酶切割在靶序列位置處的一條或兩條股。在一些實施方式中,所述切割導致靶基因的轉錄降低。在一些實施方式中,該方法進一步包括藉由基於非同源末端連接(NHEJ)的基因插入機制(更具體地與外源模板多核苷酸)修復所述切割的靶多核苷酸,其中所述修復導致突變,包括所述靶多核苷酸的一個或多個核苷酸的插入、缺失、或取代。在一些實施方式中,所述突變導致在從包含該靶序列的基因表現的蛋白質中的一個或多個胺基酸改變。在一些實施方式中,該方法進一步包括將一種或多種載體遞送到所述真核細胞,其中這一種或多種載體驅動下列一者或多者的表現:該Cas9酶、包含連接到同向重複序列的指導序列的受保護的指導RNA。在一些實施方式中,所述載體被遞送到受試者內的真核細胞中。在一些實施方式中,所述修飾發生在細胞培養物中的所述真核細胞中。在一些實施方式中,該方法進一步包括在所述修飾之前從受試者中分離所述真核細胞。在一些實施方式中,該方法進一步包括使所述真核細胞和/或從中衍生的細胞返回到所述受試者中。
在一個方面,本發明提供了修飾多核苷酸在真核細胞中的表現之方法。在一些實施方式中,該方法包括允許Cas9 CRISPR複合物結合到該多核苷酸上,這樣使得所述結合導致所述多核苷酸的表現增加或 降低;其中該CRISPR複合物包含與受保護的指導RNA複合的Cas9酶,該受保護的指導RNA包含雜交到所述多核苷酸內的靶序列上的指導序列。在一些實施方式中,該方法進一步包括將一種或多種載體遞送到所述真核細胞,其中這一種或多種載體驅動下列一者或多者的表現:該Cas9酶和該受保護的指導RNA。
在一個方面,本發明提供了產生包含經突變的疾病基因的模式真核細胞之方法。在一些實施方式中,疾病基因係與患有或產生疾病的風險的增加相關聯的任何基因。在一些實施方式中,該方法包括(a)向真核細胞中引入一種或多種載體,其中這一種或多種載體驅動下列一者或多者的表現:Cas9酶和包含連接到同向重複序列的指導序列的受保護的指導RNA;並且(b)允許CRISPR複合物結合到靶多核苷酸上以實施在所述疾病基因內的該靶多核苷酸的切割,其中該CRISPR複合物包含與包含雜交到該靶多核苷酸內的靶序列上的指導序列的指導RNA複合的Cas9酶,由此產生包含經突變的疾病基因的模式真核細胞。在一些實施方式中,所述切割包括藉由所述Cas9酶切割在靶序列位置處的一條或兩條股。在一些實施方式中,所述切割導致靶基因的轉錄降低。在一些實施方式中,該方法進一步包括藉由與外源模板多核苷酸的基於非同源末端連接(NHEJ)的基因插入機制修復所述切割的靶多核苷酸,其中所述修復導致突變,包括所述靶多核苷酸的一個或多個核苷酸的插入、缺失、或取代。在一些實施方式中,所述突變導致在從包含該靶序列的基因表現的蛋白質中的一個或多個胺基酸改變。
在一個方面,本發明提供了用於研發生物活性劑之方法, 該生物活性劑調製與疾病基因相關的細胞傳訊事件。在一些實施方式中,疾病基因係與患有或產生疾病的風險的增加相關聯的任何基因。在一些實施方式中,該方法包括(a)使測試化合物與所描述實施方式中任一項的模式細胞接觸;並且(b)檢測讀數變化,該變化指示與所述疾病基因的所述突變關聯的細胞傳訊事件的減少或增加,由此開發調節與所述疾病基因關聯的所述細胞傳訊事件的所述生物活性劑。
在一個方面,本發明提供了包含同向重複序列下游的受保護的指導序列的重組多核苷酸,其中當表現時,該受保護的指導序列引導CRISPR複合物與存在於真核細胞中的對應的靶序列的序列特異性結合。在一些實施方式中,該靶序列係存在於真核細胞中的病毒序列。在一些實施方式中,該靶序列係原癌基因或癌基因。
在一個方面,本發明提供了藉由在一種或多種細胞的基因中引入一個或多個突變來選擇一種或多種細胞之方法,該方法包括:將一種或多種載體引入這一種或多種細胞中,其中這一種或多種載體驅動下列一者或多者的表現:Cas9酶、包含指導序列的受保護的指導RNA、和編輯模板;其中該編輯模板包含消除Cas9酶切的一個或多個突變;允許該編輯模板與該靶多核苷酸在有待篩選的這一種或多種細胞中的基於非同源末端連接(NHEJ)的基因插入機制;允許CRISPR複合物結合到靶多核苷酸上以實施在所述基因內的該靶多核苷酸的切割,其中該CRISPR複合物包含與受保護的指導RNA複合的Cas9酶,該受保護的指導RNA包含雜交到該靶多核苷酸內的靶序列上的指導序列,其中該CRISPR複合物與該靶多核苷酸的結合誘導細胞死亡,由此允許選擇其中已經引 入一個或多個突變的一種或多種細胞。在本發明的一較佳的實施方式中,該有待選擇的細胞可以是真核細胞。本發明的方面允許選擇特異細胞,而不需要選擇標記或可能包括反選擇系統的兩步法。
關於該Cas9酶的突變,當該酶不是FnCas9時,突變可以是如在本文的其他地方所描述的;還設想了任何該等置換胺基酸的保守性取代。在一方面,本發明提供了本文討論的任何或每個或所有實施方式,其中該CRISPR酶包括至少一個或多個、或至少兩個或更多個突變,其中這至少一個或多個突變或這至少兩個或更多個突變選自在本文的其他地方描述的那些。
在一個另外的方面,本發明涉及用於鑒定或設計適合在CRISPR-Cas9系統或其功能部分內的或結合到CRISPR-Cas9系統或其功能部分的潛在的化合物的電腦輔助方法、或反之亦然(用於鑒定或設計結合到所希望的化合物的潛在的CRISPR-Cas9系統或其功能部分的電腦輔助方法)、或用於鑒定或設計潛在的CRISPR-Cas9系統的電腦輔助方法(例如,就預測能夠被操縱的CRISPR-Cas9系統的區域而言-例如,基於晶體結構數據或基於Cas9異種同源物的數據,或就官能團(如活化蛋白或抑制蛋白)可以附接至該CRISPR-Cas9系統的何處而言,或就Cas9截短而言或就設計切口酶而言),所述方法包括:
使用電腦系統,例如包括處理器、數據存儲系統、輸入裝置、和輸出裝置的程式設計電腦,以下步驟:
(a)藉由所述輸入裝置將數據登錄到該程式設計電腦中,該數據包括來自CRISPR-Cas9晶體結構的或與其有關的原子子集的三 維座標,例如在CRISPR-Cas9系統結合結構域中、或可替代地或另外地在基於Cas9異種同源物之間的或關於Cas9的或關於切口酶的或關於官能團的差異而變化的結構域中,視情況連同來自一種或多種CRISPR-Cas9系統複合物的結構資訊,由此產生數據集;
(b)使用所述處理器比較所述數據集與儲存在所述電腦數據存儲系統中的電腦結構資料庫,例如結合到或推定結合到或希望結合到CRISPR-Cas9系統的化合物的、或關於Cas9異種同源物的(例如,關於Cas9的或關於在Cas9異種同源物之間變化的結構域或區域的)、或關於CRISPR-Cas9晶體結構的、或關於切口酶的或關於官能團的結構;
(c)使用電腦方法從所述資料庫中選擇一種或多種結構-例如,可以結合到所希望的結構的CRISPR-Cas9結構、可以結合到某些CRISPR-Cas9結構的所希望的結構、可以被操縱的CRISPR-Cas9系統的部分,例如基於來自CRISPR-Cas9晶體結構的其他部分的和/或來自Cas9異種同源物、截短的Cas9、新穎的切口酶或特定的官能團、或用於附接官能團或官能團-CRISPR-Cas9系統的位置的數據;
(d)使用電腦方法構建所選一種或多種結構的模型;並且
(e)將所選一種或多種結構輸出至所述輸出裝置;
並且視情況合成所選一種或多種結構中的一者或多者;
並且進一步視情況作為CRISPR-Cas9系統或在其中測試所述合成的所選一種或多種結構;
或者,所述方法包括:提供該CRISPR-Cas9晶體結構的至少兩個原子的座標,例如本文的CRISPR-Cas9晶體結構的晶體結構表的至少兩個原子或該CRISPR-Cas9晶體結構的至少一個子結構域的座標(“所選座標”);提供包含結合分子的候選物的或可以被操縱的該CRISPR-Cas9系統的部分的結構,例如基於來自該CRISPR-Cas9晶體結構的其他部分的和/或來自Cas9異種同源物的數據,或官能團的結構,並且將該候選物的結構與所選座標匹配,以由此獲得產品數據,該產品數據包括可以結合到所希望的結構的CRISPR-Cas9結構,可以結合到某些CRISPR-Cas9結構的所希望的結構、可以被操縱的CRISPR-Cas9系統的部分、截短的Cas9、新穎的切口酶或特定的官能團、或用於附接官能團或官能團-CRISPR-Cas9系統的位置,並且將其輸出;並且視情況從所述產品數據合成一種或多種化合物並且進一步視情況包括作為CRISPR-Cas9系統或在其中測試所述合成的一種或多種化合物。
該測試可以包括對由所述合成的所選一種或多種結構產生的CRISPR-Cas9系統進行分析,例如相對於結合、或執行所希望的功能。
前述方法中的輸出可以包括數據傳輸,例如經由電信、電話、視訊會議、公眾通訊(例如演示,如電腦演示(例如POWERPOINT))、網際網路、電子郵件、文獻交流(如電腦程式(例如WORD))文件等進行的資訊傳輸。因此,本發明還包括含有以下項的電腦可讀介質:根據本文引用的晶體結構的原子座標數據,所述數據限定了CRISPR-Cas9或其至少一個子結構域的三維結構,或針對CRISPR-Cas9的結構因子數據,所述結構因子數據可衍生自本文引用的晶體結構的原子座標數據。該電腦 可讀介質還可以含有前述方法的任何數據。本發明進一步包括用於產生或執行如在前述方法中的合理設計的方法、電腦系統,含有以下任一項:根據本文引用的晶體結構的原子座標數據,所述數據限定了CRISPR-Cas9或其至少一個子結構域的三維結構,或針對CRISPR-Cas9的結構因子數據,所述結構因子數據可衍生自本文引用的晶體結構的原子座標數據。本發明進一步包括經商方法,該方法包括向使用者提供該電腦系統或該介質或CRISPR-Cas9或其至少一個子結構域的三維結構、或針對CRISPR-Cas9的結構因子數據(所述結構列於本文引用的晶體結構的原子座標數據中並且所述結構因子數據可衍生自本文引用的晶體結構的原子座標數據)、或本文的電腦介質或本文的數據傳輸。
“結合位點”或“活性位點”包括結合腔或區域中的位點(如原子、胺基酸殘基的官能團或多個這樣的原子和/或基團)或基本上由其組成或由其組成,該結合腔或區域可以結合至化合物(如核酸分子),所述化合物涉及在結合中。
所謂“匹配(fitting)”意指藉由自動或半自動手段確定候選分子的一個或多個原子與本發明結構的至少一個原子之間的相互作用,並且計算這樣的相互作用穩定的程度。相互作用包括由電荷、空間因素等引起的吸引和排斥。進一步描述了匹配用的各種基於電腦之方法。
所謂“均方根(或rms)偏差”,我們意指離均差的平方的算術平均數的平方根。
所謂“電腦系統”意指用於分析原子座標數據的硬體裝置、軟體裝置和數據存儲裝置。本發明的基於電腦的系統的最低硬體裝 置典型地包括中央處理器(CPU)、輸入裝置、輸出裝置以及數據存儲裝置。合意地,提供顯示器或監測器用於視覺化結構數據。數據存儲裝置可以是RAM或用於存取本發明的電腦可讀介質的裝置。這樣的系統的實例係運行Unix、Windows或Apple作業系統的電腦和平板設備。
所謂“電腦可讀介質”意指可以被電腦直接或間接讀取並且存取,例如使得該介質適於在以上提到的電腦系統中使用的任何一種或多種介質。這樣的介質包括但不限於:磁存儲介質,如軟碟、硬碟存儲介質和磁帶;光存儲介質,如光碟或CD-ROM;電存儲介質,如RAM和ROM;拇指驅動設備;雲存儲裝置以及該等類別的混合體,如磁/光存儲介質。
本發明包括在本文描述的經優化的功能性CRISPR-Cas酶系統中使用在上文描述的受保護的指導物。
藉由指導工程化形成RISC
在一些實施方式中,該指導可以是如本文描述的受保護的指導物(例如pgRNA)或受護航的指導(例如esgRNA)。在一些實施方式中,這兩者都利用RISC。RISC係RNAi的關鍵組分。RISC(RNA誘導沈默複合體)係一多蛋白,確切地說係核糖核蛋白複合體,它摻入了雙股RNA(dsRNA)片段的一條股,如小干擾RNA(siRNA)或微小RNA(miRNA),該股充當RISC的模板用於識別互補信使RNA(mRNA)轉錄物。mRNA因此被RISC的組分之一切割。
因此,在一些實施方式中,RISC的形成係有利的。根據本發明的不同方面的指導RNA(包括但不限於受保護的和/或受護航的指 導RNA)可以被適配成包括促進RISC形成的RNA核苷酸,例如與可以被提供於細胞中的或可以例如已經被表現於細胞中的siRNA或miRNA組合。這例如作為用於清除或降解該指導物的自行失活性系統可以是有用的。
因此,該指導RNA可以包括與靶miRNA或siRNA互補的序列,該靶miRNA或siRNA可以或可以不存在於細胞內。以此方式,只有當例如藉由表現(藉由該細胞或藉由人為干涉)存在該miRNA或siRNA時,才存在RNA序列與該miRNA或siRNA的結合,這然後導致該指導RNA被該細胞內的RNA誘導沈默複合體(RISC)切割。因此,在一些實施方式中,該指導RNA包括與靶miRNA或siRNA互補的RNA序列,並且該指導RNA序列與該靶miRNA或siRNA的結合導致該指導RNA被該細胞內的RNA誘導沈默複合體(RISC)切割。
下文具體參考受保護的和受護航的指導物對其進行進一步解釋。
藉由使用受保護的指導物的RISC形成
例如,可以在以下方面中描述受保護的指導物:工程化的、非天然存在的組成物,該組成物包含規律間隔成簇短迴文重複(CRISPR)-CRISPR相關(Cas)(CRISPR-Cas)系統,該系統具有受保護的指導RNA(pgRNA)多核苷酸序列,該多核苷酸序列包括(a)保護性序列、(b)能夠雜交到真核細胞中的靶序列上的指導序列、(c)tracr配對序列、和(d)tracr序列,其中(a)、(b)、(c)和(d)以5’到3’方向排列,其中該保護性序列包括兩個或更多個與該靶序列不互補的核苷 酸,其中在轉錄時,該tracr配對序列雜交到該tracr序列上,並且該指導序列引導CRISPR複合物與該靶序列的序列特異性結合,其中該CRISPR複合物包含與(1)雜交到該靶序列上的指導序列、和(2)雜交到該tracr序列上的tracr配對序列複合的II型Cas9蛋白,並且其中在該多核苷酸序列中,該指導序列、tracr序列和tracr配對序列中的一者或多者被修飾。
在一個方面,這種受保護的指導物系統被用於該sgRNA的5'延伸的二級結構保護。例如,申請人延伸了該sgRNA,這樣使得引入了miRNA結合位點,以便僅當該miRNA結合位點被RISC複合體機器加工且切割時,才使該sgRNA具有活性。這在不進行二級結構保護的情況下是不可能的,因為外切核酸酶加工將從5’端開始並且朝該sgRNA回切。藉由向添加的miRNA位點的5’添加小二級結構環,則可以保護miRNA免於被外切核酸酶嚼回。
藉由使用受護航的指導物的RISC形成
在另一個實例中,可以描述受護航的(escorted)指導物。具體而言,設想了miRNA誘導型esgRNA。這裡,該護航性RNA適配體序列與靶miRNA互補,這樣使得當該靶miRNA存在於摻入了該RNA誘導沈默複合體(RISC)的細胞中時,存在該護航性RNA適配體序列與該靶miRNA的結合,這使得該esgRNA被該細胞內的RNA誘導沈默複合體(RISC)切割。
在替代性實施方式中,可以在該esgRNA的5’端提供多種多樣的一級和二級結構,該等結構被設計為使得該RISC複合體能夠接近該miRNA結合位點。esgRNA可以在保護性序列的5’具有第一和第二接頭 序列。在替代性實施方式中,接頭1和2可以例如各自獨立地是0、1、2、3、或4個核苷酸長,其中保護性序列在長度上為0、1或2個核苷酸。
在一示例性實施方式中,可以使用miR-122在HEK.293細胞系統中展示esgRNA靶向的誘導,在該等細胞中miR-122並不天然地表現。在不存在外源miR-122下,受保護的esgRNA並不介導靶向的EMX1.3核酸酶活性。當添加外源miR-122(100ng/孔)時,觀察到靶向的EMX1.3切割(作為在凝膠上的電泳變種可見的不同切割偽像)。這證實了可以在提供遺傳誘導型sgRNA的系統中利用高度表現的內源miRNA。可以使用具有容易確定的相應序列的任何miRNA代替miRNA122。
例如,sgRNA可以連接至與源靶miRNA互補的“護航”RNA適配體序列。該靶miRNA可以在該細胞內形成RNA誘導沈默複合體(RISC)。當該靶miRNA存在於細胞中時,存在該護航性RNA適配體序列與該靶miRNA的結合,這使得該esgRNA被該細胞內的RNA誘導沈默複合體(RISC)切割。該護航物的切割釋放活性sgRNA。
例如,可以在以下方面中描述受保護的指導物:非天然存在的或工程化的組成物,該組成物包含受護航的單個CRISPR-Cas9指導RNA(esgRNA),該指導RNA包含:
RNA指導序列,該RNA指導序列能夠雜交到細胞中的感興趣的基因組座位中的靶序列上,以及,
護航性RNA適配體序列,
其中該護航性RNA適配體序列包括對該細胞上或該細胞中的適 配體配位基的結合親和力,或者該護航性RNA適配體序列響應於該細胞上或該細胞中的局部化適配體效應子,
其中該適配體配位基或效應子在該細胞上或該細胞中的存在在空間上或在時間上是受限的。
該護航性RNA適配體序列可以與靶miRNA互補,該靶miRNA可以或可以不存在於細胞內,這樣使得僅當存在該靶miRNA時,才存在該護航性RNA適配體序列與該靶miRNA的結合,這使得該esgRNA被該細胞內的RNA誘導沈默複合體(RISC)切割。因此,在一些實施方式中,該護航性RNA適配體序列與靶miRNA互補,並且該護航性RNA適配體序列與該靶miRNA的結合導致該esgRNA被該細胞內的RNA誘導沈默複合體(RISC)切割。
根據本發明,編碼所述指導RNA或Cas蛋白中的至少一者的核苷酸序列在該細胞內與包含感興趣基因的啟動子的調節元件可操作地連接,由此至少一種CRISPR-Cas系統組分的表現由該感興趣基因的啟動子驅動。“可操作地連接”旨在意指編碼該指導RNA和/或該Cas的核苷酸序列按允許表現該核苷酸序列的方式連接至這一種或多種調節元件,還如在本文的其他地方所提及的。在本文的其他地方還描述了術語“調節元件”。根據本發明,該調節元件包括感興趣基因的啟動子,如較佳的是感興趣的內源基因的啟動子。在某些實施方式中,該啟動子在其內源基因組位置處。在這樣的實施方式中,編碼該CRISPR和/或Cas的核酸處於在其天然基因組位置處的感興趣基因的啟動子的轉錄控制之 下。在某些其他實施方式中,該啟動子被提供在(單獨的)核酸分子上,例如載體或質粒,或其他染色體外核酸,即該啟動子未被提供在其天然基因組位置處。在某些實施方式中,該啟動子被基因組整合在非天然基因組位置處。
在某些實施方式中,編碼該指導RNA的核酸在該細胞內與包含感興趣基因的啟動子的調節元件可操作地連接。在某些實施方式中,編碼該Cas的核酸在該細胞內與包含感興趣基因的啟動子的調節元件可操作地連接。在某些實施方式中,編碼該指導RNA的核酸在該細胞內與包含感興趣基因的啟動子的調節元件可操作地連接,並且編碼該Cas的核酸在該細胞內與包含感興趣基因的啟動子的調節元件可操作地連接。在後一種情況下,驅動該指導RNA和該Cas的表現的啟動子可以是相同的或可以是不同的。在某些實施方式中,編碼該指導RNA和/或Cas的核酸被基因組整合。在某些實施方式中,編碼該指導RNA和/或Cas的核酸係染色體外的或附加型的。編碼該指導RNA的核酸和編碼該Cas的核酸可以位於相同的或不同的核酸分子上。
被根據本發明的一種或多種指導RNA靶向的所選DNA序列可以是內源DNA序列或外源DNA序列。被根據本發明的一種或多種指導RNA靶向的所選DNA序列(如外源DNA序列)可以是基因組整合的或可以是染色體外的(例如被提供在質粒或載體上)。在某些實施方式中,如本文描述的方法包括藉由如在本文的其他地方描述的、本領域已知的手段在該細胞中引入載體或質粒,所述載體或質粒包含所述選擇的DNA序列,並且所述方法包括檢測所述選擇的DNA序列在所述載體上的修 飾。應理解的是,所述載體或質粒、或包含在其中的至少所選DNA序列可以是基因組整合的,如隨機整合或經由同源重組。當該所選靶DNA序列係內源序列時,較佳的是這樣選擇該序列,使得其修飾對該細胞的(正常)功能沒有影響或具有最小影響。熟習該項技術者藉由常規分析或實驗應容易地鑒別這樣的序列。在任何情況下,較佳的是這樣的所選內源靶DNA序列並不位於基因的編碼序列或ORF中和/或並不位於基因的調節序列(如啟動子、增強子、沈默子等)中。
如在本文的其他地方所描述的,該所選靶DNA序列藉由功能性CRISPR複合物(即與該Cas蛋白複合的指導RNA,其中該指導RNA按5’到3'方向包括該指導序列、tracr配對序列和tracr序列,其中該tracr序列可以或可以不在與該指導序列和tracr配對序列相同的核酸分子上)的作用進行修飾。如本文使用的,“修飾的”基本上對應於突變的,即該靶DNA序列的核酸序列被改變,如在本文的其他地方描述的,如包括一個或多個核苷酸的點突變、缺失、取代、或插入。
然而,如在本文的其他地方所描述的,還應顯而易見的是在某些實施方式中,“修飾的”對應於靶座位的改變,如基因的轉錄的活化或抑制、CpG位點的甲基化或脫甲基化等,它們可以不需要一個或多個核苷酸的點突變、缺失、取代、或插入。此外,如在本文的其他地方所描述的,還應顯而易見的是,稱CRISPR-Cas酶“改變”或“修飾”一個或多個靶多核苷酸座位包括直接改變或修飾,例如經由該酶本身的催化活性;但是還包括間接改變或修飾,例如經由與CRISPR-Cas酶(如異源功能結構域,例如轉錄活化結構域)相關聯的催化活性。另外,如 應當理解的,意圖在於藉由CRISPR-Cas酶的作用被“改變”或“修飾”的這一個或多個靶多核苷酸座位可以被包含在與指導RNA的指導序列部分互補的多核苷酸序列中或與其鄰近,例如在該改變或修飾係藉由該CRISPR-Cas酶本身的催化活性(例如藉由該CRISPR-Cas酶的核酸酶活性切割DNA)實現的實施方式中。然而,還包括有待“改變”或“修飾”的一個或多個靶座位在不同於與該指導RNA的指導序列部分互補的序列位置處的實施方式,例如在該改變或修飾係經由與該CRISPR-Cas酶相關聯的異源功能結構域(例如基因的轉錄的活化或抑制)實現的實施方式中。因此,靶座位的“改變”或“修飾”(或類似術語)意指經由該CRISPR-Cas酶的直接或間接作用,並且此外,有待改變或修飾的“靶座位”和與該指導RNA的指導序列部分互補的“靶序列”可以是相同的或可以不是相同的。
在某些實施方式中,在如本文描述的根據本發明的方法中,該CRISPR-Cas系統係多元化的,即可以提供多種不同的指導RNA。每種指導RNA都可以靶向不同的所選DNA靶標(即與其雜交)。該等不同指導RNA的表現可以由不同的感興趣基因的啟動子驅動。因此,在某些實施方式中,如本文描述的本發明的方法係用於確定多於一個(如至少兩個)感興趣的基因在細胞中的表現之方法,該等方法包括提供包含CRISPR-Cas系統的細胞,所述CRISPR-Cas系統包含多於一種(如至少兩種)靶向不同所選DNA序列的指導RNA和能夠修飾所選DNA序列的Cas蛋白;由此每種指導RNA都在該細胞內與包含不同感興趣基因的啟動子的調節元件可操作地連接;並且基於所述對應的所選DNA序列的修飾的 檢測來確定所述感興趣的基因的表現。在某些實施方式中,超過一種不同的指導RNA可以在該細胞內與包含同一感興趣基因的啟動子的調節元件可操作地連接。該等不同的指導RNA可以被提供在不同的核酸分子上或被提供在同一核酸分子上。該等對應的指導RNA可以被設計成這樣,使得僅第一所選靶DNA的修飾產生或破壞第二所選靶DNA。
在某些實施方式中,該CRISPR-Cas系統的組分中的一種或多種可以在該細胞中條件性地(例如組織或細胞類型特異性的)和/或誘導性地(例如,化學誘導型)表現。在本文的其他地方描述了誘導型和條件型表現系統。在具體實施方式中,該等指導RNA中的一種或多種可以在該細胞中條件性地和/或誘導性地表現。在特別較佳的實施方式中,該Cas可以在該細胞中條件性地和/或誘導性地表現。
如本文使用的,術語所選DNA序列的“靶向”意指指導RNA能夠與所選DNA序列雜交。如本文使用的,“雜交(hybridization或hybridizing)”係指其中一個或多個多核苷酸反應形成複合物的反應,該複合物經由該等核苷酸殘基的鹼基之間的氫鍵鍵合而穩定化。氫鍵鍵合可以借助於沃森-克裡克鹼基配對、Hoogstein結合或以任何其他序列特異性方式而發生。該複合物可包含形成雙股體的兩條股、形成多股複合物的三條或多條股、單個自我雜交股、或該等的任何組合。雜交反應可以構成更廣泛的過程(如PCR的開始、或經由酶的多核苷酸的切割)中的步驟。能夠與給定序列雜交的序列被稱為該給定序列的“互補物”。
如本文使用的,“表現(expression或expressing)”係指藉此從DNA模板轉錄成多核苷酸(如轉錄成mRNA或其他RNA轉錄物) 的過程和/或轉錄的mRNA隨後藉此翻譯成肽、多肽或蛋白質的過程。轉錄物和編碼的多肽可以總稱為“基因產物”。如果多核苷酸來源於基因組DNA,則表現可以包括真核細胞中mRNA的剪接。如本文使用的基因或核酸的“表現”不僅涵蓋細胞基因表現,而且涵蓋在選殖系統中或在任何其他背景下的一個或多個核酸的轉錄和翻譯。
術語“多肽”、“肽”和“蛋白質”在本文可互換地使用,係指具有任何長度的胺基酸的聚合物。該聚合物可以是可以是直鏈或支鏈的,它可以包含修飾的胺基酸,並且它可以被非胺基酸中斷。該等術語還涵蓋已經被修飾的胺基酸聚合物;該等修飾例如二硫鍵形成、糖基化、脂化(lipidation)、乙醯化、磷酸化、或任何其他操縱,如與標記組分的綴合。如本文使用的,術語“胺基酸”包括天然的和/或非天然的或者合成的胺基酸,包括甘胺酸以及D或I旋光異構物、以及胺基酸類似物和肽模擬物。
術語“受試者”、“個體”和“患者”在本文中是可互換地使用的,係指脊椎動物,較佳的是哺乳動物,更較佳的是人。哺乳動物包括但不限於鼠類、猴、人、農畜、體育用動物和寵物。也包括體內獲得或體外培養的生物實體的組織、細胞及其子代。
在某些實施方式中,如本文描述的根據本發明的方法和細胞可以在治療劑的篩選方法中、和/或在診斷方法中使用。候選治療劑可以具有不同的時間表現譜效應,這可以根據如本文描述的方法讀出。
術語“治療劑”、“能夠用於治療的試劑”或“處理劑”係可互換地使用的,並且是指在給予受試者時賦予某種有益影響的分子 或化合物。該有益影響包括診斷確定的實現;改善疾病、症狀、障礙、或病理學病況;減少或預防疾病、症狀、障礙或病況的發作;以及總體上對抗疾病、症狀、障礙或病理學病況。
如本文使用的,“治療”或“進行治療”、或“減輕”或“改善”係可互換地使用的。該等術語係指如下途徑,該途徑用於獲得有益或希望的結果,包括但不限於治療益處和/或預防益處。治療益處意指治療中的一種或多種疾病、病況、或症狀上的任何治療上相關的改進或對其的影響。對於預防益處,該組成物可給予至處於發展具體的疾病、病況、或症狀的風險的受試者,或給予至報告了疾病的一個或多個生理學症狀的受試者,儘管該疾病、病況、或症狀可能還沒有體現出來。
如本文使用的,術語“嵌合RNA”、“嵌合指導RNA”、“指導RNA”、“單個指導RNA”以及“合成指導RNA”係指包括指導序列、tracr序列和tracr配對序列的多核苷酸序列。術語“指導序列”係指在指定靶位點的指導RNA內約20bp的序列,並且可與術語“指導”或“間隔子”互換地使用。術語“tracr配對序列”也可與術語“(一個或多個)同向重複”互換地使用。該指導序列、tracr、和tracr配對序列可以被提供在單個核酸分子上。可替代地,該指導和tracr配對序列可以被提供在單個核酸分子上,而該tracr被提供在分開的核酸分子上。
一般而言,該CRISPR-Cas或CRISPR系統係如在上述文獻(如WO 2014/093622(PCT/US 2013/074667))中使用的,並且共同地是指轉錄物和涉及CRISPR相關(“Cas”)基因的表現或指導其活性的其他元件,包括編碼Cas基因的序列、tracr(反式活化CRISPR)序列(例如 tracrRNA或活性部分tracrRNA)、tracr配對序列(涵蓋“同向重複”和在內源CRISPR系統背景下的tracrRNA加工的部分同向重複)、指導序列(在內源CRISPR系統背景下也稱為“間隔子(spacer)”)或如該術語在本文中使用的“一個或多個RNA”(例如,指導Cas(如Cas9)的一個或多個RNA,例如CRISPR RNA和反式活化(tracr)RNA或單個指導RNA(sgRNA)(嵌合RNA))或來自CRISPR座位的其他序列和轉錄物。一般而言,CRISPR系統的特徵為促進在靶序列的位點處的CRISPR複合物(在內源CRISPR系統的背景下也稱為原型間隔子)的形成的元件。在CRISPR複合物形成的背景下,“靶序列”係指指導序列被設計為對其具有互補性的序列,其中在靶序列與指導序列之間的雜交促進CRISPR複合物的形成。靶序列可以包含任何多核苷酸,如DNA或RNA多核苷酸。在一些實施方式中,靶序列位於細胞的細胞核或細胞質中。在一些實施方式中,可以藉由電腦搜索重複模體來鑒定同向重複,其滿足下列標準的任一項或全部:1.發現在II型CRISPR座位側翼的基因組序列的2Kb視窗;2.跨從20到50bp;以及3.以20到50bp間隔開。在一些實施方式中,可以使用該等標準中的2條,例如1和2、2和3、或1和3。在一些實施方式中,可以使用所有這3條標準。
在本發明的實施方式中,術語指導序列和指導RNA(即能夠將Cas導向靶基因組座位的RNA)可互換地使用,如在前述引用文獻(如WO 2014/093622(PCT/US 2013/074667))中。一般而言,指導序列係與靶多核苷酸序列具有足夠互補性以便與該靶序列雜交並且引導CRISPR複合物與該靶序列的序列特異性結合的任何多核苷酸序列。在一 些實施方式中,當使用適合的比對演算法進行最佳比對係,在指導序列與其相應的靶序列之間的互補程度係約或多於約50%、60%、75%、80%、85%、90%、95%、97.5%、99%、或更多。可以使用用於比對序列的任何適合的演算法來確定最佳比對,其非限制性實例包括史密斯-沃特曼演算法、尼德曼-翁施演算法、基於伯羅斯-惠勒變換的演算法(例如伯羅斯-惠勒比對工具)、ClustalW、Clustal X、BLAT、Novoalign(Novocraft技術公司;在www.novocraft.com可獲得)、ELAND(億明達公司,聖地牙哥,加利福尼亞州)、SOAP(在soap.genomics.org.cn可獲得)、以及Maq(在maq.sourceforge.net可獲得)。在一些實施方式中,指導序列在長度上為約或多於約5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、75個、或更多個核苷酸。在一些實施方式中,指導序列在長度上為少於約75、50、45、40、35、30、25、20、15、12個、或更少的核苷酸。較佳的是,該指導序列係10-30個核苷酸長。可以藉由任何適合的測定法來評估指導序列引導CRISPR複合物與靶序列的序列特異性結合的能力。例如,足以形成CRISPR複合物的CRISPR系統的組分,包括有待測試的指導序列在內,可以例如藉由用編碼該CRISPR序列的組分的載體進行轉染而被提供到具有相應靶序列的宿主細胞中,隨後藉由如本文所述的Surveyor測定來評估在該靶序列之內的優先切割。類似地,藉由提供該靶序列、包括有待測試的指導序列在內的CRISPR複合物的組分、和不同於該測試指導序列的對照指導序列,並且比較在該測試指導序列與該對照指導序列反應之間的靶序列處的結合或切割率,可以在試管中評估靶多核苷酸序列的切割。其他測定法係可能的,並且將由熟習該項技術者想到。
指導序列(即能夠將Cas導向基因組靶座位的RNA)可以被選擇為靶向任何靶序列。在一些實施方式中,該靶序列係在細胞的基因組內的序列。示例性靶序列包括在靶基因組中為獨特的那些。例如,對於釀膿鏈球菌Cas9,在基因組中的獨特靶序列可以包括形式MMMMMMMMNNNNNNNNNNNNXGG的Cas9靶位點,其中NNNNNNNNNNNNXGG(N係A、G、T、或C;並且X可以是任何物)在該基因組中單次出現。在基因組中的獨特靶序列可以包括形式MMMMMMMMMNNNNNNNNNNNXGG的釀膿鏈球菌Cas9靶位點,其中NNNNNNNNNNNXGG(N係A、G、T、或C;並且X可以是任何物)在該基因組中單次出現。對於嗜熱鏈球菌CRISPR1 Cas9,在基因組中的獨特靶序列可以包括形式MMMMMMMMNNNNNNNNNNNNXXAGAAW的Cas9靶位點,其中NNNNNNNNNNNNXXAGAAW(N係A、G、T、或C;X可以是任何物;並且W係A或T)在該基因組中單次出現。在基因組中的獨特靶序列可以包括形式MMMMMMMMMNNNNNNNNNNNXXAGAAW的嗜熱鏈球菌CRISPR1 Cas9靶位點,其中NNNNNNNNNNNXXAGAAW(N係A、G、T、或C;X可以是任何物;並且W係A或T)在該基因組中單次出現。對於釀膿鏈球菌Cas9,在基因組中的獨特靶序列可以包括形式MMMMMMMMNNNNNNNNNNNNXGGXG的Cas9靶位點,其中NNNNNNNNNNNNXGGXG(N係A、G、T、或C;並且X可以是任何物)在該基因組中單次出現。在基因組中的獨特靶序列可以包括形式MMMMMMMMMNNNNNNNNNNNXGGXG的釀膿鏈球菌Cas9靶位點,其中NNNNNNNNNNNXGGXG(N係A、G、T、或C;並且X可以是 任何物)在該基因組中單次出現。在該等序列的每一個中,“M”可以是A、G、T、或C,並且在序列鑒定中不必考慮為是獨特的。在一些實施方式中,指導序列被選擇為降低在該指導序列內的二級結構程度。在一些實施方式中,在最佳地折疊時,該指導序列的約或少於約75%、50%、40%、30%、25%、20%、15%、10%、5%、1%、或更少的核苷酸參與自我互補鹼基配對。可以藉由任何適合的多核苷酸折疊演算法來確定最佳折疊。一些演算法係基於計算最小吉布斯(Gibbs)自由能。一種這樣的演算法的實例係mFold,正如祖克(Zuker)和施蒂格勒(Stiegler)所描述的(《核酸研究》(Nucleic Acids Res.)9(1981),133-148)。折疊演算法的另一個實例係使用質心結構預測演算法的由維也納大學(University of Vienna)的理論化學研究所(Institute for Theoretical Chemistry)研發的線上網路服務器RNAfold(參見例如,A.R.格魯伯(Gruber)等人,2008,《細胞》(Cell)106(1):23-24;以及PA卡爾(Carr)和GM丘奇(Church),2009,《自然生物技術》(Nature Biotechnology)27(12):1151-62)。
一般而言,tracr配對序列包括與tracr序列具有足夠互補性以促進下列一項或多項的任何序列:(1)側翼於tracr配對序列的指導序列在含有相應的tracr序列的細胞中的切除;和(2)CRISPR複合物在靶序列處的形成,其中該CRISPR複合物包含雜交到該tracr序列上的tracr配對序列。通常,互補程度係就tracr配對序列與tracr序列沿著這兩個序列的較短者的長度的最佳比對而言。可以藉由任何適合的比對演算法來確定最佳比對,並且可以可以進一步對二級結構做出解釋,如在該tracr序列或tracr配對序列之內的自我互補性。在一些實施方式中,在進行最佳比對時, 在該tracr序列與tracr配對序列之間沿著這兩者的較短者的長度的互補程度係約或多於約25%、30%、40%、50%、60%、70%、80%、90%、95%、97.5%、99%、或更高。在一些實施方式中,該tracr序列在長度上為約或多於約5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、40、50個、或更多個核苷酸。在一些實施方式中,該tracr序列和tracr配對序列被包含在單個轉錄物中,使得在這兩者之間的雜交產生具有二級結構(如髮夾)的轉錄物。在本發明的一實施方式中,該轉錄物或轉錄的多核苷酸序列具有至少兩個或更多個髮夾。在較佳的實施方式中,該轉錄物具有兩個、三個、四個或五個髮夾。在本發明的一另外的實施方式中,該轉錄物具有至多五個髮夾。在髮夾結構中,在該環的最終“N”和上游的序列5’的部分對應於該tracr配對序列,並且該環的序列3’的部分對應於該tracr序列。另外的包含指導序列、tracr配對序列、和tracr序列的單個多核苷酸的非限制性實例如下(列出為5’到3’),其中“N”代表指導序列的鹼基,小寫字體的第一區代表tracr配對序列,且小寫字體的第二區代表tracr序列,並且最後的多聚T序列代表轉錄終止子:(1)
Figure 112128864-A0101-12-0176-267
Figure 112128864-A0101-12-0176-266
(SEQ ID NO:X);(2)NNNNNNNNNNNNNNNNNNNNgtttttgtactctcaGAAAtgcagaagctacaaagataaggcttcatgccgaaatcaacaccctgtcattttatggcagggtgttttcgttatttaaTTTTTT(SEQ ID NO:X);(3)NNNNNNNNNNNNNNNNNNNNgtttttgtactctcaGAAAtgcagaagctacaaagataaggcttcatgccgaaatcaacaccctgtcattttatggcagggtgtTTTTTT(SEQ ID NO:X);(4) NNNNNNNNNNNNNNNNNNNNgttttagagctaGAAAtagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcTTTTTT(SEQ ID NO:X);(5)NNNNNNNNNNNNNNNNNNNNgttttagagctaGAAATAGcaagttaaaataaggctagtccgttatcaacttgaaaaagtgTTTTTTT;(SEQ ID NO:X)以及(6)NNNNNNNNNNNNNNNNNNNNgttttagagctagAAATAGcaagttaaaataaggctagtccgttatcaTTTTTTTT(SEQ ID NO:X)。在一些實施方式中,序列(1)到(3)與來自嗜熱鏈球菌CRISPR1的Cas9結合使用。在一些實施方式中,序列(4)到(6)與來自釀膿鏈球菌的Cas9結合使用。在一些實施方式中,該tracr序列係與包含該tracr配對序列的轉錄物分開的轉錄物。
在一些實施方式中,隨後可以藉由滿足下列標準的任一項或全部的序列來預測候選tracrRNA:1.與同向重複同源的序列(在Geneious中搜索的具有高達18-bp錯配的模體);2.在轉錄方向上的預測的不依賴Rho的轉錄終止子的存在;以及3.在tracrRNA與同向重複之間的穩定髮夾二級結構。在一些實施方式中,可以使用該等標準中的2條,例如1和2、2和3、或1和3。在一些實施方式中,可以使用所有這3條標準。
在一些實施方式中,嵌合的合成指導RNA(sgRNA)設計可以在同向重複與tracrRNA之間摻入至少12bp的雙股體結構。
指導Cas(如Cas9)的RNA可以包括CRISPR RNA和反式活化(tracr)RNA。可以將該tracr配對序列和該tracr序列連接以形成反式活化(tracr)序列。該tracr配對序列和該tracr序列可以視情況被設計成形成單個指導RNA(sgRNA)。的確,有利的是指導Cas的RNA可以包括嵌合的單個指導RNA(sgRNA)。在進行最佳比對時,該tracr序列與tracr配 對序列沿著這兩者的較短者的長度可以是約或多於約25%、30%、40%、50%、60%、70%、80%、90%、95%、97.5%、99%、或更高。該tracr序列在長度上可以為約或多於約5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、40、50個、或更多個核苷酸。
在經典CRISPR-Cas系統中,在指導序列與其相應的靶序列之間的互補程度可以是約或多於約50%、60%、75%、80%、85%、90%、95%、97.5%、99%、或100%;指導或RNA或sgRNA在長度上可以為約或多於約5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、75個、或更多個核苷酸;或者指導或RNA或sgRNA在長度上可以為少於約75、50、45、40、35、30、25、20、15、12個、或更少的核苷酸;並且有利地,tracrRNA在長度上為30或50個核苷酸。然而,本發明的一方面在於減少脫靶相互作用,例如減少與具有低互補性的靶序列的相互作用的指導。的確,在該等實例中,顯示本發明涉及突變,該等突變產生能夠將具有大於80%至約95%互補性(例如,83%-84%或88%-89%或94%-95%互補性)的靶序列與脫靶序列區分開(例如,將具有18個核苷酸的靶標與具有1、2或3個錯配的18個核苷酸的脫靶區分開)的CRISPR-Cas系統。因此,在本發明的背景下,在指導序列與其相應的靶序列之間的互補程度大於94.5%或95%或95.5%或96%或96.5%或97%或97.5%或98%或98.5%或99%或99.5%或99.9%,或係100%。脫靶小於100%或99.9%或99.5%或99%或99%或98.5%或98%或97.5%或97%或96.5%或96%或95.5%或95%或94.5%或94%或93%或92%或91%或90%或89%或88%或87%或86%或85%或84%或83% 或82%或81%或80%的該序列與該指導物之間的互補性,其中有利的是脫靶係100%或99.9%或99.5%或99%或99%或98.5%或98%或97.5%或97%或96.5%或96%或95.5%或95%或94.5%的該序列與該指導物之間的互補性。
在根據本發明的特別較佳的實施方式中,該指導RNA(能夠將Cas導向靶座位)可以包含(1)能夠雜交到真核細胞中的基因組靶座位上的指導序列;(2)tracr序列;以及(3)tracr配對序列。所有(1)至(3)可以位於單個RNA(即sgRNA)中(以5’到3’方向排列),或者tracrRNA可以是不同於含有指導序列和tracr序列的RNA的RNA。該tracr雜交到tracr配對序列上並且將CRISPA/Cas複合物引導至靶序列。
如本文描述的根據本發明的方法包括在真核細胞中(在體外,即在分離的真核細胞中)誘導一個或多個如本文討論的突變,包括向細胞遞送如本文討論的載體。這一個或多個突變可以包括經由一種或多種指導、一種或多種RNA或一種或多種sgRNA在一個或多個細胞的每個靶序列處引入、缺失、或取代一個或多個核苷酸。該等突變可以包括經由一種或多種指導、一種或多種RNA或一種或多種sgRNA在所述一個或多個細胞的每個靶序列處引入、缺失、或取代1-75個核苷酸。該等突變可以包括經由一種或多種指導、一種或多種RNA或一種或多種sgRNA在所述一個或多個細胞的每個靶序列處引入、缺失、或取代1、5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、或75個核苷酸。該等突變可以包括經由一種或多種指導、一種或多種RNA或一種或多種sgRNA在所述一個或多個細胞的每個靶序列處引入、缺失、或取代5、10、11、12、13、14、15、 16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、或75個核苷酸。該等突變包括經由一種或多種指導、一種或多種RNA或一種或多種sgRNA在所述一個或多個細胞的每個靶序列處引入、缺失、或取代10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、或75個核苷酸。該等突變可以包括經由一種或多種指導、一種或多種RNA或一種或多種sgRNA在所述一個或多個細胞的每個靶序列處引入、缺失、或取代20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、或75個核苷酸。該等突變可以包括經由一種或多種指導、一種或多種RNA或一種或多種sgRNA在所述一個或多個細胞的每個靶序列處引入、缺失、或取代40、45、50、75、100、200、300、400或500個核苷酸。
為了將毒性和脫靶效應最小化,重要的是控制所遞送的Cas mRNA和指導RNA的濃度。Cas mRNA和指導RNA的最佳濃度可以藉由在細胞或非人類真核生物動物模型中測試不同的濃度並且使用深度定序分析在潛在的脫靶基因組座位處的修飾的範圍而確定。可替代地,為了將毒性水平和脫靶效應最小化,可以用一對靶向感興趣位點的指導RNA來遞送Cas切口酶mRNA(例如,具有D10A突變的釀膿鏈球菌Cas9)。將毒性和脫靶效應最小化的指導序列和策略可以是如在WO 2014/093622(PCT/US 2013/074667)中的;或者,經由如本文的突變。
在一些實施方式中,該CRISPR系統有利地衍生自II型CRISPR系統。在一些實施方式中,CRISPR系統的一種或多種元件來源於包含內源CRISPR系統的特殊生物,如釀膿鏈球菌。在本發明的較佳的 實施方式中,該CRISPR系統係II型CRISPR系統,並且該Cas酶係Cas9,其催化DNA切割。Cas蛋白的非限制性實例包括:Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8,Cas9(也稱為Csn1和Csx12)、Cas10、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4、其同源物、或其修飾形式。較佳的Cas酶可以被鑒定為Cas9,因為這可以是指與來自II型CRISPR系統的具有多個核酸酶結構域的最大核酸酶共用同源性的酶的通用類別。最較佳的是,該Cas9酶來自或衍生自SpCas9或SaCas9。應當理解的是,SpCas9或SaCas9係來自或衍生自釀膿鏈球菌或金黃色葡萄球菌Cas9的那些。所謂衍生,申請人意指該衍生的酶在很大程度上是基於與野生型酶具有高度序列同源性的含義,但是如本文描述的它在某些方面已經被突變(修飾)。應當理解的是,術語Cas和CRISPR酶在本文中通常可互換地使用,除非另外顯而易見的。該Cas酶可以是例如任何天然存在的細菌Cas9以及任何嵌合體、突變體、同源物或異種同源物。本文中使用的許多殘基編號係指來自釀膿鏈球菌中的II型CRISPR座位的Cas9酶(可替代地稱為SpCas9或spCas9)。然而,應當理解的是,本發明包括更多的來自其他微生物物種的Cas9,例如SpCas9的異種同源物,或衍生自除釀膿鏈球菌之外的微生物的Cas9,例如衍生自金黃色葡萄球菌的SaCas9、衍生自嗜熱鏈球菌的St1Cas9等等。熟習該項技術者應能夠藉由比較相關胺基酸序列而確定在除了SpCas9之外的Cas9酶中的適當的相應殘基。因此,在特異性胺基酸置換係指使用SpCas9編號的情況下,那麼,除非上下文清楚說 明,這並不預期係指其他Cas9酶,本揭露預期涵蓋在其他Cas9酶中的相應修飾。
在一些實施方式中,未經修飾的Cas(如Cas9)具有DNA切割活性。在一些實施方式中,該Cas引導在靶序列位置處(例如在該靶序列之內和/或在該靶序列的互補物之內)的一條股或兩條股的切割。在一些實施方式中,該Cas引導距離靶序列的第一個或最後一個核苷酸約1、2、3、4、5、6、7、8、9、10、15、20、25、50、100、200、500個、或更多個鹼基對之內的一條股或兩條股的切割。在一些實施方式中,載體編碼相對於相應的野生型酶被突變的Cas,使得該突變的Cas缺乏切割含有靶序列的靶多核苷酸的一條股或兩條股的能力。例如,在來自釀膿鏈球菌的Cas9的RuvC I催化結構域中的天冬胺酸到丙胺酸取代(D10A)將Cas9從切割兩條股的核酸酶轉化成切口酶(切割單條股)。致使Cas9為切口酶的其他突變實例包括而不限於H840A、N854A、和N863A。作為一另外的實例,Cas9的兩個或更多個催化結構域(RuvC I、RuvC II、和RuvC III或該HNH結構域)可以被突變為產生實質上缺乏所有DNA切割活性的突變的Cas9。在一些實施方式中,D10A突變與H840A、N854A、或N863A突變的一者或多者相組合,以便產生實質上缺乏所有DNA切割活性的Cas9酶。在一些實施方式中,當該突變的酶的DNA切割活性不多於該酶的非突變形式的DNA切割活性的約25%、10%、5%、1%、0.1%、0.01%、或更少時,則Cas被考慮為實質上缺乏所有DNA切割活性;一個實例可以是當突變形式的DNA切割活性與非突變形式相比係零或可忽略不計時。因此,該Cas可以包括一個或多個突變,並且可以用作具有或不具有與功 能結構域融合的通用DNA結合蛋白。該等突變可以是人工引入的突變或獲得性和丟失性功能突變。該等突變可以包括但不限於分別在RuvC和HNH催化結構域中的催化結構域(例如,D10和H840)之一中的突變;或者該CRISPR酶可以包括一個或多個選自下組的突變,該組由以下各項組成:D10A、E762A、H840A、N854A、N863A或D986A,和/或該Cas的RuvC1或HNH結構域中的一個或多個突變,或者具有如本文另外討論的突變。在本發明的一方面,該Cas酶可以融合至蛋白質(例如TAG)、和/或誘導型/控制型結構域(如化學誘導型/控制型結構域)。在本發明中,該Cas可以是嵌合Cas蛋白;例如,由於作為嵌合體而具有增強的功能的Cas。嵌合Cas蛋白可以是含有來自一種以上的天然存在的Cas的片段的新Cas。該等可以包括一種Cas9同源物的一個或多個N-末端片段與另一種Cas同源物的一個或多個C-末端片段的融合。該Cas可以按mRNA的形式遞送到細胞中。Cas的表現可以處於誘導型啟動子的控制之下。在該酶不是SpCas9的情況下,可以在相應於SpCas9的位置10、762、840、854、863和/或986的任何或所有殘基處進行突變(其可以例如藉由標準序列比較工具進行確定)。具體地說,在SpCas9中的任何或所有下列突變係較佳的:D10A、E762A、H840A、N854A、N863A和/或D986A;並且還設想了該等置換胺基酸中的任何的保守性取代。在其他Cas9中的相應位置處的相同取代(或該等突變的保守性取代)也是較佳的。特別較佳的是在SpCas9中的D10和H840。然而,在其他Cas9中,相應於SpCas9 D10和H840的殘基也是較佳的。明確地,避免對已知突變的閱讀係本發明的一個目的。也就係說,在本領域中已知導致Cas9成為切口酶或導致Cas9變得“失活”(例如,與非突變的Cas9相比,具有很少或沒有,例如5%或不到5%, 例如不到4%、3%、2%或1%的核酸酶活性)的突變並不旨在落入減少或消除指導與脫靶核酸分子之間的相互作用的Cas9突變的範圍內,但是申請人保留利用附帶條件來排除這樣的已知的產生“切口酶”-或-“失活”-Cas9的突變的權利。的確,短語“由此與未修飾的酶相比該CRISPR複合物中的酶具有降低的修飾一個或多個脫靶座位的能力和/或由此與未修飾的酶相比該CRISPR複合物中的酶具有增加的修飾一個或多個靶座位的能力”(或類似表述)並不旨在對僅產生失活Cas9的切口酶的突變或已知Cas9突變進行閱讀。然而,這並不是說,本發明的一種或多種修飾或一個或多個突變“由此與未修飾的酶相比該CRISPR複合物中的酶具有降低的修飾一個或多個脫靶座位的能力和/或由此與未修飾的酶相比該CRISPR複合物中的酶具有增加的修飾一個或多個靶座位的能力”(或類似表述)不能與使得該酶成為切口酶或使得該酶失活的突變組合。這樣一種失活酶可以是增強的核酸分子結合物。並且這樣一種切口酶可以是增強的切口酶。例如,將溝槽中的和/或溝槽附近的一個或多個中性胺基酸和/或Cas9中的其他位置中的與核酸(例如,DNA、cDNA、RNA、sgRNA)非常接近的其他帶電的殘基變為一個或多個帶正負的胺基酸可以導致“由此與未修飾的酶相比該CRISPR複合物中的酶具有降低的修飾一個或多個脫靶座位的能力和/或由此與未修飾的酶相比該CRISPR複合物中的酶具有增加的修飾一個或多個靶座位的能力”,例如,更具切割性。因為這既可以是增強的中靶切割又可以是增強的脫靶切割(超級切割Cas9),將其與本領域中稱為tru-指導或tru-sgRNA(參見例如,付(Fu)等人,“使用截短的指導RNA改進CRISPR-Cas核酸酶特異性(Improving CRISPR-Cas nuclease specificity using truncated guide RNAs)”,《自然生 物技術》(Nature Biotechnology)32,279-284(2014)doi:10.1038/nbt.2808收稿於2013年11月17日,接收於2014年1月06日,線上公開於2014年1月26日,線上修正於2014年1月29日)的一起使用,以便具有增強的中靶活性而沒有較高的脫靶切割、或者用於製備超級切割切口酶、或者用於與使得Cas9失活的突變組合為超級結合物。
SpCas9的異種同源物可以用於本發明的實踐中。Cas酶可以被鑒定為Cas9,因為這可以是指與來自II型CRISPR系統的具有多個核酸酶結構域的最大核酸酶共用同源性的酶的通用類別。最較佳的是,該Cas9酶來自或衍生自spCas9(釀膿鏈球菌Cas9)或saCas9(金黃色葡萄球菌Cas9)。“StCas9”係指來自嗜熱鏈球菌的野生型Cas9,其蛋白質序列在登錄號G3ECR1下給出於SwissProt資料庫中。類似地,釀膿鏈球菌Cas9或spCas9在登錄號Q99ZW2下被包括在SwissProt中。關於衍生,申請人意指該衍生的酶在很大程度上是基於與野生型酶具有高度序列同源性的含義,但是如本文所述它在某些方面已經被突變(修飾)。應當理解的是,術語Cas和CRISPR酶在本文中通常可互換地使用,除非另外說明。如上提及的,在本文中使用的許多殘基編號係指來自釀膿鏈球菌中的II型CRISPR座位的Cas9酶。然而,應當理解的是,本發明包括更多的來自其他微生物物種的Cas9s,如SpCas9、SaCa9、St1Cas9等等。藉由來源於釀膿鏈球菌或Cas9或任何密切相關的Cas9的酶促作用,產生了在靶位點序列處的雙股斷裂,所述靶位點序列雜交到該指導序列的20個核苷酸上並.且具有在該靶序列的20個核苷酸之後的原型間隔子相鄰模體(PAM)序列(實例包括NGG/NRG或可以如本文所述進行確定的PAM)。經由Cas9 的對於位點特異性DNA識別和切割的CRISPR活性係由該指導序列、部分雜交到該指導序列上的tracr序列以及該PAM序列定義的。不希望被理論所束縛,據信該靶序列應該與PAM(原型間隔子鄰近模體)相關;也就係說,與由CRISPR複合物識別的短序列相關。對PAM的精確序列和長度要求取決於使用的Cas而不同,但是PAM典型地是臨近原型間隔子(也就係說,靶序列)的2-5個鹼基對序列。在一些實施方式中,該方法包括允許CRISPR複合物結合到該靶多核苷酸上以實施所述靶多核苷酸的切割,由此修飾該靶多核苷酸,其中該CRISPR複合物包含與雜交到在所述靶多核苷酸內的靶序列上的指導序列複合的Cas,其中所述指導序列連接到tracr配對序列上,該tracr配對序列進而雜交到tracr序列上。該CRISPR系統的更多方面在卡吉諾夫(Karginov)和漢農(Hannon)的“CRISPR系統:在細菌和古細菌中的小RNA指導的防禦”(The CRISPR system:small RNA-guided defence in bacteria and archaea),《分子細胞學雜誌》(Mole Cell)2010年1月15日;37(1):7中。II型CRISPR座位來自釀膿鏈球菌SF370,該座位含有四個基因Cas9、Cas1、Cas2和Csn1的聚簇以及兩個非編碼RNA元件tracrRNA和由非重複序列的短段(間隔子,每個約30bp)間隔開的重複序列(同向重複)的特徵性陣列。在此系統中,以四個連續步驟產生靶向的DNA雙股斷裂(DSB)。第一步,從CRISPR座位轉錄兩個非編碼RNA前-crRNA陣列和tracrRNA。第二步,將tracrRNA雜交到前-crRNA的同向重複上,然後將其加工成含有單獨的間隔子序列的成熟crRNA。第三步,該成熟crRNA:tracrRNA複合物經由在crRNA的間隔子區與原型間隔子DNA之間形成異源雙股體而引導Cas到由原型間隔子和對應的PAM組成的DNA靶標。最後,Cas介導PAM上游的靶DNA的切割, 以在原型間隔子內產生DSB。由單個間隔子組成的前-crRNA陣列,該單個間隔子側翼為兩個同向重複(DR,還被術語“tracr配對序列”所涵蓋)。在某些實施方式中,Cas可以組成性地存在或誘導性地存在或條件性地存在或給予或遞送。Cas優化可以用來增強功能或者用來開發新的功能,可以產生嵌合Cas蛋白。並且Cas可以用作通用的DNA結合蛋白。
典型地,在內源CRISPR系統的背景下,CRISPR複合物(包含雜交到靶序列上並且與一種或多種Cas蛋白複合的指導序列)的形成導致在該靶序列中或其附近(例如在1、2、3、4、5、6、7、8、9、10、20、50、或更多個鹼基對之內)的一條股或兩條股的切割。不希望受到理論的束縛,該tracr序列(其可以包含或其組成為野生型tracr序列的全部或部分(例如野生型tracr序列的約或多於約20、26、32、45、48、54、63、67、85個、或更多個核苷酸))也可以形成CRISPR複合物的一部分,如藉由沿著該tracr序列的至少一部分雜交到與該指導序列可操作地連接的tracr配對序列的全部或部分上。
在本揭露中,術語“Cas”可以意指“Cas9”或CRISPR酶。在本發明的背景下,Cas9或Cas或CRISPR酶被突變或修飾,“由此與未修飾的酶相比該CRISPR複合物中的酶具有降低的修飾一個或多個脫靶座位的能力”(或類似表述);並且,當閱讀本說明書時,術語“Cas9”或“Cas”或“CRISPR酶”等意在包括根據本發明的經突變或經修飾的Cas9或Cas或CRISPR酶,即“由此與未修飾的酶相比該CRISPR複合物中的酶具有降低的修飾一個或多個脫靶座位的能力”(或類似表述)。
用於表現Cas蛋白的密碼子優化和密碼子使用
編碼Cas的核酸分子有利地是經密碼子優化的Cas。密碼子優化序列的一實例在這種情形下是針對在真核生物(例如,人類)中表現(即,針對在人類中表現進行優化)或針對如本文討論的另一種真核生物、動物或哺乳動物進行優化的序列;參見,例如,WO 2014/093622(PCT/US 2013/074667)中的SaCas9人類密碼子優化序列。雖然這係較佳的,但是應當理解的是,其他實例也是可能的,並且針對除人類之外的宿主物種的密碼子優化或針對具體器官的密碼子優化係已知的。在一些實施方式中,編碼Cas的酶編碼序列經密碼子優化,以便在特定的細胞(如真核細胞)中表現。該等真核細胞可以是特定生物的那些或來源於特定生物,如哺乳動物,包括但不限於人、或如本文討論的非人類真核生物或動物或哺乳動物,例如,小鼠、大鼠、兔、狗、牲畜、或非人類哺乳動物或靈長類動物。在一些實施方式中,對於人類或動物而言很可能使得他們(它們)受苦而沒有任何實質性醫學益處的用於修飾人類的種系遺傳同一性的方法和/或用於修飾動物的遺傳同一性的方法、以及還有作為這樣的方法的結果的動物,可以被排除在外。一般而言,密碼子優化係指藉由用在宿主細胞的基因中更頻繁地或者最頻繁地使用的密碼子代替天然序列的至少一個密碼子(例如約或多於約1、2、3、4、5、10、15、20、25、50個、或更多個密碼子同時維持該天然胺基酸序列而修飾核酸序列以便增強在感興趣宿主細胞中的表現之方法。不同的物種對於具有特定胺基酸的某些密碼子展示出特定的偏好。密碼子偏好性(在生物之間的密碼子使用的差異)經常與信使RNA(mRNA)的翻譯效率相 關,而該翻譯效率則被認為依賴於(除其他之外)被翻譯的密碼子的性質和特定的轉運RNA(tRNA)分子的可用性。細胞內選定的tRNA的優勢一般反映了最頻繁用於肽合成的密碼子。因此,可以將基因定制為基於密碼子優化在給定生物中的最佳基因表現。密碼子利用率表可以容易地獲得,例如在www.kazusa.orjp/codon/上可獲得的密碼子使用資料庫(“Codon Usage Database”)中,並且該等表可以藉由不同的方式調整適用。參見,中村(Nakamura)Y.等人,“從國際DNA序列資料庫中製表的密碼子使用:2000年的狀態(Codon usage tabulated from the international DNA sequence databases:status for the year 2000)”《核酸研究》(Nucl.Acids Res.)28:292(2000)。用於密碼子優化特定的序列以便在特定的宿主細胞中表現的電腦演算法也是可得的,如基因製造(Gene Forge)(Aptagen公司;雅各斯(Jacobus),賓夕法尼亞州),也是可得的。在一些實施方式中,在編碼Cas的序列中的一個或多個密碼子(例如1、2、3、4、5、10、15、20、25、50個、或更多個、或所有密碼子)對應於對於特定胺基酸最頻繁使用的密碼子。
在某些實施方式中,如本文描述的方法可以包括提供Cas轉基因細胞,在其中編碼一種或多種指導RNA的一個或多個核酸被提供或被引人,在該細胞中與包含一個或多個感興趣基因的啟動子的調節元件可操作地連接。如本文使用的,術語“Cas轉基因細胞”係指其中已經基因組整合了Cas基因的細胞,如真核細胞。根據本發明,該細胞的性質、類型、或來源不是特別受限的。而且,該Cas轉基因被引入該細胞中的方式可以變化並且可以是如本領域中已知的任何方法。在某些實施方式 中,藉由將該Cas轉基因引入分離的細胞中來獲得該Cas轉基因細胞。在某些其他實施方式中,藉由從Cas轉基因生物中分離細胞來獲得該Cas轉基因細胞。藉由舉例的方式並且不受限,如本文提及的Cas轉基因細胞可以來源於Cas轉基因真核生物(如Cas敲入真核生物)。參考藉由引用併入本文的WO 2014/093622(PCT/US13/74667)。可以修飾針對靶向Rosa座位的、轉讓給桑加莫生物科學公司(Sangamo BioSciences,Inc.)的美國專利公開案號20120017290和20110265198之方法,以便利用本發明的CRISPR Cas系統。也可以修飾針對靶向Rosa座位的、轉讓給Cellectis公司的美國專利公開案號20130236946之方法,以便利用本發明的CRISPR Cas系統。藉由進一步舉例的方式,參考普萊特(Platt)等人(《細胞》((Cell);159(2):440-455(2014)),描述了Cas9敲入小鼠,將其藉由引用併入本文。該Cas轉基因可以進一步包括Lox-Stop-polyA-Lox(LSL)盒,由此賦予可藉由Cre重組酶誘導的Cas表現。可替代地,可以藉由將該Cas轉基因引入分離的細胞中來獲得該Cas轉基因細胞。轉基因的遞送系統在本領域係熟知的。藉由舉例的方式,該Cas轉基因可以借助載體(例如,AAV、腺病毒、慢病毒)和/或粒子和/或奈米粒子遞送而被遞送到例如真核細胞中,還如在本文的其他地方所描述的。
熟習該項技術者應理解的是,如本文提及的細胞(如Cas轉基因細胞)除了具有整合的Cas基因之外還可以包括另外的基因組改變、或當與能夠將Cas導向靶座位的RNA複合時由Cas的序列特異性作用產生的突變,例如像一個或多個致癌突變,例如像但不限於描述於普萊特(Platt)等人(2014)、陳(Chen)等人(2014)或庫馬爾(Kumar)等 人(2009)中的。
具有一個或多個NLS的Cas蛋白
在一些實施方式中,該Cas序列融合至一個或多個核定位序列(NLS),如約或多於約1、2、3、4、5、6、7、8、9、10個、或更多個NLS。在一些實施方式中,該Cas包括在或接近於胺基-末端的約或多於約1、2、3、4、5、6、7、8、9、10個、或更多個NLS,在或接近於接基-末端約或多於約1、2、3、4、5、6、7、8、9、10個、或更多個NLS,或該等的組合(例如在胺基-末端的零個或至少一個或多個NLS以及在羧基-末端的零個或至少一個或多個NLS)。當存在多於一個NLS時,每一個可以被選擇為不依賴於其他NLS,使得在多於一個拷貝中可以存在單個NLS和/或與在一個或多個拷貝中存在一個或多個其他NLS相組合。在本發明的一個較佳的實施方式中,該Cas包括至多6個NLS。在一些實施方式中,當NLS的最近的胺基酸係在從N-末端或C-末端沿著該多肽鏈的約1、2、3、4、5、10、15、20、25、30、40、50個、或更多個胺基酸之內時,NLS可以被視為接近該N-末端或C-末端。NLS的非限制性實例包括來源於以下項的NLS序列:SV40病毒大T抗原的NLS,其具有胺基酸序列PKKKRKV(SEQ ID NO:X);來自核質蛋白的NLS(例如,具有序列KRPAATKKAGQAKKKK的核質蛋白二分NLS)(SEQ ID NO:X);c-myc NLS,其具有胺基酸序列PAAKRVKLD(SEQ ID NO:X)或RQRRNELKRSP(SEQ ID NO:X);hRNPA1 M9 NLS,其具有序列NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(SEQ ID NO:X);來自輸入蛋白-α的IBB結構域的序列 RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(SEQ ID NO:X);肌瘤T蛋白的序列VSRKRPRP(SEQ ID NO:X)和PPKKARED(SEQ ID NO:X);人p53的序列POPKKKPL(SEQ ID NO:X);小鼠c-abl IV的序列SALIKKKKKMAP(SEQ ID NO:X);流感病毒NS1的序列DRLRR(SEQ ID NO:X)和PKQKKRK(SEQ ID NO:X);肝炎病毒δ抗原的序列RKLKKKIKKL(SEQ ID NO:X);小鼠Mx1蛋白的序列REKKKFLKRR(SEQ ID NO:X);人聚(ADP-核糖)聚合酶的序列KRKGDEVDGVDEVAKKKSKK(SEQ ID NO:X);以及類固醇激素受體(人)糖皮質激素的序列RKCLQAGMNLEARKTKK(SEQ ID NO:X)。一般而言,這一個或多個NLS具有足夠的強度,以便在真核細胞的細胞核中驅動該Cas以可檢測的量積聚。一般而言,核定位活性的強度可以由在該Cas中的NLS的數目、所使用的一個或多個特定的NLS、或該等因素的組合匯出。可以藉由任何適合的技術進行細胞核中積聚的檢測。例如,檢測標記可以融合到該Cas上,使得細胞內的位置可以被視覺化,如與檢測細胞核的位置的手段(例如,對於細胞核特異的染料,如DAPI)相結合。還可以將細胞核從細胞中分離出來,然後可以藉由任何適合的用於檢測蛋白質的方法分析其內容物,如免疫組織化學、西方墨點或酶活性測定。如藉由測定CRISPR複合物形成的作用(例如,測定在靶序列處的DNA切割或突變、或測定由於CRISPR複合物形成和/或Cas酶活性的影響而改變的基因表現活性),與沒有暴露於該Cas或複合物、或暴露於缺乏這一個或多個NLS的Cas的對照相比較,還可以間接地確定細胞核中的積聚。在一些實施方式中,不存在添加至或融合至該Cas蛋白的NLS。
CRISPR系統的遞送
根據本揭露和本領域的知識,可以藉由在本文一般性地和詳細地描述的遞送系統來遞送CRISPR-Cas系統(確切地說係本文描述的新穎的CRISPR系統)、或其組分或其核酸分子(包括,例如HDR模板)或編碼或提供其組分的核酸分子。
關於載體的一般資訊
通常,並且貫穿本說明書,術語“載體”係指一種核酸分子,它能夠運送與其連接的另一種核酸分子。載體包括但不限於,單股、雙股、或部分雙股的核酸分子;包括一個或多個自由端、無自由端(例如,環狀的)的核酸分子;包括DNA、RNA、或兩者的核酸分子;以及本領域已知的其他多種多樣的多核苷酸。一種類型的載體係“質粒”,其係指其中可以例如藉由標準分子選殖技術插入另外的DNA片段的環狀雙股DNA環。另一種類型的載體係病毒載體,其中病毒衍生的DNA或RNA序列存在於用於包裝進病毒(例如,逆轉錄病毒、複製缺陷型逆轉錄病毒、腺病毒、複製缺陷型腺病毒、以及腺相關病毒)的載體中。病毒載體還包含由用於轉染到宿主細胞中的病毒攜帶的多核苷酸。某些載體(例如,具有細菌複製起點的細菌載體和附加型哺乳動物載體)能夠在它們被導入的宿主細胞中自主複製。其他載體(例如,非附加型哺乳動物載體)在引入宿主細胞後整合到該宿主細胞的基因組中,並且由此與該宿主基因組一起複製。而且,某些載體能夠指導它們可操作連接的基因的表現。這樣的載體在此被稱為“表現載體”。用於在真核細胞中表現並且導致在真核細胞中表現的載體在本文可以被稱為“真核表現載體”。 在重組DNA技術中使用的普通表現栽體通常是質粒形式。
重組表現載體可包含處於適合於在宿主細胞中的核酸表現的形式的本發明的核酸,這意味著該等重組表現載體包含基於待用於表現的宿主細胞而選擇的一種或多種調節元件,所述調節元件可操作地連接至待表現的核酸序列。在重組表現載體內,“可操作地連接”旨在表示感興趣的核苷酸序列以允許該核苷酸序列的表現的方式被連接至這一種或多種調節元件(例如,處於體外轉錄/翻譯系統中或當該載體被引入宿主細胞中時,處於該宿主細胞中)。
術語“調節元件”旨在包括啟動子、增強子、內部核糖體進入位點(IRES)、以及其他表現控制元件(例如,轉錄終止信號,如多聚腺苷酸化信號和多聚U序列)。這樣的調節序列例如描述於戈德爾(Goeddel),《基因表現技術:酶學方法》(GENE EXPRESSION TECHNOLOGY:METHODS IN ENZYMOLOGY)185,學術出版社(Academic Press),聖地牙哥(San Diego),加利福尼亞州(1990)中。調節元件包括指導一個核苷酸序列在許多類型的宿主細胞中的組成型表現的那些序列以及指導該核苷酸序列只在某些宿主細胞中表現的那些序列(例如,組織特異型調節序列)。組織特異性啟動子可主要引導在感興趣的期望組織中的表現,所述組織例如肌肉、神經元、骨、皮膚、血液、特定的器官(例如,肝、胰腺)、或特殊的細胞類型(例如,淋巴細胞)。調節元件還可以時序依賴性方式(如以細胞週期依賴性或發育階段依賴性方式)指導表現,該方式可以是或者可以不是組織或細胞類型特異性的。在一些實施方式中,載體包括一個或多個pol III啟動子(例如,1、2、 3、4、5個、或更多個pol III啟動子)、一個或多個pol II啟動子(例如,1、2、3、4、5個、或更多個pol II啟動子)、一個或多個pol I啟動子(例如,1、2、3、4、5個、或更多個pol I啟動子)、或其組合。pol III啟動子的實例包括但不限於U6和H1啟動子。pol II啟動子的實例包括但不限於逆轉錄勞斯肉瘤病毒(RSV)LTR啟動子(視情況具有RSV增強子)、巨細胞病毒(CMV)啟動子(視情況具有CMV增強子)[參見,例如,波沙特(Boshaft)等人,《細胞》(Cell)41:521-530(1985)]、SV40啟動子、二氫葉酸還原酶啟動子、β-肌動蛋白啟動子、磷酸甘油激酶(PGK)啟動子、和EF1α啟動子。還被術語“調節元件”涵蓋的是增強子元件,如WPRE;CMV增強子;在HTLV-I的LTR中的R-U5’片段(《分子細胞生物學》(Mol.Cell.Biol.),第8(1)卷,第466-472頁,1988);SV40增強子;以及在兔β-珠蛋白的外顯子2與3之間的內含子序列(《美國國家科學院院刊》(Proc.Natl.Acad.Sci.USA.),第78(3)卷,第1527-31頁,1981)。熟習該項技術者應當理解的是,表現載體的設計可取決於比如待轉化的宿主細胞的選擇、所希望的表現水平等因素。載體可以被引入到宿主細胞中而由此產生轉錄物、蛋白質、或肽,包括由如本文描述的核酸編碼的融合蛋白或肽(例如,規律間隔成簇短迴文重複(CRISPR)轉錄物、蛋白質、酶、其突變體形式、其融合蛋白等)。
有利的載體包括慢病毒以及腺相關病毒,並且也可選擇此類型的載體以靶向具體類型的細胞。
在一些實施方式中,將驅動靶向核酸的系統的一個或多個元件的表現的一種或多種載體引入宿主細胞中,使得靶向核酸的該系統 的該等元件的表現在一個或多個靶位點引導靶向核酸的複合物的形成。例如,靶向核酸的效應酶和靶向核酸的指導RNA可以各自可操作地連接到分開的載體上的分開的調節元件上。可以將靶向核酸的該系統的一種或多種RNA遞送到轉基因的靶向核酸的效應蛋白的動物或哺乳動物,例如組成性地或誘導性地或條件性地表現靶向核酸的效應蛋白的動物或哺乳動物;或以其他方式表現靶向核酸的效應蛋白或具有含有靶向核酸的效應蛋白的細胞的動物或哺乳動物,如藉由向其先前給予編碼並且在體內表現靶向核酸的效應蛋白的一種或多種載體的方式。可替代地,從相同或不同調節元件表現的兩個或更多個元件可以結合在單個載體中,其中提供靶向核酸的該系統的任何組分的一種或多種另外的載體不包括在該第一載體中。結合在單個載體中的靶向核酸的系統元件可以按照任何適合的方向排列,如一個元件相對於第二元件位於5'(“上游”)或3'(“下游”)。一個元件的編碼序列可以位於第二元件的編碼序列的同一條股或相對股上,並且取向為相同或相對的方向。在一些實施方式中,單個啟動子驅動編碼靶向核酸的效應蛋白的轉錄物以及嵌入在一個或多個內含子序列之內(例如,各自在不同的內含子中、兩個或更多個在至少一個內含子中、或全部在單個內含子中)的靶向核酸的指導RNA的表現。在一些實施方式中,靶向核酸的該效應蛋白和靶向核酸的該指導RNA可以可操作地連接至同一啟動子並且從其中表現。用於表現靶向核酸的系統的一個或多個元件的遞送運載體、載體、粒子、奈米粒子、配製物及其組分係如在前述文獻(如WO 2014/093622(PCT/US 2013/074667))中使用的。在一些實施方式中,載體包括一個或多個插入位點,如限制性內切核酸酶識別序列(也稱為“選殖位點”)。在一些實施方式中,一個或 多個插入位點(例如,約或多於約1、2、3、4、5、6、7、8、9、10個、或更多個插入位點)位於一種或多種載體的一個或多個序列元件的上游和/或下游。在一些實施方式中,載體包括在tracr配對序列的上游,並且視情況在可操作地連接到該tracr配對序列上的調節元件的下游的插入位點,使得在將指導序列插入到該插入位點中之後並且在表現時,該指導序列引導靶向核酸的複合物與真核細胞中的靶序列的序列特異性結合。在一些實施方式中,載體包括兩個或更多個插入位點,從而允許在每個位點插入指導序列。在這樣一種安排中,兩個或更多個指導序列可以包含單個指導序列的兩個或更多個拷貝、兩個或更多個不同的指導序列、或該等的組合。當使用多個不同的指導序列時,可以使用單個表現構建體使靶向核酸的活性靶向到細胞內的多個不同的相應靶序列。例如,單個載體可以包括約或多於約1、2、3、4、5、6、7、8、9、10、15、20個、或更多個指導序列。在一些實施方式中,可以提供約或多於約1、2、3、4、5、6、7、8、9、10個、或更多種這樣的含有靶序列的載體,並且視情況將其遞送到細胞中。在一些實施方式中,載體包括可操作地連接到編碼靶向核酸的效應蛋白的酶編碼序列上的調節元件。靶向核酸的效應蛋白或靶向核酸的指導RNA或一種或多種RNA可以分開地遞送;並且有利地,該等中的至少一者經由粒子或奈米粒子複合物遞送。靶向核酸的效應蛋白mRNA可以在靶向核酸的指導RNA之前遞送,以給靶向核酸的效應蛋白的表現留出時間。可以在給予靶向核酸的指導RNA之前1-12小時(較佳的是約2-6小時)給予靶向核酸的效應蛋白mRNA。可替代地,可以一起給予靶向核酸的效應蛋白mRNA和靶向核酸的指導RNA。有利地,可以在初始給予靶向核酸的效應蛋白mRNA+指導RNA之後1-12小 時(較佳的是約2-6小時)給予指導RNA的第二加強劑量。為了實現基因組修飾的最有效水平,另外給予靶向核酸的效應蛋白mRNA和/或指導RNA可以是有用的。
關於載體遞送的一般資訊
在某些方面,本發明涉及載體,該等載體例如用於將Cas和/或能夠將Cas導向靶座位的RNA(即指導RNA)遞送或引入細胞中,而且還用於繁殖該等組分(例如在原核細胞中)。如本文使用的,“載體”係允許或促進一個實體從一個環境轉移到另一個環境中的工具。它係複製子,如質粒、噬菌體、或粘粒,另一個DNA片段可以插入其中,從而引起該插入的片段的複製。通常,當與適當的控制元件關聯時,載體能夠複製。一般而言,術語“載體”係指一種核酸分子,其能夠運送與其連接的另一種核酸分子。載體包括但不限於,單股、雙股、或部分雙股的核酸分子;包括一個或多個自由端、無自由端(例如環狀的)的核酸分子;包括DNA、RNA、或兩者的核酸分子;以及本領域已知的其他多種多樣的多核苷酸。一種類型的載體係“質粒”,其係指其中可以例如藉由標準分子選殖技術插入另外的DNA片段的環狀雙股DNA環。另一種類型的載體係病毒載體,其中病毒衍生的DNA或RNA序列存在於用於包裝病毒(例如,逆轉錄病毒、複製缺陷型逆轉錄病毒、腺病毒、複製缺陷型腺病毒、以及腺相關病毒(AAV))的載體中。病毒載體還包含由用於轉染到宿主細胞中的病毒攜帶的多核苷酸。某些載體(例如,具有細菌複製起點的細菌載體和附加型哺乳動物載體)能夠在它們被導入的宿主細胞中自主複製。其他載體(例如,非附加型哺乳動物載體)在引入 宿主細胞後整合到該宿主細胞的基因組中,並且由此與該宿主基因組一起複製。而且,某些載體能夠指導它們可操作連接的基因的表現。這樣的載體在此被稱為“表現載體”。在重組DNA技術中使用的普通表現栽體通常是質粒形式。
重組表現載體可包含處於適合於在宿主細胞中的核酸表現的形式的本發明的核酸,這意味著該等重組表現載體包含基於待用於表現的宿主細胞而選擇的一種或多種調節元件,所述調節元件可操作地連接至待表現的核酸序列。在重組表現載體內,“可操作地連接”旨在表示感興趣的核苷酸序列以允許該核苷酸序列的表現的方式被連接至該一種或多種調節元件(例如,處於體外轉錄/翻譯系統中或當該載體被引入到宿主細胞中時,處於該宿主細胞中)。關於重組和選殖方法,提及2004年9月2日以US 2004-0171156 A1公開的美國專利申請10/815,730,該專利的內容藉由引用以其全文併入本文。
這一種或多種載體可以包括一種或多種調節元件,例如一種或多種啟動子。這一種或多種載體可以包括Cas編碼序列,和/或單個指導RNA編碼序列,但是可能地,還可以包括至少3或8或16或32或48或50個指導RNA(例如,sgRNA)編碼序列,如1-2、1-3、1-4、1-5、3-6、3-7、3-8、3-9、3-10、3-8、3-16、3-30、3-32、3-48、3-50種RNA(例如,sgRNA)。在單個載體中,有利地當存在高達約16種RNA(例如,sgRNA)時,可以存在啟動子針對每種RNA(例如,sgRNA);並且,當單個載體提供多於16種RNA(例如,sgRNA)時,一種或多種啟動子可以驅動這一種或多種RNA(例如,sgRNA)中的多於一種的表現,例如當存在32種RNA (例如,sgRNA),每種啟動子都可以驅動兩種RNA(例如,sgRNA)的表現,並且當存在48種RNA(例如,sgRNA)時,每種啟動子都可以驅動三種RNA(例如,sgRNA)的表現。藉由簡單的算術以及良好建立的選殖方案和本揭露的傳授,熟習該項技術者可以容易地就一種或多種RNA(例如,適合的示例性載體如AAV的一種或多種sgRNA,和適合的啟動子如U6啟動子,例如U6-sgRNA)而言實踐本發明。例如,AAV的包裝極限係約4.7kb。單個U6-sgRNA(加選殖用的限制酶切位點)的長度係361bp。因此,熟習該項技術者可以容易地將約12-16個(例如,13個)U6-sgRNA盒裝配進單個載體中。這可以藉由任何合適的手段進行組裝,如用於TALE組裝的金門(golden gate)策略(http://www.genome-engineering.org/taleffectors/)。熟習該項技術者還可以使用串聯指導策略將U6-sgRNA的數目增加大約1.5倍,例如從12-16個(例如,13個)增加到大約18-24個(例如,約19個)U6-sgRNA。因此,熟習該項技術者可以在單個載體(例如,AAV載體)中容易地達到大約18-24個(例如,約19個)啟動子-RNA(例如,U6-sgRNA)。用於增加載體中的啟動子和RNA(例如,一種或多種sgRNA)的數目的另一種手段係使用單個啟動子(例如,U6)來表現一系列由可切割的序列隔開的RNA(例如,sgRNA)。並且用於增加載體中的啟動子-RNA(例如,sgRNA)的數目的又另一種手段係在編碼序列或基因的內含子中表現一系列由可切割的序列隔開的啟動子-RNA(例如,sgRNA);並且,在這種情況下,有利的是使用聚合酶II啟動子,它可以具有增加的表現並且按組織特異性方式使得長RNA能夠轉錄。(參見例如,http://nar.oxfordjournals.org/content/34/7/e53.short, http://www.nature.com/mt/journal/v16/n9/abs/mt2008144a.html)。在一有利的實施方式中,AAV可以包裝靶向高達約50個基因的U6串聯sgRNA。因此,根據本領域的知識以及本揭露的傳授,熟習該項技術者可以容易地製備和使用一種或多種載體(例如,單個載體),這一種或多種載體在操作性地或功能性地連接的一種或多種啟動子的控制下表現多種RNA或指導或sgRNA-一尤其是就本文討論的RNA或指導物或sgRNA的數目而言,而無需進行任何過度的實驗。
這一種或多種指導RNA(例如,一種或多種sgRNA)的編碼序列和/或Cas編碼序列可以功能性地或操作性地連接至一種或多種調節元件並且因此這一種或多種調節元件驅動表現。這一種或多種啟動子可以是一種或多種組成型啟動子和/或一種或多種條件型啟動子和/或一種或多種誘導型啟動子和/或一種或多種組織特異性啟動子。該啟動子可以選自由以下各項組成之群組:RNA聚合酶、pol I、pol II、pol III、T7、U6、H1、逆轉錄勞斯肉瘤病毒(RSV)LTR啟動子、巨細胞病毒(CMV)啟動子、SV40啟動子、二氫葉酸還原酶啟動子、β-肌動蛋白啟動子、磷酸甘油激酶(PGK)啟動子、以及EF1α啟動子。一有利的啟動子係啟動子U6。
載體遞送
載體遞送,例如質粒、病毒遞送:該CRISPR酶,例如Cas9,和/或本發明的任何RNA,例如指導RNA,可以使用任何適合載體,例如,質粒或病毒載體,如腺相關病毒(AAV)、慢病毒、腺病毒或其他病毒載體類型、或其組合進行遞送。Cas9以及一種或多種指導RNA可以被包裝 到一種或多種載體(例如,質粒或病毒載體)中。在一些實施方式中,病毒(例如,質粒或病毒載體)可以例如藉由肌肉注射遞送到感興趣的組織中,而有時經由靜脈內、經皮、鼻內、經口、粘膜、或其他遞送方法進行遞送。這樣的遞送可以經由單劑量或多劑量來進行。熟習該項技術者理解的是,本文有待遞送的實際劑量可以在很大程度上取決於多種因素而變化,如載體選擇、靶細胞、生物、或組織、有待治療的受試者的一般狀況、所尋求的轉化/修飾的程度、給藥途徑、給藥方式、所尋求的轉化/修飾的類型,等等。
這樣的劑量可以進一步含有,例如,載體(水、鹽水、乙醇、甘油、乳糖、蔗糖、磷酸鈣、明膠、葡聚糖、瓊脂、果膠、花生油、芝麻油,等等)、稀釋劑、藥學上可接受的載體(例如,磷酸鹽緩衝鹽水)、藥學上可接受的賦形劑、和/或本領域已知的其他化合物。該劑型可以進一步含有一種或多種藥學上可接受的鹽,例如像,無機酸鹽如鹽酸鹽、氫溴酸鹽、磷酸鹽、硫酸鹽、等等;以及有機酸鹽,如乙酸鹽、丙酸鹽、丙二酸鹽、苯甲酸鹽等等。另外,在本文也可以存在輔助物質,如潤濕劑或乳化劑、pH緩衝物質、凝膠或膠凝材料、調味劑、著色劑、微球體、聚合物、懸浮劑等等。另外,也可以存在一種或多種其他常規藥用成分,如防腐劑、保濕劑、懸浮劑、表面活性劑、抗氧化劑、抗結劑、填充劑、螯合劑、包衣劑、化學穩定劑等等,尤其是該劑型係可復原形式時。適合的示例性成分包括微晶纖維素、羧甲基纖維素鈉、聚山梨酯80、苯乙醇、三氯三級丁醇、山梨酸鉀、抗壞血酸、二氧化硫、沒食子酸丙酯、對羥基苯甲酸酯、乙基香蘭素、甘油、苯酚、對氯酚、明膠、白蛋白和 它們的組合。藥學上可接受的賦形劑的徹底論述可獲自《雷明頓藥物科學》(REMINGTON'S PHARMACEUTICAL SCIENCES)(馬克出版公司,紐約,1991),藉由引用將其併入本文。
在本文的一實施方式中,遞送係經由腺病毒進行的,其可以是含有至少1 x 105個腺病毒載體粒子(也稱為粒子單位,pu)的單次加強劑量。在本文的一實施方式中,該劑量較佳的是係該腺病毒載體的至少約1 x 106個粒子(例如,約1 x 106-1 x 1012個粒子),更較佳的是至少約1 x 107個粒子,更較佳的是至少約1 x 108個粒子(例如,約1 x 108-1 x 1011個粒子或約1 x 108-1 x 1012個粒子),並且最較佳的是至少約1 x 100個粒子(例如,約1 x 109-1 x 1010個粒子或約1 x 109-1 x 1012個粒子),或者甚至至少約1 x 1010個粒子(例如,約1 x 1010-1 x 1012個粒子)。可替代地,該劑量包含不多於約1 x 1014個粒子,較佳的是不多於約1 x 1013個粒子,甚至更較佳的是不多於約1 x 1012個粒子,甚至更較佳的是不多於約1 x 1011個粒子,並且最較佳的是不多於約1 x 1010個粒子(例如,不多於約1 x 109個粒子)。因此,該劑量可以含有單劑量的腺病毒載體,其具有例如,約1 x 106粒子單位(pu),約2 x 106pu、約4 x 106pu、約1 x 107pu、約2 x 107pu、約4 x 107pu、約1 x 108pu、約2 x 108pu、約4 x 108pu、約1 x 109pu、約2 x 109pu、約4 x 109pu、約1 x 1010pu、約2 x 1010pu、約4 x 1010pu、約1 x 1011pu、約2 x 1011pu、約4 x 1011pu、約1 x 1012pu、約2 x 1012pu、或約4 x 1012pu的腺病毒載體。參見例如,在2013年6月4日授權的授予納貝爾(Nabel)等人的美國專利案號8,454,972 B2中的腺病毒載體(藉由引用併入本文)以及在其第29欄第36-58行的劑型。在本文的一個實施方式 中,該腺病毒係經由多劑量遞送的。
在本文的一實施方式中,該遞送係經由AAV進行的。用於針對人類的AAV的體內遞送的治療有效劑量被認為處於含有從約1 x 1010到約1 x 1010個功能AAV/ml溶液的從約20到約50ml的鹽水溶液的範圍內。該劑量可以調整以便使治療益處相對於任何副作用的平衡。在本文的一實施方式中,AAV劑量大致處於從約1 x 105到1 x 1050個基因組AAV、從約1 x 108到1 x 1020個基因組AAV、從約1 x 1010到約1 x 1016個基因組、或約1 x 1011到約1 x 1016個基因組AAV的濃度範圍內。人類劑量可以是約1 x 1013個基因組AAV。這樣的濃度能以從約0.001ml到約100ml、約0.05到約50ml、或約10到約25ml的載體溶液進行遞送。藉由建立劑量反應曲線的常規試驗,熟習該項技術者可以容易地確立其他有效劑量。參見,例如,2013年3月26日授權的授予哈加(Hajjar)等人的美國專利案號8,404,658 B2,在第27欄第45-60行。
一般包裝和啟動子
介導體內基因組修飾的、將Cas9編碼核酸分子例如DNA包裝到載體,例如,病毒載體中的方式包括:
為了實現NHEJ介導的基因敲除:
單病毒載體:
●含有兩個或更多個表現盒的載體:
●啟動子-Cas9編碼核酸分子-終止子
●啟動子-gRNA1-終止子
●啟動子-gRNA2-終止子
●啟動子-gRNA(N)-終止子(一直到載體的大小限制)
雙病毒載體:
●含有一個用於驅動Cas9表現的表現盒的載體1
●啟動子-Cas9編碼核酸分子-終止子
●含有一個或多個用於驅動一個或多個指導RNA表現的表現盒的載體2
●啟動子-gRNA1-終止子
●啟動子-gRNA(N)-終止子(一直到載體的大小限制)
為了介導同源定向修復。
●除了上述單和雙病毒載體途徑之外,另外的載體可以用來遞送同源定向修復模板。
用來驅動Cas9編碼核酸分子表現的啟動子可以包括:
●AAV ITR可以用作啟動子:這對於消除另外的啟動子元件(可在載體中佔用空間)的需要係有利的。空出來的另外的空間可以用來驅動另外的元件的表現(gRNA,等等)。同樣,ITR活性係較弱的,因此可以用來降低由於Cas9的過表現所致的潛在毒性。
●對於遍存表現,可以使用啟動子CMV、CAG、CBh、PGK、SV40、鐵蛋白重鏈或輕鏈,等等。
●對於腦或其他CNS表現,可以使用啟動子:用於所有神經元的突 觸蛋白I、用於興奮性神經元的CaMKIIα、用於GABA能神經元的GAD67或GAD65或VGAT,等等。
●對於肝臟表現,可以使用白蛋白啟動子。
●對於肺表現,可以使用SP-B。
●對於內皮細胞,可以使用ICAM。
●對於造血細胞,可以使用IFNβ或CD45。
●對於成骨細胞,可以使用OG-2。
用來驅動指導RNA的啟動子可以包括:
●Pol III啟動子,如U6或H1
●使用Pol II啟動子和內含子盒來表現gRNA
CRISPR-Cas9的結晶和結構
CRISPR-Cas9的結晶和晶體結構的表徵:該等晶體可以藉由蛋白質結晶學的技術(包括分批、液橋、透析、蒸汽擴散和懸滴法)獲得。通常,該等晶體藉由將基本上純的CRISPR-Cas9和它所結合的核酸分子以剛好低於沈澱所需的濃度溶解於含有沈澱劑的水性緩衝液中來生長。藉由受控蒸發去除水,以產生沈澱條件,維持沈澱條件直至晶體生長停止。參見尼施瑪素(Nishimasu)等人
晶體的用途、晶體結構和原子結構座標(Uses of the Crystals,Crystal Structure and Atomic Structure Co-Ordinates):該等晶體並且特別是由其獲得的原子結構座標具有多種多樣的用途。晶體和結構座 標特別有用於鑒定與CRISPR-Cas9結合的化合物(核酸分子)以及可以與具體化合物(核酸分子)結合的CRISPR-Cas9。因此,本文描述的結構座標可以在確定另外的合成的或突變的CRISPR-Cas9、Cas9、切口酶、結合結構域的晶體結構中用作定相模型。提供與核酸分子複合的CRISPR-Cas9的晶體結構可以為熟習該項技術者提供對CRISPR-Cas9的瞭解。這種瞭解提供了用於設計修飾的CRISPR-Cas9的手段,如藉由向其附接官能團(如抑制蛋白或活化蛋白)。雖然人們可以將官能團(如抑制蛋白或活化蛋白)附接至CRISPR-Cas9的N末端或C末端,但是晶體結構證明N末端似乎被遮蔽或隱藏,而C末端更易於為官能團(如抑制蛋白或活化蛋白)獲得。此外,晶體結構證明大約在CRISPR-Cas9(釀膿鏈球菌)的殘基534-676之間存在撓性環,該環適於附接官能團(如活化蛋白或抑制蛋白)。附接可以經由接頭,例如撓性甘胺酸-絲胺酸(GlyGlyGlySer)或(GGGS)3,或者剛性α-螺旋接頭如(Ala(GluAlaAlaAlaLys)Ala)。除撓性環之外,還存在核酸酶或H3區域、H2區域和螺旋區域。所謂“螺旋(helix)”或“螺旋的(helical)”意指如本領域已知的螺旋,包括但不限於α-螺旋。另外,術語螺旋或螺旋的還可以用於指示具有N-末端轉角的c-末端螺旋元件。
提供與核酸分子複合的CRISPR-Cas9的晶體結構允許藥物或化合物發現、鑒定和設計可以與CRISPR-Cas9結合的化合物的新穎方法,並且因此本揭露提供了在診斷、治療或預防多細胞生物的病症或疾病中有用的工具,該等多細胞生物係例如藻類、植物、無脊椎動物、魚、兩棲動物、爬行動物、禽類、哺乳動物;例如家養植物、動物(例如,生產動物如豬、牛、雞;伴侶動物如貓、犬、齧齒動物(兔、沙鼠、倉 鼠);實驗動物如小鼠、大鼠)以及人類。因此,本揭露提供了合理設計CRISPR-Cas9複合物的基於電腦之方法。這種合理設計可以包括:提供CRISPR-Cas9複合物的結構,如藉由晶體結構表的和/或在關於晶體結構的一個或多個圖中的一些或全部(例如結構的至少2個或更多個,例如至少5個,有利地至少10個,更有利地至少50個並且甚至更有利地至少100個原子)座標所限定的;參見尼施瑪素(Nishimasu)等人;提供希望的核酸分子的結構,就所希望的CRISPR-Cas9複合物而言;並且使如藉由一些或全部座標所限定的CRISPR-Cas9複合物的結構與希望的核酸分子匹配,在所述匹配中包括獲得如藉由一些或全部座標所限定的CRISPR-Cas9複合物的一種或多種推定修飾,用於使所述希望的核酸分子約束涉及希望的核酸分子的一種或多種CRISPR-Cas9複合物。該方法或該方法的匹配可以使用CRISPR-Cas9複合物的感興趣的原子的座標,如藉由一些或全部座標所限定的,該等座標在活性位點或結合區附近(例如結構的至少2個或更多個,例如至少5個,有利地至少10個,更有利地至少50個並且甚至更有利地至少100個原子),以便在活性位點或結合區附近建模。該等座標可以用於限定空間,然後針對希望的或候選核酸分子對所述空間進行“經由電腦類比”篩選。因此,本揭露提供了合理設計CRISPR-Cas9複合物的基於電腦之方法。這種方法可以包括:提供晶體結構表的至少兩個原子的座標(“選定的座標”);參見尼施瑪素(Nishimasu)等人;提供候選或希望的核酸分子的結構;並且使候選物的結構與選定的座標匹配。以這種方式,熟練人員還可以匹配官能團和候選或希望的核酸分子。例如,提供CRISPR-Cas9複合物的結構,如藉由一些或全部(例如結構的至少2個或更多個,例如至少5個,有利地至少10個,更有利地至少50個 並且甚至更有利地至少100個原子)座標所限定的;提供希望的核酸分子的結構,就所希望的CRISPR-Cas9複合物而言;使CRISPR-Cas9複合物的結構,如藉由晶體結構表中的和/或關於晶體結構的圖中的一些或全部座標所限定的,與參見尼施瑪素(Nishimasu)等人;希望的核酸分子匹配,在所述匹配中包括獲得如所限定的CRISPR-Cas9複合物的一種或多種推定修飾,用於使所述希望的核酸分子約束涉及希望的核酸分子的一種或多種CRISPR-Cas9複合物;選擇一種或多種推定匹配CRISPR-Cas9─希望的核酸分子複合物,使這樣一種或多種推定匹配CRISPR-Cas9─希望的核酸分子複合物與官能團(例如,活化蛋白、抑制蛋白)匹配,例如就用於安放官能團的位置(例如,撓性環內的位置)和/或用於產生安放官能團的位置的這一種或多種推定匹配CRISPR-Cas9─希望的核酸分子複合物的推定修飾而言。
然而,SpCas9晶體結構的知識(參見尼施瑪素(Nishimasu)等人)不可能預測藉由本發明的突變所實現的脫靶效應的減少;或特定突變可以實現脫靶效應的減少,如本文所揭露的。但是,既然根據本揭露存在著提供或實現脫靶效應減少的突變的知識,熟練人員可以容易地應用本文的傳授,與SpCas9晶體結構的知識和Cas9序列的知識結合,來製備序列並且跨Cas9進行結構分析,以獲得可以按與本文類似的方式突變或修飾的類似胺基酸,以便獲得另外的經突變的或經修飾的Cas9,其中該突變或修飾導致減少的脫靶效應。
因此,可以使用在本文揭露的一個或多個突變或一種或多種修飾附近的或在定位成鄰近於這樣一個或多個突變或一種或多種修飾 的活性位點或結合區附近的座標連同SpCas9晶體的資訊實踐本揭露;並且因此,確定SpCas9的另外的突變或修飾或Cas9異種同源物中的類似突變或修飾的方法可以採用例如對比考慮CRISPR-Cas9複合物的一個或多個感興趣的子結構域的考慮。確定SpCas9的另外的突變或修飾或Cas9異種同源物中的類似突變或修飾的方法可以使用結構域或子結構域的座標來實踐。該等方法可以視情況包括由“經由電腦類比”輸出合成候選或希望的核酸分子和/或CRISPR-Cas9系統,並且測試“濕式(wet)”或實際突變或修飾的結合和/或活性和/或脫靶效應的減少。包括突變或修飾的CRISPR-Cas9系統可以視情況包括官能團。該等方法可以包括觀察細胞或含有該細胞的生物的希望的反應,例如症狀或病症或疾病的減少,有利地包括脫靶效應的減少。提供候選核酸分子的結構可以涉及藉由電腦篩選含有核酸分子數據(例如,關於病症或疾病的此類數據)的資料庫來選擇化合物。候選核酸分子的結合的3-D描述符可以衍生自來源於來自晶體結構的的CRISPR-Cas9複合物或其結構域或區域的構造和化學性質的幾何和功能約束,考慮到如本文揭露的突變或修飾。實際上,描述符可以是本文的CRISPR-Cas9複合物晶體結構的一種或多種虛擬修飾類型,用於將CRISPR-Cas9結合至候選或希望的核酸分子。然後可以使用具有推定的良好綁定的描述符和核酸分子進行本文的“濕式”步驟。
“匹配(fitting)”可以意指藉由自動或半自動手段確定候選物的至少一個原子與CRISPR-Cas9複合物的至少一個原子之間的相互作用並且計算這樣一種相互作用穩定的程度。相互作用可以包括由電荷、空間因素等引起的吸引、排斥。“子結構域”可以意指二級結構的 至少一個(例如,一個、兩個、三個或四個)完整元件。CRISPR-Cas9的具體區域或結構域包括在晶體結構表和與其對應的圖中鑒定的那些;參見尼施瑪素(Nishimasu)等人。
在任何情況下,CRISPR-Cas9(例如釀膿鏈球菌Cas9;參見尼施瑪素(Nishimasu)等人)複合物的三維結構在本發明的背景下提供了用於鑒定Cas9的異種同源物中的另外的突變的另外的工具,因為基於使用CRISPR-SpCas9複合物的晶體結構的序列和結構位置比較,本文鑒定的突變/修飾的位置可以應用於Cas9的異種同源物。晶體結構還可以作為新的且特異性的Cas9的設計基礎,例如具有本文的一個或多個突變或一種或多種修飾並且包括或具有融合配偶體或具有連接至其上的任何一個或多個不同官能團的那些,該等官能團係例如轉錄阻抑因子、轉錄活化蛋白、核酸酶結構域、DNA甲基轉移酶、蛋白乙醯轉移酶、蛋白脫乙醯酶、蛋白甲基轉移酶、蛋白脫胺酶、蛋白激酶、以及蛋白磷酸酶;並且,在一些方面,功能結構域係表觀遺傳調節劑;參見例如,張(Zhang)等人,美國專利案號8,507,272,並且再次指出的是它和本文引用的所有文獻以及本文引用的所有申請文獻特此藉由引用併入本文)相互作用,藉由修飾Cas9的方式,藉由新穎切口酶的方式。根據本揭露並且瞭解CRISPR-Cas9(釀膿鏈球菌Cas9)晶體結構的三維結構,可以使用電腦建模程式來設計或鑒定預期與可能的或確認的位點(如結合位點)相互作用的不同分子或者CRISPR-Cas9系統(例如,釀膿鏈球菌Cas9)的其他結構或功能特徵。可以藉由使用電腦建模(使用對接程式)檢查潛在結合的化合物(“結合物(binder)”)。對接程式係已知的;例如GRAM、 DOCK或AUTODOCK(參見沃爾特斯(Walters)等人《今日藥物發現》(Drug Discovery Today),第3卷,第4期(1998),160-178;和鄧恩布拉克(Dunbrack)等人《折疊與設計》(Folding and Design)2(1997),27-42)。這種程式可以包括潛在結合物的電腦匹配,以確定該潛在結合物的形狀和化學結構在多大程度上與CRISPR-Cas9系統(例如,釀膿鏈球菌Cas9)綁定。可以進行CRISPR-Cas9系統(例如,釀膿鏈球菌Cas9)的活性位點或結合位點的電腦輔助手動檢查。程式(如GRID(P.戈德福德(Goodford),《藥物化學雜誌》(J.Med.Chem),1985,28,849-57)-一種確定具有不同官能團的分子之間的可能相互作用位點的程式)還可以用於分析活性位點或結合位點以預測結合化合物的部分結構。電腦程式可以用於估計例如以下兩種結合配偶體的吸引、排斥或位阻,CRISPR-Cas9系統(例如,釀膿鏈球菌Cas9)和候選核酸分子或者核酸分子和候選CRISPR-Cas9系統(例如,釀膿鏈球菌Cas9);並且與此一起,CRISPR-Cas9晶體結構(釀膿鏈球菌Cas9)允許此類方法。通常,匹配越緊,位阻越小,並且吸引力越大,潛在的結合物越有效,因為該等特性與較緊的結合常數一致。此外,候選CRISPR-Cas9系統(例如,釀膿鏈球菌Cas9)的設計越具特異性,越可能的是它也將不與脫靶分子相互作用。並且,本發明允許“濕式”方法。例如,在一個方面,本揭露提供了用於確定候選CRISPR-Cas9系統(例如,釀膿鏈球菌Cas9)的結合至該候選CRISPR-Cas9系統(例如,釀膿鏈球菌Cas9)的結合物(例如,靶核酸分子)的結構之方法,所述方法包括(a)提供根據本揭露的候選CRISPR-Cas9系統(釀膿鏈球菌Cas9)的第一晶體或候選物候選CRISPR-Cas9系統(例如,釀膿鏈球菌Cas9)的第二晶體,(b)使該第一晶體或第二晶體與所 述結合物在可以形成複合物的條件下接觸;並且(c)確定所述候選物(例如,CRISPR-Cas9系統(例如,釀膿鏈球菌Cas9))或CRISPR-Cas9系統(釀膿鏈球菌Cas9)複合物的結構。第二晶體可以具有在本文討論的基本上相同的座標,然而由於CRISPR-Cas9系統的次要變化(例如,來自作為例如釀膿鏈球菌Cas9與作為釀膿鏈球菌Cas9的這樣一種系統的Cas9,其中“例如釀膿鏈球菌Cas9”指示該Cas9係Cas9並且可以屬於或來源於釀膿鏈球菌或其異種同源物),該晶體可以按不同的空間群形成。代替或除“經由電腦類比”方法之外,本揭露進一步涉及其他“濕式”方法,包括結合物(例如,靶核酸分子)和候選CRISPR-Cas9系統(例如,釀膿鏈球菌Cas9)、或候選結合物(例如,靶核酸分子)和CRISPR-Cas9系統(例如,釀膿鏈球菌Cas9)、或候選結合物(例如,靶核酸分子)和候選CRISPR-Cas9系統(例如,釀膿鏈球菌Cas9)的高通量篩選(前述一種或多種CRISPR-Cas9系統具有或不具有一個或多個官能團),以便選擇具有結合活性的化合物。可以對那些顯示出結合活性的結合物和CRISPR-Cas9系統進行選擇並且進一步用具有本文的結構的CRISPR-Cas9晶體進行結晶,例如藉由共結晶或藉由浸泡,用於X-射線分析。已經藉由基於本文的結合物和CRISPR-Cas9對的晶體結構數據對具有有利的匹配特性(例如,預測的強吸引)的那些進行確定而設計、鑒定或選擇了可能的結合物和CRISPR-Cas9系統對,然後可以藉由“濕式”方法篩選該等可能的對的活性。因此,在一個方面,本發明可以涉及:獲得或合成該等可能的對;並且使結合物(例如,靶核酸分子)和候選CRISPR-Cas9系統(例如,釀膿鏈球菌Cas9)接觸、或使候選結合物(例如,靶核酸分子)和CRISPR-Cas9系統(例如,釀膿鏈球菌Cas9)接觸、或使候選結合物(例 如,靶核酸分子)和候選CRISPR-Cas9系統(例如,釀膿鏈球菌Cas9)接觸(前述一種或多種CRISPR-Cas9系統具有或不具有一個或多個官能團),以便確定結合能力。在後一步中,接觸有利地在確定功能的條件下。代替或除進行這樣一種測定之外,本揭露可以包括:由一種或多種複合物的所述接觸和分析獲得或合成這一種或多種複合物,例如藉由X射線衍射或NMR或其他手段,以便確定結合或相互作用的能力。然後可以獲得關於結合的詳細結構資訊,並且根據這個資訊,可以對候選CRISPR-Cas9系統或其組分的結構或功能進行調節。可以重複和再次重複該等步驟,如必要的話。可替代地或另外地,來自或在前述方法中的潛在CRISPR-Cas9系統可以與核酸分子一起在體內,包括但不限於藉由向生物(包括非人類動物和人類)給予的方式,以便確定或確認功能,包括是否由其導致了希望的結果(例如,症狀的減少、治療)。
本揭露進一步涉及藉由使用本文討論的文獻的結構座標(尤其是如果關於本文討論的一種或多種修飾或一個或多個突變進行調整的)確定具有未知結構的一種或多種CRISPR-cas系統或複合物的三維結構之方法。例如,如果提供了具有未知晶體結構的CRISPR-Cas系統或複合物的X射線晶體或NMR光譜數據,則CRISPR-Cas9複合物的結構可以用於解釋該數據,以便藉由如在X射線晶體學的情況下的定相建模等技術提供未知系統或複合物的可能結構。因此,方法可以包括:將具有未知晶體結構的CRISPR-Cas系統或複合物的表示與具有本文引用的文獻的晶體結構的CRISPR-Cas9系統和複合物的類似表示(有利地關於本文的一種或多種修飾或一個或多個突變進行調整的)進行比對,以匹配同源或類 似區域(例如,同源或類似序列);為具有未知晶體結構的CRISPR-Cas系統或複合物的匹配的同源或類似區域(例如,序列)的結構建模;並且,確定基本上保留了所述匹配的同源區域的結構的未知晶體結構的構象(例如考慮到,應當形成有利的相互作用,這樣使得形成低能量構象)。就胺基酸而言,“同源區域”描述了例如相同的或具有類似的(例如脂肪族、芳香族、極性、帶負電荷或帶正電荷的)側鏈化學基團的兩個序列中的胺基酸殘基。就核酸分子而言,同源區域可以包括至少85%或86%或87%或88%或89%或90%或91%或92%或93%或94%或95%或96%或97%或98%或99%的同源性或一致性。相同和類似區域有時被熟習該項技術者分別描述為“不變的”和“保守的”。有利地,藉由電腦建模進行第一和第三步驟。同源建模係熟習該項技術者熟知的一項技術(參見例如,格里爾(Greer),《科學》(Science)第228卷(1985)1055;和布倫代爾(Blundell)等人《歐洲生物化學雜誌》(Eur J Biochem)第172卷(1988),513)。本文的CRISPR-Cas9晶體結構的保守區和具有未知晶體結構的CRISPR-Cas系統的保守區的電腦表示有助於預測和確定具有未知晶體結構的CRISPR-Cas系統的晶體結構。仍進一步地,本發明的採用經由電腦類比的CRISPR-Cas9晶體結構的方面同樣可以應用於本文的新的一個或多個突變或一種或多種修飾和CRISPR-Cas晶體結構。以這種方式,可以獲得CRISPR-Cas晶體結構的文庫。因此本揭露提供了合理的CRISPR-Cas系統設計。例如,已經藉由本文描述的方法(包括考慮到來自本文引用的文獻的本領域的知識)確定了CRISPR-Cas系統或複合物的構象或晶體結構,這樣一種構象可以用於本文的基於電腦的方法中,用於確定晶體結構仍未知的其他CRISPR-Cas系統或複合物的構象或晶體結構。來自所 有該等晶體結構的數據可以在資料庫中,並且本文的方法可以藉由使本文涉及的晶體結構或其部分相對於文庫中的一種或多種晶體結構而在此進行的比較而更穩健。本揭露進一步提供了旨在產生CRISPR-cas系統或複合物的結構和/或進行其合理設計的系統(如電腦系統)。該系統可以含有:本文的或由其衍生(例如,藉由建模)的原子座標數據,所述數據限定了CRISPR-cas系統或複合物或其至少一個結構域或子結構域的三維結構,或針對其的結構因子數據,所述結構因子數據可衍生自原子座標數據。本揭露還涉及具有以下項的電腦可讀介質:原子座標數據,所述數據限定了CRISPR-cas系統或複合物或其至少一個結構域或子結構域的三維結構,或針對其的結構因子數據。“電腦可讀介質”係指可以由電腦直接讀取和訪問的任何介質,並且包括但不限於:磁存儲介質;光存儲介質;電存儲介質;雲存儲以及該等類別的混合型。藉由提供此類電腦可讀介質,可以常規訪問原子座標數據用於建模或其他“經由電腦類比”方法。本揭露進一步包括藉由提供對此類電腦可讀介質的訪問營商之方法,例如在訂購的基礎上,經由互聯網或全球通信/電腦網路;或者,在訂購的基礎上,該電腦系統可以供使用者使用。“電腦系統”係指用於分析本發明的原子座標數據的硬體裝置、軟體裝置和數據存儲裝置。本發明的基於電腦的系統的最低硬體裝置包括中央處理器(CPU)、輸入裝置、輸出裝置以及數據存儲裝置。合意地,提供顯示器或監測器用於視覺化結構數據。本揭露進一步包括傳輸本文的或在本文描述的任何方法或其步驟中獲得的資訊之方法,例如經由電信、電話、大眾通訊、大眾媒體、圖像、互聯網,電子郵件等。可以對本揭露的晶體結構進行分析以產生CRISPR-cas系統或複合物的一張或多張傅立葉電子密度圖;可 以基於X射線衍射圖計算傅立葉電子密度圖。然後可以將該等圖用於確定結合或其他相互作用的方面。可以使用已知程式計算電子密度圖,如來自CCP4電腦包(協同計算項目(Collaborative Computing Project),第4期.CCP4套件:用於蛋白質晶體學的項目(The CCP4 Suite:Programs for Protein Crystallography),《晶體學報》(Acta Crystallographica),D50,1994,760-763)的那些。用於圖視覺化和模型建立,可以使用程式如“QUANTA”(1994,聖地牙哥,加利福尼亞州:分子模擬(Molecular Simulations),鐘斯(Jones)等人,《晶體學學報》(Acta Crystallography A47)(1991),110-119)。
本文引用的晶體結構給出了CRISPR-Cas9(釀膿鏈球菌)的原子座標數據,並且列出了每個原子(藉由唯一編號);每個胺基酸殘基的化學元素及其位置(如藉由電子密度圖和抗體序列比較確定的),元素所在的胺基酸殘基,股標識符,殘基的編號,相對於晶軸限定了對應原子的原子位置(以埃計)的座標(例如,X、Y、Z),原子在對應位置中的占位,“B”,負責原子圍繞其原子中心移動的各向同性位移參數(以埃2計)以及原子序數。
在本發明的具體實施方式中,CRISPR-Cas9系統或該CRISPR-Cas9的組分的晶體結構的構象變化提供了關於蛋白質結構區域相對於對CRISPR-Cas系統功能而言重要的核苷酸(RNA或DNA)結構區域的撓性或移動的重要且關鍵的資訊。針對作為本申請中的CRISPR酶的Cas9(例如釀膿鏈球菌Cas9:與指導RNA和靶DNA複合的cas9的晶體結構(Crystal structure of cas9 in complex with guide RNA and target DNA).尼 施瑪素(Nishimasu),H.、蘭(Ran),FA.、徐(Hsu),PD.、科納曼(Konermann),S.、舍哈塔(Shehata),SI.、多米耶(Dobmae),N.、石穀(Ishitani),R.、張(Zhang),F.、努爾基(Nureki),O.《細胞》(Cell)2月27日.(2014).156(5):935-49;或Sa Cas9:金黃色葡萄球菌Cas9的晶體結構(Crystal Structure of Staphylococcus aureus Cas9),尼施瑪素等人,《細胞》162,1113-1126(2015年8月27日))提供的結構資訊可以用於進一步工程化和優化CRISPR-Cas系統並且這也可以被外推用於探詢其他CRISPR酶系統中的結構-功能關係。本發明的一個方面涉及2.4Å解析度下的與sgRNA及其靶DNA複合的釀膿鏈球菌Cas9的晶體結構。該結構揭示了由靶識別和核酸酶葉片組成的兩葉片構造,其將sgRNA:DNA雙股體容納在它們的介面處的帶正電荷的溝槽中。識別葉片對於sgRNA和DNA結合係至關重要的,並且核酸酶葉片包含HNH和RuvC核酸酶結構域,該等結構域適合地被定位為分別用於靶DNA的互補和非互補股的切割。本文提供的這種高分辨結構和功能分析闡明了藉由Cas9靶向RNA指導的DNA的分子機制,並且提供了用於產生優化的CRISPR-Cas系統及其組分的豐富資訊。
在本發明的具體實施方式中,晶體結構提供了用於理解藉由Cas9進行的RNA指導的DNA靶向的分子機制的關鍵步驟。本文的結構和功能分析為合理工程化基於Cas9的基因組調節技術提供了有用的舞臺,並且可以提供關於Cas9介導的靶DNA上的PAM序列識別或sgRNA:DNA雙股體之間的錯配耐受性的指導。本發明的方面還涉及截短突變體,例如釀膿鏈球菌Cas9截短突變體可以促進將Cas9包裝到尺寸受 約束的病毒載體中用於體內和治療應用。類似地,PAM相互作用(PI)結構域的工程化可以允許對PAM特異性程式設計,改善靶位點識別保真性,並且增加Cas9基因組工程化平臺的多能性。另外,PAM相互作用(PI)結構域的工程化可以允許對PAM特異性程式設計,改善靶位點識別保真性,並且增加Cas(例如Cas9)基因組工程化平臺的多能性。Cas蛋白(如Cas9蛋白)可以被工程化為改變其PAM特異性,例如如描述於克萊因史迪維爾(Kleinstiver)BP等人具有改變的PAM特異性的工程化的CRISPR-Cas9核酸酶(Engineered CRISPR-Cas9 nucleases with altered PAM specificities)。《自然》(Nature).2015 Jul 23;523(7561):481-5.doi:10.1038/nature14592。
本發明包括經優化的功能性CRISPR-Cas酶系統。具體而言,該CRISPR酶包括一個或多個將它轉化為DNA結合蛋白的突變,展現出感興趣的功能的功能結構域可以被募集或附於或插入或附接至該DNA結合蛋白。在某些實施方式中,該CRISPR酶包括一個或多個突變,這一個或多個突變包括但不限於D10A、E762A、H840A、N854A、N863A或D986A(基於釀膿鏈球菌Cas9的胺基酸位置編號),和/或這一個或多個突變在該CRISPR酶的RuvC1或HNH結構域中或者為如本文另外討論的突變。在一些實施方式中,該CRISPR酶具有一個或多個在催化結構域中的突變,其中在轉錄時,該tracr配對序列雜交到該tracr序列上,並且該指導序列指導CRISPR複合物與該靶序列的序列特異性結合,並且其中該酶進一步包含功能結構域。
本文提供的結構資訊允許探詢sgRNA(或嵌合RNA)與 靶DNA和CRISPR酶(例如Cas9)的相互作用,從而允許工程化或改變sgRNA的結構,以便優化整個CRISPR-Cas系統的功能性。例如,可以在不與Cas9蛋白衝突的情況下藉由插入一個或多個不同的RNA環或一個或多個不同的序列來擴展sgRNA的環,這一個或多個不同的RNA環或一個或多個不同的序列可以募集可以結合至這一個或多個不同的RNA環或一個或多個不同的序列的轉接蛋白。
本發明的酶的功能變體
在實施方式中,如本文提及的Cas9蛋白還包括功能變體。如本文使用的蛋白質的“功能變體”係指這樣的蛋白質的至少部分地保留該蛋白質的活性的變體。功能變體可以包括突變體(其可以是插入、缺失、或置換突變體),包括多晶型物等。還包括在功能變體內的是這樣的蛋白質與另一種通常不相關的核酸、蛋白質、多肽或肽的融合產物。功能變體可以是天然存在的或可以是人造的。有利的實施方式可以涉及工程化或非天然存在的靶向II型RNA的效應蛋白,例如Cas9或其異種同源物或同系物。
關於根據本發明的蛋白質突變的一般資訊
本發明包括CRISPR Cas複合物,該複合物包含CRISPR酶和指導RNA(sgRNA),其中該CRISPR酶包括至少一個突變,這樣使得該CRISPR酶沒有或具有不超過5%的沒有這至少一個突變的CRISPR酶的核酸酶活性,以及視情況至少一個或多個核定位序列;該RNA指導(sgRNA)包括能夠雜交到細胞中的感興趣的基因組座位中的靶序列上的指導序列;並且其中:該CRISPR酶與兩個或更多個功能結構域相關 聯;或者藉由插入結合至一種或多種轉接蛋白的一個或多個不同RNA序列來修飾該sgRNA的至少一個環,並且其中該轉接蛋白與兩個或更多個功能結構域相關聯;或者該CRISPR酶與一個或多個功能結構域相關聯,並且藉由插入結合至一種或多種轉接蛋白的一個或多個不同RNA序列來修飾該sgRNA的至少一個環,並且其中該轉接蛋白與一個或多個功能結構域相關聯。
功能結構域和轉接蛋白;適配體
轉接蛋白可以包括但不限於存在於各種噬菌體外殼蛋白內的正交RNA結合蛋白/適配體組合。這樣的外殼蛋白的列表包括但不限於:Qβ、F2、GA、fr、JP501、M12、R17、BZ13、JP34、JP500、KU1、M11、MX1、TW18、VK、SP、FI、ID2、NL95、TW19、AP205、ΦCb5、ΦCb8r、ΦCb12r、ΦCb23r、7s以及PRR1。該等轉接蛋白或正交RNA結合蛋白可以進一步募集效應蛋白或融合物,該等效應蛋白或融合物包括一個或多個功能結構域。在一些實施方式中,功能結構域可以選自由以下各項組成之群組:轉位酶結構域、整合酶結構域、重組酶結構域、游離酶結構域、轉化酶結構域、蛋白酶結構域、DNA甲基轉移酶結構域、DNA羥甲基酶結構域、DNA脫甲基酶結構域、脫胺酶、組蛋白乙醯酶結構域、組蛋白脫乙醯酶結構域、核酸酶結構域、抑制蛋白結構域、活化蛋白結構域、核定位信號結構域、轉錄調節蛋白(或轉錄複合體募集)結構域、細胞攝取活性相關結構域、核酸結合結構域、抗體呈遞結構域、組蛋白修飾酶、組蛋白修飾酶的募集物;組蛋白修飾酶、組蛋白甲基轉移酶、組蛋白脫甲基酶、組蛋白激酶、組蛋白磷酸酶、組蛋白核糖基酶、組蛋 白脫核糖基酶、組蛋白泛素酶、組蛋白脫泛素酶、組蛋白生物素酶和組蛋白尾部蛋白酶的抑制劑。
在一些較佳的實施方式中,該功能結構域係轉錄活化結構域,較佳的是VP64。在一些實施方式中,該功能結構域係轉錄抑制結構域,較佳的是KRAB。在一些實施方式中,該轉錄抑制結構域係SID、或SID的多聯體(例如SID4X)。在一些實施方式中,該功能結構域係表觀遺傳修飾結構域,從而提供了表觀遺傳修飾酶。在一些實施方式中,該功能結構域係活化結構域,其可以是P65活化結構域。在一些實施方式中,該功能結構域係脫胺酶,如胞苷脫胺酶。胞苷脫胺酶可以被引導至靶核酸的它引導胞苷轉化成尿苷的地方,從而導致C向T的取代(在互補股上是G向A的取代)。在這樣一個實施方式中,可以在不進行DNA切割的情況下實現核苷酸取代。
在一個方面,使用surveyor分析來鑒定indel活性/核酸酶活性。一般而言,surveyor分析包括提取基因組DNA、PCR擴增CRISPR靶位點側翼的基因組區域、純化產物、重退火以允許異源雙股體形成。重退火之後,遵循製造商的推薦方案,將產物用SURVEYOR核酸酶和SURVEYOR增強子S(轉基因組學公司(Transgenomics))處理。可以根據已知方法用聚丙烯醯胺凝膠進行分析。量化可以基於相對條帶強度。
***誘導酶和分割型酶(“分割型-Cas9”)
在一方面,本發明提供了非天然存在的或工程化的誘導型Cas9 CRISPR-Cas系統,該系統包含:
第一Cas9融合構建體,其附接至誘導型二聚體的第一個一半,和
第二Cas9融合構建體,其附接至該誘導型二聚體的第二個一半,
其中該第一Cas9融合構建體可操作地連接至一個或多個核定位信號,
其中該第二Cas9融合構建體可操作地連接至一個或多個核輸出信號,
其中與誘導物能量源接觸使該誘導型二聚體的該第一個一半和該第二個一半聚到一起,
其中使該誘導型二聚體的該第一個一半和該第二個一半聚到一起允許該第一Cas9融合構建體和該第二Cas9融合構建體構成功能性Cas9CRISPR-Cas系統,
其中該Cas9 CRISPR-Cas系統包含指導RNA(gRNA),該指導RNA包含能夠雜交到細胞中的感興趣的基因組座位中的靶序列上的指導序列,並且
其中該功能性Cas9 CRISPR-Cas系統結合至該靶序列,並且視情況,編輯該基因組座位以改變基因表現。
在本發明的一方面,在該誘導型Cas9 CRISPR-Cas系統中,該誘導型二聚體係或包含誘導型異二聚體或基本上由其組成或由其組成。在一個方面,在誘導型Cas9 CRISPR-Cas系統中,該誘導型異二聚體的第一個一半或第一部分或第一片段係或包含FKBP(視情況是FKBP12)或由其組成或基本上由其組成。在本發明的一方面,在該誘導型Cas9 CRISPR-Cas系統中,該誘導型異二聚體的第二個一半或第二部分 或第二片段係或包含FRB或由其組成或基本上由其組成。在本發明的一個方面,在該誘導型Cas9 CRISPR-Cas系統中,該第一Cas9融合構建體的安排係或包含N’末端Cas9部分-FRB-NES或由其組成或基本上由其組成。在本發明的一方面,在該誘導型Cas9 CRISPR-Cas系統中,該第一Cas9融合構建體的安排係或包含NES-N’末端Cas9部分-FRB-NES或由其組成或基本上由其組成。在本發明的一方面,在該誘導型Cas9 CRISPR-Cas系統中,該第二Cas9融合構建體的安排係或包含C’末端Cas9部分-FKBP-NLS或基本上由其組成或由其組成。在一方面,本發明提供了在該誘導型Cas9 CRISPR-Cas系統中,該第二Cas9融合構建體的安排係或包含NLS-C’末端Cas9部分-FKBP-NLS或由其組成或基本上由其組成。在一方面,在誘導型Cas9 CRISPR-Cas系統中可以存在將該Cas9部分與該誘導型二聚體的一半或部分或片段分開的接頭。在一方面,在該誘導型Cas9 CRISPR-Cas系統中,該誘導物能量源係或包含雷帕黴素或基本上由其組成或由其組成。在一方面,在誘導型Cas9 CRISPR-Cas系統中,該誘導型二聚體係誘導型同二聚體。在一方面,在誘導型Cas9 CRISPR-Cas系統中,該Cas9係FnCas9。在一方面,在該誘導型Cas9 CRISPR-Cas系統中,一個或多個功能結構域與該Cas9的一個或兩個部分關聯,例如,該等功能結構域視情況包括轉錄活化蛋白、轉錄或核酸酶(如Fok1核酸酶)。在一個方面,在該誘導型Cas9 CRISPR-Cas系統中,該功能性Cas9 CRISPR-Cas系統結合至靶序列並且該酶係失活的Cas9,該失活的Cas9當與不具有至少一個突變的Cas9相比時視情況具有降低至少97%或100%的核酸酶活性(或不超過3%並且有利地0%的核酸酶活性)。本發明進一步包括並且本發明的一方面提供了編碼如在本文討論的誘導型Cas9 CRISPR-Cas系統的多核苷酸。
在一方面,本發明提供了用於遞送如在本文討論的附接至誘導型二聚體的第一個一半或第一部分或片段並且可操作地連接至一個或多個核定位信號的第一Cas,9融合構建體的載體。在一方面,本發明提供了用於遞送附接至誘導型二聚體的第二個一半或第二部分或片段並且可操作地連接至一個或多個核輸出信號的該第二Cas9融合構建體的載體。
在一方面,本發明提供了用於遞送以下兩者的載體:如在本文討論的附接至誘導型二聚體的第一個一半或第一部分或片段並且可操作地連接至一個或多個核定位信號的第一Cas9融合構建體;以及如在本文討論的附接至誘導型二聚體的第二個一半或第二部分或片段並且可操作地連接至一個或多個核輸出信號的第二Cas9融合構建體。
在一方面,該載體可以是單個質粒或表現盒。
在一方面,本發明提供了用本文討論的載體中的任一個轉化的或表現如在本文討論的誘導型Cas9 CRISPR-Cas系統的真核宿主細胞或細胞系。
在一方面,本發明提供了用本文討論的載體中的任一個轉化的或表現本文討論的誘導型Cas9 CRISPR-Cas系統的轉基因生物或其子代。在一方面,本發明提供了組成性地表現如在本文討論的誘導型Cas9 CRISPR-Cas系統的模式生物。
在一方面,本發明提供了非天然存在的或工程化的誘導型 Cas9 CRISPR-Cas系統,該系統包含:
第一Cas9融合構建體,其附接至誘導型異二聚體的第一個一半,和
第二Cas9融合構建體,其附接至該誘導型異二聚體的第二個一半,
其中該第一Cas9融合構建體可操作地連接至一個或多個核定位信號,
其中該第二Cas9融合構建體可操作地連接至核輸出信號,
其中與誘導物能量源接觸使該誘導型異二聚體的該第一個一半和該第二個一半聚到一起,
其中使該誘導型異二聚體的該第一個一半和該第二個一半聚到一起允許該第一Cas9融合構建體和該第二Cas9融合構建體構成功能性Cas9 CRISPR-Cas系統,
其中該Cas9 CRISPR-Cas系統包含指導RNA(gRNA),該指導RNA包含能夠雜交到細胞中的感興趣的基因組座位中的靶序列上的指導序列,並且
其中該功能性Cas9 CRISPR-Cas系統編輯該基因組座位以改變基因表現。
在一方面,本發明提供了治療對其有需要的受試者之方法,該方法包括藉由用如本文討論的多核苷酸或本文討論的載體中的任一個轉化該受試者而誘導基因編輯並且向該受試者給予誘導物能量源。本發明包括這種多核苷酸或載體在藥劑的製造中之用途,例如,這種藥劑用於治療受試者或用於治療受試者的這樣一種方法。本發明包括用於 在治療對其有需要的受試者的方法中使用的如本文討論的多核苷酸或本文討論的載體中的任一個,該方法包括誘導基因編輯,其中該方法進一步包括向該受試者給予誘導物能量源。在一方面,在該方法中還提供了修復模板,例如藉由包含所述修復模板的載體遞送該修復模板。
本發明還提供了治療對其有需要的受試者之方法,該方法包括藉由用本文討論的多核苷酸或本文討論的載體中的任一個轉化該受試者而誘導轉錄活化或抑制,其中所述多核苷酸或載體編碼或包含無催化活性的Cas9和如本文討論的關聯的一個或多個功能結構域;該方法進一步包括向該受試者給予誘導物能量源。本發明還提供了用於在治療對其有需要的受試者的方法中使用的本文討論的多核苷酸或本文討論的載體中的任一個,該方法包括誘導轉錄活化或抑制,其中該方法進一步包括向該受試者給予誘導物能量源。
因此,本發明尤其包括同二聚體連同異二聚體,失活的Cas9或基本上沒有核酸酶活性的Cas9(例如,藉由突變),其中存在一個或多個NLS和/或一個或多個NES的系統或複合物;連接至分割型Cas9的一個或多個功能結構域;方法(包括治療方法)以及用途。
應當理解的是,在本文提及Cas9、Cas9蛋白或Cas9酶的情況下,這包括本發明的分割型Cas9。在一方面,本發明提供了用於改變或修飾基因產物表現之方法。所述方法可以包括向含有並表現編碼該基因產物的DNA分子的細胞中引入工程化的、非天然存在的Cas9CRISPR-Cas系統,該系統包含Cas9蛋白和靶向該DNA分子的指導RNA,由此該指導RNA靶向編碼該基因產物的DNA分子,並且該Cas9蛋白切割 編碼該基因產物的DNA分子,由此改變該基因產物的表現;並且,其中該Cas9蛋白和該指導RNA並不天然地一起存在。本發明包括包含連接至同向重複(DR)序列上的指導序列的指導RNA。本發明進一步包括經密碼子優化以便在真核細胞中表現的Cas9蛋白。在一較佳的實施方式中,該真核細胞係哺乳動物細胞,並且在一更較佳的實施方式中,該哺乳動物細胞係人類細胞。在本發明的一另外的實施方式中,該基因產物的表現被降低。
在一個方面,本發明提供了工程化的、非天然存在的Cas9 CRISPR-Cas系統,該系統包含Cas9蛋白和靶向在細胞中編碼基因產物的DNA分子的指導RNA,由此該指導RNA靶向編碼該基因產物的DNA分子,並且該Cas9蛋白切割編碼該基因產物的DNA分子,由此改變該基因產物的表現;並且,其中該Cas9蛋白和該指導RNA並不天然地一起存在;這包括本發明的分割型Cas9。本發明包括包含連接至DR序列上的指導序列的指導RNA。本發明進一步包括經密碼子優化以便在真核細胞中表現的Cas9蛋白。在一較佳的實施方式中,該真核細胞係哺乳動物細胞,並且在一更較佳的實施方式中,該哺乳動物細胞係人類細胞。在本發明的一另外的實施方式中,該基因產物的表現被降低。
在另一個方面,本發明提供了工程化的、非天然存在的載體系統,該載體系統包含一種或多種載體,這一種或多種載體包含第一調節元件以及第二調節元件,該第一調節元件可操作地連接至Cas9 CRISPR-Cas系統的指導RNA,該指導RNA靶向編碼基因產物的DNA分子,該第二調節元件可操作地連接至Cas9蛋白;這包括本發明的分割型 Cas9。組分(a)和(b)可以位於該系統的相同或不同載體上。該指導RNA靶向在細胞中編碼該基因產物的DNA分子,並且該Cas9蛋白切割編碼該基因產物的DNA分子,由此改變該基因產物的表現;並且,其中該Cas9蛋白和該指導RNA並不天然地一起存在。本發明包括包含連接至DR序列上的指導序列的指導RNA。本發明進一步包括經密碼子優化以便在真核細胞中表現的Cas9蛋白。在一較佳的實施方式中,該真核細胞係哺乳動物細胞,並且在一更較佳的實施方式中,該哺乳動物細胞係人類細胞。在本發明的一另外的實施方式中,該基因產物的表現被降低。
在一個方面,本發明提供了包含一種或多種載體的載體系統。在一些實施方式中,該系統包含:(a)第一調節元件,該第一調節元件可操作地連接到DR序列和一個或多個插入位點,這一個或多個插入位點用於在該DR序列的下游插入一個或多個指導序列,其中在表現時,該指導序列引導Cas9 CRISPR-Cas複合物與真核細胞中的靶序列的序列特異性結合,其中該Cas9 CRISPR-Cas複合物包含與(1)雜交到該靶序列上的指導序列、和(2)該DR序列複合的Cas9;以及(b)第二調節元件,該第二調節元件可操作地連接至編碼所述Cas9酶的酶編碼序列,該Cas9酶包含核定位序列;其中組分(a)和(b)位於該系統的相同或不同載體上;這包括本發明的分割型Cas9。在一些實施方式中,組分(a)進一步包括可操作地連接到該第一調節元件的兩個或更多個指導序列,其中當表現時,這兩個或更多個指導序列中的每者都引導Cas9 CRISPR-Cas複合物與真核細胞中的不同靶序列的序列特異性結合。
在一些實施方式中,該Cas9 CRISPR-Cas複合物包括一個 或多個核定位序列,其具有足夠強度來在真核細胞的細胞核中驅動所述Cas9 CRISPR-Cas複合物以可檢測的量積聚。不希望被理論所束縛,認為核定位序列對於真核生物中的Cas9 CRISPR-Cas複合物活性不是必要的,但包括此類序列增強該系統的活性,尤其對於靶向細胞核中的核酸分子而言。
在一些實施方式中,該Cas9酶係選自下組的細菌物種的Cas9,該組由以下各項組成:土拉熱弗朗西絲菌1、土拉熱弗朗西絲菌新兇手亞種、易北河普氏菌、毛螺菌科細菌MC2017 1、分解蛋白丁酸弧菌、Peregrinibacteria細菌GW2011_GWA2_33_10、Parcubacteria細菌GW2011_GWC2_44_17、密斯氏菌屬SCADC、胺基酸球菌屬BV3L6、毛螺菌科細菌MA2020、Candidatus Methanoplasma termitum、挑剔真桿菌、牛莫拉氏菌237、稻田鉤端螺旋體、毛螺菌科細菌ND2006、狗口腔卟啉單胞菌3、狄氏普氏菌、以及獼猴卟啉單胞菌,並且可以包括來源於該等生物的經突變的Cas9。該酶可以是Cas9同系物或異種同源物。在一些實施方式中,該Cas9經密碼子優化以便在真核細胞中表現。在一些實施方式中,該Cas9引導在該靶序列位置處的一條或兩條股的切割。在一較佳的實施方式中,該股斷裂係具有5'突出端的交錯切割。在一些實施方式中,該第一調節元件係聚合酶III啟動子。在一些實施方式中,該第二調節元件係聚合酶II啟動子。在一些實施方式中,該同向重複具有16nt的最小長度和單個莖環。在另外的實施方式中,該同向重複具有長於16nt,較佳的是多於17nt的長度,並且具有多於一個莖環或經優化的二級結構。
在一個方面,本發明提供了真核宿主細胞,該真核宿主細 胞包含(a)第一調節元件,該第一調節元件可操作地連接到同向重複序列和一個或多個插入位點,這一個或多個插入位點用於在該DR序列的下游插入一個或多個指導序列,其中在表現時,該指導序列引導Cas9 CRISPR-Cas複合物與真核細胞中的靶序列的序列特異性結合,其中該Cas9 CRISPR-Cas複合物包含與(1)雜交到該靶序列上的指導序列、和(2)該DR序列複合的Cas9;和/或(b)第二調節元件,該第二調節元件可操作地連接至編碼所述Cas9酶的酶編碼序列,該Cas9酶包含核定位序列。在一些實施方式中,該宿主細胞包含組分(a)和(b);這包括本發明的分割型Cas9。在一些實施方式中,組分(a)、組分(b)、或組分(a)和(b)穩定地整合到該宿主真核細胞的基因組中。在一些實施方式中,組分(a)進一步包括可操作地連接到該第一調節元件的兩個或更多個指導序列,其中當表現時,這兩個或更多個指導序列中的每者都引導Cas9 CRISPR-Cas複合物與真核細胞中的不同靶序列的序列特異性結合。在一些實施方式中,該Cas9經密碼子優化以便在真核細胞中表現。在一些實施方式中,該Cas9引導在該靶序列位置處的一條或兩條股的切割。在一個較佳的實施方式中,該股斷裂係具有5'突出端的交錯切割。在一些實施方式中,該Cas9缺少DNA股切割活性。在一些實施方式中,該第一調節元件係聚合酶III啟動子。在一些實施方式中,該同向重複具有16nt的最小長度和單個莖環。在另外的實施方式中,該同向重複具有長於16nt,較佳的是多於17nt的長度,並且具有多於一個莖環或經優化的二級結構。在一個方面,本發明提供了非人類真核生物;較佳的是多細胞真核生物,包含根據所描述的實施方式中任一項的真核宿主細胞。在其他方面,本發明提供了真核生物;較佳的是多細胞真核生物,包含根據所描 述的實施方式中任一項的真核宿主細胞。在該等方面的一些實施方式中,該生物可以是動物;例如哺乳動物。另外,該生物可以是節肢動物,如昆蟲。該生物也可以是植物。另外,該生物可以是真菌。
在一個方面,本發明提供了套組,該套組包括在此所述的組分中的一種或多種。在一些實施方式中,該套組包括載體系統以及用於使用該套組的說明書。在一些實施方式中,該載體系統包含(a)第一調節元件,該第一調節元件可操作地連接到同向重複序列和一個或多個插入位點,這一個或多個插入位點用於在該DR序列的下游插入一個或多個指導序列,其中在表現時,該指導序列引導Cas9 CRISPR-Cas複合物與真核細胞中的靶序列的序列特異性結合,其中該Cas9 CRISPR-Cas複合物包含與(1)雜交到該靶序列上的指導序列、和(2)該DR序列複合的Cas9;和/或(b)第二調節元件,該第二調節元件可操作地連接至編碼所述Cas9酶的酶編碼序列上,該Cas9酶包含核定位序列,並且有利地這包括本發明的分割型Cas9。在一些實施方式中,該套組包括位於該系統的相同或不同載體上的組分(a)和(b)。在一些實施方式中,組分(a)進一步包括可操作地連接到該第一調節元件的兩個或更多個指導序列,其中當表現時,這兩個或更多個指導序列中的每者都引導Cas9 CRISPR-Cas複合物與真核細胞中的不同靶序列的序列特異性結合。在一些實施方式中,該Cas9包括一個或多個核定位序列,其具有足夠強度來在真核細胞的細胞核中驅動所述Cas9以可檢測的量積聚。在一些實施方式中,該Cas9酶係選自下組的細菌物種的Cas9,該組由以下各項組成:土拉熱弗朗西絲菌1、土拉熱弗朗西絲菌新兇手亞種、易北河普氏菌、毛螺菌科細菌 MC2017 1、分解蛋白丁酸弧菌、Peregrinibacteria細菌GW2011_GWA2_33_10、Parcubacteria細菌GW2011_GWC2_44_17、密斯氏菌屬SCADC、胺基酸球菌屬BV3L6、毛螺菌科細菌MA2020、Candidatus Methanoplasma termitum、挑剔真桿菌、牛莫拉氏菌237、稻田鉤端螺旋體、毛螺菌科細菌ND2006、狗口腔卟啉單胞菌3、狄氏普氏菌、以及獼猴卟啉單胞菌,並且可以包括來源於該等生物的經突變的Cas9。該酶可以是Cas9同系物或異種同源物。在一些實施方式中,該Cas9經密碼子優化以便在真核細胞中表現。在一些實施方式中,該Cas9引導在該靶序列位置處的一條或兩條股的切割。在一較佳的實施方式中,該股斷裂係具有5'突出端的交錯切割。在一些實施方式中,該CRISPR酶缺少DNA股切割活性。在一些實施方式中,該同向重複具有16nt的最小長度和單個莖環。在另外的實施方式中,該同向重複具有長於16nt,較佳的是多於17nt的長度,並且具有多於一個莖環或經優化的二級結構。
在一個方面,本發明提供了修飾在真核細胞中的靶多核苷酸之方法。在一些實施方式中,該方法包括允許Cas9 CRISPR-Cas複合物結合到該靶多核苷酸上以實施所述靶多核苷酸的切割,由此修飾該靶多核苷酸,其中該Cas9 CRISPR-Cas複合物包含與雜交到在所述靶多核苷酸內的靶序列上的指導序列複合的Cas9,其中所述指導序列連接到同向重複序列上。在一些實施方式中,所述切割包括藉由所述Cas9切割在靶序列位置處的一條或兩條股;這包括本發明的分割型Cas9。在一些實施方式中,所述切割導致靶基因的轉錄降低。在一些實施方式中,該方法進一步包括藉由與外源模板多核苷酸同源重組修復所述切割的靶多核苷 酸,其中所述修復導致突變,包括所述靶多核苷酸的一個或多個核苷酸的插入、缺失、或取代。在一些實施方式中,所述突變導致在從包含該靶序列的基因表現的蛋白質中的一個或多個胺基酸改變。在一些實施方式中,該方法進一步包括將一種或多種載體遞送到所述真核細胞,其中這一種或多種載體驅動下列一者或多者的表現:該Cas9、和連接到該DR序列的指導序列。在一些實施方式中,所述載體被遞送到受試者內的真核細胞中。在一些實施方式中,所述修飾發生在細胞培養物中的所述真核細胞中。在一些實施方式中,該方法進一步包括在所述修飾之前從受試者中分離所述真核細胞。在一些實施方式中,該方法進一步包括使所述真核細胞和/或從中衍生的細胞返回到所述受試者中。
在一個方面,本發明提供了修飾多核苷酸在真核細胞中的表現之方法。在一些實施方式中,該方法包括允許Cas9 CRISPR-Cas複合物結合到該多核苷酸上,這樣使得所述結合導致所述多核苷酸的表現增加或降低;其中該Cas9 CRISPR-Cas複合物包含與雜交到所述多核苷酸內的靶序列上的指導序列複合的Cas9,其中所述指導序列連接到同向重複序列;這包括本發明的分割型Cas9。在一些實施方式中,該方法進一步包括將一種或多種載體遞送到所述真核細胞,其中這一種或多種載體驅動下列一者或多者的表現;該Cas9、和連接到該DR序列的指導序列。
在一個方面,本發明提供了產生包含經突變的疾病基因的模式真核細胞之方法。在一些實施方式中,疾病基因係與患有或產生疾病的風險的增加相關聯的任何基因。在一些實施方式中,該方法包括(a)向真核細胞中引入一種或多種載體,其中這一種或多種載體驅動下列一 者或多者的表現:Cas9、和連接到同向重複序列的指導序列;並且(b)允許Cas9 CRISPR-Cas複合物結合到靶多核苷酸上以實施在所述疾病基因內的該靶多核苷酸的切割,其中該Cas9 CRISPR-Cas複合物包含與(1)雜交到該靶多核苷酸內的靶序列上的指導序列、和(2)該DR序列複合的Cas9,由此產生包含經突變的疾病基因的模式真核細胞;這包括本發明的分割型Cas9。在一些實施方式中,所述切割包括藉由所述Cas9切割在靶序列位置處的一條或兩條股。在一較佳的實施方式中,該股斷裂係具有5'突出端的交錯切割。在一些實施方式中,所述切割導致靶基因的轉錄降低。在一些實施方式中,該方法進一步包括藉由與外源模板多核苷酸同源重組修復所述切割的靶多核苷酸,其中所述修復導致突變,包括所述靶多核苷酸的一個或多個核苷酸的插入、缺失、或取代。在一些實施方式中,所述突變導致在從包含該靶序列的基因表現的蛋白質中的一個或多個胺基酸改變。
在一個方面,本發明提供了用於研發生物活性劑之方法,該生物活性劑調製與疾病基因相關的細胞傳訊事件。在一些實施方式中,疾病基因係與患有或產生疾病的風險的增加相關聯的任何基因。在一些實施方式中,該方法包括(a)使測試化合物與所描述實施方式中任一項的模式細胞接觸;並且(b)檢測讀數變化,該變化指示與所述疾病基因的所述突變關聯的細胞傳訊事件的減少或增加,由此開發調節與所述疾病基因關聯的所述細胞傳訊事件的所述生物活性劑。
在一個方面,本發明提供了包含同向重複序列下游的指導序列的重組多核苷酸,其中當表現時,該指導序列引導Cas9 CRISPR-Cas 複合物與存在於真核細胞中的對應的靶序列的序列特異性結合。在一些實施方式中,該靶序列係存在於真核細胞中的病毒序列。在一些實施方式中,該靶序列係原癌基因或癌基因。
在一個方面,本發明提供了藉由在一種或多種細胞的基因中引入一個或多個突變來選擇一種或多種細胞之方法,該方法包括:將一種或多種載體引入這一種或多種細胞中,其中這一種或多種載體驅動下列一者或多者的表現:Cas9、連接至同向重複序列上的指導序列、和編輯模板;其中該編輯模板包含消除Cas9切割的一個或多個突變;允許該編輯模板與靶多核苷酸在有待篩選的一種或多種細胞中進行同源重組;允許Cas9 CRISPR-Cas複合物結合到靶多核苷酸上以實施在所述基因內的該靶多核苷酸的切割,其中該Cas9 CRISPR-Cas複合物包含與(1)雜交到該靶多核苷酸內的靶序列上的指導序列、和(2)該同向重複序列複合的Cas9,其中該Cas9 CRISPR-Cas複合物與該靶多核苷酸的結合誘導細胞死亡,由此允許選擇其中已經引入一個或多個突變的一種或多種細胞;這包括本發明的分割型Cas9。在本發明的另一個較佳的實施方式中,該有待選擇的細胞可以是真核細胞。本發明的方面允許選擇特異細胞,而不需要選擇標記或可能包括反選擇系統的兩步法。
在本文,存在短語“這包括本發明的分割型Cas9”或類似文本;並且,這係表明在本文的實施方式中的Cas9可以是如本文討論的分割型Cas9。
在一方面,本發明涉及非天然存在的或工程化的誘導型Cas9 CRISPR-Cas系統,該系統包含附接至誘導型異二聚體的第一個一半 的第一Cas9融合構建體和附接至該誘導型異二聚體的第二個一半的第二Cas9融合構建體,其中該第一Cas9融合構建體可操作地連接至一個或多個核定位信號,其中該第二Cas9融合構建體可操作地連接至核輸出信號,其中與誘導物能量源接觸使該誘導型異二聚體的第一個一半和第二個一半聚到一起,其中使該誘導型異二聚體的第一個一半和第二個一半聚到一起允許該第一Cas9融合構建體和該第二Cas9融合構建體構成功能性Cas9 CRISPR-Cas系統,其中該Cas9 CRISPR-Cas系統包含指導RNA(gRNA),該指導RNA包含能夠雜交到細胞中的感興趣的基因組座位中的靶序列上的指導序列,並且其中該功能性Cas9 CRISPR-Cas系統編輯該基因組座位以改變基因表現。在本發明的一實施方式中,該誘導型異二聚體的第一個一半係FKBP12並且該誘導型異二聚體的第二個一半係FRB。在本發明的另一個實施方式中,該誘導物能量源係雷帕黴素。
誘導物能量源可以被簡單地認為是誘導物或二聚化劑。出於一致性,本文始終使用術語‘誘導物能量源’。該誘導物能量源(或誘導物)用以重構Cas9。在一些實施方式中,該誘導物能量源藉由誘導型二聚體的兩個一半的作用使Cas9的兩個部分聚到一起。因此誘導型二聚體的兩個一半在誘導物能量源的存在下被聚到一起。二聚體的兩個一半在沒有誘導物能量源的情況下將不形成到二聚體(二聚化)。
因此,誘導型二聚體的兩個一半與誘導物能量源協作,以二聚化該二聚體。這進而藉由使Cas9的第一部分和第二部分聚到一起而重構Cas9。
CRISPR酶融合構建體各自包含分割型Cas9的一部分。該 等構建體較佳的是經由接頭(如本文描述的GlySer接頭)融合至該二聚體的兩個一半之一。該二聚體的兩個一半可以是基本上相同的一起形成同二聚體的兩種單體,或者它們可以是不同的一起形成異二聚體的單體。因此,兩種單體可以被認為是整個二聚體的一半。
在Cas9酶的兩個部分實質上包含功能化Cas9的意義上,該Cas9係分割型的。該Cas9可以充當基因組編輯酶(當與靶DNA和指導物形成複合物時),如切口酶或核酸酶(切割DNA的兩條股),或者它可以是基本上作為具有非常少的或沒有催化活性的DNA結合蛋白的失活的Cas9,這典型地是由於其催化結構域中的一個或多個突變。
分割型Cas9的兩個部分可以被認為是該分割型Cas9的N’末端部分和C’末端部分。融合典型地是在Cas9的分割點。換言之,分割型Cas9的C’末端或N’末端部分融合至二聚體兩個一半之一,同時N’末端的C’末端部分融合至二聚體的另一半。
在斷裂係新產生的意義上,Cas9不一定係分割型的。典型地經由電腦類比設計分割點並將其選殖到構建體中。總之,分割型Cas9的兩個部分(N’末端和C’末端部分)形成完整的Cas9,較佳的是包含至少70%或更多的野生型胺基酸(或編碼它們的核苷酸),較佳的是至少80%或更多、較佳的是至少90%或更多、較佳的是至少95%或更多並且最較佳的是至少99%或更多的野生型胺基酸(或編碼它們的核苷酸)。一些修剪係可能的,並且設想了突變體。可以完全去除非功能結構域。重要的是,這兩個部分可以被聚到一起並且所希望的Cas9功能被恢復或重構。
該二聚體可以是同二聚體或異二聚體。
可以在與第一Cas9構建體的可操作連接中使用一個或多個(較佳的是兩個)NLS。可以在與第一Cas9構建體的可操作連接中使用一個或多個(較佳的是兩個)NES。NLS和/或NES較佳的是在分割型Cas9-二聚體(即,半二聚體)融合的側翼,即,一個NLS可以定位在第一Cas9構建體的N’末端並且一個NLS可以定位在第一Cas9構建體的C’末端。類似地,一個NES可以定位在第二Cas9構建體的N’末端並且一個NES可以定位在第二Cas9構建體的C’末端。當提及N’或C’末端時,應當理解的是,該等末端對應於相應核苷酸序列中的5’端和3’端。
一較佳的安排係第一Cas9構建體被安排成5’-NLS-(N’末端Cas9部分)-接頭-(二聚體的第一個一半)-NLS-3’。一較佳的安排係第二Cas9構建體被安排成5’-NES--(二聚體的第二個一半)-接頭-(C’末端Cas.9部分)-NES-3’。適合的啟動子較佳的是在該等構建體各自的上游。這兩種構建體可以分開或一起遞送。
在一些實施方式中,與第二Cas9構建體的可操作連接中的一個或全部NES可以被換為NLS。然而,這典型地可能不是較佳的,並且在其他實施方式中,與第二Cas9構建體的可操作連接的定位信號係一個或多個NES。
還應當理解的是,NES可以可操作地連接至分割型Cas9的N’末端片段,並且NLS可以可操作地連接至分割型Cas9的C’末端片段。然而,可以較佳的是這樣的安排,其中NLS可操作地連接至分割型Cas9的N’末端片段並且NES可操作地連接至分割型Cas9的C’末端片段。
NES用以將第二Cas9融合構建體定位在細胞核外,至少直 到提供誘導物能量源(例如,至少直到向誘導物提供能量源以執行其功能)。誘導物的存在刺激兩種Cas9融合物在細胞質中二聚化並且使得對於二聚化的第一和第二Cas9融合物定位至細胞核而言在熱力學上有價值。不被理論所束縛,申請人認為NES將第二Cas9融合物螯合到細胞質上(即,細胞核外)。第一Cas9融合物上的NLS將它定位至細胞核。在兩種情況下,申請人使用NES或NLS將平衡(核運輸的平衡)轉向希望的方向。二聚化典型地發生細胞核外(非常小的部分可能發生在細胞核中)並且二聚化的複合物上的NLS將核運輸平衡轉向核定位,因此二聚化並且因此重構的Cas9進入細胞核。
有益地,申請人能夠在分割型Cas9中重構功能。使用暫態轉染來證明這個概念並且二聚化在存在誘導物能量源的背景下發生。沒有看到Cas9的分開片段具有活性。然後使用藉由慢病毒遞送的穩定表現使其顯現出並且顯示可以使用分割型Cas9方法。
本發明的這種分割型Cas9方法係有益的,因為它允許誘導Cas9活性,因此允許時間控制。此外,可以使用不同的定位序列(即,NES和NLS係較佳的),以減少來自自動組裝複合物的背景活性。還可以使用組織特異性啟動子(例如第一和第二Cas9融合構建體各自的啟動子)用於組織特異性靶向,由此提供空間控制。可以使用兩種不同的組織特異性啟動子來發揮更好程度的控制,如果需要的話。就階段特異性啟動子而言可以使用相同的方法或者可以存在階段和組織特異性啟動子的混合物,其中第一和第二Cas9融合構建體之一處於組織特異性啟動子的控制下(即可操作地連接至或包含該啟動子),同時第一和第二Cas9融合構 建體中的另一者處於階段特異性啟動子的控制下(即可操作地連接至或包含該啟動子)。
誘導型Cas9 CRISPR-Cas系統包含一個或多個核定位序列(NLS),如在此所描述的,例如像可操作地連接至第一Cas9融合構建體。該等核定位序列理想地具有足夠的強度,以便驅動所述第一Cas9融合構建體在真核細胞的細胞核中以可檢測的量積聚。不希望被理論所束縛,認為核定位序列對於真核生物中的Cas9 CRISPR-Cas複合物活性不是必要的,但包括此類序列增強該系統的活性,尤其對於靶向細胞核中的核酸分子而言,並且幫助操作本發明的2-部分系統。
同樣地,第二Cas9融合構建體可操作地連接至核輸出序列(NES)。的確,它可以連接至一個或多個核輸出序列。換言之,與第二Cas9融合構建體一起使用的輸出序列的數目較佳的是1或2或3。典型地2係較佳的,但是在一些實施方式中1係足夠的並且因此係較佳的。NLS和NES的適合實例在本領域係已知的。例如,較佳的核輸出信號(NES)係人類蛋白酪胺酸激酶2。較佳的信號將是物種特異性的。
在使用FRB和FKBP系統的情況下,FKBP的側翼較佳的是核定位序列(NLS)。在使用FRB和FKBP系統的情況下,較佳的安排係N’末端Cas9-FRB-NES:C’末端Cas9-FKBP-NLS。因此,第一Cas9融合構建體將包含C’末端Cas9部分並且第二Cas9融合構建體將包含N’末端Cas9部分。
本發明的另一個有益方面係它可以被快速開啟,即具有快速響應。不被理論所束縛,認為Cas9活性可以藉由二聚化現有(已經存 在)的融合構建體(藉由與誘導物能量源接觸)進行誘導,這比藉由表現(尤其是翻譯)新的融合構建體更迅速。因此,第一和第二Cas9融合構建體可以提前在靶細胞中進行表現,即需要Cas9活性之前。然後可以在時間上控制Cas9活性並且然後藉由添加誘導物能量源來快速構建,這理想地比藉由表現(包括轉錄的誘導)由例如載體遞送的Cas9更快速地起作用(以二聚化異二聚體並且由此提供Cas9活性)。
除非另外顯而易見的,術語Cas9或Cas9酶和CRISPR酶在本文可互換地使用。
申請人證明Cas9可以被分割成兩種組分,當被聚回到一起時其重構功能性核酸酶。採用雷帕黴素敏感型二聚化結構域,申請人產生了用於對Cas9介導的基因組編輯和轉錄調節進行時間控制的化學誘導型Cas9。換句話說,申請人證明藉由被分割成兩個片段可以使Cas9成為化學誘導型的,並且雷帕黴素敏感型二聚化結構域可以被用於Cas9的受控重組裝。申請人表明重組裝的Cas9可以用來介導基因組編輯(藉由核酸酶/切口酶活性)以及轉錄調節(作為DNA結合結構域,所謂的‘‘失活的Cas9”)。
因此,使用雷帕黴素敏感型二聚化結構域係較佳的。Cas9的重組裝係較佳的。可以藉由恢復結合活性來確定重組裝。在Cas9係切口酶或誘導雙股斷裂的情況下,本文描述了相比於野生型的適合的比較百分比。
雷帕黴素處理可以持續12天。劑量可以是200nM。這種時間和/或莫耳劑量係針對人類胚腎293FT(HEK293FT)細胞系的適當劑 量的實例並且這可以用在其他的細胞系中。這個數字可以被外推用於體內治療應用,例如以mg/kg計。然而,還可以設想的是,這裡還使用了用於向受試者給予雷帕黴素的標準劑量。所謂“標準劑量”意指在雷帕黴素的正常治療應用或主要適應症下的劑量(即當給予雷帕黴素用於預防器官排斥時使用的劑量)。
值得注意的是,Cas9-FRB/FKBP段的較佳的是安排係分開且無活性的,直到雷帕黴素誘導的FRB和FKBP的二聚化導致功能性全長Cas9核酸酶的重組裝。因此,較佳的是附接至誘導型異二聚體的第一個一半的第一Cas9融合構建體與附接至誘導型異二聚體的第二個一半的第二Cas9融合構建體分開遞送和/或分開定位。
為了將Cas9(N)-FRB片段螯合在細胞質中,在細胞質中它不太可能與核定位的Cas9(C)-FKBP片段二聚化,較佳的是在Cas9(N)-FRB上使用來自人類蛋白酪胺酸激酶2的單個核輸出序列(NES)(Cas9(N)-FRB-NES)。在雷帕黴素的存在下,Cas9(N)-FRB-NES與Cas9(C)-FKBP-2xNLS二聚化,以重構完整的Cas9蛋白,其將核運輸平衡轉向核輸入並且允許DNA靶向。
高劑量的Cas9可以加重脫靶(OT)序列處的indel頻率,該等序列展現出與指導股的幾個錯配。此類序列係尤其敏感的,如果錯配係非連續的和/或在指導物的種子區外的話。因此,Cas9活性的時間控制可以用於降低長期表現實驗中的劑量並且因此與組成型活性的Cas9相比,產生減少的脫靶indel。
病毒遞送係較佳的。具體而言,設想了慢病毒或AAV遞 送載體。申請人產生了分割型-Cas9慢病毒構建體,類似於lentiCRISPR質粒。分割段應足夠小以配合AAV的約4.7kb的尺寸限制。
申請人證明,分割型Cas9的穩定的、低拷貝表現可以用於在靶向的座位處誘導實質性indel而不在脫靶位點處引起顯著的突變。申請人選殖了Cas9片段(基於本文描述的分割5的2個部分)。
還可以使用失活的Cas9,其包含VP64反式活化結構域,例如添加至Cas9(C)-FKBP-2xNLS(失活的Cas9(C)-FKBP-2xNLS-VP64)。該等片段重構無催化活性的Cas9-VP64融合物(失活的Cas9-VP64)。在雷帕黴素的存在下藉由VP64誘導轉錄活化,以誘導Cas9(C)-FKBP融合物和Cas9(N)-FRB融合物的二聚化。換言之,申請人測試了分割型失活的Cas9-VP64的可誘導性並且顯示在雷帕黴素的存在下藉由分割型失活的Cas9-VP64誘導轉錄活化。因此,本發明的誘導型Cas9可以與一個或多個功能結構域(如轉錄活化蛋白或抑制蛋白或核酸酶(如Fok1))關聯。功能結構域可以結合至或與分割型Cas9的一部分融合。
較佳的安排係第一Cas9構建體被安排成5’-第一定位信號-(N’末端Cas9部分)-接頭-(二聚體的第一個一半)-第一定位信號-3’並且第二Cas9構建體被安排成5’-第二定位信號--(二聚體的第二個一半)-接頭-(C’末端Cas9部分)-第二定位信號-功能結構域-3’。這裡,功能結構域被放置在第二Cas9構建體的3’端。可替代地,功能結構域可以被放置在第一Cas9構建體的5’端。可以在3’端或5’端或在兩端使用一個或多個功能結構域。適合的啟動子較佳的是在該等構建體各自的上游。這兩種構建體可 以分開或一起遞送。定位信號可以是NLS或NES,只要它們在每種構建體中不相互混雜即可。
在一個方面,本發明提供了誘導型Cas9 CRISPR-Cas系統,其中該Cas9當與不具有至少一個突變的Cas9酶相比時具有降低至少97%或100%的核酸酶活性。
因此,還較佳的是該Cas9係失活的Cas9。理想地,分割應當始終係這樣的,使得這一個或多個催化結構域不受影響。對於失活的Cas9,意圖係發生DNA結合,但是不顯示切割或切口酶活性。
在一個方面,本發明提供了如本文討論的誘導型Cas9 CRISPR-Cas系統,其中一個或多個功能結構域與該Cas9關聯。這個功能結構域可以與分割型Cas9的一部分或兩部分關聯(即,結合至其上或與其融合)。可以存在與分割型Cas9的兩個部分各自關聯的功能結構域。因此,該等功能結構域可以典型地被提供為第一和/或第二Cas9融合構建體的部分,作為該構建體內的融合物。功能結構域典型地經由接頭(如GlySer接頭)融合,如本文討論的。這一個或多個功能結構域可以是轉錄活化結構域或抑制蛋白結構域。儘管它們可以是不同的結構域,但是較佳的是所有功能結構域係活化蛋白或抑制蛋白並且不使用兩者的混合物。
轉錄活化結構域可以包含VP64、p65、MyoD1、HSF1、RTA或SET7/9。
在一方面,本發明提供了如本文討論的誘導型Cas9 CRISPR-Cas系統,其中與該Cas9關聯的一個或多個功能結構域係轉錄抑制結構域。
在一方面,本發明提供了如本文討論的誘導型Cas9 CRISPR-Cas系統,其中轉錄抑制結構域係KRAB結構域。
在一方面,本發明提供了如本文討論的誘導型Cas9 CRISPR-Cas系統,其中轉錄抑制結構域係NuE結構域、NcoR結構域、SID結構域或SID4X結構域。
在一方面,本發明提供了如本文討論的誘導型Cas9 CRISPR-Cas系統,其中與轉接蛋白關聯的一個或多個功能結構域具有一種或多種活性,包括修飾院酶活性、去甲酶活性、轉錄活化活性、轉錄抑制活性、轉錄釋放因子活性、組蛋白修飾活性、RNA切割活性、DNA切割活性、DNA整合活性或核酸結合活性。
在一些實施方式中,組蛋白修飾結構域也是較佳的。下文討論了示例性組蛋白修飾結構域。轉位酶結構域、HR(同源重組)機構結構域、重組酶結構域和/或整合酶結構域作為本發明的功能結構域也是較佳的。在一些實施方式中,DNA整合活性包括HR機構結構域、整合酶結構域、重組酶結構域和/或轉位酶結構域。
在一方面,本發明提供了如本文討論的誘導型Cas9 CRISPR-Cas系統,其中DNA切割活性係由於核酸酶。
在一方面,本發明提供了如本文討論的誘導型Cas9 CRISPR-Cas系統,其中核酸酶包括Fok1核酸酶。
此類功能結構域(其與本發明的分割型Cas9系統係較佳的)的用途還詳細討論在康納爾曼(Konermann)等人(“用工程化的 CRISPR-Cas9複合物進行的基因組範圍內的轉錄活化(Genome-scale transcriptional activation with an engineered CRISPR-Cas9 complex)”《自然》(Nature)公開於2014年12月11日)中。
本發明的系統可以與任何指導一起使用。
在某些實施方式中可以使用經修飾的指導物。特別較佳的是採用以上提及的康納爾曼(Konermann)(《自然》(Nature),2014年12月11日)論文的傳授的指導物。修飾該等指導物,這樣使得添加蛋白質結合RNA部分(如適配體)。這樣一個或多種部分可以替換該指導物的一部分。然後相應的RNA結合蛋白結構域可以用於識別RNA並且將功能結構域(如本文描述的那些)募集到指導物。這主要用於與失活的Cas9一起使用,藉由核酸酶(如Fok1)導致轉錄活化或抑制或DNA切割。此類指導物與失活的Cas9結合使用係強大的,並且是尤其強大的,如果該Cas9本身還與其自身的功能結構域(如本文討論的)關聯的話。當失活的Cas9(具有或不具有其自身的關聯功能結構域)被誘導以根據本發明重構,即作為分割型Cas9,則該工具係尤其有用的。
指導RNA(gRNA)(還較佳的是用於在本發明中)可以包含指導序列,該指導序列能夠雜交到細胞中的感興趣的基因組座位中的靶序列上,其中該gRNA藉由插入一個或多個不同的RNA序列而被修飾,這一個或多個RNA序列結合至一種或多種轉接蛋白,並且其中該轉接蛋白與一個或多個功能結構域關聯。該Cas9可以包含至少一個突變,這樣使得該Cas9酶具有不超過5%的不具有這至少一個突變的Cas9酶的核酸酶活性;和/或至少一個或多個核定位序列。還提供了非天然存在的或 工程化的組成物,該組成物包含:一種或多種指導RNA(gRNA),其包含能夠雜交到細胞中的感興趣的基因組座位中的靶序列上的指導序列;Cas9酶,其包含至少一個或多個核定位序列,其中該Cas9酶包含至少一個突變,這樣使得該Cas9酶具有不超過5%的不具有這至少一個突變的Cas9酶的核酸酶活性,其中至少一種gRNA藉由插入結合至一種或多種轉接蛋白的一個或多個不同RNA序列而被修飾,並且其中該轉接蛋白與一個或多個功能結構域關聯。
該gRNA較佳的是藉由插入結合至一種或多種轉接蛋白的一個或多個不同RNA序列而被修飾。插入的結合至一種或多種轉接蛋白的一個或多個不同RNA序列較佳的是對相同的或不同的轉接蛋白具有特異性的適配體序列或者兩個或更多個適配體序列。轉接蛋白較佳的是包括MS2、PP7、Qβ、F2、GA、fr、JP501、M12、R17、BZ13、JP34、JP500、KU1、M11、MX1、TW18、VK、SP、FI、ID2、NL95、TW19、AP205、ΦCb5、ΦCb8r、ΦCb12r、ΦCb23r、7s、PRR1。尤其穩定表現分割型失活的Cas9的細胞系可以是有用的。
申請人證明,Cas9可以被分割成兩個不同的片段,當使用化學誘導被聚回到一起時其重構功能性全長Cas9核酸酶。分割型Cas9構造將有用於多種應用。例如,分割型Cas9可以允許藉由將每個片段放在不同的組識特異性啟動子之下而將Cas9活性限制在交叉的細胞群的遺傳策略。另外,還可以採用不同的化學誘導型二聚化結構域(如APA)和赤黴素。
該誘導物能量源較佳的是化學誘導。
分割位置或地點係Cas9酶的第一部分與第二部分分開的點。在一些實施方式中,第一部分將包含或編碼胺基酸1至X,同時第二部分將包含或編碼胺基酸X+1至端點。在這個實例中,編號係連續的,但是這可能不總係必要的,因為胺基酸(或編碼它們的核苷酸)可以從分割端的任一端修剪下來,其條件係保留足夠的DNA結合活性和(如果需要的話)DNA切口酶或切割活性,例如相比於野生型Cas9至少40%、50%、60%、70%、80%、90%或95%的活性。
本文提供的示例性編號可以參考野生型蛋白,較佳的是野生型FnCas9。然而,設想的是可以使用野生型Cas9的(如FnCas9蛋白的)突變體。編號還可以不完全遵循FnCas9編號,因為例如可以使用一些N’或C’末端截短或缺失,但是這可以使用標準序列比對工具解決。作為序列比對工具,異種同源物也是較佳的。
因此,可以使用本領域的普通技術選擇分割位置,例如基於晶體數據和/或計算結構預測。
例如,Cas9核酸酶一級結構的計算分析揭示了三個不同區域(圖1)。第一個係C-末端RuvC樣結構域,其係唯一的功能表征結構域。第二個係N-末端α-螺旋區域並且第三個係混合α和β區,其位於RuvC樣結構域與α-螺旋區之間。在Cas9一級結構內預測出若干小段的非結構化區域。被暴露於溶劑並且在不同Cas9異種同源物內不保守的非結構化區域可以代表較佳的分割側(圖2和圖3)。
下表呈現了As和LbCas9內的潛在的非限制性分割區。這樣一個區域內的分割位點可以是合時宜的。
Figure 112128864-A0101-12-0250-262
對於Fn、As和Lb Cas9突變體,應該容易地顯而易見的是例如基於序列比對,潛在的分割位點的相應位置係什麼。對於非Fn、As和Lb酶,可以使用異種同源物的晶體結構,如果該異種同源物與預期Cas9之間存在相對較高程度的同源性的話,或者可以使用計算預測。
理想地,分割位置應當位於區域或環內。較佳的是,在胺基酸序列的中斷不會引起結構特徵(例如α-螺旋或-β片層)的部分或完全破壞的地方出現分割位置。非結構化區域(在晶體結構中不顯現的區域,因為該等區域不足夠結構化以在晶體中“凍住”)通常是較佳的選擇。申請人可以例如在暴露於Cas9表面的非結構化區域中進行分割。
申請人可以遵循作為較佳的實例並且作為指南提供的以下程序。由於非結構化區域並不顯現在晶體結構中,申請人交叉參考了具有Cas9的一級胺基酸序列的晶體周圍的胺基酸序列。每個非結構化區域可以例如由約3至10個胺基酸構成,這並沒有顯現在晶體中。申請人因此在該等胺基酸之間進行分割。為了包括更多的潛在分割側,申請人使用與非結構化區域相同的標準包括了位於Cas9外的環中的分割。
在一些實施方式中,分割位置在Cas9的外側環中。在其他較佳的實施方式中,分割位置在Cas9的非結構化區域中。非結構化區典型地是高度撓性的外側環,其結構不能從晶體圖案中容易地確定。
一旦已經鑒定出分割位置,便可以設計適合的構建體。
典型地,NES被定位在分割胺基酸的第一部分的N’末端(或編碼它的核苷酸的5’端)。那樣的話,NLS被定位在分割胺基酸的第二部分的C’末端(或編碼它的核苷酸的3’端)。以此方式,第一Cas9融合構建體可以可操作地連接至一個或多個核輸出信號,並且第二Cas9融合構建體可以可操作地連接至核定位信號。
當然,可以提供相反的安排,其中NLS被定位在分割胺基酸的第一部分的N’末端(或編碼它的核苷酸的5’端)。那樣的話,NES被定位在分割胺基酸的第二部分的C’末端(或編碼它的核苷酸的3’端)。因此,第一Cas9融合構建體可以可操作地連接至一個或多個核定位信號,並且第二Cas9融合構建體可以可操作地連接至核輸出信號。
出於包裝目的,保持兩個部分(分割的兩側)長度大致相同的分割可以是有利的。例如,認為當轉錄物的尺寸大約相同時更易於維持兩個段之間的化學計量。
在某些實例中,人類密碼子優化的Cas9(如FnCas9)的N-末端和C-末端段被分別融合到FRB和FKBP二聚化結構域。這種安排可以是較佳的。可以將它們進行切換(即,N’末端融合到FKBP並且C’末端融合到FRB)。
較佳的是在本文中使用接頭(如(GGGGS)3),以將Cas9片段與二聚化結構域分開。(GGGGS)3係較佳的,因為是相對較長的接頭(15個胺基酸)。甘胺酸殘基最具撓性並且絲胺酸殘基提高了接頭在蛋白質外的機會。(GGGGS)6、(GGGGS)9或(GGGGS)12可以較佳的是用作替代 物。其他較佳的替代物係(GGGGS)1、(GGGGS)2、(GGGGS)4、(GGGGS)5、(GGGGS)7、(GGGGS)8、(GGGGS)10或(GGGGS)11
例如,(GGGGS)3可以被包括在N’末端Cas9片段與FRB之間。例如,(GGGGS)3可以被包括在FKB與C’末端Cas9片段之間。
替代接頭係可獲得的,但是高度撓性接頭被認為最佳地起作用,以允許有最大機會將Cas9的2部分聚在一起並且因此重構Cas9活性。一替代方案係核質蛋白的NLS可以用作接頭。
接頭還可以用在Cas9與任何功能結構域之間。再一次,這裡可以使用(GGGGS)3接頭(或其6、9或12個重複形式),或者核質蛋白的NLS可以用作Cas9與功能結構域之間的接頭。
設想了FRB/FKBP系統的替代物。例如,ABA和赤黴素系統。
因此,FKBP家族的較佳的實例係以下任何一種誘導型系統。在FK506的存在下與鈣調磷酸酶(Calcineurin)A(CNA)二聚化的FKBP;在FKCsA的存在下與CyP-Fas二聚化的FKBP;在雷帕黴素的存在下與FRB二聚化的FKBP;在庫馬黴素的存在下與GryB二聚化的GyrB;在赤黴素的存在下與GID1二聚化的GAI;或在HaXS的存在下與HaloTag二聚化的Snap-tag。
FKBP家族本身的替代物也是較佳的。例如,在FK1012的存在下進行同二聚化的FKBP(即,一個FKBP與另一個FKBP二聚化)。因此,還提供了非天然存在的或工程化的誘導型Cas9 CRISPR-Cas系統, 該系統包含:
第一Cas9融合構建體,其附接至誘導型同二聚體的第一個一半,和
第二Cas9融合構建體,其附接至該誘導型同二聚體的第二個一半,
其中該第一Cas9融合構建體可操作地連接至一個或多個核定位信號,
其中該第二Cas9融合構建體可操作地連接至(視情況一個或多個)核輸出信號,
其中與誘導物能量源接觸使該誘導型同二聚體的第一個一半和第二個一半聚到一起,
其中使該誘導型同二聚體的該第一個一半和該第二個一半聚到一起允許該第一Cas9融合構建體和該第二Cas9融合構建體構成功能性Cas9 CRISPR-Cas系統,
其中該Cas9 CRISPR-Cas系統包含指導RNA(gRNA),該指導RNA包含能夠雜交到細胞中的感興趣的基因組座位中的靶序列上的指導序列,並且
其中該功能性Cas9 CRISPR-Cas系統結合至該靶序列,並且視情況,編輯該基因組座位以改變基因表現。
在一個實施方式中,同二聚體較佳的是FKBP並且誘導物能量源較佳的是FK1012。在另一個實施方式中,同二聚體較佳的是GryB 並且誘導物能量源較佳的是庫馬黴素。在另一個實施方式中,同二聚體較佳的是ABA並且誘導物能量源較佳的是赤黴素。
在其他實施方式中,該二聚體係異二聚體。異二聚體的較佳的實例係以下任何一種誘導型系統:在FK506的存在下與鈣調磷酸酶A(CNA)二聚化的FKBP;在FKCsA的存在下與CyP-Fas二聚化的FKBP;在雷帕黴素的存在下,在庫馬黴素的存在下與FRB二聚化的FKBP;在赤黴素的存在下與GID1二聚化的GAI;或在HaXS的存在下與HaloTag二聚化的Snap-tag。
申請人使用FKBP/FRB,因為它被良好地表徵並且兩個結構域都足夠小(<100個胺基酸),以幫助包裝。此外,雷帕黴素已經被使用了好久並且副作用被很好地理解。大的二聚化結構域(>300 aa)也應起作用,但是可能需要更長的接頭以允許Cas9重構。
保羅姆魯甘(Paulmurugan)和甘比爾(Gambhir)(《癌症研究》(Cancer Res),2005年8月15日65;7413)討論了FRB/FKBP/雷帕黴素的背景。另一篇有用的論文係克拉布特裡(Crabtree)等人(《化學與生物學》(Chemistry & Biology)13,99-107,2006年6月)的文章。
在一實例中,構建了表現盒(質粒)。gRNA處於U6啟動子的控制下。使用兩個不同的Cas9分割物。分割型Cas9構建體係基於以下項的:第一Cas9融合構建體,其側翼為NLS,其中FKBP經由GlySer接頭融合至分割型Cas9的C末端部分;以及第二Cas9融合構建體,其側翼為NES,其中FRB經由GlySer接頭與分割型Cas9的N末端部分融合。為了分開第一和第二Cas9融合構建體,在轉錄分割中使用P2A。在雷帕黴素的存 在下,分割型Cas9顯示出與野生型類似的indel形成,但是在不存在雷帕黴素的情況下indel形成比野生型明顯要低。
因此,提供了單個載體。該載體包含:
第一Cas9融合構建體,其附接至誘導型二聚體的第一個一半,和
第二Cas9融合構建體,其附接至該誘導型二聚體的第二個一半,
其中該第一Cas9融合構建體可操作地連接至一個或多個核定位信號,
其中該第二Cas9融合構建體可操作地連接至一個或多個核輸出信號,
其中與誘導物能量源接觸使該誘導型異二聚體的該第一個一半和該第二個一半聚到一起,
其中使該誘導型異二聚體的該第一個一半和該第二個一半聚到一起允許該第一Cas9融合構建體和該第二Cas9融合構建體構成功能性Cas9 CRISPR-Cas系統,
其中該Cas9 CRISPR-Cas系統包含指導RNA(gRNA),該指導RNA包含能夠雜交到細胞中的感興趣的基因組座位中的靶序列上的指導序列,並且
其中該功能性Cas9 CRISPR-Cas系統結合至該靶序列,並且視情況,編輯該基因組座位以改變基因表現。該等元件較佳的是被提供在單個構建體(如表現盒)上。
第一Cas9融合構建體在每端較佳的是側接至少一個核定 位信號。第二Cas9融合構建體在每端較佳的是側接至少一個核輸出信號。
還提供了治療對其有需要的受試者之方法,該方法包括藉由用編碼系統的多核苷酸或本發明的任何載體轉化該受試者而誘導基因編輯並且向該受試者給予誘導物能量源。還可以提供適合的修復模板,例如藉由包含所述修復模板的載體遞送該修復模板。
還提供了治療對其有需要的受試者之方法,該方法包括藉由用編碼本發明的系統的多核苷酸或本發明的任何載體轉化該受試者而誘導轉錄活化或抑制,其中所述多核苷酸或載體編碼或包含無催化活性的Cas9和一個或多個關聯功能結構域;該方法進一步包括向該受試者給予誘導物能量源。
還提供了用於在所述治療方法中使用的包含本發明的系統的組成物。還提供了本發明的系統在用於這樣的治療方法的藥劑的製造中之用途。
在本文或在本文引用的文獻中描述了可藉由本發明的系統治療的病症的實例。
單個載體可以包含轉錄物分割劑,如P2A。P2A將轉錄物分割為兩個,以將第一和第二Cas9融合構建體分開。分割係由於“核糖體跳過”。實質上,在翻譯過程中核糖體跳過胺基酸,這破壞了蛋白鏈並且產生兩個單獨的多肽/蛋白。單個載體還有用於低背景活性不是問題但是高誘導型活性係所希望的應用。
一個實例係選殖胚胎幹細胞系的產生。正常程序係用編碼 wt Cas9或Cas9切口酶的質粒進行暫態轉染。該等質粒產生Cas9分子,該等分子保留活性持續若干天並且具有更高的脫靶活性機會。使用分割型Cas9的單個表現載體允許將“高”Cas9活性限制在較短的時間窗(例如,一個劑量的誘導物,如雷帕黴素)。在沒有連續(每日)誘導物(例如雷帕黴素)處理的情況下,單個表現分割型Cas9載體的活性較低並且呈現出減少的引起不想要的脫靶效應的機會。
經誘導的Cas9活性的峰值在一些實施方式中是有益的並且可以使用單個遞送載體最容易地引起,但是藉由雙載體系統(每個載體遞送分割型Cas9的一半)也是可能的。峰值可以是較高活性並且持續較短時段,典型地是誘導物的壽命。
因此,提供了用於產生選殖胚胎幹細胞系之方法,該方法包括用編碼本發明的系統的多核苷酸或本發明的一種載體轉染一種或多種胚胎幹細胞以表現本發明的分割型Cas9並且向這一種或多種幹細胞給予本發明的誘導物能量源或使這一種或多種幹細胞與本發明的誘導物能量源接觸以誘導Cas9的重構。可以提供修復模板。
正如在本文描述的所有方法,應當理解的是將需要適合的gRNA或指導物。
在功能性結構域等與酶的一部分或其他部分“關聯”的情況下,該等係典型的融合物。這裡相對於一個分子如何與另一個分子‘關聯’,例如在Cas9的部分與功能結構域之間,使用術語“與...關聯”。在這樣的蛋白質-蛋白質相互作用的情況下,可以按抗體識別表位的方式就識別而論看待這種關聯。可替代地,一種蛋白可以經由這兩種 蛋白的融合物與另一蛋白關聯,例如一個亞基融合至另一亞基。融合典型地藉由將一種蛋白的胺基酸序列添加至另一蛋白的胺基酸序列上而發生,例如經由一起剪接編碼每種蛋白或亞基的核苷酸序列。可替代地,這基本上可以被視為兩個分子之間的結合或直接連接,如融合蛋白。在任何情況下,融合蛋白可以在感興趣的兩個亞基之間(即酶與功能結構域之間或轉接蛋白與功能結構域之間)包括接頭。因此,在一些實施方式中,Cas9的部分藉由結合至其上而與功能結構域關聯。在其他實施方式中,Cas9視情況經由中間接頭而與功能結構域關聯,因為這兩者被融合到一起。接頭的實例包括本文討論的GlySer接頭。
誘導物的其他實例包括光和激素。對於光,誘導型二聚體可以是異二聚體並且包括第一個一半光誘導型二聚體和第二個(並且互補的)一半光誘導型二聚體。第一個一半和第二個一半光誘導型二聚體的較佳的實例係CIB1和CRY2系統。CIB1結構域係光敏感型隱花色素2(CRY2)的異源二聚體結合配偶體。
在另一個實例中,可以將藍光響應性磁體二聚化系統(pMag和nMag)融合至分割型Cas9蛋白的兩個部分。響應於光刺激,pMag和nMag二聚化並且Cas9重組裝。例如,此類系統結合Cas9描述於尼洪基(Nihongaki)等人(《自然生物技術》(Nat.Biotechnol.)33,755-790,2015)中。
本發明包括,該誘導物能量源可以是熱、超音波、電磁能或化學品。在本發明的一較佳的實施方式中,該誘導物能量源可以是抗生素、小分子、激素、激素衍生物、類固醇或類固醇衍生物。在一個更 較佳的實施方式中,該誘導物能量源可以是脫落酸(ABA)、多西環素(doxycycline)(DOX)、cumate、雷帕黴素、4-羥基他莫西芬(4-hydroxytamoxifen)(4OHT)、雌激素或蛻皮激素。本發明提供了至少一種開關可以選自由以下各項組成之群組:基於抗生素的誘導型系統、基於電磁能的誘導型系統、基於小分子的誘導型系統、基於核受體的誘導系統以及基於激素的誘導型系統。在一更較佳的實施方式中,該至少一種開關可以選自由以下各項組成之群組:四環素(Tet)/DOX誘導型系統、光誘導型系統、ABA誘導型系統、cumate抑制蛋白/操縱子系統、4OHT/雌激素誘導型系統、基於蛻皮激素的誘導型系統以及FKBP12/FRAP(FKBP12-雷帕黴素複合物)誘導型系統。還在本文和在PCT/US 2013/051418(藉由引用併入本文)中討論了此類誘導物。
一般而言,可以使用本發明的分割型Cas9方法尋求可以由Cas9(無論係wt、切口酶還是失活的Cas9(具有或不具有關聯功能結構域))造成的任何用途。該益處仍係Cas9活性的誘導型性質。
作為一個另外的實例,可以用螢光蛋白(像GFP)製備分割型Cas9融合物。這允許使基因組座位成像(參見“藉由優化的CRISPA/Cas系統使人類活細胞中的基因組座位動態成像(Dynamic Imaging of Genomic Loci in Living Human Cells by an Optimized CRISPR/Cas System)”,陳(Chen)B等人《細胞》(Cell)2013),但是以誘導型方式。因此,在一些實施方式中,一個或多個Cas9部分可以與螢光蛋白(例如GFP)關聯(並且特別是與其融合)。
另外的實驗解決了當中靶切割處於相同水平時,野生型 (wt)與分割型Cas9之間是否存在脫靶切割差異。為了做到這一點,申請人使用wt和分割型Cas9質粒的暫態轉染並且在不同時間點進行收穫。申請人在發現中靶切割在+/- 5%內的一組樣品之後尋找脫靶活化。申請人使得細胞系穩定表現wt或分割型Cas9而不表現指導物(使用慢病毒)。抗生素選擇之後,將指導物用單獨的慢病毒進行遞送並且在不同時間點進行收穫,以測量中靶/脫靶切割。
申請人將去穩定序列(PEST,參見“mRNA-和蛋白質-去穩定元件用以開發高度響應性報告系統的用途(Use of mRNA- and protein-destabilizing elements to develop a highly responsive reporter system)”,文(Voon)DC等人《核酸研究》(Nucleic Acids Research)2005)引入FRB(N)Cas9-NES片段中,以促進更快的降解並且因此降低分割型失活的Cas9-VP64複合物的穩定性。
對於與分割型Cas9系統一起使用而言,如在本說明書的其他地方描述的這樣的去穩定序列(包括PEST)可以是有利的。
產生了穩定表現分割型失活的Cas9-VP64和MS2-p65-HSF1+指導物的細胞系。PLX抗性篩選可以證明,不可逆的定時轉錄活化在藥物篩選中可以是有用的。當分割型失活的Cas9-VP64不可逆時,這種方法可以是有利的。
在一個方面,本發明提供了非天然存在的或工程化的Cas9 CRISPR-Cas系統,該系統可以包含至少一種開關,其中所述Cas9 CRISPR-Cas系統的活性藉由與至少一種誘導物能量源(就該開關而言)接觸進行控制。在本發明的一實施方式中,就至少一種開關而言的或所 述Cas9 CRISPR-Cas系統的活性的控制可以被活化、增強、終止或抑制。與至少一種誘導物能量源接觸可以產生第一效應和第二效應。第一效應可以是以下項中的一者或多者:核輸入、核輸出、次級組分(如效應分子)的募集、(蛋白質、DNA或RNA)的構象變化、切割、負荷物(如裝籠的分子或輔因子)的釋放、締合或解離。第二效應可以是以下項中的一者或多者:就至少一種開關而言的或所述Cas9 CRISPR-Cas系統的活性的控制的活化、增強、終止或抑制。在一實施方式中,第一效應和第二效應可以一連串地發生。
在本發明的另一個方面,該Cas9 CRISPR-Cas系統可以進一步包含至少一個或多個核定位信號(NLS)、核輸出信號(NES)、功能結構域、撓性接頭、突變、缺失、改變或截短。這一個或多個NLS、NES或功能結構域可以被條件性地活化或失活。在另一個實施方式中,該突變可以是以下項中的一者或多者:轉錄因子同源區中的突變、DNA結合結構域中的突變(如突變鹼性螺旋環螺旋的鹼性殘基)、內源NLS中的突變或內源NES中的突變。本發明包括,該誘導物能量源可以是熱、超音波、電磁能或化學品。在本發明的一較佳的實施方式中,該誘導物能量源可以是抗生素、小分子、激素、激素衍生物、類固醇或類固醇衍生物。在一個更較佳的實施方式中,該誘導物能量源可以是脫落酸(ABA)、多西環素(DOX)、cumate、雷帕黴素、4-羥基他莫西芬(4OHT)、雌激素或蛻皮激素。本發明提供了至少一種開關可以選自由以下各項組成之群組:基於抗生素的誘導型系統、基於電磁能的誘導型系統、基於小分子的誘導型系統、基於核受體的誘導系統以及基於激素的誘導型系統。在 一個更較佳的實施方式中,該至少一種開關可以選自由以下各項組成之群組:四環素(Tet)/DOX誘導型系統、光誘導型系統、ABA誘導型系統、cumate抑制蛋白/操縱子系統、4OHT/雌激素誘導型系統、基於蛻皮激素的誘導型系統以及FKBP12/FRAP(FKBP12-雷帕黴素複合物)誘導型系統。
如在本申請中所詳述的控制方面涉及至少一種或多種開關。如在本文使用的術語“開關(switch)”係指以協調方式起作用以影響變化的系統或一組組分,涵蓋生物功能的所有方面,如該功能的活化、抑制、增強或終止。在一個方面,術語開關涵蓋遺傳開關,該等遺傳開關包含基因調節蛋白的基礎組分和該等蛋白識別的特異性DNA序列。在一個方面,開關涉及在基因調節中使用的誘導型和抑制型系統。一般而言,誘導型系統可以是關閉的,除非存在允許基因表現的某種分子(稱為誘導物)。該分子被說成“誘導表現”。它發生的方式取決於控制機制以及細胞類型差異。抑制型系統係開啟的,除非存在抑制基因表現的某種分子(稱為輔抑制蛋白(corepressor))。該分子被說成“抑制表現”。它發生的方式取決於控制機制以及細胞類型差異。如在本文使用的術語“誘導型(inducible)”可以包括開關的所有方面,不論涉及的分子機制如何。因此,如由本發明所包括的開關可以包括但不限於基於抗生素的誘導型系統、基於電磁能的誘導型系統、基於小分子的誘導型系統、基於核受體的誘導系統以及基於激素的誘導型系統。在較佳的實施方式中,該開關可以是四環素(Tet)/DOX誘導型系統、光誘導型系統、脫落酸(ABA)誘導型系統、cumate抑制蛋白/操縱子系統、4OHT/雌激素誘 導型系統、基於蛻皮激素的誘導型系統或FKBP12/FRAP(FKBP12-雷帕黴素複合物)誘導型系統。
本發明的Cas9 CRISPR-Cas系統可以被設計成以時間和空間精確方式調節或改變單獨內源基因的表現。該Cas9 CRISPR-Cas系統可以被設計成與感興趣的基因的啟動子序列結合以改變基因表現。該Cas9可以被一分為二,其中一半融合至隱花色素異二聚體(隱花色素-2或CIB1)的一半,同時剩餘的隱花色素配偶體融合至Cas9的另一半。在一些方面,轉錄效應結構域也可以被包括在Cas9 CRISPR-Cas系統中。效應子結構域可以是活化蛋白(如VP16、VP64或p65)或抑制蛋白(如KRAB、EnR或SID)。在未刺激狀態下,一半Cas9-隱花色素2蛋白定位至感興趣的基因的啟動子,但是不結合至該CIB1-效應蛋白。在用藍色光譜的光刺激後,隱花色素-2被活化,經歷構象變化並且露出其結合結構域。CIB1進而結合至隱花色素-2,從而使Cas9的第二個一半定位至感興趣的基因的啟動子區並且活化基因組編輯,這可以引起基因過表現或沈默。LITE的方面進一步描述於劉(Liu),H等人,《科學》(Science),2008和甘迺迪(Kennedy)M等人,《自然方法》(Nature Methods)2010中,將其內容藉由引用以其全文併入本文。
可以在物種、強度、機制、持續時間、尺寸或任何數量的其他參數的基礎上選擇可以進一步調節功能的活化蛋白和抑制蛋白結構域。較佳的效應子結構域包括但不限於轉位酶結構域、整合酶結構域、重組酶結構域、解離酶結構域、轉化酶結構域、蛋白酶結構域、DNA甲基轉移酶結構域、DNA脫甲基酶結構域、組蛋白乙醯酶結構域、組蛋白 脫乙醯酶結構域、核酸酶結構域、抑制蛋白結構域、活化蛋白結構域、核定位信號結構域、轉錄蛋白募集結構域、細胞攝取活性相關結構域、核酸結合結構域或抗體呈遞結構域。
也存在若干不同方式來產生化學誘導型系統:1.可藉由脫落酸(ABA)誘導的基於ABI-PYL的系統(參見例如網址stke.sciencemag.org/cgi/content/abstract/sigtrans;4/164/rs2),2.可藉由雷帕黴素(或基於雷帕黴素的相關化學品)誘導的基於FKBP-FRB的系統(參見例如網址nature.com/nmeth/journal/v2/n6/full/nmeth763.html),3.可藉由赤黴素(GA)誘導的基於GID1-GAI的系統(參見例如網址nature.com/nchembio/journal/v8/n5/full/nchembio.922.html)。
由本發明所考慮的另一種系統係基於亞細胞定位變化的化學誘導型系統。申請人還包括被工程化為靶向感興趣的基因組座位的誘導型Cas9 CRISPR-Cas系統,其中該Cas9酶被分成兩個融合構建體,所述構建體被進一步連接至化學或能量敏感型蛋白的不同部分。當化學或能量傳遞物與該化學或能量敏感型蛋白結合時,這種化學或能量敏感型蛋白將導致Cas9酶的任一半的亞細胞定位變化(即將Cas9酶的任一半從細胞質運輸到細胞的細胞核)。融合構建體從一個亞細胞區室或細胞器(在其中由於缺乏重構的Cas9 CRISPR-Cas系統的底物,其活性被封存)向另一個亞細胞區室或細胞器(在其中存在該底物)的這種運輸允許該等組分聚集在一起並且重構功能活性並且然後與其希望的底物(即哺乳動物細胞核中的基因組DNA)相接觸並且導致靶基因表現的活化或抑制。
考慮了其他誘導型系統,如但不限於藉由以下項進行調 節:重金屬[梅奧(Mayo)KE等人,《細胞》(Cell)1982,29:99-108;塞爾(Searle)PF等人,《分子細胞生物學》(Mol Cell Biol)1985,5:1480-1489和布林斯特(Brinster)RL等人,《自然》(Nature)(倫敦)1982,296:39-42],類固醇激素[海因斯(Hynes)NE等人,《美國國家科學院院刊》(Proc Natl Acad Sci USA)1981,78:2038-2042;克羅克(Klock)G等人,《自然》(倫敦)1987,329:734-736和李(Lee)F等人,《自然》(倫敦)1981,294:228-232],熱休克[努爾(Nouer)L:熱休克反應(Heat Shock Response).博卡拉頓,佛羅里達州:CRC;1991]以及其他已經開發的試劑[穆立克(Mullick)A、馬西(Massie)B:基因表現的轉錄、翻譯和控制(Transcription,translation and the control of gene expression)。在由斯皮爾(Speir)RE.編輯的細胞技術百科全書(Encyclopedia of Cell Technology)中,威利出版社(Wiley);2000:1140-1164和富塞內格爾(Fussenegger)M,.《生物技術進展》(Biotechnol Prog)2001,17:1-51]。然而,該等誘導型哺乳動物啟動子存在局限,如誘導物(熱休克、重金屬、糖皮質激素等)的“關閉”狀態的“洩漏(leakiness)”和多效效應。已經提出了昆蟲激素(蛻皮激素)在減少哺乳動物細胞中的細胞過程干擾的嘗試中的用途[努(No)D等人,《美國國家科學院院刊》(Proc Natl Acad Sci USA)1996,93:3346-3351]。另一種極好的系統使用雷帕黴素作為誘導物[裡維拉(Rivera)VM等人,《自然醫學》(Nat Med)1996,2:1028-1032],但是雷帕黴素作為免疫抑制劑的作用將其用途主要局限於體內並且因此必須找到用於控制基因表現的生物惰性化合物[賽斯(Saez)E等人,《美國國家科學院院刊》(Proc Natl Acad Sci USA)2000,97:14512-14517]。
還參見關於誘導型系統的以下章節。
去穩定化的酶:具有去穩定結構域或與其關聯的根據本發明的酶
在一個方面,本發明提供了與至少一個去穩定結構域(DD)關聯的非天然存在的或工程化的CRISPR酶,較佳的是2類CRISPR酶,較佳的是如本文描述的V型或VI型CRISPR酶,如較佳的是但不限於如在本文的其他地方描述的Cas9;並且,出於簡寫的目的,與至少一個去穩定結構域(DD)關聯的這樣一種非天然存在的或工程化的CRISPR酶在本文被稱為“DD-CRISPR酶”。應理解的是,如在本文的其他地方描述的根據本發明的任何CRISPR酶都可以用作具有如在下文描述的去穩定化結構域或者與其關聯。如在本文的其他地方描述的任何方法、產品、組成物和用途都同樣適用於如下文進一步詳述的與去穩定化結構域關聯的CRISPR酶。
藉由進一步指導的方式,提供了以下具體方面和實施方式。
當如在本章節中描述的方面和實施方式涉及DD-CRISPR酶、DD-Cas、DD-Cas9Cas9、DD-CRISPR-Cas或DD-CRISPR-Cas9系統或複合物時,沒有前綴“DD”的術語“CRISPR”、“Cas”、“Cas9”、“CRISPR系統”、“CRISPR複合物”、“CRISPR-Cas”、“CRISPR-Cas9”等可以被視為具有前綴DD,尤其是當該背景允許這樣,使得就DD實施方式閱讀本揭露時。因此,在一個方面,本發明提供了用於使用CRISPR系統(其可以被讀為DD-CRISPR系統和/或CRISPR系統)的一種或多種元件之方法。本發明的CRISPR複合物提供了用於修飾 靶多核苷酸的有效手段。本發明的CRISPR複合物具有多種多樣的實用性,包括修飾(例如,缺失、插入、轉位、失活、活化)多種細胞類型中的靶多核苷酸。正因為如此,本發明的CRISPR複合物在例如基因療法、藥物篩選、疾病診斷以及預後中具有廣闊的應用譜。
在一個方面,本發明提供了工程化的、非天然存在的DD-CRISPR-Cas系統,該系統包含DD-CRISPR酶(例如像DD-CRISPR酶),其中該CRISPR酶係Cas蛋白(在本文稱為“DD-Cas蛋白”,即術語如“DD-CRISPR-Cas9複合物”之前的“DD”意指具有Cas9蛋白的CRISPR-Cas9複合物,該Cas9蛋白具有至少一個與其關聯的去穩定結構域),有利地是DD-Cas蛋白,例如與至少一個去穩定結構域關聯的Cas9蛋白(在本文稱為“DD-Cas9蛋白”),以及靶向核酸分子(如DNA分子)的指導RNA,由此該指導RNA靶向該核酸分子(例如,DNA分子)。該核酸分子(例如,DNA分子)可以編碼基因產物。在一些實施方式中,該DD-Cas蛋白可以切割編碼該基因產物的DNA分子。在一些實施方式中,改變該基因產物的表現。該Cas蛋白和該指導RNA並不天然地一起存在。本發明包括包含(視情況,在適用情況下)融合到tracr序列上的指導序列的指導RNA。本發明進一步包括編碼經密碼子優化以便在真核細胞中表現的Cas蛋白。在一較佳的實施方式中,該真核細胞係哺乳動物細胞,並且在一更較佳的實施方式中,該哺乳動物細胞係人類細胞。該基因產物的表現可以被降低。該CRISPR酶可以構成CRISPR-Cas系統的一部分,該系統進一步包含指導RNA(gRNA),該指導RNA包含能夠雜交到細胞中的感興趣的基因組座位中的靶序列上的指導序列。在一些實施方 式中,該功能性CRISPR-Cas系統結合至該靶序列。在一些實施方式中,該功能性CRISPR-Cas系統可以編輯該靶序列,例如該靶序列可以包括基因組座位,並且在一些實施方式中,可以存在基因表現的改變。在一些實施方式中,該功能性CRISPR-Cas系統可以進一步包括功能結構域。在一些實施方式中,本發明提供了用於改變或修飾基因產物表現之方法。該方法可以包括引入含有靶核酸(例如,DNA分子)、或含有和表現靶核酸(例如,DNA分子)的細胞中;例如,該靶核酸可以編碼基因產物或提供基因產物(例如,調節序列)的表現。
在一些實施方式中,該DD-CRISPR酶係DD-Cas9。在一些實施方式中,該DD-CRISPR酶係V-A亞型或V-B亞型CRISPR酶。在一些實施方式中,該DD-CRISPR酶係Cas9。在一些實施方式中,該DD-CRISPR酶係As DD-Cas9。在一些實施方式中,該CRISPR酶係Lb DD-Cas9。在一些實施方式中,該DD-CRISPR酶切割DNA的兩條股,以產生雙股斷裂(DSB)。在一些實施方式中,該DD-CRISPR酶係切口酶。在一些實施方式中,該DD-CRISPR酶係雙切口酶。在一些實施方式中,該DD-CRISPR酶係失活的Cas9,例如與野生型Cas9或不具有對它的突變的Cas9相比,基本上沒有核酸酶活性,例如具有不超過5%的核酸酶活性的Cas9。適合的Cas9突變描述在本文的其他地方,並且包括例如D917A、E1006A、E1028A、D1227A、D1255A、N1257A、D917A、E1006A、E1028A、D1227A、D1255A以及N1257A,參考FnCas9p RuvC結構域中的胺基酸位置;或例如N580A、N584A、T587A、W609A、D610A、K613A、E614A、D616A、K624A、D625A、K627A以及Y629A,參考如在本文的其他地方描述的推 定第二核酸酶結構域。
在一些通用實施方式中,該DD-CRISPR酶與一個或多個功能結構域相關聯。在一些更具體的實施方式中,該DD-CRISPR酶係失活的Cas9和/或與一個或多個功能結構域相關聯。在一些實施方式中,該DD-CRISPR酶包括例如α-螺旋或混合型α/β二級結構的截短。在一些實施方式中,截短包括去除或用接頭置換。在一些實施方式中,該接頭係分支的或以其他方式允許束縛DD和/或功能結構域。在一些實施方式中,該CRISPR酶藉由融合蛋白與該DD相關聯。在一些實施方式中,該CRISPR酶融合至該DD。換言之,該DD可以藉由與所述CRISPR酶融合而與該CRISPR酶相關聯。在一些實施方式中,該酶可以被認為是經修飾的CRISPR酶,其中該CRISPR酶融合到至少一個去穩定結構域(DD)。在一些實施方式中,該DD可以經由連接蛋白與該CRISPR酶關聯,例如使用如標記系統(如鏈黴親和素-生物素系統)的系統。因此,提供了CRISPR酶與對該連接物的高親和力配位基具有特異性的連接蛋白的融合,而該DD被結合到所述高親和力配位基。例如,鏈黴親和素可以是融合到CRISPR酶上的連接物,同時生物素可以被結合到該DD上。共定位後,鏈黴親和素將結合至生物素,因此將該CRISPR酶連接至該DD。為了簡單起見,該CRISPR酶和該DD的融合在一些實施方式中是較佳的。在一些實施方式中,該融合包括在該DD與該CRISPR酶之間的接頭。在一些實施方式中,該融合可以是到CRISPR酶的N-末端。在一些實施方式中,至少一個DD融合至CRISPR酶的N-末端。在一些實施方式中,該融合可以是到CRISPR酶的C-末端。在一些實施方式中,至少一個DD融合至 CRISPR酶的C-末端。在一些實施方式中,一個DD可以融合至CRISPR酶的N-末端,並且另一個DD融合至CRISPR酶的C-末端。在一些實施方式中,該CRISPR酶與至少兩個DD相關聯,並且其中第一DD融合至CRISPR酶的N-末端並且第二DD融合至CRISPR酶的C-末端,第一和第二DD係相同的或不同的。在一些實施方式中,該融合可以是到DD的N-末端。在一些實施方式中,該融合可以是到DD的C-末端。在一些實施方式中,該融合可以在CRISPR酶的C-末端與DD的N-末端之間。在一些實施方式中,該融合可以在DD的C-末端與CRISPR酶的N-末端之間。相比於包含至少一種C末端融合的DD,包含至少一種N-末端融合的DD觀察到更少的背景。將N-末端和C-末端融合組合具有最少的背景,但是整體活性最低。有利地,藉由至少一種N-末端融合或至少一種N末端融合加至少一種C-末端融合來提供DD。並且當然,可以藉由至少一種C-末端融合來提供DD。
在某些實施方式中,蛋白去穩定化結構域(如用於誘導型調節)可以融合至例如Cas9的N-末端和/或C-末端。此外,去穩定化結構域可以被引入例如Cas9的一級序列的溶劑暴露環中。Cas9核酸酶一級結構的計算分析揭示了三個不同區域。第一個係C-末端RuvC樣結構域,其係唯一的功能表征結構域。第二個係N-末端α-螺旋區域並且第三個係混合α和β區,其位於RuvC樣結構域與α-螺旋區之間。在Cas9一級結構內預測出若干小段的非結構化區域。被暴露於溶劑並且在不同Cas9異種同源物內不保守的非結構化區域係小蛋白序列的較佳的分割和插入側。此外,該等側可以用於在Cas9異種同源物之間產生嵌合蛋白。
在一些實施方式中,該DD係ER50。在一些實施方式中,這個DD的對應穩定化配位基係4HT。因此,在一些實施方式中,這至少一個DD之一係ER50並且其穩定化配位基係4HT或CMP8。在一些實施方式中,該DD係DHFR50。在一些實施方式中,這個DD的對應穩定化配位基係TMP。因此,在一些實施方式中,這至少一個DD之一係DHFR50並且其穩定化配位基係TMP。在一些實施方式中,該DD係ER50。在一些實施方式中,這個DD的對應穩定化配位基係CMP8。因此,在ER50系統中,CMP8可以是4HT的替代穩定化配位基。雖然也許有可能的是CMP8和4HT可以/應該以競爭性方式使用,但是一些細胞類型可能對這兩種配位基中的一者或另一者更加敏感,並且根據本揭露和本領域的知識,熟練人員可以使用CMP8和/或4HT。
在一些實施方式中,一個或兩個DD可以融合至CRISPR酶的N-末端,並且一個或兩個DD融合至CRISPR酶的C-末端。在一些實施方式中,這至少兩個DD與該CRISPR酶相關聯並且該等DD係相同的DD,即該等DD係同源的。因此,該等DD中的兩個(或兩個或更多個)可以是ER50 DD。在一些實施方式中這係較佳的。可替代地,該等DD中的兩個(或兩個或更多個)可以是DHFR50 DD。在一些實施方式中這也是較佳的。在一些實施方式中,這至少兩個DD與該CRISPR酶相關聯並且該等DD係不同的DD,即該等DD係異源的。因此,該等DD之一可以是ER50,同時該等DD中的一個或多個或任何其他DD可以是DHFR50。具有兩個或更多個異源的DD可以是有利的,因為它將提供更高水平的降解控制。N末端或C-末端處的多於一個DD的串聯融合可以增強降解;並且這 樣一種串聯融合可以是例如ER50-ER50-Cas9或DHFR-DHFR-Cas9。設想的是高水平的降解將在不存在任一種穩定化配位基的情況下發生,中間水平的降解將在不存在穩定化配位基並且存在其他(或另一種)穩定化配位基的情況下發生,而低水平的降解將在存在兩種(或兩種或更多種)穩定化配位基的情況下發生。還可以藉由具有N-末端ER50 DD和C-末端DHFR50 DD來進行控制。
在一些實施方式中,該CRISPR酶與該DD的融合包括在該DD與該CRISPR酶之間的接頭。在一些實施方式中,該接頭係GlySer接頭。在一些實施方式中,該DD-CRISPR酶進一步包括至少一個核輸出信號(NES)。在一些實施方式中,該DD-CRISPR酶包括兩個或更多個NES。在一些實施方式中,該DD-CRISPR酶包括至少一個核定位信號(NLS)。這可以是除了NES外還有的。在一些實施方式中,該CRISPR酶包括作為該CRISPR酶與該DD之間的接頭的、或作為其一部分的定位(核輸入或輸出)信號或基本上由其組成或由其組成。HA或Flag標籤作為接頭也落入本發明的範圍內。申請人使用NLS和/或NES作為接頭並且還使用高達(GGGGS)3的甘胺酸絲胺酸接頭作為GS。
在一個方面,本發明提供了編碼該CRISPR酶和關聯DD的多核苷酸。在一些實施方式中,所編碼的CRISPR酶和關聯DD可操作地連接到第一調節元件。在一些實施方式中,DD也被編碼並且可操作地連接至第二調節元件。有利地,這裡的DD將要“肅清(mop up)”穩定化配位基並且所以它有利地是和與該酶(例如,如本文討論的)關聯的DD相同的DD(即,相同類型的結構域)(其中應理解的是,術語“肅清” 意為如在本文討論的並且還可以傳達執行以便有助於或終止活性)。藉由用過量的不與該CRISPR酶關聯的DD肅清穩定化配位基,將看到該CRISPR酶的更多降解。不受理論束縛,設想的是隨著添加另外的或過量的非關聯DD,平衡將從穩定化配位基複合或結合遠離向與CRISPR酶關聯的DD移動,並且反而將更多的穩定化配位基複合或結合朝向游離DD(即,不與CRISPR酶關聯的DD)移動。因此,當希望藉由CRISPR酶的增加的降解來降低CRISPR酶活性時,提供過量的或另外的非關聯(或游離)DD係較佳的。過量的游離DD將結合殘餘配位基並且還將所結合的配位基從DD-Cas融合物帶走。因此,它促進DD-Cas降解並且增強Cas活性的時間控制。在一些實施方式中,該第一調節元件係啟動子並且可以視情況包括增強子。在一些實施方式中,該第二調節元件係啟動子並且可以視情況包括增強子。在一些實施方式中,該第一調節元件係早期啟動子。在一些實施方式中,該第二調節元件係晚期啟動子。在一些實施方式中,該第二調節元件係或包含誘導型控制元件(視情況是tet系統)或抑制型控制元件(視情況是tetr系統)或基本上由其組組成。誘導型啟動子可以是有利的(例如rTTA),以便在多西環素的存在下誘導tet
附接或關聯可以經由接頭,例如撓性甘胺酸-絲胺酸(GlyGlyGlySer)或(GGGS)3,或者剛性α-螺旋接頭如(Ala(GluAlaAlaAlaLys)Ala)。較佳的是在本文中使用接頭(如(GGGGS)3),以將蛋白質或肽結構域分開。(GGGGS)3係較佳的,因為是相對較長的接頭(15個胺基酸)。甘胺酸殘基最具撓性並且絲胺酸殘基提高了接頭在蛋白質外的機會。(GGGGS)6、(GGGGS)9或(GGGGS)12可以較 佳的是用作替代物。其他較佳的替代物係(GGGGS)1、(GGGGS)2、(GGGGS)4、(GGGGS)5、(GGGGS)7、(GGGGS)8、(GGGGS)10或(GGGGS)11。替代接頭係可獲得的,但是高度撓性接頭被認為最佳地起作用,以允許有最大機會將Cas的2部分聚在一起並且因此重構Cas活性。一替代方案係核質蛋白的NLS可以用作接頭。例如,接頭還可以用在Cas與任何功能結構域之間。再一次,這裡可以使用(GGGGS)3接頭(或其6、9或12個重複形式),或者核質蛋白的NLS可以用作Cas與功能結構域之間的接頭。
在一方面,本發明提供了用於遞送本發明的DD-CRISPR-Cas複合物或本文討論的多核苷酸的手段,例如遞送該複合物的一種或多種組分的一種或多種粒子、包含本文討論的一種或多種多核苷酸的一種或多種載體(例如,編碼CRISPR酶、DD;提供CRISPR-Cas複合物的RNA)。在一些實施方式中,該載體可以是質粒或病毒載體(如AAV或慢病毒)。用質粒暫態轉染進例如HEK細胞中可以是有利的,尤其是考慮到AAV的尺寸限制,並且在將Cas9裝配進AAV中時用另外的編碼(就與一個或多個DD的關聯而言)的情況下AAV可以達到上限。
還提供了組成性地表現CRISPR酶和關聯DD的模型。該生物可以是轉基因的,並且可以已經用本發明載體轉染或者可以是這樣轉染的生物的後代。在一另外的方面,本發明提供了組成物,該等組成物包含本文描述的CRISPR酶和關聯DD或多核苷酸或載體。還提供了包含指導RNA的CRISPR-Cas系統。
還提供了治療受試者(例如,對其有需要的受試者)之方法,該方法包括藉由用編碼系統的多核苷酸或本發明的任何載體轉化該 受試者而誘導基因編輯並且向該受試者給予穩定化配位基。還可以提供適合的修復模板,例如藉由包含所述修復模板的載體遞送該修復模板。還提供了治療受試者(例如,對其有需要的受試者)之方法,該方法包括藉由用編碼本發明的系統的多核苷酸或本發明的任何載體轉化該受試者而誘導轉錄活化或抑制,其中所述多核苷酸或載體編碼或包含無催化活性的CRISPR酶和一個或多個關聯功能結構域;該方法進一步包括向該受試者給予穩定化配位基。該等方法還可以包括向該受試者遞送過量DD和/或表現過量DD。在任何處理離體地(例如在細胞培養物中)發生的情況下,則應當理解的是,術語‘受試者’可以由短語“細胞或細胞培養物”替換。
還提供了用於在所述治療方法中使用的包含本發明的系統的組成物。單獨的組成物可以包含穩定化配位基。可以提供包括這樣的組成物的藥盒。還提供了本發明的系統在用於這樣的治療方法的藥劑的製造中之用途。本發明還提供了本發明系統在篩選(例如,功能獲得篩選)中之用途。人為地強行過表現基因的細胞能夠例如藉由負反請回路隨時間下調該基因(重建平衡)。到篩選開始的時候,未經調節的基因可能再次被減少。使用誘導型Cas9活化蛋白允許正好在篩選之前誘導轉錄並且因此使假陰性命中的機會最小化。因此,藉由在篩選(例如,功能獲得篩選)中使用本發明,可以使假陰性結果的機會最小化。
在一個方面,本發明提供了工程化的、非天然存在的CRISPR-Cas系統,該系統包含DD-Cas蛋白和靶向在細胞中編碼基因產物的DNA分子的指導RNA,由此該指導RNA靶向編碼該基因產物的DNA分 子,並且該Cas蛋白切割編碼該基因產物的DNA分子,由此改變該基因產物的表現;並且,其中該Cas蛋白和該指導RNA並不天然地一起存在。本發明包括含有融合到tracr序列上的指導序列的指導RNA。在本發明的一個實施方式中,該Cas蛋白係Cas9蛋白。本發明進一步包括編碼經密碼子優化以便在真核細胞中表現的Cas蛋白。在一較佳的實施方式中,該真核細胞係哺乳動物細胞,並且在一更較佳的實施方式中,該哺乳動物細胞係人類細胞。在本發明的一另外的實施方式中,該基因產物的表現被降低。
在功能性結構域等與酶的一部分或其他部分關聯的情況下,該等係典型的融合物。這裡相對於一個分子如何與另一個分子‘關聯’,例如在CRISPR酶的部分與功能結構域之間,使用術語“與...關聯”。這兩者可以被認為束縛至彼此。在這樣的蛋白質-蛋白質相互作用的情況下,可以按抗體識別表位的方式就識別而論看待這種關聯。可替代地,一種蛋白可以經由這兩種蛋白的融合物與另一蛋白關聯,例如一個亞基融合至另一亞基。融合典型地藉由將一種蛋白的胺基酸序列添加至另一蛋白的胺基酸序列上而發生,例如經由一起剪接編碼每種蛋白或亞基的核苷酸序列。可替代地,這基本上可以被視為兩個分子之間的結合或直接連接,如融合蛋白。在任何情況下,融合蛋白可以在感興趣的兩個亞基之間(例如酶與功能結構域之間或轉接蛋白與功能結構域之間)包括接頭。因此,在一些實施方式中,CRISPR酶的部分藉由結合至其上而與功能結構域關聯。在其他實施方式中,CRISPR酶視情況經由接頭而與功能結構域關聯,因為這兩者被融合到一起。接頭的實例包括本文討 論的GlySer接頭。雖然非共價結合的DD可能能夠活化關聯Cas(例如Cas9)的降解,但是蛋白酶體降解涉及蛋白鏈的解旋;並且,融合係較佳的,因為它可以保證在降解時DD仍連接到Cas。然而,在對DD具有特異性的穩定化配位基的存在下使該CRISPR酶和該DD聚到一起,形成穩定複合物。這種複合物包含結合到該DD的穩定化配位基。該複合物還包含與該CRISPR酶關聯的DD。在不存在所述穩定化配位基的情況下,DD及其關聯CRISPR酶的降解係受促進的。
去穩定化結構域具有普遍實用性以便為範圍廣泛的蛋白質賦予不穩定性;參見例如,宮崎(Miyazaki),《化學學會雜誌》(J Am Chem Soc.)2012年3月7日;134(9):3942-3945,藉由引用併入本文。CMP8或4-羥基他莫昔芬可以是去穩定化結構域。更一般地說,發現哺乳動物DHFR(DHFRt)(遵循N端法則的去穩定化殘基)的溫度敏感型突變體在容許溫度下是穩定的,但是在37℃下是不穩定的。向表現DHFRt的細胞中添加甲胺喋呤(哺乳動物DHFR高親和力配位基)部分地抑制該蛋白質的降解。這係重要的證明,即小分子配位基可以穩定以其他方式在細胞中被靶向而降解的蛋白質。使用雷帕黴素衍生物來穩定mTOR的FRB結構域的不穩定突變體(FRB*)並且恢復融合的激酶GSK-3β的功能。6,7這個系統證明配位基依賴性穩定性代表用於調節複雜的生物環境中的特異性蛋白的功能的有吸引力的策略。當藉由雷帕黴素誘導的FK506結合蛋白和FKBP12的二聚化而發生泛素補償時,用於控制蛋白質活性的系統可以涉及變得具有功能性的DD。人類FKBP12或ecDHFR蛋白的突變體可以被工程化為分別在不存在它們的高親和力配位基Shield-1或甲氧苄啶 (TMP)的情況下在代謝上是不穩定的。該等突變體係在本發明的實踐中有用的可能去穩定化結構域(DD)中的一些並且作為與CRISPR酶的融合的DD的不穩定性賦予整個融合蛋白被蛋白酶體進行CRISPR蛋白降解。Shield-1和TMP以劑量依賴性方式結合至DD並且穩定該DD。雌激素受體配位基結合結構域(ERLBD,ERS1的殘基305-549)也可以被工程化為去穩定化結構域。由於雌激素受體傳訊途徑牽涉在多種疾病(如乳腺癌)中,所以該途徑已經得到廣泛研究並且已經開發了雌激素受體的許多激動劑和拮抗劑。因此,ERLBD和藥物的相容對係已知的。存在結合至ERLBD的突變體但是不結合其野生型形式的配位基。藉由使用編碼三個突變(L384M、M421G、G521R)12的該等突變型結構域之一,有可能的是使用不擾亂內源雌激素敏感性網路的配位基調節ERLBD衍生的DD的穩定性。可以引入另外的突變(Y537S),以進一步使ERLBD去穩定並且將它配置為潛在的DD候選物。這種四突變體係有利的DD發展。突變型ERLBD可以融合至CRISPR酶並且可以使用配位基調節或擾亂其穩定性,由此該CRISPR酶具有DD。另一種DD可以是由Shield1配位基穩定的、基於經突變的FKBP蛋白的12-kDa(107-胺基酸)標籤;參見例如,《自然方法》(Nature Methods)5,(2008)。例如,DD可以是經修飾的FK506結合蛋白12(FKBP12),其結合至合成的、生物惰性小分子Shield-1並且被Shield-1可逆地穩定;參見例如,巴那金斯基(Banaszynski)LA、陳(Chen)LC、梅納德-史密斯(Maynard-Smith)LA、黃(Ooi)AG、萬德賴斯(Wandless)TJ.使用合成小分子調節活細胞中的蛋白質功能的快速、可逆且可調的方法(A rapid,reversible,and tunable method to regulate protein function in living cells using synthetic small molecules).《細胞》 (Cell).2006;126:995-1004;巴那金斯基LA、塞爾美雅(Sellmyer)MA、康塔格(Contag)CH、萬德賴斯TJ、索恩(Thorne)SH.活小鼠中的蛋白質穩定性和功能的化學控制(Chemical control of protein stability and function in living mice).《自然醫學》(Nat Med.)2008;14:1123-1127;梅納德-史密斯LA、陳LC、巴那金斯基LA、黃AG、萬德賴斯TJ.用於使用生物沈默小分子工程化條件型蛋白質穩定性的直接方法(A directed approach for engineering conditional protein stability using biologically silent small molecules).《生物化學雜誌》(The Journal of biological chemistry).2007;282:24866-24872;以及羅德里格斯(Rodriguez),《生物化學》(Chem Biol.)2012年3月23日;19(3):391-398─將其全部藉由引用併入本文,並且可以用在本發明的實踐中,在選擇有待與本發明的實踐中的CRISPR酶關聯的DD中。如可以看到的,本領域中的知識包括多種DD,並且DD可以與CRISPR酶相關聯(例如,融合到其上,有利地藉由接頭),由此該DD在配位基的存在下可以被穩定並且當不存在該配位基時該DD可以被去穩定,由此該CRISPR酶被完全去穩定,或者該DD在不存在配位基下可以被穩定並且當存在該配位基時該DD可以被去穩定;該DD允許調節或控制─打個譬喻說,活化或關閉─該CRISPR酶並且因此調節或控制CRISPR-Cas複合物或系統,以由此提供用於例如在體內或體外環境中調節或控制該系統的手段。例如,當感興趣的蛋白質作為與DD標籤的融合表現時,它被去穩定並且在細胞中例如被蛋白酶體迅速降解。因此,不存在穩定化配位基導致D關聯的Cas被降解。當新的DD融合至感興趣的蛋白質時,其不穩定性被賦予給該感興趣的蛋白質,從而使得整個融合蛋白被快速降解。Cas的峰活性對於減少脫靶效應而言有時係有益的。因 此,短突發的高活性係較佳的。本發明能夠提供這樣的峰值。從一些意義上來說,該系統係可誘導的。從一些其他意義上來說,該系統在不存在穩定化配位基下被抑制,並且在存在穩定化配位基下被去抑制。不希望受任何理論束縛並且未做出任何承諾,本發明的其他益處可以包括,它係:
●可定量的(dosable)(與活化或關閉例如可允許可變的CRISPR-Cas系統或複合物活性的系統相反)。
●正交的,例如配位基僅影響其同源DD,所以可以獨立地操作兩種或更多種系統,和/或該等CRISPR酶可以來自一種或多種異種同源物。
●可移植的,例如可以在不同細胞類型或細胞系中工作。
●快速的。
●時間受控的。
●藉由允許Cas被降解而能夠減少背景或脫靶Cas或Cas毒性或Cas的過量累積。
雖然DD可以在CRISPR酶的N末端和/或C末端(包括在分割(如在本文的其他地方所定義的)的一側或多側的DD),但是例如,Cas9(N)-接頭-DD-接頭-Cas9(C)也是引入DD的方式。在一些實施方式中,如果僅使用DD至有待使用的CRISPR酶的一個末端關聯,則較佳的是使用ER50作為DD。在一些實施方式中,如果使用N-末端和C-末端兩者,則ER50和/或DHFR50任一者的使用係較佳的。藉由N-末端融合看到了特別好的結果,這係出人意料的。具有N末端和C末端融合兩者可以是 協同性的。去穩定結構域的尺寸不同,但是在尺寸上典型地是大約100-300個胺基酸。DD較佳的是係工程化的去穩定化蛋白質結構域。DD以及例如從高親和力配位基及其配位基結合結構域製備DD之方法。本發明可以被認為是“正交的”,因為僅有特異性配位基將穩定其對應的(同源)DD,它對非同源DD的穩定性沒有影響。可商購的DD系統係CloneTech公司的ProteoTunerTM系統;穩定化配位基係Shield1。
在一些實施方式中,穩定化配位基係‘小分子’。在一些實施方式中,穩定化配位基係可穿透細胞的。它對其相對應的DD具有高親和力。適合的DD-穩定化配位基對在本領域係已知的。一般而言,穩定化配位基可以藉由以下方式去除:
●天然加工(例如,蛋白酶體降解),例如在體內;
●肅清,例如離體/細胞培養,藉由:
o提供較佳的結合配偶體;或者
o提供XS底物(DD而沒有Cas),
在另一個方面,本發明提供了工程化的、非天然存在的載體系統,該載體系統包含一種或多種載體,這一種或多種載體包含第一調節元件以及第二調節元件,該第一調節元件可操作地連接至CRISPR-Cas系統的指導RNA,該指導RNA靶向編碼基因產物的DNA分子,該第二調節元件可操作地連接編碼DD-Cas蛋白;組分(a)和(b)可以位於該系統的相同或不同載體上。該指導RNA靶向在細胞中編碼該基因產物的DNA分子,並且該DD-Cas蛋白可以切割編碼該基因產物的 DNA分子(它可以切割一條股或兩條股或者基本上沒有核酸酶活性),由此改變該基因產物的表現;並且,其中該DD-Cas蛋白和該指導RNA並不天然地一起存在。在本發明的一實施方式中,該DD-Cas蛋白係DD-Cas9蛋白。本發明進一步包括編碼經密碼子優化以便在真核細胞中表現的DD-Cas蛋白。在一較佳的實施方式中,該真核細胞係哺乳動物細胞,並且在一更較佳的實施方式中,該哺乳動物細胞係人類細胞。在本發明的一另外的實施方式中,該基因產物的表現被降低。
在一個方面,本發明提供了包含一種或多種載體的載體系統。在一些實施方式中,該系統包含:(a)第一調節元件,該第一調節元件可操作地連接到同向重複序列和一個或多個插入位點,這一個或多個插入位點用於在該同向重複序列的上游或下游(以適用者為准)插入一個或多個指導序列,其中在表現時,該指導序列引導DD-CRISPR複合物與真核細胞中的靶序列的序列特異性結合,其中該CRISPR複合物包含DD-CRISPR酶,該酶與雜交到該靶序列上的指導序列複合;和(b)第二調節元件,該第二調節元件可操作地連接至編碼所述DD-CRISPR酶的酶編碼序列,該DD-CRISPR酶包括至少一個核定位序列和/或至少一個NES;其中組分(a)和(b)位於該系統的相同或不同載體上。在適用的情況下,還可以提供tracr序列。在一些實施方式中,組分(a)進一步包括可操作地連接到該第一調節元件的兩個或更多個指導序列,其中當表現時,這兩個或更多個指導序列中的每者都引導DD-CRISPR複合物與真核細胞中的不同靶序列的序列特異性結合。在一些實施方式中,該DD-CRISPR複合物包括一個或多個核定位序列和/或一個或多個NES,其 具有足夠強度來在真核細胞的細胞核中或細胞核外驅動所述CRISPR複合物以可檢測的量積聚。不希望受理論束縛,認為核定位序列和/或NES對於真核生物中的DD-CRISPR複合物活性不是必要的,但包括此類序列增強該系統的活性,尤其對於靶向細胞核中的核酸分子和/或在細胞核中存在分子而言。在一些實施方式中,該DD-CRISPR酶係DD-Cas9。在一些實施方式中,該DD-CRISPR酶係DD-Cas9酶。在一些實施方式中,該DD-Cas9酶衍生自土拉熱弗朗西絲菌1、土拉熱弗朗西絲菌新兇手亞種、易北河普氏菌、毛螺菌科細菌MC2017 1、分解蛋白丁酸弧菌、Peregrinibacteria細菌GW2011_GWA2_33_10、Parcubacteria細菌GW2011_GWC2_44_17、密斯氏菌屬SCADC、胺基酸球菌屬BV3L6、毛螺菌科細菌MA2020、Candidatus Methanoplasma termitum、挑剔真桿菌、牛莫拉氏菌237、稻田鉤端螺旋體、毛螺菌科細菌ND2006、狗口腔卟啉單胞菌3、狄氏普氏菌、或獼猴卟啉單胞菌Cas9(例如該等生物之一的被修飾成具有至少一個DD或與其關聯的Cas9),並且可以包括另外的突變或改變或者可以是嵌合Cas9。該酶可以是DD-Cas9同系物或異種同源物。在一些實施方式中,該DD-CRISPR酶經密碼子優化以便在真核細胞中表現。在一些實施方式中,該DD-CRISPR引導在該靶序列位置處的一條或兩條股的切割。在一些實施方式中,該DD-CRISPR酶缺少DNA股切割活性。在一些實施方式中,該第一調節元件係聚合酶III啟動子。在一些實施方式中,該第二調節元件係聚合酶II啟動子。在一些實施方式中,該指導序列在長度上是至少16、17、18、19、20、25個核苷酸,或16-30個之間、或16-25個之間、或16-20個之間的核苷酸。通常,並且貫穿本說明書,術語“載體”係指一種核酸分子,它能夠運送與其連接的另一種核酸分 子。載體包括但不限於,單股、雙股、或部分雙股的核酸分子;包括一個或多個自由端、無自由端(例如,環狀的)的核酸分子;包括DNA、RNA、或兩者的核酸分子;以及本領域已知的其他多種多樣的多核苷酸。一種類型的載體係“質粒”,其係指其中可以例如藉由標準分子選殖技術插入另外的DNA片段的環狀雙股DNA環。另一種類型的載體係病毒載體,其中病毒衍生的DNA或RNA序列存在於用於包裝進病毒(例如,逆轉錄病毒、複製缺陷型逆轉錄病毒、腺病毒、複製缺陷型腺病毒、以及腺相關病毒)的載體中。病毒載體還包含由用於轉染到宿主細胞中的病毒攜帶的多核苷酸。某些載體(例如,具有細菌複製起點的細菌載體和附加型哺乳動物載體)能夠在它們被導入的宿主細胞中自主複製。其他載體(例如,非附加型哺乳動物載體)在引入宿主細胞後整合到該宿主細胞的基因組中,並且由此與該宿主基因組一起複製。而且,某些載體能夠指導它們可操作連接的基因的表現。這樣的載體在此被稱為“表現載體”。在重組DNA技術中使用的普通表現栽體通常是質粒形式。
重組表現載體可包含處於適合於在宿主細胞中的核酸表現的形式的本發明的核酸,這意味著該等重組表現載體包含基於待用於表現的宿主細胞而選擇的一種或多種調節元件,所述調節元件可操作地連接至待表現的核酸序列。在重組表現載體內,“可操作地連接”旨在表示感興趣的核苷酸序列以允許該核苷酸序列的表現的方式被連接至這一種或多種調節元件(例如,處於體外轉錄/翻譯系統中或當該載體被引入宿主細胞中時,處於該宿主細胞中)。
在一些實施方式中,用一種或多種在此描述的載體暫態地 或非暫態地轉染宿主細胞。在一些實施方式中,當細胞天然地出現在受試者體內時將其轉染。在一些實施方式中,被轉染的細胞取自受試者。在一些實施方式中,該細胞來源於取自受試者的細胞,如細胞系。用於組織培養的多種多樣的細胞系在本領域係已知的。細胞系的實例包括但不限於,C8161、CCRF-CEM、MOLT、mIMCD-3、NHDF、HeLa-S3、Huh1、Huh4、Huh7、HUVEC、HASMC、HEKn、HEKa、MiaPaCell、Panc1、PC-3、TF1、CTLL-2、C1R、Rat6、CV1、RPTE、A10、T24、J82、A375、ARH-77、Calu1、SW480、SW620、SKOV3、SK-UT、CaCo2、P388D1、SEM-K2、WEHI-231、HB56、TIB55、Jurkat、J45.01、LRMB、Bcl-1、BC-3、IC21、DLD2、Raw264.7、NRK、NRK-52E、MRC5、MEF、Hep G2、海拉B、海拉T4、COS、COS-1、COS-6、COS-M6A、BS-C-1猴腎上皮細胞、BALB/3T3小鼠胚胎成纖維細胞、3T3 Swiss、3T3-L1、132-d5人類胎兒成纖維細胞;10.1小鼠成纖維細胞、293-T、3T3、721、9L、A2780、A2780ADR、A2780cis、A172、A20、A253、A431、A-549、ALC、B16、B35、BCP-1細胞、BEAS-2B、bEnd.3、BHK-21、BR 293、BxPC3、C3H-10T1/2、C6/36、Cal-27、CHO、CHO-7、CHO-IR、CHO-K1、CHO-K2、CHO-T、CHO Dhfr -/-、COR-L23、COR-L23/CPR、COR-L23/5010、COR-L23/R23、COS-7、COV-434、CML T1、CMT、CT26、D17、DH82、DU145、DuCaP、EL4、EM2、EM3、EMT6/AR1、EMT6/AR10.0、FM3、H1299、H69、HB54、HB55、HCA2、HEK-293、海拉、Hepa1c1c7、HL-60、HMEC、HT-29、Jurkat、JY細胞、K562細胞、Ku812、KCL22、KG1、KYO1、LNCap、Ma-Mel 1-48、MC-38、MCF-7、MCF-10A、MDA-MB-231、MDA-MB-468、MDA-MB-435、MDCK II、 MDCK II、MOR/0.2R、MONO-MAC 6、MTD-1A、MyEnd、NCI-H69/CPR、NCI-H69/LX10、NCI-H69/LX20、NCI-H69/LX4、NIH-3T3、NALM-1、NW-145、OPCN/OPCT細胞系、Peer、PNT-1A/PNT 2、RenCa、RIN-5F、RMA/RMAS、Saos-2細胞、Sf-9、SkBr3、T2、T-47D、T84、THP1細胞系、U373、U87、U937、VCaP、維洛(Vero)細胞、WM39、WT-49、X63、YAC-1、YAR及其轉基因變種。細胞系可獲得自熟習該項技術者已知的多種來源(參見例如,美國典型培養物保藏中心(American Type Culture Collection)(ATCC)(馬納薩斯(Manassus),維吉尼亞州))。在一些實施方式中,使用用一種或多種在此描述的載體轉染的細胞建立新的細胞系,該新的細胞系包括一種或多種載體來源的序列。在一些實施方式中,使用用如在此描述的CRISPR系統的組分轉染(如藉由用一種或多種載體進行暫態轉染或用RNA進行轉染)且藉由CRISPR複合物的活性修飾的細胞建立新的細胞系,該新的細胞系包括以下細胞,該等細胞包含吸水但是缺少任何其他外源序列。在一些實施方式中,在評估一種或多種測試化合物中使用用一種或多種在此描述的載體暫態或非暫態轉染的細胞或來源於這樣的細胞的細胞系。
術語“調節元件”旨在包括啟動子、增強子、內部核糖體進入位點(IRES)、以及其他表現控制元件(例如,轉錄終止信號,如多聚腺苷酸化信號和多聚U序列)。這樣的調節序列例如描述於戈德爾(Goeddel),《基因表現技術:酶學方法》(GENE EXPRESSION TECHNOLOGY:METHODS IN ENZYMOLOGY)185,學術出版社(Academic Press),聖地牙哥(San Diego),加利福尼亞州(1990)中。 調節元件包括指導一核苷酸序列在許多類型的宿主細胞中的組成型表現的那些序列以及指導該核苷酸序列只在某些宿主細胞中表現的那些序列(例如,組織特異型調節序列)。組織特異性啟動子可主要引導在感興趣的期望組織中的表現,所述組織例如肌肉、神經元、骨、皮膚、血液、特定的器官(例如,肝、胰腺)、或特殊的細胞類型(例如,淋巴細胞)。調節元件還可以時序依賴性方式(如以細胞週期依賴性或發育階段依賴性方式)指導表現,該方式可以是或者可以不是組織或細胞類型特異性的。在一些實施方式中,載體包括一個或多個pol III啟動子(例如,1、2、3、4、5個、或更多個pol III啟動子)、一個或多個pol II啟動子(例如,1、2、3、4、5個、或更多個pol II啟動子)、一個或多個pol I啟動子(例如,1、2、3、4、5個、或更多個pol I啟動子)、或其組合。pol III啟動子的實例包括但不限於U6和H1啟動子。pol II啟動子的實例包括但不限於逆轉錄勞斯肉瘤病毒(RSV)LTR啟動子(視情況具有RSV增強子)、巨細胞病毒(CMV)啟動子(視情況具有CMV增強子)[參見,例如,波沙特(Boshart)等人,《細胞》(Cell)41:521-530(1985)]、SV40啟動子、二氫葉酸還原酶啟動子、β-肌動蛋白啟動子、磷酸甘油激酶(PGK)啟動子、和EF1α啟動子。還被術語“調節元件”涵蓋的是增強子元件,如WPRE;CMV增強子;在HTLV-I的LTR中的R-U5’片段(《分子細胞生物學》(Mol.Cell.Biol.),第8(1)卷,第466-472頁,1988);SV40增強子;以及在兔β-珠蛋白的外顯子2與3之間的內含子序列(《美國國家科學院院刊》(Procc.Natl.Acad.Sci.USA.),第78(3)卷,第1527-31頁,1981)。熟習該項技術者應當理解的是,表現載體的設計可取決於比如待轉化的宿主細胞的選擇、所希望的表現水平等因素。載體可以被引入到宿主細胞中 而由此產生轉錄物、蛋白質、或肽,包括由如本文描述的核酸編碼的融合蛋白或肽(例如,規律間隔成簇短迴文重複(CRISPR)轉錄物、蛋白質、酶、其突變體形式、其融合蛋白等)。
有利的載體包括慢病毒以及腺相關病毒,並且也可選擇此類型的載體以靶向具體類型的細胞。
在一個方面,本發明提供了包含調節元件的載體,該調節元件可操作地連接到編碼DD-CRISPR酶的酶編碼序列上,該DD-CRISPR酶包含一個或多個核定位序列和/或NES。在一些實施方式中,所述調節元件驅動真核細胞中DD-CRISPR酶的轉錄,使得所述DD-CRISPR酶以可檢測的量在該真核細胞的細胞核中積聚和/或被從細胞核中輸出。在一些實施方式中,該調節元件係聚合酶II啟動子。在一些實施方式中,該DD-CRISPR酶係DD-Cas9。在一些實施方式中,該DD-CRISPR酶係DD-Cas9酶。在一些實施方式中,該DD-Cas9酶衍生自土拉熱弗朗西絲菌1、土拉熱弗朗西絲菌新兇手亞種、易北河普氏菌、毛螺菌科細菌MC2017 1、分解蛋白丁酸弧菌、Peregrinibacteria細菌GW2011_GWA2_33_10、Parcubacteria細菌GW2011_GWC2_44_17、密斯氏菌屬SCADC、胺基酸球菌屬BV3L6、毛螺菌科細菌MA2020、Candidatus Methanoplasma termitum、挑剔真桿菌、牛莫拉氏菌237、稻田鉤端螺旋體、毛螺菌科細菌ND2006、狗口腔卟啉單胞菌3、狄氏普氏菌、或獼猴卟啉單胞菌Cas9(例如,被修飾成具有至少一個DD或與其相關聯),並且可以包括該Cas9的另外的改變或突變,並且可以是嵌合Cas9。在一些實施方式中,該DD-CRISPR酶經密碼子優化以便在真核細胞中表現。在一些實施方式 中,該DD-CRISPR引導在該靶序列位置處的一條或兩條股的切割。在一些實施方式中,該DD-CRISPR酶缺少或基本上缺少DNA股切割活性(例如,與野生型酶或沒有降低核酸酶活性的突變或改變的酶相比,不超過5%核酸酶活性)。
在一個方面,本發明提供了DD-CRISPR酶,該酶包括一個或多個核定位序列和/或NES,其具有足夠強度來在真核細胞的細胞核中和/或細胞核外驅動所述DD-CRISPR酶以可檢測的量積聚。在一些實施方式中,該DD-CRISPR酶係DD-Cas9。在一些實施方式中,該DD-CRISPR酶係DD-Cas9酶。在一些實施方式中,該DD-Cas9酶衍生自土拉熱弗朗西絲菌1、土拉熱弗朗西絲菌新兇手亞種、易北河普氏菌、毛螺菌科細菌MC2017 1、分解蛋白丁酸弧菌、Peregrinibacteria細菌GW2011_GWA2_33_10、Parcubacteria細菌GW2011_GWC2_44_17、密斯氏菌屬SCADC、胺基酸球菌屬BV3L6、毛螺菌科細菌MA2020、Candidatus Methanoplasma termitum、挑剔真桿菌、牛莫拉氏菌237、稻田鉤端螺旋體、毛螺菌科細菌ND2006、狗口腔卟啉單胞菌3、狄氏普氏菌、或獼猴卟啉單胞菌Cas9(例如,被修飾成具有至少一個DD或與其相關聯),並且可以包括該Cas9的另外的改變或突變,並且可以是嵌合Cas9。在一些實施方式中,該DD-CRISPR酶經密碼子優化以便在真核細胞中表現。在一些實施方式中,該DD-CRISPR引導在該靶序列位置處的一條或兩條股的切割。在一些實施方式中,該DD-CRISPR酶缺少或基本上缺少DNA股切割活性(例如,與野生型酶或沒有降低核酸酶活性的突變或改變的酶相比,不超過5%核酸酶活性)。
在一個方面,本發明提供了真核宿主細胞,該真核宿主細胞包含(a)第一調節元件,該第一調節元件可操作地連接到同向重複序列和一個或多個插入位點,這一個或多個插入位點用於在該同向重複序列的上游或下游(以適用者為准)插入一個或多個指導序列,其中在表現時,該指導序列引導DD-CRISPR複合物與真核細胞中的靶序列的序列特異性結合,其中該CRISPR複合物包含DD-CRISPR酶,該酶與雜交到該靶序列上的指導序列複合;和/或(b)第二調節元件,該第二調節元件可操作地連接至編碼所述DD-CRISPR酶的酶編碼序列,該DD-CRISPR酶包括至少一個核定位序列和/或NES。在一些實施方式中,該宿主細胞包括組分(a)以及(b)。在適用的情況下,還可以提供tracr序列。在一些實施方式中,組分(a)、組分(b)、或組分(a)和(b)穩定地整合到該宿主真核細胞的基因組中。在一些實施方式中,組分(a)進一步包括可操作地連接到該第一調節元件的兩個或更多個指導序列,其中當表現時,這兩個或更多個指導序列中的每者都引導DD-CRISPR複合物與真核細胞中的不同靶序列的序列特異性結合。在一些實施方式中,該DD-CRISPR酶包括一個或多個核定位序列和/或核輸出序列或NES,其具有足夠強度來在真核細胞的細胞核中和/或細胞核外驅動所述CRISPR酶以可檢測的量積聚。在一些實施方式中,該DD-CRISPR酶係Cas9。在一些實施方式中,該CRISPR酶係Cas9酶。在一些實施方式中,該DD-Cas9酶衍生自土拉熱弗朗西絲菌1、土拉熱弗朗西絲菌新兇手亞種、易北河普氏菌、毛螺菌科細菌MC2017 1、分解蛋白丁酸弧菌、Peregrinibacteria細菌GW2011_GWA2_33_10、Parcubacteria細菌GW2011_GWC2_44_17、密斯氏菌屬SCADC、胺基酸球菌屬BV3L6、毛螺菌科細菌MA2020、 Candidatus Methanoplasma termitum、挑剔真桿菌、牛莫拉氏菌237、稻田鉤端螺旋體、毛螺菌科細菌ND2006、狗口腔卟啉單胞菌3、狄氏普氏菌、或獼猴卟啉單胞菌Cas9(例如,被修飾成具有至少一個DD或與其相關聯),並且可以包括該Cas9的另外的改變或突變,並且可以是嵌合Cas9。在一些實施方式中,該DD-CRISPR酶經密碼子優化以便在真核細胞中表現。在一些實施方式中,該DD-CRISPR引導在該靶序列位置處的一條或兩條股的切割。在一些實施方式中,該DD-CRISPR酶缺少或基本上缺少DNA股切割活性(例如,與野生型酶或沒有降低核酸酶活性的突變或改變的酶相比,不超過5%核酸酶活性)。在一些實施方式中,該第一調節元件係聚合酶III啟動子。在一些實施方式中,該第二調節元件係聚合酶II啟動子。在一些實施方式中,該指導序列在長度上是至少16、17、18、19、20、25個核苷酸,或16-30個之間、或16-25個之間、或16-20個之間的核苷酸。在一方面,本發明提供了非人類真核生物;較佳的是多細胞真核生物,包含根據所描述的實施方式中任一項的真核宿主細胞。在其他方面,本發明提供了真核生物;較佳的是多細胞真核生物,包含根據所描述的實施方式中任一項的真核宿主細胞。在該等方面的一些實施方式中,該生物可以是動物;例如哺乳動物。另外,該生物可以是節肢動物,如昆蟲。該生物也可以是植物。另外,該生物可以是真菌。
通常關於CRISPR-Cas系統的使用,提及的是文獻(包括貫穿本揭露引用的專利申請、專利和專利出版物),因為本發明的實施方式可以如在那些文獻中的使用。一種或多種CRISPR-Cas系統(例如,單個的或多元化的)可以與作物基因組學的最新進展結合使用。這樣一種 或多種CRISPR-Cas系統可以用於進行有效且具成本效益的植物基因或基因組探詢或編輯或操縱一例如,用於快速研究和/或選擇和/或探詢和/或比較和/或操縱和/或轉化植物基因或基因組;例如,以為一種或多種植物產生、鑒定、開發、優化、或賦予一種或多種性狀或一種或多種特徵或者以轉化植物基因組。因此,可以改進植物、具有性狀或特徵的新組合的新植物的生產、或具有增強的性狀的新植物的生產。關於定點整合(SDI)或基因編輯(GE)或任何近反向育種(Near Reverse Breeding)(NRB)或反向育種(RB)技術中的植物,可以使用這樣的一種或多種CRISPR-Cas系統。關於使用植物中的CRISPR-Cas系統,提及的是亞利桑那大學網站,“CRISPR-PLANT”(http://www.genome.arizona.edu/crispr/)(由賓州州立大學(Penn State)和AGI提供支援)。本發明的實施方式可以在基因組編輯中用於植物中或先前已經使用RNAi或類似基因組編輯技術的地方;參見例如,涅克拉索夫(Nekrasov),“植物基因組編輯一點通:使用CRISPR/Cas系統在模式和作物植物中進行靶向誘變(Plant genome editing made easy:targeted mutagenesis in model and crop plants using the CRISPR/Cas system)”,《植物方法》(Plant Methods)2013,9:39(doi:10.1186/1746-4811-9-39);布魯克斯(Brooks),“使用CRISPR/Cas9系統在第一代番茄中進行有效的基因編輯(Efficient gene editing in tomato in the first generation using the CRISPR/Cas9 system)”,《植物生理學》(Plant Physiology)2014年9月第114.247577頁;單(Shan),“使用CRISPR-Cas系統對作物植物進行靶向基因組修飾(Targeted genome modification of crop plants using a CRISPR-Cas system)”,《自然生物技術》(Nature Biotechnology)31,686-688(2013);馮(Feng),“使用 CRISPR/Cas系統在植物中進行有效基因組編輯(Efficient genome editing in plants using a CRISPR/Cas system)”,《細胞研究》(Cell Research)(2013)23:1229-1232.doi:10.1038/cr.2013.114;線上公開於2013年8月20日;謝(Xie),“使用CRISPR-Cas系統在植物中進行RNA指導的基因組編輯(RNA-guided genome editing in plants using a CRISPR-Cas system)”,《分子植物》(Mol Plant.)2013年11月;6(6):1975-83.doi:10.1093/mp/sst119.電子版2013年8月17日;徐(Xu),“使用根癌農桿菌介導的CRISPR-Cas系統在水稻中進行基因靶向(Gene targeting using the Agrobacterium tumefaciens-mediated CRISPR-Cas system in rice)”,《水稻》(Rice)2014,7:5(2014);周(Zhou)等人,“在異交多年生木本植物胡楊中針對雙等位基因CRISPR突變開發SNP揭示了4-香豆酸:CoA連接酶特異性與冗餘(Exploiting SNPs for biallelic CRISPR mutations in the outcrossing woody perennial Populus reveals 4-coumarate:CoA ligase specificity and Redundancy)”,《新植物學家》(New Phytologist)(2015)(論壇)1-4(僅在www.newphytologist.com線上可得);卡林多(Caliando)等人,“使用CRISPR裝置在宿主基因組中穩定進行的靶向向DNA降解(Targeted DNA degradation using a CRISPR device stably carried in the host genome)”,《自然通訊》(NATURE COMMUNICATIONS)6:6989,DOI:10.1038/ncomms7989、www.nature.com/naturecommunications DOI:10.1038/ncomms7989;美國專利案號6,603,061-農桿菌介導的植物轉化方法(Agrobacterium-Mediated Plant Transformation Method);美國專利案號7,868,149-植物基因組序列及其用途(Plant Genome Sequences and Uses Thereof)以及US 2009/0100536-轉具有增強的農藝性狀的基因植物 (Transgenic Plants with Enhanced Agronomic Traits),將每者的所有內容和揭露藉由引用以其全文結合在此。在本發明的實踐中,莫雷爾(Morrell)等人“作物基因組學:進展與應用(Crop genomics:advances and applications)”《遺傳學自然評論》(Nat Rev Genet.).2011 Dec 29;13(2):85-96;將其各自藉由引用併入本文,包括關於本文的實施方式如何可以就植物而使用。因此,加上必要的變更,本文對動物細胞的提及也可適用植物細胞,除非另外係顯而易見的。
在一個方面,本發明提供了套組,該套組包括在此所述的組分中的一種或多種。在一些實施方式中,該套組包括載體系統以及用於使用該套組的說明書。在一些實施方式中,該載體系統包含:(a)第一調節元件,該第一調節元件可操作地連接到同向重複序列和一個或多個插入位點,這一個或多個插入位點用於在該同向重複序列的上游或下游(以適用者為准)插入一個或多個指導序列,其中在表現時,該指導序列引導CRISPR複合物與真核細胞中的靶序列的序列特異性結合,其中該CRISPR複合物包含CRISPR酶,該酶與雜交到該靶序列上的指導序列複合;和/或(b)第二調節元件,該第二調節元件可操作地連接至編碼所述CRISPR酶的酶編碼序列上,該CRISPR酶包含核定位序列。在適用的情況下,還可以提供tracr序列。在一些實施方式中,該套組包括位於該系統的相同或不同載體上的組分(a)和(b)。在一些實施方式中,組分(a)進一步包括可操作地連接到該第一調節元件的兩個或更多個指導序列,其中當表現時,該兩個或更多個指導序列中的每個引導CRISPR複合物在真核細胞中與不同靶序列的序列特異性結合。在一些實施方式中,該 CRISPR酶包括一個或多個核定位序列,該一個或多個核定位序列具有足夠強度來在真核細胞的細胞核中驅動所述CRISPR酶以可檢測到的量積聚。在一些實施方式中,該CRISPR酶係Cas9。在一些實施方式中,該CRISPR酶係Cas9酶。在一些實施方式中,該Cas9酶衍生自土拉熱弗朗西絲菌1、土拉熱弗朗西絲菌新兇手亞種、易北河普氏菌、毛螺菌科細菌MC2017 1、分解蛋白丁酸弧菌、Peregrinibacteria細菌GW2011_GWA2_33_10、Parcubacteria細菌GW2011_GWC2_44_17、密斯氏菌屬(Smithella sp.)SCADC、胺基酸球菌屬BV3L6、毛螺菌科細菌MA2020、Candidatus Methanoplasma termitum、挑剔真桿菌、牛莫拉氏菌237、稻田鉤端螺旋體、毛螺菌科細菌ND2006、狗口腔卟啉單胞菌3、狄氏普氏菌、或獼猴卟啉單胞菌Cas9(例如,被修飾成具有至少一個DD或與其相關聯),並且可以進一步包括該Cas9的改變或突變,並且可以是嵌合Cas9。在一些實施方式中,該DD-CRISPR酶經密碼子優化以便在真核細胞中表現。在一些實施方式中,該DD-CRISPR引導在該靶序列位置處的一條或兩條股的切割。在一些實施方式中,該DD-CRISPR酶缺少或基本上缺少DNA股切割活性(例如,與野生型酶或沒有降低核酸酶活性的突變或改變的酶相比,不超過5%核酸酶活性)。在一些實施方式中,該第一調節元件係聚合酶III啟動子。在一些實施方式中,該第二調節元件係聚合酶II啟動子。在一些實施方式中,該指導序列在長度上是至少16、17、18、19、20、25個核苷酸,或16-30個之間、或16-25個之間、或16-20個之間的核苷酸。
在一個方面,本發明提供了修飾在真核細胞中的靶多核苷 酸之方法。在一些實施方式中,該方法包括允許DD-CRISPR複合物結合到該靶多核苷酸上例如以實施所述靶多核苷酸的切割,由此修飾該靶多核苷酸,其中該DD-CRISPR複合物包含與雜交到在所述靶多核苷酸內的靶序列上的指導序列複合的DD-CRISPR酶,其中所述指導序列連接到同向重複序列上。在適用的情況下,還可以提供tracr序列(例如以提供單個指導RNA,sgRNA)。在一些實施方式中,所述切割包括藉由所述DD-CRISPR酶切割在該靶序列位置的一條或兩條股;在一些實施方式中,所述切割導致靶基因的轉錄降低。在一些實施方式中,該方法進一步包括藉由與外源模板多核苷酸同源重組修復所述切割的靶多核苷酸,其中所述修復導致突變,包括所述靶多核苷酸的一個或多個核苷酸的插入、缺失、或取代。在一些實施方式中,所述突變導致在從包含該靶序列的基因表現的蛋白質中的一個或多個胺基酸改變。在一些實施方式中,該方法進一步包括將一種或多種載體遞送到所述真核細胞,其中這一種或多種載體驅動下列一者或多者的表現:該DD-CRISPR酶和連接到該同向重複序列的指導序列。在適用的情況下,還可以提供tracr序列。在一些實施方式中,所述載體被遞送到受試者內的真核細胞中。在一些實施方式中,所述修飾發生在細胞培養物中的所述真核細胞中。在一些實施方式中,該方法進一步包括在所述修飾之前從受試者中分離所述真核細胞。在一些實施方式中,該方法進一步包括使所述真核細胞和/或從中衍生的細胞返回到所述受試者中。
在一個方面,本發明提供了修飾多核苷酸在真核細胞中的表現之方法。在一些實施方式中,該方法包括允許DD-CRISPR複合物結 合到該多核苷酸上,這樣使得所述結合導致所述多核苷酸的表現增加或降低;其中該DD-CRISPR複合物包含與雜交到所述多核苷酸內的靶序列上的指導序列複合的DD-CRISPR酶,其中所述指導序列連接到同向重複序列。在適用的情況下,還可以提供tracr序列。在一些實施方式中,該方法進一步包括將一種或多種載體遞送到所述真核細胞,其中這一種或多種載體驅動下列一者或多者的表現:該DD-CRISPR酶和連接到該同向重複序列的指導序列。在適用的情況下,還可以提供tracr序列。
在一個方面,本發明提供了產生包含經突變的疾病基因的模式真核細胞之方法。在一些實施方式中,疾病基因係與患有或產生疾病的風險的增加相關聯的任何基因。在一些實施方式中,該方法包括(a)向真核細胞中引入一種或多種載體,其中這一種或多種載體驅動下列一者或多者的表現:DD-CRISPR酶、連接到同向重複序列上的指導序列(在適用的情況下,還可以提供tracr序列);並且(b)允許DD-CRISPR複合物結合到靶多核苷酸上例如以實施在所述疾病基因內的該靶多核苷酸的切割,其中該DD-CRISPR複合物包含與雜交到該靶多核苷酸內的靶序列上的指導序列複合的DD-CRISPR酶,由此產生包含經突變的疾病基因的模式真核細胞。在一些實施方式中,所述切割包括藉由所述DD-CRISPR酶切割在該靶序列位置的一條或兩條股;在一些實施方式中,所述切割導致靶基因的轉錄降低。在一些實施方式中,該方法進一步包括藉由與外源模板多核苷酸同源重組修復所述切割的靶多核苷酸,其中所述修復導致突變,包括所述靶多核苷酸的一個或多個核苷酸的插入、缺失、或取代。在一些實施方式中,所述突變導致在從包含該靶序列的基因表現 的蛋白質中的一個或多個胺基酸改變。
在一個方面,本發明提供了用於研發生物活性劑之方法,該生物活性劑調製與疾病基因相關的細胞傳訊事件。在一些實施方式中,疾病基因係與患有或產生疾病的風險的增加相關聯的任何基因。在一些實施方式中,該方法包括(a)使測試化合物與所描述實施方式中任一項的模式細胞接觸;並且(b)檢測讀數變化,該變化指示與所述疾病基因的所述突變關聯的細胞傳訊事件的減少或增加,由此開發調節與所述疾病基因關聯的所述細胞傳訊事件的所述生物活性劑。
在一個方面,本發明提供了重組多核苷酸,該重組多核苷酸包含同向重複序列上游或下游(以適用者為准)的指導序列,其中當表現時該指導序列引導DD-CRISPR複合物與存在於真核細胞中的對應的靶序列的序列特異性結合。在一些實施方式中,該靶序列係存在於真核細胞中的病毒序列。在適用的情況下,還可以提供tracr序列。在一些實施方式中,該靶序列係原癌基因或癌基因。
在一個方面,本發明提供了藉由在一種或多種細胞的基因中引入一個或多個突變來選擇一種或多種細胞之方法,該方法包括:將一種或多種載體引入這一種或多種細胞中,其中這一種或多種載體驅動下列一者或多者的表現:DD-CRISPR酶、連接到同向重複序列上的指導序列(在適用的情況下,還可以提供tracr序列)、和編輯模板;其中該編輯模板包含消除DD-CRISPR酶切的一個或多個突變;允許該編輯模板與靶多核苷酸在有待篩選的一種或多種細胞中進行同源重組;允許CRISPR複合物結合到靶多核苷酸上以實施在所述基因內的該靶多核苷酸的切 割,其中該DD-CRISPR複合物包含與雜交到該靶多核苷酸內的靶序列上的指導序列複合的DD-CRISPR酶,其中該DD-CRISPR複合物與該靶多核苷酸的結合誘導細胞死亡,由此允許選擇其中已經引入一個或多個突變的一種或多種細胞。在一個較佳的實施方式中,該DD-CRISPR酶係DD-Cas9。在本發明的另一方面,該有待選擇的細胞可以是真核細胞。本發明的方面允許選擇特異細胞,而不需要選擇標記或可能包括反選擇系統的兩步法。這一種或多種細胞可以是原核或真核細胞。
在一個另外的方面,本發明涉及用於鑒定或設計適合在DD-CRISPR-Cas9系統或其功能部分內的或結合到DD-CRISPR-Cas9系統或其功能部分的潛在的化合物的電腦輔助方法、或反之亦然(用於鑒定或設計結合到所希望的化合物的潛在的DD-CRISPR-Cas9系統或其功能部分的電腦輔助方法)、或用於鑒定或設計潛在的DD-CRISPR-Cas9系統的電腦輔助方法(例如,就預測能夠被操縱的DD-CRISPR-Cas9系統的區域而言一例如,基於晶體結構數據或基於Cas9異種同源物的數據,或就官能團(如活化蛋白或抑制蛋白)可以附接至該DD-CRISPR-Cas9系統的何處而言,或就Cas9截短而言或就設計切口酶而言),所述方法包括:使用電腦系統,例如包括處理器、數據存儲系統、輸入裝置、和輸出裝置的程式設計電腦,以下步驟:(a)藉由所述輸入裝置將數據登錄到該程式設計電腦中,該數據包括來自DD-CRISPR-Cas9晶體結構的或與其有關的原子子集的三維座標,例如在DD-CRISPR-Cas9系統結合結構域中、或可替代地或另外地在基於Cas9異種同源物之間的或關於Cas9的或關於切口酶的或關於官能團的差異而變化的結構域中,視情況連同來自一種或 多種CRISPR-Cas9系統複合物的結構資訊,由此產生數據集;(b)使用所述處理器比較所述數據集與儲存在所述電腦數據存儲系統中的電腦結構資料庫,例如結合到或推定結合到或希望結合到DD-CRISPR-Cas9系統的化合物的、或關於DD-Cas9異種同源物的(例如,關於Cas9的或關於在Cas9異種同源物之間變化的結構域或區域的)、或關於DD-CRISPR-Cas9晶體結構的、或關於切口酶的或關於官能團的結構;(c)使用電腦方法從所述資料庫中選擇一種或多種結構一例如,可以結合到所希望的結構的DD-CRISPR-Cas9結構、可以結合到某些DD-CRISPR-Cas9結構的所希望的結構、可以被操縱的DD-CRISPR-Cas9系統的部分,例如基於來自DD-CRISPR-Cas9晶體結構的其他部分的和/或來自DD-Cas9異種同源物、截短的Cas9、新穎的切口酶或特定的官能團、或用於將官能團附接至DD-CRISPR-Cas9系統或突變該等系統的位置的數據;(d)使用電腦方法構建所選一種或多種結構的模型;並且(e)將所選一種或多種結構輸出至所述輸出裝置;並且視情況合成所選一種或多種結構中的一者或多者;並且進一步視情況作為DD-CRISPR-Cas9系統或在其中測試所述合成的所選一種或多種結構;或者,所述方法包括:提供該DD-CRISPR-Cas9晶體結構的至少兩個原子的座標,例如本文引用的材料的至少兩個原子、或該DD-CRISPR-Cas9晶體結構的至少一個子結構域的座標(“所選座標”);提供包含結合分子的候選物的或可以被操縱的該DD-CRISPR-Cas9系統的部分的結構,例如基於來自該DD-CRISPR-Cas9晶體結構的其他部分的和/或來自Cas9異種同源物的數據,或官能團的結構,並且將該候選物的結構與所選座標匹配,以由此獲得產品數據,該產品數據包括可以結合到所希望的結構的DD-CRISPR-Cas9結構,可以結 合到某些DD-CRISPR-Cas9結構的所希望的結構、可以被操縱的CRISPR-Cas9系統的部分,截短的Cas9、新穎的切口酶、或特定的官能團、或用於附接官能團或用於突變DD-CRISPR-Cas9系統的位置,並且將其輸出;並且視情況從所述產品數據合成一種或多種化合物並且進一步視情況包括作為DD-CRISPR-Cas9系統或在其中測試所述合成的一種或多種化合物。該測試可以包括對由所述合成的所選一種或多種結構產生的DD-CRISPR-Cas9系統進行分析,例如相對於結合、或執行所希望的功能。前述方法中的輸出可以包括數據傳輸,例如經由電信、電話、視訊會議、公眾通訊(例如演示,如電腦演示(例如POWERPOINT))、網際網路、電子郵件、文獻交流(如電腦程式(例如WORD))檔等進行的資訊傳輸。因此,本發明還包括含有以下項的電腦可讀介質:根據本文引用的材料的原子座標數據,所述數據限定了DD-CRISPR-Cas9或其至少一個子結構域的三維結構,或針對CRISPR-Cas9的結構因子數據,所述結構因子數據可衍生自本文引用的材料。該電腦可讀介質還可以含有前述方法的任何數據。本發明進一步包括用於產生或執行如在前述方法中的合理設計的方法、電腦系統,含有以下任一項:根據本文引用的材料的原子座標數據,所述數據限定了DD-CRISPR-Cas9或其至少一個子結構域的三維結構,或針對CRISPR-Cas9的結構因子數據,所述結構因子數據可衍生自本文引用的材料的原子座標數據。本發明進一步包括經商方法,該方法包括向使用者提供該電腦系統或該介質或DD-CRISPR-Cas9或其至少一個子結構域的三維結構、或針對DD-CRISPR-Cas9的結構因子數據(所述結構列於本文引用的材料的原子座標數據中並且所述結構因子數據可衍生自本文引用的材料的原子座標數據)、或本文的電腦介質或本文 的數據傳輸。
“結合位點”或“活性位點”包括結合腔或區域中的位點(如原子、胺基酸殘基的官能團或多個這樣的原子和/或基團)或基本上由其組成或由其組成,該結合腔或區域可以結合至化合物(如核酸分子),所述化合物涉及在結合中。所謂“匹配(fitting)”意指藉由自動或半自動手段確定候選分子的一個或多個原子與本發明結構的至少一個原子之間的相互作用,並且計算這樣的相互作用穩定的程度。相互作用包括由電荷、空間因素等引起的吸引和排斥。進一步描述了匹配用的各種基於電腦之方法。所謂“均方根(或rms)偏差”,我們意指離均差的平方的算術平均數的平方根。所謂“電腦系統”意指用於分析原子座標數據的硬體裝置、軟體裝置和數據存儲裝置。本發明的基於電腦的系統的最低硬體裝置典型地包括中央處理器(CPU)、輸入裝置、輸出裝置以及數據存儲裝置。合意地,提供顯示器或監測器用於視覺化結構數據。數據存儲裝置可以是RAM或用於存取本發明的電腦可讀介質的裝置。這樣的系統的實例係運行Unix、Windows或Apple作業系統的電腦和平板設備。所謂“電腦可讀介質”意指可以被電腦直接或間接讀取並且存取,例如使得該介質適於在以上提到的電腦系統中使用的任何一種或多種介質。這樣的介質包括但不限於:磁存儲介質,如軟碟、硬碟存儲介質和磁帶;光存儲介質,如光碟或CD-ROM;電存儲介質,如RAM和ROM;拇指驅動設備;雲存放裝置以及該等類別的混合體,如磁/光存儲介質。
在本發明的具體實施方式中,DD-CRISPR-Cas9系統或該DD-CRISPR-Cas9的組分的晶體結構的構象變化提供了關於蛋白質結構 區域相對於對DD-CRISPR-Cas系統功能而言重要的核苷酸(RNA或DNA)結構區域的撓性或移動的重要且關鍵的資訊。在本文引用的材料中針對Cas9提供的結構資訊可以用於進一步工程化和優化本文的DD-CRISPR-Cas系統並且這可以被外推用於探詢其他CRISPR酶,例如還用DD-CRISPR酶系統,例如其他V型或VI型CRISPRR酶系統(例如其他V型或VI型DD-CRISPR酶系統)中的結構-功能關係。本發明包括經優化的功能性DD-CRISPR-Cas酶系統。具體而言,該DD-CRISPR酶包括一個或多個將它轉化為DNA結合蛋白的突變,展現出感興趣的功能的功能結構域可以被募集或附於或插入或附接至該DNA結合蛋白。在某些實施方式中,該CRISPR酶在DD-CRISPR酶的RuvC1中包括一個或多個突變和/或為如本文另外討論的突變。在一些實施方式中,該DD-CRISPR酶在催化結構域中具有一個或多個突變,其中在轉錄時,該指導序列引導DD-CRISPR複合物與該靶序列的序列特異性結合,並且其中該酶進一步包括功能結構域(例如,用於提供去穩定化結構域或將其促成)。在本文引用的材料中提供的結構資訊允許探詢指導與靶DNA和CRISPR酶(例如,Cas9;例如DD-CRISPR酶,例如DD-Cas9)的相互作用,從而允許工程化或改變sgRNA的結構,以便優化整個DD-CRISPR-Cas系統的功能性。例如,可以在不與Cas9蛋白衝突的情況下藉由插入可以結合至RNA的轉接蛋白來擴展該指導的環。該等轉接蛋白可以進一步募集效應蛋白或融合,該等效應蛋白或融合包括一個或多個功能結構域。功能結構域可以包括轉錄活化結構域(例如VP64)、基本上由其組成或由其組成。功能結構域可以包括轉錄抑制結構域(例如KRAB)、基本上由其組成。在一些實施方式中,轉錄抑制結構域係或包括SID、或SID的多聯體(例如SID4X)或基 本上由其組成。在一些實施方式中,功能結構域包括表觀遺傳修飾結構域、基本上由其組成,從而提供了表觀遺傳修飾酶。在一些實施方式中,功能結構域包括活化結構域、基本上由其組成,其可以是P65活化結構域。
本發明的方面包括非天然存在的或工程化的組成物,該組成物可以包含指導RNA(gRNA),其包含能夠雜交到細胞中的感興趣的基因組座位中的靶序列上的指導序列;和DD-CRISPR酶,其可以包含至少一個或多個核定位序列,其中該DD-CRISPR酶包括一個或兩個或更多個突變,這樣使得該酶與野生型酶相比具有改變或降低的核酸酶活性,其中該gRNA的至少一個環藉由插入結合至一種或多種轉接蛋白的一個或多個不同RNA序列而被修飾,並且其中該轉接蛋白進一步募集一個或多個異源功能結構域。在本發明的一個實施方式中,該DD-CRISPR酶包括一個或兩個或更多個突變。在另一個實施方式中,功能結構域包括轉錄活化結構域(例如VP64)、基本上由其組成。在另一個實施方式中,功能結構域包括轉錄抑制結構域(例如,KRAB結構域、SID結構域或SID4X結構域)、基本上由其組成。在本發明的實施方式中,這一個或多個異源功能結構域具有一種或多種選自下組的活性,該組包括修飾烷酶活性、去甲酶活性、轉錄活化活性、轉錄抑制活性、轉錄釋放因子活性、組蛋白修飾活性、RNA切割活性以及核酸結合活性,基本上由其組成,或由其組成。在本發明的另外的實施方式中,該細胞係真核細胞或哺乳動物細胞或人類細胞。在另外的實施方式中,該轉接蛋白選自下組,該組包括MS2、PP7、Qβ、F2、GA、fr、JP501、M12、R17、BZ13、JP34、JP500、KU1、M11、MX1、TW18、VK、SP、FI、ID2、NL95、TW19、AP205、 ΦCb5、ΦCb8r、ΦCb12r、ΦCb23r、7s、PRR1,基本上由其組成,或由其組成。在另一個實施方式中,該gRNA的至少一個環係四環和/或環2。本發明的一方面包括藉由向細胞中引入本文描述的任何組成物來修飾感興趣的基因組座位以改變該細胞中的基因表現之方法。
本發明的一方面係上述元件被包含在單個組成物中或被包含在單獨的組成物中。該等組成物可以有利地被應用於宿主,以在基因組水平上引出功能效應。
一般而言,按以下方式修飾gRNA,該方式為轉接蛋白提供了結合用的特異性結合位點(例如,適配體),該等轉接蛋白包括一個或多個功能結構域(例如,經由融合蛋白)。修飾經修飾的sgRNA,使得一旦該gRNA形成DD-CRISPR複合物(即結合至gRNA和靶標的DD-CRISPR酶),則該等轉接蛋白結合,並且轉接蛋白上的功能結構域被定位為有利於屬性化功能有效的空間取向。例如,如果該功能結構域包括轉錄活化蛋白(例如,VP64或p65)、基本上由其組成,則該轉錄活化蛋白被放置為允許它影響靶標轉錄的空間取向。同樣地,轉錄抑制蛋白將被有利地定位為影響靶標的轉錄,並且核酸酶(例如,Fok1)將被有利地定位為切割或部分切割該靶標。
熟習該項技術者應理解,對gRNA的允許銜接子+功能結構域的結合但不允許銜接子+功能結構域的正確定位(例如由於CRISPR複合物的三維結構內的位阻)的修飾係並非預期的修飾。可以在如本文描述的四環、莖環1、莖環2、或莖環3處,較佳的是在四環或莖環2處,並且最較佳的是在四環和莖環2兩者處對這一種或多種經修飾的 gRNA進行修飾。
如本文所解釋的,該等功能結構域可以是例如來自下組的一個或多個結構域,該組包括修飾烷酶活性、去甲酶活性、轉錄活化活性、轉錄抑制活性、轉錄釋放因子活性、組蛋白修飾活性、RNA切割活性、DNA切割活性、核酸結合活性、以及分子開關(例如光誘導型),基本上由其組成,或由其組成。在一些情況下,有利的是另外提供至少一個NLS和/或NES。在一些情況下,有利的是將該NLS和/或NES定位在N末端。當包括超過一個功能結構域時,該等功能結構域可以是相同的或不同的。
該gRNA可以被設計成包括多個對相同或不同轉接蛋白具有特異性的結合識別位點(例如,適配體)。該gRNA可以被設計成結合至轉錄起始位點(即TSS)上游的啟動子區-1000 - +1個核酸,較佳的是-200個核酸。這種定位改進了影響基因活化(例如,轉錄活化蛋白)或基因抑制(例如,轉錄抑制蛋白)的功能結構域。該經修飾的gRNA可以是被靶向一個或多個靶座位、包含在組成物中的一種或多種修飾的gRNA(例如,至少1種gRNA、至少2種gRNA、至少5種gRNA、至少10種gRNA、至少20種gRNA、至少30種gRNA、至少50種gRNA)。
此外,當核酸酶活性被失活時,具有降低的核酸酶活性的DD-CRISPR酶係最有效的(例如,與野生型酶相比,核酸酶失活至少70%、至少80%、至少90%、至少95%、至少97%、或100%;或換句話說,DD-Cas9酶或DD-CRISPR酶有利地具有約0%的非經突變的或野生型Cas9酶或CRISPR酶的核酸酶活性、或不超過約3%或約5%或約10%的非經突 變或野生型Cas9酶或CRISPR酶的核酸酶活性)。藉由向Cas9及其異種同源物的RuvC核酸酶結構域中引入突變這係可能的。失活的CRISPR酶可以具有關聯的(例如,經由融合蛋白)一個或多個功能結構域,例如至少一個去穩定化結構域;或者,例如像如在本文針對經修飾的gRNA轉接蛋白描述的那些,包括例如來自下組的一個或多個結構域,該組包括修飾烷酶活性、去甲酶活性、轉錄活化活性、轉錄抑制活性、轉錄釋放因子活性、組蛋白修飾活性、RNA切割活性、DNA切割活性、核酸結合活性、以及分子開關(例如,光誘導型),基本上由其組成,或由其組成。較佳的結構域係Fok1、VP64、P65、HSF1、MyoD1。在提供Fok1的情況下,有利的是提供多個Fok1功能結構域以允許功能性二聚體,並且gRNA被設計成為功能使用(Fok1)提供適當間隔,如在蔡(Tsai)等人(《自然生物技術》(Nature Biotechnology),第32卷,第6期,2014年6月)中具體描述的。該轉接蛋白可以利用已知接頭來附接這樣的功能結構域。在一些情況下,有利的是另外提供至少一個NLS或NES。在一些情況下,有利的是將該NLS或NES定位在N末端。當包括超過一個功能結構域時,該等功能結構域可以是相同的或不同的。一般而言,這一個或多個功能結構域在失活的DD-CRISPR酶上的定位係這樣一種定位,其允許功能結構域的正確空間取向以影響具有屬性化功能效應的靶標。例如,如果該功能結構域係轉錄活化蛋白(例如VP64或p65),則該轉錄活化蛋白被放置為允許它影響靶標轉錄的空間取向。同樣地,轉錄抑制蛋白將被有利地定位為影響靶標的轉錄,並且核酸酶(例如,Fok1)將被有利地定位為切割或部分裂解該靶標。這可以包括除DD-CRISPR酶的N-末端/C-末端之外的位置。
轉接蛋白可以是任何數目的蛋白質,其結合至被引入經修飾的gRNA中的適配體或識別位點並且一旦該gRNA已經被摻入DD-CRISPR複合物中,則允許一個或多個功能結構域的正確定位,以便影響具有屬性化功能的靶標。如在本申請中所詳細解釋的,該等可以是外殼蛋白,較佳的是噬菌體外殼蛋白。與這樣的轉接蛋白(例如,呈融合蛋白的形式)相關聯的功能結構域可以包括例如來自下組的一個或多個結構域,該組包括修飾烷酶活性、去甲酶活性、轉錄活化活性、轉錄抑制活性、轉錄釋放因子活性、組蛋白修飾活性、RNA切割活性、DNA切割活性、核酸結合活性、以及分子開關(例如光誘導型),基本上由其組成,或由其組成。較佳的結構域係Fok1、VP64、P65、HSF1、MyoD1。在該功能結構域係轉錄活化蛋白或轉錄阻抑因子的情況下,有利的是另外提供至少一個NLS或NES並且較佳的是在N末端處。當包括超過一個功能結構域時,該等功能結構域可以是相同的或不同的。該轉接蛋白可以利用已知接頭來附接這樣的功能結構域。這樣的接頭可以用於使該DD與該CRISPR酶關聯或者使得該CRISPR酶包含該DD。
因此,gRNA(例如,經修飾的gRNA)、失活的DD-CRISPR酶(具有或不具有功能結構域)、以及具有一個或多個功能結構域的結合蛋白可以各自獨立地被包含在組成物中並且被單獨地或共同地給予至宿主。可替代地,該等組分可以被提供在用於給予至宿主的單個組成物中。可以經由熟習該項技術者已知的或本文描述的用於遞送到宿主的病毒載體(例如,慢病毒載體、腺病毒載體、AAV載體)進行向宿主的給予。如本文所解釋的,使用不同的選擇標記(例如,用於慢病毒sgRNA選擇) 和gRNA濃度(例如,取決於是否使用多種gRNA)對於引出改進的效果而言可以是有利的。在這個概念的基礎上,若干變化適於引出基因組座位事件,包括DNA切割、基因活化、或基因失活。使用所提供的組成物,熟習該項技術者可以有利地且特異性地靶向具有相同或不同功能結構域的單個或多個座位,以引出一個或多個基因組座位事件。該等組成物可以按多種多樣的方法應用,用於在細胞中篩選文庫和在體內進行功能建模(例如,lincRNA的基因活化和功能鑒定;功能獲得建模;功能缺失建模;使用本發明的組成物建立用於優化和篩選目的的細胞系和轉基因動物)。
本發明包括本發明的組成物用於建立和利用條件型或誘導型DD-CRISPR轉基因細胞/動物之用途;參見例如,普萊特(Platt)等入,《細胞》(Cell)(2014),159(2):440-455,或者本文引用的PCT專利出版物,如WO 2014/093622(PCT/US 2013/074667)。例如,細胞或動物(如非人類動物,例如脊椎動物或哺乳動物,如齧齒動物例如小鼠、大鼠,或其他實驗室或田間動物例如貓、狗、綿羊等)可以是‘敲入的’,由此類似於普萊特(Platt)等人,該動物條件性地或誘導性地表現DD-Cas9。該靶細胞或動物因此條件性地或誘導性地包含DD-CRISPR酶(例如,DD-Cas9)(例如,呈Cre依賴性構建體的形式)和/或條件性地或誘導性地包含轉接蛋白或DD,並且在表現被引入該靶細胞中的載體之後,該載體表現該DD-CRISPR酶(例如,DD-Cas9)和/或轉接蛋白或DD,這在該靶細胞中誘導或產生DD-CRISPR酶(例如,DD-Cas9)表現和/或銜接子或DD表現的條件。藉由應用本發明的傳授和組成物與產生CRISPR複合 物的已知方法,誘導型基因組事件也是本發明的一方面。一個僅有的實例係產生CRISPR敲入/條件型轉基因動物(例如,包含例如Lox-Stop-polyA-Lox(LSL)盒的小鼠)並且隨後遞送一種或多種組成物,這一種或多種組成物提供一種或多種經修飾的gRNA(例如感興趣的靶基因的TSS的-200個核苷酸,用於基因活化目的;例如具有一種或多種由外殼蛋白例如MS2識別的適配體的經修飾的gRNA)、一種或多種如本文描述的轉接蛋白(連接至一個或多個VP64的MS2結合蛋白)以及用於誘導條件型動物的工具(例如,用於使得DD-Cas9表現可誘導的Cre重組酶)。可替代地,該轉接蛋白或DD可以被提供為具有條件型或誘導型CRISPR酶的條件型或誘導型元件,以便提供用於篩選目的的有效模型,這有利地僅需要最少的設計和給予特異性gRNA用於廣泛的應用。
在一些實施方式中,當靶向遺傳疾病時,尤其是在治療方法中,並且較佳的是在提供修復模板以校正或改變表型的情況下,表型改變較佳的是基因組修飾的結果。
在一些實施方式中,可以被靶向的疾病包括與引起疾病的剪接缺陷有關的那些。
在一些實施方式中,細胞靶標包括造血幹細胞/祖細胞(CD34+);人類T細胞;以及眼(視網膜細胞)-例如光感受器先質細胞。
在一些實施方式中,基因靶標包括:人類β珠蛋白-HBB(用於治療鐮狀細胞貧血,包括藉由刺激基因轉換(使用密切相關的HBD基因作為內源模板));CD3(T細胞);以及CEP920-視網膜(眼)。
在一些實施方式中,疾病靶標還包括:癌症;鐮狀細胞貧 血(基於點突變);HBV、HIV;β-地中海貧血;以及眼科或眼部疾病-例如引起萊伯(Leber)先天性黑朦(LCA)的剪接缺陷。
在一些實施方式中,遞送方法包括:酶-指導複合物(核糖核蛋白)的陽離子脂質介導的“直接”遞送和質粒DNA的電穿孔。
在此描述的方法、產物和用途可以用於非治療目的。此外,在此描述的方法中的任一項可以體外或離體應用。
在一方面,提供了非天然存在的或工程化的組成物,該組成物包含:
I.兩個或更多個CRISPR-Cas系統多核苷酸序列,其包含
(a)第一指導序列,該第一指導序列能夠雜交到多核苷酸座位中的第一靶序列上,
(b)第二指導序列,該第二指導序列能夠雜交到多核苷酸座位中的第二靶序列上,
(c)同向重複序列,
(d)視情況,在適用的情況下的tracr序列;以及
II. Cas9酶或編碼它的第二多核苷酸序列,
其中該Cas9酶係包含如本文描述的一個或多個DD的經修飾的酶,
其中在轉錄時,該第一指導序列和該第二指導序列分別引導第一CRISPR複合物和第二CRISPR複合物與該第一靶序列和第二靶序列的序列特異性結合,
其中該第一CRISPR複合物包含與可雜交到該第一靶序列上的第一指導序列複合的Cas9酶,
其中該第二CRISPR複合物包含與可雜交到該第二靶序列上的第二指導序列複合的Cas9酶,並且
其中該第一指導序列引導鄰近該第一靶序列的DNA雙股體的一條股的切割,並且該第二指導序列引導鄰近該第二靶序列的另一條股的切割,從而誘導雙股斷裂,由此修飾該生物或該非人類或非動物生物。
在另一個實施方式中,該Cas9作為蛋白質遞送到該細胞中。在另一個並且特別較佳的實施方式中,該Cas9作為蛋白質或作為編碼它的核苷酸序列遞送到該細胞中。作為蛋白質遞送至細胞可以包括核糖核蛋白(RNP)複合物的遞送,在該複合物中該蛋白質與該指導複合。
在一方面,提供了藉由本發明的組成物、系統或經修飾的酶修飾的或包含本發明的組成物、系統或經修飾的酶的宿主細胞和細胞系,包括幹細胞及其子代。
在一方面,提供了細胞治療方法,在該等方法中,例如對單個細胞或細胞群進行取樣或培養,其中該細胞或該等細胞如本文描述地進行離體修飾或已經如本文描述地進行離體修飾,並且然後被重新引入(取樣的細胞)或引入(培養的細胞)該生物體內。幹細胞(無論係胚胎幹細胞還是誘導型多能或全能幹細胞)在這一點上也是特別較佳的。但是,當然還設想了體內實施方式。
本發明方法可以進一步包括遞送模板,如修復模板,它們 可以是dsODN或ssODN,參見下文。模板的遞送可以經由與任何或所有CRISPR酶或指導的遞送同時的或分開的遞送並且經由相同或不同的遞送機制。在一些實施方式中,較佳的是一起遞送該模板與該指導,並且較佳的是還有該CRISPR酶。實例可以是AAV載體,其中該CRISPR酶係AsCas9或LbCas9。
本發明方法可以進一步包括:(a)向該細胞遞送雙股寡去氧核苷酸(dsODN),該雙股寡去氧核苷酸包含與藉由所述雙股斷裂產生的突出端互補的突出端,其中所述dsODN被整合進該感興趣的座位中;或-(b)向該細胞遞送單股寡去氧核苷酸(ssODN),其中所述ssODN充當所述雙股斷裂的同源定向修復的模板。本發明的方法可以用於預防或治療個體的疾病,視情況其中所述疾病係由所述感興趣座位中的缺陷引起。本發明的方法可以是在該個體的體內進行或針對取自該個體的細胞離體地進行,視情況其中將所述細胞返回到該個體。
本發明還包括藉由使用本發明的CRISPR酶或Cas酶或Cas9酶或CRISPR-CRISPR酶或CRISPR-Cas系統或CRISPR-Cas9系統獲得的產品。
結構同源性;同系物與異種同源物
在實施方式中,如在本文提及的Cas9蛋白還包括Cas9的同系物或異種同源物,如SpCas9或eSpCas9的。術語“異種同源物”(在本文還稱為“直系同源物”)和“同源物”(在本文還稱為“同系物”)在本領域係眾所周知的。藉由進一步指導的方式,如本文使用的蛋白質的“同系物”係相同種類的、執行與作為其同系物的蛋白質相同或相似 功能的蛋白質。可以藉由以下方式來鑒定同系物和異種同源物:同源建模(參見例如,格里爾(Greer),《科學》(Science)第228卷(1985)1055,和布倫代爾(Blundell)等人,(歐洲生物化學雜誌》(Eur J Biochem)第172卷(1988)513)或“結構性BLAST”(戴伊(Dey)F、克利夫 張(CliffZhang)Q、皮特瑞(Petrey)D、霍尼格(Honig)B.關於“結構性BLAST”:使用結構關係推斷功能(Toward a "structural BLAST":using structural relationships to infer function).《蛋白質科學》(Protein Sci.)2013年4月;22(4):359-66.doi:10.1002/pro.2225.)。關於在CRISPR-Cas座位領域中的應用,還參見史馬科夫(Shmakov)等人(2015)。同源蛋白可以不必係結構相關的,或者僅僅是部分結構相關的。如本文使用的蛋白質的“異種同源物”係不同種類的、執行與作為其異種同源物的蛋白質相同或相似功能的蛋白質。直向同源蛋白可以不必係結構相關的,或者僅僅是部分結構相關的。在具體實施方式中,如在本文提及的Cas9的同系物或異種同源物與Cas9具有至少80%,更較佳的是至少85%,甚至更較佳的是至少90%,例如像至少95%的序列同源性或一致性。在另外的實施方式中,如在本文提及的Cas9的同系物或異種同源物與野生型Cas9具有至少80%,更較佳的是至少85%,甚至更較佳的是至少90%,例如像至少95%的序列一致性。在具體實施方式中,如在本文提及的Cas9的同系物或異種同源物與Cas9具有至少80%,更較佳的是至少85%,甚至更較佳的是至少90%,例如像至少95%的序列同源性或一致性。在另外的實施方式中,如在本文提及的Cas9的同系物或異種同源物與野生型SpCas9具有至少80%,更較佳的是至少85%,甚至更較佳的是至少90%,例如像至少95%的序列一致性。在該Cas9具有一個或多個突變(經突變的)情況下,如 在本文提及的所述Cas9的同系物或異種同源物與經突變的Cas9具有至少80%,更較佳的是至少85%,甚至更較佳的是至少90%,例如像至少95%的序列一致性。
直向同源蛋白的特定結構域係類似地相關的。在某些實施方式中,如在本文提及的Cas9的直向同源結構域與Cas9具有至少60%、至少70%、至少80%、至少90%、或至少95%的序列同源性或一致性。在具體實施方式中,如在本文提及的Cas9的直向同源結構域與SpCas9具有至少60%、至少70%、至少80%、至少90%、或至少95%的序列同源性或一致性。
CRISPR-Cas9複合物或其組分的遞送
根據本揭露和本領域的知識,可以藉由在本文一般性地和詳細地描述的遞送系統來遞送CRISPR-Cas系統(確切地說係本文描述的新穎的CRISPR系統)、或其組分或其核酸分子(包括,例如HDR模板)或編碼或提供其組分的核酸分子。
載體遞送,例如質粒、病毒遞送:該CRISPR酶,例如Cas9、Cas9異種同源物或其突變體,和/或本發明的任何RNA,例如指導RNA,可以使用任何適合載體,例如,質粒或病毒載體,如腺相關病毒(AAV)、慢病毒、腺病毒或其他病毒載體類型、或其組合進行遞送。Cas9以及一種或多種指導RNA可以被包裝到一種或多種載體(例如,質粒或病毒載體)中。在一些實施方式中,病毒(例如,質粒或病毒載體)可以例如藉由肌肉注射遞送到感興趣的組織中,而有時經由靜脈內、經皮、鼻內、經口、粘膜、或其他遞送方法進行遞送。這樣的遞送可以經由單劑量或 多劑量來進行。熟習該項技術者理解的是,本文有待遞送的實際劑量可以在很大程度上取決於多種因素而變化,如載體選擇、靶細胞、生物、或組織、有待治療的受試者的一般狀況、所尋求的轉化/修飾的程度、給藥途徑、給藥方式、所尋求的轉化/修飾的類型,等等。
這樣的劑量可以進一步含有,例如,載體(水、鹽水、乙醇、甘油、乳糖、蔗糖、磷酸鈣、明膠、葡聚糖、瓊脂、果膠、花生油、芝麻油,等等)、稀釋劑、藥學上可接受的載體(例如,磷酸鹽緩衝鹽水)、藥學上可接受的賦形劑、和/或本領域已知的其他化合物。該劑型可以進一步含有一種或多種藥學上可接受的鹽,例如像,無機酸鹽如鹽酸鹽、氫溴酸鹽、磷酸鹽、硫酸鹽、等等;以及有機酸鹽,如乙酸鹽、丙酸鹽、丙二酸鹽、苯甲酸鹽等等。另外,也可以存在輔助物質,如潤濕劑或乳化劑、pH緩衝物質、凝膠或膠凝材料、調味劑、著色劑、微球體、聚合物、懸浮劑等等。另外,也可以存在一種或多種其他常規藥用成分,如防腐劑、保濕劑、懸浮劑、表面活性劑、抗氧化劑、抗結劑、填充劑、螯合劑、包衣劑、化學穩定劑等等,尤其是該劑型係可復原形式時。適合的示例性成分包括微晶纖維素、羧甲基纖維素鈉、聚山梨酯80、苯乙醇、三氯三級丁醇、山梨酸鉀、抗壞血酸、二氧化硫、沒食子酸丙酯、對羥基苯甲酸酯、乙基香蘭素、甘油、苯酚、對氯酚、明膠、白蛋白和它們的組合。藥學上可接受的賦形劑的徹底論述可獲自《雷明頓藥物科學》(REMINGTON'S PHARMACEUTICAL SCIENCES)(馬克出版公司,紐約,1991),藉由引用將其併入本文。
在本文的一實施方式中,遞送係經由腺病毒進行的,其可 以是含有至少1 x 105個腺病毒載體粒子(也稱為粒子單位,pu)的單次加強劑量。在本文的一實施方式中,該劑量較佳的是係該腺病毒載體的至少約1 x 106個粒子(例如,約1 x 106-1 x 1012個粒子),更較佳的是至少約1 x 107個粒子,更較佳的是至少約1 x 108個粒子(例如,約1 x 108-1 x 1011個粒子或約1 x 108-1 x 1012個粒子),並且最較佳的是至少約1 x 100個粒子(例如,約1 x 109-1 x 1010個粒子或約1 x 109-1 x 1012個粒子),或者甚至至少約1 x 1010個粒子(例如,約1 x 1010-1 x 1012個粒子)。可替代地,該劑量包含不多於約1 x 1014個粒子,較佳的是不多於約1 x 1013個粒子,甚至更較佳的是不多於約1 x 1012個粒子,甚至更較佳的是不多於約1 x 1011個粒子,並且最較佳的是不多於約1 x 1010個粒子(例如,不多於約1 x 109個粒子)。因此,該劑量可以含有單劑量的腺病毒載體,其具有例如,約1 x 106粒子單位(pu),約2 x 106pu、約4 x 106pu、約1 x 107pu、約2 x 107pu、約4 x 107pu、約1 x 108pu、約2 x 108pu、約4 x 108pu、約1 x 109pu、約2 x 109pu、約4 x 109pu、約1 x 1010pu、約2 x 1010pu、約4 x 1010pu、約1 x 1011pu、約2 x 1011pu、約4 x 1011pu、約1 x 1012pu、約2 x 1012pu、或約4 x 1012pu的腺病毒載體。參見例如,在2013年6月4日授權的授予納貝爾(Nabel)等人的美國專利案號8,454,972 B2中的腺病毒載體(藉由引用併入本文)以及在其第29欄第36-58行的劑型。在本文的一實施方式中,該腺病毒係經由多劑量遞送的。
在本文的一實施方式中,該遞送係經由AAV進行的。用於針對人類的AAV的體內遞送的治療有效劑量被認為處於含有從約1 x 1010到約1 x 1010個功能AAV/ml溶液的從約20到約50ml的鹽水溶液的範 圍內。該劑量可以調整以便使治療益處相對於任何副作用的平衡。在本文的一個實施方式中,AAV劑量大致處於從約1 x 105到1 x 1050個基因組AAV、從約1 x 108到1 x 1020個基因組AAV、從約1 x 1010到約1 x 1016個基因組、或約1 x 1011到約1 x 1016個基因組AAV的濃度範圍內。人類劑量可以是約1 x 1013個基因組AAV。這樣的濃度能以從約0.001ml到約100ml、約0.05到約50ml、或約10到約25ml的載體溶液進行遞送。藉由建立劑量反應曲線的常規試驗,熟習該項技術者可以容易地確立其他有效劑量。參見,例如,2013年3月26日授權的授予哈加(Hajjar)等人的美國專利案號8,404,658 B2,在第27欄第45-60行。
在本文的一實施方式中,該遞送係經由質粒進行的。在這樣的質粒組成物中,該劑量應當係足以引出反應的質粒的量。例如,在質粒組成物中的質粒DNA的適當量可以是從約0.1到約2mg,或從約1μg到約10μg/70kg個體。本發明的質粒一般將包括(i)啟動子;(ii)編碼CRISPR酶的序列,視情況連接到所述啟動子上;(iii)選擇標記;(iv)複製起點;和(v)(ii)的下游的並且可操作連接到其上的轉錄終止子。該質粒還可以編碼CRISPR複合物的RNA組分,但是該等中的一種或多種相反可以被編碼到不同載體上。
本文的劑量係基於平均70kg的個體。給藥頻率在醫學或獸醫學從業者(例如醫師、獸醫師)或本領域熟練的科學家的範圍之內。還應注意,在實驗中所使用的小鼠典型地是約20g,並且從小鼠實驗,一隻小鼠可以擴展到70kg個體。
在一些實施方式中,本發明的RNA分子在脂質體或陽離 子脂質體配製物等等中進行遞送並且可以藉由熟習該項技術者熟知的方法進行製備。這樣的方法例如在美國專利案號5,593,972、5,589,466和5,580,859中,將其藉由引用併入本文。已經開發了專門針對增強和改進遞送siRNA到哺乳動物細胞中的遞送系統(參見例如,沈(Shen)等人《歐洲生化學會聯合會快報》(FEBS Let.).2003,539:111-114;夏(Xia)等人,《自然生物技術》(Nat.Biotech.)2002,20:1006-1010;賴希(Reich)等人,《分子視界》(Mol.Vision.)2003,9:210-216;索倫森(Sorensen)等人,《分子生物學雜誌》(J.Mol.Biol.)2003,327:761-766;路易士(Lewis)等人,《自然遺傳學》(Nat.Gen.)2002,32:107-108以及西梅奧尼(Simeoni)等人,NAR 2003,31,11:2717-2724)並且可以將其應用於本發明。最近,siRNA已經成功用於抑制靈長類動物中的基因表現(參見例如,托倫蒂諾(Tolentino)等人,《視網膜》(Retina)24(4):660),它也可應用於本發明。
實際上,RNA遞送係有用的體內遞送方法。有可能使用脂質體或粒子或奈米粒子將Cas9和gRNA(以及例如,HR修復模板)遞送到細胞中。因此,CRISPR酶如Cas9的遞送和/或本發明的RNA的遞送可以處於RNA的形式並且經由微囊泡、脂質體或粒子或奈米粒子來進行。例如,Cas9 mRNA和gRNA可以被包裝到脂質體粒子中用於體內遞送。脂質體轉染試劑例如來自生命技術公司(Life Technologies)的lipofectamine以及市售的其他試劑可以有效地將RNA分子遞送到肝臟中。
還較佳的RNA遞送手段包括經由粒子或奈米粒子(卓(Cho)S.、金伯格(Goldberg)M.、松(Son)S.、許(Xu)Q.、楊(Yang) F.、梅(Mei)Y.、博加特廖夫(Bogatyrev)S.、朗格(Langer)R.和安德森(Anderson)D.,“用於將小干擾RNA遞送到內皮細胞的脂質樣奈米粒子”(Lipid-like nanoparticles for small interfering RNA delivery to endothelial cells),《先進功能材料》(Advanced Functional Materials),19:3112-3118,2010)或外排體(施羅德(Schroeder)A.、萊文斯(Levins)C.、科迪斯(Cortez)C.、朗格(Langer)R.、和安德森(Anderson)D.,“用於siRNA遞送的基於脂質的奈米治療劑”(Lipid-based nanotherapeutics for siRNA delivery),《內科學雜誌》(Journal of Internal Medicine),267:9-21,2010,PMID:20059641)遞送RNA。事實上,已經表明外排體在遞送siRNA中特別有用,其為與CRISPR系統有一些相似之處的系統。例如,艾爾.安達盧西(El-Andaloussi)S等人(“外排體介導的體外和體內siRNA遞送”(“Exosome-mediated delivery of siRNA in vitro and in vivo”).《自然-實驗手冊》(Nat Protoc.)2012年12月;7(12):2112-26.doi:10.1038/nprot.2012.131.電子版2012年11月15日描述了外排體對於跨不同的生物屏障的藥物遞送係有希望的工具並且可以用於體外和體內遞送siRNA。其途徑在於藉由轉染包含與肽配位基融合的外排體蛋白的表現載體產生靶向外排體。然後將該等外排體純化並且從轉染的細胞上清液中表徵,然後將RNA載入到外排體中。根據本發明的遞送或給藥可以用外排體進行,尤其是但不限於腦。維生素E(α-生育酚)可以與CRISPR Cas結合並且連同高密度脂蛋白(HDL)一起遞送到腦,例如以與烏諾(Uno)等人完成的用於將短干擾RNA(siRNA)遞送到腦的類似方式《人類基因治療》(HUMAN GENE THERAPY)22:711-719(2011年6月)。經由用磷酸鹽緩衝鹽水(PBS)或游離TocsiBACE或Toc-siBACE/HDL充滿的並 且與腦灌注套組3(Brain Infusion Kit 3)(Alzet公司)連接的微滲透壓泵(型號1007D;Alzet公司,庫比蒂諾(Cupertino),CA)灌注小鼠。將一根腦灌注導管置於在正中線的前囪的後方約0.5mm,用於灌注到背側第三腦室中。烏諾(Uno)等人發現,藉由相同的ICV灌注方法,少至3nmol的Toc-siRNA與HDL可誘導相當程度的靶減少。可以考慮結合至α-生育酚的並且與HDL共同給予靶向腦的相似劑量的CRISPR Cas用於本發明,例如,可以考慮靶向腦的約3nmol到約3μmol的CRISPR Cas。鄒(Zou)等人(《人類基因治療》(HUMAN GENE THERAPY 22:465-475(2011年4月))描述了靶向PKCγ的短髮夾RNA的慢病毒介導之遞送方法,其用於在大鼠脊髓中的體內基因沈默。鄒(Zou)等人藉由鞘內導管給予約10μl的具有1 x 109個轉導單位(TU)/ml的滴度的重組慢病毒。在本發明中可以考慮相似劑量的在靶向腦的慢病毒載體中表現的CRISPR Cas用於人類,例如,可以考慮靶向腦的在具有1 x 109個轉導單位(TU)/ml的滴度的慢病毒中的約10-50ml的CRISPR Cas。
就局部遞送至腦部而言,這可以以各種方法實現。例如,材料可以例如藉由注射遞送到紋狀體內。注射可以藉由穿顱術定向性進行。
提高NHEJ或HR效率也有助於遞送。較佳的是,NHEJ效率藉由共表現末端加工酶(co-expressing end-processing enzyme)如Trex2而增強(杜米特拉切(Dumitrache)等人《遺傳學》(Genetics).2011年8月;188(4):787-797)。較佳的是,HR效率藉由暫態抑制NHEJ機構如Ku70和Ku86而增加。HR效率也可以藉由共表現原核或真核同源重組酶如 RecBCD、RecA而增加。
包裝和啟動子
介導體內基因組修飾的、將本發明的Cas9編碼核酸分子(例如,DNA)包裝到載體(例如,病毒載體)中的方式包括:
●為了實現NHEJ介導的基因敲除:
●單病毒載體:
●含有兩個或更多個表現盒的載體:
●啟動子-Cas9編碼核酸分子-終止子
●啟動子-gRNA1-終止子
●啟動子-gRNA2-終止子
●啟動子-gRNA(N)-終止子(一直到載體的大小限制)
●雙病毒載體:
●含有一個用於驅動Cas9表現的表現盒的載體1
●啟動子-Cas9編碼核酸分子-終止子
●含有一個或多個用於驅動一個或多個指導RNA表現的表現盒的載體2
●啟動子-gRNA1-終止子
●啟動子-gRNA(N)-終止子(一直到載體的大小限制)
●為了介導同源定向修復。
●除了上述單和雙病毒載體途徑之外,另外的載體可以用來遞送同源定向修復模板。
用來驅動Cas9編碼核酸分子表現的啟動子可以包括:
─AAV ITR可以用作啟動子:這對於消除另外的啟動子元件(可在載體中佔用空間)的需要係有利的。空出來的另外的空間可以用來驅動另外的元件的表現(gRNA,等等)。同樣,ITR活性係較弱的,因此可以用來降低由於Cas9的過表現所致的潛在毒性。
─對於遍存表現,可以使用的啟動子包括:CMV、CAG、CBh、PGK、SV40、鐵蛋白重鏈或輕鏈等。
對於腦或其他CNS表現,可以使用啟動子:用於所有神經元的突觸蛋白I、用於興奮性神經元的CaMKIIα、用於GABA能神經元的GAD67或GAD65或VGAT,等等。對於肝臟表現,可以使用白蛋白啟動子。對於肺表現,可以使用SP-B。對於內皮細胞,可以使用ICAM。對於造血細胞,可以使用IFNβ或CD45。對於成骨細胞,人們可以使用OG-2。
用來驅動指導RNA的啟動子可以包括:
─Pol III啟動子,如U6或H1
─使用Pol II啟動子和內含子盒來表現gRNA
腺相關病毒(AAV)
Cas9或Cas9突變體或異種同源物以及一種或多種指導RNA可以使用腺相關病毒(AAV)、慢病毒、腺病毒或其他質粒或病毒載體類型進行遞送,尤其是,使用來自以下文獻的配方和劑量:例如,美 國專利案號8,454,972(針對腺病毒的配方、劑量)、8,404,658(針對AAV的配方、劑量)和5,846,946(針對DNA質粒的配方、劑量)以及來自臨床試驗和關於涉及慢病毒、AAV、和腺病毒的臨床試驗的出版物。例如,對於AAV,給藥途徑、配方和劑量可以如美國專利案號8,454,972並且如涉及AAV的臨床試驗。對於腺病毒,給藥途徑、配方和劑量可以如美國專利案號8,404,658並且如涉及腺病毒的臨床試驗。對於質粒遞送,給藥途徑、配方和劑量可以如美國專利案號5,846,946並且如涉及質粒的臨床試驗。劑量可以基於或推斷為平均70kg的個體(例如,男性成人),並且可以針對患者、受試者、不同重量和物種的哺乳動物進行調整。給藥頻率在醫學或獸醫學從業者(例如,醫師、獸醫師)的範圍之內,其取決於常規因素,包括患者或受試者的年齡、性別、一般健康狀況、其他狀況以及著手解決的特殊狀況或症狀。可以將病毒載體注射到感興趣的組織中。對於細胞類型特異性基因組修飾,Cas9的表現可以由細胞類型特異性啟動子驅動。例如,肝臟特異性表現可以使用白蛋白啟動子,而神經元特異性表現(例如,用於靶向CNS障礙)可以使用突觸蛋白I啟動子。
就體內遞送而言,AAV相比於其他病毒載體係有利的,這係由於兩個原因:
低毒性(這可以是由於純化方法不需要細胞粒子的超速離心所致,而超速離心可能活化免疫反應);
引起插入誘變的低概率,原因在於它未整合到宿主基因組中。
AAV具有4.5或4.75Kb的包裝限制。這意味著Cas9以及啟動子和轉錄終止子必須都配合在同一個病毒載體中。大於4.5或4.75Kb的 構建體將導致病毒產生的顯著降低。SpCas9係相當大的,其基因自身超過4.1Kb,使其難於包裝到AAV中。因此本發明的實施方式包括利用更短的Cas9同源物。例如:
Figure 112128864-A0101-12-0325-263
因此該等物種總體上是較佳的Cas9物種。
關於AAV,AAV可以是AAV1、AAV2、AAV5或任何其組合。可以相對於有待被靶向的細胞而選擇AAV;例如,可以選擇用於靶 向腦或神經元細胞的AAV血清型1、2、5或雜合衣殼AAV1、AAV2、AAV5或其任何組合;並且可以選擇用於靶向心臟組織的AAV4。AAV8可用於遞送到肝臟。本文的啟動子和載體係單獨較佳的。關於該等細胞的某些AAV血清型的表格(參見格林姆(Grimm),D.等人,《病毒學雜誌》(J.Virol.)82:5887-5911(2008))如下:
Figure 112128864-A0101-12-0326-264
慢病毒
慢病毒係複雜的反轉錄病毒,其具有在有絲分裂細胞和有絲分裂後細胞兩者中感染並表現其基因的能力。最為人熟知的慢病毒係 人類免疫缺陷病毒(HIV),其利其他病毒的包膜糖蛋白來靶向廣泛範圍的細胞類型。
慢病毒可以製備如下。在選殖pCasES10(含有慢病毒轉移質粒骨架)之後,將處於低傳代數(p=5)的HEK293FT接種在T-75燒瓶中,直到在轉染之前的一天在具有10%胎牛血清而沒有抗生素的DMEM中50%匯合。在20小時之後,培養基更換為OptiMEM(無血清)培養基,並且在4小時後進行轉染。細胞用10μg的慢病毒轉移質粒(pCasES10)和下列包裝質粒轉染:5μg的pMD2.G(VSV-g假型)、和7.5μg的psPAX2(gag/pol/rev/tat)。在具有陽離子脂質遞送劑(50μL的Lipofectamine 2000和100μl的Plus試劑)的4mL OptiMEM中進行轉染。在6小時之後,培養基更換為具有10%胎牛血清的無抗生素的DMEM。在細胞培養過程中,該等方法使用血清,但是無血清方法係較佳的。
慢病毒可以如下純化。在48小時後收穫病毒上清液。首先清除上清液的碎片並藉由0.45μm的低蛋白結合(PVDF)濾膜進行過濾。然後將它們在超速離心機中以24,000rpm旋轉2小時。將病毒沈澱重新懸浮在50μl的DMEM中在4C過夜。然後將它們等分,並且立即在-80℃冷凍。
在另一個實施方式中,還考慮了基於馬傳染性貧血病毒(EIAV)的最小非靈長類慢病毒載體,尤其是對於眼基因治療而言(參見例如,巴魯穀安(Balagaan),《基因醫學雜誌》(J Gene Med)2006;8:275-285)。在另一個實施方式中,還考慮了RetinoStat®,一經由視網膜下注射用於治療濕型的年齡相關性黃斑變性的、表現血管生成抑制蛋白(內皮抑素和血管抑素)的基於馬傳染性貧血病毒的慢病毒基因治療載 體(參見,例如,賓利(Binley)等人,《人類基因治療》(HUMAN GENE THERAPY)23:980-991(2012年9月)),並且這種載體可以經修飾用於本發明的CRISPR-Cas系統。
在另一個實施方式中,自滅活慢病毒載體可以用於和/或適合於本發明的CRISPR-Cas系統,該自滅活慢病毒載體具有靶向由HIV tat/rev共用的共有外顯子的siRNA、核仁定位TAR誘餌、和抗CCR5特異性錘頭狀核酶(參見,例如,迪吉斯托(DiGiusto)等人(2010)《科學轉化醫學》(Sci Transl Med)2:36ra43)。可以收集最少2.5×106個CD34+細胞/每千克患者體重,並且以2×106個細胞/ml的密度在X-VIVO 15培養基中(龍沙公司(Lonza))預刺激16到20個小時,該培養基含有2μmol/L-穀胺醯胺、幹細胞因子(100ng/ml)、Flt-3配位基(Flt-3L)(100ng/ml)、和促血小板生成素(10ng/ml)(CellGenix公司)。可以用慢病毒以感染複數5在75-cm2的包被有纖網蛋白(25mg/cm2)(重組人纖維蛋白片段(RetroNectin),寶生物工程株式會社(Takara Bio Inc.))的組織培養瓶中轉導預刺激的細胞16到24小時。
慢病毒載體還揭露於帕金森病的治療中,參見,例如,美國專利公開案號20120295960以及美國專利案號7303910和7351585。慢病毒載體還已經揭露於眼病的治療中,參見例如,美國專利公開案號20060281180、20090007284、US 20110117189;US 20090017543;US 20070054961、US 20100317109。慢病毒載體還已經揭露於遞送到腦中,參見例如,美國專利公開案號US 20110293571;US 20110293571、US 20040013648、US 20070025970、US 20090111106以及美國專利案號US 7259015。
RNA遞送
RNA遞送:該CRISPR酶,例如Cas9,和/或任何本發明的RNA,例如指導RNA,也可以按RNA的形式遞送。可以使用體外轉錄產生Cas9 mRNA。例如,可以使用含有下列元件的PCR盒來合成Cas9 mRNA:來自β珠蛋白-polyA尾(一串120個或更多的腺嘌呤)的T7_啟動子-科紮克(kozak)序列(GCCACC)-Cas9-3’UTR。該盒可以用於經由T7聚合酶的轉錄。也可以使用體外轉錄從含有T7_啟動子-GG-指導RNA序列的盒來轉錄指導RNA。
為了增強表現並且降低可能的毒性,可以,例如,使用假-U或5-甲基-C修飾該CRISPR酶-編碼序列和/或指導RNA,以包括一個或多個經修飾的核苷。
mRNA遞送方法用於當前的肝臟遞送係特別有希望的。
關於RNA遞送的很多臨床工作已經集中於RNAi或反義上,但是該等系統可以適用於遞送RNA用於實現本發明。應當相應地閱讀以下關於RNAi等的參考文獻。實際上,RNA遞送係有用的體內遞送方法。有可能使用脂質體或奈米粒子將Cas9和gRNA(以及例如,HR修復模板)遞送到細胞中。因此,CRISPR酶如Cas9的遞送和/或本發明的RNA的遞送可以處於RNA的形式並且經由微囊泡、脂質體或奈米粒子來進行。例如,Cas9 mRNA和gRNA可以被包裝到脂質體粒子中用於體內遞送。脂質體轉染試劑例如來自生命技術公司(Life Technologies)的lipofectamine以及市售的其他試劑可以有效地將RNA分子遞送到肝臟中。
RNA的粒子遞送
RNA的遞送手段還較佳的是包括經由奈米粒子的RNA遞送(卓(Cho)S.、金伯格(Goldberg)M.、松(Son)S.、許(Xu)Q.、楊(Yang)F.、梅(Mei)Y.、博加特廖夫(Bogatyrev)S.、朗格(Langer)R.和安德森(Anderson)D.,“用於將小干擾RNA遞送到內皮細胞的脂質樣奈米粒子”(Lipid-like nanoparticles for small interfering RNA delivery to endothelial cells),《先進功能材料》(Advanced Functional Materials),19:3112-3118,2010)或外排體(施羅德(Schroeder)A.、萊文斯(Levins)C.、科迪斯(Cortez)C.、朗格(Langer)R.、和安德森(Anderson)D.,“用於siRNA遞送的基於脂質的奈米治療劑”(Lipid-based nanotherapeutics for siRNA delivery),《內科學雜誌》(Journal of Internal Medicine),267:9-21,2010,PMID:20059641)。事實上,已經表明外排體在遞送siRNA中特別有用,其為與CRISPR系統有一些相似之處的系統。例如,艾爾.安達盧西(El-Andaloussi)S等人(“外排體介導的體外和體內siRNA遞送”(“Exosome-mediated delivery of siRNA in vitro and in vivo”).《自然-實驗手冊》(Nat Protoc.)2012年12月;7(12):2112-26.doi:10.1038/nprot.2012.131.電子版2012年11月15日描述了外排體對於跨不同的生物屏障的藥物遞送係有希望的工具並且可以用於體外和體內遞送siRNA。其途徑在於藉由轉染包含與肽配位基融合的外排體蛋白的表現載體產生靶向外排體。然後將該等外排體純化並且從轉染的細胞上清液中表徵,然後將RNA載入到外排體中。根據本發明的遞送或給藥可以用外排體進行,尤其是但不限於腦。維生素E(α-生育酚)可以與CRISPR Cas 結合並且連同高密度脂蛋白(HDL)一起遞送到腦,例如以與烏諾(Uno)等人完成的用於將短干擾RNA(siRNA)遞送到腦的類似方式《人類基因治療》(HUMAN GENE THERAPY)22:711-719(2011年6月)。經由用磷酸鹽緩衝鹽水(PBS)或游離TocsiBACE或Toc-siBACE/HDL充滿的並且與腦灌注套組3(Brain Infusion Kit 3)(Alzet公司)連接的微滲透壓泵(型號1007D;Alzet公司,庫比蒂諾(Cupertino),CA)灌注小鼠。將一根腦灌注導管置於在正中線的前囪的後方約0.5mm,用於灌注到背側第三腦室中。烏諾(Uno)等人發現,藉由相同的ICV灌注方法,少至3nmol的Toc-siRNA與HDL可誘導相當程度的靶減少。可以考慮結合至α-生育酚的並且與HDL共同給予靶向腦的相似劑量的CRISPR Cas用於本發明,例如,可以考慮靶向腦的約3nmol到約3μmol的CRISPR Cas。鄒(Zou)等人(《人類基因治療》(HUMAN GENE THERAPY 22:465-475(2011年4月))描述了靶向PKCγ的短髮夾RNA的慢病毒介導的遞送方法,其用於在大鼠脊髓中的體內基因沈默。鄒(Zou)等人藉由鞘內導管給予約10μl的具有1 x 109個轉導單位(TU)/ml的滴度的重組慢病毒。在本發明中可以考慮相似劑量的在靶向腦的慢病毒載體中表現的CRISPR Cas用於人類,例如,可以考慮靶向腦的在具有1 x 109個轉導單位(TU)/ml的滴度的慢病毒中的約10-50ml的CRISPR Cas。
就局部遞送至腦部而言,這可以以各種方法實現。例如,材料可以,例如,藉由注射遞送到紋狀體內。注射可以藉由穿顱術定向性進行。
提高NHEJ或HR效率也有助於遞送。較佳的是,NHEJ效 率藉由共表現末端加工酶(co-expressing end-processing enzyme)如Trex2而增強(杜米特拉切(Dumitrache)等人《遺傳學》(Genetics).2011年8月;188(4):787-797)。較佳的是,HR效率藉由暫態抑制NHEJ機構如Ku70和Ku86而增加。HR效率也可以藉由共表現原核或真核同源重組酶如RecBCD、RecA而增加。
質粒遞送
在本文的一實施方式中,該遞送係經由質粒進行的。在這樣的質粒組成物中,該劑量應當係足以引出反應的質粒的量。例如,在質粒組成物中的質粒DNA的適當量可以是從約0.1到約2mg,或從約1μg到約10μg/70kg個體。本發明的質粒一般將包括(i)啟動子;(ii)編碼CRISPR酶的序列,視情況連接到所述啟動子上;(iii)選擇標記;(iv)複製起點;和(v)(ii)的下游的並且可操作連接到其上的轉錄終止子。該質粒還可以編碼CRISPR複合物的RNA組分,但是該等中的一種或多種相反可以被編碼到不同載體上。
本文的劑量係基於平均70kg的個體。給藥頻率在醫學或獸醫學從業者(例如醫師、獸醫師)或本領域熟練的科學家的範圍之內。還應注意,在實驗中所使用的小鼠典型地是約20g,並且從小鼠實驗,一隻小鼠可以擴展到70kg個體。
在一些實施方式中,本發明的RNA分子在脂質體或陽離子脂質體配製物等等中進行遞送並且可以藉由熟習該項技術者熟知的方法進行製備。這樣的方法描述於例如美國專利案號5,593,972、5,589,466和5,580,859中,將其藉由引用併入本文。已經開發了專門針對增強和改 進遞送siRNA到哺乳動物細胞中的遞送系統(參見例如,沈(Shen)等人《歐洲生化學會聯合會快報》(FEBS Let.)2003,539:111-114;夏(Xia)等人,《自然生物技術》(Nat.Biotech.)2002,20:1006-1010;賴希(Reich)等人,《分子視界》(Mol.Vision.)2003,9:210-216;索倫森(Sorensen)等人,《分子生物學雜誌》(J.Mol.Biol.)2003,327:761-766;路易士(Lewis)等人,《自然遺傳學》(Nat.Gen.)2002,32:107-108以及西梅奧尼(Simeoni)等人,NAR 2003,31,11:2717-2724)並且可以將其應用於本發明。最近,siRNA已經成功用於抑制靈長類動物中的基因表現(參見例如,托倫蒂諾(Tolentino)等人,《視網膜》(Retina)24(4):660),它也可應用於本發明。
關於粒子遞送的一般資訊
此外,提及的是標題為“用於使用粒子遞送組分靶向障礙和疾病的CRISPR-CAS系統和組成物的遞送、用途和治療應用(DELIVERY,USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS FOR TARGETING DISORDERS AND DISEASES USING PARTICLE DELIVERY COMPONENTS)”PCT申請PCT/US 14/70057,案卷參考47627.99.2060和BI-2013/107(要求來自以下一個或多個或所有美國臨時專利申請的權益:提交於2014年9月24日的62/054,490;提交於2014年6月10日的62/010,441;以及各自提交於2013年12月12日的61/915,118、61/915,215和61/915,148)(“粒子遞送PCT”),將其藉由引用併入本文,關於製備含有sgRNA-和-Cas9蛋白的粒子之方法,該方法包括將包含sgRNA和Cas9 蛋白(和視情況HDR模板)的混合物與以下混合物混合,該混合物包含表面活性劑、磷脂、生物可降解聚合物、脂蛋白和醇或基本上由其組成或由其組成;以及來自這樣的過程的粒子。例如,其中使Cas9蛋白和sgRNA在適合的溫度(例如,15℃-30℃,例如,20℃-25℃,例如,室溫)下以適合的莫耳比(例如,3:1至1:3或2:1至1:2或1:1)有利地在無菌、無核酸酶緩衝液(例如,1X PBS)中一起混合適合的時間(例如,15-45,如30分鐘)。分開地,粒子組分如或包含:表面活性劑(例如,陽離子脂質(例如,1,2-二油醯基-3-三甲基銨-丙烷(DOTAP)));磷脂(例如,二肉豆蔻磷脂醯膽鹼(DMPC));生物可降解聚合物(如乙二醇聚合物或PEG)、以及脂蛋白,如低密度脂蛋白,例如,膽固醇溶解於醇中,有利地是C1-6烷基醇,如甲醇、乙醇、異丙醇,例如100%乙醇。將這兩種溶液混合在一起以形成含有Cas9-sgRNA複合物的粒子。因此,在粒子中配製整個複合物之前,可以使sgRNA與該Cas9蛋白預複合。可以製備具有不同莫耳比的不同已知組分的配製物,以促進將核酸遞送到細胞(例如1,2-二油醯基-3-三甲基銨-丙烷(DOTAP)、1,2-二十四醯基-sn-甘油-3-磷酸膽鹼(DMPC)、聚乙二醇(PEG)和膽固醇)。例如,DOTAP:DMPC:PEG:膽固醇莫耳比可以是DOTAP 100、DMPC 0、PEG 0、膽固醇0;或DOTAP 90、DMPC 0、PEG 10、膽固醇0;或DOTAP 90、DMPC 0、PEG 5、膽固醇5。DOTAP 100、DMPC 0、PEG 0、膽固醇0。因此,該申請包括將sgRNA、Cas9蛋白和形成粒子的組分混合;連同來自此類混合的粒子。本發明的方面可以涉及粒子;例如,使用類似於粒子遞送PCT的過程的粒子,例如藉由將如在本發明中的sgRNA和/或Cas9蛋白的混合物和形成粒子的組分混合,例如如在粒子遞送PCT中,以形成粒子;以及來自這 樣的混合的粒子(或者,當然,涉及如在本發明中的sgRNA和/或Cas9的其他粒子)。
粒子遞送系統和/或配製物
已知一些類型的粒子遞送系統和/或配製物在不同種類的生物醫學應用中是有用的。總體上,粒子被定義為小物體,該物體在其運輸和特性方面以整體單元表現。根據直徑將粒子進一步分類。粗粒子涵蓋在2,500與10,000奈米之間的範圍。細粒子的尺寸在100與2,500奈米之間。超細粒子、或奈米粒子的大小通常是在1和100奈米之間。100-nm極限的基礎係以下事實:使粒子區分於大塊材料的新穎特性典型地是在100nm之下的臨界長度規模下顯現的。
如在此所使用的,粒子遞送系統/配製物被定義為任何包括根據本發明的粒子的生物學遞送系統/配製物。根據本發明的粒子係任何具有小於100微米(μm)的最大尺寸(例如直徑)的實體。在一些實施方式中,本發明的粒子具有小於10μm的最大尺寸。在一些實施方式中,本發明的粒子具有小於2000奈米(nm)的最大尺寸。在一些實施方式中,本發明的粒子具有小於1000奈米(nm)的最大尺寸。在一些實施方式中,本發明的粒子具有小於900nm、800nm、700nm、600nm、500nm、400nm、300nm、200nm、或100nm的最大尺寸。典型地,本發明的粒子具有500nm或更小的最大尺寸(例如,直徑)。在一些實施方式中,本發明的粒子具有250nm或更小的最大尺寸(例如,直徑)。在一些實施方式中,本發明的粒子具有200nm或更小的最大尺寸(例如,直徑)。在一些實施方式中,本發明的粒子具有150nm或更小的最大尺寸(例如,直徑)。在 一些實施方式中,本發明的粒子具有100nm或更小的最大尺寸(例如,直徑)。在本發明的一些實施方式中使用更小的粒子(例如,具有50nm或更小的最大尺寸)。在一些實施方式中,本發明的粒子具有範圍在25nm與200nm之間的最大尺寸。
粒子表徵(包括,例如表徵形態、尺寸、等)係使用各種不同的技術進行的。通用技術係電子顯微術(TEM、SEM)、原子力顯微鏡(AFM)、動態光散射(DLS)、X-射線光電子光譜法(XPS)、粉末X射線衍射(XRD)、傅立葉轉換紅外光譜術(FTIR)、基質輔助雷射解吸/電離飛行時間質譜法(MALDI-TOF)、紫外-可見光譜法、雙偏振干涉法以及核磁共振(NMR)。表徵(尺寸測量)可以針對天然粒子(即預載入)或在載入負荷物(在此負荷物指代例如CRISPR-Cas系統的一種或多種組分,例如CRISPR酶或mRNA或指導RNA、或其任何組合,並且可以包括另外的載體和/或賦形劑)後進行,以提供具有最適大小的粒子以用於任何本發明的體外、離體和/或體內施用的遞送。在某些較佳的實施方式中,粒子尺寸(例如,直徑)表徵係基於使用動態雷射散射(DLS)的測量。可提及的是美國專利案號8,709,843;美國專利案號6,007,845;美國專利案號5,855,913;美國專利案號5,985,309;美國專利案號5,543,158;以及詹姆斯(James)E.達爾曼(Dahlman)和卡門 巴爾內斯(Carmen Barnes)等人在《自然奈米技術》(Nature Nanotechnology)(2014)的公開物,線上公開於2014年5月11日,doi:10.1038/nnano.2014.84,以上文獻涉及粒子、製造和使用它們的方法及其測量。
在本發明的範圍內的粒子遞送系統可以按任何形式提 供,包括但不限於固體、半固體、乳液、或膠體粒子。這樣可以將在此描述的任何遞送系統,包括但不限於例如基於脂質的系統、脂質體、膠束、微泡、外排體、或基因槍,提供為在本發明的範圍內的粒子遞送系統。
粒子
可以使用粒子或脂質包膜同時遞送CRISPR酶mRNA和指導RNA;例如,可以經由粒子遞送本發明的CRISPR酶和RNA(例如,作為複合物),如在達爾曼(Dahlman)等人,WO 2015089419 A2和其中引用的文獻中的,如7C1(參見例如,詹姆斯(James)E.達爾曼(Dahlman)和卡門 巴爾內斯(Carmen Barnes)等人《自然奈米技術》(Nature Nanotechnology)(2014)線上公開於2014年5月11日,doi:10.1038/nnano.2014.84),例如,包含脂質或類脂質和親水聚合物(例如陽離子脂質和親水聚合物)的遞送粒子,例如其中該陽離子脂質包括1,2-二油醯基-3-三甲基銨-丙烷(DOTAP)或1,2-二十四醯基-sn-甘油-3-磷酸膽鹼(DMPC)和/或其中該親水聚合物包括乙二醇或聚乙二醇(PEG);和/或其中該粒子進一步包含膽固醇(例如,來自以下項的粒子:配製物1=DOTAP 100、DMPC 0、PEG 0、膽固醇0;配製物編號2=DOTAP 90、DMPC 0、PEG 10、膽固醇0;配製物編號3=DOTAP 90、DMPC 0、PEG 5、膽固醇5),其中使用有效的多步方法形成粒子,其中第一步,將效應蛋白和RNA例如在無菌、不含核酸酶的1X PBS中例如在室溫下以例如1:1的莫耳比在一起混合例如30分鐘;並且分開地,將如適用於該配製物的DOTAP、DMPC、PEG、和膽固醇溶解於醇(例如,100%乙醇)中; 並且,將這兩種溶液混合在一起以形成含有該等複合物的粒子)。
例如,蘇(Su)X、弗裡克(Fricke)J、卡瓦納(Kavanagh)DG、歐文(Irvine)DJ(“使用脂質包封的pH響應性聚合物奈米粒子的體外和體內mRNA遞送”(“In vitro and in vivomRNA delivery using lipid-enveloped pH-responsive polymernanoparticles”)《分子藥理學》(Mol Pharm.)2011年6月6;8(3):774-87.doi:10.1021/mp100390w.2011年4月1日電子版)描述了生物可降解的核-殼結構粒子,其具有由磷脂雙層殼包封的聚(β-胺基酯)(PBAE)核。該等被開發為用於體內mRNA遞送。該pH響應性PBAE被選擇為促進內體破裂,而該脂質表面層被選擇為使聚陽離子核的毒性最小化。因此,該等對於遞送本發明的RNA係較佳的。
在一個實施方式中,考慮了基於自組裝生物粘附聚合物的粒子,其可應用於肽的經口遞送、肽的靜脈內遞送以及肽的鼻遞送,均遞送到腦。其他實施方式,還考慮了例如疏水性藥物的經口吸收和眼部遞送。分子包膜技術涉及被保護並遞送到疾病部位的工程化聚合物包膜(參見例如,馬薩(Mazza)M.等人,《ACS奈米》(ACSNano),2013.7(2):1016-1026;秀(Siew)A.等人,《分子藥理學》(Mol Pharm),2012.9(1):14-28;拉拉特薩(Lalatsa)A.等人,《控釋雜誌》(J Contr Rel),2012.161(2):523-36;拉拉特薩(Lalatsa)A.等人,《分子藥理學》(Mol Pharm),2012.9(6):1665-80;拉拉特薩(Lalatsa)A.等人,《分子藥理學》(Mol Pharm),2012.9(6):1764-74;加勒特(Garrett)N.L.等人,《生物光電雜誌》(J Biophotonics),2012.5(5-6):458-68;加勒特(Garrett)N.L.等人,《拉曼光譜雜誌》(J Raman Spect),2012.43(5):681-688; 阿哈默德(Ahmad)S.等人,《皇家學會介面雜誌》(J Royal Soc Interface)2010.7:S423-33;烏切克布(Uchegbu)I.F.《藥物遞送專家評論》(Expert Opin Drug Deliv),2006.3(5):629-40;曲(Qu)X.等人《生物大分子》(Biomacromolecules),2006.7(12):3452-9和烏切克布(Uchegbu)I.F.等人,《國際藥學雜誌》(Int J Pharm),2001.224:185-199)。考慮了約5mg/kg的劑量,呈單劑量或多劑量形式,這取決於靶組織。
在一個實施方式中,可以使用由丹.安德森實驗室(Dan Anderson’s lab)在MIT開發的可將RNA遞送到癌細胞以便使腫瘤生長停止的粒子/並且或使其適用於本發明的CRISPR Cas系統。具體地說,安德森實驗室開發了用於新生物材料和奈米製劑的合成、純化、表徵、和配製的全自動化組合系統。參見例如,阿拉比(Alabi)等人,《美國國家科學院院刊》(Proc Natl Acad Sci U S A.)2013年8月6日;110(32):12881-6;張(Zhang)等人,《先進材料》(Adv Mater.)2013年9月6日;25(33):4641-5;江(Jiang)等人,《奈米通訊》(Nano Lett.)2013年3月13日;13(3):1059-64;卡拉吉安尼斯(Karagiannis)等人,《ACS奈米》(ACS Nano.)2012年10月23日;6(10):8484-7;懷特海德(Whitehead)等人,《ACS奈米》(ACS Nano.)2012年8月28日;6(8):6922-9和李(Lee)等人,《自然奈米技術》(Nat Nanotechnol.)2012年6月3日;7(6):389-93。
美國專利申請20110293703涉及類脂質化合物,該等化合物在多核苷酸的給藥中也是特別有用的,其可適用於遞送本發明的CRISPR Cas系統。在一個方面,胺基醇類脂質化合物與有待遞送到細胞或受試者的藥劑結合而形成微粒子、奈米粒子、脂質體、或膠束。有待 藉由粒子、脂質體、或膠束遞送的藥劑可以處於氣體、液體、或固體的形式,並且該藥劑可以是多核苷酸、蛋白質、肽、或小分子。該等胺基醇類脂質化合物可以與其他胺基醇類脂質化合物、聚合物(合成的或天然的)、表面活性劑、膽固醇、碳水化合物、蛋白質、脂質、等等形成粒子。然後該等粒子可以視情況與藥用賦形劑結合而形成藥物組成物。
美國專利公開案號20110293703也提供了製備胺基醇類脂質化合物之方法。使胺的一種或多種等效物與環氧化物封端化合物的一種或多種等效物在適當條件下反應而形成本發明的胺基醇類脂質化合物。在某些實施方式中,胺的所有胺基基團與環氧化物封端化合物充分反應而形成三級胺。在其他實施方式中,胺的所有胺基基團未與環氧化物封端化合物完全反應形成三級胺,由此生成在胺基醇類脂質化合物中的一級胺或二級胺。該等一級胺或二級胺照原樣留下或者可以與另一種親電劑如不同的環氧化物封端化合物反應。正如熟習該項技術者將理解的,胺與未過量的環氧化物封端化合物反應將產生多種不同的具有不同數目的尾部的胺基醇類脂質化合物。某些胺類可以用兩個環氧化物衍生的化合物尾部將其完全功能化,而其他分子用環氧化物衍生的化合物尾部將不會被完全功能化。例如,二胺或多胺可包括離開該分子的不同胺基部分的一個、二個、三個、或四個環氧化物衍生的化合物尾部,從而產生一級胺、二級胺、和三級胺。在某些實施方式中,並不是所有胺基基團都被完全功能化。在某些實施方式中,使用相同類型的環氧化物封端化合物中的兩種。在其他實施方式中,使用兩種或更多種不同的環氧化物封端化合物。胺基醇類脂質化合物的合成係用或不用溶劑進行的, 並且該合成可以在範圍從30℃-100℃,較佳的是在大致50℃-90℃的較高溫度下進行。視情況,可以將製備的胺基醇類脂質化合物純化。例如,可以純化胺基醇類脂質化合物的混合物而產生具有特定數目的、環氧化物衍生的化合物尾部的胺基醇類脂質化合物。或者,該混合物可以被純化而產生特定的立體異構物或區域異構物。也可以使用烷基鹵化物(例如,碘甲烷)或其他烷化劑將該等胺基醇類脂質化合物烷化,和/或它們可以被醯化。
美國專利公開案號20110293703還提供了藉由發明方法製備的胺基醇類脂質化合物的文庫。使用涉及液體處理器、機器人、微量滴定板、電腦等的高通量技術,可以製備和/或篩選該等胺基醇類脂質化合物。在某些實施方式中,篩選了該等胺基醇類脂質化合物的將多核苷酸或其他藥劑(例如,蛋白質、肽、小分子)轉染到細胞中的能力。
美國專利公開案號20130302401涉及已經使用組合聚合製備的一類聚(β-胺基醇)(PBAAs)。該等發明的PBAA可以在生物技術和生物醫學應用中用作塗層(如用於醫療裝置或植入物的薄膜或多層薄膜的塗層)、添加劑、材料、賦形劑、生物防污劑(non-biofouling agent)、微圖像化劑(micropatterning agent)、以及細胞封裝劑(cellular encapsulation agent)。當用作表面塗層時,該等PBAA在體外和體內均引出不同水平的炎症,這取決於它們的化學結構。這類材料的巨大化學多樣性允許我們鑒定出體外抑制巨噬細胞活化的聚合物塗層。此外,在羧化聚苯乙烯微粒的皮下移植之後,該等塗層減少了炎症細胞的募集,並且減輕了纖維化。該等聚合物可以用來形成用於細胞封裝的聚電解質複 合物膠囊。本發明還可具有許多其他的生物應用,如抗微生物塗層、DNA或siRNA遞送、以及幹細胞組織工程。美國專利公開案號20130302401的傳授內容可以適用於本發明的CRISPR Cas系統。在一些實施方式中,可以使用基於糖的粒子,例如GalNAc,如本文所描述的,並且參考WO 2014118272(藉由引用併入本文)和耐爾(Nair),JK等人,2014,《美國化學會志》(Journal of the American Chemical Society)136(49),16958-16961以及本文的傳授,尤其是就應用於所有粒子的遞送而言,除非另外係顯而易見的。
在另一個實施方式中,考慮了脂質粒子(LNP)。抗轉甲狀腺素蛋白小干擾RNA已經被封裝在脂質粒子中並且被遞送到人體內(參見,例如,科爾賀(Coelho)等人,《新英格蘭醫學雜誌》(N Engl J Med)2013;369:819-29),並且這樣一種系統可以適用於並且應用於本發明的CRISPR Cas系統。考慮到靜脈內給予約0.01到約1mg/kg體重的劑量。考慮了降低輸注相關反應的風險的用藥,如考慮到地塞米松、對乙醯胺基酚(acetampinophen)、苯海拉明或西替利
Figure 112128864-A0101-12-0342-7
(cetirizine)、以及雷尼替丁(ranitidine)。考慮了約0.3mg/千克的多劑量,每4週一次,五個劑量。
LNP已經顯示在將siRNA遞送到肝臟中是高度有效的(參見,例如,塔韋內羅(Tabernero)等人,《癌症發現》(Cancer Discovery),2013年4月,第3卷,第4期,第363-470頁),並且因此被考慮用於遞送編碼CRISPR Cas的RNA到肝臟。考慮了6mg/kg的LNP的約四個劑量的用量,每兩週一次。塔韋內羅(Tabernero)等人證明,在以0.7mg/kg給予 LNP的前2個週期之後,觀察到腫瘤消退,並且在6個週期結束之後,患者已經實現了部分應答,具有淋巴結轉移完全消退以及肝臟腫瘤的顯著萎縮。在此患者中給予40個劑量之後獲得完全應答,在接受經過26個月的劑量之後其保持緩解和完全治療。具有RCC和在用VEGF途徑抑制劑進行的在先治療之後進展的包括腎臟、肺、以及淋巴結在內的肝外部位疾病的兩位患者在所有部位的疾病都保持穩定大約8到12個月,並且一具有PNET和肝轉移的患者繼續在18個月(36個劑量)的延伸研究中保持疾病穩定。
然而,必須將LNP的電荷考慮在內。當陽離子脂質與帶負電的脂質結合時,誘導促進細胞內遞送的非雙層結構。由於帶電荷的LNP在靜脈注射之後迅速從循環中清除,開發了具有低於7的pKa值的可電離陽離子脂質(參見,例如,羅辛(Rosin)等人,《分子治療》(Molecular Therapy),第19卷,第12期,第1286-2200頁,2011年12月)。帶負電荷的聚合物如RNA可以低pH值(例如,pH 4)載入到LNP中,在此pH時可電離脂質展示出正電荷。然而,在生理學pH值時,LNP展現出與更長的循環時間相容的低表面電荷。已經關注了四種可電離陽離子脂質,即1,2-二亞油醯基-3-二甲基銨-丙烷(DLinDAP)、1,2-二亞油基氧基-3-N,N-二甲基胺基丙烷(DLinDMA)、1,2-二亞油基氧基-酮基-N,N-二甲基-3-胺基丙烷(DLinKDMA)、以及1,2-二亞油基-4-(2-二甲基胺基乙基)-[1,3]-二氧戊環(DLinKC2-DMA)。已經表明,含有該等脂質的LNP siRNA系統在體內肝細胞中展現出顯著不同的基因沈默特性,具有根據採用因子VII基因沈默模型的DLinKC2-DMA>DLinKDMA>DLinDMA>>DLinDAP系 列而變化的潛能(參見,例如,羅辛(Rosin)等人,《分子治療》(Molecular Therapy),第19卷,第12期,第1286-2200頁,2011年12月)。可以考慮LNP或者在LNP中的或與LNP相關的CRISPR-Cas RNA的1μg/ml的劑量,尤其是對於含有DLinKC2-DMA的配製物而言。
LNP的製備和CRISPR Cas封裝可以使用/和或改編自羅辛(Rosin)等人的《分子治療》(Molecular Therapy),第19卷,第12期,第1286-2200頁,2011年12月)。陽離子脂質1,2-二亞油醯基-3-二甲基銨-丙烷(DLinDAP)、1,2-二亞油基氧基-3-N,N-二甲基胺基丙烷(DLinDMA)、1,2-二亞油基氧基酮基-N,N-二甲基-3-胺基丙烷(DLinK-DMA)、1,2-二亞油基-4-(2-二甲基胺基乙基)-[1,3]-二氧戊環(DLinKC2-DMA)、(3-o-[2"-(甲氧基聚乙二醇2000)琥珀醯]-1,2-二肉豆蔻醯基-sn-二醇(PEG-S-DMG)、以及R-3-[(ω-甲氧基-聚(乙二醇)2000)胺甲醯]-1,2-二肉豆蔻醯氧基丙基-3-胺(PEG-C-DOMG)可以由Tekmira製藥公司(Tekmira Pharmaceuticals)(溫哥華,加拿大)提供或者合成。膽固醇可以購自西格瑪公司(聖路易斯,密蘇里州)。特異性CRISPR Cas RNA可以封裝在含有DLinDAP、DLinDMA、DLinK-DMA、和DLinKC2-DMA的LNP中(陽離子脂質:DSPC:CHOL:PEGS-DMG或PEG-C-DOMG的莫耳比為40:10:40:10)。在需要時,可以結合0.2% SP-DiOC18(英傑公司,伯靈頓,加拿大)來評估細胞攝取、細胞內遞送、和生物分佈。藉由將由陽離子脂質:DSPC:膽固醇:PEG-c-DOMG(40:10:40:10莫耳比)組成的混合物溶解在乙醇中直到最終脂質濃度為10mmol/l來進行封裝。可以將脂質的這種乙醇溶液逐滴加入到pH 4.0的50mmol/l檸檬酸 鹽中而形成多層囊泡,從而產生30%(vol/vol)乙醇的最終濃度。在使用擠出機(北方脂質公司(Northern Lipids),溫哥華,加拿大)藉由兩個重疊的80nm Nuclepore聚碳酸酯濾膜擠出多層囊泡之後,可以形成大的單層囊泡。可以藉由如下步驟實現封裝:將溶解在含有30%乙醇(vol/vol)的pH 4.0的50mmol/l檸檬酸鹽中的2mg/ml的RNA逐滴加入到擠出的形成的大單層囊泡中,並且在31℃培養30分鐘,伴隨持續混合直到最終的RNA/脂質重量比為0.06/1(wt/wt)。藉由使用Spectra/Por 2再生纖維素透析膜在pH為7.4的磷酸鹽緩衝鹽水中透析16小時進行乙醇的去除以及配製緩衝液的中和。使用NICOMP 370型粒徑分析儀、囊泡/強度模式、以及高斯擬合,藉由動態光散射,可以測定粒度分佈(Nicomp粒徑分析儀公司(Nicomp Particle Sizing),聖巴巴拉市,加利福尼亞州)。對於所有三個LNP系統的粒徑可以是約70nm的直徑。可以藉由使用VivaPureD MiniH柱(賽多利斯斯泰迪生物技術公司(Sartorius Stedim Biotech))從分析前後收集的樣品中去除游離RNA來確定RNA封裝效率。從洗脫的粒子提取封裝的RNA並且將其在260nm定量。藉由使用來自美國瓦克化學公司(Wako Chemicals USA)(里士滿(Richmond),維吉尼亞州)的膽固醇E酶法測定法測量囊泡中的膽固醇含量,確定了RNA與脂質的比率。與本文關於LNP和PEG脂質的討論結合,聚乙二醇化的脂質體或LNP同樣適於遞送CRISPR-Cas系統或其組分。
大LNP的製備可以使用/和或改編自羅辛(Rosin)等人的《分子治療》(Molecular Therapy),第19卷,第12期,第1286-2200頁,2011年12月。可以在含有50:10:38.5的莫耳比的DLinKC2-DMA、 DSPC、和膽固醇的乙醇中製備脂質預混物溶液(20.4mg/ml總脂質濃度)。可以按照0.75:1的莫耳比(乙酸鈉:DLinKC2-DMA)將乙酸鈉添加到脂質預混物中。隨後可以藉由將該混合物與1.85倍體積的檸檬酸鹽緩衝液(10mmol/l,pH 3.0)在劇烈攪拌下合併而使脂質水合,從而導致在含有35%的在水性緩衝液中的自發脂質體形成。可以在37℃培養該脂質體溶液以允許粒徑的時間依賴性增加。可以藉由動態光散射(奈米粒徑電位分析儀(Zetasizer Nano ZS),瑪律文儀器公司(Malvern Instruments),烏斯特郡(Worcestershire),英國)在培養的不同時間去除等分試樣以研究脂質體大小的變化。一旦實現所希望的粒徑,可以將水性PEG脂質溶液(儲備溶液=在35%(vol/vol)乙醇中的10mg/ml PEG-DMG)添加到該脂質體混合物中,以便產生3.5%總脂質的最終PEG莫耳濃度。在添加PEG-脂質之後,該等脂質體應該其大小,有效抑制進一步生長。然後以大約1:10(wt:wt)的RNA與總脂質比率將RNA添加到空脂質體,然後在37℃培養30分鐘以形成載入的LNP。隨後將該混合物在PBS中透析過夜,並且用0.45-μm的注射器過濾器。
球形核酸(SNATM)構建體和其他粒子(尤其是金粒子)也被考慮為將CRISPR-Cas系統遞送到預期靶標的手段。重要數據表明,基於核酸功能化的金粒子的AuraSense治療性球形核酸(SNATM)構建體係有用的。
可以與本文的傳授結合使用的文獻包括:卡特勒(Cutler)人,《美國化學會志》(J.Am.Chem.Soc.)2011 133:9254-9257,郝(Hao)等人,Small.2011 7:3158-3162,張(Zhang)等人,《ACS奈米》(ACS Nano.) 2011 5:6962-6970,卡特勒(Cutler)等人,《美國化學會志》(J.Am.Chem.Soc.)2012 134:1376-1391,楊(Young)等人,《奈米通訊》(Nano Lett.)2012 12:3867-71,鄭(Zheng)等人,《美國國家科學院院刊》(Proc.Natl.Acad.Sci.USA.)2012 109:11975-80,米爾金(Mirkin),《奈米醫學》(Nanomedicine)2012 7:635-638張(Zhang)等人,《美國化學會志》(J.Am.Chem.Soc.)2012 134:16488-1691,因特勞布(Weintraub),《自然》(Nature)2013 495:S14-S16,崔(Choi)等人,《美國國家科學院院刊》(Proc.Natl.Acad.Sci.USA.)2013 110(19):7625-7630,詹森(Jensen)等人,《科學轉化醫學》(Sci.Transl.Med.)5,209ra152(2013)以及米爾金(Mirkin)等人,Small,10:186-192。
具有RNA的自組裝粒子可以用被聚乙二醇化的聚乙烯亞胺(PEI)進行構建,其中Arg-Gly-Asp(RGD)肽配位基附接在聚乙二醇(PEG)的遠端。例如,這一系統已經被用作靶向表現整合素的腫瘤新血管系統和遞送抑制血管內皮生長因子受體2(VEGF R2)表現以及由此實現抑制腫瘤血管發生的siRNA的手段(參見,例如,施弗勒斯(Schiffelers)等人,《核酸研究》(Nucleic Acids Research),2004,第32卷,第19期)。藉由將等體積的陽離子聚合物水溶液和核酸水溶液混合從而產生在2到6範圍上的可電離氮(聚合物)相比磷酸鹽(核酸)的淨莫耳過量,從而製備奈米束。在陽離子聚合物與核酸之間的靜電相互作用導致聚複合物的形成,其具有約100nm的平均粒徑分佈,此後稱為奈米束。設想了CRISPR Cas的約100到200mg的劑量,用於施弗勒斯(Schiffelers)等人的自組裝粒子中的遞送。
巴特利特(Bartlett)等人的奈米束(PNAS,2007年9月25日,第104卷,第39期)也可以應用於本發明。藉由將等體積的陽離子聚合物水溶液和核酸水溶液混合從而產生在2到6範圍上的可電離氮(聚合物)相比磷酸鹽(核酸)的淨莫耳過量,從而製備巴特利特(Bartlett)等人的奈米束。在陽離子聚合物與核酸之間的靜電相互作用導致聚複合物的形成,其具有約100nm的平均粒徑分佈,此後稱為奈米束。巴特利特(Bartlett)等人的DOTA-siRNA合成如下:1,4,7,10-四氮雜環十二烷-1,4,7,10-四乙酸單(N-羥基琥珀醯亞胺酯)(DOTA-NHSester)訂購自Macrocyclics公司(達拉斯(Dallas),德克薩斯州)。將碳酸鹽緩衝液(pH 9)中的具有100倍莫耳過量的DOTA-NHS-酯的胺修飾的RNA有義股加入到微量離心管中。藉由在室溫攪拌4小時使該等內容物反應。將該DOTA-RNA有義綴合物用乙醇沈澱,重新懸浮在水中,並且退火到未修飾的反義股上而產生DOTA-siRNA。所有液體用Chelex-100(Bio-Rad,赫庫斯(Hercules),加利福尼亞州)預處理,以便去除微量金屬污染物。藉由使用含有環糊精的聚陽離子可以形成Tf靶向和非靶向的siRNA粒子。典型地,粒子以3(+/-)的進料比和0.5g/升的siRNA濃度在水中形成。用Tf(金剛烷-PEG-Tf)修飾在靶向粒子表面上的百分之一的金剛烷-PEG分子。將粒子懸浮在用於注射的5%(wt/vol)的葡萄糖載體溶液中。
大衛斯(Davis)等人(《自然》,第464卷,2010年4月15日)使用靶向的粒子遞送系統進行了RNA臨床試驗(臨床試驗登記號NCT00689065)。在21天週期的第1、3、8和10天藉由30分鐘的靜脈輸注對患有標準護理治療難治的實性癌的患者給予靶向粒子劑量。該等粒子 由合成遞送系統組成,該系統含有:(1)線性的、基於環糊精的聚合物(CDP),(2)展示在粒子的外部上的用於接合癌細胞表面上的TF受體(TFR)的人轉鐵蛋白(TF)靶向配位基,(3)親水聚合物(用來促進在生物流體中的粒子穩定性的聚乙二醇(PEG)),以及(4)被設計為降低RRM2(在臨床中使用的序列,先前表示為siR2B+5)表現的siRNA。TFR已經久為所知在惡性細胞中被下調,並且RRM2係確立的抗癌靶標。已經顯示該等粒子(臨床版本表示為CALAA-01)在非人類靈長動物中的多劑量研究中良好耐受。雖然已經藉由脂質體遞送向患有慢性粒細胞白血病的單一患者給予了siRNA,但是大衛斯等人的臨床試驗係初期人類試驗,該試驗用一個靶向的遞送系統全身性地遞送siRNA並且治療患有實性癌的患者。為了確定該靶向的遞送系統是否能夠將功能性siRNA有效遞送到人類腫瘤,大衛斯(Davis)等人研究了來自三個不同的劑量組群的三位患者的活組織檢查;患者A、B和C均患有轉移性黑素瘤並且分別接受了18、24和30mg m-2 siRNA的CALAA-01劑量。還可以針對本發明的CRISPR Cas系統考慮相似的劑量。用含有線性的基於環糊精的聚合物(CDP)、展示在粒子的外部上的用於接合癌細胞表面上的TF受體(TFR)的人轉鐵蛋白(TF)靶向配位基和/或親水聚合物(例如,用來促進在生物流體中的粒子穩定性的聚乙二醇(PEG))的粒子,可以實現本發明的遞送。
就本發明而言,較佳的是使用粒子或脂質包膜遞送CRISPR複合物的一種或多種組分例如CRISPR酶或mRNA或指導RNA。其他遞送系統或載體可以結合本發明的粒子方面使用。
通常,“奈米粒子”係指任何具有小於1000nm的直徑的粒子。在某些較佳的實施方式中,本發明的奈米粒子具有500nm或更小的最大尺寸(例如,直徑)。在其他較佳的實施方式中,本發明的奈米粒子具有範圍在25nm與200nm之間的最大尺寸。在其他較佳的實施方式中,本發明的奈米粒子具有100nm或更小的最大尺寸。在其他較佳的實施方式中,本發明的奈米粒子具有範圍在35nm與60nm之間的最大尺寸。
包含於本發明中的粒子可以提供為不同形式,例如提供為固體粒子(例如,金屬如銀、金、鐵、鈦,非金屬,基於脂質的固體,聚合物)、粒子懸浮液、或其組合。可以製備金屬粒子、介電粒子和半導體粒子連同混合結構(例如,核-殼粒子)。由半導體材料製成的粒子也可以經量子點標記,如果它們足夠小(典型地低於10nm)使得電子能級的量子化發生的話。此類奈米級粒子作為藥物載體或成像劑用於生物醫學應用中,並且可以被適配為用於本發明中的相似目的。
半-固體和軟粒子已經製造出,並且是在本發明的範圍內。具有半-固體性質的原型粒子係脂質體。各種類型的脂質體粒子目前在臨床上用作用於抗癌藥物和疫苗的遞送系統。一半親水並且另一半疏水的粒子稱為傑那斯(Janus)粒子,並且對於穩定乳液係特別有效的。它們可以在水/油介面處自組裝,並且充當固體表面活性劑。
美國專利案號8,709,843(藉由引用結合在此)提供了用於將包含治療劑的粒子靶向遞送至組織、細胞和細胞內隔室的藥物遞送系統。本發明提供了包含聚合物的靶向粒子,該聚合物綴合至表面活性劑、親水聚合物或脂類。藉由引用結合在此的美國專利案號6,007,845提供了 以下粒子,該等粒子具有多嵌段共聚物的核,該多嵌段共聚物係藉由將多官能化合物與一種或多種疏水聚合物和一種或多種親水聚合物共價連接而形成的,並且該等粒子包含生物活性材料。藉由引用併入本文的美國專利案號5,855,913提供了具有空氣動力學上輕的粒子的微粒組成物,該等空氣動力學上輕的粒子具有小於0.4g/cm3的振實密度,其平均直徑在5μm與30μm之間,將表面活性劑結合在其表面以用於將藥物遞送至肺部系統。藉由引用併入本文的美國專利案號5,985,309提供了以下粒子,該等粒子結合表面活性劑和/或帶正電或負電的治療劑或診斷劑和相反電荷帶電分子的親水或疏水複合物,以用於遞送至肺部系統。藉由引用併入本文的美國專利案號5,543,158提供了生物可降解的可注射粒子,該等可注射粒子具有生物可降解的固體核,該固體核在表面上包含生物活性材料和聚(亞烷基二醇)部分。藉由引用結合在此的WO 2012135025(也公開為US 20120251560)描述了綴合的聚乙烯亞胺(PEI)聚合物和綴合的氮雜-大環化合物(統稱為“綴合的微脂體(lipomer)”或“微脂體”)。在某些實施方式中,可設想此類綴合的微脂體可以在CRISPR-Cas系統的背景下使用,以實現體外、離體和體內基因組干擾以修飾基因表現,包括調節蛋白表現。
在一個實施方式中,該粒子可以是環氧化物-修飾的脂質-聚合物,有利地為7C1(參見例如,詹姆斯(James)E.達爾曼(Dahlman)和卡門 巴爾內斯(Carmen Barnes)等人在《自然奈米技術》(Nature Nanotechnology)(2014)的公開物,線上公開於2014年5月11日,doi:10.1038/nnano.2014.84)。C71係藉由使C15環氧化物終止的脂質與 PEI600以14:1莫耳比進行反應來合成,並且與C14PEG2000配製以產生在PBS溶液中穩定持續至少40天的粒子(直徑在35與60nm之間)。
可以利用環氧化物-修飾的脂質-聚合物將本發明的CRISPR-Cas系統遞送至肺部細胞、心血管細胞或腎細胞,然而熟習該項技術者可以調適該系統以遞送到其他靶器官。設想了從約0.05至約0.6mg/kg的劑量範圍。還設想了經數天或數周的劑量,其中總劑量為約2mg/kg。
外排體
外排體係轉運RNA和蛋白質的並且可以向腦和其他靶器官中遞送RNA的內源奈米囊泡。為了降低免疫原性,阿爾瓦雷斯-爾維蒂(Alvarez-Erviti)等人(2011,《自然生物技術》29:341)使用了用於外排體產生的自我衍生的樹突細胞。藉由將樹突細胞工程化為表現Lamp2b(外泌體膜蛋白,融合到神經元特異性RVG肽上)而實現了靶向腦。藉由電穿孔使純化的外排體載入外源RNA。靜脈注射的RVG靶向的外排體特異性地將GAPDH siRNA遞送到腦中的神經元、小膠質細胞、少突神經膠質細胞,導致特異性的基因敲除。預暴露於RVG外排體未減弱敲低,並且在其他組織中未觀察到非特異性攝取。藉由BACE1的強的mRNA(60%)和蛋白質(62%)敲低證明了外排體介導的siRNA遞送的治療潛能,BACE1係阿茲海默症中的治療靶標。
為了獲得免疫惰性的外排體池,阿爾瓦雷斯-爾維蒂(Alvarez-Erviti)等人收穫了來自具有同源主要組織相容性複合體(MHC)單體型的近交C57BL/6小鼠的骨髓。由於未成熟樹突細胞產生 大量的缺乏T細胞活化劑如MHC-II和CD86的外排體,阿爾瓦雷斯-爾維蒂(Alvarez-Erviti)等人選擇具有粒細胞/巨噬細胞集落刺激因子(GM-CSF)的樹突細胞持續7天。次日,使用良好建立的超速離心方案從培養上清中純化外排體。該等產生的外排體在物理上是同質的,具有直徑為80nm的粒徑分佈峰,正如藉由粒子跟蹤分析(NTA)和電子顯微鏡檢查所測定。阿爾瓦雷斯-爾維蒂(Alvarez-Erviti)等人獲得了6-12μg的外排體(基於蛋白質濃度測量的)/每106個細胞。
其次,阿爾瓦雷斯-爾維蒂(Alvarez-Erviti)等人研究了使用適用於奈米級應用的穿孔方案給修飾的外排體載入外源負荷的可能性。由於電穿孔對於奈米級的膜粒子尚未良好表徵,使用非特異性Cy5標記的RNA用於電穿孔方案的經驗優化。在外排體超速離心和溶解之後測定了封裝的RNA的量。在400V和125μF的電穿孔導致RNA的最好保留並且用於所有的後續實驗。
阿爾瓦雷斯-爾維蒂(Alvarez-Erviti)向正常C57BL/6小鼠給予被包封在150μg的RVG外排體中的150μg的每種BACE1 siRNA並且將敲低效率與四個對照進行比較:未處理的小鼠、僅僅用RVG外排體注射的小鼠,用與體內陽離子脂質體試劑錯合的BACE1 siRNA注射的小鼠、以及用與RVG-9R錯合的BACE1 siRNA注射的小鼠,該RVG肽與靜電結合到siRNA上的9個D-精胺酸綴合。在給藥之後3天,分析皮層組織樣品,並且在siRNA-RVG-9R處理的和siRNARVG外排體處理的小鼠中均觀察到顯著的蛋白質敲低(45%,P<0.05,相對於62%,P<0.01),這係由於顯著的BACE1 mRNA水平降低(分別為66%[+或-]15%,P<0.001以及 61%[+或-]13%,P<0.01)。而且,申請人證明了在RVG-外排體處理的動物中在總[β]-澱粉樣蛋白1-42水平上的顯著降低(55%,P<0.05),其中β澱粉樣蛋白為一種在阿茲海默症理學中的澱粉樣斑塊的主要成分。所觀察到的降低大於在心室內注射BACE1抑制劑之後的正常小鼠中證明的β澱粉樣蛋白1-40降低。阿爾瓦雷斯-爾維蒂(Alvarez-Erviti)在BACE1切割產物上進行了5'-cDNA末端快速擴增(RACE),其提供了經由siRNA的RNAi介導的敲低的證據。
最後,阿爾瓦雷斯-爾維蒂(Alvarez-Erviti)等人藉由評定IL-6、IP-10、TNFα和IFN-α血清濃度研究了RNA-RVG外排體是否誘導了體內免疫反應。在外排體處理之後,類似於與有力地刺激IL-6分泌的siRNA-RVG-9R相反的siRNA轉染試劑處理,登記了在所有細胞因子上的非顯著性變化,證實了該外排體處理的免疫惰性屬性。假定外排體僅僅封裝20%的siRNA,用RVG-外排體遞送比RVG-9R遞送顯得更有效,因為用少五倍的siRNA實現了相當的mRNA敲低和更好的蛋白質敲低,而沒有相應水平的免疫刺激。這個實驗證明了RVG-外排體技術的治療潛力,其潛在地適合於與神經退行性疾病相關的基因的長期沈默。阿爾瓦雷斯-爾維蒂(Alvarez-Erviti)等人的外排體遞送系統可以用於將本發明的CRISPR-Cas系統遞送至治療靶標,尤其是神經退行性疾病。對於本發明可以考慮封裝在約100到1000mg的RVG外排體中的約100到1000mg的CRISPR Cas的劑量。
艾爾.安達盧西(El-Andaloussi)等人(《自然-實驗手冊》(Nature Protocols)7,2112-2126(2012))揭露了可以如何利用來源於培 養的細胞的外排體用於體外和體內遞送RNA。這個方案首先描述了藉由轉染包含與肽配位基融合的外排體蛋白的表現載體的靶向外排體的產生。其次,艾爾.安達盧西(El-Andaloussi)等人解釋了如何純化和表徵來自轉染的細胞上清液的外排體。接著,艾爾.安達盧西(El-Andaloussi)等人詳述了將RNA載入到外排體中的關鍵步驟。最後,艾爾.安達盧西(El-Andaloussi)等人概述了如何使用外排體有效體外遞送RNA以及體內遞送到小鼠腦中。還提供了預期結果的實例,其中外排體介導的RNA遞送藉由功能分析和成像而評估。整個方案進行約3周。根據本發明的遞送或給藥可以使用從自我衍生的樹突細胞產生的外排體來進行。根據本文的教導,這可以在本發明的實踐中採用。
在另一個實施方式中,考慮了瓦爾葛籣(Wahlgren)等人的血漿外排體(《核酸研究》(Nucleic Acids Research),2012年,第40卷,第17期,e130)。外排體係由包括樹突細胞(DC)、B細胞、T細胞、肥大細胞、上皮細胞和腫瘤細胞在內的許多細胞類型產生的奈米囊泡(30-90nm大小)。該等囊泡藉由晚期核內體的向內出芽而形成,並且然後在與質膜融合後釋放到細胞外環境中。由於外排體天然地在細胞之間運送RNA,這種特性在基因治療中可以是有用的,並且根據本揭露可以用於本發明的實踐中。
來自血漿的外排體可以藉由如下製備:在900g離心血沈棕黃層持續20分鐘以便分離血漿,之後收穫細胞上清液,在300g離心10分鐘以便去除細胞,並且在16 500g離心30分鐘,之後藉由0.22mm過濾器進行過濾。藉由在120 000g超速離心70min使外排體沈澱。根據在RNAi 人/小鼠活化套組(Quiagen,希爾頓(Hilden),德國)中的製造商的說明進行siRNA到外排體中的化學轉染。siRNA以終濃度2mmol/ml添加到100ml PBS中。在加入HiPerFect轉染試劑之後,將該混合物在室溫下培養10分鐘。為了去除過量的膠束,使用醛/硫酸鹽乳膠珠再分離外排體。可以類似於siRNA進行CRISPR Cas到外排體中的化學轉染。外排體可以與從健康供體的外周血中分離的單核細胞和淋巴細胞共培養。因此,可以考慮的是,可以將含有CRISPR的外排體引入人單核細胞和淋巴細胞中並且以自體方式再引入。因此,可以使用血漿外排體進行根據本發明的遞送或給藥。
脂質體
可以用脂質體進行根據本發明的遞送或給藥。脂質體係球形囊泡結構,其組成為圍繞內部水性區室的單層或多層脂質雙層以及相對不可滲透的外部親脂性磷脂雙層。脂質體作為藥物遞送載體受到了相當的重視,因為它們係生物相容、無毒的,可以遞送親水和親脂性藥物分子,包護它們的負荷物免於被血漿酶降解,並且運送它們的負荷跨過生物膜和血腦屏障(BBB)(對於評述,參見,例如,斯普奇(Spuch)和納瓦羅(Navarro)《藥物遞送雜誌》(Journal of Drug Delivery),2011卷,文獻標識碼469679,第12頁,2011.doi:10.1155/2011/469679)。
可以從幾種不同類型的脂質製造脂質體;然而,磷脂最常用來產生作為藥物載體的脂質體。雖然當脂質膜與水性溶液混合時脂質體形成係自發的,但也可藉由使用均質機、超音波發生器、或擠出設備以振搖的形式施加力使其加速(對於評述,參見,例如,斯普奇(Spuch) 和納瓦羅(Navarro)《藥物遞送雜誌》(Journal of Drug Delivery),2011卷,文獻標識碼469679,第12頁,2011.doi:10.1155/2011/469679)。
可以將幾種其他的添加劑添加到脂質體,以便修飾其結構和特性。例如,可以將膽固醇或鞘磷脂添加到脂質體混合物中,以便說明穩定脂質體結構並且防止脂質體內部負荷物的洩漏。此外,從氫化卵磷脂醯膽鹼或卵磷脂醯膽鹼、膽固醇、和磷酸二鯨蠟脂製備脂質體,並且脂質體的平均囊泡大小被調整到約50至100nm。(對於評述,參見,例如,斯普奇(Spuch)和納瓦羅(Navarro)《藥物遞送雜誌》(Journal of Drug Delivery),2011卷,文獻標識碼469679,第12頁,2011.doi:10.1155/2011/469679)。
脂質體配製物主要可以由天然磷脂和脂質如1,2-二硬脂醯-sn-甘油基-3-磷脂醯膽鹼(DSPC)、鞘磷脂、卵磷脂醯膽鹼和單唾液酸神經節苷酯構成。由於這種配製物僅僅由磷脂組成,脂質體配製物已經遇到了許多挑戰,其中之一係在血漿中的不穩定性。已經作出戰勝該等挑戰的若干嘗試,特別是在脂質膜的處理方面。該等嘗試之一集中於膽固醇的處理。將膽固醇添加到常規配製物中減緩了封裝的生物活性化合物到血漿中的迅速釋放,或者添加1,2-二油醯基-sn-甘油基-3-磷酸乙醇胺(DOPE)增加穩定性(對於評述,參見,例如,斯普奇(Spuch)和納瓦羅(Navarro)《藥物遞送雜誌》(Journal of Drug Delivery),2011卷,文獻標識碼469679,第12頁,2011.doi:10.1155/2011/469679)。
在一特別有利的實施方式中,特洛伊木馬(Trojan Horse)脂質體(也稱為分子木馬)係令人希望的並且方案可見於 http://cshprotocols.cshlp.org/content/2010/4/pdb.prot5407.long。該等粒子允許轉基因在血管內注射之後遞送到整個腦。不受到限制,表面結合有特異性抗體的中性脂質粒子允許經由胞吞作用跨過血腦屏障。申請人假定利用特洛伊木馬脂質體將核酸酶的CRISPR家族經由血管內注射遞送到腦,這將允許全腦轉基因動物,而不需要胚胎操作。對於在脂質體中的體內給藥,可以考慮約1-5g的DNA或RNA。
在另一個實施方式中,該CRISPR Cas系統可以在脂質體中給藥,如穩定的核酸-脂質粒子(SNALP)(參見,例如,莫里西(Morrissey)等人,《自然生物技術》(Nature Biotechnology),第23卷,第8期,2005年8月)。考慮了約1、3或5mg/kg/天的靶向SNALP中的特異性CRISPR Cas的每日靜脈注射。日治療可以經過約三天,然後每週治療持續約五周。在另一個實施方式中,還考慮了藉由以約1或2.5mg/kg的劑量靜脈注射給藥的封裝有特異性CRISPR Cas的SNALP(參見,例如,齊默爾曼(Zimmerman)等人,《自然通訊》(Nature Letters),第441卷,2006年5月4日)。該SNALP配製物可含有以2:40:10:48的莫耳百分比的脂質3-N-[(w甲氧基聚(乙二醇)2000)胺甲醯]-1,2-二肉豆蔻氧基-丙胺(PEG-C-DMA)、1,2-二亞油基氧基-N,N-二甲基-3-胺基丙烷(DLinDMA)、1,2-二硬脂醯-sn-甘油基-3-磷酸膽鹼(DSPC)和膽固醇,(參見,例如,齊默爾曼(Zimmerman)等人,《自然通訊》(Nature Letters),第441卷,2006年5月4日)。
在另一個實施方式中,已經證明穩定的核酸-脂質粒子(SNALP)將分子有效遞送到高度血管化的HepG2-衍生的肝臟腫瘤,但 是不遞送到血管化不良的HCT-116衍生的肝臟腫瘤(參見,例如,李(Li),《基因治療》(Gene Therapy)(2012)19,775-780)。可以藉由如下製備該等SNALP脂質體:使用25:1的脂質/siRNA比率和48/40/10/2的膽固醇/D-Lin-DMA/DSPC/PEG-C-DMA的莫耳比,用二硬脂醯磷脂醯膽鹼(DSPC)、膽固醇和siRNA配製D-Lin-DMA和PEG-C-DMA。生成的SNALP脂質體在大小上為約80-100nm。
在又另一個實施方式中,SNALP可以包含合成膽固醇(西格瑪-奧德里奇公司(Sigma-Aldrich),聖路易斯,密蘇里州,美國)、二棕櫚醯磷脂醯膽鹼(Avanti Polar Lipids公司,阿拉巴斯特(Alabaster),阿拉巴馬州,美國)、3-N-[(w-甲氧基聚(乙二醇)2000)胺甲醯]-1,2-二肉豆蔻氧基丙基胺、和陽離子的1,2-二亞油基氧基-3-N,N二甲基胺基丙烷(參見,例如,蓋斯伯特(Geisbert)等人,《柳葉刀》(Lancet)2010;375:1896-905)。例如可以考慮靜脈推注給予約2mg/kg總CRISPR Cas/劑的劑量。
在又另一個實施方式中,SNALP可以包含合成膽固醇(西格瑪-奧德里奇公司(Sigma-Aldrich))、1,2-二硬脂醯基-sn-甘油基-3-磷酸膽鹼(DSPC;Avanti Polar Lipids公司)、PEG-cDMA以及1,2-二亞油基氧基-3-(N;N-二甲基)胺基丙烷(DLinDMA)(參見例如,賈奇(Judge),《臨床研究雜誌》(J.Clin.Invest.)119:661-673(2009))。用於體內研究的配製物可包含約9:1的最終脂質/RNA質量比。
已經由阿爾尼拉姆製藥公司(Alnylam Pharmaceuticals)的巴羅斯(Barros)和格羅布(Gollob)評論了RNAi奈米藥物的安全性(參 見,例如,《先進藥物遞送評論》(Advanced Drug Delivery Reviews)64(2012)1730-1737)。穩定的核酸脂質粒子(SNALP)由四種不同的脂質構成-在低pH時為陽離子的可電離脂質(DLinDMA)、中性輔助脂質、膽固醇、和可擴散的聚乙二醇(PEG)-脂質。該粒子直徑大約為80nm並且在生理pH時係電中性的。在配製過程中,該可電離脂質用於在粒子形成過程中使脂質與陰離子RNA縮合。當在漸增的酸性內體條件下帶正電荷時,該可電離的脂質還介導了SNALP與內體膜的融合,從而使得能夠將RNA釋放到細胞質中。該PEG-脂質在配製過程中使該粒子穩定並且減少聚集,隨後提供中性的親水性外部,以改進藥代動力學特性。
到目前為止,已經使用具有RNA的SNALP配製物開始兩個臨床項目。Tekmira製藥公司最近完成了SNALP-ApoB在具有增高的LDL膽固醇的成年志願者中的I期單劑量研究。ApoB主要在肝臟和空腸中表現,並且對於VLDL和LDL的組裝和分泌係必需的。十七位受試者接受了SNALP-ApoB的單劑量(跨7個劑量水平的劑量遞增)。沒有肝臟毒性(預期為基於臨床前研究的潛在劑量限制性毒性)的證據。處於最高劑量的(兩位中的)一位受試者經歷了與免疫系統刺激一致的流感樣症狀,於係做出結束該試驗的決定。
阿爾尼拉姆製藥公司(Alnylam Pharmaceuticals)已經類似地推出了ALN-TTR01,其採用上述SNALP技術並且靶向突變體和野生型TTR的肝細胞產生,從而治療TTR澱粉樣變性(ATTR)。已經描述了三個ATTR綜合症:家族性澱粉樣多發性神經病變(FAP)和家族性澱粉樣心肌病(FAC)-兩者均由TTR中的常染色體顯性突變引起;以及由野 生型TTR引起的老年全身性澱粉樣變性(SSA)。最近在具有ATTR的患者中完成了ALN-TTR01的安慰劑對照單劑量遞增I期試驗。向31位患者(23位用研究藥物,8位用安慰劑)在0.01到1.0mg/kg(基於siRNA)的劑量範圍內以15分鐘靜脈內輸注給予ALN-TTR01。治療耐受良好,其中在肝功能試驗中沒有顯著增加。在
Figure 112128864-A0101-12-0361-184
0.4mg/kg時在23位患者的3位中注意到輸注相關反應;對所有患者均做出減慢輸注速率的反應並且所有患者繼續參與研究。在處於1mg/kg的最高劑量(如根據臨床前和NHP研究預期的)的兩位患者中注意到血清細胞因子IL-6、IP-10和IL-1ra的最小與暫態升高。在1mg/kg時觀察到ALN-TTR01的預期藥理效應,即,血清TTR的降低。
在又另一個實施方式中,可以藉由將陽離子脂質、DSPC、膽固醇和PEG-脂質以40:10:40:10的莫耳比分別溶解在例如乙醇中來製作SNALP(參見,森普爾(Semple)等人,《自然生物技術》(Nature Niotechnology),第28卷,第2期,2010年2月,第172-177頁)。將該脂質混合物添加到水性緩衝液中(50mM檸檬酸鹽,pH 4),混合至最終的乙醇和脂質濃度分別為30%(vol/vol)和6.1mg/ml,允許在22℃平衡2分鐘,然後擠出。使用Lipex擠出儀(北方脂質公司(Northern Lipids)),在22℃將水合脂質藉由兩層80nm孔徑大小的過濾器(Nuclepore)直到獲得70-90nm直徑的囊泡時為止,正如藉由動態光散射分析測定的。這大致需要1-3次藉由。將該siRNA(溶解在50mM檸檬酸鹽中,pH為4的含有30%乙醇的水溶液)以約5ml/min的速率在混合下添加到預平衡的(35℃)囊泡中。在達到0.06(wt/wt)的最終靶siRNA/脂質比率之後,將該混合物在35℃ 另外培養30分鐘,以允許囊泡重組和該siRNA的封裝。然後去除乙醇並且藉由透析或切向流滲濾用PBS(155mM NaCl、3mM Na2HPO4、1mM KH2PO4,pH 7.5)替換外部緩衝液。使用控制的逐步稀釋法過程將siRNA封裝在SNALP中。KC2-SNALP的脂質組分為以57.1:7.1:34.3:1.4的莫耳比使用的DLin-KC2-DMA(陽離子脂質)、二棕櫚醯磷脂醯膽鹼(DPPC;Avanti Polar Lipids公司)、合成膽固醇(西格瑪公司)和PEG-C-DMA。在形成載入的粒子後,將SNALP在PBS中透析並且在使用之前藉由0.2μm的濾膜消毒過濾。平均粒徑為75-85nm,並且將90%-95%的siRNA封裝在脂質粒子內。用於體內測試的在配製物中的最終siRNA/脂質比率係大約0.15(wt/wt)。在使用之前即刻將含有因子VII siRNA的LNP-siRNA系統在無菌PBS中稀釋到適當濃度,並且藉由側尾靜脈以10ml/kg的總體積靜脈內給藥。這種方法和該等遞送系統可以類推到本發明的CRISPR Cas系統。
其他脂質
其他陽離子脂質,如胺基脂質2,2-二亞油基-4-二甲基胺基乙基-[1,3]-二氧戊環(DLin-KC2-DMA)可以例如類似於SiRNA地用來封裝CRISPR Cas或其組分或對其進行編碼的一個或多個核酸分子(參見,例如,加雅拉曼(Jayaraman),《德國應用化學》(Angew.Chem.Int.Ed.)2012,51,8529-8533),並且因此可以在本發明的實踐中採用。可以考慮具有下列脂質組成的預成型囊泡:分別處於莫耳比40/10/40/10的胺基脂質、二硬脂醯卵磷脂(DSPC)、膽固醇和(R)-2,3-雙(十八烷氧基)丙基-1-(甲氧基聚(乙二醇)2000)丙基碳酸酯(PEG-脂質),以及大約0.05(w/w)的 FVII siRNA/總脂質比率。為了確保在70-90nm範圍內的窄粒徑分佈以及0.11±0.04(n=56)的低多分散性指數,可以在添加CRISPR Cas RNA之前將粒子藉由80nm的膜擠出達三次。可以使用含有高度有效的胺基脂質16的粒子,其中四種脂質組分16、DSPC、膽固醇和PEG-脂質的莫耳比(50/10/38.5/1.5)可以被進一步優化,以增強體內活性。
邁克爾S D科爾曼(Michael S D Kormann)等人(“在小鼠中遞送化學修飾的mRNA之後治療蛋白的表現”("Expression of therapeutic proteins after delivery of chemically modified mRNA in mice):《自然生物技術》(Nature Biotechnology),第29卷,第154-157頁,(2011))描述了脂質包膜用於遞送RNA的用途。脂質包膜的用途在本發明中也是較佳的。
在另一個實施方式中,脂質可以與本發明的CRISPR Cas系統配製在一起而形成脂質粒子(LNP)。脂質包括但不限於,DLin-KC2-DMA4、C12-200和輔助脂質二硬脂醯磷脂醯膽鹼、膽固醇和PEG-DMG,可以使用自發囊泡形成程序將其與CRISPR Cas而不是siRNA一起配製(參見例如,諾沃勃蘭特塞瓦(Novobrantseva),《分子治療-核酸》(Molecular Therapy-Nucleic Acids)(2012)1,e4;doi:10.1038/mtna.2011.3)。組分莫耳比可以是約50/10/38.5/1.5(DLin-KC2-DMA或C12-200/二硬脂醯磷脂醯膽鹼/膽固醇/PEG-DMG)。在DLin-KC2-DMA和C12-200脂質粒子(LNP)的情況下,最終脂質:siRNA重量比可以分別係約12:1和9:1。配製物可以具有約80nm的平均粒徑,具有>90%的包覆效率。可以考慮3mg/kg的劑量。
Tekmira公司在美國和國外具有一組針對LNP和LNP配製物的不同方面的大約95個同族專利(參見例如,美國專利案號7,982,027;7,799,565;8,058,069;8,283,333;7,901,708;7,745,651;7,803,397;8,101,741;8,188,263;7,915,399;8,236,943和7,838,658以及歐洲專利號1766035;1519714;1781593和1664316),所有該等專利均可用於和/或適用於本發明。
該CRISPR Cas系統或其組分或對其進行編碼一個或多個核酸分子可以封裝在PLGA微球中進行遞送,例如進一步在美國公開申請20130252281和20130245107以及20130244279(轉讓給Moderna Therapeutics公司)中,其涉及包含修飾的核酸分子的組成物的配製物方面,所述核酸分子可以編碼蛋白質、蛋白質先質、或該蛋白質或蛋白質先質的部分或完全加工形式。該配製物具有50:10:38.5:1.5-3.0(陽離子脂質:融合脂質:膽固醇:PEG脂質)的莫耳比。該PEG脂質可以選自,但不限於PEG-c-DOMG、PEG-DMG。該融合脂質可以是DSPC。還參見,施魯姆(Schrum)等人,“工程化核酸的遞送和配製”(Delivery and Formulation of Engineered Nucleic Acids),美國公開申請20120251618。
Nanomerics公司的技術著手解決針對廣泛治療學的生物利用度挑戰,包括基於低分子量疏水藥物、肽以及核酸(質粒、siRNA、miRNA)的治療學。該技術已經證明了明顯優勢的特異性的給藥途徑包括口服途徑、跨血腦屏障的運送、向實體瘤以及眼部的遞送。參見例如,馬薩(Mazza)等人,2013,《ACS奈米》(ACS Nano.)2013年2月26日; 7(2):1016-26;烏切克布(Uchegbu)和秀(Siew),2013,《製藥科學雜誌》(J Pharm Sci.)102(2):305-10和拉拉特薩(Lalatsa)等人,2012,《控釋雜誌》(J Control Release),2012年7月20日;161(2):523-36。
美國專利公開案號20050019923描述了用於向哺乳動物身體遞送生物活性分子例如多核苷酸分子、肽和多肽和/或藥劑的陽離子樹狀聚合物。該等樹狀聚合物適合於將生物活性分子的遞送靶向到例如肝、脾、肺、腎或心臟(或甚至腦)。樹狀聚合物係從簡單的支化單體單元以逐步方式製備的3維大分子,其性質和功能性可以容易地進行控制和改變。經由向多功能核(發散式合成法)或朝向多功能核(收斂式合成法)重複加成結構單元(building blocks)而合成樹狀聚合物,並且結構單元的3維殼的各次加成導致更高級別的樹狀聚合物的形成。聚丙烯亞胺樹狀聚合物從二胺基丁烷核開始,藉由對一級胺的丙烯腈的雙邁克爾加成反應向其上添加兩倍數目的胺基基團,繼之為腈的氫化。這導致胺基基團的加倍。聚丙烯亞胺樹狀聚合物含有100%的可質子化氮以及高達64個末端胺基基團(5級,DAB 64)。可質子化基團常常為能夠在中性pH時接受質子的胺基。樹狀聚合物作為基因遞送劑的用途在很大程度上集中於聚醯胺-胺和含磷化合物之用途,其中胺/醯胺的混合物或N--P(O2)S分別作為綴合單元,沒有報導關於更低級別的聚丙烯亞胺樹狀聚合物用於基因遞送的用途的工作。還研究了作為pH敏感的控制釋放系統的聚丙烯亞胺樹狀聚合物,其用於藥物遞送以及當被外周胺基酸基團化學修飾時用於它們的客體分子的封裝。還研究了聚丙烯亞胺樹狀聚合物的細胞毒性和與DNA的相互作用以及DAB 64的轉染效力。
美國專利公開案號20050019923係基於與早期報導相反的觀察:陽離子樹狀聚合物例如聚丙烯亞胺樹狀聚合物展示出適當的特性,如,特異性靶向和低毒性,其用於在生物活性分子如基因材料的靶向遞送中使用。另外,陽離子樹狀聚合物的衍生物也展示出適當的用於生物活性分子的靶向遞送的特性。還參見,《生物活性聚合物》(Bioactive Polymers)、美國公開申請20080267903,其揭露了不同的聚合物,包括陽離子聚胺聚合物和樹枝狀聚合物,其顯示具有抗增殖活性,並且因此可用於治療其特徵為不希望的細胞增殖的失調,如新生物和腫瘤、炎性失調(包括自身免疫性失調)、牛皮癬和動脈粥樣硬化。該等聚合物可以作為活性劑單獨使用、或者作為其他治療劑(如藥物分子或用於基因治療的核酸)的遞送載體。在這樣的情況下,該等聚合物自身固有的抗腫瘤活性可以補足有待遞送的藥劑的活性。該等專利公開的揭露可以與本文針對遞送一種或多種CRISPR Cas系統或其一種或多種組分或對其進行編碼的一個或多個核酸分子的傳授結合使用。
超電荷蛋白
超電荷蛋白係一類具有非常高的正或負理論淨電荷的工程化的或天然存在的蛋白質並且可以用於遞送一種或多種CRISPR Cas系統或其一種或多種組分或對其進行編碼的一個或多個核酸分子。超負電荷蛋白和超正電荷蛋白兩者都展示出顯著的抵抗熱誘導或化學誘導的聚集的能力。超正電荷蛋白還能夠滲透哺乳動物細胞。使負荷物與該等蛋白質結合,如質粒DNA、RNA、或其他蛋白質,可使得該等大分子到體外和體內的哺乳動物細胞中的功能遞送成為可能。劉大衛實驗室(David Liu’s lab)在2007年報導了超電荷蛋白的建立和表徵(勞倫斯(Lawrence)等人,2007,《美國化學會志》(Journal of the American Chemical Society)129,10110-10112)。
RNA和質粒DNA到哺乳動物細胞中的非病毒遞送對於研究和治療應用都係有價值的(阿肯克(Akinc)等人,2010,《自然生物技術》(Nat.Biotech.)26,561-569)。純化的+36 GFP蛋白(或其他超正電荷蛋白)與RNA在適當的無血清培養基中混合並且允許在添加到細胞中之前複合。在這個階段的血清的包含將會抑制超電荷蛋白-RNA複合物的形成和降低治療效果。已經發現以下方案對於多種細胞系係有效的(麥克諾頓(McNaughton)等人,2009,《美國國家科學院院刊》(Proc.Natl.Acad.Sci.USA)106,6111-6116)(然而,應當進行改變蛋白質和RNA劑量的先導實驗來優化用於特異性細胞系的程式):(1)在治療前一天,以1 x 105個細胞/孔鋪板於48孔板中。(2)在治療當天,在無血清的培養基中稀釋純化的+36 GFP蛋白直到終濃度200nM。添加RNA到50nM的終濃度。渦旋混合並且在室溫培養10分鐘。(3)在培養過程中,抽吸培養基離開細胞並且再次用PBS洗滌。(4)在培養+36 GFP和RNA之後,向細胞加入蛋白質-RNA複合物。(5)將細胞與複合物在37℃培養4小時。(6)在培養之後,抽出培養基並且用20U/mL的肝素PBS洗滌三次。用含血清培養基另外培養細胞48小時或更長,這取決於用於活性的試驗。(7)藉由免疫印跡、qPCR、表型分析、或其他適當的方法分析細胞。
劉大衛實驗室(David Liu’s lab)已經進一步發現+36 GFP在一些列細胞中是一有效的質粒遞送試劑。由於質粒DNA係比siRNA大 的負荷物,有效複合質粒需要成比例地更大的+36 GFP蛋白。為了有效質粒遞送,申請人已經開發了帶有C末端HA2肽標籤的+36 GFP變體,這種肽係已知的從流感病毒血凝素蛋白衍生的內體破壞肽。下列方案在多種細胞中是有效的,但是如上所述,建議針對特異性細胞系和遞送應用優化質粒DNA的超電荷蛋白的劑量:(1)在治療前一天,以1 x 105/孔鋪板於48孔板中。(2)在治療當天,在無血清的培養基中稀釋純化的þ36 GFP蛋白直到終濃度2mM。加入1mg的質粒DNA。渦旋混合並且在室溫培養10分鐘。(3)在培養過程中,抽吸培養基離開細胞並且再次用PBS洗滌。(4)在培養þ36 GFP和質粒DNA之後,向細胞輕輕加入蛋白質-DNA複合物。(5)將細胞與複合物在37C培養4小時。(6)在培養之後,抽出培養基並且用PBS洗滌。在含血清培養基中培養細胞,並且另外培養24-48小時。(7)在適當時分析質粒遞送(例如,藉由質粒驅動的基因表現)。還參見,例如,麥克諾頓(McNaughton)等人,《美國國家科學院院刊》(Proc.Natl.Acad.Sci.USA)106,6111-6116(2009);克羅尼肯(Cronican)等人,《ACS化學生物學》(ACS Chemical Biology)5,747-752(2010);克羅尼肯等人,《化學與生物學》(Chemistry & Biology)18,833-838(2011);湯普森(Thompson)等人,《酶學方法》(Methods in Enzymology)503,293-319(2012);湯普森,D.B.,等人,《化學與生物學》(Chemistry & Biology)19(7),831-843(2012)。超電荷蛋白的該等方法可以使用和/或適用於本發明的CRISPR Cas系統的遞送。呂博士(Dr.Lui)以及與本文的教導結合的本文的文獻的該等系統可以用於遞送一種或多種CRISPR Cas系統或其一種或多種組分或對其進行編碼的一個或多個核酸分子。
細胞穿透肽(CPP)
在又另一個實施方式中,考慮了細胞穿透肽(CPP)用於遞送CRISPR Cas系統。CPP係短肽,其促進細胞吸收不同分子負荷物(從奈米級粒子到小化學分子和DNA的大片段)。如在此使用的術語“負荷物”包括但不限於下組,該組由以下各項組成:治療劑、診斷探針、肽、核酸、反義寡核苷酸、質粒、蛋白質、粒子、脂質體、發色團、小分子和放射性物質。在本發明的多個方面,該負荷物還可包括CRISPR Cas系統的任何組分或整個功能性CRISPR Cas系統。本發明的多個方面進一步提供了用於將希望的負荷物遞送到受試者體內之方法,該等方法包括:(a)製備一複合物,其包含本發明的細胞穿透肽以及希望的負荷物,並且(b)經口服、關節內、腹膜內、鞘內、動脈內(intrarterially)、鼻內、實質內、皮下、肌內、靜脈內、真皮、直腸內地、或局部給予該複合物至一受試者。負荷物係藉由化學鍵經由共價鍵或藉由非共價相互作用與該等肽相關聯。
CPP的功能係將該負荷物遞送進入細胞,這係一通常藉由內吞作用發生的過程,其中該負荷物被遞送到活體哺乳動物細胞的內體。細胞穿透肽具有不同的大小、胺基酸序列、和電荷,但所有CPP具有一不同的特徵,該特徵係轉位質膜並協助將各種分子量的負荷物遞送到細胞質或細胞器的能力。CPP轉位可以分為三個主要的進入機制:直接滲透於膜中、內吞作用-介導的進入、和藉由形成暫時性結構轉位。CPP已經發現在治療不同疾病中在藥物(包括癌症和病毒抑制劑)中作為藥物遞送劑的許多應用、連同在用於細胞標記的造影劑中的許多應用。後者 的實例包括充當用於GFP、MRI造影劑、或量子點的載體。CPP具有很大的作為用於研究和醫學的體外和體內遞送載體的潛力。CPP典型地具有胺基酸組成物,該胺基酸組成物包含高相對豐度的帶負電荷的胺基酸,例如賴胺酸或精胺酸,或具有包含交替模式的極性/帶電荷的胺基酸和非極性疏水性胺基酸的序列。這兩種類型的結構分別稱為聚陽離子或兩親性的。第三類CPP係僅含有非極性殘基的疏水性肽,具有低淨電荷或具有對於細胞攝入關鍵的疏水胺基酸基團。發現的初始CPP之一係來自人類免疫缺陷病毒1(HIV-1)的反式-活化轉錄活化蛋白(Tat),發現其高效地從周圍介質被許多培養中的細胞類型攝取。從此以後,已知CPP的數目已經顯著擴大,並且已經產生具有更有效蛋白轉導特性的小分子合成類似物。CPP包括但不限於穿透素、Tat(48-60)、轉運素(Transportan)、以及(R-AhX-R4)(Ahx=胺基己醯基)。
美國專利8,372,951提供了來源於嗜酸性粒細胞陽離子蛋白質(ECP)的CPP,它展示出高度細胞穿透效率和低毒性。還提供了將CPP與其內負荷物遞送進脊椎動物受試者中的多個方面。CPP的其他方面及其遞送在美國專利8,575,305;8;614,194以及8,044,019中。CPP可以用來遞送CRISPR-Cas系統或其組分。可以採用CPP遞送CRISPR-Cas系統或其組分,也被提供於原稿“藉由細胞穿透肽介導的對Cas9蛋白和指導RNA的遞送進行的基因破壞(Gene disruption by cell-penetrating peptide-mediated delivery of Cas9 protein and guide RNA)”,蘇雷什 羅摩克裡希納(Suresh Ramakrishna),阿布-博恩塞拉 誇庫 達迪(Abu-Bonsrah Kwaku Dad),賈格迪什 博盧爾(Jagadish Beloor)等人, 《基因組研究》(Genome Res.)2014年4月2日,[電子出版先於印刷],藉由引用以其全文結合,其中證實了用CPP-綴合的重組Cas9蛋白和CPP-複合的指導RNA進行治療導致在人類細胞系中的內源基因破壞。在該論文中,Cas9蛋白經由硫醚鍵綴合至CPP,而指導RNA與CPP複合,形成形成縮合的、帶負電荷的粒子。已經顯示,用修飾的Cas9和指導RNA同時和順序地治療人類細胞,包括胚胎幹細胞、真皮成纖維細胞、HEK293T細胞、海拉(HeLa)細胞、和胚胎癌細胞,導致有效的基因破壞,伴隨相對於質粒轉染而言降低的脫靶突變。
可植入裝置
在另一個實施方式中,還考慮可植入裝置用於遞送該CRISPRCas系統或其一種或多種組分或對其進行編碼的一個或多個核酸分子。例如,美國專利公開20110195123揭露了一可植入醫用裝置,其局部地並且在延長的時期內洗脫藥物,包括幾種類型的這種裝置、實施的治療方式和植入方法。該裝置包含聚合物基材,例如,用作裝置主體的基質、以及藥物,並且在一些情況下包含另外的支架材料,如金屬或另外的聚合物,以及增強可見度和成像的材料。可植入遞送裝置在提供局部的並且在延長的時期內的釋放方面可以是有利的,其中藥物直接釋放到患病區域的細胞外基質(ECM),所述患病區域如腫瘤、炎症、退化,或用於針對症狀的目的,或者釋放到受損的平滑肌細胞,或者用於預防。如上文揭露的,一類藥物係RNA,並且這個系統可以用於和/或適用於本發明的CRISPR Cas系統。在一些實施方式中,植入方式為用於包括近距離放射療法和針吸活組織檢查在內的其他治療的、當今開發和使用的現 有植入程序。在這樣的情況下,在本發明中描述的新植入物的尺寸類似於初始植入物。典型地在相同的治療程序中植物很少的裝置。
正如在美國專利公開20110195123中,提供了一種藥物遞送可植入或可插入系統,包括適用於空腔例如腹腔和/或其中藥物遞送系統未被錨定或附接的任何其他類型的給藥,其包含生物穩定的和/或可降解的和/或生物可吸收的聚合物基材,其可以例如視情況是一基質。應當指出的是術語“插入”也包括植入。該藥物遞送系統較佳的是被實施為如在美國專利公開20110195123中的“裝填器(Loder)”。
聚合物或多種聚合物係生物相容的,其結合一種藥劑和/或多種藥劑,使得藥劑以控制的速率釋放,其中該聚合物基材如基質的總體積,例如在一些實施方式中是視情況並且較佳的是不大於容許達到該藥劑的治療水平的最大體積。作為一非限制性實例,這樣的體積較佳的是在0.1m3至1000mm3的範圍內,正如該藥劑負荷的體積所要求的。該裝填器視情況是更大的,例如當結合有一其大小由功能性決定的裝置時,例如而不限於,膝關節、宮內節育環或子宮頸環等等。
在一些實施方式中,該藥物遞送系統(用於遞送該組成物)被設計為較佳的是採用可降解聚合物,其中主要釋放機制係本體溶蝕(Bulk erosion);或者在一些實施方式中,使用了不可降解的、或緩慢降解的聚合物,其中主要釋放機制係擴散而不是本體溶蝕,使得外部部分用作膜,而其內部部分用作儲藥池,該儲藥池在延長的時期內(例如從約一周到約幾個月)實際上不受環境的影響。還可以視情況使用具有不同釋放機制的不同聚合物的組合。在總藥物釋放期的重要時段期間,在 表面處的濃度梯度較佳的是被維持有效地恒定,並且因此擴散速率係有效地恒定的(稱為“零模式”擴散)。關於術語“恒定”,它意指較佳的是維持在治療效果的低閾值以上的擴散速率,但是可以仍然視情況具有初期突釋的特徵和/或可以波動,例如增加和降低到一定程度。該擴散速率較佳的是被如此維持一延長的時期,並且它被考慮為相對於一定的水平係恒定的,以便優化治療有效期,例如該有效沈默期。
該藥物遞送系統視情況並且較佳的是被設計為保護基於核苷酸的治療劑免於降解,而不論化學性質或由於受試者體內的酶和其他因素的攻擊。
如在美國專利公開20110195123中的藥物遞送系統視情況與傳感和/或活化器具相關聯,該等器具藉由活化和/或加速/減速的無創和/或微創方法在該裝置的植入之時和/或之後被操作,例如視情況包括但不限於熱力加熱和冷卻、雷射光束和超音波,包括聚焦超音波和/或RF(射頻)方法或裝置。
根據美國專利公開20110195123的以下實施方式,用於局部遞送的部位可以視情況包括其特徵為高度異常的細胞增殖、受到抑制的細胞凋亡的靶部位,包括腫瘤、活動性和/或慢性炎症和感染,包括自身免疫性疾病狀態、退化組織(包括肌肉和神經組織)、慢性疼痛、退行性部位,以及用於增強組織再生的骨折位置以及其他傷口位置,以及損傷的心肌、平滑肌和橫紋肌。
用於植入該組成物的部位、或靶部位,較佳的是其特徵為用於靶向局部遞送的足夠小的半徑、面積和/或體積。例如,該靶部位視 情況具有在從約0.1mm到約5cm範圍內的直徑。
該靶部位的位置較佳的是針對最大治療效力而選擇。例如,該藥物遞送系統的組成物(視情況與如上所述的用於植入的裝置一起)視情況並且較佳的是被植入在腫瘤環境或與之相關的血供之內或者附近。
例如該組成物(視情況與該裝置一起)視情況植入在胰臟、前列腺、乳房、肝臟之內或附近,藉由乳頭,在血管系統之內,等等。
靶位置視情況選自由以下各項組成之群組(僅僅作為非限制性實例,因為視情況在身體內的任何部位可以適合於植入裝填器):1.腦,在退行性部位,像在帕金森病或阿茲海默症中的基底神經節、白質和灰質;2.如在肌萎縮性脊髓側索硬化症(ALS)的情況下的脊柱;3.子宮頸以預防HPV感染;4.活動性或慢性炎性關節;5.在牛皮癬情況下的真皮;6.交感神經部位和感覺神經部位用於止痛作用;7.骨內植入;8.急性和慢性感染部位;9.陰道內;10.內耳--聽覺系統、內耳的迷路、前庭系統;11.氣管內;12.心內;冠狀動脈、心外膜;13.膀胱;14.膽道系統;15.實質組織,包括且不限於腎臟、肝臟、脾臟;16.淋巴結;17.唾液腺;18.牙齦;19.關節內(進入關節);20.眼內;21.腦組織;22.腦室;23.空腔,包括腹腔(例如但不限於,用於卵巢癌);24.食管內以及25.直腸內。
視情況,該系統(例如含有該組成物的裝置)的插入與向在該靶部位和該部位附近的ECM注射材料有關,從而影響該靶部位和這個部位附近的ECM中的局部pH和/或溫度和/或影響該藥物的擴散和/或藥 物動力學的其他生物因素。
視情況,根據一些實施方式,所述藥劑的釋放可以與傳感和/或活化器具相關聯,該等器具藉由活化和/或加速/減速的無創和/或微創方法和/或別的方法在插入之前和/或之時和/或之後被操作,所述方法包括雷射光束、放射、熱力加熱和冷卻、和超音波,包括聚焦超音波和/或RF(射頻)方法或裝置、以及化學活化劑。
根據美國專利公開20110195123的其他實施方式,該藥物較佳的是包括RNA,例如,對於局限性癌症情況,在乳房、胰臟、腦、腎臟、膀胱、肺、以及前列腺中,如下文所述。儘管用RNAi進行示例,但是許多藥物可適用封裝在裝填器中,並且可以與本發明結合使用,只要這樣的藥物可以被裝填器底物(例如像基質)封裝即可,並且這個系統可以用於和/或適用於遞送本發明的CRISPR Cas系統。
作為特殊應用的另一個實例,神經肌肉退行性疾病由於異常基因表現而發生。RNA的局部遞送可以具有干擾這樣的異常基因表現的治療特性。包括小分子藥物和大分子在內的抗凋亡、抗炎和抗退行性藥物的局部遞送也可以視情況是治療性的。在這樣的情況下,該裝填器用於以恒定速率和/或藉由單獨植入的專用裝置延長釋放。這都可以用於和/或適用於本發明的CRISPR Cas系統。
作為特殊應用的又另一個實例,用基因修飾劑治療精神和認知障礙。基因敲低係治療選項。向中樞神經系統部位局部遞送藥劑的裝填器係對於精神和認知障礙的治療選項,該等精神和認知障礙包括但不限於,精神病、雙極性疾病、神經性障礙和行為疾病(behavioral maladies)。該等裝填器也可以在特定腦部位進行植入時局部遞送包括小分子藥物和大分子的藥物。這都可以用於和/或適用於本發明的CRISPR Cas系統。
作為特殊應用的另一個實例,在局部部位的先天性和/或適應性免疫介質的沈默使得能夠預防器官移植排斥。用植入到移植器官和/或植入部位的裝填器局部遞送RNA和免疫調節試劑致使經由排斥性免疫細胞(如針對移植器官而被活化的CD8)的局部免疫抑制。這都可以用於和/或適用於本發明的CRISPR Cas系統。
作為特殊應用的另一個實例,包括VEGF和血管生成素及其他在內的血管生長因子對於新血管形成係必需的。該等因子、肽、肽類比物的局部遞送或抑制它們的抑制蛋白係一重要的治療模式;使抑制蛋白沈默以及用裝填器局部遞送刺激血管發生的該等因子、肽、大分子和小分子藥物對於周圍血管疾病、全身性血管疾病和心血管疾病係治療性的。
插入之方法,如植入,可以視情況已用於其他類型的組織植入和/或用於組織取樣,視情況在這樣的方法中沒有修改,或者可替代地視情況僅僅具有非重點修改。這樣的方法視情況包括但不限於,近距離放射治療方法、活組織檢查、用和/或不用超音波的內窺鏡檢查如ERCP、進入腦組織的立體定向法、腹腔鏡檢查,包括用腹腔鏡進入關節、腹腔器官、膀胱壁和體腔的植入。
在本文討論的可植入裝置技術可以與本文的教導一起使用並且因此根據本揭露和本領域的知識,可以經由可植入裝置遞送 CRISPR-Cas系統或其組分或其核酸分子或編碼或提供組分的核酸分子。
氣霧劑遞送
針對肺病進行治療的受試者的每一側肺可以例如接受支氣管內遞送的藥學上有效量的霧化AAV載體系統,同時自然地呼吸。像這樣,通常對於AAV遞送而言,霧化遞送係較佳的。腺病毒或AAV粒子可以用於遞送。每一者都可操作地連接至一個或多個調節序列上的適合的基因構建體可以被選殖到遞送載體中。在這種情況下,提供下列構建體作為實例:用於Cas9的Cbh或EF1a啟動子、用於指導RNA的U6或H1啟動子:一較佳的安排係使用靶向指導物的CFTRδ508、用於δF508突變的修復模板以及密碼子優化的Cas9酶,所述酶具有視情況一個或多個核定位信號或序列(NLS),例如,兩個(2)NLS。還設想了沒有NLS的構建體。
CRISPR酶mRNA和指導RNA
也可以單獨遞送CRISPR酶mRNA和指導RNA。可以在該指導RNA在給出時間以待CRISPR酶表現之前遞送CRISPR酶mRNA。可以在給予指導RNA之前1-12小時(較佳的是約2-6小時)給予CRISPR酶mRNA。
可替代地,可以一起給予CRISPR酶mRNA和指導RNA。有利地,可以在初始給予CRISPR酶mRNA+指導RNA之後1-12小時(較佳的是約2-6小時)給予指導RNA的第二加強劑量。
為了實現基因組修飾的最有效水平,另外給予CRISPR酶 mRNA和/或指導RNA可以是有用的。在一些實施方式中,當靶向遺傳病時,尤其是在治療方法中以及較佳的是,其中提供修復模板用於校正或改變表型,表型改變較佳的是係基因組修飾的結果。
在一些實施方式中,可以被靶向的疾病包括與引起疾病的剪接缺陷有關的那些。
在一些實施方式中,細胞靶標包括造血幹細胞/祖細胞(CD34+);人類T細胞;以及眼(視網膜細胞)-例如光感受器先質細胞。
在一些實施方式中,基因靶標包括:人類β珠蛋白-HBB(用於治療鐮狀細胞貧血,包括藉由刺激基因轉換(使用密切相關的HBD基因作為內源模板));CD3(T細胞);以及CEP920-視網膜(眼)。
在此處關於與突變或與疾病病況相關的靶標的討論中,此類突變或疾病病況可以是,例如血友病B、SCID、SCID-X1、ADA-SCID、遺傳性酪胺酸血症、鐮狀細胞貧血、β-地中海貧血、伴X染色體的CGD、偉-爾二氏症候群、范康尼氏頑固性貧血、腎上腺腦白質失養症(ALD)、異染性白質失養症(MLD)、烏謝爾症候群(Usher Syndrome)、色素性視網膜炎、先天性利伯氏黑朦(Leber’s Congential Amaurosis)、囊性纖維病、HIV/AIDS、HSV-1、HSV-2;或更通常地,免疫缺陷障礙,血液病、或遺傳性溶酶體貯積病。靶標可與免疫療法(例如,癌症免疫療法)關聯。
在一些實施方式中,遞送方法包括:陽離子脂質介導的酶-指導複合物(核糖核蛋白)的“直接”遞送和質粒DNA的電穿孔。
本發明的方法可進一步包括模板的遞送,如修復模板,該等模板可以是dsODN或ssODN,參見以下。模板的遞送可以經由同時或單獨於遞送任何或所有CRISPR酶、指導物、tracr配對或tracrRNA並且藉由相同或不同的遞送機構進行。在一些實施方式中,較佳的是,模板與指導物、tracr配對和/或tracrRNA以及,較佳的是,還有CRISPR酶一起遞送。一實例可以是AAV載體,其中該CRISPR酶係SaCas9(具有N580突變)。
本發明的方法可以進一步包括:(a)向該細胞遞送雙股寡去氧核苷酸(dsODN),該雙股寡去氧核苷酸包含與藉由所述雙股斷裂產生的突出端互補的突出端,其中所述dsODN被整合進該感興趣座位中;或-(b)向該細胞遞送單股寡去氧核苷酸(ssODN),其中所述ssODN充當所述雙股斷裂的同源定向修復的模板。本發明的方法可以用於預防或治療個體的疾病,視情況其中所述疾病係由所述感興趣座位中的缺陷引起。本發明的方法可以是在該個體的體內進行或針對取自該個體的細胞離體地進行,視情況其中將所述細胞返回到該個體。
根據本發明的酶可以應用於優化的功能性CRISPR Cas系統中,該系統係功能篩選所感興趣的;SAM篩選
在一個方面,本發明提供了非天然存在的或工程化的組成物,該組成物包含一種類型V,更具體地,包括能夠雜交到細胞中感興趣的基因組座位中靶序列上的指導序列的Cas9 CRISPR指導RNA,其中該指導RNA係藉由插入結合至兩種或多種轉接蛋白(例如,適配體)的一個或多個不同RNA序列而進行修飾的,並且其中每種轉接蛋白與一個或多個功能結構域關聯;或者,其中該指導RNA被修飾成具有至少一個非編 碼功能環。在具體實施方式中,藉由插入同向重複的5’、在同向重複內、或指導序列的3’的一個或多個不同RNA序列,對指導RNA進行修飾。當存在多於一個功能結構域時,該等功能結構域可以是相同或不同的,例如,兩個相同或兩個不同的活化蛋白或抑制蛋白。在一個方面,本發明提供了非天然存在的或工程化的CRISPR-Cas複合物組成物,該組成物包括在此所討論的指導RNA和CRISPR酶,該酶係一種Cas9酶,其中視情況,該Cas9酶包括至少一個突變,這樣使得該Cas9酶具有不超過5%的不具有該至少一個突變的Cas9酶的核酸酶活性,以及視情況一種或多種包含至少一個或多個核定位序列。在一方面,本發明提供了在此所討論的Cas9 CRISPR指導RNA或Cas9 CRISPR-Cas複合物,其包括一非天然存在的或工程化的組成物,該組成物包含兩種或更多種轉接蛋白,其中每種蛋白與一個或多個功能結構域關聯,並且其中該轉接蛋白結合至插入到該指導RNA中的不同RNA序列上。在具體實施方式中,該指導RNA被另外地或可替代地修飾,以便仍確保Cas9 CRISPR複合物的結合,但防止被Cas9酶切割(如在本文別處所詳述的)。
在一方面,本發明提供了一種非天然存在的或工程化的組成物,該組成物包含:一指導RNA(gRNA),其包含一種能夠雜交到細胞中感興趣的基因組座位中靶序列上的指導序列;Cas9酶,其包含至少一個或多個核定位序列,其中該Cas9酶包括至少一個突變,這樣使得該Cas9酶具有不超過5%的不具有該至少一個突變的Cas9酶的核酸酶活性,其中該指導RNA係藉由插入結合至一種或多種轉接蛋白的一個或多個不同RNA序列而進行修飾的,並且其中該轉接蛋白與一個或多個功能結構 域關聯;或者,其中該指導RNA被修飾成具有至少一個非編碼功能環,並且其中該組成物包括兩種或更多種轉接蛋白,其中每種蛋白與一個或多個功能結構域關聯。在一方面,本發明提供了在此討論的組成物,其中該Cas9酶當與不具有至少一個突變的Cas9酶相比時具有降低至少97%或100%的核酸酶活性。在一個方面,本發明提供了在此討論的組成物,其中該Cas9酶包括兩個或更多個突變。在一方面,本發明提供了在此討論的組成物,其中該Cas9酶與一個或多個功能結構域關聯。在一方面,本發明提供了在此討論的組成物,其中該兩個或多個與轉接蛋白關聯的功能結構域各自係一異源功能結構域。在一方面,本發明提供了在此討論的組成物,其中該一個或多個與Cas9酶關聯的功能結構域各自係一個異源功能結構域。在一方面,本發明提供了在此討論的組成物,其中該轉接蛋白係融合蛋白,該融合蛋白包括功能結構域,該融合蛋白視情況包括一在轉接蛋白和功能結構域之間的接頭,該接頭視情況包括一種GlySer接頭。在一個方面,本發明提供了在此討論的組成物,其中該gRNA不是藉由插入結合至兩種或多種轉接蛋白的一個或多個不同RNA序列而進行修飾的。在一方面,本發明提供了在此討論的組成物,其中該一個或多個與轉接蛋白關聯的功能結構域係一個轉錄活化結構域。在一方面,本發明提供了在此討論的組成物,其中該一個或多個與Cas9酶關聯的功能結構域係一個轉錄活化結構域。在一方面,本發明提供了在此討論的組成物,其中該一個或多個與轉接蛋白關聯的功能結構域係一個包括VP64、p65、MyoD1、HSF1、RTA或SET7/9的轉錄活化結構域。在一方面,本發明提供了在此討論的組成物,其中該一個或多個與Cas9酶關聯的功能結構域係包括VP64、p65、MyoD1、HSF1、RTA或SET7/9的轉 錄活化結構域。在一方面,本發明提供了在此討論的組成物,其中該一個或多個與轉接蛋白關聯的功能結構域係一轉錄抑制蛋白結構域。在一方面,本發明提供了在此討論的組成物,其中該一個或多個與Cas9酶關聯的功能結構域係一轉錄抑制蛋白結構域。在一方面,本發明提供了在此討論的組成物,其中該轉錄抑制蛋白結構域係KRAB結構域。在一方面,本發明提供了在此討論的組成物,其中該轉錄抑制蛋白結構域係NuE結構域,NcoR結構域、SID結構域或SID4X結構域。在一方面,本發明提供了在此討論的組成物,其中該一個或多個與轉接蛋白關聯的功能結構域中的至少一個具有一種或多種活性,該等活性包括甲基化酶活性、脫甲基化酶活性、轉錄活化活性、轉錄阻抑活性、轉錄釋放因子活性、組蛋白修飾活性、DNA整合活性RNA切割活性、DNA切割活性或核酸結合活性。在一方面,本發明提供了在此討論的組成物,其中該一個或多個與Cas9酶關聯的功能結構域具有一種或多種活性,該等活性包括甲基化酶活性、脫甲基化酶活性、轉錄活化活性、轉錄阻抑活性、轉錄釋放因子活性、組蛋白修飾活性、DNA整合活性RNA切割活性、DNA切割活性、核酸結合活性、或分子開關活性或化學可誘導性或光可誘導性。在一方面,本發明提供了在此討論的組成物,其中該DNA切割活性係由於Fok1核酸酶。在一方面,本發明提供了在此討論的組成物,其中該一個或多個功能結構域附接至該Cas9酶,這樣使得當結合至該gRNA和靶標時,該功能結構域處於空間定向,從而允許該功能結構域在其屬性功能中起作用;或者,視情況,其中該一個或多個功能結構域經由接頭附接至該Cas9酶,視情況GlySer接頭。在一方面,本發明提供了在此討論的組成物,其中該gRNA被修飾成使得,在gRNA結合轉接蛋白並且進一步結合至該 Cas9酶和靶標之後,該功能結構域處於空間定向,從而允許該功能結構域在其屬性功能中起作用。在一方面,本發明提供了在此討論的組成物,其中該一個或多個與Cas9酶關聯的功能結構域被附接到Cas9的RuvC結構域上。在一方面,本發明提供了在此討論的組成物,其中該指導RNA的同向重複係藉由插入一個或多個不同RNA序列而進行修飾的。在一方面,本發明提供了在此討論的組成物,其中插入的結合至一種或多種轉接蛋白的一個或多個不同RNA序列係適配體序列。在一方面,本發明提供了在此討論的組成物,其中該適配體序列係對相同轉接蛋白具有特異性的兩個或更多個適配體序列。在一方面,本發明提供了在此討論的組成物,其中該適配體序列係對不同轉接蛋白具有特異性的兩個或更多個適配體序列。在一方面,本發明提供了在此討論的組成物,其中該轉接蛋白包括MS2、PP7、Qβ、F2、GA、fr、JP501、M12、R17、BZ13、JP34、JP500、KU1、M11、MX1、TW18、VK、SP、FI、ID2、NL95、TW19、AP205、ΦCb5、ΦCb8r、ΦCb12r、ΦCb23r、7s、PRR1。因此,在具體實施方式中,該適配體選自一特異性結合以上列出的任一種轉接蛋白的結合蛋白。在一方面,本發明提供了在此討論的組成物,其中該細胞係真核細胞。在一方面,本發明提供了在此討論的組成物,其中該真核細胞係哺乳動物細胞、植物細胞或酵母細胞,由此該哺乳動物細胞視情況是小鼠細胞。在一方面,本發明提供了在此討論的組成物,其中該哺乳動物細胞係人類細胞。在一方面,本發明提供了在此討論的組成物,其中第一轉接蛋白與p65結構域關聯並且第二轉接蛋白與HSF1結構域關聯。在一方面,本發明提供了在此討論的組成物,其中該組成物包括一種CRISPR-Cas複合物,該複合物具有至少三個功能結構域,其中至少一個 與該Cas9酶關聯並且其中至少兩個與gRNA關聯。
在一個方面,本發明提供了在此以上討論的組成物,其中存在多於一個gRNA,並且該等gRNA靶向不同序列,由此當使用該組成物時,存在著多工。在一個方面,本發明提供了一種組成物,其中存在多於一個gRNA係藉由插入結合至一種或多種轉接蛋白的一個或多個不同RNA序列而進行修飾的。
在一方面,本發明提供了在此討論的組成物,其中與一個或多個功能結構域關聯的一種或多種轉接蛋白係存在的並且結合到插入到該指導RNA中的不同的RNA序列上。
在一方面,本發明提供了在此討論的組成物,其中該一個或多個靶序列係非編碼或調節序列。該等調節序列可以是一個或多個啟動子、增強子或沈默子序列。
在一方面,本發明提供了在此討論的組成物,其中該指導RNA被修飾成具有至少一個非編碼功能環;例如,其中該至少一個非編碼功能環係抑制性的;例如,其中至少一個非編碼功能環包括Alu。
在一方面,本發明提供了一種方法,該方法用於引入一基因組座位事件,該事件包括向宿主給予或在宿主中體內表現如在此討論的一種或多種組成物。在一方面,本發明提供了在此討論之方法,其中該基因組座位事件包括影響該座位中的基因活化、基因抑制、或切割。
在一方面,本發明提供了在此討論的方法,其中該宿主係真核細胞。在一方面,本發明提供了在此討論的方法,其中該宿主係哺 乳動物細胞,視情況是小鼠細胞或植物細胞或酵母細胞。在一方面,本發明提供了在此討論的方法,其中該宿主係非人類真核生物。在一方面,本發明提供了在此討論的方法,其中該非人類真核生物係非人哺乳動物。在一方面,本發明提供了在此討論的方法,其中該非人哺乳動物係小鼠。
在一方面,本發明提供了一種修飾感興趣的基因組座位之方法,以藉由引入或在細胞中表現如在此討論的組成物來改變細胞中的基因表現。在一方面,本發明提供了在此討論的方法,該方法包括遞送該組成物或用於編碼它的一種或多種核酸分子,其中所述一種或多種核酸分子被操作性地連接至一個或多個調節序列並且在體內進行表現。在一方面,本發明提供了在此討論的方法,其中經由慢病毒、腺病毒、或AAV進行體內表現。
在一方面,本發明提供了如在此討論的細胞的哺乳動物細胞系,其中該細胞系視情況是人細胞系或小鼠細胞系。在一方面,本發明提供了一轉基因哺乳動物模型,視情況是小鼠,其中該模型已經用在此討論的組成物進行了轉化或係所述轉化體的子代。
在一方面,本發明提供一種或多種核酸分子,該等核酸分子編碼指導RNA或Cas9 CRISPR-Cas複合物或如在此討論的組成物。在一方面,本發明提供了一種載體,該載體包含:一核酸分子,該核酸分子編碼一指導RNA(gRNA),該指導RNA包括一能夠雜交到細胞中感興趣的基因組座位中靶序列上的指導序列,其中該gRNA的同向重複係藉由插入結合至兩種或多種轉接蛋白的一個或多個不同RNA序列而進行修飾 的,並且其中每種轉接蛋白與一個或多個功能結構域關聯;或者,其中該gRNA被修飾成具有至少一個非編碼功能環。在一方面,本發明提供了一種或多種載體,所述載體包括一種或多種編碼以下各項的核酸分子:非天然存在的或工程化的CRISPR-Cas複合物組成物,該組成物包括在此所討論的gRNA和一Cas9酶,其中視情況,該Cas9酶包括至少一個突變,這樣使得該Cas9酶具有不超過5%的不具有該至少一個突變的Cas9酶的核酸酶活性,以及視情況一種或多種包含至少一個或多個核定位序列。在一方面,一載體可以進一步包括一種或多種可在一種真核細胞中操作的調節元件,所述調節元件操作性地連接到編碼指導RNA(gRNA)的核酸分子和/或編碼Cas9酶和/或視情況一個或多個核定位序列的核酸分子上。
在一個方面,本發明提供了一套組,該套組包括上文所描述的一個或多個組分。在一些實施方式中,該套組包括如以上所描述的載體系統以及用於使用該套組的說明書。
在一方面,本發明提供了一篩選功能獲得(GOF)或功能缺失(LOF)或用於篩選非編碼RNA或潛在調節區(例如,增強子、抑制蛋白)之方法,該方法包括如在此討論的或在此討論的含有或表現Cas9的模型的細胞的細胞系,以及將如在此討論的組成物引入該細胞系或模型的細胞中,由此該gRNA包括一活化蛋白或一抑制蛋白,並且分別監測用於GOF或LOF,關於gRNA引入其中的那些細胞包括一活化蛋白或關於gRNA引入其中的那些細胞包括一抑制蛋白。本發明的篩選被稱為SAM篩選。
在一方面,本發明提供了一種Cas9 CRISPR Cas複合物, 該複合物包括一Cas9酶和一指導RNA(gRNA),其中該Cas9酶包括至少一個突變,這樣使得該Cas9酶具有不超過5%的不具有該至少一個突變的Cas9酶的核酸酶活性,以及視情況至少一個或多個核定位序列;該指導RNA(gRNA)包括一種能夠雜交到細胞中感興趣的基因組座位中靶序列上的指導序列;並且其中該gRNA係藉由插入結合至一種或多種轉接蛋白的一個或多個不同RNA序列而進行修飾的,並且其中該轉接蛋白與兩個或多個功能結構域關聯,或者,其中該gRNA被修飾成具有至少一個非編碼功能環;或該Cas9酶與一個或多個功能結構域關聯,並且該gRNA係藉由插入結合至一種或多種轉接蛋白的一個或多個不同RNA序列而進行修飾的,並且其中該轉接蛋白與兩個或多個功能結構域關聯,或者,其中該gRNA被修飾成具有至少一個非編碼功能環。
在一方面,本發明提供了基因組廣度文庫,其包括多個Cas9指導RNA(gRNA),該等指導RNA包括指導序列,該等指導序列各自都能夠雜交到細胞中感興趣的基因組座位中的靶序列上,並且由此該文庫能夠靶向真核細胞群中多個基因組座位中的多個靶序列,其中每個gRNA係藉由插入結合至一種或多種或兩種或多種轉接蛋白的一個或多個不同RNA序列而進行修飾的,並且其中該轉接蛋白與一個或多個功能結構域關聯;或者,其中該gRNA被修飾成具有至少一個非編碼功能環。並且當存在多於一個功能結構域時,該等功能結構域可以是相同或不同的,例如,兩個相同或兩個不同的活化蛋白或抑制蛋白。在一方面,本發明提供了一種或多種非天然存在的或工程化的CRISPR-Cas複合物組成物的文庫,該組成物包括本發明所述的gRNA和Cas9酶,其中視情況,該 Cas9酶包括至少一個突變,這樣使得該Cas9酶具有不超過5%的不具有該至少一個突變的Cas9酶的核酸酶活性,以及視情況一種或多種包含至少一個或多個核定位序列。在一方面,本發明提供了一種或多種本發明所述的gRNA或Cas9 CRISPR-Cas複合物,其包括一種非天然存在的或工程化的組成物,該組成物包含一種或兩種或更多種轉接蛋白,其中每種蛋白與一個或多個功能結構域關聯,並且其中該轉接蛋白結合至插入到該gRNA的至少一個環中的不同RNA序列上。
在一方面,本發明提供了一種非天然存在的或工程化的組成物的文庫,其各自包含:一Cas9 CRISPR指導RNA(gRNA),其包含一種能夠雜交到細胞中感興趣的基因組座位中靶序列上的指導序列;Cas9酶,其包含至少一個或多個核定位序列,其中該Cas9酶包括至少一個突變,這樣使得該Cas9酶具有不超過5%的不具有該至少一個突變的Cas9酶的核酸酶活性,其中該gRNA的至少一個環係藉由插入結合至一種或多種轉接蛋白的一個或多個不同RNA序列而進行修飾的,並且其中該轉接蛋白與一個或多個功能結構域關聯,其中該組成物包括一種或多種或兩種或多種轉接蛋白,其中每種蛋白與一個或多個功能結構域關聯,並且其中該等gRNA包括基因組廣度文庫,其包括多個Cas9指導RNA(gRNA)。在一方面,本發明提供了如在此討論的文庫,其中該Cas9酶當與不具有至少一個突變的Cas9酶相比時具有降低至少97%或100%的核酸酶活性。在一方面,本發明提供了一種如在此討論的文庫,其中該Cas9酶包括兩個或更多個突變。在一方面,本發明提供了如在此討論的文庫,其中該Cas9酶包括兩個或更多個突變。在一方面,本發明提供了一種如 在此討論的文庫,其中該Cas9酶與一個或多個功能結構域關聯。在一方面,本發明提供了如在此討論的文庫,其中一個或兩個或多個與轉接蛋白關聯的功能結構域係異源功能結構域。在一方面,本發明提供了如在此討論的文庫,其中一個或多個與Cas9酶關聯的功能結構域係異源功能結構域。在一方面,本發明提供了如在此討論的文庫,其中該轉接蛋白係包括該功能結構域的融合蛋白。在一方面,本發明提供了如在此討論的文庫,其中該gRNA不是藉由插入結合至一種或兩種或多種轉接蛋白的一個或多個不同RNA序列而進行修飾的。在一方面,本發明提供了如在此討論的文庫,其中一個或兩個或多個與轉接蛋白關聯的功能結構域係轉錄活化結構域。在一方面,本發明提供了如在此討論的文庫,其中一個或兩個或多個與Cas9酶關聯的功能結構域係轉錄活化結構域。在一方面,本發明提供了如在此討論的文庫,其中一個或兩個或多個與轉接蛋白關聯的功能結構域係包括VP64、p65、MyoD1或HSF1的轉錄活化結構域。在一方面,本發明提供了如在此討論的文庫,其中一個或多個與Cas9酶關聯的功能結構域係包括VP64、p65、MyoD1或HSF1的轉錄活化結構域。在一方面,本發明提供了如在此討論的文庫,其中一個或兩個或多個與轉接蛋白關聯的功能結構域係轉錄抑制蛋白結構域。在一方面,本發明提供了如在此討論的文庫,其中一個或多個與Cas9酶關聯的功能結構域係轉錄抑制蛋白結構域。在一方面,本發明提供了如在此討論的文庫,其中該轉錄抑制蛋白結構域係KRAB結構域。在一方面,本發明提供了如在此討論的文庫,其中該轉錄抑制蛋白結構域係SID結構域或SID4X結構域。在一方面,本發明提供了如在此討論的文庫,其中該一個或兩個或多個與轉接蛋白關聯的功能結構域中的至少一個具有一種或多種活 性,該等活性包括甲基化酶活性、脫甲基化酶活性、轉錄活化活性、轉錄阻抑活性、轉錄釋放因子活性、組蛋白修飾活性、RNA切割活性、DNA切割活性或核酸結合活性。在一方面,本發明提供了如在此討論的文庫,其中該一個或多個與Cas9酶關聯的功能結構域具有一種或多種活性,該等活性包括甲基化酶活性、脫甲基化酶活性、轉錄活化活性、轉錄阻抑活性、轉錄釋放因子活性、組蛋白修飾活性、RNA切割活性、DNA切割活性、核酸結合活性、或分子開關活性或化學可誘導性或光可誘導性。在一方面,本發明提供了如在此討論的文庫,其中該DNA切割活性係Fok1核酸酶。在一方面,本發明提供了如在此討論的文庫,其中該一個或多個功能結構域附接至該Cas9酶,這樣使得當結合至該gRNA和靶標時,該功能結構域處於空間定向,從而允許該功能結構域在其屬性功能中起作用。在一方面,本發明提供了如在此討論的文庫,其中該gRNA被修飾成使得,在gRNA結合轉接蛋白並且進一步結合至該Cas9酶和靶標之後,該功能結構域處於空間定向,從而允許該功能結構域在其屬性功能中起作用。在一方面,本發明提供了如在此討論的文庫,其中該一個或多個與Cas9酶關聯的功能結構域被附接到Cas9酶的N末端上。在一方面,本發明提供了如在此討論的文庫,其中該一個或多個與Cas9酶關聯的功能結構域被附接到FnCas9蛋白的RuvC或任何與該等結構域對應的異種同源物上。在一方面,本發明提供了如在此討論的文庫,其中該gRNA的同向重複係藉由插入不同的RNA序列而進行修飾的。在一方面,本發明提供了如在此討論的文庫,其中插入的結合至一種或多種轉接蛋白的一個或多個不同RNA序列係適配體序列。在一方面,本發明提供了如在此討論的文庫,其中該適配體序列係對相同轉接蛋白具有特異性的兩個或更多個 適配體序列。在一方面,本發明提供了如在此討論的文庫,其中該適配體序列係對不同轉接蛋白具有特異性的兩個或更多個適配體序列。在一方面,本發明提供了如在此討論的文庫,其中該轉接蛋白包括MS2、PP7、Qβ、F2、GA、fr、JP501、M12、R17、BZ13、JP34、JP500、KU1、M11、MX1、TW18、VK、SP、FI、ID2、NL95、TW19、AP205、ΦCb5、ΦCb8r、ΦCb12r、ΦCb23r、7s、PRR1。在一方面,本發明提供了如在此討論的文庫,其中該細胞群係真核細胞群。在一方面,本發明提供了如在此討論的文庫,其中該真核細胞係哺乳動物細胞、植物細胞或酵母細胞。在一方面,本發明提供了如在此討論的文庫,其中該哺乳動物細胞係人類細胞。在一方面,本發明提供了如在此討論的文庫,其中該細胞群係胚胎幹(ES)細胞群。在一方面,本發明提供了如在此討論的文庫,其中基因組座位中的靶序列係非編碼序列。在一方面,本發明提供了如在此討論的文庫,其中藉由所述靶向來改變一種或多種基因產物的基因功能;或其中關於基因功能,存在功能獲得;或其中關於基因功能,存在功能改變;或其中關於基因功能,存在功能降低;或其中篩選針對非編碼RNA或潛在調節區(例如,增強子、抑制蛋白)。在一方面,本發明提供了如在此討論的文庫,其中所述靶向導致基因功能的敲除。在一方面,本發明提供了如在此討論的文庫,其中該靶向具有約100或更多個序列。在一方面,本發明提供了如在此討論的文庫,其中該靶向具有約1000或更多個序列。在一方面,本發明提供了如在此討論的文庫,其中該靶向具有約20,000或更多個序列。在一方面,本發明提供了如在此討論的文庫,其中該靶向具有整個基因組。在一方面,本發明提供了如在此討論的文庫,其中該靶向具有一系列聚焦於相關或令人希望的途徑的靶序列。在一方 面,本發明提供了如在此討論的文庫,其中該途徑係免疫途徑。在一方面,本發明提供了如在此討論的文庫,其中該途徑係細胞分裂途徑。在一方面,本發明提供了如在此討論的文庫,其中基因功能的改變包括:向細胞群中的每個細胞中引入具有一種或多種包含工程化的、非天然存在的Cas9 CRISPR-Cas系統的載體的載體系統,該系統包括:I. Cas9蛋白,和II.一種或多種類型的Cas9指導RNA,其中組分I和II可以是相同或在不同載體系統上,將組分I和II整合到每個細胞中,其中該指導序列靶向每個細胞中的獨特基因,其中該Cas9蛋白可操作地連接至調節元件上,其中在轉錄時,包括該指導序列的指導RNA引導Cas9 CRISPR-Cas系統與該獨特基因的基因組座位中的靶序列的序列特異性結合,藉由該Cas9蛋白誘導該基因組座位的切割,並且證實細胞群的每個細胞中的多個獨特基因中的不同突變,由此產生突變細胞文庫。在一方面,本發明提供了如在此討論的文庫,其中該一種或多種載體係質粒載體。在一方面,本發明提供了如在此討論的文庫,其中該調節元件係誘導型啟動子。在一方面,本發明提供了如在此討論的文庫,其中該誘導型啟動子可以是多西環素誘導型啟動子。在一方面,本發明提供了如在此討論的文庫,其中藉由全外顯子組定序來證實不同突變。在一方面,本發明提供了如在此討論的文庫,其中在100或更多個獨特基因中實現突變。在一方面,本發明提供了如在此討論的文庫,其中在1000或更多個獨特基因中實現突變。在一方面,本發明提供了如在此討論的文庫,其中在20,000或更多個獨特基因中實現突變。在一方面,本發明提供了如在此討論的文庫,其中在整個基因組中實現突變。在一方面,本發明提供了如在此討論的文庫,其中在多個獨特基因中實現基因功能的改變,該等獨特基因在特定 生理途徑或狀態下發揮作用。在一方面,本發明提供了如在此討論的文庫,其中該途徑或狀態係免疫途徑或狀態。在一方面,本發明提供了如在此討論的文庫,其中該途徑或狀態係細胞分裂途徑或狀態。在一方面,本發明提供了如在此討論的文庫,其中第一轉接蛋白與p65結構域關聯並且第二轉接蛋白與HSF1結構域關聯。在一方面,本發明提供了如在此討論的文庫,其中每個Cas9 CRISPR-Cas複合物具有至少三個功能結構域,其中至少一個與Cas9酶關聯並且其中至少兩個與gRNA關聯。在一方面,本發明提供了如在此討論的文庫,其中基因功能的改變係敲除突變。
在一方面,本發明提供了一種用於功能篩選在離體或體內細胞池中基因組基因之方法,該方法包括給予或表現包括多個Cas9 CRISPR-Cas系統指導RNA(gRNA)的文庫,並且其中該篩選進一步包括使用Cas9酶,其中該CRISPR複合物被修飾成包括異源功能結構域。在一方面,本發明提供了用於篩選基因組之方法,該方法包括向宿主給予或在宿主體內表現文庫。在一方面,本發明提供了如本文討論之方法,該方法進一步包括給予該宿主的或在該宿主中表現的活化蛋白。在一方面,本發明提供了如在此討論之方法,其中活化蛋白附接至Cas9酶上。在一方面,本發明提供了如在此討論之方法,其中活化蛋白附接至Cas9酶的N末端或C末端上。在一方面,本發明提供了如在此討論之方法,其中活化蛋白附接至Cas9 CRISPR gRNA同向重複上。在一方面,本發明提供了如在此討論之方法,該方法進一步包括向宿主給予或在宿主中表現的抑制蛋白。在一方面,本發明提供了如本文討論之方法,其中該篩選包括在該座位中影響並檢測基因活化、基因抑制、或切割。在一方面, 本發明提供了如本文討論之方法,其中該宿主係真核細胞。在一方面,本發明提供了如在此討論之方法,其中該宿主係哺乳動物細胞、酵母細胞或植物細胞。在一方面,本發明提供了如在此討論之方法,其中該宿主係非人類真核生物。在一方面,本發明提供了如在此討論之方法,其中該非人類真核生物係非人哺乳動物。在一方面,本發明提供了如在此討論之方法,其中該非人哺乳動物係小鼠。在一方面,本發明提供了如在此討論之方法,該方法包括遞送Cas9 CRISPR-Cas複合物或其一種或多種組分或用於編碼它們的一種或多種核酸分子,其中所述一種或多種核酸分子被操作性地連接至一個或多個調節序列上並且在體內進行表現。在一方面,本發明提供了如在此討論之方法,其中經由慢病毒、腺病毒、或AAV進行體內表現。在一方面,本發明提供了如本文討論之方法,其中該遞送係經由粒子、奈米粒子、脂質或細胞穿透肽(CPP)。
在一個方面,本發明提供了一對Cas9 CRISPR-Cas複合物,其各自包括Cas9指導RNA(gRNA),該指導RNA包括能夠雜交到細胞中感興趣的基因組座位中靶序列上的指導序列,其中所述gRNA係藉由插入結合至一種或多種轉接蛋白的一個或多個不同RNA序列而進行修飾的,並且其中該轉接蛋白與一個或多個功能結構域關聯,其中每個Cas9 CRISPR-Cas的每個gRNA包括具有DNA切割活性的功能結構域。在一個方面,本發明提供了如在此討論的成對Cas9 CRISPR-Cas複合物,其中DNA切割活性係由於Fok1核酸酶。
在本文方法和組成物的具體實施方式中,使用編碼經密碼子優化以用於在真核細胞中表現的Cas9蛋白的核苷酸序列。在一較佳的 實施方式中,該真核細胞係哺乳動物細胞,並且在一更較佳的實施方式中,該哺乳動物細胞係人類細胞、酵母細胞或植物細胞。可替代地,該真核細胞係植物細胞。在本發明的一另外的實施方式中,該基因產物的表現被降低。
在本文提供的方法和組成物的一些實施方式中,該Cas9酶係胺基酸球菌屬BV3L6、毛螺菌科(Lachnospiraceae)細菌MA2020或新殺手土拉熱弗朗西絲菌1(Francisella tularensis 1 Novicida)Cas9,並且可以包括衍生自該等生物的突變Cas9。該酶可以是一種Cas9同系物或異種同源物。
在一個方面,本發明提供了產生包含具有修飾的表現的基因的模式真核細胞之方法。在一些實施方式中,疾病基因係與患有或產生一種疾病的風險的增加相關聯的任何基因。在一些實施方式中,該方法包括(a)向真核細胞中引入上文所述的一種或多種載體,以及(b)允許CRISPR複合物結合到靶多核苷酸上以便修飾遺傳基因座,由此產生包含修飾的遺傳基因座的模式真核細胞。
在一個方面,本發明提供了一種用於研發生物活性劑之方法,該生物活性劑調製與疾病基因相關的細胞傳訊事件。在一些實施方式中,疾病基因係與患有或產生疾病的風險的增加相關聯的任何基因。在一些實施方式中,該方法包括(a)使測試化合物與所述實施方式中的任一項的模式細胞接觸;並且(b)檢測讀數變化,該變化指示與所述疾病基因的所述突變關聯的細胞傳訊事件的減少或增加,從而開發調製與所述疾病基因關聯的所述細胞傳訊事件的所述生物活性劑。
本發明包括優化的功能性CRISPR-Cas Cas9酶系統,尤其是結合本發明修飾的指導物,並且另外其中該Cas9酶還與功能結構域關聯。具體而言,該Cas9酶包括使其轉化成DNA結合蛋白的一個或多個突變,展現出感興趣的功能的功能結構域可以募集或附加或插入或附接至其上。在某些實施方式中,該Cas9酶包含一個或多個突變和/或一個或多個突變在該Cas9的RuvC1結構域中或者為如本文另外論述的突變。在一些實施方式中,該Cas9酶具有一個或多個在催化結構域中的突變,其中在轉錄時,該指導序列指導CRISPR複合物與該靶序列的序列特異性結合,並且其中該酶進一步包含一個功能結構域。在一些實施方式中,根據FnCas9蛋白的在E1006處的突變係較佳的。
本文提供的結構資訊允許探詢指導RNA與靶DNA和Cas9酶的相互作用,從而允許工程化或改變指導RNA結構,以優化整個Cas9 CRISPR-Cas系統的功能性。例如,藉由插入可結合至RNA上的轉接蛋白,可以擴展指導RNA的環,而不與Cas9蛋白衝突。該等轉接蛋白可以進一步募集包括一個或多個功能結構域的效應蛋白或融合。
在一些較佳的實施方式中,該功能結構域係轉錄活化結構域,較佳的是VP64。在一些實施方式中,該功能結構域係轉錄抑制結構域,較佳的是KRAB。在一些實施方式中,該轉錄抑制結構域係SID、或SID的多聯體(例如SID4X)。在一些實施方式中,該功能結構域係表觀遺傳修飾結構域,從而提供了表觀遺傳修飾酶。在一些實施方式中,該功能結構域係活化結構域,其可以是P65活化結構域。
本發明的一方面係上述元件被包含在單個組成物中或被 包含在單獨的組成物中。該等組成物可以有利地被應用於宿主,以在基因組水平上引出功能效應。
一般來說,以為包括一個或多個功能結構域(例如,經由融合蛋白)的轉接蛋白提供其結合的特異性結合位點(例如,適配體)的方式對指導RNA進行修飾。對修飾的指導RNA進行修飾,這樣使得一旦該指導RNA形式CRISPR複合物(即,Cas9酶結合至指導RNA和靶),轉接蛋白結合並且,轉接蛋白上的功能結構域被定位成空間定向,這有利於屬性功能起效。例如,如果該功能結構域係轉錄活化蛋白(例如,VP64或p65),該轉錄活化蛋白被置於空間定向,這允許它能夠影響靶標的轉錄。同樣地,轉錄抑制蛋白將被有利地定位為影響靶標的轉錄,並且核酸酶(例如Fok1)將被有利地定位為切割或部分裂解該靶標。
熟習該項技術者理解的是,對指導RNA進行允許結合銜接子+功能結構域但不適當定位該銜接子+功能結構域(例如,由於CRISPR複合物三維結構的位阻)的修飾不是預期的修飾。藉由引入同向重複的5’、在同向重複內、或指導序列的3’的一個或多個不同RNA序列,可以對一個或多個修飾的指導RNA進行修飾。
如在此解釋的,該等功能結構域可以是,例如,來自下組的一個或多個結構域,該組由以下各項組成:甲基化酶活性、脫甲基化酶活性、轉錄活化活性、轉錄阻抑活性、轉錄釋放因子活性、組蛋白修飾活性、RNA切割活性、DNA切割活性、核酸結合活性、以及分子開關(例如,光誘導型)。在一些情況下,有利的是另外提供至少一個NLS。在一些情況下,有利的是將該NLS定位在N末端。當包括超過一個功能結 構域時,該等功能結構域可以是相同的或不同的。
指導RNA可以被設計成包括對相同或不同轉接蛋白具有特異性的多個結合識別位點(例如,適配體)。Cas9酶的指導RNA的特徵在於,它典型地是37-43個核苷酸,並且在於它僅包含一個莖環。指導RNA可以被設計成結合至轉錄起始位點(即TSS)上游啟動區-1000-+1個核酸,較佳的是-200個核酸。這種定位改進了影響基因活化(例如,轉錄活化蛋白)或基因抑制(例如,轉錄阻抑物)的功能結構域。修飾的指導RNA可以是靶向包含在組成物中的一個或多個靶座位(例如,至少1個指導RNA、至少2個指導RNA、至少5個指導RNA,至少10個指導RNA、至少20個指導RNA、至少30個指導RNA、至少50個指導RNA)的一個或多個修飾的指導RNA。
另外,當使核酸酶活性失活(例如,與野生型酶相比,核酸酶失活至少70%、至少80%、至少90%、至少95%、至少97%、或100%;或者換句話說,有利地具有非突變或野生型Cas9酶約0%的核酸酶活性、或非突變或野生型Cas9酶不超過約3%或約5%或約10%的核酸酶活性的Cas9酶)時,具有降低的核酸酶活性的Cas9酶係最有效的。藉由將突變引入到FnCas9或其異種同源物的RuvC核酸酶結構域中,這係可能的。例如,利用選自下組的殘基突變,該組由以下各項組成:如在FnCas9中的D917A、E1006A、E1028A、D1227A,D1255A或N1257,並且更較佳的是,引入選自下組的一種或多種突變,該組由以下各項組成:FnCas9或對應的異種同源物的位置D917A、E1006A、E1028A、D1227A、D1255A、N1257A、D917A、E1006A、E1028A、D1227A、D1255A以及N1257。在 具體實施方式中,突變係具有在FnCas9中的E1006A的D917A。
失活的Cas9酶可以與一個或多個功能結構域相關聯(例如,經由融合蛋白),像例如,如在此對於修飾的指導RNA轉接蛋白所描述的,包括例如,來自下組的一個或多個結構域,該組由以下各項組成:甲基化酶活性、脫甲基化酶活性、轉錄活化活性、轉錄阻抑活性、轉錄釋放因子活性、組蛋白修飾活性、RNA切割活性、DNA切割活性、核酸結合活性、以及分子開關(例如,光誘導型)。較佳的結構域係Fok1、VP64、P65、HSF1、MyoD1。在提供Fok1的事件中,有利的是提供多個Fok1功能結構域以允許功能性二聚體,以及指導RNA被設計為針對功能用途(Fok1)提供適當間隔,如具體描述於蔡(Tsai)等人,《自然生物技術》(Nature Biotechnology),第32卷,第6期,2014年6月)中。轉接蛋白可以利用已知的接頭來附接此類功能結構域。在一些情況下,有利的是另外提供至少一種NLS。在一些情況下,有利的是將該NLS定位在N末端。當包括超過一個功能結構域時,該等功能結構域可以是相同的或不同的。
一般來說,一個或多個功能結構域定位在滅活的Cas9酶上允許正確的空間定向,使得功能結構域影響具有屬性功能效應的靶標。例如,如果該功能結構域係轉錄活化蛋白(例如,VP64或p65),該轉錄活化蛋白被置於空間定向,這允許它能夠影響靶標的轉錄。同樣地,轉錄阻抑物將被有利地定位以影響靶標的轉錄,並且核酸酶(例如,Fok1)將被有利地定位以切割或部分切割該靶標。這可以包括除Cas9酶的N-/C-末端之外的位置。
轉接蛋白可以是結合至引入到修飾的指導RNA中的適配 體或識別位點上並且允許正確定位一個或多個功能結構域的任何數量的蛋白質,一旦該指導RNA已經被結合到CRISPR複合物中,以影響具有屬性功能的靶標。如在本申請中所詳細解釋的,此類可以是外殼蛋白,較佳的是噬菌體外殼蛋白。與這樣的轉接蛋白(例如呈融合蛋白的形式)相關聯的功能結構域可以包括例如來自下組的一個或多個結構域,該組由以下各項組成:修飾烷酶活性、去甲酶活性、轉錄活化活性、轉錄抑制活性、轉錄釋放因子活性、組蛋白修飾活性、RNA切割活性、DNA切割活性、核酸結合活性、以及分子開關(例如光誘導型)。較佳的結構域係Fok1、VP64、P65、HSF1、MyoD1。在該功能結構域係轉錄活化蛋白或轉錄阻抑因子的情況下,有利的是另外提供至少一個NLS並且較佳的是在N末端處。當包括超過一個功能結構域時,該等功能結構域可以是相同的或不同的。該轉接蛋白可以利用已知接頭來附接這樣的功能結構域。
因此,修飾的指導RNA、失活的Cas9酶(具有或不具有功能結構域)、以及具有與一個或多個功能結構域的結合蛋白,可以各自單獨包含在組成物中並單獨地或共同地給予至宿主。可替代地,可以將該等組分提供於單一組成物中用於給予至宿主。可以經由熟習該項技術者已知的或本文描述的用於遞送到宿主的病毒載體(例如慢病毒載體、腺病毒載體、AAV載體)進行向宿主的給予。如本文所解釋的,使用不同的選擇標記(例如用於慢病毒gRNA選擇)和gRNA濃度(例如取決於是否使用多種gRNA)對於引出改進的效果而言可以是有利的。
在這個概念的基礎上,若干變化適於引出基因組座位事件,包括DNA切割、基因活化、或基因失活。使用所提供的組成物,熟 習該項技術者可以有利地且特異性地靶向具有相同或不同功能結構域的單個或多個座位,以引出一個或多個基因組座位事件。該等組成物可以按多種多樣的方法應用,用於在細胞中篩選文庫和在體內進行功能建模(例如lincRNA的基因活化和功能鑒定;功能獲得建模;功能缺失建模;使用本發明的組成物建立用於優化和篩選目的的細胞系和轉基因動物)。
本發明包括本發明的組成物用於建立和利用條件型或誘導型CRISPR轉基因細胞/動物的用途。(參見,例如,普萊特(Platt)等人,《細胞》(Cell)(2014),http://dx.doi.org/10.1016/j.cell.2014.09.014,或本文引用的PCT專利公開,如WO 2014/093622(PCT/US 2013/074667),其被認為不是先於本發明或申請)。例如,靶細胞有條件性地或誘導性地包括Cas9 CRISPR酶(例如,以Cre依賴性構建體的形式)和/或有條件性地或誘導性地包括轉接蛋白並且,在表現被引入進靶細胞中的載體時,該載體表現的是誘導或產生在靶細胞中Cas9酶表現和/或接合體表現的條件。藉由將該教授內容和本發明的組成物與已知用於產生CRISPR複合物的方法一起應用,受功能結構域影響的誘導型基因組事件也是本發明的一方面。這個方面的一個單單的實例係產生CRISPR敲入/條件型轉基因動物(例如,包括例如Lox-終止-polyA-Lox(LSL)盒的小鼠),並且隨後遞送提供如在此所描述的(例如,用被外殼蛋白(例如,MS2)識別的一種或多種適配體修飾的指導RNA)一種或多種修飾的指導RNA(例如,-200個核苷酸至感興趣的靶基因的TSS用於基因活化目的)、如在此所描述的一種或多種轉接蛋白(連接至一個或多個VP64上的MS2結合蛋白)、以及用於誘導條件型動物的手段(例如,用於使得Cas9 表現為誘導型的Cre重組酶)的一種或多種組成物。可替代地,轉接蛋白可以作為條件型或誘導型元件與條件型或誘導型Cas9酶提供,以便提供用於篩選目的的有效模型,這有利地對於大量應用僅需要最小限度的設計和特異gRNA給予。
鈍化的/失活的Cas蛋白
當Cas9蛋白具有核酸酶活性時,該Cas9蛋白可以被修飾以便具有降低的核酸酶活性,例如,與野生型酶相比,核酸酶失活至少70%、至少80%、至少90%、至少95%、至少97%、或100%;或者換句話說,有利地具有非突變或野生型Cas9酶或CRISPR酶約0%的核酸酶活性、或非突變或野生型Cas9酶(例如,非突變或野生型釀膿鏈球菌Cas9酶或CRISPR酶)不超過約3%或約5%或約10%的核酸酶活性的Cas9酶。藉由將突變引入到Cas9及其異種同源物的核酸酶結構域中,這係可能的。
失活的Cas9 CRISPR酶可以與一個或多個功能結構域相關聯(例如,經由融合蛋白),包括例如,來自下組的一個或多個結構域,該組包括以下各項、基本上由其組成、或由其組成:甲基化酶活性、脫甲基化酶活性、轉錄活化活性、轉錄阻抑活性、轉錄釋放因子活性、組蛋白修飾活性、RNA切割活性、DNA切割活性、核酸結合活性、以及分子開關(例如,光誘導型)。較佳的結構域係Fok1、VP64、P65、HSF1、MyoD1。在提供Fok1的事件中,有利的是提供多個Fok1功能結構域以允許功能性二聚體,以及sgRNA被設計為針對功能用途(Fok1)提供適當間隔,如具體描述於蔡(Tsai)等人,《自然生物技術》(Nature Biotechnology),第32卷,第6期,2014年6月)中。該轉接蛋白可以利用 已知接頭來附接這樣的功能結構域。在一些情況下,有利的是另外提供至少一種NLS。在一些情況下,有利的是將該NLS定位在N末端。當包括超過一個功能結構域時,該等功能結構域可以是相同的或不同的。
一般來說,一個或多個功能結構域定位在滅活的Cas9酶上允許正確的空間定向,使得功能結構域影響具有屬性功能效應的靶標。例如,如果該功能結構域係轉錄活化蛋白(例如,VP64或p65),該轉錄活化蛋白被置於空間定向,這允許它能夠影響靶標的轉錄。同樣地,轉錄阻抑物將被有利地定位以影響靶標的轉錄,並且核酸酶(例如,Fok1)將被有利地定位以切割或部分切割該靶標。這可以包括除CRISPR酶的N-/C-末端之外的位置。
在一實施方式中,Cas9可以包括一個或多個突變(並且因此編碼其的一個或多個核酸分子可以具有一個或多個突變)。該突變可以是人工引入的突變並且可包括但不限於催化結構域中的一個或多個突變。關於Cas9酶的催化結構域的實例可包括但不限於RuvC I、RuvC II、RuvC III以及HNH域。
在一個實施方式中,該Cas9可以包括一個或多個突變。該突變可以是人工引入的突變並且可包括但不限於催化結構域中的一個或多個突變,例如,以提供一切口酶。關於Cas酶的催化結構域的實例可包括但不限於RuvC I、RuvC II、RuvC III以及HNH域。
在一實施方式中,Cas9可以用作融合至或可操作地連接至功能結構域上的通用核酸結合蛋白。示例性的功能結構域可以包括但不限於:翻譯引發劑、翻譯活化蛋白、翻譯抑制蛋白、核酸酶,特別是核 糖核酸酶、剪接體、珠粒、光誘導型/可控型結構域或化學誘導型/可控型結構域。
在一些實施方式中,靶向未改性的核酸的效應蛋白可以具有切割活性。在一些實施方式中,該靶向RNA的效應蛋白可以指導在靶序列位置處或附近(例如在該靶序列之內和/或在該靶序列的互補物之內或在與該靶序列關聯的序列處)的一條或兩條核酸(DNA或RNA)股的切割。在一些實施方式中,靶向核酸的Cas9蛋白可指導距離靶序列的第一個或最後一個核苷酸約1、2、3、4、5、6、7、8、9、10、15、20、25、50、100、200、500個、或更多個鹼基對之內的一條或兩條DNA或RNA股的切割。在一些實施方式中,切割可以是平的,即由此產生平端。在一些實施方式中,切割可以是交錯的,即由此產生黏性末端。在一些實施方式中,切割可以是具有5’突出端(例如,1至5個核苷酸的5’突出端)的交錯切口。在一些實施方式中,切割可以是具有3’突出端(例如,1至5個核苷酸的3’突出端)的交錯切口。在一些實施方式中,載體編碼可相對於相應的野生型酶被突變的靶向核酸的Cas蛋白,使得該突變的靶向核酸的Cas蛋白缺乏切割含有靶序列的靶多核苷酸的一條或兩條DNA或RNA股的能力。作為一個另外的實例,Cas的兩個或更多個催化結構域(RuvC I、RuvC II、和RuvC III或該HNH結構域)可以被突變為產生實質上缺乏所有RNA切割活性的突變的Cas。如在此描述的,Cas9效應蛋白的對應催化結構域還可以被突變為產生缺乏所有DNA切割活性或具有實質上降低的DNA切割活性的突變的Cas9。在一些實施方式中,當該突變的酶的RNA切割活性不多於該酶的非突變形式的核酸切割活性的約25%、10%、5%、 1%、0.1%、0.01%、或更少時,則靶向核酸的效應蛋白可被考慮為實質上缺乏所有RNA切割活性;一實例可以是當突變形式的核酸切割活性與非突變形式相比係零或可忽略不計時。可以參考與來自II型CRISPR系統的具有多個核酸酶結構域的最大核酸酶共用同源性的酶的通用類別來鑒定一種效應蛋白。最較佳的是,該效應蛋白係II型蛋白,如Cas9。關於衍生,申請人意指該衍生的酶在很大程度上是基於與野生型酶具有高度序列同源性的含義,但是如本領域已知或如本文所述它在某些方面已經被突變(修飾)。
再一次,應當理解的是,術語Cas和CRISPR酶和CRISPR蛋白和Cas蛋白通常可互換地使用,並且在此參考的各方面同樣係指本申請中進一步描述的新穎的CRISPR效應蛋白,除非另外顯而易見的,如藉由具體參考Cas9。如上提及的,在本文中使用的許多殘基編號係指來自II型CRISPR座位的效應蛋白。然而,應當理解的是,本發明包括更多的來自其他微生物物種的效應蛋白。
作為Cas蛋白的可能來源的生物的列表
Cas蛋白可以包括來自以下屬的生物的Cas蛋白,該屬包括鏈球菌、彎曲桿菌、Nitratifractor、葡萄球菌、細小棒菌屬(Parvibaculum)、羅氏菌屬、奈瑟菌屬、葡糖醋桿菌屬、固氮螺菌屬、Sphaerochaeta、乳桿菌屬、真桿菌屬或棒狀桿菌屬。
Cas9蛋白可以包括來自以下屬的生物的Cas9蛋白,該屬包括鏈球菌、彎曲桿菌、Nitratifractor、葡萄球菌、細小棒菌屬(Parvibaculum)、羅氏菌屬、奈瑟菌屬、葡糖醋桿菌屬、固氮螺菌屬、 Sphaerochaeta、乳桿菌屬、真桿菌屬或棒狀桿菌屬。
較佳的實例包括釀膿鏈球菌、金黃色葡萄球菌。
在一實施方式中,Cas9蛋白可以是以下屬的生物的一異種同源物,該屬包括但不限於棒狀桿菌屬、薩特氏菌屬、軍團菌屬、密螺旋體屬、產線菌屬、真桿菌屬、鏈球菌屬、乳桿菌屬、支原體屬、擬桿菌屬、類桿菌屬、Flaviivola、黃質菌屬、Sphaerochaeta、固氮螺菌屬、葡糖醋桿菌屬、奈瑟菌屬、羅氏菌屬、細小棒菌屬(Parvibaculum)、葡萄球菌屬、Nitratifractor、支原體屬以及彎曲桿菌屬。這樣一種屬的生物的物種可以是如本文另外論述的。
一些鑒定CRISPR-Cas系統酶的異種同源物的方法可涉及鑒定感興趣的基因組中的tracr序列。鑒定tracr序列可涉及以下步驟:在一個資料庫中搜索該等同向重複或tracr配對序列以鑒定包括一CRISPR酶的CRISPR區域。在該CRISPR酶有義和反義兩個方向的側翼的CRISPR區域中搜索同源序列。尋找轉錄終止子以及二級結構。將不是一同向重複或tracr配對序列但與tracr配對序列的同向重複具有超過50%一致性的任何序列鑒定為一可能的tracr序列。取該可能的tracr序列並且分析與其相關的轉錄終止子序列。
應當理解的是,可以將在此描述的任何功能性工程化到來自其他異種同源物的CRISPR酶中,包括包含來自多個異種同源物的片段的嵌合酶。此類異種同源物的實例係在此其他地方所述的。因此,嵌合酶可以包括以下生物的CRISPR酶異種同源物的片段,該生物包括但不限於棒狀桿菌屬、薩特氏菌屬、軍團菌屬、密螺旋體屬、產線菌屬、真桿 菌屬、鏈球菌屬、乳桿菌屬、支原體屬、擬桿菌屬、類桿菌屬、Flaviivola、黃質菌屬、Sphaerochaeta、固氮螺菌屬、葡糖醋桿菌屬、奈瑟菌屬、羅氏菌屬、細小棒菌屬(Parvibaculum)、葡萄球菌屬、Nitratifractor、支原體屬以及彎曲桿菌屬。嵌合酶可以包括第一片段和第二片段,並且該等片段可以是本文提到的屬的生物的CRISPR酶異種同源物或本文提到的物種的片段;有利的是,該等片段來自不同物種的CRISPR酶異種同源物。
為了將毒性和脫靶效應降低到最低限度,重要的是控制所遞送的CRISPR酶mRNA和指導RNA的濃度。CRISPR酶mRNA和指導RNA的最佳濃度可以藉由在細胞或動物模型中測試不同的濃度並且使用深度定序分析在潛在的脫靶基因組座位處的修飾的範圍而確定。例如,對於靶向人類基因組的EMX1基因中的5’-GAGTCCGAGCAGAAGAAGAA-3’的指導序列,可以使用深度定序來評定在下列兩個脫靶位點處的修飾水平,1:5’-GAGTCCTAGCAGGAGAAGAA-3’和2:5’-GAGTCTAAGCAGAAGAAGAA-3’。對於體內遞送,應當選擇產生最高的中靶修飾水平同時使脫靶修飾水平最小化的濃度。
遞送:用於DNA/RNA或DNA/DNA或RNA/RNA或蛋白/RNA的選項
在一些實施方式中,CRISPR系統的組分可以不同形式進行遞送,如DNA/RNA或RNA/RNA或蛋白RNA的組合。例如,Cas9可以作為編碼DNA的多核苷酸或編碼RNA的多核苷酸或作為蛋白進行遞送。指導物可以作為編碼DNA的多核苷酸或RNA進行遞送。設想了所有可能的組合,包括混合形式的遞送。
在一些實施方式中,所有此類組合(DNA/RNA或DNA/DNA或RNA/RNA或蛋白/RNA)。
在一些實施方式中,當以蛋白質形式遞送Cas9時,有可能將其與一種或多種指導物進行預裝配。
遞送:奈米線團(nanoclew)
另外,可以使用奈米線團(nanoclew)遞送CRISPR系統,例如如描述於孫(Sun)W等人,用於抗癌藥遞送的繭樣自降解的DNA線團(Cocoon-like self-degradable DNA nanoclew for anticancer drug delivery.),《美國化學會志》(J Am Chem Soc.)2014年10月22日;136(42):14722-5.doi:10.1021/ja5088024.電子版2014年10月13日中;或在孫(Sun)W等人,用於有效遞送用於基因組編輯的CRISPR-Cas9的自組裝的DNA線團(Self-Assembled DNA Nanoclews for the Efficient Delivery of CRISPR-Cas9 for Genome Editing.),《德國應用化學英文國際版》(Angew Chem Int Ed Engl.),2015年10月5日;54(41):12029-33.doi:10.1002/anie.201506030.電子版2015年8月27日中。
遞送-GalNAc
CRISPR複合物組分可以藉由與運輸部分綴合或關聯進行遞送(例如從揭露於美國專利案號8,106,022;8,313,772中的方法改適的,其藉由引用結合在此)。核酸遞送策略可以例如用於改進指導RNA、或信使RNA或編碼CRISPR複合物組分的編碼DNA(包括CRISPR蛋白)的遞送。例如,RNA可以結合修飾的RNA核苷酸以改進穩定性、減少免疫刺激、和/或改進特異性(參見德利維(Deleavey),葛籣(Glen)F.等人, 2012,《化學與生物學》(Chemistry & Biology),第19卷,第8期,937-954;紮利平斯(Zalipsky),1995,《先進藥物遞送評論》(Advanced Drug Delivery Reviews)16:157-182;凱裡薩提(Caliceti)和維羅納(Veronese),2003,《先進藥物遞送評論》(Advanced Drug Delivery Reviews),55:1261-1277)。已經描述了不同構建體可以用於修飾核酸(如gRNA),以便更有效的遞送,如可以適用於修飾gRNA的可逆的電荷中和磷酸三酯骨架修飾,從而使得更加疏水並且非陰離子化,由此改善細胞進入(米德(Meade)BR等人,2014,《自然生物技術》(Nature Biotechnology)32,1256-1261)。在另外的替代實施方式中,所選擇的RNA模體可以用於介導細胞轉染(麥哲倫(Magalhães)M等人,《分子治療》(Molecular Therapy)(2012);20 3,616-624)。類似地,適配體可以被適配成用於遞送CRISPR複合物組分,例如藉由將適配體附加到gRNA上(譚(Tan)W等人,2011,《生物技術趨勢》(Trends in Biotechnology),2011年12月,第29卷,第12期)。
在一些實施方式中,將三分支N-乙醯半乳糖胺(GalNAc)綴合至寡核苷酸組分可以用於改進遞送,例如遞送至選擇細胞類型(例如肝細胞)(參見WO 2014118272,其藉由引用結合在此;奈爾(Nair),JK等人,2014,《美國化學會志》(Journal of the American Chemical Society),136(49),16958-16961)。這可以被認為是基於糖的粒子,並且在相應標題下在此提供了關於其他粒子遞送系統和/或配製物的另外的細節。因此,GalNAc可以被認為是在本文所描述的其他粒子意義上的粒子,這樣使得一般用途和其他考慮(例如,所述粒子的遞送)也適用於GalNAc 粒子。液相綴合策略可以例如用於將活化為PFP(五氟苯基)酯的三分支GalNAc簇(mol.wt.~2000)附接到5'-己基胺基修飾的寡核苷酸(5'-HA ASOs,mol.wt.~8000Da;奧斯德爾格(
Figure 112128864-A0101-12-0410-185
stergaard)等人,《生物共軛化學》(Bioconjugate Chem.),2015,26(8),第1451-1455頁)上。類似地,已經描述聚(丙烯酸酯)聚合物用於體內核酸遞送(參見WO 2013158141,其藉由引用結合在此)。在另外的替代實施方式中,可以將CRISPR奈米粒子(或蛋白複合物)與天然存在的血清蛋白預混合使用,以便改進遞送(阿肯克(Akinc)A等人,2010,《分子治療》(Molecular Therapy),第18卷,第7期,1357-1364)。
例如藉由篩選化學品文庫,篩選技術可以用來鑒別遞送增強劑(吉樂朗(Gilleron)J.等人,2015,《核酸研究》(Nucl.Acids Res.)43(16):7984-8001)。多種方法也已被描述用於評估遞送載體的效率,如脂質奈米粒子,其可以用於鑒別用於CRISPR組分的有效遞送載體(參見沙海(Sahay)G.等人,2013,《自然生物技術》(Nature Biotechnology),31,653-658)。
在一些實施方式中,可以藉由將功能肽添加至蛋白質(例如,改變蛋白疏水性的肽)來促進蛋白CRISPR組分的遞送,例如以便改進體內功能性。CRISPR複合物組分蛋白可以類似地被修飾以便促進隨後的化學反應。例如,可以將胺基酸添加到具有經歷點擊化學的基團的蛋白上(尼克奇(Niki
Figure 112128864-A0101-12-0410-188
)I.等人,2015,《自然工具》(Nature Protocols),10,780-791)。在這種類型的實施方式中,然後點擊化學基團可以用於添加多種多樣的替代結構(如聚(乙二醇))以用於穩定性、細胞穿透肽、 RNA適配體、脂質、或碳水化合物(如GalNAc)。在另外的替代方案中,例如藉由將細胞穿透肽添加到蛋白上,CRISPR複合物組分蛋白可以被修飾以使蛋白適配成用於細胞進入(參見斯萬森(Svensen)等人,2012,《藥理學趨勢》(Trends in Pharmacological Sciences),第33卷,第4期)(參見考夫曼(Kauffman),W.伯克利(Berkeley)等人,2015,《生物化學趨勢》(Trends in Biochemical Sciences),第40卷,第12冊,749-764;科倫(Koren)和特其林(Torchilin),2012,《分子醫學趨勢》(Trends in Molecular Medicine),第18卷,第7期)。在另外的替代實施方式中,可以用有助於稍後遞送CRISPR複合物組分的化合物或配製物預處理患者或受試者。
可誘導系統
在一些實施方式中,CRISPR酶可以形成可誘導系統的組分。該系統的誘導性質將允許該系統利用一能量形式對基因編輯或基因表現進行時空控制。該能量形式可以包括但不限於,電磁輻射、聲能、化學能和熱能。可誘導系統的實例包括四環素誘導型啟動子(Tet-開(Tet-On)或Tet-關(Tet-Off))、小分子雙雜交體轉錄活化系統(FKBP、ABA等)或光可誘導系統(光敏素、LOV結構域或隱花色素)。在一實施方式中,該CRISPR酶可以是以序列特異性方式指導轉錄活性的變化的光誘導的轉錄效應因子(LITE)的一部分。光的組分可以包括CRISPR酶、光響應細胞色素異二聚體(例如,來自擬南芥)、以及轉錄活化/抑制結構域。誘導型DNA結合蛋白和關於使用它們的方法的其他實例提供在US 61/736,465、US 61/721,283以及WO 2014/018423中,特此藉由引用以其全文併入。
自行失活性系統
一旦在細胞的基因組中一種基因的所有拷貝已經被編輯,在該細胞中CRISRP/Cas9繼續表現不再係必需的。事實上,持續表現在未預期的基因組位點等處的脫靶效應的情況下會係不令人希望的。因此時間限制性表現會係有用的。誘導型表現提供了一種方法,但是此外申請人已經工程化自行失活性CRISPR-Cas9系統,該系統依賴於在該CRISPR載體本身內使用非編碼指導靶序列。因此,表現開始後,該CRISPR系統將導致其自身的破壞,但是在破壞完成之前,它將有時間編輯靶基因的基因組拷貝(在二倍體細胞中具有正常點突變的情況下,需要至多兩個編輯)。簡單地,該自行失活性CRISPR-Cas系統包括另外的RNA(即指導RNA),該RNA靶向CRISPR酶本身的編碼序列或者靶向與存在於以下項的一個或多個中的獨特序列互補的一種或多種非編碼指導靶序列:
(a)在驅動非編碼RNA元件的表現的啟動子內,
(b)在驅動Cas9基因的表現的啟動子內,
(c)在Cas9編碼序列中的ATG翻譯起始密碼子的100bp內,
(d)在病毒遞送載體的例如AAV基因組中的反向末端重複(iTR)內。
另外,該RNA可以經由載體遞送,例如編碼CRISPR複合物的單獨的載體或相同的載體。當由單獨的載體提供時,靶向Cas表現的CRISPR RNA可以順序地或同時地給予。當順序給予時,靶向Cas表現的 CRISPR RNA係在旨在用於例如基因編輯或基因工程的CRISPR RNA之後被遞送。此時期可以是數分鐘時期(例如5分鐘,10分鐘,20分鐘,30分鐘,45分鐘,60分鐘)。此時期可以是數小時時期(例如2小時,4小時,6小時,8小時,12小時,24小時)。此時期可以是數天時期(例如2天,3天,4天,7天)。此時期可以是數周時期(例如2周,3周,4周)。此時期可以是數月時期(例如2個月,4個月,8個月,12個月)。此時期可以是數年時期(例如2年,3年,4年)。以此方式,Cas酶與能夠雜交到第一靶標(例如一個基因組座位或多個感興趣座位)上的第一gRNA/chiRNA關聯,並且承擔CRISPR-Cas系統的所希望的一種或多種功能(例如基因工程);並且隨後該Cas酶可以然後與能夠雜交到包含Cas或CRISPR盒的至少部分的序列上的第二gRNA/chiRNA關聯。在gRNA/chiRNA靶向編碼Cas蛋白的表現的序列的情況下,該酶變得受阻礙並且該系統變為自行失活性。以相同方式,經由例如如在此解釋的脂質體、脂質轉染、粒子、微囊泡來應用的靶向Cas表現的CRISPR RNA可以順序地或同時地給予。類似地,自失活可以用於用以靶向一種或多種靶標的一種或多種指導RNA的失活。
在一些方面,提供單一gRNA,該單一gRNA能夠雜交到CRISPR酶起始密碼子的序列下游,借此在一段時間之後CRISPR酶表現有損失。在一些方面,提供一種或多種gRNA,所述gRNA能夠雜交到編碼CRISPR-Cas系統的多核苷酸的一種或多種編碼區或非編碼區,借此在一段時間之後CRISPR-Cas系統的一種或多種或者在一些情況下全部失活。在該系統的一些方面,並且不受理論限制,該細胞可以包含多種 CRISPR-Cas複合物,其中CRISPR複合物的第一子集包含能夠靶向有待編輯的一個或多個基因組座位的第一chiRNA,並且CRISPR複合物的第二子集包含能夠靶向編碼CRISPR-Cas系統的多核苷酸的至少一種第二chiRNA,其中CRISPR-Cas複合物的第一子集介導對靶向的一個或多個基因組座位的編輯,並且CRISPR複合物的第二子集最終使CRISPR-Cas系統失活,由此使細胞中進一步的CRISPR-Cas表現失活。
因此,本發明提供了一種CRISPR-Cas系統,包括一種或多種用於遞送至真核細胞的載體,其中該一種或多種載體編碼:(i)CRISPR酶;(ii)第一指導RNA,該第一指導RNA能夠雜交到細胞中的靶序列上;(iii)第二指導RNA,該第二指導RNA能夠雜交到編碼CRISPR酶的載體中的一種或多種靶序列上;(iv)至少一種tracr配對序列;以及(v)至少一種tracr序列,該第一和第二複合物可以使用相同的tracr和tracr配對,因此區別僅在於指導序列,其中當在細胞內表現時:該第一指導RNA引導第一CRISPR複合物與細胞中的靶序列的序列特異性結合;該第二指導RNA引導第二CRISPR複合物與編碼CRISPR酶的載體中的靶序列的序列特異性結合;該等CRISPR複合物包含(a)雜交到tracr序列上的該tracr配對序列,以及(b)結合到該指導RNA上的CRISPR酶,使得指導RNA可以結合到其靶序列上;並且該第二CRISPR複合物使CRISPR-Cas系統失活以防止該細胞對CRISPR酶繼續表現。
在本文中的其他地方揭露了該一種或多種載體、該編碼的酶、該指導序列等的另外特徵。例如,一種或多種指導序列的一者或兩者可以是chiRNA序列的部分,該chiRNA序列在單RNA內提供了指導、 tracr配對和tracr序列,這樣使得該系統可以編碼(i)CRISPR酶;(ii)第一chiRNA,其包含能夠雜交到細胞中的第一靶序列上的序列、第一tracr配對序列、和第一tracr序列;(iii)第二指導RNA,其能夠雜交到編碼CRISPR酶、第二tracr配對序列、和第二tracr序列的載體上。類似地,該酶可以包括一個或多個NLS等。
該等不同的編碼序列(CRISPR酶、指導RNA、tracr和tracr配對)可以被包括在單一載體上或多種載體上。例如,有可能在一個載體上編碼該酶,並且在另一個載體上編碼不同的RNA序列,或者有可能在一個載體上編碼該酶並且編碼一個chiRNA,並且在另一個載體上編碼其餘chiRNA,或者任何其他排列。總體上,使用總計一種或兩種不同載體的系統係較佳的。
在使用多種載體的情況下,有可能以不等數目遞送它們,並且理想地採用相對於第二指導RNA而言的過量的編碼第一指導RNA的載體,由此有助於延遲CRISPR系統的最終失活,直至基因組編輯已經具有發生的機會。
該第一指導RNA可以靶向基因組內的任何感興趣靶序列,如在此其他地方所述。該第二指導RNA靶向編碼CRISPR Cas9酶的載體內的序列,並且由此使來自該載體的酶表現失活。因此在載體中的靶序列必須能夠使表現失活。適合的靶序列可以是例如接近Cas9編碼序列的翻譯起始密碼子或在其內,在驅動非編碼RNA元件的表現的啟動子中的非編碼序列中,在驅動Cas9基因的表現的啟動子內,在Cas9編碼序列中的ATG翻譯起始密碼子的100bp內,和/或在病毒遞送載體的例如在 AAV基因組中的反向末端重複(iTR)內。在此區附近的雙股斷裂可以誘導Cas9編碼序列中的移碼,導致蛋白表現的損失。“自行失活性”指導RNA的可替代靶序列目的在於編輯/失活多個表現CRISPR-Cas9系統所需的或者載體穩定性所需的調節區/序列。例如,如果Cas9編碼序列的啟動子被破壞,則轉錄可以被抑制或阻止。類似地,如果載體包括用於複製、維持或穩定性的序列,則有可能靶向該等。例如,在AAV載體中,有用的靶序列係在iTR內。其他用以靶向的有用序列可以是啟動子序列、聚腺苷酸化位點等。
另外,如果指導RNA以陣列形式表現,同時靶向兩種啟動子的“自行失活性”指導RNA將導致從CRISPR-Cas表現構建體切除間插核苷酸,有效地導致其完全失活。類似地,在指導RNA靶向兩種ITR或同時靶向兩種或更多種其他CRISPR-Cas組分的情況下,間插核苷酸的切除將產生。總體上如在此解釋的自失活採用用以提供CRISPR-Cas9的調節的CRISPR-Cas9系統係可應用的。例如,如在此解釋的自失活可以應用至突變例如擴增障礙的CRISPR修復,如在此解釋的。作為該自失活的結果,CRISPR修復僅是暫態有活性的。
將非靶向核苷酸添加至“自行失活性”指導RNA的5’端(例如1-10個核苷酸,較佳的是1-5個核苷酸)可以用於延遲其加工和/或修飾其效力,作為確保在CRISPR-Cas9停止之前在靶向的基因組座位處進行編輯的手段。
在自行失活性AAV-CRISPR-Cas9系統的一個方面,共表現靶向感興趣基因組序列(例如1-2、1-5、1-10、1-15、1-20、1-30)的 一種或多種sgRNA的質粒可以用“自行失活性”sgRNA建立,所述“自行失活性”sgRNA靶向在工程化的ATG起始位點處或附近(例如,在5個核苷酸內,在15個核苷酸內,在30個核苷酸內,在50個核苷酸內,在100個核苷酸內)的SpCas9序列。在U6啟動子區中的調節序列還可以用sgRNA靶向。U6驅動的sgRNA可以按陣列形式設計,使得多種sgRNA序列可以同時釋放。當首次遞送到靶組織/細胞(左細胞)中,sgRNA開始累積,同時在細胞核中的Cas9水平上升。Cas9複合所有sgRNA以介導CRISPR-Cas9質粒的基因組編輯和自失活。
自行失活性CRISPR-Cas9系統的一個方面係表現單一或來自1至4個或更多個不同指導序列(例如高達約20個或約30個指導序列)的串聯陣列形式。每個單獨的自行失活性指導序列可以靶向不同的靶標。該等可以從例如一個嵌合pol3轉錄物加工。可以使用Pol3啟動子例如U6或H1啟動子。Pol2啟動子,例如在此遍及全文提及的那些。反向末端重複(iTR)序列可以在Pol3啟動子-sgRNA(s)-Pol2啟動子-Cas9的側翼。
嵌合串聯陣列轉錄物的一個方面係一種或多種指導物編輯一種或多種靶標,同時一種或多種自行失活性指導物使CRISPR/Cas9系統失活。因此,例如用於修復擴增障礙的描述的CRISPR-Cas9系統可以直接與在此描述的自行失活性CRISPR-Cas9系統組合。這種系統可以例如具有針對用於修復的靶區域的兩種指導物,以及針對CRISPR-Cas9的自我失活的至少一種第三指導物。參考申請案序號PCT/US2014/069897,標題為“Crispr-Cas系統在核苷酸重複障礙中使用的組成物和方法(Compositions And Methods Of Use Of Crispr-Cas Systems In Nucleotide Repeat Disorders)”,公開於2014年12月12日作為WO/2015/089351。
套組
在一個方面,本發明提供了以下套組,該等套組包含揭露於以上方法和組成物中的元件中的任何一個或多個。元件可以單獨地或組合地提供,並且可以被提供於任何適合的容器中,如小瓶、瓶子或管。在一些實施方式中,該套組包括一種或多種語言,例如多於一種語言的說明書。
在一些實施方式中,套組包括一種或多種用於在利用在此描述的元件中的一種或多種的方法中使用的試劑。試劑可以被提供於任何適合的容器中。例如,套組可以提供一種或多種反應或存儲緩衝液。可以按在具體測定中可用的形式或按在使用之前需要添加一種或多種其他組分的形式(例如按濃縮或凍乾形式)提供試劑。緩衝液可以是任何緩衝液,包括但不限於碳酸鈉緩衝液、碳酸氫鈉緩衝液、硼酸鹽緩衝液、Tris緩衝液、MOPS緩衝液、HEPES緩衝液及其組合。在一些實施方式中,該緩衝液係鹼性的。在一些實施方式中,該緩衝液具有從約7至約10的pH。在一些實施方式中,該套組包括一個或多個寡核苷酸,該一個或多個寡核苷酸對應於一用於插入進載體中的指導序列,以便可操作地連接該指導序列和一個調節元件。在一些實施方式中,該套組包括一同源重組模板多核苷酸。在一些實施方式中,該套組包括在此描述的載體中的一個或多個和/或在此描述的多核苷酸中的一個或多個。該套組可以有利地允許提供本發明的系統的所有元件。
靶向核酸的系統和方法
術語“靶向核酸的系統”,其中核酸係DNA或RNA,並且在一些方面還可以指DNA-RNA雜合體或其衍生物,總共係指轉錄物和涉及靶向DNA或RNA的CRISPR相關(“Cas”)基因的表現或指導其活性的其他元件,其可以包括編碼靶向DNA或RNA的Cas蛋白的序列、和包括CRISPR RNA(crRNA)序列和(在一些但不是所有系統中)反式活化CRISPR/Cas系統RNA(tracrRNA)序列的靶向DNA或RNA的指導RNA、或來自靶向DNA或RNA的CRISPR座位的其他序列和轉錄物。一般來說,靶向RNA的系統的特徵為促進在靶DNA或RNA序列的位點處形成靶向DNA或RNA的複合物的元件。在靶向DNA或RNA的複合物形成的背景下,“靶序列”係指靶向DNA或RNA的指導RNA被設計為對其具有互補性的DNA或RNA序列,其中在靶序列與靶向RNA的指導RNA之間的雜交促進靶向RNA的複合物的形成。在一些實施方式中,靶序列位於細胞的細胞核或細胞質中。
在本發明的一方面,新型的靶向DNA的系統還稱為靶向DNA的CRISPR/Cas,或本申請的CRISPR-Cas靶向DNA的系統基於不要求產生用以靶向特異性DNA序列的定制蛋白的鑒定出的Cas9蛋白,而係單個效應蛋白或酶可以藉由RNA分子被程式設計為識別特異性DNA靶標,換言之,使用所述RNA分子可以將該酶募集到特異性DNA靶標上。本發明的方面特別涉及靶向DNA的RNA指導的SpCas9 CRISPR系統。
在一個方面,本發明提供了用於使用靶向核酸的系統的一個或多個元件之方法。本發明的的靶向核酸的複合物提供了用於修飾靶DNA或RNA(單股或雙股、直鏈或超螺旋的)的有效手段。本發明的靶 向核酸的複合物具有多種多樣的實用性,包括修飾(例如,缺失、插入、轉位、失活、活化)多種細胞類型中的靶DNA或RNA。正因為如此,本發明的靶向核酸的複合物在例如基因療法、藥物篩選、疾病診斷以及預後中具有廣闊的應用譜。示例性的靶向核酸的複合物包括與雜交到感興趣的靶座位內的靶序列上的指導RNA複合的靶向DNA或RNA的效應蛋白。
在此描述的該等靶向核酸的系統、載體系統、載體和組成物可以用於各種靶向核酸的應用中,由此改變或修飾基因產物的合成,如蛋白、核酸切割、核酸編輯、核酸剪接;靶核酸的運輸、靶核酸的追蹤、靶核酸的分離、靶核酸的視覺化等。
本發明的方面還涵蓋在此描述的組成物和系統在基因組工程,例如用於改變或操縱一個或多個基因或一種或多種基因產物在原核或真核細胞體內、體外或離體表現的方法和用途。
在一個實施方式中,本發明提供了一種切割靶DNA之方法。該方法可以包括使用靶向核酸的複合物修飾靶DNA,該複合物結合到該靶DNA上並且實施所述靶DNA的切割。在一個實施方式中,當被引入進細胞中時,本發明的靶向核酸的複合物在RNA序列中可產生斷裂(例如,單股或雙股斷裂)。例如,可以使用該方法切割細胞中的疾病RNA。例如,可將外源RNA模板引入進細胞中,該外源RNA模板包括有待整合的、側翼為上游序列和下游序列的序列。上游和下游序列與RNA中的整合位點的任一側都具有序列相似性。在希望的情況下,供體RNA可以是mRNA。該外源RNA模板包括有待整合的序列(例如,突變的RNA)。供 整合的序列可以是對細胞而言內源或外源的序列。有待整合的序列的實例包括編碼蛋白質的RNA或非編碼RNA(例如,微小RNA)。因此,供整合的序列可以可操作地連接到一個或多個適當的控制序列上。可替代地,有待整合的序列可以提供一種調節功能。選擇外源RNA模板中的上游和下游序列,以促進感興趣的RNA序列與供體RNA之間的重組。該上游序列係一個與供整合的靶向位點的上游的RNA序列具有序列相似性的RNA序列。類似地,該下游序列係一個與供整合的靶向位點的RNA序列下游具有序列相似性的RNA序列。外源RNA模板中的上游和下游序列與靶向的RNA序列可以具有75%、80%、85%、90%、95%或100%序列一致性。較佳的是,外源RNA模板中的上游和下游序列與靶向的RNA序列具有約95%、96%、97%、98%、99%或100%序列一致性。在一些方法中,外源RNA模板中的上游和下游序列與靶向的RNA序列具有約99%或100%序列一致性。上游或下游序列可以包括從約20bp至約2500bp,例如約50、100、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400或2500bp。在一些方法中,示例性上游或下游序列具有約200bp至約2000bp、約600bp至約1000bp或更具體地約700bp至約1000bp。在一些方法中,該外源RNA模板可以進一步包括一標記。這樣的一種標記使得容易地篩選靶向的整合。適合的標記的實例包括限制性位點、螢光蛋白或選擇性標記。可以使用重組技術構建本發明的外源RNA模板(參見例如,薩姆布魯克(Sambrook)等人,2001和奧蘇貝爾(Ausubel)等人,1996)。在一種用於藉由整合外源DNA模板而修飾靶DNA的方法中,藉由靶向核酸的複合物將一斷裂(例如,雙股或單股斷裂)引入進DNA 序列中,藉由用外源DNA模板進行同源重組而修復該斷裂,這樣使得將該模板整合進DNA靶標中。雙股斷裂的存在促進模板的整合。在其他實施方式中,本發明提供了一種修飾RNA在真核細胞中的表現之方法。該方法包括藉由使用結合到編碼RNA(例如,mRNA或pre-mRNA)的DNA上的靶向核酸的複合物增加或降低靶多核苷酸的表現。在一些方法中,可以使靶DNA失活以實施細胞中的表現的修飾。例如,當靶向DNA的複合物結合到細胞中的一靶序列上時,該靶DNA失活,這樣使得該序列不被轉錄,該編碼蛋白不被產生,或者該序列不會像野生型序列一樣起作用。例如,可以使蛋白質或微小RNA編碼序列失活,這樣使得該蛋白質或微小RNA或前-微小RNA轉錄物不被產生。靶向DNA的複合物的靶DNA可以是對真核細胞而言內源或外源的任何DNA。例如,該靶DNA可以是一種駐留在真核細胞的細胞核中的DNA。靶DNA可以是編碼編碼基因產物(例如,蛋白)的基因產物(例如,mRNA或pre-mRNA)的序列或非編碼序列(例如,ncRNA、lncRNA、tRNA、或rRNA)。靶DNA的實例包括與傳訊生化途徑相關的序列,例如傳訊生化途徑相關DNA。靶DNA的實例包括疾病相關DNA。“疾病相關”DNA係指與非疾病對照的組織或細胞相比,在來源於疾病影響的組織的細胞中以異常水平或以異常形式產生轉錄產物的任何DNA。在改變的表現與疾病的出現和/或進展相關的情況下,它可以是從以異常高的水平被表現的基因轉錄的DNA;它可以是從以異常低的水平被表現的基因轉錄的DNA。疾病相關DNA還指從具有一個或多個突變或直接負責或與一個或多個負責疾病的病因學的基因連鎖不平衡的遺傳變異的基因轉錄的DNA。翻譯的產物可以是已知的或未知的,並且可以處於正常或異常水平。靶向DNA的複合物的靶 DNA可以是對真核細胞而言內源或外源的任何DNA。例如,該靶DNA可以是一種駐留在真核細胞的細胞核中的DNA。靶DNA可以是編碼基因產物(例如,mRNA、pre-mRNA、蛋白)的序列或非編碼序列(例如,ncRNA、lncRNA、tRNA、或rRNA)。
在一些實施方式中,該方法可以包括允許靶向核酸的複合物結合到靶DNA上,以實現所述靶DNA的切割,由此修飾靶DNA,其中該靶向核酸的複合物包括與雜交到所述靶DNA內的靶序列上的指導RNA複合的靶向核酸的效應蛋白。在一個方面,本發明提供了修飾DNA或RNA在真核細胞中的表現之方法。在一些實施方式中,該方法包括允許靶向核酸的複合物結合到該DNA上,這樣使得所述結合導致所述DNA的表現增加或降低;其中該靶向核酸的複合物包括與指導RNA複合的靶向核酸的效應蛋白。類似的考慮因素和條件適用如上文針對修飾靶DNA之方法。事實上,該等取樣、培養和重新引入選擇跨本發明的多個方面而適用。在一個方面,本發明提供了修飾真核細胞中的靶DNA之方法,該等方法可以在體內、離體或在體外。在一些實施方式中,該方法包括對來自人或非人動物的細胞或細胞群進行取樣,並且修飾該細胞或該等細胞。培養可以發生在離體的任何階段。該細胞或該等細胞甚至可以被重新引入該非人動物或植物中。對於重新引入的細胞,特別較佳的是該等細胞係幹細胞。
的確,在本發明的任何方面,靶向核酸的複合物可以包括與雜交到靶序列上的指導RNA複合的靶向核酸的效應蛋白。
本發明涉及用於控制涉及序列靶向的基因表現的系統、方 法、和組成物的工程化和優化,該序列靶向涉及靶向核酸的系統及其組分。本發明方法的一個優點在於,該CRISPR系統最小化或避免了脫靶結合及其所產生的副作用。這係藉由使用被安排為具有針對靶DNA的高度序列特異性的系統而實現的。
相對於靶向核酸的複合物或系統,較佳的是,該tracr序列具有一個或多個髮夾結構,並且長度係30個或更多個核苷酸,長度係40個或更多個核苷酸,或長度係50或更多個核苷酸;該crRNA序列的長度在10至30個核苷酸之間,該靶向核酸的效應蛋白係II型Cas9效應蛋白。
編輯與修飾
在一個方面,本發明提供了用於使用CRISPR系統的一個或多個元件之方法。本發明的CRISPR複合物提供了用於修飾靶多核苷酸的有效手段。本發明的CRISPR複合物具有多種多樣的實用性,包括修飾(例如,缺失、插入、轉位、失活、活化)多種細胞類型中的靶多核苷酸。正因為如此,本發明的CRISPR複合物在例如基因療法、藥物篩選、疾病診斷以及預後中具有廣闊的應用譜。示例性CRISPR複合物包括與指導序列複合的CRISPR酶,該指導序列與靶多核苷酸內的靶序列雜交。在某些實施方式中,將同向重複序列連接到指導序列上。
DNA切割和修復
該方法包括使用CRISPR複合物修飾靶多核苷酸,該CRISPR複合物結合到該靶多核苷酸上並且實施所述靶多核苷酸的切割。典型地,當被引入進細胞中時,本發明的CRISPR複合物在基因組序列中產生一個斷裂(例如,單股或雙股斷裂)。例如,可以使用該方法切 割細胞中的疾病基因。由該CRISPR複合物產生的斷裂可以藉由修復過程進行修復,如易出錯的非同源末端連接(NHEJ)途徑或高保真同源定向修復(HDR)。在該等修復過程期間,可以將外源多核苷酸模板引入進基因組序列中。在一些方法中,該HDR過程被用於修飾基因組序列。例如,將外源多核苷酸模板引入進細胞中,該外源多核苷酸模板包括有待整合的、側翼為上游序列和下游序列的序列。上游和下游序列與染色體中的整合位點的任一側都具有序列相似性。在希望的情況下,供體多核苷酸可以是DNA,例如DNA質粒、細菌人工染色體(BAC)、酵母人工染色體(YAC)、病毒載體、一段線性DNA、PCR片段、裸核酸或與遞送賦形劑(如脂質體或泊洛沙姆)複合的核酸。該外源多核苷酸模板包括有待整合的序列(例如,突變的基因)。供整合的序列可以是對細胞而言內源或外源的序列。有待整合的序列的實例包括編碼蛋白質的多核苷酸或非編碼RNA(例如,微小RNA)。因此,供整合的序列可以可操作地連接到一個或多個適當的控制序列上。可替代地,有待整合的序列可以提供一調節功能。選擇外源多核苷酸模板中的上游和下游序列,以促進感興趣的染色體序列與供體多核苷酸之間的重組。該上游序列係與供整合的靶向位點的上游的基因組序列具有序列相似性的核酸序列。類似地,該下游序列係與供整合的靶向位點的染色體序列下游具有序列相似性的核酸序列。外源多核苷酸模板中的上游和下游序列與靶向的基因組序列可以具有75%、80%、85%、90%、95%或100%序列一致性。較佳的是,外源多核苷酸模板中的上游和下游序列與靶向的基因組序列具有約95%、96%、97%、98%、99%或100%序列一致性。在一些方法中,外源多核苷酸模板中的上游和下游序列與靶向的基因組序列具有約99%或100%序列 一致性。上游或下游序列可以包括從約20bp至約2500bp,例如約50、100、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400或2500bp。在一些方法中,示例性上游或下游序列具有約200bp至約2000bp、約600bp至約1000bp或更具體地約700bp至約1000bp。在一些方法中,該外源多核苷酸模板可以進一步包括標記。這樣的一種標記使得容易地篩選靶向的整合。適合的標記的實例包括限制性位點、螢光蛋白或選擇性標記。可以使用重組技術構建本發明的外源多核苷酸模板(參見例如,薩姆布魯克(Sambrook)等人,2001和奧蘇貝爾(Ausubel)等人,1996)。在一種用於藉由整合外源多核苷酸模板而修飾靶多核苷酸的方法中,藉由CRISPR複合物將雙股斷裂引入進基因組序列中,經由同源重組藉由外源多核苷酸模板而修復該斷裂,這樣使得將該模板整合進基因組中。雙股斷裂的存在促進模板的整合。在其他實施方式中,本發明提供了修飾多核苷酸在真核細胞中的表現之方法。該方法包括藉由使用結合到多核苷酸上的CRISPR複合物增加或降低靶多核苷酸的表現。在一些方法中,可以使靶多核苷酸失活以實施細胞中的表現的修飾。例如,當CRISPR複合物結合到細胞中的靶序列上時,該靶多核苷酸失活,這樣使得該序列不被轉錄,該編碼蛋白不被產生,或者該序列不會像野生型序列一樣起作用。例如,可以使蛋白質或微小RNA編碼序列失活,這樣使得該蛋白質或微小RNA或前-微小RNA轉錄物不被產生。在一些方法中,可以使控制序列失活,這樣使得它不再作為控制序列起作用。如在此使用,“控制序列”係指影響核酸序列的轉錄、翻譯或可及性的任何核酸序列。控制序列的實例包括啟動子、轉錄終止子和增強子,它們係 控制序列。CRISPR複合物的靶多核苷酸可以是對真核細胞而言內源或外源的任何多核苷酸。例如,該靶多核苷酸可以是駐留在真核細胞的細胞核中的多核苷酸。該靶多核苷酸可以是編碼基因產物(例如,蛋白質)的序列或非編碼序列(例如,調節多核苷酸或無用DNA)。靶多核苷酸的實例包括與傳訊生化途徑相關的序列,例如傳訊生化途徑相關基因或多核苷酸。靶多核苷酸的實例包括疾病相關基因或多核苷酸。“疾病相關”基因或多核苷酸係指與非疾病對照的組織或細胞相比,在來源於疾病影響的組織的細胞中以異常水平或以異常形式產生轉錄或翻譯產物的任何基因或多核苷酸。在改變的表現與疾病的出現和/或進展相關的情況下,它可以是以異常高的水平被表現的基因;它可以是以異常低的水平被表現的基因。疾病相關基因還指具有一個或多個突變或直接負責或與一個或多個負責疾病的病因學的基因連鎖不平衡的遺傳變異的基因。轉錄的或翻譯的產物可以是已知的或未知的,並且可以處於正常或異常水平。CRISPR複合物的靶多核苷酸可以是對真核細胞而言內源或外源的任何多核苷酸。例如,該靶多核苷酸可以是駐留在真核細胞的細胞核中的多核苷酸。該靶多核苷酸可以是編碼基因產物(例如,蛋白質)的序列或非編碼序列(例如,調節多核苷酸或無用DNA)。
基因編輯或用Cas9改變靶基因座;HDR和模板
該等股中的一條股的雙股斷裂或單股斷裂應該有利地足夠接近於靶位置使得校正發生。在一實施方式中,距離不超過50、100、200、300、350或400個核苷酸。雖然希望不受理論束縛,據信斷裂應該足夠接近於靶位置,這樣使得斷裂位於在端切除過程中經受外切核酸酶 介導的去除的區域內。如果靶位置和斷裂之間的距離過大,突變可能不被包括在端切除中,並且因此,可以不被校正,因為模板核酸序列僅可用於校正端切除區域內的序列。
在一實施方式中,其中出於誘導HDR介導的校正的目的,指導RNA和II型分子,特別是Cas9或其異種同源物或同系物,較佳的是Cas9核酸酶誘導雙股斷裂,切割位點遠離靶位置0-200bp(例如,0至175、0至150、0至125、0至100、0至75、0至50、0至25、25至200、25至175、25至150、25至125、25至100、25至75、25至50、50至200、50至175、50至150、50至125、50至100、50至75、75至200、75至175、75至150、75至1 25、75至100bp)。在一實施方式中,切割位點遠離靶位置0-100bp(例如,0到75、0到50、0至25、25至100、25至75、25至50、50至100、50至75或75至100bp)。在一另外的實施方式中,出於誘導HDR介導的校正的目的,與Cas9或其異種同源物或同系物複合的兩個或更多個指導RNA可以用於誘導多重斷裂。
同源臂應該至少延伸遠至可以發生端切除的區域,例如,以便允許所切除的單股突出端在供體模板中找到互補區。可以藉由參數(如質粒大小或病毒包裝限制)來限制總長度。在一實施方式中,同源臂可以不延伸到重複元件中。示例性同源臂長度包括至少50、100、250、500、750或1000個核苷酸。
如在此使用的,靶位置係指藉由II型,特別是Cas9或其異種同源物或同系物,較佳的是Cas9分子依賴性方法修飾的靶核酸或靶基因(例如,染色體)上的位點。例如,靶位置可以是靶核酸的修飾的Cas9 分子裂解以及靶位置的模板核酸引導的修飾(例如,校正)。在一實施方式中,靶位置可以是在一個或多個核苷酸被添加至其中的目標核酸上的兩個核苷酸(例如,相鄰的核苷酸)之間的位點。靶位置可以包括藉由模板核酸被改變(例如,校正)的一個或多個核苷酸。在一實施方式中,靶位置在靶序列(例如,指導RNA所結合的序列)之內。在一實施方式中,靶位置係靶序列(例如,指導RNA所結合的序列)的上游或下游。
如在此使用的術語模板核酸係指可以與II型分子,特別是Cas9或其異種同源物或同系物,較佳的是Cas9分子和指導RNA分子結合使用以改變靶位置的結構的核酸序列。在一實施方式中,靶核酸被修飾成具有模板核酸的一些或所有序列,典型地在一個或多個切割位點處或附近。在一個實施方式中,模板核酸係單股的。在一替代實施方式中,模板核酸係雙股的。在一實施方式中,模板核酸係DNA(例如,雙股DNA)。在一替代實施方式中,模板核酸係單股DNA。
在一實施方式中,模板核酸藉由參與同源重組改變靶位置的結構。在一實施方式中,模板核酸改變靶位置的序列。在一實施方式中,模板核酸導致將修飾的或非天然存在的鹼基摻入到靶核酸中。
模板序列可以經過斷裂介導的或用靶序列催化的重組。在一實施方式中,模板核酸可以包括對應於藉由Cas9介導的切割事件而被切割的靶序列上的位點的序列。在一實施方式中,模板核酸可以包括對應於在第一Cas9介導的事件中被切割的靶序列上的第一位點,以及在第二Cas9介導的事件中被切割的靶序列上的第二位點兩者的序列。
在某些實施方式中,模板核酸可以包括導致所翻譯序列的 編碼序列發生改變的序列,例如,導致蛋白產物中一種胺基酸取代另一種胺基酸的序列,例如,將突變體等位基因轉化為野生型等位基因、將野生型等位基因轉化為突變體等位基因、和/或引入終止密碼子、插入胺基酸殘基,缺失胺基酸殘基、或無意義突變。在某些實施方式中,模板核酸可以包括導致非編碼序列發生改變的序列,例如,在外顯子或在5'或3'非翻譯區或非轉錄區中的改變。此類改變包括控制元件(例如,啟動子、增強子)的改變,以及順式作用或反式作用控制元件的改變。
與靶基因的靶位置具有同源性的模板核酸可以用於改變靶序列的結構。模板序列可以用於改變不想要的結構,例如,不想要的或突變型核苷酸。模板核酸可以包括當整合時導致以下效果的序列:降低正控制元件的活性;增加正控制元件的活性;降低負控制元件的活性;增加負控制元件的活性;降低基因表現;增加基因表現;增加對障礙或疾病的抗性;增加對病毒進入的抗性;校正突變或改變賦予、增加,消除或減少基因產物的生物學特性的不想要的胺基酸殘基,例如,增加酶的酶活性、或增加基因產物與另一種分子相互作用的能力。
模板核酸可以包括導致具有靶序列的1、2、3、4、5、6、7、8、9、10、11、12或更多個核苷酸的序列發生變化的序列。在一實施方式中,該模板核酸長度可以是20 +/- 10、30 +/- 10、40 +/- 10、50 +/- 10、60 +/- 10、70 +/- 10、80 +/- 10、90 +/- 10、100 +/- 10、110 +/- 10、120 +/- 10、130 +/- 10、140 +/- 10、150 +/- 10、160 +/- 10、170 +/- 10、180 +/- 10、190 +/- 10、200 +/- 10、210 +/- 10、或220 +/- 10個核苷酸。在一個實施方式中,該模板核酸長度可以是30 +/- 20、40 +/- 20、50 +/- 20、60 +/- 20、 70 +/- 20、80 +/- 20、90 +/- 20、100 +/- 20、110 +/- 20、120 +/- 20、130 +/- 20、140 +/-20、I 50 +/- 20、160 +/- 20、170 +/- 20、180 +/- 20、190 +/- 20、200 +/- 20、210+/-20、或220+/-20個核苷酸。在一實施方式中,該模板核酸長度係10至1,000、20至900、30至800、40至700、50至600、50至500、50至400、50至300、50至200、或50至100個核苷酸。
模板核酸包括以下組分:[5'同源臂]-[置換序列]-[3'同源臂]。該等同源臂提供進入染色體中的重組,因此用置換序列替換所不希望的元件(例如,突變或標籤)。在一實施方式中,該等同源臂在最遠端切割位點的側翼。在一實施方式中,5'同源臂的3'端係緊鄰置換序列的5'端的位置。在一實施方式中,5'同源臂可以從置換序列的5'端的5’至少延伸10、20、30、40、50、100、200、300、400、500、600、700、800、900、1000、1500、或2000個核苷酸。在一實施方式中,3'同源臂的5'端係緊鄰置換序列的3'端的位置。在一實施方式中,3'同源臂可以從置換序列的3'端的3’至少延伸10、20、30、40、50、100、200、300、400、500、600、700、800、900、1000、1500、或2000個核苷酸。
在某些實施方式中,可以將一條或兩條同源臂縮短以避免包括某些序列重複元件。例如,可以將5'同源臂縮短以避免序列重複元件。在其他實施方式中,可以將3'同源臂縮短以避免序列重複元件。在一些實施方式中,可以將5'和3'同源臂二者縮短以避免包括某些序列重複元件。
在某些實施方式中,用於校正突變的模板核酸可以被設計用作單股寡核苷酸。當使用單股寡核苷酸時,5'和3'同源臂的長度範圍可 以高達約200個鹼基對(bp),例如,長度至少係25、50、75、100、125、150、175、或200bp。
DNA修復和NHEJ
在某些實施方式中,核酸酶誘導的非同源末端聯接(NHEJ)可以用於靶基因特異性敲除。核酸酶誘導的NHEJ還可以用於去除(例如,缺失)感興趣的基因的序列。通常,NHEJ藉由將兩個末端連接在一起來修復DNA的雙股斷裂;然而,通常,只有兩個相容末端(完全如它們藉由雙股斷裂所形成的)係完全連接的,原始序列才被恢復。雙股斷裂的DNA末端的經常是酶處理的物件,由此導致在重新連接該等末端之前,在一條股或兩條股上添加或去除核苷酸。這導致在NHEJ修復位點處的DNA序列中存在插入和/或缺失(indel)突變。典型地,該等突變中的三分之二改變閱讀框並且,因此,產生非功能蛋白。另外,維持閱讀框但插入或缺失大量序列的突變可破壞蛋白的功能性。這係部位依賴性的,因為關鍵功能結構域中的突變比蛋白的非關鍵區中的突變可能更不耐受。藉由NHEJ產生的indel突變本質上是不可預測的;然而,在給定的斷裂位點,某些indel序列係有利的並且在群體中是過度表現的,這可能歸因於微同源性的小區域。缺失的長度可以廣泛地變化;最常見在1-50bp範圍內,但它們可以輕易地大於50bp,例如,它們可以輕易地達到大於約100-200bp。插入傾向於較短,並且經常包括直接圍繞斷裂位點的序列的短的複製。然而,有可能獲得大的插入,並且在該等情況下,插入序列經常被跟蹤至基因組的其他區域或至存在於細胞中的質粒DNA。
因為NHEJ係誘變過程,它還可以用於缺失小的序列模體,只要不需要產生特異最終序列。如果雙股斷裂被靶向至短靶序列附近,由NHEJ修復引起的缺失突變經常跨越,並且因此除去不想要的核苷酸。對於較大DNA區段的缺失,將兩個雙股斷裂各自引入序列兩側可以導致末端之間的NHEJ,去除整個插入序列。這兩種方法都可以用於缺失特異性DNA序列;然而,NHEJ的易錯性質仍然可以在修復位點處產生indel突變。
切割兩條雙股的II型分子,特別是Cas9或其異種同源物或同系物,較佳的是Cas9分子和單股、或切口酶,II型分子,特別是Cas9或其異種同源物或同系物,較佳的是Cas9分子可以用於在此描述的方法和組成物中,以產生NHEJ介導的indel。靶向基因(例如,編碼區(例如,感興趣的基因的早期編碼區))的NHEJ介導的indel可以用於敲除感興趣的基因(即,消除其表現)。例如,感興趣的基因的早期編碼區包括緊接著轉錄起始位點的序列,其在編碼序列的第一外顯子之內、或在轉錄起始位點的500bp之內(例如,小於500、450、400、350、300、250、200、150、100或50bp)。
在一實施方式中,其中出於誘導NHEJ介導的indel的目的,指導RNA以及II型分子,特別是Cas9或其異種同源物或同系物,較佳的是Cas9核酸酶產生雙股斷裂,指導RNA可以被配置為將雙股斷裂定位在極接近於靶位置的核苷酸之處。在一實施方式中,切割位點可以遠離靶位置0-500bp(例如,遠離靶位置小於500、400、300、200、100、50、40、30、25、20、15、10、9、8、7、6、5、4、3、2或1bp)。
在一實施方式中,其中出於誘導NHEJ介導的indel的目的,與II型分子,特別是Cas9或其異種同源物或同系物,較佳的是Cas9核酸酶複合的兩個指導RNA誘導兩個單股斷裂,兩個指導RNA可以被配置為將兩個單股斷裂定位以便為NHEJ修復提供靶位置的核苷酸。
功能性效應子的遞送
不像CRISPR-Cas介導的基因敲除,其藉由在DNA水平上使基因突變而永久消除表,CRISPR-Cas敲減允許藉由使用人工轉錄因子暫時降低基因表現。使Cas9蛋白的兩個DNA切割結構域中的關鍵殘基突變導致產生無催化活性Cas9。無催化活性Cas9與指導RNA複合並且定位至由指導RNA的靶向結構域指定的DNA序列,然而,它不切割靶DNA。無活性Cas9蛋白與效應子結構域(例如,轉錄抑制結構域)的融合能使得將效應子募集至由指導RNA指定的任何DNA位點。在某些實施方式中,Cas9可以融合至轉錄抑制結構域並募集至基因的啟動區。尤其針對基因抑制,在此考慮到的是阻斷內源轉錄因子的結合部位將有助於下調基因表現。在另一個實施方式中,無活性Cas9可以融合到染色質修飾蛋白上。改變染色質狀態可以導致靶基因的表現降低。
在一實施方式中,指導RNA分子可以被靶向至已知的轉錄應答元件(例如,啟動子、增強子等)、已知的上游活化序列、和/或疑似能夠控制靶DNA表現、具有未知或已知功能的序列。
在一些方法中,可以使靶多核苷酸失活以實施細胞中的表現的修飾。例如,當CRISPR複合物結合到細胞中的一靶序列上時,該靶多核苷酸失活,這樣使得該序列不被轉錄,該編碼蛋白不被產生,或者 該序列不會像野生型序列一樣起作用。例如,可以使蛋白質或微小RNA編碼序列失活,這樣使得該蛋白質不被產生。
在某些實施方式中,該CRISPR酶包含一個或多個選自下組的突變,該組由以下各項組成:D917A、E1006A和D1225A和/或該一個或多個突變在該CRISPR酶的RuvC結構域中或者為如本文另外論述的突變。在一些實施方式中,該CRISPR酶具有一個或多個在催化結構域中的突變,其中在轉錄時,該同向重複序列形成單個莖環,並且該指導序列指導CRISPR複合物與該靶序列的序列特異性結合,並且其中該酶進一步包含功能結構域。在一些實施方式中,該功能結構域係轉錄活化結構域,較佳的是VP64。在一些實施方式中,該功能結構域係轉錄抑制結構域,較佳的是KRAB。在一些實施方式中,該轉錄抑制結構域係SID、或SID的多聯體(例如SID4X)。在一些實施方式中,該功能結構域係表觀遺傳修飾結構域,從而提供了表觀遺傳修飾酶。在一些實施方式中,該功能結構域係活化結構域,其可以是P65活化結構域。
功能性效應子(結構域)
可以用本發明的Cas9進行基因編輯。可以使Cas9失活並融合到一個或多個功能性結構域(效應子)上。
在一些實施方式中,該功能結構域可以選自由以下各項組成之群組:轉位酶結構域、整合酶結構域、重組酶結構域、解離酶結構域、轉化酶結構域、蛋白酶結構域、DNA甲基轉移酶結構域、DNA羥甲基化酶結構域、DNA脫甲基酶結構域、組蛋白乙醯酶結構域、組蛋白脫乙醯酶結構域、核酸酶結構域、抑制蛋白結構域、活化蛋白結構域、核 定位信號結構域、轉錄調節蛋白(或轉錄複合體募集)結構域、細胞攝取活性相關結構域、核酸結合結構域、抗體呈遞結構域、組蛋白修飾酶、組蛋白修飾酶的募集物;組蛋白修飾酶的抑制劑、組蛋白甲基轉移酶、組蛋白脫甲基化酶、組蛋白激酶、組蛋白磷酸酶、組蛋白核糖基酶、組蛋白脫核糖基酶、組蛋白泛素化酶、組蛋白去泛素化酶、組蛋白生物素化酶和組蛋白尾蛋白酶。
在一些較佳的實施方式中,該功能結構域係轉錄活化結構域,較佳的是VP64。在一些實施方式中,該功能結構域係轉錄抑制結構域,較佳的是KRAB。在一些實施方式中,該轉錄抑制結構域係SID、或SID的多聯體(例如SID4X)。在一些實施方式中,該功能結構域係表觀遺傳修飾結構域,從而提供了表觀遺傳修飾酶。在一些實施方式中,該功能結構域係活化結構域,其可以是P65活化結構域。
非分裂細胞中(神經元和肌肉)中的基因靶向
非分裂(尤其是非分裂、完全分化)細胞類型,包括肌細胞以及尤其是神經元,提出了關於基因靶向或基因組工程的問題,例如因為同源重組(HR)總體上在G1細胞週期階段受抑制。然而,儘管研究了細胞控制正常DNA修復系統的機制,奧斯文(Orthwein)等人已經報導了使非分裂細胞中的HR保持“關閉”的先前未知的開關,並且他們設計了策略以撥動這個開關重新開啟。奧斯文(Orthwein)等人(加拿大渥太華西奈山醫院(Mount Sinai Hospital)的丹尼爾迪羅謝(Daniel Durocher)實驗室報告於自然(Nature)16142中,線上公開於2015年12月9日)已經顯示,可以解除對HR的抑制並且基因靶向在腎(293T)以及骨肉瘤 (U2OS)細胞二者中成功完成。已知腫瘤抑制基因、BRCA1、PALB2以及BRAC2能藉由HR促進DNA DSB修復。他們發現BRCA1與PALB2-BRAC2複合物的形成受PALB2上的泛素位點支配,這樣使得藉由E3泛素連接酶對該位點起作用。這種E3泛素連接酶由與滯蛋白-3(CUL3)-RBX1複合的KEAP1(PALB2相互作用蛋白)構成。PALB2泛素化抑制它與BRCA1的相互作用並且被去泛素化酶USP11抵消,其本身處於細胞週期控制之下。與DNA端切除的活化組合的BRCA1-PALB2相互作用的恢復足以誘導G1中的同源重組,如藉由多種方法所測量的,包括針對USP11或KEAP1、基於CRISPR-Cas9的基因靶向測定(表現自pX459載體)。然而,當使用KEAP1消耗或表現PALB2-KR突變型使BRCA1-PALB2相互作用在切除感受態G1細胞中恢復時,檢測出基因打靶事件的穩健增加。
因此,在一些實施方式中,細胞(尤其是非分裂、完全分化的細胞類型,包括肌細胞以及尤其是神經元)中的HR復活係較佳的。在一些實施方式中,在一些實施方式中,促進BRCA1-PALB2相互作用係較佳的。在一些實施方式中,靶細胞係非分裂細胞。在一些實施方式中,靶細胞係神經元或肌細胞。在一些實施方式中,在體內靶向靶細胞。在一些實施方式中,細胞處於G1並且HR受抑制。
在一些實施方式中,使用KEAP1耗盡,例如抑制KEAP1活性的表現,係較佳的。KEAP1消耗可以藉由siRNA實現,例如,如奧斯文(Orthwein)等人中所示。可替代地,PALB2-KR突變體(在BRCA1相互作用結構域中缺乏所有八個Lys殘基)的表現係較佳的,與KEAP1消耗相結合或單獨地。
不管細胞週期位置,PALB2-KR與BRCA1相互作用。因此,在一些實施方式中,促進或恢復BRCA1-PALB2相互作用(尤其是在G1細胞中)係較佳的,尤其是其中靶細胞係非分裂的,或其中去除和返回(離體基因靶向)係有問題的,例如神經元或肌細胞。KEAP1 siRNA係較佳的並且可購自賽默飛世爾(ThermoFischer)。
在一些實施方式中,BRCA1-PALB2複合物可以作為蛋白錯合物、融合蛋白、編碼BRCA1和PALB2的多核苷酸或編碼BRCA1-PALB2融合蛋白的多核苷酸被遞送到G1細胞中。此類多核苷酸可以在適合的啟動子的控制之下,例如,並且如在此描述的,同時並視情況在與CRISPR蛋白相同的載體或載體系統中、或單獨地進行遞送。促進在非分裂、完全分化的)細胞類型,包括肌細胞以及尤其是神經元中的HR的其他可能性可以包括PALB2的直接遞送(使用融合至對PALB2親和的分子的Cas9);和/或BRCA2的直接遞送(使用融合至對BRCA2親和的分子的Cas9)。
在一些實施方式中,可以例如藉由增加去泛素化酶USP11的表現或活性來促進PALB2脫泛素化。如此,在一些實施方式中,設想的是可以提供構建體以促進或上調去泛素化酶USP11的表現或活性。
CRL4的敲低還可以用於使得KEAP1失活或降低它的活性。例如,可以使用CRL4 siRNA。可替代地,MLN4924(泛CRL酶抑制劑)還可以用於使KEAP1失活。
特別較佳的是還提供了53BP的敲除,因為表明這需要活化HDR(在奧斯文(Orthwein)等人中所示)。53BP的敲除還可以藉由 siRNA實現。
活化DNA的切除(在DNA雙股斷裂的任一側產生3’突出端)對活化G1中的HR也是必要的。藉由以下方式做到這一點:對基因CtIP(或SAE2)的ORF與模擬活化磷酸化作用的突變(T847E)進行遞送。諸位申請人現在假定可以藉由使用Cas9雙切口酶以引入3’突出端(徐(Hsu)等人)來避免這個要求。因此,在靶向非分裂、完全分化的)細胞類型,包括肌細胞以及尤其是神經元中這樣使用Cas9雙切口酶以引入3’突出端係較佳的。
在一個實施方式中,本發明提供了一種切割靶多核苷酸之方法。該方法包括使用CRISPR複合物,該CRISPR複合物結合到該靶多核苷酸上並且實施所述靶多核苷酸的切割。典型地,當被引入進細胞中時,本發明的CRISPR複合物在基因組序列中產生斷裂(例如,單股或雙股斷裂)。例如,可以使用該方法切割細胞中的疾病基因。
由該CRISPR複合物產生的斷裂可以藉由修復過程進行修復,如易出錯的非同源末端連接(NHEJ)途徑或高保真同源定向修復(HDR)。在該等修復過程期間,可以將外源多核苷酸模板引入進基因組序列中。在一些方法中,該HDR過程被用於修飾基因組序列。例如,將外源多核苷酸模板引入進細胞中,該外源多核苷酸模板包括有待整合的、側翼為上游序列和下游序列的序列。上游和下游序列與染色體中的整合位點的任一側都具有序列相似性。
在希望的情況下,供體多核苷酸可以是DNA,例如DNA質粒、細菌人工染色體(BAC)、酵母人工染色體(YAC)、病毒載體、 一段線性DNA、PCR片段、裸核酸或與遞送賦形劑(如脂質體或泊洛沙姆)複合的核酸。
該外源多核苷酸模板包括有待整合的序列(例如,突變的基因)。供整合的序列可以是對細胞而言內源或外源的序列。有待整合的序列的實例包括編碼蛋白質的多核苷酸或非編碼RNA(例如,微小RNA)。因此,供整合的序列可以可操作地連接到一個或多個適當的控制序列上。可替代地,有待整合的序列可以提供調節功能。
選擇外源多核苷酸模板中的上游和下游序列,以促進感興趣的染色體序列與供體多核苷酸之間的重組。該上游序列係與供整合的靶向位點的上游的基因組序列具有序列相似性的核酸序列。類似地,該下游序列係與供整合的靶向位點的染色體序列下游具有序列相似性的核酸序列。外源多核苷酸模板中的上游和下游序列與靶向的基因組序列可以具有75%、80%、85%、90%、95%或100%序列一致性。較佳的是,外源多核苷酸模板中的上游和下游序列與靶向的基因組序列具有約95%、96%、97%、98%、99%或100%序列一致性。在一些方法中,外源多核苷酸模板中的上游和下游序列與靶向的基因組序列具有約99%或100%序列一致性。
上游或下游序列可以包括從約20bp至約2500bp,例如約50、100、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400或2500bp。在一些方法中,示例性上游或下游序列具有約200bp至約2000bp、約600bp至約1000bp或更具體地約700bp至約1000bp。
在一些方法中,該外源多核苷酸模板可以進一步包括標記。這樣的一種標記使得容易地篩選靶向的整合。適合的標記的實例包括限制性位點、螢光蛋白或選擇性標記。可以使用重組技術構建本發明的外源多核苷酸模板(參見例如,薩姆布魯克(Sambrook)等人,2001和奧蘇貝爾(Ausubel)等人,1996)。
在一種用於藉由整合外源多核苷酸模板而修飾靶多核苷酸的示例性方法中,藉由CRISPR複合物將雙股斷裂引入進基因組序列中,經由同源重組一個外源多核苷酸模板而修復該斷裂,這樣使得將該模板整合進基因組中。雙股斷裂的存在促進模板的整合。
在其他實施方式中,本發明提供了一種修飾多核苷酸在真核細胞中的表現之方法。該方法包括藉由使用結合到多核苷酸上的CRISPR複合物增加或降低靶多核苷酸的表現。
在一些方法中,可以使靶多核苷酸失活以實施細胞中的表現的修飾。例如,當CRISPR複合物結合到細胞中的一靶序列上時,該靶多核苷酸失活,這樣使得該序列不被轉錄,該編碼蛋白不被產生,或者該序列不會像野生型序列一樣起作用。例如,可以使蛋白質或微小RNA編碼序列失活,這樣使得該蛋白質不被產生。
在一些方法中,可以使控制序列失活,這樣使得它不再作為控制序列起作用。如在此使用,“控制序列”係指影響核酸序列的轉錄、翻譯或可及性的任何核酸序列。控制序列的實例包括啟動子、轉錄終止子和增強子,它們係控制序列。失活的靶序列可以包括缺失突變(即,缺失一個或多個核苷酸)、插入突變(即,插入一個或多個核苷酸) 或無義突變(即,用另一個核苷酸取代一個單核苷酸,這樣使得引入終止密碼子)。在一些方法中,靶序列的失活導致該靶序列的“敲除”。
使用CRISPR Cas系統的示例性方法
本發明提供了非天然存在的或工程化的組成物、或編碼所述組成物的組分的一種或多種多核苷酸、或包含對所述組成物的組分進行編碼的一種或多種多核苷酸的載體或遞送系統,其用於體內、離體或體外修飾靶細胞,並且是以改變細胞使得一旦被修飾則CRISPR修飾的細胞的子代或細胞系保留改變的表型的方式進行。該等修飾的細胞和子代可以是多細胞生物例如植物或動物的部分,其中在離體或體內向希望的細胞型應用CRISPR系統。CRISPR發明可以是治療的療法。該治療的療法可以包括基因或基因組編輯、或基因療法。
用CRISPR-Cas系統或複合物修飾靶標
在一個方面,本發明提供了修飾真核細胞中的靶多核苷酸之方法,該等方法可以在體內、離體或在體外。在一些實施方式中,該方法包括對來自人或非人動物的細胞或細胞群進行取樣,並且修飾該細胞或該等細胞。培養可以發生在離體的任何階段。該細胞或該等細胞甚至可以被重新引入該非人動物或植物中。對於重新引入的細胞,特別較佳的是該等細胞係幹細胞。
在一些實施方式中,該方法包括允許CRISPR複合物結合到該靶多核苷酸上以實施所述靶多核苷酸的切割,由此修飾該靶多核苷酸,其中該CRISPR複合物包括與雜交或可雜交到在所述靶多核苷酸內的靶序列上的指導序列複合的CRISPR酶,其中所述指導序列連接到tracr配 對序列上,該tracr配對序列進而雜交到tracr序列上。
在一個方面,本發明提供了修飾多核苷酸在真核細胞中的表現之方法。在一些實施方式中,該方法包括允許CRISPR複合物結合到該多核苷酸上,這樣使得所述結合導致所述多核苷酸的表現增加或降低;其中該CRISPR複合物包括與雜交或可雜交到在所述多核苷酸內的靶序列上的指導序列複合的CRISPR酶,其中所述指導序列連接到tracr配對序列上,該tracr配對序列進而雜交到tracr序列上。類似的考慮因素和條件適用如上文針對修飾靶多核苷酸之方法。事實上,該等取樣、培養和重新引入選擇跨本發明的多個方面而適用。
確實,在本發明的任何方面,該CRISPR複合物可以包括與雜交或可雜交到靶序列上的指導序列複合的CRISPR酶,其中所述指導序列可以連接到tracr配對序列上,該tracr配對序列進而可以雜交到tracr序列上。類似的考慮因素和條件適用如上文針對修飾靶多核苷酸之方法。
因此,在此描述的、非天然存在的CRISPR酶中的任何一種包括至少一個修飾,並且由此該酶具有某些改進的能力。具體地,該等酶中的任一種能夠與指導RNA形成CRISPR複合物。當這種複合物形成時,該指導RNA能夠結合至靶多核苷酸序列上,並且該酶能夠改變靶座位。此外,與未修飾的酶相比,在該CRISPR複合物中的酶具有降低的修飾一個或多個脫靶座位的能力。
此外,與未修飾的酶相比,本文描述的修飾的CRISPR酶包含這樣的酶,由此其在CRISPR複合物中該酶具有增加的修飾一個或多個靶座位的能力。這種功能可以單獨或與降低的修飾一個或多個脫靶位 點的能力的上述功能組合提供。任何此類酶可以被提供為具有對如本文描述的CRISPR酶的任一種另外修飾,例如與由一種或多種相關異源功能結構域提供的任何活性、用以降低核酸酶活性的任何另外突變等相組合。
在本發明的有利的實施方式中,經修飾的CRISPR酶被提供為與未修飾的酶相比具有降低的修飾一個或多個脫靶位點的能力,並且與未修飾的酶相比具有增加的修飾一個或多個靶座位的能力。與對酶的另外修飾相組合,可以實現顯著增強特異性。例如,提供了此類有利實施方式與一種或多種另外的突變的組合,其中該一種或多種另外的突變係在一個或多個催化活性結構域中。此類另外的催化突變可以賦予切口酶如本文其他處詳細描述的切口酶功能性。在此類酶中,可以由於在酶活性方面改進的特異性實現增強的特異性。
如以上所述用以降低脫靶效應和/或增強靶標效應的修飾可以被製成位於帶正電荷的區域/凹槽中的胺基酸殘基,該帶正電荷的區域/凹槽位於RuvC-III和HNH之間。應當理解的是,可以藉由修飾上述凹槽內的胺基酸,但還要藉由修飾鄰近於該凹槽或其外部的胺基酸來實現上述任何功能性作用。
可以被工程化到如在此描述的經修飾的CRISPR酶中的另外的功能性包括以下該等。1.經修飾的CRISPR酶,其破壞DNA:蛋白質相互作用而不影響蛋白質三級或二級結構。這包括接觸RNA:DNA雙股體任何部分的殘基。2.經修飾的CRISPR酶,其弱化蛋白內相互作用,該蛋白內相互作用使Cas9保持響應於DNA結合(靶標或脫靶)的核酸酶切割所必需的構象。例如:輕度抑制、但仍然允許HNH結構域(定位在易 切斷的磷酸酯處)的核酸酶構象的修飾。3.經修飾的CRISPR酶,其強化蛋白內相互作用,該蛋白內相互作用使Cas9保持對響應於DNA結合(靶標或脫靶)的核酸酶活性進行抑制的構象。例如:將HNH結構域穩定在遠離易切斷的磷酸酯的構象中的修飾。任何此類另外的功能增強可以與對如本文中其他地方所詳細描述的CRISPR酶進行的任何其他修飾組合提供。
任何在此描述的改進的功能性可以被製成任何CRISPR酶(如Cas9酶)。在此描述的Cas9酶衍生自來自釀膿鏈球菌和金黃色葡萄球菌的Cas9酶。然而,應當理解的是,可以將在此描述的任何功能性工程化到來自其他異種同源物的Cas9酶中,包括包含來自多個異種同源物的片段的嵌合酶。此類異種同源物的實例可以見於例如圖8和圖9中,如在此描述的。
本發明使用核酸來結合靶TDNA序列。這係有利的,因為產生核酸比產生蛋白質容易且價廉得多,並且特異性可以根據其中尋求同源性的拉伸長度而變化。例如多指的複雜3-D複雜定位係不需要的。術語“多核苷酸”、“核苷酸”、“核苷酸序列”、“核酸”和“寡核苷酸”可互換地使用。它們係指具有任何長度的核苷酸的聚合形式,係去氧核糖核苷酸或核糖核苷酸、或其類似物。多核苷酸可具有任何三維結構,並且可以執行已知或未知的任何功能。以下是多核苷酸的非限制性實例:基因或基因片段的編碼區或非編碼區、根據連接分析定義的多個座位(一個座位)、外顯子、內含子、信使RNA(mRNA)、轉運RNA、核糖體RNA、短干擾RNA(siRNA)、短髮夾RNA(shRNA)、micro-RNA (miRNA)、核酶、cDNA、重組多核苷酸、分支多核苷酸、質粒、載體、任何序列的分離的DNA、任何序列的分離的RNA、核酸探針、和引物。該術語還涵蓋具有合成骨架的核酸樣結構,參見,例如,埃克斯坦(Eckstein),1991;巴塞加(Baserga)等人,1992;米利根(Milligan),1993;WO 97/03211;WO 96/39154;馬塔(Mata),1997;施特勞斯-紹庫普(Strauss-Soukup),1997;和紮姆斯塔(Samstag),1996。多核苷酸可以包含一個或多個經修飾的核苷酸,如甲基化的核苷酸和核苷酸類似物。如果存在,可以在聚合物組裝之前或之後進行核苷酸結構的修飾。核苷酸的序列可以被非核苷酸組分中斷。多核苷酸可以在聚合後,如藉由與標記的組分綴合來進一步修飾。如本文所用的術語“野生型”係熟習該項技術者所理解的術語,並且表示生物、菌株、基因的典型形式或者當它在自然界存在時區別於突變體或變體形式的特徵。“野生型”可以是基線。如本文所用的術語“變體”應當被理解為表示具有衍生自在自然界中存在的模式的性質的展示。術語“非天然存在的”或“工程化的”可互換地使用並且表面人工的參與。該等術語,當指核酸分子或多肽時,表示該核酸分子或多肽至少基本上從它們在自然界中或如發現於自然界中的與其結合的至少另一種組分游離出來。“互補性”係指核酸與另一個核酸序列借助於傳統的沃森-克裡克鹼基配對或其他非傳統類型形成一個或多個氫鍵的能力。互補百分比表示一個核酸分子中可與一個第二核酸序列形成氫鍵(例如,沃森-克裡克鹼基配對)的殘基的百分比(例如,10個之中有5、6、7、8、9、10個即為50%、60%、70%、80%、90%、和100%互補)。“完全互補”表示一個核酸序列的所有連續殘基與一個第二核酸序列中的相同數目的連續殘基形成氫鍵。如本文使用的 “基本上互補”係指在具有8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50個或更多個核苷酸的區域上至少為60%、65%、70%、75%、80%、85%、90%、95%、97%、98%、99%、或100%的互補程度,或者係指在嚴格條件下雜交的兩個核酸。如本文使用的對於雜交的“嚴格條件”係指與靶序列具有互補性的一核酸主要地與該靶序列雜交並且基本上不雜交到非靶序列上的條件。嚴格條件通常是序列依賴性的,並且取決於許多因素而變化。一般而言,該序列越長,則該序列特異性地雜交到其靶序列上的溫度就越高。嚴格條件的非限制性實例在蒂森(Tijssen)(1993)的《生物化學和分子生物學中的實驗室技術-核酸探針雜交》(Laboratory Techniques In Biochemistry And Molecular Biology-Hybridization With Nucleic Acid Probes),第I部分,第二章,“雜交原理概述和核酸探針分析策略”(“Overview of principles of hybridization and the strategy of nucleic acid probe assay”),愛思唯爾(Elsevier),紐約,中有詳述。在提及一個多核苷酸序列時,那麼也設想了互補的或部分互補的序列。能夠在高嚴格條件下雜交到參考序列上的該等序列係較佳的。通常,為了使雜交率最大化,選擇了相對低嚴格性的雜交條件:低於熱熔點(Tm)約20℃到25℃。Tm係50%的特異性靶序列在具有規定的離子強度和pH的溶液中雜交到完全互補的探針上的溫度。通常,為了要求雜交序列的至少約85%的核苷酸互補性,高嚴格洗滌條件被選擇為低於Tm約5℃到15℃。為了要求雜交序列的至少約70%的核苷酸互補性,中等嚴格洗滌條件被選擇為低於Tm約15℃到30℃。高容許(極低嚴格性)洗滌條件可以低至在Tm之下50℃,從而允許在雜交序列之間的高水平錯配。熟習該項技術者將認識到,在 雜交和洗滌階段中的其他物理和化學參數也可以改變,從而影響來自在靶序列與探針序列之間的特定同源性水平的可檢測雜交信號的結果。較佳的高嚴格條件包括在50%甲醯胺、5×SSC、和1% SDS中在42℃培養,或者在5×SSC和1% SDS中在65℃培養,在0.2×SSC和0.1% SDS中在65℃洗滌。“雜交”係指其中一個或多個多核苷酸反應形成一種複合物的反應,該複合物經由該等核苷酸殘基之間的鹼基的氫鍵鍵合而穩定化。氫鍵鍵合可以借助於沃森-克裡克鹼基配對、Hoogstein結合或以任何其他序列特異性方式而發生。該複合物可包含形成雙股體的兩條股、形成多股複合物的三條或多條股、單個自我雜交股、或該等的任何組合。雜交反應可以構成更廣泛的過程(如PCR的開始、或經由一種酶的多核苷酸的切割)中的步驟。能夠與給定序列雜交的序列被稱為該給定序列的“互補物”。如本文使用的,術語“基因組座位(locus)”或“座位(locus)”(複數係座位(loci))係在染色體上的基因或DNA序列的特定位置。“基因”係指編碼多肽或RNA股的DNA或RNA的段(stretch),其在生物中發揮功能作用並且因此係活生物體遺傳的分子單元。出於本發明的目的,可以考慮包括調節基因產物的產生的區域的基因,而不論這樣的調節序列是否接近編碼和/或轉錄的序列。因此,基因包括而不必限於,啟動子序列、終止子、翻譯調節序列(如核糖體結合位點和內部核糖體進入位點)、增強子、沈默子、隔離子、邊界元件、複製起點、核基質附著位點和座位控制區。如本文使用的“基因組座位的表現”或“基因表現”係藉此在功能性基因產物的合成中使用來自基因的資訊的過程。基因表現的產物常常是蛋白質,但是在非蛋白質編碼基因如rRNA基因或tRNA基因中,產物係功能性RNA。基因表現的過程由所有已知的 生物利用-產生功能性產物以便存活的真核生物(包括多細胞生物)、原核生物(細菌和古細菌)以及病毒。如本文使用的基因或核酸的“表現”不僅涵蓋細胞基因表現,而且涵蓋在選殖系統中或在任何其他背景下的一個或多個核酸的轉錄和翻譯。如本文使用的“表現”係指藉此從DNA模板轉錄成多核苷酸(如轉錄成mRNA或其他RNA轉錄物)的過程和/或轉錄的mRNA隨後藉此翻譯成肽、多肽或蛋白質的過程。轉錄物和編碼的多肽可以總稱為“基因產物”。如果多核苷酸來源於基因組DNA,表現可以包括真核細胞中mRNA的剪接。術語“多肽”、“肽”和“蛋白質”在本文可互換地使用,係指具有任何長度的胺基酸的聚合物。該聚合物可以是可以是直鏈或支鏈的,它可以包含修飾的胺基酸,並且它可以被非胺基酸中斷。該等術語還涵蓋已經被修飾的胺基酸聚合物;該等修飾例如二硫鍵形成、糖基化、脂化(lipidation)、乙醯化、磷酸化、或任何其他操縱,如與標記組分的綴合。如本文使用的術語“胺基酸”包括天然的和/或非天然的或者合成的胺基酸,包括甘胺酸以及D和L旋光異構物、以及胺基酸類似物和肽模擬物。如本文使用的,術語“結構域”或“蛋白質結構域”係指可以獨立於該蛋白質鏈的其餘部分而存在並且起作用的蛋白質序列的一部分。正如在本發明的多個方面中所描述,序列一致性與序列同源性有關。可以藉由肉眼、更通常地借助於可得的序列比較程式來進行同源性比較。該等可商購的電腦程式可以計算在兩個或更多個序列之間的同源性的百分比(%)並且還可以計算由兩個或更多個胺基酸或核酸序列共用的序列一致性。在一些較佳的實施方式中,本文描述的dTALE的封端區具有與本文提供的封端區胺基酸序列至少95%一致性或共用一致性的序列。可以藉由本領域已知的許多電腦程式(例 如BLAST或FASTA等等)來生成序列同源性。用於進行這樣的比對的適合的電腦程式係GCG威斯康辛Bestfit套裝軟體(威斯康辛大學,美國;德弗羅(Devereux)等人,1984,《核酸研究》(Nucleic Acids Research)12:387)。可以進行序列比較的其他軟體的實例包括但不限於,BLAST套裝軟體(參見奧蘇貝爾(Ausubel)等人,1999,出處同上-第18章)、FASTA(阿爾丘爾(Atschul)等人,1990,《分子生物學雜誌》(J.Mol.Biol.),403-410)以及GENEWORKS系列比較工具。BLAST和FASTA均可用於離線和線上搜索(參見奧蘇貝爾(Ausubel)等人,1999,出處同上,7-58頁到7-60頁)。然而,較佳的是使用GCG Bestfit程式。可以計算在連續序列上的序列同源性百分比(%),即,將一個序列與另一個序列比對,並且將一個序列中的每個胺基酸或核苷酸與另一個序列中的相應胺基酸或核苷酸直接進行比較,一次比較一個殘基。這被稱為“無空位”比對。典型地,這樣的無空位比對僅僅在較少數目的殘基上進行。雖然這係一種非常簡單和一致之方法,但是它未能考慮的是,例如,在其他方面完全相同的序列對中,一個插入或缺失可以引起隨後的胺基酸殘基被排除在比對之外,因此當進行全域比對時可能導致在同源性%上的大幅降低。因此,大多數序列比較方法被設計為產生考慮到可能的插入和缺失的優化比對,而沒有過度地使總體同源性或一致性評分不利。這係藉由在序列比對中插入“空位”來實現的,以便試圖將局部同源性或一致性最大化。然而,該等更複雜的方法向出現在該比對中的每個空位分配“空位罰分”,從而對於相同數目的一致的胺基酸而言,具有盡可能少的空位的序列比對-反映了在這兩個比較的序列之間的更高關聯性-可以比具有許多空位者實現更高的得分。“親合空位成本”(“Affinity gap costs”) 典型地用於對空位的存在要求相對高的成本並對空位中的每個後續殘基施加較小的罰分。這係最常用的空位評分系統。高空位罰分當然將產生具有更少空位的最佳比對。大多數比對程式允許修改空位罰分。然而,當使用這種序列比較軟體時較佳的是使用預設值。例如當使用GCG威斯康辛Bestfit套裝軟體時,胺基酸序列的默認空位罰分為對於每個空位的-12,以及對於每個延伸的-4。因此計算最大同源性%首先要求產生最佳比對,考慮空位罰分。用於進行這樣的比對的適合的電腦程式係GCG威斯康辛Bestfit套裝軟體(德弗羅(Devereux)等人,1984,《核酸研究》(Nuc.Acids Research)12 p387)。可以進行序列比較的其他軟體的實例包括但不限於,BLAST套裝軟體(參見奧蘇貝爾(Ausubel)等人,1999《精編分子生物學實驗指南》(Short Protocols in Molecular Biology),第4次編輯 第18章)、FASTA(阿爾丘爾(Altschul)等人,1990《分子生物學雜誌》(J.Mol.Biol.403-410)以及GENEWORKS系列比較工具。BLAST和FASTA均可用於離線和線上搜索(參見奧蘇貝爾(Ausubel)等人,1999,《精編分子生物學實驗指南》(Short Protocols in Molecular Biology),7-58頁到7-60頁)。然而,對於一些應用,較佳的是使用GCG Bestfit程式。一種新的工具,稱為BLAST 2序列,也可用於比較蛋白質和核苷酸序列(參見《歐洲微生物學會聯合會微生物學快報》(FEMS Microbiol Lett.)1999174(2):247-50;FEMS Microbiol Lett.1999 177(1):187-8以及在國立衛生研究院的網址的國家生物技術資訊中心的網址)。雖然最終同源性%可以按照一致性進行測量,但是比對過程自身典型地不是基於全或無配對比較(all-or-nothing pair comparison)。相反,通常使用尺度相似性評分矩陣(scaled similarity score matrix),基於化學相似性或進化距離對各個成對 比較評分。通常使用的這種矩陣的實例為BLOSUM62矩陣-BLAST系列程式的預設矩陣。GCG威斯康辛程式通常使用公開的預設值或自訂符號比較表(更多細節詳見用戶手冊)。對於一些應用,較佳的是使用GCG套裝軟體的公共預設值,或在其他軟體情況下的預設矩陣,如BLOSUM62。可替代地,可以基於類似於CLUSTAL(希金斯DG(Higgins DG)和夏普PM(Sharp PM)(1988),《基因》(Gene)73(1),237-244)的演算法,使用在DNASISTM(日立軟體公司(Hitachi Software))中的多重比對特徵來計算同源性百分比。一旦軟體已經產生最佳比對,就有可能計算同源性%,較佳的是序列一致性%。軟體典型地這樣進行,作為序列比較的一部分,並且產生數位結果。該等序列也可以具有胺基酸殘基的缺失、插入或取代,其產生沈默變化並生成功能上等同的物質。可以基於胺基酸特性(如殘基的極性、電荷、可溶性、疏水性、親水性、和/或兩親性)的相似性做出有意胺基酸取代,並且因此它在將胺基酸集合成官能團中是有用的。可以僅僅基於胺基酸的側鏈特性將它們集合在一起。然而,包括突變數據同樣係更有用的。出於結構原因,如此衍生的胺基酸的集合很有可能是保守性的。該等集合可以被描述為文氏圖形式(Venn diagram)(利文斯敦C.D.(Livingstone C.D.)和巴頓G.J.(Barton G.J.)(1993)““蛋白質序列比對:用於殘基保守些的分級分析的策略”(“Protein sequence alignments:a strategy for the hierarchical analysis of residue conservation”)《生物科學計算應用》(Comput.Appl.Biosci.)9:745-756)(泰勒(Taylor)W.R.(1986)“胺基酸保守性的分類”(“The classification of amino acid conservation”)《理論生物學雜誌》(J.Theor.Biol.)119;205-218)。例如可以根據下表做出保守性取代,該表描述了普遍接受的胺 基酸的文氏圖分組。
Figure 112128864-A0101-12-0453-251
本發明的實施方式包括可包含同源取代(本文使用取代和置換兩者來表示現有胺基酸殘基或核苷酸與替代殘基和核苷酸之間的互換)的序列(多核苷酸或多肽兩者),該同源取代,即,在胺基酸的情況下發生同類取代(like-for-like substitution),如鹼性對鹼性、酸性對酸性、極性對極性。也可以發生非同源取代,即,從一類殘基到另一類殘基,或者可替代地涉及包含非天然胺基酸如鳥胺酸(在下文稱為Z)、二胺基丁酸鳥胺酸(在下文稱為B)、正亮胺酸鳥胺酸(在下文稱為O)、吡啶基丙胺酸、噻吩基丙胺酸、萘基丙胺酸和苯基甘胺酸。變體胺基酸序列可以包括適合的可插入在該序列的任何兩個胺基酸殘基之間的間隔基團,包括除了胺基酸間隔物(如甘胺酸或β-丙胺酸殘基)之外的烷基基團,如甲基、乙基或丙基基團。一另外的變化形式,其涉及處於類肽形式的一個或多個胺基酸殘基的存在,也是熟習該項技術者熟知的。為避免疑義,“該類肽形式”用來指代變體胺基酸殘基,其中該α-碳取代基在該殘基 的氮原子上,而不是在該α-碳上。用於製備處於該類肽形式的肽之方法係本領域已知的,例如西蒙RJ(Simon RJ)等人,PNAS(1992)89(20),9367-9371和豪威爾DC(Horwell DC),《生物技術趨勢》(Trends Biotechnol.)(1995)13(4),132-134。
同源建模:其他Cas9異種同源物中的相應殘基可以藉由張(Zhang)等人,2012(《自然》(Nature);490(7421):556-60)和陳(Chen)等人,2015(《PLoS計算生物學》(PLoS Comput Biol);11(5):E1004248)的方法進行鑒定-計算蛋白質-蛋白質相互作用(PPI)方法用以預測由結構域-模體介面介導的相互作用。PrePPI(預測PPI),基於結構的PPI預測方法,使用貝葉斯統計框架(Bayesian statistical framework)將結構證據與非結構證據相結合。該方法涉及取一對查詢蛋白並使用結構比對以便鑒別與它們實驗確定的結構或同源性模型相對應的結構代表。藉由考慮總體和局部幾何關係,將結構比對進一步用於鑒別接近和遙遠的結構鄰居。每當結構代表的兩個鄰居形成報導於蛋白質資料庫(Protein Data Bank)中的複合物,這限定了用於建模兩個查詢蛋白之間相互作用的模板。藉由將代表性結構疊加在模板中它們對應的結構鄰居上來產生複合物的模型。此途徑在戴伊(Dey)等人,2013(《蛋白質科學》(Prot Sci);22:359-66)中。
出於本發明的目的,擴增意指利用引物和聚合酶的能夠以合理的保真度複製靶序列的任何方法。可以藉由天然或重組DNA聚合酶,如TaqGoldTM、T7 DNA聚合酶、大腸桿菌DNA聚合酶的Klenow片段以及逆轉錄酶進行擴增。一較佳的擴增方法係PCR。
在某些方面,本發明涉及載體。如本文使用的,“載體”係一允許或促進實體從一個環境轉移到另一個環境中的工具。它係複製子,如質粒、噬菌體、或粘粒,另一個DNA片段可以插入其中,從而引起該插入的片段的複製。通常,當與適當的控制元件關聯時,載體能夠複製。一般而言,術語“載體”係指核酸分子,其能夠運送與其連接的另一種核酸分子。載體包括但不限於,單股、雙股、或部分雙股的核酸分子;包括一個或多個自由端、無自由端(例如環狀的)的核酸分子;包括DNA、RNA、或兩者的核酸分子;以及本領域已知的其他多種多樣的多核苷酸。一種類型的載體係“質粒”,其係指其中可以例如藉由標準分子選殖技術插入另外的DNA片段的環狀雙股DNA環。另一種類型的載體係病毒載體,其中病毒衍生的DNA或RNA序列存在於用於包裝病毒(例如,逆轉錄病毒、複製缺陷型逆轉錄病毒、腺病毒、複製缺陷型腺病毒、以及腺相關病毒(AAV))的載體中。病毒載體還包含由用於轉染到宿主細胞中的病毒攜帶的多核苷酸。某些載體(例如,具有細菌複製起點的細菌載體和附加型哺乳動物載體)能夠在它們被導入的宿主細胞中自主複製。其他載體(例如,非附加型哺乳動物載體)在引入宿主細胞後整合到該宿主細胞的基因組中,並且由此與該宿主基因組一起複製。而且,某些載體能夠指導它們可操作連接的基因的表現。這樣的載體在此被稱為“表現載體”。在重組DNA技術中使用的普通表現栽體通常是質粒形式。
重組表現載體可包含處於適合於在宿主細胞中的核酸表現的形式的本發明的核酸,這意味著該等重組表現載體包含基於待用於 表現的宿主細胞而選擇的一種或多種調節元件,所述調節元件可操作地連接至待表現的核酸序列。在重組表現載體內,“可操作地連接”旨在表示感興趣的核苷酸序列以允許該核苷酸序列的表現的方式被連接至該一種或多種調節元件(例如,處於體外轉錄/翻譯系統中或當該載體被引入到宿主細胞中時,處於該宿主細胞中)。關於重組和選殖方法,提及2004年9月2日以US 2004-0171156 A1公開的美國專利申請10/815,730,該專利的內容藉由引用以其全文併入本文。
本發明的多個方面涉及用於嵌合的RNA與經修飾的或突變的CRISPR酶(例如,Cas9)的雙順反子載體。用於嵌合的RNA與經修飾的或突變的CRISPR酶的雙順反子表現載體係較佳的。一般而言並且特別地,在這個實施方式中,經修飾的或突變的CRISPR酶較佳的是由CBh啟動子驅動。嵌合RNA可以較佳的是由Pol III啟動子(如U6啟動子)驅動。理想地,將這兩者結合。嵌合的指導RNA典型地由20bp指導序列(N)組成並且這可以接合到tracr序列上(從下股的第一個“U”到該轉錄物的結尾)。該tracr序列可以在如指示的不同位置被截短。指導序列和tracr序列被該tracr配對序列隔開,該tracr配對序列可以是GUUUUAGAGCUA。這之後可以是如所示的環序列GAAA。這兩者都係較佳的實例。申請人已經藉由SURVEYOR測定證明了在人EMX1PVALB座位處的Cas9介導的indel。ChiRNA由其“+n”標誌指示,並且crRNA係指指導序列和tracr序列被表現為分開的轉錄物的雜交體RNA。貫穿本申請,嵌合RNA也可以被稱為單指導、或合成指導RNA(sgRNA)。該環較佳的是係GAAA,但是並並限於這個序列或者實際上在長度上僅僅為4bp。實際上,用於在 髮夾結構中使用的較佳的是環形成序列在長度上為四個核苷酸,並且最較佳的是具有序列GAAA。然而,可以使用更長或更短的環序列,正如可替代的序列。該等序列較佳的是包括三聯體(例如,AAA)、和另外的核苷酸(例如C或G)。環形成序列的實例包括CAAA和AAAG。在實踐在此揭露的任何方法中,可以經由本領域已知的一種或多種方法將適合的載體引入進細胞或胚胎中,該等方法包括但不限於,顯微注射、電穿孔、聲致穿孔、基因槍、磷酸鈣介導的轉染、陽離子轉染、脂質體轉染、樹枝狀聚合物轉染、熱休克轉染、核轉染、磁轉染、脂轉染、刺穿轉染(impalefection)、光學轉染、專有劑增強的核酸攝取以及經由脂質體、免疫脂質體、病毒顆粒或人工病毒體進行遞送。在一些方法中,藉由顯微注射將該載體引入進胚胎中。可以將這個或該等載體顯微注射進胚胎的細胞核或細胞質中。在一些方法中,藉由核轉染將這個或該等載體引入進細胞中。
術語“調節元件”旨在包括啟動子、增強子、內部核糖體進入位點(IRES)、和其他表現控制元件(例如轉錄終止信號,如多聚腺苷酸化信號和多聚U序列)。這樣的調節元件在例如戈德爾(Goeddel),《基因表現技術:酶學方法》(GENE EXPRESSION TECHNOLOGY:METHODS IN ENZYMOLOGY)185,學術出版社(Academic Press),聖地牙哥(San Diego),加利福尼亞州(1990)中。調節元件包括指導一核苷酸序列在許多類型的宿主細胞中的組成型表現的那些序列以及指導該核苷酸序列只在某些宿主細胞中表現的那些序列(例如,組織特異型調節序列)。組織特異型啟動子可主要指導在感興趣的期望組織中的表現, 所述組織例如肌肉、神經元、骨、皮膚、血液、特定的器官(例如肝臟、胰腺)、或特殊的細胞類型(例如淋巴細胞)。調節元件還可以時序依賴性方式(如以細胞週期依賴性或發育階段依賴性方式)指導表現,該方式可以是或者可以不是組織或細胞類型特異性的。在一些實施方式中,載體包含一個或多個pol III啟動子(例如1、2、3、4、5、或更多個pol III啟動子)、一個或多個pol II啟動子(例如1、2、3、4、5、或更多個pol II啟動子)、一個或多個pol I啟動子(例如1、2、3、4、5、或更多個pol I啟動子)、或其組合。pol III啟動子的實例包括但不限於U6和H1啟動子。pol II啟動子的實例包括但不限於逆轉錄勞斯肉瘤病毒(RSV)LTR啟動子(視情況具有RSV增強子)、巨細胞病毒(CMV)啟動子(視情況具有CMV增強子)[參見,例如,波沙特(Boshart)等人,《細胞》(Cell)41:521-530(1985)]、SV40啟動子、二氫葉酸還原酶啟動子、β-肌動蛋白啟動子、磷酸甘油激酶(PGK)啟動子、和EF1α啟動子。還被術語“調節元件”涵蓋的是增強子元件,如WPRE;CMV增強子;在HTLV-I的LTR中的R-U5’片段(《分子細胞生物學》(Mol.Cell.Biol.),第8(1)卷,第466-472頁,1988);SV40增強子;以及在兔β-珠蛋白的外顯子2與3之間的內含子序列(《美國國家科學院院刊》(Proc.Natl.Acad.Sci.USA.),第78(3)卷,第1527-31頁,1981)。熟習該項技術者應當理解的是,表現載體的設計可取決於比如待轉化的宿主細胞的選擇、所希望的表現水平等因素。載體可以被引入到宿主細胞中而由此產生轉錄物、蛋白質、或肽,包括由如本文描述的核酸編碼的融合蛋白或肽(例如,規律間隔成簇短迴文重複(CRISPR)轉錄物、蛋白質、酶、其突變體形式、其融合蛋白等)。關於調節序列,提及美國專利申請10/491,026,該專利的內容藉由引用以其 全文併入本文。關於啟動子,提及PCT公開WO 2011/028929和美國申請12/511,940,該等專利的內容藉由引用以其全文併入本文。
載體可以被設計為用於在原核或真核細胞中表現CRISPR轉錄物(例如核酸轉錄物、蛋白質、或酶)。例如,CRISPR轉錄物可表現於例如大腸桿菌的細菌細胞、昆蟲細胞(使用桿狀病毒表現載體)、酵母細胞、或哺乳動物細胞中。適合的宿主細胞進一步討論於Goeddel(戈德爾),《基因表現技術:酶學方法》(GENE EXPRESSION TECHNOLOGY:METHODS IN ENZYMOLOGY)185,學術出版社(Academic Press),聖地牙哥(San Diego),加利福尼亞州(Calif.)(1990年)中。可替代地,重組表現載體可在體外例如使用T7啟動子調節序列和T7聚合酶來轉錄和翻譯。
載體可以被引入原核生物或原核細胞中並且在其中增殖。在一些實施方式中,原核生物用來擴增有待引入真核細胞中的載體的多個拷貝,或者作為有待引入真核細胞中的載體的產生中的中間載體(例如,擴增質粒作為病毒載體包裝系統的一部分)。在一些實施方式中,原核生物用來擴增一載體的多個拷貝並且表現一種或多種核酸,如提供用於遞送到宿主細胞或宿主生物中的一種或多種蛋白質的來源。蛋白質在原核生物中的表現最經常在大腸桿菌中用含有指導融合或非融合蛋白的表現的組成型或誘導型啟動子的載體來進行。融合載體將多個胺基酸添加到在其中編碼的蛋白質上,如該重組蛋白的胺基端上。這樣的融合載體可以用於一個或多個目的,如:(i)增加重組蛋白的表現;(ii)增加重組蛋白的溶解性;以及(iii)藉由在親和純化中充當配位基來輔助 重組蛋白的純化。通常,在融合表現載體中,將蛋白切割位點引入至融合部分與重組蛋白的接合處以使得能夠在純化融合蛋白之後將重組蛋白與融合部分分離。這類酶以及它們的同源識別序列包括因子Xa、凝血酶以及腸激酶。示例性融合表現載體包括pGEX(發瑪西亞生物技術有限公司(Pharmacia Biotech Inc);史密斯和詹森,1988.《基因》(Gene)67:31-40)、pMAL(紐英倫生物技術公司(New England Biolabs),貝芙麗(Beverly),麻塞諸塞州(Mass.))以及pRIT5(發瑪西亞公司,皮斯卡塔韋(Piscataway),新澤西州(N.J.)),它們分別將穀胱甘肽S-轉移酶(GST)、麥芽糖E結合蛋白或蛋白A融合至靶重組蛋白。適合的誘導型非融合大腸桿菌表現載體的實例包括pTrc(阿姆蘭(Amrann)等人,(1988)《基因》(Gene)69:301-315)以及pET 11d(斯圖迪爾(Studier)等人,《基因表現技術:酶學方法》(GENE EXPRESSION TECHNOLOGY:METHODS IN ENZYMOLOGY)185,學術出版社(Academic Press),聖地牙哥(San Diego),加利福尼亞州(Calif.)(1990)60-89)。在一些實施方式中,載體係酵母表現載體。用於在酵母釀酒中表現的載體的實例包括pYepSec1(巴爾戴利(Baldari)等人,1987,《歐洲分子生物學學會雜誌》(EMBO J)6:229-234)、pMFa(庫爾堅(Kurjan)和赫斯庫伍特茲(Herskowitz),1982,《細胞》(Cell)30:933-943)、pJRY88(舒爾茨(Schultz)等人,1987,Gene 54:113-123),pYES2(Invitrogen Corporation(英傑公司),San Diego(聖地牙哥),Calif(加利福尼亞州))、以及picZ(Invitrogen Corp(英傑公司),San Diego(聖地牙哥),Calif(加利福尼亞州))。在一些實施方式中,使用桿狀病毒載體,載體驅動昆蟲細胞中的蛋白質表現。可用於在培養的昆蟲細胞(例如,SF9細胞)中表現蛋白 質的桿狀病毒載體包括pAc系列(史密斯(Smith)等人,1983,Mol.Cell.Biol.)3:2156-2165)和pVL系列(拉克瑙(Lucklow)和薩莫斯(Summers),1989,《病毒學》(Virology)170:31-39)。
在一些實施方式中,使用哺乳動物表現載體,載體能夠驅動一種或多種序列在哺乳動物細胞中表現。哺乳動物表現載體的實例包括pCDM8(錫德(Seed),1987,《自然》(Nature)329:840)和pMT2PC(考夫曼(Kaufman)等人,1987,《歐洲分子生物學學會雜誌》(EMBO J.)6:187-195)。當用於哺乳動物細胞中時,表現載體的控制功能典型地由一種或多種調節元件提供。例如,常用的啟動子來源於多瘤、腺病毒2、巨細胞病毒、猿猴病毒40、以及本文所述和本領域已知的其他病毒。對於用於原核細胞和真核細胞兩者的其他適合的表現系統參見例如薩姆布魯克(Sambrook)等人的《分子選殖實驗指南》(Molecular Cloning:A Laboratory Manual.)(第2版)的第16和第17章,冷泉港實驗室(Cold Spring Harbor Laboratory),冷泉港實驗室出版社(Cold Spring Harbor Laboratory Press),冷泉港(Cold Spring Harbor),紐約,1989。
在一些實施方式中,重組哺乳動物表現載體能夠指導核酸優先在特定細胞類型中表現(例如,使用組織特異型調節元件來表現核酸)。組織特異型調節元件係本領域中已知的。適合的組織特異型啟動子的非限制性實例包括白蛋白啟動子(肝臟特異性的;平克特(Pinkert)等人,1987.Genes Dev.1:268-277),淋巴特異性啟動子(卡裡曼(Calame)和伊頓(Eaton),1988.Adv.Immunol.43:235-275),特別是T細胞受體的啟動子(維納圖(Winoto)和巴爾迪莫(Baltimore),1989.《歐洲分子生物 學學會雜誌》(EMBO J.)8:729-733)和免疫球蛋白(巴納吉(Baneiji)等人,1983.《細胞》(Cell)33:729-740;奎恩(Queen)和巴爾迪莫(Baltimore),1983.《細胞》(Cell)33:741-748),神經元特異性啟動子(例如,神經絲啟動子;伯恩(Byrne)和魯德爾(Ruddle),1989.Proc.Natl.Acad.Sci.USA)86:5473-5477),胰腺特異性啟動子(艾德蘭德(Edlund)等人,1985.《科學》(Science)230:912-916),以及乳腺特異性啟動子(例如,乳清啟動子;美國專利案號4,873,316和歐洲申請公開號264,166)。還涵蓋發育型調節啟動子,例如,鼠科動物同源框蛋白(hox)啟動子凱賽爾((Kessel)和格魯斯(Gruss),1990.《科學》(Science)249:374-379)和α-甲胎蛋白啟動子(卡姆皮斯(Campes)和蒂爾曼(Tilghman),1989.Genes Dev.3:537-546)。關於該等原核和真核載體,提及美國專利6,750,059,該專利的內容藉由引用以其全文併入本文。本發明的其他實施方式可涉及病毒載體的使用,關於它提及美國專利申請13/092,085,該專利的內容藉由引用以其全文併入本文。組織特異型調節元件係本領域中已知的,並且在這個方面提及美國專利7,776,321,該專利的內容藉由引用以其全文併入本文。在一些實施方式中,調節元件可操作地連接至CRISPR系統的一個或多個元件,從而驅動該CRISPR系統的該一個或多個元件的表現。一般而言,CRISPR(規律間隔成簇短迴文重複),也稱為SPIDR(SPacer間隔開的同向重複),構成通常對於特定細菌物種而言特異性的DNA基因座的家族。該CRISPR座位包含在大腸桿菌中被識別的間隔開的短序列重複(SSR)的一個不同類(石野(Ishino)等人,《細菌學雜誌》(J.Bacteriol.),169:5429-5433[1987];和中田(Nakata)等人,《細菌學雜誌》(J.Bacteriol.),171:3553-3556[1989])、以及相關基因。 類似的間隔開的SSR已經鑒定於地中海富鹽菌(Haloferax mediterranei)、釀膿鏈球菌、魚腥藻屬、和結核分枝桿菌中(參見,格魯恩(Groenen)等人,《分子微生物學》(Mol.Microbiol.),10:1057-1065[1993];霍(Hoe)等人,《新發感染性疾病》(Emerg.Infect.Dis.),5:254-263[1999];馬斯波爾(Masepohl)等人,《生物化學與生物物理學學報》(Biochim.Biophys.Acta)1307:26-30[1996];and Mojica et al.,Mol.Microbiol.),17:85-93[1995])。該等CRISPR座位典型地不同於其他SSR的重複結構,該等重複已被稱為規律間隔的短重複(SRSR)(詹森(Janssen)等人,《OMICS:整合生物學雜誌》(OMICS J.Integ.Biol.),6:23-33[2002];以及莫吉卡(Mojica)等人,《分子微生物學》(Mol.Microbiol.),36:244-246[2000])。一般而言,該等重複係以簇存在的短元件,其被具有基本上恒定長度的獨特間插序列規律地間隔開(莫吉卡(Mojica)等人,[2000],同上)。雖然重複序列在菌株之間係高度保守的,許多間隔開的重複和該等間隔區的序列一般在菌株與菌株之間不同(馮.埃姆登(van Embden)等人,《細菌學雜誌》(J.Bacteriol.),182:2393-2401[2000])。已經在40種以上的原核生物中鑒定出CRISPR座位(參見,例如,詹森(Janssen)等人,《分子微生物學》(Mol.Microbiol.),43:1565-1575[2002];以及莫吉卡(Mojica)等人,[2005]),包括但不限於:氣火菌屬(Aeropyrum)、熱棒菌屬(Pyrobaculum)、硫化葉菌屬(Sulfolobus)、古球菌屬(Archaeoglobus)、鹽盒菌屬(Halocarcula)、甲烷桿菌屬(Methanobacterium)、甲烷球菌屬(Methanococcus)、甲烷八疊球菌屬(Methanosarcina)、甲烷火菌屬(Methanopyrus)、焦球菌屬(Pyrococcus)、嗜酸菌屬(Picrophilus)、熱原體屬(Thermoplasma)、棒 狀桿菌屬(Corynebacterium)、分枝桿菌屬(Mycobacterium)、鏈黴菌屬(Streptomyces)、產水菌屬(Aquifex)、紫單胞菌屬(Porphyromonas)、綠菌屬(Chlorobium)、棲熱菌屬(Thermus)、芽孢桿菌屬(Bacillus)、利斯特菌屬(Listeria)、葡萄球菌屬(Staphylococcus)、梭菌屬(Clostridium)、好熱厭氧桿菌屬(Thermoanaerobacter)、支原體屬(Mycoplasma)、梭桿菌屬(Fusobacterium)、固氮弓菌屬(Azarcus)、色桿菌屬(Chromobacterium)、奈瑟菌屬(Neisseria)、亞硝化單胞菌屬(Nitrosomonas)、脫硫弧菌屬(Desulfovibrio)、地桿菌屬(Geobacter)、粘球菌屬(Myxococcus)、彎曲桿菌屬(Campylobacter)、類桿菌屬(Wolinella)、不動桿菌屬(Acinetobacter)、歐文菌屬(Erwinia)、埃希菌屬(Escherichia)、軍團桿菌屬(Legionella)、甲基球菌屬(Methylococcus)、巴斯德菌屬(Pasteurella)、發光細菌屬(Photobacterium)、沙門菌屬(Salmonella)、黃單胞菌屬(Xanthomonas)、耶爾森菌屬(Yersinia)、密螺旋體屬(Treponema)以及棲熱袍菌屬(Thermotoga)。
在一些實施方式中,該CRISPR酶係包含一個或多個異源蛋白結構域(例如除了該CRISPR酶之外的約或多於約1、2、3、4、5、6、7、8、9、10個、或更多個結構域)的融合蛋白的一部分。CRISPR酶融合蛋白可以包含任何其他蛋白質,以及視情況在任何兩個結構域之間的連接序列。可以融合到CRISPR酶上的蛋白質結構域的實例包括但不限於,表位標籤、報告基因序列、以及具有下列活性的一者或多者的蛋白質結構域:修飾烷酶活性、去甲酶活性、轉錄活化活性、轉錄抑制活性、 轉錄釋放因子活性、組蛋白修飾活性、RNA切割活性和核酸結合活性。表位標籤的非限制性實例包括組胺酸(His)標籤、V5標籤、FLAG標籤、流感病毒血凝素(HA)標籤、Myc標籤、VSV-G標籤、和硫氧還蛋白(Trx)標籤。報告基因的實例包括,但不限於,穀胱甘肽-S-轉移酶(GST)、辣根過氧化物酶(HRP)、氯黴素乙醯轉移酶(CAT)、β-半乳糖苷酶、β-葡糖醛酸糖苷酶、螢光素酶、綠色螢光蛋白(GFP)、HcRed、DsRed、青螢光蛋白(CFP)、黃色螢光蛋白(YFP)、以包括藍色螢光蛋白(BFP)的自發螢光蛋白。CRISPR酶可以融合到編碼蛋白質或蛋白質片段的基因序列上,所述蛋白質或蛋白質片段結合DNA分子或結合其他細胞分子,其包括,但不限於,麥芽糖結合蛋白(MBP)、S-tag、Lex A DNA結合結構域(DBD)融合物、GAL4 DNA結合結構域融合物、以及單純皰疹病毒(HSV)BP16蛋白融合物。可以形成包含CRISPR酶的融合蛋白的一部分的另外的結構域在US 20110059502中,藉由引用將其併入本文。在一些實施方式中,使用標記的CRISPR酶來鑒定靶序列的位置。
除非另有說明,本發明的實踐採用免疫學、生物化學、化學、分子生物學、微生物學、細胞生物學、基因組學和重組DNA的常規技術,該等在本領域的技能之內。參見薩姆布魯克(Sambrook)、弗裡奇(Fritsch)和馬尼亞蒂斯(Maniatis),《分子選殖:實驗室手冊》(MOLECULAR CLONING:A LABORATORY MANUAL),第2次編輯(1989);《當代分子生物學實驗手冊》(CURRENT PROTOCOLS IN MOLECULAR BIOLOGY)(F.M.奧蘇貝爾(F.M.Ausubel)等人編輯,(1987));《酶學方法》(METHODS IN ENZYMOLOGY)系列(學術出 版公司):《PCR 2:實用方法》(PCR 2:A PRACTICAL APPROACH)(M.J.麥克弗森(M.J.MacPherson,B.D.Hames)和G.R.泰勒(Taylor)編輯(1995))、哈洛(Harlow)和拉內(Lane)編輯(1988)《抗體:實驗室手冊》(ANTIBODIES,A LABORATORY MANUAL),以及《動物細胞培養》(ANIMAL CELL CULTURE)(R.I.弗雷謝尼(R.I.Freshney)編輯(1987))。
遺傳以及表觀遺傳狀況的模型
可以使用本發明的方法產生可以用作疾病模型的植物、動物或細胞。如在此使用,“疾病”係指受試者的疾病、障礙或適應症。例如,可以使用本發明的方法產生以下動物或細胞,該動物或細胞在一個或多個與疾病相關的核酸序列中包括修飾,或以下植物、動物或細胞,一個或多個與疾病相關的核酸序列的表現在該植物、動物或細胞中被改變。這樣的核酸序列可以編碼疾病相關蛋白序列或可以是疾病相關控制序列。因此,應該理解的是在本發明的實施方式中,植物、受試者、患者、生物或細胞可以是非人受試者、患者、生物或細胞。因此,本發明提供了由本發明方法產生的植物、動物或細胞或其子代。該子代可以是產生的植物或動物的選殖或可以藉由與同一物種的其他個體雜交而由有性繁殖產生,以在其後代中基因滲入另外的令人希望的性狀。在多細胞生物(特別是動物或植物)的情況下,該細胞可以是在體內或離體的。在該細胞處於培養中的情況下,如果滿足適當的培養條件並且較佳的是,如果該細胞適合地適於此目的(例如,幹細胞),則可以建立細胞系。還設想了藉由本發明產生的細菌細胞系。因此,還設想了細胞系。
在一些方法中,可以使用疾病模型研究突變對動物或細胞的影響以及使用在疾病研究中常用的措施對疾病的發展和/或進展的影響。可替代地,這樣的一種疾病模型有用於研究藥物活性化合物對疾病的影響。
在一些方法中,可以使用疾病模型評估潛在的基因療法策略的效力。也就係說,可以將疾病相關基因或多核苷酸進行修飾,這樣使得疾病發展和/或進展被抑制或減少。具體而言,該方法包括修飾疾病相關基因或多核苷酸,這樣使得產生一改變的蛋白質,其結果係,該動物或細胞具有改變的反應。因此,在一些方法中,可以將基因修飾動物與易患該疾病的動物進行比較,這樣使得可以評估基因療法事件的效果。
在另一個實施方式中,本發明提供了一種研發生物活性劑之方法,該生物活性劑調製與疾病基因相關的細胞傳訊事件。該方法包括使測試化合物與細胞接觸,該細胞包括一種或多種載體,這一種或多種載體驅動CRISPR酶、連接到tracr配對序列上的指導序列和tracr序列中的一種或多種的表現;並且檢測讀出的變化,該變化指示與例如包含在該細胞中的疾病基因的突變相關的細胞傳訊事件的減少或增加。
可以與用於篩選細胞功能變化的本發明的方法組合構建細胞模型或動物模型。可以使用這樣的一種模型研究由本發明的CRISPR複合物修飾的基因組序列對感興趣的細胞功能的影響。例如,可以使用細胞功能模型研究修飾的基因組序列對細胞內傳訊或細胞外傳訊的影響。可替代地,可以使用細胞功能模型研究修飾的基因組序列對感知覺的影響。在一些這樣的模型中,修飾一個或多個與該模型中的傳訊生化 學途徑相關的基因組序列。
已經具體研究了若干疾病模型。該等疾病模型包括新生(de novo)自閉症風險基因CHD8、KATNAL2和SCN2A;以及綜合症性自閉症(安格曼綜合症(Angelman Syndrome))基因UBE3A。該等基因以及所得的自閉症模型當然係較佳的,但用於顯示本發明的跨基因和對應的模型的廣闊的適用性。
可以藉由當將測試模型細胞和對照細胞與候選試劑接觸時,測定它們之間的對應的基因的mRNA水平差異而確定一個或多個與傳訊生化途徑相關的基因組序列的改變的表現。可替代地,藉由檢測編碼的多肽或基因產物的水平差異而確定與傳訊生化途徑相關的序列的差異表現。
為了在mRNA轉錄物或對應的多核苷酸水平上測定試劑誘導的變化,首先根據本領域的標準方法提取包含在樣品中的核酸。例如,可以根據陳述於薩姆布魯克(Sambrook)等人(1989)中的程序使用各種水解酶分離mRNA或遵循由製造商提供的隨附說明書藉由核酸結合樹脂提取mRNA。然後,根據本領域廣泛已知的方法或基於在此示例之方法,藉由擴增程式或常規的雜交測定(例如Northern印跡分析)檢測包含在提取的核酸樣品中的mRNA。
出於本發明的目的,擴增意指利用引物和聚合酶的能夠以合理的保真度複製靶序列的任何方法。可以藉由天然或重組DNA聚合酶,如TaqGoldTM、T7 DNA聚合酶、大腸桿菌DNA聚合酶的Klenow片段以及逆轉錄酶進行擴增。一較佳的擴增方法係PCR。具體而言,可以使 分離的RNA經受逆轉錄測定,該測定與定量聚合酶鏈式反應(RT-PCR)耦合,以便定量與傳訊生化途徑相關的序列的表現水平。
在擴增測定中可以即時地執行基因表現水平的檢測。在一個方面,可以用螢光DNA結合劑直接使擴增產物視覺化,該等螢光DNA結合劑包括但不限於DNA嵌入劑和DNA溝結合劑。因為摻入進雙股DNA分子中的嵌入劑的量典型地與擴增DNA產物的量成比例,可以常規地藉由使用本領域的常規光學系統定量嵌入的染料的螢光而確定擴增產物的量。適於本申請的DNA結合染料包括SYBR綠、SYBR藍、DAPI、碘化丙錠(propidium iodine)、Hoeste、SYBR金、溴化乙錠(ethidium bromide)、吖啶、原黃素(proflavine)、吖啶橙、吖啶黃、氟香豆素(fluorcoumanin)、玫瑰樹鹼(ellipticine)、道諾黴素(daunomycin)、氯奎、偏端黴素(distamycin)D、色黴素(chromomycin)、乙菲啶(homidium)、光輝黴素(mithramycin)、多吡啶釕(ruthenium polypyridyl)、安麯黴素(anthramycin)等。
在另一個方面,可以在擴增反應中利用其他螢光標記物(如序列特異的探針),以促進擴增產物的檢測和定量。基於探針的定量擴增依賴於希望的擴增產物的序列特異的檢測。它利用螢光的靶標特異的探針(例如,TaqMan®探針),從而導致增加的特異性和敏感性。用於進行基於探針的定量擴增的方法本領域係確立的並且教導於美國專利案號5,210,015中。
在又另一個方面,可以使用與以下序列具有序列同源性的雜交探針進行常規的雜交測定,該等序列與傳訊生化途徑相關。典型地, 在雜交反應中,允許探針和與傳訊生化途徑相關的序列形成穩定的複合物,該等序列被包含在來源於測試受試者的生物樣品內。熟習該項技術者應該意識到的是,在將反義核酸用作探針核酸的情況下,提供於樣品中的靶多核苷酸被選擇為與該反義核酸的序列互補。相反地,在核苷酸探針係有義核酸的情況下,該靶多核苷酸被選擇為與該有義核酸的序列互補。
可以在不同嚴格度條件下進行雜交。用於實踐本發明的適合的雜交條件係這樣的,使得探針和與傳訊生化途徑相關的序列之間的識別相互作用既係充分特異的又係充分穩定的。增加雜交反應的嚴格度的條件在本領域係廣泛已知且公開的。參見例如,(薩姆布魯克(Sambrook)等人,(1989);非放射性原位雜交應用手冊(Nonradioactive In Situ Hybridization Application Manual),寶靈曼公司(Boehringer Mannheim),第二版)。可以使用固定在任何固體支持物上的探針進行雜交測定,所述固體支持物包括但不限於硝化纖維、玻璃、矽以及多種基因陣列。如在美國專利案號5,445,934中,在高密度基因晶片上執行較佳的雜交測定。
對於在雜交測定過程中形成的探針-靶標複合物的常規檢測,將核苷酸探針錯合至可檢測標記物上。適於在本發明中使用的可檢測標記物包括藉由光化學、生物化學、光譜學、免疫化學、電學、光學或化學手段可檢測的任何組成物。多種多樣的適當的可檢測標記物在本領域係已知的,包括螢光或化學發光標記物、放射性同位素標記物、酶或其他配位基。在較佳的實施方式中,可能希望的是利用螢光標記物或 酶標籤,如地高辛、β-半乳糖苷酶、脲酶、鹼性磷酸酶或過氧化物酶、親和素/生物素複合物。
用於檢測或定量雜交強度的檢測方法將典型地取決於以上選擇的標記物。例如,可以使用照相底片或感光成像儀檢測放射性標記物。可以使用檢測發射光的光檢測器檢測並定量螢光標記物。典型地藉由為酶提供底物並測量由酶對底物的作用而產生的反應產物來檢測酶標記物;並且最後,藉由簡單地使著色的標記物視覺化而檢測比色標記物。
還可以藉由檢查對應的基因產物確定與傳訊生化途徑相關的序列的試劑誘導的表現變化。確定蛋白質水平典型地涉及a)使包含在生物樣品中的蛋白質與特異性結合到與傳訊生化途徑相關的蛋白質上的試劑接觸;並且(b)鑒定這樣形成的任何試劑:蛋白質複合物。在此實施方式的一個方面,特異性結合與傳訊生化途徑相關的蛋白質的該試劑係一抗體,較佳的是單株抗體。
藉由在將允許在該試劑和與傳訊生化途徑相關的蛋白質之間形成複合物的條件下,藉由使該試劑與來源於測試樣品的與傳訊生化途徑相關的蛋白質的樣品接觸而進行該反應。可以根據本領域中的標準程式直接地或間接地檢測複合物的形成。在直接檢測方法中,該等試劑提供有可檢測的標記物並且未反應的試劑可以從複合物中除去;由此剩餘的標記物的量指示形成的複合物的量。對於這樣之方法,較佳的是選擇即使在嚴格洗滌條件過程中仍附接至該等試劑上的標記物。較佳的是,該標記物不干擾結合反應。在替代方案中,間接檢測程序可以使用 包含用化學方法或酶方法引入的標記物的試劑。令人希望的標記物通常不干擾所得的試劑:多肽複合物的結合或穩定性。然而,標記物典型地被設計成係用於有效結合並且因此產生可檢測的信號的抗體可及的。
適於檢測蛋白質水平的多種多樣的標記物在本領域係已知的。非限制性實例包括放射性同位素、酶、膠體金屬、螢光化合物、生物發光化合物以及化學發光化合物。
可以藉由標準定量測定定量在結合反應過程中形成的試劑:多肽複合物的量。如上所示,可以藉由仍留在結合位點處的標記物的量直接測量試劑:多肽複合物的形成。在一個替代方案中,測試與傳訊生化途徑相關的蛋白質與標記的類似物結合特定試劑上的位點的競爭能力。在此競爭測定中,捕獲的標記物的量與存在於測試樣品中的與傳訊生化途徑相關的蛋白質序列的量成反比。
多種用於蛋白質分析的基於以上概括的總則的技術在本領域係可獲得的。它們包括但不限於放射免疫測定、ELISA(酶聯免疫放射測定)、“夾層免疫測定、免疫放射測定、原位免疫測定(使用例如,膠體金、酶或放射性同位素標記物)、西方墨點分析、免疫沈澱測定、免疫螢光測定以及SDS-PAGE。
特異性識別或結合到與傳訊生化途徑相關的蛋白質上的抗體對於執行前述蛋白質分析而言是較佳的。在希望的情況下,可以使用識別特定類型的翻譯後修飾(例如,傳訊生化途徑誘導的修飾)的抗體。翻譯後修飾包括但不限於糖基化、脂化、乙醯化以及磷酸化。該等抗體可以購自商業供應商。例如,特異性識別酪胺酸磷酸化蛋白質的抗 磷酸酪胺酸抗體可以獲得自多個供應商,包括英傑公司和珀金埃爾默公司(Perkin Elmer)。抗磷酸酪胺酸抗體在檢測響應於ER應激而在其酪胺酸殘基上存在差異磷酸化的蛋白質中是特別有用的。這樣的蛋白質包括但不限於真核翻譯起始因子2α(eIF-2α)。可替代地,可以藉由用展示出希望的翻譯後修飾的靶蛋白免疫宿主動物或抗體產生細胞而使用常規的多株或單株抗體技術產生該等抗體。
在實踐主題方法中,可以令人希望的是,在不同身體組織中、在不同細胞類型中和/或在不同亞細胞結構中辨別與傳訊生化途徑相關的蛋白質的表現譜。可以藉由使用能夠結合到優先表現於某些組織、細胞類型或亞細胞結構中的蛋白質標記的組織特異的、細胞特異的或亞細胞結構特異的抗體進行該等研究。
還可以藉由檢查基因產物相對於對照細胞的活性變化而確定與傳訊生化途徑相關的基因的改變的表現。與傳訊生化途徑相關的蛋白質的試劑誘導的活性變化的測定將取決於處於研究之下的生物活性和/或傳訊途徑。例如,在該蛋白質係激酶的情況下,可以藉由本領域已知的多種測定確定它磷酸化一種或多種下游底物的能力的變化。代表性測定包括但不限於用抗體進行免疫印跡和免疫沈澱,該等抗體係如識別磷酸化蛋白質的抗磷酸酪胺酸抗體。此外,可以藉由高通量化學發光測定檢測激酶活性,如AlphaScreenTM(可獲得自珀金埃爾默公司)和eTagTM測定(陳-輝(Chan-Hui)等人(2003)《臨床免疫學》(Clinical Immunology)111:162-174)。
在與傳訊生化途徑相關的蛋白質係使得細胞內pH條件波 動的傳訊級聯的一部分的情況下,可以將pH敏感的分子(如螢光pH染料)用作報導分子。在與傳訊生化途徑相關的蛋白質係離子通道的另一個實例中,可以監測膜電位和/或細胞內離子濃度的波動。多種商業套組和高通量裝置特別適於快速且穩健地篩選離子通道調節劑。代表性儀器包括FLIPRTM(分子設備公司(Molecular Devices,Inc.))和VIPR(奧羅拉生物科學公司(Aurora Biosciences)))。該等儀器能夠同時檢測微板的1000多個樣品孔中的反應,並且能夠提供一秒內或甚至一毫秒內的即時測量和功能數據。
在實踐在此揭露的任何方法中,可以經由本領域已知的一種或多種方法將適合的載體引入進細胞或胚胎中,該等方法包括但不限於,顯微注射、電穿孔、聲致穿孔、基因槍、磷酸鈣介導的轉染、陽離子轉染、脂質體轉染、樹枝狀聚合物轉染、熱休克轉染、核轉染、磁轉染、脂轉染、刺穿轉染(impalefection)、光學轉染、專有劑增強的核酸攝取以及經由脂質體、免疫脂質體、病毒顆粒或人工病毒體進行遞送。在一些方法中,藉由顯微注射將該載體引入進胚胎中。可以將這個或該等載體顯微注射進胚胎的細胞核或細胞質中。在一些方法中,藉由核轉染將這個或該等載體引入進細胞中。
靶座位,靶多核苷酸;PAM序列
CRISPR複合物的靶多核苷酸可以是對真核細胞而言內源或外源的任何多核苷酸。例如,該靶多核苷酸可以是駐留在真核細胞的細胞核中的多核苷酸。該靶多核苷酸可以是編碼基因產物(例如,蛋白質)的序列或非編碼序列(例如,調節多核苷酸或無用DNA)。該靶可以 是調控元件或調節元件或啟動子或增強子或沈默子。在一些實施方式中,該啟動子可以在+200bp左右或甚至來自TTS的+1000bp。在一些實施方式中,該調節區可以是增強子。該增強子典型地大於來自TTS的+1000bp。更具體地,真核蛋白編碼基因的表現通常是藉由多個順式作用轉錄調控區進行調節的。一些控制元件位於起始位點(啟動子近側元件)附近,而其他元件位置更遠(增強子以及沈默子)。啟動子決定轉錄起始位點以及RNA聚合酶II的直接結合。已經在真核DNA中鑒定出三種類型的啟動子序列。最常見的TATA盒在迅速轉錄基因中是普遍的。在一些基因中很少發現起始啟動子,並且CpG島係轉錄基因所特有的。啟動子近側元件存在於起始位點
Figure 112128864-A0101-12-0475-189
200鹼基對內。若干此類包含高達
Figure 112128864-A0101-12-0475-190
20個鹼基對的元件可以幫助調節具體基因。長度通常為
Figure 112128864-A0101-12-0475-191
100-200個鹼基對的增強子包含多個8-至20-bp控制元件。它們可以位於啟動子上游或下游、在內含子內、或在基因的最終外顯子下游從200個鹼基對到成千上萬個鹼基。啟動子近側元件和增強子可以是細胞類型特異性的,僅在特定分化細胞類型中發揮作用。然而,該等區域中的任何區域可以是靶序列並且被以下概念所涵蓋:該靶可以是調控元件或調節元件或啟動子或增強子或沈默子。
典型地,在內源核酸靶向系統的背景下,核酸靶向複合物(包含雜交到靶序列上並且與一種或多種核酸靶向效應蛋白複合的指導RNA)的形成導致在該靶序列中或其附近(例如在1、2、3、4、5、6、7、8、9、10、20、50、或更多個鹼基對之內)的一條股或兩條DNA或RNA股的切割。如在此使用的,術語“一個或多個與感興趣的靶座位關聯的 序列”係指在靶序列附近的序列(例如,離靶序列1、2、3、4、5、6、7、8、9、10、20、50、或更多個鹼基對之內,其中該靶序列被包括在感興趣的靶座位中)。
不希望被理論所束縛,據信該靶序列應該與PAM(原型間隔子鄰近模體)相關;也就係說,與由CRISPR複合物識別的短序列相關。對PAM的精確序列和長度要求取決於使用的CRISPR酶而不同,但是PAM典型地是臨近原型間隔子(也就係說,靶序列)的2-5個鹼基對序列。在以下實例部分中給出PAM序列的實例,並且熟練人員將能夠鑒定與給定的CRISPR酶一起使用的另外的PAM序列。另外,PAM相互作用(PI)結構域的工程化可以允許對PAM特異性程式設計,改善靶位點識別保真性,並且增加Cas(例如,Cas9)基因組工程化平臺的多能性。Cas蛋白(如Cas9蛋白)可以被工程化來改變它們的PAM特異性,例如,如描述於克萊因史蒂夫(Kleinstiver)BP等人,具有改變PAM特異性的工程化CRISPR-Cas9核酸酶(Engineered CRISPR-Cas9 nucleases with altered PAM specificities.)《自然》(Nature).2015 Jul 23;523(7561):481-5.doi:10.1038/nature14592。在一些實施方式中,該方法包括允許CRISPR複合物結合到該靶多核苷酸上以實施所述靶多核苷酸的切割,由此修飾該靶多核苷酸,其中該CRISPR複合物包括與雜交到在所述靶多核苷酸內的靶序列上的指導序列複合的CRISPR酶,其中所述指導序列連接到tracr配對序列上,該tracr配對序列進而雜交到tracr序列上。在一個方面,本發明提供了修飾多核苷酸在真核細胞中的表現之方法。在一些實施方式中,該方法包括允許CRISPR複合物結合到該多核苷酸上,這樣使得所述結合導 致所述多核苷酸的表現增加或降低;其中該CRISPR複合物包括與雜交到在所述多核苷酸內的靶序列上的指導序列複合的CRISPR酶,其中所述指導序列連接到tracr配對序列上,該tracr配對序列進而雜交到tracr序列上。類似的考慮因素和條件適用如上文針對修飾靶多核苷酸之方法。事實上,該等取樣、培養和重新引入選擇跨本發明的多個方面而適用。在一個方面,本發明提供了修飾真核細胞中的靶多核苷酸之方法,該等方法可以在體內、離體或在體外。在一些實施方式中,該方法包括對來自人或非人動物的細胞或細胞群進行取樣,並且修飾該細胞或該等細胞。培養可以發生在離體的任何階段。該細胞或該等細胞甚至可以被重新引入該非人動物或植物中。對於重新引入的細胞,特別較佳的是該等細胞係幹細胞。
確實,在本發明的任何方面,該CRISPR複合物可以包括與雜交到靶序列上的指導序列複合的CRISPR酶,其中所述指導序列可以連接到tracr配對序列上,該tracr配對序列進而可以雜交到tracr序列上。
本發明涉及用於控制涉及序列靶向的基因表現的系統、方法、和組成物的工程化和優化,該序列靶向例如涉及CRISPR-Cas系統及其組分的基因組干擾或基因編輯。該Cas酶係Cas9。本發明方法的優點在於,該CRISPR系統最小化或避免了脫靶結合及其所產生的副作用。這係藉由使用被安排為具有針對靶DNA的高度序列特異性的系統而實現的。
相對於CRISPR-Cas複合物或系統,較佳的是,該tracr序列具有一個或多個髮夾結構,並且長度係30個或更多個核苷酸,長度係40個或更多個核苷酸,或長度係50或更多個核苷酸;該指導序列的長度 在10至30個核苷酸之間,該CRISPR/Cas酶係II型Cas9酶。
CRISPR複合物的靶多核苷酸可以包括多個疾病相關基因和多核苷酸以及傳訊生化途徑相基因和多核苷酸,如分別提交於2012年12月12日和2013年1月2日、標題均為用於序列操縱的系統方法和組成物(SYSTEMS METHODS AND COMPOSITIONS FOR SEQUENCE MANIPULATION)的分別具有博多(Broad)參考號BI-2011/008/WSGR案卷號44063-701.101和BI-2011/008/WSGR案卷號44063-701.102的美國臨時專利申請61/736,527和61/748,427中所列舉,將所有該等申請的內容藉由引用以其全文結合在此。
靶多核苷酸的實例包括與傳訊生化途徑相關的序列,例如傳訊生化途徑相關基因或多核苷酸。靶多核苷酸的實例包括疾病相關基因或多核苷酸。“疾病相關”基因或多核苷酸係指與非疾病對照的組織或細胞相比,在來源於疾病影響的組織的細胞中以異常水平或以異常形式產生轉錄或翻譯產物的任何基因或多核苷酸。在改變的表現與疾病的出現和/或進展相關的情況下,它可以是一個以異常高的水平被表現的基因;它可以是以異常低的水平被表現的基因。疾病相關基因還指具有一個或多個突變或直接負責或與一個或多個負責疾病的病因學的基因連鎖不平衡的遺傳變異的基因。轉錄的或翻譯的產物可以是已知的或未知的,並且可以處於正常或異常水平。
基因組廣度敲除篩選
可以將在此描述的CRISPR-Cas蛋白和系統用於進行有效並且且符合成本效益的功能基因組篩選。此類篩選可以利用CRISPR-Cas 基因組廣度文庫。此類篩選和文庫可以提供確定基因的功能,涉及的細胞路徑基因,以及任何基因表現的改變係如何能夠產生一具體生物過程的。本發明的優點在於,該CRISPR系統避免了脫靶結合及其所產生的副作用。這係藉由使用被安排為具有針對靶DNA的高度序列特異性的系統而實現的。
基因組廣度文庫可以包括多個CRISPR-Cas系統指導RNA,如在此描述的,其包括能夠靶向真核細胞群中多個基因組座位中多個靶序列的指導序列。該等細胞群可以是胚胎幹(ES)細胞群。基因組座位中的靶序列可以是非編碼序列。該非編碼序列可以是內含子、調節序列、剪接位點、3’ UTR、5’ UTR、或多聚腺苷酸化信號。可以藉由所述靶向來改變一種或多種基因產物的基因功能。該靶向可導致基因功能的敲除。基因產物的靶向可以包括多於一種指導RNA。一基因產物可以被2、3、4、5、6、7、8、9、或10種指導RNA靶向,較佳的是每個基因3至4種。可以使脫靶修飾最小化(參見,例如,RNA指導的Cas9核酸酶的DNA靶向特異性(DNA targeting specificity of RNA-guided Cas9 nucleases)徐(Hsu),P.、斯科特(Scott),D.、溫斯坦(Weinstein),J.、蘭(Ran),FA.、科納曼(Konermann),S.、阿格瓦拉(Agarwala),V.、李(Li),Y.、法恩(Fine),E.、吳(Wu),X.、沙勒姆(Shalem),O.、克拉迪克(Cradick),TJ.、馬拉菲尼(Marraffini),LA.、包(Bao),G.、&張(Zhang),F.《自然生物技術》(Nat Biotechnol)doi:10.1038/nbt.2647(2013)),藉由引用結合在此。該靶向可以具有約100或更多個序列。該靶向可以具有約1000或更多個序列。該靶向可以具有約20,000或更多個序 列。該靶向可以具有整個基因組。該靶向可以具有一系列聚焦於相關或令人希望的途徑的靶序列。該途徑可以是免疫途徑。該途徑可以是細胞分裂途徑。
本發明的一個方面包括基因組廣度文庫,該基因組廣度文庫可以包括多個CRISPR-Cas系統指導RNA,該等指導RNA可以包括能夠靶向多個基因組座位中多個靶序列的指導序列,其中所述靶向導致基因功能的敲除。該文庫可以潛在包括靶向生物基因組中各個和每個基因的指導RNA。
在本發明的一些實施方式中,該生物或受試者係真核生物(包括人類在內的哺乳動物)或非人類真核生物或非人類動物或非人類哺乳動物。在一些實施方式中,該生物或受試者係非人類動物,並且可以是節肢動物例如昆蟲,或者可以是線蟲。在本發明的一些方法中,該生物或受試者係植物。在本發明的一些方法中,該生物或受試者係哺乳動物或非人類哺乳動物。非人類哺乳動物可以是例如齧齒動物(較佳的是小鼠或大鼠)、有蹄動物、或靈長動物。在本發明的一些方法中,該生物或受試者係包括微藻在內的藻類,或者係真菌。
基因功能的敲除可以包括:向細胞群中的每個細胞中引入具有一種或多種包含工程化的、非天然存在的CRISPR-Cas系統的載體的載體系統,該系統包括:I. Cas蛋白,和II.一種或多種指導RNA,其中組分I和II可以是相同或在不同載體系統上,將組分I和II整合到每個細胞中,其中該指導序列靶向每個細胞中的獨特基因,其中該Cas蛋白可操作地連接至調節元件上,其中在轉錄時,包括該指導序列的指導RNA引導 CRISPR-Cas系統與該獨特基因的基因組座位中的靶序列的序列特異性結合,藉由該Cas蛋白誘導該基因組座位的切割,並且證實細胞群的每個細胞中的多個獨特基因中的不同敲除突變,由此產生基因敲除細胞文庫。本發明包括,該細胞群係真核細胞群,並且在一較佳的實施方式中,該細胞群係胚胎幹(ES)細胞群。
該一種或多種載體可以是質粒載體。該載體可以是單個載體,其包括Cas9、sgRNA,以及視情況,進入靶細胞中的選擇性標記。不被理論所束縛,藉由單個載體同時遞送Cas9和sgRNA的能力使得能夠應用於任何感興趣的細胞類型,而不需要首先產生表現Cas9的細胞系。該調節元件可以是誘導型啟動子。該誘導型啟動子可以是多西環素誘導型啟動子。在本發明的一些方法中,該指導序列的表現係在T7啟動子控制下並且是由T7聚合酶的表現驅動的。可以藉由全外顯子組定序證實不同敲除突變。可以在100或更多個獨特基因中實現敲除突變。可以在1000或更多個獨特基因中實現敲除突變。可以在20,000或更多個獨特基因中實現敲除突變。可以在整個基因組中實現敲除突變。可以在多個獨特基因中實現基因功能的敲除,該等獨特基因在特定生理途徑或狀態下發揮作用。該途徑或狀態可以是免疫途徑或狀態。該途徑或狀態可以是細胞分裂途徑或狀態。
本發明還提供了套組,其包括在此提及的基因組廣度文庫。該套組可以包括單個容器,該容器包括包含本發明所述文庫的載體或質粒。該套組還可以包括面板,該面板包括具有包括來自本發明所述文庫的指導序列的獨特CRISPR-Cas系統指導RNA的選擇,其中該選擇指 示特定的生理條件。本發明包括,該靶向具有約100或更多個序列、約1000或更多個序列或約20,000或更多個序列或整個基因組。此外,一系列靶序列可以聚焦於相關或令人希望的途徑,如免疫路徑或細胞分裂。
在本發明的另外方面,Cas9酶可以包含一個或多個突變,並且可以用作具有或不具有與功能結構域融合的通用DNA結合蛋白。該等突變可以是人工引入的突變或獲得性和丟失性功能突變。該等突變可以包括但不限於分別在RuvC和HNH催化結構域中的催化結構域(D10和H840)之一中的突變。已經表徵了其他的突變。在本發明的一個方面,該功能結構域可以是轉錄活化結構域,其可以是VP64。在本發明的其他方面,該功能結構域可以是轉錄抑制蛋白結構域,其可以是KRAB或SID4X。本發明的其他方面涉及融合到結構域上的突變的Cas 9酶,該等結構域包括但不限於,轉錄活化劑、抑制蛋白、重組酶、轉位酶、組蛋白重塑劑(histone remodeler)、脫甲基酶、DNA甲基轉移酶、隱花色素、光可誘導/可控制結構域或化學可誘導/可控制結構域。本發明的一些方法可以包括誘導靶向基因的表現。在一個實施方式中,藉由利用功能結構域來藉由靶向真核細胞群中多個基因組座位中多個靶序列誘導表現。
在本發明的實踐中是有用的,參考:
Figure 112128864-A0101-12-0482-192
在人類細胞中基因組規模CRISPR-Cas9敲除篩選(Genome-Scale CRISPR-Cas9 Knockout Screening in Human Cells)沙勒姆(Shalem),O.、桑耶納(Sanjana),NE.、哈爾特寧(Hartenian),E.、史(Shi),X.、斯科特(Scott),DA.、邁克爾森(Mikkelson),T.、赫克爾(Heckl),D.、埃伯特(Ebert),BL.、羅特(Root),DE.、登奇(Doench),JG.、張(Zhang), F.《科學》(Science)12月12日.(2013).[電子版先於印刷版];以最終編輯形式公開,如:《科學》(Science)2014年1月3日;343(6166):84-87。
Figure 112128864-A0101-12-0483-193
沙勒姆(Shalem)等人涉及新的在基因組廣度範圍上探詢基因功能的方式。他們的研究顯示,遞送基因組範圍的CRISPR-Cas9敲除(GeCKO)文庫利用64,751個獨特的指導序列靶向18,080個基因,該等指導序列使得在人類細胞中陰性和陽性選擇篩選兩者成為可能。首先,該等作者顯示,使用該GeCKO文庫來鑒定癌症和多能幹細胞中對於細胞活力至關重要的基因。接著,在黑色素瘤模型中,該等作者針對基因進行篩選,該等基因的損失涉及對維羅非尼(抑制突變體蛋白激酶BRAF的治療劑)的抗性。他們的研究顯示,最高級候選物包括先前驗證的基因NF1和MED12連同新穎的命中物NF2、CUL3、TADA2B、和TADA1。該等作者觀察到在靶向相同基因的獨立指導RNA之間的高水平的一致性以及高比率的命中確認,並且因此證實了採用Cas9進行基因組範圍篩選的前景。
還參考美國專利公開案號US 20140357530;以及PCT專利公開WO 2014093701,藉由引用特此結合於此。
功能改變和篩選
在一些實施方式中,一個或多個功能結構域與CRISPR酶(例如,II型Cas9酶)關聯。
在一些實施方式中,一個或多個功能結構域與轉接蛋白關聯,例如,如與康納曼(Konnerman)等人的修飾指導一起使用的轉接蛋白(《自然》(Nature)517,583-588,2015年1月29日)。
在一些實施方式中,一個或多個功能結構域與死sgRNA(dRNA)關聯。在一些實施方式中,dRNA複合物與活性cas9藉由在基因座處的功能結構域指導基因調控,而sgRNA藉由在另一個基因座處的活性cas9指導DNA切割,例如,如在達爾曼(Dahlman),‘用催化活性Cas9核酸酶進行正交基因控制(Orthogonal gene control with a catalytically active Cas9 nuclease)’(出版中)。在一些實施方式中,相比於脫靶調節,dRNA被選擇為最大化針對感興趣的基因座位的調節的選擇性。在一些實施方式中,dRNA被選擇為最大化靶基因調節和最小化靶切割。
出於以下討論的目的,參考功能結構域可以是與CRISPR酶關聯的功能結構域或與轉接蛋白關聯的功能結構域。
在本發明的實踐中,藉由插入可募集可結合至一個或多個不同RNA環或一個或多個不同序列上的轉接蛋白的一個或多個不同RNA環或一個或多個不同序列,可以擴展sgRNA的環,而不與Cas9蛋白衝突。該轉接蛋白可以包括但不限於存在於噬菌體外殼蛋白的多樣性內的正交RNA結合蛋白/適配體組合。此類外殼蛋白的列表包括但不限於:Qβ、F2、GA、fr、JP501、M12、R17、BZ13、JP34、JP500、KU1、M11、MX1、TW18、VK、SP、FI、ID2、NL95、TW19、AP205、ΦCb5、ΦCb8r、ΦCb12r、ΦCb23r、7s以及PRR1。該等轉接蛋白或正交RNA結合蛋白可以進一步募集包括一個或多個功能結構域的效應蛋白或融合。在一些實施方式中,該功能結構域可以選自由以下各項組成之群組:轉位酶結構域、整合酶結構域、重組酶結構域、解離酶結構域、轉化酶結構域、蛋白酶結構域、DNA甲基轉移酶結構域、DNA羥甲基化酶結構域、DNA脫甲基酶結構 域、組蛋白乙醯酶結構域、組蛋白脫乙醯酶結構域、核酸酶結構域、抑制蛋白結構域、活化蛋白結構域、核定位信號結構域、轉錄調節蛋白(或轉錄複合體募集)結構域、細胞攝取活性相關結構域、核酸結合結構域、抗體呈遞結構域、組蛋白修飾酶、組蛋白修飾酶的募集物;組蛋白修飾酶的抑制劑、組蛋白甲基轉移酶、組蛋白脫甲基化酶、組蛋白激酶、組蛋白磷酸酶、組蛋白核糖基酶、組蛋白脫核糖基酶、組蛋白泛素化酶、組蛋白去泛素化酶、組蛋白生物素化酶和組蛋白尾蛋白酶。在一些較佳的實施方式中,該功能結構域係轉錄活化結構域,例如但不限於,VP64、p65、MyoD1、HSF1、RTA、SET7/9或組蛋白乙醯轉移酶。在一些實施方式中,該功能結構域係轉錄抑制結構域,較佳的是KRAB。在一些實施方式中,該轉錄抑制結構域係SID、或SID的多聯體(例如SID4X)。在一些實施方式中,該功能結構域係表觀遺傳修飾結構域,從而提供了表觀遺傳修飾酶。在一些實施方式中,該功能結構域係活化結構域,其可以是P65活化結構域。
在一些實施方式中,該一個或多個功能結構域係NLS(核定位序列)或NES(核輸出信號)。在一些實施方式中,該一個或多個功能結構域係轉錄活化結構域,其包括VP64、p65、MyoD1、HSF1、RTA、SET7/9和組蛋白乙醯轉移酶。就與CRISPR酶關聯的那些而言,在此其他對活化(或活化蛋白)結構域的參考文獻包括任何已知的轉錄活化結構域,並且確切地為VP64、p65、MyoD1、HSF1、RTA、SET7/9或組蛋白乙醯轉移酶。
在一些實施方式中,該一個或多個功能結構域係轉錄阻抑 物結構域。在一些實施方式中,該轉錄阻抑物結構域係KRAB結構域。在一些實施方式中,該轉錄抑制蛋白結構域係NuE結構域,NcoR結構域、SID結構域或SID4X結構域。
在一些實施方式中,一個或多個功能結構域具有一種或多種活性,包括修飾烷酶活性、去甲酶活性、轉錄活化活性、轉錄抑制活性、轉錄釋放因子活性、組蛋白修飾活性、RNA切割活性、DNA切割活性、DNA整合活性或核酸結合活性。
在一些實施方式中,組蛋白修飾結構域也是較佳的。下文討論了示例性組蛋白修飾結構域。轉位酶結構域、HR(同源重組)機構結構域、重組酶結構域和/或整合酶結構域作為本發明的功能結構域也是較佳的。在一些實施方式中,DNA整合活性包括HR機構結構域、整合酶結構域、重組酶結構域和/或轉位酶結構域。在一些實施方式中,組蛋白乙醯轉移酶係較佳的。
在一些實施方式中,DNA切割活性係由於核酸酶。在一些實施方式中,核酸酶包括Fok1核酸酶。參見,“用於高度特異性基因組編輯的二聚體CRISPR RNA-指導的FokI核酸酶(Dimeric CRISPR RNA-guided FokI nucleases for highly specific genome editing)”,辛達爾(Shengdar)Q.蔡(Tsai),尼古拉斯維尼肯斯(Nicolas Wyvekens),賽德凱特爾(Cyd Khayter),詹尼弗A.福登(Jennifer A.Foden),維沙爾撒帕爾(Vishal Thapar),迪派克瑞昂(Deepak Reyon),馬修J.古德溫(Mathew J.Goodwin),馬丁J.阿裡耶(Martin J.Aryee),J.基斯莊(J.Keith Joung)《自然生物學技術》(Nature Biotechnology)32(6):569-77 (2014),涉及識別延伸的序列並且可以在人類細胞中高效編輯內源基因的二聚體RNA-指導的FokI核酸酶。
在一些實施方式中,該一個或多個功能結構域附接至該CRISPR酶,這樣使得當結合至該sgRNA和靶標時,該功能結構域處於空間定向,從而允許該功能結構域在其屬性功能中起作用。
在一些實施方式中,該一個或多個功能結構域附接至該轉接蛋白,這樣使得當該CRISPR酶結合至該sgRNA和靶標時,該功能結構域處於空間定向,從而允許該功能結構域在其屬性功能中起作用。
在一方面,本發明提供了如本文討論的組成物,其中該一個或多個功能結構域經由接頭(如本文討論的GlySer接頭)附接至該CRISPR酶或轉接蛋白。
經常藉由染色質修飾酶(如組蛋白甲基轉移酶(HMT)和脫乙醯基酶(HDAC))介導內源轉錄抑制。抑制組蛋白效應子結構域係已知的,並且下面提供了示例性列表。在該示例性列表中,較佳的是小尺寸的蛋白和功能性截短,以促進有效的病毒包裝(例如經由AAV)。一般來說,然而,該等結構域可以包括HDAC、組蛋白甲基轉移酶(HMT)、和組蛋白乙醯轉移酶(HAT)抑制劑,連同HDAC和HMT募集蛋白。該功能結構域可以是或包括,在一些實施方式中,HDAC效應子結構域、HDAC募集物效應子結構域(HDAC Recruiter Effector Domain)、組蛋白甲基轉移酶(HMT)效應子結構域、組蛋白甲基轉移酶(HMT)募集物效應子結構域、或組蛋白乙醯轉移酶抑制劑效應子結構域。
HDAC效應子結構域
Figure 112128864-A0101-12-0488-252
Figure 112128864-A0101-12-0489-253
因此,本發明所述抑制蛋白結構域可以選自組蛋白甲基轉移酶(HMT)、組蛋白脫乙醯酶(HDAC)、組蛋白乙醯轉移酶(HAT)抑制劑、連同HDAC和HMT募集蛋白。
該HDAC結構域可以是上表那些中的任何一項,即: HDAC8、RPD3、MesoLo4、HDAC11、HDT1、SIRT3、HST2、CobB、HST2、SIRT5、Sir2A、或SIRT6。
在一些實施方式中,該功能結構域可以是HDAC募集物效應子結構域。較佳的實例包括在下表中的那些,即:MeCP2、MBD2b、Sin3a、NcoR、SALL1、RCOR1。在本發明實例中示例了NcoR,並且儘管較佳的,但是設想該類別中的其他也是有用的。
HDAC募集物效應子結構域的表
Figure 112128864-A0101-12-0490-254
Figure 112128864-A0101-12-0491-255
在一些實施方式中,該功能結構域可以是甲基轉移酶(HMT)效應子結構域。較佳的實例包括在下表中的那些,即:NUE、vSET、EHMT2/G9A、SUV39H1、dim-5、KYP、SUVR4、SET4、SET1、SETD8、以及TgSET8。在本發明實例中示例了NUE,並且儘管較佳的是,但是設想該類別中的其他也是有用的。
組蛋白甲基轉移酶(HMT)效應子結構域的表
Figure 112128864-A0101-12-0491-256
Figure 112128864-A0101-12-0492-257
Figure 112128864-A0101-12-0493-258
在一些實施方式中,該功能結構域可以是組蛋白甲基轉移酶(HMT)募集物效應子結構域。較佳的實例包括在下表中的那些,即:Hp1a、PHF19、以及NIPP1。
組蛋白甲基轉移酶(HMT)募集物效應子結構域的表
Figure 112128864-A0101-12-0493-259
Figure 112128864-A0101-12-0494-260
在一些實施方式中,該功能結構域可以是組蛋白乙醯轉移酶抑制劑效應子結構域。較佳的實例包括在下表中列出的SET/TAF-1β。
組蛋白乙醯轉移酶抑制劑效應子結構域的表
Figure 112128864-A0101-12-0494-261
除了啟動子或啟動子近側元件之外,還較佳的是靶向內源 (調節)控制元件(如增強子以及沈默子)。因此,除了靶向啟動子之外,本發明還可以用於靶向內源控制元件(包括增強子以及沈默子)。該等控制元件可以位於轉錄起始位點(TSS)的上游和下游,從距離TSS 200bp開始至100kb。對已知控制元件的靶向可以用於活化或抑制感興趣的基因。在一些情況下,單個控制元件可以影響多個靶基因的轉錄。對單個控制元件的靶向因此可以用於同時控制多個基因的轉錄。
另一方面,對假定的控制元件的靶向(例如,藉由對假定的控制元件連同該元件周圍200bp直至100kB的區域進行鋪瓦(tiling))可以用作一種驗證此類元件(藉由測量感興趣的基因的轉錄)或檢測新穎控制元件(例如,藉由對感興趣的基因的TSS上游和下游的100kb進行鋪瓦)的手段。此外,對假定的控制元件的靶向在理解疾病的遺傳原因的情況下可以是有用的。與疾病表型關聯的許多突變和常見的SNP變體位於編碼區之外。用本文描述的活化或抑制系統對此類區域靶向後可以接著讀出a)一組假定的靶標(例如,一組位於非常接近於控制元件處的基因)或b)藉由例如RNAseq或微陣列進行全轉錄組讀出的轉錄。這將允許鑒定疾病表型中所涉及的可能候選基因。此類候選基因可以用作新穎的藥物靶標。
本文中提及了組蛋白乙醯轉移酶(HAT)抑制劑。然而,在一些實施方式中,一替代方案係,該一個或多個功能結構域包括乙醯轉移酶,較佳的是組蛋白乙醯轉移酶。該等在表觀基因組學領域中是有用的,例如在探詢表觀基因組的方法中。探詢表觀基因組的方法可以包括,例如,靶向表觀基因組序列。靶向表觀基因組序列可以包括該指導 被引導至表觀基因組靶序列。表觀基因組靶序列可以包括,在一些實施方式中,包括啟動子、沈默子或增強子序列。
連接到如在此描述的CRISPR-Cas酶,較佳的是失活的Cas,更較佳的是失活的Cas9,上的功能結構域靶向表觀基因組序列的用途可以用於活化或抑制啟動子、沈默子或增強子。
乙醯轉移酶的實例係已知的,但在一些實施方式中,可以包括組蛋白乙醯轉移酶。在一些實施方式中,組蛋白乙醯轉移酶可以包括人類乙醯轉移酶p300的催化核心(哲巴斯卡(Gerbasch)和雷迪(Reddy),《自然生物技術》(Nature Biotech)2015年4月6日)。
在一些較佳的實施方式中,該功能結構域連接到失活的Cas9酶上以靶向並且活化表觀基因組序列,如啟動子或增強子。還可以提供針對此類啟動子或增強子的一種或多種指導來引導CRISPR酶與此類啟動子或增強子的結合。
在此相對於功能結構域與CRISPR酶或轉接蛋白的關聯使用術語“與......關聯”。關於一種分子相對於另一種分子如何“關聯”,例如在轉接蛋白與功能結構域之間、或在CRISPR酶與功能結構域之間進行使用。在這樣的蛋白質-蛋白質相互作用的情況下,可以按抗體識別表位的方式就識別而論看待這種關聯。可替代地,一種蛋白可以經由這兩種蛋白的融合物與另一蛋白關聯,例如一個亞基融合至另一亞基。融合典型地藉由將一種蛋白的胺基酸序列添加至另一蛋白的胺基酸序列上而發生,例如經由一起剪接編碼每種蛋白或亞基的核苷酸序列。可替代地,這基本上可以被視為兩個分子之間的結合或直接連接,如融 合蛋白。在任何情況下,融合蛋白可以在感興趣的兩個亞基之間(即酶與功能結構域之間或轉接蛋白與功能結構域之間)包括接頭。因此,在一些實施方式中,CRISPR酶或轉接蛋白藉由結合至其上而與功能結構域關聯。在其他實施方式中,CRISPR酶或轉接蛋白視情況經由接頭而與功能結構域關聯,因為這兩者被融合到一起。
功能結構域或融合蛋白的附接可以經由接頭,例如撓性甘胺酸-絲胺酸(GlyGlyGlySer)或(GGGS)3,或者剛性α-螺旋接頭如(Ala(GluAlaAlaAlaLys)Ala)。較佳的是在本文中使用接頭(如(GGGGS)3),以將蛋白或肽結構域分開。(GGGGS)3係較佳的,因為是相對較長的接頭(15個胺基酸)。甘胺酸殘基最具撓性並且絲胺酸殘基提高了接頭在蛋白質外的機會。(GGGGS)6、(GGGGS)9或(GGGGS)12可以較佳的是用作替代物。其他較佳的替代物係(GGGGS)1、(GGGGS)2、(GGGGS)4、(GGGGS)5、(GGGGS)7、(GGGGS)8、(GGGGS)10或(GGGGS)11。替代接頭係可獲得的,但是高度撓性接頭被認為最佳地起作用,以允許有最大機會將Cas9的2部分聚在一起並且因此重構Cas9活性。一種替代方案係核質蛋白的NLS可以用作接頭。例如,接頭還可以用在Cas9與任何功能結構域之間。再一次,這裡可以使用(GGGGS)3接頭(或其6、9或12個重複形式),或者核質蛋白的NLS可以用作Cas9與功能結構域之間的接頭。
飽和誘變
關於通常使用的CRISPR-Cas系統,提及的是包括專利申請、專利在內的文獻,並且可以如在那些文獻中使用本揭露通篇引用作 為本發明實施方式的專利公開。可以將一種或多種CRISPR-Cas系統用於進行基因組座位的飽和或深度掃描誘變結合細胞表型-例如用於確定關鍵最小特徵和基因表現、抗藥性、以及疾病逆轉所需的功能元件的離散脆弱性。藉由飽和或深度掃描誘變意指將基因組座位之內的每個或基本上每個DNA鹼基切割。可以將CRISPR-Cas指導RNA的文庫引入細胞群中。可以引入該文庫,這樣使得每個細胞接收到單個指導RNA(sgRNA)。在藉由轉導如在此所描述的病毒載體而引入該文庫的情況下,使用低的感染複數(MOI)。該文庫可以包括靶向基因組座位(原型間隔子鄰近模體)(PAM)序列上游的每個序列的sgRNA。對於該基因組座位內每1000個鹼基對,該文庫可以包括PAM序列上游的至少100個不重疊基因組序列。該文庫可以包括靶向至少一種不同PAM序列上游序列的sgRNA。該一種或多種CRISPR-Cas系統可以包括多於一種Cas蛋白。可以使用如在此所描述的任何Cas蛋白,包括直系同源物或識別不同PAM序列的工程化Cas蛋白。對於sgRNA的脫靶位點的頻率可以小於500。可以產生脫靶得分來選擇具有最少脫靶位點的sgRNA。可以藉由使用在單個實驗中靶向相同部位的sgRNA來確認確定為與在sgRNA靶部位處的切割關聯的任何表型。還可以藉由使用如在此所描述的切口酶Cas9,以及靶向感興趣的基因組位點的兩個sgRNA進行靶部位的驗證。不被理論所束縛,如果在驗證實驗中觀察到表型發生變化,那麼靶部位係真正命中。
該基因組座位可以包括至少一個連續基因組區域。該至少一個連續基因組區域可以包括高達整個基因組。該至少一個連續基因組區域可以包括基因組的功能元件。該功能元件可以是在非編碼區、編碼 基因、內含子區域、啟動子、或增強子內。該至少一個連續基因組區域可以包括至少1kb、較佳的是至少50kb的基因組DNA。該至少一個連續基因組區域可以包括轉錄因子結合位點。該至少一個連續基因組區域可以包括DNase I超敏反應的區域。該至少一個連續基因組區域可以包括轉錄增強子或抑制子元件。該至少一個連續基因組區域可以包括富集了表觀遺傳標籤的位點。該至少一個連續基因組DNA區域可以包括表觀遺傳隔離子。該至少一個連續基因組區域可以包括兩個或更多個以物理方式相互作用的連續基因組區域。可以藉由‘4C技術’來確定相互作用的基因組區域。4C技術允許以對於以物理方式與選擇的DNA片段相互作用的DNA區段的無偏性方式篩選整個基因組,如在趙(Zhao)等人,((2006)《自然遺傳學》(Nat Genet)38,1341-7)和在美國專利8,642,295中,將兩者藉由引用以其全文結合在此。該表觀遺傳標籤可以是組蛋白乙醯化、組蛋白甲基化、組蛋白泛素化、組蛋白磷酸化、DNA甲基化、或對其缺乏。
用於飽和或深度掃描誘變的一種或多種CRISPR-Cas系統可以用於細胞群中。該一種或多種CRISPR-Cas系統可以用於真核細胞中,包括但不限於哺乳動物以及植物細胞。該細胞群可以是原核細胞。該真核細胞群可以是胚胎幹(ES)細胞、神經元細胞、上皮細胞、免疫細胞、內分泌細胞、肌細胞、紅細胞、淋巴細胞、植物細胞、或酵母細胞群。
在一個方面,本發明提供了用於篩選與表型變化關聯的功能元件之方法。可以將該文庫引入到被適配成包含Cas蛋白的細胞群中。基於表型,可以將該等細胞分選進至少兩個組。表型可以是基因的表現、 細胞生長、或細胞活力。對存在於每個組中的指導RNA的相對表示進行確定,由此藉由存在於每個組中的指導RNA的表示來確定與表型變化關聯的基因組位點。表型變化可以是感興趣的基因表現的變化。可以是上調、下調、或敲除感興趣的基因。可以將該等細胞分選進高表現組和低表現組。該細胞群可以包括用於確定表型的報告基因構建體。該報告基因構建體可以包括檢測標記。可以藉由使用檢測標記分選細胞。
在另一個方面,本發明提供了用於篩選與對化合物的抗性關聯的基因組位點之方法。該化合物可以是藥物或殺有害生物劑。可以將該文庫引入到被適配成包含Cas蛋白的細胞群中,其中每個細胞群包含不多於一種指導RNA;用該化合物處理該細胞群;並且相比於早期時間點,在用該化合物處理之後稍後的時間點確定指導RNA的表示,由此藉由指導RNA的富集來確定與對該化合物的抗性關聯的基因組位點。可以藉由深度定序方法來確定sgRNA的表示。
在本發明的實踐中是有用的,參考:標題為藉由Cas9介導的在原位飽和誘變的BCL11A增強子分解(BCL11A enhancer dissection by Cas9-mediated in situ saturating mutagenesis)的文章,康沃爾(Canver),M.C.、史密斯(Smith),E.C.、謝爾(Sher),F.、皮內洛(Pinello),L.、山迦納(Sanjana),N.E.、沙勒姆(Shalem),O.、陳(Chen),D.D.、斯庫普(Schupp),P.G.、維嘉穆(Vinjamur),D.S.、加西亞(Garcia),S.P.、盧克(Luc),S.、栗田(Kurita),R.、中村(Nakamura),Y.、藤原(Fujiwara),Y.、梅達(Maeda),T.、袁(Yuan),G.、張(Zhang),F.、奧爾金(Orkin),S.H.、和鮑爾(Bauer),D.E.DOI:10.1038/nature15521,線上公開於2015 年9月16日,該文章藉由引用結合在此,並且簡要討論如下:
康沃爾(Canver)等人描述了新穎的合併CRISPR-Cas9指導RNA文庫以進行人類和小鼠BCL11A紅系增強子的原位飽和誘變,該等增強子先前被鑒定為與胎兒血紅蛋白(HbF)水平相關的增強子,並且其小鼠異種同源物係紅系BCL11A表現所必要的。這種方法揭示了關鍵最小特徵和該等增強子的離散脆弱性。藉由原代人類祖細胞和小鼠基因轉移的編輯,諸位作者驗證了BCL11A紅系增強子作為針對HbF再誘導的靶標。諸位作者生成了告知治療性基因組編輯的詳細增強子圖。
使用CRISPR-Cas系統以修飾細胞或生物體之方法
在一些實施方式中,本發明包括一種修飾細胞或生物體之方法。該細胞可以是原核細胞或真核細胞。該細胞可以是哺乳動物細胞。該哺乳動物細胞可以是非人類靈長動物、牛、豬、齧齒動物或小鼠細胞。該細胞可以是非哺乳動物真核細胞,如家禽、魚類或蝦。該細胞還可以是植物細胞。該植物細胞可以是作物植物(如木薯、玉米、高粱、小麥、或水稻)的細胞。該植物細胞還可以是藻類、喬木或蔬菜的細胞。藉由本發明引入到細胞中的修飾可以使得細胞和細胞子代被改變以便改進生物製品(如抗體、澱粉、醇或其他所希望的細胞產出)的生產。藉由本發明引入到細胞中的修飾可以使得細胞和細胞子代包括改變所生產的生物製品的變化。
該系統可以包含一種或多種不同的載體。在本發明的一方面,該Cas蛋白經密碼子優化以便在所希望的細胞類型,優先真核細胞,較佳的是哺乳動物細胞或人類細胞中表現。
CRISPR系統可以用於植物中
一種或多種CRISPR-Cas系統(例如,單個或多重)可以與作物基因組學的最新進展結合使用。這樣的一種或多種CRISPR-Cas系統可以用於進行有效並且且符合成本效益的植物基因或基因組探詢或編輯或操縱,例如,以便快速研究和/或選擇和/或探詢和/或比較和/或操縱和/或轉化植物基因或基因組;例如,以為一種或多種植物產生、鑒定、開發、優化、或賦予一種或多種性狀或一種或多種特徵或者以轉化植物基因組。因此,可以改進植物、具有性狀或特徵的新組合的新植物的生產、或具有增強的性狀的新植物的生產。關於定點整合(SDI)或基因編輯(GE)或任何近反向育種(Near Reverse Breeding)(NRB)或反向育種(RB)技術中的植物,可以使用這樣的一種或多種CRISPR-Cas系統。關於使用植物中的CRISPR-Cas系統,提及的是亞利桑那大學網站,“CRISPR-PLANT”(http://www.genome.arizona.edu/crispr/)(由賓州州立大學(Penn State)和AGI提供支援)。本發明的實施方式可以用於植物中的基因組編輯,或其中RNAi或類似基因組編輯技術先前已經被使用;參見,例如,涅克拉索夫(Nekrasov),“植物基因組編輯變得容易:使用CRISPR/Cas系統在模式和作物植物中的靶定誘變(Plant genome editing made easy:targeted mutagenesis in model and crop plants using the CRISPR/Cas system)”,植物方法(Plant Methods),2013,9:39(doi:10.1186/1746-4811-9-39);布魯克斯(Brooks),“使用CRISPR/Cas系統在第一代番茄在有效基因編輯(Efficient gene editing in tomato in the first generation using the CRISPR/Cas9 system)”,《植物生理學》(Plant Physiology),2014年9月,pp 114.247577;單(Shan),“使用CRISPR-Cas系統對作物植物進行定向基因組修飾(Targeted genome modification of crop plants using a CRISPR-Cas system)”,《自然生物技術》(Nature Biotechnology),31,686-688(2013);馮(Feng),“使用CRISPR/Cas系統在植物中的有效基因組編輯(Efficient genome editing in plants using a CRISPR/Cas system)”,《細胞研究》(Cell Research)(2013)23:1229-1232.doi:10.1038/cr.2013.114;線上公開於2013年8月20日;謝(Xie),“使用CRISPR-Cas系統在植物中RNA指導的基因組編輯(RNA-guided genome editing in plants using a CRISPR-Cas system)”,《分子植物》(Mol Plant.).2013年11月;6(6):1975-83.doi:10.1093/mp/sst119。電子版20138月17日;徐(Xu),“使用根癌農桿菌介導的CRISPR-Cas系統在水稻中進行基因靶向(Gene targeting using the Agrobacterium tumefaciens-mediated CRISPR-Cas system in rice)”,《水稻》(Rice)2014,7:5(2014);周(Zhou)等人,“在異交多年生木本植物胡楊中針對雙等位基因CRISPR突變開發SNP揭示了4-香豆酸:CoA連接酶特異性與冗餘(Exploiting SNPs for biallelic CRISPR mutations in the outcrossing woody perennial Populus reveals 4-coumarate:CoA ligase specificity and Redundancy)”,《新植物學家》(New Phytologist)(2015)(論壇)1-4(僅在www.newphytologist.com線上可得);卡林多(Caliando)等人,“使用CRISPR裝置在宿主基因組中穩定進行的靶向向DNA降解(Targeted DNA degradation using a CRISPR device stably carried in the host genome)”,《自然通訊》(NATURE COMMUNICATIONS)6:6989,DOI:10.1038/ncomms7989、www.nature.com/naturecommunications DOI: 10.1038/ncomms7989;美國專利案號6,603,061-農桿菌介導的植物轉化方法(Agrobacterium-Mediated Plant Transformation Method);美國專利案號7,868,149-植物基因組序列及其用途(Plant Genome Sequences and Uses Thereof)以及US 2009/0100536-轉具有增強的農藝性狀的基因植物(Transgenic Plants with Enhanced Agronomic Traits),將每者的所有內容和揭露藉由引用以其全文結合在此。在本發明的實踐中,莫雷爾(Morrell)等人“作物基因組學:進展與應用(Crop genomics:advances and applications)”,《遺傳學自然評論》(Nat Rev Genet.).2011 Dec 29;13(2):85-96;將其各自藉由引用併入本文,包括關於本文的實施方式如何可以就植物而使用。因此,加上必要的變更,此處對動物細胞的提及也可適用植物細胞,除非另外係顯然的;並且,可以將具有降低的脫靶效應的本文所述的酶和採用此類酶的系統在植物應用中使用,包括在此提及的那些。
菅野(Sugano)等人,《植物細胞生理學》(Plant Cell Physiol.2014年3月;55(3):475-81.doi:10.1093/pcp/pcu014。電子版2014年1月18日)報導了將CRISPR/Cas9應用於苔類地錢L.(Marchantia polymorpha L.)的靶向誘變中,其已經被作為用於研究陸生植物進化的模式物種。對地錢(M.polymorpha)的U6啟動子進行鑒定並選殖以表現gRNA。該gRNA的靶序列被設計為破壞編碼地錢(M.polymorpha)的植物生長素響應因子1(ARF1)的基因。使用土壤桿菌介導的轉化,菅野(Sugano)等人在地錢(M.polymorpha)的配子體世代中分離了穩定的突變體。使用花椰菜花葉病毒35S或地錢(M.polymorpha)EF1α啟動子, 來實現基於CRISPR/Cas9的體內定點誘變,以表現Cas9。顯示出植物生長素抗性表型的分離的突變個體不是嵌合的。此外,藉由無性繁殖T1植物來產生穩定的突變體。使用基於CRIPSR/Cas9的靶向誘變,易於建立多個arf1等位基因。菅野(Sugano)等人的該等方法可以應用於本發明的CRISPR Cas系統。
卡巴迪(Kabadi)等人(《核酸研究》(Nucleic Acids Res.)2014年10月29日;42(19):e147.doi:10.1093/nar/gku749。電子版2014年8月13日)開發了單個慢病毒系統以表現Cas9變體,報告基因以及多至四個來自藉由方便的金門(Golden Gate)選殖方法併入到載體中的獨立RNA聚合酶III啟動子的sgRNA。每個sgRNA充分表現並且可以介導在永生化和原代人類細胞中的多重基因編輯和持續轉錄活化。卡巴迪(Kabadi)等人的該等方法可以應用於本發明的CRISPR Cas系統。
林(Ling)等人,(《BMC植物生物學》(BMC Plant Biology),2014,14:327)開發了基於pGreen或pCAMBIA骨架連同gRNA設定的CRISPR/Cas9二元載體。除了BsaI以外,這種工具箱(toolkit)不需要限制性內切酶以產生具有玉米密碼子優化的Cas9以及在少至一個選殖步驟中高效率的一種或多種gRNA的最終構建體。使用玉米原生質體、轉基因玉米株系、和轉基因擬南芥屬株系,對該工具箱進行驗證並且顯示其展示出高效率和特異性。更重要的是,使用這種工具箱,在T1代的轉基因幼苗中檢測出三個擬南芥基因的定向突變。此外,該多重基因突變可以被下一代遺傳。(指導RNA)模組載體作為工具箱設置用於植物的多元基因組編輯。林(Lin)等人的工具箱可以應用於本發明的CRISPR Cas 系統。
用於經由CRISPR/Cas9靶向植物基因組編輯的方案也可以在系列分子生物學方法(Methods in Molecular Biology)的第1284卷,第239-255頁(2015年2月10日)中獲得。涉及用於設計、構建、並且評估使用擬南芥和本氏煙原生質體作為模式細胞系統、用於植物密碼子優化的Cas9(pcoCas9)介導的基因組編輯的雙gRNA的詳細程序。也討論了將該CRISPR/Cas9系統應用於在全株中產生靶向的基因組修飾的策略。該章節中的方案可以適用於本發明的CRISPR Cas系統。
馬(Ma)等人(《分子植物》(Mol Plant.)2015年8月,3;8(8):1274-84.doi:10.1016/j.molp.2015.04.007)報導了穩健的CRISPR/Cas9載體系統,其利用植物密碼子優化的Cas9基因,以便在單子葉植物和雙子葉植物中進行方便和高效的多元基因組編輯。馬(Ma)等人設計了基於PCR的程式以迅速產生多個sgRNA表現盒,其可以藉由金門(Golden Gate)連接或吉布森組裝在一輪選殖中裝配進二元CRISPR/Cas9載體中。使用這種系統,馬(Ma)等人編輯了稻的46靶位點,突變率為平均85.4%,主要在雙等位基因和純合狀態中。馬(Ma)等人提供了藉由同時靶向基因家族的多個(多達八個)成員、生物合成途徑中的多基因、或單個基因中的多個位點,T0稻和T1擬南芥屬植物中功能缺失基因突變的實例。馬(Ma)等人該等方法可以適用於本發明的CRISPR Cas系統。
洛德(Lowder)等人(《植物生理學》(Plant Physiol.2015年8月21日,pii:pp.00636.2015)還開發了使得能夠在植物中多元基因組編輯和轉錄調控表現、沈默或非編碼基因的CRISPR/Cas9工具箱。該工具 箱為研究者提供了方案和試劑以便使用金門和通路(Gatewayge)選殖方法,為單子葉植物和雙子葉植物快速並且有效地組裝功能性CRISPR/Cas9 T-DNA構建體。它伴隨一整套能力發生,包括植物內源基因的多元基因編輯以及轉錄活化或抑制。基於T-DNA的轉化技術係對現代植物生物技術、遺傳學、分子生物學以及生理學很重要。因此,申請人開發了一種用於組裝Cas9(WT、切口酶或dCas9)和一種或多種gRNA進入感興趣的T-DNA目的載體中之方法。該組裝方法基於金門(Golden Gate)組裝和多位點Gateway重組二者。組裝需要三種模組。第一模組係Cas9入門載體,其包含無啟動子Cas9或其衍生物基因,其側翼為attL1和attR5位點。第二模組係gRNA入門載體,其包含入門gRNA表現盒,其側翼為attL5和attL2位點。第三模組包括包含attR1-attR2的目的T-DNA載體,其提供用於Cas9表現的啟動子的選擇。洛德(Lowder)等人的工具箱可以應用於本發明的CRISPR Cas系統。
彼得森(Petersen)(“對於精確乙二醇工程化植物(Towards precisely glycol engineered plants)”,2015年丹麥植物生物技術年會(Plant Biotech Denmark Annual meeting 2015),哥本哈根,丹麥)開發了使用CRISPR/Cas9以工程化擬南芥中的基因組改變,例如,以乙二醇工程化擬南芥以便產生具有所希望的翻譯後修飾的蛋白和產品之方法。赫布林斯達普(Hebelstrup)等人(《植物科學前沿》(Front Plant Sci.)2015年4月23日;6:247)概述了在植物中澱粉生物工程,由此提供表現澱粉修飾酶並直接產生通常是藉由工業化學和/或物理處理澱粉製成的產品的作物。彼得森(Petersen)和赫布林斯達普(Hebelstrup)的方法可以應 用於本發明的CRISPR-Cas9系統。
在一有利的實施方式中,植物可以是樹。本發明還可以利用在此揭露的CRISPR Cas系統以用於草本系統(參見,例如,貝勒哈吉(Belhaj)等人,《植物方法》(Plant Methods),9:39,以及哈里森(Harrison)等人,《基因&發育》(Genes & Development),28:1859-1872)。在一特別有利的實施方式中,本發明的CRISPR Cas系統可以靶向樹的單核苷酸多態性(SNP)(參見,例如,周(Zhou)等人,《新植物學家》(New Phytologist),第208卷第2期,第298-301頁,2015年10月)。在周(Zhou)等人的研究中,諸位作者使用4-香豆酸:輔酶A連接酶(4CL)基因家族作為案例研究在木本多年生楊屬植物中應用CRISPR Cas系統,並且對於兩個被靶向的4CL基因實現了100%突變效率,檢查了攜帶雙等位基因修飾的每個轉化子。在周(Zhou)等人的研究中,CRISPR/Cas9系統對單核苷酸多態性(SNP)高度敏感,因為用於第三4CL基因的切割由於靶序列中的SNP而被消除。
周(Zhou)等人(《新植物學家》(New Phytologist),第208卷第2期,第298-301頁,2015年10月)的該等方法可以適用於如下的本發明。與木質素和類黃酮生物合成關聯的兩個4CL基因(4CL1和4CL2)分別被靶向用於CRISPR/Cas9編輯。常規地用於轉化的歐洲山楊×阿爾巴(alba)殖株717-1B4與基因組定序的毛果楊不同。因此,就由參考基因組設計的4CL1和4CL2 gRNA用內部717 RNA-Seq數據進行探詢,以確保不存在SNP,這可以限制Cas效率。針對4CL5設計的第三gRNA,4CL1的基因組重複,也包括在內。對應的717序列在每個等位基因附近/在PAM 之內具有一個SNP,據期兩者均藉由4CL5-gRNA消除靶向。所有三種gRNA靶位點被定位在第一外顯子之內。對於717轉化,gRNA從苜蓿屬U6.6啟動子中表現,連同在二元載體的CaMV 35S啟動子的控制下的人類密碼子優化的Cas。用僅Cas載體進行的轉化可以充當對照。使隨機選擇的4CL1和4CL2株系均經受擴增子定序。然後,加工數據,並且在所有情況下證實雙等位基因突變。
在植物中,病原體常常是宿主特異性的。例如,番茄尖鐮孢菌番茄專化型(Fusarium oxysporum f.sp.lycopersici)引起番茄枯萎病,而且只攻擊番茄,並且香石竹尖鐮孢禾柄鏽菌小麥專化型(F.oxysporum f.dianthii Puccinia graminis f.sp.tritici)只攻擊小麥。植物具有抵抗大多數病原體的現有的和誘導性的防禦。跨植物代的突變和重組事件導致產生敏感性的遺傳變異性,特別是當病原體以比植物更高的頻率繁殖時。在植物中可以存在非宿主抗性,例如,該宿主和病原體係不相容的。還可以存在水平抗性,例如典型地由許多基因控制的針對所有種的病原體的部分抗性,以及垂直抗性,例如典型地由很少的基因控制的針對病原體的某些種而不是其他種的完全抗性。在基因對基因水平中,植物和病原體一起演化,並且在一者中的遺傳變化使在另一者中的變化平衡。因此,使用自然變異,育種者針對產率、質量、均勻性、耐性、抗性將最有用的基因進行結合。抗性基因的來源包括天然或外來品種、傳家寶品種(Heirloom Varieties)、近緣野生植物、以及誘導的突變,例如用誘變劑處理植物材料。利用本發明,向植物育種者提供了一種新的誘導突變的工具。因此,熟習該項技術者可以分析抗性基因的來源的基 因組,並且在具有所希望的特徵或性狀的品種方面,採用本發明來誘導抗性基因的發生,這樣具有比先前的誘變劑更好的精確性,並且因此加速並改良植物育種計畫。
應用於植物和酵母菌;應用於生物燃料
將Cas9-CRISPR系統應用於植物和酵母菌
定義:
一般來說,術語“植物”涉及植物界中任何不同的光合、真核、單細胞或多細胞生物,其特徵性地藉由細胞分裂生長,包含葉綠體,並且具有由纖維素組成的細胞壁。術語植物涵蓋單子葉植物和雙子葉植物。確切地說,該等植物旨在包括但不限於被子植物和裸子植物,如阿拉伯樹膠、苜蓿、莧菜、蘋果、杏、朝鮮薊、白蠟樹、蘆筍、鱷梨、香蕉、大麥、豆類、甜菜、樺樹、山毛櫸、黑莓、藍莓、青花菜、抱子甘藍、捲心菜、油菜、哈密瓜、胡蘿蔔、木薯、花椰菜、雪松、穀類、芹菜、栗子、櫻桃、大白菜、柑橘、克萊門氏小柑橘、三葉草、咖啡、玉米、棉花、豇豆、黃瓜、柏樹、茄子、榆樹、菊苣、桉樹、茴香、無花果、冷杉、天竺葵、葡萄、葡萄柚、落花生、地櫻桃、樹膠鐵杉、山核桃木、羽衣甘藍、奇異果、甘藍、落葉松、萵苣、韭、檸檬、青檸、洋槐、松樹、孔雀草、玉米、芒果、楓樹、甜瓜、粟、蘑菇、芥菜、堅果、橡樹、燕麥、油棕、秋葵、洋蔥、橙、觀賞植物或花或樹木、木瓜、棕櫚、荷蘭芹、歐洲防風草、豌豆、桃、花生、梨、泥炭(peat)、胡椒、柿子、木豆、松樹、鳳梨、大蕉、李子、石榴、馬鈴薯、南瓜、菊苣、蘿蔔、油菜籽、覆盆子、稻、黑麥、高粱、紅花、黃花柳、大豆、菠菜、 雲杉、南瓜屬植物果實、草莓、糖甜菜、甘蔗、向日葵、甘薯、甜玉米、橘子、茶、煙草、番茄、樹類、黑小麥、草坪草、蕪菁、藤本植物、胡桃、豆瓣菜、西瓜、小麥、山藥、紫杉、以及西葫蘆。術語植物還涵蓋藻類,藻類主要係光能自養生物,它們主要一致缺少根、葉以及其他表徵高等植物的器官。
使用如在此描述的CRISPR/Cas9系統用於基因組編輯的方法可以用於賦予基本上任何植物所希望的性狀。針對所希望的生理學以及農學特徵,可以使用本揭露的核酸構建體和以上所述的各種轉化方法對多種多樣的植物和植物細胞系統進行工程化。在較佳的實施方式中,用於工程化的靶植物和植物細胞包括,但不限於,那些單子葉植物和雙子葉植物,例如作物(包括穀類作物(例如,小麥、玉米、稻、粟、大麥)、果實作物(例如,番茄、蘋果、梨、草莓、橙)、飼料作物(例如,苜蓿)、根用蔬菜作物(例如,胡蘿蔔、馬鈴薯、甜菜、山藥)、葉類蔬菜作物(例如,萵苣、菠菜);開花植物(例如,矮牽牛、玫瑰、菊花)、松柏植物以及松樹(例如,松杉、雲杉);植物除污中所使用的植物(例如,重金屬累積植物);油料作物(例如,向日葵、油菜種子)和用於實驗目的的植物(例如,擬南芥屬)。因此,該等方法和CRISPR-Cas系統可以用於遍及廣泛範圍的植物,像例如與屬於以下目的雙子葉植物:木蘭目(Magniolales)、八角茴香目(Illiciales)、樟目(Laurales)、胡椒目(Piperales)、馬覽鈴目(Aristochiales)、睡蓮目(Nymphaeales)、毛茛目(Ranunculales)、Papeverales、瓶子草科(Sarraceniaceae)、昆藍樹目(Trochodendrales)、金縷梅目(Hamamelidales)、Eucomiales、萊脫 納目(Leitneriales)、楊梅目(Myricales)、殼鬥目(Fagales)、木麻黃目(Casuarinales)、石竹目(Caryophyllales)、肉穗果目(Batales)、蓼目(Polygonales)、藍雪目(Plumbaginales)、五椏果目(Dilleniales)、山茶目(Theales)、錦葵目(Malvales)、蕁麻目(Urticales)、玉蕊目(Lecythidales)、紫堇目(Violales)、楊柳目(Salicales)、白花菜目(Capparales)、歐石楠目(Ericales)、Diapensales、柿樹目(Ebenales)、報春花目(Primulales)、薔薇目(Rosales)、豆目(Fabales)、川苔草目(Podostemales)、小二仙草目(Haloragales)、桃金娘目(Myrtales)、山茱萸目(Cornales)、睡蓮目(Proteales)、檀香目(San tales)、大花草目(Rafflesiales)、衛矛目(Celastrales)、大戟目(Euphorbiales)、鼠李目(Rhamnales)、無患子目(Sapindales)、胡桃目(Juglandales)、牻牛兒苗目(Geraniales)、遠志目(Polygalales)、傘形目(Umbellales)、龍膽目(Gentianales)、花蔥目(Polemoniales)、唇形目(Lamiales)、車前草目(Plantaginales)、玄參目(Scrophulariales)、桔梗目(Campanulales)、茜草目(Rubiales)、川綠斷目(Dipsacales)、以及菊目(Asterales);該等方法和CRISPR-Cas系統可以與單子葉植物一起使用,如屬於以下目的那些植物:澤瀉目(Alismatales)、水鱉目(Hydrocharitales)、茨藻目(Najadales)、黴草目(Triuridales)、鴨蹠草目(Commelinales)、穀精草目(Eriocaulales)、帚燈草目(Restionales)、禾本目(Poales)、燈芯草目(Juncales)、莎草科(Cyperales)、香蒲目(Typhales)、鳳梨目(Bromeliales)、薑目(Zingiberales)、檳榔目(Arecales)、環花目(Cyclanthales)、露兜樹目(Pandanales)、天南星目(Arales)、(Lilliales)、以及蘭目(Orchid ales),或與屬於裸子植物的植物一起使用,例如屬於 以下目的那些植物:松目(Pinales)、銀杏目(Ginkgoales)、蘇鐵目(Cycadales)、南洋杉目(Araucariales)、Cupressales以及麻黃目(Gnetales)。
在此描述的CRISPR/Cas9系統和使用方法可以用於遍及廣泛範圍的植物物種,該等植物物種包括在以下雙子葉植物、單子葉植物或裸子植物屬的非限制性列表:顛茄屬(Atropa)、油丹屬(Alseodaphne)、檟如樹屬(Anacardium)、落花生屬(Arachis)、瓊楠屬(Beilschmiedia)、芸苔屬(Brassica)、紅花屬(Carthamus)、木防己屬(Cocculus)、巴豆屬(Croton)、黃瓜屬(Cucumis)、柑橘屬(Citrus)、西瓜屬(Citrullus)、辣椒屬(Capsicum)、長春花屬(Catharanthus)、椰子屬(Cocos)、咖啡屬(Coffea)、南瓜屬(Cucurbita)、胡蘿蔔屬(Daucus)、杜氏木屬(Duguetia)、花菱草屬(Eschscholzia)、無花果屬(Ficus)、草莓屬(Fragaria)、海罌粟屬(Glaucium)、大豆屬(Glycine)、棉屬(Gossypium)、向日葵屬(Helianthus)、橡膠樹屬(Hevea)、天仙子屬(Hyoscyamus)、萵苣屬(Lactuca)、卷枝藤屬(Landolphia)、亞麻屬(Linum)、木薑子屬(Litsea)、番茄屬(Lycopersicon)、羽扇豆屬(Lupinus)、木薯屬(Manihot)、馬郁蘭屬(Majorana)、蘋果屬(Malus)、苜蓿屬(Medicago)、煙草屬(Nicotiana)、齊墩果屬(Olea)、銀膠菊屬(Parthenium)、罌粟屬(Papaver)、鱷梨屬(Persea)、菜豆屬(Phaseolus)、黃連木屬(Pistacia)、豌豆屬(Pisum)、梨屬(Pyrus)、李屬(Prunus)、蘿蔔屬(Raphanus)、蓖麻屬(Ricinus)、千里光屬(Senecio)、漢防己屬(Sinomenium)、千金藤屬(Stephania)、歐白芥屬(Sinapis)、茄屬 (Solanum)、可可屬(Theobroma)、三葉草屬(Trifolium)、胡蘆巴屬(Trigonella)、蠶豆屬(Vicia)、長春花屬(Vinca)、葡萄屬(Vilis)、以及豇豆屬(Vigna);以及以下屬:蔥屬(Allium)、須芒草屬(Andropogon)、畫眉草屬(Aragrostis)、天門冬屬(Asparagus)、燕麥屬(Avena)、狗牙根屬(Cynodon)、油棕屬(Elaeis)、羊茅屬(Festuca)、黑麥草屬(Festulolium)、Heterocallis、大麥屬(Hordeum)、浮萍屬(Lemna)、黑麥草屬(Lolium)、芭蕉屬(Musa)、稻屬(Oryza)、黍屬(Panicum)、Pannesetum、梯牧草屬(Phleum)、早熟禾屬(Poa)、黑麥屬(Secale)、高粱(Sorghum)、小麥屬(Triticum)、玉蜀黍屬(Zea)、冷杉屬(Abies)、杉木屬(Cunninghamia)、麻黃屬(Ephedra)、雲杉屬(Picea)、松屬(Pinus)、以及黃杉屬(Pseudotsuga)。
該等CRISPR/Cas9系統和使用方法還可以用於遍及廣泛範圍的“藻類”或“藻類細胞”;包括例如選自若干真核生物門的藻類,其包括紅藻植物門(Rhodophyta)(紅藻)、綠藻門(Chlorophyta)(綠藻)、褐藻門(Phaeophyta)(褐藻)、矽藻門(Bacillariophyta)(矽藻)、真眼點藻綱(Eustigmatophyta)以及溝鞭藻類連同原核門藍藻門(Cyanobacteria)(藍綠藻)。術語“藻類”包括例如選自下述的藻類:雙眉藻屬(Amphora)、魚腥藻屬(Anabaena)、Anikstrodesmis、叢粒藻屬(Botryococcus)、角毛藻屬(Chaetoceros)、衣藻屬(Chlamydomonas)、小球藻屬(Chlorella)、綠球藻屬(Chlorococcum)、小環藻屬(Cyclotella)、筒柱藻屬(Cylindrotheca)、杜氏藻屬(Dunaliella)、Emiliana、眼蟲屬(Euglena)、血球菌屬(Hematococcus)、等邊金藻屬(Isochrysis)、單鞭 金藻屬(Monochrysis)、單針藻屬(Monoraphidium)、微綠球藻屬(Nannochloris)、微綠球藻(Nannnochloropsis)、舟形藻屬(Navicula)、腎鞭藻屬(Nephrochloris)、腎爿藻屬(Nephroselmis)、菱形藻屬(Nitzschia)、節球藻屬(Nodularia)、念珠藻屬(Nostoc)、Oochromonas、卵囊藻屬(Oocystis)、顫藻屬(Oscillartoria)、巴夫藻屬(Pavlova)、褐指藻屬(Phaeodactylum)、扁藻屬(Playtmonas)、顆石藻屬(Pleurochrysis)、紫菜屬(Porhyra)、假魚腥藻屬(Pseudoanabaena)、塔胞藻屬(Pyramimonas)、裂絲藻屬(Stichococcus)、聚球藻屬(Synechococcus)、集胞藻屬(Synechocystis)、四爿藻屬(Tetraselmis)、海鏈藻屬(Thalassiosira)、以及束毛藻屬(Trichodesmium)。
可以根據本發明的方法處理植物的一部分,即“植物組織”以產生改良的植物。植物組織還包括植物細胞。如在此使用的術語“植物細胞”係指活的植物的個人單位,不論在完整的全植物中或以離體組織培養、在培養基或瓊脂上、懸浮於生長培養基或緩衝液中生長分離形式、或作為高等組織化個體的一部分,例如像,植物組織、植物器官、或全植物。
“原生質體”係指已使用例如機械或酶手段完全或部分地去除防衛細胞壁的植物細胞,由此形成可以改造它們的細胞壁、增殖並在適當的生長條件下再生長成全植物的活的植物的完整的生物化學感受態單位。
術語“轉化”廣義上是指以下過程,藉由該過程借助農桿菌(Agrobacteria)或多種化學或物理方法中的一種藉由引入DNA對植物 宿主進行基因修飾。如在此所使用的,術語“植物宿主”係指植物,包括任何細胞、組織、器官、或植物子代。許多適合的植物組織或植物細胞可以被轉化並且包括,但不局限於,原生質體、體細胞胚、花粉、葉、幼苗、莖、愈傷組織、匍匐莖、試管塊莖、以及嫩枝。植物組織還指此種植物、種子、子代、不管有性還是無性生殖的繁殖體、以及該等項中任一項所述之後代(例如插條或種子)的任何選殖。
如在此使用的術語“轉化的”係指其中已經引入外源DNA分子(如構建體)的細胞、組織、器官、或生物。所引入的DNA分子可以被整合到受體細胞、組織、器官、或生物的基因組DNA中,這樣使得所引入的DNA分子被傳遞至該後續子代。在該等實施方式中,“轉化的”或“轉基因的”細胞或植物還可以包括細胞或植物的子代以及產自採用這種轉化的植株作為雜交的親本的育種計畫並且展示出由存在所引入的DNA分子導致的改變的表型的子代。較佳的是,轉基因植物係能育的並且能夠將所引入的DNA藉由有性生殖傳遞給子代。
術語“子代”,如轉基因植物的子代,出生自、產生自、或衍生自植物或轉基因植物。所引入的DNA分子也可以被暫態引入到受體細胞中,這樣使得所引入的DNA分子不被後續子代遺傳並且因此不被認為是轉基因的。因此,如在此使用的,“非轉基因”植物或植物細胞係不包含穩定整合到其基因組中的外源DNA的植物。
如在此所使用的術語“植物啟動子”係能夠活化植物細胞轉錄的啟動子,無論其是否來源自植物細胞。示例性的適合植物啟動子包括但不局限於,那些獲得自植物、植物病毒、以及細菌(如包含在 植物細胞中表現的基因的土壤桿菌屬(Agrobacterium)或根瘤菌屬)的啟動子。
如在此使用的,“真菌細胞”係指真菌界內任何類型的真核細胞。真菌界內的門包括菌門子囊菌亞門(Ascomycota)、擔子菌門(Basidiomycota)、芽枝黴門(Blastocladiomycota)、壺菌門(Chytridiomycota)、球囊菌門(Glomeromycota)、微孢子蟲目(Microsporidia)、以及新美鞭菌門(Neocallimastigomycota)。真菌細胞可以包括酵母菌、黴菌、和絲狀真菌。在一些實施方式中,真菌細胞係酵母細胞。
如在此所使用的,術語“酵母細胞”係指以下門內的任何真菌細胞:子囊菌亞門和擔子菌門。酵母細胞可以包括芽殖酵母細胞、裂殖酵母細胞、以及黴菌細胞。不限於該等生物,在實驗室和工業設置中使用的許多類型的酵母菌係門子囊菌亞門(Ascomycota)的部分。在一些實施方式中,酵母細胞係釀酒酵母(S.cerervisiae)、馬克思克魯維酵母(Kluyveromyces marxianus)、或東方伊薩酵母(Issatchenkia orientalis)細胞。其他酵母細胞可以包括但不限於假絲酵母屬(Candida spp.)(例如,白色念珠菌(Candida albicans))、亞羅酵母屬(Yarrowia spp.)(例如,亞羅解脂酵母(Yarrowia lipolytica))、畢赤酵母屬(Pichia spp.)(例如,巴斯德畢赤酵母(Pichia pastoris))、克魯維酵母菌屬(Kluyveromyces spp.)(例如,產乳糖酶酵母(Kluyveromyces lactis)和馬克思克魯維酵母(Kluyveromyces marxianus))、脈孢菌屬(Neurospora spp.)(例如,粗糙脈孢菌(Neurospora crassa))、鐮刀菌屬(Fusarium spp.)(例如,尖孢鐮 刀菌(Fusarium oxysporum))、以及伊薩酵母屬(Issatchenkia spp.)(例如,東方伊薩酵母(Issatchenkia orientalis),又稱為庫德里阿茲威畢赤酵母(Pichia kudriavzevii)以及Candida acidothermophilum)。在一些實施方式中,真菌細胞係絲狀真菌細胞。如在此所使用的術語“絲狀真菌細胞”係指以絲狀體(即菌絲或菌絲體)生長的任何類型的真菌細胞。絲狀真菌細胞的實例可以包括但不限於麯黴屬(Aspergillus spp.)(例如,黑麯黴(Aspergillus niger))、木黴屬(Trichoderma spp.)(例如,裡氏木黴(Trichoderma reesei))、根黴(Rhizopus spp.)(例如,米根黴(Rhizopus oryzae))、和被孢黴屬(Mortierella spp.)(例如,深黃被孢黴(Mortierella isabellina))。
在一些實施方式中,真菌細胞係工業菌株。如在此使用的,“工業菌株”係指工業過程(例如,以商業或工業規模生產產品)中使用的或從中分離的任何真菌細胞菌株。工業菌株可以是指典型地在工業過程中使用的真菌物種,或者它可以是指也可用於非工業目的(例如,實驗室研究)的真菌物種的隔離群。工業過程的實例可以包括發酵(例如,在食品或飲料產品的生產中)、蒸餾、生物燃料生產、化合物生產、以及多肽生產。工業菌株的實例可以包括但不限於,JAY270和ATCC4124。
在一些實施方式中,真菌細胞係多倍體細胞。如在此使用的,“多倍體”細胞可以是指其基因組存在於多於一個拷貝中的任何細胞。多倍體細胞可以是指天然地發現處於多倍體狀態的細胞類型、或者它可以是指已被誘導以多倍體狀態存在的細胞(例如,藉由減數分裂、 胞質分裂、或DNA複製的特定調節、改變、失活、活化、或修飾)。多倍體細胞可以是指其整個基因組係多倍體的細胞、或者它可以是指感興趣的具體基因組座位係多倍體的細胞。不希望被理論所束縛,據認為指導RNA的豐度在多倍體細胞的基因組工程化中比在單倍體細胞中可以更經常地是限速組分,並且因此使用在此描述的CRISPR/Cas9系統的方法可以利用某種真菌細胞類型。
在一些實施方式中,真菌細胞係二倍體細胞。如在此使用的,“二倍體”細胞可以是指其基因組存在於兩個拷貝中的任何細胞。二倍體細胞可以是指天然地發現處於二倍體狀態的細胞類型、或者它可以是指已被誘導以二倍體狀態存在的細胞(例如,藉由減數分裂、胞質分裂、或DNA複製的特定調節、改變、失活、活化、或修飾)。例如,釀酒酵母菌株S228C可以維持處於單倍體或二倍體狀態。二倍體細胞可以是指其整個基因組係二倍體的細胞、或者它可以是指感興趣的具體基因組座位係二倍體的細胞。在一些實施方式中,真菌細胞係單倍體細胞。如在此使用的,“單倍體”細胞可以是指其基因組存在於一個拷貝中的任何細胞。單倍體細胞可以是指天然地發現處於單倍體狀態的細胞類型、或者它可以是指已被誘導以單倍體狀態存在的細胞(例如,藉由減數分裂、胞質分裂、或DNA複製的特定調節、改變、失活、活化、或修飾)。例如,釀酒酵母菌株S228C可以維持處於單倍體或二倍體狀態。單倍體細胞可以是指其整個基因組係單倍體的細胞、或者它可以是指感興趣的具體基因組座位係單倍體的細胞。
如在此使用的,“酵母表現載體”係指包含編碼RNA和/ 或多肽的一個或多個序列的核酸,並且可以進一步包含控制一種或多種核酸表現的任何所希望的元件,連同能夠使得表現載體在酵母細胞內部複製和維持的任何元件。許多適合的酵母表現載體及其特徵係本領域中已知的;例如,不同載體和技術在酵母菌實驗室手冊(Yeast Protocols),第2版,肖(Xiao),W.編輯,(胡瑪納出版社(Humana Press),紐約,2007)以及巴克哥爾茨(Buckholz),R.G.和格利森(Gleeson),M.A.(1991),生物技術(Biotechnology)(NY)9(11):1067-72中示出。酵母載體可以包含但不限於著絲粒(CEN)序列、自主複製序列(ARS)、可操作地連接到感興趣的序列或基因上的啟動子(如RNA聚合酶III啟動子)、終止子(例如,RNA聚合酶III終止子)、複製原點、和標記基因(例如,營養缺陷型、抗生素、或其他選擇性標記)。在酵母菌中使用的表現載體的實例可以包括質粒、酵母人工染色體、2μ質粒、酵母整合型質粒、酵母複製型質粒、穿梭載體、和游離型質粒。
CRISPR/Cas9系統組分在植物和植物細胞基因組中的穩定整合
在具體實施方式中,設想的是引入編碼CRISPR/Cas9系統的組分的多核苷酸以便穩定整合進植物細胞的基因組中。在該等實施方式中,可以依據該chi/sgRNA和/或Cas9基因在何時、何處及在何條件下表現,對轉化載體或表現系統的設計進行調節。
在具體實施方式中,設想了將CRISPR/Cas9系統的組分穩定地引入到植物細胞的基因組DNA中。另外地或可替代地,設想了引入CRISPR/Cas9系統的組分以便穩定整合到植物細胞器的DNA中,例如但不局限於質體、線粒體或葉綠體。
用於穩定整合到植物細胞基因組中的表現系統可以包含以下元件中的一個或多個:可以用來在植物細胞中表現RNA和/或Cas9酶的啟動子元件;增強表現的5’非翻譯區;進一步增強在某些細胞(如單子葉植物細胞)中表現的內含子元件;為插入該chi/sgRNA和/或Cas9基因序列以及其他所希望的元件提供方便的限制位點的多選殖位點;以及為所表現的轉錄物提供有效終止的3’非翻譯區。
表現系統的該等元件可以是圓形(如質粒或轉化載體)或非圓形(如直鏈雙股DNA)的一種或多種表現構建體。
在一具體實施方式中,CRISPR-Cas9表現系統包括至少:
(a)編碼與植物靶序列雜交的指導或chi/sgRNA的核苷酸序列,並且其中該指導或chi/sgRNA包括指導序列和同向重複序列,以及
(b)編碼Cas9蛋白的核苷酸序列,
其中組分(a)或(b)位於相同或不同的構建體上,並且由此不同的核苷酸序列可以在植物細胞中可操作的相同或不同調節元件的控制之下。
含有CRISPR/Cas9系統的該等組分的一種或多種DNA構建體,並且,在適用的情況下,可以藉由各種各樣的常規技術將模板序列引入到植物、植物部分、或植物細胞基因組中。該方法通常包括以下步驟:選擇適合的宿主細胞或宿主組織,將一種或多種構建體引入到宿主細胞或宿主組織中、並且從中再生植物細胞或植物。
在具體實施方式中,可以使用諸如但不限於電穿孔、微注射、植物 細胞原生質體的氣溶膠束注入的技術將DNA構建體引入到植物細胞中,或者可以使用如DNA粒子轟擊的基因槍法直接將該等DNA構建體引入到植物組織中(還參見付(Fu)等人,轉基因研究(Transgenic Res.)2000年2月;9(1):11-9)。粒子轟擊的基礎係使塗覆有感興趣的基因的顆粒加速朝向細胞,由此導致顆粒穿透原生質並且典型地穩定整合到基因組中。(參見,例如,克萊因(Klein)等人,《自然》(Nature)(1987),克萊因等人,《生物/技術》(Bio/Technology)(1992),卡薩斯(Casas)等人,《美國國家科學院院刊》(Proc.Natl.Acad.Sci.USA)(1993))。
在具體實施方式中,可以藉由土壤桿菌介導的轉化將包含CRISPR/Cas9系統的組分的DNA構建體引入到植物中。該等DNA構建體可以與適合的T-DNA側翼區結合並且被引入到常規根瘤土壤桿菌(Agrobacterium tumefaciens)宿主載體中。藉由感染植物或藉由用土壤桿菌屬細菌(含有一種或多種Ti(根瘤誘導)質粒)培育植物原生質體,可以將外源DNA結合到植物基因組中。(參見,例如,弗萊裡(Fraley)等人,(1985);羅傑斯(Rogers)等人,(1987)以及美國專利案號5,563,055)。
植物啟動子
為了確保在植物細胞中適當表現,典型地將在此描述的CRISPR/Cas9系統的組分置於植物啟動子(即在植物細胞中可操作的啟動子)的控制下。設想了使用不同類型的啟動子。
組成型植物啟動子係能夠在所有或幾乎所有植物組織的所有或幾乎所有植物發育階段表現開放讀碼框(ORF)的啟動子(稱為“組成型表現”)。組成型啟動子的一個非限制性實例係花椰菜花葉病毒 35S啟動子。“調節啟動子”係指非組成型地、但是以暫時和/或空間調節方式指導基因表現的啟動子,並且包括組織特異性、組織較佳型及誘導型啟動子。不同啟動子可以指導在不同組織或細胞類型中、或在不同發育階段、或響應於不同環境條件的基因表現。在具體實施方式中,CRISPR/Cas9組分中的一個或多個在組成型啟動子(如花椰菜花葉病毒35S啟動子)的控制之下表現。組織較佳型啟動子可以用於靶向具體植物組織中某些細胞類型的增強的表現,例如,葉或根的維管細胞或在種子的特異性細胞中。在CRISPR/Cas9系統中使用的具體啟動子的實例發現於川俁(Kawamata)等人,(1997)《植物細胞生理學》(Plant Cell Physiol)38:792-803;山本(Yamamoto)等人,(1997)《植物雜誌》(Plant J)12:255-65;伊爾(Hire)等人,(1992)《植物分子生物學》(Plant Mol Biol)20:207-18、庫斯特(Kuster)等人,(1995)《植物分子生物學》29:759-72、以及凱帕納(Capana)等人(1994)《植物分子生物學》25:681-91中。
可誘導並且允許對基因編輯或基因表現進行時空控制的啟動子的實例可以利用一種能量形式。該能量形式可以包括但不限於,聲能、電磁輻射、化學能和/或熱能。可誘導系統的實例包括四環素誘導型啟動子(Tet-開(Tet-On)或Tet-關(Tet-Off))、小分子雙雜交體轉錄活化系統(FKBP、ABA等)或光可誘導系統(光敏素、LOV結構域或隱花色素),如以序列特異性方式指導轉錄活性的變化的光誘導的轉錄效應因子(LITE)。光誘導型系統的組分可以包括CRISPR/Cas9酶、光響應細胞色素異二聚體(例如,來自擬南芥)、以及轉錄活化/抑制結構域。誘導型DNA結合蛋白和關於使用它們的方法的其他實例提供在US 61/736465和US 61/721,283 中,特此藉由引用以其全文併入。
在具體實施方式中,暫態或誘導型表現可以藉由使用例如化學調節型促進劑(即,由此應用外源化學製品誘導基因表現)來實現。也可以藉由化學阻抑型啟動子來獲得對基因表現的調節,其中應用化學製品阻抑基因表現。化學誘導型啟動子包括但不限於:由苯磺醯胺除草劑安全劑(德 維爾德(De Veylder)等人(1997)(《植物細胞生理學》(Plant Cell Physiol)38:568-77)活化的玉米ln2-2啟動子、由用作萌前除草劑的疏水性親電子化合物活化的玉米GST啟動子(GST-ll-27,WO 93/01294)、以及由水楊酸活化的煙草PR-1 a啟動子(奧諾(Ono)等人,(2004)《生物科學、生物技術、生物化學》(Biosci Biotechnol Biochem),68:803-7))。還可以在此使用由抗生素(如四環素誘導型和四環素阻抑型啟動子(加茨(Gatz)等人,(1991)《分子遺傳學與普通遺傳學》(Mol Gen Genet)227:229-37;美國專利案號5,814,618和5,789,156)調節的啟動子。
易位至和/或在特定植物細胞器中表現
該表現系統可以包括用於易位至和/或在特定植物細胞器中表現的元件。
葉綠體靶向
在具體實施方式中,設想的是將CRISPR/Cas9系統用於特異性修飾葉綠體基因或以確保葉綠體中的表現。為此目的,使用葉綠體轉化方法或將CRISPR/Cas9系統組分區室化至葉綠體。例如,向質體基因組中引入遺傳修飾可以減少生物安全性問題,如藉由花粉的基因流。
葉綠體轉化的方法係本領域中已知的並且包括粒子轟擊法、PEG處理、以及微注射。此外,可以如在WO 2010061186中所描述的來使用涉及將轉化盒從核基因組易位至質體之方法。
可替代地,設想了將CRISPR/Cas9系統組分中的一個或多個靶向植物葉綠體。這係藉由將編碼葉綠體轉運肽(CTP)或質體轉運肽的序列結合到可操作地連接到編碼Cas9蛋白的序列的5’區上的表現構建體中實現的。在處理步驟中的易位至葉綠體中的過程中去除CTP。表現蛋白的葉綠體靶向係熟習該項技術者所熟知的(參見例如蛋白質轉運到葉綠體中(Protein Transport into Chloroplasts),2010,《植物生物學年度綜述》(Annual Review of Plant Biology),第61卷:157-180)。在此類實施方式中,還希望將chi/sgRNA靶向植物葉綠體。借助葉綠體定位序列可以用於將chi/sgRNA易位到葉綠體中的方法和構建體描述於例如US 20040142476中,其藉由引用結合在此。可以將構建體的此類變化結合到本發明的表現系統中以有效易位Cas9-chi/sgRNA。
將編碼CRISPR-Cas9系統的多核苷酸引入藻類細胞中。
轉基因藻類或其他植物,如油菜,可以在植物油或生物燃料像醇類(尤其是甲醇和乙醇)或其他產品的生產中特別有用。該等可以被工程化為表現或過表現高水平的油或醇類,以供在油或生物燃料行業中使用。
US 8945839描述了使用Cas9用於工程化微藻(萊氏衣藻細胞)物種)之方法。類似地,可以將在此描述的CRISPR/Cas9系統應用於衣藻屬物種及其他藻類。在具體實施方式中,將Cas9和chi/sgRNA引入 到使用在組成型啟動子(如Hsp70A-Rbc S2或β2-微管蛋白)的控制之下表現Cas9的載體進行表現的藻類中。視情況,使用含有T7啟動子的載體對chi/sgRNA進行遞送。可替代地,可以將Cas9 mRNA和體外轉錄的chi/sgRNA遞送至藻類細胞中。電穿孔方案可由熟習該項技術者獲得,如來自GeneArt Chlamydomonas Engineering套組的標準推薦方案。
在具體實施方式中,在此使用的內切核酸酶係分離Cas9酶。對於靶向的基因組修飾,分離Cas9酶優先用於藻類中,如已經描述於WO 2015086795中。Cas9分離系統的用途特別適合用於基因組靶向的誘導型方法並且避免了在藻類細胞中Cas9過量表現的潛在毒性效應。在具體實施方式中,可以將所述Cas9分離結構域(RuvC和HNH結構域)同時地或順序地引入細胞中,這樣使得所述一個或多個分離Cas9結構域處理藻類細胞中的靶核酸序列。相比於野生型Cas9,分離Cas9的尺寸縮小允許藉由其他方法將CRISPR系統遞送到細胞中,如使用如在此描述的細胞穿透肽。這種方法用於產生經基因修飾的藻類係特別有意義的。
將編碼Cas9組分的多核苷酸引入酵母細胞中
在具體實施方式中,本發明涉及CRISPR/Cas9系統用於酵母細胞的基因組編輯的用途。可以用於引入編碼CRISPR/Cas9系統組分的多核苷酸的用於轉化酵母細胞的方法係熟習該項技術者所熟知的,並且由河合(Kawai)等人,2010,《生物工程與昆蟲》(Bioeng Bugs.)2010年11月-12月;1(6):395-403)進行了概述。非限制性實例包括藉由醋酸鋰處理(其可以進一步包括載體DNA和PEG處理)、轟擊或藉由電穿孔來轉化酵母細胞。
在植物和植物細胞中暫態表現Cas9 CRISP系統組分
在具體實施方式中,設想的是在植物細胞中暫態表現chi/sgRNA和/或Cas9基因。在該等實施方式中,僅當細胞中存在chi/sgRNA和Cas9蛋白二者時,CRISPR/Cas9系統可以確保靶基因的修飾,這樣使得可以進一步控制基因組修飾。因為Cas9酶的表現係暫態的,再生自此類植物細胞的植物典型地不含外源DNA。在具體實施方式中,Cas9酶由植物細胞穩定表現,並且暫態表現指導序列。
在具體實施方式中,使用植物病毒載體可以將CRISPR/Cas9系統組分引入到植物細胞中(斯科瑟夫(Scholthof)等人,1996,《植物病理學年鑒》(Annu Rev Phytopathol.)1996;34:299-323)。在另外的具體實施方式中,所述病毒載體係來自DNA病毒的載體。例如,雙生病毒(例如,捲心菜葉曲病毒(cabbage leaf curl virus)、豆黃矮病毒(bean yellow dwarf virus)、小麥矮小病毒(wheat dwarf virus)、番茄曲葉病毒(tomato leaf curl virus)、玉米條紋病毒(maize streak virus)、煙草曲葉病毒(tobacco leaf curl virus)、或番茄金色花葉病毒(tomato golden mosaic virus))或矮縮病毒(nanovirus)(例如,蠶豆壞死黃化病毒(Faba bean necrotic yellow virus))。在其他具體實施方式中,所述病毒載體係來自RNA病毒的載體。例如,煙草脆裂病毒組(例如,煙草脆裂病毒(tobacco rattle virus)、煙草鑲崁病毒(tobacco mosaic virus))、馬鈴薯X病毒組(例如,馬鈴薯X病毒或大麥病毒(例如,大麥條紋花葉病毒( ))。植物病毒的複製基因組係非整合載體。
在具體實施方式中,用於暫態表現CRISPR/Cas9構建體的 載體係例如pEAQ載體,其被定制為在原生質體中用於農桿菌介導的暫態表現(塞恩思伯裡(Sainsbury)F.等人,《植物生物技術雜誌》(Plant Biotechnol J.)2009年9月;7(7):682-93)。使用修飾的捲心菜葉曲病毒(CaLCuV)載體以在表現CRISPR酶的穩定轉基因植物中表現gRNA證明了基因組位置的精確靶向(《科技報告》(Scientific Reports)5,文章號:14926(2015),doi:10.1038/srep14926)。
在具體實施方式中,可以將編碼chi/sgRNA和/或Cas9基因的雙股DNA片段暫態引入到植物細胞中。在此類實施方式中,以足以修飾細胞但在經過預期的時間段之後或在一次或多次細胞分裂之後不持續的量提供所引入的雙股DNA片段。用於在植物中直接DNA轉移的方法係熟習該項技術者已知的(參見例如大衛(Davey)等人,《植物分子生物學》(Plant Mol Biol.)1989年9月;13(3):273-85)。
在其他實施方式中,將編碼Cas9蛋白的RNA多核苷酸引入到植物細胞中,然後它被以足以修飾細胞但在經過預期的時間段之後或在一次或多次細胞分裂之後不持續的量產生蛋白(在至少一種chi/sgRNA的存在下)的宿主細胞翻譯並加工。用於將mRNA引入到植物原生質體中以便暫態表現的方法係熟習該項技術者已知的(參見例如在加利耶(Gallie),《植物細胞報告》(Plant Cell Reports)(1993),13;119-122中)。
還設想了上述不同方法的組合。
將CRISPR/Cas9組分遞送到植物細胞中
在具體實施方式中,感興趣的是將CRISPR/Cas9系統的一 種或多種組分直接遞送至植物細胞中。對於產生非轉基因植物,這係尤其感興趣的(參見下文)。在具體實施方式中,在植物或植物細胞外部製備Cas9組分中的一個或多個並將其遞送到細胞中。例如,在具體實施方式中,在引入到植物細胞中之前,在體外製備Cas9蛋白。Cas9蛋白可以藉由熟習該項技術者已知的不同方法進行製備並且包括重組生產。在表現之後,將Cas9蛋白分離,如果需要的話進行再折疊,進行純化和視情況進行處理以除去任何純化標籤(如His標籤)。一旦獲得未加工、部分純化、或更完全純化的Cas9蛋白,可以將蛋白引入到植物細胞中。
在具體實施方式中,將Cas9蛋白與靶向感興趣的基因的chi/sgRNA進行混合,以形成預先裝配的核糖核蛋白。
經由電穿孔、藉由用Cas9關聯的基因產物包衣的顆粒轟擊、藉由化學轉染或藉由跨細胞膜運輸的一些其他手段,可以將該等單獨的組分或預先裝配的核糖核蛋白引入到植物細胞中。例如,用預先裝配的CRISPR核糖核蛋白對植物原生質體進行轉染已經證實能確保植物基因組的定向修飾(如吳(Woo)等人,《自然生物技術》(Nature Biotechnology),2015;DOI:10.1038/nbt.3389所描述)。
在具體實施方式中,使用奈米粒子將CRISPR/Cas9系統組分引入到植物細胞中。可以將該等組分,作為蛋白或核酸或以其組合,上載到或包裝在奈米粒子中並將其施用到植物上(例如,如描述於WO 2008042156和US 20130185823中)。具體地,本發明的實施方式包括奈米粒子,用編碼Cas9蛋白的一種或多種DNA分子、編碼chi/sgRNA和/或如描述於WO 2015089419中的分離的chi/sgRNA的DNA分子上載或填充該 奈米粒子。
用於將CRISPR/Cas9系統的一種或多種組分引入到植物細胞中的其他手段藉由使用細胞穿透肽(CPP)進行。因此,具體地,本發明的實施方式包括組成物,該組成物包括連接到Cas9蛋白上的細胞穿透肽。在本發明的具體實施方式中,Cas9蛋白和/或chi/sgRNA被連接到一個或多個CPP上,以便有效地將它們運輸至植物原生質體內(如羅摩克裡希納(Ramakrishna)所描述(2014《基因組研究》(Genome Res.)2014年6月;24(6):1020-7針對人類細胞中的Cas9)。在其他實施方式中,Cas9基因和/或chi/sgRNA係由一個或多個環狀或非環狀DNA分子所編碼的,其被連接到一個或多個CPP上以便進行植物原生質體遞送。然後,將該等植物原生質體再生成為植物細胞並且進一步成為植物。通常將CPP描述為具有少於35個胺基酸的短肽,該等胺基酸衍生自蛋白或衍生自嵌合序列,其能夠以非受體依賴性方式跨細胞膜運輸生物分子。CPP可以是陽離子肽、具有疏水序列的肽、兩親性肽、具有富含脯胺酸及抗微生物序列的肽、以及嵌合或二分肽(博客(Pooga)和朗熱爾(Langel)2005)。CPP能夠穿透生物膜,並且如此觸發不同生物分子跨細胞膜移動到細胞質中,並能改進它們的細胞內通路,並且因此促進生物分子與靶標的相互作用。CPP的實例尤其包括:Tat(藉由HIV 1型進行病毒複製所需的核轉錄活化蛋白)、穿透素、卡波濟(Kaposi)成纖維細胞增長因子(FGF)信號肽序列、整聯蛋白β3信號肽序列;聚精胺酸肽Arg序列、富含鳥嘌呤的分子轉運體、甜箭頭肽(sweet arrow peptide)等。
使用CRISPR/Cas9系統以製成遺傳修飾的非轉基因植物
在具體實施方式中,將在此描述的方法用於修飾內源基因或用於修飾它們的表現而不向植物基因組中永久性引入任何外源基因,包括那些編碼CRISPR組分的基因,以便避免植物基因組中存在外源DNA。這可以是有意義的,因為針對非轉基因植物的法規要求不那麼嚴格。
在具體實施方式中,這藉由CRISPR/Cas9組分的暫態表現來確保。在具體實施方式中,CRISPR組分中的一個或多個在一種或多種病毒載體上進行表現,該一種或多種病毒載體產生充足的Cas9蛋白和chi/sgRNA,以便根據在此描述之方法,持續穩定地確保對感興趣的基因的修飾。
在具體實施方式中,在植物原生質體中確保了CRISPR/Cas9構建體的暫態表現,並且因此未將其整合進基因組中。這種有限的表現時機可以足以允許CRISPR/Cas9系統確保對如在此描述的靶基因進行修飾。
在具體實施方式中,在遞送分子的微粒(如奈米粒子或如以上在此描述的CPP分子)的輔助下,將CRISPR/Cas9系統的不同組分單獨地或混合引入植物細胞、原生質體或植物組織中。
藉由Cas9核酸酶的直接活性以及視情況引入模板DNA或藉由對使用如在此描述的CRISPR/Cas9系統所靶向的基因進行修飾,CRISPR/Cas9組分的表現可以誘導基因組的定向修飾。以上在此描述的不同策略允許Cas9介導的定向基因組編輯,而無需將CRISPR/Cas9組分引入到植物基因組中。典型地,在雜交時將暫態引入到植物細胞中的組分去 除。
檢測植物基因組中的修飾-選擇性標記
在具體實施方式中,其中該方法涉及對植物基因組的內源靶基因進行修飾,可以使用任何適合的方法以確定,在用CRISPR/Cas9系統感染或轉染植物、植物部分或植物細胞之後,靶位點處是否已經發生基因靶向或靶向誘變。其中該方法涉及引入轉基因,針對轉基因的存在或針對由轉基因編碼的性狀,可以藉由選擇或篩選工程化的植物材料來鑒定和分離轉化的植物細胞、愈傷組織、組織或植物。物理和生物化學方法可以用於鑒定含有插入的基因構建體或內源DNA修飾的植物或植物細胞轉化體。該等方法包括但不限於:1)Southern分析或PCR擴增用於檢測以及確定重組DNA插入片段或修飾的內源基因的結構;2)Northern印跡、S1 RNA酶保護、引物延伸或逆轉錄酶-PCR擴增用於檢測以及檢查基因構建體的RNA轉錄物;3)酶法測定用於檢測酶或核酶活性,其中此類基因產物由基因構建體進行編碼,或表現受遺傳修飾的影響;4)蛋白凝膠電泳、西方墨點技術、免疫沈澱、或酶聯免疫測定,其中基因構建體或內源基因產物係蛋白質。另外的技術(如原位雜交、酶染色、以及免疫染色)也可以用於檢測重組構建體的存在或表現或用於檢測對特定植物器官和組織中內源基因的修飾。該等用於進行所有該等測定的方法對於熟習該項技術者而言是眾所周知的。
另外地(或可替代地),編碼CRISPR/Cas9組分的表現系統典型地被設計成包括一個或多個選擇性標記或檢測標記,其提供了用以分離或有效選擇含有和/或在早期階段並大規模地被CRISPR/Cas9系統 修飾的細胞的手段。
在土壤桿菌介導的轉化的情況下,標記盒可以靠近或在側翼T-DNA邊界之間並被包含於二元載體內。在另一個實施方式中,標記盒可以在T-DNA的外部。選擇性標記盒還可以在與表現盒相同的T-DNA邊界內或與之靠近或可以在二元載體(例如,2T-DNA系統)上第二T-DNA內的其他地方。
對於粒子轟擊或用原生質體轉化,表現系統可以包括一個或多個分離的線性片段或可以是更大的構建體的一部分,該更大的構建體可能包含細菌複製元件、細菌選擇性標記或其他可檢測元件。可以將包括編碼指導物和/或Cas9的多核苷酸的一種或多種表現盒以物理方式連接到標記盒上,或可以將其與編碼標記盒的第二核酸分子進行混合。標記盒由必需元件組成,以表現允許有效選擇轉化細胞的檢測標記或選擇性標記。
基於選擇性標記的細胞選擇程序將取決於標記基因的性質。在具體實施方式中,使用選擇性標記,即基於標記基因的表現,允許直接選擇細胞的標記。選擇性標記可以賦予陽性選擇或陰性選擇,並且取決於外部底物的存在係條件型或非條件型(三木(Miki)等人,2004,107(3):193-232)。最常見的是將抗生素或除草劑耐受性基因用作標記,由此藉由以下方式進行選擇:使工程化的植物材料在培養基上生長,該培養基含有抑制作用量的抗生素或除草劑,標記基因賦予對該抗生素或除草劑的抗性。此類基因的實例係賦予對抗生素(如潮黴素(hpt)和康黴素(nptII))的抗性的基因,以及賦予對除草劑的抗性(例如草丁膦 (phosphinothricin)(bar)並且氯磺隆(chlorosulfuron)(als))的基因,
還可以藉由以下方法來鑒別轉化的植物和植物細胞:針對可見標記的活性進行篩選,典型地為能夠處理有色底物(例如,β-葡糖醛酸糖苷酶、螢光素酶、B基因或C1基因)的酶。這類選擇和篩選方法對於熟習該項技術者而言是眾所周知的。
植物栽培與再生
在具體實施方式中,可以對具有修飾的基因組並且藉由在此描述的方法中的任一者產生或獲得的植物細胞進行培養以再生具有經轉化或修飾的基因型以及因此所希望的表型的全株。常規的再生技術對於熟習該項技術者而言是眾所周知的。此類再生技術的具體實例依賴於操縱組織培養生長培養基中的某些植物激素,並且典型地依賴於已經與希望的核苷酸序列一起引入的殺生物劑和/或除草劑標誌物。在另外的具體實施方式中,植物再生獲得自培養的原生質體、植物愈傷組織,外植體、器官、花粉、胚或其部分(參見例如,埃文斯(Evans)等人,(1983),《植物細胞培養手冊》(Handbook of Plant Cell Culture),克利(Klee)等人(1987)《植物生理學年鑒》(Ann.Rev.of Plant Phys.))。
在具體實施方式中,如在此描述的經轉化或改良的植物可以自體授粉以提供種子用於本發明的純合改良的植物(對於DNA修飾係純合的)或與非轉基因植物或不同的改良的植物雜交以提供種子用於雜合植物。當將重組DNA引入到植物細胞中時,這種雜交所得的植物係對於重組DNA分子雜合的植物。藉由從改良的植物雜交獲得並且包括遺傳修飾(其可以是重組DNA)的這兩種純合及雜合植物在此被稱為“子 代”。子代植物係起源於原始轉基因植物並且含有基因組修飾或藉由在此提供的方法引入的重組DNA分子的植物。可替代地,可以使用Cas9藉由上文所述方法之一來獲得轉基因植物,由此沒有外源DNA結合到基因組中。藉由進一步育種獲得的此類植物的子代也可以包含遺傳修飾。藉由任何常用於不同作物的育種方法進行育種(例如,阿拉德(Allard),《植物育種原理》(Principles of Plant Breeding),約翰威利父子公司(John Wiley & Sons),紐約(NY),U.of CA,大衛斯(Davis),加州(CA),50-98(1960)。
產生具有增強的農藝性狀的植物
可以將在此提供的基於Cas9的CRISPR系統用於引入靶向的雙股或單股斷裂和/或用於引入基因活化劑和或阻抑物系統,並且不受限制,可以用於基因靶向、基因置換、靶向誘變、靶向缺失或插入、靶向倒位和/或靶向易位。藉由共表現針對在單個細胞中實現多個修飾的多個靶向RNA,可以確保多重基因組修飾。這種技術可以用於高精度工程化具有改進特徵的植物,包括增強的營養品質、對疾病增加的抗性和對生物的和非生物脅迫增加的抗性、以及增加的有商業價值的植物產品或異源化合物的生產。
在具體實施方式中,將如在此描述的CRISPR/Cas9系統用於在內源DNA序列中引入靶向的雙股斷裂(DSB)。DSB活化細胞DNA修復途徑,可以利用其在斷裂位點附近實現所希望的DNA序列修飾。這係感興趣的,其中內源基因的失活可以賦予或促成所希望的性狀。在具體實施方式中,在DSB位點處促進用模板序列進行的同源重組,以便引入 感興趣的基因。
在具體實施方式中,CRISPR/Cas9系統可以用作融合至或可操作地連接至功能結構域上的通用核酸結合蛋白,以便活化和/或抑制內源植物基因。示例性的功能結構域可以包括但不限於:翻譯引發劑、翻譯活化蛋白、翻譯抑制蛋白、核酸酶,特別是核糖核酸酶、剪接體、珠粒、光誘導型/可控型結構域或化學誘導型/可控型結構域。典型地,在該等實施方式中,Cas9蛋白包含至少一個突變,這樣使得它具有不超過5%的不具有該至少一個突變的Cas9蛋白的活性;該chi/sgRNA包括指導序列,該指導序列能夠雜交到靶序列上。
在此描述的該等方法通常導致產生“改良的植物”,因為相比於野生型植物,它們具有一個或多個令人希望的性狀。在具體實施方式中,所獲得的植物、植物細胞或植物部分係轉基因植株,其包括結合到植物所有或部分細胞基因組中的外源DNA序列。在具體實施方式中,獲得了非轉基因遺傳修飾的植物、植物部分或細胞,因為沒有外源DNA序列結合到植物任何植物細胞的基因組中。在此類實施方式中,改良的植物係非轉基因的。當僅確保內源基因的修飾並且沒有外源基因被引入或維持在植物基因組中時,所得基因改造農作物不包含外源基因並且因此可以基本上被認為是非轉基因的。以下更詳細地描述了CRISPR/Cas9系統用於植物基因組編輯的該等不同應用:
a)引入一個或多個外源基因以賦予感興趣的農藝性狀
本發明提供了用於基因組編輯或修飾與感興趣的靶座位關聯或在感興趣的靶座位處的序列之方法,其中該方法包括:將Cas9效 應蛋白複合物引入到植物細胞中,由此該Cas9效應蛋白複合物有效地起作用以將DNA插入片段(例如,編碼感興趣的外源基因)整合到植物細胞的基因組中。在較佳的實施方式中,藉由用外源引入的DNA模板或修復模板的HR來促進DNA插入片段的整合。典型地,將外源引入的DNA模板或修復模板與Cas9效應蛋白複合物或一種組分或用於表現該複合物的組分的多核苷酸載體一起進行遞送。
在此提供的該等CRISPR/Cas9系統允許定向基因送遞。變得越來越清楚的是表現感興趣的基因的效率在很大程度上是由整合到基因組中的位置決定的。本發明的方法允許將外源基因靶向整合到基因組中所希望的位置中。可以基於先前產生的事件的資訊對位置進行選擇或者可以藉由在本文中的其他地方揭露的方法對位置進行選擇。
在具體實施方式中,在此提供的該等方法包括(a)向細胞中引入包括chi/sgRNA的CRISPR/Cas9複合物,其包括同向重複和指導序列,其中該指導序列雜交到對於植物細胞而言是內源的靶序列上;(b)當該指導序列雜交到該靶序列上並且在該指導序列所靶向的序列處或其附近誘導雙股斷裂時,將與chi/sgRNA複合的Cas9效應分子引入到植物細胞中;以及(c)將編碼HDR修復模板的核苷酸序列引入到細胞中,該修復模板編碼感興趣的基因並且作為HDR的結果其被引入到DS斷裂的位置中。在具體實施方式中,引入的步驟可以包括向植物細胞遞送編碼Cas9效應蛋白、chi/sgRNA和修復模板的一種或多種多核苷酸。在具體實施方式中,藉由DNA病毒(例如,雙生病毒群)或RNA病毒(例如,煙草脆裂病毒組)將該等多核苷酸遞送到細胞中。在具體實施方式中,引入的 步驟包括向植物細胞遞送含有一個或多個多核苷酸序列的T-DNA,該一個或多個多核苷酸序列編碼Cas9效應蛋白、chi/sgRNA和修復模板,其中經由農桿菌進行遞送。編碼Cas9效應蛋白的核酸序列可以可操作地連接到啟動子(如組成型啟動子(例如,花椰菜花葉病毒35S啟動子)、或細胞特異性或誘導型啟動子)上。在具體實施方式中,將多核苷酸藉由微彈轟擊引入。在具體實施方式中,該方法進一步包括在引入的步驟之後對植物細胞進行篩選,以確定是否已經引入修復模板(即感興趣的基因)。在具體實施方式中,該等方法包括從植物細胞中再生植物的步驟。在另外的實施方式中,該等方法包括對植物進行雜交育種,以獲得遺傳上所希望的植物譜系。下文列出了編碼感興趣的性狀的外源基因的實例。
b)編輯內源基因以賦予感興趣的農藝性狀
本發明提供了用於基因組編輯或修飾與感興趣的靶座位關聯或在感興趣的靶座位處的序列之方法,其中該方法包括:將Cas9效應蛋白複合物引入到植物細胞中,由此該Cas9複合物修飾植物內源基因的表現。這可以藉由不同方式來實現,在具體實施方式中,消除內源基因的表現係令人希望的並且將CRISPR/Cas9複合物用於靶向和切割內源基因,以便修飾基因表現。在該等實施方式中,在此提供的該等方法包括(a)向植物細胞中引入包括chi/sgRNA的CRISPR/Cas9複合物,其包括同向重複和指導序列,其中該指導序列雜交到植物細胞基因組中感興趣的基因內的靶序列上;以及(b)將Cas9效應蛋白引入到細胞中,當結合到chi/sgRNA上時,其包括雜交到該靶序列上的指導序列,確保了在該指導序列所靶向的序列處或其附近的雙股斷裂;在具體實施方式中,引入 的步驟可以包括向植物細胞遞送編碼Cas9效應蛋白和chi/sgRNA的一種或多種多核苷酸。
在具體實施方式中,藉由DNA病毒(例如,雙生病毒群)或RNA病毒(例如,煙草脆裂病毒組)將該等多核苷酸遞送到細胞中。在具體實施方式中,引入的步驟包括向植物細胞遞送含有一個或多個多核苷酸序列的T-DNA,該一個或多個多核苷酸序列編碼Cas9效應蛋白和chi/sgRNA,其中經由農桿菌進行遞送。編碼CRISPR/Cas9系統的組分的多核苷酸序列可以可操作地連接到啟動子(如組成型啟動子(例如,花椰菜花葉病毒35S啟動子)、或細胞特異性或誘導型啟動子)上。在具體實施方式中,將多核苷酸藉由微彈轟擊引入。在具體實施方式中,該方法進一步包括在引入的步驟之後對植物細胞進行篩選,以確定是否已經對感興趣的基因表現進行了修飾。在具體實施方式中,該等方法包括從植物細胞中再生植物的步驟。在另外的實施方式中,該等方法包括對植物進行雜交育種,以獲得遺傳上所希望的植物譜系。
在上述方法的具體實施方式中,藉由對疾病易感性基因或編碼植物防衛基因負調節物(例如,Mlo基因)的基因進行定向突變來獲得抗病作物。在一個具體實施方式中,藉由對植物基因(如那些編碼乙醯乳酸合酶(ALS)和原卟啉原氧化酶(PPO)的基因)中的特定核苷酸進行定向取代來產生除草劑耐受性作物。在具體實施方式中,藉由對編碼非生物脅迫耐受性的負調節物的基因進行定向突變得到耐乾旱和耐鹽作物、藉由對蠟質基因(Waxy gene)進行定向突變得到低直鏈澱粉穀物、藉由對糊粉層中的主要脂肪酶基因進行定向突變得到具有降低的酸敗性 的水稻或其他穀物等。在具體實施方式中。下文列出了編碼感興趣的性狀的內源基因的更廣泛的列表。
c)藉由CRISPR/Cas9系統調節內源基因以賦予感興趣的農藝性狀
在此還提供了使用在此提供的Cas9蛋白用於調節(即活化或抑制)內源基因表現之方法。此類方法利用一個或多個不同RNA序列,其藉由Cas9複合物被靶向至植物基因組。更具體地說,一個或多個不同RNA序列結合至兩種或多種轉接蛋白(例如,適配體),由此每個轉接蛋白與一個或多個功能結構域相關聯,並且其中與轉接蛋白關聯的一個或多個功能結構域中的至少一個具有一種或多種活性,該等活性包括甲基化酶活性、脫甲基化酶活性、轉錄活化活性、轉錄阻抑活性、轉錄釋放因子活性、組蛋白修飾活性、DNA整合活性RNA切割活性、DNA切割活性或核酸結合活性;將該等功能結構域用於調節內源植物基因的表現,以便獲得所希望的性狀。典型地,在該等實施方式中,Cas9效應蛋白具有一個或多個突變,這樣使得它具有不超過5%的不具有該至少一個突變的Cas9效應蛋白的核酸酶活性。
在具體實施方式中,在此提供的該等方法包括以下步驟:(a)向細胞中引入包括chi/sgRNA的CRISPR/Cas9複合物,其包括同向重複和指導序列,其中該指導序列雜交到對於植物細胞而言是內源的靶序列上;(b)當該指導序列雜交到該靶序列上時,將與chi/sgRNA複合的Cas9效應分子引入到植物細胞中;並且其中該chi/sgRNA被修飾成包括與功能結構域結合的不同RNA序列(適配體)和/或該Cas9效應蛋白被修飾成使其連接到功能結構域上。在具體實施方式中,引入的步驟可以包括向植 物細胞遞送編碼(修飾的)Cas9效應蛋白和(修飾的)chi/sgRNA的一種或多種多核苷酸。在此其他地方描述了CRISPR/Cas9系統的組分在該等方法中使用的詳細內容。
在具體實施方式中,藉由DNA病毒(例如,雙生病毒群)或RNA病毒(例如,煙草脆裂病毒組)將該等多核苷酸遞送到細胞中。在具體實施方式中,引入的步驟包括向植物細胞遞送含有一個或多個多核苷酸序列的T-DNA,該一個或多個多核苷酸序列編碼Cas9效應蛋白和chi/sgRNA,其中經由農桿菌進行遞送。編碼CRISPR/Cas9系統的一種或多種組分的核酸序列可以可操作地連接到啟動子(如組成型啟動子(例如,花椰菜花葉病毒35S啟動子)、或細胞特異性或誘導型啟動子)上。在具體實施方式中,將多核苷酸藉由微彈轟擊引入。在具體實施方式中,該方法進一步包括在引入的步驟之後對植物細胞進行篩選,以確定是否已經對感興趣的基因表現進行了修飾。在具體實施方式中,該等方法包括從植物細胞中再生植物的步驟。在另外的實施方式中,該等方法包括對植物進行雜交育種,以獲得遺傳上所希望的植物譜系。下文列出了編碼感興趣的性狀的內源基因的更廣泛的列表。
使用Cas9以修飾多倍體植物
許多植物係多倍體的,這意味著它們攜帶有其基因組的兩份拷貝──有時多達六份,如在小麥中。可以使根據本發明所述利用CRISPR/Cas9效應蛋白的方法“多工”,以影響基因的所有拷貝、或以同時靶向數十個基因。例如,在具體實施方式中,將本發明所述方法用於同時確保負責抑制對抗疾病的防禦的不同基因中發生功能失去突變。在具 體實施方式中,將本發明所述方法用於同時抑制TaMLO-Al、TaMLO-Bl以及TaMLO-Dl核酸序列在小麥植株細胞中的表現以及從中再生小麥植株,以便確保該小麥植株對白粉病具有抗性(還參見WO 2015109752)。
賦予農藝性狀的示例性基因
如以上在此描述的,在具體實施方式中,本發明包括使用如在此描述的CRISPR/Cas9系統用於插入感興趣的DNA,包括一個或多個植物可表現的基因。在另外的具體實施方式中,本發明涵蓋使用如在此描述的Cas9系統用於部分或完全缺失一個或多個植物表現的基因的方法和工具。在其他另外的具體實施方式中,本發明涵蓋使用如在此描述的Cas9系統以確保藉由突變、取代、插入一個或多個核苷酸對一個或多個植物表現的基因進行修飾的方法和工具。在其他具體實施方式中,本發明涵蓋如在此描述的CRISPR/Cas9系統藉由特異性修飾指導所述基因表現的一種或多種調節元件來確保對一個或多個植物表現的基因的表現進行修飾的用途。
在具體實施方式中,本發明涵蓋涉及引入外源基因和/或靶向內源基因和它們的調節元件之方法,如下所列:
1.賦予針對害蟲或疾病的抗性的基因:
‧植物疾病抗性基因。可以用選殖的抗性基因來轉化一種植物以工程化針對特定病原體菌株具有抗性的植物。參見,例如,鐘斯(Jones)等人,《科學》(Science)266:789(1994)(選殖對黃枝孢黴具有抗性的番茄Cf-9基因(cloning of the tomato Cf-9 gene for resistance to Cladosporium fulvum));馬丁(Martin)等人,《科學》(Science)262:1432 (1993)(對丁香假單胞菌番茄致病變種具有抗性的番茄Pto基因編碼蛋白激酶(tomato Pto gene for resistance to Pseudomonas syringae pv.tomato encodes a protein kinase));明尊諾(Mindrinos)等人,《細胞》(Cell)78:1089(1994)(擬南芥可以是對丁香假單胞菌具有抗性的RSP2基因(Arabidopsmay be RSP2 gene for resistance to Pseudomonas syringae))。
‧賦予針對害蟲(如大豆囊胞線蟲)的抗性的基因。參見,例如,PCT申請WO 96/30517;PCT申請WO 93/19181。
‧蘇芸金芽胞桿菌蛋白參見,例如,蓋澤(Geiser)等人,《基因》(Gene)48:109(1986)。
‧凝集素,參見,例如,尚格雲頓(Van Damme)等人,《植物分子生物學》(Plant Molec.Biol.)24:25(1994。
‧維生素結合蛋白(如親和素),參見PCT申請US 93/06487,其傳授了親和素及親和素同系物作為對抗昆蟲有害生物的殺幼蟲劑的用途。
‧酶抑制劑,如蛋白酶或蛋白酶抑制劑或澱粉酶抑制劑。參見,例如,亞伯(Abe)等人,《生物化學雜誌》(J.Biol.Chem.)262:16793(1987),赫伯(Huub)等人,《植物分子生物學》(Plant Molec.Biol.)21:985(1993)),炭穀(Sumitani)等人,《生物科學、生物科技與生物化學》(Biosci.Biotech.Biochem.)57:1243(1993)以及美國專利案號5,494,813。
‧昆蟲特異性激素或資訊素,如蛻皮甾類或保幼激素、其變體、基於其的模擬物、或其拮抗劑或激動劑。參見,例如,哈莫克(Hammock)等人,《自然》(Nature)344:458(1990)。
‧在表現時,打亂受影響的有害生物的生理學的昆蟲特異性肽或神經肽。例如,雷根(Regan),《生物化學雜誌》(J.Biol.Chem.269:9(1994),以及普拉特(Pratt)等人,《生物化學與生物物理研究通訊》(Biochem.Biophys.Res.Comm.)163:1243(1989)。還參見美國專利案號5,266,317。
‧由蛇、胡蜂、或任何其他生物在自然界中產生昆蟲特異性毒液。例如,參見龐(Pang)等人,《基因》(Gene)116:165(1992)。
‧負責單萜、倍半萜、類固醇、氧肟酸、苯丙素(phenylpropanoid)衍生物或另一種具有殺昆蟲活性的非蛋白質性的分子的超積累的酶。
‧參與修飾生物活性分子的酶,包括翻譯後修飾;例如,糖解酶、蛋白水解酶、脂解酶、核酸酶、環化酶、轉胺酶、酯酶、水解酶、磷酸酶、激酶磷酸化酶、聚合酶、彈性酶、殼多糖酶和葡聚糖酶,無論係天然的還是合成的。參見PCT申請WO 93/02197、卡拉默(Kramer)等人,《昆蟲生物化學與分子生物學》(Insect Biochem.Molec.Biol.)23:691(1993),以及卡沃萊克(Kawalleck)等人,《植物分子生物學》(Plant Molec.Biol.)21:673(1993)。
‧刺激信號轉導的分子。例如,參見博特利亞(Botella)等人,《植物分子生物學》(Plant Molec.Biol.)24:757(1994),以及格裡斯(Griess)等人,《植物生理學》(Plant Physiol.)104:1467(1994)。
‧病毒侵入性蛋白或由其衍生的錯合物毒素。參見比奇(Beachy)等人,《植物病理學年鑒》(Ann.rev.Phytopathol.)28:451(1990)。
‧由病原體或寄生物在自然界中產生的發育停頓蛋白。參見蘭姆(Lamb)等人,《生物/技術》(Bio/Technology)10:1436(1992)以及特巴特(Toubart)等人,《植物雜誌》(Plant J.)2:367(1992)。
‧由植物在自然界中產生的發育停頓蛋白。例如,洛格曼(Logemann)等人,《生物/技術》(Bio/Technology)10:305(1992)。
在植物中,病原體常常是宿主特異性的。例如,一些鐮孢屬物種會引起番茄枯萎病,而且只攻擊番茄、並且其他鐮孢屬物種只攻擊小麥。植物具有抵抗大多數病原體的現有的和誘導性的防禦。跨植物代的突變和重組事件導致產生敏感性的遺傳變異性,特別是當病原體以比植物更高的頻率繁殖時。在植物中可以存在非宿主抗性,例如,該宿主和病原體係不相容的,或者可以存在典型地由許多基因控制的針對所有種的病原體的部分抗性和/或還有針對病原體的某些種而不是其他種的完全抗性。這種抗性典型地由很少的基因控制。使用CRISP-Cas9系統的方法和組分,現在存在新工具用於預先誘導其上的特定突變。因此,人們可以分析抗性基因的來源的基因組,並且在具有所希望特徵或性狀的植物中,使用CRISPR/Cas9系統的方法和組分以誘導抗性基因的發生。本發明的系統能做到具有比先前的誘變劑更好的精確性,並且因此加速並改良植物育種計畫。
2.參與植物疾病的基因,如在WO 2013046247中列出的那些:
‧米穀病:稻瘟病菌(Magnaporthe grisea)、宮部旋孢腔菌(Cochliobolus miyabeanus)、立枯絲核菌(Rhizoctonia solani)、藤倉赤黴 (Gibberella fujikuroi);小麥病:小麥白粉病菌(Erysiphe graminis)、禾穀鐮刀菌(Fusarium graminearum)、燕麥鐮刀菌(F.avenaceum)、大刀鐮刀菌(F.culmorum)、雪黴葉枯菌(Microdochium nivale)、條形柄鏽菌(Puccinia striiformis)、禾柄鏽菌(P.Graminis)、小麥葉鏽菌(P.recondita)、粉紅雪腐病菌(Micronectriella nivale)、核瑚菌屬(Typhula sp.)、小麥黑粉菌(Ustilago tritici)、小麥網腥黑穗病菌(Tilletia caries)、小麥基腐病菌(Pseudocercosporella herpotrichoides)、禾生球腔菌(Mycosphaerella graminicola)、小麥殼多孢(Stagonospora nodorum)、偃麥草核腔菌(Pyrenophora tritici-repentis);大麥病:白粉病菌(Erysiphe graminis)、禾穀鐮刀菌(Fusarium graminearum)、燕麥鐮刀菌(F.avenaceum)、大刀鐮刀菌(F.culmorum)、雪黴葉枯菌(Microdochium nivale)、條形柄鏽菌(Puccinia striiformis)、禾柄鏽菌(P.graminis)、大麥柄鏽菌(P.hordei)、裸黑粉菌(Ustilago nuda)、大麥雲紋斑病菌(Rhynchosporium secalis)、圓核腔菌(Pyrenophora teres)、禾旋孢腔菌(Cochliobolus sativus)、麥類核腔菌(Pyrenophora graminea)、立枯絲核菌(Rhizoctonia solani);玉米病:玉米黑粉菌(Ustilago maydis)、異旋孢腔菌(Cochliobolus heterostrophus)、高粱膠尾孢(Gloeocercospora sorghi)、多堆柄鏽菌(Puccinia polysora)、玉米灰斑病菌(Cercospora zeae-maydis)、茄絲核菌(Rhizoctonia solani);
‧柑橘病害:黒點病菌(Diaporthe citri)、瘡痂病菌(Elsinoe fawcetti)、指狀青黴(Penicillium digitatum)、義大利青黴(P.italicum)、不全疫黴(Phytophthora parasitica)、柑橘褐腐疫黴(Phytophthora citrophthora);蘋果病害:Monilinia mali、蘋果樹腐爛病菌(Valsa ceratosperma)、白叉絲單囊殼(Podosphaera leucotricha)、互隔交鏈孢菌蘋果致病型(Alternaria alternata apple pathotype)、蘋果黑星病菌(Venturia inaequalis)、尖孢炭疽菌(Colletotrichum acutatum)、惡疫黴(Phytophtora cactorum);
‧梨病害:梨黑星病菌(Venturia nashicola)、梨黑星菌(V.Pirina)、梨黑斑病菌(Alternaria alternata Japanese pear pathotype)、梨膠鏽菌(Gymnosporangium haraeanum)、惡疫黴(Phytophtora cactorum);
‧桃病害:美澳型核果褐腐病菌(Monilinia fructicola)、桃瘡痂病(Cladosporium carpophilum)、擬莖點黴屬(Phomopsis sp.);
‧葡萄病害:葡萄痂囊腔菌(Elsinoe ampelina)、檬果炭疽病菌(Glomerella cingulata)、Uninula necator、Phakopsora ampelopsidis、葡萄球座菌(Guignardia bidwellii)、葡萄生單軸黴(Plasmopara viticola);
‧柿子病害:柿炭疽病(Gloesporium kaki)、柿角斑病(Cercospora kaki)、柿葉球腔菌(Mycosphaerela nawae);
‧瓠果病害:瓜類炭疽菌(Colletotrichum lagenarium)、黃瓜白粉病菌(Sphaerotheca fuliginea)、黃瓜蔓枯病(Mycosphaerella melonis)、尖孢鐮刀菌(Fusarium oxysporum)、黃瓜霜黴病菌(Pseudoperonospora cubensis)、疫黴屬(Phytophthora sp.)、腐黴屬(Pythium sp.);
‧番茄病害:茄鏈格孢菌(Alternaria solani)、黃枝孢黴(Cladosporium fulvum)、致病疫黴(Phytophthora infestans);
‧茄子病害:褐紋病菌(Phomopsis vexans)、二孢白粉菌(Erysiphe cichoracearum);
‧十字花科蔬菜病害:蘿蔔鏈格孢菌(Alternaria japonica)、白菜白斑病菌(Cercosporella brassicae)、芸薹根腫病菌(Plasmodiophora brassicae)、寄生霜黴(Peronospora parasitica);
‧大蔥病害:蔥柄鏽菌(Puccinia allii)、大蔥霜黴(Peronospora destructor);
‧大豆病害:菊池尾孢菌(Cercospora kikuchii)、大豆黑痘病菌(Elsinoe glycines)、菜豆間座殼大豆變種(Diaporthe phaseolorum var.sojae)、大豆殼針孢(Septoria glycines)、大豆尾孢(Cercospora sojina)、豆薯層鏽菌(Phakopsora pachyrhizi)、大豆疫黴病菌(Phytophthora sojae)、茄絲核菌(Rhizoctonia solani)、多主棒孢菌(Corynespora casiicola)、核盤菌(Sclerotinia sclerotiorum);
‧菜豆病害:菜豆炭疽病菌(Colletrichum lindemthianum);
‧花生病害:球座尾孢菌(Cercospora personata)、落花生尾孢(Cercospora arachidicola)、齊整小核菌(Sclerotium rolfsii);
‧豌豆病害豌豆:豌豆白粉菌(Erysiphe pisi);
‧馬鈴薯病害:茄鏈格孢菌(Alternaria solani)、致病疫黴(Phytophthora infestans)、馬鈴薯疫黴緋腐病菌(Phytophthora erythroseptica)、馬鈴薯粉痂菌(Spongospora subterranean)、f.sp.Subterranean;
‧草莓病害:白粉病菌(Sphaerotheca humuli)、檬果炭疽病菌(Glomerella cingulata);
‧茶病害:茶網餅病菌(Exobasidium reticulatum)、白星病(Elsinoe leucospila)、擬盤多毛孢屬(Pestalotiopsis sp.)、禾口炭疽病(Colletotrichum theae-sinensis);
‧煙草病害:煙草赤星病菌(Alternaria longipes)、二孢白粉菌(Erysiphe cichoracearum)、煙草炭疽病菌(Colletotrichum tabacum)、煙草霜黴(Peronospora tabacina)、煙草疫黴菌(Phytophthora nicotianae);
‧油菜籽病害:核盤菌(Sclerotinia sclerotiorum)、茄絲核菌(Rhizoctonia solani);
‧棉花病害:茄絲核菌(Rhizoctonia solani);
‧甜菜病害:甜菜尾孢菌(Cercospora beticola)、水稻紋枯病菌(Thanatephorus cucumeris)、水稻紋枯病菌(Thanatephorus cucumeris)、螺殼狀絲囊黴(Aphanomyces cochlioides);
‧玫瑰病害:薔薇雙殼菌(Diplocarpon rosae)、薔薇單囊殼(Sphaerotheca pannosa)、霜黴菌(Peronospora sparsa);
‧菊花和菊科病害:萵苣盤枝黴(Bremia lactuca)、野菊花殼針孢屬(Septoria chrysanthemi-indici)、堀病柄鏽菌(Puccinia horiana);
‧不同植物的病害:瓜果腐黴(Pythium aphanidermatum)、德巴厘腐黴(Pythium debarianum)、禾草腐黴(Pythium graminicola)、畸雌腐黴(Pythium irregulare)、終極腐黴(Pythium ultimum)、灰葡萄孢菌(Botrytis cinerea)、核盤菌(Sclerotinia sclerotiorum);
‧蘿蔔病害:甘藍鏈格孢(Alternaria brassicicola);
‧結縷草屬病害:同果核盤菌(Sclerotinia homeocarpa)、茄絲核菌(Rhizoctonia solani);
‧香蕉病害:香蕉黑條葉斑病菌(Mycosphaerella fijiensis、香蕉黃條葉斑病菌(Mycosphaerella musicola);
‧向日葵病害:向日葵霜黴病菌(Plasmopara halstedii);
‧種子病或由麯黴屬(Aspergillus spp.)、青黴屬(Penicillium spp.)、鐮刀菌屬(Fusarium spp.)、赤黴菌屬(Gibberella spp.)、木黴屬(Tricoderma spp.)、根串珠黴屬(Thielaviopsis spp.)、根黴屬(Rhizopus spp.)、毛黴屬(Mucor spp.)、伏革菌屬(Corticium spp.)、Rhoma菌屬、絲核菌屬(Rhoma spp.)、殼色單隔孢屬(Diplodia spp)、或類似物引起的在不同植物生長最初階段的疾病;
‧由多粘桿菌屬(Polymixa spp.)、油壺菌屬或類似物介導的不同植物的病毒病。
3.賦予針對除草劑的抗性的基因係實例:
‧針對抑制生長點或分生組織的除草劑的抗性,如咪唑啉酮或磺醯脲,例如,分別由李(Lee)等人,《歐洲分子生物學學會雜誌》(EMBO J.)7:1241(1988)和三木(Miki)等人,《理論與應用遺傳學》(Theor.Appl.Genet.)80:449(1990)。
‧草甘膦耐受性(分別由例如,突變體5-烯醇丙酮莽草酸-3-磷酸合 酶(EPSP)基因、aroA基因和草甘膦乙醯轉移酶(GAT)基因賦予的抗性),或如由草銨膦(來自鏈黴菌種類的草胺膦乙醯轉移酶(PAT)基因,包括吸水鏈黴菌和綠色產色鏈黴菌(Streptomyces viridichromogenes))賦予的針對其他膦醯基化合物的抗性,以及由編碼ACC酶抑制劑的基因賦予的針對吡啶氧或苯氧基丙酸以及環己酮的抗性。參見,例如,美國專利案號4,940,835以及美國專利6,248,876、美國專利案號4,769,061、EP號0 333 033以及美國專利案號4,975,374。還參見EP號0242246,德格裡夫(DeGreef)等人,生物/技術(Bio/Technology)7:61(1989),馬歇爾(Marshall)等人,《理論與應用遺傳學》(Theor.Appl.Genet.)83:435(1992),WO 2005012515至卡斯爾(Castle)等人,以及WO 2005107437。
‧針對抑制光合作用的除草劑的抗性,如三嗪(psbA和gs+基因)或苯腈(腈水解酶基因)、和穀胱甘肽S-轉移酶,在匹茲皮拉(Przibila)等人,《植物細胞》(Plant Cell)3:169(1991),美國專利案號4,810,648,和海耶斯(Hayes)等人,《生物化學雜誌》(Biochem.J.)285:173(1992)中。
‧編碼使除草劑解毒的酶或對抑制耐受的突變型穀胺醯胺合酶的基因,例如在美國專利申請案序號11/760,602中。或者,去毒酶係編碼草丁膦乙醯轉移酶的酶(如來自鏈黴菌種類的bar或pat蛋白)。草丁膦乙醯轉移酶例如描述於美國專利案號5,561,236;5,648,477;5,646,024;5,273,894;5,637,489;5,276,268;5,739,082;5,908,810以及7,112,665中。
‧羥基苯丙酮酸雙氧化酶(HPPD)抑制劑,即天然存在的HPPD耐受性酶,或編碼突變或嵌合的HPPD酶的基因,如描述於WO 96/38567、 WO 99/24585、及WO 99/24586、WO 2009/144079、WO 2002/046387、或美國專利案號6,768,044中。
4.參與非生物脅迫耐受性的基因的實例:
‧轉基因能夠降低植物細胞或植物中聚(ADP核糖)聚合酶(PARP)基因的表現和/或活性,如描述於WO 00/04173或、WO/2006/045633中。
‧轉基因能夠降低植物或植物細胞中編碼PARG的基因的表現和/或活性,如描述於例如WO 2004/090140中。
‧編碼菸醯胺腺嘌呤二核苷酸分段合成途徑的植物功能性酶的轉基因,包括菸醯胺酶、煙醯酸磷酸核糖基轉移酶、菸酸單核苷酸腺嘌呤轉移酶、菸醯胺腺嘌呤二核苷酸合成酶或菸醯胺磷酸核糖基轉移酶,如描述於例如EP 04077624.7、WO 2006/133827、PCT/EP07/002,433、EP 1999263、或WO 2007/107326中。
‧參與碳水化合物生物合成的酶包括描述於以下各項中的那些酶,例如EP 0571427、WO 95/04826、EP 0719338、WO 96/15248、WO 96/19581、WO 96/27674、WO 97/11188、WO 97/26362、WO 97/32985、WO 97/42328、WO 97/44472、WO 97/45545、WO 98/27212、WO 98/40503、WO99/58688、WO 99/58690、WO 99/58654、WO 00/08184、WO 00/08185、WO 00/08175、WO 00/28052、WO 00/77229、WO 01/12782、WO 01/12826、WO 02/101059、WO 03/071860、WO 2004/056999、WO 2005/030942、WO 2005/030941、WO 2005/095632、WO 2005/095617、WO 2005/095619、WO 2005/095618、WO 2005/123927、WO 2006/018319、WO 2006/103107、WO 2006/108702、WO 2007/009823、 WO 00/22140、WO 2006/063862、WO 2006/072603、WO 02/034923、EP 06090134.5、EP 06090228.5、EP 06090227.7、EP 07090007.1、EP 07090009.7、WO 01/14569、WO 02/79410、WO 03/33540、WO 2004/078983、WO 01/19975、WO 95/26407、WO 96/34968、WO 98/20145、WO 99/12950、WO 99/66050、WO 99/53072、美國專利案號6,734,341、WO 00/11192、WO 98/22604、WO 98/32326、WO 01/98509、WO 01/98509、WO 2005/002359、美國專利案號5,824,790、美國專利案號6,013,861、WO 94/04693、WO 94/09144、WO 94/11520、WO 95/35026或WO 97/20936,或參與多聚果糖(尤其是菊糖和果聚糖蔗類型)生產(如揭露於EP 0663956、WO 96/01904、WO 96/21023、WO 98/39460、及WO 99/24593中)、參與α-1,4-葡聚糖生產(如揭露於WO 95/31553、US 2002031826、美國專利案號6,284,479、美國專利案號5,712,107、WO 97/47806、WO 97/47807、WO 97/47808以及WO 00/14249中)、參與α-1,6支鏈α-1,4-葡聚糖生產(如揭露於WO2010/00/73422中)、參與alternan產生(如揭露於例如WO 00/47727、WO 00/73422、EP 06077301.7、美國專利案號5,908,975以及EP 0728213中)、參與透明質酸產生(如揭露於例如WO 2006/032538、WO 2007/039314、WO 2007/039315、WO 2007/039316、JP 2006304779、以及WO 2005/012529中)的酶。
‧改進抗旱性的基因。例如,WO 2013122472揭露了功能性遍在蛋白-蛋白質連接酶蛋白(UPL)蛋白,更確切地說,UPL3的缺少或水平降低導致所述植物對水的需求降低或針對乾旱的抗性改善。具有增加的耐旱性的轉基因植物的其他實例揭露於,例如,US 2009/0144850、US 2007/0266453、以及WO 2002/083911中。US2009/0144850描述了由於改變的DR02核酸表現,植物顯示出耐旱性表型。US 2007/0266453描述了由於改變的DR03核酸表現,植物顯示出耐旱性表型,並且WO 2002/083911描述了由於在保衛細胞中表現的ABC轉運體活性降低,植物具有對乾旱脅迫增加的耐受性。另一個實例係春日(Kasuga)及諸位共同作者的工作(1999),他們描述了編碼DREB1A的cDNA在轉基因植物過量表現在正常生長條件下活化了許多逆境耐性基因的表現並且導致改進的耐旱性、耐鹽負荷性、及耐凍性。然而,DREB1A的表現還導致了在正常生長條件下的嚴重生長遲緩(春日(Kasuga)(1999)《自然生物技術》(Nat Biotechnol)17(3)287-291)。
在另外的具體實施方式中,可以藉由影響特定植物性狀來改善作物植物。例如,藉由開發殺有害生物劑抗性植物、改善植物的抗病性、改善植物的昆蟲和線蟲抗性、改善植物對抗寄生雜草的抗性、改善植物的耐旱性、改善植物的營養價值、改善植物的逆境耐性、避免自體受粉、植物性飼料可消化性生物量、糧食產量等。以下提供了幾個具體的非限制性實例。
除了對單個基因的定向突變之外,可以將Cas9CRISPR複合物設計成允許植物中多個基因的定向突變、染色體片段的缺失、轉基因的位點特異性整合、體內定點誘變、以及精確的基因置換或等位基因互換。因此,在此描述的該等方法在基因發掘和驗證、突變和同種基因(cisgenic)育種、以及雜交育種中具有廣泛應用。該等應用有助於產生新一代具有不同改良的農藝性狀的基因改造農作物,如除草劑耐受性、 抗病性、非生物脅迫耐受性、高產率、以及優越的品質。
使用Cas9基因以產生雄性不育植物
相比於近交植物,雜種植物典型地具有有利的農藝性狀。然而,對於自體受粉植物,產生雜種可以是挑戰性的。在不同植物類型中,已經鑒定出對植物能育性,更具體係雄性能育性非常重要的基因。例如,在玉米中,已經鑒定出至少兩個在能育性方面非常重要的基因(新植物育種分子技術、技術開發與規範阿米塔布莫漢蒂國際會議(Amitabh Mohanty International Conference on New Plant Breeding Molecular Technologies Technology Development And Regulation),2014年10月9日-10日,齋蒲爾(Jaipur),印度;斯威塔斯夫(Svitashev)等人,《植物生理學》(Plant Physiol.)2015年10月;169(2):931-45;久卡諾維奇(Djukanovic)等人,《植物雜誌》(Plant J.)2013年12月;76(5):888-99)。可以將在此提供的該等方法用於靶向雄性能育性所需的基因,以便產生可以容易地進行雜交以產生雜種的雄性不育植物。在具體實施方式中,將在此提供的CRISPR/Cas9系統用於靶向誘變細胞色素P450像基因(MS26)或大範圍核酸酶基因(MS45),由此賦予玉米植物雄性不育性。可以將如此遺傳改變的玉米植物用於雜交育種計畫中。
增加植物的生育期
在具體實施方式中,將在此提供的該等方法用於延長植物(如水稻植株)的生育期。例如,可以靶向水稻生育期基因(如Ehd3),以便產生基因突變並且可以針對延長的再生植物生育期選擇小植株(如在CN 104004782中所描述的)。
使用Cas9以在感興趣的作物中產生遺傳變異
野生種質和作物植物遺傳變異的可用性係作物改善計畫的關鍵,但來自作物植物的種質的可用多樣性係有限的。本發明設想用於在感興趣的種質中產生遺傳變異多樣性之方法。在CRISPR/Cas9系統的該應用中提供了靶向植物基因組中不同位置的chi/sgRNA文庫並且將其與Cas9效應蛋白一起引入植物細胞中。以此方式,可以產生一批基因組範圍點突變和基因敲除。在具體實施方式中,該等方法包括從如此獲得的細胞產生植物部分或植物以及針對感興趣的性狀篩選細胞。靶基因可以包括編碼及非編碼區。在具體實施方式中,該性狀係逆境耐性並且該方法係用於產生逆境耐受性作物品種之方法。
使用Cas9以影響果實成熟
成熟係果實和蔬菜成熟過程中的正常階段。成熟開始後僅幾天就使得果實或蔬菜不可食用。這個過程給農民和消費者都帶來重大損失。在具體實施方式中,將本發明的方法用於減少乙烯產生。這藉由確保以下各項中的一個或多個來確保:a.抑制ACC合酶基因表現。ACC(1-胺基環丙烷-1-羧酸)合酶係負責將S-腺苷甲硫胺酸(SAM)轉化成ACC的酶;乙烯生物合成中的第二至最後一步。當將合酶基因的反義(“鏡像(mirror-image)”)或截短的拷貝插入到植物基因組中時,酶表現受阻;b.插入ACC脫胺酶基因。編碼該酶的基因獲得自綠針假單胞菌(Pseudomonas chlororaphis),一種常見的非病原性土壤細菌。它將ACC轉化為不同的化合物,從而減少可供用於乙烯生產的ACC量;c.插入SAM水解酶基因。這種方法類似於ACC脫胺酶,其中當乙烯先質代謝物的量 減少時,它的生產受阻;在這種情況下,SAM被轉化成同型絲胺酸。編碼該酶的基因獲得自大腸桿菌T3噬菌體,以及d.抑制ACC氧化酶基因表現。ACC氧化酶係催化ACC氧化成乙烯的酶,乙烯生物合成途徑的最後步驟。使用在此描述之方法,下調ACC氧化酶基因導致乙烯生產的抑制,由此延遲果實成熟。在具體實施方式中,另外地或可替代地,對於以上描述的修飾,將在此所描述的方法用於修飾乙烯受體,以便干擾藉由果實獲得的乙烯信號。在具體實施方式中,對編碼乙烯結合蛋白的ETR1基因表現進行修飾,更具體係抑制。在具體實施方式中,另外地或可替代地,對於以上描述的修飾,將在此所描述的方法用於修飾編碼多聚半乳糖醛酸酶(PG)的基因表現,它係負責分解果膠的酶,該物質維持植物細胞壁的完整性。果膠分解發生在成熟過程一開始時,由此導致果實的軟化。因此,在具體實施方式中,將在此描述的方法用於將突變引入PG基因中或抑制PG基因的活化,以便減少所產生的PG酶量,由此延遲果膠降解。
因此,在具體實施方式中,該等方法包括使用CRISPR/Cas9系統以確保如以上所描述的植物細胞基因組的一個或多個修飾,並且從中再生植物。在具體實施方式中,植物係番茄植株。
增加植物的貯存壽命
在具體實施方式中,將本發明的方法用於修飾參與影響植物或植物部分貯存壽命的化合物生產的基因。更具體地說,修飾發生在防止還原糖在馬鈴薯塊莖中累積的基因中。當高溫處理時,該等還原糖與游離胺基酸反應,由此產生棕色、苦味產物和升高的丙烯醯胺水平, 其中一潛在致癌物。在具體實施方式中,將在此提供的方法用於減少或抑制液泡轉化酶基因(VInv)的表現,其編碼將蔗糖分解為葡萄糖和果糖的蛋白(克拉森(Clasen)等人,DOI:10.1111/pbi.12370)。
使用CRISPR/Cas9系統以確保附加價值的性狀
在具體實施方式中,將CRISPR/Cas9系統用於產生營養改善的農作物。在具體實施方式中,在此提供的該等方法被適配成產生“功能性食品”,即可以提供超出傳統營養物質的健康益處的改性食品或食品成分,它包含和或“營養保健食品”,即可以被認為是食品或食品部分並且提供健康益處(包括預防和治療疾病)的物質。在具體實施方式中,營養保健食品可用於預防和/或治療癌症、糖尿病、心血管疾病、以及高血壓中的一種或多種。
營養改善的作物的實例包括(紐厄爾-麥克格洛克林(Newell-McGloughlin),《植物生理學》(Plant Physiology),2008年7月,第147卷,第939-953頁):
Figure 112128864-A0101-12-0558-185
修飾的蛋白質量、含量和/或胺基酸組成,如已針對百喜草所描述的(盧西亞尼(Luciani)等人,2005,《佛羅里達遺傳學會議海報》(Florida Genetics Conference Poster)),油菜(勒斯勒爾(Roesler)等人,1997,《植物生理學》(Plant Physiol)113 75-81),玉米(克倫威爾(Cromwell)等人,1967,1969《動物科學雜誌》(J Anim Sci)26 1325-1331,奧奎因(O’Quin)等人,2000《動物科學雜誌》(J Anim Sci)78 2144-2149,楊(Yang)等人,2002,《轉基因研究》(Transgenic Res)11 11-20,揚(Young)等人,2004,《植物雜誌》(Plant J)38 910-922),馬鈴薯(於(Yu)J和 歐(Ao),1997《植物學報》(Acta Bot Sin)39 329-334;查克拉博蒂(Chakraborty)等人,2000,《美國國家科學院院刊》(Proc Natl Acad Sci USA)97 3724-3729;李(Li)等人,2001)《中國科學通報》(Chin Sci Bull)46 482-484,稻(勝部(Katsube)等人,1999,《植物生理學》(Plant Physiol)120 1063-1074),大豆(丁金斯(Dinkins)等人,2001,拉普(Rapp)2002,《體外細胞與發育生物學植物》(In Vitro Cell Dev Biol Plant)37 742-747),甘薯(英格寧(Egnin)和普拉卡什(Prakash)1997,《體外細胞與發育生物學》(In Vitro Cell Dev Biol)33 52A)。
Figure 112128864-A0101-12-0559-186
必需胺基酸含量,如已針對油菜所描述的(法爾科(Falco)等人,1995,《生物/技術》(Bio/Technology)13 577-582),羽扇豆(壞特(White)等人,2001,《食品與農業科學雜誌》(J Sci Food Agric)81 147-154),玉米(萊(Lai)和梅辛(Messing),2002,Agbios 2008 GM作物資料庫(2008年3月11日)),馬鈴薯(澤(Zeh)等人,2001,《植物生理學》(Plant Physiol)127 792-802),高粱(Sorghum)(趙(Zhao)等人,2003,克呂韋爾學術出版集團(Kluwer Academic Publishers),多德雷赫特(Dordrecht),荷蘭(The Netherlands),第413-416頁),大豆(法爾科(Falco)等人,1995《生物/技術》(Bio/Technology)13 577-582;加利爾(Galili)等人,2002《植物科學評論》(Crit Rev Plant Sci)21 167-204)。
Figure 112128864-A0101-12-0559-187
如對於油菜的油和脂肪酸(迪赫斯(Dehesh)等人,(1996)《植物雜誌》(Plant J)9 167-172[PubMed];德爾維齊奧(Del Vecchio)(1996)《脂肪、油和相關材料的國際新聞》(INFORM)(International News on Fats,Oils and Related Materials)7 230-243;勒斯勒爾(Roesler)等人, (1997)《植物生理學》(Plant Physiol)113 75-81[PMC免費文章][PubMed];弗羅曼(Froman)和烏爾辛(Ursin)(2002,2003)《美國化學學會論文摘要》(Abstracts of Papers of the American Chemical Society)223 U35;詹姆斯(James)等人,(2003)《美國臨床營養學雜誌》(Am J Clin Nutr)77 1140-1145[PubMed];Agbios(2008,上述);庫頓(coton)(查普曼(Chapman)等人,(2001)。《美國石油化學會雜誌》(J Am Oil Chem Soc)78 941-947;劉(Liu)等人,(2002)《美國營養學院雜誌》(J Am Coll Nutr)21 205S-211S[PubMed];奧尼爾(O’Neill)(2007)《澳大利亞生命科學家》(Australian Life Scientist.)http://www.biotechnews.com.au/index.php/id;866694817;fp;4;fpid;2(2008年6月17日),亞麻籽(阿巴迪(Abbadi)等人,2004,《植物細胞》(Plant Cell)16:2734-2748),玉米(楊(Young)等人,2004,《植物雜誌》(Plant J)38 910-922),油棕(賈蘭尼(Jalani)等人,1997,《美國石油化學會雜誌》(J Am Oil Chem Soc)74 1451-1455;帕爾韋茲(Parveez),2003,AgBiotechNet 113 1-8),稻(愛能(Anai)等人,2003,《植物細胞報告》(Plant Cell Rep)21 988-992),大豆(雷迪(Reddy)和湯瑪斯(Thomas),1996,《自然生物技術》(Nat Biotechnol)14 639-642;金尼(Kinney)和沃爾頓(Kwolton),1998,《布萊基學術及專業》(Blackie Academic and Professional),倫敦,第193-213頁),向日葵(阿爾卡迪亞(Arcadia),《生物科學》(Biosciences)2008)
Figure 112128864-A0101-12-0560-188
糖類,如對於菊苣所描述的果聚糖(斯密肯斯(Smeekens)(1997)《植物科學發展趨勢》(Trends Plant Sci)2 286-287,施普倫格(Sprenger) 等人,(1997)《歐洲生化學會聯合會快報》(FEBS Lett)400 355-358,塞維尼埃(Sévenier)等人,(1998)《自然生物技術》(Nat Biotechnol)16 843-846),玉米(凱米(Caimi)等人,(1996)《植物生理學》(Plant Physiol)110 355-363),馬鈴薯(黑爾韋格(Hellwege)等人,1997《植物雜誌》(PlantJ)12 1057-1065),甜菜(斯密肯斯(Smeekens)等人,1997,上述),菊糖,如針對馬鈴薯所描述的(黑爾韋格(Hellewege)等人,2000,《美國國家科學院院刊》(Proc Natl Acad Sci USA)97 8699-8704),澱粉,如針對稻所描述的(施瓦爾(Schwall)等人,(2000)《自然生物技術》(Nat Biotechnol)18 551-554,蔣(Chiang)等人,(2005)《分子育種》(Mol Breed)15 125-143),
Figure 112128864-A0101-12-0561-189
維生素類和類葫蘿蔔素,如針對油菜所描述的(新穀(Shintani)和德拉佩納(DellaPenna)(1998)《科學》(Science)282 2098-2100),玉米(羅契福特(Rocheford)等人,(2002)。《美國營養學院雜誌》(J Am Coll Nutr)21 191S-198S,卡胡恩(Cahoon)等人,(2003)《自然生物技術》(Nat Biotechnol)21 1082-1087,陳(Chen)等人,(2003)《美國國家科學院院刊》(Proc Natl Acad Sci USA)100 3525-3530),芥菜籽(休梅克(Shewmaker)等人,(1999)《植物雜誌》(Plant J)20 401-412,馬鈴薯(杜克萊(Ducreux)等人,2005,《實驗植物學雜誌》(J Exp Bot)56 81-89),稻(葉(Ye)等人,(2000)《科學》(Science)287 303-305,草莓(阿吉厄斯(Agius)等人,(2003),《自然生物技術》(Nat Biotechnol)21 177-181),番茄(羅薩蒂(Rosati)等人,(2000)《植物雜誌》(Plant J)24 413-419,弗雷澤(Fraser)等人,(2001)《食品與農業科學雜誌》(J Sci Food Agric)81 822-827,梅塔(Mehta)等人,(2002)《自然生物技術》(Nat Biotechnol)20 613-618,迪亞斯.德拉.伽茲(Díaz de la Garza)等人,(2004)《美國國家科學院院刊》(Proc Natl Acad Sci USA)101 13720-13725,因芬西(Enfissi)等人,(2005)《植物生物技術雜誌》(Plant Biotechnol J)3 17-27,德拉佩納(DellaPenna)(2007)《美國國家科學院院刊》(Proc Natl Acad Sci USA)104 3675-3676。
Figure 112128864-A0101-12-0562-190
功能性次級代謝產物,如對於蘋果所描述的(芪,斯贊科夫斯基(Szankowski)等人,(2003)《植物細胞報告》(Plant Cell Rep)22:141-149),苜蓿(白藜蘆醇,希普斯金(Hipskind)和派瓦(Paiva)(2000)《分子植物微生物相互作用》(Mol Plant Microbe Interact)13 551-562),獼猴桃(白藜蘆醇,小林(Kobayashi)等人(2000)《植物細胞報告》(Plant Cell Rep)19 904-910),玉米和大豆(黃酮類,於(Yu)等人,(2000)《植物生理學》(Plant Physiol)124 781-794),馬鈴薯(花青苷和生物鹼糖苷,魯卡斯瑟維克茨(Lukaszewicz)等人,(2004)《農業食品化學期刊》(J Agric Food Chem)52 1526-1533),稻(黃酮類和白藜蘆醇,斯塔克-洛倫森(Stark-Lorenzen)等人,(1997)《植物細胞報告》(Plant Cell Rep)16 668-673,申(Shin)等人,(2006)《植物生物技術雜誌》(Plant Biotechnol J)4 303-315),番茄(+白藜蘆醇、氯原酸、黃酮類、芪;羅薩蒂(Rosati)等人,(2000)上述,繆爾(Muir)等人,(2001)《自然》(Nature)19 470-474,尼格威戈(Niggeweg)等人,(2004)《自然生物技術》(Nat Biotechnol)22 746-754,焦維納佐(Giovinazzo)等人,(2005)《植物生物技術雜誌》(Plant Biotechnol J)3 57-69),小麥(咖啡酸和阿魏酸、白藜蘆醇;美 國合眾國際新聞社(United Press International)(2002));以及
Figure 112128864-A0101-12-0563-191
礦物質獲取,如針對苜蓿所描述的(植酸酶,奧斯丁-菲力浦斯(Austin-Phillips)等人,(1999)http://www.molecularfarming.com/nonmedical.html),萵苣(Lettuse)(鐵,戈托(Goto)等人,(2000)《理論與應用遺傳學》(Theor Appl Genet)100 658-664),稻(鐵,盧卡(Lucca)等人(2002)《美國營養學院雜誌》(J Am Coll Nutr)21 184S-190S),玉米、大豆和小麥(植酸酶,德雷卡卡基(Drakakaki)等人,(2005)《植物分子生物學》(Plant Mol Biol)59 869-880,登堡(Denbow)等人,(1998)《家禽科學》(Poult Sci)77 878-881,布林克-佩德森(Brinch-Pedersen)等人,(2000)《分子育種》(Mol Breed)6 195-206)。
在具體實施方式中,附加價值的性狀與存在於植物中的化合物的所設想的健康益處相關。例如,在具體實施方式中,藉由應用本發明的方法獲得附加價值的作物,以確保修飾或誘導/增加以下化合物中的一種或多種的合成:
Figure 112128864-A0101-12-0563-192
類葫蘿蔔素,如存在於胡蘿蔔中的α-胡蘿蔔素,其中和可對細胞造成損害的自由基,或存在於不同果實和蔬菜中的β-胡蘿蔔素,其中和自由基
Figure 112128864-A0101-12-0563-193
存在於青菜中的葉黃素,其有助於到維持健康的視力
Figure 112128864-A0101-12-0563-194
存在於番茄和番茄產物的番茄紅素,其被認為能降低前列腺癌的風險
Figure 112128864-A0101-12-0564-195
存在於柑橘和玉米中的玉米黃素,其有助於到維持健康的視力
Figure 112128864-A0101-12-0564-196
存在於麥麩中的膳食纖維,如不溶性纖維,其可以降低乳腺癌和/或結腸癌的風險,以及存在於燕麥中的β-葡聚糖、存在於洋車前子(Psylium)和全穀類穀物中的可溶性纖維,其可以降低心血管疾病(CVD)的風險
Figure 112128864-A0101-12-0564-197
脂肪酸,如ω-3脂肪酸,其可以降低CVD的風險並且改進心智和視覺功能,共軛亞油酸,其可以改善身體組成,可以降低某些癌症的風險,以及GLA,其可以降低癌症和CVD的炎症風險,可以改善身體組成
Figure 112128864-A0101-12-0564-198
存在於小麥中的黃酮類,如羥基苯乙烯,其具有抗氧化劑樣活性,可以降低退行性疾病的風險,存在於果實和蔬菜中的黃酮醇、兒茶素類和單寧,其中和自由基並且可以降低癌症的風險
Figure 112128864-A0101-12-0564-199
存在於十字花科蔬菜(青花菜、羽衣甘藍)、辣根中的芥子油苷、吲哚、異硫氰酸酯,如蘿蔔硫素,其中和自由基,可以降低癌症的風險
Figure 112128864-A0101-12-0564-200
存在於葡萄中的酚類,如芪,其可以降低退行性疾病、心臟病、和癌症的風險,可具有延年益壽功效,以及存在於蔬菜和柑橘中的咖啡酸和阿魏酸,其可具有抗氧化劑樣活性,其可以降低退行性疾病、心臟病、和眼病的風險,以及存在於可可豆中的表兒茶素,其具有抗氧化劑樣活性,可以降低退行性疾病和心臟病的風險
Figure 112128864-A0101-12-0564-201
存在於玉米、大豆、小麥以及木制油類中的植物甾烷醇/甾烷醇,可以藉由降低血液膽固醇水平來降低冠心病的風險
Figure 112128864-A0101-12-0564-202
存在於洋姜、胡蔥、洋蔥粉中的果聚糖、菊糖、低聚果糖,其可 以改善胃腸道健康
Figure 112128864-A0101-12-0565-203
存在於大豆中的皂苷類,其可以降低LDL膽固醇
Figure 112128864-A0101-12-0565-204
存在於大豆中的大豆蛋白質,其可以降低心臟病的風險
Figure 112128864-A0101-12-0565-205
存在於大豆中的植物雌激素,如異黃酮,其可以減少更年期症狀(如熱潮紅),可以減少骨質疏鬆症,以及存在於亞麻、黑麥和蔬菜中的CVD和木脂素類,其可以抵抗心臟病和一些癌症,可以降低LDL膽固醇、總膽固醇。
Figure 112128864-A0101-12-0565-206
存在於洋蔥、大蒜、橄欖、韭和青蔥(scallon)中的硫化物和硫醇類,如烯丙基硫,以及存在於十字花科蔬菜中的烯丙基甲基三硫、二硫酚硫酮(dithiolthiones),其可以降低LDL膽固醇、有助於維持健康的免疫系統
Figure 112128864-A0101-12-0565-207
存在於蔓越橘、可可中的單甯,如原花色素,其可以改善泌尿道健康、可以降低CVD和高血壓的風險
Figure 112128864-A0101-12-0565-208
等。
此外,本發明的方法還設想修飾蛋白/澱粉功能、保質期、味道/美觀、纖維品質、以及過敏原、抗營養素、和毒素減少性狀。
在一個實施方式中,植物可以是豆科植物。本發明可以利用在此揭露的CRISP-Cas9系統用於探索並修飾,例如但不限於大豆、豌豆、和花生。柯廷(Curtin)等人提供了針對豆科植物功能基因組學的工具箱。(參見柯廷等人,“用於豆科植物功能基因組學的基因組工程工具箱(A genome engineering toolbox for legume Functional genomics)”,第 22屆國際植物和動物基因組會議(International Plant and Animal Genome Conference XXII)2014)。柯廷使用了CRISPR的遺傳轉化以敲除/敲低發根與全株系統中的單拷貝和複製豆科植物基因二者。選擇該等靶基因中的一些以便探索和優化敲除/敲低系統的特徵(例如,八氫番茄紅素不飽和酶),而藉由大豆與擬南芥切片機樣基因的同源性或藉由苜蓿屬中結瘤的全基因組關聯研究來鑒定其他靶基因。
花生過敏症以及豆科植物過敏症通常是真實並且嚴重的健康問題。本發明的CRISPR-Cas9效應蛋白系統可以用於鑒別並且然後編輯或沈默編碼此類豆科植物的變應原性蛋白的基因。對於此類基因和蛋白沒有限制,尼柯拉烏(Nicolaou)等人鑒別了花生、大豆、扁豆、豌豆、羽扇豆、青豆、和綠豆中的變應原性蛋白。參見,尼柯拉烏(Nicolaou)等人,變態反應學與臨床免疫學當前觀點(Current Opinion in Allergy and Clinical Immunology),2011;11(3):222)。
因此,本發明涵蓋用於生產具有附加營養價值的植物之方法,所述方法包括使用如在此描述的CRISPR/Cas9系統,向植物細胞中引入編碼參與生產附加營養價值的組分的酶的基因,以及從所述植物細胞中再生植物,所述植物的特徵在於附加營養價值的所述組分的表現增加。在具體實施方式中,將CRISPR/Cas9系統用於間接修飾該等化合物的內源合成,例如藉由修飾控制這種化合物代謝的一種或多種轉錄因子。以上在此描述了使用CRISPR/Cas9系統用於將感興趣的基因引入植物細胞中和/或修飾內源基因之方法。
已經修飾為賦予附加價值性狀的植物修飾的一些具體實 例係:具有修飾的脂肪酸代謝的植物,例如,藉由用十八烷醯-ACP脫飽和酶的反義基因轉化植物以增加植物的硬脂酸含量。參見卡努贊(Knultzon)等人,《美國國家科學院院刊》(Proc.Natl.Acad.Sci.U.S.A.)89:2624(1992)。另一個實例涉及降低植酸鹽含量,例如藉由選殖並且然後再引入與可以負責特徵為低水平植酸的玉米突變體的單個等位基因關聯的DNA。參見瑞波伊(Raboy)等人,Maydica 35:383(1990)。
類似地,玉米(玉蜀黍(Zea mays))Tfs C1和R的表現,其在強啟動子的控制下調節玉米糊粉層中的黃酮類的生產,導致擬南芥屬(擬南芥)中花青素的高累積速率,據推測係藉由活化整個途徑(布魯斯(Bruce)等人,2000,《植物細胞》(Plant Cell)12:65-80)。德拉佩納(DellaPenna)(韋爾施(Welsch)等人,2007《植物生物學年鑒》(Annu Rev Plant Biol)57:71-738)發現了,Tf RAP2.2及其相互作用配偶體SINAT2增加了擬南芥葉子中的胡蘿蔔素合成。表現Tf Dof1誘導編碼用於碳骨架生產的酶的基因的上調、胺基酸含量的顯著增加、以及轉基因擬南芥屬Glc水平的降低(柳澤(Yanagisawa),2004《植物細胞生理學》(Plant Cell Physiol)45:386-391),並且DOF Tf AtDof1.1(OBP2)上調擬南芥屬中芥子油苷生物合成途徑的所有步驟(斯科爾裡茨(Skirycz)等人,2006,《植物雜誌》(Plant J)47:10-24)。
減少植物中的過敏原
在具體實施方式中,本文提供的方法用於產生具有降低水平的過敏原的植物,使得它們對於消費者更安全。在具體實施方式中,該等方法包括改變促成植物過敏原的產生的一個或多個基因的表現。例 如,在具體實施方式中,該等方法包括下調植物細胞(例如黑麥草植物細胞)中Lol p5基因的表現,並且從其再生植物以降低所述植物的花粉的致敏性(巴拉(Bhalla)等人,1999,《美國國家科學院院刊》(Proc.Natl.Acad.Sci.USA)第96卷:11676-11680)。
感興趣的內源基因的篩選方法
本文提供的方法進一步允許跨物種、門和植物界鑒定對具有增加的營養價值的組分的產生中涉及的酶進行編碼的有價值基因,或者總體上影響感興趣的農藝性狀的基因。藉由使用如本文所述的CRISPR/Cas9系統選擇性地靶向例如編碼植物中的代謝途徑的酶的基因,可以鑒定負責植物的某些營養方面的基因。類似地,藉由選擇性地靶向可以影響令人希望的農藝性狀的基因,可以鑒定相關的基因。因此,本發明涵蓋編碼以下酶的基因的篩選方法,所述酶涉及具有特定營養價值和/或農藝性狀的化合物的產生。
CRISPR/Cas9系統在植物和酵母中的另外的應用
在生物燃料生產中CRISPR/Cas9系統的用途
如本文使用的術語“生物燃料”係從植物和植物衍生的資源製成的替代燃料。可再生生物燃料可以提取自已經藉由固碳過程獲得其能量的有機物質,或者係藉由生物質的使用或轉化來制得。這種生物質可以直接用於生物燃料或可以藉由熱轉化、化學轉化、和生物化學轉化而轉化為便利的含能量物質。這種生物質轉化可以導致處於固體、液體、或氣體形式的燃料。存在兩種類型的生物燃料:生物乙醇和生物柴油。生物乙醇主要係藉由大部分衍生自玉米和甘蔗的纖維素(澱粉) 的糖發酵過程產生。在另一方面生物柴油主要產自油料作物如油菜籽、棕櫚、和大豆。生物燃料係主要用於運輸。
增強用於生物燃料生產的植物特性
在具體實施方式中,使用採用了如本文所述的CRISPR/Cas9系統的方法來改變細胞壁特性,以便促進由關鍵水解試劑的接近,以用於更有效釋放用於發酵的糖。在具體實施方式中,纖維素和/或木質素的生物合成被修飾。纖維素係細胞壁的主要組分。纖維素和木質素的生物合成被共調節。藉由降低木質素在植物中的比例,可以增加纖維素的比例。在具體實施方式中,使用本文描述的方法下調植物中的木質素生物合成,從而增加可發酵的碳水化合物。更具體地,使用本文描述的方法來下調選自下組的至少一種第一木質素生物合成基因,該組由以下各項組成:4-香豆酸3-羥化酶(C3H)、苯丙胺酸胺裂解酶(PAL)、肉桂酸4-羥化酶(C4H)、羥基肉桂醯轉移酶(HCT)、咖啡酸O-甲基轉移酶(COMT)、咖啡醯CoA 3-O-甲基轉移酶(CCoAOMT)、阿魏酸5-羥化酶(F5H)、肉桂醇脫氫酶(CAD)、肉桂醯CoA-還原酶(CCR)、4-香豆酸-CoA連接酶(4CL)、單木質醇-特異性糖基轉移酶、和醛脫氫酶(ALDH),如WO 2008064289 A2中所揭露的。
在具體實施方式中,使用本文描述的方法來產生植物物質,該植物物質在發酵過程中產生更低水平的乙酸(還參見WO 2010096488)。更具體地,本文揭露的方法用於產生與CaslL同源的突變,以降低多糖乙醯化。
修飾酵母以用於生物燃料生產
在具體實施方式中,本文提供的Cas9酶用於由重組微生物進行生物乙醇生產。例如,可以使用Cas9來改造微生物,例如酵母,以從可發酵糖產生生物燃料或生物聚合物,並且以視情況能夠降解源自農業廢物的植物衍生木質纖維素(作為可發酵糖的來源)。更具體地,本發明提供了以下方法,借由該等方法使用該CRISPR/Cas9複合物以將生物燃料生產所需的外源基因引入微生物中和/或修飾可干擾生物燃料合成的內源基因。更具體地,該等方法涉及將編碼以下酶的一個或多個核苷酸序列引入微生物例如酵母中,該等酶涉及丙酮酸到乙醇或另一種感興趣產物的轉化。在具體實施方式中,該等方法確保引入允許微生物降解纖維素的一種或多種酶,例如纖維素酶。在又另外的實施方式中,使用CRISPR/Cas9複合物來修飾與生物燃料生產途徑競爭的內源代謝途徑。
因此,在更具體的實施方式中,使用本文描述的方法如下修飾微生物:
- 引入至少一種異源核酸或增加至少一種內源核酸的表現,所述核酸編碼植物細胞壁降解酶,使得所述微生物能夠表現所述核酸並且產生和分泌所述植物細胞降解酶;
- 引入至少一種異源核酸或增加至少一種內源核酸的表現,所述核酸編碼將丙酮酸轉化為乙醛的酶(視情況以上核酸與編碼將乙醛轉化為乙醇的酶的至少一種異源核酸組合),使得所述宿主細胞能夠表現所述核酸;和/或
- 修飾對所述宿主細胞中代謝途徑中的酶進行編碼的至少一種核酸,其中所述途徑產生除了來自丙酮酸的乙醛或來自乙醛的乙醇外的代 謝物,並且其中所述修飾導致所述代謝物的降低的產生,或者引入對所述酶的抑制劑進行編碼的至少一種核酸。
修飾藻類和植物以用於生產植物油或生物燃料
轉基因藻類或其他植物,如油菜,可以在植物油或生物燃料例如像醇類(尤其是甲醇和乙醇)的生產中特別有用。該等可以被工程化為表現或過表現高水平的油或醇類,以供在油或生物燃料行業中使用。
US 8945839描述了使用Cas9改造微藻(萊氏衣藻細胞)物種之方法。使用類似方式,本文描述的CRISPR/Cas9系統的方法可以應用於衣藻屬物種和其他藻類。在具體實施方式中,在藻類中引入Cas9和chi/sgRNA,其使用在組成型啟動子如Hsp70A-Rbc S2或β2-微管蛋白的控制下表現Cas9的載體進行表現。chi/sgRNA將使用含有T7啟動子的載體來遞送。可替代地,Cas9 mRNA和體外轉錄的chi/sgRNA可以被遞送到藻類細胞中。電穿孔方案遵循來自GeneArt Chlamydomonas Engineering套組的標準推薦方案。
使用Cas9產生能夠生產脂肪酸的微生物
在具體實施方式中,本發明的方法用於產生基因工程化的能夠產生脂肪酸酯例如脂肪酸甲酯(“FAME”)和脂肪酸乙酯(“FAEE”)的微生物。
在具體實施方式中,設想特異性地修飾以下基因,該等基因涉及改變由藻類細胞產生的脂質的量和/或脂質的品質。編碼涉及脂肪 酸合成途徑的酶的基因的實例可以編碼具有例如以下酶的活性的蛋白:乙醯CoA羧化酶,脂肪酸合酶,3-酮脂醯-醯基載體蛋白合酶III,甘油-3-磷酸脫氫酶(G3PDH),烯醯-醯基載體蛋白還原酶(烯醯-ACP-還原酶),甘油-3-磷酸醯基轉移酶,溶血磷脂酸醯基轉移酶或二醯基甘油醯基轉移酶,磷脂:二醯基甘油醯基轉移酶,磷脂酸磷酸酶,脂肪酸硫酯酶(thioesterase)如棕櫚醯蛋白硫酯酶,或蘋果酸酶。在另外的實施方式中,設想產生具有增加的脂質積累的矽藻。這可以藉由靶向降低脂質異化作用的基因來實現。對於用於本發明方法特別感興趣的是涉及活化三醯甘油和游離脂肪酸兩者的基因,連同直接涉及脂肪酸的β-氧化的基因,如醯基-CoA合成酶、3-酮脂醯-CoA硫解酶、醯基-CoA氧化酶活性和葡糖磷酸變位酶。本文所述的Cas9系統和方法可以用於特異性地活化矽藻中的此類基因以增加其脂質含量。
典型地,宿主細胞可以被工程化為藉由表現或過表現編碼硫酯酶的基因、編碼醯基-CoA合酶的基因、以及編碼酯合酶的基因,從存在於培養基中的碳源如醇產生脂肪酸酯。因此,本文提供的方法用於修飾微生物以過表現或引入硫酯酶基因、編碼醯基-CoA合酶的基因、以及編碼酯合酶的基因。在具體實施方式中,該硫酯酶基因係選自tesA、'tesA、tesB、fatB、fatB2、fatB3、fatAl、或fatA。在具體實施方式中,編碼醯基-CoA合酶的基因係選自fadDJadK、BH3103、pfl-4354、EAV15023、fadD1、fadD2、RPC_4074、fadDD35、fadDD22、faa39、或編碼具有相同特性的酶的經鑒定基因。在具體實施方式中,編碼酯合酶的基因係編碼來自以下項的合酶/醯基-CoA:二醯基甘油醯基轉移酶的基因:霍霍巴 (Simmondsia chinensis)、不動桿菌屬物種ADP、泊庫島食烷菌、銅綠假單胞菌、賈登思豐迪菌(Fundibacter jadensis)、擬南芥、或真養產鹼桿菌(Alkaligenes eutrophus)、或其變體。另外地或可替代地,本文提供的方法用於降低編碼醯基-CoA脫氫酶的基因、編碼外膜蛋白受體的基因、以及編碼脂肪酸生物合成的轉錄調節因子的基因中的至少一者在所述微生物中的表現。在具體實施方式中,該等基因中的一個或多個例如藉由引入突變而失活。在具體實施方式中,編碼醯基-CoA脫氫酶的基因係fadE。在具體實施方式中,編碼脂肪酸生物合成的轉錄調節因子的基因編碼DNA轉錄抑制蛋白,例如fabR。
另外地或可替代地,所述微生物被修飾為降低編碼丙酮酸甲酸裂解酶的基因、編碼乳酸脫氫酶的基因、或兩者中的至少一種的表現。在具體實施方式中,編碼丙酮酸甲酸裂解酶的基因係pflB。在具體實施方式中,編碼乳酸脫氫酶的基因係係IdhA。在具體實施方式中,該等基因中的一種或多種例如藉由向其中引入突變而失活。
在具體實施方式中,該微生物選自以下屬:埃希氏菌屬、芽孢桿菌屬、乳桿菌屬、紅球菌屬、聚球藻屬、集胞藻屬(Synechoystis)、假單胞菌屬、麯黴屬、木黴屬、脈孢菌屬、鐮孢屬、腐質黴屬、根毛黴屬、克魯維酵母屬、畢赤酵母屬、毛黴屬、毀絲黴屬(Myceliophtora)、青黴屬、顯革菌屬、側耳屬、栓菌屬、金孢子菌屬、酵母屬、寡養單胞菌屬(Stenotrophamonas)、裂殖酵母屬、亞羅酵母屬、或鏈黴菌屬。
使用Cas9產生能夠生產有機酸的微生物
本文提供的方法被進一步用於改造能夠更特別地從戊糖 或己糖生產有機酸的微生物。在具體實施方式中,該等方法包括將外源LDH基因引入微生物。在具體實施方式中,在所述微生物中的有機酸生產係另外地或可替代地藉由使編碼涉及內源代謝途徑(該內源代謝途徑產生除感興趣有機酸之外的代謝物和/或其中該內源代謝途徑消耗該有機酸)的蛋白的內源基因失活來增加。在具體實施方式中,該修飾確保了除感興趣有機酸之外的代謝物的產生得以降低。根據具體實施方式,使用該等方法以引入其中消耗該有機酸的內源途徑的至少一種工程化的基因缺失和/或失活,或編碼涉及內源途徑(該內源途徑產生除感興趣有機酸之外的代謝物)的產物的基因的缺失和/或失活。在具體實施方式中,該至少一種工程化的基因缺失或失活係在編碼選自下組的酶的一個或多個基因中,該組由以下各項組成:丙酮酸脫羧酶(pdc)、延胡索酸還原酶、醇脫氫酶(adh)、乙醛脫氫酶、磷酸烯醇式丙酮酸羧化酶(ppc)、D-乳酸脫氫酶(d-ldh)、L-乳酸脫氫酶(l-ldh)、乳酸2-單加氧酶。在另外的實施方式中,該至少一種工程化的基因缺失和/或失活係在編碼丙酮酸脫羧酶(pdc)的內源基因中。
在另外的實施方式中,該微生物被工程化為產生乳酸,並且該至少一種工程化的基因缺失和/或失活係在編碼乳酸脫氫酶的內源基因中。另外地或可替代地,該微生物包括以下內源基因的至少一種工程化的基因缺失或失活,該內源基因編碼細胞色素依賴性乳酸脫氫酶,例如細胞色素B2-依賴性L-乳酸脫氫酶。
使用Cas9產生改進的木糖或纖維二糖利用型酵母菌株
在具體實施方式中,可以應用該CRISPR/Cas9系統來選擇 改進的木糖或纖維二糖利用型酵母菌株。易錯PCR可以用於擴增涉及木糖利用或纖維二糖利用途徑的一個(或多個)基因。涉及木糖利用途徑和纖維二糖利用途徑的基因的實例可以包括但不限於描述於以下中的那些:哈(Ha),S.J.等人(2011)《美國國家科學院院刊》(Proc.Natl.Acad.Sci.USA)108(2):504-9和加拉茲卡(Galazka),J.M.等人(2010)《科學》(Science)330(6000):84-6。所得雙股DNA分子文庫,各自在這種所選基因中包括隨機突變,可以與CRISPR/Cas9系統的組分共轉化到酵母菌株(例如S288C)中,並且可以用增強的木糖或纖維二糖利用能力來選擇菌株,如WO 2015138855中所述。
使用Cas9產生用於類異戊二烯生物合成的改進的酵母菌株
塔達斯賈克那(Tadas Jakočiūnas)等人描述了多元CRISPR/Cas9系統用於在一轉化步驟中在麵包酵母釀酒酵母中基因組工程化高達5個不同基因組座位的成功應用(《代謝工程》(Metabolic Engineering),第28卷,2015年3月,第213-222頁),導致具有高甲羥戊酸(為工業上重要的類異戊二烯生物合成途徑的關鍵中間體)產生的菌株。在具體實施方式中,該CRISPR/Cas9系統可以應用於如本文描述的多元基因組工程化方法中,以用於鑒定另外的用於在類異戊二烯合成中使用的高產酵母菌株。
使用Cas9產生生產乳酸的酵母菌株
在另一個實施方式中,涵蓋了多元CRISPR/Cas9系統的成功應用。類似於弗拉季斯拉夫斯塔威克(Vratislav Stovicek)等人(《代謝工程通訊》(Metabolic Engineering Communications),第2卷,2015年12 月,第13-22頁),可以按單一轉化事件設計和獲得改進的生產乳酸的菌株。在具體實施方式中,CRISPR/Cas9系統用於同時地插入異源乳酸脫氫酶基因和破壞兩個內源基因PDC1和PDC5基因。
CRISPR/Cas9系統在植物中的另外應用
在具體實施方式中,CRISPR系統、並且較佳的是本文描述的CRISPR/Cas9系統,可以用於視覺化遺傳元件動力學。例如,CRISPR成像可以視覺化重複或非重複性基因組序列,報告端粒長度變化和端粒運動,並且監測整個細胞週期中基因座位的動力學(陳(Chen)等人,《細胞》(Cell),2013)。該等方法還可以應用於植物。
CRISPR系統並且較佳的是本文描述的CRISPR/Cas9系統的其他應用,係體外和體內靶向的基因破壞陽性選擇篩選(馬利納(Malina)等人,《基因和發育》(Genes and Development),2013)。該等方法還可以應用於植物。
在具體實施方式中,非活性Cas9內切核酸酶與組蛋白修飾酶的融合可以在複雜的表觀基因組中引入定制變化(魯斯克(Rusk)等人,《自然方法》(Nature Methods),2014)。該等方法還可以應用於植物。
在具體實施方式中,CRISPR系統並且較佳的是本文描述的CRISPR/Cas9系統可以用於純化染色質的特定部分並且鑒定相關蛋白,由此說明其在轉錄中的調節作用(沃爾德里普(Waldrip)等人,《表觀遺傳學》(Epigenetics),2014)。該等方法還可以應用於植物。
在具體實施方式中,本發明可以用作用於在植物系統中去 除病毒的療法,因為它能夠切割病毒DNA和RNA兩者。在人類系統中的先前研究已經證實了在靶向丙型肝炎單股RNA病毒(A.普裡斯(Price)等人,《國家科學院院刊》(Proc.Natl.Acad.Sci),2015)連同乙型肝炎雙股DNA病毒(V.羅馬南(Ramanan)等人,《科學報告》(Sci.Rep),2015)中成功利用CRISPR。該等方法還可以被適配用於在植物中使用CRISPR/Cas9系統。
在具體實施方式中,本發明可以用於改變基因組複雜性。在另外的具體實施方式中,該CRISPR系統並且較佳的是本文描述的CRISPR/Cas9系統可以用於破壞或改變染色體數目,並產生僅包含來自一個親本的染色體的單倍體植物。此類植物可以被誘導為經歷染色體複製,並且轉化為僅包含純合子等位基因的二倍體植物(卡裡米-阿什蒂亞尼(Karimi-Ashtiyani)等人,PNAS,2015;安東(Anton)等人,《細胞核》(Nucleus),2014)。該等方法還可以應用於植物。
在具體實施方式中,本文描述的CRISPR/Cas9系統可以用於自我切割。如所述,Cas9酶和sgRNA的啟動子係組成型啟動子,並且第二sgRNA被引入在相同的轉化盒中,但由誘導型啟動子控制。該第二sgRNA可以被指定為誘導Cas9基因中的位點特異性切割,以便產生非官能Cas9。在另外的具體實施方式中,該第二sgRNA誘導在轉化盒的兩端上的切割,導致盒從宿主基因組中的去除。該系統提供了細胞暴露於Cas酶的受控持續時間,並且進一步使脫靶編輯最小化。另外,對CRISPR/Cas盒的兩端的切割可以用於產生具有雙等位基因突變的無轉基因T 0植物(例如莫耳(Moore)等人,《核酸研究》(Nucleic Acids Research),2014;舍 費爾(Schaeffer)等人,《植物科學》(Plant Science),2015)。莫耳(Moore)等人的該等方法可以應用於本文描述的CRISPR/Cas9系統。
改進的植物
本發明還提供了藉由本文提供的方法可獲得和獲得的植物和酵母細胞。藉由本文描述的方法獲得的改進的植物可以藉由以下基因的表現用於食品或飼料生產中,該等基因例如確保對植物有害生物、除草劑、乾旱、低溫或高溫、過量水等的耐受性。
藉由本文描述的方法獲得的改進的植物,尤其是作物和藻類可以藉由表現例如比在野生型中通常所見的更高的蛋白、碳水化合物、營養素或維生素水平而用於食品或飼料生產中。在此方面,改進的植物,尤其是豆類和塊莖係較佳的。
改進的藻類或其他植物,如油菜,可以在植物油或生物燃料例如像醇類(尤其是甲醇和乙醇)的生產中特別有用。該等可以被工程化為表現或過表現高水平的油或醇類,以供在油或生物燃料行業中使用。
本發明還提供了植物的改進部分。植物部分包括但不限於,葉、莖、根、塊莖、種子、胚乳、胚珠、以及花粉。如本文設想的植物部分可以是可存活的、不可存活的、可再生的和/或不可再生的。
還本文涵蓋的是提供了根據本發明的方法產生的植物細胞和植物。藉由傳統育種方法產生的包括遺傳修飾的植物的配子、種子、胚、合子或體細胞、子代或雜合體也包括在本發明的範圍內。此類植物 可以包含插入或代替靶序列的異源或外源DNA序列。可替代地,此類植物可以僅包含在一個或多個核苷酸中的改變(突變、缺失、插入、取代)。這樣,此類植物與它們的祖先植物的不同之處將僅在於具體修飾的存在。
農場動物和生產動物
因此,本發明提供了由本發明方法產生的植物、動物或細胞或其子代。該子代可以是產生的植物或動物的選殖或可以藉由與同一物種的其他個體雜交而由有性繁殖產生,以在其後代中基因滲入另外的令人希望的性狀。在多細胞生物(特別是動物或植物)的情況下,該細胞可以是在體內或離體的。
生物體和動物;方法
本申請還可以被擴展到其他農業應用,如,例如,農場動物和生產動物。例如,豬具有使得它們作為生物醫學模型(尤其是在再生醫學中)引人注目的許多特徵。具體地,患有重症綜合性免疫缺陷(SCID)的豬可以提供用於再生藥物、異種移植、和腫瘤發展的有用模型,並且將有助於開發人類SCID患者的療法。李(Lee)等人(《美國國家科學院院刊》(Proc Natl Acad Sci U S A.)2014年5月20日;111(20):7260-5)利用報告子-指導的轉錄活化蛋白樣效應核酸酶(TALEN)系統來以高效率產生體細胞中重組活化基因(RAG)2的靶向修飾,包括影響兩個等位基因的一些。CRISPR Cas可以應用於類似系統。
李(Lee)等人,(《美國國家科學院院刊》(Proc Natl Acad Sci U S A.),2014年5月20日;111(20):7260-5)的方法可以如下應用於本發明。突變的豬係藉由靶向修飾在胎兒成纖維細胞中的RAG2,隨後進行 SCNT和胚胎轉移而產生。編碼CRISPR Cas的構建體以及報告子被電穿孔到胎-衍生的成纖維細胞中。在48h後,將表現綠色螢光蛋白的轉染的細胞以單一細胞/孔的估計稀釋分選到96孔板的單獨的孔中。RAG2的靶向修飾係藉由擴增在任何CRISPR Cas切割位點側翼的基因組DNA片段、隨後對PCR產物進行定序來篩選的。在篩選並確保脫靶突變的缺乏之後,將攜帶RAG2的靶向修飾的細胞用於SCNT。去除極體、連同卵母細胞的相鄰細胞質(推測含有中期II板)的一部分,並且將供體細胞放置於卵黃周。然後將重構胚胎電穿孔以將供體細胞與卵母細胞融合並且然後進行化學活化。將活化的胚胎培養於具有0.5μM Scriptaid(S7817;西格瑪奧德里奇公司(Sigma-Aldrich))的豬合子培養基3(PZM3)中,持續14-16h。然後將胚洗滌以去除Scriptaid並且在PZM3中培養直到它們被轉移到替代豬的輸卵管中。
本發明還適用於修飾其他動物例如母牛的SNP。丹(Tan)等人(《美國國家科學院院刊》(Proc Natl Acad Sci U S A.),2013年10月8日;110(41):16526-16531)使用質粒、rAAV、以及寡核苷模板擴展了家畜基因編輯工具箱,以包括轉錄活化蛋白樣(TAL)效應核酸酶(TALEN)-和規律間隔成簇短迴文重複序列(CRISPR)/Cas9-刺激的同源定向修復(HDR)。基因特異性gRNA序列根據其方法被選殖到丘奇(Church)實驗室gRNA載體(Addgene ID:41824)中(馬里(Mali)P等人(2013)經由Cas9的RNA-指導的基因組工程化(Human Genome Engineering via Cas9.)《科學》(Science)339(6121):823-826)。藉由共轉染hCas9質粒(Addgene ID:41815)或從RCIScript-hCas9合成的mRNA來提供Cas9核 酸酶。藉由從hCas9質粒(包含hCas9 cDNA)亞選殖XbaI-AgeI片段到RCIScript質粒中,來構建該RCIScript-hCas9。
許(Heo)等人(《幹細胞發育》(Stem Cells Dev.)2015年2月1日;24(3):393-402.doi:10.1089/scd.2014.0278.電子出版2014年11月3日)報導在牛基因組中使用牛多能細胞和規律間隔成簇短迴文重複序列(CRISPR)/Cas9核酸酶進行高效基因靶向。首先,許(Heo)等人,藉由異位表現山中因子(yamanaka factor)和GSK3β及MEK抑制劑(2i)處理,產生了來自牛體細胞成纖維細胞的誘導多能幹細胞(iPSC)。許(Heo)等人觀察到在畸胎瘤中的基因表現和發育潛能方面,該等牛iPSC高度類似於天然多能幹細胞。此外,對牛NANOG座位具有特異性的CRISPR/Cas9核酸酶示出在牛iPSC和胚胎中牛基因組的高度有效的編輯。
Igenity®提供了動物例如母牛的特徵分析,以進行和傳遞具有經濟意義的經濟性狀的性狀,例如胴體成分、胴體品質、母體和繁殖性狀以及平均日增重。綜合Igenity®特徵分析開始於DNA標記的發現(最常見的單核苷酸多態性或SNP)。在Igenity®特徵之後的所有標記由在研究機構(包括大學、研究組織和政府機構如USDA)的獨立科學家發現。然後在Igenity®在驗證群體中分析了標記。Igenity®使用了代表不同生產環境和生物型的多種資源群體,常常與來自牛肉產業的種畜、小牛、飼育場和/或包裝區的工業夥伴一起工作以收集不是通常可獲得的表型。牛基因組資料庫係廣泛可獲得的,參見例如NAGRP牛基因組協作計畫(http://www.animalgenome.org/cattle/maps/db.html)。因此,本發明可以用於靶向牛SNP。熟習該項技術者可以利用上述方案用於靶向SNP,並將 它們應用於牛SNP,如在例如由丹(Tan)等人或許(Heo)等人所述。
鄒清間(Qingjian Zou)等人(《分子細胞生物學進展通路雜誌》(Journal of Molecular Cell Biology Advance Access),出版於2015年10月12日)證明了在狗中藉由靶向狗肌生成抑制蛋白(MSTN)基因(骨骼肌質量的負調節子)的第一外顯子而增加肌肉質量。首先,使用靶向MSTN的sgRNA與Cas9載體共轉染到犬胚胎成纖維細胞(CEF)中,來驗證sgRNA的效率。此後,藉由以下方式產生MSTN KO狗:用Cas9 mRNA和MSTN sgRNA的混合物顯微注射具有正常形態學的胚胎,並且將合子自體移植到相同的雌性狗的輸卵管中。與其野生型同窩出生的姐妹相比,敲除的狗在大腿上展示出明顯的肌肉表型。
家畜-豬
在一些實施方式中,在家畜中的病毒靶標可以包括例如在豬巨噬細胞上的豬CD163。CD163與PRRSv(豬繁殖和呼吸障礙綜合症病毒,動脈炎病毒屬)感染相關(認為是藉由病毒細胞進入)。PRRSv感染,尤其是豬肺泡巨噬細胞(在肺中發現),導致在以前不可治癒的豬綜合症(“神秘豬病”或“藍耳病”),其引起家庭豬患病,包括繁殖失敗、重量減輕和高死亡率。經常看到由於藉由丟失巨噬細胞活性造成的免疫缺陷引起的機會性感染,例如地方性肺炎、腦膜炎和耳腫脹。因增加的抗生素利用和財務損失(估計每年6億6千萬美元)這還具有顯著的經濟學和環境反響。
如由密蘇裡大學的克莉絲汀(Kristin)M惠特沃思(Whitworth)和蘭德爾普拉瑟博士(Dr Randall Prather)等人(《自然 生物技術》(Nature Biotech)3434,線上公開於2015年12月07日)和與Genus Plc合作中所報導,CD163係使用CRISPR-Cas9來靶向,並且編輯的豬的後代在暴露於PRRSv中時係有抗性的。一個雄性創立者和一個雌性創立者二者均具有CD163的外顯子7中的突變,將它們進行繁殖以產生後代。雄性創立者在一個等位基因上的外顯子7中具有11-bp缺失,這導致在結構域5中胺基酸45處的移碼突變和錯義翻譯以及後續的在胺基酸64處的提前終止密碼子。其他等位基因在外顯子7中具有2-bp添加,並且在前面內含子中具有377-bp缺失,其被預測為導致結構域5的前49個胺基酸的表現以及後續的在胺基酸85處的提前終止密碼子。母豬具有在一個等位基因中的7bp添加,其在翻譯時被預測為表現結構域5的前48個胺基酸,隨後為在胺基酸70處的提前終止密碼子。該母豬的其他等位基因係不可擴增的。選擇的後代被預測為空動物(CD163-/-),即CD163敲除。
因此,在一些實施方式中,豬肺泡巨噬細胞可以由CRISPR蛋白來靶向。在一些實施方式中,豬CD163可以由CRISPR蛋白來靶向。在一些實施方式中,豬CD163可以如以下來敲除:藉由誘導DSB,或藉由例如靶向外顯子7的缺失或修飾(包括以上所述的那些中的一個或多個)、或在基因的其他區域中例如外顯子5的缺失或修飾的插入或缺失。
還設想了編輯的豬和其子代,例如CD163敲除豬。這可以用於家畜、培育或建模目的(即豬模型)。還提供了包括該基因敲除的精液。
CD163係富含半胱胺酸的清道夫受體(SRCR)超家族的成員。基於體外研究,該蛋白的SRCR結構域5係負責解包裝和釋放病毒 基因組的結構域。這樣,還可以靶向SRCR超家族的其他成員以便評估對其他病毒的抗性。PRRSV也是哺乳動物動脈炎病毒屬組的一個成員,該組還包括鼠乳酸脫氫酶升高症病毒、猴出血熱病毒和馬動脈炎病毒。動脈炎病毒具有重要發病特性,包括巨噬細胞向性以及能夠導致嚴重疾病和持續性感染兩者。因此,例如藉由豬CD163或其在其他物種中的同系物,可以靶向動脈炎病毒並且特別是鼠乳酸脫氫酶升高症病毒、猴出血熱病毒和馬動脈炎病毒,並且還提供了鼠類、猿以及馬模型以及敲除。
事實上,該途徑可被延伸至引起其他家畜疾病(其可以傳播至人類)以及上述肺炎、腦膜炎和水腫的病毒或細菌,例如豬流感病毒(SIV)株,包括丙型流感和甲型流感亞型(稱為H1N1、H1N2、H2N1、H3N1、H3N2、和H2N3)。
異種移植,異種移植物
本發明還考慮了使用本文描述的CRISPR-Cas系統例如Cas9效應蛋白系統來提供適於用於提供修飾的組織(用於移植)的RNA指導的DNA核酸酶。例如,RNA-指導的DNA核酸酶可以用於敲除、敲減或破壞在動物例如轉基因豬(例如人類血紅素加氧酶-1轉基因豬品系)中的所選基因,例如藉由破壞對由人類免疫系統識別的表位進行編碼的基因即異種抗原基因的表現。用於破壞的候選豬基因可以例如包括α(1,3)-半乳糖基轉移酶和胞苷一磷酸-N-乙醯基神經胺酸羥化酶基因(參見PCT專利公開案WO 2014/066505)。此外,可以破壞編碼內源逆轉錄病毒的基因,例如編碼全部豬內源逆轉錄病毒的基因(參見楊(Yang)等人,2015,豬內源逆轉錄病毒(PERV)的基因組範圍的失活(Genome-wide inactivation of porcine endogenous retroviruses(PERVs)),《科學》(Science)2015年11月27日:第350卷第6264期,第1101-1104頁)。此外,RNA-指導的DNA核酸酶可以用於靶向用於在異種移植供體動物中整合另外基因例如人類CD55基因的位點,以改進針對超急性排斥的保護。
基因驅動和應用至蚊和瘧疾
本發明還考慮使用本文描述的CRISPR-Cas系統,例如Cas9效應蛋白系統,來提供RNA-指導的基因驅動,例如在與PCT專利公開案WO 2015/105928中所述的基因驅動類似的系統中。這種系統可以例如提供用於藉由將一種編碼RNA指導的DNA核酸酶的核酸序列和一種或多種指導RNA引入種系細胞來改變真核生物種系細胞之方法。指導RNA可以被設計成互補於種系細胞的基因組DNA上的一個或多個靶位置。編碼RNA指導的DNA核酸酶的核酸序列和編碼指導RNA的核酸序列可以提供在構建體上的側翼序列之間(其中啟動子被安排為使得種系細胞可以表現RNA指導的DNA核酸酶、以及指導RNA),連同任何所希望的負荷物編碼序列(也位於側翼序列之間)一起。該等側翼序列將典型地包括以下序列,該序列係與所選靶標染色體上的相應序列係一致的,使得側翼序列與由構建體編碼的組分一起運行以輔助外源核酸構建體序列在靶切割位點處藉由例如同源重組的機制插入基因組DNA中,以使得種系細胞針對該外源核酸序列係純合的。以此方式,基因驅動系統能夠貫穿繁殖種群而種質滲入所希望的負荷物基因(甘茨(Gantz)等人,2015,高度有效的Cas9介導的基因驅動以用於瘧疾載體蚊斯氏按蚊的群體修飾(Highly efficient Cas9-mediated gene drive for population modification of the malaria vector mosquito Anopheles stephensi),PNAS 2015,先於印刷公開,2015年11月23日,doi:10.1073/pnas.1521077112;埃斯維特(Esvelt)等人,2014,關於RNA指導的基因驅動以改變野生群體(Concerning RNA-guided gene drives for the alteration of wild populations),eLife 2014;3:e03401)。在選擇的實施方式中,可以選擇在基因組中具有很少潛在脫靶位點的靶序列。使用多個指導RNA靶向在靶座位內的多個位點,可以增加切割頻率並阻礙驅動抗性等位基因的演變。截短的指導RNA可以減少脫靶切割。可以使用配對切口酶代替單一核酸酶,以進一步提高特異性。基因驅動構建體可以包括編碼轉錄調節因子的負荷物序列,轉錄調節因子例如用以活化同源重組基因和/或抑制非同源末端連接。靶位點可以被選擇在必需基因內,使得非同源末端連接事件可導致致死率而不會產生驅動抗性等位基因。基因驅動構建體可以被工程化為在一系列宿主中在一系列溫度下發揮作用(卓(Cho)等人2013,使用小分子對秀麗隱桿線蟲中的蛋白穩定性的快速和可調控制(Rapid and Tunable Control of Protein Stability in Caenorhabditis elegans Using a Small Molecule),PLoS ONE 8(8):e72393.doi:10.1371/journal.pone.0072393)。
FISH和使用失活的CRISPR Cas9酶的示例性方法
在一個方面中,本發明提供了工程化的、非天然存在的CRISPR-Cas系統,該系統包括催化失活的本文所述的Cas蛋白,較佳的是失活的Cas9(dCas9),以及在螢光原位雜交(FISH)中該系統之用途。缺乏產生DNA雙股斷裂的能力的dCas9可以與螢光蛋白例如增強的綠色螢光蛋白(eEGFP)融合,並且在體內與小指導RNA共表現以靶向臂間、 中心和端粒重複。該dCas9系統可以用於視覺化人類基因組中的重複序列和單獨基因兩者。標記的dCas9 CRISPR-cas系統的此類新應用在細胞成像以及研究功能性核構造(尤其是在具有小核容量或複雜3-D結構的情況下)中可以是重要的。(陳(Chen)B、吉伯特(Gilbert)LA、奇米尼(Cimini)BA、施米鮑爾(Schnitzbauer)J、張(Zhang)W、李(Li)GW、派克(Park)J、布萊克本(Blackburn)EH、維斯曼(Weissman)JS、齊(Qi)LS、黃(Huang)B.2013.在人類活細胞中藉由優化的CRISPR/Cas系統對基因組座位的動態成像(Dynamic imaging of genomic loci in living human cells by an optimized CRISPR/Cas system).《細胞》(Cell)155(7):1479-91.doi:10.1016/j.cell.2013.12.001.)
用RNA指導的效應蛋白複合物進行治療靶向
如將是顯而易見的,設想的是可以使用本發明系統靶向任何感興趣的多核苷酸序列。本發明提供了非天然存在的或工程化的組成物、或編碼所述組成物的組分的一種或多種多核苷酸、或包含對所述組成物的組分進行編碼的一種或多種多核苷酸的載體或遞送系統,其用於體內、離體或體外修飾靶細胞,並且是以改變細胞使得一旦被修飾則CRISPR修飾的細胞的子代或細胞系保留改變的表型的方式進行。該等修飾的細胞和子代可以是多細胞生物例如植物或動物的部分,其中在離體或體內向希望的細胞型應用CRISPR系統。CRISPR發明可以是治療的療法。該治療的療法可以包括基因或基因組編輯、或基因療法。
處理病原體,像細菌、真菌和寄生性病原體
本發明還可用於處理細菌、真菌和寄生性病原體。大多數 研究工作已經集中在發展新抗生素上,然而一旦被開發,將經歷相同的抗藥性問題。本發明提供了解決那些難題的新穎的基於CRISPR的替代方案。此外,不像現有抗生素,基於CRISPR的處理可以被製成病原體特異性的,誘導靶病原體的細菌細胞死亡的同時回避有益細菌。
江(Jiang)等人(“使用CRISPR-Cas系統進行細菌基因組的RNA指導的編輯(RNA-guided editing of bacterial genomes using CRISPR-Cas systems)”,《自然生物技術》(Nature Biotechnology),第31卷,233-9頁,2013年3月)使用CRISPR-Cas9系統來突變或殺滅肺炎鏈球菌和大腸桿菌。將精確突變引入基因組中的工作依賴於在靶基因組位點處的雙-RNA:Cas9-引導的切割,以殺死未突變的細胞,並且回避對選擇性標記或反選擇系統的需要。CRISPR系統已被用於逆轉抗生素抗性並且消除菌株之間的抗性轉移。皮卡德(Bickard)等人顯示重程式設計為靶向毒力基因的Cas9殺死強毒的而並非無毒的金黃色葡萄球菌。重程式設計核酸酶以靶向抗生素抗性基因破壞了包含抗生素抗性基因的葡萄球菌質粒,並且針對質粒負載的抗性基因的擴張進行了免疫。(參見,皮卡德(Bikard)等人,“開發CRISPR-Cas核酸酶以產生序列特異性抗微生物劑(Exploiting CRISPR-Cas nucleases to produce sequence-specific antimicrobials)”,《自然生物技術》(Nature Biotechnology),第32卷,1146-1150,doi:10.1038/nbt.3043,線上公開於2014年10月05日)皮卡德(Bikard)顯示在小鼠皮膚定殖模型中,CRISPR-Cas9抗微生物劑在體內發揮功能以殺死金黃色葡萄球菌。類似地,約瑟夫(Yosef)等人使用CRISPR系統來靶向編碼酶的基因,該酶賦予對β-內醯胺抗生素的抗性(參 見約瑟夫等人,“溫和且溶胞的噬菌體被程式設計為敏化並殺滅抗生素抗性細菌(Temperate and lytic bacteriophages programmed to sensitize and kill antibiotic-resistant bacteria)”,《美國國家科學院院刊》(Proc.Natl.Acad.Sci.USA),第112卷,第7267-7272頁,doi:10.1073/pnas.1500107112線上公開於2015年5月18日)。
CRISPR系統可以用於編輯對其他遺傳學途徑有抗性的寄生蟲的基因組。例如,CRISPR-Cas9系統顯示將雙股斷裂引入約氏瘧原蟲基因組中(參見張(Zhang)等人,“使用CRISPR/Cas9系統對瘧原蟲基因組的有效編輯(Efficient Editing of Malaria Parasite Genome Using the CRISPR/Cas9 System)”,mBio.第5卷,e01414-14,2014年七月-八月)。古爾巴勒(Ghorbal)等人,(“在人類瘧原蟲鐮狀瘧原蟲中CRISPR-Cas9系統的基因組編輯(Genome editing in the human malaria parasite Plasmodium falciparumusing the CRISPR-Cas9 system)”,《自然生物技術》(Nature Biotechnology),第32卷,第819-821頁,doi:10.1038/nbt.2925,線上公開於2014年6月1日)修飾了兩種基因orc1kelch13的序列,這兩種基因分別具有在基因沈默中和引發對青蒿素的抗性中的推定作用。儘管不存在對修飾的直接選擇,在適當位點改變的寄生蟲被以非常高的效率恢復,指示中性的或甚至有害的突變可以使用該系統產生。CRISPR-Cas9還用於修飾其他病原性寄生蟲包括剛地弓形蟲的基因組(參見沈(Shen)等人,“在剛地弓形蟲的不同菌株中使用CRISPR/CAS9進行高效基因破壞(Efficient gene disruption in diverse strains of Toxoplasma gondii using CRISPR/CAS9)”,mBio vol.5:e01114-14,2014;以及薩迪 克(Sidik)等人,“使用CRISPR/Cas9進行剛地弓形蟲的高效基因組工程化(Efficient Genome Engineering of Toxoplasma gondii Using CRISPR/Cas9)”,PLoS One第9卷,e100450,doi:10.1371/journal.pone.0100450,線上公開於2014年6月27日)。
維亞斯(Vyas)等人(“白色念珠菌CRISPR系統允許必需基因和基因家族的基因工程(A Candida albicans CRISPR system permits genetic engineering of essential genes and gene families)”,《科學進展》(Science Advances),第1卷,e1500248,DOI:10.1126/sciadv.1500248,2015年4月3日)採用CRISPR系統來克服在白色念珠菌中的基因工程中長期存在的障礙,並且在單一實驗中有效地突變一些不同基因的兩種拷貝。在其中一些機制貢獻於抗藥性的生物中,維亞斯(Vyas)產生了不再展示針對氟康唑或環己醯亞胺的超抗性的純合雙突突體,所述超抗性由親本臨床分離株Can90展示。維亞斯還藉由創立條件型等位基因獲得在白色念珠菌的必需基因中的純合功能缺失突變。DCR1(為核糖體RNA加工所需)的無效等位基因在低溫下是致命的,但在高溫下是存活的。維亞斯使用引入無義突變的修復模板以及不能在16℃生長的分離的dcr1/dcr1突變體。
本發明的CRISPR系統藉由破壞染色體座位用於在鐮狀瘧原蟲中使用。古爾巴勒(Ghorbal)等人(“使用CRISPR-Cas9系統在人類瘧原蟲鐮狀瘧原蟲中的基因組編輯(Genome editing in the human malaria parasite Plasmodium falciparum using the CRISPR-Cas9 system)”,《自然生物技術》(Nature Biotechnology),32,819-821(2014), DOI:10.1038/nbt.2925,2014年6月1日)採用CRISPR系統以在瘧疾基因組中引入特異性基因敲除和單一核苷酸取代。為了將CRISPR-Cas9適用於鐮狀瘧原蟲,古爾巴勒等人產生了在pUF1-Cas9附加體中的擬原生質調節元件的控制之下的表現載體,所述表現載體攜帶給予了對DSM1(鐮狀瘧原蟲二氫乳清酸脫氫酶(PfDHODH)抑制劑)的抗性的藥物選擇性標記ydhodh,並且對於sgRNA的轉錄,使用鐮狀瘧原蟲U6小核(sn)RNA調節元件,將用於同源重組修復的指導RNA和供體DNA模板放置於相同質粒pL7上。還參見,張(Zhang)C.等人(“使用CRISPR/Cas9系統對瘧原蟲基因組的高效編輯(Efficient editing of malaria parasite genome using the CRISPR/Cas9 system)”,MBio,2014年7月1日;5(4):E01414-14,doi:10.1128/MbIO.01414-14)以及瓦格納(Wagner)等人(“在鐮狀瘧原蟲中高效的CRISPR-Cas9介導的基因組編輯(Efficient CRISPR-Cas9-mediated genome editing in Plasmodium falciparum)”,《自然方法》(Nature Methods)11,915-918(2014),DOI:10.1038/nmeth.3063)。
處理病原體,像病毒病原體如HIV
Cas介導的基因組編輯可能用於在體細胞組織中引入保護性突變以對抗非基因疾病或複雜疾病。例如,NHEJ介導的在淋巴細胞中的CCR5受體失活(隆巴爾多(Lombardo)等人,《自然生物技術》(Nat Biotechnol.)2007年11月;25(11):1298-306)可以是用於回避HIV感染的可行策略,然而PCSK9(科恩(Cohen)等人,《自然遺傳學》(Nat Genet.)2005年2月;37(2):161-5)或血管生成素(穆蘇努瑞(Musunuru)等人,《新英格蘭醫學雜誌》(N Engl J Med.)2010年12月2日;363(23):2220-7) 的缺失可以提供針對菌株抗性血膽脂醇過多或血脂過多的治療效果。儘管該等靶標還可以使用siRNA介導的蛋白敲減來處置,NHEJ介導的基因失活的唯一優勢係能夠實現永久治療益處而無需持續治療。如與所有基因療法伴隨的,重要的當然係確立每個提出的治療用途具有有利的收益-風險比。
編碼Cas9和指導RNA的質粒DNA連同修復模板到酪胺酸血症成年小鼠模型的肝臟中的水動力遞送,顯示能夠在約250分之1的細胞中校正突變體Fah基因並挽救該野生型Fah蛋白的表現(《自然生物技術》(Nat Biotechnol.)2014年6月;32(6):551-3)。此外,臨床試驗成功地使用ZF核酸酶來藉由離體敲除CCR5受體對抗HIV感染。在所有患者中,HIV DNA水平降低,並且在四分之一的患者中,HIV RNA變得不可檢測(達巴斯(Tebas)等人,《新英格蘭醫學雜誌》(N Engl J Med.)2014年3月6日;370(10):901-10)。該等結果均證明了可程式設計的核酸酶作為新治療平臺的希望。
在另一個實施方式中,自滅活慢病毒載體可以用於和/或適合於本發明的CRISPR-Cas9系統,該自滅活慢病毒載體具有靶向由HIV tat/rev共用的共有外顯子的siRNA、核仁定位TAR誘餌、和抗CCR5特異性錘頭狀核酶(參見,例如,迪吉斯托(DiGiusto)等人(2010)《科學轉化醫學》(Sci Transl Med)2:36ra43)。可以收集最少2.5×106個CD34+細胞/每千克患者體重,並且以2×106個細胞/ml的密度在X-VIVO 15培養基中(龍沙公司(Lonza))預刺激16到20個小時,該培養基含有2μmol/L-穀胺醯胺、幹細胞因子(100ng/ml)、Flt-3配位基(Flt-3L)(100ng/ml)、 和促血小板生成素(10ng/ml)(CellGenix公司)。可以用慢病毒以感染複數5在75-cm2的包被有纖網蛋白(25mg/cm2)(重組人纖維蛋白片段(RetroNectin),寶生物工程株式會社(Takara Bio Inc.))的組織培養瓶中轉導預刺激的細胞16到24小時。
根據本領域的知識和本揭露的教導,就免疫缺陷病症(如HIV/AIDS)而言,熟習該項技術者可以校正HSC,包括使HSC與靶向並敲除CCR5的CRISPR-Cas9系統接觸。可以將靶向並敲除CCR5-和-Cas9蛋白的指導RNA(並且有利地是雙指導物法,例如一對不同的指導RNA;例如,靶向原代人類CD4+ T細胞和CD34+造血幹細胞和祖細胞(HSPC)中的兩個臨床相關基因B2M和CCR5的指導RNA)與HSC接觸。可以將這樣接觸的細胞給予;並且視情況處理/擴增。參見卡地亞(Cartier)。還參見基姆(Kiem),“用於HIV疾病的基於造血幹細胞的基因療法(Hematopoietic stem cell-based gene therapy for HIV disease)”,《細胞‧幹細胞》(Cell Stem Cell).2012年2月3日;10(2):137-147;藉由引用連同其引用的文獻併入本文;曼達爾(Mandal)等人,“使用CRISPR/Cas9有效消除人造血幹細胞和效應細胞中的基因(Efficient Ablation of Genes in Human Hematopoietic Stem and Effector Cells using CRISPR/Cas9)”,《細胞‧幹細胞》(Cell Stem Cell),第15卷,第5期,第643-652頁,2014年11月6日;藉由引用連同其引用的文獻併入本文。作為另一種使用CRISPR-Cas9系統對抗HIV/AIDS的手段,還提及的是愛賓娜(Ebina),“藉由編輯HIV-1整合前病毒DNA抑制HIV-1表現的CRISPR/Cas9系統(CRISPR/Cas9 system to suppress HIV-1 expression by editing HIV-1 integrated proviral DNA)”《科技報告》(SCIENTIFIC REPORTS)|3:2510|DOI:10.1038/srep02510,藉由引用併入本文連同它引用的文獻。
用於HIV治療的基因組編輯的基本原理源於以下觀察結果,即對CCR5(病毒的細胞輔助受體)的功能缺失突變純合的個體對感染具有高度抗性並且以另外方式係健康的,從而表明藉由基因組編輯模擬這種突變可以是安全且有效的治療策略[劉(Liu),R.等人《細胞》(Cell)86,367-377(1996)]。這一想法在臨床上得到了驗證,當向感染HIV的患者給予來自對功能缺失CCR5突變純合的供體的異體骨髓移植時,產生不可檢測水平的HIV以及正常CD4 T細胞計數的恢復[赫特爾(Hutter),G.等人《新英格蘭醫學雜誌》(The New England journal of medicine)360,692-698(2009)]。儘管由於成本和潛在的移植物抗宿主疾病,骨髓移植對於大多數HIV患者而言是不現實的治療策略,但是轉化患者自己的T細胞為CCR5的HIV療法係令人希望的。
使用ZFN和NHEJ敲除人源化HIV小鼠模型中的CCR5的早期研究顯示移植CCR5編輯的CD4 T細胞提高病毒載量和CD4 T細胞計數[佩雷斯(Perez),E.E.等人《自然生物技術》(Nature biotechnology)26,808-816(2008)]。重要的是,該等模型還顯示HIV感染導致對CCR5裸細胞的選擇,表明編輯賦予健康度優勢並且潛在地允許小數目的經編輯的細胞產生治療作用。
作為這項和其他有希望的臨床前研究的結果,敲除患者T細胞中的CCR5的基因組編輯治療現在已經在人類中進行測試[奧爾特(Holt),N.等人《自然生物技術》(Nature biotechnology)28,839-847 (2010);李(Li),L.等人《分子療法:美國基因治療學會雜誌》(Molecular therapy:the journal of the American Society of Gene Therapy)21,1259-1269(2013)]。在最近的I期臨床試驗中,從患有HIV的患者體內取出CD4+ T細胞,用被設計成敲除CCR5基因的ZFN進行編輯並且以自體方式移植回患者體內[泰巴斯(Tebas),P.等人《新英格蘭醫學雜誌》(The New England journal of medicine)370,901-910(2014)]。
在另一個研究中(曼達爾(Mandal)等人,《細胞‧幹細胞》(Cell Stem Cell,第15卷,第5期,第643-652頁,2014年11月6日)),CRISPR-Cas9已經靶向人類CD4+ T細胞和CD34+造血幹細胞和祖細胞(HSPC)中的兩個臨床相關基因B2M和CCR5。使用單一RNA指導物導致HSPC中而非T細胞中的高效誘變。雙重指導物方法改進在兩種細胞類型中的基因缺失效率。已經經歷用CRISPR-Cas9進行基因組編輯的HSPC保留多向潛能。將預測的中靶和脫靶突變經由HSPC中的靶捕獲定序來檢驗,並且僅在一個位點處觀察到低水平的脫靶誘變。該等結果證明CRISPR-Cas9可以有效地以最小脫靶誘變來消融HSPC中的基因,具有用於基於造血細胞的療法的廣泛可應用性。
王(Wang)等人(PLoS One.2014年12月26日;9(12):e115987.doi:10.1371/journal.pone.0115987)經由CRISPR相關蛋白9(Cas9)和單一指導RNA(指導RNA)使CCR5沈默,其中用慢病毒載體表現Cas9和CCR5指導RNA。王(Wang)等人顯示將表現Cas9和CCR5指導RNA的慢病毒載體單輪轉導到HIV-1易感人類CD4+細胞中產生高頻率的CCR5基因破壞。CCR5基因破壞的細胞不僅對R5-熱帶HIV-1(包括傳 遞/創立者(T/F)HIV-1分離株)具有抗性,而且在R5-熱帶HIV-1感染期間具有超過CCR5基因未破壞的細胞的選擇優勢。在穩定轉導的細胞中,甚至在轉導後84天,藉由T7內切核酸酶I測定未檢測到在與該等CCR5指導RNA高度同源的潛在脫靶位點處的基因組突變。
法恩(Fine)等人(《科學報告》(Sci Rep.)2015年7月1日;5:10777.doi:10.1038/srep10777)鑒定了表現釀膿鏈球菌Cas9(SpCas9)蛋白的片段的兩盒系統,所述片段以小室剪接在一起以形成能夠進行位點特異性DNA切割的功能蛋白。採用特異性CRISPR引導股,法恩(Fine)等人證明瞭該系統作為單一Cas9和作為一對Cas9切口酶在切割人類HEK-293T細胞中的HBB和CCR5基因中的功效。在進行標準轉染時與野生型SpCas9(wtSpCas9)相比,反式剪接的SpCas9(tsSpCas9)展示出約35%的核酸酶活性,但在更低的給予水平上具有實質上降低的活性。tsSpCas9相對於wtSpCas9的大大降低的開放閱讀框長度潛在地允許更複雜且更長的遺傳元件被包裝到包含組織特異性啟動子的AAV載體中,多元指導RNA表現,以及效應子結構域與SpCas9的融合。
李(Li)等人(《遺傳病毒學雜誌》(J Gen Virol.)2015Aug;96(8):2381-93.doi:10.1099/vir.0.000139.電子版2015年4月8日)證明CRISPR-Cas9可以有效地介導在細胞系中CCR5座位的編輯,導致在細胞表面上CCR5表現的敲除。新一代定序揭示了各種突變被引入CCR5的預測切割位點周圍。對於所分析的三個最有效的指導RNA的每一個,在15個評分靠前的潛在位點處沒有檢測到顯著的脫靶效應。藉由構建攜帶CRISPR-Cas9組分的嵌合Ad5F35腺病毒,李(Li)等人有效地轉導初級 CD4+ T-淋巴細胞,並且破壞CCR5表現,並且將陽性轉導的細胞賦予HIV-1抗性。
參考WO 2015/148670,並且藉由本文的傳授,本發明包含結合本文的傳授而應用的該文獻的方法和材料。在基因療法的一方面,包含了涉及的或與人類免疫缺陷病毒(HIV)和獲得性免疫缺陷綜合症(AIDS)相關的用於編輯靶序列的方法和組成物。在一相關方面,本文描述的本發明包含藉由在C-C趨化因子受體5型(CCR5)的基因中引入一個或多個突變來預防和治療HIV感染和AIDS。該CCR5基因還稱為CKR5、CCR-5、CD195、CKR-5、CCCKR5、CMKBR5、IDDM22、和CC-CKR-5。在一個另外的方面,本文描述的本發明包含提供用於例如在已經感染的受試者中預防或降低HIV感染和/或預防或降低HIV進入宿主細胞的能力。HIV的示例性宿主細胞包括但不限於CD4細胞、T細胞、腸相關淋巴組織(GALT)、巨噬細胞、樹突細胞、髓樣先質細胞、以及小膠質細胞。病毒進入宿主細胞需要病毒糖蛋白gp41和gp120與CD4受體和共受體(例如CCR5)的相互作用。如果共受體,例如CCR5,不存在於宿主細胞的表面上,則病毒不能結合並進入宿主細胞。疾病的進展因此被阻止。藉由敲除或敲減在宿主細胞中的CCR5,例如,藉由引入保護性突變(如CCR5 δ 32突變),HIV病毒進入該宿主細胞被防止。
熟習該項技術者可以利用例如以下文獻的上述研究:奧爾特(Holt),N.等人《自然生物技術》(Nature biotechnology)28,839-847(2010);李(Li),L.等人《分子療法:美國基因治療學會雜誌》(Molecular therapy:the journal of the American Society of Gene Therapy)21,1259-1269 (2013)];曼達爾(Mandal)等人,《細胞‧幹細胞》(Cell Stem Cell),第15卷,第5期,第643-652頁,2014年11月6日;王(Wang)等人(PLoS One.2014年12月26日;9(12):e115987.doi:10.1371/journal.pone.0115987);法恩(Fine)等人(《科學報告》(Sci Rep.)2015年7月1日;5:10777.doi:10.1038/srep10777)以及李(Li)等人(《基因病毒雜誌》(J Gen Virol.)2015年8月;96(8):2381-93.doi:10.1099/vir.0.000139.電子版2015年4月8日),用於用本發明的CRISPR Cas9系統靶向CCR5。
處理病原體,像病毒病原體如HBV
慢性乙型肝炎病毒(HBV)感染,因在感染細胞中病毒附加體DNA(cccDNA)的持久性,係普遍、致命的,並且很少能治癒。羅馬南(Ramanan)等人(羅馬南V、斯洛馬(Shlomai)A、考克斯(Cox)DB、史華茲(Schwartz)RE、米凱利迪斯(Michailidis)E、巴塔(Bhatta)A、斯科特(Scott)DA、張(Zhang)F、賴斯(Rice)CM、巴蒂亞(Bhatia)SN,《科學報告》(Sci Rep.)2015年6月2日;5:10833.doi:10.1038/srep10833,線上公開於2015年6月2日)顯示CRISPR/Cas9系統可以特異性地靶向並切割HBV基因組中的保守區,導致病毒基因表現和複製的穩固抑制。在Cas9以及適當選擇的指導RNA的持續表現時,他們證明了cccDNA由Cas9切割,並且cccDNA與病毒基因表現和複製的其他參數兩者大幅降低。因此,他們先係直接靶向病毒附加體DNA係用以控制病毒並且可能治癒患者的新穎治療途徑。這還描述於以博多研究所等為名的WO 2015089465 A1中,將該文獻內容藉由引用特此結合。
本發明還可應用於治療B型肝炎病毒(HBV)。然而,藉 由例如優化劑量和序列,該CRISPR Cas系統必須適應於避免RNAi的缺點,如過度活化(overstaring)內源小RNA途徑的風險(參見,例如,格林姆(Grimm)等人,《自然》第441卷,2006年5月26日)。例如,考慮例如約每人1-10 x 1014個粒子的低劑量。在另一個實施方式中,針對HBV的該CRISPR Cas系統可以在脂質體中給藥,如一種穩定的核酸-脂質粒子(SNALP)(參見,例如,莫里西(Morrissey)等人,《自然生物技術》(Nature Biotechnology),第23卷,第8期,2005年8月)。考慮了約1、3或5mg/kg/天的靶向SNALP中的HBV RNA的CRISPR Cas的每日靜脈注射。每天治療可以經過約三天,然後每週治療持續約五周。在另一個實施方式中,陳(Chen)等人的系統(《基因治療》(2007)14,11-19)可以使用和/或適用於本發明的CRISPR Cas系統。陳(Chen)等人使用雙股腺相關病毒8-假型載體(dsAAV2/8)來遞送shRNA。在HBV轉基因小鼠的肝臟中,攜帶HBV特異性shRNA的dsAAV2/8載體(1 x 1012個載體基因組/小鼠)的單次給藥有效抑制了HBV蛋白、mRNA和複製型DNA的穩定水平,從而導致在循環中的HBV負荷的高達2-3個log10減少。在載體給藥之後,顯著的HBV抑制持續了至少120天。shRNA的治療作用係靶序列依賴性的並且不涉及干擾素的活化。對於本發明,可以將針對HBV的CRISPR Cas系統選殖到AAV載體如dsAAV2/8載體中,並且給予至人,例如,以1 x 1015個載體基因組到約1 x 1016個載體基因組/人的劑量。在另一個實施方式中,伍德爾(Wooddell)等人的方法(《分子治療》第21卷,第5期,973-985,2013年5月)可以用於和/或適用於本發明的CRISPR Cas系統。伍德爾(Wooddell)等人表明,肝細胞靶向的、N-乙醯半乳糖胺軛合的蜂毒肽樣肽(NAG-MLP)與靶向凝血因子VII(F7)的嗜肝膽固 醇軛合的siRNA(chol-siRNA)的簡單共注射導致在小鼠和非人類靈長動物中的有效F7敲低,而在細胞因子的臨床化學或誘導上沒有變化。使用HBV感染的暫態轉基因小鼠模型,伍德爾(Wooddell)等人表明,NAG-MLP與有效的靶向保守HBV序列的chol-siRNA的簡單共注射導致病毒RNA、蛋白質、和病毒DNA的多對數(multilog)抑制。對於本發明可以設想例如,約6mg/kg的NAG-MLP和6mg/k的HBV特異性CRISPR Cas的靜脈內共注射。在替代方案中,約3mg/kg的NAG-MLP和3mg/kg的HBV特異性CRISPR Cas可以在第一天遞送,隨後在兩周之後給予約2-3mg/kg的NAG-MLP和2-3mg/kg的HBV特異性CRISPR Cas。
林(Lin)等人(《分子治療-核酸》(Mol Ther Nucleic Acids.)2014年8月19日;3:e186.doi:10.1038/mtna.2014.38)設計了針對基因型A的HBV的八種gRNA。採用HBV-特異性gRNA時,CRISPR-Cas9系統顯著地降低了用HBV-表現載體轉染的Huh-7細胞中HBV核心和表明蛋白的產生。在八種篩選的gRNA中,鑒定兩個有效的。靶向保守HBV序列的一種gRNA針對不同的基因型發揮作用。使用流體動力學-HBV持久性小鼠模型,林(Lin)等人進一步證明該系統可以切割包含肝內HBV基因組的質粒並且促進其體內清除,導致血清表面抗原水平降低。該等數據表明該CRISPR-Cas9系統可以在體外和體內均破壞HBV-表現模板,指示它在根除持久HBV感染中的潛力。
董(Dong)等人(《抗病毒研究》(Antiviral Res.)2015年6月;118:110-7.doi:10.1016/j.antiviral.2015.03.015.電子版,2015年4月3日)使用該CRISPR-Cas9系統靶向HBV基因組,並且有效地抑制HBV 感染。董(Dong)等人合成四種靶向HBV的保守區域的單一指導RNA(指導RNA)。該等指導RNA與Cas9的表現降低了Huh7細胞以及HBV-複製細胞HepG2.2.15中的病毒產生。董(Dong)等人進一步證明CRISPR-Cas9引導在被轉染細胞的HBV cccDNA中發生的切割和切割介導的誘變。在攜帶HBV cccDNA的小鼠模型中,經由快速尾靜脈注射指導RNA-Cas9質粒導致低水平的cccDNA和HBV蛋白。
劉(Liu)等人(《遺傳病毒學雜誌》(J Gen Virol.)2015年8月;96(8):2252-61.doi:10.1099/vir.0.000159.電子版2015年4月22日)設計了靶向不同HBV基因型的保守區域的可以顯著抑制體外和體內HBV複製的八種指導RNA(gRNA),以研究使用CRISPR-Cas9系統破壞HBVDNA模板的可能性。HBV特異性gRNA/Cas9系統可以抑制細胞中不同基因型的HBV的複製,並且病毒DNA藉由單一gRNA/Cas9系統顯著降低,並且藉由不同的gRNA/Cas9系統的組合被清除。
王(Wang)等人(《世界胃腸病學雜誌》(World J Gastroenterol.)2015年8月28日;21(32):9554-65.doi:10.3748/wjg.v21.i32.9554)設計了15種針對基因型A-D的HBV的gRNA。選擇覆蓋HBV調節區域的兩種上述gRNA(雙gRNA)的十一個組合。每個gRNA和11個雙gRNA對抑制HBV(基因型A-D)複製的效率係藉由測量在培養上清液中的HBV表面抗原(HBsAg)或e抗原(HBeAg)來檢查的。在用雙gRNA和HBV表現載體共轉染的HuH7細胞中,使用聚合酶鏈式反應(PCR)和定序方法檢查HBV-表現載體的破壞,並且在HepAD38細胞中使用KCl沈澱、質粒安全ATP依賴性DNA酶(PSAD)消化、滾環 擴增和定量PCR組合方法來檢查cccDNA的破壞。藉由線粒體四唑測定來評估該等gRNA的細胞毒性。所有的gRNA可以顯著降低培養上清液中的HBsAg或HBeAg產生,其取決於gRNA針對的區域。所有的雙gRNA可以有效地抑制基因型A-D的HBV的HBsAg和/或HBeAg產生,並且當與單獨使用的單一gRNA相比時,雙gRNA的抑制HBsAg和/或HBeAg產生的功效顯著增加。此外,藉由PCR直接定序,申請人證實該等雙gRNA可以藉由去除在兩種使用的gRNA的切割位點之間的片段特異性地破壞HBV表現模板。最重要的是,gRNA-5和gRNA-12組合不僅可以有效地抑制HBsAg和/或HBeAg產生,而且還破壞HepAD38細胞中的cccDNA庫。
卡裡莫夫(Karimova)等人(《科學報告》(Sci Rep.)2015年9月3日;5:13734.doi:10.1038/srep13734)鑒定了在HBV基因組的S和X區中,被靶向用於由Cas9切口酶進行特異和有效切割的交叉基因型保守的HBV序列。這種方法不僅破壞報告細胞系中附加型cccDNA和染色體整合的HBV靶位點,而且破壞了在長期和從頭感染的肝癌細胞系中的HBV複製。
熟習該項技術者可以利用例如以下文獻的上述研究:林(Lin)等人(《分子治療-核酸》(Mol Ther Nucleic Acids.)2014年8月19日;3:e186.doi:10.1038/mtna.2014.38),董(Dong)等人(《抗病毒研究》(Antiviral Res.)2015年6月;118:110-7.doi:10.1016/j.antiviral.2015.03.015.電子版2015年4月3日),劉(Liu)等人(《遺傳病毒學雜誌》(J Gen Virol.)2015年8月;96(8):2252-61.doi:10.1099/vir.0.000159.電子版,2015年4月22日),王(Wang)等人(《世界腸胃學雜誌》(World J Gastroenterol.)2015 年8月28日;21(32):9554-65.doi:10.3748/wjg.v21.i32.9554)以及卡裡莫夫(Karimova)等人(《科學報告》(Sci Rep.)2015年9月3日;5:13734.doi:10.1038/srep13734),用於用本發明的CRISPR Cas系統靶向HBV。
患者特異性篩選方法
靶向核苷酸(例如三核苷酸重複)的CRISPR-Cas系統可以用於針對此類重複的存在對患者或患者樣品進行篩選。該等重複可以是該CRISPR-Cas系統的RNA的靶標,並且如果被該CRISPR-Cas系統結合至其上,則可以檢測到該結合,以由此指示存在這樣一個重複。因此,CRISPR-Cas系統可以用於針對該重複的存在對患者或患者樣品進行篩選。然後可以向該患者給予一種或多種適合的化合物以解決該病症;或者,可以向該患者給予CRISPR-Cas系統,該系統結合到並且引起插入、缺失或突變並且減輕該病症。
治療遺傳或表觀遺傳方面的疾病
本發明的CRISPR/Cas9系統可以用來校正基因突變,先前使用TALEN和ZFN嘗試了已經被鑒定為Cas9系統的潛在靶標的該等突變,但是成功有限,包括作為在愛迪塔斯醫藥公司的公開申請中描述的使用Cas9系統來靶向座位以用基因療法在治療上解決疾病之方法,包括格盧克曼(Gluckmann)等人的WO 2015/048577,CRISPR-相關方法以及組成物(CRISPR-RELATED METHODS AND COMPOSITIONS);格盧克曼(Gluckmann)等人的WO 2015/070083,CRISPR-相關方法以及具有統治性gRNA的組成物(CRISPR-RELATED METHODS AND COMPOSITIONS WITH GOVERNING gRNASCRISPR-RELATED METHODS AND COMPOSITIONS WITH GOVERNING gRNAS)。
應提及的是馬埃德爾(Maeder)等人的WO 2015/134812,CRISPR/CAS-相關方法以及用於治療烏謝爾症候群和色素性視網膜炎的組成物(CRISPR/CAS-RELATED METHODS AND COMPOSITIONS FOR TREATING USHER SYNDROME AND RETINITIS PIGMENTOSA)。藉由本文的傳授,本發明包含結合本文的傳授應用的該等文獻的方法和材料。在眼睛和聽力基因療法的方面,用於治療烏謝爾症候群和色素性視網膜炎的方法和組成物可以適於本發明的CRISPR-Cas系統(參見例如WO 2015/134812)。在一實施方式中,WO 2015/134812涉及藉由基因編輯,例如使用CRISPR-Cas9介導的方法以校正USH2A基因中的位置2299處的鳥嘌呤缺失(例如,替代USH2A基因中的位置2299處的缺失的鳥嘌呤殘基),來治療或延遲烏謝爾症候群IIA型(USH2A、USH11A)和色素性視網膜炎39(RP39)的發作或進展。在一相關的方面,藉由用一種或多種核酸酶、一種或多種切口酶或其組合進行切割來靶向突變,以例如用校正點突變(例如,單一核苷酸如鳥嘌呤缺失)的供體模板誘導HDR。突變體USH2A基因的改變或校正可以藉由任何機制來介導。可以與突變體HSH2A基因的改變(例如校正)相關的示例性機制包括但不限於非同源末端連接、微同源性介導的末端連接(MMEJ)、同源定向修復(例如內源供體模板介導的)、SDSA(合成依賴性股退火)、單股退火或單股侵入。在一個實施方式中,用於治療烏謝爾症候群和色素性視網膜炎的方法可以包括獲得由受試者攜帶的突變的資訊,例如藉由對USH2A基因的適當部分進行定序。
在一些實施方式中,提供了原發性開角型青光眼(POAG)的治療、預防或診斷。該靶標較佳的是係MYOC基因。這描述於WO 2015/153780中,將其揭露藉由引用特此結合。
還提及的是WO 2015/138510,並且藉由本文的傳授,本發明(使用CRISPR-Cas9系統)包含提供萊伯先天性黑朦10(LCA 10)的發作或進展的治療或延遲。LCA 10係由CEP290基因中的突變引起,例如在CEP290基因中a c.2991+1655,腺嘌呤到鳥嘌呤突變,該突變產生內含子26中的隱蔽剪接位點。這係在CEP290的內含子26的核苷酸1655處的突變,例如A到G突變。CEP290也稱為:CT87;MKS4;POC3;rd16;BBS14;JBTS5;LCAJO;NPHP6;SLSN6;以及3H11Ag(參見,例如,WO 2015/138510)。在基因療法的一方面,本發明涉及在CEP290基因的至少一個等位基因中,在LCA靶位置位點(例如c.2991+1655;A到G)附近處引入一個或多個斷裂。改變LCA10靶位置係指(1)在LCA10靶位置(例如c.2991+1655A到G)附近或包括該位置處,斷裂誘導的引入indel(在本文也稱為NHEJ介導的引入indel),或(2)斷裂誘導的基因組序列(該基因組序列包括在LCA10靶位置處的突變,例如c.2991+1655A到G)缺失(在本文也稱為NHEJ介導的缺失)。兩種途徑因在LCA 10靶位置處的突變而產生隱含剪接位點的丟失或破壞。
在一方面中,本發明(使用CRISPR-Cas9系統)包括提供萊伯先天性黑朦10(LCA 10)的發作或進展的治療或延遲。LCA 10係由CEP290基因中的突變引起,例如在CEP290基因中a c.2991+1655,腺嘌呤到鳥嘌呤突變,該突變產生內含子26中的隱蔽剪接位點。這係在CEP290 的內含子26的核苷酸1655處的突變,例如A到G突變。CEP290也稱為:CT87;MKS4;POC3;rd16;BBS14;JBTS5;LCAJO;NPHP6;SLSN6;以及3H11Ag(參見,例如,WO 2015/138510)。在基因療法的一方面,本發明涉及在CEP290基因的至少一個等位基因中,在LCA靶位置位點(例如c.2991+1655;A到G)附近處引入一個或多個斷裂。改變LCA10靶位置係指(1)在LCA10靶位置(例如c.2991+1655A到G)附近或包括該位置處,斷裂誘導的引入indel(在本文也稱為NHEJ介導的引入indel),或(2)斷裂誘導的基因組序列(該基因組序列包括在LCA10靶位置處的突變,例如c.2991+1655 A到G)缺失(在本文也稱為NHEJ介導的缺失)。兩種途徑因在LCA 10靶位置處的突變而產生隱含剪接位點的丟失或破壞。
研究者正在考慮基因療法是否可以用於治療寬範圍的疾病。本發明的基於Cas9效應蛋白的CRISPR系統被設想用於此類治療用途,包括但不限於另外的示例靶向區和具有如下的遞送方法。使用本發明系統進行治療可能是有用的病況或疾病的一些實例被包括在本文包含的基因和參考的實例中,並且當前與還提供的那些病況相關。該等示例的基因和病況並非詳盡的。
治療循環系統的疾病
本發明還考慮向血液或造血幹細胞遞送CRISPR-Cas9系統,特別是本文描述的新穎CRISPR效應蛋白系統。瓦爾葛籣(Wahlgren)等人的血漿外泌體(《核酸研究》(Nucleic Acids Research),2012年,第40卷,第17期,e130)被較早描述並且利用為向血液遞送該CRISPR Cas9系統。還考慮本發明的核酸靶向系統用來治療血紅蛋白病,如地中海貧 血和鐮狀細胞病。參見,例如,可以被本發明的CRISPR Cas9系統靶向的潛在靶標的國際專利公開號WO 2013/126794。
德拉科波羅(Drakopoulou),“綜述文章,用於β-地中海貧血的基於造血幹細胞的基因療法的持續挑戰(Review Article,The Ongoing Challenge of Hematopoietic Stem Cell-Based Gene Therapy for β-Thalassemia)”,《國際幹細胞》(Stem Cells International),第2011卷,文章ID 987980,10頁,doi:10.4061/2011/987980,藉由引用併入本文連同它引用的文獻,如同完整地陳述一樣,討論了使用遞送β-球蛋白或γ-球蛋白的基因的慢病毒修飾HSC。與使用慢病毒相對照,根據本領域的知識和本揭露的教導,就β-地中海貧血而言,熟習該項技術者可以使用靶向並校正突變的CRISPR-Cas9系統來校正HSC(例如,用遞送β-球蛋白或γ-球蛋白(有利地是非鐮狀化β-球蛋白或γ-球蛋白)的編碼序列的適合的HDR模板);確切地說,指導RNA可以靶向引起β-地中海貧血的突變,並且HDR可以為β-球蛋白或γ-球蛋白的正確表現提供編碼。將靶向包含突變-和-Cas9蛋白的粒子的指導RNA與攜帶突變的HSC進行接觸。該粒子還可以包含適合的HDR模板,以校正β-球蛋白或γ-球蛋白的適當表現的突變;或HSC可以與包含或遞送HDR模板的第二粒子或載體接觸。可以將這樣接觸的細胞給予;並且視情況處理/擴增;參見卡地亞(Cartier)。在此方面提及的是:卡瓦紮娜(Cavazzana),“經由離體地用慢病毒βA-T87Q-球蛋白載體轉導的自體造血幹細胞移植的用於重型β-地中海貧血的基因治療的成果(Outcomes of Gene Therapy for β-Thalassemia Major via Transplantation of Autologous Hematopoietic Stem Cells Transduced Ex Vivo with a Lentiviral βA-T87Q-Globin Vector)”tif2014.org/abstractFiles/Jean%20Antoine%20Ribeil_Abstract.pdf;卡瓦紮娜-卡爾沃(Cavazzana-Calvo),“人β-地中海貧血基因治療後的輸血獨立性和HMGA2活化(Transfusion independence and HMGA2 activation after gene therapy of human β-thalassaemia)”,《自然》(Nature)467,318-322(2010年9月16日)doi:10.1038/nature09328;寧休斯(Nienhuis),“地中海貧血基因治療的發展(Development of Gene Therapy for Thalassemia),《冷泉港醫學展望》(Cold Spring Harbor Perpsectives in Medicine),doi:10.1101/cshperspect.a011833(2012),LentiGlobin BB305,含有工程化的β-球蛋白基因(βA-T87Q)的慢病毒載體(LentiGlobin BB305,a lentiviral vector containing an engineered β-globin gene(βA-T87Q));以及謝(Xie)等人,“使用CRISPR/Cas9和背負式運輸對患者特異性iPSC中的β-地中海貧血突變進行無縫基因校正(Seamless gene correction of β-thalassaemia mutations in patient-specific iPSCs using CRISPR/Cas9 and piggyback)”《基因組研究》(Genome Research)gr.173427.114(2014)http://www.genome.org/cgi/doi/10.1101/gr.173427.114(冷泉港實驗室出版社(Cold Spring Harbor Laboratory Press));這係卡瓦紮娜的涉及人β-地中海貧血的工作的主題和謝的工作的主題,全部藉由引用併入本文,連同本文引用的或與其相關的所有文獻。在本發明中,該HDR模板可以提供HSC以便表現工程化的β-球蛋白基因(例如,βA-T87Q),或β-球蛋白,如在謝(Xie)中的。
徐(Xu)等人(《科學報告》(Sci Rep.)2015年7月9日; 5:12065.doi:10.1038/srep12065)已設計TALEN和CRISPR-Cas9以直接靶向球蛋白基因中的內含子2突變位點IVS2-654。徐(Xu)等人使用TALEN和CRISPR-Cas9觀察到在IVS2-654座位處不同頻率的雙股斷裂(DSB),並且與CRISPR-Cas9相比,當與背負式運輸轉座子供體相組合時TALEN介導更高的同源基因靶向效率。此外,與TALEN相比,對於CRISPR-Cas9,觀察到更明顯的脫靶事件。最後,選擇TALEN校正的iPSC選殖用於使用OP9共培養系統進行成紅血細胞分化,並且檢測到與未校正細胞相比相對較高的HBB的轉錄。
宋(Song)等人(《幹細胞發育》(Stem Cells Dev.)2015年5月1日;24(9):1053-65.doi:10.1089/scd.2014.0347.電子版,2015年2月5日)使用CRISPR/Cas9以校正β-Thal iPSC;在人類胚胎幹細胞(hESC)未顯示脫靶效應時,基因校正的細胞展現正常的核型和完整的多能性。然後,宋(Song)等人評估基因校正的β-Thal iPSC的分化效率。宋(Song)等人發現在造血分化過程中,基因校正的β-Thal iPSC顯示了增加的擬胚體比率和不同的造血祖細胞百分比。更重要的是,與未校正組相比,基因校正的βThal iPSC品系恢復HBB表現,並降低了活性氧種類的產生。宋(Song)等人的研究表明一旦由CRISPR-Cas9系統校正,β-Thal iPSC的造血分化效率則大大改進。類似的方法可以利用本文描述的CRISPR-Cas9系統進行,例如包括Cas9效應蛋白的系統。
參考WO 2015/148860,藉由本文的傳授,本發明包含結合本文的傳授而應用的該等文獻的方法和材料。在血液相關疾病基因療法的方面,用於治療β地中海貧血的方法和組成物可以適於本發明的 CRISPR-Cas系統(參見例如WO 2015/148860)。在一實施方式中,WO 2015/148860涉及治療或預防β地中海貧血或其症狀,例如藉由改變用於B-細胞CLL/淋巴瘤11A(BCL11A)的基因。該BCL11A基因也稱為B-細胞CLL/淋巴瘤11A、BCL11A-L、BCL11A-S、BCL11AXL、CTIP 1、HBFQTL5和ZNF。BCL11A編碼在調節球蛋白基因表現中涉及的鋅-指蛋白。藉由改變BCL11A基因(例如,BCL11A基因的一個或兩個等位基因),可以增加γ球蛋白的水平。γ球蛋白可以替代血紅蛋白複合物中的β球蛋白,並且有效地負載氧氣到組織,由此改善β地中海貧血疾病表型。
鐮狀細胞貧血係一種紅細胞變為鐮刀形的常染色體隱性遺傳疾病。它由β-球蛋白基因中的單鹼基取代導致,該基因位於染色體11的短臂上。其結果係,產生纈胺酸而非穀胺酸,從而導致鐮珠蛋白(HbS)的產生。這導致形成形狀扭曲的紅細胞。由於這種異常的形狀,小血管可以被阻斷,從而造成對骨、脾和皮膚組織的嚴重損傷。這可能導致疼痛、頻繁感染、手足綜合症或甚至多器官功能衰竭的發作。扭曲的紅細胞對溶血也是更敏感的,溶血導致嚴重貧血。如在β-地中海貧血的情況下,鐮狀細胞貧血可以藉由用該CRISPR-Cas9系統修飾HSC進行校正。該系統允許藉由切割其DNA並且然後讓它自我修復而對細胞的基因組進行特異性編輯。Cas9蛋白被插入並且藉由RNA指導物被指導至突變點並且然後它切割該點處的DNA。同時,插入健康形式的序列。這個序列被細胞自己的修復系統用來固定誘導的切割。以此方式,該CRISPR-Cas9允許在先前獲得的幹細胞中校正突變。根據本領域的知識和本揭露的教導,就鐮狀細胞貧血而言,熟習該項技術者可以使用靶向並校正突變的 CRISPR-Cas9系統來校正HSC(例如,用遞送β-球蛋白(有利地是非鐮狀化β-球蛋白或)的編碼序列的適合的HDR模板);確切地說,指導RNA可以靶向引起鐮狀細胞貧血的突變,並且HDR可以為β-球蛋白的正確表現提供編碼。將靶向包含突變-和-Cas9蛋白的粒子的指導RNA與攜帶突變的HSC進行接觸。該粒子還可以包含適合的HDR模板,以校正β-球蛋白的適當表現的突變;或HSC可以與包含或遞送HDR模板的第二粒子或載體接觸。可以將這樣接觸的細胞給予;並且視情況處理/擴增。參見卡地亞(Cartier)。該HDR模板可以提供HSC以便表現工程化的β-球蛋白基因(例如,βA-T87Q),或β-球蛋白,如在謝(Xie)中的。
還提及的是WO 2015/148863,並且藉由本文的傳授,本發明包含該等文獻的方法和材料,它們可以適於本發明的CRISPR-Cas系統。在治療和預防鐮狀細胞病(為遺傳血液病)的一方面中,WO 2015/148863包含改變BCL11A基因。藉由改變BCL11A基因(例如,BCL11A基因的一個或兩個等位基因),可以增加γ球蛋白的水平。γ球蛋白可以替代血紅蛋白複合物中的β球蛋白,並且有效地負載氧氣到組織,由此改善鐮狀細胞疾病表型。
威廉姆斯(Williams),“擴寬造血幹細胞遺傳療法的適應症(Broadening the Indications for Hematopoietic Stem Cell Genetic Therapies)”,《細胞‧幹細胞》(Cell Stem Cell)13:263-264(2013),藉由引用併入本文連同它引用的文獻,如同完整地陳述一樣,報導了慢病毒介導的基因轉移進入來自患有溶酶體貯積病異染性白質失養症症(MLD)的患者的HSC/P細胞中,所述疾病係由芳基硫酸酯酶A(ARSA)缺陷引 起的導致神經脫髓鞘的遺傳疾病;以及慢病毒介導的基因轉移進入患有偉-爾二氏症候群(WAS)的患者的HSC中(患者具有缺損WAS蛋白,該蛋白係調節血液細胞譜系中的細胞骨架功能的小GTP酶CDC42的效應子,並且因此罹患伴有復發性感染、自身免疫性症狀的免疫缺陷以及具有異常小的且功能異常的血小板的血小板減少,導致大量出血並且白血病和淋巴瘤的風險增加)。與使用慢病毒相對照,根據本領域的知識和本揭露的教導,就MLD(芳基硫酸酯酶A(ARSA)缺陷)而言,熟習該項技術者可以使用靶向並校正突變(芳基硫酸酯酶A(ARSA)缺陷)的CRISPR-Cas9系統來校正HSC(例如,用遞送ARSA的編碼序列的適合的HDR模板);確切地說,指導RNA可以靶向引起MLD(缺陷ARSA)的突變,並且HDR可以為ARSA的正確表現提供編碼。將靶向包含突變-和-Cas9蛋白的粒子的指導RNA與攜帶突變的HSC進行接觸。該粒子還可以包含適合的HDR模板,以校正ARSA的適當表現的突變;或HSC可以與包含或遞送HDR模板的第二粒子或載體接觸。可以將這樣接觸的細胞給予;並且視情況處理/擴增。參見卡地亞(Cartier)。與使用慢病毒相對照,根據本領域的知識和本揭露的教導,就WAS而言,熟習該項技術者可以使用靶向並校正突變(WAS蛋白缺陷)的CRISPR-Cas9系統來校正HSC(例如,用遞送WAS蛋白的編碼序列的適合的HDR模板);確切地說,指導RNA可以靶向引起WAS的突變(缺陷WAS蛋白),並且HDR可以為WAS蛋白的正確表現提供編碼。將靶向包含突變-和-Cas9蛋白的粒子的指導RNA與攜帶突變的HSC進行接觸。該粒子還可以包含適合的HDR模板,以校正WAS的適當表現的突變;或HSC可以與包含或遞送HDR模板的第二粒子或載體接觸。可以將這樣接觸的細胞給予;並且視情況處理/擴增。 參見卡地亞(Cartier)。
在本發明的一方面中,涉及編輯靶核酸序列或調節靶核酸序列的表現的方法和組成物,以及其結合癌症免疫療法的應用,係藉由適配本發明的CRISPR-Cas系統來領會。參考WO 2015/161276中的基因療法的應用,其涉及可以用於藉由改變一個或多個T細胞表現的基因,例如FAS、BID、CTLA4、PDCD1、CBLB、PTPN6、TRAC和/或TRBC基因中的一個或多個,影響T細胞增殖、存活和/或功能的方法和組成物。在一個相關方面,T細胞增殖可以藉由改變一個或多個T細胞表現的基因,例如CBLB和/或PTPN6基因、FAS和/或BID基因、CTLA4和/或PDCDI和/或TRAC和/或TRBC基因,而受到影響。
在患者惡性腫瘤中嵌合抗原受體(CAR)19T-細胞展現抗白血病作用。然而,白血病患者通常不具有足夠的T細胞來收集,意味著治療必須涉及來自供體的修飾的T細胞。因此,存在建立供體T-細胞的庫的興趣。凱西姆(Qasim)等人(“在B-ALL中Talen工程化的通用CAR19T細胞的第一臨床應用(First Clinical Application of Talen Engineered Universal CAR19 T Cells in B-ALL)”ASH第57屆年度會議和展覽會(ASH 57th Annual Meeting and Exposition),2015年12月5日-8日,摘要2046(https://ash.confex.com/ash/2015/webprogram/Paper81653.html線上公開於2015年11月)討論了修飾CAR19 T細胞以藉由破壞T細胞受體表現和CD52靶向來消除移植物抗宿主病的風險。此外,靶向CD52細胞,使得它們變得對阿侖單抗不敏感,並且由此允許阿侖單抗預防宿主介導的對人類白細胞抗原(HLA)不匹配的CAR19 T細胞的排斥。研究者使用編碼 與RQR8連接的4g7 CAR19(CD19 scFv-4-1BB-CD3ζ)的第三代自我失活型慢病毒載體,然後使用用於多元靶向T細胞受體(TCR)α恒定股座位和CD52基因座位兩者的兩對TALEN mRNA對細胞進行電穿孔。將在離體表現後仍表現TCR的細胞使用CliniMacs α/β TCR耗減進行耗減,產生T細胞產物(UCART19),具有<1%的TCR表現,其85%表現CAR19,並且64%變為CD52陰性。給予修飾的CAR19 T細胞以治療患者的復發的急性成淋巴細胞白血病。本文提供的傳授內容提供了用於修飾細胞例如以去除或調節CD52或其他靶標的有效方法,因此可以結合以下來使用:改變T細胞或其他細胞向患者的給予以治療惡性腫瘤。
Watts,“造血幹細胞擴增與基因治療(Hematopoietic Stem Cell Expansion and Gene Therapy)”《細胞療法》(Cytotherapy),13(10):1164-1171.doi:10.3109/14653249.2011.620748(2011),藉由引用併入本文連同它引用的文獻,如同完整地陳述一樣,討論了造血幹細胞(HSC)基因療法(例如,病毒介導的HSC基因療法),作為許多障礙的極具吸引力的治療選擇,該等障礙包括血液學病症、免疫缺陷(包括HIV/AIDS)以及其他遺傳障礙,像溶酶體貯積病,包括SCID-X1、ADA-SCID、β-地中海貧血、X連鎖CGD、偉-爾二氏症候群、范康尼氏頑固性貧血、腎上腺腦白質失養症(ALD)和異染性白質失養症(MLD)。
轉讓給Cellectis公司的美國專利公開案號20110225664、20110091441、20100229252、20090271881和20090222937,涉及CREI變體,其中兩個I-CreI單體的至少一個具有至少兩個取代,一個在分別位於從I-CreI的位置26到40以及44到77的LAGLIDADG核心域的兩個功能性亞 結構域的每一個中,能夠從人白細胞介素2受體γ鏈(IL2RG)基因切割DNA靶序列的所述變體也稱為普通細胞因子受體γ鏈基因或γC基因。在美國專利公開案號20110225664、20110091441、20100229252、20090271881和20090222937中鑒定的靶序列可以用於本發明的核酸靶向系統。
由於在淋巴細胞T成熟方面的缺陷所致的嚴重聯合免疫缺陷(SCID)總係與淋巴細胞B的功能缺陷相關聯(卡瓦紮納-卡爾沃(Cavazzana-Calvo)等人,《醫學年鑒》(Annu.Rev.Med.),2005,56,585-602;費舍爾(Fischer)等人,《免疫學評論》(Immunol.Rev.),2005,203,98-109)。總發病率估計為每75 000個出生人數有1個。患有未經治療的SCID的患者遭受多重機會性微生物感染,並且通常不能活過一年。SCID可以藉由同種異體造血幹細胞(來自家族供體)轉移進行治療。對於供體而言的組織相容性可在很大程度上變化。在腺苷脫胺酶(ADA)缺陷的情況下,SCID之一形成,患者可以藉由注射酶重組腺苷脫胺酶進行治療。
由於已經顯示ADA基因在SCID患者中突變(吉布勒特(Giblett)等人,《柳葉刀》(Lancet),1972,2,1067-1069),已經鑒定了幾種其他的涉及SCID的基因(卡瓦紮納-卡爾沃(Cavazzana-Calvo)等人,《醫學年鑒》(Annu.Rev.Med.),2005,56,585-602;費舍爾(Fischer)等人,《免疫學評論》(Immunol.Rev.),2005,203,98-109)。對於SCID有四種主要原因:(i)最常見的SCID形式,SCID-X1(X連鎖的SCID或X-SCID),係由IL2RG基因的突變引起的,導致成熟T淋巴細胞和NK細胞的缺乏。IL2RG編碼γC蛋白(野口(Noguchi)等人,《細胞》(Cell),1993, 73,147-157),其為至少五種白細胞介素受體複合物的一種共有組分。該等受體藉由JAK3激酶活化幾種靶標(馬基(Macchi)等人,《自然》(Nature),1995,377,65-68),其失活導致與γC失活相同的綜合症;(ii)ADA基因的突變導致嘌呤代謝缺陷,這對於淋巴細胞先質係致命的,進而導致B、T和NK細胞的准缺乏;(iii)V(D)J重組在免疫球蛋白和T淋巴細胞受體(TCR)的成熟中是一重要步驟。在涉及這個過程的三種基因重組活化基因1和2(RAG1和RAG2)以及阿蒂米斯(Artemis)中的突變導致成熟T和B淋巴細胞的缺乏;以及(iv)還報導了在涉及T細胞特異性傳訊的其他基因如CD45中的突變,雖然它們代表少數情形(卡瓦紮納-卡爾沃(Cavazzana-Calvo)等人,《醫學年鑒》(Annu.Rev.Med.),2005,56,585-602;費舍爾(Fischer)等人,《免疫學評論》(Immunol.Rev.),2005,203,98-109)。出於兩個主要原因,自從它們的遺傳基礎已經鑒定以來,不同的SCID形式已經成為基因治療方法的範例(費舍爾(Fischer)等人,《免疫學評論》(Immunol.Rev.),2005,203,98-109)。首先,係由於在所有血液疾病中可以設想離體治療。造血幹細胞(HSC)可以從骨髓恢復,並且在較少的細胞分裂中保持了它們的多能性。因此,可以將它們進行體外處理,然後重新注射到患者中,它們入駐骨髓中。其次,由於淋巴細胞的成熟在SCID患者中受損,經校正的細胞具有選擇性優勢。因此,少量的校正細胞可恢復功能性免疫系統。這種假設借助於下列各項確認數次(i)與SCID患者中的突變的逆轉相關聯的免疫功能的部分恢復(赫希霍恩(Hirschhorn)等人,《自然-遺傳學》(Nat.Genet.),1996,13,290-295;斯蒂芬(Stephan)等人,《新英格蘭醫學雜誌》(N.Engl.J.Med.),1996,335,1563-1567;布索(Bousso)等人,《美國國 家科學院院刊》(Proc.Natl.,Acad.Sci.USA),2000,97,274-278;和田(Wada)等人,《美國國家科學院院刊》(Proc.Natl.Acad.Sci.USA)2001,98,8697-8702;西小森(Nishikomori)等人,《血液》(Blood),2004,103,4565-4572),(ii)在造血細胞中的體外SCID-X1缺陷的校正(坎多蒂(Candotti)等人,《血液》,1996,87,3097-3102;卡瓦紮納-卡爾沃(Cavazzana-Calvo)等人,《血液》,1996,《血液》,88,3901-3909;泰勒(Taylor)等人,《血液》,1996,87,3103-3107;哈辛-貝(Hacein-Bey)等人,《血液》,1998,92,4090-4097),(iii)SCID-X1的校正(蘇戴斯(Soudais)等人,《血液》,2000,95,3071-3077;蔡(Tsai)等人,《血液》,2002,100,72-79),JAK-3(邦廷(Bunting)等人,《自然醫學》(Nat.Med.),1998,4,58-64;邦廷等人,《人類基因治療》(Hum.Gene Ther.),2000,11,2353-2364)和RAG2(耶茨(Yates)等人,《血液》,2002,100,3942-3949)在動物模型中的體內缺陷以及(iv)基因治療臨床試驗的結果(卡瓦紮納-卡爾沃等人,《科學》,2000,288,669-672;艾爾迪(Aiuti)等人,《自然醫學》(Nat.Med.),2002;8,423-425;加斯帕(Gaspar)等人,《柳葉刀》(Lancet),2004,364,2181-2187)。
轉讓給兒童醫療中心有限公司(Children’s Medical Center Corporation)和哈弗大學(President and Fellows of Harvard College)的美國專利公開案號20110182867涉及經由BCL11A表現或活性抑制劑(如RNAi和抗體)在造血祖細胞中調節胎兒血紅蛋白(HbF)表現的方法和用途。在美國專利公開案號20110182867中揭露的靶標,如BCL11A,可以被本發明的CRISPR Cas9系統靶向,以便調節胎兒血紅蛋白表現。對於 另外的BCL11A靶標,還參見鮑爾(Bauer)等人(《科學》(Science)2013年10月11日:第342卷,第6155期,第253-257頁)和許(Xu)等人(《科學》2011年11月18日:第334卷,第6058期,第993-996頁)。
採用本領域的知識和本揭露中的傳授,熟習該項技術者可以針對遺傳性血液障礙例如β-地中海貧血、血友病、或遺傳性溶酶體貯積疾病來校正HSC。
治療腦、中樞神經系統和免疫系統的疾病
本發明還考慮了向腦或神經元遞送該CRISPR-Cas系統。例如,藉由降低HTT(杭丁頓氏症的致病基因)的表現,RNA干擾(RNAi)對這種病症提供了治療潛能(參見,例如,麥克布賴德(McBride)等人,《分子治療》(Molecular Therapy)第19卷,第12期,2011年12月,第2152-2162頁),因此申請人假定它可以用於/或適用於該CRISPR-Cas系統。可以使用一種演算法來生成該CRISPR-Cas系統,以便降低反義序列的脫靶可能性。該等CRISPR-Cas序列可以靶向小鼠、恒河猴或人類亨廷丁的外顯子52中的一序列並且表現於一病毒載體如AAV中。可以按照約三次微量注射/半球(總共六次注射)來注射包括人類在內的動物:第一次在前連合的吻側1mm(12μl),並且用1e12vg/ml的AAV以約1μl/分的速率在第一次注射的尾側間隔3mm和6mm進行其餘兩次注射(分別為12μl和10μl),並且將針留在適當位置持續另外的5分鐘,以允許注射物從針尖擴散。
迪費吉裡亞(DiFiglia)等人(PNAS,10月23日,2007年,第104卷,第43期,17204-17209)觀察到,向成熟的紋狀體中單次給 予靶向Htt的siRNA可以使突變體Htt沈默,減弱神經元病理,並且延遲在急驟起病的HD的病毒性轉基因小鼠模型中觀察到的異常行為表現。迪費吉裡亞(DiFiglia)用2μl的Cy3標記的cc-siRNA-Htt或10μM的未結合的siRNA-Htt注射到小鼠的紋狀體內。在本發明中對於人類可以考慮靶向Htt的CRISPR Cas的相似劑量,例如,可以將約5-10ml的10μM的靶向Htt的CRISPR Cas注射到紋狀體內。
在另一個實施方式中,布德羅(Boudreau)等人(《分子治療》(Molecular Therapy)第17卷,第6期,2009年6月)將5μl的表現htt特異性RNAi病毒的重組AAV血清型2/1載體(以4 x 1012個病毒基因組/ml)注射到紋狀體(straiatum)中。在本發明中對於人類可以考慮靶向Htt的CRISPR Cas的相似劑量,例如,可以將約10-20ml的4 x 1012個病毒基因組/ml靶向Htt的CRISPR Cas注射到紋狀體內。
在另一個實施方式中,可以連續給予靶向HTT的CRISPR Cas(參見,例如,於(Yu)等人,《細胞》(Cell)150,895-908,8月31日,2012年)。於(Yu)等人利用遞送0.25ml/小時的滲透泵(型號2004)來遞送300mg/天的ss-siRNA或磷酸鹽緩衝鹽水(PBS)(西格瑪奧德里奇公司(Sigma Aldrich),持續28天,並且使用被設計為遞送0.5μl/小時的泵(型號2002)來遞送75mg/天的陽性對照MOE ASO,持續14天。用稀釋在無菌PBS中的ss-siRNA或MOE充滿泵(度瑞公司(Durect Corporation),進而在植入之前將其在37C培養24或48(型號2004)小時。用2.5%異氟烷麻醉小鼠,並且在頭蓋骨底部做正中切口。使用腦功能區定位導子,將套管植入右側腦室並且用樂泰膠(Loctite adhesive)固定。 將一根附接到Alzet微滲透壓泵的導管附接到該套管上,並且將該泵皮下置於肩胛間區(midscapular area)中。用5.0號尼龍縫線將該切口閉合。在本發明中對於人類可以考慮靶向Htt的CRISPR Cas的相似劑量,例如,可以給予約500到1000g/天的靶向Htt的CRISPR Cas。
在連續輸注的另一個實例中,斯泰爾斯(Stiles)等人(《實驗神經病學》(Experimental Neurology)233(2012)463-471)將具有鈦針尖的腦實質導管植入到右側殼核中。將該導管連接到一皮下植入在腹部的SynchroMed® II泵(美敦力神經調控部門(Medtronic Neurological),明尼阿波里斯市,明尼蘇達州)上。在以6μL/天輸注磷酸鹽緩衝鹽水7天之後,用試驗品將該等泵重新充滿並且程式設計為連續遞送7天。以約0.1到0.5μL/分的變化輸注速率輸注約約2.3到11.52mg/d的siRNA。在本發明中對於人類可以考慮靶向Htt的CRISPR Cas的相似劑量,例如,可以給予約20到200mg/天的靶向Htt的CRISPR Cas。在另一個實施方式中,轉讓給桑加莫(Sangamo)的美國專利公開案號20130253040(WO 2013130824)的該等方法也可以適合於用於治療杭丁頓氏症的從塔樂斯(TALES)到本發明的CRISPR Cas系統。在博多研究所(The Broad Institute)等名下的藉由引用特此結合的WO 2015089354 A1描述了杭丁頓氏症(HP)的靶標。關於杭丁頓氏症,CRISPR複合物的可能的靶基因:PRKCE;IGF1;EP300;RCOR1;PRKCZ;HDAC4;以及TGM2。
因此,以下各項中的一種或多種:PRKCE;IGF1;EP300;RCOR1;PRKCZ;HDAC4;和TGM2,在本發明的一些實施方式中可以被選擇作為杭丁頓氏症的靶標。
其他三核苷酸重複障礙。該等可以包括以下各項中的任一項:類別I,包括杭丁頓氏症(HD)和脊髓小腦性失調症;類別II擴展,係表型相異的,具有在量值上通常較小並且還發現於基因的外顯子中的異質擴增;以及類別III,包括脆弱X染色體症候群、肌強直性營養不良、兩種脊髓小腦性失調症、青少年肌陣攣性癲癇以及弗裡德賴希共濟失調(Friedreich's ataxia)。
本發明的一個另外的方面涉及利用CRISPR-Cas系統校正EMP2A和EMP2B基因缺陷,該等基因已經被鑒定為與拉福拉病(Lafora disease)相關。拉福拉病係由可以作為青年期的癲癇發作而開始的進行性肌陣攣性癲癇表徵的常染色體隱性病症。該疾病的少數病可以由尚未鑒定的基因的突變引起。該疾病引起發作、肌肉痙攣、行走困難、失智,並且最終引起死亡。當前沒有療法被證明有效對抗疾病進展。與癲癇相關的其他遺傳異常還可以靶向CRISPR-Cas系統並且基礎遺傳學進一步描述於由朱利亞諾阿文濟尼(Giuliano Avanzini)、傑佛瑞L.諾貝爾斯(Jeffrey L.Noebels)編輯的《癲癇與遺傳癲癇遺傳學》(Genetics of Epilepsy and Genetic Epilepsies),馬里亞尼兒科神經學基金會(Mariani Foundation Paediatric Neurology):20;2009)中。
轉讓給加莫生物科技公司(Sangamo BioSciences,Inc.)的美國專利公開案號20110158957的涉及使T細胞受體(TCR)基因失活的方法也可以被修飾為本發明的CRISPR Cas系統。在另一個實例中,轉讓給加莫生物科技公司的美國專利公開案號20100311124和轉讓給Cellectis公司的美國專利公開案號20110225664的方法(兩者都涉及使穀胺醯胺合 成酶基因表現基因失活)也可以被修飾為本發明的CRISPR Cas系統。。
治療聽力疾病
本發明還考慮了向一隻或兩隻耳遞送該CRISPR-Cas系統。
研究者正在調查基因治療是否可以用來輔助當前的耳聾治療一即,耳蝸植入物。耳聾常常由毛細胞的缺失或損害引起,其不能將信號傳遞到聽覺神經元。在這樣的情況下,可以使用耳蝸植入物對聲音做出響應並且將電信號傳輸到神經細胞。但是,由於受損的毛細胞釋放釋放更少的生長因子,該等神經元常常退化並從耳蝸縮回。
美國專利申請20120328580描述了例如使用一個注射器(例如單劑量注射器)將一種藥物組成物注射到耳中(例如,耳部施用),如注射到耳蝸的腔(luminae)中(例如,中階、前庭階、和鼓階)。例如,可以藉由鼓室內注射(例如,進入中耳)、和/或注射到外耳、中耳、和/或內耳給予本文描述的一種或多種化合物。這樣的方法在本領域中常規使用,例如,用於將甾體和抗生素給予到人耳中。例如,可以藉由耳的圓窗或藉由耳蝸囊進行注射。其他內耳施用方法係本領域已知的(參見,例如,索爾特(Salt)和普蘭特克(Plontke),《今日藥物發現》(Drug Discovery Today),10:1299-1306,2005)。
在另一種給藥方式中,可以經由一導管或泵原位施用該藥物組成物。導管或泵可以,例如,將藥物組成物導向到耳蝸腔或耳的圓窗和/或結腸腔中。適合於將本文所述的一種或多種化合物施用到耳(例如,人耳)中的示例性藥物遞送設備和方法由麥肯納(McKenna)等人, (美國公開號2006/0030837)和雅各森(Jacobsen)等人,(美國專利案號7,206,639)描述。在一些實施方式中,可以在外科手術過程中將導管或泵定位在例如患者的耳中(例如,外耳、中耳和/或內耳)。在一些實施方式中,可以將導管或泵定位在例如患者的耳中(例如,外耳、中耳和/或內耳),而不需要外科手術。
可替代地或另外地,本文所述的一種或多種化合物可以與一種佩戴在外耳中的機械裝置(如耳蝸植入物或助聽器)聯合使用。適合於與本發明一起使用的示例性耳蝸植入物由埃奇(Edge)等人(美國公開號2007/0093878)描述。
在一些實施方式中,上述給藥方式可以按照任何順序組合並且可以是同時的或者散佈的。
可替代地或另外地,本發明可以根據食品藥品監督管理局批准的任何方法給藥,例如,如描述於《CDER數據標準手冊》(CDER Data Standards Manual),版本號004(在fda.give/cder/dsm/DRG/drg00301.htm可獲得)。
一般而言,在美國專利申請20120328580中描述的該等細胞治療方法可以用來體外促進細胞向或朝向內耳的成熟細胞類型(例如,毛細胞)的完全或部分分化。從這樣的方法得到的細胞然後可以移植或植入到需要這種治療的患者中。下面描述了實踐該等方法所需的細胞培養方法,包括用於鑒定和選擇適當細胞類型的方法、用於促進選定細胞的完全或部分分化的方法、用於鑒定完全或部分分化的細胞類型的方法、以及用於植入完全或部分分化的細胞之方法。
適合於在本發明中使用的細胞包括但不限於,當與本文所述的一種或多種化合物例如體外接觸時能夠完全或部分分化成內耳的成熟細胞,例如,毛細胞(例如,內耳和/或外耳毛細胞)的細胞。能夠分化成毛細胞的示例性細胞包括但不限於幹細胞(例如,內耳幹細胞、成體幹細胞、骨髓源性幹細胞、胚胎幹細胞、間充質幹細胞、皮膚乾細胞、iPS細胞、和脂肪來源幹細胞)、祖細胞(例如,內耳祖細胞)、支持細胞(例如,戴特斯細胞(Deiters' cell)、柱細胞、內指狀細胞、頂蓋細胞(tectal cell)和漢森細胞(Hensen's cell))、和/或生殖細胞。幹細胞用於替代內耳感覺細胞的用途描述於李(Li)等人(美國公開號2005/0287127)和李等人(美國專利序號11/953,797)。骨髓源性幹細胞用於替代內耳感覺細胞的用途描述於埃奇(Edge)等人的PCT/US 2007/084654。iPS細胞描述於,例如,高橋(Takahashi)等人,《細胞》(Cell),第131卷,第5期,第861-872頁(2007);高橋(Takahashi)和山中(Yamanaka),《細胞》126,663-76(2006);沖田(Okita)等人,《自然》(Nature)448,260-262(2007);餘(Yu)J.等人,《科學》(Science)318(5858):1917-1920(2007);中川(Nakagawa)等人,《自然生物技術》(Nat.Biotechnol.)26:101-106(2008);以及紮瑞斯(Zaehres)和肖勒(Scholer),《細胞》131(5):834-835(2007)。可以藉由分析(例如,定性或定量)一種或多種組織特異型基因的存在來鑒定這種適合的細胞。例如,可以藉由檢測一種或多種組織特異型基因的蛋白質產物來檢測基因表現。蛋白質檢測技術包括使用針對適當抗原的抗體將蛋白質染色(例如,使用細胞提取物或全細胞)。在這種情況下,該適當抗原係該組織特異型基因表現的蛋白質產物。雖然在原則上可以標記第一抗體(即,結合該抗原的抗體),更普遍的是(並 且改進視覺化)使用針對該第一抗體的第二抗體(例如,抗IgG)。這種第二抗體與螢光染料、或適當的用於比色反應的酶、或金珠(用於電子顯微鏡檢查)、或者與生物素-親和素系統結合,使得該一級抗體進而該抗原的位置可以被識別。
藉由將藥物組成物直接應用於外耳,本發明的CRISPR Cas分子可以遞送到耳,其中組成物從美國公開申請20110142917修改而來。在一些實施方式中,該藥物組成物應用於耳道。遞送至耳還可以稱為聽覺或耳遞送。
在一些實施方式中,本發明的RNA分子在脂質體或陽離子脂質體配製物等等中進行遞送並且可以藉由熟習該項技術者熟知的方法進行製備。這樣的方法描述於,例如,美國專利案號5,593,972、5,589,466、和5,580,859中,將其藉由引用併入本文。
已經開發了專門針對增強和改進遞送siRNA到哺乳動物細胞中的遞送系統,(參見,例如,沈(Shen)等人《歐洲生化學會聯合會快報》(FEBS Let.).2003,539:111-114;夏(Xia)等人,《自然生物技術》(Nat.Biotech.)2002,20:1006-1010;賴希(Reich)等人,《分子視界》(Mol.Vision.)2003,9:210-216;索倫森(Sorensen)等人,《分子生物學雜誌》(J.Mol.Biol.)2003,327:761-766;路易士(Lewis)等人,《自然遺傳學》(Nat.Gen.)2002,32:107-108以及西梅奧尼(Simeoni)等人,NAR 2003,31,11:2717-2724)並且可以將其應用於本發明。最近,siRNA已經成功用於抑制靈長動物中的基因表現(參見例如托倫蒂諾(Tolentino)等人,《視網膜》(Retina)24(4):660,它也可應用於本發明。
齊(Qi)等人揭露了藉由可應用於本發明的核酸靶向系統的新蛋白質遞送技術經由完整圓窗到內耳的有效siRNA轉染方法(參見,例如,齊(Qi)等人,《基因治療》(Gene Therapy)(2013),1-9)。具體地說,可將Cy3標記的siRNA經由完整圓窗滲透轉染到內耳的細胞中(包括內和外毛細胞、壺腹脊、橢圓囊斑和球囊斑)的TAT雙股RNA結合結構域(TAT-DRBD)成功用於體內遞送雙股siRNA,用於治療各種內耳疾病和保留聽覺功能。可以考慮約40μl的10mM RNA作為施用至耳的劑量。
根據瑞嘉利(Rejali)等人(《聽力研究》(Hear Res.)2007年6月;228(1-2):180-7),耳蝸植入物的功能借助於良好保留螺旋神經節神經元而得以改善,該等神經元係經由植入物電刺激的靶標,並且先前已經表明腦源性神經營養因子(BDNF)在實驗性變聾的耳中增強了螺旋神經節的存活。瑞嘉利(Rejali)等人測試了耳蝸值入物電極的改良設計,該電極包括被具有BDNF基因插入片段的病毒載體轉導的成纖維細胞的塗層。為了完成這種類型的離體基因轉移,瑞嘉利(Rejali)等人用具有BDNF基因盒插入片段的腺病毒轉導豚鼠,並且確定該等細胞分泌BDNF,進而將BDNF分泌細胞經由瓊脂糖凝膠附著在該耳蝸植入物電極上,並且將該電極植入鼓階中。瑞嘉利(Rejali)等人確定,該BDNF表現電極與對照電極相比在植入48天之後能夠保留顯著更多的在耳蝸底回中的螺旋神經節神經元,並且證明了耳蝸植入物治療與用於增強螺旋神經節神經元存活的離體基因轉移相結合的可行性。這樣一種系統可以應用於遞送到耳的本發明的核酸靶向系統。
穆科吉(Mukherjea)等人(《抗氧化劑與氧化還原信號》 (Antioxidants & Redox Signaling),第13卷,第5期,2010)證明,使用短干擾(si)RNA敲低NOX3消除了順鉑的耳毒性,正如保護OHC免於損害以及在聽覺腦幹反應(ABR)中降低的閾值位移所證明。將不同劑量的siNOX3(0.3、0.6、和0.9μg)施用至大鼠並且藉由即時RT-PCR評估NOX3表現。當與序列打亂的(scrambled)siRNA的經鼓膜施用或未治療的耳蝸比較時,使用的最低劑量的NOX3 siRNA(0.3μg)未顯示對NOX3 mRNA的任何抑制。然而,與序列打亂的對照siRNA相比,給予更高劑量的NOX3 siRNA(0.6和0.9μg)降低了NOX3表現。這樣一種系統系統可應用於經鼓膜給藥的本發明的CRISPR Cas系統,其中向人類給藥的CRISPR Cas的劑量為約2mg到約4mg。
榮格(Jung)等人(《分子治療》(Molecular Therapy),第21卷,第4期,834-841,2013年4月)證明,在橢圓囊中的Hes5水平在應用siRNA之後降低,並且在該等橢圓囊中的毛細胞的數目顯著大於對照處理之後的數目。該等數據表明,siRNA技術可以用於誘導內耳中的修復和再生,並且Notch信號通路對於特異性基因表現抑制係一個潛在有用的靶標。榮格(Jung)等人將藉由將無菌生理鹽水加入凍乾siRNA而製備的8μg的Hes5 siRNA以2μl體積注射到耳的前庭上皮。這樣一種系統系統可應用於向耳的前庭上皮給藥的本發明的核酸靶向系統,其中向人類給藥的CRISPR Cas的劑量為約1到約30mg。
治療眼睛疾病
本發明還考慮了向一隻或兩隻眼睛遞送該CRISPR-Cas9系統。
在本發明的又另一個方面,該CRISPR-Cas9系統可以用來矯正幾種基因突變引起的眼部缺陷,其進一步描述於《眼的遺傳疾病》(Genetic Diseases of the Eye),第二版,由伊萊亞斯(Elias)I.特拉布勒西(Traboulsi)編輯,牛津大學出版社,2012年。
為了向眼部給藥,慢病毒載體,尤其是馬傳染性貧血病毒(EIAV)係特別較佳的。
在另一個實施方式中,還考慮了基於馬傳染性貧血病毒(EIAV)的最小非靈長類慢病毒載體,尤其是對於眼基因治療而言(參見,例如,巴魯穀安(Balagaan),《基因醫學雜誌》(J Gene Med)2006;8:275-285,2005年11月21日在《威利線上期刊》(Wiley InterScience)(www.interscience.wiley.com)DOI:10.1002/jgm.845)。考慮該等載體具有驅動靶基因表現的巨細胞病毒(CMV)啟動子。前房內、視網膜下、眼內和玻璃體內注射均予以考慮(參見,例如,巴魯穀安(Balagaan),《基因醫學雜誌》(J Gene Med)2006;8:275-285,2005年11月21日在《威利線上期刊》(Wiley Inter Science)(www.interscience.wiley.com).DOI:10.1002/jgm.845)。可以在手術顯微鏡的輔助下進行眼內注射。為了視網膜下和玻璃體內注射,藉由輕輕指壓可以使眼睛突出,並且使用接觸鏡系統看見眼底,該接觸鏡系統包含在角膜上的一滴耦合介質溶液,角膜用玻璃顯微鏡載玻片蓋玻片覆蓋。為了視網膜下注射,安裝在5-μl的漢密爾頓注射器上的10-mm 34號針的尖端可以在直接視覺化之下穿過鞏膜赤道部上部朝向後極切向行進,直到該針的孔在視網膜下空間中可見時為止。然而,可以注射2μl的載體懸浮液以產生上部泡狀視網膜脫離,從而 證實視網膜下載體給藥。這種方法建立了一種自我癒合的鞏膜切開術,允許載體懸浮液保留在視網膜下空間中,直到它在該操作的48小時之內被RPE吸收為止。可以在半球下方重複這個操作以產生下部視網膜脫離。這種技術導致大約70%的感覺神經性視網膜和RPE暴露於該載體懸浮液。為了玻璃體內注射,針尖可以在角鞏膜緣後方1mm穿過鞏膜並且將2μl的載體懸浮液注射到玻璃體腔中。為了前房內注射,針尖可以藉由角鞏膜緣穿刺朝向中央角膜行進,並且可以注射2μl的載體懸浮液。為了前房內注射,針尖可以藉由角鞏膜緣穿刺朝向中央角膜行進,並且可以注射2μl的載體懸浮液。可以1.0-1.4×1010或1.0-1.4×109個轉導單位(TU)/ml的滴度注射該等載體。
在另一個實施方式中,還考慮了RetinoStat®,一經由視網膜下注射用於治療濕型的年齡相關性黃斑變性的表現血管生成抑制蛋白(內皮抑素和血管抑素)的基於馬傳染性貧血病毒的慢病毒基因治療載體(參見,例如,賓利(Binley)等人,《人類基因治療》(HUMAN GENE THERAPY)23:980-991(2012年9月))。這樣一種載體可以改良為本發明的CRISPR-Cas9系統。每隻眼可以用RetinoStat®以1.1 x 105個轉導單位/眼(TU/眼)以總體積100μl進行治療。
在一實施方式中,提及WO 2015/153780,其包括藉由靶向MYOC基因的編碼序列提供對原發性開角型青光眼(POAG)的治療或預防。引起POAG的一些靶突變包括但不限於P370(例如P370L);I477(例如,I477N或I477S);T377(例如TE77R);Q368(Q368終止)-所有均在MYOC基因中。該靶突變還可以包括在MYOC基因中的胺基酸序列 位置246-252之間的突變熱點。在一實施方式中,該靶突變係在MYOC基因中的胺基酸序列位置例如胺基酸368-380、胺基酸368-370+377-380、胺基酸364-380、或胺基酸347-380之間的突變熱點。在一實施方式中,該靶突變係在MYOC基因中的胺基酸序列位置423-437(例如胺基酸423-426、胺基酸423-427和胺基酸423-437)之間的突變熱點。在一實施方式中,該靶突變係在MYOC基因中的胺基酸序列位置477-502之間的突變熱點(參見例如WO 2015/153780)。
在另一個實施方式中,對於遞送至眼可以考慮E1-、部分E3-、E4-缺失的腺病毒載體。對患有晚期新生血管性年齡相關性黃斑變性(AMD)的二十八位患者給予表現人色素上皮源性因子(AdPEDF.ll)的E1-、部分E3-、E4-缺失的腺病毒載體的單次玻璃體內注射(參見,例如,坎波基亞羅(Campochiaro)等人,《人類基因治療》(Human Gene Therapy)17:167-176(2006年2月))。研究了從106到109.5個粒子單位(PU)範圍的劑量,沒有與AdPEDF.ll有關的嚴重不良事件且沒有劑量限制性毒性(參見,例如,坎波基亞羅(Campochiaro)等人,《人類基因治療》(Human Gene Therapy)17:167-176(2006年2月))。腺病毒載體介導的眼部基因轉移顯得係一種可行的用於治療眼部病症之方法,並且可應用於該CRISPR Cas9系統。
在另一個實施方式中,RXi製藥公司(RXi Pharmaceuticals)的sd-rxRNA®系統可以用於和/或適用於將CRISPR Cas9遞送至眼。在這個系統中,3μg的sd-rxRNA的單次玻璃體內給藥導致PPIB mRNA水平的序列特異性降低,持續14天。該sd-rxRNA®系統可以應用於 本發明的核酸靶向系統,考慮向人類給藥的劑量為約3到20mg的CRISPR。
米林頓-華德(Millington-Ward)等人(《分子治療》(Molecular Therapy),第19卷,第4期,642-649,2011年4月)描述了腺相關病毒(AAV)載體,其用來遞送基於RNA干擾(RNAi)的視紫紅質抑制劑和由於在RNAi靶位點上的簡並位置處的核苷酸改變而抵抗抑制的密碼子修飾的視紫紅質代替基因。由米林頓-華德(Millington-Ward)等人將6.0 x 108vp或1.8 x 1010vp AAV的注射劑經視網膜下注射到眼中。米林頓-華德(Millington-Ward)等人的AAV載體可以應用於本發明的CRISPR Cas系統,考慮向人類給藥的劑量為約2 x 1011到約6 x 1013vp。
戴爾卡拉(Dalkara)等人(《科學轉化醫學》(Sci Transl Med)5,189ra76(2013))還涉及用於形成AAV載體的體內定向演化,該AAV載體在將野生型缺陷型基因無損傷地注射到眼的玻璃體液中之後遞送至整個視網膜。戴爾卡拉(Dalkara)描述了7聚體肽展示文庫和藉由從AAV1、2、4、5、6、8、和9的cap基因的DNA改組構建的AAV文庫。將該等rcAAV文庫和在CAG或Rho啟動子之下表現GFP的rAAV載體進行包裝,並且藉由定量PCR獲得抗去氧核糖核酸酶的基因組滴度。彙集該等文庫,並且進行兩輪演化,每輪演化包括初始文庫多樣化繼之以三個體內選擇步驟。在每個這樣的步驟中,用2ml的碘克沙醇純化的磷酸鹽緩衝鹽水(PBS)透析的文庫以約1×1012vg/ml的基因組滴度對P30 rho-GFP小鼠進行玻璃體內注射。戴爾卡拉(Dalkara)等人的AAV載體可以應用於本發明的核酸靶向系統,考慮向人類給藥的劑量為約1 x 1015到約1 x 1016vg/ml。
在另一個實施方式中,該視紫紅質基因可以被靶向用於治療色素性視網膜炎(RP),其中轉讓給桑加莫生物科學公司(Sangamo BioSciences,Inc.)的美國專利公開案號20120204282的系統可以依照本發明的CRISPR Cas9系統進行修飾。
在另一個實施方式中,針對從人類視紫紅質基因切割靶序列的方法的轉讓給Cellectis公司的美國專利公開案號20130183282的方法也可以針對本發明的核酸靶向系統進行修改。
轉讓給臺灣中央研究院(Academia Sinica)的美國專利公開案號20130202678涉及用於治療視網膜病變和視力威脅性眼科疾病(sight-threatening ophthalmologic disorders)之方法,該等方法涉及向眼的視網膜下或玻璃體內空間中遞送Puf-A基因(在眼組織的視網膜神經節和色素細胞中表現並且展示出獨特的抗凋亡活性)。具體地說,令人希望的靶標係zgc:193933、prdm1a、spata2、tex10、rbb4、ddx3、zp2.2、Blimp-1和HtrA2,均可以由本發明的核酸靶向系統靶向。
吳(Wu)(《細胞-幹細胞》(Cell Stem Cell),13:659-62,2013)設計了一種指導RNA,其將Cas9導向到單個鹼基突變,該突變在小鼠中引起白內障,其中它誘導DNA切割。然後,在突變小鼠中,使用針對接合子修復機制給予的另一種野生型等位基因或寡核苷酸(oligos)校正斷裂的等位基因的序列並且校正引起白內障的基因缺陷。
美國專利公開案號20120159653描述了使用鋅指核酸酶基因修飾與黃斑變性(MD)相關的細胞、動物以及蛋白質。黃斑變性(MD) 係老年人視力損害的主要原因,但也是兒童疾病如斯塔加特病(Stargardt disease)、索斯比基底營養不良(Sorsby fundus)、和兒童致死性神經變性疾病(在如嬰兒期一般年幼的年齡就開始)的標誌性症狀。由於對視網膜的損害,黃斑變性導致視野中心(黃斑)的視力喪失。當前存在的動物模型並未概括該疾病的主要標誌,因為它係在人類中觀察到的。包含編碼與MD相關的蛋白質的突變基因的可得到的動物模型也產生高度可變的表型,使得針對人類疾病和治療開發的翻譯係有問題的。
美國專利公開案號20120159653的一個方面包括編輯任何編碼與MD相關的蛋白質的染色體序列,該等序列可以應用於本發明核酸靶向系統。典型地,基於與MD相關的蛋白質與MD病症的實驗性關聯,選擇與MD相關的蛋白質。例如,相對於缺乏MD病症的群體,在具有MD病症的群體中,與MD相關的蛋白質的產生率或循環濃度可以升高或降低。可以使用蛋白質組技術評估蛋白質水平差異,包括但不限於西方墨點、免疫組織化學染色、酶聯免疫吸附測定(ELISA)以及質譜法。可替代地,可以使用基因組技術藉由獲得編碼該等蛋白質的基因的基因表現譜而鑒定與MD相關的蛋白質,包括但不限於DNA微陣列分析、基因表現系列分析(SAGE)以及定量即時聚合酶鏈式反應(Q-PCR)。
藉由非限制性實例的方式,與MD相關的蛋白質包括但不限以下蛋白質:(ABCA4)ATP結合盒,亞家族A(ABC1),成員4、ACHM1全色盲(視杆單色色盲)1、ApoE,脂蛋白E(ApoE)、C1QTNF5(CTRP5),C1q和腫瘤壞死因子相關蛋白5(C1QTNF5)、C2補體,補體2(C2)、C3補體,補體(C3)、CCL2,趨化因子(C-C模體)配位基2(CCL2)、CCR2, 趨化因子(C-C模體)受體2(CCR2)、CD36分化抗原簇36、CFB,補體受體B、CFH,補體因子CFHH、CFHR1,補體因子H相關1、CFHR3,補體因子H相關3、CNGB3環核苷酸閘控通道β3、CP血漿血漿銅藍蛋白(CP)、CRP,C反應蛋白(CRP)、CST3半胱胺酸蛋白酶抑制劑C或半胱胺酸蛋白酶抑制劑3(CST3)、CTSD,組織蛋白酶D(CTSD)、CX3CR1,趨化因子(C-X3-C模體)受體1、ELOVL4,超長鏈脂肪酸延伸4、ERCC6,切除修復交叉互補齧齒動物修復缺陷,互補群6、FBLN5,抗衰老蛋白-5,FBLN5,抗衰老蛋白5、FBLN6,抗衰老蛋白6FSCN2聚束蛋白(FSCN2)、HMCN1,半椎蛋白1,HMCN1,半椎蛋白1、HTRA1,HtrA絲胺酸肽酶1(HTRA1),HTRA1、HtrA絲胺酸肽酶1、IL-6,白細胞介素6、IL-8,白細胞介素8、LOC387715、假定蛋白、LEKHA1、含血小板白細胞C激酶底物同源性域家族A成員1(PLEKHA1)、PROM1,普羅敏蛋白(Prominin)1(PROM1或CD133)、PRPH2,外周蛋白-2RPGR色素性視網膜炎GTP酶調節劑、SERPING1,絲胺酸蛋白酶抑制劑肽酶抑制劑,支序群G,成員1(C1-抑制劑)、TCOF1,糖蜜TIMP3金屬蛋白酶抑制劑3(TIMP3)、TLR3 Toll樣受體3。
與MD相關的其染色體序列被編輯的蛋白質的一致性可以並且應該變化。在較佳的實施方式中,與其染色體序列被編輯的MD相關的蛋白質可以是ATP結合盒、由ABCR基因編碼的亞家族A(ABC1)成員4蛋白(ABCA4)、由APOE基因編碼的脂蛋白E蛋白(APOE)、由CCL2基因編碼的趨化因子(C-C模體)配位基2蛋白(CCL2)、由CCR2基因編碼的趨化因子(C-C模體)受體2蛋白(CCR2)、由CP基因編碼的血漿血 漿銅藍蛋白蛋白(CP)、由CTSD基因編碼的組織蛋白酶D蛋白(CTSD)、或由TIMP3基因編碼的金屬蛋白酶抑制劑3蛋白(TIMP3)。在一個示例性實施方式中,該遺傳修飾的動物係大鼠,並且與編碼與MD相關的蛋白質的編輯的染色體序列可以是:(ABCA4)ATP結合盒NM_000350亞家族A(ABC1)成員4、APOE脂蛋白ENM_138828(APOE)、CCL2趨化因子(C-C NM_031530模體)配位基2(CCL2)、CCR2趨化因子(C-C NM_021866模體)受體2(CCR2)、CP血漿血漿銅藍蛋白(CP)NM_012532、CTSD組織蛋白酶D(CTSD)NM_134334、TIMP3金屬蛋白酶NM_012886抑制劑3(TIMP3)。該動物或細胞可以包括1、2、3、4、5、6、7個或更多個破壞的編碼與MD相關的蛋白質的染色體序列以及零、1、2、3、4、5、6、7個或更多個編碼破壞的與MD相關的蛋白質的染色體整合序列。
編輯的或整合的染色體序列可以被修飾為編碼改變的與MD相關的蛋白質。MD相關染色體序列中的幾種突變已經與MD相關。在與MD相關的染色體序列中的突變的非限制性實例包括可引起MD的那些,包括在ABCR蛋白中的:E471K(即,在位置471的穀胺酸被改變為賴胺酸)、R1129L(即,在位置1129處的精胺酸被改變為亮胺酸)、T1428M(即,在位置1428處的蘇胺酸被改變為甲硫胺酸)、R1517S(即,在位置1517處的精胺酸被改變為絲胺酸)、I1562T(即,在位置1562處的異亮胺酸被改變為蘇胺酸)、以及G1578R(即,在位置1578處的甘胺酸被改變為精胺酸);在CCR2蛋白中的:V64I(即,在位置192處的纈胺酸被改變為異亮胺酸);在CP蛋白質中的:G969B(即,在位置969處的甘胺酸被 改變為天冬醯胺或天冬胺酸);在TIMP3蛋白中的:S156C(即,在位置156處的絲胺酸被改變為半胱胺酸)、G166C(即,在位置166處的甘胺酸被改變為半胱胺酸)、G167C(即,在位置167處的甘胺酸被改變為半胱胺酸)、Y168C(即,在位置168處的酪胺酸被改變為半胱胺酸)、S170C(即,在位置170處的絲胺酸被改變為半胱胺酸)、Y172C(即,在位置172處的酪胺酸被改變為半胱胺酸)以及S181C(即,在位置181處的絲胺酸被改變為半胱胺酸)。MD相關基因和疾病的遺傳變體的其他關聯在本領域係已知的。
治療循環系統和肌肉疾病
本發明還考慮了向心臟遞送本文描述的CRISPR-Cas系統,例如Cas9效應蛋白系統。對於心臟,心肌熱帶腺相關病毒(AAVM)較佳的,尤其是在心臟中顯示出優先基因轉移的AAVM41(參見,例如,林-揚加(Lin-Yanga)等人,PNAS,3月10日,2009年,第106卷,第10期)。給藥可以是全身性的或局部的。對於全身給藥可以考慮約1-10 x 1014個載體基因組的劑量。還參見,例如,艾拉裡奧(Eulalio)等人(2012)《自然》(Nature)492:376和索馬森達拉姆(Somasuntharam)等人(2013)《生物材料》(Biomaterials)34:7790。
例如,美國專利公開案號20110023139描述了使用鋅指核酸酶基因修飾與心血管疾病相關的細胞、動物以及蛋白質。心血管疾病通常包括高血壓、心臟病發作、心力衰竭、以及中風和TIA。涉及心血管疾病的任何染色體序列或由涉及心血管疾病的任何染色體序列編碼的蛋白質都可以在本揭露中描述的方法中加以利用。典型地,基於心血管相 關蛋白與心血管疾病的發展的實驗性關聯,選擇心血管相關蛋白。例如,相對於缺乏心血管障礙的群體,在具有心血管障礙的群體中,心血管相關蛋白的產生率或循環濃度可以升高或降低。可以使用蛋白質組技術評估蛋白質水平差異,包括但不限於西方墨點、免疫組織化學染色、酶聯免疫吸附測定(ELISA)以及質譜法。可替代地,可以使用基因組技術藉由獲得編碼該等蛋白質的基因的基因表現譜而鑒定心血管相關蛋白,包括但不限於DNA微陣列分析、基因表現系列分析(SAGE)以及定量即時聚合酶鏈式反應(Q-PCR)。
作為舉例,該染色體序列可以包括但不限於,IL1B(白細胞介素1,β)、XDH(黃嘌呤脫氫酶)、TP53(腫瘤蛋白p53)、PTGIS(前列腺素12(前列環素)合酶)、MB(肌紅蛋白)、IL4(白細胞介素4)、ANGPT1(血管生成素1)、ABCG8(ATP結合盒,亞家族G(白),成員8)、CTSK(組織蛋白酶K)、PTGIR(前列腺素12(前列環素)受體(IP))、KCNJ11(內向整流鉀通道,亞家族J,成員11)、INS(胰島素)、CRP(C反應蛋白,正五聚蛋白相關的)、PDGFRB(血小板源生長因子受體,β多肽)、CCNA2(細胞週期蛋白A2)、PDGFB(血小板源生長因子β多肽(猴肉瘤病毒(v-sis)癌基因同源物))、KCNJ5(內向整流鉀通道,亞家族J,成員5)、KCNN3(鉀中間小電導鈣活化通道,亞家族N,成員3)、CAPN10(卡配因10)、PTGES(前列腺素E合酶)、ADRA2B(腎上腺素能,α-2B-,受體)、ABCG5(ATP結合盒,亞家族G(WHITE)、成員5)、PRDX2(過氧化物氧化還原酶2)、CAPN5(卡配因5)、PARP14(聚(ADP-核糖)聚合酶家族,成員14)、MEX3C(mex-3同源物C(秀麗隱桿線蟲))、 ACE血管緊張素I轉化酶(肽基二肽酶A)1)、TNF(腫瘤壞死因子(TNF超家族,成員2))、IL6(白細胞介素6(干擾素,β2))、STN(抑制素)、SERPINE1(絲胺酸蛋白酶抑制蛋白肽酶抑制劑,支序群E(微管連接蛋白,血漿纖維溶素原活化物抑制劑1型)、成員1)、ALB(白蛋白)、ADIPOQ(脂聯素,含C1Q和膠原蛋白域)、APOB(脂蛋白B(包括Ag(x)抗原))、APOE(脂蛋白E)、LEP(瘦素)、MTHFR(5,10-亞甲基四氫葉酸還原酶(NADPH))、APOA1(脂蛋白A-I)、EDN1(內皮素1)、NPPB(利鈉肽先質B)、NOS3(一氧化氮合酶3(內皮細胞))、PPARG(過氧化物酶體增殖物活化受體γ)、PLAT(血漿纖維溶素原活化物,組織)、PTGS2(前列腺素內過氧化物合酶2(前列腺素G/H合酶和環加氧酶))、CETP(膽固醇酯轉移蛋白,血漿)、AGTR1(血管緊張素II受體,1型)、HMGCR(3-羥基-3-甲基戊二酸單醯輔酶A還原酶)、IGF1(胰島素樣生長因子1(生長素調節素C))、SELE(選滯蛋白E)、REN(腎素)、PPARA(過氧化物酶體增殖物活化受體α)、PON1(對氧磷酶1)、KNG1(激肽原1)、CCL2(趨化因子(C-C模體)配位基2)、LPL(脂蛋白脂酶)、VWF(馮‧維勒布蘭德因子)、F2(凝血因子II(凝血酶))、ICAM1(細胞間粘附分子1)、TGFB1(轉化生長因子,β1)、NPPA(利鈉肽先質A)、IL10(白細胞介素10)、EPO(促紅細胞生成素)、SOD1(超氧化物歧化酶1,可溶性)、VCAM1(血管細胞粘附分子1)、IFNG(干擾素,γ)、LPA(脂蛋白,Lp(a))、MPO(髓過氧化物酶)、ESR1(雌激素受體1)、MAPK1(絲裂原活化蛋白激酶1)、HP(血紅素結合素)、F3(凝血因子III(促凝血酶原激酶,組織因子))、CST3(半胱胺酸蛋白酶抑制劑C)、COG2(寡聚高基蛋複合體成分2)、MMP9(基質金屬肽酶9(明膠酶B,92kDa明膠酶, 92kDa IV型膠原酶))、SERPINC1(絲胺酸蛋白酶抑制蛋白肽酶抑制劑,支序群C(抗凝血酶)、成員1)、F8(凝血因子VIII,促凝血成分)、HMOX1(血紅素加氧酶(解環)1)、APOC3(脂蛋白C-III)、IL8(白細胞介素8)、PROK1(前動力蛋白1)、CBS(胱硫醚-β-合酶)、NOS2(一氧化氮合酶2,誘導型)、TLR4(toll樣受體4)、SELP(選滯蛋白P(顆粒膜蛋白140kDa,抗原CD62))、ABCA1(ATP結合盒,亞家族A(ABC1)、成員1)、AGT(血管緊張素原(絲胺酸蛋白酶抑制蛋白肽酶抑制劑,支序群A,成員8))、LDLR(低密度脂蛋白受體)、GPT(穀丙轉胺酶(丙胺酸轉胺酶))、VEGFA(血管內皮生長因子A)、NR3C2(細胞核受體亞家族3,型C,成員2)、IL18(白細胞介素18(干擾素-γ-誘導因子))、NOS1(一氧化氮合酶1(神經元的))、NR3C1(細胞核受體亞家族3,C組,成員1(糖皮質激素受體))、FGB(纖維蛋白原β鏈)、HGF(肝細胞生長因子(肝細胞生長因子A;分散因子))、IL1A(白細胞介素1,α)、RETN(抵抗素)、AKT1(v-akt鼠科胸腺瘤病毒癌基因同源物1)、LIPC(脂肪酶,肝臟的)、HSPD1(熱休克60kDa蛋白1(伴侶蛋白(chaperonin)))、MAPK14(絲裂原活化蛋白激酶14)、SPP1(分泌磷蛋白1)、ITGB3(整合素,β3(血小板糖蛋白111a,抗原CD61))、CAT(過氧化氫酶)、UTS2(尾加壓素2)、THBD(血栓調節蛋白)、F10(凝血因子X)、CP(血漿血漿銅藍蛋白(亞鐵氧化酶))、TNFRSF11B(腫瘤壞死因子受體超家族,成員11b)、EDNRA(內皮素A型受體)、EGFR(表皮生長因子受體(紅白血病病毒(v-erb-b)癌基因同源物,鳥類的))、MMP2(基質金屬肽酶2(明膠酶A,72kDa明膠酶,72kDa IV型膠原酶))、PLG(纖維蛋白溶酶原)、NPY(神經肽Y)、RHOD(ras同源物基因家族,成員D)、MAPK8(絲裂原活化蛋白激 酶8)、MYC(V-Myc骨髓細胞瘤病毒癌基因同源物(鳥類的))、FN1(纖網蛋白1)、CMA1(凝乳酶1,肥大細胞)、PLAU(血漿纖維溶素原活化物,尿激酶)、GNB3(鳥嘌呤核苷酸結合蛋白(G蛋白)、β多肽3)、ADRB2(腎上腺素能,β-2-,受體,表面)、APOA5(脂蛋白A-V)、SOD2(超氧化物歧化酶2,線粒體的)、F5(凝血因子V(促凝血球蛋白原,不穩定因子))、VDR(維生素D(1,25-二羥維生素D3)受體)、ALOX5(花生四烯酸鹽5-脂氧合酶)、HLA-DRB1(主要組織相容性複合物,I類I,DRβ1)、PARP1(聚(ADP-核糖)聚合酶1)、CD40LG(CD40配位基)、PON2(對氧磷酶2)、AGER(晚期糖基化終末產物特異性受體)、IRS1(胰島素受體底物1)、PTGS1(前列腺素內過氧化物合酶1(前列腺素G/H合酶和環加氧酶))、ECE1(內皮素轉化酶1)、F7(凝血因子VII(血清凝血酶原轉變加速因子))、URN(白細胞介素1受體拮抗劑)、EPHX2(環氧化物水解酶2,細胞質的)、IGFBP1(胰島素樣生長因子結合蛋白1)、MAPK10(絲裂原活化蛋白激酶10)、FAS(Fas(TNF受體超家族,成員6))、ABCB1(ATP結合盒,亞家族B(MDR/TAP),成員1)、JUN(jun癌基因)、IGFBP3(胰島素樣生長因子結合蛋白3)、CD14(CD14分子)、PDE5A(磷酸二酯酶5A,cGMP特異性)、AGTR2(血管緊張素II受體,2型)、CD40(CD40分子,TNF受體超家族成員5)、LCAT(卵磷脂膽固醇醯基轉移酶)、CCR5(趨化因子(C-C模體)受體5)、MMP1(基質金屬肽酶1(間質膠原酶))、TIMP1(TIMP金屬肽酶抑制劑1)、ADM(腎上腺髓質素)、DYT10(肌張力障礙10)、STAT3(傳訊和轉錄活化蛋白3(急性期反應因子))、MMP3(基質金屬肽酶3(基質溶解素1,前白明膠酶))、ELN(彈性蛋白)、USF1(上游轉錄因子1)、CFH(補體因子H)、HSPA4(熱休克70kDa蛋白4)、 MMP12(基質金屬肽酶12(巨噬細胞彈性蛋白酶))、MME(膜金屬肽鏈內切酶)、F2R(凝血因子II(凝血酶)受體)、SELL(選滯蛋白L)、CTSB(組織蛋白酶B)、ANXA5(膜聯蛋白(annexin)A5)、ADRB1(腎上腺素能,β-1-,受體)、CYBA(細胞色素b-245,α多肽)、FGA(纖維蛋白原α鏈)、GGT1(γ-穀胺醯轉肽酶1)、LIPG(脂肪酶,內皮的)、HIF1A(缺氧誘導因子1,α亞基(鹼性-螺旋-環-螺旋轉錄因子))、CXCR4(趨化因子(C-X-C模體)受體4)、PROC(蛋白C(凝血因子Va和VIIIa抑制蛋白)、SCARB1(清道夫受體B類,成員1)、CD79A(CD79a分子,免疫球蛋白相關α)、PLTP(磷脂轉移蛋白)、ADD1(內收蛋白1(α))、FGG(纖維蛋白原γ鏈)、SAA1(血清澱粉樣蛋白A1)、KCNH2(電壓閘控鉀離子通道,亞家族H(觸角電位相關(eag-related))、成員2)、DPP4(二肽基肽酶4)、G6PD(6-磷酸葡萄糖脫氫酶)、NPR1(鈉尿肽受體A/鳥苷酸環化酶A(心房鈉尿肽受體A))、VTN(玻連蛋白(vitronectin))、KIAA0101(KIAA0101)、FOS(FBJ鼠科骨肉瘤病毒癌基因同源物)、TLR2(toll樣受體2)、PPIG(肽基脯胺醯異構酶G(親環素(cyclophilin)G))、IL1R1(白細胞介素1受體,I型)、AR(雄激素受體)、CYP1A1(細胞色素P450,家族1,亞家族A,多肽1)、SERPINA1(絲胺酸蛋白酶抑制蛋白肽酶抑制劑,支序群A(α-1抗蛋白酶,抗胰蛋白酶),成員1)、MTR(5-甲基四氫葉酸高半胱胺酸甲基轉移酶)、RBP4(視黃醇結合蛋白4,血漿)、APOA4(脂蛋白A-IV)、CDKN2A(細胞週期蛋白依賴性激酶抑制劑2A(黑素瘤p16,抑制CDK4))、FGF2(成纖維細胞生長因子2(鹼性))、EDNRB(內皮素受體B型)、ITGA2(整合素,α2(CD49B,VLA-2受體α2亞基))、CABIN1(鈣調神經磷酸酶結合蛋白1)、SHBG(性激素 結合球蛋白)、HMGB1(高遷移率族1)、HSP90B2P(熱休克蛋白90kDa β(Grp94),成員2(假基因))、CYP3A4(細胞色素P450,家族3,亞家族A,多肽4)、GJA1(間隙連接蛋白,α1,43kDa)、CAV1(小窩蛋白1,細胞質膜微囊蛋白,22kDa)、ESR2(雌激素受體2(ER β))、LTA(淋巴毒素α(TNF超家族,成員1))、GDF15(生長分化因子15)、BDNF(腦源性神經營養因子)、CYP2D6(細胞色素P450,家族2,亞家族D,多肽6)、NGF(神經生長因子(β多肽))、SP1(Sp1轉錄因子)、TGIF1(TGFB-誘導因子同源框1)、SRC(v-src肉瘤(施密特-魯平(Schmidt-Ruppin)A-2)病毒癌基因同源物(鳥類的))、EGF(表皮生長因子(β-抑胃素))、PIK3CG(磷酸肌醇-3-激酶,催化的,γ多肽)、HLA-A(主要組織相容性複合物,I類,A)、KCNQ1(電壓閘控鉀通道,KQT樣亞家族,成員1)、CNR1(大麻素受體1(腦))、FBN1(微纖維蛋白1)、CHKA(膽鹼激酶α)、BEST1(卵黃狀黃斑病蛋白1)、APP(澱粉樣蛋白β(A4)先質蛋白)、CTNNB1(連環蛋白(鈣粘著蛋白關聯蛋白),β1,88kDa)、IL2(白細胞介素2)、CD36(CD36分子(凝血酶敏感蛋白受體))、PRKAB1(蛋白激酶,AMP活化的,β1非催化亞基)、TPO(甲狀腺過氧化物酶)、ALDH7A1(醛脫氫酶7家族,成員A1)、CX3CR1(趨化因子(C-X3-C模體)受體1)、TH(酪胺酸羥化酶)、F9(凝血因子IX)、GH1(生長激素1)、TF(轉鐵蛋白)、HFE(血色素沈著病)、IL17A(白細胞介素17A)、PTEN(磷酸酯酶與張力蛋白同源物)、GSTM1(穀胱甘肽S-轉移酶μ1)、DMD(肌營養不良蛋白)、GATA4(GATA結合蛋白4)、F13A1(凝血因子XIII,A1多肽)、TTR(轉甲狀腺素蛋白)、FABP4(脂肪酸結合蛋白4,脂肪細胞)、PON3(對氧磷酶3)、APOC1(脂蛋白C-I)、INSR(胰島素受體)、TNFRSF1B (腫瘤壞死因子受體超家族,成員1B)、HTR2A(5-羥色胺(血清素)受體2A)、CSF3(集落刺激因子3(粒細胞))、CYP2C9(細胞色素P450,家族2,亞家族C,多肽9)、TXN(硫氧還蛋白(thioredoxin))、CYP11B2(細胞色素P450,家族11,亞家族B,多肽2)、PTH(甲狀旁腺素、CSF2(集落刺激因子2(粒細胞-巨噬細胞))、KDR(激酶插入結構域受體受體(III型受體酪胺酸激酶))、PLA2G2A(磷脂酶A2,型IIA(血小板,滑液))、B2M(β-2-微球蛋白)、THBS1(凝血酶敏感蛋白1)、GCG(胰高血糖素)、RHOA(ras同源物基因家族,成員A)、ALDH2(醛脫氫酶2家族(線粒體的))、TCF7L2(轉錄因子7樣2(T細胞特異性HMG盒))、BDKRB2(緩激肽受體B2)、NFE2L2(紅細胞衍生核因子2樣蛋白)、NOTCH1(Notch同源物1,易位相關的(果蠅))、UGT1A1(UDP葡糖醛酸基轉移酶1家族,多肽A1)、IFNA1(干擾素,α1)、PPARD(過氧化物酶體增殖物活化受體δ)、SIRT1(長壽蛋白(沈默交配型資訊調控2同源物)1(釀酒酵母))、GNRH1(促性腺素釋放激素1(黃體生成素釋放激素))、PAPPA(妊娠相關血漿蛋白A,冠毛素1)、ARR3(抑制蛋白3,視網膜的(X-抑制蛋白))、NPPC(利鈉肽先質C)、AHSP(α血紅蛋白穩定蛋白)、PTK2(PTK2蛋白酪胺酸激酶2)、IL13(白細胞介素13)、MTOR(雷帕黴素機械靶(絲胺酸/蘇胺酸激酶))、ITGB2(整合素,β2(補體成分3受體3和4亞基))、GSTT1(穀胱甘肽S-轉移酶θ1)、IL6ST(白細胞介素6傳訊因子(gp130,抑瘤素M受體))、CPB2(羧肽酶B2(血漿))、CYP1A2(細胞色素P450,家族1,亞家族A,多肽2)、HNF4A(肝細胞核因子4,α)、SLC6A4(溶質載體家族6(神經遞質轉運蛋白,血清素),成員4)、PLA2G6(磷脂酶A2,型VI(細胞溶質的,鈣依賴性))、 TNFSF11(腫瘤壞死因子(配位基)超家族,成員11)、SLC8A1(溶質載體家族8(鈉/鈣交換蛋白),成員1)、F2RL1(凝血因子II(凝血酶)受體樣1)、AKR1A1(醛酮還原酶家族1,成員A1(醛還原酶))、ALDH9A1(醛脫氫酶9家族,成員A1)、BGLAP(骨γ-羧穀胺酸(gla)蛋白)、MTTP(微粒體甘油三酯轉移蛋白)、MTRR(5-甲基四氫葉酸-高半胱胺酸甲基轉移酶還原酶)、SULT1A3(磺基轉移酶家族,細胞溶質的,1A,酚較佳,成員3)、RAGE(腎腫瘤抗原)、C4B(補體成分4B(奇都血型)、P2RY12(嘌呤能受體P2Y,G-蛋白偶聯的,12)、RNLS(腎酶,FAD依賴性胺氧化酶)、CREB1(cAMP應答元件結合蛋白1)、POMC(前腦啡黑細胞促素皮促素)、RAC1(ras相關C3肉毒毒素底物1(rho家族,小GTP結合蛋白Rac1))、LMNA(核纖層蛋白NC)、CD59(CD59分子,補體調節蛋白)、SCN5A(鈉通道,電壓閘控,V型,α亞基)、CYP1B1(細胞色素P450,家族1,亞家族B,多肽1)、MIF(巨噬細胞遊走抑制蛋白(糖基化抑制蛋白))、MMP13(基質金屬肽酶13(膠原酶3))、TIMP2(TIMP金屬肽酶抑制劑2)、CYP19A1(細胞色素P450,家族19,亞家族A,多肽1)、CYP21A2(細胞色素P450,家族21,亞家族A,多肽2)、PTPN22(蛋白酪胺酸磷酸酶,非受體型22(淋巴樣))、MYH14(肌球蛋白,重鏈14,非肌肉)、MBL2(甘露糖結合凝集素(蛋白C)2,可溶性(調理素缺陷))、SELPLG(選滯蛋白P配位基)、AOC3(胺氧化酶,含銅3(血管粘附蛋白1))、CTSL1(組織蛋白酶L1)、PCNA(增殖細胞核抗原)、IGF2(胰島素樣生長因子2(生長素調節素A))、ITGB1(整合素,β1(纖網蛋白受體,β多肽,抗原CD29包括MDF2,MSK12))、CAST(鈣蛋白酶抑制蛋白)、CXCL12(趨化因子(C-X-C模體)配位基12(基質 細胞衍生因子1))、IGHE(免疫球蛋白恒定區ε)、KCNE1(電壓閘控鉀通道,Isk相關家族,成員1)、TFRC(轉鐵蛋白受體(p90,CD71))、COL1A1(膠原,I型,α1)、COL1A2(膠原,I型,α2)、IL2RB(白細胞介素2受體,β)、PLA2G10(磷脂酶A2,型X)、ANGPT2(血管生成素2)、PROCR(蛋白C受體,內皮的(EPCR))、NOX4(NADPH氧化酶4)、HAMP(海帕西啶抗微生物肽)、PTPN11(蛋白酪胺酸磷酸酶,非受體類型11)、SLC2A1(溶質載體家族2(易化葡萄糖轉運蛋白),成員1)、IL2RA(白細胞介素2受體,α)、CCL5(趨化因子(C-C模體)配位基5)、IRF1(干擾素調節因子1)、CFLAR(CASP8和FADD樣凋亡調節因子)、CALCA(降鈣素相關多肽α)、EIF4E(真核翻譯起始因子4E)、GSTP1(穀胱甘肽S-轉移酶pi 1)、JAK2(Janus激酶2)、CYP3A5(細胞色素P450,家族3,亞家族A,多肽5)、HSPG2(類肝素硫酸蛋白聚糖2)、CCL3(趨化因子(C-C模體)配位基3)、MYD88(髓性分化原發反應基因(88))、VIP(血管活性腸肽)、SOAT1(固醇O-醯基轉移酶1)、ADRBK1(腎上腺素能,β,受體激酶1)、NR4A2(細胞核受體亞家族4,型A,成員2)、MMP8(基質金屬肽酶8(中性白細胞膠原酶))、NPR2(鈉尿肽受體B/鳥苷酸環化酶B(心房鈉尿肽受體B))、GCH1(GTP環化水解酶1)、EPRS(穀胺醯-脯胺醯-tRNA合成酶)、PPARGC1A(過氧化物酶體增殖物活化受體γ,共活化劑1 α)、F12(凝血因子XII(哈格曼因子))、PECAM1(血小板/內皮細胞粘附分子)、CCL4(趨化因子(C-C模體)配位基4)、SERPINA3(絲胺酸蛋白酶抑制蛋白肽酶抑制劑,支序群A(α-1抗蛋白酶,抗胰蛋白酶),成員3)、CASR(鈣傳感受體)、GJA5(間隙連接蛋白,α5,40kDa)、FABP2(脂肪酸結合蛋白2,腸)、TTF2(轉錄終止因子,RNA聚 合酶II)、PROS1(蛋白S(α))、CTF1(心臟營養素1)、SGCB(肌聚糖,β(43kDa肌營養不良蛋白相關糖蛋白))、YME1L1(YME1樣1(釀酒酵母))、CAMP(卡色力西丁(cathelicidin)抗微生物肽)、ZC3H12A(含鋅指CCCH型12A)、AKR1B1(醛酮還原酶家族1,成員B1(醛糖還原酶))、DES(結蛋白)、MMP7(基質金屬肽酶7(基質溶解因子,子宮的))、AHR(芳香烴受體)、CSF1(集落刺激因子1(巨噬細胞))、HDAC9(組蛋白去乙醯化酶9)、CTGF(結締組織生長因子)、KCNMA1(大電導鈣活化鉀通道,亞家族M,α成員1)、UGT1A(UDP葡糖醛酸基轉移酶1家族,多肽A複合體座位)、PRKCA(蛋白激酶C,α)、COMT(兒茶酚-β-甲基轉移酶)、S100B(S100鈣結合蛋白B)、EGR1(早期生長反應蛋白1)、PRL(催乳素)、IL15(白細胞介素15)、DRD4(多巴胺受體D4)、CAMK2G(鈣-鈣調蛋白依賴性蛋白激酶II γ)、SLC22A2(溶質載體家族22(有機陽離子轉運蛋白),成員2)、CCL11(趨化因子(C-C模體)配位基11)、PGF(B321胎盤生長因子)、THPO(血小板生成素)、GP6(糖蛋白VI(血小板))、TACR1(速激肽受體1)、NTS(神經降壓肽)、HNF1A(HNF1同源框A)、SST(生長抑素)、KCND1(電壓閘控鉀通道,Shal相關亞家族,成員1)、LOC646627(磷脂酶抑制劑)、TBXAS1(血栓烷A合酶1(血小板))、CYP2J2(細胞色素P450,家族2,亞家族J,多肽2)、TBXA2R(血栓烷A2受體)、ADH1C(醇脫氫酶1C(I類),γ多肽)、ALOX12(花生四烯酸鹽12-脂氧合酶)、AHSG(α-2-HS-糖蛋白)、BHMT(甜菜鹼同型半胱胺酸甲基轉移酶)、GJA4(間隙連接蛋白,α 4,37kDa)、SLC25A4(溶質載體家族25(線粒體載體;腺嘌呤核苷酸轉運蛋白),成員4)、ACLY(ATP檸檬酸裂合酶)、ALOX5AP(花生四烯酸鹽 5-脂氧合酶-活化蛋白)、NUMA1(核有絲分裂器蛋白1)、CYP27B1(細胞色素P450,家族27,亞家族B,多肽1)、CYSLTR2(半胱胺醯白三烯受體2)、SOD3(超氧化物歧化酶3,細胞外的)、LTC4S(白三烯C4合酶)、UCN(尿皮質素)、GHRL(胃促生長素/肥胖抑制素先質肽)、APOC2(脂蛋白C-II)、CLEC4A(C型凝集素結構域家族4,成員A)、KBTBD10(Kelch重複和BTB(POZ)域包含蛋白)、TNC(腱生蛋白(tenascin)C)、TYMS(胸苷酸合成酶)、SHC1(SHC(含Src同源物2域)轉化蛋白1)、LRP1(低密度脂蛋白受體相關蛋白1)、SOCS3(細胞因子傳訊抑制蛋白3)、ADH1B(醇脫氫酶1B(I類),β多肽)、KLK3(激肽釋放酶相關肽酶3)、HSD11B1(羥基固醇(11-β)脫氫酶1)、VKORC1(生素K環氧化物還原酶複合體,亞基1)、SERPINB2(絲胺酸蛋白酶抑制蛋白肽酶抑制劑,支序群B(卵清蛋白),成員2)、TNS1(張力蛋白1)、RNF19A(環指蛋白9A)、EPOR(促紅細胞生成素受體)、ITGAM(整合素,αM(補體成分3受體3亞基))、PITX2(配對樣同源域2)、MAPK7(絲裂原活化蛋白激酶7)、FCGR3A(IgG的Fc片段,低親和力111a,受體(CD16a))、LEPR(瘦素受體)、ENG(內皮糖蛋白)、GPX1(穀胱甘肽過氧化酶1)、GOT2(穀草轉胺酶2,線粒體(天冬胺酸胺基轉移酶2))、HRH1(組胺受體H1)、NR112(細胞核受體亞家族1,型I,成員2)、CRH(促腎上腺皮質素釋放激素)、HTR1A(5-羥色胺(血清素)受體1A)、VDAC1(電壓依賴性陰離子通道1)、HPSE(類肝素酶)、SFTPD(表面活性蛋白D)、TAP2(轉運蛋白2,ATP結合盒,亞家族B(MDR/TAP))、RNF123(環指蛋白123)、PTK2B(PTK2B蛋白酪胺酸激酶2 β)、NTRK2(神經營養酪胺酸激酶,受體,2型)、IL6R(白細胞介素6受體)、ACHE(乙醯膽鹼酯酶(Yt血型))、 GLP1R(胰高血糖素樣肽1受體)、GHR(生長激素受體)、GSR(穀胱甘肽還原酶)、NQO1(NAD(P)H脫氫酶,醌1)、NR5A1(細胞核受體亞家族5,型A,成員1)、GJB2(間隙連接蛋白,β2,26kDa)、SLC9A1(溶質載體家族9(鈉/氫交換體)、成員1)、MAOA(單胺氧化酶A)、PCSK9(前蛋白轉化酶枯草桿菌蛋白酶/kexin 9型)、FCGR2A(IgG的Fc片段,低親和力IIa,受體(CD32))、SERPINF1(絲胺酸蛋白酶抑制蛋白肽酶抑制劑,支序群F(α-2抗纖維蛋白溶酶,色素上皮衍生因子),成員1)、EDN3(內皮素3)、DHFR(二氫葉酸還原酶)、GAS6(生長停滯特異蛋白6)、SMPD1(鞘磷脂磷酸二酯酶1,酸溶酶體)、UCP2(解偶聯蛋白2(線粒體的,質子載體))、TFAP2A(轉錄因子AP-2 α(活化增強子結合蛋白2 α))、C4BPA(補體成分4結合蛋白,α)、SERPINF2(絲胺酸蛋白酶抑制蛋白肽酶抑制劑,支序群F(α-2抗纖維蛋白溶酶,色素上皮衍生因子),成員2)、TYMP(胸苛酸磷酸化酶)、ALPP(鹼性磷酸酶,胎盤的(Regan同工酶))、CXCR2(趨化因子(C-X-C模體)受體2)、SLC39A3(溶質載體家族39(鋅轉運蛋白)、成員3)、ABCG2(ATP結合盒,亞家族G(WHITE)、成員2)、ADA(腺苷脫胺酶)、JAK3(Janus激酶3)、HSPA1A(熱休克70kDa蛋白1A)、FASN(脂肪酸合酶)、FGF1(成纖維細胞生長因子1(酸性))、F11(凝血因子XI)、ATP7A(ATP酶,Cu++轉運的,α多肽)、CR1(補體成分(3b/4b)受體1(Knops血型))、GFAP(膠質細胞原纖維酸性蛋白)、ROCK1(Rho相關,含捲曲螺旋蛋白激酶1)、MECP2(甲基CpG結合蛋白2(雷特氏症候群))、MYLK(肌球蛋白輕鏈激酶)、BCHE(丁醯膽鹼酯酶)、LIPE(脂肪酶,激素敏感的)、PRDX5(過氧化物氧化還原酶5)、ADORA1(腺苷A1受體)、WRN(維爾納綜 合症,RecQ解旋酶樣)、CXCR3(趨化因子(C-X-C模體)受體3)、CD81(CD81分子)、SMAD7(SMAD家族成員7)、LAMC2(層連結蛋白,γ2)、MAP3K5(絲裂原活化蛋白激酶激酶激酶5)、CHGA(染色顆粒素A(甲狀旁腺分泌蛋白1))、IAPP(胰島澱粉樣蛋白多肽)、RHO(視紫紅質)、ENPP1(外核苷酸焦磷酸酶/磷酸二酯酶1)、PTHLH(甲狀旁腺激素樣激素)、NRG1(神經調節蛋白1)、VEGFC(血管內皮生長因子C)、ENPEP(穀胺醯基胺肽酶(胺基肽酶A))、CEBPB(CCAAT/增強子結合蛋白(C/EBP),β)、NAGLU(N-乙醯胺基葡糖苷酶,α-)、F2RL3(凝血因子II(凝血酶)受體樣3)、CX3CL1(趨化因子(C-X3-C模體)配位基1)、BDKRB1(緩激肽受體B1)、ADAMTS13(具有凝血酶敏感蛋白1型模體的ADAM金屬肽酶,13)、ELANE(彈性蛋白酶,嗜中性粒細胞表現的)、ENPP2(外核苷酸焦磷酸酶/磷酸二酯酶2)、CISH(細胞因子誘導的含SH2的蛋白)、GAST(胃泌素)、MYOC(肌纖蛋白,小梁網可誘導糖皮質激素應答)、ATP1A2(ATP酶,Na+/K+轉運的,α2多肽)、NF1(神經纖維瘤蛋白1)、GJB1(間隙連接蛋白,β1,32kDa)、MEF2A(肌細胞增強因子2A)、VCL(紐蛋白)、BMPR2(骨形態發生蛋白受體,II型(絲胺酸/蘇胺酸激酶))、TUBB(微管蛋白,β)、CDC42(細胞分裂週期42(GTP結合蛋白,25kDa))、KRT18(角蛋白18)、HSF1(熱休克轉錄因子1)、MYB(v-myb成髓細胞瘤病毒癌基因同源物(鳥類))、PRKAA2(蛋白激酶,AMP活化的,α2催化亞基)、ROCK2(Rho關聯含捲曲螺旋蛋白激酶2)、TFPI(組織因子途徑抑制物(脂蛋白相關凝血抑制劑))、PRKG1(蛋白激酶,cGMP依賴性,I型)、BMP2(骨形態發生蛋白2)、CTNND1(連環蛋白(鈣粘著蛋白關聯蛋白),δ1)、CTH(胱 硫醚酶(胱硫醚γ-裂解酶))、CTSS(組織蛋白酶S)、VAV2(vav 2鳥苷酸交換因子)、NPY2R(神經肽Y受體Y2)、IGFBP2(胰島素樣生長因子結合蛋白2,36kDa)、CD28(CD28分子)、GSTA1(穀胱甘肽S-轉移酶α1)、PPIA(肽基脯胺醯異構酶A(親環素A))、APOH(脂蛋白H(β-2-糖蛋白I))、S100A8(S100鈣結合蛋白A8)、IL11(白細胞介素11)、ALOX15(花生四烯酸鹽15-脂氧合酶)、FBLN1(腓骨蛋白1)、NR1H3(細胞核受體亞家族1,型H,成員3)、SCD(硬脂醯基-輔酶A去飽和酶(△-9-去飽和酶))、GIP(抑胃多肽)、CHGB(染色顆粒素B(分泌粒蛋白1))、PRKCB(蛋白激酶C,β)、SRD5A1(類固醇-5-α還原酶α多肽1(3-氧代-5 α-類固醇δ4-脫氫酶α1))、HSD11B2(羥基固醇(11-β)脫氫酶2)、CALCRL(降鈣素受體樣)、GALNT(UDP-N-乙醯基-α-D-半乳糖胺:多肽N-乙醯半乳糖胺基轉移酶2(GalNAc-T2))、ANGPTL4(血管生成素樣4)、KCNN4(鉀中間/小電導鈣活化通道,亞家族N,成員4)、PIK3C2A(磷酸肌醇-3-激酶,2類,α多肽)、HBEGF(肝素結合EGF樣生長因子)、CYP7A1(細胞色素P450,家族7,亞家族A,多肽1)、HLA-DRB5(主要組織相容性複合物,II類,DR β5)、BNIP3(BCL2/腺病毒E1B 19kDa相互作用蛋白3)、GCKR(葡糖激酶(己糖激酶4)調節蛋白)、S100A12(S100鈣結合蛋白A12)、PADI4(肽基精胺酸脫亞胺酶,IV型)、HSPA14(熱休克70kDa蛋白14)、CXCR1(趨化因子(C-X-C模體)受體1)、H19(H19,母系印記表現轉錄物(非蛋白質編碼))、KRTAP19-3(角蛋白關聯蛋白19-3)、IDDM2(胰島素依賴型糖尿病2)、RAC2(ras相關C3肉毒毒素底物2(rho家族,小GTP結合蛋白Rac2))、RYR1(蘭尼鹼受體1(骨骼))、CLOCK(clock同源物(小鼠))、NGFR(神經生長因子受體(TNFR 超家族,成員16))、DBH(多巴胺β-羥化酶(多巴胺β-單加氧酶))、CHRNA4(膽鹼能受體,煙鹼的,α4)、CACNA1C(鈣通道,電壓依賴性,L型,α1C亞基)、PRKAG2(蛋白激酶,AMP活化的,γ 2非催化亞基)、CHAT(膽鹼乙醯轉移酶)、PTGDS(前列腺素D2合酶21kDa(腦))、NR1H2(細胞核受體亞家族1,型H,成員2)、TEK(TEK酪胺酸激酶,內皮的)、VEGFB(血管內皮生長因子B)、MEF2C(肌細胞增強因子2C)、MAPKAPK2(絲裂原活化的蛋白激酶活化的蛋白激酶2)、TNFRSF11A(腫瘤壞死因子受體超家族,成員11a,NFKB活化劑)、HSPA9(熱休克70kDa蛋白9(致死蛋白))、CYSLTR1(半胱胺醯白三烯受體1)、MAT1A(甲硫胺酸腺苷轉移酶I,α)、OPRL1(阿片受體樣1)、IMPA1(肌醇(肌肉)-1(或4)-單磷酸酶1)、CLCN2(氯通道2)、DLD(二氫硫辛醯胺脫氫酶)、PSMA6(蛋白酶體(先質,巨蛋白因子)亞基,α型,6)、PSMB8(蛋白酶體(先質,巨蛋白因子)亞基,β型,8(大型多功能肽酶7))、CHI3L1(殼多糖酶3樣1(軟骨糖蛋白-39))、ALDH1B1(醛脫氫酶1家族,成員B1)、PARP2(聚(ADP-核糖)聚合酶2)、STAR(類固醇生成性急性期調節蛋白)、LBP(脂多糖結合蛋白)、ABCC6(ATP結合盒,亞家族C(CFTR/MRP),成員6)、RGS2(G蛋白傳訊調節因子2,24kDa)、EFNB2(肝配蛋白-B2)、GJB6(間隙連接蛋白,β6,30kDa)、APOA2(脂蛋白A-II)、AMPD1(腺苷單磷酸脫胺酶1)、DYSF(迪斯弗林(dysferlin),肢帶型肌營養不良2B(常染色體隱性))、FDFT1(法呢醯二磷酸酯法呢醯基轉移酶1)、EDN2(內皮素2)、CCR6(趨化因子(C-C模體)受體6)、GJB3(間隙連接蛋白,β3,31kDa)、IL1RL1(白細胞介素1受體樣1)、ENTPD1(外核苷三磷酸二磷酸水解酶1)、BBS4(巴- 比二氏綜合症(Bardet-Biedl syndrome)4)、CELSR2(鈣粘著蛋白,EGF LAG七經G型受體2(火烈鳥同源物,果蠅))、F11R(F11受體)、RAPGEF3(Rap鳥苷酸交換因子(GEF)3)、HYAL1(透明質酸葡糖胺酶1)、ZNF259(鋅指蛋白259)、ATOX1(ATX1抗氧化劑蛋白1同源物(酵母))、ATF6(活化轉錄因子6)、KHK(已酮糖激酶(果糖激酶))、SAT1(亞精胺/精胺N1-乙醯轉移酶1)、GGH(γ-穀胺醯水解酶(結合酶,葉醯聚γ穀胺醯水解酶))、TIMP4(TIMP金屬肽酶抑制劑4)、SLC4A4(溶質載體家族4,碳酸氫鈉協同轉運蛋白,成員4)、PDE2A(磷酸二酯酶2A,cGMP刺激的)、PDE3B(磷酸二酯酶3B,cGMP抑制的)、FADS1(脂肪酸去飽和酶1)、FADS2(脂肪酸去飽和酶2)、TMSB4X(胸腺素β4,X連鎖的)、TXNIP(硫氧還蛋白相互作用蛋白)、LIMS1(LIM和衰老細胞抗原樣域1)、RHOB(ras同源物基因家族,成員B)、LY96(淋巴細胞抗原96)、FOXO1(叉頭框O1)、PNPLA2(含Patatin樣磷脂酶域2)、TRH(促甲狀腺激素釋放激素)、GJC1(間隙連接蛋白,γ 1,45kDa)、SLC17A5(溶質載體家族17(陰離子/糖轉運蛋白),成員5)、FTO(脂肪量和肥胖相關)、GJD2(間隙連接蛋白,δ2,36kDa)、PSRC1(富含脯胺酸/絲胺酸捲曲螺旋蛋白1)、CASP12(半胱天冬酶12(基因/假基因))、GPBAR1(G蛋白耦聯膽汁酸受體1)、PXK(含PX域絲胺酸/蘇胺酸激酶)、IL33(白細胞介素33)、TRIB1(tribbles同源物1(果蠅))、PBX4(前B細胞白血病同源框4)、NUPR1(核蛋白,轉錄調節子,1)、15-Sep(15kDa硒蛋白)、CILP2(軟骨中間層蛋白2)、TERC(端粒酶RNA組分)、GGT2(γ-穀胺醯轉肽酶2)、MT-CO1(線粒體編碼細胞色素c氧化酶I)、以及UOX(尿酸氧化酶,假基因)。該等序列中的任何序列可以是對於該CRISPR-Cas 系統的靶標,例如以解決突變。
在另一個實施方式中,該染色體序列可以進一步選自Pon1(對氧磷酶1)、LDLR(LDL受體)、ApoE(脂蛋白E)、Apo B-100(脂蛋白B-100)、ApoA(脂蛋白(a))、ApoA1(脂蛋白A1)、CBS(胱硫醚(Cystathione)B-合酶)、糖蛋白IIb/IIb、MTHRF(5,10-亞甲基四氫葉酸還原酶(NADPH)、及其組合。在一次反覆運算中,該等染色體序列和由涉及心血管疾病的染色體序列編碼的蛋白質可以選自CacnalC、Sod1、Pten、Ppar(α)、Apo E、瘦素、及其組合,作為對於該CRISPR-Cas系統的靶標。
治療肝臟和腎臟的疾病
本發明還考慮了向肝臟和/或腎臟遞送本文描述的CRISPR-Cas系統,例如Cas9效應蛋白系統。誘導治療性核酸的細胞攝取的遞送策略包括物理力或載體系統,如基於病毒、脂質或複合體的遞送、或奈米載體。根據具有較低可能的臨床相關性的最初應用,當以全身性流體動力高壓注射將核酸定址(addressed)於腎細胞時,許多種基因治療性病毒和非病毒載體已經被應用於體內靶向不同的動物腎臟疾病模型中的轉錄後事件(Csaba Révész和Péter Hamar(2011)。“靶向腎臟中的RNA的遞送方法”(Delivery Methods to Target RNAs in the Kidney),《基因治療應用》(Gene Therapy Applications),康春生教授(Prof.Chunsheng Kang)(編輯),ISBN:978-953-307-541-9,印天科技(InTech),可獲自:http://www.intechopen.com/books/gene-therapy-applications/delivery-methods-to-target-rnas-in-the-kidney)。遞送至腎臟的方法可以包括以下文獻中描 述的那些,袁(Yuan)等人(《美國生理學-腎臟生理學雜誌》(Am J Physiol Renal Physiol)295:F605-F617,2008)研究了在注射鏈佐黴素的1型糖尿病小鼠模型中體內遞送靶向花生四烯酸代謝的12/15-脂氧合酶(12/15-LO)途徑的小干擾RNA(siRNA)是否能夠改善腎損傷和糖尿病腎病(DN)。為了實現更好的體內通路以及在腎臟中的siRNA表現,袁(Yuan)等人使用與膽固醇結合的雙股12/15-LO siRNA寡核苷酸。將約400μg的siRNA皮下注射到小鼠中。袁(Yuang)等人的方法可應用於本發明的CRISPR Cas系統,其中考慮將1-2g的與膽固醇結合的CRISPR Cas皮下注射至人,以便遞送到腎臟。
莫利托裡斯(Molitoris)等人(《美國腎臟病學會雜誌》(J Am Soc Nephrol)20:1754-1764,2009年)採用了近端小管細胞(PTC)作為在腎臟內的寡核苷酸再吸收部位,以便檢驗靶向p53(凋亡途徑中的一種關鍵蛋白質)的siRNA的效力,從而預防腎損傷。在缺血性損傷之後4小時靜脈內注射針對p53的裸露的合成siRNA最大限度地保護了PTC和腎功能。莫利托裡斯(Molitoris)等人的數據表明,在靜脈內給藥之後siRNA被快速遞送到近端小管細胞。為了劑量反應分析,用在相同的四個時間點給予的0.33、1、3、或5mg/kg劑量的siP53注射大鼠,分別產生1.32、4、12、和20mg/kg的累積劑量。與PBS處理的缺血對照大鼠相比較,所有檢驗的siRNA劑量在第一天產生了SCr降低作用,其中更高的劑量在經過大約五天中更有效。12和20mg/kg的累積劑量提供了最好的保護作用。莫利托裡斯(Molitoris)等人的方法可應用於本發明的核酸靶向系統,其中對於人類考慮遞送到腎臟的12和20mg/kg累積劑量。
湯普森(Thompson)等人(《核酸治療學》(Nucleic Acid Therapeutics),第22卷,第4期,2012年)報導了合成的小干擾RNA I5NP在齧齒類和非人類靈長動物中靜脈內給藥之後的毒理學和藥代動力學特性。I5NP被設計為經由RNA干擾(RNAi)途徑起作用以便暫時抑制促凋亡蛋白p53的表現並且被開發為保護細胞免於諸如急性腎損傷之類的急性缺血/再灌注損傷,急性缺血/再灌注損傷可能在重大心臟手術以及在腎移植後可能出現的移植功能延遲中發生。在齧齒類中的800mg/kg I5NP以及在非人類靈長動物中的1,000mg/kg I5NP的劑量對於引出不良作用係需要的,在猴中被分離為導向對血液的作用,包括補體的亞臨床活化和凝血時間的輕度增加。在大鼠中,用I5NP的大鼠類似物未觀察到另外的不良作用,表明該等作用很可能代表合成RNA雙股體的類作用,而不是與I5NP的預期藥理學活性有關的毒性。總之,該等數據支援用於在急性缺血/再灌注損傷之後保留腎功能的I5NP的靜脈內給藥的臨床測試。在猴子中的無明顯損害作用水平(NOAEL)係500mg/kg。在猴中,在以高達25mg/kg的劑量水平靜脈內給藥之後未觀察到對心血管、呼吸、以及神經系統參數的影響。因此,對於向人的腎臟靜脈內給予CRISPR Cas可以考慮相似的劑量。
清水(Shimizu)等人(《美國腎臟病學會雜誌》(J Am Soc Nephrol)21:622-633,2010)開發了經由基於聚(乙二醇)-聚(L-賴胺酸)的載體將siRNA靶向遞送到腎小球的系統。該siRNA/奈米載體複合物在直徑上大約為10到20nm,該大小將允許它移動跨過有窗孔的內皮細胞而接近腎小球膜。在腹膜內注射螢光標記的siRNA/奈米載體複合物之後,清水 (Shimizu)等人在血液循環中檢測到siRNA,持續一段延長的時間。在腎小球腎炎的小鼠模型中,絲裂原活化蛋白激酶1(MAPK1)siRNA/奈米載體複合物的重複腹膜內給藥抑制了腎小球MAPK1 mRNA和蛋白質的表現。為了研究siRNA累積,向BALBc小鼠給予與PIC奈米載體複合的Cy5標記的siRNA(0.5ml,5nmol的siRNA含量)、裸露的Cy5標記的siRNA(0.5ml,5nmol)、或封裝在HVJ-E中的Cy5標記的siRNA(0.5ml,5nmol的siRNA含量)。清水(Shimizu)等人的方法可應用於本發明的核酸靶向系統,其中考慮將約10-20μmol的與奈米載體複合的CRISPR Cas以約1-2升腹膜內注射至人並且遞送到腎臟。
治療上皮和肺疾病
本發明還考慮了向一個或兩個肺遞送本文描述的CRISPR-Cas系統例如Cas9系統。
雖然基於AAV-2的載體最初被提議用於向CF氣道的CFTR遞送,但其他血清型如AAV-1、AAV-5、AAV-6、和AAV-9在肺上皮細胞的多種模型中也展示出提高的基因轉移效率(參見,例如,李(Li)等人,《分子治療》(Molecular Therapy),第17卷,第12期,2067-2077,2009年12月)。在體外轉導人氣道上皮細胞上,AAV-1被證明比AAV-2和AAV-5更有效約100倍,雖然AAV-1體內轉導的鼠類氣管氣道上皮具有與AAV-5相等的效率。其他研究已經表明,在針對體外人氣道上皮(HAE)的基因遞送上,AAV-5比AAV-2更有效50倍,並且在體內小鼠肺氣道上皮中顯著更有效。還已經表明,在體外人氣道上皮細胞中以及在體內鼠類氣道中,AAV-6比AAV-2更有效。8更為近期的分離物,AAV-9,顯示出在體內 鼠類鼻和肺泡上皮中展示了比AAV-5更好的基因轉移效率,其中檢測出基因表現持續超過9個月,表明AAV可使得體內長期基因表現成為可能,這係對於CFTR基因遞送載體而言的理想特性。此外,證明了AAV-9可以被再次給予至鼠類的肺部,而不喪失CFTR表現並且具有最低限度的免疫後果。可以在CF和非CF HAE培養物的頂面用100μl的AAV載體接種,維持數小時(參見,例如,李(Li)等人,《分子治療》(Molecular Therapy),第17卷,第12期,2067-2077,2009年12月)。MOI可以從1×103到4×105個載體基因組/細胞而變化,這取決於病毒濃度和該等實驗的目的。以上引用的載體被考慮用於本發明的遞送和/或給藥。
薩莫拉(Zamora)等人(《美國呼吸道與危重護理學雜誌》(Am J Respir Crit Care Med)第183卷,第531-538頁,2011年)報導了針對人類感染性疾病治療的RNA干擾治療法的應用以及抗病毒藥物在呼吸道合胞病毒(RSV)感染的肺移植受體中的隨機試驗。薩莫拉(Zamora)等人進行了一項在具有RSV呼吸道感染的LTX受體中的隨機化、雙盲、安慰劑對照的試驗。容許患者接受針對RSV的護理標準。每天給予霧化的ALN-RSV01(0.6mg/kg)或安慰劑,持續3天。這項研究證明,可以安全地向具有RSV感染的LTX受體給予靶向RSV的RNAi治療劑。ALN-RSV01的三個每日劑量並不導致任何呼吸道症狀的惡化或肺功能的損害,並且未展示任何出全身性致炎作用,如細胞因子或CRP的誘導。在吸入之後,藥代動力學僅僅顯示出低的短暫的全身性暴露,與臨床前動物數據一致,表明靜脈內或藉由吸入給予的ALN-RSV01藉由外切核酸酶介導的消化和腎臟排泄而從循環中迅速清除。薩莫拉(Zamora)等人 的方法可以應用於本發明的核酸靶向系統,並且霧化的CRISPR Cas,例如以0.6mg/kg的劑量,可以被考慮用於本發明。
施萬克(Schwank)等人(《細胞-幹細胞》(Cell Stem Cell),13:653-58,2013)使用了CRISPR-Cas9來校正在人類幹細胞中的與囊性纖維化相關聯的缺陷。該研究組的目標係離子通道囊性纖維化跨膜傳導受體(CFTR)的基因。在CFTR中的缺失引起該蛋白質在囊性纖維化患者中的錯誤折疊。使用從患有囊性纖維化的兩個兒童的細胞樣品中發育而來的培養的腸幹細胞,施萬克(Schwank)等人能夠利用CRISPR連同含有有待插入的修補序列的供體質粒來校正該缺陷。然後該等研究者使該等細胞生長成腸“類器官”或微型腸,並且顯示它們正常地起作用。在這種情況下,約一半的選殖類器官經歷正確的基因修正。
治療肌肉系統的疾病
本發明還考慮了向一種或多種肌肉遞送本文描述的CRISPR-Cas系統例如Cas9系統。
Bortolanza等人(《分子治療》(Molecular Therapy)第19卷,第11期,2055-2064,2011年11月)表明,在面肩肱型肌營養不良(FSHD)發作之後的FRG1小鼠中,干擾RNA表現盒的全身性遞送導致劑量依賴性長期FRG1敲低,而沒有毒性徵象。Bortolanza等人發現,單次靜脈內注射5×1012vg的rAAV6-sh1FRG1挽救了FRG1小鼠的肌肉組織病理學和肌肉功能。詳細而言,使用一個25號的泰爾茂(Terumo)注射器將200μl的含有2×1012或5×1012vg的在生理溶液中的載體注射到尾靜脈中。Bortolanza等人的方法可以應用於表現CRISPR Cas的AAV,並且將其以約 2×1015或2×1016vg載體的劑量注射到人體內。
Dumonceaux等人(《分子治療》(Molecular Therapy)第18卷,第5期,881-887,2010年5月)使用針對肌肉生長抑制素受體AcvRIIb mRNA(sh-AcvRIIb)的RNA干擾技術抑制了肌肉生長抑制素途徑。由向量化(vectorized)U7外顯子跳躍技術(U7-DYS)介導准肌營養不良蛋白(quasi-dystrophin)的恢復。將攜帶單獨的sh-AcvrIIb構建體、單獨的U7-DYS構建體、或這兩種構建體的組合的腺相關載體注射到營養不良mdx小鼠的脛骨前肌(TA)肌肉中。以1011個AAV病毒基因組進行注射。Dumonceaux等人的方法可以應用於表現CRISPR Cas的AAV,並且將其以例如約1014到1015vg載體的劑量注射到人體內。
木內(Kinouchi)等人(《基因治療》(Gene Therapy)(2008)15,1126-1130)報導了藉由未經化學修飾的siRNA與缺端膠原(ATCOL)的奈米粒子形成的到正常或患病小鼠骨骼肌的體內siRNA遞送的有效性。靶向肌肉生長抑制素(骨骼肌生長的負調節劑)的siRNA的ATCOL介導的在小鼠骨骼肌中的局部應用或者經由靜脈內在應用之後幾周之內引起肌肉質量的顯著增加。該等結果暗示siRNA的ATCOL介導的應用係一種強大的用於包括肌肉萎縮在內的疾病的未來治療用途的工具。根據製造商的說明,將MstsiRNA(終濃度,10mM)與ATCOL(對於局部給藥的終濃度,0.5%)(AteloGene,高研株式會社(Kohken),東京,日本)混合。在藉由戊巴比妥鈉(25mg/kg,腹膜內注射)麻醉小鼠(20周大,雄性C57BL/6)之後,將Mst-siRNA/ATCOL複合物注射到咬肌和股二頭肌中。木內(Kinouchi)等人的方法可以應用於CRISPR Cas,並且例如 將其以40μM溶液的約500到1000ml的劑量注射到人體內。哈格斯特龍(Hagstrom)等人(《分子治療》(Molecular Therapy)第10卷,第2期,2004年8月)描述了使得能夠將核酸有效且可重複地遞送到遍及哺乳動物四肢肌肉的肌細胞(肌纖維)的血管內、非病毒方法。該程序涉及注射裸質粒DNA或siRNA到暫時由止血帶或血壓袖帶分離的肢體的遠端靜脈中。藉由以足夠的體積將其迅速注射,促進了向肌纖維的核酸遞送,使得該核酸溶液能夠溢出到肌肉組織中。在小動物和大動物中都以最低毒性實現了在骨骼肌中的高水平轉基因表現。還獲得了向四肢肌肉遞送siRNA的證據。為了將質粒DNA靜脈注射到恒河猴中,將三通旋塞連接到各自載入有單個注射器的兩個注射器泵(型號PHD 2000;哈佛儀器公司(Harvard Instruments))上。在罌粟鹼注射五分鐘之後,以1.7或2.0ml/s的速率注射pDNA(15.5到25.7mg,在40-100ml鹽水中)。對於本發明的表現CRISPR Cas的質粒DNA,這可以按比例增加,對於人類,注射在800到2000ml鹽水中的約300到500mg。對於到大鼠中的腺病毒載體注射,注射在3ml的生理鹽水溶液中的(NSS)2 x 109個感染粒子。對於本發明的表現CRISPR Cas的腺病毒載體,這可以按比例增加,對於人類,注射在10升NSS中的約1 x 1013個感染粒子。對於siRNA,以12.5μg的siRNA注射到大鼠的大隱靜脈中,並且以750μg的siRNA注射到靈長動物的大隱靜脈中。對於本發明的CRISPR Cas,這可以按比例增加,例如,向人的大隱靜脈注射約15到約50mg。
還參見,例如,WO 2013163628 A2,《突變基因的基因校正》(Genetic Correction of Mutated Genes),杜克大學的公開申請,描述 了例如校正一框移突變的努力,該框移突變引起提前終止密碼子和可經由核酸酶介導的非同源末端連接進行校正的截短基因產物,該基因產物如引起迪謝內肌營養不良(“DMD”)的那些,迪謝內肌營養不良係一種隱性遺傳的、致命的、X連鎖疾病,其導致由於肌營養不良蛋白基因突變所致的肌肉變性。引起DMD的大多數肌營養不良蛋白突變係破壞該閱讀框並且引起肌營養不良蛋白基因的提前翻譯終止的外顯子缺失。肌營養不良蛋白係細胞質蛋白,其提供負責調節肌細胞完整性和功能的細胞膜肌營養不良蛋白聚糖複合物的結構穩定性。如在此可互換地使用的肌營養不良蛋白基因或“DMD基因”係在座位Xp21處的2.2兆鹼基。初級轉錄測量了約2,400kb,其中成熟mRNA為約14kb。79個外顯子編碼超過3500個胺基酸的蛋白質。在DMD患者中,外顯子51常常接近破壞框的缺失並且已經在臨床試驗中被靶向基於寡核苷酸的外顯子跳躍。對於外顯子51跳躍化合物依替利森(eteplirsen)的臨床試驗最近報導了跨48周的顯著功能益處,相比於基線具有47%的肌營養不良蛋白陽性纖維。外顯子51的突變理想地適合於經由基於NHEJ的基因組編輯的持久校正。
涉及從人類肌營養不良蛋白基因(DMD)切割靶序列的大範圍核酸酶變體的轉讓給Cellectis公司的美國專利公開案號20130145487的方法也可以針對本發明的核酸靶向系統進行修改。
治療皮膚疾病
本發明還考慮了向皮膚遞送本文描述的CRISPR-Cas系統,例如Cas9效應蛋白系統。
希克森(Hickerson)等人(《分子治療-核酸》(Molecular Therapy-Nucleic Acids)(2013)2,e129)涉及一種用於向人類和鼠類皮膚遞送自我遞送(sd)-siRNA的機動化的微針陣列皮膚遞送裝置。將基於siRNA的皮膚治療劑轉化到臨床的主要挑戰係有效遞送系統的開發。在多種皮膚遞送技術中已經投入了實質性的努力,但是成功有限。在其中用siRNA治療皮膚的臨床研究中,與皮下針注射相關的劇烈疼痛預先排除了試驗中額外患者的納入,這凸顯了對於改進的、更為“患者友好的”(即,很少或沒有疼痛)遞送方法的需要。微針代表行包括siRNA在內的大的帶電負荷物跨越一級屏障、角質層進行遞送的有效途徑,並且通常被認為比常規皮下針疼痛更少。機動化的“衝壓型”微針裝置,包括由希克森(Hickerson)等人使用的機動化的微針陣列(MMNA)裝置,已經顯示在無毛小鼠研究中是安全的並且引起很少的或沒有疼痛,其證據為:(i)在美容業中廣泛使用以及(ii)其中幾乎所有志願者發現使用該裝置比流感疫苗針劑(flushot)疼痛少得多的有限測試,表明使用這種裝置的siRNA遞送將產生比使用皮下針注射的先前臨床試驗中所體驗的少得多的疼痛。該MMNA裝置(作為Triple-M或Tri-M由韓國首爾的Bomtech電子有限公司在市場上銷售)適用於將siRNA遞送到小鼠和人類皮膚。將sd-siRNA溶液(高達300μl的0.1mg/ml RNA)引入被設定為0.1mm深度的一次性Tri-M針盒(Bomtech)的腔室中。為了處理皮膚,在處理之前將未鑒定的皮膚(在外科手術之後立即獲得)手動拉伸並且釘在軟木平臺上。使用具有28號0.5英吋針頭的胰島素注射器進行所有皮內注射。該MMNA裝置和希克森(Hickerson)等人的方法可以用於和/或適用於,例如,以高達300μl的0.1mg/ml CRISPR Cas的劑量向皮膚遞送本發明的CRISPR Cas。
裡奇曼(Leachman)等人(《分子治療》(Molecular Therapy),第18卷,第2期,442-446,2010年2月)涉及利用基於針對皮膚的第一短干擾RNA(siRNA)的治療劑用於治療罕見的皮膚病症先天性厚甲(PC)的Ib期臨床試驗,先天性厚甲為常染色體顯性綜合症,其包括致殘性的掌蹠角化病。這種siRNA,稱為TD101,特異性地並且有力地靶向角蛋白6a(K6a)N171K突變體mRNA,而不影響野生型K6a mRNA。
鄭(Zheng)等人(PNAS,7月24日,2012年,第109卷,第30期,11975-11980)表明,球形核酸奈米粒子結合物(SNA-NC),由高度定向的、共價固定的siRNA的緻密殼圍繞的金核,在應用之後數小時之內在體外自由地穿透幾乎100%的角化細胞、小鼠皮膚、以及人表皮。鄭(Zheng)等人證明,在人類皮膚中單次應用25nM的表皮生長因子受體(EGFR)SNA-NC持續60小時顯示出有效的基因敲低。對於向皮膚給予固定在SNA-NC中的CRISPR Cas可以考慮了相似的劑量。
通用基因療法考慮
疾病相關基因和多核苷酸以及疾病具體資訊的實例可獲得自約翰斯.霍普金斯大學的麥考斯克-納森遺傳醫學研究所(McKusick-Nathans Institute of Genetic Medicine,Johns Hopkins University)(巴爾的摩,馬里蘭州)和國立醫學圖書館的國家生物技術資訊中心(National Center for Biotechnology Information,National Library of Medicine)(貝塞斯達,馬里蘭州)。
該等基因和途徑的突變可以導致產生不當的蛋白質或以不當的量影響功能的蛋白質。藉由引用而特此結合來自於2012年12月12 日提交的美國臨時申請61/736,527的基因、疾病和蛋白質的另外的實例。這樣的基因、蛋白質和途徑可以是本發明的CRISPR複合物的靶多核苷酸。
本發明的實施方式還涉及與敲除基因、擴增基因以及修復與DNA重複不穩定性和神經障礙相關的具體突變有關的方法和組成物(羅伯特D..威爾斯(Robert D.Wells)、蘆沢哲夫(Tetsuo Ashizawa),遺傳不穩定性與神經疾病(Genetic Instabilities and Neurological Diseases),第二版,學術出版社(Academic Press),2011年10月13日-《醫學》(Medical))。已經發現串聯重複序列的特定方面對超過二十種人類疾病負責(重複不穩定新見:RNA‧DNA雜交體的作用(New insights into repeat instability:role of RNA‧DNA hybrids).麥基弗EI(McIvor EI)、波拉克U(Polak U)、納皮爾拉拉M(Napierala M).《RNA生物學》(RNA Biol.)2010年9月-10月;7(5):551-8)。可以利用在此的效應蛋白系統校正基因組不穩定性缺陷。
本發明的若干另外的方面涉及校正與範圍廣泛的遺傳性疾病相關的缺陷,該等遺傳性疾病在專題小節遺傳性障礙(Genetic Disorders)下被進一步描述於國立衛生研究院的網站(網址為health.nih.gov/topic/GeneticDisorders)。遺傳性腦病可以包括但不限於,腎上腺腦白質失養症、胼胝體發育不全、艾卡爾迪綜合症(Aicardi Syndrome)、阿爾佩斯病(Alpers' Disease)、阿茲海默症、巴特綜合症(Barth Syndrome)、巴藤病(Batten Disease)、CADASIL、小腦變性、費波瑞病(Fabry's Disease)、格斯特曼-施特勞斯納病 (Gerstmann-Straussler-Scheinker Disease)、杭丁頓氏症以及其他三聯體重複障礙、萊氏病(Leigh's Disease)、杭Lesch-Nyhan氏症候群、門克斯病(Menkes Disease)、線粒體肌病以及NINDS空洞腦(Colpocephaly)。該等疾病在小節遺傳性腦部障礙(Genetic Brain Disorders)下被進一步描述於國立衛生研究院的網站。
使用CRISPR Cas系統的示例方法
本發明提供了非天然存在的或工程化的組成物、或編碼所述組成物的組分的一種或多種多核苷酸、或包含對所述組成物的組分進行編碼的一種或多種多核苷酸的載體或遞送系統,其用於體內、離體或體外修飾靶細胞,並且是以改變細胞使得一旦被修飾則CRISPR修飾的細胞的子代或細胞系保留改變的表型的方式進行。該等修飾的細胞和子代可以是多細胞生物例如植物或動物的部分,其中在離體或體內向希望的細胞型應用CRISPR系統。CRISPR發明可以是治療的療法。該治療的療法可以包括基因或基因組編輯、或基因療法。
用CRISPR-Cas系統或複合物修飾靶標
在一個方面,本發明提供了修飾真核細胞中的靶多核苷酸之方法,該等方法可以在體內、離體或在體外。在一些實施方式中,該方法包括對來自人或非人動物的細胞或細胞群進行取樣,並且修飾該細胞或該等細胞。培養可以發生在離體的任何階段。該細胞或該等細胞甚至可以被重新引入該非人動物或植物中。對於重新引入的細胞,特別較佳的是該等細胞係幹細胞。
在一些實施方式中,該方法包括允許CRISPR複合物結合 到該靶多核苷酸上以實施所述靶多核苷酸的切割,由此修飾該靶多核苷酸,其中該CRISPR複合物包括與雜交或可雜交到在所述靶多核苷酸內的靶序列上的指導序列複合的CRISPR酶,其中所述指導序列連接到tracr配對序列上,該tracr配對序列進而雜交到tracr序列上。
在一個方面,本發明提供了修飾多核苷酸在真核細胞中的表現之方法。在一些實施方式中,該方法包括允許CRISPR複合物結合到該多核苷酸上,這樣使得所述結合導致所述多核苷酸的表現增加或降低;其中該CRISPR複合物包括與雜交或可雜交到在所述多核苷酸內的靶序列上的指導序列複合的CRISPR酶,其中所述指導序列連接到tracr配對序列上,該tracr配對序列進而雜交到tracr序列上。類似的考慮因素和條件適用如上文針對修飾靶多核苷酸之方法。事實上,該等取樣、培養和重新引入選擇跨本發明的多個方面而適用。
確實,在本發明的任何方面,該CRISPR複合物可以包括與雜交或可雜交到靶序列上的指導序列複合的CRISPR酶,其中所述指導序列可以連接到tracr配對序列上,該tracr配對序列進而可以雜交到tracr序列上。
類似的考慮因素和條件適用如上文針對修飾靶多核苷酸之方法。因此,在本文描述的非天然存在的CRISPR酶的任一種中包括至少一種修飾,並且由此該酶具有某些改進的能力。具體地,該等酶中的任一種能夠與指導RNA形成CRISPR複合物。當這種複合物形成時,該指導RNA能夠結合至靶多核苷酸序列上,並且該酶能夠改變靶座位。此外,與未修飾的酶相比,在該CRISPR複合物中的酶具有降低的修飾一個或多 個脫靶座位的能力。
此外,與未修飾的酶相比,本文描述的修飾的CRISPR酶包含這樣的酶,由此其在CRISPR複合物中該酶具有增加的修飾一個或多個靶座位的能力。這種功能可以單獨或與降低的修飾一個或多個脫靶位點的能力的上述功能組合提供。任何此類酶可以被提供為具有對如本文描述的CRISPR酶的任一種另外修飾,例如與由一種或多種相關異源功能結構域提供的任何活性、用以降低核酸酶活性的任何另外突變等相組合。
在本發明的有利的實施方式中,經修飾的CRISPR酶被提供為與未修飾的酶相比具有降低的修飾一個或多個脫靶位點的能力,並且與未修飾的酶相比具有增加的修飾一個或多個靶座位的能力。與對酶的另外修飾相組合,可以實現顯著增強特異性。例如,提供了此類有利實施方式與一種或多種另外的突變的組合,其中該一種或多種另外的突變係在一個或多個催化活性結構域中。此類另外的催化突變可以賦予切口酶如本文其他處詳細描述的切口酶功能性。在此類酶中,可以由於在酶活性方面改進的特異性實現增強的特異性。
如以上所述用以降低脫靶效應和/或增強靶標效應的修飾可以被製成位於帶正電荷的區域/凹槽中的胺基酸殘基,該帶正電荷的區域/凹槽位於RuvC-III和HNH之間。應當理解的是,可以藉由修飾上述凹槽內的胺基酸,但還要藉由修飾鄰近於該凹槽或其外部的胺基酸來實現上述任何功能性作用。
可以被工程化到如在此描述的經修飾的CRISPR酶中的另外的功能性包括以下該等。1.經修飾的CRISPR酶,其破壞DNA:蛋白質 相互作用而不影響蛋白質三級或二級結構。這包括接觸RNA:DNA雙股體任何部分的殘基。2.經修飾的CRISPR酶,其弱化蛋白內相互作用,該蛋白內相互作用使Cas9保持響應於DNA結合(靶標或脫靶)的核酸酶切割所必需的構象。例如:輕度抑制、但仍然允許HNH結構域(定位在易切斷的磷酸酯處)的核酸酶構象的修飾。3.經修飾的CRISPR酶,其強化蛋白內相互作用,該蛋白內相互作用使Cas9保持對響應於DNA結合(靶標或脫靶)的核酸酶活性進行抑制的構象。例如:將HNH結構域穩定在遠離易切斷的磷酸酯的構象中的修飾。任何這種功能增強可以提供為與如本文其他處詳細描述的對CRISPR酶的任何其他修飾相組合。
任何本文描述的改進的功能性可以針對任何CRISPR酶例如Cas9酶。本文描述的Cas9酶衍生自來自釀膿鏈球菌和金黃色葡萄球菌的Cas9酶。然而,應當理解的是本文描述的任何功能性可以被工程化到來自其他異種同源物的Cas9酶中,包括含有來自多種異種同源物的片段的嵌合酶。
核酸、胺基酸和蛋白質、調節序列、載體等
本發明使用核酸來結合靶TDNA序列。這係有利的,因為產生核酸比產生蛋白質容易且價廉得多,並且特異性可以根據其中尋求同源性的拉伸長度而變化。例如多指的複雜3-D複雜定位係不需要的。術語“多核苷酸”、“核苷酸”、“核苷酸序列”、“核酸”和“寡核苷酸”可互換地使用。它們係指具有任何長度的核苷酸的聚合形式,係去氧核糖核苷酸或核糖核苷酸、或其類似物。多核苷酸可具有任何三維結構,並且可以執行已知或未知的任何功能。以下是多核苷酸的非限制性 實例:基因或基因片段的編碼區或非編碼區、根據連接分析定義的多個座位(一個座位)、外顯子、內含子、信使RNA(mRNA)、轉運RNA、核糖體RNA、短干擾RNA(siRNA)、短髮夾RNA(shRNA)、micro-RNA(miRNA)、核酶、cDNA、重組多核苷酸、分支多核苷酸、質粒、載體、任何序列的分離的DNA、任何序列的分離的RNA、核酸探針、和引物。該術語還涵蓋具有合成骨架的核酸-樣結構,參見,例如埃克斯坦(Eckstein),1991;巴塞加(Baserga)等人,1992;米利根(Milligan),1993;WO 97/03211;WO 96/39154;馬塔(Mata),1997;施特勞斯-紹庫普(Strauss-Soukup),1997;和紮姆斯塔(Samstag),1996。多核苷酸可以包含一個或多個經修飾的核苷酸,如甲基化的核苷酸和核苷酸類似物。如果存在,可以在聚合物組裝之前或之後進行核苷酸結構的修飾。核苷酸的序列可以被非核苷酸組分中斷。多核苷酸可以在聚合後,如藉由與標記的組分綴合來進一步修飾。如本文所用的術語“野生型”係熟習該項技術者所理解的術語,並且表示生物、菌株、基因的典型形式或者當它在自然界存在時區別於突變體或變體形式的特徵。“野生型”可以是基線。如本文所用的術語“變體”應當被理解為表示具有衍生自在自然界中存在的模式的性質的展示。術語“非天然存在的”或“工程化的”可互換地使用並且表面人工的參與。該等術語,當指核酸分子或多肽時,表示該核酸分子或多肽至少基本上從它們在自然界中或如發現於自然界中的與其結合的至少另一種組分游離出來。“互補性”係指核酸與另一個核酸序列借助於傳統的沃森-克裡克鹼基配對或其他非傳統類型形成一個或多個氫鍵的能力。互補百分比表示一個核酸分子中可與一個第二核酸序列形成氫鍵(例如,沃森-克裡克鹼基配對)的殘基的百分比 (例如,10個之中有5、6、7、8、9、10個即為50%、60%、70%、80%、90%、和100%互補)。“完全互補”表示一個核酸序列的所有連續殘基與一個第二核酸序列中的相同數目的連續殘基形成氫鍵。如本文使用的“基本上互補”係指在一個具有8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50個或更多個核苷酸的區域上至少為60%、65%、70%、75%、80%、85%、90%、95%、97%、98%、99%、或100%的互補程度,或者係指在嚴格條件下雜交的兩個核酸。如本文使用的對於雜交的“嚴格條件”係指與靶序列具有互補性的一個核酸主要地與該靶序列雜交並且基本上不雜交到非靶序列上的條件。嚴格條件通常是序列依賴性的,並且取決於許多因素而變化。一般而言,該序列越長,則該序列特異性地雜交到其靶序列上的溫度就越高。嚴格條件的非限制性實例描述於蒂森(Tijssen)(1993)的《生物化學和分子生物學中的實驗室技術-核酸探針雜交》(Laboratory Techniques In Biochemistry And Molecular Biology-Hybridization With Nucleic Acid Probes),第I部分,第二章,“雜交原理概述和核酸探針分析策略”(“Overview of principles of hybridization and the strategy of nucleic acid probe assay”),愛思唯爾(Elsevier),紐約。在提及一個多核苷酸序列時,那麼也設想了互補的或部分互補的序列。能夠在高嚴格條件下雜交到參考序列上的該等序列係較佳的。通常,為了使雜交率最大化,選擇了相對低嚴格性的雜交條件:低於熱熔點(Tm)約20℃到25℃。Tm係50%的特異性靶序列在具有規定的離子強度和pH的溶液中雜交到完全互補的探針上的溫度。通常,為了要求雜交序列的至少約85%的核苷酸互補性,高嚴格洗滌條件被選擇為低於Tm約5℃到15℃。為了要求雜交序列的至少約 70%的核苷酸互補性,中等嚴格洗滌條件被選擇為低於Tm約15℃到30℃高容許(極低嚴格性)洗滌條件可以低至在Tm之下50℃,從而允許在雜交序列之間的高水平錯配。熟習該項技術者將認識到,在雜交和洗滌階段中的其他物理和化學參數也可以改變,從而影響來自在靶序列與探針序列之間的特定同源性水平的可檢測雜交信號的結果。較佳的高嚴格條件包括在50%甲醯胺、5×SSC、和1% SDS中在42℃培養,或者在5×SSC和1% SDS中在65℃培養,在0.2×SSC和0.1% SDS中在65℃洗滌。“雜交”係指其中一個或多個多核苷酸反應形成複合物的反應,該複合物經由該等核苷酸殘基之間的鹼基的氫鍵鍵合而穩定化。氫鍵鍵合可以借助於沃森-克裡克鹼基配對、Hoogstein結合或以任何其他序列特異性方式而發生。該複合物可包含形成一個雙股體的兩條股、形成多股複合物的三條或多條股、單個自我雜交股、或該等的任何組合。雜交反應可以構成更廣泛的過程(如PCR的開始、或經由一種酶的多核苷酸的切割)中的步驟。能夠與給定序列雜交的序列被稱為該給定序列的“互補物”。如本文使用的,術語“基因組座位(locus)”或“座位(locus)”(複數係座位(loci))係在染色體上的基因或DNA序列的特定位置。“基因”係指編碼多肽或RNA鏈的DNA或RNA的段(stretch),其在生物中發揮功能作用並且因此係活生物體遺傳的分子單元。出於本發明的目的,可以考慮包括調節基因產物的產生的區域的基因,而不論這樣的調節序列是否接近編碼和/或轉錄的序列。因此,基因包括而不必限於,啟動子序列、終止子、翻譯調節序列(如核糖體結合位點和內部核糖體進入位點)、增強子、沈默子、隔離子、邊界元件、複製起點、核基質附著位點和座位控制區。如本文使用的“基因組座位的表現”或“基因表現”係藉此在 功能性基因產物的合成中使用來自基因的資訊的過程。基因表現的產物常常是蛋白質,但是在非蛋白質編碼基因如rRNA基因或tRNA基因中,產物係功能性RNA。基因表現的過程由所有已知的生物利用-產生功能性產物以便存活的真核生物(包括多細胞生物)、原核生物(細菌和古細菌)以及病毒。如本文使用的基因或核酸的“表現”不僅涵蓋細胞基因表現,而且涵蓋在選殖系統中或在任何其他背景下的一個或多個核酸的轉錄和翻譯。如本文使用的“表現”係指藉此從DNA模板轉錄成多核苷酸(如轉錄成mRNA或其他RNA轉錄物)的過程和/或轉錄的mRNA隨後藉此翻譯成肽、多肽或蛋白質的過程。轉錄物和編碼的多肽可以總稱為“基因產物”。如果多核苷酸來源於基因組DNA,表現可以包括真核細胞中mRNA的剪接。術語“多肽”、“肽”和“蛋白質”在本文可互換地使用,係指具有任何長度的胺基酸的聚合物。該聚合物可以是可以是直鏈或支鏈的,它可以包含修飾的胺基酸,並且它可以被非胺基酸中斷。該等術語還涵蓋已經被修飾的胺基酸聚合物;該等修飾例如二硫鍵形成、糖基化、脂化(lipidation)、乙醯化、磷酸化、或任何其他操縱,如與標記組分的綴合。如本文使用的術語“胺基酸”包括天然的和/或非天然的或者合成的胺基酸,包括甘胺酸以及D和L旋光異構物、以及胺基酸類似物和肽模擬物。如本文使用的,術語“結構域”或“蛋白質結構域”係指可以獨立於該蛋白質鏈的其餘部分而存在並且起作用的蛋白質序列的一部分。正如在本發明的多個方面中所描述,序列一致性與序列同源性有關。可以藉由肉眼、更通常地借助於可得的序列比較程式來進行同源性比較。該等可商購的電腦程式可以計算在兩個或更多個序列之間的同源性的百分比(%)並且還可以計算由兩個或更多個胺基酸或核酸序列共用的序列 一致性。
在本發明的多個方面中,術語“指導RNA”,係指包括以下項中的一種或多種的多核苷酸序列:推定或鑒定的tracr序列和推定或鑒定的crRNA序列或指導序列。在具體實施方式中,“指導RNA”包括推定或鑒別的crRNA序列或指導序列。在另外的實施方式中,該指導RNA不包括推定或鑒定的tracr序列。
如本文所用的術語“野生型”係熟習該項技術者所理解的術語,並且表示生物、菌株、基因的典型形式或者當它在自然界存在時區別於突變體或變體形式的特徵。“野生型”可以是基線。
如本文所用的術語“變體”應當被理解為表示具有衍生自在自然界中存在的模式的性質的展示。
術語“非天然存在的”或“工程化的”可互換地使用並且表面人工的參與。該等術語,當指核酸分子或多肽時,表示該核酸分子或多肽至少基本上從它們在自然界中或如發現於自然界中的與其結合的至少另一種組分游離出來。在所有方面和實施方式中,無論它們是否包括該等術語,將理解的是,較佳的是,可以是視情況並且由此係較佳的是包括的或不是較佳的是不包括的。此外,術語“非天然存在的”和“工程化”可以互換地使用,並且因此可以單獨或組合使用,並且一者或另一者可以替代兩種一起的提及。具體地,“工程化”較佳的是替代“非天然存在的”或“非天然存在的和/或工程化的”。
可以藉由本領域已知的許多電腦程式(例如BLAST或FASTA等等)來生成序列同源性。用於進行這樣的比對的適合的電腦程 式係GCG威斯康辛Bestfit套裝軟體(威斯康辛大學,美國;德弗羅(Devereux)等人,1984,《核酸研究》(Nucleic Acids Research)12:387)。可以進行序列比較的其他軟體的實例包括但不限於,BLAST套裝軟體(參見奧蘇貝爾(Ausubel)等人,1999,出處同上-第18章)、FASTA(阿爾丘爾(Atschul)等人,1990,《分子生物學雜誌》(J.Mol.Biol.),403-410)以及GENEWORKS系列比較工具。BLAST和FASTA均可用於離線和線上搜索(參見奧蘇貝爾(Ausubel)等人,1999,出處同上,7-58頁到7-60頁)。然而,較佳的是使用GCG Bestfit程式。可以計算在連續序列上的序列同源性百分比(%),即,將一個序列與另一個序列比對,並且將一個序列中的每個胺基酸或核苷酸與另一個序列中的相應胺基酸或核苷酸直接進行比較,一次比較一個殘基。這被稱為“無空位”比對。典型地,這樣的無空位比對僅僅在較少數目的殘基上進行。雖然這係一種非常簡單和一致之方法,但是它未能考慮的是,例如,在其他方面完全相同的序列對中,一個插入或缺失可以引起隨後的胺基酸殘基被排除在比對之外,因此當進行全域比對時可能導致在同源性%上的大幅降低。因此,大多數序列比較方法被設計為產生考慮到可能的插入和缺失的優化比對,而沒有過度地使總體同源性或一致性評分不利。這係藉由在序列比對中插入“空位”來實現的,以便試圖將局部同源性或一致性最大化。然而,該等更複雜的方法向出現在該比對中的每個空位分配“空位罰分”,從而對於相同數目的一致的胺基酸而言,具有盡可能少的空位的序列比對-反映了在這兩個比較的序列之間的更高關聯性-可以比具有許多空位者實現更高的得分。“親合空位成本”(“Affinity gap costs”)典型地用於對空位的存在要求相對高的成本並對空位中的每個後續殘基施加較小 的罰分。這係最常用的空位評分系統。高空位罰分當然將產生具有更少空位的最佳比對。大多數比對程式允許修改空位罰分。然而,當使用這種序列比較軟體時較佳的是使用預設值。例如當使用GCG威斯康辛Bestfit套裝軟體時,胺基酸序列的默認空位罰分為對於每個空位的-12,以及對於每個延伸的-4。因此計算最大同源性%首先要求產生最佳比對,考慮空位罰分。用於進行這樣的比對的適合的電腦程式係GCG威斯康辛Bestfit套裝軟體(德弗羅(Devereux)等人,1984,《核酸研究》(Nuc.Acids Research 12 p387)。可以進行序列比較的其他軟體的實例包括但不限於,BLAST套裝軟體(參見奧蘇貝爾(Ausubel)等人,1999《精編分子生物學實驗指南》(Short Protocols in Molecular Biology),第4版-第18章)、FASTA(阿爾丘爾(Altschul)等人,1990《分子生物學雜誌》(J.Mol.Biol.)403-410)以及GENEWORKS系列比較工具。BLAST和FASTA均可用於離線和線上搜索(參見奧蘇貝爾(Ausubel)等人,1999,《精編分子生物學實驗指南》(Short Protocols in Molecular Biology),7-58頁到7-60頁)。然而,對於一些應用,較佳的是使用GCG Bestfit程式。新的工具,稱為BLAST 2序列,也可用於比較蛋白質和核苷酸序列(參見《歐洲微生物學會聯合會微生物學快報》(FEMS Microbiol Lett.)1999 174(2):247-50;FEMS Microbiol Lett.1999177(1):187-8以及在國立衛生研究院的網址的國家生物技術資訊中心的網址)。雖然最終同源性%可以按照一致性進行測量,但是比對過程自身典型地不是基於全或無配對比較(all-or-nothing pair comparison)。相反,通常使用尺度相似性評分矩陣(scaled similarity score matrix),基於化學相似性或進化距離對各個成對比較評分。通常使用的這種矩陣的實例為BLOSUM62矩陣-BLAST系列程式的預設矩陣。GCG威斯康辛程 式通常使用公開的預設值或自訂符號比較表(更多細節詳見用戶手冊)。對於一些應用,較佳的是使用GCG套裝軟體的公共預設值,或在其他軟體情況下的預設矩陣,如BLOSUM62。可替代地,可以基於類似於CLUSTAL(希金斯DG(Higgins DG)和夏普PM(Sharp PM)(1988),《基因》(Gene)73(1),237-244)的演算法,使用在DNASISTM(日立軟體公司(Hitachi Software))中的多重比對特徵來計算同源性百分比。一旦軟體已經產生最佳比對,就有可能計算同源性%,較佳的是序列一致性%。軟體典型地這樣進行,作為序列比較的一部分,並且產生數位結果。該等序列也可以具有胺基酸殘基的缺失、插入或取代,其產生沈默變化並生成功能上等同的物質。可以基於胺基酸特性(如殘基的極性、電荷、可溶性、疏水性、親水性、和/或兩親性)的相似性做出有意胺基酸取代,並且因此它在將胺基酸集合成官能團中是有用的。可以僅僅基於胺基酸的側鏈特性將它們集合在一起。然而,包括突變數據同樣係更有用的。出於結構原因,如此衍生的胺基酸的集合很有可能是保守性的。該等集合可以被描述為文氏圖形式(Venn diagram)(利文斯敦C.D.(Livingstone C.D.)和巴頓G.J.(Barton G.J.)(1993)“蛋白質序列比對:用於殘基保守些的分級分析的策略”(“Protein sequence alignments:a strategy for the hierarchical analysis of residue conservation”)《生物科學計算應用》(Comput.Appl.Biosci.9:745-756)(泰勒(Taylor)W.R.(1986)“胺基酸保守性的分類”(“The classification of amino acid conservation”)《理論生物學雜誌》(J.Theor.Biol.)119;205-218)。例如可以根據下表做出保守性取代,該表描述了普遍接受的胺基酸的文氏圖分組。
Figure 112128864-A0101-12-0676-242
Figure 112128864-A0101-12-0677-243
術語“受試者”、“個體”和“患者”在本文中是可互換地使用的,指的是脊椎動物,較佳的是係哺乳動物,更加較佳的是係人類。哺乳動物包括但不限於鼠類、猴、人、農畜、體育用動物和寵物。也包括體內獲得或體外培養的生物實體的組織、細胞及其子代。
術語“治療劑(therapeutic agent)”、“可用於治療的試劑(therapeutic capable agent)”或“處理劑(treatment agent)”係可互換地使用的,並且是指在給予受試者時賦予某種有益影響的一種分子或化合物。該有益影響包括診斷確定的實現;改善疾病、症狀、障礙、或病理學病況;減少或預防疾病、症狀、障礙或病況的發作;以及總體上對抗疾病、症狀、障礙或病理學病況。
如此處使用的,“治療(treatment)”或“進行治療(treating)”或“減輕”或“改善”係可互換地使用的。該等術語係指如下途徑,該途徑用於獲得有益或希望的結果,包括但不限於治療益處和/或預防益處。治療益處意指治療中的一種或多種疾病、病況、或症狀上的任何治療上相關的改進或對其的影響。對於預防益處,該組成物可給予至處於發展具體的疾病、病況、或症狀的風險的受試者,或給予至報告了疾病的一個或多個生理學症狀的受試者,儘管該疾病、病況、或 症狀可能還沒有體現出來。
術語“有效量”或“治療有效量”係指一種藥劑的足以實現有益或希望的結果的量。治療有效量可依賴於正治療的受試者和疾病病狀、受試者的重量和年齡、疾病病況的嚴重度、給藥方式等中一項或多個而改變,並可以由熟習該項技術者容易地確定。該術語也適用藉由此處描述的顯像方法中的任一項提供一種檢測用圖像的一個劑量。具體劑量可依賴於以下中一個或多個而變化:所選擇的具體藥劑、所遵循的給藥方案、是否與其他化合物組合給予、給予時間、待顯像的組織、以及攜帶它的物理遞送系統。
除非另有說明,本發明的實踐採用免疫學、生物化學、化學、分子生物學、微生物學、細胞生物學、基因組學和重組DNA的常規技術,該等在本領域的技能之內。參見薩姆布魯克(Sambrook)、弗裡奇(Fritsch)和馬尼亞蒂斯(Maniatis),《分子選殖:實驗室手冊》(MOLECULAR CLONING:A LABORATORY MANUAL),第2版(1989);《當代分子生物學實驗手冊》(CURRENT PROTOCOLS IN MOLECULAR BIOLOGY)(F.M.奧蘇貝爾(F.M.Ausubel)等人編輯,(1987));《酶學方法》(METHODS IN ENZYMOLOGY)系列(學術出版公司):《PCR 2:實用方法》(PCR 2:A PRACTICAL APPROACH)(M.J.麥克弗森(M.J.MacPherson,B.D.Hames)和G.R.泰勒(Taylor)編輯(1995))、哈洛(Harlow)和拉內(Lane)編輯(1988)《抗體:實驗室手冊》(ANTIBODIES,A LABORATORY MANUAL),以及《動物細胞培養》(ANIMAL CELL CULTURE)(R.I.弗雷謝尼(R.I.Freshney)編輯 (1987))。
本發明的若干方面涉及包括一種或多種載體的載體系統,或載體本身。載體可以被設計為用於在原核或真核細胞中表現CRISPR轉錄物(例如核酸轉錄物、蛋白質、或酶)。例如,CRISPR轉錄物可表現於例如大腸桿菌的細菌細胞、昆蟲細胞(使用桿狀病毒表現載體)、酵母細胞、或哺乳動物細胞中。適合的宿主細胞進一步討論於Goeddel(戈德爾),《基因表現技術:酶學方法》(GENE EXPRESSION TECHNOLOGY:METHODS IN ENZYMOLOGY)185,學術出版社(Academic Press),聖地牙哥(San Diego),加利福尼亞州(Calif.)(1990年)中。可替代地,重組表現載體可在體外例如使用T7啟動子調節序列和T7聚合酶來轉錄和翻譯。
本發明的實施方式包括可包含同源取代(本文使用取代和置換兩者來表示現有胺基酸殘基或核苷酸與替代殘基和核苷酸之間的互換)的序列(多核苷酸或多肽兩者),該同源取代,即,在胺基酸的情況下發生同類取代(like-for-like substitution),如鹼性對鹼性、酸性對酸性、極性對極性。也可以發生非同源取代,即,從一類殘基到另一類殘基,或者可替代地涉及包含非天然胺基酸如鳥胺酸(在下文稱為Z)、二胺基丁酸鳥胺酸(在下文稱為B)、正亮胺酸鳥胺酸(在下文稱為O)、吡啶基丙胺酸、噻吩基丙胺酸、萘基丙胺酸和苯基甘胺酸。變體胺基酸序列可以包括適合的可插入在該序列的任何兩個胺基酸殘基之間的間隔基團,包括除了胺基酸間隔物(如甘胺酸或-β丙胺酸)之外的烷基基團,如甲基、乙基或丙基基團。一另外的變化形式,其涉及處於類肽形式的一個或多 個胺基酸殘基的存在,也是熟習該項技術者熟知的。為避免疑義,“該類肽形式”用來指代變體胺基酸殘基,其中該α-碳取代基在該殘基的氮原子上,而不是在該α-碳上。用於製備處於該類肽形式的肽的方法係本領域已知的,例如西蒙RJ(SimonRJ)等人,PNAS(1992)89(20),9367-9371和豪威爾DC(Horwell DC),《生物技術趨勢》(Trends Biotechnol.)(1995)13(4),132-134。
同源建模:在其他Cas9異種同源物中的相應殘基可以藉由張(Zhang)等人,2012(《自然》(Nature);490(7421):556-60)和陳(Chen)等人,2015(《PLoS計算生物學》(PLoS Comput Biol);11(5):E1004248)的方法進行鑒定-計算蛋白質-蛋白質相互作用(PPI)方法用以預測由結構域-模體介面介導的相互作用。PrePPI(預測PPI),一種基於結構的PPI預測方法,使用貝葉斯統計框架(Bayesian statistical framework)將結構證據與非結構證據相結合。該方法涉及取一對查詢蛋白並使用結構比對以便鑒別與它們實驗確定的結構或同源性模型相對應的結構代表。結構比對進一步用來藉由考慮全域和局部幾何關係來鑒定接近的和遠端的結構相鄰物。每當結構代表物的兩個相鄰物形成報告於蛋白質資料庫中的複合物,這限定了用於對兩個查詢蛋白質之間的相互作用進行建模的模板。複合物的模型係藉由在模板中將代表性結構疊加在其對應的結構相鄰物上來創建。這種方法進一步描述於戴伊(Dey)等人,2013(《蛋白質科學》(Prot Sci);22:359-66)。
出於本發明的目的,擴增意指利用引物和聚合酶的能夠以合理的保真度複製靶序列的任何方法。可以藉由天然或重組DNA聚合 酶,如TaqGoldTM、T7 DNA聚合酶、大腸桿菌DNA聚合酶的Klenow片段以及逆轉錄酶進行擴增。一較佳的擴增方法係PCR。
在某些方面,本發明涉及載體。如本文使用的,“載體”係允許或促進一個實體從一個環境轉移到另一個環境中的工具。它係複製子,如質粒、噬菌體、或粘粒,另一個DNA片段可以插入其中,從而引起該插入的片段的複製。通常,當與適當的控制元件關聯時,載體能夠複製。一般而言,術語“載體”係指核酸分子,其能夠運送與其連接的另一種核酸分子。載體包括但不限於,單股、雙股、或部分雙股的核酸分子;包括一個或多個自由端、無自由端(例如環狀的)的核酸分子;包括DNA、RNA、或兩者的核酸分子;以及本領域已知的其他多種多樣的多核苷酸。一種類型的載體係“質粒”,其係指其中可以例如藉由標準分子選殖技術插入另外的DNA片段的環狀雙股DNA環。另一種類型的載體係病毒載體,其中病毒衍生的DNA或RNA序列存在於用於包裝病毒(例如,逆轉錄病毒、複製缺陷型逆轉錄病毒、腺病毒、複製缺陷型腺病毒、以及腺相關病毒(AAV))的載體中。病毒載體還包含由用於轉染到宿主細胞中的病毒攜帶的多核苷酸。某些載體(例如,具有細菌複製起點的細菌載體和附加型哺乳動物載體)能夠在它們被導入的宿主細胞中自主複製。其他載體(例如,非附加型哺乳動物載體)在引入宿主細胞後整合到該宿主細胞的基因組中,並且由此與該宿主基因組一起複製。而且,某些載體能夠指導它們可操作連接的基因的表現。這樣的載體在此被稱為“表現載體”。在重組DNA技術中使用的普通表現栽體通常是質粒形式。
重組表現載體可包含處於適合於在宿主細胞中的核酸表現的形式的本發明的核酸,這意味著該等重組表現載體包含基於待用於表現的宿主細胞而選擇的一種或多種調節元件,所述調節元件可操作地連接至待表現的核酸序列。在重組表現載體內,“可操作地連接”旨在表示感興趣的核苷酸序列以允許該核苷酸序列的表現的方式被連接至該一種或多種調節元件(例如,處於體外轉錄/翻譯系統中或當該載體被引入到宿主細胞中時,處於該宿主細胞中)。關於重組和選殖方法,提及2004年9月2日以US 2004-0171156 A1公開的美國專利申請10/815,730,該專利的內容藉由引用以其全文併入本文。
本發明的多個方面涉及用於嵌合的RNA與Cas9的雙順反子載體。用於嵌合的RNA與Cas9的雙順反子表現載體係較佳的。一般而言並且特別地,在這個實施方式中,Cas9較佳的是由CBh啟動子驅動。嵌合RNA可以較佳的是由Pol III啟動子(如U6啟動子)驅動。理想地,將這兩者結合。嵌合的指導RNA典型地由20bp指導序列(N)組成並且這可以接合到tracr序列上(從下股的第一個“U”到該轉錄物的結尾)。該tracr序列可以在如指示的不同位置被截短。指導序列和tracr序列被該tracr配對序列隔開,該tracr配對序列可以是GUUUUAGAGCUA。這之後可以是如所示的環序列GAAA。這兩者都係較佳的實例。申請人已經藉由SURVEYOR測定證明了在人EMX1PVALB座位處的Cas9介導的indel。ChiRNA由其“+n”標誌指示,並且crRNA係指指導序列和tracr序列被表現為分開的轉錄物的雜交體RNA。貫穿本申請,嵌合RNA也可以被稱為單指導、或合成指導RNA(sgRNA)。
在一些實施方式中,提供了指導RNA中的環。這可以是莖環或四核苷酸環(tetra loop)。該環較佳的是係GAAA,但是並並限於這個序列或者實際上在長度上僅僅為4bp。實際上,用於在髮夾結構中使用的較佳的環形成序列在長度上為四個核苷酸,並且最較佳的是具有序列GAAA。然而,可以使用更長或更短的環序列,正如可替代的序列。該等序列較佳的是包括三聯體(例如,AAA)、和另外的核苷酸(例如C或G)。環形成序列的實例包括CAAA和AAAG。在實踐在此揭露的任何方法中,可以經由本領域已知的一種或多種方法將適合的載體引入進細胞或胚胎中,該等方法包括但不限於,顯微注射、電穿孔、聲致穿孔、基因槍、磷酸鈣介導的轉染、陽離子轉染、脂質體轉染、樹枝狀聚合物轉染、熱休克轉染、核轉染、磁轉染、脂轉染、刺穿轉染(impalefection)、光學轉染、專有劑增強的核酸攝取以及經由脂質體、免疫脂質體、病毒顆粒或人工病毒體進行遞送。在一些方法中,藉由顯微注射將該載體引入進胚胎中。可以將這個或該等載體顯微注射進胚胎的細胞核或細胞質中。在一些方法中,藉由核轉染將這個或該等載體引入進細胞中。
術語“調節元件”旨在包括啟動子、增強子、內部核糖體進入位點(IRES)、和其他表現控制元件(例如轉錄終止信號,如多聚腺苷酸化信號和多聚U序列)。這樣的調節序列例如描述於戈德爾(Goeddel),《基因表現技術:酶學方法》(GENE EXPRESSION TECHNOLOGY:METHODS IN ENZYMOLOGY)185,學術出版社(Academic Press),聖地牙哥(San Diego),加利福尼亞州(1990)中。調節元件包括指導一個核苷酸序列在許多類型的宿主細胞中的組成型表 現的那些序列以及指導該核苷酸序列只在某些宿主細胞中表現的那些序列(例如,組織特異型調節序列)。組織特異型啟動子可主要指導在感興趣的期望組織中的表現,所述組織例如肌肉、神經元、骨、皮膚、血液、特定的器官(例如肝臟、胰腺)、或特殊的細胞類型(例如淋巴細胞)。調節元件還可以時序依賴性方式(如以細胞週期依賴性或發育階段依賴性方式)指導表現,該方式可以是或者可以不是組織或細胞類型特異性的。在一些實施方式中,一載體包含一個或多個pol III啟動子(例如1、2、3、4、5、或更多個pol III啟動子)、一個或多個pol II啟動子(例如1、2、3、4、5、或更多個pol II啟動子)、一個或多個pol I啟動子(例如1、2、3、4、5、或更多個pol I啟動子)、或其組合。pol III啟動子的實例包括但不限於U6和H1啟動子。pol II啟動子的實例包括但不限於逆轉錄勞斯肉瘤病毒(RSV)LTR啟動子(視情況具有RSV增強子)、巨細胞病毒(CMV)啟動子(視情況具有CMV增強子)[參見,例如,波沙特(Boshart)等人,《細胞》(Cell)41:521-530(1985)]、SV40啟動子、二氫葉酸還原酶啟動子、β-肌動蛋白啟動子、磷酸甘油激酶(PGK)啟動子、和EF1α啟動子。還被術語“調節元件”涵蓋的是增強子元件,如WPRE;CMV增強子;在HTLV-I的LTR中的R-U5’片段(《分子細胞生物學》(Mol.Cell.Biol.),第8(1)卷,第466-472頁,1988);SV40增強子;以及在兔β-珠蛋白的外顯子2與3之間的內含子序列(《美國國家科學院院刊》(Proc.Natl.Acad.Sci.USA.),第78(3)卷,第1527-31頁,1981)。熟習該項技術者應當理解的是,表現載體的設計可取決於比如待轉化的宿主細胞的選擇、所希望的表現水平等因素。載體可以被引入到宿主細胞中而由此產生轉錄物、蛋白質、或肽,包括由如本文描述的核酸編碼的融合蛋白或肽(例 如,規律間隔成簇短迴文重複(CRISPR)轉錄物、蛋白質、酶、其突變體形式、其融合蛋白等)。關於調節序列,提及美國專利申請10/491,026,該專利的內容藉由引用以其全文併入本文。關於啟動子,提及PCT公開WO12/511,940和美國申請12/511,940,該等專利的內容藉由引用以其全文併入本文。
載體可以被設計為用於在原核或真核細胞中表現CRISPR轉錄物(例如核酸轉錄物、蛋白質、或酶)。例如,CRISPR轉錄物可表現於例如大腸桿菌的細菌細胞、昆蟲細胞(使用桿狀病毒表現載體)、酵母細胞、或哺乳動物細胞中。適合的宿主細胞進一步討論於Goeddel(戈德爾),《基因表現技術:酶學方法》(GENE EXPRESSION TECHNOLOGY:METHODS IN ENZYMOLOGY)185,學術出版社(Academic Press),聖地牙哥(San Diego),加利福尼亞州(Calif.)(1990年)中。可替代地,重組表現載體可在體外例如使用T7啟動子調節序列和T7聚合酶來轉錄和翻譯。
載體可以被引入原核生物或原核細胞中並且在其中增殖。在一些實施方式中,原核生物用來擴增有待引入真核細胞中的載體的多個拷貝,或者作為有待引入真核細胞中的載體的產生中的中間載體(例如,擴增質粒作為病毒載體包裝系統的一部分)。在一些實施方式中,原核生物用來擴增一個載體的多個拷貝並且表現一種或多種核酸,如提供用於遞送到宿主細胞或宿主生物中的一種或多種蛋白質的來源。蛋白質在原核生物中的表現最經常在大腸桿菌中用含有指導融合或非融合蛋白的表現的組成型或誘導型啟動子的載體來進行。融合載體將多個 胺基酸添加到在其中編碼的蛋白質上,如該重組蛋白的胺基端上。這樣的融合載體可以用於一個或多個目的,如:(i)增加重組蛋白的表現;(ii)增加重組蛋白的溶解性;以及(iii)藉由在親和純化中充當配位基來輔助重組蛋白的純化。通常,在融合表現載體中,將蛋白切割位點引入至融合部分與重組蛋白的接合處以使得能夠在純化融合蛋白之後將重組蛋白與融合部分分離。這類酶以及它們的同源識別序列包括因子Xa、凝血酶以及腸激酶。示例性融合表現載體包括pGEX(發瑪西亞生物技術有限公司(Pharmacia Biotech Inc);史密斯和詹森,1988.《基因》(Gene)67:31-40)、pMAL(紐英倫生物技術公司(New England Biolabs),貝芙麗(Beverly),麻塞諸塞州(Mass.))以及pRIT5(發瑪西亞公司,皮斯卡塔韋(Piscataway),新澤西州(N.J.)),它們分別將穀胱甘肽S-轉移酶(GST)、麥芽糖E結合蛋白或蛋白A融合至靶重組蛋白。適合的誘導型非融合大腸桿菌表現載體的實例包括pTrc(Amrann(阿姆蘭)等人,(1988年)《基因》(Gene)69:301-315)以及pET 11d(Studier(斯圖迪爾)等人,《基因表現技術:酶學方法》(GENE EXPRESSION TECHNOLOGY:METHODS IN ENZYMOLOGY)185,學術出版社(Academic Press),聖地牙哥(San Diego),加利福尼亞州(Calif.)(1990年)60-89。在一些實施方式中,載體係酵母表現載體。用於在酵母釀酒中表現的載體的實例包括pYepSec1(巴爾戴利(Baldari)等人,1987,《歐洲分子生物學學會雜誌》(EMBO J)6:229-234)、pMFa(庫爾堅(Kurjan)和赫斯庫伍特茲(Herskowitz),1982,《細胞》(Cell)30:933-943)、pJRY88(舒爾茨(Schultz)等人,1987,《基因》(Gene)54:113-123)、pYES2(英傑公司(Invitrogen Corporation),聖地牙哥(San Diego),加利福尼亞州 (Calif))、以及picZ(英傑公司,聖地牙哥,加利福尼亞州)。在一些實施方式中,使用桿狀病毒載體,載體驅動昆蟲細胞中的蛋白質表現。可用於在培養的昆蟲細胞(例如,SF9細胞)中表現蛋白質的桿狀病毒載體包括pAc系列(史密斯(Smith)等人,1983,Mol.Cell.Biol.)3:2156-2165)和pVL系列(拉克瑙(Lucklow)和薩莫斯(Summers),1989,《病毒學》(Virology)170:31-39)。
在一些實施方式中,使用哺乳動物表現載體,載體能夠驅動一種或多種序列在哺乳動物細胞中表現。哺乳動物表現載體的實例包括pCDM8(錫德(Seed),1987,《自然》(Nature)329:840)和pMT2PC(考夫曼(Kaufman)等人,1987,《歐洲分子生物學學會雜誌》(EMBO J.)6:187-195)。當用於哺乳動物細胞中時,表現載體的控制功能典型地由一種或多種調節元件提供。例如,常用的啟動子來源於多瘤、腺病毒2、巨細胞病毒、猿猴病毒40、以及本文所述和本領域已知的其他病毒。對於用於原核細胞和真核細胞兩者的其他適合的表現系統參見例如薩姆布魯克(Sambrook)等人的《分子選殖實驗指南》(Molecular Cloning:A Laboratory Manual.)(第2版)的第16和第17章,冷泉港實驗室(Cold Spring Harbor Laboratory),冷泉港實驗室出版社(Cold Spring Harbor Laboratory Press),冷泉港(Cold Spring Harbor),紐約,1989。
在一些實施方式中,重組哺乳動物表現載體能夠指導核酸優先在特定細胞類型中表現(例如,使用組織特異型調節元件來表現核酸)。組織特異型調節元件係本領域中已知的。適合的組織特異型啟動子的非限制性實例包括白蛋白啟動子(肝臟特異性的;平克特(Pinkert) 等人,1987.Genes Dev.1:268-277),淋巴特異性啟動子(卡裡曼(Calame)和伊頓(Eaton),1988.Adv.Immunol.43:235-275),特別是T細胞受體的啟動子(維納圖(Winoto)和巴爾迪莫(Baltimore),1989.《歐洲分子生物學學會雜誌》(EMBO J.)8:729-733)和免疫球蛋白(巴納吉(Baneiji)等人,1983.《細胞》(Cell)33:729-740;奎恩(Queen)和巴爾迪莫(Baltimore),1983.《細胞》(Cell)33:741-748),神經元特異性啟動子(例如,神經絲啟動子;伯恩(Byrne)和魯德爾(Ruddle),1989.Proc.Natl.Acad.Sci.USA)86:5473-5477),胰腺特異性啟動子(艾德蘭德(Edlund)等人,1985.《科學》(Science)230:912-916),以及乳腺特異性啟動子(例如,乳清啟動子;美國專利案號4,873,316和歐洲申請公開號264,166)。還涵蓋發育型調節啟動子,例如,鼠科動物同源框蛋白(hox)啟動子凱賽爾((Kessel)和格魯斯(Gruss),1990.《科學》(Science)249:374-379)和α-甲胎蛋白啟動子(卡姆皮斯(Campes)和蒂爾曼(Tilghman),1989.Genes Dev.3:537-546)。關於該等原核和真核載體,提及美國專利6,750,059,該專利的內容藉由引用以其全文併入本文。本發明的其他實施方式可涉及病毒載體的使用,關於它提及美國專利申請13/092,085,該專利的內容藉由引用以其全文併入本文。組織特異型調節元件係本領域中已知的,並且在這個方面提及美國專利7,776,321,該專利的內容藉由引用以其全文併入本文。在一些實施方式中,調節元件可操作地連接至CRISPR系統的一個或多個元件,從而驅動該CRISPR系統的該一個或多個元件的表現。一般而言,CRISPR(規律間隔成簇短迴文重複),也稱為SPIDR(SPacer間隔開的同向重複),構成通常對於特定細菌物種而言特異性的DNA基因座的家族。該CRISPR座位包含在大腸桿菌 中被識別的間隔開的短序列重複(SSR)的一不同類(石野(Ishino)等人,《細菌學雜誌》(J.Bacteriol.),169:5429-5433[1987];和中田(Nakata)等人,《細菌學雜誌》(J.Bacteriol.),171:3553-3556[1989])、以及相關基因。類似的間隔開的SSR已經鑒定於地中海富鹽菌(Haloferax mediterranei)、釀膿鏈球菌、魚腥藻屬、和結核分枝桿菌中(參見,格魯恩(Groenen)等人,《分子微生物學》(Mol.Microbiol.),10:1057-1065[1993];霍(Hoe)等人,《新發感染性疾病》(Emerg.Infect.Dis.),5:254-263[1999];馬斯波爾(Masepohl)等人,《生物化學與生物物理學學報》(Biochim.Biophys.Acta)1307:26-30[1996];and Mojica et al.,Mol.Microbiol.),17:85-93[1995])。該等CRISPR座位典型地不同於其他SSR的重複結構,該等重複已被稱為規律間隔的短重複(SRSR)(詹森(Janssen)等人,《OMICS:整合生物學雜誌》(OMICS J.Integ.Biol.),6:23-33[2002];以及莫吉卡(Mojica)等人,《分子微生物學》(Mol.Microbiol.),36:244-246[2000])。一般而言,該等重複係以簇存在的短元件,其被具有基本上恒定長度的獨特間插序列規律地間隔開(莫吉卡(Mojica)等人,[2000],同上)。雖然重複序列在菌株之間係高度保守的,許多間隔開的重複和該等間隔區的序列一般在菌株與菌株之間不同(馮.埃姆登(van Embden)等人,《細菌學雜誌》(J.Bacteriol.),182:2393-2401[2000])。已經在40種以上的原核生物中鑒定出CRISPR座位(參見,例如,詹森(Janssen)等人,《分子微生物學》(Mol.Microbiol.),43:1565-1575[2002];以及莫吉卡(Mojica)等人,[2005]),包括但不限於:氣火菌屬(Aeropyrum)、熱棒菌屬(Pyrobaculum)、硫化葉菌屬(Sulfolobus)、古球菌屬(Archaeoglobus)、鹽盒菌屬(Halocarcula)、甲 烷桿菌屬(Methanobacterium)、甲烷球菌屬(Methanococcus)、甲烷八疊球菌屬(Methanosarcina)、甲烷火菌屬(Methanopyrus)、焦球菌屬(Pyrococcus)、嗜酸菌屬(Picrophilus)、熱原體屬(Thermoplasma)、棒桿菌屬(Corynebacterium)、分枝桿菌屬(Mycobacterium)、鏈黴菌屬(Streptomyces)、產水菌屬(Aquifex)、紫單胞菌屬(Porphyromonas)、綠菌屬(Chlorobium)、棲熱菌屬(Thermus)、芽孢桿菌屬(Bacillus)、利斯特菌屬(Listeria)、葡萄球菌屬(Staphylococcus)、梭菌屬(Clostridium)、好熱厭氧桿菌屬(Thermoanaerobacter)、支原體屬(Mycoplasma)、梭桿菌屬(Fusobacterium)、固氮弓菌屬(Azarcus)、色桿菌屬(Chromobacterium)、奈瑟球菌屬(Neisseria)、亞硝化單胞菌屬(Nitrosomonas)、脫硫弧菌屬(Desulfovibrio)、地桿菌屬(Geobacter)、粘球菌屬(Myxococcus)、彎曲桿菌屬(Campylobacter)、類桿菌屬(Wolinella)、不動桿菌屬(Acinetobacter)、歐文菌屬(Erwinia)、埃希菌屬(Escherichia)、軍團菌屬(Legionella)、甲基球菌屬(Methylococcus)、巴斯德菌屬(Pasteurella)、發光細菌屬(Photobacterium)、沙門菌屬(Salmonella)、黃單胞菌屬(Xanthomonas)、耶爾森菌屬(Yersinia)、密螺旋體屬(Treponema)、和棲熱袍菌屬(Thermotoga)。
一般而言,如在本申請中使用的“核酸靶向系統”統一指代在表現或引導核酸靶向CRISPR-相關(“Cas”)基因(在本文還稱為效應蛋白)的活性中涉及的轉錄物和其他元件,包括編碼核酸靶向Cas(效應物)蛋白和指導RNA(包括crRNA序列和反式活化CRISPR/Cas系統RNA(tracrRNA)序列)的序列、或其他序列以及來自核酸靶向CRISPR座位 的轉錄物。在一些實施方式中,核酸靶向系統的一種或多種元件衍生自V型/VI型核酸靶向CRISPR系統。在一些實施方式中,核酸靶向系統的一個或多個元件來源於包含內源核酸靶向CRISPR系統的特殊生物,如釀膿鏈球菌。一般而言,核酸靶向系統表徵為促進核酸靶向複合物在靶序列的位點處形成的元件。在核酸靶向複合物形成的背景下,“靶序列”係指指導序列被設計為對其具有互補性的序列,其中在靶序列與指導RNA之間的雜交促進DNA或RNA-靶向複合物的形成。完全互補性不是必需的,條件係存在足夠互補性以引起雜交並且促進核酸靶向複合物的形成。靶序列可以包括RNA多核苷酸。在一些實施方式中,靶序列位於細胞的細胞核或細胞質中。在一些實施方式中,該靶序列可位於真核細胞的一個細胞器例如線粒體或葉綠體內。可被用於重組到包括該靶序列的靶基因座中的序列或模板被稱為“編輯模板”或“編輯RNA”或“編輯序列”。在本發明的方面,外源的模板RNA可稱為編輯模板。在本發明的一方面,該重組係同源重組。
典型地,在內源核酸靶向系統的背景下,核酸靶向複合物(包含雜交到靶序列上並且與一種或多種核酸靶向效應蛋白複合的指導RNA)的形成導致在該靶序列中或其附近(例如在1、2、3、4、5、6、7、8、9、10、20、50、或更多個鹼基對之內)的一條股或兩條RNA股的切割。在一些實施方式中,將驅動核酸靶向系統的一個或多個元件的表現的一種或多種載體引入到宿主細胞中,使得該核酸靶向系統的該等元件的表現在一個或多個靶位點指導核酸靶向複合物的形成。例如,核酸-靶向效應蛋白和指導RNA可以各自可操作地連接到在分開的載體上的單獨 的調節元件。可替代地,從相同或不同調節元件表現的二個或更多個元件可以結合在單個載體中,其中提供該核酸靶向系統的任何組分的一種或多種另外的載體不包括在該第一載體中。結合在單個載體中的靶向核酸的系統元件可以按照任何適合的方向排列,如一個元件相對於第二元件位於5'(“上游”)或3'(“下游”)。一個元件的編碼序列可以位於第二元件的編碼序列的同一條股或相對股上,並且取向為相同或相對的方向。在一些實施方式中,單一啟動子驅動編碼核酸靶向效應蛋白和指導RNA的轉錄物的表現,該指導RNA嵌入在一個或多個內含子序列中(例如,各自處於不同內含子中,兩個或更多個處於至少一個內含子中,或全部處於單一內含子中)。在一些實施方式中,核酸靶向效應蛋白和指導RNA可操作地連接至相同的啟動子上並且從其表現。
一般而言,指導序列係與靶多核苷酸序列具有足夠互補性以便與該靶序列雜交並且引導核酸靶向複合物與該靶序列的序列特異性結合的任何多核苷酸序列。在一些實施方式中,當使用適合的比對演算法進行最佳比對係,在指導序列與其相應的靶序列之間的互補程度係約或多於約50%、60%、75%、80%、85%、90%、95%、97.5%、99%、或更多。可以使用用於比對序列的任何適合的演算法來確定最佳比對,其非限制性實例包括史密斯-沃特曼(Smith-Waterman)演算法、尼德曼-翁施(Needleman-Wunsch)演算法、基於伯羅斯-惠勒變換(Burrows-Wheeler Transform)的演算法(例如伯羅斯-惠勒比對工具(Burrows Wheeler Aligner))、ClustalW、Clustal X、BLAT、Novoalign(Novocraft技術公司)、ELAND(億明達公司(Illumina),聖地牙哥,加利福尼亞州)、SOAP(在 soap.genomics.org.cn可獲得)、以及Maq(在maq.sourceforge.net可獲得)。在一些實施方式中,指導序列在長度上為約或多於約5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、75個、或更多個核苷酸。在一些實施方式中,指導序列在長度上為少於約75、50、45、40、35、30、25、20、15、12個、或更少的核苷酸。可以藉由任何適合的測定法來評估指導序列引導核酸靶向複合物與靶序列的序列特異性結合的能力。例如,足以形成核酸靶向複合物的核酸靶向系統的組分,包括有待測試的指導序列在內,可以例如藉由用編碼該核酸靶CRISPR向序列的組分的載體進行轉染而被提供到具有相應靶序列的宿主細胞中,隨後藉由如本文所述的Surveyor測定來評估在該靶序列之內或附近的優先切割。類似地,藉由提供該靶序列、包括有待測試的指導序列在內的核酸靶向複合物的組分、和不同於該測試指導序列的對照指導序列,並且比較在該測試指導序列與該對照指導序列反應之間的靶序列處或附近的結合或切割率,可以在試管中評估靶多核苷酸序列(或在其附近的序列)的切割。其他測定法係可能的,並且將由熟習該項技術者想到。
指導序列可以被選擇為靶向任何靶序列。在一些實施方式中,該靶序列係在基因轉錄物或mRNA內的序列。
在一些實施方式中,該靶序列係在細胞的基因組內的序列。
在一些實施方式中,指導序列被選擇為降低在該指導序列內的二級結構程度。可以藉由任何適合的多核苷酸折疊演算法來確定二 級結構。一些演算法係基於計算最小吉布斯(Gibbs)自由能。一種這樣的演算法的實例係mFold,正如祖克(Zuker)和施蒂格勒(Stiegler)所描述的(《核酸研究》(Nucleic Acids Res.)9(1981),133-148)。折疊演算法的另一個實例係使用質心結構預測演算法的由維也納大學(University of Vienna)的理論化學研究所(Institute for Theoretical Chemistry)研發的線上網路服務器RNAfold(參見例如,A.R.格魯伯(Gruber)等人,2008,《細胞》(Cell)106(1):23-24;以及PA卡爾(Carr)和GM丘奇(Church),2009,《自然生物技術》(Nature Biotechnology)27(12):1151-62)。另外的演算法可以發現於美國申請案序號61/836,080)中;藉由引用併入本文。
在一些實施方式中,還提供了重組模板。重組模板可以是如本文所述的另一個載體的組分,其被包含在一個分開的載體中,或者被提供為一個分開的多核苷酸。在一些實施方式中,重組模板被設計為用作在同源重組中的模板,如在被作為核酸靶向複合物的一部分的核酸靶向效應蛋白切開或切割的靶序列之內或在其附近。模板多核苷酸可以具有任何適合的長度,如約或多於約10、15、20、25、50、75、100、150、200、500、1000個、或更多個核苷酸長度。在一些實施方式中,該模板多核苷酸與包含該靶序列的多核苷酸的一部分互補。當進行最佳比對時,模板多核苷酸能夠與靶序列的一個或多個核苷酸(例如約或多於約1、5、10、15、20、25、30、35、40、45、50、60、70、80、90、100個、或更多個核苷酸)重疊。在一些實施方式中,當一個模板序列與包含靶序列的多核苷酸進行最佳比對時,該模板多核苷酸的最近的核苷酸在距 離該靶序列的約1、5、10、15、20、25、50、75、100、200、300、400、500、1000、5000、10000個、或更多個核苷酸之內。
在一些實施方式中,該核酸靶向效應蛋白係包含一個或多個異源蛋白結構域(例如除了該核酸靶向效應蛋白之外的約或多於約1、2、3、4、5、6、7、8、9、10個、或更多個結構域)的融合蛋白的一部分。在一些實施方式中,該CRISPR效應蛋白/酶係包含一個或多個異源蛋白結構域(例如除了該CRISPR酶之外的約或多於約1、2、3、4、5、6、7、8、9、10個、或更多個結構域)的融合蛋白的一部分。CRISPR酶融合蛋白可以包含任何其他蛋白質,以及視情況在任何兩個結構域之間的連接序列。可以融合到CRISPR酶上的蛋白質結構域的實例包括但不限於,表位標籤、報告基因序列、以及具有下列活性的一者或多者的蛋白質結構域:修飾烷酶活性、去甲酶活性、轉錄活化活性、轉錄抑制活性、轉錄釋放因子活性、組蛋白修飾活性、RNA切割活性和核酸結合活性。表位標籤的非限制性實例包括組胺酸(His)標籤、V5標籤、FLAG標籤、流感病毒血凝素(HA)標籤、Myc標籤、VSV-G標籤、和硫氧還蛋白(Trx)標籤。報告基因的實例包括,但不限於,穀胱甘肽-S-轉移酶(GST)、辣根過氧化物酶(HRP)、氯黴素乙醯轉移酶(CAT)、β-半乳糖苷酶、β-葡糖醛酸糖苷酶、螢光素酶、綠色螢光蛋白(GFP)、HcRed、DsRed、青螢光蛋白(CFP)、黃色螢光蛋白(YFP)、以包括藍色螢光蛋白(BFP)的自發螢光蛋白。CRISPR酶可以融合到編碼一種蛋白質或蛋白質片段的基因序列上,所述蛋白質或蛋白質片段結合DNA分子或結合其他細胞分子,其包括,但不限於,麥芽糖結合蛋白(MBP)、S-tag、Lex ADNA結 合結構域(DBD)融合物、GAL4 DNA結合結構域融合物、以及單純皰疹病毒(HSV)BP16蛋白融合物。可以形成包含CRISPR酶的融合蛋白的一部分的另外的結構域描述於US 20110059502中,藉由引用將其併入本文。在一些實施方式中,使用標記的CRISPR酶來鑒定靶序列的位置。
在一些實施方式中,CRISPR酶可以形成可誘導系統的組分。該系統的誘導性質將允許該系統利用一種能量形式對基因編輯或基因表現進行時空控制。該能量形式可以包括但不限於,電磁輻射、聲能、化學能和熱能。可誘導系統的實例包括四環素誘導型啟動子(Tet-On或Tet-Off)、小分子雙雜交體轉錄活化系統(FKBP、ABA等)或光可誘導系統(光敏素、LOV結構域或隱花色素)。在一個實施方式中,該CRISPR酶可以是光可誘導轉錄效應物(LITE)的一部分,從而以序列特異性方式引導轉錄活性的變化。光的組分可以包括CRISPR酶、光響應細胞色素異二聚體(例如,來自擬南芥)、以及轉錄活化/抑制結構域。可誘導的DNA結合蛋白和它們的使用方法的另外實例提供於US 61/736465和US 61/721,283和WO 2014/018423和US 8889418、US 8895308、US 20140186919、US 20140242700、US 20140273234、US 20140335620、WO 2014093635中,將該等文獻藉由引用以其全文特此結合。
在一些方面,本發明提供了以下方法,該等方法包括向宿主細胞遞送一種或多種多核苷酸,如或如本文描述的一種或多種載體、其一種或多種轉錄物和/或一種或多種自其轉錄的蛋白。在一些方面,本發明進一步提供了藉由這樣的方法產生的細胞以及包括這樣的細胞或由這樣的細胞產生的生物體(例如動物、植物、或真菌)。在一些實施方式 中,將與(並且視情況與其複合)指導RNA組合的核酸靶向效應蛋白遞送至細胞。可以使用常規的病毒和非病毒基的基因轉移方法將核酸引入哺乳動物細胞或靶組織中。可以使用這樣的方法向培養物中或宿主生物中的細胞給予編碼核酸靶向系統的組分的核酸。非病毒載體遞送系統包括DNA質粒、RNA(例如在此描述的載體的轉錄物)、裸核酸以及與遞送賦形劑(如脂質體)複合的核酸。病毒載體遞送系統包括DNA和RNA病毒,在被遞送至細胞後它們具有游離型或整合型基因組。關於基因療法程式的綜述,參見安德森(Anderson),《科學》(Science)256:808-813(1992);納貝爾(Nabel)&費爾格納(Felgner),TIBTECH 11:211-217(1993);三穀(Mitani)&卡斯基(Caskey),TIBTECH 11:162-166(1993);狄龍(Dillon),TIBTECH 11:167-175(1993);米勒(Miller),《自然》(Nature)357:455-460(1992);範.布朗特(Van Brunt),《生物技術》(Biotechnology)6(10):1149-1154(1988);維涅(Vigne),《恢復神經學和神經科學》(Restorative Neurology and Neuroscience)8:35-36(1995);克雷默(Kremer)&佩里科德特(Perricaudet),《英國醫學公報》(British Medical Bulletin)51(1):31-44(1995);哈嗒嗒(Haddada)等人,在《微生物學和免疫學當前主題》(Current Topics in Microbiology and Immunology)中,多爾夫勒(Doerfler)和博姆(Böhm)(編輯)(1995);以及餘(Yu)等人,《基因療法》(Gene Therapy)1:13-26(1994)。
核酸的非病毒遞送方法包括脂轉染、核轉染、顯微注射、基因槍、病毒顆粒、脂質體、免疫脂質體、聚陽離子或脂質:核酸共軛物、裸DNA、人工病毒體以及DNA的試劑增強性攝取。脂轉染描述於例如美 國專利案號5,049,386、4,946,787;和4,897,355),並且脂轉染試劑係商業銷售的(例如TransfectamTM和LipofectinTM)。適於多核苷酸的有效的受體識別脂轉染的陽離子和中性脂質包括Felgner(費爾格納),WO 91/17424;WO 91/16024的那些。遞送可以針對細胞(例如體外或離體給予)或靶組織(例如體內給予)。
脂質:核酸複合物(包括靶向的脂質體,如免疫脂質複合物)的製備係熟習該項技術者熟知的(參見例如,克麗絲特爾(Crystal),《科學》(Science)270:404-410(1995);布萊澤(Blaese)等人,《癌症基因療法》(Cancer Gene Ther.)2:291-297(1995);貝爾(Behr)等人,《生物共軛化學》(Bioconjugate Chem.)5:382-389(1994);雷米(Remy)等人,《生物共軛化學》5:647-654(1994);高(Gao)等人,《基因療法》(Gene Therapy)2:710-722(1995);艾哈邁德(Ahmad)等人,《癌症研究》(Cancer Res.)52:4817-4820(1992);美國專利案號4,186,183、4,217,344、4,235,871、4,261,975、4,485,054、4,501,728、4,774,085、4,837,028以及4,946,787)。
使用RNA或DNA病毒基的系統遞送核酸利用將病毒靶向體內的特定細胞並將病毒有效負荷(payload)運至細胞核中的高度進化的過程。可以將病毒載體直接給予至患者(體內)或可以使用它們在體外處理細胞,並且視情況,可以將修飾的細胞給予至患者(離體)。常規的病毒基的系統可以包括用於基因轉移的逆轉錄病毒載體、慢病毒載體、腺病毒載體、腺相關病毒載體以及單純皰疹病毒載體。用逆轉錄病毒、慢病毒和腺相關病毒基因轉移方法整合進宿主基因組中是可能的,這通常導致插入轉基因的長期表現。另外,已經在不同細胞類型和靶組 織中觀察到高轉導效率。
可以藉由摻入外源包膜蛋白,擴展靶細胞的潛在靶群而改變逆轉錄病毒的向性。慢病毒載體係能夠轉導或感染非分裂細胞並典型地產生較高病毒效價的逆轉錄病毒載體。因此,逆轉錄病毒基因轉移系統的選擇將依賴於靶組織。逆轉錄病毒載體由順式作用長末端重複組成,該等長末端重複具有包裝多達6-10kb的外源序列的能力。最低量的順式作用LTR對於載體的複製和包裝而言是足夠的,然後使用該等載體將治療基因整合進靶細胞中,以提供永久的轉基因表現。廣泛使用的逆轉錄病毒載體包括基於鼠白血病病毒(MuLV)、長臂猿白血病病毒(GaLV)、猴免疫缺陷病毒(SIV)、人類免疫缺陷病毒(HIV)及其組合的那些(參見例如,布赫謝爾(Buchscher)等人,《病毒學雜誌》(J.Virol.)66:2731-2739(1992);約翰(Johann)等人,《病毒學雜誌》66:1635-1640(1992);佐姆內爾費爾特(Sommnerfelt)等人,《病毒學》(Virol.)176:58-59(1990);威爾遜(Wilson)等人,《病毒學雜誌》63:2374-2378(1989);米勒(Miller)等人,《病毒學雜誌》65:2220-2224(1991);PCT/US 94/05700)。在暫態表現係較佳的應用中,可以使用腺病毒基系統。腺病毒基載體在許多細胞類型中能夠具有非常高的轉導效並且無需細胞分裂。用這樣的載體,已經獲得了較高的效價和表現水平。可以在相對簡單的系統中大量地產生此載體。還可以使用腺相關病毒(“AAV”)載體轉導具有靶核酸的細胞,例如,在體外產生核酸和肽,以及用於體內和離體基因療法程式(參見例如,韋斯特(West)等人,《病毒學》(Virology)160:38-47(1987);美國專利案號4,797,368;WO 93/24641;科丁(Kotin),《人類基 因療法》(Human Gene Therapy)5:793-801(1994);繆斯科斯卡(Muzyczka),《臨床研究雜誌》(J.Clin.Invest.)94:1351(1994))。重組AAV載體的構建描述於多個出版物中,包括美國專利案號5,173,414;特拉特斯金(Tratschin)等人,《分子與細胞生物學》(Mol.Cell.Biol.)5:3251-3260(1985);特拉特斯金等人,《分子與細胞生物學》(Mol.Cell.Biol.)4:2072-2081(1984);埃爾莫內特(Hermonat)&繆斯科斯卡(Muzyczka),《美國國家科學院院刊》(PNAS)81:6466-6470(1984);以及薩莫爾斯基(Samulski)等人,《病毒學雜誌》(J.Virol.)63:03822-3828(1989)。
一般遞送
本發明涉及經由至少一種奈米粒子複合物遞送的CRISPR複合物的至少一個種組分(例如,RNA)。在一些方面,本發明提供了以下方法,該等方法包括向宿主細胞遞送一種或多種多核苷酸,如或如在此描述的一種或多種載體、其一種或多種轉錄物和/或一種或多種自其轉錄的蛋白。在一些方面,本發明進一步提供了藉由這樣的方法產生的細胞以及包括這樣的細胞或由這樣的細胞產生的動物。在一些實施方式中,將與(並且視情況與其複合)指導序列組合的CRISPR酶遞送至細胞。可以使用常規的病毒和非病毒基的基因轉移方法將核酸引入哺乳動物細胞或靶組織中。可以使用這樣的方法向培養物中或宿主生物中的細胞給予編碼CRISPR系統的組分的核酸。非病毒載體遞送系統包括DNA質粒、RNA(例如在此描述的載體的轉錄物)、裸核酸以及與遞送賦形劑(如脂質體)複合的核酸。病毒載體遞送系統包括DNA和RNA病毒,在被遞送 至細胞後它們具有游離型或整合型基因組。關於基因療法程序的綜述,參見安德森(Anderson),《科學》(Science)256:808-813(1992);納貝爾(Nabel)&費爾格納(Felgner),TIBTECH 11:211-217(1993);三穀(Mitani)&卡斯基(Caskey),TIBTECH 11:162-166(1993);狄龍(Dillon),TIBTECH 11:167-175(1993);米勒(Miller),《自然》(Nature)357:455-460(1992);範.布朗特(Van Brunt),《生物技術》(Biotechnology)6(10):1149-1154(1988);維涅(Vigne),《恢復神經學和神經科學》(Restorative Neurology and Neuroscience)8:35-36(1995);克雷默(Kremer)&佩里科德特(Perricaudet),《英國醫學公報》(British Medical Bulletin)51(1):31-44(1995);哈嗒嗒(Haddada)等人,在《微生物學和免疫學當前主題》(Current Topics in Microbiology and Immunology)中多爾夫勒(Doerfler)和博姆(Böhm)(編輯)(1995);以及餘(Yu)等人,《基因療法》(Gene Therapy)1:13-26(1994)。
核酸的非病毒遞送方法包括脂轉染、顯微注射、基因槍、病毒顆粒、脂質體、免疫脂質體、聚陽離子或脂質:核酸共軛物、裸DNA、人工病毒體以及DNA的試劑增強的攝取。脂轉染描述於例如美國專利案號5,049,386、4,946,787;和4,897,355),並且脂轉染試劑係商業銷售的(例如TransfectamTM和LipofectinTM)。適於多核苷酸的有效的受體識別脂轉染的陽離子和中性脂質包括Felgner(費爾格納),WO 91/17424;WO 91/16024的那些。遞送可以針對細胞(例如體外或離體給予)或靶組織(例如體內給予)。
脂質:核酸複合物(包括靶向的脂質體,如免疫脂質複合 物)的製備係熟習該項技術者熟知的(參見例如,克麗絲特爾(Crystal),《科學》(Science)270:404-410(1995);布萊澤(Blaese)等人,《癌症基因療法》(Cancer Gene Ther.)2:291-297(1995);貝爾(Behr)等人,《生物共軛化學》(Bioconjugate Chem.)5:382-389(1994);雷米(Remy)等人,《生物共軛化學》5:647-654(1994);高(Gao)等人,《基因療法》(Gene Therapy)2:710-722(1995);艾哈邁德(Ahmad)等人,《癌症研究》(Cancer Res.)52:4817-4820(1992);美國專利案號4,186,183、4,217,344、4,235,871、4,261,975、4,485,054、4,501,728、4,774,085、4,837,028以及4,946,787)。
使用RNA或DNA病毒基的系統遞送核酸利用將病毒靶向體內的特定細胞並將病毒有效負荷(payload)運至細胞核中的高度進化的過程。可以將病毒載體直接給予至患者(體內)或可以使用它們在體外處理細胞,並且視情況,可以將修飾的細胞給予至患者(離體)。常規的病毒基的系統可以包括用於基因轉移的逆轉錄病毒載體、慢病毒載體、腺病毒載體、腺相關病毒載體以及單純皰疹病毒載體。用逆轉錄病毒、慢病毒和腺相關病毒基因轉移方法整合進宿主基因組中是可能的,這通常導致插入轉基因的長期表現。另外,已經在不同細胞類型和靶組織中觀察到高轉導效率。
可以藉由摻入外源包膜蛋白,擴展靶細胞的潛在靶群而改變逆轉錄病毒的向性。慢病毒載體係能夠轉導或感染非分裂細胞並典型地產生較高病毒效價的逆轉錄病毒載體。因此,逆轉錄病毒基因轉移系統的選擇將依賴於靶組織。逆轉錄病毒載體由順式作用長末端重複組成,該等長末端重複具有包裝多達6-10kb的外源序列的能力。最低量的 順式作用LTR對於載體的複製和包裝而言是足夠的,然後使用該等載體將治療基因整合進靶細胞中,以提供永久的轉基因表現。廣泛使用的逆轉錄病毒載體包括基於鼠白血病病毒(MuLV)、長臂猿白血病病毒(GaLV)、猴免疫缺陷病毒(SIV)、人類免疫缺陷病毒(HIV)及其組合的那些(參見例如,布赫謝爾(Buchscher)等人,《病毒學雜誌》(J.Virol.)66:2731-2739(1992);約翰(Johann)等人,《病毒學雜誌》66:1635-1640(1992);佐姆內爾費爾特(Sommnerfelt)等人,《病毒學》(Virol.)176:58-59(1990);威爾遜(Wilson)等人,《病毒學雜誌》63:2374-2378(1989);米勒(Miller)等人,《病毒學雜誌》65:2220-2224(1991);PCT/US 94/05700)。
在另一個實施方式中,考慮了科卡爾(Cocal)水泡性病毒包膜假型逆轉錄病毒載體顆粒(參見例如,轉讓給弗雷德.哈欽森癌症研究中心(Fred Hutchinson Cancer Research Center)的美國專利公開案號20120164118)。科卡爾病毒屬於水泡性病毒屬,並且是哺乳動物水泡性口炎病原體。科卡爾病毒最初分離自千里達拉島(Trinidad)的蟎(瓊克斯(Jonkers)等人,《美國獸醫研究雜誌》(Am.J.Vet.Res.)25:236-242(1964)),並且已經在千里達拉島、巴西和阿根廷從昆蟲、牛和馬體內鑒定出感染。已經從天然地感染的節肢動物體內分離出感染哺乳動物的水泡性病毒中的許多,表明它們係媒介傳播的。水皰性病毒抗體在居住於該等病毒係地方性的且係實驗室獲得的農村地區的人中間係常見的;人類感染通常導致流感樣症狀。科卡爾病毒包膜糖蛋白在胺基酸水平上與印第安那VSV-G(VSV-G Indiana)具有71.5%一致性,並且水皰性病毒的包膜基因的系統發育比較顯示科卡爾病毒在血清學上與印第安那VSV-G 株不同,但是在水皰性病毒中間與其最密切相關。瓊克斯(Jonkers)等人,《美國獸醫研究雜誌》(Am.J.Vet.Res.)25:236-242(1964)和特拉瓦索德羅薩(Travassos da Rosa)等人,《美國熱帶藥學與衛生學雜誌》(Am.J.Tropical Med.& Hygiene)33:999-1006(1984)。科卡爾水皰性病毒包膜假型逆轉錄病毒載體顆粒可以包括例如慢病毒、α逆轉錄病毒、β逆轉錄病毒、γ逆轉錄病毒、δ逆轉錄病毒以及ε逆轉錄病毒載體顆粒,該等顆粒可以包括逆轉錄病毒Gag、Pol和/或一種或多種輔助蛋白以及科卡爾水皰性病毒包膜蛋白。在該等實施方式的某些方面內,Gag、Pol和輔助蛋白係慢病毒的和/或γ逆轉錄病毒的。本發明提供了包含或基本上由編碼CRISPR系統的外源核酸分子組成的AAV,例如,多個盒,該多個盒包括第一盒或由其組成,該第一盒包括或基本上由啟動子、編碼CRISPR相關(Cas)蛋白(假定的核酸酶或解旋酶蛋白)(例如,Cas9)的核酸分子和終止子組成,以及兩個或更多個,有利地直到載體的包裝尺寸極限,例如總共(包括第一盒)五個盒,該等盒包括或基本上由啟動子、編碼指導RNA(gRNA)的核酸分子和終止子組成(例如,每個盒示意性地由啟動子-gRNA1-終止子、啟動子-gRNA2-終止子...啟動子-gRNA(N)-終止子表示(其中N係可以插入的處於載體的包裝尺寸極限的上限的數目)),或兩個或更多個單獨的rAAV,每個rAAV包含一個或多於一個CRISPR系統盒,例如,第一rAAV包含第一盒,該第一盒包括或基本上由啟動子、編碼Cas(例如,Cas9)的核酸分子和終止子組成,並且第二rAAV包含多個,四個,盒,該等盒包括或基本上由啟動子、編碼指導RNA(gRNA)的核酸分子和終止子組成(例如,每個盒示意性地由啟動子-gRNA1-終止子、啟動子-gRNA2-終止子...啟動子-gRNA(N)-終止子表示(其中N係可 以插入的處於載體的包裝尺寸極限的上限的數目))。由於rAAV係一種DNA病毒,因此涉及AAV或rAAV的在此討論中的核酸分子有利地是DNA。在一些實施方式中,啟動子有利地是人類突觸蛋白I啟動子(hSyn)。用於將核酸遞送至細胞的另外的方法係熟習該項技術者已知的。參見例如藉由引用結合在此的US 20030087817。
在一些實施方式中,用一種或多種在此描述的載體暫態地或非暫態地轉染宿主細胞。在一些實施方式中,當細胞天然地出現在受試者體內時將其轉染。在一些實施方式中,被轉染的細胞取自受試者。在一些實施方式中,該細胞來源於取自受試者的細胞,如細胞系。用於組織培養的多種多樣的細胞系在本領域係已知的。細胞系的實例包括但不限於,C8161、CCRF-CEM、MOLT、mIMCD-3、NHDF、海拉-S3、Huh1、Huh4、Huh7、HUVEC、HASMC、HEKn、HEKa、MiaPaCell、Pancl、PC-3、TF1、CTLL-2、C1R、Rat6、CV1、RPTE、A10、T24、J82、A375、ARH-77、Calu1、SW480、SW620、SKOV3、SK-UT、CaCo2、P388D1、SEM-K2、WEHI-231、HB56、TIB55、Jurkat、J45.01、LRMB、Bcl-1、BC-3、IC21、DLD2、Raw264.7、NRK、NRK-52E、MRC5、MEF、Hep G2、海拉B、海拉T4、COS、COS-1、COS-6、COS-M6A、BS-C-1猴腎上皮細胞、BALB/3T3小鼠胚胎成纖維細胞、3T3 Swiss、3T3-L1、132-d5人類胎兒成纖維細胞;10.1小鼠成纖維細胞、293-T、3T3、721、9L、A2780、A2780ADR、A2780cis、A172、A20、A253、A431、A-549、ALC、B16、B35、BCP-1細胞、BEAS-2B、bEnd.3、BHK-21、BR 293、BxPC3、C3H-10T1/2、C6/36、Cal-27、CHO、CHO-7、CHO-IR、CHO-K1、 CHO-K2、CHO-T、CHO Dhfr -/-、COR-L23、COR-L23/CPR、COR-L23/5010、COR-L23/R23、COS-7、COV-434、CML T1、CMT、CT26、D17、DH82、DU145、DuCaP、EL4、EM2、EM3、EMT6/AR1、EMT6/AR10.0、FM3、H1299、H69、HB54、HB55、HCA2、HEK-293、海拉、Hepa1c1c7、HL-60、HMEC、HT-29、Jurkat、JY細胞、K562細胞、Ku812、KCL22、KG1、KYO1、LNCap、Ma-Mel 1-48、MC-38、MCF-7、MCF-10A、MDA-MB-231、MDA-MB-468、MDA-MB-435、MDCK II、MDCK II、MOR/0.2R、MONO-MAC 6、MTD-1A、MyEnd、NCI-H69/CPR、NCI-H69/LX10、NCI-H69/LX20、NCI-H69/LX4、NIH-3T3、NALM-1、NW-145、OPCN/OPCT細胞系、Peer、PNT-1A/PNT 2、RenCa、RIN-5F、RMA/RMAS、Saos-2細胞、Sf-9、SkBr3、T2、T-47D、T84、THP1細胞系、U373、U87、U937、VCaP、維洛(Vero)細胞、WM39、WT-49、X63、YAC-1、YAR及其轉基因變種。細胞系可獲得自熟習該項技術者已知的多種來源(參見例如,美國典型培養物保藏中心(American Type Culture Collection)(ATCC)(馬納薩斯(Manassus),維吉尼亞州))。在一些實施方式中,使用用一種或多種在此描述的載體轉染的細胞建立新的細胞系,該新的細胞系包括一種或多種載體來源的序列。在一些實施方式中,使用用如在此描述的CRISPR系統的組分轉染(如藉由用一種或多種載體進行暫態轉染或用RNA進行轉染)且藉由CRISPR複合物的活性修飾的細胞建立新的細胞系,該新的細胞系包括以下細胞,該等細胞包含吸水但是缺少任何其他外源序列。在一些實施方式中,在評估一種或多種測試化合物中使用用一種或多種在此描述的載體暫態或非暫態轉染的細胞或來源於這樣的細胞的細胞系。
在一些實施方式中,使用一種或多種在此描述的載體產生非人轉基因動物或轉基因植物。在一些實施方式中,該轉基因動物係一種哺乳動物,如小鼠、大鼠或兔。用於產生轉基因動物和植物的方法在本領域係已知的,並且通常以如在此描述的細胞轉染方法開始。在另一個實施方式中,可以考慮用具有針陣列的流體遞送裝置(參見例如,轉讓給弗雷德.哈欽森癌症研究中心的美國專利公開案號20110230839)將CRISPR Cas遞送至實體組織。用於將流體遞送至實體組織的美國專利公開案號20110230839的裝置可以包括多個排列為陣列的針;多個儲庫,每個儲庫都與該多個針中的對應的針處於流體聯通;以及多個致動器,該等致動器可操作地耦合至該多個儲庫中的對應的儲庫並被配置為控制該儲庫內的流體壓力。在某些實施方式中,該多個致動器中的每個都可以包括多個柱塞中的一個,該多個柱塞中的每個的第一端都被接收進該多個儲庫中的對應的儲庫中,並且在某些另外的實施方式中,該多個柱塞中的柱塞在其對應的第二端被可操作地耦合在一起,以便可以同時被按下。某些仍另外的實施方式可以包括一柱塞驅動器,該柱塞驅動器被配置為以選擇性地可變速率按下所有該多個柱塞。在其他實施方式中,該多個致動器中的每個都可以包括多個流體傳輸線中的一個,該等流體傳輸線具有第一和第二端,該多個流體傳輸線中的每個的第一端被耦合至該多個儲庫中的對應的儲庫。在其他實施方式中,該裝置可以包括一個流體壓力源,並且該多個致動器中的每個在該流體壓力源與該多個儲庫中的對應的儲庫之間都包括一液壓耦合器。在另外的實施方式中,該流體壓力源可以包括壓縮機、真空蓄能器、蠕動泵、主缸、微流體泵以及閥中的至少一個。在另一個實施方式中,該多個針中的每個都可以包括 多個沿其長度分佈的埠。
遞送至腎臟
針對腎臟的遞送方法總結如下:
Figure 112128864-A0101-12-0708-244
Figure 112128864-A0101-12-0709-245
Figure 112128864-A0101-12-0710-246
Figure 112128864-A0101-12-0711-247
Figure 112128864-A0101-12-0712-248
Figure 112128864-A0101-12-0713-249
遞送到腦
用於腦的遞送選項包括將處於DNA或RNA形式的CRISPR酶和指導RNA封裝到脂質體中並且結合到用於跨血腦屏障(BBB)遞送的分子特洛伊木馬上。分子特洛伊木馬已經顯示對於將B-gal表現載體遞送到非人類靈長動物的腦中是有效的。可以使用相同的途徑 來遞送含有CRISPR酶和指導RNA的遞送載體。例如,夏CF(Xia CF)和博阿多RJ(Boado RJ)、帕德瑞吉WM(Pardridge WM)“使用親和素-生物素技術經由人胰島素受體的siRNA的抗體介導的靶向”(“Antibody-mediated targeting of siRNA via the human insulin receptor using avidin-biotin technology.”《分子藥理學》(Mol Pharm.)2009年5月-6月;6(3):747-51.doi:10.1021/mp800194)描述了如何將短干擾RNA(siRNA)遞送到培養物中以及體內的細胞,並且可以與受體特異性單株抗體(mAb)和親和素-生物素技術聯合使用。作者還報導,就親和素-生物素技術而言,由於在靶向mAb與siRNA之間的鍵係穩定的,在靜脈給予該靶向的siRNA之後,體內觀察到在遠處部位(例如腦)的RNAi效應。
張(Zhang)等人(《分子治療學》(Mol Ther.)2003年1月;7(1):11-8.))描述了編碼報導分子如螢光素酶的表現質粒如何被包封在“人工病毒”的內部,該“人工病毒”包含85nm的聚乙二醇化的免疫脂質體,其在體內與針對人胰島素受體(HIR)的單株抗體(MAb)一起靶向到恒河猴腦。該HIRMAb使得攜帶外源基因的脂質體在靜脈注射之後經歷跨血腦屏障的轉胞吞作用和跨神經元質膜的胞吞作用。與大鼠比較,在恒河猴的腦中的螢光素酶基因表現水平高50倍。藉由組織化學和共聚焦顯微鏡檢查都證明了β-半乳糖苷酶基因在靈長動物腦中的廣泛神經元表現。作者指明,這種途徑使得在24小時內的可逆成年轉基因可行。因此,免疫脂質體的使用係較佳的。該等可以與抗體結合靶向特定的組織或細胞表面蛋白。
HSC-遞送到造血幹細胞並編輯造血幹細胞;以及具體條件
術語“造血幹細胞”或“HSC”係指包括那些廣泛地被認為是HSC的細胞,例如產生全部其他血細胞並且衍生自中胚層的位於紅骨髓(包含於大多數骨的核心中)中的血細胞。本發明的HSC包括具有造血幹細胞的表型的細胞,該等細胞藉由以下項來鑒定:小尺寸,缺乏譜系(lin)標記,以及屬於分化系列簇的標記例如CD34、CD38、CD90、CD133、CD105、CD45、以及還有c-kit(-幹細胞因子的受體)。造血幹細胞對於用於檢測譜系定型的標記係陰性的,並且因此稱為Lin-;並且藉由FACS對它們進行純化過程中,多個高達14種不同的成熟血液-譜系標記,例如人類的CD13&CD33(針對髓系)、CD71(針對紅系)、CD19(針對B細胞)、CD61(針對巨核細胞)等;以及B220(鼠類CD45)(針對B細胞)、Mac-1(CD11b/CD18)(針對單核細胞)、Gr-1(針對粒細胞)、Ter119(針對紅系細胞)、Il7Ra、CD3、CD4、CD5、CD8(針對T細胞)等。小鼠HSC標記:CD34lo/-、SCA-1+、Thy1.1+/lo、CD38+、C-kit+、lin-,和人類HSC標記:CD34+、CD59+、Thy1/CD90+、CD38lo/-、C-kit/CD117+、和lin-。HSC係藉由標記來鑒定。因此,本文處討論的實施方式中,HSC可以是CD34+細胞。HSC還可以是呈CD34-/CD38-的造血幹細胞。在本領域中被認為是HSC的可缺乏細胞表面上的c-kit的幹細胞係在本發明的範圍內,並且CD133+細胞在本領域中也被認為是HSC。
該CRISPR-Cas(例如Cas9)系統可以被工程化為靶向HSC中的一個或多個基因座位。可以製備有利地針對真核細胞並且尤其是哺乳動物細胞(例如人類細胞,如HSC)經密碼子優化的Cas(例如,Cas9)蛋白以及靶向HSC中的一個或多個座位(例如基因EMX1)的sgRNA。該 等可以經由粒子遞送。該等顆粒可以藉由混合的Cas(例如Cas9)蛋白和sgRNA形成。sgRNA和Cas(例如Cas9)蛋白混合物可以例如與以下混合物混合,該混合物包含表面活性劑、磷脂、生物可降解聚合物、脂蛋白和醇或基本上由其組成或由其組成,由此可以形成含有sgRNA和Cas(例如Cas9)蛋白的粒子。本發明包括如此製備的粒子和來自這樣一種方法的粒子及其用途。
更一般地說,可以使用有效過程形成粒子。首先,可以將Cas(例如Cas9)蛋白以及靶向基因EMX1或對照基因LacZ的sgRNA以適合的(例如,3:1至1:3或2:1至1:2或1:1)莫耳比,在適合的溫度(例如,15-30C,例如,20-25C,例如,室溫)下混合在一起持續適合的時間(例如,15-45,如30分鐘),有利的是在無菌、無核酸酶緩衝液中(例如,1X PBS)。分開地,粒子組分如或包含:表面活性劑(例如,陽離子脂質(例如,1,2-二油醯基-3-三甲基銨-丙烷(DOTAP)));磷脂(例如,二肉豆蔻磷脂醯膽鹼(DMPC));可生物降解的聚合物(例如,乙二醇聚合物或PEG)、以及脂蛋白,如低密度脂蛋白,例如,膽固醇可溶解於醇中,有利的是C1-6烷基醇,如甲醇、乙醇、異丙醇,例如,100%乙醇。將這兩種溶液可以混合在一起以形成含有Cas(例如Cas9)-sgRNA複合物的粒子。在某些實施方式中,該粒子可以含有HDR模板。其可以是與含有sgRNA+Cas(例如Cas9)蛋白的粒子共給予的粒子,或即,除使HSC與含有sgRNA+Cas(例如Cas9)蛋白的粒子接觸之外,使HSC與含有HDR模板的粒子接觸;或者使該HSC與含有全部的該sgRNA、Cas(例如Cas9)和該HDR模板的粒子接觸。該HDR模板可以藉由分開的載體給予,由此 在第一實例中,該粒子穿透HSC細胞並且該分開的載體也穿透該細胞,其中該HSC基因組被sgRNA+Cas(例如Cas9)修飾並且該HDR模板也存在,由此基因組座位被該HDR修飾;例如,這可以導致突變的校正。
在該等粒子形成之後,可以將96孔板中的HSC用15ug Cas(例如Cas9)蛋白/孔進行轉染。轉染後三天,可以收穫HSC,並且可以對在EMX1座位處的插入和缺失(indel)的數目進行量化。
這說明了HSC如何可以使用靶向HSC中一個或多個感興趣基因組座位的CRISPR-Cas(例如Cas9)來修飾。有待修飾的HSC可以是在體內,即在生物中,例如人類或非人類真核細胞,例如動物,如魚,如斑馬斑馬魚;哺乳動物,例如靈長類,如猿、黑猩猩、獼猴;齧齒動物,如小鼠、大鼠;犬或狗;家畜(母牛/牛、綿羊/綿羊、山羊或豬);飛禽或家禽,例如小雞。有待修飾的HSC可以是在體外、即這種生物的外部。並且,可以離體使用修飾的HSC,即這種生物的一種或多種HSC可以獲得或分離自生物,視情況該一種或多種HSC可以擴增,該一種或多種HSC係由包括靶向HSC中一個或多個基因座位的CRISPR-Cas(例如Cas9)的組成物修飾,例如藉由:使該一種或多種HSC與該組成物接觸,例如其中該組成物包括含有CRISPR酶以及靶向HSC中的一個或多個基因座位的一種或多種sgRNA的粒子,例如藉由將sgRNA和Cas(例如Cas9)蛋白混合物與包含表面活性劑、磷脂、生物可降解聚合物、脂蛋白和醇或基本上由其組成或由其組成的混合物進行混合來獲得或可獲得的粒子(其中一種或多種sgRNA靶向HSC中的一個或多個基因座位);視情況擴增所得的經修飾HSC並且向該生物給予所得的經修飾HSC。在一些情況 下,分離或獲得的HSC可以是來自第一生物(如來自與第二生物係相同物種的生物),並且該第二生物可以是給予所得的經修飾的HSC的生物,例如該第一生物可以是對第二生物的供體(例如,如在親本或同族成員中的親緣物)。修飾的HSC可以具有遺傳修飾以解決或減輕或降低個體或受試者或患者的疾病或病況狀態的症狀。修飾的HSC,例如在對第二生物的第一生物供體的情況下,可以具有遺傳修飾,以使HSC具有一種或多種蛋白,例如更像第二生物的表面標記或蛋白。修飾的HSC可以具有遺傳修飾以模擬個體或受試者或患者的疾病或病況狀態,並且會重給予至非人類生物以製備動物模型。根據本揭露和本領域中的知識,HSC的擴增係在熟習該項技術者的範圍內,參見例如李(Lee),“藉由克服CUL4介導的HOXB4的降解對成於人造血幹細胞的改進的離體擴增(Improved ex vivo expansion of adult hematopoietic stem cells by overcoming CUL4-mediated degradation of HOXB4.)”《血液》(blood).2013年5月16日;121(20):4082-9.doi:10.1182/blood-2012-09-455204.電子公開於2013年3月21日。
如所指示的為了改善活性,在粒子中配製整個複合物之前,sgRNA可以與Cas(例如Cas9)蛋白預複合。可以製備具有不同莫耳比的不同已知組分的配製物,以促進將核酸遞送到細胞(例如1,2-二油醯基-3-三甲基銨-丙烷(DOTAP)、1,2-二十四醯基-sn-甘油-3-磷酸膽鹼(DMPC)、聚乙二醇(PEG)和膽固醇)。例如,DOTAP:DMPC:PEG:膽固醇莫耳比可以是DOTAP 100,DMPC 0,PEG 0,膽固醇0;或DOTAP 90、DMPC 0、PEG 10、膽固醇0;或DOTAP 90、DMPC 0、PEG 5、膽 固醇5。DOTAP 100、DMPC 0、PEG 0、膽固醇0。因此本發明包括混合sgRNA、Cas(例如Cas9)蛋白以及形成粒子的組分;連同來自此類混合的粒子。
在一較佳的實施方式中,含有Cas(例如Cas9)-sgRNA複合物的粒子可以藉由將Cas(例如Cas9)蛋白與一個或多個sgRNA混合在一起來形成,較佳的是按1:1的莫耳比,酶:指導RNA。分開地,較佳的是將該等已知能促進核酸遞送的不同組分(例如,DOTAP、DMPC、PEG、以及膽固醇)溶解於乙醇中。將這兩種溶液混合在一起以形成含有Cas(例如Cas9)-sgRNA複合物的粒子。在粒子形成之後,可以將Cas(例如Cas9)-sgRNA複合物轉染到細胞中(例如,HSC)。可以應用條形編碼。可以使該等粒子、Cas-9和/或sgRNA帶條碼。
在一實施方式中,本發明包括製備含有sgRNA-和-Cas(例如Cas9)蛋白的粒子之方法,該方法包括將sgRNA和Cas(例如Cas9)蛋白混合物與包括或基本上由表面活性劑、磷脂、可生物降解的聚合物、脂蛋白及醇組成或由其組成的混合物進行混合。一實施方式包括來自該方法的含有sgRNA-和-Cas(例如Cas9)蛋白的粒子。在一實施方式中,本發明包括該粒子在藉由操縱感興趣基因組座位中的靶序列來修飾感興趣基因組座位、或生物或非人類生物的方法中之用途,該方法包括將包含該感興趣基因組座位的細胞與該粒子接觸,其中sgRNA靶向該感興趣基因組座位;或在藉由操縱感興趣基因組座位中的靶序列來修飾感興趣基因組座位、或生物或非人類生物的方法中之用途,該方法包括使包含該感興趣基因組座位的細胞與該粒子接觸,其中該sgRNA靶向該感興趣 基因組座位。在該等實施方式中,感興趣的基因組座位有利地是HSC中的基因組座位。
對於治療應用的考慮:基因組編輯療法中的考慮係序列特異性核酸酶的選擇,例如Cas9核酸酶的變體。每個核酸酶變體可以具有自己一套獨特的長處和短處,其中的許多必須在治療的背景下平衡以最大化治療益處。迄今,兩種使用核酸酶的治療性編輯方法已經顯示出顯著的前景:基因破壞和基因校正。基因破壞涉及刺激NHEJ以在遺傳元件中產生靶向的indel,這通常導致對患者而言有益的功能缺失突變。相比之下,基因校正使用HDR將致病突變直接逆轉,從而恢復功能同時保留經校正元件的生理調節。HDR還可以用於將治療性轉基因插入基因組中的限定“安全港”座位中,以恢復丟失的基因功能。為了使得特異性編輯治療有效,在靶細胞群中必須達到足夠高水平的修飾以逆轉疾病症狀。這種治療性修飾的‘閾值’藉由治療後經編輯的細胞的健康度、和逆轉症狀所需的基因產物的量來確定。關於健康度,相對於它們的未編輯對應物,編輯對經處理的細胞產生三種潛的在結果:增加、中性或降低的健康度。在健康度增加的情況下,例如在SCID-X1的治療中,相對於其未編輯的對應物,修飾的造血祖細胞選擇性地擴增。SCID-X1係一種由IL2RG基因的突變引起的疾病,該基因的功能為造血淋巴細胞譜系的適當發育所需[倫納德(Leonard),W.J.等人《免疫學綜述》(Immunological reviews)138,61-86(1994);考杉斯基(Kaushansky),K.&威廉姆斯(Williams),W.J.威廉姆斯(Williams)《血液學》(hematology),(麥格勞-希爾醫學部(McGraw-Hill Medical),紐約,2010)]。在藉由接受針 對SCID-X1的病毒基因療法的患者和SCID-X1突變的自發校正的罕見實例進行的臨床試驗中,經校正造血祖細胞可以能夠克服這種發育阻斷並且相對於其患病對應物擴增以介導治療[布索(Bousso),P.等人《美國國家科學院院刊》(Proceedings of the National Academy of Sciences of the United States of America)97,274-278(2000);哈賽因-貝-阿比納(Hacein-Bey-Abina),S.等人《新英格蘭醫學雜誌》(The New England journal of medicine)346,1185-1193(2002);加斯帕(Gaspar),H.B.等人《柳葉刀》(Lancet)364,2181-2187(2004)]。在經編輯細胞具有選擇性優勢的情況下,甚至低數量的經編輯細胞也可以藉由擴增而增多,從而為患者提供治療益處。相比之下,針對其他造血疾病(像慢性肉芽腫病(CGD))的編輯對於經編輯的造血祖細胞而言沒有誘導健康度方面的變化,從而提高治療性修飾的閾值。CGD係由編碼吞噬細胞氧化酶蛋白的基因的突變引起的,該等蛋白通常被嗜中性粒細胞用於產生殺死病原體的活性氧[慕克吉(Mukherjee),S.&思拉舍(Thrasher),A.J.《基因》(Gene)525,174-181(2013)]。因為該等基因的功能障礙不影響造血祖細胞健康度或發育,而係僅僅影響成熟造血細胞類型抵抗感染的能力,所以經編輯的細胞在這種疾病中不可能優先擴增。的確,在基因療法試驗中已經觀察到在CGD中的基因校正細胞中沒有選擇性優勢,從而造成長期細胞植入困難[梅爾施(Malech),H.L.等人《美國國家科學院院刊》(Proceedings of the National Academy of Sciences of the United States of America)94,12133-12138(1997);康(Kang),H.J.等人《分子療法:美國基因治療學會雜誌》(Molecular therapy:the joumal of the American Society of Gene Therapy)19,2092-2101(2011)]。因此,相對於編輯產生 增加的靶細胞健康度的疾病,治療編輯產生中性健康度優勢的疾病(像CGD)將需要顯著更高水平的編輯。如果編輯賦予健康度劣勢,正如恢復癌細胞中的腫瘤抑制基因的功能的情況,經修飾的細胞被其患病對應物勝過,從而使得治療益處相對於編輯率而言較低。後一類別的疾病特別難以用基因組編輯療法進行治療。
除細胞健康度之外,治療疾病所必需的基因產物的量也影響用於逆轉症狀所必須達到的治療性基因組編輯的最低水平。B型血友病係基因產物水平的小變化可以導致臨床結果的顯著變化的疾病。這種疾病係由編碼因子IX的基因的突變引起的,所述因子係通常由肝臟分泌進入血液的蛋白質,在血液中它作為凝血級聯的組分起作用。B型血友病的臨床嚴重性與因子IX活性的量相關。嚴重疾病與低於1%的正常活性相關,較輕形式的疾病與高於1%的因子IX活性相關[考杉斯基(Kaushansky),K.&威廉姆斯(Williams),W.J.威廉姆斯(Williams)《血液學》(hematology),(麥格勞-希爾醫學部(McGraw-Hill Medical),紐約,2010);洛夫基斯特(Lofqvist),T.等人《內科醫學雜誌》(Journal of internal medicine)241,395-400(1997)]。這表明可以在甚至小百分比的肝細胞中恢復因子IX表現的編輯療法對臨床結果可以具有大的影響。一項使用ZFN校正出生後不久的B型血友病小鼠模型的研究證明3%-7%的校正足以逆轉疾病症狀,從而為這一假設提供了臨床前證據[李(Li),H.等人《自然》(Nature)475,217-221(2011)]。
基因產物水平的小變化便可以影響臨床結果的障礙以及經編輯的細胞存在健康度優勢的疾病係基因組編輯療法的理想靶標,因 為治療性修飾的閾值足夠低以允許給出當前技術的成功機會較高。靶向該等疾病現在已經在臨床前水平和I期臨床試驗下取得了編輯治療的成功。需要改進DSB修復途徑操縱和核酸酶遞送,以將該等有希望的結果擴展到對於經編輯的細胞而言具有中性健康度優勢或需要較大量的基因產物用於治療的疾病。下表示出了基因組編輯應用於治療模型的一些實例,並且特此藉由引用結下表的參考和那些參考中引用的文獻,就如同全部列出一樣。
Figure 112128864-A0101-12-0723-250
使用CRISPR-Cas(例如Cas9)系統來靶向,藉由HDR介導的對突變的校正或HDR介導的插入正確的基因序列,有利地經由如本文的遞送系統例如粒子遞送系統,解決前述表格的病況中的每一個,這根據本揭露和本領域中的知識係在熟習該項技術者的範圍內。因此,一個實施方式包括使攜帶B型血友病、SCID(例如,SCID-X1、ADA-SCID)或遺傳性酪胺酸血症突變的HSC與靶向感興趣的基因組座位的sgRNA-和-Cas(例如Cas9)蛋白接觸,就B型血友病、SCID(例如,SCID-X1、 ADA-SCID)或遺傳性酪胺酸血症而言(例如,如在李(Li)、吉諾維斯(Genovese)或印(Yin)中的)。該粒子還可以包含適合的HDR模板,以校正突變;或HSC可以與包含或遞送HDR模板的第二粒子或載體接觸。在此方面,可提及的是B型血友病係一種由編碼因子IX的基因的功能缺失突變引起的X連鎖隱性障礙,所述因子係凝血級聯的關鍵組分。將受嚴重影響個體體內的因子IX活性恢復到高於1%的其水平可以將該疾病轉化為顯著更輕的形式,因為從年幼時預防性地向此類患者體內輸注重組因子IX達到此類水平在很大程度上改善臨床併發症。根據本領域的知識和本揭露的教導,就B型血友病而言,熟習該項技術者可以使用靶向並校正突變(由編碼因子IX的基因的功能缺失突變引起的X連鎖隱性障礙)的CRISPR-Cas(例如Cas9)系統來校正HSC(例如,用遞送因子IX的編碼序列的適合的HDR模板);確切地說,sgRNA可以靶向引起B型血友病的突變,並且HDR可以為因子IX的正確表現提供編碼。將包含靶向突變-和-Cas(例如Cas9)蛋白的sgRNA的粒子與攜帶突變的HSC進行接觸。該粒子還可以包含適合的HDR模板,以校正因子IX的適當表現的突變;或HSC可以與包含或遞送HDR模板的第二粒子或載體接觸。可以將這樣接觸的細胞給予;並且視情況處理/擴增。參見卡地亞(Cartier),如本文討論。
在卡地亞(Cartier),“小型研討會:X連鎖腎上腺腦白質失養症,造血幹細胞移植和X連鎖腎上腺腦白質失養症中的造血幹細胞基因療法(MINI-SYMPOSIUM:X-Linked Adrenoleukodystrophypa,Hematopoietic Stem Cell Transplantation and Hematopoietic Stem Cell Gene Therapy in X-Linked Adrenoleukodystrophy)”,《腦病理學》(Brain Pathology)20(2010)857-862,藉由引用併入本文連同它引用的文獻,如同完整地陳述一樣中,認識到異體造血幹細胞移植(HSCT)用於向患有賀勒氏症(Hurler’s disease)的患者的腦中遞送正常的溶酶體酶並且存在關於用於治療ALD的HSC基因療法的討論。在兩個患者中,在粒細胞-集落刺激因子(G-CSF)動員後收集外周CD34+細胞,並且用骨髓增殖性肉瘤病毒增強子(缺失陰性對照區的dl587rev引物結合位點取代的(MND)-ALD慢病毒載體)進行轉導。在低濃度的細胞因子的存在下,在6h期間用MND-ALD載體轉導來自患者的CD34+細胞。轉導之後將轉導的CD34+細胞冷凍,以在5%的細胞上進行各種安全性測試,該等測試具體地包括三種複製感受態慢病毒(RCL)測定。CD34+細胞的轉導效力的範圍係從35%至50%,其中慢病毒整合拷貝的平均數目在0.65與0.70之間。將轉導的CD34+細胞解凍之後,在用白消安和環磷醯胺完全清髓後,以每kg多於4.106個轉導的CD34+細胞再輸注到患者體內。將患者的HSC消除,以有利於經基因校正的HSC的植入。對於這兩個患者而言,在第13天與15天之間發生血液學恢復。對於第一患者而言,在第12個月發生幾乎完全的免疫恢復,並且對於第二患者而言發生在第9個月。與使用慢病毒相對照,根據本領域的知識和本揭露的教導,就ALD而言,熟習該項技術者可以使用靶向並校正突變的CRISPR-Cas(Cas9)系統來校正HSC(例如,用適合的HDR模板);確切地說,sgRNA可以靶向ABCD1(位於X染色體上的編碼ALD(過氧化物酶體膜轉運體蛋白)的基因)中的突變,並且HDR可以為該蛋白質的正確表現提供編碼。將包含靶向突變-和-Cas(Cas9)蛋白的sgRNA的粒子與攜帶突變的HSC(例如CD34+細胞) 進行接觸,如在卡地亞(Cartier)中的。該粒子還可以包含適合的HDR模板,以校正用於過氧化物酶體膜轉運蛋白的表現的突變;或HSC可以與包含或遞送HDR模板的第二粒子或載體接觸。如此接觸的細胞視情況可以如在卡地亞(Cartier)中的進行處理。如此接觸的細胞可以如在卡地亞(Cartier)中的進行給予。
參考WO 2015/148860,藉由本文的傳授,本發明包含結合本文的傳授而應用的該等文獻的方法和材料。在血液相關疾病基因療法的方面,用於治療β地中海貧血的方法和組成物可以適於本發明的CRISPR-Cas系統(參見例如WO 2015/148860)。在一實施方式中,WO 2015/148860涉及治療或預防β地中海貧血或其症狀,例如藉由改變用於B-細胞CLL/淋巴瘤11A(BCL11A)的基因。該BCL11A基因也稱為B-細胞CLL/淋巴瘤11A、BCL11A-L、BCL11A-S、BCL11AXL、CTIP 1、HBFQTL5和ZNF。BCL11A編碼在調節球蛋白基因表現中涉及的鋅-指蛋白。藉由改變BCL11A基因(例如,BCL11A基因的一個或兩個等位基因),可以增加γ球蛋白的水平。γ球蛋白可以替代血紅蛋白複合物中的β球蛋白,並且有效地負載氧氣到組織,由此改善β地中海貧血疾病表型。
還提及的是WO 2015/148863,並且藉由本文的傳授,本發明包含該等文獻的方法和材料,它們可以適於本發明的CRISPR-Cas系統。在治療和預防鐮狀細胞病(為遺傳血液病)的一個方面中,WO 2015/148863包含改變BCL11A基因。藉由改變BCL11A基因(例如,BCL11A基因的一個或兩個等位基因),可以增加γ球蛋白的水平。γ球蛋白可以替代血紅蛋白複合物中的β球蛋白,並且有效地負載氧氣到組織, 由此改善鐮狀細胞疾病表型。
在本發明的一方面中,涉及編輯靶核酸序列或調節靶核酸序列的表現的方法和組成物,以及其結合癌症免疫療法的應用,係藉由適配本發明的CRISPR-Cas系統來領會。參考WO 2015/161276中的基因療法的應用,其涉及可以用於藉由改變一個或多個T細胞表現的基因,例如FAS、BID、CTLA4、PDCD1、CBLB、PTPN6、TRAC和/或TRBC基因中的一個或多個,影響T細胞增殖、存活和/或功能的方法和組成物。在一相關方面,T細胞增殖可以藉由改變一個或多個T細胞表現的基因,例如CBLB和/或PTPN6基因、FAS和/或BID基因、CTLA4和/或PDCDI和/或TRAC和/或TRBC基因,而受到影響。
在患者惡性腫瘤中嵌合抗原受體(CAR)19T-細胞展現抗白血病作用。然而,白血病患者通常不具有足夠的T細胞來收集,意味著治療必須涉及來自供體的修飾的T細胞。因此,存在建立供體T-細胞的庫的興趣。凱西姆(Qasim)等人(“在B-ALL中Talen工程化的通用CAR19T細胞的第一臨床應用(First Clinical Application of Talen Engineered Universal CAR19 T Cells in B-ALL)”ASH第57屆年度會議和展覽會(ASH 57th Annual Meeting and Exposition),2015年12月5日-8日,摘要2046(https://ash.confex.com/ash/2015/webprogram/Paper81653.html線上公開於2015年11月)討論了修飾CAR19 T細胞以藉由破壞T細胞受體表現和CD52靶向來消除移植物抗宿主病的風險。此外,靶向CD52細胞,使得它們變得對阿侖單抗(Alemtuzumab)不敏感,並且由此允許阿侖單抗預防宿主介導的對人類白細胞抗原(HLA)不匹配的CAR19 T細胞的排斥。 研究者使用編碼與RQR8連接的4g7 CAR19(CD19 scFv-4-1BB-CD3ζ)的第三代自我失活型慢病毒載體,然後使用用於多元靶向T細胞受體(TCR)α恒定股座位和CD52基因座位兩者的兩對TALEN mRNA對細胞進行電穿孔。將在離體表現後仍表現TCR的細胞使用CliniMacs α/β TCR耗減進行耗減,產生T細胞產物(UCART19),具有<1%的TCR表現,其85%表現CAR19,並且64%變為CD52陰性。給予修飾的CAR19 T細胞以治療患者的復發的急性成淋巴細胞白血病。本文提供的傳授內容提供了有效的用於提供經修飾的造血幹細胞及其子代之方法,所述造血幹細胞及其子代包括但不限於血液的髓系和淋巴系的細胞,包括T細胞、B細胞、單核細胞、巨噬細胞、嗜中性粒細胞、嗜鹼性粒細胞、嗜酸性細胞、紅細胞、樹突狀細胞、和巨核細胞或血小板、以及天然殺傷細胞以及它們的先質和祖細胞。此類細胞可以藉由敲除、敲進或以其他方式調節靶標來修飾,例如以去除或調節如上所述的CD52以及其他靶標,例如但不限於CXCR4和PD-1。因此本發明的組成物、細胞、和方法,結合改變向患者進行的T細胞或其他細胞的給予,可以用於調節免疫應答和治療(不限於)惡性腫瘤、病毒感染、和免疫障礙。
參考WO 2015/148670,並且藉由本文的傳授,本發明包含結合本文的傳授而應用的該文獻的方法和材料。在基因療法的一方面,包含了涉及的或與人類免疫缺陷病毒(HIV)和獲得性免疫缺陷綜合症(AIDS)相關的用於編輯靶序列的方法和組成物。在一相關方面,本文描述的本發明包含藉由在C-C趨化因子受體5型(CCR5)的基因中引入一個或多個突變來預防和治療HIV感染和AIDS。該CCR5基因還稱為 CKR5、CCR-5、CD195、CKR-5、CCCKR5、CMKBR5、IDDM22、和CC-CKR-5。在一個另外的方面,本文描述的本發明包含提供用於例如在已經感染的受試者中預防或降低HIV感染和/或預防或降低HIV進入宿主細胞的能力。HIV的示例性宿主細胞包括但不限於CD4細胞、T細胞、腸相關淋巴組織(GALT)、巨噬細胞、樹突細胞、髓樣先質細胞、以及小膠質細胞。病毒進入宿主細胞需要病毒糖蛋白gp41和gp120與CD4受體和共受體(例如CCR5)的相互作用。如果共受體,例如CCR5,不存在於宿主細胞的表面上,則病毒不能結合並進入宿主細胞。疾病的進展因此被阻止。藉由敲除或敲減在宿主細胞中的CCR5,例如,藉由引入保護性突變(如CCR5 δ 32突變),HIV病毒進入該宿主細胞被防止。
X連鎖慢性肉芽腫病(CGD)係一種由於不存在吞噬細胞NADPH氧化酶或其活性降低而導致的宿主防禦遺傳性障礙。使用靶向並校正該突變(不存在吞噬細胞NADPH氧化酶或其活性降低)的CRISPR-Cas(Cas9)系統(例如,用遞送吞噬細胞NADPH氧化酶的編碼序列的適合的HDR模板);確切地說,sgRNA可以靶向引起CGD的突變(缺陷吞噬細胞NADPH氧化酶),並且HDR可以為吞噬細胞NADPH氧化酶的正確表現提供編碼。將包含靶向突變-和-Cas(Cas9)蛋白的sgRNA的粒子與攜帶突變的HSC進行接觸。該粒子還可以包含適合的HDR模板,以校正吞噬細胞NADPH氧化酶的適當表現的突變;或HSC可以與包含或遞送HDR模板的第二粒子或載體接觸。可以將這樣接觸的細胞給予;並且視情況處理/擴增。參見卡地亞(Cartier)。
范康尼氏頑固性貧血:至少15個基因(FANCA、FANCB、 FANCC、FANCD1/BRCA2、FANCD2、FANCE、FANCF、FANCG、FANCI、FANCJ/BACH1/BRIP1、FANCL/PHF9/POG、FANCM、FANCN/PALB2、FANCO/Rad51C和FANCP/SLX4/BTBD12)的突變可以引起范康尼氏頑固性貧血。產生自該等基因的蛋白質涉及在稱為FA途徑的細胞過程中。當產生新的DNA拷貝的過程(稱為DNA複製)由於DNA損傷被阻斷時,FA途徑被開啟(活化)。FA途徑將某些蛋白送至損害區域,這觸發了DNA修復,所以DNA複製可以繼續。FA途徑對某一類型的DNA損傷(稱為股間交聯(ICL))特別具有響應性。當DNA的相對股上的兩個DNA結構單元(核苷酸)異常地附接或連接在一起時出現ICL,這使得DNA複製過程停止。ICL可以藉由在體內產生的毒性物質的積聚或藉由用某些癌症治療藥物進行治療而引起。將八種與范康尼氏頑固性貧血相關的蛋白質集合在一起以形成稱為FA核心複合物的複合物。FA核心複合物活化兩種稱為FANCD2和FANCI的蛋白質。這兩種蛋白質的活化將DNA修復蛋白帶至ICL區域,因此可以去除交聯並且DNA複製可以繼續。FA核心複合物。更具體地,FA核心複合物係由FANCA、FANCB、FANCC、FANCE、FANCF、FANCG、FANCL和FANCM組成的核多蛋白複合物,作為E3泛素連接酶起作用並且介導ID複合物的活化,所述ID複合物係由FANCD2和FANCI構成的異二聚體。一旦被單遍在蛋白化,它便與FA途徑下游的經典腫瘤抑制劑(包括FANCD1/BRCA2、FANCN/PALB2、FANCJ/BRIP1和FANCO/Rad51C)相互作用並且由此促進經由同源重組(HR)進行的DNA修復。80%至90%的FA情況歸因於以下三個基因之一的突變:FANCA、FANCC和FANCG。該等基因提供用於產生FA核心複合物的組分的指令。與FA核心複合物相關的此類基因的突變將使得該複合物喪失 功能並且破壞整個FA途徑。其結果係,DNA損傷未被有效修復並且ICL隨時間積累。蓋澤爾哈特(Geiselhart),“綜述文章,藉由范康尼氏頑固性貧血途徑破壞傳訊導致異常的造血幹細胞生物學:潛在機制和可能的治療策略(Review Article,Disrupted Signaling through the Fanconi Anemia Pathway Leads to Dysfunctional Hematopoietic Stem Cell Biology:Underlying Mechanisms and Potential Therapeutic Strategies)”,《貧血》(Anemia)第2012卷(2012),文章ID 265790,http://dx.doi.org/10.1155/2012/265790,討論了FA和涉及股骨內注射編碼FANCC基因的慢病毒從而在體內校正HSC的動物實驗。使用靶向與FA相關的突變中的一個或多個的CRISPR-Cas(Cas9)系統,例如具有一種或多種sgRNA和一種或多種HDR模板的CRISPR-Cas(Cas9)系統,這一種或多種sgRNA和這一種或多種HDR模板對應地靶向引起FA的突變FANCA、FANCC或FANCG中的一個或多個並且提供FANCA、FANCC或FANCG中一個或多個的校正表現;例如,sgRNA可以靶向關於FANCC的突變,並且HDR可以為FANCC的適當表現提供編碼。將靶向包含一個或多個突變(例如在FA中涉及的一個或多個,例如關於FANCA、FANCC或FANCG中的任何一者或多者的一個或多個突變)-和Cas(Cas9)蛋白的粒子的sgRNA與攜帶一個或多個突變的HSC接觸。該粒子還可以包含一種或多種適合的HDR模板,以校正用於FA中涉及的一種或多種蛋白(例如FANCA、FANCC或FANCG中的任何一者或多者)的適當表現的突變;或HSC可以與包含或遞送HDR模板的第二粒子或載體接觸。可以將這樣接觸的細胞給予;並且視情況處理/擴增。參見卡地亞(Cartier)。
本文討論中的粒子(例如關於包含一種或多種sgRNA和Cas(Cas9),視情況一種或多種HDR模板或一種或多種HDR模板;例如關於B型血友病、SCID、SCID-X1、ADA-SCID、遺傳性酪胺酸血症、β-地中海貧血、X-連鎖的CGD、偉-爾二氏症候群、范康尼氏頑固性貧血、腎上腺腦白質失養症(ALD)、異染性白質失養症(MLD)、HIV/AIDS、免疫缺陷障礙、血液學病況、或遺傳性溶酶體貯積疾病)有利地是藉由以下來獲得或可獲得:將一種或多種sgRNA和Cas(Cas9)蛋白混合物(視情況包含一種或多種HDR模板,或這種混合物僅包含一種或多種HDR模板,當關於一種或多種模板分離的粒子係所希望的時候)與包含表面活性劑、磷脂、生物可降解聚合物、脂蛋白和醇或基本上由其組成或由其組成的混合物進行混合(其中一種或多種sgRNA靶向HSC中的一個或多個基因座位)。
的確,本發明尤其適用於用基因組編輯來治療造血遺傳障礙,以及免疫缺陷障礙,例如遺傳免疫缺陷障礙,尤其是藉由使用本文討論的粒子技術。遺傳免疫缺陷係其中本發明的基因組編輯干預可以成功的疾病。原因包括:造血細胞(免疫細胞係其一個子集)係治療可及的。它們可以是從身體去除並且自體地或同種異體地移植。此外,某些遺傳免疫缺陷,例如,嚴重的聯合免疫缺陷(SCID),產生了免疫細胞的增殖缺點。藉由稀少的自發的‘反’突變來校正引起SCID的遺傳損傷指示,校正甚至一淋巴細胞祖細胞可以足以恢復患者中的免疫功能.../../../Users/t_kowalski/AppData/Local/Microsoft/Windows/Temporary Internet Files/Content.Outlook/GA8VY8LK/Treating SCID for Ellen.docx- _ENREF_1參見布索(Bousso),P.,等人,體內衍生自單一人類T細胞先質的T細胞譜的遞送、功能、和穩定性(Diversity,functionality,and stability of the T cell repertoire derived in vivo from a single human T cell precursor.)《美國國家科學院院刊》(Proceedings of the National Academy of Sciences of the United States of America)97,274-278(2000)。用於編輯的細胞的選擇性優勢允許甚至低水平的編輯,以產生治療作用。本發明的這種作用可以在SCID、偉-爾二氏症候群、和其他本文提及的病況中看到,包括其他遺傳性造血障礙,例如α-和β-地中海貧血,其中血紅蛋白缺陷不利地影響紅系祖細胞的健康。
NHEJ和HDR DSB修復活性隨細胞類型和細胞狀態而顯著變化。NHEJ不是高度地受細胞週期調節並且跨細胞類型係有效的,從而允許在可及靶細胞群中進行高水平的基因破壞。相比之下,HDR主要在S/G2期過程中起作用,並且因此局限於活躍分裂的細胞,從而限制了需要對有絲分裂細胞進行精確基因組修飾的治療[齊恰(Ciccia),A.&埃利奇(Elledge),S.J.《分子細胞》(Molecular cell)40,179-204(2010);查普曼(Chapman),J.R.等人《分子細胞》47,497-510(2012)]。
經由HDR的校正效率可以藉由靶向座位的表觀遺傳學狀態或序列或者使用的具體修復模板構型(單股對比雙股、長同源臂對比短同源臂)進行控制[哈賽因-貝-阿比納(Hacein-Bey-Abina),S.等人《新英格蘭醫學雜誌》(The New England journal of medicine)346,1185-1193(2002);加斯帕(Gaspar),H.B.等人《柳葉刀》(Lancet)364,2181-2187(2004);博伊默(Beumer),K.J.等人G3(2013)]。NHEJ和HDR機器在靶 細胞中的相對活性也可以影響基因校正效率,因為該等途徑可以競爭以解決DSB[博伊默(Beumer),K.J.等人《美國國家科學院院刊》(Proceedings of the National Academy of Sciences of the United States of America)105,19821-19826(2008)]。HDR還賦予了伴隨NHEJ策略未見的遞送挑戰,因為它需要同時遞送核酸酶和修復模板。在實踐中,該等約束迄今為止已經在治療相關細胞類型中導致低水平的HDR。臨床轉化因此在很大程度上已經聚焦於NHEJ策略來治療疾病,儘管已經針對B型血友病和遺傳性酪胺酸血症小鼠模型描述了概念驗證臨床前HDR治療[李(Li),H.等人《自然》(Nature)475,217-221(2011);印(Yin),H.等人《自然生物技術》(Nature biotechnology)32,551-553(2014)]。
任何給定的基因組編輯應用都可以包括蛋白質、小RNA分子和/或修復模板的組合,使得遞送這多個部分比遞送小分子治療劑顯著更具有挑戰性。已經開發了兩種用於遞送基因組編輯工具的主要策略:離體策略和體內策略。在離體治療中,將患病細胞從體內取出,編輯並且然後移植回患者體內。離體編輯具有以下優點:允許靶細胞群被明確定義並且指定遞送到細胞中的治療性分子的具體劑量。當脫靶修飾係問題時,後一考慮事項可能是特別重要的,因為滴定核酸酶的量可以減少此類突變(徐(Hsu)等人,2013)。離體方法的另一個優點係可以實現典型高的編輯率,這歸因於使蛋白質和核酸進入用於研究和基因療法應用的培養中的細胞中的有效遞送系統的發展。
離體方法存在將應用局限於小數目的疾病的缺陷。例如,在體外操縱時靶細胞必須能夠存活。對於許多組織(像腦)而言,在體 外培養細胞係主要挑戰,因為細胞不能存活或失去對其體內功能必需的特性。因此,鑒於本揭露和本領域中的知識,藉由CRISPR-Cas(Cas9)系統,使得能夠進行關於具有經受離體培養和操縱的成體幹細胞群體(例如造血系統)的組織的離體治療。[邦恩(Bunn),H.F.&阿斯特爾(Aster)J.,《血液障礙的病理生理學》(Pathophysiology of blood disorders)(麥格勞希爾(McGraw-Hill),紐約(New York),2011)]
體內基因組編輯涉及將編輯系統直接遞送到處於其天然組織中的細胞類型。體內編輯允許治療受影響細胞群不易於離體操縱的疾病。此外,將核酸酶原位遞送至細胞允許處理多種組織和細胞類型。相對於離體療法而言,該等特性可能允許將體內治療應用於更大範圍的疾病。
迄今為止,在很大程度上已經藉由使用具有限定的組織特異性向性的病毒載體實現了體內編輯。就攜帶負荷物的能力和向性而言,此類載體目前係受限的,將這種模式的治療局限於用臨床上有用的載體進行轉導係有效的器官系統,如肝、肌肉和眼睛[科特曼(Kotterman),M.A.&謝弗(Schaffer),D.V.《自然綜述˙遺傳學》(Nature reviews.Genetics)15,445-451(2014);紐倫(Nguyen),T.H.&費裡(Ferry),N.《基因治療》(Gene therapy)11增刊1,S76-84(2004);博伊(Boye),S.E.等人《分子療法:美國基因治療學會雜誌》(Molecular therapy:the journal of the American Society of Gene Therapy)21,509-519(2013)]。
體內遞送的潛在障礙係可能響應於治療所必需的大量病 毒而產生的免疫應答,但是這種現象並不是基因組編輯特有的並且伴隨其他基於病毒的基因療法也有觀察到[貝西(Bessis),N.等人《基因治療》(Gene therapy)11增刊1,S10-17(2004)]。還有可能的是來自編輯核酸酶本身的肽被呈現在MHC I類分子上以刺激免疫應答,儘管幾乎沒有支持這發生在臨床前水平下的證據。這種模式的治療的另一個主要困難係控制編輯基因組的核酸酶在體內的分佈以及因此的劑量,從而產生可能難以預測的脫靶突變譜。然而,鑒於本揭露和本領域中的知識,包括使用用於治療癌症的基於病毒和粒子的療法,HSC的體內修飾(例如藉由經粒子或病毒遞送)係在熟習該項技術者的範圍之內。
離體編輯療法:純化、培養和移植造血細胞的由來已久的臨床專業知識已經使得影響血液系統的疾病(如SCID、范康尼氏頑固性貧血、偉-爾二氏症候群和鐮狀細胞貧血)成為離體編輯治療的焦點。聚焦於造血細胞的另一個原因係歸功於針對血液障礙設計基因治療的先前努力,已經存在相對較高效率的遞送系統。在該等優點存在下,這種模式的治療可以應用於其中經編輯的細胞具有健康優勢的疾病,使得小數目的植入的經編輯細胞可以擴增並治療疾病。一種這樣的疾病係HIV,其中感染導致CD4+ T細胞的健康度劣勢。
離體編輯治療最近已經被擴展成包括基因校正策略。在來自吉諾維斯(Genovese)和同事的一篇最近的論文中克服了離體HDR的障礙,他們在獲得自罹患SCID-X1的患者的造血幹細胞(HSC)中實現了突變的IL2RG基因的基因校正[吉諾維斯,P.等人《自然》(Nature)510,235-240(2014)]。吉諾維斯(Genovese)等人使用多模式策略完成了HSC 中的基因校正。首先,使用含有編碼IL2RG的治療性cDNA的HDR模板的整合缺陷型慢病毒轉導HSC。轉導後,用對靶向IL2RG中的突變熱點的ZFN進行編碼的mRNA對細胞進行電穿孔,以基於基因校正刺激HDR。為了提高HDR率,用小分子優化培養條件,以促使HSC分裂。藉由優化的培養條件、核酸酶和HDR模板,以治療上相關的比率在培養中獲得來自SCID-X1患者的經基因校正的HSC。來自經歷相同的基因校正程式的未受影響的個體的HSC在小鼠體內可以維持長期造血功能,即HSC功能的黃金標準。HSC能夠產生所有造血細胞類型並且可以進行自體移植,使得它們成為所有造血遺傳障礙的極有價值的細胞群[韋斯曼(Weissman),I.L.&靜流(Shizuru),J.A.《血液》(Blood)112,3543-3553(2008)]。原則上,經基因校正的HSC可以用於治療範圍廣泛的遺傳血液障礙,使得這項研究成為治療性基因組編輯的令人振奮的突破。
體內編輯治療:體內編輯可以有利地根據本揭露和本領域中的知識來使用。對於遞送有效的器官系統而言,已經取得了許多令人振奮的臨床治療成功。成功的體內編輯治療的第一個實例在B型血友病小鼠模型中得到證實[李(Li),H.等人《自然》(Nature)475,217-221(2011)]。如較早所指出的,B型血友病係由編碼因子IX的基因的功能缺失突變引起的X連鎖隱性障礙,所述因子係凝血級聯的關鍵組分。將受嚴重影響個體體內的因子IX活性恢復到高於1%的其水平可以將該疾病轉化為顯著更輕的形式,因為從年幼時預防性地向此類患者體內輸注重組因子IX達到此類水平在很大程度上改善臨床併發症[洛夫基斯特(Lofqvist),T.等人《內科醫學雜誌》(Journal of internal medicine)241,395-400(1997)]。因 此,僅需低水平的HDR基因校正來改變患者的臨床結果。此外,因子IX由肝合成和分泌,肝係可以被編碼編輯系統的病毒載體有效轉導的器官。
使用編碼ZFN的嗜肝腺相關病毒(AAV)血清型和校正HDR模板,在鼠類肝中實現突變的、人源化因子IX基因的高達7%的基因校正[李(Li),H.等人《自然》(Nature)475,217-221(2011)]。這使得凝塊形成動力學(凝血級聯功能的量度)得到改進,第一次證明體內編輯治療不僅可行,而且有效。如本文所討論的,根據本文的傳授內容和本領域中的知識,技術人員被定位,例如李(Li),以用含HDR模板和CRISPR-Cas(Cas9)系統(該系統靶向X連鎖隱性障礙的突變以逆轉功能缺失突變)的粒子解決B型血友病。
在此項研究的基礎上,其他團體最近已經使用用CRISPR-Cas進行的肝體內基因組編輯成功地治療遺傳性酪胺酸血症小鼠模型並且產生提供針對心血管疾病的保護的突變。這兩種不同的應用證明了這種方法用於涉及肝功能異常的障礙的多功能性[印(Yin),H.等人《自然生物技術》(Nature biotechnology)32,551-553(2014);丁(Ding),Q.等人《循環研究》(Circulation research)115,488-492(2014)]。為了證明此策略係廣泛適用的,必需將體內編輯應用於其他器官系統。目前,正在努力優化病毒和非病毒載體兩者,以擴展可以用這種模式的治療進行治療的障礙的範圍[科特曼(Kotterman),M.A.&謝弗(Schaffer),D.V.《自然綜述˙遺傳學》(Nature reviews.Genetics)15,445-451(2014);印(Yin),H.等人《自然綜述˙遺傳學》(Nature reviews.Genetics)15,541-555(2014)]。如本文所討論的,根據本文的傳授內容和本領域中的知識,技 術人員被定位,例如印(Yin),以用含HDR模板和靶向突變的CRISPR-Cas(Cas9)系統的粒子解決遺傳性酪胺酸血症。
靶向缺失、治療應用:基因的靶向缺失可以是較佳的。因此,較佳的是在以下中涉及的基因,免疫缺陷障礙、血液學病況、或遺傳性溶酶體貯積疾病,例如B型血友病、SCID、SCID-X1、ADA-SCID、遺傳性酪胺酸血症、β-地中海貧血、X-連鎖的CGD、偉-爾二氏症候群、范康尼氏頑固性貧血、腎上腺腦白質失養症(ALD)、異染性白質失養症(MLD)、HIV/AIDS、其他代謝障礙,編碼錯誤折疊的蛋白(涉及疾病)的基因,導致功能缺失的涉及疾病的基因;總體上使用任何本文討論的遞送系統可以在HSC中靶向突變,其中認為粒子系統係有利的。
在本發明中,可以具體地遵循首先由騰格裡(Tangri)等人針對促紅細胞生成素提出並且隨後開發的方法來降低該CRISPR酶的免疫原性。因此,定向演化或合理設計可以用來降低在宿主物種(人類或其他物種)中的CRISPR酶(例如Cas9)的免疫原性。
基因組編輯:本發明的CRISPR/Cas(Cas9)系統可以用來校正基因突變,先前使用TALEN和ZFN和慢病毒嘗試了該等突變(包括如本文討論的),但是成功有限;還參見WO 2013163628。
過繼性細胞療法
本發明還考慮使用本文描述的CRISPR-Cas系統,例如Cas9效應蛋白系統,從而修飾用於過繼性療法的細胞。本發明的方面涉及特異性針對所選抗原(例如腫瘤相關抗原)的免疫系統細胞如T細胞的過繼性轉移(參見瑪律斯(Maus)等人,2014,用於癌症或病毒的過繼 性免疫療法(Adoptive Immunotherapy for Cancer or Viruses),《免疫學年度評論》(Annual Review of Immunology),第32卷:189-225;羅森伯格(Rosenberg)和瑞斯提夫(Restifo),2015,作為用於人類癌症的個性化免疫療法的過繼性細胞轉移(Adoptive cell transfer as personalized immunotherapy for human cancer),《科學》(Science)第348卷,第6230期,第62-68頁;瑞斯提夫(Restifo)等人,2015,過繼性免疫療法用於癌症:利用T細胞應答(Adoptive immunotherapy for cancer:harnessing the T cell response).《自然評論免疫學》(Nat.Rev.Immunol.)12(4):269-281;以及詹森(Jenson)和裡德爾(Riddell),2014,設計和實施採用嵌合抗原受體修飾的T細胞進行的過繼性治療(Design and implementation of adoptive therapy with chimeric antigen receptor-modified T cells).《免疫學評論》(Immunol Rev.)257(1):127-144)。各種策略可以例如用於藉由改變T細胞受體(TCR)的特異性來對T細胞進行基因修飾,例如藉由引入具有選擇的肽特異性的新TCR α和β鏈(參見美國專利案號8,697,854;PCT專利公開案:WO 2003020763、WO 2004033685、WO 2004044004、WO 2005114215、WO 2006000830、WO 2008038002、WO 2008039818、WO 2004074322、WO 2005113595、WO 2006125962、WO 2013166321、WO 2013039889、WO 2014018863、WO 2014083173;美國專利案號8,088,379)。
作為TCR修飾的替代方案或添加方案,可以使用嵌合抗原受體(CAR)以產生特異性針對所選靶標如惡性細胞的免疫反應性細胞,例如T細胞,其中廣泛的受體嵌合構建體已經被描述(參見美國專利案號5,843,728;5,851,828;5,912,170;6,004,811;6,284,240;6,392,013; 6,410,014;6,753,162;8,211,422;以及PCT公開案WO 9215322)。可替代的CAR構建體可以被表徵為屬於連續世代。第一代CAR典型地由藉由柔性接頭例如藉由CD8α鉸股結構域和CD8α跨膜結構域連接到CD3ζ或FcRγ的跨膜和細胞內傳訊結構域上的特異性針對抗原的抗體的單股可變片段(例如包含與特異性抗體的VH相連的VL)組成(scFv-CD3ζ或scFv-FcRγ;參見美國專利案號7,741,465;美國專利案號5,912,172;美國專利案號5,906,936)。第二代CAR結合了在胞內結構域內的一種或多種共刺激分子例如CD28、OX40(CD134)、或4-1BB(CD137)的細胞內結構域(例如scFv-CD28/OX40/4-1BB-CD3ζ;參見美國專利案號8,911,993;8,916,381;8,975,071;9,101,584;9,102,760;9,102,761)。第三代CAR包括共刺激性胞內結構域例如CD3ζ-鏈、CD97、GDI la-CD18、CD2、ICOS、CD27、CD154、CDS、OX40、4-1BB、或CD28傳訊構域的組合(例如scFv-CD28-4-1BB-CD3ζ或scFv-CD28-OX40-CD3ζ;參見美國專利案號8,906,682;美國專利案號8,399,645;美國專利案號5,686,281;PCT公開號WO 2014134165;PCT公開號WO 2012079000)。可替代地,共刺激可以藉由在抗原特異性T細胞中表現CAR來安排,所述抗原特異性T細胞被選擇為在伴隨的共刺激下,在其天然αβTCR例如由專業抗原呈遞細胞上的抗原接合後被活化並且擴增。此外,另外的工程化受體可以提供在免疫反應性細胞上,例如以改進T細胞攻擊的靶向和/或最小化副作用。
可以使用替代性技術來轉化靶免疫反應性細胞,例如原生質體融合、脂轉染、轉染或電穿孔。可以使用寬範圍的載體,例如逆轉錄病毒載體、慢病毒載體、腺病毒載體、腺相關病毒載體、質粒或轉座 子,例如睡美人轉座子(參見美國專利案號6,489,458;7,148,203;7,160,682;7,985,739;8,227,432),可以用於引入CAR,例如使用藉由CD3ζ以及CD28或CD137的第二代抗原特異性CAR傳訊。病毒載體可以例如包括基於HIV、SV40、EBV、HSV或BPV的載體。
靶向的用於轉化的細胞可以例如包括T細胞、自然殺傷(NK)細胞、細胞毒性T淋巴細胞(CTL)、調節性T細胞、人類胚胎幹細胞、腫瘤浸潤淋巴細胞(TIL)或可以分化出淋巴樣細胞的多能幹細胞。表現希望的CAR的T細胞可以例如藉由與γ-照射的活化和繁殖細胞(AaPC)的共培養來選擇,它們共表現癌症抗原和共刺激性分子。可以例如藉由在可溶性因子例如IL-2和IL-21的存在下,在AaPC上共培養來擴增該等工程化的CAR T細胞。可以例如進行該擴增以提供記憶CAR+ T細胞(其可以例如藉由非酶數位陣列和/或多-面板流式細胞術來測定)。以此方式,CAR T細胞可以被提供為具有針對帶有抗原的腫瘤的特定細胞毒性活性(視情況連同產生所希望的趨化因子例如干擾素-γ)。這種CAR T細胞可以例如用於動物模型中,例如以治療腫瘤異種移植物。
多種方法(例如前述的)可以適於提供對患有疾病(例如瘤形成,例如藉由給予有效量的含有抗原識別受體的免疫反應性細胞,該抗原識別受體結合所選抗原)的受試者進行治療和/或增加存活之方法,其中該結合活化免疫反應性細胞,由此治療或預防該疾病(例如瘤形成、病原體感染、自身免疫性障礙、或異體移植反應)。在CAR T細胞療法中的給予可以例如涉及給予從106至109個細胞/kg,具有或不具有例如採用環磷醯胺的淋巴耗減歷程。
在一個實施方式中,該治療可以給予到經歷免疫抑制治療的患者中。該等細胞或細胞群體,可以被製成由於對這種免疫抑制劑的受體進行編碼的基因的失活而耐受至少一種免疫抑制劑。不受理論的束縛,免疫抑制治療應有助於選擇和擴增在患者內的根據本發明的免疫反應性細胞或T細胞。
給予根據本發明的細胞或細胞群體可以按任何便利方式來進行,包括藉由霧化吸入、注射、攝取、輸注、植入或移植。該等細胞或細胞群體可以皮下、真皮內、瘤內、節內、髓內、肌內、藉由靜脈內或淋巴管注射、或腹膜內給予至患者。在一個實施方式中,本發明的細胞組成物較佳的是藉由靜脈注射給予。
給予細胞或細胞群體可以由給予104-109個細胞/kg體重組成,較佳的是105至106個細胞/kg體重,包括在那些範圍內的細胞數目的所有整數值。在CAR T細胞療法中的給予可以例如涉及給予從106至109個細胞/kg,具有或不具有例如採用環磷醯胺的淋巴耗減歷程。該等細胞或細胞群體可以按一個或多個劑量給予。在另一個實施方式中,有效量的細胞係作為單一劑量給予。在另一個實施方式中,有效量的細胞係在一段時間內作為多於一個劑量給予。給予的時間安排係在管理醫師的判斷內,並且取決於患者的臨床病況。該等細胞或細胞群體可以從任何來源如血庫或供體獲得。雖然個體需要不同,針對具體疾病或病況確定給定細胞類型的有效量的最佳範圍係在熟習該項技術者的技術內。有效量意指提供治療或預防益處的量。給予的劑量將取決於接受者的年齡、健康和體重、並行治療(如果有的話)的種類、治療頻率和所希望的作用的 性質。
在另一個實施方式中,腸胃外給予有效量的細胞或包含那些細胞的組成物。該給予可以是靜脈內給予。該給予可以是直接藉由在腫瘤內注射來進行。
為了避免可能的不良反應,工程化的免疫反應性細胞可以配備有轉基因安全性開關,該開關處於使得細胞易於暴露於特異性信號的轉基因形式。例如,單純性皰疹病毒胸苷激酶(TK)基因可以按此方式使用,例如藉由在幹細胞移植後引入到用作供體淋巴細胞輸注物的異體T淋巴細胞中(格雷科(Greco)等人,用TK-自殺基因改進細胞療法的安全性(Improving the safety of cell therapy with the TK-suicide gene).藥理學前沿(Front.Pharmacol.)2015;6:95)。在此類細胞中,給予核苷前藥例如更昔洛韋或阿昔洛韋引起細胞死亡。可替代的安全性開關構建體包括可誘導的半胱天冬酶9,例如藉由給予將兩個非功能性icasp9分子置於一起而形成活性酶的小分子二聚物觸發。已經描述了各種實施細胞增殖控制的替代途徑(參見美國專利公開案號20130071414;PCT專利公開案WO 2011146862;PCT專利公開案WO 2014011987;PCT專利公開案WO 2013040371;周(Zhou)等人,《血液》(BLOOD),2014,123/25:3895-3905;迪史塔西(Di Stasi)等人,《新英格蘭生物醫學雜誌》(The New England Journal of Medicine)2011;365:1673-1683;薩德拉恩(Sadelain)M等人,《新英格蘭生物醫學雜誌》(The New England Journal of Medicine)2011;365:1735-173;拉莫斯(Ramos)等人,《幹細胞》(Stem Cells)28(6):1107-15(2010))。
在過繼性療法的另一個細化方面,基因組編輯可以用於針對例如提供經編輯CAR T細胞的可替代實施而定制免疫反應性細胞,(參見白羅(Poirot)等人,2015,多元基因組編輯的T細胞生產平臺用於“現成的”過繼性T細胞免疫療法(Multiplex genome edited T-cell manufacturing platform for "off-the-shelf" adoptive T-cell immunotherapies),《癌症研究》(Cancer Res)75(18):3853)。細胞可以使用如本文描述的任何CRISPR系統和其使用方法來編輯。CRISPR系統可以藉由本文描述的任何方法被遞送到免疫細胞。在較佳的實施方式中,將細胞進行離體編輯,並且轉移到對其有需要的受試者中。可以編輯免疫反應性細胞、CAR T細胞或任何用於過繼性細胞轉移的細胞。可以進行編輯以消除潛在的同種反應性T-細胞受體(TCR),破壞化學治療劑的靶標,阻斷免疫檢查點,活化T細胞,和/或增加功能上消耗的或功能失調的CD8+ T-細胞的分化和/或增殖(參見PCT專利公開案WO 2013176915、WO 2014059173、WO 2014172606、WO 2014184744、和WO 2014191128)。編輯可以導致基因的失活。
使基因失活意為感興趣的基因不是以功能蛋白形式表現。在一個具體實施方式中,該CRISPR系統特異性地催化一個靶向的基因中的切割,從而使所述靶向的基因失活。引起的核酸股斷裂通常是藉由同源重組或非同源末端連接(NHEJ)的不同機制修復的。然而,NHEJ係通常導致在切割位點處DNA序列的變化的非完美修復過程。經由非同源末端連接(NHEJ)的修復經常導致小的插入或缺失(indel),並且可以用於創建特異性基因敲除。其中已經發生切割誘導的誘變事件的細胞 可以藉由本領域中熟知的方法鑒定和/或選擇。
T細胞受體(TCR)係響應於抗原呈遞參與T細胞活化的細胞表面受體。TCR總體上由兩個鏈(α和β)構成,它們組裝以形成異二聚體,並且與CD3-轉導亞基締合以形成存在於細胞表面上的T細胞受體複合物。TCR的α和β各鏈由免疫球蛋白樣N-末端可變(V)區和恒定(C)區、疏水跨膜結構域、和短胞質區組成。至於免疫球蛋白分子,α和β鏈的可變區係藉由V(D)J重組產生,在T細胞群體內創造了多種多樣的抗原特異性。然而,相比於識別完整抗原的免疫球蛋白,由與MHC分子關聯的經處理的肽片段活化T細胞,藉由T細胞將額外維度引入抗原識別,稱為MHC限制。藉由T細胞受體識別在供體和受體之間的MHC差異導致T細胞增殖和移植物抗宿主病(GVHD)的潛在發展。TCRα或TCRβ的失活可以導致TCR從T細胞表面的清除,防止了同種異體抗原的識別並因此防止GVHD。然而,TCR破壞總體上導致清除CD3傳訊組分,並且改變進一步的T細胞擴增的方式。
異體細胞由宿主免疫系統快速地排斥。已經證明,存在於非照射的血液產品中的異體白細胞將持續不超過5至6天(博尼(Boni),米蘭斯基(Muranski)等人2008《血液》(Blood)1;112(12):4746-54)。因此,為了防止異體細胞的排斥,宿主的免疫系統通常必須在一定程度上被抑制。然而,在過繼性細胞轉移的情況下,免疫抑制性藥物的使用還對引入的治療T細胞具有有害作用。因此,在該等情況下為了有效地使用過繼性免疫療法途徑,所引入的細胞將需要對免疫抑制治療具有抗性。因此,在一具體實施方式中,本發明進一步包括以下步驟:修飾T細胞以 使它們對免疫抑制劑具有抗性,較佳的是藉由使對免疫抑制劑的靶標進行編碼的至少一個基因失活。免疫抑制劑係藉由若干作用機制中的一個抑制免疫功能的試劑。免疫抑制劑可以是但不限於鈣調磷酸酶抑制劑、雷帕黴素的靶標、白介素-2受體α-鏈阻斷劑、肌苷一磷酸脫氫酶的抑制劑、二氫葉酸還原酶的抑制劑、皮質類固醇或免疫抑制性抗代謝物。本發明允許藉由使T細胞中的免疫抑制劑的靶標失活而對T細胞賦予免疫抑制抗性,以用於免疫療法。作為非限制性實例,免疫抑制劑的靶標可以是免疫抑制劑的受體,例如:CD52、糖皮質激素受體(GR)、FKBP家族基因成員和親環蛋白家族基因成員。
免疫檢查點係抑制通路,其減慢或終止免疫反應並預防來自免疫細胞的不受控活性的過度組織損害。在某些實施方式中,靶向的免疫檢查點係程式設計的死亡-1(PD-1或CD279)基因(PDCD1)。在其他實施方式中,靶向的免疫檢查點係細胞毒性T-淋巴細胞相關抗原(CTLA-4)。在另外的實施方式中,靶向的免疫檢查點係CD28和CTLA4Ig超家族的另一個成員,例如BTLA、LAG3、ICOS、PDL1或KIR。在另外的其他實施方式中,靶向的免疫檢查點係TNFR超家族的一個成員,例如CD40、OX40、CD137、GITR、CD27或TIM-3。
另外的免疫檢查點包括含有Src同源性2結構域的蛋白酪胺酸磷酸酶1(SHP-1)(沃森(Watson)HA,等人,SHP-1:用於癌症免疫療法的下一個檢查點靶標(SHP-1:the next checkpoint target for cancer immunotherapy)?生物化學學會彙刊(Biochem Soc Trans.)2016年4月15日;44(2):356-62)。SHP-1係廣泛表現的抑制性蛋白酪胺酸磷酸酶 (PTP)。在T-細胞中,它係抗原-依賴性活化和增殖的負調節物。它係胞質蛋白,並且因此不適合於抗體介導的療法,但其在活化和增殖中的作用使得它成為對於以過繼性轉移策略(如嵌合抗原受體(CAR)T細胞)進行的基因操縱有吸引力的靶標。免疫檢查點還可以包括具有Ig和ITIM結構域的T細胞免疫受體(TIGIT/Vstm3/WUCAM/VSIG9)和VISTA(樂梅西埃(Le Mercier)I等人,(2015)超越於CTLA-4和PD-1,負檢查點調節物的Z代(Beyond CTLA-4 and PD-1,the generation Z of negative checkpoint regulators).《免疫學前沿》(Front.Immunol.)6:418)。
WO 2014172606涉及使用MT1和/或MT1抑制劑以增加消耗的CD8+ T細胞的增殖和/或活性,並且降低CD8+ T細胞消耗(例如,降低功能上消耗的或無響應的CD8+免疫細胞)。在某些實施方式中,藉由在過繼性地轉移的T細胞中進行基因編輯來靶向金屬硫蛋白。
在某些實施方式中,基因編輯的靶標可以是在免疫檢查點蛋白的表現中涉及的至少一個靶向的座位。此類靶標可以包括但不限於CTLA4、PPP2CA、PPP2CB、PTPN6、PTPN22、PDCD1、ICOS(CD278)、PDL1、KIR、LAG3、HAVCR2、BTLA、CD160、TIGIT、CD96、CRTAM、LAIR1、SIGLEC7、SIGLEC9、CD244(2B4)、TNFRSF10B、TNFRSF10A、CASP8、CASP10、CASP3、CASP6、CASP7、FADD、FAS、TGFBRII、TGFRBRI、SMAD2、SMAD3、SMAD4、SMAD10、SKI、SKIL、TGIF1、IL10RA、IL10RB、HMOX2、IL6R、IL6ST、EIF2AK4、CSK、PAG1、SIT1、FOXP3、PRDM1、BATF、VISTA、GUCY1A2、GUCY1A3、GUCY1B2、GUCY1B3、MT1、MT2、CD40、OX40、CD137、GITR、 CD27、SHP-1或TIM-3。在較佳的實施方式中,在PD-1或CTLA-4基因的表現中涉及的基因座位被靶向。在其他較佳的實施方式中,基因的組合被靶向,例如但不限於PD-1和TIGIT。
在其他實施方式中,至少兩個基因被編輯。基因對可以包括但不限於PD1和TCRα、PD1和TCRβ、CTLA-4和TCRα、CTLA-4和TCRβ、LAG3和TCRα、LAG3和TCRβ、Tim3和TCRα、Tim3和TCRβ、BTLA和TCRα、BTLA和TCRβ、BY55和TCRα、BY55和TCRβ、TIGIT和TCRα、TIGIT和TCRβ、B7H5和TCRα、B7H5和TCRβ、LAIR1和TCRα、LAIR1和TCRβ、SIGLEC10和TCRα、SIGLEC10和TCRβ、2B4和TCRα、2B4和TCRβ。
無論在T細胞的遺傳修飾之前或之後,通常T細胞可以使用例如在以下文獻中描述的方法活化和擴增:美國專利6,352,694;6,534,055;6,905,680;5,858,358;6,887,466;6,905,681;7,144,575;7,232,566;7,175,843;5,883,223;6,905,874;6,797,514;6,867,041;和7,572,631。可以體外或體內擴增T細胞。
除非另有說明,本發明的實踐採用免疫學、生物化學、化學、分子生物學、微生物學、細胞生物學、基因組學和重組DNA的常規技術,該等在本領域的技能之內。參見《分子選殖:實驗室手冊》(MOLECULAR CLONING:ALABORATORY MANUAL),第2版(1989)(薩姆布魯克(Sambrook)、弗裡奇(Fritsch)和馬尼亞蒂斯(Maniatis));《分子選殖:實驗室手冊》(MOLECULAR CLONING:A LABORATORY MANUAL),第4版(2012)(格林(Green)和薩姆布魯克(Sambrook)); 分子生物學中的當前工具(CURRENT PROTOCOLS IN MOLECULAR BIOLOGY)(1987)(F.M.奧蘇貝爾(Ausubel)等人,編輯);《酶學方法》(METHODS IN ENZYMOLOGY)系列(學術出版公司);《PCR 2:實用方法》(PCR 2:A PRACTICAL APPROACH)(1995)(M.J.麥克弗森(M.J.MacPherson)、B.D.Hames)和G.R.泰勒(泰勒(Taylor)編輯);《抗體:實驗室手冊》(ANTIBODIES,A LABORATORY MANUAL)(1988)(哈洛(Harlow)和拉內(Lane)編輯);《抗體:實驗室手冊》(ANTIBODIES,A LABORATORY MANUAL),第二版(2013)(E.A.格林菲爾德(Greenfield)編輯);和動物細胞培養(1987)(R.I.弗雷謝尼(Freshney)編輯)。
除非另外指明,本發明的實踐使用常規的用於產生遺傳修飾的小鼠的技術。參見馬滕H.霍夫科(Marten H.Hofker)和簡 范 德烏森(Jan van Deursen),轉基因小鼠方法和方案(TRANSGENIC MOUSE METHODS AND PROTOCOLS),第二版(2011)。
ALS
美國專利公開案號20110023144描述了使用鋅指核酸酶基因修飾與肌萎縮性側索硬化(ALS)疾病相關的細胞、動物以及蛋白質。ALS由涉及隨意運動的腦皮層、腦幹和脊髓中的某些神經細胞的逐步穩定退化表徵。
運動神經元障礙以及與該等障礙相關的蛋白質係一套影響患上運動神經元障礙的易感性、運動神經元障礙的存在、運動神經元障礙的嚴重性或其任何組合的相異蛋白質。本揭露包括編碼與一種特定 的運動神經元障礙ALS疾病相關的蛋白質的任何染色體序列的編輯。典型地基於ALS相關蛋白與ALS的實驗相關性選擇與ALS相關的蛋白質。例如,相對於沒有ALS的群體,在具有ALS的群體中,與ALS相關的蛋白質的產生率或循環濃度可以升高或降低。可以使用蛋白質組技術評估蛋白質水平差異,包括但不限於西方墨點、免疫組織化學染色、酶聯免疫吸附測定(ELISA)以及質譜法。可替代地,可以使用基因組技術藉由獲得編碼該等蛋白質的基因的基因表現譜而鑒定與ALS相關的蛋白質,包括但不限於DNA微陣列分析、基因表現序列分析(SAGE)以及定量即時聚合酶鏈式反應(Q-PCR)。
藉由非限制性實例的方式,與ALS相關的蛋白質包括但不限於以下蛋白質:SOD1超氧化物歧化酶1,ALS3肌萎縮性側索可溶性硬化3 SETX senataxin ALS5肌萎縮性側索硬化5 FUS融合在肉瘤中ALS7肌萎縮性側索硬化7 ALS2肌萎縮性側索DPP6二肽基肽酶6硬化2 NEFH神經微絲,重PTGS1前列腺素-多肽內過氧化物合酶1 SLC1A2溶質載體家族1 TNFRSF10B腫瘤壞死因子(膠質高親和性受體超家族,穀胺酸轉運體),成員10b成員2 PRPH外周蛋白HSP90AA1熱休克蛋白90kDaα(胞質的),類別A成員1 GRIA2穀胺酸受體,IFNG干擾素,γ離子型的,AMPA 2 S100B S100鈣結合FGF2成纖維細胞生長因子2蛋白質B AOX1醛氧化酶1 CS檸檬酸合酶TARDBP TAR DNA結合蛋白TXN硫氧還原蛋白RAPH1 Ras締合MAP3K5絲裂原活化蛋白質(RaIGDS/AF-6)和激酶5普列克底物蛋白(pleckstrin)同源性結構域1 NBEAL1蛋白激酶錨定蛋白(neurobeachin)樣1 GPX1穀胱甘肽過氧化物酶1 ICA1L胰島細胞自身抗 原RAC1 ras-相關C3肉毒菌1.69kDa樣毒素底物1 MAPT微管相關ITPR2肌醇1,4,5-蛋白tau三磷酸受體,2型ALS2CR4肌萎縮性側索GLS穀胺醯胺酶硬化2(青少年)染色體區域,候選物4 ALS2CR8肌萎縮性側索CNTFR睫狀神經營養因子硬化2(青少年)受體染色體區域,候選物8 ALS2CR11肌萎縮性側索FOLH1葉酸水解酶1硬化2(青少年)染色體區域,候選物11 FAM117B具有序列P4HB的家族脯胺醯基4-羥化酶,相似性117,成員B β多肽CNTF睫狀神經營養因子SQSTM1死骨片(sequestosome)1 STRADB STE20相關激酶NAIP NLR家族,凋亡適配器β抑制蛋白YWHAQ酪胺酸3-SLC33A1溶質載體家族33單加氧酶/色胺酸(乙醯-CoA轉運體),一種5-單加氧酶成員1活化蛋白,θ多肽TRAK2運輸蛋白,圖4圖4同系物,SAC1驅動蛋白結合2脂質磷酸酶結構域包含NIF3L1 NIF3 NGG1相互作用INA互聯蛋白(internexin)神經因子3樣1中間絲蛋白,α PARD3B par-3分區COX8A細胞色素c氧化酶缺陷3同系物B亞基VIIIA CDK15細胞週期蛋白依賴性激酶HECW1 HECT,C2和WW 15結構域包含E3泛素蛋白連接酶1 NOS1一氧化氮合酶1 MET met原癌基因SOD2超氧化物歧化酶2,HSPB1熱休克27kDa線粒體蛋白1 NEFL神經微絲,輕CTSB組織蛋白酶B多肽ANG血管生成素,HSPA8熱休克70kDa核糖核酸酶,RNA酶A蛋白8家族,5 VAPB VAMP(囊泡-ESR1雌激素受體1相關膜蛋白)-相關蛋白B和C SNCA突觸核蛋白,α HGF肝細胞生長因子CAT過氧化氫酶ACTB肌動蛋白,β NEFM神經微絲,介質TH酪胺酸羥化酶多肽BCL2 B-細胞CLL/淋巴瘤2 FAS Fas(TNF受體超家族,成員6)CASP3半胱天冬酶3,凋亡-CLU簇集蛋白相關半胱胺酸肽酶SMN1運動神經元的存活G6PD葡萄糖-6-磷酸1,端粒脫氫酶BAX BCL2-相關X HSF1熱休克轉錄蛋白因子1 RNF19A環指蛋白19A JUN jun癌基因ALS2CR12肌萎縮性側索HSPA5熱休克70kDa硬化2(青少年)蛋白5染色體區域,候選物12 MAPK14絲裂原活化蛋白IL10白介素10激酶14 APEX1 APEX核酸酶TXNRD1硫氧還原蛋白還原酶1(多功能DNA修復酶)1 NOS2一氧化氮合酶2,TIMP1 TIMP金屬肽酶可誘導的抑制劑1 CASP9半胱天冬酶9,相關半胱胺酸凋亡肽酶的凋亡-XIAP X-連接的抑制劑GLG1高基蛋白糖蛋白1 EPO促紅細胞生成素VEGFA血管內皮ELN彈性蛋白生長因子A GDNF膠質細胞衍生的NFE2L2核因子(紅系(erythroid)-神經營養因子衍生的2)樣2 SLC6A3溶質載體家族6 HSPA4熱休克70kDa(神經遞質蛋白4轉運體,多巴胺),成員3 APOE脂蛋白E PSMB8蛋白酶體(先質,巨蛋白因子)亞基,β類型,8 DCTN1動力蛋白活化蛋白(dynactin)1 TIMP3 TIMP金屬肽酶抑制劑3 KIFAP3驅動蛋白相關SLC1A1溶質載體家族1蛋白3(神經元/上皮高親和性穀胺酸轉運體,系統Xag),成員1 SMN2運動神經元的存活CCNC細胞週期蛋白C 2,著絲粒MPP4膜蛋白,STUB1 STIP1同源性和U-棕櫚醯化的4盒包含蛋白1 ALS2澱粉樣蛋白β(A4)PRDX6過氧化物酶6先質蛋白SYP突觸素CABIN1鈣調磷酸酶結合蛋白1 CASP1半胱天冬酶1,凋亡-GART磷酸核糖甘胺醯胺相關半胱胺酸甲醯轉移酶,肽酶磷酸核糖甘胺醯胺合成酶,磷酸核糖胺基咪唑合成酶CDK5細胞週期蛋白依賴性激酶5 ATXN3共濟失調蛋白3 RTN4漿膜蛋白(reticulon)4 C1QB補體成分1,q亞成分,B鏈VEGFC神經生長因子HTT亨廷頓蛋白(huntingtin)受體PARK7帕金森病7 XDH黃嘌呤脫氫酶GFAP膠質纖維酸性MAP2微管相關蛋白2 CYCS細胞色素c,軀體的FCGR3B IgG的Fc片段,低親和性IIIb,CCS UBL5(泛素樣5超氧化物歧化酶)的銅分子伴侶MMP9基質金屬肽 酶SLC18A3溶質載體家族18 9((囊狀乙醯膽鹼),成員3 TRPM7暫態受體HSPB2熱休克27kDa潛在的陽離子通道,蛋白2亞家族M,成員7 AKT1 v-akt鼠胸腺瘤DERL1 Der1樣結構域家族,病毒癌基因同系物1成員1 CCL2趨化因子(C--C模體)NGRN突觸生長相關蛋白(neugrin),軸突配位基2贅生物(outgrowth)相關GSR穀胱甘肽還原酶TPPP3促微管蛋白聚合蛋白家族成員3 APAF1凋亡肽酶BTBD10 BTB(POZ)結構域活化蛋白1包含10 GLUD1穀胺酸CXCR4趨化因子(C--X--C模體)脫氫酶1受體4 SLC1A3溶質載體家族1 FLT1 fms相關酪胺酸(膠質高親和性穀胺酸轉運體),成員3激酶1 PON1對氧磷酶1 AR雄激素受體LIF白血病抑制蛋白ERBB3 v-erb-b2紅白血病病毒癌基因同系物3 LGALS1凝集素,半乳糖苷-CD44 CD44分子結合,可溶的,1 TP53腫瘤蛋白p53 TLR3 toll樣受體3 GRIA1穀胺酸受體,GAPDH甘油-3-離子型的,AMPA 1磷酸脫氫酶GRIK1穀胺酸受體,DES結蛋白離子型的,紅藻胺酸(kainate)1 CHAT膽鹼乙醯轉移酶FLT4 fms相關酪胺酸激酶4 CHMP2B染色質修飾的BAG1 BCL2相關蛋白2B永生基因(athanogene)MT3金屬硫蛋白3 CHRNA4膽鹼能受體,煙鹼的,α 4 GSS穀胱甘肽合成酶BAK1 BCL2-拮抗劑(antagonist/killer)1 KDR激酶插入結構域GSTP1穀胱甘肽S-轉移酶受體(III型pi 1受體酪胺酸激酶)OGG1 8-氧橋鳥嘌呤(oxoguanine)DNA IL6白介素6(干擾素,糖基化酶β 2)。
該動物或細胞可以包括1、2、3、4、5、6、7、8、9、10個或更多個破壞的、編碼與ALS相關的蛋白質的染色體序列以及零、1、2、3、4、5、6、7、8、9、10個或更多個編碼破壞的與ALS相關的蛋白 質的染色體整合序列。與ALS相關的較佳的是蛋白包括SOD1(超氧化物歧化酶1)、ALS2(肌萎縮性側索硬化2)、FUS(融合在肉瘤中)、TARDBP(TAR DNA結合蛋白)、VAGFA(血管內皮生長因子A)、VAGFB(血管內皮生長因子B)以及VAGFC(血管內皮生長因子C)及其任何組合。
自閉症
美國專利公開案號20110023145描述了使用鋅指核酸酶基因修飾與泛自閉症障礙(ASD)相關的細胞、動物以及蛋白質。泛自閉症障礙(ASD)係一組由社會交往和溝通的質量損傷以及行為、興趣和活動的限制性重複和刻板性模式表徵的障礙。這三種障礙自閉症、亞斯伯格症候群(AS)和未另行規定的廣泛性發育障礙(PDD-NOS)係具有不同的嚴重程度、相關智力功能和醫療條件的同一障礙的連續體。ASD係主要由遺傳決定的障礙,具有大約90%遺傳力。
美國專利公開案號20110023145包括編輯任何編碼與ASD相關的蛋白質的染色體序列,該等序列可以被應用於本發明的CRISPR Cas系統。典型地基於與ASD相關的蛋白質與ASD的發生率或適應症的實驗相關性選擇與ASD相關的蛋白質。例如,相對於缺少ASD的群體,在具有ASD的群體中,與ASD相關的蛋白質的產生率或循環濃度可以升高或降低。可以使用蛋白質組技術評估蛋白質水平差異,包括但不限於西方墨點、免疫組織化學染色、酶聯免疫吸附測定(ELISA)以及質譜法。可替代地,可以使用基因組技術藉由獲得編碼該等蛋白質的基因的基因表現譜而鑒定與ASD相關的蛋白質,包括但不限於DNA微陣列分析、基因表現序列分析(SAGE)以及定量即時聚合酶鏈式反應(Q-PCR)。
可能和與ASD相關的蛋白質相關的疾病狀態或障礙的非限制性實例包括自閉症、亞斯伯格症候群(AS)、未另行規定的廣泛性發育障礙(PDD-NOS)、雷特氏症候群、結節性硬化(tuberous sclerosis)、苯丙酮尿症、史-倫-奧三氏綜合症(Smith-Lemli-Opitz syndrome)以及脆弱X染色體症候群。藉由非限制性實例的方式,與ASD相關的蛋白質包括但不限於以下蛋白質:ATP10C胺基磷脂-MET MET受體轉運ATP酶酪胺酸激酶(ATP10C)BZRAP1 MGLUR5(GRM5)代謝型穀胺酸受體5(MGLUR5)CDH10鈣粘素-10 MGLUR6(GRM6)代謝型穀胺酸受體6(MGLUR6)CDH9鈣粘素-9 NLGN1神經連接蛋白-1 CNTN4接觸蛋白-4 NLGN2神經連接蛋白-2 CNTNAP2接觸蛋白相關的SEMA5A神經連接蛋白-3蛋白樣2(CNTNAP2)DHCR7 7-脫氫膽固醇NLGN4X神經連接蛋白-4 X-還原酶(DHCR7)連接的DOC2A雙重C2樣-結構域-NLGN4Y神經連接蛋白-4 Y-包含蛋白α連接的DPP6二肽基NLGN5神經連接蛋白-5胺肽酶樣蛋白6 EN2鋸齒狀2(EN2)NRCAM神經細胞粘附分子(NRCAM)MDGA2脆性X智力遲鈍NRXN1軸突蛋白-1 1(MDGA2)FMR2(AFF2)AF4/FMR2家族成員2 OR4M2嗅覺受體(AFF2)4M2 FOXP2叉頭框蛋白P2 OR4N4嗅覺受體(FOXP2)4N4 FXR1脆性X智力OXTR催產素受體阻滯,常染色體(OXTR)同系物1(FXR1)FXR2脆性X智力PAH苯丙胺酸阻滯,常染色體羥化酶(PAH)同系物2(FXR2)GABRA1 γ-胺基丁酸PTEN磷酸酶和受體亞基α-1張力蛋白同源物(GABRA1)(PTEN)GABRA5 GABAA(.γ.-胺基丁酸PTPRZ1受體類型酸)受體α 5酪胺酸蛋白亞基(GABRA5)磷酸酶ζ(PTPRZ1)GABRB1 γ-胺基丁酸RELN顫蛋白受體亞基β-1(GABRB1)GABRB3 GABAA(.γ.-胺基丁酸RPL10 60S核糖體 酸)受體.β.3亞基蛋白L10(GABRB3)GABRG1 γ-胺基丁酸SEMA5A腦信號蛋白(Semaphorin)-5A受體亞基γ-1(SEMA5A)(GABRG1)HIRIP3 HIRA-相互作用蛋白3 SEZ6L2發作相關6同系物(小鼠)樣2 HOXA1同源盒蛋白Hox-A1 SHANK3 SH3和多重(HOXA1)錨蛋白重複結構域3(SHANK3)IL6白介素-6 SHBZRAP1 SH3和多重錨蛋白重複結構域3(SHBZRAP1)LAMB1層連結蛋白亞基β-1 SLC6A4血清素(LAMB1)轉運體(SERT)MAPK3絲裂原活化蛋白TAS2R1味覺受體激酶3類型2成員1 TAS2R1 MAZ Myc相關的鋅指TSC1結節性硬化蛋白的蛋白1 MDGA2 MAM結構域包含TSC2結節性硬化糖基磷脂醯肌醇蛋白2錨定物2(MDGA2)MECP2甲基CpG結合UBE3A泛素蛋白蛋白2(MECP2)連接酶E3A(UBE3A)MECP2甲基CpG結合WNT2無翅型蛋白2(MECP2)MMTV整合位點家族,成員2(WNT2)。
與ASD相關的其染色體序列被編輯的蛋白質的一致性可以並且將會變化。在較佳的實施方式中,與ASD相關的其染色體序列被編輯的蛋白質可以是由BZRAP1基因編碼的苯二氮卓受體(外周)相關蛋白1(BZRAP1)、由AFF2基因編碼的AF4/FMR2家族成員2蛋白(AFF2)(亦稱MFR2)、由FXR1基因編碼的脆性X智力遲鈍常染色體同系物1蛋白(FXR1)、由FXR2基因編碼的脆性X智力遲鈍常染色體同系物2蛋白(FXR2),由MDGA2基因編碼的含MAM結構域的糖基磷脂醯肌醇錨定物2蛋白(MDGA2)、由MECP2基因編碼的甲基CpG結合蛋白2(MECP2)、由MGLUR5-1基因編碼的代謝型穀胺酸受體5(MGLUR5)(亦稱GRM5)、由NRXN1基因編碼的軸突蛋白1蛋白或由SEMA5A基因 編碼的腦信號蛋白-5A蛋白(SEMA5A)。在一個示例性實施方式中,該基因修飾動物係大鼠,並且編碼與ASD相關的蛋白質的編輯的染色體序列如下所列:BZRAP1苯二氮卓受體XM_002727789,(外周)相關XM_213427,蛋白1(BZRAP1)XM_002724533,XM_001081125 AFF2(FMR2)AF4/FMR2家族成員2 XM_219832,(AFF2)XM_001054673 FXR1脆性X智力NM_001012179遲鈍,常染色體同系物1(FXR1)FXR2脆性X智力NM_001100647遲鈍,常染色體同系物2(FXR2)MDGA2含MAM結構域的NM_199269糖基磷脂醯肌醇錨定物2(MDGA2)MECP2甲基CpG結合NM_022673蛋白2(MECP2)MGLUR5代謝型穀胺酸NM_017012(GRM5)受體5(MGLUR5)NRXN1軸突蛋白-1 NM_021767 SEMA5A腦信號蛋白-5A(SEMA5A)NM_001107659。
三核苷酸重複擴增障礙(TRE)
美國專利公開案號20110016540描述了使用鋅指核酸酶基因修飾與三核苷酸重複擴增障礙相關的細胞、動物以及蛋白質。三核苷酸重複擴增障礙係複雜的、進行性的疾病,其涉及發育神經生物學並且常常影響認知以及感覺運動功能。
三核苷酸重複擴增蛋白係一套多樣化的蛋白質,該等蛋白質與發生三核苷酸重複擴增障礙的易感性、三核苷酸重複擴增障礙的存在、三核苷酸重複擴增障礙的嚴重性或其任何組合相關聯。三核苷酸重複擴增障礙被分為由重複類型決定的兩個類別。最常見的重複係三聯體CAG,當出現在一個基因的編碼區中時,其編碼胺基酸穀胺醯胺(Q)。因此,該等障礙被稱為多聚穀胺醯胺(polyQ)障礙並且包括下列疾病: 杭丁頓氏症(HD);脊延髓肌萎縮症(SBMA);脊髓小腦性失調症(SCA型1、2、3、6、7、和17);以及齒狀紅核-蒼白球呂伊斯體萎縮症(Dentatorubro-Pallidoluysian Atrophy,DRPLA)。其餘的三核苷酸重複擴增障礙不涉及CAG三聯體,或者該CAG三聯體不在該基因的編碼區中,並且因此被稱為非多聚穀胺醯胺障礙。非多聚穀胺醯胺障礙包括脆弱X染色體症候群(FRAXA);脆性XE精神發育遲滯(FRAXE);弗裡德賴希共濟失調(FRDA);肌強直性營養不良(DM);和脊髓小腦性失調症(SCA型8、和12)。
與三核苷酸重複擴增障礙相關聯的蛋白質典型地是基於三核苷酸重複擴增障礙相關性蛋白質與三核苷酸重複擴增障礙的實驗性關聯而選擇的。例如,相對於沒有三核苷酸重複擴增障礙的群體,在具有三核苷酸重複擴增障礙的群體中,與三核苷酸重複擴增障礙相關的蛋白質的產生率或循環濃度可以升高或降低。可以使用蛋白質組技術評估蛋白質水平差異,包括但不限於西方墨點、免疫組織化學染色、酶聯免疫吸附測定(ELISA)以及質譜法。可替代地,可以使用基因組技術藉由獲得編碼該等蛋白質的基因的基因表現譜而鑒定與三核苷酸重複擴增障礙相關的蛋白質,包括但不限於DNA微陣列分析、基因表現系列分析(SAGE)以及定量即時聚合酶鏈式反應(Q-PCR)。
與三核苷酸重複擴增障礙相關聯的蛋白質的非限制性實例包括AR(雄激素受體)、FMR1(脆性x精神發育遲滯1)、HTT(亨廷丁)、DMPK(肌強直性營養不良蛋白激酶)、FXN(線粒體型共濟失調蛋白)、ATXN2(脊髓小腦性失調症蛋白2)、ATN1(萎縮蛋白1)、FEN1 (片段結構特異內切核酸酶1)、TNRC6A(含有6A的三核苷酸重複)、PABPN1(多聚(A)結合蛋白,核1)、JPH3(親聯蛋白3)、MED15(介體複合物亞基15)、ATXN1(脊髓小腦性失調症蛋白1)、ATXN3(脊髓小腦性失調症蛋白3)、TBP(TATA盒結合蛋白)、CACNA1A(鈣通道,電壓依賴性,P/Q型、α1A亞基)、ATXN80S(ATXN8相反股(非蛋白質編碼))、PPP2R2B(蛋白磷酸酶2,調節亞基B,β)、ATXN7(脊髓小腦性失調症蛋白7)、TNRC6B(含有6 B的三核苷酸重複)、TNRC6C(含有6C的三核苷酸重複)、CELF3(CUGBP、Elav樣家族成員3)、MAB21L1(mab-21-樣1(秀麗隱桿線蟲))、MSH2(MutS同源物2,結腸癌,無息肉病型1(大腸杆菌))、TMEM185A(跨膜蛋白185A)、SIX5(SIX同源框5)、CNPY3(冠層3同源物(斑馬魚))、FRAXE(脆性部位,葉酸型,罕見型,fra(X)(q28)E)、GNB2(鳥嘌呤核苷酸結合蛋白(G蛋白)、β多肽2)、RPL14(核糖體蛋白L14)、ATXN8(脊髓小腦性失調症蛋白8)、INSR(胰島素受體)、TTR(轉甲狀腺素蛋白)、EP400(E1A結合蛋白p400)、GIGYF2(GRB10相互作用GYF蛋白2)、OGG1(8-氧鳥嘌呤DNA糖基化酶)、STC1(斯鈣素1)、CNDP1(肌肽二肽酶1(金屬肽酶M20家族))、C10orf2(染色體10開放閱讀框2)、MAML3智者基因樣3(果蠅)、DKC1(先天性角化不全症1,角化不良蛋白)、PAXIP1(PAX相互作用(具有轉錄活化域)蛋白1)、CASK(鈣/鈣調蛋白依賴性絲胺酸蛋白激酶(MAGUK家族)、MAPT(微管相關蛋白tau)、SP1(Sp1轉錄因子)、POLG(聚合酶(DNA指導的),γ)、AFF2(AF4/FMR2家族,成員2)、THBS1(凝血酶敏感蛋白1)、TP53(腫瘤蛋白p53)、ESR1(雌激素受體1)、CGGBP1(CGG三聯體重複結合蛋白1)、ABT1(基本轉錄活化蛋白1)、 KLK3(激肽釋放酶相關肽酶3)、PRNP(朊病毒蛋白)、JUN(jun癌基因)、KCNN3(鉀中間/小電導鈣活化通道,亞家族N,成員3)、BAX(BCL2相關X蛋白)、FRAXA(脆性部位,葉酸型,罕見型,fra(X)(q27.3)A(巨睾丸,精神發育遲滯))、KBTBD10(Kelch重複和BTB(POZ)域包含蛋白10)、MBNL1(盲肌樣(果蠅))、RAD51(RAD51同源物(RecA同源物,大腸桿菌)(釀酒酵母))、NCOA3(核受體共活化蛋白3)、ERDA1(擴展重複結構域,CAG/CTG 1)、TSC1(結節性硬化1)、COMP(軟骨寡聚基質蛋白)、GCLC(穀胺醯半胱胺酸連接酶,催化亞基)、RRAD(Ras相關關聯糖尿病)、MSH3(mutS同源物3(大腸桿菌))、DRD2(多巴胺受體D2)、CD44(CD44分子(印度血型))、CTCF(CCCTC結合因子(鋅指蛋白))、CCND1(細胞週期蛋白D1)、CLSPN(扣蛋白同源物(非洲爪蟾))、MEF2A(肌細胞增強因子2A)、PTPRU(蛋白酪胺酸磷酸酶,受體型,U)、GAPDH(3-磷酸甘油醛脫氫酶)、TRIM22(三模體蛋白22)、WT1(維爾姆斯瘤1)、AHR(芳香烴受體)、GPX1(穀胱甘肽過氧化物酶1)、TPMT(硫嘌呤甲基轉移酶)、NDP(諾裡病(假神經膠質瘤))、ARX(無芒相關同源框)、MUS81(MUS81內切核酸酶同源物(釀酒酵母))、TYR(酪胺酸酶(眼皮膚白化病IA))、EGR1(早期生長反應蛋白1)、UNG(尿嘧啶DNA糖基化酶)、NUMBL(麻木同源物(果蠅)樣)、FABP2(脂肪酸結合蛋白2,腸)、EN2(鋸齒狀同源框2)、CRYGC(晶狀體蛋白,γC)、SRP14(信號識別粒子14kDa(同源Alu RNA結合蛋白))、CRYGB(晶狀體蛋白,γ B)、PDCD1(程式性細胞死亡1)、HOXA1(同源框A1)、ATXN2L(脊髓小腦性失調症蛋白2樣)、PMS2(PMS2減數分裂後分離增加2樣蛋白(釀酒酵母))、GLA(半乳糖苷酶,α)、CBL (Cas-Br-M(鼠)熱帶逆轉錄病毒轉化序列)、FTH1(鐵蛋白,重多肽1)、IL12RB2(白細胞介素12受體,β2)、OTX2(正小齒同源框2)、HOXA5(同源框A5)、POLG2(聚合酶(DNA指導的),γ2,輔助亞基)、DLX2(末端減少同源框2)、SIRPA(信號調節蛋白α)、OTX1(正小齒同源框1)、AHRR(芳香烴受體抑制物)、MANF(中腦星形膠質細胞衍生神經營養因子)、TMEM158(跨膜蛋白158(基因/假基因))、以及ENSG00000078687。
與三核苷酸重複擴增障礙相關聯的較佳的蛋白質包括HTT(亨廷丁)、AR(雄激素受體)、FXN(線粒體型共濟失調蛋白)、Atxn3(脊髓小腦性失調症蛋白)、Atxn1(脊髓小腦性失調症蛋白)、Atxn2(脊髓小腦性失調症蛋白)、Atxn7(脊髓小腦性失調症蛋白)、Atxn10(脊髓小腦性失調症蛋白)、DMPK(肌強直性營養不良蛋白激酶)、Atn1(萎縮蛋白1)、CBP(creb結合蛋白)、VLDLR(極低密度脂蛋白受體)、及其任何組合。
阿茲海默症
美國專利公開案號20110023153描述了使用鋅指核酸酶基因修飾與阿茲海默症相關的細胞、動物以及蛋白質。曾經修飾的細胞和動物可以進一步使用已知的用於研究靶向突變對AD的發展和/或進展的影響之方法,使用AD研究中常用的措施進行測試-如但不限於,學習和記憶、焦慮、抑鬱、成癮、感覺運動功能以及測量行為、功能、病理、代謝和生化功能的測定。
本揭露包括編碼與AD相關的蛋白質的任何染色體序列的 編輯。典型地基於AD相關蛋白與AD障礙的實驗相關性選擇AD相關蛋白。例如,相對於缺少AD障礙的群體,在具有AD障礙的群體中,AD相關蛋白的產生率或循環濃度可以升高或降低。可以使用蛋白質組技術評估蛋白質水平差異,包括但不限於西方墨點、免疫組織化學染色、酶聯免疫吸附測定(ELISA)以及質譜法。可替代地,可以使用基因組技術藉由獲得編碼該等蛋白質的基因的基因表現譜而鑒定AD相關蛋白,包括但不限於DNA微陣列分析、基因表現序列分析(SAGE)以及定量即時聚合酶鏈式反應(Q-PCR)。
阿茲海默症相關蛋白的實例可以包括例如由VLDLR基因編碼的極低密度脂蛋白受體蛋白(VLDLR)、由UBA1基因編碼的泛素樣改性劑活化酶1(UBA1)或由UBA3基因編碼的NEDD8-活化酶E1催化亞基蛋白(UBE1C)。
藉由非限制性實例的方式,與AD相關的蛋白質包括但不限於如下所列的蛋白質:染色體序列編碼蛋白ALAS2 δ-胺基酮戊酸合酶2(ALAS2)ABCA1 ATP-結合盒轉運體(ABCA1)ACE血管緊張素I-轉化酶(ACE)APOE脂蛋白E先質(APOE)APP澱粉樣蛋白先質蛋白(APP)AQP1水通道蛋白1(AQP1)BIN1 Myc盒依賴性相互作用蛋白1或橋接整合蛋白1(BIN1)BDNF腦源性神經營養因子(BDNF)BTNL8嗜乳脂蛋白樣蛋白8(BTNL8)C1ORF49 1號染色體開放閱讀框49 CDH4鈣粘素-4 CHRNB2神經元乙醯膽鹼受體亞基β-2 CKLFSF2 CKLF樣MARVEL跨膜結構域-包含蛋白2(CKLFSF2)CLEC4E C型凝集素結構域家族4,成員e(CLEC4E)CLU簇集蛋白(也稱為脂蛋白J)CR1紅細胞補體受體1(CR1, 也稱為CD35、C3b/C4b受體和免疫粘附受體)CR1L紅細胞補體受體1(CR1L)CSF3R粒細胞集落刺激因子3受體(CSF3R)CST3胱抑素C或胱抑素3 CYP2C細胞色素P450 2C DAPK1死亡相關蛋白激酶1(DAPK1)ESR1雌激素受體1 FCAR IgA受體的Fc片段(FCAR,也稱為CD89)FCGR3B IgG的Fc片段,低親和性IIIb,受體(FCGR3B或CD16b)FFA2游離脂肪酸受體2(FFA2)FGA纖維蛋白原(因子I)GAB2 GRB2-相關結合蛋白2(GAB2)GAB2 GRB2-相關結合蛋白2(GAB2)GALP甘丙肽樣肽GAPDHS甘油醛-3-磷酸脫氫酶,精子發生的(GAPDHS)GMPB GMBP HP結合珠蛋白(HP)HTR7 5-羥色胺(血清素)受體7(腺苷酸環化酶偶聯的)IDE胰島素降解酶IF127 IF127 IFI6干擾素,α-可誘導蛋白6(IFI6)IFIT2具有三角形四肽重複的干擾素誘導的蛋白2(IFIT2)IL1RN白介素-1受體拮抗劑(IL-1RA)IL8RA白介素8受體,α(IL8RA或CD181)IL8RB白介素8受體,β(IL8RB)JAG1鋸齒狀1(JAG1)KCNJ15鉀內向整流通道,亞家族J,成員15(KCNJ15)LRP6低密度脂蛋白受體相關蛋白6(LRP6)MAPT微管相關蛋白tau(MAPT)MARK4 MAP/微管親和性調節激酶4(MARK4)MPHOSPH1 M期磷蛋白1 MTHFR 5,10-亞甲基四氫葉酸還原酶MX2干擾素誘導的GTP-結合蛋白Mx2 NBN Nibrin,也稱為NBN NCSTN呆蛋白NIACR2菸酸受體2(NIACR2,也稱為GPR109B)NMNAT3菸醯胺核苷酸腺苷醯轉移酶3 NTM Neurotrimin(或HNT)ORM1血清類粘蛋白(Orosmucoid)1(ORM1)或α-1-酸性糖蛋白1 P2RY13 P2Y嘌呤受體13(P2RY13)PBEF1菸醯胺磷酸核糖轉移酶(NAmPRTase或Nampt)也稱為前B細胞集落增強因子1(PBEF1)或內脂素PCK1磷酸烯醇丙酮酸羧激酶PICALM磷脂醯肌醇結合網格蛋白裝配蛋白 (PICALM)PLAU尿激酶型纖維蛋白溶酶原活化劑(PLAU)PLXNC1叢狀蛋白(Plexin)C1(PLXNC1)PRNP朊病毒蛋白PSEN1早老素1蛋白(PSEN1)PSEN2早老素2蛋白(PSEN2)PTPRA蛋白質酪胺酸磷酸酶受體A型蛋白(PTPRA)RALGPS2具有PH結構域和SH3結合模體的Ral GEF 2(RALGPS2)RGSL2 G-蛋白傳訊樣調節劑2(RGSL2)SELENBP1含硒結合蛋白1(SELNBP1)SLC25A37線粒體鐵轉運蛋白(Mitoferrin)-1 SORL1含分揀蛋白相關受體L(DLR類別)A重複的蛋白質(SORL1)TF轉鐵蛋白TFAM線粒體轉錄因子A TNF腫瘤壞死因子TNFRSF10C腫瘤壞死因子受體超家族成員10C(TNFRSF10C)TNFSF10腫瘤壞死因子受體超家族,(TRAIL)成員10a(TNFSF10)UBA1泛素樣改性劑活化酶1(UBA1)UBA3 NEDD8-活化酶E1催化亞基蛋白(UBE1C)UBB泛素B蛋白(UBB)UBQLN1泛醌蛋白(Ubiquilin)-1 UCHL1泛素羧基末端酯酶L1蛋白(UCHL1)UCHL3泛素羧基末端水解酶同工酶L3蛋白(UCHL3)VLDLR極低密度脂蛋白受體蛋白(VLDLR)。
在示例性實施方式中,與AD相關的其染色體序列被編輯的蛋白質可以是由VLDLR基因編碼的極低密度脂蛋白受體蛋白(VLDLR)、由UBA1基因編碼的泛素樣改性劑活化酶1(UBA1)、由UBA3基因編碼的NEDD8-活化酶E1催化亞基蛋白(UBE1C)、由AQP1基因編碼的水通道蛋白1(AQP1)、由UCHL1基因編碼的泛素羧基末端酯酶L1蛋白(UCHL1)、由UCHL3基因編碼的泛素羧基末端水解酶同工酶L3蛋白(UCHL3)、由UBB基因編碼的泛素B蛋白(UBB)、由MAPT基因編碼的微管相關蛋白tau(MAPT)、由PTPRA基因編碼的蛋白質酪胺酸磷酸酶 受體A型蛋白(PTPRA)、由PICALM基因編碼的磷脂醯肌醇結合網格蛋白裝配蛋白(PICALM)、由CLU基因編碼的簇集蛋白(也稱為脂蛋白J)、由PSEN1基因編碼的早老素1蛋白、由PSEN2基因編碼的早老素2蛋白、由SORL1基因編碼的含分揀蛋白相關受體L(DLR類別)A重複的蛋白質(SORL1)蛋白質、由APP基因編碼的澱粉樣蛋白先質蛋白(APP)、由APOE基因編碼的脂蛋白E先質(APOE)或由BDNF基因編碼的腦源性神經營養因子(BDNF)。在一示例性實施方式中,該基因修飾動物係大鼠,並且編碼與AD相關的蛋白質的編輯的染色體序列如下:APP澱粉樣蛋白先質蛋白(APP)NM_019288 AQP1水通道蛋白1(AQP1)NM_012778 BDNF腦源性神經營養因子NM_012513 CLU簇集蛋白(也稱為NM_053021脂蛋白J)MAPT微管相關蛋白NM_017212 tau(MAPT)PICALM磷脂醯肌醇結合NM_053554網格蛋白裝配蛋白(PICALM)PSEN1早老素1蛋白(PSEN1)NM_019163 PSEN2早老素2蛋白(PSEN2)NM_031087 PTPRA酪胺酸磷酸酶NM_012763受體A型蛋白(PTPRA)SORL1含分揀蛋白相關受體L(DLR NM_053519,類別)A重複的XM_001065506,蛋白質(SORL1)XM_217115 UBA1泛素樣改性劑活化NM_001014080酶1(UBA1)UBA3 NEDD8-活化酶E1 NM_057205催化亞基蛋白(UBE1C)UBB泛素B蛋白(UBB)NM_138895 UCHL1泛素羧基末端NM_017237酯酶L1蛋白(UCHL1)UCHL3泛素羧基末端NM_001110165水解酶同工酶L3蛋白(UCHL3)VLDLR極低密度脂蛋白NM_013155受體蛋白(VLDLR)。
該動物或細胞可以包括1、2、3、4、5、6、7、8、9、10、 11、12、13、14、15個或更多個破壞的、編碼與AD相關的蛋白質的染色體序列以及零、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15個或更多個編碼與AD相關的蛋白質的染色體整合序列。
編輯的或整合的染色體序列可以被修飾為編碼一種改變的與AD相關的蛋白質。AD相關染色體序列中的許多突變已經與AD相關。例如,APP中的V7171(即位置717處的纈胺酸變為異亮胺酸)錯義突變引起家族性AD。早老素-1蛋白中的多重突變,如H163R(即位置163處的組胺酸變為精胺酸)、A246E(即位置246處的丙胺酸變為穀胺酸)、L286V(即位置286處的亮胺酸變為纈胺酸)以及C410Y(即位置410處的半胱胺酸變為酪胺酸)引起家族性3型阿茲海默症。早老素-2蛋白中的突變,如N141I(即位置141處的天冬醯胺變為異亮胺酸)、M239V(即位置239處的甲硫胺酸變為纈胺酸)以及D439A(即位置439處的天冬胺酸變為丙胺酸)引起家族性4型阿茲海默症。AD相關基因和疾病的遺傳變體的其他相關性在本領域係已知的。參見例如,韋林(Waring)等人(2008)《神經病學年鑒》(Arch.Neurol.)65:329-334,將其揭露藉由引用以其全文併入本文。
疾病相關基因的實例
疾病相關基因和多核苷酸的實例列於表A和B中。傳訊生化途徑相關基因和多核苷酸的實例列於表C中。
Figure 112128864-A0101-12-0767-240
Figure 112128864-A0101-12-0768-28
Figure 112128864-A0101-12-0769-29
Figure 112128864-A0101-12-0769-30
Figure 112128864-A0101-12-0770-31
Figure 112128864-A0101-12-0771-32
Figure 112128864-A0101-12-0772-33
Figure 112128864-A0101-12-0773-34
Figure 112128864-A0101-12-0773-35
Figure 112128864-A0101-12-0774-36
Figure 112128864-A0101-12-0775-37
Figure 112128864-A0101-12-0776-38
Figure 112128864-A0101-12-0777-39
Figure 112128864-A0101-12-0778-40
Figure 112128864-A0101-12-0779-41
Figure 112128864-A0101-12-0780-42
Figure 112128864-A0101-12-0781-43
Figure 112128864-A0101-12-0782-44
Figure 112128864-A0101-12-0783-45
Figure 112128864-A0101-12-0784-46
Figure 112128864-A0101-12-0785-47
Figure 112128864-A0101-12-0786-48
Figure 112128864-A0101-12-0787-49
Figure 112128864-A0101-12-0788-50
Figure 112128864-A0101-12-0789-51
Figure 112128864-A0101-12-0790-52
Figure 112128864-A0101-12-0791-53
Figure 112128864-A0101-12-0792-54
Figure 112128864-A0101-12-0793-55
Figure 112128864-A0101-12-0794-56
示例性靶基因、靶座位、靶多核苷酸的清單
作為舉例,該染色體序列可以包括但不限於,IL1B(白細胞介素1,β)、XDH(黃嘌呤脫氫酶)、TP53(腫瘤蛋白p53)、PTGIS (前列腺素12(前列環素)合酶)、MB(肌紅蛋白)、IL4(白細胞介素4)、ANGPT1(血管生成素1)、ABCG8(ATP結合盒,亞家族G(白),成員8)、CTSK(組織蛋白酶K)、PTGIR(前列腺素12(前列環素)受體(IP))、KCNJ11(內向整流鉀通道,亞家族J,成員11)、INS(胰島素)、CRP(C反應蛋白,正五聚蛋白相關的)、PDGFRB(血小板源生長因子受體,β多肽)、CCNA2(細胞週期蛋白A2)、PDGFB(血小板源生長因子β多肽(猴肉瘤病毒(v-sis)癌基因同源物))、KCNJ5(內向整流鉀通道,亞家族J,成員5)、KCNN3(鉀中間小電導鈣活化通道,亞家族N,成員3)、CAPN10(卡配因10)、PTGES(前列腺素E合酶)、ADRA2B(腎上腺素能,α-2B-,受體)、ABCG5(ATP結合盒,亞家族G(WHITE)、成員5)、PRDX2(過氧化物氧化還原酶2)、CAPN5(卡配因5)、PARP14(聚(ADP-核糖)聚合酶家族,成員14)、MEX3C(mex-3同源物C(秀麗隱桿線蟲))、ACE血管緊張素I轉化酶(肽基二肽酶A)1)、TNF(腫瘤壞死因子(TNF超家族,成員2))、IL6(白細胞介素6(干擾素,β2))、STN(抑制素)、SERPINE1(絲胺酸蛋白酶抑制蛋白肽酶抑制劑,支序群E(微管連接蛋白,血漿纖維溶素原活化物抑制劑1型)、成員1)、ALB(白蛋白)、ADIPOQ(脂聯素,含C1Q和膠原蛋白域)、APOB(脂蛋白B(包括Ag(x)抗原))、APOE(脂蛋白E)、LEP(瘦素)、MTHFR(5,10-亞甲基四氫葉酸還原酶(NADPH))、APOA1(脂蛋白A-I)、EDN1(內皮素1)、NPPB(利鈉肽先質B)、NOS3(一氧化氮合酶3(內皮細胞))、PPARG(過氧化物酶體增殖物活化受體γ)、PLAT(血漿纖維溶素原活化物,組織)、PTGS2(前列腺素內過氧化物合酶2(前列腺素G/H合酶和環加氧酶))、CETP(膽固醇酯轉移蛋白,血漿)、AGTR1(血管緊張素II受體,1型)、HMGCR(3- 羥基-3-甲基戊二酸單醯輔酶A還原酶)、IGF1(胰島素樣生長因子1(生長素調節素C))、SELE(選滯蛋白E)、REN(腎素)、PPARA(過氧化物酶體增殖物活化受體α)、PON1(對氧磷酶1)、KNG1(激肽原1)、CCL2(趨化因子(C-C模體)配位基2)、LPL(脂蛋白脂酶)、VWF(馮.維勒布蘭德因子)、F2(凝血因子II(凝血酶))、ICAM1(細胞間粘附分子1)、TGFB1(轉化生長因子,β1)、NPPA(利鈉肽先質A)、IL10(白細胞介素10)、EPO(促紅細胞生成素)、SOD1(超氧化物歧化酶1,可溶性)、VCAM1(血管細胞粘附分子1)、IFNG(干擾素,γ)、LPA(脂蛋白,Lp(a))、MPO(髓過氧化物酶)、ESR1(雌激素受體1)、MAPK1(絲裂原活化蛋白激酶1)、HP(血紅素結合素)、F3(凝血因子III(促凝血酶原激酶,組織因子))、CST3(半胱胺酸蛋白酶抑制劑C)、COG2(寡聚高基蛋複合體成分2)、MMP9(基質金屬肽酶9(明膠酶B,92kDa明膠酶,92kDa IV型膠原酶))、SERPINC1(絲胺酸蛋白酶抑制蛋白肽酶抑制劑,支序群C(抗凝血酶)、成員1)、F8(凝血因子VIII,促凝血成分)、HMOX1(血紅素加氧酶(解環)1)、APOC3(脂蛋白C-III)、IL8(白細胞介素8)、PROK1(前動力蛋白1)、CBS(胱硫醚-β-合酶)、NOS2(一氧化氮合酶2,誘導型)、TLR4(toll樣受體4)、SELP(選滯蛋白P(顆粒膜蛋白140kDa,抗原CD62))、ABCA1(ATP結合盒,亞家族A(ABC1)、成員1)、AGT(血管緊張素原(絲胺酸蛋白酶抑制蛋白肽酶抑制劑,支序群A,成員8))、LDLR(低密度脂蛋白受體)、GPT(穀丙轉胺酶(丙胺酸轉胺酶))、VEGFA(血管內皮生長因子A)、NR3C2(細胞核受體亞家族3,型C,成員2)、IL18(白細胞介素18(干擾素-γ-誘導因子))、NOS1(一氧化氮合酶1(神經元的))、NR3C1(細胞核受體亞家族3,C組,成員1(糖皮質 激素受體))、FGB(纖維蛋白原β鏈)、HGF(肝細胞生長因子(肝細胞生長因子A;分散因子))、IL1A(白細胞介素1,α)、RETN(抵抗素)、AKT1(v-akt鼠科胸腺瘤病毒癌基因同源物1)、LIPC(脂肪酶,肝臟的)、HSPD1(熱休克60kDa蛋白1(伴侶蛋白))、MAPK14(絲裂原活化蛋白激酶14)、SPP1(分泌磷蛋白1)、ITGB3(整合素,β3(血小板糖蛋白111a,抗原CD61))、CAT(過氧化氫酶)、UTS2(尾加壓素2)、THBD(血栓調節蛋白)、F10(凝血因子X)、CP(血漿血漿銅藍蛋白(亞鐵氧化酶))、TNFRSF11B(腫瘤壞死因子受體超家族,成員11b)、EDNRA(內皮素A型受體)、EGFR(表皮生長因子受體(紅白血病病毒(v-erb-b)癌基因同源物,鳥類的))、MMP2(基質金屬肽酶2(明膠酶A,72kDa明膠酶,72kDa IV型膠原酶))、PLG(纖維蛋白溶酶原)、NPY(神經肽Y)、RHOD(ras同源物基因家族,成員D)、MAPK8(絲裂原活化蛋白激酶8)、MYC(V-Myc骨髓細胞瘤病毒癌基因同源物(鳥類的))、FN1(纖網蛋白1)、CMA1(凝乳酶1,肥大細胞)、PLAU(血漿纖維溶素原活化物,尿激酶)、GNB3(鳥嘌呤核苷酸結合蛋白(G蛋白)、β多肽3)、ADRB2(腎上腺素能,β-2-,受體,表面)、APOA5(脂蛋白A-V)、SOD2(超氧化物歧化酶2,線粒體的)、F5(凝血因子V(促凝血球蛋白原,不穩定因子))、VDR(維生素D(1,25-二羥維生素D3)受體)、ALOX5(花生四烯酸鹽5-脂氧合酶)、HLA-DRB1(主要組織相容性複合物,I類I,DRβ1)、PARP1(聚(ADP-核糖)聚合酶1)、CD40LG(CD40配位基)、PON2(對氧磷酶2)、AGER(晚期糖基化終末產物特異性受體)、IRS1(胰島素受體底物1)、PTGS1(前列腺素內過氧化物合酶1(前列腺素G/H合酶和環加氧酶))、ECE1(內皮素轉化酶1)、F7(凝血因子VII(血清凝血酶原轉變加速因 子))、URN(白細胞介素1受體拮抗劑)、EPHX2(環氧化物水解酶2,細胞質的)、IGFBP1(胰島素樣生長因子結合蛋白1)、MAPK10(絲裂原活化蛋白激酶10)、FAS(Fas(TNF受體超家族,成員6))、ABCB1(ATP結合盒,亞家族B(MDR/TAP),成員1)、JUN(jun癌基因)、IGFBP3(胰島素樣生長因子結合蛋白3)、CD14(CD14分子)、PDE5A(磷酸二酯酶5A,cGMP特異性)、AGTR2(血管緊張素II受體,2型)、CD40(CD40分子,TNF受體超家族成員5)、LCAT(卵磷脂膽固醇醯基轉移酶)、CCR5(趨化因子(C-C模體)受體5)、MMP1(基質金屬肽酶1(間質膠原酶))、TIMP1(TIMP金屬肽酶抑制劑1)、ADM(腎上腺髓質素)、DYT10(肌張力障礙10)、STAT3(傳訊和轉錄活化蛋白3(急性期反應因子))、MMP3(基質金屬肽酶3(基質溶解素1,前白明膠酶))、ELN(彈性蛋白)、USF1(上游轉錄因子1)、CFH(補體因子H)、HSPA4(熱休克70kDa蛋白4)、MMP12(基質金屬肽酶12(巨噬細胞彈性蛋白酶))、MME(膜金屬肽鏈內切酶)、F2R(凝血因子II(凝血酶)受體)、SELL(選滯蛋白L)、CTSB(組織蛋白酶B)、ANXA5(膜聯蛋白A5)、ADRB1(腎上腺素能,β-1-,受體)、CYBA(細胞色素b-245,α多肽)、FGA(纖維蛋白原α鏈)、GGT1(γ-穀胺醯轉肽酶1)、LIPG(脂肪酶,內皮的)、HIF1A(缺氧誘導因子1,α亞基(鹼性-螺旋-環-螺旋轉錄因子))、CXCR4(趨化因子(C-X-C模體)受體4)、PROC(蛋白C(凝血因子Va和VIIIa抑制蛋白)、SCARB1(清道夫受體B類,成員1)、CD79A(CD79a分子,免疫球蛋白相關α)、PLTP(磷脂轉移蛋白)、ADD1(內收蛋白1(α))、FGG(纖維蛋白原γ鏈)、SAA1(血清澱粉樣蛋白A1)、KCNH2(電壓閘控鉀離子通道,亞家族H(觸角電位相關)、成員2)、DPP4(二肽基肽酶4)、G6PD(6- 磷酸葡萄糖脫氫酶)、NPR1(鈉尿肽受體A/鳥苷酸環化酶A(心房鈉尿肽受體A))、VTN(玻連蛋白)、KIAA0101(KIAA0101)、FOS(FBJ鼠科骨肉瘤病毒癌基因同源物)、TLR2(toll樣受體2)、PPIG(肽基脯胺醯異構酶G(親環素G))、IL1R1(白細胞介素1受體,I型)、AR(雄激素受體)、CYP1A1(細胞色素P450,家族1,亞家族A,多肽1)、SERPINA1(絲胺酸蛋白酶抑制蛋白肽酶抑制劑,支序群A(α-1抗蛋白酶,抗胰蛋白酶),成員1)、MTR(5-甲基四氫葉酸高半胱胺酸甲基轉移酶)、RBP4(視黃醇結合蛋白4,血漿)、APOA4(脂蛋白A-IV)、CDKN2A(細胞週期蛋白依賴性激酶抑制劑2A(黑素瘤p16,抑制CDK4))、FGF2(成纖維細胞生長因子2(鹼性))、EDNRB(內皮素受體B型)、ITGA2(整合素,α2(CD49B,VLA-2受體α2亞基))、CABIN1(鈣調神經磷酸酶結合蛋白1)、SHBG(性激素結合球蛋白)、HMGB1(高遷移率族1)、HSP90B2P(熱休克蛋白90kDa β(Grp94),成員2(假基因))、CYP3A4(細胞色素P450,家族3,亞家族A,多肽4)、GJA1(間隙連接蛋白,α1,43kDa)、CAV1(小窩蛋白1,細胞質膜微囊蛋白,22kDa)、ESR2(雌激素受體2(ER β))、LTA(淋巴毒素α(TNF超家族,成員1))、GDF15(生長分化因子15)、BDNF(腦源性神經營養因子)、CYP2D6(細胞色素P450,家族2,亞家族D,多肽6)、NGF(神經生長因子(β多肽))、SP1(Sp1轉錄因子)、TGIF1(TGFB-誘導因子同源框1)、SRC(v-src肉瘤(施密特-魯平(Schmidt-Ruppin)A-2)病毒癌基因同源物(鳥類的))、EGF(表皮生長因子(β-抑胃素))、PIK3CG(磷酸肌醇-3-激酶,催化的,γ多肽)、HLA-A(主要組織相容性複合物,I類,A)、KCNQ1(電壓閘控鉀通道,KQT樣亞家族,成員1)、CNR1(大麻素受體1(腦))、FBN1(微 纖維蛋白1)、CHKA(膽鹼激酶α)、BEST1(卵黃狀黃斑病蛋白1)、APP(澱粉樣蛋白β(A4)先質蛋白)、CTNNB1(連環蛋白(鈣粘著蛋白關聯蛋白),β1,88kDa)、IL2(白細胞介素2)、CD36(CD36分子(凝血酶敏感蛋白受體))、PRKAB1(蛋白激酶,AMP活化的,β1非催化亞基)、TPO(甲狀腺過氧化物酶)、ALDH7A1(醛脫氫酶7家族,成員A1)、CX3CR1(趨化因子(C-X3-C模體)受體1)、TH(酪胺酸羥化酶)、F9(凝血因子IX)、GH1(生長激素1)、TF(轉鐵蛋白)、HFE(血色素沈著病)、IL17A(白細胞介素17A)、PTEN(磷酸酯酶與張力蛋白同源物)、GSTM1(穀胱甘肽S-轉移酶μ1)、DMD(肌營養不良蛋白)、GATA4(GATA結合蛋白4)、F13A1(凝血因子XIII,A1多肽)、TTR(轉甲狀腺素蛋白)、FABP4(脂肪酸結合蛋白4,脂肪細胞)、PON3(對氧磷酶3)、APOC1(脂蛋白C-I)、INSR(胰島素受體)、TNFRSF1B(腫瘤壞死因子受體超家族,成員1B)、HTR2A(5-羥色胺(血清素)受體2A)、CSF3(集落刺激因子3(粒細胞))、CYP2C9(細胞色素P450,家族2,亞家族C,多肽9)、TXN(硫氧還蛋白)、CYP11B2(細胞色素P450,家族11,亞家族B,多肽2)、PTH(甲狀旁腺素、CSF2(集落刺激因子2(粒細胞-巨噬細胞))、KDR(激酶插入結構域受體受體(III型受體酪胺酸激酶))、PLA2G2A(磷脂酶A2,型IIA(血小板,滑液))、B2M(β-2-微球蛋白)、THBS1(凝血酶敏感蛋白1)、GCG(胰高血糖素)、RHOA(ras同源物基因家族,成員A)、ALDH2(醛脫氫酶2家族(線粒體的))、TCF7L2(轉錄因子7樣2(T細胞特異性HMG盒))、BDKRB2(緩激肽受體B2)、NFE2L2(紅細胞衍生核因子2樣蛋白)、NOTCH1(Notch同源物1,易位相關的(果蠅))、UGT1A1(UDP葡糖醛酸基轉移酶1家族,多肽A1)、IFNA1(干擾素,α 1)、PPARD(過氧化物酶體增殖物活化受體δ)、SIRT1(長壽蛋白(沈默交配型資訊調控2同源物)1(釀酒酵母))、GNRH1(促性腺素釋放激素1(黃體生成素釋放激素))、PAPPA(妊娠相關血漿蛋白A,冠毛素1)、ARR3(抑制蛋白3,視網膜的(X-抑制蛋白))、NPPC(利鈉肽先質C)、AHSP(α血紅蛋白穩定蛋白)、PTK2(PTK2蛋白酪胺酸激酶2)、IL13(白細胞介素13)、MTOR(雷帕黴素機械靶(絲胺酸/蘇胺酸激酶))、ITGB2(整合素,β2(補體成分3受體3和4亞基))、GSTT1(穀胱甘肽S-轉移酶θ1)、IL6ST(白細胞介素6傳訊因子(gp130,抑瘤素M受體))、CPB2(羧肽酶B2(血漿))、CYP1A2(細胞色素P450,家族1,亞家族A,多肽2)、HNF4A(肝細胞核因子4,α)、SLC6A4(溶質載體家族6(神經遞質轉運蛋白,血清素),成員4)、PLA2G6(磷脂酶A2,型VI(細胞溶質的,鈣依賴性))、TNFSF11(腫瘤壞死因子(配位基)超家族,成員11)、SLC8A1(溶質載體家族8(鈉/鈣交換蛋白),成員1)、F2RL1(凝血因子II(凝血酶)受體樣1)、AKR1A1(醛酮還原酶家族1,成員A1(醛還原酶))、ALDH9A1(醛脫氫酶9家族,成員A1)、BGLAP(骨γ-羧穀胺酸(gla)蛋白)、MTTP(微粒體甘油三酯轉移蛋白)、MTRR(5-甲基四氫葉酸-高半胱胺酸甲基轉移酶還原酶)、SULT1A3(磺基轉移酶家族,細胞溶質的,1A,酚較佳,成員3)、RAGE(腎腫瘤抗原)、C4B(補體成分4B(奇都血型)、P2RY12(嘌呤能受體P2Y,G-蛋白偶聯的,12)、RNLS(腎酶,FAD依賴性胺氧化酶)、CREB1(cAMP應答元件結合蛋白1)、POMC(前腦啡黑細胞促素皮促素)、RAC1(ras相關C3肉毒毒素底物1(rho家族,小GTP結合蛋白Rac1))、LMNA(核纖層蛋白NC)、CD59(CD59分子,補體調節蛋白)、SCN5A(鈉通道,電壓閘控,V型, α亞基)、CYP1B1(細胞色素P450,家族1,亞家族B,多肽1)、MIF(巨噬細胞遊走抑制蛋白(糖基化抑制蛋白))、MMP13(基質金屬肽酶13(膠原酶3))、TIMP2(TIMP金屬肽酶抑制劑2)、CYP19A1(細胞色素P450,家族19,亞家族A,多肽1)、CYP21A2(細胞色素P450,家族21,亞家族A,多肽2)、PTPN22(蛋白酪胺酸磷酸酶,非受體型22(淋巴樣))、MYH14(肌球蛋白,重鏈14,非肌肉)、MBL2(甘露糖結合凝集素(蛋白C)2,可溶性(調理素缺陷))、SELPLG(選滯蛋白P配位基)、AOC3(胺氧化酶,含銅3(血管粘附蛋白1))、CTSL1(組織蛋白酶L1)、PCNA(增殖細胞核抗原)、IGF2(胰島素樣生長因子2(生長素調節素A))、ITGB1(整合素,β1(纖網蛋白受體,β多肽,抗原CD29包括MDF2,MSK12))、CAST(鈣蛋白酶抑制蛋白)、CXCL12(趨化因子(C-X-C模體)配位基12(基質細胞衍生因子1))、IGHE(免疫球蛋白恒定區ε)、KCNE1(電壓閘控鉀通道,Isk相關家族,成員1)、TFRC(轉鐵蛋白受體(p90,CD71))、COL1A1(膠原,I型,α1)、COL1A2(膠原,I型,α2)、IL2RB(白細胞介素2受體,β)、PLA2G10(磷脂酶A2,型X)、ANGPT2(血管生成素2)、PROCR(蛋白C受體,內皮的(EPCR))、NOX4(NADPH氧化酶4)、HAMP(海帕西啶抗微生物肽)、PTPN11(蛋白酪胺酸磷酸酶,非受體類型11)、SLC2A1(溶質載體家族2(易化葡萄糖轉運蛋白),成員1)、IL2RA(白細胞介素2受體,α)、CCL5(趨化因子(C-C模體)配位基5)、IRF1(干擾素調節因子1)、CFLAR(CASP8和FADD樣凋亡調節因子)、CALCA(降鈣素相關多肽α)、EIF4E(真核翻譯起始因子4E)、GSTP1(穀胱甘肽S-轉移酶pi 1)、JAK2(Janus激酶2)、CYP3A5(細胞色素P450,家族3,亞家族A,多肽5)、HSPG2(類肝素硫酸蛋白 聚糖2)、CCL3(趨化因子(C-C模體)配位基3)、MYD88(髓性分化原發反應基因(88))、VIP(血管活性腸肽)、SOAT1(固醇O-醯基轉移酶1)、ADRBK1(腎上腺素能,β,受體激酶1)、NR4A2(細胞核受體亞家族4,型A,成員2)、MMP8(基質金屬肽酶8(中性白細胞膠原酶))、NPR2(鈉尿肽受體B/鳥苷酸環化酶B(心房鈉尿肽受體B))、GCH1(GTP環化水解酶1)、EPRS(穀胺醯-脯胺醯-tRNA合成酶)、PPARGC1A(過氧化物酶體增殖物活化受體γ,共活化劑1 α)、F12(凝血因子XII(哈格曼因子))、PECAM1(血小板/內皮細胞粘附分子)、CCL4(趨化因子(C-C模體)配位基4)、SERPINA3(絲胺酸蛋白酶抑制蛋白肽酶抑制劑,支序群A(α-1抗蛋白酶,抗胰蛋白酶),成員3)、CASR(鈣傳感受體)、GJA5(間隙連接蛋白,α5,40kDa)、FABP2(脂肪酸結合蛋白2,腸)、TTF2(轉錄終止因子,RNA聚合酶II)、PROS1(蛋白S(α))、CTF1(心臟營養素1)、SGCB(肌聚糖,β(43kDa肌營養不良蛋白相關糖蛋白))、YME1L1(YME1樣1(釀酒酵母))、CAMP(卡色力西丁抗微生物肽)、ZC3H12A(含鋅指CCCH型12A)、AKR1B1(醛酮還原酶家族1,成員B1(醛糖還原酶))、DES(結蛋白)、MMP7(基質金屬肽酶7(基質溶解因子,子宮的))、AHR(芳香烴受體)、CSF1(集落刺激因子1(巨噬細胞))、HDAC9(組蛋白去乙醯化酶9)、CTGF(結締組織生長因子)、KCNMA1(大電導鈣活化鉀通道,亞家族M,α成員1)、UGT1A(UDP葡糖醛酸基轉移酶1家族,多肽A複合體座位)、PRKCA(蛋白激酶C,α)、COMT(兒茶酚-β-甲基轉移酶)、S100B(S100鈣結合蛋白B)、EGR1(早期生長反應蛋白1)、PRL(催乳素)、IL15(白細胞介素15)、DRD4(多巴胺受體D4)、CAMK2G(鈣-鈣調蛋白依賴性蛋白激酶II γ)、SLC22A2(溶質載 體家族22(有機陽離子轉運蛋白),成員2)、CCL11(趨化因子(C-C模體)配位基11)、PGF(B321胎盤生長因子)、THPO(血小板生成素)、GP6(糖蛋白VI(血小板))、TACR1(速激肽受體1)、NTS(神經降壓肽)、HNF1A(HNF1同源框A)、SST(生長抑素)、KCND1(電壓閘控鉀通道,Shal相關亞家族,成員1)、LOC646627(磷脂酶抑制劑)、TBXAS1(血栓烷A合酶1(血小板))、CYP2J2(細胞色素P450,家族2,亞家族J,多肽2)、TBXA2R(血栓烷A2受體)、ADH1C(醇脫氫酶1C(I類),γ多肽)、ALOX12(花生四烯酸鹽12-脂氧合酶)、AHSG(α-2-HS-糖蛋白)、BHMT(甜菜鹼同型半胱胺酸甲基轉移酶)、GJA4(間隙連接蛋白,α 4,37kDa)、SLC25A4(溶質載體家族25(線粒體載體;腺嘌呤核苷酸轉運蛋白),成員4)、ACLY(ATP檸檬酸裂合酶)、ALOX5AP(花生四烯酸鹽5-脂氧合酶-活化蛋白)、NUMA1(核有絲分裂器蛋白1)、CYP27B1(細胞色素P450,家族27,亞家族B,多肽1)、CYSLTR2(半胱胺醯白三烯受體2)、SOD3(超氧化物歧化酶3,細胞外的)、LTC4S(白三烯C4合酶)、UCN(尿皮質素)、GHRL(胃促生長素/肥胖抑制素先質肽)、APOC2(脂蛋白C-II)、CLEC4A(C型凝集素結構域家族4,成員A)、KBTBD10(Kelch重複和BTB(POZ)域包含蛋白)、TNC(腱生蛋白C)、TYMS(胸苷酸合成酶)、SHCl(SHC(含Src同源物2域)轉化蛋白1)、LRP1(低密度脂蛋白受體相關蛋白1)、SOCS3(細胞因子傳訊抑制蛋白3)、ADH1B(醇脫氫酶1B(I類),β多肽)、KLK3(激肽釋放酶相關肽酶3)、HSD11B1(羥基固醇(11-β)脫氫酶1)、VKORC1(生素K環氧化物還原酶複合體,亞基1)、SERPINB2(絲胺酸蛋白酶抑制蛋白肽酶抑制劑,支序群B(卵清蛋白),成員2)、TNS1(張力蛋白1)、RNF19A(環指蛋白 9A)、EPOR(促紅細胞生成素受體)、ITGAM(整合素,αM(補體成分3受體3亞基))、PITX2(配對樣同源域2)、MAPK7(絲裂原活化蛋白激酶7)、FCGR3A(IgG的Fc片段,低親和力111a,受體(CD16a))、LEPR(瘦素受體)、ENG(內皮糖蛋白)、GPX1(穀胱甘肽過氧化酶1)、GOT2(穀草轉胺酶2,線粒體(天冬胺酸胺基轉移酶2))、HRH1(組胺受體H1)、NR112(細胞核受體亞家族1,型I,成員2)、CRH(促腎上腺皮質素釋放激素)、HTR1A(5-羥色胺(血清素)受體1A)、VDAC1(電壓依賴性陰離子通道1)、HPSE(類肝素酶)、SFTPD(表面活性蛋白D)、TAP2(轉運蛋白2,ATP結合盒,亞家族B(MDR/TAP))、RNF123(環指蛋白123)、PTK2B(PTK2B蛋白酪胺酸激酶2 β)、NTRK2(神經營養酪胺酸激酶,受體,2型)、IL6R(白細胞介素6受體)、ACHE(乙醯膽鹼酯酶(Yt血型))、GLP1R(胰高血糖素樣肽1受體)、GHR(生長激素受體)、GSR(穀胱甘肽還原酶)、NQO1(NAD(P)H脫氫酶,醌1)、NR5A1(細胞核受體亞家族5,型A,成員1)、GJB2(間隙連接蛋白,β2,26kDa)、SLC9A1(溶質載體家族9(鈉/氫交換體)、成員1)、MAOA(單胺氧化酶A)、PCSK9(前蛋白轉化酶枯草桿菌蛋白酶/kexin 9型)、FCGR2A(IgG的Fc片段,低親和力IIa,受體(CD32))、SERPINF1(絲胺酸蛋白酶抑制蛋白肽酶抑制劑,支序群F(α-2抗纖維蛋白溶酶,色素上皮衍生因子),成員1)、EDN3(內皮素3)、DHFR(二氫葉酸還原酶)、GAS6(生長停滯特異蛋白6)、SMPD1(鞘磷脂磷酸二酯酶1,酸溶酶體)、UCP2(解偶聯蛋白2(線粒體的,質子載體))、TFAP2A(轉錄因子AP-2 α(活化增強子結合蛋白2 α))、C4BPA(補體成分4結合蛋白,α)、SERPINF2(絲胺酸蛋白酶抑制蛋白肽酶抑制劑,支序群F(α-2抗纖維蛋白溶酶,色素上皮衍生 因子),成員2)、TYMP(胸苛酸磷酸化酶)、ALPP(鹼性磷酸酶,胎盤的(Regan同工酶))、CXCR2(趨化因子(C-X-C模體)受體2)、SLC39A3(溶質載體家族39(鋅轉運蛋白)、成員3)、ABCG2(ATP結合盒,亞家族G(WHITE)、成員2)、ADA(腺苷脫胺酶)、JAK3(Janus激酶3)、HSPA1A(熱休克70kDa蛋白1A)、FASN(脂肪酸合酶)、FGF1(成纖維細胞生長因子1(酸性))、F11(凝血因子XI)、ATP7A(ATP酶,Cu++轉運的,α多肽)、CR1(補體成分(3b/4b)受體1(Knops血型))、GFAP(膠質細胞原纖維酸性蛋白)、ROCK1(Rho相關,含捲曲螺旋蛋白激酶1)、MECP2(甲基CpG結合蛋白2(雷特氏症候群))、MYLK(肌球蛋白輕鏈激酶)、BCHE(丁醯膽鹼酯酶)、LIPE(脂肪酶,激素敏感的)、PRDX5(過氧化物氧化還原酶5)、ADORA1(腺苷A1受體)、WRN(維爾納綜合症,RecQ解旋酶樣)、CXCR3(趨化因子(C-X-C模體)受體3)、CD81(CD81分子)、SMAD7(SMAD家族成員7)、LAMC2(層連結蛋白,γ2)、MAP3K5(絲裂原活化蛋白激酶激酶激酶5)、CHGA(染色顆粒素A(甲狀旁腺分泌蛋白1))、IAPP(胰島澱粉樣蛋白多肽)、RHO(視紫紅質)、ENPP1(外核苷酸焦磷酸酶/磷酸二酯酶1)、PTHLH(甲狀旁腺激素樣激素)、NRG1(神經調節蛋白1)、VEGFC(血管內皮生長因子C)、ENPEP(穀胺醯基胺肽酶(胺基肽酶A))、CEBPB(CCAAT/增強子結合蛋白(C/EBP),β)、NAGLU(N-乙醯胺基葡糖苷酶,α-)、F2RL3(凝血因子II(凝血酶)受體樣3)、CX3CL1(趨化因子(C-X3-C模體)配位基1)、BDKRB1(緩激肽受體B1)、ADAMTS13(具有凝血酶敏感蛋白1型模體的ADAM金屬肽酶,13)、ELANE(彈性蛋白酶,嗜中性粒細胞表現的)、ENPP2(外核苷酸焦磷酸酶/磷酸二酯酶2)、CISH(細胞因子誘 導的含SH2的蛋白)、GAST(胃泌素)、MYOC(肌纖蛋白,小梁網可誘導糖皮質激素應答)、ATP1A2(ATP酶,Na+/K+轉運的,α2多肽)、NF1(神經纖維瘤蛋白1)、GJB1(間隙連接蛋白,β1,32kDa)、MEF2A(肌細胞增強因子2A)、VCL(紐蛋白)、BMPR2(骨形態發生蛋白受體,II型(絲胺酸/蘇胺酸激酶))、TUBB(微管蛋白,β)、CDC42(細胞分裂週期42(GTP結合蛋白,25kDa))、KRT18(角蛋白18)、HSF1(熱休克轉錄因子1)、MYB(v-myb成髓細胞瘤病毒癌基因同源物(鳥類))、PRKAA2(蛋白激酶,AMP活化的,α2催化亞基)、ROCK2(Rho關聯含捲曲螺旋蛋白激酶2)、TFPI(組織因子途徑抑制物(脂蛋白相關凝血抑制劑))、PRKG1(蛋白激酶,cGMP依賴性,I型)、BMP2(骨形態發生蛋白2)、CTNND1(連環蛋白(鈣粘著蛋白關聯蛋白),δ1)、CTH(胱硫醚酶(胱硫醚γ-裂解酶))、CTSS(組織蛋白酶S)、VAV2(vav 2鳥苷酸交換因子)、NPY2R(神經肽Y受體Y2)、IGFBP2(胰島素樣生長因子結合蛋白2,36kDa)、CD28(CD28分子)、GSTA1(穀胱甘肽S-轉移酶α1)、PPIA(肽基脯胺醯異構酶A(親環素A))、APOH(脂蛋白H(β-2-糖蛋白I))、S100A8(S100鈣結合蛋白A8)、IL11(白細胞介素11)、ALOX15(花生四烯酸鹽15-脂氧合酶)、FBLN1(腓骨蛋白1)、NR1H3(細胞核受體亞家族1,型H,成員3)、SCD(硬脂醯基-輔酶A去飽和酶(△-9-去飽和酶))、GIP(抑胃多肽)、CHGB(染色顆粒素B(分泌粒蛋白1))、PRKCB(蛋白激酶C,β)、SRD5A1(類固醇-5-α還原酶α多肽1(3-氧代-5 α-類固醇δ4-脫氫酶α1))、HSD11B2(羥基固醇(11-β)脫氫酶2)、CALCRL(降鈣素受體樣)、GALNT(UDP-N-乙醯基-α-D-半乳糖胺:多肽N-乙醯半乳糖胺基轉移酶2(GalNAc-T2))、ANGPTL4(血管生成素樣 4)、KCNN4(鉀中間/小電導鈣活化通道,亞家族N,成員4)、PIK3C2A(磷酸肌醇-3-激酶,2類,α多肽)、HBEGF(肝素結合EGF樣生長因子)、CYP7A1(細胞色素P450,家族7,亞家族A,多肽1)、HLA-DRB5(主要組織相容性複合物,II類,DR β5)、BNIP3(BCL2/腺病毒E1B 19kDa相互作用蛋白3)、GCKR(葡糖激酶(己糖激酶4)調節蛋白)、S100A12(S100鈣結合蛋白A12)、PADI4(肽基精胺酸脫亞胺酶,IV型)、HSPA14(熱休克70kDa蛋白14)、CXCR1(趨化因子(C-X-C模體)受體1)、H19(H19,母系印記表現轉錄物(非蛋白質編碼))、KRTAP19-3(角蛋白關聯蛋白19-3)、IDDM2(胰島素依賴型糖尿病2)、RAC2(ras相關C3肉毒毒素底物2(rho家族,小GTP結合蛋白Rac2))、RYR1(蘭尼鹼受體1(骨骼))、CLOCK(clock同源物(小鼠))、NGFR(神經生長因子受體(TNFR超家族,成員16))、DBH(多巴胺β-羥化酶(多巴胺β-單加氧酶))、CHRNA4(膽鹼能受體,煙鹼的,α4)、CACNA1C(鈣通道,電壓依賴性,L型,α1C亞基)、PRKAG2(蛋白激酶,AMP活化的,γ 2非催化亞基)、CHAT(膽鹼乙醯轉移酶)、PTGDS(前列腺素D2合酶21kDa(腦))、NR1H2(細胞核受體亞家族1,型H,成員2)、TEK(TEK酪胺酸激酶,內皮的)、VEGFB(血管內皮生長因子B)、MEF2C(肌細胞增強因子2C)、MAPKAPK2(絲裂原活化的蛋白激酶活化的蛋白激酶2)、TNFRSF11A(腫瘤壞死因子受體超家族,成員11a,NFKB活化劑)、HSPA9(熱休克70kDa蛋白9(致死蛋白))、CYSLTR1(半胱胺醯白三烯受體1)、MAT1A(甲硫胺酸腺苷轉移酶I,α)、OPRL1(阿片受體樣1)、IMPA1(肌醇(肌肉)-1(或4)-單磷酸酶1)、CLCN2(氯通道2)、DLD(二氫硫辛醯胺脫氫酶)、PSMA6(蛋白酶體(先質,巨蛋白因子)亞基,α型, 6)、PSMB8(蛋白酶體(先質,巨蛋白因子)亞基,β型,8(大型多功能肽酶7))、CHI3L1(殼多糖酶3樣1(軟骨糖蛋白-39))、ALDH1B1(醛脫氫酶1家族,成員B1)、PARP2(聚(ADP-核糖)聚合酶2)、STAR(類固醇生成性急性期調節蛋白)、LBP(脂多糖結合蛋白)、ABCC6(ATP結合盒,亞家族C(CFTR/MRP),成員6)、RGS2(G蛋白傳訊調節因子2,24kDa)、EFNB2(肝配蛋白-B2)、GJB6(間隙連接蛋白,β6,30kDa)、APOA2(脂蛋白A-II)、AMPD1(腺苷單磷酸脫胺酶1)、DYSF(迪斯弗林(dysferlin),肢帶型肌營養不良2B(常染色體隱性))、FDFT1(法呢醯二磷酸酯法呢醯基轉移酶1)、EDN2(內皮素2)、CCR6(趨化因子(C-C模體)受體6)、GJB3(間隙連接蛋白,β3,31kDa)、IL1RL1(白細胞介素1受體樣1)、ENTPD1(外核苷三磷酸二磷酸水解酶1)、BBS4(巴-比二氏綜合症(Bardet-Biedl syndrome)4)、CELSR2(鈣粘著蛋白,EGF LAG七經G型受體2(火烈鳥同源物,果蠅))、F11R(F11受體)、RAPGEF3(Rap鳥苷酸交換因子(GEF)3)、HYAL1(透明質酸葡糖胺酶1)、ZNF259(鋅指蛋白259)、ATOX1(ATX1抗氧化劑蛋白1同源物(酵母))、ATF6(活化轉錄因子6)、KHK(已酮糖激酶(果糖激酶))、SAT1(亞精胺/精胺N1-乙醯轉移酶1)、GGH(γ-穀胺醯水解酶(結合酶,葉醯聚γ穀胺醯水解酶))、TIMP4(TIMP金屬肽酶抑制劑4)、SLC4A4(溶質載體家族4,碳酸氫鈉協同轉運蛋白,成員4)、PDE2A(磷酸二酯酶2A,cGMP刺激的)、PDE3B(磷酸二酯酶3B,cGMP抑制的)、FADS1(脂肪酸去飽和酶1)、FADS2(脂肪酸去飽和酶2)、TMSB4X(胸腺素β4,X連鎖的)、TXNIP(硫氧還蛋白相互作用蛋白)、LIMS1(LIM和衰老細胞抗原樣域1)、RHOB(ras同源物基因家族,成員B)、LY96(淋巴細胞抗原96)、 FOXO1(叉頭框O1)、PNPLA2(含Patatin樣磷脂酶域2)、TRH(促甲狀腺激素釋放激素)、GJC1(間隙連接蛋白,γ 1,45kDa)、SLC17A5(溶質載體家族17(陰離子/糖轉運蛋白),成員5)、FTO(脂肪量和肥胖相關)、GJD2(間隙連接蛋白,δ2,36kDa)、PSRC1(富含脯胺酸/絲胺酸捲曲螺旋蛋白1)、CASP12(半胱天冬酶12(基因/假基因))、GPBAR1(G蛋白耦聯膽汁酸受體1)、PXK(含PX域絲胺酸/蘇胺酸激酶)、IL33(白細胞介素33)、TRIB1(tribbles同源物1(果蠅))、PBX4(前B細胞白血病同源框4)、NUPR1(核蛋白,轉錄調節子,1)、15-Sep(15kDa硒蛋白)、CILP2(軟骨中間層蛋白2)、TERC(端粒酶RNA組分)、GGT2(γ-穀胺醯轉肽酶2)、MT-CO1(線粒體編碼細胞色素c氧化酶I)、以及UOX(尿酸氧化酶,假基因)。該等序列中的任何序列可以是對於該CRISPR-Cas系統的靶標,例如以解決突變。
在另一個實施方式中,該染色體序列可以進一步選自Pon1(對氧磷酶1)、LDLR(LDL受體)、ApoE(脂蛋白E)、Apo B-100(脂蛋白B-100)、ApoA(脂蛋白(a))、ApoA1(脂蛋白A1)、CBS(胱硫醚(Cystathione)B-合酶)、糖蛋白IIb/IIb、MTHRF(5,10-亞甲基四氫葉酸還原酶(NADPH)、及其組合。在一次反覆運算中,該等染色體序列和由涉及心血管疾病的染色體序列編碼的蛋白質可以選自Cacna1C、Sod1、Pten、Ppar(α)、Apo E、瘦素、及其組合,作為對於該CRISPR-Cas系統的靶標。
分泌酶障礙
美國專利公開案號20110023146描述了使用鋅指核酸酶基 因修飾與分泌酶相關障礙相關的細胞、動物以及蛋白質。分泌酶對於將前蛋白加工成其生物活性形式係必需的。分泌酶途徑的各種組分的缺陷促成許多障礙,特別是具有標誌性澱粉樣蛋白生成或澱粉樣蛋白斑塊的那些,如阿茲海默症(AD)。
分泌酶障礙以及與該等障礙相關的蛋白質係一套影響眾多障礙的易感性、障礙的存在、障礙的嚴重性或其任何組合的相異蛋白質。本揭露包括編碼與分泌酶障礙相關的蛋白質的任何染色體序列的編輯。典型地基於分泌酶相關蛋白質與分泌酶障礙的發展的實驗相關性選擇與分泌酶障礙相關的蛋白質。例如,相對於沒有分泌酶障礙的群體,在具有分泌酶障礙的群體中,與分泌酶障礙相關的蛋白質的產生率或循環濃度可以升高或降低。可以使用蛋白質組技術評估蛋白質水平差異,包括但不限於西方墨點、免疫組織化學染色、酶聯免疫吸附測定(ELISA)以及質譜法。可替代地,可以使用基因組技術藉由獲得編碼該等蛋白質的基因的基因表現譜而鑒定與分泌酶障礙相關的蛋白質,包括但不限於DNA微陣列分析、基因表現序列分析(SAGE)以及定量即時聚合酶鏈式反應(Q-PCR)。
藉由非限制性實例的方式,與分泌酶障礙相關的蛋白質包括PSENEN(早老素增強子2同系物(秀麗隱桿線蟲))、CTSB(組織蛋白酶B)、PSEN1(早老素1)、APP(澱粉樣蛋白β(A4)先質蛋白)、APH1B(前咽缺陷1同系物B(秀麗隱桿線蟲))、PSEN2(早老素2(阿茲海默症4))、BACE1(β-位點APP-切割酶1)、ITM2B(膜內在蛋白2B)、CTSD(組織蛋白酶D)、NOTCH1(Notch同系物1、易位相關(果蠅))、TNF (腫瘤壞死因子(TNF超家族,成員2))、INS(胰島素)、DYT10(肌張力障礙10)、ADAM17(ADAM金屬肽酶結構域17)、APOE(脂蛋白E)、ACE(血管緊張素I轉化酶(肽基二肽酶A)1)、STN(他汀)、TP53(腫瘤蛋白p53)、IL6(白介素6(干擾素,β 2))、NGFR(神經生長因子受體(TNFR超家族,成員16))、IL1B(白介素1,β)、ACHE(乙醯膽鹼酯酶(Yt血型))、CTNNB1(連環蛋白(鈣粘素相關蛋白),β 1,88kDa)、IGF1(胰島素樣生長因子1(生長調節素C))、IFNG(干擾素,γ)、NRG1(神經調節蛋白1)、CASP3(半胱天冬酶3,凋亡相關半胱胺酸肽酶)、MAPK1(絲裂原活化蛋白激酶1)、CDH1(鈣粘素1,1型,E-鈣粘素(上皮))、APBB1(澱粉樣蛋白β(A4)先質蛋白結合,家族B,成員1(Fe65))、HMGCR(3-羥基-3-甲基戊二醯-輔酶A還原酶)、CREB1(cAMP反應元件結合蛋白1)、PTGS2(前列腺素內過氧化物合酶2(前列腺素G/H合酶和環氧合酶))、HES1(長毛和裂口增強蛋白(hairy and enhancer of split)1,(果蠅))、CAT(過氧化氫酶)、TGFB1(轉化生長因子,β 1)、ENO2(烯醇酶2(γ,神經元的))、ERBB4(v-erb-a紅白血病病毒癌基因同系物4(禽的))、TRAPPC10(運輸蛋白粒子複合物10)、MAOB(單胺氧化酶B)、NGF(神經生長因子(β多肽))、MMP12(基質金屬肽酶12(巨噬細胞彈性蛋白酶))、JAG1(鋸齒狀1(艾歐吉勒綜合症(Alagille syndrome)))、CD40LG(CD40配位基)、PPARG(過氧化物酶體增殖劑活化的受體γ)、FGF2(成纖維細胞生長因子2(鹼性的))、IL3(白介素3(集落刺激因子,多重的))、LRP1(低密度脂蛋白受體相關蛋白1)、NOTCH4(Notch同系物4(果蠅))、MAPK8(絲裂原活化蛋白激酶8)、PREP(脯胺醯內肽酶)、NOTCH3(Notch同系物3(果蠅))、PRNP(朊 病毒蛋白)、CTSG(組織蛋白酶G)、EGF(表皮生長因子(β-尿抑胃素))、REN(腎素)、CD44(CD44分子(印度血型))、SELP(選滯蛋白P(顆粒膜蛋白140kDa,抗原CD62))、GHR(生長激素體)、ADCYAP1(腺苷酸環化酶活化多肽1(腦垂體的))、INSR(胰島素受體)、GFAP(膠質酸性蛋白)、MMP3(基質金屬肽酶3(溶基質素1,前明膠酶(progelatinase)))、MAPK10(絲裂原活化蛋白激酶10)、SP1(Sp1轉錄因子)、MYC(v-myc骨髓細胞瘤病病毒癌基因同系物(禽的))、CTSE(組織蛋白酶E)、PPARA(過氧化物酶體增殖劑活化受體α)、JUN(jun癌基因)、TIMP1(TIMP金屬肽酶抑制劑1)、IL5(白介素5(集落刺激因子,嗜酸性粒細胞))、IL1A(白介素1,α)、MMP9(基質金屬肽酶9(明膠酶B,92kDa明膠酶,92kDa IV型膠原酶))、HTR4(5-羥色胺(血清素)受體4)、HSPG2(硫酸乙醯肝素蛋白多糖2)、KRAS(v-Ki-ras2柯爾斯頓(Kirsten)大鼠肉瘤病毒癌基因同系物)、CYCS(細胞色素c,軀體的)、SMG1(SMG1同系物,磷脂醯肌醇3-激酶相關激酶(秀麗隱桿線蟲))、IL1R1(白介素1受體,I型)、PROK1(前動力蛋白1)、MAPK3(絲裂原活化蛋白激酶3)、NTRK1(神經營養酪胺酸激酶受體,1型)、IL13(白介素13)、MME(膜金屬內肽酶)、TKT(轉酮醇酶)、CXCR2(趨化因子(C-X-C模體)受體2)、IGF1R(胰島素樣生長因子1受體)、RARA(視黃酸受體,α)、CREBBP(CREB結合蛋白)、PTGS1(前列腺素內過氧化物合酶1(前列腺素G/H合酶和環氧合酶))、GALT(半乳糖-1-磷酸尿甙基轉移酶(uridylyltransferase))、CHRM1(膽鹼能受體,毒蕈鹼1)、ATXN1(共濟失調蛋白1)、PAWR(PRKC,凋亡,WT1,調節劑)、NOTCH2(Notch同系物2(果蠅))、M6PR(甘露糖-6-磷酸受體(陽離子依賴性 的))、CYP46A1(細胞色素P450,家族46、亞家族A,多肽1)、CSNK1 D(酪蛋白激酶1,δ)、MAPK14(絲裂原活化蛋白激酶14)、PRG2(蛋白多糖2,骨髓(自然殺傷細胞活化劑,嗜酸性粒細胞顆粒主要鹼性蛋白))、PRKCA(蛋白激酶C,α)、L1 CAM(L1細胞粘附分子)、CD40(CD40分子,TNF受體超家族成員5)、NR1I2(核受體亞家族1,I組,成員2)、JAG2(鋸齒狀2)、CTNND1(連環蛋白(鈣粘素相關蛋白)、δ 1)、CDH2(鈣粘素2,1型、N-鈣粘素(神經元的))、CMA1(凝乳酶1、肥大細胞)、SORT1(分揀蛋白1)、DLK1(δ樣1同系物(果蠅))、THEM4(硫酯酶超家族成員4)、JUP(連接斑珠蛋白(junction plakoglobin))、CD46(CD46分子,補體調節蛋白)、CCL11(趨化因子(C-C模體)配位基11)、CAV3(小窩蛋白3)、RNASE3(核糖核酸酶,RNA酶A家族、3(嗜酸性粒細胞陽離子蛋白))、HSPA8(熱休克70kDa蛋白8)、CASP9(半胱天冬酶9,凋亡相關半胱胺酸肽酶)、CYP3A4(細胞色素P450,家族3,亞家族A,多肽4)、CCR3(趨化因子(C-C模體)受體3)、TFAP2A(轉錄因子AP-2α(活化增強子結合蛋白2α))、SCP2(固醇載體蛋白2)、CDK4(細胞週期蛋白依賴性激酶4)、HIF1A(缺氧可誘導的因子1,α亞基(基本螺旋-環-螺旋轉錄因子))、TCF7L2(轉錄因子7樣2(T細胞特異的,HMG盒))、IL1R2(白介素1受體,II型)、B3GALTL(β 1,3-半乳糖轉移酶樣)、MDM2(Mdm2 p53結合蛋白同系物(小鼠))、RELA(v-rel網狀內皮組織增殖病毒癌基因同系物A(禽的))、CASP7(半胱天冬酶7,凋亡相關半胱胺酸肽酶)、IDE(胰島素降解酶)、FABP4(脂肪酸結合蛋白4,脂肪細胞)、CASK(鈣/鈣調蛋白依賴性絲胺酸蛋白激酶(MAGUK家族))、ADCYAP1R1(腺苷酸環化酶活化多肽1(腦垂體的)受體類型I)、ATF4 (活化轉錄因子4(tax-反應增強子元件B67))、PDGFA(血小板衍生的生長因子α多肽)、C21或f33(21號染色體開放閱讀框33)、SCG5(分泌粒蛋白V(7B2蛋白))、RNF123(環指蛋白123)、NFKB1(B細胞中的κ輕多肽基因增強子的核因子1)、ERBB2(v-erb-b2紅白血病病毒癌基因同系物2、神經/膠質母細胞瘤衍生的癌基因同系物(禽的))、CAV1(小窩蛋白1,胞膜窖蛋白,22kDa)、MMP7(基質金屬肽酶7(基質溶解素,子宮的))、TGFA(轉化生長因子,α)、RXRA(類視黃醇X受體,α)、STX1A(突觸融合蛋白1A(腦的))、PSMC4(蛋白酶體(先質,巨蛋白因子)26S亞基,ATP酶,4)、P2RY2(嘌呤能受體P2Y,G蛋白偶聯的,2)、TNFRSF21(腫瘤壞死因子受體超家族,成員21)、DLG1(discs,大的同系物1(果蠅))、NUMBL(numb同系物(果蠅)樣)、SPN(涎福林(sialophorin))、PLSCR1(磷脂混雜酶1)、UBQLN2(泛醌蛋白2)、UBQLN1(泛醌蛋白1)、PCSK7(前蛋白轉化酶枯草桿菌/科信(kexin)類型7)、SPON1(脊椎蛋白1,細胞外基質蛋白)、SILV(西爾弗(silver)同系物(小鼠))、QPCT(穀胺醯胺-肽環轉移酶)、HESS(長毛和裂口增強蛋白5(果蠅))、GCC1(GRIP和含捲曲螺旋結構域的1)及其任何組合。
該基因修飾動物或細胞可以包括1、2、3、4、5、6、7、8、9、10個或更多個破壞的、編碼與分泌酶障礙相關的蛋白質的染色體序列以及零、1、2、3、4、5、6、7、8、9、10個或更多個編碼破壞的與分泌酶障礙相關的蛋白質的染色體整合序列。
靶向肝臟或肝臟細胞;血友病
提供了靶向肝臟細胞。這可以是在體外或體內。肝細胞係 較佳的。遞送CRISPR蛋白可以是經由病毒載體,尤其是AAV(並且特別是AAV2/6)載體。該等可以藉由靜脈注射給予。
針對肝臟的較佳的靶標,無論在體外還是在體內,係白蛋白基因。在白蛋白以非常高的水平表現時這係一種所謂的‘安全港’,所以在成功的基因編輯之後白蛋白的產生的某些降低被耐受。這也是較佳的,因為即使僅一小部分肝細胞被編輯,在從白蛋白啟動子/增強子所見的高水平表現允許實現有用水平的正確或轉基因生產(從插入的供體模板)。
白蛋白的內含子1已經由韋克斯勒(Wechsler)等人顯示(在美國血液學會第57屆年度會議上報導-摘要可線上獲得於https://ash.confex.com/ash/2015/webprogram/Paper86495.html,並且呈現於2015年12月6日)為是適合的靶位點。他們的工作使用了Zn指,以在此靶位點處切割DNA,並且可以產生適合的指導序列以指導在該相同位點處由CRISPR蛋白的切割。
使用在高度表現的基因(具有高度活性增強子/啟動子的基因)內的靶標如白蛋白還可以允許使用無啟動子的供體模板,如由韋克斯勒(Wechsler)等人所報導,並且這在肝臟靶向之外也是廣泛可應用的。其他高度表現的基因的實例係已知的。
肝臟相關的血液障礙,尤其是血友病並且特別是B型血友病
對肝細胞的成功的基因編輯已經在小鼠(體外和體內兩者)中和在非人類靈長類(體內)中實現,顯示在肝細胞中藉由基因編輯/基因組工程化治療血液障礙係可行的。具體地,在非人類靈長類中已 經示出在肝細胞中人類F9(hF9)基因的表現,指示在人類中B型血友病的治療。
韋克斯勒(Wechsler)等人在在美國血液學會第57屆年度會議上(摘要發表於2015年12月6日,並且可線上獲得於https://ash.confex.com/ash/2015/webprogram/Paper86495.html)報導,他們已經成功地藉由體內基因編輯在非人類靈長類中從肝細胞表現了人類F9(hF9)。這係使用1)靶向白蛋白座位的內含子1的兩個鋅指核酸酶(ZFN),和2)人類F9供體模板構建體來實現的。ZFN和供體模板係在靜脈內注射的分開的嗜肝腺相關病毒血清型2/6(AAV2/6)載體上被編碼,導致在一定比例的肝臟肝細胞中hF9基因的校正拷貝向白蛋白座位中的靶向插入。
白蛋白座位被選擇為“安全港”,因為這種最豐富的血漿蛋白的產生超過10g/天,並且在那些水平上的適度減少係被良好耐受的。基因組編輯的肝細胞產生治療量的正常hFIX(hF9),而非白蛋白,由高度活性白蛋白增強子/啟動子驅動。在白蛋白座位處hF9轉基因的靶向整合以及該基因剪接為白蛋白轉錄物被示出。
小鼠研究:以1.0 x1013載體基因組(vg)/kg,經由尾靜脈注射給予C57BL/6小鼠運載體(n=20)或編碼小鼠替代試劑的AAV2/6載體(n=25)。在治療的小鼠中血漿hFIX的ELISA分析顯示峰值水平為50-1053ng/mL,維持了6個月研究的持續時間。來自小鼠血漿的FIX活性的分析確證了與表現水平相稱的生物活性。
非人類靈長類(NHP)研究:在此大動物模型中,以1.2 x 1013vg/kg(n=5/組)單一靜脈內共輸注編碼NHP靶向的白細胞特異性ZFN的AAV2/6載體和人類F9供體,導致>50ng/mL(正常的>1%)。使用更高的AAV2/6劑量(高達1.5 x 1014vg/kg)在一些動物中產生高達1000ng/ml(或正常的20%)以及在單一動物中產生高達2000ng/ml(或正常的50%)的血漿hFIX水平,持續研究的持續時間(3個月)。
該治療在小鼠和NHP中被良好耐受,其中在任何物種中在治療劑量下,不具有與AAV2/6 ZFN+供體治療相關的顯著毒物學發現。聖加蒙(Sangamo)(加利福尼亞州,美國)自從應用至FDA起已經被授予允許執行體內基因組編輯應用的世界上首個人類臨床試驗。這係在EMEA批准脂蛋白脂肪酶缺陷的阿利潑金(Glybera)基因療法治療之後進行的。
因此,在一些實施方式中,較佳的是使用以下的任一個或全部:
‧AAV(尤其是AAV2/6)載體,較佳的是藉由靜脈注射給予;
‧白蛋白,作為用於轉基因/模板的基因編輯/插入的靶標-尤其是在白蛋白的內含子1處;
‧人類F9供體模板;和/或
‧無啟動子供體模板。
B型血友病
因此,在一些實施方式中,較佳的是本發明用於治療B型血友病。這樣較佳的是提供模板並且這係人類F9基因。將瞭解的是,該 hF9模板包括wt或‘正確’形式的hF9,這樣使得治療係有效的。
在一替代實施方式中,B型血友病形式的F9可以被遞送以便創建模型生物、細胞或細胞系(例如鼠類或非人類靈長類模型生物,細胞或細胞系),該模型生物、細胞或細胞系具有或攜帶B型血友病表型,即不能產生wt F9。
A型血友病
在一些實施方式中,F9(因子IX)基因可以被上述F8(因子VIII)基因替代,導致A型血友病的治療(藉由提供正確的F8基因)和/或創建A型血友病模型生物、細胞或細胞系(藉由提供不正確的A型血友病形式的F8基因)。
C型血友病
在一些實施方式中,F9(因子IX)基因可以被上述F11(因子XI)基因替代,導致C型血友病的治療(藉由提供正確的F11基因)和/或創建C型血友病模型生物、細胞或細胞系(藉由提供不正確的C型血友病形式的F11基因)。
其他病況
囊性纖維化(CF)
在一些實施方式中,提供了治療、預防或診斷囊性纖維化。該靶標較佳的是係SCNN1A或CFTR基因。這描述於WO 2015157070,將其揭露藉由引用特此結合。
癌症和CAR-T
在一些實施方式中,提供了治療、預防或診斷囊性纖維化。該靶標較佳的是FAS、BID、CTLA4、PDCD1、CBLB、PTPN6、TRAC或TRBC基因中的一個或多個。該癌症可以是以下項中的一種或多種:淋巴瘤、慢性淋巴細胞性白血病(CLL)、B細胞急性淋巴細胞性白血病(B-ALL)、急性成淋巴細胞性白血病、急性髓細胞性白血病、非霍奇金氏淋巴瘤(NHL)、彌漫性大細胞淋巴瘤(DLCL)、多發性骨髓瘤、腎細胞癌(RCC)、成神經細胞瘤、結直腸癌、乳腺癌、卵巢癌、黑色素瘤、肉瘤、前列腺癌、肺癌、食管癌、肝細胞癌、胰腺癌、星形細胞瘤、間皮瘤、頭頸癌、以及成神經管細胞瘤。這可以用工程化嵌合抗原受體(CAR)T細胞來實施。這描述於WO 2015161276,將其揭露藉由引用特此結合。
單純皰疹病毒1和2
在一些實施方式中,提供了HSV-1(單純皰疹病毒1)的治療、預防或診斷。該靶標較佳的是在HSV-1中的UL19、UL30、UL48或UL50基因。這描述於WO 2015153789,將其揭露藉由引用特此結合。
在其他實施方式中,提供了HSV-2(單純皰疹病毒2)的治療、預防或診斷。該靶標較佳的是在HSV-2中的UL19、UL30、UL48或UL50基因。這描述於WO 2015153791,將其揭露藉由引用特此結合。
本發明可以進一步基於CFISPR-Cas9開發的方面、以及如在以下文章(特此藉由引用結合於此,並且特別是在涉及在細胞和生物中遞送CRISPR蛋白複合物和使用RNA指導的內切核酸酶時)中列出的用途來說明和延伸:
Figure 112128864-A0101-12-0821-184
使用CRISPR/Cas系統進行的多元基因組工程化(Multiplex genome engineering using CRISPR/Cas systems)。叢(Cong),L.、蘭(Ran),F.A.、科克斯(Cox)D.、林(Lin),S.、巴雷德(Barretto),R.、哈比蔔(Habib),N.、徐(Hsu),P.D.、武(Wu),X.、江(Jiang),W.、馬拉菲尼(Marraffini),L.A.,&張(Zhang),F.《科學》(Science)2月15日;339(6121):819-23(2013);
Figure 112128864-A0101-12-0821-185
使用CRISPR-Cas系統對細菌基因組進行RNA-指導的編輯(RNA-guided editing of bacterial genomes using CRISPR-Cas systems)。江(Jiang)W.、比卡德(Bikard)D.、科克斯(Cox)D.、張(Zhang)F、馬拉菲尼(Marraffini)LA.《自然生物技術》(Nat Biotechnol Mar);31(3):233-9(2013);
Figure 112128864-A0101-12-0821-186
藉由CRISPR/Cas-介導的基因組工程化在多基因中攜帶突變的小鼠的一步產生(One-Step Generation of Mice Carrying Mutations in Multiple Genes by CRISPR/Cas-Mediated Genome Engineering)。王(Wang)H.、楊(Yang)H.、奇瓦里拉(Shivalila)CS.、朵拉蒂(Dawlaty)MM.、程(Cheng)AW.、張(Zhang)F.、耶尼施(Jaenisch)R.《細胞》(Cell)5月9日;153(4):910-8(2013);
Figure 112128864-A0101-12-0821-187
哺乳動物內源轉錄和外遺傳狀態的光控制(Optical control of mammalian endogenous transcription and epigenetic states)。科納曼(Konermann)S、布裡格姆(Brigham)MD、特裡維諾(Trevino)AE、徐(Hsu)PD、海頓裡希(Heidenreich)M、叢(Cong)L、普萊特(Platt)RJ、斯科特(Scott)DA、丘奇(Church)GM、張(Zhang)F.《自然》 (Nature).8月22日;500(7463):472-6.doi:10.1038/Nature12466.電子公開於2013年8月23日(2013);
Figure 112128864-A0101-12-0822-188
藉由RNA指導的CRISPR Cas9進行的雙切以用於增強的基因組編輯特異性(Double Nicking by RNA-Guided CRISPR Cas9 for Enhanced Genome Editing Specificity)。蘭(Ran),FA.、徐(Hsu),PD.、林(Lin),CY.、古滕伯格(Gootenberg),JS.、科納曼(Konermann),S.、特裡維諾(Trevino),AE.、斯科特(Scott),DA.、井上(Inoue),A.、馬托巴(Matoba),S.、張(Zhang),Y.,&張(Zhang),F.《細胞》(Cell)8月28日.pii:S0092-8674(13)01015-5.(2013-A);
Figure 112128864-A0101-12-0822-189
RNA指導的Cas9核酸酶的DNA靶向特異性(DNA targeting specificity of RNA-guided Cas9 nucleases)。徐(Hsu),P.、斯科特(Scott),D.、溫斯坦(Weinstein),J.、蘭(Ran),FA.、科納曼(Konermann),S.、阿格瓦拉(Agarwala),V.、李(Li),Y.、法恩(Fine),E.、吳(Wu),X.、沙勒姆(Shalem),O.、克拉迪克(Cradick),TJ.、馬拉菲尼(Marraffini),LA.、包(Bao),G.,&張(Zhang),F.《自然生物技術》(Nat Biotechnol)doi:10.1038/nbt.2647(2013);
Figure 112128864-A0101-12-0822-190
使用CRISPR-Cas9系統進行的基因組工程化(Genome engineering using the CRISPR-Cas9 system)。蘭(Ran),FA.、徐(Hsu),PD.、賴特(Wright),J.、阿格瓦拉(Agarwala),V.、斯科特(Scott),DA.、張(Zhang),F.《自然工具》(Nature Protocols)十一月;8(11):2281-308(2013-B);
Figure 112128864-A0101-12-0822-191
在人類細胞中基因組規模CRISPR-Cas9敲除篩選(Genome-Scale CRISPR-Cas9 Knockout Screening in Human Cells)。Shalem,O.,Sanjana, NE.,Hartenian,E.,Shi,X.,Scott,DA.,Mikkelson,T.,Heckl,D.,Ebert,BL.,Root,DE.,Doench,JG.,Zhang,F.Science Dec 12.(2013).[電子版先於印刷版];
Figure 112128864-A0101-12-0823-192
在與指導RNA和靶DNA複合物中的cas9的晶體結構(Crystal structure of cas9 in complex with guide RNA and target DNA)。尼氏瑪素(Nishimasu),H.、蘭(Ran),FA.、徐(Hsu),PD.、科納曼(Konermann),S.、舍哈塔(Shehata),SI.、多米耶(Dohmae),N.、石穀(Ishitani),R.、張(Zhang),F.、努爾基(Nureki),O.《細胞》(Cell)2月27日.156(5):935-49(2014);
Figure 112128864-A0101-12-0823-193
在哺乳動物細胞中CRISPR內切核酸酶Cas9的基因組寬結合(Genome-wide binding of the CRISPR endonuclease Cas9 in mammalian cells)。吳(Wu)X.、斯科特(Scott)DA.、凱裡茲(Kriz)AJ.、邱(Chiu)AC.、徐(Hsu)PD.、達東(Dadon)DB.、程(Cheng)AW.、特裡維諾(Trevino)AE.、科納曼(Konermann)S.、陳(Chen)S.、耶尼施(Jaenisch)R.、張(Zhang)F.、夏普(Sharp)PA.《自然生物技術》(Nat Biotechnol.)4月20日.doi:10.1038/nbt.2889(2014);
Figure 112128864-A0101-12-0823-194
用於基因組編輯和癌模造的CRISPR-Cas9敲入小鼠(CRISPR-Cas9 Knockin Mice for Genome Editing and Cancer Modeling.)普萊特(Platt)RJ、陳(Chen)S、周(Zhou)Y、嚴(Yim)MJ、西奇(Swiech)L、肯普頓(Kempton)HR、達爾曼(Dahlman)JE、帕納斯(Parnas)O、艾森豪(Eisenhaure)TM、約瓦諾維奇(Jovanovic)M、格拉哈姆(Graham)DB、加加瓦拉(Jhunjhunwala)S、海頓賴希 (Heidenreich)M、賽維爾(Xavier)RJ、蘭格(Langer)R、安德森(Anderson)DG、哈科恩(Hacohen)N、雷格夫(Regev)A、馮(Feng)G、夏普(Sharp)PA、張(Zhang)F.《細胞》(Cell)159(2):440-455 DOI:10.1016/j.cell.2014.09.014(2014);
Figure 112128864-A0101-12-0824-195
用於基因組工程化的CRISPR-Cas9的開發與應用(Development and Applications of CRISPR-Cas9 for Genome Engineering),徐(Hsu)PD、蘭德(Lander)ES、張(Zhang)F.《細胞》(Cell).6月5日;157(6):1262-78(2014)。
Figure 112128864-A0101-12-0824-196
使用CRISPR/Cas9系統在人類細胞中進行遺傳篩選(Genetic screens in human cells using the CRISPR/Cas9 system),王(Wang)T、魏(Wei)JJ、薩巴蒂尼(Sabatini)DM、蘭德(Lander)ES.,《科學》(Science).1月3日;343(6166):80-84.doi:10.1126/science.1246981(2014);
Figure 112128864-A0101-12-0824-197
用於CRISPR-Cas9介導的基因失活的高活性sgRNA的合理設計(Rational design of highly active sgRNAs for CRISPR-Cas9-mediated gene inactivation),多恩奇(Doench)JG、哈特尼(Hartenian)E、格拉哈姆(Graham)DB、托索瓦(Tothova)Z、赫格德(Hegde)M、斯密斯(Smith)I、蘇蘭德(Sullender)M、埃伯特(Ebert)BL、賽維爾(Xavier)RJ、羅特(Root)DE.(線上公開於2014年9月3日)《自然生物技術》(Nat Biotechnol).12月;32(12):1262-7(2014);
Figure 112128864-A0101-12-0824-198
使用CRISPR-Cas9在哺乳動物腦中的基因功能的體內探詢(In vivo interrogation of gene function in the mammalian brain using CRISPR-Cas9),斯維希(Swiech)L、海頓賴希(Heidenreich)M、班納 吉(Banerjee)A、哈比蔔(Habib)N、李(Li)Y、特龍貝塔(Trombetta)J、蘇爾(Sur)M、張(Zhang)F.,(線上公開於2014年10月19日)《自然生物技術》(Nat Biotechnol).1月;33(1):102-6(2015);
Figure 112128864-A0101-12-0825-199
用工程化的CRISPR-Cas9複合物進行的基因組範圍內的轉錄活化(Genome-scale transcriptional activation by an engineered CRISPR-Cas9 complex),康納爾曼(Konermann)S、布裡格姆(Brigham)MD、特雷維諾(Trevino)AE、俊(Joung)J、阿巴迪(Abudayyeh)OO、巴爾塞納(Barcena)C、徐(Hsu)PD、哈比蔔(Habib)N、古滕伯格(Gootenberg)JS、尼氏瑪素(Nishimasu)H、努爾基(Nureki)O、張(Zhang)F.,《自然》(Nature).1月29日;517(7536):583-8(2015)。
Figure 112128864-A0101-12-0825-200
用於可誘導的基因組編輯和轉錄調節的分離-Cas9構造(A split-Cas9 architecture for inducible genome editing and transcription modulation),蔡徹(Zetsche)B、沃爾茲(Volz)SE、張(Zhang)F.,(線上公開於2015年2月02日)《自然生物技術》(Nat Biotechnol).2月;33(2):139-42(2015);
Figure 112128864-A0101-12-0825-201
在腫瘤生長和轉移的小鼠模型中基因組範圍的CRISPR篩選(Genome-wide CRISPR Screen in a Mouse Model of Tumor Growth and Metastasis),陳(Chen)S、桑吉那(Sanjana)NE、鄭(Zheng)K、沙勒姆(Shalem)O、李(Lee)K、史(Shi)X、斯科特(Scott)DA、宋(Song)J、潘(Pan)JQ、維斯樂德(Weissleder)R、李(Lee)H、張(Zhang)F、夏普(Sharp)PA.《細胞》(Cell)160,1246-1260,2015年3月12日(在小鼠中多元篩選),以及
Figure 112128864-A0101-12-0826-202
使用金黃色葡萄球菌Cas9進行體內基因組編輯(In vivo genome editing using Staphylococcus aureus Cas9),蘭(Ran)FA、叢(Cong)L、閆(Yan)WX、斯科特(Scott)DA、古滕伯格(Gootenberg)JS、凱裡茲(Kriz)AJ、蔡徹(Zetsche)B、沙勒姆(Shalem)O、吳(Wu)X、馬卡洛娃(Makarova)KS、庫寧(Koonin)EV、夏普(Sharp)PA、張(Zhang)F.,(線上公開於2015年4月01日),《自然》(Nature).4月9日;520(7546):186-91(2015)。
Figure 112128864-A0101-12-0826-203
沙勒姆(Shalem)等人,“使用CRISPR-Cas9的高通量功能基因組學(High-throughput functional genomics using CRISPR-Cas9)”,《自然綜述遺傳學》(Nature Reviews Genetics)16,299-311(2015年5月)。
Figure 112128864-A0101-12-0826-204
徐(Xu)等人,“改進的CRISPR sgRNA設計的序列決定物(Sequence determinants of improved CRISPR sgRNA design)”,《基因組研究》(Genome Research)25,1147-1157(2015年8月)。
Figure 112128864-A0101-12-0826-205
帕納斯(Parnas)等人,“在初級免疫細胞中基因組範圍的CRISPR篩選以剖析調節網路(A Genome-wide CRISPR Screen in Primary Immune Cells to Dissect Regulatory Networks)”,《細胞》(Cell)162,675-686(2015年7月30日)。
Figure 112128864-A0101-12-0826-206
羅馬南(Ramanan)等人,“病毒DNA的CRISPR/Cas9切割有效地抑制乙型肝炎病毒(CRISPR/Cas9 cleavage of viral DNA efficiently suppresses hepatitis B virus)”,《科學報告》(Scientific Reports)5:10833.doi:10.1038/srep10833(2015年6月2日)
Figure 112128864-A0101-12-0826-207
尼氏瑪素(Nishimasu)等人,“金黃色葡萄球Cas9的晶體結構 (Crystal Structure of Staphylococcus aureus Cas9)”,《細胞》(Cell)162,1113-1126(2015年8月27日)
Figure 112128864-A0101-12-0827-208
藉由Cas9介導的原位飽和誘變切開BCL11A增強子(BCL11A enhancer dissection by Cas9-mediated in situ saturating mutagenesis),詹韋爾(Canver)等人,《自然》(Nature)527(7577):192-7(2015年11月12日)doi:10.1038/nature15521.電子公開於2015年9月16日。
Figure 112128864-A0101-12-0827-209
Cpf1係第2類CRISPR-Cas系統的單一RNA指導的內切核酸酶(Cpf1 Is a Single RNA-Guided Endonuclease of a Class 2 CRISPR-Cas System),蔡徹(Zetsche)等人,《細胞》(Cell)163,759-71(2015年9月25日)。
Figure 112128864-A0101-12-0827-210
不同的第2類CRISPR-Cas系統的發現和功能表征(Discovery and Functional Characterization of Diverse Class 2 CRISPR-Cas Systems),沙姆克(Shmakov)等人,《分子細胞》(Molecular Cell),60(3),385-397 doi:10.1016/j.molcel.2015.10.008,電子公開於2015年10月22日。
Figure 112128864-A0101-12-0827-211
具有改進的特異性的合理工程化的Cas9核酸酶(Rationally engineered Cas9 nucleases with improved specificity),斯萊馬克(Slaymaker)等人,《科學》(Science)2016年1月1日351(6268):84-88 doi:10.1126/science.aad5227.電子公開於2015年12月1日。[電子版先於印刷版]
將它們各自藉由引用併入本文,可以在本發明的實踐中考慮,並且下文簡要討論:
Figure 112128864-A0101-12-0827-212
叢(Cong)等人基於嗜熱鏈球菌Cas9以及還有釀膿鏈球菌Cas9兩 者改造了II型CRISPR-Cas系統以用於在真核細胞中使用,並且證實了Cas9分子可以藉由短RNA指導以誘導在人類和小鼠細胞中DNA的精確切割。他們的研究進一步顯示Cas9在轉化成一種切口酶時可以用來以最低誘變活性促進在真核細胞中的同源定向修復。另外,他們的研究證實多個指導序列可以被編碼進單一CRISPR陣列中以使得能夠在哺乳動物基因組內的內源性基因組座位位點處同時編輯若干,證實了RNA指導的核酸酶技術的容易可程式設計性和廣泛可應用性。這種使用RNA以程式設計細胞內序列特異性DNA切割的能力定義了新一類的基因組編輯工具。該等研究進一步顯示,其他CRISPR座位可能是可移植入哺乳動物細胞中的,並且還可以介導哺乳動物基因組切割。重要地,可以設想的是CRISPR-Cas系統的若干方面可以進一步改進以增加其效率和多功能性。
Figure 112128864-A0101-12-0828-213
江(Jiang)等人使用規律間隔成簇短迴文重複(CRISPR)-關聯的Cas9內切核酸酶,與雙-RNA複合,以在肺炎鏈球菌和大腸桿菌的基因組中引入精確的突變。該途徑依賴於在靶基因組位點處的雙-RNA:Cas9-引導的切割,以殺死未突變的細胞,並且回避對選擇性標記或反選擇系統的需要。該研究報導藉由改變短CRISPR RNA(crRNA)的序列以使單一-和多個多核苷酸變化被攜帶在編輯模板上而重程式設計雙-RNA:Cas9特異性。該研究顯示,同時使用兩種crRNA使得多元誘變成為可能。另外,當該途徑與重組工程組合使用時,在肺炎鏈球菌中使用描述的途徑回收的接近100%的細胞包含希望的突變,並且在大腸桿菌中回收的65%包含突變。
Figure 112128864-A0101-12-0828-214
王(Wang)等人(2013)使用CRISPR/Cas系統用於一步生成攜 帶多基因中突變的小鼠,所述小鼠傳統上是以多步藉由在胚胎幹細胞中的連續重組和/或小鼠的與單一突變的耗時性雜交生成的。CRISPR/Cas系統將大大加速功能上豐富的基因和上位基因相互作用的體內研究。
Figure 112128864-A0101-12-0829-215
科納曼(Konermann)等人(2013)解決了在本領域中對通用和穩固技術的需要,其使得能夠基於CRISPR Cas9酶以及還有轉錄活化蛋白樣效應子對DNA-結合結構域進行光調節和化學調節。
Figure 112128864-A0101-12-0829-216
蘭(Ran)等人(2013-A)描述了將Cas9切口酶突變體與配對的指導RNA相組合以引入靶向的雙股斷裂的途徑。這解決了以下問題:來自微生物CRISPR-Cas系統的Cas9核酸酶藉由指導序列而靶向特異性基因組座位,其可以耐受與該DNA靶標的某些錯配並由此促進不希望的脫靶誘變。因為基因組中的單獨切口以高保真性被修復,所以同時經由適當補償指導RNA而形成切口對於雙股斷裂係必需的,並且所述切口形成延伸了特異性識別的鹼基的數目以用於靶標切割。作者證實了使用配對的切口形成可以降低在細胞系中的脫靶活性50至1,500倍,並且從而促進在小鼠受精卵中的基因敲除而不犧牲中靶切割效率。這個通用策略使得多種多樣的要求高特異性的基因組編輯應用成為可能。
Figure 112128864-A0101-12-0829-217
徐(Hsu)等人(2013)表徵了在人類細胞中SpCas9靶向特異性以告知靶位點的選擇並避免脫靶效應。該研究評價了在293T和293FT細胞中的>100個預測的基因組脫靶座位處>700個指導RNA變體和SpCas9-誘導的indel突變水平。該等作者示出SpCas9以序列依賴性方式耐受指導RNA與靶DNA之間在不同位置處的錯配,對錯配的數目、位置和分佈敏感。該等作者進一步示出SpCas9-介導的切割不受DNA甲基化的影響,並 且SpCas9和sgRNA的劑量可被滴定為使得脫靶修飾最小化。另外,為了促進哺乳動物基因組工程應用,該等作者報導提供基於網路的軟體工具以指導靶序列的選擇和驗證連同脫靶分析。
Figure 112128864-A0101-12-0830-218
蘭(Ran)等人(2013-B)描述了用於在哺乳動物細胞中Cas9介導的經由非同源末端連接(NHEJ)或同源定向修復(HDR)基因組編輯、連同產生修飾的細胞系(以用於下游功能研究)的一組工具。為了最小化脫靶切割,該等作者進一步描述了一種雙-切口策略,使用的是Cas9切口酶突變體與配對的指導RNA。由該等作者提供的方案經實驗得出用於選擇靶位點、評價切割效率和分析脫靶活性的指南。該等研究顯示,以靶設計開始,基因修飾可以在少至1-2周內實現,並且修飾的選殖細胞系可以在2-3周內得以衍生。
Figure 112128864-A0101-12-0830-219
沙勒姆(Shalem)等人描述了新的在基因組廣度範圍上探詢基因功能的方式。他們的研究顯示,遞送基因組範圍的CRISPR-Cas9敲除(GeCKO)文庫利用64,751個獨特的指導序列靶向18,080個基因,該等指導序列使得在人類細胞中陰性和陽性選擇篩選兩者成為可能。首先,該等作者顯示,使用該GeCKO文庫來鑒定癌症和多能幹細胞中對於細胞活力至關重要的基因。接著,在黑色素瘤模型中,該等作者針對基因進行篩選,該等基因的損失涉及對維羅非尼(一種抑制突變體蛋白激酶BRAF的治療劑)的抗性。他們的研究顯示,最高級候選物包括先前驗證的基因NF1和MED12連同新穎的命中物NF2、CUL3、TADA2B、和TADA1。該等作者觀察到在靶向相同基因的獨立指導RNA之間的高水平的一致性以及高比率的命中確認,並且因此證實了採用Cas9進行基因組範圍篩選 的前景。
Figure 112128864-A0101-12-0831-220
尼氏瑪素(Nishimasu)等人以2.5A°解析度報導了與sgRNA複合的釀膿鏈球菌Cas9以及其靶DNA的晶體結構。該結構揭示了一種由靶識別和核酸酶葉片組成的兩葉片構造,其將sgRNA:DNA異源雙股體容納在它們的介面處的帶正電的凹槽中。然而識別葉片對於結合sgRNA和DNA係至關重要的,核酸酶葉片包含HNH和RuvC核酸酶結構域,該等結構域適合地被定位為分別用於靶DNA的互補和非互補股的切割。核酸酶葉片還包含負責與原型間隔子鄰近模體(PAM)相互作用的羧基-末端結構域。這種高解析度結構和伴隨的功能分析已經揭示了RNA-指導的由Cas9進行的DNA靶向的分子機制,由此為合理設計新的通用基因組編輯技術做好準備。
Figure 112128864-A0101-12-0831-221
吳(Wu)等人標定了在小鼠胚胎幹細胞(mESC)中,來自釀膿鏈球菌的無催化活性Cas9(dCas9)(載入有單一指導RNA(sgRNA))的基因組廣度的結合位點。該等作者顯示,測試的四種sgRNA中的每一種將dCas9靶向至數十和數千個之間的基因組位點,該等基因組位點頻繁地藉由sgRNA中的5-核苷酸種子區和NGG原型間隔子鄰近模體(PAM)表徵。染色質不可接近性降低了dCas9與具有匹配種子序列的其他位點的結合;因此70%的脫靶位點係與基因相關聯的。該等作者顯示,在用催化活性的Cas9轉染的mESC中295 dCas9結合位點的靶向定序鑒定出超過背景水平的僅一個突變位點。該等作者提出了一種針對Cas9結合和切割的兩態模型,其中種子匹配觸發了結合但是需要與靶DNA的廣泛配對用於切割。
Figure 112128864-A0101-12-0832-222
普萊特(Platt)等人建立了Cre依賴性Cas9敲入式小鼠。該等作者證明了在神經元、免疫細胞、和內皮細胞中,使用腺相關病毒(AAV)-、慢病毒-、或粒子介導的遞送指導RNA進行體內以及離體基因組編輯。
Figure 112128864-A0101-12-0832-223
徐(Hsu)等人(2014)係綜述文章,其總體討論了CRISPR-Cas9從優酪乳到基因組編輯的歷史,包括細胞的遺傳篩選。
Figure 112128864-A0101-12-0832-224
王(Wang)等人(2014)涉及聚池的功能缺失遺傳篩選方法,該方法適合用於使用基因組規模的慢病毒單一指導RNA(sgRNA)文庫進行的正選擇和負選擇兩者。
Figure 112128864-A0101-12-0832-225
多恩奇(Doench)等人創建了sgRNA池,覆蓋六個內源性小鼠基因和三個內源性人類基因的一組的全部可能靶位點,並且藉由抗體染色和流式細胞術定量地測定了該等sgRNA產生其靶基因的無效等位基因的能力。該等作者顯示PAM的優化改進了活性並且還提供了用於設計sgRNA的線上工具。
Figure 112128864-A0101-12-0832-226
斯維希(Swiech)等人證明瞭AAV介導的SpCas9基因組編輯可以使能進行腦中的基因功能的反向遺傳學研究。
Figure 112128864-A0101-12-0832-227
康納爾曼(Konermann)等人(2015)討論了在有和沒有接頭的情況下,在指導物(例如莖或四核苷酸環)上的適當位置處,附接多種效應物結構域的能力,該等效應物結構域例如轉錄活化蛋白、功能和表觀基因組調節物。
Figure 112128864-A0101-12-0832-228
蔡徹(Zetsche)等人證明瞭Cas9酶可以分離為兩個並且因此針對活化而言Cas9的組裝可以被控制。
Figure 112128864-A0101-12-0833-229
陳(Chen)等人涉及藉由證明以下進行多元篩選:在小鼠中基因組範圍的體內CRISPR-Cas9篩選揭示了調節肺轉移的基因。
Figure 112128864-A0101-12-0833-230
蘭(Ran)等人(2015)涉及SaCas9以及其編輯基因組的能力,並且證明不能從生物化學測定外推。沙勒姆(Shalem)等人(2015)描述了催化無活性的Cas9(dCas9)融合用於綜合地抑制(CRISPRi)或活化(CRISPRa)表現的方式,示出使用Cas9用於基因組規模的篩選(包括測定且聚池的篩選)的進展、使基因組座位失活的敲除途徑、以及調節轉錄活性的策略。
Figure 112128864-A0101-12-0833-231
沙勒姆(Shalem)等人(2015)描述了催化無活性的Cas9(dCas9)融合用於綜合地抑制(CRISPRi)或活化(CRISPRa)表現的方式,示出使用Cas9用於基因組規模的篩選(包括測定且聚池的篩選)的進展、使基因組座位失活的敲除途徑、以及調節轉錄活性的策略。
Figure 112128864-A0101-12-0833-232
許(Xu)等人(2015)評估了在基於CRISPR的篩選中促成單一指導RNA(sgRNA)效率的DNA序列特徵。該等作者探索了CRISPR/Cas9敲除的效率以及在切割位點處的核苷酸較佳性。該等作者還發現對於CRISPRi/a的序列較佳性基本上不同於對於CRISPR/Cas9敲除的序列較佳性。
Figure 112128864-A0101-12-0833-233
帕納斯(Parnas)等人(2015)將基因組範圍的聚池的CRISPR-Cas9文庫引入樹突細胞(DC)中,以鑒定控制由細菌脂多糖(LPS)對腫瘤壞死因子(Tnf)的誘導的基因。對Tlr4傳訊的已知調節物和先前未知的候選物進行鑒定,並根據對於對LPS的典型響應的不同效果分成三個功能模組。
Figure 112128864-A0101-12-0834-234
羅馬南(Ramanan)等人(2015)證明了在受感染細胞中對病毒附加體DNA(cccDNA)的切割。HBV基因組作為3.2kb雙股附加體DNA種類存在於受感染的肝細胞的細胞核中,該種類稱為共價閉合環狀DNA(ccc DNA),其係HBV生命週期中的關鍵組分,其複製不受目前療法的抑制。該等作者顯示特異性靶向HBV的高度保守區的sgRNA穩固地抑制病毒複製並耗減cccDNA。
Figure 112128864-A0101-12-0834-235
尼氏瑪素(Nishimasu)等人(2015)報導了SaCas9的晶體結構,該SaCas9與單一指導RNA(sgRNA)以及其包含5'-TTGAAT-3' PAM和5'-TTGGGT-3' PAM的雙股DNA靶標複合。SaCas9與SpCas9的結構比較突出顯示出結構保存和差別,解釋了它們不同的PAM特異性和直向同源性sgRNA識別。
Figure 112128864-A0101-12-0834-236
詹韋爾(Canver)等人(2015)證明了非編碼基因組元件的基於CRISPR-Cas9的功能研究。該等作者開發了聚池的CRISPR-Cas9指導RNA文庫,以進行人類和小鼠BCL11A增強子的原位飽和誘變,揭示了增強子的關鍵特徵。
Figure 112128864-A0101-12-0834-237
蔡徹(Zetsche)等人(2015)報導了Cpf1的表徵,Cpf1係來自新兇手弗朗西絲菌U112的第2類CRISPR核酸酶,具有不同於Cas9的特徵。Cpf1係單一RNA-指導的內切核酸酶,缺乏tracrRNA,使用富含T的原型間隔子相鄰模體,並且經由交錯的DNA雙股斷裂來切割DNA。
Figure 112128864-A0101-12-0834-238
沙姆克(Shmakov)等人(2015)報導了三種不同的第2類CRISPR-Cas系統。兩種系統CRISPR酶(C2c1和C2c3)包含遠遠與Cpf1相關的RuvC樣內切核酸酶結構域。不像Cpf1,C2c1取決於crRNA和 tracrRNA兩者以用於DNA切割。該第三酶(C2c2)包含兩個預測的HEPN RNA酶結構域,並且是tracrRNA獨立的。
Figure 112128864-A0101-12-0835-239
斯萊馬克(Slaymaker)等人(2016)報導了使用結構指導的蛋白質工程化,以改進釀膿鏈球菌Cas9(SpCas9)的特異性。該等作者開發了“增強的特異性”SpCas9(eSpCas9)變體,該等變體保持穩固的中靶切割,具有降低的脫靶效應。
而且,“二聚CRISPR RNA指導的FokI核酸酶用於高度特異性基因組編輯(Dimeric CRISPR RNA-guided FokI nucleases for highly specific genome editing)”,勝達(Shengdar)Q.蔡(Tsai)、尼古拉斯 威肯(Nicolas Wyvekens)、西迪 卡特(Cyd Khayter)、詹尼弗(Jennifer)A.福登(Foden)、維沙爾 撒帕爾(Vishal Thapar)、迪派克 雷安(Deepak Reyon)、馬修(Mathew)J.古德溫(Goodwin)、馬丁(Martin)J.阿裡耶(Aryee)、J.基斯 俊(Keith Joung)《自然生物技術》(Nature Biotechnology)32(6):569-77(2014)涉及二聚RNA指導的FokI核酸酶,其識別延伸序列並且可以高效率地編輯人類細胞中的內源性基因。
關於CRISPR-Cas系統、其組分、及這類組分的遞送(包括方法、材料、遞送賦形劑、載體、粒子、AAV、以及其製造和使用(包括關於量和配製物))的一般資訊,都可用於本發明的實踐中,參考以下:美國專利案號8,697,359、8,771,945、8,795,965、8,865,406、8,871,445、8,889,356、8,889,418、8,895,308、8,906,616、8,932,814、8,945,839、8,993,233和8,999,641;美國專利公開案US 2014-0310830(美國申請案序號14/105,031)、US 2014-0287938 A1(美國申請案序號14/213,991)、US 2014-0273234 A1(美國申請案序號14/293,674)、US2014-0273232 A1(美國申請案序號14/290,575)、US 2014-0273231(美國申請案序號14/259,420)、US 2014-0256046 A1(美國申請案序號14/226,274)、US 2014-0248702 A1(美國申請案序號14/258,458)、US 2014-0242700 A1(美國申請案序號14/222,930)、US 2014-0242699 A1(美國申請案序號14/183,512)、US 2014-0242664 A1(美國申請案序號14/104,990)、US 2014-0234972 A1(美國申請案序號14/183,471)、US 2014-0227787 A1(美國申請案序號14/256,912)、US 2014-0189896 A1(美國申請案序號14/105,035)、US 2014-0186958(美國申請案序號14/105,017)、US 2014-0186919 A1(美國申請案序號14/104,977)、US 2014-0186843 A1(美國申請案序號14/104,900)、US 2014-0179770 A1(美國申請案序號14/104,837)和US 2014-0179006 A1(美國申請案序號14/183,486),US 2014-0170753(美國申請案序號14/183,429);US 2015-0184139(美國申請案序號14/324,960);14/054,414歐洲專利申請EP 2 771 468(EP13818570.7)、EP 2 764 10390(EP13824232.6)、和EP 2 784 162(EP14170383.5);以及PCT專利公開案WO 2014/093661(PCT/US 2013/074743)、WO 2014/093694(PCT/US 2013/074790)、WO 2014/093595(PCT/US 2013/074611)、WO 2014/093718(PCT/US 2013/074825)、WO 2014/093709(PCT/US 2013/074812)、WO 2014/093622(PCT/US 2013/074667)、WO 2014/093635(PCT/US 2013/074691)、WO 2014/093655(PCT/US 2013/074736)、WO 2014/093712(PCT/US 2013/074819)、WO 2014/093701(PCT/US 2013/074800)、WO 2014/018423(PCT/US 2013/051418)、WO 2014/204723(PCT/US 2014/041790)、WO 2014/204724 (PCT/US 2014/041800)、WO 2014/204725(PCT/US 2014/041803)、WO 2014/204726(PCT/US 2014/041804)、WO 2014/204727(PCT/US 2014/041806)、WO 2014/204728(PCT/US 2014/041808)、WO 2014/204729(PCT/US 2014/041809)、WO 2015/089351(PCT/US 2014/069897)、WO 2015/089354(PCT/US 2014/069902)、WO 2015/089364(PCT/US 2014/069925)、WO 2015/089427(PCT/US 2014/070068)、WO 2015/089462(PCT/US 2014/070127)、WO 2015/089419(PCT/US 2014/070057)、WO 2015/089465(PCT/US 2014/070135)、WO 2015/089486(PCT/US 2014/070175)、PCT/US 2015/051691、PCT/US 2015/051830。還參考了美國臨時專利申請61/758,468;61/802,174;61/806,375;61/814,263;61/819,803和61/828,130,分別提交於2013年1月30日;2013年3月15日;2013年3月28日;2013年4月20日;2013年5月6日和2013年5月28日。還參考提交於2013年6月17日的美國臨時專利申請61/836,123。另外參考各自提交於2013年6月17日的美國臨時專利申請61/835,931、61/835,936、61/835,973、61/836,080、61/836,101和61/836,127。進一步參考提交於2013年8月5日的美國臨時專利申請61/862,468和61/862,355;提交於2013年8月28日的61/871,301;提交於2013年9月25日的61/960,777和提交於2013年10月28日的61/961,980。又進一步參考:提交於2014年10月28日的PCT/US 2014/62558,以及美國臨時專利申請系列號:61/915,148、61/915,150、61/915,153、61/915,203、61/915,251、61/915,301、61/915,267、61/915,260、和61/915,397,各自提交於2013年12月12日。提交於2013年1月29日和2013年2月25日的61/757,972和61/768,959;都提交於2014年6月11日的62/010,888和62/010,879;各自提交於2014年6月10日的62/010,329、 62/010,439和62/010,441;各自提交於2014年2月12日的61/939,228和61/939,242;提交於2014年4月15日的61/980,012;提交於2014年8月17日的62/038,358;各自提交於2014年9月25日的62/055,484、62/055,460和62/055,487;以及提交於2014年10月27日的62/069,243。參考提交於2014年6月10日的尤其指定美國的PCT申請,申請號PCT/US 14/41806。參考提交於2014年1月22日的美國臨時專利申請61/930,214。參考提交於2014年6月10日的尤其指定美國的PCT申請,申請號PCT/US 14/41806。
還提及的是:15年6月17日的美國申請62/180,709,保護的指導RNA(PGRNA)(PROTECTED GUIDE RNAS(PGRNAS));14年12月12日提交的美國申請62/091,455,保護的指導RNA(PGRNA)(PROTECTED GUIDE RNAS(PGRNAS));14年12月24日的美國申請62/096,708,保護的指導RNA(PROTECTED GUIDE RNAS(PGRNAS));14年12月12日的美國申請62/091,462,14年12月23日的62/096,324,2015年6月7日的62/180,681,以及2015年10月5日的62/237,496,用於CRISPR轉錄因子的失活指導物(DEAD GUIDES FOR CRISPR TRANSCRIPTION FACTORS);14年12月12日的美國申請62/091,456,以及2015年6月17日的62/180,692,用於CRISPR-CAS系統的護送的和功能化的指導物(ESCORTED AND FUNCTIONALIZED GUIDES FOR CRISPR-CAS SYSTEMS);14年12月12日的美國申請62/091,461,用於關於造血幹細胞(HSC)的基因組編輯的CRISPR-CAS系統和組成物的遞送、使用以及治療應用(DELIVERY,USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS FOR GENOME EDITING AS TO HEMATOPOETIC STEM CELLS(HSCs));14年12月19日的美國申請62/094,903,藉由基因組範圍的插入捕獲定序對雙股斷裂和基因組重排的無偏鑒定(UNBIASED IDENTIFICATION OF DOUBLE-STRAND BREAKS AND GENOMIC REARRANGEMENT BY GENOME-WISE INSERT CAPTURE SEQUENCING);14年12月24日的美國申請62/096,761,用於序列操縱的工程化系統、方法以及優化的酶及指導物支架(ENGINEERING OF SYSTEMS,METHODS AND OPTIMIZED ENZYME AND GUIDE SCAFFOLDS FOR SEQUENCE MANIPULATION);14年12月30日的美國申請62/098,059,2015年6月18日的62/181,641,以及2015年6月18日的62/181,667,RNA-靶向系統;14年12月24日的美國申請62/096,656,以及2015年6月17日的62/181,151,具有或關聯於去穩定化結構域的CRISPR(CRISPR HAVING OR ASSOCIATED WITH DESTABILIZATION DOMAINS);14年12月24日的美國申請62/096,697,具有或關聯於AAV的CRISPR(CRISPR HAVING OR ASSOCIATED WITH AAV);14年12月30日的美國申請62/098,158,工程化CRISPR複合物插入靶向系統(ENGINEERED CRISPR COMPLEX INSERTIONAL TARGETING SYSTEMS);15年4月22日的美國申請62/151,052,用於胞外核外報告的細胞靶向(CELLULAR TARGETING FOR EXTRACELLULAR EXOSOMAL REPORTING);14年9月24日的美國申請62/054,490,使用粒子遞送組分靶向障礙和疾病的CRISPR-CAS系統和組成物的遞送、用途以及治療應用(DELIVERY,USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS FOR TARGETING DISORDERS AND DISEASES USING PARTICLE DELIVERY COMPONENTS);美國申請61/939,154,12-F EB-14,用於用優化的功能性CRISPR-CAS系統進行序列操縱的系統、方法和組成物(SYSTEMS,METHODS AND COMPOSITIONS FOR SEQUENCE MANIPULATION WITH OPTIMIZED FUNCTIONAL CRISPR-CAS SYSTEMS);14年9月25日的美國申請62/055,484,用於用優化的功能性CRISPR-CAS系統進行序列操縱的系統、方法和組成物(SYSTEMS,METHODS AND COMPOSITIONS FOR SEQUENCE MANIPULATION WITH OPTIMIZED FUNCTIONAL CRISPR-CAS SYSTEMS);14年12月4日的美國申請62/087,537,用於用優化的功能性CRISPR-CAS系統進行序列操縱的系統、方法和組成物(SYSTEMS,METHODS AND COMPOSITIONS FOR SEQUENCE MANIPULATION WITH OPTIMIZED FUNCTIONAL CRISPR-CAS SYSTEMS);14年9月24日的美國申請62/054,651,用於對體內多種癌症突變的競爭建模的CRISPR-CAS系統和組成物的遞送、用途以及治療應用(DELIVERY,USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS FOR MODELING COMPETITION OF MULTIPLE CANCER MUTATIONS IN VIVO);14年10月23日的美國申請62/067,886,用於對體內多種癌症突變的競爭建模的CRISPR-CAS系統和組成物的遞送、用途以及治療應用(DELIVERY,USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS FOR MODELING COMPETITION OF MULTIPLE CANCER MUTATIONS IN VIVO);14年9月24日的美國申請62/054,675,以及2015年6月17日的62/181,002,在神經元細胞/組織中CRISPR-CAS系 統和組成物的遞送、用途以及治療應用(DELIVERY,USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS IN NEURONAL CELLS/TISSUES);14年9月24日的美國申請62/054,528,在免疫疾病或障礙中的CRISPR-CAS系統和組成物的遞送、用途以及治療應用(DELIVERY,USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS IN IMMUNE DISEASES OR DISORDERS);14年9月25日的美國申請62/055,454,用於使用細胞穿透肽(CPP)靶向障礙和疾病的CRISPR-CAS系統和組成物的遞送、用途以及治療應用(DELIVERY,USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS FOR TARGETING DISORDERS AND DISEASES USING CELL PENETRATION PEPTIDES(CPP));14年9月25日的美國申請62/055,460,多功能CRISPR複合物和/或優化的酶連接的功能性CRISPR複合物(MULTIFUNCTIONAL-CRISPR COMPLEXES AND/OR OPTIMIZED ENZYME LINKED FUNCTIONAL-CRISPR COMPLEXES);14年12月4日的美國申請62/087,475,以及2015年6月18日的62/181,690,用優化的功能性CRISPR-CAS系統進行功能性篩選(FUNCTIONAL SCREENING WITH OPTIMIZED FUNCTIONAL CRISPR-CAS SYSTEMS);14年9月25日的美國申請62/055,487,用優化的功能性CRISPR-CAS系統進行功能性篩選(FUNCTIONAL SCREENING WITH OPTIMIZED FUNCTIONAL CRISPR-CAS SYSTEMS);14年12月4日的美國申請62/087,546,以及2015年6月18日的62/181,687,多功能CRISPR複合物和/或優化的酶連接的功能性CRISPR複 合物(MULTIFUNCTIONAL CRISPR COMPLEXES AND/OR OPTIMIZED ENZYME LINKED FUNCTIONAL-CRISPR COMPLEXES);以及14年12月30日的美國申請62/098,285,對於腫瘤生長和轉移的CRISPR介導的體內建模以及遺傳篩選(CRISPR MEDIATED IN VIVO MODELING AND GENETIC SCREENING OF TUMOR GROWTH AND METASTASIS)。
提及的是2015年6月18日的美國申請62/181,659,以及2015年8月19日的62/207,318,CAS9異種同源物和變體的系統、方法、酶以及指導物支架的工程化和優化以用於序列操縱(ENGINEERING AND OPTIMIZATION OF SYSTEMS,METHODS,ENZYME AND GUIDE SCAFFOLDS OF CAS9 ORTHOLOGS AND VARIANTS FOR SEQUENCE MANIPULATION)。提及的是2015年6月18日的美國申請62/181,663以及2015年10月22日的62/245,264,新穎的CRISPR酶和系統(NOVEL CRISPR ENZYMES AND SYSTEMS),2015年6月18日的美國申請62/181,675,2015年10月22日的62/285,349,2016年2月17日的62/296,522,以及2016年4月8日的62/320,231,新穎的CRISPR酶以及系統(NOVEL CRISPR ENZYMES AND SYSTEMS),2015年9月24日的美國申請62/232,067,2015年12月18日的美國申請14/975,085,歐洲申請號16150428.7,2015年8月16日的美國申請62/205,733,2015年8月5日的美國申請62/201,542,2015年7月16日的美國申請62/193,507,以及2015年6月18日的美國申請62/181,739,各自標題為新穎的CRISPR酶和系統(NOVEL CRISPR ENZYMES AND SYSTEMS),並且提及2015年10月22日的美國申請62/245,270,新穎的 CRISPR酶和系統(NOVEL CRISPR ENZYMES AND SYSTEMS)。提及的是2014年2月12日的美國申請61/939,256,以及2014年12月12日的WO 2015/089473(PCT/US 2014/070152),各自標題為採用用於序列操縱的新構造的系統、方法以及優化的指導物組成物的工程化(ENGINEERING OF SYSTEMS,METHODS AND OPTIMIZED GUIDE COMPOSITIONS WITH NEW ARCHITECTURES FOR SEQUENCE MANIPULATION)。還提及的是2015年8月15日的PCT/US 2015/045504,2015年6月17日的美國申請62/180,699,以及2014年8月17日的美國申請62/038,358,各自標題為使用CAS9切口酶的基因組編輯(GENOME EDITING USING CAS9 NICKASES)。
該等專利、專利公開和申請的每一者,以及在其中或在它們的審查程式期間引用的所有文獻(“申請引用文獻”)以及在該等申請引用文獻中引用或參考的所有文獻,連同其中提到的或在其中任何文獻中提到並藉由引用結合在其中的針對任何產品的任何說明書、說明、產品規格、和產品表,特此藉由引用併入本文,並且可以在本發明的實踐中採用。所有文獻(例如,該等專利、專利公開和申請以及申請引用文獻)在如同每個單獨文獻被確切地且單獨地指明為藉由引用結合的相同程度上藉由引用併入本文。
此外,提及的是標題為“用於使用粒子遞送組分靶向障礙和疾病的CRISPR-CAS系統和組成物的遞送、用途和治療應用(DELIVERY,USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS FOR TARGETING DISORDERS AND DISEASES USING PARTICLE DELIVERY COMPONENTS)”的PCT申請PCT/US 14/70057,案卷參考47627.99.2060和BI-2013/107(要求來自以下一個或多個或所有美國臨時專利申請的權益:提交於2014年9月24日的62/054,490;提交於2014年6月10日的62/010,441;以及各自提交於2013年12月12日的61/915,118、61/915,215和61/915,148)(“粒子遞送PCT”),將其藉由引用併入本文,關於一種製備含有sgRNA-和-Cas9蛋白的粒子之方法,該方法包括將包含sgRNA和Cas9蛋白(和視情況HDR模板)的混合物與以下混合物混合,該混合物包含表面活性劑、磷脂、生物可降解聚合物、脂蛋白和醇或基本上由其組成或由其組成;以及來自這樣的過程的粒子。例如,其中使Cas9蛋白和sgRNA在適合的溫度(例如,15℃-30℃,例如,20℃-25℃,例如,室溫)下以適合的莫耳比(例如,3:1至1:3或2:1至1:2或1:1)有利地在無菌、無核酸酶緩衝液(例如,1X PBS)中一起混合適合的時間(例如,15-45,如30分鐘)。分開地,粒子組分如或包含:表面活性劑(例如,陽離子脂質(例如,1,2-二油醯基-3-三甲基銨-丙烷(DOTAP)));磷脂(例如,二肉豆蔻磷脂醯膽鹼(DMPC));可生物降解的聚合物(例如,乙二醇聚合物或PEG)、以及脂蛋白,如低密度脂蛋白,例如,膽固醇溶解於醇中,有利的是C1-6烷基醇,如甲醇、乙醇、異丙醇,例如,100%乙醇。將這兩種溶液混合在一起以形成含有Cas9-sgRNA複合物的粒子。因此,在粒子中配製整個複合物之前,可以使sgRNA與該Cas9蛋白預複合。可以製備具有不同莫耳比的不同已知組分的配製物,以促進將核酸遞送到細胞(例如1,2-二油醯基-3-三甲基銨-丙烷(DOTAP)、1,2-二十四醯基-sn-甘油-3-磷酸膽鹼(DMPC)、聚乙二醇(PEG)和膽固醇)。例如,DOTAP: DMPC:PEG:膽固醇莫耳比可以是DOTAP 100,DMPC 0,PEG 0,膽固醇0;或DOTAP 90、DMPC 0、PEG 10、膽固醇0;或DOTAP 90、DMPC 0、PEG 5、膽固醇5。DOTAP 100、DMPC 0、PEG 0、膽固醇0。因此,該申請包括將sgRNA、Cas9蛋白和形成粒子的組分混合;連同來自此類混合的粒子。本發明的方面可以涉及粒子;例如,使用類似於粒子遞送PCT的過程的粒子,例如藉由將如在本發明中的sgRNA和/或Cas9蛋白的混合物和形成粒子的組分混合,例如如在粒子遞送PCT中,以形成粒子;以及來自這樣的混合的粒子(或者,當然,涉及如在本發明中的sgRNA和/或Cas9的其他粒子)。
現在將藉由以下非限制性實例進一步描述本發明。
【實例】
以下實例用來說明本文描述的本發明。應理解的是下文所述的激發研究的科學原理不應解讀為以任何方式限制主題,或者強加任何機械的或其他要求。
科學原理
不希望受本文描述的任何理論束縛,諸位發明人設想了用於修飾釀膿鏈球菌Cas9(SpCas9)的策略,旨在產生示出改進的靶標特異性的修飾的變體SpCas9酶。相同的原理可以應用於任何Cas9異種同源物。這種改進的特異性可以在示出針對非靶標(脫靶)座位的降低活性的變體中實現,與此同時保持適當的針對預期靶座位的活性。在以下描述的測定中的活性涉及核酸酶活性,藉由DNA的切割來表現,如藉由INDEL的形成測量的。這種活性被期望為涉及CRISPR複合物(換言之, 在Cas9酶和指導RNA之間的複合物)結合至DNA上的相關位點的能力。因此,針對非靶位點的活性降低可以被預期為起因於在該位點處CRISPR複合物的降低的結合。示出針對非靶座位的降低的活性的修飾Cas9酶與未修飾的(例如野生型)酶相比可以因此被預期為不太好地結合至非靶位點。尼氏瑪素(Nishimasu)等人(《細胞》(Cell),2014,156(5),第935-49頁)報導了SpCas9變體酶在2.5Å解析率下的晶體結構,該SpCas9變體酶與長度為98個核苷酸的單一指導RNA(sgRNA)以及一段包括長23個核苷酸的靶DNA複合。基於該等結構數據,諸位發明人鑒定了位於RuvC-III和HNH結構域之間的正電荷區域。諸位發明人推斷,在Cas9酶結合至DNA的相關區域時,在正常的沃森-克裡克鹼基配對破壞之後,溝槽可以適應非靶股。Cas9的此區域的正電荷殘基可以藉由與DNA的非靶股的負電荷磷酸二酯骨架相互作用而發揮作用以穩定酶與DNA之間的相互作用。諸位發明人假定,藉由Cas9的正電荷殘基的取代,與非靶股的相互作用可以被破壞。此相互作用的充足的破壞可以保持針對靶位點的適當活性,但降低酶的針對非靶標位點的活性(其將一般被預期為,與靶序列相比,由於一個或多個錯配而與指導序列具有較弱的相互作用)。諸位發明人出人意料地發現Cas9的修飾可以確實降低脫靶活性。還參見圖1,以及本文對其的討論。
另外關於本發明中正電荷殘基的取代破壞了與DNA骨架的相互作用,並且導致酶針對非靶位點的活性降低,同時維持了針對靶位點的適當活性,應提及的是克萊恩斯提夫(Kleinstiver)BP等人。該等作者描述了包含REC1結構域中的突變的SpCas9的三取代變體 (R661A/Q695A/Q926A)和四取代變體(N497A/R661A/Q695A/Q926A)。該等取代涉及被設計為破壞DNA磷酸酯骨架的氫鍵的殘基,並且突變體被報告為具有高的中靶活性和最低的脫靶活性。(參見,克萊恩斯提夫(Kleinstiver)BP等人,不具有可檢測基因組範圍的脫靶效應的高保真CRISPR-Cas9核酸酶(High-fidelity CRISPR-Cas9 nucleases with no detectable genome-wide off-target effects).《自然》(Nature)2016年1月28日;529(7587):490-5.doi:10.1038/nature16526.電子公開於2016年1月6日。
此外,諸位發明人還假定可以進行CRISPR酶的胺基酸殘基的修飾,其在Cas9酶結合至DNA的相關區域時在正常的沃森-克裡克鹼基配對的破壞之後,可以具有增加酶與非靶股之間的相互作用的穩定性的作用。例如,用正電荷胺基酸取代在未修飾的酶中不帶正電荷的胺基酸殘基可以藉由增加該酶的淨正電荷而具有穩定酶與非靶股之間的相互作用的作用。因此,在該酶的相關區域中的更多的淨正電荷將被預期提供與DNA的非靶股的帶負電荷磷酸二酯骨架的更強相互作用。在未修飾酶中不帶正電荷的胺基酸可以是例如帶中性負荷的、帶負電荷的、疏水等的胺基酸。任何此類胺基酸可以用帶正電荷胺基酸取代,這樣實現所需作用。上述功能作用係基於複雜的和互相關聯的靜電和熱力學考慮。因此,應理解的是,可以組合上述功能作用。因此,CRISPR酶可以按一種增強酶針對靶標的活性但還降低針對一種或多種脫靶的活性的方式被修飾。例如,預期的是,可以使得修飾促進中靶活性的增加,同時可以使得修飾降低脫靶活性。因此,可以實現協同效應。
應當理解的是上述功能效應的任一種可以藉由修飾前述溝槽內的胺基酸以及藉由修飾該溝槽的鄰近處或外部的胺基酸來實現。
實例1-材料和方法。
SpCas9突變體的產生
雖然這從本揭露的完整背景中是明顯的,縮寫“SpCas9”係指釀膿鏈球菌Cas9,並且縮寫“SaCas9”係指金黃色葡萄球菌Cas9。修飾的SpCas9和SaCas9變體,例如修飾的丙胺酸變體係使用已知的技術藉由基於PCR的誘變來創建的。(其他技術可以包括製備編碼Cas9的核酸分子,但針對一個或多個蛋白突變或一個或多個修飾的一個或多個對應密碼子發生改變,從而使修飾的或突變的Cas9表現,例如經由載體表現系統,例如細菌表現系統或病毒表現載體系統。然後如此表現的經修飾或突變的Cas9可以易於純化。本發明的改性的或突變的Cas9可以用於CRISPR-Cas系統中和CRISPR-Cas系統的任何應用中;並且有利地具有降低的或幾乎沒有或本質上沒有或沒有脫靶效應和/或增加的中靶效應的優勢。因此,本發明的Cas9或具有本發明Cas9的本發明的CRISPR-Cas系統可以經由遞送系統被遞送,該遞送系統可以是一種或多種載體,包括如本文討論的。)
用於測試修飾的Cas9活性的系統
藉由將編碼突變體Cas9的質粒和編碼sgRNA(僅中靶)的質粒共轉染到HEK293T或HEK293FT細胞中來測試修飾的Cas9酶。使用Lipofectamine 2000對匯合率為90%-95%的細胞進行轉染,使細胞在37℃和5% CO2下生長持續大約72h下生長持續大約72h,並且收穫。將中靶和 脫靶基因組座位進行PCR擴增,並且使用新一代定序(NGS)進行分析。從定序數據計算對於中靶和脫靶座位的Indel%。針對表A中示出的基因組座位測試SpCas9突變體。SaCas9突變體係使用EMX101指導物和OT1至OT3藉由NGS來測試,根據蘭(Ran)等人2015。沒有進行生物化學或SURVEYOR分析(所有數據來自NGS;參見西迪-陳(Sidi-Chen),“在腫瘤生長和轉移的小鼠模型中基因組範圍的CRISPR篩選(Genome-wide CRISPR Screen in a Mouse Model of Tumor Growth and Metastasis)”,《細胞》(Cell)160(6):1246-1260,DOI:http://dx.doi.org/10.1016/j.cell.2015.02.038,2015年3月12日)。
Indel分析
進行藉由靶向深度定序的Indel分析,並且如前所述來分析(徐(Hsu),P.D.等人(2013)RNA指導的Cas9核酸酶的DNA靶向特異性(DNA targeting specificity of RNA-guided Cas9 nucleases).自然生物技術(Nat.Biotechnol.) 31,827-832)。大約轉染後3天收穫細胞。使用QuickExtract DNA提取套組(Epicentre),藉由將沈澱的細胞重懸浮於QuickExtract(80μL/24-孔,或20μL/96-孔)中、隨後在65℃培養15min、68℃持續15min以及98℃持續10-15min,來提取基因組DNA。用於NGS分析的PCR片段在兩步PCR反應中產生。簡言之,使用用於第二輪擴增的引物與PCR處理(handle)來擴增感興趣基因組區域(表2),隨後為融合PCR方法以將億明達(Illumina)P5適配子以及樣品特異性條碼附接至第一輪PCR產物上。
實例2-單一SpCas9突變體的初始分析(EMX1和VEGFA靶序列)。
產生SpCas9的49個初始單一點突變並測試INDEL形成。在此實例中的靶序列係EMX1和VEGFA基因的序列。靶序列和脫靶序列兩者示於下表A中,具有PAM序列。在脫靶序列中,如在靶序列之間的錯配以粗體和加底線示出。結果示於圖2A和2B中。
與野生型酶相比以下突變體示出針對脫靶位點的降低的活性(參見圖2A和2B)。
R63A
H415A
H447A
R778A
R780A
Q807A
K810A
R832A
K848A
K855A
K968A
R976A
H982A
K1000A
K1003A
K1047A
R1060A
K1107A
R1114A
K1118A
K1200A
實例3-單一SpCas9突變體的進一步分析
在具有第三指導序列和另外的脫靶座位的情況下,將在實例2中鑒定的若干單一點突變修飾的SpCas9酶進一步針對INDEL形成進行測試。靶序列和脫靶序列示於下表A中,具有PAM序列。在脫靶序列中,如在靶序列之間的錯配以粗體加底線示出。結果示於圖3中。在此實例中測試的經修飾的SpCas9酶係:
R780A
K810A
K848A
K855A
R976A
H982A
K1003A
R1060A
如在圖3中所示,與未修飾的(野生型)酶(SpCas9)相比,所有八種修飾的酶示出針對脫靶位點的降低的活性。
實例4-單一SpCas9突變體的進一步分析(VEGFA1靶序列)。
在具有第二不同靶序列的情況下,將若干單一點突變修飾的SpCas9酶(包括實例2中所述的突變體)針對INDEL形成進行測試,在這種情況下VEGFA1係VEGFA基因的序列。在此實例中測試的經修飾的SpCas9酶係:
R780A
K810A
K848A
K855A
R976A
H982A
K1003A
R1060A
H1240A
H1311A
靶序列和脫靶序列示於下表A中,具有PAM序列。在脫靶序列中,如在靶序列之間的錯配以粗體示出。結果示於圖3中。
實例5-組合SpCas9突變體的分析
產生二十四個雙點突變和14個三點突變修飾的SpCas9酶,並且用兩個不同靶序列測試INDEL形成,在這種情況下這兩個不同靶序列為EMX1和VEGFA基因的序列(VEGFA3係VEGFA中的序列)。靶序列和脫靶序列示於下表A中,具有PAM序列。在脫靶序列中,如在靶序列之間的錯配以粗體示出。所測試的突變體和結果示於圖4和圖5中;在圖4和圖5的星號指示目前認為有利的實施方式。如圖4和圖5中所示,相比於野生酶,所有突變體示出針對OT 46、OT4、和OT18脫靶的顯著降低的活性。若干組合突變體另外示出針對所有四種脫靶的降低的活性,同時保持與WT類似的中靶活性;該等係:
Figure 112128864-A0101-12-0853-57
表A:SpCas9指導物(用於SpCas9的靶標和脫靶座位; 紅色指示脫靶序列錯配;豎直線|指示SpCas9切割位點;脫靶序列經由本發 明的突變/修飾而被拒絕):
表B: SpCas9報告的突變(藉由引用結合的引用文獻;保留明確地否認該等突變中的單獨任一個的權利,並且注意已知突變中沒有一種如何被揭露或提示為與未修飾的酶相比獲得降低的脫靶效應和/或增加的修飾一個或多個靶座位的能力,其在安德斯(Anders)等人中提及:K1107A、KES→GG以及KES→KG可以賦予相對於在sgRNA的位置1和2處的錯配的特異性,但是係以適度降低的中靶切割效率為代價,並且他們也未結出對特異性的更詳細的表徵,這樣使得該等已知的突變體未揭露或提示本發明的一般主張仍然係有效的;並且,應提及的是本發明可以包括在下表中的任何突變/修飾結合賦予降低的脫靶效應的修飾/突變,只要以下突變/修飾中的一種或多種的添加不會不利地影響本發明中實現的降低的脫靶和/或增加的修飾一個或多個靶座位作用的能力):
Figure 112128864-A0101-12-0856-61
Figure 112128864-A0101-12-0858-63
Figure 112128864-A0101-12-0859-64
實例6-另外的SpCas9突變體的分析(VEGFA3靶序列)。
產生若干另外的單一點突變修飾的SpCas9酶,並且在靶序列VEGFA3為VEGFA基因的序列的情況下測試INDEL形成。在此實例中測試的經修飾的SpCas9酶如下示出:
Figure 112128864-A0101-12-0859-65
如圖2中所示,相比於野生型酶,若干個突變體示出針對OT1和OT4脫靶兩者的顯著降低的活性。若干突變體另外示出與野生型酶相比,針對所有三種脫靶的活性的降低,該等係
Figure 112128864-A0101-12-0859-66
Figure 112128864-A0101-12-0860-67
實例7-SaCas9突變體的分析(EMX101靶序列)。
產生若干單一點突變修飾的SaCas9酶,並且在靶序列係EMX101基因的序列的情況下測試INDEL形成。靶序列和脫靶序列示於下表C中,具有PAM序列。在脫靶序列中,如在靶序列之間的錯配以粗體和加底線示出。在此實例中測試的經修飾的SaCas9酶係丙胺酸突變體,如下示出:
K518A
K523A
K525A
H557A
R561A
K572A
R686A
K687A
K692A
R694A
H700A
K751A
如圖6中所示,相比於野生型酶,若干個突變體示出針對OT2和OT3脫靶兩者的顯著降低的活性。若干突變體另外示出與野生型酶相比,針對所有三種脫靶的活性的降低,該等係
K523A
K525A
R561A
K572A
R694A
H700A
表C: 用於驗證SaCas9突變的指導物的序列資訊,包括PAM(紅色指示脫靶序列錯配;脫靶序列經由本發明的突變/修飾而被拒絕)
圖7提供關於以下本文揭露的SaCas9突變體的另外的數據。
Figure 112128864-A0101-12-0862-70
突變體R245A、R480A、R499A、R650A和R654A在脫靶效應的降低方面表現良好,其中尤其R480A、R499A和R245A表現良好。
實例8-修飾的Cas9酶的列表。
對於SpCas9,目前,在前述實例中包括的本文列出的單一和組合突變體被認為是有利的,因為具有證明的較佳特異性增強。SpCas9和SaCas9突變體,包括測試的那些以及以其他方式在本揭露之內的那些,列於下表1-7中。
表1-SpCas9四突變體的列表
Figure 112128864-A0101-12-0862-71
表2-SpCas9單突變體的列表
Figure 112128864-A0101-12-0863-72
表3-SpCas9雙突變體和三突變體的列表
Figure 112128864-A0101-12-0863-73
Figure 112128864-A0101-12-0864-74
表4-SaCas9單突變體的列表
Figure 112128864-A0101-12-0864-75
表5-SaCas9單突變體的列表
Figure 112128864-A0101-12-0864-76
Figure 112128864-A0101-12-0865-77
SpCas9突變體的代表性實例列於下表6中。
表6-SpCas9單突變體的列表
Figure 112128864-A0101-12-0865-78
下表7提供了在本揭露之內的示例性突變體,包括示例的那些。
表7:在本揭露之內的代表性突變體單突變體
Figure 112128864-A0101-12-0866-79
Figure 112128864-A0101-12-0867-80
Figure 112128864-A0101-12-0868-81
實例9-Cas9的修飾用於增強的中靶活性。
最初,諸位發明人對不帶電荷的位於SpCas9的RuvC-III和HNH結構域之間的溝槽中的胺基酸進行修飾。待修飾的胺基酸包括具有不帶電荷的側鏈的胺基酸,包括絲胺酸、蘇胺酸、天冬醯胺和穀胺醯 胺。將選擇的胺基酸改變為帶正電荷的胺基酸,例如精胺酸或賴胺酸。藉由如上所述的新一代定序來評估SpCas9的這種單一胺基酸改變對在靶座位處INDEL形成的作用。選擇與未修飾的酶相比具有增加的/增強的中靶活性的較佳的突變。諸位發明人評估如上所述的雙突變體和三突變體。選擇具有增強的中靶活性的特別較佳的突變。
諸位發明人以與針對SpCas9所述的相同方式,評估SaCas9中的此類突變。選擇具有增強的中靶活性的特別較佳的突變。
諸位發明人擴張了對不帶電荷的胺基酸的修飾的範圍,該等不帶電荷的胺基酸位於SpCas9的RuvC-III和HNH結構域之間的溝槽附近或外部。再次,藉由如上所述的SURVEYOR分析評估該等改變對靶座位處的INDEL形成的作用。選擇與未修飾的酶相比具有增加的/增強的中靶活性的較佳的突變。SaCas9中進行類似的分析。
諸位發明人將證明增強的中靶活性的SpCas9突變與證明降低的脫靶活性的突變組合。再次,藉由如上所述的SURVEYOR分析評估該等改變對靶座位處的INDEL形成的作用。選擇與未修飾的酶相比具有增加/增強的中靶活性和降低的脫靶活性的特別較佳的突變。在SpCas9中進行類似的分析。
實例10-SpCas9突變體的分析(多種靶序列)。
將三種突變體K855A(單一突變)、和TM14和TM15(兩者為三突變體),在靶序列為EMX101、EMX1.1、EMX1.2、EMX1.3、EMX1.8、EMX1.10、DNMT1.1、DNMT1.2、DNMT1.4、DNMT1.7、VEGFA4、VEGFA5、和VEGFA3的情況下針對INDEL形成進行測試。如 在圖10中所示,所有三種突變體示出針對靶標的活性和針對OT4的低脫靶活性。
將一擴大組的單突變體、雙突變體、和三突變體,在靶序列為EMX101、EMX1.1、EMX1.2、EMX1.3、EMX1.8、EMX1.10、DNMT1.1、DNMT1.2、DNMT1.4、DNMT1.7、VEGFA4、VEGFA5、和VEGFA3的情況下針對INDEL形成進行測試。該等突變體包括E779L、R780A、K810A、K848A、K855A、R976A、H982A、DM11、DM17、DM19、DM20、DM23、DM24、DM25、DM35、DM40、TM14、TM15、和TM16。圖11概述了針對靶標的活性和針對OT4的脫靶活性。總的來說,針對評估的幾乎所有的基因組脫靶、以及針對一組廣泛的錯配指導物存在活性的降低。
實例11-SpCas9突變體的分析(VEGFA3靶標和脫靶序列)。
產生若干突變修飾的SpCas9酶,並且在靶序列係VEGFA3基因的序列的情況下測試INDEL形成。在此實例中測試的經修飾的SpCas9酶包括:
R780A
K848A
K1000A
K848A R1060A
R780A R1114A
H982A K1003A R1060A
R63A K848A R1060A
R63A K855A R1060A E610G
K1107A
T13I R63A K810A
R63A K855A
R63A H982A
G12D R63A R1060A
H415A K848A
H415A K848A
R780A R1114A
K848A K1107A
K848A E1108A
S1109A
R63A E610G K855A R1060A
R63A K848A R1060A
如在圖12和圖13中所示,與野生酶相比,若干突變體針對三種脫靶OT1、OT4、和OT18中的一個或多個示出顯著降低的活性。若干突變體另外示出與野生型酶相比,針對所有三種脫靶的活性的降低。該等包括:
R780A R1114A
H982A K1003A K1129E
R63A K855A R1060A E610G
K1107A
R63A K855A
R63A H982A
K848A K1107A
R63A E610G K855A R1060A
R63A K848A R1060A
實例12-SpCas9突變體的分析(EMX1.3靶標和脫靶序列)。
將若干突變修飾的SpCas9酶在靶序列為EMX1.3的序列的情況下針對INDEL形成進行測試。在此實例中測試的經修飾的SpCas9酶包括:
N14K
E779L
E809K
L813R
S845K
L847R
D849A
D861K
E977K
I978K
N979L
N980K
如在圖14中所示,某些突變體示出高的中靶活性,以及在該等之中,相對於脫靶序列OT14、OT23、OT35、OT46、和OT53的特異性的區別。突變體中的某些證明了比野生型更高的特異性,其他則證明了針對脫靶序列的高活性。
實例13-SpCas9突變體的分析(EMX1.3靶標)。
將若干突變修飾的SpCas9酶在靶序列為EMX1.3的序列的情況下測試用錯配指導物形成INDEL。在此實例中測試的三種經修飾的SpCas9酶包括:
K855A
K810A、K1003A、R1060A
K848A、K1003A、R1060A
結果示於圖15中。
實例14-增強的Cas9突變體具有高的活性和特異性
與野生型(WT)SpCas9相比,29個點突變體中的六個將脫靶活性降 低至少10倍,同時保持中靶切割效率,並且6個其他突變體將特異性改進2至5倍。當對第二座位VEGFA(1)進行測試時,該等突變體還展現出改進的特異性(圖15D)。雖然當靶向EMX1(1)和VEGFA(1)時一些點突變體比WT SpCas9具有更大的特異性,脫靶indel仍然係可檢測的(約0.1%)(圖15D)。為了進一步改進特異性,申請人使用在初始篩選中鑒定的前幾個點突變體進行組合誘變。35個組合突變體中的八個保持野生型中靶活性,並且展現出在EMX1(1)OT1、VEGFA(1)OT1、和VEGFA(2)OT2處的不可檢測的脫靶indel水平(圖15E)。為了確保所觀察到的特異性增加不是由於降低的中靶活性造成的,申請人使用前16個突變體測量了在10個靶座位處的中靶indel形成(圖15F),如藉由中靶和脫靶活性的組合確定的。申請人觀察到針對三種突變體的高效率和特異性:SpCas9(K855A)、SpCas9(K810A/K1003A/R1060A)(還稱為eSpCas9(1.0))、以及SpCas9(K848A/K1003A/R1060A)(還稱為eSpCas9(1.1))。這三個變體被選擇用於進一步分析。
為了評估SpCas9(K855A)、eSpCas9(1.0)、以及eSpCas9(1.1)是否廣泛地保持有效的核酸酶活性,申請人測量了在24個靶位點(跨越10個不同的基因組座位)處的中靶indel產生(圖16A)。在多數靶位點中,所有三種突變體產生與WT SpCas9類似的indel水平(圖16B)。為了測試特異性的改進是否可以歸因於降低的Cas9表現,申請人進行了針對SpCas9的西方墨點,並且發現所有三種突變體等同地表現或以比WT SpCas9更高的水平表現(圖16C)。這證明特異性的改進不是由於降低的蛋白質表現水平。
申請人然後比較了三種突變體與WT SpCas9(具有截短指導序列(針對EMX1(1)為18nt並且針對VEGFA(1)為17nt))的特異性,已經顯示該等突變體減少脫靶indel形成。所有三種突變體減少了在評估的所有脫靶位點處的切割。並且,eSpCas9(1.0)和eSpCas9(1.1)消除了24個該等位點中的20個。相比之下,具有截短指導物的WT SpCas9消除了24個位點中的14個,但與具有全長指導物的WT SpCas9相比還增加了在5個位點處的脫靶活性。
為了評估SpCas9(K855A)、eCas9(1.0)、和eCas9(1.1)對於錯配靶位點的耐受性,申請人系統性地突變VEGFA(1)指導序列以引入不同位置處的單一和雙鹼基錯配(圖17A-C)。相比於WT SpCas9,使用錯配指導物,所有三種突變體均誘導較低水平的indel。值得注意的是,eSpCas9(1.0)和eSpCas9(1.1)誘導更低的indel水平,甚至在單一鹼基錯配位於7-12bp種子序列外部的情況下。鑒於申請人未觀察到eSpCas9(1.0)和eSpCas9(1.1)之間在特異性方面的任何區別,SpCas9(K855A)和eSpCas9(1.1)被選擇用於進一步的基於中靶效率的分析。
使用跨基因組定量DNA雙股斷裂(DSB)的BLESS(直接原位斷裂標記、鏈黴親和素富集以及新一代定序)來評估SpCas9(K855A)和eSpCas9(1.1)的基因組範圍的編輯特異性(圖17A)。在轉染後大約24h收穫細胞,並且進行BLESS。簡言之,將總計1千萬個細胞固定用於核分離和透化作用,並且然後用蛋白酶K在37℃處理4min,之後用PMSF失活。將脫蛋白的核DSB用200mM的退火近端接頭標記過夜。在蛋白酶K消化標記的核之後,將染色質用26G針進行機械剪切,之 後進行聲處理(BioRuptor,高檔上20分鐘,50%占空比)。將總共20μg的剪切染色質捕獲於鏈黴親和素珠粒上,洗滌、並且連接至200mM的遠端接頭。然後用I-SceI在37℃消化4h將接頭髮夾切割下,並且產品經PCR富集18個循環,之後用TruSeq Nano LT套組(億明達)進行文庫製備。對於陰性對照,將細胞用Lipofectamine 2000和pUC19 DNA模擬轉染,並且藉由測定平行處理。
如前所述的(蘭(Ran)等人,《自然》(Nature)2015)計算DSB得分以將背景DSB從真實Cas9-誘導的DSB分離,並且基於DSB得分對座位的分選揭示了前幾個脫靶位點,如先前已經針對該等sgRNA靶標鑒定的。為了提供超越該等前幾個脫靶的另外的檢測能力,我們從先前的Cas9-BLESS數據發現同源性檢索演算法可以有助於另外鑒定真實的Cas9誘導的DSB。同源性檢索演算法檢索在DSB簇中間任一側上的基因組50nt的區域內的最佳匹配的指導序列,所述DSB簇係在針對所有NGG和NAG PAM序列的BLESS中鑒定。採用以下權重來計算基於同源性的得分:在sgRNA和基因組序列得分+3之間的匹配,錯配係-1,而在sgRNA和基因組序列之間的插入或缺失花費-5。因此,具有全20bp指導物+PAM的中靶序列將得69分。將針對DSB簇的最終同源性得分鑒定為來自所有可能序列的分數的最大值。使用該等權重,我們憑經驗發現當>50的閾值用於同源性得分時,真實脫靶(對此,indel係基於靶向的深度定序被鑒定)以及背景DSB被完全分開。針對前200個BLESS DSB座位使用這種同源性指標允許我們進一步從背景DSB鑒定脫靶。
申請人針對兩種突變體測定EMX1(1)和VEGFA(1)靶標,並且將該等結果與WT SpCas9進行比較。(圖17B)。SpCas9(K855A)和eSpCas9(1.1)兩者均展現出在基因組範圍上脫靶切割的減少,並且未產生任何新的脫靶位點(圖17C-D)。
實例15-Cas9靶向和核酸酶活性的機制
在Cas9結合非靶DNA股的強度超過DNA重雜交的力時脫靶切割發生。與這種模型一致,被設計為弱化Cas9和非互補DNA股之間的相互作用的突變導致特異性方面的實質性改進。該模型還表明,相反地,特異性可以藉由加強Cas9與非靶股之間的相互作用而降低。與這種模型一致,產生兩種突變體,S845K和L847R,其各自展現出降低的特異性(圖24)。
實例16-金黃色葡萄球菌Cas9(SaCas9)的特異性
還可以將類似策略應用於其他Cas9家族蛋白。改進的特異性形式的金黃色葡萄球菌Cas9(SaCas9)類似於eSpCas9而產生。在RuvC和HNH結構域之間的溝槽中的殘基的單胺基酸突變體和雙胺基酸突變體被針對降低的脫靶切割而篩選。將具有改進的特異性的突變體組合以使得SaCas9的變體保持在EMX位點7處的中靶切割,並且具有顯著降低的脫靶切割。(圖25)SaCas9的晶體結構顯示在HNH和RuvC結構域之間的溝槽被突變為改造核酸酶為具有改進的特異性。
實例17-HBG1的活化
將spCas9或spCas9突變體與不同指導RNA的複合物針對 HBG1的活化進行測試。圖31示出藉由包含具有缺陷核酸酶活性的Cas9分子(例如dCas9,R780A/K810A,和R780A/K855A;還參見圖4)的複合物來活化,或者藉由核酸酶組分Cas9(例如,未突變的spCas9(px165),R780A,K810A,或K848A)與縮短的(即“15bp”)指導RNA的複合物來活化。在用所有三種測試的指導物證明活化中突變體R780A係特別值得注意的。
實例18-CRISPR-Cas9組分的粒子介導的向造血幹細胞(HSC)中的遞送
申請人已經證明Cas9可以經由粒子遞送至細胞。許多核治療劑可需要一種或多種sgRNA和Cas9核酸酶兩者的同時遞送。因此,申請人證明了將修飾的Cas9酶和sgRNA的複合物以此方式遞送的能力。
修飾的Cas9酶係藉由經由粒子與一種或多種指導RNA共遞送至細胞中來測試。以1:1莫耳比將靶向EMX1基因的sgRNA與eSpCas9(1.1)(K848A,K1003A,R1060A)在室溫下在無菌無核酸酶的1X PBS中混合30分鐘。對照係將相同的sgRNA與SpCas9混合。分開地,將DOTAP、DMPC、PEG、以及膽固醇溶解於100%乙醇中。將這兩種溶液混合在一起以形成含有Cas9-sgRNA複合物的粒子。在該等粒子形成之後,將96孔板中的HSC用15ug Cas9蛋白每孔進行轉染。在轉染後三天,收穫HSC,並且使用BLESS和藉由同源性檢索演算法鑒定的脫靶來評估基因組範圍的編輯特異性。對在EMX1座位處的中靶插入和缺失(indel)的數目以及在多個脫靶位點處的indel進行定量。eSpCas9(1.1)展現出在基因組範圍上脫靶切割的減少並且沒有新脫靶位點。
實例19:CRISPR-Cas9組分的粒子介導的向造血幹細胞(HSC)中的遞送以及HBB的修復。
靶向在β-球蛋白(HBB)基因中的通常GAG->GTG點突變的任一側上的序列的兩種sgRNA與eSpCas9(1.1)(K848A,K1003A,R1060A)以1:1(sgRNA對酶)莫耳比在室溫下在無菌無核酸酶的1X PBS中混合30分鐘。對照係將相同的sgRNA與SpCas9混合。分開地,將DOTAP、DMPC、PEG、以及膽固醇溶解於100%乙醇中。將兩種溶液和用於校正GAG->GTG點突變的模板核酸混合在一起,以形成包含Cas9-sgRNA複合物和模板的粒子。在該等粒子形成之後,將96孔板中的HSC用15ug Cas9蛋白每孔進行轉染。在轉染後三天,收穫HSC並且針對GAG->GTG點突變的修復對其進行測試。然後使用BLESS和藉由同源性檢索演算法鑒定的脫靶來針對基因組範圍的編輯特異性評估校正的細胞。量化在多個脫靶位點處的indel。eSpCas9(1.1)展現出在基因組範圍上脫靶切割的減少並且沒有新脫靶位點。
Figure 112128864-A0101-12-0879-241
Figure 112128864-A0101-12-0880-83
Figure 112128864-A0101-12-0881-84
Figure 112128864-A0101-12-0882-85
Figure 112128864-A0101-12-0883-86
指導序列和NGS引物的表格
Figure 112128864-A0101-12-0884-87
野生型SpCas9
Figure 112128864-A0101-12-0888-91
Figure 112128864-A0101-12-0889-92
Figure 112128864-A0101-12-0890-93
Figure 112128864-A0101-12-0891-94
>K855A
Figure 112128864-A0101-12-0891-95
Figure 112128864-A0101-12-0892-96
Figure 112128864-A0101-12-0893-97
Figure 112128864-A0101-12-0894-98
Figure 112128864-A0101-12-0895-99
eSpCas9(1.0)
Figure 112128864-A0101-12-0895-101
Figure 112128864-A0101-12-0896-102
Figure 112128864-A0101-12-0897-103
Figure 112128864-A0101-12-0898-104
Figure 112128864-A0101-12-0899-105
eSpCas9(1.1)
Figure 112128864-A0101-12-0899-107
Figure 112128864-A0101-12-0900-108
Figure 112128864-A0101-12-0901-109
Figure 112128864-A0101-12-0902-110
Figure 112128864-A0101-12-0903-111
***
雖然如上詳細描述了本發明的較佳的實施方式,應理解上述段落定義的本發明並不局限於上述說明書中的具體細節,原因係其許多明顯變化係可能的而並不背離本發明的精神或範圍。
本發明的新穎特徵在所附申請專利範圍中具體提出。藉由參考提出說明性實施方式的以下詳細說明,將獲得對本發明的特徵和優點的更好理解,在該等實施方式中利用了本發明的原理,並且在該等附圖中:
圖1A-1B提供了示意圖概述,對其應理解一位或多位申請人/發明人不必受本文或在任何具體圖(包括圖1)中列出的任何具體理論的束縛。該圖討論了結合至非靶向的gDNA股的帶正電的殘基的突變,由此改進特異性。示意性概述表中的數據如下並且是就SpCas9的突變而言的:
Figure 112128864-A0101-12-0057-265
參考SpCas9的編號,圖1A展示了沿著非靶向股溝槽分佈的改進特異性的丙胺酸突變,例如Arg780、Lys810、Lys855、Lys848、Lys1003、Arg1060、Arg976、His982。不希望受任何一種具體理論的束縛,提議的 機制係核酸酶活性係無活性的,直到非靶向的DNA股在空間上觸發HNH構象變化;結合到HNH與RuvC之間的溝槽的非靶向的股取決於RNA:DNA配對;突變該溝槽中的DNA結合殘基對適當的RNA:DNA配對提出了更多能量需求(圖1B)。使用本文的(包括圖1中的)信息,熟習該項技術者可以容易地製備展現出改進的或降低的脫靶效應的其他Cas9(例如,不同於SpCas9)的突變體。例如,本文引用的文獻提供了關於本文示例的SpCas9和SaCas9的眾多異種同源物的資訊。從該資訊(包括那些其他Cas9的序列資訊),熟習該項技術者可以藉由本揭露的資訊容易地製備在除本文示例的SpCas9和SaCas9之外的Cas9異種同源物中具有減少的脫靶效應的類似突變體。另外,本文的文獻提供了關於Cas9(例如,SpCas9)的晶體結構資訊;並且可以容易地在晶體結構之間進行結構比較,例如在SpCas9的晶體結構與其異種同源物的晶體結構之間,以便在不進行過度實驗的情況下同樣容易地獲得在除SpCas9之外的Cas9異種同源物中具有減少的脫靶效應的類似突變體。因此,本發明廣泛適用於不同Cas9異種同源物中的一種或多種修飾或一個或多個突變,以減少脫靶效應,包括但不限於SpCas9和SaCas9。如本文進一步討論的,可以容易地實現對以上描述的Cas9酶的另外的或進一步的修飾,由此與未修飾的酶相比,該CRISPR複合物中的酶具有增加的修飾一個或多個靶座位的能力。
圖2A示出了經修飾的SpCas9酶的活性,如藉由% INDEL形成所測量的。描繪了SpCas9的49種點突變體。EMX1.3的靶序列係EMX1基因的序列並且將活性與相關脫靶序列(OT 46)進行比較。
圖2B示出了經修飾的SpCas9酶的活性,如藉由% INDEL形成所測量的。描繪了SpCas9的49種點突變體。靶序列係VEGFA基因的序列並且將活性與兩個相關脫靶序列(OT 1和OT 2)進行比較。
圖2C示出了經修飾的SpCas9酶的活性,如藉由% INDEL形成所測量的。靶序列係VEGFA基因的序列並且將活性與三個相關脫靶序列(OT 1、OT 4和OT 18)進行比較。
圖3示出了經修飾的SpCas9酶的活性,如藉由% INDEL形成所測量的。描繪了相對於脫靶序列展示出特異性的點突變體。靶序列係EMX1和VEGFA基因的序列並且將活性與九個相關脫靶序列進行比較。
圖4A示出了經修飾的SpCas9酶的活性,如藉由% INDEL形成所測量的。描繪了SpCas9的雙突變體。靶序列係EMX1基因的序列並且將活性與兩個相關脫靶序列進行比較。
圖4B示出了經修飾的SpCas9酶的活性,如藉由% INDEL形成所測量的。描繪了SpCas9的雙突變體。靶序列係VEGFA基因的序列並且將活性與三個相關脫靶序列進行比較。
圖5示出了經修飾的SpCas9酶的活性,如藉由% INDEL形成所測量的。描繪了SpCas9的14種三突變體。靶序列係EMX1和VEGFA基因的序列並且將活性與四個相關脫靶序列(OT 46、OT 1、OT 4和OT 18)進行比較。
圖6示出了經修飾的SaCas9酶的活性,如藉由% INDEL形 成所測量的。靶序列EMX101係EMX1基因的序列並且將活性與三個相關脫靶序列(OT1、OT2和OT3)進行比較。
圖7示出了經修飾的SaCas9酶的活性,如藉由% INDEL形成所測量的。EMX101的靶序列係EMX1的序列並且將活性與相關脫靶序列(OT3)進行比較。
圖8A-8D示出了Cas基因的系統發生樹;藉由本文的傳授和本領域的知識,所示例的SpCas9和SaCas9的一個或多個突變或一種或多種修飾可以應用於其他Cas9。
圖9A-9F示出了揭示五個Cas9家族的系統發生分析,這五個家族包括三組大的Cas9(約1400個胺基酸)和兩組小的Cas9(約1100個胺基酸);藉由本文的傳授和本領域的知識,所示例的SpCas9和SaCas9的一個或多個突變或一種或多種修飾可以應用於其他Cas9(並且因此,跨圖9的Cas9以及Cas9家族和組,本發明包括如本文所示例的就SpCas9和SaCas9而言的一種或多種修飾或一個或多個突變)。
圖10A-10D示出了經修飾的SpCas9酶的活性,如藉由% INDEL形成所測量的。圖10A-C示出了靶序列EMX101、EMX1.1、EMX1.2、EMX1.3、EMX1.8、EMX1.10、DNMT1.1、DNMT1.2、DNMT1.4、DNMT1.7、VEGFA4、VEGFA5、和VEGFA3的活性。圖10D示出了與脫靶序列OT4相比的VEGFA3活性。
圖11A-11D示出了經修飾的SpCas9酶的活性,如藉由% INDEL形成所測量的。圖11A-C示出了靶序列EMX101、EMX1.1、EMX1.2、EMX1.3、EMX1.8、EMX1.10、DNMT1.1、DNMT1.2、DNMT1.4、 DNMT1.7、VEGFA4、VEGFA5、和VEGFA3的活性。圖11D示出了與脫靶序列OT4相比的VEGFA3活性。
圖12示出了經修飾的SpCas9酶的活性,如藉由% INDEL形成所測量的。靶序列係VEGFA3並且將活性與四個相關脫靶序列(OT1、OT2、OT4和OT18)進行比較。
圖13示出了經修飾的SpCas9酶的活性,如藉由% INDEL形成所測量的。靶序列係VEGFA3並且將活性與四個相關脫靶序列(OT1、OT2、OT4和OT18)進行比較。
圖14示出了經修飾的SpCas9酶的活性,如藉由% INDEL形成所測量的。描繪了SpCas9的14種點突變體。靶序列係EMX1.3並且將活性與五個相關脫靶序列(OT14、OT23、OE35、OT46和OT53)進行比較。
圖15A-15F示出了SpCas9的結構方面和改進的特異性。圖A係靶標解旋模型。RuvC(水鴨色)與HNH(品紅色)結構域之間的nt-溝槽藉由與非互補股的非特異性DNA相互作用而使DNA解旋穩定化。RNA:cDNA和Cas9:ncDNA相互作用驅動DNA解旋(頂部箭頭)與cDNA:ncDNA再雜交(底部箭頭)的競爭。圖B:SpCas9(PDB ID 4UN3)的結構,示出了位於HNH(品紅色)與RuvC(水鴨色)結構域之間的nt-溝槽。將非靶標DNA股(紅色)手動地建模為nt-溝槽(插圖)。圖C:針對特異性改進,對丙胺酸點突變體的篩選。圖D:在另外的脫靶座位處對靠前的點突變體的評估。將靠前的五種賦予特異性的突變體以紅色突出顯示。圖E:與單點突變體相比,組合突變體改進特異性。eSpCas9(1.0) 和eSpCas9(1.1)以紅色突出顯示。圖F:對10個靶座位處的靠前的點突變體和組合突變體的針對中靶切割效率的篩選。SpCas9(K855A)、eSpCas9(1.0)、和eSpCas9(1.1)以紅色突出顯示。
圖16A-16C示出了spCas9突變體對中靶效率的維持。圖A示出了與針對被靶向9個基因組座位的24種sgRNA的SpCas9相比,SpCas9突變體的中靶切割效率的評估。圖B係突變體SpCas9(K855A)、eSpCas9(1.0)和eSpCas9(1.1)的歸一化的中靶indel形成的圖基(Tukey)圖。圖C係使用抗SpCas9抗體的SpCas9和突變體的西方墨點。
圖17A-17C示出了spCas9以及突變體K855A、eSpCas9(1.0)和eSpCas9(1.1)對指導RNA與靶DNA之間的單鹼基和雙鹼基錯配的敏感性。圖A描繪了針對VEGFA靶標的錯配的指導序列。圖B提供了spCas9和三種突變體的熱圖,示出了用具有單鹼基錯配的指導序列產生的indel%。圖C示出了用含有連續顛換錯配的指導序列產生的indel形成。與野生型相比:eSpCas9(1.0)包括K810A、K1003A、R1060A;eSpCas9(1.1)包括K848A、K1003A、R1060A。
圖18A-18F示出了突變體SpCas9(K855A)和eSpCas9(1.1)的無偏全基因組脫靶譜。圖A係BLESS(直接原位斷裂標記,在鏈黴親和素上富集和下一代定序)工作流程的示意性提綱。圖B示出了被映射到基因組的正向(紅色)和反向(藍色)讀數的代表性BLESS定序。與DSB熱點相比,映射在Cas9切割位點處的讀數具有不同的形狀。圖C和D示出了使用靶向EMX1(1)(圖C)和VEGFA(1)(圖D)的指導物的由每種SpCas9突變體產生的全基因組DSB簇的曼哈頓(Manhattan)圖。圖E和F描繪了 在BLESS中鑒定的脫靶位點的靶向的深度定序驗證。脫靶位點按DSB得分排序(藍色熱圖)。綠色熱圖指示了靶序列與脫靶序列之間的序列相似性。
圖19示出了sgRNA指導的靶向和DNA解旋的示意圖。Cas9藉由一系列協調的步驟切割靶DNA。首先,PAM相互作用結構域識別靶DNA的5’的NGG序列。PAM結合之後,針對sgRNA:DNA互補性對靶序列的前10-12個核苷酸(種子序列)取樣,一依賴於DNA雙股體分離的過程。如果種子序列核苷酸與sgRNA互補,則將DNA的其餘部分解旋並且使全長的sgRNA與靶DNA股雜交。在這個模型中,RuvC(水鴨色)與HNH(品紅色)結構域之間的nt-溝槽使非靶向的DNA股穩定化並且藉由與DNA磷酸骨架的正電荷的非特異性相互作用有助於解旋。RNA:cDNA和Cas9:ncDNA相互作用驅動DNA解旋(頂部箭頭)與cDNA:ncDNA再雜交(底部箭頭)的競爭。
圖20描繪了揭示出非靶標股溝槽的SpCas9的靜電學。(A)與sgRNA和靶DNA配對的SpCas9的藉由靜電勢著色以突出顯示帶正電的區域的晶體結構(4UN3)。標度係從-10至1keV。(B)與圖(A)相同,其中HNH結構域被去除,以揭示sgRNA:DNA異源雙股體。(C)藉由以下結構域著色的晶體結構(與(A)處於相同的方向):HNH(品紅色)、RuvC(水鴨色)、和PAM相互作用(PI)(米色)。
圖21A-21D示出了所產生的突變體的脫靶分析。產生了二十九種SpCas9點突變體並且針對在(A)EMX1靶位點和(B)兩個VEGFA靶位點處的特異性對其進行測試。在(C)EMX1和(D)VEGFA處對組 合了改進特異性的靠前的殘基的突變體進行進一步測試。
圖22A-22C提供了帶注釋的SpCas9胺基酸序列。改變非靶向的股溝槽電荷的SpCas9的突變主要在RuvC和HNH結構域(以黃色突出顯示)之中。RuvC(青色)、橋螺旋(BH,綠色)、REC(灰色)、HNH(品紅色)、和PI(米色)結構域係如在尼施馬蘇(Nishmasu)等人中所注釋的。
圖23示出了K855A、eSpCas9(1.0)和eSpCas9(1.1)與截短的sgRNA的特異性比較,並且指示SpCas9(1.0)和eSpCas9(1.1)作為用於改進特異性的策略勝過截短的sgRNA。在主要注釋的並且預測的脫靶位點處對三個座位(EMX1(1)、VEGFA(1)和VEGFA(5))處的indel頻率進行測試。對於兩個VEGFA靶位點,tru-sgRNA增加一些脫靶位點處的indel頻率,並且在野生型中未觀察到的脫靶處產生indel。將每種SpCas9突變體的可藉由NGS檢測的脫靶位點的數目列在熱圖下方。
圖24顯示增加nt-溝槽中的正電荷可以導致脫靶位點處的切割增加。在EMX1(1)靶位點處,點突變體SpCas9(S845K)和SpCas9(L847R)展現出低於野生型SpCas9的特異性。
圖25A-25D描繪了藉由nt-溝槽的誘變來產生eSaCas9。與eSpCas9類似地產生SaCas9的改進的特異性形式。(A,B)針對減少的脫靶切割對RuvC與HNH結構域之間的溝槽中的殘基的單胺基酸和雙胺基酸突變體進行篩選。(C)將具有改進的特異性的突變體組合,以製備在EMX位點7處維持中靶切割並且具有顯著減少的脫靶切割的SaCas9變體。(D)SaCas9的晶體結構,示出了HNH與RuvC結構域之間的溝槽。
圖26示出了某些特異性增強的突變體的中靶效率的表徵。PI結構域中的磷酸鎖環處的三種SpCas9突變體(Lys1107、Glu1108、Ser1109)為鄰近於PAM的sgRNA的鹼基1和2賦予特異性。該等突變體由點突變體(K1107A)和其中的Lys-Glu-Ser序列分別被二肽Lys-Gly(KG)和Gly-Gly(GG)替換的兩種突變體組成。我們的數據指示該等突變體可以大幅降低中靶切割效率。
圖27顯示eSpCas9(1.1)對人類細胞沒有細胞毒性。將HEK293T細胞用WT或eSpCas9(1.1)轉染並且培養72小時,之後使用CellTiter-Glo測定測量細胞存活,在該測定中響應於由活細胞進行的ATP產生而發螢光。
圖28示出了具有截短的指導RNA的Nt-溝槽突變體的分析。將截短的指導RNA(Tru)與單胺基酸SpCas9突變體組合並且靶向(A)EMX1(1)或(B)VEGFA(1)。雖然大多數被靶向EMX1的具有18nt指導物的突變體保留了中靶效率,但是被靶向VEGFA(1)的具有17nt指導物的那些嚴重受損。
圖29A-29B示出了所選擇的單胺基酸和雙胺基酸突變體。如在SpCas9中,非靶向股溝槽中的正電荷的減少增強特異性。正電荷的減少可以藉由用中性或帶負電荷的胺基酸取代帶正電荷的胺基酸(A)或藉由除去溝槽內的帶正電荷的胺基酸位置(B)來實現。感興趣的突變體係K572,
圖30示出了所選擇的突變體的改進的特異性。CM2在脫靶活性方面展現出強烈降低,然而保留了完全的中靶活性。CM1: R499A;Q500K;K572A。CM2:R499A;Q500K;R654A;G655R。CM3:K572A;R654A;G655R。
圖31示出了長度15bp、17bp和20bp的spCas9或spCas9突變體指導物的複合物對γ珠蛋白HBG1座位的活化。Cas9(px165)係未經突變的spCas9。dCas9指示無活性spCas9。描繪的單突變體(“SM”)係R780A、K810A、和K848A。描繪的雙突變體(“DM”)係R780A/K810A、和R780A/K855A。
圖32示出了不同的可程式設計核酸酶平臺的比較。
圖33示出了治療性基因組修飾的類型。特定類型的基因組編輯治療取決於引起疾病的突變的性質。a,在基因破壞中,藉由用NHEJ靶向該座位使蛋白的致病功能沈默。在感興趣的基因上形成indel常常導致移碼突變,該等移碼突變產生提前終止密碼子和非功能性蛋白產物或無義介導的轉錄物衰變,從而抑制基因功能。b,HDR基因校正可以用來校正有害突變。在外源提供的校正HDR模板的存在下,DSB被靶向突變位點附近。藉由外源模板對斷裂位點進行HDR修復校正了該突變,從而恢復基因功能。c,基因校正的替代方案係基因添加。這種模式的處理將治療性轉基因引入基因組中的安全港(safe-harbor)座位中。DSB被靶向該安全港座位並且與斷裂位點具有同源性、含有啟動子和轉基因的HDR模板被引入細胞核中。HDR修復將啟動子-轉基因盒拷貝到安全港座位中,從而恢復基因功能,儘管對基因表現沒有真實的生理控制。
圖34示出了離體與體內編輯治療。在離體編輯治療中,從患者體內取出細胞,編輯並且然後重新植入(頂部圖)。為了使得這種治 療模式成功,靶細胞必須能夠在體外存活並且在移植後能夠歸巢回到靶組織中。體內治療涉及原位細胞基因組編輯(底部圖)。對於體內全身性治療,與細胞身份或狀態相對無關的遞送劑用來實現在範圍廣泛的組織類型中進行編輯。儘管這種模式的編輯治療在將來係可能的,但是目前不存在足夠有效使這可行的遞送系統。在向患者給予對特定器官系統具有向性的遞送劑的情況下,使用臨床上相關的病毒載體的體內靶向治療係可行的。
圖35A-35B示出了經由Cas9同源重組(HR)載體進行的基因治療的示意性表示。
圖36呈現了用於定向遞送蛋白質或指導物的糖附接(尤其是與GalNac)的示意圖。
圖37A、37B、和37C一起展示了SaCas9和SpCas9的序列比對。這兩種蛋白質的RUVC和HNH結構域注釋也被示於這三個圖中。
本文的該等圖僅僅是出於說明性的目的,並且不一定係按比例繪製的。
本案的圖皆為實驗數據,並非本案的代表圖。故本案無指定代表圖。

Claims (16)

  1. 一種工程化Cas9蛋白,包括HNH結構域、RuvC結構域和位於該HNH結構域與RuvC結構域之間的溝槽中之至少一種經修飾的胺基酸殘基,其中,該經修飾的胺基酸殘基係不帶電的胺基酸殘基,其取代野生型釀膿鏈球菌(Streptcoccus pyogeues)Cas9(SpCas9)相應位置的K、R或Q。
  2. 如請求項1所述之工程化Cas9蛋白,其中,該經修飾的胺基酸殘基係選自K775A、Q807A、R780A、K810A、R832A、K848A、K855A、K862A、K866A、K961A、K968A、K974A、R976A、K1000A、K1003A、K1014A、K1047A或K1060A,以野生型SpCas9的胺基酸位置編號作為參照。
  3. 如請求項1所述之工程化Cas9蛋白,其中,該工程化Cas9蛋白對靶多核苷酸座位相較於脫靶多核苷酸座位具有增加的特異性。
  4. 如請求項1所述之工程化Cas9蛋白,其中,該工程化Cas9蛋白包括來自以下屬的生物的野生型Cas9蛋白的突變體,該屬包括鏈球菌屬、彎曲桿菌屬、Nitratifractor、葡萄球菌屬、細小棒菌屬、羅氏菌屬、奈瑟菌屬、葡糖醋桿菌屬、固氮螺菌屬、Sphaerochaeta、乳桿菌屬、真桿菌屬和棒狀桿菌屬。
  5. 如請求項1所述之工程化Cas9蛋白,其中,該工程化Cas9蛋白係SpCas9的突變體。
  6. 如請求項1所述之工程化Cas9蛋白,其中,該工程化Cas9蛋白係金黃色葡萄球菌(Staphylococcus aureus)Cas9的突變體。
  7. 如請求項1所述之工程化Cas9蛋白,其中,該工程化Cas9蛋白包括一個或多個核定位信號。
  8. 如請求項1所述之工程化Cas9蛋白,其中,該工程化Cas9蛋白包括二個或多個核定位信號。
  9. 如請求項1所述之工程化Cas9蛋白,其中,該工程化Cas9蛋白係融合至一個或多個異源功能結構域。
  10. 如請求項9所述之工程化Cas9蛋白,其中該一個或多個異源功能結構域具有以下活性中的一種或多種:修飾烷酶活性、去甲酶活性、轉錄活化活性、轉錄抑制活性、轉錄釋放因子活性、組蛋白修飾活性、核酸酶活性、單股RNA切割活性、雙股RNA切割活性、單股DNA切割活性、雙股DNA切割活性以及核酸結合活性。
  11. 一種組成物,包括(a)如請求項1至10中任一項所述之工程化Cas9蛋白和(b)CRISPR-Cas系統嵌合RNA。
  12. 如請求項11所述之組成物,其中,該工程化Cas9蛋白與該CRISPR-Cas系統嵌合RNA複合。
  13. 一種組成物,包括(a)編碼如請求項1至10中任一項所述之工程化Cas9蛋白的mRNA和(b)CRISPR-Cas系統嵌合RNA。
  14. 如請求項13所述之組成物,其中,該(a)和(b)包括在一種或多種脂質粒子中。
  15. 一種組成物,包括(a)編碼如請求項1至10中任一項所述之工程化Cas9蛋白的多核苷酸和(b)編碼CRISPR-Cas系統嵌合RNA的多核苷酸。
  16. 如請求項15所述之組成物,其中,該(a)和(b)包括在一種或多種AAV載體中。
TW112128864A 2015-06-18 2016-06-17 降低脫靶效應的crispr酶突變 TW202400626A (zh)

Applications Claiming Priority (10)

Application Number Priority Date Filing Date Title
US201562181453P 2015-06-18 2015-06-18
US62/181,453 2015-06-18
US201562207312P 2015-08-19 2015-08-19
US62/207,312 2015-08-19
US201562237360P 2015-10-05 2015-10-05
US62/237,360 2015-10-05
US201562255256P 2015-11-13 2015-11-13
US62/255,256 2015-11-13
US201562269876P 2015-12-18 2015-12-18
US62/269,876 2015-12-18

Publications (1)

Publication Number Publication Date
TW202400626A true TW202400626A (zh) 2024-01-01

Family

ID=56345216

Family Applications (2)

Application Number Title Priority Date Filing Date
TW112128864A TW202400626A (zh) 2015-06-18 2016-06-17 降低脫靶效應的crispr酶突變
TW105119140A TWI813532B (zh) 2015-06-18 2016-06-17 降低脱靶效應的crispr酶突變

Family Applications After (1)

Application Number Title Priority Date Filing Date
TW105119140A TWI813532B (zh) 2015-06-18 2016-06-17 降低脱靶效應的crispr酶突變

Country Status (14)

Country Link
US (3) US10876100B2 (zh)
EP (2) EP3929287A3 (zh)
JP (3) JP7107683B2 (zh)
KR (2) KR20230132877A (zh)
CN (2) CN109536474A (zh)
AU (2) AU2016280893B2 (zh)
CA (1) CA2989830A1 (zh)
IL (3) IL293323B2 (zh)
MX (2) MX2017016289A (zh)
RU (2) RU2021120582A (zh)
SG (1) SG10201912329YA (zh)
TW (2) TW202400626A (zh)
WO (1) WO2016205613A1 (zh)
ZA (1) ZA201708498B (zh)

Families Citing this family (164)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10323236B2 (en) 2011-07-22 2019-06-18 President And Fellows Of Harvard College Evaluation and improvement of nuclease cleavage specificity
US10704021B2 (en) 2012-03-15 2020-07-07 Flodesign Sonics, Inc. Acoustic perfusion devices
WO2014018423A2 (en) * 2012-07-25 2014-01-30 The Broad Institute, Inc. Inducible dna binding proteins and genome perturbation tools and applications thereof
EP2931892B1 (en) 2012-12-12 2018-09-12 The Broad Institute, Inc. Methods, models, systems, and apparatus for identifying target sequences for cas enzymes or crispr-cas systems for target sequences and conveying results thereof
US20140179770A1 (en) 2012-12-12 2014-06-26 Massachusetts Institute Of Technology Delivery, engineering and optimization of systems, methods and compositions for sequence manipulation and therapeutic applications
KR20160056869A (ko) 2013-06-17 2016-05-20 더 브로드 인스티튜트, 인코퍼레이티드 바이러스 구성성분을 사용하여 장애 및 질환을 표적화하기 위한 crispr-cas 시스템 및 조성물의 전달, 용도 및 치료 적용
WO2014204724A1 (en) 2013-06-17 2014-12-24 The Broad Institute Inc. Delivery, engineering and optimization of tandem guide systems, methods and compositions for sequence manipulation
KR20160034901A (ko) 2013-06-17 2016-03-30 더 브로드 인스티튜트, 인코퍼레이티드 서열 조작에 최적화된 crispr-cas 이중 닉카아제 시스템, 방법 및 조성물
WO2014204727A1 (en) 2013-06-17 2014-12-24 The Broad Institute Inc. Functional genomics using crispr-cas systems, compositions methods, screens and applications thereof
CA2915842C (en) 2013-06-17 2022-11-29 The Broad Institute, Inc. Delivery and use of the crispr-cas systems, vectors and compositions for hepatic targeting and therapy
US20150044192A1 (en) 2013-08-09 2015-02-12 President And Fellows Of Harvard College Methods for identifying a target site of a cas9 nuclease
US9359599B2 (en) 2013-08-22 2016-06-07 President And Fellows Of Harvard College Engineered transcription activator-like effector (TALE) domains and uses thereof
US9737604B2 (en) 2013-09-06 2017-08-22 President And Fellows Of Harvard College Use of cationic lipids to deliver CAS9
US9228207B2 (en) 2013-09-06 2016-01-05 President And Fellows Of Harvard College Switchable gRNAs comprising aptamers
US9388430B2 (en) 2013-09-06 2016-07-12 President And Fellows Of Harvard College Cas9-recombinase fusion proteins and uses thereof
CN106061510B (zh) 2013-12-12 2020-02-14 布罗德研究所有限公司 用于基因组编辑的crispr-cas系统和组合物的递送、用途和治疗应用
EP3080271B1 (en) 2013-12-12 2020-02-12 The Broad Institute, Inc. Systems, methods and compositions for sequence manipulation with optimized functional crispr-cas systems
EP3080258A1 (en) 2013-12-12 2016-10-19 The Broad Institute, Inc. Compositions and methods of use of crispr-cas systems in nucleotide repeat disorders
US20150166985A1 (en) 2013-12-12 2015-06-18 President And Fellows Of Harvard College Methods for correcting von willebrand factor point mutations
WO2015089364A1 (en) 2013-12-12 2015-06-18 The Broad Institute Inc. Crystal structure of a crispr-cas system, and uses thereof
WO2015105955A1 (en) 2014-01-08 2015-07-16 Flodesign Sonics, Inc. Acoustophoresis device with dual acoustophoretic chamber
EP3690044B1 (en) 2014-02-11 2024-01-10 The Regents of the University of Colorado, a body corporate Crispr enabled multiplexed genome engineering
US10077453B2 (en) 2014-07-30 2018-09-18 President And Fellows Of Harvard College CAS9 proteins including ligand-dependent inteins
EP3215617B1 (en) 2014-11-07 2024-05-08 Editas Medicine, Inc. Systems for improving crispr/cas-mediated genome-editing
EP3889260A1 (en) 2014-12-12 2021-10-06 The Broad Institute, Inc. Protected guide rnas (pgrnas)
EP3265559B1 (en) 2015-03-03 2021-01-06 The General Hospital Corporation Engineered crispr-cas9 nucleases with altered pam specificity
US11708572B2 (en) 2015-04-29 2023-07-25 Flodesign Sonics, Inc. Acoustic cell separation techniques and processes
US11377651B2 (en) 2016-10-19 2022-07-05 Flodesign Sonics, Inc. Cell therapy processes utilizing acoustophoresis
US11390884B2 (en) 2015-05-11 2022-07-19 Editas Medicine, Inc. Optimized CRISPR/cas9 systems and methods for gene editing in stem cells
JP7396783B2 (ja) 2015-06-09 2023-12-12 エディタス・メディシン、インコーポレイテッド 移植を改善するためのcrispr/cas関連方法および組成物
WO2016205759A1 (en) 2015-06-18 2016-12-22 The Broad Institute Inc. Engineering and optimization of systems, methods, enzymes and guide scaffolds of cas9 orthologs and variants for sequence manipulation
AU2016280893B2 (en) 2015-06-18 2021-12-02 Massachusetts Institute Of Technology CRISPR enzyme mutations reducing off-target effects
AU2016285724A1 (en) 2015-06-29 2017-11-16 Ionis Pharmaceuticals, Inc. Modified CRISPR RNA and modified single CRISPR RNA and uses thereof
AU2016316845B2 (en) * 2015-08-28 2022-03-10 The General Hospital Corporation Engineered CRISPR-Cas9 nucleases
AU2016326711B2 (en) 2015-09-24 2022-11-03 Editas Medicine, Inc. Use of exonucleases to improve CRISPR/Cas-mediated genome editing
CA3002827A1 (en) 2015-10-23 2017-04-27 President And Fellows Of Harvard College Nucleobase editors and uses thereof
WO2017165862A1 (en) 2016-03-25 2017-09-28 Editas Medicine, Inc. Systems and methods for treating alpha 1-antitrypsin (a1at) deficiency
US11597924B2 (en) 2016-03-25 2023-03-07 Editas Medicine, Inc. Genome editing systems comprising repair-modulating enzyme molecules and methods of their use
EP3443086B1 (en) 2016-04-13 2021-11-24 Editas Medicine, Inc. Cas9 fusion molecules, gene editing systems, and methods of use thereof
US11214789B2 (en) 2016-05-03 2022-01-04 Flodesign Sonics, Inc. Concentration and washing of particles with acoustics
US10337051B2 (en) 2016-06-16 2019-07-02 The Regents Of The University Of California Methods and compositions for detecting a target RNA
US10017760B2 (en) 2016-06-24 2018-07-10 Inscripta, Inc. Methods for generating barcoded combinatorial libraries
WO2018005873A1 (en) * 2016-06-29 2018-01-04 The Broad Institute Inc. Crispr-cas systems having destabilization domain
US11078481B1 (en) 2016-08-03 2021-08-03 KSQ Therapeutics, Inc. Methods for screening for cancer targets
CN110214183A (zh) 2016-08-03 2019-09-06 哈佛大学的校长及成员们 腺苷核碱基编辑器及其用途
EP3497214B1 (en) 2016-08-09 2023-06-28 President and Fellows of Harvard College Programmable cas9-recombinase fusion proteins and uses thereof
KR101710026B1 (ko) 2016-08-10 2017-02-27 주식회사 무진메디 Cas9 단백질 및 가이드 RNA의 혼성체를 함유하는 나노 리포좀 전달체 조성물
WO2018039438A1 (en) 2016-08-24 2018-03-01 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
US11078483B1 (en) 2016-09-02 2021-08-03 KSQ Therapeutics, Inc. Methods for measuring and improving CRISPR reagent function
KR20230169449A (ko) 2016-09-30 2023-12-15 더 리젠츠 오브 더 유니버시티 오브 캘리포니아 Rna-가이드된 핵산 변형 효소 및 이의 사용 방법
KR20190071725A (ko) 2016-09-30 2019-06-24 더 리젠츠 오브 더 유니버시티 오브 캘리포니아 Rna-가이드된 핵산 변형 효소 및 이의 사용 방법
US11242542B2 (en) * 2016-10-07 2022-02-08 Integrated Dna Technologies, Inc. S. pyogenes Cas9 mutant genes and polypeptides encoded by same
CN110462034A (zh) * 2016-10-07 2019-11-15 综合Dna技术公司 化脓链球菌cas9突变基因和由其编码的多肽
GB2573062A (en) 2016-10-14 2019-10-23 Harvard College AAV delivery of nucleobase editors
SG10201913505WA (en) * 2016-10-17 2020-02-27 Univ Nanyang Tech Truncated crispr-cas proteins for dna targeting
WO2018119359A1 (en) 2016-12-23 2018-06-28 President And Fellows Of Harvard College Editing of ccr5 receptor gene to protect against hiv infection
IT201700016321A1 (it) * 2017-02-14 2018-08-14 Univ Degli Studi Di Trento Mutanti di cas9 ad alta specificita' e loro applicazioni.
EP3592853A1 (en) 2017-03-09 2020-01-15 President and Fellows of Harvard College Suppression of pain by gene editing
JP2020510439A (ja) 2017-03-10 2020-04-09 プレジデント アンド フェローズ オブ ハーバード カレッジ シトシンからグアニンへの塩基編集因子
EP3596217A1 (en) 2017-03-14 2020-01-22 Editas Medicine, Inc. Systems and methods for the treatment of hemoglobinopathies
BR112019019655A2 (pt) 2017-03-23 2020-04-22 Harvard College editores de nucleobase que compreendem proteínas de ligação a dna programáveis por ácido nucleico
EP3601568A1 (en) * 2017-03-31 2020-02-05 Agenovir Corporation Antiviral therapeutic
BR112019022201A2 (pt) 2017-04-24 2020-05-12 Dupont Nutrition Biosciences Aps Métodos para modular a atividade de uma endonuclease cas, para aumentar a especificidade de uma endonuclease cas e complexo polinucleotídico guia, para aumentar a frequência de recombinação homóloga e para ativação ou repressão gênica, célula e célula vegetal
CN108795989A (zh) * 2017-04-26 2018-11-13 哈尔滨工业大学 SpyCas9的基因编辑活性抑制位点及其抑制剂
EP3615672A1 (en) 2017-04-28 2020-03-04 Editas Medicine, Inc. Methods and systems for analyzing guide rna molecules
US11591601B2 (en) 2017-05-05 2023-02-28 The Broad Institute, Inc. Methods for identification and modification of lncRNA associated with target genotypes and phenotypes
EP3622070A2 (en) 2017-05-10 2020-03-18 Editas Medicine, Inc. Crispr/rna-guided nuclease systems and methods
US11560566B2 (en) 2017-05-12 2023-01-24 President And Fellows Of Harvard College Aptazyme-embedded guide RNAs for use with CRISPR-Cas9 in genome editing and transcriptional activation
CN110662835B (zh) * 2017-05-19 2023-04-28 清华大学 工程化改造用于由增强的指导RNA优化的基因编辑和转录调节的最小化SaCas9 CRISPR/Cas系统
KR102151064B1 (ko) * 2017-05-24 2020-09-02 기초과학연구원 매칭된 5' 뉴클레오타이드를 포함하는 가이드 rna를 포함하는 유전자 교정용 조성물 및 이를 이용한 유전자 교정 방법
GB201708662D0 (en) * 2017-05-31 2017-07-12 Tropic Biosciences Uk Ltd Compositions and methods for increasing shelf-life of banana
AU2018279457B2 (en) 2017-06-08 2024-02-15 Osaka University Method for manufacturing DNA-edited eukaryotic cell, and kit used in method
AU2018279829B2 (en) 2017-06-09 2024-01-04 Editas Medicine, Inc. Engineered Cas9 nucleases
CN107365793A (zh) * 2017-06-19 2017-11-21 百格基因科技(江苏)有限公司 一种适用于植物的大规模基因组编辑的方法
US10011849B1 (en) 2017-06-23 2018-07-03 Inscripta, Inc. Nucleic acid-guided nucleases
US9982279B1 (en) 2017-06-23 2018-05-29 Inscripta, Inc. Nucleic acid-guided nucleases
US20200140896A1 (en) * 2017-06-30 2020-05-07 Novartis Ag Methods for the treatment of disease with gene editing systems
EP3650540A4 (en) * 2017-07-07 2021-03-31 Toolgen Incorporated TARGET-SPECIFIC CRISPR MUTANT
WO2019014564A1 (en) 2017-07-14 2019-01-17 Editas Medicine, Inc. SYSTEMS AND METHODS OF TARGETED INTEGRATION AND GENOME EDITING AND DETECTION THEREOF WITH INTEGRATED PRIMING SITES
JP2020534795A (ja) 2017-07-28 2020-12-03 プレジデント アンド フェローズ オブ ハーバード カレッジ ファージによって支援される連続的進化(pace)を用いて塩基編集因子を進化させるための方法および組成物
KR102660303B1 (ko) * 2017-07-28 2024-04-25 로커스 아이피 컴퍼니 엘엘씨 피부, 모발 및 두피 건강을 개선하기 위한 효모 기반 마스크
AU2018309648A1 (en) * 2017-08-04 2020-01-16 Syngenta Participations Ag Methods and compositions for targeted genomic insertion
US11286468B2 (en) 2017-08-23 2022-03-29 The General Hospital Corporation Engineered CRISPR-Cas9 nucleases with altered PAM specificity
US11319532B2 (en) 2017-08-30 2022-05-03 President And Fellows Of Harvard College High efficiency base editors comprising Gam
WO2019051419A1 (en) * 2017-09-08 2019-03-14 University Of North Texas Health Science Center MODIFIED CASE VARIANTS9
US11572574B2 (en) 2017-09-28 2023-02-07 Toolgen Incorporated Artificial genome manipulation for gene expression regulation
CN107630018B (zh) * 2017-09-30 2018-10-12 深圳三智医学科技有限公司 一种用于编辑或修复hbb基因的试剂盒
US11795443B2 (en) 2017-10-16 2023-10-24 The Broad Institute, Inc. Uses of adenosine base editors
WO2019079462A1 (en) * 2017-10-17 2019-04-25 President And Fellows Of Harvard College TRANSCRIPTION MODULATION SYSTEMS BASED ON CAS9
US11970719B2 (en) 2017-11-01 2024-04-30 The Regents Of The University Of California Class 2 CRISPR/Cas compositions and methods of use
JP2021503278A (ja) 2017-11-01 2021-02-12 ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア CasZ組成物及び使用方法
US10662425B2 (en) 2017-11-21 2020-05-26 Crispr Therapeutics Ag Materials and methods for treatment of autosomal dominant retinitis pigmentosa
KR102387830B1 (ko) * 2017-11-22 2022-04-18 고쿠리츠다이가쿠호진 고베다이가쿠 안정하고 부작용이 적은 게놈 편집용 복합체 및 이를 코딩하는 핵산
JP2021507561A (ja) 2017-12-14 2021-02-22 フロデザイン ソニックス, インク.Flodesign Sonics, Inc. 音響トランスデューサドライバ及びコントローラ
US20210371877A1 (en) * 2017-12-18 2021-12-02 Spark Therapeutics, Inc. Adeno-associated virus (aav) vector lipid nanoparticle compositions and methods of use
CN108048405A (zh) * 2018-01-15 2018-05-18 上海市东方医院 稳定表达人内源性INav的细胞模型及其制备方法和用途
US20210054353A1 (en) * 2018-03-19 2021-02-25 Crispr Therapeutics Ag Novel rna-programmable endonuclease systems and uses thereof
JP2021519073A (ja) * 2018-03-29 2021-08-10 ジェネンテック, インコーポレイテッド 哺乳動物細胞におけるラクトジェニック活性の制御
US20190336585A1 (en) * 2018-05-03 2019-11-07 John Lawrence Mee Method for sustainable human cognitive enhancement
WO2019222423A1 (en) * 2018-05-15 2019-11-21 The Brigham And Women's Hospital, Inc. Compositions and methods related to tumor cell killers and vaccines
EP3805386A4 (en) * 2018-06-08 2022-03-23 Modalis Therapeutics Corporation MODIFIED CAS9 PROTEIN AND USE THEREOF
WO2019235907A1 (ko) * 2018-06-08 2019-12-12 충남대학교 산학협력단 Crispr/cas9 시스템을 이용하여 플라보노이드 생합성 유전체를 편집하기 위한 조성물 및 이의 이용
CN110684755B (zh) * 2018-07-05 2021-12-31 清华大学 基于进化信息构建嵌合SaCas9用于增强和扩展PAM位点的识别
JP2021524272A (ja) 2018-07-10 2021-09-13 エーエルアイエー セラピューティクス エス. アール. エル. ガイドrna分子および/またはガイドrna分子/rna誘導型ヌクレアーゼ複合体の無痕跡送達のための小胞およびその産生方法
EP3830301B1 (en) 2018-08-01 2024-05-22 Mammoth Biosciences, Inc. Programmable nuclease compositions and methods of use thereof
CN108949830B (zh) * 2018-08-03 2021-11-26 福州大学 一种在鱼类中实现基因组编辑、精确定点基因敲入的方法
KR20210049137A (ko) * 2018-08-24 2021-05-04 플래그쉽 파이어니어링 이노베이션스 브이아이, 엘엘씨 식물의 변형을 위한 방법 및 조성물
CN109402115B (zh) * 2018-09-06 2024-02-02 广州普世利华科技有限公司 靶向Rett突变基因RNA的gRNA及Rett突变基因的检测方法、检测试剂盒
US20210198642A1 (en) * 2018-09-07 2021-07-01 Astrazeneca Ab Compositions and methods for improved nucleases
CN113166779A (zh) * 2018-10-09 2021-07-23 北卡罗来纳大学查佩尔希尔分校 调控的基因编辑系统
EP3880826A4 (en) * 2018-11-07 2022-08-24 Akouos, Inc. USE OF ADENO-ASSOCIATED VIRAL VECTORS TO CORRECT GENE DEFECTS/EXPRESS PROTEINS IN CILIATE AND SUPPORTING CELLS IN THE INNER EAR
WO2020097344A1 (en) * 2018-11-08 2020-05-14 Arizona Board of Regents on Behalf Arizona State University Synthetic immunomodulation with a crispr super-repressor in vivo
CN109385425A (zh) * 2018-11-13 2019-02-26 中山大学 一种高特异性ABE碱基编辑系统及其在β血红蛋白病中的应用
WO2020106771A1 (en) * 2018-11-19 2020-05-28 Exosome Therapeutics, Inc. Compositions and methods for producing exosome loaded therapeutics for the treatment of multiple oncological disorders
CN111321171A (zh) * 2018-12-14 2020-06-23 江苏集萃药康生物科技有限公司 一种应用CRISPR/Cas9介导ES打靶技术制备基因打靶动物模型的方法
US20220073890A1 (en) * 2018-12-14 2022-03-10 Pioneer Hi-Bred International, Inc. Novel crispr-cas systems for genome editing
EP3931313A2 (en) 2019-01-04 2022-01-05 Mammoth Biosciences, Inc. Programmable nuclease improvements and compositions and methods for nucleic acid amplification and detection
US20220098572A1 (en) * 2019-01-31 2022-03-31 Beam Therapeutics Inc. Nucleobase editors having reduced non-target deamination and assays for characterizing nucleobase editors
US20220154158A1 (en) * 2019-03-12 2022-05-19 MAX-PLANCK-Gesellschaft zur Förderung der Wissenschaften e.V. Cas9 variants with enhanced specificity
GB2601618A (en) 2019-03-19 2022-06-08 Broad Inst Inc Methods and compositions for editing nucleotide sequences
CN110009626A (zh) * 2019-04-11 2019-07-12 北京百度网讯科技有限公司 用于生成图像的方法和装置
US20210008161A1 (en) 2019-06-17 2021-01-14 Crispr Therapeutics Ag Methods and compositions for improved homology directed repair
CN110272881B (zh) * 2019-06-29 2021-04-30 复旦大学 核酸内切酶SpCas9高特异性截短变异体TSpCas9-V1/V2及其应用
AU2020310837A1 (en) * 2019-07-08 2022-02-24 Inscripta, Inc. Increased nucleic acid-guided cell editing via a LexA-Rad51 fusion protein
WO2021007177A1 (en) * 2019-07-08 2021-01-14 The Regents Of The University Of California Variant type v crispr/cas effector polypeptides and methods of use thereof
CN110600075B (zh) * 2019-08-14 2021-08-03 浙江工业大学 一种基于配体生长策略的蛋白质atp对接方法
CN110402852A (zh) * 2019-08-28 2019-11-05 浙江海洋大学 利于提高虎斑乌贼产卵数量与质量的养殖方法
MX2022005028A (es) * 2019-11-01 2022-05-16 Syngenta Crop Protection Ag Metodos de control de malas hierbas y composiciones y plantas relacionadas.
KR102493904B1 (ko) * 2019-12-13 2023-01-31 한국생명공학연구원 EeCpf1에 의해 IL2Rg 유전자가 돌연변이된 면역부전 동물모델 및 그 제조방법
WO2021163515A1 (en) * 2020-02-12 2021-08-19 Temple University - Of The Commonwealth System Of Higher Education Crispr-cas9 mediated disruption of alcam gene inhibits adhesion and trans-endothelial migration of myeloid cells
CN111337666B (zh) * 2020-02-12 2021-04-02 山东大学 I-motif重组介导的FRET探针及其原位成像癌细胞表面蛋白质同源二聚化的应用
KR20220128644A (ko) * 2020-03-11 2022-09-21 시그마-알드리치 컴퍼니., 엘엘씨 게놈 변형을 위한 높은 충실도 SpCas9 뉴클라제
EP4118203A4 (en) * 2020-03-11 2024-03-27 Broad Inst Inc NEW ENZYMES CASES AND METHODS FOR SPECIFICITY AND ACTIVITY PROFILING
KR20220161383A (ko) 2020-03-31 2022-12-06 메타지노미, 인크. 클래스 ii, 유형 ii crispr 시스템
EP4127155A1 (en) * 2020-03-31 2023-02-08 Metagenomi, Inc. Class ii, type ii crispr systems
WO2021216772A1 (en) * 2020-04-21 2021-10-28 Mammoth Biosciences, Inc. Casy programmable nucleases and rna component systems
MX2022014008A (es) 2020-05-08 2023-02-09 Broad Inst Inc Métodos y composiciones para la edición simultánea de ambas cadenas de una secuencia de nucleótidos de doble cadena objetivo.
WO2022018638A1 (en) 2020-07-21 2022-01-27 Crispr Therapeutics Ag Genome-editing compositions and methods to modulate faah for treatment of neurological disorders
CN111904973B (zh) * 2020-07-27 2021-12-03 中国农业科学院兰州兽医研究所 ssc-miR-122在制备调节猪繁殖与呼吸综合征病毒复制的药物中的应用
CN111979273B (zh) * 2020-08-24 2022-05-27 苏州启辰生物科技有限公司 一种制备人源化ace2小鼠模型的方法
WO2022047194A1 (en) * 2020-08-28 2022-03-03 Rau Bio Limited Approaches to simulating the interactions of biological systems through the use of modular computational workflows
US20230383273A1 (en) * 2020-10-21 2023-11-30 Emendobio Inc. Novel omni 56, 58, 65, 68, 71, 75, 78, and 84 crispr nucleases
WO2022109058A1 (en) * 2020-11-18 2022-05-27 Entrada Therapeutics, Inc. Nucleases comprising cell penetrating peptide sequences
WO2022119957A1 (en) * 2020-12-02 2022-06-09 The Regents Of The University Of California Crispr-cas effector polypeptides and methods of use thereof
CA3205138A1 (en) 2020-12-17 2022-06-23 Vertex Pharmaceuticals Incorporated Compositions and methods for editing beta-globin for treatment of hemaglobinopathies
CN114807240B (zh) * 2021-01-21 2024-02-06 深圳市第二人民医院(深圳市转化医学研究院) 一种连接有适配体的模板分子及其试剂盒
WO2022170216A2 (en) * 2021-02-08 2022-08-11 Emendobio Inc. Omni 90-99, 101, 104-110, 114, 116, 118-123, 125, 126, 128, 129, and 131-138 crispr nucleases
AU2022232622A1 (en) * 2021-03-11 2023-10-12 Emendobio Inc. Strategies for knock-ins at c3 safe harbor sites
CN113249384A (zh) * 2021-04-27 2021-08-13 重庆医科大学 可靶向编辑HBV cccDNA的特异sgRNA序列及其应用
WO2022238958A1 (en) 2021-05-12 2022-11-17 Crispr Therapeutics Ag Multiplex gene editing
WO2023275892A1 (en) * 2021-06-29 2023-01-05 Council Of Scientific & Industrial Research Engineered fncas9 and uses thereof
CN113584049B (zh) * 2021-07-27 2023-02-03 杭州师范大学 Vdac1基因在调控植物开花期中的应用
CN113755498A (zh) * 2021-09-27 2021-12-07 赛业(苏州)生物科技有限公司 靶向小鼠Ube3a基因的gRNA及构建AS疾病小鼠模型的方法
WO2023077148A1 (en) 2021-11-01 2023-05-04 Tome Biosciences, Inc. Single construct platform for simultaneous delivery of gene editing machinery and nucleic acid cargo
CN114214330A (zh) * 2021-12-20 2022-03-22 杭州百凌生物科技有限公司 一种检测脊索瘤的质控品及其制备方法和应用
WO2023122764A1 (en) 2021-12-22 2023-06-29 Tome Biosciences, Inc. Co-delivery of a gene editor construct and a donor template
WO2023205744A1 (en) 2022-04-20 2023-10-26 Tome Biosciences, Inc. Programmable gene insertion compositions
WO2023215831A1 (en) 2022-05-04 2023-11-09 Tome Biosciences, Inc. Guide rna compositions for programmable gene insertion
WO2023219933A1 (en) 2022-05-09 2023-11-16 Entrada Therapeutics, Inc. Compositions and methods for delivery of nucleic acid therapeutics
WO2023225670A2 (en) 2022-05-20 2023-11-23 Tome Biosciences, Inc. Ex vivo programmable gene insertion
TW202405175A (zh) 2022-06-07 2024-02-01 美商斯奎柏治療公司 用於靶向pcsk9的組合物及方法
WO2024020587A2 (en) 2022-07-22 2024-01-25 Tome Biosciences, Inc. Pleiopluripotent stem cell programmable gene insertion
CN116376975B (zh) * 2023-02-27 2024-05-14 中国科学院脑科学与智能技术卓越创新中心 激活异染色质基因的方法及应用
CN116987730B (zh) * 2023-09-22 2023-12-01 西北农林科技大学深圳研究院 硫氧还蛋白StCDSP32在植物抗病中的应用

Family Cites Families (185)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS501A (zh) 1973-04-28 1975-01-06
US5703055A (en) 1989-03-21 1997-12-30 Wisconsin Alumni Research Foundation Generation of antibodies through lipid mediated DNA delivery
US7150982B2 (en) 1991-09-09 2006-12-19 Third Wave Technologies, Inc. RNA detection assays
US5593972A (en) 1993-01-26 1997-01-14 The Wistar Institute Genetic immunization
US5543158A (en) 1993-07-23 1996-08-06 Massachusetts Institute Of Technology Biodegradable injectable nanoparticles
US6007845A (en) 1994-07-22 1999-12-28 Massachusetts Institute Of Technology Nanoparticles and microparticles of non-linear hydrophilic-hydrophobic multiblock copolymers
US7745416B2 (en) 1995-04-11 2010-06-29 The Regents Of The University Of California Method for in vivo regulation of cardiac muscle contractility
US5622856A (en) 1995-08-03 1997-04-22 Avigen High efficiency helper system for AAV vector production
US5855913A (en) 1997-01-16 1999-01-05 Massachusetts Instite Of Technology Particles incorporating surfactants for pulmonary drug delivery
US5985309A (en) 1996-05-24 1999-11-16 Massachusetts Institute Of Technology Preparation of particles for inhalation
US5846946A (en) 1996-06-14 1998-12-08 Pasteur Merieux Serums Et Vaccins Compositions and methods for administering Borrelia DNA
US5944710A (en) 1996-06-24 1999-08-31 Genetronics, Inc. Electroporation-mediated intravascular delivery
US5869326A (en) 1996-09-09 1999-02-09 Genetronics, Inc. Electroporation employing user-configured pulsing scheme
GB9907461D0 (en) 1999-03-31 1999-05-26 King S College London Neurite regeneration
GB9710049D0 (en) 1997-05-19 1997-07-09 Nycomed Imaging As Method
US6251677B1 (en) 1997-08-25 2001-06-26 The Trustees Of The University Of Pennsylvania Hybrid adenovirus-AAV virus and methods of use thereof
GB9720465D0 (en) 1997-09-25 1997-11-26 Oxford Biomedica Ltd Dual-virus vectors
EP1025217B1 (en) 1997-10-24 2006-10-04 Invitrogen Corporation Recombinational cloning using nucleic acids having recombination sites
US7868149B2 (en) 1999-07-20 2011-01-11 Monsanto Technology Llc Plant genome sequence and uses thereof
US6603061B1 (en) 1999-07-29 2003-08-05 Monsanto Company Agrobacterium-mediated plant transformation method
GB0024550D0 (zh) 2000-10-06 2000-11-22 Oxford Biomedica Ltd
WO2002074968A1 (en) 2001-03-16 2002-09-26 Naoya Kobayashi Method for proliferating a liver cell, a liver cell obtained thereby, and use thereof
JP4588296B2 (ja) 2001-04-05 2010-11-24 ジョンズ・ホプキンス・ユニバーシティ キメラワクチン
CA2453183C (en) 2001-07-12 2016-05-10 University Of Massachusetts In vivo production of small interfering rnas that mediate gene silencing
WO2003014318A2 (en) 2001-08-08 2003-02-20 Genzyme Corporation Methods for treating diabetes and other blood sugar disorders
WO2003016338A1 (en) 2001-08-15 2003-02-27 Parker Hughes Institute Crystal structure of the btk kinase domain
GB0125216D0 (en) 2001-10-19 2001-12-12 Univ Strathclyde Dendrimers for use in targeted delivery
US20090100536A1 (en) 2001-12-04 2009-04-16 Monsanto Company Transgenic plants with enhanced agronomic traits
AU2002353231B2 (en) 2001-12-21 2008-10-16 Oxford Biomedica (Uk) Limited Method for producing a transgenic organism using a lentiviral expression vector such as EIAV
US7539579B2 (en) 2002-04-09 2009-05-26 Beattie Kenneth L Oligonucleotide probes for genosensor chips
EP1532178A4 (en) 2002-06-11 2006-10-25 Scripps Research Inst ARTIFICIAL TRANSCRIPTION FACTORS
ES2354607T3 (es) 2002-06-28 2011-03-16 Protiva Biotherapeutics Inc. Procedimiento y aparato para producir liposomas.
GB0220467D0 (en) 2002-09-03 2002-10-09 Oxford Biomedica Ltd Composition
AU2003283976B2 (en) 2002-09-27 2009-12-10 Cold Spring Harbor Laboratory Cell-based RNA interference and related methods and compositions
US9534224B2 (en) 2002-11-15 2017-01-03 Trustees Of Boston University Cis/trans riboregulators
US20060178297A1 (en) 2003-01-28 2006-08-10 Troy Carol M Systems and methods for silencing expression of a gene in a cell and uses thereof
MXPA05014215A (es) 2003-07-03 2006-03-13 Univ California Mapeo de genoma de elementos funcionales de adn y proteinas celulares.
NZ544637A (en) 2003-07-16 2010-04-30 Protiva Biotherapeutics Inc Lipid encapsulated interfering RNA
JP4555292B2 (ja) 2003-08-08 2010-09-29 サンガモ バイオサイエンシズ インコーポレイテッド 標的化された切断及び組換えの方法及び組成物
CN1882693B (zh) 2003-09-15 2012-08-15 普洛体维生物治疗公司 聚乙二醇修饰的脂质化合物及其应用
GB0325379D0 (en) 2003-10-30 2003-12-03 Oxford Biomedica Ltd Vectors
FR2862659B1 (fr) 2003-11-21 2006-02-10 Pasteur Institut Genome de legionella pneumophila souche paris- applications diagnostiques et epidemiologiques
WO2005070948A1 (en) 2004-01-23 2005-08-04 Intronn, Inc. Correction of alpha-1-antitrypsin genetic defects using spliceosome mediated rna trans splicing
WO2005074511A2 (en) 2004-01-27 2005-08-18 The Board Of Trustees Of The Leland Stanford Junior University Methods and compositions for homozygous gene inactivation using collections of pre-defined nucleotide sequences complementary to chromosomal transcripts
US20050220796A1 (en) 2004-03-31 2005-10-06 Dynan William S Compositions and methods for modulating DNA repair
EP1766035B1 (en) 2004-06-07 2011-12-07 Protiva Biotherapeutics Inc. Lipid encapsulated interfering rna
US7745651B2 (en) 2004-06-07 2010-06-29 Protiva Biotherapeutics, Inc. Cationic lipids and methods of use
FR2872170B1 (fr) 2004-06-25 2006-11-10 Centre Nat Rech Scient Cnrse Lentivirus non interactif et non replicatif, preparation et utilisations
CA2573702C (en) 2004-07-16 2013-10-15 The Government Of The United States Of America As Represented By The Sec Retary Of The Department Of Health And Human Services Vaccine constructs and combination of vaccines designed to improve the breadth of the immune response to diverse strains and clades of hiv
GB0422877D0 (en) 2004-10-14 2004-11-17 Univ Glasgow Bioactive polymers
WO2006116756A1 (en) 2005-04-28 2006-11-02 Benitec, Limited. Multiple-rnai expression cassettes for simultaneous delivery of rnai agents related to heterozygotic expression patterns
US7892224B2 (en) 2005-06-01 2011-02-22 Brainlab Ag Inverse catheter planning
AU2006272634B2 (en) 2005-07-26 2013-01-24 Sangamo Therapeutics, Inc. Targeted integration and expression of exogenous nucleic acid sequences
EP3284833B1 (en) 2005-08-26 2021-12-01 DuPont Nutrition Biosciences ApS Use of crispr associated genes (cas)
US7838658B2 (en) 2005-10-20 2010-11-23 Ian Maclachlan siRNA silencing of filovirus gene expression
ES2377660T3 (es) 2005-10-28 2012-03-29 Mitsubishi Tanabe Pharma Corporation Nuevo péptido que penetra en las células
CA2628300C (en) 2005-11-02 2018-04-17 Protiva Biotherapeutics, Inc. Modified sirna molecules and uses thereof
GB0526211D0 (en) 2005-12-22 2006-02-01 Oxford Biomedica Ltd Viral vectors
EP1989307B1 (en) 2006-02-08 2012-08-08 Quark Pharmaceuticals, Inc. NOVEL TANDEM siRNAS
US9677123B2 (en) 2006-03-15 2017-06-13 Siemens Healthcare Diagnostics Inc. Degenerate nucleobase analogs
CA2915441A1 (en) 2006-05-11 2007-11-22 Alnylam Pharmaceuticals, Inc. Compositions and methods for inhibiting expression of the pcsk9 gene
US8748567B2 (en) 2006-05-22 2014-06-10 Children's Medical Center Corporation Method for delivery across the blood brain barrier
US7915399B2 (en) 2006-06-09 2011-03-29 Protiva Biotherapeutics, Inc. Modified siRNA molecules and uses thereof
JP2008078613A (ja) 2006-08-24 2008-04-03 Rohm Co Ltd 窒化物半導体の製造方法及び窒化物半導体素子
WO2008093152A1 (en) 2007-02-01 2008-08-07 Cellectis Obligate heterodimer meganucleases and uses thereof
DK2860267T3 (en) 2007-03-02 2019-04-23 Dupont Nutrition Biosci Aps CULTURES WITH IMPROVED PROFESS RESISTANCE
PE20090064A1 (es) 2007-03-26 2009-03-02 Novartis Ag Acido ribonucleico de doble cadena para inhibir la expresion del gen e6ap humano y composicion farmaceutica que lo comprende
WO2008149176A1 (en) 2007-06-06 2008-12-11 Cellectis Meganuclease variants cleaving a dna target sequence from the mouse rosa26 locus and uses thereof
NZ587060A (en) 2007-12-31 2012-09-28 Nanocor Therapeutics Inc Rna interference for the treatment of heart failure
US20100081707A1 (en) 2008-02-21 2010-04-01 Ali Robin R Devices and methods for delivering polynucleotides into retinal cells of the macula and fovea
PT2279254T (pt) 2008-04-15 2017-09-04 Protiva Biotherapeutics Inc Novas formulações lipídicas para entrega de ácido nucleico
EP2283029A1 (en) 2008-06-04 2011-02-16 Medical Research Council Peptides
CN102137658A (zh) 2008-06-30 2011-07-27 斯兰斯德有限公司 局部递送药物的方法、组合物和系统
US20110117189A1 (en) 2008-07-08 2011-05-19 S.I.F.I. Societa' Industria Farmaceutica Italiana S.P.A. Ophthalmic compositions for treating pathologies of the posterior segment of the eye
WO2010011961A2 (en) 2008-07-25 2010-01-28 University Of Georgia Research Foundation, Inc. Prokaryotic rnai-like system and methods of use
US20100076057A1 (en) 2008-09-23 2010-03-25 Northwestern University TARGET DNA INTERFERENCE WITH crRNA
US9404098B2 (en) 2008-11-06 2016-08-02 University Of Georgia Research Foundation, Inc. Method for cleaving a target RNA using a Cas6 polypeptide
MX353900B (es) 2008-11-07 2018-02-01 Massachusetts Inst Technology Lipidoides de aminoalcohol y usos de los mismos.
US20110016540A1 (en) 2008-12-04 2011-01-20 Sigma-Aldrich Co. Genome editing of genes associated with trinucleotide repeat expansion disorders in animals
WO2010065123A1 (en) 2008-12-04 2010-06-10 Sangamo Biosciences, Inc. Genome editing in rats using zinc-finger nucleases
JP5855462B2 (ja) 2008-12-10 2016-02-09 アルナイラム ファーマシューティカルズ, インコーポレイテッドAlnylam Pharmaceuticals, Inc. GNAQを標的としたdsRNA組成物および発現を阻害するための方法
WO2010075424A2 (en) 2008-12-22 2010-07-01 The Regents Of University Of California Compositions and methods for downregulating prokaryotic genes
US20110239315A1 (en) 2009-01-12 2011-09-29 Ulla Bonas Modular dna-binding domains and methods of use
EP2206723A1 (en) 2009-01-12 2010-07-14 Bonas, Ulla Modular DNA-binding domains
WO2011036510A1 (en) 2009-09-24 2011-03-31 Cellectis Meganuclease variants cleaving the genome of the herpes simplex virus and uses thereof
WO2010143917A2 (en) 2009-06-11 2010-12-16 Toolgen Incorporation Targeted genomic rearrangements using site-specific nucleases
EP2449106B1 (en) 2009-07-01 2015-04-08 Protiva Biotherapeutics Inc. Compositions and methods for silencing apolipoprotein b
JP5766188B2 (ja) 2009-07-01 2015-08-19 プロチバ バイオセラピューティクス インコーポレイティッド 固形腫瘍に治療剤を送達するための脂質製剤
JP2013500018A (ja) 2009-07-24 2013-01-07 シグマ−アルドリッチ・カンパニー・リミテッド・ライアビリティ・カンパニー ゲノム編集のための方法
JP5866283B2 (ja) 2009-07-28 2016-02-17 サンガモ バイオサイエンシーズ, インコーポレイテッド トリヌクレオチド反復疾患を治療するための方法および組成物
US8889394B2 (en) 2009-09-07 2014-11-18 Empire Technology Development Llc Multiple domain proteins
WO2011064736A1 (en) 2009-11-27 2011-06-03 Basf Plant Science Company Gmbh Optimized endonucleases and uses thereof
WO2011076873A1 (en) 2009-12-23 2011-06-30 MAX-PLANCK-Gesellschaft zur Förderung der Wissenschaften e.V. Influenza targets
CA2788850C (en) 2010-02-09 2019-06-25 Sangamo Biosciences, Inc. Targeted genomic modification with partially single-stranded donor molecules
US10087431B2 (en) 2010-03-10 2018-10-02 The Regents Of The University Of California Methods of generating nucleic acid fragments
JP5952263B2 (ja) 2010-04-26 2016-07-13 サンガモ バイオサイエンシーズ, インコーポレイテッド ジンクフィンガーヌクレアーゼを使ったrosa遺伝子座のゲノム編集
US8927514B2 (en) 2010-04-30 2015-01-06 City Of Hope Recombinant adeno-associated vectors for targeted treatment
ES2590343T3 (es) 2010-05-10 2016-11-21 The Regents Of The University Of California Composiciones de endorribonucleasas y métodos de uso de las mismas
US8372951B2 (en) 2010-05-14 2013-02-12 National Tsing Hua University Cell penetrating peptides for intracellular delivery
CA2798988C (en) 2010-05-17 2020-03-10 Sangamo Biosciences, Inc. Tal-effector (tale) dna-binding polypeptides and uses thereof
US20110293571A1 (en) 2010-05-28 2011-12-01 Oxford Biomedica (Uk) Ltd. Method for vector delivery
JP2013537410A (ja) 2010-07-23 2013-10-03 シグマ−アルドリッチ・カンパニー・リミテッド・ライアビリティ・カンパニー 標的化エンドヌクレアーゼおよび一本鎖核酸を用いたゲノム編集
DK2601611T3 (da) 2010-08-02 2021-02-01 Integrated Dna Tech Inc Fremgangsmåder til forudsigelse af stabilitet og smeltetemperaturer for nukleinsyreduplekser
US9193827B2 (en) 2010-08-26 2015-11-24 Massachusetts Institute Of Technology Poly(beta-amino alcohols), their preparation, and uses thereof
WO2012031205A2 (en) 2010-09-03 2012-03-08 The Brigham And Women's Hospital, Inc. Lipid-polymer hybrid particles
EP2627665B1 (en) 2010-10-12 2015-12-16 The Children's Hospital Of Philadelphia Methods and compositions for treating hemophilia B
WO2012135025A2 (en) 2011-03-28 2012-10-04 Massachusetts Institute Of Technology Conjugated lipomers and uses thereof
JP2014511687A (ja) 2011-03-31 2014-05-19 モデルナ セラピューティクス インコーポレイテッド 工学操作された核酸の送達および製剤
SI3693025T1 (sl) 2011-04-22 2022-04-29 The Regents Of The University Of California Virioni adeno-povezanega virusa z varianto kapsida in postopki za njihovo uporabo
SG194089A1 (en) 2011-04-27 2013-11-29 Amyris Inc Methods for genomic modification
US20120295960A1 (en) 2011-05-20 2012-11-22 Oxford Biomedica (Uk) Ltd. Treatment regimen for parkinson's disease
WO2012164565A1 (en) 2011-06-01 2012-12-06 Yeda Research And Development Co. Ltd. Compositions and methods for downregulating prokaryotic genes
JP6185916B2 (ja) 2011-09-21 2017-08-23 サンガモ セラピューティクス, インコーポレイテッド 導入遺伝子発現を制御するための方法および組成物
AU2012318562A1 (en) 2011-10-06 2014-04-10 Sangamo Therapeutics, Inc. Methods and compositions for regulating HIV infection
US20130122096A1 (en) 2011-11-14 2013-05-16 Silenseed Ltd. Compositions for drug delivery and methods of manufacturing and using same
WO2013071440A1 (en) 2011-11-18 2013-05-23 UNIVERSITé LAVAL Methods and products for increasing frataxin levels and uses thereof
EP2782596A4 (en) 2011-11-22 2015-07-29 Philadelphia Children Hospital VIRAL VECTORS FOR HIGHLY EFFECTIVE TRANSGEN DELIVERY
US8450107B1 (en) 2011-11-30 2013-05-28 The Broad Institute Inc. Nucleotide-specific recognition sequences for designer TAL effectors
HRP20220717T1 (hr) 2011-12-16 2022-07-22 Modernatx, Inc. Modificirani pripravci mrna
GB201122458D0 (en) 2011-12-30 2012-02-08 Univ Wageningen Modified cascade ribonucleoproteins and uses thereof
KR102084539B1 (ko) 2012-02-29 2020-03-04 상가모 테라퓨틱스, 인코포레이티드 헌팅턴병을 치료하기 위한 방법 및 조성물
WO2013141680A1 (en) 2012-03-20 2013-09-26 Vilnius University RNA-DIRECTED DNA CLEAVAGE BY THE Cas9-crRNA COMPLEX
US9637739B2 (en) 2012-03-20 2017-05-02 Vilnius University RNA-directed DNA cleavage by the Cas9-crRNA complex
AU2013204327B2 (en) 2012-04-20 2016-09-01 Aviagen Cell transfection method
EP4289948A3 (en) 2012-05-25 2024-04-17 The Regents of the University of California Methods and compositions for rna-directed target dna modification and for rna-directed modulation of transcription
CA2874828A1 (en) 2012-06-01 2013-12-05 Drexel University Modulation of hepatitis b virus cccdna transcription
US8614194B1 (en) 2012-07-25 2013-12-24 Kaohsiung Medical University Anionic cell penetrating peptide and its use for intracellular delivery
DK2906684T3 (da) 2012-10-10 2020-09-28 Sangamo Therapeutics Inc T-celle-modificerende forbindelser og anvendelser deraf
JP6517143B2 (ja) 2012-10-23 2019-05-22 ツールゲン インコーポレイテッド 標的dnaに特異的なガイドrnaおよびcasタンパク質コード核酸またはcasタンパク質を含む、標的dnaを切断するための組成物、ならびにその使用
US20160017366A1 (en) 2012-12-06 2016-01-21 Sigma-Aldrich Co. Llc Crispr-based genome modification and regulation
WO2014093479A1 (en) 2012-12-11 2014-06-19 Montana State University Crispr (clustered regularly interspaced short palindromic repeats) rna-guided control of gene regulation
US20140310830A1 (en) 2012-12-12 2014-10-16 Feng Zhang CRISPR-Cas Nickase Systems, Methods And Compositions For Sequence Manipulation in Eukaryotes
WO2014093655A2 (en) 2012-12-12 2014-06-19 The Broad Institute, Inc. Engineering and optimization of systems, methods and compositions for sequence manipulation with functional domains
PL2921557T3 (pl) 2012-12-12 2017-03-31 Broad Inst Inc Projektowanie systemów, sposoby i optymalizowane kompozycje kierujące do manipulacji sekwencją
EP2931899A1 (en) 2012-12-12 2015-10-21 The Broad Institute, Inc. Functional genomics using crispr-cas systems, compositions, methods, knock out libraries and applications thereof
US20140189896A1 (en) 2012-12-12 2014-07-03 Feng Zhang Crispr-cas component systems, methods and compositions for sequence manipulation
EP2931892B1 (en) 2012-12-12 2018-09-12 The Broad Institute, Inc. Methods, models, systems, and apparatus for identifying target sequences for cas enzymes or crispr-cas systems for target sequences and conveying results thereof
PL2784162T3 (pl) 2012-12-12 2016-01-29 Broad Inst Inc Opracowanie systemów, metod oraz zoptymalizowanych kompozycji przewodnikowych do manipulacji sekwencyjnej
US20140179770A1 (en) 2012-12-12 2014-06-26 Massachusetts Institute Of Technology Delivery, engineering and optimization of systems, methods and compositions for sequence manipulation and therapeutic applications
US8697359B1 (en) 2012-12-12 2014-04-15 The Broad Institute, Inc. CRISPR-Cas systems and methods for altering expression of gene products
ES2786193T3 (es) 2012-12-12 2020-10-09 Broad Inst Inc Modificación por tecnología genética y optimización de sistemas, métodos y composiciones enzimáticas mejorados para la manipulación de secuencias
KR20150095861A (ko) 2012-12-17 2015-08-21 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 Rna-가이드된 인간 게놈 조작
CN104995302B (zh) 2013-01-16 2021-08-31 爱默蕾大学 Cas9-核酸复合物及其相关用途
WO2014118272A1 (en) 2013-01-30 2014-08-07 Santaris Pharma A/S Antimir-122 oligonucleotide carbohydrate conjugates
US10660943B2 (en) 2013-02-07 2020-05-26 The Rockefeller University Sequence specific antimicrobials
US9163837B2 (en) 2013-02-27 2015-10-20 Siemens Aktiengesellschaft Flow conditioner in a combustor of a gas turbine engine
EP3620534B1 (en) 2013-03-14 2021-10-13 Caribou Biosciences, Inc. Crispr-cas compositions of nucleic acid-targeting nucleic acids
KR20230157540A (ko) 2013-03-15 2023-11-16 더 제너럴 하스피탈 코포레이션 Rna-안내 게놈 편집을 위해 특이성을 증가시키기 위한 절단된 안내 rna(tru-grnas)의 이용
ES2645931T3 (es) 2013-03-27 2017-12-11 Wilco Ag Método de inspección y/o de prueba en línea de dispositivos y aparato para realizar tal método
JP6576904B2 (ja) 2013-04-04 2019-09-18 トラスティーズ・オブ・ダートマス・カレッジ HIV−1プロウイルスDNAのinvivo切除のための組成物及び方法
EP2997146A4 (en) 2013-05-15 2017-04-26 Sangamo BioSciences, Inc. Methods and compositions for treatment of a genetic condition
ES2670531T3 (es) 2013-05-29 2018-05-30 Cellectis S.A. Un método para producir una escisión de ADN precisa utilizando la actividad nickasa de Cas9
US20140356956A1 (en) 2013-06-04 2014-12-04 President And Fellows Of Harvard College RNA-Guided Transcriptional Regulation
CA3176690A1 (en) 2013-06-04 2014-12-11 President And Fellows Of Harvard College Rna-guided transcriptional regulation
US10704060B2 (en) 2013-06-05 2020-07-07 Duke University RNA-guided gene editing and gene regulation
WO2014204727A1 (en) 2013-06-17 2014-12-24 The Broad Institute Inc. Functional genomics using crispr-cas systems, compositions methods, screens and applications thereof
KR20160034901A (ko) 2013-06-17 2016-03-30 더 브로드 인스티튜트, 인코퍼레이티드 서열 조작에 최적화된 crispr-cas 이중 닉카아제 시스템, 방법 및 조성물
WO2014204724A1 (en) 2013-06-17 2014-12-24 The Broad Institute Inc. Delivery, engineering and optimization of tandem guide systems, methods and compositions for sequence manipulation
CA2915842C (en) 2013-06-17 2022-11-29 The Broad Institute, Inc. Delivery and use of the crispr-cas systems, vectors and compositions for hepatic targeting and therapy
AU2014281030B2 (en) 2013-06-17 2020-07-09 Massachusetts Institute Of Technology Delivery, engineering and optimization of systems, methods and compositions for targeting and modeling diseases and disorders of post mitotic cells
KR20160056869A (ko) 2013-06-17 2016-05-20 더 브로드 인스티튜트, 인코퍼레이티드 바이러스 구성성분을 사용하여 장애 및 질환을 표적화하기 위한 crispr-cas 시스템 및 조성물의 전달, 용도 및 치료 적용
CN103343120B (zh) * 2013-07-04 2015-03-04 中国科学院遗传与发育生物学研究所 一种小麦基因组定点改造方法
PL3019619T3 (pl) 2013-07-11 2022-01-10 Modernatx, Inc. Kompozycje zawierające syntetyczne polinkleotydy kodujące białka powiązane z crispr i syntetyczne sgrna oraz sposoby ich stosowania
CN103388006B (zh) 2013-07-26 2015-10-28 华东师范大学 一种基因定点突变的构建方法
US11306328B2 (en) 2013-07-26 2022-04-19 President And Fellows Of Harvard College Genome engineering
EA037850B1 (ru) 2013-08-29 2021-05-27 Тэмпл Юниверсити Оф Зе Коммонвэлс Систем Оф Хайе Эдьюкейшн Способы и композиции для рнк-направленного лечения вич-инфекции
US9388430B2 (en) 2013-09-06 2016-07-12 President And Fellows Of Harvard College Cas9-recombinase fusion proteins and uses thereof
US9737604B2 (en) 2013-09-06 2017-08-22 President And Fellows Of Harvard College Use of cationic lipids to deliver CAS9
WO2015048690A1 (en) * 2013-09-27 2015-04-02 The Regents Of The University Of California Optimized small guide rnas and methods of use
US20160237455A1 (en) 2013-09-27 2016-08-18 Editas Medicine, Inc. Crispr-related methods and compositions
WO2015065964A1 (en) 2013-10-28 2015-05-07 The Broad Institute Inc. Functional genomics using crispr-cas systems, compositions, methods, screens and applications thereof
CN106459995B (zh) 2013-11-07 2020-02-21 爱迪塔斯医药有限公司 使用统治型gRNA的CRISPR相关方法和组合物
EP3375877A1 (en) * 2013-11-18 2018-09-19 Crispr Therapeutics AG Crispr-cas system materials and methods
EP3080258A1 (en) 2013-12-12 2016-10-19 The Broad Institute, Inc. Compositions and methods of use of crispr-cas systems in nucleotide repeat disorders
WO2015089364A1 (en) 2013-12-12 2015-06-18 The Broad Institute Inc. Crystal structure of a crispr-cas system, and uses thereof
EP3080260B1 (en) 2013-12-12 2019-03-06 The Broad Institute, Inc. Crispr-cas systems and methods for altering expression of gene products, structural information and inducible modular cas enzymes
EP3079726B1 (en) 2013-12-12 2018-12-05 The Broad Institute, Inc. Delivery, use and therapeutic applications of the crispr-cas systems and compositions for targeting disorders and diseases using particle delivery components
CN103668472B (zh) 2013-12-31 2014-12-24 北京大学 利用CRISPR/Cas9系统构建真核基因敲除文库的方法
US10354746B2 (en) 2014-01-27 2019-07-16 Georgia Tech Research Corporation Methods and systems for identifying CRISPR/Cas off-target sites
JP6323228B2 (ja) 2014-07-18 2018-05-16 富士電機株式会社 電力変換装置
US9932566B2 (en) 2014-08-07 2018-04-03 Agilent Technologies, Inc. CIS-blocked guide RNA
EP3180426B1 (en) 2014-08-17 2019-12-25 The Broad Institute, Inc. Genome editing using cas9 nickases
EP3265559B1 (en) 2015-03-03 2021-01-06 The General Hospital Corporation Engineered crispr-cas9 nucleases with altered pam specificity
AU2016280893B2 (en) 2015-06-18 2021-12-02 Massachusetts Institute Of Technology CRISPR enzyme mutations reducing off-target effects
JP6186470B2 (ja) 2016-04-20 2017-08-23 パイオニア株式会社 音響装置、音量制御方法、音量制御プログラム及び記録媒体

Also Published As

Publication number Publication date
EP3929287A2 (en) 2021-12-29
IL256368B (en) 2021-07-29
JP2019022512A (ja) 2019-02-14
US10876100B2 (en) 2020-12-29
WO2016205613A1 (en) 2016-12-22
AU2022201165A1 (en) 2022-03-17
RU2018101710A (ru) 2019-07-19
AU2016280893B2 (en) 2021-12-02
ZA201708498B (en) 2018-11-28
IL293323A (en) 2022-07-01
CN109536474A (zh) 2019-03-29
IL256368A (en) 2019-08-29
SG10201912329YA (en) 2020-02-27
MX2022005304A (es) 2022-08-02
KR102575342B1 (ko) 2023-09-05
JP2022141778A (ja) 2022-09-29
RU2021120582A (ru) 2021-09-02
EP3129393A1 (en) 2017-02-15
JP7107683B2 (ja) 2022-07-27
US10494621B2 (en) 2019-12-03
IL293323B1 (en) 2023-09-01
CA2989830A1 (en) 2016-12-22
JP2018522546A (ja) 2018-08-16
IL284808B (en) 2022-07-01
IL293323B2 (en) 2024-01-01
IL284808A (en) 2021-08-31
EP3929287A3 (en) 2022-04-13
TW201704255A (zh) 2017-02-01
RU2752834C2 (ru) 2021-08-09
KR20180034404A (ko) 2018-04-04
US20190032036A1 (en) 2019-01-31
TWI813532B (zh) 2023-09-01
MX2017016289A (es) 2018-08-15
AU2016280893A1 (en) 2018-01-18
EP3129393B1 (en) 2021-08-04
CN108290933A (zh) 2018-07-17
JP6793699B2 (ja) 2020-12-02
KR20230132877A (ko) 2023-09-18
US20190010471A1 (en) 2019-01-10
US20200087641A1 (en) 2020-03-19
RU2018101710A3 (zh) 2019-11-20

Similar Documents

Publication Publication Date Title
TWI813532B (zh) 降低脱靶效應的crispr酶突變
JP7280312B2 (ja) 新規crispr酵素及び系
US20220162584A1 (en) Cpf1 complexes with reduced indel activity
AU2017257274B2 (en) Novel CRISPR enzymes and systems
US20190233814A1 (en) Novel crispr enzymes and systems
EP3436575A1 (en) Novel crispr enzymes and systems
TWI837592B (zh) 新型crispr酶以及系統