IT201700016321A1 - Mutanti di cas9 ad alta specificita' e loro applicazioni. - Google Patents

Mutanti di cas9 ad alta specificita' e loro applicazioni.

Info

Publication number
IT201700016321A1
IT201700016321A1 IT102017000016321A IT201700016321A IT201700016321A1 IT 201700016321 A1 IT201700016321 A1 IT 201700016321A1 IT 102017000016321 A IT102017000016321 A IT 102017000016321A IT 201700016321 A IT201700016321 A IT 201700016321A IT 201700016321 A1 IT201700016321 A1 IT 201700016321A1
Authority
IT
Italy
Prior art keywords
cas9
group
seq
modified
modified cas9
Prior art date
Application number
IT102017000016321A
Other languages
English (en)
Inventor
Anna Cereseto
Antonio Casini
Gianluca Petris
Alberto Inga
Michele Olivieri
Original Assignee
Univ Degli Studi Di Trento
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Univ Degli Studi Di Trento filed Critical Univ Degli Studi Di Trento
Priority to IT102017000016321A priority Critical patent/IT201700016321A1/it
Priority to US16/485,253 priority patent/US11525127B2/en
Priority to EP18708920.6A priority patent/EP3583209A1/en
Priority to CA3053218A priority patent/CA3053218A1/en
Priority to CN201880011895.5A priority patent/CN110520528A/zh
Priority to MX2019009651A priority patent/MX2019009651A/es
Priority to JP2019565062A priority patent/JP7232531B2/ja
Priority to EA201991913A priority patent/EA037825B1/ru
Priority to BR112019016765-0A priority patent/BR112019016765A2/pt
Priority to KR1020197026441A priority patent/KR20190116407A/ko
Priority to PCT/EP2018/053717 priority patent/WO2018149888A1/en
Priority to AU2018221644A priority patent/AU2018221644A1/en
Publication of IT201700016321A1 publication Critical patent/IT201700016321A1/it

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y301/00Hydrolases acting on ester bonds (3.1)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/70Fusion polypeptide containing domain for protein-protein interaction
    • C07K2319/71Fusion polypeptide containing domain for protein-protein interaction containing domain for transcriptional activaation, e.g. VP16
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/80Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Description

DOMANDA DI BREVETTO DI INVENZIONE INDUSTRIALE DAL TITOLO:
MUTANTI DI CAS9 AD ALTA SPECIFICITA' E LORO APPLICAZIONI
Campo dell’invenzione
La presente invenzione appartiene ai campi degli enzimi e delle proteine che legano gli acidi nucleici, in particolare varianti di Cas9.
Stato della tecnica
Il numero di applicazioni tecnologiche che coinvolgono il sistema CRISPR-Cas9 ha osservato un aumento enorme negli anni passati, spinto dalla flessibilità e dall’efficacia di questo nuovo strumento di editing del genoma. Solitamente, i siti bersaglio sono riconosciuti da Cas9 attraverso una cosiddetta sequenza di “RNA guida” (gRNA) complementare a un acido nucleico bersaglio che include una sequenza proto-spaziatrice. Il riconoscimento del bersaglio richiede anche la presenza in prossimità di una corta sequenza PAM (motivo adiacente al protospaziatore). Solitamente, l’acido nucleico bersaglio è DNA, ma in alcune circostanze può essere anche RNA. Gli RNA guida possono essere formati da uno o più corti RNA. L’editing del genoma mediante l’approccio con CRISPR-Cas9 è stato applicato con successo su una varietà di tipi e specie cellulari, dimostrando chiaramente l’efficacia e la solidità che devono caratterizzare una tecnologia rivoluzionaria. In modo importante, sia la ricerca di base sia le applicazioni a orientamento terapeutico, a parte l’efficacia, richiedono elevata specificità di taglio per l’editing. Tuttavia, svariati studi hanno dimostrato che i tagli di Cas9 nel genoma non sono sempre diretti ai siti destinati e lesioni indesiderate possono essere introdotte in regioni di DNA che condividono livelli differenti di similarità con il bersaglio selezionato. In aggiunta, la previsione di tale attività indesiderata è difficile e spesso inaffidabile, per via dell’assenza di regole semplici che governano il fenomeno. Inoltre, la stima degli effetti fuori bersaglio non è sempre semplice e i risultati ottenuti applicando metodi differenti sono spesso non conformi. Quindi, il potenziamento della specificità del kit di strumenti CRISPR-Cas9 è un miglioramento altamente auspicabile di questa tecnologia fondamentale, consentendo il suo uso sicuro in tutti i campi di applicazione, in particolare nelle applicazioni terapeutiche umane.
Strategie differenti sono state proposte per ridurre l’introduzione di mutazioni indesiderate fuori bersaglio da parte di CRISPR-Cas9, come lo stretto controllo dei livelli intracellulari di Cas9 di Streptococcus pyogenes (SpCas9), l’introduzione di gRNA ingegnerizzati caratterizzati da proto-spaziatori più corti con minore complementarietà verso la sequenza bersaglio (gRNA troncati), la fusione di SpCas9 a domini di legame al DNA specifici per dirigere il suo legame o l’utilizzo di nickasi di SpCas9 appaiate e SpCas9 cataliticamente inattive appaiate e fuse al dominio endonucleasico di Fokl. Tuttavia, nessuno di questi approcci elimina completamente i bersagli errati e per via della loro complessità molecolare intrinseca sono spesso privi di attività sul bersaglio desiderato.
Recentemente, due gruppi hanno riportato l’ingegnerizzazione razionale guidata da struttura di varianti di SpCas9 caratterizzate da una propensione più bassa a tagliare siti fuori bersaglio. Slaymaker IM et al. (Science. 2016, 351(6268):84-8) hanno generato tre mutanti di SpCas9 sia con efficienza elevata (vicino ai livelli wildtype di formazione di indel, inserzioni-delezioni, sul bersaglio) che con specificità elevata (nessuna formazione di indel rilevabile in corrispondenza di siti fuori bersaglio relativi ai geni EMX(1) e VEGFA(1), loci standard per il saggio di specificità): SpCas9 (K855A), SpCas9 (K810A/K1003A/R1060A) [denominato anche eSpCas9(1.0)], e SpCas9 (K848A/K1003A/R1060A) [denominato anche eSpCas9(1.1)].
Kleinstiver BP et al. (Nature.2016, 529(7587):490-5) hanno generato 15 differenti varianti di SpCas9 caratterizzate da tutte le singole, doppie, triple e quadruple combinazioni possibili delle sostituzioni N497A, R661A, Q695A, e Q926A. La variante mutante tripla (R661A/Q695A/Q926A) e la variante caratterizzata da quattro sostituzioni (N497A/R661A/Q695A/Q926A, più avanti denominata SpCas9-HF1) hanno mostrato entrambe minimo editing di EGFP, a livelli quasi non misurabili, quando guidate da quattro sgRNA disappaiati.
Inoltre, da questi recenti sforzi, è evidente che una delle principali necessità nel campo è la generazione di sistemi di editing del genoma senza alcuna attività non desiderata.
L’obiettivo della presente invenzione è fornire nuove varianti, almeno alternative, di Cas9 ad alta fedeltà.
Sommario dell’invenzione
L’argomento oggetto della presente invenzione è una molecola di Cas9 modificata comprendente almeno una mutazione localizzata in corrispondenza di una posizione di residuo amminoacidico selezionata nel gruppo costituito da: K377, E387, D397, R400, D406, A421, L423, R424, Q426, Y430, K442, P449, V452, A456, R457, W464, M465, K468, E470, T474, P475, W476, F478, K483, S487, A488, T496, F498, L502, N504, K506, P509, F518, N522, E523, K526, L540, S541, I548, D550, F553, V561, K562, E573, A589, L598, D605, L607, N609, N612, E617, D618, D628, R629, R635, K637, L651, K652, R654, T657, G658, L666, K673, S675C, I679V, L680, L683, N690, R691, N692, F693, S701, F704, Q712, G715, Q716, H723, I724, L727, I733, L738 e Q739;
in cui la posizione degli amminoacidi modificati è identificata mediante riferimento alla numerazione degli amminoacidi nella posizione corrispondente di una Cas9 di Streptococcus pyogenes (SpCas9) matura non modificata, come identificata da SEQ ID NO: 1.
In una forma di realizzazione preferita, la Cas9 modificata comprende almeno una mutazione in corrispondenza della posizione K526.
Le varianti di SpCas9 secondo l’invenzione sono state inizialmente ottenute mediante mutagenesi casuale del suo dominio REC1-II e sono state sottoposte a screening per l’identificazione di mutanti con rapporti on/off aumentati mediante un saggio basato su lievito che consente di valutare simultaneamente l’attività specifica ed aspecifica utilizzando due bersagli genomici ingegnerizzati. Dopo ulteriore validazione in cellule di mammifero, le varianti di SpCas9 secondo l’invenzione sono state generate. Sorprendentemente, una SpCas9 modificata secondo l’invenzione ha mostrato un’attività aspecifica significativamente ridotta rispetto a SpCas9 wildtype e analisi in parallelo a varianti precedentemente riportate e generate in modo razionale hanno dimostrato un miglioramento significativo nella fedeltà di una variante di SpCas9 dell’invenzione. In aggiunta, una SpCas9 modificata secondo l’invenzione e avente le mutazioni aggiuntive D10A e H840A fuse con un dominio di attivazione trascrizionale (VP64) ha mostrato un’attività fuori bersaglio significativamente ridotta rispetto alla variante di SpCas9 wild-type contenente unicamente le mutazioni D10A e H840A.
Descrizione dettagliata dell’invenzione
La presente invenzione descrive molecole di Cas9 con specificità aumentata ottenute attraverso mutagenesi casuale del dominio REC1-II di Cas9 e screening usando un saggio basato su lievito per valutare simultaneamente l’attività specifica ed aspecifica di ciascuna variante generata. I mutanti selezionati sono stati ulteriormente raffinati mediante screening in un sistema di mammifero.
In un primo aspetto dell’invenzione, le varianti di Cas9 comprendono almeno una mutazione localizzata in corrispondenza di un residuo amminoacidico selezionato nel gruppo costituito da: K377, E387, D397, R400, D406, A421, L423, R424, Q426, Y430, K442, P449, V452, A456, R457, W464, M465, K468, E470, T474, P475, W476, F478, K483, S487, A488, T496, F498, L502, N504, K506, P509, F518, N522, E523, K526, L540, S541, I548, D550, F553, V561, K562, E573, A589, L598, D605, L607, N609, N612, E617, D618, D628, R629, R635, K637, L651, K652, R654, T657, G658, L666, K673, S675C, I679V, L680, L683, N690, R691, N692, F693, S701, F704, Q712, G715, Q716, H723, I724, L727, I733, L738 e Q739;
in cui la posizione degli amminoacidi modificati è identificata mediante riferimento alla numerazione degli amminoacidi nella posizione corrispondente di una Cas9 di Streptococcus pyogenes (SpCas9) matura e non modificata, come identificato da SEQ ID NO: 1.
Preferibilmente, secondo l’invenzione, la mutazione in corrispondenza della posizione K526 è selezionata nel gruppo costituito da K526N e K526E; più preferibilmente K526E.
Secondo una forma di realizzazione preferita dell’invenzione, la Cas9 modificata avente il residuo K526 mutato comprende una o più ulteriori mutazioni localizzate in corrispondenza dei residui amminoacidici selezionati nel gruppo costituito da: K377, E387, D397, R400, Q402, R403, F405, D406, N407, A421, L423, R424, Q426, Y430, K442, P449, Y450, V452, A456, R457, W464, M465, K468, E470, T472, I473, T474, P475, W476, F478, K483, S487, A488, M495, T496, N497, F498, L502, N504, K506, P509, Y515, F518, N522, E523, K526, L540, S541, I548, D550, F553, V561, K562, E573, A589, L598, D605, L607, N609, N612, E617, D618, D628, R629, R635, K637, L651, K652, R654, T657, G658, W659, R661, L666, K673, S675C, I679V, L680, L683, N690, R691, N692, F693, Q695, H698, S701, F704, Q712, G715, Q716, H721, H723, I724, L727, A728, I733, L738, Q739.
Le ulteriori mutazioni sono un numero compreso tra 1 e 8.
Preferibilmente, l’una o più ulteriori mutazioni sono selezionate nel gruppo costituito da: K377E, E387V, D397E, R400H, Q402R, R403H, F405L, D406Y, D406V, N407P, N407H, A421V, L423P, R424G, Q426R, Y430C, K442N, P449S, Y450A,Y450S, Y450H, Y450N, V452I, A456T, R457P, R457Q, W464L, M465R, K468N, E470D, T472A, I473F, I473V, T474A, P475H, W476R, F478Y, F478V, K483M, S487Y, A488V, M495V, M495T, T496A, N497A, F498I, F498Y, L502P, N504S, K506N, P509L, Y515N, F518L, F518I, N522K, N522I, E523K, E523D, L540Q, S541P, I548V, D550N, F553L, V561M, V561A, K562E, E573D, A589T, L598P, D605V, L607P, N609D, N609S, N612Y, N612K, E617K, D618N, D628G, R629G, R635G, K637N, L651P, L651H, K652E, R654H, T657A, G658E, W659R, R661A, R661W, R661L, R661Q, R661S, L666P, K673M, S675C, I679V, L680P, L683P, N690I, R691Q, R691L, N692I, F693Y, Q695A, Q695H, Q695L, H698Q, H698P, S701F, F704S, Q712R, G715S, Q716H, H721R, H723L, I724V, L727H, A728G, A728T, I733V, L738P, Q739E, Q739P e Q739K.
In forme di realizzazioni preferite, il numero totale delle mutazioni summenzionate è compreso tra 1 e 9; preferibilmente tra 1 e 5; in modo maggiormente preferibile tra 1 e 4.
SEQ ID N: 1 è la sequenza avente il numero di accesso NP_269215 (NCBI) denominata SpCas9.
Secondo l’invenzione, il polipeptide modificato, escluse le mutazioni, ha preferibilmente un’identità di almeno il 50%, 60%, 70%, 80%, 90%, 95%, 99% o 100% con SEQ ID N: 1.
L’identità percentuale tra due polipeptidi o sequenze di acido nucleico può essere determinata dagli esperti nella tecnica mediante l’uso di software di allineamento (ad esempio il programma BLAST).
Preferibilmente, la Cas9 modificata è una Cas9 di S. pyogenes. In alcune forme di realizzazione, Cas9 è un ortologo di SpCas9 (per esempio proveniente da S. thermophilus, S. aureus, N meningitides). In alcune forme di realizzazione, l’ortologo di Cas9 ha almeno il 10% o il 25% di identità di amminoacidi rispetto al dominio Rec1-II di SpCas9 e identità di amminoacidi complessiva di qualsiasi percentuale tra il 10% o il 25% e il 100% rispetto a SpCas9. Gli esperti nella tecnica possono determinare i residui omologhi appropriati da modificare mediante gli allineamenti di sequenza e/o strutturali. Gli amminoacidi identificati possono essere modificati in modo conservativo con sostituzioni all’interno dei seguenti gruppi: glicina, alanina; valina, isoleucina, leucina; acido aspartico, acido glutammico, asparagina, glutammina; serina, treonina; lisina, arginina; fenilalanina, tirosina.
Il polipeptide modificato conserva la capacità di interagire con i gRNA e/o con un DNA o RNA bersaglio.
Secondo l’invenzione, una mutazione X1nnnX2 significa che in corrispondenza della posizione nnn l’amminoacido X2 è presente al posto dell’amminoacido X1 che è presente nel polipeptide wild-type; di conseguenza, per esempio, K526E significa che l’amminoacido in corrispondenza della posizione 526 corrisponde a un acido glutammico (Glu o E), al posto dell’amminoacido lisina (Lys o K) che è presente nel polipeptide wild-type.
Secondo una forma di realizzazione preferita dell’invenzione, il polipeptide Cas9 modificato comprende una mutazione in corrispondenza della posizione K526 e una o più mutazioni ulteriori in corrispondenza della posizione selezionata nel gruppo costituito da Y450, M495, Y515, R661, N690, R691, Q695, H698; preferibilmente M495, Y515, R661, H698.
Secondo una forma di realizzazione preferita dell’invenzione, l’almeno una mutazione ulteriore è selezionata nel gruppo costituito da Y450S, M495V, Y515N, R661X, N690I, R691Q, Q695H, H698Q; preferibilmente selezionata nel gruppo costituito da M495V, Y515N, K526E, R661X, H698Q; in cui X è un amminoacido selezionato nel gruppo costituito da L, Q e S; preferibilmente X è Q o S.
Secondo una forma di realizzazione preferita dell’invenzione, il polipeptide Cas9 modificato comprende una mutazione doppia selezionata nel gruppo costituito da K526E+Y450S, K526E+M495V, K526E+Y515N, K526E+R661X, K526E+N690I, K526E+R691Q, K526E+Q695H e K526E+H698Q; in cui X è un amminoacido selezionato nel gruppo costituito da L, Q e S; preferibilmente X è Q o S.
Secondo una forma di realizzazione preferita dell’invenzione, il polipeptide Cas9 modificato come descritto sopra comprende una mutazione tripla selezionata nel gruppo costituito da M495V+K526E+R661X, Y515N+K526E+R661X, K526E+R661X+H698Q e M495V+Y515N+K526E; in cui X è un amminoacido selezionato nel gruppo costituito da L, Q e S; preferibilmente X è Q o S.
Secondo una forma di realizzazione preferita dell’invenzione, il polipeptide Cas9 modificato come descritto sopra comprende una mutazione quadrupla selezionata nel gruppo costituito da M495V+Y515N+K526E+R661X e M495V+K526E+R661X+H698Q; in cui X è un amminoacido selezionato nel gruppo costituito da L, Q e S; preferibilmente X è Q o S.
È maggiormente preferito un polipeptide Cas9 modificato come descritto sopra comprendente una mutazione quadrupla M495V+Y515N+K526E+R661Q (più avanti denominata anche evoCas9) o M495V+Y515N+K526E+R661S (più avanti denominata anche evoCas9-II).
Per un aspetto, oggetto della presente invenzione è un polipeptide Cas9 modificato isolato comprendente almeno una mutazione selezionata nel gruppo costituito da K377E, E387V, D397E, R400H, Q402R, R403H, F405L, D406Y, D406V, N407P, N407H, A421V, L423P, R424G, Q426R, Y430C, K442N, P449S, Y450S, Y450H, Y450N, V452I, A456T, R457P, R457Q, W464L, M465R, K468N, E470D, T472A, I473F, I473V, T474A, P475H, W476R, F478Y, F478V, K483M, S487Y, A488V, M495V, M495T, T496A, F498I, F498Y, L502P, N504S, K506N, P509L, Y515N, F518L, F518I, N522K, N522I, E523K, E523D, K526E, K526N, L540Q, S541P, I548V, D550N, F553L, V561M, V561A, K562E, E573D, A589T, L598P, D605V, L607P, N609D, N609S, N612Y, N612K, E617K, D618N, D628G, R629G, R635G, K637N, L651P, L651H, K652E, R654H, T657A, G658E, W659R, R661W, R661L, R661Q, R661S, L666P, K673M, S675C, I679V, L680P, L683P, N690I, R691Q, R691L, N692I, F693Y, Q695H, Q695L, H698Q, H698P, S701F, F704S, Q712R, G715S, Q716H, H721R, H723L, I724V, L727H, A728G, A728T, I733V, L738P, Q739E, Q739P e Q739K.
Secondo una forma di realizzazione preferita, l’invenzione si riferisce a un polipeptide Cas9 modificato comprendente:
una mutazione singola selezionata nel gruppo costituito da D406Y, W464L, T474A, K526E, N612K, L683P; o
una mutazione doppia selezionata nel gruppo costituito da R400H+Y450S, D406V+E523K, A421V+R661W, R424G+Q739P, W476R+L738P, P449S+F704S, N522K+G658E, E523D+E617K, L540Q+L607P, W659R+R661W, S675C+Q695L e I679V+H723L; o
una mutazione tripla selezionata nel gruppo costituito da K377E+L598P+L651H, D397E+Y430C+L666P, Q402R+V561M+Q695L, N407P+F498I+P509L, N407H+K637N+N690I, Y450H+F553L+Q716H, Y450N+H698P+Q739K, T472A+P475H+A488V, I473F+D550N+Q739E, F478Y+N522I+L727H, K483M+Q695H+Q712R, S487Y+N504S+E573D, T496A+N609D+A728G, R654H+R691Q+H698Q e R691L+H721R+I733V;
una mutazione quadrupla selezionata nel gruppo costituito da F405L+F518L+L651P+I724V, L423P+M465R+Y515N+K673M, R457P+K468N+R661W+G715S, E470D+I548V+A589T+Q695H, A488V+D605V+R629G+T657A e M495V+K526N+S541P+K562E; o
cinque mutazioni selezionate nel gruppo costituito da R403H+N612Y+L651P+K652E+G715S;
sei mutazioni selezionate nel gruppo costituito da E387V+V561A+D618N+D628G+L680P+S701F,
R403H+K526E+N612Y+L651P+K652E+G715S,
R403H+M495T+N612Y+L651P+K652E+G715S,
R403H+L502P+N612Y+L651P+K652E+G715S,
R403H+K506N+N612Y+L651P+K652E+G715S,
R403H+N612Y+L651P+K652E+N692I+G715S; o
sette mutazioni selezionate nel gruppo costituito da R403H+A456T+N612Y+L651P+K652E+G715S+G728T,
R403H+F498Y+N612Y+L651P+K652E+R661L+G715S,
R403H+Q426R+F478V+N612Y+L651P+K652E+G715S; o
otto mutazioni selezionate nel gruppo costituito da R403H+R442N+V452I+N609S+N612Y+R635G+L651P+K652E+F693Y+G715S; o nove mutazioni selezionate nel gruppo costituito da R403H+R457Q+F518I+N612Y+R635G+L651P+K652E+F693Y+G715S.
Preferibilmente, secondo l’invenzione, il polipeptide Cas9 modificato comprende almeno una mutazione selezionata nel gruppo costituito da Y450S, M495V, Y515N, K526E, R661X, N690I, R691Q, Q695H, H698Q; in cui X è selezionato nel gruppo costituito da L, Q e S; preferibilmente X è Q o S.
In alcune forme di realizzazione, dette mutazioni identificate per Cas9 sono idonee a migliorare la specificità di altre varianti della nucleasi Cas9 finora riportate ((SpCas9-HF1-4, eSpCas9(1.0) –(1.1.)). Pertanto, facoltativamente, la variante di Cas9 descritta sopra può ulteriormente comprendere una o più mutazioni aggiuntive in corrispondenza dei residui L169A, K810A, K848A, Q926A, R1003A, R1060A, D1135E.
In alcune forme di realizzazione, dette mutazioni identificate per Cas9 sono idonee a migliorare la specificità di Cas9-nickasi, dCas9-FokI o dCas9. Pertanto, facoltativamente, la variante di Cas9 descritta sopra può ulteriormente comprendere almeno una mutazione aggiuntiva in corrispondenza di un residuo selezionato nel gruppo costituito da D10, E762, D839, H840, N863, H983 e D986 per diminuire l’attività nucleasica. Preferibilmente, tali mutazioni aggiuntive sono D10A, o D10N e H840A, H840N o H840Y. Preferibilmente, dette mutazioni generano una nickasi Cas9 o una Cas9 cataliticamente inattiva (Ran F et al. Cell. 2013, 154(6):1380-1389; Maeder M et al. Nature Methods. 2013, 10(10):977-979).
In alcune forme di realizzazione, dette mutazioni identificate per Cas9 sono idonee a migliorare la specificità di varianti della nucleasi Cas9 che riconoscono sequenze PAM alternative. Pertanto, facoltativamente, la variante di Cas9 descritta sopra può ulteriormente comprendere una o più mutazioni aggiuntive in corrispondenza dei residui D1135V/R1335Q/T1337R (variante QVR), D1135E/R1335Q/T1337R (variante EVR), D1135V/G1218R/R1335Q/T1337R (variante VRQR), D1135V/G1218R/R1335E/T1337R (variante VRER) secondo il brevetto statunitense US20160319260.
Ulteriore oggetto della presente invenzione è anche una variante della proteina SpCas9 come descritto sopra fusa ad altre sequenze polipeptidiche.
Preferibilmente la variante di Cas9 è fusa a sequenze amminoacidiche che codificano marcatori peptidici (vale a dire V5-tag, FLAG-tag, myc-tag, HA-tag, GST-tag, polyHis-tag, MBP-tag), proteine, domini proteici, modulatori della trascrizione, enzimi che agiscono su piccole molecole, DNA, RNA ed enzimi di modificazione delle proteine (vale a dire adenosina deaminasi, citidina deaminasi, guanosil transferasi, DNA metiltransferasi, RNA metiltransferasi, DNA demetilasi, RNA demetilasi, diossigenasi, poliadenilato polimerasi, pseudouridina sintasi, acetiltransferasi, deacetilasi, ubiquitin-ligasi, deubiquitinasi, chinasi, fosfatasi, NEDD8-ligasi, de-NEDDilasi, SUMO-ligasi, deSUMOilasi, istone deacetilasi, istone acetiltransferasi, istone metiltransferasi, istone demetilasi), domini di legame al DNA, proteine di legame dell’RNA, sequenze polipeptidiche con funzioni biologiche specifiche (vale a dire segnali di localizzazione nucleare, segnali di localizzazione mitocondriale, segnali di localizzazione plastidica, segnali di localizzazione subcellulare, segnali di destabilizzazione, motivi della “destruction box” della Geminina), domini di legame a specifiche strutture molecolari (vale a dire MS2, Csy4 e proteina lambda N).
Ulteriore oggetto della presente invenzione è un metodo per produrre una variante di Cas9 come descritto sopra, detto metodo comprendente la ricostruzione della variante di Cas9 da uno o più suoi frammenti; preferibilmente mediante l’introduzione di un’inteina o un introne proteico o un dominio di dimerizzazione all’interno del polipeptide Cas9.
In alcune forme di realizzazione, la fase di ricostituzione può essere eseguita in vitro, in alcune altre forme di realizzazione essa può essere eseguita in vivo (vedere di seguito).
Preferibilmente, tali frammenti possono essere indotti a ricostituire la proteina Cas9 mediante dimerizzazione di una split-Cas9 (Wright AV et al. PNAS 2015 12(10):2984-9; Liu KI et al. Nat Chem Biol.2016, 12(11):980-987).
Preferibilmente, tali frammenti possono essere indotti a ricostituire la proteina Cas9 cataliticamente attiva mediante dimerizzazione con inteine di una split-Cas9 (Truong DJ et al. Nucleic Acids Res 43(13):6450-8).
Secondo l’invenzione, un vettore è un sistema idoneo alla somministrazione o all’espressione di una sequenza nucleotidica o proteica.
Ulteriore oggetto della presente invenzione è anche dato da complessi ribonucleoproteici o complessi proteici, ribonucleoproteici e lipidici misti contenenti il polipeptide Cas9 modificato (complessi Cas9-sgRNA, e loro coniugati con proteine, acido nucleici o componenti lipidici aggiuntivi come ad esempio peptidi di penetrazione cellulare, aptameri di acidi nucleici e vescicole lipidiche).
Ulteriore oggetto della presente invenzione è un vettore proteico o ribonucleoproteico contenente il polipeptide Cas9 modificato. In alcune forme di realizzazione, tale vettore è un complesso o vescicola naturale o artificiale (vedere sopra). In alcune forme di realizzazione, tale vettore è derivato da una cellula di packaging o di rilascio. In alcune forme di realizzazione, tale vettore è costituito da strutture a base di vescicole extracellulari (vale a dire in via non limitativa esosomi e strutture simili a esosomi), o particelle virali o particelle simil-virali contenenti il polipeptide Cas9 modificato secondo l’invenzione.
Ulteriore oggetto della presente invenzione è una sequenza di nucleotidi codificanti per un polipeptide Cas9 modificato come descritto sopra o per suoi frammenti. Preferibilmente, secondo l’invenzione, la sequenza di nucleotidi codificante una Cas9 modificata come descritto sopra, o suoi frammenti, è basata su SEQ ID N: 2, che è la sequenza avente il numero di accesso NC_002737, o SEQ ID N.3, che è stata ottenuta attraverso l’ottimizzazione dei codoni per l’espressione nelle cellule umane, e presenta sostituzioni di base corrispondenti alle mutazioni descritte sopra. La sequenza di nucleotidi dell’invenzione, codificante un polipeptide Cas9 modificato, escluse le mutazioni, ha preferibilmente un’identità di almeno il 50%, 60%, 70%, 80%, 90%, 95%, 99% o 100% con SEQ ID N: 2 o SEQ ID N: 3.
Ulteriore oggetto della presente invenzione è un acido nucleico comprendente la sequenza di nucleotidi come descritto sopra.
Un metodo per produrre un polipeptide Cas9 modificato come descritto sopra, con cui il polipeptide Cas9 modificato è espresso per mezzo di un acido nucleico come descritto sopra.
Ulteriore oggetto della presente invenzione è un vettore comprendente l’acido nucleico come descritto sopra, in cui detto vettore è idoneo all’espressione genica in cellule procariotiche o cellule eucariotiche (per esempio, lievito, cellule di mammifero, cellule di insetto, cellule vegetali). Preferibilmente, il vettore può essere, in via non limitativa, un plasmide, un fagemide, un cromosoma artificiale batterico o di lievito, un frammento di DNA o RNA, o un vettore basato su Agrobacterium, o un vettore virale.
Preferibilmente, l’acido nucleico dell’invenzione è somministrato attraverso lentiSLiCES consentendo un ulteriore aumento della specificità attraverso un circuito auto-limitante come descritto nella domanda di brevetto italiana IT 102016000102542. Preferibilmente, l’acido nucleico dell’invenzione è somministrato attraverso un vettore retrovirale, un vettore EIAV, un vettore SIV, un vettore adenovirale, un vettore AAV, un vettore basato sul virus dell’herpes, un vettore basato su Baculovirus, un vettore basato sul virus del vaccino, un vettore basato sul virus Sendai o un batteriofago. Preferibilmente, il vettore del batteriofago è basato sul fago λ, sul fago M13, o sul fago P1.
Ulteriore oggetto della presente invenzione è un acido nucleico comprendente frammenti della sequenza di nucleotidi come descritto sopra.
Preferibilmente, quando i polipeptidi tradotti codificati da due o più acidi nucleici differenti comprendenti frammenti della sequenza di nucleotidi come descritto sopra possono essere usati in vitro o in vivo per ricostituire una variante di Cas9 cataliticamente attiva come descritto sopra.
Preferibilmente, se tali frammenti di Cas9 possono essere usati per ricostituire l’espressione della proteina Cas9 a livello del DNA mediante sfruttamento della ricombinazione tra vettori virali differenti (vale a dire Wu Z et al. Mol Ther. 2010, 18(1)80-86).
Preferibilmente, se tali frammenti di Cas9 possono essere usati per ricostituire una proteina Cas9 a livello della trascrizione mediante sfruttamento del trans-splicing (Fine EJ et al. Sci Rep.2015, 5:10777).
Ulteriore oggetto della presente invenzione è anche una cellula ingegnerizzata per codificare un acido nucleico o un vettore come descritto sopra o una cellula modificata permanentemente mediante la variante di Cas9 dell’invenzione.
Preferibilmente, la cellula ingegnerizzata è una cellula procariotica, più preferibilmente un batterio.
Preferibilmente, la cellula ingegnerizzata è una cellula eucariotica. Preferibilmente è una cellula animale. Preferibilmente, la cellula ingegnerizzata è una cellula di mammifero. Più preferibilmente è una cellula umana. Preferibilmente, la cellula ingegnerizzata è una cellula somatica, più preferibilmente è una cellula tumorale, in modo maggiormente preferibile è una cellula staminale o una cellula staminale pluripotente indotta.
Ulteriore oggetto ulteriore della presente invenzione è anche un animale ingegnerizzato per codificare un acido nucleico o un vettore come descritto sopra o un animale modificato permanentemente mediante la variante di Cas9 dell’invenzione. Preferibilmente, l’animale è un organismo modello (vale a dire, ad esempio, Drosophila melanogaster, topo, zanzara, ratto), o l’animale è un animale di fattoria o un pesce allevato o un animale domestico. Preferibilmente, l’animale è un vettore per almeno una malattia. Più preferibilmente, l’organismo è un vettore per malattie umane (vale a dire, zanzare, zecche, uccelli).
Ulteriore oggetto della presente invenzione è una pianta ingegnerizzata usando un acido nucleico o un vettore come descritto sopra o una pianta modificata permanentemente mediante la variante di Cas9 dell’invenzione. Preferibilmente, la pianta è una coltura (vale a dire riso, soia, grano, tabacco, cotone, erba medica, colza, mais, barbabietola da zucchero).
Ulteriore oggetto della presente invenzione è anche un metodo per modificare permanentemente una cellula, un animale o una pianta, detto metodo comprendente l’uso di una molecola di Cas9 dell’invenzione per editare il DNA della cellula, dell’animale o della pianta.
Ulteriore oggetto della presente invenzione è anche una sequenza di nucleotidi o un acido nucleico o un vettore, come descritto sopra, per l’uso come un medicinale per la terapia genica.
Ulteriore oggetto ulteriore della presente invenzione è anche una composizione farmaceutica comprendente una sequenza di nucleotidi o un acido nucleico o un vettore, come descritto sopra, e almeno un eccipiente farmaceuticamente accettabile.
Ulteriore oggetto ulteriore della presente invenzione è anche una composizione farmaceutica comprendente un polipeptide di Cas9 ricombinante, contenente le mutazioni descritte sopra, e almeno un eccipiente farmaceuticamente accettabile. Ulteriore oggetto della presente invenzione è anche l’uso in vitro di una sequenza di nucleotidi o un acido nucleico o un vettore, come descritto sopra, per ingegneria genomica, ingegneria cellulare, espressione proteica o altre applicazioni di biotecnologia.
Ulteriore oggetto della presente invenzione è l’uso in vitro di un polipeptide di Cas9 ricombinante, contenente le mutazioni descritte sopra, unitamente a un gRNA per ingegneria genomica, ingegneria cellulare, espressione proteica o altre applicazioni di biotecnologia.
Ulteriore oggetto della presente invenzione è un kit di parti, per uso simultaneo, separato o sequenziale, comprendente una sequenza di nucleotidi o un acido nucleico o un vettore o un polipeptide di Cas9 ricombinante come descritto sopra. Un metodo in vitro o in vivo per alterare il genoma di una cellula, il metodo comprendendo l’espressione nella cellula di Cas9 modificata come descritto sopra unitamente a un RNA guida che identifica una sequenza genomica specifica.
Un metodo in vitro o in vivo per alterare il trascrittoma di una cellula, il metodo comprendendo l’espressione nella cellula del regolatore trascrizionale basato su dCas9 come descritto sopra unitamente a un RNA guida che identifica una sequenza genomica specifica.
Un metodo in vitro o in vivo per alterare l’epigenoma di una cellula, il metodo comprendendo l’espressione nella cellula dell’editor dell’epigenoma basato su dCas9 come descritto sopra unitamente a un RNA guida che identifica una sequenza genomica specifica.
La presente invenzione sarà compresa meglio alla luce degli esperimenti di seguito. Breve descrizione delle figure
Figura 1. Progettazione di un saggio in vivo basato sul lievito per quantificare l’attività specifica ed aspecifica di SpCas9. Generazione di ceppi reporter di lievito. I loci TRP1 e ADE2 sono stati modificati mediante l’inserzione di una cassetta reporter contenente un sito bersaglio (TRP1) o sequenze differenti fuori bersaglio (ADE2, le sequenze sono riportate nel riquadro in alto a destra). La presenza di regioni di omologia (HR) su entrambi i lati del bersaglio consente la riparazione efficiente mediante appaiamento del singolo filamento in seguito al taglio prodotto da Cas9. Usando piastre selettive appropriate, è possibile seguire lo stato di editing dei due loci. La sopravvivenza di una colonia indicherà il taglio sul bersaglio di TRP1, mentre il colore della colonia consente di stimare il taglio aspecifico del locus ADE2.
Figura 2. Validazione del ceppo yACMO usando SpCas wild-type. Quantificazione della percentuale media di colonie rosse (taglio specifico) e bianche (taglio aspecifico) dopo la trasformazione di SpCas9 wild-type nei ceppi reporter yACMO-off1/off4 che esprimono stabilmente un sgRNA che corrisponde alla sequenza bersaglio nel locus TRP1. L’espressione di Cas9 è stata indotta per 24 ore prima della piastratura. Le barre di errore rappresentano s.e.m. per n = 3.
Figura 3. Selezione di un dominio bersaglio per la generazione casuale della libreria. Schema dei domini di SpCas9. Il dominio Rec1-II (evidenziato) è parte del lobo di riconoscimento alfa-elicoidale. BH: elica di connessione.
Figura 4. Screening del lievito per varianti di SpCas9 ad alta specificità. (a) Rappresentazione schematica del flusso di lavoro dello screening del lievito. (b) Valutazione dell’attività di taglio e della specificità delle varianti di SpCas9 ottenute dallo screening del lievito attraverso l’analisi con il ceppo reporter yACMO-off4. L’espressione di Cas9 è stata indotta per 5 ore prima della piastratura. Per ulteriore informazioni vedere tavola di appendice 1. (c) Valutazione della specificità della variante C13. Il mutante C13 è stato trasformato nei ceppi reporter yACMO-off1/off4 che esprimono un sgRNA diretto contro il sito inserito nel locus TRP1 e la percentuale di colonie rosse (taglio specifico) e bianche (taglio aspecifico) è stata valutata dopo 24 ore di espressione di Cas9. Le barre di errore rappresentano s.e.m. per n = 3.
Figura 5. Selezione di varianti di SpCas9 ottimizzate in cellule di mammiferi. Cellule 293 esprimenti stabilmente EFGP sono state transfettate con mutanti singoli e doppi (a) come pure tripli (b) generati mediante la combinazione gerarchica di mutazioni ottenute dalle varianti isolate in lievito maggiormente performanti unitamente a un sgRNA specifico per il bersaglio (sgGFPon) o ciascuna delle guide disappaiate. La perdita di fluorescenza di EGFP è stata misurata mediante analisi FACS a 7 giorni dalla transfezione. (c) Comparazione fianco a fianco delle migliori varianti generate con mutanti precedentemente pubblicati. Il saggio di knockout di EGFP della linea cellulare 293 è stato usato per stimare la specificità delle principali varianti isolate (varianti VNEL, VNEQ e VNES) e per comparare le loro prestazioni con i mutanti ad alta fedeltà precedentemente pubblicati. La perdita della fluorescenza di EGFP è stata misurata mediante analisi FACS a 7 giorni dalla transfezione. sgGFP1314 contiene delle basi non appaianti nelle posizioni 13 e 14 dal PAM della sequenza spaziatrice; sgGFP1819 contiene delle basi non appaianti nelle posizioni 18 e 19; sgGFP18 contiene una singola base non appaiante nella posizione 18. Le linee punteggiate indicano i rapporti on/off calcolati per le coppie on/off indicate. Le linee tratteggiate indicano il livello spontaneo di perdita della fluorescenza di EGFP. Le barre di errore rappresentano s.e.m. per n ≥ 2.
Figura 6. Attività di evoCas9 contro siti contenuti nel gene EGFP. (a) Attività di evoCas9 contro i loci EGFP. Le cellule 293 esprimenti stabilmente EGFP sono state transfettate con wt SpCas9, evoCas9 (VNEQ) e la variante VNEL unitamente a sgRNA che colpiscono regioni differenti della regione codificante per EGFP. La perdita della fluorescenza di EGFP è stata misurata mediante analisi FACS a 7 giorni dalla transfezione. Le linee tratteggiate indicano il livello spontaneo di perdita della fluorescenza di EGFP. Le barre di errore rappresentano s.e.m. per n ≥ 2. (b) Rapporto tra l’attività specifica di taglio di evoCas9 o della variante VNEL e di SpCas9 wild-type calcolato sui loci EGFP. Sono mostrati la mediana e l’intervallo interquartile. Un livello dell’attività di taglio specifico superiore al 70% della proteina wt è indicato dall’area ombreggiata. (c) Espressione intracellulare di evoCas9. Western blot rappresentativo di lisati da cellule 293T transfettate con wt SpCas9, evoCas9 o le altre varianti ad alta fedeltà. La tubulina è stata usata come controllo di caricamento. SpCas9 è rilevato usando un anticorpo anti-FLAG.
Figura 7. Attività di evoCas9 su loci endogeni. (a) L’attività di wt SpCas9, evoCas9 e SpCas9-HF1 verso loci endogeni è stata comparata tramite transfezione di cellule 293T e mediante misurazione della formazione di indel a 7 giorni dalla transfezione usando il software TIDE. (b) Rapporto tra l’attività specifica di taglio di evoCas9 o SpCas9-HF1 e di SpCas9 wild-type calcolato sui loci endogeni. Sono mostrati la mediana e l’intervallo interquartile. Un livello dell’attività sul bersaglio sopra il 70% della proteina wt è indicato dall’area ombreggiata. Le barre di errore rappresentano s.e.m. per n = 2.
Figura 8. Comparazione in parallelo della specificità di evoCas9 e SpCas9-HF1. (a) Attività non specifica di evoCas9 su loci selezionati. Le cellule 293T sono state transfettate con wt SpCas9, evoCas9 o SpCas9-HF1 unitamente a sgRNA che colpiscono i loci FANCF sito 2 o CCR5 sp11. La formazione di indel in corrispondenza di due siti aspecifici precedentemente identificati è stata stimata a 7 giorni dalla transfezione usando il software TIDE. Le barre di errore rappresentano s.e.m. per n = 2. (b) Rapporti on/off calcolati dalle percentuali medie di indel ottenute in (a). Le linee tratteggiate indicano un rapporto on/off uguale a 1. (c) Rappresentazione schematica del locus CCR5 e del sito aspecifico altamente omologo ad esso associato nel gene CCR2. Il taglio simultaneo dei due siti genera una delezione cromosomica di approssimativamente 16 kb. Una PCR semiquantitativa è stata eseguita su DNA genomico di cellule 293T transfettate con wt SpCas9, evoCas9 o SpCas9-HF1 e l’RNA guida di CCR5 per stimare la quantità di delezione cromosomica generata in ciascuna condizione. Il locus FANCF è stato usato come un normalizzatore interno. La quantità di delezione è stata quantificata usando densitometria con il software ImageJ. Le barre di errore rappresentano s.e.m. per n = 2.
Figura 9. Validazione della specificità di evoCas9 mediante deep-sequencing mirato. Il deep-sequencing mirato di siti aspecifici precedentemente identificati per il locus EMX1 sito 1 (a) e il locus VEGFA sito 3 (b) è stato eseguito su DNA genomico di cellule 293T esprimenti wt Spcas9 o evoCas9 unitamente a ciascun sgRNA specifico. Le cellule non esprimenti Cas9 sono state sequenziate per determinare i livelli di indel di fondo. Il DNA genomico da tre replicati biologici è stato miscelato prima della preparazione della libreria.
Figura 10. Specificità a livello genomico di evoCas9. (a) Analisi GUIDE-seq dei siti aspecifici relativi al locus VEGFA sito 2 eseguita sia per wt SpCas9 sia per evoCas9 in cellule 293T. Il quadrato nero indica il sito specifico. (b) Numero totale di siti aspecifici rilevati per wt SpCas9 e evoCas9. Il DNA genomico da tre replicati biologici è stato miscelato prima della preparazione della libreria.
Figura 11. Attivazione trascrizionale mediata da evo-dCas9. (a) Rappresentazione schematica del reporter di attivazione trascrizionale basato su Tet Responsive Element (TRE)-EGFP. In seguito al legame di dCas9-VP64 a ripetizioni di TetO, viene attivata l’espressione di EGFP. (b) L’attivazione di EGFP è stata misurata in cellule 293T transfettate con attivatori trascrizionali basati su dCas9 o evo-dCas9 unitamente a sgRNA perfettamente appaianti con il bersaglio (con o senza una G disappaiata 5’) o guide disappaiate. TetO-off6 contiene un appaiamento errato in posizione 6 dalla PAM, TetO-off1314 contiene due appaiamenti errati in posizione 13-14 e TetO-off1819 contiene due appaiamenti errati in posizione 18-19. (c) Numero di volte di attivazione dell’espressione di EGFP rispetto al controllo non-targeting calcolato dai dati in (b). Le barre di errore rappresentano s.e.m. per n = 2. L’espressione di EGFP è stata misurata mediante analisi FACS 2 giorni dopo la transfezione.
Figura 12. Specificità a lungo termine di evoCas9. SpCas9 (a), evoCas9 (b) e SpCas9-HF1 (c) sono state stabilmente espresse attraverso l’utilizzo di vettori lentivirali in cellule 293T esprimenti stabilmente EGFP. Ciascun vettore lentivirale trasportava un sgRNA diretto verso la sequenza codificante EGFP o differenti guide disappaiate già presentate nella figura 5. Il knockout di EGFP è stato valutato mediante analisi FACS a diversi tempi dalla trasduzione come indicato nei grafici. Le cellule trasdotte sono state coltivate sotto selezione in terreno contenente puromicina. Le barre di errore rappresentano s.e.m. per n = 2
Sezione sperimentale
Progettazione di un ceppo di lievito reporter per la rilevazione dell’attività di Cas9 Saccaromyces cerevisiae è stato usato come un modello sperimentale per sviluppare uno screening di evoluzione diretto ad isolare le varianti di SpCas9 ad alta specificità. Il vantaggio di usare una piattaforma di saggio basata su lievito risiede da un lato nelle similarità che il lievito condivide con i batteri, come il tasso di raddoppiamento veloce, la possibilità di isolare singoli cloni con facilità e la disponibilità di protocolli di trasformazione veloci e affidabili; dall’altro lato, l’organizzazione del DNA e il suo metabolismo nel lievito sono simili a quelli delle cellule eucariotiche superiori. Pertanto, il modello del lievito offre una piattaforma flessibile per screening ad alta processività combinata a similarità con un sistema di mammifero che di conseguenza aumenta la solidità dell’esito dello screening. Inizialmente, è stata progettata una strategia per generare ceppi di lievito reporter auxotrofi per la misurazione simultanea dell’attività specifica ed aspecifica di Cas9. Questo approccio si è basato sul testare la modifica di due loci genomici del lievito: TRP1 (cromosoma IV) e ADE2 (cromosoma XV). Usando l’approccio del delitto perfetto, le sequenze codificanti wild-type dei due loci sono state divise in due metà separate dalla sequenza bersaglio specifica che corrisponde al sgRNA nel caso del locus TRP1 o da sequenze differenti nel caso del locus ADE2 (schematizzato nella figura 1). Ciascuna delle sequenze bersaglio inserite nel locus ADE2 (ADE2off1-off4, tabella di appendice 4) conteneva un singolo appaiamento errato posizionato a distanze crescenti dalla sequenza PAM. Una duplicazione di 100 bp è stata aggiunta su entrambi i lati della sequenza bersaglio (TRP1 o ADE2) e un codone di stop è stato posizionato immediatamente a monte, tra le due regioni di omologia, per assicurare l’interruzione prematura della traduzione (figura 1). Il knockout dei geni TRP1 e ADE2 per inserzione della cassetta reporter produce difetti nelle vie metaboliche del triptofano e dell’adenina, sopprimendo la crescita in assenza di triptofano e portando all’accumulo nel vacuolo cellulare di un prodotto intermedio di biosintesi dell’adenina quando le cellule sono fatte crescere a basse concentrazioni di adenina, conferendo di conseguenza una pigmentazione rossa caratteristica alle colonie su piastre di agar. A seguito della formazione di rotture del doppio filamento indotte da Cas9, ciascun locus può essere riparato in modo efficiente dalle cellule di lievito usando la via di riparazione che sfrutta l’appaiamento del singolo filamento grazie alla presenza delle due regioni di omologia fiancheggianti il sito bersaglio, ottenendo la reversione alla prototrofia per i due nutrienti. L’avvenuto evento di editing in corrispondenza di ciascuno dei due loci può a sua volta essere visualizzato usando piastre reporter appropriate, che sono prive di triptofano e contengono solo basse concentrazioni di adenina (SDluta5, figura 1). La lettura completa del saggio è costituita da un processo in due fasi. La prima fase è costituita dalla valutazione dell’efficienza del taglio sul bersaglio specifico mediante comparazione del numero di colonie ottenute su piastre reporter Sdluta5 con quelle ottenute dalla sola selezione del numero totale di trasformanti (piastre Sdlu). La seconda fase è costituita dal conteggio del numero di colonie rosse (TRP1<+>/ADE2-), corrispondente ai tagli specifici, e di colonie bianche (TRP1<+>/ADE2<+>) in cui anche il locus contenente i bersagli aspecifici è stato editato, su piastre reporter per la valutazione dell’attività specifica contro l’attività aspecifica di Cas9. Quattro ceppi di lievito sono stati generati contenenti quattro siti potenziali siti aspecifici (ADE2off1-off4) e sono stati nominati yACMO-off1/off4. In seguito, il tasso di reversione spontanea per i loci ADE2 e TRP1 dei differenti ceppi yACMO è stato valutato per evitare l’introduzione di qualsiasi variabile confondente nella lettura del saggio. In effetti, la reversione spontanea del locus TRP1 può portare all’isolamento di cloni falsi positivi, mentre la ricombinazione spontanea del gene ADE2 può generare colonie false negative. Per approssimare le condizioni sperimentali usate durante il nostro saggio, ciascuno dei quattro ceppi è stato separatamente trasformato con un plasmide codificante per SpCas9; dopo 24 ore di incubazione in terreno selettivo, le cellule sono state distribuite su piastre selettive per misurare il numero totale di trasformanti e 1000 volte più cellule sono state piastrate su piastre selettive private di triptofano o adenina, per contare il numero di revertanti per ciascun locus. Mediante comparazione del numero di colonie ottenuto nelle differenti condizioni selettive è stato possibile stimare una frequenza di reversione media di approssimativamente 1-1,5x10<-5>per entrambi i loci TRP1 e ADE2 indicando di conseguenza come la reversione spontanea sia trascurabile.
Validazione del ceppo reporter yACMO
La funzionalità del saggio reporter è stata validata mediante test dei quattro ceppi reporter (yACMO-off1/off4) in combinazione con SpCas9 wild-type. Per massimizzare l’efficienza complessiva, prima della trasformazione con SpCas9, ciascuno dei ceppi è stato trasformato stabilmente con un plasmide esprimente l’sgRNA-on, corrispondente perfettamente alla sequenza bersaglio nel locus TRP1. In seguito, i quattro ceppi sono stati trasformati con un plasmide per l’espressione di SpCas9 wild-type controllata da un promotore inducibile da galattosio e, dopo 4 ore di incubazione di recupero, SpCas9 è stata indotta per una durata di tempo pari ad una notte in terreno contenenti galattosio prima della piastratura su piastre SDlu e Sdluta5 (piastre reporter). In queste condizioni sperimentali abbiamo coerentemente raggiunto il 100% di taglio sul bersaglio, mentre l’attività aspecifica, misurata come la percentuale di colonie bianche (TRP1<+>/ADE2<+>) su piastre reporter, è aumentata in conformità con la distanza della base disappaiata dalla sequenza PAM, come atteso (figura 2). Per i due bersagli errati con base disappaiata più distale dalla PAM (off3 e off4), SpCas9 è stata completamente incapace di distinguere tra la sequenza specifica e le corrispondenti sequenze disappaiate (figura 2). Considerando questi risultati, le varianti SpCas9 sono state sottoposte a screening usando il ceppo yACMO-off4, contenente la sequenza aspecifica più forte, al fine di selezionare mutanti con un aumento marcato nella fedeltà.
Screening basato su lievito per varianti SpCas9 ad alta specificità
A differenza di studi precedentemente pubblicati (Slaymaker IM et al., Science.
2016, 351(6268):84-8; Kleinstiver BP et al., Nature. 2016, 529(7587):490-5), gli inventori ritenevano che un approccio senza bias poteva portare all’isolamento di sostituzioni amminoacidiche non banali aumentando la probabilità di ottenere una variante di SpCas9 con fedeltà più alta. Per trovare un bersaglio idoneo per la mutagenesi casuale, i dati strutturali disponibili sono stati analizzati per identificare quale dominio di SpCas9 fosse più coinvolto nella formazione di tale tipo di interazioni. Il lobo nucleasico di Cas9 è stato escluso da questa analisi, poiché contiene i due siti catalitici che devono essere preservati per mantenere l’attività di taglio. È stato riportato che il lobo di riconoscimento, contenente i domini Rec1, Rec2 e dell’elica di connessione crea svariati contatti con la doppia elica di gRNA:DNA. In aggiunta, il lobo di riconoscimento nel complesso è una delle regioni meno conservate tra tutte e tre le famiglie di Cas9 appartenenti ai sistemi CRISPR di tipo II, indicando un grado elevato di plasticità della sequenza. Al contrario, l’elica a ponte è una delle regioni più conservate tra i differenti ortologhi di Cas9, suggerendo che la sua sequenza sia particolarmente importante per la funzione nucleasica. Le regioni Rec1-Rec2 misurano più di 600 amminoacidi, una dimensione non idonea alla mutagenesi casuale, ma la maggioranza dei residui interagenti con il DNA target è localizzata nell’ultima porzione del dominio Rec1-II, approssimativamente tra il residuo 400 e 700 (figura 3).
Una libreria di varianti del dominio REC1-II, generata mediante “error-prone” PCR in modo da contenere approssimativamente 4-5 mutazioni per molecola, è stata assemblata direttamente nel ceppo di lievito reporter yACMO-off4 sfruttando la ricombinazione omologa tra i frammenti di REC1-II mutagenizzati, contenenti braccia di omologia appropriate, e un plasmide che esprime una SpCas9 inducibile da galattosio in cui la stessa regione era stata precedentemente rimossa. Il flusso di lavoro dello screening complessivo è schematizzato nella figura 4a. Dopo la cotrasformazione e un’incubazione di recupero per una durata di tempo pari ad una notte in terreno SDlu per consentire la riparazione del plasmide codificante Cas9 mediante ricombinazione omologa e la selezione delle cellule trasformate, le colture sono state indotte per 5 ore con galattosio per esprimere SpCas9 e in seguito piastrate su svariate piastre reporter SDluta5. Il tempo di induzione è stato abbreviato, rispetto ad esperimenti precedenti, per ottenere varianti in grado di mantenere attività nucleasica elevata poiché si è osservato che SpCas9 wild-type può tagliare completamente la sua sequenza bersaglio in questo arco di tempo ristretto (dati non riportati). Due giorni dopo, sono state ottenute multiple colonie e quelle rosse sono state strisciate su nuove piastre reporter contenenti galattosio invece di destrosio per riattivare l’espressione di SpCas9 e mantenerla costantemente attivata per esacerbare qualsiasi effetto aspecifico. Dopo 48 ore, i plasmidi sono stati recuperati dagli strisci più rossi e dopo l’amplificazione nei batteri sono stati sequenziati con il metodo di Sanger per identificare le mutazioni introdotte nel dominio REC1-II. Sono state identificate svariate sostituzioni amminoacidiche, alcune delle quali erano presenti più di una volta nel pool di mutanti in combinazione con gruppi di mutazioni differenti. Degno di nota, è probabile che i mutanti contenenti la stessa serie di variazioni rappresentino cloni derivanti dalla stessa cellula originale che si è replicata durante l’incubazione di recupero. Tuttavia, data la diversità di sostituzioni ottenute, questo fenomeno non ha avuto effetto sui risultati dello screening. In seguito, è stato eseguito un nuovo esperimento di valutazione nel ceppo yACMO-off4 di ciascuna variante isolata al fine di misurare più precisamente la loro attività di taglio, scartare quelle che non tagliavano efficientemente il loro bersaglio rispetto a SpCas9 wild-type e classificare le rimanenti secondo quest’ultimo parametro e la loro capacità di discriminare i siti aspecifici (figura 4b). Per confermare ulteriormente i risultati dello screening, la specificità di una delle varianti ottenute (variante C13) è stata valutata più in dettaglio mediante trasformazione in tutti e quattro i ceppi reporter yACMO. Dopo 24 ore di espressione di Cas9, la quantificazione di colonie bianche e rosse su piastre reporter ha mostrato un’attività aspecifica significativamente ridotta rispetto a SpCas9 wild-type (comparare la figura 4c e la figura 2).
Ottimizzazione di varianti di SpCas9 ad alta fedeltà in cellule di mammifero.
È stato selezionato un pool di sostituzioni appartenenti alle varianti maggiormente performanti isolate dallo screening del lievito sia secondo l’efficienza di taglio sia secondo la riduzione dell’attività non specifica. Per ottenere un aumento significativo nella fedeltà rispetto ai mutanti identificati, è stata tentata una combinazione gerarchica di queste mutazioni, poiché ci si attendeva che alcune delle sostituzioni in ciascuna variante generata casualmente potessero essere neutrali o dannose. Come primo criterio di selezione, è stata impiegata la posizione relativa di ciascuna sostituzione e della doppia elica di sgRNA:DNA, secondo i dati strutturali disponibili, identificando un primo sottoinsieme di mutazioni. In aggiunta, si è focalizzata l’attenzione su un cluster conformazionale di sostituzioni localizzato all’estremità del dominio REC1-II che è in contatto con la parte più distale di PAM della sequenza di DNA bersaglio (nt. 17-20). Di conseguenza, le mutazioni appartenenti a questo cluster sono state selezionate anche nel caso non fosse stata precedentemente riportata alcuna interazione con la doppia elica di sgRNA:DNA. In particolare, è stato deciso di aggiungere le mutazioni sequenzialmente iniziando dal singolo mutante K526E, che aveva un comportamento particolarmente soddisfacente nel saggio del lievito (figura 4c). In particolare, la mutazione K526E è inclusa nel dominio Rec1-II summenzionato (figura 3).
Usando una linea cellulare reporter esprimente stabilmente EGFP (293mutiGFP), l’attività specifica di taglio (sgGFPon) dei mutanti doppi è stata testata mediante misurazione della perdita di fluorescenza indotta da mutazioni frameshift nella sequenza codificante EGFP. In parallelo, è stata valutata la loro capacità di evitare il taglio dello stesso sito dopo l’introduzione negli sgRNA di una o due basi disappaiate in posizioni distali dal trinucleotide PAM (posizione 18 per sgGFP18 e posizioni 18-19 per sgGFP1819). SpCas9 wild-type non è stata in grado di discriminare questi surrogati di sequenze aspecifiche, come confermato dall’osservazione che l’efficienza di taglio della sequenza bersaglio è la medesima quando la nucleasi è guidata sia da sgRNA appaiati che disappaiati, producendo la stessa riduzione nella percentuale di cellule di EGFP<+>(figure 5a). Dopo un primo ciclo di selezione, le sostituzioni maggiormente performanti sono state combinate in tripli mutanti che sono stati usati per ripetere nuovamente la valutazione nella linea cellulare reporter EGFP (figura 5b). In seguito, un ultimo ciclo di selezione è stato eseguito dopo avere generato un mutante quadruplo mediante combinazione delle sostituzioni migliori del ciclo precedente (variante VNEL). In aggiunta, un altro sgRNA contenente due appaiamenti errati in una regione più prossimale a PAM (posizioni 13 e 14, sgGFP1314) è stato impiegato per verificare che l’aumento osservato nella fedeltà della variante VNEL sia conservato per mutazioni che interessano l’intera sequenza spaziatrice. La variante VNEL ha indotto una perdita piccola o nulla della fluorescenza di EGFP in combinazione con tutti gli RNA guida caratterizzati da basi disappaiate, un risultato particolarmente impressionante per l’sgRNA contenente una singola sostituzione in posizione 18 dalla PAM (sgGFP18). D’altra parte, questo forte aumento nella specificità ha prodotto una piccola ma misurabile diminuzione nell’attività di taglio (~20% di perdita, figura 5c). Al fine di affrontare questo problema, due derivati alternativi della variante VNEL (le varianti VNEQ e VNES) sono state generate mediante progettazione razionale e testate usando lo stesso saggio di knockout di EGFP. Come atteso, è stato osservato un ripristino completo dell’efficienza di taglio sul bersaglio, in parallelo con un piccolo aumento nell’attività aspecifica. Complessivamente, la variante VNEQ mutante ha mostrato il rapporto di specificità migliore (figura 5c).
La comparazione fianco a fianco dei mutanti quadrupli (varianti VNEL, VNEQ, VNES) con le varianti ad alta fedeltà precedentemente pubblicate (SpCas9-HF1 e eSpCas9(1.1)) usando la linea cellulare reporter EGFP descritta sopra, ha rivelato un aumento marcato nella fedeltà che era particolarmente evidente usando l’sgRNA contenente un appaiamento errato singolo in posizione 18. Per questo particolare surrogato di sito aspecifico, una riduzione assoluta approssimativamente da 17 a 4 volte nel taglio non specifico è stata misurata nella comparazione delle varianti VNEL, VNEQ e VNES con SpCas9-HF1, che secondo i presenti esperimenti discriminava già siti disappaiati molto meglio di eSpCas9(1.1) (figura 5c). Questa osservazione è stata ulteriormente confermata mediante analisi dei rapporti di specificità delle differenti varianti di SpCas9 calcolati per i due surrogati aspecifici più forti (sgGFP1819 e sgGFP18) (comparare le linee punteggiate nella figura 5c). In seguito, l’attività nucleasica delle varianti VNEL e VNEQ è stata stimata più in dettaglio mediante il taglio di diversi siti bersaglio in differenti regioni della sequenza codificante di EGFP, usando la linea cellulare reporter 293multiGFP e misurando la perdita di fluorescenza. La variante VNES è stata esclusa dall’analisi poiché si comportava in modo simile al mutante VNEQ. In conformità con i risultati precedenti (figura 5c), abbiamo osservato livelli wild-type di attività per VNEQ, mentre VNEL era leggermente sottoperformante in corrispondenza di alcuni dei siti, con una perdita significativa di attività per uno dei loci testati (figure 6a e 6b). Per escludere la possibilità che il comportamento di taglio differente misurato verso siti specifici ed aspecifici fosse dovuto a un’alterazione dei livelli intracellulari delle varianti SpCas9, i livelli intracellulari di SpCas9 wild-type, VNEL e VNEQ, come pure delle due varianti ad alta fedeltà pubblicate precedentemente (eSpCas9(1.1) e SpCas9-HF1) sono stati analizzati in cellule 293T transfettate con quantità uguali dei corrispondenti plasmidi di espressione. Come mostrato chiaramente dai risultati (figura 6c), non è stata osservata alcuna differenza considerevole. Dati questi risultati, la variante VNEQ è stata ulteriormente caratterizzata, poiché tra i mutanti qui analizzati ha conservato livelli quasi wild-type di attività e ha ridotto drasticamente il taglio di sequenze aspecifiche nel modello cellulare di distruzione di EGFP. Il mutante VNEQ è stato denominato evoCas9 (Cas9 evoluta).
Attività di evoCas9 verso loci endogeni
In seguito, i dati di cui sopra sono stati confermati mediante analisi dell’attività nei confronti di loci endogeni. Un gruppo di siti bersaglio genomici testati precedentemente è stato di conseguenza selezionato al fine di comparare l’attività di taglio di evoCas9 con quella di SpCas9 wild-type in corrispondenza di ciascun locus. In aggiunta, anche SpCas9-HF1 è stata introdotta nella comparazione, come ulteriore riferimento. Dopo la transfezione in cellule 293T di ciascuna variante di SpCas9 unitamente a sgRNA specifici per i differenti loci, la formazione di indel è stata analizzata mediante uso del pacchetto software Tracking of Indels by Decomposition (TIDE) su ampliconi relativi a ciascun sito bersaglio sequenziati con il metodo di Sanger (Brinkman EK et al., Nucleic Acids Res. 2014, 42(22):e168). Per la maggioranza dei loci, non si è osservata alcuna differenza considerevole nell’efficienza di taglio tra SpCas9 wild-type ed evoCas9, l’ultima essendo in generale leggermente meno attiva con un’attività media complessiva che è l’80% di quella della proteina wild-type (figura 7a e figura 7b). Per un sito bersaglio, il locus ZSCAN2, abbiamo osservato un’efficienza di taglio molto scarsa, senza trovare alcuna spiegazione per tale comportamento (figura 7a). La variante SpCas9-HF1 ha mostrato un’efficienza di taglio complessiva più bassa, con un’attività media globale che è il 60% rispetto al wild-type (figura 7a e figura 7b). Ciò non è in conformità con le osservazioni pubblicate precedentemente (Kleinstiver BP et al., Nature. 2016, 529(7587):490-5) ed è possibile speculare che questa discrepanza possa essere dovuta alle differenti procedure sperimentali adottate. Questi dati dimostrano che evoCas9 conserva livelli quasi wild-type di attività di taglio contro un gruppo di loci endogeni, superando in efficienza la variante SpCas9-HF1 riportata precedentemente, nelle condizioni sperimentali testate.
Valutazione dell’attività aspecifica di evoCas9
Unitamente all’attività verso i siti bersaglio, la specificità di evoCas9 è stata misurata mediante la verifica del tasso di editing in corrispondenza di due siti aspecifici precedentemente associati con l’editing in corrispondenza di due loci: FANCF sito 2 e CCR5sp11. L’editing con Cas9 di questi loci genera interesse poiché il sito aspecifico associato a FANCF sito 2 era uno dei pochi siti non ripetitivi che SpCas9-HF1 non era in grado di discriminare dal corrispondente sito bersaglio specifico, mentre l’editing del locus CCR5sp11, che ha un valore per la sua applicazione terapeutica nel trattamento dell’AIDS, correla con il taglio fuori bersaglio del gene altamente omologo CCR2. Dopo la transfezione transiente in cellule 293T, la formazione di indel in corrispondenza di questi due siti aspecifici è stata misurata usando il software TIDE, rivelando una diminuzione significativa di taglio nelle cellule esprimenti evoCas9 rispetto alle cellule transfettate con SpCas9 wild-type (figura 8a). In aggiunta, il calcolo dei rapporti di specificità per SpCas9 wild-type, evoCas9 e SpCas9-HF1 ha confermato che la variante dell’invenzione era in grado di avere prestazioni migliori dei suoi competitori in corrispondenza di questi due loci (figura 8b). Il taglio simultaneo del locus CCR5sp11 e del corrispondente sito aspecifico nel gene CCR2 genera una delezione cromosomica di approssimativamente 16 kilobasi (schematizzata nella figura 8c). La frequenza di questo riarrangiamento cromosomico è stata misurata mediante PCR semiquantitativa in cellule transfettate con SpCas9 wild-type, evoCas9 o SpCas9-HF1 unitamente a sgRNA che colpisce il locus CCR5. Mentre l’evento di traslocazione era particolarmente evidente in cellule editate da SpCas9 wild-type, una forte riduzione nella quantità di delezione a livelli scarsamente rilevabili è stata osservata in presenza sia di SpCas9-HF1 che di evoCas9, l’ultima riducendo ulteriormente la delezione misurata di quasi due volte rispetto alla prima (figura 8c).
In seguito, la capacità di evoCas9 di evitare tagli genomici indesiderati è stata indagata mediante l’esecuzione di deep-sequencing mirato su una serie selezionata di siti aspecifici associati con l’editing in corrispondenza dei siti genomici VEGFA sito 3 e EMX1-K. È stato precedentemente mostrato che tutti i siti scelti vengono editati unitamente al locus sul bersaglio (Kleinstiver BP, et al., Nature. 2015, 523(7561):481-5). Il vantaggio dell’approccio di amplicon-sequencing risiede nella possibilità di misurare simultaneamente l’editing di svariati bersagli ad elevata sensibilità al fine di rilevare anche eventi di editing rari. L’analisi dei dati di sequenziamento ha dimostrato che, conservando al contempo attività elevata di taglio su entrambi i loci genomici, evoCas9 è caratterizzata da livelli di fondo di editing nella maggioranza dei siti aspecifici testati (figure 9a e 9b). Il primo sito aspecifico relativo al locus VEGFA sito 3 (VEGFA3-OT1) è stato l’unico locus dove l’attività di editing di evoCas9 è stata misurata al di sopra del livello di fondo (figura 9b). Tuttavia, deve essere considerato che lo stesso locus è editato quasi come il bersaglio desiderato da SpCas9 wild-type e che la variante SpCas9-HF1 precedentemente riportata non era in grado di sopprimere completamente il taglio non specifico di questa sequenza (Kleinstiver BP et al. Nature., 2016, 529(7587):490-5). Si è speculato che questi risultati possono essere spiegati con la natura altamente ripetitiva di questo particolare locus. Per quattro siti aspecifici relativi al locus VEGFA sito 3 (VEGFA3-OT1, -OT4, -OT5, -OT7) sono stati rivelati tassi di editing di fondo significativamente più alti (figura 9b), probabilmente per via delle caratteristiche peculiari della cromatina locale che è più fragile e di conseguenza incline ad accumulare mutazioni.
Nel complesso, questi dati indicano che evoCas9 diminuisce significativamente i tagli genomici indesiderati a livelli non rilevabili per la maggioranza dei siti aspecifici testati. In aggiunta, la comparazione in parallelo con la variante SpCas9-HF1 pubblicata precedentemente per siti fuori bersaglio selezionati ha dimostrato una capacità aumentata di discriminare siti disappaiati.
Specificità di evoCas9 a livello genomico
L’analisi dell’attività aspecifica di evoCas9 a livello dell’intero genoma è stata ottenuta mediante l’uso della tecnica GUIDE-seq stabilita precedentemente (Tsai SQ et al., Nat Biotechnol. 2015, 33(2):187-97). Questo approccio è basato sull’integrazione di un corto oligonucleotide di 34 bp in siti che sono stati tagliati da Cas9 al fine di consentire la loro cattura per la preparazione della libreria per il nextgeneration sequencing. In questo modo, è possibile identificare senza conoscenze a priori una raccolta di nuovi siti genomici che sono tagliati in modo non specifico da Cas9 in associazione con un particolare RNA guida. L’analisi GUIDE-seq è stata eseguita per analizzare i siti aspecifici associati con l’editing del locus VEGFA sito 2, che è altamente ripetitivo, ed è stato dimostrato essere associato a numerosi tagli indesiderati nel genoma cellulare. In aggiunta, studi precedenti (Kleinstiver BP et al., Nature. 2016, 529(7587):490-5) hanno indicato che alcuni dei bersagli errati rilevati erano ancora tagliati dalla variante ad alta fedeltà SpCas9-HF1. Le librerie GUIDE-seq sono state generate da DNA genomico di cellule 293T transfettate con SpCas9 wild-type o evoCas9, unitamente a l’sgRNA diretto control il locus VEGFA sito 2 e l’oligonucleotide esca a doppio filamento. I dati di sequenziamento sono stati analizzati usando una pipeline di software open source (Tsai SQ et al., Nat Biotechnol. 2016, 34(5):483) che ha permesso di rivelare 600 differenti siti aspecifici differenti per SpCas9 wild-type caratterizzati da 7 o meno appaiamenti errati con la sequenza bersaglio (figure 10a e 10b). Degno di nota, approssimativamente 100 di queste sequenze aspecifiche sono state editate più efficientemente del sito bersaglio, secondo il numero di letture ottenute tramite l’analisi GUIDE-seq che è stato riportato essere un buon indicatore dell’attività di taglio effettiva in corrispondenza di ciascun sito identificato (Tsai SQ et al., Nat Biotechnol. 2015, 33(2):187-97) (figura 10a). Quando la stessa analisi è stata eseguita su campioni trasfettati con evoCas9, è stato rilevato un totale di soli 10 siti, la maggioranza dei quali condivideva alta similarità con il bersaglio corretto ed era caratterizzata da meno di cinque appaiamenti errati con il locus VEGFA sito 2 (figura 10a). Solo un bersaglio errato emerso dall’analisi mostrava livelli di taglio elevati (più del bersaglio corretto) in presenza di evoCas9 e ciò era probabilmente dovuto alla natura particolare di questa sequenza che differiva per soli due nucleotidi dal bersaglio desiderato e conteneva due serie ininterrotte di citosine al livello di ciascun appaiamento errato (figura 10a), consentendo l’eventuale formazione di bolle per alloggiare i nucleotidi non appaianti.
Complessivamente, l’analisi GUIDE-seq di cui sopra ha dimostrato che evoCas9 conserva una specificità molto alta a livello dell’intero genoma quando testata usando una sequenza bersaglio ripetitiva caratterizzata da multipli siti aspecifici nel genoma cellulare.
Specificità di un attivatore trascrizionale basato su evo-dCas9 Un’applicazione alternativa per Cas9, indipendente dalla sua attività nucleasica, è la generazione di attivatori trascrizionali guidati da RNA mediante fusione di una versione cataliticamente inattiva di Cas9 (dCas9) con vari domini proteici in grado di stimolare la trascrizione. Un attivatore trascrizionale basato su VP64 è stato ingegnerizzato usando un mutante cataliticamente inattivo di evoCas9 (evo-dCas9) e testato fianco a fianco con un attivatore dCas9-VP64 wild-type. L’attivazione trascrizionale è stata testata mediante uso di un sistema reporter basato su un vettore di espressione per EGFP inducibile, regolato da un trans-attivatore basato su TetR attraverso operatori Tet integrati all’interno di un promotore CMV minimo. Il trans-attivatore Tet è stato sostituito con l’attivatore trascrizionale basato su Cas9 guidato da un sgRNA diretto contro sequenze ripetute dell’operatore Tet (figura 11a). Due differenti sgRNA che differiscono solo per la presenza o l’assenza di un extra nucleotide 5’-G sono stati disegnati verso l’operatore Tet del plasmide reporter, in aggiunta a tre guide aggiuntive basate sulla stessa sequenza sul bersaglio, contenenti una o due mutazioni in posizioni differenti lungo la sequenza spaziatrice. Livelli assoluti più bassi di espressione di EGFP sono stati osservati in presenza di evo-dCas9-VP64 rispetto a dCas9-VP64 sia per RNA guida specifici sia contenenti mutazioni, suggerendo un legame più forte al DNA bersaglio da parte di dCas9 wild-type (figura 11b). Tuttavia, l’intensità di attivazione specifica relativa calcolata rispetto al sgRNA di controllo era simile sia per dCas9 wild-type che per evo-dCas9, per via dell’attivazione spontanea più bassa osservata con evo-dCas9. Probabilmente, questo risultato è dovuto alla propensione inferiore di evo-Cas9 di legarsi al DNA in modo non specifico (figura 11c). In modo interessante, la specificità aumentata mostrata da evo-dCas9-VP64 è stata modesta rispetto a dCas9-VP64, suggerendo che evoCas9 si lega a bersagli aspecifici, anche se meno efficientemente, ma è poi incapace di completare la reazione di taglio (figura 11c). Complessivamente, questi risultati indicano che evoCas9 può essere sfruttata per costruire un regolatore trascrizionale caratterizzato da attivazione spontanea più bassa, sebbene con meno potenza di attivazione assoluta, e fedeltà di attivazione leggermente aumentata.
Specificità a lungo termine di evoCas9
Poiché l’espressione permanente di Cas9 nelle cellule è stata associata con l’aumento dell’attività aspecifica, un problema importante che doveva essere indagato era il comportamento a lungo termine di evoCas9 nelle cellule. Per affrontare questo punto, sono state generate particelle lentivirali al fine di ottenere l’espressione stabile di SpCas9 wild-type, evoCas9 o SpCas9-HF1 unitamente a un sgRNA di interesse. Per sfruttare un modello cellulare di knockout di EGFP simile a quello impiegato precedentemente per sottoporre a screening le varianti ad alta specificità, gli esperimenti sono stati condotti usando la stessa serie di sgRNA diretti verso la sequenza codificante di EGFP, corrispondente perfettamente al locus bersaglio o contenente uno o più appaiamenti errati in posizioni differenti della sequenza spaziatrice, agendo di conseguenza come surrogati di siti aspecifici. La linea cellulare reporter è stata trasdotta con quantità uguali dei differenti vettori lentivirali e le colture sono state selezionate per tutto l’intero periodo degli esperimenti in modo da isolare la popolazione trasdotta ed evitare la diluizione possibile di eventi di editing nel tempo prodotti dalla perdita di cellule editate o dalla ridotta vitalità delle cellule trasdotte. Analogamente a quanto osservato negli esperimenti di transfezione transiente, la diminuzione della fluorescenza di EGFP a tempi diversi dalla trasduzione ha rivelato che SpCas9 wild-type taglia la sequenza bersaglio con efficacia analoga in combinazione con un sgRNA perfettamente appaiato o con quelli disappaiati (vedere figura 12a e figura 5c). Al contrario, sia evoCas9 sia SpCas9-HF1 non hanno tagliato EGFP efficientemente usando gli sgRNA sgGFP1314 e sgGFP1819, entrambi contenenti appaiamenti errati doppi (figura 12b-c). Degno di nota, mentre la perdita di fluorescenza era a livelli di fondo per campioni di evoCas9 in tutti i punti temporali, un numero misurabile di cellule EGFP-negative che rimaneva costante nel tempo era presente nelle colture trasdotte con vettori esprimenti SpCas9-HF1 (figura 12c). In aggiunta, all’esame del surrogato aspecifico più forte, sgGFP18, contenente un singolo appaiamento errato in una posizione distale da PAM, il comportamento delle due varianti differiva significativamente: mentre SpCas9-HF1 non è stata in grado di discriminare correttamente tra sgRNA appaiato e disappaiato e ha tagliato il locus bersaglio con efficienza simile nei due casi, evoCas9 ha mostrato una tendenza crescente di perdita di cellule fluorescenti che tuttavia ha raggiunto meno della metà del livello del knockout del bersaglio a 40 giorni dalla trasduzione (figure 12b-c). Questi dati suggeriscono che, con una selezione attenta degli RNA guida, la variante di Cas9 ad alta specificità dell’invenzione, evoCas9, consente l’espressione a lungo termine della nucleasi limitando o eliminando i tagli indesiderati nel genoma cellulare . Materiali e metodi
Plasmidi e costrutti. Il plasmide p415-GalL-Cas9-CYC1t è stato usato per esprimere Cas9 nel lievito (ottenuto da Addgene, n° 43804) (Di Carlo JE, et al., Nucleic Acids Res. 2013, 41(7):4336-43). Per consentire la rimozione precisa del dominio Rec1-II mediante enzimi di restrizione, mutazioni sinonime sono state generate attraverso PCR al fine di introdurre due siti di restrizione, NcoI e NheI, rispettivamente a monte e a valle del dominio di Rec1-II (per i primer, vedere la tabella in appendice 2). La cassetta di espressione per sgRNA è stata ottenuta dal plasmide p426-SNR52p-gRNA.CAN1.Y-SUP4t (ottenuto da Addgene, n°3803) (Di Carlo JE, et al., Nucleic Acids Res. 2013, 41(7):4336-43). Al fine di scambiare la sequenza spaziatrice originale con il bersaglio auspicato, è stata adottata una strategia basata su assemblaggio tramite PCR. La porzione 5’ della cassetta di espressione dell’sgRNA è stata amplificata tramite PCR usando il primer forward T3 (che si appaia prima del promotore SNR52) e un primer reverse che si appaia immediatamente a monte della sequenza spaziatrice e contenente un’estremità sporgente corrispondente alla sequenza sul bersaglio auspicata (vedere la tabella in appendice 2). Lo stesso è stato eseguito per il frammento 3’ del sgRNA, usando il primer reverse primer T7 e un primer forward che si appaia immediatamente dopo la sequenza spaziatrice e contenente un’estremità sporgente 5’ antiparallela a quella menzionata precedentemente. La reazione di assemblaggio per ottenere la cassetta del gRNA è stata preparata mediante miscelazione dei due ampliconi di PCR ed eseguendo una singola fase di denaturazione, appaiamento ed estensione, seguita da un’amplificazione esponenziale usando solo i primer esterni T3 e T7. In seguito, il frammento risultante è stato purificato su gel e clonato con estremità piatte in pRS316 (ATCC), un plasmide centromerico a basso numero di copie che trasporta un marcatore selezionabile di lievito, URA3, pre-digerito con SacII/XhoI e reso ad estremità piatte, generando il plasmide pRS316-SNR52p-gRNA.ON-SUP4t. Per l’espressione di SpCas9 in cellule di mammifero è stato impiegato un plasmide derivato da pX330-U6-Chimeric_BB-CBh-hSpCas9 (ottenuto da Addgene, n° 42230) (Cong L et al., Science. 2013, 339(6121):819-23), dove la cassetta codificante del sgRNA è stata rimossa, pX-Cas9. La sequenza codificante SpCas9 è stata ottimizzata con codoni umani ed è regolata da un promotore CBh. In aggiunta, due segnali di localizzazione nucleare (NLS) sono stati aggiunti alle estremità N- e C-terminali di SpCas9 per consentire l’ingresso nel nucleo e un triplo FLAG è stato posizionato in corrispondenza dell’estremità N-terminale della proteina per facilitarne la rilevazione. Il plasmide codificante per le varianti di Cas9 migliorate è stato ottenuto mediante mutagenesi sito-diretta sequenziale a partire dal plasmide pX-Cas9. Per l'espressione dei mutanti di SpCas9 ottimizzati precedentemente pubblicati sono stati usati i plasmidi VP12 (ottenuto da Addgene, n° 72247) (Kleinstiver BP et al., Nature. 2016, 529(7587):490-5) e eSpCas9(1.1) (ottenuto da Addgene, n° 71814) (Slaymaker IM et al., Science. 2016, 351(6268):84-8). Le sequenze spaziatrici desiderate sono state clonate come oligonucleotidi appaiati con estremità sporgenti appropriate in un sito BbsI doppio a monte della porzione costante dell’RNA guida di un plasmide pUC19 contenente una cassetta di espressione guidata dal promotore U6. Per gli esperimenti che implicano vettori lentivirali, il vettore di trasferimento lentiCRISPRv1 (ottenuto da Addgene, n° 49535) (Cong L et al., Science. 2013, 339(6121):819-23) è stato impiegato unitamente al vettore di impacchettamento pCMV-delta8.91 (un gentile omaggio di Didier Trono, EPFL, Svizzera) e pMD2.G (ottenuto da Addgene, n° 12259), codificante per la glicoproteina del virus della stomatite vescicolare (VSVG), per produrre particelle virali. Il vettore di trasferimento lentiCRISPRv1 contiene una cassetta di espressione per una versione umanizzata in codoni di una SpCas9 marcata con un FLAG a livello N-terminale e fusa attraverso un peptide 2A con la sequenza codificante per la puromicina in modo da consentire la selezione di cellule trasdotte. Una cassetta di espressione guidata da U6 trascrive il sgRNA. Gli oligo appaiati corrispondenti agli spaziatori desiderati sono stati clonati nell’RNA guida usando un doppio sito BsmBI. I vettori basati su lentiCRISPRv1 codificanti per varianti di SpCas9 ottimizzate sono stati generati mediante sostituzione di parte della sequenza codificante per SpCas9 con un frammento di PCR corrispondente alla regione di CDS contenente le mutazioni (per i primer, vedere la tabella in appendice 2). Il plasmide pTRE-GFP è stato ottenuto mediante subclonaggio della sequenza codificante per EGFP dal plasmide pEGFP-N1 (Clontech) nel vettore di clonaggio pTRE-Tight (Clontech). Un elenco completo dei siti bersaglio degli RNA guida è disponibile nell’appendice. Tutti gli oligonucleotidi sono stati acquistati da Eurofins Genomics.
Colture di lievito. Il ceppo di lievito yLFM-ICORE (generato dal laboratorio di uno degli inventori dal ceppo parentale yIG397, un gentile omaggio di Richard Iggo) (Jegga AG et al., Proc Natl Acad Sci U S A. 2008, 105(3):944-9; Tomso DJ et al., Proc Natl Acad Sci U S A.2005, 102(18):6431-6) è stato usato per generare i ceppi di lievito reporter usati in questo studio. Terreni minimi sintetici (SD) sono stati impiegati in tutti gli esperimenti con il lievito (base azotata per lievito senza amminoacidi, 6,7 g/l, L-isoleucina 600 mg/l, L-valina 150 mg/l, L-adenina 200 mg/l, L-arginina 20 mg/l, L-istidina 10 mg/l, L-leucina 100 mg/l, L-lisina 90 mg/l, L-metionina 20 mg/l, L-fenilalanina 50 mg/l, L-treonina 200 g/l, L-triptofano 20 mg/l, L-uracile 20 mg/l, acido L-glutammico 100 mg/l, acido L-aspartico 200 g/l, L-serina 400 mg/l, D-(+)-glucosio 20 g/l). I singoli amminoacidi sono stati omessi secondo le necessità sperimentali quando era richiesto un terreno selettivo. Per l’induzione di p415-GalL-Cas9-CYC1t, sono stati usati 20 g/l D-(+)-galattosio e 10 g/l D-(+)-raffinosio invece di destrosio. Il terreno specifico per lo screening tramite colore dei mutanti di ADE2 è stato preparato usando concentrazioni basse di adenina (5 mg/l). Quando era richiesto un terreno non selettivo, si è impiegato terreno ricco YPDA (estratto di lievito 10 g/l, peptone 20 g/l, D-(+)-glucosio 20 g/l, L-adenina 200 mg/l). Tutte le soluzioni sono state preparate usando ddH2O, sterilizzate con filtro e conservate a 4 °C. I terreni solidi sono stati preparati mediante sterilizzazione in autoclave, aggiungendo 20 g/l di agar alla soluzione. Tutti i composti chimici per preparare terreni per lievito sono stati ottenuti da Sigma-Aldrich.
Trasformazione del lievito. Il giorno prima della trasformazione, approssimativamente 1 mm<3>del ceppo di lievito di interesse è stato inoculato in 5 ml di terreno ricco o terreno sintetico selettivo e fatto crescere per una durata di tempo pari a una notte a 30 °C agitando al contempo a 200 rpm. Il giorno successivo, 3-5 ml della coltura sono stati inoculati in un totale di 30 ml dello stesso terreno e sono stati fatti crescere a 30 °C a 200 rpm per ulteriori 2-4 ore. In seguito, le cellule sono state raccolte mediante centrifugazione a 2000xg per 2’, lavate in 30 ml di ddH2O, centrifugate di nuovo a 2000xg per 2’ e risospese in 10 ml di LiAc/Te 1X (acetato di litio 0,1M e Tris 10 mM EDTA 1 mM, pH 7,5). La soluzione è stata centrifugata di nuovo a 2000xg per 2’ e risospesa in un volume appropriato di LiAc/TE 1X (100 mg di pellet di lievito in 500 μl). La miscela di trasformazione conteneva 500 ng di DNA plasmidico, 5 μl di DNA di sperma di salmone (approssimativamente 1 μg, Sigma-Aldrich) precedentemente frammentato mediante sonicazione e bollito a 100 °C per 10’, 50 μl di coltura di lievito risospesa e 300 μl di polietilenglicole (PEG) 500 g/l con un peso molecolare di ~36,500 (Sigma-Aldrich) diluito in LiAc/TE 1X. Dopo aver mescolato usando un vortex, la miscela di trasformazione è stata posta per 30’ a 30 °C ed in seguito sottoposta a shock termico usando un bagno secco per 30’ a 42 °C. In seguito, le cellule sono state centrifugate a 3000xg per 3’, risospese in 5 ml dell’appropriato terreno SD selettivo o piastrate direttamente su piastre SD-agarosio selettive e incubate a 30 °C. Per la valutazione della frequenza di reversione spontanea, dopo la trasformazione con p415-GalL-Cas9-CYC1t le cellule sono state fatte crescere in terreno selettivo per 24 ore. In seguito, la concentrazione delle cellule è stata valutata mediante misurazione dell’OD600e 1000 cellule sono state piastrate su piastre selettive private di leucina (SDI) o 10<6>cellule sono state distribuite su piastre ulteriormente private di adenina (SDIa) o di triptofano (SDlt), per valutare il numero di revertanti.
PCR da colonia di lievito. Le PCR da colonia sono state eseguite mediante risospensione di approssimativamente 1 mm<3>di colonia di lievito in 49 μl di ddH2O.
1 μl di liticasi (10000 U/ml, Sigma-Aldrich) è stato aggiunto per digerire la parete cellulare e la sospensione è stata in seguito incubata a 30 °C per 30’. Le cellule sono state pellettate, il surnatante è stato rimosso e il pellet secco è stato bollito per 10’ a 100 °C. In seguito, il pellet è stato risospeso in 50 μl di ddH2O e 5 μl sono stati usati nella reazione PCR, usando la DNA polimerasi ad alta fedeltà Phusion (Thermo Scientific).
Recupero del DNA plasmidico dal lievito. Al fine di isolare i plasmidi codificanti per i mutanti di Cas9 dal lievito, singole colonie sono state fatte crescere per una durata di tempo pari a una notte a 30 °C agitando a 200 rpm in 5 ml di terreno SD senza leucina (SDI), per selezionare la presenza del plasmide p415-GalL-Cas9-CYC1t, rilassando al contempo la selezione del plasmide codificante per l’RNA guida in modo da indurre la sua progressiva diluizione e perdita. Il giorno successivo, le cellule sono state raccolte mediante centrifugazione per 5’ a 5000xg e risospese in 250 μl di tampone A1 (Nucleospin Plasmid, Macherey-Nagel) contenente 0,1 mg/ml di RNasi A. In seguito, le cellule sono state lisate meccanicamente aggiungendo 100 μl di microsfere di vetro lavate in acido (Sigma-Aldrich) e agitando tramite vortex in modo continuo per 5’. In seguito, il DNA plasmidico è stato recuperato dal surnatante usando colonne standard da miniprep con filtro in silice, seguendo le istruzioni del produttore. Il DNA è stato eluito in 30 μl di 10 mM TrisHCl pH 8,5. Il DNA eluito è stato poi digerito con gli enzimi NcoI e NheI (New England BioLabs) per eliminare il vettore codificante per l’sgRNA al fine di evitare contaminazioni, poiché anch’esso è selezionabile attraverso la resistenza all’ampicillina. Dopo la digestione, 10 μl sono stati trasformati in cellule di E. coli chimicamente competenti. In seguito, i plasmidi recuperati sono stati digeriti per verificare la loro identità ed in seguito sono stati sequenziati con il metodo di Sanger per identificare le mutazioni presenti nel dominio Rec1-II.
Assemblaggio delle cassette genomiche TRP1 e ADE2 modificate. Le cassette di DNA usate per ingegnerizzare i loci genomici ADE2 (ADE2-Off1, ADE2-Off2, ADE2-Off3 e ADE2-Off4) e TRP1 (TRP1-On) sono state costruite usando una strategia simile. Due PCR da colonia differenti sono state eseguite per amplificare le due metà di ciascun locus wild-type separatamente. La prima ha impiegato un primer forward a monte della CDS del gene e un primer reverse caratterizzato da un’estremità sporgente contenente la sequenza bersaglio o le sequenze aspecifiche off1-off4 seguite da, rispettivamente, i siti di restrizione KpnI o BamHI (vedere la tabella in appendice 3). Tutti i primer reverse contenevano un codone di stop prima della sequenza bersaglio/aspecifica per assicurare il troncamento della proteina. La seconda metà della cassetta è stata assemblata usando un primer reverse che si appaia a valle delle sequenze codificanti per ADE2 e TRP1 e un primer forward che si appaia 100 bp prima del primer reverse usato per costruire la prima metà della cassetta. In questo modo, quando le due parti erano unite insieme, il costrutto finale conteneva una regione di omologia lunga 100 bp a monte e a valle delle sequenze bersaglio/aspecifiche. In aggiunta, questi primer forward contenevano lo stesso sito di restrizione presente nel primer reverse della prima metà corrispondente della cassetta. I vari frammenti relativi a TRP1 e ADE2 sono stati assemblati mediante ligazione delle due metà digerite con Kpnl o BamHI (New England BioLabs), a seconda del sito di restrizione presente. I prodotti sono stati separati su un gel di agarosio per rimuovere i frammenti derivati da omoligazione. La cassetta finale è stata arricchita mediante PCR usando i primer più esterni e trasformata direttamente nel lievito.
Generazione di ceppi reporter di lievito. L’approccio delitto perfetto consente la modificazione genetica di specifici loci in combinazione con la praticità di un sistema di selezione attraverso lo sfruttamento del meccanismo di riparazione diretto da omologia che è particolarmente efficiente nel lievito (Stuckey S e Storici F, Methods Enzymol. 2013, 533:103-31). La prima fase è costituita dall’inserzione di una cassetta COunter selectable REporter I-SceI (CORE-I-SceI) nel locus specifico di interesse. La cassetta contiene un sito di riconoscimento per I-SceI, come pure la sequenza codificante per la stessa endonucleasi sotto il controllo del promotore GAL1 inducibile da galattosio, il gene della resistenza kanMX4 (G418) e il gene marcatore controselezionabile URA3 da Kluyveromyces lactis (KlURA3). La cassetta CORE-I-SceI è stata amplificata con primer contenenti delle estremità specifiche per i loci ADE2 e TRP1 (vedere tabella in appendice 3). Ciascun locus è stato editato sequenzialmente, seguendo la stessa procedura, iniziando dal locus ADE2. 500 ng di cassetta CORE-I-SceI specifica per il locus sono stati trasformati nel lievito e le cellule sono state piastrate su piastre YPDA e incubate a 30 °C per una durata di tempo pari a una notte. Il giorno successivo, le colonie sono state piastrate in replica su terreni YPDA contenenti 200 μg/ml di G418 (Invivogen). Le colonie resistenti sono state sottoposte a screening per la riuscita inserzione della cassetta nel locus desiderato mediante PCR da colonia usando primer che si appiano alle sequenze genomiche fiancheggianti il sito di integrazione e alla cassetta. In seguito, la cassetta CORE-I-SceI integrata all’interno del locus di interesse è stata scambiata con la sequenza editata finale (TRP1-On, ADE2-Off1, ADE2-Off2, ADE2-Off3 e ADE2-Off4), generando un totale di quattro differenti ceppi di lievito caratterizzati dalla stessa sequenza bersaglio e da quattro bersagli aspecifici. Il ceppo di lievito intermedio appropriato contenente la cassetta CORE-I-SceI è stato inoculato per una durata di tempo pari a una notte in 5 ml di YPDA. Il giorno successivo, prima della trasformazione, l’inoculo è stato risospeso in 30 ml di terreno sintetico contenente galattosio e raffinosio invece di destrosio (SRG). Questa fase è essenziale per indurre la trascrizione dell’endonucleasi I-SceI che taglia il suo sito bersaglio localizzato all’interno della cassetta CORE. Questa rottura del doppio filamento aumenta la frequenza normale di eventi di riparazione promossi dalla ricombinazione omologa, favorendo lo scambio di cassetta con la nuova sequenza desiderata. Dopo 4 ore in SRG, il lievito è stato trasformato con 500 ng della sequenza donatore per la ricombinazione omologa contenente la sequenza desiderata seguendo il protocollo di trasformazione standard. In seguito, i trasformanti sono stati piastrati su SD contenente 60 mg/ml di uracile e 1 g/l di acido 5-fluoroorotico (5-FOA) (Toronto Research Chemicals). Il 5-FOA in presenza di orotidina 5'-fosfato decarbossilasi (codificata da KlURA3) è convertito in fluorouracile che è un potente inibitore della timidilato sintasi. In seguito, le colonie resistenti a 5-FOA sono state piastrate in replica su YPDA e YPDA addizionato con G418, per selezionare ulteriormente per la perdita della cassetta CORE. Mediante comparazione delle due piastre in replica, è possibile selezionare colonie resistenti a 5-FOA e sensibili a G418, che corrispondono a cloni positivi. Le PCR da colonia, eseguite usando primer genomici che si appaiano a monte e a valle dell’intero locus genomico, sono state analizzate mediante sequenziamento con metodo Sanger per confermare la sequenza del locus editato. I ceppi di lievito appena generati contenenti i loci TRP1 e ADE2 modificati sono stati chiamati yACMO-off1, yACMO-off2, yACMO-off3 e yACMO-off4, caratterizzati da una sequenza bersaglio selezionata nel locus TRP1 da quattro differenti sequenze aspecifiche nel locus ADE2, ciascuna contenente una singola base modificata rispetto alla sequenza bersaglio in una posizione che è più prossimale alla PAM per off1 e più distale dalla PAM per off4 (vedere tabella in appendice 4).
Lettura del saggio del lievito. I geni ADE2 e TRP1 codificano per enzimi fondamentali nelle vie metaboliche che portano alla produzione di adenina e di triptofano e per questa ragione il loro knockout distrugge la capacità del lievito di crescere su terreno privato di questi due nutrienti. I ceppi di lievito yACMO generati in questo studio sono carenti dell’attività genica di TRP1 e ADE2 a meno che Cas9 non tagli la sequenza bersaglio interrompendo ciascuna sequenza codificante: la ricombinazione mediata da appaiamento a singolo filamento tra le due regioni di omologia di 100 bp su entrambi i lati dei siti bersaglio assicura la ricostituzione del locus wild-type. Di conseguenza, uno screening basato sulla selezione delle auxotrofie può essere usato per valutare l’attività di taglio di Cas9 in corrispondenza dei due loci genomici, misurando gli eventi di taglio specifici ed aspecifici. Dopo la trasformazione con p415-GalL-Cas9-CYC1t e pRS316-SNR52p-gRNA.ON-SUP4t, le cellule sono state fatte crescere in terreno sintetico senza leucina e uracile (SDlu) per 4 ore prima di un’induzione per una durata di tempo pari a una notte in terreno contenente galattosio (SRGlu). In seguito, le cellule sono state piastrate in numeri uguali su piastre SDlu, per misurare il numero totale di trasformanti, e su piastre SDlu private di triptofano e con basse concentrazioni di adenina (SDluta5), per distinguere colonie in cui Cas9 ha tagliato solo le sequenze bersaglio o anche le sequenze aspecifiche. In particolare, all’osservazione della piastra reporter SDluta5possono essere presenti differenti fenotipi: l’assenza di crescita indica la carenza di editing del locus TRP1 (TRP1-/ADE2<+/->); la crescita di una colonia rossa (TRP1<+>/ADE2-) indica l’editing solo in corrispondenza del locus TRP1, senza alcuna attività aspecifica rilevata; la crescita di una colonia bianca (TRP1<+>/ADE2<+>) indica l’editing in corrispondenza di entrambi i loci TRP1 e ADE2, rilevando tagli aspecifici. La tipica pigmentazione rossa della colonia è determinata dall’accumulo nel vacuolo cellulare di un intermedio della via biosintetica dell’adenina generato dal blocco a livello del prodotto genico di ADE2. Mediante comparazione del numero totale di colonie ottenute su piastre SDlu e SDluta5, è possibile misurare l’efficienza di taglio del bersaglio, mentre mediante quantificazione della percentuale di colonie rosse e bianche sulla piastra SDluita5può essere ottenuta una stima della specificità dell’attività di Cas9 rispetto alla sequenza aspecifica testata.
Screening di lievito per mutanti di SpCas9. La libreria di mutanti è stata generata mediante PCR error-prone (epPCR) usando il kit GeneMorph (Agilent). Seguendo le istruzioni del produttore, la quantità iniziale del DNA stampo (p415-GalL-Cas9-CYC1t) e il numero di cicli sono stati impostati per ottenere una media di 5 mutazioni per kilobase. Primer lunghi 50 bp sono stati selezionati per appaiarsi 150 bp a monte e a valle della sequenza codificante il dominio REC1-II (vedere tabella in appendice 5). La libreria ottenuta per PCR è stata direttamente assemblata in vivo mediante co-trasformazione del pool di ampliconi mutagenizzati con il plasmide p415-GalL-Cas9-CYC1t, digerito precedentemente con NcoI e NhI (New England BioLabs) per rimuovere il dominio REC1-II, con un rapporto inserto/plasmide di 3:1. Le due regioni di omologia di 150 bp a entrambe le estremità degli ampliconi sono state usate dal lievito per riparare il plasmide digerito mediante ricombinazione omologa, incorporando di conseguenza la porzione mutagenizzata. I cloni contenenti mutazioni nelle regioni fiancheggianti di 150 bp sono stati probabilmente selezionati in modo negativo durante questo processo di assemblaggio in vivo per via della perdita di omologia completa. Ciononostante, queste mutazioni giacevano all’esterno della nostra regione di interesse (il dominio REC1-II). La libreria mutagenica è stata sottoposta a screening contemporaneamente al suo assemblaggio mediante co-trasformazione dei frammenti nel ceppo di lievito yACMO-off4 che esprimeva stabilmente un sgRNA specifico per la sequenza bersaglio contenuta nel locus TRP1. Dopo la trasformazione, la coltura è stata fatta crescere per una durata di tempo pari a una notte in terreno SD privo di uracile e leucina (SDlu, per selezionare cellule contenenti plasmidi esprimenti sia sgRNA sia Cas9) per consentire il recupero e la corretta ricombinazione. Il giorno successivo, l’espressione di Cas9 è stata indotta mediante crescita della coltura in terreno contenente galattosio (SRGlu) per 5 ore prima di piastrare su svariate piastre selettive prive di triptofano e contenenti basse concentrazioni di adenina (SDluta5), per discriminare colonie secondo lo stato di editing dei loci TRP1 e ADE2. Dopo 48 ore, le colonie TRP1<+>/ADE2<->(rosse) sono state strisciate su piastre selettive con bassa adenina e senza triptofano contenenti galattosio e raffinosio (SRGluta5) per mantenere l’espressione di Cas9 indotta in modo costitutivo e forzare la generazione di eventuali tagli aspecifici. Dopo ulteriori 48 ore di incubazione, i plasmidi esprimenti Cas9 sono stati estratti dagli strisci più rossi, corrispondenti a colonie in cui Cas9 tagliava solo il sito bersaglio, e le mutazioni sono state caratterizzate mediante sequenziamento con il metodo Sanger.
Analisi e quantificazione del colore delle colonie di lievito. Tutte le immagini delle piastre sono state acquisite con una Canon EOS 1100D (1/60, f/9.0 e ISO 800) e analizzate con OpenCFU (Geissmann Q, PLoS One.2013;8(2):e54072). Per tutte le immagini è stato usato un valore di soglia invertito (valore = 2) con un raggio tra 8 e 50 pixel. La discriminazione tra colonie bianche e rosse è stata ottenuta calcolata il segnale medio nei canali RGB ed impostando in ciascun esperimento un valore di soglia manuale che discrimina accuratamente tra colonie rosse e bianche.
Cellule di mammifero e trasfezioni. Le cellule 293T/17 sono state ottenute dalla American Type Culture Collection (ATCC) e sono state coltivate in terreno di Eagle modificato da Dulbecco (DMEM; Life Technologies) integrato con siero di vitello fetale al 10% (FCS; Life Technologies) e antibiotici (PenStrep, Life Technologies). Le cellule 293multiGFP sono state generate mediante transfezione stabile con pEGFP-IRES-Puromicina e selezionate con 1 μg/ml di puromicina. Le cellule 293blastEGFP sono state ottenute mediante infezione a bassa MOI di cellule HEK293T con il vettore lentivirale pAIB-GFP esprimente EGFP seguita da selezione clonale con 5 μg/ml di blasticidina. Per la transfezione, 1×10<5>293multiGFP o 293T cellule/pozzetto sono state seminate in piastre a 24 pozzetti e transfettate il giorno seguente usando TransIT-LT1 (Mirus Bio) secondo il protocollo del produttore usando 400-750 ng di plasmidi esprimenti Cas9 e 200-250 ng di plasmidi esprimenti l’sgRNA. Per esperimenti di transfezione transiente che implicano l’espressione di EGFP, sono stati usati 100 ng del plasmide pEGFP-N1. Per determinare il livello di riduzione dell’espresione di EGFP da parte di Cas9 dopo la transfezione in 293multiGFP, le cellule sono state raccolte 7 giorni dopo la transfezione e sono state analizzate mediante citofluorimetro usando un FACSCanto (BD Biosciences).
Produzione dei vettori lentivirali e trasduzioni. Le particelle lentivirali sono state prodotte mediante semina di 4x10<6>cellule 293T in un piastra Petri da 10 cm. Il giorno dopo, le piastre sono state transfettate con 10 μg di ciascun transfer vector basato su lentiCRISPR (Cong L et al., Science. 2013, 339(6121):819-23) unitamente a 6,5 μg del vettore di impacchettamento pCMV-deltaR8.91 e 3,5 μg di pMD2.G usando il metodo della polietilenimmina (PEI). Dopo un’incubazione per una durata di tempo pari a una notte, il terreno è stato sostituito con DMEM completo fresco e 48 ore dopo il surnatante contenente le particelle virali è stato raccolto, centrifugato a 500xg per 5 minuti e filtrato attraverso un filtro 0,45 μm in PES. La quantificazione dei titoli del vettore è stata eseguita usando il metodo SG-PERT (Pizzato M et al., J Virol Methods. 2009, 156(1-2):1-7). Le scorte di vettore sono state conservate a -80 °C per uso futuro.
Per le trasduzioni, 10<5>cellule 293blastGFP sono state seminate in una piastra a 24 pozzetti e il giorno successivo sono state trasdotte con 0,4 unità di trascrittasi inversa (RTU)/pozzetto di ciascun vettore mediante centrifugazione a 1600xg a 16 °C per 2 ore. Dopo un’incubazione per una durata di tempo pari a una notte, il surnatante virale è stato rimosso e le cellule sono state mantenute in coltura per un totale di 48 ore prima di aggiungere 0,5 μg/ml di puromicina che è stata mantenuta per tutto l’esperimento. Per determinare il livello di riduzione di espressione di EGFP indotto da Cas9 dopo l’infezione, le cellule 293blastGFP sono state raccolte ai tempi indicati dopo la trasduzione e sono state analizzate mediante citofluorimetro usando un FACSCanto (BD Biosciences).
Rilevazione di mutazioni genomiche indotte da Cas9. Il DNA genomico è stato ottenuto a 7 giorni dalla transfezione, usando la soluzione di estrazione per DNA genomico QuickExtract (Epicentre). Le reazioni di PCR per amplificare i loci genomici sono state realizzate usando la DNA polimerasi ad alta fedeltà Phusion (Thermo Fisher). I campioni sono stati amplificati usando gli oligo elencati nella tabella in appendice 8. I prodotti di PCR purificati sono stati analizzati mediante sequenziamento e applicazione del software TIDE (Brinkman EK et al., Nucleic Acids Res. 2014, 42(22):e168). Per quantificare la delezione cromosomica CCR2-CCR5, un approccio di PCR semi-quantitativa è stato impostato usando primer fiancheggianti il sito sul bersaglio CCR5 e il locus aspecifico CCR2 (tabella in appendice 8). Il numero di cicli di PCR è stato modulato al fine di non raggiungere il plateau di amplificazione. Le quantificazioni sono state ottenute mediante analisi densitometriche usando il software ImageJ e sfruttando il locus genomico FANCF come normalizzatore interno.
Western blot. Le cellule sono state lisate in buffer NEHN (20 mM HEPES pH 7,5, 300 mM NaCl, 0,5% NP40, 1 mM EDTA, 20% glicerolo, integrato con 1% di cocktail di inibitore della proteasi (Pierce)). Gli estratti cellulari sono stati separati mediante SDS-PAGE usando i PageRuler Plus Protein Standards come marcatori di massa molecolare standard (Thermo Fisher Scientific). Dopo l’elettroforesi, i campioni sono stati trasferiti su membrane PVDF di 0,22 μm (GE Healthcare). Le membrane sono state incubate con anti-FLAG di topo (Sigma) per rilevare SpCas9 e le differenti varianti ad alta fedeltà, con anti-α-tubulina di topo (Sigma) per un controllo di caricamento e con un anticorpo secondario anti-topo prodotto in capra (KPL) coniugato ad HRP per la rilevazione tramite ECL. Le immagini sono state acquisite usando il sistema di rilevazione UVItec Alliance.
Deep-sequencing mirato. Siti aspecifici selezionati per i loci genomici VEGFA3 e EMX1, unitamente al loro relativo sito bersaglio corretto, sono stati amplificati usando la polimerasi Phusion ad alta fedeltà (Thermo Scientific) o la polimerasi EuroTaq (Euroclone) da DNA genomico di 293T estratto 7 giorni dopo la transfezione con SpCas9 wild-type o evoCas9 unitamente a sgRNA che colpiscono i loci EMX1 e VEGFA3, o un vettore vuoto pUC. Gli ampliconi relativi ai siti aspecifici sono stati raggruppati in concentrazione quasi equimolare prima della purificazione e dell’indicizzazione. Le librerie sono state indicizzate mediante PCR usando indici Nextera (Illumina), quantificate con il kit Qubit dsDNA High Sensitivity Assay (Invitrogen), raggruppate tenendo conto del numero di bersagli e sequenziate su un sistema Illumina Miseq system usando un kit Illumina Miseq Reagent V3 – 150 cicli (150 bp - singola lettura). L’elenco completo di primer usato per generare gli ampliconi è riportato nella tabella in appendice 7.
Un genoma di riferimento è stato costruito usando Picard (http://broadinstitute.github.io/picard) e samtool (Li H at al., Bioinformatics. 2009, 25(16):2078-9) dalle sequenze di DNA delle regioni specifiche e aspecifiche considerate. I dati di sequenziamento grezzi (file FASTQ) sono stati mappati contro il genoma di riferimento creato usando BWA-MEM (Li H e Durbin R, Bioinformatics.
2010, 26(5):589-95) con parametri standard e i file di allineamento risultanti sono stati catalogati usando samtool. Solo le read con qualità di mappatura maggiore o uguale a 30 sono state conservate. La presenza di indel in ciascuna read per ciascuna regione considerata è stata determinata mediante la ricerca di indel di 1 bp di dimensione direttamente adiacenti al sito di taglio previsto o indel di dimensione >= 2 bp che si sovrappongono a regioni della dimensione di 5 bp fiancheggianti il sito di taglio previsto.
Esperimenti GUIDE-seq e analisi dei dati. Il GUIDE-seq è stato eseguito come descritto precedentemente (Bolukbasi MF et al., Nat Methods.2015,12(12):1150-6) con poche modifiche. In breve, 2x10<5>cellule 293T sono state transfettate con 750 ng di un plasmide esprimente Cas9, unitamente a 250 ng di plasmide codificante per l’sgRNA o un plasmide pUC19 vuoto e 10 pmol dell’oligonucleotide a doppio filamento contenente legami di fosforotioato in corrispondenza di entrambe le estremità (progettato secondo il protocollo GUIDE-seq originale) usando il reagente di transfezione Lipofectamine 3000 (Invitrogen). Tre giorni dopo la transfezione, il DNA genomico è stato estratto usando il kit DNeasy Blood and Tissue kit (Qiagen) seguendo le istruzioni del produttore ed è stato frammentato a una lunghezza media di 500 bp con il dispositivo di sonicazione Bioruptor Pico (Diagenode). La preparazione delle librerie è stata eseguita con gli adattatori e i primer originali secondo studi precedenti (Tsai SQ et al., Nat Biotechnol. 2015, 33(2):187-97). Le librerie sono state quantificate con il kit Qubit dsDNA High Sensitivity Assay (Invitrogen) e sequenziate con il sistema di sequenziamento MiSeq (Illumina) usando un kit Illumina Miseq Reagent V2 - 300 cicli (2x150bp paired-end).
I dati di sequenziamento grezzi (file FASTQ) sono stati analizzati usando la pipeline computazionale GUIDE-seq (Tsai SQ et al., Nat Biotechnol. 2015, 33(2):187-97). Dopo il demultiplexing, i putativi duplicati di PCR sono stati consolidati in letture singole. Le letture consolidate sono state mappate rispetto al genoma di riferimento umano GrCh37 usando BWA-MEM (Li H e Durbin R, Bioinformatics. 2010, 26(5):589-95); le letture con qualità di mappatura inferiore a 50 sono state eliminate mediante filtrazione. In seguito all’identificazione delle regioni genomiche in cui si è integrato l’oligodeossinucleotide a doppio filamento (dsODN) nei dati allineati, i siti RGN sono stati conservati se erano presenti al massimo otto appaiamenti errati rispetto al bersaglio e se tali siti erano assenti nei controlli. La visualizzazione dei
siti aspecifici allineati è disponibile come una griglia di sequenza codificata da colori.
Appendice
Tabella 1. Mutanti ottenuti dallo screening del lievito, relativo alla figura 4.
Mutante Sostituzioni amminoacidiche
A0 R403H, N612Y, L651P, K652E, G715S
A1 R403H, N612Y, L651P, K652E, G715S
A2 W659R, R661L
A3 L540Q, L607P
A4 R400H, Y450S
A5 T472A, P475H, A488V
A6 N407P, F498I, P509L
A7 D406Y
A8 A488V, D605V, R629G, T657A
A9 S487Y, N504S, E573D
A10 K377E, L598P, L651H
A11 T496A, N609D, A728G
A12 Y450H, F553L, Q716H
B1 K483M, Q695H, Q712R
B2 L683P
B3 P449S, F704S
B4 S675C, Q695L
B5 W464L
B6 I473F, D550N, Q739E
B7 A421V, R661W
B8 M495V, K526N, S541P, K562E
B9 D406V, E523K
B10 N407H, K637N, N690I
B11 M495V, K526N, S541P, K562E
B12 I679V, H723L
B13 N522K, G658E
B14 L423P, M465R, Y515N, K673M
B15 R654H, R691Q, H698Q
C1 L683P
C2 T474A
C3 L683P
C4 L683P
C5 W476R, L738P
C6 W476R, L738P
C7 W476R, L738P
C8 W476R
C9 L683P
C10 L683P
C11 L683P
C12 L683P
C13 K526E
C14 F405L, F518L, L651P, I724V
C15 K526E
C16 E470D, I548V, A589T, Q695H
C17 E470D, I548V, A589T, Q695H
C18 E470D, I548V, A589T, Q695H
C19 Y450N, H698P, Q739K
C20 K526E
C21 F405L, F518L, L651P, I724V
C22 F405L, F518L, L651P, I724V
C23 D397E, Y430C, L666P
C24 L380*, I473V ;C25 Frameshift, N522S, K646R, D686V ;C26 Frameshift, N522S, K646R, D686V ;C27 Frameshift, N522S, K646R, D686V ;C28 Frameshift, N522S, K646R, D686V ;C29 R691L, H721R, I733V ;C30 Q402R, V561M, Q695H ;C31 Q402R, V561M, Q695H ;C32 Q402R, V561M, Q695H ;C33 F478Y, N522I, L727H ;C34 Frameshift, A640T, Q709L ;* = codone di stop
Tabella 2. Primer usati per il clonaggio dei plasmidi
Nome del
primer Sequenza (5’- … -3’)
Rec1-II-NheI-F CCAGAAAGCACAAGTTGCTAGCCAGGGGGACAGTC (SEQ ID N. 4)
Rec1-II-NheI-R GACTGTCCCCCTGGCTAGCAACTTGTGCTTTCTGG (SEQ ID N. 5)
Rec1-II-NcoI-F CAGCGCACTTTCGACCATGGAAGCATCCCCCA (SEQ ID
Rec1-II-NcoI-R TGGGGGATGCTTCCATGGTCGAAAGTGCGCTG (SEQ ID
7)
T3-Diretto AATTAACCCTCACTAAAGGG (SEQ ID N.8)
T7-Inverso TAATACGACTCACTATAGGG (SEQ ID N.9)
sgRNA- CTCGTGACCACCCTGACCTAGTTTTAGAGCTAGAAATAG Ontarget-F (SEQ ID N.10)
sgRNA- TAGGTCAGGGTGGTCACGAGGATCATTTATCTTTCACTG Ontarget-R (SEQ ID N.11)
Apa-ZhangCas-F ACGTGGGCCCTCTGGCCAG (SEQ ID N.12)
Nhe-ZhangCas-R TACGCTAGCTCCCTTTTTCTTTTTTGCCTGG (SEQ ID N.
Tabella 3. Apa-Primer usati JoungCas-F ATTAGGGCCCCCTGGCCCGAGGGAAC (SEQ ID N.14)
Speper la JoungCas-R TAATACTAGTGACTTTCCTCTTCTTCTTGGG (SEQ ID N. costruzione della cassetta reporter di lievito
Nome del primer Sequenza (5’- … -3’)
TRP1-genomic-F CCAAGAGGGAGGGCATTGG (SEQ ID N.16)
TRP1Pt1-ON-Kpn-R TGCGGTACCGTAGGTCAGGGTGGTCACGAGTTAG AGGAACTCTTGGTATTCTTGC (SEQ ID N.17)
TRP1Pt2-Kpn-F TTAGGTACCGTAATCAACCTAAGGAGGATGTTT
(SEQ ID N.18)
TRP1-genomic-R TGCTTGCTTTTCAAAAGGCCTG (SEQ ID N.19)
ADE2-genomic-F TGCCTAGTTTCATGAAATTTTAAAGC (SEQ ID N.20) ADE2Pt1-OFF1- CCAGGATCCGGAGGTCAGGGTGGTCACGAGTTAG
Bam-R ACGCAAGCATCAATGGTAT (SEQ ID N.21)
ADE2Pt1-OFF2- CCAGGATCCGTAGGTAAGGGTGGTCACGAGTTAG
Bam-R ACGCAAGCATCAATGGTAT (SEQ ID N.22)
ADE2Pt1-OFF3- CCAGGATCCGTAGGTCAGGGCGGTCACGAGTTAG
Bam-R ACGCAAGCATCAATGGTAT (SEQ ID N.23)
ADE2Pt1-OFF4- CCAGGATCCGTAGGTCAGGGTGGTAACGAGTTAG
Bam-R ACGCAAGCATCAATGGTAT (SEQ ID N.24)
ADE2Pt2-Bam-F ATTAGGATCCTGGTGTGGAAATGTTCTATTTAG
(SEQ ID N.25)
ADE2-genomic-R GTAATCATAACAAAGCCTAAAAAATAG (SEQ ID N.
26)
TATTGAGCACGTGAGTATACGTGATTAAGCACACA TRP1-CORE-F AAGGCAGCTTGGAGTTAGGGATAACAGGGTAATTT GGATGGACGCAAAGAAGT (SEQ ID N.27) TGCAGGCAAGTGCACAAACAATACTTAAATAAATA
TRP1-CORE-R CTACTCAGTAATAACTTCGTACGCTGCAGGTCGAC
(SEQ ID N.28)
CCTACTATAACAATCAAGAAAAACAAGAAAATCGG
ADE2-CORE-F ACAAAACAATCAAGTTAGGGATAACAGGGTAATTT
GGATGGACGCAAAGAAGT (SEQ ID N.29) ATATCATTTTATAATTATTTGCTGTACAAGTATATCA
ADE2-CORE-R ATAAACTTATATATTCGTACGCTGCAGGTCGAC
(SEQ ID N.30)
Tabella 4. Siti specifico e aspecifici usati per generare i ceppi yACMO
Nome del Sequenza (5’- … -3’, con PAM in minuscolo), bersaglio appaiamento errato in grassetto
TRP1-on CTCGTGACCACCCTGACCTAcgg (SEQ ID N.31)ADE2-off1CTCGTGACCACCCTGACCTCcgg (SEQ ID N.32) ADE2-off2 CTCGTGACCACCCTTACCTAcgg (SEQ ID N.33) ADE2-off3 CTCGTGACCGCCCTGACCTAcgg (SEQ ID N.34) ADE2-off4 CTCGTTACCACCCTGACCTAcgg (SEQ ID N.35)
Tabella 5. Primer di PCR error-prone
Nome del primer Sequenza (5’- … -3’)
epPCR-F GTCTAAAAATGGCTACGCCGGATACATTGACGGCG
GAGCAAGCCAGGAGG (SEQ ID N.36)
epPCR-R TCTCGGGCCATCTCGATAACGATATTCTCGGGCTTA
TGCCTTCCCATTAC (SEQ ID N.37)
Tabella 6. Sequenze spaziatrici usate per preparare gli sgRNA per saggi reporter
Nome del
bersaglio Sequenza spaziatrice (5’- … -3’)
GFPon GGGCACGGGCAGCTTGCCGG (SEQ ID N.38)
GFP1314 GGGCACCCGCAGCTTGCCGG (SEQ ID N.39)
GFP1819GCCCACGGGCAGCTTGCCGG (SEQ ID N.40)
GFP18 GGCCACGGGCAGCTTGCCGG (SEQ ID N.41)
GFP sito 2 GTCGCCCTCGAACTTCACCT (SEQ ID N.42) GFP sito 14 GAAGGGCATCGACTTCAAGG (SEQ ID N.43) GFP sito 16 GCTGAAGCACTGCACGCCGT (SEQ ID N.44) GFP sito 18 GACCAGGATGGGCACCACCC (SEQ ID N.45) GFP sito 20 GAAGTTCGAGGGCGACACCC (SEQ ID N.46) GFPon-19nt GGCACGGGCAGCTTGCCGG (SEQ ID N.47) GFPB-18nt GGCAAGCTGCCCGTGCCC (SEQ ID N.48) GFPW-17nt GTGACCACCCTGACCTA (SEQ ID N.49)
TetO-on GTGATAGAGAACGTATGTCG (SEQ ID N.50) TetO-on+G gGTGATAGAGAACGTATGTCG (SEQ ID N.51) TetO-off6 GTGATAGAGAACGTCTGTCG (SEQ ID N.52) TetO-off1314 GTGATACTGAACGTATGTCG (SEQ ID N.53) TetO-off1819 GACATAGAGAACGTATGTCG (SEQ ID N.54)
I nucleotidi disappaiati 5’ sono indicati in minuscolo. Le mutazioni sono indicate in
grassetto.
Tabella 7. Oligo per il deep-sequencing mirato
Estremità sporgente comune per il primer forward: 5’-
TCGTCGGCAGCGTCAGATGTGTATAAGAGACAG-3’ (SEQ ID N.55)
Estremità sporgente comune per il primer reverse: 5’-
GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAG-3’ (SEQ ID N.56)
Locus Bersaglio Forward (5’-…-3’) Reverse (5’-…-3’)
GAGTCCGAGCAGA CCGGAGGACAAA AAGCAGCACTCTG EMX1-on AGAAGAAggg (SEQ GTACAAACGGC CCCTCGTG (SEQ
ID N.57) (SEQ ID N.58) ID N.59)
GAGTTAGAGCAGA CTTTTATACCATC CTAGGAAAGATTA EMX1-ot1 AGAAGAAagg (SEQ TTGGGGTTACAG ACAGAGAGTCTGA ID N.60) (SEQ ID N.61) C (SEQ ID N.62) GAGTCTAAGCAGA CAATGTGCTTCAA CCTCTACTTCATTG EMX1-ot2 AGAAGAAgag (SEQ CCCATCACGGC TACTCAAGGTAAG ID N.63) (SEQ ID N.64) (SEQ ID N.65) AAGTCTGAGCACA TAGTTCTGACATT CTCTGTTGTTATTT EMX1-ot3 AGAAGAAtgg (SEQ CCTCCTGAGGG TTTGGTCAATATCT ID N.66) (SEQ ID N.67) G (SEQ ID N.68) GAGTCCTAGCAGG AAAGCCTGGAGG ATCTAGCTGTCCT EMX1-ot4 AGAAGAAgag (SEQ CTGCCAGGT (SEQ GTCTCATTGGC ID N.69) ID N.70) (SEQ ID N.71) GAGGCCGAGCAG CAGGAGCCGGGT CCTCAGCCTTCCC EMX1-ot5 AAGAAAGAcgg GGGAG (SEQ ID N. TCAGCCAC (SEQ ID
(SEQ ID N.72) 73) N. 74)
VEGFA3- GGTGAGTGAGTGT CTGGGTGAATGG GGAAGGCGGAGA on GTGCGTGtgg (SEQ AGCGAGCAG GCCGGACA (SEQ
ID N.75) (SEQ ID N.76) ID N.77)
VEGFA3- AGTGAGTGAGTGT GAAGGGGAGGGG CGTGCGTGCCGCC ot1 GTGTGTGggg (SEQ GAAGTCACC (SEQ GTTGATC (SEQ ID
ID N.78) ID N.79) N. 80)
VEGFA3- TGTGGGTGAGTGT TCTGTCACCACAC GTAGTTGCCTGGG ot2 GTGCGTGagg (SEQ AGTTACCACC GATGGGGTATG ID N.81) (SEQ ID N.82) (SEQ ID N.83)
VEGFA3- GCTGAGTGAGTGT CACCTGGCCCATT TGGGGACAGCATG ot3 ATGCGTGtgg (SEQ TCTCCTTTGAGG TGCAAGCCACA ID N.84) (SEQ ID N.85) (SEQ ID N.86)
VEGFA3- GGTGAGTGAGTGT GGACCCCTCTGA CACACACCCTCAC ot4 GTGTGTGagg(SEQ CAGACTGCA (SEQ ATACCCTCAC (SEQ
ID N.87) ID N.88) ID N.89)
VEGFA3- AGAGAGTGAGTGT GGAAGAATGCAAA GACCTGGTGGGAG ot5 GTGCATGagg (SEQ GGAGAAGCAAGT TTGATTGGATC ID N.90) AC (SEQ ID N.91) (SEQ ID N.92)
VEGFA3- AGTGTGTGAGTGT CCTTGGGAATCTA GACACCCCACACA ot6 GTGCGTGtgg (SEQ TCTTGAATAGGCC CTCTCATGC (SEQ
ID N.93) T (SEQ ID N.94) ID N.95)
VEGFA3- TGTGAGTAAGTGT CCTAAGCTGTATG CTGTTTTGCTAAGA ot7 GTGTGTGtgg (SEQ TGAGTCCCTGA GATGATTAGATGG ID N.96) (SEQ ID N.97) TC (SEQ ID N.98)
VEGFA3- GTTGAGTGAATGT GCCCTCTCCGGA GAAGGGTTGGTTT ot8 GTGCGTGagg (SEQ AGTGCCTTG (SEQ GGAAGGCTGTC ID N.99) ID N.100) (SEQ ID N.101)
VEGFA3- GGTGAGTGAGTGC CCACAGGAATTTG CCCCACGTCCACC ot9 GTGCGGGtgg (SEQ AAGTCCGTGCT CATACACAC (SEQ
ID N.102) (SEQ ID N.103) ID N.104)
VEGFA3- AGCGAGTGGGTGT GACGTCTGGGTC GGCCGTCAGTCGG ot10 GTGCGTGggg CCGAGCAGT (SEQ TCCCGA (SEQ ID N.
(SEQ ID N.105) ID N.106) 107)
VEGFA3- TGTGAGTGAGTGT GGAGGGTTGAAC TGAGTATGTGTGA ot11 GTGCGTGtga (SEQ TGTGACAGAACTG GTGAGAGTGTGCA ID N.108) (SEQ ID N.109) (SEQ ID N.110)
VEGFA3- ACTGTGTGAGTGT GATCCTTAGGCGT CACCGGCACAGTG ot12 GTGCGTGagg (SEQ GCGTGTGC (SEQ ACACTCAC (SEQ ID
ID N.111) ID N.112) N. 113)
VEGFA3- TGTGAGTGAGTGT AGACCTTCAATGT CATAGAGTGTAGC ot13 GTGTATGggg (SEQ GGATGTGCGTG AGATTTCCATAACT ID N.114) (SEQ ID N.115) TC (SEQ ID N.116) Le mutazioni sono indicate in grassetto. La PAM è inclusa in minuscolo.
Tabella 8. Sequenze spaziatrici per bersagli e oligo genomici per l’amplificazione
di loci genomici
Locus Bersaglio Forward (5’-…-3’) Reverse (5’-…-3’)
GGTGAGTGAGTG GCATACGTGGGC CCGCAATGAAGGG
VEGFA3 TGTGCGTGTGG TCCAACAGGT GAAGCTCGA (SEQ
(SEQ ID N.75) (SEQ ID N.117) ID N.118)
GTGCGGCAAGAG GACTGTGGGCAG TGTATACGGGACT
ZSCAN2 CTTCAGCCGGG AGGTTCAGC (SEQ TGACTCAGACC
(SEQ ID N.119) ID N.120) (SEQ ID N.121) GAGTCCGAGCAG CTGCCATCCCCTT GGAATCTACCACC
EMX1-K AAGAAGAAGGG CTGTGAATGT CCAGGCTCT (SEQ
(SEQ ID N.57) (SEQ ID N.122) ID N.123)
GACCCCCTCCAC TCAGCGGACTCA GCGCCGAGTCGC
VEGFA2 CCCGCCTCCGG CCGGCCAG (SEQ CACTGCGG (SEQ
(SEQ ID N.124) ID N.125) ID N.126)
GCTGCAGAAGGG GCCAGGCTCTCTT AGCATAGCGCCTG
FANCF2 ATTCCATGAGG GGAGTGTC (SEQ GCATTAATAGG
(SEQ ID N.127) ID N.128) (SEQ ID N.129)
FANCF2- GCTGCAGAAGGG CCCGTGAGGTGC CACATGGAGGAGG
OT1 ATTCCAAGAGG TGAGATTTGAAC TGACGCTG (SEQ
(SEQ ID N.130) (SEQ ID N.131) ID N.132)
CCR5sp1 GGTACCTATCGAT ATGCACAGGGTG CTAAGCCATGTGC
1 TGTCAGGAGG GAACAAGATGGA ACAACTCTGAC
(SEQ ID N.133) (SEQ ID N.134) (SEQ ID N.135) GGTATCTATCGAT CATTGTGGGCTCA CTGAGATGAGCTT
CCR2 TGTCAGGAGG CTCTGCTGCA TCTGGAGAGTCA
(SEQ ID N.136) (SEQ ID N.137) (SEQ ID N.138) 5’- G disappaiate sono indicate in minuscolo. Le mutazioni sono indicate in
grassetto. PAM inclusa nelle sequenze bersaglio.

Claims (28)

  1. RIVENDICAZIONI 1. Una molecola Cas9 modificata isolata comprendente almeno una mutazione localizzata in corrispondenza della posizione del residuo amminoacidico selezionato nel gruppo costituito da K377, E387, D397, R400, D406, A421, L423, R424, Q426, Y430, K442, P449, V452, A456, R457, W464, M465, K468, E470, T474, P475, W476, F478, K483, S487, A488, T496, F498, L502, N504, K506, P509, F518, N522, E523, K526, L540, S541, I548, D550, F553, V561, K562, E573, A589, L598, D605, L607, N609, N612, E617, D618, D628, R629, R635, K637, L651, K652, R654, T657, G658, L666, K673, S675C, I679V, L680, L683, N690, R691, N692, F693, S701, F704, Q712, G715, Q716, H723, I724, L727, I733, L738, Q739; in cui la posizione della sequenza degli amminoacidi modificati è identificata mediante riferimento alla numerazione degli amminoacidi nella posizione corrispondente di una Cas9 di Streptococcus pyogenes (SpCas9) maturo e non modificato, come identificato dalla SEQ ID NO: 1.
  2. 2. Una Cas9 modificata secondo la rivendicazione 1, comprendente almeno una mutazione in corrispondenza della posizione K526.
  3. 3. Una Cas9 modificata secondo la rivendicazione 2, in cui la mutazione in corrispondenza della posizione K526 è selezionata nel gruppo costituito da K526N e K526E.
  4. 4. Una Cas9 modificata secondo una qualsiasi delle rivendicazioni 2-3, comprendente almeno una mutazione ulteriore localizzata in corrispondenza della posizione di residuo amminoacidico selezionata nel gruppo costituito da: K377, E387, D397, R400, Q402, R403, F405, D406, N407, A421, L423, R424, Q426, Y430, K442, P449, Y450, V452, A456, R457, W464, M465, K468, E470, T472, I473, T474, P475, W476, F478, K483, S487, A488, M495, T496, N497, F498, L502, N504, K506, P509, Y515, F518, N522, E523, L540, S541, I548, D550, F553, V561, K562, E573, A589, L598, D605, L607, N609, N612, E617, D618, D628, R629, R635, K637, L651, K652, R654, T657, G658, W659, R661, L666, K673, S675C, I679V, L680, L683, N690, R691, N692, F693, Q695, H698, S701, F704, Q712, G715, Q716, H721, H723, I724, L727, A728, I733, L738, Q739.
  5. 5. Una Cas9 modificata secondo la rivendicazione 4, in cui l’almeno una mutazione ulteriore è in corrispondenza di una posizione selezionata nel gruppo costituito da Y450, M495, Y515, R661, N690, R691, Q695, H698.
  6. 6. Una Cas9 modificata secondo una qualsiasi delle rivendicazioni 4-5, in cui l’almeno una mutazione ulteriore è selezionata nel gruppo costituito da: K377E, E387V, D397E, R400H, Q402R, R403H, F405L, D406Y, D406V, N407P, N407H, A421V, L423P, R424G, Q426R, Y430C, K442N, P449S, Y450A,Y450S, Y450H, Y450N, V452I, A456T, R457P, R457Q, W464L, M465R, K468N, E470D, T472A, I473F, I473V, T474A, P475H, W476R, F478Y, F478V, K483M, S487Y, A488V, M495V, M495T, T496A, N497A, F498I, F498Y, L502P, N504S, K506N, P509L, Y515N, F518L, F518I, N522K, N522I, E523K, E523D, K526N, K526E, L540Q, S541P, I548V, D550N, F553L, V561M, V561A, K562E, E573D, A589T, L598P, D605V, L607P, N609D, N609S, N612Y, N612K, E617K, D618N, D628G, R629G, R635G, K637N, L651P, L651H, K652E, R654H, T657A, G658E, W659R, R661A, R661W, R661L, R661Q, R661S, L666P, K673M, S675C, I679V, L680P, L683P, N690I, R691Q, R691L, N692I, F693Y, Q695A, Q695H, Q695L, H698Q, H698P, S701F, F704S, Q712R, G715S, Q716H, H721R, H723L, I724V, L727H, A728G, A728T, I733V, L738P, Q739E, Q739P e Q739K.
  7. 7. Una Cas9 modificata secondo una qualsiasi delle rivendicazioni 1-6 comprendente una mutazione quadrupla selezionata nel gruppo costituito da M495V+Y515N+K526E+R661X e M495V+K526E+R661X+H698Q; in cui X è un amminoacido selezionato nel gruppo costituito da L, Q e S; preferibilmente X è Q o S.
  8. 8. Una Cas9 modificata secondo la rivendicazione 1 comprendente almeno una mutazione selezionata nel gruppo costituito da K377E, E387V, D397E, R400H, Q402R, R403H, F405L, D406Y, D406V, N407P, N407H, A421V, L423P, R424G, Q426R, Y430C, K442N, P449S, Y450S, Y450H, Y450N, V452I, A456T, R457P, R457Q, W464L, M465R, K468N, E470D, T472A, I473F, I473V, T474A, P475H, W476R, F478Y, F478V, K483M, S487Y, A488V, M495V, M495T, T496A, F498I, F498Y, L502P, N504S, K506N, P509L, Y515N, F518L, F518I, N522K, N522I, E523K, E523D, K526E, K526N, L540Q, S541P, I548V, D550N, F553L, V561M, V561A, K562E, E573D, A589T, L598P, D605V, L607P, N609D, N609S, N612Y, N612K, E617K, D618N, D628G, R629G, R635G, K637N, L651P, L651H, K652E, R654H, T657A, G658E, W659R, R661W, R661L, R661Q, R661S, L666P, K673M, S675C, I679V, L680P, L683P, N690I, R691Q, R691L, N692I, F693Y, Q695H, Q695L, H698Q, H698P, S701F, F704S, Q712R, G715S, Q716H, H721R, H723L, I724V, L727H, A728G, A728T, I733V, L738P, Q739E, Q739P e Q739K.
  9. 9. Una Cas9 modificata secondo una qualsiasi delle rivendicazioni 4-8, comprendente un numero totale di dette mutazioni compreso tra 1 e 9.
  10. 10. Una Cas9 modificata secondo la rivendicazione 8 o 9, comprendente: una mutazione singola selezionata nel gruppo costituito da D406Y, W464L, T474A, N612K, L683P; o una mutazione doppia selezionata nel gruppo costituito da R400H+Y450S, D406V+E523K, A421V+R661W, R424G+Q739P, W476R+L738P, P449S+F704S, N522K+G658E, E523D+E617K, L540Q+L607P, W659R+R661W, S675C+Q695L e I679V+H723L; o una mutazione tripla selezionata nel gruppo costituito da K377E+L598P+L651H, D397E+Y430C+L666P, Q402R+V561M+Q695L, N407P+F498I+P509L, N407H+K637N+N690I, Y450H+F553L+Q716H, Y450N+H698P+Q739K, T472A+P475H+A488V, I473F+D550N+Q739E, F478Y+N522I+L727H, K483M+Q695H+Q712R, S487Y+N504S+E573D, T496A+N609D+A728G, R654H+R691Q+H698Q e R691L+H721R+I733V; una mutazione quadrupla selezionata nel gruppo costituito da F405L+F518L+L651P+I724V, L423P+M465R+Y515N+K673M, R457P+K468N+R661W+G715S, E470D+I548V+A589T+Q695H, A488V+D605V+R629G+T657A e M495V+K526N+S541P+K562E; o cinque mutazioni selezionate nel gruppo costituito da R403H+N612Y+L651P+K652E+G715S; sei mutazioni selezionate nel gruppo costituito da E387V+V561A+D618N+D628G+L680P+S701F, R403H+K526E+N612Y+L651P+K652E+G715S, R403H+M495T+N612Y+L651P+K652E+G715S, R403H+L502P+N612Y+L651P+K652E+G715S, R403H+K506N+N612Y+L651P+K652E+G715S, R403H+N612Y+L651P+K652E+N692I+G715S; o sette mutazioni selezionate nel gruppo costituito da R403H+A456T+N612Y+L651P+K652E+G715S+G728T, R403H+F498Y+N612Y+L651P+K652E+R661L+G715S, R403H+Q426R+F478V+N612Y+L651P+K652E+G715S; o otto mutazioni selezionate nel gruppo costituito da R403H+R442N+V452I+N609S+N612Y+R635G+L651P+K652E+F693Y+G715S; o nove mutazioni selezionate nel gruppo costituito da R403H+R457Q+F518I+N612Y+R635G+L651P+K652E+F693Y+G715S.
  11. 11. Una Cas9 modificata secondo una qualsiasi delle rivendicazioni 1-10, comprendente inoltre almeno una mutazione aggiuntiva che diminuisce l’attività nucleasica in corrispondenza di un residuo selezionato nel gruppo costituito da D10, E762, D839, H840, N863, H983 e D986.
  12. 12. Una Cas9 modificata secondo una qualsiasi delle rivendicazioni 1-10, comprendente inoltre almeno una mutazione aggiuntiva che cambia la specificità di riconoscimento della PAM in corrispondenza di un residuo selezionato nel gruppo costituito da D1135, G1218, R1335, T1337.
  13. 13. Una Cas9 modificata secondo una qualsiasi delle rivendicazioni 1-12 che proviene da S. pyogenes o un suo ortologo.
  14. 14. Una Cas9 modificata secondo una qualsiasi delle rivendicazioni 1-12 che è fusa a una o più altre sequenze polipeptidiche.
  15. 15. Un metodo per produrre una Cas9 modificata secondo una qualsiasi delle rivendicazioni 1-14, detto metodo comprendente la ricostruzione della Cas9 modificata da uno o più suoi frammenti.
  16. 16. Complessi proteici o ribonucleoproteici o complessi proteici e ribonucleoproteici misti o lipidici contenenti la Cas9 modificata secondo una qualsiasi delle rivendicazioni 1-14.
  17. 17. Una proteina di fusione comprendente una Cas9 modificata secondo una qualsiasi delle rivendicazioni 1-14.
  18. 18. Una sequenza di nucleotidi codificante una Cas9 modificata secondo una qualsiasi delle rivendicazioni 1-14 e i suoi frammenti.
  19. 19. Un acido nucleico comprendente la sequenza di nucleotidi secondo la rivendicazione 18.
  20. 20. Un vettore comprendente l’acido nucleico secondo la rivendicazione 19.
  21. 21. Un metodo per produrre una Cas9 modificata secondo una qualsiasi delle rivendicazioni 1-14, con cui la Cas9 modificata è espresso per mezzo di un acido nucleico secondo la rivendicazione 19.
  22. 22. Una cellula, animale o pianta ingegnerizzato usando un acido nucleico secondo la rivendicazione 19 o un vettore secondo la rivendicazione 20.
  23. 23. Una sequenza di nucleotidi secondo la rivendicazione 18 o acido nucleico secondo la rivendicazione 19 o vettore secondo la rivendicazione 20, per l’uso come un medicinale nella terapia genica.
  24. 24. Una composizione farmaceutica comprendente la sequenza di nucleotidi secondo la rivendicazione 18 o l’acido nucleico secondo la rivendicazione 19 o il vettore secondo la rivendicazione 20 e almeno un eccipiente farmaceuticamente accettabile.
  25. 25. Una composizione farmaceutica comprendente una Cas9 modificata ricombinante secondo una qualsiasi delle rivendicazioni 1-14 e almeno un eccipiente farmaceuticamente accettabile.
  26. 26. L’uso in vitro di Cas9 modificata ricombinante secondo le rivendicazioni 1-14 unitamente a un gRNA, o la sequenza di nucleotidi secondo la rivendicazione 18 o l’acido nucleico secondo la rivendicazione 19 o il vettore secondo la rivendicazione 20, per ingegneria genetica, ingegneria cellulare, espressione proteica o altre applicazioni di biotecnologia.
  27. 27. Un kit di parti, per uso simultaneo, separato o sequenziale, comprendente una Cas9 modificata ricombinante secondo le rivendicazioni 1-14 unitamente a un gRNA, o la sequenza di nucleotidi secondo la rivendicazione 18 o l’acido nucleico secondo la rivendicazione 19 o il vettore secondo la rivendicazione 20.
  28. 28. Un metodo in vitro per alterare il genoma di una cellula, il metodo comprendendo l’espressione nella cellula della Cas9 modificata secondo le rivendicazioni 1-14 unitamente a un RNA guida che identifica una sequenza genomica bersaglio.
IT102017000016321A 2017-02-14 2017-02-14 Mutanti di cas9 ad alta specificita' e loro applicazioni. IT201700016321A1 (it)

Priority Applications (12)

Application Number Priority Date Filing Date Title
IT102017000016321A IT201700016321A1 (it) 2017-02-14 2017-02-14 Mutanti di cas9 ad alta specificita' e loro applicazioni.
US16/485,253 US11525127B2 (en) 2017-02-14 2018-02-14 High-fidelity CAS9 variants and applications thereof
EP18708920.6A EP3583209A1 (en) 2017-02-14 2018-02-14 High-fidelity cas9 variants and applications thereof
CA3053218A CA3053218A1 (en) 2017-02-14 2018-02-14 High-fidelity cas9 variants and applications thereof
CN201880011895.5A CN110520528A (zh) 2017-02-14 2018-02-14 高保真性cas9变体及其应用
MX2019009651A MX2019009651A (es) 2017-02-14 2018-02-14 Variantes de cas9 de alta fidelidad y aplicaciones de las mismas.
JP2019565062A JP7232531B2 (ja) 2017-02-14 2018-02-14 高忠実度cas9バリアントおよびそれらの利用
EA201991913A EA037825B1 (ru) 2017-02-14 2018-02-14 ВЫСОКОТОЧНЫЕ ВАРИАНТЫ Cas9 И ИХ ПРИМЕНЕНИЯ
BR112019016765-0A BR112019016765A2 (pt) 2017-02-14 2018-02-14 Molécula de cas9 modificada isolada, método para produzir uma cas9 modificada, complexos de proteína ou ribonucleoproteína ou complexos de proteína e ribonucleoproteína misturadas ou lipídeo, proteína de fusão, sequência de nucleotídeos, ácido nucleico, vetor, célula, animal ou planta, composição farmacêutica, uso in vitro de uma cas9 modificada recombinante, kit de partes, e, método in vitro para alterar o genoma de uma célula
KR1020197026441A KR20190116407A (ko) 2017-02-14 2018-02-14 고-충실도 Cas9 변이체 및 그의 적용
PCT/EP2018/053717 WO2018149888A1 (en) 2017-02-14 2018-02-14 High-fidelity cas9 variants and applications thereof
AU2018221644A AU2018221644A1 (en) 2017-02-14 2018-02-14 High-fidelity Cas9 variants and applications thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
IT102017000016321A IT201700016321A1 (it) 2017-02-14 2017-02-14 Mutanti di cas9 ad alta specificita' e loro applicazioni.

Publications (1)

Publication Number Publication Date
IT201700016321A1 true IT201700016321A1 (it) 2018-08-14

Family

ID=59067822

Family Applications (1)

Application Number Title Priority Date Filing Date
IT102017000016321A IT201700016321A1 (it) 2017-02-14 2017-02-14 Mutanti di cas9 ad alta specificita' e loro applicazioni.

Country Status (12)

Country Link
US (1) US11525127B2 (it)
EP (1) EP3583209A1 (it)
JP (1) JP7232531B2 (it)
KR (1) KR20190116407A (it)
CN (1) CN110520528A (it)
AU (1) AU2018221644A1 (it)
BR (1) BR112019016765A2 (it)
CA (1) CA3053218A1 (it)
EA (1) EA037825B1 (it)
IT (1) IT201700016321A1 (it)
MX (1) MX2019009651A (it)
WO (1) WO2018149888A1 (it)

Families Citing this family (49)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3613852A3 (en) 2011-07-22 2020-04-22 President and Fellows of Harvard College Evaluation and improvement of nuclease cleavage specificity
US9163284B2 (en) 2013-08-09 2015-10-20 President And Fellows Of Harvard College Methods for identifying a target site of a Cas9 nuclease
US9359599B2 (en) 2013-08-22 2016-06-07 President And Fellows Of Harvard College Engineered transcription activator-like effector (TALE) domains and uses thereof
US9322037B2 (en) 2013-09-06 2016-04-26 President And Fellows Of Harvard College Cas9-FokI fusion proteins and uses thereof
US9228207B2 (en) 2013-09-06 2016-01-05 President And Fellows Of Harvard College Switchable gRNAs comprising aptamers
US9737604B2 (en) 2013-09-06 2017-08-22 President And Fellows Of Harvard College Use of cationic lipids to deliver CAS9
US20150166982A1 (en) 2013-12-12 2015-06-18 President And Fellows Of Harvard College Methods for correcting pi3k point mutations
US10077453B2 (en) 2014-07-30 2018-09-18 President And Fellows Of Harvard College CAS9 proteins including ligand-dependent inteins
US11680268B2 (en) 2014-11-07 2023-06-20 Editas Medicine, Inc. Methods for improving CRISPR/Cas-mediated genome-editing
WO2016182959A1 (en) 2015-05-11 2016-11-17 Editas Medicine, Inc. Optimized crispr/cas9 systems and methods for gene editing in stem cells
WO2016201047A1 (en) 2015-06-09 2016-12-15 Editas Medicine, Inc. Crispr/cas-related methods and compositions for improving transplantation
AU2016326711B2 (en) 2015-09-24 2022-11-03 Editas Medicine, Inc. Use of exonucleases to improve CRISPR/Cas-mediated genome editing
IL294014B1 (en) 2015-10-23 2024-03-01 Harvard College Nucleobase editors and their uses
EP3433363A1 (en) 2016-03-25 2019-01-30 Editas Medicine, Inc. Genome editing systems comprising repair-modulating enzyme molecules and methods of their use
US11236313B2 (en) 2016-04-13 2022-02-01 Editas Medicine, Inc. Cas9 fusion molecules, gene editing systems, and methods of use thereof
AU2017306676B2 (en) 2016-08-03 2024-02-22 President And Fellows Of Harvard College Adenosine nucleobase editors and uses thereof
CA3033327A1 (en) 2016-08-09 2018-02-15 President And Fellows Of Harvard College Programmable cas9-recombinase fusion proteins and uses thereof
WO2018039438A1 (en) 2016-08-24 2018-03-01 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
US11242542B2 (en) * 2016-10-07 2022-02-08 Integrated Dna Technologies, Inc. S. pyogenes Cas9 mutant genes and polypeptides encoded by same
CN110462034A (zh) 2016-10-07 2019-11-15 综合Dna技术公司 化脓链球菌cas9突变基因和由其编码的多肽
CN110214180A (zh) 2016-10-14 2019-09-06 哈佛大学的校长及成员们 核碱基编辑器的aav递送
US11377645B2 (en) 2016-12-16 2022-07-05 The Rockefeller University Compositions and methods using Cas9 with enhanced spacer acquisition function
WO2018119359A1 (en) 2016-12-23 2018-06-28 President And Fellows Of Harvard College Editing of ccr5 receptor gene to protect against hiv infection
IT201700016321A1 (it) 2017-02-14 2018-08-14 Univ Degli Studi Di Trento Mutanti di cas9 ad alta specificita' e loro applicazioni.
US11898179B2 (en) 2017-03-09 2024-02-13 President And Fellows Of Harvard College Suppression of pain by gene editing
JP2020510439A (ja) 2017-03-10 2020-04-09 プレジデント アンド フェローズ オブ ハーバード カレッジ シトシンからグアニンへの塩基編集因子
KR20190130613A (ko) 2017-03-23 2019-11-22 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 핵산 프로그램가능한 dna 결합 단백질을 포함하는 핵염기 편집제
WO2018201086A1 (en) 2017-04-28 2018-11-01 Editas Medicine, Inc. Methods and systems for analyzing guide rna molecules
WO2018209320A1 (en) 2017-05-12 2018-11-15 President And Fellows Of Harvard College Aptazyme-embedded guide rnas for use with crispr-cas9 in genome editing and transcriptional activation
AU2018279829B2 (en) * 2017-06-09 2024-01-04 Editas Medicine, Inc. Engineered Cas9 nucleases
WO2019014564A1 (en) 2017-07-14 2019-01-17 Editas Medicine, Inc. SYSTEMS AND METHODS OF TARGETED INTEGRATION AND GENOME EDITING AND DETECTION THEREOF WITH INTEGRATED PRIMING SITES
WO2019023680A1 (en) 2017-07-28 2019-01-31 President And Fellows Of Harvard College METHODS AND COMPOSITIONS FOR EVOLUTION OF BASIC EDITORS USING PHAGE-ASSISTED CONTINUOUS EVOLUTION (PACE)
US11319532B2 (en) 2017-08-30 2022-05-03 President And Fellows Of Harvard College High efficiency base editors comprising Gam
US11795443B2 (en) 2017-10-16 2023-10-24 The Broad Institute, Inc. Uses of adenosine base editors
EP3918059A4 (en) * 2019-01-29 2022-11-30 Flagship Pioneering Innovations V, Inc. COMPOSITIONS CONTAINING AN ENDONUCLEASIS AND METHODS OF PURIFICATION OF AN ENDONUCLEASE
EP3942040A1 (en) 2019-03-19 2022-01-26 The Broad Institute, Inc. Methods and compositions for editing nucleotide sequences
US20230022146A1 (en) * 2019-06-17 2023-01-26 Vertex Pharmaceuticals Incorporated Compositions and methods for editing beta-globin for treatment of hemaglobinopathies
CN114651067A (zh) * 2019-10-15 2022-06-21 新加坡科技研究局 测量核酸修饰酶活性的测定
EP4077674A1 (en) 2019-12-18 2022-10-26 Alia Therapeutics S.R.L. Compositions and methods for treating retinitis pigmentosa
MX2022014008A (es) 2020-05-08 2023-02-09 Broad Inst Inc Métodos y composiciones para la edición simultánea de ambas cadenas de una secuencia de nucleótidos de doble cadena objetivo.
WO2022018638A1 (en) 2020-07-21 2022-01-27 Crispr Therapeutics Ag Genome-editing compositions and methods to modulate faah for treatment of neurological disorders
CA3205138A1 (en) 2020-12-17 2022-06-23 Vertex Pharmaceuticals Incorporated Compositions and methods for editing beta-globin for treatment of hemaglobinopathies
CN112680430B (zh) * 2020-12-28 2023-06-06 南方医科大学 一种CRISPR SpCas9突变体及其应用
CN113005141A (zh) * 2021-01-05 2021-06-22 温州医科大学 高活性突变体构成的基因编辑工具及制备方法和修复先天性视网膜劈裂症致病基因的方法
CN112626070A (zh) * 2021-01-13 2021-04-09 海南微氪生物科技股份有限公司 一种基于切离酶基因编辑技术的定向修复系统
WO2022152746A1 (en) 2021-01-13 2022-07-21 Alia Therapeutics Srl K526d cas9 variants and applications thereof
WO2022238958A1 (en) 2021-05-12 2022-11-17 Crispr Therapeutics Ag Multiplex gene editing
WO2023285431A1 (en) 2021-07-12 2023-01-19 Alia Therapeutics Srl Compositions and methods for allele specific treatment of retinitis pigmentosa
WO2023060059A2 (en) * 2021-10-05 2023-04-13 The Board Of Trustees Of The Leland Stanford Junior University Treatment of polycythemia vera via cr1spr/aav6 genome editing

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016164797A1 (en) * 2015-04-08 2016-10-13 University Of Pittsburgh - Of The Commonwealth System Of Higher Education Activatable crispr/cas9 for spatial and temporal control of genome editing
US9512446B1 (en) * 2015-08-28 2016-12-06 The General Hospital Corporation Engineered CRISPR-Cas9 nucleases
WO2016205613A1 (en) * 2015-06-18 2016-12-22 The Broad Institute Inc. Crispr enzyme mutations reducing off-target effects

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2913869C (en) * 2013-05-29 2023-01-24 Cellectis New compact scaffold of cas9 in the type ii crispr system
WO2016123243A1 (en) * 2015-01-28 2016-08-04 The Regents Of The University Of California Methods and compositions for labeling a single-stranded target nucleic acid
EP3265559B1 (en) 2015-03-03 2021-01-06 The General Hospital Corporation Engineered crispr-cas9 nucleases with altered pam specificity
IT201700016321A1 (it) 2017-02-14 2018-08-14 Univ Degli Studi Di Trento Mutanti di cas9 ad alta specificita' e loro applicazioni.

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016164797A1 (en) * 2015-04-08 2016-10-13 University Of Pittsburgh - Of The Commonwealth System Of Higher Education Activatable crispr/cas9 for spatial and temporal control of genome editing
WO2016205613A1 (en) * 2015-06-18 2016-12-22 The Broad Institute Inc. Crispr enzyme mutations reducing off-target effects
US9512446B1 (en) * 2015-08-28 2016-12-06 The General Hospital Corporation Engineered CRISPR-Cas9 nucleases

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
BENJAMIN P. KLEINSTIVER ET AL: "High-fidelity CRISPR-Cas9 nucleases with no detectable genome-wide off-target effects", NATURE, vol. 529, no. 7587, 6 January 2016 (2016-01-06), pages 490 - 495, XP055303390, ISSN: 0028-0836, DOI: 10.1038/nature16526 *
CASINI A ET AL: "Identification of high-fidelity Cas9 variants using a yeast-based screening", HUMAN GENE THERAPY, vol. 27, no. 11, 18 October 2016 (2016-10-18) - 21 October 2016 (2016-10-21), & CONFERENCE ON CHANGING THE FACE OF MODERN MEDICINE - STEM CELLS AND GENE THERAPY; FLORENCE, ITALY, pages A41 *
IAN M SLAYMAKER ET AL: "Rationally engineered Cas9 nucleases with improved specificity", SCIENCE, AMERICAN ASSOCIATION FOR THE ADVANCEMENT OF SCIENCE, vol. 351, no. 6268, 1 January 2016 (2016-01-01), pages 84 - 88, XP002757561, ISSN: 0036-8075, [retrieved on 20151201], DOI: 10.1126/SCIENCE.AAD5227 *
M. JINEK ET AL: "Structures of Cas9 Endonucleases Reveal RNA-Mediated Conformational Activation", SCIENCE, vol. 343, no. 6176, 14 March 2014 (2014-03-14), pages 1247997 - 1247997, XP055149157, ISSN: 0036-8075, DOI: 10.1126/science.1247997 *

Also Published As

Publication number Publication date
CN110520528A (zh) 2019-11-29
EA037825B1 (ru) 2021-05-25
AU2018221644A1 (en) 2019-08-29
CA3053218A1 (en) 2018-08-23
KR20190116407A (ko) 2019-10-14
US11525127B2 (en) 2022-12-13
JP2020507347A (ja) 2020-03-12
EP3583209A1 (en) 2019-12-25
WO2018149888A1 (en) 2018-08-23
EA201991913A1 (ru) 2020-01-22
US20200149020A1 (en) 2020-05-14
JP7232531B2 (ja) 2023-03-03
BR112019016765A2 (pt) 2020-05-26
MX2019009651A (es) 2019-12-18

Similar Documents

Publication Publication Date Title
IT201700016321A1 (it) Mutanti di cas9 ad alta specificita&#39; e loro applicazioni.
AU2021200010B2 (en) Novel CRISPR enzymes and systems
JP6745391B2 (ja) 遺伝子操作CRISPR−Cas9ヌクレアーゼ
US10767168B2 (en) Engineered CRISPR-Cas9 nucleases with altered PAM specificity
JP6700788B2 (ja) Rna誘導性ヒトゲノム改変
US20220364071A1 (en) Novel crispr enzymes and systems
US20230025039A1 (en) Novel type vi crispr enzymes and systems
US20200255829A1 (en) Novel crispr-associated transposon systems and components
Chacko et al. The lncRNA RZE1 controls cryptococcal morphological transition
EP3778899A1 (en) Rna-directed dna cleavage and gene editing by cas9 enzyme from neisseria meningitidis
WO2016108926A1 (en) Crispr mediated in vivo modeling and genetic screening of tumor growth and metastasis
EP3794118A1 (en) In situ cell screening methods and systems
KR20220054434A (ko) 신규한 crispr dna 표적화 효소 및 시스템
EP3847251A1 (en) Compositions and methods for improved nucleases
Li et al. RELATe enables genome-scale engineering in fungal genomics
US20200246488A1 (en) Compositions and methods for treating inflammatory bowel diseases
Mercier et al. In depth characterization of an archaeal virus-host system reveals numerous virus exclusion mechanisms
Penewit et al. Recombineering in Staphylococcus aureus
Casini Better safe than sorry: new CRISPR/Cas9 tools for improved genome engineering
WO2024030961A2 (en) Type lb crispr-associated transposase systems
Schlesinger Functional screening and molecular characterisation of small proteins
Sandoval Genetic and Functional Characterization of Novel Host Factors Regulating Virus Infection in Caenorhabditis elegans
Reilly Bypassable essential genes affecting regulation of heterochromatin silencing in S. pombe
Davis et al. Mobile website: http://y. gsaconf. org Follow the conference on Twitter:# YEAST14