KR20240029030A - 미오신 중쇄 염기 편집을 위한 조성물 및 방법 - Google Patents

미오신 중쇄 염기 편집을 위한 조성물 및 방법 Download PDF

Info

Publication number
KR20240029030A
KR20240029030A KR1020247002102A KR20247002102A KR20240029030A KR 20240029030 A KR20240029030 A KR 20240029030A KR 1020247002102 A KR1020247002102 A KR 1020247002102A KR 20247002102 A KR20247002102 A KR 20247002102A KR 20240029030 A KR20240029030 A KR 20240029030A
Authority
KR
South Korea
Prior art keywords
seq
sequence
cas9
fusion protein
gene
Prior art date
Application number
KR1020247002102A
Other languages
English (en)
Inventor
에릭 엔. 올슨
론다 바셀-두비
안드레아스 차이
Original Assignee
더 보드 오브 리젠츠 오브 더 유니버시티 오브 텍사스 시스템
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 더 보드 오브 리젠츠 오브 더 유니버시티 오브 텍사스 시스템 filed Critical 더 보드 오브 리젠츠 오브 더 유니버시티 오브 텍사스 시스템
Publication of KR20240029030A publication Critical patent/KR20240029030A/ko

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K67/00Rearing or breeding animals, not otherwise provided for; New breeds of animals
    • A01K67/027New breeds of vertebrates
    • A01K67/0275Genetically modified vertebrates, e.g. transgenic
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • A61K48/0058Nucleic acids adapted for tissue specific expression, e.g. having tissue specific promoters as part of a contruct
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/0075Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the delivery route, e.g. oral, subcutaneous
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P9/00Drugs for disorders of the cardiovascular system
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4716Muscle proteins, e.g. myosin, actin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/78Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y305/00Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
    • C12Y305/04Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
    • C12Y305/04002Adenine deaminase (3.5.4.2)
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2207/00Modified animals
    • A01K2207/15Humanized animals
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/07Animals genetically altered by homologous recombination
    • A01K2217/075Animals genetically altered by homologous recombination inducing loss of function, i.e. knock out
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2227/00Animals characterised by species
    • A01K2227/10Mammal
    • A01K2227/105Murine
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2267/00Animals characterised by purpose
    • A01K2267/03Animal model, e.g. for test or diseases
    • A01K2267/0306Animal model for genetic diseases
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/09Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/80Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector

Abstract

본 개시는 CRISPR-Cas9 시스템용으로 설계된 Cas9 니카제 및 데아미나제를 포함하는 단일 가이드 RNA(sgRNA) 및 융합 단백질을 포함하는 조성물, 및 하나 이상의 심근증(cardiomyopathies)을 예방, 개선 또는 치료하기 위해 이를 사용하는 방법에 관한 것이다.

Description

미오신 중쇄 염기 편집을 위한 조성물 및 방법
관련 출원과의 상호-참조
본 출원은 2021년 7월 1일에 제출된 미국 가출원 번호 제63/217,618호 및 2021년 7월 2일에 제출된 미국 가출원 번호 제63/218,221호의 이익을 주장하고, 그 개시는 참조에 의해 그 전체가 본원에 도입된다.
서열 목록의 참조에 의한 도입
본 출원에는 컴퓨터 판독가능 형식으로 PatentCenter를 통해 제출된 서열 목록이 함유되어 있으며, 그 전체가 참조에 의해 본원에 도입된다. 2022년 7월 1일에 작성된 컴퓨터 판독가능 파일은 UTSW-3923-PCT(106546-728561).xml로 명명되고, 크기는 약 368,000바이트이다.
본 발명의 개념은 단일 가이드 RNA(sgRNA)와, 데아미나제 및 Cas9 니카제(nickase) 또는 비활성화된(deactivated) Cas9 엔도뉴클레아제를 포함하는 융합 단백질(fusion protein)을 포함하는 조성물 및 하나 이상의 심근증(cardiomyopathies)을 예방, 개선 또는 치료하기 위한 이들의 사용 방법에 관한 것이다.
관련 기술의 논의
심근증(cardiomyopathy)은 심근의 비대, 비후 및/또는 경직을 유발하는 심근의 질환이다.  심근증이 진행되면, 심장이 약해지고, 심부전 또는 불규칙한 심장 박동(즉, 부정맥(arrhythmias))을 유도할 수 있다. 비대성 심근증(HCM)은 종종 육종, 세포 골격 및/또는 소포체 유전자의 유전적 돌연변이에 기인하는 주요 유형의 심근증이다. 현재, 이러한 심근증에 대한 치료법은 이식을 제외하고는 없다. 따라서, 의료 분야에서는 이러한 심장 질환에 대한 치료가 요구되고 있다. 
요약
본 개시는 적어도 부분적으로는 염기쌍 편집을 통해 유전자 돌연변이를 수정함으로써 HCM과 같은 가족성 심근증과 관련된 표현형을 성공적으로 역전시키는 클러스터드-규칙적 인터스페이스 짧은 회문 반복(CRISPR)-CRISPR 연관 단백질 9(Cas9) 시스템과 함께 사용하기 위한 가이드 RNA(gRNA)의 발견에 기반한다.  
본 개시의 양상은, 서열번호 1 또는 2의 DNA 뉴클레오티드 서열에 대응하는 스페이서 서열(spacer sequence)을 포함하는 gRNA를 제공한다. 일부 양상에서, gRNA는 서열번호 5 또는 6에 대해 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100%의 서열 동일성(sequence identity)을 갖는 스페이서 서열을 포함한다. 예를 들면, 일부 양상에서, gRNA는 서열번호 5 또는 6을 포함하거나 이를 이루어지는 스페이서 서열을 포함할 수 있다. 
본 개시의 다른 양상은 Cas9 니카제 또는 비활성화된 Cas9 엔도뉴클레아제에 공유 결합된 데아미나제를 포함하는 융합 단백질을 제공한다.
다양한 양상에서, 데아미나제는 ABEmax, ABE8e, ABE7.10 및 이들의 임의의 기능적 변이체(functional variant)로 이루어진 그룹으로부터 선택될 수 있다. 다양한 양상에서, 데아미나제는 서열번호 7, 9 및 11 중 어느 하나에 대해 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%의 서열 상동성(sequence homology)을 갖는 아미노산 서열을 포함할 수 있다. 예를 들면, 데아미나제는 서열번호 7, 9 및 11을 포함하는 아미노산 서열을 포함할 수 있다. 일부 실시형태에서, 데아미나제는 서열번호 7을 포함하는 아미노산 서열을 포함한다.
본 개시의 다양한 양상에서, Cas9 니카제 또는 비활성화된 Cas9 엔도뉴클레아제는 SpRY, SpG, SpCas9-NG, SpCas9-VRQR 또는 이들의 변이체로부터 선택된다. 일부 양상에서, Cas9 니카제 또는 비활성화된 Cas9 엔도뉴클레아제는 서열번호 15, 17, 19 및 21 중 어느 하나와 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%의 서열 상동성을 갖는 아미노산 서열을 포함한다. 예를 들면, Cas9 니카제 또는 비활성화된 Cas9 엔도뉴클레아제는 서열번호 15, 17, 19, 21(SpRY, SpG, SpCas9-NG, SpCas9-VRQR) 중 어느 하나를 포함하는 아미노산 서열을 포함할 수 있다. 일부 양상에서, Cas9 니카제 또는 비활성화된 Cas9 엔도뉴클레아제는 서열번호 15를 포함하는 아미노산 서열을 포함한다. 
본 개시의 임의의 양상에서, 데아미나제는 펩티드 링커(peptide linker)를 통해 Cas9 니카제 또는 비활성화된 Cas9 엔도뉴클레아제에 공유 결합될 수 있다. 일부 양상에서, 펩티드 링커는 서열번호 27을 포함하는 아미노산 서열을 포함한다. 
본원에 기재된 임의의 융합 단백질에서, 데아미나제 및/또는 Cas9 니카제 또는 비활성화된 Cas9 엔도뉴클레아제는 핵 국재화 신호(nuclear localization signal; NLS) 펩티드를 추가로 포함한다. 다양한 양상에서, 핵 국재화 신호(NLS) 펩티드는 서열번호 31 내지 42 중 어느 하나로부터 선택될 수 있다. 일부 양상에서, 핵 국재화 신호(NLS) 펩티드는 서열번호 31 또는 서열번호 32를 포함할 수 있다. 
본 개시의 임의의 양상에서, 융합 단백질은 서열번호 45 내지 60 중 어느 하나에 대해 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99%의 서열 상동성을 갖는 아미노산 서열을 포함하는 융합 단백질이 제공된다. 일부 양상에서, 융합 단백질의 아미노산 서열은 서열번호 45 내지 60 중 어느 하나를 포함하거나 이들로 이루어진다. 일부 양상에서, 융합 단백질의 아미노산 서열은 서열번호 45 또는 46(ABEmax-SpCas9_VRQR)을 포함하거나 이들로 이루어진다. 
본 개시의 추가 양상은 본원에 기재된 임의의 gRNA를 코딩하는(encoding) 단리된 핵산을 제공한다. 다른 양상은 본원에 제공된 융합 단백질을 코딩하는 단리된 핵산을 제공한다. 또한, gRNA 및/또는 융합 단백질 또는 이의 단편을 코딩하는 하나 이상의 핵산을 포함하는 바이러스 벡터(viral vector)가 제공된다. 일부 양상에서, (a) 제4항 내지 제20항 중 어느 한 항의 융합 단백질의 제1 단편을 코딩하는 핵산을 포함하는 제1 바이러스 벡터 및 (b) 융합 단백질의 제2 단편을 코딩하는 제2 바이러스 벡터를 포함하는 바이러스 벡터의 쌍(pair)으로서, 상기 융합 단백질의 제1 단편 및 제2 단편이 단백질 트랜스-스플라이싱(protein trans-splicing)을 거쳐 융합 단백질을 형성할 수 있는 바이러스 벡터의 쌍이 제공된다.  임의의 양상에서, 제1 및/또는 제2 바이러스 벡터는 서열번호 1 또는 2를 표적화(targeting)하는 gRNA를 코딩하는 핵산을 추가로 포함할 수 있다. 
본 개시의 또 다른 양상은 본원에 제공된 gRNA 또는 융합 단백질(또는 이의 단편)을 코딩하는 임의의 단리된 핵산, 바이러스 벡터 및/또는 본원에 제공된 바이러스 벡터의 쌍 및 약제학적으로 허용되는 담체, 희석제 및/또는 부형제를 포함하는 약제학적 조성물을 제공한다. 일부 양상에서, 약제학적 조성물은 리포솜을 추가로 포함할 수 있다. 
본 개시의 다른 양상은 세포에서 MYH7 유전자의 돌연변이를 수정(correcting)하는 방법을 제공하고, 이 방법은 Cas9 니카제 또는 비활성화된 Cas9 엔도뉴클레아제, 데아미나제, 및 서열번호 1 또는 2 중 어느 하나로부터 선택된 DNA 뉴클레오티드 서열을 표적화하는 gRNA, 또는 Cas9 니카제 또는 비활성화된 Cas9 엔도뉴클레아제, 데아미나제 및/또는 gRNA를 코딩하는 하나 이상의 핵산을 세포에 전달하여, MYH7 유전자 내 또는 근방에서 적어도 하나의 뉴클레오티드의 하나 이상의 돌연변이를 초래하는 MYH7 유전자 내 또는 그 근방에서 하나 이상의 단일-가닥 절단(single-strand break; SSB)을 수행함으로써 MYH7 유전자의 돌연변이를 수정하는 단계를 포함한다. 일부 양상에서, 본 방법은 본원에 기재된 핵산, 바이러스 벡터 또는 바이러스 벡터의 쌍을 세포에 전달하는 단계를 포함한다. 
본 개시의 또 다른 양상은 이를 필요로 하는 대상체(subject)에서 MYH7 유전자의 돌연변이에 의해 유발된 심근증을 치료하는 방법에 관한 것이고, 상기 방법은 MYH7 유전자를 발현하는 대상체 내의 적어도 하나의 세포에, RNA 가이드 니카제, 데아미나제, 및 서열번호 1 또는 2 중 어느 하나로부터 선택된 DNA 뉴클레오티드 서열을 표적화하는 gRNA, 또는 RNA 가이드 니카제, 데아미나제 및/또는 gRNA를 코딩하는 하나 이상의 핵산을 전달하여, MYH7 유전자 내 또는 그 근방에서 적어도 하나의 뉴클레오티드의 하나 이상의 돌연변이를 초래하는 MYH7 유전자 내 또는 그 근방에서 하나 이상의 단일-가닥 절단(SSB)을 수행함으로써, 대상체의 적어도 하나의 세포에서 MYH7 유전자의 돌연변이를 수정하는 단계를 포함한다. 일부 양상에서, 본 방법은 본원에 제공된 gRNA 및/또는 융합 단백질 중 하나 이상을 코딩하는 핵산을 포함하는 핵산 또는 바이러스 벡터를 포함하는 약제학적 조성물을 대상체에게 투여하는 것을 포함한다. 다양한 양상에서, MYH7 유전자의 돌연변이는 돌연변이된 MYH7 유전자에 의해 코딩된 단백질 생성물에서 단일 아미노산 치환을 초래하는 하나 이상의 단일 뉴클레오티드 다형성(polymorphism)을 포함한다. 다양한 양상에서, 단백질 생성물은 미오신 단백질 또는 펩티드일 수 있고, 단일 아미노 치환은 서열번호 96에 따라 R403Q를 포함한다. 
본 개시의 추가의 양상은 인간화 돌연변이 Myh6 대립유전자를 형성하기 위해 내인성 뮤린(endogenous murine) Myh6 유전자 내에 삽입된 MYH7 c.1208 G>A(p.R403Q) 인간 미스센스(missense) 돌연변이를 포함하는 인간 핵산을 포함하는 유전자 편집 마우스에 관한 것이다. 일부 양상에서, 인간 핵산은 미스센스 돌연변이에 인접하고 상류에 위치하는 제1 폴리뉴클레오티드 및 미스센스 돌연변이에 인접하고 하류에 위치하는 제2 폴리뉴클레오티드를 추가로 포함한다. 다양한 양상에서, 제1 폴리뉴클레오티드는 약 30 내지 75개 뉴클레오티드, 약 35 내지 약 70개 뉴클레오티드, 약 40 내지 약 65개 뉴클레오티드, 또는 약 45 내지 약 60개 뉴클레오티드를 포함한다. 일부 양상에서, 제1 폴리뉴클레오티드는 55개 뉴클레오티드를 포함하거나 이들로 이루어진다. 일부 양상에서, 제2 폴리뉴클레오티드는 약 10 내지 30개 뉴클레오티드, 약 15 내지 25개 뉴클레오티드, 또는 약 20 내지 25개 뉴클레오티드를 포함한다. 추가의 양상에서, 제2 폴리뉴클레오티드는 21개 뉴클레오티드를 포함하거나 이들로 이루어진다. 다양한 양상에서, 인간 핵산은 서열번호 97의 뉴클레오티드 서열을 포함한다. 본원의 임의의 양상에서, 마우스의 적어도 하나의 세포는 서열번호 94를 포함하는 야생형 미오신 단백질에 대하여 R404Q 치환을 포함하는 돌연변이 미오신 단백질을 발현한다. 추가의 양상에서, 마우스는 또한 야생형 Myh6 대립유전자를 포함할 수 있고, 마우스는 인간화 돌연변이 Myh6 대립유전자에 대해 이형접합성(heterozygous)이다.
하기 도면은 본원의 일부를 구성하고, 본 개시의 특정 양상을 추가로 설명하기 위해 포함되며, 이는 본원에 제시된 특정 실시형태의 상세한 설명과 조합하여 도면을 참조함으로써 더욱 잘 이해할 수 있다. 본 발명의 실시형태는 유사한 참조 번호가 유사한 요소를 나타내는 예시적 예를 통해 설명된다:
도 1A-1C는 본 개시의 다양한 양상에 따라 인간 세포에서 MYH7 돌연변이의 수정에 사용되는 예시적 CRISPR-Cas9 시스템을 나타내는 대표적 개략도 및 그래프를 도시한다. 도 1A는 gRNA 설계의 예시적 개요를 설명하는 개략도를 나타낸다.  도 1B는 인간 iPSC 세포에 대한 CRISPR-Cas9 시스템 형질감염의 예시적 개요를 설명하는 개략도를 나타낸다. 도 1C는 MYH7 R403Q 돌연변이를 수정하기 위한 예시적 CRISPR-Cas9 시스템의 편집 효율을 설명하는 그래프를 나타낸다. 
도 2A 및 도 2B는 본 개시의 다양한 양상에 따라 인간 세포에서 MYH7 돌연변이의 수정에 사용되는 예시적 CRISPR-Cas9 시스템을 설명하는 대표적 개략도 및 그래프를 나타낸다. 도 2A는 MYH7 R403Q 돌연변이를 수정하는 CRISPR-Cas9 시스템의 투여 후에 인간 iPSC 세포의 분화에 대한 예시적 개요를 설명하는 개략도를 나타낸다. 도 2B는 MYH7 R403Q 돌연변이를 수정하는 CRISPR-Cas9 시스템의 투여 후에 심근세포로 분화된 인간 iPSC 세포의 과수축성의 감소를 도시하는 그래프를 나타낸다. 
도 3A 및 3B는 본 개시의 다양한 양상에 따라 마우스 미오신 중쇄 6(Myh6) 유전자(도 3B) 내에서 동일한 인간 질환-유발 돌연변이를 표적화하는 인간 MYH7 p.R403Q 돌연변이(도 3A)를 모델링하기 위해 생성된 유전자 변형 마우스 계통을 설명하는 대표적 개략도를 나타낸다.
도 4A-4E는 본 개시의 다양한 양상에 따라 발생 단계 P8에서 야생형(WT; 도 4A), 403/+(도 4B) 및 403/403(도 4C) 마우스의 심장 표현형의 발달 및 생후 6개월 후의 야생형(WT; 도 4D) 및 403/+(도 4E) 마우스의 심장 섬유화를 설명하는 대표적 이미지를 도시한다.
도 5는 본 개시의 다양한 양상에 따라 인간 MYH7 p.R403Q 돌연변이의 마우스 모델에서 Myh6.R403Q 돌연변이의 수정을 위한 CRISPR-Cas9 시스템을 설명하는 대표적 개략도를 도시한다.
도 6A는 상동성-지시 복구를 통해 동종 HD403/+ 및 HD403/403 iPSC를 생성하는 대표적 개략도를 도시한다. 건강한 공여자(HDWT)로부터 유래한 iPSC를 사용하여, MYH7 p.R403Q(c.1208G>A) 돌연변이는 SpCas9, sgRNA(녹색으로 표시된 스페이서 서열, 금색으로 표시된 PAM 서열) 및 돌연변이를 함유하는 단일-가닥 올리고데옥시뉴클레오티드(ssODN) 공여자 주형을 사용한 CRISPR-Cas9-기반 상동성-지시 복구에 의해 도입했다. 이형접합성 유전자형(HD403/+) 및 호모접합성 유전자형(HD403/403)을 단리했다. 돌연변이 삽입 및 대응하는 아미노산 변화를 강조하는 크로마토그램을 표시된 유전자형에 대해 표시한다. 적색 화살표는 아미노산 403의 코딩 뉴클레오티드 1208을 나타낸다. 
도 6B는 고도 상동성 MYH6 유전자에 돌연변이 삽입이 없음을 나타내는 생어 서열분석 크로마토그램을 도시한다. 적색 화살표는 코딩 뉴클레오티드 1211 및 아미노산 404를 나타낸다.
도 6C 도 6A-6B에서 생성된 iPSC로부터 유래된 심근세포의 대표적 이미지를 도시한다. (알파-액티닌은 녹색으로 표시되고, 핵은 청색으로 DAPI(4',6-디아미디노-2-페닐인돌)로 표시되어 있다. 스케일 바, 25μm.
도 7A는 예시적 sgRNA, h403_sgRNA를 염기 편집 방법에 사용하여 MYH7 c.1208G>A(p.R403Q) 미스센스 돌연변이를 수정하는 방법을 도시하는 개략도이다. 구체적으로, 염기 편집은 돌연변이 중성 하전된 글루타민을 양으로 하전된 아르기닌으로 다시 전환하여, 미오신 헤드의 적절한 기능을 회복시킬 수 있다. 
도 7B는 일부 예시적 방법에서 8개의 후보 염기 에디터 변이체가 호모접합성 MYH7 c.1208G>A iPSC 계통(HD403/403) 내에서 후보 h403_sgRNA를 사용하여 병원성 아데닌을 구아닌으로 수정하는 이들의 효율에 대해 스크리닝하는 방법을 설명하는 개략도를 도시한다.
도 7C는 후보 염기 에디터에 의한 형질감염 72시간 후의 HD403/403 iPSC에서 표적 프로토스페이서 내의 모든 아데닌의 DNA 편집 효율을 도시하는 대표적 막대 그래프를 도시한다. 데이터는 3개의 기술 복제에 대한 평균±s.d.이다. 넘버링은 PAM의 제1 염기 5'를 1로 하고; 표적 돌연변이 아데닌은 위치 A16이다. 
도 8A는 건강한 공여자(HD) 및 2명의 HCM 환자(HCM1 및 HCM2)로부터 iPSC를 재프로그래밍하고, 이어서 HD 계통에 대한 돌연변이 녹-인(knock-in), 및 HDMI 및 HCM2 계통에 대한 염기 편집 수정을 수행하는 워크플로우를 도시한다. iPSC-CM 기능의 하류 분석을 위해 동종 클론 계통을 단리하여 CM으로 분화시켰다. 
도 8B는 온-표적 프로토스페이서, h403_sgRNA 내의 모든 아데닌 잔기의 편집을 측정하기 위한 심층 서열분석 실험의 결과를 도시한다. 표적 병원성 아데닌은 A16이다. ABE-처리된 MYH7403/+  HCM1 및 MYH7403/+  HCM2 iPSC에 대해 심층 서열분석을 수행했다. 
도 8C는 HD, HCM1, 및 HCM2 환자로부터의 MYH7403/+ 및 MYH7WT iPSC-CM의 피크 수축력을 도시한다. 스튜던트 비페어링 양측 T-검정에 의한 **P < 0.01, ****P < 0.0001. 
도 8D는 전자 수송 쇄 복합체 억제제, 올리고마이신, 카보닐 시아나이드 m-클로로페닐 하이드라존(CCCP) 및 안티마이신 A(AntA)에 대한 노출 후에 지시된 세포주에서 시간의 함수로서 산소 소비율(OCR)(상부), 및 지시된 세포주의 기초 OCR(좌측 하단) 및 최대 OCR(우측 하단)에 대한 4개 시점에 걸친 값의 평균 및 분포를 도시한다. 스튜던트 비페어링 양측 T-검정에 의한 ***P < 0.001, ****P < 0.0001. 
도 9는 상위 8개 CRISPR-동정된 후보 오프-표적 유전자좌의 프로토스페이서 내의 58개 아데닌에 대한 편집을 측정하기 위한 심층 서열분석 분석의 결과를 도시한다. 
도 10은 글루타민 403 주변의 아미노산 수준(상부) 및 DNA 서열 수준(하부)에서 마우스 α-미오신 중쇄(Myh6) 및 인간 β-미오신 중쇄(MYH7)에 대한 상동성 비교를 도시한다. h403_sgRNA는 녹색으로 표시되어 있고, PAM 서열은 황색으로 표시되어 있다. 병원성 c.1208 G>A 뉴클레오티드는 PAM의 직전 5'에 있는 아데닌 뉴클레오티드를 위치 1로 계수하는 위치 14-17의 정규 염기 편집 윈도우 내에 있다.
도 11A 천연 뮤린 Myh6 게놈 서열의 일부를 p.R403Q 돌연변이를 함유하는 인간 MYH7 서열로 치환함으로써 인간화 HCM 마우스 모델을 생성하는 방법을 도시한다. 생어 서열분석 크로마토그램은 천연 Myh6WT 서열(상부), 인간화 Myh6h403/+ 마우스 모델 서열(중앙), 환자-유래 iPSC 계통 서열(하부)를 나타낸다. 황색 사각형은 녹-인된 인간 뉴클레오티드를 나타낸다.
도 11B는 출생 후 8일차에 야생형(좌측), 이형접합성(중앙), 호모접합성(우측) 유전자형에 대한 인간화 마우스 모델의 관상(4-챔버)(중앙) 및 횡단(하부) 섹션의 총 조직학(상부) 및 마송(Masson) 트리크롬 염색을 도시한다. 스케일 바, 1mm
도 11C는 생후 9개월차에 야생형(좌측) 및 이형접합성(우측) 유전자형에 대한 인간화 마우스 모델의 심장 절편에 대한 마송 트르크롬, 피크로시리우스(Picrosirius) 적색, 및 헤마톡실린 & 에오신 염색을 도시한다. 스케일 바, 상부 10배 이미지의 경우 1mm, 중앙 10배 이미지의 경우 100μm, 하부 40배 이미지의 경우 25μm.
도 12A 인간 MYH7 p.R403Q 돌연변이를 표적으로 하기 위해 ABEmax-VRQR 염기 에디터 절반 및 h403_sgRNA를 코딩하는 이중 AAV9 ABE 시스템의 개략도를 도시한다.
도 12B는 P0에서 생리식염수 또는 이중 AAV9 ABE를 사용한 Myh6h403/+ 또는 Myh6h403/+ 마우스의 흉강내 주사, 이어서 연속 심초음파에 대한 실험 개요를 도시한다. 0.1% 사이클로스포린 A를 보충한 고형사료를 생후 5주차에 11주 동안 제공했다.
도 12C-12H는 생후 8 내지 16주령의 Myh6WT 마우스, Myh6h403/+ 마우스 또는 ABE-처리된 Myh6h403/+ 마우스의 이완기에서 좌심실 전벽 두께(C), 이완기에서 좌심실 후벽 두께(D), 이완기(E) 및 수축기(F)에서 좌심실 내경, 박출률(G) 및 분획 단축(H) 도시한다(각 그룹에 대해 n=5).
도 12I Myh6WT 마우스, Myh6h403/+ 마우스 또는 ABE-처리된 Myh6h403/+ 마우스에 대한 연속(500μm 간격) 횡단 절편의 대표적 마송 트리크롬 염색을 도시한다. 스케일 바, 1mm. 
도 12J-M은 12I에서 각 실험 그룹에 대한 n=3-5마리의 심실 단면적(12J), 평균 벽 두께(12K), 심장 중량(HW) 대 경골 길이(TL)(12L), 콜라겐 면적의 비율(12M)을 도시한다. 데이터는 평균±표준편차이다. 스튜던트 비페어링 양측 T-검정에 의한 *P < 0.05, **P < 0.01.
도 13A Myh6h403/h403 마우스를 ABE-AAV9 또는 생리식염수로 처리하기 위한 주사의 상세를 도시한다.
도 13B Myh6WT 마우스(n=7), Myh6h403/+ 마우스(n=8), Myh6h403/h403 마우스(n=6), 및 저용량(AAV LOW, n=3) 또는 고용량(AAV HIGH, n=5)에서 ABE-처리된 Myh6h403/h403 마우스의 대표적 카플란-마이어(Kaplan-Meier) 곡선이다. 중앙 수명: Myh6WT 및 Myh6h403/+ 마우스, > 40일; Myh6h403/h403 마우스, 7일; AAV LOW Myh6h403/h403 마우스, 9일(1.3배 연장, P <0.05); AAV HIGH Myh6h403/h403 마우스, 15일(2.1배 연장, P <0.01). 맨텔-콕스 검정에 의한 *P <0.05, **P <0.01.
도 13C는 Myh6h403/h403 마우스 및 AAV HIGH Myh6h403/h403 마우스의 생어 서열분석 크로마토그램을 도시하고, cDNA 수준에서 표적 병원성 아데닌의 35% 온-표적 편집을 나타낸다.
도 13D 생후 15일차에 AAV HIGH Myh6h403/h403 마우스의 4-챔버 절편화 및 마송 트리크롬 염색을 도시한다. 
도 14A 마우스에서 이중 AAV9 ABE 주사 후의 게놈 및 전사체 변화를 측정하는 개략도를 도시한다. 18주령의 Myh6WT 마우스, Myh6h403/+ 마우스 또는 ABE-처리된 Myh6h403/+ 마우스로부터 심근세포 핵을 단리하여 게놈 수정 및 전사체 변화를 평가했다.
도 14B는 이중 AAV9 ABE 처리 후의 병원성 아데닌 뉴클레오티드를 수정하기 위한 DNA-편집 효율을 도시한다. 데이터는 평균±s.d.이다.
도 14C Myh6h403/+ 마우스와 비교하여 ABE-처리된 Myh6h403/+ 마우스에서 발현된 돌연변이 전사물의 비율을 도시한다. 데이터는 평균±s.d.이다. 스튜던트 비페어링 양측 T-검정에 의한 *P < 0.05, 각 그룹에 대해 n=3 생물학적 복제.
도 14D 생리식염수-처리된 마우스와 비교하여 ABE-처리된 Myh6h403/+ 마우스의 방관자 편집을 도시한다. 데이터는 평균±s.d.이다. 스튜던트 비페어링 양측 T-검정에 의한 *P < 0.05, 각 그룹에 대해 n=3 생물학적 복제.
도 14E는 Myh6WT 마우스, Myh6h403/+ 마우스 및 ABE-처리된 Myh6h403/+ 마우스에서 전사체-전체 핵 수준의 A-to-I RNA 편집을 도시한다. 데이터는 평균±s.d.이다.
도 14F는 Myh6WT 또는 Myh6h403/+ 마우스 및 ABE-처리된 Myh6h403/+ 마우스 사이에서 차등적으로 발현되는 257개 유전자의 히트 맵을 도시한다. 샘플과 유전자는 계층적 클러스터링에 의해 정렬되어 있다. 데이터는 각 행의 합계로 스케일링되었고, 행 최소 및 행 최대로 표시된다. ABE-처리된 Myh6h403/+ 마우스는 Myh6WT  마우스와 클러스터링된다.
도 14G는 Myh6WT  마우스에 대해 정규화된 Myh6h403/+ 마우스 및 ABE-처리된 Myh6h403/+ 마우스에 대한 Nppa mRNA 발현의 배율 변화 발현을 도시한다. RNA-seq 및 qPCR로부터의 데이터. 데이터는 평균±s.d.이다. 스튜던트 비페어링 양측 T-검정에 의한 *P < 0.05, 각 그룹에 대해 n=3 생물학적 복제.
도 15A는 생후 16주령에서 Myh6WT 마우스, Myh6h403/+ 마우스 또는 ABE-처리된 Myh6h403/+ 마우스의 대표적 M-모드 이미지를 도시한다. 
도 15B-15D는 Myh6WT  마우스와 비교하여 Myh6h403/+ 마우스(도 15B), Myh6h403/+ 마우스와 비교하여 ABE-처리된 Myh6h403/+ 마우스(도 15C), 및 Myh6WT 마우스와 비교하여 Myh6h403/+ 마우스(도 15D)에서 상향-조절된 유전자(적색) 및 하향-조절된 유전자(청색)의 배율 변화 및 p-값을 나타내는 대표적 볼케이노 플롯을 도시한다.
이하의 상세한 설명은 본 발명의 다양한 실시형태를 설명하는 첨부 도면을 참조한다. 도면 및 설명은 당업자가 본 발명의 개념을 실시할 수 있도록 본 발명의 양상 및 실시형태를 충분히 상세하게 기재하기 위한 것이다. 본 발명의 개념의 범위에서 벗어나지 않고서 다른 구성요소를 활용하여 변경을 가할 수 있다. 따라서, 이하의 설명은 한정적인 의미로 해석되어서는 안 된다. 본 발명의 개념의 범위는 첨부된 청구범위의 범위와, 이러한 청구범위가 권리를 갖는 균등물의 전체 범위에 의해서만 정의된다.
본 개시는 적어도 부분적으로 염기쌍 편집을 통해 유전자 돌연변이를 수정함으로써 가족성 심근증(familial cardiomyopathy; HCM)과 관련된 표현형을 성공적으로 역전시키는 클러스터드-규칙적 인터스페이스 짧은 회문 반복(CRISPR)-CRISPR 연관 단백질 9(Cas9) 시스템과 함께 사용하기 위한 가이드 RNA(gRNA)의 발견에 기초한다. 다양한 양상에서, 본 개시는 또한 염기쌍 편집을 수행하여 이러한 유전자 돌연변이를 수정하기 위해 데아미나제 및 Cas9-관련 니카제(예를 들면, 단일-가닥 절단을 생성하는 엔도뉴클레아제)를 조합하는 신규 융합 단백질을 제공한다. 따라서, 본원에는 CRISPR-Cas9 시스템용으로 설계된 단일 가이드 RNA(sgRNA)를 포함하는 조성물, 및 하나 이상의 심근증을 예방, 개선 또는 치료하기 위해 이를 사용하는 방법이 제공된다. 또한, 본원에 제공된 조성물 및 방법을 시험하기 위해 사용될 수 있는 HCM과 관련된 돌연변이를 포함하는 마우스 모델도 제공된다.
I. 용어
본원에 사용된 문구 및 용어는 설명을 목적으로 하는 것이고, 이를 한정하는 것으로 간주해서는 안 된다. 예를 들면, "a"와 같은 단수 용어의 사용은 항목의 수를 제한하는 것으로 의도되지 않는다. 또한, 한정되지 않지만, "상부", "하부", "좌측", "우측", "최상", "최하", "하", "상" 및 "측면"과 같은 관계 용어의 사용은 도면을 구체적으로 참조하여 명확하게 하기 위해 기재에 사용되며, 본 발명의 개념 또는 첨부된 청구범위의 범위를 한정하는 것을 의도하지 않는다. 
추가로, 본 발명의 개념은 다수 상이한 형태의 실시형태에 영향을 받기 쉽기 때문에, 본 개시는 본 발명의 개념의 원리의 예로서 고려되는 것으로 의도하며, 본 발명의 개념을 도시 및 기재된 특정 실시형태로 한정하는 것을 의도하지 않는다. 본 발명의 개념의 특징 중 어느 하나는 개별적으로 또는 다른 특징과 조합하여 사용될 수 있다. 상세한 설명에서 "실시형태", "실시형태들" 및/또는 이와 유사한 용어에 대한 언급은 언급되는 특징 및/또는 특징들이 상세한 설명의 적어도 하나의 양상에 포함된다는 것을 의미한다. 상세한 설명에서 "실시형태", "실시형태들" 및/또는 이와 같은 용어에 대한 개별적 언급은 반드시 동일한 실시형태를 지칭하는 것은 아니며, 또한 그렇게 명시되지 않는 한 및/또는 당업자에게 상세한 설명으로부터 용이하게 명백할 수 있는 경우를 제외하고는 상호 배타적인 것은 아니다. 예를 들면, 한 가지 실시형태에서 기재된 특징, 구조, 프로세스, 단계, 동작 등은 다른 실시형태에도 포함될 수 있지만, 반드시 포함되는 것은 아니다. 따라서, 본 발명의 개념은 본원에 기재된 실시형태들의 다양한 조합 및/또는 통합을 포함할 수 있다. 추가로, 본 개시의 모든 양상은 본원에 기재된 바와 같이 이의 실시에 필수적인 것은 아니다. 마찬가지로, 본 발명의 개념의 다른 시스템, 방법, 특징 및 이점은 도면 및 상세한 설명을 검토하면 당업자에게 명백하거나 또는 명백해질 것이다. 이러한 모든 추가 시스템, 방법, 특징 및 이점은 본 상세한 설명 내에 포함되고, 본 발명의 개념의 범위 내에 있으며, 청구 범위에 의해 포괄되는 것으로 의도된다. 
본원에서 사용되는 바와 같이, "약"이라는 용어는 열거된 값, 예를 들면, 양, 용량, 온도, 시간, 백분율 등에 대하여 ±10%, ±9%, ±8%, ±7%, ±6%, ±5%, ±4%, ±3%, ±2% 또는 ±1%를 의미할 수 있다.  
"포함하는(comprising)", "포함하는(including)", "포괄하는(encompassing)" 및 "갖는(having)"이라는 용어는 본 개시에서 호환적으로 사용된다. "포함하는(comprising)", "포함하는(including)", "포괄하는" 및 "갖는"이라는 용어는 기술된 것을 포함하는 것을 의미하지만, 반드시 이들로 한정되는 것은 아니다.
본원에 사용된 "또는" 및 "및/또는"이라는 용어는 포괄적 또는 임의의 하나 또는 임의의 조합을 의미하는 것으로 해석되어야 한다. 따라서, "A, B 또는 C" 또는 "A, B 및/또는 C"는 다음 중 하나를 의미한다: "A", "B" 또는 "C"; "A 및 B"; "A 및 C"; "B 및 C"; "A, B 및 C". 이 정의에 대한 예외는 요소, 기능, 단계 또는 동작의 조합이 일부 방식으로 본질적으로 상호 배타적인 경우에만 발생한다.
본원에서 사용되는 바와 같이, "치료하다", "치료하는", "치료" 등의 용어는, 달리 명시되지 않는 한, 이러한 용어가 적용되는 질환, 장애 또는 상태 또는 이러한 질환, 장애 또는 상태의 하나 이상의 증상의 진행을 역전, 완화, 억제하거나, 또는 이들을 예방하는 것을 지칭할 수 있으며, 증상 또는 합병증의 발증을 예방하거나 증상 또는 합병증을 완화하거나 상태 또는 장애를 제거하기 위해 본원에 기재된 임의의 조성물, 약제학적 조성물 또는 투여 형태의 투여를 포함한다.  
"핵산" 또는 "폴리뉴클레오티드"라는 용어는 단일-가닥 또는 이중-가닥 형태의 데옥시리보핵산(DNA) 또는 리보핵산(RNA) 및 이들의 폴리머를 지칭한다. 특별히 한정되지 않는 한, 이 용어는 참조 핵산과 유사한 결합 특성을 갖고 자연 발생 뉴클레오티드와 유사한 방식으로 대사되는 천연 뉴클레오티드의 공지된 유사체를 함유하는 핵산을 포괄한다. 달리 명시되지 않는 한, 특정 핵산 서열은 또한 명시적으로 표시된 서열뿐만 아니라 이의 보존적으로 변형된 변이체(예: 축퇴 코돈 치환), 대립유전자, 동원체, SNP 및 상보적 서열도 암묵적으로 포함한다. 구체적으로, 축퇴 코돈 치환은 하나 이상의 선택된(또는 모든) 코돈의 제3 위치가 혼합-염기 및/또는 데옥시이노신 잔기로 치환되는 서열을 생성함으로써 달성될 수 있다[참조: Batzer et al., Nucleic Acid Res. 19:5081 (1991); Ohtsuka et al., J. Biol. Chem. 260:2605-2608 (1985); and Rossolini et al., Mol. Cell. Probes 8:91-98 (1994)].
"펩티드", "폴리펩티드" 및 "단백질"이라는 용어는 호환적으로 사용되며, 펩티드 결합에 의해 공유 결합된 아미노산 잔기로 구성된 화합물을 지칭한다. 단백질 또는 펩티드는 적어도 2개의 아미노산을 포함해야 하고, 단백질 또는 펩티드의 서열을 구성할 수 있는 아미노산의 최대 수에 제한은 없다. 폴리펩티드는 펩티드 결합에 의해 서로 결합된 2개 이상의 아미노산을 포함하는 임의의 펩티드 또는 단백질을 포함한다. 본원에서 사용되는 바와 같이, 이 용어는, 예를 들면, 당해 기술분야에서 일반적으로 펩티드, 올리고펩티드 및 올리고머로 지칭되는 짧은 쇄와 일반적으로 당해 기술분야에서 단백질로 지칭되는 긴 쇄를 모두 지칭하며, 이들 중에는 다양한 유형이 있다. "폴리펩티드"는, 예를 들면, 생물학적 활성 단편, 실질적으로 상동성 폴리펩티드, 올리고펩티드, 호모이량체, 헤테로이량체, 폴리펩티드의 변이체, 변형된 폴리펩티드, 유도체, 유사체, 융합 단백질 등을 포함한다. 폴리펩티드에는 천연 펩티드, 재조합 펩티드 또는 이들의 조합이 포함된다.
또한, 반대의 것이 명확하게 명시되지 않는 한, 하나 이상의 단계 또는 동작을 포함하는 본원에 청구된 임의의 방법에서, 방법의 단계 또는 동작의 순서가 반드시 방법의 단계 또는 동작이 언급되는 순서로 한정되는 것은 아니라는 것을 이해해야 한다.
II.  조성물
본 개시는 하나 이상의 심근증을 예방, 개선 또는 치료하기 위한 조성물을 제공한다. 일부 실시형태에서, 본원의 조성물은 가이드 RNA(gRNA)를 포함할 수 있다. 일부 실시형태에서, 본원의 조성물은 RNA-가이드 엔도뉴클레아제에 공유 결합된 데아미나제를 포함하는 융합 단백질을 포함할 수 있다. 일부 실시형태에서, 본원의 조성물은 클러스터드-규칙적 인터스페이스 짧은 회문 반복(CRISPR)-CRISPR 연관 단백질 9(Cas9) 시스템을 포함할 수 있다.  일부 실시형태에서, 본원의 조성물은 본원에 개시된 gRNA 및/또는 CRISPR-Cas9 시스템의 전달을 위한 AAV 벡터, AAV 바이러스 입자, 또는 이들의 조합을 포함할 수 있다. 일부 실시형태에서, 본원의 조성물은 제형화되어 하나 이상의 약제학적 조성물을 형성할 수 있다. 
(a) gRNA
일반적으로, 가이드 폴리뉴클레오티드는 호환 가능한 핵산-가이드 뉴클레아제와 결합할 수 있고, 표적 서열과 하이브리드화하여 뉴클레아제를 표적 서열로 지시할 수 있다. 가이드 폴리뉴클레오티드와 복합체를 형성할 수 있는 대상 핵산-가이드 뉴클레아제는 가이드 폴리뉴클레오티드와 상용성인 핵산-가이드 뉴클레아제로서 지칭될 수 있다. 또한, 핵산-가이드 뉴클레아제와 복합체를 형성할 수 있는 가이드 폴리뉴클레오티드는 가이드 폴리뉴클레오티드 또는 핵산-가이드 뉴클레아제와 상용성인 가이드 핵산으로 지칭될 수 있다. 
일부 실시형태에서, 본원에 개시된 조작된 폴리뉴클레오티드(gRNA)는 합성 tracrRNA 및 crRNA를 포함하는 단편으로 분할될 수 있다. 일부 양상들에서, 본원의 gRNA는 5'-CCT CAG GTG AAA GTG GGC AA-3'(서열번호 1)의 뉴클레오티드 서열과 적어도 85%의 서열 동일성(예를 들면, 약 85%, 90%, 95%, 99%, 100%)을 갖는 핵산 서열을 포함할 수 있다. 일부 양상에서, 본원의 gRNA는 5'-CCT CAG GTG AAG GTG GGG AA-3'(서열번호 2)의 뉴클레오티드 서열과 적어도 85%의 서열 동일성(예를 들면, 약 85%, 90%, 95%, 99%, 100%)을 갖는 핵산 서열을 포함할 수 있다. 일부 양상들에서, 본원의 gRNA는 5'-CCU CAG GUG AAA GUG GGC AA-3'(서열번호 5)의 뉴클레오티드 서열과 적어도 85%의 서열 동일성(예를 들면, 약 85%, 90%, 95%, 99%, 100%)을 갖는 핵산 서열을 포함할 수 있다. 일부 양상에서, 본원의 gRNA는 5'-CCU CAG GUG AAG GUG GGG AA-3'(서열번호 6)의 뉴클레오티드 서열과 적어도 85%의 서열 동일성(예를 들면, 약 85%, 90%, 95%, 99%, 100%)을 갖는 핵산 서열을 포함할 수 있다. 일부 양상에서, 본원의 gRNA는 5'-CCT CAG GTG AAA GTG GGC AA-3'(서열번호 1)의 핵산 서열을 포함할 수 있다. 일부 양상에서, 본원의 gRNA는 5'-CCT CAG GTG AAG GTG GGG AA-3'(서열번호 2)의 뉴클레오티드 서열을 포함할 수 있다. 일부 양상들에서, 본원의 gRNA는 CCU CAG GUG AAA GUG GGC AA-3'(서열번호 5)의 뉴클레오티드 서열을 포함할 수 있다. 일부 양상에서, 본원의 gRNA는 5'-CCU CAG GUG AAG GUG GGG AA-3'(서열번호 6)의 뉴클레오티드 서열을 포함할 수 있다.
일부 실시형태에서, 본원의 gRNA는 변형된 또는 비천연 발생 뉴클레오티드를 포함할 수 있다. 일부 실시형태에서, gRNA는 본원에 개시된 바와 같이 플라스미드, 선형 작제물 또는 편집 카세트와 같은 폴리뉴클레오티드 분자 상의 DNA 서열에 의해 코딩될 수 있다. 일부 양상에서, gRNA는 서열번호 1을 포함하는 DNA 서열에 의해 코딩될 수 있다. 일부 양상에서, RNA 가이드 폴리뉴클레오티드는 서열번호 2를 포함하는 DNA 서열에 의해 코딩될 수 있다.
일부 실시형태에서, 본원의 가이드 폴리뉴클레오티드(예를 들면, gRNA)는 스페이서 서열을 포함할 수 있다. 스페이서 서열은 표적 서열과 하이브리드화하고 표적 서열에 대한 복합체화 핵산-가이드 뉴클레아제의 서열-특이적 결합을 지시하기 위해 표적 폴리뉴클레오티드 서열과 충분한 상보성을 갖는 폴리뉴클레오티드 서열이다. 다시 말해, gRNA 분자의 스페이서 서열은 DNA 서열을 "표적"으로 하거나 또는 DNA 서열에 "대응"하는 것으로 이해된다. 가이드 서열 및 이의 대응하는 표적 서열 사이의 상보성의 정도는 적절한 정렬 알고리즘을 사용하여 최적으로 정렬시킨 경우 약 50%, 60%, 75%, 80%, 85%, 90%, 95%, 97.5%, 99% 또는 그 이상일 수 있다. 최적 정렬은 서열 정렬을 위한 임의의 적합한 알고리즘을 사용하여 결정될 수 있다. 일부 실시형태에서, 본원의 가이드 서열은 길이가 약 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 75개 또는 그 이상의 뉴클레오티드일 수 있다. 다른 실시형태에서, 본원의 스페이서 서열은 길이가 약 75, 50, 45, 40, 35, 30, 25, 20개 뉴클레오티드 미만일 수 있다. 바람직하게는, 스페이서 서열은 10 내지 30개 뉴클레오티드 길이이다.  일부 양상에서, 본원의 스페이서 서열은 길이가 15 내지 20개 뉴클레오티드일 수 있다.  
일부 실시형태에서, 본원의 가이드 폴리뉴클레오티드(예를 들면, gRNA)는 스캐폴드 서열을 포함할 수 있다. 일반적으로, "스캐폴드 서열"은 표적 가능한 뉴클레아제 복합체(예를 들면, CRISPR-Cas9 시스템)의 형성을 촉진하기에 충분한 서열을 갖는 임의의 서열을 포함할 수 있으며, 여기서 표적 가능한 뉴클레아제 복합체는 핵산-가이드 뉴클레아제를 포함하지만 이들로 한정되지 않고, 가이드 폴리뉴클레오티드는 스캐폴드 서열 및 가이드 서열을 포함할 수 있다. 표적 가능한 뉴클레아제 복합체의 형성을 촉진하기 위한 스캐폴드 서열 내의 충분한 서열은 이차 구조의 형성에 관여하는 1 또는 2개의 서열 영역과 같은 스캐폴드 서열 내의 2개 서열 영역의 길이에 따른 상보성 정도를 포함할 수 있다. 일부 양상에서, 1 또는 2개의 서열 영역은 동일한 폴리뉴클레오티드에 포함되거나 코딩될 수 있다. 일부 양상에서, 1 또는 2개의 서열 영역은 별도의 폴리뉴클레오티드에 포함되거나 코딩될 수 있다. 최적의 정렬은 임의의 적절한 정렬 알고리즘에 의해 결정될 수 있으며, 1 또는 2개의 서열 영역 내의 자가-상보성과 같은 이차 구조를 추가로 고려할 수 있다. 일부 실시형태에서, 최적으로 정렬시킨 경우, 2개 서열 영역 중 더 짧은 길이를 따라 1 또는 2개의 서열 영역 사이의 상보성 정도는 약 25%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 97.5%, 99% 또는 그 이상일 수 있다. 일부 실시형태에서, 2개 서열 영역 중 적어도 하나는 길이가 약 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 40, 50 또는 그 이상의 뉴클레오티드일 수 있다.
일부 실시형태에서, 본원의 대상 가이드 폴리뉴클레오티드의 스캐폴드 서열은 이차 구조를 포함할 수 있다. 일부 실시형태에서, 이차 구조는 의사-놋(pseudoknot) 영역을 포함할 수 있다. 일부 실시형태에서, 핵산-가이드 뉴클레아제에 대한 본원의 가이드 폴리뉴클레오티드의 결합 동태는 부분적으로 스캐폴드 서열 내의 이차 구조에 의해 결정된다. 일부 실시형태에서, 핵산-가이드 뉴클레아제에 대한 본원의 가이드 폴리뉴클레오티드의 결합 동태는 부분적으로 스캐폴드 서열을 갖는 핵산 서열에 의해 결정된다.  
특정 실시형태에서, 스페이서 돌연변이는 치환 gRNA 서열이 생성되거나 결실 또는 삽입 돌연변이가 생성될 때에 시험하기 위해 플라스미드에 도입될 수 있다. 이러한 각각의 플라스미드 작제물은, 예를 들면, 결실, 치환 또는 삽입을 갖는 게놈 편집 정확성 및 효율성을 시험하기 위해 사용될 수 있다. 대안적으로, 일부 실시형태에서, 본원에 개시된 조성물 및 방법에 의해 생성된 gRNA 작제물은 소정의 기간에 걸쳐 편집 효율을 관찰함으로써 선택된 표적에 대한 최적 게놈 편집 시간을 시험할 수 있다. 이러한 실시형태에 따라, 본원에 개시된 조성물 및 방법에 의해 생성된 gRNA 작제물은 편집 효율 및 정확성을 최적화하기 위해 최적의 게놈 편집 윈도우에 대해 시험될 수 있다.
본원에 개시된 조작된 gRNA의 사용을 위한 표적 폴리뉴클레오티드의 예에는 신호전달 생화학 경로와 관련된 서열/유전자 또는 유전자 세그먼트, 예를 들면, 신호전달 생화학 경로-관련 유전자 또는 폴리뉴클레오티드가 포함될 수 있다. 본원에서 고려되는 다른 실시형태는 본원에 개시된 조작된 gRNA의 사용을 위한 표적 폴리뉴클레오티드의 예에 관한 것이고, 질환-관련 유전자 또는 폴리뉴클레오티드와 관련된 것을 포함할 수 있다. 
"질환-관련" 또는 "장애-관련" 유전자 또는 폴리뉴클레오티드는 대조군과 비교하여 비정상 수준의 전사 또는 번역 생성물을 초래하거나 비-질환 대조군의 조직 또는 세포와 비교하여 질환-발병 조직으로부터 유래한 세포에서 비정상 형태를 초래하는 임의의 유전자 또는 폴리뉴클레오티드를 지칭할 수 있다. 이는 비정상적으로 높은 수준으로 발현되는 유전자일 수 있고; 이는 비정상적으로 낮은 수준으로 발현되는 유전자, 또는 유전자가 하나 이상의 돌연변이를 함유하고 돌연변이 유전자의 발현 또는 발현 변화가 건강한 상태 또는 장애의 발생 및/또는 진행과 직접 상관관계가 있는 유전자일 수 있다. 질환 또는 장애-관련 유전자는 질환 또는 장애의 원인 또는 진행에 직접 관여하거나 질환 또는 장애의 원인 또는 진행에 관여하는 유전자(들)와 연결 불균형 상태에 있는 돌연변이(들) 또는 유전자 변이를 갖는 유전자를 지칭할 수 있다. 전사 또는 번역된 생성물은 공지되었거나 공지되지 않았을 수 있으며, 정상 또는 비정상 수준일 수 있다.   
일부 실시형태에서, 본원에 개시된 gRNA는 심근증-관련 유전자 또는 폴리뉴클레오티드와 관련된 폴리뉴클레오티드를 표적으로 할 수 있다. 일부 양상들에서, 심근증-관련 유전자 또는 폴리뉴클레오티드는 HCM-관련 유전자 또는 폴리뉴클레오티드일 수 있다. 일부 실시형태에서, 본원에 개시된 gRNA는, 이들로 한정되지 않지만, TTN, MYH7, MYH6, MYPN, TNNT2, TPM1, 또는 이들의 임의의 조합과 같은 심근증-관련 유전자와 관련된 폴리뉴클레오티드를 표적으로 할 수 있다. 일부 양상에서, 본원에 개시된 gRNA는 MYH7, MYBPC3, TNNC1 또는 이들의 조합과 같은 하나 이상의 심근증-관련 유전자와 관련된 폴리뉴클레오티드를 표적으로 할 수 있다.
일부 실시형태에서, 본원에 개시된 gRNA는 심근증-관련 유전자에 관련된 폴리뉴클레오티드 또는 하나 이상의 돌연변이(들)를 갖는 폴리뉴클레오티드를 표적으로 할 수 있다. 일부 실시형태에서, 본원에 개시된 gRNA는 하나 이상의 돌연변이(들)를 갖는 심근증-관련 유전자와 관련된 폴리뉴클레오티드를 표적으로 할 수 있으며, 여기서 심근증-관련 유전자는 TTN, MYH7, MYH6, MYPN, TNNT2, TPM1 또는 이들의 임의의 조합일 수 있다. 일부 양상에서, 본원에 개시된 gRNA는 하나 이상의 돌연변이(들)를 갖는 심근증-관련 유전자와 관련된 폴리뉴클레오티드를 표적으로 할 수 있으며, 여기서 심근증-관련 유전자는 MYH7 또는 이들의 조합일 수 있다. 일부 예에서, 본원에 개시된 gRNA는 MYH7 유전자 또는 이의 포유동물 등가물에서 R403Q 돌연변이와 관련된 폴리뉴클레오티드를 표적으로 할 수 있다.
(b) 염기 에디터 
염기 편집은 유전적 기반 질환을 수정하고 잠재적으로 치유하기 위한 매력적인 방법으로 부상하고 있다. 염기 에디터는 Cas9 니카제 또는 비활성화된 Cas9 및 데아미나제 단백질의 융합 단백질이고, 이는 단일 가이드 RNA(sgRNA)의 프로토스페이서 인접 모티프(PAM) 부위와 관련하여 정의된 편집 윈도우 내에서 이중-가닥 절단 없이 염기쌍 편집을 가능하게 한다. 아데닌 염기 에디터(ABE)는 데옥시아데노신 데아미나제를 사용하여 이노신 중간체를 통해 DNA A·T 염기쌍을 G·C 염기쌍으로 전환하고, 생체내 및 시험관내에서 다수의 유사분열후 세포에서 기능하는 것으로 이전에 밝혀졌다. 
따라서, 일부 실시형태에서, 본원의 조성물은 데아미나제 및 Cas9 니카제 또는 비활성화된 Cas9 엔도뉴클레아제를 포함하는 융합 단백질을 추가로 포함한다. 적합한 데아미나제 및 Cas9 니카제 또는 비활성화된 Cas9 엔도뉴클레아제는 하기에 보다 상세하게 기재되어 있다. 일부 양상에서, 융합 단백질은 데아미나제 및 RNA-가이드 엔도뉴클레아제를 연결하는 유연한 펩티드 링커를 추가로 포함할 수 있다. 또 다른 양상에서, 다른 이차 성분(예를 들면, 핵 국재화 서열)도 또한 융합 단백질에 포함될 수 있다. 
일부 실시형태에서, 본원에 제공된 염기 에디터는 하나 이상의 단백질 도메인을 포함하는 재조합 융합 단백질로서 제조될 수 있고, 이에 의해 염기 에디터를 생성할 수 있다. 특정 실시형태에서, 본원에 제공된 염기 에디터는 염기 에디터 단백질의 염기 편집 활성(예를 들면, 효율, 선택성 및/또는 특이성)을 개선하는 하나 이상의 특징을 포함한다. 예를 들면, 본원에 제공된 염기 에디터 단백질은 뉴클레아제 활성이 저하된 Cas9 도메인을 포함할 수 있다. 일부 실시형태에서, 본원에 제공된 염기 에디터 단백질은 뉴클레아제 활성을 갖지 않는 Cas9 도메인(dCas9), 또는 Cas9 니카제로 지칭되는 이중화된 DNA 분자의 하나의 가닥을 절단하는 Cas9 도메인(nCas9)을 가질 수 있다. 임의의 특정 이론에 얽매이지 않고서, 촉매 잔기(예: H840)의 존재는 Cas9의 활성을 유지하여 표적 A의 반대측에 T를 함유하는 비편집(예: 탈아미노화되지 않은) 가닥을 절단한다. Cas9의 촉매 잔기(예: D10 내지 A10)의 돌연변이는 표적 A 잔기를 함유하는 편집된 가닥의 절단을 방지한다. 이러한 Cas9 변이체는 gRNA-정의된 표적 서열을 기반으로 특정 위치에 단일-가닥 DNA 절단(닉(nick))을 생성할 수 있고, 이에 의해 편집되지 않은 가닥이 복구되고, 최종적으로 편집되지 않은 가닥에서 T로부터 C로의 변화를 초래할 수 있다. 
(i) 데아미나제 
다양한 양상에서, 융합 단백질은 아데닌 염기 에디터(ABE)로서 데아미나제를 포함한다. 복합체에서 사용될 수 있는 적합한 데아미나제는 ABE-max, ABE8e 또는 ABE7.10이다. 참조를 용이하게 하기 위해, 이들 예시적 데아미나제를 코딩하는 아미노산 서열 및 핵산 서열은 표 1 및 표 2에 제공되어 있다. 또한, 핵 국재화 신호(NLS)(각 표에서 밑줄 및 볼드체로 표시)를 포함하는 예시적 데아미나제의 서열도 포함되어 있고, 이하에서 보다 상세히 설명한다. 
다양한 양상에서, 데아미나제는 서열번호 7, 9 및 11 중 어느 하나에 대해 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%의 서열 상동성을 갖는 아미노산 서열을 포함한다. 다양한 양상에서, 데아미나제는 서열번호 7, 9 및 11 중 어느 하나의 아미노산 서열을 포함한다. 일부 양상에서, 상기 데아미나제는 서열번호 7의 아미노산 서열을 포함한다. 일부 양상에서, 상기 데아미나제는 서열번호 9의 아미노산 서열을 포함한다. 일부 양상에서, 상기 데아미나제는 서열번호 11의 아미노산 서열을 포함한다.
다양한 양상에서, 데아미나제는 핵 국재화 신호(NLS)를 추가로 포함한다. 적합한 핵 국재화 신호는 이하에 설명되어 있다. 일부 양상에서, 핵 국재화 신호는 MKRTADGSEFESPKKKKV(서열번호 31)를 포함한다. 일부 양상에서, NLS를 추가로 포함하는 데아미나제는 서열번호 8 또는 10 중 어느 하나에 대해 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99%의 서열 상동성을 갖는 아미노산 서열을 포함한다. 다양한 양상에서, NLS를 추가로 포함하는 데아미나제는 서열번호 8 또는 10의 아미노산 서열을 포함한다. 다양한 양상에서, NLS를 추가로 포함하는 데아미나제는 서열번호 8의 아미노산 서열을 포함한다. 다양한 양상에서, NLS를 추가로 포함하는 데아미나제는 서열번호 10의 아미노산 서열을 포함한다.
[표 1]
다양한 양상에서, 데아미나제는 서열번호 12, 13, 14, 28, 74 및 75 중 어느 하나를 포함하는 핵산에 의해 코딩된다. 하기 표 2에 제시된 바와 같이, 서열번호 12, 13 및 28은 핵 국재화 신호(NLS)를 추가로 포함하는 ABEmax 및 ABE8e에 대응하고, 하기 표에서 NLS를 코딩하는 서열은 볼드체 및 밑줄로 표시되어 있다. 서열번호 74, 75, 및 14는 각각 핵 국재화 신호를 갖지 않는 ABEmax, ABE8e 및 ABE7.10에 대응한다. 일부 양상에서, 본원에 제공된 융합 단백질의 데아미나제는 서열번호 12 또는 74를 포함하는 핵산에 의해 코딩된다. 일부 양상에서, 본원에 제공된 융합 단백질 내의 데아미나제는 서열번호 13 또는 75를 포함하는 핵산에 의해 코딩된다. 일부 양상에서, 본원에 제공된 융합 단백질 내의 데아미나제는 서열번호 14 또는 28을 포함하는 핵산에 의해 코딩된다. 
[표 2]
(ii) Cas9 니카제 또는 비활성화된 Cas9 엔도뉴클레아제
다양한 양상에서, 본원에 사용된 융합 단백질(예: 염기 에디터)은 Cas9 니카제 또는 비활성화된 Cas9 엔도뉴클레아제를 포함한다. 이들 단백질은 원핵생물에서 천연-발생 방어 메커니즘인 CRISPR-Cas9 시스템으로부터 유래하고, 유전자 편집에 사용된 RNA-가이드 DNA-표적화 플랫폼으로 재이용되고 있다. CRISPR-Cas9 시스템은 DNA 뉴클레아제 Cas9 및 2개의 비-코딩 RNA, crisprRNA(crRNA) 및 트랜스-활성화 RNA(tracrRNA)(즉, gRNA)에 의존하여 DNA의 절단을 표적으로 한다. CRISPR은 클러스터드-규칙적 인터스페이스 짧은 회문 반복의 약어이고, 예를 들면, 원핵생물을 감염시키거나 공격한 바이러스에 의해 이전에 세포에 노출된 외래 DNA와 유사성을 갖는 DNA의 단편(스페이서 DNA)을 함유하는 세균 및 고세균의 게놈에서 발견되는 DNA 서열의 패밀리이다. 이들 DNA 단편은 원핵생물에 의해 사용되어, 예를 들면, 후속 공격 중에 유사한 바이러스로부터 재-도입될 때에 유사한 외래 DNA를 검출하고 파괴한다. CRISPR 유전자좌의 전사는 스페이서 서열을 포함하는 RNA 분자의 형성을 초래하고, 이는 외래의 외인성 DNA를 인식하고 절단할 수 있는 Cas(CRISPR-관련) 단백질과 결합하여 이를 표적으로 한다. CRISPR-Cas 시스템의 다수 유형 및 부류는 문헌[참조: 예를 들면, Koonin et al., (2017) Curr Opin Microbiol 37:67-78]에 기재되어 있다. 
crRNA는 통상 표적 DNA 내의 20개 뉴클레오티드(nt) 서열과 왓슨-크릭 염기쌍 형성을 통해 CRISPR-Cas9 복합체의 서열 인식 및 특이성을 유도한다. crRNA에서 5' 20nt의 서열을 변경하면, 특정 유전자좌에 대한 CRISPR-Cas9 복합체의 표적화가 가능해진다. CRISPR-Cas9 복합체는, 표적 서열 뒤에 프로토스페이서 인접 모티프(PAM)라고 하는 특정 짧은 DNA 모티프(서열 NGG 포함)가 있는 경우, crRNA의 최초 20nt와 일치하는 서열을 함유하는 DNA 서열에만 결합한다. TracrRNA는 crRNA의 3' 말단과 하이브리드화하여 Cas9 엔도뉴클레아제에 의해 결합된 RNA 이중쇄 구조를 형성하여 촉매 활성 CRISPR-Cas9 복합체를 형성하고, 이어서 이는 표적 DNA를 절단할 수 있다. CRISPR-Cas9 복합체가 표적 부위의 DNA에 결합되면, Cas9 효소 내의 2개의 독립적 뉴클레아제 도메인은 각각 PAM 부위 상류의 DNA 가닥 중 하나를 절단하여 DNA의 두 가닥이 모두 염기쌍(블런트 말단)으로 종결하는 이중-가닥 절단(DSB)을 잔류시킨다. 특정 표적 부위에서 DNA에 대한 CRISPR-Cas9 복합체의 결합 및 부위-특이적 DSB의 형성 후, 다음 주요 단계는 DSB의 복구이다. 세포는 2개 주요 DNA 복구 경로, 즉 비-상동성 말단 결합(NHEJ) 및 상동성-지시 복구(HDR)를 사용하여 DSB를 복구한다. 
NHEJ는 비-분열 세포를 포함하는 대부분의 세포 유형에서 고도로 활성화되어 있는 강력한 복구 메커니즘이다. NHEJ는 에러가 발생하기 쉽고, DSB의 부위에서 1 내지 수백 개의 뉴클레오티드의 제거 또는 부가를 초래할 수 있지만, 이러한 변형은 통상 20nt 미만이다. 수득되는 삽입 및 결실(인델)은 유전자의 코딩 또는 비-코딩 영역을 파괴할 수 있다. 또는, HDR은 내인성 또는 외인성으로 제공되는 상동성 공여자 DNA의 긴 스트레치를 사용하여 높은 충실도로 DSB를 복구한다. HDR은 분열 중의 세포에서만 활성적이고, 대부분의 세포 유형에서 비교적 낮은 빈도로 발생한다. 본 개시의 다수의 실시형태에서, NHEJ는 복구 오퍼런트로서 활용된다. 
일부 실시형태에서, Cas9(CRISPR 관련 단백질 9) 엔도뉴클레아제는 본원에 기재된 바와 같이 하나 이상의 심근증을 예방, 개선 또는 치료하기 위해 본원의 CRISPR 방법에서 사용될 수 있다. 본원에서 사용되는 "Cas9 분자"는 gRNA 분자와 상호작용할 수 있고, gRNA 분자와 협력하여, 표적 서열 및 PAM 서열을 포함하는 부위에 국재화(예를 들면, 표적 또는 홈(home))할 수 있는 분자를 지칭한다. Cas9 단백질은 하기를 포함하지만 이들로 한정되지 않는 다수의 CRISPR 시스템에 존재하는 것으로 공지되어 있다: 메타노코커스 마리팔루디스(Methanococcus maripaludis); 코리네박테리움 디프테리아에(Corynebacterium diphtheriae); 코리네박테리움 에피시엔스(Corynebacterium efficiens); 코리네박테리움 글루타미움(Corynebacterium glutamicum); 코리네박테리움 크로펜스테드티(Corynebacterium kroppenstedtii); 마이코박테리움 아브세수스(Mycobacterium abscessus); 노카르디아 파르시니카(Nocardia farcinica); 로도코커스 에리스로폴리스(Rhodococcus erythropolis); 로도코커스 조스티(Rhodococcus jostii); 로도코커스 오파쿠스(Rhodococcus opacus); 아시도테무스 셀룰로리티쿠스(Acidothermus cellulolyticus); 아르트로박터 클로로페놀리쿠스(Arthrobacter chlorophenolicus); 크리벨라 플라비다(Kribbella flavida); 써모모노스포라 쿠르바타(Thermomonospora curvata); 비피도박테리움 덴티움(Bifidobacterium dentium); 비피도박테리움 롱굼(Bifidobacterium longum); 슬랙키아 헬리오트리니레두센스(Slackia heliotrinireducens); 페르세포넬라 마리나(Persephonella marina); 박테로이데스 프래길리스(Bacteroides fragilis); 캡노사이토파가 오크라세아(Capnocytophaga ochracea); 플라보박테리움 사이크로필룸(Flavobacterium psychrophilum); 악커만시아 뮤시니필라(Akkermansia muciniphila); 로세이플렉수스 카스텐홀지(Roseiflexus castenholzii); 로세이플렉서스(Roseiflexus); 시네코시스티스(Synechocystis); 엘루시미크로비움 미누툼(Elusimicrobium minutum); 피브로박터 석시노제네스(Fibrobacter succinogenes); 바실루스 세레우스(Bacillus cereus); 리스테리아 이노쿠아(Listeria innocua); 락토바실루스 카세이(Lactobacillus casei); 락토바실러스 람노수스(Lactobacillus rhamnosus); 락토바실러스 살리바리우스(Lactobacillus salivarius); 스트렙토콕쿠스 아갈락티아에(Streptococcus agalactiae); 스트렙토콕쿠스 디스갈락티아에 이퀴시밀리스(Streptococcus dysgalactiae equisimilis); 스트렙토콕쿠스 에퀴 주에피데미쿠스(Streptococcus equi zooepidemicus); 스트렙토콕쿠스 갈롤리티쿠스(Streptococcus gallolyticus); 스트렙토콕쿠스 고르도니니(Streptococcus gordonii); 스트렙토콕쿠스 뮤탄스(Streptococcus mutans); 스트렙토콕쿠스 피오게네스(Streptococcus pyogenes); 스트렙토콕쿠스 피오게네스(Streptococcus pyogenes) M1 GAS; 스트렙토콕쿠스 피오게네스(Streptococcus pyogenes) MGAS5005; 스트렙토콕쿠스 피오게네스(Streptococcus pyogenes) MGAS2096; 스트렙토콕쿠스 피오게네스(Streptococcus pyogenes) MGAS9429; 스트렙토콕쿠스 피오게네스(Streptococcus pyogenes) MGAS 10270; 스트렙토콕쿠스 피오게네스(Streptococcus pyogenes) MGAS6180; 스트렙토콕쿠스 피오게네스(Streptococcus pyogenes) MGAS315; 스트렙토콕쿠스 피오게네스(Streptococcus pyogenes) SSI-1; 스트렙토콕쿠스 피오게네스(Streptococcus pyogenes) MGAS 10750; 스트렙토콕쿠스 피오게네스(Streptococcus pyogenes) NZ131; 스트렙토콕쿠스 써모필레스(Streptococcus thermophiles) CNRZ1066; 스트렙토콕쿠스 써모필레스(Streptococcus thermophiles) LMD-9; 스트렙토콕쿠스 써모필레스(Streptococcus thermophiles) LMG 18311; 스타필로콕쿠스 아우레우스(Staphylococcus aureus); 스타필로콕쿠스 아우리쿨라리스(Staphylococcus auricularis); 스타필로콕쿠스 루트라에(Staphylococcus lutrae); 스타필로콕쿠스 루그두넨시스(Staphylococcus lugdunensis); 클로스트리디움 보툴리눔 A3 로크 마레(lostridium botulinum A3 Loch Maree); 클로스트리디움 보툴리눔 B 에클룬드 17B(Clostridium botulinum B Eklund 17B); 클로스트리디움 보툴리눔(lostridium botulinum) Ba4 657; 클로스트리디움 보툴리눔 F 랑게란드(Clostridium botulinum F Langeland); 클로스트리듐 셀룰로리티쿰(Clostridium cellulolyticum) H10; 피네골디아 마그나(Finegoldia magna) ATCC 29328; 유박테리움 렉탈(Eubacterium rectale) ATCC 33656; 마이코플라스마 갈리셉티쿰(Mycoplasma gallisepticum); 마이코플라스마 모바일(Mycoplasma mobile) 163K; 마이코플라스마 페네트란스(Mycoplasma penetrans); 마이코플라스마 시노비아에(Mycoplasma synoviae) 53; 스트렙토바실루스 모닐리포르미스(Streptobacillus moniliformis) DSM 12112; 브라디리조비움(Bradyrhizobium) BTAi1; 니트로박터 함부르겐시스(Nitrobacter hamburgensis) X14; 로도슈도모나스 팔루스트리스(Rhodopseudomonas palustris) BisB18; 로도슈도모나스 팔루스트리스(Rhodopseudomonas palustris) BisB5; 파르비바쿨룸 라바멘티보란스(Parvibaculum lavamentivorans) DS-1; 디노로세오박터 쉬바에(Dinoroseobacter shibae) DFL 12; 글루코나세토박터 디아조트로피쿠스(Gluconacetobacter diazotrophicus) Pal 5 FAPERJ; 글루코나세토박터 디아조트로피쿠스(Gluconacetobacter diazotrophicus) Pal 5 JGI; 아조스피릴룸(Azospirillum) B510 uid46085; 로도스피릴룸 루브룸(Rhodospirillum rubrum) ATCC 11170; 디아포로박터(Diaphorobacter) TPSY uid29975; 버미네프로박터 에이세니아에(Verminephrobacter eiseniae) EF01-2; 네이세리아 메닝기티데스(Neisseria meningitides) 053442; 네이세리아 메닝기티데스(Neisseria meningitides) alpha14; 네이세리아 메닝기티데스(Neisseria meningitides) Z2491; 데설포비브리오 살렉시겐스(Desulfovibrio salexigens) DSM 2638; 캄필로박터 제주니 도일레이(Campylobacter jejuni doylei) 269 97; 캄필로박터 제주니(Campylobacter jejuni) 81116; 캄필로박터 제주니(Campylobacter jejuni); 캄필로박터 라리(Campylobacter lari) RM2100; 헬리코박터 헤파티쿠스(Helicobacter hepaticus); 울리넬라 석시노게네스(Wolinella succinogenes); 톨루모나스 아우엔시스(Tolumonas auensis) DSM 9187; 슈도알테로모나스 아틀란티카(Pseudoalteromonas atlantica) T6c; 셰와넬라 페알레아나(Shewanella pealeana) ATCC 700345; 레지오넬라 뉴모필라 파리스(Legionella pneumophila Paris); 액티노바실러스 석시노게네스(Actinobacillus succinogenes) 130Z; 파스테우렐라 멀토시다(Pasteurella multocida); 프란시셀라 툴라렌시스 노비시다(Francisella tularensis novicida) U112; 프란시셀라 툴라렌시스 홀라르티카(Francisella tularensis holarctica); 프란시셀라 툴라렌시스(Francisella tularensis) FSC 198; 프란시셀라 툴라렌시스(Francisella tularensis); 프란시셀라 툴라렌시스(Francisella tularensis) WY96-3418; 및 트레포네마 덴티콜라(Treponema denticola) ATCC 35405 등.
다양한 실시형태에서, 개선된 염기 에디터는 뉴클레아제-비활성화 Cas 단백질을 포함할 수 있으며, "dCas" 또는 "dCas9" 단백질(뉴클레아제-"사멸" Cas9의 경우)와 호환적으로 지칭될 수 있다. 대안적으로, 본원에서 사용되는 바와 같이, 뉴클레아제 비활성화 Cas9 단백질은 "비활성화된 Cas9"로 지칭될 수 있다. 불활성 DNA 절단 도메인을 갖는 Cas9 단백질(또는 이의 단편)을 생성하는 방법은 공지되어 있다[참조: 예를 들면, Jinek et al, Science.337:816-821(2012); Qi et al,“Repurposing CRISPR as an RNA-Guided Platform for Sequence-Specific Control of Gene Expression” (2013) Cell. 28; 152(5): 1173-83, 각각의 전체 내용은 참조에 의해 본원에 도입된다]. 예를 들면, Cas9의 DNA 절단 도메인은 2개의 서브도메인, 즉 HNH 뉴클레아제 서브도메인 및 RuvCl 서브도메인을 포함하는 것으로 공지되어 있다. HNH 서브도메인은 gRNA와 상보적 가닥을 절단하는 반면, RuvCl 서브도메인은 비상보적 가닥을 절단한다. 이들 서브도메인 내의 돌연변이는 Cas9의 뉴클레아제 활성을 침묵시킬 수 있다. 예를 들면, 돌연변이 D10A 및 H840A는 에스. 피오게네스(S. pyogenes) Cas9의 뉴클레아제 활성을 완전히 비활성화한다[참조: Jinek et al, Science. 337:816-821(2012); Qi et al, Cell. 28; 152(5): 1173-83 (2013)]. 일부 실시형태에서, Cas9의 단편을 포함하는 단백질이 제공된다. 예를 들면, 일부 실시형태에서, 단백질은 2개의 Cas9 도메인 중 하나를 포함한다: (1) Cas9의 gRNA 결합 도메인; 또는 (2) Cas9의 DNA 절단 도메인.
일부 실시형태에서, Cas9 또는 이의 단편을 포함하는 단백질은 "Cas9 변이체"로 지칭된다. Cas9 변이체는 Cas9 또는 이의 단편과 상동성을 공유한다. 예를 들면, Cas9 변이체는 야생형 Cas9과 적어도 약 70% 동일, 적어도 약 80% 동일, 적어도 약 90% 동일, 적어도 약 95% 동일, 적어도 약 96% 동일, 적어도 약 97% 동일, 적어도 약 98% 동일, 적어도 약 99% 동일, 적어도 약 99.5% 동일, 또는 적어도 약 99.9% 동일하다. 일부 실시형태에서, Cas9 변이체는 야생형 Cas9와 비교하여 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 21, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 45, 46, 47, 48, 49, 50 또는 그 이상의 아미노산 변화를 가질 수 있다. 일부 실시형태에서, Cas9 변이체는 Cas9의 단편(예를 들면, gRNA 결합 도메인 또는 DNA-절단 도메인)을 포함하며, 이러한 단편은 야생형 Cas9의 대응하는 단편과 적어도 약 70% 동일, 적어도 약 80% 동일, 적어도 약 90% 동일, 적어도 약 95% 동일, 적어도 약 96% 동일, 적어도 약 97% 동일, 적어도 약 98% 동일, 적어도 약 99% 동일, 적어도 약 99.5% 동일, 또는 적어도 약 99.9% 동일하다. 일부 실시형태에서, 단편은 대응하는 야생형 Cas9의 아미노산 길이의 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 동일, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 적어도 99.5% 동일하다. 
일부 실시형태에서, Cas9 단편은 길이가 적어도 100 아미노산이다. 일부 실시형태에서, 단편은 길이가 적어도 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200, 1250, 또는 적어도 1300 아미노산이다. 일부 실시형태에서, 야생형 Cas9은 스트렙토콕쿠스 피오게네스(Streptococcus pyogenes)로부터의 Cas9에 대응한다(NCBI 참조 서열: NC_0l7053.l). 다른 실시형태에서, 야생형 Cas9는 스트렙토콕쿠스 피오게네스로부터의 Cas9에 대응한다(NCBI 참조 서열: NC_002737.2). 또 다른 실시형태에서, Cas9는 Cas9 뉴클레아제 활성을 비활성화하는 하나 이상의 돌연변이를 갖는 Cas9 아미노산 서열에 대응하거나, 부분적으로 또는 전체적으로 포함한다. 
일부 실시형태에서, Cas9 도메인은 D10A 돌연변이를 포함하지만, 스트렙토콕쿠스 피오게네스(Streptococcus pyogenes)의 Cas9와 같은 야생형 서열과 비교하여 위치 840에서의 잔기(NCBI 참조 서열: NC_0l7053.l)를 포함한다. 특정 이론에 구속되고 싶지 않지만, 촉매 잔기 H840의 존재는 Cas9의 활성을 회복시켜 표적 C 반대측에 G를 함유하는 비편집(예: 비-탈아미노화) 가닥을 절단한다. H840(예를 들면, A840으로부터)의 복구는 C를 함유하는 표적 가닥의 절단을 초래하지 않는다. 이러한 Cas9 변이체는 gRNA-정의 표적 서열에 기초하여 특정 위치에서 단일-가닥 DNA 절단(닉(nick))을 생성할 수 있고, 비-편집된 가닥의 복구를 유도한다. 아데노신 염기 에디터의 맥락에서, 아데노신(A)는 이노신(I)으로 탈아미노화되고, 비편집 가닥(탈아미노화된 A와 염기쌍을 이루는 T를 포함)이 니킹(nicking)되어, 탈아미노화된 A와 염기쌍을 이루는 T의 제거가 촉진되고, 그 결과 A-T 염기쌍이 G-C 염기쌍으로 돌연변이된다. T를 갖는 비-편집 가닥에 니킹을 하면, 부정합 복구 메커니즘을 통해 T의 제거가 용이해진다. 
다른 실시형태들에서, 예를 들면, 뉴클레아제 비활성화된 Cas9(dCas9)을 초래하는 D10A 및 H840A 이외의 돌연변이를 갖는 dCas9 변이체가 제공된다. 이러한 돌연변이는, 예를 들면, 스트렙토콕쿠스 피오게네스로부터의 Cas9과 같은 야생형 서열을 참조하여, D10 및 H820에서의 다른 아미노산 치환, 또는 Cas9의 뉴클레아제 도메인 내의 다른 치환(예를 들면, HNH 뉴클레아제 서브도메인 및/또는 RuvCl 서브도메인에서의 치환)을 포함한다(NCBI 참조 서열: NC_0l7053.l). 일부 실시형태에서, dCas9의 변이체 또는 상동체(예를 들면, 스트렙토콕쿠스 피오게네스로부터의 Cas9의 변이체(NCBI 참조 서열: NC_0l7053.l))가 제공되며, 이는 NCBI 참조 서열: NC_0l7053.l과 적어도 약 70% 동일, 적어도 약 80% 동일, 적어도 약 90% 동일, 적어도 약 95% 동일, 적어도 약 98% 동일, 적어도 약 99% 동일, 적어도 약 99.5% 동일 또는 적어도 약 99.9% 동일하다. 일부 실시형태에서, NC_0l7053.l보다 약 5 아미노산, 약 10 아미노산, 약 15 아미노산, 약 20 아미노산, 약 25 아미노산, 약 30 아미노산, 약 40 아미노산, 약 50 아미노산, 약 75 아미노산, 약 100 아미노산 이상 짧거나 긴 아미노산 서열을 갖는 dCas9의 변이체(예를 들면, NCBI 참조 서열: NC_0l7053.l의 변이체)가 제공된다.
일부 실시형태에서, 본원에 제공된 염기 에디터는 Cas9 단백질의 전장 아미노산 서열, 예를 들면, 본원에 제공된 Cas9 서열 중 하나를 포함한다. 그러나, 다른 실시형태들에서, 본원에 제공된 융합 단백질은 전장 Cas9 서열을 포함하지 않고, 이의 단편만을 포함한다. 예를 들면, 일부 실시형태에서, 본원에 제공된 Cas9 융합 단백질은 Cas9 단편을 포함하며, 여기서 단편은 crRNA 및 tracrRNA 또는 sgRNA에 결합하지만, 예를 들면, 뉴클레아제 도메인의 절단된 버전만을 포함하거나 뉴클레아제 도메인을 전혀 포함하지 않는다는 점에서 기능성 뉴클레아제 도메인을 포함하지 않는다. 적합한 Cas9 도메인 및 Cas9 단편의 예시적 아미노산 서열이 본원에 제공되며, Cas9 도메인 및 단편의 추가 적합한 서열은 당업자에게 명백할 것이다.
변이체 및 이의 상동체를 포함한 추가 Cas9 단백질이 본 개시의 범위 내에 있음을 인식해야 한다. 이의 전체가 참조에 의해 본원에 도입되어 있는 PCT 출원 공개 WO2020051360A1은 일부 적합한 Cas9 변이체, 니카제 및 비활성화된 Cas9 단백질을 개시한다. 예시적 Cas9 단백질은 하기 제공된 것을 포함하지만 이들로 한정되지 않는다. 이러한 예시적 니카제 또는 비활성화된 Cas9 단백질의 예시적 아미노산 서열 및 코딩 핵산 서열은 하기 표 3 및 4에 제공된다.
다양한 양상에서, Cas9 니카제 또는 비활성화된 Cas9 엔도뉴클레아제는 SpRY, SpG, SpCas9-NG, SpCas9-VRQR 또는 이들의 변이체로부터 선택된다. 다양한 양상에서, Cas9 니카제 또는 비활성화된 Cas9 엔도뉴클레아제는 서열번호 15, 17, 19 및 21 중 어느 하나와 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%의 서열 상동성을 갖는 아미노산 서열을 포함한다. 예를 들면, 일부 양상에서, Cas9 니카제 또는 비활성화된 Cas9 엔도뉴클레아제는 서열번호 15, 17, 19, 및 21 중 어느 하나를 포함하는 아미노산 서열을 포함한다. 일부 양상에서, Cas9 니카제 또는 비활성화된 Cas9 엔도뉴클레아제는 서열번호 15를 포함하는 아미노산 서열을 포함한다. 일부 양상에서, Cas9 니카제 또는 비활성화된 Cas9 엔도뉴클레아제는 서열번호 17을 포함하는 아미노산 서열을 포함한다. 일부 양상에서, Cas9 니카제 또는 비활성화된 Cas9 엔도뉴클레아제는 서열번호 19를 포함하는 아미노산 서열을 포함한다. 일부 양상에서, Cas9 니카제 또는 비활성화된 Cas9 엔도뉴클레아제는 서열번호 21을 포함하는 아미노산 서열을 포함한다.
다양한 양상에서, Cas9 니카제 또는 비활성화된 Cas9 엔도뉴클레아제는 핵 국재화 신호를 추가로 포함할 수 있다. 일부 양상에서, 핵 국재화 신호는 KRTADGSEFEPKKRKV(서열번호 32)를 포함한다. 일부 양상에서, 핵 국재화 신호는 짧은 펩티드 링커를 통해 Cas9 니카제 또는 비활성화된 Cas9 엔도뉴클레아제에 연결된다. 따라서, 일부 양상에서, 링커를 통해 NLS를 포함하는 Cas9 니카제 또는 비활성화된 Cas9 엔도뉴클레아제는 서열번호 16, 18, 20 및 22 중 어느 하나와 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 상동성을 갖는 아미노산 서열을 포함할 수 있다. 일부 양상에서, 링커를 통해 NLS를 포함하는 Cas9 니카제 또는 비활성화된 Cas9 엔도뉴클레아제는 서열번호 16, 18, 20 및 22 중 어느 하나를 포함하는 아미노산 서열을 포함할 수 있다. 다양한 양상에서, 링커를 통해 NLS를 포함하는 Cas9 니카제 또는 비활성화된 Cas9 엔도뉴클레아제는 서열번호 16의 아미노산 서열을 포함할 수 있다. 다양한 양상에서, 링커를 통해 NLS를 포함하는 Cas9 니카제 또는 비활성화된 Cas9 엔도뉴클레아제는 서열번호 18의 아미노산 서열을 포함할 수 있다. 다양한 양상에서, 링커를 통해 NLS를 포함하는 Cas9 니카제 또는 비활성화된 Cas9 엔도뉴클레아제는 서열번호 20의 아미노산 서열을 포함할 수 있다. 다양한 양상에서, 링커를 통해 NLS를 포함하는 Cas9 니카제 또는 비활성화된 Cas9 엔도뉴클레아제는 서열번호 22의 아미노산 서열을 포함할 수 있다. 
[표 3]
다양한 양상에서, SpCas9 니카제 또는 비활성화된 Cas9 엔도뉴클레아제는 서열번호 23 내지 26, 83 및 100 내지 102 중 어느 하나를 포함하는 핵산에 의해 코딩된다. 하기 표 4에 제시된 바와 같이, 서열번호 23 내지 26은 각각 링커를 코딩하는 핵산을 통해 각 핵산의 3' 말단에 부착된 핵 국재화 신호(NLS)를 추가로 포함하는 SpCas9-VRQR, SpRY, SpG 및 SpCas9-NG에 대응한다. 이들 각 서열에서, 링커를 코딩하는 핵산은 밑줄로 표시되어 있고, NLS를 코딩하는 핵산은 볼드체로 표시되어 있다. 서열번호 83 및 100 내지 102는 링커 또는 NLS을 갖지 않는 동일한 단백질 (SpCas9-VRQR, SpRY, SpG 및 SpCas9-NG)을 코딩한다. 
일부 양상에서, 본원에 제공된 융합 단백질 내의 SpCas9 니카제 또는 비활성화된 Cas9 엔도뉴클레아제는 서열번호 83을 포함하는 핵산에 의해 코딩된다. 일부 양상에서, 본원에 제공된 융합 단백질 내의 SpCas9 니카제 또는 비활성화된 Cas9 엔도뉴클레아제는 서열번호 100을 포함하는 핵산에 의해 코딩된다. 일부 양상에서, 본원에 제공된 융합 단백질 내의 SpCas9 니카제 또는 비활성화된 Cas9 엔도뉴클레아제는 서열번호 101을 포함하는 핵산에 의해 코딩된다. 일부 양상에서, 본원에 제공된 융합 단백질 내의 SpCas9 니카제 또는 비활성화된 Cas9 엔도뉴클레아제는 서열번호 102를 포함하는 핵산에 의해 코딩된다.
일부 양상에서, 본원에 제공된 융합 단백질 내의 SpCas9 니카제 또는 비활성화된 Cas9 엔도뉴클레아제는 핵 국재화 신호(NLS)를 추가로 포함하고, 서열번호 23을 포함하는 핵산에 의해 코딩된다. 일부 양상에서, 본원에 제공된 융합 단백질 내의 SpCas9 니카제 또는 비활성화된 Cas9 엔도뉴클레아제는 핵 국재화 신호(NLS)를 추가로 포함하고, 서열번호 24를 포함하는 핵산에 의해 코딩된다. 일부 양상에서, 본원에 제공된 융합 단백질 내의 SpCas9 니카제 또는 비활성화된 Cas9 엔도뉴클레아제는 핵 국재화 신호(NLS)를 추가로 포함하고, 서열번호 25를 포함하는 핵산에 의해 코딩된다. 일부 양상에서, 본원에 제공된 융합 단백질 내의 SpCas9 니카제 또는 비활성화된 Cas9 엔도뉴클레아제는 핵 국재화 신호(NLS)를 추가로 포함하고, 서열번호 26을 포함하는 핵산에 의해 코딩된다. 
[표 4]
일부 실시형태에서, 본원의 Cas9 효소는 스트렙토콕쿠스(Streptococcus), 스타필로콕쿠스(Staphylococcus) 또는 이들의 변이체로부터 유래할 수 있다. 본원에 제공된 바와 같이, 야생형 Cas9이 사용되거나 또는 Cas9의 변형된 버전(예를 들면, Cas9의 진화된 버전, 또는 Cas9 동원체 또는 변이체)이 사용될 수 있다는 것을 이해해야 한다. 일부 양상에서, 본원에서 Cas9 효소는 스트렙토콕쿠스 피오게네스 Cas9(SpCas9) 변이체일 수 있다. 일부 양상에서, 본원의 Cas9 효소는 NGG PAM과 상용성인 스트렙토콕쿠스 피오게네스 Cas9(SpCas9) 변이체일 수 있다. 표준적 PAM은 서열 5'-NGG-3'이며, 여기서 "N"은 임의의 핵염기이고, 그 후에 2개의 구아닌("G") 핵염기가 이어진다. 일부 양상에서, 본원의 Cas9 효소는 비-NGG PAM과 상용성인 스트렙토콕쿠스 피오게네스 Cas9(SpCas9) 변이체일 수 있다. 일부 양상에서, 본원의 Cas9 효소는 TGAG 및/또는 CGAG로부터 선택된 비-NGG PAM과 상용성인 스트렙토콕쿠스 피오게네스 Cas9(SpCas9) 변이체일 수 있다. 일부 양상에서, 본원의 Cas9 효소는 비-NGG PAM과 상용성인 스트렙토콕쿠스 피오게네스 Cas9(SpCas9) 변이체를 사용하는 아데닌 염기 에디터(ABE) ABEmax의 변이체일 수 있다. 일부 예에서, 본원의 Cas9 효소는 ABEmax-SpCas9-NG일 수 있다.
일부 실시형태에서, 활성 Cas9 분자가 표적 핵산과 상호작용하여 절단하는 능력은 PAM 서열에 의존한다. PAM 서열은 표적 핵산 내의 서열이다. 일부 실시형태에서, 본원의 PAM은 TGAG 또는 CGAG의 뉴클레오티드 서열과 적어도 85%(예를 들면, 약 85%, 90%, 95%, 99%, 100%)의 서열 동일성을 갖는 폴리뉴클레오티드 서열을 가질 수 있다. 일부 실시형태에서, 본원의 PAM은 TGAG 또는 CGAG의 뉴클레오티드 서열을 가질 수 있다. 일부 실시형태에서, 표적 핵산의 절단은 PAM 서열의 상류에서 발생한다. 상이한 세균 종의 활성 Cas9 분자는 상이한 서열 모티프(예를 들면, PAM 서열)를 인식할 수 있다. 일부 실시형태에서, 에스. 피오게네스의 활성 Cas9 분자는 서열 모티프 "NGG"를 인식하고, 해당 서열로부터 상류에 있는 표적 핵산 서열 1 내지 10, 예를 들면, 3 내지 5 염기쌍의 절단을 지시할 수 있다. 일부 실시형태에서, 에스. 피오게네스의 활성 Cas9 분자는 비-NGG 서열 모티프를 인식하고, 해당 서열로부터 상류에 있는 표적 핵산 서열 1 내지 10, 예를 들면, 3 내지 5 염기쌍의 절단을 지시할 수 있다.
(iii) 융합 단백질의 추가 요소
다양한 양상에서, 융합 단백질은 하나 이상의 추가 요소를 포함할 수 있다. 다양한 예들에서, 융합 단백질은 펩티드 링커를 추가로 포함하여, 예를 들면, 데아미나제 및 SpCas9 니카제 또는 비활성화된 Cas9 엔도뉴클레아제를 공유 결합하거나, 각 단백질을 하나 이상의 핵 국재화 신호에 연결할 수 있다. 마찬가지로, 핵 국재화 신호는 데아미나제 및/또는 SpCas9 니카제 또는 비활성화된 Cas9 엔도뉴클레아제의 일부로서 융합 단백질에 포함될 수 있는 추가 요소이다. 
따라서, 다양한 양상에서, 융합 단백질은 유연한 펩티드 링커를 추가로 포함한다. 적합한 링커는 하기 표 5에 제공되어 있다. 일부 양상에서, 유연한 링커는 데아미나제 및 SpCas9 니카제 또는 비활성화된 Cas9 엔도뉴클레아제를 공유 결합할 수 있다. 예를 들면, 일부 양상에서, 링커는 서열번호 27을 포함할 수 있다. 다양한 양상에서, 유연한 링커는 핵 국재화 신호를 데아미나제 또는 SpCas9 니카제 또는 비활성화된 Cas9 엔도뉴클레아제의 N 또는 C 말단에 연결할 수 있다. 예를 들면, 링커는 SGGS(서열번호 103)를 포함할 수 있다. 유연한 펩티드 링커는 핵산에 의해 코딩될 수 있다. 링커를 코딩할 수 있는 적절한 핵산은 하기 표 6에 제공되어 있다. 일부 양상에서, 링커는 서열번호 29 또는 30을 포함하는 핵산에 의해 코딩될 수 있다. 일부 양상에서, 링커는 서열번호 78을 포함하는 핵산에 의해 코딩될 수 있다.
[표 5]
[표 6]
추가의 양상에서, 융합 단백질은 하나 이상의 핵 국재화 신호(NLS)를 추가로 포함할 수 있다. 하나 이상의 NLS는 데아미나제 및/또는 Cas9 니카제 또는 비활성화된 Cas9 엔도뉴클레아제 중 하나 또는 둘 다에 공유 부착되거나 연결될 수 있다. 예를 들면, 일부 양상에서, NLS는 데아미나제의 N- 또는 C-말단에 연결될 수 있다. 다른 양상에서, NLS는 Cas9 니카제 또는 비활성화된 Cas9 엔도뉴클레아제의 N- 또는 C-말단에 연결될 수 있다. 예를 들면, 일부 양상에서, NLS는 데아미나제의 N-말단에 연결될 수 있고, 또 다른 NLS는 Cas9 니카제 또는 비활성화된 Cas9 엔도뉴클레아제의 C-말단에 연결될 수 있다. 
예시적 NLS에는 c-myc NLS, SV40 NLS, hnRNPAI M9 NLS, 뉴클레오플라스민 NLS, 임포르틴-알파로부터의 IBB의 서열 RMRKFKNKGKDTAELRRRVEVSVELRKAKKDEQILKRRNV(서열번호 33), 근종 T 단백질의 서열 VSRKRPRP(서열번호 34) 및 PPKKARED(서열번호 35), 인간 p53의 서열 PQPKKP(서열번호 104), 마우스 cabl IV의 서열 SALIKKKKMAP(서열번호 36), 인플루엔자 바이러스 NS1의 서열 DRLRR(서열번호 37) 및 서열 PKQKKRK(서열번호 38), 간염 바이러스 델타 항원의 서열 RKLKKKK(서열번호 39), 및 마우스 Mx1 단백질의 서열 REKKKFLKRR(서열번호 40)이 포함된다. 추가로 허용되는 핵 국재화 신호에는 인간 폴리(ADP-리보스) 폴리머라제의 서열 KRKGDEVDGVDEVAKKKK(서열번호 41) 또는 스테로이드 호르몬 수용체(인간) 글루코코르티코이드의 서열 RKCLQAGMNLEARKTKK(서열번호 42)와 같은 양분 핵 국재화 서열이 포함될 수 있다. 추가의 예시적 NLS에는 MKRTADGSEFESPKKRKV(서열번호 31) 및 KRTADGSEFEPKKRKV(서열번호 32)가 포함된다. 다른 적합한 핵 국재화 신호(NLS)는 당업자에게 공지되어 있다. 
(iii) 예시적 융합 단백질
전술한 개시에 따라, 예시적 융합 단백질은 상기 제공된 적어도 하나의 데아미나제 및 적어도 하나의 Cas9 니카제 또는 비활성화된 Cas9 엔도뉴클레아제를 조합하여 제공될 수 있다. 상정할 수 있는 비제한적 조합은 다음과 같다: ABEmax-VRQR, ABEmax-SpCas9-NG, ABEmax-SpRY, ABEmax-SpG, ABE8e-VRQR, ABE8e-SpCas9-NG, ABE8e-SpRY 및 ABE8e-SpG. 이들 융합 단백질 각각은 데아미나제 및 Cas9 단백질을 연결하는 링커(예를 들면, 서열번호 27 또는 28)를 추가로 포함할 수 있다. 추가로, 이들 융합 단백질 각각은 하나 이상의 핵 국재화 신호(NLS)를 추가로 포함할 수 있다. 핵 국재화 신호를 갖거나 갖지 않는, 이들 융합 단백질의 예시적 아미노산 서열은 하기 표 7에 제공되어 있다. 
다양한 양상들에서, 융합 단백질은 서열번호 45 내지 60 중 어느 하나에 대해 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99%의 서열 상동성을 갖는 아미노산 서열을 포함한다. 일부 양상에서, 융합 단백질은 서열번호 45, 47, 49, 51, 53, 55, 57, 및 59 중 어느 하나에 대해 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99%의 서열 상동성을 갖는 아미노산 서열을 포함한다. 일부 양상에서, 융합 단백질은 서열번호 45, 47, 49, 51, 53, 55, 57, 및 59 중 어느 하나를 포함하는 아미노산 서열을 포함한다. 일부 양상에서, 융합 단백질은 하나 이상의 핵 국재화 서열(NLS)을 추가로 포함한다. 따라서, 다양한 예에서, 융합 단백질은 서열번호 46, 48, 50, 52, 54, 56, 58 및 60 중 어느 하나에 대해 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99%의 서열 상동성을 갖는 아미노산 서열을 포함할 수 있다. 다양한 양상에서, 융합 단백질은 서열번호 46, 48, 50, 52, 54, 56, 58 및 60 중 어느 하나를 포함하는 아미노산 서열을 포함할 수 있다. 일부 양상에서, 융합 단백질은 서열번호 46, 48, 50, 52, 54, 56, 58 및 60 중 어느 하나로 이루어진 아미노산 서열을 포함할 수 있다. 
[표 7]
다양한 양상에서, 본원에 제공된 융합 단백질은 하나 이상의 핵산에 의해 코딩될 수 있다. 일부 양상에서, 융합 단백질은 단일 핵산에 의해 코딩될 수 있다. 상기한 완전 융합 단백질을 코딩하는 적절한 핵산(링커 및 NLS를 포함)은 본원의 표 8에 제공된다. 일부 양상들에서, 융합 단백질은 서열번호 61 내지 68 중 어느 하나를 포함하는 핵산에 의해 코딩될 수 있다. 일부 양상에서, 융합 단백질은 서열번호 73, 79 및 147 내지 152 중 어느 하나를 포함하는 핵산에 의해 코딩될 수 있다. 
[표 8]
(c) CRISPR 유전자 편집 시스템
일부 실시형태에서, 본원의 조작된 CRISPR 유전자 편집 시스템(예를 들면, 포유동물 세포에서 유전자 편집용)은 (1) (게놈 DNA 표적 서열에 하이브리드화할 수 있는) 표적화 도메인 및 Cas(예: Cas9 효소)에 결합할 수 있는 서열을 포함하는 본원에 개시된 가이드 RNA 분자(gRNA), 및 (2) 염기 에디터(예를 들면, 데아미나제 및 Cas9 니카제 또는 비활성화된 Cas9 엔도뉴클레아제의 융합 단백질)를 포함할 수 있다. 일부 양상에서, 조작된 CRISPR 유전자 편집 시스템은 서열번호 1 또는 2의 서열을 표적화하는 gRNA 및 서열번호 45 내지 60 중 어느 하나를 포함하는 융합 단백질을 포함한다. 일부 양상에서, 조작된 CRISPR 유전자 편집 시스템은 서열번호 1의 서열을 표적화하는 (즉, 서열번호 5의 스페이서 서열을 포함하는) gRNA 및 서열번호 45 또는 46을 포함하는 융합 단백질을 포함한다. 일부 양상에서, 조작된 CRISPR 유전자 편집 시스템은 서열번호 2의 서열(즉, 서열번호 6의 스페이서 서열을 포함)을 표적화하는 gRNA 및 서열번호 45 또는 46을 포함하는 융합 단백질을 포함한다. 
(i) CRISPR 시스템의 추가 요소 
gRNA는 tracr 도메인이라고 하는 도메인을 포함할 수 있다. 표적 도메인 및 Cas, 예를 들면, Cas9 효소에 결합할 수 있는 서열은 동일(단일 gRNA, 키메라 gRNA 또는 sgRNA라고도 함) 또는 상이한 분자(종종 이중 gRNA 또는 dgRNA라고도 함)에 배치될 수 있다. 상이한 분자에 배치되는 경우, 각각은, 예를 들면, 하이브리드화를 통해 분자가 결합할 수 있도록 하는 하이브리드화 도메인을 포함한다.
특정 실시형태에서, 표적 서열에 이중-가닥 절단을 생성하기 위해, 본원의 CRISPR-Cas9 시스템은 가이드 핵산(gRNA)에 의해 결정되는 표적 서열에 결합할 수 있고, 뉴클레아제는 표적 서열을 절단하기 위해 표적 서열에 인접한 프로토스페이서 인접 모티프(PAM) 서열을 인식할 수 있다. 일부 실시형태에서, 본원의 CRISPR-Cas9 시스템은 핵산-가이드 뉴클레아제와 상용성인 스캐폴드 서열을 포함할 수 있다. 다른 실시형태에서, 가이드 서열은 표적 서열의 효율적 편집을 위해 임의의 원하는 표적 서열에 상보성이도록 조작될 수 있다. 다른 실시형태에서, 가이드 서열은 임의의 원하는 표적 서열에 하이브리드화되도록 설계할 수 있다. 일부 실시형태에서, 표적 핵산 서열은 20 뉴클레오티드 길이를 갖는다. 일부 실시형태에서, 표적 핵산은 20 미만의 뉴클레오티드 길이를 갖는다. 일부 실시형태에서, 표적 핵산은 20 이상의 뉴클레오티드 길이를 갖는다. 일부 실시형태에서, 표적 핵산은 적어도 5, 10, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30 이상의 뉴클레오티드 길이를 갖는다. 일부 실시형태에서, 표적 핵산은 최대 5, 10, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30 이상의 뉴클레오티드 길이를 갖는다.
일부 실시형태에서, 본원에서 CRISPR-Cas9 시스템의 표적 서열은 원핵세포 또는 진핵세포에 내인성 또는 외인성인 임의의 폴리뉴클레오티드일 수 있거나, 또는 검증 등을 위한 시험관내 시스템에서 임의의 폴리뉴클레오티드일 수 있다. 다른 실시형태에서, 표적 서열은 진핵 세포의 핵에 존재하는 폴리뉴클레오티드일 수 있다. 표적 서열은 유전자 생성물(예를 들면, 단백질)을 코딩하는 서열 또는 비-코딩 서열(예를 들면, 조절 폴리뉴클레오티드 또는 정크 DNA)일 수 있다. 본원에서, 표적 서열은 PAM, 즉 본원에서 CRISPR-Cas9 시스템에 의해 인식되는 짧은 서열과 연관되어야 하는 것으로 고려된다. 일부 실시형태에서, PAM에 대한 서열 및 길이 요건은 선택된 핵산-가이드 뉴클레아제에 따라 상이하다. 특정 실시형태에서, PAM 서열은 원하는 PAM에 따라 표적 서열에 인접한 약 2 내지 5개의 염기쌍 서열이거나 그 이상일 수 있다. PAM 서열의 예는 하기 실시예 섹션에 제공되며, 당업자는 이들이 본 발명의 개념의 이러한 양상을 한정하는 것은 아니기 때문에 소정 핵산-가이드 뉴클레아제와 함께 사용하기 위한 추가 PAM 서열을 동정할 수 있을 것이다. 추가로, PAM 상호작용(PI) 도메인의 조작은 PAM 특이성의 프로그래밍을 가능하게 하고, 표적 부위 인식 충실도를 개선하며, 핵산-가이드 뉴클레아제 게놈 조작 플랫폼의 다양성을 증가시킬 수 있다.
(d) 단리된 핵산 및 벡터 
다양한 양상에서, 본원에 제공된 CRISPR 유전자 편집 시스템의 하나 이상의 성분(예를 들면, gRNA 및/또는 융합 단백질(염기 에디터))은 핵산(예를 들면, 상기한 것)에 의해 코딩될 수 있다. 따라서, 본원에서는 상기 하나 이상의 gRNA를 코딩하는 단리된 핵산이 제공된다. 또한, 데아미나제 및 Cas9 니카제 또는 Cas9 엔도뉴클레아제를 포함하는 융합 단백질을 코딩하는 단리된 핵산도 제공된다. 본 개시에 따라 단리된 핵산으로 제공될 수 있는 예시적 핵산은 상기 표에 기재되어 있다. 
본원에서 CRISPR-Cas9 시스템의 성분을 코딩하는 폴리뉴클레오티드 서열은 하나 이상의 벡터를 포함할 수 있다. 본원에서 사용되는 "벡터"라는 용어는 그것이 연결된 또 다른 핵산을 수송할 수 있는 핵산 분자를 지칭할 수 있다. 벡터는 단일-가닥, 이중-가닥 또는 부분적으로 이중-가닥인 핵산 분자; 하나 이상의 자유 말단을 포함하는 핵산 분자, 자유 말단을 포함하지 않는 핵산 분자(예: 환상); DNA, RNA 또는 이들 둘 다를 포함하는 핵산 분자; 및 당해 기술분야에 공지된 다른 종류의 폴리뉴클레오티드를 포함하지만 이들로 한정되지 않는다. 벡터의 한 가지 유형은 "플라스미드"이고, 이는 표준 분자 클로닝 기술 등에 의해 추가 DNA 세그먼트를 삽입할 수 있는 환상 이중-가닥 DNA 루프를 지칭한다. 또 다른 유형의 벡터는 바이러스 벡터이고, 여기서 바이러스-유래 DNA 또는 RNA 서열은 바이러스(예: 레트로바이러스, 복제 결함 레트로바이러스, 아데노바이러스, 복제 결함 아데노바이러스, 아데노-관련 바이러스)로 패키징하기 위해 벡터에 존재한다. 다른 벡터(예: 비-에피솜 포유동물 벡터)는 숙주 세포에 도입할 때에 숙주 세포의 게놈에 통합될 수 있다. 재조합 발현 벡터는 숙주 세포에서 핵산의 발현에 적합한 형태로 본 발명의 개념의 핵산을 포함할 수 있으며, 이는 재조합 발현 벡터가 발현에 사용될 숙주 세포에 기초하여 선택될 수 있는 하나 이상의 조절 요소를 포함할 수 있고, 발현될 핵산 서열에 작동 가능하게 연결되어 있는 것을 의미한다. 
일부 실시형태에서, 조절 요소는 본원에서 표적화 가능한 CRISPR-Cas9 시스템의 하나 이상의 요소에 작동 가능하게 연결되어, 표적화 가능한 CRISPR-Cas9 시스템의 하나 이상의 성분의 발현을 유도할 수 있다.
일부 실시형태에서, 벡터는 본원에서 Cas9 뉴클레아제를 코딩하는 폴리뉴클레오티드 서열에 작동 가능하게 연결된 조절 요소를 포함할 수 있다. 본원에서 Cas9 뉴클레아제를 코딩하는 폴리뉴클레오티드 서열은 원핵세포 또는 진핵세포와 같은 특정 세포에서의 발현을 위해 최적화된 코돈일 수 있다. 진핵 세포는 효모, 균류, 조류, 식물, 동물 또는 인간 세포일 수 있다. 진핵 세포는 인간, 마우스, 랫트, 래빗, 개 또는 비-인간 영장류를 포함한 비인간 포유동물을 포함하지만 이들로 한정되지 않는 포유동물과 같은 특정 생물로부터 유래한 세포일 수 있다. 식물 세포에는 종자, 현탁 배양액, 배아, 분열조직 영역, 캘러스 조직, 잎, 뿌리, 신아, 배우체, 포자체, 화분 및 소포자로부터의 세포가 포함될 수 있지만 이들로 한정되지 않는다. 
본원에서 사용되는 바와 같이, "코돈 최적화"는 천연 아미노산 서열을 유지하면서 천연 서열의 적어도 하나 이상의 코돈을 해당 숙주 세포의 유전자에서 보다 빈번하게 또는 가장 빈번하게 사용되는 코돈으로 대체함으로써 관심 있는 숙주 세포에서 발현을 증강시키기 위해 핵산 서열을 변형하는 프로세스를 지칭할 수 있다. 다양한 종은 특정 아미노산의 특정 코돈에 대해 특정 편향을 나타낸다. 본원에서 고려되는 바와 같이, 코돈 최적화를 기반으로 특정 생물에서 최적의 유전자 발현을 위해 유전자를 조정할 수 있다. 코돈 사용 표는, 예를 들면, "코돈 사용 데이터베이스"에서 용이하게 입수할 수 있다. 
일부 실시형태에서, 본원의 Cas9 뉴클레아제 및 하나 이상의 가이드 핵산(예를 들면, gRNA)은 DNA 또는 RNA로 전달될 수 있다. RNA(변형되지 않거나 염기 또는 백본 변형을 포함하는) 분자로서 본원의 Cas9 뉴클레아제 및 가이드 핵산 모두의 전달은 핵산-가이드 뉴클레아제가 세포 내에서 지속되는 시간을 감소(예: 반감기 감소)시키기 위해 사용할 수 있다. 이는 표적 세포에서 오프-표적 절단 활성의 수준을 감소시킬 수 있다. mRNA로서 Cas9 뉴클레아제의 전달은 단백질로 번역되는 시간이 걸리기 때문에, 본원에서의 양상은 핵산-가이드 뉴클레아제 단백질과의 상호작용에 이용할 수 있는 가이드 핵산의 수준을 최대화하기 위해 Cas9 mRNA 전달의 수 시간 후에 가이드 핵산을 전달하는 것을 포함할 수 있다. 다른 경우에, Cas9 mRNA 및 가이드 핵산을 동시에 전달할 수 있다. 다른 예에서, 가이드 핵산은 Cas9 mRNA의 0.5, 1, 2, 3, 4 또는 그 이상의 시간 후와 같이 순차적으로 전달될 수 있다.
일부 실시형태에서, RNA 형태 또는 DNA 발현 카세트 상에 코딩된 가이드 핵산(예를 들면, gRNA)은 벡터 또는 염색체 상에 코딩된 핵산-가이드 뉴클레아제를 포함하는 숙주 세포에 도입될 수 있다. 가이드 핵산은 하나 이상의 폴리뉴클레오티드를 갖는 카세트에 제공될 수 있으며, 이는 카세트에서 연속적 또는 비연속적일 수 있다. 일부 실시형태에서, 가이드 핵산은 단일 연속 폴리뉴클레오티드로서 카세트 내에 제공될 수 있다. 다른 실시형태에서, 분포 및 활성을 추적하기 위해, 추적제를 가이드 핵산에 첨가할 수 있다.
다른 실시형태들에서, 다양한 전달 시스템을 사용하여 숙주 세포에 gRNA 및/또는 Cas9 뉴클레아제를 도입할 수 있다. 이러한 실시형태에 따라, 본원에 개시된 실시형태에 사용되는 시스템에는 효모 시스템, 리포펙션 시스템, 미세주입 시스템, 생물학적 시스템, 바이로솜, 리포솜, 면역리포솜, 폴리카티온, 지질:핵산 접합체, 비리온, 인공 비리온, 바이러스 벡터, 전기천공, 세포 투과성 펩티드, 나노입자, 나노와이어 및/또는 엑소좀이 포함될 수 있지만 이들로 한정되지 않는다. 
일부 실시형태에서, 본원에 기재된 하나 이상의 벡터 또는 선형 폴리뉴클레오티드, 이의 하나 이상의 전사물, 및/또는 이로부터 전사된 하나 이상의 단백질을 숙주 세포에 전달하는 방법이 제공된다. 일부 양상에서, 본 발명의 개념은 이러한 방법에 의해 생산된 세포를 추가로 제공하며, 생물은 이러한 세포를 포함하거나 이러한 세포로부터 생산될 수 있다. 일부 실시형태에서, 가이드 핵산과 조합하여(및 임의로 복합체화되어) 조작된 뉴클레아제가 세포로 전달된다.
특정 실시형태에서, 종래의 바이러스 및 비-바이러스 기반 유전자 전달 방법을 사용하여 원핵 세포, 진핵 세포, 식물 세포, 포유동물 세포 또는 표적 조직과 같은 세포에 핵산을 도입할 수 있다. 이러한 방법을 사용하여 본원의 CRISPR-Cas9 시스템의 성분을 코딩하는 핵산을 배양물 또는 숙주 생물에 투여할 수 있다. 비-바이러스 벡터 전달 시스템에는 DNA 플라스미드, RNA(예를 들면, 본원에 기재된 벡터의 전사물), 네이키드 핵산 및 리포솜과 같은 전달 비히클과 복합체를 형성한 핵산이 포함된다. 바이러스 벡터 전달 시스템에는 DNA 및 RNA 바이러스가 포함되고, 이는 세포에 전달된 후에 에피솜 또는 통합 게놈을 갖는다. 당해 기술분야에 공지된 임의의 유전자 치료 방법은 본원에서의 사용이 고려될 수 있다. 핵산의 비-바이러스 전달의 방법은 본원에서 고려된다. 아데노-관련 바이러스("AAV") 벡터를 또한 사용하여, 예를 들면, 핵산 및 펩티드의 시험관내 생산, 생체내 및 생체외 유전자 치료 절차에서 표적 핵산으로 세포를 형질도입할 수 있다.  
일부 실시형태에서, 본원의 작제물 중 임의의 것을 코딩하는 핵산(예를 들면, gRNA, 데아미나제 및 Cas9 니카제를 포함하는 융합 단백질 또는 비활성화된 Cas9 단백질)은 아데노-연관 바이러스(AAV)를 사용하여 세포에 전달될 수 있다.  AAV는 숙주 게놈에 부위-특이적으로 통합되어 도입유전자를 전달할 수 있는 작은 바이러스이다. 역방향 말단 반복(ITR)은 AAV 게놈 및/또는 관심 있는 도입유전자의 측면에 존재하고, 복제 기점으로 기능한다. 또한, AAV 게놈에는 rep 및 cap 단백질이 존재하고, 이는 전사될 때에 AAV 게놈을 캡슐화하여 표적 세포로 전달하는 캡시드를 형성한다. 이러한 캡시드의 표면 수용체는 AAV 혈청형을 부여하고, 캡시드가 어느 표적 기관에 주로 결합하고, 따라서 AAV가 어느 세포를 가장 효율적으로 감염시키는지를 결정한다. 현재 공지된 인간 AAV 혈청형은 12개이다. 일부 실시형태에서, 임의의 포유동물 AAV 혈청형은 본원에 기재된 코딩 핵산을 전달하기 위해 본원에서 사용될 수 있다. 아데노-관련 바이러스는 몇몇 이유로 유전자 치료에 가장 빈번하게 사용되는 바이러스 중 하나이다. 첫째, AAV는 인간을 포함한 포유동물에게 투여할 때에 면역 반응을 유발하지 않는다. 둘째, 특히 적절한 AAV 혈청형의 선택을 고려하는 경우, AAV는 표적 세포에 효과적으로 전달된다. 최후로, 게놈은 통합되지 않고 숙주 세포에 존속할 수 있기 때문에, AAV는 분열 세포 및 비-분열 세포를 모두 감염시킬 수 있는 능력을 갖고 있다. 이러한 특성은 이들을 유전자 치료에 이상적인 후보로 되게 한다.
일부 실시형태에서, 본원에 개시된 폴리뉴클레오티드(예를 들면, gRNA, Cas9)는 적어도 하나의 AAV 벡터를 사용하여 세포에 전달될 수 있다. AAV 벡터는 전형적으로 단백질-기반 캡시드 및 캡시드에 의해 캡슐화된 핵산을 포함한다. 핵산은, 예를 들면, 역방향 말단 반복에 의해 측면에 있는 도입유전자를 포함하는 벡터 게놈일 수 있다. AAV "캡시드"는 개별 "캡시드 단백질" 또는 "서브유닛"을 포함하는 거의 구형의 단백질 쉘이다. AAV 캡시드는 전형적으로 T=1 정이십면체 대칭을 수반하여 연결 및 배열된 약 60개의 캡시드 단백질 서브유닛을 포함한다. AAV 벡터가 AAV 캡시드 단백질을 포함하는 것으로 본원에서 기재되는 경우, AAV 벡터는 캡시드를 포함하며, 여기서 캡시드는 하나 이상의 AAV 캡시드 단백질(즉, 서브유닛)을 포함하는 것으로 이해될 것이다. 또한, 본원에서는 "바이러스-유사(viral-like) 입자" 또는 "바이러스-유사(virus-like) 입자"가 기재되는데, 이는 도입유전자를 포함하는 임의의 벡터 게놈 또는 핵산을 포함하지 않는 캡시드를 지칭한다. 본 개시의 바이러스 벡터는 추가로 문헌[참조: 국제 특허공보 WO 00/28004 and Chao et al., (2000) Molecular Therapy 2:619]에 기재된 바와 같이 "표적" 바이러스 벡터(예를 들면, 지향성을 갖는) 및/또는 "하이브리드" 파보바이러스(즉, 바이러스 TR 및 바이러스 캡시드가 상이한 파보바이러스로부터 유래)일 수 있다. 본 개시의 바이러스 벡터는 추가로 국제 특허공보 WO 01/92551(이의 개시는 전체가 참조에 의해 본원에 도입된다)에 기재된 이중쇄 파보바이러스 입자일 수도 있다. 따라서, 일부 실시형태에서, 이중-가닥(이중) 게놈은 본 발명 개념의 바이러스 캡시드에 패키징될 수 있다. 추가로, 바이러스 캡시드 또는 게놈 요소는 삽입, 결실 및/또는 치환을 포함한 다른 변형을 함유할 수 있다.  
일부 실시형태에서, 본원의 gRNA 및/또는 융합 단백질을 코딩하는 단리된 핵산은 AAV 벡터(예를 들면, AAV-Cas9 벡터)에 패키징될 수 있다. 일부 실시형태에서, AAV 벡터는 야생형 AAV 벡터이다. 일부 실시형태에서, AAV 벡터는 하나 이상의 돌연변이를 포함한다. 일부 실시형태에서, AAV 벡터는 혈청형 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11 또는 이들의 임의의 조합의 AAV 벡터로부터 단리 또는 유래된다.
예시적 AAV-Cas9 벡터는 Cas9 서열을 포함하는 중앙 서열 영역의 측면에 있는 2개의 ITR(역방향 말단 반복) 서열을 함유한다. 일부 실시형태에서, ITR은 혈청형 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11 또는 이들의 임의의 조합의 AAV 벡터로부터 단리 또는 유래된다. 일부 실시형태에서, ITR은 AAV 혈청형에 대한 전장 및/또는 야생형 서열을 포함하거나 이들로 이루어진다. 일부 실시형태에서, ITR은 AAV 혈청형에 대한 절단된 서열을 포함하거나 이들로 이루어진다. 일부 실시형태에서, ITR은 AAV 혈청형에 대한 신장된 서열을 포함하거나 이들로 이루어진다. 일부 실시형태에서, ITR은 동일한 AAV 혈청형에 대한 야생형 서열과 비교하여 서열 변이를 포함하는 서열을 포함하거나 이들로 이루어진다. 일부 실시형태에서, 서열 변이는 치환, 결실, 삽입, 반전, 또는 전위 중 하나 이상을 포함한다. 일부 실시형태에서, ITR은 적어도 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 142, 143, 144, 145, 146, 147, 148, 149 또는 150 염기쌍을 포함하거나 이들로 이루어진다. 일부 실시형태에서, ITR은 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149 또는 150 염기쌍을 포함하거나 이들로 이루어진다. 일부 실시형태에서, ITR은 110±10 염기쌍의 길이를 갖는다. 일부 실시형태에서, ITR은 120±10 염기쌍의 길이를 갖는다. 일부 실시형태에서, ITR은 130±10 염기쌍의 길이를 갖는다. 일부 실시형태에서, ITR은 140±10 염기쌍의 길이를 갖는다. 일부 실시형태에서, ITR은 150±10 염기쌍의 길이를 갖는다. 일부 실시형태에서, ITR은 115, 145 또는 141 염기쌍의 길이를 갖는다.
일부 실시형태에서, AAV-Cas9 벡터는 하나 이상의 핵 국재화 신호(NLS)를 함유할 수 있다. 일부 실시형태에서, AAV-Cas9 벡터는 1, 2, 3, 4 또는 5개의 핵 국재화 신호를 함유할 수 있다. 예시적 NLS에는 서열번호 31 및 32가 포함된다. 다른 예시적 NLS에는 c-myc NLS, SV40 NLS, hnRNPAI M9 NLS, 뉴클레오플라스민 NLS, 임포르틴-알파로부터 IBB 도메인의 서열 RMRKFKNKGKDTAELRRRVEVSVELRKAKKDEQILKRRNV(서열번호 33), 근종 T 단백질의 서열 VSRKRPRP(서열번호 34) 및 PPKKARED(서열번호 35), 인간 p53의 서열 PQPKKKPL(서열번호 104), 마우스 c-abl IV의 인간 p53의 서열 SALIKKKKMAP(서열번호 36), 인플루엔자 바이러스 NS1의 서열 DRLRR(서열번호 37) 및 PKQKKRK(서열번호 38), 간염 바이러스 델타 항원의 서열 RKLKKKKL(서열번호 39), 및 마우스 Mx1 단백질의 서열 REKKKFLKRR(서열번호 40)이 포함된다. 추가로 허용되는 핵 국재화 신호에는 인간 폴리(ADP-리보스) 폴리머라제의 서열 KRKGDEVDGVDEVAKKKSKK(서열번호 41) 또는 스테로이드 호르몬 수용체(인간) 글루코코르티코이드의 서열 RKCLQAGMNLEARKTKK(서열번호 42)와 같은 양분 핵 국재화 서열이 포함된다.
일부 실시형태에서, AAV-Cas9 벡터는 벡터의 패키징 및 융합 단백질 및/또는 gRNA의 발현을 촉진하기 위한 추가 요소를 포함할 수 있다. 일부 실시형태에서, AAV-Cas9 벡터는 폴리A 서열을 포함할 수 있다. 일부 실시형태에서, 폴리A 서열은 bgHi-polyA 서열일 수 있다. 일부 실시형태에서, AAV-Cas9 벡터는 조절 요소를 포함할 수 있다. 일부 실시형태에서, 조절 요소는 활성제 또는 억제제이다. 일부 실시형태에서, 조절 요소는 전사 후 조절 요소이다(예: WPRE-3-우드척 간염 바이러스 전사 후 조절 요소-3).
일부 실시형태에서, AAV-Cas9는 하나 이상의 프로모터를 함유할 수 있다.  일부 실시형태에서, 하나 이상의 프로모터는 Cas9의 발현을 유도한다. 일부 실시형태에서, 하나 이상의 프로모터는 근육-특이적 프로모터이다. 예시적 근육-특이적 프로모터에는 미오신 경쇄-2 프로모터, α-액틴 프로모터, 트로포닌 1 프로모터, Na+/Ca2+ 교환 프로모터, 디스트로핀 프로모터, α7 인테그린 프로모터, 뇌 나트륨이뇨 펩티드 프로모터, αB-크리스탈린/작은 열 충격 단백질 프로모터, α-미오신 중쇄 프로모터, ANF 프로모터, CK8 프로모터 및 CK8e 프로모터가 포함된다. 일부 실시형태에서, 하나 이상의 프로모터는 심장-특이적 프로모터이다. 예시적 심장-특이적 프로모터에는 심장 트로포닌 T 및 α-미오신 중쇄 프로모터가 포함된다.
일부 실시형태에서, AAV-Cas9 벡터는 효모, 세균, 곤충 세포 또는 포유동물 세포에서의 생산용으로 최적화될 수 있다. 일부 실시형태에서, AAV-Cas9 벡터는 인간 세포에서의 발현용으로 최적화될 수 있다. 일부 실시형태에서, AAV-Cas9 벡터는 바큘로바이러스 발현 시스템에서의 발현용으로 최적화될 수 있다.
본 개시의 유전자 편집 작제물의 일부 실시형태에서, 작제물은 프로모터 및 본원에 기재된 융합 단백질을 코딩하는 핵산을 포함하거나 이들로 이루어진다. 일부 실시형태에서, 상기 작제물은 심장 트로포닌 T 프로모터, 및 데아미나제 및 Cas9 뉴클레아제를 포함하는 융합 단백질을 코딩하는 핵산을 포함하거나 이들로 이루어진다. 일부 실시형태에서, 상기 작제물은 심장 트로포닌 T 프로모터, 및 데아미나제 및 스타필로콕쿠스 피오게네스로부터 단리되거나 유래된 Cas9 니카제("SpCas9")를 포함하는 융합 단백질을 코딩하는 핵산을 포함하거나 이들로 이루어진다. 본원의 AAV 벡터에 사용될 수 있는 예시적 프로모터는 서열번호 72를 포함할 수 있다. 
일부 실시형태에서, 프로모터 및 뉴클레아제를 포함하는 작제물은 적어도 2개의 역방향 말단 반복(ITR) 서열을 추가로 포함한다. 일부 실시형태에서, 프로모터 및 뉴클레아제를 포함하는 작제물은 혈청형 2(AAV2)의 AAV로부터 단리되거나 유래된 적어도 2개의 ITR 서열을 추가로 포함한다. 일부 실시형태에서, 프로모터 및 뉴클레아제를 포함하는 작제물은 각각 서열번호 71 또는 85의 뉴클레오티드 서열을 포함하거나 이로 이루어지는 적어도 2개의 ITR 서열을 추가로 포함한다. 일부 실시형태에서, 프로모터 및 뉴클레아제를 포함하는 작제물은 적어도 2개의 ITR 서열을 추가로 포함하며, 여기서 제1 ITR 서열은 서열번호 71의 뉴클레오티드 서열을 포함하거나 이들로 이루어지고, 제2 ITR 서열은 서열번호 85의 뉴클레오티드를 포함하거나 이들로 이루어진다. 일부 실시형태에서, 상기 작제물은, 5'으로부터 3' 방향으로, 제1 ITR, 프로모터(예를 들면, 심장 트로포닌 T 프로모터)를 코딩하는 서열, 핵 국재화 신호를 코딩하는 서열, 데아미나제를 코딩하는 서열, 유연한 펩티드 링커를 코딩하는 서열, SpCas9 니카제 단편(예를 들면, N-말단 절반)을 코딩하는 서열, gRNA를 코딩하는 서열 및 제2 ITR을 포함하거나 이들로 이루어진다. 일부 실시형태에서, 상기 작제물은, 5'으로부터 3' 방향으로, 제1 ITR, 프로모터(예를 들면, 심장 트로포닌 T 프로모터)를 코딩하는 서열, 핵 국재화 신호를 코딩하는 서열, SpCas9 니카제의 제2 단편(예를 들면, C-말단 절반)을 코딩하는 서열, gRNA을 코딩하는 서열 및 제2 ITR을 포함하거나 이들로 이루어진다.
(e) 염기 에디터 및 gRNA의 AAV 전달
본 개시의 일부 양상은 분할-염기 에디터 이중 AAV 전략을 사용하여 염기 에디터(및 이들의 관련 gRNA)의 전달에 관한 것이다. 동물에서 염기 에디터의 전달에 대한 한 가지 장애는 아데노-관련 바이러스(AAV)에서 염기 에디터를 패키징할 수 없다는 것이고, AAV는 효율적으로 광범위하게 사용되는 전달제이고 유일한 FDA-승인 생체내 유전자 치료 벡터이다. 염기 에디터를 코딩하는 DNA의 거대한 크기(에스. 피오게네스(S. pyogenes) Cas9을 함유하고 가이드 RNA 또는 조절 서열을 포함하지 않는 염기 에디터의 경우 5.2 kb)는 <5 kb 12의 게놈 패키징 크기 제한을 갖는 AAV에서의 패키징을 배제할 수 있다.
이러한 패키징 크기 제한을 회피하고 AAV를 사용하여 염기 에디터를 전달하기 위해, 아데닌 염기 에디터(ABE)가 N-말단 및 C-말단 절반으로 분할되는 분할-염기 에디터 이중 AAV 전략이 고안되었다. 이 전략은 PCT 특허 출원 공보 제WO2020236982A1호에 기재되어 있으며; 그 전체 내용은 참조에 의해 본원에 도입되어 있다. 각 염기 에디터 절반은 고속-스플라이싱 분할-인테인의 절반에 융합된다. 각 염기 에디터-분할 인테인 절반을 발현하는 AAV 입자에 의한 공-감염 후, 트랜스에서의 단백질 스플라이싱은 전장 염기 에디터를 재구성한다. 소분자 또는 sgRNA를 사용하여 분할 Cas9을 연결하는 다른 접근법과 달리, 인테인 스플라이싱은 모든 외인성 서열을 제거하고 분할 부위에서 천연 펩티드 결합을 재생성하여 비변형된 염기 에디터와 서열이 동일한 단일 재구성 단백질을 초래한다.
PCT 특허 출원 공보 제WO2020236982A1호에 기재된 것은 핵산 분자, 조성물, 재조합 AAV(rAAV) 입자, 키트 및, 예를 들면, rAAV 벡터를 통해 Cas9 단백질 또는 핵염기 에디터를 세포에 전달하기 위한 방법을 추가로 제공한다. 전형적으로, Cas9 단백질 또는 핵염기 에디터는 N-말단 부분과 C-말단 부분으로 "분할"된다. Cas9 단백질 또는 핵염기 에디터의 N-말단 부분 또는 C-말단 부분은 각각 인테인 시스템의 하나의 구성원에 융합될 수 있다. 수득된 융합 단백질은, 별개의 벡터(예: 별개의 rAAV 벡터) 상에서 하나의 세포로 전달되어 공-발현될 때, 결합되어 완전한 및 기능적 Cas9 단백질 또는 핵염기 에디터를 형성할 수 있다(예를 들면, 인테인-매개 단백질 스플라이싱을 통해). 추가로, 본원에는 분할된 Cas9 단백질 또는 핵염기 에디터의 높은 발현 수준에 대한 전달 벡터 내의 조절 요소의 경험적 시험을 제공한다.
일부 실시형태에서, 아데닌 염기 에디터(ABE)는 ABE의 Cas9 도메인 내에서 분할된다. 일부 실시형태에서, ABE는 하기 서열을 갖는 Cas9(예를 들면, Cas9-VRQR)의 Glu 573 및 Cys 574 잔기 사이에서 분할된다: 
명확하게 하기 위해, 잔기 E573 및 C574는 서열번호 15의 상기 서열에서 볼드체 및 밑줄로 표시되어 있다. 상이한 Cas9 서열(예를 들면, 상기 수록된 서열번호 16 내지 22)을 갖는 ABE는 서열번호 15의 Cas9와 비교하여 동일하거나 상이한 잔기(예를 들면, 본원에 예시된 바와 같이, 서열번호 15의 573 또는 574 잔기로부터의 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90 또는 100 잔기인 잔기)에서 분할될 수 있다. 또한, 서열번호 15는 개시 코돈으로서 최초 아미노산 잔기로서 메티오닌을 함유하는 것으로 이해될 수 있다. 이 아미노산이 생략된 경우, 예컨대, Cas9 단백질이 N 말단에 핵 국재화 서열로 발현되는 경우, 분할되는 대응 잔기는 E572 및 C573이다. 또한, (본원에서 기재된 바와 같이) Cas9 단백질에 공유 결합된 데아미나제를 포함하는 완전 융합 단백질도 Cas9 단백질의 동등한 위치에서 분할될 수 있음을 이해할 수 있다. 예를 들면, 서열번호 46을 포함하는 융합 단백질은 서열번호 46에 따라 E987 및 C988에서 분할될 수 있다. 다른 Cas9 서열 및 본원에 기재된 융합 단백질(예를 들면, 염기 에디터)에서 대응하는 잔기를 동정하는 데 유용한 도구(예를 들면, BLAST)는 당해 기술분야에 공지되어 있으며, 당업자는 이러한 대응하는 잔기를 결정하는 방법을 이해할 수 있을 것이다. 일부 실시형태에서, 염기 에디터의 분할에 사용되는 인테인은 Npu 인테인이다. 일부 실시형태에서, 인테인은 서열번호 153 또는 154의 아미노산 서열을 포함하며, 여기서 서열번호 153은 Npu DnaE N-말단 단백질이고, 서열번호 154는 Npu DnaE C-말단 단백질이다.
Npu DnaE N-말단 단백질:
CLSYETEILTVEGLPIGKIVEKRIECTVYSVDNNGNINGNYTQPVAQWHDRGEQEVFEYCLEDGSLIRATKDHKFMTVDGQMLPID(서열번호 153)
Npu DnaE C-말단 단백질:
IKATRKYLGKQNVYDIGVERDHNFALKNGFIASN(서열번호 154). 
일부 실시형태에서, 5'으로부터 3' 방향으로 제1 ITR, 프로모터를 코딩하는 서열, gRNA 및/또는 Cas9 니카제 또는 이의 단편을 코딩하는 서열 및 제2 ITR을 포함하거나 이들로 이루어진 작제물은 폴리 A 서열을 추가로 포함한다. 일부 실시형태에서, 폴리A 서열은 bGH 서열을 포함하거나 이들로 이루어진다. 본 개시의 예시적 bGH 서열은 서열번호 81 (ctgtgccttctagttgccagccatctgttgtttgcccctcccccgtgccttccttgaccctggaaggtgccactcccactgtcctttcctaataaaatgaggaaattgcatcgcattgtctgagtaggtgtcattctattctggggggtggggtggggcaggacagcaagggggaggattgggaagacaatagcaggcatgctggggatgcggtgggctctatgg)의 서열을 포함하거나 이들로 이루어진다. 일부 실시형태에서, 상기 작제물은 5'으로부터 3' 방향으로 제1 ITR, 프로모터를 코딩하는 서열, 융합 단백질(이하, "염기 에디터")을 코딩하는 서열 또는 이의 단편, 폴리 A 서열, gRNA를 코딩하는 서열 및 제2 ITR을 포함하거나 이들로 이루어진다. 일부 실시형태에서, 상기 작제물은 5'으로부터 3' 방향으로 제1 ITR, 프로모터를 코딩하는 서열, 융합 단백질(이하, "염기 에디터")을 코딩하는 서열 또는 이의 단편, bgH 폴리A 서열, gRNA를 코딩하는 서열 및 제2 ITR을 포함하거나 이들로 이루어진다. 일부 실시형태에서, 상기 작제물은 5'으로부터 3' 방향으로 제1 AAV2 ITR, 심근 트로포닌 T 프로모터를 코딩하는 서열, 융합 단백질(이하, "염기 에디터")을 코딩하는 서열 또는 이의 단편, bgH 폴리A 서열, gRNA를 코딩하는 서열 및 제2 AAV2 ITR을 포함하거나 이들로 이루어진다. 일부 실시형태에서, 5'으로부터 3' 방향으로 제1 ITR, 프로모터를 코딩하는 서열, 융합 단백질(이하, "염기 에디터")을 코딩하는 서열 또는 이의 단편, 폴리A 서열, gRNA를 코딩하는 서열 및 제2 ITR을 포함하는 작제물은 적어도 하나의 핵 국재화 신호를 추가로 포함한다. 일부 실시형태에서, 5'으로부터 3' 방향으로 제1 ITR, 프로모터를 코딩하는 서열, 융합 단백질(이하 "염기 에디터")을 코딩하는 서열 또는 이의 단편, 폴리A 서열, gRNA를 코딩하는 서열 및 제2 ITR을 포함하는 작제물은 적어도 2개의 핵 국재화 신호를 추가로 포함한다. 본 개시의 핵 국재화 신호를 코딩하는 예시적 서열은 서열번호 43, 44 및 90 중 어느 하나를 포함하거나 이들로 이루어진다. 일부 실시형태에서, 상기 작제물은 5'으로부터 3' 방향으로 제1 ITR, 프로모터를 코딩하는 서열, 제1 핵 국재화 신호를 코딩하는 서열, 융합 단백질(이하, "염기 에디터")을 코딩하는 서열 또는 이의 단편, 폴리 A 서열, gRNA를 코딩하는 서열 및 제2 ITR을 포함하거나 이들로 이루어진다. 일부 실시형태에서, 상기 작제물은 5'으로부터 3' 방향으로 제1 ITR, 프로모터를 코딩하는 서열, 제1 핵 국재화 신호를 코딩하는 서열, 융합 단백질(이하, "염기 에디터")을 코딩하는 서열 또는 이의 단편, 제2 핵 국재화 신호를 코딩하는 서열, 폴리 A 서열, gRNA를 코딩하는 서열 및 제2 ITR을 포함하거나 이들로 이루어진다. 일부 실시형태에서, 5'으로부터 3' 방향으로 제1 ITR, 프로모터를 코딩하는 서열, 제1 핵 국재화 신호를 코딩하는 서열, 융합 단백질(이하 "염기 에디터")을 코딩하는 서열 또는 이의 단편, 제2 핵 국재화 신호를 코딩하는 서열, 폴리 A 서열, gRNA를 코딩하는 서열 및 제2 ITR을 포함하는 작제물은 정지 코돈을 추가로 포함한다. 정지 코돈은 TAG, TAA 또는 TGA의 서열을 가질 수 있다. 일부 실시형태에서, 작제물은 5'으로부터 3' 방향으로 제1 ITR, 프로모터를 코딩하는 서열, 제1 핵 국재화 신호를 코딩하는 서열, 융합 단백질(이하, "염기 에디터")을 코딩하는 서열 또는 이의 단편, 제2 핵 국재화 신호를 코딩하는 서열, 정지 코돈, 폴리 A 서열, gRNA를 코딩하는 서열 및 제2 ITR을 포함하거나 이들로 이루어진다. 일부 실시형태에서, 5'으로부터 3' 방향으로 제1 ITR, 프로모터를 코딩하는 서열, 제1 핵 국재화 신호를 코딩하는 서열, 뉴클레아제를 코딩하는 서열, 제2 핵 국재화 신호를 코딩하는 서열, 정지 코돈, 폴리 A 서열 및 제2 ITR을 포함하거나 이로 이루어지는 작제물은 조절 서열을 추가로 포함한다. 조절 서열은 번역 후 조절 요소를 코딩할 수 있다. 예를 들면, 본 개시의 예시적 조절 서열은 (WPRE-3(우드척 간염 바이러스 전사 후 조절 요소-3)을 코딩하는) 서열번호 80의 뉴클레오티드 서열을 포함하거나 이들로 이루어진다. 일부 실시형태에서, 상기 작제물은 5'으로부터 3' 방향으로 제1 ITR, 프로모터를 코딩하는 서열, 제1 핵 국재화 신호를 코딩하는 서열, 융합 단백질(이하 "염기 에디터")을 코딩하는 서열 또는 이의 단편, 제2 핵 국재화 신호를 코딩하는 서열, 정지 코돈, 조절 요소(예를 들면, 서열번호 80)를 코딩하는 서열, 폴리 A 서열, gRNA를 코딩하는 서열 및 제2 ITR을 포함하거나 이들로 이루어진다. 일부 실시형태에서, 5'으로부터 3' 방향으로 제1 ITR, 프로모터를 코딩하는 서열, 제1 핵 국재화 신호를 코딩하는 서열, 융합 단백질(이하 "염기 에디터")을 코딩하는 서열 또는 이의 단편, 제2 핵 국재화 신호를 코딩하는 서열, 정지 코돈, 조절 서열, 폴리 A 서열, gRNA를 코딩하는 서열 및 제2 ITR을 포함하거나 이로 이루어지는 작제물은 하나 이상의 gRNA 스캐폴드 서열을 추가로 포함할 수 있다. 적합한 gRNA 스캐폴드 서열에는 서열번호 82, 84, 165 및/또는 166 중 어느 하나가 포함될 수 있다.
서열번호 82:
GAGGGCCTATTTCCCATGATTCCTTCATATTTGCATATACGATACAAGGCTGTTAGAGAGATAATTAGAATTAATTTGACTGTAAACACAAAGATATTAGTACAAAATACGTGACGTAGAAAGTAATAATTTCTTGGGTAGTTTGCAGTTTTAAAATTATGTTTTAAAATGGACTATCATATGCTTACCGTAACTTGAAAGTATTTCGATTTCTTGGCTTTATATATCTTGTGGAAAGGACGAAACACCG 
서열번호 84:
GCTTAAGAGCTATGCTGAAACAGCATAGCAAGTTTAAGTAAGTAAGGCTAGTCCGTTATCACTTGAAAAAGTGGCACCGAGTCGTTGC
서열번호 165:
GTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGC
서열번호 166:
GTTTAAGAGCTATGCTGGAACAGCATAGCAAGTTTAAATAAGGCTAGTCCGTTATCACTTGAAAAAGTGGCACCAGAGTCGTTTGCTTTT
따라서, 일부 실시형태에서, 상기 작제물은 5'으로부터 3' 방향으로 제1 ITR, 프로모터를 코딩하는 서열, 제1 핵 국재화 신호를 코딩하는 서열, 융합 단백질(이하 "염기 에디터")을 코딩하는 서열 또는 이의 단편, 제2 핵 국재화 신호를 코딩하는 서열, 정지 코돈, 조절 서열, 폴리 A 서열, 제1 gRNA 스캐폴드 서열을 코딩하는 서열, gRNA를 코딩하는 서열, 제2 gRNA 스캐폴드 서열을 코딩하는 서열 및 제2 ITR을 포함하거나 이들로 이루어진다.
일부 실시형태에서, 작제물은 하나 이상의 스페이서 서열을 추가로 포함할 수 있다. 본 개시의 예시적 스페이서 서열은 1 내지 1500 뉴클레오티드(그 사이의 모든 범위를 포함)의 길이를 갖는다. 일부 실시형태에서, 스페이서 서열은 ITR, 프로모터, 핵 국재화 서열, 융합 단백질을 코딩하는 서열(이하 "염기 에디터"), 정지 코돈, 폴리A 서열, gRNA 스캐폴드, gRNA를 코딩하는 핵산 및/또는 조절 요소의 5'측 또는 3'측의 어느 하나에 위치할 수 있다.
본 개시에 따라, gRNA 및/또는 융합 단백질(염기 에디터) 또는 이의 단편을 코딩하는 핵산 중 하나 이상을 포함하는 예시적 바이러스 벡터가 제공된다. 또한, 본원에 기재된 융합 단백질의 제1 단편을 코딩하는 제1 바이러스 벡터 및 융합 단백질의 제2 단편을 코딩하는 제2 바이러스 벡터를 포함하는 한 쌍의 바이러스 벡터가 제공되고, 여기서 제1 및 제2 단편은 번역 후 스플라이싱을 통해 세포 내에서 재조합되어 기능성 융합 단백질을 형성할 수 있다(상기한 바와 같이). 2개의 예시적 벡터가 주요 성분과 함께 하기 표 9 및 10에 기재되어 있다.
[표 9]
[표 10]
일부 양상에서, 상기 표에 제공된 각 AAV 벡터는 ABEmax-VRQR의 N-말단 절반(서열번호 69) 또는 C-말단 절반(서열번호 70) 중 어느 하나를 발현한다. 2개 단백질 절반이 접촉하면, 단백질 트랜스-스플라이싱을 거쳐 완전한 단백질을 형성한다. 서열번호 69 및 70은 하기 표 12에 제공되어 있다. 각 서열에는 밑줄로 표시된 "NPU 인테인 단편"을 갖는다(서열번호 153 및 154). 이 단편은 최종 단백질 작제물로부터 제거되어 완전한 융합 단백질을 형성한다.
[표 12]
일부 실시형태에서, 본원에 개시된 AAV 벡터는 표적 세포에서 도입유전자 발현을 위한 게놈의 전달에 사용될 수 있는 바이러스 입자로 패키징될 수 있다. 일부 실시형태에서, 본원에 개시된 AAV 벡터는 일시적 형질감염, 생산자 세포주의 사용, Ad-AAV 하이브리드에 바이러스 특징의 조합, 헤르페스 바이러스 시스템의 사용, 또는 바큘로바이러스를 사용한 곤충 세포에서의 생산에 의해 입자에 패키징될 수 있다. 
일부 실시형태에서, 본 발명의 패키징 세포를 생성하는 방법은 AAV 입자 생산에 필요한 모든 성분을 안정적으로 발현하는 세포주를 생성하는 것을 포함한다. 예를 들면, AAV rep 및 cap 유전자를 결여하는 rAAV 게놈, rAAV 게놈으로부터 분리된 AAV rep 및 cap 유전자, 네오마이신 내성 유전자와 같은 선택 가능한 마커를 포함하는 플라스미드(또는 복수의 플라스미드)가 세포의 게놈에 통합된다. AAV 게놈은 GC 테일링[참조: Samulski et al., 1982, Proc. Natl. Acad. S6. USA, 79:2077-2081], 제한 엔도뉴클레아제 절단 부위를 함유하는 합성 링커의 부가[참조: Laughlin et al., 1983, Gene, 23:65-73] 또는 직접 블런트-말단 결찰[참조: Senapathy & Carter, 1984, J. Biol. Chem., 259:4661-4666] 등의 절차에 의해 세균 플라스미드로 도입되어 왔다. 이어서, 패키징 세포주를 아데노바이러스와 같은 헬퍼 바이러스에 감염시킨다. 이 방법의 이점은 세포를 선택할 수 있고 rAAV의 대량 생산에 적합하다는 것이다. 적합한 방법의 다른 예는 플라스미드 대신에 아데노바이러스 또는 바큘로바이러스를 사용하여 패키징 세포에 rAAV 게놈 및/또는 rep 및 cap 유전자를 도입한다.
일부 실시형태에서, 숙주 세포는 본원에 기재된 바와 같이 하나 이상의 벡터, 선형 폴리뉴클레오티드, 폴리펩티드, 핵산-단백질 복합체 또는 이들의 임의의 조합으로 일시적 또는 비일시적으로 형질감염시킨다. 일부 실시형태에서, 세포는 시험관내, 배양 중 또는 생체외에서 형질감염시킬 수 있다. 일부 실시형태에서, 세포는 대상체 내에서 자연적으로 발생하는 바와 같이 형질감염시킬 수 있다. 일부 실시형태에서, 형질감염된 세포는 대상체로부터 채취될 수 있다. 일부 실시형태에서, 세포는 세포주와 같이 대상체로부터 채취한 세포로부터 유래한다.
일부 실시형태에서, 본원에 기재된 바와 같이 하나 이상의 벡터, 선형 폴리뉴클레오티드, 폴리펩티드, 핵산-단백질 복합체 또는 이들의 임의의 조합으로 형질감염된 세포는 신규 세포주를 확립하기 위해 사용될 수 있으며, 하나 이상의 형질감염-유래 서열을 포함할 수 있다. 일부 실시형태에서, 본원에 기재된 조작된 핵산-가이드 뉴클레아제 시스템의 성분으로 일시적으로 형질감염되고(예를 들면, 하나 이상의 벡터의 일시적 형질감염 또는 RNA의 형질감염에 의해) 조작된 뉴클레아제 복합체의 활성을 통해 변형된 세포는 신규 세포주를 확립하기 위해 사용될 수 있으며, 변형을 함유할 수 있지만 다른 외인성 서열을 결여하는 세포를 포함할 수 있다.
본원에 개시된 일부 실시형태는 본원에 개시된 CRISPR-Cas9 시스템의 용도와 관련되고, 예를 들면, 유전자를 표적으로 하여 녹-아웃(knock out)하거나, 유전자를 증폭시키고/시키거나, DNA 반복 불안정성 및 의학적 장애와 관련된 특정 돌연변이를 복구하기 위해 사용될 수 있다. 일부 실시형태에서, 본원에 개시된 CRISPR-Cas9 시스템은 이러한 게놈 불안정성의 결함을 이용하고 수정하기 위해 사용될 수 있다. 다른 실시형태에서, 본원에 개시된 CRISPR-Cas9 시스템은 심근증과 관련된 유전자의 결함을 수정하기 위해 사용될 수 있다. 
C. 약제학적 성분
본원에 개시된 AAV 바이러스 입자, AAV 벡터, 폴리뉴클레오티드, 또는 폴리뉴클레오티드를 코딩하는 벡터 중 어느 것이라도 약제학적 조성물로 제형화될 수 있다. 일부 실시형태에서, 약제학적 조성물은 약제학적으로 허용되는 하나 이상의 담체, 희석제 또는 부형제를 추가로 포함할 수 있다. 본 방법에서 사용되는 임의의 약제학적 조성물은 동결건조된 제형 또는 수용액의 형태로 약제학적으로 허용되는 담체, 부형제 또는 안정제를 포함할 수 있다.  
약제학적 조성물 중의 담체는 조성물의 활성 성분과 상용성이고, 바람직하게는 활성 성분을 안정화할 수 있으며 치료 대상체에게 유해하지 않다는 의미에서 "허용되는" 것이어야 한다. 예를 들면, "약제학적으로 허용되는"은 생리학적으로 허용되고 포유동물(예: 인간)에게 투여되는 경우에 통상 바람직하지 않은 반응을 생성하지 않는 것을 포함하는 조성물의 분자 실체 및 기타 성분을 지칭할 수 있다.  일부 예에서, 본원에 개시된 약제학적 조성물에 사용되는 "약제학적으로 허용되는" 담체는 연방 또는 주 정부의 규제 기관에 의해 승인되거나, 포유동물, 및 보다 특히 인간에서 사용하기 위해 미국 약전 또는 기타 일반적으로 인정되는 약전에 등재된 것들일 수 있다.     
완충제를 포함한 약제학적으로 허용되는 담체는 당해 기술분야에 널리 공지되어 있으며, 포스페이트, 시트레이트, 및 기타 유기산; 아스코르브산 및 메티오닌을 포함한 항산화제; 보존제; 저분자량 폴리펩티드; 혈청 알부민, 젤라틴 또는 면역글로불린과 같은 단백질; 아미노산; 소수성 고분자; 단당류; 이당류 및 기타 탄수화물; 금속 착체; 및/또는 비이온성 계면활성제를 포함할 수 있다[참조: 예를 들면, Remington: The Science and Practice of Pharmacy 20th Ed. (2000) Lippincott Williams and Wilkins, Ed. K. E. Hoover].
일부 실시형태에서, 약제학적 조성물 또는 제형은 피하, 근육내, 정맥내, 복강내, 심장내, 관절내 또는 해면체내 주사에 의한 투여용일 수 있다. 일부 실시형태에서, 약제학적 조성물 또는 제형은 정맥내, 뇌실내 주사, 방실내 주사, 실질내 주사, 복강내, 심장내, 관절내 또는 해면체내 주사 또는 이들의 조합과 같은 비경구 투여용이다. 이러한 약제학적으로 허용되는 담체는 석유, 동물성, 식물성 또는 합성 기원, 예컨대, 땅콩유, 대두유, 광유 등을 포함하여 물 및 오일과 같은 멸균 액체일 수 있다. 생리식염수 용액 및 수용성 덱스트로스, 폴리에틸렌 글리콜(PEG) 및 글리세롤 용액도 또한 특히 주사용 용액의 액체 담체로서 사용될 수 있다. 본원에 개시된 약제학적 조성물은 추가 성분, 예를 들면, 방부제, 완충제, 강장제, 항산화제 및 안정제, 비이온성 습윤제 또는 청징제, 점도 증가제 등을 추가로 포함할 수 있다. 본원에 기재된 약제학적 조성물은 단일 단위 용량 또는 복수회 용량 형태로 패키징될 수 있다. 
비경구 투여에 적합한 제형에는 항산화제, 완충제, 정균제 및 용질을 함유하여 제형을 의도된 수용자의 혈액과 등장성으로 되게 하는 수성 및 비수성 멸균 주사액; 현탁제 및 증점제를 포함할 수 있는 수성 및 비수성 멸균 현탁액이 포함된다. 수용액은 적절히 완충될 수 있다(바람직하게는 3 내지 9의 pH로). 멸균 조건하에서 적절한 비경구 제형의 제조는 당업자에게 널리 공지된 표준 제약 기술에 의해 용이하게 수행된다.
생체내 투여에 사용되는 약제학적 조성물은 멸균성이어야 한다. 이는, 예를 들면, 멸균 여과막을 통한 여과에 의해 용이하게 달성할 수 있다. 멸균 주사용 용액은 일반적으로, 필요에 따라, 상기 열거된 다양한 기타 성분과 함께 적절한 용매에 필요한 양의 AAV 입자를 도입하고, 이어서 여과 멸균함으로써 제조된다. 일반적으로, 분산액은 멸균된 활성 성분을, 기본 분산 매체 및 상기 열거된 것들 중 필요한 기타 성분을 함유하는 멸균 비히클에 도입하여 제조한다. 멸균 주사용 용액의 제조를 위한 멸균 분말의 경우, 바람직한 제조 방법은 활성 성분과, 사전에 멸균 여과된 용액으로부터 임의의 원하는 추가 성분의 분말을 생성하는 진공 건조 및 동결-건조 기술이다. 
본원에 개시된 약제학적 조성물은 희석제 및 보조제와 같은 기타 성분을 포함할 수도 있다. 허용되는 담체, 희석제 및 보조제는 수용자에 대해 무독성이고, 사용되는 용량 및 농도에서 불활성인 것이 바람직하며, 포스페이트, 시트레이트 또는 기타 유기 산과 같은 완충제; 아스코르브산과 같은 항산화제; 저분자량 폴리펩티드; 혈청 알부민, 젤라틴 또는 면역글로불린과 같은 단백질; 폴리비닐피롤리돈과 같은 친수성 고분자; 글리신, 글루타민, 아스파라긴, 아르기닌 또는 라이신과 같은 아미노산; 단당류, 이당류, 및 글루코스, 만노스 또는 덱스트린을 포함한 기타 탄수화물; EDTA와 같은 킬레이트제; 만니톨 또는 솔비톨과 같은 당 알코올; 나트륨과 같은 염-형성 대이온 및/또는 트윈(Tween), 플루로닉 또는 폴리에틸렌 글리콜과 같은 비이온성 계면활성제를 포함한다.
D. 유전자-편집 생물 - 모델 시스템
본 개시의 추가 양상은 본원에 제공된 유전자 편집 기술 및 조성물을 시험하기 위해 사용될 수 있는 유전자 편집 생물(예를 들면, 포유동물 생물)에 관한 것이다. 예를 들면, 한 가지 양상에서, 본원의 유전자 편집 조성물은 일반적으로 심근증과 관련된 유전자 돌연변이를 수정하기 위해 인간 유전자의 돌연변이 부위에서 염기 편집을 수행하기 위한 니카제 및 데아미나제의 융합 단백질 및 gRNA를 포함한다. 그러나, 대응 뮤린 유전자(MYH6)가 인간 유전자(MYH7)와 상이하고, 뮤린 MYH6 및 인간 MYH7에 동등한 돌연변이가 존재하지 않기 때문에 이 전략을 시험하기에 적합한 마우스 모델은 존재하지 않는다. 이는, 인간 MYH7 유전자에 최적화된 CRISPR 유전자 편집 시스템이 뮤린 MYH6 유전자에는 영향을 미치지 않을 수 있음을 의미한다. 
따라서, 본 개시의 추가의 양상에 따라, 유전자 편집 마우스가 제공되며, 상기 마우스는 인간화 돌연변이 Myh6 대립유전자를 형성하기 위해 내인성 뮤린 Myh6 유전자 내에 삽입된 MYH7 c.1208 G>A(p.R403Q) 인간 미스센스 돌연변이를 포함하는 인간 핵산을 포함한다. 일부 양상에서, 인간 핵산은 미스센스 돌연변이에 인접하고 상류에 있는 제1 폴리뉴클레오티드 및 미스센스 돌연변이에 인접하고 하류에 있는 제2 폴리뉴클레오티드를 추가로 포함한다. 예를 들면, 일부 양상에서, 제1 폴리뉴클레오티드는 약 30 내지 75개 뉴클레오티드, 약 35 내지 약 70개 뉴클레오티드, 약 40 내지 약 65개 뉴클레오티드, 또는 약 45 내지 약 60개 뉴클레오티드를 포함한다. 예를 들면, 제1 폴리뉴클레오티드는 약 55개 뉴클레오티드를 포함할 수 있다. 다른 양상에서, 제2 폴리뉴클레오티드는 약 10 내지 30개 뉴클레오티드, 약 15 내지 25개 뉴클레오티드, 또는 약 20 내지 25개 뉴클레오티드를 포함할 수 있다. 예를 들면, 제2 폴리뉴클레오티드는 21개 뉴클레오티드를 포함하거나 이들로 이루어질 수 있다. 내인성 Myh6 유전자에 삽입될 수 있는 예시적 인간 핵산은 하기 표에 기재되어 있다. 또한, 천연 MyH6 대립유전자도 제공된다. 표 13에 제시된 바와 같이, 인간화 핵산은 MYH7 유전자의 동등 부분과 동일하며, 뮤린 MyH6 유전자에 대한 치환을 포함한다(밑줄). 미스센스 돌연변이는 볼드체 및 밑줄로 표시되어 있다. 서열번호 158(표 14C)은 G>A 돌연변이를 포함하는 임의의 인간화 대립유전자를 제공하며, 여기서 뉴클레오티드 N1 내지 N6은 천연 마우스 뉴클레오티드 또는 인간화 뉴클레오티드로부터 선택될 수 있다. 다양한 양상에서, 인간화 돌연변이 Myh6 대립유전자는 천연 Myh6 대립유전자(서열번호 99 또는 서열번호 163)에 대하여 서열번호 158에 따라 적어도 1, 적어도 2, 적어도 3, 적어도 4, 적어도 5 또는 적어도 6개의 돌연변이를 포함한다. 표 14A 내지 14C는 전체 뮤린 및 인간 돌연변이체 및 야생형 MYH6 및 MYH7 단백질 서열(표 14A), 전체 인간 및 뮤린 돌연변이체 및 야생형 유전자 전사물(cDNA 서열)(표 14B), 및 Myh6 대립유전자 주변의 임의의 인간화 돌연변이를 커버하는 추가 서열(표 14C)을 추가로 제공한다. 
다양한 양상에서, 유전자 편집 마우스의 적어도 1개 세포는 서열번호 94를 포함하는 야생형 미오신 단백질에 대해 R404Q 치환을 포함하는 돌연변이체 미오신 단백질을 발현한다. 참조를 용이하게 하기 위해, 표 14는 천연 Myh6 단백질(마우스), 천연 인간 Myh7 단백질, 및 상기한 인간화 Myh6 대립유전자에 의해 발현되는 돌연변이체 Myh6 단백질의 서열을 제공한다. 따라서, 다양한 양상에서, 유전자 편집 마우스의 적어도 1개 세포는 서열번호 96을 포함하는 돌연변이체 미오신 단백질을 발현한다. 일부 양상에서, 마우스는 돌연변이체 Myh6 대립유전자에 대해 이형접합성이고, 야생형 Myh6 대립유전자를 추가로 포함한다.  
[표 13]
[표 14A]
[표 14B]
[표 14C]
유전자 편집 마우스는 당해 기술분야 공지된 방법에 따라 생성될 수 있다. 일부 양상에서, 유전자 편집 마우스는 당해 기술분야에 기재된 프로토콜에 따라 Cas9 mRNA(50ng/μL)(서열번호 94, IDT), sgRNA(20ng/μL)(서열번호 93, IDT) 및 ssODN 공여자 주형(15ng/μL)(서열번호 92, IDT)을 접합자에 미세주입하여 생성된다[참조: 예를 들면, H. Miura, R. M. Quadros, C. B. Gurumurthy, M. Ohtsuka, 긴 ssDNA 공여자를 사용하여 녹-인(knock-in) 및 조건부 녹아웃(knockout) 마우스 모델을 생성하기 위한 Easi-CRISPR. Nat Protoc 13, 195-215 (2018, 이의 전체는 참조에 의해 본원에 도입됨)]. 하기 표 15는 본원에서 유전자 편집 마우스를 생성하기 위해 이들 방법에 따라 사용될 수 있는 Cas9 mRNA, sgRNA 및 ssODN 공여자 주형의 예시적 핵산을 제공한다. 
[표 15]
III. 방법
다양한 양상에서, 세포에서 MYH7 유전자의 돌연변이를 수정하는 방법이 제공되며, 이 방법은 Cas9 니카제 또는 비활성화된 Cas9 엔도뉴클레아제, 데아미나제, 및 서열번호 1 또는 2 중 어느 하나로부터 선택된 DNA 뉴클레오티드 서열을 표적화하는 gRNA, 또는 Cas9 니카제 또는 비활성화된 Cas9 엔도뉴클레아제, 데아미나제 및/또는 gRNA를 코딩하는 하나 이상의 핵산을 세포에 전달하여, MYH7 유전자 내 또는 그 근방에서 적어도 뉴클레오티드의 하나 이상의 돌연변이를 초래하는 MYH7 유전자 내 또는 그 근방에서 하나 이상의 단일-가닥 전달(SSB)을 수행함으로써 MYH7 유전자의 돌연변이를 수정하는 단계를 포함한다. 다양한 양상에서, 이 방법은 본원에 기재된 융합 단백질 및/또는 gRNA를 코딩하는 핵산을 세포에 전달하는 것을 포함할 수 있다. 핵산은 바이러스 벡터로 전달될 수 있다. 일부 양상에서, 핵산은 2개의 바이러스 벡터(예를 들면, 상기 표 12 및 13에 기재된 벡터)로 전달될 수 있다. 
다른 양상에서, 이를 필요로 하는 대상체에서 MYH7 유전자의 돌연변이에 의해 유발된 심근증을 치료하는 방법이 제공되며, 상기 방법은 MYH7 유전자를 발현하는 대상체에서 적어도 하나의 세포에 Cas9 니카제 또는 비활성화된 Cas9 엔도뉴클레아제, 데아미나제 및 서열번호 1 또는 2 중 어느 하나로부터 선택된 DNA 뉴클레오티드 서열을 표적화하는 gRNA, 또는 RNA-가이드 니카제, 데아미나제 및/또는 gRNA를 코딩하는 하나 이상의 핵산을 전달하여, MYH7 유전자 내 또는 그 근방에서 적어도 하나의 뉴클레오티드의 하나 이상의 돌연변이를 초래하는 MYH7 유전자 내 또는 그 근방에서 하나 이상의 단일-가닥 절단(SSB)을 수행함으로써 대상체의 적어도 하나의 세포에서 MYH7 유전자의 돌연변이를 수정하는 단계를 포함한다. 다양한 양상에서, RNA-가이드 니카제, 데아미나제 및 gRNA는 본원에 기재된 임의의 약제학적 조성물에서 전달될 수 있다. 일부 양상에서, Cas9 니카제/비활성화된 Cas9 엔도뉴클레아제 및 데아미나제는 융합 단백질(예를 들면, 본원에 기재된 임의의 융합 단백질)로서 전달된다. 다양한 양상에서, 이 방법은 융합 단백질 및/또는 gRNA를 코딩하는 하나 이상의 바이러스 벡터를 대상체에게 투여하는 것을 포함한다.
다양한 양상에서, 이러한 방법 중 어느 하나에 의해 수정된 MYH7 유전자의 돌연변이는 돌연변이된 MYH7 유전자에 의해 코딩된 단백질 생성물에서 단일 아미노산 치환을 초래하는 하나 이상의 단일 뉴클레오티드 다형성을 포함한다. 일부 경우, 단백질 생성물은 미오신 단백질 또는 펩티드이며, 단일 아미노 치환은 서열번호 96에 따라 R403Q를 포함한다. 
다양한 실시형태에서, 본원에 개시된 조성물은 필요로 하는 대상체에게 투여한 후에 심장 질환의 치료에 효과적일 수 있다. 다른 실시형태에서, 본원에 개시된 조성물은 필요로 하는 대상체에게 투여한 후에 하나 이상의 심근증의 치료에 효과적일 수 있다. 다른 실시형태에서, 본원에 개시된 조성물은 필요로 하는 대상체에게 투여한 후에 HCM의 치료에 효과적일 수 있다. 다른 실시형태에서, 본원에 개시된 조성물은 필요로 하는 대상체에게 투여한 후에 적어도 하나의 HCM 증상의 개선에 효과적일 수 있다. 
본원에서 적합한 대상체는 인간, 가축 동물, 반려 동물, 실험 동물, 또는 동물원 동물을 포함한다. 일부 실시형태에서, 대상체는 설치류, 예를 들면, 마우스, 랫트, 기니 피그 등일 수 있다. 일부 실시형태에서, 대상체는 가축 동물일 수 있다. 적합한 가축 동물의 비제한적 예에는 돼지, 소, 말, 염소, 양, 라마 및 알파카가 포함될 수 있다. 일부 실시형태에서, 대상체는 반려 동물일 수 있다. 반려 동물의 비제한적 예에는 개, 고양이, 래빗 및 새와 같은 애완동물이 포함될 수 있다. 또 다른 실시형태에서, 대상체는 동물원 동물일 수 있다. 본원에서 사용되는 바와 같이, "동물원 동물"은 동물원에서 볼 수 있는 동물을 지칭한다. 이러한 동물에는 비-인간 영장류, 대형 고양이, 늑대 및 곰이 포함될 수 있다. 특정 실시형태에서, 동물은 실험 동물이다. 실험 동물의 비제한적 예에는 설치류, 개과, 고양이과 및 비인간 영장류가 포함될 수 있다. 특정 실시형태에서, 동물은 설치류이다.  설치류의 비제한적 예에는 마우스, 랫트, 기니 피그 등이 포함될 수 있다. 바람직한 실시형태에서, 대상체는 인간이다.
다양한 실시형태에서, 필요로 하는 대상체는 적어도 하나의 심장 질환으로 진단되었을 수 있다. 일부 양상에서, 대상체는 하나 이상의 심근증을 가질 수 있다. 일부 실시형태에서, 대상체는 HCM을 가질 수 있다. 일부 실시형태에서, 대상체는 적어도 하나의 HCM 증상을 가질 수 있다. 일부 양상에서, HCM의 증상은 피로일 수 있다. 일부 실시형태에서, HCM의 증상은 호흡곤란(dyspnea)일 수 있다. 일부 실시형태에서, HCM의 증상은 부종(edema)일 수 있다. 일부 실시형태에서, HCM의 증상은 복수(ascites)일 수 있다. 일부 실시형태에서, HCM의 증상은 흉통(chest pain)일 수 있다. 또 다른 양상에서, HCM의 증상은 심잡음(heart murmur)일 수 있다. 
일부 실시형태에서, 본원에 개시된 조성물의 투여 방법은 동일한 질환 상태 및 예측된 결과를 갖는 미치료 대상체의 심근증-유도 심장 섬유증과 비교하여 심근증-유발 심장 섬유증을 감소 및/또는 역전시킬 수 있다. 일부 실시형태에서, 본원에 개시된 조성물의 투여 방법은 동일한 질환 상태 및 예측된 결과를 갖는 미치료 대상체에서 심근증-유도 좌심실 확장과 비교하여 심근증-유도 좌심실 확장을 감소 및/또는 역전시킬 수 있다.  
본 개시의 다른 실시형태는 필요로 하는 대상체에게 본원에 개시된 조성물을 투여하는 방법이고, 여기서 투여는 심근증(예를 들면, HCM)을 치료한다. 본 개시의 다른 실시형태는 필요로 하는 대상체에게 본원에 개시된 조성물을 투여하는 방법이고, 여기서 심근증(예를 들면, HCM)의 적어도 하나의 증상이 투여 후 1개월 이내에 적어도 25% 개선된다. 
다양한 실시형태에서, 본원에 개시된 조성물은 비경구 투여에 의해 투여될 수 있다. 본원에서 사용되는 바와 같이, "비경구 투여에 의한"은 소화관 이외의 경로를 통한 본원에 개시된 조성물의 투여를 지칭한다. 일부 실시형태에서, 본원에 개시된 조성물은 비경구 주사에 의해 투여될 수 있다. 일부 양상에서, 비경구 주사에 의한 개시된 조성물의 투여는 피하, 근육내, 정맥내, 복강내, 심장내, 관절내 또는 해면체내 주사에 의한 것일 수 있다. 일부 실시형태에서, 비경구 주사에 의한 개시된 조성물의 투여는 당해 기술분야에서 공지된 지연 방법 또는 볼러스 방법에 의한 것일 수 있다. 일부 실시형태에서, 비경구 주사에 의한 투여 경로는 표적 위치에 의해 결정될 수 있다. 일부 실시형태에서, 본원에 개시된 조성물은 심장내 주사에 의한 비경구 투여를 위해 제형화될 수 있다. 일부 실시형태에서, 본원에 개시된 조성물은 카테터-기반 관상동맥내 주입에 의한 비경구 투여를 위해 제형화될 수 있다. 일부 실시형태에서, 본원에 개시된 조성물은 심낭 주사에 의한 비경구 투여를 위해 제형화될 수 있다.
다양한 실시형태에서, 본원에 개시된 조성물의 투여 용량은 특별히 제한되지 않으며, 예방 및/또는 치료의 목적, 질환의 종류, 대상체의 체중 또는 연령, 질환의 중증도 등과 같은 조건에 따라 적절히 선택될 수 있다. 일부 실시형태에서, 본원에 개시된 조성물의 용량의 투여는 본원에 개시된 조성물의 치료학적 유효량을 포함할 수 있다. 본원에서 사용되는 바와 같이, "치료학적 유효"라는 용어는 심장 질환을 치료하거나, 심장 질환과 관련된 적어도 하나의 증상의 발현을 감소시키거나, 심장 섬유화를 역전/예방하거나, 적어도 하나의 심장 심실의 확장을 역전/예방하거나, 총 심장 중량을 감소시키거나, 심장 기능을 개선시키거나, 생존능을 증가시키거나, 또는 이들의 조합을 나타내는 투여된 조성물의 양을 지칭한다.  
일부 실시형태에서, 본원에 개시된 조성물은 이를 필요로 하는 대상체에게 1회 투여될 수 있다. 일부 실시형태에서, 본원에 개시된 조성물은 이를 필요로 하는 대상체에게 1회 이상 투여될 수 있다. 일부 실시형태에서, 본원에 개시된 조성물의 제1 투여 후에, 본원에 개시된 조성물의 제2 투여가 이어질 수 있다. 일부 실시형태에서, 본원에 개시된 조성물의 제1 투여 후에, 본원에 개시된 조성물의 제2 및 제3 투여가 이어질 수 있다. 일부 실시형태에서, 본원에 개시된 조성물의 제1 투여 후에, 본원에 개시된 조성물의 제2, 제3 및 제4 투여가 이어질 수 있다. 일부 실시형태에서, 본원에 개시된 조성물의 제1 투여 후에, 본원에 개시된 조성물의 제2, 제3, 제4, 및 제5 투여가 이어질 수 있다.  
필요로 하는 대상체에게 조성물을 투여할 수 있는 횟수는 의료 전문가의 재량, 심장 질환의 중증도, 및 제형에 대한 대상체의 반응에 의존할 수 있다. 일부 실시형태에서, 본원에 개시된 조성물은 연속적으로 투여될 수 있거나; 또는 투여되는 조성물의 용량을 일시적으로 감소시키거나 특정 기간 동안 일시적으로 중지할 수 있다(즉, "조성물 휴약"). 일부 양상에서, 조성물 휴약 기간은 2일 내지 1년에서 다양할 수 있으며, 예를 들면, 2일, 1주, 1개월, 6개월 및 1년을 포함할 수 있다. 또 다른 양상에서, 조성물 휴약 중의 용량 감소는 10% 내지 100%일 수 있으며, 예를 들면, 10%, 25%, 50%, 75% 및 100%가 포함될 수 있다.
다양한 실시형태에서, 본원에 개시된 조성물의 원하는 1일 용량은 단일 투여량으로 또는 동시에(또는 단기간에 걸쳐) 또는 적절한 간격으로 투여되는 분할 용량으로 제공될 수 있다. 다른 실시형태에서, 본원에 개시된 조성물의 투여는 약 1일 1회, 약 1일 2회, 약 1일 3회 대상체에게 투여될 수 있다. 다른 실시형태에서, 본원에 개시된 조성물의 투여는 적어도 1일 1회, 약 2일 동안 적어도 1일 1회, 약 3일 동안 적어도 1일 1회, 약 4일 동안 적어도 1일 1회, 약 5일 동안 적어도 1일 1회, 약 6일 동안 적어도 1일 1회, 약 1주일 동안 적어도 1일 1회, 약 2주 동안 적어도 1일 1회, 약 3주 동안 적어도 1일 1회, 약 4주 동안 적어도 1일 1회, 약 8주 동안 적어도 1일 1회, 약 12주 동안 적어도 1일 1회, 약 16주 동안 적어도 1일 1회, 약 24주 동안 적어도 1일 1회, 약 52주 동안 및 그 이후에 적어도 1일 1회 대상체에게 투여될 수 있다. 바람직한 실시형태에서, 본원에 개시된 조성물의 투여는 약 4주에 1회 대상체에게 투여될 수 있다. 
일부 실시형태에서, 개시된 조성물은 초기에 투여된 후, 하나 이상의 상이한 조성물 또는 치료 섭생의 후속 투여가 이어질 수 있다. 다른 실시형태에서, 개시된 조성물은 하나 이상의 상이한 조성물 또는 치료 섭생의 투여 후에 투여될 수 있다.  
IV. 키트
본 개시의 일부 실시형태는 본원에 개시된 CRISPR-Cas9 시스템 및/또는 신규 gRNA 또는 본원에 개시된 공지 gRNA를 패키징 및 수송하기 위한 키트를 포함하며, 적어도 하나의 용기를 추가로 포함한다.
일부 실시형태에서, 키트는 본원에 기재된 방법 중 임의의 방법에서 CRISPR-Cas9 시스템, gRNA 및/또는 AAV 입자를 사용하기 위한 지침을 추가로 포함할 수 있다. 포함된 지침은 대상체에서 의도된 활성을 달성하기 위해 본원에 개시된 약제학적 조성물을 대상체에게 투여하는 것에 대한 설명을 포함할 수 있다. 키트는 대상체가 치료를 필요로 하는지 여부를 식별하는 것에 기초하여 치료에 적합한 대상체를 선택하는 것에 대한 설명을 추가로 포함할 수 있다. 일부 실시형태에서, 지침은 심근증을 갖고 있거나 갖는 것으로 의심되는 대상체에게 본원에 개시된 약제학적 조성물을 투여하는 것에 대한 설명을 포함할 수 있다. 
명백한 바와 같이, 본 시스템은 관심 있는 임의의 폴리뉴클레오티드 서열을 표적으로 하기 위해 사용될 수 있을 것으로 예상된다. 본 시스템을 사용하여 완전히 치료하기 위해 사용될 수 있는 상태 또는 질환의 일부 예는 본 발명의 도면 및 표에 포함되어 있고, 현재 이러한 질환과 관련된 유전자의 예도 본원에 제공되어 있다. 그러나, 예시된 유전자들이 완전한 것은 아니다. 본 개시의 추가 목적, 이점 및 신규 특징들은 본 개시에 비추어 하기 실시예를 검토함으로써 당업자에게 명백해질 것이다. 하기 실시예들은 본 발명을 제한하기 위한 것이 아니다.
*******
몇몇 실시형태를 기재하였지만, 당업자에게는 본 발명 개념의 정신을 벗어나지 않으면서 다양한 수정, 대체 구성 및 등가물이 사용될 수 있음을 인식할 수 있을 것이다. 추가로, 본 발명 개념을 불필요하게 모호하게 하는 것을 피하기 위해 다수의 널리 공지된 프로세스 및 요소는 기재되지 않았다. 따라서, 이러한 기재는 본 발명 개념의 범위를 제한하는 것으로 간주되어서는 안 된다.
당업자는 현재 개시된 실시형태들이 제한이 아닌 예시에 의해 교시한다는 것을 이해할 것이다. 따라서, 이 기재에 포함되거나 첨부된 도면에 도시된 사항은 예시적인 것으로 해석되어야 하며 제한적 의미로 해석되어서는 안 된다. 하기 청구범위는 본원에 기재된 모든 일반적 및 구체적 특징뿐만 아니라, 언어의 문제로서 그 사이에 속한다고 할 수 있는 방법 및 조립의 범위에 대한 모든 진술을 포함하도록 의도되었다. 
실시예
하기 실시예들은 본 개시의 바람직한 실시형태를 입증하기 위해 포함된다. 당업자는 하기 실시예들에 개시된 기술들이 본 개시의 실시에서 양호하게 기능하도록 발명자에 의해 발견된 기술들을 나타내며, 따라서 이의 실시를 위한 바람직한 모드를 구성하는 것으로 간주될 수 있음을 인식할 것이다. 그러나, 당업자는 본 개시에 비추어 개시되는 특정 실시형태에서 다수의 변경이 이루어질 수 있고 본 개시의 정신 및 범위를 벗어나지 않으면서도 여전히 유사하거나 유사한 결과를 수득할 수 있음을 인식해야 한다.
실시예 1.  
예시적 방법에서, CRISPR-Cas9가 인간 세포의 MYH7 돌연변이의 수정에 사용되었다. 간단히 말하면, 이 예시적 연구에서는 MYH7 c.1208G>A(p.R403Q) 돌연변이(Mut)를 함유하는 환자-유래 유도 다능성 줄기 세포(iPSC)를 사용했다. MYH7 p.R403Q 돌연변이는 모든 HCM-유발 돌연변이의 1/3에서 발생하며, 코딩 뉴클레오티드 1208이 구아닌으로부터 아데닌으로 돌연변이되어 최종 단백질에서 아미노산 403이 아르기닌으로부터 글루타민으로 전환되는 결과를 초래한다. 도 1A는 프로토스페이서 인접 모티프(PAM) 5'-TGAG-3'와 함께 서열 5'-CCT CAG GTG AAA GTG GGC AA-3'(서열번호 1)의 서열을 갖는 gRNA를 나타낸다. 프로토스페이서 인접 모티프(PAM) 5'-TGAG-3'와 함께 서열 5'-CCT CAG GTG AAA GTG GGC AA-3'(서열번호 1)을 갖는 gRNA를 코딩하는 플라스미드, 및 ABEmax-SpCas9-NG를 코딩하는 플라스미드의 핵감염 후(도 1B), 인접한 아데닌 뉴클레오티드의 유의한 방관자 편집을 수반하지 않고서, 돌연변이체 아데닌 뉴클레오티드를 야생형 구아닌 뉴클레오티드로 다시 강력한 편집이 수행된다(도 1C). 
이어서, MYH7 c.1208G>A(p.R403Q) 돌연변이(Mut)를 함유하는 환자-유래 유도 다능성 줄기 세포(iPSC) 또는 상기 기재된 CRISPR-Cas9 방법을 사용하여 수정된 iPSC(Cor)를 단리하고, 심근세포(iPSC-CM)로 분화시켰다(도 2A, 도 6C). Mut iPSC-CM 및 Cor iPSC-CM에 의한 힘 생성의 분석은 Cor 계통에서 유의한 감소를 나타냈고, 이는 MYH7 p.R403Q 돌연변이의 수정이 과수축성 표현형을 감소시켰음을 입증했다(도 2B). 이러한 데이터는 CRISPR-Cas9가 환자에서 발견되는 과수축성 표현형의 개선에 사용될 수 있음을 시사한다. 
실시예 2.  
또 다른 예시적 방법에서, 인간 MYH7 p.R403Q 돌연변이를 모델링하기 위해 유전자 변형 마우스 계통을 생성했다(도 3A). 구체적으로, 이 마우스 계통은 마우스에서 우세하게 발현되는 미오신 동형인 마우스 미오신 중쇄 6(Myh6) 유전자 내에 동일한 인간 질환-유발 돌연변이를 함유했다(도 3B). 하나의 대립유전자에 미스센스 돌연변이를 갖는 마우스(403/+)와, 양쪽 대립유전자 모두에 미스센스 돌연변이를 갖는 마우스(403/403)를 미스센스 돌연변이를 함유하지 않는 마우스(야생형 또는 "WT")와 직접 비교하여 발생으로부터 심장 표현형에 대해 모니터링했다.  403/403 마우스는 P8에서 심장의 비대를 나타내기 시작한다(도 4A-4C). 현저한 심장 섬유화가 생후 6개월 후에 403/+ 마우스에서 관찰되었다(도 4D 및 4E). 
인간 MYH7 p.R403Q 돌연변이의 마우스 모델에서 Myh6.R403Q 돌연변이를 수정하기 위해, 마우스 계통에서 아데노-관련 바이러스(AAV)-기반 수정을 위해 PAM 5'-CGAG-3'(서열번호 4) 서열과 함께 서열 5'-CCT CAG GTG AAG GTG GGG AA-3'(서열번호 2)를 갖는 sgRNA를 설계했다(도 5). 마우스에서 온-표적 및 오프-표적 편집 효율은 AAV 전달 및/또는 A-염기 에디터를 사용하여 결정된다. 인간 MYH7 p.R403Q 돌연변이의 마우스 모델에 AAV를 통해 sgRNA를 투여한 후, 심장 기능을 평가하고, sgRNA 투여 전의 심장 기능과 비교하여 마우스에서 표현형 구제를 측정했다. 
실시예 3 인간 iPSC에서 R403Q 돌연변이를 수정하기 위한 ABE의 동정
염기 에디터는 Cas9 니카제 또는 비활성화된 Cas9 및 데아미나제 단백질의 융합 단백질이고, 이는 단일-가이드 RNA(sgRNA)의 프로토스페이서 인접 모티프(PAM) 부위와 관련하여 정의된 편집 윈도우 내에서 이중-가닥 절단 없이 염기쌍 편집을 가능하게 한다. 아데닌 염기 에디터(ABE)는 데옥시아데노신 데아미나제를 사용하여 이노신 중간체를 통해 DNA A·T 염기쌍을 G·C 염기쌍으로 전환한다. 다양한 아데닌 염기 에디터(ABE)의 효율을 스크리닝하기 위해, MYH7 c.1208 G>A(p.R403Q) 병원성 미스센스 돌연변이는 CRISPR-Cas9-기반 상동성-지시 복구를 사용하여 건강한 공여자(HDWT)로부터 유래된 인간 유도 다능성 줄기 세포(iPSC) 계통에 삽입했다. 환자에게서 발견된 이형접합성 유전자형을 반영하는 동종 이형접합성 돌연변이 클론(HD403/+)과, 환자에게서 이전에 기재되지 않았던 동종 호모접합성 돌연변이 클론(HD403/403)을 단리했다. 서열분석은 이러한 클론의 생성 중에 고도 상동성의 MYH6 유전자에 돌연변이가 없는 것으로 확인되었다(도 6A-6B).  
ABE는 프로토스페이서 위치 14-17에 최적의 활성 윈도우를 갖기 때문에(PAM 서열의 바로 5' 측의 제1 뉴클레오티드를 프로토스페이서 위치 1로 계산), sgRNA는 프로토스페이서 위치 16(h403_sgRNA)에 MYH7 c.1208 G>A 돌연변이를 배치하는 NGA PAM으로 선택되었다(도 7A). 임의의 방관자 편집을 도입하지 않고서 병원성 뉴클레오티드를 야생형 뉴클레오티드로 효율적으로 수정할 수 있는 최적 ABE를 동정하기 위해, 최적화된 좁은 윈도우의 ABE7.10 변이체(서열번호 11)인 ABEmax(서열번호 7) 또는 고도 프로세스성 넓은 윈도우의 진화된 ABE7.10 변이체인 ABE8e(서열번호 9)를 포함하는 다양한 조작된 데아미나제를 시험했다. 각 데아미나제 변이체의 아미노산 및 핵산 서열은 상기 표 1 및 2에 제공되어 있다. 각 조작된 데아미나제 변이체는 NRN PAM을 표적화하는 SpRY(서열번호 17); NGN PAM을 표적화하는 SpG(서열번호 19); NG PAM을 표적화하는 SpCas9-NG(서열번호 21) 또는 NGA PAM을 표적화하는 SpCas9-VRQR(서열번호 15)를 포함한 조작된 SpCas9 변이체와 융합했다. 각 SpCas9 변이체에 대한 아미노산 및 핵산 서열은 상기 표 3 및 4에 제공되어 있다. 이어서, 이러한 ABE를 h403_sgRNA(서열번호 1, 도 7B)에 의한 일시적 주입을 통해 HD403/403 iPSC 계통에서 이들의 수정 효율에 대해 스크리닝했다. 병원성 아데닌의 유사한 편집 효율은 시험된 모든 ABEmax-SpCas9 변이체로 달성되었고, ABEmax-SpRY의 26±2.3%로부터 ABEmax-VRQR의 34±2.5%의 범위이고, 인접한 아데닌의 방관자 편집은 최소였다(3개 방관자의 평균은 2.6±1.7%였음). ABE8e-SpCas9 변이체는 보다 높은 편집 효율을 달성했고, ABE8e-SpRY(서열번호 57)의 27±2.6%로부터 ABE8e-SpG(서열번호 59)의 37±1.5%의 범위이고, 인접한 아데닌의 방관자 편집은 약간 증가했다(3개 방관자의 평균은 4.0±2.0%였음)(도 7C). 이러한 방관자 편집은 편집의 조합에 따라 β-미오신 중쇄에서 K405E, K405R 또는 K405G 돌연변이를 초래할 것으로 예측되지만, β-미오신 중쇄 기능에 대한 이러한 돌연변이의 영향은 기재되지 않았다. 후속 실험의 경우, 보다 좁은 윈도우의 ABEmax를 사용하여 잠재적 방관자 편집을 감소시켰고, 이의 보다 엄격한 PAM 요건을 갖는 SpCas9-VRQR 변형을 사용하여 잠재적 Cas 의존성 오프-표적 편집을 감소시켰다. 수득되는 융합 단백질(ABEmax-VRQR)은 서열번호 45의 아미노산 서열을 갖고 있었다. 하기 실시예에서 사용된 핵 국재화 서열을 추가로 포함하는 동일한 융합 단백질은 서열번호 46의 아미노산 서열을 갖는다. 이들 실시예에 기재된 모든 데아미나제-니카제 단백질의 아미노산 서열 및 코딩 핵산은 상기 표 7 및 8에 제공되어 있다.  
실시예 4 - HCM 환자-유래 iPSC에서 수정 효율 및 오프-표적 DNA 편집 분석.
ABEmax-VRQR 및 h403_sgRNA 시스템을 질환 모델에 적용하기 위해, 인간 유도 다능성 줄기 세포(iPSC)는 MYH7403/+ 돌연변이를 갖는 2명의 HCM 환자(HCM1403/+ 및 HCM2403/+)로부터 유래되었고, MYH7403/+ 돌연변이는 ABEmax-VRQR-P2a-EGFP 및 h403_sgRNA(서열번호 1) 및 GFP+ 세포의 형광-활성화 세포 분류를 통해 수정했다(도 8A). 고처리량 서열분석(HTS)은, 98 내지 99%의 온-표적 편집에도 불구하고, 생물정보학 도구 CRISPOR를 사용하여 동정된 8개 시험 후보 오프-표적 유전자좌의 58개 아데닌 염기 모두에서 오프-표적 DNA 편집(0.12% 이하)이 최소 내지 전혀 발생하지 않았음을 나타냈다(도 8B도 9, 및 하기 표 16). β-미오신의 아미노산 505(K505)에 대한 3개 방관자 아데닌에서 낮은 빈도(0.03 내지 0.48%)의 방관자 편집이 관찰되었다. 후속 특성화를 위해, 고도의 상동성 MYH6 유전자의 방관자 편집 또는 편집을 함유하지 않는 HCM 환자-유래 iPSC(HCM1WT 및 HCM2WT)의 수정 클론 균주를 단리했다. 이러한 결과는 ABEmax-VRQR을 갖는 h403_sgRNA가 최소한의 방관자 편집을 갖고 DNA 오프-표적 편집을 거의 또는 전혀 갖지 않고서 표적 병원성 미스센스 돌연변이를 효율적 및 특이적으로 수정할 수 있음을 시사한다.
[표 16]
실시예 5 - ABE-수정된 환자 iPSC-유래 CM의 기능 분석
인간 심근세포(CM)에서 염기 편집 수정의 기능적 영향을 판단하기 위해, MYH7403/+ 돌연변이체 및 MYH7WT 건강한 클론 균주 모두는 CM 기능에 미치는 유전자 편집 수정의 효과를 조사하기 위해 3개 환자-유래 계통(HD, HCM1, HCM2) 모두에 대해 CM으로 분화시켰다(도 8A). 
CM의 현저한 특징은 수축력의 생성이다. HCM은 과수축성을 초래하고, 이는 증가된 힘의 생성을 유도할 수 있다. 유전자 편집 수정이 HCM 환자-유래 계통에서 과수축력 생성을 감소시킬 수 있는지를 조사하기 위해, iPSC-CM을 부드러운 폴리디메틸실록산 표면에 단일-세포 밀도로 플레이팅하고, 수축하는 CM의 높은 프레임-레이트 비디오를 기록하고, 피크 수축력을 계산했다. HD403/+ iPSC-CM은 원래 건강한 공여자로부터 유래된 HDWT iPSC-CM과 비교하여 피크 수축력의 1.7배 증가를 나타냈다. 반면, 수정된 HCM1WT 및 HCM2WT CM은 이들의 동종 HCM1403/+ 및 HCM2403/+와 비교하여 각각 피크 수축력의 2.0배 및 1.6배 감소를 나타냈다(도 8C). 
이전 연구에서는 HCM  돌연변이가 ATP 소비의 증가 및 세포 대사의 변화를 유도한 것으로 나타났기 때문에, 세포 에너지의 변화는 유전자 편집 수정 후의 대사 플럭스 검정을 통해 평가했다. HDWT iPSC-CM과 비교하여 HD403/+ iPSC-CM에서는 기초 산소 소비율(OCR)이 1.6배 증가했으며, HD403/+ iPSC-CM에서는 HDWT iPSC-CM과 비교하여 최대 OCR이 2.1배 증가했다. 수정된 HCM1WT 및 HCM2WT CM은 동종 HCM1403/+ 및 HCM2403/+ CM과 비교하여 기초 OCR에서 각각 1.4배 및 1.2배 감소를 나타내고 최대 OCR에서 각각 3.7배 및 2.1배 감소를 나타냈다(도 8D). 이러한 데이터는 인간 HCM CM에서 병원성 돌연변이의 수정이 과수축성 표현형을 감소시키고 정상 세포 에너지를 회복하기에 충분하다는 것을 입증한다.
실시예 6 - HCM의 인간화 마우스 모델의 개발
상기 기재된 염기 편집 방법을 HCM의 마우스 모델에 적용했다. β-미오신 중쇄는 성인 인간 심장에서 발견되는 우성 미오신 동형인 반면, 고도 상동성의 α-미오신 중쇄는 성체 마우스 심장에서 발현되는 우성 미오신 동형이고 Myh6 유전자에 의해 코딩된다. 결과적으로, 이전에 기재된 HCM의 마우스 모델은 이러한 발현 차이를 설명하기 위해 마우스 Myh6 유전자 상에 대응 인간 MYH7 돌연변이를 배치했다. R403 주변의 30개 아미노산은 인간 MYH7과 마우스 Myh6 사이에서 100% 동일하지만, 단백질의 이 영역을 코딩하는 DNA 서열은 동일하지 않다(도 10). 따라서, 인간 게놈을 위해 개발된 sgRNA와 편집 전략은 마우스 모델에 직접 적용되지 않을 수 있다. 
본 발명의 인간 서열-특이적 염기 편집 전략을 사용하여 전임상 연구를 수행하기 위해, 인간 게놈 특이적 CRISPR 전략을 시험할 수 있도록 마우스 Myh6 유전자 내에 MYH7 c.1208 G>A(p.R403Q) 인간 미스센스 돌연변이를 함유하는 인간화 마우스 모델을 생성하고, 돌연변이의 상류 및 하류에 적어도 22개 뉴클레오티드의 인간 DNA 서열 동일성을 갖도록 했다(도 11A). 다른 Myh6 대립유전자에는 비변형 마우스 게놈 서열이 함유되어 있다. 이 인간화 마우스 모델(Myh6h403/+)은 이전에 기재된 Myh6 p.R403Q 마우스 모델의 표현형을 반영한다. 가장 특히, 호모접합성 마우스(Myh6h403/h403)는 심방이 비대하고 광범위한 간질성 섬유증을 갖고 생후 1주일 이내에 사망한다(도 11B). 생후 9개월에, Myh6h403/+ 마우스는 현저한 심실 비대, 근세포 혼란 및 섬유화를 수반한 심근증을 발증했다(도 11C). 
실시예 7 - 인간 HCM의 마우스 모델의 생체내 ABE 치료
ABEmax-VRQR 및 h403_sgRNA는 아데노-연관 바이러스(AAV) 내에 패키징시켰다. 전장 염기 에디터(약 5.6kb)가 단일 AAV9의 패키징 한계(약 4.7kb)를 초과하기 때문에, 염기 에디터를 2개의 AAV9(서열번호 86 및 91)로 분할하고, 트랜스-스플라이싱 인테인을 사용하여 단백질 발현시에 세포에서 전장 염기 에디터를 재구성했다. AAV9은 광범위한 조직 지향성을 함유하고 있기 때문에, 심장 트로포닌 T 프로모터를 사용하여 염기 에디터의 발현을 CM으로 제한했다. 이 이중 AAV9 시스템의 경우, 각 AAV9에는 또한 h403_sgRNA를 코딩하는 발현 카세트의 단일 카피도 함유되어 있다(도 12A). 2개 벡터는 상기 표 9와 10에 구성 성분과 함께 기재되어 있다. 
본 발명의 이중 AAV9 ABE 시스템의 효율은 생후 1주일 이내에 사망하는 Myh6h403/h403  마우스를 구출하기 위해 시도함으로써 검증했다. 특히, 호모접합성 유전자형을 갖는 인간 환자는 보고되지 않았다. P0(출생 후 0일) Myh6h403/h403 새끼에게 생리식염수, 저용량(4×1013vg/kg) 또는 고용량(1.5×1014 vg/kg)의 각 AAV9(저용량의 경우 총 8×1013vg/kg, 및 고용량의 경우 3×1014 vg/kg)을 흉강내 주사하고, 이들의 발달을 모니터링했다(도 13A). 3×1014vg/kg 고용량은 임상 시험에서 투여된 최고 용량이다. Myh6h403/+ 및 Myh6WT 마우스는 이유기후 및 성체기까지 생존했다. 생리식염수-주사된 마우스의 생존기간 중앙값은 7.0일인 반면, 저용량 ABE-치료된 마우스의 생존기간 중앙값은 9.0일로 증가했다(1.3배 연장, 맨텔-콕스 검정에 의한 P<0.05). 고용량 ABE-치료된 마우스의 생존기간 중앙값은 15.0일로 증가했다(2.1배 연장, 맨텔-콕스 검정에 의한 P<0.01)(도 13B). 고용량 마우스로부터의 심장의 cDNA의 생어 서열분석은 전사물 수준에서 병원성 돌연변이 뉴클레오티드의 35% 수정을 나타냈고, 이는 이중 AAV9 ABE 시스템이 심장에서 편집을 가능하게 했음을 시사했다(도 13A-13D). 
MYH7 p.R403Q 돌연변이는 인간 환자로부터 이형접합성 형태로만 존재하기 때문에, AAV9 ABE 시스템을 도입하여 Myh6h403/+ 마우스에서 HCM 질환 발증을 예방했다. Myh6h403/+ P0 새끼에게 생리식염수 또는 1×1014vg/kg의 각 AAV9(2×1014vg/kg)를 흉강내 주사하고, 이들의 동배 Myh6WT 대조군 새끼에게 생리식염수를 주사했다(도 12B). 생후 5주령에서, 마우스에게 0.1% 사이클로스포린 A의 고형사료 식이를 제공했고, 이는 육종 돌연변이의 마우스 모델에서 HCM의 발증을 촉진하는 것으로 이전에 나타났다. 질환의 진행을 모니터링하기 위해, 생후 8주, 12주, 16주차에 연속 심초음파 검사를 실시했다. Myh6h403/+ 마우스는 Myh6WT 대조군과 비교하여 이완기에서 좌심실 전벽 두께(LVAW;d)의 증가(1.07±0.0443mm 대 0.883±0.0441mm, P=0.017) 및 좌심실 후벽 두께(LVPW;d)의 증가(1.04±0.0809mm 대 0.867±0.0590mm, P=0.128)를 포함하여 HCM의 증가된 특징을 갖고 있었다. 이들 마우스는 또한 이완기에서 좌심실 내경(LVID;d)의 감소(2.34±0.142mm 대 2.81±0.0540mm, P=0.015) 및 수축기에서 좌심실 내경(LVID;s)의 감소(0.940±0.0713mm 대 1.24±0.0520, P=0.010)를 갖고, 박출률(EF)과 분획 단축(FS)은 약간 증가했다. Myh6h403/+ 마우스의 심실 벽 두께의 증가 및 그에 따른 심실 직경의 감소는 인간 환자에서 임상적 진행과 일치한다. 
이와 대조적으로, ABE-치료된 Myh6h403/+ 마우스는 Myh6WT 대조군 마우스와 필적하는 심초음파 측정치를 나타냈고, 이는 병원성 뉴클레오티드의 유전자 수정이 HCM의 발증을 예방하기에 충분했다는 것을 시사한다(도 12C-12H, 표 1, 도 15A). 조직학적 분석은 또한 Myh6h403/+ 마우스가 Myh6WT 대조군 마우스와 비교하여 심장 벽 두께의 증가 및 심실 직경의 감소를 나타낸 반면, ABE-치료된 Myh6h403/+ 마우스는 Myh6WT 대조군 마우스와 유사한 심장 크기를 갖고 있었다(도 12I-12K). 경골 길이로 정규화한 경우, Myh6h403/+ 마우스는 Myh6WT 대조군 마우스와 비교하여 심장 중량에서 1.3배 더 큰 심장을 갖고 있었고, ABE-치료된 Myh6h403/+ 마우스는 Myh6WT 마우스와 비교하여 심장 중량에서 유의차가 없었다(도 12L). 섬유화의 척도로서, Myh6h403/+ 마우스의 심장은 Myh6WT 대조군 마우스와 비교하여 3.0배 더 많은 콜라겐 면적을 갖는 반면, ABE-치료된 Myh6h403/+ 마우스는 Myh6WT 마우스와 비교하여 콜라겐 면적에 유의차가 없었다(도 12M). 이러한 데이터는 이중 AAV9 ABE 치료가 심장의 HCM-매개 병리학적 리모델링의 발증을 예방하기에 충분했다는 것을 시사한다. 
실시예 8 - ABE-처리된 마우스의 게놈 및 전사체 분석. 
염기 편집 후의 게놈 및 전사체 변화를 확인하기 위해, 생리식염수-처리된 Myh6WT 대조군 마우스, 생리식염수-처리된 Myh6h403 /+ 마우스, 및 ABE-처리된 Myh6h403 /+ 마우스로부터 CM 핵을 단리했다(도 14A). 이중 AAV9 ABE 처리 후의 온-표적 편집 효율을 먼저 평가했다. ABE-처리된 Myh6h403 /+ 마우스에서, 표적 병원성 아데닌의 DNA 편집 효율은 32.3±2.87%이고, Myh6h403 /+ 마우스와 비교하여 돌연변이 전사물이 33.1±9.08% 감소했으며(도 14B-C), 이는 돌연변이 전사물의 염기 편집 또는 RNAi-기반 녹-다운을 사용한 다른 생체내 연구에 필적한다. 추가로, ABE-처리된 Myh6h403 /+ 마우스에서는 방관자 편집이 존재하지 않았다(도 14D). 이어서, ABEmax에는 데아미나제 활성이 함유되어 있기 때문에, 전사체-전체 RNA 서열분석(RNA-seq)을 사용하여 잠재적 오프-표적 RNA 편집을 평가했다. RNA-seq 분석은, 생리식염수-처리된 마우스와 비교하여 ABE-처리된 마우스의 전사체에서 A-to-I 편집의 평균 빈도에 현저한 변화가 없는 것으로 나타났다(도 14E). 이 발견은 본 발명의 이중 AAV9 ABE 시스템에 의한 생체내 처리가 내인성 세포 데아미나제 활성의 배경 수준 이상으로 RNA 탈아미노화를 증가시키지 않음을 시사한다. 
전사체-전체 변화는 ABE-처리된 Myh6h403 /+ 마우스에서 RNA-seq을 통해 평가했다. Myh6WT  마우스와 Myh6h403 /+ 마우스 사이에서 257개의 차등적으로 조절되는 유전자가 동정되었다. 히트 맵은 ABE-처리된 Myh6h403 /+ 마우스가 Myh6WT  마우스보다 Myh6h403/+ 마우스와 더욱 유사한 전사체 프로파일을 갖는 것을 나타냈다(도 14F, 도 15B-15D). Myh6h403 /+ 마우스와 Myh6WT 마우스 사이에 차등적으로 조절되는 유전자의 유전자 온톨로지 분석은 세포간 신호전달 및 혈관신생의 조절장애를 나타내고, 세포간 신호전달은 Myh6h403 /+ 마우스와 ABE-처리된 Myh6h403 /+ 마우스 사이에서 조절장애였다(표 17, 하기 참조). 추가로, 원형 비대 마커 Nppa의 발현은 Myh6WT 마우스와 비교하여 Myh6h403 /+ 마우스에서 2.8배 더 높은 반면, ABE-처리된 Myh6h403 /+ 마우스에서 Nppa의 발현은 MyhWT 마우스와 유의차가 없었다(도 14G). 이를 종합하면, 이들 데이터는 이중 AAV9 ABE 시스템이 게놈 DNA의 병원성 돌연변이 뉴클레오티드를 효율적으로 수정하고 전사체 조절장애를 예방할 수 있음을 시사한다.
[표 17]
실시예 9 - 재료 및 방법 
연구 설계 및 승인.   이 연구의 목적은 병원성 HCM-유발 돌연변이의 염기 편집 수정이 인간 CM과 인간화 마우스 모델에서 HCM 병리학적 특징의 발증을 예방할 수 있는지를 판단하는 것이었다. 인간 CM에서, 이는 HCM 환자-유래된 iPSC의 염기 편집 수정 및 특징적 CM 기능의 변화 측정에 의해 수행했다. 인간화 마우스 모델에서, 이중 AAV9 시스템을 사용하여 염기 편집 성분을 CM에 전달하고, 심장 기능, 치수 및 전사체학의 변화를 측정했다. 모든 실험의 경우, 사용된 반복 수, 반복의 유형 및 통계적 검정은 도면 범례에 보고되어 있다. 시험관내 CM 실험에 대해, 3개의 개별 분화로부터 데이터를 수집했으며, 가외치 또는 기타 데이터 포인트는 제외하지 않았다. 생체내 실험의 경우, 수컷 마우스는 유전자형에 기초하여 치료에 할당했다. 심초음파 측정은 블라인드 방식으로 수행했다. 평균으로부터 2 표준편차 이상 감소한 체중을 갖는 런트(Runt) 마우스는 제외했다. 종점은 심초음파 측정치의 변화에 의해 유도했다. 이 논문에 기재된 동물 실험은 UT 사우스웨스턴 기관 동물 관리 및 사용 위원회의 감독하에 승인 및 수행했다.
플라스미드 및 벡터 작제 pSpCas9(BB)-2A-GFP(PX458) 플라스미드는 펭 장(Feng Zhang)으로부터의 기증물이었고(Addgene 플라스미드 #48138), 하기 염기 에디터 및 SpCas9 니카제에서 클로닝하기 위한 주요 스캐폴드로 사용했다: ABE8e, 데이비드 리우(David Liu)로부터의 기증물(Addgene 플라스미드 #138489); VRQR-ABEmax, 데이비드 리우(David Liu)로부터의 기증물(Addgene 플라스미드 #119811); NG-ABEmax, 데이비드 리우(David Liu)로부터의 기증물(Addgene 플라스미드 #124163); pCMV-T7-SpG-HF1-P2A-EGFP(RTW5000), 벤자민 클라인스티버(Benjamin Kleinstiver)로부터의 기증물(Addgene 플라스미드 #139996); 및 pCMV-T7-SpRY-HF1-P2A-EGFP(RTW5008), 벤자민 클라인스티버로부터의 기증물(Addgene 플라스미드 #139997). N-말단 ABE 및 C-말단 ABE 작제물은 Cbh_v5 AAV-ABE N 말단(Addgene 플라스미드 #137177) 및 Cbh_v5 AAV-ABE C 말단(Addgene 플라스미드 #137178)로부터 적용하고, 트위스트 바이오사이언스(Twist Bioscience)에 의해 합성했다. 선택된 플라스미드의 PCR 증폭은 PrimeStar GXL 폴리머라제(Takara)를 사용하여 수행했으며, 클로닝은 NEBuilder HiFi DNA 어셈블리(NEB)를 사용하여 제한 효소-소화된 목적 벡터로 수행했다. 
환자-유래 iPSC 및 동종 돌연변이체 계통의 생성 MYH7 c.1208 G>A(p.R403Q) 돌연변이를 갖는 환자 2명의 말초 혈액 단핵 세포(PBMC)를 센다이 바이러스를 사용하여 iPSC(HCM1 및 HCM1)로 재프로그래밍했다. HCM1 계통은 광범위한 HCM 가족력을 갖고 좌심실 박출률의 저하 및 최대 산소 섭취량(VO2 max)의 저하를 수반한 비폐색성 HCK의 병력을 갖는 56세의 여성으로부터 유래했다. 완전한 심장 차단을 위해 양심실 박동기를 배치했다. HCM2 계통은 HCM, 이식형 제세동기의 병력을 갖고 HCM의 강력한 가족력을 갖는 32세 남성으로부터 유래했다. 이 남성은 좌심방이 확장되어 있지만, VO2 max, 대사 당량(MET)이 개선되었고 심폐 운동 시험에 의한 심방 세동의 증거는 없었다. 건강한 남성 공여자(HD)로부터의 PBMC는 센다이 바이러스(CytoTune 2.0 Sendai Reprogramming Kit, ThermoFisher Scientific)를 사용하여 UT 사우스웨스턴 웰스톤 마이오에디팅 코어(UT Southwestern Wellstone Myoediting Core)에서 iPSC로 재프로그래밍했다. 상동성-지시 복구를 통해 MYH7 c.1208 G>A(p.R403Q) 돌연변이를 함유하는 동종 iPSC를 생성하기 위해, HD iPSC에, P3 Primary Cell 4D-Nucleofector X Kit(Lonza)를 사용하여 돌연변이를 코딩하는 단일-가닥 올리고데옥시뉴클레오티드(ssODN) 주형(Integrated DNA Technologies, IDT) 및 SpCas9-P2a-EGFP를 코딩하는 PX458 플라스미드 및 MYH7 표적화 sgRNA를 핵감염시켰다. HCM1 및 HCM2 환자 유래 계통의 염기 편집 수정을 위해, iPSCS에, ABEmax-VRQR-P2a-EGFP 및 h403_sgRNA를 코딩하는 플라스미드를 핵감염시켰다. 48시간 후, GFP+ iPSC를 형광 활성화 세포 선별에 의해 수집하고, 클론적으로 확장시키고, 생어 서열분석에 의해 유전자형을 분석했다(사용된 프라이머에 대해서는 표 18 참조). 
iPSC 유지 및 분화 iPSC 배양 및 분화는 이전에 기재된 바와 같이 수행했다[참조: F. Chemello, A. C. Chai, H. Li, C. Rodriguez-Caycedo, E. Sanchez-Ortiz, A. Atmanli, A. A. Mireault, N. Liu, R. Bassel-Duby, E. N. Olson, Precise correction of Duchenne muscular dystrophy exon deletion mutations by base and prime editing. Sci Adv 7, (2021)]. 간단히 말하면, iPSC는 마트리겔(Corning)-코팅된 조직 배양 폴리스티렌 플레이트에서 배양하고, mTeSR1 배지(STEMCELL)에서 유지하고, 베르센(Versene)을 사용하여 70-80%의 컨플루언시(confluency)로 계대했다. iPSC는 아스코르브산(50μg/mL), 및 인슐린을 포함하지 않는 B27이 보충된 RPMI(RPMI/B27-)에서 CHIR99021(Selleckchem)로 24시간 동안 처리함으로써 70~80%의 컨플루언시에서 CM으로 분화시켰다((d)0일차부터 d1까지). d1에서, 배지를 RPMI/B27-로 교환했다. d3에서, 세포를 WNT-C59(Selleckchem)가 보충된 RPMI/B27-로 처리했다. d5에서, 배지를 RPMI/B27-로 교환했다. d7부터, iPSC-CM은 아스코르브산(50μg/mL)과 B27(RPMI/B27)이 보충된 RPMI에서 유지하고, 배지는 3-4일마다 갱신했다. CM의 대사적 선택은 글루코스 없이 5mM DL-락테이트 나트륨과 CDM3 보충제(500μg/mL 오리자 사티바-유래된 재조합 인간 알부민, A0237, Sigma-Aldrich, 및 213μg/mL L-아스코르브산 2-포스페이트, Sigma-Aldrich)가 보충된 RPMI에서 세포를 배양함으로써 d10부터 개시하여 6일 동안 수행했다. 이들의 성숙을 유도하기 위해, iPSC-CM은 B27, 50μmol 팔미트산, 100μmol 올레산, 10mmol 갈락토스, 및 1mmol 글루타민(Sigma-Aldrich)이 보충된, 글루코스 비함유 RPMI에서 유지했다. 모든 CM 기능 연구는 d40-50에서 수행했다. 
플라스미드 형질감염 및 편집 효율 분석 iPSC는 형질감염 24시간 전에 48웰 플레이트에 시딩했다. 약 20%의 컨플루언시에서, 웰당 1μL의 리포펙타민 줄기 형질감염 시약(Thermo Fisher)을 사용하여 염기 에디터 및 h403_sgRNA를 코딩하는 0.5μg의 플라스미드로 세포를 일시적으로 형질감염시켰다. 형질감염 48시간 후, 세포를 직접 PCR 용해 시약(세포)(Viagen)에서 용해시켰다. 표적 부위의 PCR 증폭은 PrimeStar GXL 폴리머라제(Takara)를 사용하여 수행했고, PCR 클린업은 ExoSap-IT Express(ThermoFisher)를 사용하여 생어 서열분석 전에 수행했다. 크로마토그램은 염기 편집 효율을 결정하기 위해 EditR을 사용하여 분석했다.
iPSC -CM의 수축성 분석 iPSC-CM은 이전에 확립된 프로토콜에 따라 준비된 유연한 폴리디메틸실록산(PDMS) 527 기질(영률=5kPa) 상에 단일-세포 밀도로 플레이팅했다[참조: A. Atmanli, A. C. Chai, M. Cui, Z. Wang, T. Nishiyama, R. Bassel-Duby, E. N. Olson, Cardiac Myoediting Attenuates Cardiac Abnormalities in Human and Mouse Models of Duchenne Muscular Dystrophy. Circ Res 129, 602-616 (2021)]. 수축하는 iPSC-CM의 기록은 37℃에서 공명 스캐닝 모드에서 초당 59프레임의 니콘 A1R+ 공초점 시스템을 사용하여 캡처했다. iPSC-CM의 수축력 생성은 이전에 확립된 방법을 사용하여 정량화했다. 간단히 말하면, 기록은 Fiji를 사용하여 수축 중 최대 및 최소 세포 길이 및 세포 폭을 측정하기 위해 분석했다. 이전에 공개된 커스텀 Matlab 코드를 사용하여 피크 수축기 힘을 계산했다[참조: J. D. Kijlstra, D. Hu, N. Mittal, E. Kausel, P. van der Meer, A. Garakani, I. J. Domian, Integrated Analysis of Contractile Kinetics, Force Generation, and Electrical Activity in Single Human Stem Cell-Derived Cardiomyocytes. Stem Cell Reports 5, 1226-1238 (2015)]. 
iPSC -CM의 세포외 플럭스 분석 iPSC-CM을 마트리겔(Matrigel)로 코팅된 해마(Seahorse) XFe96 V3 PS 세포 배양 마이크로플레이트(Agilent)에 웰당 40,000개 세포로 플레이팅했다. 플레이팅 1주일 후, 세포를 예열된 검정 배지(2mM L-글루타민, 1mM 나트륨 피루베이트, 및 10mM 글루코스가 보충된 피루베이트-비함유 DMEM(Sigma D5030), pH 7.4)로 3회 세척하고, 37℃에서 60분간 비-CO2 인큐베이터에서 인큐베이팅했다. 산소 소비율(OCR)은 2분간의 측정, 10초의 대기, 및 3분의 혼합의 연속 사이클을 사용하여 해마 XFe96 기기에서 측정했다. 미토콘드리아 스트레스 시험은 올리고마이신(최종 농도 2μM), CCCP(최종 농도 1μM), 및 안티마이신 A(최종 농도 1μM)를 지정된 시간 간격으로 주사하여 수행했다. 데이터는 WAVE 소프트웨어(Agilent)를 사용하여 분석했다. 
면역형광 염색. iPSC-CM을 유리 표면에 플레이팅하고, 4% 파라포름알데히드로 10분간 고정시키고, 이어서 5% 염소 혈청/0.1% 트윈-20(Sigma-Aldrich)으로 1시간 동안 차단했다. 1차 및 2차 항체를 차단 완충액에서 희석하고, 각각 2시간 및 1시간 동안 세포에 첨가했다. 핵은 DAPI를 사용하여 대비 염색했다. 사용된 항체에는 육종성 α-액티닌(클론 EA-53, A7811, Sigma-Aldrich, 1:600 희석) 및 염소 항-마우스 IgG1 Alexa 488(A21121, Thermo-Fisher, 1:600 희석)이 포함되었다.  
오프 -표적 분석. 후보 오프-표적 부위를 CRISPOR로 동정하고, PCR 생성물을 성공적으로 수득한 절단 빈도 결정(CFD) 스코어에 따라 상위 8개 부위를 선택했다. DNeasy 혈액 및 조직 키트(Qiagen)를 사용하여, ABEmax-VRQR-P2a-EGFP 및 h403_sgRNA를 코딩하는 플라스미드로 핵 감염된 HCM1, HCM2 및 HD 세포주로부터 게놈 DNA를 단리하고, GFP+ 세포에 대해 선별했다. 표적 부위는 PrimeStar GXL 폴리머라제(Takara)를 사용하여 PCR 증폭시키고, 제2 PCR을 사용하여 일루미나(Illumina) 유동 세포 결합 서열 및 바코드를 추가했다. PCR 생성물은 AMPure XP 비드(Beckman Coulter)로 정제하고, 2200 TapeStation 시스템(Agilent)에서 완전성을 분석하고, 풀링 및 일루미나(Illumina) MiSeq에 로딩하기 전에 QuBit dsDNA 고감도 검정(Invitrogen)으로 정량화했다. 역다중화 후, 수득되는 판독치를 편집 빈도에 대해 CRISPResso2로 분석했다[참조: K. Clement, H. Rees, M. C. Canver, J. M. Gehrke, R. Farouni, J. Y. Hsu, M. A. Cole, D. R. Liu, J. K. Joung, D. E. Bauer, L. Pinello, CRISPResso2 provides accurate and rapid genome editing sequence analysis. Nat Biotechnol 37, 224-226 (2019)]. 
아데노 -관련 바이러스의 생성. 재조합 AAV9(rAAV9) 바이러스는 미시간 대학교 벡터 코어에서 요오딕사놀 구배를 통한 초원심분리법을 사용하여 제조했다. rAAV9는 아미콘(Amicon) 초원심 필터 장치(Millipore)를 사용하여 PBS로 3회 세척하고, PBS+0.001% 플루로닉 F68에 재현탁시켰다. 역가는 qPCR에 의해 평가했다. rAAV9는 25μL 분액으로 -80℃에서 저장했다.
마우스. 마우스는 12시간:12시간의 명암 사이클을 갖는 차단 시설에서 사육하고, 표준 고형사료(2916 Teklad Global)로 유지했다. 인간화된 Myh6h403 /+ 돌연변이는 수정된 프로토콜(H)에 따라 Cas9 mRNA(50ng/μL)(TriLink Biotechnologies), sgRNA(20ng/μL)(IDT), 및 ssODN 공여자 주형(15ng/μL)(IDT)을 접합체에 미세주사함으로써 도입했다[참조: H. Miura, R. M. Quadros, C. B. Gurumurthy, M. Ohtsuka, Easi-CRISPR for creating knock-in and conditional knockout mouse models using long ssDNA donors. Nat Protoc 13, 195-215 (2018)]. 유전자형 분석은 커스텀 TaqMan SNP 유전자형 검정법(ThermoFisher)을 사용하여 수행했다. HCM의 발증을 촉진하기 위해, 마우스를 1g/kg의 사이클로스포린 A(Alfa Aesar) 및 0.2g/kg의 청색 식품 염료가 함유된 커스텀 고형사료(2916 Teklad Global 베이스)로 처리했다. 주사의 경우, 마우스는 P0에서 유전자형 분석하고, 심장과 폐를 피하여 횡격막을 통해 검상돌기하 접근법에 의해 하종격동으로 31G 인슐린 시린지를 사용하여 생리식염수 또는 AAV9 용량을 40μL 단일 볼러스에 의해 투여했다. 
경흉벽 심초음파 검사. 의식이 있는 마우스의 심장 기능은 VisualSonics Vevo2100 이미징 시스템을 사용하여 2차원 경흉벽 심초음파에 의해 평가했다. M-모드 트레이싱을 사용하여 이완기의 좌심실 전벽 두께(LVAW;d), 이완기의 좌심실 후벽 두께(LVPW;d), 및 이완기 말기(LVIDd) 및 수축기 말기(LVIDs)의 LV 내경을 측정했다. FS는 하기 공식에 따라 계산했다: FS(%) = [(LVIDd - LVIDs)/LVIDd] × 100. EF는 하기 공식에 따라 계산했다: EF(%) = [(LVEDV - LVESV)/LVEDV] × 100. 모든 측정은 연구에 대해 블라인딩된 숙련된 작업자에 의해 수행했다.
조직학. 마우스 심장을 절개하고, 심장마비성 0.2M KCl이 함유된 PBS에 5분간 침지한 후, 밤새 PBS 중의 4% 파라포름알데히드에 고정하고, 70% 에탄올에서 탈수하고, 파라핀 매립했다. 500μm 간격으로 연속 횡단면을 절단하고, 슬라이드에 적재하고, 이어서 H&E 염색 또는 마송 트리크롬 염색을 실시했다. 이미지는 BZ-X 올인원 현미경(Keyence)으로 10배율 또는 40배율에서 캡처했다. 
CM 핵 단리. 각 핵 샘플에 대해, 심실 심장 조직을 단리했다. CM 핵은 이전에 기재된 바와 같이 단리했다[참조: M. Cui, E. N. Olson, Protocol for Single-Nucleus Transcriptomics of Diploid and Tetraploid Cardiomyocytes in Murine Hearts. STAR Protoc 1, 100049 (2020)]. 단리된 핵은 즉시 하류 처리에 사용하거나, -80℃에서 핵 PURE 저장 완충제(Sigma Aldrich)에 저장했다. RNA-seq 및 qPCR의 경우, RNeasy 마이크로 키트(Qiagen)를 사용하여 핵으로부터 RNA를 단리했다. DNA 서열분석의 경우, 핵은 직접 PCR 용해 시약(세포)(Viagen)에서 용해했다. 
RNA- seq 라이브러리 제조, 서열분석 및 분석. RNA-seq 라이브러리는 일루미나 서열분석 어댑터를 함유하는 SMARTer 스트랜디드 토탈 RNA-Seq 키트 v2-Pico 입력 포유동물 키트(Takara)를 사용하여 생성했다. 라이브러리는 2200 테이프스테이션 시스템(Agilent)에서 시각화하고, 풀링 및 일루미나(Illumina) NextSeq 500에 로딩하기 전에 QuBit dsDNA 고감도 검정법(Invitrogen)으로 정량화했다. FastQC 도구(버전 0.11.8)를 RNA-seq 데이터의 품질 관리에 사용하여 트리밍을 위한 판독치의 낮은 품질 또는 어댑터 부분을 결정했다. 판독 트리밍은 Trimmomatic(버전 0.39)을 사용하여 수행하고, 가닥(strandness)은 RSeQC(버전 4.0.0)를 사용하여 결정하고, 이어서 HiSAT2(버전 2.1.0)를 디폴트 설정과 -rna-strandness R로 사용하여 판독치를 mm10 참조 게놈에 정렬했다. 정렬된 판독치는 featureCounts(버전 1.6.2)를 사용하여 계수했다. 차등적 유전자 발현 분석은 R 패키지 DESeq(버전 1.38.0)을 사용하여 수행했다. 배율 변화가 2를 초과하고 p값이 0.01 미만인 유전자를 샘플 그룹 비교 사이에서 DEG로 지정했다. 전사체-전체 서열분석 분석에서 서열분석된 아데노신 중 A-to-I 편집의 평균 비율을 계산하기 위해, 이전 전략[참조: L. W. Koblan, M. R. Erdos, C. Wilson, W. A. Cabral, J. M. Levy, Z. M. Xiong, U. L. Tavarez, L. M. Davison, Y. G. Gete, X. Mao, G. A. Newby, S. P. Doherty, N. Narisu, Q. Sheng, C. Krilow, C. Y. Lin, L. B. Gordon, K. Cao, F. S. Collins, J. D. Brown, D. R. Liu, In vivo base editing rescues Hutchinson-Gilford progeria syndrome in mice. Nature 589, 608-614 (2021)]을 적용했다. 간단히 말하면, REDItools2를 사용하여 각 샘플의 편집 비율을 정량화했다. 아데노신을 제외한 뉴클레오티드를 제거하고, 판독 커버리지가 10 미만이거나 판독 품질 스코어가 25 미만인 나머지 아데노신도 또한 여과하여 낮은 샘플링 또는 낮은 서열분석 품질로 인한 에러를 회피했다. 이어서, 각 샘플에서 A-to-I 전환의 수를 계산하고, 이를 여과 후의 데이터 세트 내의 총 아데노신 수로 나누어 전사체에서 A-to-I 편집의 비율을 취득했다.
정량적 실시간 PCR 분석. 정량적 폴리머라제 연쇄 반응(qPCR) 반응은 어플라이드 바이오시스템스(Applied Biosystems) TaqMan 패스트 어드방스드 마스터 믹스(Fast Advanced Master Mix)(Applied Biosystems)를 사용하여 조립했다. 검정은 어플라이드 바이오시스템스(Applied Biosystems) QuantStudio 5 실시간(Real-Time) PCR 시스템(Applied Biosystems)을 사용하여 수행했다. 발현 값은 18S mRNA로 정규화하고, 배율 변화로서 표시했다. 
통계. 모든 데이터는 지시된 바와 같이 평균±s.e.m 또는 평균±s.d.로 표시된다. 도면에 제시된 바와 같이, 각 2개 그룹 사이의 비교를 위해 비페어링 양측 스튜던트 T-검정을 실시했다. 카플란-마이어 분석 및 로그-랭크(맨텔-콕스) 검정을 사용하여 상이한 유전자형 사이의 생존율 차이를 평가했다. 데이터 분석은 통계 소프트웨어(그래프패드 프리즘 소프트웨어(GraphPad Prism Software))를 사용하여 수행했다. 0.05 미만의 P값은 통계학적으로 유의한 것으로 간주했다.
상기 방법에 사용된 올리고/프라이머 및 기타 핵산은 하기 표 18에 제공되어 있다. 
[표 18]

Claims (44)

  1. 서열번호 1 또는 2의 DNA 뉴클레오티드 서열에 대응하는 스페이서 서열(spacer sequence)을 포함하는 gRNA. 
  2. 제1항에 있어서, 상기 gRNA가 서열번호 5 또는 6에 대해 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 서열 동일성(sequence identity)을 갖는 스페이서 서열을 포함하는, gRNA. 
  3. 제1항 또는 제2항에 있어서, 상기 gRNA가 서열번호 5 또는 6을 포함하거나 이로 이루어지는 스페이서 서열을 포함하는, gRNA. 
  4. Cas9 니카제(nickase) 또는 비활성화된(deactivated) Cas9 엔도뉴클레아제에 공유 결합된 데아미나제를 포함하는 융합 단백질(fusion protein). 
  5. 제4항에 있어서, 상기 데아미나제가 ABEmax, ABE8e, ABE7.10 및 이들의 임의의 기능적 변이체(functional variant)로 이루어진 그룹으로부터 선택되는, 융합 단백질. 
  6. 제5항에 있어서, 상기 데아미나제가 서열번호 7, 9 및 11 중 어느 하나에 대해 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%의 서열 상동성을 갖는 아미노산 서열을 포함하는, 융합 단백질.
  7. 제6항에 있어서, 상기 데아미나제가 서열번호 7, 9 및 11을 포함하는 아미노산 서열을 포함하는, 융합 단백질.
  8. 제7항에 있어서, 상기 데아미나제가 서열번호 7을 포함하는 아미노산 서열을 포함하는, 융합 단백질.
  9. 제4항 내지 제8항 중 어느 한 항에 있어서, 상기 Cas9 니카제 또는 비활성화된 Cas9 엔도뉴클레아제가 SpRY, SpG, SpCas9-NG, SpCas9-VRQR 또는 이의 변이체로부터 선택되는, 융합 단백질.
  10. 제9항에 있어서, 상기 Cas9 니카제 또는 비활성화된 Cas9 엔도뉴클레아제가 서열번호 15, 17, 19, 및 21 중 어느 하나와 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%의 서열 상동성(sequence homology)을 갖는 아미노산 서열을 포함하는, 융합 단백질. 
  11. 제10항에 있어서, 상기 Cas9 니카제 또는 비활성화된 Cas9 엔도뉴클레아제가 서열번호 15, 17, 19, 및 21 중 어느 하나를 포함하는 아미노산 서열을 포함하는, 융합 단백질. 
  12. 제11항에 있어서, 상기 Cas9 니카제 또는 비활성화된 Cas9 엔도뉴클레아제가 서열번호 15를 포함하는 아미노산 서열을 포함하는, 융합 단백질. 
  13. 제4항 내지 제12항 중 어느 한 항에 있어서, 상기 데아미나제가 펩티드 링커(peptide linker)를 통해 Cas9 니카제 또는 비활성화된 Cas9 엔도뉴클레아제에 공유 결합되어 있는, 융합 단백질. 
  14. 제13항에 있어서, 상기 펩티드 링커가 서열번호 27을 포함하는 아미노산 서열을 포함하는, 융합 단백질.
  15. 제4항 내지 제14항 중 어느 한 항에 있어서, 상기 데아미나제 및/또는 Cas9 니카제 또는 비활성화된 Cas9 엔도뉴클레아제가 핵 국재화 신호(nuclear localization signal; NLS) 펩티드를 추가로 포함하는, 융합 단백질. 
  16. 제15항에 있어서, 상기 핵 국재화 신호(NLS) 펩티드가 서열번호 31 내지 42 중 어느 하나로부터 선택되는, 융합 단백질. 
  17. 제14.2항에 있어서, 상기 핵 국재화 신호(NLS) 펩티드가 서열번호 31 또는 서열번호 32를 포함하는, 융합 단백질.
  18. 제4항 내지 제18항 중 어느 한 항에 있어서, 상기 융합 단백질이 서열번호 45 내지 60 중 어느 하나에 대해 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 서열 상동성을 갖는 아미노산 서열을 포함하는, 융합 단백질. 
  19. 제18항에 있어서, 상기 아미노산 서열이 서열번호 45 내지 60 중 어느 하나를 포함하거나 이로 이루어지는, 융합 단백질. 
  20. 제19항에 있어서, 상기 아미노산 서열이 서열번호 45 또는 46을 포함하거나 이로 이루어지는, 융합 단백질. 
  21. 제1항 내지 제3항 중 어느 한 항의 gRNA를 코딩하는(encoding) 단리된 핵산.
  22. 제4항 내지 제20항 중 어느 한 항의 융합 단백질 또는 이의 단편을 코딩하는 단리된 핵산. 
  23. 제21항의 핵산 및/또는 제22항의 핵산을 포함하는 바이러스 벡터(viral vector).
  24. (a) 제4항 내지 제20항 중 어느 한 항의 융합 단백질의 제1 단편을 코딩하는 핵산을 포함하는 제1 바이러스 벡터; 및
    (b) 융합 단백질의 제2 단편을 코딩하는 제2 바이러스 벡터를 포함하는, 제23항의 바이러스 벡터의 쌍(pair)으로서,
    상기 융합 단백질의 제1 단편 및 제2 단편이 단백질 트랜스-스플라이싱(protein trans-splicing)을 거쳐 융합 단백질을 형성할 수 있는, 바이러스 벡터의 쌍.
  25. 제24항에 있어서, 상기 제1 및/또는 제2 바이러스 벡터가 제1항 내지 제3항 중 어느 한 항의 gRNA를 코딩하는 핵산을 추가로 포함하는, 바이러스 벡터의 쌍. 
  26. 제21항 또는 제22항의 핵산, 제23항의 바이러스 벡터, 및/또는 제24항 또는 제25항의 바이러스 벡터의 쌍, 및 약제학적으로 허용되는 담체, 희석제 및/또는 부형제를 포함하는 약제학적 조성물. 
  27. 제26항에 있어서, 리포솜을 추가로 포함하는, 약제학적 조성물. 
  28. 세포에서 MYH7 유전자의 돌연변이를 수정(correcting)하는 방법으로서, 상기 방법은
    Cas9 니카제 또는 비활성화된 Cas9 엔도뉴클레아제, 데아미나제, 및 서열번호 1 또는 2 중 어느 하나로부터 선택된 DNA 뉴클레오티드 서열을 표적화(targeting)하는 gRNA, 또는 상기 Cas9 니카제 또는 비활성화된 Cas9 엔도뉴클레아제, 데아미나제 및/또는 gRNA를 코딩하는 하나 이상의 핵산을 세포에 전달하여, MYH7 유전자 내 또는 그 근방에서 적어도 하나의 뉴클레오티드의 하나 이상의 돌연변이를 초래하는 MYH7 유전자 내 또는 그 근방에서 하나 이상의 단일-가닥 절단(single-strand break; SSB)을 수행함으로써, MYH7 유전자의 돌연변이를 수정하는 단계를 포함하는, 방법.
  29. 제28항에 있어서, 제21항 및/또는 제22항의 핵산을 세포에 전달하는 단계를 포함하는, 방법.  
  30. 제28항에 있어서, 제23항의 하나 이상의 바이러스 벡터를 세포에 전달하는 단계를 포함하는, 방법. 
  31. 제28항에 있어서, 제24항 및/또는 제25항의 바이러스 벡터의 쌍을 세포에 전달하는 단계를 포함하는, 방법. 
  32. 이를 필요로 하는 대상체(subject)에서 MYH7 유전자의 돌연변이에 의해 유발된 심근증(cardiomyopathy)을 치료하는 방법으로서, 상기 방법은
    MYH7 유전자를 발현하는 대상체 내의 적어도 하나의 세포에, RNA 가이드 니카제, 데아미나제, 및 서열번호 1 또는 2 중 어느 하나로부터 선택된 DNA 뉴클레오티드 서열을 표적화하는 gRNA, 또는 상기 RNA 가이드 니카제, 데아미나제 및/또는 gRNA를 코딩하는 하나 이상의 핵산을 전달하여, MYH7 유전자 내 또는 그 근방에서 적어도 하나의 뉴클레오티드의 하나 이상의 돌연변이를 초래하는 MYH7 유전자 내 또는 그 근방에서 하나 이상의 단일-가닥 절단(SSB)을 수행함으로써, 대상체의 적어도 하나의 세포에서 MYH7 유전자의 돌연변이를 수정하는 단계를 포함하는, 방법. 
  33. 제32항에 있어서, 제26항 또는 제27항의 약제학적 조성물을 대상체에게 투여하는 단계를 포함하는, 방법. 
  34. 제32항 또는 제33항에 있어서, 상기 MYH7 유전자의 돌연변이가, 돌연변이된 MYH7 유전자에 의해 코딩된 단백질 생성물에서 단일 아미노산 치환을 초래하는 하나 이상의 단일 뉴클레오티드 다형성(polymorphism)을 포함하는, 방법. 
  35. 제34항에 있어서, 상기 단백질 생성물이 미오신 단백질 또는 펩티드이고, 상기 단일 아미노 치환이 서열번호 96에 따른 R403Q를 포함하는, 방법. 
  36. 내인성 뮤린(endogenous murine) Myh6 유전자 내에 삽입되어 인간화 돌연변이 Myh6 대립유전자를 형성하는 MYH7 c.1208 G>A(p.R403Q) 인간 미스센스(missense) 돌연변이를 포함하는 인간 핵산을 포함하는 유전자 편집된 마우스(gene editied mouse). 
  37. 제36항에 있어서, 상기 인간 핵산이 미스센스 돌연변이에 인접하고 이의 상류에 위치한 제1 폴리뉴클레오티드, 및 미스센스 돌연변이에 인접하고 이의 하류에 위치한 제2 폴리뉴클레오티드를 추가로 포함하는, 유전자 편집된 마우스. 
  38. 제37항에 있어서, 상기 제1 폴리뉴클레오티드가 약 30 내지 75개 뉴클레오티드, 약 35 내지 약 70개 뉴클레오티드, 약 40 내지 약 65개 뉴클레오티드, 또는 약 45 내지 약 60개 뉴클레오티드를 포함하는, 유전자 편집된 마우스.
  39. 제38항에 있어서, 상기 제1 폴리뉴클레오티드가 55개 뉴클레오티드를 포함하거나 이로 이루어지는, 유전자 편집된 마우스. 
  40. 제36항 내지 제39항 중 어느 한 항에 있어서, 상기 제2 폴리뉴클레오티드가 약 10 내지 30개 뉴클레오티드, 약 15 내지 25개 뉴클레오티드, 또는 약 20 내지 25개 뉴클레오티드를 포함하는, 유전자 편집된 마우스. 
  41. 제36항 내지 제40항 중 어느 한 항에 있어서, 상기 제2 폴리뉴클레오티드가 21개 뉴클레오티드를 포함하거나 이로 이루어지는, 유전자 편집된 마우스. 
  42. 제36항 내지 제41항 중 어느 한 항에 있어서, 상기 인간 핵산이 서열번호 97의 뉴클레오티드 서열을 포함하는, 유전자 편집된 마우스.
  43. 제36항 내지 제42항 중 어느 한 항에 있어서, 상기 마우스의 적어도 하나의 세포가 서열번호 94를 포함하는 야생형 미오신 단백질에 대하여 R404Q 치환을 포함하는 돌연변이체 미오신 단백질을 발현하는, 유전자 편집된 마우스. 
  44. 제36항 내지 제43항 중 어느 한 항에 있어서, 상기 마우스가 야생형 Myh6 대립유전자를 추가로 포함하고, 상기 마우스가 인간화 돌연변이체 Myh6 대립유전자에 대해 이형접합성(heterozygous)인, 유전자 편집된 마우스.
KR1020247002102A 2021-07-01 2022-07-01 미오신 중쇄 염기 편집을 위한 조성물 및 방법 KR20240029030A (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US202163217618P 2021-07-01 2021-07-01
US63/217,618 2021-07-01
US202163218221P 2021-07-02 2021-07-02
US63/218,221 2021-07-02
PCT/US2022/073386 WO2023279106A1 (en) 2021-07-01 2022-07-01 Compositions and methods for myosin heavy chain base editing

Publications (1)

Publication Number Publication Date
KR20240029030A true KR20240029030A (ko) 2024-03-05

Family

ID=84690288

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020247002102A KR20240029030A (ko) 2021-07-01 2022-07-01 미오신 중쇄 염기 편집을 위한 조성물 및 방법

Country Status (6)

Country Link
EP (1) EP4363589A1 (ko)
KR (1) KR20240029030A (ko)
AU (1) AU2022302172A1 (ko)
CA (1) CA3224369A1 (ko)
IL (1) IL309772A (ko)
WO (1) WO2023279106A1 (ko)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017070632A2 (en) * 2015-10-23 2017-04-27 President And Fellows Of Harvard College Nucleobase editors and uses thereof
WO2019126315A1 (en) * 2017-12-19 2019-06-27 The Regents Of The University Of Michigan Cardiac microtissue and uses thereof
EP3921417A4 (en) * 2019-02-04 2022-11-09 The General Hospital Corporation ADENINE DNA BASE EDITOR VARIANTS WITH REDUCED OFF-TARGET RNA EDITING
WO2020236982A1 (en) * 2019-05-20 2020-11-26 The Broad Institute, Inc. Aav delivery of nucleobase editors

Also Published As

Publication number Publication date
CA3224369A1 (en) 2023-01-05
WO2023279106A1 (en) 2023-01-05
IL309772A (en) 2024-02-01
EP4363589A1 (en) 2024-05-08
AU2022302172A1 (en) 2024-01-18

Similar Documents

Publication Publication Date Title
Gray et al. Optimizing promoters for recombinant adeno-associated virus-mediated gene expression in the peripheral and central nervous system using self-complementary vectors
US20230365962A1 (en) Targeted rna editing by leveraging endogenous adar using engineered rnas
US20180155708A1 (en) Split Cas9 Proteins
WO2017053879A1 (en) Use of exonucleases to improve crispr/cas-mediated genome editing
US11492614B2 (en) Stem loop RNA mediated transport of mitochondria genome editing molecules (endonucleases) into the mitochondria
CA3116452A1 (en) Genome editing methods and constructs
CN111718420B (zh) 一种用于基因治疗的融合蛋白及其应用
WO2022150974A1 (en) Targeted rna editing by leveraging endogenous adar using engineered rnas
US20230272428A1 (en) Methods and compositions for correction of dmd mutations
KR20240029030A (ko) 미오신 중쇄 염기 편집을 위한 조성물 및 방법
US20210363546A1 (en) In vivo homology directed repair in heart, skeletal muscle, and muscle stem cells
CN117897486A (zh) 用于肌球蛋白重链碱基编辑的组合物和方法
WO2023206088A1 (en) Rna base editor for treating dmd-associated diseases
KR20240027748A (ko) Rbm20 돌연변이의 게놈 편집
WO2023184107A1 (en) Crispr-cas13 system for treating mecp2-associated diseases
WO2020187272A1 (zh) 一种用于基因治疗的融合蛋白及其应用
CN117980482A (zh) Rbm20突变的基因组编辑
JP2024506906A (ja) 増強された多重遺伝子制御及び編集のための合成cas12a
US20210180087A1 (en) In situ gene editing
LLADO SANTAEULARIA THERAPEUTIC GENOME EDITING IN RETINA AND LIVER
WO2023235726A2 (en) Crispr interference therapeutics for c9orf72 repeat expansion disease
WO2023235725A2 (en) Crispr-based therapeutics for c9orf72 repeat expansion disease
JP2024517939A (ja) 編集タンパク質の発現のための方法および組成物
WO2023004411A1 (en) A method for in vivo gene therapy to cure scd without myeloablative toxicity
WO2022234295A1 (en) Abca4 genome editing